train_weak_to_strong.py [21:26]:
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
        eval_batch_size=32,
        custom_kwargs={
            "torch_dtype": torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float32,
        },
    ),
    ModelConfig(
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -



train_weak_to_strong.py [37:42]:
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
        eval_batch_size=32,
        custom_kwargs={
            "torch_dtype": torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float32,
        },
    ),
    ModelConfig(
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -



