in scripts/launcher_distributed_kd.py [0:0]
def parse_arge():
parser = argparse.ArgumentParser()
# infra configuration
parser.add_argument("--workers", type=int, default=6)
parser.add_argument("--train_dir", type=str, default="train")
parser.add_argument("--teacher_model_dir", type=str, default="../teacher_model")
parser.add_argument("--student_model_dir", type=str, default="../student_model")
parser.add_argument("--log_dir", type=str, default="../log")
parser.add_argument("--model_output_dir", type=str, default="../output")
parser.add_argument(
"--tune_finetune_yaml", type=str, default="knowledge_distillation_qwen2.yaml"
)
parser.add_argument("--tune_eval_yaml", type=str, default="evaluation_qwen2.yaml")
parser.add_argument("--tune_quant_yaml", type=str, default="quant_qwen2.yaml")
parser.add_argument("--prompt", type=str, default="")
parser.add_argument("--hf_token", type=str, default="")
parser.add_argument("--wandb_api_key", type=str, default="")
parser.add_argument("--wandb_project", type=str, default="")
parser.add_argument(
"--wandb_watch", type=str, default="gradients"
) # options: false | gradients | all
parser.add_argument(
"--tune_recipe", type=str, default="knowledge_distillation_single_device"
)
parser.add_argument("--tune_action", type=str, default="fine-tune")
parser.add_argument(
"--teacher_model_id", type=str, default="Qwen/Qwen2-1.5B-Instruct"
)
parser.add_argument(
"--student_model_id", type=str, default="Qwen/Qwen2-0.5B-Instruct"
)
parser.add_argument("--use_downloaded_model", type=bool, default=False)
args = parser.parse_known_args()
return args