lm_eval/tasks/alghafa/copa_ar/copa

task: copa_ar dataset_path: Hennara/copa_ar dataset_name: null output_type: multiple_choice training_split: null validation_split: null test_split: test doc_to_text: "السؤال: {{query}}\nالجواب:" doc_to_choice: "{{[sol1, sol2]}}" doc_to_target: label should_decontaminate: true doc_to_decontamination_query: query metric_list: - metric: acc aggregation: mean higher_is_better: true - metric: acc_norm aggregation: mean higher_is_better: true metadata: version: 1.0

lm_eval/tasks/alghafa/copa_ar/copa_ar.yaml (21 lines of code) (raw):