subtitles/fr/tasks_04_🤗-tasks-summarization.srt (42 lines of code) (raw):

1 00:00:04,560 --> 00:00:06,640 Bienvenue dans la série d'Hugging Face sur les tâches ! 2 00:00:07,280 --> 00:00:10,720 Dans cette vidéo, nous allons examiner la tâche de résumé de texte. 3 00:00:13,200 --> 00:00:16,480 Le résumé consiste à produire une version plus courte 4 00:00:16,480 --> 00:00:21,600 d'un document tout en préservant les informations pertinentes et importantes dans le document. 5 00:00:25,040 --> 00:00:29,840 Les modèles de résumé prennent un document à résumer et génèrent le texte résumé. 6 00:00:33,360 --> 00:00:40,240 Cette tâche est évaluée sur le score ROUGE. Il est basé sur le chevauchement entre la séquence produite 7 00:00:40,240 --> 00:00:48,000 et la séquence correcte. Vous pouvez voir ceci comme ROUGE-1, 8 00:00:48,000 --> 00:00:55,600 qui est le chevauchement de tokens uniques et ROUGE-2, le chevauchement de paires de tokens successives. ROUGE-N 9 00:00:55,600 --> 00:01:02,960 fait référence au chevauchement de N tokens successifs. Ici, nous voyons un exemple de la façon dont les chevauchements ont lieu. 10 00:01:06,160 --> 00:01:11,280 Un exemple de jeu de données utilisé pour cette tâche s'appelle Extreme Summarization (XSUM). 11 00:01:11,280 --> 00:01:14,480 Ce jeu de données contient des textes et leurs versions résumées. 12 00:01:17,680 --> 00:01:21,280 Vous pouvez utiliser des modèles de résumé pour résumer les articles de recherche, ce 13 00:01:21,280 --> 00:01:25,680 qui permettrait aux chercheurs de choisir facilement des articles pour leur liste de lecture. 14 00:01:29,040 --> 00:01:39,520 Pour plus d'informations sur la tâche de résumé de textes, consultez le cours d'Hugging Face.