subtitles/fr/tasks_04_🤗-tasks-summarization.srt (42 lines of code) (raw):
1
00:00:04,560 --> 00:00:06,640
Bienvenue dans la série d'Hugging Face sur les tâches !
2
00:00:07,280 --> 00:00:10,720
Dans cette vidéo, nous allons examiner la tâche de résumé de texte.
3
00:00:13,200 --> 00:00:16,480
Le résumé consiste à produire une version plus courte
4
00:00:16,480 --> 00:00:21,600
d'un document tout en préservant les informations pertinentes et importantes dans le document.
5
00:00:25,040 --> 00:00:29,840
Les modèles de résumé prennent un document à résumer et génèrent le texte résumé.
6
00:00:33,360 --> 00:00:40,240
Cette tâche est évaluée sur le score ROUGE. Il est basé sur le chevauchement entre la séquence produite
7
00:00:40,240 --> 00:00:48,000
et la séquence correcte. Vous pouvez voir ceci comme ROUGE-1,
8
00:00:48,000 --> 00:00:55,600
qui est le chevauchement de tokens uniques et ROUGE-2, le chevauchement de paires de tokens successives. ROUGE-N
9
00:00:55,600 --> 00:01:02,960
fait référence au chevauchement de N tokens successifs. Ici, nous voyons un exemple de la façon dont les chevauchements ont lieu.
10
00:01:06,160 --> 00:01:11,280
Un exemple de jeu de données utilisé pour cette tâche s'appelle Extreme Summarization (XSUM).
11
00:01:11,280 --> 00:01:14,480
Ce jeu de données contient des textes et leurs versions résumées.
12
00:01:17,680 --> 00:01:21,280
Vous pouvez utiliser des modèles de résumé pour résumer les articles de recherche, ce
13
00:01:21,280 --> 00:01:25,680
qui permettrait aux chercheurs de choisir facilement des articles pour leur liste de lecture.
14
00:01:29,040 --> 00:01:39,520
Pour plus d'informations sur la tâche de résumé de textes, consultez le cours d'Hugging Face.