Classification et analyse de tonalité des sujets de l’actualité
الأطروحات و الكتابات الأكاديمية من تأليف: Amrane, Abdesalam ; Bousbia, Nabila ; Chalal, Rachid ; Ecole Nationale Spérieure d'Informatique ; Yebda, Sadia ; Khorsi, Roufaida ; نشر في: 2019
ملخص: Les sources de média sont considérées comme la première référence d’information. Les technologies de diffusion de masse produisent en permanence une quantité énorme d’informations et attirent un large public. Souvent, ces médias jouent à la fois un rôle de miroir d’opinion de la société et de créateur d’opinion. La mise en évidence de certaines informations peut avoir un impact économique et politique pour les organisations. La catégorisation manuelle de ces informations demeure une tâche difficile aux agents de veille. Ceci a suscité un intérêt particulier pour l’automatisation de la catégorisation des textes véhiculés dans l’actualité. Il existe plusieurs travaux dans le cadre de la classification de texte par apprentissage automatique qui ont été réalisés dans diverses langues. Ce projet vise les sources média algériennes et traite le texte exprimé en langue française. L’objectif principal de ce travail est de développer un système de classification de l’actualité basé sur l’extraction de texte pour classifier automatiquement les sujets de l’actualité et analyser la tonalité exprimée. Ce document présente en premier lieu un état de l’art sur les différentes approches de classification de texte ainsi que les approches d’analyse de tonalité basées sur l’apprentissage automatique. L'étiquette utilisée pour les catégories est l’ensemble des entités nommées désignant des organisations et/ou leur secteur d’activité, tandis que les étiquettes d'opinion indiqueront l'orientation positive, négative ou neutre des informations vers l’entité nommée. Deux modèles de classification ont été conçus puis évalués sur une série de tests effectués sur un dataset que nous avons collecté. Les modèles proposés atteignent des performances très élevées en termes de qualité de prédiction et d’erreurs d’estimation. Enfin, et pour de montrer l’intérêt pratique de notre solution nous présentons un prototype qui illustre un cas d’utilisation du système. L’utilisateur introduit ses articles et l’application retourne leur classe thématique et leur tonalité
Alger:
لغة:
فرنسية
الوصف المادي:
139 p. ill.
;30 cm
الشهادة:
Ingeneiur d'Etat
مؤسسة مناقشة الرسالة:
Alger, Ecole Nationale Spérieure d'Informatique
تخصص:
Informatique
الفهرس العشري
621 .الفيزياء التطبيقية (الهندسة الكهربائية ، الهندسة المدنية ، الهندسة الميكانيكية ، الهندسة التطبيقية ، المبادئ الفيزيائية في الهندسة)
الموضوع
الإعلام الآلي
الكلمات الدالة:
Fouille d’opinion
Classification de texte
ملاحظة: Bibliogr.pp.105-107; Annexe pp.108-139