Analyse de sentiment dans Excel
Ce tutoriel montre comment définir le sentiment d’un document dans Excel en utilisant XLSTAT.
Documents à catégoriser en utilisant l’analyse de sentiment avec XLSTAT
Ce tutoriel est basé sur un jeu de données qui contient les paroles de 94 chansons de la chanteuse américaine Taylor Swift. Le jeu de données provient de la plateforme de data science, Kaggle et est accessible à cette adresse.
Paramétrer une analyse de sentiment avec XLSTAT
-
Ouvrir XLSTAT.
-
Sélectionner le menu XLSTAT/ Text Mining / Analyse de sentiment. La boîte de dialogue apparaît.
-
Dans l’onglet Général, sélectionner les fréquences des termes à partir de la matrice documents-termes obtenue avec la fonctionnalité extraction de caractéristiques.
-
Sélectionner le dictionnaire de sentiment Bing qui permet d’utiliser un dictionnaire binaire. Chaque terme sera alors associé au sentiment positif ou négatif.
-
Sélectionner les titres de chanson en tant que libellés des documents.
-
Cliquer sur OK.
Interpréter les résultats d’une analyse de sentiment
Le scores de document est la somme des produits du score du terme multiplié par la fréquence du terme. Un terme catégorisé comme "négatif" obtient un score de -1, s'il est catégorisé comme "neutre" il obtient un score de 0 enfin il obtient 1 lorsqu'il est catégorisé en "positif".
Plus un document est positif, plus son score de sentiment est élevé. Dans notre cas la chanson avec l’intention la plus positive est « Out of the woods » tandis que la plus négative est « Shake it off ».
La distribution des scores des documents permet de savoir ici que la majorité des chansons ont un score proche de zéro, donc neutre.
Le nuage de mot basé sur les sentiments s’interprète comme un nuage de mot classique or ici les mots sont colorés selon leur sentiment. Il montre que « love » est le mot positif le plus présent dans les 94 chansons de Taylor Swift, tandis que « shake » et bad » semblent être les mots négatifs les plus présents. Ce qui explique que la chanson « Shake it off » soit catégorisée comme négative.
Conseils : le score du terme « shake » peut être diminué ou neutralisé pour qu’il n’influence pas le score de la chanson « Shake it off ». Pour cela, il faut activer l’option scores personnalisés.
Le dernier graphique donne un aperçu des scores de chaque terme, il permet ici de voir la catégorie sentimentale de chaque terme.
Cet article vous a t-il été utile ?
- Oui
- Non