Solution d'analyse de données

Nuage de mots avec Excel

03/05/2018
Ce tutoriel explique comment générer et interpréter un nuage de mots dans Excel avec logiciel XLSTAT.

Jeu de données pour réaliser un nuage de mots

Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant sur le bouton ci-dessous :
Télécharger les données

Dans ce tutoriel, nous utiliserons les données provenant du site web stateoftheunion.onetwothree concernant les derniers « discours sur l'état de l'Union » des présidents D. Trump et B. Obama dont les textes intégraux peuvent-être obtenus aux adresses suivantes :
http://stateoftheunion.onetwothree.net/texts/20160112.html pour le Président Obama.
http://stateoftheunion.onetwothree.net/texts/20170228.html pour le Président Trump.

Un nuage de mot est une représentation visuelle des mots-clefs les plus utilisés dans un texte. Dans ces graphiques, les mots s'affichent suivant des polices de caractères d'autant plus grandes qu'ils sont utilisés.

Paramétrer un nuage de mots dans XLSTAT

Une fois que XLSTAT est lancé, choisissez XLSTAT / Visualisation des données / Nuage de mots (voir ci-dessous) :
XLSTAT menu :Visualisation des données
La boîte de dialogue correspondant à Nuage de mots apparaît.
Nuage de mots boîte de dialogue dans XLSTAT
Dans l’onglet Général, sélectionnez la colonne B dans le champ Matrice fréquence terme  et la colonne A dans le champ Etiquettes de terme. Ces données correspondent à la fréquence et aux noms des termes utilisés dans le discours d’Obama.

L'option Libellés des documents est activée, car la première ligne de données contient le nom des variables.
Nuage de mots boîte de dialogue dans XLSTAT
Dans l'onglet Options, activez les options Mots max. et Période de rot. ce qui aura respectivement pour effet de limiter le nombre de mots à afficher dans le nuage (ici 260 mots maximum) ainsi que d’effectuer une rotation périodique à la verticale d’un mot à une période définie (ici nous avons choisi d’orienter à la verticale 1 mot tous les quatre).

L’option Position aléatoire est par défaut désactivée de manière à afficher les mots en fréquence d’apparition décroissante à partir du centre vers la périphérie du nuage (si non activée alors chacun des mots sera affiché à une position aléatoire dans le nuage).

Une échelle de couleurs personnalisée est sélectionnée dans le nuage via l’option Echelle de couleurs personnalisée afin de choisir un dégradé de couleur à appliquer sur la police de caractère. Ce choix permettra de mettre en évidence les mots du plus ou moins fréquents (si non sélectionnée alors des couleurs par strate fréquentielle seront aléatoirement choisies).

Les calculs pour l’affichage du graphique commencent lorsque vous cliquez sur le bouton OK.
 
Pour générer le nuage de mots sur le discours de Trump, répétez la même procédure en sélectionnant cette fois-ci les colonnes D et E.

Interprétation des nuages de mots

Les nuages de mots représentant les discours sur l’état de l’union des Présidents Obama et Trump sont affichés respectivement avec un dégradé de couleurs rouges (Obama) et bleus (Trump) :
Nuages de mots générés avec XLSTAT
D’un côté, le nuage du mot du Président Obama couvre un large panel de sujets (quantité élevée de mots clés ayant des fréquences d’occurrence élevées). Ces termes sont centrés autour du mot clé world. D’un autre côté, le nuage du discours du Président Trump s’articule autour des mots clés will, american, country.

Nous contacter

Envoyer un email au service commercial

Contacter notre équipe de support technique : support@xlstat.com

https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283