Solution d'analyse de données

Rendre un graphique issu d'une ACP plus lisible

20/10/2017

Jeu de données pour modifier un graphique avec les outils de visualisation XLSTAT

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Ce tutoriel utilise les résultats obtenus dans le tutoriel sur l'ACP. (Analyse en Composantes Principales).

Notre but est d'améliorer la lisibilité de la représentation graphique des observations sur les axes F1 et F2.

Modifier un graphique avec les outils de visualisation XLSTAT: Repositionnement des étiquettes

Pour commencer, nous faisons une copie de la représentation, pour ensuite l'agrandir. On peut observer qu'au cours de l'agrandissement certaines étiquettes s'éloignent du point auquel elles correspondent.

Pour remédier à cela, nous sélectionnons le graphique puis nous utilisons l'outil Repositionnement des étiquettes de la barre Visualisation des données, et choisissons les options suivantes :

easy1f.gif

Modifier un graphique avec les outils de visualisation XLSTAT: Changer la taille et la couleur des points

Nous créons ensuite, à droite du tableau des coordonnées des observations, une colonne qui contient la somme des valeurs issues du tableau des cosinus carrés obtenus pour une observation donnée et pour les deux premiers axes. Pour rappel, pour un axe et une observation donnés, le cosinus correspond au cosinus de l'angle entre l'axe et le vecteur reliant l'origine au point. Ainsi, plus le cosinus carré est élevé, plus le point est proche de l'axe dans l'espace multidimensionnel résultant de l'ACP.

La somme des cosinus carrés sur les deux premiers axes factoriels F1 et F2, pour une observation donnée, donne donc une idée de la fidélité de la représentation dans le plan défini par F1 et F2, pour cette observation. Pour une observation donnée, la somme des cosinus carrés sur l'ensemble des axes vaut 1. Donc plus on est proche de 1, plus grande est la fidélité.

Afin d'indiquer le niveau de fidélité de la représentation en deux dimensions pour les différents points, nous souhaitons grossir les points en fonction de la valeur du cosinus. Cela nous permettra de savoir quels points peuvent être interprétés sans risque d'erreur.

Par ailleurs, pour différencier les Etats des cinq regroupements du Census Bureau (Nord Est, Sud, Midwest, West et Pacifique), nous allons utiliser différents motifs.

Pour modifier les motifs, nous devons utiliser les codes définis par XLSTAT qui eux-mêmes respectent l'ordre des motifs proposés par Excel (voir boîte de dialogue Excel ci-dessous) : 1 correspond à un carré, 2 à un losange, 3 à un triangle, 4 à un x, 5 à une étoile, 6 à un point, 7 à un -, 8 à un + et 9 à un disque. Seules quatre motifs étant réellement utilisables, les Etats de Hawaï et d'Alaska qui font partie de la zone Pacifique seront représentés sous forme de ronds avec un pourtour noir.

easy3f.gif

Nous créons ensuite une colonne contenant les codes correspondant à chaque Etat.

Pour augmenter la lisibilité du graphique, nous allons colorer en rouge les points ayant une somme des cosinus carrés supérieure à 0.8. Pour modifier la couleur des points, nous devons appliquer les couleurs à utiliser aux cellules contenant les motifs. Dans un premier temps, nous colorons le fond des cellules en bleu pour toute la colonne contenant la somme des cosinus carrés. Ensuite, nous utilisons l'outil DataFlagger (barre "Outils") pour colorer en rouge les cellules supérieures ou égales à 0.8.

Pour entourer de noir les points correspondant à Hawaï et à l'Alaska, une bordure inférieure noire a été ajoutée aux cellules concernées. Le format des cellules est ensuite copié et collé dans la colonne contenant les motifs, et nous effaçons les formats dans la colonne des cosinus (Excel / Editer / Effacer les formats).

easy2f.gif

Nous sélectionnons ensuite le graphique, puis nous lançons l'outil EasyPoints de la barre "Visualisation des données". Les options suivantes ont été choisies :

easy4f.gif

Nous obtenons alors la carte suivante :

easy5f.gif

Plus lisible, cette représentation nous permet d'identifier les Etats dont on peut interpréter la proximité. Par exemple, on peut conclure que la West Virginia et la Pennsylvanie sont proches, alors que la Pennsylvanie et l'Alaska sont très différents. Par ailleurs, on remarque que dans la partie en haut à droite ou en bas à droite de la représentation, on retrouve surtout des Etats de l'Ouest.

Nous contacter

Envoyer un email au service commercial

Contacter notre équipe de support technique : support@xlstat.com

https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283