Solution d'analyse de données

Analyse Canonique des Corrélations dans Excel

20/10/2017

Jeu de données pour l’Analyse Canonique des Corrélations

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données correspondent à des mesures prises sur des hommes d’âge moyen dans un club de gym (Dr. A. C. Linnerud, NC State University).

Il y a deux types de données mesurées sur les hommes :

  1. Données physiques :
    • Poids (Weight)
    • Tour de taille (Waist)
    • Pouls (Pulse)
  2. Le nombre et type d’exercise que les hommes ont fait:
    • Tractions (Chins)
    • Abdos (Sit-ups)
    • Sauts (Jumps)

Paramétrer l’Analyse Canonique des Corrélations

Aller au menu Analyse de données Multibloc, et sélectionner la fonction Analyse Canonique des Corrélations.

XLSTAT menu Analyse de Données Multiblocs Analyse Canonique des Corrélations FR

Dans l’onglet Général vous pouvez sélectionner les données. Y1 correspond aux données physiologiques qui se trouvent dans les colonnes B à D. Y2 correspond aux exercices dont les données se trouvent dans les colonnes E à G.

Les colonnes ont un libellé donc il faut garder l’option Libellés des variables cochée. Vous pouvez ajouter les Libellés des observations en cochant l’option correspondante et sélectionnant la colonne A.

corrélations canoniquesanalysis software

Dans l’onglet Options, activez les options centrés et réduire pour normaliser les données et supprimer tout effet d'échelle.

corrélations canoniques software package

Pour les Sorties sélectionnez les toutes.

corrélations canoniques package

Choisissez aussi d’obtenir le graphique disponible dans l’onglet Graphiques.

corrélations canoniques dans excel

Cliquez sur OK quand ces sélections sont faites.

Quand la boîte de dialogue apparaît pour choisir les facteurs, choisissez les facteurs F1 et F2.

Remarquez que la variance expliquée est de 99.22%.

corrélations canoniques logiciel

Résultats de l’Analyse Canonique des Correspondances

Le premier résultat après les statistiques descriptives est la matrice de corrélation.

Notez la forte corrélation (0.870) entre le poids (weight) et le tour de taille (waist) dans le premier tableau. Ainsi que la corrélation entre abdos (sit-ups) et sauts (jumps) – 0.669 – et tractions (chins) – 0.696 – dans le deuxième tableau.

Les corrélations entre les deux tableaux sont plutôt faibles, mis à part le tour de taille et abdos (Waist et Sit-up’s -0.646) et tour de taille et tractions ( Waist et Chins -0.552).

canonical correlation

Les Valeurs propres montrent que le premier facteur seul explique 93% de la variabilité du jeu de données.

corrélations canoniques valeurs propres

Le test lambda de Wilks permet de tester si les variables canoniques sont liées ou non à Y1 et Y2. Nous voyons ici donne que si F1 est lié sans que cela soit significatif au seuil alpha=0.05, cela n'est pas le cas pour F2 et F3.

 

corrélations canoniques wilks lambda

Les corrélations canoniques sur le facteur 1 montrent que les tables Y1 et Y2 sont corrélées. Notez que cette valeur est plus grande que les corrélations entre les deux tables.

Les coefficients de redondance montre qu’une faible portion de la variabilité des variables initiales est prédite par les variables canoniques.

corrélations canoniques coefficients de redondance

Sur le graphique suivant, on peut voir que le tour de taille et le poids sont corrélés négativement avec les facteurs 1 et 2. Ils sont aussi anti-corrélés avec les exercices abdos et tractions. Cela veut dire les personnes avec un poids et un tour de taille plus importants ne font pas autant d’abdos et de tractions que les autres.

corrélations canoniques graphique

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283