Solution d'analyse de données

Caractérisation de variables avec Excel

23/01/2019

Ce tutorial explique comment étudier le lien entre des variables de même nature ou de nature différente avec la fonction Caractérisation de variables du logiciel XLSTAT. 

Jeu de données pour la Caractérisation de variables

Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant sur le bouton ci-dessous :
Télécharger les données

Les données ont été récoltées dans le cadre d'une surveillance de la population angevine : le CHU d'Angers a étudié des hommes et des femmes pour déterminer leur aptitude à ronfler. Le fichier contient un échantillon de 100 patients interrogés entre 2000 et 2002.

But de ce tutoriel sur la Caractérisation de variables

En utilisant la caractérisation de variables, notre but est d'étudier les liens qui peuvent exister entre les différentes variables que nous avons à notre disposition ici, à savoir les 4 variables quantitatives : Age, Poids, Taille et Alcool et les 2 variables qualitatives : Sexe et Ronfle.
La fonction Caractérisation de variables permet d’étudier le lien entre des variables de même nature ou de nature différente. Ce tutoriel comporte 5 parties associées à 5 onglets de résultats et présente les différents résultats en fonction de l’étude des liens entre les variables et en fonction de la nature de ces variables (quantitatives ou qualitatives).

Paramétrer la Caractérisation de variables

Une fois XLSTAT lancé, choisissez la commande Description des données / Caractérisation de variables (voir ci-dessous).
 
Une fois le bouton cliqué, la boîte de dialogue correspondant à la Caractérisation de variables apparaît.
Vous pouvez alors sélectionner les données sur la feuille Excel.

1) Lien entre variables quantitatives

Nous allons étudier ici le lien entre la variable quantitative Alcool (élément à caractériser) et les trois autres variables quantitatives Age, Taille et Poids (éléments caractérisant). Nous choisissons d’afficher les résultats dans l’ordre croissant des p-values (ceci sera également le cas pour les autres exemples).


Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.
Les résultats ci-dessous sont contenus dans l’onglet « Caractérisation de Variables ».

Aucune des p-values n’est inférieure au seuil de 5%, on ne rejette donc pas l’hypothèse d’indépendance et on peut donc conclure que la variable Alcool n’est pas liée aux variables Poids, Taille et Age.

2) Lien entre variables qualitatives

Dans cette seconde partie, nous étudions le lien entre la variable qualitative Ronfle (élément à caractériser) et les deux autres variables qualitatives Sexe et Tabac (éléments caractérisant).

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.
Les résultats ci-dessous sont contenus dans l’onglet « Caractérisation de Variables1 ».

La p-value associée à la variable Sexe est inférieure au seuil de significativité de 5% on en conclut donc qu’il y a un lien entre la variable Ronfle et la variable Sexe. Par contre il y a indépendance entre la variable Ronfle et la variable Tabac.

3) Lien entre variables quantitatives et qualitatives

Dans cette troisième partie, nous étudions le lien entre la variable quantitative Alcool (élément à caractériser) et les trois autres variables qualitatives Sexe, Tabac et Ronfle (éléments caractérisant).

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.
Les résultats ci-dessous sont contenus dans l’onglet « Caractérisation de Variables2 ».
Les 3 p-values sont inférieures au seuil de significativité de 5% on en conclut donc qu’il y a un lien entre la variable quantitative Alcool et les variables qualitatives Sexe, Tabac et Ronfle.

4) Lien entre variables quantitatives et modalités

Dans cette quatrième partie, nous étudions le lien entre la variable quantitative Alcool (élément à caractériser) et les modalités de la variable qualitative Sexe (éléments caractérisant).

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.
Les résultats ci-dessous sont contenus dans l’onglet « Caractérisation de Variables3 ».

Les p-values significatives et les valeurs test montrent que les hommes (SEXE-0) ont une consommation d’alcool supérieure à la moyenne et que cette différence est significative, de même les femmes (SEXE-1) ont une consommation d’alcool inférieure à la moyenne.

5) Lien entre modalités de différentes variables qualitatives

Dans cette dernière partie, nous étudions le lien entre les modalités de la variable qualitative Ronfle (élément à caractériser) et les modalités des variables qualitatives Sexe et Tabac (éléments caractérisant).

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.
Les résultats ci-dessous sont contenus dans l’onglet « Caractérisation de Variables4 ».

On voit que parmi les personnes qui ronflent (Ronfle-1) les hommes sont sur-représentés (SEXE-0) et que ceci est significatif. On remarque également que le fait d’être fumeur n’a pas d’impact sur le fait de ronfler.

Conclusion pour cette Caractérisation de Variables

Ces différentes études ont permis de voir des liens entre différentes variables et d’en tirer des conclusions. On a vu par exemple qu’il y avait un lien entre la consommation d’alcool et le sexe, un lien entre le fait de ronfler et le sexe mais pas de lien significatif entre le fait de ronfler et la consommation de tabac.

Nous contacter

Envoyer un email au service commercial

Contacter notre équipe de support technique : support@xlstat.com

https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283