Analyse de Redondance (RDA) dans Excel
Ce tutoriel vous aidera à mettre en place et interpréter une Analyse de Redondance ou RDA dans Excel en utilisant le logiciel statistique XLSTAT.
Qu’est-ce que l’Analyse de Redondance (RDA) ?
L’Analyse de Redondance (RDA) est une sorte d’approche multivariée des modèles linéaires, c’est-à-dire un modèle linéaire avec plusieurs variables dépendantes.
La RDA construit une Analyse en Composantes Principales (ACP) sur les variables réponses (matrice Y) sous la contrainte que les axes produits – aussi appelés axes canoniques – sont également une combinaison linéaire des variables explicatives (matrice X).
La RDA est souvent utilisée en écologie pour expliquer une matrice d’abondances sites / espèces avec un ensemble de variables environnementales qui capturent souvent des gradients (étendue de températures ou profondeurs de sol ou richesses en nutriments etc.).
Dans un contexte de RDA, on part sur l’hypothèse que les matrices Y et X sont linéairement liées.
Quelle-est la différence entre l’Analyse de Redondance et l’Analyse Canonique des Correspondances ?
L’Analyse Canonique des Correspondances ou ACC est une méthode apparentée à l’Analyse de Redondance. Alors que dans la RDA, les liens entre les matrices Y et X sont supposés linéaires, ces liens sont supposés unimodaux dans l'ACC. En écologie, l'ACC illustre mieux le concept de niche spécifique à condition que les gradients environnementaux soient échantillonnés sur toute leur amplitude. La RDA serait mieux adaptée dans les cas où de plus petites fractions de gradients environnementaux sont capturés.
Qu’est-ce qu’une variable conditionnante et qu’est-ce qu’une RDA partielle ?
Similairement à l’Analyse Canonique des Correspondance, il est possible de retirer les effets de variables explicatives indésirables afin de focaliser l’interprétation sur les effets d’intérêt. Ces variables indésirables incluent les effets bloc ou toute autre variable environnementale pouvant potentiellement occulter les effets des variables explicatives centrales dans l’étude en question. Ceci produit ce qu’on appelle une RDA partielle (ou ACC partielle dans le cas de l'ACC). Les variables indésirables sont appelées variables conditionnantes.
XLSTAT permet de sélectionner des variables conditionnantes autant avec la RDA qu’avec l'ACC, dans l’onglet Général des boîtes de dialogue (activez ACC partielle ou RDA partielle).
Jeu de données pour ce tutoriel sur l’Analyse de Redondance dans Excel
Les données correspondent aux abondances de 30 espèces de plantes (en colonnes) sur 20 sites (en lignes) dans des communautés de dunes. Les noms des espèces sont la concaténation des 4 premières lettres du genre et des 4 premières lettres de l’espèce, en latin. Les sites sont également décrits par deux variables environnementales en colonnes : - Epaisseur du sol : variable quantitative, profondeur de l’horizon A1 dans le sol.
-
Gestion : variable qualitative avec les niveaux AB (Agriculture Biologique), AL agriculture de Loisir), GN (Gestion de Conservation de la Nature) et AS (Agriculture Standard).
Les données sont extraites de [Jongman, R.H.G, ter Braak, C.J.F & van Tongeren, O.F.R. (1987). Data Analysis in Community and Landscape Ecology. Pudoc, Wageningen]. D’autres variables environnementales de la même source ont été exclues pour ce tutoriel.
Objectif de ce tutoriel sur l’Analyse de Redondance
L’objectif de ce tutoriel est d’examiner les relations linéaires entre le type de gestion et l’épaisseur de l’horizon A1 du sol sur des communautés de plantes de dunes grâce à l’Analyse de Redondance.
Configurer une Analyse de Redondance dans XLSTAT
Une fois XLSTAT ouvert, sélectionnez Fonctions Avancées / Analyse de Données Multiblocs / Analyse de Redondance :
Sélectionnez la matrice Sites / Espèces dans le champ Variables réponse. Sous Variables explicatives, sélectionnez la colonne épaisseur du sol dans le champ Quantitatives et la colonne Gestion dans le champ qualitatives.
Dans l’onglet Options, activez le test de permutation et entrez 1000 dans le champ nombre de permutations. Si vos variables réponse ou vos variables explicatives ne sont pas sur la même échelle, il peut être utile d’activer l’option Réduire sur la matrice concernée.
Dans l’onglet Graphiques, désactivez l’option Observations sous Afficher.
Cliquez OK. Les calculs se lancent et les résultats s’affichent sur une nouvelle feuille Excel.
Interpréter les sorties d’une Analyse de Redondance
Une première boîte de dialogue apparaît et permet de sélectionner les axes à représenter sur les graphiques de la RDA. Les axes F1 et F2 portent 80% de l’inertie contrainte (voir explications plus bas). Sélectionnez ces axes et Cliquez sur Terminer.
Après une série de statistiques descriptives sur les variables réponse et explicatives, une table résumant le partitionnement de l’inertie est affichée :
L’inertie ou variabilité des variables réponse est divisée en : - L’inertie contrainte, qui constitue la part d’inertie expliquée par les variables explicatives.
-
L’inertie non-contrainte, qui constitue la part résiduelle.
Environ 39% de la variabilité de communautés d’espèces peut être expliquée par les deux variables environnementales étudiées.
Ensuite, un test de permutation permet de tester l’hypothèse nulle que les variables réponse et variables explicatives ne sont pas liées linéairement. Ici, la p-value est très en-dessous du seuil de risque alpha. Nous pouvons donc rejeter l’hypothèse nulle en prenant en compte un risque très faible de nous tromper. Ceci est une étape importante car elle valide la fiabilité des résultats suivants.
Ensuite, les détails de l’inertie contrainte portée par chaque axe de la RDA sont fournis dans un tableau :
L’axe F1 porte 45% de l’inertie contrainte, correspondant à 18% de l’inertie totale. Comme nous l’avons déjà vu, les axes F1 et F2 portent ensemble 80% de l’inertie contrainte, correspondant à 32% de l’inertie totale.
Une table équivalente avec le détail de l’inertie non-contrainte est affichée ensuite :
Les coefficients canoniques standardisés permettent d’évaluer sur chaque axe les effets relatifs de chaque coefficient émanant des variables explicatives.
Les scores des observations sont les coordonnées des observations (sites) sur le graphique de la RDA.
Les Contributions (Observations) mesurent le degré de contribution de chaque observation à la construction de chaque axe.
Les cosinus carrés (Observations) mesurent la qualité de représentation de chaque observation sur chaque axe.
Les observations 15, 16 et 20 semblent avoir contribué de manière importante à la construction de l’axe F1 et sont également bien représentées sur cet axe.
Les scores et les cosinus carrés sont également montrés pour les variables réponses (espèces dans notre exemple).
). De la même manière, les cosinus carrés liés aux espèces reflètent la représentativité de chaque espèce sur chaque axe. Les espèces telles que Elymus repens, Poa pratensis, Ranunculus flammula et d’autres semblent être bien représentées sur l’axe F1.
Les scores des coefficients de variables explicatives sont également fournis.
A la fin du rapport, nous voyons le graphique de la RDA, également appelé triplot dans les situations où il inclut les observations ou sites (qui ont été retirés ici pour assurer une meilleure lisibilité).
Sur un axe de RDA donné, seules les observations et variables réponses associées à des cosinus carrés élevés doivent être interprétées.
L’axe 1 semble être lié aux deux variables explicatives, avec la gestion de conservation de la nature à gauche et une épaisseur de l’horizon A1 du sol importante à gauche ; et les agricultures de loisir et biologique à droite.
La gestion de Conservation de la Nature est donc liée à un horizon A1 important dans les sols. Ces environnements sont caractérisés par les espèces Eleocharis palustris, Ranunculus flammula, Salix repens et d’autres.
D’un autre côté, des sols plus fins sont liés à l’agriculture biologique et de loisir avec une abondance spécifique relativement importante de Lolium perenne et Poa pratensis.
L’axe deux est lié à l’agriculture standard, caractérisée par Alopecurus geniculatus.
Cet article vous a t-il été utile ?
- Oui
- Non