Solution d'analyse de données

Test d'homogénéité d'une série temporelle dans Excel

20/10/2017

Jeu de données pour réaliser un test d'homogénéité d'une série temporelle

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données proviennent du relevé du débit d’une rivière durant 30 jours. Le but est ici de vérifier qu’une série temporelle est homogène entre deux temps donnés.

La variété des tests utilisés vient de ce que les hypothèses alternatives possibles sont nombreuses : changement de distribution, changements de moyenne (une ou plusieurs fois) ou présence de tendance.

Les tests disponibles dans XLSTAT correspondent à l’hypothèse alternative d’un unique décalage. Pour l’ensemble des tests, XLSTAT fournit des p-values en utilisant des rééchantillonnages Monte Carlo, les calculs exacts étant soit impossibles soit trop coûteux en temps de calcul.

Paramétrer un test d'homogénéité d'une série temporelle

Une fois XLSTAT lancé, cliquez sur l’icône TIME et choisissez la fonction Tests d’homogénéité.

hom1f.gif

Une fois le bouton cliqué, la boîte de dialogue apparaît. Vous pouvez alors sélectionner les données sur la feuille Excel.

Vous devez sélectionner la série temporelle "débit".

L'option Libellé des séries est laissée activée car la première ligne de la colonne de données comprend le nom de la série.

Nous sélectionnons la première colonne comme données de date, celle-ci représente le jour dans le mois.

Nous allons appliquer quatre tests. Le test de Pettitt, le test SNHT (Standard normal homogeneity test), le test de Buishand et le rapport de von Neumann.

hom2f.gif

Dans les options, l’hypothèse alternative est prise telle que le décalage est différent de 0, c’est-à-dire qu’il existe un décalage entre deux parties de la série temporelle.

hom3f.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués, puis les résultats sont affichés.

Interpréter les résultats d'un test d'homogénéité d'une série temporelle

XLSTAT vous donne d’abord des statistiques descriptives pour la série sélectionnée. Ensuite, les résultats des tests sont affichés.

Le test de Pettitt est un test non paramétrique ne nécessitant aucune hypothèse quant à la distribution des données. Le test de Pettitt est une adaptation du test de Mann-Whitney basé sur les rangs, permettant d’identifier le temps auquel se produit un changement.

hom4f.gif

La p-value indique clairement qu’on rejette l’hypothèse nulle et donc qu’on peut considérer qu’il existe un décalage entre deux parties de cette série temporelle. Le graphique associé montre très bien ce décalage.

hom5f.gif

Le test SNHT (Standard normal homogeneity test) se base sur l’hypothèse nulle que les rapports centrés réduits entre la valeur observée de la série et la moyenne suivent une distribution N(0,1). La p-value obtenue est inférieure à 0,0001 et l’hypothèse nulle est donc rejetée. On peut donc dire que entre les temps 1 et n les variables sont distribuées suivant une loi N(µ1, 1) et entre n+1 et T elles sont distribuées suivant une loi N(µ2,1). Ces conclusions confirment celles du premier test.

hom6f.gif

Le test de Buishand se base sur l’hypothèse nulle que les variables suivent une ou plusieurs distributions ayant une même moyenne. La p-value obtenue est inférieure à 0,0001 et l’hypothèse nulle est donc rejetée. On peut donc dire qu’il existe un temps t à partir duquel les variables changent de moyenne. Les conclusions précédentes sont aussi validées.

hom8f.gif

Finalement, le rapport de von Neumann est basé sur la somme des carrés des différences entre deux valeurs successives de la série. L’espérance de ce rapport est de 2 lorsque la moyenne est constante. La p-value est de 0,002 et on rejette donc l’hypothèse nulle qui suppose que les données sont homogènes. Ce résultat est cohérent avec les résultats précédents.

hom9f.gif

Cette courte analyse nous a montré que les tests d’homogénéité ont tous rejeté l’hypothèse nulle d’homogénéité de la série temporelle. Ainsi, il existe un point au-delà duquel le débit de cours d’eau est différent. Ce point se situe au niveau du 15ème jour du mois.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283