Solution d'analyse de données

Séries temporelles, analyse descriptive et transformation

20/10/2017

Jeu de données pour l'analyse descriptive et transformations de séries temporelles

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données proviennent de [Box, G.E.P. and Jenkins, G.M. (1976). Time Series Analysis: Forecasting and Control. Holden-Day, San Francisco], et correspondent au trafic aérien international (en milliers de passagers) de Janvier 1949 à Décembre 1960.

Le but est ici d'analyser la série chronologique avant de l'utiliser en mode prédictif dans un autre tutoriel.

Airline Passenger time series graph

On note sur ce graphique que le nombre de passagers a tendance à augmenter régulièrement que l'on retrouve chaque année un cycle similaire. Cependant les variations à l'intérieur d'une même année sont de plus en plus fortes. Afin de confirmer ces éléments nous allons analyser la série, puis la transformer pour valider nos hypothèses.

Paramétrer une analyse descriptive de séries temporelles

Pour activer la boîte de dialogue de l'analyse descriptive des séries chronologiques, lancez XLSTAT, puis sélectionnez la commande XLSTAT / Time / Analyse descriptive.

time series menu

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue de l'analyse descriptive apparaît. Sélectionnez alors les données sur la feuille Excel. La série à analyser correspond ici à la série Passagers.

L'option Libellés des séries est activée parce que la première ligne des données sélectionnées correspond au nom de la variable.

time series dialog box 1

Dans l'onglet Options, sélectionnez le mode automatique.

time series dialog box 2

Dans les onglets Sorties et Graphiques, activez l'option Autocorrélations partielles.

time series dialog box 3

time series dialog box 4

Les calculs commencent lorsque l'on a appuyé sur OK. Les résultats sont ensuite affichés.

Interprétation de l'analyse descriptive de séries temporelles

Dans les premiers tableaux sont affichées des statistiques générales.

Ensuite, un tableau donne les résultats des tests de normalité et de bruit blanc.

Le test de Jarque-Bera est un test de normalité fondé sur les propriétés de symétrie et d’aplatissement de la loi normale. Plus la valeur du Khi² est importante, moins l'hypothèse nulle de normalité des données est vraisemblable. Ici, la probabilité fournie, qui correspond à la probabilité de se tromper en rejetant l'hypothèse nulle, est proche de 0,012. Avec un seuil de signification alpha=0.05, on doit donc rejeter l'hypothèse nulle.

Les trois autres tests (Box-Pierce, Ljung-Box, McLeod-Li) sont calculés à différents pas de temps. Ils permettent de tester si les données pourraient provenir d'un bruit blanc ou non.

Ces tests s'appuient également sur la distribution du Khi². Les résultats sont concordants, et indiquent que les données ne peuvent pas être supposées provenir d'un bruit blanc. Alors qu'un tri n'a aucune influence sur le test de Jarque-Bera, il en aurait un sur les autres tests qui sont adaptés aux séries temporelles.

time series desc result 1

Dans le tableau ci-dessous sont affichées les fonctions descriptives de la série chronologique, et les deux diagrammes en bâtons correspondent à la fonction d'autocorrélation (FAC) et à la fonction d'autocorrélation partielle (FACP).

Les intervalles de confiance à 95% sont également affichés. Au niveau de l'autocorrélogramme, on identifie une autocorrélation d'ordre 1, ainsi qu'une saisonnalité de 12 mois.

time series desc result 2

time series desc result 3

Transformation d'une série temporelle

Dans le but d'augmenter la normalité des données, nous allons procéder à deux transformations successives :

Nous voulons d'abord stabiliser la variance de la série,
Puis, retirer les autocorrélations significatives par une différenciation de la série.
Cela peut être fait avec l'outil de transformation de séries temporelles.

Paramétrer la transformation d'une série temporelle

Pour activer la boîte de dialogue correspondante, choisissez la commande XLSTAT / XLSTAT-Time / Transformation de séries, ou cliquez sur le bouton correspondant de la barre d'outils XLSTAT-Time.

time series menu transformation

Sélectionnez les données sur la feuille Excel. La variable à transformer correspond ici à la série Passagers. 

time series desc transformation dialog box 1

Après avoir sélectionné les données, activez l'option Box-Cox dans l'onglet Options

time series desc transformation dialog box 1

Nous pourrions demander une transformation avec optimisation du paramètre lambda, mais nous décidons de fixer lambda à 0, ce qui revient à faire une transformation logarithmique de la série. Cette transformation est souvent efficace lorsque l'on souhaite supprimer une variabilité croissante,

Interpréter le résultat d'une transformation de série temporelle

D'abord, un tableau et deux graphiques apparaissent: l'un représentant le jeu de données d'origine et le deuxième représentant la transformation Box-Cox. Comme prévu, la transformation log a éliminé la variabilité croissante.

time series transformation dialog box 2

Ensuite, pour supprimer la tendance croissante et la composante saisonnière, nous décidons de faire une différenciation de la série. Dans la boîte de dialogue de transformation de série temporelle, nous sélectionnons les données transformées (Box-Cox). 

time series transform dialog box

La valeur de d est fixée à 1 pour retirer la tendance, et D et s sont fixés à 1 et 12 pour retirer la saisonnalité de douze mois. 

time series transform dialog box

Les calculs se lancent une fois que vous cliquez sur OK.

 

Interpréter le résultat d'une transformation de série temporelle

Les graphiques qui s'affichent montrent que les composantes tendancielle et saisonnière ont effectivement été éliminées.

time series transformation result 2

Analyse descriptive des données chronologiques transformées

Dans le but de vérifier si les transformations ont permis de rendre la séries compatible avec un bruit blanc, nous devons réaliser une analyse descriptive de la série transformée.

time series desc dialog box 5

Assurez-vous d'avoir bien sélectionné l'option Supprimer les observations dans l'onglet données manquantes car la correction de tendance et de saisonnalité a réduit le nombre de points.

time series desc dialog box 6

Le test de Jarque-Bera confirme que les séries sont plus proches d'une distribution normale : la probabilité est passée de 0,012 à 0,027. Cependant, les tests de bruit blanc indiquent que les transformations n'ont pas été suffisantes. 

time series desc result 2

L'autocorrélogramme montre également que des composantes significatives au pas de temps 1 et 10 restent présentes. Une investigation plus poussée du processus générateur serait nécessaire pour mieux corriger la série.

time series desc result 3

Décomposition saisonnière de la série

Nous allons maintenant illustrer une seconde approche pour explorer notre série temporelle via l'option décomposition saisonnière de l'outil de transformation de séries temporelles. Nous repartons du jeu de données initial comme indiqué sur la figure qui suit.

time series transformation dialog box

Cette fois, nous choisissons l'onglet Décomposition saisonnière dans l'onglet Options. Nous choisissons le modèle multiplicatif car la série présente un comportement clairement compatible avec ce type de modèle. La période est réglée à 12 pour une périodicité annuelle avec des données mensuelles.

time series transformation dialog box

Une fois la décomposition calculée, nous obtenons un tableau et 4 graphiques présentant successivement la série initiale, la composante tendancielle, la composante saisonnière et la composante aléatoire. Les 3 dernières séries pouvant être multipliées entre elles pour reconstruire la première.

time series transformation result

Nous souhaitons maintenant tester la stationnarité de la composante aléatoire. Pour cela, nous allons appliquer une transformation de Box-Cox sur cette composante aléatoire afin de la recentrer sur 0.

time series transformation dialog box

La figure ci-dessous montre le résultat de cette dernière transformation. 

time series transformation dialog box

Nous lançons une nouvelle fois l'analyse descriptive sur notre série transformée.

time series desc dialog box

Cette fois, le test de Jarque-Bera ne permet pas de rejeter l'hypothèse d'une distribution normale.

time series desc result table

Cependant, nous pouvons tout de même identifier une composante saisonnière résiduelle, quoique diminuée, dans l'autocorrélogramme. Il semblerait qu'un travail d'analyse supplémentaire reste nécessaire pour identifier le processus générateur.

time series desc result autocorrelogram

 

 

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283