Séries temporelles, analyse descriptive et transformation
Ce tutoriel vous montrera comment décrire et transformer une série temporelle pour qu’elle devienne stationnaire, dans Excel en utilisant XLSTAT.
Jeu de données pour analyse descriptive et transformations de séries temporelles
Les données proviennent de [Box, G.E.P. and Jenkins, G.M. (1976). Time Series Analysis: Forecasting and Control. Holden-Day, San Francisco], et correspondent au trafic aérien international (en milliers de passagers) de Janvier 1949 à Décembre 1960.
Le but ici est de montrer l’utilité de l’analyse descriptive avant l’utilisation de modèles prédictifs.
On note sur ce graphique que le nombre de passagers a tendance à augmenter régulièrement et que l'on retrouve chaque année un cycle similaire. Cependant les variations à l'intérieur d'une même année sont de plus en plus fortes. Afin de confirmer ces éléments nous allons commencer par analyser la fonction d’autocorrélation de la série.
Analyse descriptive de série temporelle
Paramétrer une analyse descriptive de série temporelle avec XLSTAT
-
Ouvrir XLSTAT
-
Selectionner le menu Fonctions avancées / Analyse de séries temporelles/ Analyse descriptive. La boite de dialogue de l’analyse descriptive apparaît.
-
Dans l’onglet Général, sélectionner les les valeurs de la série temporelle.
-
Dans l’onglet Options, cocher l’option automatique pour le choix du nombre de décalages pour lesquels effectuer les calculs. Configurer l’intervalle de confiance à 95% et s’assurer que l’option tests de bruit blanc est cochée.
-
Dans l’onglet Sorties, sélectionner autocorrélations et autocorrélations partielles
-
Dans l’onglet Graphiques, cocher les options autocorrélogramme et autocorrélogramme partiel
Comment interpréter une analyse descriptive de série temporelle ?
Dans les premiers tableaux sont affichées des statistiques générales. Ensuite, un tableau donne les résultats des tests de normalité et de bruit blanc.
Le test de Jarque-Bera est un test de normalité fondé sur les propriétés de symétrie et d’aplatissement de la loi normale. Plus la valeur du Khi² est importante, moins l'hypothèse nulle de normalité des données est vraisemblable. Ici, la probabilité fournie, qui correspond à la probabilité de se tromper en rejetant l'hypothèse nulle, est proche de 0,012. Avec un seuil de signification alpha=0.05, on doit donc rejeter l'hypothèse nulle.
Les trois autres tests (Box-Pierce, Ljung-Box, McLeod-Li) sont calculés à différents pas de temps. Ils permettent de tester si les données pourraient provenir d'un bruit blanc ou non. Ces tests s'appuient également sur la distribution du Khi². Les résultats sont concordants, et indiquent que les données ne peuvent pas être issus d'un bruit blanc. Alors qu'un tri n'a aucune influence sur le test de Jarque-Bera, il en aurait un sur les autres tests qui sont adaptés spécifiquement aux séries temporelles.
Dans le tableau ci-dessous sont affichées les fonctions descriptives de la série chronologique, et les deux diagrammes en bâtons correspondent à la fonction d'autocorrélation (FAC) et à la fonction d'autocorrélation partielle (FACP). Les intervalles de confiance à 95% sont également affichés. Au niveau de l'autocorrélogramme, on identifie une autocorrélation d'ordre 1, ainsi qu'une saisonnalité de 12 mois.
Transformation d’une série temporelle
Dans le but d'augmenter la normalité des données, nous allons procéder à deux transformations successives : nous voulons d'abord stabiliser la variance de la série, puis, retirer les autocorrélations significatives par une différenciation de la série. Cela peut être fait avec l'outil de transformation de séries temporelles.
Paramétrer une transformation de série temporelle avec XLSTAT
-
Selectionner le menu Fonctions avancées / Analyse de séries temporelles/ Transformation de série temporelle. La boite de dialogue transformation de série temporelle apparaît.
-
Dans l’onglet Général, sélectionner les les valeurs de la série temporelle.
-
Dans l’onglet Options, cocher l’option Box-Cox et configurer le paramètre lambda à 0 afin de réaliser une transformation logarithmique de la série. La transformation logarithmique est souvent efficace lorsqu’il s’agit de supprimer une variabilité croissante.
Résultats de la transformation logarithmique
D'abord, un tableau et deux graphiques apparaissent: l'un représentant le jeu de données d'origine et le deuxième représentant la transformation logarithmique. Comme prévu, celle-ci a permis d’éliminer la variabilité croissante.
Paramétrer une différenciation de série temporelle avec XLSTAT
-
Selectionner le menu Fonctions avancées / Analyse de séries temporelles/ Transformation de série temporelle. La boite de dialogue transformation de série temporelle apparaît.
-
Dans l’onglet Général, sélectionner les les valeurs de la série temporelle issue de la transformation logarithmique
-
Dans l’onglet Options, cocher l’option différenciation and fixer la valeur de d à 1 pour enlever la tendance, la valeur de D à 1 et celle de s à 12 pour supprimer la saisonnalité de 12 mois.
Résultats de la différenciation
Les graphiques qui s'affichent montrent que la composante tendancielle a effectivement été éliminée.
Réaliser une analyse descriptive sur la série obtenue donne les résultats suivants.
Le test de Jarque-Bera confirme que les séries sont plus proches d'une distribution normale : la probabilité est passée de 0,012 à 0,027. Cependant, les tests de bruit blanc indiquent que les transformations n'ont pas été suffisantes.
L'autocorrélogramme montre également que des composantes significatives au pas de temps 1 et 12 restent présentes. Une investigation plus poussée du processus générateur serait nécessaire pour mieux corriger la série.
Paramétrer une décomposition saisonnière de série temporelle avec XLSTAT
-
Selectionner le menu Fonctions avancées / Analyse de séries temporelles/ Transformation de série temporelle. La boite de dialogue transformation de série temporelle apparaît.
-
Dans l’onglet Général, sélectionner les les valeurs de la série temporelle initiale
-
Dans l’onglet Options, cocher l’option décomposition saisonnière et sélectionner le modèle multiplicatif. Ce modèle est choisi car la série présente un comportement clairement compatible avec ce type de modèle. La période est réglée à 12 pour une périodicité annuelle, les données étant mensuelles.
Résultats de la décomposition saisonnière de série temporelle
Une fois la décomposition calculée, nous obtenons un tableau et 4 graphiques présentant successivement la série initiale, la composante tendancielle, la composante saisonnière et la composante aléatoire. Les 3 dernières séries peuvent être multipliées entre elles pour reconstruire la série d’origine.
La stationnarité de la composante aléatoire peut maintenant être testée. Il est toutefois nécessaire de réaliser une transformation logarithmique de cette composante aléatoire afin de la centrer en 0.
Une analyse descriptive est à nouveau effectuée sur la série obtenue. Cette fois, le test de Jarque-Bera ne permet pas de rejeter l'hypothèse d'une distribution normale.
Cependant, nous pouvons tout de même identifier une composante saisonnière résiduelle, quoique diminuée, dans l'autocorrélogramme. Il semblerait qu'un travail d'analyse supplémentaire reste nécessaire pour identifier le processus générateur.
Cet article vous a t-il été utile ?
- Oui
- Non