L’objectif de ce TP est de comparer différentes méthodes de prévisions vus en cours. Nous nous intéressons à l’évolution sur 10 ans du nombre d’immatriculations de voitures particulières en France.

library(readxl)
immat <- read_excel("c7ex2.xls")
X <- ts(immat[!is.na(immat[,2]),2],frequency = 12)
plot(X)

Pour évaluer les qualités prédictives des modèles considérés, nous séparons la dernière année des neuf précédentes.

X.app <- window(X,end=c(9,12))
X.test <- window(X,start=10)
  1. Analyser graphiquement la série.
  2. A partir des méthodes vues en cours et dans les TP précédents proposer un modèle de type SARIMA pour la série considérée. Nous rappelons ici les principales étapes de construction d’un modèle de type SARIMA (méthodologie de Box et Jenkins).
    • Etape 1 : stationnarisation de la série par différentiation. On pourra dans un premier temps transformer les données (transformation \(\log\) ou \(x\mapsto x^\alpha\)) pour stabiliser la variance. On peut faire appel ici aux tests de racines unitaires.
    • Etape 2 : visualisation des ACF et PACF empiriques pour déterminer les paramètres \(p\), \(q\), \(P\) et \(Q\).
    • Etape 3 : estimation des paramètres.
    • Etape 4 : tests de blancheur des résidus.
    • Etape 5 : prévision à partir du modèle retenu.
  3. Proposer un modèle de lissage exponentiel.
  4. Prédire les valeurs de la série sur la dernière années à partir des modèles retenus. Quel modèle proposeriez-vous ?