Rencontres Statistiques du CEREMADE (Marc Hoffmann, lundi 3 juin 2024)

3 juin 24

La prochaine séance des Rencontres statistiques du CEREMADE aura lieu lundi 3 juin 2024 à 14h en salle A707. Nous aurons le plaisir d'écouter Marc Hoffmann (Ceremade), qui nous parlera de

Pour en finir (?) avec l'estimation non-paramétrique d'une diffusion

Résumé
Alors que l'estimation non-paramétrique des coefficients d'une diffusion scalaire semblait être bien comprise (minimax, adaptatif, bayésien non-paramétrique) au début des années 2000, alors que la statistique des semi-martingales s'était résolument tournée vers la finance statistique, les années 2020 voient réapparaître le problème de l'estimation du champ de vecteur de dérive et de la matrice de diffusion pour un processus de diffusion multivarié, notamment sous l'influence de questions de ML et de problèmes inverses bayésiens.

Dans cet exposé, issu d'un travail en cours avec Chiara Amorino et aussi Kolyan Ray, nous montrons que si l'on se contente d'un programme théorique non-paramétrique classique (asymptotique en perte L^2, minimax adaptatif à la Lepski, mais pas tellement plus), alors il est possible d'obtenir des résultats relativement généraux qui améliorent en dimension arbitraire ce que l'on connaît, et ceci dans plusieurs directions : pour (i) des observations en temps grand avec pas de discrétisation arbitrairement lent (ii) une réflexion du processus aux bords d'un domaine, mais pas forcément (iii) des situations où la diffusion peut dégénérer, ce qui permet d'inclure des modèles de type position-vitesse ; (iv) dans certains cas (conductivité, schémas rapides) des vitesses de contraction bayésiennes.

L'approche est toujours un peu la même : pour les bornes supérieures,  approcher le modèle par un schéma de régression martingale, découpler les propriétés de concentration du bruit martingale de la "vitesse de remplissage" de l'espace par le "design" (souvent mal connue, ou tout au moins difficile à estimer) ; pour les bornes inférieures, des méthodes perturbatives utilisant un peu de calcul de Malliavin et pour les résultats bayésiens, plus fins, des développements en temps petit du noyau de la chaleur pour une "bonne" géométrie.