Titre : Analyse et modélisation des données à haute fréquence sur les marchés financiers en utilisant les processus de Hawkes et les réseaux de neurones
Résumé :
Cette thèse est consacrée à l'étude de la microstructure du marché dans les marchés électroniques, en mettant l'accent sur deux sujets clés. Le premier sujet concerne la construction de deux modèles pour les événements de Niveau 1 dans le carnet d'ordres, en utilisant des approches basées sur des modèles statistiques. Le premier modèle consiste en un processus de Hawkes non-linéaire pour modéliser la dynamique dubid-ask spread, appelé le modèle "State-Dependent Spread Hawkes". En intégrant les tailles des sauts du spread et sa valeur dans la fonction d'intensité, ce modèle est capable de capturer diverses propriétés statistiques du spread. Le second modèle, appelé "Hawkes process with shot noise", est utilisé pour séparer les sources de corrélation endogènes et exogènes entre deux prix d'actifs. Pour ce faire, ce modèle suppose l'existence d'un processus latent (shot noise), représentant des comportements d'agents spécifiques non directement observables sur le marché. Théoriquement, des théorèmes de limite sont démontrés et dans la pratique, l'estimation est facilitée par une technique d'estimation non paramétrique. Le second sujet concerne l'analyse et la caractérisation des comportements des agents sur le marché financier, en utilisant des approches basées sur des réseaux neuronaux profonds. Ce sujet comprend deux tâches. La première tâche consiste à classifier les agents en fonction de leurs ordres passés, grâce à une approche d'apprentissage supervisé. La deuxième tâche vise à apprendre la représentation des comportements des agents, en utilisant un modèle d'apprentissage auto-supervisé fondé sur la triplet loss. Ces représentations apprises nous permettent d'appliquer l'algorithme de clustering K-means pour identifier des types de comportements distincts au sein de chaque groupe et ainsi analyser les comportements des agents.