Rencontres Statistiques du CEREMADE (Rémi Boutin, lundi 30 septembre 2024)

30 septembre 24

Une nouvelle saison des Rencontres statistiques du CEREMADE reprendra le lundi 30 septembre 2024 à 13h30 en salle A409. Nous aurons le plaisir d'écouter Rémi Boutin (LPSM, Sorbonne Université), qui nous parlera de

Le modèle profond à positions et blocs latents pour la classification partielle et non-supervisée des nœuds d'un graphe

Résumé
L'augmentation de la quantité de données provenant du web a entraîné une augmentation de l'utilisation des réseaux pour modéliser des relations entre différents objets, appelés noeuds. Le nombre de noeuds pouvant être très large, l'information contenue dans un réseau doit être résumée, principalement avec des méthodes de classification de noeuds. Pour que les résultats soient interprétables, une visualisation adéquate est également nécessaire. Afin d'allier ces deux propriétés, nous proposons une nouvelle méthodologie, appelée Deep latent position block model (Deep LPBM) permettant d'obtenir simultanément  une visualisation basée sur une approche par bloc, plus générale qu'une méthode de détection de communauté, ainsi qu'une représentation continue des noeuds dans un espace latent correspondant aux probabilités d'appartenance aux clusters. Notre méthodologie, basée sur une stratégie d'auto-encodeur variationnel, repose sur un réseau convolutif de graphe (GCN), avec un decodeur spécialement conçu pour notre tâche. L'inférence est basée sur une borne inférieure de la vraisemblance marginale du modèle et une optimisation de celle-ci par descente de gradient stochastique. Une comparaison avec des méthodes de référence sur la classification pure est fournie ainsi qu'une comparaison sur l'estimation des probabilités d'appartenance aux clusters. Pour conclure, nous illustrerons la nouveauté de Deep LPBM sur un jeu de donnée réel correspondant au réseau des blogs politiques français en 2007 et comparerons les résultats avec ceux obtenus par un modèle à blocs stochastiques.