logo site
Institut de Mathématiques de Marseille, UMR 7373
Slogan du site
Descriptif du site

Pierre PUDLO, Grégoire AUFORT - Méthodes bayésiennes approchées

lundi
21
octobre
2019
14h00 - 17h00
horaire FRUMAM

Aix-Marseille Université - Site St Charles
3, place Victor Hugo - case 39
13331 MARSEILLE Cedex 03

Pierre PUDLO, Grégoire AUFORT (I2M, Aix-Marseille Université)

Méthodes bayésiennes approchées (ABC), et applications au choix de modèle de formation stellaire des galaxies

Nous commencerons par présenter les méthodes bayésiennes approchées (ABC pour Approximate Bayesian Computation). Ces méthodes ont été développées pour faire une analyse bayésienne lorsque la vraisemblance n’est pas calculable. Nous montrerons comment, à partir de simulations et de statistiques résumées sur ces simulations, nous pouvons reconstruire la loi a posteriori d’un paramètre, ou d’un indice de modèle.
Par la suite, nous nous intéressons au problème du choix de modèle dans le cas où nous devons traité un nombre important de jeux de données, ou d’objets. Nous proposons une extension de l’algorithme ABC-RandomForest pour le choix de modèle. Cette extension est basée sur du boosting d’arbres (minimisation de l’entropie croisée) sur le catalogue de simulations ABC. Cet algorithme d’apprentissage nous permet de contourner l’emploi de statistiques résumées dans notre algorithme. Enfin, nous présenterons une application à l’astrophysique. Il s’agit de reconstruire l’histoire de formation stellaire à partir de données photométriques, qui portent une information limitée. Malgré cette limite, nous montrerons la pertinence de la complexification d’un modèle d’histoire de formation pour certains jeux de données.

Pierre PUDLO (I2M, Aix-Marseille Université)

Approximate Bayesian Computation with SMC^2

Il s’agit d’un travail joint avec Anthony Ebert et Kerrie Mengersen (QUT, Brisbane, Australia)
L’algorithme SMC^2 de N. Chopin, P. Jacob et O. Papaspiliopoulos permet d’échantillonner la loi a posteriori des paramètres d’un modèle à espace d’état, aussi appelé chaîne de Markov cachée. Cet algorithme nécessite de savoir évaluer numériquement la densité de la loi de transition des états latents, et de la loi d’émission des observations. Lorsque ce n’est plus possible, nous devons recourir à une stratégie semblable à celle des algorithmes ABC, qui reposent uniquement sur notre capacité à simuler de nouveaux jeux de données, et à les comparer aux données observées. L’algorithme que nous proposons peut être vu comme une mise à jour itérative de la loi a priori, qui inclut progressivement le jeu de données. Dans une certaine mesure, il permet de lutter contre le fléau de la dimension lorsque l’on compare des jeux de données dans les méthodes ABC. Enfin, nous illustrerons cet algorithme par un problème d’inférence sur le processus de Hawkes.

Webpage
Webpage
Pierre PUDLO
Grégoire AUFORT