Statistique Computationnelle Bayésienne pour l’étude des Distributions Spectrales d’énergie des galaxies

Grégoire Aufort
I2M, Aix-Marseille Université
/user/gregoire.aufort/

Date(s) : 10/10/2022   iCal
14 h 00 min - 16 h 00 min

SOUTENANCE DE THÈSE

Statistique Computationnelle Bayésienne pour l’étude des Distributions Spectrales d’énergie des galaxies

Sous la codirection de Pierre PUDLO (I2M) et de Denis BURGARELLA (Laboratoire d’Astrophysique de Marseille – LAM).

Thèse en préparation à Aix-Marseille , dans le cadre de Mathématiques et informatique de Marseille (184) , en partenariat avec Institut de Mathématiques de Marseille (équipe de recherche Statistique du groupe ALEA) depuis le 11-10-2018.

Membres du jury : 

– Nicolas CHOPIN, ENSAE, Président du jury
– Sylvain LE CORFF, Institut Polytechnique de Paris, Rapporteur
– Marc HUERTAS-COMPANY, Observatoire de Paris, Rapporteur
– Véronique BUAT, Aix-Marseille Université, Membre du jury
– Florence FORBES, INRIA, Membre du jury
– Clotilde LAIGLE, Institut d’Astrophysique de Paris, Membre du jury
– Pierre PUDLO, I2M, Aix-Marseille Université, Co-directeur
– Denis BURGARELLA, Laboratoire d’Astrophysique de Marseille, Co-directeur

Résumé : L’exploitation de nouveaux outils d’observation en astrophysique nécessite le développement de nouveaux outils statistiques afin d’être efficace et précis. Nous nous intéressons particulièrement aux statistiques bayésiennes pour l’étude des distributions spectrales d’énergie des galaxies.

Après une introduction à l’analyse des distributions spectrales d’énergie, la première partie de cette thèse propose un algorithme de calcul bayésien approché (ABC) basé sur l’apprentissage automatique pour le choix de modèles d’histoire de la formation d’étoiles à partir de données photométriques. La méthode est appliquée aux données du relevé COSMOS pour l’identification des galaxies dont le taux de formation d’étoiles a subi une violente altération dans un passé proche.

La deuxième partie de la thèse propose un nouvel algorithme d’échantillonnage préferentiel adaptatif multiple : TAMIS (Tempered Anti-Truncated Multiple Importance Sampling). En introduisant une séquence de distributions cibles auxiliaires auto-calibrées, TAMIS est robuste au fléau de la dimension ainsi qu’à une mauvaise initialisation, et nécessite relativement peu d’évaluations de la densité cible, sans utiliser son gradient.

La troisième partie présente le code CIGALE utilisé pour modéliser les distributions spectrales des galaxies à partir de modèles physiques. Le calcul de la SED attendue avec des paramètres connus se fait par étapes successives correspondant aux différents processus physiques en jeu. Pour accélérer le calcul, nous proposons de remplacer les calculs explicites de certaines étapes par une approximation de réseau de neurones.

Enfin, nous présentons un modèle statistique complet pour l’inférence bayésienne des paramètres et le choix du modèle utilisant à la fois des données photométriques et spectroscopiques, et l’application de TAMIS à ce problème spécifique.

Mots clés : Statistique, Calcul bayésien approximatif, Galaxies, Densité spectrales d’énergie, Apprentissage profond, échantillonnage d’importance.


Bayesian computational statistics for the study of spectral energy distributions of galaxies

Abstract: The exploitation of new observation tools in astrophysics requires the development of new statistical tools in order to be effective and precise. We are particularly interested  Bayesian statistics for the study of the Spectral Energy Distributions of galaxies.

After an introduction to the analysis of spectral energy distributions, the first part of this thesis proposes a Machine Learning based Approximate Bayesian Computation algorithm (ABC) for the choice of Star Formation History models from data photometric. The method is applied to data from the COSMOS survey for the identification of galaxies whose star formation rate has undergone a violent alteration in the near past.

The second part of the thesis proposes a new Multiple Adaptive Importance Sampling algorithm: TAMIS (Tempered Anti-Truncated Multiple Importance Sampling). By introducing a sequence of self-calibrated auxiliary target distributions TAMIS is robust to the curse of dimensionality as well as poor initialization, and requires relatively few evaluations of the target density, without using its gradient.

The third part presents the CIGALE code used for modeling the spectral distributions of galaxies from physical models. The calculation of the expected SED with known parameters is done in successive stages corresponding to the different physical processes at play. To speed up the computation, we propose the replacement of the explicit computations of certain steps by a neural network approximation.

Finally we presents a complete statistical model for the Bayesian parameter inference and model choice using both photometric and spectroscopic data, and the application of TAMIS to this specific problem.

Keywords: Statistics, Galaxies, Spectral Energy Density, Deep Learning, Importance Sampling, Approximate Bayesian Computation.

Liens :
https://www.theses.fr/s210548
https://college-doctoral.univ-amu.fr/inscrit/10985
https://pierre-pudlo.pedaweb.univ-amu.fr/author/gregoire-aufort/
https://adum.parisnanterre.fr/as/ed/cv.pl?mat=100895&site=adumR
https://scholar.google.com/citations?user=fPkU8WEAAAAJ&hl=fr
https://www.researchgate.net/profile/Gregoire-Aufort
https://fr.linkedin.com/in/grégoire-aufort-1a985411a

Lieu :

Laboratoire d’Astrophysique de Marseille

Pôle de l’Étoile Site de Château-Gombert

38, rue Frédéric Joliot-Curie

13388 Marseille

Emplacement
LAM - Laboratoire d'Astrophysique de Marseille

Catégories



Retour en haut 

Secured By miniOrange