Descente de gradient dans l’espace de Wasserstein pour l’échantillonnage : théorie et algorithmes
Chiheb Daaloul
I2M, Aix-Marseille Université
Date(s) : 06/12/2024 iCal
13h30 - 18h00
Jury :
- M. Thibaut LE GOUIC Centrale Méditerranée (Directeur de thèse)
- Mme Magali TOURNUS Centrale Méditerranée (Co-encadrante de thèse)
- M. Adil AHIDAR-COUTRIX École Centrale Casablanca (Co-directeur de thèse)
- M. Pierre PUDLO Aix-Marseille Université (Président)
- M. Nicolas COURTY Université Bretagne Sud (Rapporteur)
- M. Alain DURMUS CMAP, École polytechnique (Rapporteur)
- M. Arnaud GUILLIN Université Clermont-Auvergne (Examinateur)
- M. Romain HUG Aix-Marseille Université (Examinateur)
Résumé (français) :
L’échantillonnage est un outil très utilisé en statistiques (méthodes bayésiennes,
apprentissage statistique) qui permet de représenter faiblement une mesure de probabilité
via une intégration contre une classe de fonctions régulières.L’algorithme de Langevin est une méthode populaire qui fournit un échantillon
approximativement distribué selon une mesure de probabilité définie sur R^d . Dans
la première partie de cette thèse, nous obtenons des résultats concernant la convergence
d’une généralisation de l’algorithme de Langevin aux mesures définies sur un
sous-ensemble convexe possiblement borné de R^d , et dans le cas où la mesure n’est
pas nécessairement (relativement) log-concave. Nous justifions rigoureusement la
convergence de cet algorithme sous des hypothèses raisonnables. L’analyse présentée
dans cette partie s’inscrit dans l’interprétation de l’échantillonnage comme un
problème d’optimisation dans l’espace de Wasserstein.Calculer une moyenne est une opération élémentaire permettant de réduire un en-
semble complexe de données à un élément représentatif interprétable. Dans l’espace
de Wasserstein, M. Agueh et G. Carlier ont défini le barycentre comme la moyenne de
Fréchet, qui a reçu une attention grandissante de la part de communautés au sein et
en-dehors des mathématiques. Ceci tient en partie à ce que le barycentre de Wasserstein
fournit un représentant plus interprétable que d’autres notions de moyennes
dans certaines situation (par exemple, en traitement d’images).Dans la deuxième partie de cette thèse, nous proposons une méthode basée sur une
descente de gradient dans l’espace des couplages de Wasserstein pour échantillonner le
barycentre de mesures à densité définies sur R^d . Notre méthode consiste en
une relaxation de la formulation multimarginale du barycentre, où la contrainte de
couplage est remplacée par une pénalité.
Abstract (English) :
Sampling is a widely used tool in statistics (Bayesian methods, statistical learning)
that allows for a weak representation of a probability measure through integration
against a class of regular functions.
The Langevin algorithm is a popular method that provides a sample approximately
distributed according to a probability measure defined on R^d . In the first part of
this thesis, we obtain results regarding the convergence of a generalization of the
Langevin algorithm to measures defined on a possibly bounded convex subset of R^d ,
where the measure is not necessarily (relatively) log-concave. We rigorously justify the
convergence of this algorithm under reasonable assumptions. The analysis presented
in this section is framed within the interpretation of sampling as an optimization
problem in the Wasserstein space.
Calculating an average is a basic operation that reduces a complex dataset to an
interpretable representative element. In the Wasserstein space, M. Agueh and G. Carlier
defined the barycenter as the Fréchet mean, which has received growing attention
from communities both within and outside mathematics. This is partly due to the
fact that the Wasserstein barycenter provides a more interpretable representative than
other notions of averages in certain situations (e.g., in image processing).
In the second part of this thesis, we propose a gradient descent-based method in the
space of Wasserstein couplings to sample the barycenter of density measures defined
on R^d . Our method consists of a relaxation of the multimarginal formulation of the
barycenter, where the coupling constraint is replaced by a penalty.
Emplacement
I2M Saint-Charles - Salle de séminaire
Catégories