Robin Fuchs : Mixed Deep Gaussian Mixture Model:  Un modèle de clustering pour données mixtes

Robin Fuchs
I2M, Aix-Marseille Université
/user/robin.fuchs/

Date(s) : 14/12/2020   iCal
14 h 00 min - 16 h 00 min

Le regroupement de données mixtes présente de nombreux défis inhérents à la nature hétérogène des variables. Un algorithme de clustering devrait néanmoins être capable de capturer le pouvoir discriminant de chacune de ces variables continues et non-continues en tenant compte de cette hétérogénéité.
Dans ce travail, nous introduisons une méthode de clustering appelée Mixed Deep Gaussian Mixture Model (MDGMM) qui peut être considérée comme un moyen automatique de fusionner le clustering effectué séparément sur des données continues et non-continues. Nous concevons également une nouvelle stratégie d’initialisation et une méthode qui sélectionne la meilleure spécification du modèle et le nombre optimal de groupes « à la volée » à partir des données. En outre, notre modèle fournit des représentations continues et de faible dimension des observations qui peuvent constituer un outil utile pour visualiser des ensembles de données mixtes.
Enfin, nous validons les performances de notre approche en comparant ses résultats avec des modèles de clustering pour données mixtes appartenant à l’état de l’art sur plusieurs jeux de données couramment utilisés.

Catégories



Retour en haut 

Secured By miniOrange