Institut de Mathématiques de Marseille, UMR 7373




Rechercher


Accueil > Séminaires > Séminaires et Groupes de travail hebdomadaires > Statistiques

Séminaire Statistiques

par Le Gouic Thibaut, Lozingot Eric, Willer Thomas - publié le , mis à jour le

Agenda

Séminaire

  • Lundi 27 mars 14:00-15:00 - Sofiane SAADANE - Institut de Mathématiques de Toulouse

    Étude du regret associé aux algorithmes de bandit de type Narendra-Shapiro

    Résumé : Les algorithmes de bandit de types N-S ont été introduits dans les années 60 en vue d’applications aux tests cliniques notamment. Le principe d’un algorithme de bandit peut être défini de la manière suivante : on dispose de 2 sources A et B (ayant respectivement une probabilité pA et pB d’être satisfaisante lorsque qu’elle est utilisée) et on souhaite déterminer laquelle des deux est la plus performante. Récemment, Lamberton et Pagès ont introduit une version dite "pénalisée" de cet algorithme pour laquelle divers résultats de convergence ont été démontrés. Nous nous intéressons dans ce travail à la question suivante : ces algorithmes sont-ils performants d’un point de vue de regret ? Le regret étant la différence entre la meilleure performance possible (i.e celle obtenue en choisissant toujours la meilleur source) et celle obtenue par l’algorithme. Dans cette présentation, nous verrons qu’une légère modification de cette algorithme conduit à des bornes de regret de l’ordre de \sqrtn uniformément en pA et pB. Nous étendrons aussi les résultats de Lamberton et Pagès à une version multidimensionnelle de l’algorithme. Nous établirons une convergence en loi vers la mesure invariante d’un PDMP pour lequel nous étudierons sa convergence à l’équilibre par méthode de couplage.

    JPEG - 6.4 ko
    Sofiane SAADANE

    Lieu : FRUMAM, salle séminaire 2ème étage

    Exporter cet événement

  • Lundi 27 mars 15:30-16:30 - Guillaume CHAUVET - ENSAI, Bruz

    Propriétés de la méthode du pivot, avec application à l’échantillonnage sur flux de données et à l’échantillonnage spatial

    Résumé : Les plans de sondage à probabilités inégales sont utilisés pour sélectionner des échantillons afin d’améliorer la précision des estimateurs par rapport à un tirage à probabilités égales. Si les variables d’intérêt sont approximativement proportionnelles à la probabilité de tirage, la variance peut ainsi être très fortement réduite. Ce principe est notamment utilisé pour un premier degré de tirage dans une enquête auprès des ménages ou une enquête épidémiologique, où des unités primaires (communes ou groupes de communes) sont généralement sélectionnées à probabilités proportionnelles au nombre de résidences principales.
    Parmi les algorithmes de tirage à probabilités inégales, la méthode du pivot (Deville et Tillé, 1998) présente de nombreux avantages. Basée sur un principe de duels entre unités, elle permet de bénéficier d’un effet de stratification, qui tend à réduire la variance si l’ordre d’apparition des unités est lié aux variables mesurées. Il s’agit d’une méthode séquentielle qui permet d’échantillonner des individus à la volée. Elle est donc particulièrement adaptée à un échantillonnage dans un flux de données. Enfin, elle permet d’éviter la sélection d’unités contigües dans la population. Cela la rend très intéressante dans un contexte d’échantillonnage spatial, où elle permet de sélectionner des échantillons bien équilibrés dans l’espace. De nombreux auteurs se sont récemment intéressés à l’utilisation de la méthode du pivot dans ce contexte, voir notamment Grafström et al. (2012), Grafström and Tillé (2013) ou Vallée et al. (2015).
    Lors de cette présentation, nous décrirons notamment le principe de la méthode du pivot, et nous montrerons qu’elle offre de bonnes propriétés statistiques pour un estimateur de type Horvitz-Thompson (consistance faible, théorème central-limite, inégalité exponentielle) sous de faibles hypothèses. Nous présenterons deux applications de la méthode du pivot. Le premier travail (en cours) porte sur un échantillonnage sur flux volumineux de données (travail joint avec Emmanuelle Anceaume, Yann Busnel et Nicolo Rivetti). Le second travail (en cours) porte sur une modification de la méthode GRTS (Generalized Random Tesselation Sampling), couramment utilisée pour un échantillonnage spatial (travail joint avec Ronan Le Gleut).

    JPEG - 4.2 ko
    Guillaume CHAUVET

    Lieu : FRUMAM, salle séminaire du 2ème étage

    Exporter cet événement

  • Lundi 10 avril 14:00-15:00 - Benoit Henry - LORIA

    Séminaire Statistiques (TBA)

    Lieu : FRUMAM, salle séminaire 2ème étage

    Exporter cet événement

  • Lundi 10 avril 15:30-16:30 - Yang Lu - GREQAM

    Séminaire Statistiques (TBA)

    Lieu : FRUMAM, salle séminaire 2ème étage

    Exporter cet événement

  • Lundi 24 avril 14:00-15:00 - Christophe Dutang - Université du Maine, Le Mans

    Séminaire Statistiques (TBA)

  • Lundi 24 avril 15:30-16:30 - Matthieu Marbac - INRIA Lille

    Variable selection for mixed data clustering : a model-based approach

    Résumé : In this talk, we consider two approaches for selecting variables in
    latent class analysis. The first approach consists in optimizing the BIC
    with a modified version of the EM algorithm. This approach
    simultaneously performs both model selection and parameter inference.
    The second approach consists in maximizing the MICL, which considers the
    clustering task, with an algorithm of alternate optimization. This
    approach performs model selection without requiring the maximum
    likelihood estimates for model comparison, then parameter inference is
    done for the unique selected model. Thus, both
    approaches avoid the computation of the maximum likelihood
    estimates for each model comparison. Moreover, they also avoid the use
    of the standard algorithms for variable selection which are often
    suboptimal (e.g. stepwise method) and computationally expensive. The
    case of data with missing values is also discussed. The interest of both
    proposed criteria is shown on a medical data sets describing 1300
    patients by 160000 variables.

    Lieu : FRUMAM, salle de séminaire du 2ème étage

    Exporter cet événement

groupe de travail

Manifestation scientifique

Descriptif
Nature Séminaire
Intitulé Statistiques
Responsables Thibaut Le Gouic
Thomas Willer
Équipe de rattachement Statistiques du Groupe ALEA
Fréquence Hebdomadaire
Jour-Horaire Le Lundi à 14h
Lieu FRUMAM, St Charles (accès)

Contacts :
thibaut.le-gouic_at_centrale-marseille.fr
thomas.willer_at_univ-amu.fr
-
-
-