Guillaume CHAUVET – Propriétés de la méthode du pivot, avec application à l’échantillonnage sur flux de données et à l’échantillonnage spatial




Date(s) : 27/03/2017   iCal
15 h 30 min - 16 h 30 min

Guillaume CHAUVET (IRMAR)

Les plans de sondage à probabilités inégales sont utilisés pour sélectionner des échantillons afin d’améliorer la précision des estimateurs par rapport à un tirage à probabilités égales. Si les variables d’intérêt sont approximativement proportionnelles à la probabilité de tirage, la variance peut ainsi être très fortement réduite. Ce principe est notamment utilisé pour un premier degré de tirage dans une enquête auprès des ménages ou une enquête épidémiologique, où des unités primaires (communes ou groupes de communes) sont généralement sélectionnées à probabilités proportionnelles au nombre de résidences principales.

Parmi les algorithmes de tirage à probabilités inégales, la méthode du pivot (Deville et Tillé, 1998) présente de nombreux avantages. Basée sur un principe de duels entre unités, elle permet de bénéficier d’un effet de stratification, qui tend à réduire la variance si l’ordre d’apparition des unités est lié aux variables mesurées. Il s’agit d’une méthode séquentielle qui permet d’échantillonner des individus à la volée. Elle est donc particulièrement adaptée à un échantillonnage dans un flux de données. Enfin, elle permet d’éviter la sélection d’unités contigües dans la population. Cela la rend très intéressante dans un contexte d’échantillonnage spatial, où elle permet de sélectionner des échantillons bien équilibrés dans l’espace. De nombreux auteurs se sont récemment intéressés à l’utilisation de la méthode du pivot dans ce contexte, voir notamment Grafström et al. (2012), Grafström and Tillé (2013) ou Vallée et al. (2015).

Lors de cette présentation, nous décrirons notamment le principe de la méthode du pivot, et nous montrerons qu’elle offre de bonnes propriétés statistiques pour un estimateur de type Horvitz-Thompson (consistance faible, théorème central-limite, inégalité exponentielle) sous de faibles hypothèses. Nous présenterons deux applications de la méthode du pivot. Le premier travail (en cours) porte sur un échantillonnage sur flux volumineux de données (travail joint avec Emmanuelle Anceaume, Yann Busnel et Nicolo Rivetti). Le second travail (en cours) porte sur une modification de la méthode GRTS (Generalized Random Tesselation Sampling), couramment utilisée pour un échantillonnage spatial (travail joint avec Ronan Le Gleut).

http://ensai.fr/equipe/guillaume-chauvet/

Catégories



Retour en haut