BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//wp-events-plugin.com//7.2.3.1//EN
TZID:Europe/Paris
X-WR-TIMEZONE:Europe/Paris
BEGIN:VEVENT
UID:1772@i2m.univ-amu.fr
DTSTART;TZID=Europe/Paris:20170522T140000
DTEND;TZID=Europe/Paris:20170522T150000
DTSTAMP:20170507T120000Z
URL:https://www.i2m.univ-amu.fr/evenements/classification-non-supervisee-b
 asee-sur-les-arbres-de-decision-et-importance-des-variables/
SUMMARY: (...): Classification non supervisée basée sur les arbres de dé
 cision et importance des variables
DESCRIPTION:: CUBT ("clustering using unsupervised binary trees") est une m
 éthode descendante qui comprend trois étapes pour obtenir une partition 
 optimale d'un jeu de données. Cette méthode a les mêmes avantages que C
 ART\, elle peut produire des partitions optimales pour une grande variét
 é de données et possède de bonnes propriétés de convergence. Elle est
  aussi interprétable grâce à la lecture des divisions binaires obtenues
  dans l'arbre.Une des limitations techniques de la version initiale de CUB
 T est le fait que le critère d'hétérogénéité et la mesure de dissimi
 larité utilisés sont spécifiques aux données quantitatives continues. 
 Nous proposons donc des extensions de CUBT pour l'adapter au cas de donné
 es ordinales (de type item) et nominales. Nous suggérons de nouveaux crit
 ères\, basés sur l'information mutuelle et l'entropie de Shannon. Diffé
 rents modèles de simulation de données sont présentés pour expériment
 er cette nouvelle version de CUBT et la comparer à d'autres approches non
  supervisées. Nous définissons aussi quelques heuristiques concernant le
  choix des paramètres de CUBT.Nous nous intéressons ensuite au problème
  de sélection de variables en classification non supervisée. Un arbre de
  classification permet d'identifier les variables qui prennent part active
 ment à la construction de l'arbre. Cependant\, bien que certaines variabl
 es soient non pertinentes pour la construction de l'arbre\, elles peuvent 
 être compétitives dans les différentes divisions binaires de l'arbre. D
 ans de nombreuses applications d'analyse de données\, il est essentiel de
  classer les variables selon un score d'importance afin de déterminer leu
 r pertinence dans un modèle donné. La sélection de variables permet ain
 si de réduire la complexité des modèles que l'on utilise\, afin d'obten
 ir un gain de précision et d'interprétabilité du modèle. Nous présent
 ons donc une méthode pour mesurer l'importance des variables dans le cadr
 e de la classification non-supervisée. Cette méthode\, inspirée de CART
 \, utilise CUBT et la notion de divisions binaires compétitives pour déf
 inir un score d'importance des variables. Nous analysons l’efficacité e
 t la stabilité de ce nouvel indice\, en le comparant à d'autres méthode
 s classiques de scores d'importance de variables. Nous considérons des mo
 dèles de simulation de données pour comparer notre approche\, en ajoutan
 t des variables non pertinentes dans les jeux de données obtenus. Cette m
 éthode montre des résultats satisfaisants en termes d'efficacité et de 
 stabilité. Ce nouveau critère peut être utilisé pour obtenir une hiér
 archie des variables d'un jeu de données\, et développer un algorithme p
 erformant de sélection de variables.http://www.researchgate.net/profile/P
 ierre_Michel2
END:VEVENT
BEGIN:VTIMEZONE
TZID:Europe/Paris
X-LIC-LOCATION:Europe/Paris
BEGIN:DAYLIGHT
DTSTART:20170326T030000
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
END:DAYLIGHT
END:VTIMEZONE
END:VCALENDAR