BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//wp-events-plugin.com//7.4.0.1//EN
TZID:Europe/Paris
X-WR-TIMEZONE:Europe/Paris
BEGIN:VEVENT
UID:8457@i2m.univ-amu.fr
DTSTART;TZID=Europe/Paris:20231211T150000
DTEND;TZID=Europe/Paris:20231211T180000
DTSTAMP:20241209T160722Z
URL:https://www.i2m.univ-amu.fr/evenements/soutenance-de-these-classificat
 ion-non-supervisee-des-productions-vocales-chez-le-bebe-humain-entre-0-et-
 12-mois/
SUMMARY:Guillem Bonafos (I2M\, Aix-Marseille Université): Classification n
 on-supervisée des productions vocales chez le bébé humain entre 0 et 12
  mois
DESCRIPTION:Guillem Bonafos: Composition du jury\n\n\n\n\nM. Pierre PUDLO
  \nAix Marseille Université \nDirecteur de thèse \n\n\nM. Bertrand MI
 CHEL \nÉcole Centrale de Nantes \nRapporteur \n\n\nMme Florence LEVRER
 O \nUniversité Jean Monnet \nRapporteure \n\n\nMme Marianne CLAUSEL \
 nUniversité de Lorraine \nExaminatrice \n\n\nM. Vincent VANDEWALLE \nU
 niversité Côte d'Azur \nPrésident \n\n\nM. Jean-Marc FREYERMUTH \nAi
 x-Marseille Université \nCo-directeur de thèse \n\n\nM. Samuel TRONçO
 N \nRésurgences R&amp\;D \nCo-encadrant de thèse \n\n\nM. Arnaud REY
  \nAix Marseille Université \nInvité\n\n\n\n\n\n\nMots-clés :\nClass
 ification\, Apprentissage statistique\, Développement du langage\, Statis
 tique bayésienne\, Analyse Topologique des Données\n\n\n\n\n&nbsp\;\n\n\
 n\nKeywords :\nClustering\, Machine learning\, Language Development\, Baye
 sian Statistics\, Topological Data Analysis\n\n\n\n \n\n\n\nRésumé : 
  \n\n\n\nAux alentours de son premier anniversaire\, l'enfant humain pron
 once son premier mot. Cette première production n'est pourtant pas le dé
 but de son apprentissage de la langue. Celui-ci commence dès sa naissance
 . En effet\, tout au long de sa première année\, l'enfant développe des
  capacités motrices lui permettant de produire une gamme de vocalisations
  de plus en plus large\, en les calibrant au langage qui l'entoure. Les mo
 yens d'enregistrements et de stockage récents permettent de construire de
  nouvelles bases de données de vocalisations produites tout au long de l'
 année. Nous construisons dans cette thèse une telle base et présentons 
 trois contributions pour aider à étudier la question des vocalisations i
 nfantiles pré-langagières. Nous proposons d'abord une méthodologie pour
  détecter et classifier automatiquement les vocalisations dans les enregi
 strements audios massifs. Elle permet l'apprentissage d'un réseau de neur
 ones à partir d'un peu plus d'une heure de données étiquetées\, qui fa
 it ensuite le travail d'extraction de vocalisations d'enregistrements natu
 rels massifs. Elle a été appliquée sur deux ensembles d'enregistrements
 \, prouvant son adaptabilité : les enregistrements de bébé récoltés p
 our ce travail de thèse ainsi que des enregistrements d'un mois d'un encl
 os de singe\, permettant de produire deux nouveaux ensembles de données\,
  un de vocalisation de bébé et un de vocalisation de singe. Nous avons r
 endu ce dernier librement accessible\, tout comme le code permettant de re
 produire la méthodologie. Nous emmenons ensuite des preuves empiriques de
  l'intérêt d'incorporer une information topologique dans la représentat
 ion d'un signal vocal humain pour une tâche de classification. Nous quant
 ifions la plus-value d'une approche topologiquement augmentée et les diff
 érences selon l'objet représentant une vocalisation identique. On montre
  que l'information topologique est complémentaire à une information fré
 quentielle et que les homologies persistantes calculées sur chaque objet 
 sont complémentaires entre elles. Pour répondre à cette question\, nous
  avons construit une nouvelle base d'enregistrements de 11 200 voyelles\, 
 que nous avons rendu librement accessible. Nous avons comparé les résult
 ats sur trois tâches de classification selon que la représentation du si
 gnal est topologiquement augmentée ou non\, ainsi que la meilleure façon
  de vectoriser l'information contenue dans un diagramme de persistance. En
 fin\, nous avons classifié de manière non-supervisée\, par une modélis
 ation bayésienne non-paramétrique\, les vocalisations produites par un e
 nfant durant sa première année de vie\, à partir d'une représentation 
 topologiquement augmentée du signal. On découvre huit classes de vocalis
 ations\, dont la proportion de production varie selon le développement\, 
 et avec des caractéristiques fréquentielles différentes. \n\n\n \n\n\n
 \n\n\n\n\nAbstract :  \n\n\n\nAround her first birthday\, the human child
  utters her first word. This first utterance is not\, however\, the beginn
 ing of language learning. This begins at birth. Throughout the first year 
 of life\, children develop motor skills that enable them to produce an inc
 reasingly wide range of vocalizations\, calibrated to the language around 
 them. Recent recording and storage technologies have made it possible to b
 uild new databases of vocalizations produced throughout the year. In this 
 thesis\, we build such a database and present three contributions to help 
 study the question of pre-language infant vocalizations. First\, we propos
 e a methodology for automatically detecting and classifying vocalizations 
 in massive audio recordings. It enables a neural network to be trained fro
 m just over an hour's worth of labeled data\, which then does the job of e
 xtracting vocalizations from massive natural recordings. It has been appli
 ed to two sets of recordings\, proving its adaptability: the baby recordin
 gs collected for this thesis work and one month's recordings from a monkey
  pen\, enabling us to produce two new data sets\, one of baby vocalization
 s and one of monkey vocalizations. We have made the latter freely accessib
 le\, as has the code enabling the methodology to be reproduced. We then pr
 ovide empirical evidence of the value of incorporating topological informa
 tion into the representation of a human vocal signal for a classification 
 task. We quantify the added value of a topologically augmented approach an
 d the differences depending on the object representing an identical vocali
 zation. We show that topological information is complementary to frequency
  information and that the persistent homologies computed on each object ar
 e complementary to each other. To answer this question\, we built a new da
 tabase of recordings of 11\,200 vowels\, which we made freely accessible. 
 We compared results on three classification tasks depending on whether the
  signal representation is topologically augmented or not\, as well as the 
 best way to vectorize the information contained in a persistence diagram. 
 Finally\, we performed an unsupervised classification\, using non-parametr
 ic Bayesian modeling\, of the vocalizations produced by a child during its
  first year of life\, based on a topologically augmented representation of
  the signal. Eight classes of vocalizations were discovered\, with differe
 nt proportions of production depending on development\, and with different
  frequency characteristics.\n\n\n \n\n\n\n
CATEGORIES:Soutenance de thèse,ALEA,Statistique
LOCATION:Saint-Charles - FRUMAM  (2ème étage)\, 3 Place Victor Hugo\, Mar
 seille\, 13003\, France
X-APPLE-STRUCTURED-LOCATION;VALUE=URI;X-ADDRESS=3 Place Victor Hugo\, Marse
 ille\, 13003\, France;X-APPLE-RADIUS=100;X-TITLE=Saint-Charles - FRUMAM  (
 2ème étage):geo:0,0
END:VEVENT
BEGIN:VTIMEZONE
TZID:Europe/Paris
X-LIC-LOCATION:Europe/Paris
BEGIN:STANDARD
DTSTART:20231029T020000
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
END:STANDARD
END:VTIMEZONE
END:VCALENDAR