Localisation

Adresses

Aix-Marseille Université
Institut de Mathématiques de Marseille (I2M) - UMR 7373
Site Saint-Charles : 3 place Victor Hugo, Case 19, 13331 Marseille Cedex 3
Site Luminy : Campus de Luminy - Case 907 - 13288 Marseille Cedex 9

Extraction d’information dans le domaine biomédical à base de corpus et de connaissances


...

Date(s) : 23/09/2019   iCal
14h00 - 15h00

Le séminaire sera composé de deux parties. Dans la première partie, je ferai un survol de plusieurs de nos travaux récents en TAL biomédical : extraction de symptômes et traitements dans des forums de santé, normalisation d’informations dans les certificats de décès, TAL pour la formation des médecins. Dans la deuxième partie, je me concentrerai sur un travail récent (thèse d’A Ferré) autour du plongement d’ontologie pour le liage référentiel. La tâche de normalisation d’entité consiste en la mise en correspondance automatique de mentions d’entités dans des textes avec les concepts d’un référentiel, typiquement une ontologie. Pour réaliser cette tâche en alliant corpus et connaissances a priori, nous proposons une nouvelle approche par alignement de deux types de représentations vectorielles d’entités capturant une partie de leur sens : les plongements lexicaux pour les mentions textuelles et des « plongements ontologiques » pour les concepts, conçus spécifiquement pour ce travail. L’alignement entre les deux se fait par apprentissage supervisé. Les méthodes développées ont été évaluées avec un jeu de données de référence du domaine biologique et elles représentent aujourd’hui l’état de l’art pour ce jeu de données.

http://www.limsi.fr/~pz/

Catégories Pas de Catégories


Secured By miniOrange