Recherche

Thèmes favoris

Notre équipe de chercheurs est passionnée par le Traitement Automatique du Langage Naturel (TALN ou NLP en anglais) et porte ses travaux tout particulièrement sur les thèmes suivants :

  • L’approche symbolique ;
  • La reconnaissance des entités nommées ;
  • La détection de sentiments.

Publications

Technologie RLA

Les chaînes de traitement en Traitement Automatique du Langage Naturel (TALN) sont composées de plusieurs modules qui effectuent des traitements dans un flot d’exécution : les résultats issus d’un module sont communiqués au module suivant.

Chaque module est généralement conçu de façon indépendante des autres modules. Par exemple, un module se focalise sur la reconnaissance d’entités nommées (nom de personnes, nom de lieux, d’organisations, etc.), un autre sur la résolution de coréférences (i.e. identifier l’antécédent d’un terme comme dans « Luc mange. Il est heureux. » où « Il » fait référence à « Luc », un autre module encore se focalise sur l’analyse syntaxique, etc.

Le fonctionnement actuel des chaînes de traitement implique qu’une erreur d’analyse d’un module donné a nécessairement un impact négatif sur la qualité des analyses des modules suivants. 

Issu des travaux de notre équipe de recherche, le Recursive Linguistic Analyzer (RLA) propose un fonctionnement innovant permettant notamment d’éviter ce phénomène et améliore ainsi considérablement la performance globale des chaînes de traitement du TALN.

Labos partenaires

L’excellence du RLA est le résultat du travail de l’équipe de recherche de Emvista.

Dirigée par Cédric Lopez, elle a tissé depuis plusieurs années de solides relations avec les chercheurs spécialisés en TAL des plus grands laboratoires français : 

  • Le LIRMM, Laboratoire d’Informatique, de Robotique et de Mécanique de Montpellier ;
  • L’IRIT, Institut de Recherche en Informatique de Toulouse ;
  • Le LIG, Laboratoire d’Informatique de Grenoble.