Similarit\'e s\'emantique entre phrases : apprentissage par transfert interlingue (Semantic Sentence Similarity : Multilingual Transfer Learning)

Dans cet article, nous d{\'e}crivons une approche exploratoire pour entra{\^\i}ner des mod{\`e}les de langue et r{\'e}soudre des t{\^a}ches d{'}appariement entre phrases issues de corpus en fran{\c{c}}ais et relevant du domaine m{\'e}dical. Nous montrons que, dans un contexte o{\`u} les donn{\'e}es d{'}entra{\^\i}nement sont en nombre restreint, il peut {\^e}tre int{\'e}ressant d{'}op{\'e}rer un apprentissage par transfert, d{'}une langue dont nous disposons de plus de ressources pour l{'}entra{\^\i}nement, vers une langue cible moins dot{\'e}e de donn{\'e}es d{'}entra{\^\i}nement (le fran{\c{c}}ais dans notre cas). Les r{\'e}sultats de nos exp{\'e}rimentations montrent que les mod{\`e}les de langue multilingues sont capables de transf{\'e}rer des repr{\'e}sentations d{'}une langue {\`a} l{'}autre de fa{\c{c}}on efficace pour r{\'e}soudre des t{\^a}ches de similarit{\'e} s{\'e}mantique telles que celles propos{\'e}es dans le cadre de l{'}{\'e}dition 2020 du D{\'e}fi fouille de texte (DEFT).

PDF Abstract

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here