no code implementations • LREC 2020 • Salima Mdhaffar, Yannick Est{\`e}ve, Antoine Laurent, Hern, Nicolas ez, Richard Dufour, Delphine Charlet, Geraldine Damnati, Solen Quiniou, Nathalie Camelin
The use cases concern scientific fields from both speech and text processing, with language model adaptation, thematic segmentation and transcription to slide alignment.
no code implementations • RANLP 2019 • Amir Hazem, Hern, Nicolas ez
In this paper, we introduce the concept of disruption which we define as a side effect of the training process of embedding models.
no code implementations • RANLP 2019 • Amir Hazem, Hern, Nicolas ez
In this paper, we propose a systematic study of the impact of the main word embedding models on sentence representation.
no code implementations • JEPTALNRECITAL 2019 • Salima Mdhaffar, Yannick Est{\`e}ve, Hern, Nicolas ez, Antoine Laurent, Solen Quiniou
Les transcriptions automatiques de ces syst{\`e}mes sont de plus en plus exploitables et utilis{\'e}es dans des syst{\`e}mes complexes de traitement automatique du langage naturel, par exemple pour la traduction automatique, l{'}indexation, la recherche documentaire... Des {\'e}tudes r{\'e}centes ont propos{\'e} des m{\'e}triques permettant de comparer la qualit{\'e} des transcriptions automatiques de diff{\'e}rents syst{\`e}mes en fonction de la t{\^a}che vis{\'e}e. Dans cette {\'e}tude nous souhaitons mesurer, qualitativement, l{'}apport de l{'}adaptation automatique des mod{\`e}les de langage au domaine vis{\'e} par un cours magistral.
no code implementations • JEPTALNRECITAL 2018 • Basma El Amel Boussaha, Hern, Nicolas ez, Christine Jacquin, Emmanuel Morin
En se basant sur la similarit{\'e} s{\'e}mantique entre le contexte et la r{\'e}ponse, notre approche apprend {\`a} mieux distinguer les bonnes r{\'e}ponses des mauvaises.
no code implementations • RANLP 2017 • Amir Hazem, Basma El Amel Boussaha, Hern, Nicolas ez
Since the advent of word embedding methods, the representation of longer pieces of texts such as sentences and paragraphs is gaining more and more interest, especially for textual similarity tasks.
no code implementations • JEPTALNRECITAL 2016 • Soufian Salim, Hern, Nicolas ez, Emmanuel Morin
D{'}autres exp{\'e}riences sont d{\'e}taill{\'e}es, et nous rapportons les r{\'e}sultats obtenus avec diff{\'e}rentes approches et diff{\'e}rents traits sur les diff{\'e}rentes parties de notre corpus multimodal.
no code implementations • LREC 2016 • Hern, Nicolas ez, Soufian Salim, Elizaveta Loginova Clouet
We present a large, free, French corpus of online written conversations extracted from the Ubuntu platform{'}s forums, mailing lists and IRC channels.
no code implementations • LREC 2012 • Hern, Nicolas ez
And we propose a component to wrap command lines third party tools and a set of components to connect various markup languages with the UIMA data structure.