Utilisation de mesures de confiance pour am\'eliorer le d\'ecodage en traduction de parole

Les mesures de confiance au niveau mot (Word Confidence Estimation - WCE) pour la traduction auto- matique (TA) ou pour la reconnaissance automatique de la parole (RAP) attribuent un score de confiance {\`a} chaque mot dans une hypoth{\`e}se de transcription ou de traduction. Dans le pass{\'e}, l{'}estimation de ces mesures a le plus souvent {\'e}t{\'e} trait{\'e}e s{\'e}par{\'e}ment dans des contextes RAP ou TA. Nous proposons ici une estimation conjointe de la confiance associ{\'e}e {\`a} un mot dans une hypoth{\`e}se de traduction automatique de la parole (TAP). Cette estimation fait appel {\`a} des param{\`e}tres issus aussi bien des syst{\`e}mes de transcription de la parole (RAP) que des syst{\`e}mes de traduction automatique (TA). En plus de la construction de ces estimateurs de confiance robustes pour la TAP, nous utilisons les informations de confiance pour re-d{\'e}coder nos graphes d{'}hypoth{\`e}ses de traduction. Les exp{\'e}rimentations r{\'e}alis{\'e}es montrent que l{'}utilisation de ces mesures de confiance au cours d{'}une seconde passe de d{\'e}codage permettent d{'}obtenir une am{\'e}lioration significative des performances de traduction ({\'e}valu{\'e}es avec la m{\'e}trique BLEU - gains de deux points par rapport {\`a} notre syst{\`e}me de traduc- tion de parole de r{\'e}f{\'e}rence). Ces exp{\'e}riences sont faites pour une t{\^a}che de TAP (fran{\c{c}}ais-anglais) pour laquelle un corpus a {\'e}t{\'e} sp{\'e}cialement con{\c{c}}u (ce corpus, mis {\`a} la disposition de la communaut{\'e} TALN, est aussi d{\'e}crit en d{\'e}tail dans l{'}article).

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here