Apprentissage par imitation pour l'\'etiquetage de s\'equences : vers une formalisation des m\'ethodes d'\'etiquetage easy-first
De nombreuses m{\'e}thodes ont {\'e}t{\'e} propos{\'e}es pour acc{\'e}l{\'e}rer la pr{\'e}diction d{'}objets structur{\'e}s (tels que les arbres ou les s{\'e}quences), ou pour permettre la prise en compte de d{\'e}pendances plus riches afin d{'}am{\'e}liorer les performances de la pr{\'e}diction. Ces m{\'e}thodes reposent g{\'e}n{\'e}ralement sur des techniques d{'}inf{\'e}rence approch{\'e}e et ne b{\'e}n{\'e}ficient d{'}aucune garantie th{\'e}orique aussi bien du point de vue de la qualit{\'e} de la solution trouv{\'e}e que du point de vue de leur crit{\`e}re d{'}apprentissage. Dans ce travail, nous {\'e}tudions une nouvelle formulation de l{'}apprentissage structur{\'e} qui consiste {\`a} voir celui-ci comme un processus incr{\'e}mental au cours duquel la sortie est construite de fa{\c{c}}on progressive. Ce cadre permet de formaliser plusieurs approches de pr{\'e}diction structur{\'e}e existantes. Gr{\^a}ce au lien que nous faisons entre apprentissage structur{\'e} et apprentissage par renforcement, nous sommes en mesure de proposer une m{\'e}thode th{\'e}oriquement bien justifi{\'e}e pour apprendre des m{\'e}thodes d{'}inf{\'e}rence approch{\'e}e. Les exp{\'e}riences que nous r{\'e}alisons sur quatre t{\^a}ches de TAL valident l{'}approche propos{\'e}e.
PDF Abstract