Reconnaissance de phones fond\'ee sur du Transfer Learning pour des enfants apprenants lecteurs en environnement de classe (Transfer Learning based phone recognition on children learning to read, with speech recorded in a classroom environment)

A conditions {\'e}gales, les performances actuelles de la reconnaissance vocale pour enfants sont inf{\'e}rieures {\`a} celles des syst{\`e}mes pour adultes. La parole des jeunes enfants est particuli{\`e}rement difficile {\`a} reconna{\^\i}tre, et les donn{\'e}es disponibles sont rares. En outre, pour notre application d{'}assistant de lecture pour les enfants de 5-7 ans, les mod{\`e}les doivent s{'}adapter {\`a} une lecture lente, des disfluences et du bruit de brouhaha typique d{'}une classe. Nous comparons ici plusieurs mod{\`e}les acoustiques pour la reconnaissance de phones sur de la parole lue d{'}enfant avec des donn{\'e}es bruit{\'e}es et en quantit{\'e} limit{\'e}e. Nous montrons que faire du Transfer Learning avec des mod{\`e}les entra{\^\i}n{\'e}s sur la parole d{'}adulte et trois heures de parole d{'}enfant am{\'e}liore le taux d{'}erreur au niveau du phone (PER) de 7,6{\%} relatifs, par rapport {\`a} un mod{\`e}le enfant. La normalisation de la longueur du conduit vocal sur la parole d{'}adulte r{\'e}duit ce taux d{'}erreur de 5,1{\%} relatifs suppl{\'e}mentaires, atteignant un PER de 37,1{\%}.

PDF Abstract
No code implementations yet. Submit your code now

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here