Traducció automàtica de la parla : creació i avaluació de sis motors de TAE
Jiménez Molina, Noelia
Sánchez Gijón, María Pilar, dir. (Universitat Autònoma de Barcelona)
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació

Títol variant: Traducción automática del habla : Creación y evaluación de seis motores de TAE
Títol variant: Spoken Language Translation : Creating and Evaluating Six SMT Engines
Data: 2020
Resum: La traducció automàtica (TA) ha millorat notablement aquests darrers anys. No obstant això, la traducció de la parla i el processament del llenguatge natural encara són un desafiament per als sistemes de TA. Aquest treball sorgeix amb la motivació d'aportar una possible solució a la manca de naturalitat de la traducció automàtica per veu. La hipòtesi és que es pot millorar l'oralitat de les traduccions mitjançant corpus orals transcrits i optimitzacions en l'entrenament dels sistemes de TA. Per demostrar aquesta hipòtesi, es creen amb KantanMT (després d'haver provat amb MTradumàtica) sis motors de traducció automàtica estadística entrenats amb diferents corpus orals transcrits i escrits per després, evaluar-los.
Resum: La traducción automática (TA) ha mejorado notablemente en los últimos años; sin embargo, la traducción del habla y el procesamiento del lenguaje natural siguen siendo todo un reto para los sistemas de TA. Este trabajo surge con la motivación de aportar una posible solución a la falta de naturalidad en la traducción automática del habla. Se parte de la hipótesis de que se puede mejorar la oralidad de las traducciones introduciendo corpus orales transcritos y optimizaciones en el entrenamiento de los sistemas de TA. Para probar esta hipótesis, se crean con KantanMT -tras probar MTradumàtica- seis motores de traducción automática estadística entrenados con distintos corpus orales transcritos y escritos y, después, se evalúan.
Resum: Machine Translation (MT) has been greatly improved in recent years. Nevertheless, Spoken Language Translation (SLT) and natural language processing remain a major challenge for MT engines. The purpose of this work is to provide a possible solution to the lack of naturalness in SLT. The work is based on the hypothesis that it is possible to improve the orality of translations by introducing transcribed oral corpus and optimizations in the training process of MT systems. To test this hypothesis, six statistical machine translation engines, trained with different transcribed oral and written corpora, were created with KantanMT, after trying MTradumàtica, and then evaluated.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Castellà
Titulació: Tradumàtica: Tecnologies de la Traducció [4315970]
Pla d'estudis: Màster Universitari en Tradumàtica: Tecnologies de la Traducció [1350]
Document: Treball de fi de postgrau ; Text
Matèria: Traducció automàtica de la parla ; Reconeixement automàtic de la parla ; Traducció automàtica estadística ; MTradumàtica ; KantanMT ; Traducción automática del habla ; Reconocimiento automático del habla ; Traducción automática estadística ; Spoken language translation ; Automatic speech recognition ; Statistical machine translation



95 p, 1.8 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de recerca i projectes de final de carrera > Traducció i Interpretació. TFM

 Registre creat el 2021-10-08, darrera modificació el 2022-07-02



   Favorit i Compartir