Avaluació de la utilitat de l'eina de neteja de corpus automàtica bicleaner : avaluació aplicada al corpus wilimatrix Anglès-Catlà en comparació amb l'avaluació manual de Keops
Balaguer Falco, Mar
Riera Irigoyen, Marc, dir.
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació

Títol variant: Evaluación de la utilidad de la herramienta de limpieza de corpus automática Bicleaner : evaluación aplicada al corpus WikiMatrix inglés-catalán en comparación con la evaluación manual de KEOPS
Títol variant: Evaluation of the usefulness of the automatic corpus cleaning tool Bicleaner : evaluation applied to the corpus WikiMatrix English-Catalan in comparison to the KEOPS manual evaluation
Publicació: Bellaterra: Universitat Autònoma de Barcelona, 2023
Resum: El present treball de fi de màster té com a objectiu avaluar la qualitat de l'eina de neteja i avaluació de corpus automàtica, Bicleaner. Per aconseguir-ho s'ha passat una mostra del corpus de WikiMatrix anglès-català de 200 feta amb segments aleatoris per l'eina. Per extreure conclusions sobre els resultats sobre aquest mateix conjunt de segments s'ha realitzat altra avaluació, de forma manual, amb ajuda de l'eina KEOPS i se n'han comparat els resultats. Els resultats mostren que l'avaluació automàtica pot ser molt útil per a fer una primera aproximació, encara que no produeixi uns resultats prou coherents per a dependre'n únicament i es requereixi una segona avaluació.
Resum: El presente trabajo de final de máster tiene como objetivo evaluar la calidad de la herramienta de limpieza y evaluación de corpus automática, Bicleaner. Para conseguirlo se ha pasado una muestra del corpus de WikiMatrix inglés-catalán hecha con segmentos aleatorios por la herramienta. Para extraer conclusiones sobre los resultados se ha realizado otra evaluación, de forma manual, con ayuda de la herramienta KEOPS y se han comparado los resultados. Los resultados muestran que la evaluación automática puede ser muy útil para hacer una primera aproximación, aunque luego no produzca unos resultados lo suficientemente coherentes para depender de ella únicamente y se necesite una segunda evaluación.
Resum: The aim of this master's thesis is to evaluate the quality of the automatic corpus cleaning and evaluation tool, Bicleaner. To achieve this, a sample of the English-Catalan WikiMatrix corpus made with random segments has been evaluated with the tool. In order to draw conclusions about the results, another evaluation was carried out manually with the help of the KEOPS tool and the results were compared. The results show that the automatic evaluation can be very useful for a first approximation, even though it doesn't produce coherent enough results to be used on its own and a second evaluation is needed.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. Creative Commons
Llengua: Català
Titulació: Màster Universitari en Tradumàtica: Tecnologies de la Traducció [1350]
Pla d'estudis: Tecnologies de la Traducció [4315970]
Document: Treball de fi de postgrau ; Text
Matèria: Avaluació de corpus ; Bicleaner ; KEOPS ; Anglès-català ; WikiMatrix ; Evaluación de corpus ; Inglés catalán ; Corpus evaluation ; English-Catalan



67 p, 2.9 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de recerca i projectes de final de carrera > Traducció i Interpretació. TFM

 Registre creat el 2023-10-02, darrera modificació el 2023-10-21



   Favorit i Compartir