English-Catalan Neural Machine Translation : state-of-the-art technology, quality, and productivity

dc.contributor.author
Briva-Iglesias, Vicent
dc.date.issued
2022
dc.identifier
https://ddd.uab.cat/record/269820
dc.identifier
urn:10.5565/rev/tradumatica.303
dc.identifier
urn:oai:ddd.uab.cat:269820
dc.identifier
urn:oai:tradumatica.revistes.uab.cat:article/303
dc.identifier
urn:articleid:15787559n20p149
dc.identifier
urn:oai:raco.cat:article/10000004358
dc.description.abstract
Recent major changes and technological advances have consolidated machine translation (MT) as a key player to be considered in the language services world. In numerous instances, it is even an essential player due to budget and time constraints. Much attention has been paid to MT research recently, and MT use by professional or amateur users has increased. Yet, research has focused mainly on language combinations with huge amounts of online available corpora (e.g. English-Spanish). The situation for minoritized or stateless languages like Catalan is different. This study analyses Softcatalà's new open-source, neural machine translation engine and compares it with Google Translate and Apertium in the English-Catalan language pair. Although MT engine developers use automatic metrics for MT engine evaluation, human evaluation remains the gold standard, despite its cost. Using TAUS DQF tools, translation quality (in terms of relative ranking, adequacy and fluency) and productivity (comparing editing times and distances) have been evaluated with the participation of 11 evaluators. Results show that Softcatalà's Translator offers higher quality and productivity than the other engines analysed.
dc.description.abstract
Els recents i importants canvis i avenços tecnològics han consolidat la traducció automàtica (TA) com un actor clau a tenir en compte en el món dels serveis lingüístics. En molts casos, és fins i tot un actor essencial a causa de les limitacions de pressupost i temps. Últimament, la recerca en TA ha rebut molta atenció i se n'ha augmentat l'ús per part d'usuaris professionals i aficionats. De tota manera, la recerca s'ha centrat principalment en les combinacions lingüístiques amb grans quantitats de corpus disponibles en línia (per exemple, anglès-castellà). La situació de les llengües minoritàries o no oficials a un estat, com el català, és diferent. Aquest estudi analitza el nou motor de traducció automàtica neuronal de codi obert de Softcatalà i el compara amb el Google Traductor i l'Apertium en la combinació lingüística anglès-català. Tot i que els desenvolupadors de motors de traducció automàtica fan servir mètriques automàtiques per avaluar-los, l'avaluació humana continua sent la pràctica de referència, tot i el cost que implica. Per mitjà de les eines TAUS DQF, s'ha avaluat la qualitat de la traducció (en termes de classificació relativa, adequació i fluïdesa) i la productivitat (comparant els temps d'edició i les distàncies) amb la participació d'11 avaluadors. Els resultats mostren que el traductor de Softcatalà ofereix una qualitat i productivitat majors que els altres motors analitzats.
dc.format
application/pdf
dc.language
eng
dc.publisher
dc.relation
Revista tradumàtica ; Num. 20 (2022), p. 149-176
dc.rights
open access
dc.rights
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, fins i tot amb finalitats comercials, sempre i quan es reconegui l'autoria de l'obra original.
dc.rights
https://creativecommons.org/licenses/by/4.0/
dc.subject
Machine translation
dc.subject
Translation technologies
dc.subject
Human evaluation
dc.subject
Catalan
dc.subject
Translation quality
dc.subject
Quality evaluation
dc.subject
Traducció automàtica
dc.subject
Tecnologies de la traducció
dc.subject
Avaluació humana
dc.subject
Català
dc.subject
Qualitat de la traducció
dc.subject
Avaluació de la qualitat
dc.subject
Traducción automática
dc.subject
Tecnologías de la traducción
dc.subject
Evaluación humana
dc.subject
Catalán
dc.subject
Calidad de la traducción
dc.subject
Evaluación de la calidad
dc.title
English-Catalan Neural Machine Translation : state-of-the-art technology, quality, and productivity
dc.type
Article


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)