Lexical impoverishment in neural machine translation : automatic and human study of Spanish-English noun translation

Publication date

2024

Abstract

The information required to translate a word in the machine translation of isolated sentences is often missing or unobtainable. We show that the diversity in the training-set distribution of Spanish equivalents of English nouns is reduced in translation. A translator survey reveals this is often due to lack of source context.


La informació necessària per a traduir una paraula en traducció automàtica d'oracions aïllades sovint falta o no se'n pot extraure. Mostrem que la diversitat en la distribució del conjunt d'entrenament dels equivalents espanyols dels substantius anglesos es redueix en la traducció. Una enquesta amb traductors revela que això sovint es deu a la manca de context d'origen.


La información necesaria para traducir una palabra en la traducción automática de frases aisladas es a menudo inexistente o inaccesible. En este artículo demostramos que la diversidad en la distribución del conjunto de entrenamiento de los equivalentes en español de sustantivos ingleses se reduce después de haber sido traducidos. Una encuesta a traductores revela que eso a menudo se debe a la falta de contexto del original.

Document Type

Article

Language

English

Publisher

 

Related items

;

Tradumàtica ; Núm. 22 (2024), p. 162-180

Recommended citation

This citation was generated automatically.

Rights

open access

Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, fins i tot amb finalitats comercials, sempre i quan es reconegui l'autoria de l'obra original.

https://creativecommons.org/licenses/by/4.0/

This item appears in the following Collection(s)