A large Spanish-Catalan parallel corpus release for machine translation

Consultar RECERCAT

Para acceder a los documentos con el texto completo, por favor, siga el siguiente enlace: http://hdl.handle.net/10230/26266

Título:	A large Spanish-Catalan parallel corpus release for machine translation
Autor/a:	Costa-jussà, Marta R.; Fonollosa, José A Rodriguez; Mariño Acebal, José B.; Poch, Marc; Farrús, Mireia
Abstract:	We present a large Spanish-Catalan parallel corpus extracted from ten years of the paper edition of a bilingual Catalan newspaper. The produced corpus of 7:5M parallel sentences (around 180M words per language) is useful for many natural language applications. We report excellent results when building a statistical machine translation system trained on this parallel corpus. The Spanish-Catalan corpus is partially available via ELDA (Evaluations and Language Resources Distribution Agency) in catalog number ELRA-W0053.
Abstract:	This work has been partially funded by the Seventh Framework Program of the European Commission through the International Outgoing Fellowship Marie Curie Action (IMTraP-2011-29951). The authors also want to thank the Universitat Polit ecnica de Catalunya for its support and permission to publish this research.
Materia(s):	-Catalan-Spanish parallel corpus -Machine translation
Derechos:	© Institute of Informatics Slovak Academy of Sciences
Tipo de documento:	Artículo Artículo - Versión publicada
Editor:	Institute of Informatics Slovak Academy of Sciences
Compartir:

Farrús, Mireia; Costa-jussà, Marta R.; Mariño Acebal, José B.; Poch, Marc; Hernández, Adolfo; Henríquez, Carlos; Fonollosa, José A Rodriguez

Farrús, Mireia; Poch, Marc; Costa-jussà, Marta R.; Mariño Acebal, José B.; Hernández, Adolfo; Henríquez, Carlos; Fonollosa, José A Rodriguez

Costa-jussà, Marta R.; Farrús, Mireia; Mariño Acebal, José B.; Fonollosa, José A Rodriguez

Farrús, Mireia; Costa-jussà, Marta R.; Mariño Acebal, José B.; Fonollosa, José A Rodriguez

Costa-jussà, Marta R.; Farrús, Mireia; Mariño Acebal, José B.; Fonollosa, José A Rodriguez

Coordinación

Patrocinio