Construcción de los WordNets 3.0 para castellano y catalán mediante traducción automática de corpus anotados semánticamente

Autor/a

Oliver González, Antoni

Data de publicació

2011-07-01T11:48:26Z

2011-07-01T11:48:26Z

2011-06-28

2011-07-26T12:36:06Z



Resum

Este artículo describe una metodología de construcción de WordNets que se basa en la traducción automática de un corpus en inglés desambiguado por sentidos. El corpus que utilizamos está formado por las propias glosas de WN 3.0 etiquetadas semánticamente y por el corpus Semcor. Los resultados de precisión son comparables a los obtenidos mediante métodos basados en diccionarios bilingües para las mismas lenguas. La metodología descrita se está utilizando, en combinación con otras estrategias, en la creación de los WordNets 3.0 del español y catalán.


This paper describes a methodology for the construction of WordNets based on machine translation of an English sense tagged corpus. We use the Semcor corpus and the WordNet 3.0 sense tagged glosses as a corpus. Precision results are comparable to those obtained by methods based on bilingual dictionaries for the same languages. This methodology is being used for the construction of the Spanish and Catalan WordNets 3.0 in combination with other strategies.

Tipus de document

Master thesis

Llengua

Castellà

Matèries i paraules clau

WordNet; recursos lingüísticos; traducción automática

Publicat per

Universitat Oberta de Catalunya

Aquest element apareix en la col·lecció o col·leccions següent(s)