Construcción de los WordNets 3.0 para castellano y catalán mediante traducción automática de corpus anotados semánticamente

Author

Oliver González, Antoni

Publication date

2011-07-01T11:48:26Z

2011-07-01T11:48:26Z

2011-06-28

2011-07-26T12:36:06Z



Abstract

Este artículo describe una metodología de construcción de WordNets que se basa en la traducción automática de un corpus en inglés desambiguado por sentidos. El corpus que utilizamos está formado por las propias glosas de WN 3.0 etiquetadas semánticamente y por el corpus Semcor. Los resultados de precisión son comparables a los obtenidos mediante métodos basados en diccionarios bilingües para las mismas lenguas. La metodología descrita se está utilizando, en combinación con otras estrategias, en la creación de los WordNets 3.0 del español y catalán.


This paper describes a methodology for the construction of WordNets based on machine translation of an English sense tagged corpus. We use the Semcor corpus and the WordNet 3.0 sense tagged glosses as a corpus. Precision results are comparable to those obtained by methods based on bilingual dictionaries for the same languages. This methodology is being used for the construction of the Spanish and Catalan WordNets 3.0 in combination with other strategies.

Document Type

Master thesis

Language

Spanish

Subjects and keywords

WordNet; recursos lingüísticos; traducción automática

Publisher

Universitat Oberta de Catalunya

This item appears in the following Collection(s)