Title:
|
Bootstrapping a statistical speech translator from a rule-based one
|
Author:
|
Rayner, Manny; Estrella, Paula; Bouillon, Pierrette
|
Other authors:
|
International Workshop on Free/Open-Source Rule-Based Machine Translation (2nd : 2011 : Barcelona) |
Abstract:
|
We describe a series of experiments in which we start with English to French and English to Japanese versions of an Open Source rule-based speech translation system for a medical domain, and bootstrap correspondign statistical systems. Comparative evaluation reveals that the rule-based systems are still significantly better than the statistical ones, despite the fact that considerable effort has been invested in tuning both the recognition and translation components; also, a hybrid system only marginally improved recall at the cost of a los in precision. The result suggests that rule-based architectures may still be preferable to statistical ones for safety-critical speech translation tasks. |
Abstract:
|
Describimos una serie de experimentos en los que comenzamos con las versiones de inglés a francés y de inglés a japonés de un sistema de traducción oral basado en reglas de código abierto para un dominio médico, e iniciamos los sistemas estadísticos correspondientes. La evaluación comparativa revela que los sistemas basados en reglas son significativamente mejores que los estadísticos, a pesar del hecho de que se ha dedicado un esfuerzo considerable en mejorar los componentes de reconocimiento y traducción; además, un sistema híbrido sólo mejoró de modo marginal la memoria a costa de una pérdida de precisión. Los resultados indican que las arquitecturas basadas en reglas podrían ser mejores para tareas de traducción oral críticas. |
Abstract:
|
Descrivim una sèrie d'experiments en què comencem amb les versions d'anglès a francès i d'anglès a japonès d'un sistema de traducció oral basat en regles en codi obert per a un domini mèdic, i iniciem els sistemes estadístics corresponents. L'avaluació comparativa revela que els sistemes basats en regles encara són significativament millors que els estadístics, malgrat el fet que s'ha dedicat un esforç important a millorar els components tant de reconeixement com de traducció; a més a més, un sistema híbrid només va millorar marginalment la memòria a costa d'una pèrdua de precisió. Els resultats indiquen que les arquitectures basades en regles podrien ser millors que les estadístiques per a tasques de traducció oral crítiques. |
Subject(s):
|
-Statistical -bootstrapping -Traducción automática estadística -bootstrapping -Traducció automàtica estadística -bootstrapping -Open source software -Machine translating -Computational linguistics -Programari lliure -Traducció automàtica -Lingüística computacional -Software libre -Traducción automática -Lingüística computacional |
Rights:
|
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Document type:
|
Conference Object |
Published by:
|
Universitat Oberta de Catalunya
|
Share:
|
|