Título:
|
Block-based Speech-to-Speech Translation; Implementación de un sistema de Traducción de Voz; Implementació d'un sistema de Traducció de Veu
|
Autor/a:
|
Roca, Sandra
|
Otros autores:
|
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; Giró Nieto, Xavier |
Abstract:
|
Esta tesis explora diferentes maneras de implementar un sistema de bloques de Traducción de Voz con el propósito de generar grandes cantidades de datos para generar un gran corpus paralelo de voz. La primera tarea consiste en buscar y conseguir dominar herramientas adecuadas para implementar cada uno de los tres bloques que integran el sistema de traducción de voz: reconocimiento de voz, traducción y síntesis de voz. Experimentamos con algunas herramientas de Código abierto y conseguimos entrenar un sistema de reconocimiento de voz y una máquina de traducción neuronal. Posteriormente, los sometemos a test con el fin de evaluar su rendimiento. Como opción alternativa, usamos las soluciones de Computación en la nube (Cloud Computing) proporcionadas por Google Cloud para implementar los tres bloques secuenciales y elaboramos el sistema global con éxito. Finalmente, hacemos un estudio comparativo entre el desarrollo de software interno y la implementación Cloud Computing. |
Abstract:
|
This bachelor's thesis explores different ways of building a block-based Speech Translation system with the aim of generating huge amounts of parallel speech data. The first goal is to research and manage to run suitable tools to implement each one of the three blocks that integrates the Speech Translation system: Speech Recognition, Translation and Speech Synthesis. We experiment with some open-source toolkits and we manage to train a speech recognition system and a neural machine translation system. Then, we test them to evaluate their performance. As an alternative option, we use the cloud computing solutions provided by Google Cloud to implement the three sequential blocks and we successfully build the overall system. Finally, we make a comparative study between an in-house software development versus Cloud computing implementation. |
Abstract:
|
Aquesta tesi explora diferents maneres d'implementar un sistema de blocs de Traducció de Veu amb la finalitat de generar un gran corpus paral·lel de veu. La primera tasca consisteix en cercar i aconseguir dominar eines adequades per a implementar cada un dels tres blocs que integra el sistema de traducció de veu: reconeixement de veu, traducció, i síntesi de veu. Experimentem amb algunes eines de codi obert i aconseguim entrenar un sistema de reconeixement de veu i una màquina de traducció neuronal. Posteriorment, els sotmetem a test per tal d'avaluar el seu rendiment. Com a opció alternativa, utilitzem les solucions d'Informàtica en núvol (Cloud Computing) proporcionades per Google Cloud per a implementar els tres blocs seqüencials i elaborem el sistema global amb èxit. Finalment, fem un estudi comparatiu entre el desenvolupament de software intern i la implementació Cloud computing. |
Materia(s):
|
-Automatic speech recognition -Machine translating -reconocimiento del habla -síntesi de voz -traducción de voz -speech translation -speech recognition -speech sythesis -Sintetitzadors de veu -Reconeixement automàtic de la parla -Traducció automàtica |
Derechos:
|
S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Tipo de documento:
|
Trabajo/Proyecto fin de carrera |
Editor:
|
Universitat Politècnica de Catalunya
|
Compartir:
|
|