Título:
|
Birds Sound Detection Using Convolutional Neural Networks; Detección de sonido de aves usando redes neuronales convolucionales; Detecció de sons d'ocells mitjançant xarxes neuronals convolucionals
|
Autor/a:
|
Solé Franquesa, Llorenç
|
Otros autores:
|
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; Nadeu Camprubí, Climent |
Abstract:
|
The population of birds, marine mammals, and other species can be monitored through computational analysis of acoustic scenes that may include the sounds of the targeted species. See Ch. 11 of the book "Computational analysis of sound scenes and events", DOI 10.1007/978-3-319-63450-0. |
Abstract:
|
The objective of this thesis is to learn how to train and test a Deep Neural Network (DNN). For that purpose, after reviewing recent works, we have chosen the bird sound detection task of the DCASE Challenge 2018, that involves three databases of 10sec-long audio files which include positive and negative samples of presence of bird sounds in different recording condi- tions. Using a Convolutional Neural Network (CNN) architecture, we have carried out a set of experiments, and used transfer learning methodology to deal with the different recording conditions. Finally, we have presented further ways to improve the results. |
Abstract:
|
El objetivo de esta tesis es aprender cómo entrenar y probar una red neuronal profunda. Para ese propósito, después de revisar trabajos recientes, hemos elegido la tarea de detección de sonido de aves del DCASE Challenge 2018, que incluye tres bases de datos de archivos de audio de 10 segundos de duración que incluyen muestras positivas y negativas de la presencia de sonidos de aves en diferentes condiciones de grabación. Usando una arquitectura de red neuronal convolucional, hemos llevado a cabo un conjunto de experimentos y hemos utilizado la metodología de aprendizaje por transferencia para tratar las diferentes condiciones de grabación. Finalmente, hemos presentado otras formas de mejorar los resultados. |
Abstract:
|
L'objectiu d'aquesta tesi és aprendre com entrenar i provar una xarxa neuronal profunda. Per a aquest propòsit, després de revisar treballs recents, hem triat la tasca de detecció de sons d'aus del DCASE Challenge 2018, que inclou tres bases de dades d'arxius d'àudio de 10 segons de durada que inclouen mostres positives i negatives de la presència de sons d'aus en diferents condicions de gravació. Usant una arquitectura de xarxa neuronal convolucional, hem dut a terme un conjunt d'experiments i hem utilitzat la metodologia d'aprenentatge per transferència per tractar les diferents condicions de gravació. Finalment, hem presentat altres formes de millorar els resultats. |
Materia(s):
|
-Àrees temàtiques de la UPC::Enginyeria de la telecomunicació -Neural networks (Computer science) -Machine learning -Artificial intelligence -Research -Deep Learning -Convolutional Neural Networks (CNN) -Signal processing -Transfer Learning -Investigación -Aprendizaje profundo -Redes neuronales convolucionales -Procesamiento de señales -Transferencia de aprendizaje -Xarxes neuronals (Informàtica) -Aprenentatge automàtic -Intel·ligència artificial |
Derechos:
|
S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Tipo de documento:
|
Trabajo/Proyecto fin de carrera |
Editor:
|
Universitat Politècnica de Catalunya
|
Compartir:
|
|