Localització i identificació d'objectes utilitzant xarxes neuronals convolucionals (CNN)

Other authors

Universitat Politècnica de Catalunya. Departament d'Enginyeria Minera, Industrial i TIC

Escobet Canal, Antoni

Publication date

2020-07-13

Abstract

En els darrers anys, l’interès en els algoritmes d’aprenentatge profund ha viscut un creixement exponencial gràcies a l’alt rendiment i precisió que proporcionen, una de les tècniques d’aprenentatge profund que més ha crescut son les Xarxes Neuronals Convolucionals (CNN d’aquí endavant), aquest tipus de xarxes neuronals son utilitzats en sistemes de visió per computador i, concretament, en tasques com la classificació d’imatges, detecció d’objectes i segmentació. Al ser una de les tècniques més innovadores i precises dels darrers anys que existeixen en el camp de la visió per computador ha fet que sigui cada vegada més utilitzada, podríem destacar per exemple la seva utilització en aplicacions de reconeixement facial, digitalitzar documents escrits a mà, aplicacions mòbils que apliquen i creen efectes artístics sobre les cares de persones... Malgrat les altes prestacions que ofereixen les CNN i l’extens ús que s’ha fet d’elles en aplicacions sobretot per mòbils, és una tècnica encara desconeguda per una important part de persones, i l’objectiu d’aquesta memòria és aconseguir que una persona que no hagi escoltat mai el concepte de les CNN (però amb els coneixements sobre informàtica i matemàtiques adquirits durant el grau) sigui capaç d’arribar a implementar una aplicació apte per ser implementada en una aplicació real, començant per explicar en detall els conceptes teòrics tant de les xarxes neuronals en general com de les CNN en particular, i finalment implementar una aplicació real amb un algoritme dels disponibles a Internet.


In recent years, the interest in Deep Learning algorithms has grown exponentially thanks to its high performance and accuracy, one of the fastest growing Deep Learning techniques are Convolutional Neural Network (CNN, hereinafter), such neural networks are used in computer vision systems and, specifically in tasks such as image classification, object detection and segmentation. Being one of the most innovative and accurate techniques in the recent years that exist in the field of computer vision has made it increasingly used, we could highlight for example its use in facial recognition applications, digitizing handwritten documents, mobile application that apply and create artistic effects on people’s face… Despite the high performance offered by the CNN and the extensive use that has been made of them in applications, specially, for mobile phones, it is a technique still unknown to a significant portion of people, and the goal of this document is to teach a person who never heard about the CNN (but with the knowledge acquired during the degree) to made an application suitable to be implemented in a real application, the document starts explaining the theoretical concepts of both neural network in general and CNN in particular, and finally, implement a real application with an algorithm available on the Internet.

Document Type

Bachelor thesis

Language

Catalan

Publisher

Universitat Politècnica de Catalunya

Recommended citation

This citation was generated automatically.

Rights

Restricted access - author's decision

This item appears in the following Collection(s)