La predicció de la funció d’una proteïna és un dels problemes més desafiadors en l’era post genomica. El nombre de noves proteïnes identificades ha augmentat exponencialment amb els avenços de les tècniques d’alt rendiment. Encara que, la caracterització funcional d’aquestes noves proteïnes no ha augmentat en la mateixa proporció. Tenint en compte aquest punt, aquest treball proporciona una descripció comprensible de l’enfocament de l’aprenentatge auomàtic, que s’apliquen actualment en problemes de classificció de proteïnes i predicció de la funció. En aquest treball principalment es farà servir el mètode de support vector machine per realitzar la classificació i la predicció. Primer de tot es defineix que és una proteïna i perquè és important tenir una classificació de proteïnes, llavors es presenta l’aprenentatge automàtic per cadenes de caràcters i algunes eines útils per treballar-lo en R. Un cop es sap que és l’aprenentatge automàtic i les seves característiques, l’objectiu es exposar la classificació de proteïnes i la seva predicció, tal com s’ha fet en l’apartat de l’aprenentatge automàtic es proposen algunes eines útils per poder-ho treballar amb R. Finalment es fa una classificació de proteïnes segons on es troben a la cèl·lula i la seva predicció amb una base de dades proteòmica real.
Bachelor thesis
Catalan
Àrees temàtiques de la UPC::Matemàtiques i estadística::Matemàtica aplicada a les ciències; Bioinformatics; proteïna dades òmiques, aprenentatge automàtic, classificació de proteïnes, predicció de proteïnes, localització subcellular; Bioinformàtica; Classificació AMS::92 Biology and other natural sciences
Universitat Politècnica de Catalunya
Universitat de Barcelona
Restricted access - author's decision
Treballs acadèmics [82539]