Classificació de proteïnes segons on es troben a la cel·lula mitjançant tècniques de Machine Learning

Other authors

Vegas Lozano, Esteban

Publication date

2015-06

Abstract

La predicció de la funció d’una proteïna és un dels problemes més desafiadors en l’era post genomica. El nombre de noves proteïnes identificades ha augmentat exponencialment amb els avenços de les tècniques d’alt rendiment. Encara que, la caracterització funcional d’aquestes noves proteïnes no ha augmentat en la mateixa proporció. Tenint en compte aquest punt, aquest treball proporciona una descripció comprensible de l’enfocament de l’aprenentatge auomàtic, que s’apliquen actualment en problemes de classificció de proteïnes i predicció de la funció. En aquest treball principalment es farà servir el mètode de support vector machine per realitzar la classificació i la predicció. Primer de tot es defineix que és una proteïna i perquè és important tenir una classificació de proteïnes, llavors es presenta l’aprenentatge automàtic per cadenes de caràcters i algunes eines útils per treballar-lo en R. Un cop es sap que és l’aprenentatge automàtic i les seves característiques, l’objectiu es exposar la classificació de proteïnes i la seva predicció, tal com s’ha fet en l’apartat de l’aprenentatge automàtic es proposen algunes eines útils per poder-ho treballar amb R. Finalment es fa una classificació de proteïnes segons on es troben a la cèl·lula i la seva predicció amb una base de dades proteòmica real.

Document Type

Bachelor thesis

Language

Catalan

Publisher

Universitat Politècnica de Catalunya

Universitat de Barcelona

Recommended citation

This citation was generated automatically.

Rights

Restricted access - author's decision

This item appears in the following Collection(s)