dc.contributor
Agència de Gestió d'Ajuts Universitaris i de Recerca
dc.contributor
Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics
dc.contributor.author
Gonzàlez Pellicer, Edgar
dc.date.accessioned
2009-06-03T15:41:29Z
dc.date.available
2009-06-03T15:41:29Z
dc.date.issued
2009-06-03T15:41:29Z
dc.identifier.uri
http://hdl.handle.net/2072/16020
dc.description.abstract
Les tècniques de clustering poden ajudar a reduir la supervisió en processos d'obtenció de patrons per a Extracció d'Informació. En aquest treball, que abarca un període de 4 anys de recerca, es comença per estudiar la representació de documents més adequada per a la tasca de clustering. Per tal d'evitar els biaixos dels mètodes individuals de clustering, es consideren mètodes de clustering conjunt. S'exploren diversos mètodes de combinació supervisada, i s'hi afegeixen estratègies automàtiques per a determinar el nombre de clusters de la combinació. També es consideren mecanismes per a obtenir clusterings conjunts ponderats, així com estratègies de combinació no supervisada. Finalment, els resultats del clustering s'utilitzen en un sistema d'adquisició de patrons per a substituir els elements de supervisió humana. Totes aquestes estratègies i mètodes s'avaluen en tasques de clustering de documents i adquisició de patrons usant dades reals. Es comprova que els mots com representació de documents superen altres models per a la tasca de clustering, així com que el clustering conjunt supera les limitacions dels clusterings individuals, i que les estratègies no supervisades d'adquisició de patrons obtenen resultats competitius respecte a les estratègies supervisades.
cat
dc.format.extent
31 p.
ca
dc.format.extent
305811 bytes
dc.format.mimetype
application/pdf
dc.relation.ispartofseries
Els ajuts de l'AGAUR;2005FI01060
dc.rights
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original i l’Agència i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/)
cat
dc.subject.other
Clústers
ca
dc.subject.other
Extracció de dades -- Automatització
ca
dc.subject.other
Aprenentatge automàtic
ca
dc.title
Una aproximació d'aprenentatge automàtic per a extracció d'informació adaptativa
ca
dc.type
info:eu-repo/semantics/article
ca