NewsAnalyzer : un analitzador de notícies etiquetades

dc.contributor
Universitat Oberta de Catalunya
dc.contributor.author
Castaño Ribes, Rafel
dc.date
2011-06-28T14:31:16Z
dc.date
2011-06-28T14:31:16Z
dc.date
2011-06-15
dc.date.accessioned
2011-07-26T12:14:08Z
dc.date.available
2011-07-26T12:14:08Z
dc.date.issued
2011-07-26T12:14:08Z
dc.identifier.uri
http://hdl.handle.net/10609/8016
dc.description.abstract
En aquest treball es pretén abordar la problemàtica de confirmar o refutar si determinades fonts de notícies online mostren algun tipus de biaix que a priori un lector podria detectar per simple intuïció. Per simplificar les tasques d'anàlisi es treballa amb fonts de notícies que disposen d'APIs d'accés als seus articles i que, a més a més, proporcionen anotacions semàntiques (etiquetes) associades a cada notícia a mode de classificació d'aquestes. Per complir amb els objectius plantejats s'analitza i millora un mètode descrit en la bibliografia que permet dur a terme una anàlisi de les etiquetes per tal d'obtenir i aplicar un vocabulari comú a les diferents fonts (procediment de normalització). El programari resultant es presenta com una aplicació implementada en Java i MySQL que recol·lecta notícies anotades semànticament de diferents fonts de notícies online (els diaris The Guardian i The New York Times), les analitza i permet visualitzar els resultats en funció del vocabulari normalitzat per tal d'extreure conclusions sobre quins són els temes més tractats per cada font. Finalment, s'analitzen els resultats obtinguts, es discuteixen i s'extreuen una sèrie de conclusions sobre el mètode de normalització i classificació emprats i es proposen possibles millores per al futur de l'aplicació.
dc.description.abstract
En este trabajo se pretende abordar la problemática de confirmar o refutar si determinadas fuentes de noticias online muestran algún tipo de sesgo que a priori un lector podría detectar por simple intuición. Para simplificar las tareas de análisis se trabaja con fuentes de noticias que disponen de APIs de acceso a sus artículos y que, además, proporcionan anotaciones semánticas (etiquetas) asociadas a cada noticia a modo de clasificación de las mismas. Para cumplir con los objetivos planteados se analiza y mejora un método descrito en la bibliografía que permite llevar a cabo un análisis de las etiquetas para obtener y aplicar un vocabulario común a las diferentes fuentes (procedimiento de normalización). El software resultante se presenta como una aplicación implementada en Java y MySQL que recolecta noticias anotadas semánticamente de diferentes fuentes de noticias online (los diarios The Guardian y The New York Times), las analiza y permite visualizar los resultados en función del vocabulario normalizado para extraer conclusiones sobre cuáles son los temas más tratados por cada fuente. Finalmente, se analizan los resultados obtenidos, se discuten y se extraen una serie de conclusiones sobre el método de normalización y clasificación utilizados y se proponen posibles mejoras para el futuro de la aplicación.
dc.description.abstract
This paper aims to tackle the problem of confirming or refuting whether certain online newspapers show some kind of a priori bias that a reader could detect by simple intuition.
dc.language.iso
cat
dc.publisher
Universitat Oberta de Catalunya
dc.rights
<a href="http://www.gnu.org/licenses/gpl.html">http://www.gnu.org/licenses/gpl.html</a>
dc.subject
anotacions semàntiques
dc.subject
normalització d'etiquetes
dc.subject
anàlisi de notícies
dc.subject
anotaciones semánticas
dc.subject
semantic annotations
dc.subject
normalización de etiquetas
dc.subject
standard tags
dc.subject
análisis de noticias
dc.subject
news analysis
dc.subject
Electronic newspapers
dc.subject
Mass media
dc.subject
Premsa electrònica -- Innovacions tecnològiques
dc.subject
Mitjans de comunicació de massa
dc.subject
Prensa electrónica -- Innovaciones tecnológicas
dc.subject
Medios de comunicación de masas
dc.title
NewsAnalyzer : un analitzador de notícies etiquetades
dc.type
Bachelor thesis


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)