Título:
|
A graph partitioning approach to entity disambiguation using uncertain information
|
Autor/a:
|
Sapena Masip, Emilio; Padró, Lluís; Turmo Borras, Jorge
|
Otros autores:
|
Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics; Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural |
Abstract:
|
This paper presents a method for Entity Disambiguation in Information
Extraction from different sources in the web. Once entities and relations between
them are extracted, it is needed to determine which ones are referring to the
same real-world entity. We model the problem as a graph partitioning problem in
order to combine the available information more accurately than a pairwise classifier.
Moreover, our method handle uncertain information which turns out to be
quite helpful. Two algorithms are trained and compared, one probabilistic and
the other deterministic. Both are tuned using genetic algorithms to find the best
weights for the set of constraints. Experiments show that graph-based modeling
yields better results using uncertain information. |
Abstract:
|
Peer Reviewed |
Materia(s):
|
-Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Llenguatge natural -Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic -Text processing (Computer science) -Information storage and retrieval systems -Processament de textos -Recuperació de la informació |
Derechos:
|
|
Tipo de documento:
|
Artículo - Versión publicada Objeto de conferencia |
Editor:
|
Springer
|
Compartir:
|
|