Title:
|
LotterySampling: a novel algorithm for the heavy hitters and the top-k problems on data streams
|
Author:
|
Solera Pardo, Gonzalo
|
Other authors:
|
Universitat Politècnica de Catalunya. Departament de Ciències de la Computació; Martínez Parra, Conrado |
Abstract:
|
Proponemos un nuevo algoritmo de minado de datos para los problemas Top-K y Heavy Hitters sobre largos flujos de datos. Es un algoritmo aleatorio inspirado en una idea original que sin hacer ninguna asumpción especial sobre los datos, mejora el estado del arte, tanto en precisión como en eficiencia. |
Abstract:
|
We propose a new data mining algorithm for the Top-k and Heavy Hitters problems on large data streams. It's a randomized algorithm inspired in an original idea that without making any special assumption on the data, outperforms the state-of-the-art, both in accuracy and efficiency. |
Subject(s):
|
-Àrees temàtiques de la UPC::Informàtica -Big data -Data mining -Algorithms -extracció d'informació -algoritme aleatori -algoritme probabilistic -fluxes de data -data mining -information retrieval -randomized algorithms -probabilistic algorithms -heavy hitters -data streams -recall -precision -Dades massives -Mineria de dades -Algorismes |
Rights:
|
|
Document type:
|
Bachelor Thesis |
Published by:
|
Universitat Politècnica de Catalunya
|
Share:
|
|