Content quality control by duplicated image detection with Apache Spark;
Gestió i control del contingut mitjançant la detecció de duplicats per imatge amb Apache Spark
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
Civit Rovira, Jaume
Umbert Juliana, Anna
2016-09
El proyecto se basa en la reducción del trafico generado tanto en el terminal móvil como en los servidores a traves de la detección de duplicados. Dado el volumen de datos que se manejan en base de datos y en servidor, y la precariedad de la velocidad de las redes móviles en algunas situaciones es necesario mantener un control de items duplicados en el catalogo. Esto responde a dos problemas: por un lado la calidad del catalogo y por otro el volumen innecesario de datos que se maneja tanto en servidor como cliente.
Master thesis (pre-Bologna period)
Castellà
Àrees temàtiques de la UPC::Enginyeria de la telecomunicació; Big data; Parallel programming (Computer science); Electronic data processing -- Distributed processing); Spark; distributed processes; procesos distribuidos; Algorismes paral·lels; Mineria de dades; Processament en paral·lel (Ordinadors); Macrodades; Programació en paral·lel (Informàtica); Processament distribuït de dades
Universitat Politècnica de Catalunya
Restricted access - confidentiality agreement
Treballs acadèmics [82541]