Abstract:
|
[CASTELLÀ] En este proyecto se ha llevado a cabo la investigación de la técnica web scraping, desde una perspectiva teórica, explicando los conceptos básicos para el entendimiento de la técnica y las diversas herramientas necesarias para la implementación de ésta en diferentes ejemplos. Y tras la investigación, se ha desarrollado una aplicación web adaptable que ofrece un servicio de búsqueda y comparación de precios de pernoctaciones en hoteles. La obtención de datos para el servicio se ha desarrollado mediante la técnica web scraping, a partir de las principales páginas web de agencias de viajes en línea. Asimismo, la aplicación se ha implementado mediante una arquitectura sin servidor, utilizando los servicios web de Amazon. Específicamente los servicios: Amazon S3, API Gateway y AWS Lambda. Las principales herramientas usadas en este proyecto son: Fiddler para el análisis de peticiones HTTP, el lenguaje de programación Python junto a las expresiones regulares y los patrones Xpath para extraer la información y HTML, CSS y Angular para desarrollar la interfaz de usuario. |
Abstract:
|
[ANGLÈS] In this project web scraping technique has been researched from a theoretical perspective, explaining all the basic concepts for the understanding of the technique and all the tools needed to implement it in different examples. After the investigation, a single and responsive web application that offers a hotel price comparison service has been developed from scratch. Data obtained for the service comes from applying web scraping to main online travel agency websites. On the other hand, the application has been deployed through a serverless architecture, using Amazon’s web services, specifically the following services: Amazon S3, API Gateway y AWS Lambda. The main tools used in this project are Fiddler, to analyze HTTP web requests, Python, programing language with regular expressions, Xpath patterns to extract information, and HTML, CSS, JS with Angular to develop user interface. |