Universitat Politècnica de Catalunya. Departament de Ciències de la Computació
Talavera Méndez, Luis José
2022-05-03
Es parteix de dos data sets procedents de dos hotels diferents de Portugal, un de la regió d’Algarve, situada al sud del país, i l’altre de la ciutat de Lisboa. Els dos data sets contenen un conjunt d’observacions, on cada una d’elles representa una reserva. Cada observació està definida per unes variables explicatives i una variable resposta que indica si la reserva va ser cancel·lada o no. En aquest projecte es busca trobar models que puguin fer prediccions de les cancel·lacions, i al mateix temps, veure quins són els factors que tendeixen a causar aquest fet. Per fer-ho, es segueix la metodologia CRISP-DM que integra totes les fases necessàries per extreure valor de les dades. S’inicia establint el problema que es vol resoldre, després s’analitzen les variables que tenim a disposició i la seva interacció. Seguidament, es preparen els data sets per poder fer el modelatge, i finalment, es construeixen els models per predir la variable resposta i s’avalua el resultat d’ells en funció del rendiment obtingut. A l’apartat de modelatge, cada un dels models passa per un procés d’optimització per poder millorar les seves mètriques. Tot el projecte es realitza amb el llenguatge de programació Python, utilitzant l’entorn de distribució Anaconda i en concret la seva interfície de codi obert Jupyter Notebook. S’opta per aquest llenguatge, ja que mitjançant les seves llibreries es facilita el processament i manipulació de les dades, així com la posterior fase de creació dels models on s’utilitzen tècniques de Machine Learning.
Bachelor thesis
Catalán
Àrees temàtiques de la UPC::Informàtica::Sistemes d'informació; Mathematical models; Hotels--Reservation system--Portugal; Models matemàtics; Hotels--Serveis de reserves--Portugal
Universitat Politècnica de Catalunya
Restricted access - author's decision
Treballs acadèmics [82542]