Universitat Politècnica de Catalunya. Departament de Ciències de la Computació
Béjar Alonso, Javier
2024-01-25
Este proyecto implica la creación de una librería en Pytorch que incluye varios métodos para generar datos tabulares artificiales, como GANs, VAEs, Bit Diffusion y un modelo llamado Data Augmentation basado en autoencoders de eliminación de ruido. El objetivo de la librería es proporcionar herramientas accesibles para que los usuarios experimenten y evalúen enfoques generativos. La evaluación de los modelos muestra que su rendimiento varía según el contexto y las características del conjunto de datos. Aunque los resultados son buenos, aún hay margen para incorporar metodologías adicionales y mejorar la calidad de los datos sintéticos. En resumen, la librería ha logrado generar datos artificiales de buena calidad, y con más dedicación, se puede mejorar aún más. Esto establece una base sólida para futuras investigaciones en generación de datos sintéticos.
This project involves the creation of a Pytorch library that includes various methods for generating artificial tabular data, such as GANs, VAEs, Bit Diffusion, and a model called Data Augmentation based on denoising autoencoders. The library's purpose is to provide accessible tools for users to experiment with and evaluate generative approaches. The evaluation of the models reveals that their performance varies depending on the context and dataset characteristics. Although the results are good, there is still room to incorporate additional methodologies and improve the quality of synthetic data. In summary, the library has successfully generated high-quality artificial data, and with further dedication, further improvements can be made. This establishes a solid foundation for future research in synthetic data generation.
Bachelor thesis
Castellà
Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial; Data sets; Deep learning (Machine learning); generació de dades sintètiques; xarxes generatives adversatives; autoencoders variacionals; difusió de bits; augmentació de dades; aprenentatge profund; intel·ligència artificial; processament de dades tabulars; models generatius; Pytorch; evaluació de models; conjunts de dades; investigació en IA; desenvolupament de llibreries; tècniques de reducció de soroll; synthetic data generation; generative adversarial networks; variational autoencoders; bit diffusion; data augmentation; deep learning; artificial intelligence; tabular data processing; generative models; Pytorch; model evaluation; datasets; AI research; library development; noise reduction techniques; Conjunts de dades; Aprenentatge profund
Universitat Politècnica de Catalunya
Open Access
Treballs acadèmics [82502]