Abstract:
|
En este apartado explicaré de una manera concreta, los principales objetivos del
proyecto. En la primera fase del proyecto, Implementación de un datawarehouse, los objetivos
primordiales son:
" No perder datos. Hasta el momento, muchos de los datos que se tenían no eran
persistentes, es decir no se guardaban dentro de la BO. Por ejemplo, de los
datos de los alumnos disponíamos de datos como el nombre, el ONI, el
identificador, la titulación, la ciudad, el país, ... entre otros; de todos estos datos,
solo teníamos constancia dentro de la BO del identificador del usuario. Estos
datos provenían de un fichero .txt y un fichero .xml que se generan
automáticamente a partir del Raco y del Moodle, por tanto los datos quedaban
en unos ficheros con un alto riesgo de extravío, pérdida, alteración de la
información contenida, ... Con la implantación del datawarehouse se pretende
que se guarden el mayor número de información útil.
" Integración. Los datos provenientes de bases de datos distribuidas, de ficheros
de texto, hojas de Excel por las diferentes unidades de la organización y que con
frecuencia tendrán diferentes estructuras (fuentes heterogéneas). Se debe
facilitar una descripción global y un análisis comprensivo de toda la organización
en el almacén de datos; de esta manera, conseguir una explotación más fácil de
los datos. Así pues, todos los datos los encontraremos en el OW.
" Automatización del proceso de carga. Hasta el momento, la inserción de los
datos dentro del OW era manual, es decir, una vez cada cuatrimestre una
persona se dedicaba a hacer las inserciones, las modificaciones y los borrados
que fuesen necesarios, dentro de la base de datos ya existente. Con este
proyecto, se pretende que mediante una herramienta ETL, en nuestro caso
Kettle, este proceso se haga de una manera automática; casi prescindiendo de la
manipulación del usuario. |