Estudio del uso de memorias no volátiles para mejorar el rendimiento de bases de datos NoSQL

Otros/as autores/as

Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors

Becerra Fontal, Yolanda

Fecha de publicación

2019-11

Resumen

Els discs són els dispositius d'emmagatzematge amb el temps d'accés més alt. De diverses formes, l'estructura de la jerarquia de memòria d'un sistema informàtic sempre s'ha intentat optimitzar. No obstant, el disc és l'única memòria que manté persistent les dades, és a dir, després de l'apagada de sistema, es mantenen en memòria. Per tant, en la majoria de sistemes informàtics els discs són indispensables. Així doncs, l'accés a ells és inevitable, de manera que millorar un sistema amb la seva interacció amb aquests dispositius és fàcilment beneficiós. Intel ha proposat una nova tecnologia no volàtil amb un temps d'accés poc superior a les memòries DRAM. Es pretén que la persistència d'aquestes dades no resulti tan costosa com els discs tradicionals HDD o SSD. Per comprovar la seva efectivitat, es posarà a prova en diferents entorns. Un bon exemple de sistema informàtic amb moltes operacions a disc són les bases de dades. En aquest cas, la base de dades serà Cassandra. Quan una base de dades, com Cassandra, escriu les dades de les taules a disc, les escriu de fila en fila. Apache Arrow, una llibreria d'Apache, permet escriure les dades en columnes, aprofitant les característiques SIMD dels nous processadors. Així mateix, el format en què es guarden les dades es pretén que sigui el mateix per a totes les bases de dades. Aquest programari encara és nou i sembla tenir potencial, de manera que aquest treball també aspira a poder fer un anàlisi de la llibreria aplicada en Cassandra amb la memòria no volàtil.


Disks are the storage with the highest access time. In various ways, the structure of the memory hierarchy of a computer has always been tried to optimize. However, the disk is the only memory that keeps data persistent, that is, after system shutdown, they are maintained. Therefore, in most computer systems the disks are indispensable. Thus, access to them is inevitable, so improving a system with its interaction with these devices is easily beneficial. Intel has proposed a new non-volatile technology with a slightly longer access time to DRAM memories. It is intended that the persistence of this data is not expensive as traditional HDD or SSD disks. To verify its effectiveness, it will be tested in different environments. A good example of a computer system with many disks operations are databases. In this case, the database will be Cassandra. When a database, such as Cassandra, writes the data in memory, it writes them from row to row. Apache Arrow, an Apache library, allows you to write the data in columns, taking advantage of the SIMD features of the new processors. Also, the format in which the data is stored is intended to be the same for all databases. This software is still new and seems to have potential, so this work also aims to make an analysis of the library applied in Cassandra with Intel's non-volatile memory.

Tipo de documento

Bachelor thesis

Lengua

Castellano

Publicado por

Universitat Politécnica de Catalunya

Citación recomendada

Esta citación se ha generado automáticamente.

Derechos

Open Access

Este ítem aparece en la(s) siguiente(s) colección(ones)