Tesis:
Algoritmos polinomiales para reparar data warehouses inconsistentes

Cargando...
Miniatura
Fecha
2013
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad del Bío-Bío. Departamento de Sistemas de Información
Resumen
Un Data Warehouse (DW) es un almacén de datos que se modela utilizando el modelo multidimensional, el cual estructura la información de acuerdo a dimensiones y hechos. Una dimensión es un concepto abstracto que agrupa datos que comparten un significado semántico común. Las dimensiones se modelan mediante jerarquías de categorías, las que contienen elementos. Una dimensión es estricta si cada elemento de toda categoría tiene un único ancestro en cada categoría superior y homogénea si cada elemento tiene al menos un ancestro en cada categoría superior. Si una dimensión no satisface las restricciones de integridad que imponen estas condiciones, al utilizar vistas precomputadas para responder consultas, se pueden obtener respuestas incorrectas. Una dimensión se puede volver inconsistente con respecto a sus restricciones de integridad estrictas y homogéneas luego de efectuar una actualización, por ejemplo, luego de una reclasificación de elementos. Cuando esto sucede es necesario reparar (corregir) la dimensión. Una reparación es una nueva dimensión que satisface el conjunto de restricciones estrictas y homogéneas y se obtiene mediante inserción y eliminación de arcos entre elementos de las categorías. Una reparación es minimal si se obtiene mediante un número mínimo de cambios. Se ha demostrado que en general computar reparaciones minimales con respecto a restricciones de integridad estrictas y homogéneas es un problema NP-completo. Sin embargo, se ha mostrado que si la dimensión se vuelve inconsistente luego de una única operación de reclasificación de elementos es posible computar una reparación, que contiene la actualización, en tiempo polinomial. En esta tesis se implementan algoritmos para computar reparaciones que mantienen las operaciones de reclasificación que producen las inconsistencias. Esto para un caso particular de dimensiones. Además, se consideran otras restricciones que pueden ser impuestas por el administrador del Data Warehouse, tales como restricciones de prioridad y seguridad.
Descripción
Tesis (Magíster en Ciencias de la Computación)
Palabras clave
Bases de datos, Algoritmos computacionales-investigaciones, Inconsistencias, Restricciones estrictas, Restricciones homogéneas
Citación
Colecciones