Social Media: ¿Qué son los cubos OLAP?

domingo, 16 de octubre de 2011

¿Qué son los cubos OLAP?

OLAP Cube illustration
Un cubo OLAP, OnLine Analytical Processing o Procesamiento Analítico en Línea, término acuñado por Edgar Frank Codd de EF Codd and Associates, encargado por Arbor Software (en la actualidad Hyperion Solutions), es una base de datos multidimensional, en la cual el almacenamiento físico de los datos se realiza en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliación de las dos dimensiones de una hoja de cálculo.

A menudo se pensaba que todo lo que los usuarios pueden querer de un sistema de información se podría hacer de una base de datos relacional. No obstante Codd fue uno de los precursores de las bases de datos relacionales, por lo que sus opiniones fueron y son respetadas.

Detalle de una tabla de dimensión de un cubo O...
Diseño en copo de nieve de un Cubo OLAP
La propuesta de Codd consistía en realizar una disposición de los datos en vectores para permitir un análisis rápido. Estos vectores son llamados cubos. Disponer los datos en cubos evita una limitación de las bases de datos relacionales, que no son muy adecuadas para el análisis instantáneo de grandes cantidades de datos.

Las bases de datos relacionales son más adecuadas para registrar datos provenientes de transacciones (conocido como OLTP o procesamiento de transacciones en línea). Aunque existen muchas herramientas de generación de informes para bases de datos relacionales, éstas son lentas cuando debe explorarse toda la base de datos. Por ejemplo, una empresa podría analizar algunos datos financieros por producto, por período, por ciudad, por tipo de ingresos y de gastos, y mediante la comparación de los datos reales con un presupuesto. Estos parámetros en función de los cuales se analizan los datos se conocen como dimensiones.


Para acceder a los datos sólo es necesario indexarlos a partir de los valores de las dimensiones o ejes. El almacenar físicamente los datos de esta forma tiene sus pros y sus contras. Por ejemplo, en estas bases de datos las consultas de selección son muy rápidas (de hecho, casi instantáneas). Pero uno de los problemas más grandes de esta forma de almacenamiento es que una vez poblada la base de datos ésta no puede recibir cambios en su estructura. Para ello sería necesario rediseñar el cubo.

En un sistema OLAP puede haber más de tres dimensiones, por lo que a los cubos OLAP también reciben el nombre de hipercubos. Las herramientas comerciales OLAP tienen diferentes métodos de creación y vinculación de estos cubos o hipercubos (véase Tipos de OLAP en el artículo sobre OLAP).



La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE.

Tipos de sistemas OLAP

Tradicionalmente, los sistemas OLAP se clasifican según las siguientes categorías:

ROLAP
 
Implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas

MOLAP
 
Esta implementación OLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado.

HOLAP (Hybrid OLAP)

Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional.

Aunque no todo es tan complicado como parece (¿O si?) , Existe software especializado para crear Cubos OLAP como :

Pentaho: ¿Que es pentaho?


Pentaho es la solución BI Open Source líder del mercado y la mejor alternativa a los productos comerciales.

Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de análisis e informes integrados con un motor de workflow de procesos de negocio. La plataforma será capaz de ejecutar las reglas de negocio necesarias, expresadas en forma de procesos y actividades y de presentar y entregar la información adecuada en el momento adecuado, mediante analisis OLAP, Cuadros de Mando, etc…

Mondrian: ¿Que es Mondrian?


Mondrian es un servidor OLAP que esta escrito en Java.
Permite interactuar con grandes cantidades de datos almacenados en Bases de Datos relacionales, sin necesidad de utilizar complejas sentencias SQL.
Ver más documentos de karla
Fuentes:

Definicion de OLAP – Wikipedia
Definicion de Cubo OLAP – Wikipedia
Diseño de Cubos OLAP Mondrian con Pentaho

 Enlaces de Interes:

-Introduccion a Pentaho
-Analisis OLAP con Pentaho
-Como Instalar Pentaho
-Como crear un cubo multidimensional OLAP usando Pentaho
-Funciones OLAP en Microsoft Excel
-Microsoft Dynamics AX con OLAP
-Habla el mayor experto sobre OLAP: Nigel Pendse

-Inteligencia de Negocio: Conceptos y Aplicaciones con PENTAHO (pdf)
-Análisis y diseño de herramientas de e-business (pdf)
-Caso de estudio



 


Enhanced by Zemanta