Feeds:
Entradas
Comentarios

En este documento se muestra paso a paso como se creo un cubo OLAP

http://www.scribd.com/doc/31967622/TOPICOS-CUBO

Anuncios

El siguiente link trata acerca de algunos ejemplos reales que aplican  la mineria de datos.. Para mas información de clic sobre el siguiente link:

http://www.scribd.com/doc/31963956/Mineria-de-datos

Minería De Datos

Que tal, aqui les dejo algunos ejemplos  donde se aplica la  minería de datos, espero y este tema sea de su utilidad..

http://docs.google.com/View?id=dg834964_34dm9q4kdc

Datamining

El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.

Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento.

Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso común a todos ellos se suele componer de cuatro etapas principales:

Determinación de los objetivos. Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining.

Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.

Determinación del modelo. Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.

Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

MDX

CUBOS OLAP

Introducción.

Cuando  se trabaja con bases de datos multidimensionales (como SQL Server Analysis Services) en Office Excel 2007, se puede  utilizar fórmulas OLAP para generar informes de enlaces de datos OLAP complejos y de forma libre. Las nuevas funciones de cubo se utilizan para extraer datos OLAP (conjuntos y valores) de Analysis Services y mostrarlos en una celda. Las fórmulas OLAP se pueden generar cuando se convierten fórmulas de tabla dinámica en fórmulas de celda o cuando se utiliza Autocompletar en argumentos de funciones de cubo al escribir fórmulas.

CUBOS OLAP EN EXCEL

Niveles de detalle: Las bases de datos OLAP organizan los datos por nivel de detalle, utilizando las mismas categorías que se utilizan para analizar los datos. Por ejemplo, una base de datos de ventas puede tener campos correspondientes al país, la región, la ciudad y el lugar de cada venta. Esta información puede organizarse desde el menor al mayor nivel de detalle, como se indica a continuación:

Recuperar datos OLAP: Puede conectarse a los orígenes de datos (origen de datos: conjunto almacenado de información de “origen” utilizado para conectarse a una base de datos. Un origen de datos puede incluir el nombre y la ubicación del servidor de la base de datos, el nombre del controlador de la base de datos e información que necesita la base de datos cuando se inicia una sesión.) OLAP como lo haría a otros orígenes de datos externos. Puede trabajar con bases de datos creadas con servicios OLAP de Microsoft SQL Server, el producto servidor OLAP de Microsoft. Excel también puede trabajar con productos de otros proveedores compatibles con OLE-DB para OLAP. Los datos OLAP sólo se pueden mostrar como informe de tabla dinámica o de gráfico dinámico, no como rango de datos externos (rango de datos externos: rango de datos que se incorpora a una hoja de cálculo pero que se origina fuera de Excel, como en una base de datos o un archivo de texto.

En Excel, se puede dar formato a los datos o utilizarlos en cálculos.). Puede guardar informes OLAP de tabla dinámica y de gráfico dinámico en plantillas de informe (plantilla de informe: plantilla de Excel (archivo .xlt) que incluye una o más consultas o informes de tabla dinámica basados en datos externos. Al guardarse una plantilla de informe, Excel se guarda también la definición de la consulta, pero no los datos consultados en la plantilla.), y crear archivos de conexión de datos de Office (.odc) para conectarse a bases de datos OLAP y a archivos de consulta (.oqy) para consultas (consulta: en Query o Access, medio de buscar registros que responden a una pregunta concreta sobre los datos de una base de datos.) OLAP. Al abrir un archivo .odc u .oqy, Excel muestra un informe de tabla dinámica en blanco, listo para que el usuario decida el diseño.

Crear archivos de cubo para utilizarlos sin conexión: Puede utilizar el Asistente para cubos sin conexión de Excel para crear archivos con un subconjunto de los datos de una base de datos del servidor OLAP. Los archivos de cubo sin conexión permiten trabajar con datos OLAP sin estar conectado a la red. Sólo podrá crear archivos de cubo si utiliza un proveedor OLAP (proveedor OLAP: conjunto de software que proporciona acceso a un tipo concreto de base de datos OLAP. Este software puede incluir un controlador de origen de datos y otro software de cliente necesario para conectarse a una base de datos.), como los servicios OLAP de Microsoft SQL Server, que admita esta función.

Crear cubos a partir de bases de datos relacionales: Otro asistente, el Asistente para cubos OLAP, permite organizar datos consultados de bases de datos relacionales, como Microsoft SQL Server, en cubos OLAP. El asistente está disponible desde Microsoft Query, al que se puede tener acceso desde Excel. Un cubo permite trabajar con cantidades mayores de datos en un informe de tabla dinámica o gráfico dinámico que en otras circunstancias y, además, agiliza la recuperación de los datos.

Niveles en una dimensión geográfica: Esta organización facilita que un informe de tabla dinámica o de gráfico dinámico muestre resúmenes de ventas de alto nivel, como el total de ventas de un país o de una región, y los detalles de los sitios en los que las ventas son especialmente altas o bajas.

Dimensiones y cubos: El conjunto de niveles que abarca un aspecto de los datos, como las áreas geográficas, se denomina dimensión. De forma similar, la información del momento en que se hicieron las ventas podría organizarse en una dimensión temporal con niveles para año, trimestre, mes y día. Las bases de datos OLAP se denominan cubos porque combinan varias dimensiones, como tiempo, geografía y líneas de productos, con datos resumidos, como ventas o cifras de inventario.

Componentes de software necesarios para el acceso a OLAP

Un proveedor OLAP : Para configurar orígenes de datos OLAP (origen de datos: conjunto almacenado de información de “origen” utilizado para conectarse a una base de datos. Un origen de datos puede incluir el nombre y la ubicación del servidor de la base de datos, el nombre del controlador de la base de datos e información que necesita la base de datos cuando se inicia una sesión.) para Microsoft Excel, es necesario uno de los siguientes proveedores OLAP (proveedor OLAP: conjunto de software que proporciona acceso a un tipo concreto de base de datos OLAP. Este software puede incluir un controlador de origen de datos y otro software de cliente necesario para conectarse a una base de datos.):

  • Proveedor OLAP de Microsoft: Excel incluye el controlador de origen de datos (controlador de origen de datos: archivo de programa utilizado para conectarse a una base de datos específica. Cada programa o sistema de administración de bases de datos requiere un controlador diferente.) y el software de cliente que necesitará para tener acceso a bases de datos creadas con el producto OLAP de Microsoft, Servicios OLAP de Microsoft SQL Server. El controlador que se incluye con Excel  y posteriores admite tanto la versión 7.0 como la versión 8.0 de este producto. Si tiene el controlador versión 7.0 incluido con Excel puede utilizarlo para tener acceso a bases de datos de la versión 7.0, pero para las bases de datos de la versión 8.0 deberá utilizar el controlador versión 8.0.
  • Otros proveedores OLAP: Para otros productos OLAP, deberá instalar controladores adicionales y software de cliente. Para utilizar las funciones de Excel a fin de trabajar con datos OLAP, el producto del proveedor debe adaptarse al estándar OLE-DB para OLAP y ser compatible con Microsoft Office. Para obtener información sobre cómo instalar y utilizar proveedores OLAP de otros fabricantes, póngase en contacto con el administrador del sistema o con el proveedor de los productos OLAP.

Bases de datos de servidor y archivos de cubo: El software cliente OLAP de Excel admite conexiones a dos tipos de bases de datos OLAP. Si en la red hay disponible una base de datos en un servidor OLAP, puede recuperar datos de origen de la misma directamente. Si tiene un archivo de cubo sin conexión (archivo de cubo sin conexión: archivo que se crea en el disco duro o en un recurso compartido de red para almacenar datos de origen OLAP para un informe de tabla dinámica o de gráfico dinámico. Los archivos de cubo sin conexión permiten continuar trabajando cuando no se está conectado al servidor OLAP.) que contiene datos OLAP o un archivo de definición de cubo (definición de cubo: información, almacenada por el Asistente para cubos OLAP en un archivo .oqy, que define cómo se construye un cubo OLAP en la memoria utilizando datos recuperados de una base de datos relacional.), puede conectarse a ese archivo y recuperar los datos de origen del mismo.

Orígenes de datos: Un origen de datos proporciona acceso a todos los datos de la base de datos o del archivo de cubo sin conexión. Una vez que se crea un origen de datos OLAP, los informes pueden basarse en él y los datos OLAP pueden devolverse a Excel como informes de tabla dinámica o gráfico dinámico. Puede crear un origen de datos mientras utiliza el Asistente para tablas y gráficos dinámicos para crear un nuevo informe, o crearlo en Microsoft Query y utilizarlo para crear informes en Excel.

Microsoft Query: Microsoft Query es un componente opcional de Microsoft Office que se puede instalar y al que se puede tener acceso desde Excel. Puede utilizar Query para recuperar datos de una base de datos externa como Microsoft SQL o Microsoft Access. No necesita utilizar Query para recuperar datos de una tabla dinámica OLAP conectada a un archivo de cubo (cubo: estructura de datos OLAP. un cubo contiene dimensiones, como País, Región, Ciudad, y campos de datos, como Índice de ventas. Las dimensiones organizan los tipos de datos en jerarquías con niveles de detalle y cantidades de medida de campos de datos.).

Diferencias de funciones en los informes con datos de origen OLAP

Si trabaja con informes de tabla dinámica y gráfico dinámico de datos de origen (datos de origen: lista o tabla que se utiliza para crear un informe de tabla dinámica o gráfico dinámico. Los datos de origen pueden tomarse de una lista o rango de Excel, de un cubo o base de datos externa o de otro informe de tabla dinámica.) OLAP y de otros tipos de datos de origen, observará algunas diferencias de funciones.

Recuperación de datos

Un servidor OLAP devuelve nuevos datos a Microsoft Excel cada vez que se cambia el diseño del informe. Con otros tipos de datos de origen externo, se consultan todos los datos la vez, o se pueden establecer opciones para que la consulta se realice solamente cuando se muestren elementos de campo de página (campo de página: campo asignado a una orientación de página en un informe de tabla dinámica o de gráfico dinámico. Puede mostrarse un resumen de todos los elementos de un campo de página o bien un elemento cada vez que filtre los datos para los demás elementos.)diferentes. También están disponibles otras opciones para actualizar (actualizar: renovar el contenido de un informe de tabla dinámica o gráfico dinámico para reflejar los cambios realizados en el origen de datos subyacente. Si el informe está basado en datos externos, la actualización ejecuta la consulta subyacente para recuperar los datos nuevos o modificados.) el informe.

En informes basados en datos de origen OLAP, no está disponible la configuración del campo de página (campo de página: campo asignado a una orientación de página en un informe de tabla dinámica o de gráfico dinámico. Puede mostrarse un resumen de todos los elementos de un campo de página o bien un elemento cada vez que filtre los datos para los demás elementos.), la consulta en segundo plano ni la optimización de la memoria.

Tipos de campos Para los datos de origen OLAP, los campos de dimensión (dimensión: estructura OLAP que organiza los datos en niveles, como País, Región y Ciudad para una dimensión Geografía. En un informe de tabla dinámica o de gráfico dinámico, cada dimensión se convierte en un conjunto de campos donde se puede ampliar o contraer el nivel de detalle.) tienen iconos en la lista de campos y sólo se pueden utilizar como campos de fila (campo de fila: campo asignado a una orientación de fila en un informe de tabla dinámica. Los elementos asociados a un campo de fila se muestran como rótulos de fila.) (Series), columna (campo de columna: campo asignado a una orientación de columna en un informe de tabla dinámica. Los elementos asociados a un campo de columna se muestran como rótulos de columna.) (categoría) o página. Los campos con iconos sólo se pueden utilizar como campos de datos. Para otros tipos de datos de origen, todos los campos tienen iconos y pueden utilizarse en cualquier parte de un informe.

Campos y elementos a los que se ha cambiado el nombre: Para datos de origen OLAP, los campos y elementos (elemento: subcategoría de un campo en informes de tabla dinámica y de gráfico dinámico. Por ejemplo, el campo “Mes” podría tener los elementos “Enero”, “Febrero”, etc.) a los que se cambie el nombre y se oculten, recuperarán sus nombres originales cuando se vuelvan a mostrar. Para otros tipos de datos de origen, los campos y elementos mantienen los nuevos nombres en estos casos.

Acceso a datos de detalle: Para datos de origen OLAP, el servidor determina qué niveles de detalle están disponibles y calcula los valores de resumen, de modo que los registros de detalle que componen los valores de resumen generalmente no están disponibles y no es posible mostrar elementos que no contienen datos. No obstante, el servidor puede proporcionar campos de propiedad (campos de propiedad: atributos independientes asociados con elementos, o integrantes, de un cubo OLAP. Por ejemplo, si los elementos de ciudad tiene propiedades de tamaño y población almacenados en el cubo del servidor, un informe de tabla dinámica puede mostrar el tamaño y la población de cada ciudad.) que sí se pueden mostrar. Otros tipos de datos de origen no tienen campos de propiedad, pero se puede mostrar el detalle subyacente de los valores de campos de datos y elementos, así como los elementos que no contienen datos. Es posible que los campos de página OLAP no tengan el elemento Todos y que el comando Mostrar página no esté disponible.

Orden inicial: Para datos de origen OLAP, los elementos aparecen primero en el orden en que los devuelve el servidor OLAP. Después puede ordenar o reorganizar los elementos manualmente. Para otros tipos de datos de origen, los elementos de un nuevo informe aparecen ordenados primero en orden ascendente por nombre de elemento.

Cálculos: Los servidores OLAP proporcionan valores resumidos directamente para un informe, de modo que no se pueden cambiar las funciones de resumen (función de resumen: tipo de cálculo que combina datos de origen en un informe de tabla dinámica o una tabla de consolidación, o cuando se insertan subtotales automáticos en una lista o base de datos. Algunos ejemplos de funciones de resumen son: Sumar, Contar y Promedio.) de los campos de datos. Para otros tipos de datos de origen, se puede cambiar la función de resumen de un campo de datos y utilizar varias funciones de resumen para el mismo campo de datos. Los dos tipos de datos de origen admiten cálculos personalizados (cálculo personalizado: método para resumir valores del área de datos de un informe de tabla dinámica utilizando los valores de otras celdas del área de datos. Utilice la lista Mostrar datos como del cuadro de diálogo Campo de tabla dinámica para un campo de datos con el fin de crear cálculos personalizados.). No se pueden crear campos calculados (campo calculado: campo de un informe de tabla dinámica o de gráfico dinámico que utiliza una fórmula que usted cree. Los campos calculados pueden realizar cálculos utilizando el contenido de otros campos del informe de tabla dinámica o de gráfico dinámico.) ni elementos calculados (elemento calculado: elemento de un campo de tabla dinámica o gráfico dinámico que utiliza una fórmula que usted cree. Los elementos calculados pueden realizar cálculos utilizando el contenido de otros elementos del mismo campo del informe de tabla dinámica o gráfico dinámico.) en informes con datos de origen OLAP.

Subtotales: En informes con datos de origen OLAP, no se puede cambiar la función de resumen para subtotales ni mostrar subtotales para campos de fila o de columna interiores. Con otros tipos de datos de origen, se pueden cambiar funciones de resumen de subtotales y mostrar u ocultar subtotales para todos los campos de fila y columna.

Para datos de origen OLAP, se pueden incluir o excluir los elementos ocultos al calcular subtotales y totales generales. Para otros tipos de datos de origen, se pueden incluir los elementos ocultos de un campo de página en los subtotales, pero los elementos ocultos de otros campos se excluyen de forma predeterminada.

CREACIÓN DE UN ARCHIVO DE CONSULTA OLAP PARA CONECTARSE A UNA BASE DE DATOS OLAP

Cree un origen de datos (origen de datos: conjunto almacenado de información de “origen” utilizado para conectarse a una base de datos. Un origen de datos puede incluir el nombre y la ubicación del servidor de la base de datos, el nombre del controlador de la base de datos e información que necesita la base de datos cuando se inicia una sesión.) nuevo que utilice el nombre que desee para el archivo de consulta OLAP (.oqy) como nombre del origen de datos.

¿Cómo?

  1. En el menú Datos, elija Importar datos externos y, a continuación, haga clic en Nueva consulta de base de datos.
  2. En la ficha Cubos OLAP del cuadro de diálogo Elegir origen de datos, haga clic en Nuevo origen de datos y, a continuación, en Aceptar.
  3. Elija un nombre para el origen de datos, seleccione un proveedor OLAP (proveedor OLAP: conjunto de software que proporciona acceso a un tipo concreto de base de datos OLAP. Este software puede incluir un controlador de origen de datos y otro software de cliente necesario para conectarse a una base de datos.) y haga clic en Conectar.
  4. Siga las instrucciones del Asistente para conexiones multidimensionales.
  5. En el cuadro de diálogo Elegir origen de datos, haga clic en Opciones en la ficha Cubos OLAP para ver el nombre de la carpeta en la que se creó el archivo .oqy. La ubicación predeterminada es la carpeta de perfil de usuario dentro de Datos de programa\Microsoft\Consultas.

Observación. Al utilizar el comando Abrir en el menú Archivo de Microsoft Excel para abrir un archivo .oqy, Excel muestra una hoja de cálculo con un informe de tabla dinámica vacío para los datos OLAP. Puede utilizar este informe para mostrar los datos que desee ver y guardarlo en un archivo de libro de Excel.  También puede utilizar el Asistente para cubos OLAP en Microsoft Query para crear un archivo .oqy que conecta con un archivo de cubo o que define uncubo (cubo: estructura de datos OLAP. un cubo contiene dimensiones, como País, Región, Ciudad, y campos de datos, como Índice de ventas. Las dimensiones organizan los tipos de datos en jerarquías con niveles de detalle y cantidades de medida de campos de datos.) creado a partir de datos consultados. Para obtener más información, consulte la Ayuda de Microsoft Query.

OLAP, MOLAP, ROLA, HOLAP.

ROLAP (Relational Online Analytical Processing)

Proceso analítico relacional en línea.

Es una forma de procesamiento analítico en línea (OLAP) que ejecuta análisis multidimensional sobre datos almacenados en una base de datos relacional, en vez de una base de datos multidimensional, como se considera el estándar de OLAP. Utiliza una arquitectura de tres niveles. La BD relacional maneja el almacenamiento de datos, el motor OLAP proporciona la funcionalidad analítica, y alguna herramienta especializada es empleada para el nivel de presentación.  El nivel de aplicación es el motor OLAP, que ejecuta las consultas de los usuarios. El motor OLAP se integra con el nivel de presentación a través del cual los usuarios realizan los análisis OLAP.

Después de que el modelo de datos para el DW se ha definido, los datos se cargan desde los sistemas transaccionales. Los usuarios finales ejecutan sus análisis multidimensionales, a través del motor OLAP, el cual transforma sus datos a consultas en SQL ejecutadas en las BD relacionales y sus resultados son devueltos a los usuarios.

La arquitectura ROLAP es capaz de usar datos pres calculados (si estos están disponibles), o de generar dinámicamente los resultados desde la información elemental (menos resumida). Esta arquitectura accede directamente a los datos del DW y soporta técnicas de optimización para acelerar las consultas como tablas particionadas, soporte a la des normalización, soporte de múltiples reuniones, pre calculado de datos, índices etcétera.

Ventajas de ROLAP

La construcción de herramientas OLAP sobre sistemas relacionales presenta algunas ventajas frente a los sistemas multidimensionales:

  • ROLAP es escalable ya que maneja grandes volúmenes de datos.
  • Existe  una gran variedad de herramientas de carga de datos para sistemas relacionales.
  • Los datos se almacenan en una base de datos relacional estándar que puede ser accedida por cualquier herramienta de generación de informes SQL (reporting). Estas herramientas no tienen que ser necesariamente de tipo OLAP.
  • Obviando el almacenamiento de datos del modelo multidimensional, es posible modelar datos con éxito que de otro modo no se ajustarían en un modelo dimensional estricto.

Desventajas de ROLAP

Hay un consenso general en la industria de que las herramientas ROLAP tienen menor rendimiento que las herramientas MOLAP.

  • El proceso de carga de tablas agregadas debe ser gestionado por código ETL personalizado. Las herramientas ROLAP no disponen de mecanismos automáticos para realizar esta tarea, lo significa que se necesita más tiempo de desarrollo de código.
  • Muchos desarrolladores de modelos dimensionales ROLAP ignoran el paso de crear tablas agregadas. En este caso el rendimiento de una consulta se ve afectado porque entonces se necesita consultar las tablas con datos más detallados.
  • Los sistemas ROLAP se construyen sobre bases de datos de propósito general, por lo que hay algunas funcionalidades especiales propias de las herramientas MOLAP que no están disponibles en los sistemas ROLAP (tales como el indexado jerárquico especial). Sin embargo, las herramientas ROLAP modernas van supliendo estas carencias con las últimas mejoras en el lenguaje SQL tales como los operadores CUBE y ROLLUP, las vistas de cubo DB2, así como otras extensiones SQL OLAP.
  • Ya que las herramientas ROLAP se basan en SQL para todos los cálculos, no son apropiadas cuando el modelo realiza muchos cómputos que no se traducen bien en SQL (por ejemplos: presupuestos, asignaciones, informes financieros y otros escenarios).

MOLAP (Multidimensional online analytical processing)

Procesamiento analítico multidimensional en línea.

Proceso analítico en línea (OLAP) que indexa directamente en una base de datos multidimensional. Por lo general una aplicación OLAP considera los datos en forma multidimensional, el usuario es capaz de ver diferentes aspectos o facetas de agregados de datos, como las ventas por tiempo, geografía y modelo del producto. Si la información se almacena en una base de datos relacional, se puede ver en forma multidimensional, pero solo mediante el acceso secuencial y el procesamiento de una tabla para cada dimensión o aspecto que se quiera ver.

Los procesos MOLAP usan información que ya están almacenados en un arreglo multidimensional, en el cual todas las posibles combinaciones de los datos se reflejan, cada uno en una celda que puede ser accesado directamente. Por ésta razón, MOLAP es, para la mayoría de los usos, más rápida y más ágil para responder al usuario que el ROLAP. El MOLAP se usa particularmente en proyectos de bodegas de datos.

La arquitectura MOLAP usa unas bases de datos multidimensionales para proporcionar el análisis, su principal premisa es que el OLAP está mejor implantado almacenando los datos multidimensionalmente.

Un sistema MOLAP usa una BD multidimensional (BDMD), en la que la información se almacena multidimensionalmente. Este utiliza una arquitectura de dos niveles: la BDMD y el motor analítico. La BDMD es la encargada del manejo, acceso y obtención de los datos.

El nivel de aplicación es el responsable de la ejecución de las consultas OLAP. El nivel de presentación se integra con el de aplicación y proporciona una interfaz a través de la cual los usuarios finales visualizan los análisis OLAP.

La información procedente de los sistemas transaccionales se carga en el sistema MOLAP. Una vez cargados los datos en la BDMD, se realiza una serie de cálculos para obtener datos agregados a través de las dimensiones del negocio, poblando la estructura de la BDMD. Luego de llenar esta estructura, se generan índices y se emplean algoritmos de tablas hash para mejorar los tiempos de accesos de las consultas. Una vez que el proceso de poblado ha finalizado, la BDMD está lista para su uso. Los usuarios solicitan informes a través de la interfaz y la lógica de aplicación de la BDMD obtiene los datos. La arquitectura MOLAP requiere unos cálculos intensivos de compilación. Lee de datos pre compilados, y tiene capacidades limitadas de crear agregaciones dinámicamente o de hallar ratios que no se hayan pre calculados y almacenados previamente.

Ventajas de MOLAP

  • Ayuna el funcionamiento de la pregunta debido al almacenaje optimizado, a la indexación de direcciones multidimensional y a depositar.
  • Un tamaño más pequeño del en-disco de datos comparó a los datos almacenados adentro base de datos emparentada debido a las técnicas de la compresión.
  • Cómputo automatizado de los agregados de alto nivel de los datos.
  • Es muy compacto para los módems bajos de la dimensión.
  • El modelo del arsenal proporciona la indexación de direcciones natural
  • Extracto eficaz de los datos alcanzados con la pre-estructuración de datos agregados.

Desventajas de MOLAP

  • El paso de proceso (carga de los datos) puede ser absolutamente muy largo, especialmente en volúmenes grandes de los datos. Esto es remediada generalmente haciendo solamente el proceso incremental, es decir, procesando solamente los datos que ha cambiado (generalmente los nuevos datos) en vez de tratar de nuevo el modem entero.
  • Las herramientas de MOLAP tienen tradicionalmente dificultad el preguntar de modelos con dimensiones con muy arriba cardinality (es decir, millones de miembros).
  • Ciertas herramientas de MOLAP (e.g., Essbase) tenga dificultad el poner al día y el preguntar de modelos con más de diez dimensiones. Este límite diferencia dependiendo de la complejidad y cardinality de las dimensiones en la pregunta. También depende del número de los hechos o de las medidas almacenadas. Otras herramientas de MOLAP (e.g., Servicios del análisis de MicrosoftApplix TM1) puede manejar centenares de dimensiones.
  • El acercamiento de MOLAP introduce redundancia de datos.

HOLAP: Hybrid OLAP

Es una combinación de los dos anteriores. Los datos agregados y pre calculados se almacenan en estructuras multidimensionales y los de menor nivel de detalle en el relacional. Requiere un buen trabajo de análisis para identificar cada tipo de dato.

Particionamiento vertical En este modo, HOLAP almacena agregaciones como un MOLAP para mejorar la velocidad de las consultas, y los datos se detallan en ROLAP para optimizar el tiempo en que se procesa el cubo.

Particionamiento horizontal En este modo HOLAP almacena una sección de los datos, normalmente los más recientes  en modo MOLAP para mejorar la velocidad de las consultas, y los datos más antiguos en ROLAP. Además, se pueden almacenar algunos cubos en MOLAP y otros en ROLAP.

HOLAP permite almacenar una parte de los datos como en un sistema MOLAP y el resto como en uno ROLAP. El grado de control que el operador de la aplicación tiene sobre este particionamiento varía de unos productos a otros. Se han desarrollado soluciones de OLAP híbridas que combinan el uso de las arquitecturas ROLAP y MOLAP. En una solución con HOLAP, los registros detallados (los volúmenes más grandes) se mantienen en la BD relacional, mientras que los agregados lo hacen en un almacén MOLAP independiente Los servidores OLAP se clasifican de acuerdo como se almacenan los datos:

  • Un servidor MOLAP almacena los datos en disco en estructuras optimizadas para acceso multidimensional. Típicamente, los datos son almacenados en arreglos densos, los cuales requieren cuatro u ocho bytes por celda.
  • Un servidor ROLAP almacena sus datos en una BD relacional. Cada fila de una tabla de hechos tiene una columna para cada dimensión y otra para cada medida.
  • Es necesario almacenar tres tipos de datos: hechos, agregados y dimensiones.

LENGUAJE MDX

MDX es un acrónimo de Multidimensional Query eXpression. Este lenguaje fue creado en 1997 por Microsoft. No es un lenguaje estándar sin embargo diferentes fabricantes de herramientas OLAP (entre ellos Mondrian) lo han adoptado como estandard de hecho. El MDX es en los sistemas OLAP el equivalente al SQL en los sistemas gestores de bases de datos relacionales. Eso significa que es el lenguaje a través del cual podemos explotar la información que reside en los motores OLAP y satisfacer las consultas analíticas de las que hemos hablado en el capítulo introductorio. Es un lenguaje de consulta más cercano al lenguaje natural que el sql sin embargo tiene funciones y formulas que lo hacen muy potente para el análisis de datos. La principal diferencia del mundo OLAP respecto al mundo relacional radica en que las estructuras dimensionales están jerarquizadas y se representan en forma de árbol y por lo tanto existen relaciones entre los diferentes miembros de las dimensiones. Este hecho hace que el lenguaje MDX disponga de funciones y atributos especiales que permiten referenciar los diferentes elementos de las dimensiones con expresiones como MIEMBROS-HIJO, MIEMBROS-PRIMO, MIEMBROS-PADRE,etc… Haciendo una analogía con los árboles genealógicos.

Ejemplo de sintaxis de MDX

Se desea obtener el importe de las ventas para el año 2008 para la familia de productos lácteos la consulta sería la siguiente:

SELECT

{ [Medidas].[importe ventas]}

on columns,

{ [Tiempo].[2008] }

on rows

FROM [cubo ventas]

WHERE ([Familia].[lacteos])

welcome

Hola a todos mi nombre es alylu, este wordpress fue creado para el uso de la información sobre la materia que actualmente estoy cursando la cual es Tópicos Avanzados De Base De Datos, espero que la información que publique sea de su utilidad.

XML  Schemas


Ejemplo