Ciudad de México
+525520161426
servicios@microsys.com.mx

Almacenes de datos. Data Warehouse vs Data Mart ¿Que son y cual es mejor?

data-warehouse

Actualmente existen muchas formas de almacenar y analizar información, y si una organización escoge mal entre las alternativas que existen, podría enfrentarse a un problema grave de costos, y no obtener beneficios. Data Warehouse y Data Mart, son de los principales métodos de almacenamiento utilizados, sin embargo el éxito o fracaso de una infraestructura dependerá básicamente de quién use la información y de qué forma.

Primeramente ¿de dónde viene la información? Generalmente de distintos medios, como pueden ser: sistemas de información internos y externos, redes sociales, etc. Esta se almacena para ser analizada, y posteriormente se le da alguna utilidad, como la de corregir alguna situación interna, incrementar ventas, definir estrategias, etc. Sin embargo, la gran incógnita que surge es, ¿cómo se debe almacenar esta información para sacar el mayor provecho? Bueno, eso depende de varios factores que vamos a analizar.

Antes de iniciar con el análisis, al final del artículo dejaré una liga a una de nuestras presentaciones, sobre un curso que impartimos sobre infraestructuras de datos. Esta presentación te dará un panorama más amplio sobre el presente artículo.

Veamos un poco de historia. Hace algunos años Ralph Kimball, un estudioso, pionero y autoridad en materia de análisis de datos llegó a la conclusión que era mejor para una empresa implementar pequeños almacenes de datos (Conocidos como Data Mart) con el fin de ir exponenciando el crecimiento de la infraestructura, es decir, conforme crece tu empresa, entonces crecen tus almacenes, esto es conocido como crecimiento ascendente (Bottom-up, Kimball), y da la ventaja de que cuando se tenga más de un almacén pequeño de datos, entonces ya se podría pensar en centralizar estos almacenes en una infraestructura más grande (Data Warehouse), digamos que, en términos coloquiales, es un modelo de estrella, con diferentes picos que concentran toda la información al centro.

De igual forma, hubo otra persona que creo otro método para almacenes de datos, Bill Inmon. Inmon decía que toda la información que se recolectara, debería concentrarse en un almacén de datos gigante (Data Warehouse), para posteriormente subdividirse al máximo detalle en pequeños almacenes (Data Mart). Es decir, primero se construye un almacén grande de datos, y este se va subdividiendo a niveles más pequeños, con el fin de organizar la información del negocio, esto es conocido como crecimiento descendente (Top-down, Inmon).

Naturalmente ambos métodos tienen sus diferencias no solo en la implementación, sino también en costos y otras variaciones, en la tabla siguiente podemos ver cuales son las características generales de cada metodología.

Ahora bien, ya que sabemos de qué se tratan ambos métodos y cuáles son sus características, podríamos preguntar, ¿Cuál es el método que más me conviene? Bueno esto va a depender de varios factores que podemos analizar a continuación:

1.- Presupuesto: Con cuanto dinero dispone mi compañía o negocio para invertir en infraestructura de almacenamiento de datos, es un tema no tan sencillo de resolver, dado que, aunque la empresa disponga de una cantidad considerable, existen otros factores a valorar, como por ejemplo, el hecho de saber que si momentáneamente (digamos un crecimiento de dos años) no voy a ocupar una gran infraestructura, no tiene caso entonces realmente gastar una fortuna en recursos para este fin, un punto importante de la buena planeación es el saber como invertir.

2.- Plazos de entrega: Que tan urgente es la implementación de una infraestructura de almacenamiento de datos, aunque siempre es importante tener una, sin embargo esto lo podemos valorar haciendo un ejercicio sencillo, calcular el cómo se va a afectar mi operación al no tener un almacén de datos, es decir, valorar si voy a perder dinero, clientes, presencia, etc. Cualquier factor que pudiera disminuir la operabilidad de mi negocio, es un factor determinante para tomar en cuenta la urgencia de implementar un sistema de almacenamiento de datos.

3.- Alcance: Podríamos decir que este punto es el necesitamos valorar de inicio. ¿Para que necesito mi almacén de datos? ¿Quiénes lo van a utilizar? ¿Cuánto crecimiento tendré en determinado tiempo? Todas estas preguntas, te ayudarán a definir tu alcance, por ejemplo, si trabajas en un corporativo con diferentes sucursales, lo más adecuado sería construir un Data Mart por cada sucursal, para concentrar todo en un Data Warehouse que centralice esa información, en dado caso de que la necesidad de la empresa sea de recolección de datos. Pero si por el contrario, y basándonos en el mismo ejemplo, lo que tu empresa requiere es retroalimentación constante, entonces lo adecuado sería recoger la información directamente en un Data Warehouse y posteriormente repartirla a distintos Data Mart por sucursal.

4.- Mantenimiento: De que recursos disponemos para el mantenimiento, tanto humanos, como económicos. Naturalmente administrar un Data Warehouse implica un costo en recursos. Pero administrar varios Data Mart también, por lo cual debemos realizar cálculos precisos y realizar un plan de mantenimiento, este plan nos va a ayudar a saber cada cuando necesitamos realizar mantenimiento tanto de software como de hardware, por ejemplo. El aprender a calcular esfuerzo de horas hombre también nos va a beneficiar para no tener derroche de recursos.

El hacer este análisis básico, nos va a ayudar a no cometer un error que pueda ser desastroso, a la hora de implementar una infraestructura de almacenamiento de datos.

Si deseas consultoría y asesoramiento para la implementación de tu almacén de datos, no dudes en contactarnos. Contamos con los mejores especialistas que podrán ayudarte a definir mejor tu infraestructura.

En la siguiente liga podrás consultar información adicional sobre Data Warehouse y Data Mart:

Introducción al Data Warehouse Parte I

Abrir chat
¿Necesitas ayuda? Contáctanos
Powered by