Almacenes de datos. Data Warehouse vs Data Mart ¿Que son y cual es mejor?

Actualmente existen muchas formas de almacenar y analizar información; si una organización escoge mal entre las alternativas que existen, podría enfrentarse a un problema grave de costos, y no obtener beneficios. Data Warehouse y Data Mart, son los principales métodos de almacenamiento; sin embargo el éxito de una infraestructura dependerá de la forma en que se utilice la información.

Primeramente ¿de dónde viene la información? Generalmente de distintos medios, como pueden ser: sistemas de información internos y externos, redes sociales, etc. Esta se almacena para ser analizada, y posteriormente se le da alguna utilidad, como la de corregir alguna situación interna, incrementar ventas, definir estrategias, etc. Sin embargo, la gran incógnita que surge es, ¿cómo se debe almacenar esta información para sacar el mayor provecho? Bueno, eso depende de varios factores que vamos a analizar.

Antes de iniciar con el análisis, al final dejaremos una liga a una de nuestras presentaciones. Esta te dará un panorama más amplio sobre el presente artículo.

Veamos un poco de historia. Hace algunos años Ralph Kimball, autoridad en análisis de datos llegó a la conclusión que era mejor implementar pequeños almacenes de datos (Data Mart); con el fin de ir exponenciando el crecimiento de la infraestructura, conforme crece el negocio, entonces crecen tus almacenes (crecimiento ascendente o Bottom-up, Kimball); entonces cuando se tiene más de un almacén, ya se puede pensar en centralizarlos en una infraestructura más grande (Data Warehouse); esto es conocido como un modelo de estrella, con diferentes picos que concentran toda la información al centro.

Data Mart

También hubo otra persona que creo otro método para almacenes de datos, Bill Inmon. Él decía que toda la información debería concentrarse en un almacén de datos grande, para subdividirse al máximo detalle en pequeños almacenes. Es decir, primero se construye un Data Warehouse, y este se va subdividiendo en Data Mart, esto es conocido como crecimiento descendente (Top-down, Inmon).

Naturalmente ambos métodos tienen sus diferencias no solo en la implementación, sino también en costos y otras variaciones; en la tabla siguiente podemos ver cuales son las características generales de cada metodología.

Ahora bien, ya que sabemos de qué se tratan ambos métodos y cuáles son sus características, podríamos preguntar, ¿Cuál es el método que más me conviene? Bueno esto va a depender de varios factores que podemos analizar a continuación:

1.- Presupuesto: Con cuanto dinero dispone mi compañía o negocio para invertir en infraestructura de almacenamiento de datos. Esto es un tema no tan sencillo de resolver, dado que, aunque la empresa disponga del presupuesto, existen otros factores a valorar; como el hecho de saber que si momentáneamente no se ocupa una gran infraestructura, no tiene caso entonces realmente gastar una gran cantidad; un punto importante de la buena planificación es el saber como invertir.

2.- Plazos de entrega: Que tan urgente es la implementación de una infraestructura de almacenamiento de datos. Aunque siempre es importante tener una, sin embargo esto lo podemos valorar haciendo un ejercicio sencillo; calcular el cómo se va a afectar mi operación al no tener un almacén de datos, valorar si vamos a perder dinero, clientes, presencia, etc. Cualquier factor que pudiera disminuir la operabilidad del negocio, es un factor para tomar en cuenta la urgencia de implementar un sistema de almacenamiento de datos.

3.- Alcance: Podríamos decir que este punto es el necesitamos valorar de inicio. ¿Para que necesito mi almacén de datos? ¿Quiénes lo van a utilizar? ¿Cuánto crecimiento tendré en determinado tiempo? Todas estas preguntas, te ayudarán a definir tu alcance, por ejemplo, si trabajas en un corporativo con diferentes sucursales, lo más adecuado sería construir un Data Mart por cada sucursal, para concentrar todo en un Data Warehouse que centralice esa información, en dado caso de que la necesidad de la empresa sea de recolección de datos. Pero si por el contrario, y basándonos en el mismo ejemplo, lo que tu empresa requiere es retroalimentación constante, entonces lo adecuado sería recoger la información directamente en un Data Warehouse y posteriormente repartirla a distintos Data Mart por sucursal.

4.- Mantenimiento: De que recursos disponemos para el mantenimiento, tanto humanos, como económicos. Naturalmente administrar un Data Warehouse implica un costo en recursos. Pero administrar varios Data Mart también, por lo cual debemos realizar cálculos precisos y realizar un plan de mantenimiento, este plan nos va a ayudar a saber cada cuando necesitamos realizar mantenimiento tanto de software como de hardware, por ejemplo. El aprender a calcular esfuerzo de horas hombre también nos va a beneficiar para no tener derroche de recursos.

El hacer este análisis básico, nos va a ayudar a no cometer un error que pueda ser desastroso, a la hora de implementar una infraestructura de almacenamiento de datos.

Si deseas consultoría y asesoramiento para la implementación de tu almacén de datos, no dudes en contactarnos. Contamos con los mejores especialistas que podrán ayudarte a definir mejor tu infraestructura.

En la siguiente liga podrás consultar información adicional sobre Data Warehouse y Data Mart:

Introducción al Data Warehouse Parte I

Almacenes de datos. Data Warehouse vs Data Mart ¿Que son y cual es mejor?
Etiquetado en:                 
Abrir chat
¿Necesitas ayuda? Contáctanos