Data LakeHouse
En la mayoría de las grandes empresas, de acuerdo con lo que he observado, el DWH está por un lado y los Data Lakes por otro. Ambos muy importantes y se usan dependiendo de los requisitos de información. Algunas empresas separan el caso de uso relacionado con la ciencia de datos, del caso de uso de BI y lo más común es, que para los primeros el repositorio es un Data Lake y para los segundos es un Data Warehouse. Hasta ahí todo está claro, pero la tendencia que se manifiesta es que los dos mundos tienden a unirse y por eso se habla de los DWH modernos que contienen datos relacionales y datos no relacionales.
Después de lo dicho en el párrafo anterior, el concepto que quiero mostrarles es el DATA LAKEHOUSE. En el libro de Shiyal, Bhadresh. Beginning Azure Synapse Analytics dice:
“En los últimos años, ha surgido una tendencia en la que existe una necesidad creciente de combinar capacidades de Data Warehouse con capacidades de los Data Lakes. Se trata de conceptos diferentes, pero, debido a las necesidades del mercado, actualmente los DWH y los Data Lakes están en convergencia. Hay inmensos beneficios para el panorama de datos que esta convergencia está aportando”.
Data Lakehouse, es un concepto relativamente nuevo y sugiere un gran cambio de paradigma del antiguo proceso, que considera que las Bodegas de Datos y los Data Lakes se construyen en repositorios separados. Un Data Lakehouse es una combinación de los mejores componentes tanto del DL como del DWH. Implementa la estructura de datos y las funciones de gestión de datos de los almacenes de datos en un almacenamiento rentable de un Data Lake. Intenta combinar lo mejor de ambos mundos: análisis de Big Data basado en lago de datos y un almacén de datos. Este es un campo emergente, y se están produciendo innovaciones continuas.
En el mundo de los datos ocurren actualizaciones frecuentes de todos los conceptos, terminologías, herramientas y tecnologías. En varios años el panorama de los datos ha evolucionado de un Data Warehouse a un Data Lake y a un Data Lakehouse.
Ref.:
Shiyal, Bhadresh. Beginning Azure Synapse Analytics. Apress. Edición de Kindle.