Hana y Hadoop - Dream Team para Big Data


Los usuarios de SAP que han tenido la oportunidad de trabajar con Hana suelen estar entusiasmados con las posibilidades y el increíble rendimiento. Preferirían almacenar todos los datos posibles en Hana y procesarlos directamente "en memoria".
Por desgracia, hay un inconveniente: cuanto más se utiliza Hana, más caro resulta y más recursos se necesitan. También hay una limitación general de Hana:
Aunque el almacenamiento de datos relacionales es ideal para los datos estructurados, resulta difícil con datos no estructurados como registros, feeds de redes sociales, documentos o imágenes. Sin embargo, es precisamente aquí donde Hadoop tiene sus puntos fuertes.
Una plataforma como Cloudera Enterprise permite el almacenamiento, procesamiento y análisis económico y flexible de big data, pero no tiene una funcionalidad y rendimiento comparables cuando aloja cargas de trabajo relacionales, como el procesamiento de transacciones en línea (OLTP) en una base de datos o almacén de datos.
Nada de esto es nuevo y, de hecho, muchas empresas operan ambas plataformas de forma paralela, separada y diferenciada, para aprovechar sus respectivos puntos fuertes.
Sin embargo, a menudo se pasa por alto que una arquitectura integrada de ambas soluciones puede combinar lo mejor de los dos mundos y, al mismo tiempo, compensar las desventajas.
Cloudera Enterprise es capaz de absorber grandes volúmenes de datos diversos y limitar el apetito de recursos de SAP Hana. Complementa de forma ideal a Hana en las siguientes áreas en particular:
- Volumen y diversidad de datos: los sistemas tradicionales de gestión de datos están llegando aquí a sus límites. Las empresas tienen que hacer concesiones debido a los costes y la complejidad técnica y decidir qué datos conservan y cuáles no. Además, los datos no estructurados son difíciles de modelar y almacenar. Cloudera Enterprise es ideal para proporcionar y almacenar todos los datos de una organización.
- Utilización de recursos: los procesos pueden externalizarse en una arquitectura integrada. Hana puede utilizar los recursos liberados para servir consultas y aplicaciones de la mejor manera posible. las cargas de trabajo ETL que requieren muchos recursos son las que se externalizan con más frecuencia, pero también es posible transferir consultas y análisis a Cloudera Enterprise, especialmente para volúmenes de datos muy grandes.
- Problemas de capacidad: puede resultar ventajoso externalizar datos de Hana, por ejemplo datos históricos o de escaso valor. Esto permite ejecutar análisis durante periodos de tiempo más largos sin tener que mantener todo el historial de datos en Hana. Una menor carga en los servidores de Hana se traduce automáticamente en menores costes.
- Recursos de análisis y consulta: En una arquitectura integrada, Hana puede gestionar el procesamiento rápido de datos estructurados y en línea, por ejemplo OLTP, almacenamiento de datos u OLAP (procesamiento analítico en línea).Cloudera Enterprise ofrece la opción adicional de procesar grandes volúmenes de datos no estructurados en línea y fuera de línea. Las organizaciones pueden sopesar por sí mismas qué distribución tiene más sentido desde el punto de vista del coste y el rendimiento.
En una arquitectura integrada, los costes pueden reducirse significativamente en comparación con una operación Hana pura. Las empresas pueden empezar con tareas sencillas, como la externalización de las cargas de trabajo ETL, y avanzar gradualmente hacia una plataforma de análisis combinada.
Además de externalizar procesos individuales, es posible incluso extraer datos de Hana y transferirlos a Cloudera Enterprise para su análisis. Esto puede ser útil para analizar datos de valor desconocido sin utilizar los costosos recursos de Hana, que así pueden emplearse para cargas de trabajo más importantes.
La conclusión es que está surgiendo un auténtico dream team: Las empresas no tienen que decidirse por una plataforma; combinadas, obtienen lo mejor de ambos mundos.