Híbrida, ágil y resistente: la gestión de datos SAP
Datos, almacenamiento y gestión de datos
La digitalización de los procesos requiere una arquitectura de datos y una infraestructura de almacenamiento de datos estables. "Una arquitectura de datos estable es absolutamente esencial", explica Glenn Fitzgerald, CDO Product Business en Fujitsu EMEA, al comienzo de la entrevista exclusiva de E-3. "Especialmente cuando tanto los datos de SAP Hana como los que no son de SAP deben estar disponibles en una plataforma universal para todos los requisitos empresariales. Aquí es donde el Servicio de Inspección del Sistema sería fundamentalmente útil." Dos puntos clave son cruciales para los usuarios: la protección de datos y la seguridad de los datos como parte de la seguridad general de TI. La solución utiliza métodos de inteligencia artificial como apoyo al análisis de datos para detectar anomalías. "En el caso concreto de la colaboración con nuestros socios, se definió e instaló una plataforma de TI correspondiente sobre la base de Kubernetes, Ceph Cluster, servidores Fujitsu Primergy y servidores NetApp NFS", afirma Glenn Fitzgerald, describiendo la simbiosis en la comunidad SAP.
“Intelligent Enterprise, que proporciona una visión holística de los datos de S/4 y ajenos a SAP.“
Glenn Fitzgerald, CDO, Fujitsu PBL Europa
El éxito de la transformación digital de una empresa depende sobre todo de lo bien o mal que gestione los datos. Al fin y al cabo, solo se puede avanzar con una estrategia de datos y análisis coherente. Por ello, muchas empresas están llevando a cabo cambios estructurales para convertirse en una empresa impulsada por los datos, es decir, para utilizar de forma coherente sus propias bases de datos con el fin de abrir nuevas oportunidades y posibilidades para sus procesos empresariales.
"En el curso de la transformación digital, los datos necesitan ser procesados, enriquecidos con información, consolidados y correlacionados", explica Thomas Herrmann, Manager Business Development SAP en NetApp para EMEA. En septiembre de este año, organizó una conferencia para clientes existentes de SAP con la participación de la propia SAP, Cisco, Fujitsu, Red Hat y Amazon/AWS. Se demostró la interacción entre los proveedores de TI complementarios para la gestión de datos en sistemas SAP. Naturalmente, uno de los puntos centrales fue el tema de la computación en nube, con especial énfasis en la nube híbrida y, en última instancia, el reto de la conversión de S/4.
“La avalancha de datos asociada a la digitalización exige la aplicación de un concepto de archivo.“
Thomas Herrmann, Director de Desarrollo de Negocio SAP, NetApp
Por ello, Thomas Herrmann explicó lógicamente en el evento Net-App: "La gestión de datos desempeña un papel decisivo e importante en todas las iniciativas de digitalización de la empresa. La gestión de datos es la suma de todas las medidas necesarias para recopilar, almacenar y proporcionar datos de esta forma. Una vez completada la digitalización, todos los procesos empresariales clave se basan en datos, que deben gestionarse de la forma más óptima posible para que puedan utilizarse de forma óptima." Su colega Robert Madl, de Cisco, añade: "La gestión de datos es sin duda un criterio importante para el éxito. La transformación digital en el contexto de SAP es, al fin y al cabo, la digitalización, optimización y automatización de los procesos empresariales."
Estructuras de datos
Actualmente, la gestión de datos se demanda en todas partes, como explica Robert Madl, responsable de Cisco: "Si, por ejemplo, automatizo procesos en la producción o la logística de almacén con el apoyo de sensores -palabra clave IoT-, se generan muchos datos nuevos que deben tratarse de forma muy diferente a los datos ERP tradicionales. Si, por ejemplo, las máquinas se controlan basándose en estos datos de sensores, es fundamental una transmisión fiable con la correspondiente baja latencia. Si los datos de los sensores se recopilan para el análisis de big data en conexión con los datos del sistema ERP, tampoco es problemático almacenar estos datos en una distribución híbrida en un lago de datos en la nube y mantener las bases de datos ERP on-prem o en un colocation. Sin embargo, tomar las decisiones de gestión de datos correctas en este caso es fundamental para el éxito de los proyectos de transformación digital."
“Es posible realizar arquitecturas de datos híbridas. El reto reside en las interdependencias entre los sistemas.“
Robert Madl, Ejecutivo Global de Socios Estratégicos, Cisco
En 2024, el 93% de las empresas alemanas utilizarán cada vez más sus datos para aumentar sus ventas. El 42% incluso considera que los datos son una fuente importante de ingresos. Así se desprende del nuevo estudio "The Multi-Cloud Maturity Index", realizado entre unos 3.000 responsables de la toma de decisiones empresariales y de TI de la región EMEA. "La última década ha demostrado que casi todo lo que nos rodea está impulsado por los datos. Es más, los datos se han convertido en un activo corporativo clave y, si se utilizan correctamente, pueden contribuir de forma significativa al éxito empresarial", subraya Glenn Fitzgerald, de Fujitsu, en el debate con el redactor jefe de E-3, Peter Färbinger. Y Fitzgerald añade: "Actualmente vivimos en un mundo con datos no estructurados, silos de datos, un crecimiento desorbitado de los datos y una creciente complejidad de los mismos. Esto hace que la gestión de estos datos sea aún más importante para el éxito de una empresa. ¿Hasta qué punto es sólida la estrategia de gestión de datos de una empresa para que pueda responder con rapidez a las demandas del mercado en todo momento?"
Empresa inteligente
La siguiente pregunta es crucial: ¿qué métodos y herramientas se necesitan para utilizar con éxito datos de cualquier tipo? Tecnologías como la inteligencia artificial y el aprendizaje automático ofrecen soluciones, afirma Glenn Fitzgerald, que explica: "Por un lado, la calidad de los datos puede mejorar significativamente y, por otro, los errores pueden reconocerse ya en la fase de recopilación de datos. A ello puede contribuir el registro automatizado mediante aprendizaje automático". Optimizar el suministro de los procesos empresariales con los datos mejor cualificados posibles -y en el momento oportuno- es crucial para el éxito de la empresa. Un objetivo primordial aquí es captar al cliente, reconocer su reto y ofrecerle una solución. Para ello existen numerosas técnicas, métodos y herramientas. Así es como apoyamos al cliente y desarrollamos juntos su empresa inteligente".
¿Cuáles son los criterios para el almacenamiento de datos en la empresa inteligente? El sistema ERP está in situ, por lo que ¿los datos también deberían estar in situ? ¿El sistema ERP está en la nube, por lo que los datos también deberían estar allí? ¿Es así? Thomas Herrmann: "No es tan fácil de responder, porque influyen varios factores: velocidad de la red, es decir, ancho de banda suficiente para la nube, ubicación, distancia a la red troncal más cercana. Acceso en tiempo real o procesamiento por lotes, es decir, ¿cuáles son mis SLA en términos de tiempos de respuesta, etc.? Cuando se trata del procesamiento de datos en tiempo real, los datos deben estar ubicados, por supuesto, donde se procesan, con Hana esto sería computación en memoria, si esto es en la nube o on-prem es entonces de importancia secundaria."
Y Robert Madl, de Cisco, añade: "Por supuesto, es posible realizar arquitecturas de datos híbridas. El reto reside en comprender las interdependencias entre sistemas. A menudo, los entornos SAP han crecido orgánicamente durante décadas y el código personalizado se implementa en todas partes, cuyos creadores puede que ya ni siquiera pertenezcan a la empresa. Por eso, a menudo existen dependencias entre sistemas. Por ejemplo, un sistema puede acceder directamente a la base de datos de otro, o realizar una llamada al otro sistema, que a su vez desencadena el acceso al nivel de datos. Aquí es importante saber qué sistemas dependen unos de otros y cómo, es decir, qué anchos de banda se necesitan y hasta qué punto es crítica para el tiempo esta comunicación, es decir, qué latencias máximas son admisibles para que los datos necesarios estén disponibles a tiempo y en su totalidad".
Procesos y algoritmos
En última instancia, se trata de garantizar que el proceso empresarial que se asigna a los sistemas SAP -independientemente de dónde se estén ejecutando- funcione con un alto rendimiento. "Cuando se distribuyen sistemas SAP en varios sitios, simplemente hay que ser consciente de que existen latencias más altas y un ancho de banda más bajo entre los sitios y tenerlo en cuenta a la hora de planificar una migración. AppDynamics puede ser extremadamente útil en este caso, ya que analiza y visualiza automáticamente estas dependencias entre sistemas y las pone a disposición para la planificación", explica Robert Madl en el debate.
¿Qué opina el responsable de Cisco sobre la optimización del almacenamiento de datos? "Depende del tipo de datos y de cómo se utilicen. Con bases de datos como SAP Hana, tiene sentido tener los datos cerca de los recursos informáticos", explica Robert Madl. "Aunque Hana es una base de datos en memoria -lo que significa que los datos se almacenan en la memoria principal del servidor-, esto solo ayuda con las transacciones de lectura. Las transacciones de escritura sólo se confirman una vez que los datos se han escrito en el llamado nivel de persistencia, es decir, el sistema de almacenamiento de datos. Por lo tanto, para el rendimiento de la aplicación es fundamental disponer de un IO rápido entre el servidor y el almacenamiento".
Bases de datos en memoria
Las aplicaciones OLTP han experimentado el mayor aumento de rendimiento con la introducción de la memoria flash. En los escenarios analíticos (típicamente OLAP), el impacto en el rendimiento en tiempo de ejecución sería menor gracias a la tecnología en memoria, ya que los datos ya están almacenados; sin embargo, se tardaría mucho tiempo en arrancar estos sistemas si los datos no se pueden cargar desde un almacén de datos local a la memoria de trabajo. El almacenamiento descentralizado de datos puede tener mucho sentido para los análisis de big data, afirma Robert Madl y explica: "Si se dispone de varios lagos de datos basados en Hadoop cerca de la fuente de datos o de los sensores, por ejemplo, se puede utilizar el algoritmo MapReduce para preagrupar iterativamente los datos para su análisis de forma descentralizada y luego sólo transferir la información necesaria a un sistema central para su posterior procesamiento."
¿Cuáles son las ventajas e inconvenientes de la gestión híbrida de datos? Robert Madl: "Hay que optimizar los tres factores: tiempo, coste y complejidad. El lugar donde se crean los datos no tiene por qué ser necesariamente el lugar donde se utilizan. Transferir datos a grandes distancias genera costes y lleva tiempo. Sin embargo, tener muchas ubicaciones de almacenamiento de datos diferentes aumenta la complejidad. A menudo resulta ser una estrategia sensata en los proyectos de transformación digital definir unos requisitos mínimos para el factor tiempo, un marco máximo para los costes y, a continuación, optimizar primero en la dirección de la complejidad. En un proyecto de fábrica inteligente, por ejemplo, el factor tiempo suele dictar cuánta computación de borde se necesita, los costes de transmisión dictan hasta qué punto hay que preagregar los datos de los sensores y la complejidad es, en última instancia, el factor decisivo para la viabilidad y el éxito general."
S/4 y conversión de datos
La gestión y el almacenamiento de datos se convierten en un factor de éxito y de coste en la conversión a S/4. ¿Cómo se garantiza un alto nivel de éxito y bajos costes de datos para los clientes SAP existentes? "Junto con nuestro cliente, creamos una auténtica Empresa Inteligente en la que se consigue una visión holística de SAP S/4 Hana y de los datos que no son de SAP", afirma Glenn Fitzgerald, responsable de Fujitsu, al describir el reto. Cómo se gestionan y almacenan los datos en detalle depende de los propios procesos de negocio de la empresa. "Aquí es donde Fujitsu apoya a sus clientes con el llamado enfoque de co-creación. Se trata esencialmente de un taller basado en las especificaciones del Fujitsu Human Centric Experience Design. Trabajamos en estrecha colaboración con los clientes, los socios tecnológicos y nuestros expertos para desarrollar un enfoque óptimo, acompañado de una prueba de concepto y un plan a largo plazo para superar los retos específicos y optimizar continuamente las TI", afirma Glenn Fitzgerald, que ha trabajado en muchos proyectos de éxito.
Inundación de datos y digitalización
El volumen de datos de los actuales clientes de SAP seguirá creciendo, y con él los costes de la gestión de datos. "La avalancha de datos asociada a la digitalización requiere la implantación de un concepto de archivado", explica Thomas Herrmann, responsable de NetApp, al término del debate E-3. "El primer paso es determinar qué datos deben archivarse en cumplimiento de la ley, qué datos deben archivarse y qué datos deben almacenarse durante un periodo de tiempo determinado. El archivado de datos moderno utiliza la nube. Todos los grandes proveedores de nubes ofrecen un nivel de archivado para el almacenamiento de objetos.
Estos niveles se están convirtiendo cada vez más en el destino preferido para los datos de backup con requisitos de retención a largo plazo. Esto incluye las principales ofertas de archivado de AWS, Azure y GCP. Las soluciones de archivado en cloud son los niveles de almacenamiento de objetos más rentables disponibles en la actualidad y pueden escalar a petabytes de almacenamiento si es necesario a medida que aumenta el tamaño de los datos archivados. NetApp Cloud Backup, por ejemplo, proporciona un servicio integral para la protección a largo plazo de sus datos en entornos heterogéneos, ya sea en cloud, on-prem o en una combinación híbrida de estas plataformas. NetApp Cloud Backup admite los niveles de almacenamiento de archivado de los proveedores de cloud mencionados anteriormente como destinos para sus datos de archivado y backup a largo plazo."
Datos y cargas de trabajo
Robert Madl, director de Cisco, tiene otro consejo para los clientes actuales de SAP: "Las cargas de trabajo de SAP no suelen vivir en el vacío. Por lo tanto, una infraestructura óptima para SAP Hana no solo debería ser óptima para Hana en sí, sino también para todas las demás cargas de trabajo, de modo que no tenga que crear un silo de gestión adicional en TI para esta única carga de trabajo". Existen alrededor de 200 arquitecturas de referencia para Cisco Flexpod sobre cómo operar de forma fiable cargas de trabajo en él, no sólo cargas de trabajo SAP como Hana, sino también servicios web, por ejemplo, que a menudo forman parte del proceso de negocio mapeado que es soportado por el sistema SAP. Con Flexpod XCS, ahora existe una versión optimizada para múltiples nubes de Flexpod que amplía precisamente estas arquitecturas de referencia para incluir escenarios en los que los servicios pueden externalizarse y conectarse a la nube sin esfuerzo administrativo adicional."