Motor vectorial como potenciador de la IA
Al comienzo del evento TechEd 2023, el director de tecnología de SAP, Jürgen Müller, explicó que estaba encantado de anunciar una mejora importante, si no la más significativa, para la plataforma de base de datos Hana: la capacidad de utilizar vectores como objetos en la plataforma de base de datos, una sensación de Hana más allá de los modelos lingüísticos grandes (LLM), que simplemente utilizan algoritmos de aprendizaje profundo para resumir y organizar grandes cantidades de datos.
El argumento de Jürgen Müller en el TechEd 2023 en Bangalore no era incorrecto. Los grandes modelos lingüísticos normalmente sólo pueden captar el pasado. Se entrenan utilizando datos existentes, normalmente extraídos de Internet. Una respuesta inmediata en tiempo real basada en datos operativos es difícil de lograr. Sin embargo, la base de datos Hana de SAP ha producido resultados en tiempo real durante muchos años, ¡y ahora con vectores!
LLM, vectores y tejido de datos
SAP ha aclarado y ampliado el anuncio realizado en TechEd 2023 a principios de este año. Las nuevas funciones de la solución SAP Datasphere, incluida la IA generativa, deberían permitir optimizar la planeación corporativa mediante paisajes de datos simplificados y un trabajo intuitivo con los datos. "Capturar datos tecnológicamente y respaldar así las decisiones es cada vez más importante. Al mismo tiempo, la IA, que se basa en datos de alta calidad, está revolucionando todos los aspectos de una empresa", afirma Jürgen Müller, director de tecnología y miembro de la junta directiva de SAP. "Nuestras últimas innovaciones en SAP Datasphere y la ampliación de la colaboración con Collibra son un paso crucial para permitir a los clientes impulsar su transformación empresarial inteligente a través de los datos."
En el centro de los últimos anuncios se encuentra un tejido de datos para la gestión de los datos empresariales. El tejido de datos, tal como lo definen los analistas de Gartner, es una arquitectura que garantiza que los datos no sólo se utilicen como recurso, sino que también constituyan la base fundamental de las iniciativas estratégicas. Con las innovaciones y la asociación anunciadas, las organizaciones pueden ofrecer datos significativos a los usuarios de datos, manteniendo al mismo tiempo el contexto y la lógica empresariales.
El objetivo a largo plazo de Thomas Failer, socio de SAP y CEO de Data Migration International, es: "Queremos ser el proveedor líder de gestión inteligente de datos y de un tejido de datos inteligente para todas las empresas en 2027 con la ayuda de la IA. Hemos definido hitos a lo largo del camino". Las funciones ampliadas en el ámbito de la gestión de la retención, es decir, la recuperación de datos personales y la generación de objetos empresariales con ayuda de la IA, deberían estar disponibles para los clientes en la primavera de 2024 con la versión 11 de la plataforma DMI para la gestión de la información, JiVS IMP. El mercado del tejido de datos es actualmente muy competitivo: "Hemos decidido utilizar SAP Datasphere para una arquitectura moderna de tejido de datos empresariales junto con nuestro entorno S/4 Hana. Esto nos permite establecer eficazmente una plataforma de análisis de datos moderna que permite la capacidad de autoservicio empresarial basada en datos y modelos de datos de confianza", afirma Achim Welter, director sénior de ERP, digital y estrategia de TI en la empresa Hershey's.
Distancia euclidiana
Con Datasphere, los clientes de SAP pueden simplificar sus entornos de datos con una visión integral de los mismos. Esto les permite adaptarse a los cambios del mercado más rápidamente y tomar mejores decisiones. Desde el nuevo asistente de IA y las capacidades de bases de datos vectoriales que garantizan la conservación del contexto empresarial en los resultados generativos de IA, hasta el nuevo gráfico de conocimiento que permite comprender datos complejos y reconocer patrones, las innovaciones de SAP garantizan que los clientes puedan sacar el máximo partido de sus datos.
La distancia euclidiana de los vectores multidimensionales puede utilizarse de forma excelente para agrupar objetos, como también señaló el director de tecnología de SAP, Jürgen Müller, en su declaración a la prensa desde Bangalore, India, donde tuvo lugar el SAP Tech-Ed 2023. La base de datos Hana ahora también es capaz de calcular la distancia euclidiana y, por tanto, puede encontrar similitudes en grandes cantidades de datos.
El nuevo Knowledge Graph en SAP Datasphere y Hana le ofrece a las empresas la oportunidad de descubrir perspectivas y patrones ocultos en sus aplicaciones y sistemas. Esto permite tanto a los usuarios técnicos como a los empresariales comprender mejor las relaciones entre datos, metadatos y procesos empresariales, mejorando la eficacia del aprendizaje automático y de los modelos lingüísticos grandes. La agrupación, es decir, la búsqueda de similitudes, puede crear a menudo momentos muy esclarecedores para grandes cantidades de datos. El truco se basa en el cálculo de la distancia euclidiana y también puede realizarse sin Hana como un simple cálculo mental. Según el director de tecnología de SAP, Jürgen Müller, la supuesta sensación de Hana y Datasphere es ahora la posibilidad de utilizar vectores como objetos en la plataforma de base de datos. En las matemáticas euclidianas tradicionales, los vectores no son realmente una sensación nueva o emocionante. Con las herramientas informáticas existentes de la plataforma de base de datos Hana, cualquier estudiante de informática de primer semestre puede implementar unas cuantas funciones vectoriales sencillas.
¿Qué es un vector? En un sistema de coordenadas con un eje x y un eje y, se pueden elegir dos puntos cualesquiera. Si estos puntos se conectan mediante la línea recta más corta posible y se añade una flecha al final, y entonces tenemos ante nosotros sobre el papel un gráfico dirigido o un vector en el espacio bidimensional. También es fácil imaginar un vector en un espacio tridimensional (ejes x, y y z), por ejemplo, un lápiz sobre una mesa. El extremo y la punta del lápiz pueden determinarse con precisión como puntos en el espacio. Por tanto, el lápiz sería el vector. Ahora pasamos a dimensiones superiores, difíciles de visualizar (un cubo de cuatro dimensiones tendría una sombra tridimensional, por ejemplo), pero sigue siendo fácil calcular con dimensiones superiores. Joule, el asistente de SAP basado en inteligencia artificial generativa, ya está disponible en la solución SAP Analytics Cloud para la creación y el desarrollo automatizados de informes, cuadros de mando, planes, etc. Las funciones del motor vectorial de la nube Hana combinan la potencia de los modelos lingüísticos grandes con los datos relevantes de la empresa y garantizan que el contexto empresarial se mantenga en los resultados de la IA generativa.
Motor vectorial de Hana Cloud
Lo que el director de tecnología de SAP, Jürgen Müller, presentó en Bangalore en TechEd 2023 tiene una gran importancia práctica. Muchos clientes de Hana apreciarán enormemente la ampliación del lenguaje a dimensiones superiores. Sin embargo, la matemática presentada es bastante tradicional y familiar. Presentar la distancia euclidiana como un hito en el desarrollo de Hana es extraño, pero para los clientes de SAP, las funciones del motor vectorial de SAP Hana Cloud son un paso importante hacia la IA generativa empresarial.
Estas distancias euclidianas de los gráficos del motor vectorial pueden utilizarse como medidas de similitud para la agrupación. Con ellas se pueden crear excelentes mapas cuyas áreas (clusters) proporcionan información directa sobre preferencias, similitudes y tendencias. Hace unos diez años, la editorial E3 y el profesor Alfred Taudes, de la Universidad de Economía y Administración de Empresas de Viena, crearon un mapa Hana de este tipo basándose en una encuesta realizada en la comunidad SAP.