En lo que se refiere a los datos, estar a la vanguardia es un objetivo en constante movimiento. También hay muchas expectativas sobre “lo más avanzado” que no siempre están fundadas en la realidad. En Snowflake vemos el modo en que las empresas más vanguardistas trabajan con datos en nuestra plataforma. En nuestro informe inaugural de tendencias de datos examinamos el uso real de los datos por parte de esas empresas —en lugar de tan solo tratar la opinión de los líderes sobre sus operaciones de datos— y han surgido cuatro tendencias que redefinen el modo en que las empresas modernas alcanzan el éxito: 

1. Las empresas están conectando los datos en todos los sitios que pueden. Por el contrario, en cierto modo, conectar tus datos se va complicando a pesar de los años de conversaciones sobre acabar con los silos de datos. El número de aplicaciones de software como servicio (software as a service, SaaS) aumenta, cada una puede convertirse en un silo, y las empresas modernas tienen sus recursos de nube en varios proveedores. El número de organizaciones con datos en las tres nubes públicas principales creció un 207 % en el último año*. Al aumentar la complejidad de los datos se producen menos casos de uso de inteligencia artificial (IA) y aprendizaje automático (ML). Cada vez se necesita desarrollar más workloads de computación para el uso de estas herramientas avanzadas y, si no conectas todos tus datos a una fuente de datos única que lo abarque todo, te quedarás atrás.

2. Las empresas vanguardistas incorporan el trabajo a los datos y no al revés. Como muchas plataformas de datos, Snowflake aboga por almacenar todos tus datos en un único lugar. Solo eso ya genera desafíos si tienes que extraer y preparar conjuntos de datos individuales para cada tipo de trabajo que desees realizar. En nuestra plataforma, vemos que los usuarios adoptan el siguiente paso: realizar el trabajo importante con todos los datos juntos, en lugar de extraer y cargar los datos para cada aplicación nueva. Las empresas pueden hacer más por menos eliminando las pilas de infraestructura en silos. Las tareas que solían llevar a un equipo unas seis semanas se pueden hacer en pocos días. He aquí un ejemplo específico de Snowflake: nuestro CEO, Frank Slootman, me llamó un jueves. Quería una solución de IA generativa que facilitara la navegación por todos nuestros datos de ventas. Frank quería poder realizar cualquier tipo de pregunta en un lenguaje natural, sin código, y obtener una respuesta. En solo dos días, desarrollamos una aplicación con una interfaz sencilla con tecnología Streamlit que podía responder preguntas ejecutivas de alto nivel que un CEO podría querer revisar a diario. Este elemento de velocidad y autoservicio es un punto de inflexión.

3. La gobernanza es más importante. La gobernanza subyace en todas las tendencias de datos. Si tus datos se encuentran en cinco lugares diferentes, hay muchas probabilidades de que existan cinco políticas de gobernanza en conflicto. Los LLM (large language models) son el tema del momento y deberíamos encaminarnos hacia ellos, pero siempre de un modo que garantice que los datos están protegidos. Los LLM han demostrado recientemente que pueden aumentar la productividad tanto de los desarrolladores como los usuarios empresariales a través de modelos entrenados con los datos de Internet. Una gran oportunidad aguarda a las organizaciones para que mejoren los LLM con sus propios datos. Pero los LLM más avanzados están alojados en servidores externos, lo que conlleva el riesgo de exponer datos propios. Las organizaciones tienen que comenzar a definir una estrategia sobre cómo incorporar los LLM, tanto de código abierto como comerciales, a los datos y no al revés. Para conectar datos, trabajar donde se encuentran dichos datos y automatizar a escala, es crucial que la gobernanza sea constante. Lo ideal sería que una única plataforma con capacidades de gobernanza integrada fomentara la clasificación, el control de acceso basado en funciones (role-based access control, RBAC), el Object Tagging, la calidad de los datos y la observabilidad. En una entrada de blog anterior, My 2023 Predictions for Chief Data Officers, hice hincapié en que no es buena idea mantener el coste y la complejidad del uso de diversas herramientas. Este es el futuro: lo común será tener todo en un mismo lugar. 

4. Las empresas están adoptando la automatización y esperan una plataforma completamente gestionada. Una plataforma de datos totalmente gestionada no es solo necesaria para acceder a nueva información, sino también para actuar sin la demora de la revisión humana. Responder a un evento de seguridad o gestionar los recursos de nube con eficiencia en tiempo real son procedimientos de funcionamiento estándar en una empresa moderna. Con respecto al segundo ejemplo, el año pasado observamos un repunte significativo en los eventos de redimensionamiento de almacenes, el uso de la automatización que ayuda a los clientes a ser eficientes con recursos de nube inmensamente escalables. En Snowflake aplicamos este principio a las licencias de aplicaciones de software. Creamos una herramienta de gestión automatizada que revoca la licencia de software de un empleado si no ha usado la aplicación en un periodo de tiempo determinado. Durante el primer año de uso de la herramienta, ahorramos 5,5 millones de dólares en costes de SaaS innecesarios.

Implicaciones generales 

Estas tendencias apuntan a una imagen general: sin la unificación de los datos, estás limitando a tu empresa, tu información, tu potencial y la oportunidad de monetización. Cada empresa busca obtener valor de sus datos, ya sea creando un producto digital totalmente nuevo o improvisando una herramienta interna en un fin de semana largo. Todo el mundo quiere participar en la carrera hacia la IA generativa, pero no todo el mundo tiene los datos suficientes como para obtener información de calidad. Teniendo en cuenta estas cuatro tendencias en tu estrategia de datos, te pondrás a la cabeza de la carrera.

* Los datos del informe de tendencias de datos de 2023 abarcan el periodo de 12 meses hasta el 31 de enero de 2023 (denominado aquí “este año” o “el año”), para ir en línea con el año fiscal 2023 de Snowflake. Examinamos el uso de datos de unos 7800 clientes de Snowflake, algunos de ellos usuarios de Snowflake desde hace mucho tiempo y otros que se acaban de unir al Data Cloud. Ten en cuenta que la base de clientes de Snowflake creció un 31 % en el año fiscal 2023, lo que proporciona una referencia de comparación para las estadísticas que identifican tendencias que superaron este crecimiento general.