Cómo obtener ROI con la IA generativa: Todo empieza con tu estrategia de datos

Las empresas pioneras en inteligencia artificial (IA) generativa han dejado claro que una estrategia de datos sólida es la piedra angular de cualquier iniciativa eficaz de IA. Para aprovechar realmente el potencial de la IA como multiplicador de valor y catalizador de experiencias de cliente rediseñadas, es indispensable disponer de una plataforma de datos fácil de usar y fiable.
En el informe “El excepcional ROI de la IA generativa”, publicado recientemente, demostramos que la IA generativa es un motor de beneficios: más de nueve de cada diez encuestados afirman que su inversión en IA generativa es rentable. Los encuestados que cuantificaron el retorno de la inversión (return on investment, ROI) de sus iniciativas de IA generativa observaron un ROI medio del 41 %. Para aprovechar todo el potencial de la IA generativa, es necesario contar con una estrategia de datos unificada y sólida. El 88 % de los pioneros en adoptarla afirma que necesita estrategias de datos y herramientas que abarquen todos los casos de uso de la IA generativa, lo que significa que las empresas necesitan una plataforma de datos moderna, fácil de crear e implementar, fiable en su diseño y conectada sin problemas entre equipos, herramientas y nubes.
El 96 % de los pioneros en IA generativa afirma que está entrenando, ajustando o enriqueciendo sus large language models (LLM) comerciales y de código abierto, y el 80 % ajusta modelos con sus datos propios. Estas medidas esenciales plantean algunos desafíos reales. Nos referimos a posibles quebraderos de cabeza en torno a la calidad de los datos, la cantidad de datos que pueden gestionar los sistemas, el riesgo de que se amplifiquen los sesgos y las preocupaciones sobre la privacidad —como la posible filtración de información empresarial propia o datos personales de los clientes— en los resultados.
Por eso, el enfoque de una organización con respecto a la IA generativa debe basarse en una plataforma de datos sólida para minimizar esos riesgos, reducir los costes sorpresa y facilitar la adopción de las herramientas adecuadas, el escalado y la réplica de los éxitos de la IA, así como asegurarse de que todos los datos de una organización se utilizan de forma segura y adecuada.
Es fácil perderse en su mera escala: el 71 % de las organizaciones descubrió que un enriquecimiento eficaz de los modelos requiere varios terabytes de datos o varios millones de documentos. Sin embargo, la magnitud los datos no es el único problema: las empresas pioneras en IA generativa mencionan la calidad (45 %) y la cantidad (38 %) de los datos, entre otras cuestiones. Por lo tanto, la higiene de los datos y la forma en que se gestionan se convierten en una prioridad obligatoria para la IA.
Para añadir complejidad, la gran mayoría de los datos de cualquier empresa son datos no estructurados, como archivos PDF, vídeos e imágenes. Por ello, para capitalizar el potencial de la IA, se necesita una plataforma que admita datos estructurados y no estructurados sin comprometer la precisión, la calidad y la gobernanza. Solo el 11 % de las empresas pioneras afirma que más de la mitad de sus datos no estructurados están listos para usarse en el entrenamiento y ajuste de LLM. Incluso estas pioneras, que reportan un gran éxito general, se han enfrentado a algunos inconvenientes con sus plataformas de datos. A nivel de plataforma de datos, descubrimos:
El 55 % de las organizaciones se ven obstaculizadas por tareas de gestión de datos que requieren mucho tiempo, como el etiquetado.
El 52 % tiene dificultades con la calidad de los datos, lo que incluye problemas de error, sesgos, irrelevancia y disponibilidad.
El 51 % afirma que la preparación de los datos es demasiado complicada.
El 50 % menciona problemas con la confidencialidad de los datos.
El 42 % afirma carecer del rango o la diversidad de datos necesarios.
Todos estos desafíos se abordan con mayor eficacia en una plataforma de datos unificada. Llevar la tecnología de IA a una base para los datos sencilla, fiable y conectada reduce los desafíos que pueden retrasar un proyecto o derivar en costes inesperados.
La IA generativa y la plataforma de datos basada en la nube van de la mano
La mayoría de las empresas pioneras en IA generativa dependen de plataformas de datos basadas en la nube. Además, el 81 % de esas empresas pioneras afirma que está incrementando considerablemente sus inversiones en soluciones de almacenamiento de datos basadas en la nube en los próximos 12 meses. No es ninguna sorpresa. La nube ofrece una mayor escalabilidad, control de costes y gobernanza, así como acceso al procesamiento de alto rendimiento necesario para las iniciativas de IA generativa.
Cuando se les preguntó qué buscaban de un almacén de datos basado en la nube, las empresas pioneras señalaron en gran medida tres características clave:
Seguridad: El 46 % la considera crítica y el otro 38 % afirma que es importante.
Funcionalidad de IA avanzada: El 39 % cree que es crítica, y el otro 45 % cree que es importante contar con capacidades de LLM y aprendizaje automático (machine learning, ML).
Capacidades analíticas integradas: El 39 % las califica de críticas y un 45 % adicional dice que son importantes.
La plataforma de Snowflake aborda todas las necesidades fundamentales de una estrategia de IA eficaz, que depende de una plataforma de datos moderna, gobernada y segura. Para proteger las aplicaciones de IA emergentes, como los chatbots y análisis de sentimientos, las empresas basadas en datos deben implementar un acceso controlado y protección durante toda la transformación de los datos (capa de plata), lo que incluye todo el ciclo de vida de seguridad, que comprende lo siguiente:
clasificación automática de conjuntos de datos confidenciales y descripciones automáticas de objetos para comprender los datos
supervisión continua y aplicación automática de políticas mediante políticas de acceso basadas en etiquetas y auditorías de acceso y gráficos de linaje completos
mantenimiento continuo de la calidad de los datos a escala
Además de estas capacidades de gobernanza listas para usar, hemos integrado una amplia gama de LLM y capacidades generales de ML directamente en la plataforma, lo que elimina el movimiento complejo de datos y la necesidad de gestionar la infraestructura. Como está integrada de forma nativa en la plataforma, este enfoque preserva los estrictos límites de seguridad de las organizaciones y les permite aplicar y hacer cumplir políticas de gobernanza y acceso uniformes en todas las aplicaciones de datos.
La IA generativa no es otra tecnología aislada del resto de la pila de datos moderna. Es una iniciativa transformadora de gran calado que se extenderá por toda la organización basada en datos. En la carrera hacia el éxito de la IA, estas organizaciones necesitan una plataforma de datos subyacente que les permita escalar rápidamente la nueva generación de aplicaciones basadas en IA con sencillez, al tiempo que las crean e implementan de una manera segura y conforme a las normativas.
Para comprender cómo las organizaciones de todo el mundo están superando los desafíos de implementar la IA generativa y obteniendo una rentabilidad significativa de sus inversiones, lee “El excepcional ROI de la IA generativa”.