Rester à la pointe en matière de données nécessite de s’adapter constamment. D’ailleurs, si cet objectif suscite un fort engouement, il n’est pas toujours étayé par des faits. Snowflake sait comment les entreprises à la pointe de la technologie utilisent réellement les données sur sa plateforme. Dans notre rapport inaugural sur les dernières tendances en matière de données, nous étudions comment ces entreprises utilisent réellement les données, sans s’arrêter au seul ressenti des dirigeants dans ce domaine. Ainsi, nous avons pu dégager quatre tendances qui redéfinissent les conditions de la réussite pour les entreprises modernes : 

1. Les entreprises interconnectent toutes les données possibles. Paradoxalement, il devient d’une certaine façon de plus en plus difficile d’interconnecter les données, malgré des années de débat sur l’élimination des silos. En effet, le nombre d’applications SaaS ne cesse d’augmenter, or chacune représente une source de silos potentiels. En outre, les entreprises modernes répartissent leurs ressources sur le cloud entre différents fournisseurs. Ainsi, le nombre d’entreprises ayant des données disséminées entre les trois principaux clouds publics a bondi de 207 % sur l’année*. Par ailleurs, la complexité croissante des données retarde le développement des cas d’usage de l’IA et du ML. De plus en plus de workloads de calcul doivent être créés pour ces outils avancés. Enfin, si toutes vos données ne sont pas connectées à une source de données unique et exhaustive, vous finirez inévitablement par vous retrouver à la traîne.

2. Les entreprises à la pointe de la technologie rapprochent leur travail des données, et non l’inverse. Comme beaucoup de plateformes de données, Snowflake recommande de stocker toutes les données au même endroit. Pourtant, le défi est de taille si vous devez récupérer et préparer des ensembles de données distincts pour chaque type de tâche à effectuer. Sur notre plateforme, nous voyons certains de nos utilisateurs passer au niveau supérieur en utilisant efficacement toutes ces données réunies, sans les extraire pour les charger sur chaque nouvelle application. Ainsi, ces entreprises parviennent à optimiser leurs processus, en éliminant les piles d’infrastructure silotées. Les tâches qui pouvaient autrefois nécessiter jusqu’à six semaines ne leur prennent plus que quelques jours. Nous pouvons citer un exemple propre à Snowflake : notre PDG, Frank Slootman, m’a appelé un jeudi. Il voulait une solution d’IA générative qui permettrait de consulter facilement nos données commerciales. Frank voulait pouvoir poser n’importe quelle question dans ce domaine dans une langue naturelle, sans code, pour obtenir une réponse. En deux jours seulement, nous avons développé une application avec une interface simple basée sur Streamlit, capable de répondre aux questions qu’un haut dirigeant comme un PDG pourrait se poser au quotidien. Cette vitesse et cette possibilité de libre-service changent vraiment la donne.

3. La gouvernance compte de plus en plus. La gouvernance sous-tend les différentes tendances en matière de données. Si vos données sont hébergées à cinq endroits différents, vous vous trouverez sans doute face à cinq politiques de gouvernance en conflit. Les LLM sont la grande tendance du moment, mais il convient comme toujours de veiller à la protection des données. Les LLM ont récemment prouvé qu’ils permettaient aux développeurs comme aux utilisateurs professionnels d’améliorer leur productivité, grâce à des modèles formés à l’aide de données issues d’Internet. Les entreprises disposent donc d’une formidable occasion d’améliorer les LLM avec leurs propres données. Cependant, les LLM les plus avancés sont hébergés sur des services externes, d’où un risque d’exposition de données propriétaires. Par conséquent, les entreprises doivent commencer à définir une stratégie pour faire venir les LLM, à la fois open-source et commerciaux, jusqu’à leurs données, et non l’inverse. Pour connecter les données, les utiliser là où elles se trouvent et les automatiser à grande échelle, il est indispensable d’assurer une gouvernance cohérente. Idéalement, une plateforme unique dotée de capacités de gouvernance intégrées doit régir la classification, le contrôle d’accès basé sur des rôles, l’Object Tagging, la qualité des données et l’observabilité. Dans un précédent article de blog, intitulé My 2023 Predictions for Chief Data Officers (Mes prédictions pour les Chief Data Officers en 2023), j’ai souligné à quel point il était malavisé de supporter les coûts et la complexité liés à l’utilisation de différents outils. À l’avenir, tout devra être regroupé au même endroit. 

4. Les entreprises apprécient l’automatisation et exigent une plateforme entièrement gérée. Une plateforme de données entièrement gérée est nécessaire, non seulement pour accéder à de nouvelles informations, mais également pour prendre des mesures sans avoir à attendre une intervention humaine. Ainsi, une gestion efficace en temps réel des incidents de sécurité ou des ressources dans le cloud est désormais la norme dans les entreprises modernes. Dans le cas de la gestion des ressources, nous avons constaté au cours de l’année passée une nette hausse des événements de redimensionnement automatique des entrepôts. De fait, l’automatisation aide les clients à gagner en efficacité grâce à la modularité des ressources dans le cloud. Snowflake a appliqué ce principe aux licences d’applications logicielles. En effet, nous avons créé un outil de gestion automatique qui révoque la licence d’un collaborateur qui n’a pas utilisé l’application concernée depuis un laps de temps défini. Au cours de la première année où nous avons utilisé cet outil, nous avons pu économiser 5,5 millions de dollars de dépenses SaaS inutiles.

Les implications à plus grande échelle 

Ces tendances s’inscrivent dans une réalité plus globale : l’absence d’unification des données limite l’entreprise, les informations, le potentiel et les possibilités de monétisation. Chaque entreprise cherche à tirer une valeur ajoutée de ses données, que ce soit en créant un nouveau produit numérique ou en améliorant rapidement un outil interne pendant un week-end prolongé. Tout le monde veut participer à la course à l’IA générative, mais tous n’ont pas suffisamment de données pour obtenir des informations de qualité. En tenant compte de ces quatre tendances dans votre stratégie en matière de données, vous vous assurez une bonne place dans cette course.

*Les données de ce rapport sur les tendances en matière de données en 2023 couvrent une période de 12 mois allant jusqu’au 31 janvier 2023 (« cette année » ou « l’année »), en accord avec l’exercice fiscal 2023 de Snowflake. Nous avons étudié l’utilisation des données d’environ 7 800 clients de Snowflake, certains clients de longue date, d’autres ayant rejoint récemment le Data Cloud. Remarque : la clientèle de Snowflake a bondi de 31 % au cours de l’exercice fiscal 2023, ce qui fournit une base de comparaison statistique pour identifier les tendances au-delà de cette croissance globale.