Nel campo dei dati, lo “stato dell’arte” è come un bersaglio mobile. E l’entusiasmo per le ultime innovazioni non è sempre giustificato dalla realtà dei fatti. Noi di Snowflake siamo in grado di vedere come le aziende più all’avanguardia lavorano con i dati sulla nostra piattaforma. Nel nostro primo report sui trend dei dati abbiamo esaminato qual è l’utilizzo effettivo dei dati da parte di queste aziende, anziché limitarci a riportare l’opinione dei dirigenti, e abbiamo identificato i quattro trend che stanno tracciando la nuova strada verso il successo per le aziende moderne. 

1. Le aziende connettono i dati ovunque possibile. Per contro, in un certo senso diventa sempre più difficile connettere i dati, nonostante si parli da anni di abbattere i silos. Aumenta il numero di applicazioni SaaS, ciascuna delle quali è un potenziale silo, e le aziende moderne disperdono le loro risorse cloud tra più provider. Il numero di organizzazioni che archiviano dati su tutti e tre i principali cloud pubblici è cresciuto del 207% nel corso dell’anno*. La crescente complessità dei dati ostacola l’adozione di nuovi casi d’uso AI/ML. Questi strumenti avanzati richiedono un numero sempre maggiore di workload computazionali e le aziende che non connettono tutti i propri dati a un’unica fonte universale perdono inevitabilmente terreno.

2. Le aziende all’avanguardia portano il lavoro dove si trovano i dati e non viceversa. Come molte piattaforme dati, Snowflake promuove l’archiviazione di tutti i dati in un unico posto. Ma anche questo comporta difficoltà quando si devono estrarre e preparare data set separati per ogni tipo di lavoro. Sulla nostra piattaforma, vediamo che gli utenti sono già passati alla fase successiva: lavorare in modo utile con tutti quei dati riuniti, invece di estrarre e caricare i dati in ogni nuova applicazione. Eliminando gli stack di infrastrutture in silos, le aziende sono in grado di fare di più con meno risorse. Task che prima richiedevano più di sei settimane di lavoro possono essere completati in pochi giorni. Cito a questo proposito un esempio che riguarda Snowflake. Il nostro CEO, Frank Slootman, mi ha chiamato un giovedì perché voleva una soluzione di AI generativa che consentisse di orientarsi più facilmente tra tutti i nostri dati sulle vendite. Frank voleva essere in grado di formulare qualsiasi domanda sulle vendite usando un linguaggio naturale, non di programmazione, e ricevere la risposta. In soli due giorni abbiamo sviluppato un’app con una semplice interfaccia basata su Streamlit in grado di generare le risposte alle potenziali domande quotidiane sulle vendite di un alto dirigente come un CEO. Questa velocità e questa autonomia sono rivoluzionarie.

3. La governance è ancora più importante. Ciascun trend dei dati è in qualche modo legato alla governance. Se i dati di un’azienda risiedono in cinque località diverse, probabilmente ci saranno cinque criteri di governance contraddittori. I modelli linguistici di grandi dimensioni (LLM) sono l’argomento del momento e non possiamo ignorarli, ma come sempre dobbiamo proteggere i dati. Di recente i LLM si sono dimostrati capaci di rendere più produttivi sia gli sviluppatori che gli utenti aziendali tramite modelli addestrati con i dati di internet. Le aziende hanno la grande opportunità di migliorare questi grandi modelli con i propri dati, ma i LLM più avanzati risiedono su servizi esterni e comportano quindi il rischio di esporre dati proprietari. Le organizzazioni devono iniziare a definire una strategia per portare i LLM, sia open source che commerciali, dove si trovano i dati e non viceversa. Per connettere i dati, lavorare dove risiedono i dati e automatizzare su scala è indispensabile una governance uniforme. La situazione ideale è un’unica piattaforma con funzionalità di governance integrate che abiliti la classificazione, il controllo degli accessi basato sui ruoli, l’object tagging, la qualità dei dati e l’osservabilità. In un articolo precedente, My 2023 Predictions for Chief Data Officers, ho sottolineato quanto sia sconsigliabile, per ragioni di costo e di complessità, continuare a utilizzare strumenti eterogenei. Nel futuro prossimo sarà normale avere tutto nello stesso posto. 

4. Le aziende adottano l’automazione e vogliono una piattaforma completamente gestita. Una piattaforma dati completamente gestita è necessaria non solo per accedere a nuovi insight, ma anche per agire senza il ritardo causato dalla revisione umana. Rispondere a un evento di sicurezza o gestire le risorse cloud con efficienza e in tempo reale sono procedure operative standard in un’azienda moderna. Per quanto riguarda il secondo caso, l’anno scorso abbiamo rilevato un notevole aumento degli eventi di ridimensionamento automatico dei data warehouse, un uso dell’automazione che consente di migliorare l’efficienza dei clienti sfruttando risorse cloud infinitamente scalabili. Noi di Snowflake abbiamo applicato questo principio alle licenze per le applicazioni software. Abbiamo creato uno strumento di gestione automatica che revoca la licenza software di un dipendente se non usa l’applicazione per un determinato periodo di tempo. Nel primo anno di utilizzo, questo strumento ci ha permesso di risparmiare 5,5 milioni di dollari grazie all’eliminazione dei costi SaaS superflui.

Le implicazioni più ampie 

Questi trend tracciano un quadro più vasto: le organizzazioni che non unificano i dati pongono limiti all’azienda, agli insight, alle potenzialità e alle opportunità di monetizzazione. Ogni azienda cerca di ottenere valore dai suoi dati, che si tratti di creare un prodotto digitale completamente nuovo o di realizzare uno strumento per uso interno nel giro di un fine settimana. Tutti vogliono essere in corsa per l’AI generativa, ma non tutti dispongono di una quantità di dati sufficiente per ottenere insight di qualità. Tener conto di questi quattro trend nella propria strategia legata ai dati significa prepararsi al meglio per affrontare la gara.

*I dati nel report Trend dei dati 2023 sono relativi al periodo di 12 mesi fino al 31 gennaio 2023 (“anno”, “quest’anno”), corrispondente all’anno finanziario 2023 di Snowflake. Abbiamo esaminato l’utilizzo dei dati di circa 7.800 clienti di Snowflake, alcuni sono utenti di lunga data, altri sono entrati nel Data Cloud più di recente. Ricordiamo inoltre che poiché la base di clienti di Snowflake è cresciuta del 31% nel corso dell’anno finanziario 2023, questo dato costituisce la base di confronto per le statistiche che identificano i trend che hanno superato questa crescita complessiva.