Blog/Prodotto e tecnologia/Semplifica l’intero ciclo di sviluppo dei dati
JUN 03, 2026/Lettura: 8 minProdotto e tecnologia

Semplifica l’intero ciclo di sviluppo dei dati

Quando la maggior parte dei dati aziendali arriva ai sistemi che dovrebbero utilizzarli per prendere decisioni, spesso è già superata. Questo ritardo può fare la differenza tra agenti AI che forniscono una risposta utile e agenti che commettono un errore costoso. L’Agentic AI può prendere decisioni intelligenti solo se accede in modo continuo a informazioni aggiornate.

Con l’aumento delle organizzazioni che portano l’Agentic AI in produzione, i team di data engineering devono concentrarsi sempre più su pipeline in tempo reale e architetture event-driven. Questo evidenzia l’esigenza di connettere e governare più fonti, anche mentre cambiano di continuo. Ma le soluzioni che i team devono sviluppare superano ormai ciò che la loro piattaforma dati può supportare.

Al Summit 2026, Snowflake rafforza la piattaforma per aiutare i team di data engineering ad avere successo nell’era dell’intelligenza artificiale. Tra le novità spiccano un servizio di streaming nativo compatibile con Apache Kafka e funzionalità basate sull’intelligenza artificiale che riducono lo spostamento dei dati e i costi di migrazione.

Questi miglioramenti riducono il tempo che i data engineer trascorrono gestendo l’infrastruttura e l’orchestrazione manuale. Così possono dedicarsi meno alle attività infrastrutturali di base e più ai risultati che l’intelligenza artificiale rende possibili, con Snowflake CoCo come filo conduttore che trasforma configurazioni complesse in una conversazione guidata.

Esegui lo streaming dei dati alla velocità richiesta dall’intelligenza artificiale

Gli agenti osservano, decidono, agiscono, apprendono e integrano quanto appreso nella decisione successiva. Ogni ciclo decisionale dovrebbe rendere la risposta successiva più accurata, più personalizzata e più attuabile. Questo ciclo è continuo, quindi anche i dati che lo alimentano devono fluire senza interruzioni. Le organizzazioni che utilizzano Kafka dispongono già della dorsale di streaming richiesta da questo ciclo. Il problema è che gestirla insieme a una piattaforma separata per l’analisi dei dati significa pagare, governare e presidiare due sistemi distinti, mentre i dati arrivano comunque in ritardo nel punto in cui si prendono davvero le decisioni.

Datastream (presto in private preview) è il servizio di streaming nativo Snowflake compatibile con Apache Kafka, progettato per concentrare questo overhead operativo in un’unica piattaforma governata. I dati arrivano in modo continuo come tabelle native Snowflake o tabelle open Apache Iceberg™, interrogabili in pochi secondi. I topic sono protetti con il controllo degli accessi basato sui ruoli (RBAC) Snowflake e le tabelle ereditano tutta la potenza di Horizon Catalog, inclusi classificazione, lineage e policy di masking. I dati sono governati dal momento in cui arrivano. Ti basta descrivere la pipeline di streaming di cui hai bisogno: CoCo gestisce l’autenticazione di Datastream e permette ai team di iniziare in pochi minuti, senza competenze Kafka avanzate.

 

Datastream è progettato per le organizzazioni che vogliono sostituire la propria infrastruttura Kafka con un servizio nativo Snowflake. Architettura ad alte prestazioni Snowpipe Streaming è un’API di ingestion diretta per i team che trasmettono dati streaming dalle proprie app, anche da cluster Kafka esistenti tramite Kafka Connector. Oggi Cboe Global Markets, operatore di mercati finanziari, elabora ogni giorno 190 miliardi di righe di dati di mercato e le interroga in meno di 30 secondi, offrendo a trader e analisti visibilità in tempo reale sull’attività dei mercati. Al Summit, i miglioramenti di Snowpipe Streaming includono:

  • Kafka Connector 4.0 è in GA e offre ingestion lato server fino a 10 GB/s per tabella, riducendo le risorse lato client fino al 30 %1: i team possono scalare il throughput senza compromettere i costi.
  • La registrazione degli errori è in GA e acquisisce le righe non riuscite in una tabella interrogabile con SQL, con contesto completo, così i team individuano i problemi di qualità dei dati prima che gli agenti agiscano su input errati.
  • Con il supporto SDK multilingue, in GA, i team eseguono lo streaming dallo stack che conoscono, inclusi Java, Python, Node.js e un’interfaccia REST.
  • I canali elastici (private preview) consentono a migliaia di client di trasmettere contemporaneamente gigabyte al secondo a una tabella tramite un endpoint condiviso con scalabilità automatica, riducendo il tempo di sviluppo necessario per creare e scalare pipeline di streaming.
  • Durable Acknowledgments (private preview) elimina la finestra di potenziale perdita di dati tra ingestion e commit. Le pipeline mission-critical evitano di alimentare gli agenti con dati incompleti.

Pipeline che si gestiscono da sole

Portare i dati in Snowflake in tempo reale è solo metà del processo. L’altra metà consiste nel trasformare quel flusso grezzo in qualcosa che analisti, modelli e agenti possano davvero utilizzare. Questo layer di trasformazione deve essere eseguito in modo continuo, gestire autonomamente retry e logica di refresh e restare affidabile senza un engineer dedicato che lo controlli costantemente. I team accelerano quando le pipeline si gestiscono da sole.

A Summit, Sergey Labetsik di Wind Creek Hospitality ha mostrato come la migrazione di un processo batch dbt, prima eseguito ogni 30 minuti, a una pipeline Dynamic Tables abbia ridotto la latenza end‑to‑end a meno di un minuto, distribuendo voucher per il cibo agli ospiti nel momento stesso in cui li maturavano.

E questo percorso dichiarativo è diventato più veloce e flessibile. I miglioramenti delle prestazioni sono in GA e offrono refresh fino a 2,8 volte più rapidi per i workload Dynamic Table comuni2. Custom incrementalization (public preview) consente agli engineer di utilizzare istruzioni MERGE o INSERT per trasformazioni che non possono essere espresse in modo dichiarativo, mantenendo l’automazione completa di Dynamic Tables.

Figure 2: Up to 2.8x faster refresh performance  for Dynamic Tables with improvements to how Snowflake works with aggregate functions, qualify rank (SCD-1), cluster-by, joins and more.
Figure 2: Up to 2.8x faster refresh performance for Dynamic Tables with improvements to how Snowflake works with aggregate functions, qualify rank (SCD-1), cluster-by, joins and more.

DCM Projects (public preview) offre ai team un unico workflow controllato per definire l’infrastruttura in modo dichiarativo, visualizzare in anteprima e distribuire modifiche tra ambienti e mantenere un audit trail completo di ogni deployment. dbt Projects on Snowflake, ora ancora più veloce con il supporto Fusion in GA, estende la stessa filosofia agli utenti dbt.

Le skill CoCo per Snowpipe Streaming, Dynamic Tables e dbt Projects accelerano configurazione e troubleshooting in questi workflow, consentendo agli engineer di concentrarsi sulla logica della pipeline anziché sul boilerplate.

Accedi ai dati aziendali con semantica di business, senza spostarli

Alcuni dei dati di maggior valore di qualsiasi organizzazione non devono essere spostati affatto. Risiedono già in piattaforme enterprise chiave come SAP, Salesforce e Workday, con significati di business, relazioni e modelli semantici integrati. Per i dirigenti che cercano di portare iniziative di intelligenza artificiale in produzione, il costo di questa ricostruzione è spesso l’ostacolo principale.

Anziché replicare i dati, le Zero-Copy Integrations portano l’intelligenza del sistema di origine direttamente in Snowflake: governata, pronta per l’esecuzione di query e con la ricchezza semantica necessaria ai workload di intelligenza artificiale per funzionare in modo affidabile. Modelli e agenti operano su dati che mantengono il contesto di business originale, invece che su repliche di tabelle ridotte all’essenziale.

SAP è ora in GA tramite SAP BDC Connect for Snowflake e offre un’integrazione bidirezionale zero-copy. I data engineer accedono ai dati SAP ERP per intelligenza artificiale, analisi dei dati e data engineering senza processi ETL complessi, mentre gli insight arricchiti tornano in SAP per attivare azioni automatizzate. Salesforce Data 360, pioniere dell’integrazione zero-copy nativa con Snowflake, offre un’esperienza connector potenziata che consente ai clienti di condividere dati in modo bidirezionale senza manutenzione della pipeline. Workday entra in private preview e rende disponibili dati HR e finanziari come Iceberg Tables gestite esternamente, con acquisizione incrementale delle modifiche a livello di layer di storage.

 

In tutti e tre i casi, l’architettura è coerente: I dati risiedono nel sistema di origine, emergono in Snowflake tramite Catalog-Linked Databases ed ereditano l’intero perimetro di governance di Horizon. Lineage end‑to‑end, policy di accesso e audit trail si applicano dal momento in cui i dati diventano visibili. In più, le skill CoCo gestiscono il lifecycle management, così i team configurano e mantengono le connessioni tramite prompt in linguaggio naturale, rendendo l’integrazione dei dati enterprise accessibile a qualsiasi utente Snowflake.

Connetti ciò che resta con Snowflake Openflow

Lo zero-copy funziona per le piattaforme enterprise che hanno investito in percorsi di integrazione nativa. Ma molti dati critici risiedono ancora in database on‑premise per l’elaborazione delle transazioni online (OLTP), app SaaS e sistemi legacy mai progettati per la condivisione.

Dal lancio dello scorso anno, Openflow, il servizio gestito Snowflake per l’integrazione dei dati basato su Apache NiFi, registra un’adozione crescente da parte dei clienti, mentre i team consolidano stack di connector frammentati in un’unica piattaforma. Questo slancio porta a un’espansione significativa dell’ambito al Summit.

Il deployment gestito Snowflake è ora in GA su Google Cloud Platform, insieme ad AWS e Azure. Data Connectivity Proxy, presto in GA su AWS, estende Openflow alle reti private, connettendo fonti che in precedenza richiedevano engineering personalizzato per essere raggiunte. Openflow supporta dati strutturati e non strutturati, batch e streaming, e resta open ed estensibile. I team sviluppano connector personalizzati e li eseguono sulla piattaforma gestita Snowflake senza rinunciare al controllo.

Una procedura guidata di configurazione in Snowsight accompagna passo dopo passo l’installazione dei connector con convalida integrata della connettività all’origine, semplificando il passaggio dalla configurazione all’ingestion dei dati in pochi minuti. Quando i connector segnalano errori, la risoluzione dei problemi assistita dall’intelligenza artificiale, basata su CoCo e integrata direttamente nella Connector Monitoring Dashboard, analizza i log e fornisce passaggi di remediation mirati nell’intera libreria Openflow in crescita, inclusi connector ad alta domanda appena aggiunti come Veeva, BigQuery e MongoDB (tutti in public preview). Questi connector utilizzano la personalizzazione assistita dall’intelligenza artificiale per accelerare il deployment e offrire una visibilità più profonda sui dati specializzati di settore.

 

Sviluppa e distribuisci su larga scala con Snowpark

Non tutte le trasformazioni rientrano in un modello dichiarativo. Per data engineer e data scientist che sviluppano in modo programmatico con Python, Java, Scala e Apache Spark™, le trasformazioni includono parsing di file complessi, inferenza ML su scala batch e workflow Python in più fasi. La sfida è che il deployment in produzione può richiedere più tempo della scrittura del codice. Snowpark riduce la distanza tra prototipo e produzione.

Le principali novità presentate al Summit includono inferenza ML batch ottimizzata (public preview) per scoring su larga scala più rapido ed efficiente; API Snowpark Data Integration con supporto JDBC estese (public preview) per ridurre il lavoro necessario a portare dati esterni in Snowflake; File transform per Apache Spark (presto in public preview) per l’ETL di file grandi e complessi; Snowpark Directory Import in GA per semplificare il deployment di progetti Python multi-file; un builder visivo di pipeline DAG per orchestrare Notebook e ML Job (private preview); e Code Bundles per distribuire codice Python e Java in produzione (presto in public preview).

Le skill CoCo per Snowpark Python e Apache Spark riducono ulteriormente l’attrito nel deployment e nella migrazione di queste pipeline programmatiche, aiutando i team a passare da codice Python o Apache Spark locale a workflow pronti per la produzione con prestazioni superiori di 5,1 volte e costi inferiori del 42 %3.

Imposta l’obiettivo: Snowflake AIM fa il resto

Nulla rallenta un team dati quanto il peso di ciò che ha ereditato. Strumenti ETL legacy, dialetti SQL datati, schemi Oracle precedenti all’attuale team di engineering: i progetti di migrazione hanno una meritata reputazione per tempi lunghi, budget superati e rischi introdotti in workload che funzionavano bene, finché non hanno smesso di farlo. Molte organizzazioni finiscono per mantenere il vecchio stack in parallelo al nuovo, raddoppiando costi e impegno di gestione per mesi, se non per anni.

Snowflake AIM (AI-powered Migration) è ora in GA ed è una piattaforma unificata di migrazione, modernizzazione e virtualizzazione che combina la proprietà intellettuale di SnowConvert AI, Snowpark Migration Accelerator e Datometry. Un agente di migrazione Snowflake AIM, disponibile tramite Snowflake CoCo, guida i team nel percorso end‑to‑end: Mostra con chiarezza, tenendo conto delle dipendenze, cosa deve essere spostato, in quale ordine e con quali livelli di rischio, prima che qualcuno intervenga sulla produzione. Processi che prima richiedevano settimane o mesi ora si completano in una frazione del tempo.

Il data engineer come architetto dei risultati

Il filo conduttore di tutti gli annunci è lo stesso: ridurre il tempo che gli engineer dedicano a mantenere operativi i sistemi, così possono concentrarsi di più sui risultati che contano. I task che un tempo consumavano cicli di engineering, dalla manutenzione dei connector al debugging delle pipeline, diventano più rapidi e semplici da gestire a ogni release, con CoCo come filo conduttore che li unisce.

In questo contesto, il ruolo del data engineer diventa ancora più centrale. Il lavoro riguarda sempre meno le attività infrastrutturali di base e sempre più la progettazione della data foundation su cui l’intelligenza artificiale può davvero operare. Snowflake continua a impegnarsi per rendere invisibile la complessità, così i team dati possono concentrarsi su ciò che oggi rendono possibile.


  1. I clienti dichiarano una riduzione fino al 30% dei costi delle risorse lato client grazie all’architettura Snowpipe Streaming ad alte prestazioni. Scopri di più: Scalare lo streaming in Snowflake: presentazione dell’architettura Snowpipe Streaming di nuova generazione
  2. Miglioramenti delle prestazioni Snowflake basati su un workload di trasformazione interno, misurati al 4 maggio 2025 con Standard Warehouse e al 4 maggio 2026 con Gen2.
  3. In base a casi d’uso di produzione dei clienti e attività di proof of concept che hanno confrontato velocità e costi di Snowpark con quelli dei servizi Spark gestiti tra novembre 2022 e maggio 2025. Tutti i risultati sintetizzano esiti effettivi ottenuti dai clienti con dati reali e non rappresentano set di dati fittizi utilizzati per i benchmark.

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where DataDoes More