AI e ML

Cortex Agents: la piattaforma che alimenta Snowflake Intelligence e gli agenti di enterprise AI

Snowflake Intelligence sta ridefinendo il modo in cui gli utenti business lavorano con i dati, trasformando gli insight in decisioni e azioni in tutta l’azienda. A rendere possibile questa esperienza sono Cortex Agents, la piattaforma Snowflake per sviluppare e governare agenti di enterprise AI. Cortex Agents orchestrano attività in più passaggi su dati, workflow e sistemi esterni. I team possono anche utilizzarli per sviluppare e scalare direttamente agenti personalizzati. 

I team enterprise stanno passando dalla prototipazione degli agenti di intelligenza artificiale al loro rilascio in produzione. Ora i team vogliono misurare efficienza e accuratezza degli agenti nelle diverse funzioni aziendali, per passare dalla sperimentazione a risultati di business concreti, il tutto in un ambiente affidabile e governato.

Di conseguenza, gli sviluppatori di agenti hanno bisogno di una piattaforma che consenta di sviluppare in modo affidabile, iterare rapidamente e rilasciare in produzione con sicurezza. Gli amministratori degli account hanno bisogno di guardrail scalabili: controlli della spesa, isolamento dei dati e governance che funzionino per ogni team. 

Cortex Agents supporta funzionalità che coprono l’intero ciclo di vita dello sviluppo di agenti enterprise: 

  • Sviluppare agenti che possono connettersi a qualsiasi strumento esterno tramite MCP ed eseguire codice in una sandbox all’interno del perimetro Snowflake.
  • Scalare su migliaia di utenti, applicando l’isolamento dei dati per tenant con le familiari policy di accesso righe Snowflake. 
  • Governare con le stesse policy e la gestione dei costi tramite budget completi. 
  • Iterare con un framework di valutazione per migliorare continuamente la qualità. 

Nel complesso, rappresentano l’infrastruttura di cui le aziende hanno bisogno per portare gli agenti dai progetti pilota alla produzione su larga scala, con una soluzione gestita che nasce all’interno del perimetro di sicurezza e governance Snowflake, la stessa data foundation che alimenta Snowflake Intelligence.

“Con Snowflake Intelligence, i nostri team in oltre 1600 sedi possono utilizzare il linguaggio naturale per comprendere meglio le prestazioni operative e accedere a insight in tempo reale senza dipendere dagli analisti. Questo accelera il processo decisionale e favorisce un maggiore allineamento in tutta l’organizzazione, basato su un’unica fonte di dati governati. Guardando al futuro, Cortex Code ci aiuta a sviluppare e scalare agenti AI per accelerare la crescita delle vendite e migliorare la disponibilità della flotta, evolvendo il nostro modo di operare ogni giorno.”

Tony Leopold
Chief Technology and Strategy Officer, United Rentals

Sviluppare: connetti tutto, esegui qualsiasi cosa

Migliaia di utenti si affidano ogni giorno all’intelligenza artificiale per interrogare i propri dati. Passare all’azione — creare un ticket Jira, aggiornare un record Salesforce, eseguire un’analisi o generare un grafico — è il passaggio più complesso: richiede la connessione a sistemi esterni, l’esecuzione di codice e la trasformazione della conoscenza di dominio in workflow ripetibili. Finora, questo significava scrivere integrazioni personalizzate con gli strumenti, predisporre l’infrastruttura e gestire tutto in autonomia. Il peso delle integrazioni ha spinto molti team a rimandare i deployment in produzione. Snowflake Intelligence ora integra in modo nativo connettori MCP, esecuzione del codice e skill, rendendo semplice sviluppare agenti che rispondono alle domande e agiscono davvero sui sistemi aziendali.

Connettori MCP: uno standard per l’integrazione dei dati esterni

Model Context Protocol (MCP) si è affermato come standard open per connettere gli agenti di intelligenza artificiale a strumenti e servizi esterni. Cortex Agents ora supporta connettori MCP (GA a breve) , un livello di integrazione nativa che ti consente di connettere il tuo agente a qualsiasi server compatibile con MCP, inclusi Atlassian (Jira e Confluence), GitHub, Salesforce, Google Workspace e Slack, con una configurazione minima.

La configurazione segue un’interfaccia standardizzata e un modello semplice. Un team sales ops può connettere rapidamente le proprie istanze Salesforce e JIRA e interagire tramite l’interfaccia Snowflake Intelligence, basata su Cortex Agents, per monitorare la pipeline, caricare report per i clienti e creare ticket in automatico.

Lo stesso modello di governance che si applica agli oggetti Snowflake — ruoli, grant, audit logging — si applica anche ai server MCP esterni, semplificando la gestione. 

sales-1

Fig 1: Connettori MCP: Integrazione fluida con gli strumenti enterprise

Agent skills: pacchetti di task modulari e riutilizzabili

Gli agenti progettati esclusivamente per il recupero dei dati possono solo rispondere alle domande. Agent skills (GA a breve) consentono agli agenti di eseguire task ripetibili e in più passaggi, creare previsioni, generare report, eseguire workflow, utilizzando pacchetti modulari che gli utenti definiscono e distribuiscono una sola volta.

Le aziende possono ora codificare le competenze distribuite nell’organizzazione in skill riutilizzabili da più team. Ad esempio, una skill di previsione sviluppata dal team di analisi dei dati può essere utilizzata dagli agenti in operations, vendite e marketing senza duplicare il codice. 

Gli agenti dotati delle skill giuste possono eseguire questi task on demand, liberando i dipendenti per concentrarsi su attività a maggior valore. Man mano che nell’organizzazione vengono aggiunte e condivise nuove skill, l’agente diventa progressivamente più capace senza ulteriore effort di sviluppo, amplificando i guadagni di produttività tra i team.

sales-2

Fig 2: Agent Skills: Workflow riutilizzabili tra i team

“​​Snowflake è diventato un elemento centrale nel modo in cui applichiamo l’AI alle nostre operazioni. Con Snowflake Intelligence, i nostri team possono analizzare le prestazioni produttive, individuare insight più rapidamente e persino anticipare problemi relativi ad apparecchiature e processi prima che si verifichino. Abbiamo già implementato decine di agenti AI nei reparti di produzione, qualità, supply chain e finanza, offrendo ai team un accesso più rapido a dati affidabili e conoscenze critiche. Questo ci aiuta a migliorare l’efficienza e accelerare la generazione di insight, consentendo interventi più rapidi sul campo. È un passo avanti significativo nel modo in cui operiamo e cresciamo come azienda.”

Priya Almelkar
CIO, Wolfspeed

Code Execution Tool: Python in sandbox in ogni agente

Alcuni task richiedono codice che non esiste ancora, generato e implementato in linea con il task pianificato. Il Code Execution Tool (public preview a breve) offre agli agenti un ambiente Python in sandbox per generare ed eseguire codice all’interno di una conversazione. Gli sviluppatori possono utilizzarlo per analizzare i dati, risolvere problemi e generare documenti in formati come i PDF.

La sandbox applica l’isolamento a livello di sessione, quindi gli agenti non possono accedere a dati oltre quelli passati nella conversazione corrente. L’agente decide quando l’esecuzione del codice è l’approccio più adatto e la richiama di conseguenza. Se un utente chiede un grafico dell’andamento dei ricavi, l’agente genera il codice Python, lo esegue e restituisce la visualizzazione, senza alcuna configurazione aggiuntiva.

Per casi d’uso più avanzati, puoi estendere la sandbox. Sono disponibili ulteriori pacchetti Python tramite Snowflake Artifact Repository, che ospita pacchetti selezionati e approvati per l’utilizzo in Snowflake. Puoi concedere l’accesso alla rete esterna tramite network rules e integrazioni di accesso esterno, consentendo all’agente di raggiungere le API, estrarre dati da fonti esterne e inviare i risultati ai sistemi downstream.

Quando le skill fanno riferimento a script Python, si affidano al Code Execution Tool per eseguirli: le due funzionalità sono progettate per lavorare insieme. Un’organizzazione può sviluppare una libreria di skill che eseguono codice, mentre il Code Execution Tool gestisce il runtime.

bash

Fig 3: Esecuzione del codice: Python sicuro e on demand in ogni agente

Scalare: deployment tra i team senza compromessi

Un singolo agente pilota di successo spesso crea pressione per espandere l’iniziativa: Possiamo eseguirne il deployment a tutti i 5.000 commerciali? Possiamo condividerlo tra più aree di vendita? Le risposte di solito mettono in evidenza un divario tra ciò che funziona per un team e ciò che funziona su larga scala. I deployment multi-tenant richiedono isolamento dei dati tra i gruppi. Distribuire gli aggiornamenti richiede test senza interrompere la produzione. Storicamente, entrambi i problemi hanno richiesto settimane di engineering personalizzato.

Multi-tenancy: un agente, molti tenant, dati isolati

Il multi-tenancy (GA) consente a un singolo Cortex Agent di servire più tenant, team, aree geografiche o clienti diversi, applicando un rigoroso isolamento dei dati tra loro senza distribuire istanze separate dell’agente.

Il modello utilizza attributi di sessione e policy di accesso righe. Quando richiami l’agente, l’applicazione passa valori specifici del tenant che vengono mantenuti nella sessione. Prima che l’agente esegua qualsiasi SQL, questi valori vengono impostati come attributi di sessione. Una policy di accesso righe sulla tabella fa riferimento a questi attributi per filtrare le righe, così un agente di vendita regionale può vedere solo i dati della regione specificata dall’applicazione chiamante.

Snowflake supporta attributi di sessione immutabili: il contesto del tenant viene impostato una sola volta e non può essere modificato da SQL generato, esecuzione del codice o invocazione di strumenti durante la sessione. Snowflake consiglia vivamente di utilizzare attributi di sessione immutabili per le policy di accesso righe, così, anche se una query ostile tenta di modificare il contesto del tenant, il requisito di isolamento resta valido.

Versioning degli agenti: gestione del ciclo di vita per la produzione

Se una nuova configurazione dell’applicazione causa un problema in produzione, la domanda non è “Che cosa è andato storto?”, ma “Quanto rapidamente posso fare rollback?” Il versioning degli agenti (GA) risolve il problema introducendo un modello di ciclo di vita basato su commit che separa sviluppo e produzione.

Ogni agente ha una live version  (una copia di lavoro modificabile per lo sviluppo) e può avere un numero qualsiasi di named versions (snapshot immutabili create eseguendo il commit della live version). Il commit crea un identificatore assegnato dal sistema (VERSION$1, VERSION$2 e così via). Le named versions non possono essere modificate; la loro immutabilità è la data foundation di deployment affidabili.

Gli alias forniscono etichette di routing leggibili — production, staging, canary — che assegni alle named versions. Riassegnare un alias da una versione a un’altra reindirizza tutto il traffico senza alcuna modifica all’applicazione chiamante. Promuovere una nuova versione richiede un comando di una riga; per il rollback si utilizza lo stesso comando, puntando alla versione precedente.

I team che gestiscono configurazioni degli agenti in Git possono creare named versions importando direttamente da uno stage connesso a Git, bypassando del tutto la live version. Il risultato è un modello di deployment degli agenti che gli ingegneri già conoscono: Sviluppa in development, testa in staging, promuovi in production ed esegui il rollback se necessario.

version

Fig 4: Versioning degli agenti: Deployment sicuri con rollback istantaneo

Governare: controlla i costi a ogni livello

L’utilizzo degli agenti di intelligenza artificiale si traduce direttamente in crediti consumati. Le aziende che eseguono il deployment degli agenti su larga scala hanno bisogno di risposte a domande che, nella maggior parte delle piattaforme, non sono ancora standard: Quanto sta spendendo il team Finance per l’agente condiviso di analisi dei dati? Cosa succede quando un team esaurisce il budget mensile: l’accesso viene interrotto automaticamente? Posso assegnare al team Sales un limite indipendente da quello del team Engineering sullo stesso agente? Con una gestione completa dei costi e il monitoraggio dell’utilizzo, i team possono scalare l’intelligenza artificiale con sicurezza, senza temere sforamenti di budget. 

Resource budgets: controllo della spesa a livello di agente

Resource budgets for Cortex Agents (GA) applicano un limite mensile di spesa in crediti a uno specifico oggetto Cortex Agent, tracciato tramite il modello Snowflake di attribuzione dei costi basato su tag. Puoi impostare e monitorare budget a livello di team e di intera organizzazione, così la spesa è visibile, controllata e allineata all’utilizzo. Snowflake monitora il consumo di crediti per l’agente con tag ed esegue le azioni configurate al raggiungimento delle soglie.

Il modello di azioni basato su soglie è flessibile. All’80% puoi attivare un avviso per il responsabile del team. Al 100% una stored procedure revoca l’accesso. Per i team con esigenze che superano il limite, ad esempio durante la stagione degli utili per un agente di analisi finanziaria, puoi configurare un’azione di ripristino a una soglia oltre il 100%, seguita da un blocco definitivo al 200%. Un’azione di inizio ciclo ripristina automaticamente l’accesso all’inizio di ogni nuovo periodo di budget.

I budget offrono a Engineering, Finance e a tutti gli altri team lo stesso controllo sulla spesa per l’intelligenza artificiale che già hanno su capacità di calcolo e archiviazione. L’utilizzo incontrollato degli agenti non passa inosservato fino alla fattura di fine mese.

agent-5

Fig 5: Budget delle risorse: controlla la spesa degli agenti con precisione

Shared resource budgets: spesa per team su agenti condivisi

I budget delle risorse operano a livello di agente: si applicano a tutto l’utilizzo di quell’agente, indipendentemente dal team che lo esegue. Shared resource budgets (GA) operano a livello di gruppo di utenti: Più team possono condividere lo stesso agente, mentre ciascun team opera con un limite di spesa indipendente. I budget vengono applicati a livello di team, quindi l’utilizzo di ogni gruppo viene tracciato e controllato in modo indipendente. Snowflake monitora il consumo di crediti degli utenti con tag rispetto alla risorsa condivisa, in modo indipendente dagli altri gruppi che utilizzano la stessa istanza.

Quando un utente è soggetto a più budget, un budget a livello di risorsa sull’agente e un budget a livello di risorsa condivisa per il suo team, ogni budget viene valutato in modo indipendente e l’utente viene bloccato dalla soglia che viene raggiunta per prima. Ad esempio, un team Finance che esaurisce il budget condiviso di 500 crediti perderà l’accesso anche se l’agente complessivo non ha ancora raggiunto il limite di risorsa di 1.000 crediti. Gli altri team continuano senza impatti.

Questo modello offre ai team di piattaforma la flessibilità di distribuire un’infrastruttura condivisa, dando al contempo alle singole business unit il controllo sui propri consumi.

Itera: misura ciò che conta, correggi ciò che non funziona

Gli LLM sono intrinsecamente non deterministici. L’orchestrazione degli strumenti può fallire in modo silenzioso: l’agente può allucinare il recupero dei dati e produrre comunque una risposta dall’aspetto plausibile. Le metriche di qualità generiche non intercettano i problemi specifici del dominio. Senza una misurazione strutturata, i team non possono capire se un agente migliora o peggiora nel tempo. Con Cortex Agent Evaluations ora puoi monitorare e iterare le applicazioni agentiche direttamente entro il perimetro sicuro Snowflake. 

Cortex Agent Evaluations: dalla revisione soggettiva alle prestazioni quantificate

Cortex Agent Evaluations sono ora GA. Il framework ti consente di definire un set di dati di query di test e i comportamenti attesi dell’agente, eseguire valutazioni sul tuo agente e ricevere metriche quantificate per ogni esecuzione.

Le valutazioni si basano sul framework Agent GPA (Goal-Plan-Action) di Snowflake, un approccio supportato dalla ricerca che mette a disposizione tre metriche integrate:

  • Accuratezza nella selezione ed esecuzione degli strumenti: L’agente ha scelto gli strumenti giusti nelle fasi giuste e li ha eseguiti correttamente con input e output previsti?
  • Correttezza della risposta: Quanto la risposta dell’agente corrispondeva a quella attesa?
  • Coerenza logica: Le istruzioni, la pianificazione e le chiamate agli strumenti dell’agente sono coerenti internamente? 

Le prestazioni del framework GPA sul benchmark TRAIL/GAIA ne confermano l’affidabilità: nei test di benchmark, i giudici GPA hanno rilevato il 95% degli errori annotati dagli esseri umani (contro un baseline del 55%) e hanno localizzato gli errori su specifici intervalli di trace con un’accuratezza dell’86%. Non è un sistema di tipo pass/fail: ti indica esattamente in quale punto della catena di ragionamento l’agente si è bloccato.

Il vantaggio pratico è che i team possono passare da una revisione umana soggettiva a una misurazione della qualità strutturata e ripetibile. Prima della prima distribuzione in produzione, esegui una valutazione per stabilire una baseline. Dopo ogni modifica di configurazione, la esegui di nuovo per verificare che la qualità sia rimasta invariata. 

6-record

Fig 6: Agent Evaluations: misura, diagnostica e migliora con GPA

Il futuro del lavoro, powered by Snowflake Intelligence

​Snowflake Intelligence porta un nuovo modo di lavorare in azienda, in cui gli insight non si fermano alle risposte, ma guidano azioni concrete in tutta l’organizzazione.

Alla base di questa esperienza c’è una piattaforma completamente gestita, progettata per soddisfare ogni requisito dell’intelligenza artificiale in produzione: Connettività agli strumenti aziendali, esecuzione sicura del codice, scalabilità multiutente con isolamento dei dati, governance dei costi granulare e valutazione integrata per migliorare la qualità.

Queste funzionalità rimuovono gli ostacoli più complessi all’implementazione dell’intelligenza artificiale su larga scala, eliminando la complessità di integrazione, garantendo governance e controllo dei costi, e fornendo la data foundation per risultati affidabili e misurabili.

Snowflake Intelligence è al centro di questo sistema. Gli utenti fanno domande, esplorano i dati e agiscono in un unico posto, mentre la piattaforma connette in modo sicuro dati, workflow e sistemi dietro le quinte. È questa integrazione che consente alle aziende di passare dalla sperimentazione a un impatto reale, senza dover assemblare più strumenti o scendere a compromessi sulla governance.

Poiché viene eseguito su Snowflake, ogni interazione si basa su dati governati, controlli di accesso esistenti e policy unificate. I team non devono ricostruire la governance per l’intelligenza artificiale: estendono ciò di cui già si fidano.

In sostanza, Snowflake Intelligence agisce come un agente di lavoro personale, che comprende il tuo contesto, ti aiuta a ragionare nella complessità e agisce per tuo conto. Consente ai team di muoversi più rapidamente, collaborare in modo più efficace e, in definitiva, lavorare alla velocità dell’intelligenza artificiale.

Snowflake Intelligence è pronta per la produzione e trasforma i dati in decisioni e le decisioni in azione, in modo sicuro e su larga scala, basandosi sulla piattaforma dati su cui fai già affidamento.

Inizia subito

Queste funzionalità sono GA. Per saperne di più: 

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • prova gratuita di 30 giorni
  • nessuna carta di credito
  • annulli quando vuoi