IA ML

Cortex Agents: a plataforma que impulsiona o Snowflake Intelligence e os agentes de IA para empresas

O Snowflake Intelligence está redefinindo a forma como os usuários de negócios trabalham com dados, transformando insights em decisões e ações em toda a empresa. Por trás dessa experiência estão os Cortex Agents, a plataforma da Snowflake para criar e governar agentes de IA para empresas. O Cortex Agents orquestra trabalhos de várias etapas entre dados, fluxos de trabalho e sistemas externos. As equipes também podem usá-los para criar e ajustar a escala de agentes personalizados diretamente. 

As equipes corporativas estão migrando da prototipagem de agentes de IA para a implantação em produção. Agora, as equipes querem medir a eficiência e a precisão dos agentes em todas as funções de negócios, para avançar da experimentação para resultados reais, tudo dentro de um ambiente confiável e governado.

Para isso, os desenvolvedores de agentes precisam de uma plataforma que permita criar com confiabilidade, iterar rapidamente e lançar em produção com segurança. Os administradores de contas precisam de controles escaláveis: controle de custos, isolamento de dados e governança que funcionem em todas as equipes. 

O Cortex Agents oferece recursos que abrangem todo o ciclo de vida do desenvolvimento de agentes corporativos: 

  • Crie agentes que podem se conectar a qualquer ferramenta externa via MCP e executar código em um sandbox dentro do perímetro do Snowflake.
  • Ajuste a escala para milhares de usuários, aplicando isolamento de dados por tenant com as Row Access Policies conhecidas do Snowflake. 
  • Governe com as mesmas políticas e gestão de custos por meio de orçamentos abrangentes. 
  • Itere com uma estrutura de avaliação para melhorar continuamente a qualidade. 

Juntos, eles representam a infraestrutura que as empresas precisam para levar agentes de projetos piloto à produção em escala, com uma solução gerenciada que nasce dentro do perímetro de segurança e governança do Snowflake — a mesma base que impulsiona o Snowflake Intelligence.

“Com o Snowflake Intelligence, nossas equipes em mais de 1.600 localidades podem usar linguagem natural para entender melhor o desempenho operacional e acessar insights em tempo real sem depender de analistas. Isso está acelerando a tomada de decisões e criando um alinhamento mais forte em toda a empresa, com base em uma única fonte de dados governados. Olhando para o futuro, o Cortex Code está nos ajudando a construir e escalar agentes de IA para acelerar o crescimento das vendas e melhorar a disponibilidade da frota, avançando a forma como operamos todos os dias.”

Tony Leopold
Chief Technology and Strategy Officer, United Rentals

Criar: conecte-se a tudo, execute qualquer coisa

Milhares de usuários dependem de IA para fazer consultas nos seus dados diariamente. Agir — criar um ticket no Jira, atualizar um registro no Salesforce, executar uma análise ou gerar um gráfico — é o passo mais difícil: exige conexão com sistemas externos, execução de código e a transformação do conhecimento de domínio em fluxos de trabalho repetíveis. Até agora, isso significava escrever integrações de ferramentas personalizadas, provisionar infraestrutura e manter tudo por conta própria. Essa carga de integração levou muitas equipes a adiar implantações em produção. O Snowflake Intelligence agora reúne nativamente conectores MCP, execução de código e skills, facilitando a criação de agentes que respondem perguntas e tomam ações reais em sistemas corporativos.

Conectores MCP: um padrão para integração de dados externos

O Model Context Protocol (MCP) se consolidou como o padrão aberto para conectar agentes de IA a ferramentas e serviços externos. O Cortex Agents agora oferece suporte a conectores MCP (GA em breve) — uma camada de integração nativa que permite conectar seu agente a qualquer servidor compatível com MCP, incluindo Atlassian (Jira e Confluence), GitHub, Salesforce, Google Workspace e Slack, com configuração mínima.

A configuração segue uma interface padronizada e um padrão simples. Uma equipe de operações de vendas pode conectar rapidamente suas instâncias do Salesforce e do JIRA e interagir pela interface do Snowflake Intelligence, com tecnologia Cortex Agents, para acompanhar o pipeline, fazer upload de relatórios de clientes e criar tickets automaticamente.

O mesmo modelo de governança aplicado aos objetos do Snowflake — roles, grants, audit logging — se aplica aos servidores MCP externos, simplificando o gerenciamento. 

sales-1

Figura 1: Conectores MCP: Integração contínua com ferramentas corporativas

Agent skills: pacotes de tarefas modulares e reutilizáveis

Agentes criados exclusivamente para recuperação de dados só conseguem responder perguntas. Agent skills (GA) permitem que os agentes executem Tasks repetíveis e de várias etapas — como executar previsões, gerar relatórios e acionar fluxos de trabalho — usando pacotes modulares que os usuários definem e implantam uma única vez.

As empresas agora podem codificar o conhecimento distribuído pela organização em skills que podem ser reutilizadas por várias equipes. Por exemplo, uma skill de previsão criada pela equipe de análise de dados pode ser usada por agentes de operações, vendas e marketing sem duplicar código. 

Agentes equipados com as skills certas podem executar essas Tasks sob demanda — liberando os colaboradores para se concentrarem em trabalhos de maior valor. À medida que mais skills são contribuídas e compartilhadas pela organização, o agente se torna progressivamente mais capaz sem esforço adicional de desenvolvimento, multiplicando os ganhos de produtividade entre as equipes.

sales-2

Figura 2: Agent Skills: Fluxos de trabalho reutilizáveis entre equipes

“​​A Snowflake tornou-se uma parte central de como aplicamos IA em nossas operações. Com o Snowflake Intelligence, nossas equipes podem analisar o desempenho de manufatura, obter insights mais rapidamente e até antecipar problemas em equipamentos e processos antes que ocorram. Já implantamos dezenas de agentes de IA em manufatura, qualidade, cadeia de suprimentos e finanças, proporcionando às equipes acesso mais rápido a dados confiáveis e conhecimento crítico. Isso está nos ajudando a melhorar a eficiência e acelerar a geração de insights, permitindo ações mais rápidas no chão de fábrica. É um avanço significativo na forma como operamos e escalamos o negócio.”

Priya Almelkar
CIO, Wolfspeed

Code Execution Tool: Python em sandbox em todos os agentes

Algumas Tasks exigem código que ainda não existe — gerado e implementado de acordo com a tarefa planejada. O Code Execution Tool (em versão preliminar pública em breve) oferece aos agentes um ambiente Python em sandbox para gerar e executar código como parte de uma conversa. Os desenvolvedores podem usá-lo para analisar dados, resolver problemas e gerar documentos em formatos como PDF.

O sandbox aplica isolamento em nível de sessão, impedindo que os agentes acessem dados além do que foi passado na conversa atual. O agente decide quando a execução de código é a abordagem correta e a aciona conforme necessário. Se um usuário solicitar um gráfico de tendência de receita, o agente gera o código Python, executa e retorna a visualização — sem nenhuma configuração adicional.

Para casos de uso mais avançados, o sandbox pode ser estendido. Pacotes Python adicionais estão disponíveis no Snowflake Artifact Repository, que hospeda pacotes selecionados e aprovados para uso dentro do Snowflake. O acesso externo à rede pode ser concedido por meio de regras de rede e integrações de acesso externo, permitindo que o agente acesse APIs, extraia dados de fontes externas e envie resultados para sistemas downstream.

Quando as skills referenciam scripts Python, elas dependem do Code Execution Tool para executá-los — as duas funcionalidades foram projetadas para trabalhar juntas. Uma organização pode criar uma biblioteca de skills que executam código, e o Code Execution Tool gerencia o runtime.

bash

Figura 3: Code Execution: Python seguro e sob demanda em todos os agentes

Scale: implante em todas as equipes sem concessões

Um único agente piloto bem-sucedido frequentemente gera pressão para expandir: Podemos implementar isso para todos os 5.000 representantes de vendas? Podemos compartilhá-lo em várias regiões de vendas? As respostas geralmente revelam uma lacuna entre o que funciona para uma equipe e o que funciona em escala. Implantações multi-tenant exigem isolamento de dados entre grupos. A distribuição de atualizações requer testes sem interromper a produção. Historicamente, ambos os problemas exigiram semanas de engenharia personalizada.

Multi-tenancy: um agente, vários tenants, dados isolados

Multi-tenancy (GA) permite que um único Cortex Agent atenda a vários tenants — diferentes equipes, regiões ou clientes — aplicando isolamento estrito de dados entre eles sem a necessidade de implantar instâncias separadas do agente.

O modelo usa atributos de sessão e Row Access Policies. Ao chamar o agente, a aplicação passa valores específicos do tenant que são mantidos na sessão. Antes de o agente executar qualquer SQL, esses valores são definidos como atributos de sessão. Uma Row Access Policy na sua tabela referencia esses atributos para filtrar linhas — assim, um agente de vendas regional só consegue ver os dados da região especificada pela aplicação que o chamou.

O Snowflake oferece suporte a atributos de sessão imutáveis, o que significa que o contexto do tenant é definido uma única vez e não pode ser modificado por nenhum SQL gerado, execução de código ou invocação de ferramenta durante a sessão. O Snowflake recomenda fortemente o uso de atributos de sessão imutáveis para Row Access Policies, de modo que, mesmo que uma consulta maliciosa tente modificar o contexto do tenant, o requisito de isolamento seja mantido.

Controle de versão de agentes: gerenciamento do ciclo de vida em produção

Se uma nova configuração de aplicação quebrar algo em produção, a pergunta não é "O que deu errado?" — é "Com que rapidez posso fazer o rollback?" O controle de versão de agentes (GA) resolve isso introduzindo um modelo de ciclo de vida baseado em commits que separa o desenvolvimento da produção.

Cada agente tem uma live version — uma cópia de trabalho mutável para desenvolvimento — e pode ter qualquer número de named versions — snapshots imutáveis criados ao fazer o commit da live version. O commit cria um identificador atribuído pelo sistema (VERSION$1, VERSION$2 e assim por diante). e assim por diante). As named versions não podem ser modificadas; sua imutabilidade é a base de implantações confiáveis.

Aliases fornecem rótulos de roteamento legíveis por humanos — production, staging, canary — que você atribui às named versions. Reatribuir um alias de uma versão para outra redireciona todo o tráfego sem nenhuma alteração na aplicação que faz a chamada. Promover uma nova versão é um comando de uma linha; o rollback é o mesmo comando apontando para a versão anterior.

Equipes que gerenciam configurações de agentes no Git podem criar named versions importando diretamente de um stage conectado ao Git, ignorando completamente a live version. O resultado é um modelo de implantação de agentes que os engenheiros já conhecem: Crie em desenvolvimento, teste em staging, promova para produção e faça rollback se necessário.

version

Figura 4: Controle de versão de agentes: Implantações seguras com rollback instantâneo

Governar: controle de custos em todos os níveis

O uso de agentes de IA se traduz diretamente em créditos consumidos. As empresas que implantam agentes amplamente precisam de respostas para perguntas que ainda não são padrão na maioria das plataformas: Quanto a equipe de finanças está gastando com o agente de análise de dados compartilhado? O que acontece quando uma equipe esgota seu orçamento mensal — o acesso é cortado automaticamente? Posso definir um limite para a equipe de vendas independente do limite da equipe de engenharia para o mesmo agente? Com uma gestão de custos abrangente e rastreamento de uso, as equipes podem escalar a IA com confiança, sem se preocupar com estouros de orçamento. 

Orçamentos de recursos: controle de custos no nível do agente

Os orçamentos de recursos para Cortex Agents (GA) aplicam um limite mensal de créditos a um objeto Cortex Agent específico, rastreado por meio do modelo de atribuição de custos baseado em tags do Snowflake. Você pode definir e acompanhar orçamentos por equipe e para toda a organização, garantindo que os custos sejam visíveis, controlados e alinhados ao uso. O Snowflake rastreia o consumo de créditos do agente com tag e executa as ações configuradas quando os limites são atingidos.

O modelo de ações por limite é flexível. Ao atingir 80%, você pode acionar um alerta para o líder da equipe. Ao atingir 100%, um procedimento armazenado revoga o acesso. Para equipes com necessidades que ultrapassam o limite — como uma temporada de resultados financeiros para um agente de análise financeira, por exemplo — você pode configurar uma ação de reativação em um limite acima de 100%, seguida de uma interrupção definitiva em 200%. Uma ação de início de ciclo reativa o acesso automaticamente no início de cada novo período orçamentário.

Os orçamentos oferecem às equipes de engenharia, finanças e todas as demais o mesmo controle sobre os custos com IA que já têm sobre processamento e armazenamento. O uso descontrolado de agentes não passa despercebido até a fatura do fim do mês.

agent-5

Figura 5: Orçamentos de recursos: Controle os custos com agentes com precisão

Orçamentos de recursos compartilhados: custos por equipe em agentes compartilhados

Os orçamentos de recursos operam no nível do agente: eles se aplicam a todo o uso desse agente, independentemente de qual equipe o está executando. Os orçamentos de recursos compartilhados (GA) operam no nível do grupo de usuários: Várias equipes podem compartilhar o mesmo agente enquanto cada equipe trabalha com um limite de gastos independente. Os orçamentos são aplicados no nível da equipe, de modo que o uso de cada grupo é rastreado e controlado de forma independente. O Snowflake rastreia o consumo de créditos dos usuários com tag em relação ao recurso compartilhado, de forma independente dos outros grupos que usam a mesma instância.

Quando um usuário está sujeito a múltiplos orçamentos, um orçamento no nível do recurso para o agente e um orçamento no nível do recurso compartilhado para sua equipe, cada orçamento é avaliado de forma independente, e o usuário é bloqueado pelo limite que for atingido primeiro. Por exemplo, uma equipe de finanças que esgota seu orçamento compartilhado de 500 créditos perderá o acesso mesmo que o agente geral ainda não tenha atingido seu limite de 1.000 créditos. As demais equipes continuam sem interrupções.

Esse modelo oferece às equipes de plataforma a flexibilidade de implementar infraestrutura compartilhada, ao mesmo tempo que dá às unidades de negócio individuais controle sobre seu próprio consumo.

Iterar: meça o que importa, corrija o que falha

Os LLMs são inerentemente não determinísticos. A orquestração de ferramentas pode falhar silenciosamente: o agente pode alucinar a recuperação de dados e ainda assim produzir uma resposta aparentemente plausível. Métricas de qualidade genéricas não capturam falhas específicas de domínio. Sem uma medição estruturada, as equipes não conseguem saber se um agente está melhorando ou piorando ao longo do tempo. Com o Cortex Agent Evaluations, agora você pode monitorar e iterar aplicações agênticas diretamente dentro do ambiente seguro do Snowflake. 

Cortex Agent Evaluations: da avaliação subjetiva à performance quantificada

O Cortex Agent Evaluations já está disponível ao público. A estrutura permite que você defina um conjunto de dados com consultas de teste e comportamentos esperados do agente, execute avaliações no seu agente e receba métricas quantificadas para cada execução.

As avaliações são executadas com tecnologia da estrutura Agent GPA (Goal-Plan-Action) do Snowflake — uma abordagem embasada em pesquisa que apresenta três métricas integradas:

  • Precisão na seleção e execução de ferramentas: O agente escolheu as ferramentas certas nas etapas corretas e as executou corretamente com as entradas e saídas esperadas?
  • Correção das respostas: Quão próxima foi a resposta do agente em relação à resposta esperada?
  • Consistência lógica: As instruções, o planejamento e as chamadas de ferramentas do agente são internamente consistentes? 

A performance da estrutura GPA no benchmark TRAIL/GAIA evidencia sua confiabilidade: nos testes de benchmark, os avaliadores GPA capturaram 95% dos erros anotados por humanos (em comparação com 55% do padrão de referência) e localizaram erros em intervalos de rastreamento específicos com 86% de precisão. Este não é um sistema de aprovação/reprovação, ele indica exatamente em qual ponto da cadeia de raciocínio o agente falhou.

O benefício prático é que as equipes podem passar da revisão humana subjetiva para uma medição de qualidade estruturada e repetível. Antes da primeira implantação em produção, você executa uma avaliação para estabelecer um padrão de referência. Após cada alteração de configuração, você a executa novamente para confirmar que a qualidade foi mantida. 

6-record

Figura 6: Agent Evaluations: Meça, diagnostique e melhore com o GPA

O futuro do trabalho, com Snowflake Intelligence

​O Snowflake Intelligence traz uma nova forma de trabalhar para as empresas, em que os insights não se limitam a respostas, mas impulsionam ações concretas em todo o seu negócio.

Por trás dessa experiência há uma plataforma totalmente gerenciada, projetada para atender a todos os requisitos de IA em produção: Conectividade com ferramentas corporativas, execução segura de código, escalabilidade multiusuário com isolamento de dados, governança granular de custos e avaliação integrada para melhorar a qualidade.

Esses recursos eliminam as barreiras mais difíceis para implementar IA em escala, reduzindo a complexidade de integração, garantindo governança e controle de custos e fornecendo a base para resultados confiáveis e mensuráveis.

O Snowflake Intelligence está no centro desse sistema. Os usuários fazem perguntas, exploram dados e tomam decisões em um único lugar enquanto a plataforma conecta dados, fluxos de trabalho e sistemas de forma segura nos bastidores. Essa integração é o que permite às empresas avançar da experimentação para o impacto real, sem precisar unir diversas ferramentas ou comprometer a governança.

Por ser executado no Snowflake, cada interação é fundamentada em dados governados, controles de acesso existentes e políticas unificadas. As equipes não precisam reconstruir a governança para a IA — elas ampliam o que já confiam.

Em sua essência, o Snowflake Intelligence atua como um agente de trabalho pessoal que entende o seu contexto, ajuda a raciocinar sobre situações complexas e age em seu nome. Ele permite que as equipes se movam mais rápido, colaborem com mais eficiência e, em última análise, trabalhem na velocidade da IA.

O Snowflake Intelligence está pronto para produção e transforma dados em decisões e decisões em ação, com segurança, em escala, construído sobre a plataforma de dados em que você já confia.

Primeiros passos

Esses recursos já estão disponíveis ao público. Para saber mais: 

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Onde os dados fazem mais

  • Avaliação gratuita de 30 dias
  • Sem precisar de cartão de crédito
  • Cancele a qualquer hora