AI & ML

Cortex Agents: Snowflake Intelligence와 엔터프라이즈 AI 에이전트를 구동하는 플랫폼

Snowflake Intelligence는 비즈니스 사용자가 데이터로 작업하는 방식을 새롭게 정의하며, 인사이트를 엔터프라이즈 전반의 의사 결정과 실행으로 연결합니다. 이러한 경험을 가능하게 하는 것은 Cortex Agents로, 엔터프라이즈 AI 에이전트를 구축하고 거버넌스를 적용할 수 있는 Snowflake의 플랫폼입니다. Cortex Agents는 데이터, 워크플로우, 외부 시스템 전반에서 여러 단계로 이어지는 작업을 오케스트레이션합니다. 팀은 이를 활용해 사용자 지정 에이전트를 직접 구축하고 확장할 수도 있습니다. 

엔터프라이즈 팀은 AI 에이전트 프로토타입 단계에서 벗어나 실제 프로덕션 환경으로 전환하고 있습니다. 이제 팀은 신뢰할 수 있고 거버넌스가 적용된 환경에서, 실험을 넘어 실제 비즈니스 성과로 이어가기 위해 업무 기능 전반에서 에이전트의 효율성과 정확도를 측정하길 원합니다.

이에 따라 에이전트 개발자는 안정적으로 구축하고 빠르게 반복하며, 신뢰를 갖고 프로덕션에 배포할 수 있는 플랫폼이 필요합니다. 계정 관리자는 모든 팀에 걸쳐 작동하는 확장 가능한 가드레일, 즉 지출 통제, 데이터 격리, 거버넌스를 필요로 합니다. 

Cortex Agents는 엔터프라이즈 에이전트 개발의 전체 수명 주기를 아우르는 기능을 지원합니다. 

  • 구축 MCP를 통해 어떤 외부 도구와도 연결하고, Snowflake 경계 내 샌드박스에서 코드를 실행할 수 있는 에이전트를 구축합니다.
  • 확장 익숙한 Snowflake Row Access Policy를 활용해 테넌트별 데이터 격리를 강제하면서, 수천 명의 사용자로 규모 있게 확장합니다. 
  • 거버넌스 적용 동일한 정책을 적용하고, 포괄적인 예산 관리를 통해 비용 관리까지 수행합니다. 
  • 반복 평가 프레임워크로 품질을 지속적으로 개선합니다. 

이 모든 기능은 Snowflake의 보안 및 거버넌스 경계 내에서 제공되는 관리형 솔루션을 기반으로, 기업이 에이전트를 파일럿 단계에서 대규모 프로덕션으로 전환하는 데 필요한 인프라를 구성하며, Snowflake Intelligence를 구동하는 동일한 기반 위에서 작동합니다.

“Snowflake Intelligence를 통해 전 세계 1,600개 이상의 지점에 있는 팀이 자연어를 사용해 운영 성과를 보다 정확하게 이해하고, 분석가에 의존하지 않고도 실시간 인사이트에 접근할 수 있게 되었습니다. 이는 의사 결정 속도를 가속화하고 거버넌스가 적용된 단일 데이터 소스를 기반으로 비즈니스 전반의 정렬을 강화하고 있습니다. Cortex Code는 AI 에이전트를 구축하고 확장하여 매출 성장을 가속화하고 플릿 가용성을 개선함으로써, 일상적인 운영 프로세스를 지속적으로 고도화하고 있습니다.”

Tony Leopold
Chief Technology and Strategy Officer, United Rentals

구축: 모든 것을 연결하고, 무엇이든 실행

수천 명의 사용자가 매일 AI로 데이터를 쿼리합니다. 하지만 실행은 더 어려운 단계입니다. Jira 티켓 생성, Salesforce 레코드 업데이트, 분석 실행, 차트 생성 같은 작업을 하려면 외부 시스템과 연결하고 코드를 실행하며 도메인 지식을 반복 가능한 워크플로우로 전환해야 합니다. 지금까지는 사용자 지정 도구 통합을 작성하고, 인프라를 구축한 뒤, 그 모든 것을 직접 운영하고 유지해야 했습니다. 이러한 통합 부담으로 인해 많은 팀에서 프로덕션 배포가 지연되는 경우가 많았습니다. 이제 Snowflake Intelligence는 MCP 커넥터, 코드 실행, 스킬을 네이티브로 결합해, 엔터프라이즈 시스템 전반에서 질문에 답할 뿐 아니라 실제 액션까지 수행하는 에이전트를 쉽게 구축할 수 있도록 합니다.

MCP 커넥터: 외부 데이터 데이터 통합을 위한 표준

Model Context Protocol(MCP)은 AI 에이전트를 외부 도구 및 서비스에 연결하기 위한 개방형 표준으로 자리 잡았습니다. Cortex Agents는 이제 MCP connectors(GA 예정)를 지원하며, 이 네이티브 통합 계층을 통해 최소한의 구성만으로 Atlassian(Jira 및 Confluence), GitHub, Salesforce, Google Workspace, Slack을 포함해 MCP 호환 서버라면 어디든 에이전트를 연결할 수 있습니다.

설정은 표준화된 인터페이스와 직관적인 패턴을 따릅니다. 예를 들어 영업 운영 팀은 Salesforce와 JIRA 인스턴스를 빠르게 연결한 뒤, Cortex Agents로 구동되는 Snowflake Intelligence 인터페이스에서 파이프라인을 추적하고 고객 보고서를 업로드하며 티켓을 자동 생성하는 식으로 상호 작용할 수 있습니다.

Snowflake 오브젝트에 적용되는 것과 동일한 거버넌스 모델(역할, 권한 부여, 감사 로깅)이 외부 MCP 서버에도 그대로 적용되므로 관리가 한층 단순해집니다. 

자료 1: MCP 커넥터: 엔터프라이즈 도구와의 매끄러운 통합

Agent skills: 재사용 가능한 모듈형 작업 패키지

데이터 조회만을 위해 구축된 에이전트는 질문에 답하는 것까지만 가능합니다. Agent skills(GA 예정)를 활용하면 사용자가 한 번 정의하고 배포한 모듈형 패키지를 활용해 예측 실행, 보고서 생성, 워크플로우 수행과 같은 반복적인 다단계 작업을 에이전트가 수행할 수 있습니다.

엔터프라이즈는 이제 조직 전반에 흩어진 전문 지식을 스킬로 체계화해 여러 팀이 재사용하도록 만들 수 있습니다. 예를 들어 분석 팀이 구축한 예측 스킬을 운영, 영업, 마케팅 팀의 에이전트가 코드 중복 없이 활용할 수 있습니다. 

적절한 스킬을 갖춘 에이전트는 필요한 태스크를 온디맨드로 실행해, 직원이 더 높은 가치의 작업에 집중하도록 돕습니다. 조직 내에서 더 많은 스킬이 기여되고 공유될수록, 추가 개발 노력 없이도 에이전트의 역량은 점점 강화되며 팀 전반의 생산성 향상이 누적됩니다.

자료 2: Agent Skills: 팀 전반에서 재사용 가능한 워크플로우

“Snowflake는 현재 당사의 운영 전반에 AI를 적용하는 방식에서 핵심적인 역할을 하고 있습니다. Snowflake Intelligence를 통해 팀은 제조 성과를 분석하고 더 빠르게 인사이트를 도출하며, 장비 및 공정에서 발생할 수 있는 문제를 사전에 예측할 수 있습니다. 이미 제조, 품질, 공급망, 재무 전반에 걸쳐 수십 개의 AI 에이전트를 배포했으며, 이를 통해 팀은 신뢰할 수 있는 데이터와 핵심 지식에 더 빠르게 접근하고 있습니다. 이러한 변화는 효율성을 개선하고 인사이트 도출을 가속화하여 생산 현장에서 더 빠른 실행을 가능하게 합니다. 이는 기업 운영 방식과 확장 전략을 고도화하는 중요한 진전입니다.”

Priya Almelkar
CIO, Wolfspeed

Code Execution Tool: 각 에이전트에 샌드박스 환경의 Python 제공

일부 태스크는 아직 존재하지 않는 코드를 필요로 합니다. 계획된 태스크 흐름에 맞춰 코드를 생성하고 구현해야 하기 때문입니다. Code Execution Tool(퍼블릭 프리뷰 예정)은 대화의 일부로 코드를 생성하고 실행할 수 있는 샌드박스 기반 Python 환경을 에이전트에 제공합니다. 개발자는 이를 활용해 데이터를 분석하고 문제를 해결하며 PDF 같은 형식의 문서를 생성할 수 있습니다.

샌드박스는 세션 수준 격리를 강제하므로, 에이전트는 현재 대화에 전달된 범위를 넘어서는 데이터에 액세스할 수 없습니다. 에이전트가 코드 실행이 적절한 시점을 판단하고, 이에 따라 실행을 호출합니다. 사용자가 수익 추세 차트를 요청하면 에이전트가 Python을 생성하고 실행한 다음, 추가 구성 없이 시각화를 반환합니다.

더 고도화된 사용 사례를 위해 샌드박스를 확장할 수도 있습니다. 추가 Python 패키지는 Snowflake Artifact Repository를 통해 사용할 수 있습니다. 이 리포지토리는 Snowflake 내 사용이 승인된 엄선된 패키지를 호스팅합니다. 네트워크 규칙과 외부 액세스 통합을 통해 외부 네트워크 액세스를 부여하면, 에이전트가 API에 접근하고 외부 소스에서 데이터를 가져오며 결과를 다운스트림 시스템으로 푸시할 수 있습니다.

스킬이 Python 스크립트를 참조할 경우, 이를 실행하기 위해 Code Execution Tool에 의존하며, 두 기능은 함께 작동하도록 설계되어 있습니다. 조직은 코드를 실행하는 스킬 라이브러리를 구축할 수 있으며, Code Execution Tool이 런타임을 처리합니다.

자료 3: Code Execution: 모든 에이전트에서 안전하게 제공되는 온디맨드 Python

확장: 기능 저하 없이 전사 배포

하나의 파일럿 에이전트가 성공하면 자연스럽게 확장 요구가 뒤따릅니다. 즉, 5,000명의 영업 담당자 전체에 배포할 수 있는가, 여러 영업 지역 간에 공유할 수 있는가와 같은 질문이 제기됩니다. 이러한 답변은 보통 한 팀에서 효과적인 방식과 대규모 확장 환경에서 효과적인 방식 사이의 격차를 드러냅니다. 멀티 테넌트 배포에서는 그룹 간 데이터 격리가 필수입니다. 업데이트를 롤아웃하려면 프로덕션을 방해하지 않으면서 테스트할 수 있어야 합니다. 이 두 가지 문제를 해결하려면 그동안 수주에 걸친 사용자 지정 엔지니어링이 필요했습니다.

Multi-tenancy: 하나의 에이전트, 여러 테넌트, 격리된 데이터

Multi-tenancy(GA)를 사용하면 단일 Cortex Agent가 멀티 테넌트(팀, 지역 또는 고객)를 지원하면서도 별도의 에이전트 인스턴스를 배포하지 않고 엄격한 데이터 격리를 유지할 수 있도록 합니다.

이 모델은 세션 속성과 Row Access Policy를 활용합니다. 에이전트를 호출할 때 애플리케이션이 테넌트별 값을 전달하며, 이 값은 세션에 유지됩니다. 에이전트가 어떤 SQL을 실행하기 전에 해당 값이 세션 속성으로 설정됩니다. 테이블에 적용한 Row Access Policy가 이 속성을 참조해 행을 필터링하므로, 예를 들어 리전 영업 에이전트는 호출한 애플리케이션이 지정한 리전의 데이터만 볼 수 있습니다.

Snowflake는 변경 불가능한 세션 속성을 지원합니다. 즉, 테넌트 컨텍스트를 한 번 설정하면 세션 동안 생성된 SQL, 코드 실행, 도구 호출로도 이를 수정할 수 없습니다. Snowflake는 Row Access Policy에 변경 불가능한 세션 속성을 사용할 것을 강력히 권장하며, 이는 악의적인 쿼리가 테넌트 컨텍스트를 변경하려 시도하더라도 격리 요구 사항이 유지되도록 하기 위함입니다.

Agent versioning: 프로덕션을 위한 수명 주기 관리

새로운 애플리케이션 구성이 프로덕션에서 문제를 일으킬 경우, 중요한 질문은 ‘무엇이 잘못되었는가’가 아니라 ‘얼마나 빠르게 롤백할 수 있는가’입니다. Agent versioning (GA)은 개발과 프로덕션을 분리하는 커밋 기반 수명 주기 모델을 도입해 이를 해결합니다.

모든 에이전트에는 개발을 위한 변경 가능한 작업 사본인 라이브 버전이 있으며, 라이브 버전을 커밋해 만든 변경 불가능 스냅샷인 명명된 버전을 여러 개 가질 수 있습니다. 커밋을 수행하면 시스템이 VERSION$1, VERSION$2와 같은 식별자를 자동으로 할당합니다. 명명된 버전은 수정할 수 없으며, 이러한 불변성이 신뢰할 수 있는 배포의 기반이 됩니다.

Aliases는 사람이 읽기 쉬운 라우팅 레이블인 production, staging, canary 를 제공하며, 이를 명명된 버전에 할당해 사용합니다. 어떤 alias를 한 버전에서 다른 버전으로 재할당하면 호출하는 애플리케이션을 바꾸지 않아도 모든 트래픽이 새 버전으로 리디렉션됩니다. 새 버전으로 승격하는 작업은 한 줄 명령어로 수행되며, 롤백도 이전 버전을 가리키도록 하는 동일한 명령어로 실행됩니다.

Git에서 에이전트 구성을 관리하는 팀은 Git에 연결된 스테이지에서 직접 가져와 라이브 버전을 전혀 거치지 않고 버전을 생성할 수 있습니다. 그 결과, 엔지니어에게 익숙한 에이전트 배포 모델이 완성됩니다. 개발 중에 빌드하고, 스테이징에서 테스트한 뒤, 프로덕션으로 승격하고, 필요하면 롤백합니다.

자료 4: 에이전트 버전 관리: 즉시 롤백으로 구현하는 안전한 배포

거버넌스: 모든 계층에서 비용 통제

AI 에이전트 사용량은 크레딧 소비로 직결됩니다. 에이전트를 전사적으로 확산하는 기업은 아직 대부분의 플랫폼에서 표준적으로 제공되지 않는 질문에 대한 답을 필요로 합니다. 재무 팀은 공유 분석 에이전트에 비용을 얼마나 사용하고 있는가, 팀이 월간 예산을 모두 소진하면 접근이 자동으로 차단되는가, 동일한 에이전트에서 영업 팀에 엔지니어링 팀과는 별도의 한도를 설정할 수 있는가 등이 이에 해당합니다. 포괄적인 비용 관리와 사용량 추적을 통해 팀은 예산 초과에 대한 우려 없이 AI를 확장할 수 있습니다. 

Resource budgets: 에이전트 단위 비용 통제

Resource budgets for Cortex Agents(GA)는 특정 Cortex Agents 오브젝트에 월간 크레딧 사용 한도를 적용하며, Snowflake의 태그 기반 비용 기여도 모델을 통해 이를 추적합니다. 팀 단위와 조직 전체 예산을 설정하고 추적할 수 있어, 비용 사용이 가시화되고 통제되며 실제 사용량과 정렬됩니다. Snowflake는 태그가 지정된 에이전트의 크레딧 소비를 추적하고, 임계값에 도달하면 미리 구성한 동작을 실행합니다.

임계값 기반 동작 모델은 유연합니다. 80%에 도달하면 팀 리더에게 알림을 보낼 수 있으며, 100%에 도달하면 저장 프로시저가 액세스 권한을 제거합니다. 한도를 초과하는 수요가 있는 경우, 예를 들어 재무 분석 에이전트의 실적 시즌과 같은 상황에서는100%를 넘는 임계값에 사용 재개 동작을 구성하고, 이후 200%에서 완전히 차단되도록 구성할 수 있습니다. 주기 시작 동작은 각 예산 기간의 시작 시점에 액세스 권한을 자동으로 재개합니다.

예산을 통해 엔지니어링, 재무 및 기타 모든 팀은 컴퓨팅 및 스토리지에 대해 이미 보유한 것과 동일한 수준의 AI 비용 통제 권한을 확보할 수 있습니다. 에이전트 사용량이 급증하더라도 월말 요금 청구 시점까지 모르고 지나가는 상황은 발생하지 않습니다.

자료 5: Resource Budgets: 에이전트 사용 비용을 정밀하게 통제

Shared resource budgets: 공유 에이전트의 팀별 지출

리소스 예산은 에이전트 수준에서 작동하며, 어떤 팀이 실행하든 해당 에이전트의 모든 사용에 적용됩니다. Shared resource budgets(GA)은 유저 그룹 수준에서 동작합니다. 여러 팀이 같은 에이전트를 공유하되, 각 팀은 서로 독립적인 지출 한도 내에서 사용합니다. 예산은 팀 수준에서 강제되므로, 각 그룹의 사용량을 독립적으로 추적하고 통제할 수 있습니다. Snowflake는 동일한 인스턴스를 사용하는 다른 그룹과 무관하게, 공유 리소스에 대해 태그가 지정된 사용자의 크레딧 사용량을 추적합니다.

사용자가 여러 예산의 적용을 받는 경우(에이전트에 대한 리소스 수준 예산 및 팀에 대한 공유 리소스 수준 예산) 각 예산은 독립적으로 평가되며, 먼저 임계값에 도달한 쪽에 의해 사용이 중단됩니다. 예를 들어 재무 팀이 500 크레딧의 공유 예산을 모두 사용하면, 전체 에이전트가 1,000 크레딧 리소스 한도에 도달하지 않았더라도 해당 팀의 접근은 중단됩니다. 다른 팀은 계속 정상적으로 사용할 수 있습니다.

이 모델은 플랫폼 팀이 공유 인프라를 유연하게 배포할 수 있도록 하면서도 각 비즈니스 단위가 자체 사용량을 통제할 수 있게 합니다.

반복: 핵심 측정 및 문제 수정

LLM은 본질적으로 비결정적입니다. 도구 오케스트레이션은 눈에 띄지 않게 실패할 수 있으며, 에이전트는 데이터 조회를 환각으로 만들어내고도 그럴듯한 결과를 반환할 수 있습니다. 일반적인 품질 지표만으로는 도메인 특화 실패를 포착하기 어렵습니다. 정형 측정이 없으면, 시간이 지날수록 에이전트가 개선되는지 악화되는지 팀이 판단할 수 없습니다. Cortex Agent Evaluations를 사용하면 이제 보안이 적용된 Snowflake 경계 안에서 에이전틱 애플리케이션을 직접 모니터링하고 반복 개선할 수 있습니다. 

Cortex Agent Evaluations: 주관적 리뷰에서 정량화된 성과로

Cortex Agent Evaluations가 이제 GA로 제공됩니다. 이 프레임워크를 활용하면 테스트 쿼리와 에이전트의 기대 동작으로 구성된 데이터 세트를 정의하고, 에이전트에 대한 평가를 실행하며, 각 실행마다 정량화된 성능 지표를 받을 수 있습니다.

평가는 Snowflake의 Agent GPA(Goal-Plan-Action) 프레임워크를 기반으로 동작하며, 연구로 검증된 이 접근 방식은 다음 세 가지 내장형 지표를 제공합니다.

  • 도구 선택 및 실행 정확도: 에이전트가 적절한 단계에서 올바른 도구를 선택하고, 기대된 입력과 출력으로 정확히 실행했는가?
  • 답변 정확성: 에이전트의 응답이 기대 답변과 얼마나 일치하는가?
  • 논리적 일관성: 에이전트의 지침, 계획, 도구 호출이 내부적으로 일관되는가? 

GPA 프레임워크는 TRAIL/GAIA 벤치마크에서의 성능을 통해 그 신뢰성을 입증합니다. 벤치마크 테스트에서 GPA 평가는 인간이 주석으로 표시한 오류의 95%를 포착했으며(기준선 55%), 오류를 특정 추적 구간에 86% 정확도로 위치시켰습니다. 이는 단순한 합격/불합격 시스템이 아니라, 에이전트의 추론 체인에서 정확히 어느 지점에서 문제가 발생했는지를 알려줍니다.

실질적인 이점은 팀이 주관적 인간 검토에서 벗어나 구조화되고 반복 가능한 품질 측정으로 전환할 수 있다는 점입니다. 첫 프로덕션 배포 이전에 평가를 실행해 기준선을 설정하고, 이후 모든 구성 변경마다 다시 실행해 품질이 유지되는지 확인합니다. 

자료 6: Agent Evaluations: GPA로 측정, 진단 및 개선

Snowflake Intelligence로 구현하는 미래의 업무 방식

​Snowflake Intelligence는 엔터프라이즈에 새로운 업무 방식을 제시합니다. 인사이트가 단순한 답변에 그치지 않고, 비즈니스 전반에서 실제 실행으로 이어집니다.

이 경험의 뒤에는 프로덕션 AI의 모든 요구사항을 충족하도록 설계된 완전 관리형 플랫폼이 있습니다. 엔터프라이즈 도구와의 연결성, 안전한 코드 실행, 데이터 격리를 전제로 한 멀티유저 확장성, 세밀한 비용 거버넌스, 그리고 품질 개선을 위한 내장형 평가가 그 기반입니다.

이러한 역량은 AI를 대규모로 배포할 때 가장 큰 장벽을 제거합니다. 통합 복잡성을 줄이고, 거버넌스와 비용 통제를 보장하며, 신뢰할 수 있고 측정 가능한 성과를 위한 기반을 제공합니다.

Snowflake Intelligence는 이 시스템의 중심에 자리합니다. 사용자는 하나의 환경에서 질문하고, 데이터를 탐색하며, 실행까지 수행할 수 있으며, 플랫폼은 그 뒤에서 데이터, 워크플로우, 시스템을 안전하게 연결합니다. 이 통합을 통해 엔터프라이즈는 여러 도구를 억지로 결합하거나 거버넌스를 저해하지 않고도 실험 단계에서 실제 성과로 전환할 수 있습니다.

Snowflake에서 실행되기 때문에 모든 상호작용은 거버넌스가 적용된 데이터, 기존 액세스 제어, 통합 정책을 기반으로 이뤄집니다. 팀은 AI를 위해 거버넌스를 새로 구축할 필요가 없습니다. 이미 신뢰하는 체계를 그대로 확장하면 됩니다.

핵심은 Snowflake Intelligence가 개인 업무 에이전트로 작동한다는 점입니다. 사용자 컨텍스트를 이해하고 복잡한 문제 해결을 지원하며 사용자를 대신해 실행합니다. 그 결과 팀은 더 빠르게 움직이고 더 효과적으로 협업하며, 궁극적으로 AI의 속도로 작업할 수 있습니다.

Snowflake Intelligence는 프로덕션 준비가 완료된 상태로, 데이터에서 의사 결정을, 의사 결정에서 실행으로 전환합니다. 이 모든 과정은 조직이 이미 신뢰하는 데이터 플랫폼 위에서, 보안과 확장성을 갖춘 상태로 이루어집니다.

시작하기

이 기능들은 GA로 제공됩니다. 다음을 통해 자세히 살펴보세요. 

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • 30일 무료 평가판
  • 신용카드 불필요
  • 언제든지 취소 가능