사용량 기준 가격이 예산 친화적인 클라우드 데이터 웨어하우스를 제공하는 방법
참고: 이 내용은 2022. 5. 5에 게시된 컨텐츠(How Usage-Based Pricing Delivers a Budget-Friendly Cloud Data Warehouse)에서 번역되었습니다.
참고: 이 게시물은 2018년에 처음 게시되었습니다. 그 후 현재 사용 가능한 제품, 기능 및 성능을 반영하도록 내용이 업데이트되었습니다.
Snowflake 데이터 클라우드는 거의 즉각적인 탄력성을 갖추고 있어 고객이 수요를 충족하기 위해 스케일업 및 스케일다운할 수 있습니다. 이러한 요구사항이 예측 가능하든 변동성이 크든 상관없이 시스템은 주요 데이터 워크로드에 대한 결과를 제공하기 위해 유연하게 조정되며, 필요한 용량보다 더 많은 용량을 제공하지 않습니다. 또한 사용자는 완전히 격리된 다수의 컴퓨팅 클러스터에서 쿼리할 수 있는 거의 무제한 규모의 데이터 저장소를 보유하고 있으므로 일부 워크로드에서 활동이 크게 급증하더라도 서로 부정적인 영향을 미치지 않고 동시 워크로드를 실행할 수 있습니다. 이러한 유형의 유연성은 강력하지만 이러한 유연성에 따라 수요가 급증하여 지출이 급증할 위험이 있습니다.
Snowflake는 사용량과 지출에 대한 명확한 가시성, 모니터링 및 리소스 사용량이 예상보다 많을 때 알림 전송, 상한에 도달하면 사용을 차단할 수 있는 강력한 비용 제어를 통해 진정한 클라우드 탄력성의 균형을 유지해줍니다. 이 게시물에서는 고객이 이러한 기능을 사용하여 유연성과 제어 사이에서 필요한 균형을 어떻게 맞출 수 있는지 설명합니다.
간단한 가격 책정 모델
Snowflake의 가격 책정 모델은 주로 2개의 소비 기반 메트릭: 컴퓨팅 사용 및 데이터 스토리지의 사용을 기반으로 하고 있습니다.
컴퓨팅 요금은 Snowpipe로 데이터 로딩과 같은 쿼리를 실행하거나 서비스를 수행하는 데 사용되는 크레딧 수를 기준으로 합니다. 크레딧은 사용된 에디션(표준, 엔터프라이즈 또는 비즈니스 크리티컬)에 따라 가격 책정률이 있으며, 각 에디션에는 서로 다른 기능 목록이 함께 제공됩니다. 컴퓨팅 클러스터 사용 시간 또는 서버리스 운영에는 크레딧이 소비되며, 모든 컴퓨팅 비용은 예측 또는 추정 사용량이 아닌 실제 사용량에 따라 청구됩니다(초).
스토리지 비용은 클라우드 공급업체가 전달한 지역 또는 클라우드 간 데이터 이동 비용뿐만 아니라 매월 저장되는 바이트 수를 기준으로 합니다. 스토리지 비용은 저장된 모든 데이터를 자동으로 압축하고 총 압축 파일 크기는 계정의 스토리지 비용을 계산하는 데 사용됩니다.
모든 요금은 사용량 기준
예를 들어, 미국의 경우 Snowflake 스토리지 비용은 저장된 데이터의 압축 TB당 평균 미화 23달러(한 달 평균)의 고정 요금으로 시작합니다. 컴퓨팅 비용은 Snowflake 스탠다드 에디션에서 소비되는 각 크레딧에 대해 초당 $0.00056인 반면, Snowflake 엔터프라이즈 에디션(고객 관리 암호화 키 및 기타 보안 강화 기능을 포함하며 HIPAA 및 PCI 규정 준수를 가능하게 함)은 소비되는 각 크레딧에 대해 초당 $0.0011입니다.
명확하고 간단한 컴퓨팅 크기 조정
Snowflake 사용자는 쿼리 실행을 지원하는 컴퓨팅 리소스의 논리적 그룹인 ‘가상 웨어하우스’를 얼마든지 사용할 수 있습니다. 가상 데이터 웨어하우스는 X-Small, Small, Medium, Large 및 X-Large에서 6X-Large까지 10가지 ‘T-shirt’ 크기로 제공됩니다(5XL 및 6XL은 미리 보기에). 각 데이터 웨어하우스 크기에는 초당 소비되는 컴퓨팅 크레딧 수가 있습니다. 규모를 확장하여 가상 웨어하우스의 컴퓨팅 용량을 두 배로 늘리면 크레딧 사용량도 두 배로 증가합니다. Snowflake의 성능은 선형적입니다. 일반적으로 웨어하우스 크기를 두 배로 늘리면 작업 시간이 절반으로 줄어들기 때문에 동일한 비용이 발생합니다.
유휴 컴퓨팅 시간에 대해 요금 없음
Snowflake는 고객에게 진정한 리소스 탄력성을 제공합니다. 당사의 소비 기반 가격 모델은 초 단위로 사용 요금이 청구됩니다. 또한 거의 즉각적인 자동 중지 및 거의 즉각적인 자동 재개 기능을 통해 불필요한 리소스 비용이 발생하지 않습니다. 각 워크로드는 다른 작업에 영향을 미치지 않고 독립적인 확장을 지원하는 자체 컴퓨팅 리소스 세트를 가질 수 있습니다. 한편, 이러한 모든 클러스터는 모든 데이터를 볼 수 있으므로 사일로로 인해 데이터 가용성이 저하되지 않습니다.
모든 쿼리는 쿼리가 시작된 가상 웨어하우스에서 자동으로 실행됩니다. Snowflake의 큰 이점 중 하나는 사용자 정의 규칙을 사용하여 수동 또는 자동으로 실행 중인 쿼리가 없을 경우 특정 가상 웨어하우스를 일시 중단할 수 있다는 것입니다(예: ‘비활성 상태 2분 후 일시 중단’). 일시 중단되면 유휴 컴퓨팅 시간에도 요금이 일시 중단됩니다.
일시 중단, 재개, 증가 및 감소를 포함한 운영은 기본적으로 즉각적으로 이루어지기 때문에 고객은 예상치 못한 사용에 대한 여유 공간이나 용량 계획에 대한 걱정 없이 실제 사용량에 맞게 지출을 정확하게 맞출 수 있습니다.
다른 데이터 플랫폼 솔루션과 함께 서비스를 종료하여 과금을 중단하면 종료 시 데이터가 데이터 웨어하우스에서 자동으로 삭제됩니다. 나중에 해당 데이터에 대해 쿼리를 실행해야 하는 경우 웨어하우스를 재프로비저닝하고 데이터를 다시 로드해야 하므로 시간과 비용이 소모됩니다. 이러한 비효율성 때문에 이 설계의 데이터 플랫폼은 쿼리 실행 여부에 상관없이 미터기가 작동되는 상태로 연중무휴 활성 상태를 유지하는 경우가 많습니다.
Snowflake에서 일시 중지된 가상 웨어하우스에 대한 새 쿼리를 처리할 때 플랫폼은 지연이나 수동 재프로비저닝 없이 해당 클러스터를 자동으로 다시 시작합니다. 따라서 필요할 때 용량을 사용할 수 있으며, 필요 없을 때는 비용을 지불할 필요가 없습니다.
유연성 및 예측 가능성
Snowflake에서 쿼리를 실행할 때 용량 예측이 필요하지 않으며, 고정된 사용량 할당량이나 숨겨진 가격 프리미엄도 없습니다. 사용량에 대해서만 비용을 지불하면 데이터 클라우드는 거의 실시간으로 용량을 자동으로 늘리거나 줄여 수요를 충족합니다.
온프레미스 데이터 플랫폼과 사전 클라우드 아키텍처가 있는 클라우드 데이터 플랫폼은 용량과 수요를 실시간으로 맞추는 것을 거의 불가능하게 만듭니다. 시스템이 적시 프로비저닝에 충분히 신속하게 대응하지 못하거나 가격 책정 모델이 너무 경직되면 높은 비용, 제한된 성능 또는 둘 다 부담하게 됩니다.
예상치 못한 수요를 감안하기 위한 버퍼로서 사용자가 실제 필요한 용량보다 더 많은 용량을 가지고 있을 때 높은 비용이 발생합니다. 성능 저하는 더 많은 수요가 있는데 시스템의 민첩성이 충분하지 못해서 확장하지 못할 때 발생합니다. 수동으로 스케줄에 따라 또는 자동 크기 조정을 사용하여 추가 또는 제거할 수 있는 Snowflake의 거의 즉각적인 리소스 탄력성을 통해 이러한 문제를 제거하고 고객이 리소스를 과도하게 프로비저닝하지 않고도 필요할 때 충분한 용량을 확보할 수 있습니다.
일부 클라우드 데이터 플랫폼은 쿼리 실행 시간이 아닌 검색된 테라바이트 수 또는 쿼리에서 반환된 테라바이트 수에 따라 과금됩니다. 이것은 유연하지만 사용자나 애플리케이션이 지정된 쿼리로 검색 또는 반환되는 데이터의 양을 예측할 수 없기 때문에 문제가 될 수 있으며, 이로 인해 매달 매우 변동적이고 예측 불가능한 가격이 책정됩니다.
비용 거버넌스 및 제어
고객이 Snowflake와 함께 제공되는 높은 수준의 탄력성으로 인해 사용자가 예산을 너무 빨리 지출할까봐 우려한다면 어떻게 해야 합니까? 일부 고객은 민첩성을 무엇보다도 우선시하며 데이터 엔지니어와 분석가가 그들의 데이터로 상상할 수 있는 모든 것을 실현할 수 있다는 사실에 만족합니다.
지출을 제어하려는 조직을 위해 Snowflake는 비용 관리 및 제어를 위한 강력한 툴셋을 제공합니다. 사용자는 과거 사용 패턴과 예측된 사용 패턴을 완벽하게 파악할 수 있으며 세부적인 수준에서 사용량에 대한 경고 또는 엄격한 제한을 설정할 수 있습니다. 일별, 주별, 월별 또는 연간 소비 한도에 대한 제한을 설정할 수 있습니다. 각 회사의 재량에 따라 이러한 제한은 정보 통지 또는 할당량에 도달했을 때 추가 사용을 방지하는 한도일 수 있습니다. 가상 웨어하우스 수준에서 제한을 정의할 수 있으므로 다양한 중요도 수준을 가진 여러 부서 및 워크로드에서 특정 사용 사례에 적합한 제한을 설정할 수 있습니다.
또 다른 비용 거버넌스 기능인 오브젝트 태그 지정은 여러 객체를 쉽게 분류하고 태그별로 지출을 그룹화할 수 있게 해줍니다.
간단함, 비용 효율성 및 고성능 유지
클라우드 인프라의 탄력성을 활용하도록 설계되지 않았던 기존의 온프레미스 데이터 웨어하우스 기술이나 클라우드 기반 데이터 웨어하우스와 달리, Snowflake의 데이터 클라우드를 사용하면 데이터 및 예산 관련 작업을 쉽게 수행할 수 있습니다. Snowflake는 기존 데이터 웨어하우스 솔루션보다 훨씬 적은 관리 노력으로 데이터에서 최대한 많은 통찰력을 이끌어냅니다. Snowflake는 기존 솔루션의 번거로움을 제거하여 비즈니스를 발전시키는 전략적 데이터 분석 및 엔지니어링 프로젝트에 집중할 수 있게 해줍니다.