제품 및 기술

SLA 책무의 수준 높이기

SLA 책무의 수준 높이기

참고: 이 내용은 2022. 6. 2에 게시된 컨텐츠(Leveling Up Our SLA Commitments)에서 번역되었습니다.

요약

Snowflake는 당사 서비스 수준 협약(SLA)에 99.99%의 목표를 추가합니다. 당사의 데이터에 따르면 99.9%를 목표로 하는 기존 SLA 고객에게 사실 더 나은 것으로 밝혀졌으므로, 해당 SLA 역시 유지합니다. 이러한 변화의 목표는 아주 복잡한 주제에서 혼동을 일으킬 수 있는 잠재 요인을 제거하여 당사의 SLA를 경쟁사와 더욱 쉽게 비교할 수 있도록 하며, 필요한 곳에 자금을 지원하기 위해서입니다.

배경 상황

Snowflake의 지원 정책은 고객에 대한 SLA를 정의합니다. 변호사만 마음에 들어 할 법한 이 문서는 당사 제품에 대해 측정하기에 좋으면서도 모호하지 않은 기준을 제공하며, 고객마다 이러한 기준으로 신뢰할 수 있는 평가를 받을 수 있습니다. 이는 높은 수준에서 99.9%의 시간 동안 1% 이하의 쿼리 오류율로 정의됩니다. 이러한 조치는 거의 항상 안정적인 서비스 제공을 보장하지만 한 달 동안 최대 43분의 중단 가능성이 있다는 것을 인정합니다.

또 다른 데이터 웨어하우스는 99.99%에 달하는 시간에 10% 이하의 오류율이라는 다른 매개변수로 SLA를 제공합니다. 이러한 조치는 항상 상대적으로 높은 백그라운드 오류 비율(최대 10%)을 허용하지만, 서비스가 완전히 중단되는 시간은 한 달에 약 4분으로 제한합니다.

SLA 위반 상황이 일어나면 두 경우에서 전부 사용자에게 사용 크레딧이 제공됩니다. 당사는 Snowflake가 제공하는 고객 서비스의 안정성을 측정하고 이러한 여러 SLA 기준의 영향을 계산할 수 있는 몇 년 전의 데이터를 보유하고 있습니다. 경험에 비추어 봤을 때 당사는 99.99%의 10% 오류율을 이용한 사용자에 비해 기존의 1% 오류 계산을 이용한 사용자에게 더 많은 크레딧을 제공하며, 당사는 이것이 고객께서 실제로 원하시는 사항인 모든 쿼리의 성공을 추구하는 더 엄격한 척도라고 믿습니다. 

새로운 SLA

2022년 6월부터 Snowflake는 다음의 가장 까다로운 두 가지 기준에 따라 SLA 쿼리를 성공적으로 실행할 것을 약속합니다.

  • 99.9%에 달하는 시간 동안 오류율 1% 미만
  • 99.99%에 달하는 시간 동안 오류율 10% 미만

이러한 조치는 기본적으로 이제 당사가 매우 높은 오류 비율을 보인 4분~43분 사이의 대규모 서비스 중단 1회에 대해서는 수 개월간 고객에게 크레딧을 제공할 예정임을 뜻합니다. 이 정도의 중단 상황은 Snowflake에서 흔히 벌어지는 일이 아닙니다. 당사 데이터에 따르면 특정 달의 99.99% SLA에 대해 오류율 10%를 허용하는 조치를 적용하는 것만으로도 고객의 SLA 크레딧이 40% 감소하게 됩니다. 두 SLA의 장점을 전부 적용함으로써 고객께서는 크레딧 발행 수가 약 24% 증가하는 것을 볼 수 있습니다. 현재 거의 모든 중단 상황이 기존 SLA에 포함되어 있기 때문에 이러한 조치는 불균형합니다. 이러한 변경 조치는 서비스 중단을 방지하는 것의 중요성을 인식하고 당사가 계속해서 우수한 서비스를 제공할 수 있도록 당사의 인센티브를 고객의 인센티브와 맞추는 것입니다.

신뢰성 엔지니어를 위한 기술적 세부 사항

이러한 산업 표준 SLA 기준은 사용자의 경험을 제대로 측정하지 못합니다. 기본 SLI(서비스 수준 지표)는 쿼리 실행에 중점을 두므로 클라이언트 라이브러리 동작부터 올바른 결과 제공에 이르기까지 실제 사용자 워크플로의 여러 중대한 구성 요소를 놓칩니다. 또한 이러한 측정 방식은 암암리에 사용자의 Snowflake 도달 및 인증 여부에 의존합니다.

당사는 현재 추가 가용성 자원을 모니터링하며 이를 내부 SLO(서비스 수준 목표)에 통합합니다. 당사는 SLO 위반 시 그 이유를 이해하기 위해 엄격한 내부 엔지니어링 사후 검토를 진행하며 이러한 위반이 사용자에게 영향을 미칠 경우 해당 문제의 근본적인 원인을 알아내기 위해 진행한 외부 버전의 분석을 게시합니다. 당사는 Snowflake 배치를 통해 이러한 사후 검토 데이터를 종합하며 이에 해당하는 '가용성' 데이터를 당사의 커뮤니티 사이트에 올립니다. 이러한 종합 척도가 SLA 크레딧으로 곧바로 변환되지는 않지만, 이는 시간의 흐름에 따라 증가하는 안정성에 대한 인사이트를 제공해 줍니다.

기사 공유하기

Snowpark ML, Snowflake Notebooks, Snowflake Feature Store로 손쉽게 ML 구축하고 배포하기

Snowflake의 AI/ML 관련 신규 발표를 통해 공개된 Snowpark ML, Snowflake Notebooks, Snowflake Feature Store는 데이터 사이언티스트의 머신러닝 워크플로우 간소화를 지원합니다. 자세히 알아보세요.

Snowpark: 관리형 컨테이너, ML API, Python 런타임, DevOps 등

Snowflake는 현재 라이브러리 및 런타임에 대한 새로운 발전 사항을 통해 Python 데이터 과학자와 데이터 엔지니어가 데이터 클라우드에서 훨씬 더 쉽게 개발할 수 있도록 하고 있습니다. Snowflake가 이를 어떻게 실현하고 있는지 알아보세요.

금융 서비스 산업과 비정형 데이터: 합리적인 엔터프라이즈 AI 전략의 필수 요소

비정형 데이터가 금융 서비스 산업의 엔터프라이즈 AI 전략에 중요한 이유를 알아보세요. AI를 통해 데이터를 처리하고 활용하여 어떻게 고객의 가치를 창출하는지 알아보세요.

Unistore: 하나의 플랫폼에서 트랜잭션 데이터와 분석 데이터를 함께 처리하는 Snowflake의 새로운 워크로드

Snowflake의 새로운 워크로드 Unistore 덕분에 트랜잭션 데이터와 분석 데이터 사이에 오래 존재해 오던 사일로가 마침내 허물어지고 있습니다. 더 자세히 알아보세요.

Snowflake 교육 프로그램의 이점: 설문조사로 입증된 강력한 ROI

선도적인 기업들은 광범위한 효율성, 혁신 및 비용 절감 촉진을 위해 Snowflake 교육 프로그램을 활용하고 있습니다. Snowflake의 Train for Success 보고서를 통해 더 자세히 알아보세요.

AI의 ROI 확보는 총 경제적 효과의 파악으로부터 --- Snowflake의 TEI

AI 이니셔티브의 총 경제적 효과(TEI)를 파악하여 AI 이니셔티브의 높은 ROI를 보장하는 방법을 알아보세요. Snowflake의 AI 데이터 클라우드가 어떻게 3년 만에 354%의 ROI를 가져다 줬는지를 이점과 비용 그리고 유연성과 위험성에 대한 인사이트와 함께 살펴보세요.

비즈니스 연속성 체크리스트 - Snowflake 블로그

더 많은 데이터 워크로드가 클라우드로 이동함에 따라 오래된 플레이북에 대해 재고해야 합니다. 다음은 재해 복구 및 비즈니스 연속성 계획을 수립하는 다섯 가지 단계입니다.

차세대 충성도 프로그램은 생태계 | Snowflake 블로그

Amazon과 같은 대기업은 단순한 충성도 프로그램이 아닌 충성도 생태계를 만들었습니다. 어떻게 하면 소규모 회사가 데이터를 사용하여 이를 따라잡을 수 있을까요?

시험 개발의 비하인드 스토리 알아보기

유효하고 신뢰할 수 있으며 공평한 전문가 인증서 시험은 국제 정신 측정 가이드라인과 대단히 흥미로운 반복 프로세스에 따라 진행됩니다. 자세히 알아보세요.

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • 30일 무료 평가판
  • 신용카드 불필요
  • 언제든지 취소 가능