Data for Breakfast 서울 - 3월 19일 (목)

데이터와 에이전틱 인텔리전스로 비즈니스 가치를 실현하세요!

고객 사례

외부 LiDAR 데이터를 활용해 보험료 산정의 투명성을 높이고 의미 있는 인사이트를 확보한 Zurich Insurance Group

Zurich Insurance Group은 10TB 규모의 영국 정부 LiDAR 데이터에 포함된 3,000억 개의 데이터 포인트를 처리함으로써, 위험도를 더욱 정확히 분석하고, 그에 따라 보험료를 산정하며 새로운 고객을 유치하는 데 활용합니다.

3,000억 개 영국 국가 LiDAR 데이터 세트에 포함된 데이터 포인트 수

100 시간 전체 데이터 처리에 소요되는 시간

a woman sitting at a desk in front of a laptop
marketwise logo
업종
Financial Services
위치
London, England

방대한 공공 데이터 세트를 의미 있는 인사이트로

영미권에서 어떤 보험이든 가입해본 경험이 있다면 Zurich Insurance Group(이하 Zurich)이라는 이름을 한 번쯤 들어봤을 것입니다. Zurich은 기업은 물론, 정부, 학교, 병원 등 다양한 공공 부문 기관에 보험 상품을 제공하는 세계적인 보험사입니다.

다른 보험사들과 마찬가지로, Zurich 역시 데이터를 활용해 위험도를 평가하고 보험 상품의 언더라이팅을 수행합니다. 그러나 개인이나 자산에 대한 데이터가 충분히 있더라도 서로 다른 형식으로 제공되는 경우가 많기 때문에 위험도 평가나 보험료 산정에 효과적으로 활용하는 데는 한계가 있습니다.

Snowflake의 오랜 고객인 Zurich는 AI 데이터 클라우드를 사용하여, 영국 정부가 보유한 3,000억 개 이상의 데이터 포인트를 활용 가능한 형태로 전환했으며, 이를 통해 언더라이팅 프로세스의 일부를 자동화하고, 보험료 산정의 투명성을 높이는 동시에 신규 고객 확보에도 기여하고 있습니다.

주요 내용
  • 복잡한 데이터에서 의미 있는 인사이트 도출: Zurich는 약 10TB 상당의 LiDAR 데이터로 이루어진 6,500개의 파일을 처리하여 정확한 인사이트를 도출합니다. 이를 통해 언더라이터의 보험 인수 의사 결정을 더욱 정교하게 지원하고, 고객이 자신의 필요에 맞는 최상의 보험 상품을 합리적인 가격에 선택할 수 있게 합니다.
  • 네이티브 Python 지원: Zurich 팀은 Snowpark에서 사전 구축된 Python 라이브러리를 사용할 수 있기 때문에 LiDAR 데이터를 보강하고 위험도를 더욱 정확하게 분석할 수 있는 알고리즘을 개발할 수 있습니다.
  • 보다 효율적인 언더라이팅과 투명한 보험료 산정: 언더라이터는 건물 위험도를 더 빠르게 평가하고 보다 정확한 언더라이팅을 수행하며 보다 합리적인 보험료를 제시할 수 있습니다. 이러한 개선은 신규 고객 유치뿐만 아니라 기존 고객 유지에도 도움이 됩니다.

국가 LiDAR 데이터 세트 활용

데이터는 수십 년 동안 보험 산업의 생명줄과 같은 핵심 기반이었습니다. 하지만 최근 몇 년 사이 활용 가능한 데이터 세트와 이를 활용하는 방식이 크게 바뀌었습니다. Zurich의 데이터 사이언스 리드인 Jonathan Davis는 이렇게 설명합니다.“이제는 데이터를 단순히 보관하는 데서 그치지 않고, 최대한 활용하려는 움직임이 나타나고 있습니다. 또한 외부 데이터에 대한 관심도 점점 커지고 있습니다. 그중에는 무료로 이용할 수 있는 데이터도 많지만, 실제로 활용하기 쉽지 않은 경우가 대부분입니다.”

특히 Zurich 영국 사업부는 영국 정부가 제공하는 국가 LiDAR(레이저 기반 거리 측정) 데이터에 주목했습니다. 이 데이터는 잉글랜드 역내 건물들의 높이와 그 주변 환경에 대한 정보를 담고 있습니다. 이 데이터의 잠재적 사용 사례는 방대합니다. Zurich 팀은 이를 통해 건물의 높이뿐만 아니라, 인근에 있는 나무의 높이와 거리, 그리고 언더라이팅 결정에 영향을 미칠 수 있는 여타 물리적 위험 요소를 파악할 수 있습니다.

하지만 Zurich의 기존 인프라는 수십억 개의 데이터 포인트로 이루어진 이 데이터를 합리적인 시간 안에 처리하기에는 역부족이었습니다. Davis는 이렇게 말합니다. “이론적으로는 가능해 보였습니다. 그래서 Python과 일반 SQL 서버에서 기존 방식대로 데이터 로딩을 시도했지만 금방 실패했습니다. 6,500개의 파일 중 단 하나만을 대상으로 진행한 개념 증명(PoC) 프로젝트에서도 확장 가능성은 전혀 보이지 않았습니다.”

silhouette of a cameraman operator operating a camera

“데이터를 다시 처리하고 재수집하는 데 많은 시간이 걸릴 수도 있었습니다. 하지만 Snowflake는 데이터를 안정적으로 읽을 수 있는 방식을 제공했고, 로그도 잘 남기기 때문에 문제를 쉽게 파악하고 작업을 이어서 진행할 수 있었습니다.”

Isaac Brocklesby
Data Scientist, Zurich

Python 라이브러리, 지리 공간 지원, 확장성 모두 한곳에서 제공

Zurich는 이미 수년 전부터 Snowflake를 활용해 언더라이팅 데이터를 수집하고 처리해왔습니다. 그리고 AI 데이터 클라우드를 통해 Davis와 그의 팀은 이러한 LiDAR 데이터 사용 사례를 구현하는 데 필요한 확장성, 처리 성능 그리고 다양한 기능을 확보할 수 있었습니다.

Davis는 이렇게 설명합니다. “네이티브 지리 공간 지원은 필수적이었습니다. 또한 Snowpark에서 Python을 지원한다는 점도 매우 유용했습니다. 저희 팀은 Python에 익숙하기 때문에, 로컬 개발 환경에서 작업한 뒤 Snowflake로 푸시하면 모든 것이 자연스럽게 연동된다는 점이 매우 좋습니다.”

Python 외에, 다양한 언어를 네이티브로 지원한다는 점 덕분에 팀은 이 사용 사례를 가능하게 하는 중요한 사전 구축 라이브러리들을 사용할 수 있었습니다. Zurich의 데이터 사이언티스트 Issac Brocklesby는 이렇게 덧붙입니다. “LAZ와 LAS 파일은 LiDAR 데이터에서 흔히 사용되는 형식인데, 이런 파일 형식을 읽을 수 있는 지원은 많지 않습니다. 하지만 Python에는 이를 처리할 수 있는 매우 훌륭한 패키지 두 가지가 있습니다. 만일 이런 라이브러리에 액세스할 수 없었다면 이 사용 사례를 구현하는 과정이 훨씬 더 힘들었을 것입니다.”

더 빠르고 공정한 언더라이팅과 보험료 산정

이 사용 사례는 Zurich에서 오래 전부터 준비해 온 프로젝트였지만 일단 AI 데이터 클라우드가 투입되자 데이터 처리가 매우 빠르게 진행됐습니다. Medium 사이즈 Snowpark 웨어하우스를 사용해 단 100시간 만에 모든 데이터를 처리하고 준비를 마칠 수 있었습니다. 이러한 데이터 세트 준비 이후 Zurich는 개인 및 기업 보험 언더라이팅 전반에서 상당한 효과를 보기 시작했습니다

“위험에 대한 이해가 향상된 것이 얼마나 큰 가치를 지니는지, 그리고 이것이 저희 회사와 고객에게 어떤 가치를 가져올지 정확히 평가하기는 어렵습니다. 다만 비용 절감과 매출 증가에 도움이 될 것으로 기대하고 있습니다.”

Jonathan Davis
Data Science Lead, Zurich

Zurich의 AI 데이터 리드인 Anna Collins는 이렇게 말합니다. "위험을 더 깊이 이해하면 모든 유형의 언더라이팅에서 실질적인 이점을 얻을 수 있습니다. 이제는 어떤 건물이 고층인지 중층인지 정확히 파악할 수 있고, 홍수나 강풍으로 인한 피해 위험도 더 정확하게 평가할 수 있습니다."

또한 각 건물의 정확한 높이와 주변 환경에 대한 데이터를 확보함으로써 나무가 쓰러져 건물을 덮칠 위험이나, 시간이 지나면서 손상될 수 있는 평지붕의 면적 등도 계산할 수 있습니다. Brocklesby는 이렇게 설명합니다. "이 모든 데이터를 제대로 된 위험 분석으로 전환하기 위해 여러 복잡한 알고리즘을 개발했습니다. 두 지점 간의 공간적 관계를 계산하는 작업은 비용이 많이 드는 경향이 있지만, Snowflake의 H3 기능을 활용하면 공간 인덱싱을 통해 높이 데이터 간의 관계를 계산할 수 있습니다. 이는 훨씬 빠를 뿐 아니라, 해당 데이터 세트에서 가치를 끌어내는 데 핵심적인 역할을 했습니다."

더 많은 인사이트를 확보하면서 Zurich는 상당한 손실로 이어질 수 있는 위험을 보험으로 인수하는 상황을 피할 수 있게 되었습니다. 이뿐만 아니라, 개별 건에 대한 보험료도 더 정확하게 산정할 수 있게 되면서, 다른 보험사에서 잘못된 분류로 더 비싼 보험 상품을 제시받던 고객을 신규 고객으로 유치할 가능성도 높아졌습니다. 

그리고 Zurich와 계약을 체결하는 고객은 자신의 상황을 더 잘 이해하는 보험사를 통해 더 나은 서비스를 경험할 수 있게 되었습니다. Davis는 이렇게 덧붙입니다. "이제 서비스 속도가 훨씬 빨라졌습니다. 보험료 견적 산출과 가입 단계에서 예전처럼 많은 질문을 할 필요가 없습니다. 그동안 고객들이 ‘이 정도라면 당연히 알고 있어야 하는 것 아닌가?’라고 생각했을 법한 정보를 이제는 미리 다 파악하고 있습니다.”

정확한 LiDAR 데이터는 Zurich의 언더라이팅 프로세스 효율성도 크게 높였습니다. Zurich의 머신러닝 수석 엔지니어인 Will Davis는 이렇게 설명합니다. "과거에는 언더라이터들이 건물 높이를 추정하기 위해 Google Street View를 활용하는 경우가 많았습니다. 그래서 주소 하나당 몇 분씩 걸렸습니다. 하지만 이제는 거의 즉시 확인할 수 있습니다. 수천 개의 자산으로 구성되어 있는 포트폴리오라면 상당한 시간을 절약할수 있습니다."

국가 LiDAR 데이터 활용을 더 많은 사용자로 확대

Zurich는 이미 국가 LiDAR 데이터 세트를 수집하고 변환하는 과정에서 상당한 효과를 확인했습니다. 하지만 이제 시작에 불과합니다. Davis는 이렇게 말합니다. “이건 방대한 데이터의 보고입니다. 충분한 시간을 들여 살펴보면 가치 있는 정보를 훨씬 더 많이 발견할 수 있을 것입니다. 앞으로 추가적으로 진행하고 싶은 데이터 보강 작업이 아직 많이 남아 있습니다.”

또한 Zurich 팀은 LiDAR 데이터를 조직 내부 구성원 누구나 사용할 수 있는 셀프 서비스 플랫폼 형태로 제공하는 방안도 고려하고 있습니다. 이를 구현하기 위한 방법으로 Davis는 LiDAR 데이터 세트를 기반으로 한 네이티브 앱을 개발하는 데 Snowflake의 Streamlit 지원 기능을 활용하는 방안을 검토하고 있습니다. 또한 Snowflake에서 AI 및 머신러닝 모델을 배포하여 사용자들이 다양한 모델을 실행할 수 있는 관리형 계층을 구축할 수 있는 방안도 고려하고 있습니다.

하지만 Zurich 팀이 미래를 기대하는 이유는 Snowflake 플랫폼의 기능 때문만이 아닙니다. Davis와 데이터 사이언스 팀은 새로운 사용 사례를 가능하게 하는 Snowflake의 지속적인 지원에도 기대를 걸고 있습니다. Davis는 이렇게 말합니다. “Snowflake 팀은 저희가 필요로 했던 일부 Python 라이브러리에 대한 지원도 추가해 줬습니다. 플랫폼 자체도 물론 강력하지만, 저희가 받은 지원이 정말 큰 차이를 만들어 냈습니다.”  

Where Data Does More

  • 30일 무료 평가판
  • 신용카드 불필요
  • 언제든지 취소 가능