
고객 사례
미래에셋자산운용, AI 투자 모델 데이터 작업 효율화로 운영 부담과 비용은 줄이고, 작업 속도는 대폭 향상
2016년부터 AI 투자 모델을 개발해온 미래에셋자산운용은 2024년 내외부의 데이터를 AI 투자 모델로 투입하는 데이터 파이프라인을 구축형에서 스노우플레이크 데이터 클라우드로 전환했다.
주요 결과
294%
단일 클러스터 대비 성능 향상
15시간에서 3분
작업 시간 단축


업종
Financial Services위치
한국고객사 소개
미래에셋자산운용은 글로벌 투자 전문 기업으로 다양한 자산에 대한 투자 상품을 제공하고 있다. 1997년 설립 후 전세계 16개 지역에 글로벌 운용 네트워크를 구축하고 현재 354조원 이상의 자산을 운용 중이다. 대표 투자 상품인 ETF의 순자산 규모는 142조원이며, 전 세계 운용사 중 12위에 해당한다.
스토리 하이라이트
- 마켓플레이스 통한 AI 투자 모델 개발 시간 단축 및 비용 절감: Data Sharing 기능으로 벤더의 최신 데이터세트를 쉽게 공유받고 데이터 파이프라인 단일화. 데이터 전처리 작업의 시간, 비용 등의 측면의 효율성 증가.
- Multi-cluster 기능으로 294% 성능 개선: 미래에셋자산운용은 스노우플레이크의 Task, Multi-cluster, Stream, Time Travel, Zero copy cloning 등의 기능을 활용 중. Multi-cluster 기능으로 4개 클러스터가 30개 쿼리를 나눠 실행했을 때 단일 클러스터 대비 35% 비용 추가로 최대 294% 성능 개선.
- 금융 데이터 분석의 속도를 높여 투자 기회를 선점: 마켓플레이스를 통해 데이터 워크플로우를 대폭 단축시켜 연구 개발 프로세스를 효율화. 특정 배치 프로시저의 경우 15시간 걸리던 작업을 최대 확장 시 3분 이내에 완료할 수 있게 됨.
스노우플레이크 도입 배경
미래에셋자산운용의 AI 투자모델을 위한 인풋 데이터는 S&P글로벌, FACTSET 같은 금융 데이터 기업으로부터 구매한 재무 회계 데이터가 주를 이룬다. AI 투자 모델의 미래 수익률 예측에 활용되는 데이터는 금융 모델, 가격, 거래량, 매크로 등으로 다양하다.
기존 데이터 환경은 데이터 벤더로부터 FTP로 전송받은 원본 데이터를 추출·변환·적재(ETL)와 데이터 전처리 과정을 거쳐 AI 투자 모델로 넣는 복잡한 흐름을 갖고 있었다. 데이터 소스마다 별도의 파이프라인과 인프라를 운영해 갈수록 부담이 커지는 구조였다.
이같은 환경은 복잡한 데이터 관리 문제를 발생시켰다. 과거 시점별 데이터 추출을 위한 데이터 변경 이력을 저장하는 니즈는 스토리지 용량 부담을 누적시켰다. AI 모델 학습을 위해 잘 정제한 데이터를 AI 부서 외의 현업 부서와 해외 법인에도 제공할 수 있게 데이터 접근성도 개선해야 했다. 운영 비용은 늘어나고 데이터 관리 복잡성은 커졌으며, 확장성 부족의 한계가 드러났다.
스노우플레이크를 도입하면서 AI 투자 모델을 위한 데이터 처리 작업의 시간과 부담이 획기적으로 줄었고, 프로세스가 훨씬 더 효율화됐습니다. 덕분에 반복적인 데이터처리 업무보다 전략 수립과 모델 개발에 더 집중할 수 있는 환경이 조성되었습니다.
최용민
AI 투자 모델 294% 성능 향상 및 투자 모델 개발 시간 단축, 비용 절감
미래에셋자산운용은 스노우플레이크 마켓플레이스의 Data sharing 기능을 통해 데이터 벤더의 최신 데이터세트를 쉽게 공유받게 됐으며, 데이터 파이프라인이 스노우플레이크로 단일화됐다. 물리적인 데이터 복제와 데이터 수집 파이프라인이 사라졌고, 더 빠르고 편리하게 잦은 주기로 데이터를 확보할 수 있게 됐다.
데이터마켓인 스노우플레이크 마켓플레이스에서 데이터 벤더 기업은 다양한 SaaS 커넥터를 활용해 데이터 상품을 직접 전달하므로 기존 ETL 프로세스 관련 비용과 업무가 사라졌다. 마켓플레이스에서 구매한 데이터는 스노우플레이크에서 즉시 조회 가능한 형태여서 AI 투자 모델에서 바로 활용할 수 있다. 데이터 공급기업이 정보를 업데이트하면 곧바로 미래에셋자산운용의 데이터도 변경된다.
기존에 운영하던 ETL 프로시저도 스노우플레이크 플랫폼에서 동일하게 사용할 수 있었다. 주요 기능은 1:1로 치환해 변환할 수 있었고, 그외 구문은 로직 변경 없이 그대로 사용 가능했다.
스노우플레이크는 데이터 전처리 작업의 시간, 비용 등의 측면에서 효율성을 높였다. 스노우플레이크 마켓플레이스의 데이터는 바로 AI 모델에서 활용가능한 형태로 흘러들어가 AI 투자 모델 학습에 돌입하는 시간을 대폭 줄였다. 스노우플레이크는 데이터 용량에 상관없이 실제로 컴퓨팅 자원의 사용량에 따라 과금한다. AI 모델이 데이터를 활용할 때만 비용을 지불하면 되기 때문에 용량 증가 부담을 덜었을 뿐 아니라, 모델 학습 시 자원 할당 최적화 전략을 통해 시간을 단축하고 비용도 줄이게 됐다.
미래에셋자산운용은 스노우플레이크의 Task, Multi-cluster, Stream, Time Travel, Zero copy cloning 등의 기능을 활용 중이다.
Task는 주기적으로 SQL이나 프로시저를 호출해 데이터의 최신성을 유지한다. 여러 Task 가 연속적으로 실행되도록 구현할 수 있다. Task와 Stream 기능을 결합한 스케줄링으로 스노우플레이크 테이블로 데이터를 자동 적재할 수 있다. 또한 선언적 데이터 파이프라인인 ‘Dynamic Table’ 을 활용하면 최종 타깃 테이블에 대한 SQL 정의만으로 소스 테이블의 변경 사항이 자동으로 반영된다.
Multi-cluster 기능은 동시 쿼리 작업의 성능을 향상시키고 비용을 줄인다. 미래에셋자산운용은 Multi-cluster 기능을 사용해 30개 샘플 쿼리를 동시 실행할 때 자동으로 부하 분산되는 지를 확인했다. 4개 클러스터가 30개 쿼리를 나눠 실행했을 때 단일 클러스터 대비 35% 비용 추가로 최대 294% 성능을 개선할 수 있는 것으로 확인됐다.
Stream과 Time Travel, Zero copy cloning 등은 데이터 변경 이력 관리를 용이하게 해 AI 투자 모델의 결과를 좌우하는 ‘Point in time’ 데이터 관리를 지원한다. AI 투자 모델이 투자 포트폴리오를 구성할 때 각 종목별 점수와 투자 전략을 기반으로 결정하게 된다. AI 투자 모델은 과거 데이터를 학습해 수식을 만들고 검증하는 과정을 거쳐 만들어지는데, 모델 학습에 활용되는 데이터의 품질과 시점에 따라 완성도가 갈린다. 재무 회계 데이터의 경우 수시로 변경될 수 있어서 데이터 변경 이력 관리가 매우 중요하다. 데이터 시점에 따라 AI 투자 모델의 결과가 크게 달라지기 때문이다.
Stream 기능은 테이블과 뷰의 입력, 변경, 삭제 등을 자동 감지해 변경 로그를 저장함으로써 변경 사항을 추적하게 해준다. Time Travel 기능은 과거 데이터 변경 내역을 스냅샷으로 보관한다. 이를 활용해 특정 시점 데이터 복제, 복원, 특정 기간 내 재변경 내용 분석 등이 가능하다. Zero copy cloning 기능을 활용하면 데이터 테이블을 물리적으로 복사하지 않고 메타데이터만 복제할 수 있다. 복제 후 변경 분에 대해서만 과금해 스토리지 비용을 아낄 수 있다.
금융 데이터 분석의 속도를 높여 투자 기회를 선점 - 15시간을 3분으로, 300% 성능 향상
미래에셋자산운용은 전세계 법인에서 공통으로 활용할 수 있는 글로벌 데이터베이스와 데이터 플랫폼을 갖춤으로써 글로벌 공유가 용이해졌다. 마켓플레이스를 통한 빠른 데이터 업데이트는 데이터 워크플로우를 대폭 단축시켜 연구 개발 프로세스를 효율화했다. 원본 데이터의 모든 행에 대한 스냅샷을 만들 수 있게 돼 변경 사항에 대한 정보 기록과 관리가 용이해졌다. 특정 배치 프로시저의 경우 15시간 걸리던 작업을 최대 확장 시 3분 이내에 완료할 수 있게 됐다. 시스템 자원 비용을 절감하면서 성능은 최대 300배 이상 향상되었다.

Start your 30-DayFree Trial
Try Snowflake free for 30 days and experience the AI Data Cloud that helps eliminate the complexity, cost and constraints inherent with other solutions.