Data for Breakfast 서울 - 3월 19일 (목)

데이터와 에이전틱 인텔리전스로 비즈니스 가치를 실현하세요!

고객 사례

카카오게임즈 Snowflake 활용해 게임 이상행위 효과적 탐지 엔드 투 엔드 데이터 접근, 처리 속도 대폭 향상

카카오게임즈는 Snowflake 데이터 플랫폼을 지난 2022년부터 꾸준히 사용해온 기업이다. 게임 서비스가 다양해지고 데이터 복잡성이 커지면서 보다 원활한 게임 데이터 분석을 위해 클라우드상에서 운영 중이던 데이터 플랫폼을 Snowflake로 바꾼 뒤, 활용 범위를 계속 확장해왔다. 카카오게임즈는 현재 서비스 중인 49개 게임에서 발생하는 이상행위를 탐지·대응하기 위해 운영 중인 KARS(KakaoGames Abusing Detection Risk Management Security) 시스템의 데이터 플랫폼으로 Snowflake를 효과적으로 활용하고 있다.

asian woman playing video games
kakaogames logo
업종
Advertising, Media & Entertainment
위치
Korea

고객사 소개

카카오게임즈는 오딘, 배틀그라운드, 아키에이지 등과 같은 인기 게임을 서비스하고 있는 국내 대표 게임사다. 캐주얼부터 하드코어까 지 다양한 장르의 게임을 PC, 모바일뿐 아니라 콘솔에서도 제공하는 멀티 플랫폼 기업이다. 카카오게임즈는 초창기 애니팡 같은 게임 채널링 위주 사업에서 퍼블리싱 구조로 개편했고, 유망 개발사들을 자회사로 편입해 자체 지적재산(IP) 확보와 게임 개발 역량을 강화하며 성장했다. 일본, 미국, 유럽 등 해외 법인을 거점으로 글로벌 시장으로 서비스 영역을 확장하고 있다.

주요 내용
  • 데이터 민주화 및 전사적 협업: 비개발직군 사용자가 직접 데이터를 탐색하고 쿼리를 수정할 수 있는 환경을 구축하여, 전체 쿼리 수정 비중의 80%가 현업 부서에서 발생할 정도로 높은 수준의 데이터 중심 문화를 정착시킴
  • 실시간 성능 및 운영 효율성: Kafka와 연계한 실시간 파이프라인을 통해 데이터 적재 속도를 기존 1시간에서 1분으로 95% 단축했으며, 복잡한 쿼리 조회 성능을 80% 이상 향상시켜 대규모 데이터를 신속하게 인사이트로 전환
  • 지능형 보안 및 이상행위 탐지: 49개 게임에서 발생하는 어뷰징 행위를 실시간으로 감시하는 이상행위 탐지 시스템 'KARS'를 Snowflake 기반으로 고도화하여, 1,600개 이상의 대시보드를 안정적으로 운영하고 수천만 건의 보호 조치를 수행

카카오게임즈의 게임 이상행위 탐지 대응 시스템, ‘KARS’

카카오게임즈가 정의하는 이상행위란, 개발자가 의도하지 않은 방식으로 사용자가 행위를 수행해 게임 시스템이나 다른 이용자에게 부정적 영향을 미치거나 피해를 입히는 것을 의미한다. 게임 내에서 이같은 이상행위를 탐지하기 위한 핵심 요건은 데이터를 ‘넓고 (Width), 깊게(Depth), 빨리(Speed)’ 봐야한다는 점이다. 

‘넓게 본다’는 것은 이용자의 모든 행동을 모니터링 할 수 있어야 한다는 뜻이다. 이를 위해 현재와 과거 데이터까지 조회할 수 있어야 한다. ‘깊게 본다’는 것은 심층적이고 종합적인 분석과 판단이 가능하도록 사용자의 행동과 특성에 대한 다양한 정보를 활용하자는 의 미다. 게임 서비스는 특성상 어뷰징(Abusing) 피해 확산이 빠르게 이뤄진다. 신속한 대응이 이뤄지지 않으면 이용자들이 수억, 수십억에 달하는 대규모 피해를 입을 수 있기 때문에 ‘빠른’ 탐지와 대응은 매우 중요하다. 

카카오게임즈가 구현해 운영 중인 KARS는 게임 서비스 운영 및 이상 탐지를 위한 데이터 모니터링·자동화 대응 시스템이다. 게임별 데이터 조회와 대시보드 기반의 데이터 시각화, 정해진 주기나 조건에 맞춰 전송하는 알람, 사전 정의된 조건에 따라 이뤄지는 이용자 자동 제재 기능을 제공한다. 모니터링부터 인지, 조사, 제재까지, 이용자 문의 응대나 버그·시스템 수정 같은 후속조치를 제외한 대부분의 이상행위 프로세스를 KARS가 담당하고 있다. KARS는 현재 49개 게임을 모니터링하고 있다. 1600개 이상의 대시보드, 1500여개의 알람, 6000개 이상의 쿼리를 지원한다. 2025년 1월부터 9월 중순까지 KARS를 통해 이용자 제재가 이뤄진 건수는 75만 건, 보호 조치 수행 건수는 1250만 건에 달한다. 이상행위 탐지 시스템의 핵심 요소인 ‘넓고, 깊게, 빨리’ 보고 대응할 수 있도록 구현해 얻을 수 있는 결과다.

스노우플레이크를 도입한 뒤 KARS에서 이상행위 탐지를 위한 엔드 투 엔드 데이터 접 근이 가능해졌을 뿐 아니라 데이터 적재 및 처리 속도가 매우 빠르고 쉬워졌습니다. Snowflake를 도입한 뒤 데이터 적재속도는 95%, 조회 속도는 80%, 압축률은 43% 증 가해, 더 빠른 적재 더 빠른 조회, 더 높은 압축률을 실현하는 효과를 얻었습니다.

박종범
카카오게임즈 이상탐지셀장

엔드 투 엔드 데이터 접근

KARS는 다양한 소스에서 수집·적재하는 데이터부터 정제·전처리·가공을 거친 데이터, 최종 서비스에 사용되는 데이터까지, 로우 데이터(Raw Data)부터 집계 결과를 포괄하는 모든(End to End) 데이터에 접근할 수 있도록 구현돼 있다. 즉 데이터 플랫폼 내 인제스트 레이어(Ingest Layer), 스테이징 레이어(Staging Layer), 서빙 레이어 (Serving Layter)를 모두 아우르는 데이터 플랫폼이 KARS와 연동 된다. 게임 이용자가 플레이를 시작하면 게임 서버와 통신하는 데이터를 제외한 모든 데이터들은 Kafka topic으로 전송된 뒤 데이터레이크의 인제스트·스테이징·서빙 레이어에 저장된다. 이 데이터레이크의 대부분은 Snowflake 플랫폼으로 구성돼 있다. 데이터 수집부터 처리, 공유, 활용, 관리까지 모두 Snowflake를 활용하고 있다. 비정형·스트림 데이터 처리와 탐색, 스냅샷 확보부터 이상치 확인 및 처리, 데이터 병합·관리, 보안 처리와 협업, 시각화 툴이나 분석 솔루션, 인공지능(AI) 학습 데이터로의 연결, 모니터링과 데이터 수명주기 관리까지 모두 Snowflake에서 지원한다.

빠른 데이터 적재·처리 성능

Snowflake를 도입하기 전에 카카오게임즈가 운영하던 기존 데이터 아키텍처에서는 이상행위 탐지를 위한 데이터 정제와 가공에 많 은 시간이 소요됐다. 또 데이터 소비자가 원하는 데이터를 쉽게 찾아 보는 것은 물론 시각화하기도 어렵다는 문제가 있었다. 이로 인해 데이터 담당자는 분석보다는 전처리에 더 많이 매달렸고, 휴먼 에러가 발생하기도 했다. Snowflake를 도입한 뒤 KARS에서 이상행위 탐지를 위한 엔드 투 엔드 데이터 접근이 가능해졌을 뿐 아니라 데이터 적재 및 처리 속도가 매우 빠르고 쉬워졌다. Snowflake를 도입한 뒤 데이터 적재속도는 95%, 조회 속도는 80%, 압축률은 43% 증가 했다. 예를 들어 데이터 적재에 1시간이 걸리던 속도는 1분으로, 7.7 초 소요된 건당 조회 시간은 1초로 줄었다.

kakao games

유저 드리븐 탐색

KARS는 데이터를 ‘깊게’ 볼 수 있도록 ‘유저 드리븐(User-drven)’ 탐색을 적용했다. 현업 사용자가 데이터를 요청하면 데이터팀이 전달하는 방식이 아니라 현업 사용자 스스로 데이터를 탐색하게 하는 방식을 채택했다. 이른바 ‘데이터 민주화’의 구현이다. 

대시보드에서 비개발자들인 현업 담당자가 필요한 데이터를 직접 조회하고 쿼리를 수정해 처리할 수 있는 체계를 적용했다. 8개 장르 49개에 달하는 게임 서비스에서 발생하는 예기치 않은 이상행위를 빠르게 탐지해내야 하는 상황에서 부족한 데이터팀 인력으로는 업 무와 관심사가 각기 다른 수많은 현업 담당자들의 요구를 현실적으로 충족할 수 없다는 점에서 강구한 자구책이다. 

장장 5년에 걸친 노력 끝에 카카오게임즈는 비개발직군에서 대부분의 요청을 자체 처리하는 성과를 얻었다. 실제 이용 현황을 집계해본 결과, 전체 이용자 중 편집자 비중이 15%에 달하고 그 중 개발직군 이 5%, 비개발직군이 10%를 차지하는 가운데 비개발직군의 쿼리 수정 비중이 80%에 달해 개발직군(20%)의 쿼리수정 횟수율을 크게 능가했다. 

앞으로 카카오게임즈는 AI 기술을 활용해 이상행위 탐지와 데이터 기반 의사결정 역량을 더욱 강화할 계획이다. 이미 대규모 언어모델(LLM)과 모델컨텍스트프로토콜(MCP), AI 에이전트를 활용하고 있다. MCP는 Snowflake가 지원하는 외부 MCP는 물론 자체 개발한 MCP인 데이터랩 등을 활용하고 있다. 앞으로는 검증 완료된 수많은 쿼리 자산과 LLM을 결합해 비전문가도 필요한 데이터를 자연어로 쉽게 조회해서 의사결정에도 도움을 받고 도메인 로직도 쉽게 습득 할 수 있도록 발전시킬 계획이다. 또 회사 특성이 반영된 지식 자산을 LLM이 사용하도록해 일반 AI 모델이 제공하지 못하는 맞춤형 인사이트를 확보할 수 있을 것으로 기대하고 있다.

Where Data Does More

  • 30일 무료 평가판
  • 신용카드 불필요
  • 언제든지 취소 가능