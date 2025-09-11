빠르게 변화하는 마케팅과 광고의 세계에서 데이터 엔지니어는 세분화된 인사이트를 제공하고, 정교한 고객 세분화를 구축하며, 높은 정확도로 캠페인 효과를 측정해야 합니다. 그와 동시에 증가하는 개인정보 보호 규정의 복잡성과 민감한 고객 데이터 보호에 대한 지속적인 요구 사항과 같은 여러 가지 도전에 직면해 있습니다.

조직이 데이터의 잠재력을 최대한 발휘하며 이러한 복잡한 환경을 탐색할 수 있도록 데이터 엔지니어는 Snowflake의 Data Clean Rooms와 Snowpark Container Services를 함께 활용할 수 있습니다.

개인정보가 우선시되는 세계에서 직면하는 데이터 협업 과제

가장 가치 있는 인사이트는 조직의 자체 데이터와 파트너의 데이터를 결합함으로써 얻어지는 경우가 많습니다. 다음과 같은 작업을 예로 들 수 있습니다.

고객의 관심사와 행동을 더 잘 이해하기 위해 세컨드 파티 파트너 데이터로 고객 프로필 강화

가장 가치 있는 고객과 비슷한 신규 잠재 고객을 찾는 유사 모델 구축

CVR 데이터를 퍼블리셔의 노출 데이터와 결합하여 광고 캠페인 효과 측정

하지만 가공되지 않은 개인 식별 정보(PII)를 파트너와 직접 공유하는 것은 허용되지 않습니다.

안전한 협업과 고급 분석

Snowflake Data Clean Rooms는 여러 관계자가 기본 PII를 노출하지 않고도 데이터에 대해 협업할 수 있는 안전한 환경을 제공합니다. 파트너가 분석을 위해 데이터를 가져올 수 있는 중립적인 공간임과 동시에, 어떤 것이 가능한지, 그리고 어떤 데이터가 클린룸 밖으로 이동할 수 있는지에 대해 엄격한 통제가 이루어지는 공간이라고 할 수 있습니다.

단순한 조인 및 집계 이상의 작업을 하거나 마케팅 분석 지원을 위해 복잡한 머신러닝 모델을 실행하는 경우, Snowpark Container Services는 데이터 클린룸을 다음 단계로 끌어올립니다.

이제 Snowpark Container Services를 통해 팀은 조직의 Snowflake Data Clean Room 내에서 사용자 지정 코드는 물론, 전체 Docker 컨테이너도 직접 실행할 수 있습니다. 수행할 수 있는 작업은 다음과 같습니다.

Scikit-learn, PyTorch 또는 XGBoost로 구축된 자체 머신러닝 모델을 가져와 클린룸의 결합된 데이터에서 실행

Python과 같은 선호하는 프로그래밍 언어와 라이브러리를 활용한 고급 데이터 변환 및 피처 엔지니어링

코드를 서비스로 배포 및 관리하여 모델을 프로덕션 워크플로우에 통합

마케팅 및 광고의 이점

그렇다면 마케팅 또는 광고 조직의 데이터 엔지니어에게 이는 어떤 의미를 가질까요? 주요 이점은 다음과 같습니다.

대상 고객 인사이트 강화 : 조직의 자체 데이터를 파트너의 데이터와 안전하게 결합하여 고객에 대해 보다 완전하게 파악할 수 있습니다.

더 강력한 유사 모델링: 더 풍부하고 다양한 데이터 세트로 훈련하여 더욱 정확한 유사 모델을 구축합니다.

캠페인 측정 개선: CVR을 마케팅 캠페인에 보다 정확하게 귀속시켜 조직의 광고 수익(ROAS)을 더 명확하게 이해합니다.

더 나은 유연성과 제어: 안전하고 관리되는 환경 내에서 모델을 구축하고 배포하기 위해 친숙한 도구와 라이브러리를 사용합니다.

인사이트 도출 시간 단축: 조직은 복잡한 데이터 통합 프로젝트에 시간을 낭비하지 않고도 더 빠른 비즈니스 인사이트를 제공할 수 있습니다.

유사 모델을 구축하는 방법

리테일 브랜드의 데이터 엔지니어가 충성도가 가장 높은 고객과 유사한 신규 고객을 찾고 있다고 가정해 봅시다. 해당 브랜드는 최고의 고객 목록을 확보하고 있으며, 대규모 온라인 독자층을 보유한 출판사와 파트너십을 맺었습니다.

데이터 엔지니어가 Snowflake Data Clean Rooms와 Snowpark Container Services를 사용하여 강력한 유사 모델을 구축하는 방법은 다음과 같습니다.

Data Clean Room 설정: 브랜드와 출판사는 모두 적절한 정책을 갖춘 Snowflake Data Clean Room에서 고객 데이터를 제공하므로 PII가 노출될 위험이 없습니다. 유사 모델 훈련: 브랜드는 Snowflake Notebook에서 XGBoost를 사용하여 유사 모델을 구축합니다. 퍼블리셔는 클린룸의 통합 데이터와 충성도 높은 고객 목록을 타깃 변수로 활용하여 모델을 훈련할 수 있습니다. Snowpark Container Services를 통한 모델 배포: 브랜드는 모델과 해당 모델의 종속성을 컨테이너에 패키징하고, 퍼블리셔는 Snowpark Container Services를 사용하여 이를 서비스로 배포합니다. 퍼블리셔의 대상 고객 점수 평가: 퍼블리셔는 이제 브랜드의 모델에 대상 고객 데이터를 활용함으로써 각 고객에 대한 "유사 점수"를 파악할 수 있습니다. 브랜드는 이러한 점수에 근거하여 다음 광고 캠페인을 위해 사용자 지정 대상 고객을 생성할 수 있습니다.

Snowflake Data Clean Rooms와 Snowpark Container Services는 데이터 협업 및 고급 머신러닝 모델 실행을 위해 안전하고 유연하며 강력한 플랫폼을 제공하는 동시에, 사용자 개인정보 보호를 존중하고 규정 준수 요구 사항을 준수합니다.

또한, 현재 PrPr 단계에 있는 DCR 내 ML Jobs를 통해 간소화된 ML 개발 워크플로우와 최적화된 ML 런타임으로 동일한 SPCS 기반 배포를 수행할 수 있습니다. 체험을 원하시는 분은 관련 계정 팀에 문의하시길 바랍니다.

이 새로운 데이터 협업 패러다임을 수용하면 새로운 인사이트 확보는 물론, 더 나은 비즈니스 성과 도출을 통해 마케팅 및 광고 팀에 더욱 가치 있는 파트너로 자리매김할 수 있습니다.

여기에서 단계별 예제를 따라 Data Clean Rooms와 Snowflake Container Services를 설정해 보세요. 사용자 환경에서 체험 가능한 샘플 노트북도 다운로드할 수 있습니다.

Snowflake의 최신 Clean Room 혁신과 더불어 새로운 AI/ML 기능, 다자간 데이터 협업 확장에 대해 자세히 알아보려면 여기를 클릭하세요.