참고: 이 내용은 2022. 4. 12에 게시된 컨텐츠(Share But Don’t Show: Secure Data Collaboration with Data Clean Rooms)에서 번역되었습니다.

우리는 모두 나이를 직접 묻지 않고도 나이를 밝히도록 요구하는 이런 밈이 인터넷을 돌아다니는 것을 본 적이 있을 것입니다. “나이를 말하지 말고, 어린 사람들이 이해하지 못할 내 어린 시절에서 기억하는 것은 무엇인가요?” 또는 연필과 카세트테이프간의 관련성을 묻는 질문 말입니다(물론 그 사람이 카세트테이프가 무엇인지 알고 있다는 가정하에).

저는 오래된 특정 광고들이 기억납니다. 핫도그 광고, 마요네즈 광고, 셰이크 앤 베이크(Shake and Bake) 광고, 기타 1970년대가 회상되는 음식의 광고 노래를 아직도 다 부를 수 있습니다. 또는 내 세대만이 기억할 수 있는 시간과 장소로 나를 데려다주는 음악도 기억하고 있습니다. 대부분 청소년기에 계속 반복해서 들었던, 그래서 수년이 지나도 가사가 다 기억나는 감상적인 사랑 노래입니다. 최근 두바이에 갔을 때, 이런 맥락으로 동료의 차에서 노래를 불렀습니다.

이러한 밈은 다음과 같은 오래된 딜레마를 실제로 설명합니다. 기본적인 자료 없이 어떻게 정보를 공유할 수 있는가? 내 나이를 실제로 밝히지 않고도 다른 사람들보다 더 나이가 많다는 것을 입증할 수 있는가? 또는 두 사람이 각각 얼마를 소유하는지 모른 채 누가 더 부자라고 판단할 수 있는가? 이것이 야오의 백만장자 문제(Yao’s Millionaires’ problem)입니다.

1982년에 컴퓨터 과학자이자 계산 이론가인 Andrew Yao는 백만장자의 딜레마를 사실로 가정하고 수학적 해결책을 입증했습니다. 몇몇 다른 교수들은 대안적인 해결책을 제안했습니다. 그러나 이러한 모든 해결책에서는 궁극적으로 백만장자가 이론수학에 대한 광범위한 지식을 갖춰야 했습니다.

백만장자들의 지능은 의심할 여지가 없지만, 대부분에게는 이러한 방정식을 풀 의향이 없을 것이었습니다. 다행히 계산과 컴퓨터 프로그래밍의 발전으로 작업을 훨씬 용이하게 하는 도구가 제공되었습니다. Snowflake에서는 안전한 다자간 계산을 수행할 수 있습니다.

야오의 백만장자가 현대의 계산법을 만나다.

두 사람의 백만장자, Bob과 Alice가 그들의 질문에 어떻게 답할 수 있을지 간단히 살펴보겠습니다. 이 예시에서 Bob은 Snowflake 액세스 정책과 사전에 정해진 질문을 사용하여 기본적인 개인 정보(즉, 그의 실제 자산)를 밝히지 않은 채 Alice가 자신의 자산을 그의 자산과 비교하도록 했습니다. 단계는 다음과 같습니다.

Alice는 자신의 자산 가치로 테이블을 생성합니다(alice.wealth).

Bob도 자신의 자산 가치로 테이블을 생성합니다(bob.wealth). 하지만 Bob은 다음으로 Alice가 할 수 있는 질문과 어떤 답을 받을 수 있는지를 정확히 지정한 액세스 정책을 생성합니다. 즉, Alice는 자산 가치가 무엇인지 질문할 수 없습니다. 다음과 같이 Alice는 두 자산 가치가 서로 어떻게 연관되었는지만 물을 수 있고 Bob이 지정한 답만 받을 수 있습니다.

when bob.wealth > alice.wealth then \'bob is richer\'
when bob.wealth = alice.wealth then \'neither is richer\'
else \'alice is richer\' end

이에 따라 Alice의 자산 가치를 공유하지 않고 Bob의 자산 가치를 공유하지 않은 채 Alice의 데이터를 Bob의 데이터와 비교할 수 있게 됩니다. Alice가 허용된 질문 이외의 질문을 시도하면, 아무런 결과도 얻을 수 없습니다.

노출 없는 공유가 가능한 Snowflake 데이터 클린룸의 기능

물론 Snowflake 고객들이 자신의 자산을 비교하는 것은 아닙니다. 하지만 안전한 다자간 계산이 상당히 가치가 높다는 것을 다른 사용 사례를 통해서도 알 수 있습니다. 예시는 산업 전반에 걸쳐 광고 배치 및 마케팅 캠페인의 극대화, 사기 감지를 개선하기 위한 일반 거래 패턴의 식별 또는 의료 성과를 개선하기 위한 환자의 생활 주기 추적 등의 사용 사례로 확장됩니다.

점점 보편화되는 사용 사례를 한 번 보시죠. 제삼자 쿠키가 단계적으로 폐지됨에 따라 기업들은 해당 고객의 온라인 습관을 이해하기 위해 대체 수단을 찾고 있습니다. 기업들은 더 이상 고객들을 직접 추적할 수 없으며, 개인정보보호 요구 사항과 산업 규정을 준수하여 고객 목록을 그냥 공유할 수 없습니다. 하지만 어떤 고객들을 공통적으로 보유하는지 식별하고자 할 수 있습니다. 이 사용 사례는 미디어와 광고에서 일반적으로 발생합니다. 한 브랜드가 새 제품을 미디어 플랫폼에서 광고하고자 할 때, 적절한 대상에게 도달하기를 원할 것입니다.

한 스포츠 브랜드가 새 장비 또는 새 신발을 출시하여 고객에게 알리길 원한다고 생각해 보십시오. 그 브랜드는 미디어 공급자와 협력하여 스포츠 장비나 의복도 구매하는 가입자를 타겟으로 하길 원합니다. 해당 고객이 그 광고를 볼 가능성이 가장 높을 프로그램 중에 광고가 실행되기를 원합니다. 이를 수행하기 위해 이들은 서로 고객의 데이터를 전혀 공유하거나 노출하지 않은 채 겹치는 고객과 가입자를 판별해야 합니다.

양 당사자는 고객 정보를 보유합니다. 브랜드는 고객의 스포츠 습관과, 종종 각 고객에게 공통된 기타 인구통계학적 정보를 알고 있습니다. 미디어 공급자는 가입자들이 시청하는 프로그램이 무엇인지 알고 있습니다. 공통부분은 어디에 광고를 배치할지 나타냅니다. 아래의 가상 예시를 예로 들면, 신발 구매 빈도에 기반하여 형성된 인물인 High Mileage Runners는 Friendliest Catch를 시청할 가능성이 높습니다. 스포츠 시청자 중에서는 아무도 Cakemakers(표본 크기가 작아 재식별을 방지하기 위해 삭제될 수 있는 카테고리)를 보지 않을 것 같습니다.

이 광고 시나리오에는 종종 더 많은 참여자가 있으며, 여기에는 보유한 데이터가 고객 세분화에 대해 알려진 정보를 보강하는 타사 데이터 공급자와 광고 캠페인을 개발 및 실행하는 대행사가 포함됩니다. Snowflake 플랫폼이 제공하는 기능인 액세스 정책, 허용된 문장, 데이터 공유를 통해 다양한 당사자들은 필요한 정보를 얻어 이러한 마케팅 투자의 가치를 높일 수 있습니다.

데이터 클린룸 기능 실행

이 시나리오는 단지 이론적이거나 허구적이지 않습니다. 대형 미디어 기업의 광고 부서는 Snowflake의 데이터 클린룸 기능을 사용하여, 즉시 눈에 들어오지 않는 통찰을 드러냄으로써 광고주를 위한 광고 배치의 가치를 높입니다. 예를 들어, 미디어 기업이 최근 주요 스포츠 리그 프로그램에 대한 권리를 획득했고, 브랜드의 중요한 타겟 시장은 그 열혈 팬들입니다. 하지만 그들이 경기만 보는 것이 아닙니다. 특정 코미디 프로그램과 시리즈를 넘겨가며 찾아 봅니다. 데이터 클린룸은 브랜드가 경기 창 안팎에서 고객을 타겟팅하도록 돕습니다.

쿠키 없는 새로운 광고 세계에서 데이터 클린룸 기능이 활성화된다면, 다양한 당사자들은 기본 데이터를 노출하지 않고 정보를 공유할 수 있습니다. 예를 들어 보겠습니다.

  • 브랜드는 증가하는 타사 고객 데이터를 타사의 보강과 함께 활용하여 마케팅 캠페인에 대한 타겟을 구체화할 수 있습니다.
  • 미디어 기업은 자체 플랫폼 전체의 자사 가입자 데이터를 브랜드의 고객 데이터와 안전하게 매칭하여 광고 배치를 개선할 수 있습니다.
  • 대행사 또는 광고주 또는 미디어 기업 자체는 캠페인 로그, 아이덴티티, 기여도, 판매 데이터를 결합하여 광고 캠페인의 성과를 측정할 수 있습니다.

기타 산업에 걸친 데이터 클린룸 사용 사례

광고에만 사용 사례가 있는 것은 분명히 아닙니다. 데이터 클린룸의 이점은 사용 사례와 산업에 걸쳐 확장됩니다. 의료 연구원들이 특정 진단을 받고 약을 처방받은 환자가 약국에서 실제로 처방 약을 조제 받는지 알고 싶어 한다고 생각해보십시오. 또는 제조 기업이 부품 공급자와 데이터를 공유하여 결함을 예측하고 제품 개발을 개선하여 예정에 없는 가동 중지 시간을 줄인다고 말입니다.

산업간 협업의 몇 가지 예를 통해서도 안전한 데이터 협업의 혁신적인 힘을 볼 수 있습니다. 소매업자는 소비자 동향을 소비재 제조업체와 공유하여 제품 개발을 개선하고 수요를 예측합니다. 은행과 소매업자는 브랜드별 신용 카드를 제공하기 위해 협업합니다. 보안 공격을 당하고 있는 기업들은 발신 IP 주소를 비교하여 식별하고 협업하여 공통의 위협에 대항하여 방어할 수 있습니다. 데이터 협업과 안전한 데이터 협업의 기회는 끝이 없습니다.

이 방대한 데이터 협업의 세계에 대해서는 6월 13일~16일에 라스베이거스에서 열리는 Snowflake Summit 2022에서 논의하겠습니다. 그때까지 이 최신 Snowflake 웨비나, 데이터 클린룸으로 데이터 협업의 미래 구현(Enabling The Future of Data Collaboration With Data Clean Rooms)을 살펴보십시오.