注:本記事は(2022年4月12日)に公開された(Share But Don’t Show: Secure Data Collaboration with Data Clean Rooms)を翻訳して公開したものです。

ミームがインターネット上を飛び回り、実際に問いかけることなく年齢を明かさせようとしていることは皆さんご存知の通りです。「年齢を明かさずにこたえてください。年下の子が理解できない思われる、子供時代で覚えていることは何ですか?」または、「鉛筆とカセットテープの関係は何でしょうか?」など。(カセットテープがどういうものかを知っている、という前提ですが)。

私が覚えているのは、いくつかの古い広告です。ホットドッグ、マヨネーズ、Shake & Bakeなどの1970年代を思い起こさせる食品の広告であれば、CMソングを完璧に歌うことができます。また、私の世代だけが覚えている音楽も、その時代、場所を思い起こさせてくれます。そのほとんどは、青年期に繰り返し聞いた感傷的なラブソングで、多くの年月が過ぎた後でも一言一句間違えずに歌うことができます。先日ドバイへ出張した際、同僚の車内で偶然この歌が流れていました。

これらのミームは、昔からあるジレンマを表しています。それは、情報の根底にあるものを明かすことなくどうやって情報を共有するか、という問題です。たとえば、実際に年齢を明かすことなく、周囲の人たちより自分が年上であると知らせることができるでしょうか?また、2人の人間がどれだけの資産を持っているかを知らないまま、どちらがより裕福であるかを判定できるでしょうか?これはYaoのミリオネア問題と呼ばれるものです。

1982年、コンピューターサイエンティスト兼コンピューターセオリストであるAndrew Yaoは、ミリオネアのジレンマを仮定し、数学的解答を提示しました。また何人かの他の学者も、別の解答を提供しました。しかし、その解答はいずれも、結局のところ、ミリオネアが理論的数学の広範な知識を身につけていなければならないものばかりでした。

ミリオネアたちの知性に疑問がないとしても、多くの人はこれらの方程式を解きたいと思わないでしょう。幸運なことに、コンピューターやコンピュータープログラミングの発展により、この作業を大幅に進展させるツールも開発されており、セキュアなマルチパーティコンピュテーションをSnowflakeで実行することもできます。

Yaoのミリオネアたちと最新のコンピュテーションメソッドとの出会い

2人のミリオネア、BobとAliceがどのようにしてこの質問に答えることができたかを見てみましょう。この例ではBobがSnowflakeのアクセスポリシーや事前設定されたクエリを使用して、根底にある個人情報(実際の資産)は伏せたままで、Aliceに彼女の資産と彼の資産を比較させています。手順は次の通りです。

Aliceが彼Aliceが彼女の資産値を表すテーブルを作成します(alice.wealth)。

Bobも彼の資産値を表すテーブルを作成します(bob.wealth)。彼はさらに、Aliceができる質問、受け取ることのできる答えを特定するアクセスポリシーを作成します。つまり、Aliceは資産値を尋ねることができません。彼女はお互いがどのように関連しているかという質問のみ可能で、Bobが特定した回答を得ることしかできません。

when bob.wealth > alice.wealth then \'bob is richer\'
when bob.wealth = alice.wealth then \'neither is richer\'
else \'alice is richer\' end

このようにして、お互いに自身の資産値を明かすことなく、AliceのデータをBobのデータと比較することができます。Aliceが許可された以外の質問をしようとしても、結果を得ることはできません。

Snowflakeデータクリーンルームの機能を使用した不可視でのデータシェアリング

もちろんSnowflakeユーザーは資産を比較するわけではありません。しかし、セキュアなマルチパーティコンピュテーションが非常に重要視される他のユースケースもあります。広告配置やマーケティングキャンペーンの最適化、不正検知を向上するためのよくあるトランザクションパターンの特定、医療成果を改善するための患者のライフサイクル追跡など、さまざまな業界において広範なユースケースが挙げられます。

ますます一般的となってきているユースケースを詳しく見ていきましょう。サードパーティのCookieの段階的廃止を受け、企業は顧客のオンラインでの習慣を把握するための代替手段を模索しています。直接顧客を追跡することができなくなり、プライバシー要件や業界規程も遵守する必要があるため、企業は顧客リストを共有することもできません。それでも、共通する顧客を特定する必要はあります。これは、メディアや広告業界ではよくあるユースケースです。ブランドが新製品の広告をメディアプラットフォームに配置したいと考えており、適切なオーディエンスに確実に届けたいと考えます。

新しい装備や靴の発売について顧客に知らせたいと考えているスポーツブランドを想定してください。メディアプロバイダーと連携することで、このブランドは、スポーツ用品や衣料も購入しているサブスクライバーをターゲティングしたいと考えています。顧客の視聴の可能性が一番高いショーの最中に広告が流れるようにするのが理想的です。そのために、お互いに顧客データを共有、公開することなくオーバーラップしている顧客やサブスクライバーを特定する必要があります。

双方が顧客情報を有しています。ブランド側は、顧客の運動習慣を把握しており、さらに個々の顧客が共有したその他の人口学的情報も保有している場合が多いです。メディアプロバイダー側は、サブスクライバーが視聴するショーを把握しています。このオーバーラップにより、広告をどこに配置すべきかが明らかになりました。例えば、次の例では、シューズの購入頻度に基づいて作成されたペルソナであるHigh Mileage RunnersがFriendliest Catchを視聴する可能性が高いとしています。Cakemakersを視聴予定のスポーツ愛好家はいないため、サンプルサイズが小さいせいで生じるIDの再認証を防止するために、このカテゴリーは削除するのがよいでしょう。

この広告シナリオでは、通常、顧客セグメントについての情報をデータでエンリッチ化するサードパーティデータプロバイダー、広告キャンペーンの開発や実施を担当する代理店、といった、より多くの関係者が存在します。Snowflakeプラットフォームが提供する機能(ステートメントやデータシェアリングを可能にするアクセスポリシー)により、このようなマーケティング投資における価値の増大に必要な情報を、複数の関係者が入手できるようになります。

データクリーンルームの機能を実践する

このシナリオは単なる理論上の作り物ではありません。巨大なメディア企業の広告部門は、Snowflakeデータクリーンルームの機能を使用して、一見したところ明らかではないインサイトを公開することにより、広告主のために広告配置の価値を拡大しています。例えば、メディア企業が最近、主なスポーツリーグのプログラミング権利を獲得しました。同社の熱心なファンはブランドにとって、重要なターゲットマーケットとなります。しかし、彼らが視聴するのはゲームだけではありません。特定のコメディショーやシリーズで指数を上回っていました。データクリーンルームは、ブランドによる顧客セグメントのターゲティングをゲームウィンドウの内外からサポートします。

Cookieを削減した新たな広告の世界では、データクリーンルームの機能を有効化することで、複数の関係者が、根底にあるデータを開示することなく情報を共有することができます。例えば:

  • ブランドは、拡大を続けるサードパーティによりエンリッチ化されたファーストパーティ顧客データを活用し、マーケティングキャンペーンに向けたターゲットを絞り込みます。
  • メディア企業は、ファーストパーティサブスクライバーデータを、自社のプラットフォーム全体において、ブランドの顧客データを安全にマッチングさせ、広告配置を改善します。
  • 代理店、広告主、またはメディア企業は、キャンペーンログ、ID、アトリビューション、販売データを組み合わせて、広告キャンペーンの成果を測定します。

他の業界におけるデータクリーンルームのユースケース

もちろん、広告だけが唯一のユースケースではありません。データクリーンルームにより得られるメリットは、ユースケースや業界を超えて提供されます。特定の診断を受け所要された治療を受けている患者が、実際に薬局で処方箋を調剤しているのかを把握したい医療研究者がいると想像してみてください。または部品のサプライヤーとデータを共有しているメーカーは、不良品を予測し製品開発を改善することで、予定外のダウンタイムを低減することができます。

業界を超えたコラボレーションをいくつかご紹介します。これらも、セキュアなデータコラボレーションにおける革新力を説明しています。小売業者は消費財におけるコンシューマートレンドを共有し、メーカーは、製品開発や需要予測をサポートしています。銀行や小売業者はブランドに特化したクレジットカードの提供において協力しています。セキュリティ攻撃を受けている企業は、IPアドレスを創出して、よくある脅威を特定し連携して防御するために、IPアドレスの創出を比較したいと思うかもしれません。データコラボレーションの機会、さらに言えばセキュアなデータコラボレーションの機会は無限に広がっています。

6月13~16日にラスベガスで開催予定のSnowflake Summit 2022において、巨大なデータコラボレーションの世界について話します。そのときまで、こちらの最近のSnowflakeウェビナーデータクリーンルームを活用した未来のデータコラボレーションの実現をご覧ください。