注:本記事は(2021年6月29日)に公開された(How Starschema Uses Snowflake Data Marketplace to Share a Trusted COVID-19 Data Set)を翻訳して公開したものです。

昨年は、多くの企業がCOVID-19の影響と拡散についての基本的な情報を得るため、Starschemaの精選されたデータセットを用いました。ポッドキャストRise of the Data Cloudの最新エピソードでは、Starschemaの共同創始者兼CEOであるTamas Foldi氏を迎え、データシェアリングの力について、また同社がSnowflake Data Marketplaceを用いてこの価値ある情報をどのように配信しているかについて紹介していただきました。

コロナ禍において、企業各社は自社の従業員や会社の福祉に関する主要な意思決定に役立つ、信頼できるデータソースを求めていました。そして2020年3月、Starschemaは要望に応え、公共の情報に基づく信頼性の高いCOVID-19データの精選されたパッケージを、Snowflake Data Marketplaceを通じて無償で提供しました。

これはStarschemaにとってデータセットの提供に乗り出す第一歩であり、同社は非常に真剣に取り組みました。データセットはリリース以来継続的にメンテナンスされ、更新され、毎日情報が追加されています。Foldi氏は「危機が生じたときは、どうすれば他者に最も貢献できるかを考えなければなりません。当社にとって、これを実行することがもっとも直接的で明確な方法でした。」と伝えています。

パンデミックの初期の頃、Foldi氏はTableauコミュニティーフォーラムのメンバーである2人の友人に声をかけられ、COVID-19データハブの構築に力を貸してくれないかと頼まれました。友人は、堅牢かつ簡単にアクセスできるダッシュボードをTableauで構築し、世界中でCOVID-19の症例を追跡できるようにしたいと考えていました。それこそ、Starschemaが力を発揮できる分野でした

この過程でFoldi氏は、これらのダッシュボードが想定よりかなりデータにアクセスし難かったため、より簡単な方法が必要だと考えました。Foldi氏はすぐに、異なる組織間で簡単にデータを共有できる使い易いプラットフォームとして、Snowflake Data Marketplaceのことを思い出しました。「Snowflake Data Marketplaceを用いることで、クリーンかつすぐに使える形式のデータを、クリック1つでアクセス可能にすることができました。」

Starschemaは、GitHubのパブリックレポジトリにデータセットを構築し、Snowflake Data Marketplaceを通じて何百の、最終的には何千ものSnowflakeカスタマーに提供しました。

このデータセットは幅広い情報をもたらすものです。たとえば、世界保健機関やそれより小さい国内機関から得られる疾病率や死亡率に関する疫学的なデータ、アメリカ疾病予防管理センターからのテストデータ、さらに最近のワクチンデータなどです。その他のデータも、人口統計学的情報やICUのベッド数など、さらに有用なコンテキストをもたらしています。

そのようなすべてのデータを一元化することで、組織はデータをもっと利用しやすくなります。Foldi氏は「非常に系統的な、結合しやすいデータセットで、さまざまなソースと調和させたり、それらに自身のデータを結合したり融合したりすることができます。」と語りました。この情報を自身のERP、CRM、その他のシステムと結合させることで、組織は以前の方法では見つけられなかったインサイトを明らかにすることができます。

Starschemaのデータセットは、コロナ禍において、3つの使用事例が見られたとFoldi氏は言います。当初、データセットがCOVID-19の症例と死亡率のみだったころ、企業各社はこれを使用してどの人員や施設を退避させるべきかを判断していました。

使用事例の第2波では、COVID-19のデータと外部データ(匿名の電話アンケートで集められたモビリティ指標など)を結合させる例が多く見られました。たとえば、ある大手音楽レーベルは、通勤する人が減り、車の中で音楽を聴く人が少なくなる中で、パンデミックが音楽ストリーミング消費に与える影響を分析したいと考えていました。

現在、多くの企業がStarschemaのデータを使用して、オフィスやその他の施設を再開しても安全かどうか、また消費者が対面サービスを希望した場合、感染の恐れがあるかどうかを判断しています。各社は特に、ワクチン接種率や関連するリスクへの影響を注視しています。

これまでの教訓としてFoldi氏は、コミュニティーの力とSnowflakeのようなマーケットプレースによる使用事例の広がりについて語りました。マーケットプレースは外部のパートナーやカスタマーとのデータシェアリングに役立つだけでなく、大規模組織内での共有にも役立つと指摘しています。

「組織内でデータを公開することは大きな価値をもたらします。私たちは社内のクライアントにSnowflakeを使用して社内データ交換システムやデータマーケットプレースを構築するよう推奨しました。これによりさまざまな部署間で非常に洗練された方法でデータを交換できます。」

Rise of the Data Cloudは、受賞歴のある著述家でありジャーナリストであるSteve Hamm氏がホスト役を務めるポッドキャストです。エピソードごとにSteve氏は、クラウドをどのように利用してデータを管理、共有、分析しているか、どのようにビジネスの成長を加速し、イノベーションを促進し、業界に革新をもたらしているかについて、データ業界のリーダーを招いてインタビューしています。このポッドキャストの他の回を聴きたい場合はこちらからアクセスしてください。