注:本記事は(2021年7月2日)に公開された(San Francisco and Datavant fight Covid-19 with Data)を翻訳して公開したものです。

Snowflakeヘルスケア・アンド・ライフサイエンス・フォーラム 2021において、Snowflakeはサンフランシスコ市のBlake Valenta氏およびDatavant社のJason Labonte氏と対談し、ベイエリアがいかにデータサイエンスを駆使してCOVID-19と闘っているかを伺いました。

COVID-19の蔓延は、日々の生活のあらゆる側面を阻害しており、あらゆる規模の企業が新しい働き方や顧客へのサービスの提供の仕方に適用しようと試みています。データサイエンスの分野にも劇的な変化が見られ、ITやアナリティクス分野のリーダーたちは、次々と迫る新たな課題を克服すべく躍起になっていました。

サンフランシスコ市は、適応しようとする意志がいかに永続的なインパクトをもたらし得るかを示す好例を示してくれています。パンデミックが始まった頃、市はEOC(エマージェンシー・オペレーションズ・センター)という機関横断的なハブを立ち上げました。初期の最大の課題の1つは、ベイエリアの病院を悩ませていたマスク、グローブ、ガウンといった個人保護具の深刻な不足に対応することでした。市はEOCを通じて調達を一元化しましたが、組織ごとに発注システムや追跡システムが異なり、すべてが独自のスキーマを使用していました。

市のDataSF(最高データ責任者事務局)のアナリストストラテジストであるBlake Valenta氏は、「いま手元に物品がどれくらいあるか、適切な医療グレードの物品はどれくらいか、あとどれくらい調達する必要があるかといったことを俯瞰的に把握することが困難でした」と、語っていました。

Valenta氏のチームはこの問題の解決に乗り出しました。実は以前からSnowflakeデータクラウドに注目していたのですが、感染拡大を期にソリューションの導入を決断したそうです。

「Snowflakeデータクラウドを使用することで、私たちは意思決定者がサンフランシスコの個人保護具問題を解決できるよう、データを一元化し、調整することができました。システムの立ち上げは1週間足らずで済みました。」

—Blake Valenta氏、アナリストストラテジスト、DataSF

単一の医学研究環境

サンフランシスコの金融街を少し歩いたところにDatavant社があります。同社は、医療業界におけるデータの接続性や断片化の問題の解決を専門とする医療テクノロジー企業です。業界固有の最大の課題の1つは、患者が医師の診断を受けるたびにデータが異なる電子医療記録システムにキャプチャされることです。ラボテストの結果はラボシステムに保管され、処方箋は薬局のシステムに保管されます。データはあっても、サイロ化された状態です。

Datavant社の最高戦略責任者であるJason Labonte氏は、Snowflakeがそうしたデータのキャプチャ、機密を保護しながらのデータ交換、およびダウンストリームとのリンクを可能にすると知っていました。2020年初頭より、同氏とそのチームはリアル世界のすべての医療データを単一のリポジトリで管理する「COVID-19リサーチデータベース」という、Snowflakeを使用したプロジェクトに取り組んできました。

当初、Datavant社はすべてのデータを単一の環境に取り込むための全国的なインフラストラクチャーを有していませんでした。しかしデータがどこにあり、誰が所有しているかは把握していました。「私たちは有志同盟を形成しました」と、Labonte氏は語ります。「データを所有する組織から、データベース作成技術のあるSnowflakeのような組織までが参加しました。途方もない仕事でしたが、私たちは仕組みを60日間で立ち上げました。」

データベースには、13の民間ソースからのデータや55の公共データセット(健康診断書、医療請求、コンシューマーデータ、グローバルモビリティデータ、州ごとの医療キャパシティなど)が含まれ、全て単一の調査環境にロードされます。これはSnowflakeのコンポーネントに組み込まれたプライバシーおよびセキュリティ層で管理され、すべてのデータがHIPAA規制に基づいて匿名化されるよう徹底されています。

「当社には、データレイアウト付きのwikiやデータセットの説明を含め、Snowflake環境で非常に安全かつ精密にセットアップされた大規模なデータリポジトリを有しています。そしてこれはパンデミックに取り組む公共の医療研究者に無償で提供されています。これまでの登録ユーザー数は2,000を超えています。」

—Jason Labonte氏、最高戦略責任者、Datavant社

単一の信頼できる情報ソース

DataSFは、市の個人保護具不足問題を解決した後、Datavant社が行ったものと類似したミッションに乗り出しました。市行政機関内の部署だけでなく一般に向けて、断片化されたソースからのデータを統合し標準化する必要がありました。議論にはコミュニティー組織、ジャーナリスト、および住民の関与が必要であり、そのすべてを情報面で同じ条件にしなければなりません。

「私たちはSnowflakeを使用して、各部署から集めたデータをカタログへと一元化しました。各部署のアナリストはそのカタログを使用して必要なレポートやダッシュボードを構築しました。私たちは、何をリリースできて何をリリースできないかについてのデータガバナンス基準を策定する必要がありましたが、内外のビューは同じデータに基づくものとなっています。サンフランシスコの住民やコミュニティー組織やジャーナリストも利用できます。コミュニティー全体が同じ信頼できる情報源を見ることができるので、可能な限り効率的かつ安全な形で共に進むことができます。」

—Blake Valenta氏、アナリストストラテジスト、DataSF

Datavant 社とサンフランシスコ市は直接的に協働関係にあるわけではありませんが、Snowflakeを使用して同時に同じような課題の解決に取り組んでいるのは決して偶然ではありません。

「ビッグデータ界の多くが、人工知能と機械学習を次の大きな潮流と見ていますが、すぐ手の届くところにある果実のように、大量のデータがアクセス不能なサイロの中にすでに存在しています。その問題を解決できれば、スタートダッシュを決めることができるでしょう。大規模なデータセットをアクセス可能な環境に簡単に移行し、セキュリティやプライバシーを保護しながらそのデータを共有するには、Snowflakeのようなテクノロジーパートナーがまさに必要です。」

—Jason Labonte氏、最高戦略責任者、Datavant社