注:本記事は(2021年7月29日)に公開された(Use the Data Cloud to (finally) Demystify Data Governance)を翻訳して公開したものです。

組織がデータを使用し始めて以来、データガバナンスの必要性がなくなることはありませんでした。人やチームによってガバナンスの意味は変わりますが、 確かなことが1つあります。それは、長く探求されてきたデータガバナンスの万能薬はまだ見つかっておらず、組織は多大な時間と労力をかけ、重要なデータ資産を効果的に統制する方法を模索し続けているという点です。

データガバナンスを取り巻く環境の変化

テクノロジー業界は、この問題の解決に向け大きく歩を進めています。Business Wireによると、データガバナンスのテクノロジー面は、強力かつ活気ある広範なデータ管理市場へとつながっており、20%以上の成長が見込まれるなど、減速の気配がないということです。1現在、Snowflakeとパートナーシップを結んでいるベンダーの中にも、データガバナンスの広範な課題の解決支援に変化をもたらしている企業がいくつかあります。

たとえばCollibra社は、すべてのデータユーザーに向けて優良で信頼できるデータに簡単にアクセスするメリットを提供するという最終目標を掲げ、ガバナンスとスチュワードシップに注力しています。2 data.world社は、サイロ化と分散が進んでいるデータを、理解しやすく一貫性のあるビジネス概念にマッピングし、ユーザーがビジネスの問題についての明確かつ正確な回答を迅速に得られるようにするデータカタログを提供しています。3

データガバナンス機能に投資する

Snowflakeは、カスタマーが自身のデータをより良く管理できるよう、データガバナンス機能に重点を置いてきました。たとえば、行アクセスポリシー(正規版リリース済み)は、綿密なコンテンツベースのアクセスコントロールでデータを保護することを可能にします。列レベルのセキュリティ(正規版リリース済み)は、テーブルやビュー内の列にマスキングポリシーを適用して、部外秘データを管理することを可能にします。部外秘データの管理は、外部トークン化と組み合わせてProtegrity4またはMicro Focus Voltage5などのサードパーティツールを利用するとさらに強化できます。さらに、Snowflakeが最近発表したオブジェクトタギング機能(現在はパブリックプレビュー版)は、ユーザーがデータをよりよく把握し、整理することを可能にするもので、テーブル、ビュー、列などのさまざまなオブジェクトにユーザー定義のメタデータをアタッチできます。

一方、Snowflakeとデータガバナンスにとってさらに興味深いものが、データクラウドです。これまで取り上げてきた機能やテクノロジーはそれぞれ、ガバナンスの課題を解決する上で主要な役割を果たしますが、重大な問題が1つ残ったままです。それはデータのサイロです。

データサイロが作った壁を打ち壊す

データサイロがデータガバナンスに関するあらゆる取り組みのアキレス腱となっているのには、いくつかの理由があります。第一に、サイロは特にさまざまな関係者のニーズを満たすために存在するという点です。つまり、データを収集し利用する方法について多様な要件が存在することによって複数のガバナンスプロセスが必要になっているということです。サイロが多ければガバナンスポリシーも増え、物事を管理下に置くために余計な時間や費用がかかってしまいます。サイロをまたいで信頼関係を維持することは困難です。

第二に、サイロは形やサイズがさまざまです。サイロはデータベースの場合もあれば、ファイルやスプレッドシートである場合もあります。サイロの数が増えれば、データがどこに、どのように向かうかを追跡するのに大変な労力が必要となります。合意された方法でデータを扱うよう利用者に徹底するには、かなりの信頼が必要です。第三に、データをライフサイクル全体にわたって追跡することは複雑であり、リスクも生じやすくなります。データがどのように動き、変化しているかを追跡し続けることは、データが多くのサイロにまたがっていれば、それだけ複雑になります。

データクラウドは、新しい方法でサイロを打ち壊すことで、この状況を打開します。データクラウド内では、同じチーム、部門、または組織に所属しているかいないかにかかわらずデータに接続し、共通のデータセットでコラボレーションできます。データは本質的にデータクラウド内で接続されるため、ニーズの違いがあっても一元化された方法でガバナンスポリシーを簡単に適用できます。

たとえば、A社が作成したテーブル内でマスクされたデータは、特定のロールを持つユーザーのみが完全な形で見ることができるようになっています。A社がそれと同じデータをB社にシェアする場合、そのシェアに対して同じポリシーを割り当てることができます。管理すべきサイロはなく、他のマスキングポリシーを作成する必要もありません。以前はなかった方法でデータを接続することで、データガバナンスが以前より容易になっています。エコシステム全体でのデータリネージと追跡可能性も同じ形で役立っています。

データクラウドの接続性、Snowflakeのコアガバナンス機能、およびガバナンスパートナーのエコシステムの組み合わせが、最終的に組織のデータガバナンスの加速を助けます。


  1. bwnews.pr/3zjxazN
  2. collibra.com
  3. data.world
  4. protegrity.com
  5. bit.ly/3iwnn2E