CDMCとは:Cloud Data Management Capabilitiesフレームワーク実践ガイド
CDMCは、機密データの制御、成熟度の評価、ガバナンス要件の測定可能な技術的コントロールへの変換を行うための、クラウドに特化したフレームワークを組織に提供します。本ガイドでは、このフレームワークと14のコントロール、およびチームがそれらを実際に適用する方法について説明します。
- CDMCフレームワークとは
- CDMCデータガバナンスフレームワークの6つの機能領域
- SnowflakeによるCDMCの実装
- クラウドコントロールの評価を可能にするCDMC
- 関連リソース
クラウド環境はデータ管理を変革しました。現在、データはリージョン間を移動し、アイデンティティはフェデレーションされ、ストレージとコンピュートは独立してスケーリングします。また、アクセスの決定はAPI、ポリシー、メタデータに依存するようになっており、これらは事後チェックではなく継続的に評価される必要があります。
Cloud Data Management Capabilities(CDMC)フレームワークは、組織がクラウド、マルチクラウド、ハイブリッドクラウド環境におけるデータの管理および制御方法を評価し、改善するのに役立ちます。
CDMCフレームワークとは
CDMCは、ベストプラクティスの評価および認定資格フレームワークです。このフレームワークは、100以上の組織から300名以上が参加したCDMCワーキンググループによって開発され、2021年に最初のCDMCコントロールが公開されました。このフレームワークは、内部利用を目的とした無料ライセンスの下で、EDM Councilによって提供されています。
CDMCは、DAMA-DMBOKやDCAMなどのフレームワークとは異なります。DAMA-DMBOKは専門分野としてのデータ管理に関する知識体系ですが、DCAMはより広範なエンタープライズデータ管理機能を評価するものです。CDMCはこれらの基盤が重要であることを前提としていますが、クラウド環境における機密データのガバナンスに必要なコントロールに焦点を絞っています。クラウド環境では、自動化、ポリシーの適用、継続的な証拠収集は、後から追加されるオプションのレイヤーではなく、設計の一部となります。
CDMCの核となるのは、6つの領域に含まれる14の主要なコントロールと自動化です。
- ガバナンスとアカウンタビリティ
- カタログ化と分類
- アクセシビリティと利用
- 保護とプライバシー
- データライフサイクル
- データおよびテクニカルアーキテクチャ
このフレームワークは、各コントロールを証明および評価できるように構築されています。そのため、ガバナンスの参考としてだけでなく、コントロールが適用されている範囲と適用されていない範囲を示す必要があるクラウドプログラムの実用的な評価モデルとしても役立ちます。
また、このフレームワークは意図的にベンダーニュートラルに作られているため、さまざまな業界や、クラウド、マルチクラウド、ハイブリッドクラウド環境全体で関連性を持ちます。主要なプロバイダーやエコシステムベンダーは、これらのコントロールに対する独自の実装ガイダンスや評価資料を公開しています。
CDMCデータガバナンスフレームワークの6つの機能領域
14のコントロールは、それらが総合的にサポートする6つの運用領域を通じて見ると、より扱いやすくなります。
- ガバナンスとアカウンタビリティは、データコントロールのコンプライアンス、所有権、信頼できるデータソースとプロビジョニングポイント、データ主権と国境を越えた移動といった、基盤となるコントロールプレーンを対象としています。チームは、誰が機密資産を所有しているか、その資産がどこで作成されたか、コンプライアンスがどのように監視されているか、そして管轄区域間の移動が管理され監査可能であるかを示すことができる必要があります。
- カタログ化と分類は、機密データが作成または取り込み時に自動的にカタログ化および分類されるかどうか、またそのプロセスが環境全体で一貫しているかどうかを対象としています。フレームワークはカタログを静的なインベントリではなく、ライブのコントロールサーフェスとして想定しているため、これはCDMCがクラウド指向であることを示す最も明確な例の1つです。
- アクセシビリティと使用は、エンタイトルメント、アクセスのデフォルト設定、データ消費の目的を対象としています。機密データへのアクセスはデフォルトで作成者および所有者に付与され、アクセスは追跡される必要があります。また、機密データを含むデータ共有契約においては、データ消費の目的が提示される必要があります。
- 保護とプライバシーは、機密データに対する適切なセキュリティコントロールと、管轄区域に応じた個人データに対するデータ保護影響評価の自動トリガーを対象としています。ここは、CDMCがガバナンス要件をプライバシー運用および証拠と最も明確に結び付けている部分です。
- データライフサイクルは、保持、アーカイブ、パージ、およびデータ品質の測定を対象としています。EDM Councilの図では、データ品質の測定を独立した最上位の品質ドメインではなく、ここに配置しています。これは、品質が単なるアナリティクスの課題としてではなく、継続的なライフサイクル管理の一部として扱われていることを示す有用なシグナルです。
- データおよびテクニカルアーキテクチャは、コストメトリクスとリネージを対象としています。CDMCは、組織がデータの使用、ストレージ、移動に関連するコストメトリクスをカタログで利用できるようにし、機密データのリネージ情報を利用できるようにすることを求めています。
EDM CouncilのCDMCベンチマーク資料では、エビデンスに基づくスコアリングモデルを使用し、プロセス、エンゲージメント、エビデンスに結びついた評価出力によって成熟度を説明しています。実際には、組織はこの結果を使用して、コントロールごとの成熟度ビューと、自動化、メタデータ、ポリシーの適用範囲、または監視においてまだ作業が必要な箇所を示す修復ヒートマップを作成します。
6つの領域全体で測定された成熟度がどのようなものかについて、実践的な考え方を以下に示しました。
| 機能領域 | 測定された成熟度の状態 |
|---|---|
| カタログ化と分類 | 新しいデータアセットは自動的にカタログ化され、所有権が入力され、機密列は取り込み時に分類され、タグはダウンストリームのポリシー適用のためにクエリできる |
| データ保護とプライバシー | マスキング、暗号化、プライバシーコントロールはポリシーを通じて関連付けられ、コントロールの適用のエビデンスは手動で再構築することなく提示できる |
| データ品質 | 品質チェックはスケジュールに従って実行され、例外は一元的に可視化され、所有者はどのチェックがどこで失敗したかを追跡できる |
| データライフサイクル | 保持スケジュールは一貫して適用され、リカバリウィンドウが定義され、復元またはパージアクションを監査できる |
| データアクセスと使用 | アクセスはロールベースまたはポリシーベースのルールに従い、デフォルトの所有権は明確であり、使用状況はユーザー、ロール、および承認された目的に追跡できる |
| データ主権 | リージョンおよび移動の制約が文書化され、国境を越えた取り扱いは監査可能であり、例外はポリシーに照らしてレビューできる |
SnowflakeによるCDMCの実装
CDMCはベンダー中立であり、実装は組織によって異なりますが、Snowflakeはこれらのコントロールの多くの側面をサポート可能な機能を提供します。
カタログ化と分類
Snowflake Horizonカタログはメタデータ、リネージ、ポリシーコンテキストを統合し、Snowflakeの機密データ分類は、機密として識別された列にシステム定義のタグを適用します。Horizonは、環境全体にわたる保持およびアクセスポリシーの適用を支援し、カタログ化と分類がアクティブなコントロールレイヤーとして機能すべきであるというCDMCの期待をサポートします。
保護とプライバシー
Snowflakeは、ダイナミックデータマスキングと行アクセスポリシーを可能にします。ダイナミックデータマスキング機能は、マスキングポリシーを使用して、クエリ実行時にテーブルおよびビューの列にあるプレーンテキストデータを選択的にマスクします。一方、行アクセスポリシーは、テーブルまたはビューで表示可能な行を制御します。これらのコントロールを組み合わせることで、セキュリティコントロールおよびプライバシーに配慮したアクセス管理に関連するCDMCの要件をサポートするために使用できます。
データライフサイクル
Snowflakeは、最大90日間のTime Travelと、Time Travelの保持期間終了後7日以内のフェイルセーフを提供します。これらの機能は、プラットフォーム内の保持およびリカバリコントロール要件をサポートできる組み込み機能を提供します。
データ品質の管理と測定
データライフサイクル内のデータ品質の測定コントロールについて、Snowflakeのデータ品質モニタリングとデータメトリック関数は、一般的なデータ品質属性を測定するための組み込みおよびカスタムの方法を提供します。システムデータメトリック関数は、テーブルまたはビューに割り当てて、ガバナンスおよびコンプライアンスのニーズに使用できるため、CDMC Control 11に実用的に適合します。
アクセシビリティと使用
Snowflakeのアクセスモデルは、ロールベースのアクセス制御(RBAC)、所有権、および権限を中心としており、その上に関連するポリシーコントロールが階層化されています。これにより、フレームワークのエンタイトルメントとアクセスの側面がサポートされる一方で、タグとメタデータは、アクセスの決定を機密性や使用コンテキストに結び付けるのに役立ちます。
データおよびテクニカルアーキテクチャ
Horizonカタログのメタデータおよびリネージモデルは、CDMCを一連のコントロールステートメントから、組織が実際に評価できるものへと変えるのに役立ちます。このフレームワークは、チームが機密アセットを特定し、それにガバナンスコンテキストを付与し、システム、変換、およびそれに依存するダウンストリームオブジェクト全体にわたって追跡できることを前提としています。メタデータは、所有権、分類、タグ、関連するコントロールなどのコンテキストを表面化させます。一方、リネージは、データがどのように移動し、それらのコントロールをどこで維持する必要があるかを示します。
ガバナンスとアカウンタビリティ
Snowflakeは、CDMCが依存するコントロールコンテキストの確立を支援します。このフレームワークは、機密データが分類または保護されているかどうかだけでなく、誰がそれを所有しているか、どのソースが信頼できるか、コンプライアンスがどのように監視されているか、環境や管轄区域を越えた移動をポリシーに照らしてレビューできるかどうかを組織が示せるかを問うものです。
Snowflakeは、共有メタデータ、所有権フィールド、タグ、ポリシーの適用、およびアクティビティの可視性を通じて、組織がコンプライアンス関連のプロセスを実装、運用、および監視するのを支援できる機能を提供します。これにより、ガバナンスはデータスチュワードやコントロール所有者が実際に検査できるものになります。
機能と特徴のシンプルなマップを以下に示します。
| CDMCの機能 | Snowflake機能のサポート |
|---|---|
| ガバナンスとアカウンタビリティ | Snowflake Horizonカタログ、所有権メタデータ、タグ、アクセス履歴、ポリシー制御 |
| カタログ化と分類 | Snowflake Horizonカタログ、機密データの分類、オブジェクトのタグ付け |
| アクセシビリティと利用 | RBAC、行アクセスポリシー、所有権と権限のモデル |
| 保護とプライバシー | ダイナミックデータマスキング、行アクセスポリシー、分類タグ、ポリシーの適用 |
| データライフサイクル | Time Travel、フェイルセーフ、Horizonカタログにおける保持関連のポリシーコンテキスト |
| データおよびテクニカルアーキテクチャ | Snowflake Horizonカタログにおけるリネージとメタデータ、より広範なガバナンスレポートと組み合わされた使用状況およびコストデータ |
クラウドコントロールの評価を可能にするCDMC
CDMCを際立たせているのは、クラウドデータ管理には自動化され、証跡化され、継続的に再評価できる制御が必要であると想定している点ではありません。なぜなら、モダンなプラットフォームは実際にそのように動作しているからです。このフレームワークの価値は、コントロールを命名することだけではありません。カタログのメタデータがどこに設定されているか、アクセスがどのように適用されているか、品質チェックが手動の介入なしで実行されているか、監査人や規制当局から証明を求められたときにどのような証拠が存在するかといった質問を、チームに投げかける点にあります。
