
NYC Health + Hospitals Elevates Care for New Yorkers Experiencing Homelessness
SnowflakeのAIデータクラウドは、NYC Health + Hospitalsのデータハブの中核機能として、ニューヨークの困難な状況にある住民グループをサポートするために患者インサイトをタイムリーに提供しています。
トークン化は、機密データをトークンと呼ばれる非機密のプレースホルダー値に置き換えるセキュリティ手法です。トークンから元のデータを数学的に抽出することは不可能であるため、セキュリティ侵害時のデータ漏洩を最小限に抑え、規制コンプライアンスを合理化できます。
トークン化は、機密データをトークンと呼ばれる非機密のプレースホルダー値に置き換えるセキュリティ手法です。トークンから元のデータを数学的に抽出することは不可能であるため、セキュリティ侵害時のデータ漏洩を最小限に抑え、規制コンプライアンスを合理化できます。トークン化は、金融業界では決済カードデータの保護に、ヘルスケア業界では患者記録の保護に広く使用されています。また、新興のデジタルビジネスモデルの重要な構成要素でもあります。
本ガイドでは、トークン化の概要、その仕組み、そして機密データのセキュリティとプライバシーを確保するうえでトークン化が重要である理由について解説します。
トークン化は、クレジットカード番号や社会保障番号などの機密データをランダムに生成された文字列に置き換えます。この文字列は、セキュアなデータボールトを介して元の情報にリンクされています。トークン自体には意味がないため、トークンがハッキングされたり盗まれたりしても、トークンが表す元のデータのセキュリティは維持されます。
このことにより、トークン化は、機密データを解読できれば暴露できる暗号化とは異なるものになっています。また、個人を特定できる情報をデータから永続的に削除する匿名化とは異なり、許可されたシステムではトークン化を簡単に元に戻すことができます。企業はトークンを使用することで、基盤データにアクセスすることなく、決済、アナリティクスの実行、IDの検証が可能となるため、プライバシー規制の遵守が大幅に簡素化されます。
トークン化と暗号化のどちらを使用するかの選択は必ずしも明確ではありません。どちらのテクノロジーも、保護しようとしているデータと求められている取り扱い方法に応じて、ユースケースが異なります。以下に、主な違いを紹介します。
トークン化は、機密データを別のボールトに保存されているランダムなプレースホルダー値に置き換えます。暗号化は、数学アルゴリズムを使用してデータのスクランブルを行います。スクランブルされたデータは、適切なキーでスクランブル解除できます。
トークン化では、元のデータを取得するにはセキュアなトークンボールトへのアクセス権が必要です。暗号化は、正しい復号キーとアルゴリズムがあれば元に戻せるため、ポータビリティに優れています。
トークンのセキュリティは、トークンを元のデータにリンクさせるボールトのセキュリティに全面的に依存します。ボールトが突破されると、すべてのトークンが侵害を受ける可能性があります。暗号化はキーの管理に依存するため、通常、侵害は特定のキーで暗号化されたデータにのみ影響します。
トークン化では、ボールトのルックアップとネットワークレイテンシーによってパフォーマンスのボトルネックが発生する可能性があります。暗号化は外部に依存せずにローカルで実行できるため、より高速な処理が可能です。
トークン化されたデータは機密情報を含んでいないため、大部分が規制対象外です。暗号化されたデータは通常、機密扱いのままコンプライアンス要件が適用されます。
トークン化には、高可用性とディザスタリカバリを備えた専用のボールトインフラストラクチャが必要です。暗号化はインフラストラクチャの要件が低く、バックアップ手順がシンプルです。
トークン化では、ボールトの管理とメンテナンスのための継続的な運用コストが多めにかかります。暗号化では、広く利用可能な多くのソリューションを通じて、一般的に総保有コストを抑えることができます。
どちらのテクノロジーも、適切に設計されたデータガバナンスシステムの重要なコンポーネントです。たとえば、銀行やEコマースサイトでは、トークンを使用して個人の決済処理情報を不明瞭にすると同時に、暗号化を展開して企業の専有データを保護できます。トークン化は、患者のアイデンティティを保護しようとするヘルスケア組織には適していますが、検査結果や医療画像などの大量の機密情報の保護には適していません。
トークン化は、機密データをセキュアなプレースホルダーに置き換え、同時に許可されたユーザーが元の情報を取得することを可能にする、複数のステップからなるプロセスです。このプロセスは、キャプチャから最終的な削除に至るライフサイクル全体にわたって、データを確実に保護します。このプロセスの仕組みは以下のとおりです。
トークン化システムは、組織のデータ環境(通常はオンラインショッピングカート、ユーザー登録フォーム、APIエンドポイントなどのデータ収集ポイント)に入る機密情報をリアルタイムでキャプチャします。
トークン化エンジンが、元のデータと数学的な関係を持たない一意のランダムなプレースホルダー値を作成します。トークンは、システム要件やセキュリティポリシーに応じて、データの元の形式(社会保障番号の9桁の置き換えなど)を保持する場合も、新しい形式を採用する場合もあります。
実際のデータは暗号化され、厳格なアクセス制御、監査ログ、冗長性対策が採用された、隔離されたセキュアなトークンボールトに保存されます。このボールトは、アクセス元のアプリケーションから独立して動作し、トークンと対応する元の値との極めて重要なマッピングを保持します。
許可されたシステムは、元のデータにアクセスする必要がある場合には、適切な認証情報とともにトークンをボールトに送信します。ボールトがリクエストを検証して対応する機密データを取得し、処理を行うためにセキュアな形で承認済みアプリケーションに返します。
生成されたトークンは、ビジネスプロセス、データベース、アナリティクスシステム、サードパーティ統合のすべてで機密データに取って代わります。アプリケーションは、実際の機密情報を扱うことなくトークンを処理、保存、送信できるため、セキュリティリスクとコンプライアンスの適用範囲の大幅な縮小が可能です。
システムは、ビジネスルールや規制要件に従って、トークンの有効期限、更新、セキュアな削除を管理します。元のデータが不要になると、トークンとそのボールトマッピングの両方が永続的に破棄されるため、データのライフサイクル全体にわたって保護が万全になります。
データセキュリティのトークン化では、機密情報をセキュアなプレースホルダー値に置き換えるためのさまざまな方法が採用されており、それぞれの方法によってユースケースごとに異なるメリットがもたらされます。どの方法を使用するかは、データ形式の要件、パフォーマンスのニーズ、セキュリティアーキテクチャによって異なります。
形式保持型のトークン化は、機密データを元のデータと同じ形式や長さ、文字タイプのトークンに置き換えます(たとえば、16桁のクレジットカード番号は16桁のトークンに置き換えられます)。この方法は、特定のフィールド検証要件のある既存のシステムやデータベースとシームレスに統合できるため、アプリケーションを変更することなく、強力なデータ保護を実現できます。
ボールトベースのトークン化は、トークンと元の機密データとのマッピングを、トークンボールトと呼ばれる、一元化された、高度にセキュアなデータベースに保存します。このアプローチは、最も強力なセキュリティモデルを提供しますが、ボールトの可用性に依存するため、大量のオペレーションが発生する際にパフォーマンスのボトルネックが生じる可能性があります。
ボールトレスのトークン化は、暗号化アルゴリズムを使用して数学的にトークンを生成します。適切なキーを使用してトークンを元のデータに戻すことができるため、中央のトークンボールトが不要になります。この方法はボールトルックアップを必要としないため、パフォーマンスとスケーラビリティに優れています。しかし、アルゴリズムまたはキーが侵害された場合、暗号攻撃に対してより脆弱になる可能性があります。
静的データのトークン化は、長期保存やアナリティクスを目的として、データベース、ファイル、データウェアハウス内の機密情報をトークンに置き換えます。この方法は、非実稼働環境での保存データの保護、サードパーティとの安全なデータ共有、データ保持のコンプライアンス要件のサポートに理想的です。
ダイナミックデータのトークン化はリアルタイムに動作し、アプリケーション、API、ネットワーク通信で移動する機密データをキャプチャし、トークン化します。このアプローチは、移動中のデータを包括的に保護するため、特にレガシーシステムに役立ちます。
トークン化は、機密データの保護と運用効率の維持の両方を目指す組織に大きなメリットをもたらします。これらのメリットは、セキュリティ、コンプライアンス、システム機能に関する重要なビジネスニーズに対応するものです。
トークン化は、許可されていないユーザーや悪意のあるアクターがアクセスする可能性のあるビジネスシステム、データベース、アプリケーション上での機密情報の存在を減らすことにより、データセキュリティを高めます。
トークン化は、機密データを価値のないプレースホルダーに置き換えることで、データ侵害やサイバー攻撃の潜在的な影響を大幅に軽減できます。システムが侵害された場合でも、通常、セキュアなボールトにアクセスできなければ、盗まれたトークンを使用して元のデータを再構成することはできません。
トークン化を適切に実装することで機密データの露出を減らせるため、実装の詳細や規制の解釈によっては、PCI DSSのような標準でのコンプライアンスの適用範囲を狭めることが可能です。これにより、コンプライアンスのためのコスト、監査の複雑さ、厳格な規制とモニタリング要件の対象となるシステムの数を大幅に減らすことができます。
ワークフローやサードパーティ接続で機密データをシームレスに置き換えることができるため、組織は既存のビジネスプロセスやシステム統合を維持できます。
トークン化にはセキュリティ上の大きなメリットがあるものの、組織は実装上の課題や継続的な制約を慎重に検討する必要があります。こうした課題や制約は、プロジェクトのタイムライン、コスト、運用の複雑さに影響を与える可能性があります。
トークン化には、セキュアなトークンボールト、高可用性システム、ディザスタリカバリなどの専門的なインフラストラクチャを整えるために、多額の初期投資が必要となります。組織は、ボールトのメンテナンス、モニタリング、セキュリティアップデート、商用のトークン化プラットフォームで想定されるライセンス料といった運営経費も考慮する必要があります。
レガシーシステムでは、多くの場合、ハードコードされたデータ検証ルール、固定フィールド長、あるいは元のデータへの直接アクセスを想定した組み込みのビジネスロジックが使用されています。旧式のアプリケーションやデータベースでは、高額なカスタム開発やシステムの全面的な見直しが必要となり、複雑な統合の課題が生じる場合があります。
無許可のデトークン化を防ぐには、24時間365日のモニタリング、定期的なセキュリティ監査、複雑なバックアップ手順、高度なアクセス制御が求められます。組織では、複数のデータセンターにまたがるボールトのパフォーマンス、スケーラビリティ、暗号化キーのローテーション、可用性の管理が必要になります。そのため、運用が大幅に複雑化し、専門的な知識が必要となる場合があります。
リアルタイムのトークン化とデトークン化は、高スループット環境でレイテンシーのボトルネックを引き起こす可能性があります。特に、トランザクションやデータアクセスリクエストのたびにボールトのルックアップが必要となる場合です。トランザクション負荷の高いシナリオでは、アプリケーションとトークンボールトの間のネットワーク通信の遅延がすぐに蓄積され、顧客体験やシステム応答性に影響する可能性があります。
商用のトークン化ソリューションでは、専有フォーマット、API、ボールトアーキテクチャが使用されることが多く、ベンダー間の移行や代替のセキュリティアプローチへの切り替えが困難になります。組織は、重要なセキュリティインフラストラクチャを特定のベンダーに依存せざるを得ない状況に陥る場合があり、そうした状況では長期的なコスト上昇につながる可能性があります。
トークン化は、データアナリティクス、レポート作成、ビジネスインテリジェンスの運用を妨げる可能性があります。形式を保持するトークンは、正確なアナリティクスに必要な統計的特性を維持できない場合があります。一方、形式を保持しないトークンは、既存のデータ処理ワークフローを破綻させ、アプリケーションの大幅な変更が必要になる可能性があります。
トークン化は、さまざまな業界で幅広く採用されています。以下に、組織が機能とコンプライアンスを維持しながら機密データを保護するためにトークン化をどう活用しているのかについて、具体的な実装例を示します。
主要決済処理業者は、オンライン購入、モバイル決済、定期的な請求トランザクションにおいて、トークン化を使用して実際のクレジットカード番号を固有のトークンに置き換えています。このアプローチにより、加盟店は実際のカードデータを扱わずに支払いを処理したり、顧客の支払い設定を保存したりできます。そのため、PCI DSSのコンプライアンスの適用範囲が縮小するとともに、データ侵害時にカード番号が漏洩するリスクが排除されます。
病院やヘルスケアシステムは、米国HIPAA規制の下で患者のプライバシーを保護するために、患者IDとカルテ番号をトークン化しています。トークン化により、ヘルスケア組織は個々の患者のプライバシーを侵害することなく、集団健康調査や品質向上イニシアチブのために匿名化された患者データを共有できます。
エンタープライズIDプロバイダーは、ユーザー認証情報と個人を特定できる情報をトークン化することで、アプリケーションやサービスを横断したシングルサインオンと多要素認証を実現しています。これにより、組織は実際のユーザー名、パスワード、個人情報をサードパーティのアプリケーションやサービスプロバイダーに公開することなく、ユーザーIDを検証してアクセスポリシーを適用できます。
主要クラウドプラットフォームは、クラウドデータベース、データウェアハウス、アナリティクスプラットフォームに保存されている機密データを保護するためのトークン化サービスを提供しています。組織はこうしたサービスを利用して、顧客データや専有情報をクラウドストレージへのアップロード前にトークン化することで、クラウドアカウントが侵害されたり、不正な管理者によるアクセスを受けたりした場合でも、機密情報を確実に保護できます。
仮想通貨取引所や分散型金融(DeFi)プラットフォームは、不動産、商品、美術品のような現実世界の資産をトークン化し、ブロックチェーンネットワーク上で取引可能なデジタル表現を作成します。DeFiのスタートアップ企業が、トークン化された担保を利用して、従来の金融仲介業者が関与しない分散型の貸借を実現する可能性があります。
主要な小売企業やオンラインマーケットプレイスは、顧客の個人情報、購入履歴、ロイヤルティプログラムのデータをトークン化して、パーソナライズされたマーケティングエンジンやレコメンデーションエンジンを実現しています。このアプローチにより、企業は実際の顧客IDを保護しながら、顧客の行動パターンを分析し、ターゲットに合った体験を提供できます。
トークン化は、機密データを保護すると同時に、組織が制御されたリスクの低い方法で情報を利用できるようにするセキュリティアプローチです。組織はトークン化を活用して、厳格なセキュリティ標準を維持しながら、セキュアなクラウドアナリティクスを実現し、より安全なサードパーティコラボレーションを促進し、革新的なビジネスモデルを模索できます。
トークン化は、コンプライアンス要件を簡素化し、セキュリティ侵害時の露出を最小限に抑えることで、顧客やパートナーが確信を持ってデジタルサービスやデータ共有イニシアチブに関与するうえで欠かせない、信頼のフレームワークを確立します。企業は、機密データが社内のどこを流れているのかを徹底的に評価し、トークン化によって現在のセキュリティのペインポイントを戦略的な競争優位性に変えるにはどうすればよいのかを検討する必要があります。
トークン化は、機密データを別のボールトに保存されているランダムなプレースホルダー値に置き換えます。一方で暗号化は、適切なキーで元に戻せる数学アルゴリズムを使用して、データのスクランブルを行います。主な違いは、トークンは元のデータと数学的な関係を持っていないことです。誰かがトークンをクラックしても、セキュアボールトにアクセスできなければ実際の情報を抽出できません。
セキュリティアプリケーションと機械学習アプリケーションはどちらもトークン化に依存していますが、「トークン化」の意味はそれぞれで異なります。自然言語処理(NLP)におけるトークン化は、コンピューターが言語を処理して理解できるよう、テキストを文、単語、文字のような小さな単位に分割することを指します。機械学習モデルが解釈できる大きさにパラグラフを細かく刻む処理、と考えると分かりやすいでしょう。このように、NLPにおけるトークン化は機械がテキストを読み取りやすくするものです。一方でセキュリティにおけるトークン化は、組織が機密情報を隠しやすくするためのものです。