生成AIのROIを解き放つ:すべてはデータ戦略から始まる

生成AIのアーリーアダプターは、堅牢なデータ戦略こそがAIイニシアチブの成功の基盤であることを明確にしています。AIの可能性を真に引き出して、ビジネス価値を大幅に高め、顧客体験の再構築の触媒とするためには、使いやすく信頼のおけるデータプラットフォームが不可欠です。
Snowflakeの最近のレポート「The Radical ROI of Gen AI」は、生成AIが収益の原動力となることを示しています。調査対象のアーリーアダプターの10人に9人以上が、生成AIへの投資は黒字であると回答しています。生成AIイニシアチブのROIを定量化した調査回答者は、平均41%のROIであることが明らかになったと報告しています。生成AIの可能性を最大限に引き出すには、堅牢で統合されたデータ戦略が不可欠です。アーリーアダプターの88%は、すべての生成AIユースケースに対応できるデータ戦略とデータツールが必要だと回答しています。これはつまり、企業には、容易な構築と展開、高信頼の設計、チーム、ツール、クラウドのシームレスな接続を実現する、モダンデータプラットフォームが必要だということです。
アーリーアダプターの96%は、商用のLLMやオープンソースのLLMをトレーニング、チューニング、拡張していると回答しており、80%は、専有データでモデルをファインチューニングしていると答えています。この基本的なステップは、いくつかの現実的な課題をもたらします。すなわち、データ品質、システムで処理できるデータ量、バイアスが増幅するリスク、出力のプライバシーに関する懸念(企業の専有情報や顧客の個人データが外部に漏洩する可能性)についての難しい問題です。
だからこそ、生成AIに対する組織のアプローチは、そのようなリスクを最小限に抑え、計画外のコストを削減できるとともに、適切なツールの導入が容易で、AIの成功を再現して拡大し、組織のすべてのデータのセキュアで適切な活用を可能にする、強力なデータプラットフォーム上に構築する必要があります。
データの規模が拡大すると、データ管理は難しくなります。71%の組織が、効果的なモデル拡張には数テラバイトのデータ、つまり数百万のドキュメントが必要であると回答しています。しかし、問題となるのはデータの規模だけではありません。さまざまな問題のなかで、アーリーアダプターが最も多く挙げているのは、データの質(45%)と量(38%)です。そのため、データハイジーンとデータ管理はAIにおいて必須の考慮事項となります。
この課題をさらに難しくしているのは、PDF、動画、画像など、あらゆる企業のデータの大部分は非構造化データであるということです。そのため、AIの可能性を最大限に引き出すには、正確性、品質、ガバナンスを損なうことなく構造化データと非構造化データをサポートするプラットフォームが不可欠です。アーリーアダプターのなかで、半分以上の非構造化データをLLMのトレーニングやファインチューニングに利用できる準備ができていると回答したのは、わずか11%でした。全体的に大きな成功を収めていると報告しているアーリーアダプターでさえ、データプラットフォームにはいくらかの潜在的な問題を抱えています。データプラットフォームレベルでは、
55%の組織が、ラベル付けなどの時間のかかるデータ管理タスクに妨げられています。
52%が、エラー、バイアス、関連性、適時性の問題など、データ品質の維持に苦慮している
51%が、データ準備が非常に難しいと回答している
50%が、データ機密性の問題を挙げている
42%が、データの範囲や多様性が不十分であると回答している
これらの課題に最も効果的に対応できるのは、統合されたデータプラットフォームです。信頼できる接続された簡単なデータファウンデーション上で、AIテクノロジーを使用することによって、プロジェクトの遅延や予想外のコストにつながる課題を軽減できます。
生成AIとクラウドベースのデータプラットフォームの連携
生成AIのアーリーアダプターの大部分は、クラウドベースのデータプラットフォームに依存しています。また、アーリーアダプターの81%が、今後12か月間でクラウドベースのデータウェアハウスソリューションへの投資を積極的に増やすと回答しています。これは驚くことではありません。クラウドは、スケーラビリティ、コスト制御、ガバナンスを強化するだけでなく、生成AIイニシアチブに必要な高パフォーマンスのコンピュートへのアクセスを提供します。
クラウドベースのデータウェアハウスに何を求めているかを尋ねたところ、アーリーアダプターは主に次の3つの機能を挙げました。
セキュリティ:46%が「極めて重要」と回答し、38%が「重要」と回答
高度なAI機能:39%が、LLMとMLの機能を搭載することは「極めて重要」と回答し、45%が「重要」と回答
統合されたアナリティクス機能:39%が「極めて重要」と回答し、45%が「重要」と回答
Snowflakeのプラットフォームは、ガバナンスが確保されたセキュアなモダンデータプラットフォームを支えに、AI戦略の成功に不可欠なすべてのニーズに対応します。センチメント分析やチャットボットなどの新興のAIアプリケーションを保護するために、データドリブンな企業は、セキュリティライフサイクルのすべてを含むデータ変換(シルバーレイヤー)全体にわたって、アクセス制御と保護を実装する必要があります。これには以下が含まれます。
機密データセットの自動データ分類と、データ理解のための自動オブジェクト説明
タグベースアクセスポリシー、包括的なリネージグラフ、アクセス監査による、継続的なモニタリングと自動ポリシー適用
継続的で大規模なデータ品質の維持
Snowflakeでは、追加設定なしに有効化できるガバナンス機能に加えて、さまざまなLLMや一般的なMLの機能をプラットフォームに直接統合することで、複雑なデータの移動やインフラストラクチャ管理の必要性を排除しました。このアプローチでは、プラットフォームへのネイティブな統合により、組織の厳格なセキュリティ境界の維持が可能になり、すべてのデータアプリケーションにわたって一貫したガバナンスとアクセスポリシーを適用できます。
生成AIは、モダンデータスタックの他の部分から切り離された別のテクノロジーではありません。これは、データドリブンな組織の全体に拡散する大規模で革新的なイニシアチブです。組織がAIをいち早く成功に導くには、新世代のAI搭載アプリケーションをシンプルかつ迅速に拡張し、同時にコンプライアンスに準拠したセキュアな方法で構築、展開できるようにする、基盤となるデータプラットフォームが必要になります。
世界中の組織が、どのようにして生成AIの導入に伴う課題を克服し、投資から大きなリターンを得ているかについて詳しくは、「The Radical ROI of Gen AI」をお読みください。