注:本記事は(2024年3月19日)に公開された(Data Trends 2024: Strategies for an AI-Ready Data Foundation)を機械翻訳により公開したものです。

企業のデータ戦略は常に動き続けています。生成AIと大規模言語モデル(LLM)に対する関心が爆発的に高まっており、競争力を維持するためにはこれらのテクノロジーをどれだけ迅速に採用すべきかについて、ビジネスリーダーらが議論するようになっています。

新たにリリースされたSnowflakeデータトレンド2024では、データクラウド内のユーザーによるデータの利用方法に新たなアプローチを取り入れることができます。ユーザーがどのような機能、言語、アプローチを採用しているかを把握することで、この急速に変化する新しい高度なAI時代に向けて組織がデータをどのように準備しているかをリアルに知ることができます。

本レポートでは、データ戦略の2つの側面に焦点を当てました。LLMと、LLMと連携するアプリケーションに関するアクティビティを調べました。しかし、生成AI、LLM、その他の革新的なテクノロジーで成功を収めるには、強力なデータ基盤を構築する必要があります。そこで、私たちはまず、組織が高度な新しいテクノロジーの準備作業をシフトしているか、加速しているかを示唆する基本的な活動に着目しました。

全体として、組織は強力な新しいAIテクノロジーによってデータをより効果的に使用できるように確実に準備していることがわかりました。最も目立った回答はガバナンスに関するものでした。セキュリティとコンプライアンスの義務を果たすためには強力なデータガバナンスが不可欠ですが、妨げになると見なされがちです。IT部門がデータを「ロックダウン」すれば、インサイトの獲得や戦略の改善にデータを活用できなくなるため、不満の声が上がることがよくあります。データクラウドのアクティビティを見ると、まったく逆の結果が出ています。

  • 個々のガバナンス機能(データオブジェクトに適用されるタグ、データセットに割り当てられるマスキングポリシーなど)の適用は、2023年1月から2024年1月にかけて72%から98%増加しました。
  • このポリシーで保護されたデータに対して実行された累積クエリ数も、142%増加しました。

これは、組織がデータガバナンスプラクティスの粒度を高めても、データでできることが増えていることを示しています。

また、このレポートでは、AIフレンドリーなプログラミング言語Pythonの使用が571%増加し、また、非構造化データを扱う機会が増えました。これはAIの可能性が大きく、すべての非構造化データのシェアが一貫して80~90%になると推定されているためです。 

AIの作業とアプリケーションについて、私たちが最も刺激的だったのは、Streamlit開発者コミュニティでした。 

  • 2023年4月から2024年1月まで、20,000人以上の開発者が33,000以上のLLMアプリケーション(開発中のアプリケーションを含む)に取り組みました。 
  • その間、チャットボットであるアプリの割合は、4月の18%から1月末までに46%へと大幅に増加しました。

その多くは実験とパイロットプロジェクトだったはずですが、多くの開発者がこれらの複雑なAIモデルに熱心に取り組んでいるという事実は、イノベーションの革新的な波が始まっているという期待を裏付けるものに過ぎません。

将来的な形の可能性に関するさらなるインサイト:昨年夏にパブリックプレビューを開始して以来、急速に普及しているSnowflakeネイティブアプリフレームワーク(AWSとAzureで一般提供、GCPでプライベートプレビュー中)は、さまざまな環境にデータをコピーするのではなく、単一の安全なデータセットにコンピュテーションをもたらすという当社のマントラがユーザーの共感を呼ぶことを示しています。  

データクラウドの機能が実際にどのように利用されているかを見れば、自社の製品計画を改良するだけでなく、企業データのトレンドと未来もわかります。Snowflakeはその未来を形作るためにイノベーションを続けています。本レポートを通じて、ビジネスリーダーやITリーダーがデータクラウド内外のデータ戦略を策定するのに役立つアイデアや指標が得られることを願います。

詳細については、Snowflakeデータトレンド2024をご覧ください