エンタープライズAIを加速する無限のデータ

正直な話、堅牢なデータ基盤なしに、優れたエージェント型AI製品を構築することはできません。しかし、現実には、ほとんどのデータファウンデーションに重大な亀裂が生じています。開発者やプロダクトマネージャーは依然として、断片化されたデータやアクセスできないデータと格闘し、サイロ化されたシステム間でのデータガバナンスに多くの時間を費やしています。この摩擦が、優れたアイデアを実稼働からさらに後押しします。
Snowflakeは、この状況を変えるためのツールです。
Snowflakeは本日、開発者に究極のデータ柔軟性とアクセシビリティを提供することに全面的に焦点を当てた、新しいツールと拡張機能を大幅に刷新しました。Snowflake Horizon Catalog、Snowflake Openflow、Snowflake Postgresの進歩とパフォーマンスの向上により、開発者はエンタープライズデータにセキュアに接続し、利用することが容易になります。
AIを活用したデータ移行の合理化
データの一元化、データの取り込みとアクセスの簡素化、相互運用性の向上による開発加速
エンタープライズクラスのセキュリティとガバナンスの機能と管理機能による、コンプライアンスプロセスとレジリエンシーの強化と大規模化
取り込みとクエリのパフォーマンスの向上、コストの大規模な可視性の強化により、インサイトを迅速に取得
ここからは、データの提供方法について詳しく見ていきましょう。
AIでデータ移行を合理化し、データの柔軟性とアクセシビリティを向上
レガシーシステムからのデータ移動は、特に複雑で相互依存するコードやスキーマを扱う場合には、時間のかかる高コストのギャンブルとなることが多くあります。私たちは、移行ツールに直接AIを組み込むことで、このプロセスの悩みを解消しています。
SnowConvert AIは、より高速で予測可能な低コストの移行パスを提供するため、信頼できるデータを開発者に迅速に提供できます。AI駆動のコード検証と修復(パブリックプレビュー中)は、変換されたコードのテストと修復という面倒で時間のかかるプロセスを自動化することで移行を加速します。そのため、展開前に精度と品質を確保できます。自動インクリメンタルコード検証(一般提供中)は、変換されたコードのセマンティック等価性を自動的に小さな増分でチェックし、データの信頼性を大幅に高めます。
また、SnowConvert AIのサポートをデータベース以外にも拡張し、レガシーETLやBIリポイント(パブリックプレビュー中)など、エンドツーエンドのエコシステム移行もサポートしています。この幅広いサポートにより、データ環境全体のリスクの軽減と一貫性の向上が実現し、品質を犠牲にすることなく移行に必要な時間とコストを大幅に削減できます。
簡素化されたワークフローとエンタープライズレイクハウス全体にわたる相互運用性の拡大により、開発を加速
モダンアプリ開発では、パイプラインオーケストレーションのエキスパートでなくても大丈夫です。トランザクションデータと分析データが共存し、エンジンやクラウドに関係なくオープンデータフォーマットを簡単に扱える、合理化された環境が必要です。
ここで、簡素化されたワークフローと真の相互運用性が差別化要素となります。Snowflakeは、エンドツーエンドのパイプラインを合理化するために、データワークロードの統合、オープンスタンダードのサポートの拡大、コネクタと展開オプションの追加によってエンタープライズレイクハウスを再定義しています。最終的な目標は、必要なものを必要なタイミングで構築できる柔軟性を提供することです。
Snowflake Postgresでより多くの運用ワークロードをサポートし、データを統合
Postgresは、開発者の間でナンバーワンのデータベースであり、モダンアプリケーション開発のバックボーンとしての地位を確立しています。Snowflake Postgres(近日中にパブリックプレビュー中)が、PostgresをSnowflake AIデータクラウドに移行しようとしていることは、すでにご存じですね。開発者が求めるPostgresを、ビジネスに必要なエンタープライズグレードのプラットフォームで提供して、トランザクションシステムと分析システム間のデータ接続を容易にします。オープンソースのPostgresとの完全な互換性を備えているため、コードを書き換えることなくSnowflake上で運用ワークロードを実行できます。開発者は、依存する特定のPostgres拡張機能、ORM、クライアント/フレームワークを引き続き使用できます。新しいトランザクションデータを使用して、よりスマートなアプリケーションやコンテキストアウェアなAIエージェントを構築すると同時に、アーキテクチャを簡素化してシングルプラットフォームでのイノベーションを加速できます。
また、オープンソースのPostgres拡張セットであるpg_lakeも発表しています。pg_lakeは、開発者がPostgresを使用してレイクハウスとやり取りできるようにします。pg_lakeを使用すると、Postgresがオブジェクトストレージ内の分析データのある場所で直接クエリを実行できます。これは、Apache Iceberg™テーブルに対する標準のSQLを使用した読み取りと書き込み、CSV、Parquet、JSONなどのファイル形式からのデータのクエリやロードを可能にすることで実現します。pg_lakeにより、Postgresのパワーをレイクハウスにもたらします。
相互運用性の向上
真に使いやすく、コネクテッドで、信頼できるエンタープライズレイクハウスを実現するためには、すべてのエンジンやクラウドプラットフォームにわたって普遍的なアクセスと相互運用性を確保する必要があります。Snowflakeは一貫して、クロスクラウドとクロスリージョンのセキュアなデータアクセシビリティとデータ共有のメリットを強調しています。現在は、Apache Polaris(インキュベーション中)とApache Iceberg REST CatalogのオープンAPIを介して、Snowflake Horizon Catalogが外部エンジンの読み取り(近日中にパブリックプレビュー中)と書き込み(近日中にプライベートプレビュー中)のSnowflake管理Icebergテーブルへのアクセスをサポートしているため、ロックインのない相互運用性が強化されています。これにより、Iceberg RESTプロトコルをサポートする外部クエリエンジンからSnowflake管理Icebergテーブルへのアクセスが大幅に容易になります。Apache Polarisアカウントを個別に設定し、統合を設定し、ユーザーとロールのセットを個別に管理し、セキュリティ設定を個別に行う必要はありません。SnowflakeアカウントのHorizon Catalogから直接、テーブルにアクセスできるようになりました。
また、ゼロETLデータ共有機能を、データの存在するメタデータカタログに関係なくApache IcebergテーブルやDelta Lakeテーブルなどのオープンテーブル形式(一般提供中)にも拡張しています。新しいバリアントデータ型や地理空間データ型など、最新のApache Iceberg V3機能(プライベートプレビュー中)のサポートにより、Icebergテーブルのユースケースがさらに広がります。
また、Snowflakeはレイクハウスに新たなレベルのエンタープライズデータ保護を導入しています。Snowflake管理Icebergテーブル事業継続性/ディザスタリカバリ(BCDR)(パブリックプレビュー中)では、複数のリージョンやクラウドにまたがってアカウントオブジェクトやデータベースの非同期コピーを作成し、フェイルオーバーグループを形成できます。この堅牢なレジリエンシーとリカバリ機能により、災害やクラウド障害が発生しても、データへのアクセスを維持し、ビジネスを稼働させることができます。
パイプラインの合理化とデータ提供の強化
エンドツーエンドのデータパイプラインを簡素化することで、より多くのソースからデータを取得してデータチームの手に渡すまでの時間が短縮します。さらに、エンリッチされたデータプロダクトを迅速に構築して共有できるため、エージェント型AIのイニシアチブが大幅に改善します。
Snowflake Openflo wは、プロセスの最初の部分に取り組み、実質的にあらゆるソースからのデータ抽出と統合を自動化し、エンタープライズレイクハウス全体でデータを一元化することに重点を置いています。Openflowは、AWSのBYOC(bring your own cloud)展開オプションで一般提供が開始され、SnowparkコンテナサービスによるSnowflake展開オプションはAWSとMicrosoft Azureで一般提供が開始されています。Openflow Snowflakeの展開では、完全に統合されたエクスペリエンスが提供されるため、データエンジニアはインフラストラクチャの管理、ネットワークの構成、システム間のセキュリティ境界の懸念から解放されます。
また、Snowflakeはコネクタと展開オプションの広範なライブラリに新たな統合オプションを追加しています。これらはすべて、データへの接続と利用の効率化を目的としています。
統合されたゼロコピーのエンタープライズデータ統合:SAP Snowflake(プライベートプレビュー中)は、フルマネージドのデータ機能とAI機能によってSAPビジネスデータクラウドを拡張し、双方向統合を通じてエンタープライズデータランドスケープを簡素化します。また、Oracle(近日中にパブリックプレビュー中)とも提携し、CDCとの新たなコラボレーションを拡張して、オンプレミスとクラウドの環境にまたがって高速なデータレプリケーションを実現しました。
dbt projects on Snowflake(一般提供):Snowflakeで直接、データ変換dbtプロジェクトを構築、テスト、展開、監視できるため、データエンジニアはインフラストラクチャのメンテナンスではなく、インサイトの提供に集中できます。
Snowpark Connect for Apache Spark™(一般提供):オープンソースのSpark Connectクライアントを使用して、最小限の変更でApache SparkコードをSnowflake上で直接実行できます。Snowparkのお客様は、平均で5.6倍の高速化と41%のコスト削減を実現しています1。
開発者がこうしたすべてのデータにアクセスできるようになると、信頼性とシンプルさを備えたコラボレーションと効率的なプロジェクトイテレーションの方法が必要になります。高度なデータプロダクトを作成して共有することは、エンリッチされたデータを提供する効率的な方法です。データプロダクトとしてのデータベース、テーブル、セキュアビューの共有に加え、Snowflakeネイティブアプリフレームワークの宣言型共有構成(近日中に一般提供)を使用することで、Snowflake NotebookとUDFを簡単にパッケージ化して共有できるようになりました。
エンタープライズクラスのセキュリティ、ガバナンス、レジリエンシーのイノベーションでコンプライアンスの取り組みを強化
より多くのデータを接続してAIイニシアチブを拡大するにつれて、セキュリティ、ガバナンス、事業継続性の機能に対する要求は高まるばかりです。トレーニングには、クリーンで正確なAIデータが必要です。堅牢なレジリエンシーとデータセキュリティはまさに必須事項です。コンプライアンスも重要です。
Snowflake Horizon Catalogは、すべてのデータにわたってAIのコンテキストとガバナンスを提供する、汎用的なAIカタログです。エンタープライズレイクハウスにロックインのない相互運用性を提供し、データとAIのためのエンタープライズグレードのセキュリティとガバナンスの機能を提供します。また、Horizon Catalogは、AIエージェントがデータを正しく解釈できるように欠落しているコンテキストを提供することで、AIがデータについて理解を深めることにも役立ちます。最後に、Horizon Catalogは、クロスリージョン、クロスクラウドの管理性と、組織内のすべてのアカウントの管理者との大規模な共有、クラウドとリージョンにまたがるシームレスなコラボレーションとBCDRを可能にします。
新たに利用可能になったHorizon Catalogの機能には、非構造化データ内の個人を特定できる情報(PII)を検出してリダクションするAI SQL関数であるAI Redact(パブリックプレビュー中)が含まれます。これは、AIモデルがトレーニングに使用している非構造化データのPIIを保護するという、エンタープライズAIの急速な導入を阻む大きな障害に直接対処するものであり、組織がエンタープライズデータAIをさらに活用できるようにします。また、機密データの検知、タグ付け、保護、モニタリングの管理と自動化を可能にする、トラストセンターのシンプルなUIであるData Security Posture Management(パブリックプレビュー中)も発表しています。
現在パブリックプレビュー中のHorizon Catalogでは、外部データリネージの可視性、自動化されたデータプロファイリングのためのタブを備えたSnowsightインターフェイスのシンプルなデータ品質UIなど、その他の改善点も提供されています。新しい異常検知UIとアラートシステム(パブリックプレビュー中)は、組織内のすべてのアカウントでセキュリティ異常を一元化し、新しい異常を警告します。トラストセンターのその他のアップデート:
サードパーティTrust Center拡張機能の構築(パブリックプレビュー中)と、Snowflakeマーケットプレイスを通じた他のSnowflakeユーザーへの提供
グローバル組織管理者が組織アカウントのすべてのアカウントのセキュリティ態勢を確認できるようにする(近日中に一般提供)
Hybrid Tableに対するSnowflakeの機能拡張の焦点は、セキュリティのサポートでもあります。Hybrid Tableは、Microsoft Azureで一般提供されるようになっただけでなく、SnowflakeのTri-Secret Secure(TSS)暗号化モデルもサポートしています(AWSで一般提供中、Microsoft Azureでパブリックプレビュー中)。TSSは、Snowflakeの組み込みのユーザー認証と、Snowflakeが保持するキーとお客様が管理するキーを組み合わせた複合マスターキーでデータを保護し、より高度なセキュリティを提供します。さらに、Hybrid Tableの自動キー再生成機能(AWSとAzureで一般提供中)は、開発者が暗号化キーを定期的かつ自動的に変更することで、セキュリティとコンプライアンスの基準を満たします。
ビジネスレジリエンシー面では、Snowflake Backups(近日中に一般提供)は、サイバーレジリエンシーの強化、コンプライアンスのサポート、監査または法的目的のためのデータ整合性の強化を実現する強力なツールを提供します。ポイントインタイムバックアップを作成し、変更不可に設定することで、一度作成したバックアップは管理者であっても変更や削除ができなくなります。ランサムウェアのシナリオ、自然災害、障害が発生した場合は、バックアップとSnowflakeのアカウントレプリケーション機能を組み合わせることで、すべてのバックアップセットとポリシーを別のリージョンまたはクラウドプロバイダーに複製して復元できます。

取り込みとクエリのパフォーマンスが向上し、コストの可視性が大規模に向上することで、インサイトを迅速に得られる
スピードとコスト効率は、収益とユーザーに価値を提供する能力の両方に直接影響します。リアルタイムのデータストリームを扱い、高負荷の分析ワークロードを実行する場合、大規模なパフォーマンスは特に重要です。
エージェント型AIアプリのデータとパフォーマンスの需要に対応
Snowflakeは、プラットフォーム全体にわたって継続的に自動改善を行うことで、データパイプラインとクエリの高速化を実現します。
そのメリットは、Snowflake Standard Warehouse Generation 2(Gen2)のSnowflake Optima intelligent optimization機能にあります。Snowflake Optimaは、アナリティクスとデータエンジニアリングのワークロードのクエリパフォーマンスを高速化します。たとえば、ワークロードを分析して高速化できる反復ポイントルックアップクエリをプロアクティブに特定するOptima Indexing(一般提供中)などがあります。ある自動車業界のお客様は、Snowflake Optimaにより、Gen2ウェアハウスで頻繁に実行される高選択性クエリを15倍高速化しました。
ストリーミングワークロードについては、Snowflakeの次世代データ取り込みフレームワークの最新バージョンである Snowflake Streaming V2(近日中にAzureとGCPでAWSで一般提供)が、最近のベンチマークテストで クエリ完了時間が56%短縮 され、エンドツーエンドのレイテンシーが改善 する簡素化されたアーキテクチャをサポートしています2 。また、全体的な費用の削減に役立つ、予測可能な従量課金の料金モデルも導入しています。
Snowflakeダイナミックテーブルは、単一のSQLクエリで必要な状態を定義できるようにすることで、データパイプラインを簡素化します。新しい不変機能(一般提供中)を使用すると、テーブルの領域をロックしてリフレッシュ時に変更されないようにできるため、再計算が減少し、コストが低減します。ダイナミックIcebergテーブル(一般提供中)はデータレイクと統合できるため、Snowflakeで管理しながら外部クラウドストレージ(AWS S3、Azure Blob Storageなど)にデータを保存できます。
コストを注視する
今日の開発者は、AIの取り組みの一環としてクラウドコストを頻繁に監視する必要があることに気付いています。Snowflakeのお客様は、SQLを使用して組織のすべてのSnowflakeアカウントにわたって共有リソース(プライベートプレビュー中)の粒度の高いコスト割り当てを行うなど、詳細を掘り下げるツールを使用して消費を管理できるようになりました。新しいタグベースのバジェット機能により、組織は共有リソースのユーザーのバジェットを設定できます(近日中にプライベートプレビュー中)。これにより、ユーザーは共有リソースの消費をユーザーレベルで監視できるようになり、コスト超過を防止できます。
データ戦略はAI戦略に不可欠
Snowflakeは、エンタープライズ対応のデータとAIを加速する、コネクテッドで信頼性の高い簡単なデータファウンデーションの構築において、さらなるレベルアップを実現しています。開発者は、単一のAI対応プラットフォームを使用して、複数のソースから複数の種類のデータを簡単に移行、アクセス、接続してエージェント型AIアプリを構築できます。しかも、驚異的な高速パフォーマンス、高いスケーラビリティ、効果的なコスト管理が実現します。
AIデータクラウドは、ガバナンスの確保されたインテリジェントなAIを大規模に提供し、開発者ワークフローをモダナイズする新機能によって、構築の改善と迅速化を支援します。詳細をご確認ください。これらの機能を実際に体験するには、BUILD 2025アジェンダを確認し、多数の詳細なセッションまたはハンズオンラボに参加してください。
______________
12022年11月から2025年5月までの期間について、お客様の実稼働ユースケースと概念実証(PoC)の実践におけるSnowparkとマネージドSparkサービスの速度とコストの比較結果に基づきます。調査結果はすべて、実データによる実際のお客様の結果を要約したものであり、ベンチマーク用に作られたデータセットを表すものではありません。
2ベンチマークレポートは、TPC-DSベンチマークから派生しているため、この結果は非公式であり、トランザクション処理パフォーマンス評議会による検証や認定を受けたものではありません。この結果は情報提供のみを目的としており、TPC-DSの公式結果と比較することはできません。
将来の見通しに関する記述
このページには、Snowflakeが将来提供する製品に関する記述を含め、将来の見通しに関する記述が含まれていますが、これはいかなる製品の提供も約束するものではありません。実際の成果や提供物は異なる可能性があり、既知および未知のリスクおよび不確実性の影響を受けます。詳細については、最新の四半期報告書(10-Q)をご覧ください。


