すべての企業は、2つの世界でビジネスを展開しています。1つは、アプリが注文を処理し、イベントを追跡し、顧客にリアルタイムでサービスを提供する世界です。もう1つは、アナリティクスプラットフォームがインサイトを発見し、モデルをトレーニングし、AIを駆動する世界です。これら2つの世界の間には、抽出、変換、ロード(ETL)パイプライン、バッチジョブ、サードパーティツールが複雑に絡み合っており、そのメンテナンスには多額のコストがかかります。
現在、Snowflake Postgresがこのギャップを埋めようとしています。Snowflake Summitで、以下の機能が発表されました。
データミラーリング:PostgresとSnowflake間のオールウェイズオンのレプリケーション(まもなくパブリックプレビュー開始)
データレイク向けPostgres:Icebergなどのオープンフォーマットを使用して、Postgresとアナリティクスを同期する、より柔軟な方法(まもなく一般提供開始)
これらにより、複雑なパイプラインを必要とせずに、トランザクションデータと分析データをシームレスに接続できます。
インフラストラクチャにおける最大の課題への対応
オンライントランザクション処理(OLTP)データベースとオンライン分析処理(OLAP)データベース間のデータ移動は、データエステートにおいて最も苦痛なインフラストラクチャタスクであるという声が、お客様から常に寄せられています。ETLのライセンス、パイプラインのコンピュート、コネクタの料金といった目に見えるコストは、氷山の一角にすぎません。その水面下には、データの不整合、ガバナンスリスク、メンテナンスに費やされるエンジニアリング時間、そして古いデータによる意思決定の遅れが潜んでいます。
AIエージェントとリアルタイムアプリの時代において、このアプローチでは常に一歩遅れをとることになります。不正検知モデルは、昨晩のバッチロードでは今日の脅威を捉えることができません。価格設定エンジンは、6時間のタイムラグがあっては最適化できません。
Snowflake Postgresにより、PostgresとSnowflakeを連携させるための、根本的に異なり、かつ画期的にシンプルなアプローチが開発されました。
データを接続する2つの新しい方法:オールウェイズオンのデータミラーリングとオープンフォーマットのデータレイク統合
オープンソースのpg_lake拡張機能により、オールウェイズオンのデータミラーリングと、柔軟でオープンフォーマットのデータレイク統合のいずれかを選択して、トランザクションデータと分析データをシームレスに接続できるようになりました。
1.データミラーリング:「設定するだけで後はお任せ」のデータレプリケーション
データミラーリングにより、PostgresとSnowflake間で低レイテンシーのレプリケーションが提供されます。ミラーを作成すると、Snowflakeは、スキーマの変更やミラーリングされたスキーマ内に作成された新しいテーブルを含め、ソーステーブルの現在の状態を反映したターゲットテーブルを維持します。
Snowflake CoCo、Snowsight UI、または単一のSQLコマンドを使用して、数回のクリックで設定できます。これだけで完了です。データは、必要な場所へとスムーズに流れていきます。詳しくは、こちらのデモをご覧ください。
データミラーリングの主なメリットは以下のとおりです。
管理するインフラストラクチャがゼロ:ミラーは完全にSnowflake内で実行される外部のCDCサービスをデプロイする必要も、コネクタプロセスを監視する必要も、追加のベンダーを管理する必要もない
常に最新の読み取り:すべてのミラーリングされたテーブルには、すでに適用されたデータと処理中の変更を組み合わせた
$liveビューが含まれているため、読み取り側はコミットされたすべてのソースの変更を数秒以内に確認できるトランザクションの一貫性:単一のソーストランザクションからの変更は、ターゲットにまとめて表示される外部キーなどのテーブル間の関係はそのまま維持されるため、ダウンストリームの結合やレポートの正確性が保たれる
組み込みの変更履歴:すべてのミラーリングされたテーブルには、挿入、更新、削除を公開する7日間の変更フィード(
$changes)が自動的に追加され、SnowflakeとPostgresの両方からクエリを実行できるあらゆる規模での高スループット:レプリケーションでは、コストのかかるフルテーブルスキャンをスキップする最適化された適用戦略が使用されるため、データが増加しても高いパフォーマンスが維持される
データミラーリングは、データ移動について考えるのをやめたいチームにとって特に有用です。一度セットアップすれば、OLTPとOLAPが自動的かつ継続的、そして確実に同期されます。また、データミラーリングは間もなく逆方向にも機能するようになります。SnowflakeからPostgresへのミラーリングは今年後半に提供される予定であり、トランザクションと分析の世界を繋ぐ本格的な双方向ブリッジが構築されます。
2.データレイク向けPostgres:データ移動の柔軟性に優れたツール
すべてのユースケースで継続的な同期が必要なわけではありません。より高い柔軟性が求められる場合もあります。たとえば、特定のファイルの移動、共有のオープンフォーマットテーブルの作成、またはSnowflakeへの移動中におけるデータの変換が必要になる場合があります。
データレイク向けPostgresは、そのような柔軟性を提供します。
ファイルの移動:内部Snowflakeステージまたは外部オブジェクトストレージを介して、PostgresとSnowflake間でファイルをプッシュおよびプルする
Apache Iceberg™テーブルの共有:PostgresとSnowflakeの両方から読み取り可能なオープンフォーマットのIcebergテーブルを作成する。これにより、2つのシステムで1つのテーブルを共有でき、重複を排除できる
移動中の変換:データがPostgresとSnowflakeの間を移動する際に、フィルター、結合、集計などのSQL変換を適用する
これにより、開発者は使い慣れたPostgresの完全なエクスペリエンスに加えて、IcebergやParquetなどのオープンスタンダードとのネイティブな相互運用性を得ることができます。これは、データ移動の方法、タイミング、対象について、より詳細な制御を求めるチーム向けです。
結果:1つのプラットフォーム、ゼロパイプラインを実現
これらの機能を組み合わせることで、各ワークロードに最適なアプローチを選択できるようになります。
データミラーリング |
データレイク向けPostgres |
|
最適な用途 |
継続的かつ自動的な同期 |
柔軟で制御された移動 |
レイテンシ |
秒単位 |
オンデマンド |
セットアップ |
1つのコマンド、数回のクリック |
SQL + pg_lake + pg_cron(オプション) |
方向 |
Postgres → Snowflake(現在) |
オブジェクトストレージを介した双方向 |
フォーマット |
ネイティブSnowflakeテーブル |
カタログ統合、ストレージ統合、またはステージを介したIceberg、Parquet、CSV、JSON |
実際の成果:企業はすでにパイプラインを排除しつつある
Ericsson、48時間の遅延から数分へ
Ericssonの基盤データチームは、世界中のあらゆる顧客ネットワークからソフトウェア、ハードウェア、ライセンスのデータを収集しています。AIからカスタマーサポートまで、複数のダウンストリームチームがこのデータに依存しています。以前は、データは4つのレガシーデータベースに閉じ込められており、それらを接続するパイプラインの同期には最大40日かかっていました。
Snowflake Postgresに統合することで、Ericssonはこれらのパイプラインを排除しました。チケットの作成において現場に何がデプロイされているかを正確に把握する必要がある同社のカスタマーサポートプラットフォームでは、48時間のデータ遅延と12時間の処理時間が、エンドツーエンドで1時間未満に短縮されました。現在、すべてのチームがSnowflakeの共有レイヤーを通じて、同じ信頼できるデータにアクセスしています。
「Snowflake Postgresによって、個別のデータプレーンを必要とする最後の理由がなくなりました。トランザクションワークロードと分析ワークロードに対応する1つのプラットフォームに、4つのレガシーデータベースを統合したことで、同期パイプライン、信頼できる情報源の競合、そして余分なインフラストラクチャを排除できました」
—Dean Soc氏
SimCorpはデータ同期を10倍高速化
SimCorpは、世界有数の金融機関に投資ソフトウェアを提供しており、40年以上にわたる膨大な金融商品データを管理しています。この規模をサポートするため、同社はPostgresとSnowflakeの環境を別々に運用し、システム間で数時間のデータ転送を必要とするカスタムの照合プロセスを実行していました。
Snowflake Postgresにより、このような複雑さは解消されました。Snowflake Postgresは照合コードの必要性を排除し、運用を合理化してオーバーヘッドを削減します。
その効果は絶大です。一貫した追跡とレポート作成を確実にするために取引所コードを標準化する同社の市場IDサービスでは、同期時間が数時間から20分未満へと10倍短縮されました。同時に、投資チームが市場リスクを定量化できるようにするミッションクリティカルなリスクモデルとクレジットスプレッドカーブは、AIとデータ共有を通じて、世界中のクライアントがほぼ即時に利用できるようになりました。
今後、SimCorpはこの基盤をベースとして、データプラットフォームを通じたPostgresとSnowflake間のインテリジェントなロードバランシングを可能にする予定です。この進化は、統合されたトランザクションデータと分析データを活用する次世代アプリケーションへの道を切り開き、世界中のクライアントに、より迅速なインサイト、向上したスケーラビリティ、そしてより強力な成果をもたらします。
「初期テストの結果、ディスク操作は従来のマネージドPostgresソリューションと比べて最大10倍高速であることが示されました。大量のトランザクション更新や複雑なアプリケーションワークフローを、大幅な飛躍となるレベルのスピードと安定性ですぐにサポートできるようになりました」
—Mike Willett氏
Snowflake Postgresの差別化要因
ほとんどのデータレプリケーションツールは、データベースとウェアハウスの間に別のサービスを挟み込むことで機能するため、監視すべきシステムがもう1つ増え、スタックに別のベンダーが追加されることになります。これらのツールは、データ移動をインフラストラクチャに後付けされた外部の問題として扱います。
Snowflake Postgresは、これをネイティブな機能として扱います。データ移動は、Postgresがオブジェクトストレージ(Snowflakeが読み取るのと同じレイヤー)に直接書き込むことを可能にするオープンソースのPostgres拡張機能であるpg_lakeに基づいて構築されています。仲介要素はありません。PostgresとSnowflakeがネイティブに連携するだけです。
これにより、以下のメリットが得られます。
評価、支払い、管理を行う新しいベンダーが不要
展開および監視する新しいインフラストラクチャが不要
新しいスキルの習得が不要(オープンスタンダードに基づいて構築された標準的なPostgresと標準的なSnowflakeであるため)
AIエージェントやリアルタイムアプリを損なうデータ遅延が解消
また、すでにSnowflakeのお客様である場合は、新しい契約を必要とせずに、既存のコミット済み利用枠からこれらのトランザクションワークロードを実行できます。
トランザクションデータと分析データが1つになれば、AIとアプリは最新の信頼できる情報に基づいて動作します。エージェントは最新のトランザクションをほぼリアルタイムで確認できます。価格モデルは最新のデータに基づいて実行されます。不正検知は、脅威の発生時にそれを捕捉します。ダッシュボードは、昨日の状況ではなく、現在の状況を反映します。
今すぐ利用を開始
PostgresからSnowflakeへのデータミラーリングは、まもなくパブリックプレビューで利用可能になります。データレイク向けPostgresは、まもなく一般提供されます。利用を開始するには、以下のリソースをご確認ください。
将来の見通しに関する記述:本記事には、将来の製品提供に関する将来予想に関する記述が含まれていますが、これらは提供を確約するものではありません。実際の結果は異なる場合があります。詳細については、最新の四半期報告書(10-Q)をご覧ください。





