データエンジニアリング

エンタープライズデータ統合の簡略化:Snowflake OpenflowのBYOC展開の詳細

アナリティクス、機械学習、検索など、データドリブンな価値あるインサイトを引き出すために、企業は保有する大量の情報を管理するためのより良い方法を常に模索しています。しかし、過去の状況では、これは言うは易く行うは難しでした。実際には、複雑な統合パイプラインの構築(と維持)が必要になるため、コストは言うまでもなく厄介です。 

多くの人にとって、適応性と拡張性を備えながら管理と制御が容易なデータ統合サービスは、夢のようなパイプ(ライン)のように思えるかもしれませんが、Snowflake Openflowはそのような構想を実現するために設計されています。Openflowには、2種類の展開方法があります。Snowflakeがホストする方法と、お客様がホストする方法です。Bring Your Own Cloud(BYOC)展開に基づく顧客ホスト型のオプションは、すべてのAWS商用リージョンで一般提供されています。これらの展開オプションにより、Openflowは、プライバシーやセキュリティを損なうことなく、運用のシンプルさを維持しながら、顧客データが存在する場所でデータフローを実行する柔軟性を提供します。

2部シリーズの第1回となるこのブログ記事では、BYOCとは何か、BYOCがチームにとって有益である理由、BYOCを使用するタイミングについて詳しく説明します。後に、お客様がホストするオプションと、Snowflakeがホストするオプションの両方について説明します。 

BYOCの利点

データの移動とネットワーキングに関しては、企業は通常、フルマネージド型のSaaSオプションか、セルフホスト型のオルタナティブかの2種類の展開方法から選択する必要がありますが、それぞれに長所と短所があります。マネージド型のSaaSは、セットアップとメンテナンスが簡単ですが、柔軟性に欠けることが多く、セルフホスト型では、コントロールとカスタマイズを強化できますが、特に最初の段階では、はるかに多くの作業が必要になります。 

しかし、その中間に位置するのが、利便性とスケーラビリティ、柔軟性とコントロール性という、それぞれのメリットを兼ね備えた「ちょうどいい」ソリューションです。BYOCにより、企業はクラウドインフラストラクチャ上でマネージドサービスのエクスペリエンスを享受できます。パブリックシステムとプライベートシステムをセキュアに接続し、組織のクラウド環境の安全な範囲内でローカルで機密データの前処理を行うことができます。また、大規模な企業の場合、BYOCは既存のクラウドインフラストラクチャ契約から得られる、あらゆる好ましい条件の価格設定を活用する機会を提供し、最終利益に貢献します。以上の理由から、最近人気が高まっているのがBYOCモデルです。

柔軟なデータフロー

SnowflakeのBYOC Openflow展開は、データが存在するお客様の要件に対応するように設計されています。データ主権を維持し、多くのシステムでの継続性を維持しながら、高度なデータエンジニアリング機能を解放します。BYOCにより、Snowflakeは顧客のインフラストラクチャでホストされるOpenflowの展開とランタイムの管理という手間のかかる作業を引き受けます。オブザーバビリティやパイプラインのオーケストレーションといった側面を単一のコンソールで簡素化し、使いやすさと柔軟性を兼ね備えています。

BYOCの展開により、Snowflakeは次の管理をサポートします。

  • インストールの複雑さ:特定のクラウド環境の詳細を把握し、コードとしてのインフラストラクチャアセットを生成してクラウドプラットフォームチームと簡単に共有できるため、展開が大幅に簡略化されます。 

  • 統合オブザーバビリティ:詳細なDAGビューとリネージを備えた統合パイプラインのビジュアルガイダンスを提供します。 

  • セキュリティ:認証、詳細な認可、転送中の暗号化、シークレット管理、AWS PrivateLink、Tri-Secret Secureなどの高度なセキュリティ機能を提供します。 

しかし、Openflow BYOC展開の最大のメリットは、Snowflakeがもたらす柔軟性です。これにより、企業は既存のアーキテクチャとネットワーク設計で最も効果的な方法でパイプラインをセキュアに展開できるようになります。あらゆるソースからあらゆるデスティネーションへのデータ移動に対応し、企業のニーズに応じて新しいインフラストラクチャや既存のインフラストラクチャを自由に使用できます。Openflowは、硬直した所定の経路でデータを流すよう強制したり、複雑でコストのかかる回避策を随時構築したりすることなく、「強力かつ柔軟な」パイプラインを構築できるように構築されています。

セキュリティモデルや必要な許可、ガイド付き導入ウィザードの柔軟なネットワーキングオプションなど、BYOCの展開に必要な条件の詳細については、Openflowドキュメントをご覧ください。

あらゆる場所でのOpenflowの実現

Snowflakeは、企業の所在地に影響を受けることなく、重要なデータシステムの近くでデータフローを実行する必要があると考えています。Openflowは、Snowflake内で(Snowparkコンテナサービス*を通じて)フルマネージド型で実行するか、外部マネージド型Apache Iceberg™テーブルに企業が書き込むのを支援するかを、ユーザーが選択できるようになります。 

柔軟なコンピュートを展開するOpenflowにより、データエンジニアはセルフサービスでランタイム(ウェアハウスに似たコンピュートクラスター)をプロビジョニングできます。これらのランタイムには、フロー作成UIとフロー実行に必要なコンピュートの両方が組み込まれています。つまり、構造化データ、非構造化データ、バッチデータ、ストリーミングデータなど、データタイプに関係なく、Openflowはデータ取り込みアーキテクチャのモダナイゼーションに必要なすべてを組織に提供します。OpenflowはエンタープライズAIの鍵を握っています。Snowflakeをはじめ、あらゆる環境でシームレスなETLを実現し、データ移動を根本から変革します。

BYOC Openflowの展開を開始するには、Openflowドキュメントをご覧ください。 

2025年7月29日開催のData Engineering Connect: Streamline Data Pipeline Workflows with ZeroOpsにもぜひご参加ください。本イベントでは、データエンジニアがSnowflakeを活用してデータパイプラインのワークフローを自動化し、運用のオーバーヘッドから解放されて、本当に重要な業務に集中できるようになる方法をご紹介します。


*現在AWSとAzureのプライベートプレビュー中

記事をシェアする

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • 30日間無料トライアル
  • クレジットカード不要
  • いつでもキャンセル