Question 1

Snowflake Openflowとは何ですか?

Accepted Answer

Snowflake Openflowは、Apache Nifiを基盤とする統合マネージドサービスです。ほぼあらゆるデータソースを任意の宛先に接続できるように設計されており、構造化データと非構造化データをサポートし、お客様のクラウド環境で実行できるため、完全に制御できます。

Question 2

Snowflake OpenflowとApache Nifiはどのように関係していますか?

Accepted Answer

Snowflake OpenflowはApache Nifi上に構築されており、堅牢なデータフロー機能を活用しています。つまり、使い慣れたNiFiプロセッサーやコントローラーのサービスに加え、高度なガバナンスと制御、可観測性、お客様のクラウド内またはSnowflakeマネージドのSnowparkコンテナサービス経由で統合を実行および展開するためのオプションなど、Snowflake固有のコンポーネントも使用でき、どちらのサービスもSnowflakeによって管理されます。

Question 3

Openflowは、どのような種類のデータソースとデータタイプを処理できますか?

Accepted Answer

Openflowは、構造化、半構造化、非構造化(テキスト、画像、音声、動画、センサーデータ)など、幅広い配列データを処理できるように設計されています。さまざまなSaaSプラットフォーム(Google Ads、Meta Ads、SharePoint、Boxなど)、データベース(MySQL、PostgreSQL)、ストリーミングサービス(Kafka、Kinesis)などのコネクタを提供しています。

Question 4

OpenflowはAIと非構造化データユースケースをどのようにサポートしていますか?

Accepted Answer

Openflowは、GoogleドライブやSharePointなどのソースからマルチモーダルデータや非構造化データをほぼリアルタイムで取り込みできるようにします。このコネクタは、ETLパイプラインで直接、非構造化データの抽出、前処理(Snowflake Cortex LLM関数を使用)、ロード、アクティベーションを行う組み込み機能を提供します。これにより、データはAIの処理やアプリケーション(Snowflake Cortex AIを使用した「お客様のデータとのチャット」体験の構築などにすぐに利用できるようになります。

Question 5

Snowflake Openflowの展開モデルは何ですか?

Accepted Answer

Snowflake Openflowは、マネージドサービスです。お客様は、Bring Your Own Cloud(BYOC)またはSnowflakeのSnowparkコンテナサービス(SPCS)のいずれかを使用して実行できます。BYOCでは、お客様のクラウド環境内で顧客が実行する統合(当初はAWSの商用リージョンで利用可能、お客様のVPCに展開)。これにより、お客様のデータとネットワークをより詳細に制御できるようになり、Snowflakeはランタイムの展開と管理のためのUI、オブザーバビリティ、APIなど、Openflowサービス自体を管理します。SPCS(現在プライベートプレビュー中)では、すべての展開とランタイムがSnowflakeによって管理されます。

Question 6

Snowflake Openflowの現在の可用性はどうなっていますか?

Accepted Answer

2025年6月3日時点で、Snowflake Openflow BYOCはすべてのAWS商用リージョンで一般提供されており、SPCSはプライベートプレビュー中です。

Snowflake上でのApache Sparkの活用

実稼働スケールでのワークロード実行の高速化

総保有コストの削減

運用オーバーヘッドを削減

Apache Spark™コードでSnowflakeの機能を最大限に活用

Snowpark ConnectでSparkパイプラインを加速

外部Sparkクラスターの接続

使い慣れた環境での作業

お客様のデータが存在する場所を問わずSparkを実行

Apache Spark™用Snowpark Connectパートナー

関連リソース

ドキュメント

SnowflakeでのApache Spark™のオープンな構築

Apache Spark™用Snowpark Connectの包括的なガイド

よくある質問

Where DataDoes More

接続性

データ変換

レイクハウス