注:本記事は(2021年11月16日)に公開された(Snowday: Snowpark Offers Expanded Capabilities Including Python, Multi-Cloud Availability, and More)を翻訳して公開したものです。

今年初めのローンチ以来、SnowflakeのSnowpark開発者向けフレームワークは、全てを同じプラットフォームにまとめることで、データサイエンティスト、データエンジニア、アプリケーション開発者の協働を容易にするとともに、データアーキテクチャの合理化を推進してきました。Snowpark(パブリックプレビュー版)により、開発者はSnowflakeのセキュリティ、ガバナンス、パフォーマンス上のメリットを享受しながら、慣れ親しんだコーディング言語と構成を使用して、データを利用したコラボレーションができます。 

今回のSnowdayでは、SnowparkでPythonがネイティブにサポートされることが発表されました。現在はプライベートプレビュー版として提供されています。

Snowflakeのプロダクト部門シニアバイスプレジデントであるChristian Kleinermanは次のように述べています。「Snowparkは、データクラウドでできることの範囲を劇的に拡大しました。Snowpark for JavaやSnowpark for Scalaと同じく、Snowpark for PythonがSnowflakeのエンジンにネイティブに統合され、ユーザーはSnowflakeで作業するときと同様のセキュリティ、ガバナンス、管理性能を享受できます。当社が世界のデータの有効活用に引き続きフォーカスする中、PythonはSnowflakeにおけるデータ分析プログラミングの選択肢をさらに拡げ、データアーキテクチャの合理化を実現します。」

Pythonの長所は、オープンソースパッケージの豊かなエコシステムにあります。近年、オープンソースパッケージはデータサイエンスの大きな推進要素となっています。Snowpark for Pythonのローンチの一環として、当社はSnowflakeデータクラウドにエンタープライズ級のオープンソースイノベーションをもたらすことで、データサイエンティストや開発者が業務でシームレスなエクスペリエンスを確保する後押しをしたいと考えています。このシームレスなエクスペリエンスは、最近のSnowflakeとAnaconda社とのパートナーシップならびにプロダクト統合で現実のものとなっています。これまでも管理されたデータへのほぼ瞬時のアクセスのメリットを受けていたSnowflakeデータクラウドのユーザーは、シームレスな依存関係管理とAnaconda社とのパートナーシップで実現した包括的かつ厳選されたオープンソースパッケージを活用することで、Pythonベースのワークフローを加速できます。さまざまなパッケージ間の依存関係は開発者を「依存関係地獄」に突き落として多大な時間のロスを生じさせますが、統合型のAnacondaパッケージマネージャは、それを適切なツールなしに解決できるなど、大きな価値をもたらします。

さらに、Snowpark for Pythonにより、データチームは強化された信頼性とセキュリティのもとで業務を遂行できます。ユーザーは、データをコピーしたり移動したりする必要なく、好みの言語を使用しながら、同じデータを用いてコラボレーションできます。これにより、データの無秩序なコピーがなくなるだけでなく、すべてのコードをSnowflakeの高度にセキュリティ保護されたサンドボックス内で直接実行できるため、さらに安全です。

これらの機能をいち早く体験したい方はパブリックプレビューにご参加ください。お申し込みはこちら

最も一般的なプログラミング言語をネイティブにSnowparkに追加するだけでは満足できない方々のために、Snowdayでは次のとおり、Snowparkのその他の改良点の詳細についても説明しました。

Snowparkのその他の強化点

可用性をあらゆるクラウドに拡大するため、AzureとGoogle Cloudを追加

6月よりAWSで提供されているSnowpark APIとJava UDFが、Microsoft AzureとGoogleでも提供開始となりました(プライベートプレビュー版)。これらの三大クラウドサービスプロバイダーに対応することで、開発者がどこにいようとSnowflakeの機能にアクセスできる可能性が大きく広がりました。

「Snowflakeでは、私たちがサービスを提供しているクラウドやリージョン全体で等しく優れたサポートを提供することを目指しています。クラウドプロバイダーはそれぞれ特徴が大きく異なりますが、それはカスタマーではなく、私たちが対処すべきことです」とSnowflakeでシニアプロダクトマネージャーを務めるIsaac Kunenは語りました。

テーブル関数の強化

Snowparkでは、テーブル関数を含むJava関数のサポートを拡大し、現在サポート対象の全クラウドプロバイダーにてパブリックプレビュー版として提供されています。これにより、Snowparkでの使用事例がさらに増加しています。各行ごとにオペレーションするスカラー関数のサポートから一歩大きく進み、開発者は行のグループに対して単一の結果を返したり、複数の行全体で状態を維持したりといった包括的な機能を実行できます。この新機能の詳細については、こちらをご覧ください。

非構造化ファイルの処理

現在プライベートプレビュー版として提供されているこの新機能により、開発者はSnowparkを使用することで非構造化データへのアクセスや処理をSnowflake内で直接行うことができるようになりました。たとえば今やユーザーはEXIF(交換可能な画像ファイル形式)のデータを、他の構造化データセットや半構造化データセットと共に読み込むことができます。テーブル関数と組み合わせることにより、請求書などのPDFファイルを解析したり、業界固有のファイル(DICOMファイルなど)からメタデータを抽出したりして、ユースケースに合わせて非構造化データを簡単に変換できます。

Javaストアドプロシージャとタスク機能

SnowparkでのJavaストアドプロシージャのサポートが現在プライベートプレビュー版で提供されています。これによりクライアントサイドコードをプロシージャ内で使用し、Snowflakeの内部で実行できます。これにより開発者は、複雑なアプリケーションコードの定義、実行、スケジューリングを、別途にクライアントを管理する必要なく行うことができます。これをタスク機能と組み合わせることで、Snowparkのジョブをスケジュールしたりコーディネートしたりできます。

ロギングフレームワーク

Snowflakeは、新しいロギングフレームワークをプライベートプレビュー版としてリリースしました。Snowpark内で呼び出すことができるため、開発の生産性を向上させるほか、用途によってはモニタリングやデバッグがより簡単になります。

Snowparkは、データクラウドの可能性を広げ、データエンジニアリングとデータサイエンスの未来を形作ります。これらの最新イノベーションにより、組織はクラウドやリージョン全体でビジネス継続性を維持することが容易になるほか、データエンジニアやデータサイエンティストはより迅速にパイプライン、MLワークフロー、データアプリケーションを構築できるようになり、さらには適切なデータをカスタマーに届けるにあたっての複雑さを解消できます。

Snowparkについての詳細やSnowdayの残りのコンテンツをご覧になりたい方は、こちらにアクセスしてください。

​​将来の見通しに関する記述について

この投稿には、明示・暗示を問わず、(i)Snowflakeのビジネス戦略、(ii)Snowflakeの製品、サービス、技術(開発中のものを含む)(iii)市場の成長、トレンド、競合に関する考察(iv)Snowflakeの製品と第三者プラットフォームとの統合、相互運用性、利用可能性などに関する将来の見通しに関する記述が含まれています。これらの将来の見通しに関する記述は、Snowflakeが証券取引委員会に提出した2021年7月31日を末日とする四半期報告書(フォーム10-Q)内の表題「Risk Factors(リスク要素)」以下の記述やその他の記述を含め、若干のリスク、不確かさ、および推測を伴います。これらのリスク、不確かさ、および推測を踏まえると、実際の結果はこれらの将来の見通しに関する記述で予想または暗示された事柄と大きくかつ不利な形で異なる場合があります。よって、これから起こることの予測として、将来の見通しに関する記述に依存することはおやめください。© 2021 Snowflake Inc.  All rights reserved.  Snowflake, the Snowflake 本書で使用されているその他すべてのSnowflakeの製品、機能、サービスの名称は、米国その他の国におけるSnowflake Inc.の登録商標または商標です。本書で言及または使用されているその他のブランド名やロゴはすべて識別のみを目的としており、それぞれの保有者の商標である可能性があります。Snowflakeとかかる保有者との間には、提携、スポンサー、または推奨関係があるとは限りません。