注:本記事は(2022年5月26日)に公開された(Delivering on Innovation: Snowflake’s Transformative Enhancements Since BUILD Summit)を翻訳して公開したものです。

Snowflakeでは常に、データクラウドやデベロッパーフレームワークであるSnowparkの改善に取り組むことで、デベロッパーやデータアプリケーションの強化に注力しています。

年次で開催されるデベロッパー会議であるSnowflake BUILDの期間中、また以降の7か月の間、SnowflakeはSnowparkやデータクラウドにおける多数のイノベーションを発表してきました。6月13~16日にラスベガスのCAESARS FORUMカンファレンスセンターにて開催されるSnowflake Summit 2022に先駆けて、これらの発表の中から注目すべき改革点を振り返ります。

Python向けSnowpark急成長を遂げているプログラミング言語のひとつであるPythonを、Snowparkの一部としてSnowflake内でネイティブに使用することができます。Python向けSnowparkにより、好きな言語を使用してデータを容易に連携できるようになると同時に、Snowflakeプラットフォームが持つセキュリティ、ガバナンス、伸縮性能を活用して、拡張性が高く最適化されたパイプライン、アプリケーション、機械学習ワークフローの構築も可能です。Python向けSnowparkは現在プライベートプレビュー中です。

Snowparkのその他の更新

BUILD以降、AWSやAzureやGCPのパブリックプレビューにおけるSnowpark Scala API およびJava UDFのGAなど、Snowparkに一連の改善を加えてきました。これらの改善により、クラウドベンダー分野のお客様全体がSnowparkによるメリットを享受していただけるようになりました。表形式のJava UDFもGAで利用可能となっており、テーブル上で実施され、表形式で結果を返します。テーブル関数に対応しているため、ユーザーは、文字列分解、ファイル解析、適合度統計のためのアルゴリズムといった、Snowflakeで提供できるユースケースを大幅に拡張しすることができます。Snowpark Java APIはSnowparkにおける新たなクライアント言語サポートで、現在パブリックプレビュー中です。

パイプラインの構築や実行の容易化に向け、Snowpark API向けのストアドプロシージャはクライアント側で書かれたコード(現在JavaとScalaに対応)をプロシージャ内で機能させ、Snowflake内部で実行することが可能です。デベロッパーは、ストリームとタスクといったSnowflakeの機能を利用して、個々のクライアント管理を行うことなく、複雑なワークフローの構築、実行、スケジューリングをすべてSnowflake内で行うことができます。そのため、複雑さが緩和され、関係するシステム数も低減するため、Snowflake内の安全性や統治性が維持されます。

オブジェクトタギングオブジェクトのタグ付けは、ビジネスコンテキストを適用することで、データの理解や管理の容易化を図るものです。機密情報やPII、またコストセンターに属するものなど、データオブジェクトを特定しタグ付けします。顧客はカスタマイズしたタグのライブラリを作成し、お客様の、それらのタグを列、テーブル/ビュー、データベース、ハウスといったオブジェクトに関連付けることができます。

アクセス履歴アクセス履歴は、データの移動や変更において、さらなる可視化を促進し、データポイントの追跡やエラーのトラックバックをサポートします。お客様はデータの作成元を特定し、データに加えられた変更、データの変遷、さらに今後の使用について判断することができます。

インタラクティブユースケースのパフォーマンスSnowflakeは伸縮パフォーマンスエンジンを改善し、データアプリケーションや組み込み型アナリティクス向けにスピードやスループットが求められるインタラクティブなユースケースをサポートしています。一般公開中の今回の更新には、同時実行性、スループット、実行の高速化が含まれています。

SnowflakeスクリプトSnowflakeスクリプトは、手続き型ロジックへのサポートを追加するSnowflake SQLの拡張機能です。Snowflakeスクリプトを使用してストアドプロシージャを書いたり、ストアドプロシージャの外部に手続き型コードを書いたりすることができます。

非構造化データに対応Snowflakeにおける非構造化データサポート機能には、Snowflake内における非構造化データの保存、アクセス、処理、管理、統治、共有が含まれます。構造化、半構造化、非構造化にかかわらず、クラウド全体にまたがるデータの管理、分析を単一のシームレスなエクスペリエンスとして実行できます。

SQL APISnowflake SQL APIはREST APIのひとつで、Snowflakeデータベース内にあるデータにSQLを介してアクセス、更新したり、カスタムアプリケーションを開発したりできます。SQL APIにより標準的なクエリやほとんどのDDLやDMLステートメントを実行できます。

6月のSnowflake Summit 2022において、次のイノベーションの波を発表できることを大変嬉しく思います。今回の新たなイノベーションをいち早く知りたいという方は、Snowflake CEOであるFrank Slootman、共同創業者兼プロダクト担当プレジデントであるBenoit Dageville、プロダクト担当シニアバイスプレジデントであるChristian Kleinermanが参加するオープニング基調講演にぜひご参加ください。