スノーフレイク、Pythonのネイティブサポートとデータアクセスを拡充し、 データクラウド上でのプログラマビリティを強化

※本報道資料は米国スノーフレイク社が6月14日に発表した内容の抄訳です。

  • スノーフレイクがSnowpark for Pythonの提供を開始したことで(現在はパブリックプレビュー版をすべての顧客が利用可能)、オープンソースのパッケージとライブラリからなるPythonの豊かなエコシステムをデータサイエンティスト、データエンジニア、アプリケーション開発者が活用することが可能に
  • スノーフレイクは、新たにストリーミングデータとの連携を強化してデータアクセスを拡大すると共に、オープンフォーマットのデータやオンプレミスで保存されているデータを利用できるようデータクラウドを拡充
  • 84.51°、Allegis Group、Sophos、Method Analyticsなどの顧客がSnowflakeを利用してデータサイエンス能力とアプリケーション開発能力を高め、イノベーションを推進

データクラウドを提供するスノーフレイク(ニューヨーク証券取引所:SNOW)は本日、年次のユーザーカンファレンスであるSnowflake Summit 2022において、データサイエンティスト、データエンジニア、アプリケーション開発者向けの一連のプログラマビリティ強化機能リリースを発表しました。これらの新機能は特にPythonのサポート強化をテーマとしており、現在プライベートプレビュー中であるSnowpark for Pythonの提供を開始すると共に、現在開発を進めているStreamlitとのネイティブ統合によって高速なアプリケーションの開発サイクルを実現します。また、新たにストリーミングデータとの連動を強化すると同時に、オープンフォーマットのデータやオンプレミスで保存されているデータをデータクラウドで利用できるようにすることで、より多くのデータに効率的にアクセスできるようにします。今回の機能強化により、データのプロフェッショナルや開発者は、Snowflakeプラットフォームのスピード、シンプルさ、一貫性のあるガバナンス、セキュリティを活用しながら、簡単かつ迅速にデータを構築し、コラボレーションを行えるようになります。

機械学習やアプリケーション開発向けにPythonのサポートを強化
SnowflakeのデベロッパーフレームワークであるSnowparkの導入により、データサイエンティスト、データエンジニア、アプリケーション開発者が、好みの言語やライブラリを使用してスケーラブルなパイプライン、アプリケーション、機械学習(ML)ワークフローをSnowflake上で直接構築できる多様なプログラミング環境が広がりました。今後の方向性として、Snowpark for Pythonを用いて開発できるものをさらに増やし、オープンソースのパッケージとライブラリからなるPythonの豊富なエコシステムにユーザーがデータクラウド上でシームレスにアクセスできるようにする取り組みを進めます。

Snowpark for Pythonは、安全性に優れたPythonサンドボックスを利用し、他の言語で記述されたSnowflakeのパイプラインやアプリケーションと同じSnowflakeのコンピューティングインフラストラクチャで実行されます。そのため、Snowpark for Pythonには、開発者がSnowflakeを用いて開発を行う際に期待するのと同じスケーラビリティ、伸縮性、セキュリティ、コンプライアンスを確保できるというメリットがあります。開発者は、Snowparkを使用してSnowflake上でPythonベースのデータ処理を強化することにより、データ処理アーキテクチャを合理化、現代化する機会を得ることができます。

さらに、Snowpark for Pythonを補う以下の新機能が追加されます。

  • Python用のSnowflakeワークシート(現在プライベートプレビュー中)を利用することで、SnowflakeのユーザーインターフェースであるSnowsight上で直接、PythonやSnowparkのPython用DataFrame APIを使用してパイプライン、MLモデル、アプリケーションの開発を行い、コードの自動補完機能や数秒でカスタムロジックを生成する機能によって開発作業を効率化することができます。
  • SnowflakeとStreamlitの統合(現在開発中)によって、Pythonベースのアプリケーション開発機能がSnowflakeに直接組み込まれます。これによりユーザーはインタラクティブなアプリケーションを開発し、安全にデータシェアリング、高速で反復的な開発サイクル、ビジネスチームとのコラボレーションを行って開発の影響力を高めることができます。
  • 大容量メモリのウェアハウス,(現在開発中)により、ユーザーはAnacondaとの統合によって利用可能となった人気のあるPythonのオープンソースライブラリを使用し、特徴量エンジニアリングや大量のデータセットを用いたモデルトレーニングなどのメモリ負荷の高い作業を安全に行えるようになります。
  • 時系列予測(現在プライベートプレビュー中)をはじめとしたSQL機械学習により、SQLユーザーはMLを駆使した予測を日々のビジネスインテリジェンスや分析に取り入れ、意思決定の質とスピードを高めることができます。

Pythonは、堅牢な構文や豊富なオープンソース パッケージ エコシステムによって開発者から人気を得ています。SnowflakeとAnacondaの継続的なパートナーシップにより、Snowflake上でより多くのPythonパッケージにシームレスにアクセスできるようになると同時に、すべてのコードを非常に安全なサンドボックス環境で実行できます。また、SnowflakeがPythonのサポートを強化していることが、Snowpark Acceleratedプログラムの発展に大きく寄与しており、開発にPythonを使用している多くのパートナーが好みの言語でデータクラウドの力を活用するようになりました。

グローバルな人材ソリューション企業であるAllegis Group社は、Snowparkを利用し、Snowflake上のAllegis Enterprise Data Platformに保存されているデータを使用するMLソリューションや人工知能(AI)ソリューションをサポートしています。

 Allegis GroupのAI & MDM ArchitectであるJoe Nolte氏は、次のように述べています。

「Snowparkは拡張性を重視しており、Snowpark for Pythonを利用することで好みのプログラミング言語で効果的にデータを処理するために必要なツールを得られます。Snowparkは、データサイエンスやアプリケーション開発のフレームワークとして人気が高まっています。チームでシームレスかつ簡単にデータを用いたコラボレーションを行うことができ、全員が同じプラットフォームを利用することによって価値を生み出すまでの時間が短縮されます。」

Snowflakeを利用してより多くのデータにアクセスし、迅速に有益なインサイトを獲得
開発者の生産性の向上、精度の高いMLモデルの構築、より強力なアプリケーションの提供を実現するには、すばやく効率的に適切なデータにアクセスできることが極めて重要です。Snowflakeの機能強化によって、ユーザーはより多くのデータを即座に利用して迅速に実験を行えるようになり、高度なプログラミング機能と深いインサイトを得ることができます。

新たなイノベーションには、以下のものがあります。

  • サーバーレスでのストリーミングデータの取り込みを実現するSnowpipe Streaming(現在プライベートプレビュー中)と、宣言的なストリーミングデータの変換を簡略化する Materialized Table(現在開発中)により、ストリーミングデータをサポートし、ストリーミングパイプラインとバッチパイプラインの境界を排除します。
  • SnowflakeがIcebergテーブルに対応(現在開発中)することにより、Snowflakeプラットフォームの使いやすさ、性能、一貫性のあるガバナンスを生かしながら、人気のオープンテーブルフォーマットであるApache Icebergを外部ストレージで利用できるようになり、データマネジメント全体を簡略化すると同時にアーキテクチャの柔軟性を確保することができます。
  • オンプレミスストレージ向け外部テーブル(現在プライベートプレビュー中)により、SnowflakeがサポートするDell Technologies社やPure Storage社などのオンプレミスストレージシステムに保存されているデータにアクセスできるようになり、データを移動させることなくデータクラウドの伸縮性を活用できます。

Snowflakeのプロダクト担当上級副社長であるChristian Kleinermanは、次のように述べています。

「データサイエンティスト、データエンジニア、アプリケーション開発者が、ガバナンスを損なうことなくより簡単にデータクラウドで開発を行えるよう、我々はPythonに重点的に投資しています。当社の新たなイノベーションにより、顧客はSnowflake上で直接、より多くのデータにアクセスし、それを利用して新たな方法で開発を行えるようになり、データを重視した顧客のエコシステムの価値が高まります。これらの機能に、Snowflakeのトップクラスのデータセキュリティとプライバシーが組み合わさることで、これまでとは異なる方法でデータを用いた実験、高速で反復的な開発サイクル、コラボレーションを行い、価値を生み出せるようになります。」

これらのプログラマビリティ強化機能の他にも、Snowflakeは、新たなUnistoreワークロードネイティブアプリケーションフレームワークサイバーセキュリティワークロードなどについてSnowflake Summit 2022で発表しました。

関連情報 

将来の見通しに関する記述について
このプレスリリースには、明示または黙示を問わず、(i)Snowflakeの事業戦略、(ii)開発中または一般に提供されていないSnowflakeの製品、サービス、テクノロジー、(iii)市場の拡大、トレンド、競争状況に関する考察、(iv)Snowflake製品とサードパーティプラットフォームの統合およびサードパーティプラットフォーム上でのSnowflake製品の相互運用性と可用性についての言及など、将来の見通しに関する記述が含まれています。これらの将来の見通しに関する記述は、さまざまなリスク、不確実性、前提に左右されます。これには、Snowflakeが証券取引委員会に提出するForm 10-Q(四半期レポート)やForm 10-K(年次レポート)内の「リスク要因」などのセグメントに記載されているリスク、不確実性、前提が含まれます。これらのリスク、不確実性、前提を考慮すると、将来の見通しに関する記述において予想または暗示されている結果と比較して、実際には大きく異なる結果や反対の結果に至る可能性があります。  そのため、将来の見通しに関するいかなる記述も、未来の出来事についての予測として利用してはなりません。  

© 2022 Snowflake Inc.  All rights reserved.  Snowflake、Snowflakeのロゴ、および本書に記載されているその他すべてのSnowflakeの製品、機能、サービス名は、米国およびその他の国におけるSnowflake Inc.の登録商標または商標です。  本書で言及または使用されているその他すべてのブランド名またはロゴは、識別目的でのみ使用されており、各所有者の商標である可能性があります。  Snowflakeが、必ずしもかかる商標所有者と関係を持ち、または出資や支援を受けているわけではありません。

スノーフレイクについて
スノーフレイクは、Snowflakeのデータクラウドを用い、あらゆる組織が自らのデータを活用できるようにします。顧客企業はデータクラウドを利用してサイロ化されたデータを統合し、データを検索して安全に共有しながら、さまざまな分析ワークロードを実行しています。データやユーザーがどこに存在するかに関係なく、Snowflakeは複数のクラウドと地域にまたがり単一のデータ体験を提供します。多くの業界から何千ものお客様(2022年4月30日時点で、2021年のForbes Global 2000社(G2K)のうち506社を含む)が、Snowflakeデータクラウドを全社で幅広いビジネスに活用しています。詳しくは、snowflake.comをご覧ください。

<本件に関するお問い合わせ>
Snowflake株式会社
PR担当 山中
[email protected]

Source: Snowflake Inc.