注:本記事は(2021年6月15日)に公開された(Live from Las Vegas…New Snowflake Capabilities!)を翻訳して公開したものです。

今年、オフラインで開催されるSnowflake Summit 2022に、何千人というお客様、ユーザー、パートナーの皆様をお迎えできることを大変嬉しく思います。4日間の期間中に催される250以上のセッションを通じ、皆さんが一堂に会し、ベストプラクティスを共有し、コラボレーションを実現できるのは素晴らしいことです。長年にわたり、Snowflakeのデータクラウドにおけるイノベーションは、データアナリティクスやコラボレーションに大きな変革をもたらしてきました。そして今回、データクラウドプラットフォームに追加された拡張機能が、アプリケーションの開発や配布を変革しようとしています。

私たちは、より多くのユースケースをより効率よく実行できるよう、当社プラットフォームのパフォーマンス向上に常に尽力しています。使用やコストの可視化を向上し、ネイティブガバナンス機能を拡張し、さらにオープンフォーマットやオンプレミスでの保存データを使用したデータクラウドの今後の展開も発表しました。私たちは、デベロッパー、データサイエンティスト、データエンジニア向けにPythonサポートを拡大することで、引き続きデータクラウドのプログラマビリティ向上を推進していきます。

アプリケーション開発の今後を支えるために、Snowflakeマーケットプレイスの対象はデータ以外にも拡張されています。アプリケーションの構築、展開を迅速かつ容易に実行する新たな方法により、今では、ユーザーによるアプリケーションの発見やプロバイダーによる収益化といったすべてがSnowflake内で実施可能になっています。さらに新たにCybersecurity(サイバーセキュリティ)Unistore(ユニストア)の2つのワークロードが加わることになりました。

データクラウドの限界を超える

新たに発表されたSnowflakeのIcebergテーブル(現在開発中)を活用することで、ユーザーはSnowflakeプラットフォームの持つ容易性、性能、一貫したガバナンスといったメリットを享受したまま、利用者の多いオープンテーブルフォーマットであるApache Icebergを外部ストレージで利用できるようになります。これによりデータ管理全体を簡素化し、柔軟なアーキテクチャを実現できます。

また、オンプレミスストレージ向けの外部テーブルを使用したデータアクセスもさらに拡張します(近日プライベートプレビュー予定)。これによりユーザーは、Dell TechnologiesPure Storageといったオンプレミスストレージシステムにある自社データにアクセスできるようになり、データを移動することなくデータクラウドの伸縮性を活用できるようになります。これは、マルチクラウド環境における運用の柔軟性向上やデータ主権要件の遵守につながります。

パフォーマンスの改善

Snowflakeでは、根幹を成す伸縮性のある高性能エンジンに、透明性の高い一連の最適化を行い、各クレジットに対しより多くのコンピューティングパワーを実現しています。これには、より迅速かつ複雑な検索、膨大なクエリ用の同一リソースフットプリントにおける拡張性、レプリケーションスケジュールの短期化、さらにより多くのインタラクティブなユースケースが含まれています。

さらに、AWSが提供するハードウェアの新機能を活用できるよう、Snowflakeの最適化も行われました。これから12か月かけて、SnowflakeはAWS上でのコンピューティングで使用されるハードウェアをアップデートする予定です。ユーザーアクションや設定が不要なAWS上でのコンピューティングで、平均10%の性能の向上が報告され始めています。

コストガバナンスの可視化

Snowflakeは、支出効率の改善に向け、コストの可視化の向上、支出の制限や管理、目標の最適化を実現する一連の機能を追加します。ユーザーがリソースグループを作成し予算を設定できるため(いずれも現在プライベートプレビュー中)、予算配分に対する支出をより簡単に管理できるようになります。

また、事前構築された使用状況の可視化や、検索最適化サービスやクエリアクセラレーションサービスといったサーバーレス機能の影響の評価、予測ツールを活用し、さらに多くの使用量メトリクスを追加する予定です。

ガバナンス機能の拡張

既に利用可能なSnowflakeのネイティブのガバナンス機能を基にした、タギング、マスキング、リネージの可視化や管理を向上する新たな機能を発表しました。

これには、タグベースのマスキング(近日パブリックプレビュー予定)が含まれているため、チームは機密性の高い列へのマスキングポリシーの割り当てをより簡単に自動化することができます。また、列レベルのデータリネージ(近日プライベートプレビュー予定)も追加されたため、既にアクセス履歴内で一般提供されているオブジェクトレベルのリネージが拡張されています。

最後に紹介する新たなガバナンスインターフェイス(近日プライベートプレビュー予定)は、タグやマスキングポリシーに対する組み込みレポートを活用し、データスチュワードにデータの保護を確実にする新たな方法をもたらします。

レプリケーションがパイプラインにも対応

Snowflakeは、クラウドやリージョンにまたがり、中断時にフェイルオーバーやフェイルバックの機能を使用し、より容易にデータ損失を管理、制限し、オペレーションを維持できるようになっています。ビジネスインテリジェンスダッシュボード、パイプライン、ガバナンスポリシーなどに対するフェイルオーバー機能を活用し、継続的可用性がデータ以外にも適用されています。

レプリケーション機能は、データベースからアカウントメタデータ(現在パブリックプレビュー中)やインジェストパイプライン(プライベートプレビュー中)まで拡張されています。クライアントリダイレクトと組み合わせることで、最小限の中断での運用することができます。

ストリーミング式データパイプライン

Snowflakeは、ストリーミングデータのサーバーレスインジェスト用Snowpipeストリーミング(現在プライベートプレビュー中)およびストリーミングデータの宣言的変換用マテリアライズドテーブル(現在開発中)の発表により、ストリーミングインジェストやトランスフォーメーションの簡素化を進めます。データエンジニアやデベロッパーは、単一システム内でリアルタイムのバッチデータを取り扱うために、異なるシステムやツールを結合する必要がなくなります。ストリーミングデータをアナリティクス、データサイエンスや機械学習ワークフロー、さらにアプリケーションと結びつけることがはるかに容易になります。

データクラウドでのPython対応

Snowparkを使用することで、データサイエンティストやデータデベロッパーは、Pythonを含め、自身が選択したプログラミング言語でコーディングし、パイプライン、機械学習(ML)ワークフロー、データアプリケーションをより迅速かつ安全に単一プラットフォームで実行できます。パブリックプレビュー中のPython向けSnowparkでは、Anaconda統合の一部として、自動でパッケージ管理される破損したPython環境を心配することなく、ユーザーは人気のオープンソースパッケージに簡単にアクセスすることができます。

デベロッパーはいつでもお好きな統合開発環境(IDE)や開発ツールからSnowparkを使用できます。Python向けSnowflake Worksheets(現在プライベートプレビュー中)を使用すれば、デベロッパーはSnowparkのデータフレームトランスフォーメーションやカスタマイズされたユーザー定義関数といったすべてをSnowflake内で構築、展開できるようになります。

Streamlitの統合

データクラウドにあるStreamlitを使用してデータを活用しましょう。SnowflakeとStreamlitの統合(現在開発中)によりデータサイエンティストやMLエンジニアによる開発を効率化し、インタラクティブなアプリケーションの構築、実行、共有すべてがSnowflake内で容易に実施できるようになります。

Streamlitの使用を先送りにする必要はありません。すぐにStreamlitをインストールしてSnowflakeのPythonコネクタを使用してSnowflakeに接続し、構築を始めましょう。

SQLユーザー向け機械学習

Snowflakeによって、何千人という既存SQLユーザーがMLによる予測を日常のビジネスインテリジェンスやアナリティクスへ容易に取り入れることができ、SQL機械学習(現在プライベートプレビュー中)機能の一部として、意思決定の質や速度の向上に役立てています。予測の数が数十であれ数百万であれ、プログラミングやインフラストラクチャオーバーヘッドの必要なくMLによるインサイトを取得できます。本機能により、アナリストや他のSQLユーザーは、MLモデルをSnowflake内でネイティブに使用することが可能になります。まずは時系列予測に始まり、さらにモデルを追加して拡張する予定です。

ネイティブアプリケーションフレームワーク

データクラウドでのアプリケーションの構築と使用に新たな方法が加わりました。Snowflakeのネイティブアプリケーションフレームワーク(現在プライベートプレビュー中)を使用することで、アプリケーションプロバイダーはSnowflakeの機能を使用してアプリケーションを構築し、その後、Snowflakeデータマーケットプレイスで配布、収益化を図ることができます。お客様は自身のSnowflakeアカウントを使用して、これらのアプリケーションのインストールや実行といったすべてをSnowflake内で実施できます。これにより、データの活用がこれまで以上に迅速かつ安全にできるため、プロバイダーにとってもお客様にとっても大きな変革となります。

ネイティブアプリケーションフレームワークの詳細は、こちらのSnowflake ネイティブアプリケーションフレームワークの紹介をご覧ください。

新しいワークロード:Cybersecurity

SnowflakeのCybersecurityワークロードは、レガシーセキュリティ情報およびイベント管理ソリューション(SIEM)などにおける多くの弱点に対処するソリューションの提供を開始しました。データクラウドはデータサイロ、データの統合や保持の制限、高額なコストやスケーラビリティといった問題を解消します。これらを始めとする障壁により、セキュリティチームはセキュリティデータの価値を最大限生かすことができませんでした。Snowflakeを使用することで、セキュリティチームによるデータの一元化、高精度の脅威の検出、インシデントへの迅速な対応が可能になります。

Cybersecurityワークロードの詳細は、Snowflakeのデータクラウド向け最新ワークロード:Cybersecurityをご覧ください。

新しいワークロード:Unistore

これまで、トランザクションデータや分析データはサイロ化され、システム間のデータ移動が複雑となり、最新の開発で必要とされる迅速性の障害となっていました。Snowflakeの新しいワークロードであるUnistoreは、トランザクションデータや分析データを単一プラットフォームで同時に取り扱うことのできる最新のアプローチを提供しています。本ワークロードにより、トランザクションビジネスアプリケーションをSnowflake上で直接構築し、トランザクションデータの分析クエリをリアルタイムで実行し、ガバナンスやセキュリティに対する一貫したアプローチを確保できます。

本発表の一部として、Snowflakeは、Unistoreを強化する新たなテーブルタイプであるハイブリッドテーブル(現在プライベートプレビュー中)を導入し、迅速な単一行オペレーションを提供しています。

Snowflakeの新しいワークロード、Unistoreの詳細は、トランザクション&分析データ向けSnowflakeの新ワークロード、Unistoreの紹介をご覧ください。

コラボレーション&Snowflakeマーケットプレイスの推進

Snowflakeは、データクラウドにおけるプライバシー保護コラボレーションの新たな機会の創出により、インサイトの配信と収益化をさらに推進してまいります。今回の発表には以下が含まれます。

  • マーケットプレイスの収益化:企業によるデータの売買を大幅に容易化することを目的とした本製品により、企業は、Snowflake環境内の潜在的なデータパートナーを発見し、購買を決定する前にそのデータを試験的に使用できるようになります。バイヤーとセラーは、使用量ベースの価格設定を使用しデータの価値を調整できます。
  • SaaSコネクタ:クライアントは、セキュリティを損なうことなく、Snowflakeデータクラウドで作業をしながらServiceNowデータを使用できます(現在プライベートプレビュー中)。これによりコラボレーションが促進されると同時に大規模組織におけるデータ移行ニーズを低減します。
  • グローバルデータクリーンルーム:これまでは、データシェアリングのリスクが高すぎて、多くの重要なデータコラボレーションユースケースが実行できませんでした。Snowflakeを使用することで、グローバルなデータクリーンルーム(現在プライベートプレビュー中)の作成が可能となり、たとえデータが異なるクラウドやリージョンに存在していても、お客様におけるデータガバナンスコントロールが向上し、パートナーと連携できるようになります。グローバルデータクリーンルームは消費者の購買行動や健康データといった機密データや規制対象データのコラボレーションに理想的です。

今回の発表やSummitで行われたその他の製品発表については、オンデマンドの基調講演をご覧ください。

基調講演を視聴して、データクラウドの最新情報を確認しましょう。

将来予測に関する記述

本記事には、明示または黙示を問わず、(i)Snowflakeの事業戦略、(ii)開発中や一般公開されていないものも含めたSnowflakeが提供する製品、サービス、テクノロジー、(iii)市場の成長、トレンド、競争に関する考慮事項、(iv)サードパーティプラットフォームと連携したまた同プラットフォーム上でのSnowflake製品の統合、相互運用性、および可用性、についての言及など、将来の見通しに関する記述が含まれています。これらの将来の見通しに関する記述は、さまざまなリスク、不確実性、前提に左右されます。これには、Snowflakeが証券取引委員会に提出するForm 10-Q(四半期レポート)およびForm 10-K(年次報告書)内の「リスク要因」などのセグメントに記載されているリスク、不確実性、前提が含まれます。これらのリスク、不確実性、前提を考慮すると、将来の見通しに関する記述において予想または暗示されている結果と比較して、実際には大きく異なる結果や反対の結果に至る可能性があります。そのため、将来の見通しに関するいかなる記述も、未来の出来事についての予測として利用するべきではありません。

© 2022 Snowflake Inc.  All rights reserved.  Snowflake、Snowflakeのロゴ、およびその他ここに記載されるすべてのSnowflake製品、機能、サービス名は、米国およびその他の国々におけるSnowflake Inc.の登録商標または商標です。本書で言及または使用されているその他のブランド名やロゴはすべて識別のみを目的としており、それぞれの保有者の商標である可能性があります。Snowflakeとかかる保有者との間には、提携、スポンサー、または推奨関係があるとは限りません。