注:本記事は(2021年6月8日)に公開された(Bringing the World’s Data Together: Announcements from Snowflake Summit)を翻訳して公開したものです。

今年開催されたSnowflake Data Cloud Summit: Data Together Nowでは、世界のカスタマーやパートナーがバーチャルに集合し、データが持つ革新的な力と、データクラウドで世界のデータを一元化するというSnowflakeのビジョンについて掘り下げました。70ものセッションが行われた2日間の中で出席者は、基調講演で刺激を受け、カスタマーやパートナーによるセッションで同業他社から学び、実践ラボや技術研修に参加しました。

Summitの場で、Snowflakeは5つの主要分野、すなわちデータプログラマビリティグローバルデータガバナンスプラットフォーム最適化コネクテッドインダストリーズ、およびPowered by Snowflakeにおけるイノベーションについて発表しました。これらのイノベーションは、データクラウドにさらに多くのデータを集約させ、それらのデータからより高い価値とビジネスインサイトを引き出すための力を組織にもたらすことになるでしょう。

Snowflakeプロダクト部門担当シニアバイスプレジデントであるChristian Kleinermanは次のように述べました。「当社が特に力を入れているのは、皆様の組織のデータ活用能力を高め、データからさらなる価値と、よりタイムリーなインサイトを得て、より優れた製品やサービスを構築できるようにすることです。私たちは、性能や対費用効果という点で向上し続けるだけでなく、データのガバナンスの確保や、プログラマビリティの簡略化も同時に実現していきます。」

データプログラマビリティの向上により、開発がさらに簡単かつ柔軟に

Snowflakeは、プログラミング言語やプログラミングモデル全体でユーザーにより高い柔軟性と拡張性を提供する、データプログラマビリティの進化について発表しました。「当社のカスタマーにとって、データプログラマビリティはパイプラインの実行、データの変換、およびデータからの値抽出の中核となるものです。」と、Kleinermanは語りました。Summitで特に強調されたデータプログラマビリティのイノベーションは次のとおりです。

SnowparkとJava UDFSnowflakeの開発者向けツール「Snowpark」を使用すると、データエンジニア、データサイエンティスト、および開発者は使い慣れた言語やプログラミング概念を用いながら、Snowflake内で直接ワークロードを実行できます。Snowparkは現在、ScalaとJava用のプライベートプレビュー版が提供されていますが、近日中にパブリックプレビュー版も公開されます。将来的にはPythonやその他の言語にも対応する予定です。加えて、ユーザーはJava UDFを使用することで自前のカスタムコードやビジネスロジックをSnowflakeに持ち込み、管理の複雑さを低減しつつパフォーマンスの向上や使用事例の拡張を図ることができます。Java UDFは現在プライベートプレビュー版で提供されていますが、近々パブリックプレビュー版が提供されます。

Snowpark Accelerated ProgramSnowflakeはまた、パートナーに技術エキスパートへのアクセスとSnowflakeカスタマーへのさらなるアピールの場を提供するSnowpark Accelerated Programをローンチしました。これによりSnowflakeパートナーネットワーク(SPN)の一員であるパートナーは、SnowparkやJava UDFを使用してソリューションの統合や構築を行い、データサイエンス、データ統合、セキュリティ、およびビジネスインテリジェンスに関してカスタマーが抱える複雑な課題を解決する手助けができるようになりました。Snowpark Accelerated Programには現在、約50社のパートナーが参加しています。

非構造化データへの対応Snowflakeは、非構造化データによる価値実現を加速し、構造化データや半構造化データと同様にファイルを保存、管理、処理、共有することを可能にします。非構造化データ管理機能は現在プライベートプレビュー版で提供されていますが、近日中にパブリック版でも提供が開始される予定です。

SQL APISnowflake SQL APIは、外部API管理またはアプリケーションサービス層を設定、管理することなく、アプリケーションがSnowflakeをプログラムで直接的に呼び出すことができるREST APIです。この新APIは、SELECT、INSERT、CREATE、COPY、MERGEといった標準SQL関数をサポートしており、カスタマーは管理タスクの自動化やSnowflakeとカスタムアプリケーションとの統合のほか、インフラストラクチャーのプロビジョニングや管理を行うことなくSnowflakeによって有効化されるカスタマー向けデータアプリケーションを構築することもできます。Snowflake SQL APIは現在、パブリックプレビュー版で提供されています。

Amazon SageMakerによる機械学習プライベートプレビュー版に間もなく統合されるSageMaker Autopilotにより、カスタマーは使い慣れたSQLを利用して、最高の機械学習(ML)モデルをSnowflake内からネイティブに自動構築、自動デプロイできます。さらに、Amazon SageMaker Data WranglerがデータソースとしてSnowflakeをサポートするようになったことにより(一般提供開始済み)、カスタマーはML用データの準備と特徴量エンジニアリングを加速し、未加工データからMLドリブン型のインサイトをより迅速に入手できるようになりました。

サーバーレスタスク:タスクの強化版であり、かつSnowflake内のオペレーションをスケジュールするためのネイティブオブジェクトであるサーバーレスタスクは、Snowflakeがオペレーションの実行にどれくらいのコンピュートリソースが必要かを見極めてスケジュールするサーバーレス実行モデルを可能にします。「私たちはカスタマーに、インフラストラクチャーではなくデータに集中していただきたいと考えています。」と、Kleinermanは語りました。サーバーレスタスクは現在、プライベートプレビュー版で利用可能です。

スキーマ検出Snowflakeのカスタマーから要望が最も多い、データ値に基づくスキーマの検出と抽出機能が、パブリックプレビュー版で利用可能になりました。スキーマ検出で現在サポートされているファイル形式はParquet、AVRO、ORCですが、将来的にはもっと多くのファイル形式とスキーマの進化に対応していく予定です。

グローバルなデータガバナンスとプライバシー保護を簡略化する新機能

Kleinermanはさらに次のように述べました。「データのセキュリティと保護は、Snowflakeの設立当初から最重要事項であり続けています。シームレスな共有とコラボレーションによってデータでつながる世界を目指すという当社のビジョンも例外ではありません。データガバナンスとプライバシー保護は不可欠です。」この日に発表されたグローバルデータガバナンス機能は次のとおりです。

分類機能:Snowflakeの新しい分類機能は、対象テーブル内にある個人を特定できる情報(PII)を自動的に検出し、Snowflakeのタグフレームワークを使用してアノテーションします。その後、ユーザーは適切なセキュリティコントロールを適用してデータを保護できます。この機能はSnowflakeの全体的なガバナンスフレームワークにシームレスに統合されており、ロールベースのポリシーを使用したデータアクセス管理を可能にします。分類機能は現在、プライベートプレビュー版で利用可能です。

匿名化ビュー:匿名化ビューは、カスタマーデータの分析的価値を維持しながら、カスタマーのプライバシーと識別情報を保護します。匿名化ビューは共有とクエリが可能ですが、ベーステーブルに変更を施すことなく、クエリ時にロールベースのコントロールを動的に適用します。匿名化ビューはプライベートプレビュー版で間もなく利用可能となります。

オブジェクトタギング:Snowflakeのオブジェクトタギング機能は、機密性の高いデータの追跡を可能にし、アクセスポリシーの大規模な監視、制御をより簡単に実行できるようにします。タグをコンピュートオブジェクトに適用して、リソースの利用率を追跡したり、原価配分の可視性を高めたりすることもできます。オブジェクトタギング機能は現在、プライベートプレビュー版で利用可能です。

アクセス履歴:アクセス履歴はSnowflakeの新しいビューです。これを利用するとカスタマーはコンプライアンス監査に適合する粒度のカラムレベルのレポートを作成できます。加えて、このビューでは未使用のテーブルまたはカラムを特定できるので、カスタマーはストレージ費用を最適化したり、逆に頻繁にアクセスされているアセットを特定してパフォーマンスを最適化したりできます。アクセス履歴はパブリックプレビュー版で利用可能です。

行アクセスポリシー:行アクセスポリシーは、クエリ結果内のデータ行を、ユーザー名、ロール、またはカスタム属性(地域や組織など)といったコンテキスト情報に基づいて動的に制限するための、ポリシーベースのソリューションを提供します。このポリシーベースのアプローチによってデータアクセスを簡単に管理できるようになり、データサイロや複数の安全なビューを維持する必要がなくなります。行データポリシー機能はパブリックプレビュー版で利用可能です。

Alationの統合:この新たな統合により、データスチュワードはSnowflakeのポリシーをAlationのポリシーセンターやデータカタログから直接作成、発見、施行できるようになります。この機能は近い将来のAlationリリースで利用可能になる予定です。

プラットフォームの最適化でより高いパフォーマンスとコスト効率性を実現

データクラウドの柔軟性と機能性を拡大することに加えて、Snowflakeはより高いコスト効率性、パフォーマンスの向上、およびカスタマー向けの使用事例の充実化に継続的に取り組んできました。この日に発表されたプラットフォーム最適化機能は次のとおりです。

ストレージの経済性向上:Snowflakeはデータ圧縮を改善することによりストレージ費用を削減しました。ある大企業顧客はすでに新規データに対するストレージ費用を30%削減しています。

「当社のカスタマーは、透明性が高く、ユーザーによるアクションや設定の変更が不要で、アプリケーションやクエリの変更がいらず、ストレージ費用削減に直接つながる、優れたストレージ技術を活用しています。」(Kleinerman談)

この機能はすでに、すべてのSnowflakeカスタマーに向けて運用開始されており、新しく書き込まれたデータに自動的に適用されます。

対話型エクスペリエンスのためのサポートを改善:Snowflakeは、対話型ダッシュボードや組込型アナリティクスのパフォーマンスや同時並行性を高めるアップデートをリリースしています。これらのエンハンスメントは現在プライベートプレビュー版で提供されていますが、単一のコンピュートクラスタにおいてクエリスループットが最大6倍に向上し、それらのワークロードの平均クエリ時間が最大8分の1に短縮されるという結果を出しています。

利用状況ダッシュボード:Snowflakeは、カスタマーがプラットフォーム全体での利用状況とコストをより良く監視し、把握できる新しい利用状況ダッシュボードを開発しました。利用状況ダッシュボードは現在、パブリックプレビュー版で提供されています。

コネクテッドインダストリーズによってコラボレーションとデータの調達を容易にする

データを見つけ、それが特定のニーズや要件を満たしていることを確認し、データセットを調達するという作業は複雑なプロセスになりがちです。これをデータコンシューマーとデータプロバイダーの両者にとってシンプルなものにするべく、当社では現在、2つの新機能を開発中です。今年の後半にSnowflake Data Marketplaceにおいてプライベートプレビュー版で提供を開始する予定です。

発見と取引:現在、データのコンシューマーは、従量課金制を採用したSnowflake Data Marketplaceで新しいデータを発見し、データプロバイダーから直接購入できるようになっています。このセルフサービス型のマーケット機能により、データプロバイダーは新しい市場にリーチし、データの販売と配信にかかるコストを削減できます。

購入前の試用:新たに導入された試用サービスにより、カスタマーはサンプルデータにアクセスし、自分のニーズに最適なデータセットかどうかを評価してから購入できるようになりました。Snowflake内で即時にデータを購入し、フルデータセットにシームレスにアップグレードできるので、データコンシューマーは必要な時に必要なデータにアクセスできる一方で、支払は使用するデータに対してのみでOKとなります。

Powered by Snowflakeでアプリケーションを構築し、育てる

Powered by Snowflakeは、Snowflake上でアプリケーションを構築し、運用し、育てるソフトウェア企業やアプリケーション開発者を支援するために設計された、新しいSnowflakeパートナーネットワーク(SPN)プログラムです。このプログラムでは、技術的なアドバイス、アプリ開発を専門とするサポートエンジニアへのアクセス、および共同の営業・マーケティング機会を提供します。詳しくは、https://snowflake.com/partners/PoweredbySnowflakeをご覧ください。

Snowflake Data Cloud SummitにおけるBenoit DagevilleとChristian Kleinermanの基調講演をご覧になりたい方は、こちらにアクセスしてください

Snowflake Data Cloud Summitの各セッションについては、こちらからオンデマンドで視聴いただけます。データクラウドの新機能についてさらに詳しく知りたい方は、6月6日より開催されるSnowflake Deep Diveシリーズへの参加を今すぐお申し込みください。

将来の見通しに関する記述

この投稿には、明示・暗示を問わず、Snowflakeの(i)ビジネス戦略、(ii)製品、サービス、技術(開発中のものを含む)(iii)市場の成長、トレンド、競合に関する考察(iv)当社の製品とサードパーティ製プラットフォームとの統合、相互運用性、利用可能性などに関する将来の見通しに関する記述が含まれています。これらの将来の見通しに関する記述は、Snowflakeが証券取引委員会に提出した2021年4月30日を末日とする四半期報告書(フォーム10-Q)内の表題「Risk Factors(リスク要素)」以下の記述やその他の記述を含め、若干のリスク、不確かさ、および推測を伴います。これらのリスク、不確かさ、および推測を踏まえると、実際の結果はこれらの将来の見通しに関する記述で予想または暗示された事柄と大きくかつ不利な形で異なる場合があります。よって、これから起こることの予測として、将来の見通しに関する記述に依存することはお控えください。

© 2021 Snowflake Inc.  All rights reserved.  Snowflake、Snowflakeのロゴ、およびその他ここに記載されるすべてのSnowflake製品、機能、サービス名は、米国およびその他の国々におけるSnowflake Inc.の登録商標または商標です。本稿で言及または使用されているその他のブランド名やロゴはすべて識別のみを目的としており、それぞれの保有者の商標である可能性があります。Snowflakeとかかる保有者との間には、提携、スポンサー、または推奨関係があるとは限りません。