Snowflake「Polaris Catalog」を発表
6月 03, 2024
※本報道資料は米国スノーフレイク社が6月3日に発表した内容の抄訳です。
Snowflake「Polaris Catalog」を発表
AWS、Google Cloud、Microsoft Azure、Salesforceなど相互運用性へのコミットメントを強化
Apache Icebergのフルオープンカタログにより、企業はデータのコントロールと柔軟性を得ることが可能に
AIデータクラウド企業であるSnowflake(ニューヨーク証券取引所:SNOW)は本日、年次ユーザーカンファレンス「Snowflake Summit 2024」において、データレイクハウス、データレイク、その他の最新アーキテクチャの実装に選択されるオープンスタンダードであるApache Iceberg向けの、ベンダーニュートラルでオープンなカタログ実装であるPolaris Catalog (ポラリス カタログ) を発表しました。Polaris Catalogは、今後90日以内にオープンソース化され、企業やIcebergコミュニティ全体に、Amazon Web Services(AWS)、Confluent、Dremio、Google Cloud、Microsoft Azure、Salesforceなどとの完全なエンタープライズ・セキュリティとApache Icebergの相互運用性を備えた、新たなレベルの選択肢、柔軟性、データ制御を提供する予定です。
Snowflakeのプロダクト担当上級副社長のChristian Kleinerman(クリスチャン・クライナーマン)は次のように述べています。
「組織は、オープンなストレージと、ロックインのない相互運用可能なクエリエンジンを必要としています。現在、業界リーダーたちのサポートにより、あらゆる組織が多様なシステム間でデータに簡単にアクセスできる柔軟性と制御性を高めています。Polaris Catalogは、SnowflakeのApache Icebergをオープンスタンダードとして選択するというコミットメントを拡張し、お客様やより広範なIcebergコミュニティがオープンで中立的なアプローチを通じてデータを活用できるようにすることで、業界リーダーの意図を確固たるものにし、そのデータに対するクロスエンジンの相互運用性とセキュリティを可能にします」
Polaris CatalogがApache Icebergに新しいレベルの相互運用性を導入
Apache Icebergは、2020年5月にインキュベーションからトップレベルのApacheソフトウェア財団のプロジェクトに浮上して以来人気が急上昇し、オープンソースを代表するデータテーブルフォーマットとなりました。Polaris Catalogを使用することで、ユーザーはフルオープンな相互運用性を備えた組織のIcebergテーブルを検索してアクセスする、あらゆるエンジンのための単一で一元化された場所を得ることができます。Polaris Catalogは、IcebergのオープンソースRESTプロトコルに依存しており、Apache Flink、Apache Spark、Dremio、Python、Trinoなど、Iceberg Rest APIをサポートしている任意のエンジンから、ユーザーがデータにアクセスして取得できるオープンスタンダードを提供しています。
組織は、SnowflakeのAIデータクラウドでホストされたPolaris Catalogの運用を数分で開始することができます(Snowflakeがホストするパブリックプレビューは近日開始予定)。または、DockerやKubernetesなどのコンテナを使用して、独自のインフラでセルフホストすることも可能です。Polaris Catalogのバックエンド実装はオープンソースであるため、組織はベンダーロックインを排除しつつ、ホスティングインフラストラクチャを自由に入れ替えることができます。
Polaris Catalogコミュニティに主要企業が参入
Apache Icebergをこれほど強力なものにしているのは、多様な採用者、貢献者、商用サービスからなる活気あるコミュニティです。 Polaris Catalogがより広範なコミュニティや環境の進化するニーズに確実に応えられるよう、SnowflakeはIcebergのエコシステムと協力してプロジェクトを推進しています。
SnowflakeとMicrosoftが締結した直近のパートナーシップ拡大に伴い、SnowflakeとFabric間でよりシームレスな相互運用性を実現します。この相互運用性は、SnowflakeとMicrosoftが、業界をリードするストレージフォーマットのオープンスタンダードであるApache IcebergとApache Parquetをサポートするというコミットメントによって可能になりました。現在、Polaris Catalogの開発において、両社はデータの保存場所に関係なく、すべてのユーザーが企業データを活用し、AIを活用したアプリケーションを大規模に作成できるようにするという共同ミッションの下、提携を続けています。
MicrosoftのAzureデータ担当 コーポレート バイス プレジデントのArun Ulag氏は次のように述べています。
「Microsoftは創業当初から、地球上のすべてのユーザーがより多くのことを実現できるようにすることに注力してきました。これは強力なデータ分析基盤から始まります。Delta Parquet、Apache Iceberg、Apache XTable などのオープン データ標準へのサポートと貢献を通じて、組織が新しいレベルのオープン データの相互運用性を実現し、データをより多く活用できるようにすることで、この使命を推進しています。また、Icebergコミュニティと共にオープンソースカタログの作成に取り組む熱意に期待しています。これにより、共同の顧客や広範なオープンソースコミュニティに、さらなる柔軟性と管理能力を提供することができます」
Snowflakeの持つ専門知識は、何千ものグローバルなお客様のクロスクラウドデータとAIワークロードを支えるデータ基盤として機能し、急速に成長するIcebergコミュニティのイノベーションとオープンソーススキルセットにより、両社はエンジン間のデータの相互運用性を簡素化し続けます。
Snowflake、オープンソースへのコミットメントを継続的に拡大
Polaris Catalogは、Iceberg Tablesへの投資など、Snowflakeが最近行ったオープンソースへのコミットメントに続くもので、Snowflakeのお客様は、Snowflakeの使いやすさ、パフォーマンス、統一されたガバナンスの恩恵を受けながら、独自のストレージ内のデータをApache Icebergフォーマットで扱うことができます。
Snowflakeは最近、市場で最もオープンなエンタープライズグレードの大規模言語モデル(LLM)の1つであるSnowflake Arcticも発表しました。Snowflakeのオープンソースへのコミットメントの一環として、Arcticの重みを、Apache 2.0ライセンスで公開しただけでなく、一連のクックブックを通じてArcticのトレーニング方法も幅広く公開しました。 さらに、SnowflakeはStreamlitオープンソースコミュニティをサポートしており、現在、月間アクティブ開発者数は27万5000人以上、月間アプリケーション閲覧数は600万を超えています。2022年3月にSnowflakeがStreamlitを買収して以来、SnowflakeとStreamlitが開発者のために最先端のオープンソースの進歩に投資し続けた結果、オープンソースコミュニティは過去2年間で500%以上の成長を遂げています。
データプラットフォームの専門家によるニュースに対するコメント
Amazon Web Servicesのテクノロジーパートナーシップ担当 マネージングディレクターであるChris Grusz氏は述べています。
「AWSは、Snowflakeなどのパートナーと協力して、顧客の選択を加速できるオープンソースソリューションの開発に取り組んでいます。Snowflakeと協力することで、Apache Icebergをエンジン間で相互運用可能な状態に維持できることを嬉しく思います」
Confluentの最高製品責任者のShaun Clowes氏は次のように述べています。
「Confluent では、データのサイロ化を解消し、よりリアルタイムなインサイトで企業のビジネスを強化することを使命としています。Confluent Cloud 上のTableflowを利用することで、組織はビジネス全体からのデータストリームをワンクリックで Apache Iceberg テーブルにワンクリックで変換できるようになります。SnowflakeのPolaris CatalogとTableflowを併用することで、データチームはこれらのテーブルに簡単にアクセスして、重要なアプリケーション開発やダウンストリーム分析を行うことができます」
Dremioの創業者のTomer Shiran氏は次のように述べています。
「お客様は、オープンなエコシステムを繁栄させ、ストレージ、データ、メタデータを所有することを望んでいます。彼らは閉じ込められることを望んでいません。私たちは、Apache Iceberg やオープンカタログの Project Nessie や Polaris Catalog などのオープンスタンダードのサポートに尽力しています。これらのオープンテクノロジーは、エコシステムの相互運用性と顧客にふさわしい選択肢を提供します」
Goldman Sachsの最高データ責任者(CDO)兼データエンジニアリング責任者のNeema Raphael氏は次のように述べています。
「当社はオープンソースコミュニティ、特にデータスペース全体に積極的に参加しています。データプラットフォームであるLegendをオープンソース化し、Icebergのようなオープンソースのテーブルフォーマットと連携できるようにしたことで、Snowflakeのようなクエリエンジンとの相互運用性が向上しました。PolarisのようなオープンソースのIceberg Catalogの立ち上げは、相互運用性へのコミットメントをさらに高めるためのエキサイティングな次のステップです」
Salesforceのソフトウェアエンジニアリング担当 エグゼクティブバイスプレジデントである Raveendrnathan Loganathan 氏は次のように述べています。
「Apache Icebergの人気は、エコシステム全体で組織のゼロコピー・データ・アクセスを簡素化するオープン・ストレージ標準を確立しました。当社のSalesforce Data Cloudは、ファイル用のOpen Standards Apache Parquetと、テーブル用のApache Icebergを使用してゼロから構築されています。これにより閉鎖的だったデータを解放し、洞察を導き出し、Customer 360全体でアクションを調節するためのゼロコピーイノベーションを促進しています。Snowflakeを当社のZero Copy Partner Networkのメンバーとして迎えることができ、この新しいオープンカタログ標準が、企業におけるゼロコピー・アクセスをどのように促進するか楽しみにしております」
詳細情報
- Polaris Catalogの詳細についてはこのウェビナーに登録してご覧ください。
- Polaris Catalogの一意な差別化について、このブログ記事で紹介しています。
- SnowflakeのAIデータクラウド上でホストされているPolaris Catalogを数分で使い始める方法はこちらからご覧ください。
- LinkedInとX(旧Twitter)で、Snowflakeの最新ニュースやお知らせを発信しています。
このプレスリリースには、明示または黙示を問わず、(i)Snowflakeの事業戦略、(ii)開発中または一般に提供されていないSnowflakeの製品、サービス、テクノロジー、(iii)市場の拡大、トレンド、競争状況に関する考察、(iv)Snowflake製品とサードパーティプラットフォームの統合およびサードパーティプラットフォーム上でのSnowflake製品の相互運用性と可用性についての言及など、将来の見通しに関する記述が含まれています。これらの将来の見通しに関する記述は、さまざまなリスク、不確実性、前提に左右されます。これには、Snowflakeが証券取引委員会に提出するForm 10-Q(四半期レポート)やForm 10-K(年次レポート)内の「リスク要因」などのセグメントに記載されているリスク、不確実性、前提が含まれます。これらのリスク、不確実性、前提を考慮すると、将来の見通しに関する記述において予想または暗示されている結果と比較して、実際には大きく異なる結果や反対の結果に至る可能性があります。 これらの記述は、初回記述日の時点に限った記述であり、かかる記述の時点で入手可能な情報に、および/または経営陣がかかる時点で抱いていた誠実な信念に、基づいています。法律で義務付けられている場合を除き、Snowflakeには、本プレスリリース内の記述を更新する義務または意図は、一切ありません。そのため、将来の見通しに関するいかなる記述も、未来の出来事についての予測として利用してはなりません。
© 2024 Snowflake Inc All rights reserved. Snowflake、Snowflakeのロゴ、および本書に記載されているその他すべてのSnowflakeの製品、機能、サービス名は、米国およびその他の国におけるSnowflake Inc.の登録商標または商標です。 本書で言及または使用されているその他すべてのブランド名またはロゴは、識別目的でのみ使用されており、各所有者の商標である可能性があります。 Snowflakeが、必ずしもかかる商標所有者と関係を持ち、または出資や支援を受けているわけではありません。
Snowflakeについて
Snowflakeは、シンプルかつ効率的で信頼性の高いエンタープライズAIを実現します。Snowflakeのデータクラウドは、世界最大規模の数百の企業を含む世界中の数多くのお客様に利用されており、データ共有、AI/機械学習アプリケーションの構築、ビジネスの強化に貢献しています。これからは、エンタープライズAIの時代です。詳しくは、snowflake.com/ja/(ニューヨーク証券取引所:SNOW)をご覧ください。
<本件に関するお問い合わせ>
Snowflake合同会社
PR担当 山中
[email protected]