製品 & テクノロジー

Polaris Catalogがオープンソースに

Polaris Catalogがオープンソースに

2024年6月、Snowflakeは、組織とIcebergコミュニティに新たなレベルのデータ選択肢、柔軟性、コントロールを提供するPolaris Catalogを発表しました。幅広い読み取りと書き込みの相互運用性とクロスエンジンアクセス制御により、よりオープンで安全なレイクハウスアーキテクチャを実現します。Apache Iceberg™は、オープン標準を中心として広大なコミュニティを構築することで、データモビリティを大幅に向上させました。次のステップは、Icebergを補完するオープンなコミュニティ主導のカタログです。これにより、多くの組織が求めている真にベンダーニュートラルな相互運用性を実現できます。

現在、Polaris CatalogはApache 2.0ライセンスのオープンソースであり、GitHubで公開されています。Snowflakeの新しいサービス、Powered by Polaris Catalogがパブリックプレビューで利用可能になりました。

コミュニティを通じた相互運用性

オープンファイルフォーマットやテーブルフォーマットのオープンソースプロジェクトをサポートする大規模なコミュニティが成長したように、メタデータカタログの標準に関するコラボレーションを行うコミュニティも生まれています。アイデアの多様性とコミュニティへの貢献により、多種多様なツールのカタログが最も相互運用性に優れています。 

Polaris CatalogはApache IcebergのRESTカタログ仕様を実装しており、Apache Doris™、Apache Flink™、Apache Spark™、Daft、DuckDB、Presto、Snowflake、Starburst、Trino、Upsolverなどとの相互運用性をすでに実現しています。また、Alation、ALTR、Atlan、Collibra、dbt Labs、data.world、Dlemio、Confluent、Fivetran、Google Cloud、Immuta、Microsoft、Project Nessie、Salesforceも、Polaris Catalogオープンソースプロジェクトに統合の追加や貢献を予定しています。

Project NessieのPolaris Catalogへの貢献

Project Nessieは、Gitのようなセマンティクスを備えたApache Iceberg™用のオープンソースインテリジェントメタストアおよびカタログです。Dremioの共同設立者が作成し、2020年にApacheライセンスのプロジェクトとなりました。 

Dremioのチームは、Nessieのさまざまな機能や性能をPolaris プロジェクトに導入することを楽しみにしています。Project NessieのPolaris Catalogへの貢献は、オープンレイクハウスアーキテクチャのための最も堅牢なオープンソースカタログを開発するための包括的なコミュニティを形成するでしょう。1つのプロジェクトでイノベーションを起こすことで、カタログの無秩序な増加を抑制し、より幅広いコントリビューターグループが急速な進歩を推進できるようになります。このパートナーシップにより、技術的な進歩が促進されるだけでなく、Nessieコミュニティにより多くのコントリビューターが参加し、Polarisを取り巻く拡大するエコシステムがさらに強化されます。Nessieエコシステムの詳細については、こちらを参照してください。

「Apache Arrow™の共同設立者であり、Project Nessieのクリエイターであり、Apache Iceberg™に大きく貢献しているDremioの文化にはオープン性が浸透しています。Apacheライセンスに基づくオープンソースとしてのPolaris Catalogの立ち上げに賛同し、その成功に積極的に貢献できることを楽しみにしています。オープンソースのApache Iceberg™カタログとしてProject Nessieを4年以上構築してきた経験があり、カタログレベルのバージョン管理、マルチエンジンサポート、マルチテーブルトランザクション、データ用Gitなどの差別化された機能を、Polaris Catalogやより幅広いコミュニティと共有できることを嬉しく思います。」

—Tomer Shiran氏、Dlemio、共同創業者、CPO

パブリックプレビュー中のSnowflakeサービス(Powered by Polaris Catalog)

オープンソースに加えて、Snowflakeのお客様向けに、SnowflakeのPolaris Catalogを利用したサービスのパブリックプレビューが開始されました。このサービスは、Polaris Catalogのオープンソース実装を利用しており、Snowflakeを使用していなくても簡単に開始できます。このサービスは、上記の多数のエンジンとともに使用して、クロスエンジンセキュリティでIcebergテーブルへの読み取りと書き込みの両方を行うことができます。

他のベンダーがホストするカタログはオープンソースの仕様から外れるため、ロックインにつながりますが、SnowflakeのPolaris Catalog向けサービスは、現在および将来のPolaris Catalogのオープンソース実装と完全に互換性があるように設計されています。エンドポイントの提供、バグ修正の展開などのサービス実行はSnowflakeが行い、ユーザーはデータの完全ポータブルカタログを入手し、Iceberg RESTカタログ互換ツールで使用できます。

今すぐ始めましょう

記事をシェアする

Snowflake AIデータクラウド向けに構築された、エンタープライズに最適なPostgresの提供

SnowflakeがCrunchy Dataを買収し、Snowflake Postgresを発表しました。Snowflake Postgresは、オープンソースの柔軟性と安全な拡張性を兼ね備えたエンタープライズ対応PostgreSQLソリューションです。

Power BI向けSnowflakeコネクターが、カスタムSQL対応になりました。

カスタムSQLへの対応により、Power BIやSnowflakeのユーザーは、時間短縮、柔軟性およびさまざまな新機能が利用できるようになり、生産性が高まります。

Snowflake Openflow Revolutionizes Data Movement for AI and Interoperability

Snowflake Openflowは、マネージドで拡張可能なプラットフォームにより、ソースやフォーマットをまたいだデータ統合を簡素化します。現在は、AWS上でBYOCにより一般提供されています。

How Apache Iceberg Is Changing the Face of Data Lakes

Apache Iceberg™がどのようにオープンで高性能なデータレイクハウスを実現し、ウェアハウスの信頼性とレイクの柔軟性、ベンダーニュートラルなアーキテクチャを実現しているかをご紹介します。

AI-readyなレイクハウスの構築

Snowflakeは、オープンテーブルフォーマットのための新しいデータエンジニアリング機能を発表します。これにより、IcebergとDelta Lakeでコネクテッドな高性能レイクハウスを構築できます。

コスト管理インターフェイスでSnowflakeのコストをより適切に管理

新たにリリースされたこれらの機能により、Snowflakeの費用を適切に把握、管理し、組織に最大限のビジネス価値を提供できます。

Govern an Open Lakehouse with Snowflake Open Catalog

Apache Polaris(インキュベーション)向けのマネージドサービスであるSnowflakeオープンカタログは、データレイクとレイクハウスの安全な相互運用性を実現し、データガバナンスを簡素化します。

Snowflake、検索ユースケース向けに実用的なテキスト埋め込みモデルを発売

オープンソースコミュニティがApache 2.0ライセンスで利用可能。

Introducing Polaris Catalog: An Open Source Catalog for Apache Iceberg

Learn how we’re enabling new levels of choice and flexibility for open data.

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • 30日間の無料トライアル
  • クレジットカード不要
  • いつでもキャンセル