Produkt & Technologie

Polaris Catalog ist jetzt Open Source

Polaris Catalog ist jetzt Open Source

Im Juni 2024 kündigte Snowflake Polaris Catalog an, um Unternehmen und der Iceberg-Community ein neues Maß an Auswahl, Flexibilität und Kontrolle über ihre Daten zu bieten. Sie ermöglicht offenere, sichere Lakehouse-Architekturen mit breiter Lese- und Schreib-Interoperabilität und motorübergreifender Zugriffskontrolle. Apache IcebergTM hat die Datenmobilität erheblich verbessert, indem es eine riesige Community rund um einen offenen Standard aufgebaut hat. Der nächste logische Schritt ist ein offener, communitybasierter Katalog, der Iceberg ergänzt. Das öffnet die Tür für eine wirklich anbieterneutrale Interoperabilität, die viele Unternehmen wollen.

Polaris Catalog ist ab sofort Open Source unter der Apache 2.0-Lizenz und jetzt auf GitHub verfügbar. Snowflakes neuer Service powered by Polaris Catalog ist jetzt in Public Preview für Snowflake-Kunden verfügbar.

Interoperabilität durch Community

So wie große Gemeinschaften Open-Source-Projekte für offene Datei- und Tabellenformate unterstützen, entsteht auch eine Gemeinschaft, die an Standards für Metadatenkataloge mitarbeitet. Ideenvielfalt und Communitybeiträge schaffen den interoperabelsten Katalog für verschiedenste Tools. 

Polaris Catalog implementiert die REST-Katalog-Spezifikation von Apache Iceberg, was bedeutet, dass die Interoperabilität mit Apache DorisTM, Apache FlinkTM, Apache SparkTM, Daft, DuckDB, Presto, SingleStore, Snowflake, Starburst, Trino, Upsolver und mehr bereits ermöglicht. Darüber hinaus haben auch Alation, ALTR, Atlan, Collibra, dbt Labs, data.world, Dremio, Confluent, Fivetran, Google Cloud, Immuta, Microsoft, Project Nessie und Salesforce vor, Integrationen hinzuzufügen oder Beiträge zum Open-Source-Projekt Polaris Catalog zu leisten.

Einbringen der Fähigkeiten von Project Nessie zu Polaris Catalog

Project Nessie ist ein intelligenter Open-Source-Metastore und -Katalog für Apache Iceberg™ mit Git-ähnlicher Semantik. 2020 wurde es von Dremio-Mitgründern gegründet und zu einem Apache-lizenzierten Projekt. 

Das Team von Dremio freut sich, die verschiedenen Funktionen und Fähigkeiten von Nessie in das Polaris-Projekt einzubringen. Durch das Einbringen der Fähigkeiten von Project Nessie zu Polaris Catalog wird sich eine inklusive Community bilden, die sich der Entwicklung des robustesten Open-Source-Katalogs für Open-Lakehouse-Architekturen verschreibt. Die Innovation in einem Projekt reduziert die Katalogwucherung und ermöglicht es einer breiteren Gruppe von Mitwirkenden, schnelle Fortschritte zu erzielen. Diese Partnerschaft beschleunigt nicht nur den technischen Fortschritt, sondern bringt auch mehr Mitwirkende in die Nessie-Community und stärkt so das wachsende Ökosystem rund um Polaris weiter. Um mehr über das Nessie-Ökosystem zu erfahren, lesen Sie diesen Beitrag.

„Als Mitbegründer von Apache Arrow™, Schöpfer von Project Nessie und bedeutende Mitwirkende an Apache Iceberg™ ist Offenheit in der Kultur von Dremio tief verwurzelt. Wir freuen uns, die Einführung von Polaris Catalog als Open Source unter der Apache-Lizenz zu unterstützen und freuen uns darauf, aktiv zum Erfolg beizutragen. Mit über vier Jahren Erfahrung beim Aufbau von Project Nessie als Open-Source-Apache Iceberg™-Katalog freuen wir uns, seine differenzierten Funktionen, wie z. B. Versionierung auf Katalogebene, Unterstützung mehrerer Engines, Transaktionen mit mehreren Tabellen und Git für Daten, mit Polaris Catalog und der breiteren Community zu teilen.“

Tomer Shiran
Mitgründer und CPO, Dremio

Snowflake Service, unterstützt durch Polaris Catalog, jetzt in Public Preview

Neben Open Source ist Snowflakes Service powered by Polaris Catalog jetzt in Public Preview für Snowflake-Kunden verfügbar. Dieser Service basiert auf der Open-Source-Implementierung von Polaris Catalog und ist eine einfache Möglichkeit für den Einstieg, selbst wenn Sie Snowflake nicht verwenden. Sie können diesen Service mit den vielen oben aufgeführten Engines verwenden, um Iceberg-Tabellen mit engineübergreifender Sicherheit zu lesen und zu schreiben.

Während andere von Anbietern gehostete Kataloge von der Open-Source-Spezifikation abweichen, was zu einer Bindung führt, ist Snowflakes Service für Polaris Catalog darauf ausgelegt, sowohl jetzt als auch in Zukunft vollständig mit der Open-Source-Implementierung von Polaris Catalog kompatibel zu sein. Snowflake kümmert sich um die Ausführung des Dienstes wie die Bereitstellung eines Endpunkts, die Bereitstellung von Fehlerbehebungen und Benutzer erhalten einen vollständig portablen Katalog für ihre Daten, der mit Iceberg REST-Katalog-kompatiblen Tools verwendet werden kann.

Heute noch loslegen

The Essential Guide to Modernizing Data Lakes for AI with Snowflake

Beitrag teilen

Snowpipe Streaming now in Public Preview

Today we are happy to announce the public preview of Snowpipe Streaming as the latest addition to our Snowflake ingestion offerings. Read more.

4 Steps to Shopper 360 Success for Retailers and Consumer Goods Brands

Organizations are striving to achieve ‘Shopper 360,’ a comprehensive and integrated view of their shoppers that is the retail equivalent of Customer 360.

Snowflake and DOD SkillBridge: A New Path for Military Talent

Snowflake is a proud authorized partner of the DOD SkillBridge program, an initiative that allows active-duty service members to complete an internship during their last 180 days of service. The goal is simple: provide a direct path to civilian employment and a seamless transition out of the military.

Reimagine Batch and Streaming Data Pipelines With Dynamic Tables

Explore Snowflake's Dynamic Tables. Simplify your data pipelines for batch and streaming data with enhanced performance, scalability, and easier orchestration.

New Snowflake Deployment: Mexico and South Korea Coming Soon

Snowflake is expanding its Data Cloud infrastructure with a new deployment in the Microsoft Azure Mexico and Microsoft Azure Seoul region within 2024 H1. Read our blog for more information.

Meta Code Llama on Snowflake Testing | Blog

Snowflake has been actively testing Meta’s just announced LLM-based Code Llama, an updated iteration (Llama2) focusing on code generation, including SQL.

JSON Support in Snowflake | Snowflake Blog Post

Read about our JSON support and support for other semi-structured data types. See how you can use SQL to query JSON data in Snowflake!

Decoding AI’s Marketing Impact with Scott Brinker

Explore how AI is reshaping marketing strategy, martech stacks, and creativity in this expert-led conversation with Scott Brinker and Snowflake's Florian Delval

Snowflake and Spark - Query Pushdown %%sep%% %%sitename%% Blog

This post describes query pushdown from Spark to Snowflake, resulting in significant performance improvements that can help transition from ETL to ELT.

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • 30 Tage kostenlos testen
  • Keine Kreditkarte erforderlich
  • Jederzeit kündbar