Question 1

Was ist Snowflake Openflow?

Accepted Answer

Snowflake Openflow ist ein verwalteter Integrationsdienst, der auf Apache NiFi basiert. Es wurde entwickelt, um praktisch jede Datenquelle mit jedem Ziel zu verbinden, unterstützt strukturierte und unstrukturierte Daten und bietet Ihnen vollständige Kontrolle, da Openflow in Ihrer eigenen Cloud-Umgebung ausgeführt wird.

Question 2

Wie steht Snowflake Openflow mit Apache NiFi in Beziehung?

Accepted Answer

Snowflake Openflow basiert auf Apache NiFi und nutzt seine robusten Datenflussfunktionen. Das bedeutet, dass Sie vertraute NiFi-Prozessoren und Controller-Services sowie Snowflake-spezifische Komponenten verwenden können, einschließlich erweiterter Governance und Kontrolle, Beobachtbarkeit und der Möglichkeit, die Integration in Ihrer Cloud oder über Snowflake Managed Snowpark Container Services auszuführen und bereitzustellen, wobei beide Services von Snowflake verwaltet werden.

Question 3

Welche Art von Datenquellen und -typen kann Openflow verarbeiten?

Accepted Answer

Openflow wurde entwickelt, um eine breite Palette von Daten zu verarbeiten, einschließlich strukturierter, semistrukturierter und unstrukturierter (Text, Bilder, Audio, Video, Sensor Daten). Es bietet Konnektoren für verschiedene SaaS-Plattformen (z. B. Google Ads, Meta Ads, SharePoint, Box), Datenbanken (MySQL, PostgreSQL), Streaming-Dienste (Kafka, Kinesis) und mehr.

Question 4

Wie unterstützt Openflow Anwendungsfälle für KI und unstrukturierte Daten?

Accepted Answer

Openflow ermöglicht die Erfassung multimodaler und unstrukturierter Daten aus Quellen wie Google Drive oder SharePoint nahezu in Echtzeit. Die Konnektoren bieten integrierte Funktionen zum Extrahieren, Vorverarbeiten (mit Snowflake Cortex LLM-Funktionen), Laden und Aktivieren unstrukturierter Daten direkt in der ETL-Pipeline. Dadurch sind die Daten sofort für KI-Verarbeitungen und -Applikationen verfügbar, z. B. für den Aufbau von "Chat with Your Daten"-Erfahrungen mit Snowflake Cortex AI.

Question 5

Wie sieht das Bereitstellungsmodell für Snowflake Openflow aus?

Accepted Answer

Snowflake Openflow ist ein verwalteter Dienst, der Kunden Optionen zur Ausführung entweder über Bring Your Own Cloud (BYOC) oder über Snowflakes Snowpark Container Services (SPCS) bietet. Mit BYOC erhalten Sie eine vom Kunden betriebene Integration in Ihrer eigenen Cloud-Umgebung (zunächst in kommerziellen AWS-Regionen verfügbar, in Ihrer VPC bereitgestellt). So haben Sie mehr Kontrolle über Ihre Daten und Ihr Netzwerk, während Snowflake den Openflow-Service selbst verwaltet, einschließlich der Benutzeroberfläche, der Beobachtbarkeit und der APIs für die Bereitstellung und Verwaltung von Laufzeitumgebungen. Mit SPCS (derzeit in Private Preview) werden alle Bereitstellungen und Laufzeitumgebungen von Snowflake verwaltet.

Question 6

Wie ist Snowflake Openflow derzeit verfügbar?

Accepted Answer

Seit dem 3. Juni 2025 ist Snowflake Openflow BYOC in allen kommerziellen AWS-Regionen allgemein verfügbar und SPCS befindet sich in Private Preview.

Apache Sparkauf Snowflake

Schnellere Workloads im Produktiveinsatz

Senkung der Gesamtbetriebskosten (TCO)

Minimierung des Betriebsaufwands

Die volle Leistung von Snowflake, Jetzt für Ihren Apache Spark™-Code

Beschleunigung von Spark-Pipelines mit Snowpark Connect

Integration externer Spark-Cluster

Nahtloses Arbeiten in vertrauten Umgebungen

Spark-Ausführung direkt dort, wo Ihre Daten gespeichert sind

PARTNER: SNOWPARK CONNECTfor Apache Spark™

Ressourcen

Dokumentation

Building Apache Spark™ in the Open at Snowflake

Comprehensive Guide to Snowpark Connect for Apache Spark™

Häufig gestellte Fragen

Where DataDoes More

Konnektivität

Transformation

Lakehouse