Heutzutage ist der Data Clean Room in aller Munde. Dabei herrscht Verwirrung darüber, was genau ein Data Clean Room ist und wie er sich von Data-Sharing-Methoden unterscheidet. In diesem Blogbeitrag möchte ich etwas Licht in dieses Dunkel bringen. 

Was bedeutet Data Sharing?

Zu den herkömmlichen Methoden für das Data Sharing gehören das Kopieren von Dateien in FTP/Cloud-Buckets, die Verwendung von ETL-Pipelines oder die Pflege und der Aufruf von APIs. Der Nachteil dieser traditionellen Methoden besteht darin, dass sie eine effektive Zusammenarbeit verhindern. Das wiederum führt zu Erkenntnislücken, ungenauen Daten und Sicherheitsproblemen. Sobald die Daten von einem Ort zu einem anderen verschoben werden, sind sie nur so sicher wie der Ort, an dem sie sich gerade befinden. Eine effektive Governance ist nahezu unmöglich, und die Pflege von individuellen Pipelines kann sehr kostspielig sein, neben den zahlreichen anderen Problemen, die mit dieser Vorgehensweise verbunden sind.

Secure Data Sharing hingegen ist eine Funktion der Plattform von Snowflake. Damit können Organisationen einen sicheren Zugriff auf ihre Daten gewähren. Das ist ein großer Fortschritt gegenüber den Zeiten, als man große Dateien über FTP kopierte oder anfällige ETL-Pipelines entwickelte und pflegte. Anstatt beispielsweise Dateien von einem System auf ein anderes zu kopieren, legen Snowflake-Benutzer:innen lediglich fest, auf welche Tabellen innerhalb einer Datenbank ein anderer Kunde von Snowflake zugreifen kann. 

Wann ist der Einsatz von Secure Data Sharing sinnvoll?

Secure Data Sharing bietet sich an, wenn Sie generellen Zugriff auf ein Dataset bereitstellen möchten. Ein Beispiel: Um die Geschäftsentscheidungen und -ergebnisse zu verbessern, geben Sie Daten zwischen verschiedenen Geschäftsbereichen oder für vertrauenswürdige Agenturen oder Partner zur Analyse frei. Diese Funktion, die Kunden einen sicheren und widerrufbaren Zugriff auf die Daten bietet, wird auch von Unternehmen oder Datenanbietern genutzt, die Daten monetarisieren oder verkaufen. 

Snowflake Secure Data Sharing

Die Plattform von Snowflake sorgt für eine nahtlose Data Collaboration und unterstützt Sie dabei, die Kosten zu senken und neue geschäftliche Erkenntnisse zu gewinnen. Unternehmen können dank Snowflake Secure Data Sharing Daten sicher über ihr gesamtes Ökosystem hinweg freigeben, mit folgenden Vorteilen:

  • Schneller Zugriff auf Live-Daten aus der gesamten Organisation 
  • Kontrollierter Zugriff auf freigegebene Daten
  • Einfache Veröffentlichung von Datasets, um neue Erkenntnisse zu gewinnen, während gleichzeitig Zugriffskontrollen festgelegt werden

Die Snowflake Cloud Data Platform

Mit Snowflake können Organisationen sowohl Datennutzer als auch -anbieter sein – oder beides. Auch für Anwendungen ist die Snowflake Data Cloud ein leistungsstarkes Tool. Sie ermöglicht Kunden das Entdecken, Entwickeln und Vertreiben von Apps, welche direkt in ihrem Snowflake-Konto ausgeführt werden.

Unternehmen, die die Möglichkeiten der Plattform von Snowflake nutzen, um eine den Datenschutz wahrende Zusammenarbeit zu ermöglichen, profitieren von zahlreichen Vorteilen. Dazu gehören: 

  • Das Data Sharing innerhalb des gesamten geschäftlichen Ökosystems, ohne dass Daten kopiert oder verschoben werden müssen
  • Das Analysieren von Daten, ohne sie offenzulegen
  • Das Entdecken und Monetarisieren von Daten in der Data Cloud
  • Das sichere Data Sharing mit Unternehmen, die Snowflake noch nicht verwenden

Die Daten von heute erfordern einen neuen Ansatz

Allerdings produzieren Unternehmen auch eine Fülle sensibler und/oder regulierter Daten, die nicht einfach für Dritte freigegeben werden können, wie z. B. Kundenlisten und personenbezogene Daten (Personally Identifiable Information, PII). Infolgedessen werden diese Daten nicht freigegeben bzw. es wird nicht außerhalb der Organisation, aus der sie stammen, an ihnen zusammengearbeitet. In manchen Fällen werden die Daten zwar freigegeben, aber sie werden vor der Freigabe aggregiert, was die Möglichkeiten der Analyse stark einschränkt. Unternehmen die aus sensiblen und/oder regulierten Daten Erkenntnisse gewinnen oder entsprechende Abfragen ausführen möchten, ohne die zugrunde liegenden Daten offenzulegen, sollten den Einsatz eines Data Clean Rooms in Betracht ziehen.

Was versteht man unter einem Data Clean Room?

„Durch die aktuelle Branchendynamik hat sich die Nachfrage nach Data Sharing und Kollaboration beschleunigt“, schreibt Jennifer Bellisent, Principal Data Strategist bei Snowflake. „Gleichzeitig ist die Nachfrage nach Daten durch neue Anwendungsfälle und datenintensive analytische Methoden explosionsartig gestiegen. Doch auch die Sorge um die Wahrung des Datenschutzes nimmt zu. Aus diesen Dynamiken hat sich ein perfekter Sturm entwickelt: der Bedarf an sicherer Data Collaboration über Data Clean Rooms.“

Bei einem Data Clean Room handelt es sich allerdings nicht zwangsläufig um einen „Raum“. Während einige traditionelle Clean Rooms eine physische Infrastruktur erfordern, handelt es sich bei modernen Data Clean Rooms nicht um physische Räume, sondern um ein Framework, bei dem die Daten nicht in ein anderes System oder eine andere Umgebung übertragen werden müssen. 

Bei einem Data Clean Room kann ein Anbieter Regeln für die Arten von Abfragen festlegen, die mit den Daten ausgeführt werden können. Im Unterschied zum Data Sharing wird dem Unternehmen, das die Abfragen ausführt, dabei der Zugriff auf die zugrunde liegenden Daten selbst verwehrt.

Secure Data Sharing und Data Clean Rooms ähneln sich insofern, als sie zwei oder mehr Parteien eine sichere Zusammenarbeit an den Daten ermöglichen. Aber so wie Secure Data Sharing eine große Verbesserung gegenüber den alten Methoden für die Freigabe von Daten darstellte, markiert die Entwicklung des Data Clean Rooms den nächsten großen Schritt in Richtung sicherer Methoden der Data Collaboration für Unternehmen.

Benötigen Sie einen Data Clean Room?

Um es noch einmal zu sagen: Secure Data Sharing ist eine großartige Option für die Freigabe von Daten zwischen verschiedenen Geschäftsbereichen oder mit vertrauenswürdigen Dritten. Es gibt jedoch verschiedene Szenarien, in denen ein Unternehmen sich für die Einrichtung einer Data Clean Room-Umgebung entscheiden kann.

Aufgrund der Einführung verschiedener Verordnungen, darunter der California Consumer Privacy Act (CCPA) und die Datenschutz-Grundverordnung (DSGVO), müssen bei dem Umgang mit Verbraucherdaten jetzt strenge Datenschutzanforderungen eingehalten werden. Wenn die Daten aller Beteiligten sensibel und/oder reguliert sind, bietet sich ein Data Clean Room als ideale Lösung für die Zusammenarbeit mit anderen Unternehmen an. 

Ein Beispiel dafür sind Medien- und Werbeunternehmen. Mit einem Data Clean Room können diese Unternehmen unter Wahrung des Datenschutzes personalisierte Segmenterkenntnisse für Werbung und Kampagnenattribution gewinnen. Ein multinationales Medienunternehmen nutzt eine cloudübergreifende Data Clean Room-Umgebung, unterstützt von Snowflake, um ihre internen Zielgruppendaten an Werbepartner weiterzuleiten. Diese Partner können die Daten dann sicher mit ihren entsprechenden eigenen Datasets verknüpfen. Dabei werden die zugrunde liegenden personenbezogenen Daten weder verschoben noch kopiert oder offengelegt.

Tatsächlich sollte ein Data Clean Room für jede Branche mit sensiblen und/oder regulierten Daten in Betracht gezogen werden, insbesondere dann, wenn der Wert (oder das Risiko) der Zusammenarbeit an diesen Daten hoch ist. 

Der Snowflake Global Data Clean Room

Der Snowflake Global Data Clean Room ist ein Framework für die sichere Zusammenarbeit mehrerer Parteien. Damit können zwei oder mehr Kunden von Snowflake Daten analysieren, ohne dass dabei dem Gegenüber die Rohdaten offengelegt werden. Diese Lösung baut auf den Kernfunktionen von Snowflake für Kollaboration und Data Governance auf, wie zum Beispiel: 

  • Row Access Policies und Datenbankrollen, mit denen die Parteien Kundendaten abgleichen können, ohne die personenbezogenen Daten einer der Parteien offenzulegen
  • Stored Procedures, um Abfragen zu definieren und zu validieren
  • Secure Data Sharing für die automatische und sichere Freigabe von Tabellen zwischen verschiedenen Snowflake-Konten, ohne dass die Daten an einen Ort außerhalb von Snowflake übertragen werden müssen

Zu den wichtigsten Vorteilen von Snowflake Global Data Clean Room gehören:

  • Zwei oder mehr Parteien erhalten die Möglichkeit, Daten über Clouds und Regionen hinweg zu analysieren. Dabei werden keine Daten gegenseitig offengelegt.
  • Schutz vor Reverse Engineering oder Re-Identifizierung hochsensibler Daten durch Begrenzung der Arten von Abfragen, die über den Daten ausgeführt werden können.
  • Prüfung des Zugriffs auf den Global Data Clean Room mit individueller Ereignisprotokollierung.

Welcher Ansatz eignet sich am besten für mein Unternehmen?

Die gesamte Data Collaboration in Unternehmen sollte sicher sein. Deshalb sollte das Kopieren von Daten mit den veralteten Methoden überflüssig werden. Wenn Sie mit vertrauenswürdigen Partnern zusammenarbeiten und diese Zusammenarbeit nicht gegen den Datenschutz verstößt, ist der Einsatz von Snowflake Secure Data Sharing ein sinnvoller Lösungsansatz – schnell, einfach und sicher. Wenn Sie jedoch mit der Zusammenarbeit an sensiblen und/oder regulierten Daten beginnen, und das Risiko bei der Zusammenarbeit an diesen Daten sehr hoch ist, sollten Sie den Einsatz eines Data Clean Rooms in Betracht ziehen. 

Wenn Sie mehr über dieses Thema erfahren möchten, schauen Sie sich unser Webinar „What Is a Global Data Clean Room and When Do You Need One?“ an, das on demand verfügbar ist.