Si les data clean rooms font actuellement beaucoup parler d’elles sur le marché, il règne une certaine confusion sur leur définition exacte et sur ce qui les distingue des méthodes de partage de données. À travers cet article de blog, je souhaite lever le voile sur ce sujet. 

En quoi consiste le partage de données ?

Parmi les méthodes de partage de données traditionnelles, on retrouve la copie de fichiers dans des FTP/compartiments cloud, l’utilisation de pipelines ETL ou encore la maintenance et l’appel d’API. Ces techniques classiques présentent toutefois des inconvénients : elles peuvent entraver la collaboration et induire des lacunes en matière d’informations, des données imprécises et des problèmes de sécurité. Une fois les données déplacées, leur niveau de sécurité dépend de leur nouvel emplacement, rendant la gouvernance efficace de ces données pratiquement impossible. En outre, l’entretien de pipelines personnalisés, entre autres problèmes, peut se révéler coûteux.

À l’inverse, le Secure Data Sharing, une fonctionnalité de la plateforme Snowflake, permet aux entreprises d’octroyer l’accès à leurs données en toute sécurité. Il s’agit d’une avancée majeure par rapport à l’époque qui imposait de copier des fichiers volumineux sur un serveur FTP ou de construire et d’entretenir des pipelines ETL fragiles. Au lieu de copier des fichiers entre deux systèmes, un utilisateur Snowflake peut, par exemple, définir en toute simplicité les tables d’une base de données auxquelles un autre utilisateur Snowflake peut accéder. 

Quand utiliser le Secure Data Sharing ?

Le Secure Data Sharing est idéal pour fournir un accès direct à un ensemble de données. Par exemple, il se révèle précieux lorsqu’il s’agit de partager des données avec plusieurs unités commerciales ou des agences ou partenaires de confiance à des fins d’analyse et d’amélioration de la prise de décisions et des résultats commerciaux. Les entreprises ou fournisseurs de données qui monétisent ou vendent des données utilisent également cette méthode en raison de l’accès sécurisé et révocable qu’elle assure à leurs clients. 

Snowflake Secure Data Sharing

La plateforme de Snowflake fluidifie la collaboration sur les données tout en aidant à réduire les coûts et à dévoiler de nouvelles informations métiers. Snowflake Secure Data Sharing permet aux entreprises de partager leurs données en toute sécurité dans l’ensemble de leur écosystème. Elles peuvent ainsi :

  • Accéder rapidement aux données actualisées dans l’ensemble de leur organisation. 
  • Contrôler l’accès gouverné aux données partagées.
  • Publier facilement des ensembles de données à des fins de découverte, tout en définissant des contrôles d’accès.

La plateforme data dans le cloud de Snowflake

Avec Snowflake, une entreprise peut utiliser des données, fournir des données ou les deux. Le Data Cloud Snowflake représente également un outil puissant pour les applications. Cette solution permet aux clients de découvrir, créer et distribuer des applications qui fonctionnent en mode natif au sein de leur compte Snowflake.

Les entreprises qui mettent à profit la plateforme de Snowflake pour faciliter la collaboration tout en préservant la confidentialité y voient une multitude d’avantages, notamment : 

  • Le partage entre écosystèmes métiers sans copie ni déplacement de données.
  • L’analyse des données sans exposition de ces dernières.
  • La découverte et la monétisation des données dans le Data Cloud.
  • Le partage sécurisé des données avec des entreprises qui n’utilisent pas Snowflake.

Les données d’aujourd’hui nécessitent une approche innovante

Toutefois, les entreprises génèrent également une grande quantité de données sensibles et/ou réglementées qui ne peuvent tout simplement pas être partagées avec d’autres parties, comme des listes de clients et des informations personnelles identifiables (PII). C’est pourquoi ces données ne sont ni partagées ni rassemblées à des fins de collaboration à l’extérieur de l’entreprise dont elles proviennent, ni agrégées avant partage, ce qui limite les possibilités d’analyse. Pour extraire des informations ou exécuter des requêtes sur des données sensibles et/ou réglementées sans exposer les données sous-jacentes, une entreprise doit envisager d’utiliser une data clean room.

Qu’est-ce qu’une data clean room ?

« La dynamique actuelle du secteur a accéléré les demandes à l’égard du partage et de la collaboration », constate Jennifer Bellisent, Principal Data Strategist chez Snowflake. « En parallèle, de nouveaux cas d’usage et méthodes d’analyses riches en données ont entraîné une explosion de la demande de données. On observe toutefois une hausse des préoccupations en matière de confidentialité des données. Cette dynamique a déclenché une véritable révolution : le besoin en collaboration sécurisée sur les données via des data clean rooms. »

Une data clean room n’est pas nécessairement une « salle » à proprement parler. Alors que certaines clean rooms requièrent une infrastructure physique, les data clean rooms modernes ne correspondent pas à un espace physique, mais plutôt à un framework qui ne nécessite aucune migration des données vers un autre système ou environnement. 

Une data clean room se distingue du partage de données par le fait qu’un fournisseur peut définir des règles sur les types de requêtes qu’il est possible d’appliquer à ces données, mais aussi empêcher l’entreprise qui exécute les requêtes d’accéder aux données sous-jacentes elles-mêmes.

La fonctionnalité Secure Data Sharing et les data clean rooms ont ceci de similaire qu’elles permettent à au moins deux parties de collaborer sur des données en toute sécurité. À l’instar de la nette amélioration apportée par Secure Data Sharing par rapport aux anciennes méthodes de partage de données, l’émergence des data clean rooms représente le prochain jalon vers des méthodes de collaboration autour des données plus sécurisées pour les entreprises.

Avez-vous besoin d’une data clean room ?

Une fois encore : le partage de données sécurisé est idéal pour partager des données entre des unités commerciales ou avec des tiers de confiance. Une entreprise qui évalue la possibilité de configurer un environnement de data clean room fait face à plusieurs scénarios.

En raison de l’adoption de diverses réglementations, y compris la loi californienne sur la protection de la vie privée des consommateurs (CCPA) et le Règlement général sur la protection des données (RGPD), les données des utilisateurs doivent désormais être gérées selon un niveau de confidentialité strict. Il est possible d’utiliser une data clean room pour collaborer avec d’autres entreprises si les données de chaque partie sont sensibles et/ou réglementées. 

Une data clean room peut, par exemple, permettre à une agence de presse ou à un annonceur d’accéder à des informations sur des segments personnalisés à des fins publicitaires et d’attribution de campagnes sans mettre à mal la confidentialité des données. Une agence de presse multinationale utilise un environnement de data clean room cross-cloud optimisé par Snowflake pour fournir ses données d’audience à ses partenaires publicitaires, qu’ils peuvent recouper en toute sécurité avec leurs ensembles de données respectifs, et ce sans déplacer, copier ni exposer les PII sous-jacentes.

Il convient d’envisager une data clean room pour chaque secteur d’activité qui traite des données sensibles et/ou réglementées, a fortiori lorsque la collaboration sur de telles données implique un niveau de valeur (ou de risque) élevé. 

Snowflake Global Data Clean Room

Snowflake Global Data Clean Room fournit un framework assurant une collaboration sécurisée et multipartite. De cette manière, plusieurs clients Snowflake peuvent analyser des données sans pour autant divulguer leurs données brutes respectives. Cette solution tire parti de fonctionnalités de gouvernance des données et de collaboration Snowflake de base, parmi lesquelles : 

  • Les Row Access Policies et les rôles de bases de données, permettant aux parties de faire correspondre des données clients sans exposer leurs PII.
  • Les procédures stockées, qui génèrent et valident les demandes de requêtes.
  • Le Secure Data Sharing, assurant le partage automatique et sécurisé de tables entre plusieurs comptes Snowflake sans exiger de déplacer des données à l’extérieur de Snowflake.

Snowflake Global Data Clean Room offre les principaux avantages suivants :

  • Permettre à deux parties ou plus d’analyser des données à travers les clouds et les régions sans les exposer mutuellement.
  • Empêcher la rétro-ingénierie ou la désanonymisation des données très sensibles en limitant les types de requêtes qu’il est possible d’exécuter sur les données.
  • Contrôler l’accès à Global Data Clean Room avec une journalisation d’événements personnalisée.

Quelle approche convient le mieux à mon entreprise ?

Puisque toute collaboration sur les données d’entreprise doit être sécurisée, la copie des données à l’aide de méthodes traditionnelles est appelée à devenir obsolète. Cela étant, si vous collaborez avec des partenaires de confiance sans enfreindre les réglementations en matière de confidentialité, Snowflake Secure Data Sharing représente une option viable, à la fois rapide, simple et sécurisée. Dès lors que le processus implique le traitement de données sensibles et/ou réglementées et un niveau de risque élevé lié à la collaboration sur ces données, optez plutôt pour une data clean room. 

Pour en savoir plus, inscrivez-vous à notre webinaire à la demande : « Qu’est-ce qu’une Global Data Clean Room et quand en avez-vous besoin ? ».