Últimamente se está hablando mucho de las data clean rooms en el mercado, y hay bastante confusión acerca de qué son exactamente y en qué se diferencian de los métodos de data sharing. Voy a intentar aclarar la cuestión en esta entrada de blog. 

¿Qué es el data sharing?

Algunos métodos de data sharing tradicionales son la copia de archivos en un protocolo de transferencia de archivos (file transfer protocol, FTP) o en contenedores en la nube; el uso de flujos de extracción, transformación y carga (extract, transform, and load; ETL); y el mantenimiento y las llamadas a las API. El problema de estos métodos tradicionales es que pueden impedir que haya una colaboración efectiva, lo que da lugar a carencias de información, datos imprecisos y problemas de seguridad. Una vez que los datos se mueven, su seguridad depende de la ubicación en la que se encuentran; esto es casi imposible de controlar de forma eficaz. Además, mantener flujos personalizados puede resultar muy costoso y es posible que surjan muchos otros problemas.

Sin embargo, con la tecnología Secure Data Sharing de la plataforma de Snowflake, las organizaciones pueden dar acceso a sus datos de manera segura, lo que supone un gran avance con respecto a tener que copiar grandes archivos mediante FTP o verse obligados a crear y mantener flujos de ETL frágiles. En lugar de copiar archivos de un sistema a otro, por ejemplo, un usuario de Snowflake puede definir sencillamente a qué tablas de una base de datos puede acceder otro cliente de Snowflake. 

¿En qué casos debe usarse Secure Data Sharing?

La tecnología Secure Data Sharing es excelente para ofrecer acceso directo a un conjunto de datos, por ejemplo, al compartir datos entre distintas unidades de negocio, con agencias o partners de confianza para hacer análisis con los que tomar decisiones empresariales más acertadas y obtener mejores resultados. También la usan las empresas y los proveedores de datos que monetizan o venden datos, ya que les permite ofrecer un acceso seguro y revocable a sus clientes. 

Snowflake Secure Data Sharing

La plataforma de Snowflake permite una colaboración de datos fluida y ayuda a reducir costes y a extraer nueva información empresarial. Snowflake Secure Data Sharing permite a las organizaciones compartir datos de forma segura en todo su ecosistema empresarial para que puedan:

  • acceder rápidamente a datos actualizados desde toda la organización; 
  • controlar el acceso gobernado a los datos compartidos;
  • publicar fácilmente conjuntos de datos para que sea posible encontrarlos, y establecer controles de acceso.

Cloud Data Platform de Snowflake

Con Snowflake, las organizaciones pueden ser consumidoras, proveedoras de datos, o ambas. Además, Snowflake Data Cloud también es una herramienta de aplicaciones muy potente, ya que permite a los clientes descubrir, crear y distribuir aplicaciones que se ejecutan de forma nativa en su cuenta de Snowflake.

Las empresas que aprovechan la plataforma de Snowflake para proporcionar una colaboración que protege la privacidad disfrutan de un amplio abanico de ventajas, como las siguientes: 

  • uso compartido de datos entre ecosistemas empresariales sin copiarlos ni moverlos;
  • análisis de datos sin exponerlos;
  • descubrimiento y monetización de datos en el Data Cloud;
  • uso compartido de datos de forma segura con empresas que no usan los servicios de Snowflake.

Se necesita una nueva estrategia para los datos actuales

Las empresas también generan gran cantidad de datos confidenciales y/o regulados que no pueden compartirse con nadie, como listas de clientes o información de identificación personal (personally identifiable information, PII) Como resultado, estos datos no se comparten ni se colabora con ellos fuera de la organización donde se originan, o bien se agregan antes de compartirse, lo que limita los tipos de análisis que pueden hacerse. Para extraer información o ejecutar consultas en datos confidenciales y/o regulados sin exponerlos, las empresas pueden usar una data clean room.

¿Qué es una data clean room?

“Las dinámicas actuales del sector han acelerado la necesidad de compartir y colaborar”, afirma Jennifer Bellisent, Principal Data Strategist de Snowflake. “Al mismo tiempo, los nuevos casos de uso y los métodos de analíticas que hacen un uso intensivo de los datos han provocado que se dispare la demanda de datos. Sin embargo, también han crecido las preocupaciones acerca de cómo preservar su privacidad. Como resultado, estas dinámicas han dado lugar a la tormenta perfecta: se necesita una colaboración de datos segura a través de data clean rooms”.

Una data clean room no tiene nada que ver con un espacio físico. Aunque algunas clean rooms tradicionales requieren una infraestructura física, las data clean rooms modernas no son espacios físicos, sino marcos que no requieren que los datos se muevan a un sistema o entorno diferentes. 

Las data clean rooms se diferencian del data sharing en que los proveedores pueden establecer reglas acerca de los tipos de consultas que es posible ejecutar en los datos, pero sin que la empresa que las ejecuta pueda acceder a los datos subyacentes.

La tecnología Secure Data Sharing y las data clean room se parecen en que ambas permiten que dos o más partes puedan colaborar con datos de forma segura. No obstante, al igual que Secure Data Sharing fue una gran mejora con respecto a los métodos anteriores para compartir datos, la aparición de las data clean rooms es el próximo gran paso para que las organizaciones dispongan de métodos más seguros de colaboración de datos.

¿Necesitas una data clean room?

Como ya se ha mencionado, la tecnología Secure Data Sharing es una gran opción para compartir datos entre unidades de negocio o con terceros de confianza. Sin embargo, hay distintas situaciones en las que una empresa puede decidir que es preciso crear un entorno de data clean room.

Con la introducción de distintas normativas, como la Ley de Privacidad del Consumidor de California (California Consumer Privacy Act, CCPA) y el Reglamento General de Protección de Datos (RGPD), es necesario adherirse a niveles de privacidad muy estrictos a la hora de gestionar los datos de los consumidores. Colaborar con otras empresas empleando una data clean room es una solución que puede usarse si los datos de todas las partes son confidenciales y/o están regulados. 

Por ejemplo, en el caso de las empresas de medios y publicidad, una data clean room puede permitir a las organizaciones extraer información personalizada de segmentos con fines de atribución sin dejar de preservar la privacidad. Una empresa multinacional de medios emplea un entorno de data clean room entre nubes basado en Snowflake para ofrecer datos de primera mano de su audiencia a partners de publicidad. De ese modo, los partners pueden combinarlos con sus propios conjuntos de datos de forma segura, todo ello sin mover, copiar ni revelar la PII subyacente.

De hecho, las data clean rooms son una gran opción para todos los sectores que tienen datos confidenciales y/o regulados, especialmente cuando el valor o el riesgo de colaborar con esos datos es elevado. 

Snowflake Global Data Clean Room

Snowflake Global Data Clean Room es un marco para que varias partes puedan colaborar de forma segura. Permite a dos o más clientes de Snowflake analizar datos sin revelárselos los unos a los otros. Esta solución aprovecha las principales funciones de colaboración y gobernanza de datos de Snowflake, como: 

  • Row Access Policies y roles de base de datos, con los que los distintos interesados pueden confrontar datos de clientes sin exponer la PII de los demás;
  • Stored Procedures para generar y validar solicitudes de consulta;
  • Secure Data Sharing para compartir tablas de forma automática y segura entre distintas cuentas de Snowflake sin necesidad de mover datos fuera de la plataforma.

Estas son algunas de las ventajas clave de Snowflake Global Data Clean Room:

  • Permite a dos o más partes analizar datos entre nubes y regiones sin exponerlos.
  • Protege ante la ingeniería inversa y la reidentificación de datos muy confidenciales limitando los tipos de consultas que pueden ejecutarse en los datos.
  • Audita el acceso a Global Data Clean Room con un registro de eventos personalizado.

¿Cuál es la mejor estrategia para mi empresa?

Toda la colaboración de datos empresariales debe ser segura, por lo que la copia de datos con métodos heredados está quedando obsoleta. Dicho esto, usar Snowflake Secure Data Sharing es una estrategia viable, rápida, fácil y segura para colaborar con partners de confianza en actividades que no infringen ninguna normativa de privacidad. Sin embargo, es recomendable usar una data clean room si empiezas a colaborar con datos confidenciales y/o regulados con un riesgo elevado. 

Si quieres obtener más información, regístrate para ver nuestro webinar bajo demanda What Is a Global Data Clean Room and When Do You Need One?.