Ampliación del data sharing de Snowflake a los formatos de tabla abiertos

Esta publicación se actualizó en febrero de 2026 para aclarar algunos detalles de un producto.
Nos complace anunciar una importante expansión del data sharing de Snowflake sin extracción, transformación y carga (ETL): ahora puedes compartir formatos de tabla abiertos de forma fácil y segura, como Apache Iceberg y Delta Lake, entre distintas regiones y nubes. Esta versión permite a los proveedores compartir de forma segura los datos almacenados en formatos de tabla abiertos en cualquier nube y región sin flujos complejos y sin incurrir en cargos de salida por consulta exponenciales.
Snowflake Data Sharing ya lidera en el mercado en lo que respecta a capacidades de colaboración y adopción. Con un ecosistema de data sharing 2,5 veces superior al de los principales competidores, la colaboración de Snowflake proporciona un valor cada vez mayor a una base de usuarios global en crecimiento. Dado que miles de clientes ya comparten datos, las empresas pueden utilizar el uso compartido de los formatos de tabla abiertos para disfrutar de lo mejor de ambos mundos: el data sharing de formato abierto y todas las ventajas principales del data sharing de Snowflake. Entre sus ventajas se incluyen:
Acceso a los datos casi en tiempo real
Controles de gobernanza basados en políticas de Snowflake Horizon Catalog para datos compartidos
Cross-Cloud Auto-Fulfillment y Egress Cost Optimizer para un data sharing entre regiones y nubes simplificado y económico
Prestación de servicios en regiones reguladas, como la nube gubernamental estadounidense y Virtual Private Snowflake
¿Por qué es importante?
Durante muchos años, los clientes de Snowflake han podido compartir datos de forma segura y colaborar con un amplio ecosistema de clientes y partners. El data sharing es la piedra angular de la plataforma de Snowflake, y muchos clientes lo utilizan para desarrollar conexiones y crear ecosistemas de datos sólidos en Snowflake AI Data Cloud.
Con la introducción del data sharing de formatos de tabla abiertos, las capacidades de colaboración de Snowflake se han ampliado a:
Datos almacenados fuera de Snowflake en el propio almacenamiento en la nube de los clientes (AWS S3, Azure Storage, Google GCS)
Datos en formatos de tabla abiertos, como:
Apache Iceberg gestionado por Horizon Catalog o por catálogos externos (AWS Glue, Apache Polaris)
Delta Lake gestionado por catálogos externos (Databricks Unity, Hive Metastore)
Esto significa que las empresas que eligen formatos de tabla abiertos también están ahora conectadas al AI Data Cloud y pueden disfrutar de las ventajas de un próspero ecosistema de datos.
¿Qué desafíos se resuelven?
La mayoría de las organizaciones suelen tener que compartir diversos formatos de datos, tanto de forma interna como externa, pero suelen encontrarse con obstáculos como:
Seguridad y cumplimiento: La aplicación de políticas detalladas de acceso a los datos compartidos es fundamental para mantener la seguridad y el cumplimiento.
Dispersión geográfica y en la nube: Colaboración entre unidades de negocio (líneas de negocio, proveedores, clientes) que suelen estar repartidas por diferentes regiones y nubes, incluidos los entornos de nube comerciales y gubernamentales.
Distintos formatos de datos: Los datos existen en diversos formatos, como Apache Iceberg y Delta Lake.
Snowflake Data Sharing y, específicamente, el data sharing de formatos de tabla abiertos, aborda directamente los principales obstáculos a los que se enfrentan los ingenieros y arquitectos al colaborar con los datos. Reduce las barreras geográficas y entre nubes gracias a la capacidad de compartir tablas en formatos abiertos, amplía las capacidades básicas de gobernanza y ofrece a los clientes la flexibilidad de estandarizar sus datos en formatos como Iceberg, al tiempo que permite a las organizaciones globales compartir datos con cualquier unidad de negocio, proveedor o cliente.
¿Cómo funciona?
El uso compartido de formatos de tabla abiertos está habilitado por Cross-Cloud Auto-Fulfillment (compatible con nubes comerciales, privadas virtuales de Snowflake y gubernamentales de EE. UU.), que simplifica el data sharing para Apache Iceberg y Delta Lake directamente desde el almacenamiento en la nube. Puedes compartir estos datos con un consumidor de Snowflake en cualquier región o nube sin necesidad de gestionar la infraestructura subyacente ni de mantener trabajos de ETL. Además, el uso compartido de formatos de tablas abiertos optimiza los costes de transferencia de datos a través de Egress Cost Optimizer, lo que ayuda a evitar cargos por consulta impredecibles y astronómicos.
Snowflake Horizon Catalog proporciona controles de gobernanza integrales basados en políticas que se pueden aplicar a los datos en formato de tabla abierto compartidos con los consumidores en diferentes regiones o nubes. Esta capacidad garantiza la residencia de datos y facilita el cumplimiento normativo necesario para la colaboración, en particular dentro de sectores regulados o al trabajar con ellos, como el sector público, los servicios financieros, la sanidad y ciencias de la vida.
Cuando se combina con Delta Direct y Catalog Federation* (aprovechando Unity Catalog y IRC API de Uniform), Snowflake Cross-Cloud Auto-Fulfillment amplía esta capacidad a tablas Delta Lake que residen en el almacenamiento en la nube y que son escritas por motores Delta como Microsoft Fabric o Databricks, o bien gestionadas por catálogos como Databricks Unity o Hive Metastore. De esta forma, se amplía el uso compartido de tablas abiertas a tablas Delta Lake con consumidores de Snowflake en cualquier región o nube, nuevamente sin necesidad de gestionar la infraestructura subyacente.

Ejemplo de uso compartido de tablas de Apache IcebergTM gestionadas en Snowflake
El uso compartido de formatos de tabla abiertos permite compartir tablas de Apache Iceberg y Delta Lake entre regiones o nubes y solo está disponible a través de la función Cross-Cloud Auto-Fulfillment de Iceberg. Para obtener más información sobre cómo funciona esta función, consulta la sección (en inglés) sobre el aprovisionamiento automático de productos de datos. Para obtener más información sobre cómo funciona el uso compartido de datos en formatos de tabla abiertos, consulta la documentación (en inglés) sobre el uso del aprovisionamiento automático con tablas de formatos abiertos.
A continuación, se muestra cómo empezar a compartir formatos de tabla abiertos con tablas de Iceberg como ejemplo.
Paso 1. Crea una tabla con un formato de tabla abierto (por ejemplo, Iceberg)
Inicia sesión en la cuenta del proveedor y crea un formato de tabla abierto (como Iceberg) usando los comandos SQL que se muestran a continuación. Para obtener más información sobre cómo crear tablas de Iceberg o gestionarlas mediante catálogos externos, consulta la documentación aquí.
Comando SQL para crear una tabla de Iceberg en AWS S3
create database sample_db_laf_<your alias>;
create schema sample_sc;
create warehouse xsmall;
use warehouse xsmall;
-- Create an external volume for managed table
create or replace external volume managed_exvol
STORAGE_LOCATIONS = (
(
NAME = 'my-s3-us-west-2'
STORAGE_PROVIDER = 'S3'
STORAGE_BASE_URL = 's3://datalake-storage-team/iceberg/table_replication_west'
STORAGE_AWS_ROLE_ARN = 'arn:aws:iam::631484165566:role/datalake-storage-integration-role-2'
)
);
-- create iceberg managed table
create or replace iceberg table sample_iceberg_table_for_laf_testing (
symbol string,
description string
) EXTERNAL_VOLUME = 'managed_exvol'
catalog=snowflake
BASE_LOCATION='sample_iceberg_table_for_laf_testing';
insert into sample_iceberg_table_for_laf_testing values ('A', 'Adam'), ('E', 'Eve'), ('B', 'Bob');
insert into sample_iceberg_table_for_laf_testing values ('D', 'Dan'), ('C', 'Cat'), ('F', 'Fan');
select * from sample_iceberg_table_for_laf_testing;Paso 1b (opcional). Protege los datos con controles de gobernanza basados en políticas
Antes de compartir datos, aprovecha la compatibilidad completa de las funciones de gobernanza de Snowflake Horizon Catalog con tus tablas Apache Iceberg o Delta gestionadas por Horizon o externas, que incluyen:
Políticas de gobernanza detalladas: acceso a filas, políticas de enmascaramiento
Políticas de mejora de la privacidad: política de agregación, política de unión, política de proyección
Clasificación de datos y etiquetado
Además, puedes auditar y supervisar el uso compartido con una auditoría completa mediante el uso de cuenta y el historial de acceso.
Para obtener más información, revisa los ejemplos en la sección sobre cómo compartir datos protegidos por políticas.
Paso 2. Crear un producto de datos dirigido a los consumidores de la región o entre regiones en unos pocos clics
En tu cuenta de proveedor, crea un producto de datos privado a través de la interfaz de Snowsight. Para ello, haz clic en +Listing y selecciona Only Specified Customers. Después, haz lo siguiente:
Especifica un nombre para el producto de datos.
Adjunta la tabla de Iceberg que creaste.
Añade una descripción del producto de datos.
Especifica el alias de la cuenta del consumidor.
Publica el producto de datos.
Los pasos detallados están disponibles aquí.
Estado: con el rol ACCOUNTADMIN, puedes comprobar el estado del producto de datos en la cuenta del proveedor si vas a Data Sharing -> Provider Studio -> Listings.
Cross-Cloud Auto-Fulfillment garantiza que tus datos se entreguen de forma segura y automática a los consumidores de cualquier región o nube.

Paso 3. Los consumidores de la organización o de otras organizaciones acceden a tu producto de datos
Los consumidores pueden ir a Data Products -> Private Sharing para encontrar el producto de datos privado y, a continuación, hacer clic en Get. El consumidor puede estar en la misma cuenta (uso compartido interno) de la misma organización (Internal Marketplace) o en otras organizaciones (uso compartido externo en Snowflake Marketplace).

Resumen final
Snowflake está ampliando su liderazgo en data sharing sin ETL con la integración de formatos de tabla abiertos para permitir un data sharing seguro, gobernado y optimizado en cuanto a costes, en cualquier nube y región. Para ver estas nuevas y potentes capacidades en acción y saber cómo empezar a usarlas, lee esta página de soluciones en la que se muestra una demostración y una guía quickstart.
*Limitación: actualmente, catalog federation no es compatible con bases de datos vinculadas a catálogos. Consulta la información sobre esta limitación en la documentación.



