Producto y tecnología

Gobernanza y detección de datos avanzadas e integradas con Snowflake Horizon Catalog

Los silos complican una gobernanza y detección efectivas

Con la llegada de la IA generativa y los large language models (LLM), las empresas se están dando prisa por obtener el máximo valor empresarial posible de sus activos de datos, incluidas las aplicaciones y los modelos. Lamentablemente, estos activos de datos suelen estar aislados en silos en varios proveedores y soluciones de servicios en la nube, así como en diferentes ecosistemas de partners, clientes y proveedores. A medida que aumenta el número de silos, la detección y la democratización del acceso se vuelven realmente difíciles, y la gestión de los riesgos y costes de seguridad asociados al traslado de activos de datos entre diferentes sistemas con diferentes modelos de gobernanza se vuelve extremadamente compleja.

Simplifica la gobernanza y la detección a escala con Snowflake Horizon Catalog

Uno de los objetivos principales de Snowflake desde el principio ha sido eliminar los silos de datos y hacer que todos los datos estén disponibles de forma sencilla y coherente. Sin embargo, no basta con facilitar el acceso a los datos: los datos de una organización deben ser fáciles de encontrar, de colaborar con ellos y de gobernar. Esta información nos sirvió de inspiración para crear Snowflake Horizon Catalog.

Con Horizon Catalog, buscamos crear un catálogo que reflejara nuestra búsqueda incansable de la simplicidad y la uniformidad. En el núcleo de Horizon Catalog se encuentra un repositorio global unificado para Snowflake AI Data Cloud, que incluye datos estructurados, semiestructurados y no estructurados; modelos; Snowflake Notebooks; Streamlit; Snowflake Native Apps y fichas de datos. Sobre este repositorio, creamos un conjunto de capacidades en torno a los cinco temas siguientes:

  • Seguridad: Horizon Catalog se basa en una sólida base de seguridad que ofrece una robusta seguridad de red, una sólida gestión de identidades y autenticación, junto con una supervisión y protección continuas del riesgo a través de Trust Center. Además, el control de acceso centralizado basado en roles (role-based access control, RBAC) en las nubes ayuda a garantizar la protección de los datos desde el momento en que se registran hasta el momento en que se consumen.

  • Cumplimiento: Horizon Catalog proporciona herramientas a los clientes para garantizar que el acceso a los datos se controla y se audita, que los datos son de alta integridad y que se utilizan para fines apropiados mediante funciones como la clasificación automática para la detección de datos confidenciales; políticas de autorización detalladas para proteger los datos, como el enmascaramiento basado en etiquetas (Tag-based Masking) y el enmascaramiento dinámico de datos (Dynamic Data Masking); y la supervisión de la calidad de los datos y la visualización del linaje de datos.

  • Privacidad: las organizaciones suelen limitar el uso de los datos por cuestiones de privacidad. Las funciones de privacidad avanzadas de Horizon Catalog, como Synthetic Data Generation, Differential Privacy Policies y Snowflake Data Clean Rooms, permiten el análisis de datos y la colaboración al tiempo que preservan la privacidad, lo que abre nuevas posibilidades.

  • Detección: los usuarios deben ser capaces de encontrar los datos, las aplicaciones y los modelos que necesitan, comprenderlos y acceder a ellos sin problemas. Horizon Catalog ofrece una detección de contenido continua (datos, aplicaciones y modelos) que funciona con datos independientemente del formato o la ubicación.

  • Colaboración: Horizon Catalog permite una colaboración segura con clientes y proveedores sin necesidad de mover datos, tanto dentro como fuera de la organización. Los clientes también pueden enriquecer y sacar partido a sus datos con conjuntos de datos, aplicaciones y productos de IA de terceros en Snowflake Marketplace.
Diagram showing the components of Snowflake Horizon Catalog and its interaction with other elements of the Snowflake platform, such as Snowsight and Snowflake Open Catalog

Un principio fundamental que nos motivó a crear Horizon Catalog es la facilidad de uso a escala: incluso un equipo pequeño debería ser capaz de proteger y seleccionar los patrimonios de datos más complejos mediante un único conjunto de herramientas. Horizon Catalog se ha diseñado para ser fácil de usar por lo siguiente: 

  • Multinube y global: tu patrimonio de datos puede abarcar varias nubes y regiones, incluidas aquellas donde pueden almacenar los datos tus partners, clientes o proveedores. Horizon Catalog te ayuda a gestionar tu patrimonio de datos con un único modelo de gobernanza y seguridad que funciona de forma uniforme en todas las regiones y las tres nubes principales (AWS, Azure y GCP), así como en nubes soberanas para mercados regulados. 

  • Integrado por diseño: no querrás dedicar tiempo ni recursos valiosos a crear integraciones personalizadas que a menudo son débiles y poco fiables. Las funciones de gobernanza, las superficies de detección y los flujos de solicitudes de Horizon Catalog están integrados por diseño, lo que ayuda a garantizar la coherencia de la aplicación y la fiabilidad. Por ejemplo, el Marketplace interno de Horizon Catalog está totalmente integrado con controles de gobernanza y acceso para proporcionar un mecanismo de autoservicio sencillo tanto para usuarios técnicos como empresariales. Por su parte, Trust Center de Horizon Catalog proporciona una única herramienta unificada que optimiza la supervisión de la seguridad entre nubes para detectar riesgos de seguridad y recomendaciones para abordarlos.

  • Con tecnología de Snowflake Cortex AI: Horizon Catalog utiliza Snowflake Cortex AI para automatizar y potenciar lo que antes eran tareas manuales. Para automatizar la curación de datos, Horizon Catalog se integra con Cortex AI para generar descripciones de objetos y columnas de forma inteligente. Puedes utilizar la función de búsqueda en lenguaje natural basada en IA para encontrar los datos que necesitas. Por último, puedes utilizar la IA para comprender y analizar tus datos mediante Snowflake Copilot, Cortex Analyst y Cortex Knowledge Extensions, todo ello con una intuitiva interfaz de lenguaje natural. 

  • Interoperable: la plataforma debe ofrecer la flexibilidad de trabajar con formatos de tabla abiertos para minimizar las dependencias y la libertad de elegir la herramienta adecuada para el workload adecuado. Horizon Catalog se integra con Apache Polaris (un catálogo de código abierto para Apache Iceberg Tables), así como con Snowflake Open Catalog (un servicio gestionado con la tecnología de Apache Polaris) para gestionar sin problemas no solo objetos de Snowflake, sino también objetos de Iceberg de código abierto fuera de Snowflake. Esta integración proporciona a las empresas niveles de elección, flexibilidad y control sin precedentes sobre sus datos, ya que amplía las capacidades de gobernanza y detección de Horizon Catalog a Iceberg Tables creadas por cualquier otro motor compatible en Apache Polaris y Snowflake Open Catalog. El ecosistema de partners de Snowflake Horizon Catalog amplía aún más las capacidades de Horizon Catalog más allá de Snowflake e Iceberg.

Con Horizon Catalog, los administradores y los responsables de los datos y de la seguridad pueden comprender, proteger y auditar las cuentas y los activos de todas las regiones y nubes, al tiempo que permiten a los equipos de datos detectar datos, servicios y aplicaciones en todo el mundo, acceder a ellos y compartirlos, sin necesidad de recurrir a procesos de extracción, transformación y carga (extract, transform, and load, ETL). Horizon Catalog se basa en el liderazgo actual de Snowflake en cuanto a data sharing —con miles de clientes que comparten datos dentro de las organizaciones y entre ellas, y adquieren datos o aplicaciones en Snowflake Marketplace— y gobernanza y seguridad de los datos, con las políticas de RBAC, clasificación, etiquetado detalladas en las que confían miles de clientes. Al mismo tiempo, Horizon Catalog amplía estas capacidades líderes nativas de gobernanza y detección a formatos de tabla abiertos para mejorar la interoperabilidad entre sistemas de gestión de metadatos, motores de consultas e infraestructuras de nube.

Más información

En esta entrada de blog, presentamos por qué creamos Horizon Catalog y cómo su facilidad de uso te ayuda a gestionar de forma eficaz tu plataforma de datos empresarial moderna. En próximas entradas de blog, ofreceremos una explicación más detallada sobre cómo las capacidades asociadas a los cinco temas pueden ayudarte a alcanzar tus objetivos.

Para obtener más información sobre Snowflake Horizon Catalog, consulta los siguientes recursos:

Icono de Snowflake Horizon
Laboratorio práctico virtual

Unify Your Governance Strategy with Snowflake Horizon Catalog

Aprende cómo Snowflake Horizon Catalog ayuda en la gobernanza y detección de datos, aplicaciones y más de diferentes fuentes y con distintos formatos.
Compartir artículo

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • Prueba gratuita de 30 días
  • No se requiere tarjeta de crédito
  • Cancela en cualquier momento