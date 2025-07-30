En la versión 3.4, la comunidad de Apache Spark™ presentó Spark Connect. Su arquitectura cliente-servidor desvinculada separa el código del usuario del clúster de Spark donde se realiza el trabajo. Esta nueva arquitectura ahora permite ejecutar el código de Spark en un almacén de Snowflake, lo que elimina la necesidad de aprovisionar y mantener los clústeres de Spark.

Nos complace anunciar la vista previa pública de Snowpark Connect para Spark. Con Snowpark Connect, los clientes pueden aprovechar el potente motor vectorizado de Snowflake para su código de Spark, al tiempo que evitan la complejidad de mantener o ajustar diferentes entornos de Spark, como la gestión de dependencias, la compatibilidad de versiones y las actualizaciones. Ahora puedes ejecutar los modernos códigos de Spark DataFrame, Spark SQL y de función definida por el usuario (UDF) con Snowflake.

Al utilizar el entorno de ejecución de cómputo elástico de Snowflake con los almacenes de datos virtuales, Snowpark Connect para Spark ofrece lo mejor de ambos mundos: la potencia del motor de Snowflake y la familiaridad del código de Spark, todo ello a la vez que reduce los costes y acelera el desarrollo. Las organizaciones ya no necesitarán clústeres de Spark dedicados. Escribe o incorpora tu Spark SQL, DataFrame y UDF compatibles para ejecutarlos directamente en la plataforma de Snowflake. Snowflake gestiona todo el ajuste y escalado del rendimiento de manera automática, liberando así a los desarrolladores de la sobrecarga operativa que supone la gestión de Spark. Además, al incorporar el procesamiento de datos a Snowflake, estableces un marco de gobernanza único y sólido desde el inicio, lo que ayuda a garantizar la coherencia y la seguridad de los datos en todo el ciclo de vida sin un esfuerzo redundante.