De Spark a Snowpark para la ingeniería de datos

Migra los flujos de Spark sin apenas hacer cambios en el código y reduce la sobrecarga operativa con un motor de procesamiento elástico compatible de forma nativa con Python, Java y Scala.

Two project leads standing and looking at a tablet

Escribe código como en Psypark. Ejecútalo más rápido.

Crea procesos de transformación de datos y lógicas empresariales personalizadas desde el entorno de desarrollo integrado o cuaderno que prefieras mediante la Snowpark API. Ejecuta código de forma segura en los entornos de ejecución de Snowflake para obtener un procesamiento elástico, eficaz y gobernado.

Digram showing how users can develop code from any IDE with the Snowpark API

De Spark a Snowpark Descripción general

API DataFrame

Crea consultas con DataFrames similares a Spark desde el entorno de desarrollo integrado que prefieras y traslada el procesamiento al motor elástico de Snowflake.

UDF

Ejecuta lógicas personalizadas escritas en Python o Java directamente en Snowflake con funciones definidas por el usuario (User Defined Functions, UDF), que pueden migrarse desde Spark sin apenas hacer cambios en el código.

Procedimientos almacenados

Operacionaliza y orquesta tu lógica personalizada y tus flujos directamente en Snowflake, y ponlos a disposición de todos los usuarios de SQL.

Plataforma de Snowflake

para distintos lenguajes

El rendimiento, la elasticidad y la gobernanza de Snowpark se basan en la exclusiva arquitectura de datos multiclúster y compartida de Snowflake.

Testimonios de desarrolladores de Snowpark

Nuestros clientes están migrando de Spark a Snowpark para disponer de flujos de datos gobernados y escalables.

Cambios de código mínimos

“Queríamos pasarnos a Snowpark para mejorar el rendimiento y fue muy fácil hacerlo. Solo tuvimos que hacer un cambio en una sentencia import para convertir nuestro código de PySpark en Snowpark”.

Principal Data Engineer, Homegenius

Mejor relación precio-rendimiento

“Antes teníamos que mover los datos para procesarlos con otros lenguajes y, después, recuperar los resultados para hacerlos accesibles. Gracias a Snowpark, ahora llevamos el procesamiento a los datos. Como el procesamiento sucede en Snowflake, nuestra única plataforma, eso optimiza la arquitectura, y rentabiliza los flujos de ingeniería y las aplicaciones inteligentes”.

Sr. Director Clinical Data Analytics, IQVIA

Reducción de las operaciones adicionales

“Antes, usábamos plataformas basadas en Spark, pero llegó un momento en que la escalabilidad se volvió tan complicada que ni cumplíamos nuestros SLA de carga. Gracias a Snowflake, separar el cómputo y el almacenamiento es mucho más sencillo. Desde la migración, no hemos incumplido ni un solo SLA”.

Senior Manager of Data Platforms, EDF