"Queríamos mudar para o Snowpark por questões de desempenho e foi muito fácil fazê-lo. Converter nosso código PySpark em Snowpark foi tão simples. Só precisamos mudar uma instrução de importação."
Principal Data Engineer
Homegenius
Integre seu código Python e outros códigos de programação aos dados governados no Snowflake.
Escalabilidade elástica sem manutenção ou sobrecarga.
Controles de governança e segurança consistentes e de nível empresarial.
Crie consultas e transforme dados usando DataFrames modelados a partir de Spark ou pandas dimensionáveis (em versão preliminar pública).
Use essa biblioteca Python para acessar APIs unificadas para o desenvolvimento de modelos e recursos, bem como operações em todo o ciclo de vida de aprendizado de máquina (machine learning, ML) no Snowflake ML.
Crie e execute códigos personalizados em Python, Java e Scala usando funções definidas pelo usuário e procedimentos armazenados. Utilize os pacotes integrados do repositório Anaconda.
Registre, implemente e execute imagens de contêineres (em versão preliminar pública) na infraestrutura gerenciada do Snowflake.
Use Python para transformar dados brutos em formatos modelados para pipelines de dados.
Em média, com o Snowpark, os clientes observam um desempenho 4,6 vezes mais rápido e uma redução de custos de 35% em comparação com as soluções gerenciadas do Spark.1
Transformações de dados conectados ao seu data lake, warehouse ou Iceberg Tables no Snowflake.
Crie e operacionalize fluxos de trabalho completos de ML usando o Snowpark ML.
Use estruturas Python, como Scikit-learn e XGBoost, para pré-processamento, engenharia de recursos e modelos de treinamento que podem ser implementados e gerenciados no Snowflake ML sem movimentação de dados.
Crie modelos de aprendizado de máquina (ML) e de grandes modelos de linguagem (large language models, LLMs) de IA generativa em qualquer linguagem de programação, adicione a um pacote como uma imagem de contêiner e implemente em CPUs e GPUs configuráveis para obter a máxima flexibilidade do desenvolvedor.
*Dados de abril de 2024
"É um enorme benefício poder executar tarefas de ciência de dados, como engenharia de recursos, diretamente onde os dados residem. Isso tornou nosso trabalho muito mais eficiente e agradável."
Data Science Lead
EDF
1Com base em casos de uso de produção de clientes e exercícios de prova de conceito comparando a velocidade e os custos do Snowpark em relação aos serviços Spark gerenciados no período de novembro de 2022 e janeiro de 2024. Todas as conclusões resumem os resultados de clientes reais, com base em dados verídicos, não representando conjuntos de dados fabricados para benchmarks.