“Volevamo passare a Snowpark per migliorare le prestazioni e ci siamo riusciti con estrema facilità. Convertire il codice PySpark in Snowpark è stato semplice come cambiare un’istruzione di importazione.”
Principal Data Engineer
Homegenius
Porta il tuo codice Python o in altri linguaggi vicino ai tuoi dati governati in Snowflake.
Scalabilità elastica senza manutenzione o spese operative generali.
Sicurezza e controlli della governance coerenti e di livello enterprise.
Scrivi query e trasforma i dati con DataFrame modellati su Spark o Pandas scalabile (public preview).
Utilizza questa libreria Python per accedere ad API unificate per lo sviluppo di modelli e funzionalità e le attività operative nell’intero ciclo di vita del machine learning in Snowflake ML.
Scrivi ed esegui codice Python, Java e Scala personalizzato con UDF e stored procedures. Sfrutta i pacchetti built‑in dal repository Anaconda.
Registra, distribuisci ed esegui immagini container (public preview) nell’infrastruttura gestita Snowflake.
Usa Python per trasformare dati grezzi in formati più strutturati per le pipeline di dati
I clienti ottengono in media prestazioni 4,6 volte più veloci e risparmi sui costi del 35% con Snowpark rispetto a Spark gestito.1
Trasformazioni su dati connessi ai tuoi data lake, warehouse o Iceberg Tables in Snowflake.
Crea e rendi operativi workflow di machine learning end‑to‑end utilizzando Snowpark ML
Utilizza i framework Python, come Scikit‑learn e XGBoost, per la pre‑elaborazione, il feature engineering e l’addestramento di modelli da distribuire e gestire in Snowflake ML senza trasferimento dei dati.
Crea modelli ML e LLM di intelligenza artificiale generativa in qualsiasi linguaggio di programmazione, pacchettizzali in immagini container e distribuiscili in CPU e GPU configurabili per sviluppare con la massima flessibilità.
* Ad aprile 2024.
“Poter eseguire attività di data science, come il feature engineering, direttamente lì dove risiedono i dati è un enorme vantaggio per noi. Ha reso il nostro lavoro molto più efficiente e molto più piacevole.”
Data Science Lead
EDF
1 Dati basati su casi d’uso di produzione ed esercizi di proof‑of‑concept mettendo a confronto la velocità e il costo di Snowpark rispetto ai servizi Spark gestiti nel periodo da novembre 2022 a gennaio 2024. Tutti i risultati sintetizzano i risultati effettivi ottenuti dai clienti con i loro dati reali e non rappresentano data set creati ad hoc come benchmark.