Snowflake migliora le prestazioni del 27% secondo lo Snowflake Performance Index
Al Summit Snowflake dello scorso anno abbiamo annunciato il lancio pubblico del nostro Snowflake Performance Index (SPI), un indice aggregato per la misurazione dei miglioramenti delle performance di utilizzo effettive registrati dai clienti Snowflake nel corso del tempo.
La filosofia di prodotto di Snowflake è orientata al miglioramento continuo delle prestazioni attraverso il perfezionamento del nostro motore centrale. Rilasciamo questi miglioramenti delle prestazioni a cadenza settimanale, integrandoli nelle operazioni quotidiane dei clienti per potenziare le performance in modo fluido e senza costi aggiuntivi, migrazioni, upgrade o operazioni manuali. Questa strategia è volta a ottimizzare il rapporto prezzo/prestazioni con Snowflake. E, con il nostro modello di prezzo basato sui consumi, questi miglioramenti delle prestazioni si traducono in risparmi per i clienti.
Siamo infatti impegnati a ridurre il costo di esecuzione dei workload in Snowflake nel tempo.
Snowflake Performance Index: i risultati
A tutt’oggi, l’indice SPI è migliorato del 27% da quando abbiamo iniziato a monitorarlo nell’agosto 2022. Negli ultimi 12 mesi, è migliorato del 12%. L’indice SPI viene calcolato sui workload stabili e ricorrenti di clienti del mondo reale, e ci consente di confrontare i miglioramenti su specifici workload dei clienti nel tempo.
A differenza di altri fornitori, che utilizzano benchmark fittizi o sintetici per il confronto delle performance, Snowflake utilizza dati reali dei clienti sui workload di produzione per misurare i miglioramenti delle prestazioni, una testimonianza della nostra filosofia di base: il nostro successo è intrinsecamente legato a quello dei nostri clienti.
Miglioramenti delle prestazioni monitorati dall’indice SPI
Negli ultimi mesi abbiamo apportato una serie di miglioramenti significativi. E cosa più importante, l’implementazione di molti di questi miglioramenti è automatica, senza necessità di intervento da parte del cliente.
Continuiamo a investire per rendere il compiler più veloce e più efficiente e l’optimizer più intelligente, per migliorare le prestazioni di query e rendere ancora più rapida l’ingestion dei dati in Snowflake. Ad esempio:
- Abbiamo migliorato fino al 25% le performance di ingestion dei file JSON e Parquet con dati case‑insensitive.
- Abbiamo migliorato il throughput tra i nodi di un warehouse, introducendo una comunicazione tra i nodi più rapida durante l’esecuzione e una migliore compressione di rete, e abbiamo apportato miglioramenti al posizionamento dell’aggregazione, potenziando le prestazioni di tutte le query.
- Abbiamo identificato e ottimizzato le prestazioni di query per i modelli di query comuni, ad esempio migliorando la gestione della memoria con decisioni di broadcast join olistiche, abbreviando i tempi di esecuzione per le query con strutture di tipo deep right join.
- Abbiamo inoltre ridotto il costo di gestione delle viste materializzate migliorando l’utilizzo delle risorse di servizio.
- E continuiamo a rendere l’optimizer più intelligente, per la scelta delle migliori ottimizzazioni possibili, ad esempio introducendo stime di selettività più granulari, che consentono a Snowflake di prendere decisioni migliori sugli ordini di join.
Al Summit 2024, in particolare, abbiamo annunciato le seguenti ottimizzazioni delle prestazioni:
- Top‑K pruning V2 (disponibili per tutti i clienti): Snowflake consente il pruning preciso con micropartizioni durante il runtime delle query per le istruzioni SELECT con clausole ORDER e LIMIT. Con Top‑K pruning V2, Snowflake interrompe la scansione quando determina che nessuna delle righe rimanenti può essere in un set di risultati composti da record K. Questo algoritmo di pruning viene applicato automaticamente alle query ORDER e LIMIT, senza costi aggiuntivi, per offrire agli utenti i migliori risultati. Con Top-K V2 le prestazioni migliorano, in media, di un ulteriore 12,5%.
- Viste di cronologia DML e utilizzo degli account (presto disponibili per tutti i clienti): aiutano i clienti ad analizzare il costo e i vantaggi del clustering e dell’ottimizzazione della ricerca per migliorare il pruning, fornendo maggiore visibilità sull’efficienza di esecuzione delle query.
- Miglioramenti al Query Acceleration Service (QAS): adesso, il 6% in più di query è idoneo per il servizio QAS con l’aggiunta di INSERT.
- Miglioramenti continui delle prestazioni di clustering (disponibili per tutti i clienti): questi miglioramenti sono in grado di ridurre i costi per i clienti del 10%*.
Per le informazioni aggiornate consulta le note di rilascio sui miglioramenti delle prestazioni.
L’indice SPI evidenzia il nostro impegno a migliorare costantemente i vantaggi economici per i clienti e l’impatto quantitativo del miglioramento delle prestazioni della piattaforma sui workload di produzione reali dei clienti nel corso del tempo. E, naturalmente, ci consente di misurare e migliorare l’impatto sulle performance di nuove funzioni, migliorie e capacità di calcolo, coerentemente a quello che è il valore numero uno di Snowflake: mettere i clienti al primo posto.
Visita Snowflake Performance Index per saperne di più.
*In base a una distribuzione limitata dal 12/2 all’1/3 di ~37% crediti di reclustering