Snowflake mejora su rendimiento un 27 % según el Snowflake Performance Index
En el Summit del año pasado, anunciamos el lanzamiento público del Snowflake Performance Index (SPI), un índice agregado que mide las mejoras reales del rendimiento que los clientes experimentan con Snowflake a lo largo del tiempo.
En Snowflake, nuestra filosofía de producto se centra en mejorar el rendimiento continuamente mediante la optimización del motor principal. Implementamos estas mejoras en lanzamientos semanales y las integramos en tus operaciones diarias para que disfrutes de un mejor rendimiento sin complicaciones y sin ningún coste adicional. No se necesitan migraciones, actualizaciones ni tareas manuales. Esta estrategia se ha diseñado para optimizar el precio por rendimiento con Snowflake. Además, nuestro modelo de precios basados en el consumo permite traducir estas mejoras en ahorro de costes para los clientes.
Nuestro compromiso consiste en reducir el coste de ejecutar los workloads en Snowflake a lo largo del tiempo.
Resultados del Snowflake Performance Index
El SPI ha mejorado un 27 % desde que comenzamos a supervisar el índice en agosto de 2022. En los últimos 12 meses ha aumentado un 12 %. El SPI se calcula con workloads reales, estables y recurrentes de clientes que permiten comparar las mejoras en workloads específicos de los clientes a lo largo del tiempo.
Al contrario que otros proveedores, que usan indicadores ficticios o sintéticos para comparar el rendimiento, en Snowflake usamos datos reales de los clientes en workloads de producción para medir las mejoras de rendimiento que realizamos. Es un ejemplo de nuestra filosofía principal: nuestro éxito depende intrínsecamente del que tengan nuestros clientes.
Seguimiento de las mejoras de rendimiento mediante el SPI
En los últimos meses hemos realizado una serie de mejoras importantes. Lo mejor de todo es que muchas se realizan automáticamente, sin intervención alguna por tu parte.
Seguimos invirtiendo para que el compilador sea más rápido y eficiente, para que el optimizador sea más inteligente, para mejorar el rendimiento de la ejecución de consultas principales y para que la ingesta de datos en Snowflake sea aún más rápida. Por ejemplo:
- Hemos mejorado hasta un 25 % el rendimiento de la ingesta de archivos JSON y Parquet con datos sin distinción entre mayúsculas y minúsculas.
- Hemos optimizado la capacidad de procesamiento entre los nodos de un almacén introduciendo una comunicación entre nodos más rápida durante la ejecución, y hemos mejorado la colocación de las agregaciones para aumentar el rendimiento de todas las consultas.
- Hemos identificado y optimizado el rendimiento de las consultas en patrones de consultas comunes, como en la mejora de la gestión de la memoria con decisiones integrales de unión de difusión, lo que acelera el tiempo de ejecución de consultas con árboles de tipo deep-right join.
- También hemos reducido el coste de mantenimiento de la vista materializada mejorando el uso de los recursos de servicios.
- Asimismo, seguimos haciendo que el optimizador sea más inteligente para elegir las mejores optimizaciones posibles mediante la introducción de estimaciones de selección más detalladas, lo que permite a Snowflake tomar mejores decisiones sobre el orden de las uniones.
En concreto, en el Summit de 2024 nos complace haber anunciado estas optimizaciones de rendimiento:
- Poda Top-K V2 (de disponibilidad general): Snowflake proporciona una poda precisa con microparticiones en tiempo de ejecución de consultas para sentencias SELECT con cláusulas ORDER y LIMIT. Con la poda Top-K V2, Snowflake detiene el análisis cuando determina que ninguna fila restante puede estar dentro de un conjunto de resultados que conste de registros K. Este algoritmo de poda se aplica automáticamente a consultas ORDER y LIMIT, sin coste adicional, para que los usuarios disfruten de un rendimiento y una experiencia mejores. De hecho, Top-K V2 mejora el rendimiento, de media, un 12,5 %.
- Vistas DML History y Account Usage (pronto de disponibilidad general): permiten a los clientes analizar el coste y el beneficio de la optimización de la clusterización y búsqueda para mejorar la poda, lo que les ofrece una mayor transparencia sobre el grado de eficiencia de las consultas.
- Mejoras en Query Acceleration Service (QAS): ahora, un 6 % más de consultas son compatibles con QAS con la adición de INSERT.
- Mejoras continuas de rendimiento de la clusterización (de disponibilidad general): proporcionan un ahorro de costes de un 10 %*.
Puedes ver más información sobre los avances más recientes en las notas de la versión de nuestras mejoras de rendimiento.
El SPI demuestra nuestro compromiso por mejorar constantemente la economía de nuestros clientes y ofrece transparencia sobre el impacto cuantitativo que tienen las mejoras del rendimiento de la plataforma en los workloads de producción reales de los clientes a lo largo del tiempo. Por supuesto, este índice también nos permite medir y mejorar el impacto sobre el rendimiento de las nuevas funciones, optimizaciones y opciones de cómputo para nuestros clientes. Todo para ser fieles al principal valor de Snowflake: nuestros clientes son lo primero.
Visita el sitio web del SPI para obtener más información.
* Basado en una implantación limitada del 12/02 al 01/03 de aproximadamente el 37 % de créditos de reclusterización.