Snowflake Connect: IA, 27 de enero

Aprovecha todo el potencial de los datos y la IA con las últimas innovaciones de Snowflake.

Análisis y previsión de series temporales

Explora métodos y ejemplos de análisis de series temporales. Aprende a analizar datos de series temporales para identificar tendencias, patrones y obtener información a partir de conjuntos de datos registrados a lo largo del tiempo.

  • Descripción general
  • ¿Qué es el análisis de series temporales?
  • Componentes de los datos de series temporales
  • Tipos de datos de series temporales
  • Por qué utilizar el análisis de datos de series temporales
  • Métodos y técnicas de análisis de series temporales
  • Lista de comprobación para el análisis de series temporales
  • Ejemplos y casos de uso del análisis de series temporales
  • Ventajas del análisis de series temporales para el éxito empresarial
  • Desafíos del análisis de series temporales
  • Conclusión
  • Preguntas frecuentes sobre el análisis de series temporales
  • Clientes que usan Snowflake para Analíticas
  • Recursos de analíticas de datos

Descripción general

El análisis de series temporales es una técnica que mide una variable a intervalos de tiempo regulares, lo que permite observar y analizar las características de esos datos. Se puede utilizar para hacer un seguimiento de métricas a lo largo del tiempo y analizar datos históricos en busca de tendencias, lo que la convierte en una herramienta indispensable para una amplia variedad de casos de uso. Se utiliza de forma generalizada en muchos sectores, especialmente en aquellos que recopilan grandes volúmenes de datos, como la sanidad, las finanzas, la tecnología y la logística. 

Al identificar tendencias históricas y correlaciones, los analistas pueden utilizar el análisis de series temporales para realizar predicciones fundamentadas sobre aspectos como la demanda de productos o las necesidades informáticas. El crecimiento de la recopilación, el procesamiento y el almacenamiento de datos en casi todos los sectores de la economía ha incrementado el valor de esta técnica, al igual que la introducción del aprendizaje automático (ML) y la inteligencia artificial (IA). En este artículo exploramos en detalle el análisis de series temporales, por qué resulta útil y cómo se puede utilizar para mejorar los resultados empresariales.

¿Qué es el análisis de series temporales?

El análisis de series temporales puede parecer engañosamente simple, lo que oculta su flexibilidad y su potencial complejidad. Todos los datos de series temporales se presentan como una colección ordenada de datos recopilados a lo largo del tiempo en intervalos uniformes. Un ejemplo sería el número de suscripciones a un boletín informativo que recibe una empresa cada mes durante un año. Puede resultar especialmente eficaz cuando se aplica a datos históricos, ya que ampliar la escala temporal de la serie permite observar tendencias a largo plazo y, por ejemplo, identificar el impacto de cambios en el entorno económico, modificaciones en las políticas públicas o interrupciones en la cadena de suministro. 

La característica que define esta técnica, como cabría esperar, es el ritmo constante del paso del tiempo, en contraste con técnicas como el análisis de regresión, que examina la relación entre variables, o el análisis transversal, que analiza distintos tipos de datos en un único momento.

Componentes de los datos de series temporales

Los datos utilizados para crear una serie temporal pueden presentar determinadas características, que pueden desglosarse en los siguientes elementos:
 

Tendencia

La tendencia describe la dirección en la que evoluciona una métrica, si existe. Siguiendo con el ejemplo anterior, podría descubrirse que las suscripciones al boletín crecen mes a mes, lo que indicaría que la tendencia es ascendente.
 

Estacionalidad

La estacionalidad describe un patrón recurrente en los datos que se repite en un ciclo, normalmente vinculado a un evento predecible y constante. Uno de los ejemplos más habituales es el aumento del gasto de los consumidores durante las vacaciones, aunque un ejemplo más específico podría ser el incremento repentino de apartamentos disponibles para alquilar los días 1 y 15 de cada mes.
 

Patrones cíclicos

Los ciclos describen patrones a largo plazo que no están definidos por una estación o un evento concreto. Suelen hacer referencia a la expansión y contracción económica, que tiende a producirse a lo largo de periodos prolongados y no está ligada a un único acontecimiento. Algunos ejemplos son la reducción del gasto en software empresarial durante una recesión y el comportamiento inverso durante un periodo de crecimiento económico.
 

Ruido irregular o aleatorio

El ruido describe puntos de datos que no pueden explicarse mediante ninguno de los otros elementos, como un problema técnico que provoca una desviación respecto a la norma, un hecho puntual u otro evento no definido. Los errores de sensores en maquinaria o las pequeñas fluctuaciones en los precios de las acciones de un minuto a otro son buenos ejemplos de ruido.

Tipos de datos de series temporales

Los datos de series temporales pueden clasificarse en distintos tipos en función del número de variables, la forma en que se recopilan los datos u otra información estadística sobre la serie temporal. A continuación se muestran tres métodos principales de categorización de los datos de series temporales.
 

Series temporales univariantes o multivariantes

Una serie temporal univariante realiza el seguimiento de una única métrica en intervalos definidos. Un ejemplo habitual son los latidos por minuto (BPM), la medida estándar de la frecuencia cardíaca de una persona. Una serie temporal multivariante utiliza el mismo intervalo, pero realiza el seguimiento de varias métricas a lo largo del tiempo. Por ejemplo, un hospital puede registrar y supervisar al mismo tiempo la frecuencia cardíaca y el nivel de oxígeno en sangre de un paciente, ya que la combinación de ambos ofrece una visión más completa de la salud circulatoria. 
 

Intervalos de tiempo regulares o irregulares

Los intervalos regulares registran valores con una cadencia temporal constante; por ejemplo, la temperatura de una habitación medida una vez por minuto. Un intervalo de tiempo irregular registra eventos discretos a medida que se producen, como el seguimiento de cada solicitud procesada por un servicio en la nube, que puede concentrarse varias veces en un breve periodo o no producirse en absoluto. 
 

Series temporales estacionarias o no estacionarias

Los modelos de previsión de series temporales se basan en datos estacionarios, en los que el rango de valores es predecible a lo largo del tiempo y no varía en sus propiedades estadísticas, como la media y la varianza. Los datos no estacionarios cambian, a menudo debido a la estacionalidad u otro tipo de volatilidad. Las series estacionarias son más fiables y fáciles de analizar que las no estacionarias, aunque técnicas estadísticas como la diferenciación pueden hacer que los datos no estacionarios sean lo suficientemente estables para la previsión.

Por qué utilizar el análisis de datos de series temporales

Las series temporales pueden utilizarse en una amplia variedad de contextos, algunos centrados en la mitigación de riesgos y la disponibilidad del servicio, y otros orientados al análisis en profundidad de datos históricos para descubrir patrones útiles.

Algunos de los casos de uso más sencillos se centran en establecer una referencia para una actividad, que puede ir desde la latencia de los servicios informáticos hasta el número de interacciones que generan las acciones de marketing cada día. Una serie temporal permite supervisar estos escenarios para detectar comportamientos anómalos. Por ejemplo, un pico anómalo de latencia puede indicar la necesidad de realizar tareas de mantenimiento de red, mientras que un aumento repentino de las interacciones de marketing puede aportar información valiosa sobre qué mensajes están funcionando mejor.

También se pueden utilizar series temporales para tomar decisiones fundamentadas. Un ejemplo habitual es la gestión del inventario. Al analizar los aumentos y descensos históricos de la demanda de los clientes, se pueden optimizar la cadena de suministro y el calendario de producción para garantizar que los productos y servicios se amplíen para satisfacer la demanda y se ajusten para maximizar el ahorro de costes.

Métodos y técnicas de análisis de series temporales

Existen diversos métodos para extraer información útil a partir del análisis de series temporales. El método elegido dependerá de las características de la serie temporal y de la disponibilidad de datos históricos. Estos son algunos de los métodos de análisis de series temporales más utilizados.
 

Medias móviles y suavizado exponencial

Ambos métodos utilizan medias de datos históricos para reducir el impacto de las fluctuaciones en una métrica. Al eliminar el ruido y otros cambios anómalos, una media móvil puede ayudar a identificar una tendencia general en los datos a lo largo del tiempo. La media móvil del precio de una acción refleja la trayectoria general de ese precio durante un periodo determinado, en lugar de cambios impredecibles al alza o a la baja. El suavizado exponencial es una técnica que da mayor peso a los datos más recientes que a los más antiguos. Esto proporciona una media que incorpora los cambios recientes y permite prever una tendencia que refleje el estado actual de los datos. 
 

Modelos ARIMA y SARIMA

El modelo autorregresivo integrado de media móvil (ARIMA) combina tres técnicas (autorregresión, diferenciación y media móvil) para prever variables futuras. Al combinar estas técnicas, ARIMA puede utilizar una serie temporal no estacionaria para ofrecer predicciones precisas, ya que estima cómo cambiará la variable en función de la media móvil de los datos históricos. SARIMA (modelo autorregresivo integrado de media móvil estacional) tiene en cuenta los cambios estacionales en los datos, lo que permite realizar previsiones a partir de datos con estacionalidad.
 

Aprendizaje automático para la previsión de series temporales

Muchas organizaciones incorporan técnicas de ML, como redes neuronales recurrentes o modelos de árboles de decisión, en sus procesos de análisis, ya que estos modelos pueden generar previsiones más precisas y procesar volúmenes de datos mucho mayores. Además, pueden automatizar los aspectos del análisis que requieren más tiempo y esfuerzo, lo que aumenta la eficiencia de la organización.

Lista de comprobación para el análisis de series temporales

Incluso con potentes herramientas de aprendizaje automático, implementar con éxito un análisis de series temporales exige tener muy en cuenta los objetivos y las limitaciones del proyecto. A continuación se describen los cinco pasos que deben seguirse al iniciar un nuevo proyecto de análisis de series temporales.
 

1. Definir el objetivo

Tener una idea clara de lo que se espera obtener es importante no solo para evaluar el éxito, sino también para comprender las limitaciones del conjunto de datos.
 

2. Preparar y limpiar los datos

Una vez que el objetivo esté claro, hay que recopilar un conjunto de datos y utilizar técnicas de suavizado para limpiarlo, abordando los valores atípicos, los valores ausentes y cualquier otro problema del conjunto de datos.
 

3. Visualizar y explorar patrones

La visualización de los datos en forma gráfica ayuda a detectar patrones comunes, como la estacionalidad o las tendencias generales. El uso de una función de autocorrelación (ACF) puede ayudar a determinar si el conjunto de datos es estacionario o no.
 

4. Elegir el método adecuado

En función de los datos y del objetivo, se puede optar por aplicar ARIMA o SARIMA a conjuntos de datos en los que la estacionalidad sea relevante. Para conjuntos de datos más grandes o análisis más complejos, puede ser necesario utilizar técnicas de ML o aprendizaje profundo para obtener resultados.
 

5. Validar e interpretar los resultados

Existen numerosas técnicas para validar si los resultados son precisos, normalmente mediante la comparación de la previsión con los resultados reales a medida que se producen. Una vez que se ha validado que el modelo predice con precisión los resultados futuros, puede utilizarse la previsión para tomar decisiones relacionadas con los objetivos definidos en el paso 1. Por ejemplo, predecir cómo podría cambiar la demanda de los consumidores en los próximos seis meses.

Ejemplos y casos de uso del análisis de series temporales

Todos los sectores de la economía moderna utilizan algún tipo de análisis de datos para fundamentar la toma de decisiones. Estos son algunos de los casos de uso más habituales del análisis de series temporales en distintos sectores:
 

Retail y comercio electrónico

El análisis de series temporales se utiliza ampliamente en contextos de retail, tanto para hacer un seguimiento del interés de los clientes y la actividad de compra como para garantizar la disponibilidad del servicio. En el ámbito de la previsión, muchas organizaciones incorporan el análisis de series temporales en sus decisiones de gestión de la cadena de suministro, utilizando datos históricos para anticiparse a posibles interrupciones en el suministro y planificar los niveles de inventario de futuras promociones de ventas.
 

Sanidad y ciencias de la vida

Las organizaciones de asistencia sanitaria y bienestar utilizan ampliamente el análisis de series temporales, ya que puede aplicarse a múltiples ámbitos, desde electrocardiógrafos hasta tecnología ponible. También se utiliza en la investigación científica, donde los investigadores pueden emplearlo para analizar grandes conjuntos de datos de una región o población concreta, como el análisis de aguas residuales para detectar aumentos de determinados virus.
 

Analíticas de marketing y de clientes

El análisis de series temporales puede ser una herramienta clave para realizar el seguimiento del rendimiento de distintos tipos de campañas de marketing. Esto permite, por ejemplo, establecer una referencia del número de nuevos clientes que se adquieren cada semana, que puede utilizarse como base para medir el impacto de nuevos mensajes, anuncios u otras iniciativas de marketing.

Ventajas del análisis de series temporales para el éxito empresarial

El análisis de series temporales es muy utilizado en muchos sectores porque permite a las organizaciones comprender mejor el pasado, planificar el futuro, adaptarse a las condiciones cambiantes del mercado y mejorar el rendimiento de los productos, todo ello a partir de datos históricos. A continuación se detallan algunos de los principales beneficios:
 

1. Mejora de la precisión de las previsiones

La estructura del método de series temporales exige una limpieza exhaustiva de los datos y comprobaciones de estabilidad, lo que contribuye a que sea un modelo especialmente útil para las previsiones. Al tener en cuenta el ruido, las variables ausentes y otros posibles valores atípicos, y al contrastar las predicciones con observaciones fuera de la muestra, es posible mejorar las capacidades de previsión.
 

2. Mejor planificación de recursos

Al proporcionar previsiones precisas sobre cambios en la demanda de los consumidores, los costes y las ineficiencias de la cadena de suministro o las exigencias computacionales de los sistemas informáticos, el análisis de series temporales ayuda a minimizar los gastos innecesarios sin afectar al rendimiento del producto ni a la disponibilidad del servicio.
 

3. Supervisión del rendimiento en tiempo real

Además de su potente capacidad de previsión, el análisis de series temporales puede utilizarse en aplicaciones en tiempo real, lo que permite detectar rápidamente problemas como picos de latencia, aumentos repentinos de la demanda u otros cambios.

Desafíos del análisis de series temporales

El análisis de series temporales es solo una herramienta dentro del conjunto de técnicas de análisis de datos y, por tanto, puede no ser el método más adecuado para todos los casos de uso. Además, su utilidad depende de disponer de datos de calidad que puedan procesarse de forma fiable, lo que no siempre es posible. Estos son algunos de los desafíos más habituales de esta disciplina.
 

Calidad de los datos y valores ausentes

Por muy bien planteado que esté el enfoque, si los datos son incoherentes o presentan un gran número de valores ausentes, la precisión y la utilidad del modelo de series temporales se verán notablemente reducidas.
 

Patrones complejos y no estacionarios

Aunque es posible convertir conjuntos de datos en estacionarios mediante técnicas como la diferenciación, esto puede generar nuevos problemas, como el ruido. Los modelos de análisis de series temporales pueden tener dificultades con datos complejos; por ejemplo, métricas con múltiples patrones estacionales que varían según la hora, el día de la semana y el mes. Debido a esta complejidad, puede resultar más difícil obtener datos estacionarios y producir previsiones precisas.
 

Limitaciones de escalabilidad y de procesamiento en tiempo real

Dado que la previsión de series temporales depende de datos históricos, puede resultar complejo ajustar, probar y ejecutar modelos de series temporales con grandes volúmenes de datos. Esto puede provocar que las operaciones alcancen sus límites arquitectónicos o que su ejecución resulte costosa a medida que crece el conjunto de datos.

Conclusión

El análisis de series temporales es una de las técnicas analíticas más valiosas para las empresas, ya que permite tomar decisiones fundamentadas basadas en previsiones precisas e identificar oportunidades de optimización de la eficiencia estructural y otras mejoras. El crecimiento y la potencia de las herramientas de ML e IA han hecho que este método sea más eficiente y accesible, permitiendo incluso a equipos no técnicos crear modelos para medir el rendimiento y mejorar las previsiones. No es de extrañar que el análisis de series temporales siga siendo uno de los principales métodos analíticos utilizados por las plataformas de analíticas modernas.

Preguntas frecuentes sobre el análisis de series temporales

Estas son algunas de las preguntas más habituales sobre el análisis de series temporales.

El análisis de series temporales consiste en analizar datos actuales e históricos para extraer nueva información; por ejemplo, medir el rendimiento de una campaña de marketing en comparación con campañas anteriores a partir de métricas como tasas de clics, clientes potenciales cualificados u otras. La previsión de series temporales plantea un modelo que utiliza datos históricos para prever valores futuros de la serie; por ejemplo, proporciona una predicción del impacto que podría tener una nueva campaña de marketing en función de su rendimiento pasado. La previsión de series temporales se considera un subconjunto del análisis de series temporales.

Un modelo de previsión es un método que se utiliza para realizar predicciones fundamentadas y precisas de los valores futuros en un conjunto de datos de series temporales. Elegir el modelo adecuado es un componente clave para el éxito de la previsión de series temporales. Los analistas tienen en cuenta factores como la estacionariedad del conjunto de datos, su complejidad y los objetivos generales para seleccionar el modelo más adecuado.

Aunque es una herramienta potente, el análisis de series temporales puede no ser el método ideal en todas las situaciones. Muchos métodos de series temporales requieren grandes volúmenes de datos históricos para ofrecer análisis precisos, y modelos como ARIMA y SARIMA suelen necesitar un ajuste considerable para generar predicciones fiables. Muchos modelos también presentan dificultades ante la complejidad, como la presencia de múltiples tendencias estacionales. Algunos de estos problemas pueden abordarse con herramientas de ML o IA, pero el volumen de preprocesamiento de datos puede dar lugar a sobreajuste u otros errores.