Data for Breakfast ao redor do mundo

Transformando IA em resultados reais para os negócios.

Análise e previsão de séries temporais explicadas

Descubra métodos e exemplos de análise de séries temporais. Saiba como analisar dados de série temporal para revelar tendências, padrões e insights a partir de conjuntos de dados baseados no tempo.

  • Visão geral
  • O que é análise de série temporal?
  • Componentes de dados de série temporal
  • Tipos de dados de séries temporais
  • Por que usar a análise de dados de série temporal?
  • Métodos e técnicas de análise de séries temporais
  • Lista de verificação de análise de série temporal
  • Exemplos e casos de uso de análises de séries temporais
  • Benefícios da análise de série temporal para o sucesso dos negócios
  • Desafios da análise de séries temporais
  • Conclusão
  • Perguntas frequentes sobre análise de séries temporais
  • Clientes que usam o Snowflake para a análise de dados
  • Recursos para análise de dados

Visão geral

A análise de série temporal é uma técnica que mede uma variável em intervalos regulares de tempo, permitindo observar e analisar as características desses dados. É possível usá-la para monitorar métricas ao longo do tempo e analisar dados históricos para identificar tendências, o que a torna uma ferramenta indispensável em diversos casos de uso. Ela tem sido largamente utilizada em muitos setores, especialmente naqueles que coletam grandes volumes de dados, como o de saúde, financeiro, de tecnologia e logística. 

Ao identificar tendências e correlações históricas, os analistas podem usar análises de séries temporais para fazer previsões treinadas sobre fatores como demanda de produto ou necessidades de processamento. Em quase todos os setores da economia, o aumento do volume de processamento, armazenagem e coleta de dados ampliou o poder dessa técnica, assim como o surgimento do aprendizado de máquina e da IA. Neste artigo, veremos a análise de séries temporais em detalhes, o que a torna útil e como é possível usá-la para melhorar os resultados dos negócios.

O que é análise de série temporal?

O conceito de análise de séries temporais soa erradamente simples, o que esconde sua flexibilidade e potencial complexidade. Todos os dados de uma série temporal são apresentados como um conjunto ordenado de dados capturados ao longo do tempo em intervalos separados de maneira uniforme. Um exemplo é o número de newsletters que uma empresa recebe ao mês durante o período de um ano. A análise pode ser especialmente eficaz quando aplicada a dados históricos, pois estender a escala de tempo em série permite observar as tendências de longo prazo e, por exemplo, identificar os efeitos que têm as mudanças em cenários econômicos adversos, mudanças nas políticas públicas ou interrupções na cadeia de fornecedores. 

Conforme esperado, a característica fundamental dessa técnica é a constante de tempo, em contraste a outras técnicas como análise de regressão (que examina a relação entre as variáveis) ou análise transversal (que examina vários tipos de dados em um único momento do tempo).

Componentes de dados de série temporal

Os dados que você usa para criar a série temporal podem exibir algumas características, que podem ser classificadas nos seguintes elementos:

Tendência

A tendência representa a direção na qual a métrica está indo, se houver. Continuando no nosso exemplo anterior, você pode ver se as inscrições em newsletters estão aumentando mês após mês, o que significa que a tendência de inscrições está aumentando.

Sazonalidade

A sazonalidade descreve um padrão recorrente nos dados que acontece em algum ciclo, geralmente vinculado a um evento previsível e consistente. Um dos exemplos mais comuns é o aumento dos gastos do consumidor no período de férias, mas um exemplo mais granular pode ser o aumento súbito do número de apartamentos disponíveis para alugar nos primeiros quinze dias de cada mês.

Padrões cíclicos

Os ciclos descrevem padrões de longo prazo que não são definidos por uma determinada estação ou evento. Frequentemente, os ciclos referem-se à expansão e à contração econômicas, que tendem a ocorrer ao longo de longos períodos de tempo e não estão vinculados a um evento ou ocorrência. Exemplos são a redução dos gastos com software corporativo durante uma recessão e o contrário durante um período de crescimento econômico.

Ruídos irregulares ou aleatórios

O ruído é a descrição de pontos de dados que não podem ser explicados por qualquer um dos outros elementos, como um problema técnico que causa um desvio da norma, uma ocorrência única ou outro evento não definido. Erros de sensores em equipamentos de máquinas ou pequenas flutuações nos preços de ações de um minuto a outro são bons exemplos de ruídos.

Tipos de dados de séries temporais

Dados de séries temporais podem ser classificados em vários tipos: com base no número de variáveis, na forma de coleta desses dados ou em outras informações estatísticas sobre a série temporal. Veja, a seguir, três principais métodos de categorização dos dados de série temporal.

Séries temporais univariadas vs. multivariadas

Uma série temporal univariada rastreia uma única métrica em intervalos definidos. Um exemplo comum são os batimentos por minuto (BPM), que é a medida padrão da frequência cardíaca de uma pessoa. Uma série temporal multivariada usa o mesmo intervalo, mas rastreia várias métricas ao longo do período. Por exemplo, um hospital pode coletar e controlar a frequência cardíaca e o nível de oxigênio no sangue de um paciente ao mesmo tempo, pois a combinação desses dados dá uma visão mais completa da saúde do sistema circulatório do paciente. 

Intervalos de tempo regulares vs. irregulares

Intervalos regulares são valores registrados em um ritmo de tempo consistente. Por exemplo, a temperatura em uma sala é registrada uma vez por minuto. Um intervalo de tempo irregular registra eventos distintos à medida que eles ocorrem, como o monitoramento de cada vez que um serviço de nuvem processa uma solicitação, que pode ser agrupados em clusters várias vezes em uma pequena janela ou não. 

Série temporal estacionária vs. não estacionária

Os modelos de previsão de séries temporais dependem de dados estacionários, onde o intervalo de dados é previsível com o tempo e não varia de suas propriedades estatísticas, como média e variância. Mudanças de dados não estacionários, muitas vezes acontecem por motivos de sazonalidade ou de alguma outra volatilidade. As séries estacionárias são mais confiáveis e mais fáceis de analisar do que as não estacionárias, embora técnicas estatísticas como o diferencial possam tornar os dados não estacionários estáveis o suficiente para a previsão.

Por que usar a análise de dados de série temporal?

É possível usar séries temporais de formas imensamente variadas, algumas voltadas para a redução de riscos e tempo de recuperação da atividade do serviço, e outras voltadas para análise aprofundada de dados históricos para descobrir padrões úteis.

Alguns dos casos de uso mais simples têm como foco definir um padrão de referência para uma certa atividade, o que pode ser qualquer coisa, desde a latência de serviços de TI até o número de interações que suas iniciativas de marketing atraem todos os dias. Uma série temporal permitiria monitorar esses casos em busca de comportamentos anômalos. Por exemplo, um aumento exagerado da latência pode significar que é necessária alguma manutenção de rede, enquanto um aumento súbito do engajamento de marketing poderia fornecer insights valiosos sobre que mensagens estão funcionando melhor.

Você também pode usar as séries temporais para tomar decisões mais informadas. Um exemplo comum disso é usado na gestão de estoque. Ao analisar o histórico de aumento e redução na demanda dos clientes, você pode otimizar sua cadeia de fornecedores e o horário de produção para garantir que a escala de produção de seus produtos e serviços possa ser ajustada para atender a um aumento de demanda e reduzida para maximizar a redução de custos.

Métodos e técnicas de análise de séries temporais

É possível usar vários métodos diferentes para obter insights úteis a partir de uma análise de séries temporais. O método escolhido vai depender das propriedades de série temporal e da disponibilidade de dados históricos. Confira a seguir alguns dos métodos mais populares de análise de séries temporais.

Médias móveis e suavização exponencial

Esses métodos usam médias históricas de dados para reduzir o impacto das flutuações em uma métrica. Ao eliminar o ruído e outras alterações muito atípicas, uma média móvel pode ajudar você a identificar uma tendência geral nos dados ao longo do tempo. A média móvel do preço de um produto em estoque vai capturar a trajetória geral desse preço durante um certo período de tempo, em vez de mudanças imprevisíveis de aumento ou redução. Suavização exponencial é uma técnica que prefere dados recentes em vez de dados antigos. Dessa forma, você obtém uma média que incorpora mudanças recentes e pode prever uma tendência que reflete o estado atual dos dados.

Modelos ARIMA e SARIMA

A média móvel integrada autorregressiva (autoregressive integrated moving average, ARIMA) combina três técnicas, autorregressão, diferencial e média móvel, para prever variáveis futuras. Ao combinar essas táticas, a ARIMA pode usar uma série temporal não estacionária para fornecer previsões precisas, estimando a forma como a variável mudará com base na média móvel dos dados históricos. A média móvel integrada autorregressiva sazonal (seasonal autoregressive integrated moving average, SARIMA) refere as mudanças sazonais nos dados, permitindo fazer previsões usando dados que mostram sazonalidade.

Aprendizado de máquina para previsão de séries temporais

Muitas organizações incorporam técnicas de aprendizado de máquina (machine learning, ML) ao processo de análise, como redes neurais recorrentes ou modelos de árvore de decisão, pois esses modelos podem gerar previsões mais precisas e ingerir volumes muito maiores de dados. Elas também podem automatizar os aspectos de análise que exigem muito tempo e esforço, aumentando a eficiência organizacional.

Lista de verificação de análise de série temporal

Mesmo com ferramentas avançadas de aprendizado de máquina, implementar com sucesso uma análise de série temporal significa avaliar cuidadosamente os objetivos e as limitações do seu projeto. Confira aqui as cinco etapas para adotar ao iniciar um novo projeto de análise de séries temporais.

1. Definir o objetivo

Ter uma ideia clara do que você quer aprender é importante não apenas para avaliar o sucesso, mas também para entender as limitações do seu conjunto de dados.

2. Preparar e limpar os dados

Assim que seu objetivo estiver claro, reúna um conjunto de dados e use técnicas de “suavização” para limpá-lo, eliminando valores atípicos, valores de dados perdidos e quaisquer outros problemas no conjunto de dados.

3. Visualizar e explorar padrões

Visualizar os dados na forma gráfica ajuda a detectar quaisquer padrões comuns, como sazonalidade ou tendências gerais. Usar uma função de autocorrelação (autocorrelation function, ACF) pode ajudar a determinar se o conjunto de dados é estável ou não.

4. Escolher o método certo

Dependendo dos dados e do seu objetivo, você pode optar por aplicar métodos ARIMA ou SARIMA a conjuntos de dados em que a sazonalidade seja relevante para o seu objetivo específico. Para conjuntos de dados maiores ou análises de dados mais complexas, talvez você precise usar uma técnica de ML ou aprendizado profundo para obter resultados.

5. Validar e interpretar os resultados

Inúmeras técnicas permitem validar se os resultados são precisos, normalmente envolvendo a comparação do resultado da previsão com resultados em tempo real. Depois de validar se o seu modelo está prevendo resultados futuros com precisão, você pode usar essa capacidade de previsão para tomar decisões sobre seus objetivos descritos na etapa 1. Por exemplo, prever como a demanda do consumidor pode mudar nos próximos seis meses.

Exemplos e casos de uso para análise de séries temporais

De alguma forma, todos os setores da economia moderna usam a análise de dados para fundamentar seus processos decisórios. Estes são alguns dos casos práticos de uso mais comuns de análise de séries temporais:

Varejo e comércio eletrônico:

Há um grande uso de análise de séries temporais em contextos de varejo, tanto para monitorar o interesse e as atividades de compra dos clientes quanto para garantir o tempo de atividade do serviço. No lado da previsão, muitas organizações incorporam análise de séries temporais às suas decisões de gestão da cadeia de fornecedores, usando dados históricos para lidar com possíveis interrupções de abastecimento e planejar níveis de estoque para futuras promoções de vendas.

Saúde

As organizações de saúde e bem-estar usam extensivamente a análise de séries temporais, pois ela pode ser aplicada a tudo, desde máquinas de eletrocardiograma (ECG) até tecnologia vestível. Ela também tem uso em pesquisa científica, onde os pesquisadores podem usá-la para analisar grandes conjuntos de dados de uma região ou população fixa, como testes de esgoto para detectar aumentos em certos vírus.

Análise de dados de marketing e de clientes

A análise de séries temporais pode ser uma ferramenta indispensável para monitorar o desempenho de diferentes tipos de campanhas de marketing. Isso permite, por exemplo, estabelecer um padrão de referência de quantos novos clientes você consegue por semana, que pode ser usado como um padrão para medir o impacto de novas mensagens, anúncios ou outros esforços de marketing.

Benefícios da análise de série temporal para o sucesso dos negócios

A análise de séries temporais é popular em muitos setores, pois permite que as organizações entendam melhor o passado, planejem o futuro, se ajustem às condições do mercado em constante mudança e melhorem o desempenho do produto, tudo baseado em dados históricos. Veja, a seguir, alguns dos principais benefícios em mais detalhes:

1. Previsão mais precisa

A estrutura do método de série temporal requer extensas verificações de estabilidade e limpeza de dados, o que faz dele um modelo tão útil para a previsão. Ao levar em conta o ruído, as variáveis ausentes e outros valores atípicos e testar previsões com base em observações fora da amostra, você pode criar e melhorar seus recursos de previsão.

2. Melhor planejamento de recursos

Ao fornecer uma previsão mais exata das mudanças na demanda do consumidor, dos custos e ineficiências da cadeia de fornecedores ou das necessidades computacionais dos sistemas de TI, a análise de séries temporais pode ajudar você a minimizar o desperdício sem reduzir o desempenho e o tempo de atividade do produto.

3. Monitoramento de desempenho praticamente em tempo real

Além do imenso potencial de previsão, é possível usar a análise de séries temporais para aplicações quase em tempo real, permitindo detectar com rapidez problemas, como picos de latência, aumentos bruscos de demanda ou outras mudanças.

Desafios da análise de séries temporais

A análise de séries temporais é apenas um instrumento na caixa de ferramentas de análise de dados e, como tal, pode não ser o método perfeito para cada caso de uso. Além disso, sua utilidade depende de ter dados de qualidade que possam ser processados com sucesso para obter confiabilidade, o que nem sempre pode estar disponível. Confira a seguir alguns dos desafios mais comuns da disciplina.

Valores ausentes e qualidade dos dados

Se os dados forem inconsistentes ou com um grande número de valores ausentes, isso reduzirá bastante a precisão e a utilidade do seu modelo de série temporal.

Padrões complexos e não estacionários

Embora seja possível tornar os conjuntos de dados estacionários com técnicas como diferenciação, isso pode criar novos problemas, como ruídos. Os modelos de análise de séries temporais podem, por vezes, lidar com dados complexos, como uma métrica com vários padrões sazonais, que varia de acordo com a hora, o dia da semana e o mês. Essa dificuldade pode tornar mais difícil a fixação dos dados e a criação de uma previsão precisa.

Limitações de processamento em tempo real e escalabilidade

Como a previsão de séries temporais depende dos dados históricos, pode ser trabalhoso ajustar, testar e executar modelos de séries temporais usando grandes conjuntos de dados. Isso pode fazer com que suas operações utilizem todo o limite da arquitetura ou se tornem caras de executar, conforme o tamanho do conjunto de dados aumenta.

Conclusão

A análise de séries temporais é uma das técnicas analíticas mais valiosas disponíveis para a empresa. Ela permite fazer escolhas informadas com base em previsões precisas e identificar oportunidades de eficiência e melhoria estruturais. Graças ao desenvolvimento e ao poder das ferramentas de ML e de IA, esse método tornou-se mais eficiente e acessível, permitindo que até equipes não técnicas criem modelos para medir o desempenho e melhorar as previsões. Não é surpresa que a análise de séries temporais continue sendo um dos principais métodos analíticos usados pelas modernas plataformas de análise de dados.

Perguntas frequentes sobre análise de séries temporais

Estas são algumas das perguntas mais comuns que as pessoas têm sobre análise de séries temporais.

A análise de série temporal refere-se à análise de dados atuais e históricos para obter novos insights sobre eles, por exemplo, medindo o desempenho de uma campanha de marketing em relação a campanhas anteriores com base em métricas como cliques, leads qualificados e outras. A previsão de séries temporais sugere um modelo, que usa dados históricos para prever valores futuros da série, por exemplo, fornecendo uma previsão do possível impacto de uma nova campanha de marketing com base no desempenho passado. A previsão de séries temporais é considerada um subconjunto de análise de séries temporais.

Um modelo de previsão é um método usado para fazer previsões fundamentadas e precisas de valores futuros em um conjunto de dados de séries temporais. Escolher o modelo certo é um componente crucial para ter sucesso na previsão de séries temporais. Para escolher o melhor modelo, os analistas precisam considerar fatores como estacionaridade, complexidade e objetivos gerais do conjunto de dados.

Embora seja uma ferramenta eficaz, a análise de séries temporais pode não ser a ferramenta ideal para todas as situações. Muitos métodos de série temporal requerem grandes quantidades de dados históricos para fornecer análises precisas, e modelos como ARIMA e SARIMA, em geral, exigem ajustes significativos para realizar previsões precisas. Muitos modelos também lidam com complexidade, como várias tendências sazonais. É possível lidar com alguns desses problemas usando ferramentas de ML ou IA, mas a quantidade de pré-processamento de dados pode levar a ajustes indevidos ou outros erros.