Snowflake Connect: AI il 27 gennaio

Sfrutta tutto il potenziale dei dati e dell’AI con le ultime innovazioni Snowflake.

Analisi e previsioni basate su serie temporali

Esplora esempi e metodi di analisi delle serie temporali. Scopri come analizzare i dati delle serie temporali per individuare trend, pattern e insight da data set basati sul tempo.

  • Presentazione
  • Che cos’è l’analisi delle serie temporali?
  • Componenti dei dati delle serie temporali
  • Tipi di dati delle serie temporali
  • Perché utilizzare l’analisi dei dati delle serie temporali?
  • Metodi e tecniche di analisi delle serie temporali
  • Checklist per l’analisi delle serie temporali
  • Esempi e casi d’uso per l’analisi delle serie temporali
  • I vantaggi dell’analisi delle serie temporali per il successo aziendale
  • Le sfide dell’analisi delle serie temporali
  • Conclusione
  • FAQ sull’analisi delle serie temporali
  • Clienti che hanno scelto Snowflake per l’analisi dei dati
  • Risorse sull’analisi dei dati

Presentazione

L’analisi delle serie temporali è una tecnica statistica che misura una variabile a intervalli di tempo regolari, consentendo di osservare e analizzare l’evoluzione dei dati nel tempo. Puoi utilizzarla per monitorare metriche nel tempo e analizzare dati storici alla ricerca di trend. Si tratta quindi di uno strumento essenziale per numerosi casi d’uso. È ampiamente utilizzata in molti settori, in particolare in quelli che raccolgono grandi volumi di dati, come sanità, finanza, tecnologia e logistica. 

Individuando trend e correlazioni storiche, gli analisti possono utilizzare l’analisi delle serie temporali per formulare previsioni informate, ad esempio sulla domanda di prodotti o sulle esigenze di calcolo. La crescita dell’ingestion, dell’elaborazione e dell’archiviazione dei dati in quasi tutti i settori dell’economia ha ampliato il valore di questa tecnica, insieme all’introduzione di machine learning e AI. In questo articolo esploreremo in dettaglio l’analisi delle serie temporali, a cosa serve e come può contribuire a migliorare i risultati aziendali.

Che cos’è l’analisi delle serie temporali?

L’analisi delle serie temporali può sembrare semplice, ma questa apparente semplicità nasconde un’elevata flessibilità e una notevole complessità potenziale. I dati delle serie temporali sono rappresentati come una sequenza ordinata di osservazioni raccolte nel tempo a intervalli regolari. Un esempio tipico è il numero di iscrizioni a una newsletter registrate mensilmente da un’azienda nell’arco di un anno. Applicata ai dati storici, l’analisi delle serie temporali diventa particolarmente potente: estendendo l’orizzonte temporale è possibile individuare trend di lungo periodo e misurare, ad esempio, l’impatto di cambiamenti macroeconomici, politiche pubbliche o interruzioni della supply chain. 

La caratteristica distintiva di questa tecnica è il ruolo centrale del tempo, che la differenzia da approcci come l’analisi di regressione, focalizzata sulle relazioni tra variabili, o l’analisi cross-section, che osserva dati diversi in un singolo momento.

Componenti dei dati delle serie temporali

I dati delle serie temporali possono presentare caratteristiche specifiche, riconducibili ai seguenti elementi:
 

Trend

Il trend descrive la direzione generale assunta da una metrica nel tempo, se presente. Riprendendo l’esempio precedente, una crescita costante delle iscrizioni alla newsletter indicherebbe un trend positivo.
 

Stagionalità

La stagionalità indica pattern ricorrenti che si ripetono secondo cicli prevedibili e coerenti. Un esempio comune è l’aumento della spesa dei consumatori durante le festività, mentre un caso più specifico potrebbe essere l’incremento degli immobili disponibili per l’affitto il 1° e il 15 di ogni mese.
 

Modelli ciclici

I cicli rappresentano pattern di lungo periodo non associati a una stagione o a un evento specifico. Sono spesso legati a fasi di espansione e contrazione economica, che si sviluppano su orizzonti temporali estesi. Un esempio è la riduzione della spesa in software enterprise durante una recessione, e il suo aumento nei periodi di crescita economica.
 

Rumore irregolare o casuale

Il rumore include variazioni dei dati che non possono essere spiegate dagli altri elementi, come eventi una tantum o anomalie tecniche. Errori dei sensori nei macchinari o piccole fluttuazioni dei prezzi azionari di minuto in minuto ne sono esempi tipici.

Tipi di dati delle serie temporali

I dati delle serie temporali possono essere classificati in diversi modi, in base al numero di variabili, alla modalità di raccolta o alle loro proprietà statistiche. Di seguito sono riportati tre principali metodi di categorizzazione.
 

Serie temporali univariate e multivariate

Una serie temporale univariata monitora una singola metrica a intervalli regolari. Un esempio è la frequenza cardiaca, misurata in battiti al minuto (BPM). Una serie temporale multivariata analizza più metriche nello stesso intervallo temporale. Ad esempio, un ospedale può monitorare contemporaneamente la frequenza cardiaca e il livello di ossigeno nel sangue per ottenere una visione più completa dello stato di salute del paziente. 
 

Intervalli temporali regolari e irregolari

Gli intervalli regolari prevedono la registrazione dei dati con una cadenza costante, come la temperatura rilevata ogni minuto. Gli intervalli irregolari registrano eventi nel momento in cui si verificano, come l’elaborazione delle richieste da parte di un servizio cloud, che può clusterizzare più volte in una piccola finestra o non clusterizzare affatto. 
 

Serie temporali stazionarie e non stazionarie

I modelli previsionali basati su serie temporali funzionano meglio con dati stazionari, ovvero con proprietà statistiche come media e varianza relativamente costanti nel tempo. I dati non stazionari presentano variazioni dovute, ad esempio, alla stagionalità o a una maggiore volatilità. Sebbene le serie stazionarie siano più semplici da analizzare, tecniche come la differenziazione possono rendere utilizzabili anche dati non stazionari per le previsioni.

Perché utilizzare l’analisi dei dati delle serie temporali?

È possibile utilizzare le serie temporali per un’ampia gamma di obiettivi, dalla mitigazione del rischio e la disponibilità del servizio, all’analisi approfondita per ricavare informazioni sugli schemi nei dati storici.

Un uso comune consiste nel definire un valore di riferimento per un’attività, come la latenza dei servizi IT o il numero giornaliero di engagement delle campagne di marketing. L’analisi delle serie temporali consente di individuare rapidamente comportamenti anomali. Un improvviso picco di latenza può indicare la necessità di interventi di manutenzione, mentre un aumento inatteso dell’engagement può offrire insight preziosi sull’efficacia dei messaggi.

Le serie temporali supportano anche il processo decisionale strategico. Nella gestione dell’inventario, ad esempio, l’analisi della domanda storica consente di ottimizzare la supply chain e la pianificazione della produzione, migliorando la capacità di scalare prodotti e servizi in base alla domanda e ridurre i costi.

Metodi e tecniche di analisi delle serie temporali

È possibile applicare diversi metodi per estrarre insight dalle serie temporali. La scelta dipende dalle caratteristiche dei dati e dalla quantità di storico disponibile. Ecco alcuni dei metodi di analisi delle serie temporali più diffusi.
 

Medie mobili e smoothing esponenziale

Questi approcci utilizzano medie dei dati storici per attenuare le fluttuazioni. Riducendo il rumore e altre variazioni anomale, le medie mobili aiutano a evidenziare i trend di fondo. Nel caso dei prezzi azionari, una media mobile rappresenta la traiettoria complessiva del valore nel tempo, anziché le oscillazioni di breve periodo. Lo smoothing esponenziale attribuisce maggiore peso ai dati più recenti, una media che incorpora le modifiche recenti e può prevedere una tendenza che riflette lo stato attuale dei dati. 
 

Modelli ARIMA e SARIMA

Il modello ARIMA (autoregressive integrated moving average) combina autoregressione, differenziazione e media mobile per prevedere valori futuri. Combinando queste tattiche, ARIMA può utilizzare una serie temporale non stazionaria per fornire previsioni accurate, stimando il modo in cui la variabile cambierà in base alla media mobile dei dati storici. Il modello SARIMA (seasonal autoregressive integrated moving average) estende ARIMA includendo la componente stagionale e permettendo di prevedere usando dati che mostrano la stagionalità.
 

Machine learning per le previsioni basate su serie temporali

Molte organizzazioni incorporano tecniche di machine learning come reti neurali ricorrenti o modelli ad albero decisionale nei propri processi di analisi. Questi modelli possono generare previsioni più accurate e caricare volumi di dati molto maggiori. Possono inoltre automatizzare le attività di analisi più dispendiose in termini di tempo e risorse, aumentando l’efficienza operativa dell’organizzazione.

Checklist per l’analisi delle serie temporali

Anche con strumenti avanzati di machine learning, implementare con successo un’analisi delle serie temporali richiede un’attenta valutazione degli obiettivi e dei limiti del progetto. Di seguito sono riportati i cinque passaggi da seguire per avviare un nuovo progetto di analisi delle serie temporali.
 

1. Definire l’obiettivo

Avere una chiara comprensione di ciò che si intende ottenere è fondamentale non solo per valutare il successo dell’iniziativa, ma anche per comprendere i limiti del data set disponibile.
 

2. Preparare e pulire i dati

Una volta definito l’obiettivo, occorre raccogliere il data set e applicare tecniche di smoothing per pulire i dati, gestendo outlier, valori mancanti e altre anomalie.
 

3. Visualizzare ed esplorare i pattern

La rappresentazione grafica dei dati aiuta a individuare pattern ricorrenti, come stagionalità o trend generali. L’uso di una funzione di autocorrelazione (ACF) può contribuire a determinare se il data set è stazionario.
 

4. Scegliere il metodo appropriato

In base ai dati e all’obiettivo, è possibile applicare modelli ARIMA o SARIMA ai data set in cui la stagionalità è un fattore rilevante. Per data set di grandi dimensioni o analisi più complesse, può essere necessario ricorrere a tecniche di machine learning o deep learning.
 

5. Convalidare e interpretare i risultati

Diverse tecniche consentono di verificare l’accuratezza dei risultati, generalmente confrontando le previsioni con gli esiti reali man mano che si verificano. Una volta confermata l’affidabilità del modello, le previsioni possono essere utilizzate per supportare le decisioni relative agli obiettivi definiti nel passaggio n. 1. Ad esempio, per stimare come potrebbe evolvere la domanda dei consumatori nei prossimi sei mesi.

Esempi e casi d’uso per l’analisi delle serie temporali

Ogni settore dell’economia moderna utilizza forme di analisi dei dati per supportare i processi decisionali. Di seguito sono riportati alcuni dei casi d’uso più comuni dell’analisi delle serie temporali in ambito industriale.
 

Retail e ecommerce

L’analisi delle serie temporali è ampiamente utilizzata nei contesti retail, sia per monitorare l’interesse dei clienti e le attività di acquisto sia per garantire la continuità dei servizi. In ambito previsionale, molte organizzazioni integrano l’analisi delle serie temporali nelle decisioni di gestione della supply chain, utilizzando dati storici per anticipare potenziali interruzioni delle forniture e pianificare i livelli di inventario in vista di future promozioni.
 

Healthcare e Life Sciences

Le organizzazioni che operano negli ambiti sanitario e del benessere utilizzano estensivamente l’analisi delle serie temporali, applicandola a contesti che vanno dalle apparecchiature ECG alle tecnologie indossabili. Questo tipo di analisi è inoltre impiegata nella ricerca scientifica, ad esempio per analizzare grandi data set relativi a una regione o a una popolazione specifica, come il monitoraggio delle acque reflue per individuare l’aumento di determinati virus.
 

Marketing e customer analytics

L’analisi delle serie temporali rappresenta uno strumento fondamentale per monitorare le prestazioni di diverse tipologie di campagne di marketing. Consente, ad esempio, di definire un valore di riferimento per il numero di nuovi clienti acquisiti settimanalmente, da utilizzare per misurare l’impatto di nuovi messaggi, annunci o altre iniziative di marketing.

I vantaggi dell’analisi delle serie temporali per il successo aziendale

L’analisi delle serie temporali è diffusa in numerosi settori perché consente alle organizzazioni di comprendere meglio il passato, pianificare il futuro, adattarsi a condizioni di mercato in evoluzione e migliorare le prestazioni dei prodotti sulla base di dati storici. Di seguito sono illustrati alcuni dei principali vantaggi.
 

1. Precisione delle previsioni migliorata

La struttura dei metodi basati su serie temporali richiede approfondite attività di pulizia dei dati e verifiche di stabilità, rendendoli particolarmente efficaci per le previsioni. Tenendo conto di rumore, variabili mancanti e outlier, e validando le previsioni con osservazioni fuori campione, è possibile migliorare progressivamente le capacità previsionali.
 

2. Migliore pianificazione delle risorse

Fornendo previsioni accurate sulle variazioni della domanda dei consumatori, sui costi e sulle inefficienze della supply chain o sui requisiti computazionali dei sistemi IT, l’analisi delle serie temporali aiuta a ridurre gli sprechi senza compromettere prestazioni e continuità operativa.
 

3. Monitoraggio delle prestazioni in tempo reale

Oltre alle capacità previsionali, l’analisi delle serie temporali può essere utilizzata in scenari real-time, consentendo di individuare rapidamente problemi come picchi di latenza, aumenti improvvisi della domanda o altre variazioni operative.

Le sfide dell’analisi delle serie temporali

L’analisi delle serie temporali è uno degli strumenti disponibili nell’ambito dell’analisi dei dati e potrebbe non essere adatta a ogni caso d’uso. La sua efficacia dipende inoltre dalla disponibilità di dati di qualità, che non sempre sono accessibili. Ecco alcune delle sfide più comuni.
 

Qualità dei dati e valori mancanti

Indipendentemente dalla solidità dell’approccio adottato, dati incoerenti o caratterizzati da numerosi valori mancanti riducono significativamente l’accuratezza e l’utilità dei modelli di serie temporali.
 

Non stazionarietà e pattern complessi

Sebbene tecniche come la differenziazione possano rendere i data set stazionari, queste operazioni possono introdurre nuovo rumore. I modelli di analisi delle serie temporali possono inoltre incontrare difficoltà con dati complessi, ad esempio metriche caratterizzate da più pattern stagionali che variano in base all’ora, al giorno della settimana e al mese. Questa complessità rende più difficile ottenere dati stazionari e produrre previsioni accurate.
 

Scalabilità e limiti dell’elaborazione in tempo reale

Poiché le previsioni delle serie temporali si basano su dati storici, l’addestramento, il test e l’esecuzione dei modelli su data set di grandi dimensioni possono risultare complessi. Con l’aumento del volume dei dati, le operazioni possono raggiungere limiti architetturali o diventare onerose in termini di costi.

Conclusione

L’analisi delle serie temporali è una delle tecniche analitiche più preziose per le aziende, perché consente di prendere decisioni informate basate su previsioni affidabili e di individuare opportunità di efficienza e miglioramento strutturale. La crescente diffusione e maturità degli strumenti ML e AI ha reso questo approccio più efficiente e accessibile, permettendo anche ai team non tecnici di sviluppare modelli per misurare le prestazioni e migliorare le previsioni. Non sorprende, quindi, che l’analisi delle serie temporali resti uno dei principali metodi adottati dalle moderne piattaforme analitiche.

FAQ sull’analisi delle serie temporali

Di seguito sono riportate alcune delle domande più frequenti sull’analisi delle serie temporali.

L’analisi delle serie temporali indica l’analisi dei dati attuali e storici al fine di estrarre nuovi insight dai dati; ad esempio, misurando le prestazioni di una campagna di marketing rispetto alle campagne passate in base a metriche come clic, lead qualificati e altro. Le previsioni basate su serie temporali suggeriscono un modello, che utilizza i dati storici per prevedere i valori futuri della serie; ad esempio, per fornire una previsione dell’impatto di una potenziale nuova campagna di marketing sulla base dei risultati passati. Scopri come analizzare i dati delle serie temporali per individuare trend, pattern e insight da data set basati sul tempo.

Un modello previsionale è un metodo utilizzato per fare previsioni informate e accurate dei valori futuri in un data set di serie temporali. La scelta del modello corretto è una componente cruciale per il successo delle previsioni basate su serie temporali. Gli analisti prenderanno in considerazione fattori come la stazionarietà dei data set, la complessità e i loro obiettivi generali per scegliere quello migliore.

Sebbene sia uno strumento potente, l’analisi delle serie temporali potrebbe non essere ideale per ogni situazione. Molti metodi basati sulle serie temporali richiedono grandi quantità di dati storici per fornire analisi accurate, e modelli come ARIMA e SARIMA richiedono in genere un tuning significativo per fare previsioni accurate. Molti modelli non sono adeguati a gestire la complessità, come le molteplici tendenze stagionali. Alcuni di questi problemi possono essere affrontato utilizzando strumenti ML o AI, ma la quantità di pre-elaborazione dei dati può quindi portare a overfitting o altri errori.