Webinar am 17. Februar

Snowflake & SAP: Unlock the Power of Your Data to Unleash Enterprise Ready AI

Zeitreihenanalyse und -prognose erläutert

Entdecken Sie Methoden und Beispiele zur Zeitreihenanalyse. Erfahren Sie, wie Sie Zeitreihendaten analysieren können, um Trends, Muster und Erkenntnisse aus zeitbasierten Datasets zu gewinnen.

  • Übersicht
  • Was ist Zeitreihenanalyse?
  • Komponenten von Zeitreihendaten
  • Arten von Zeitreihendaten
  • Warum sollten Sie die Datenanalyse von Zeitreihen nutzen?
  • Methoden und Techniken zur Zeitreihenanalyse
  • Checkliste zur Zeitreihenanalyse
  • Beispiele und Anwendungsfälle für die Zeitreihenanalyse
  • Vorteile der Zeitreihenanalyse für den Geschäftserfolg
  • Herausforderungen der Zeitreihenanalyse
  • Fazit
  • FAQ zur Zeitreihenanalyse
  • Kunden, die Snowflake für Analytics nutzen
  • Ressourcen zu Data Analytics

Übersicht

Bei der Zeitreihenanalyse handelt es sich um eine Methode, die eine Variable in regelmäßigen Zeitabständen misst und es Ihnen ermöglicht, die Eigenschaften dieser Daten zu beobachten und zu analysieren. Mit ihr können Sie Kennzahlen im Zeitverlauf verfolgen und historische Daten auf Trends analysieren, was sie zu einem unverzichtbaren Tool in einer Reihe verschiedener Anwendungsfälle macht. Sie wird in zahlreichen Branchen eingesetzt, insbesondere in Branchen, die große Datenmengen erfassen, wie Gesundheitswesen, Finanzen, Technologie und Logistik. 

Durch die Identifizierung historischer Trends und Korrelationen können Analyst:innen mithilfe von Zeitreihenanalysen aussagekräftige Vorhersagen über Produktnachfrage oder Rechenanforderungen treffen. Das Wachstum bei der Datenerfassung, -verarbeitung und -speicherung in nahezu jedem Wirtschaftssektor hat die Leistungsfähigkeit dieser Technik erhöht, ebenso wie die Einführung von maschinellem Lernen und KI. In diesem Artikel untersuchen wir die Details der Zeitreihenanalyse, was sie nützlich macht und wie Sie sie zur Verbesserung der Geschäftsergebnisse einsetzen können.

Was ist Zeitreihenanalyse?

Die Analyse von Zeitreihen klingt täuschend einfach, was über ihre Flexibilität und potenzielle Komplexität hinwegtäuscht. Alle Zeitreihendaten werden als geordnete Erfassung von Daten dargestellt, die im Zeitverlauf in gleichmäßigen Abständen erfasst werden. Ein Beispiel ist die Anzahl der Newsletter-Anmeldungen, die ein Unternehmen monatlich über einen Zeitraum von einem Jahr erhält. Sie kann besonders wirkungsvoll sein, wenn sie auf historische Daten angewendet wird, da Sie durch die Verlängerung des Zeitrahmens der Reihe langfristige Trends beobachten und beispielsweise die Auswirkungen von sich verändernden wirtschaftlichen Gegenwinden, behördlichen Veränderungen oder Lieferkettenstörungen abschätzen können. 

Das entscheidende Merkmal dieser Technik ist – wie zu erwarten – der konstante Trommelschlag der Zeit – im Gegensatz zu Techniken wie der Regressionsanalyse, bei der die Beziehung zwischen Variablen untersucht wird, oder der Querschnittsanalyse, bei der verschiedene Datentypen zu einem einzigen Zeitpunkt betrachtet werden.

Komponenten von Zeitreihendaten

Die Daten, mit denen Sie die Zeitreihe erstellen, können bestimmte Merkmale aufweisen, die sich in folgende Elemente unterteilen lassen:
 

Trend

Der Trend beschreibt die Richtung, in die sich die Kennzahl bewegt, sofern vorhanden. Um unser vorheriges Beispiel fortzusetzen, könnten Sie feststellen, dass Ihre Newsletter-Anmeldungen von Monat zu Monat wachsen, was bedeuten würde, dass der Trend bei den Anmeldungen steigt.
 

Saisonalität

Saisonalität beschreibt ein wiederkehrendes Muster in den Daten, das in einem bestimmten Zyklus auftritt und in der Regel an ein vorhersehbares und konsistentes Ereignis gebunden ist. Eines der häufigsten Beispiele ist der Anstieg der Verbraucherausgaben in der Weihnachtszeit, aber ein detaillierteres Beispiel könnte der plötzliche Anstieg der Wohnungen sein, die am 1. und 15. eines jeden Monats vermietet werden können.
 

Zyklische Muster

Zyklen beschreiben langfristige Muster, die nicht durch eine bestimmte Jahreszeit oder ein bestimmtes Ereignis definiert sind. Zyklen beziehen sich oft auf wirtschaftliche Expansion und Kontraktion, was in der Regel über lange Zeiträume geschieht und nicht an ein Ereignis oder Vorkommnis gebunden ist. Beispiele wären die Verringerung der Ausgaben für Unternehmenssoftware während einer Rezession und die Umkehrung während einer Phase des Wirtschaftswachstums.
 

Unregelmäßiges oder zufälliges Rauschen

Rauschen beschreibt Datenpunkte, die durch keine der anderen Elemente erklärt werden können, wie z. B. ein technisches Problem, das eine Abweichung von der Norm verursacht, ein einmaliges Ereignis oder ein anderes undefiniertes Ereignis. Sensorfehler in Maschinenanlagen oder kleine Schwankungen der Lagerpreise von Minute zu Minute sind gute Beispiele für Rauschen.

Arten von Zeitreihendaten

Zeitreihendaten können in verschiedene Arten eingeteilt werden, basierend auf der Anzahl der Variablen, der Art und Weise, wie die Daten erfasst werden, oder anderen statistischen Informationen über die Zeitreihe. Im Folgenden stellen wir drei wichtige Kategorisierungsmethoden für Zeitreihendaten vor.
 

Univariate vs. multivariate Zeitreihen

Eine univariate Zeitreihe verfolgt eine einzelne Kennzahl in festgelegten Abständen. Ein gängiges Beispiel wären Schläge pro Minute (BPM), die das Standardmaß für die Herzfrequenz einer Person sind. Eine multivariate Zeitreihe verwendet dasselbe Intervall, verfolgt aber mehrere Metriken über den Zeitraum. Ein Krankenhaus kann beispielsweise die Herzfrequenz und den Blutsauerstoffgehalt eines Patienten gleichzeitig erfassen und verfolgen, da eine Kombination dieser beiden einen umfassenderen Überblick über die Kreislaufgesundheit bietet. 
 

Regelmäßige vs. unregelmäßige Zeitintervalle

Regelmäßige Intervalle sind ein Wert, der in einem konstanten Zeittakt aufgezeichnet wird; beispielsweise die Temperatur in einem Raum, die einmal pro Minute aufgezeichnet wird. Ein unregelmäßiges Zeitintervall zeichnet einzelne Ereignisse auf, wie z. B. die Nachverfolgung jedes Mal, wenn ein Cloud-Dienst eine Anfrage verarbeitet, die sich in einem kleinen Fenster mehrfach oder gar nicht clustern kann. 
 

Stationäre vs. nichtstationäre Zeitreihen

Zeitreihenprognosemodelle basieren auf stationären Daten, wobei der Datenbereich zeitlich vorhersehbar ist und nicht von seinen statistischen Eigenschaften wie Mittelwert und Varianz abweicht. Instationäre Daten ändern sich, oft saisonal oder aufgrund anderer Volatilität. Stationäre Datenreihen sind zuverlässiger und einfacher zu analysieren als nichtstationäre, obwohl statistische Methoden wie die Differenzenbildung nichtstationäre Daten stabil genug für Prognosen machen können.

Warum sollten Sie die Datenanalyse von Zeitreihen nutzen?

Sie können Zeitreihen in einer Vielzahl verschiedener Kapazitäten nutzen, wobei sich einige auf Risikominderung und Serviceverfügbarkeit konzentrieren und andere auf die tiefgreifende Analyse historischer Daten, um nützliche Muster aufzudecken.

Einige der einfacheren Anwendungsfälle konzentrieren sich auf die Festlegung einer Baseline für eine Aktivität, die von der Latenzzeit von IT-Diensten bis hin zur Anzahl der Interaktionen, die Ihre Marketingaktivitäten täglich erzielen, reichen kann. Mit einer Zeitreihe können Sie diese Fälle auf anomales Verhalten überwachen. Ein Beispiel dafür ist eine plötzliche Zunahme der Latenzzeit, was bedeuten kann, dass ein Netzwerk gewartet werden muss. Gleichzeitig könnte ein plötzlicher Anstieg des Marketingengagements wertvolle Erkenntnisse darüber liefern, welche Botschaften am besten funktionieren.

Sie können auch Zeitreihen nutzen, um fundierte Entscheidungen zu treffen. Ein beliebtes Beispiel hierfür ist das Bestandsmanagement. Durch die Analyse historischer Zunahmen und Abnahmen der Kundennachfrage können Sie Ihre Lieferkette und Ihren Produktionsplan optimieren, um sicherzustellen, dass Ihre Produkte und Dienstleistungen je nach Nachfrage hochskaliert und herunterskaliert werden können, um Kosteneinsparungen zu maximieren.

Methoden und Techniken zur Zeitreihenanalyse

Sie können verschiedene Methoden nutzen, um nützliche Erkenntnisse aus einer Zeitreihenanalyse zu gewinnen. Für welche Methode Sie sich entscheiden, hängt von den Eigenschaften der Zeitreihe und der Verfügbarkeit historischer Daten ab. Hier einige der beliebtesten Zeitreihenanalysemethoden.
 

Gleitender Durchschnitt und exponentielle Glättung

Beide Methoden nutzen Durchschnittswerte historischer Daten, um die Auswirkungen von Schwankungen in einer Kennzahl zu reduzieren. Ein gleitender Durchschnitt kann Ihnen helfen, einen allgemeinen Datentrend im Laufe der Zeit aufzudecken, indem er Rauschen und andere aberrante Änderungen entfernt. Der gleitende Durchschnitt eines Aktienkurses erfasst die Gesamtkurve dieses Kurses über einen bestimmten Zeitraum, anstatt sich unvorhersehbar nach oben oder unten zu verändern. Exponentielle Glättung ist eine Technik, die aktuelle Daten gegenüber älteren bevorzugt. So erhalten Sie einen Durchschnitt, der aktuelle Änderungen berücksichtigt und einen Trend prognostizieren kann, der den aktuellen Stand der Daten widerspiegelt. 
 

ARIMA- und SARIMA-Modelle

Autoregressiver integrierter gleitender Durchschnitt (Autoregression, Differenzenbildung und gleitender Durchschnitt) kombiniert drei Techniken, um künftige Variablen vorherzusagen. Durch die Kombination dieser Taktiken kann ARIMA eine instationäre Zeitreihe nutzen, um genaue Vorhersagen zu treffen und die Art und Weise zu schätzen, wie sich die Variable auf der Grundlage des gleitenden Durchschnitts historischer Daten verändern wird. SARIMA (saisonaler autoregressiver integrierter gleitender Durchschnitt) berücksichtigt saisonale Änderungen in den Daten, sodass Sie Prognosen anhand von Daten erstellen können, die die Saisonalität zeigen.
 

Maschinelles Lernen für Zeitreihenprognosen

Viele Unternehmen integrieren ML-Techniken wie rekurrente neuronale Netze oder Entscheidungsbaummodelle in ihren Analyseprozess, da diese Modelle genauere Prognosen erstellen und viel größere Datenmengen erfassen können. Darüber hinaus können sie die zeit- und arbeitsintensiven Aspekte der Analyse automatisieren und so die organisatorische Effizienz steigern.

Checkliste zur Zeitreihenanalyse

Selbst mit leistungsstarken ML-Tools bedeutet die erfolgreiche Implementierung einer Zeitreihenanalyse eine sorgfältige Abwägung der Ziele und Grenzen Ihres Projekts. Im Folgenden haben wir fünf Schritte zusammengefasst, die Sie ergreifen sollten, wenn Sie mit einem neuen Zeitreihenanalyseprojekt beginnen.
 

1. Ziel definieren

Eine klare Vorstellung davon zu haben, was Sie lernen wollen, ist nicht nur wichtig, um den Erfolg zu bewerten, sondern auch, um die Grenzen Ihres Datasets zu verstehen.
 

2. Daten vorbereiten und bereinigen

Sobald Ihr Ziel klar ist, erfassen Sie ein Dataset und wenden Sie Glättungstechniken an, um es zu bereinigen. So können Sie Ausreißer, fehlende Datenwerte und andere Probleme im Dataset beheben.
 

3. Muster visualisieren und untersuchen

Indem Sie die Daten in grafischer Form visualisieren, können Sie alle gängigen Muster erkennen, wie z. B. Saisonalität oder allgemeine Trends. Mithilfe einer Autokorrelationsfunktion (ACF) können Sie feststellen, ob das Dataset stationär ist oder nicht.
 

4. Die richtige Methode wählen

Je nach Daten und Ziel können Sie ARIMA oder SARIMA auf Datasets anwenden, bei denen die Saisonalität für Ihr jeweiliges Ziel relevant ist. Für größere Datasets oder komplexere Datenanalysen benötigen Sie möglicherweise eine ML- oder Deep-Learning-Technik, um Ergebnisse zu erzielen.
 

5. Ergebnisse validieren und interpretieren

Zahlreiche Techniken ermöglichen es Ihnen, zu validieren, ob Ihre Ergebnisse korrekt sind. In der Regel werden die Ergebnisse der Prognose mit den tatsächlichen Ergebnissen verglichen. Sobald Sie überprüft haben, ob Ihr Modell zukünftige Ergebnisse genau vorhersagt, können Sie anhand der Prognose Entscheidungen über Ihre in Schritt 1 beschriebenen Ziele treffen. Zum Beispiel Prognosen darüber, wie sich die Verbrauchernachfrage in den nächsten sechs Monaten verändern könnte.

Beispiele und Anwendungsfälle für die Zeitreihenanalyse

Jeder Sektor der modernen Wirtschaft nutzt Datenanalysen, um fundierte Entscheidungen zu treffen. Hier einige der häufigsten industriellen Anwendungsfälle für die Zeitreihenanalyse:
 

Handel und E-Commerce

Die Zeitreihenanalyse sieht in Handelskontexten einen erheblichen Nutzen, sowohl für die Nachverfolgung von Kundeninteresse und Kaufaktivität als auch für die Gewährleistung von Serviceverfügbarkeit. Auf der Prognoseseite integrieren viele Unternehmen Zeitreihenanalysen in ihre Entscheidungen im Supply-Chain-Management, indem sie historische Daten nutzen, um mögliche Versorgungsunterbrechungen zu umgehen und Lagerbestände für anstehende Verkaufsaktionen zu planen.
 

Gesundheitswesen und Life Sciences

Gesundheits- und Wellnessunternehmen nutzen die Zeitreihenanalyse umfassend, da sie sich auf alles anwenden lässt, von EKG-Geräten bis hin zu Wearables. Auch in der wissenschaftlichen Forschung können Forschende damit große Datasets aus einer Region oder einer festen Population analysieren, z. B. Abwassertests auf Zunahmen bestimmter Viren.
 

Marketing und Kundenanalytik

Die Analyse von Zeitreihen kann ein wichtiges Werkzeug sein, um die Performance verschiedener Arten von Marketingkampagnen zu verfolgen. So können Sie beispielsweise eine Baseline festlegen, wie viele neue Kund:innen Sie jede Woche erhalten. Diese Baseline kann als Vergleichswert verwendet werden, um die Auswirkungen neuer Botschaften, Anzeigen oder anderer Marketingmaßnahmen zu messen.

Vorteile der Zeitreihenanalyse für den Geschäftserfolg

Zeitreihenanalysen sind in vielen Branchen beliebt, da sie es Unternehmen ermöglichen, die Vergangenheit besser zu verstehen, für die Zukunft zu planen, sich auf veränderte Marktbedingungen einzustellen und die Produktleistung zu verbessern – alles auf der Grundlage historischer Daten. Hier einige wichtige Vorteile im Detail:
 

1. Verbesserte Prognosegenauigkeit

Die Struktur der Zeitreihenmethode erfordert umfassende Datenbereinigungen und Stabilitätsprüfungen, was sie zu einem so nützlichen Modell für Prognosen macht. Indem Sie Rauschen, fehlende Variablen und andere potenzielle Ausreißer berücksichtigen und Prognosen anhand von Beobachtungen außerhalb der Stichprobe testen, können Sie Ihre Prognosefunktionen verbessern.
 

2. Bessere Ressourcenplanung

Durch die genaue Prognose von Änderungen der Verbrauchernachfrage, Lieferkettenkosten und Ineffizienzen oder des Rechenaufwands von IT-Systemen kann die Zeitreihenanalyse Ihnen dabei helfen, Verschwendung zu minimieren, ohne die Produktleistung und -verfügbarkeit zu beeinträchtigen.
 

3. Echtzeit-Performance-Überwachung

Neben leistungsstarkem Prognosepotenzial können Sie Zeitreihenanalysen für Echtzeitanwendungen nutzen, um Probleme wie Latenzspitzen, plötzliche Nachfragesteigerungen oder andere Änderungen schnell zu erkennen.

Herausforderungen der Zeitreihenanalyse

Die Zeitreihenanalyse ist nur ein Tool im Werkzeugkasten der Datenanalyse – und daher möglicherweise nicht für jeden einzelnen Anwendungsfall die perfekte Methode. Darüber hinaus beruht ihr Nutzen auf Qualitätsdaten, die aus Zuverlässigkeitsgründen erfolgreich verarbeitet werden können und die möglicherweise nicht immer verfügbar sind. Hier einige der häufigsten Herausforderungen in dieser Disziplin.
 

Datenqualität und fehlende Werte

Unabhängig davon, wie durchdacht Ihr Ansatz ist: Wenn Ihre Daten inkonsistent sind oder eine große Anzahl fehlender Werte aufweisen, wird die Genauigkeit und Brauchbarkeit Ihres Zeitreihenmodells erheblich reduziert.
 

Instationarität und komplexe Muster

Zwar können Sie Datasets mit Methoden wie Differenzenbildung stationär ausführen, doch das kann zu neuen Problemen wie Rauschen führen. Zeitreihenanalysemodelle können manchmal mit komplexen Daten zu kämpfen haben – beispielsweise mit Metriken mit mehreren saisonalen Mustern, die sich je nach Stunde, Wochentag und Monat ändern. Diese Komplexität kann es schwierig machen, die Daten stationär bereitzustellen und eine genaue Prognose zu erstellen.
 

Skalierbarkeit und Einschränkungen bei der Echtzeitverarbeitung

Da Zeitreihenprognosen von historischen Daten abhängen, kann es umständlich sein, Zeitreihenmodelle mithilfe großer Datasets anzupassen, zu testen und auszuführen. Das kann bedeuten, dass Ihre Operationen an architektonische Grenzen stoßen oder mit zunehmender Größe des Datasets teuer in der Ausführung werden.

Fazit

Die Zeitreihenanalyse ist eine der wichtigsten Analysemethoden, die Unternehmen zur Verfügung stehen. Sie ermöglicht es Ihnen, fundierte Entscheidungen auf der Grundlage präziser Prognosen zu treffen und Möglichkeiten für strukturelle Effizienz und Verbesserung zu ermitteln. Das Wachstum und die Leistungsfähigkeit von ML- und KI-Tools haben diese Methode effizienter und zugänglicher gemacht, sodass auch Teams ohne technische Vorkenntnisse Modelle entwickeln können, um die Performance zu messen und Prognosen zu verbessern. Es ist kaum überraschend, dass die Zeitreihenanalyse nach wie vor eine der wichtigsten analytischen Methoden moderner Analytics-Plattformen ist.

FAQ zur Zeitreihenanalyse

Im Folgenden haben wir einige der häufigsten Fragen zur Zeitreihenanalyse zusammengefasst.

Zeitreihenanalyse bezieht sich auf die Analyse aktueller und historischer Daten, um daraus neue Erkenntnisse zu gewinnen. So wird beispielsweise die Performance einer Marketingkampagne im Vergleich zu früheren Kampagnen anhand von Metriken wie Klickverhalten, qualifizierten Leads und anderen gemessen. Bei Zeitreihenprognosen wird ein Modell vorgeschlagen, das anhand historischer Daten künftige Werte in der Serie prognostiziert. So können Sie beispielsweise vorhersagen, welche Auswirkungen eine potenzielle neue Marketingkampagne haben könnte, basierend auf der vergangenen Performance. Zeitreihenprognosen werden als Teilmenge der Zeitreihenanalyse betrachtet.

Ein Prognosemodell ist eine Methode, die verwendet wird, um fundierte und genaue Prognosen zukünftiger Werte in einem Zeitreihen-Dataset zu treffen. Die Auswahl des richtigen Modells ist eine entscheidende Komponente für erfolgreiche Zeitreihenprognosen. Analyst:innen werden Faktoren wie Dataset-Stationarität, Komplexität und ihre übergeordneten Ziele berücksichtigen, um das beste auszuwählen.

Obwohl es sich um ein leistungsstarkes Tool handelt, ist die Zeitreihenanalyse möglicherweise nicht für jede Situation das ideale Tool. Viele Zeitreihenmethoden benötigen große Mengen historischer Daten, um genaue Analysen bereitzustellen, und Modelle wie ARIMA und SARIMA erfordern in der Regel erhebliche Anpassungen, um genaue Vorhersagen zu treffen. Viele Modelle kämpfen auch mit Komplexität, wie z. B. mehreren saisonalen Trends. Einige dieser Probleme können Sie mit ML- oder KI-Tools lösen, aber der Umfang der Datenvorverarbeitung kann dann zu Überanpassung oder anderen Fehlern führen.