Zeitreihenprognose leicht gemacht – das Prognoseszenario der SAP Analytics Cloud (Teil 2)

Die Vorhersage von zukünftigen Entwicklungen und Risiken ermöglicht es, Unternehmen frühzeitig zu handeln. Vielmehr sogar kann durch den Einsatz von prädiktiven Verfahren auch ein Wettbewerbsvorteil generiert werden. Denn immer mehr entscheidet die Nutzung verfügbarer Daten über die eigene Zukunft. Wie einige Unternehmen mit einem guten Risikomanagement von der aktuellen Situation profitieren konnten, haben wir in unserem letzten Blogbeitrag aufgezeigt. Aus aktuellem Anlass wird in diesem Blogbeitrag daher am Beispiel der Fallzahlen des Coronavirus gezeigt, dass aus vergangenen Informationen unter Nutzung der Standardmöglichkeiten der SAP Analytics Cloud, valide Prognosen erstellt werden können.

Grundlage unserer Vorhersagen ist dabei der Datensatz des Bundesamts für Gesundheit (BAG) mit echten Daten für den Zeitraum vom 24. Februar 2020 bis einschliesslich zum 21. Februar 2021. Ausgehend von diesen vergangenen Beobachtungen, die insgesamt als sogenannte Zeitreihe bezeichnet werden, wird die Zukunft vorhergesagt. Hierzu erkennt die SAP Analytics Cloud automatisch regelmässige Muster im Zeitverlauf. Diese wiederrum bestehen nun zentral aus den Komponenten von Trends und Zyklen. Ein Trend beschreibt die allgemeine Tendenz wie beispielsweise steigende, konstante oder aber fallende Infektionszahlen. Zyklen zeigen demgegenüber, welche sich wiederholenden Schwankungen vorhanden sind. So kann ein wöchentlicher Anstieg je zum Montag typisch für eine Zeitreihe sein.

Abbildung 1: Eigene Grafik (Robin Brühwiler), Datengrundlage: Bundesamt für Gesundheit (BAG)

Die Erkennung beziehungsweise Schätzung dieser Komponenten ist die Grundlage für eine datengetriebene Vorhersage, wie sie in der nachfolgenden Abbildung dargestellt wird. Diese basiert gerade auf den Parametern für die einzelnen Bestandteile (Trends und Zyklen). Auch hierbei nimmt die SAP Analytics Cloud den Nutzer bei der Hand und sagt entsprechend seiner Auswahl einen gewählten Zeitraum voraus. Die einzelnen vorhergesagten Tage werden auch als sogenannte Punktschätzer bezeichnet. Zusätzlich kann auf Basis der vergangenen Beobachtungen ein Korridor bestimmt werden, der erwartungsgemäss die wahren Werte enthält. Dieser Bereich – auch Konfidenzintervall genannt – wird durch das Fehlerminimum beziehungsweise -maximum angegeben.

Abbildung 2: Eigene Grafik (Robin Brühwiler), Datengrundlage: Bundesamt für Gesundheit (BAG)

Sowohl die vorhergesagten einzelnen Werte als auch die Bänder des Schätzfehlers dienen einer Evaluierung der Vorhersagegüte. Hierbei ist der MAPE (mean average percentage error) eine besonders wichtige Kennzahl. Sie beschreibt, wie gross die prozentuale Abweichung der Vorhersagen von den realen Werten im Durchschnitt ist. Wichtig ist beim MAPE, dass sich durch die Berechnung per Absolutwerte (eine positive Zahl bleibt positiv, eine negative Zahl wird positiv – z.B. -5 -> 5 oder aber 3 -> 3) positive und negative Fehler nicht gegenseitig aufheben. So könnte bei den folgenden Fehlerwerten irrtümlich von insgesamt perfekten Prognosen ausgegangen werden, obwohl beide Punktschätzer prozentual je gleich weit vom realen Wert entfernt sind.

Zusätzlich erhält der Nutzer erklärende Details zu seinem Prognoseszenario, die Zusammenhänge verbal beschreiben, wie zum Beispiel bezüglich der Art des erkannten Trends:

Abbildung 3: Eigene Grafik (Robin Brühwiler)

Mit geringem Aufwand wird es dem Endnutzer also ermöglicht, mit den prädiktiven Möglichkeiten der SAP Analytics Cloud Prognosen zu erzeugen. Die statistische Arbeit übernimmt hierbei völlig die Standardlösung, sodass sich der Anwender zurücklehnen und auf das Ergebnis warten kann. Dieses wird ihm auch verbal erklärt.

Die NTT DATA Business Solutions Schweiz hilft Ihnen bei allen Themen rund um Advanced Analytics und Data Science im SAP Scope. Für Fragen oder ein persönliches Gespräch stehe ich Ihnen zur Verfügung. Hier können Sie Kontakt mit mir aufnehmen.

Björn Hirschner, SAP Data Scientist, NTT DATA Business Solutions
E-Mail: [email protected]

 

Blog-Serie: Risiken managen mit SAP Analytics Cloud und SAP HANA

 

KONTAKTIEREN SIE UNS

Björn Hirschner
Björn Hirschner
SAP Professional Consultant Business Intelligence, NTT Data Business Solutions

Während meines Studiums zum Master of Science im Fach Business Management mit dem seltenen Schwerpunkt Riskmanagement habe ich mich intensiv mit angewandter Statistik und maschinellem Lernen beschäftigt. So war beispielsweise die Vorhersage von Bitcoin-Kursrenditen und deren Volatilität ein besonderer Fokus. Es macht mir Spass, diese methodischen Fähigkeiten im Bereich Business Intelligence und Analytics im SAP Scope bei NTT Data Business Solutions anzuwenden.

Contact Us
Kontakt

Sie haben Fragen? Kontaktieren Sie uns gerne.

Rufen Sie uns gerne an
+41 44 735 85 55
Schreiben Sie uns