Blogreihe: Risiken managen mit SAP Analytics Cloud und SAP HANA
Jared Hirschner | April 22, 2021

SAP Analytics Cloud – Exponentielle Glättung (Teil 4)

In diesem Beitrag wird ein weiterer Vertreter der Vorhersageverfahren der SAP Analytics Cloud (SAC) vorgestellt: die sogenannte exponentielle Glättung. Im Besonderen geht es hier um die dreifach exponentielle Glättung.

Die Idee des Verfahrens lässt sich zusammenfassend skizzieren als Erklärung aktueller Werte auf Basis aggregierter vergangener Beobachtungen, wobei diese unterschiedlich stark gewichtet werden. Wie in unserem letzten Blogbeitrag, der das Vorhersageverfahren der linearen Regression vorgestellt hat, steht auch in diesem Beitrag eine Zeitreihe im Fokus, also eine Sammlung zeitlich geordneter Datenpunkte. Bevor wir konkret Bezug auf unser bekanntes Beispiel der Schweizer Fallzahlen des Coronavirus nehmen, wird zunächst das neue Modell ganz allgemein und in einfachen Wörtern beschrieben. Auch hier gilt: ein grundlegendes Verständnis hilft dabei, die beste Methode auszuwählen und den produktiven Einsatz nicht zu scheuen.

Zu Beginn wird das Modell der einfachen exponentiellen Glättung vorgestellt, wobei sich „einfach“ auf die Art des Modells beziehungsweise auf seine Konstruktion bezieht und nicht auf dessen konzeptionelle Schwierigkeit – wobei diese erste Variante tatsächlich nicht komplex ist. Betrachtet man verschiedene Zeitreihen, so stellt man fest, dass sich die weitere Entwicklung – gerade in der nahen Zukunft  – durch die jüngste Vergangenheit niveaumässig häufig besser einschätzen lässt, als durch „alte“ Beobachtungen. Für derartige Zusammenhänge kann sich die Modellierung einer Zeitreihe mittels der exponentiellen Glättung besonders eignen, da sie neuere Beobachtungen unter Verwendung eines Faktors stärker gewichten kann. So zeigte sich beispielsweise das Niveau der Fallzahlen des Coronavirus als variabel. Entferntere Daten, wie etwa Zahlen aus dem März 2020 werden allgemein kaum für die Erklärung oder Einschätzung jüngerer Entwicklungen herangezogen, was die absolute Anzahl an Fällen betrifft. Zusammengefasst werden in der einfachen Variante also verschiedene Vergangenheitswerte unterschiedlich stark gewichtet sowie aggregiert, was im Ergebnis Prognosen ermöglicht. Es gibt zwei theoretische Spezialfälle der unveränderten Übernahme von beobachteten Werten oder aber der Fortschreibung vergangener Prognosen, die hier nicht weiter betrachtet werden.

Dieses Einstiegsmodell kann in einem nächsten Schritt zur zweifach exponentiellen Glättung erweitert werden. Hierzu sind zusätzlich zur Betrachtung des Niveaus auch Trendkomponenten aufzunehmen. Diese beschreiben Tendenzen über den Zeitverlauf – wie beispielsweise sinkende Fallzahlen des Coronavirus. Da solche Trends oft nicht immer gleich weiterverlaufen (können), besteht die Möglichkeit, sie zu „dämpfen“ und damit abzuschwächen.

Werden weiterhin noch zeitlich wiederkehrende Muster berücksichtigt, wie etwa hohe COVID-Fallzahlen an einem bestimmten Wochentag, so erhält man mit diesem saisonalen Bestandteil letztlich die dreifache exponentielle Glättung.

Soweit zur Theorie. Wie auch die anderen beiden aktuell verfügbaren Vorhersageverfahren, ist die dreifach exponentielle Glättung mit der SAP Analytics Cloud einfach anzuwenden beziehungsweise auszuwählen (im Menü einer Grafik). Denn wiederum muss man sich nicht um die Optimierung des Modells im Hintergrund kümmern. Dies bedeutet, dass die Plattform die Arbeit übernimmt, wenn es beispielsweise darum geht, das Gewicht festzulegen, mit dem vergangene Beobachtungen mehr oder weniger stark zur Erklärung aktueller Werte herangezogen werden.

Abbildung 1: Eigene Abbildung, Datengrundlage: Bundesamt für Gesundheit (BAG)

Letztlich erhält der Nutzer auch bei diesem Verfahren neben den eigentlichen Vorhersagewerten einen Eindruck davon, in welchem Korridor sich die realen Werte erwartungsgemäss befinden werden – oft wird bei der Bestimmung der Breite dieses Bereichs eine Wahrscheinlichkeit von 95 % zugrunde gelegt. Diese Streuungsbreite ist blau schattiert zu erkennen (siehe Abbildung 1). Für den Anwender ist entscheidend: Je schmaler der Korridor ist, desto weniger Streuung, ist basierend auf den vergangenen Beobachtungen zu erwarten. So liegt die punktuelle Prognose der Fallzahl relativ zentral in dem markierten Bereich, wobei natürlich Abweichungen nach oben oder unten und somit Streuungen möglich sind. Die Relevanz von Corona als Risiko ist hierbei für verschiedene Branchen offensichtlich. Ganz allgemein aber steht mit der exponentiellen Glättung ein Modell zur Verfügung, das nur durch vergangene Werte Prognosen ermöglichen kann. Zusammen mit der einfachen Implementierung per Auswahl, bietet es sich oft an, diese zu testen. Dies gilt nicht nur im Kontext des Risikomanagements, sondern auch ganz allgemein. Beispielsweise können Umsatz- oder Produktionszahlen verwertbare Muster aufweisen, auf Basis derer die dreifach exponentielle Glättung einen datenbasierten Blick in die Zukunft verschafft. Nutzer der SAP Analytics Cloud haben vor diesem Hintergrund in der Regel zahlreiche schon vorhandene Charts, auf die sich das vorgestellte Verfahren leicht anwenden und damit testen lässt.

In unserem nächsten Artikel werden wir die automatische Vorhersage für SAC-Grafiken vorstellen, die nicht selten das Mittel der Wahl für den Endnutzer darstellt. Warum dies so ist, erfahren Sie im nächsten Beitrag unserer Serie. Kontaktieren Sie uns gern – auch bei allgemeinen Fragen oder Anregungen.

Jared Hirschner, SAP Data Scientist, NTT DATA Business Solutions
E-Mail: [email protected]

Ist hiervon etwas für Sie besonders interessant oder haben sich Fragen aufgetan?

Dann nehmen Sie gern Kontakt mit uns auf!

JETZT KONTAKTIEREN