Blogreihe: Risiken managen mit SAP Analytics Cloud und SAP HANA
Jared Hirschner | April 29, 2021

SAP Analytics Cloud – Automatische Prognose (Teil 5)

Wie in unserem vorherigen Blogbeitrag angemerkt, bietet es sich bei der Nutzung der SAP Analytics Cloud an, auswählbare Vorhersageverfahren für ohnehin schon vorhandene Daten zu testen. Gute Ergebnisse können anschliessend Anlass für eine regelmässige Verwendung der jeweiligen Methode geben. Hierbei kann es vorteilhaft sein, die Wahl eines konkreten Modells der Plattform selbst zu überlassen. Diese Möglichkeit besteht bei Zeitreihengrafiken in Form der automatischen Vorhersage, die ein bestmögliches Zeitreihenmodell auswählt, beziehungsweise mittels verfügbarer Bestandteile zusammenstellt.

Vorteile ergeben sich dabei auf verschiedene Weise. Besonders zu betonen ist, dass in der Datenanalyse ein Modell in aller Regel nicht unendlich lange genau gleich gut nutzbar ist. So müssen Veränderungen der zugrundeliegenden Daten durch die erneute Optimierung von Modellparametern berücksichtigt werden. Zum Beispiel würde man bei der schon vorgestellten exponentiellen Glättung vergangene Fallzahlen einzelner Tage stärker gewichten, wenn sich dies aufgrund neuer Daten als vorteilhaft erweist. Steigt der Beitrag jüngerer Informationen zur Erklärung der Zielvariable gegenüber älteren, so müssten diese entsprechend stärker gewichtet werden. Denn letztlich bildet ein Modell immer den jeweiligen realen Zusammenhang ab. Soweit zu den Parametern eines einzelnen, gegebenen Modells. Wesentlich globaler ist jedoch, dass ein Vorhersageverfahren nicht immer das beste bleibt. So kann die exponentielle Glättung für einen Zeitraum das beste Modell sein. Ändern sich aber die Umstände zu dessen Nachteil oder werden neue Methoden erfunden, so können andere Verfahren besser sein. Dies führt dazu, dass die verfügbaren Modelle regelmässig sowie systematisch trainiert, evaluiert und miteinander vergleichen werden müssen.

Gerade mit der SAP Analytics Cloud ist eine Lösung gegeben, die sehr regelmässig Updates bereitstellt. Weitere Informationen dazu finden Sie hier. Aus diesem Grund ist es denkbar, dass im Hintergrund der automatischen Vorhersage ein neues, besseres Verfahren Verwendung findet. Wie auch bei den anderen betrachteten Vorhersageverfahren, wie etwa der linearen Regression oder der dreifach exponentiellen Glättung, werden hierbei wiederum die modellinternen Parameter automatisch optimiert. Angemerkt sei zudem, dass auch für die performante Implementierung eines Modells im Sinne der algorithmischen Komplexität und damit der Laufzeit jeweils kein eigener Aufwand nötig ist. Daher ergibt sich zusammen mit der Delegation der Modellwahl insgesamt eine deutliche Zeitersparnis, was anfallende Aufgaben betrifft.

Bei dem Streben nach den besten Prognosen muss letztlich zudem angemerkt werden, dass auch der Einsatz von prädiktiven Verfahren an sich Risiken in sich trägt. Potenziell ergeben sich Nachteile – neben der bereits erwähnten, nichtoptimalen Verfahrenswahl – beispielsweise aus diesen Fehlerquellen:

  • «Instabile» Daten (fehlende Stationarität), etwa bei absolut immer grösser werdenden Schwankungen, wie sie bei zahlreichen Kursverläufen von Wertpapieren erkennbar sind
  • Falsche Annahmen – insbesondere a priori
  • Fehlerhafte Algorithmen
  • Falsche Darstellungen oder Interpretationen
  • Kausale Schlussfolgerungen, die sachlich unbegründet sind
  • Mangelhafte Generalisierbarkeit gewonnener Erkenntnisse

Vor diesem Hintergrund wird ersichtlich, dass hohe wissenschaftliche Ansprüche an den freien Entwurf von Vorhersageverfahren gestellt werden. Um diese durchzusetzen, bedarf es entsprechender internen Ressourcen oder aber dem Rückgriff auf externe Berater. Beide Optionen werden durch Standardlösungen, wie etwa die Verfahren der SAP Analytics Cloud oder SAP Data Intelligence unterstützt, da mit ihnen Standardverfahren zugänglich werden, die den Aufwand reduzieren, was sowohl die Einführung wie auch die Wartung prädiktiver Modelle betrifft.

Aber auch unabhängig von diesen Plattformen liegt allgemein ein Trend in Richtung der Verwendung bewährter vordefinierter Module und Funktionen vor – sowohl in verschiedenen Programmsprachen wie auch im Sinne von komplett vorgefertigten Lösungskomponenten. So können Bausteine zunehmend auch ohne aufwendige Programmierung eingesetzt werden. Und dennoch ist es für den Endnutzer empfehlenswert, ein grundlegendes Verständnis für die letztlich eingesetzte Methodik zu haben. Dies gilt umso mehr, da sich aus (prädiktiven) Auswertungen Entscheidungen ableiten. Unser zweiter Artikel zum Prognoseszenario im Kontext der Zeitreihenanalyse hilft beim Verständnis der automatischen Vorhersage, da dieser mit dem beschriebenen Trend und den Zyklen wesentliche Dynamiken erklärt, die potenziell auch bei der automatischen Vorhersage eine zentrale Rolle spielen. Für eine detaillierte Einführung zur Methodik finden Sie hier weitere Informationen. Aufgrund der Aktualität ist es ratsam, regelmässig direkt Online-Informationen zu prüfen. Das gilt im Besonderen auch hinsichtlich der erwähnten Updates. Für Zeitreihengrafiken, beispielsweise in Stories der SAP Analytics Cloud, ist die automatische Vorhersage aufgrund der genannten Vorteile oft das Mittel der Wahl. Ein Prognoseszenario eignet sich bei insgesamt nahezu identischen Vorteilen darüber hinaus nicht nur für Aufgaben der Zeitreihenanalyse, sondern auch für Fragestellungen der Regression oder der Klassifikation, wobei auch mehrere erklärende Variablen nutzbar sind.

Zusammenfassend lässt sich festhalten, dass Zeitreihen dank der vorgefertigten Methoden der SAP Analytics Cloud mit relativ wenig Aufwand modelliert werden können. Aber auch wenn keine hinreichend nutzbaren Strukturen vorhanden sind, so ist der Test eines Verfahrens ohne Nachteile durchführbar. Daher ermutigen wir Kunden unter kontrollierten Bedingungen auch zu kleinen Experimenten mit ihrer Lösung.

Weitere fortgeschrittene Möglichkeiten ergeben sich durch die R-Programmierung innerhalb der SAP Analytics Cloud, durch SAP Data Intelligence oder aber durch Verfahren, die mit der SAP-HANA-Datenbank verbunden sind. In den kommenden Beiträgen erfahren Sie mehr zu diesen Themen. Haben Sie Fragen oder Anregungen? Wir freuen uns über Ihre Kontaktaufnahme.

Jared Hirschner, SAP Data Scientist, NTT DATA Business Solutions
E-Mail: [email protected]

Ist hiervon etwas für Sie besonders interessant oder haben sich Fragen aufgetan?

Dann nehmen Sie gern Kontakt mit uns auf!

JETZT KONTAKTIEREN