Ein Rück- und Ausblick (Teil 10)

Sie haben mit diesem zehnten Blogartikel den vorerst letzten Teil unserer ersten Serie zum Thema Risikomanagement mit SAP Analytics Cloud (SAC) und SAP HANA vorliegen.

Aus gebotenem Anlass lag eingangs der Fokus auf der Modellierung der Schweizer Fallzahlen des Coronavirus, da sich dieses direkt und indirekt negativ auf verschiedenste Branchen auswirkt. Dieses nachvollziehbare Beispiel beruht auf echten Daten und erklärt anschaulich grundlegende statistische Muster wie regelmässige zeitabhängige Schwankungen („Saisonalitäten“). Obwohl dies ein sehr aktuelles Thema ist, wurde ausgehend von diesem auch auf die methodischen Grundlagen verschiedener Vorhersageverfahren eingegangen. Diese entziehen sich oftmals der Betrachtung und der Kenntnis des Nutzers, weswegen sie allgemein verständlich skizziert wurden. Die modellhaften Darstellungen besitzen im übertragenen Sinne eine lange Halbwertszeit. So haben Sie beispielsweise verschiedene Aspekte der Zeitreihenanalyse kennengelernt, die nicht nur in der SAP Analytics Cloud gültig sind. Auch die Einordnung der thematisierten Programmiersprachen kann sowohl auf andere fachliche Beispiele als auch auf die erweiterte Nutzung alternativer Plattformen angewandt werden.

Weiter wurden überblicksartig die vielfältigen Möglichkeiten der SAP HANA-Technologie in Bezug auf maschinelles Lernen vorgestellt. Zentral waren hierbei die Predictive Analysis Library (PAL) und sowie die Automated Predictive Library (APL). Methodisch wurde vertiefend ausserdem auf ein Entscheidungsbaumverfahren eingegangen, dessen Funktionsweise besonders gut zu erklären ist. Mit diesem sollte der exemplarische Einstieg in das maschinelle Lernen erleichtert werden. Unser PAL-Beispiel zur Predictive Maintenance ist dabei für zahlreiche Unternehmen sehr relevant. Aber auch die Erkennung von Betrugsfällen, die im vorherigen Beitrag beschrieben wurde, kann gerade für Unternehmen ab mittlerer Grösse von Interesse sein. Wichtig ist hierbei, dass mit den erwähnten Verfahren jeweils lediglich ein erster konkreter Referenzpunkt zum beispielhaften Verständnis geschaffen werden sollte. Selbstverständlich sind zahlreiche weitere Verfahren verfügbar. Daher wurde sowohl ein gesamthafter Überblick zu den Machine Learning-Kapazitäten der SAP HANA-Technologie geboten als auch konkrete und nachvollziehbare Beispiele aufgeführt. Denn gerade eine konkrete Auseinandersetzung hilft dabei, die mitunter verbreitete Wahrnehmung des maschinellen Lernens als Blackbox zu überwinden.

Relevant wird maschinelles Lernen für das Managen von Risiken im weiteren Sinne insbesondere durch datenbasierte Vorhersagen. Diese sind für ein vorausschauendes Handeln oft förderlich. Es kann jedoch selbstverständlich auch solche Sachverhalte geben, die sich, beispielsweise mangels Daten, nicht oder nur schlecht erklären beziehungsweise vorhersagen lassen. Dann kann die visuelle Aufbereitung von Planungsdaten, die auf verschiedenen Annahmen beruhen, mit Lösungen wie der SAC hilfreich sein. Deskriptive, explorative und planerische Funktionen werden im Gegensatz zu den Vorhersageverfahren beider Plattformen jedoch häufiger voraus- und eingesetzt, weswegen das Hauptaugenmerk auf den tendenziell eher weniger vertrauten prädiktiven Kapazitäten lag. Wie schon erwähnt, ist aktuell gerade die prognostische Beurteilung von Risiken ein sehr relevantes Anliegen. Beide betrachteten Technologien können vor diesem Hintergrund das betriebliche Risikomanagement unterstützen. Neben den Aspekten der Analyse und Vorhersage von Risiken kann die SAP HANA-Technologie zusätzlich durch die Möglichkeiten des XS Advanced-Applikationsservers weitere typische Aufgaben des Risikomanagements ermöglichen oder zumindest unterstützen. So können zum Beispiel Anwendungen zur geführten Risikobewältigung entwickelt und betrieben werden.

Es ist meist das Ziel, gewonnene Vorhersageergebnisse weiterzuverwenden und aus ihnen Handlungen abzuleiten. In dem Fall des vorgestellten Predictive Maintenance-Ansatzes wurde eine leicht exportier- und druckbare SAC-Story mit den vom Ausfall bedrohten Maschinen erzeugt, die auch automatisch per E-Mail versandt werden kann. Die entsprechende Reaktion hierauf müsste durch eine verantwortliche Person erfolgen. Eine regressive Aufgabe wäre im Gegensatz zu der Klassifikation, ob eine Maschine ausfällt oder nicht, die Preisgestaltung unter Beachtung verschiedener Risikoaspekte, also die Angabe einer Zahl. Ein solcher Preis könnte perspektivisch automatisch weiterverarbeitet und angeboten werden. Ebenfalls wäre die autonome Bestellung von Ersatzteilen auf prädiktiver Basis denkbar. Derartige Szenarien gehen letztlich jedoch über den Inhalt dieser Serie hinaus.

Dass sich die Standardlösungen der SAC und der SAP HANA-Plattform hervorragend ergänzen können, wurde mit Blogbeitrag 8 besonders deutlich. So stehen zahlreiche Verfahren des maschinellen Lernens seitens SAP HANA in Verbindung mit einer in der Regel hochperformanten Verarbeitungsumgebung bereit. Zugehörige Ergebnisse können sehr flexibel und aktuell in der SAC betrachtet, berichtet und analysiert werden. Dabei muss erneut angemerkt werden, dass auch hinsichtlich dieser Cloudlösung immer mehr prädiktive Standardmöglichkeiten zur Verfügung stehen. Beispielsweise sind schon heute verschiedene Methoden verfügbar, die sich auch auf Risikobetrachtungen anwenden lassen. Zudem sind gerade durch die regelmässigen Updatezyklen zusätzliche Erweiterungen zu erwarten. Aus praktischer Sicht erweist sich bislang oft der Konsum von Endergebnissen in der SAC als besonders vorteilig im Hinblick auf die Laufzeit.

Insgesamt lag der Schwerpunkt dieser Serie auf der einfachen Erklärung grundlegender technischer Möglichkeiten, wobei Sie hierbei mit Themen in Berührung kamen, die heute in der Data Science ganz allgemein eine besondere Rolle besitzen. So haben Sie nicht zuletzt etwas über die Programmiersprachen Python und R gelernt. R wurde mehrfach genannt und war somit relativ prominent vertreten: Einmal im (internen und externen) Erweiterungs-Kontext der SAP Analytics Cloud und zum anderen hinsichtlich der Möglichkeit, R-Server zusammen mit der SAP HANA-Technologie zu nutzen. Python wurde zur Vorhersage des Ausfalls von Maschinen per ML Client genutzt. Diese Anwendungen sind keine exotischen Beispiele. Heute werden beide Programmiersprachen sehr verbreitet und mannigfaltig eingesetzt. Mit den durch sie ermöglichten Eigenentwicklungen können teils sogar verbesserte Vorhersageleistungen erzielt werden, allerdings sind diese im Sinne einer Kosten-Nutzen-Analyse zu hinterfragen. Geringe Verbesserungen rechtfertigen nicht jeden Entwicklungs- und Wartungsaufwand.

Auch methodisch haben Sie übertragbares Wissen gesammelt und über die Aufgaben der Klassifikation, der Regression sowie der Zeitreihenanalyse gelernt. Neben den vorgestellten Verfahren sind zahlreiche weitere einsetzbar. Dabei sind gerade solche Funktionalitäten interessant, die sich standardnah ergeben. Sie bieten Potenzial, das jedoch bislang oft nicht bekannt und dementsprechend wenig genutzt ist. Ein zentrales Anliegen dieser Serie war es daher, die vorhandenen Möglichkeiten zu beleuchten. Diese reichten von weitgehend automatisierten Verfahren mit grafischer Benutzeroberfläche bis hin zu programmierten Ansätzen.

An dieser Stelle möchte ich mich für Ihr Interesse bedanken. Hat Ihnen diese Serie gefallen? Lassen Sie mich das gern wissen. Aber auch Fragen und Rückmeldungen sind nach wie vor jederzeit gern willkommen. Mit unserem Newsletter-Service verpassen Sie übrigens keine Fortsetzung oder weitere Informationsangebote.

Jared Hirschner, SAP Data Scientist, NTT DATA Business Solutions
E-Mail: [email protected]

Ist hiervon etwas für Sie besonders interessant oder haben sich Fragen aufgetan?

Dann nehmen Sie gern Kontakt mit uns auf!

JETZT KONTAKTIEREN