Blogreihe: Data Science mit SAP
Jared Hirschner | April 11, 2024 | 4 min

Data Science mit SAP und der SAP Business Technology Platform (BTP)

Mehr denn je entscheidet die Nutzung von Informationen über die eigene Wettbewerbsposition. Kann ein Unternehmen beispielsweise den Wunsch nach einem Produkt oder einer Produktkonfiguration früh antizipieren und entsprechend bedienen, so eröffnen sich Chancen der Wertschöpfung für und mit dem Kunden. Risikoseitig zeigte nicht zuletzt auch die COVID-19-Pandemie, wie wichtig die Nutzung von Daten sein kann. Ganz allgemein betrachtet, wird die moderne Datenanalyse durch bahnbrechende Entwicklungen unterstützt, sowohl in Bezug auf Hardware- als auch im Hinblick auf Software-Komponenten. Ermöglicht wird jeder datenbasierte Ansatz jedoch erst durch eine entsprechend vorhandene und gepflegte Datengrundlage.

In diesem Blog werden die Technologien des SAP-Umfelds vorgestellt. Weitere Beiträge werden folgen, um deren Nutzen anhand von einführenden Beispielen zu erläutern. Hierbei besteht eine besondere Motivation darin, der relativen Unbekanntheit der verschiedenen Lösungen ihre Standardnähe und Mächtigkeit gegenüberzustellen. Dies gilt umso mehr, nachdem sich durch das Ausnutzen der Standardmöglichkeiten besondere Vorteile bezüglich der Einfachheit und Wartbarkeit der unternehmensweiten IT-Infrastruktur ergeben können.

Bezogen auf die virtuelle «Landschaft» der SAP-Lösungen, liegt hier der Fokus eindeutig auf der sogenannten SAP Business Technology Platform (BTP), die zahlreiche Produktkomponenten einheitlich subsumiert und vereint. Dieses Umfeld stellt für unsere Zwecke auf vielfältige Weise Optionen zur Verfügung, wobei angemerkt sei, dass in dieser Blogreihe keine eingebetteten Verfahren und Technologien vorgestellt werden. Vielmehr liegt der Fokus auf Analytics-Anwendungen, ohne den Bereich der Planung einzubeziehen. Bevor jedoch einzelne Vertreter der SAP BTP vorgestellt und eingeordnet werden, sei an dieser Stelle zur ersten Einordnung eine Überblicksgrafik der umfassenden Plattform abgebildet:

Von diesen SAP BTP-Technologien werden die Folgenden im Rahmen dieser Blogreihe fokussiert. Ihre Reihenfolge stellt keine Wertung oder Rangfolge dar:

SAP HANA Cloud / On-Premise

Beide Varianten der SAP HANA-Datenbanktechnologie (Cloud und On-Premise) eröffnen Potenziale für fortgeschrittene Datenanalysen, insbesondere für prädiktive Fragestellungen. Dies liegt nicht zuletzt an der Integration der Programmiersprache R und der Bereitstellung der Predictive Analysis Library (PAL), welche zahlreiche Algorithmen des maschinellen Lernens gekapselt zur Verfügung stellt.

Aufgrund der erwartungsgemäss hohen Verbreitung der SAP HANA-Datenbanken, liegt hier unser Schwerpunkt. Bereits vorhandene und in der Regel sehr stabile Infrastrukturelemente können weiterführend genutzt werden.

Neben den vielen Vorteilen durch die SAP HANA-Technologie selbst, kann die Anbindung eines R- oder TensorFlow-Servers bemerkenswerte Erweiterungen und Laufzeitvorteile bieten.

SAP Analytics Cloud

Die SAP Analytics Cloud (SAC) bietet eine zentrale Lösung für verschiedene Einsatzszenarien, die über deskriptive Analytics-Anwendungen, Business Intelligence (BI), das Enterprise Planning bis hin zu Simulationen, Augmented und Predictive Analytics reichen. In dieser Blogreihe werden vor allem die beiden letztgenannten Fälle betrachtet.

Ähnlich wie die SAP HANA-Datenbank ist auch die SAP Analytics Cloud weit verbreitet. Das liegt nicht nur an den bereits genannten Einsatzszenarien, bei denen die einfache Anbindung verschiedener SAP-Datenquellen als gegeben vorausgesetzt wird. Vielmehr sind auch die Möglichkeiten zur integrativen oder gar losgelösten SAC-Nutzung geboten. So kann die Analytics Plattform beispielsweise auch ohne SAP-Bezug im Sinne der verwendeten Quellsysteme genutzt werden. Möglich ist beispielsweise die Anbindung einer SQL-Datenbank, eines OData-Services oder eines Google Drives. Zudem können importierte Daten verschiedener Datenquellen umfassend miteinander in Beziehung gesetzt werden. Hierbei ist es zusätzlich möglich, selbst lokale Dateien wie etwa ein CSV-Dokument zu analysieren.

Bisweilen besteht eine praktische Einschränkung hinsichtlich der Nutzbarkeit der Programmiersprache R, die in der SAC aus Konsumentensicht lediglich zur Visualisierung von Informationen eingesetzt werden kann. So ist das Resultat des R-Einsatzes eine Grafik, während beispielsweise tabellarische Daten entsprechend nur auf grafischen Umwegen darstellbar sind. Jedoch ist es möglich, auch die Kapazität der SAC für besonders rechenintensive Anwendungen durch einen dedizierten R-Server zu erweitern.

SAP Datasphere

SAP Datasphere vereint Aspekte der Datenhaltung mit den Möglichkeiten der SAP HANA-Technologie und den analytischen Kapazitäten der SAP Analytics Cloud. Daraus ergeben sich besondere Vorteile. Da hier der Fokus primär auf prädiktiven Möglichkeiten liegt, die direkt in Bezug mit ihren grundlegenden technologischen Komponenten stehen, werden diese zunächst separat vorgestellt. Natürlich werden hierdurch indirekt auch Chancen der SAP Datasphere beschrieben. Anschliessend wird nochmals Bezug auf die Datasphere Plattform an sich genommen wird.

Tabelle 1 stellt zentrale SAP-Technologien gegenüber und skizziert eine Einschätzung hinsichtlich ihrer typischen Anwendungen und Limitationen. Hierbei sei angemerkt, dass mit der SAP Business Technology Platform (BTP) und ihren zugehörigen Einzelkomponenten besonders umfassende Möglichkeiten gegeben sind.

Letztlich bleibt abschliessend zu betonen, dass Beschränkungen durch die oben erwähnten Erweiterungsmöglichkeiten häufig umfassend aufgehoben werden können. Vor der Erweiterung der eigenen IT-Infrastruktur ist jedoch gründlich zu prüfen, inwieweit bestehende Komponenten umfangreiche Teilaufgaben tragen können und ab wann Zusatzbausteine sinnvoll sind. Auch Kostenaspekte können für die nur punktuelle Erweiterung der vorhandenen IT-Landschaft und gegen eine isolierte Neueinführung einer Drittlösung sprechen – dies gilt umso mehr im Dienst der Wartbarkeit.

Ausblick

Im nächsten Blogbeitrag werden die Prognoseszenarien der SAP Analytics Cloud näher beleuchtet. Im späteren Verlauf der Reihe werden zudem die Programmiersprache R und das HANA Machine Learning vorgestellt.

Blogreihe: Data Science mit SAP

Ich helfe Ihnen gerne weiter

Sind Sie auf der Suche nach Antworten oder möchten Sie mehr Informationen über das Thema erhalten? Nehmen Sie noch heute Kontakt mit uns auf und lassen Sie uns besprechen, wo Ihre Probleme liegen, was Sie erreichen wollen und wie wir Ihnen dabei helfen können.

Jared Hirschner

Jared Hirschner

Expert Consultant / Data Scientist

Das könnte Sie ebenfalls interessieren