SAP HANA Cloud / On-Premise
Beide Varianten der SAP HANA-Datenbanktechnologie (Cloud und On-Premise) eröffnen Potenziale für fortgeschrittene Datenanalysen, insbesondere für prädiktive Fragestellungen. Dies liegt nicht zuletzt an der Integration der Programmiersprache R und der Bereitstellung der Predictive Analysis Library (PAL), welche zahlreiche Algorithmen des maschinellen Lernens gekapselt zur Verfügung stellt.
Aufgrund der erwartungsgemäss hohen Verbreitung der SAP HANA-Datenbanken, liegt hier unser Schwerpunkt. Bereits vorhandene und in der Regel sehr stabile Infrastrukturelemente können weiterführend genutzt werden.
Neben den vielen Vorteilen durch die SAP HANA-Technologie selbst, kann die Anbindung eines R- oder TensorFlow-Servers bemerkenswerte Erweiterungen und Laufzeitvorteile bieten.
SAP Analytics Cloud
Die SAP Analytics Cloud (SAC) bietet eine zentrale Lösung für verschiedene Einsatzszenarien, die über deskriptive Analytics-Anwendungen, Business Intelligence (BI), das Enterprise Planning bis hin zu Simulationen, Augmented und Predictive Analytics reichen. In dieser Blogreihe werden vor allem die beiden letztgenannten Fälle betrachtet.
Ähnlich wie die SAP HANA-Datenbank ist auch die SAP Analytics Cloud weit verbreitet. Das liegt nicht nur an den bereits genannten Einsatzszenarien, bei denen die einfache Anbindung verschiedener SAP-Datenquellen als gegeben vorausgesetzt wird. Vielmehr sind auch die Möglichkeiten zur integrativen oder gar losgelösten SAC-Nutzung geboten. So kann die Analytics Plattform beispielsweise auch ohne SAP-Bezug im Sinne der verwendeten Quellsysteme genutzt werden. Möglich ist beispielsweise die Anbindung einer SQL-Datenbank, eines OData-Services oder eines Google Drives. Zudem können importierte Daten verschiedener Datenquellen umfassend miteinander in Beziehung gesetzt werden. Hierbei ist es zusätzlich möglich, selbst lokale Dateien wie etwa ein CSV-Dokument zu analysieren.
Bisweilen besteht eine praktische Einschränkung hinsichtlich der Nutzbarkeit der Programmiersprache R, die in der SAC aus Konsumentensicht lediglich zur Visualisierung von Informationen eingesetzt werden kann. So ist das Resultat des R-Einsatzes eine Grafik, während beispielsweise tabellarische Daten entsprechend nur auf grafischen Umwegen darstellbar sind. Jedoch ist es möglich, auch die Kapazität der SAC für besonders rechenintensive Anwendungen durch einen dedizierten R-Server zu erweitern.
SAP Datasphere
SAP Datasphere vereint Aspekte der Datenhaltung mit den Möglichkeiten der SAP HANA-Technologie und den analytischen Kapazitäten der SAP Analytics Cloud. Daraus ergeben sich besondere Vorteile. Da hier der Fokus primär auf prädiktiven Möglichkeiten liegt, die direkt in Bezug mit ihren grundlegenden technologischen Komponenten stehen, werden diese zunächst separat vorgestellt. Natürlich werden hierdurch indirekt auch Chancen der SAP Datasphere beschrieben. Anschliessend wird nochmals Bezug auf die Datasphere Plattform an sich genommen wird.
Tabelle 1 stellt zentrale SAP-Technologien gegenüber und skizziert eine Einschätzung hinsichtlich ihrer typischen Anwendungen und Limitationen. Hierbei sei angemerkt, dass mit der SAP Business Technology Platform (BTP) und ihren zugehörigen Einzelkomponenten besonders umfassende Möglichkeiten gegeben sind.
Letztlich bleibt abschliessend zu betonen, dass Beschränkungen durch die oben erwähnten Erweiterungsmöglichkeiten häufig umfassend aufgehoben werden können. Vor der Erweiterung der eigenen IT-Infrastruktur ist jedoch gründlich zu prüfen, inwieweit bestehende Komponenten umfangreiche Teilaufgaben tragen können und ab wann Zusatzbausteine sinnvoll sind. Auch Kostenaspekte können für die nur punktuelle Erweiterung der vorhandenen IT-Landschaft und gegen eine isolierte Neueinführung einer Drittlösung sprechen – dies gilt umso mehr im Dienst der Wartbarkeit.
Ausblick
Im nächsten Blogbeitrag werden die Prognoseszenarien der SAP Analytics Cloud näher beleuchtet. Im späteren Verlauf der Reihe werden zudem die Programmiersprache R und das HANA Machine Learning vorgestellt.