SAP Data Hub - 1. Einleitung

11.02.2019
SAP Data Hub ist die Lösung von SAP zur Verwaltung der gesamten heterogenen Unternehmensdaten-Landschaft. SAP Data Hub hilft Anwendern, eine konsolidierte Ansicht zu schaffen, komplexe Datenoperationen flexibel zu steuern, Datenprojekte zu beschleunigen und datengesteuerte Anwendungen leicht zu erstellen.

In dieser Blog-¬Serie erklären wir, warum es SAP Data Hub gibt, was es ist und wie wir damit arbeiten können. Diese Serie wird eher technisch sein. Zwar werden wir am Anfang den Hintergrund und die Motivation erläutern, aber unser Schwerpunkt liegt auf den technischen Aspekten und dem praktischen Einsatz von SAP Data Hub.

Unser Experte
Yu Chen
yu.chen@cubeserv.com

Urlaub geplant wie ein Projekt

Stellen wir uns vor, dass wir einen Familienurlaub organisieren. Diesmal nicht wie früher - einfach eine Idee haben, ins Reisebüro oder zu hierbuchichdenurlaub.net gehen, buchen und los! Stattdessen planen wir unseren Urlaub wie in ein Projekt.

Denken wir uns es so: Alle Daten, die wir für unsere Entscheidung benötigen, sind im Internet, im Fernsehen, in Büchern, Zeitungen und im Freundeskreis für uns zugänglich, und wir können zudem alle verfügbaren Mittel benutzen, um die Information über die möglichen Reiseziele, Routen, Flug-, Bus- und Zugverbindungen, Hotels und Restaurants, Sportmöglichkeiten, Preise und Bewertungen, das Wetter, die Kinderfreundlichkeit usw. finden. Ebenso gibt es auch eine Reihenfolge oder Strategie bei der Suche und Auswertung, z.B. man sucht zuerst die möglichen Ziele mit interessanten Sehenswürdigkeiten oder Veranstaltungen usw., dann die passenden Flugverbindungen und parallel oder später die passenden Hotels und Restaurants. Evtl. auch noch die lokalen Routen zwischen verschiedenen Sehenswürdigkeiten am Zielort, dann berücksichtigt man noch das Wetter … Inzwischen werden die möglichen Kombinationen nach Preisen, nach Zeit, nach Terminen und Geschmack von jedem Familienmitglied usw. ausgewertet und es wird evtl. eine Teilentscheidung getroffen. Nach jeder Auswertung oder Entscheidung wird evtl. die Suche wieder anders durchgeführt.

Sogar nach der Buchung und während des Urlaubs können wir noch ständig überwachen, ob ein Stau entstanden ist, ob ein Flug oder eine Zugverbindung gestrichen wurde, ob das Wetter schlechter wird usw. Je nach den neuen Situationen müssen wir evtl. die Reise anpassen oder sogar neu planen.

Der Familienurlaub ist manchmal doch komplizierter als wir vorgestellt haben. 

 

Daten treiben den Menschen

Haben Sie schon den Unterschied zu unserem «alten Leben» gemerkt? Man hat eine Vorstellung oder einen Wunsch, wie der Urlaub werden soll - aber zu welchem Urlaubsziel er geht und wie man es erreicht und den Urlaub genießt, ist immer mehr durch die (immer leichter erreichbaren) Daten getrieben. Der Mensch ist einerseits immer flexibler, ist andererseits aber auch immer abhängiger von den Daten.

In dem obigen Urlaubsbeispiel haben wir grundsätzlich folgende Aufgaben:

  • die relevanten und zuverlässigen Daten finde
  • die gefundenen Daten aus unterschiedlichen Quellen (Webseiten, Apps, Magazin, TV, Freunde etc.) und Formaten (Text, Bild, Video, Gespräch etc.) zusammenführen
  • gleichzeitig ständig die zusammengeführten Daten auswerten, Entscheidungen treffen und die nächsten Aktionen anstoßen

Zwar helfen die Suchmaschinen wie Google oder ein Bibliothekskatalog hier viel die Informationen zu finden, aber persönlich haben wir auch manuell viel Arbeit geleistet, die Informationen aus unterschiedlichsten Formaten zusammenzuführen, zu verstehen und die Such- und Entscheidungsprozesse Schritt für Schritt durchzuführen.

 

Daten treiben das Unternehmen

Viele Unternehmen tun auch Ähnliches wie wir in unserem Urlaubsbeispiel: Ihre Prozesse sind immer mehr durch Daten getrieben.

  • Sie müssen immer mehr Daten verwalten und garantieren, die relevanten und zuverlässigen Daten schnell finden zu können (Data Governance & Discovery).
  • Sie müssen die Daten mit anderen (z.B. Roh- und Unternehmensdaten, Video und Text) verknüpfen und verarbeiten (Data Integration & Processing).
  • Sie müssen je nach gefundenen Daten weitere Prozesse anstoßen oder die mit den Daten gebundenen Prozesse zusammenarbeitend automatisieren (Data Orchestration).

 
Die Situation bei Unternehmen ist aber oft viel schwieriger als die, vor der ein Mensch bei der Urlaubsplanung steht.

Es gibt kaum eine gute globale Suchmöglichkeit und es ist schwer, sich einen Überblick zu verschaffen, weil die Daten oft aus technischen oder organisatorischen Gründen in Silos liegen. Und es gibt Datenexplosionen in verschiedenen Größen und Formaten (strukturiert, semi- und nicht strukturiert) aus allen Richtungen. Die Datenintegration ist also eine große Herausforderung.

Und immer mehr Rohdaten sind in Clouds oder dritten Speichern-Anbieter entweder ausgelagert oder direkt gespeichert. So versucht etwa fast jeder IoT-Lieferant, eigene Datenplattformen zu bauen und die Daten bevorzugt in eigenen Hadoop-Systemen oder Clouds zu speichern. Wie können wir dennoch die Daten aus allen Ecken orchestrieren?

Es tauchen ständig neue Datenquellen und neue Technologien auf. Um die immer komplizierteren Datenlandschaft zu beherrschen, braucht man eine ganze Menge unterschiedlicher Skills.

Das alles reduziert die Unternehmensagilität und verhindert die Innovation aus den Daten!

 

SAP Data Hub

SAP Data Hub bietet eine Lösung für die oben genannten Herausforderungen:

  • Es ermöglicht eine konsolidierte Ansicht aller Daten aus allen Datenquellen, einschließlich Geschäftsprozessen und -anwendungen.
  • Es verbessert die Datenqualität durch Bereinigung der Meta-Daten und bietet eine graphische Darstellung der Datenkorrelationen und -herkünfte im Unternehmen.
  • Die Benutzer können ihre Sicherheitsrichtlinien dynamisch an einem Ort verwalten und sicherstellen, dass Regeln und Maßnahmen ergriffen werden, um die gesetzlichen und unternehmensspezifischen Anforderungen zu erfüllen.
  • Es bietet eine robuste und erweiterbare Option, mit unterschiedlichen Datenquellen zusammen zu arbeiten, nämlich sowohl aus SAP- als auch aus Non-SAP-Systemen, in der Cloud, On-Premise oder in einem hybriden Setup.
  • Es werden verteilte Datenpipelines und Datenverarbeitungen mit Hilfe einer Vielzahl von Berechnungstechniken wie OLAP, Graphen, Zeitreihen und maschinellem Lernen angeboten.
  • Daten werden End-to-End orchestriert und möglichst dort verarbeitet, wo sie sich befinden (Operation Push-Down), damit teure Datenbewegungen vermieden werden können.

 
Wir freuen uns darauf, Ihnen im zweiten Teil unserer Blogserie weitere Details zum SAP Data Hub zu berichten!