Diese Bachelorarbeit zeigt den Entwurf und die Realisierung eines ETL-Prozesses, worüber ein automatisierter Datenexport aus SAP BW in eine relationale Datenbank durchgeführt wird. Desweiteren wird ein Prototyp einer Software zur Berechnung von Prognosen erstellt. Die berechneten Prognosen werden im Anschluss über eine File-Schnittstelle aus der Datenbank zurück in das SAP Business Warehouse geladen.
Zu Beginn werden verschiedene ETL-Tools aus dem SAP- und NON-SAP Umfeld gegenübergestellt und bewertet. Die Realisierung des ETL-Prozesses wird beispielhaft mit einem der evaluierten ETL-Tools durchgeführt.
Neben den Extraktionsmöglichkeiten werden wichtige grundlegende Technologien aus dem SAP und NON-SAP Umfeld vorgestellt, die bei der Umsetzung zum Einsatz kommen. Die Extraktion, Transformation und das Loading findet zwischen dem SAP BW System und einer relationalen Datenbank statt. Bei der Beschreibung der Umsetzung geht der Autor hauptsächlich auf die Möglichkeiten der Extraktion von Daten aus dem SAP BW System ein.
Die letztliche Betrachtung der Arbeit bringt das Ergebnis, dass die Anforderungen an den ETL-Prozess erfüllt und die Datenlieferung aus dem BW mit Hilfe eine 3rd-Party-Tools automatisiert werden kann.
Inhaltsverzeichnis
1. Einleitung
1.1 Zielsetzung und Abgrenzung
1.2 Aufbau der Arbeit
1.3 Überblick
2. Grundlegende Technologien
2.1 Relationale Datenbanksysteme (RDBS)
2.2 Data Warehouse
2.2.1 Definition
2.2.2 Nutzen
2.2.3 Abgrenzung des Begriffs Business Intelligence
2.3 Extract, Transform & Load (ETL)
2.3.1 Extraktion
2.3.2 Transformation
2.3.3 Laden
2.4 SAP Business Warehouse
2.4.1 Extraktionsschicht
2.4.2 Data-Warehouse-Schicht
3. SAP BW Standardschnittstellen
3.1 DB Connect
3.2 XML-Schnittstelle
3.3 Universal Data Integration (UDI)
3.3.1 UD Connect
3.3.2 BI Java Software Development Kit (BI Java SDK)
3.4 File-Schnittstelle
3.5 Business Application Programming Interface (BAPI)
3.5.1 Remote Function Call (RFC)
3.5.2 BW Service Application Programming Interface (SAPI)
3.6 SAP Java Connector
3.6.1 SAP Java Resource Adapter
3.7 SAP Business Connector
3.7.1 Internet Communication Framework (ICF)
3.8 Open Hub Services
3.9 Eignung der Schnittstellen für die Umsetzung
3.9.1 Import
3.9.2 Export
4. Evaluierung von 3rd-party-ETL-Tools
4.1 Xtract IS
4.2 Palo Suite
4.3 Pentaho Data Integration
4.4 Talend Open Studio
4.5 Sonstige
4.6 Fazit
5. Export der Daten aus SAP BW
5.1 Vorbereitung in SAP BW
5.1.1 InfoCube anlegen
5.1.2 Data Store Objekt anlegen
5.2 Vorbereitung in Palo ETL
5.2.1 Variablen
5.2.2 Verbindungen
5.3 Extraktion der Daten
5.4 Aufbereiten der Daten für die Berechnung
6. Berechnung der Prognosen
6.1 Java
6.2 Anforderungen an die Anwendung
6.3 Entwicklung der Anwendung
6.4 Funktionalität der Anwendung
6.4.1 Funktionen und Erweiterungen im Überblick
7. Import der Prognosen in SAP BW
7.1 Export der Prognosewerte in ein Flat File
7.2 Erstellen eines neuen InfoCubes in SAP BW
7.3 Erstellung einer DataSource für die Flat File
7.4 Import der berechneten Daten
8. Zusammenfassung
8.1 Fazit
8.2 Erweiterungsmöglichkeiten
8.2.1 Dynamischer Exportprozess
8.2.2 Automatisierung des Reimports
8.2.3 ETL-Controller Update
Zielsetzung & Themen
Das Hauptziel dieser Bachelorarbeit ist die Evaluierung verschiedener ETL-Tools sowie die anschließende prototypische Entwicklung eines ETL-Prozesses, der einen automatisierten Datenaustausch zwischen SAP BW und einer relationalen Datenbank ermöglicht, ergänzt durch eine Java-basierte Anwendung zur Prognoseberechnung.
- Vergleich und Bewertung von SAP-Data-Retrieval-Tools und Non-SAP-ETL-Tools.
- Realisierung eines automatisierten ETL-Prozesses zur Datenextraktion aus dem SAP Business Warehouse.
- Entwicklung einer prototypischen Anwendung zur Berechnung von Umsatzprognosen basierend auf exportierten Daten.
- Implementierung eines Reimport-Prozesses der berechneten Prognosedaten in das SAP BW über Flat-Files.
Auszug aus dem Buch
1.3 Überblick
Bevor in Kapitel 2 die grundlegenden Technologien beschrieben werden, wird in diesem Abschnitt ein beispielhafter Ablauf des ETL-Prozesses dargestellt. Wie man anhand der Abbildung 1-1 deutlich erkennen kann, dient das SAP BW System mit seinen InfoCubes und Data Store Objekten als Datenquelle für das ETL-Tool. Die Daten der Faktentabelle des InfoCubes sollen in diesem Beispiel via ETL-Tool aus dem SAP BW System exportiert und aufbereitet werden. Dazu müssen die Daten zuerst aus dem mehrdimensionalen InfoCube in ein Data Store Objekt mit flachen Tabellen geladen werden. Dieses Data Store Objekt befindet sich, wie der InfoCube auch, innerhalb des SAP BW Systems. Über eine geeignete Schnittstelle kann das ETL-Tool von außen auf die flache Tabelle des Data Store Objekts zugreifen und die benötigten Daten so aus dem SAP BW System extrahieren. Die extrahierten Daten werden daraufhin in mehreren Schritten transformiert und für die Berechnung der Prognosen aufbereitet. Die aufbereiteten Daten werden nach der Transformation durch den ETL-Prozess in eine relationale Datenbank geschrieben, von wo aus sie dann einer Anwendung zur Berechnung der Prognosen bereitgestellt werden. Die auf Java basierende Anwendung ermöglicht dem Benutzer die Eingabe verschiedener Kriterien, über die die Berechnung beliebig eingeschränkt werden kann.
Nach Berechnung der Prognosen legt die Anwendung die berechneten Daten erneut in der relationalen Datenbank ab. Um die Daten in das SAP BW Systemen zurückzuladen, bietet die Anwendung eine Exportfunktion an, welche die berechneten Daten in ein Flat File extrahiert. Über dieses Flat File können die Daten wieder problemlos über die File-Schnittstelle in das SAP BW System zurückgeführt werden.
Zusammenfassung der Kapitel
1. Einleitung: Diese Einleitung beschreibt die Problemstellung des Datenaustauschs zwischen SAP BW und Fremdsystemen, die Zielsetzung der Arbeit sowie den Aufbau der Ausführungen.
2. Grundlegende Technologien: Hier werden die theoretischen Grundlagen zu relationalen Datenbanksystemen, Data Warehouses und dem ETL-Prozess erläutert.
3. SAP BW Standardschnittstellen: Dieses Kapitel gibt einen Überblick über die verfügbaren Schnittstellen von SAP BW, bewertet deren Eignung für den Import und Export von Daten und bildet die Basis für die Auswahl des Tools.
4. Evaluierung von 3rd-party-ETL-Tools: Hier werden verschiedene ETL-Lösungen wie Xtract IS, die Palo Suite, Pentaho Data Integration und Talend Open Studio hinsichtlich ihrer SAP-Anbindung und Eignung für das Projekt verglichen.
5. Export der Daten aus SAP BW: In diesem praktischen Kapitel wird die Vorbereitung der Datenquellen in SAP BW sowie die Konfiguration des Extraktionsprozesses in Palo ETL detailliert beschrieben.
6. Berechnung der Prognosen: Dieses Kapitel erläutert die Entwicklung der Java-Anwendung zur Steuerung der ETL-Prozesse und zur Durchführung der Umsatzprognoseberechnung.
7. Import der Prognosen in SAP BW: Der abschließende technische Prozessschritt beschreibt, wie die berechneten Daten exportiert, aufbereitet und schlussendlich wieder in das SAP BW System zurück importiert werden.
8. Zusammenfassung: Der letzte Teil resümiert die Ergebnisse, zieht ein Fazit über den erfolgreichen Einsatz der Tools und gibt Ausblicke auf mögliche Erweiterungen des entwickelten Prozesses.
Schlüsselwörter
SAP BW, ETL-Prozess, Data Warehouse, Palo Suite, Oracle Datenbank, Java, Prognoseberechnung, Datenaustausch, Schnittstellen, Flat Files, SAP Connectivity, Business Intelligence, Extraktion, Transformation, Laden.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der Evaluierung von ETL-Tools und der Entwicklung eines automatisierten Prozesses, um Daten aus dem SAP Business Warehouse (BW) in eine externe relationale Datenbank zu exportieren und Prognoseergebnisse anschließend wieder in das SAP BW zu importieren.
Was sind die zentralen Themenfelder?
Die zentralen Themen sind der Datenaustausch in heterogenen Systemlandschaften, die Evaluierung von 3rd-Party-ETL-Tools (insbesondere Palo, Pentaho, Talend) sowie die Programmierung einer Java-Anwendung zur Steuerung dieser ETL-Prozesse.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist es, eine effiziente und benutzerfreundliche Lösung zu finden, die ohne aufwändige, manuelle Programmierungen im SAP-System einen automatisierten Export von Daten aus dem SAP BW sowie den Import von daraus abgeleiteten Prognosewerten ermöglicht.
Welche wissenschaftliche Methode wird verwendet?
Es wird eine evaluative und konstruktive Methode angewandt: Zunächst werden vorhandene Technologien und ETL-Tools analysiert und anhand definierter Anforderungen bewertet, gefolgt von einer prototypischen Umsetzung eines Beispielprozesses.
Was wird im Hauptteil behandelt?
Der Hauptteil behandelt die theoretischen Grundlagen, die Evaluierung der Schnittstellen und Tools, die konkrete Umsetzung des Exports aus dem SAP BW mittels der Palo Suite, die Entwicklung eines ETL-Controllers in Java zur Prognoseberechnung und den finalen Import der Daten zurück in das SAP BW.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit wird vor allem durch Begriffe wie SAP BW, ETL-Prozess, Data Warehouse, Palo Suite, Oracle Datenbank, Java-Programmierung und Prognoseberechnung charakterisiert.
Warum wurde die Palo Suite als ETL-Tool ausgewählt?
Die Palo Suite deckte als einzige Lösung die Anforderungen des Autors ab, bot eine direkte Anbindung an das SAP BW über die SAP-Connectivity-Erweiterung und überzeugte durch ein benutzerfreundliches Web-Interface für das Prozessdesign.
Welche Rolle spielt die Java-Anwendung im ETL-Prozess?
Der Java-basierte ETL-Controller dient als zentrales Steuerungselement. Er bietet dem Benutzer eine grafische Oberfläche, um ETL-Jobs zu starten, Parameter wie den Prognosezeitraum zu setzen und die Berechnungen der Prognosen (z.B. mittels linearer Regression) automatisiert auszuführen.
- Arbeit zitieren
- Fabian Reichle (Autor:in), 2011, ETL-Prozess zum Datenaustausch zwischen SAP BW und relationalen Datenbanken, München, GRIN Verlag, https://www.hausarbeiten.de/document/271192