Das Ziel der vorliegenden Projektarbeit ist es, dem Leser einen Überblick über die SAP HANA-Datenbank sowie die In-Memory-Plattform als Ganzes und deren wesentliche Merkmale, Bestandteile und Funktionen zu verschaffen. Dabei soll auch einem Leser, der keinen Bezug zu Datenbanktechnologien hat, anschaulich gemacht werden, wie eine SAP HANA-Datenbank funktioniert, welchem Datenbankmodell es zugrunde liegt und welche Voraussetzungen das System erfüllen muss, damit die SAP HANA-Datenbank in Betrieb genommen werden kann.
Mit der Einführung von Personal Computer ist das digitale Datenaufkommen rasant gestiegen, seien es nun Unternehmensdaten oder Daten, die ihren Ursprung im Internet haben. Daher stehen die Unternehmen vor der großen Herausforderung, die eintreffenden großen Datenmengen effizient zu verarbeiten. Für die die Bewältigung dieser Herausforderung steht der Begriff Big Data. Die klassischen rationalen Datenbanken sind nicht mehr in der Lage, eine so große Datenmenge in Echtzeit zu verarbeiten. Daher müssen andere Ansätze für eine Datenverarbeitung erforscht werden. Durch den Preisverfall für Arbeitsspeicher wurde es für die Unternehmen finanziell möglich, die Server mit einer großen Arbeitsspeichergröße auszustatten, sodass der Datenzugriff auf die Daten nicht mehr über Festplatten stattfinden muss, sondern direkt aus dem Arbeitsspeicher gelesen werden kann. Diese Art der Datenhaltung wird auch In-Memory genannt. Diesen Trend hat auch der weltweit führende Anbieter für Standardsoftware, die SAP, erkannt und eine In-Memory-Datenbank namens SAP HANA entwickelt. Da es eine relativ neue Technologie ist, ist es nicht jedem bekannt, wie sie funktioniert und welche technischen Grundlagen hinter dieser Technologie verborgen sind.
Um den Überblick über SAP HANA In-Memory-Plattform besser darzustellen, ist der Aufbau dieser Projektarbeit in zwei große Teilbereiche aufgeteilt. Zum Verständnis darüber, auf welchen allgemeinen Datenbankmodellen die In-Memory-Technologie und die SAP HANA-Datenbank aufbauen, wird in den ersten Kapiteln der Fokus auf allgemeine Datenbanktechnologien gelegt. Hier werden zum einen die technologischen Grundsätze, aber auch die Geschichte der SAP, das Wie und Warum dargelegt. Der zweite Teil der Arbeit beschreibt die In-Memory-Technologie, die technologischen Wegbereiter für diese sowie den Aufbau einer In-Memory-Datenbank.
Gliederung
1 EINFÜHRUNG
1.1 PROBLEMSTELLUNG
1.2 ZIELSETZUNG
1.3 VORGEHENSWEISE
2 GRUNDLAGEN
2.1 UNTERNEHMENSGESCHICHTE
2.2 GESCHICHTE DES SAP ERP-SYSTEMS
3 DATENBANKMODELLE
3.1 RELATIONALE DATENBANKEN
3.1.1 GESCHICHTE
3.1.2 BEGRIFFSDEFINITION
3.1.3 TECHNISCHES FUNKTIONSPRINZIP VON RELATIONALEN DATENBANKEN
3.1.4 GRENZEN VON RELATIONALEN DATENBANKEN
3.2 NOSQL-DATENBANKEN
3.2.1 GESCHICHTE
3.2.2 BEGRIFFSDEFINITION
3.2.3 TECHNISCHES FUNKTIONSPRINZIP VON NOSQL-DATENBANKEN
3.2.4 SPALTENORIENTIERTE DATENBANKEN
3.3 KONSISTENZMODELLE
3.3.1 GRUNDLAGEN DER KONSISTENZMODELLE
3.3.2 DAS CAP-THEOREM
3.3.3 STARKES KONSISTENZMODELL
3.3.4 SCHWACHES KONSISTENZMODELL
3.3.5 MULTI VERSION CONCURRENCY CONTROL
3.4 SAP HANA IST EINE NEWSQL
4 IN-MEMORY DATENBANK
4.1 WEGBEREITER FÜR IN-MEMORY-DATENBANKEN
4.1.1 ZUGRIFFSZEITEN
4.1.2 MULTI-CORE-ARCHITEKTUR
4.1.3 64-BIT-ARCHITEKTUR UND HAUPTSPEICHERKOSTEN
4.2 FUNKTIONSWEISE EINER IN-MEMORY-DATENBANK AM BEISPIEL SANSSOUCIDB
4.2.1 DATENORGANISATION UND -ZUGRIFF
4.2.2 AKTIVE UND NICHT AKTIVE DATEN
4.2.3 FEHLERTOLERANZ UND VERHALTEN IM FEHLERFALL
4.2.4 ARCHITEKTURSCHEMA SANSSOUCIDB
5 SAP HANA
5.1 EINFÜHRUNG IN DIE HANA DATENBANK
5.2 SAP HANA DATENBANKARCHITEKTUR
5.3 TECHNISCHE VORAUSSETZUNGEN FÜR SAP HANA
6 FAZIT
Zielsetzung & Themen
Diese Projektarbeit zielt darauf ab, dem Leser einen umfassenden Überblick über die SAP HANA-Datenbank und die zugrunde liegende In-Memory-Plattform zu vermitteln. Dabei soll die Funktionsweise der Technologie, ihre Einordnung in bestehende Datenbankmodelle sowie die notwendigen technischen Voraussetzungen für den Betrieb anschaulich erläutert werden.
- Historische Entwicklung von SAP und dem SAP ERP-System
- Vergleich von relationalen Datenbanken und NoSQL-Systemen
- Grundlagen und Vorteile der In-Memory-Technologie
- Technische Architektur von SAP HANA und der SanssouciDB
- Voraussetzungen für die Migration bestehender Systeme auf SAP HANA
Auszug aus dem Buch
3.1.4 Grenzen von relationalen Datenbanken
Die relationalen Datenbanken haben sich im Laufe der Jahre auf dem Markt etabliert. Sie wurden standardisiert und haben eine weite Verbreitung in der Welt der Softwareentwicklung erlangt. Durch die weite Verbreitung und das mathematische Fundament sind die RDBMS leicht zu verstehen, bedienen, administrieren, erweitern und implementieren. Entwicklungen von RDBMS über viele Jahre haben Standards und Stabilität ins System gebracht. Es wurden zahlreiche Kommunikationsschnittstellen entwickelt und speziell für die Eigenschaften der RDMBS optimiert.
Mit dem Internet-Boom stieg die Menge an Daten rasant an und die Anforderungen an das Datenbanksystem haben sich geändert. Das maximal zu verarbeitende Datenvolumen von herkömmlichen RDBMS war begrenzt und mit steigendem Datenvolumen hatten die RDBMS Leistungsverluste. Die RDBMS wurden ursprünglich für stand alone Server konzipiert, was bedeutet, dass nur eine vertikale Skalierung möglich ist. Zwar wurde die Leistung durch stärkere Hardware kompensiert, wobei auch Hardware an Grenzen stößt.
Auch mit steigender Komplexität des Datenaufbaus und von Tabellenbeziehungen werden die tabellenübergreifenden Abfragen mittels JOIN komplizierter und langsamer.
Durch starre Tabellenstrukturen sind relationale Datenbanken nicht flexibel und können an ständig wachsende Anforderungen nicht agil angepasst werden. Dazu muss die Datenbank aus der Produktivumgebung getrennt werden, um Änderungen an den Tabellen vorzunehmen, z. B. um eine neue Spalte mittels ALTER TABLE einzufügen. Für ein Unternehmen bedeutet es den Ausfall des Systems, soweit keine Replikationsdatenbank vorhanden ist. Aber auch die Umstellung auf die Replikationsserver bedeutet einen kurzen Ausfall. Nichts desto trotz muss die Datenbankarchitektur vor dem produktiven Einsatz sorgfältig geplant und getestet werden.
Die Replikationen in RDMBS sind kompliziert und umständlich. Verantwortlich dafür ist das starke Konsistenzmodell. Die Daten werden für den Replikationszeitraum gesperrt, um die Gefahr der Datenmanipulation auszuschließen. Hierzu kommt es zu Leistungseinschränkungen der Operation auf die produktive Instanz. Ein starkes Konsistenzmodell bewirkt, dass die Datenbanken stets konsistent sein müssen. Darauf wird später in Kapitel 2.4.2 ausführlicher eingegangen.
Zusammenfassung der Kapitel
1 EINFÜHRUNG: Diese Einleitung thematisiert das rasant gestiegene digitale Datenaufkommen und die damit verbundenen Herausforderungen für klassische relationale Datenbanken, was zur Entwicklung von In-Memory-Lösungen wie SAP HANA führte.
2 GRUNDLAGEN: Dieses Kapitel erläutert die Unternehmensgeschichte von SAP sowie die evolutionäre Entwicklung der SAP ERP-Systeme über die Jahrzehnte hinweg.
3 DATENBANKMODELLE: Hier werden relationale Datenbanken und NoSQL-Systeme hinsichtlich ihrer Konzepte und Funktionsweisen gegenübergestellt, wobei auch Konsistenzmodelle wie das CAP-Theorem und MVCC beleuchtet werden.
4 IN-MEMORY DATENBANK: Dieses Kapitel definiert In-Memory-Technologien, beschreibt deren Hardware-Voraussetzungen und erklärt anhand der SanssouciDB die Funktionsweise sowie Organisation aktiver und nicht-aktiver Daten.
5 SAP HANA: Hier erfolgt eine detaillierte technische Einführung in die SAP HANA Datenbankarchitektur, deren Bestandteile wie den Index Server und die XS Engine sowie die Voraussetzungen für eine Systemmigration.
6 FAZIT: Die Schlussbetrachtung resümiert, dass SAP HANA durch die Kombination aus In-Memory-Technologie und flexibler Datenverarbeitung einen entscheidenden Leistungsschub für moderne Unternehmen darstellt, trotz des organisatorischen und technischen Migrationsaufwands.
Schlüsselwörter
SAP HANA, In-Memory-Datenbank, Big Data, Relationale Datenbanken, NoSQL, NewSQL, Konsistenzmodell, ACID, BASE, ERP-System, Datenbanksystem, Hauptspeicher, Datenbankarchitektur, SanssouciDB, Datenmigration
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit untersucht die SAP HANA In-Memory-Plattform, beleuchtet ihre technischen Grundlagen und analysiert, wie diese Technologie die Verarbeitung von großen Datenmengen gegenüber klassischen Systemen optimiert.
Was sind die zentralen Themenfelder der Publikation?
Die zentralen Felder umfassen die Geschichte der SAP, den Vergleich zwischen relationalen und NoSQL-Datenbankmodellen, das Prinzip der In-Memory-Datenhaltung sowie die spezifische Architektur und die Implementierungsvoraussetzungen von SAP HANA.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, dem Leser einen fundierten Überblick über die SAP HANA-Datenbank zu verschaffen, ihre wesentlichen Funktionen zu erläutern und ein Verständnis für die zugrunde liegende In-Memory-Technologie und deren Anwendungsgebiete zu schaffen.
Welche wissenschaftliche Methode wurde verwendet?
Die Arbeit basiert auf einer tiefgehenden Literaturanalyse und der Untersuchung technischer Dokumentationen, um die Funktionsweise von SAP HANA und dessen Einordnung in das Spektrum moderner Datenbankmodelle wissenschaftlich herzuleiten.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil befasst sich detailliert mit Datenbanktheorien, den technologischen Wegbereitern für In-Memory-Systeme (wie Multi-Core- und 64-Bit-Architekturen) sowie der spezifischen Architektur und Funktionsweise von SAP HANA.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wichtige Schlagworte sind SAP HANA, In-Memory-Datenbank, Big Data, ACID, BASE, NewSQL und die grundlegende Datenbankarchitektur im Kontext moderner Unternehmenssoftware.
Wie unterscheidet sich SAP HANA von einer traditionellen relationalen Datenbank?
Im Gegensatz zu traditionellen RDBMS, die Daten primär auf Festplatten speichern, hält SAP HANA die relevanten Geschäftsdaten im Hauptspeicher, was eine drastisch schnellere Datenverarbeitung und Analyse ermöglicht.
Welche Bedeutung hat das CAP-Theorem in dieser Arbeit?
Das CAP-Theorem wird genutzt, um die Zielkonflikte in verteilten Systemen – nämlich Konsistenz, Verfügbarkeit und Ausfalltoleranz – zu erklären und einzuordnen, wie SAP HANA versucht, diese Anforderungen auszubalancieren.
Warum ist eine Unicode-Konvertierung für die Migration auf SAP HANA erforderlich?
SAP HANA ist ausschließlich auf Unicode-Systemen lauffähig, da dies ein international standardisiertes Zeichensystem darstellt, das für die globale Anwendungssicherheit und Kompatibilität unerlässlich ist.
Was genau ist die Rolle der XS Engine in der SAP HANA Architektur?
Die XS Engine fungiert als in die Datenbank eingebettete Anwendungsschicht, die es ermöglicht, webbasierte Applikationen direkt auf der HANA-Plattform auszuführen und somit zusätzliche Anwendungsserver in vielen Szenarien obsolet macht.
- Quote paper
- Andreas Markstädter (Author), 2017, Datenverarbeitung mit der SAP HANA In-Memory-Plattform der SAP, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/448968