Continuous Database Evolution

Conference Day - 21. Februar
 
11:05
11:50
 
Technologien und Tools
 
Seminarraum 1.812

NoSQL-Datenbanksysteme zeichnen sich durch eine große Schemaflexibilität aus, was eine Speicherung von Daten in verschiedenen Versionen sehr einfach möglich macht. Auch aufgrund dieser Eigenschaft haben sich NoSQL-Datenbanksysteme inzwischen fest in der agilen Softwareentwicklung etabliert, da sie die flexible und kontinuierliche Datenbankevolution vereinfachen.

Allerdings verlagert diese einfache Speichermöglichkeit heterogener Daten die Verantwortung für das Schema-Management meist in die Anwendungsebene. Denn auch wenn die Datenbank selbst kein Schema verwaltet, stellt der Anwendungscode implizite Anforderungen an die Struktur der gespeicherten Daten. Mit jedem neuen Release müssen die Daten im Produktivsystem in die aktuelle Struktur migriert werden. Das dafür heute übliche Schreiben von Migrationsskripten ist fehleranfällig und teuer.

Aus diesem Grund ist eine (optionale) Schema-Unterstützung auch für schemaflexible NoSQL-Datenbanksysteme sinnvoll und aktuell als Trend zu beobachten. Dieser reicht von ersten Werkzeugen zur Schemavalidierung, zur Schemaextraktion und zur Ausreißererkennung (Outlier Detection) bis zu elaborierten Ansätzen der Ableitung von Schemaevolutionsoperationen und daraus resultierenden Datenmigrationsoperationen.

Dieser Vortrag gibt einen Überblick über die notwendigen Prozessschritte des Schemamanagements in der agilen Anwendungsentwicklung mit NoSQL-Datenbanksystemen. Im Vortrag wird für jeden Prozessschritt erläutert, wie dieser durch Vorgehensweisen und/oder Werkzeuge unterstützt werden kann. Neben Open Source bzw. kommerziell verfügbaren Werkzeugen (u.a. Hackolade und Studio3T) werden auch Ansätze aus Forschung und Entwicklung vorgestellt und demonstriert – u.a. der von uns entwickelte Schema-Management-Prototyp Darwin.

Für die Datenmigration werden verschiedene Migrationsstrategien und ihre Auswirkungen auf den Migrationsaufwand und die Latenzzeit der Anwendung vorgestellt.

Prof. Dr. Uta Störl

Hochschule Darmstadt, Deutschland

Uta Störl war nach ihrer Promotion im Bereich Datenbanken an der Friedrich-Schiller-Universität in Jena mehrere Jahre im Research- bzw. Projektmanagement-Bereich der Dresdner Bank in Frankfurt am Main tätig. 2005 wurde sie als Professorin für Datenbanken und Informationssysteme an den Fachbereich Informatik der Hochschule Darmstadt berufen und leitet dort u.a. das Big Data Competence Center. Aktuelle Schwerpunkte ihrer Arbeit sind Datenbanktechnologien für Big Data und insbesondere NoSQL-Datenbanksysteme. Sie ist Mitherausgeberin des Datenbank-Spektrums.