5 Freunde und der verlorengegangene Gleiswechsel - Monitoring von Microservices

Conference Day
17.05.
ab 13:30 Uhr
bis Uhr
Microservice
Raum
Kraichgau

Abstract

Eine komplexe Software-Architektur ohne Bugs ist wohl Utopie. Das ist bei dem Projekt der Reisendeninformation der Deutschen Bahn nicht anders. Wir begeben uns auf Spurensuche nach verlorengegangenen Gleiswechseln und präsentieren, wie wir in unserem Projekt einen Softwarebug aufdecken. Wir geben einen Einblick in eine moderne eventverarbeitende Microservice-Architektur und stellen euch dabei unsere 5 Freunde zur Überwachung der Produktionsumgebung vor:

  • Alerting (Alertmanager)
  • Metrik-Monitoring (Prometheus + Grafana)
  • Log-Darstellung (Kibana)
  • Individuelle Tools (Konsolentools, Datenspeicher, Analyseskripts)
  • Überwachung und direkte Modifikation der Container-Orchestrierung (k9s)
Folien:

Speaker

Julian Schmidt

andrena objects ag, Deutschland

Julian Schmidt ist agiler Software-Entwickler bei andrena objects und seit derzeit drei Jahren mit viel Freude in einem Backend-Projekt für die Reisendeninformation der Deutschen Bahn tätig. Neben der Weiterentwicklung der Java-Anwendungen im Microservice-Umfeld gehört zu seinen täglichen Aufgabengebieten auch die Überwachung der produktiven Anwendung. Für ihn gehören die Entwicklung von geeigneten Alarmen und die Gestaltung von Metrik-Dashboards genauso zu einem erfolgreichen Software-Projekt wie die Entwicklung von Unit-Tests. Ist Julian Schmidt gerade nicht auf der Suche nach Lösungen von Software-Bugs, kombiniert er gerne seinen Weg aus Escape-Rooms oder lenkt sich leidenschaftlich in der Boulderhalle und draußen am Fels ab.

Christine Schreiber

andrena objects ag, Deutschland

Christine Schreiber ist agile Softwareentwicklerin bei andrena objects. Aktuell unterstützt sie die Deutsche Bahn dabei, die Reisendeninformation konsistenter zu machen – mithilfe eines Microservice-basierten Softwaresystems, das Event-getrieben Millionen Echtzeitdaten am Tag verarbeitet. Ihr besonderes Interesse gilt dabei der Überwachung der Services, um Fehler in Produktion schnell bemerken und eingrenzen zu können.