Der Funke springt über - Apache Spark in einem Raspberry Cluster

Conference Day - 16. Februar
 
14:20
15:05
 
Technologie / Innovation
 
Konferenzraum 1.801

Die verteilte Datenauswertung nimmt eine immer stärkere Rolle aufgrund der steigenden Wichtigkeit von Themen wie Big Data und Industrie 4.0 ein. Wir haben im Kleinen ein Cluster mittels Raspberry PI Minicomputern zusammengebaut und mittels Apache Spark dort verteilte Analysen berechnen lassen.

Dieser Vortrag gibt eine Kurzeinführung zu u.a. folgenden Fragestellungen:

  • Wie stelle ich mir ein eigenes kleines Cluster zusammen?
  • Welche Funktionalitäten und mathematischen Modelle bietet Apache Spark zur (verteilten) Datenanalyse?
  • Wie gut skalieren diese Funktionalitäten mit steigender Knoten-/Rechneranzahl?
  • Wie funktioniert das Monitoring der genutzten Rechnerlast und benötigten Zeit in diesem Setup?

Burkhard Hoppenstedt

Universität Ulm, Deutschland

Burkhard Hoppenstedt studierte Medieninformatik an der Universität Ulm und der NTNU (Trondheim). Aktuell promoviert er zum Thema "Predictive Maintenance" am Institut für Datenbanken und Informationssysteme an der Universität Ulm.

Nicolas Kuhaupt

Universität Ulm, Deutschland

Nicolas Kuhaupt studiert Wirtschaftsmathematik an der Universität Ulm und beschäftigt sich in seiner Masterarbeit mit der verteilten Datenauswertung mit Spark.