Wie Big Data und Green IT zusammenpassen
Über Prof. Dr Thorsten Papenbrock
Prof. Dr. Thorsten Papenbrock ist Qualifikationsprofessor an der Philipps-Universität Marburg und leitet dort die Gruppe Big Data Analytics.
Papenbrock studierte IT Systems Engineering am Hasso-Plattner-Institut, wo er 2017 promovierte und anschließend als Senior Researcher forschte. 2021 folgte er einem Ruf nach Marburg.
Prof. Dr. Thorsten Papenbrock
Den „Big Data Stack hoch und runter”
Prof. Dr. Thorsten Papenbrock forscht mit seiner Big Data Analytics Gruppe „den ganzen Big Data Stack rauf und runter“, wie er sagt. Neben klassischen Themen wie Datenbereinigung, Datenintegration oder verteiltes Rechnen liegt sein Fokus derzeit vor allem auf Data Analytics mit dem Schwerpunkt Data Profiling. Das Ziel: Datenbanken und Datenmanagement zu verbessern.
Er erforscht etwa Methoden, um strukturelle Metadaten zu finden, die beschreiben, „wie die Daten aussehen, wie sie funktionieren, wie sie zusammenhängen.“ Im Data Profiling sucht er so nach Regeln, denen die Daten folgen. Das sind oft sehr komplexe Algorithmen, „aber das ist ja gerade das Schöne, wir suchen die Herausforderung“, sagt der Forscher.
Wie Datenbanken und Green IT zusammenhängen
„Inhaltlich verankern wir uns in der Green IT“, sagt Papenbrock. Er sieht die Informatik als eine Disziplin, die helfen kann, Prozesse zu beschleunigen. Seine Forschung kann zum Beispiel Data Warehousing effizienter machen – eine große Klimaquelle, wie er sagt. Konkret geht es darum, große Datenmengen schneller zu verarbeiten, also das Profiling, die Bereinigung und die Integration der Daten zu beschleunigen und damit energieeffizienter zu machen.
Papenbrock arbeitet daher mit Unternehmen wie BMW und Rolls-Royce oder in öffentlichen Projekten des BMWi oder der NFDI an der Verbesserung solcher Datenprozesse.
Im Projekt BMW Analytics erforscht er beispielsweise, wie eine vorausschauende Wartung von Motorrädern auf der Grundlage unzuverlässiger Sensordaten möglich ist. Im Projekt AKITA geht es darum, effizientere Flugzeugturbinen zu entwickeln, die weniger CO₂ und Lärm ausstoßen. Dazu entwickeln die Forscher Systeme zur Erkennung von Anomalien in Triebwerkstestdaten. Das soll die Testzyklen von Rolls-Royce verkürzen und so die Entwicklung besserer Turbinen beschleunigen.
In dem vom BMWi geförderten Projekt Präzisions-LDS sollen KI-Methoden entwickelt werden, die den Prozess der Oberflächenbeschichtung von Offshore-Windenergieanlagen unterstützen. Die Beschichtung soll die Anlagen resistent gegen Salzwasser machen und wird häufig manuell auf Fehler überprüft. Papenbrocks Forschung soll diesen Prozess effizienter machen: „Dann muss niemand mehr mit einem Teststreifen einmal über fünf Kilometer Beschichtungsfläche drübergehen, sondern man hat einen KI-Algorithmus, der sagt: Schau doch noch mal an der und der Stelle nach“.
Effizientere KI und Aufklärung über Green IT
Neben der teilweise enormen Komplexität der Algorithmen nennt Papenbrock den Datenaustausch zwischen Industrie und Forschung oder auch zwischen Forschung und Öffentlichkeit als große Herausforderung. Hier sei eine gute Vernetzung, wie sie hessian.ai biete, von Vorteil.
Das Zentrum helfe ihm, sich mit der hessischen KI-Forschungs- und Data-Science-Szene zu vernetzen und seine Arbeit sichtbar zu machen. Zudem könnten Forschende auf die an den Hochschulen knappen Rechenressourcen zugreifen.
Er sieht in hessian.AI aber auch die Chance, eigene Forschungsthemen einzubringen und das Zentrum mitzugestalten. Denn seine Arbeit könne einen wichtigen Beitrag zur KI-Forschung leisten, bei der das Prinzip „Garbage in – Garbage out“ gelte. Mit seinen Methoden könnten die oft fehlerhaften oder unvollständigen Datensätze besser – und damit effizienter – verarbeitet werden. Damit fördere sie auch direkt Green IT.
Dabei geht es laut Papenbrock um die Beschleunigung von Prozessen und um die intelligente Steuerung von Systemen wie Heizungs- und Klimaanlagen. „Hier sehe ich meine Aufgabe auch darin, zu vermitteln, was im Bereich Green IT möglich ist und wie es umgesetzt werden kann“, so der Datenexperte.