Connectom Vernetzungs- und Innovationsfonds

Seed Funding

Der Connectom-Fonds bietet Seed-Funding für gemeinsame Forschung zwischen hessian.AI-Mitgliedern und weiteren Kolleg_innen beteiligter Hochschulen. Er wird aus Mitteln des Landes Hessen finanziert und wird von der Technischen Universität Darmstadt als federführende Partnerin in hessian.AI ausgeschrieben. Aus Mitteln des Fonds werden zeitlich begrenzte Vorhaben im gesamten Spektrum von Forschung, Lehre, Demonstratoren-/Prototypenerstellung oder Anwendung mit bis zu 100.000 EUR je Vorhaben gefördert.

Bis zu 100,000 € pro Projekt

Insgesamt 1.2 Mio €

Förderzeitraum 2025

Die Bewertung und Auswahl der zu fördernden Projektskizzen erfolgt durch eine Auswahlkommission, die sich aus Vertreterinnen und Vertretern aller an hessian.AI beteiligten Hochschulen zusammensetzt. Die eingereichten Skizzen werden auf Basis folgender Kriterien bewertet:

Bedeutung für die Schwerpunktsetzung von hessian.AI bzw. die mit hessian.AI gesetzten Ziele
Förderung der interdisziplinären und institutionsübergreifenden Kooperation
Plausibilität der Nachhaltigkeit des geförderten wissenschaftlichen Kontakts
Anschubwirkung bzw. Perspektiven für Anschlussförderung durch Drittmittel
Angemessene Berücksichtigung der jeweiligen Fachdiskussion, Innovationspotenzial und fachliche Kompetenzen der Antragsteller

Peer Reviewed Selection Procedure

Antragsberechtigt sind professorale hessian.AI-Mitglieder und DEPTH-Nachwuchsgruppenleiter_innen. Kolleg_innen anderer Hochschulen können an den Projekten beteiligt sein.

Einsendungen möglich bis 28.02.2025

Jury, die die Institutionen von hessian.AI repräsentiert

Connectom-Funds Ausschreibung 2025 Download

Geförderte Projekte 2025

Energiebasiertes, physikbewusstes Lernen von dynamischen Roboterbewegungen (EnDyRo)

Prof. Jan Peters, Intelligent Autonomous Systems (IAS), TU Darmstadt
Prof. Oliver Weeger, Cyber-Physical Simulation (CPS), TU Darmstadt

Dieses Projekt zielt darauf ab, die dynamische Robotermanipulation, insbesondere bei der anspruchsvollen Aufgabe des Jonglierens, durch physikbewusstes Lernen von kinematischen Modellen zu verbessern. Das Projekt nutzt die Robustheit und die Generalisierungsfähigkeiten der energiebasierten Dynamik, insbesondere durch stabile Hamiltonian neural networks (PHNNs), um die Bewegungsdynamik von Robotern und Bällen zu erlernen, zu optimieren und zu kontrollieren. Zu den Hauptzielen gehören die Erfassung von Roboterbewegungsdaten durch zeitliche Serienmessungen und deren Anwendung zum Erlernen von PHNN-basierten Modellen. Im Rahmen des Projekts werden Modellierungsansätze für die Roboter- und Balldynamik erforscht, die sich mit Herausforderungen wie der Interaktion zwischen Becher und Ball befassen. Anschließend sollen diese Modelle in die Bahnplanung integriert werden, um das Jonglieren mit höheren Geschwindigkeiten, längerer Dauer oder mehr Bällen zu ermöglichen. Das Projekt ist innovativ, da es PHNNs in die reale Robotersteuerung integriert, was sich potenziell auf andere Roboteraufgaben auswirken und künftige Anwendungen des digitalen Zwillings fördern könnte. Die Ergebnisse werden unter auf verschiedene Roboter-, System- und Prozesssteuerungsaufgaben übertragbar sein, wobei die Ergebnisse unter für weitere Zusammenarbeit und Forschung verbreitet werden.

LLMentor: Experten-AI-Coteaching „Einführung in das wissenschaftliche Arbeiten“

Prof. Iryna Gurevych, UKP Lab, TU Darmstadt
Prof. Florian Müller, Urban Interaction Lab, TU Darmstadt

Die Vermittlung methodischer Fähigkeiten für akademisches Arbeiten ist ein grundlegendes Ziel der Hochschulbildung. Während es in anderen Bereichen skalierbare, automatisierte Bewertungs- und Feedbackmethoden gibt, ist die Lehre des akademischen Schreibens stark auf manuelle Korrekturen und personalisiertes Feedback angewiesen. In Anbetracht der großen Anzahl von Studierenden werden Feedback und sogar Bewertungen oft von studentischen Hilfskräften abgegeben, was zu inkonsistenten Bewertungen und potenziell wenig hilfreichem oder sogar falschem Feedback führt. Bestehende, auf künstlicher Intelligenz (KI) basierende Methoden versuchen, diese Herausforderungen durch vollständig automatisierte Lösungen zu bewältigen, haben aber mit zu allgemeinem Feedback und schlechter Einhaltung der Benotungsschemata zu kämpfen. Anstatt den Prozess vollständig zu automatisieren, plädieren wir für eine Zusammenarbeit zwischen Experten und KI, die die Effizienz der KI bei der Verarbeitung großer Textmengen nutzt und gleichzeitig das menschliche Fachwissen in Bezug auf Urteilsvermögen, Pädagogik und differenzierte Bewertung effektiv einsetzt. In diesem Projekt wollen wir daher das Potenzial von KI zur Unterstützung von Lehrern bei der Bewertung und dem Feedback für akademisches Schreiben untersuchen, wobei der Lehrer die Kontrolle behält. Das Projekt hat zwei Schwerpunkte: (1) Entwurf, Implementierung und Erprobung eines Bewertungs- und Feedbacksystems unter Verwendung modernster Large Language Model (LLM)-Agenten und (2) Analyse des Systementwurfs, der Nutzung und der Auswirkungen aus der Perspektive der Mensch-Computer-Interaktion (HCI). Insbesondere werden wir die Rollenverteilung zwischen Experten und KI untersuchen und wie die Schnittstelle gestaltet werden kann, um sicherzustellen, dass der Lehrer die Kontrolle behält und gleichzeitig die einzigartigen Stärken von KI-Systemen nutzt. Wir beabsichtigen, diese Fragen in einer groß angelegten „in-the-wild“-Forschung zu klären, um die ökologische Validität unserer Ergebnisse zu erhöhen, indem wir das System in einem realen Kurs an der TU Darmstadt testen. Wenn unser Projekt erfolgreich ist, wird es die Lehre durch einen innovativen Ansatz verbessern und einen wertvollen wissenschaftlichen Beitrag zu den Bereichen Natural Language Processing (NLP) und HCI leisten.

Differenzierbare Simulationen und implizite neuronale Funktionen zur beschleunigten Entdeckung der molekularen Selbstorganisation

Prof. Gemma Roig, Goethe-Universität Frankfurt, Department of Computer Sciences
Prof. Roberto Covino, Goethe-Universität Frankfurt, Institute for Advanced Studies

Die Selbstorganisation von Molekülen ist von grundlegender Bedeutung für eine Vielzahl biologischer und industrieller Prozesse, von der Enzymkatalyse bis zur Proteinfaltung, und ist entscheidend für ein rationales Design in biomedizinischen und industriellen Anwendungen. Während physikalische Simulationen Genauigkeit und breite Anwendbarkeit bieten, ist die Simulation der Selbstorganisation eine Herausforderung [1]. Molekulare Systeme existieren oft in mehreren metastabilen Zuständen, die durch hohe Energiebarrieren voneinander getrennt sind. Übergänge zwischen diesen Zuständen sind seltene Ereignisse, die auf Zeitskalen stattfinden, die exponentiell länger sind als typische Molekularbewegungen, was eine direkte Simulation prohibitiv teuer macht [2].
Ein wichtiger Ansatz zum Verständnis dieser Übergänge ist die Bestimmung des minimalen Energiepfads (MEP) zwischen metastabilen Zuständen [3]. Der MEP gibt Aufschluss über den Mechanismus der Selbstorganisation und kann als Ausgangspunkt für detailliertere Probenahmen dienen, was ihn zu einem leistungsstarken Werkzeug für die Untersuchung wichtiger molekularer Ereignisse macht. Es gibt zwar physikalisch basierte Methoden zur Ermittlung von MEPs, doch sind diese teuer und lassen sich nicht auf Systeme von praktischem Interesse übertragen. Jüngste Fortschritte im Bereich des wissenschaftlichen maschinellen Lernens in Form von physikinformierten neuronalen Netzen (PINNs) [4] haben ein revolutionäres Potenzial für die Lösung komplexer physikalischer Probleme gezeigt. Gleichzeitig haben differenzierbare molekulare Simulationen die nahtlose Integration von physikalischen Modellen mit modernen maschinellen Lernsystemen ermöglicht [5]. Diese kombinierten Fortschritte bieten die Möglichkeit, neuartige, auf maschinellem Lernen basierende Ansätze zur Bestimmung von MEPs zu entwickeln, die noch weitgehend unerforscht sind.

Erkennen von bearbeitetem Wissen in großen Sprachmodellen (DE|ED)

Prof. Jörg Schlötterer, Universität Marburg, DEPTH Group
Prof. Christin Seifert, Universität Marburg, Department of Computer Science and Mathematics

Mit dem Erfolg von ChatGPT sind große Sprachmodelle (Large Language Models, LLMs) weithin zugänglich und in den täglichen Gebrauch integriert worden. LLM-Parameter kodieren semantische, syntaktische und kontextuelle Informationen. Da sich die Welt weiterentwickelt (z. B. „Der Bundeskanzler von Deutschland ist …“), muss ihr Wissen aktualisiert werden. Knowledge-Editing-Methoden (KE) ermöglichen gezielte Änderungen an LLM-Parametern auf effiziente Weise, ohne dass ein Finetuning des Modells erforderlich ist. Im Idealfall sind die Wissensaktualisierungen rein sachbezogen und wohlwollend. KE können jedoch auch für böswillige Zwecke ausgenutzt werden (z. B. Gefängnisausbruch, Fehlinformationen, Verzerrungen), wodurch LLMs unzuverlässig werden und sich möglicherweise auf große Teile der Gesellschaft auswirken. DEED zielt darauf ab, zu erkennen, ob ein LLM nach seinem ersten Training nachbearbeitet wurde, und den veränderten Inhalt zu identifizieren. Indem es bearbeitete Modelle zur weiteren Untersuchung kennzeichnet – ob wohlwollend oder böswillig – trägt DEED zur Sicherheit der KI bei.

Energy-Efficient Inference of Large Language Models on FPGAs (Effi-LLM)

Prof. Grace Li Zhang, TU Darmstadt, Department of Electrical Engineering and Information and Technology
Prof. Heinz Koeppl, TU Darmstadt, Department of Electrical Engineering and Information and Technology

Große Sprachmodelle (LLMs) haben begonnen, unsere Gesellschaft, Industrie und Wissenschaft grundlegend zu beeinflussen. LLMs, eine Art von tiefen neuronalen Netzen (DNNs), bestehen aus vielen Schichten, in denen Eingaben durch Multiplikations- und Akkumulationsoperationen (MAC) mit Gewichten verarbeitet werden. In LLMs müssen massive MAC-Operationen auf der Hardware ausgeführt werden, was zu einem enormen Energieverbrauch führt. Schätzungen zufolge wird der Energieverbrauch aller KI-Server für Training und Inferenz bis 2027 auf 85,4-134,0 TWh geschätzt, was dem 3-4fachen des Stromverbrauchs eines kleinen Landes wie Irland entspricht. Ein solch hoher Energieverbrauch stellt eine kritische Gefahr für unsere Umwelt dar. Um den Energieverbrauch von LLMs zu reduzieren, bringt das Projekt zwei Gruppen zusammen, um LLMs in zwei energieintensiven Szenarien mit langem Kontext zu komprimieren, d. h. Retrieval-Augmented Generation (RAG) und LLM-basierte Grundmodelle biologischer Moleküle, indem die gemeinsame Nutzung von Parametern über verschiedene Schichten hinweg untersucht wird, und die komprimierten LLMs in digitale Logikschaltungen umzuwandeln. Die resultierenden Schaltungen werden auf FPGAs validiert, um ihre Energieeffizienz zu überprüfen. Diese Demonstration wird auch als Prototyp für künftige Startup-Anwendungen verwendet.

KI-unterstützte Entscheidungsfindung basierend auf intraoperativer Bildanalyse (SINAI-PD)

Prof. Andreas Hecker, Justus Liebig Universität Gießen, Universitätsklinikum Gießen & Marburg GmbH
Prof. Michael Guckert, Technische Hochschule Mittelhessen, KITE
Dr. Anca-Laura Amati, Universitätsklinikum Gießen & Marburg GmbH
Dr. Jennifer Hannig, Technische Hochschule Mittelhessen, KITE, Junior Research Group TimeXAI

Die Entfernung des Pankreaskopfes bei Krebs oder chronischer Entzündung ist eine der risikoreichsten viszeralchirurgischen Operationen mit einer postoperativen Mortalität von ca. 5-8% in spezialisierten Zentren. Bei der Standardoperation, der partiellen Duodenopankreatektomie, wird der Pankreasschwanz erhalten und mit dem Dünndarm verbunden. Dies verhindert Diabetes, birgt aber ein hohes Risiko für Pankreasfisteln (30%), die zu lebensbedrohlichen Komplikationen führen können. Intraoperativ muss entschieden werden, ob es sinnvoll ist, den Pankreasrest zu erhalten (mit möglichen Komplikationen) oder ob eine komplette Entfernung (mit folgendem Diabetes) notwendig ist. Diese Entscheidung basiert auf der intraoperativen Beurteilung der Gewebequalität und hat weitreichende Konsequenzen für das postoperative Outcome der Patienten. Das übergeordnete Ziel des Projektes ist die Entwicklung einer Entscheidungsunterstützung mittels Künstlicher Intelligenz (KI), die intraoperative Bildanalysen und perioperative Patientendaten kombiniert, um eine objektive Risikoeinschätzung zu ermöglichen. Hierdurch können subjektive Einflüsse minimiert werde und die Patientensicherheit durch eine datenbasierte Entscheidungsfindung nachhaltig verbessert werden.
Ziel des Projektes ist es eine interdisziplinäre Kooperation zwischen der Chirurgie des Universitätsklinikum Gießen (Prof. Hecker) und dem Kompetenzzentrum KITE (Prof. Guckert) aufzubauen, die die Grundlage für weiterführende Drittmittelantragstellungen darstellt, die durch dieses Projekt initiiert werden wird. Das Projekt verfolgt einen interdisziplinären Ansatz, bei dem modernste Bildverarbeitungstechnologien mit klinischer Expertise kombiniert werden, um eine evidenzbasierte, KI-gestützte Unterstützung für chirurgische Entscheidungssituationen zu etablieren.

Interaktive Wissenskuration auf der Grundlage von abruforientierter Abfrage und erweiterter Generierung (CuRAG)

Prof. Martin Potthast, Universität Kassel
Prof. Ralph Ewerth, Universität Marburg

Die konversationelle Suche nach wissenschaftlicher Literatur gewinnt immer mehr an Bedeutung, doch die derzeitigen LLM-basierten Lösungen leiden unter mehreren Problemen, darunter eine unvollständige Literaturabdeckung, halbende Erklärungen und ein Mangel an transparenten Zitationsverknüpfungen und Belegen. Semantische Wissensrepräsentationen wie der Open Research Knowledge Graph (ORKG: https://orkg.org) zielen darauf ab, diese Probleme zu lösen, indem sie maschinenlesbare Repräsentationen von wissenschaftlichen Publikationen bereitstellen. Die zuverlässige automatische Erstellung solcher Forschungswissensgraphen bleibt jedoch eine offene Frage. Dies ist besonders in wissenschaftlichen Bereichen eine Herausforderung, in denen die Extraktion von Wissen eine spezielle Terminologie und Entitäts-/Beziehungsschemata erfordert.
Wir schlagen einen bidirektionalen Ansatz vor, der Forschung und Kuratierung durch ein synergetisches
stisches System integriert, in dem menschliche Wissensarbeiter und künstliche Intelligenz die Beiträge des jeweils anderen kontinuierlich validieren und verbessern. Unser Projekt kombiniert (1) eine reproduzierbare, erinnerungsorientierte RAG-Engine (1), die mit bibliometrischen Analysen zur Bewertung der Quellenqualität und zur Navigation im Zitationsnetzwerk angereichert ist, und (2) maßgeschneiderte, interaktive Methoden zur Wissenskuration, bei denen sowohl LLMs als auch Menschen gemeinsam domänenspezifisches Wissen extrahieren, validieren und verfeinern. Interaktive Ergebnisvisualisierungen werden die effiziente Annotation von mehreren Dokumenten unterstützen. Diese Integration ermöglicht es Forschern, konversationelle Literatursuchen durchzuführen, die zuverlässige, gut zugeordnete Informationen liefern und gleichzeitig die Möglichkeit bieten, Verbindungen zwischen Artikeln durch Zitationsnetzwerke zu erkunden. Forscher können Ad-hoc-Wissensdatenbanken zu spezifischen Themen erstellen und gemeinsam nutzen, wobei jedes Ergebnis einen eindeutigen Bezug zu den Quellpublikationen aufweist. Auf ermöglicht es das System den Nutzern, die Suchergebnisse für größere Dokumentensammlungen erneut aufzurufen, zusammenzufassen, zu visualisieren und zu verfeinern. So entsteht eine effiziente, kontinuierliche Feedbackschleife, die sowohl die unmittelbare Sucherfahrung als auch die zugrunde liegende Wissensdarstellung verbessert.
Durch diese Integration schließen wir die kritische Lücke zwischen vollautomatischer (aber fehleranfälliger) Wissensextraktion und manueller (aber nicht skalierbarer) Wissenskuration bei der Suche nach wissenschaftlichen Informationen.

KI-gestützte Drohnenplattform: Innovation für zugängliche Forschung und Lehre, Kappes

Prof. Martin Kappes, Frankfurt University of Applied Sciences, Computer Science
Prof. Christian Baun, Frankfurt University of Applied Sciences
Prof. Matthias Deegener, Frankfurt University of Applied Sciences
Prof. Oliver Hahm, Frankfurt University of Applied Sciences

Die Einsatzmöglichkeiten von Drohnen sind vielseitig, aber der Zugang ist kostenintensiv und technisch zu komplex. Gerade durch die Kombination von Drohnen und künstlicher Intelligenz ergeben sich viele neue Szenarien. Im Rahmen dieses Projekts sollen kostengünstige KI-fähige Drohnen für Lehre und Forschung entwickelt, untersucht und dokumentiert werden. Unser Ziel sind nachvollziehbare Anleitungen für flexible, selbst programmierbare und vor allem kostengünstige KI-fähige Drohnen. Diese werden aus Komponenten konstruiert, die am Markt zuverlässig verfügbar sind und das Einbinden von vorbereiteten Softwaremodulen z.B. für Objekterkennung oder autonome Navigation ermöglichen. Studierende, Forschende und Lehrende sollen in die Lage versetzt werden, mit geringem Kostenaufwand und ohne tiefgreifende Kenntnisse in Elektrotechnik und Mechanik diese Modelle nachzubauen und zu nutzen. Auch der Einstieg in KI-Anwendungen soll durch eine entsprechende Software-Plattform erleichtert werden. Das Ziel dieses Projekts ist somit nicht das Schließen einer technischen Fähigkeitslücke, sondern die Verbesserung der Zugänglichkeit und die signifikante Verringerung der Komplexität des thematischen Einstiegs.

KI-basierte Mensch-Maschine-Interaktion in der Neurorehabilitationsrobotik

Prof. Christoph Hoog Antink, TU Darmstadt, Artificially Intelligent Systems in Medicine
Prof. Jan Peters, TU Darmstadt, IAS

Schlaganfall und Rückenmarksverletzungen gehören zu den Hauptursachen für langfristige körperliche Behinderungen bei Erwachsenen. Jedes Jahr überleben etwa 10 Millionen Menschen einen Schlaganfall, der teilweise gravierende Schäden im zentralen Nervensystem (ZNS) hinterlässt. Das Ziel der Neurorehabilitation besteht darin, die Funktionsfähigkeit nach einer Schädigung des ZNS durch intensive Physiotherapie zu verbessern. Wie in vielen Bereich spielt auch hier KI/Robotik eine immer größere Rolle, sei es in der Grundlagenforschung zum Verständnis der Funktionserholung nach Schlaganfall, oder z.B. als angewandte KI-Forschung im Bereich der robotergestützten Telerehabilitation. Im Rahmen von NeuroRehaBot soll ein CoBot angeschafft und als Demonstrator für KI in der Neurorehabilitation im Bereich der oberen Extremitäten in Betrieb genommen werden. Dafür ist dessen Ansteuerung sowie eine stabile mechanische Anbindung der Proband:innen an den Roboterarm zu entwickeln. Bewegungsmuster, die von Proband:innen mit robotischer Unterstützung ausgeführt werden sollen, werden über ein großes Touch-Display visuell vorgegeben. Der Demonstrator bietet die Grundlage für gemeinsame Forschungs-, Publikations- und Antragsaktivitäten und soll darüber hinaus im interdisziplinären Medizintechnik-Studiengang genutzt werden um Medizintechniker:innen für KI und Robotik zu begeistern.

Erklärbare KI für effiziente DNN-Inferenz auf Hardware (XAI meets Hardware)

Prof. Grace Li Zhang, TU Darmstadt, Department of Electrical Engineering and Information and Technology
Prof. Kristian Kersting, Computer Science Department, TU Darmstadt

Tiefe neuronale Netze (DNNs) haben in den letzten Jahrzehnten große Durchbrüche erzielt. DNNs erfordern jedoch massive Multiplikations- und Akkumulationsoperationen (MAC), und ihre Ausführung auf digitaler Hardware, z. B. zentralen Recheneinheiten (CPUs) und Grafikprozessoren (GPUs), verursacht einen enormen Stromverbrauch. Dies stellt ein kritisches Risiko für die Leistung und die energetische Nachhaltigkeit von Rechensystemen der Künstlichen Intelligenz (KI) dar. Lösungen auf dem neuesten Stand der Technik konzentrieren sich immer noch darauf, die Anzahl der MAC-Operationen in DNNs zu reduzieren, ohne deren Erklärbarkeit für eine effiziente Inferenz auf Hardware zu untersuchen. Da DNNs in einer Vielzahl von Rechenszenarien eingesetzt werden, von Edge-Geräten bis hin zu Rechenzentren, ist eine neue Perspektive zur Untersuchung der DNN-Inferenz auf Hardware notwendig, um die verschiedenen Anforderungen an Leistung und Energieeffizienz zu erfüllen. Um dieser Herausforderung zu begegnen, erforscht dieses Projekt erklärbare KI-Ansätze, die es ermöglichen, Bilddaten früher in die Inferenz von DNNs einzubeziehen. Dadurch kann eine effiziente DNN-Beschleunigung auf Hardware erreicht werden. Diese interdisziplinäre Forschung zielt darauf ab, neue Lösungen für grüne KI zum Nutzen der Umwelt zu entwickeln.

Auswirkung seltener Fälle auf KI-gestützte medizinische Diagnoseentscheidungen: Ein Beispiel für Kinder mit intrakranieller Blutung (RARE-AI)

Prof. Ekaterina Jussopow, TU Darmstadt, Business Informatics
Prof. Anirban Mukhopadhyay, TU Darmstadt, Interactive Graphics Systems Group

Die intrakranielle Blutung (ICH) ist ein kritischer Zustand, der eine schnelle und genaue Diagnose erfordert, doch sowohl Kliniker als auch KI-Modelle haben mit seltenen und unterrepräsentierten Fällen zu kämpfen, insbesondere bei pädiatrischen Patienten. Die meisten ICH-Daten und -Expertisen beziehen sich auf ältere Erwachsene, was zu Fehldiagnosen führt, insbesondere bei Kindern, die ein Kriegstrauma erlitten haben. Dieses Projekt zielt darauf ab, die Zusammenarbeit zwischen Mensch und KI bei der ICH-Diagnose zu untersuchen und zu verbessern, indem adaptive Deep-Learning-Modelle entwickelt werden und die Interaktion zwischen Klinik und KI verbessert wird, um die schlechte Leistung in seltenen Fällen abzuschwächen.

Architektur kognitiver neuronaler Systeme Suche

Prof. Visavanathan Ramesh, Goethe-Universität Frankfurt, Center for Cognition and Computation
Prof. Gemma Roig, Goethe-Universität Frankfurt, Computational Vision & Artificial Intelligence
Dr. Sari Sadiya, Goethe-Universität Frankfurt, Computational Vision & Artificial Intelligence, FIAS

In den letzten Jahren haben sich künstliche neuronale Netze (ANN) als leistungsfähiges Instrument für viele Anwendungen wie Sehen, Sprechen und Sprache erwiesen. Trotz ihres enormen Erfolges weisen sie im Vergleich zu biologischen Systemen inhärente Beschränkungen auf, wie z. B. die Anfälligkeit für feindliche Angriffe und die Unfähigkeit, unter ungünstigen Bedingungen zu arbeiten. Modelle, die besser auf das Gehirn abgestimmt sind, versprechen, diese Herausforderungen zu überwinden.

Es wurden umfangreiche Forschungsarbeiten zur Entwicklung von ANNs durchgeführt, die ähnliche Darstellungen wie im Gehirn erlernen. Obwohl dieser Ansatz weit verbreitet ist, bringt er mehrere Herausforderungen mit sich. In erster Linie wird die Robustheit des Modells in der Regel nicht bewertet. Zweitens stützt sich diese Methode auf manuell entworfene ANNs als Grundlinien, an denen Architekturänderungen vorgenommen werden. Diese inhärente Einschränkung beeinträchtigt die Verallgemeinerbarkeit der Ergebnisse, da das in einem Modell beobachtete Verhalten möglicherweise nicht auf andere ANNs übertragbar ist, die ein besseres Brain Alignment erreichen. Darüber hinaus könnten sich experimentelle Verzerrungen auf die Modellauswahl auswirken; bestimmte Arten von ANNs, die weniger bekannt sind, könnten möglicherweise von der Forschungsgemeinschaft ignoriert werden. Um dieses Problem anzugehen, schlagen wir das Cognitive Neural Architecture Search (Cognitive NAS) Framework vor; dieses Framework optimiert ANN-Architekturen direkt für eine maximale Modell-Hirn-Anpassung. Da NAS einen breiten Designraum erforscht, werden wir unseren Versuchsaufbau so strukturieren, dass die Ergebnisse über Netzwerke mit gemeinsamen Merkmalen hinweg verallgemeinert werden können, wodurch Bedenken hinsichtlich der Verzerrung der Modellauswahl und der Verallgemeinerbarkeit der Schlussfolgerungen verringert werden. Darüber hinaus könnte ein besserer Abgleich zwischen Modell und Gehirn wichtige Erkenntnisse über die Architektur des Gehirns zutage fördern.

KI-gestützte Kontrolle des Mikrobioms (KI-Mikrobiom)

Prof. Lucas Böttcher, Frankfurt School of Finance & Management, Computational Science
Prof. Caroline Faust, KU Leuven, Laboratory of Microbial Systems Biology

Das menschliche Mikrobiom spielt eine wichtige Rolle für die Gesundheit und beeinflusst die Verdauung, die Immunität und die Krankheitsanfälligkeit. Störungen des Mikrobioms wurden mit verschiedenen Erkrankungen in Verbindung gebracht, darunter Morbus Crohn, bei dem ein Ungleichgewicht der Darmbakterien zu chronischen Entzündungen führt. Eine effektive Kontrolle des Mikrobioms könnte dazu beitragen, Behandlungen für solche Krankheiten zu finden. Herkömmliche kontrolltheoretische Methoden sind jedoch nicht ohne Weiteres auf die komplexen, hochdimensionalen dynamischen Systeme anwendbar, die der Dynamik des Mikrobioms zugrunde liegen. Um diese Herausforderung anzugehen, kombiniert dieses Projekt die Expertise des PI B¨ottcher in der Steuerung komplexer dynamischer Systeme mit KI-basierten Methoden und die des PI Faust in der Mikrobiomdynamik und experimentellen Validierung. Durch die Integration dieser sich gegenseitig ergänzenden Perspektiven wollen wir KI-gesteuerte Kontrollmethoden entwickeln und validieren, die die Zusammensetzung des Mikrobioms dynamisch in gewünschte Zustände lenken. Aufbauend auf den jüngsten Fortschritten in der Steuerungstechnik mit künstlichen neuronalen Netzen und automatischer Differenzierung werden wir Steuerungen entwerfen, die mikrobiomspezifische Einschränkungen und Dynamiken berücksichtigen. Diese Steuerungen werden Interventionen optimieren, die mit Ernährungsumstellungen, Präbiotika, Probiotika, Bakteriophagen, gezielten antimikrobiellen Mitteln oder deren Kombinationen durchgeführt werden können, um ein gesundes Mikrobiom wiederherzustellen und zu erhalten. Unser Ansatz verspricht, die Präzisionsmedizin voranzubringen, mit potenziellen Anwendungen bei der Behandlung von Morbus Crohn und anderen mikrobiombezogenen Erkrankungen.

Umwandlung von Kunst und Handwerk durch sinnvolle Mensch-KI-Zusammenarbeit (TACTFUL)

Prof. Christin Seifert, Universität Marburg, Artificial Intelligence
Prof. Marion Koelle, Hochschule RheinMain, Human-Computer Interaction

Traditionelles Handwerk und Künstliche Intelligenz (KI) scheinen sich zu widersprechen: Während das Handwerk die individuellen Fähigkeiten, den Zeitaufwand, die Authentizität und den kreativen Ausdruck betont, wird die KI für ihre Präzision, Effizienz und Fähigkeit zur Automatisierung komplexer oder langwieriger Aufgaben geschätzt. Dennoch ist die Kombination beider Aspekte vielversprechend: Die Unterstützung des Handwerks durch eine sinnvolle Zusammenarbeit zwischen Mensch und KI hat das Potenzial, das Erlernen von Fertigkeiten und deren Erhalt als kulturelles Erbe in Zeiten zunehmender Mobilität und geografischer Trennung zu erleichtern. Wir schlagen daher vor, domänenspezifische KI-Systeme zu entwerfen und zu entwickeln, die die Anforderungen traditioneller Kunst- und Handwerkspraktiken widerspiegeln und eine Mensch-KI-Ko-Kreation ermöglichen. Dies ist ein neuartiges Forschungsziel, da es an Erfahrung mit der Anpassungsfähigkeit von Basismodellen für solche Aufgaben mangelt und Nutzer- und Designanforderungen bisher unbekannt sind. Dem Feld fehlen kuratierte Datensätze und Methoden, die sinnvolle und umsetzbare Erklärungen generieren können. Mit diesem Projekt unternehmen wir einen ersten Schritt zur Erforschung der Mensch-KI-Zusammenarbeit in diesem herausfordernden Bereich, um eine zukünftige Forschungsagenda zu erstellen. Wir steuern einen Datensatz und einen Proof-of-Concept-Demonstrator bei und werden Anträge für die DFG und die Volkswagen-Stiftung vorbereiten.

Nutzung von Heterogenitäten bei den Präferenzen für die Erklärbarkeit (Bespoke XAI)

Prof. Michael Klesel, Frankfurt University of Applied Sciences, Information Systems, Artificial Intelligence and Entrepreneurship
Prof. Ekaterina Jussopow, TU Darmstadt, Business Informatics
Prof. Alexander Benlian, TU Darmstadt, Information Systems and Electronic Services
Prof. Kevin Bauer, Goethe-Universität Frankfurt, Business Informatics

Das maschinelle Lernen (ML) hat in fast allen Bereichen unseres täglichen Lebens erhebliches Potenzial gezeigt. Bei den meisten Ansätzen handelt es sich jedoch um Black-Box-Modelle, was bedeutet, dass es nur sehr wenig Transparenz über die innere Funktionsweise dieser Modelle gibt. Erklärbare KI (Explainable AI, XAI) kann Personen, die Blackbox-KI-Modelle verwenden, Transparenz bieten und hat das Potenzial, das Vertrauen der Nutzer zu erhöhen. Leider zeigt die aktuelle Literatur, dass verschiedene XAI-Visualisierungen zu sehr unterschiedlichen Ergebnissen führen. Manchmal nehmen die Menschen ein höheres Maß an Vertrauen wahr, während XAI in anderen Fällen Verwirrung stiftet. Daher sind weitere Forschungsarbeiten erforderlich, um die Faktoren zu ermitteln, die die Wahrnehmung des Nutzens von XAI durch den Einzelnen beeinflussen. Darüber hinaus sind neue Ansätze erforderlich, um ein XAI-System zu entwickeln, das sich an die individuellen XAI-Präferenzen des Einzelnen anpassen lässt. Bespoke XAI geht diese Probleme auf zwei Arten an: (1) durch die Identifizierung individueller Faktoren, die im Kontext von XAI relevant sind, und (2) durch die Entwicklung eines kausalen maschinellen Lernmodus (CML)l, mit dem die Modalität der XAI-Ebene (visuell oder narrativ) angepasst werden kann. Wir führen groß angelegte Online-Experimente durch, um die Spezifität und Effektivität unseres Modells zu bewerten. Die Ergebnisse dieser Forschung sind breit anwendbar und bieten eine empirische Grundlage für die Entwicklung individuell zugeschnittener XAI-Systeme.

Geförderte Projekte 2024

Machine Learning-Driven Approach for Reliable Diseases Prediction Using Comprehensive Imaging Biomarkers

Prof. Dr. Gemma Roig, Goethe-University, Department of Computer Sciences
Dr. Med. Andreas Bucher (KGU)

The project focuses on revolutionizing medical imaging by integrating AI-driven image processing and Explainable AI (xAI). This approach will enable efficient biomarker identification for multiple medical hypotheses, overcoming the time constraints of human analysis. Automated image analysis, or opportunistic screening, enhances the capabilities of radiologists and provides a wider range of diagnostic information beyond traditional methods, which is essential for personalized medicine. The goal is to develop a comprehensive imaging biomarker platform that identifies a wider range of health indicators missed by standard clinical evaluation, thereby revolutionizing diagnostics.

AI4DNA: AI Methods for DNA-based Data Storage

Prof. Dr. Anke Becker, Philipps-Universität Marburg, FB Biologie / Synmikro
Prof. Dr. Bernd Freisleben, Philipps-Universität Marburg, FB Mathematik / Informatik

In this project, called AI4DNA, we focus on developing a new AI-based encoder/decoder (“codec”) approach supported by machine learning (ML) methods capable of adapting to different storage requirements to ensure optimal error tolerance and coding efficiency. In particular, we plan to use deep neural networks (NNs) and leverage recent DNA-related foundation models based on transformer architectures to create novel DNA codecs that will be adaptable to different storage conditions, utilizing a realistic AI-based DNA channel model. Furthermore, we combine fountain codes with the ML methods to obtain a hybrid rule-aware AI approach to provide error correction and data recovery in DNA storage.

From toddlers to robots: Multimodal object representation learning for multitask robot behaviors

Prof. Dr. Gemma Roig, Goethe-University, Department of Computer Sciences
Prof. Dr. Georgia Chalvatzaki, TUDa, Department of Computer Sciences

How can robots learn robust and generalizable object representations that are useful for tasks, such as manipulating objects, grasping an object, avoiding an object during navigation, etc.? One common way to approach this problem is to learn such objects representations while the robot is learning to perform the specific task, or by deploying pretrained visual models which do not necessarily provide relevant features for robotic task learning. Such techniques might result in object representations that are not generalizable to other scenarios and are not easily transferable to other tasks. Another possibility could be to first learn a general object representation from the robot’s perspective, which is then used to adapt to various tasks. Just like babies and toddlers, robots can inject sequential information from the environment with different sensory modalities. As we explored in previous work on computational modeling visual representation learning in objects, self-learning objectives following the slowness principle and the multi-modality co-occurrence with aligning visual input with sparse and noisy language representations lead object representations that contain both categorical and instance information. Moreover, in prior work we have shown how information-theoretic self-supervised objectives can be leveraged to provide sparse object representations that enable predictive modeling and learning for control, while preliminary work on adapting pretrained visual-language models for robot control affirmed that while pretrained models can help speed up learning, they do not lead to robust and generalizable robot task-oriented learning. In this project, we propose to analyze the impact of object representation learning on the ability of the robot to perform certain tasks. How does including language alignment improve performance, and to what degree is it robust to noise and sparsity at the input level while training? We will adapt the framework proposed in. We will first extend the simulation environment from which contains only toys, to other object categories. Then, we will use the same strategy to train visual models, as well as visual language models, with our dataset. It is important to note that for a thorough analysis of the impact of the pretrained model and what factors are determining the generalization to manipulation tasks to the robot, we need control over the dataset that we use for training, the models, and the level of sparsity and noise of the language input for the alignment. The generation of a simulated dataset enables fine-grained adjustment of all these parameters.

Symposium on Explainable Artificial Intelligence Beyond Simple Attributions

Prof. Stefan Roth, TUDa, Department of Computer Sciences
Prof. Simone Schaub-Meyer, TUDa, Department of Computer Sciences

In recent years, deep learning (DL) has established itself as an integral part of artificial intelligence (AI) for computer vision. Increasingly complex deep neural networks (DNNs) and larger amounts of data have allowed researchers to achieve unrivalled results in various areas, such as semantic segmentation and image generation. While this might be seen as a triumph of DL, DNNs still come with the critical limitation that humans do not comprehend how they actually work. As a consequence, they often receive only limited user trust and should not inconsiderately be applied to safety-critical domains, such as autonomous driving or medical imaging. To solve this problem and open up the „black box“, the field of explainable AI (XAI) aims to better understand DNNs and how they function. In particular attribution research, i.e., understanding how relevant each input feature is for the classification of a single data point, has been a major focus of existing work. While this simple setup is a necessary first step, it rarely helps to gain a significantly greater understanding of the model under inspection, especially for more complex image and video analysis tasks beyond classification.

With this initiative, we aim to assemble researchers at the forefront of XAI research and computer vision to jointly discuss the foundation, requirements, and expectations for XAI beyond simple attributions. In an inaugural symposium, we will establish common grounds, question established explanation types, and dis- cover synergies towards XAI methods that truly promote the understanding of DNNs. Potential topics include mechanistic interpretability, the proper evaluation of XAI methods, prototype-based explanations, and XAI beyond classification. The insights and personal connections gained from the symposium will serve as a basis for future collaborations, potential grant applications, and internationally visible workshop proposals.

Improving the training efficiency of reinforcement learning agents for controlling interlinked production facilities

Prof. Dr. Horst Zisgen, h_da,
Prof. Dr. Bernhard Humm, h_da
Prof. Dr. Robert Miltenberger, h_da

Reinforcement Learning Verfahren ermöglichen es, die Steuerung von verketteten Produktionssystemen autonom zu erlernen. Sie liefern somit einen wichtigen Beitrag zur Lösung der Herausforderungen der Fertigungsindustrie, die mit der Industrie 4.0 einhergehen. Portalroboter sind eine gängige Vorgehensweise für derartige Verkettungen. Im Rahmen des Projekts wurde die Trainingseffizienz Gradienten-basierter Reinforcement Learning Verfahren, wie beispielsweise einem Actor-Critic Ansatz mit generalized advantage estimation, mit der Effizienz eines bereits implementierten DQN-Ansatzes verglichen und insbesondere bezüglich der Laufzeit einige Verbesserungen erzielt. Hier gilt es aber noch weitere Analysen durchzuführen. Des Weiteren wurde ein Multi-Agenten DQN-Ansatz entwickelt, der insbesondere bei komplexen Portalrobotersystemen mit mehreren Laufwägen eine signifikante Verbesserung der Trainingseffizienz ermöglicht. Die Ergebnisse des Multi-Agenten Ansatzes wurden als Artikel im Springer-Journal Production Engineering eingereicht.

Mitigating Shortcut Learning in Machine Learning Models for Medical Imaging

Prof. Christin Seifert, PU Marburg, Fachbereich Informatik
Prof. Dr. Gemma Roig,PU Marburg, Fachbereich Informatik

In diesem Projekt haben wir i) die Beteiligten im Krankenhaus davon überzeugt, dass das Lernen von Abkürzungen tatsächlich ein Problem ist, das sie interessieren sollte, ii) gezeigt, dass es Lösungen gibt (die keine zeitaufwändige Datenannotation und kein erneutes Training erfordern), und iii) mehrere wissenschaftliche Beiträge geleistet. Dies wird durch die nachstehend aufgeführten Vernetzungsaktivitäten, wissenschaftlichen und softwarebezogenen Ergebnisse belegt (Auswahl):
– NeurIPS 2024 (Quynh Le Phuong): Posterpräsentation beim UniReps Workshop
– Le, P. Q., Seifert, C., und Schlötterer, J. Invariant Learning with Annotation-free Environments. UniReps: 2nd Edition of the Workshop on Unifying Representations in Neural Models, 2024.
– Le, P. Q., Schlötterer, J., und Seifert, C. Out of spuriousity: Verbesserung der Robustheit gegenüber falschen Korrelationen ohne Gruppenannotationen. (zur Einreichung)
– Kuhn, L., Sadiya, S., Schlötterer, J., Seifert, C. und, Roig, G. Efficient Unsupervised Shortcut Learning Detection and Mitigation in Transformers. Eingereicht auf der 2025 Conference on Computer Vision and Pattern Recognition (in Vorbereitung)
– Software: Effiziente unüberwachte Erkennung und Abschwächung von Abkürzungen in Transformatoren: https://github.com/Arsu-Lab/Shortcut-Detection-Mitigation-Transformers
– Software: Verbesserung der Robustheit gegenüber falschen Korrelationen ohne Gruppenannotationen: https://github.com/aix-group/prusc

Economics of Optimizing Organizational LLMs (EcOOL)

Prof. Dr. Oliver Hinz, Goethe-University

Large Language Models (LLMs) weisen ein hohes Maß an sprachlichem Wissen auf, welches durch gewisse Fakten („Factual Knowledge“) untermauert wird. Im Unternehmenskontext kann jedoch die Verwendung von vortrainierten LLMs wie ChatGPT aufgrund des begrenzten Wissens über eine bestimmte Domäne mühsam sein. Ziel von EcOOL war daher die Untersuchung, wie LLMs möglichst ökonomisch sinnvoll an organisationsspezifische Gegebenheiten optimiert werden können. Im Fokus der Untersuchungen lag ein Vergleich von Retrieval-Augmented Generation (RAG) mit einem sogenannten Fine-Tuning. Als Evaluationsdatensatz wurde ein Produktsortiment von einem hessischen Gesellschaftsspieleverlag und -Großhandel verwendet.
Im Rahmen des EcOOL-Projekts hat sich gezeigt, dass ein Fine-Tuning zwar technisch möglich ist, dies Unternehmen aber vor einige Hürden stellt. Zum einen muss eine ausreichende Compute-Infrastruktur bereitstehen, um auch große Modelle nutzen zu können. Zum anderen war das Fine-Tuning durch ständig wechselnde Innovationen einem Wandel unterlaufen, welchem kleine und mittlere Unternehmen in Deutschland ohne dezidierte KI-Abteilung kaum gewachsen sein dürften. Darüber hinaus lieferten die durch das Fine-Tuning entstehenden Modelle oft Falschaussagen bzgl. des verwendeten Produktkatalogs. Daher fanden vertiefte Forschungsarbeiten im Bereich der RAG statt. Durch den gezielten Einsatz von Produkt-Filtern in Form von separaten, kleineren Transformer-Modellen konnte bspw. die RAG-Qualität gestärkt und die Ausführungszeit gesenkt werden.
Die Erkenntnisse wurden in einen Workshop der International Conference on Information Systems (ICIS 2024) wissenschaftlich verwertet. Die dazugehörige Projektpublikation wurde mit einem Best-Research-in-Progress-Paper-Award ausgezeichnet. Zusätzlich wurde das Projekt in der Lehre verwertet, bspw. im Rahmen des Seminars „Informationssysteme“ sowie in einer Bachelorarbeit. Neben der wissenschaftlichen Verwertung wurden die Projekterkenntnisse auch wirtschaftsnahe präsentiert, bspw. während eines IHK-Workshops in Frankfurt sowie auf einem KI-Treffen in Leipzig. Auch auf Social Media (insb. LinkedIn) konnten die Ergebnisse publikumswirksam der Öffentlichkeit zugänglich gemacht werden.

Predicting dropouts from psychotherapy

Prof. Dr. Bernhard Humm, h_da

Die Borderline Persönlichkeitsstörung (BPS) ist eine häufige und schwere psychische Erkrankung, die durch erhebliche Instabilität gekennzeichnet ist (Bohus et al., 2020). Die Schwere der Störung spiegelt sich in einem erheblichen Risiko für einen vorzeitigen Tod wider. Die Lebenserwartung von Patient:innen mit BPS ist um etwa 7 Jahre reduziert. Psychotherapie ist nach den gängigen Behandlungsempfehlungen die Behandlung der Wahl. Insbesondere spezifische Behandlungsansätze wie die Dialektisch Behaviorale Therapie (DBT) haben sich als wirksam erwiesen. Die Wirksamkeit wird allerdings durch die hohe Abbruchrate von ca. 28% begrenzt und setzt die Patient:innen u.a. dem Risiko eines wesentlich früheren Todeseintritts aus.

Bisherige Studien haben gezeigt, dass Therapieabbrüche prinzipiell vorhersagbar sind, aber Präzision und Timing der Vorhersage für den klinischen Einsatz noch nicht ausreichend sind. Auch das Konsortium hat bereits umfangreiche Vorarbeiten zu dem Thema durchgeführt und die mangelnde Vorhersagekraft klassischer Machine Learning-Verfahren für den Abbruch von Psychotherapien zur Behandlung der Borderline-Persönlichkeitsstörung festgestellt und publiziert.

Im Projekt wurde eine Datensatz von 75 ambulanten Borderline-Patient:innen untersucht mit insgesamt 120 Merkmalen und 115.000 Datenpunkten.

Die Daten stammen aus Fragebögen, die regelmäßig von Patient:innen und Therapeut:innen im Rahmen der Psychotherapie ausgefüllt werden. Beispiele für Merkmale sind:
(a) demografische Daten wie Alter, Geschlecht und Bildung,
(b) diagnostische Daten,
(c) Fragen an die Patient:innen, die täglich, wöchentlich, vierteljährlich oder halbjährlich gestellt werden, z. B. „Selbstmitgefühl [‚0 – nein‘, ‚1‘, ‚2‘, ‚3‘, ‚4‘, ‚5 – sehr hoch‘]“,
(d) Fragen an die Therapeut:innen, die wöchentlich nach Therapiesitzungen gestellt werden, z. B. „Ich fand es heute schwierig, mit dem/der Patient:in zu interagieren.“

Insgesamt wurden mehr als 100 detaillierte Analysen gefahren und intensiv mit den Therapeut:innen besprochen. Die Herausforderung besteht darin, kontinuierlich die Wahrscheinlichkeit vorherzusagen, dass eine Patient:in die laufende Therapie abbricht, um der Therapeut:in gegebenenfalls einen Hinweis auf eine notwendige Intervention zu geben. Wir haben herausgefunden, dass es tatsächlich eine gewisse Trennung zwischen Patient:innen, die abbrechen, gibt, und solchen, die die Therapie abschließen. Die Abbruchwahrscheinlichkeit der meisten abgebrochenen Patient:innen wird mit > 0,6 vorhergesagt. Bei einigen von ihnen steigt die vorhergesagte Abbruchwahrscheinlichkeit vor dem tatsächlichen Abbruch an. Allerdings haben auch einige abschließende Patient:innen eine vorhergesagte Abbruchwahrscheinlichkeit von 0,6 (False Positive), und bei einigen abgebrochenen Patient:innen wird eine niedrige Abbruchwahrscheinlichkeit vorhergesagt, teilweise sogar um 0 (False Negative).
Obwohl diese vorläufigen Ergebnisse vielversprechend sind, werden wesentlich mehr Patientendaten benötigt, was in einer größeren klinischen Studie adressiert wird. Zur Ermittlung der benötigten Fallzahlen haben wir Lernkurven-Analysen auf die trainierten Machine Learning Modelle durchgeführt.
Im Rahmen des Projekts wurden zwei Publikationen erstellt, die aktuell im Veröffentlichungsprozess sind.

Obwohl diese vorläufigen Ergebnisse vielversprechend sind, werden wesentlich mehr Patientendaten benötigt, was in einer größeren klinischen Studie adressiert wird. Zur Ermittlung der benötigten Fallzahlen haben wir Lernkurven-Analysen auf die trainierten Machine Learning Modelle durchgeführt.
Im Rahmen des Projekts wurden zwei Publikationen erstellt, die aktuell im Veröffentlichungsprozess sind.

Im Rahmen des Projekts wurden zwei Publikationen erstellt, die aktuell im Veröffentlichungsprozess sind.

“AI-ready Healthcare” Podcast

Prof. Dr. Anirban Mukhopadhyay, TUDa,

Bei der Entwicklung von KI-gestützter Technologie für das Gesundheitswesen, das ein hohes Risiko birgt und sehr menschlich ist, spielen öffentliches Engagement und offene Gespräche eine zentrale Rolle für die gesellschaftliche Bereitschaft für die Technologie. Daher ist die Verbreitung von Wissen im Gespräch mit den verschiedenen Interessengruppen von entscheidender Bedeutung und sollte nicht als nachträglicher Gedanke behandelt werden. Die globale akademische Gemeinschaft im Bereich der medizinischen KI nutzte jedoch das Potenzial des öffentlichen Engagements nicht in vollem Umfang aus, da es keinen entsprechenden Kanal gab.
Der „AI-ready Healthcare“-Podcast schließt diese Lücke. Podcasts sind ein großartiges Medium für die Verbreitung von Wissen, konstruktiven Argumenten und tiefgründigen, aufschlussreichen Diskussionen. Indem wir uns fest auf die fortschrittliche KI-Technologie stützen, die in der akademischen Gemeinschaft entwickelt wurde, erkunden wir die dynamische Landschaft der KI im Gesundheitswesen. Oft spreche ich zusammen mit meinem Co-Moderator Henry Krumb mit internationalen Akteuren aus ganz unterschiedlichen Bereichen, wie beispielsweise Kolleginnen aus der medizinischen KI, ärztlichen Wissenschaftlerinnen, Industriepartnerinnen, Regulierungsbehörden, Patientenvertreterinnen und globalen Gesundheitsbefürworter*innen, um nur einige zu nennen.Diese Gespräche führen zu tiefen Einblicken in die translationalen Aspekte der KI-Forschung in der klinischen Versorgung, die oft in traditionellen Kommunikationsformen wie begutachteten Fachartikeln nicht thematisiert werden. Der Podcast hat eine doppelte Wirkung: Er erweitert den Horizont technischer Probleme für akademische Forscher und erhöht die Sichtbarkeit der medizinischen KI-Forschung erheblich.

CovenantAI

Prof. Sascha Steffen, Frankfurt School of Finance & Management

Mit CovenantAI haben wir das erste Large Language Modell eingeführt, das in der Lage ist, Verletzungen von Covenants in von SEC-Dokumenten mit hoher Genauigkeit zu identifizieren. Wir verwenden den MPNET Sentence Transformer, ein hochentwickeltes vortrainiertes Modell, das sich durch die guten Leistungen bei Aufgaben mit ähnlichen Sätzen, sowie deren Klassifizierung auszeichnet. Das Modell ermöglicht es uns, die traditionellen Einschränkungen von Schlüsselwort-basierten Methoden zu überwinden, indem es komplexe Sprachstrukturen und kontextuelle Aspekte innerhalb von SEC-Dokumenten versteht. Wir sind nicht nur in der Lage, Verletzungen von Covenants zu identifizieren, sondern auch wie sie gelöst wurden und sie in Kategorien einzuordnen: Änderungen von Covenants, Verzichte auf Einhaltung mit den Covenants und kompletter Verstos der Covenants. Zusätzlich können wir durch den Einsatz eines multi-step Retrieval-Augmented Generation-Ansatzes präzise Grenzwerte von Covenants aus SEC-Dokumenten extrahieren, was die Wichtigkeit unseres Modells weiter hervorhebt. Ein großer Vorteil des Modells ist, dass es nachdem es trainiert wurde auf alle SEC-Dokumente anwendbar ist einschließlich neuerer Dokumente, was es zu einem skalierbaren und flexiblen Werkzeug macht.

Medical Digital Twin Control with Artificial Neural Networks

Prof. Lucas Böttcher, Frankfurt School of Finance & Management, Computational Science

The goal of personalized medicine is to tailor interventions for maintaining or restoring an individual’s health based on their unique biology and life situation. Key to this vision are computational models known as medical digital twins (MDTs), which integrate a wide range of health-related data and can be dynamically updated. Medical digital twins play a growing role in predicting health trajectories and optimizing the impact of inter- ventions to guide a patient’s health effectively. While MDTs are increasingly adopted in biomedicine, their high dimensionality, multiscale nature, and stochastic characteristics complicate tasks related to optimization and control, such as the development of treatment protocols.

Recent advancements in neural-network control methods show great promise in addressing difficult control problems. However, their application to biomedical problems is still in its early stages. In this project, our goal is to develop dynamics-informed neural network controllers that leverage existing knowledge about the structural characteristics of MDTs to effectively address optimal control problems in medicine. This encompasses tasks like minimizing side effects while removing pathogens. We will illustrate the effectiveness of the proposed control approaches using an MDT focused on pulmonary aspergillosis, a common respiratory fungal infection.

Geförderte Projekte 2022

Smart Assistant for Image-guided Needle Insertion

Dr. Anirban Mukhopadhyay, TUDa, Interactive Graphics Systems Group
Prof. Dr. Jan Peters, TUDa, FB Computer Sciences

Ultrasound-guided percutaneous needle navigation is a common task for clinicians to perform diagnoses (biopsy) and treatments (ablation, neoadjuvant therapy). Such procedures require skilful movement of the needle in conjunction with the U/S probe. Depending on the angle of insertion, the needle is barely visible on the U/S image. However, this task is challenging with patient and tissue movement and requires two steady hands under massive cognitive load. The increasing incidence of cancer in Europe’s ageing population, combined with the lack of qualified clinical staff, makes the timely diagnosis and treatment of cancer a critical health issue. Our goal is to develop an intelligent robotic assistant that can enable unskilled healthcare professionals to perform routine cancer diagnosis and treatment.

Multi-objective Design of Advanced Materials via Compensat

Prof. Hongbin Zhang, TUDa, Department of Materials Sciences
Prof Grace Li Zhang, TUDa, Department of Electrical Engineering and Information Technology

The project aims to develop an adaptive design framework based on neural networks and to use it for the multi-criteria design of advanced materials. To achieve this goal, robust latent space constructions and uncertainty quantification are required. However, these two requirements cannot be directly met with the conventional weight-based neural networks with single-valued predictions. In this project, we will apply error suppression and compensation to improve the robustness of neural networks in dimensionality reduction, and the uncertainties will be modelled and evaluated using Bayesian neural networks based on statistical training. These implementations will be used to perform adaptive multi-objective design of novel functional materials, including permanent magnets, thermoelectric materials and high-entropy alloys, using the existing databases and further developed into a generic framework for future autonomous experiments.

Sustainable grain cultivation through AI-based early detection of pests

Prof. Dr. Dominik L. Michels, TUDa, FB Computer Science
Prof. Dr. Bernd Freisleben, Philipps-Universität Marburg, FB Mathematics and Computer Science
Prof. Dr. Kristian Kersting, TUDa, Department of Computer Science

Plant protection products are used in agricultural fields to protect crops from pests, diseases and weeds. On the one hand, this favours the cultivation practices of closely timed, monotonous crop rotations, but is accompanied by highly problematic losses in landscape and biodiversity. Furthermore, pesticide residues end up in animal feed and human food and are thus also consumed by consumers. Cereals can currently only be grown to the extent required (climate change, war in Ukraine, etc.) with the use of enormous quantities of plant protection products such as pesticides, herbicides, fungicides and insecticides. As a result, however, around 385 million people are poisoned by pesticides every year. In order to reduce the dramatic consequences of the current form of cereal cultivation for nature, humans and animals, the use of pesticides must be reduced as far as possible. Instead of applying pesticides on a large scale to entire fields, they should only be applied in a targeted manner to those areas where this is really indicated. This requires an automatic early detection of diseases and pests.The aim of this research project is therefore to develop a prototype for an early detection system for pests in cereal crops.Firstly, a flying drone (UAV) will record close-up images of various groups of cereal plants in the field using a high-resolution camera.These images will then be analysed using computer vision for signs of the so-called Hessian fly (lat. Mayetiola destructor, eng.Hessian fly), one of the most problematic pests in cereal cultivation.A suitable insecticide can then be sprayed on the affected areas in a targeted manner (precision spraying).The sub-discipline of machine learning (ML) in AI has suitable deep neural networks (deep learning) that can be used to recognise areas yellowed by the presence of the Hessian fly.

Lifelong Explainable Robot Learning

Prof. Dr. Carlo D’Eramo, University of Würzburg and TUDa, FB Computer Science
Prof. Dr. Georgia Chalvatzaki, TUDa, FB Computer Science

Current demographic trends and reports of a shortage of carers make the need for intelligent robots that can act as universal assistants essential.While robot learning promises to equip robots with complex skills through experience and interaction with the environment, most methods are too tailored to individual tasks that do not generalise well in the non-stationary real world.Conversely, humans are constantly learning and building on existing knowledge.Lifelong learning of robots requires that an agent can form representations that are useful for continuous learning of a set of tasks to avoid catastrophic forgetting of previous skills. We propose to investigate a method that enables robots to learn a set of behaviours through multimodal cues that can be easily assembled to synthesise more complex behaviours. We propose to incorporate large pre-trained base models for language and vision into robot-oriented tasks. We will explore the design of novel parameter-efficient residuals for lifelong reinforcement learning (RL), which would allow us to build on previous representations to learn new skills while avoiding the two main problems of task interference and catastrophic forgetting.Crucially, we investigate forward and backward transfer and inference from the perspective of explainability to enable robots to explain non-experts similarities they have found during their training life in different tasks, and even to translate their actions during the execution of a task into natural language explanations.We argue that explainability is a crucial component to increase the trustworthiness of AI robots during their interaction with non-expert users.Therefore, we call this area of work Lifelong Explainable Robot Learning (LExRoL), which opens new avenues of research in the field of lifelong learning and robotics.

SPN to AI-Engine Compiler (SAICo)

Prof. Dr.-Ing. Andreas Koch, TUDa, Department of Embedded Systems and Applications (ESA)
Prof. Dr. Kristian Kersting, TUDa, Department of Computer Sciences

The Artificial Intelligence and Machine Learning LAB (AIMLL) and the Department of Embedded Systems and their Applications (ESA) have been working on various aspects of Sum Product Networks (SPNs) for several years. SPNs are a machine learning model closely related to the class of probabilistic graphical models and allow the compact representation of multivariate probability distributions with efficient inference.These properties allow, for example, neural networks to be augmented in order to increase their accuracy and allow predictions to be evaluated.In the context of SPNs, SPFlow is one of the most relevant software libraries.SPFlow is primarily developed and maintained by AIMLL and allows different types of SPNs to be created and trained quickly and easily. SPFlow offers a wide range of options for creating SPNs: Standard training routines can be used as well as customised training approaches. In addition, SPFlow can be extended so that the models, training and inference can be adapted accordingly. As part of a loose collaboration between AIMLL and ESA, a project dealing with the acceleration of SPN inference was launched back in 2018. The expertise in relation to MLIR and the acceleration of SPNs is to be used to extend the SPNC so that it can also be compiled for AI engines (AIEs) in the future. The overall aim of the project is to develop AI engines as a possible target architecture for SPN inference.In particular, various options for optimising the models are also to be evaluated, as new architectures in particular can often only be used optimally if corresponding peculiarities of the architecture and the corresponding models are exploited.The SAICo project proposal thus optimally combines the compiler/architecture-specific experience of the ESA research group with the model-related expertise of AIMLL.

SyCLeC: Symposium on Continual Learning beyond Classification

Dr. Simone Schaub-Meyer, TUDa, Department of Computer Sciences
Dr. Martin Mundt, TUDa, Department of Computer Sciences

Much of the recent progress in artificial intelligence (AI) has been focussed on improving performance numbers or qualitatively appealing examples. This may be due in part to the way we set up a traditional machine learning workflow. Typically, we start by defining a limited, well-defined task, collect data for that task, select a statistical model to learn it, and later typically conclude that an approach is successful if it performs well on the appropriate test data.This process is often repeated several times to improve the result, either by optimising the model (model-centric view) or by collecting or processing more data (data-centric view).However, well-designed real-world systems require more than just the best performance number in a benchmark. Dedicated test sets are limited not only by the fact that they do not take into account the variance of the appearance of new, unknown data during deployment, but also the different ways in which tasks change over time. A single good number in a test set therefore does not reflect the experiences and changes that a system undergoes in the real world. As much as we seem to know how to tune our popular static benchmarks, we seem to know less about how to formulate general learning processes that are able to continually learn from endless streams of data, and to adapt and generalize to modified scenarios, as we humans do. Continual, or lifelong, machine learning addresses the crucial questions that arise when aiming to overcome the limitations of single training cycles, rigid inference engines, and fixed datasets. In contrast to conventional benchmarks for machine learning, the project investigates how learners can continue to use, expand and adapt their knowledge when confronted with changing and novel tasks over time. At the heart of this is the realisation that data selection, models, training algorithms and evaluation benchmarks are not static. Despite their recent popularity, current research has only just begun to understand how we can accommodate these factors in human-like, lifelong learning AI systems. Although ongoing efforts are beginning to consider complex sequences of datasets, they are predominantly focused on image classification tasks.Unfortunately, such tasks greatly simplify learning, e.g. by only performing image-level recognition and assuming that all data is always labelled and that continuous learning mainly consists of recognising new object types.In this initiative, we therefore want to bring together researchers who are leaders in the field of continuous learning and computer vision to jointly lay the foundations for continuous learning beyond classification. In an inaugural symposium, we will identify commonalities and synergies with respect to continuous learning for a variety of relevant computer vision tasks, such as semantic segmentation and learning without classification.

Neural cellular automata enables federated cell segmentation (FedNCA)

Dr. Anirban Mukhopadhyay, TUDa, Department of Electrical Engineering and Information Technology
Prof. Dr. Heinz Koeppl, TUDa, Department of Electrical Engineering and Information Technology

The trend towards increasingly resource-intensive models is at odds with the goal of democratising deep learning for all. Favourable access to AI technology and a low barrier to entry for participation are necessary to promote and fully exploit the potential of participation around the world. The possibility of widespread collaboration encourages the collection of diverse data, which ultimately enables complex problems to be solved. This includes frugal digital health innovations that could provide access to healthcare for the last billion people. Federated learning is a viable solution, but is inaccessible due to high network bandwidth and computing requirements for clinics that cannot afford such infrastructure.The recently emerging field of neural cellular automata (NCA), which are models that converge to a defined target only through local communication, is in contrast to this as they are lightweight in terms of parameters and computational requirements.However, training NCAs in a centralised environment is already difficult and federated training of NCAs has never been attempted. We propose to (1) combine the expertise on self-organisation with the experience from the development of the first NCA for medical image segmentation to develop a novel lightweight federated NCA learning and inference algorithm. (2) The developed algorithms will be tested within the established collaboration with Peter Wild from the University Hospital Frankfurt for the segmentation of histopathology images. (3) As an extreme example, the capability of federated learning with NCA over a VAST network of low-cost computing devices is demonstrated.

Memristors – eine zentrale Hardware für KI

Prof. Dr. Lambert Alff, TUDa, FB Material Sciences
Prof. Dr.-Ing. Andreas Koch, TUDa, Department of Embedded Systems and Applications (ESA)
Prof. Dr. Christian Hochburgen, TUDa, FB ETIT

Künstliche Intelligenz wird quasi ubiquitär in die verschiedensten Lebensbereiche Eingang finden. Dies bedeutet aber auch gleichzeitig, dass der Aspekt der Energieeffizienz des damit verbundenen Rechenaufwands immer wichtiger werden wird. Daher ist die Entwicklung der für die KI eingesetzten Computerarchitekturen ein wichtiges Forschungsfeld. Ein wesentliches neues Bauteil für KI-angepasste Rechnerarchitekturen ist der sogenannte Memristor. Es gibt mehrere materialwissenschaftliche Ansätze, mit denen (hochgradig energieeffiziente) Memristoren realisiert werden können, aus denen aber unterschiedliches Bauteilverhalten resultiert bzw. realistische Einsatzszenarien noch gar nicht erforscht wurden. Dieses Projekt zielt darauf ab, die für Memristoren notwendige Kette vom Material über das Bauteil hin zur Schaltung für bestimmte Anwendungen der KI zusammenzubringen und gemeinsame Forschungsprojekte im Sinne dieses interdisziplinären und holistischen Ansatzes zu befördern.

The Algonauts Project Demonstrator: Explaining the brain with AI models

Prof. Dr. Gemma Roig, Goethe-University, FB Informatik

The Algonauts project is an ongoing project that aims to explore human and machine intelligence using the latest algorithmic tools (Cichy et al., 2019). In this way, the Algonauts project serves as a catalyst to bring together researchers from the fields of biological and machine intelligence on a common platform to exchange ideas and advance both fields in the form of challenges and joint workshops (http://algonauts.csail.mit.edu/). Here we propose to leverage the ongoing success of the Algonauts project to motivate young talents, including high school and undergraduate students, to become the future leaders in the field of AI from an interdisciplinary perspective. To this end, we aim to build a demonstrator that shows how AI models, in particular artificial deep neural networks, can be used to reveal the workings of the brain that lead to human behaviour, and how the insights gained can be used to guide the design of brain-inspired AI models that could have desirable properties similar to human cognition, such as modularity of functions. This could shed light on how to support more transparent and explainable behaviour of model decisions, as well as how to develop models that are robust to perturbations and noise. The demonstrator is intended to be interactive and provide a user-friendly interface to go through the three main steps of using AI models to understand the human brain. Step 1 is to collect brain data from people viewing images or videos, step 2 is to select existing AI models or create your own model to explain the brain data, and the third step is to compare the two to gain insights into what is happening inside the brain while people are viewing the stimuli. To this end, we will integrate into the core of the demonstrator our laboratory toolbox called Net2Brain, whose purpose is to integrate AI models to predict brain data (Bersch et al., 2022). We will improve and further develop it so that it can later be made available to the scientific community. An important goal is the integration of AI models developed in hessian.AI, e.g. those with human learning characteristics, such as continuous learning models (Dr Mundt) and embodied models from robotics (Prof Chalvatzaki), as well as interpretability and explainability algorithms.

Development, evaluation and transfer of data science tools for right-censored and high-dimensional data

Prof. Dr. Antje Jahn, Darmstadt University of Applied Sciences, Department of Mathematics and Natural Sciences
Prof. Dr. Sebastian Döhler, Darmstadt University of Applied Sciences, Department of Mathematics and Natural Sciences
Prof. Dr. Gunter Grieser, Darmstadt University of Applied Sciences, Department of Computer Science
Prof. Dr. Bernhard Humm, Darmstadt University of Applied Sciences, Department of Computer Science

In machine learning (ML), open-source and free software packages for common ecosystems such as R and Python are responsible for the transfer into practice and the entry point for many beginners into the data science field. Advanced users make the informed choice of their tools through the information from academia, where systematic evaluations of different packages and implementations support this choice for a specific application purpose. The overall goal of this project is to make knowledge about new methods for high-dimensional and right-censored data available to beginners and experienced users. Hochdimensionale Daten treten zum Beispiel im Gebiet des Text Mining oder der genetischen Statistik auf. Basierend auf aktuellen Forschungen zu Goodness-of-Fit (GOF) Tests für hochdimensionale Daten soll ein R-Paket erstellt werden, welches die Anwendung dieser Methoden für die genannten Gebiete vereinfacht. Rechtszensierte Daten treten häufig in medizinischen Daten oder im Gebiet des predictive maintenance auf. Examples include predictions of survival probabilities under various medical interventions or the prediction of optimal maintenance times for technical devices. Right-censored data requires special data science methods, for which there is sometimes insufficient support for an informed selection of implementations. This support is provided in this project. The transfer of the results achieved is to take place in the form of a multimedia campaign – consisting of a short video channel, a video channel and a blog – under the aspect of the ‘third mission’.

KIPP TransferLab – KI in Planung und Produktion | AI in planning and production

Prof. Dr. Michael Guckert, THM, Department of Mathematics, Natural Sciences and Data Processing
Prof. Dr. Thomas Farrenkopf, THM, Department of Mathematics, Natural Sciences and Data Processing
Prof. Dr. Nicolas Stein, THM, Department of Mathematics, Natural Sciences and Data Processing
Prof. Holger Rohn, THM, Department of Industrial Engineering and Management
Prof. Dr. Udo Fiedler, THM, Department of Industrial Engineering and Management
Prof. Dr. Carsten Stroh, THM, Department of Industrial Engineering and Management

Small and medium-sized enterprises (SMEs) are under increasing pressure to innovate these days. They operate with limited financial and human resources and therefore have to operate complex production structures, often with one-off and small batch production. Effizienzsteigerung in der Produktion besitzt häufig existentielle Bedeutung. Limited capacities also force them to make efficient use of the available production resources while at the same time meeting the increasing quality requirements of the markets.
Artificial intelligence (AI) in production can be used in a wide range of corporate processes and bring about lasting effects. Eine systematische, automatisierte Erhebung von Daten, die während der Fertigung unmittelbar in den Maschinen anfallen, erlaubt eine konsequente Anwendung von KI-Algorithmen und unterstützt genauere Vorhersagen der tatsächlichen Ressourcennutzung. Aus den Daten gewonnene Erkenntnisse können Prognosen von Ausbringungsmengen und -qualitäten oder Maschinenverfügbarkeiten ermöglichen. Unmittelbare Effekte einer solchen intelligenten Maschinen- und Prozessüberwachung sind eine höhere Liefertreue, eine effizientere Auslastung der Ressourcen im Unternehmen (inkl. Energie- und Ressourceneffizienz) und eine erhöhte Transparenz über den Zustand der eingesetzten Fertigungsanlagen. In order to advance the level of AI maturity in SMEs, the high potential of the technology is to be illustrated with the help of demonstrators in a real laboratory environment. The impetus already given for the introduction of AI can be used as a lever and systematic implementation can be started in addition to the already known application possibilities. In addition to the processes, the operational use in a laboratory environment is also shown using demonstrators.

Automatic classification of toxic and false content for the younger generation using advanced AI methods

Prof. Dr. Melanie Siegel, Darmstadt University of Applied Sciences, Department of Computer Science
Prof. Dr. Bernhard Humm, Darmstadt University of Applied Sciences, Department of Computer Science

The original idea of social media was to enable people to exchange information and opinions as openly as possible and thus support communication. This idea of social participation is being massively disrupted by current developments: where an open exchange of opinions on political issues was possible, the forums are increasingly being flooded with hate and threats of violence. Where free access to information was the goal, false factual claims are increasingly being made and in some cases automatically disseminated. Texts, images and videos are used and semantically linked to each other. It is becoming increasingly difficult for children and young people in particular to categorise information. There are two basic ways in which toxic information can be recognised: intrinsically by analysing and evaluating published content or extrinsically by evaluating such content in the context of other information. One must be able to classify a post as harmless banter or opinion, insult, discrimination, or even threat.
In addition, a distinction must be made between a harmless private false claim, a socially relevant false claim that should at least be commented on journalistically, and even acts of disinformation that are relevant under criminal law. Automatic processes can help with categorisation, as the DeTox project has already shown. However, the topics and language of toxic content are constantly changing, so it is necessary for the models (automatic processes – intelligent systems) to be regularly retrained. In the case of models based on neural networks, however, further training can lead to previously trained content being overwritten and the models no longer functioning on the original (old) data (‘catastrophic forgetting’). Complete retraining is usually not practicable due to the high model complexity and the associated high computational effort. False reports are not only made up of language (text). In order to transfer opinions, images and texts are often combined from a different context and placed in a new, non-existent context. Dies macht eine menschliche und automatische Erkennung besonders schwierig. Therefore, approaches are needed that analyse the text and the image in context.

Cooperation in the Repeated Prisoner’s Dilemma with Algorithmic Players / Wie kooperativ sind Menschen und KI-Algorithmen?

Prof. Dr. Oliver Hinz, Goethe University Frankfurt, Department of Economics
Prof. Dr. Matthias Blonski, Goethe University Frankfurt, Department of Economics

The aim of the project at the interface between AI and microeconomics is to understand how cooperative behaviour changes with repeated interaction with learning machines instead of humans. The following research questions are considered: How does the willingness to cooperate in the repeated prisoner’s dilemma change when one of the players is replaced by an artificially intelligent algorithm? How does this willingness depend on the expected duration of the game and the knowledge of the human about the identity of the opponent? Do any differences in cooperative behaviour result from the changed nature of the opponent (human or machine) or from deviating strategic behaviour?

The virtual doc: An AI-based medical decision support system

Prof. Dr. Dominik Heider, Philipps-Universität Marburg, FB Mathematics/Computer Science
Prof. Dr. Thorsten Papenbrock, Philipps-Universität Marburg, FB Mathematics/Computer Science
Prof. Dr. Bernd Freisleben, Philipps-Universität Marburg, Mathematics/Computer Science

The COVID pandemic has exposed the weaknesses of healthcare systems worldwide and the immense pressure doctors are under. In addition, the WHO estimates that there will be a shortage of 12.9 million healthcare professionals by 2035. The Virtual Doc project aims to support medical staff through the use of advanced sensor technologies and state-of-the-art artificial intelligence (AI) methods. The virtual doctor performs various medical tasks on a patient in an intelligent examination cubicle. The sensors in the cabin measure non-invasive parameters (e.g. BMI, heart rate, pulse) and the computer infrastructure interactively records the patient’s medical history to avoid invasive measurements. Clinical parameters are made available to physicians, including advanced disease predictions based on machine learning models for specific (or as yet unknown) conditions (e.g. type 2 diabetes mellitus (T2DM)). In this way, the virtual doctor can relieve medical staff of these tasks, freeing up capacity for treatment, emergencies and care. With this project proposal, we want to expand our existing prototype of the virtual doctor with additional sensors and analysis modules and eliminate potential sources of error. We also want to strengthen collaboration in this multi-faceted project by involving other research groups and their expertise in the development of the virtual doctor. The extent to which such an AI-supported preliminary examination makes sense and is accepted by the population will be investigated in parallel with the help of a survey (cooperation with Prof Dr Michael Leyer, Department of Economics, University of Marburg) and an on-site test in a double cabin at Bochum University Hospital (cooperation with Prof Dr Ali Canbay, UK RUB).

Visual analysis for predicting relevant technologies using neural networks (VAVTECH)

Prof. Dr. Kawa Nazemi, Hochschule Darmstadt, Department of Computer Sciences
Prof. Dr. Bernhard Humm, Hochschule Darmstadt, Department of Computer Sciences

New technologies, as well as already existing but unused technologies, have the potential to sustainably increase the innovative capacity of companies and secure their future success. However, if these relevant technologies and the associated new areas of application are not identified early enough, competitors may establish themselves in these fields ahead of time. Furthermore, neglected new technologies carry the risk of disrupting the corresponding market when they are introduced, potentially displacing unprepared companies. A valid analysis and prediction of potential future technologies is therefore more important than ever.The VAVTech project aims to develop a visual analysis system that enables people to recognize relevant technologies as early as possible and predict their potential trajectory. Scientific publications will serve as the data foundation for the analysis system, as they present respective technologies at a very early stage, making them suitable for early technology detection.The system will primarily combine neural networks and interactive visualizations, allowing companies, startups, and strategic consultants to analyze and predict the potential of new and largely unknown technologies. The neural network will be developed in a modular way to ensure its transferability to other domains. As part of the project, a functional demonstrator will be created using real-world data, laying the foundation for further work in the field of strategic foresight through the application of artificial intelligence methods.The demonstrator will serve multiple purposes: acquiring third-party funding, networking with other AI researchers, and increasing the visibility of the research through visualizations.

Women in the Field of AI in Healthcare „Women AI Days„

Prof. Dr. Barbara Klein, Frankfurt University of Applied Sciences, Department of Social Work and Health
Prof. Dr. Martin Kappes, Frankfurt University of Applied Sciences, Department Computer Sciences and Engineering

The UNESCO Recommendation on the Ethics of Artificial Intelligence establishes globally accepted standards for AI technologies, to which 193 member states have committed. Ethical guidelines are linked to human rights obligations, with a focus on so-called „blind spots,“ such as AI and gender, education, sustainability, and others. For Germany, there is significant need for action in the areas of equal treatment and diversity within AI development teams. Diversity is considered one of the prerequisites for ensuring that such considerations are appropriately reflected in AI programming.The field of artificial intelligence in Germany, among other things, requires a higher proportion of women to avoid future social biases and gender inequalities caused by unconscious biases in algorithms.This aligns with the UNESCO Recommendation, which was adopted on November 23, 2021, as the first globally negotiated legal framework for the ethical development and use of AI. Gerade im Gesundheitswesen und der Medizin sind Frauen unzureichend berücksichtig, was zu fatalen Auswirkungen in der medizinischen Versorgung führt, wenn z. B. Medikamente nur mit Männern getestet wurden. Die Zugänge für Frauen in klassische Männerdomänen wie den IT-Sektor sind oft immer noch schwierig. The goal of the initiative is therefore a three-day workshop (Women AI Days) to connect national female experts and analyze needs, such as strengthening the proportion of women and making research and work areas visible to young talents. Through accompanying social media efforts, a publication, and subsequent public lectures at Frankfurt UAS, the content will be made known to the public, with a particular focus on the state of Hesse.

Geförderte Projekte in der zweiten Runde der Aufforderungen (2022)

Accelerating Cardinality Estimation (ACE)

Prof. Dr.-Ing. Andreas Koch, TUDa, Department of Embedded Systems and Applications (ESA)
Prof. Dr. Carsten Binnig, TUDa, Data Management

Sum-Product-Networks (SPNs) gehören zur Klasse der graphischen probabilistischen Modelle und erlauben die kompakte Repräsentation von multivariaten Wahrscheinlichkeitsverteilungen. Während das Fachgebiet ESA vornehmlich die Beschleunigungsmöglichkeiten von SPNs untersucht hat, hat das FG DM sich damit befasst, für welche Anwendungsfälle im Bereich der Datenbanken SPNs genutzt werden können. Hierzu zählt z.B. die Cardinality Estimation. Sie kann verwendet werden, um die Ergebnisgrößen von Datenbank-Anfragen vorherzusagen und damit die Anfragenbearbeitung von Datenbank Management Systems (DBMS) zu optimieren. Das Gesamtziel des Projekts ist die generelle Beschleunigung der Cardinality Estimation mittels RSPNs (Relationale SPNs), die Automatisierung des Entwicklungs- und Trainingsprozesses der RSPNs sowie darüber hinaus die Untersuchung der potentiellen Nutzbarkeit im Kontext von großen Datenbanken. Die Erweiterung des SPNC, sowie die Bereitstellung entsprechender Trainingsprozesse versprechen in der Kombination hochinteressante, praktisch relevante Forschungsergebnisse, die auch in die anderen Projekten in den beiden beteiligten FGs eingehen können.

AI4Birds: Bird Species Recognition in Complex Soundscape Recordings

Dr. Markus Mühling PU Marburg, FB Mathematics & Computer Science
Prof. Dr. Nina Farbig, PU Marburg, FB Biology
Prof. Dr. Bernd Freisleben, PU Marburg, Dept. of Mathematics & Computer Science, Distributed Systems and Intelligent Computing

In diesem Projekt konzentrieren wir uns auf die automatische Erkennung von Vogelarten in Audioaufnahmen. Um die derzeitigen Überwachungsprogramme für die biologische Vielfalt zu verbessern, wird AI4Birds Tonaufnahmen in einem Waldökosystem verwenden, um neuartige Transformatormodelle zu entwickeln, die auf Selbstbeobachtung basieren, um Vogelarten in Klanglandschaften zu erkennen. Daher steht die Nachhaltigkeit im Hinblick auf die biologische Vielfalt im Mittelpunkt des Projekts. Die Nachhaltigkeit der Fortführung von AI4Birds durch die Einwerbung zusätzlicher finanzieller Mittel ist sehr wahrscheinlich; es ist geplant, AI4Birds zu nutzen, um die Finanzierungsmöglichkeiten im Rahmen der Bundesprogramme zur Förderung der biologischen Vielfalt auszuloten. Darüber hinaus planen wir, unsere Ergebnisse in Microsofts „AI for Earth“-Initiative einzubringen.

AIQTHmed | AI Quality and Testing Hub in Healthcare

Prof. Dr. Martin Hirsch, Artificial Intelligence in Medicine, UMR and Director of the Institute for Artificial Intelligence at UKGM Marburg
Prof. Dr. Thomas Nauss, Department of Mathematics, Natural Sciences and Data Processing, FG Business Informatics – Artificial Intelligence, PU Marburg

Im Mai 2021 vereinbarten die Hessische Ministerin für Digitale Strategie und Entwicklung und der VDE die Einrichtung eines ersten bundesweiten „AI Quality & Testing Hub“ (AIQTH1). Im Umfeld von hessian.AI und dem Zentrum für Verantwortungsvolle Digitalisierung (ZEVEDI) soll damit die Qualität und Vertrauenswürdigkeit von KI-Systemen durch Standardisierung und Zertifizierung in den modellhaften Themenfeldern „Mobilität“, „Finanzen“ und „Gesundheit“ gefördert und für die Bevölkerung überprüfbar und glaubwürdig gemacht werden. Ziel des Projektes ist es, über das EU-Programm DIGITAL EUROPE den modellhaften Themenbereich „Gesundheit“ des AIQTH von hessian.AI zu stärken und damit die Chance zu nutzen, diese Einrichtung in Hessen zu etablieren.

Memristors – eine zentrale Hardware für KI

Prof. Dr. Lambert Alff, TUDa, FB Material Sciences
Prof. Dr.-Ing. Andreas Koch, TUDa, Department of Embedded Systems and Applications (ESA)
Prof. Dr. Christian Hochburgen, TUDa, FB ETIT

Mind the gap! Huddle between Materials and Computer Sciences

Prof. Dr. Leopoldo Molina-Luna, TUDa, FB Material Sciences
Prof. Dr. Kristian Kersting, TUDa, FB Computer Sciences

Viele Entwickler von KI-Algorithmen verfügen nicht über das nötige Hintergrundwissen, um mit dem neuesten Stand der Forschung in einem naturwissenschaftlichen Bereich wie z. B. den Materialwissenschaften Schritt zu halten. Auf der anderen Seite verlässt sich die Materialwissenschaft bei der Bestimmung der Parameter für die Entwicklung von KI-Algorithmen in der Regel auf „educated guess“ und zahlen wenig bis gar keine Gebühren. Es besteht eine Wissenslücke zwischen der Informatik und den Materialwissenschaften, und es bedarf eines verstärkten Austauschs auf grundlegender Ebene. Das Projekt schafft eine Plattform für die Umsetzung und Konsolidierung eines umfassenden regelmäßigen Austauschs zwischen allen interessierten Parteien. Es stärkt die Vorbereitungsaktivitäten für einen IRTG-Antrag im Bereich der on operando TEM für Memristoren und ML-basierte Datenanalyseroutinen.

Innovative UX für User-Centered AI Systeme

Prof. Dr. Bernhard Humm, h_da, FB Computer Sciences
Prof. Dr. Andrea Krajewski, h_da, FB Media

Zur human-centered AI gehört u.a. die angemessene Erklärung von Entscheidungen oder Empfehlungen, die das KI-System z.B. mittels Machine Learning ausspricht (Stichwort “Explainable AI”). User Experience (UX) befasst sich hingegen mit der Entwicklung von Produkten, insbesondere IT-Systemen, die ein bestmögliches Nutzungserlebnis bieten sollen. In diesem Vorhaben sollen für drei unterschiedliche prototypische KI-Systeme, die im Rahmen des BMBF-geförderten Projekts “Kompetenzzentrum für Arbeit und Künstliche Intelligenz (KompAKI)” entwickelt werden, innovative UX-Konzepte konzipiert, abgestimmt, implementiert und evaluiert werden. Eines der KI-Systeme beschäftigt sich mit der Bereitstellung von Machine Learning (ML) für breite Nutzerkreise mit und ohne Programmierkenntnisse. Zwei KI-Systeme sind für die betriebliche Nutzung in der verarbeitenden Industrie (Industrie 4.0) vorgesehen. Dieses Vorhaben ergänzt andere KI-Initiativen in idealer Weise und fördert die Vernetzung zwischen hessian.AI-Partnern und unterschiedlichen Disziplinen.

Geförderte Projekte in der ersten Runde der Aufforderungen (2021)

SpeedTram

Dr. Florian Stock, TUDa, Department of Mechanical Engineering, Department of Automotive Engineering (FZD)
Prof. Dr. Andreas Koch, TUDa, Department of Embedded Systems and Applications (ESA)

Im Fokus der Forschungen zu autonomen Fahren stehen bisher ganz klar Autos, nur wenige Projekte haben dagegen andere Verkehrsmittel im Blick. Um dem abzuhelfen, fördert Hessian.AI mit dem Projekt SpeedTram innovative interdisziplinäre Forschung, die sich mit dem autonomen/assistierten Fahren von Straßenbahnen befasst. Das Fachgebiet für Fahrzeugtechnik (FZD) und das Fachgebiet für Eingebettete Systeme und Anwendungen (ESA) der TU Darmstadt untersuchen darin die beschleunigte Ausführung der für die Automatisierung in und von Assistenzsystemen für Straßenbahnen erforderlichen Algorithmen des maschinellen Lernens. Dabei werden reale Daten bearbeitet, die auf einem Versuchsträger des lokalen Nahverkehrsunternehmens HEAG während des Betriebs aufgezeichnet wurden. Die Auswertung dieses wachsenden, mittlerweile mehr als 140 TB umfassenden Datensatzes, war mit den bestehenden Verfahren nicht mehr sinnvoll möglich. Durch die Arbeiten in SpeedTram konnten die beiden zeitaufwändigsten Schritte der Datenanalyse, nämlich die Objekterkennung auf Basis neuronaler Netze sowie die Verarbeitung der LIDAR-Sensordaten, jeweils um die Faktoren drei und 24 beschleunigt werden. SpeedTram leistet einen wichtigen Beitrag, das Innovationspotential der automatisierten Straßenbahnführung zu heben und für künftige Anwendungen nutzbar zu machen.

AI4Bats: Recognizing Bat Species and Bat Behavior in Audio Recordings of Bat Echolocation Calls

Dr. Nicolas Frieß, PU Marburg, FB Geography, Environmental Informatics
Prof. Dr. Bernd Freisegen, PU Marburg, Dept. of Mathematics & Computer Science, Distributed Systems and Intelligent Computing
Prof. Dr. Thomas Nauss, PU Marburg, FB Geography, Environmental Informatics

Biodiversität ist wichtig für verschiedene Ökosystemleistungen, die die Grundlage des menschlichen Lebens bilden. Der derzeitige Rückgang der biologischen Vielfalt erfordert eine Transformation von der manuellen periodischen Bewertung der biologischen Vielfalt hin zu einer automatisierten Echtzeit-Überwachung. Fledermäuse sind eine der am weitesten verbreiteten terrestrischen Säugetierarten und dienen als wichtige Bioindikatoren für den Zustand von Ökosystemen. Üblicherweise werden Fledermäuse durch Aufzeichnung und Analyse ihrer Echoortungsrufe überwacht. In diesem Projekt, AI4Bats, präsentieren wir einen neuartigen KI-basierten Ansatz zur Detektion von Fledermaus-Echoortungsrufen und zur Erkennung von Fledermausarten sowie zur Erkennung von Fledermausverhalten in Audiospektrogrammen. Er basiert auf einer neuronalen Transformer-Architektur und beruht auf Selbstaufmerksamkeitsmechanismen. Unsere Experimente zeigen, dass unser Ansatz aktuelle Ansätze zur Detektion von Fledermaus-Echoortungsrufen und zur Erkennung von Fledermausarten in mehreren öffentlich verfügbaren Datensätzen übertrifft. Während unser Modell zur Detektion von Fledermaus-Echoortungsrufen eine durchschnittliche Präzision von bis zu 90,2% erreicht, erzielt unser Modell zur Erkennung von Fledermausarten eine Genauigkeit von bis zu 88,7% für 14 in Deutschland vorkommende Fledermausarten, von denen einige selbst für menschliche Experten schwer zu unterscheiden sind. AI4Bats legt den Grundstein für Durchbrüche bei der automatisierten Überwachung von Fledermäusen im Bereich der Biodiversität, deren potenzieller Verlust wahrscheinlich zu den bedeutendsten Herausforderungen gehört, die die Menschheit in naher Zukunft bewältigen muss.

AI@School

Dr. Joachim Bille, TH Mittelhessen, Head of Department FTN
Prof. Dr. Michael Guckert, TH Mittelhessen, Department of Mathematics, Natural Sciences and Data Processing, FG Business Informatics – Artificial Intelligence
Prof. Holger Rohn, TH Mittelhessen, Department of Industrial Engineering and Management, FG Life Cycle Management & Quality Management, Makerspace Friedberg

Ziel des Projekts AI@School war die Entwicklung eines Demonstrators zur anschaulichen Vermittlung von Grundkenntnissen der Künstlichen Intelligenz, der Schülerinnen und Schülern einen möglichst frühen und niedrigschwelligen Zugang zu KI-Themen ermöglichen sollte. Der Demonstrator soll zum einen geeignete Beispiele und Exponate zur anschaulichen Wissensvermittlung beinhalten, zum anderen soll ein interaktiver Einführungskurs zur Wissensvermittlung unter Anwendung der Exponate und Beispiele erarbeitet werden. Aufbauend auf diesen Angeboten soll ebenso eine prototypische Lehreinheit auf Leistungskursniveau entwickelt werden. Die Projektergebnisse sollen dauerhaft Implementierung bei hessian.AI implementiert werden; zudem ist mittel- bis langfristig ein hessenweiter Transfer des Konzepts an passende Institutionen in den anderen Landesteilen geplant.

Robot Learning of Long-Horizon Manipulation bridging Object-centric Representations to Knowledge Graphs

Prof. Dr. Georgia Chalvatzaki, TUDa, FB Informatik, iROSA: Robot Learning of Mobile Manipulation for Intelligent Assistance
Prof. Dr. Iryna Gurevych, TUDa, FB Computer Science, Ubiquitous Knowledge Processing Lab

Ziel dieses Projekts war es, die Verbindungen zwischen hochrangigen Befehlen in natürlicher Sprache und Robotermanipulation zu untersuchen. Menschen sind in der Lage, Befehle in natürlicher Sprache effektiv zu abstrahieren und zu zerlegen, z. B. „Mach mir einen Kaffee“, aber eine solche Aktion ist für einen Roboter nicht detailliert genug, um sie auszuführen. Das Problem der Aufgabenausführung in der Robotik wird in der Regel als Aufgaben- und Bewegungsplanungsproblem angegangen, bei dem ein Aufgabenplaner das abstrakte Ziel in eine Reihe von logischen Aktionen zerlegt, die von einem Bewegungsgenerator in tatsächliche Aktionen in der Welt umgesetzt werden müssen. Die Verbindung zwischen abstrakter logischer Handlung und realer Beschreibung (z.B. hinsichtlich der genauen Position von Objekten in der Szene) macht die Aufgaben- und Bewegungsplanung zu einem sehr anspruchsvollen Problem. In diesem Projekt haben wir uns diesem Problem aus drei verschiedenen Richtungen genähert, indem wir Teilprobleme des Themas im Hinblick auf unser letztendliches Ziel, das Erlernen von Manipulationsplänen mit langem Zeithorizont unter Verwendung des gesunden Menschenverstands und von Szenegraphen, untersucht haben:

Die Assoziation der Objektszene mit Robotermanipulationsplänen unter Verwendung von graphischen neuronalen Netzen (GNNs) und RL,
Verwendung von Sprachanweisungen und Bildverarbeitung in Transformatorennetzen zur Ausgabe von Teilzielen für einen Low-Level-Planer, und
Übersetzen menschlicher Anweisungen in Roboterpläne.

Projektergebnisse aus 2. und 3. sollen in naher Zukunft auf einer großen Konferenz zum maschinellen Lernen veröffentlicht werden. Arbeiten aus iii werden im Rahmen einer aktuellen Zusammenarbeit von iROSA und UKP fortgeführt.