Forschende des geplanten Exzellenzclusters “Reasonable Artificial Intelligence” (RAI) und hessian.AI nahmen an der diesjährigen IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) teil, die vom 17. bis 21. Juni in Seattle (USA) stattfand. Als eine der renommiertesten Veranstaltungen zum Thema Computer Vision zieht die Konferenz jährlich mehr als 10.000 Teilnehmerinnen an.

RAI-Beiträge erhalten Auszeichnungen

Gleich mehrere der eingereichten Workshop-Beiträge erhielten besondere Auszeichnungen:

Die Publikation “Is Synthetic Data All We Need? Benchmarking the Robustness of Models Trained with Synthetic Images” gewann den Best Paper Award im Rahmen des Workshops SyntaGen – Harnessing Generative Models for Synthetic Visual Datasets. Die Forschungsarbeit, die von Krishnakant Singh, Doktorand am Visual Inference Lab (VISINF) der TU Darmstadt, vorgestellt wurde, untersucht die Robustheit von Modellen, die mit synthetischen Bildern trainiert wurden, im Vergleich zu Modellen, die mit realen Bildern trainiert wurden. Singh‘s Co-Autor:innen Simone Schaub-Meyer, Independent Research Group Leader, und Professor Stefan Roth waren ebenfalls anwesend.

Christoph Reichs Arbeit “A Perspective on Deep Vision Performance with Standard Image and Video Codecs” wurde im Rahmen des AIS: Vision, Graphics and AI for Streaming Workshop mit einem Best Student Paper Award ausgezeichnet.

Die Forschungsarbeit “LEDITS++: Limitless Image Editing using Text-to-Image Models” erreichte beim GenAI Media Generation Challenge Workshop den zweiten Platz. LEDITS++ bietet ein effizientes und gleichzeitig vielseitiges und präzises textbasiertes Verfahren zur Manipulation von Bildern. Das Forschungsteam, vertreten durch Manuel Brack, Felix Friedrich und Patrick Schramowski, erhielt als Preis ein Meta Quest 3 Headset.

Expertenvorträge von Wissenschaftlern des RAI Cluster-Projekts

Professor Justus Thies gab zwei Workshop-Keynotes: “Digital Humans: Recent Advances in Capturing and Controlling Digital Humans – from 2D DeepFakes to volumetric avatars that can be used in immersive telepresence” im Rahmen des Workshop on Media Forensics sowie “Capturing and Controlling Digital Humans: Text-based appearance and motion control of volumetric human avatars using diffusion-based generative models” auf dem Workshop Populating Empty Cities – Virtual Humans for Robotics and Autonomous Driving.

Professor Stefan Roth hielt einen Invited Talk über die Beschleunigung und Evaluierung von Methoden der erklärbaren KI im Bereich Computer Vision im Rahmen des “SAIAD 2024 – Safe Artificial Intelligence for All Domains” Workshops.

Professor Kristian Kersting hielt im Rahmen des 3rd Explainable AI for Computer Vision (XAI4CV) Workshop einen Online-Vortrag zum Thema “Reasonable Artificial Intelligence”, in dem er die Notwendigkeit der Erklärbarkeit und Interpretierbarkeit von Künstlicher Intelligenz erläuterte und anhand von eindrücklichen Beispielen veranschaulichte.

Auf dem Workshop on Multimodal Content Moderation (MMCM) sprach Manuel Brack, Forscher am Deutschen Forschungszentrum für KI (DFKI) und Doktorand am Artificial Intelligence and Machine Learning Lab der TU Darmstadt, in seinem Invited Talk “Enhancing Visual Content Safety: Multimodal Approaches for Dataset Curation and Model Safeguarding” über multimodale Ansätze zur Verbesserung der Sicherheit visueller Inhalte.

Mit sechs Konferenzbeiträgen und fünf Workshop-Beiträgen präsentierten die Forschenden des RAI-Projekts und hessian.AI zusammen 11 Publikationen auf der CVPR 2024. Zum Vergleich: Von insgesamt 11.532 eingereichten Arbeiten wurden nur 2.719 (23,6%) angenommen. Die Themen der Beiträge reichten von der Modellierung menschlicher Gesichter und Körper über Bewegungssynthese bis hin zu textgesteuerter Bildbearbeitung. „Unsere verschiedenen Beiträge auf der CVPR 2024 haben gezeigt, dass wir Teil der rasanten Entwicklung in der Computer Vision sind. Das enorme Potenzial dieser Technologie wurde durch die Vielfalt der präsentierten Forschung deutlich“, sagt Simone Schaub-Meyer, Independent Research Group Leader, TU Darmstadt.

Übersicht der auf der Hauptkonferenz veröffentlichten Beiträge:

Visual Inference Lab (VISINF), Leitung: Prof. Stefan Roth

3D Graphics & Vision Group (GraVis), Leitung: Prof. Justus Thies

Übersicht der in den Workshops präsentierten Beiträge:

Artificial Intelligence and Machine Learning Lab, Leitung: Prof. Kristian Kersting


Visual Inference Lab (VISINF), Leitung: Prof. Stefan Roth

Über die CVPR

Die von der IEEE Computer Society (CS) und der Computer Vision Foundation (CVF) veranstaltete Conference on Computer Vision and Pattern Recognition (CVPR) ist die wichtigste jährliche Veranstaltung im Bereich der Computer Vision für Studierende, Wissenschaftler:innen und Forscher:innen aus der Industrie. Auf der Konferenz werden bedeutende Fortschritte in der Computer Vision und der Mustererkennung sowie deren Auswirkungen auf verschiedene Bereiche und Branchen vorgestellt. In diesem Jahr verzeichnete die CVPR mit mehr als 12.000 Wissenschaftler:innen und Ingenieur:innen aus 76 Ländern und Regionen eine neue Rekordzahl an Teilnehmer:innen. Mit der Hauptkonferenz, einer Expo sowie einer Vielzahl an Workshops und Kurzkursen bietet die CVPR zahlreiche Gelegenheiten zur Vernetzung, Rekrutierung, Inspiration und Motivation. Mehr erfahren

Bei einem Besuch hat sich der Bundestagsabgeordnete und Parlamentarische Staatssekretär im Bundesministerium für Bildung und Forschung (BMBF), Mario Brandenburg (FDP), über die Arbeit des Hessischen Zentrums für Künstliche Intelligenz (hessian.AI) informiert. Zentrale Themen waren unter anderem die laufenden Forschungsprojekte, die Projekte im Wettbewerb der Exzellenzstrategie des Bundes und das KI-Innovationsökosystem mit vielfältigen Ausgründungen aus hessian.AI.

Brandenburg traf zusammen mit der Präsidentin der TU Darmstadt, Professorin Tanja Brühl, und den Co-Direktor:innen von hessian.AI, Professorin Mira Mezini und Professor Kristian Kersting, sowie Wissenschaftler:innen, die bei hessian.AI forschen und Einblicke in ihre Arbeit gaben.

Kristian Kersting und Marcus Rohrbach (Professor für Multimodal Reliable Artificial Intelligence) stellten mit „Reasonable Artificial Intelligence (RAI)“ und „The Adaptive Mind (TAM)“ zwei der drei Projekte vor, mit den die TU Darmstadt im Wettbewerb der Exzellenzstrategie des Bundes und der Länder vertreten ist. Der geplante Exzellenzcluster RAI widmet sich der Entwicklung einer neuen Generation von KI-Systemen, die auf vernünftiger Ressourcennutzung, Datenschutz und kontinuierlicher Verbesserung basieren. Diese nächste Generation von KI-Systemen soll so einige Schwächen aktueller KI-Systeme adressieren. „The Adaptive Mind (TAM)“ untersucht menschliches Verhalten unter sich verändernden äußeren Bedingungen. TAM entwickelt dabei neue Zugänge, wie menschliches Wahrnehmen, Denken, Entscheiden, Handeln und Lernen verstanden und computational modelliert werden können.

Mit Occiglot soll ein zusammenhängendes Sprachmodellierungssystem geschaffen werden, das alle 24 Amtssprachen der Europäischen Union sowie weitere inoffizielle und regionale Sprachen berücksichtigt. Die erste Version konzentriert sich zunächst auf die fünf größten europäischen Sprachen: Englisch, Deutsch, Französisch, Spanisch und Italienisch. Mit LEDITS++(wird in neuem Tab geöffnet) können mittels Texteingabe Bilder verändert werden. Die Bearbeitung spezifischer Bildregionen stellt dabei sicher, dass die visuelle und kontextuelle Kohärenz der Bilder erhalten bleibt. Praktische Einblicke erhielt Brandenburg im Rahmen des Besuchs zudem in die Arbeit des Robotics Institute Germany (RIG), einem Zusammenschluss von zehn Universitäten und vier außeruniversitären Forschungseinrichtungen aus ganz Deutschland, mit dem dieExpertise der Robotikforschung synergetisch gebündelt und strategisch gestärkt wird. Auch in diesem Netzwerk ist hessian.AI vertreten.

Mit Energy Robotics und Birdmapper komplettierten zwei Start-ups unterschiedlicher Entwicklungsstufen aus dem Ökosystem die Reihe der Stationen. Energy Robotics stellt autonome Roboter für die Inspektion industrieller Anlagen her und vereinfacht so unter anderem die prädiktive Instandhaltung. Das Ziel von Birdmapper ist die autonome Messung von Vogelpopulationen als Beitrag zum Erhalt der Biodiversität.

Ein wesentlicher Baustein des KI-Ökosystems zur Qualifikation der KI-Expert:innen von morgen ist die Konrad Zuse Graduiertenschule „Excellence in Learning and Intelligent Systems“ (ELIZA), die Stefan Roth (Professor für Visuelle Inferenz) präsentierte.

Die in hessian.AI bereitgestellte Infrastruktur mit dem Supercomputer fortytwo sowie das KI-Innovationslabor und -Servicezentrum unterstützen KI-Forschung und Anwendung in Hessen in einzigartiger Weise, wie der CTO von hessian.AI, Dr. Wolfgang Stille, skizzierte.

„hessian.AI ist die tragende Säule eines lebendigen, dichten und stetig wachsenden KI-Innovationsökosystems rund um die TU Darmstadt, in Hessen und mit großer Strahlkraft weit darüber hinaus. hessian.AI verstärkt und befördert die exzellente KI-Forschung und Lehre an den hessischen Hochschulen. In hessian.AI entstehen aus disruptiven Ideen innovative Anwendungen mit transformativem Potential. Die vielfältigen Einblicke im Rahmen des Besuchs zeigen eindrücklich: Von diesem starken Netzwerk profitieren Partner:innen in Wissenschaft, Wirtschaft und Gesellschaft.“

Tanja Brühl, Präsidentin der TU Darmstadt

Der Fachkräftemangel, die steigende Informationsflut durch die Digitalisierung und die neuen Bedürfnisse der Bürgerinnen und Bürger machen es notwendig, dass sich der Staat mit den Potentialen von KI auseinandersetzt. Vordergründig bringt die öffentliche Verwaltung besonders gute Voraussetzungen für den Einsatz von KI mit: Viele Verwaltungsprozesse sind hochstrukturiert, die Ausführungsschritte meist eindeutig geregelt. Nicht zuletzt verfügt der öffentliche Sektor über eine große Menge an Daten. In diesem Blogbeitrag wird gezeigt, wo die öffentliche Verwaltung KI bereits einsetzt, welche Rolle Start-ups dabei spielen und wo die Herausforderungen liegen.

KI use cases in der Verwaltung

Die Anwendung von KI im öffentlichen Sektor geht heutzutage über Erprobungsversuche und Pilotprojekte hinaus. Unterschiedlichste Bereiche der Verwaltung nutzen KI bereits im operativen Betrieb. Systeme auf Basis von Maschinellem Lernen unterstützen bei der Überprüfung von Dokumenten, wie etwa Studienbescheinigungen, die für die Beantragung von Kindergeld notwendig sein können. Beim Zoll wird mit Hilfe von Bilderkennung versucht, Produktfälschungen zu erkennen. In der Behörden-internen IT-Infrastruktur wird KI genutzt, um die Überlastung von Serverlandschaften vorherzusagen oder Anomalien in Datenströmen zu erkennen. KI-Systeme durchdringen aber auch zunehmend das ‚Front-Office‘ der Verwaltung, wo Staat und Bürgerinnen und Bürger direkt aufeinandertreffen. Im internationalen Kontext wird KI zum Beispiel vereinzelt genutzt, um die Beratung von Arbeitslosen zu verbessern. Darüber hinaus gibt es viele weitere Anwendungen von KI im öffentlichen Sektor, alleine die EU sammelte bis Ende 2021 über 680 use cases in ihren Mitgliedstaaten.

Startups helfen, die Potentiale von KI in der Verwaltung zu heben

KI kann eingesetzt werden, um Prozesse zu automatisieren und Mitarbeiterinnen und Mitarbeiter bei repetitiven Aufgaben zu entlasten. Ein Beispiel für eine sich wiederholende Tätigkeit ist die Bearbeitung von Wohngeldanträgen in Kommunen. Dabei unterstützen kann eine kognitive KI-Anwendung eines Unternehmens aus Darmstadt, die es Verwaltungsmitarbeitenden auch ohne Programmierkenntnissen ermöglicht, bestimmte Prozessschritte selbstständig zu automatisieren. In der Verwaltung wird aber auch jeden Tag eine Vielzahl komplexer Entscheidungen getroffen. Zum Beispiel in der gesetzlichen Unfallversicherung: Bei jedem einzelnen Arbeits- oder Wegeunfall muss der zuständige Unfallversicherungsträger prüfen, ob es sich lohnt, einen schadensersatzpflichten Dritten in Regress zu nehmen. In Zusammenarbeit mit einem Data Scientist Startup wurde ein KI-basiertes System entwickelt, das Fälle mit einer hohen Wahrscheinlichkeit für ein erfolgreiches Regressverfahren identifiziert.

Mit generativer KI findet auch die neueste Entwicklung im Bereich Künstliche Intelligenz Einzug in die öffentliche Verwaltung. In der Baden-Württembergischen Landesverwaltung wird bereits intern ein Chatbot genutzt, der auf Grundlage eines KI-basierten Sprachmodells die Mitarbeitenden bei der Textarbeit unterstützt. Für die Entwicklung gemeinwohlorientierter KI-Anwendungen gibt es unterschiedliche staatliche Fördermaßnahmen.

Besondere Rahmenbedingungen für den KI-Einsatz

Künstliche Intelligenz bietet viele Vorteile für die Verwaltung. Profitieren können zum einen wiederkehrende Tätigkeiten, die mit Hilfe von KI effizienter abgearbeitet werden können. Zum anderen werden komplexe Entscheidungsvorgänge mit KI auf eine breitere empirische Grundlage gestellt. Positive Effekte erwartet man sowohl für Verwaltungsmitarbeitende, die entlastet werden, als auch für Bürgerinnen und Bürger, die von besseren staatlichen Dienstleistungen profitieren. Daher setzt die Verwaltung in ausgewählten Prozessen KI bereits ein. Bei der Erfüllung seiner vielfältigen Aufgaben unterliegt der öffentliche Sektor aber besonderen Rahmenbedingungen. Hohe Anforderungen an Sicherheit und Datenschutz sind Gründe, weshalb es voraussichtlich noch dauern wird, bis die Potentiale von KI in der Breite der Verwaltung ankommen. Rechtssicherheit wird in diesem Zusammenhang der AI Act der Europäischen Kommission bringen, auf dessen Umsetzung in nationales Recht in den kommenden Jahre viele gespannt schauen.

Mareike Sirman-Winkler ist Politikwissenschaftlerin und forscht am Weizenbaum-Institut für die vernetzte Gesellschaft zu Künstlicher Intelligenz in der öffentlichen Verwaltung. Ihre Schwerpunkte liegen auf den normativen Konflikten, organisatorischen Herausforderungen und verhaltensbezogenen Konsequenzen von KI-basierten Innovationen in der Sozialverwaltung. Sie promoviert am sozialwissenschaftlichen Institut der Universität Oldenburg. Davor war sie Referentin in einem Bundesministerium. Der Blog-Beitrag gibt ihre persönliche Meinung wieder.

Am 1. September 2023 haben wir im Woogs-Cafe in Darmstadt bei einer schönen Abendstimmung erfolgreich unseren ersten MedAI Roundtable veranstaltet.

Unser Ziel: MedAI-Startups zusammenzubringen, um gemeinsame Bedürfnisse zu identifizieren und Innovationen zu fördern. Ohne formelle Tagesordnung stellten sich die Startups vor, teilten ihre Schwerpunkte mit und hoben ihre Interessensgebiete hervor.

Der Abend war geprägt von angeregten Diskussionen unter den Startup-Gästen. Köstliche Speisen, Getränke sowie das Ambiente führten zu inspirierenden Kontakten und einem regen Austausch.

Wir freuen uns, berichten zu können, dass zahlreiche Kontakte geknüpft wurden, und Gespräche über mögliche Kooperationen sind bereits im Gange. Tatsächlich haben die zwei Gruppen bereits mit der Arbeit an einem gemeinsamen Projekt begonnen und freuen sich darauf, in den nächsten Tagen in die Details einzusteigen!

Vielen Dank an die 22 Teilnehmer aus 10 Startups und 2 Unternehmen: Multilingo Medical AI, MySympto, Deep LS, PreScriptAI, EinMind, mediEM, KardioIQ, ViSPA, Green Convenience, UnderstandUrself, Eloquest, und Innoplexus. Euer Enthusiasmus war im wahrsten Sinne des Wortes inspirierend.

Ein besonderer Dank geht an unseren AI-Startup-Coach Phillip Travers für die Konzeption und Organisation der Veranstaltung!

Bleibt dran, um keine weiteren MedAI-Innovations- und Kooperations-Updates zu verpassen!

Wir wünschen Euch und Ihnen einen entspannten Sommer 🌞🦦 und freuen uns auf ein Wiedersehen im September.