Auszeichnungen für RAI Forschende auf der CVPR

Forschende des geplanten Exzellenzclusters “Reasonable Artificial Intelligence” (RAI) und hessian.AI nahmen an der diesjährigen IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) teil, die vom 17. bis 21. Juni in Seattle (USA) stattfand. Als eine der renommiertesten Veranstaltungen zum Thema Computer Vision zieht die Konferenz jährlich mehr als 10.000 Teilnehmerinnen an.

RAI-Beiträge erhalten Auszeichnungen

Gleich mehrere der eingereichten Workshop-Beiträge erhielten besondere Auszeichnungen:

Die Publikation “Is Synthetic Data All We Need? Benchmarking the Robustness of Models Trained with Synthetic Images” gewann den Best Paper Award im Rahmen des Workshops SyntaGen – Harnessing Generative Models for Synthetic Visual Datasets. Die Forschungsarbeit, die von Krishnakant Singh, Doktorand am Visual Inference Lab (VISINF) der TU Darmstadt, vorgestellt wurde, untersucht die Robustheit von Modellen, die mit synthetischen Bildern trainiert wurden, im Vergleich zu Modellen, die mit realen Bildern trainiert wurden. Singh‘s Co-Autor:innen Simone Schaub-Meyer, Independent Research Group Leader, und Professor Stefan Roth waren ebenfalls anwesend.

Christoph Reichs Arbeit “A Perspective on Deep Vision Performance with Standard Image and Video Codecs” wurde im Rahmen des AIS: Vision, Graphics and AI for Streaming Workshop mit einem Best Student Paper Award ausgezeichnet.

Die Forschungsarbeit “LEDITS++: Limitless Image Editing using Text-to-Image Models” erreichte beim GenAI Media Generation Challenge Workshop den zweiten Platz. LEDITS++ bietet ein effizientes und gleichzeitig vielseitiges und präzises textbasiertes Verfahren zur Manipulation von Bildern. Das Forschungsteam, vertreten durch Manuel Brack, Felix Friedrich und Patrick Schramowski, erhielt als Preis ein Meta Quest 3 Headset.

Expertenvorträge von Wissenschaftlern des RAI Cluster-Projekts

Professor Justus Thies gab zwei Workshop-Keynotes: “Digital Humans: Recent Advances in Capturing and Controlling Digital Humans – from 2D DeepFakes to volumetric avatars that can be used in immersive telepresence” im Rahmen des Workshop on Media Forensics sowie “Capturing and Controlling Digital Humans: Text-based appearance and motion control of volumetric human avatars using diffusion-based generative models” auf dem Workshop Populating Empty Cities – Virtual Humans for Robotics and Autonomous Driving.

Professor Stefan Roth hielt einen Invited Talk über die Beschleunigung und Evaluierung von Methoden der erklärbaren KI im Bereich Computer Vision im Rahmen des “SAIAD 2024 – Safe Artificial Intelligence for All Domains” Workshops.

Professor Kristian Kersting hielt im Rahmen des 3rd Explainable AI for Computer Vision (XAI4CV) Workshop einen Online-Vortrag zum Thema “Reasonable Artificial Intelligence”, in dem er die Notwendigkeit der Erklärbarkeit und Interpretierbarkeit von Künstlicher Intelligenz erläuterte und anhand von eindrücklichen Beispielen veranschaulichte.

Auf dem Workshop on Multimodal Content Moderation (MMCM) sprach Manuel Brack, Forscher am Deutschen Forschungszentrum für KI (DFKI) und Doktorand am Artificial Intelligence and Machine Learning Lab der TU Darmstadt, in seinem Invited Talk “Enhancing Visual Content Safety: Multimodal Approaches for Dataset Curation and Model Safeguarding” über multimodale Ansätze zur Verbesserung der Sicherheit visueller Inhalte.

Mit sechs Konferenzbeiträgen und fünf Workshop-Beiträgen präsentierten die Forschenden des RAI-Projekts und hessian.AI zusammen 11 Publikationen auf der CVPR 2024. Zum Vergleich: Von insgesamt 11.532 eingereichten Arbeiten wurden nur 2.719 (23,6%) angenommen. Die Themen der Beiträge reichten von der Modellierung menschlicher Gesichter und Körper über Bewegungssynthese bis hin zu textgesteuerter Bildbearbeitung. „Unsere verschiedenen Beiträge auf der CVPR 2024 haben gezeigt, dass wir Teil der rasanten Entwicklung in der Computer Vision sind. Das enorme Potenzial dieser Technologie wurde durch die Vielfalt der präsentierten Forschung deutlich“, sagt Simone Schaub-Meyer, Independent Research Group Leader, TU Darmstadt.

Übersicht der auf der Hauptkonferenz veröffentlichten Beiträge:

Visual Inference Lab (VISINF), Leitung: Prof. Stefan Roth

Adapters Strike Back, Jan-Martin O. Steitz, Stefan Roth. Learn more

3D Graphics & Vision Group (GraVis), Leitung: Prof. Justus Thies

DPHMs: Diffusion Parametric Head Models for Depth-based Tracking, Jiapeng Tang, Angela Dai, Yinyu Nie, Lev Markhasin, Justus Thies, Matthias Nießner. Learn more

SCULPT: Shape-Conditioned Unpaired Learning of Posedependent Clothed and Textured Human Meshes, Soubhik Sanyal, Partha Ghosh, Jinlong Yang, Michael J. Black, Justus Thies, Timo Bolkart . Learn more

HAAR: Text-Conditioned Generative Model of 3D Strand-based Human Hairstyles, Vanessa Sklyarova, Egor Zakharov, Otmar Hilliges, Michael J. Black, Justus Thies. Learn more

DiffuScene: Denoising Diffusion Models for Generative Indoor Scene Synthesis, Jiapeng Tang, Yinyu Nie, Lev Markhasin, Angela Dai, Justus Thies, Matthias Nießner. Learn more

FaceTalk: Audio-Driven Motion Diffusion for Neural Parametric Head Models, Shivangi Aneja, Justus Thies, Angela Dai, Matthias Nießner. Learn more

Übersicht der in den Workshops präsentierten Beiträge:

Artificial Intelligence and Machine Learning Lab, Leitung: Prof. Kristian Kersting

LEDITS++: Limitless Image Editing using Text-to-Image Models, Manuel Brack, Felix Friedrich, Katharina Kornmeier, Linoy Tsaban, Patrick Schramowski, Kristian Kersting, Apolinário Passos. Learn more
LLAVAGUARD: VLM-based Safeguard for Vision Dataset Curation and Safety Assessment, Lukas Helff, Felix Friedrich, Manuel Brack, Kristian Kersting, Patrick Schramowski (presented only). Learn more

Visual Inference Lab (VISINF), Leitung: Prof. Stefan Roth

Boosting Unsupervised Semantic Segmentation with Principal Mask Proposals, Oliver Hahn, Nikita Araslanov, Simone Schaub-Meyer, Stefan Roth. Learn more
A Perspective on Deep Vision Performance with Standard Image and Video Codecs, Christoph Reich, Oliver Hahn, Daniel Cremers, Stefan Roth, Biplob Debnath. Learn more
Is Synthetic Data All We Need? Benchmarking the Robustness of Models Trained with Synthetic Images, Krishnakant Singh, Thanush Navaratnam, Jannik Holmer, Simone Schaub-Meyer, Stefan Roth. Mehr erfahren

Über die CVPR

Die von der IEEE Computer Society (CS) und der Computer Vision Foundation (CVF) veranstaltete Conference on Computer Vision and Pattern Recognition (CVPR) ist die wichtigste jährliche Veranstaltung im Bereich der Computer Vision für Studierende, Wissenschaftler:innen und Forscher:innen aus der Industrie. Auf der Konferenz werden bedeutende Fortschritte in der Computer Vision und der Mustererkennung sowie deren Auswirkungen auf verschiedene Bereiche und Branchen vorgestellt. In diesem Jahr verzeichnete die CVPR mit mehr als 12.000 Wissenschaftler:innen und Ingenieur:innen aus 76 Ländern und Regionen eine neue Rekordzahl an Teilnehmer:innen. Mit der Hauptkonferenz, einer Expo sowie einer Vielzahl an Workshops und Kurzkursen bietet die CVPR zahlreiche Gelegenheiten zur Vernetzung, Rekrutierung, Inspiration und Motivation. Mehr erfahren