PHONT begann sich im Sommer 2023 mit dem hessian.AI AI Lean Startup Funding von einem Ideenpapier zu einem Startup zu entwickeln. Seit über einem Jahr können wir bereits in Vollzeit arbeiten. PHONT verbindet Künstliche Intelligenz und Design, um Untertitel zum Leben zu erwecken. Mithilfe einer eigens entwickelten KI erkennen wir Spracheigenschaften wie Emotionen in gesprochener Sprache und stellen diese mit empirisch entwickeltem Design dar. Das Ergebnis sind emotionale Untertitel, die eine immersive und barrierefreie Möglichkeit sind, Sprache visuell auf Social Media und in Streaming-Plattformen zu erleben.
Die Idee entstand aus der Beobachtung, dass Schrift ihrem Potenzial der Sprachwiedergabe bisher nur begrenzt gerecht wird. Mitgründer Frederik hatte sich diesem Thema in seiner Type Design-Masterthesis angenommen und lebendige Untertitel gestaltet. Herausforderungen bestanden darin, die Produktvision zu kommunizieren, zu validieren und nun technisch nahtlos in entsprechende Plattformen zu integrieren.
PHONT analysiert Sprachaufnahmen mit KI-Algorithmen, um emotionale Zustände, Stimm- und Spracheigenschaften, sowie Klangerereignisse zu erkennen. Diese Informationen werden dann in Echtzeit in den Untertiteln durch visuelle Parameter dargestellt, um die sprachlichen Inhalte für die Zuschauer sichtbar zu machen.
Im Gegensatz zu herkömmlichen Untertiteln, die lediglich den gesprochenen Textinhalt wiedergeben, vermittelt PHONT auch die restlichen Informationen der Tonspur. Dies wertet den Konsum von allen audiovisiuellen Medien durch mehr emotionale Tiefe, Aufmerksamkeitsstärke und Barrierefreiheit auf. Insbesondere Social Media Konsumenten, die ihren Content gerne stumm schauen, sowie Gehörlose profitieren davon. Die User*innen können dabei selbst entscheiden, wie ihr Untertitel aussehen soll.
PHONT integriert KI, indem es maschinelles Lernen und natürliche Sprachverarbeitung einsetzt, um Emotionen in der gesprochenen Sprache zu erkennen. Für die Anpassung an verschiedene Sprachen werden später sprachspezifische Modelle trainiert, die kulturelle und linguistische Unterschiede berücksichtigen, um eine präzise Emotionserkennung in unterschiedlichen Sprachkontexten zu gewährleisten. So vermeiden wir Biases jeglicher Art.
In fünf Jahren könnte PHONT ein etablierter Standard in der Medienindustrie sein, der von zahlreichen Content Creatorn, Streaming-Diensten und Bildungsplattformen weltweit genutzt wird, um den neuen Qualitätsstandard von Untertiteln bereitzustellen.
Während der AI Startup Rising Competition haben wir wertvolle Erkenntnisse darüber gewonnen, wie wir unsere Technologie weiterentwickeln und unseren Kunden einen noch größeren Nutzen bieten können. Das Programm hat uns auch dabei unterstützt, unser Netzwerk zu erweitern und potenzielle Investoren anzusprechen.
Frederik, Co-Founder
PHONT, 1. Platz der Startup
Competition 2023/2024