392265 Project: SignSpeak: Generating Sign Language Videos from Speech using Deep Generative Models (Pj) (SoSe 2026)

Inhalt, Kommentar

Current AI systems can accurately transcribe speech and generate text-based translations. However, generating sign language videos directly from speech remains a challenging problem, as sign languages are complex visual languages that rely on hand gestures, facial expressions, and body movements.
This project explores how multimodal representations extracted from speech can be used to generate sign-language video sequences with deep generative models.
The goal is to design and implement a prototype pipeline that maps speech features to temporally coherent sign language representations and generates corresponding video output. The system will be trained and evaluated using multimodal datasets containing aligned speech, text, and sign language videos.
Depending on the number of students and the project scope, the project can also include:
• Evaluation of the intelligibility and realism of generated sign language videos
• Analysis of temporal alignment between speech and generated signs
• Comparison of direct speech-based vs. speech-to-text-to-sign pipelines

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

• Good programming skills in Python (ideally PyTorch)
• Basic knowledge of machine learning / deep learning
• Interest in generative AI and multimodal systems
• (Preferably) experience or strong interest in speech processing or video processing (e.g., speech recognition, audio features, or temporal data such as video or pose sequences)
Upon completion of this project, we will work hand in hand to publish the results in a well-established conference or journal in Human–Computer Interaction (HCI) or Computer Vision (CV)

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  
nach Vereinbarung n.V.   13.04.-24.07.2026 Nach Vereinbarung, online, CITEC oder R.1

Fachzuordnungen

Modul Veranstaltung Leistungen  
39-M-Inf-AI-app-foc_a Applied Artificial Intelligence (focus) Applied Artificial Intelligence (focus) Applied Artificial Intelligence (focus): Projekt Studienleistung
Studieninformation
39-M-Inf-INT-app-foc_a Applied Interaction Technology (focus) Applied Interaction Technology (focus) Applied Interaction Technology (focus): Projekt Studienleistung
Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.


Keine Konkretisierungen vorhanden
Kein E-Learningangebot vorhanden
Adresse:
SS2026_392265@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_720235317@ekvv.uni-bielefeld.de
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
Letzte Änderung Grunddaten/Lehrende:
Montag, 27. April 2026 
Letzte Änderung Zeiten:
Samstag, 25. April 2026 
Letzte Änderung Räume:
Samstag, 25. April 2026 
Art(en) / SWS
Projekt (Pj) / 2
Einrichtung
Technische Fakultät
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=720235317
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ID
720235317