392242 Project: Learning Rewards from Videos: Evaluating Pretrained Reward Models and Using Them for Robot Policy Learning (Pj) (SoSe 2026)

Inhalt, Kommentar

Pretrained "reward models" (PRM) promise to estimate task progress directly from observations (e.g., videos), which could reduce the need for hand-designed rewards in reinforcement learning (RL). In this project, you will evaluate an existing PRM on a simulated robotic manipulation task: does it track progress and predict success zero-shot, and where does it fail? If the signal is usable, you will design a simple policy improvement experiment that uses the reward model as-is (zero-shot), for example by ranking, filtering, or weighting trajectories, and compare against naive supervised baselines. The project is simulation-only and focuses on careful evaluation and clean experimentation. You will be given a mature codebase for the simulation, training loops and utilities. Requirements: Solid Python skills and comfort working with existing ML code and datasets. Prior RL / Imitation Learning experience is helpful but not required.

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  
nach Vereinbarung n.V.   13.04.-24.07.2026

Fachzuordnungen

Modul Veranstaltung Leistungen  
39-M-Inf-P Projekt Projekt Projekt unbenotete Prüfungsleistung
Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.


Keine Konkretisierungen vorhanden
Kein E-Learningangebot vorhanden
Adresse:
SS2026_392242@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_685331719@ekvv.uni-bielefeld.de
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
Letzte Änderung Grunddaten/Lehrende:
Freitag, 20. Februar 2026 
Letzte Änderung Zeiten:
Freitag, 20. Februar 2026 
Letzte Änderung Räume:
Freitag, 20. Februar 2026 
Art(en) / SWS
Projekt (Pj) / 2
Einrichtung
Technische Fakultät
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=685331719
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ID
685331719