392242 Project: Learning Rewards from Videos: Evaluating Pretrained Reward Models and Using Them for Robot Policy Learning (Pj) (SoSe 2026)

Inhalt, Kommentar

Pretrained "reward models" (PRM) promise to estimate task progress directly from observations (e.g., videos), which could reduce the need for hand-designed rewards in reinforcement learning (RL). In this project, you will evaluate an existing PRM on a simulated robotic manipulation task: does it track progress and predict success zero-shot, and where does it fail? If the signal is usable, you will design a simple policy improvement experiment that uses the reward model as-is (zero-shot), for example by ranking, filtering, or weighting trajectories, and compare against naive supervised baselines. The project is simulation-only and focuses on careful evaluation and clean experimentation. You will be given a mature codebase for the simulation, training loops and utilities. Requirements: Solid Python skills and comfort working with existing ML code and datasets. Prior RL / Imitation Learning experience is helpful but not required.

Lehrende

Termine ( Kalendersicht )

Rhythmus	Tag	Uhrzeit	Format / Ort	Zeitraum
nach Vereinbarung	n.V.			13.04.-24.07.2026

Fachzuordnungen

Modul	Veranstaltung	Leistungen
39-M-Inf-P Projekt Projekt	Projekt	unbenotete Prüfungsleistung	Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.

Keine Konkretisierungen vorhanden

Kein E-Learningangebot vorhanden

Adresse:: SS2026_392242@ekvv.uni-bielefeld.de; Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.; Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_685331719@ekvv.uni-bielefeld.de
Hinweise:: Weitere Hinweise zu den E-Mailverteilern

Letzte Änderung Grunddaten/Lehrende:: Freitag, 20. Februar 2026
Letzte Änderung Zeiten:: Freitag, 20. Februar 2026
Letzte Änderung Räume:: Freitag, 20. Februar 2026

Art(en) / SWS: Projekt (Pj) / 2
Einrichtung: Technische Fakultät
Fragen oder Korrekturen?: Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen: Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung: Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!; Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:; https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=685331719
Seite zum Handy schicken: Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code:
ID: 685331719

Quicklinks

392242 Project: Learning Rewards from Videos: Evaluating Pretrained Reward Models and Using Them for Robot Policy Learning (Pj) (SoSe 2026)

Inhalt, Kommentar

Lehrende

Termine ( Kalendersicht )

Fachzuordnungen

Konkretisierung der Anforderungen

E-Learningangebote

Automatischer E-Mailverteiler der Veranstaltung

Änderungen/Aktualität der Veranstaltungsdaten

Sonstiges