392241 Project: What do Robots Actually See? Comparing Visual Representations for Reinforcement Learning with a 3D-printed Arm (Pj) (WiSe 2025/2026)

Inhalt, Kommentar

Robots learn to interact with the world through visual input. But how exactly does the choice of visual representation, the way a robot "sees" its environment, impact its learning ability? This project aims to systematically evaluate several state-of-the-art pretrained encoders (e.g., ResNet-50, DINOv2, R3M, VIP, CLIP) by analyzing their visual attention patterns and correlating these with RL learning speed and success rate in a robotic manipulation task. You will embed images from a simulated WidowX pick-and-place task, generate attention heat maps, and measure how well attention overlaps with relevant objects. Then, you will plug these frozen encoders into an off-policy RL algorithm and empirically evaluate their downstream performance.

This project is a valuable opportunity for students interested in computer vision and robot learning, offering hands-on experience with modern deep learning frameworks, reinforcement learning, and simulation environments. You will directly contribute to understanding how visual representation quality impacts robot learning performance. When applicable, your results can be published as a short benchmark note or as an appendix to an existing paper.

For more details or to apply, feel free to contact me directly via email or in-person.

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

You should have strong familiarity with PyTorch and a python-based simulation framework. Experience with OpenCV and basic reinforcement learning concepts (e.g., SAC or similar) will be beneficial. The project provides you with a prebuilt 3D printed WidowX arm, ready-to-use MuJoCo simulation environments, baseline RL implementations, and all necessary computational resources (though bringing your own GPU is a plus).

Lehrende

Termine ( Kalendersicht )

Rhythmus	Tag	Uhrzeit	Format / Ort	Zeitraum

Zeige vergangene Termine >>

Fachzuordnungen

Modul	Veranstaltung	Leistungen
39-M-Inf-P Projekt Projekt	Projekt	unbenotete Prüfungsleistung	Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.

Analyze and compare how different pretrained visual encoders affect robotic reinforcement learning performance, efficiency, and interpretability for a simulated manipulation task.

Kein E-Learningangebot vorhanden

Adresse:: WS2025_392241@ekvv.uni-bielefeld.de; Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.; Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_568328324@ekvv.uni-bielefeld.de
Hinweise:: Weitere Hinweise zu den E-Mailverteilern

Letzte Änderung Grunddaten/Lehrende:: Dienstag, 17. Juni 2025
Letzte Änderung Zeiten:: Sonntag, 15. Juni 2025
Letzte Änderung Räume:: Sonntag, 15. Juni 2025

Art(en) / SWS: Projekt (Pj) / 2
Sprache: Diese Veranstaltung wird komplett in englischer Sprache gehalten
Einrichtung: Technische Fakultät
Fragen oder Korrekturen?: Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen: Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung: Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!; Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:; https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=568328324
Seite zum Handy schicken: Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code:
ID: 568328324

Quicklinks

392241 Project: What do Robots Actually See? Comparing Visual Representations for Reinforcement Learning with a 3D-printed Arm (Pj) (WiSe 2025/2026)

Inhalt, Kommentar

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

Lehrende

Termine ( Kalendersicht )

Fachzuordnungen

Konkretisierung der Anforderungen

E-Learningangebote

Automatischer E-Mailverteiler der Veranstaltung

Änderungen/Aktualität der Veranstaltungsdaten

Sonstiges