392241 Project: What do Robots Actually See? Comparing Visual Representations for Reinforcement Learning with a 3D-printed Arm (Pj) (WiSe 2025/2026)

Inhalt, Kommentar

Robots learn to interact with the world through visual input. But how exactly does the choice of visual representation, the way a robot "sees" its environment, impact its learning ability? This project aims to systematically evaluate several state-of-the-art pretrained encoders (e.g., ResNet-50, DINOv2, R3M, VIP, CLIP) by analyzing their visual attention patterns and correlating these with RL learning speed and success rate in a robotic manipulation task. You will embed images from a simulated WidowX pick-and-place task, generate attention heat maps, and measure how well attention overlaps with relevant objects. Then, you will plug these frozen encoders into an off-policy RL algorithm and empirically evaluate their downstream performance.

This project is a valuable opportunity for students interested in computer vision and robot learning, offering hands-on experience with modern deep learning frameworks, reinforcement learning, and simulation environments. You will directly contribute to understanding how visual representation quality impacts robot learning performance. When applicable, your results can be published as a short benchmark note or as an appendix to an existing paper.

For more details or to apply, feel free to contact me directly via email or in-person.

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

You should have strong familiarity with PyTorch and a python-based simulation framework. Experience with OpenCV and basic reinforcement learning concepts (e.g., SAC or similar) will be beneficial. The project provides you with a prebuilt 3D printed WidowX arm, ready-to-use MuJoCo simulation environments, baseline RL implementations, and all necessary computational resources (though bringing your own GPU is a plus).

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  
nach Vereinbarung n.V.   13.10.2025-06.02.2026

Fachzuordnungen

Modul Veranstaltung Leistungen  
39-M-Inf-P Projekt Projekt unbenotete Prüfungsleistung
Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.


Analyze and compare how different pretrained visual encoders affect robotic reinforcement learning performance, efficiency, and interpretability for a simulated manipulation task.

Kein E-Learningangebot vorhanden
Adresse:
WS2025_392241@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_568328324@ekvv.uni-bielefeld.de
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
Letzte Änderung Grunddaten/Lehrende:
Dienstag, 17. Juni 2025 
Letzte Änderung Zeiten:
Sonntag, 15. Juni 2025 
Letzte Änderung Räume:
Sonntag, 15. Juni 2025 
Art(en) / SWS
Projekt (Pj) / 2
Sprache
Diese Veranstaltung wird komplett in englischer Sprache gehalten
Einrichtung
Technische Fakultät
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=568328324
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ID
568328324