392235 Project: Benchmarking Diffusion and Flow Policies for Reinforcement Learning with a 3D-printed Robotic Arm (Pj) (WiSe 2025/2026)

Inhalt, Kommentar

Recent advances in diffusion and flow-based policies have shown great promise in robotic RL, yet a systematic comparison of these methods on practical robotic manipulation tasks remains missing. This project will benchmark three state-of-the-art algorithms—Diffusion-QL, Flow Q-Learning, and Consistency-AC—in two robotic scenarios (a simple reach task and a more challenging drawer-closing task) using the WidowX robot arm in simulation. Your goal is to measure and compare convergence rates, success metrics, computational efficiency, and stability.

This project offers excellent experience for students interested in cutting-edge algorithmic research, deep learning, and robot manipulation. You will acquire skills in reproducible experimentation and robust algorithmic evaluation. When applicable, your results can be published as a short benchmark note or as an appendix to an existing paper.

For more details or to apply, feel free to contact me directly via email or in-person.

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

You should be proficient in PyTorch and have a solid understanding of deep RL fundamentals and diffusion or flow-based generative models. The project provides you with a prebuilt 3D printed WidowX arm, ready-to-use MuJoCo simulation environments, baseline RL implementations, and all necessary computational resources (though bringing your own GPU is a plus).

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  
nach Vereinbarung n.V.   13.10.2025-06.02.2026

Fachzuordnungen

Modul Veranstaltung Leistungen  
39-M-Inf-P Projekt Projekt unbenotete Prüfungsleistung
Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.


Compare and evaluate diffusion- and flow-based RL algorithms regarding convergence speed, stability, and final performance on a simulated robotic manipulation task.

Kein E-Learningangebot vorhanden
Adresse:
WS2025_392235@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_568321174@ekvv.uni-bielefeld.de
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
Letzte Änderung Grunddaten/Lehrende:
Sonntag, 15. Juni 2025 
Letzte Änderung Zeiten:
Sonntag, 15. Juni 2025 
Letzte Änderung Räume:
Sonntag, 15. Juni 2025 
Art(en) / SWS
Projekt (Pj) / 2
Einrichtung
Technische Fakultät
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=568321174
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ID
568321174