392235 Project: Benchmarking Diffusion and Flow Policies for Reinforcement Learning with a 3D-printed Robotic Arm (Pj) (WiSe 2025/2026)

Inhalt, Kommentar

Recent advances in diffusion and flow-based policies have shown great promise in robotic RL, yet a systematic comparison of these methods on practical robotic manipulation tasks remains missing. This project will benchmark three state-of-the-art algorithms—Diffusion-QL, Flow Q-Learning, and Consistency-AC—in two robotic scenarios (a simple reach task and a more challenging drawer-closing task) using the WidowX robot arm in simulation. Your goal is to measure and compare convergence rates, success metrics, computational efficiency, and stability.

This project offers excellent experience for students interested in cutting-edge algorithmic research, deep learning, and robot manipulation. You will acquire skills in reproducible experimentation and robust algorithmic evaluation. When applicable, your results can be published as a short benchmark note or as an appendix to an existing paper.

For more details or to apply, feel free to contact me directly via email or in-person.

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

You should be proficient in PyTorch and have a solid understanding of deep RL fundamentals and diffusion or flow-based generative models. The project provides you with a prebuilt 3D printed WidowX arm, ready-to-use MuJoCo simulation environments, baseline RL implementations, and all necessary computational resources (though bringing your own GPU is a plus).

Lehrende

Termine ( Kalendersicht )

Rhythmus	Tag	Uhrzeit	Format / Ort	Zeitraum
nach Vereinbarung	n.V.			13.10.2025-06.02.2026

Fachzuordnungen

Modul	Veranstaltung	Leistungen
39-M-Inf-P Projekt Projekt	Projekt	unbenotete Prüfungsleistung	Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.

Compare and evaluate diffusion- and flow-based RL algorithms regarding convergence speed, stability, and final performance on a simulated robotic manipulation task.

Kein E-Learningangebot vorhanden

Adresse:: WS2025_392235@ekvv.uni-bielefeld.de; Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.; Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_568321174@ekvv.uni-bielefeld.de
Hinweise:: Weitere Hinweise zu den E-Mailverteilern

Letzte Änderung Grunddaten/Lehrende:: Sonntag, 15. Juni 2025
Letzte Änderung Zeiten:: Sonntag, 15. Juni 2025
Letzte Änderung Räume:: Sonntag, 15. Juni 2025

Art(en) / SWS: Projekt (Pj) / 2
Einrichtung: Technische Fakultät
Fragen oder Korrekturen?: Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen: Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung: Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!; Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:; https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=568321174
Seite zum Handy schicken: Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code:
ID: 568321174

Quicklinks

392235 Project: Benchmarking Diffusion and Flow Policies for Reinforcement Learning with a 3D-printed Robotic Arm (Pj) (WiSe 2025/2026)

Inhalt, Kommentar

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

Lehrende

Termine ( Kalendersicht )

Fachzuordnungen

Konkretisierung der Anforderungen

E-Learningangebote

Automatischer E-Mailverteiler der Veranstaltung

Änderungen/Aktualität der Veranstaltungsdaten

Sonstiges