392257 Projekt: Tiefenschätzungen auf Basis monokularer Panoramabilder für Hinderniskartenaufbau (Pj) (WiSe 2024/2025)

Contents, comment

Die Distanz zu Objekten in der Umgebung ist eine Schlüsselinformation für mobile Roboter, denn sie
ermöglicht Hindernisvermeidung als eine elementare Funktion und unterstützt die Lokalisierung, Navigation
und die Interaktion mit Objekten in der Umwelt.

Laserscanner können eine hohe Präzision bieten, müssen aber für weitergehende Aufgaben, z. B.
Objekterkennung, um zusätzliche Sensorsysteme ergänzt werden. Eine Alternative stellen Kameras mit
Fischaugenoptik dar, die eine Rundumsicht der Umgebung bieten. Besonders kostengünstig sind dabei
monokulare Kamerasysteme; hierbei können die Entfernungen zu Objekten in der Umgebung aus den
Pixelwerten lediglich geschätzt werden. Die Arbeit von Yang et al. [1] zeigt, dass pixelweise
Tiefenschätzungen von monokularen Kamerasystemen mit Hilfe von neuronalen Netzwerken ausreichend
sind, um die Lokalisierung mobiler Roboter zu unterstützen.

In diesem Projekt soll untersucht werden, ob die Tiefenschätzung mit einem neuronalen Netz auf Basis
monokularer Panoramabilder ausreichend ist, um Hindernisse in der Umgebung eines mobilen Roboters
konsistent zu erkennen.

Wir schlagen MonoDepth [5] als Netzwerk-Architektur vor. Dieser Ansatz soll mit den Empfehlungen von de
La Garanderie et al. [3] so abgewandelt werden, dass es für die Verarbeitung von Panoramabildern geeignet
ist. Code für die Netzwerkarchitektur ist auf github verfügbar (https://github.com/gdlg/panoramic-depth-esti
mation; bei einer etwaigen Veröffentlichung muss auf die restriktive Lizenz geachtet werden).

Die Architektur muss vor dem Einsatz nachtrainiert werden. Als Grundlage dafür können z. B. Datenbanken
von einer Fischaugenkamera verwendet werden, die mit einem Flächenportal in verschiedenen
Innenräumen der Universität aufgenommen wurden. Da MonoDepth mit Stereobildern trainiert wird,
müssen unabhängig von der gewählten Datenquelle automatisiert Bildpaare aus der Datenbank
zusammengestellt werden.
Dabei kann die Baseline fest oder variabel gewählt werden.

Die pixelweisen Tiefenschätzungen der Netzwerkarchitektur müssen auf eine zweidimensionale Ansicht
reduziert werden, z. B., indem die Schätzungen aus der Horizontregion entnommen werden. Diese liefern
dann für eine aktuelle Ansicht den spaltenweisen Abstand zum nächsten Hindernis.

Wir vermuten, dass diese Schätzungen auch über kurze Zeiträume inkonsistent sein werden. Um eine
konsistente Hinderniskarte aufzubauen, sollen Entfernungspunkte als zusätzliche Messungen in ein
Smoothing-and-Mapping-System aufgenommen werden (entweder global oder lokal mit einem Fenster,
nach dem Knoten aus dem Graph entfernt werden). Als weitere Messungen dienen die Odometrie des
Roboters und eine relative Posenschätzung mit MinWarping. Als Implementation für den Smoothing-and-
Mapping-Algorithmus kann GTSAM verwendet werden (https://gtsam.org).

Eine optionale Erweiterung des Projekts ist eine Live-Demo mit einem Indoor-Roboter. Hierbei soll die lokale
Hinderniskarte genutzt werden, um eine einfache Hindernisvermeidung zu implementieren. Dazu sollte die
Geschwindigkeit des Netzwerks hoch genug sein, um Bilder in Echtzeit zu verarbeiten; ggf. kann das
Netzwerk dazu mit Pruning [4] verkleinert werden.

Teaching staff

Dates ( Calendar view )

Frequency Weekday Time Format / Place Period  
by appointment n.V.   07.10.2024-31.01.2025

Hide passed dates <<

Subject assignments

Module Course Requirements  
39-M-Inf-P_ver1 Projekt Projekt Ungraded examination
Student information

The binding module descriptions contain further information, including specifications on the "types of assignments" students need to complete. In cases where a module description mentions more than one kind of assignment, the respective member of the teaching staff will decide which task(s) they assign the students.


No more requirements
No eLearning offering available
Address:
WS2024_392257@ekvv.uni-bielefeld.de
This address can be used by teaching staff, their secretary's offices as well as the individuals in charge of course data maintenance to send emails to the course participants. IMPORTANT: All sent emails must be activated. Wait for the activation email and follow the instructions given there.
If the reference number is used for several courses in the course of the semester, use the following alternative address to reach the participants of exactly this: VST_505799360@ekvv.uni-bielefeld.de
Notes:
Additional notes on the electronic mailing lists
Last update basic details/teaching staff:
Wednesday, November 13, 2024 
Last update times:
Wednesday, November 13, 2024 
Last update rooms:
Wednesday, November 13, 2024 
Type(s) / SWS (hours per week per semester)
project (Pj) / 2
Department
Faculty of Technology
Questions or corrections?
Questions or correction requests for this course?
Planning support
Clashing dates for this course
Links to this course
If you want to set links to this course page, please use one of the following links. Do not use the link shown in your browser!
The following link includes the course ID and is always unique:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=505799360
Send page to mobile
Click to open QR code
Scan QR code: Enlarge QR code
ID
505799360