392257 Projekt: Tiefenschätzungen auf Basis monokularer Panoramabilder für Hinderniskartenaufbau (Pj) (WiSe 2024/2025)

Inhalt, Kommentar

Die Distanz zu Objekten in der Umgebung ist eine Schlüsselinformation für mobile Roboter, denn sie
ermöglicht Hindernisvermeidung als eine elementare Funktion und unterstützt die Lokalisierung, Navigation
und die Interaktion mit Objekten in der Umwelt.

Laserscanner können eine hohe Präzision bieten, müssen aber für weitergehende Aufgaben, z. B.
Objekterkennung, um zusätzliche Sensorsysteme ergänzt werden. Eine Alternative stellen Kameras mit
Fischaugenoptik dar, die eine Rundumsicht der Umgebung bieten. Besonders kostengünstig sind dabei
monokulare Kamerasysteme; hierbei können die Entfernungen zu Objekten in der Umgebung aus den
Pixelwerten lediglich geschätzt werden. Die Arbeit von Yang et al. [1] zeigt, dass pixelweise
Tiefenschätzungen von monokularen Kamerasystemen mit Hilfe von neuronalen Netzwerken ausreichend
sind, um die Lokalisierung mobiler Roboter zu unterstützen.

In diesem Projekt soll untersucht werden, ob die Tiefenschätzung mit einem neuronalen Netz auf Basis
monokularer Panoramabilder ausreichend ist, um Hindernisse in der Umgebung eines mobilen Roboters
konsistent zu erkennen.

Wir schlagen MonoDepth [5] als Netzwerk-Architektur vor. Dieser Ansatz soll mit den Empfehlungen von de
La Garanderie et al. [3] so abgewandelt werden, dass es für die Verarbeitung von Panoramabildern geeignet
ist. Code für die Netzwerkarchitektur ist auf github verfügbar (https://github.com/gdlg/panoramic-depth-esti
mation; bei einer etwaigen Veröffentlichung muss auf die restriktive Lizenz geachtet werden).

Die Architektur muss vor dem Einsatz nachtrainiert werden. Als Grundlage dafür können z. B. Datenbanken
von einer Fischaugenkamera verwendet werden, die mit einem Flächenportal in verschiedenen
Innenräumen der Universität aufgenommen wurden. Da MonoDepth mit Stereobildern trainiert wird,
müssen unabhängig von der gewählten Datenquelle automatisiert Bildpaare aus der Datenbank
zusammengestellt werden.
Dabei kann die Baseline fest oder variabel gewählt werden.

Die pixelweisen Tiefenschätzungen der Netzwerkarchitektur müssen auf eine zweidimensionale Ansicht
reduziert werden, z. B., indem die Schätzungen aus der Horizontregion entnommen werden. Diese liefern
dann für eine aktuelle Ansicht den spaltenweisen Abstand zum nächsten Hindernis.

Wir vermuten, dass diese Schätzungen auch über kurze Zeiträume inkonsistent sein werden. Um eine
konsistente Hinderniskarte aufzubauen, sollen Entfernungspunkte als zusätzliche Messungen in ein
Smoothing-and-Mapping-System aufgenommen werden (entweder global oder lokal mit einem Fenster,
nach dem Knoten aus dem Graph entfernt werden). Als weitere Messungen dienen die Odometrie des
Roboters und eine relative Posenschätzung mit MinWarping. Als Implementation für den Smoothing-and-
Mapping-Algorithmus kann GTSAM verwendet werden (https://gtsam.org).

Eine optionale Erweiterung des Projekts ist eine Live-Demo mit einem Indoor-Roboter. Hierbei soll die lokale
Hinderniskarte genutzt werden, um eine einfache Hindernisvermeidung zu implementieren. Dazu sollte die
Geschwindigkeit des Netzwerks hoch genug sein, um Bilder in Echtzeit zu verarbeiten; ggf. kann das
Netzwerk dazu mit Pruning [4] verkleinert werden.

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  

Zeige vergangene Termine >>

Fachzuordnungen

Modul Veranstaltung Leistungen  
39-M-Inf-P_ver1 Projekt Projekt unbenotete Prüfungsleistung
Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.


Keine Konkretisierungen vorhanden
Kein E-Learningangebot vorhanden
Adresse:
WS2024_392257@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_505799360@ekvv.uni-bielefeld.de
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
Letzte Änderung Grunddaten/Lehrende:
Mittwoch, 13. November 2024 
Letzte Änderung Zeiten:
Mittwoch, 13. November 2024 
Letzte Änderung Räume:
Mittwoch, 13. November 2024 
Art(en) / SWS
Projekt (Pj) / 2
Einrichtung
Technische Fakultät
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=505799360
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ID
505799360