392257 Projekt: Tiefenschätzungen auf Basis monokularer Panoramabilder für Hinderniskartenaufbau (Pj) (WiSe 2024/2025)

Inhalt, Kommentar

Die Distanz zu Objekten in der Umgebung ist eine Schlüsselinformation für mobile Roboter, denn sie
ermöglicht Hindernisvermeidung als eine elementare Funktion und unterstützt die Lokalisierung, Navigation
und die Interaktion mit Objekten in der Umwelt.

Laserscanner können eine hohe Präzision bieten, müssen aber für weitergehende Aufgaben, z. B.
Objekterkennung, um zusätzliche Sensorsysteme ergänzt werden. Eine Alternative stellen Kameras mit
Fischaugenoptik dar, die eine Rundumsicht der Umgebung bieten. Besonders kostengünstig sind dabei
monokulare Kamerasysteme; hierbei können die Entfernungen zu Objekten in der Umgebung aus den
Pixelwerten lediglich geschätzt werden. Die Arbeit von Yang et al. [1] zeigt, dass pixelweise
Tiefenschätzungen von monokularen Kamerasystemen mit Hilfe von neuronalen Netzwerken ausreichend
sind, um die Lokalisierung mobiler Roboter zu unterstützen.

In diesem Projekt soll untersucht werden, ob die Tiefenschätzung mit einem neuronalen Netz auf Basis
monokularer Panoramabilder ausreichend ist, um Hindernisse in der Umgebung eines mobilen Roboters
konsistent zu erkennen.

Wir schlagen MonoDepth [5] als Netzwerk-Architektur vor. Dieser Ansatz soll mit den Empfehlungen von de
La Garanderie et al. [3] so abgewandelt werden, dass es für die Verarbeitung von Panoramabildern geeignet
ist. Code für die Netzwerkarchitektur ist auf github verfügbar (https://github.com/gdlg/panoramic-depth-esti
mation; bei einer etwaigen Veröffentlichung muss auf die restriktive Lizenz geachtet werden).

Die Architektur muss vor dem Einsatz nachtrainiert werden. Als Grundlage dafür können z. B. Datenbanken
von einer Fischaugenkamera verwendet werden, die mit einem Flächenportal in verschiedenen
Innenräumen der Universität aufgenommen wurden. Da MonoDepth mit Stereobildern trainiert wird,
müssen unabhängig von der gewählten Datenquelle automatisiert Bildpaare aus der Datenbank
zusammengestellt werden.
Dabei kann die Baseline fest oder variabel gewählt werden.

Die pixelweisen Tiefenschätzungen der Netzwerkarchitektur müssen auf eine zweidimensionale Ansicht
reduziert werden, z. B., indem die Schätzungen aus der Horizontregion entnommen werden. Diese liefern
dann für eine aktuelle Ansicht den spaltenweisen Abstand zum nächsten Hindernis.

Wir vermuten, dass diese Schätzungen auch über kurze Zeiträume inkonsistent sein werden. Um eine
konsistente Hinderniskarte aufzubauen, sollen Entfernungspunkte als zusätzliche Messungen in ein
Smoothing-and-Mapping-System aufgenommen werden (entweder global oder lokal mit einem Fenster,
nach dem Knoten aus dem Graph entfernt werden). Als weitere Messungen dienen die Odometrie des
Roboters und eine relative Posenschätzung mit MinWarping. Als Implementation für den Smoothing-and-
Mapping-Algorithmus kann GTSAM verwendet werden (https://gtsam.org).

Eine optionale Erweiterung des Projekts ist eine Live-Demo mit einem Indoor-Roboter. Hierbei soll die lokale
Hinderniskarte genutzt werden, um eine einfache Hindernisvermeidung zu implementieren. Dazu sollte die
Geschwindigkeit des Netzwerks hoch genug sein, um Bilder in Echtzeit zu verarbeiten; ggf. kann das
Netzwerk dazu mit Pruning [4] verkleinert werden.

Lehrende

Herr M.Sc. Lars Offermann

Termine ( Kalendersicht )

Rhythmus	Tag	Uhrzeit	Format / Ort	Zeitraum

Zeige vergangene Termine >>

Fachzuordnungen

Modul	Veranstaltung	Leistungen
39-M-Inf-P_ver1 Projekt	Projekt	unbenotete Prüfungsleistung	Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.

Keine Konkretisierungen vorhanden

Kein E-Learningangebot vorhanden

Adresse:: WS2024_392257@ekvv.uni-bielefeld.de; Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.; Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_505799360@ekvv.uni-bielefeld.de
Hinweise:: Weitere Hinweise zu den E-Mailverteilern

Letzte Änderung Grunddaten/Lehrende:: Mittwoch, 13. November 2024
Letzte Änderung Zeiten:: Mittwoch, 13. November 2024
Letzte Änderung Räume:: Mittwoch, 13. November 2024

Art(en) / SWS: Projekt (Pj) / 2
Einrichtung: Technische Fakultät
Fragen oder Korrekturen?: Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen: Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung: Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!; Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:; https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=505799360
Seite zum Handy schicken: Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code:
ID: 505799360

Quicklinks

392257 Projekt: Tiefenschätzungen auf Basis monokularer Panoramabilder für Hinderniskartenaufbau (Pj) (WiSe 2024/2025)

Inhalt, Kommentar

Lehrende

Termine ( Kalendersicht )

Fachzuordnungen

Konkretisierung der Anforderungen

E-Learningangebote

Automatischer E-Mailverteiler der Veranstaltung

Änderungen/Aktualität der Veranstaltungsdaten

Sonstiges