Monokulare Tiefenschätzung

Für zahlreiche Anwendungen, wie z. B. das autonome Fahren oder die erweiterte Realität, ist die Generierung von Tiefenkarten unerlässlich. Typischerweise werden diese aus Stereobildpaaren oder durch den Einsatz aktiver Sensoren (z. B. LiDAR oder RGB-D-Kameras) erzeugt. Ausgehend von der monokularen Tiefenwahrnehmung des Menschen wird in diesem Projekt die Schätzung von Tiefenkarten aus Einzelbildern mittels künstlicher neuronaler Netze untersuch.

Evaluationsmetriken

Zur qualitativen Beurteilung solcher vorhergesagten Tiefenkarten wurden bisher meist qualitative Vergleiche und globale Fehlermetriken verwendet. Diese berücksichtigen jedoch nicht die lokalen geometrischen Eigenschaften der Tiefenkarten. Aus diesem Grund stellen wir eine Reihe neuer, geometrisch interpretierbarer Metriken vor, die sich auf die folgenden Qualitätskriterien von Tiefenkarten konzentrieren:

Genauigkeit und Vollständigkeit von Tiefendiskontinuitäten
Planarität und Orientierung von flächigen Objekten
Abstandsbezogene Beurteilung

Weitere Informationen werden in den zugehörigen Publikationen [Koch19; Koch20] beschrieben.

RGB-D-Datensatz iBims-1

Die Anwendung unserer neuen Fehlermetriken erfordert einen hochwertigen RGB-D-Referenzdatensatz. Mit Hilfe eines maßgeschneiderten Aufnahmeaufbaus, bestehend aus einer DSLR-Kamera und einem terrestrischen Laserscanner, kann eine Reihe von dichten und genau ausgerichteten RGB-D-Bildpaaren erzeugt werden, die sich durch hohe Auflösung und geringes Rauschen auszeichnen. Unsere aufgenommenen Bildpaare liefern scharfe Tiefenunterbrechungen sowie rauschfreie ebene Flächen, die Grundvoraussetzungen für unsere Fehlermetriken sind.

Dieser Aufbau wurde verwendet, um unseren neuen Testdatensatz iBims-1 (independent Benchmark images and matched scans - version 1) für die monokulare Tiefenschätzung zu erstellen. Weitere Informationen zu unserem Datensatz finden Sie auf der Datensatzseite.

Publikationen

Koch, Tobias; Liebel, Lukas; Körner, Marco; Fraundorfer, Friedrich: Comparison of monocular depth estimation methods using geometrically relevant metrics on the IBims-1 dataset. Computer Vision and Image Understanding (CVIU) 191, 2020, 102877 mehr… Volltext ( DOI )
Koch, Tobias; Liebel, Lukas; Fraundorfer, Friedrich; Körner, Marco: Evaluation of CNN-Based Single-Image Depth Estimation Methods. Proceedings of the European Conference on Computer Vision Workshops (ECCV-WS), Springer International Publishing, 2019, 331-348 mehr… Volltext ( DOI )
Hödel, Max; Koch, Tobias; Hoegner, Ludwig; Stilla, Uwe: Monocular-Depth Assisted Semi-Global-Matching. International Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences (ISPRS) IV-2/W7, 2019, 55-62 mehr… Volltext ( DOI )
Liebel, Lukas; Körner, Marco: MultiDepth: Single-Image Depth Estimation via Multi-Task Regression and Classification. IEEE Intelligent Transportation Systems Conference (ITSC), IEEE, 2019, 1440-1447 mehr… Volltext ( DOI )
Bittner, Ksenia; Körner, Marco; Fraundorfer, Friedrich; Reinartz, Peter: Multi-Task cGAN for Simultaneous Spaceborne DSM Refinement and Roof-Type Classification. Remote Sensing 11 (11), 2019, 1262 mehr… Volltext ( DOI )

To top

Lehrstuhl für Methodik der Fernerkundung

Prof. Dr. Benjamin Busam

Technische Universität München
Arcisstr. 21
80333 München

Tel.: +49.89.289.22876
Fax: +49.89.289.23202

Kontakt

PD Dr. Marco Körner (PI)
marco.koerner@tum.de

Dr.-Ing. Tobias Koch (DI)
tobias.koch@tum.de

Lukas Liebel, M.Sc. (DI)
lukas.liebel@tum.de