Bibliographic Metadata
EnglishFor navigating and manipulating objects, animals, as well as autonomous robots, need information about the form and the position of objects. The advantage of camera systems is that there is no need for a complex data fusion between object recognition tasks and depth perception. Furthermore it is also possible to realize low-cost solutions. Nevertheless, when a three dimensional scene is projected to the two dimensional receptive field of a camera or a biological vision system, all depth information is lost. Also in the two dimensional display the form of an object is reduced to a contour, that may be interrupted due to occluding objects. In order to reconstruct the lost contour and depth information, animals, especially human beings, are taken as a model. The most obvious approach to such a reconstruction is the use of Stereo Vision. While there has been a great amount of research done on stereoscopic approaches, which produced many efficient algorithms, little emphasis was placed on monocular depth criteria so far. In this work, occlusion, being one of the most important monocular depth criteria, is used for the three dimensional interpretation of a scene and for the reconstruction of occluded contours. Emphasis is placed on the entire process chain, starting with the filtering of natural images. With anisotropic diffusion, a method is introduced, that enables a reduction of input images to salient features, while preserving edge information. DeutschSowohl Lebewesen als auch autonom agierende Roboter, welche in Interaktion mit ihrer Umwelt treten, benötigen zur Navigation und zur Manipulation von Objekten unter anderem Informationen über die Form und die Position von Objekten in ihrer Umgebung. Kamerasysteme bieten zum einen den Vorteil, dass eine aufwändige Datenfusion der Ergebnisse von Objekterkennung und Tiefenwahrnehmung entfällt und zum anderen den Vorteil einer kostengünstigen Realisierbarkeit. Durch die Abbildung einer dreidimensionalen Szene auf ein zweidimensionales Kamerabild geht allerdings die Tiefeninformation der betrachteten Szene verloren. Auch die Form von Objekten beschränkt sich in der zweidimensionalen Darstellung auf eine Kontur, die darüberhinaus durch verdeckende Objekte unterbrochen sein kann. Zur Rekonstruktion der durch die Kameraprojektion verlorenen Kontur- und Tiefeninformationen dienen Lebewesen, speziell der Mensch, als Vorbild. Eine naheliegende Methode zur Rekonstruktion der Tiefeninformation besteht in Analogie zum natürlichen Vorbild in der Auswertung zweier Stereobilder. Während aber das Gebiet der stereoskopischen Korrespondenzbestimmung weitgehend in der Literatur behandelt wurde und eine Vielzahl an effizienten Algorithmen hervorgebracht hat, haben monokulare Tiefenkriterien bisher nur wenig Einzug in Bildverarbeitungsanwendungen gehalten. In der Arbeit wird eines der wichtigsten monokularen Tiefenkriterien, die Verdeckung, herangezogen, um eine betrachtete Szene sinnvoll dreidimensional zu interpretieren und verdeckte Konturen zu vervollständigen. Hierbei wird besonderer Wert auf die gesamte Prozesskette gelegt, angefangen bei der Filterung natürlicher Bilder, bis hin zur perzeptuellen Organisation des Bildinhalts. Dazu wird mit der anisotropen Regularisierung eine Methodik vorgestellt, die, unter Beibehaltung salienter, also wesentlicher Konturinformationen, entsprechend einer gewünschten Skalierung eine Reduktion des Eingangsbildes auf wesentliche Bildinhalte gewährleistet. |