Go to page

Bibliographic Metadata

Links
Abstract

Hauspreisevaluierungen sind ein essenzieller, aber arbeitsaufwändiger Bestandteil in Kauf-, Finanzierungs- oder Grundsteueraktivitäten. Informationssysteme basierend auf hedonischen Preismodellen helfen die Aufgabe zu automatisieren und fokussieren auf klassische Hauseigenschaften und lineare Modelle. Jedoch haben diese eine limitierte Vorhersagepräzision und können keine impliziten Preiseinflüsse aus unstrukturierten Daten wie Bildern bemessen. Das Ziel dieser Arbeit ist die Verbesserung der Hauspreisschätzung durch Multi-view Learning, welche verschiedene Datentypen gleichzeitig analysieren kann. Aktuell bleiben der Einfluss von Datenquellen und Modellierungsstrategie auf die Vorhersagegenauigkeit unklar. Zusätzlich muss die Erklärbarkeit der Algorithmen eruiert werden. Unsere Experimente zeigen, dass Hauspreisschätzungen basierend auf Multi-view Modellen zwischen 5.4% und 34% genauer sind. Eine Kombination aus geo-räumlichen Daten, sowie Außen- und Straßenbildern verbessert die Vorhersageperformance am stärksten, während Multi-view Neuronal Networks die performantesten Modelle sind. Erklärbare künstliche Intelligenz hilft bei der Identifizierung von Entscheidungsparametern, z.B. durch die entwickelte Grad-Ram Erklärbarkeitsmethode. Aus ökonomischer Sicht zeigt ein Vergleich von Such- und Erfahrungseigenschaften, dass beide essenziell für die Hauspreisschätzung sind. Schlussendlich wird eine Taxonomie für die Erklärbarkeit von Vorhersagesystemen konstruiert.

Abstract

Real estate appraisal, the house price estimation, is an essential but cumbersome task for selling, financing, or taxing a property. Information systems based on the hedonic pricing model arose, helping automate the process. These systems use classical house attributes like size and age in linear models. However, these systems fall short with limited predictive performance and cannot account for implicit factors like aesthetics embedded in unstructured data like images. Therefore, this work aims to improve real estate appraisal by leveraging multi-view learning models, which analyze multiple data types simultaneously. It has remained unclear which data sources to include and which modeling strategy to use to increase the predictive power. Furthermore, as most models are black boxes, explainability must also be inspected. Our experiments indicate that multi-view real estate appraisal models perform between 5.4% and 34% better than the baseline. A combination of geospatial data, exterior and streetview images was the best data combination, while multi-view neural networks were the most performant models. Explainable artificial intelligence helped to extract reasons for the predictions. In particular, we developed a new post-hoc method called Grad-Ram. From an economic perspective, comparing search and experience qualities revealed that both are essential for the price estimation. Lastly, a taxonomy describing the explainability of these systems was developed.

Stats