Aschauer, M. (2021). Ein Vergleich von Kredit Scoring Methoden mittels XGBoost und logistischer Regression [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2021.86466
Die Vergabe von Krediten ist eine der Haupttätigkeitsbereiche einer Kreditinstitution. Auch in Zukunft wird sich dies nicht ändern, weil Privatpersonen immer häufiger Kredite benötigen. Deshalb wachsen die Portfolios von Kreditinstitutionen stetig an. Die Entscheidung über die Vergabe eines Kredites oder der Ablehnung der Kreditanfrage wird daher immer wichtiger. Als Entscheidungshilfe wird dabei derzeit am häufigsten die logistische Regression für das Kredit Scoring eingesetzt. Jedoch würde jede Verbesserung dieser Methode zu signifikanten zukünftigen Einsparungen führen. Daher beschäftigt sich diese Diplomarbeit mit der Ausarbeitung und Implementierung von XGBoost im Bereich des Kredit Scoring und anschließendem Vergleich zur logistischen Regression. Zu Beginn der Arbeit wird allgemein der Bereich des Kredit Scoring und die dabei verwendeten Methoden erklärt. Anschließend wird die logistische Regression näher eingeführt, um die Grundlage für die spätere Implementierung und den Vergleich zu legen. Mit der Einführung von Entscheidungsbäumen, Bagging, Boosting und Random Forests wird danach das Basiswissen und eine Abgrenzung zu anderen Methoden für XGBoost gelegt. Der Kern der Arbeit beginnt mit der Ausarbeitung der Details und der Vorteile von XGBoost. Vor der Implementierung von XGBoost und der logistischen Regression werden noch Performance Maße eingeführt, anhand derer die Resultate verglichen werden. Alles in allem zeigt sich, dass XGBoost eine erhebliche Verbesserung zur logistischen Regression in diesem Bereich darstellt. Dabei betreffen diese Verbesserungen nicht nur die Ergebnisse bei der Vorhersage, sondern auch die Handhabung der Methode.
de
Granting loans is one of the main and most important tasks of credit institutions. Additionally, private individuals need loans more and more often. Thus, the portfolios of credit institutions are constantly growing. This is why the decision on whether to grant a loan or deny the request is becoming increasingly important. Currently, logistic regression is the most commonly used method for credit scoring. However, any further improvements of this method will lead to significant future savings. Therefore, this thesis deals with the elaboration and implementation of XGBoost in the field of credit scoring and, subsequently, a comparison to logistic regression. At the beginning of the thesis, the field of credit scoring and the used methods are explained in general. Next, logistic regression is introduced in detail to lay the foundation for the later implementation and comparison. After that, the introduction of decision trees, bagging, boosting and random forest lays the foundation and a distinction to other methods for XGBoost. The core of the thesis is concerned with the elaboration of the details of XGBoost. For this purpose, before implementing XGBoost and logistic regression, performance measures are introduced, which are used to compare the results. All in all, it is shown that XGBoost is a significant improvement to logistic regression in this area. However, the improvements do not only concern the prediction results, but also the handling of the method.
en
Weitere Information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers