Lipenko, A. (2023). Extremwerttheorie in der Schadenbedarfsprognose [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.110695
Generalized linear model; extreme value theory; large claims; boosting methods
en
Abstract:
Diese Arbeit analysiert eine Möglichkeit, die Vorhersagekraft von verallgemeinerten linearen Modellen (engl.: Generalized Linear Model (GLM)) gegenüber Gradient Boosting Machine in Schadenbedarfsprognose zu verbessern. In der Literatur ist nachgewiesen, dass die Boosting Methoden bessere Vorhersagekraft als GLM haben. Allerdings bietet GLM vor allem durch seine leichte Interpretierbarkeit auch Vorteile und wird dadurch vorzugsweise in der Versicherungsbranche benutzt. Einer der Schwachstellen von GLM ist seine Sensibilität gegenüber der Großschäden. Unsere Fragestellung ist somit, ob wir die Vorhersagekraft von GLM verbessern können, wenn wir passende Großschadengrenzen berücksichtigen. Für das Bestimmen der möglichen Grenzen sowie das Approximieren der Teile von Schadenbeträgen, die oberhalb der Großschadengrenze liegen, an die verallgemeinerte Paretoverteilung benutzten wir Extremwerttheorie. Durch Kombinieren von GLM und Extremwerttheorie haben wir abhängig von Großschadengrenze drei Modelle gebaut. Alle diese Modelle konnten bessere Vorhersagen treffen als ein Modell ohne Großschadengrenze. Während das GLM ohne Großschadengrenze den tatsächlichen Schadenbedarf unter anderen wegen der Sensibilität bezüglich Großschäden um 30% überschätzt hat, liefern Modelle mit einer Großschadengrenze bessere Prognosen. Wir haben auch gezeigt, wie der Schadenbedarf der Tarifgruppen mit einem Großschaden in der Vergangenheit überschätzt wird. Das führt insbesondere in kleineren Portfolios zur Diskriminierung der einzelnen Tarifgruppen. Dieser Effekt ist bei den gebauten Modellen gemildert. Uns ist es auch gelungen, bessere Werte nach Akaike Informationskriterium und in mittleren quadratischen Abweichungen zu bekommen. Der Vergleich aller Modelle mit Gradient Boosting Machine zeigt die bessere Vorhersagekraft von Gradient Boosting Machine. Aus diesem Vergleich ist es auch ersichtlich, dass die kombinierten Modelle näher an Gradient Boosting Machine liegen als das GLM ohne Großschadengrenze. Insbesondere ist die Verteilung des Schadenbedarfs auf Tarifebenen präziser. Das trägt zu einer adäquaten Preisgestaltung in einem Versicherungsunternehmen bei.
de
This thesis analyzes a possibility to improve the predictive power of Generalized Linear Model (GLM) versus Gradient Boosting Machine in insurance claims prediction. It has been proven in the literature that the boosting methods have better predictive power than GLM. However, GLM also offers advantages, above all due to its easy interpretability and is therefore preferably used in the insurance industry. One of GLM's weaknesses is its sensitivity to large claims. Our question is therefore whether we can improve the predictive power of GLM if we take suitable large loss thresholds into account. We used extreme value theory to determine the possible thresholds and to approximate the parts of claims amounts that are above the threshold to the generalized Pareto distribution.By combining GLM and extreme value theory, we have built three models depending on the threshold. All of these models were able to make better predictions than a model without a threshold. While the GLM without a threshold overestimated the actual loss by 30%, partly because of the sensitivity to large claims, models with a threshold provide better forecasts. We have also shown how the claims prediction of tariff groups with large losses in the past can be overestimated. In smaller portfolios in particular, this leads to discrimination between the individual tariff groups. This effect is mitigated in the built models. We have also achieved better values according to Akaike information criterion and in mean squared error. The comparison of the models with Gradient Boosting Machine clearly shows that while Gradient Boosting Machine delivers better results, the built models achieve an improvement. In particular, the distribution of claims demand forecasts at contract level is more accurate. This contributes to adequate pricing in an insurance company.
en
Weitere Information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers