Retzer, L. (2025). Normality tests for small sample sizes : a comparison with power simulation [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2025.119561
E105 - Institut für Stochastik und Wirtschaftsmathematik
-
Date (published):
2025
-
Number of Pages:
121
-
Keywords:
Tests für Normalannahme; kleine Stichprobengrößen; Graphische Tests; Shapiro-Wilk Test; Anderson-Darling Test; Cramer-von Mises Test; Jarque-Bera Test; Kolmogorov-Smirnov Test; Power Simulation
de
Normality tests; Small sample sizes; Graphical test; Shapiro-Wilk test; Anderson-Darling test; Cramer-von Mises test; Jarque-Bera test; Kolmogorov-Smirnov test; Power simulation
en
Abstract:
Im Rahmen eines Datenerhebungsprozesses bei der UNIQA Insurance Group stellte sich die Frage, ob eine Teilmenge der beobachteten Variablen als normalverteilt angenommen werden kann. Diese Fragestellung bildet den Ausgangspunkt dieser Diplomarbeit, die sich mit statistischen Tests und grafischen Methoden zur Bewertung der Hypothese befasst, dass eine Stichprobe von einer Normalverteilung stammt.Aufgrund historischer Änderungen in der Datenerhebung sowie in Berechnungsverfahren oder -annahmen sind die verfügbaren Stichproben sehr klein. Dies stellt eine besondere Herausforderung dar, da viele Tests auf asymptotischen Eigenschaften beruhen, die bei kleinen Stichproben nicht erfüllt sind. Daher liegt der Fokus der Tests und der durchgeführten Powersimulation auf sehr kleinen Stichproben, die dem beobachteten Datensatz in Streuung und Größenordnung ähneln. Obwohl an die Tests unter solchen Bedingungen keine hohen Erwartungen gestellt werden können, besteht das Ziel darin, eine Auswahl robuster Verfahren zu auszuwählen, die dennoch zuverlässige Aussagen zur Gültigkeit der Normalverteilungsannahme ermöglichen. In dieser Diplomarbeit werden sowohl grafische Methoden vorgestellt, die einen Einblick in die Struktur und Streuung der Daten erlauben, als auch statistische Tests sowie die theoretischen Grundlagen, auf denen sie basieren. Alle Verfahren wurden in R implementiert. Der verwendete Code ist im Appendix beigelegt, sodass die Simulation reproduzierbar ist und leicht auf größere Stichproben oder alternative Verteilungen erweitert werden kann. Für die Powersimulation werden mehrere nicht-normalverteilte Alternativverteilungen mittels Maximum-Likelihood Schätzung an die realen Stichproben angepasst, um zufällige Datensätze zu erzeugen. Anschließend werden die Tests auf diesen Datensätzen ausgewertet, um ihr Verhalten untersuchen zu können. Die Ergebnisse zeigen, dass einige Tests in kleinen Stichproben eine höhere Power haben als andere. Darunter sind der Shapiro-Wilk Test, eine robuste Version des Jarque-Bera Tests sowie modifizierte Versionen des Anderson-Darling und des Cramér-von-Mises Tests, die Korrekturen für die Stichprobengröße beinhalten. Zusätzlich bietet diese Diplomarbeit eine Anleitung zur Anwendung der vorgestellten Methoden auf reale Datensätze und liefert damit einen Rahmen für statistische Entscheidungen bei der Überprüfung der Normalverteilungsannahme.
de
As part of a data gathering process at the UNIQA Insurance Group, the question arose whether a subset of observed variables could be reasonably assumed to follow a normal distribution. This motivated the central topic of this thesis: the evaluation of statistical tests and graphical methods for assessing the hypothesis that a sample originates from a normal distribution. Due to historical changes in the data collection and calculation procedures, the observed samples are very small. This presents a particular challenge, as many statistical tests for normality rely on asymptotic properties that may not hold for small samples. Therefore, the comparison of tests in this thesis, along with a power simulation, focuses specifically on very small sample sizes that resemble the observed data in both spread and magnitude. While normality tests are not generally expected to perform well under such conditions, the goal is to identify a selection of robust procedures that can provide reliable insight into the validity of the normality assumption. This thesis presents both graphical methods, which offer intuitive insights into the shape and spread of the data, and statistical tests, including background on the theoretical ideas they are based on. All methods are implemented in R, with accompanying code provided in the appendix, enabling full reproducibility and allowing the simulation framework to be easily extended to larger samples or alternative distributions. For the power simulation, several non-normal distributions are fitted to the observed samples using maximum likelihood estimation, providing a realistic foundation for generating random data with similar characteristics. The performance of the tests is then evaluated on these simulated datasets to gain insight into their behaviour. The results show that some tests demonstrate a more satisfying power than others in the small-sample setting. In particular, the Shapiro-Wilk test, a robust version of the Jarque-Bera test, and modified versions of the Anderson-Darling and Cramér-von Mises tests, which contain adjustments for the sample size, stand out as the more effective options for evaluating normality under such constraints. Finally, this thesis provides practical guidance on how these methods can be applied to real-world data, offering a concrete procedure for statistical decision-making when normality is in question.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers