<div class="csl-bib-body">
<div class="csl-entry">Retzer, L. (2025). <i>Normality tests for small sample sizes : a comparison with power simulation</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2025.119561</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2025.119561
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/216554
-
dc.description
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers
-
dc.description.abstract
Im Rahmen eines Datenerhebungsprozesses bei der UNIQA Insurance Group stellte sich die Frage, ob eine Teilmenge der beobachteten Variablen als normalverteilt angenommen werden kann. Diese Fragestellung bildet den Ausgangspunkt dieser Diplomarbeit, die sich mit statistischen Tests und grafischen Methoden zur Bewertung der Hypothese befasst, dass eine Stichprobe von einer Normalverteilung stammt.Aufgrund historischer Änderungen in der Datenerhebung sowie in Berechnungsverfahren oder -annahmen sind die verfügbaren Stichproben sehr klein. Dies stellt eine besondere Herausforderung dar, da viele Tests auf asymptotischen Eigenschaften beruhen, die bei kleinen Stichproben nicht erfüllt sind. Daher liegt der Fokus der Tests und der durchgeführten Powersimulation auf sehr kleinen Stichproben, die dem beobachteten Datensatz in Streuung und Größenordnung ähneln. Obwohl an die Tests unter solchen Bedingungen keine hohen Erwartungen gestellt werden können, besteht das Ziel darin, eine Auswahl robuster Verfahren zu auszuwählen, die dennoch zuverlässige Aussagen zur Gültigkeit der Normalverteilungsannahme ermöglichen. In dieser Diplomarbeit werden sowohl grafische Methoden vorgestellt, die einen Einblick in die Struktur und Streuung der Daten erlauben, als auch statistische Tests sowie die theoretischen Grundlagen, auf denen sie basieren. Alle Verfahren wurden in R implementiert. Der verwendete Code ist im Appendix beigelegt, sodass die Simulation reproduzierbar ist und leicht auf größere Stichproben oder alternative Verteilungen erweitert werden kann. Für die Powersimulation werden mehrere nicht-normalverteilte Alternativverteilungen mittels Maximum-Likelihood Schätzung an die realen Stichproben angepasst, um zufällige Datensätze zu erzeugen. Anschließend werden die Tests auf diesen Datensätzen ausgewertet, um ihr Verhalten untersuchen zu können. Die Ergebnisse zeigen, dass einige Tests in kleinen Stichproben eine höhere Power haben als andere. Darunter sind der Shapiro-Wilk Test, eine robuste Version des Jarque-Bera Tests sowie modifizierte Versionen des Anderson-Darling und des Cramér-von-Mises Tests, die Korrekturen für die Stichprobengröße beinhalten. Zusätzlich bietet diese Diplomarbeit eine Anleitung zur Anwendung der vorgestellten Methoden auf reale Datensätze und liefert damit einen Rahmen für statistische Entscheidungen bei der Überprüfung der Normalverteilungsannahme.
de
dc.description.abstract
As part of a data gathering process at the UNIQA Insurance Group, the question arose whether a subset of observed variables could be reasonably assumed to follow a normal distribution. This motivated the central topic of this thesis: the evaluation of statistical tests and graphical methods for assessing the hypothesis that a sample originates from a normal distribution. Due to historical changes in the data collection and calculation procedures, the observed samples are very small. This presents a particular challenge, as many statistical tests for normality rely on asymptotic properties that may not hold for small samples. Therefore, the comparison of tests in this thesis, along with a power simulation, focuses specifically on very small sample sizes that resemble the observed data in both spread and magnitude. While normality tests are not generally expected to perform well under such conditions, the goal is to identify a selection of robust procedures that can provide reliable insight into the validity of the normality assumption. This thesis presents both graphical methods, which offer intuitive insights into the shape and spread of the data, and statistical tests, including background on the theoretical ideas they are based on. All methods are implemented in R, with accompanying code provided in the appendix, enabling full reproducibility and allowing the simulation framework to be easily extended to larger samples or alternative distributions. For the power simulation, several non-normal distributions are fitted to the observed samples using maximum likelihood estimation, providing a realistic foundation for generating random data with similar characteristics. The performance of the tests is then evaluated on these simulated datasets to gain insight into their behaviour. The results show that some tests demonstrate a more satisfying power than others in the small-sample setting. In particular, the Shapiro-Wilk test, a robust version of the Jarque-Bera test, and modified versions of the Anderson-Darling and Cramér-von Mises tests, which contain adjustments for the sample size, stand out as the more effective options for evaluating normality under such constraints. Finally, this thesis provides practical guidance on how these methods can be applied to real-world data, offering a concrete procedure for statistical decision-making when normality is in question.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Tests für Normalannahme
de
dc.subject
kleine Stichprobengrößen
de
dc.subject
Graphische Tests
de
dc.subject
Shapiro-Wilk Test
de
dc.subject
Anderson-Darling Test
de
dc.subject
Cramer-von Mises Test
de
dc.subject
Jarque-Bera Test
de
dc.subject
Kolmogorov-Smirnov Test
de
dc.subject
Power Simulation
de
dc.subject
Normality tests
en
dc.subject
Small sample sizes
en
dc.subject
Graphical test
en
dc.subject
Shapiro-Wilk test
en
dc.subject
Anderson-Darling test
en
dc.subject
Cramer-von Mises test
en
dc.subject
Jarque-Bera test
en
dc.subject
Kolmogorov-Smirnov test
en
dc.subject
Power simulation
en
dc.title
Normality tests for small sample sizes : a comparison with power simulation
en
dc.title.alternative
Tests für eine Normalannahme von kleinen Stichprobengrößen : ein Vergleich mit Power Simulation
de
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2025.119561
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Lisa Retzer
-
dc.publisher.place
Wien
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
tuw.publication.orgunit
E105 - Institut für Stochastik und Wirtschaftsmathematik
-
dc.type.qualificationlevel
Diploma
-
dc.identifier.libraryid
AC17569247
-
dc.description.numberOfPages
121
-
dc.thesistype
Diplomarbeit
de
dc.thesistype
Diploma Thesis
en
dc.rights.identifier
In Copyright
en
dc.rights.identifier
Urheberrechtsschutz
de
tuw.advisor.staffStatus
staff
-
item.languageiso639-1
en
-
item.grantfulltext
open
-
item.openairetype
master thesis
-
item.openaccessfulltext
Open Access
-
item.mimetype
application/pdf
-
item.openairecristype
http://purl.org/coar/resource_type/c_bdcc
-
item.cerifentitytype
Publications
-
item.fulltext
with Fulltext
-
crisitem.author.dept
E105 - Institut für Stochastik und Wirtschaftsmathematik