Normality tests for small sample sizes : a comparison with power simulation

Retzer, Lisa

doi:10.34726/hss.2025.119561

DC Field

Value

Language

dc.contributor.advisor

Levajkovic, Tijana

dc.contributor.author

Retzer, Lisa

dc.date.accessioned

2025-06-30T13:03:31Z

dc.date.issued

2025

dc.date.submitted

2025-06

dc.identifier.citation

<div class="csl-bib-body"> <div class="csl-entry">Retzer, L. (2025). <i>Normality tests for small sample sizes : a comparison with power simulation</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2025.119561</div> </div>

dc.identifier.uri

https://doi.org/10.34726/hss.2025.119561

dc.identifier.uri

http://hdl.handle.net/20.500.12708/216554

dc.description

Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers

dc.description.abstract

Im Rahmen eines Datenerhebungsprozesses bei der UNIQA Insurance Group stellte sich die Frage, ob eine Teilmenge der beobachteten Variablen als normalverteilt angenommen werden kann. Diese Fragestellung bildet den Ausgangspunkt dieser Diplomarbeit, die sich mit statistischen Tests und grafischen Methoden zur Bewertung der Hypothese befasst, dass eine Stichprobe von einer Normalverteilung stammt.Aufgrund historischer Änderungen in der Datenerhebung sowie in Berechnungsverfahren oder -annahmen sind die verfügbaren Stichproben sehr klein. Dies stellt eine besondere Herausforderung dar, da viele Tests auf asymptotischen Eigenschaften beruhen, die bei kleinen Stichproben nicht erfüllt sind. Daher liegt der Fokus der Tests und der durchgeführten Powersimulation auf sehr kleinen Stichproben, die dem beobachteten Datensatz in Streuung und Größenordnung ähneln. Obwohl an die Tests unter solchen Bedingungen keine hohen Erwartungen gestellt werden können, besteht das Ziel darin, eine Auswahl robuster Verfahren zu auszuwählen, die dennoch zuverlässige Aussagen zur Gültigkeit der Normalverteilungsannahme ermöglichen. In dieser Diplomarbeit werden sowohl grafische Methoden vorgestellt, die einen Einblick in die Struktur und Streuung der Daten erlauben, als auch statistische Tests sowie die theoretischen Grundlagen, auf denen sie basieren. Alle Verfahren wurden in R implementiert. Der verwendete Code ist im Appendix beigelegt, sodass die Simulation reproduzierbar ist und leicht auf größere Stichproben oder alternative Verteilungen erweitert werden kann. Für die Powersimulation werden mehrere nicht-normalverteilte Alternativverteilungen mittels Maximum-Likelihood Schätzung an die realen Stichproben angepasst, um zufällige Datensätze zu erzeugen. Anschließend werden die Tests auf diesen Datensätzen ausgewertet, um ihr Verhalten untersuchen zu können. Die Ergebnisse zeigen, dass einige Tests in kleinen Stichproben eine höhere Power haben als andere. Darunter sind der Shapiro-Wilk Test, eine robuste Version des Jarque-Bera Tests sowie modifizierte Versionen des Anderson-Darling und des Cramér-von-Mises Tests, die Korrekturen für die Stichprobengröße beinhalten. Zusätzlich bietet diese Diplomarbeit eine Anleitung zur Anwendung der vorgestellten Methoden auf reale Datensätze und liefert damit einen Rahmen für statistische Entscheidungen bei der Überprüfung der Normalverteilungsannahme.

dc.description.abstract

As part of a data gathering process at the UNIQA Insurance Group, the question arose whether a subset of observed variables could be reasonably assumed to follow a normal distribution. This motivated the central topic of this thesis: the evaluation of statistical tests and graphical methods for assessing the hypothesis that a sample originates from a normal distribution. Due to historical changes in the data collection and calculation procedures, the observed samples are very small. This presents a particular challenge, as many statistical tests for normality rely on asymptotic properties that may not hold for small samples. Therefore, the comparison of tests in this thesis, along with a power simulation, focuses specifically on very small sample sizes that resemble the observed data in both spread and magnitude. While normality tests are not generally expected to perform well under such conditions, the goal is to identify a selection of robust procedures that can provide reliable insight into the validity of the normality assumption. This thesis presents both graphical methods, which offer intuitive insights into the shape and spread of the data, and statistical tests, including background on the theoretical ideas they are based on. All methods are implemented in R, with accompanying code provided in the appendix, enabling full reproducibility and allowing the simulation framework to be easily extended to larger samples or alternative distributions. For the power simulation, several non-normal distributions are fitted to the observed samples using maximum likelihood estimation, providing a realistic foundation for generating random data with similar characteristics. The performance of the tests is then evaluated on these simulated datasets to gain insight into their behaviour. The results show that some tests demonstrate a more satisfying power than others in the small-sample setting. In particular, the Shapiro-Wilk test, a robust version of the Jarque-Bera test, and modified versions of the Anderson-Darling and Cramér-von Mises tests, which contain adjustments for the sample size, stand out as the more effective options for evaluating normality under such constraints. Finally, this thesis provides practical guidance on how these methods can be applied to real-world data, offering a concrete procedure for statistical decision-making when normality is in question.

dc.language

English

dc.language.iso

dc.rights.uri

http://rightsstatements.org/vocab/InC/1.0/

dc.subject

Tests für Normalannahme

dc.subject

kleine Stichprobengrößen

dc.subject

Graphische Tests

dc.subject

Shapiro-Wilk Test

dc.subject

Anderson-Darling Test

dc.subject

Cramer-von Mises Test

dc.subject

Jarque-Bera Test

dc.subject

Kolmogorov-Smirnov Test

dc.subject

Power Simulation

dc.subject

Normality tests

dc.subject

Small sample sizes

dc.subject

Graphical test

dc.subject

Shapiro-Wilk test

dc.subject

Anderson-Darling test

dc.subject

Cramer-von Mises test

dc.subject

Jarque-Bera test

dc.subject

Kolmogorov-Smirnov test

dc.subject

Power simulation

dc.title

Normality tests for small sample sizes : a comparison with power simulation

dc.title.alternative

Tests für eine Normalannahme von kleinen Stichprobengrößen : ein Vergleich mit Power Simulation

dc.type

Thesis

dc.type

Hochschulschrift

dc.rights.license

In Copyright

dc.rights.license

Urheberrechtsschutz

dc.identifier.doi

10.34726/hss.2025.119561

dc.contributor.affiliation

TU Wien, Österreich

dc.rights.holder

Lisa Retzer

dc.publisher.place

Wien

tuw.version

vor

tuw.thesisinformation

Technische Universität Wien

tuw.publication.orgunit

E105 - Institut für Stochastik und Wirtschaftsmathematik

dc.type.qualificationlevel

Diploma

dc.identifier.libraryid

AC17569247

dc.description.numberOfPages

121

dc.thesistype

Diplomarbeit

dc.thesistype

Diploma Thesis

dc.rights.identifier

In Copyright

dc.rights.identifier

Urheberrechtsschutz

tuw.advisor.staffStatus

staff

item.languageiso639-1

item.grantfulltext

open

item.openairetype

master thesis

item.openaccessfulltext

Open Access

item.mimetype

application/pdf

item.openairecristype

http://purl.org/coar/resource_type/c_bdcc

item.cerifentitytype

Publications

item.fulltext

with Fulltext

crisitem.author.dept

E105 - Institut für Stochastik und Wirtschaftsmathematik

crisitem.author.parentorg

E100 - Fakultät für Mathematik und Geoinformation

Appears in Collections:

Thesis

Fulltext (Version of Record (published version))

Adobe PDF

(1.54 MB)

In Copyright

Show simple item record

Page view(s)

checked on Jun 30, 2025

Download(s)

227

checked on Jun 30, 2025

Google Scholar^TM

Check

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM