Hofbauer, M. (2020). Logarithmic concave density estimation and its application in a use case in the semiconductor industry [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2020.72250
E105 - Institut für Stochastik und Wirtschaftsmathematik
-
Date (published):
2020
-
Number of Pages:
89
-
Keywords:
Dichteschätzung; Logarithmisch konkave Dichte; Schätzung des Tail Index; Mischverteilungen; Klassifizierung von Dichten
de
Density Estimation; Logarithmic Concave Densitiy; Tail Index Estimation; Mixture-Densitiy; Density Classification
en
Abstract:
The estimation of a probability density function of a random variable X, given a sample x1,...,xn, is a task with major interest for statisticians. There are several approaches to achieve this task, resulting in different possible techniques for practitioners. A big shortcoming of many of these techniques is the dependency on parameters that determine the actual estimation. Logarithmic concave density estimation has the potential to free practitioners from such parametric requirements and thus opens the door to automatic density estimation. In this thesis we will give an overview of logarithmic concave densities, and make use of this theory to solve a specific problem in a use case in the semiconductor industry. To handle the tasks in this use case we will mainly focus on two applications of logarithmic concave density estimators: the replacement of density estimators in tail index estimation with the smoother log-concave density estimator and a statistical test that has the detection of the presence of mixtures as target. For the latter application, we will suggest an additional parameter, which improves the performance of the algorithm under the H0 with only little additional computation time. Furthermore we will implement those applications in a procedure that has the rating of densities from testing-parameters in the semiconductor industry as target. We will test this procedure using real data, conclude our findings and give an outlook about possible further development.
en
Die Schätzung der Dichtefunktion einer Zufallsvariable X, ausgehend von einer Stichprobe x1,...,xn, ist eines der Hauptprobleme in der Statistik. Es stehen verschiedene Ansätze und Methoden zur Verfügung, die jedoch in den meisten Fällen den großen Nachteil haben, dass das Resultat der Schätzung von einem oder mehreren Parametern abhängig ist. Logarithmisch konkave Dichteschätzung bietet die Möglichkeit einer parameterfreien Methode und öffnet somit die Tür für automatische Prozeduren zur Schätzung von Dichten. In dieser Arbeit beschäftigen wir uns mit möglichen Anwendungen logarithmisch konkaver Dichteschätzung und versuchen dabei eine konkrete Aufgabenstellung aus der Halbleiterindustrie zu lösen. Um dies zu tun, fokussieren wir uns jedoch auf zwei spezielle Ansätze: zum einen betrachten wir die Möglichkeit, konventionelle Dichteschätzer in der Schätzung des tail index durch den logarithmisch konkaven Dichteschätzer zu ersetzen, zum anderen betrachten wir einen statistischen Test, der die Erkennung von Mischverteilungen zum Ziel hat. Für den zweiten Fall werden wir auch eine Erweiterung vorschlagen, die die Resultate unter der H0 verbessern soll und dazu vergleichsweise wenig zusätzliche Rechenleistung benötigt. Wir werden diese Anwendungsmöglichkeiten nutzen um Dichten von Testparametern aus der Halbleiterindustrie zu bewerten. Abschließend testen wir die entstandene Prozedur anhand von realen Daten, fassen unsere Erkenntnisse zusammen und geben einen Ausblick auf mögliche zukünftige Erweiterungen.
de
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers