Tulala, P. (2019). Deep generative clustering of spatial wafer patterns [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.60502
deep learning; machine learning; generative modeling; Variational Autoencoder; Generative Adversarial Network; clustering; data preprocessing; wafer
en
Abstract:
Automatisierung der Produktion, maschinelles Lernen, Big Data, Internet der Dinge und computerunterstütztes Entscheidungsfinden sind Schlüsselfaktoren der vierten industriellen Revolution (auch Industrie 4.0 genannt). Hoch automatisierte Industriezweige, wie die Halbleiter herstellende Industrie, werden zur Grenze von Industrie 4.0. Obwohl die hochautomatisierte Halbleiterproduktion in Reinraum-Umgebungen stattfindet, ist der in der Komplexität steigende und aus hunderten von Schritten bestehende Herstellungsprozess, trotzdem anfällig für gewöhnliche Produktionsfehler. Um diese Fehler zu erkennen und ihnen vorzubeugen werden regelmäßig elektromechanische Messungen von jedem Wafer nach den verschiedenen Schritten in der Produktion genommen. Es wird angenommen, dass die Schritte welche Fertigungsfehler verursachen in einer frühen Phase der Produktionskette in charakteristischen Mustern der Wafermap-Messdaten erkannt werden. Basierend auf den erkannten Mustern kann eine automatische ausgleichende Aktion gesetzt werden um die Herstellungskosten so gering wie möglich zu halten und Engpässen vorzubeugen. Das Ziel dieser Arbeit ist es einen Algorithmus zu entwickeln der automatisch Muster in den Wafermap-Messdaten erkennt und gruppiert und dabei Methode des unüberwachten Lernen verwendet. Die unüberwachte Art solch eines Algorithmus beseitigt den Bedarf eines Experten auf dem jeweiligen Gebiet, welcher ansonsten manuell definieren müsste welche möglichen Muster in den Daten auftreten. Der erste Teil der Arbeit beschreibt die vorverarbeitenden Schritte, um den Messdatensatz zu bereinigen und zu normalisieren. Der bereinigte Datensatz wird dann verwendet, um ein generisches Model zu trainieren, welches die charakteristischsten Eigenschaften lernt und die Dimension der Daten reduziert. Spezielles Augenmerk gilt zwei Algorithmen -- Variation Autoencoder (VAE) und Generative Adversarial Network (GAN). Der letzte Teil der Arbeit beschreibt zwei einfache Clustering Methoden welche die Features je nach Ähnlichkeitsmetrik in eindeutige Cluster gruppieren. Das Fazit ist, dass generische Modelle zur Feature Extrahierung in der Halbleiter Fertigung nützlich sein können und in manchen Fällen traditionelle Modelle übertreffen.
de
Computerization of manufacturing, machine learning, big data, Internet of Things (IoT) and automated decision-making are becoming the key driving forces of the fourth industrial revolution (also referred to as Industry 4.0 ). Highly automated industries, such as semiconductor manufacturing industry, are becoming the frontiers of Industry 4.0. Despite the fact that the highly automated semiconductor production takes place in cleanroom environments, the increasingly complex manufacturing processes driven by hundreds of production steps are still susceptible to random production errors. In order to detect and prevent these errors, electromechanical measurements are regularly taken from each wafer in production after some steps. It is assumed that steps that are causing manufacturing disturbances can be identified in an early stage of production chain by recognizing characteristic patterns in the wafermap measurements data. Based on the recognized patterns, an automatic corrective action can be taken in order to minimize manufacturing cost and prevent bottlenecks. The aim of this work is to develop an algorithm to automatically recognize and cluster patterns in wafermap measurements data in an unsupervised manner. The unsupervised nature of such algorithm eliminates the need for a domain expert that would otherwise had to manually define all possible patterns occurring in the data. The first part of this work describes preprocessing steps to cleanse and normalize the measurements dataset. The cleansed dataset is then used to train a generative model that learns the most characteristic features and reduces the dimensionality of the data. A particular focus is given to two algorithms - Variational Autoencoder (VAE) and Generative Adversarial Network (GAN). The last part of the work discusses two simple clustering methods that group the extracted features into distinct clusters according to a similarity metric. It is concluded, that generative models could be useful for feature extraction in semiconductor manufacturing domain and in some cases even outperform more traditional discriminative models.