Mörtl, G. (2019). DeepLepton: muoan identification in 13 TeV pp collisions at the CMS experiment using deep learning techniques [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.62435
Myonen und Elektronen welche in Teilchenkollisionen im Zentrum des CMS Experiments am LHC entstehen, werden aufgrund ihrer Signale im Detektor rekonstruiert. Die Bestimmung des Ursprungs eines Leptons, gemäß seiner Herkunft im Streuprozess, ist wesentlich für viele Analysen. Dazu erfolgt eine Trennung in prompte, nicht-prompte und misrekonstruierte Leptonen, was auf eine Klassifikationsaufgabe mit mehreren Klassen führt. In dieser Arbeit wird ein neuartiger Ansatz für die Identifizierung von Myonen in den Daten des CMS Detektors aus dem Jahr 2016 präsentiert, wo die Proton-Proton Kollisionen bei einer Schwerpunktsenergie von sqrt(s)= 13 TeV durchgeführt wurden. Die Kombination von relevanten Observablen aus der Rekonstruktion der Leptonen mit der weiteren Teilchenaktivität in der Umgebung des Leptons ist dabei die zentrale Idee. Das soll zu einer höheren Effizienz bei der Identifizierung führen, da die umgebenden Teilchen Aufschluss über den Produktionsmechanismus des Leptons geben. Dieser Ansatz erfordert es, die Teilchen in der Umgebung eines Leptons der Reihe nach zu verarbeiten. Die Anwendung der Technik des überwachten Lernens und der Einsatz eines tiefen neuronalen Netzwerks, welches aus konvolutionalen Schichten, Long Short Term Memory (LSTM) Einheiten und vollständig verbundenen neuronalen Netzen besteht, wird den Anforderungen eines Klassifikationsproblems mit mehreren Klassen gerecht, und ermöglicht eine Verarbeitung von sequentiellen Daten. Im Vergleich mit anderen Ansätzen bewirkt die Einbindung der Umgebung der Leptonen auf einer niedrigeren Ebene der Rekonstruktion einen signifikanten Leistungszuwachs hinsichtlich der Effizienz bei der Identifizierung von Myonen. In simulierten Daten beläuft sich die Steigerung der Signaleffizienz auf bis zu 5% für gegebene Hintergrundeffizienz. Vergleiche von simulierten und realen Daten unterstreichen die Robustheit dieses neuartigen Identifikationskriteriums. Der neue \DeepLepton Algorithmus bildet damit die Grundlage für Datenanalysen mit starkem Hintergrund von nicht-prompten und misrekonstruierten Leptonen.
de
Muons and electrons emerging in particle collisions in the center of the CMS experiment at the LHC, are reconstructed on the basis of the measured detector hits. The identification of the origin of a lepton, according to its source from the hard scatter, is a central necessity in many analyses. To this end, a separation of prompt, non-prompt and fake leptons is made, which leads to a multiclass classification task. In this work, a novel approach for muon identification is presented for the 2016 detector data, taken by the CMS experiment, where proton-proton collisions were performed at a center-of-mass energy of sqrt(s)= 13 TeV. The central idea is to combine characteristic lepton reconstruction observables with the particle activity in the vicinity of the lepton. This is supposed to lead to a higher identification efficiency, since the surrounding particles give indication on the production mechanism of the lepton. The approach requires to process all the information from the vicinity of a lepton, particle by particle. The application of the supervised learning technique and the usage of a deep neural network, composed of convolutional layers, LSTM units and fully connected neural networks, meets the requirements of the multiclass classification problem, and enables the processing of the sequential data. In terms of muons, the inclusion of the low-level information of the lepton vicinity effects a significant performance gain in the identification efficiency when compared to previous approaches. In simulated data the improvement in signal efficiency amounts up to 5% for a given background efficiency. Comparisons of simulated and real data show the validity of this novel muon identification criterion. It is the founding stone of \DeepLepton, a lepton identification algorithm, to be applied in analyses where backgrounds from non-prompt and fake leptons are a substantial problem.