Maran, L. (2025). The NUCLEUS experiment : raw data analysis with machine learning methods [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2025.130904
NUCLEUS ist ein Experiment zum Nachweis von kohärenter elastischer Neutrino-Nukleus Streuung mit kryogenischen Detektoren am französischen Kernkraftwerk Chooz. Der erwartete Signalbereich liegt unterhalb von 100 eV/c2 . Um die dafür nötige Empfindlichkeit zu erreichen, müssen komplexe Methoden zur Rohdatenanalyse eingesetzt werden. Die Rohdaten des Experiments bestehen aus Zeitserien von Spannungssignalen, der gesamte Datenstrom wird gespeichert. In diesem finden sich Teilchenereignisse und Artefakte, überlagert von einem Rauschsignal. Das Lokalisieren von Ereignissen im Datenstrom wird Triggering genannt. Teilchenereignisse können durch ihre charakteristische Pulsform identifiziert und von Artefakten unterschieden werden. Die erwartete Pulsform folgt einer parametrischen Beschreibung mit a-priori unbekannten Parametern. Um die im Detektor deponierte Energie zu bestimmen, muss die Pulsamplitude ermittelt werden. Dies ist, zusammen mit der Identifizierung der Parameter der Pulsform und der Definition von Kriterien zum Ausschließen von Artefakten, Teil der Rohdatenanalyse. In dieser Arbeitstellen wir auf maschinellem Lernen basierende Methoden zur Rohdatenanalyse vor, mit dem Ziel,die Analyse zu beschleunigen und den Bedarf an manuell definierten Ausschlusskriterien zu verringern. Zur Rauschunterdrückung in Rohdaten wird der Einsatz von Autoencoder-Netzwerken untersucht, mit vielversprechenden Ergebnissen. Des Weiteren stellen wir eine formbasierte Clus-teringmethode zur Datenvisualisierung vor, sowie eine auf neuronalen Netzwerken basierende Methode für das Triggering, welche gute Effizienz mit Artefaktunterdrückung kombiniert. Außerdem wird eine Methode zur automatischen Berechnung eines Optimalfilters aus Rohdaten vorgestellt.Der Optimalfilter ist ein linearer Filter, der sowohl für das Triggering als auch zur Rekonstruktion von Pulshöhen verwendet wird. Schließlich stellen wir ein Framework zum Training von neuronalen Netzen zur Artefakterkennung vor. Die mit diesem Ansatz erzielten Ergebnisse erreichen die Qualität von händisch definierten Kriterien sowie vorheriger maschineller Lernmethoden, unter Verwendung von kleineren, schneller trainierbaren neuronalen Netzwerken. Alle Methoden wurden in das CAIT-Analyseframework implementiert, welches von NUCLEUS für die Datenanalyse verwendet wird.
de
The NUCLEUS experiment aims to measure coherent elastic neutrino-nucleus scattering at the Chooz nuclear power plant in France, using cryogenic particle detectors. The high sensitivity required to probe the expected signal range below 100 eV/c2 can only be achieved using complex and challenging analysis methods. The raw detector data consists of time series of voltage traces.During measurements, the detector out put stream is stored and recorded as raw data. This data are made up of a noisy baseline, on which particle events and artifacts are superimposed. Particle events have to be located in this stream in a process called triggering. The targeted particle events are identified and distinguished from artifacts by their characteristic shape, which follows a parametric description with a priori unknown parameters. To calculate the energy deposited in the detector by such an event, the scale of the pulse has to be determined. This task, called pulse height estimation, together with assessing event-shape parameters, triggering and defining quality cuts aimed to exclude unwanted artifacts are crucial steps of raw data analysis. This work aims to provide machine learning based methods for these tasks in order to speed up raw data analysis while minimizing the need for manually defined cuts that might introduce human biases. For denoising raw pulses the use of autoencoders is explored, showing promising results. Furthermore, a shape based clustering method useful for data visualization is introduced,along with a neural network based method for triggering that combines the efficiency of current methods with artifact rejection capabilities. We also present a method for an automatized creation of an optimum filter, a linear filter currently used for both triggering and pulse height estimation, using information from the data stream. Finally, we present a new weakly supervised per-detector framework for training neural networks for quality cuts. This approach matches the performance of both handmade cuts and previous machine learning methods while being more efficient and requiring shorter training times. All methods have been implemented in the CAITanalysis framework used by NUCLEUS for data analysis.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers