Development of chemometric methods for the visualization and interpretation of LIBS data

Gajarska, Zuzana

doi:10.34726/hss.2024.122620

Record link:

https://doi.org/10.34726/hss.2024.122620
http://hdl.handle.net/20.500.12708/200510

Title:

Development of chemometric methods for the visualization and interpretation of LIBS data

Citation:

Gajarska, Z. (2024). Development of chemometric methods for the visualization and interpretation of LIBS data [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2024.122620

reposiTUm DOI:

10.34726/hss.2024.122620

CatalogPlus:

AC17300770

Publication Type:

Thesis - Dissertation

Language:

English

Authors:

Gajarska, Zuzana

Advisor:

Limbeck, Andreas

Co-advisor:

Lohninger, Johann

Organisational Unit:

E164 - Institut für Chemische Technologien und Analytik

Date (published):

2024

Number of Pages:

137

Keywords:

LIBS; chemometrics; machine learning

Abstract:

Die Bereitstellung von Echtzeitinformationen über die elementare Zusammensetzung einer Probe hat die laserinduzierte Plasmaspektroskopie (LIBS) zu einem prominenten Werkzeug für eine schnelle In-situ-Klassifizierung von Materialien in einer Vielzahl von Anwendungsszenarien gemacht, darunter Polymer- und Schrottwiederverwertung, Detektion von Sprengstoffen, gefälschten Lebensmitteln und Pharmazeutika oder bei der Erforschung des Weltraums. Dennoch wird die Vorhersagefähigkeit von Modellen, die auf den gesamten LIBS-Spektren basieren, oft durch Drifts in der Datenverteilung begrenzt, die durch instrumentelle und Umweltver änderungen verursacht werden (z.B. Schwankungen der Laserenergie, Oberflächenhomogenität, Matrixeffekte, etc.). Zusätzlich vergrößern die hohe Dimensionalität und der gering besetzte Datenraum moderner LIBS-Spektren das Risiko von überanpassungen, stellen höhere rechnerische Anforderungen und erschweren ihre Interpretation.In der Theorie sollten nur Teilbereiche der Spektren, die elementspezifische Informationen tragen, für das Training des Klassifizierers verwendet werden, jedoch ist die Frage, welche das sind, noch nicht beantwortet worden. Obwohl eine manuelle Vorauswahl der problemrelevanten Informationen durch einen Fachmann auf dem Gebiet eine ultimative Lösung für dieses Problem darstellen könnte, ist ein solcher Ansatz angesichts des erforderlichen Zeitaufwands sowie der großen Vielfalt der LIBS-Klassifizierungsprobleme bei weitem nicht durchführbar. Trotz der großen Anzahl von Veröffentlichungen auf dem Gebiet sind die vorgeschlagenen Ansätze oft durch die Tatsache begrenzt, dass den üblichen LIBS-Praktikern ein Verständnis der maschinellen Lernmethoden fehlt, während den Datenwissenschaftern ein angemessenes Verständnis der physikochemischen Phänomene fehlt, die die Variationen in den LIBS-Spektren verursachen. Durch die Fusion der beiden Welten zielt diese Arbeit darauf ab, der Forschungsgemeinschaft einen Satz fortschrittlicher chemometrischer Werkzeuge zur Verfügung zu stellen, die eine automatisierte Verarbeitung und Interpretation von LIBS-Spektren ermöglichen. Schlussendlich kann diese Arbeit auch als Leitfaden betrachtet werden, der dazu beitragen kann, die Lücken zwischen LIBS und machinellem Lernen zu füllen.

Providing real-time information on the elemental composition of a sample, laser-induced breakdown spectroscopy (LIBS) has become a prominent tool for rapid in situ classification of materials in a wide range of application scenarios, including polymer and scrap recycling, detection of explosives, counterfeit foods, pharmaceuticals, or exploration of space. Nevertheless, the prediction ability of models based on the entire LIBS spectra is often limited by drifts in the data distribution caused by instrumental and environmental changes (e.g. fluctuations of laser energy, surface homogeneity, matrix effects, etc.). Additionally, the high dimensionality and the sparsity of the data space covered by modern LIBS spectra further increase the risk of overfitting, pose higher computational demands, and complicate their interpretation.In theory, only subregions of the spectra carrying element-specific information should be employed for the classifier’s training, however, the question of which ones has not yet been answered. Whereby a manual pre-selection of the problem-relevant information by a domain expert might represent an ultimate solution to this problem, considering the time and effort required and the great diversity of the LIBS classification problems, such an approach is far from feasible. Despite the great number of publications in the field, the suggested approaches are often limited by the fact that the common LIBS practitioners lack an understanding of the machine learning methods, whereas the data scientists lack a proper understanding of the physicochemical phenomena causing the variation in the LIBS spectra. Fusing the two worlds, this thesis aims to provide a set of advanced chemometric tools to the research community, facilitating an automatized processing and interpretation of LIBS spectra. Finally, this thesis may also be seen as a tutorial guide helping to fill the arising gaps between LIBS and machine learning.

Additional information:

Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers
Kumulative Dissertation aus vier Artikeln

License:

In Copyright

Appears in Collections:

Thesis