dc.description.abstract
Die Proteomik befasst sich mit der Struktur und Funktion von Proteinen. Der am weitesten verbreitete Ansatz zur Analyse von Proteinen ist die "bottom-up"-Analyse, bei der ein Protein zuerst in kleinere Peptide verdaut wird, welche dann mittels LC-MS/MS analysiert werden, um die Identität des ursprünglichen Proteins zu bestätigen. Um diese Peptide analysieren zu können, werden sie zunächst mittels Flüssigchromatographie (LC) aufgetrennt. Anschließend wird deren Masse-zu-Ladung-Verhältnis im Massenspektrometer gemessen und in Form von MS1-Spektren aufgezeichnet. Ausgewählte Peptide (Precursor) werden fragmentiert, was zu MS2-Spektren der jeweiligen Fragmentionen führt (MS/MS). Diese Hochdurchsatzexperimente erzeugen immense Datenmengen und werden als Shotgun Protemoics-Experimente bezeichnet.<br />Diese große Menge an Rohdaten muss durch adäquate Methoden analysiert werden, um so viele nützliche Informationen, wie möglich zu extrahieren und überflüssige, redundante Teile herauszufiltern. Die verbreiteten Datenbank-Suchmaschinen, die zur Identifikation der Peptide mittels ihrer Masse und der zugehörigen MS2-Spektren herangezogen werden, verwerfen zur Zeit einen Großteil der Informationen im MS2-Spektrum.<br />Zudem wird der Vorteil der hohen Massengenauigkeit, welche mit den modernsten Massenspektrometern erreichbar ist, durch die Geräte selbst wieder eingebüßt. Dies hat den Grund, dass die MS2-Spektren der Peptide in der Regel nicht zum optimalen Zeitpunkt, zu dem die Intensität des Peptids am größten ist, aufgenommen werden. Um diesen Nachteilen entgegenzuwirken, sind ausgefeilte Methoden für entsprechendes Preprocessing der Spektren nötig.<br />In dieser Diplomarbeit untersuchen wird zwei Arten von Preprocessing-Methoden für MS2-Spektren, mit dem Ziel die Anzahl der Spektren, die identifiziert werden können zu erhöhen, indem der Identifizierungsprozess, der von der Datenbanksuchmaschine durchgeführt wird, vereinfacht wird.<br />Erstens werden verschiedene MS2-Deisotoping und -Deconvolution Methoden untersucht, welche das Ziel haben, Isotopen-Peaks und Peaks mehrfach geladener Varianten der Analytpeptide zu entfernen. Durch die Vergrößerung des Suchraums beeinträchtigen diese Peaks unnötigerweise die Leistung der Suchmaschine. Wir führen aus, dass die Algorithmen das Vertrauen in die korrekte Identifikation von Peptiden durch das Entfernen von Peaks, vor allem aus den Bereichen um die korrekten Fragment-Peaks, welche andernfalls das Finden dieser korrekten Peaks erschweren würden, erhöht. Außerdem zeigen wir, dass diese Methoden nichtsdestotrotz durch das Design der Scoring-Algorithmen verbreiteter Suchmaschinen eingeschränkt sind.<br />Zweitens entwickeln wir einen 3d-Peak-Picking Algorithmus, der sich im Bezug auf die Masse der Peptide nicht allein auf die Infomation des einzelnen MS1-Spektrums verlässt, aus welchem das Peptid zur Fragmentierung ausgewählt wurde. Es wird statt dessen zusätzlich das Elutionsprofil des Peptids rekonstruiert, wobei viele Datenpaunkte erfasst werden, um einen statistisch zuverlässigen Wert für die Masse zu erhalten. Somit ist es möglich die Information, die durch die hohe Massengenauigkeit erreichbar ist voll und ganz zu nutzen. Unsere Experimente zeigen, dass die Peptidmassen, welche aus den rekonstruierten 3d-Peaks berechnet wurden, im Vergleich zu den vom Gerät zur Verfügung gestellten Massen, eine wesentlich höhere Präzision besitzen. Darauf aufbauend zeigen wir zudem, dass diese hohe Präzision die Anzahl der identifizierten Peptide, vor allem für strenge Suchtoleranzen, steigert.<br />Aus den entwickelten Algorithmen ist ein Plugin für ein kommerziell verfügbares Softwarepaket (Proteome Discoverer von Thermo Fisher Scientific) entstanden, welches nun in der Proteomikgruppe von Karl Mechtler eingesetzt wird. Zudem ist dieses Plugin kostenlos zum Download verfügbar.<br />
de