Miglinci, P. S. (2019). Processing, visualizing and analyzing big polymeerase chain reaction data in real-time [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.40188
E101 - Institut für Analysis und Scientific Computing
-
Date (published):
2019
-
Number of Pages:
62
-
Keywords:
PCR; qPCR; Bioinformatik; big data
de
PCR; qPCR; bioinformatics; big data
en
Abstract:
Die Polymerasen-Kettenreaktion (PCR) ist nun seit über 30 Jahren eine der wichtigsten Methoden der Molekularbiologie. Diese ermöglicht das Vervielfältigen von Nukleinsäuren durch deren zyklisches Erhitzen und Abkühlen und die Hinzugabe von speziellen Primeren, welche als Startbeziehungsweise Endpunkte für die Replizierung dienen. Mit Hilfe der quantitativen Echtzeit-PCR (qPCR), welche die Menge der vorhandenen NA periodisch misst, können DNA Proben verglichen werden, Genmutationen festgestellt werden, Sequenzen von Nukleotiden entschlüsselt oder verändert werden. Die Software, die zur Analyse von PCR Experimenten verwendet wird, hat sich im Gegensatz zu der Methode an sich und den eingesetzten PCR-Geräten nicht entsprechend schnell weiterentwickelt. Daher verwenden viele Forschungsgruppen und Institute unterschiedliche Tools und Methoden, um PCR Experimente zu analysieren und weitere Berechnungen durchzuführen. Dadurch lassen sich Ergebnisse der Experimente oftmals nicht wiederholen, beziehungsweise von Dritten reproduzieren. Nachdem vorhandene Software unterstützende Möglichkeiten zur Erstellung von PCR Experimenten, deren Analyse und Visualisierung untersucht wurden, konnte keine Software gefunden werden, die die erhobenen Benutzeranforderungen erfüllte. Daher wurde in Zusammenarbeit mit dem Austrian Instute of Technology (AIT), der Technischen Universität Wien, sowie der Platomics GmbH, einem auf Lifescience Software spezialisiertem Spinoff des AITs, erforscht, wie und mit welchen Technologien eine entsprechende Software designt werden muss, um PCR Expermiente automatisiert zu analysieren und bestmögliche Ergebnisse aus vorhandenen Daten zu erzielen. Die entwickelte Softwarelösung X-qPCR wurde mit Hilfe der Docker Virtualisierungsplattform in verschiedene Komponenten geteilt und kann sowohl in öffentlichen Cloudsystemen, sowie in geschlossenen Rechenzentren zentral installiert werden. Die Benutzer können mit Hilfe eines Webbrowsers auf die Softwarelösung zugreifen und dort ihr Experiment planen. Dies passiert mit Hilfe der Designer Komponente der Softwarelösung, welche mit Hilfe von JavaScript-Frameworks eine intuitive Benutzeroberfläche bietet. Nach dem durchgeführten Experiment können die qPCR-Rohdaten in die Processor Komponente geladen werden, welche mit Hilfe einer interaktiven Qualitätskontrolle Ausreißer und Fehler erkennen kann. Daten können optional auch normalisiert werden. Die Visualizer Komponente kann zusätzlich nützliche Grafiken, sowie statistisch relevante Plots, wie zum Beispiel Boxplots, dem Anwender über den Browser zugänglich machen. Mit Hilfe von X-qPCR können PCR Experimente nun reproduzierbar zentral analysiert werden. Ein Beispiel für einen Anwendungsfall ist die Osteoporose Früherkennung mit Hilfe von microRNA Analysen. Die Verwendung der X-qPCR Software für diesen Anwendungsfall mit Hilfe von miRNA Kits der Firma TAmiRNA wird in dieser Diplomarbeit auch beschrieben.
de
Since 30 years the polymerase chain reaction (PCR) is one of the most important methods in molecular biology. PCR allows multiplying nucleic acids by cyclic heating and cooling and also adding primers to the template, which mark the start end positions of the bases to amplify. The quantitative approach of the real time PCR (qPCR) measures the amount of NA after each cycle. This technique allows to measure DNA probes, recognize genetic mutations or decode or change the order of nucleic bases. PCR software solutions did not evolve with the same speed as used methods and machines did, so they fell behind to software solutions in other scientific areas and could not satisfy their user's needs. So various researches and institutes use multiple and incompatible tools to analyze and process their PCR experiments. So results are often not repeatable and not reproducible by others. After examine the currently available software solutions no tool could be found that satisfies the researcher's and operator's needs to analyze, process and visualize polymerase chain reaction data in real-time. So the Austrian Institute of Technology (AIT), the Vienna University of Technology, and a life science focused private company Platomics GmbH started a research project to identify needs and design a software solution that fulfills these requirements. The developed software solution X-qPCR was virtualized using the Docker virtualization engine and got split into different modules. It can be deployed in public clouds or private data centers. Users access the software solution via a web browser where they plan out their experiment. The Designer module handles these requests and gives the user an intuitive user experience which was realized using JavaScript-Frameworks. After performing the experiment the amplification and melting raw data files can uploaded into the Processor module, which performs an interactive quality control and outlier detection. Data can also be normalized optionally. The Visualizer module provides additional graphics and statistical relevant plots like box plots via the users web browsers. X-qPCR makes PCR experiments repeatable and let them be analyzed from within a central hub. A possible use case would be an early recognition of osteoporosis by performing a microRNA analysis. This use case was developed by a company called TAmiRNA which is specialized in developing miRNA Kits and analyzing the results with the X-qPCR software solution as highlighted in this master thesis.