Virtual Screening; Peer-To-Peer; JXTA; Distributed Computing; Pharmacophore; Inte:ligand; Distributed Architecture; Drug Discovery; Drug Research; Network
en
Abstract:
Virtual Screening ist in den letzten Jahren eine wichtige Methode in der computerunterstützten Arzneimittelforschung geworden. Wegen der großen anfallenden Datenmengen im Virtual Screening Prozess sind sowohl kurze Laufzeiten als auch eine Visualisierung der Ergebnisse notwendig. Virtual Screening dient dazu, diejenigen chemischen Verbunde aus einer Menge von chemischen Substanzen auszufiltern, die eine bestimmte biologische Aktivität besitzen, bevor diese synthetisiert und in vitro oder an lebenden Organismen getestet werden. Diese Masterarbeit beschreibt und evaluiert die Möglichkeit, Virtual Screening für Informationsvisualisierungs- (InfoVis) Anwendungen in der Medikamentenforschung durch den Einsatz von verteilten Berechnungen zu beschleunigen. Da die Verarbeitung großer Moleküldatenbanken wegen aufwändiger 3D-Berechnungen sehr zeitintensiv ist, müssen Wege gefunden werden, diese zu beschleunigen und zu parallelisieren. Dies ist besonders wichtig für Informationsvisualisierungssoftware, bei der die Berechnungen zur Laufzeit erfolgen und nicht vorher berechnete Datenbanken benutzt werden. Der hier gezeigte Ansatz bezieht sich nicht auf eine Optimierung der geometrischen Algorithmen, sondern darauf, den Berechnungsprozess auf mehrere Rechner zu verteilen, um so durch Parallelisierung insgesamt einen Zeitgewinn zu erhalten. Ausgehend von der Analyse der Granularität der Algorithmen für das Virtual Screening werden die Anforderungen für eine verteilte Anwendung erarbeitet. Aktuelle Methoden für verteilte Berechnungen mit einem speziellen Fokus auf Peer-To-Peer Lösungen werden in Bezug auf ihre Eignung für das gestellte Problem analysiert. Die Schnittstellen zu einer InfoVis Anwendung zur Darstellung von Screeningfortschritt und -ergebnissen sind ebenso Teil dieser Arbeit wie ein komplettes Framework für verteilte Berechnungen, das in Bezug auf Overhead und Skalierbarkeit evaluiert wurde. Das Programm verwendet einen Peer-To-Peer Ansatz für die Verteilung der Berechnungen. Das allgemeine Design macht es möglich, das Programm für verschiedene Anwendungen zu benutzen, deren Berechnungen sich für eine Verteilung eignen.
Virtual screening has become an essential technique for drug affinity prediction and computational drug discovery in the last few years. Due to the large amount of data involved in virtual screening work-flows, both short execution times, and visualization of the results are important. Virtual screening is used to filter out those compounds from a set of chemical substances that exhibit a certain biological activity before they are synthesized and tested in vitro or in real organisms. This thesis describes and evaluates the possibility of speeding up virtual screening for information visualization (InfoVis) applications for drug discovery using a distributed computation approach. As the processing of large compound libraries is very time-consuming due to complex 3D geometry calculations, it is necessary to find ways to speed up and parallelize this process. This is especially important in information visualization applications where the screening shall take place just in time, and not depend on preprocessed libraries. The approach used and described here is not to optimize the geometric algorithms, but to distribute the calculation processes on different machines to shorten the overall execution time by parallelization. Starting from an analysis of the granularity of the algorithms used for virtual screening the special requirements for a distributed application are evaluated in this context. State of the art distribution standards and methods with a special focus on peer-to-peer techniques are discussed regarding their use for the given problem. Communication interfaces to an InfoVis application visualizing screening results and progress are part of this work, and a complete distributed application for virtual screening is developed and its performance evaluated in terms of overhead and scalability. This application uses a peer-to-peer approach for the distribution of the calculations and provides a general interface to serve as the basis for calculations for different applications in this area.