<div class="csl-bib-body">
<div class="csl-entry">Cernocky, T. (2025). <i>Computational design on protein crystals</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2025.133257</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2025.133257
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/220156
-
dc.description
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers
-
dc.description.abstract
Heutzutage wird an die Entwicklung vieler Medikamente mittels Designs von neuen Proteinstrukturen herangegangen, welche an einen aktiven Stoff binden und diesen dann an die gewünschte Stelle in unserem Körper transportieren. Daneben kommen kristallisierende Proteine für Laborexperimente in Frage, weil sie stabil sind. Da Proteine, welche symmetrische Zusammenstellungen sponntan im Lösungsmittel bilden, wohl kristallisieren, sind diese von großer Bedeutung. In den letzten Jahren hat es sich herausgestellt, dass es in den Proteinen Muster gibt, die die aktuellen Machine Learning Sprachmodele lernen können. Sie wurden daher schnell als ein Hilfsmittel genommen zur Entlastung bei teuren und zeitaufwändigen chemischen Laborexperimenten beim Proteindesign. Es stellt sich nun der Bedarf ein, diese Modele an die symmetrischen Proteine anzupassen. In der vorliegenden Arbeit wird ein auf einem Graph Neural Network aufgebautes Model erklärt, das das structure-to-sequence Problem löst, das also für eine Proteinstruktur ihre Folge von Aminosäuren vorschlägt. Dieses Model wurde erweitert, damit es die zyklischen Zusammenstellungen von Proteins effizienter verarbeitet. Unter Verwendung von zwei Architekturen der Sprachmodele wurde die neue Version des Models trainiert und getestet auf zyklischen Zusammenstellungen von Proteins. Die Testergebnisse zeigen, dass unsere Erwei-terung noch nicht das Niveau des Referencemodels erreicht, aber interessanterweise liefert eine der untersuchten Architekturen bessere Vorhersagen als die andere, im Widerspruch zu bisherigen Ergebnissen in der Literatur. Am Ende stellt unsere Version des Models einen guten Ausgangspunkt zur Erweiterung auf die Proteinkristalle dar.
de
dc.description.abstract
Nowadays, a frequent way to design new drugs is to construct a protein to which an active matter binds, and the whole compound then flows through our body to the designated spot. The construction of the protein is one of the main challenges in biochemistry because often one has additional constraints, such as being able to crystallize. Crystalline proteins are better to handle in laboratory due to their stability. A general result has been known, that proteins which group themselves in the solvent, water, into symmetric assemblies often crystallize. As deep-learning methods have revolutionized computational biology in the recent years, they can serve as a tool predicting candidates for expensive and time-consuming laboratory experiments. Nevertheless, not all of the software has been developed for symmetric assemblies or crystalline proteins. The aim of this work is thus to extend one model solving the structure-to-sequence problem, that is it predicts from the protein structure the sequence of amino acids in the protein, to the cyclic assemblies of proteins. We train and test several versions of our extension on a data set of cyclic assemblies. Test results show that our extension is still behind the reference model, but interestingly one of our tested architectures, the transformer architecture, performs better than the second, multi-layer perceptron based architecture, which is in contrary with the results in the literature. Finally, our contribution can be a good benchmark to extend the model further to symmetries occurring in protein crystals.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Proteindesign
de
dc.subject
Symmetriegruppe
de
dc.subject
zyklische Zusammenstellung
de
dc.subject
graph-neuronales Netzwerk
de
dc.subject
protein design
en
dc.subject
symmetry group
en
dc.subject
cyclic assembly
en
dc.subject
graph neural network
en
dc.title
Computational design on protein crystals
en
dc.title.alternative
Computergestütztes Design von Proteinkristallen
de
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2025.133257
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Tomas Cernocky
-
dc.publisher.place
Wien
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
tuw.publication.orgunit
E101 - Institut für Analysis und Scientific Computing
-
dc.type.qualificationlevel
Diploma
-
dc.identifier.libraryid
AC17675903
-
dc.description.numberOfPages
68
-
dc.thesistype
Diplomarbeit
de
dc.thesistype
Diploma Thesis
en
dc.rights.identifier
In Copyright
en
dc.rights.identifier
Urheberrechtsschutz
de
tuw.advisor.staffStatus
staff
-
tuw.advisor.orcid
0000-0001-7116-1707
-
item.cerifentitytype
Publications
-
item.openaccessfulltext
Open Access
-
item.languageiso639-1
en
-
item.fulltext
with Fulltext
-
item.openairetype
master thesis
-
item.grantfulltext
open
-
item.mimetype
application/pdf
-
item.openairecristype
http://purl.org/coar/resource_type/c_bdcc
-
crisitem.author.dept
E104 - Institut für Diskrete Mathematik und Geometrie