KOPS - The Institutional Repository of the University of Konstanz

Deep Learning als Virtual-High-Throughput-Screening-Methode unter Verwendung von gerasterten Molekülstrukturen

Deep Learning als Virtual-High-Throughput-Screening-Methode unter Verwendung von gerasterten Molekülstrukturen

Cite This

Files in this item

Checksum: MD5:67f28bd1d50b0b04349b3f60f0138fbc

WINTER, Patrick, 2020. Deep Learning als Virtual-High-Throughput-Screening-Methode unter Verwendung von gerasterten Molekülstrukturen [Dissertation]. Konstanz: University of Konstanz

@phdthesis{Winter2020Learn-49332, title={Deep Learning als Virtual-High-Throughput-Screening-Methode unter Verwendung von gerasterten Molekülstrukturen}, year={2020}, author={Winter, Patrick}, address={Konstanz}, school={Universität Konstanz} }

deu Deep Learning als Virtual-High-Throughput-Screening-Methode unter Verwendung von gerasterten Molekülstrukturen Winter, Patrick terms-of-use 2020-04-28T12:47:01Z Virtual High-Throughput Screening ist die Anwendung von Klassifizierungsmethoden des maschinellen Lernens, um die Aktivität von Molekülen abzuschätzen. Das Ziel dabei ist es oftmals, eine Vorauswahl zu treffen, welche Moleküle am ehesten eine Chance haben, eine gewünschte biologische Aktivität zu zeigen. Dadurch lässt sich die Menge an tatsächlich im Labor durchzuführenden Tests reduzieren.<br /><br />Im Bereich des maschinellen Sehens hat sich in den letzten Jahren die Anwendung von Deep Learning als besonders akkurate Methode der Klassifizierung durchgesetzt. Hierbei werden oft Convolutional Neural Networks eingesetzt, die zuerst aus den Pixeln eines Bildes abstraktere Merkmale generieren, welche sich dann zu einer besseren Klassifizierung eignen.<br /><br />Das Ziel dieser Arbeit ist es, diese Methoden des maschinellen Sehens so zu adaptieren, dass sie sich zum Einsatz für das Virtual High-Throughput Screening eignen. Dies wird durch die Umwandlung der Struktur eines Moleküls in ein bildähnliches Rasterformat ermöglicht. Hierbei wird die Anordnung der Atome auf der Basis der 2D-Darstellung der Struktur vorgenommen. Als Merkmale eines jeden Atoms dienen sowohl sein kodiertes Elementsymbol als auch seine chemischen Eigenschaften. Die verwendete Netzwerkarchitektur besteht aus Convolution-Schichten zur Generierung abstrakterer Merkmale und aus Dense-Schichten, die diese Merkmale nutzen, um ein Molekül zu klassifizieren. Durch diese Aufteilung des Netzwerks ist auch ein separates Generieren von Merkmalen möglich, die dann in Kombination mit anderen Methoden genutzt werden können.<br /><br />Ein weiteres Ziel dieser Arbeit ist die Interpretation dessen, was ein Netzwerk aus den Daten gelernt hat. Hierzu werden in der vorgestellten Methode Saliency Maps genutzt, um zu berechnen, welche Bereiche der Eingabedaten den größten Einfluss auf die gewählte Klasse haben. Unter Verwendung dieser Berechnung ist eine Visualisierung der Substrukturen möglich, die laut Netzwerk für die Aktivität des Moleküls verantwortlich sind. Durch ein schwellenwertbasiertes Verfahren wird außerdem eine automatische Extraktion von wichtigen Substrukturen ermöglicht, die mittels einer Bewertung nach ihrer Relevanz sortiert werden.<br /><br />Die im Zuge dieser Arbeit implementierte Softwarearchitektur wird ebenfalls vorgestellt. Sie ermöglicht eine effiziente Nutzung paralleler Ressourcen, indem die Vorbereitung neuer Daten auf alle Kerne des Prozessors verteilt wird, während die vorherigen Daten gleichzeitig auf der Grafikkarte zum Training verwendet werden. Ebenfalls speichert die Architektur Zwischenergebnisse, die ein einfaches Fortsetzen von abgebrochenen oder abgestürzten Experimenten ermöglichen.<br /><br />Im experimentellen Teil der Arbeit werden sinnvolle Hyperparameter für die vorgestellte Methode gesucht. Des Weiteren wird die Methode mit gängigen Methoden des Virtual High-Throughput Screenings verglichen. In diesem Vergleich zeigt sich, dass die vorgestellte Methode es mit gängigen Fingerprints durchaus aufnehmen kann. Auch das Finden von relevanten Substrukturen wird untersucht. Die tatsächlich für die Aktivität relevanten Substrukturen werden hierbei erfolgreich gefunden. 2020-04-28T12:47:01Z 2020 Winter, Patrick

Downloads since Apr 28, 2020 (Information about access statistics)

Winter_2-uhaun1jui1e97.pdf 114

This item appears in the following Collection(s)

Search KOPS


Browse

My Account