Type of Publication: | Dissertation |
URI (citable link): | http://nbn-resolving.de/urn:nbn:de:bsz:352-158832 |
Author: | ten Brink, Tim |
Year of publication: | 2011 |
Title in another language: | Automatische Strukturvorbereitung und ihre Einflüsse auf Protein-Ligand Docking und Virtual Screening |
Summary in another language: |
In dieser Arbeit wurde das Strukturerkennungsprogramm SPORES eingeführt, das zur Vorbereitung von Protein- und Ligandstrukturen aus Strukturdatenbanken wie der PDB dient. Die automatisierte Strukturerkennung und -vorbereitung ist ein wichtiger Schritt beim Erstellen von großen Moleküldatensatzen z.B. für Virtual Screening (VS). Neben
der reinen Strukturerkennung bietet SPORES die Möglichkeit, die Strukturen kleiner Moleküle zu modifzieren, so dass z.B. verschiedene Stereoisomere, Tautomere und Protonierungszustände erstellt werden können. Modifzierte Liganden bieten in VS Experimenten die Möglichkeit, den chemischen Raum besser abzudecken. Dies kann z.B. verhindern, dass ein Ligand als nicht bindend eingestuft wird, weil er in der falschen Protonierung gedockt wurde, oder die Datenbank, aus der die Strukturen entnommen wurden nur das falsche Stereoisomer enthielt. Für die Entwicklung von SPORES wurden verschieden Datensätze verwendet. Als Trainingsdatensatz diente der ASTEX cleannc Datensatz und zur Validierung wurden der ASTEX diverse und der sehr große DUD Datensatz verwendet. Die SPORES Strukturerkennung erwies sich dabei als äußerst erfolgreich mit Fehlerquoten zwischen ca 1.5% auf dem DUD Datensatz und 5% auf dem ASTEX diverse Datensatz. Mit den Modifzierungsm oglichenkeiten von Liganden wurden verschieden Dockingstudien durchgeführt, die in den Bereich Pose Prediction und VS fallen. Beim Pose Prediction wurde hauptsächlich der ASTEX cleannc Datensatz verwendet. Diese Datensatz besteht aus manuell überarbeiteten Strukturen und die Fragestellung war, ob die automatisch generierten Ligandprotonierungen ähnlich gute Dockingergebnisse wie die manuell an die Proteine angepassten liefern können. Die von SPORES generierte Standard Protonierung, die auf einem Regelwerk in SPORES basiert und die Protonierung von organischen Molekülen bei physiologischen Bedingung wiedergeben soll, lieferte dabei etwas schlechtere Ergebnisse als die manuell bearbeitete ASTEX Protonierung (Erfolgsquoten von 76% gegenüber 80% mit PLANTS und 72% gegenüber 76% mit GOLD). Die vier unterschiedlichen Möglichkeiten zur Erzeugung von Ligand Protonierungszust anden, die in SPORES verwendet wurden, wurden ebenfalls am ASTEX cleannc Datensatz getestet. Dabei zeigte sich deutlich, dass die in PLANTS verwendete Zielfunktion ChemPLP, nicht in der Lage ist den korrekten Protonierungszustand eines Liganden im gebundenen Zustand zu identifzieren, sondern auf Grund der erhöhten Zahl von Wechselwirkungsmöglichkeiten, hoch geladene Ligandstrukturen, die oftmals falsch gedockt werden, bevorzugt. Nur wenn die Protonierungszustände vor dem Docking gefltert werden, um unwahrscheinliche auszuschließen, lassen sich ähnliche Erfolgsquoten wie mit der SPORES Standardprotonierung erzielen. Drei der vier verschiedenen Möglichkeiten in SPORES Protonierungszustände zu erzeugen verwendeten das Programm MARVIN und dessen pKa Berechnung bzw, die Protomerverteilung bei gegebenem pH Wert. Nur wenn die Protonierungszustände auf den mit MARVIN vorhergesagten Protomerverteilungen bei physiologischen pH basierten konnte eine bessere Erfolgsquote als die mit der SPORES Standardprotonierung erreicht werden. Neben den verschiedenen Protonierungszuständen wurden noch Hetereoringtautomere, die mit SPORES erzeugt wurden, getestet. Aber auch hier blieb die Erfolgsquote hinter der mit der SPORES Standardprotonierung erreichten zurück. Auf einem Teil des AXTEX cleannc Datensatzes wurde der Einfluss der Stereoisomere auf das Pose Prediction getestet. Der Teildatensatz bestand aus 56 Komplexen, von denen bei 38 das original Stereoisomer korrekt gedockt wurde, und die daher als relevant angesehen wurden. Wenn nur die relevanten Komplexe betrachtet wurden, so konnte die ChemPLP Zielfunktion in 26 dieser 38 Komplexe das korrekte Stereoisomer zwischen den anderen Isomeren identifzieren. Aufgrund der zu wenigen verfügbaren experimentellen Daten zum Bindeverhalten von Stereoisomeren und den Proteinen des Teildatensatzes lässt sich allerdings nur aussagen, dass die Zielfunktion zwar in diesen Fällen das richtige Isomer identifziert aber die korrekte Einordnung der relativen Affinitäten scheint nicht gegeben zu sein. Ein ähnliches Ergebnis wurde beim Docking mit unterschiedlichen Ringkonformeren erhalten. für VS Experiment wurden zwei Datensätze verwendet. Zum einen ein kleiner, selbst aus der ReliBase zusammengestellter Datensatz, zum anderen der sehr umfangreiche DUD Datensatz. Untersucht wurde wieder der Einfluss der verschiedenen Ligandprotonierungen auf das Screening sowie, vor allem beim DUD Datensatz, das generelle Abschneiden von PLANTS. Bei dem kleinen Datensatz, der nur 4 Zielproteine mit einer unterschiedlichen Anzahl Liganden umfasste, waren die erzielten Anreicherungen der aktiven Liganden auf den ersten Plätzen der Score-Rangfolge gut bis exzellent. Bei dem Zielprotein DHFR wurde bei Verwendung der kombinatorisch erzeugten Protonierungszuständen allerdings eine artifzielle Anreicherung aufgrund hoch geladener Strukturen festgestellt. Beim größeren DUD Datensatz zeigen die Anreicherungen für die meisten Zielproteine wenig Abhängigkeit von den unterschiedlichen Ligandprotonierungen. Insgesamt reichen die erzielten Anreicherungen auf diesem Datensatz von extrem schlecht, wobei bei einigen Zielproteinen eine fast negative Anreicherung, bei der die aktiven Liganden sich am Ende der Rangfolge sammeln, beobachtet wurde, bis hin zu exzellent, für einige wenige Zielproteine. Bei der Mehrheit der Zielproteine wurde mittlere bis gute Anreicherung beobachtet. Bei Vergleichen mit andere in der Literatur veröffentlichten Screenigergebnissen auf dem DUD Datensatz schnitt PLANTS verhältnismässig gut ab. In einem neuen Ansatz, Docking mit experimentellen NMR-Daten zu unterstützen, wurde in Kooperation mit der Gruppe von Prof. Griesinger am MPI in Göttingen und Dr. Carlomagno am EMBL in Heidelberg, die in diesen Gruppen entwickelte INPHARMA Score als externe Bibliothek in PLANTS eingebunden. Erste Versuche zur richtigen Gewichtung der INPHARMA-Score gegen uber den Anteilen der ChemPLP-Zielfunktion mit Hilfe von Rescoring-Versuchen an vorher gedockten PKA-Liganden zeigten viel versprechende Ergebnisse. Mit Hilfe von simulierten INPHARMA-Daten konnte in Simplex optimierten Rescoringexperimenten erreicht werden, dass sich die relative Lage zweier Minima der Zielfunktion vertauschte und dadurch die korrekte Dockinglösung auf Platz eins der Rangfolge verschoben wurde. Der DUD Datensatz wurde auch verwendet, um das ligandbasierte pharmACOphore Modul von PLANTS zu testen. Hierbei wurden im Einklang mit der Literatur bessere Ergebnisse als mit dem strukturbasiertem Ansatz erzielt. Das pharmACOphore Modul wurde außerdem für das 3D Alignment von Molekülen aus der DoOR Datenbank verwendet. Dieses Alignment wurde dann dafür benutzt, um ein vertrauensw urdiges CoMFAModell, für einen der in der DoOR-Datenbank enthaltenen Rezeptoren, Or22a, mit dem SYBYL Programmpaket zu erstellen. Das erstellte CoMFA-Modell erlaubt einige Rückschlüsse auf den Rezeptor, z.B. wo sich geladene Gruppen in der Bindetasche befnden sollten. Die Vorhersagekraft für die Aktivität von Duftstoffen, die im Trainingsdatensatz enthalten waren und für strukturell ähnlich Molküle war recht gut. Wie alle QSAR-Modelle ist es aber auf solche Moleküle beschränkt und kann nicht auf andere übertragen werden, vor allem, wenn funktionelle Gruppen auftreten, die kein Molekül im Trainingsdatensatz besaß. |
Examination date (for dissertations): | Sep 9, 2011 |
Dissertation note: | Doctoral dissertation, University of Konstanz |
Subject (DDC): | 540 Chemistry |
Keywords: | Strukturerkennung, Strukturerkennungsprogramm, Strukturdatenbank |
Link to License: | In Copyright |
Bibliography of Konstanz: | Yes |
TEN BRINK, Tim, 2011. Automated Structure Preparation and Its Influences on Protein-Ligand Docking and Virtual Screening [Dissertation]. Konstanz: University of Konstanz
@phdthesis{tenBrink2011Autom-15883, title={Automated Structure Preparation and Its Influences on Protein-Ligand Docking and Virtual Screening}, year={2011}, author={ten Brink, Tim}, address={Konstanz}, school={Universität Konstanz} }
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/rdf/resource/123456789/15883"> <dc:contributor>ten Brink, Tim</dc:contributor> <dcterms:title>Automated Structure Preparation and Its Influences on Protein-Ligand Docking and Virtual Screening</dcterms:title> <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/> <dcterms:issued>2011</dcterms:issued> <foaf:homepage rdf:resource="http://localhost:8080/jspui"/> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/15883/2/Dissertation_tenBrink.pdf"/> <dc:language>eng</dc:language> <dc:rights>terms-of-use</dc:rights> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-11-03T09:41:22Z</dc:date> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/15883/2/Dissertation_tenBrink.pdf"/> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-11-03T09:41:22Z</dcterms:available> <dcterms:alternative>Automatische Strukturvorbereitung und ihre Einflüsse auf Protein-Ligand Docking und Virtual Screening</dcterms:alternative> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/rdf/resource/123456789/29"/> <dc:creator>ten Brink, Tim</dc:creator> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/rdf/resource/123456789/29"/> <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/15883"/> </rdf:Description> </rdf:RDF>
Dissertation_tenBrink.pdf | 665 |