Publikation: Automated Structure Preparation and Its Influences on Protein-Ligand Docking and Virtual Screening
Dateien
Datum
Autor:innen
Herausgeber:innen
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
URI (zitierfähiger Link)
Internationale Patentnummer
Link zur Lizenz
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Sammlungen
Core Facility der Universität Konstanz
Titel in einer weiteren Sprache
Publikationstyp
Publikationsstatus
Erschienen in
Zusammenfassung
Zusammenfassung in einer weiteren Sprache
In dieser Arbeit wurde das Strukturerkennungsprogramm SPORES eingeführt, das zur Vorbereitung von Protein- und Ligandstrukturen aus Strukturdatenbanken wie der PDB dient. Die automatisierte Strukturerkennung und -vorbereitung ist ein wichtiger Schritt beim Erstellen von großen Moleküldatensatzen z.B. für Virtual Screening (VS). Neben
der reinen Strukturerkennung bietet SPORES die Möglichkeit, die Strukturen kleiner Moleküle zu modifzieren, so dass z.B. verschiedene Stereoisomere, Tautomere und Protonierungszustände erstellt werden können. Modifzierte Liganden bieten in VS Experimenten die Möglichkeit, den chemischen Raum besser abzudecken. Dies kann z.B.
verhindern, dass ein Ligand als nicht bindend eingestuft wird, weil er in der falschen Protonierung gedockt wurde, oder die Datenbank, aus der die Strukturen entnommen
wurden nur das falsche Stereoisomer enthielt.
Für die Entwicklung von SPORES wurden verschieden Datensätze verwendet. Als Trainingsdatensatz diente der ASTEX cleannc Datensatz und zur Validierung wurden
der ASTEX diverse und der sehr große DUD Datensatz verwendet. Die SPORES Strukturerkennung erwies sich dabei als äußerst erfolgreich mit Fehlerquoten zwischen
ca 1.5% auf dem DUD Datensatz und 5% auf dem ASTEX diverse Datensatz. Mit den Modifzierungsm oglichenkeiten von Liganden wurden verschieden Dockingstudien
durchgeführt, die in den Bereich Pose Prediction und VS fallen. Beim Pose Prediction wurde hauptsächlich der ASTEX cleannc Datensatz verwendet. Diese Datensatz besteht
aus manuell überarbeiteten Strukturen und die Fragestellung war, ob die automatisch generierten Ligandprotonierungen ähnlich gute Dockingergebnisse wie die manuell an
die Proteine angepassten liefern können. Die von SPORES generierte Standard Protonierung, die auf einem Regelwerk in SPORES basiert und die Protonierung von organischen
Molekülen bei physiologischen Bedingung wiedergeben soll, lieferte dabei etwas schlechtere Ergebnisse als die manuell bearbeitete ASTEX Protonierung (Erfolgsquoten
von 76% gegenüber 80% mit PLANTS und 72% gegenüber 76% mit GOLD). Die vier unterschiedlichen Möglichkeiten zur Erzeugung von Ligand Protonierungszust anden,
die in SPORES verwendet wurden, wurden ebenfalls am ASTEX cleannc Datensatz getestet. Dabei zeigte sich deutlich, dass die in PLANTS verwendete Zielfunktion
ChemPLP, nicht in der Lage ist den korrekten Protonierungszustand eines Liganden im gebundenen Zustand zu identifzieren, sondern auf Grund der erhöhten Zahl von Wechselwirkungsmöglichkeiten, hoch geladene Ligandstrukturen, die oftmals falsch gedockt werden, bevorzugt. Nur wenn die Protonierungszustände vor dem Docking gefltert werden, um unwahrscheinliche auszuschließen, lassen sich ähnliche Erfolgsquoten wie mit der SPORES Standardprotonierung erzielen. Drei der vier verschiedenen Möglichkeiten in
SPORES Protonierungszustände zu erzeugen verwendeten das Programm MARVIN und dessen pKa Berechnung bzw, die Protomerverteilung bei gegebenem pH Wert. Nur wenn
die Protonierungszustände auf den mit MARVIN vorhergesagten Protomerverteilungen bei physiologischen pH basierten konnte eine bessere Erfolgsquote als die mit der SPORES
Standardprotonierung erreicht werden. Neben den verschiedenen Protonierungszuständen wurden noch Hetereoringtautomere, die mit SPORES erzeugt wurden, getestet.
Aber auch hier blieb die Erfolgsquote hinter der mit der SPORES Standardprotonierung erreichten zurück.
Auf einem Teil des AXTEX cleannc Datensatzes wurde der Einfluss der Stereoisomere auf das Pose Prediction getestet. Der Teildatensatz bestand aus 56 Komplexen, von denen bei 38 das original Stereoisomer korrekt gedockt wurde, und die daher als relevant angesehen wurden. Wenn nur die relevanten Komplexe betrachtet wurden, so konnte die ChemPLP Zielfunktion in 26 dieser 38 Komplexe das korrekte Stereoisomer zwischen den anderen Isomeren identifzieren. Aufgrund der zu wenigen verfügbaren experimentellen Daten zum Bindeverhalten von Stereoisomeren und den Proteinen des Teildatensatzes lässt sich allerdings nur aussagen, dass die Zielfunktion zwar in diesen Fällen das richtige Isomer identifziert aber die korrekte Einordnung der relativen Affinitäten scheint nicht gegeben zu sein. Ein ähnliches Ergebnis wurde beim Docking mit unterschiedlichen Ringkonformeren erhalten.
für VS Experiment wurden zwei Datensätze verwendet. Zum einen ein kleiner, selbst aus der ReliBase zusammengestellter Datensatz, zum anderen der sehr umfangreiche DUD Datensatz. Untersucht wurde wieder der Einfluss der verschiedenen Ligandprotonierungen auf das Screening sowie, vor allem beim DUD Datensatz, das generelle Abschneiden von PLANTS. Bei dem kleinen Datensatz, der nur 4 Zielproteine mit einer unterschiedlichen Anzahl Liganden umfasste, waren die erzielten Anreicherungen der aktiven Liganden auf den ersten Plätzen der Score-Rangfolge gut bis exzellent. Bei dem Zielprotein DHFR wurde bei Verwendung der kombinatorisch erzeugten Protonierungszuständen allerdings eine artifzielle Anreicherung aufgrund hoch geladener Strukturen festgestellt.
Beim größeren DUD Datensatz zeigen die Anreicherungen für die meisten Zielproteine wenig Abhängigkeit von den unterschiedlichen Ligandprotonierungen. Insgesamt reichen
die erzielten Anreicherungen auf diesem Datensatz von extrem schlecht, wobei bei einigen Zielproteinen eine fast negative Anreicherung, bei der die aktiven Liganden sich am
Ende der Rangfolge sammeln, beobachtet wurde, bis hin zu exzellent, für einige wenige Zielproteine. Bei der Mehrheit der Zielproteine wurde mittlere bis gute Anreicherung
beobachtet. Bei Vergleichen mit andere in der Literatur veröffentlichten Screenigergebnissen auf dem DUD Datensatz schnitt PLANTS verhältnismässig gut ab.
In einem neuen Ansatz, Docking mit experimentellen NMR-Daten zu unterstützen, wurde in Kooperation mit der Gruppe von Prof. Griesinger am MPI in Göttingen und Dr.
Carlomagno am EMBL in Heidelberg, die in diesen Gruppen entwickelte INPHARMA Score als externe Bibliothek in PLANTS eingebunden. Erste Versuche zur richtigen
Gewichtung der INPHARMA-Score gegen uber den Anteilen der ChemPLP-Zielfunktion mit Hilfe von Rescoring-Versuchen an vorher gedockten PKA-Liganden zeigten viel versprechende Ergebnisse. Mit Hilfe von simulierten INPHARMA-Daten konnte in Simplex optimierten Rescoringexperimenten erreicht werden, dass sich die relative Lage zweier
Minima der Zielfunktion vertauschte und dadurch die korrekte Dockinglösung auf Platz eins der Rangfolge verschoben wurde.
Der DUD Datensatz wurde auch verwendet, um das ligandbasierte pharmACOphore Modul von PLANTS zu testen. Hierbei wurden im Einklang mit der Literatur bessere
Ergebnisse als mit dem strukturbasiertem Ansatz erzielt. Das pharmACOphore Modul wurde außerdem für das 3D Alignment von Molekülen aus der DoOR Datenbank verwendet.
Dieses Alignment wurde dann dafür benutzt, um ein vertrauensw urdiges CoMFAModell, für einen der in der DoOR-Datenbank enthaltenen Rezeptoren, Or22a, mit
dem SYBYL Programmpaket zu erstellen. Das erstellte CoMFA-Modell erlaubt einige Rückschlüsse auf den Rezeptor, z.B. wo sich geladene Gruppen in der Bindetasche
befnden sollten. Die Vorhersagekraft für die Aktivität von Duftstoffen, die im Trainingsdatensatz enthalten waren und für strukturell ähnlich Molküle war recht gut. Wie alle
QSAR-Modelle ist es aber auf solche Moleküle beschränkt und kann nicht auf andere übertragen werden, vor allem, wenn funktionelle Gruppen auftreten, die kein Molekül im
Trainingsdatensatz besaß.
Fachgebiet (DDC)
Schlagwörter
Konferenz
Rezension
Zitieren
ISO 690
TEN BRINK, Tim, 2011. Automated Structure Preparation and Its Influences on Protein-Ligand Docking and Virtual Screening [Dissertation]. Konstanz: University of KonstanzBibTex
@phdthesis{tenBrink2011Autom-15883, year={2011}, title={Automated Structure Preparation and Its Influences on Protein-Ligand Docking and Virtual Screening}, author={ten Brink, Tim}, address={Konstanz}, school={Universität Konstanz} }
RDF
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/15883"> <dc:rights>terms-of-use</dc:rights> <dc:contributor>ten Brink, Tim</dc:contributor> <dc:language>eng</dc:language> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-11-03T09:41:22Z</dcterms:available> <dc:creator>ten Brink, Tim</dc:creator> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/29"/> <dcterms:title>Automated Structure Preparation and Its Influences on Protein-Ligand Docking and Virtual Screening</dcterms:title> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/29"/> <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/15883"/> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/15883/2/Dissertation_tenBrink.pdf"/> <dcterms:issued>2011</dcterms:issued> <foaf:homepage rdf:resource="http://localhost:8080/"/> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-11-03T09:41:22Z</dc:date> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/15883/2/Dissertation_tenBrink.pdf"/> <dcterms:alternative>Automatische Strukturvorbereitung und ihre Einflüsse auf Protein-Ligand Docking und Virtual Screening</dcterms:alternative> </rdf:Description> </rdf:RDF>