Publikation: Efficient Ant Colony Optimization Algorithms for Structure- and Ligand-Based Drug Design
Dateien
Datum
Autor:innen
Herausgeber:innen
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
URI (zitierfähiger Link)
Internationale Patentnummer
Link zur Lizenz
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Sammlungen
Core Facility der Universität Konstanz
Titel in einer weiteren Sprache
Publikationstyp
Publikationsstatus
Erschienen in
Zusammenfassung
Within this work new algorithms based on Ant Colony Optimization (ACO) for the task of structure- and ligand-based drug design were developed. The ACO-algorithm PLANTS (Protein-Ligand ANT System) is capable of minimizing real-valued multi-dimensional objective functions. Therefore, all problems treated in this work were reduced to real-valued optimization problems, which were then tackled by the PLANTS approach.
In the case of structure-based drug design, PLANTS was employed to treat the flexible protein-ligand docking problem. Two empirical objective functions aiming at the prediction of experimentally observed complex conformations were parameterized using a data set consisting of 31 protein-ligand complexes. The whole approach exhibited an excellent performance with respect to predicting experimentally observed complex conformations when docking back a ligand into its cocrystallized protein structure for publicly available benchmark data sets (CCDC / Astex). On average between 76% (213 complexes of the CCDC / Astex data set) and 87% (85 complexes of the Astex diverse data set consisting of drug-like ligands) of the complex conformations could be predicted correctly. A direct comparison with the protein-ligand docking software GOLD on the same test sets showed that the PLANTS approach was able to reach at least as high success rates as the ones observed for GOLD within shorter average search times. Further experiments were carried out for the task of docking a ligand into a non-native protein structure (cross-docking). In general, these experiments identified the limitations of the presented approach. However, the inclusion of additional degrees of freedom, like flexible protein side-chains and explicit, displaceable water molecules, significantly increased the predictive power of the approach.
Besides the prediction of the complex conformation, the approach was also assessed with respect to the task of virtual screening. The inactive data sets were composed to match the property-distributions of the active ones to avoid one source of artificial enrichment. The performance of the approach regarding the discrimination between biologically active and inactive compounds was target-dependent and ranged from modest up to excellent enrichment factors.
A coupled ACO-algorithm accounting for the parameterization of the objective function as well as the complex structure prediction was used to train a target-specific objective function. The target-specific objective function in general showed a better discrimination between active and inactive ligands, while no change in the enrichment factors at 1% and 2% of the ranked database was observed compared to the standard objective function.
Furthermore, a graphics card accelerated version of the PLANTS approach was presented. This version is capable of exploiting the enormous floating point computation power of modern graphics cards for the structure transformation and objective function evaluation step. The graphics card accelerated version of the docking approach (Nvidia GeForce 8800 GTX graphics card) only needed approximately 20% of the computation time measured for the standard version of PLANTS on a test set consisting of 129 protein-ligand complexes, while reaching similar success rates.
Finally, the PLANTS approach was used in the ligand-based part of the work for the problem of pairwise and multiple flexible ligand alignment. A similarity-based objective function, rewarding the alignment of identical pharmacophoric points in different ligands, was parameterized using 4 training data sets. The resulting parameterization showed a good predictive power when tested on the independent FlexS data set as well as for the concurrent alignment of multiple ligands. Additionally, ligand-based virtual screening experiments were carried out, which showed at least comparable results compared to the structure-based PLANTS approach at considerably shorter search times per ligand.
Zusammenfassung in einer weiteren Sprache
Im Rahmen der Arbeit wurden auf der Basis von Ant Colony Optimization (ACO) neue Algorithmen für den struktur- und ligandbasierten Wirkstoffentwurf entwickelt. Der beschriebene ACO-Algorithmus PLANTS (Protein-Ligand ANT System) ist in der Lage, reellwertige mehrdimensionale Zielfunktionen zu minimieren. Alle in der Arbeit behandelten Problemstellungen wurden daher auf reellwertige Optimierungsprobleme reduziert, auf die dann der PLANTS-Algorithmus angewendet wurde.
Im strukturbasierten Fall wurde das Verfahren zunächst zur Behandlung des flexiblen Protein-Ligand-Docking-Problems eingesetzt. Zwei empirische Zielfunktionen zur Vorhersage experimentell beobachteter Komplexkonformationen wurden auf einem Trainingsdatensatz bestehend aus 31 Protein-Ligand-Komplexen parametrisiert. Das Gesamtverfahren zeigte auf öffentlich zugänglichen und allgemein anerkannten Benchmark-Datensätzen (CCDC / Astex) für das Docking eines Liganden in seine kokristallisierte Proteinstruktur eine hervorragende Leistung bezüglich der Vorhersage experimentell beobachteter Komplexkonformationen. Im Durchschnitt konnten zwischen 76% (213 Komplexe des CCDC / Astex Datensatzes) und 87% (85 Komplexe des Astex diverse Datensatzes mit wirkstoffähnlichen Liganden) der Komplexkonformationen korrekt vorhergesagt werden. Ein direkter Vergleich mit der Protein-Ligand-Docking-Software GOLD auf den gleichen Datensätzen ergab, dass PLANTS in der Regel eine mindestens genauso hohe Erfolgsquote in kürzerer durchschnittlicher Rechenzeit erreichen konnte. Weitere Experimente wurden für das Docking von Liganden in nicht-kokristallisierte Proteinstrukturen durchgeführt (cross-docking). Die Ergebnisse für diese Experimente zeigten die Limitierungen des vorgestellten Ansatzes auf. Prinzipiell konnte die Vorhersagekraft bezüglich experimentell beobachteter Komplexkonformationen durch die Berücksichtigung zusätzlicher Freiheitsgrade, wie zum Beispiel flexibler Proteinseitenketten und expliziter, verdrängbarer Wassermoleküle, deutlich verbessert werden.
Neben der Vorhersage der Komplexkonformation wurde das Verfahren ebenfalls bezüglich des Einsatzgebietes virtual screening evaluiert. Die Inaktivdatensätze wurden gemäß der Eigenschaftsverteilungen der aktiven Liganden zusammengestellt, um eine Quelle künstlicher Anreicherung zu vermeiden. Die Leistung des Verfahrens bezüglich der Diskriminierung zwischen biologisch aktiven und inaktiven Liganden war dabei proteinabhängig und reichte von mäßigen bis hin zu sehr guten Anreicherungsraten.
Für eines der Proteine wurde mit Hilfe eines gekoppelten ACO-Algorithmus, der sowohl die Zielfunktionsparameterisierung als auch die Komplexvorhersage in Betracht zieht, eine protein-spezifische Zielfunktion angelernt. Diese zeigte eine global gesehen bessere Diskriminierung zwischen aktiven und inaktiven Liganden, während sich die Anreicherungsraten
bei 1% und 2% der nach Zielfunktionswerten sortierten Datenbank, verglichen mit den Ergebnissen der Standardzielfunktion, nicht geändert hatten.
Des weiteren wurde eine grafikkarten-beschleunigte Version des PLANTS-Verfahrens vorgestellt. Diese ist in der Lage, die enorme Fließkommarechenleistung moderner Grafikkarten für den Strukturtransformations- und Zielfunktionsauswertungsschritt auszunutzen. Die grafikkarten-beschleunigte Version des Docking-Verfahrens (Nvidia GeForce 8800 GTX Grafikkarte) benötigte dabei auf einem Datensatz bestehend aus 129 Protein-Ligand-Komplexen im Durchschnitt nur ca. 20% der Rechenzeit der hauptprozessor-basierten Standardversion bei ähnlichen Erfolgsquoten.
Schließlich wurde im ligandbasierten Teil der Arbeit das PLANTS-Verfahren zur paarweisen und multiplen flexiblen Überlagerung von Ligandmolekülen eingesetzt. Dazu wurde eine ähnlichkeitsbasierte Zielfunktion auf 4 Trainingsdatensätzen parametrisiert, die das Überlagern gleicher pharmakophorer Punkte in verschiedenen Liganden belohnt. Die resultierende Parametrisierung zeigte eine gute Vorhersagekraft auf dem unabhängigen FlexS-Datensatz und für die parallele Überlagerung mehrerer Liganden. Zusätzlich wurden ligandbasierte virtual screening-Experimente durchgeführt, die mindestens vergleichbare Ergebnisse wie das strukturbasierte PLANTS-Verfahren lieferten bei wesentlich kürzeren Suchzeiten pro Ligand.
Fachgebiet (DDC)
Schlagwörter
Konferenz
Rezension
Zitieren
ISO 690
KORB, Oliver, 2008. Efficient Ant Colony Optimization Algorithms for Structure- and Ligand-Based Drug Design [Dissertation]. Konstanz: University of KonstanzBibTex
@phdthesis{Korb2008Effic-9641, year={2008}, title={Efficient Ant Colony Optimization Algorithms for Structure- and Ligand-Based Drug Design}, author={Korb, Oliver}, address={Konstanz}, school={Universität Konstanz} }
RDF
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/9641"> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/9641/1/Diss_Korb.pdf"/> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/29"/> <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/> <dcterms:abstract xml:lang="eng">Within this work new algorithms based on Ant Colony Optimization (ACO) for the task of structure- and ligand-based drug design were developed. The ACO-algorithm PLANTS (Protein-Ligand ANT System) is capable of minimizing real-valued multi-dimensional objective functions. Therefore, all problems treated in this work were reduced to real-valued optimization problems, which were then tackled by the PLANTS approach.<br />In the case of structure-based drug design, PLANTS was employed to treat the flexible protein-ligand docking problem. Two empirical objective functions aiming at the prediction of experimentally observed complex conformations were parameterized using a data set consisting of 31 protein-ligand complexes. The whole approach exhibited an excellent performance with respect to predicting experimentally observed complex conformations when docking back a ligand into its cocrystallized protein structure for publicly available benchmark data sets (CCDC / Astex). On average between 76% (213 complexes of the CCDC / Astex data set) and 87% (85 complexes of the Astex diverse data set consisting of drug-like ligands) of the complex conformations could be predicted correctly. A direct comparison with the protein-ligand docking software GOLD on the same test sets showed that the PLANTS approach was able to reach at least as high success rates as the ones observed for GOLD within shorter average search times. Further experiments were carried out for the task of docking a ligand into a non-native protein structure (cross-docking). In general, these experiments identified the limitations of the presented approach. However, the inclusion of additional degrees of freedom, like flexible protein side-chains and explicit, displaceable water molecules, significantly increased the predictive power of the approach.<br />Besides the prediction of the complex conformation, the approach was also assessed with respect to the task of virtual screening. The inactive data sets were composed to match the property-distributions of the active ones to avoid one source of artificial enrichment. The performance of the approach regarding the discrimination between biologically active and inactive compounds was target-dependent and ranged from modest up to excellent enrichment factors.<br />A coupled ACO-algorithm accounting for the parameterization of the objective function as well as the complex structure prediction was used to train a target-specific objective function. The target-specific objective function in general showed a better discrimination between active and inactive ligands, while no change in the enrichment factors at 1% and 2% of the ranked database was observed compared to the standard objective function.<br />Furthermore, a graphics card accelerated version of the PLANTS approach was presented. This version is capable of exploiting the enormous floating point computation power of modern graphics cards for the structure transformation and objective function evaluation step. The graphics card accelerated version of the docking approach (Nvidia GeForce 8800 GTX graphics card) only needed approximately 20% of the computation time measured for the standard version of PLANTS on a test set consisting of 129 protein-ligand complexes, while reaching similar success rates.<br />Finally, the PLANTS approach was used in the ligand-based part of the work for the problem of pairwise and multiple flexible ligand alignment. A similarity-based objective function, rewarding the alignment of identical pharmacophoric points in different ligands, was parameterized using 4 training data sets. The resulting parameterization showed a good predictive power when tested on the independent FlexS data set as well as for the concurrent alignment of multiple ligands. Additionally, ligand-based virtual screening experiments were carried out, which showed at least comparable results compared to the structure-based PLANTS approach at considerably shorter search times per ligand.</dcterms:abstract> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T18:13:23Z</dc:date> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/9641/1/Diss_Korb.pdf"/> <dc:contributor>Korb, Oliver</dc:contributor> <foaf:homepage rdf:resource="http://localhost:8080/"/> <dcterms:issued>2008</dcterms:issued> <dc:creator>Korb, Oliver</dc:creator> <dcterms:alternative>Effiziente Ameisenalgorithmen für den struktur- und ligandbasierten Wirkstoffentwurf</dcterms:alternative> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/29"/> <dcterms:title>Efficient Ant Colony Optimization Algorithms for Structure- and Ligand-Based Drug Design</dcterms:title> <dc:format>application/pdf</dc:format> <dc:rights>terms-of-use</dc:rights> <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/9641"/> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dc:language>eng</dc:language> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T18:13:23Z</dcterms:available> </rdf:Description> </rdf:RDF>