-
Die
Erfindung betrifft eine Klasse von Verfahren zum struktur-basierenden
virtuellen Screening mittels Datenbank-Techniken, und insbesondere
ein sublineares struktur-basierendes Verfahren zum Suchen nach bioaktiven
Verbindungen mit Hilfe von relationalen Datenbanken mittels indizierbarer
Moleküldeskriptoren.
-
Mit
virtuellem Screening wird im Allgemeinen die Aufgabe beschrieben,
kleine organische Moleküle
(Verbindungen) nach solchen mit biologischer Aktivität gegen
ein spezifisches biologisches Target zu durchsuchen. Ein biologisches
Target ist dabei ein Protein, und die biologische Aktivität besteht
darin, dieses durch die Anlagerung der Verbindung zu hemmen oder
zu aktivieren. Diese Art des Screening wird als virtuell bezeichnet,
wenn sie eine maschinenlesbare Beschreibung der Verbindungen und
des Targets benutzt und zur automatischen computergestützten Durchführung geeignet
ist. Dabei kommt der exakten Beschreibung des Ortes der Anlagerung (Bindungsstelle)
besondere Bedeutung zu. Die Anlagerung erfolgt mit einer spezifischen
Affinität
(auch Bindungsaffinität).
Bei den Verbindungen handelt es sich häufig um hoch flexible Moleküle, die
eine Vielzahl verschiedener Gestalten (Konformationen) annehmen
können.
Die Verbindungen werden in Form von Molekül-Graphen mit Atomen und Bindungen und
ggf. weiteren Moleküleigenschaften
repräsentiert.
Maschinenlesbare Beschreibungen, die die chemischen Eigenschaften
eines Moleküls
charakterisieren, bezeichnet man auch als Molekül-Deskriptor.
-
Große Mengen
derartiger Beschreibungen werden auch virtuelle Bibliothek (kurz
Bibliothek) genannt.
-
Die
Beschreibung des Targets (Target-Deskriptor) besteht entweder aus
der dreidimensionalen Struktur des Proteins, der dreidimensionalen
Struktur von mindestens einer biologisch aktiven Verbindung oder
sonstigen dreidimensionalen Beschreibungen von für die biologische Aktivität relevanten
Eigenschaften. Wenn eine dreidimensionale Struktur des Targets verfügbar ist,
spricht man von struktur-basierendem
virtuellem Screening. Die Beschreibungen von Verbindungen und Target
werden im Allgemeinen in Dateien im ASCII Format gespeichert.
-
Es
sind drei Klassen von Verfahren zum virtuellen Screening bekannt:
Dies
sind zum einen dreidimensionale ähnlichkeitsbasierte
Suchverfahren, mit denen eine Menge von biologisch aktiven Verbindungen
auf gemeinsame physikochemische und strukturelle Eigenschaften (häufig auch
Pharmacophor genannt) analysiert wird. Diese Art der Beschreibung
des Targets wird verwendet, um in einer Bibliothek Verbindungen
mit ähnlichen
Eigenschaften zu finden.
-
Eine
weitere Klasse beinhaltet Alignment-basierte Suchverfahren. Bei
diesen dienen eine oder mehrere dreidimensionale Strukturen von
biologisch aktiven Verbindungen als Negativabdruck der Bindestelle.
Mit dieser/diesen Strukturen werden die Verbindungen der Bibliothek überlagert
(aligniert) und nach der Ähnlichkeit
bezüglich
ihrer physikochemischen und strukturellen Eigenschaften mit dieser Beschreibung
des Targets bewertet.
-
Schließlich gibt
es die so genannten Docking-Verfahren, für die ein dreidimensionales
Modell der Bindungsstelle des Targets benötigt wird. Die Verbindungen
werden hierbei auf der Grundlage der Komplementarität bezüglich ihrer
physikochemischen und strukturellen Eigenschaften mit dieser Beschreibung
des Targets bewertet.
-
Die
technischen Probleme und Nachteile aller zuvor beschriebener Verfahren
bestehen zum einen in ihrer eingeschränkten Genauigkeit bei der jeweiligen
Berechnung, zum anderen darin, dass sie zum virtuellen Screening
von Bibliotheken in kurzer Zeit und mit einer hohen Genauigkeit
nicht oder nur eingeschränkt
geeignet sind. Insbesondere die Alignment- und Docking-basierten
Verfahren erfordern einen sehr hohen Rechenaufwand. Eine gründliche Untersuchung
des Suchraums erfordert Rotationen und Translationen aller Konformationen
der Verbindung und einen Vergleich mit dem Target. Je gründlicher
mit einem Verfahren dieser Suchraum untersucht wird, desto genauer
können
die Geometrie der Anlagerung und die Bindungsaffinität bewertet
werden.
-
Es
sind bereits zahlreiche Werkzeuge zum virtuellen Screening bekannt.
Man kann verschiedene Screening-Strategien unterscheiden. Dabei
bezeichnet eine Screening-Strategie
eine Vorschrift zur Anwendung eines Verfahrens oder von Kombinationen
aus mehreren Verfahren der oben genannten Klassen, ggf. gekoppelt
mit weiteren bekannten algorithmischen Methoden zum Zwecke des virtuellen Screening
großer
Bibliotheken. Mittels einer Bewertung wird dabei eine Rangordnung
nach potentieller Bindungsaffinität erstellt.
-
Prinzipiell
zu unterscheiden sind dabei sequentielle, hierarchische und Filter-basierte Screening-Strategien.
Sequentielle Strategien unterziehen jede Verbindung einer Bibliothek
derselben Routine, bestehend aus einem oder mehreren der oben beschriebenen
Verfahren. Hierarchische Strategien hingegen gruppieren die Verbindungen
einer Bibliothek zunächst
und unterziehen nur einen Teil einem oder mehreren der oben beschriebenen
Verfahren. Schließlich
gibt es noch die Filter-basierten
Strategien, welche mehrere Verfahren zum virtuellen Screening nacheinander
zum Einsatz bringen. Dabei werden zunächst einfache und schnelle
Verfahren auf alle Verbindungen einer Bibliothek angewandt und nur
ein Teil der Verbindungen, mit höherem
Potential den nachfolgenden aufwändigeren
Verfahren unterzogen.
-
In
Lemmen, C.; Lengauer, T.: "Computational methods
for the structural alignment of molecules", J Comput Aided Mol Des 2000, 14, 215–232, wird
ein Überblick über Alignment-
und Ähnlichkeits-basierte Verfahren
gegeben. Auch wenn bei diesen Ansätzen jeweils verschiedene Darstellungen
der Verbindungen und Vergleichsalgorithmen verwendet werden, gehört die überwiegende
Mehrzahl zu den sequentiellen und Filter-basierten Strategien.
-
In
folgenden Druckschriften sind eine Anzahl von Werkzeugen zum molekularen
Docking zusammengefasst, die in zahlreichen virtuellen Screening-Projekten
verwendet werden: Brooijmans, N.; Kuntz, I. D. "Molecular recognition and docking algorithms", Annu Rev Biophys
Biomol Struct 2003, 32, 335–373; algorithms", Annu Rev Biophys
Biomol Struct 2003, 32, 335–373;
Bursulaya, B. D.; Totrov, M.; Abagyan, R.; Brooks, C. L., "3rd Comparative study
of several algorithms for flexible ligand docking", J Comput Aided
Mol Des 2003, 17, 755–763;
Kellenberger, E.; Rodrigo, J.; Muller, P.; Rognan, D. "Comparative evaluation
of eight docking tools for docking and virtual screening accuracy", Proteins 2004,
57, 225–242;
und Kitchen, D. B.; Decornez, H.; Furr, J. R.; Bajorath, J. "Docking and scoring
in virtual screening for drug discovery: methods and applications", Nat Rev Drug Discov
2004, 3, 935–949.
Die Mehrzahl dieser Ansätze
gehören
ebenfalls zu den sequentiellen Strategien.
-
Zu
den hierarchischen Strategien zählt
die Gruppierung der Verbindungen einer Bibliothek in Cluster mit ähnlichen
Verbindungen. Dem Screening-Verfahren wird dann nur ein Repräsentant
aller Cluster unterzogen. Zeigt dabei ein Repräsentant hohes Potential, werden
alle Verbindungen des Clusters dem Verfahren unterzogen.
-
Cluster-Verfahren
und Klassifizierungs-Verfahren sind alternative Verfahren zur Gruppierung von
Verbindungen. Während
Cluster-Verfahren einen paarweisen Vergleich aller Verbindungen
mit nachfolgender Aggregation von ähnlichen Verbindungen beinhalten,
nutzen Klassifizierungs-Verfahren physikochemische, topologische
oder strukturelle Eigenschaften, um Verbindungen in vor-spezifizierte
Kategorien einzuteilen (siehe van Drie, J. H.; Lajiness, M. S. "Approaches to virtual
library design",
Drug Discov Today 1998, 3, 274–283).
-
In:
Joseph-McCarthy, D.; Thomas IV, B. E.; Belmarsh, M.; Moustakas,
D.; Alvarez, J. C. "Pharmacophore-Based
Molecular Docking to Account for Ligand Flexibility", Proteins 2003,
51, 172–188
und Su, A. I.; Lorber, D. M.; Weston, G. S.; Baase, W. A.; Matthews,
B. W. et al. "Docking
molecules by families to increase the diversity of hits in database
screens: computational strategy and experimental evaluation", Proteins 2001,
42, 279–293,
wird eine weitere hierarchische Strategie beschrieben. Zunächst werden
die Verbindungen einer Bibliothek vorverarbeitet und in Gruppen
mit ähnlichen
Verbindungen eingeteilt. Dann wird ein Repräsentant jedes Clusters einem Docking-Verfahren
unterzogen. Bekommt dabei ein Repräsentant eine gute Bewertung,
werden alle Verbindungen des Clusters gedockt.
-
Floriano,
W. B.; Vaidehi, N.; Zamanakos, G.; Goddard III, W. A. "HierVLS, Hierarchical
Docking Protocol for Virtual Ligand Screening of Large-Molecule
Databases", J Med
Chem 2004, 47, 56–71,
beschreiben eine Filter-basierte Screening-Strategie. Die für die ersten Schritte verwendeten
Verfahren sind dabei sehr schnell, jedoch relativ ungenau. Die Verbindungen,
die den ersten Satz von Filtern passieren, werden dann genaueren,
jedoch langsameren Docking-Verfahren unterworfen.
-
In
der
EP 0 633 534 wird
ein sequentielles Docking-Verfahren beschrieben, bei dem im Wesentlichen
auf der Grundlage eines Vergleichs zwischen den Abständen von
Wasserstoffbindungen an der Verbindung und von Wasserstoffbindungen
von Pseudo-Atomen an der Bindungsstelle eines Rezeptors die Verbindungen
an der Bindungsstelle des Rezeptors angeordnet werden.
-
In
der
US 6,727,100 wird
im Wesentlichen der Ansatz einer Abbildung von Verbindungen auf
einem zweidimensionalen Gitter mittels eines Molekül-Deskriptors
in der Weise verfolgt, dass der Abstand der Gitterpunkte den Grad
der Ähnlichkeit
der entsprechenden Verbindungen darstellt. Weiterhin wird jedem
Gitterpunkt eine fiktive Affinität
zuordnet, eine dreidimensionale Fläche über den fiktiven Affinitäten jedes
Gitterpunktes gebildet, und es werden dann auf der Grundlage der
Flächen
die Verbindungen mit hohen fiktiven Affinitäten ausgewählt.
-
Ein
wesentlicher Nachteil der oben erläuterten Verfahren besteht darin,
dass sämtliche
Verbindungen (bzw. die Repräsentanten
aller Cluster) nacheinander verarbeitet werden müssen und somit eine linear
mit der Anzahl von Verbindungen in der Bibliothek ansteigende Laufzeit
benötigen.
-
Darüberhinaus
stellen die meisten Molekül-Beschreibungen
strukturelle Eigenschaften, insbesondere Atomkoordinaten und Vorzugsrichtungen in
Bezug auf bestimmte nicht-kovalente Bindungen zwischen Verbindung
und dem Target (so ge nannte intramolekulare Wechselwirkungen, hier
z. B. Wasserstoffbrücken
oder Interaktionen der Pi-Orbitale) dar. Eine solche Darstellung
erfordert rechnerisch sehr aufwändige
Rotationen und Translationen einer Verbindung innerhalb der Bindungsstelle,
um das strukturelle bzw. richtungsabhängige Zusammenpassen mit dem
Rezeptor zu bewerten.
-
Eine
Aufgabe, die der Erfindung zu Grunde liegt, besteht deshalb darin,
ein struktur-basierendes virtuelles Screening-Verfahren zu schaffen,
dessen mittlere Laufzeit pro Verbindung deutlich geringer ist als
bei den bekannten Verfahren.
-
Gelöst wird
diese Aufgabe mit einem Screening-Verfahren mit den Merkmalen des
Anspruchs 1.
-
Erfindungsgemäß wird demnach
ein Datenbank-gestütztes
virtuelles Screening-Verfahren
geschaffen, mit dem die Verbindungen in einer Bibliothek einer Datenbank
auf der Grundlage ihrer physikochemischen und/oder strukturellen
Eigenschaften in einem Katalog kategorisiert und sortiert werden. Weiterhin
werden die korrespondierenden Eigenschaften eines Targets verwendet,
um nach passenden Verbindungen in der Datenbank zu suchen.
-
Ein
besonderer Vorteil dieses Verfahrens besteht darin, dass die Verbindungen
in den Teilen des Katalogs, die nicht zu den Target-Eigenschaften
passen, überhaupt
nicht mit dem Target verglichen und somit auch nicht verarbeitet
werden müssen.
Dies hat zur Folge, dass die Laufzeit des erfindungsgemäßen Verfahrens
wesentlich verkürzt
werden kann. Im Vergleich dazu müssen
bei den sequentiellen und Filter-basierten
Strategien alle Verbindungen und selbst bei den hierarchischen Strategien
Repräsentanten aller
Cluster von Verbindungen verarbeitet werden.
-
Ein
weiterer Vorteil des erfindungsgemäßen Verfahrens besteht in der
verwendeten Beschreibungsform für
Verbindungen und Target. Sowohl der Molekül-Deskriptor als auch der Target-Deskriptor beschreiben
physikochemische und strukturelle Eigenschaften in einer Form, in
der die Komplementarität
einer Verbindung mit dem Target bewertet werden kann, ohne dass
eine Optimierung von Rotation, Translation und Konformation der
Verbindung erforderlich ist. Dieser Vorteil ermöglicht den Einsatz relationaler
Datenbank-Technologien, mit denen die Effizienz und Skalierbarkeit
des virtuellen Screenings erheblich gesteigert werden kann.
-
Ein
bedeutender Vorteil des erfindungsgemäßen Verfahrens besteht schließlich auch
darin, dass es nicht nur dann anwendbar ist, wenn die dreidimensionale
Struktur der Bindungsstelle bekannt ist, sondern in einfacher Weise
erweitert werden kann, so dass es auch anwendbar ist, wenn das Target
auf Basis von biologisch aktiven Verbindungen definiert ist.
-
Die
Unteransprüche
haben vorteilhafte Weiterbildungen des Verfahrens zum Inhalt.
-
Zur
Durchführung
dieses Verfahrens wird vorzugsweise mindestens ein Deskriptor definiert, der
sowohl zur Darstellung der physikochemischen und strukturellen Eigenschaften
von flexiblen Verbindungen (Molekül-Deskriptor), als auch zur
Formulierung der Eigenschaften des Targets (Target-Deskriptor) in
einem Format geeignet ist, das zur Datenbank-Abfrage verwendet werden
kann.
-
Eine
wesentliche Eigenschaft des Deskriptors besteht darin, dass er sowohl
die strukturellen Eigenschaften der Verbindungen als auch des Targets unabhängig von
einem (globalen) Koordinatensystem beschreibt. Auf diese Weise können die
physikochemischen und strukturellen Eigenschaften von Verbindungen
und Target ohne Rotation und Translation direkt miteinander verglichen
werden.
-
Vorzugsweise
wird darüberhinaus
durch die Aufnahme von richtungsabhängigen Bedingungen die Selektivität des Target-Deskriptors
erhöht
und damit die Anzahl von falschen Treffern beim Nachschlagen im
Index der Molekül-Deskriptoren
vermindert.
-
Diese
Merkmale führen
insgesamt dazu, dass die Laufzeit des struktur-basierenden virtuellen Screening-Verfahrens
um einige Größenordnungen reduziert
und gleich zeitig die Genauigkeit auf einem mit anderen Ansätzen vergleichbarem
Wert gehalten werden kann.
-
Weitere
Einzelheiten, Merkmale und Vorteile der Erfindung ergeben sich aus
der folgenden Beschreibung von bevorzugten und beispielhaften Ausführungsformen
der Erfindung anhand der Zeichnung. Es zeigt:
-
1 eine
schematische Darstellung wesentlicher Schritte des Verfahrens;
-
2 eine
schematische Darstellung der Berechnung von Molekül-Deskriptoren
für Verbindungen;
-
3 eine
schematische Darstellungen der Berechnung von Target-Deskriptoren
für das
Target (hier in Form einer Bindestelle); und
-
4 eine
schematische Darstellung einer Datenbank-Struktur zur Durchführung des
Verfahrens.
-
Die
nachfolgend erläuterte
Ausführungsform beruht
auf einer Target-orientierten und Katalog-basierten Screening-Strategie.
Damit werden die physikochemischen und strukturellen Eigenschaften
des Targets analysiert und durch einen oder eine Mehrzahl von Target-Deskriptoren
beschrieben, mit denen Eigenschaften und Bedingungen in verschiedenen geometrischen
Bereichen des Targets kodiert sind. Mit dem erfindungsgemäßen Verfahren
wird jeder dieser Target-Deskriptoren verwendet, um in der Datenbank
bzw. dem Katalog nach Verbindungen zu suchen, die mit den Eigenschaften
und Bedingungen des Target-Deskriptors übereinstimmen. Die Verbindungen
sind dabei in einem Katalog entsprechend ihrer physikochemischen
und/oder geometrischen und/oder strukturellen Eigenschaften so angeordnet bzw.
kategorisiert, dass nur solche Verbindungen bei einer Suche bearbeitet
werden müssen,
die sich in passenden Kategorien des Katalogs befinden.
-
Bevorzugt
werden indizierbare Deskriptoren verwendet, die auch richtungsabhängige Bedingungen
oder Vorzugsrichtungen für
intermolekulare Wechselwirkungen beinhalten. Insbesondere wird ein
Deskriptor verwendet, mit dem physikochemische und/oder geometrische
und/oder strukturelle Eigenschaften von Triplets von an intermolekularen Wechselwirkungen
beteiligten Atomen oder Atom-Gruppen (funktionalen Gruppen) sowie
die Molekülform
in der Umgebung der beteiligten Atome sowohl der Verbindung als
auch des Targets kodiert sind. In dem indizierbaren Deskriptor sind
somit zusätzlich
zu funktionalen Gruppen, deren Typen (basierend auf einer üblichen
Kategorisierung der Wechselwirkungen), Abständen zwischen Paaren von funktionalen
Gruppen auch deren Vorzugsrichtungen kodiert. Indizierbar bedeutet
in diesem Zusammenhang, dass die Deskriptoren nach mehreren der
oben genannten Eigenschaftswerte sortiert werden können, so
dass sie für
effiziente Suchverfahren mit standardisierten Index-Strukturen wie
B-Bäume
verwaltet werden können.
-
Erfindungsgemäß werden
die Vorzugsrichtungen einer funktionalen Gruppe in einem Triplet von
funktionalen Gruppen durch Zentrierung eines lokalen Koordinatensystems
in der funktionalen Gruppe und Ausrichtung des Koordinatensystems
in Bezug auf die anderen funktionalen Gruppen des Triplets beschrieben.
Die Vorzugsrichtung einer funktionalen Gruppe wird dabei relativ
zum Koordinatensystem, beispielsweise durch Euler-Winkel in Bezug
auf die Achsen des lokalen Koordinatensystems beschrieben.
-
Ein
Punkt, der zu einer wesentlichen Beschleunigung des erfindungsgemäßen Verfahrens beiträgt, ist
die Anwendung einer relationalen Datenbank-Technologie zum Speichern
und Nachschlagen bzw. Suchen der Molekül-Deskriptoren. Bevorzugt werden
deshalb alle Daten der Verbindungen in den Tabellen eines relationalen
Datenbank-Systems gespeichert. Weiterhin werden zum Nachschlagen
bzw. Suchen von Molekül-Deskriptoren,
die die durch das Target definierten Abfragebedingungen (formuliert durch
einen Satz von Target-Deskriptoren) erfüllen, Datenbank-Abfragen auf der
Basis von Standard-Indizes für
relationale Datenbanken verwendet.
-
Während die
Typen der funktionalen Gruppen des Targets und einer passenden Verbindung kompatibel
zueinander sein müssen
(z.B. passen Donatorgruppen von Wasserstoffbindungen nur mit Akzeptorgruppen
von Wasserstoffbindungen zu sammen), werden erfindungsgemäß Bereiche
für die
Seitenlängen
von Dreiecken und Euler-Winkeln definiert, innerhalb derer die Eigenschaften
eines Molekül-Deskriptors als kompatibel
zu den Bedingungen eines Target-Deskriptors angesehen werden. Folglich
muss die Indexierung der relationalen Datenbank Bereichsabfragen
unterstützen.
-
Im
Folgenden soll zunächst
der Gesamt-Ablauf einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens
anhand der 1 erläutert werden. Dabei wird davon
ausgegangen, dass die dreidimensionale Struktur der Bindungsstelle
des Targets verfügbar
ist. Das erfindungsgemäße Verfahren
kann jedoch in einfacher Weise auch verwendet werden, wenn das Target
auf Basis von biologisch aktiven Verbindungen definiert ist.
-
In
einem ersten, zu Beginn des Verfahrens einmal durchzuführenden
Vor-Verarbeitungsschritt (1)
werden die Verbindungen V zunächst
in kleinere Bruchstücke
oder Fragmente zerlegt, und alle Fragmente werden bezüglich ihrer
Konformationen untersucht bzw. abgetastet. Dabei werden funktionale Gruppen
in den Verbindungen und den Fragmenten identifiziert, die als Wechselwirkungszentren
der Verbindungen (CIACs – compound
interaction centers) bzw. Wechselwirkungszentren der Fragmente (FIACs – fragment
interaction centers) bezeichnet werden. Wahlweise kann die Fragmentierung
entfallen, so dass nur vollständige
Verbindungen in analoger Weise betrachtet werden.
-
Triplets
von solchen FIACs bilden ein Fragment-Wechselwirkungsdreieck für jedes
Fragment-Konformer. Die Fragment-Wechselwirkungsdreiecke von einem
oder mehreren möglichen
FIAC-Tripletts kodieren die physikochemischen und strukturellen
Merkmale eines Fragment-Konformers unter Verwendung des erfindungsgemäßen Molekül-Deskriptors.
-
Die
Daten der Verbindung, die Daten der Fragmente und die Molekül-Deskriptoren
der Fragment-Wechselwirkungsdreiecke werden gemäß 1 in eine
Datenbank DB für
die Verbindungen geschrieben und mit einem B-Baum organisiert, der die FIAC-Typen,
die paarweisen FIAC-Abstände
und die FIAC-Richtungen oder jedes Fragment-Wechselwirkungsdreieck
indiziert.
-
In
einem zweiten Schritt (2) werden günstige oder vorteilhafte Wechselwirkungszentren
der Positionen oder Stellen (SIACs – site interaction centers) für funktionale
Gruppen von Verbindungen an den Bindungsstellen des Rezeptors bzw.
Targets T gesucht. Triplets von solchen SIACs definieren einen Satz
von Wechselwirkungsdreiecken für
Positionen oder Stellen (die Struktur des Rezeptors wird als fest angenommen).
Die Target-Deskriptoren dieser Positions-Wechselwirkungsdreiecke
kodieren die erforderlichen FIAC-Typen, die paarweisen FIAC-Abstände und
die FIAC-Wechselwirkungsrichtungen für ein Fragment, dessen Wechselwirkungszentren
mit den SIACs der Positions- oder Stellen-Wechselwirkungsdreiecke
zu überlagern
sind. In diesem Stadium enthält
die Datenbank DB der Verbindungen eine Tabelle mit den Bedingungen
der Positions- oder Stellen-Wechselwirkungsdreiecke des Rezeptors
T (Satz von Target-Deskriptoren) und eine Tabelle mit Fragment-Wechselwirkungsdreiecken
der Verbindungen V (Katalog von Molekül-Deskriptoren).
-
In
einem dritten Schritt (3) werden alle Positions- oder Stellen-Wechselwirkungsdreiecke
des Rezeptors bearbeitet und die Bedingungen jedes Dreiecks unter
Berücksichtigung
eines geeigneten Toleranzbereiches in positiver und negativer Richtung
in eine Indexbereich-Abfrage der Tabelle der Fragment-Wechselwirkungsdreiecke
der Verbindungen V übersetzt.
-
Mit
jedem Deskriptor werden auch Informationen über die sterischen Bedingungen
um das Wechselwirkungsdreieck gespeichert. Dies gilt sowohl für Wechselwirkungsdreiecke
der Verbindungen als auch für
Wechselwirkungsdreiecke des Targets. Die sterischen Informationen
werden verwendet, um schon während
der Datenbankabfrage grob zu überprüfen, ob
das Fragment der Verbindung mit der Bindungsstelle des Rezeptors überlappt.
Auf diese Weise wird ein initialer Test auf Überlappung zwischen Verbindung
und Target für
jeden Treffer der Abfrage durchgeführt.
-
Auf
Grund der hinzugefügten
Toleranzbereiche unterscheiden sich die Qualitäten dieser Treffer (in 1 in
Form einer Trefferliste TrL angedeutet) bei den Positions- und den
Fragment-Wechselwirkungsdreiecken. Aus diesem Grund wird die Qualität jedes
Treffers der Abfrage mit Hilfe einer Bewertungsfunktion bewertet,
und es werden nur diejenigen Treffer gespeichert, die um einen bestimmten Betrag
oberhalb eines durch einen Benutzer definierten Schwellwertes liegen.
-
In
einem vierten Schritt (4) übersetzt
der Algorithmus dann jeden in der Trefferliste TrL gespeicherten
Treffer der Abfrage in eine Platzierung des zu Grunde liegenden
Fragment-Konformers oder vollständigen
Moleküls
an der Bindungsstelle des Rezeptors. Die Überlagerung des Positions-Wechselwirkungsdreiecks
mit den drei FIACs der Fragment-Wechselwirkungsdreiecke definiert
dabei die Rotationen und Translationen des Fragment-Konformers.
-
Anschließend wird
in einem fünften
Schritt (5) eine genaue Überprüfung des
sterischen Fits für jede
Platzierung jedes Fragment-Konformers in der Bindestelle des Rezeptors
durchgeführt
("Überlappungstest"), und es wird die
Bindungsaffinität
für jede Platzierung
abgeschätzt
und jede Platzierung mit einer geringen Affinität verworfen.
-
Nachdem
die Fragmente aller Abfrage-Treffer für alle Positions- oder Stellen-Wechselwirkungsdreiecke
platziert worden sind, wird in einem sechsten Schritt (6) bewertet,
welche Fragmente zu welchen Verbindungen gehören. Außerdem werden ggf. Kombinationen
von Platzierungen von verschiedenen Fragmenten der gleichen Verbindung
identifiziert, die mit einer Verbindungs-Konformation realisiert
werden können.
Dies entfällt
jedoch, wenn nur vollständige
Moleküle
in der Datenbank gespeichert sind.
-
Nun
wird schließlich
in einem siebten Schritt (7) das Maß der Affinität der platzierten
und bewerteten Fragmente verwendet, um eine Rangordnung der Verbindungen
aufzustellen, die mindestens eine gültige Platzierung aufweisen.
-
Im
Folgenden soll nun anhand der 2 die Berechnung
eines Molekül-Deskriptors für Fragment-Wechselwirkungsdreiecke
der Verbindungen V beschrieben werden. Der Molekül-Deskriptor kodiert die Typen
der Wechselwirkungszentren, der Abstände und der Wechselwirkungsrichtungen
eines Dreiecks der FIACs sowie zusätzlich Informationen über die
sterischen Gegebenheiten des das Dreieck umgebenden Fragmentes.
-
Gemäß 2(A) spannen drei FIACs (FIAC1, FIAC2,
FIAC3) eines Fragmentes ein Wechselwirkungsdreieck WD auf. In der
Darstellung ist die Haupt-Wechselwirkungsrichtung
des FIACs 2 mit HWR und der Mittelpunkt des Wechselwirkungsdreiecks
mit M bezeichnet.
-
Gemäß 2(B) sortiert dann ein kanonischer Anordnungs-Algorithmus
die drei FIACs (fiac0, fiac1,
fiac2) in der Weise, dass die Typen der
FIACs (t0, t1, t2) und die Längen ihrer benachbarten Dreiecksseiten
(d0,1, d1,2, d2,0) in einer lexikographischen Reihenfolge
angeordnet sind: (t0, d0,1) ≤L (t1, d1,2) ≤L (t2, d2,0).
-
Die
Ecken des Dreiecks (die FIACs) beschreiben eine Ebene, in der das
Dreieck liegt. Anhand der Sortierung der drei FIACs kann eindeutig der
Raum oberhalb und der Raum unterhalb der Dreiecksebene unterschieden
werden. Um den Ort der sterischen Masse des Fragmentes zu beschreiben, werden
Kopien der Dreiecksseiten innerhalb der Ebene nach außen (weg
vom Dreiecksmittelpunkt) verschoben und dann nach oben und unten
versetzt. Damit ergeben sich insgesamt drei Linien oberhalb (t-bulkline0,1, t-bulkline1,2,
t-bultline2,0) und drei Linien unterhalb
des Dreiecks (b-bulkline0,1, b-bulkline1,2, b-bulkline2,0). In 2(B) sind
nur die Linien oberhalb des Dreiecks dargestellt.
-
Jede
dieser Linien wird in eine konstante Zahl (hier: neun) diskreter,
jeweils gleich langer Segmente aufgeteilt; jedes Segment jeder Linie
wird im Deskriptor durch ein Bit repräsentiert. Wird ein Segment
vom Fragment ganz oder teilweise durch sterische Masse überdeckt,
wird das Bit im Deskriptor gesetzt, sonst ist es nicht gesetzt.
-
Für den Bereich
oberhalb und für
den Bereich unterhalb des Dreiecks werden dazu vorzugsweise jeweils
27 Bit verwendet.
-
Somit
kodiert eine Bitfolge also auf dieser Basis das Vorhandensein (z.B.
das Bit des Liniensegmentes ist gesetzt) oder das Fehlen (das Bit
ist nicht gesetzt) sterischer Masse der Verbindung entlang jeder
Linie. Alternativ dazu können
auch Entfernungen vom Koordinatenursprung bis zur Moleküloberfläche in verschiedenen
Richtungen gemessen werden.
-
Wie
in 2(B) dargestellt ist, werden oberhalb
und unterhalb des Dreiecks jeweils drei weitere Bits genutzt, um
das Vorhandensein sterischer Masse an den (in gleicher Weise nach
oben und unten verschobenen) Eckpunkten des Dreiecks (t-bulkfiac0, t-bulkfiac1, t-bulkfiac2 bzw.
b-bulkfiac0, b-bulkfiac1, b-bulkfiac2) zu kodieren. Des Weiteren wird jeweils
ein Bit verwendet, um das Vorhandensein sterischer Masse oberhalb
und unterhalb des Dreiecksmittelpunkts zu kodieren (t-bulkcen bzw. b-bulkcen).
-
Als
nächstes
wird zur Beschreibung der Richtung der Wechselwirkung eines FIAC
gemäß 2(C) das Dreieck in einem lokalen Koordinatensystem
in der Weise angeordnet, dass das FIAC mit dem Ursprung zusammenfällt, dass
der Mittelpunkt des Dreiecks auf der negativen x-Achse liegt, und dass
das in der kanonischen Ordnung folgende FIAC in der x-z-Ebene mit
einem negativen x-Wert liegt.
-
Die
Richtung der Wechselwirkung kann nun gemäß den 2(D) bis 2(F) mit drei Euler-Winkeln beschrieben
werden:
Gemäß 2(D) repräsentiert θ den Winkel zwischen der negativen
x-Achse und der auf die x-z-Ebene projizierten Richtung der Wechselwirkung.
-
Gemäß 2(E) stellt ϕ den Winkel zwischen
der negativen x-Achse und der auf die x-y-Ebene projizierten Richtung
der Wechselwirkung dar.
-
Schließlich bezeichnet ψ gemäß 2(F) den Winkel zwischen der positiven
z-Achse und der auf
die x-y-Ebene projizierten Richtung der Wechselwirkung.
-
Die
Erzeugung der Target-Deskriptoren der Positions- oder Stellen-Wechselwirkungsdreiecke der
SIACs der Rezeptoren erfolgt gemäß 3(A) und 3(B) in
analoger Weise, wie es oben mit Bezug auf die 2(A) und 2(B) beschrieben wurde, wobei gleiche bzw.
einander entsprechende Eckpunkte, Seiten, Linien usw. mit jeweils
gleichen bzw. einander entsprechenden Bezeichnungen versehen sind,
so dass insoweit auf eine erneute Beschreibung verzichtet werden
kann. Der Target-Deskriptor
kodiert die Typen der Wechselwirkungsrichtungen HWR eines Dreiecks
der SIACs sowie zusätzlich
Informationen über
die sterische Masse des das Dreieck umgebenden Rezeptors.
-
Dabei
definiert ein Triplet der SIACs ein Positions- oder Stellen-Wechselwirkungsdreieck,
das mit dem gleichen Deskriptor beschrieben werden kann, wie er
für die
Fragment-Wechselwirkungsdreiecke benutzt wird. Hinsichtlich der
Ermittlung der Richtung der Wechselwirkung HWR gelten die 2(C) bis 2(F) entsprechend.
-
Wie
bereits erläutert
wurde, wird das erfindungsgemäße Verfahren
vorzugsweise mit Hilfe einer relationalen Datenbank ausgeführt. Die
Daten der Verbindungen und der Fragmente werden dabei in Tabellen
der Datenbank gespeichert. 4 zeigt schematisch
die Struktur einer solchen Datenbank in Form ihrer Tabellen und
deren relativer Verknüpfungen.
Mit Indexstrukturen nach dem B-Baum-Typ kann der Zugriff auf diese
Tabellen und die Abfrage der Tabellen wesentlich beschleunigt werden.
-
Zu
der größten und
am häufigsten
abgefragten Tabelle "Geometrien
der Fragment-Wechselwirkungsdreiecke" (Tabelle N) sind
alle Attribute der Fragment-Dreiecke mit Ausnahme der Bitfolgen
der sterischen Masse in dem B-Baum-Index enthalten.
-
Im
Einzelnen beinhalten die Tabellen in 4 folgende
Daten:
- A
- die Verbindungen,
- B
- die Wechselwirkungszentren
der Verbindungen (CIACs),
- C
- die CIAC-Abstände,
- D
- die Verweise auf enthaltene
Fragmente einer Verbindung,
- E
- die Atom-Bezugskoordinaten
des aktiven Fragmentkonformers für
eine spezielle Verbindung,
- F
- die Atome eines Fragments,
- G
- die Atomkoordinaten
aller Fragmentkonformere,
- H
- die Fragmente,
- K
- die Verweise von CIACs
auf die entsprechenden FIACs der enthaltenen Fragmente,
- L
- die FIACs,
- M
- die FIAC Koordinaten
aller Fragmentkonformere,
- N
- die Geometrien der
Fragment-Wechselwirkungsdreiecke der FIACs und
- P
- die Geometrien der
Positions- oder Stellen-Wechselwirkungsdreiecke der SIACs.
-
Das
Verfahren wurde mit verschiedenen virtuellen Screening-Versuchen
gegen neun Target-Proteine mit pharmazeutischer Relevanz getestet.
Die Ergebnisse wurden mit den Ergebnissen eines bekannten Molekül-Docking-Programms
(FlexX) verglichen.
-
Dabei
zeigte sich, dass in sechs von elf Fällen das erfindungsgemäße Verfahren ähnliche
oder geringfügig
bessere Leistungen als das FlexX-Programm zeigte, während es
in drei Fällen
schlechter war als das bekannte FlexX-Programm. Die mittlere Laufzeit
pro Verbindung mit dem erfindungsgemäßen Screening-Verfahren konnte
um einen Faktor von zwischen 10 und 60 im Vergleich zu dem FlexX-Programm reduziert
werden. Aus der Literatur kann entnommen werden, dass FlexX zu den
schnellsten, heute verfügbaren
Docking-Programmen gehört. Weiterhin
konnte gezeigt werden, dass die mittlere Laufzeit pro Verbindung
mit dem erfindungsgemäßen Verfahrens
mit zunehmender Größe der Bibliothek, d.
h. mit steigender Anzahl der Verbindungen, abnimmt.