DE69125399T2 - Vergleichende molekulare feldanalyse - Google Patents
Vergleichende molekulare feldanalyseInfo
- Publication number
- DE69125399T2 DE69125399T2 DE69125399T DE69125399T DE69125399T2 DE 69125399 T2 DE69125399 T2 DE 69125399T2 DE 69125399 T DE69125399 T DE 69125399T DE 69125399 T DE69125399 T DE 69125399T DE 69125399 T2 DE69125399 T2 DE 69125399T2
- Authority
- DE
- Germany
- Prior art keywords
- molecule
- molecular
- equations
- equation
- molecules
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004458 analytical method Methods 0.000 title claims description 19
- 230000000052 comparative effect Effects 0.000 title description 4
- 238000000034 method Methods 0.000 claims description 95
- 238000004617 QSAR study Methods 0.000 claims description 73
- 230000003993 interaction Effects 0.000 claims description 57
- 238000012360 testing method Methods 0.000 claims description 53
- 230000027455 binding Effects 0.000 claims description 33
- 239000000523 sample Substances 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 23
- 230000000694 effects Effects 0.000 claims description 22
- 230000009881 electrostatic interaction Effects 0.000 claims description 16
- 239000000126 substance Substances 0.000 claims description 14
- 238000010998 test method Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 238000004215 lattice model Methods 0.000 claims 2
- 239000000243 solution Substances 0.000 description 45
- 125000004429 atom Chemical group 0.000 description 41
- 230000004071 biological effect Effects 0.000 description 28
- 239000000758 substrate Substances 0.000 description 26
- 102000005962 receptors Human genes 0.000 description 24
- 108020003175 receptors Proteins 0.000 description 24
- 102000004169 proteins and genes Human genes 0.000 description 14
- 108090000623 proteins and genes Proteins 0.000 description 14
- 238000013459 approach Methods 0.000 description 13
- 150000001875 compounds Chemical class 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 239000003446 ligand Substances 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 9
- 230000002452 interceptive effect Effects 0.000 description 8
- 238000000302 molecular modelling Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 238000009877 rendering Methods 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 239000013078 crystal Substances 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000011835 investigation Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000427 antigen Substances 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 230000009149 molecular binding Effects 0.000 description 3
- 230000004001 molecular interaction Effects 0.000 description 3
- 238000005381 potential energy Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 3
- 238000002424 x-ray crystallography Methods 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008846 dynamic interplay Effects 0.000 description 2
- 230000005686 electrostatic field Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000009878 intermolecular interaction Effects 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 238000000324 molecular mechanic Methods 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 238000012066 statistical methodology Methods 0.000 description 2
- KZMAWJRXKGLWGS-UHFFFAOYSA-N 2-chloro-n-[4-(4-methoxyphenyl)-1,3-thiazol-2-yl]-n-(3-methoxypropyl)acetamide Chemical compound S1C(N(C(=O)CCl)CCCOC)=NC(C=2C=CC(OC)=CC=2)=C1 KZMAWJRXKGLWGS-UHFFFAOYSA-N 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 101100001764 Oryza sativa subsp. japonica ANS2 gene Proteins 0.000 description 1
- 230000010799 Receptor Interactions Effects 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000004791 biological behavior Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 229940126601 medicinal product Drugs 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004776 molecular orbital Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 238000005556 structure-activity relationship Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Analytical Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
- Die Erfindung bezieht sich auf ein Verfahren zum dreidimensionalen Vergleichen der sterischen und elektrostatischen Felder, die von Molekülen mit ähnlichen Bindungs-Affinitäten zu einem gemeinschaftlichen Molekül ausgehen, und zum Gewinnen der wichtigsten, den beobachteten Unterschieden der Bindungs-Affinitäten unter diesen Molekülen entsprechenden Topologie-Merkmale durch Kreuz- Korrelation der Felder. Das Verfahren ist insbesondere nützlich für das Verständnis von Struktur- bzw. Funktions-Zusammenhängen in der Biochemie.
- In den letzten drei Jahrzehnten hat die moderne Biologie die Bedeutung dreidimensionaler Konformationen bzw. Formen biologischer Moleküle hinsichtlich deren beobachteter Funktion und Aktivität erkannt. Beginnend mit der ersten Identifizierung von Alpha-Helix-Strukturen bei Proteinen über die Erkennung der DNA-Struktur als wasserstoffgebundene verdrillte Doppelhelix bis zu neueren Röntgen-Kristallstruktur-Untersuchungen von Enzym-Substrat-Komplexen hat man die Rolle der Gestalt als bestimmendem Faktor immer besser einzuschätzen gelernt. Tatsächlich weiß man jetzt, daß eine richtige Beschreibung und Erkenntnis der Funktionsweise der meisten biologischen Makromoleküle von der Kenntnis ihrer dreidimensionalen Gestalt abhängt. Oft wird die Lage mit einem dreidimensionalen Mosaikspiel (Puzzle) verglichen, dessen zueinander passende Teile in spezifischen Mustern dreidimensional verrasten. Es ist jetzt anerkannt, daß die Bindung eines Molekularsubstrats an ein Enzym von der Fähigkeit des Substrats bestimmt wird, eine Kerbe/Nut/Höhlung im Enzym derart auszufüllen, daß das Substrat sowohl mechanisch als auch chemisch in korrekter dreidimensionaler und termodynamischer Orientierung stabilisiert wird, um die katalytische Reaktion zu unterstützen. Ähnlich hat man schon lange festgestellt, daß die ganz spezifische Bindung von Antikörpern an Antigene dadurch zustandekommt, daß die speziellen Oberflächen-Formmerkmale des Antigenmoleküls vom Antikörper erkannt werden.
- Nicht nur für Basis-Erkenntnisse in der Enzymologie, Immunologie und Biochemie ist das Verständnis der dreidimensionalen Puzzles wichtig; vielmehr sind solche Untersuchungen auch für Pharmazeutik-Forscher von großem Interesse. Die meisten Wirkungen von Heilmitteln entstehen durch die Bindung eines Medikaments an ein Empfängermolekül (Rezeptor). In dem Maße, wie die Natur der Bindung besser verstanden wird, sollte es möglich sein, Arzneimittel zu schaffen, die an ihren Empfängermolekülen mit größerer Genauigkeit und Wirksamkeit andocken, als das selbst natürlich vorkommende Stoffe tun. Diese Therapiemittel- Suche ist vor allem in der Krebsforschung bedeutsam, wo generalisierte Nebenwirkungen vieler Medikamente auszuschließen und spezielle Wechselwirkungen herbeizuführen sind.
- Die Anerkennung der Wichtigkeit der dreidimensionalen Stereo-Konformation von Biomolekülen ging einher mit der Erkenntnis, wie schwierig zu verstehen ist, welchen Zusammenhang die Konformation von Molekülen mit deren Aktivität hat. Zur Zeit ist die Röntgen-Kristallstruktur-Untersuchung das einzige bekannte Verfahren, um die dreidimensionale Gestalt irgendeines Biomoleküls genau zu bestimmen. Wenn auch die Zahl der Biomoleküle, deren Struktur kristallographisch mit Erfolg entschlüsselt wurde, rasch ansteigt, ist die Gesamtzahl doch recht klein; noch seltener ist die Untersuchung von Kristallformen zusammen mit ihren gebundenen Substraten bzw. Liganden. Bei den wenigen Liganden-Biomolekül-Kombinationen, die mittels Röntgen-Kristallstruktur-Untersuchungen erfolgreich analysiert wurden, bleibt die Frage offen, ob der Komplex in Lösung eine andere Konformations-Kombination hätte als in dem für die Analyse benutzten kristallinen Zustand; allerdings deuten die Befunde darauf, daß kein großer Unterschied besteht.
- Man sieht, daß die Untersuchung der dreidimensionalen Konformation bzw. Form von Molekülen eine der Kernfragen in der modernen Molekularbiologie und Biophysik ist. In den letzten Jahren sind keine grundlegenden Fortschritte in der verfügbaren Meßtechnik hinzugekommen, abgesehen vielleicht von der in absehbarer Zukunft bevorstehenden Einführung kohärenter Röntgen-Laser, welche die dreidimensionale Abbildung biologischer Makromoleküle stark erleichtern können. Auch jüngere Fortschritte bei der Proteinsequenz-Bestimmung entweder durch direkte Sequenzanalyse der Proteine oder durch Sequenzanalyse der DNA-Molekül-Vorstufen waren für die Aufklärung der dreidimensionalen Strukturen wenig hilfreich, weil man bald entdeckte, daß - wegen der hochgradig verfalteten Proteinstruktur - Aminosäuren-Seitenketten von ganz verschiedenen Abschnitten eines Proteins zur Konformation des Rezeptors bzw. der Bindungsstelle beitragen. Ähnliche Betrachtungen gelten bezüglich der Antikörperbildung Erst vor einiger Zeit wurde auf der Grundlage der bekannten Aminosäuren-Sequenz eines Proteins ein Vorschlag für das Verständnis der Einleitung von Alpha-Helices gemacht, eventuell die einfachste Tertiär-Protein-Struktur (siehe L. G. Presta / G. D. Rose, Science 1988, 240, 1632).
- In Anbetracht der schwierigen und zeitaufwendigen Röntgen-Kristallstruktur- Untersuchungen von Biomolekülen hat man in der Forschung alternative - wenn auch weniger genaue - Wege zur Gewinnung von informationen über die stereochemische Molekülbindung gesucht. Experimental-Chemiker wandten einen Auslegungs-Ansatz chemischer Grundregeln an, um die wahrscheinlichen Bindungs-Stellen von Substraten zu analysieren. Durch Untersuchung des chemischen Aufbaues verschiedener Liganden, deren Bindungsfähigkeit an ein bestimmtes Protein bekannt ist, kamen Chemiker unter Stützung auf verallgemeinerte chemische und stereochemische Theorie-Ansätze zu fundierten Vermutungen, welche Teile des Substrats bzw. Liganden am wahrscheinlichsten mit der Bindung an das Protein zu tun haben können. Aufgrund dieser fundierten Vermutungen wurden neue Verbindungen mit prognostizierten Reaktionsstellen synthetisiert. Die Bindungs-Affinität der neuen Substrate zu dem gewünschten Protein wurden gemessen. Durch diese empirische Methode ist ein gewisses Maß an besserem Verständnis der stereochemischen Bindung erzielt worden, aber Versager waren viel häufiger als Erfolge. Zwar ist das Programm rational, doch geht es im Kern um Ausprobieren, das nicht zu einem systematischen Vorgehen für das Auffinden oder Konstruieren neuer Moleküle mit den gewünschten Bindungs-Affinitäten führt.
- Im Laufe der Jahre hat man versucht, das Verständnis stereochemischer Wechselwirkungen von Biomolekülen und die Entwicklung neuer Substratmoleküle quantitativer zu untermauern. Diese Arbeiten zeigen das Bestreben, Strukturunterschiede ähnlicher Substratmoleküle systematisch mit den Unterschieden ihrer beobachteten biologischen Aktivität in Verbindung zu bringen. So sucht man eine "Struktur-Aktivitäts-Beziehung" (Structure Activity Relationship, SAR) jeweils für eine gegebene Klasse von Substraten bzw. Liganden zu ermitteln. Soweit man jetzt zu einer Quantifizierung gelangt ist, nennt man diese Zusammenhänge jetzt "quantitative Struktur-Aktivitäts-Beziehung", (Quantitative Structure Activity Relationships, QSAR). Allgemein trachtet man, den durch eine QSAR formulierte Zusammenhang in einfachste Form zu bringen, nämlich in eine Linearkombination von Elementen. Der biologische Meßwert V soll durch eine Term-Reihe (A, B, C usw.) als Linearkombination ausgedrückt werden: V = A + B + C +... Die QSAR- Methode kann dazu dienen, viele Molekül-Werte bzw. -Eigenschaften in Zusammenhänge zu bringen, die irgendwie auf die Struktur hinweisen, z.B. Verteilungskoeffizienten und molares Reflexionsvermögen. Solche indirekten Formwerte sind herkömmlich bei QSAR-Untersuchungen verwendet worden, weil sich direkte Formwerte als begrifflich und rechnerisch schwierig erwiesen. Mit dem Fortschritt der Wissenschaft, und je mehr die Struktur-Unterschiede bei den QSAR-Untersuchungen im wesentlichen zu Molekülform-Unterschieden wurden, entwickelte sich das Gebiet der "dreidimensionalen quantitativen Struktur-Aktivitäts-Beziehungen" (Three-Dimensional Quantitative Structure Activity Relationships, 3D- QSAR).
- Mit der 3D-QSAR-Methode werden ausgewählte Form-Parameter und -Tests quantifiziert, um zu sehen, ob eine Korrelation zwischen diesen Parametern und einer biologischen Variablen - im allgemeinen der Bindungs-Affinität - feststellbar ist. Ein Modell für die Wechselwirkung zwischen einem Liganden und einem Rezeptor zu finden, hat sich als sehr komplexe Aufgabe erwiesen. Die Hauptschwierigkeit war dabei, den einfachen Begriff "Form" quantitativ auszudrücken. Wie so oft ist das, was für Auge und Verstand klar ersichtlich ist, quantitativ bzw. mathematisch bloß komplex beschreibbar. Während eine Form auszudrücken schon schwierig genug ist, stellt sich die Suche nach Formähnlichkeiten unter Verwendung von Formdeskriptoren - die bestenfalls unzureichend sind - als extrem schwierig heraus.
- Die allgemeine QSAR-Methodik beruht auf der Tatsache, daß es für die meisten Proteine eine Anzahl von bekannte Struktur-Unterschiede aufweisenden chemischen Verbindungen oder Substraten gibt, die sich mit verschiedenen Affinitäten an Protein binden. Der Grundgedanke ist dabei, daß es mit 3D-QSAR möglich sein sollte, Formdeskriptoren abzuleiten, die in der Anwendung auf die einzelnen Substrate die unterschiedlichen Bindungs-Affinitäten anzeigen. Ähnlich anderen QSAR-Methoden wird bei 3D-QSAR die Basis-Annahme getroffen, daß die maßgeblichen biologischen Parameter - gewöhnlich eine Bindungs-Affinität - als Linearkombination der gewichteten Beiträge der einzelnen Formdeskriptoren für die Substratmoleküle darstellbar sind. Sobald eine ganze Reihe von Substraten mit denselben Formdeskriptoren beschrieben sind, müßte es möglich sein, die Formdeskriptoren zu vergleichen bzw. zu korrelieren und die kritischen Formdeterminanten zu herauszuholen, die laut Befund den Differenzen der biologischen Aktivität zwischen den Substraten zugeordnet sind.
- Durch Kenntnis der signifikantesten Struktur- Form- Elemente des Substrats bzw. Liganden könnte man dann auf die Hauptelemente der Rezeptorstellen auf dem Protein schließen. Im Idealfall hätte man ebensoviele Vergleichs-Substrate wie Variable unter den Formdeskriptoren. Es bestünde also ein exakt lösbares System von Gleichungen, deren Anzahl gleich der Anzahl der Formdeskriptoren mit unbekannten Gewichtungskoeffizienten wäre. In der Praxis zeigte sich jedoch selbst mit vereinfachenden Annahmen rasch, daß bei der Benutzung vorhandener Formdeskriptoren zur Beschreibung der Eigenschaften einer unbekannten Form die Anzahl der Deskriptor-Variablen weit über die Anzahl vorhandener Substrate mit bekannter Bindungs-Charakteristik hinausgeht. Statt also eine exakte Lösung zu gewinnen, mußte man statistische Näherungsverfahren anwenden, um aus den numerischen Formdeskriptoren diejenigen Formelemente zu erhalten, die am besten mit der beobachteten biologischen Aktivität korrelierten. Erst seit kurzer Zeit stehen aber statistische Methoden zur Verfügung, mit denen brauchbare Information aus einem Gleichungssystem erzielbar ist, das weit mehr Variable als Gleichungen aufweist.
- Im letzten Jahrzehnt ist die Arbeit auf diesem Gebiet vorangekommen. Durch chemische Analyse von Substrat-Protein-Komplexen weiß man, daß molekulare Wechselwirkungen, die einen beobachteten biologischen Effekt erzeugen, gewöhnlich nicht kovalent sind. Man glaubt also, daß die zwischenmolekularen gerungen von Kräften bewirkt werden, die auf hydrophoben, van-der-Waals- (sterischen), Wasserstoff-Bindungs- und elektrostatischen Wechselwirkungen beruhen. Man hat versucht, auf der Grundlage dieser Eigenschaften Formdeskriptoren zusammenzusetzen, doch machen leider die ungeheuer große Anzahl von Freiheitsgraden und von großen labilen Protein-Substrat-Komplexen die Erstellung mathematischer Modelle der Komplex-Gestalt extrem schwer. Es erwies sich, daß weitere vereinfachende Kriterien und Annahmen notwendig sind. Eine solche als "Molekular-Form-Verfahren" bezeichnete Methode, die unabhängig von Simon et al. (siehe Z. Simon, I. Badilenscu, T. J. Racovitan in Theor. Biol. 1977, 66, 485; sowie Z. Simon, N. Dragomir, M. G. Planchithin, S. Holban, H. Glatt, F. Kerek in Eur. J. Med. 1980, 15, 521) und von Hopfinger (siehe A. J. Hopfinger, J. Am. Chem. Soc. 1980, 102, 7196) entwickelt wurde, vergleicht statt ortsabhängiger Differenzen Netz-Abhängigkeiten zwischen Molekülen. Das heißt, es wird eine Form-Charakteristik des Totalmoleküls berechnet, wobei alle Einzelheiten der speziellen Oberflächen-Merkmale zu einer Gesamt-Molekulareinheit verschmolzen werden. Das - im Sinne der biologischen Affinität - aktivste Molekül einer Reihe wird als Schablonen-Molekül angesehen, welches an der Rezeptorstelle im Protein optimal paßt. Daher sind Aktivitäts-Unterschiede unter den Reihen von Substratmolekülen in multipler Regressionsanalyse potentiell korreliert, wobei für jedes Molekül der Reihe drei Struktur- (oder Form-) Parameter definierbar sind. Die anfänglich in Betracht gezogenen Form-Parameter waren: 1) das gemeinsame Volumen, 2) das vom aktivsten, jedoch nicht von einem weniger aktiven Molekül eingenommene Volumen, und 3) das von einem weniger aktiven, aber nicht vom aktivsten Molekül eingenommene Volumen. Hopfinger bezeichnet diese Parameter als "gemeinsam-überlappende sterische Volumina" und deutet sie als quantitative Maße relativer Formähnlichkeit. Später hat Hopfinger (siehe A. J. Hopfinger, J. Med. Chem. 1983, 26, 900) eine neue Sorte Molekular-Formdeskriptoren entworfen, die vom Feld der potentiellen Energie eines Moleküls abgeleitet sind. Hierbei benutzt Hopfinger Potentiale der Molekularmechanik als Mittel zur Abschätzung der molekularen Potentialenergie- Felder:
- Diese Gleichung definiert das molekulare Potentialenergie-Feld Pu(R, θ, φ) an einem beliebigen Punkt (R, θ, φ) für das Molekül u; a(T)i und b(T)i sind die Anziehungs- bzw. Abstoßungs-Energiekoeffizienten von Atom i im Molekül u bei Wechselwirkung mit der Testsonde T, die als Einzelkraft-Zentrum behandelt wird; Qi und Q(T) bezeichnen die Ladungsdichte von Atom i bzw. Testsonde; ε(ri) ist ein dielektrischer Term, n die Anzahl der Atome in u und (ri) der Abstand zwischen Atom i und der Testsonde. Hopfinger gibt an, daß Paare von Felddifferenz- Deskriptoren (ΔPu] mit biologischen Parametern in einem 3D-QSAR korrelieren konnen. Zu beachten ist aber, daß dies ein Netz-Molekularform-Deskriptor ist, kein spezifisch ortsabhängiger Formdeskriptor.
- Eine zweite Methode ist das Abstandsgeometrie-Verfahren von Crippen (siehe z.B. A. Ghose, G. J. Crippen, J. Med. Chem. 1985, 28, 333). Bei dieser Methode muß der Anwender einen "Pharmakoträger" (pharmacophore) oder eine Liste der möglichen rezeptorbindenden Atome jedes Substrats bzw. Liganden mit spezifischen physikalisch-chemischen Eigenschaften beibringen. Die Kenntnis des Pharmakoträgers stammt aus den chemischen Untersuchungen der Bindungs- Eigenschaften einer gegebenen Reihe von Substrat-Molekülen. Ferner muß der Anwender eine "Bindungsstelle" beitragen, d.h. eine Gruppe von Punkten im Kartesischen Raum, die mit einem nahen Pharmakoträger-Atom in Wechselwirkung treten können, sowie das Ausmaß der Anziehung oder Abstoßung, je nach der Beschaffenheit des Atoms. Die geometrisch zulässigen Wechselwirkungen zwischen den Ligandenatomen und der Bindungsstelle sind bestimmt. Jeder Ligand kann sich frei bewegen oder Torsions-Verformungen mitmachen, und zwar in beliebiger Art, solange die Summe der Lagerstellen-Energien der Wechselwirkung mit der "Bindungsstelle" minimiert wird. Im Einklang mit Crippen, der wiederum eine Linearfunktion der Wechselwirkung voraussetzt, ist die Bindungsenergie eines bestimmten Bindungsmodus gegeben durch:
- wobei Ec die Konformationsenergie; C die durch quadratisches Programmieren zu bestimmenden Koeffizienten; i' die Art der Stelle i; ns die Anzahl der Nebennp die Anzahl der mit der Taschenstellen-Wechselwirkung korrelierenden Parameter; no die Anzahl der die Taschenstelle besetzenden Atome; Pj den j-ten physiochemischen Parameter des Atoms der Sorte tk bedeuten.
- Ein erfolgreiches 3D-QSAR liegt vor, wenn die erhaltene Summe der Wechselwirkungs-Energien genügend nahe bei den beobachteten Bindungs-Affinitäten ist. Das Ergebnis liefert sowohl eine Rezeptorkarte (mit Lage und Art der "Bindungsstellen"-Punkte) als auch eine aktive Konformation jedes Moleküls der Reihe. Bei den Methoden von Hopfinger und Grippen muß am Anfang eine fundierte Annahme zur Auswahl der aktiven Molekül-Konformation getroffen werden, bevor die Analyse ausführbar ist; Crippen muß außerdem eine dreidimensionale Momentankarte der Rezeptorstellen hypothetisch voraussetzen.
- Bei jeder quantitativen Methode der Formanalyse besteht das weitere große Problem, daß in Lösung die meisten Verbindungen als Gemisch von schnell gleichgewichtsbildenden Formen oder Konformeren vorliegen. Allgemein weiß man nicht einmal, welche der vielfältigen Konformationen eines Moleküls für seine gemessene biologische Aktivität verantwortlich ist. Wiederum muß man fundierte Annahmen treffen, um zu entscheiden, welche der vielen Molekular- Konformationen bei der 3D-QSAR-Analyse verwendet werden. Das Vorhandensein von Vielfach- Konformationen erschwert ferner die Aufgabe, die richtige Molekular-Ausrichtung zu wählen, in welcher der Vergleich der Substratmoleküle gemacht werden soll. Offensichtlich hängt die Eignung irgendeiner Formgröße für den Molekularform- Vergleich davon ab, daß bei der Erst-Festlegung der Formgröße die richtige Relativorientierung der Moleküle bestand. Würde man ein und dasselbe Molekül mit sich selbst um 90º gedreht vergleichen, ergäben sich wahrscheinlich kaum gemeinsame Strukturmerkmale. Infolgedessen benutzen einige 3D-QSAR- Methoden Ausrichtungsregeln, um zu gewährleisten, daß nur die variablen bzw. differierenden Molekülteile den größten Beitrag zum Formvergleich liefern. Es ist klar, daß das Vorhandensein von Vielfach-Konformationen eines gegebenen Moleküls diese Aufgabe noch kompliziert.
- sch beginnt sonach eine 3D-QSAR-Analyse mit vielen formabhängigen Parametern für relativ wenige Moleküle, deren biologische Aktivität - z.B. Bindungs-Affinität - bekannt ist. Das führt zu einer Reihe von linearen Beziehungen hungen, welche die Formparameter den biologischen Größen zuordnen, die viel mehr Unbekannte (Spalten) als Beziehungen (Zeilen) aufweisen. Außer in den Einschränkungsfällen von Formdeskriptoren mit übervereinfachten Annahmen gab es bis vor kurzem kein statistisches Regressions- oder Korrelations-Verfahren, das auch nur eine Spur von Hoffnung auf Lösung eines solchen Gleichungssystems bot.
- US-A-4 461 619 beschreibt ein Molekularmodell-Verfahren zur Erstellung eines körperlichen DNA-Modells. Vom Nukleotid wird ein Grundbestandteil ohne sonstige Spaltung des DNA entfernt, worauf versucht wird, den Grad der biologischen Aktivität eines Moleküls anhand des Ausmaßes vorherzusagen, in dem es in die so entstandene Höhlung paßt.
- In WO 91/04543 ist ein Verfahren zur Berechnung der Elektronendichte um ein Molekül herum beschrieben. Flächen gleicher Elektronendichte sind darstellbar. Es wird vorausgesetzt, daß die biologische Aktivität eine Funktion der sterischen und elektrostatischen Wechselwirkung ist.
- Im Kern offenbart US-A-4 473 890 eine computergestützte Fischer-Projektion mit Angabe einer Reihe von Regeln für die Beschreibung der Verbindbarkeit der Atome, die ein Molekül zusammensetzen, doch kann die eingenommene Konformation damit nicht beschrieben werden.
- Die Erfindung schafft hingegen ein computergestütztes Verfahren zum Erzeugen und Sichtbarmachen einer dreidimensionalen quantitativen Struktur-Aktivitäts- Beziehung 3D-QSAR einer Reihe von Molekülen aufgrund der Annahme, daß relevante biologische Parameter, z.B. Bindungs-Affinität, mit einer Linearkombination gewichteter Beiträge einer Anzahl von Form-Deskriptoren für jedes Molekül der Reihe korrelieren, das durch folgende Verfahrensschritte gekennzeichnet ist:
- a) Definieren von Molekülform-Deskriptoren für jedes Molekül (x) der Reihe durch Computer-Berechnung zumindest sterischer (Sx(N)) und elektrostatischer (Ex(N)) Wechselwirkungs-Energien zwischen einer mathematischen Darstellung einer Sonde und dem Molekül an es umgebenden vorbestimmten Gitterpunkten (N);
- b) Bestimmen eines repräsentativen Konformators für jedes Molekül (x) der Reihe derart, daß durch Änderung von Lage und/oder Torsionswinkel eines Konformator-Anwärters dieser sich zu mindestens einem Bezugsmolekül hin ausrichtet;
- c) Definieren einer Anzahl von Gleichungen, wobei jede Gleichung einem Molekül der Reihe entspricht und in jeder Gleichung ein gemessener biologischer Parameter (Valuex) des betreffenden Moleküls (x) gleich einer gewichteten Linearkombination der Molekülform-Deskriptoren (Sx(N), Ex(N)) gesetzt wird, wobei die Koeffizienten (bx, A&sub0;&sub0;&sub1;, A&sub0;&sub0;&sub2;, ..., AN, a001, a002, ..., aN) der gewichteten Linearkombination unbekannt sind und wobei die Anzahl von Gleichungen ein Gleichungssystem bildet, das viel mehr Unbekannte als Gleichungen aufweist;
- d) Gewinnen einer Anfangslösung für das Gleichungssystem durch Anwendung einer Teil-Fehlerquadratmethode (PLS) der mehrdimensionalen Analysis, wobei die Anfangslösung von derjenigen Gruppe von Koeffizienten gebildet wird, die einer Erfüllung jeder Gleichung am nächsten kommt;
- e) Berechnen eines Vergleichstest-Parameters (r²) zur Feststellung, wann die biologischen Parameter durch den Mittelwert aller gemessenen Werte besser abgeschätzt werden als durch die bei Anwendung der PLS-Lösung erhaltenen Werte;
- f) Beginnen einer zyklischen Vergleichstest-Prozedur, so daß
- f1) durch Ausschließen mindestens einer Gleichung aus dem Gleichungssystem und durch Wiederholung der PLS-Analysis an einem somit reduzierten Gleichungssystem eine Alternativgruppe von Gleichungskoeffizienten gefunden wird (CINTERCEPT, A001', ..., AN', A001' ..., aN'; Fig. 2);
- f2) die Alternativgruppe von Gleichungskoeffizienten dazu benutzt wird, den biologischen Parameter (V) desjenigen Moleküls vorherzusagen, das der ausgeschlossenen Gleichung entspricht;
- f3) der Vergleichstest-Parameter (r²) neu zur Feststellung berechnet wird, ob die Alternativkoeffizienten bessere Vorhersagewerte liefern;
- f4) der Vergleichstest-Zyklus ab Schritt f1) wiederholt wird, so daß wenigstens eine weitere Gleichung aus dem Gleichungssystem ausgeschlossen wird;
- g) Wiederholen des Vergleichstest-Zyklus so oft, wie ein Benutzer vorgibt, dem für gefundene Lösungs-Terme repräsentative Werte unter Anwendung von Computergrafik sichtbar dargestellt werden.
- Ferner ist erfindungsgemäß ein computergestütztes System vorgesehen zum Erzeugen und Sichtbarmachen einer dreidimensionalen quantitativen Struktur- Aktivitäts-Beziehung (3D-QSAR) einer Reihe von Molekülen aufgrund der Annahme, daß relevante biologische Parameter, z.B. Bindungs-Affinität, mit einer Linearkombination gewichteter Beiträge einer Anzahl von Form-Deskriptoren für jedes Molekül der Reihe korrelieren, das gekennzeichnet ist durch:
- a) Mittel zum Definieren von Molekülform-Deskriptoren für jedes Molekül (x) der Reihe durch Computer-Berechnung zumindest sterischer (Sx(N)) und elektrostatischer (Ex(N)) Wechselwirkungs-Energien zwischen einer mathematischen Darstellung einer Sonde und dem Molekül an es umgebenden vorbestimmten Gitterpunkten (N);
- b) Mittel zum Bestimmen eines repräsentativen Konformators für jedes Molekül (x) der Reihe derart, daß durch Änderung von Lage und/oder Torsionswinkel eines Konformator-Anwärters dieser sich zu mindestens einem Bezugsmolekül hin ausrichtet;
- c) Mittel zum Definieren einer Ahzahl von Gleichungen, wobei jede Gleichung einem Molekül der Reihe entspricht und in jeder Gleichung ein gemessener biologischer Parameter (Valuex) des betreffenden Moleküls (x) gleich einer gewichteten Linearkombination der Molekülform-Deskriptoren (Sx(N), Ex(N)) gesetzt wird, wobei die Koeffizienten (bX, A&sub0;&sub0;&sub1;, A&sub0;&sub0;&sub2;,..., AN, a&sub0;&sub0;&sub1;, a&sub0;&sub0;&sub2;, ..., aN) der gewichteten Linearkombination unbekannt sind und wobei die Anzahl von Gleichungen ein Gleichungssystem bildet, das viel mehr Unbekannte als Gleichungen aufweist;
- d) Mittel zum Gewinnen einer Anfangslösung für das Gleichungssystem durch Anwendung einer Teil-Fehlerquadratmethode (PLS) der mehrdimensionalen Analysis, wobei die Anfangslösung von derjenigen Gruppe von Koeffizienten gebildet wird, die einer Erfüllung jeder Gleichung am nächsten kommt;
- e) Mittel zum Berechnen eines Vergleichstest-Parameters (r²) zur Feststellung, wann die biologischen Parameter durch den Mittelwert aller gemessenen Werte besser abgeschätzt werden als durch die bei Anwendung der PLS- Lösung erhaltenen Werte;
- f) Mittel zum Ausführen einer zyklischen Vergleichstest-Prozedur, so daß
- f1) durch Ausschließen mindestens einer Gleichung aus dem Gleichungssystem und durch Wiederholung der PLS-Analysis an einem somit reduzierten Gleichungssystem eine Alternativgruppe von Gleichungskoeffizienten gefunden wird (CINTERCEPT, A001', ..., AN', A001', ..., aN'; Fig. 2);
- f2) die Alternativgruppe von Gleichungskoeffizienten dazu benutzt wird, den biologischen Parameter (V) desjenigen Moleküls vorherzusagen, das der ausgeschlossenen Gleichung entspricht;
- f3) der Vergleichstest-Parameter (r²) neu zur Feststellung berechnet wird, ob die Alternativkoeffizienten bessere Vorhersagewerte liefern;
- f4) der Vergleichstest-Zyklus ab Schritt f1) wiederholt wird, so daß wenigstens eine weitere Gleichung aus dem Gleichungssystem ausgeschlossen wird;
- g) Mittel zum Wiederholen des Vergleichstest-Zyklus so oft, wie ein Benutzer vorgibt, und Mittel zum für ihn sichtbaren Darstellen von für gefundene Lösungs-Terme repräsentativen Werten unter Anwendung von Computergrafik.
- Die vorliegende Erfindung schafft eine effektive Computermethodik mit sowohl interaktiven Graphiken als auch statischen Verfahren zum Korrelieren der Formen von Molekülen mit ihren biologischen Eigenschaften. Die erfindungsgemäße Methode benutzt einen neuen 3D-QSAR-Ansatz, der ein objektives und quantitatives Maß für die dreidimensionale Form-Charakteristik aller Bereiche eines Moleküls liefert und gleichzeitig sehr wenige einschränkende Annahmen erfordert. Die quantitative Beschreibung der Molekülform wird von einer Analyse der sterischen und elektrostatischen Wechselwirkung der das Molekül zusammensetzenden Atome mit einer Testsonde abgeleitet. Die resultierenden Wechselwirkungsenergien, die an allen Schnittpunkten (Knoten) eines das Molekül umgebenden dreidimensionalen Netzwerks oder Gitters berechnet werden, bilden die quantitativen Formdeskriptoren, die zusammen mit der gemessenen biologischen Aktivität des Moleküls als Zeile in eine Datentabelle eingegeben werden.
- Jede Molekül-Konformation läßt sich in ähnlicher Weise als Zeile von Gitterpunkt- Energien beschreiben, die der gleichen gemessenen biologischen Aktivität zugeordnet werden. Die Auswahl der bevorzugten Konformatoren kann entweder auf empirischer Basis oder im gewichteten Durchschnitt erfolgen, typisch als Boltzmann-Verteilung der einzelnen Konformationen. Dann wird eine Zeile der Wechselwirkungen verwendet, die für die Konformationen eines gegebenen Moleküls repräsentativ ist. Die sich ergebende 3D-QSAR-Tabelle hat typisch mehrere tausend Spalten von Gitterpunkt-Energien und eine Anzahl von Zeilen, die der Anzahl der Moleküle in der untersuchten Reihe entspricht.
- Theoretisch enthält diese Tabelle eine vollständige Beschreibung der Formunterschiede zwischen den untersuchten Molekülen, doch war früher keine statistische Methodik verfügbar, um brauchbare Information aus der Tabelle zu gewinnen. Soferne nicht entweder einschränkende Voraussetzungen über die Bindungsstellen gemacht werden, was die Spalten-Anzahl vermindert, oder Kenntnis der spezifischen Bindungsstellen einer speziellen Konformation gegeben ist, läßt sich eine unendliche Anzahl von Koeffizienten-Gruppe berechnen, welche die gleichen biologischen Parameterwerte liefern. Anfang der 1980er Jahre wurde eine statistische Methodik entwickelt, welche diese Art von mehrdimensionalen Problemen explizit löst und als Teil-Fehlerquadrat-Methode (Partial Least Squares analysis, PLS) bezeichnet wird.
- Die Software-Ausführungsbeispiele der vorliegenden Erfindung erlauben vier verschiedene Prozeduren, die zum Ausrichten der Moleküle im dreidimensionalen Gitter benutzbar sind, nämlich: 1) eine auf anderen Daten beruhende Ausrichtung nach Anwendervorgaben; 2) eine An-/Einpassungs-Routine; 3) eine Ausricht- Routine; und endlich 4) eine Field-Fit-Prozedur, welche die Differenzen der berechneten Atomfelder zwischen den einzelnen Molekülen minimiert. Vorzugsweise geschieht die Ausrichtung mittels Field-Fit. Eine 3D-QSAR-Tabelle wird erstellt und dann nach der für CoMFA abgewandelten PLS-Methode analysiert. Die sich ergebende Lösung der 3D-QSAR-Tabelle liefert Koeffizienten der Spaltenterme, die den Relativbeiträgen der verschiedenen Gitterpositionen zur biologischen Aktivität entsprechen. Weil die Lösung sich wiederum durch Wechselwirkungs-Energiewerte ausdrücken läßt, die den bei der Erzeugung der 3D- QSAR-Tabelle berechneten Werten ähneln, kann man den Vorgang umkehren und auf einem Videogerät ein Diagramm der Wechselwirkungs-Energien darstellen, das diejenigen Bereiche der Molekülform zeigt, welche den Differenzen der biologischen Aktivität zugeordnet sind. Stehen interaktive Graphik-Display-Geräte zur Verfügung, so gestattet die Erfindung es dem Anwender, die Analyse- Optionen zu verändern und mit angemessenem Zeitaufwand diejenigen Bereiche der Molekularform zu betrachten, die bezüglich biologischer Aktivität am wichtigsten und auf dem vor ihm angeordneten Bildschirm hervorgehoben sind. Indem er die sich durch Parameter-Änderung verwandelnde Darstellung untersucht, kann der Anwender ein Verständnis dafür gewinnen, in welcher Weise besondere Formmerkmale des Moleküls für dessen biologische Aktivität bedeutsam sind.
- Ein Ziel der vorliegenden Erfindung ist es, die Molekülformen mit Formdeskriptoren zu vergleichen, die von örtlichen Flächenbereichs-Differenzen empfindlich abhängen. Ferner bezweckt die Erfindung die Schaffung einer Methodik zum quantitativen Abschätzen der Bedeutung einzelner Komponenten der Molekularform für die biologische Aktivität eines Moleküls. Ein weiteres Ziel der Erfindung ist die Bereitstellung von Struktur-, Konformations- und Statistik-Information, mit der es Anwendern möglich ist, als Substrate bzw. Liganden verwendbare neue Moleküle vorzuschlagen bzw. zu identifizieren. Schließlich zielt die Erfindung darauf ab, interaktive Graphik-Mittel verfügbar zu machen, mit denen die verschiedenen Formparameter auf quantitative Weise untersucht werden können, um eine tiefere Kenntnis der Natur von Wechselwirkungen zwischen Molekülen zu erlangen.
- Fig. 1 ist ein Überblicks-Schema der CoMFA-Methode,
- Fig. 2 stellt das Vergleichtest-Verfahren schematisch dar,
- Fig. 3A zeigt ein Streubild (scatter plot) im dreidimensionalen Gitter-Raum einer sterischen CoMFA-Lösung,
- Fig. 3B zeigt ein Konturbild (contour plot) im dreidimensionalen Gitter-Raum der CoMFA-Lösung von Fig. 3A,
- Fig. 4A ist das Streubild von Fig. 3A mit einem überlagerten Molekül zur Veranschaulichung der dreidimensionalen Beziehung des Moleküls zur CoMFA-Lösung,
- Fig. 4B ist das Konturbild von Fig. 3B mit einem überlagerten Molekül zur Veranschaulichung der dreidimensionalen Beziehung des Moleküls zur CoMFA-Lösung,
- Fig. 5 zeigt schematisch die Integration der CoMFA-Software in eine Standardanlage für Molekular-Modellbildung und
- Fig. 6 bis Fig. 9 sind Flußdiagramme von Abläufen zur Veranschaulichung der Zusammenhänge zwischen Hauptmerkmalen der vorliegenden Erfindung.
- Die vorliegende Erfindung überwindet die Begrenzungen früherer 3D-QSAR- Ansätze und gestattet bedeutsame Einblicke in Molekular-Wechselwirkungen, die - ohne faktische Röntgenkristallographie-Kenntnis der Rezeptor-Bindungsstellen - nie zuvor erzielbar waren. Während nämlich Röntgen-Ergebnisse nur ein statisches Bild liefern, verschafft die vorliegende Erfindung detaillierteres Wissen über die Formunterschiede, die bei dynamischen Wechselwirkungen zwischen Molekülen in Lösung wirksam sind. Der Molekularfeld-Vergleich (Comparative Molecular Field Approach, CoMFA) ist ein heuristisches Verfahren zum Definieren, Bearbeiten und Veranschaulichen von Unterschieden bei Moleküle umgebenden Molekularfeldern, auf denen beobachtete Unterschiede der Aktivität dieser Moleküle beruhen. Die CoMFA-Erläuterung ist unterteilt in zwei zunehmend detaillierte Abschnitte: erstens einen Überblick des Gesamtverfahrens; zweitens Beschreibungen der Einzelkomponenten samt jeweiliger Grundlage und der Unterschiede zum Stand der Technik.
- Sobald eine Reihe von Molekülen, für die der gleiche biologische Wechselwirkungs-Parameter gemessen wurde, zur Untersuchung ausgewählt ist, beschafft man sich die dreidimensionale Struktur jedes Moleküls, typisch von der Cambridge Crystallographic Database oder mit Standardverfahren der Molekular- Modellbildung Die dreidimensionale Struktur des ersten Moleküls wird in ein dreidimensionales Gitter gesetzt, so daß die Lagebeziehung jedes Atoms im Molekül zu einem Gitter-Schnittpunkt (Gitterpunkt) bekannt ist. Ein Sonden-Atom wird ausgewählt und nacheinander an jeden Gitterpunkt gebracht. Diese sterischen und elektrostatischen Wechselwirkungs-Energien zwischen dem Sonden-Atom und dem Molekül werden für alle Gitterpunkte berechnet. Die berechneten Energien bilden in einer Konformator-Datentabelle eine dem betreffenden Molekül zugeordnete Zeile.
- Wechselwirkungsenergien weiterer Konformationen des ersten Moleküls können in ähnlicher Weise berechnet werden. Nachdem für jeden Konformator die Zeile der Wechselwirkungsenergien berechnet ist, kann man den Konformator im Field- Fit-Verfahren ausrichten, wodurch an jedem Gitterpunkt die Energiedifferenzen zwischen diesem und dem ersten Konformator minimiert werden. Dann werden die Field-Fit-Wechselwirkungsenergie-Werte jedes Konformators in die Datentabelle für das erste Molekül eingegeben. Sobald die Wechseiwirkungsenergien aller Konformationen des ersten Moleküls berechnet sind, wird ein Durchschnittswert der Wechselwirkungsenergien an jedem Gitterpunkt von allen Konformatoren zur ersten Zeile in einer 3D-QSAR-Datentabelle gemacht und dem gemessenen biologischen Parameter für das erste Molekül zugeordnet.
- Genauso wird für alle Moleküle der Reihe vorgegangen. Nachdem die Durchschnitts-Feldwerte der Konformationen für ein bestimmtes Molekül ermittelt sind, sorgt eine Field-Fit-Minimierung der Durchschnitts-Feldwerte bezogen auf die Feldwerte eines Ausrichtungsmoleküls für die Eingliederung des neuen Moleküls unter die anderen der Reihe. Der obere Bereich von Fig. 1 zeigt schematisch, wie die 3D-QSAR-Tabelle aufgebaut ist. Für jeden Gitterpunkt wird die sterische bzw. elektrostatische Wechselwirkungs-Energie mit einem Test-Sondenatom an dem Gitterpunkt in die passende sterische bzw. elektrostatische Spalte eingegeben, die diesem Punkt zugeordnet ist. Die Gitterpunkte werden durchnumeriert und die entsprechende Spalte wird als sterisch (S) bzw. elektrostatisch (E) gekennzeichnet.
- Sobald die Daten (Wechselwirkungsenergien sowie gemessene biologische Aktivität) für alle Moleküle der Reihe in die 3D-QSAR-Datentabelle eingegeben sind, wird die Teil-Fehlerquadrat-Methode (PLS) angewandt, die einen Vergleichstest einschließt. Unter Verwendung der Wechselwirkungsenergien für jeden Gitterpunkt und der biologischen Werte löst PLS im wesentlichen eine Reihe von Gleichungen mit mehr Unbekannten als Gleichungen. Wie aus dem unteren Bereich der Fig. 1 hervorgeht, ist das Lösungsergebnis eine Reihe von Koeffizienten, je einer pro Spalte, dessen Betrag (in Energieeinheiten) den Beitrag der Wechselwirkungsenergien an dem betreffenden Gifferpunkt zu den Differenzen der gemessenen biologischen Parameter ausdrückt.
- Während die Lösung viele Terme aufweist, gestattet es eine 1 : 1-Zuordnung von Term zu Gitterpunkt, die Lösung als interaktives farbcodiertes dreidimensionales Bild darzustellen, entweder in Form eines dem Oberteil von Fig. 1 ußerlich ähnlichen Graphen (vergl. Fig. 3A), wobei die Farbe eines Punktes den Betrag der betreffenden Terme anzeigt, oder besser mit Termwerten, die in Konturform summarisch abgebildet werden (vergl. Fig. 3B). Die graphische Wiedergabe zeigt deutlich den Bereich im Molekularraum, wo das 3D-QSAR Änderungen der Molekularfeldwerte in starke Zuordnung zu Änderungen der gemessenen biologischen Parameter bringt.
- Wie oben dargelegt, sind Biochemiker und Biophysiker zu der Ansicht gelangt, daß intermolekulare Wechselwirkungen hoch raumspezifisch sind, indem sie hauptsächlich von der Form-Komplementarität abhängen, und daß biologische Moleküle jedesmal bei einer Bindung ein dreidimensionales Baustein-Puzzle lösen. Die bereits erwähnten herkömmlichen 3D-QSAR-Formdeskriptoren liefern jedoch nur ein Grobmaß (net measure) der Gesamtform, wobei örtliche topologische Unterschiede zwischen Molekülen gänzlich ausgemittelt werden. Man erhält eigentlich Aggregat- bzw. Komplex-Indices, die eine Form nur so beschreiben, wie z.B. die Vergleichs-Form zweier Skulpturen durch das Maß ihres unterschiedlichen Gewichts bzw. Volumens beschrieben wird. Auch Kugel-Stäbchen-Molekularmodelle drücken weder die sterischen Wechselwirkungen ausgedehnter Molekular-Orbitale noch ladungsbedingte Wechselwirkungen aus. Für die Beschreibung von Molekularformen müßte ein Deskriptor den Einfluß wenigstens dreier Molekularparameter angeben: 1. das wahre sterische Ausmaß jedes Atoms im Molekül; 2. die elektrostatischen Wechselwirkungen jedes Atoms im Molekül; und 3. ein hinreichend feines Maß für die Angabe jedes örtlichen Topologie-Merkmals des Moleküls. Bei CoMFA wird der Ansatz verwendet, daß passendes Sampling der sterischen und elektrostatischen Wechselwirkungen eines Moleküls genügt, um die meisten Fragen betreffend mögliche formabhängige Rezeptor-Wechselwirkungen zu beantworten. Für sich genommen ist die Berechnung von Wechsetwirkungsenergien an ein Molekül umgebenden Gitterpunkten nicht neu; von anderen ist dieser Ansatz zur Einschätzung der Molekülform versuchsweise benutzt worden. Beispielsweise hat Goodford die Verwendung von Sonden-Wechselwirkungs-"Gittern" vorgeschlagen, die den erfindungsgemäß berechneten ähneln (siehe P. J. Goodford, J. Med. Chem. 1985, 28, 849).
- Theoretisch enthält die Zeile mit den von allen Gitterpunkten erzeugten Wechselwirkungsenergie-Daten die hauptsächliche Information, wie ein Molekül für einen Rezeptor dreidimensional "aussieht". Vor der Erfindung hatte jedoch noch niemand herausgefunden, wie die von diesen Daten-Zeilen dargestellten Formen verschiedener Moleküle verglichen oder wie brauchbare Information über Formunterschiede, die für molekulare Gruppierungen wichtig sind, gewonnen und sichtbar dargestellt werden könnten.
- Die Feinheit bzw. Auflösung, mit welcher die Form eines Moleküls nach dieser Methode beschrieben wird, hängt von drei Faktoren ab: 1) der sterischen Größe des Test-Sondenatoms, 2) der Ladung des Test-Sondenatoms und 3) dem Gitterabstand. Die Erfindung gestattet es dem Benutzer, sowohl die sterische Größe als auch die Ladung der Testsonde zu spezifizieren. Außerdem können die Sonden-Parameter an verschiedenen Gitterstellen verändert werden, von denen der Benutzer annimmt, daß dort feinere oder gröbere Messungen gebraucht werden. Ferner kann der Benutzer den Gitterabstand auswählen. Typisch reicht der Bereich der Sondenatom-Größe vom kovalenten Wasserstoff -H über sp³- Kohlenstoff und sp³-Sauerstoff zu zweiwertigem Schwefel. Die typisch verwendeten Sondenladungen sind + 1,0 und 0,0 während man Gitterabstandswerte von 1,0 bis 4.0 Å häufig verwendet.
- Van der Waals-Radien werden allgemein für die sterische Berechnung verwendet, und die Atomladungen können aus der Kenntnis der Atomkoordinaten berechnet werden. So berechnet sich die sterische Wechselwirkungsenergie durch:
- wobei Nat die Anzahl der Atome im Biomolekül sowie ri der Abstand zwischen dem Sondenatom und dem i-ten Atom im Biomolekül ist; Ai und Bi sind Konstanten, die charakteristisch einerseits für den Sondenatom-Typ und andererseits für den Typ des i-ten Atoms im Biomolekül sind. [Der Benutzer kann als Option statt des Exponenten 12 andere Werte auswählen.] Die elektrostatische Wechselwirkungsenergie ergibt sich durch:
- wobei Nat und ri wie bei der sterischen Berechnung definiert sind; Q ist die Ladung des Sonden-Atoms und qi ist die Ladung auf dem i-ten Atom. Die qi-Werte können nach dem Verfahren von Gasteiger und Marsili (siehe J. Gasteiger, M. Marsili, Tetrahedron 1980, 36, 3219) berechnet werden. [Der Benutzer hat die Option, den Exponenten 2 wegzulassen.) Weil das Sondenatom nacheinander an alle Gitterpunkte gebracht wird, können die sterischen Abstoßungswerte für die Punkte innerhalb des Moleküls enorm groß werden. Da der Absolutwert keine andere Bedeutung hat als abzuschätzen, wieviel Atomvolumen-Überlappung besteht, wenn ein Sondenatom eine sterische Abstoßung oberhalb eines "Abschalt"- Grenzwerts (typisch 30 kcal/mol) erfährt, wird die sterische Wechselwirkung auf diesen Grenzwert eingestellt und die elektrostatischen Wechselwirkungen werden auf den Mittelwert der elektrostatischen Wechselwirkungen der anderen Moleküle an der gleichen Stelle festgelegt. Der Benutzer der Erfindung kann diese Grenzwerte auch selbst wählen. Offensichtlich geht keine topologische Information verloren.
- Festzuhalten ist, daß jede von einem Molekularmodell berechenbare Eigenschaft, z.B. Abstände oder Torsionswinkel zwischen Atomen, in der 3D-QSAR-Tabelle zu einer weiteren Spalte werden kann. Ferner können Spalten auch Werte von anderen orientierungs-gemittelten Molekulareigenschaften (z.B. log P oder Bildungswärme), als Funktionen anderer Spalten definierte Daten oder sogar aufgrund von Anwendervorgaben mit eigenen Routinen berechnete Daten enthalten. Weil die gemessene biologische Aktivität von der Fähigkeit des Moleküls, sowohl zur Rezeptor-Stelle zu gelangen, als auch daran anzudocken bedingt ist, können zusätzliche Terme (Spalten) eingebaut werden, welche die molekulare Diffusion ausdrücken. Man erkennt, daß die statistische und visuelle Korrelation der Spalten-Daten nach dem erfindungsgemäßen Verfahren nicht auf Wechselwirkungsenergie-Formdeskriptoren beschränkt ist.
- Ein besonders wichtiges und leistungsstarkes Merkmal der vorliegenden Erfindung ist sogar, daß die CoMFA-Methode Informationen liefert, die nicht einmal durch Röntgencrystallographie-Untersuchungen erhältlich sind, weil die Röntgenergebnisse statische Bilder liefern, welche die dynamischen Wechselwirkungen in Lösung überhaupt nicht wiedergeben. Hingegen ist das CoMFA-Modell der Wechselwirkung phänomenologisch; die tatsächlich gemessene Aktivität wird durch bestimmbare Beträge ausgedrückt bzw. vorhergesagt. Die vorliegende Erfindung zeigt die Abhängigkeit der gemessenen biologischen Parameter von in allen Spalten enthaltenen Daten (Form oder sonstige relevante Informationen). Für die Ausarbeitung der vorliegenden Erfindung wurde die Lagezuordnung der Moleküle im Gitter mit dem SYBYL-Softwareprogramm von Tripos Associates Inc. durchgeführt. Es gibt jedoch verschiedene andere Programme, die funktionell gleichwertig sind und bei der vorliegenden Erfindung angewandt werden können. Beispiele sind:
- ChemX von Chemical Design Ltd., Oxford, UK
- Insight von BioSym Technologies, San Diego, CA
- Quanta von Polygen, Waltham, MA
- ChemLab von Molecular Design Ltd., San Leandro, CA
- Macromodel von Prof. Clark Still, Columbia Univ.
- Solch ein Fremd-Softwareprogramm muß den Aufbau und die Speicherung von Molekular-Modellen (Zugriff zu Atomkoordinaten) sowie die Berechnung von Atomladungen (für die Berechnung der elektrostatischen Felder) und das Tabellieren der sterischen Parameter nach Atomsorten (zur Berechnung der sterischen Felder) möglich machen.
- CoMFA funktioniert so, daß die Wechselwirkungsenergie-Formdeskriptoren und zugehörige Formänderungen mit Unterschieden der gemessenen biologischen Aktivität verglichen werden. Weil die Formdeskriptoren an jedem Gitterpunkt berechnet werden, sind die für das gleiche Molekül berechneten gitterpunktspezifischen Wechselwirkungsenergien bei Versetzung auch um nur einen Gitterabstand jeweils signifikant verschieden. So kann eine CoMFA-Analyse dieser Daten Formunterschiede zeigen, wo gar keine sind. Daher ist die Positionierung eines Molekularmodells innerhalb eines gegebenen Gitters die bei weitem wichtigste Eingabevariable für CoMFA, zumal die relativen Wechselwirkungsenergien stark von den Relativ-Molekülpositionen im Gitter abhängen.
- Mit der bevorzugten Field-Fit-Methode der vorliegenden Erfindung werden Moleküle so ausgerichtet, daß man ihre Feld-Unterschiede anstelle der Atomkoordinaten-Unterschiede minimiert. Weil die Wechselwirkungsenergien die Molekularform ausdrücken, können sie quantitativ für die Formgestaltung manipuliert werden. Dieser Ansatz ist besonders geeignet, weil die intermolekularen Vergleiche jeweils auf denselben Energiefeldern beruhen.
- Bei der Field-Fit-Methode kann jedes Molekül als Bezugsmolekül dienen. Paßt man jedoch Konformationen des gleichen Moleküls ein, so wird man gewöhnlich als Vergleichs-Standard die Konformation benutzen, die aus anderen Gründen den wahrscheinlich aktivsten Konformator darstellt. Unterwirft man die letzte Reihe von Testmolekülen dem Fieldfitting, so benutzt man als Bezugsmolekül gewöhnlich dasjenige mit der größten biologischen Aktivität. Bei der Field-Fit-Anwendung minimiert man die quadratisch gemittelte Differenz (RMS, Effektivwert) der über alle Gitterpunkte gemittelten Summen der sterischen und elektrostatischen Wechseiwirkungsenergien zwischen dem neuen Molekül und dem Bezugsmolekül oder einer Bezugsgruppe von Molekülen in Hinsicht auf die drei Freiheitsgrade starrer Körper, auf etwaige Torsionswinkel laut Anwendervorgaben und auf Änderungen der Innengeometrie. Vor der Field-Fit-Bearbeitung hat der Anwender die Option, diejenigen Gitterstellen zu gewichten, von denen er aus anderen Gründen annimmt, daß sie für die Einordnung einer gegebenen Molekularreihe oder Konformation besonders signifikant sein können. Die Ergebnisse der Field-Fit- oder Test-Einordnungen unter Verwendung von Gewichtungs-Faktoren können als dreidimensionale Streu- oder Konturbilder in der gleichen Weise dargestellt und visuell verglichen werden, wie dies weiter unten für alle graphischen Darstellungen erörtert wird.
- Mit Bezug auf die 3D-QSAR-Tabelle in Fig. 1 würde die Field-Fit-Anwendung von Molekül 2 zu Molekül 1 dem entsprechen, daß man die Summe der quadrierten Unterschiede zwischen ersten und zweiten Tabellenzeile (außer in der ersten Spalte) durch Änderung von Position und/oder Torsionswinkel des Moleküls 2 minimiert. Zufriedenstellende Field-Fit-Anwendung erfordert außerdem eine sterische Abstoßung jenseits der Gitterbegrenzung und, soweit Torsionswinkel verändert werden, die bei gleichem Kraftfeld nach herkömmlicher Molekularmechanik berechnete innere Energie. Folgendes ist der Grund für die sterische Abstoßung an der Begrenzung. Man kann sich die zu minimierende Funktion als formähnlich zum Querschnitt eines Vulkans vorstellen. Die sterische Begrenzungs-Abstoßung braucht man, weil die für die Minimierung gesuchte Antwort der Krater ist; wenn jedoch die Moleküle zu Anfang nicht näherungsweise ausgerichtet oder angepaßt sind, wird die Minimierungs-Richtung außen am Vulkan abwärtsverlaufen: d.h. die Minimierung der Felddifferenzen wird die Moleküle auseinanderstoßen. Legt man die sterische Abstoßung auf die Kante des Gitterbereichs, so wird die Abwärts-Bewegung an der Außenseite des Vulkans benachteiligt.
- Das Field-Fit erlaubt es dem Anwender auch, die relative Gewichtung der drei verschiedenen Beiträge zu der zu minimierenden Funktion anzugehen, nämlich die Felddifferenz selbst, die sterische Kanten-Abstoßung und die unterschiedlichen inneren Energien bei Änderung der Torsions- bzw. Drehbindungen und anderer innerer Geometrien im Softwareprogramm zur Ausführung der Erfindung ist die Gewichtungs-Auswahl eine Benutzeroption. Die Möglichkeit, mit Field-Fit auf einer interaktiven Grafik-Anlage die dreidimensionale Auswirkungen verschiedener Gewichtungs-Auswahl auf die Molekularausrichtung sehen zu können, stellt für sich einen bedeutsamen Fortschritt bei 3D-QSAR dar. Die Minimierung erfolgt nach der Simplexmethode, einem weitverbreiteten Algorithmus, mit Schritten solcher Größe, daß die einzelnen Atome sich anfänglich um nicht mehr als 0,2 Å bewegen. Die Simplexmethode ist bevorzugt, weil die zu minimierende Funktion keine analytischen Ableitungen hat. Konvergenz tritt ein, sobald aufeinanderfolgende Funktions-Auswertungen um weniger als 1 % variieren. Wie bei allen Minimierungen hat man bei Field-Fit eine optimale Ausrichtung, wenn die Endgeometrie der Anfangsgeometrie voraussichtlich sehr ähnelt (is "downhill from", darunter liegt).
- Die CoMFA-Softwareprogramme zur Durchführung der Erfindung ermöglichen es, andere Ausrichtungs-Verfahren einzusetzen, beispielsweise die üblichen Routinen für Anpassung und Orientierung (Fit and Orient). Beispielsweise benutzt Fit die Kleinstquadrat-Überlagerung von benutzerseitig vorgegebenen Gruppen von Atomkernen mit oder ohne Relaxation der inneren Geometrie, wogegen Orient drei Atome nach Anwendervorgaben wählt und das erste Atom an den Ursprung, das zweite Atom auf die X-Achse und das dritte Atom in die XZ-Ebene setzt. Der Benutzer kann sogar eine Probier-Ausrichtung (trial and error) aufgrund fundierter Annahmen oder sonstiger 3D-QSAR-Daten versuchen. Field-Fit eignet sich besonders, wenn bei einem auf einer anderen Ausrichtmethode basierenden CoMFA ein zu niedriges Vergleichstest-r² herauskommt, was seinerseits dadurch verursacht ist, daß ein oder mehr Moleküle sehr große Reste haben (residuals, sehr große Differenzen zwischen vorhergesagten und tatsächlichen Eigenschaften beim Vergleichstest-Schritt) Field-Fit bei der bzw. jeder Verbindung mit sehr großem Rest führt zu einer neuen Aussrichtung, die bei Wiederholung des CoMFA eine Verbesserung bewirkt. Die bei einem CoMFA-QSAR-Verfahren benutzen Konformatoren können durch irgendeinen dieser Ausrichtungs-Vorgänge entweder vor oder während der CoMFA-Rechnung ausgerichtet werden.
- Wichtige Anwendungen hat Fiejd-Fit auch, wenn man Felddifferenzen maximiert (statt minimiert). Wenn man die Unterschiede der Wechselwirkungsenergien zweier formkomplementärer Moleküle maximiert, liefert Field-Fit bestes dreidimensionales Ausrichten oder "Andocken" zwischen bzw. an den Molekülen. Sind etwa die Strukturen sowohl des Substrats als auch des Enzyms (bzw. des Antigens und des Antikörpers) bekannt, so wird Field-Fit deren optimale Ausrichtung ermitteln.
- Ein herkömmlich ungelöstes großes Problem bei 3D-QSAR-Ansätzen ist die Bestimmung der richtigen Molekular-Konformation für eine Untersuchung. Hat man keine direkte Kenntnis der momentan aktiven Konformation, welche eine biologische Aktivität bedingt, so konnte man bisher lediglich eine fundierte Vermutung machen. CoMFA mit Field-Fit erlaubt jedoch eine quantitative Konformations-Auswahl. Man kann die CoMFA-Softwareprogramme dazu benutzen, in eine separate Datentabelle die Wechselwirkungsenergien jedes Konformators einzugeben und an einen ausgewählten Schablonen-Konformator anzupassen. Dann lassen sich verschiedene Ausmittelungs oder Gewichtungs-Schemata als Anwender-Optionen einsetzen, um den repräsentativsten Konformator festzulegen. Die Wechselwirkungsenergien für die einzelnen Konformationen können auf der Basis vernünftiger Annahmen dafür gewichtet werden, daß eine Wahrscheinlichkeit für gewisse Aktivst-Konformationen gegeben ist, ohne daß man Beiträge von vermutlich weniger aktiven Formen völlig ausschließen müßte. Weil die meisten Konformationen in freier wässriger Lösung bei normalen Temperaturen im Gleichgewicht sein dürften, erlauben es die CoMFA-Programme alternativ, die Gewichtung zum Ausdruck einer Boltzmann-Verteilung über die Energie der Konformatoren zu verwenden. Nur im Fall eines hochlabilen Moleküls (das multiple Rotomere und Tautomere besitzt) würde eine Boltzmann-Verteilung eine ausgefranste und bedeutungslose Durchschnitts-Kugel ergeben. CoMFA mit Field-Fit schafft die Möglichkeit, diese verschiedenen Gewichtungsfunktionen so einzusetzen, daß eine Molekülform bestimmt wird, welche die Rezeptorstelle "aller Wahrscheinlichkeit nach" sehen würde.
- Wie oben erwähnt, bildete die vorgegebene Unterbestimmtheit einer 3D-QSAR- Tabelle mit viel mehr Spalten als Zeilen herkömmlich ein unlösbares Problem, das die Verwendung zur Formbeschreibung von an Tausenden von Gitterpunkten berechneten Wechselwirkungsenergien verhinderte. Man kann die Werte in der Datentabelle als Gleichungssystem mit viel mehr Unbekannten als Gleichungen ansehen. Beispielsweise können für drei Moleküle die folgenden drei Gleichungen aufgestellt werden:
- Value&sub1; = b¹ + A&sub0;&sub0;&sub1;S¹(001) + A&sub0;&sub0;&sub2;S¹(002) + ... ANS¹(N) + a&sub0;&sub0;&sub1;E¹(001) + a&sub0;&sub0;&sub2;E¹(002) + ... anE¹(N)
- Value&sub2; = b² + A&sub0;&sub0;&sub1;S²(001) + A&sub0;&sub0;&sub2;S²(002) + ... ANS²(N) + a&sub0;&sub0;&sub1;E²(001) + a&sub0;&sub0;&sub2;E²(002) + ... aNE²(N)
- Value&sub3; = b³ + A&sub0;&sub0;&sub1;S³(001) + A&sub0;&sub0;&sub2;S³(002) + ... ANS³(N) + a&sub0;&sub0;&sub1;E³(001) + a&sub0;&sub0;&sub2;E³(002) + ... aNE³(N)
- Darin sind Values die gemessenen biologischen Aktivitäten jedes Moleküls; bx ist der Achsenabschnitt für jede Gleichung beim Molekül x; A... und a... sind die Koeffizienten der sterischen und elektrostatischen Terme, welche die relativen Beiträge jeder räumlichen Lage ausdrücken, wobei die lndices sowohl verschiedene Koeffizientenbeträge als auch Gitterpunkte anzeigen, denen die betreffenden Werte zugeordnet sind; Sx(N) und Ex(N) sind die für die die Gitterstelle N berechneten sterischen bzw. elektrostatischen Wechselwirkungsenergien für das Molekül x, wobei N im Bereich von 1 bis zur Höchstzahl der Gitterpunkte liegt. Die Teil-Fehlerquadratmethode (PLS) der mehrdimensionalen Analysis "löst" dieses anscheinend unterbestimmte Gleichungssystem durch eine Reihe von orthogonalen Rotationen im Überraum der Matrizen mit sowohl unabhängigen als auch abhängigen Variablen, wobei jede Rotation die Gemeinschaftlichkeit zwischen den Matrizen mit unabhängigen und abhängigen Variablen maximiert. (im Gegensatz hierzu werden bei der klassischen Kleinstquadrat-Regression die Spalten mit unabhängigen Variablen einzeln und unabhängig rotiert, nicht zusammen, so daß für jeden abgeschätzten Koeffizienten ein Freiheitsgrad verbraucht wird.) Die mit PLS ermittelte Gleichungslösung ist die Gruppe von Koeffizienten-Werten, welche am ehesten jede Gleichung erfüllen. PLS ist besonders günstig für CoMFA, weil damit nur zwei Vektor-Matrix-Multiplikationen verbunden sind, die Berechnung aufgrund von Rohdaten durchführbar ist und große Aufgaben auf einer kleineren Rechenanlage lösbar sind.
- Zur Anwendung bei CoMFA hat man eine bedeutsame Verbesserung von PLS geschaffen, wobei die anfängliche PLS-Lösung in den ursprünglichen Datenraum zurückgerollt wird, so daß die als Lösung mittels des ursprünglichen metrischen Raums (in diesem Falle durch Energiewerte) erhaltenen Term-Koeffizienten neu ausgedrückt werden. Weil diese Lösung für jede Spalte der Datentabelle eine potentiell von Null verschiedenen Koeffizienten (tatsächlich 2 je Gitterpunkt) enthält, läßt sie sich im dreidimensionalen Raum darstellen und konturieren, wie jeder andere Ausdruck auch, der numerische Werte mit bekannten Orten im Raum in Verbindung bringt.
- Mit dem Auffinden einer "Lösung" durch PLS ist automatisch eine zyklische Vergleichstest-Prozedur verbunden. Sie bewertet ein Modell nicht danach, wie gut es zu den Daten paßt, sondern wie gut es solche vorhersagt. Zwar ist das Vergleichstest-Verfahren in vielen Fällen nützlich, doch ist es bei der Validierung von unterbestimmten CoMFA-3D-QSAR-Tabellen mit Vorsicht anzuwenden. Als statistisches Maß für die Zuverlässigkeit einer PLS-Lösung berechnet man ein Vergleichstest- (oder Vorhersage-) r² analog zur Definition eines herkömmlichen r² wie folgt:
- Vergleichstest r² SD-PRESS / SD,
- wobei SD die Summe über alle Moleküle der quadratischen Abweichungen jedes biologischen Parameters vom Mittelwert ist und PRESS (= Vorhersage-Quadratsumme, Predictive Sum of Squares) die Summe über alle Moleküle der quadrierten Differenzen zwischen den tatsächlichen und den vorhergesagten biologischen Parametern bedeutet. Ein negatives Vergleichstest r² entsteht, wenn PRESS größer als SD ist, wenn also die biologischen Parameter durch den Mittelwert aller Meßwerte besser abgeschätzt werden als durch die gerade betrachtete Lösung.
- Bei PLS geschieht der Einbau der Vergleichstest-Prozedur wie folgt: Zunächst wird die gesamte 3D-QSAR-Datentabelle mittels PLS durchgerechnet und eine Komponente im Überraum (hyperspace) herausgezogen. [Die Projektion dieser Komponente auf sämtliche Orthogonalebenen im Überraum liefert auf allen Ebenen Komponenten, welche die gesuchten Gleichungskoeffizienten sind.] Die PLS- Rechnung wird dann wiederholt (mit neu abgeleiteten Gleichungskoeffizienten), wobei ein zufällig gewähltes Molekül (Zeile) ausgeschlossen wird. Die resultierenden Koeffizienten werden dazu verwendet, den biologischen Wert für das ausgeschlossene Molekül (Zeile) zu berechnen bzw. vorherzusagen, und man berechnet ein neues r². [In der Praxis ermöglicht es das Softwareprogramm auch, Zufalis-Untergruppen von Molekülwerten auszuschließen und die ausgeschlossenen biologischen Werte zu berechnen. Dies vermindert den Zeitaufwand, der zur Berechnung einer ersten Koeffizientengruppe benötigt wird. Bei einer vollständigen Einzeirechnung wird jedes Molekül (Zeile) einzeln ausgeschlossen.) Diese Prozedur mit Weglassung, erneuter Ableitung und Vorhersage wird wiederholt, bis jeder biologische Parameter Wert durch eine Koeffizientengruppe vorhergesagt ist, aus deren Ableitung er ausgeschlossen war. Fig. 2 zeigt schematisch den Vergleichstest-Ablauf. Man beachte, daß bzw. wie die mittels PLS ohne die ausgeschlossene Zeile abgeleiteten Lösungskoeffizienten zusammen mit den Wechselwirkungswerten von der in der Gleichung ausgeschlossenen Reihe zur Vorhersage des biologischen Werts des ausgeschlossenen Moleküls benutzt werden.
- Für jeden Vergleichstest-Zyklus werden Werte von r² und PRESS berechnet. Ergibt sich keine Korrelation unter den Daten, so liefern die abgeleiteten Koeffizienten keine sinnvollen Vorhersagewerte und PRESS ist größer als SD. Die r²- Werte geben an, wie gut die aus einer Ausblendung gewonnenen Komponenten sind.
- Der Beitrag der bereits erhaltenen ersten Komponente wird sodann aus dem Matrix-Überraum entfernt, eine zweite PLS-Rechnung durchgeführt und noch eine Komponente herausgezogen. Eine weitere Vergleichstest-Runde wird durchgeführt, wobei wiederum der Zyklus mit Weglassung, Neuableitung und Vorhersage vollzogen wird. Der Anwender gibt an, wie oft die Ausblendungs-Vergleichstest- Prozedur wiederholt wird. Die herausgezogenen Komponenten werden addiert, in den Datenraum zurückgeführt und die resultierenden Koeffizienten erzeugt.
- Das Ergebnis der PLS-Vergleichstest-Rechnung aufgrund der Datentabelle ist eine Koeffizientengruppe (je einer pro Spalte in der Datentabelle), die bei Anwendung in einer linearen Gleichung, welche die Spaltenwerte zu gemessenen biologischen Werten in Beziehung setzt, die beobachteten biologischen Eigenschaften am besten vorhersagt, und zwar mittels Energiefeld-Differenzen unter den Molekülen der Datengruppe an jedem einzelnen der herausgegriffenen Gitterpunkte.
- Der abschließende Schritt bei CoMFA besteht in der Wiedergabe der analytischen Ergebnisse auf eine für den Biochemie-Forscher sinnvolle Weise. Allgemein sind das menschliche Auge und das Gehirn bei der Erkennung von komplexen Mustern viel geschickter in einem Bild als in einer Zahlentabelle. Auf einzigartige Weise kann man mit CoMFA-Outputs diesen gegebenen Vorteil der graphischen Darstellbarkeit ausnutzen, weil die drei Dimensionen der Eingangsdaten durchgängig beibehalten werden. Chemiker, die CoMFA anwenden, gehören ja zu den am stärksten visuell orientierten Wissenschaftler-Gruppen. Zusätzlich zu seiner Leistungsfähigkeit ist CoMFA daher auch sehr viel stärker graphisch orientiert als andere 3D-QSAR-Ansätze, und zwar sowohl hinsichtlich der Eingaben (Molekularmodelle) als auch hinsichtlich der Ausgabe (Streubilder und Konturkarten). Die einzige Zahl, auf die der Endanwender achten muß, ist das Vergleichstest-r², die Gütezahl für eine CoMFA-Rechnung.
- Man erkennt, daß die gemeinschaftlich geformten Bereiche unter den Testmolekülen nicht stark zur Lösung beitragen, was auf der Art beruht, wie die CoMFA- 3D-QSAR-Methodik aufgebaut ist, nämlich als Versuch, Unterschiede der biologischen Aktivität mit Formunterschieden in Beziehung zu setzen. Auch werden sich nicht alle Gebiete mit Formunterschieden in größeren Beiträgen zur Lösung ausdrücken, sondern nur solche Formunterschieds-Bereiche, die eng mit den biologischen Differenzen verbunden sind. Es ist eine bedeutsame Errungenschaft der vorliegenden Erfindung, daß ihr Lösung der 3D-QSAR-Datentabelle für die Wechselwirkungsenergien einen quantitativen Vergleich der Molekularform schafft. Wegen der Rückführung der PLS-Lösung in die Datengruppe haben die festgelegten Koeffizienten ferner gleiche Einheiten wie die Datenwerte, und infolgedessen gibt jeder Term seinen Funktions-Beitrag in den gleichen Einheiten wieder, in denen er abgeleitet wurde, d.h. als Wechselwirkungsenergie. Je größer der Betrag eines Koeffizienten ist, desto stärker ist allgemein seine zugeordnete räumliche Lage mit den beobachteten biologischen Differenzen in Verbindung zu setzen. Das Vorzeichen des Koeffizienten steht in Beziehung zum Vorzeichen der Änderungs-Auswirkung auf die biologische Differenz.
- Weil die Lösung den Spaltenaufbau der Datentabelle beibehält, sind ferner die Terme der Lösung den Positionen im dreidimensionalen Raum (Gitterkoordinaten) eindeutig zugeordnet. Eine graphische Darstellung in den drei Dimensionen der Term-Werte (Gitterpunkt für Gifferpunkt) führt daher zur Wiedergabe derjenigen Raumbereiche, welche für die Vorhersage von Änderungen der Molekularfunktionsweise am stärksten verantwortlich sind. Zu Vergleichs- und Untersuchungszwecken können für jeden Punkt verschiedene, jeden einzelenen Term representierende Werte dargestellt werden:
- 1) die Standardabweichung der Spaltenwerte mal 3D-QSAR-Koeffizient;
- 2) nur der 3D-QSAR-Koeffizient;
- 3) nur die Standardabweichung der Spalte;
- 4) der Spaltenwert für eines der Moleküle;
- 5) der Spaltenwert für ein Molekül mal 3D-QSAR-Koeffizient; oder
- 6) irgendwelche Daten von einer Fremddatei.
- Die Werte für sterische und elektrostatische Terme können getrennt oder kombiniert wiedergegeben werden.
- Man verwendet zwei Verfahren der graphischen Wiedergabe. Zum einen können die Terme in Form von dreidimensionalen farbkodierten Streubildern dargestellt werden, welche den Betrag und das Vorzeichen der Zuordnungen zwischen Energiefeld-Änderung und biologischer Aktivität an jedem Gitterpunkt darstellen. So zeigen in Fig. 3A blaue Punkte Lösungskoeffizienten, deren Werte angeben, daß zunehmende Molekülgröße in der Nähe die Molekül-Bindung verstärkt, während gelbe Bereiche andeuten, daß ein Größenzuwachs in der Nähe zur Abnahme der Molekülbindung führen würde. Das ursprünglich zum Einbringen der Moleküle in das Gitter benutzte Molekül-Modellbildungsprogramm kann dazu benutzt werden, irgendeines der Moleküle aus der Datengruppe auf die dreidimensionale Wiedergabe zu überlagern, so daß die farbigen Signifikanz-Bereiche mit spezifischen Atomstellen noch leichter erkennbar sind, wie in Fig. 4A gezeigt.
- Die andere Methode der Veranschaulichung von Information besteht in räumlichen Konturbildern. Dabei verbinden Konturlinien jeweils Punkte (Terme) mit ähnlichen Werten im Gitterraum. Die Konturen bilden Polyeder und schließen einen Raum ein, worin die Werte höher oder niedriger als ein vom Anwender vorgegebener Begrenzungswert sind. Auf jeder Karte umgeben die farbigen Polyeder alle Gitterpunkte, wo gemäß CoMFA eine starke Zuordnung von Feldwert-Änderungen zu Unterschieden der biologischen Parameter besteht. Fig. 3B zeigt ein Konturbild für sich, während Fig. 4B ein Konturbild mit einem für Untersuchung und Vergleich überlagerten Molekül aus der Datengruppe veranschaulicht.
- Diese Wiedergaben zeigen dem Anwender deutlich, wo entweder vergrößertes sterischen Volumen oder erhöhte elektrostatische Wechselwirkung in einem Bereich mit größerer biologischer Affinität in Beziehung steht. Umgekehrt werden auch solche Bereiche dargestellt, wo ein sterischer Volumenzuwachs oder eine zunehmende elektrostatische Wechselwirkung die biologische Affinität stören (mit ihr in negativer Beziehung stehen).
- Man kann CoMFA-Karten nicht nur als dreidimensionale Darstellungen von Molekularformen ansehen, die signifikante Beziehung zur biologischen Funktionsweise haben, sondern auch als Karten der Rezeptorräume. Bei dieser Betrachtung drücken höhere Wechselwirkungsbereich die stereospezifischen Ausrichtungs-Erfordernisse des Rezeptors aus. Die Karte der sterischen Terme zeigt die sterischen Erfordernisse an der Rezeptorstelle an, und die Karte der elektrostatischen Terme zeigt die elektrostatischen Erfordernisse an der Rezeptorstelle. Bei Kombination mit auf andere Weise erlangter chemischer Kenntnis der Rezeptorstelle kann diese Information zu interessanten und vorhersagefähigen Einsichten in die Beschaffenheit der Rezeptorstelle führen. Dieses Verfahren hebt sich deutlich verschieden vom Stand der Technik ab, z.B. von der Abstandsgeometrie-Methode, weil keine Vermutungen bezüglich der speziellen Orte der Atome an der Rezeptorstelle notwendig sind, ehe das 3D-QSAR erstellt ist. Vielmehr wird bei CoMFA die spezifische sterische und elektrostatische Information über die Rezeptorstelle vom 3D-QSAR abgeleitet. Zu erwähnen ist ein warnender Hinweis betreffend Überinterpretation der Konturkoeffizienten-Karten als Rezeptorkarte. Bei einem stark unterbestimmten System, wie es CoMFA mit sehr viel mehr auszuwertenden Koeffizienten als Verbindungen ist, kann eine Anzahl von 3D-QSAR-Lösungen der Datengruppe existieren, welche gleichermaßen zu irgendeiner gegebenen Gruppe von Verbindungen und Daten paßt.
- Dies mindert zwar nicht die Vorhersagefähigkeit oder die Lösungsauffindung mit der PLS-Vergleichstest-Methode, doch ergibt sich daraus, daß bei der Deutung der Endkarte als Rezeptorstellenkarte Vorsicht angebracht ist.
- Schließlich läßt sich die CoMFA-Karte drehen bzw. wenden und aus beliebigem Winkel betrachten, um die darin enthaltene raumspezifische Information noch besser zu erfassen.
- Ein mit der vorliegenden Erfindung erzielter wichtiger Fortschritt gegenüber dem Stand der Technik ist die Fähigkeit, das wahrscheinliche biologische Verhalten eines nicht in der ursprünglichen Datengruppe enthaltenen Moleküls quantitativ vorherzusagen. Ein starker Anstoß zur Weiterentwicklung zur 3D-QSAR für die Beschreibung von intermolekularen Anlagerungen ist, daß deren Verständnis die Konstruktion von Molekülen mit noch höherer biologischer Affinität ermöglichen sollte als bei den gegenwärtig bekannten Konstruktionen. Eine Anwendung dieses Potentials wäre dann die Schaffung von neuen und noch leistungsfähigeren bzw. selektiveren Medikamenten. Soweit nach dem Stand der Technik Vorschläge für veränderte Molekularstrukturen auf der Basis der Ergebnisse von QSAR-Rechnungen gemacht werden konnten, war es nötig, das vorgeschlagene Molekül synthetisch herzustellen und es in dem einschlägigen biologischen System zu testen, bevor man noch wußte, ob eine gewünschte Änderung erreicht worden war. Die vorliegende Erfindung erlaubt hingegen die sofortige Prüfung vorgeschlagener Molekül-Modifikationen im Vergleich mit der CoMFA-Musterlösung. Aufgrund der räumlichen Bereiche, die mit CoMFA als signifikant für die biologische Aktivität ermittelt wurden, kann man daher eine neue Molekular-Konfiguration planen. Das vorgeschlagene Molekül kann in die Gitterstruktur eingebracht und darin ausgerichtet werden, man kann seine Wechseiwirkungsenergien berechnen und in eine 3D-QSAR-Gleichung unter Verwendung der Koeffizienten einsetzen, die aus der ursprünglichen Datentabelle abgeleitet wurden. Die Gleichung ergibt einen biologischen Vorhersagewert für das Molekül.
- Die für das vorgeschlagene Molekül berechneten Wechselwirkungsenergien können auch dargestellt und mit den anfänglichen CoMFA-Raumkarten verglichen werden. Aus der resultierenden Wiedergabe kann man unmittelbar erkennen, ob die bei der Molekülkonstruktion vorgenommenen Änderungen den gleichen höheren Wechselwirkungsenergie-Termen und räumlichen Bereichen entsprechen, wie mittels CoMFA vorhergesagt. Es wurde festgestellt, daß die CoMFA-Methodik in solchen Fällen den biologischen Wert vorgeschlagener Moleküle mit hoher Genauigkeit vorhersagt, in denen die Moleküle synthetisch hergestellt bzw. getestet worden oder bei Erstellung der CoMFA-Rechnung noch unbekannt waren. Mithin liefert die vorliegende Erfindung einen quantitativen Prozeß für die Strukturuntersuchung von noch nicht hergestellten Molekülen zur Bestimmung ihrer wahrscheinlichen biologischen Aktivität. Die Bedeutung dieses Potentials für alle Aspekte der Mediko- und Biochemie ist kaum zu überschätzen.
- Die CoMFA-Methodik erlaubt ferner den Zugriff auf Moleküle mit erwünschten Strukturen aus Datenbanken von Molekülen, deren Form durch Wechselwirkungsenergien beschrieben ist. Es kann sich sogar herausstellen, daß unverdächtige, nie in einem gegebenen biologischen System getestete Moleküle die richtige Gestalt haben, um ebensogut in Wechselwirkung zu treten wie die bekannten Moleküle oder noch besser.
- CoMFA-Ergebnisse können den Anwender auch zur Bestimmung des an der Molekül-Wechselwirkung momentan beteiligten Konformators führen. Wie oben erwähnt, stellt die CoMFA-Endwiedergabe diejenigen Volumengestaltungen dar, die biologischen Aktivitätsunterschieden am stärksten zugeordnet sind. Der Anwender kann eine beliebige Molekular-Konformation, die - entweder als Stäbchenmodell oder in Wechselwirkungsenergie-Form - bei der Erstellung der 3D-QSAR-Tabelle benutzt wurde, der Lösungs-Wiedergabe überlagern, um die Gestalt jener Konformation mit den kritischen Volumengestaltungen zu vergleichen.
- In gewissem Ausmaß muß eine Korrelation bestehen, weil die Lösung aus einer Tabelle abgeleitet wird, die alle Konformationen enthält. Man kann jedoch diejenige Konformation, welche den Anforderungen des Lösungsraumes am nächsten kommt, als Hauptkonformation für die Erstellung einer weiteren 3D-QSAR- Tabelle verwenden. Sind die Vorhersagewerte r² für die neue Tabellen-Lösung höher als für die erste Lösung, so ist die ausgewählte Konformation wahrscheinlich die aktive. Man kann dieses Verfahren so oft wiederholen, wie der Anwender dies für nötig erachtet.
- Das Verfahren der vorliegenden Erfindung ermöglicht es, die Probiermethoden für die Konstruktion von Medikamenten beträchtlich zu verringern, mit entsprechenden Einsparungen an Zeit, Energie und Geld. Extensive Verwendung von CoMFA wird auch zu einer schnelleren Entwicklung von lebensrettenden Medikamenten führen. Wie bereits erwähnt, läßt sich CoMFA auch für andere Arten von intermolekularen Anlagerungen einsetzen, z.B. Untersuchungen des Antigen-Antikörper- Bindungsverhaltens und Änderungen an der Rezeptorstelle von genetisch veränderten Enzymen. Man braucht dazu nur eine gewisse Kenntnis der jeweiligen Molekülumgebung, z.B. die Röntgenkristalistruktur des Enzyms und die Kenntnis, wie substituierte Aminosäuren in die Röntgenstruktur einpaßbar sind. Die Erläuterung der vorliegenden Erfindung durch Substrat-Enzym-Bindungsaffinitäten ist als repräsentativ für die gegenwärtige Gebrauchstüchtigkeit von CoMFA zu verstehen, nicht jedoch als irgendeine Form von Begrenzung der allgemeinen Methodik bzw. Verfahrensführung gemäß der Erfindung. Es wird sogar angenommen, daß die volle Bedeutung des Verfahrens erst später erkannt werden wird, weil die erstellten räumlichen Karten ein so außerordentlich leistungsfähiges Hilfsmittel für die Untersuchung von intermolekularen Anlagerungen sind.
- Die vorliegende Erfindung dient dazu, in Verbindung mit einer Molekular-Modellbildungs-Anlage verwendet zu werden, von denen mehrere gegenwärtig handelsüblich sind. Diese Anlagen haben verschiedene Hardware- und Wiedergabe- Leistungsfähigkeit, und es gibt verschiedene Software-Ausgestaltungen. Für die Praxis der Erfindung sind jedoch die Berechnungs- und Wiedergabefunktionen besonders nützlich, die gleichwertig den Molekül-Modellbildungs-Geräten der Evans-Southerland-Reihe 300 sind.
- Figur 6 bis 9 sind Software-Fließdiagramme, welche die CoMFA-Methodik der Erfindung veranschaulichen. Dabei werden sechs Abschnitte von CoMFA-spezifischem Software-Code benutzt: FFIT.C, EVAL.C, PLS.FOR, MAP.C, Q3DEF.C und DABDEF.C. Schematisch zeigt Figur 5, wie diese sechs CoMFA-spezifischen Programme mit einer Standardanlage für Molekül-Modellbildung integriert sind. FFIT.C, EVAL.C, PLS und MAP.C sind reine Programme, während Q3DEF.C eine Datenbeschreibung sämtlicher Daten ist, nach denen die CoMFA-Programme Ausschau halten; DABDEF.C enthält den globalen Datenaufbau für Software, welche Datentabellen verwaltet. Wie oben erwähnt, sind verschiedene Programme handelsüblich, die dazu verwendet werden können, interessierende Moleküle und deren Konformatoren in den dreidimensionalen Gitterraum einzubauen; erfinderseitig wurde allerdings das Programm SYBYL von Tripos Associates, Inc. verwendet. Für die Verwaltung von Zahlentabellen wurde das DABYL-Programm von Tripos Associates, Inc. eingesetzt, doch gibt es funktionell gleichwertige Software z.B. mit dem Programm RS/1 von BBN Software, Cambridge, MA.
- Die erfindungsgemäße Methodik sieht vor, daß der Anwender die Eingabe- Optionen bzw. -Parameter auswählt. Die Daten-Strukturen für die Eingabe- Optionen bzw. -Parameter sind in Q3DEF.C festgelegt, während DABDEF.C Datenstrukturen für das Programm zur Datenverwaltung festlegt. EVAL.C erzeugt eine 3D-QSAR-Tabelle aus der Information, die vom Molekül-Modellbildungs- Programm und durch Eingabe der biologischen Parameter bereitgestellt wird. FFIT.C führt die Field-Fit-Ausrichtung durch, um Moleküle passend auszurichten, entweder Konformatoren oder die Moleküle der getesteten Reihen. PLS führt die Teil-Fehlerquadrat-Rechnung sowie den Vergleichstest der mittels EVAL.C geschaffenen 3D-QSAR-Tabelle aus. Schließlich erzeugt MAP.C die Raumkarten für die Graphik-Ausgabe. Wenn es erwünscht ist, eine Molekülstruktur den Output-Karten der CoMFA-Methodik zu überlagern, kann man die Standard-Programme für die Molekül-Modellbildung dafür verwenden.
- Die CoMFA-Software-Programme versehen den Anwender mit einer Anzahl von Optionen für die Ausnutzung der vollen Leistungsfähigkeit erfindungsgemäßer CoMFA. Nachstehend wird die Liste der Optionen vollständig aufgeführt:
- 1) Berechnungen können entweder in "interaktivem" Modus, wobei der Fortgang auf einem Terminal beobachtet wird, oder "chargenweise" getrennt ausgeführt werden, wobei die Beendigung dem Anwender signalisiert wird.
- 2) Die Gewichtung der Gitterpunkte kann entweder: gleichmäßig; nach QSAR- Koeffizienten; oder durch Gewichtungs-Vorgaben des Anwenders erfolgen.
- 3) Die sterischen und elektrostatischen Komponenten können entweder unabhängig behandelt oder aufsummiert werden.
- 4) Gesamt-Verschiebungen bzw. Rotationen können ein- oder ausgeschlossen sein.
- 5) Torsionsdrehungen können ein- oder ausgeschlossen sein, bei Einschluß unter Anwender-Vorgabe welcher Torsionsdrehungen.
- 6) Wie weit ist das Molekül bei einem Versuch zu bewegen? (Anfangswert verändert sich mit Fortgang der Simplex-Minimierung.)
- 7) Konvergenz-Kriterium: Wie klein muß die Geometrie-Änderung in aufeinanderfolgenden Schritten sein, bevor Field-Fit als erfolgt angesehen wird?
- 8) Maximalanzahl von Schritten, bevor Field-Fit beendet ist, ohne Rücksicht darauf, ob Konvergenz eingetreten ist.
- 9) Das Schablonenfeld ("target") kann von einem einzelnen Molekül (Konformator) oder von mehreren zusammen gemittelten Molekülen (Konformatoren) genommen werden.
- 10) im interaktiven Modus (Punkt 1 oben): sind Zwischenergebnisse alle 10 Schritte darzustellen?
- 11) im interaktiven Modus und mit Wiedergabe von Zwischenergebnissen: soll der Anwender nach jeder Wiedergabe zur Fortsetzung gefragt werden?
- 12) Handelt es sich um normales Feld-Fit oder um ein "Andock"-Field-Fit (mit der Zielsetzung der Differenz-Maximierung durch Field-Fit-Anwendung auf das Komplement zum Schablonenfeld)?
- 13) Was ist zu tun, um das Ergebnis von Field-Fit zu bewahren? Die Optionen sind: Nichts, Überschreiben in einen äußeren Speicher, Rückführung des Moleküls in die Datenbank.
- 1) Die Art von Ausrichtung, die auf den Molekül-Konformatoren auszuführen ist. Die Optionen sind: Keine, FIT, ORIENT, Field-Fit.
- 2) Sind die Ausrichtungs-Ergebnisse wieder in der Datenbank zu speichern?
- 3) Sollte die Energie geglättet werden? (In diesem Fall ist der QSAR-Tabellenwert an einem Gitterpunkt der Durchschnitt aus dem Momentanwert und 9 anderen, um diesen Punkt in gleichmäßigem Abstand verteilten Punkten.)
- 4) Element- bzw. Hybridisierungs-Zustand des Sondenatoms (steuert dessen sterische bzw. Van-der-Waals-Eigenschaften).
- 5) Ladung des Sondenatoms (steuert seine elektrostatische Wirkung).
- 6) Methode zur Abschätzung Van-der-Waals-Parameter (Standard-SYBYL- Methode oder berechnet nach Scott/Scheraga - der Bezug auf Scott/Scheraga ist im Code selbst enthalten).
- 7) Van-der-Waals-Abstoßungsexponent (üblicher Wert: 12).
- 8) Elektrostatischer Exponent (üblicher Wert 2, gleichwertig einem l/r-Dielektrikum).
- 9) Höchster sterischer Wert zur Aufzeichnung in der 3D-QSAR-Tabelle (gewöhnlich 30 kcal/mol).
- 10) Höchste zu betrachtende Energiekonformation bei Darstellung des Moleküls als Durchschnitt von Konformationen (wobei überhohe Energiekonformatoren verschwindend kleine Beiträge zur Gesamtform liefern).
- 11) Ist eine Spalte der 3D-QSAR-Tabelle auszuschließen, wenn eine beliebige Verbindung in der QSAR-Tabelle einen maximalen sterischen Wert beiträgt?
- 12) Sind am Terminal die Kennzeichnungen von ausgeschlossenen 3D-QSAR- Spalten aufzulisten (diese treten stets auf, wenn bei einem Wert entlang einer Spalte in der Tabelle kein Unterschied vorkommt, weil alle Verbindungen einen maximalen sterischen Wert an diesem Gitterpunkt haben)?
- 1) Ist ein Vergleichstest auszuführen? Wenn ja, Anzahl der Vergleichstest- Gruppen.
- 2) Ist "Urladen" (bootstrapping) auszuführen? Wenn ja, Anzahl der Urlade- Versuche.
- 3) Anzahl der abzufragenden Komponenten.
- 4) Ist Autoskalierung von Daten einzelner Spalten vorzusehen (Skalierung derart, daß der Werte-Durchschnitt 0.0 und die Standard-Abweichung 0, ist)? [Dieser spezielle Ablauf wird bei CoMFA nicht empfohlen, steht jedoch als allgemeine Routine bei PLS-Benutzung zur Verfügung.]
- 5) Gibt es eine Relativ-Gewichtung der Spalten? Bei Einschluß anderer Eigenschaften wie log P ist es notwendig, ihnen zusätzliches Gewicht für die Konkurrenz mit der großen Anzahl von Felddeskriptor-Spalten zu geben.)
- 6) Konvergenz-Kriterien, speziell Epsilon, Anzahl der Iterationen, zur Verwendung innerhalb von PLS selbst. (Ein Warnhinweis wird gedruckt, wenn eine PLS-Runde dadurch beendet wird, daß die Anzahl der Iterationen überschritten wird, statt daß eine Differenz kleiner als Epsilon erhalten würde.)
- 1) Welche Quelle der 3D-Daten wird für die Graphik, Konturzeichnung oder Auflistung verwendet? Die Optionen sind: (1) Spalten-Standardabweichung mal QSAR-Koeffizient; (2) nur Spalten-Standardabweichung; (3) nur QSAR Koeffizient; (4) Spaltenwert für eine einzelne Verbindung; (5) Spaltenwert für eine einzelne Verbindung mal QSAR-Koeffizient; (6) Fremddatei.
- 2) Welcher Aspekt der 3D-Daten soll geplottet oder konturgezeichnet werden? Zur Wahl stehen: sterisch, elektrostatisch, sowohl sterisch als auch elektrostatisch in verschiedenen Wiedergabe-Bereichen.
- Die CoMFA-Methodik ist vorstehend unter Bezug auf besondere Anwendungen erläutert worden. Die Anwendung der Methodik auf andere Gebiete liegt jedoch ebenfalls im Schutzumfang der Erfindung.
Claims (26)
1. Computergestütztes Verfahren zum Erzeugen und Sichtbarmachen einer
dreidimensionalen quantitativen Struktur-Aktivitäts-Beziehung (3D-QSAR)
einer Reihe von Molekülen aufgrund der Annahme, daß relevante
biologische Parameter, z.B. Bindungs-Affinität, mit einer Linearkombination
gewichteter Beiträge einer Anzahl von Form-Deskriptoren für jedes Molekül
der Reihe korrelieren, gekennzeichnet durch folgende Verfahrensschritte:
a) Definieren von Molekülform-Deskriptoren für jedes Molekül (x) der
Reihe durch Computer-Berechnung zumindest sterischer (Sx(N))
und elektrostatischer (Ex(N)) Wechselwirkungs-Energien zwischen
einer mathematischen Darstellung einer Sonde und dem Molekül an
es umgebenden vorbestimmten Gitterpunkten (N);
b) Bestimmen eines repräsentativen Konformators für jedes Molekül (x)
der Reihe derart, daß durch Änderung von Lage und/oder
Torsionswinkel eines Konformator-Anwärters dieser sich zu mindestens
einem Bezugsmolekül hin ausrichtet;
c) Definieren einer Anzahl von Gleichungen, wobei jede Gleichung
einem Molekül der Reihe entspricht und in jeder Gleichung ein
gemessener biologischer Parameter (Valuex) des betreffenden
Moleküls (x) gleich einer gewichteten Linearkombination der
Molekülform-Deskriptoren (Sx(N), Ex(N)) gesetzt wird, wobei die
Koeffizienten (bx, A&sub0;&sub0;&sub1;, A&sub0;&sub0;&sub2;, ..., AN, a&sub0;&sub0;&sub1;, a&sub0;&sub0;&sub2;, ..., aN) der gewichteten
Linearkombination unbekannt sind und wobei die Anzahl von
Gleichungen ein Gleichungssystem bildet, das viel mehr Unbekannte als
Gleichungen aufweist;
d) Gewinnen einer Anfangslösung für das Gleichungssystem durch
Anwendung einer Teil-Fehlerquadratmethode (PLS) der
mehrdimensionalen Analysis, wobei die Anfangslösung von derjenigen
Gruppe von Koeffizienten gebildet wird, die einer Erfüllung jeder
Gleichung am nächsten kommt;
e) Berechnen eines Vergleichstest-Parameters (r²) zur Feststellung,
wann die biologischen Parameter durch den Mittelwert aller
gemessenen Werte besser abgeschätzt werden als durch die bei
Anwendung der PLS-Lösung erhaltenen Werte;
f) Beginnen einer zyklischen Vergleichstest-Prozedur, so daß
f1) durch Ausschließen mindestens einer Gleichung aus dem
Gleichungssystem und durch Wiederholung der PLS-Analysis
an einem somit reduzierten Gleichungssystem eine
Alternativgruppe von Gleichungskoeffizienten gefunden wird
(CINTERCEPT, A001', ..., AN', A001'..., aN'; Fig. 2);
f2) die Alternativgruppe von Gleichungskoeffizienten dazu benutzt
wird, den biologischen Parameter (V) desjenigen Moleküls
vorherzusagen, das der ausgeschlossenen Gleichung
entspricht;
f3) der Vergleichstest-Parameter (r²) neu zur Feststellung
berechnet wird, ob die Alternativkoeffizienten bessere
Vorhersagewerte liefern;
f4) der Vergleichstest-Zyklus ab Schritt f1) wiederholt wird, so daß
wenigstens eine weitere Gleichung aus dem Gleichungssystem
ausgeschlossen wird;
g) Wiederholen des Vergleichstest-Zyklus so oft, wie ein Benutzer
vorgibt, dem für gefundene Lösungs-Terme repräsentative Werte
unter Anwendung von Computergrafik sichtbar dargestellt werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß im Schritt b) ein
am ehesten repräsentativer Konformator mittels einer
Field-Fit-Ausrichtungsroutine derart bestimmt wird, daß man die Effektivwert-Differenz der
Summe der über alle Gitterpunkte gemittelten sterischen und
elektrostatischen Wechselwirkungsenergien zwischen dem Konformator-Anwärter und
mindestens einem Bezugsmolekül durch Ändern von Lage und/oder
Torsionswinkel des Konformator-Anwärters minimiert.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß Schritt b) mittels
der Orient-or-Fit-Methode (Ausrichten oder An-/Einpassen) ausgeführt
wird.
4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, daß die Wechselwirkungsenergien gemäß einer
Boltzmann-Verteilung über die Konformatorenergien gewichtet werden.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, daß die Lösungs-Terme in Punkten des Gitter-Raums
entsprechenden dreidimensionalen Streu-Diagrammen dargestellt werden, wobei
letzteren wahlweise ein Molekularmodell überlagert wird.
6. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß
die Lösungs-Terme in dreidimensionalen Kontur-Diagrammen dargestellt
werden, die Volumina im Gitter-Raum definieren, wobei den
Kontur-Diagrammen wahlweise ein Molekularmodell überlagert wird.
7. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß das Minimieren
gemäß der Simplex-Methode erfolgt.
8. Verfahren nach Anspruch 2 oder Anspruch 7, dadurch gekennzeichnet, daß
die Ausrichtung des Konformator-Anwärters und eines Bezugsmoleküls
dargestellt wird.
9. Verfahren nach einem der Ansprüche 2, 7 oder 8, dadurch gekennzeichnet,
daß zusätzlich der Beitrag zur Minimierung derjenigen Gitterstellen
gewichtet wird, die für die Ausrichtung der Moleküle besonders signifikant
sein können, und wobei wahlweise die Auswirkung der gewählten
Gewichtungen auf die Molekular-Ausrichtung dargestellt wird.
10. Verfahren nach einem der Ansprüche 2, 7, 8 oder 9, dadurch
gekennzeichnet, daß ferner beispielsweise mittels der Simplex-Methode die
Effektivwert-Differenz der berechneten inneren Energien zwischen dem
auszurichtenden
Molekül (x) und einem Bezugsmolekül durch Veränderung von
Torsionswinkeln und innerer Geometrie des Moleküls (x) in vom Benutzer
vorgegebenen Einheiten minimiert wird, wobei wahlweise die Molekular-
Ausrichtung dargestellt wird.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß in einem
zusätzlichen Schritt die Beiträge zur Minimierung von Feld-Differenzen,
sterischer Kanten-Abstoßung und unterschiedlichen inneren Energien bei
Änderung von Torsionswinkeln und inneren Geometrien gewichtet werden,
wobei wahlweise die Auswirkung der gewählten Gewichtungen auf die
Molekular-Ausrichtung dargestellt wird.
12. Verfahren zum Bestimmen der wahrscheinlichen biologischen oder
chemischen Aktivität eines Testmoleküls, für dessen Grundstruktur ein
dreidimensionales Gittermodell durch Vergleich seiner dreidimensionalen
Gestalt mit derjenigen anderer Moleküle von bekannter biologischer oder
chemischer Aktivität erstellt wurde, gekennzeichnet durch folgende
Verfahrensschritte:
i Bestimmen des 3D-QSAR der Moleküle bekannter Aktivität gemäß
Verfahren nach einem der vorhergehenden Ansprüche;
ii Ausrichten des Testmoleküls auf die Moleküle bekannter Aktivität;
und
iii Anwenden der in Schritt i erhaltenen Lösungskoeffizienten auf die
Wechseiwirkungsenergien des Testmoleküls zur Vorhersage des
biologischen oder chemischen Parameterwerts des Testmoleküls.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß in einem
weiteren Schritt die berechneten Wechselwirkungsenergien für das
Testmolekül aufgrund der gemäß Schritt i erhaltenen Lösungskoeffizienten
dargestellt werden, um Vergleichsgebiete von Ähnlichkeiten bzw.
Unterschieden sichtbar zu machen.
14. Computergestütztes System zum Erzeugen und Sichtbarmachen einer
dreidimensionalen quantitativen Struktur-Aktivitäts-Beziehung (3D-QSAR)
einer Reihe von Molekülen aufgrund der Annahme, daß relevante
biologische Parameter, z.B. Bindungs-Affinität, mit einer Linearkombination
gewichteter Beiträge einer Anzahl von Form-Deskriptoren für jedes Molekül
der Reihe korrelieren, gekennzeichnet durch:
a) Mittel zum Definieren von Molekülform-Deskriptoren für jedes
Molekül (x) der Reihe durch Computer-Berechnung zumindest
sterischer (Sx(N)) und elektrostatischer (Ex(N)) Wechselwirkungs-
Energien zwischen einer mathematischen Darstellung einer Sonde
und dem Molekül an es umgebenden vorbestimmten Gitterpunkten
(N);
b) Mittel zum Bestimmen eines repräsentativen Konformators für jedes
Molekül (x) der Reihe derart, daß durch Änderung von Lage
und/oder Torsionswinkel eines Konformator-Anwärters dieser sich
zu mindestens einem Bezugsmolekül hin ausrichtet;
c) Mittel zum Definieren einer Anzahl von Gleichungen, wobei jede
Gleichung einem Molekül der Reihe entspricht und in jeder
Gleichung ein gemessener biologischer Parameter (Valuex) des
betreffenden Moleküls (x) gleich einer gewichteten Linearkombination der
Molekülform-Deskriptoren (Sx(N), Ex(N)) gesetzt wird, wobei die
Koeffizienten (bx, A&sub0;&sub0;&sub1;, A&sub0;&sub0;&sub2;, ..., AN, a&sub0;&sub0;&sub1;, a&sub0;&sub0;&sub2;, ..., aN) der
gewichteten Linearkombination unbekannt sind und wobei die Anzahl von
Gleichungen ein Gleichungssystem bildet, das viel mehr Unbekannte
als Gleichungen aufweist;
d) Mittel zum Gewinnen einer Anfangslösung für das Gleichungssystem
durch Anwendung einer Teil-Fehlerquadratmethode (PLS) der
mehrdimensionalen Analysis, wobei die Anfangslösung von
derjenigen Gruppe von Koeffizienten gebildet wird, die einer Erfüllung
jeder Gleichung am nächsten kommt;
e) Mittel zum Berechnen eines Vergleichstest-Parameters (r²) zur
Feststellung, wann die biologischen Parameter durch den Mittelwert
aller gemessenen Werte besser abgeschätzt werden als durch die
bei Anwendung der PLS-Läsung erhaltenen Werte;
f) Mittel zum Ausführen einer zyklischen Vergleichstest-Prozedur, so
daß
f1) durch Ausschließen mindestens einer Gleichung aus dem
Gleichungssystem und durch Wiederholung der PLS-Analysis
an einem somit reduzierten Gleichungssystem eine
Alternativgruppe von Gleichungskoeffizienten gefunden wird
(CINTERCEPT, A001', ..., AN', A001', ..., aN'; Fig. 2);
f2) die Alternativgruppe von Gleichungskoeffizienten dazu benutzt
wird, den biologischen Parameter (V) desjenigen Moleküls
vorherzusagen, das der ausgeschlossenen Gleichung
entspricht;
f3) der Vergleichstest-Parameter (r²) neu zur Feststellung
berechnet wird, ob die Alternativkoeffizienten bessere
Vorhersagewerte liefern;
f4) der Vergleichstest-Zyklus ab Schritt f1) wiederholt wird, so daß
wenigstens eine weitere Gleichung aus dem Gleichungssystem
ausgeschlossen wird;
g) Mittel zum Wiederholen des Vergleichstest-Zyklus so oft, wie ein
Benutzer vorgibt, und Mittel zum für ihn sichtbaren Darstellen von für
gefundene Lösungs-Terme repräsentativen Werten unter
Anwendung von Computergrafik.
15. System nach Anspruch 14, dadurch gekennzeichnet, daß im Schritt b) ein
am ehesten repräsentativer Konformator mittels einer
Field-Fit-Ausrichtungsroutine derart bestimmt wird, daß man die Effektivwert-Differenz der
Summe der über alle Gitterpunkte gemittelten sterischen und
elektrostatischen Wechselwirkungsenergien zwischen dem Konformator-Anwärter und
mindestens einem Bezugsmolekül durch Ändern von Lage und/oder
Torsionswinkel des Konformator-Anwärters minimiert.
16. System nach Anspruch 15, dadurch gekennzeichnet, daß Schritt b) mittels
der Orient-or-Fit-Methode (Ausrichten oder An-/Einpassen) ausgeführt
wird.
17. System nach einem der Ansprüche 14 bis 16, dadurch gekennzeichnet,
daß die Wechselwirkungsenergien gemäß einer Boltzmann-Verteilung über
die Konformatorenergien gewichtet werden.
18. System nach einem der Ansprüche 14 bis 17, gekennzeichnet durch Mittel
zum Darstellen der Lösungs-Terme in Punkten des Gitter-Raums
entsprechenden dreidimensionalen Streu-Diagrammen und wahlweise durch
Mittel zum Überlagern eines Molekularmodells auf die Streu-Diagramme.
19. System nach einem der Ansprüche 14 bis 17, gekennzeichnet durch Mittel
zum Darstellen der Lösungs-Terme in dreidimensionalen
Kontur-Diagrammen, die Volumina im Gitter-Raum definieren, und wahlweise durch
Mittel zum Überlagern eines Molekularmodells auf die Kontur-Diagramme.
20. System nach Anspruch 19, dadurch gekennzeichnet, daß die Minimierung
gemäß der Simplex-Methode erfolgt.
21. System nach Anspruch 15 oder Anspruch 20, gekennzeichnet durch Mittel
zum Darstellen der Ausrichtung des Konformator-Anwärters und eines
Bezugsmoleküls.
22. System nach einem der Ansprüche 15, 20 oder 21, zusätzlich
gekennzeichnet durch Mittel für das Gewichten des Beitrags zur Minimierung
derjenigen Gitterstellen, die für die Ausrichtung der Moleküle besonders
signifikant sein können, und wahlweise durch Mittel zum Darstellen der
Auswirkung der gewählten Gewichtungen auf die Molekular-Ausrichtung.
23. System nach einem der Ansprüche 15 oder 20 bis 22, ferner
gekennzeichnet durch Mittel zur Minimierung, beispielsweise mittels der Simplex-
Methode, der Effektivwert-Differenz der berechneten inneren Energien
zwischen dem auszurichtenden Molekül (x) und einem Bezugsmolekül
durch Veränderung von Torsionswinkeln und innerer Geometrie des
Moleküls (x) in vom Benutzer vorgegebenen Einheiten und wahlweise
durch Mittel zum Darstellen der Molekular-Ausrichtung.
24. System nach Anspruch 23, ferner gekennzeichnet durch Mittel für das
Gewichten der Beiträge zur Minimierung von Feld-Differenzen, sterischer
Kanten-Abstoßung und unterschiedlichen inneren Energien bei Änderung
von Torsionswinkeln und inneren Geometrien und wahlweise durch Mittel
zum Darstellen der Auswirkung der gewählten Gewichtungen auf die
Molekular-Ausrichtung.
25. System zum Bestimmen der wahrscheinlichen biologischen oder
chemischen Aktivität eines Testmoleküls, für dessen Grundstruktur ein
dreidimensionales Gittermodell durch Vergleich seiner dreidimensionalen
Gestalt mit derjenigen anderer Moleküle von bekannter biologischer oder
chemischer Aktivität erstellt wurde, gekennzeichnet durch Mittel zum:
i Bestimmen des 3D-QSAR der Moleküle bekannter Aktivität mit dem
System nach einem der Ansprüche 14 bis 24;
ii Ausrichten des Testmoleküls auf die Moleküle bekannter Aktivität;
und
iii Anwenden der in Schritt i erhaltenen Lösungskoeffizienten auf die
Wechseiwirkungsenergien des Testmoleküls zur Vorhersage des
biologischen oder chemischen Parameterwerts des Testmoleküls.
26. System nach Anspruch 25, gekennzeichnet durch Mittel zum Darstellen der
berechneten Wechselwirkungsenergien für das Testmolekül aufgrund der
gemäß Schritt i erhaltenen Lösungskoeffizienten, um Vergleichsgebiete von
Ähnlichkeiten bzw. Unterschieden sichtbar zu machen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US1991/004292 WO1992022875A1 (en) | 1991-06-17 | 1991-06-17 | COMPARATIVE MOLECULAR FIELD ANALYSIS (CoMFA) |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69125399D1 DE69125399D1 (de) | 1997-04-30 |
DE69125399T2 true DE69125399T2 (de) | 1997-10-23 |
Family
ID=1239656
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69125399T Expired - Lifetime DE69125399T2 (de) | 1991-06-17 | 1991-06-17 | Vergleichende molekulare feldanalyse |
DE0592421T Pending DE592421T1 (de) | 1991-06-17 | 1991-06-17 | Vergleichende molekulare feldzerlegung. |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE0592421T Pending DE592421T1 (de) | 1991-06-17 | 1991-06-17 | Vergleichende molekulare feldzerlegung. |
Country Status (7)
Country | Link |
---|---|
US (2) | US5025388A (de) |
EP (1) | EP0592421B1 (de) |
JP (1) | JPH06503908A (de) |
DE (2) | DE69125399T2 (de) |
DK (1) | DK0592421T3 (de) |
GB (1) | GB2266391A (de) |
WO (1) | WO1992022875A1 (de) |
Families Citing this family (138)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5025388A (en) * | 1988-08-26 | 1991-06-18 | Cramer Richard D Iii | Comparative molecular field analysis (CoMFA) |
US5260882A (en) * | 1991-01-02 | 1993-11-09 | Rohm And Haas Company | Process for the estimation of physical and chemical properties of a proposed polymeric or copolymeric substance or material |
US5200910A (en) * | 1991-01-30 | 1993-04-06 | The Board Of Trustees Of The Leland Stanford University | Method for modelling the electron density of a crystal |
JP2565005B2 (ja) * | 1991-03-08 | 1996-12-18 | 富士通株式会社 | 異種結晶の合成装置 |
US5241470A (en) * | 1992-01-21 | 1993-08-31 | The Board Of Trustees Of The Leland Stanford University | Prediction of protein side-chain conformation by packing optimization |
US6370479B1 (en) * | 1992-02-06 | 2002-04-09 | Fujitsu Limited | Method and apparatus for extracting and evaluating mutually similar portions in one-dimensional sequences in molecules and/or three-dimensional structures of molecules |
US5353236A (en) * | 1992-04-23 | 1994-10-04 | The Board Of Trustees Of The Leland Stanford University | High-resolution crystallographic modelling of a macromolecule |
US5420805A (en) * | 1992-05-05 | 1995-05-30 | The Trustees Of Columbia University In The City Of New York | Method and apparatus for designing molecular structures using an analytical solution for effective born radii |
US5742290A (en) * | 1992-09-03 | 1998-04-21 | Fujitsu Limited | Molecular orbital modeling system with an improved function processor |
US5581476A (en) * | 1993-01-28 | 1996-12-03 | Amgen Inc. | Computer-based methods and articles of manufacture for preparing G-CSF analogs |
US5524188A (en) * | 1993-03-01 | 1996-06-04 | Halpern Software, Inc. | Viewing three dimensional objects by rotational wobble about multiple axes |
US5884230A (en) * | 1993-04-28 | 1999-03-16 | Immunex Corporation | Method and system for protein modeling |
US5453937A (en) * | 1993-04-28 | 1995-09-26 | Immunex Corporation | Method and system for protein modeling |
US5703792A (en) * | 1993-05-21 | 1997-12-30 | Arris Pharmaceutical Corporation | Three dimensional measurement of molecular diversity |
US6081766A (en) * | 1993-05-21 | 2000-06-27 | Axys Pharmaceuticals, Inc. | Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics |
US5434796A (en) * | 1993-06-30 | 1995-07-18 | Daylight Chemical Information Systems, Inc. | Method and apparatus for designing molecules with desired properties by evolving successive populations |
US5495423A (en) * | 1993-10-25 | 1996-02-27 | Trustees Of Boston University | General strategy for vaccine and drug design |
US5553004A (en) * | 1993-11-12 | 1996-09-03 | The Board Of Trustees Of The Leland Stanford Jr. University | Constrained langevin dynamics method for simulating molecular conformations |
AU1297995A (en) * | 1993-11-26 | 1995-06-13 | Lawrence B Hendry | Design of drugs involving receptor-ligand-dna interactions |
JP3235763B2 (ja) * | 1994-02-28 | 2001-12-04 | 富士通株式会社 | 共通構造抽出装置 |
US5577239A (en) * | 1994-08-10 | 1996-11-19 | Moore; Jeffrey | Chemical structure storage, searching and retrieval system |
US5687090A (en) * | 1994-09-01 | 1997-11-11 | Aspen Technology, Inc. | Polymer component characterization method and process simulation apparatus |
US5463564A (en) * | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
US5740072A (en) * | 1994-10-07 | 1998-04-14 | The Trustees Of Columbia Universuty In The City Of New York | Rapidly convergent method for boltzmann-weighted ensemble generation in free energy simulations |
JPH08123781A (ja) * | 1994-10-20 | 1996-05-17 | Fujitsu Ltd | 3次元化合物構造式の周辺空間情報を数値データへ変換する方法、並びに、3次元化合物構造式とその周辺空間との相互作用を数値データへ変換する方法 |
US5612894A (en) * | 1995-02-08 | 1997-03-18 | Wertz; David H. | System and method for molecular modeling utilizing a sensitivity factor |
US5621671A (en) * | 1995-03-17 | 1997-04-15 | The United States Of America As Represented By The Secretary Of The Navy | Digital simulation of organismal growth |
US6341256B1 (en) | 1995-03-31 | 2002-01-22 | Curagen Corporation | Consensus configurational bias Monte Carlo method and system for pharmacophore structure determination |
US5657255C1 (en) * | 1995-04-14 | 2002-06-11 | Interleukin Genetics Inc | Hierarchic biological modelling system and method |
US5784294A (en) * | 1995-06-09 | 1998-07-21 | International Business Machines Corporation | System and method for comparative molecular moment analysis (CoMMA) |
US5978740A (en) | 1995-08-09 | 1999-11-02 | Vertex Pharmaceuticals Incorporated | Molecules comprising a calcineurin-like binding pocket and encoded data storage medium capable of graphically displaying them |
US6266622B1 (en) * | 1995-12-13 | 2001-07-24 | Regents Of The University Of California | Nuclear receptor ligands and ligand binding domains |
US6185506B1 (en) * | 1996-01-26 | 2001-02-06 | Tripos, Inc. | Method for selecting an optimally diverse library of small molecules based on validated molecular structural descriptors |
AU1847997A (en) * | 1996-01-26 | 1997-08-20 | Robert D. Clark | Method of creating and searching a molecular virtual library using validated molecular structure descriptors |
US6622094B2 (en) * | 1996-02-15 | 2003-09-16 | The Trustees Of Columbia University In The City Of New York | Method for determining relative energies of two or more different molecules |
EA001095B1 (ru) * | 1996-03-22 | 2000-10-30 | Юниверсити Оф Гуелф | Компьютерный способ создания химических структур, имеющих общие функциональные характеристики |
US6108635A (en) * | 1996-05-22 | 2000-08-22 | Interleukin Genetics, Inc. | Integrated disease information system |
US5989835A (en) | 1997-02-27 | 1999-11-23 | Cellomics, Inc. | System for cell-based screening |
US5751605A (en) * | 1996-08-15 | 1998-05-12 | Tripos, Inc. | Molecular hologram QSAR |
GB2317030A (en) * | 1996-08-30 | 1998-03-11 | Xenova Ltd | Defining a pharmacophore for the design of MDR modulators |
JP2001507675A (ja) * | 1996-11-04 | 2001-06-12 | 3―ディメンショナル ファーマシューティカルズ インコーポレイテッド | 所望の特性を有する化合物を識別するシステム、方法、コンピュータ・プログラム製品 |
US6453246B1 (en) | 1996-11-04 | 2002-09-17 | 3-Dimensional Pharmaceuticals, Inc. | System, method, and computer program product for representing proximity data in a multi-dimensional space |
US6571227B1 (en) * | 1996-11-04 | 2003-05-27 | 3-Dimensional Pharmaceuticals, Inc. | Method, system and computer program product for non-linear mapping of multi-dimensional data |
US6219440B1 (en) | 1997-01-17 | 2001-04-17 | The University Of Connecticut | Method and apparatus for modeling cellular structure and function |
US5866343A (en) * | 1997-04-15 | 1999-02-02 | Universite De Montreal | Energetically favorable binding site determination between two molecules |
JP2002514224A (ja) | 1997-06-02 | 2002-05-14 | ザ レジェンツ オブ ザ ユニバーシティー オブ カリフォルニア | プリオン蛋白質調節因子(ppmf)およびプリオン抵抗性動物 |
US5962669A (en) * | 1997-06-02 | 1999-10-05 | The Regents Of The University Of California | Nucleic acid encoding prion protein variant |
US6829540B1 (en) | 1997-08-22 | 2004-12-07 | Purdue Research Foundation | Drug discovery using multiple membrane mimetic affinities |
US6460014B1 (en) | 1997-09-05 | 2002-10-01 | Accelrys Inc. | Modeling interactions with atomic parameters including anisotropic dipole polarizability |
US6051029A (en) * | 1997-10-31 | 2000-04-18 | Entelos, Inc. | Method of generating a display for a dynamic simulation model utilizing node and link representations |
US6069629A (en) * | 1997-11-25 | 2000-05-30 | Entelos, Inc. | Method of providing access to object parameters within a simulation model |
US6078739A (en) * | 1997-11-25 | 2000-06-20 | Entelos, Inc. | Method of managing objects and parameter values associated with the objects within a simulation model |
US6708141B1 (en) | 1998-01-16 | 2004-03-16 | The University Of Connecticut | Method for modeling cellular structure and function |
GB9803466D0 (en) | 1998-02-19 | 1998-04-15 | Chemical Computing Group Inc | Discrete QSAR:a machine to determine structure activity and relationships for high throughput screening |
US7110888B1 (en) * | 1998-02-26 | 2006-09-19 | Openeye Scientific Software, Inc. | Method for determining a shape space for a set of molecules using minimal metric distances |
EP1057014B1 (de) * | 1998-02-26 | 2012-06-06 | Openeye Scientific Software, Inc. | Bestimmung einer raumform für einen satz von molekülen unter verwendung von minimal metrischen distanzen |
CA2330458A1 (en) * | 1998-04-29 | 1999-11-04 | Georgetown University | Methods of identifying and using hla binding compounds as hla-agonists and antagonists |
US6839634B1 (en) | 1998-09-11 | 2005-01-04 | The Institute Of Physical And Chemical Research | Method for predicting reaction characteristics of molecules |
IL142765A0 (en) | 1998-11-13 | 2002-03-10 | Cellomics Inc | Methods and system for efficient collection and storage of experimental data |
WO2000045334A1 (en) * | 1999-01-27 | 2000-08-03 | The Scripps Research Institute | Protein modeling tools |
US7912689B1 (en) * | 1999-02-11 | 2011-03-22 | Cambridgesoft Corporation | Enhancing structure diagram generation through use of symmetry |
US7295931B1 (en) * | 1999-02-18 | 2007-11-13 | Cambridgesoft Corporation | Deriving fixed bond information |
US6904423B1 (en) | 1999-02-19 | 2005-06-07 | Bioreason, Inc. | Method and system for artificial intelligence directed lead discovery through multi-domain clustering |
EP1163613A1 (de) * | 1999-02-19 | 2001-12-19 | Bioreason, Inc. | Verfahren und system zum auf künstlicher intelligenz basierendem auffinden von leitstrukturen durch multidomänen-gruppierung |
US7356415B1 (en) | 1999-03-24 | 2008-04-08 | International Business Machines Corporation | Similarity searching of molecules based upon descriptor vectors characterizing molecular regions |
US6349265B1 (en) * | 1999-03-24 | 2002-02-19 | International Business Machines Corporation | Method and apparatus for mapping components of descriptor vectors for molecular complexes to a space that discriminates between groups |
EP1173814A2 (de) | 1999-04-16 | 2002-01-23 | Entelos, Inc. | Verfahren und apparat zur durchführung von verbundenen simulationen mittels eines computer-gestützten modells |
US6343257B1 (en) * | 1999-04-23 | 2002-01-29 | Peptor Ltd. | Identifying pharmacophore containing combinations of scaffold molecules and substituents from a virtual library |
AU4661300A (en) * | 1999-04-26 | 2000-11-10 | Novascreen Biosciences Corporation | Receptor selectivity mapping |
US6555660B2 (en) * | 2000-01-10 | 2003-04-29 | Maxygen Holdings Ltd. | G-CSF conjugates |
US6646110B2 (en) * | 2000-01-10 | 2003-11-11 | Maxygen Holdings Ltd. | G-CSF polypeptides and conjugates |
US6831158B2 (en) * | 2000-01-10 | 2004-12-14 | Maxygen Holdings Ltd. | G-CSF conjugates |
CA2396495A1 (en) | 2000-01-25 | 2001-08-02 | Cellomics, Inc. | Method and system for automated inference creation of physico-chemical interaction knowledge from databases of co-occurrence data |
US6898533B1 (en) | 2000-02-01 | 2005-05-24 | The United States Of America As Represented By The Department Of Health And Human Services | Methods for predicting the biological, chemical, and physical properties of molecules from their spectral properties |
WO2001057495A2 (en) * | 2000-02-01 | 2001-08-09 | The Government Of The United States Of America As Represented By The Secretary, Department Of Health & Human Services | Methods for predicting the biological, chemical, and physical properties of molecules from their spectral properties |
US6625585B1 (en) | 2000-02-18 | 2003-09-23 | Bioreason, Inc. | Method and system for artificial intelligence directed lead discovery though multi-domain agglomerative clustering |
US7416524B1 (en) | 2000-02-18 | 2008-08-26 | Johnson & Johnson Pharmaceutical Research & Development, L.L.C. | System, method and computer program product for fast and efficient searching of large chemical libraries |
WO2001065462A2 (en) | 2000-02-29 | 2001-09-07 | 3-Dimensional Pharmaceuticals, Inc. | Method and computer program product for designing combinatorial arrays |
US6907350B2 (en) * | 2000-03-13 | 2005-06-14 | Chugai Seiyaku Kabushiki Kaisha | Method, system and apparatus for handling information on chemical substances |
WO2001071624A1 (en) | 2000-03-22 | 2001-09-27 | 3-Dimensional Pharmaceuticals, Inc. | System, method, and computer program product for representing object relationships in a multidimensional space |
AU2001249805A1 (en) | 2000-04-03 | 2001-10-15 | 3-Dimensional Pharmaceuticals, Inc. | Method, system, and computer program product for representing object relationships in a multidimensional space |
US7356419B1 (en) | 2000-05-05 | 2008-04-08 | Cambridgesoft Corporation | Deriving product information |
US7272509B1 (en) * | 2000-05-05 | 2007-09-18 | Cambridgesoft Corporation | Managing product information |
WO2001089560A1 (en) * | 2000-05-24 | 2001-11-29 | The Board Of Trustees Of The Leland Stanford Junior University | Inhibitors of viral infection |
US20020025535A1 (en) * | 2000-06-15 | 2002-02-28 | Diller David J. | Prioritization of combinatorial library screening |
US6834239B2 (en) * | 2000-08-22 | 2004-12-21 | Victor S. Lobanov | Method, system, and computer program product for determining properties of combinatorial library products from features of library building blocks |
US6813615B1 (en) | 2000-09-06 | 2004-11-02 | Cellomics, Inc. | Method and system for interpreting and validating experimental data with automated reasoning |
WO2002025504A2 (en) * | 2000-09-20 | 2002-03-28 | Lobanov Victor S | Method, system, and computer program product for encoding and building products of a virtual combinatorial library |
WO2002036744A2 (en) * | 2000-11-02 | 2002-05-10 | Protein Mechanics, Inc. | Method for residual form in molecular modeling |
US7054757B2 (en) * | 2001-01-29 | 2006-05-30 | Johnson & Johnson Pharmaceutical Research & Development, L.L.C. | Method, system, and computer program product for analyzing combinatorial libraries |
AU2002256166A1 (en) * | 2001-04-25 | 2002-11-11 | Bristol-Myers Squibb Company | Method of molecular structure recognition |
WO2002102820A1 (en) | 2001-06-20 | 2002-12-27 | Nuevolution A/S | Nucleoside derivatives for library preparation |
JP4444652B2 (ja) | 2001-07-11 | 2010-03-31 | マキシゲン・ホールディングズ・リミテッド | G−csf結合体 |
US7516018B2 (en) * | 2001-07-25 | 2009-04-07 | Tripos, L.P. | Structural unit analysis |
US20030216871A1 (en) * | 2001-07-31 | 2003-11-20 | Artem Tcherkassov | Calculating a characteristic property of a molecule by correlation analysis |
US20030148386A1 (en) * | 2001-11-09 | 2003-08-07 | North Dakota State University | Method for drug design using comparative molecular field analysis (CoMFA) extended for multi-mode/multi-species ligand binding and disposition |
US7329222B2 (en) * | 2002-02-25 | 2008-02-12 | Tripos, L.P. | Comparative field analysis (CoMFA) utilizing topomeric alignment of molecular fragments |
US6671628B2 (en) | 2002-03-04 | 2003-12-30 | Chemnavigator, Inc. | Methods for identifying a molecule that may bind to a target molecule |
US7996156B2 (en) * | 2002-03-07 | 2011-08-09 | The United States Of America As Represented By The Secretary, Department Of Health And Human Services | Methods for predicting properties of molecules |
IL163822A0 (en) | 2002-03-15 | 2005-12-18 | Nuevolution As | An improved method for synthesising templated molecules |
JP2005529158A (ja) * | 2002-05-28 | 2005-09-29 | ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア | 両親媒性ポリマーのコンピュータ分析および設計のための方法、システムおよびコンピュータプログラム製品 |
US10730906B2 (en) | 2002-08-01 | 2020-08-04 | Nuevolutions A/S | Multi-step synthesis of templated molecules |
US20040034481A1 (en) * | 2002-08-16 | 2004-02-19 | Hurst John R. | Methods for identifying a prospective binding site on a target molecule and for characterizing a site on a target molecule |
GB2392746B (en) * | 2002-09-06 | 2004-07-28 | Cresset Biomolecular Discovery | Comparison of molecules using field points |
KR20050055752A (ko) * | 2002-10-07 | 2005-06-13 | 니폰 조키 세야쿠 가부시키가이샤 | 3차원 구조 활성상관법 |
PT1558744E (pt) | 2002-10-30 | 2011-09-22 | Nuevolution As | Codificação enzimática |
ATE450609T1 (de) | 2002-12-19 | 2009-12-15 | Nuevolution As | Durch quasizufallsstrukturen und funktionen geführte synthesemethode |
US20040186815A1 (en) * | 2002-12-20 | 2004-09-23 | Stockfisch Thomas P. | Method for accommodating missing descriptor and property data while training neural network models |
US7826979B2 (en) * | 2003-02-14 | 2010-11-02 | Vertex Pharmaceuticals Incorporated | Method of modeling complex formation between a query ligan and a target molecule |
US20070026397A1 (en) | 2003-02-21 | 2007-02-01 | Nuevolution A/S | Method for producing second-generation library |
ATE447626T1 (de) | 2003-09-18 | 2009-11-15 | Nuevolution As | Methode zur gewinnung struktureller informationen kodierter moleküle und zur selektion von verbindungen |
US20060052943A1 (en) * | 2004-07-28 | 2006-03-09 | Karthik Ramani | Architectures, queries, data stores, and interfaces for proteins and drug molecules |
US20060053174A1 (en) * | 2004-09-03 | 2006-03-09 | Bio Wisdom Limited | System and method for data extraction and management in multi-relational ontology creation |
US20060053171A1 (en) * | 2004-09-03 | 2006-03-09 | Biowisdom Limited | System and method for curating one or more multi-relational ontologies |
US20060053172A1 (en) * | 2004-09-03 | 2006-03-09 | Biowisdom Limited | System and method for creating, editing, and using multi-relational ontologies |
US20060053175A1 (en) * | 2004-09-03 | 2006-03-09 | Biowisdom Limited | System and method for creating, editing, and utilizing one or more rules for multi-relational ontology creation and maintenance |
US20060053173A1 (en) * | 2004-09-03 | 2006-03-09 | Biowisdom Limited | System and method for support of chemical data within multi-relational ontologies |
US20060053382A1 (en) * | 2004-09-03 | 2006-03-09 | Biowisdom Limited | System and method for facilitating user interaction with multi-relational ontologies |
US20060074833A1 (en) * | 2004-09-03 | 2006-04-06 | Biowisdom Limited | System and method for notifying users of changes in multi-relational ontologies |
US7496593B2 (en) | 2004-09-03 | 2009-02-24 | Biowisdom Limited | Creating a multi-relational ontology having a predetermined structure |
US7493333B2 (en) * | 2004-09-03 | 2009-02-17 | Biowisdom Limited | System and method for parsing and/or exporting data from one or more multi-relational ontologies |
US7505989B2 (en) | 2004-09-03 | 2009-03-17 | Biowisdom Limited | System and method for creating customized ontologies |
JP4688467B2 (ja) * | 2004-10-15 | 2011-05-25 | 株式会社菱化システム | 受容体−リガンド安定複合体構造探索方法 |
US7797144B2 (en) * | 2005-03-18 | 2010-09-14 | Eve Zoebisch | Molecular modeling method and system |
JP5137821B2 (ja) | 2005-06-01 | 2013-02-06 | マキシジェン, インコーポレイテッド | Peg化されたg−csfポリペプチドおよびその製造方法 |
DK3305900T3 (da) | 2005-12-01 | 2021-10-25 | Nuevolution As | Enzymatic encoding methods for efficient synthesis of large libraries |
US7860657B2 (en) * | 2006-03-24 | 2010-12-28 | Cramer Richard D | Forward synthetic synthon generation and its useto identify molecules similar in 3 dimensional shape to pharmaceutical lead compounds |
US20090228463A1 (en) * | 2008-03-10 | 2009-09-10 | Cramer Richard D | Method for Searching Compound Databases Using Topomeric Shape Descriptors and Pharmacophoric Features Identified by a Comparative Molecular Field Analysis (CoMFA) Utilizing Topomeric Alignment of Molecular Fragments |
US8374837B2 (en) * | 2008-06-04 | 2013-02-12 | Silicos Nv | Descriptors of three-dimensional objects, uses thereof and a method to generate the same |
ES2638324T3 (es) | 2009-02-13 | 2017-10-19 | X-Chem, Inc. | Métodos de creación y examen de bibliotecas codificadas por ADN |
LT2558577T (lt) | 2010-04-16 | 2019-03-12 | Nuevolution A/S | Bifunkciniai kompleksai ir tokių kompleksų gamybos ir naudojimo būdai |
EP2447865A1 (de) | 2010-10-29 | 2012-05-02 | COSMOlogic GmbH & Co. KG | Molekularfeldanalyse auf Basis von kosmischen Polarisierungsdichten |
AU2012304387B2 (en) | 2011-09-07 | 2017-03-16 | X-Chem, Inc. | Methods for tagging DNA-encoded libraries |
CN102682209B (zh) * | 2012-05-03 | 2014-11-05 | 桂林理工大学 | 有机污染物定量结构活性相关建模的变量筛选方法 |
NZ739931A (en) | 2012-07-13 | 2019-08-30 | X Chem Inc | Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases |
US8854361B1 (en) * | 2013-03-13 | 2014-10-07 | Cambridgesoft Corporation | Visually augmenting a graphical rendering of a chemical structure representation or biological sequence representation with multi-dimensional information |
CN103150482B (zh) * | 2013-03-28 | 2016-03-16 | 湖南中烟工业有限责任公司 | 一种基于pls确定烘丝工艺参数影响因子的方法 |
JP6273470B2 (ja) * | 2013-05-10 | 2018-02-07 | ナノフォトン株式会社 | 分子振動の表示方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4473889A (en) * | 1981-09-11 | 1984-09-25 | Leeds & Northrup Company | Remote correlation of sequence of events |
US4461619A (en) * | 1981-12-29 | 1984-07-24 | Medical College Of Georgia Research Inst. | Method of predicting biological activity of compounds by nucleic acid models |
JPS58175077A (ja) * | 1982-04-07 | 1983-10-14 | Nippon Kagaku Gijutsu Joho Center | 化合物の立体化学情報記憶方法及び装置 |
US4642762A (en) * | 1984-05-25 | 1987-02-10 | American Chemical Society | Storage and retrieval of generic chemical structure representations |
US4704692A (en) * | 1986-09-02 | 1987-11-03 | Ladner Robert C | Computer based system and method for determining and displaying possible chemical structures for converting double- or multiple-chain polypeptides to single-chain polypeptides |
US4835708A (en) * | 1987-07-06 | 1989-05-30 | Spectra Physics, Inc. | Method and apparatus for analysis of chromatograms using cross-correlation and moment analysis |
JPH01159767A (ja) * | 1987-12-16 | 1989-06-22 | Toshiba Corp | 化学分子構造表示装置 |
US5025388A (en) * | 1988-08-26 | 1991-06-18 | Cramer Richard D Iii | Comparative molecular field analysis (CoMFA) |
EP0768377A1 (de) * | 1988-09-02 | 1997-04-16 | Protein Engineering Corporation | Herstellung und Auswahl von Rekombinantproteinen mit verschiedenen Bindestellen |
EP0431189A4 (en) * | 1989-06-30 | 1992-04-22 | Hitachi, Ltd. | Method of assisting material design and apparatus therefor |
JPH0353380A (ja) * | 1989-07-20 | 1991-03-07 | Fuji Photo Film Co Ltd | 化合物の対称性の処理方法 |
SE470430B (sv) * | 1989-09-18 | 1994-02-21 | Tore Brinck | Sätt att utnyttja kvantkemiska metoder vid molekyl-design |
-
1988
- 1988-08-26 US US07/237,491 patent/US5025388A/en not_active Expired - Lifetime
-
1991
- 1991-06-17 DE DE69125399T patent/DE69125399T2/de not_active Expired - Lifetime
- 1991-06-17 WO PCT/US1991/004292 patent/WO1992022875A1/en active IP Right Grant
- 1991-06-17 DE DE0592421T patent/DE592421T1/de active Pending
- 1991-06-17 DK DK91913619.2T patent/DK0592421T3/da active
- 1991-06-17 JP JP3512615A patent/JPH06503908A/ja active Pending
- 1991-06-17 US US07/716,824 patent/US5307287A/en not_active Expired - Lifetime
- 1991-06-17 EP EP91913619A patent/EP0592421B1/de not_active Expired - Lifetime
-
1993
- 1993-07-20 GB GB9315049A patent/GB2266391A/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
DE69125399D1 (de) | 1997-04-30 |
GB9315049D0 (en) | 1993-09-01 |
EP0592421B1 (de) | 1997-03-26 |
EP0592421A4 (de) | 1994-08-31 |
DK0592421T3 (da) | 1997-10-06 |
EP0592421A1 (de) | 1994-04-20 |
WO1992022875A1 (en) | 1992-12-23 |
US5307287A (en) | 1994-04-26 |
GB2266391A (en) | 1993-10-27 |
DE592421T1 (de) | 1994-08-18 |
US5025388A (en) | 1991-06-18 |
JPH06503908A (ja) | 1994-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69125399T2 (de) | Vergleichende molekulare feldanalyse | |
DE69704438T2 (de) | Verfahren,vorrichtung und programm zur synthesebasierten simulation von chemikalien mit biologischen funktionen | |
Kettaneh et al. | PCA and PLS with very large data sets | |
DE69424427T2 (de) | Verfahren zum entwerfen von molekülen mit gesuchten eigenschaften bei aufeinanderfolgender populationsentwicklung | |
DE19642651B4 (de) | Verfahren und Rechnersystem zur Erkennung konformationsflexibler Moleküle | |
Anzali et al. | The comparison of geometric and electronic properties of molecular surfaces by neural networks: Application to the analysis of corticosteroid-binding globulin activity of steroids | |
DE19646624B4 (de) | Verfahren und Computersystem zur Identifizierung konformationselastischer Moleküle | |
US6219440B1 (en) | Method and apparatus for modeling cellular structure and function | |
DE69535463T2 (de) | Ersatz für Zielobjekte und verbesserte Referenzplatten | |
DE69228292T2 (de) | Gerät zur Erzeugung einer Zwangsbedingung in einem Molekulardynamik-Verfahren | |
Oprea et al. | Chemical information management in drug discovery: Optimizing the computational and combinatorial chemistry interfaces | |
DE112012001902T5 (de) | Vorrichtung, System und Verfahren zur Beurteilung der Wirksamkeit von Arzneistoffen anhand holistischer Analyse und Visualisierung von pharmakologischen Daten | |
EP1966733A2 (de) | Screening-verfahren | |
Hall | Semi-automated methods for simulation and measurement of amyloid fiber distributions obtained from transmission electron microscopy experiments | |
DE69815718T2 (de) | Verfahren zur vorhersage, identifizierung und beschreibung von molekülen die ein gewünschtes verhalten aufweisen, inbesondere im pharmazeutischen sektor und derart hergestellte moleküle | |
DE102022121889A1 (de) | System und Verfahren zur Entdeckung von einer arzneimittelaktiven Stelle im Protein unter Verwendung von pathogenen Mutationen | |
DE60213792T2 (de) | Vorrichtung zur automatisierung von untersuchungen chemischer reaktionskinetiken | |
Rieder et al. | Stochastic 3D microstructure modeling of twinned polycrystals for investigating the mechanical behavior of γ-TiAl intermetallics | |
Vargas-Cardona et al. | Tensor decomposition processes for interpolation of diffusion magnetic resonance imaging | |
Takahashi et al. | MolSpace: a computer desktop tool for visualization of massive molecular data | |
Bertini et al. | HiTSEE: A visualization tool for hit selection and analysis in high-throughput screening experiments | |
DE102019107952B4 (de) | Computer-implementiertes Verfahren zur Analyse von Messdaten eines Objekts | |
DE102018208587A1 (de) | Verfahren zur Auswertung von Rumpfelektronenspektren | |
EP1094415A2 (de) | Verfahren zur Identifizierung von Kandidatenmolekülen | |
DE60212830T2 (de) | Surf2lead |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |