JP4314128B2 - タンパク質立体構造と誘導適合を利用したリガンド探索方法 - Google Patents
タンパク質立体構造と誘導適合を利用したリガンド探索方法 Download PDFInfo
- Publication number
- JP4314128B2 JP4314128B2 JP2004048767A JP2004048767A JP4314128B2 JP 4314128 B2 JP4314128 B2 JP 4314128B2 JP 2004048767 A JP2004048767 A JP 2004048767A JP 2004048767 A JP2004048767 A JP 2004048767A JP 4314128 B2 JP4314128 B2 JP 4314128B2
- Authority
- JP
- Japan
- Prior art keywords
- ligand
- protein
- interaction
- search method
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000003446 ligand Substances 0.000 title claims abstract description 359
- 238000000034 method Methods 0.000 title claims abstract description 115
- 102000004169 proteins and genes Human genes 0.000 title claims description 195
- 108090000623 proteins and genes Proteins 0.000 title claims description 195
- 230000006698 induction Effects 0.000 title description 15
- 238000000329 molecular dynamics simulation Methods 0.000 claims abstract description 126
- 238000004364 calculation method Methods 0.000 claims abstract description 97
- 230000003993 interaction Effects 0.000 claims abstract description 74
- 238000004458 analytical method Methods 0.000 claims abstract description 63
- 238000005556 structure-activity relationship Methods 0.000 claims description 65
- 229910052739 hydrogen Inorganic materials 0.000 claims description 22
- 239000001257 hydrogen Substances 0.000 claims description 22
- 238000005457 optimization Methods 0.000 claims description 13
- 150000001413 amino acids Chemical class 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 10
- 230000002209 hydrophobic effect Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 4
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims description 2
- 238000000547 structure data Methods 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract description 25
- 125000004429 atom Chemical group 0.000 description 180
- 102000005962 receptors Human genes 0.000 description 69
- 108020003175 receptors Proteins 0.000 description 69
- 238000005481 NMR spectroscopy Methods 0.000 description 27
- 230000006870 function Effects 0.000 description 23
- 238000000126 in silico method Methods 0.000 description 23
- 150000001875 compounds Chemical class 0.000 description 20
- 230000008569 process Effects 0.000 description 14
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 13
- 230000033001 locomotion Effects 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 11
- 230000001939 inductive effect Effects 0.000 description 11
- 108010022394 Threonine synthase Proteins 0.000 description 10
- 102000004419 dihydrofolate reductase Human genes 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 239000002184 metal Substances 0.000 description 9
- 229910052751 metal Inorganic materials 0.000 description 9
- 239000003814 drug Substances 0.000 description 8
- 238000003032 molecular docking Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000013537 high throughput screening Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 101710113864 Heat shock protein 90 Proteins 0.000 description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 102000043136 MAP kinase family Human genes 0.000 description 4
- 108091054455 MAP kinase family Proteins 0.000 description 4
- 239000003905 agrochemical Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- JBTHDAVBDKKSRW-UHFFFAOYSA-N chembl1552233 Chemical compound CC1=CC(C)=CC=C1N=NC1=C(O)C=CC2=CC=CC=C12 JBTHDAVBDKKSRW-UHFFFAOYSA-N 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 3
- 102000012479 Serine Proteases Human genes 0.000 description 3
- 108010022999 Serine Proteases Proteins 0.000 description 3
- 230000009073 conformational modification Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 150000002739 metals Chemical class 0.000 description 3
- 238000012900 molecular simulation Methods 0.000 description 3
- 230000000452 restraining effect Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 102000031716 FMN binding proteins Human genes 0.000 description 2
- 101710106548 FMN-binding protein Proteins 0.000 description 2
- 108010057366 Flavodoxin Proteins 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 2
- 102000056189 Neutrophil collagenases Human genes 0.000 description 2
- 108030001564 Neutrophil collagenases Proteins 0.000 description 2
- 235000009827 Prunus armeniaca Nutrition 0.000 description 2
- 244000018633 Prunus armeniaca Species 0.000 description 2
- 101100536885 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) THI5 gene Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000000324 molecular mechanic Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 2
- 238000005381 potential energy Methods 0.000 description 2
- 230000006916 protein interaction Effects 0.000 description 2
- 238000002922 simulated annealing Methods 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- MAXSFYCTFIBEAR-MHHWUYOGSA-N (c8-s)-hydantocidin 5'-phosphate Chemical compound O=C1N(CCC[C@H](N(O)CO)C(O)=O)C(=O)N[C@@]11[C@H](O)[C@@H](O)[C@H](COP(O)(O)=O)O1 MAXSFYCTFIBEAR-MHHWUYOGSA-N 0.000 description 1
- VKUYLANQOAKALN-UHFFFAOYSA-N 2-[benzyl-(4-methoxyphenyl)sulfonylamino]-n-hydroxy-4-methylpentanamide Chemical compound C1=CC(OC)=CC=C1S(=O)(=O)N(C(CC(C)C)C(=O)NO)CC1=CC=CC=C1 VKUYLANQOAKALN-UHFFFAOYSA-N 0.000 description 1
- YPWRJTJVIGMPLE-UHFFFAOYSA-N 3-methylhexa-2,4-dienoic acid Chemical compound CC=CC(C)=CC(O)=O YPWRJTJVIGMPLE-UHFFFAOYSA-N 0.000 description 1
- QICPQLFMWYQJGX-SFHVURJKSA-N 4-[5-[2-(1-phenyl-ethylamino)-pyrimidin-4-yl]-1-methyl-4-(3-trifluoromethylphenyl)-1h-imidazol-2-yl]-piperidine Chemical compound N([C@@H](C)C=1C=CC=CC=1)C(N=1)=NC=CC=1C(N1C)=C(C=2C=C(C=CC=2)C(F)(F)F)N=C1C1CCNCC1 QICPQLFMWYQJGX-SFHVURJKSA-N 0.000 description 1
- GIFWOCOOXAZRCD-UHFFFAOYSA-N 5-[(3,4,5-trimethylphenyl)methyl]pyrimidine-2,4-diamine Chemical compound Cc1cc(Cc2cnc(N)nc2N)cc(C)c1C GIFWOCOOXAZRCD-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- CKGQHMVEFZTUHZ-UHFFFAOYSA-N CC(C)CC(B(O)O)NC(C(CCC1)N1C(CC(C(c1ccccc1)c1ccccc1)NC(Oc1ccccc1)=O)=O)=O Chemical compound CC(C)CC(B(O)O)NC(C(CCC1)N1C(CC(C(c1ccccc1)c1ccccc1)NC(Oc1ccccc1)=O)=O)=O CKGQHMVEFZTUHZ-UHFFFAOYSA-N 0.000 description 1
- XWIBUJIGYVOQRK-UHFFFAOYSA-N CC(N(CC1)CCN1C(C(Cc1cccc(C(N)N)c1)NS(c1cc2ccccc2cc1)(=O)=O)=O)=O Chemical compound CC(N(CC1)CCN1C(C(Cc1cccc(C(N)N)c1)NS(c1cc2ccccc2cc1)(=O)=O)=O)=O XWIBUJIGYVOQRK-UHFFFAOYSA-N 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102100030416 Stromelysin-1 Human genes 0.000 description 1
- 101710108790 Stromelysin-1 Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- QTQAWLPCGQOSGP-VKNBREQOSA-N [(3r,5r,6s,7r,8e,10r,11r,12z,14e)-6-hydroxy-5,11,21-trimethoxy-3,7,9,15-tetramethyl-16,20,22-trioxo-17-azabicyclo[16.3.1]docosa-1(21),8,12,14,18-pentaen-10-yl] carbamate Chemical compound N1C(=O)\C(C)=C\C=C/[C@@H](OC)[C@H](OC(N)=O)\C(C)=C\[C@@H](C)[C@H](O)[C@H](OC)C[C@H](C)CC2=C(OC)C(=O)C=C1C2=O QTQAWLPCGQOSGP-VKNBREQOSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- XFILPEOLDIKJHX-QYZOEREBSA-N batimastat Chemical compound C([C@@H](C(=O)NC)NC(=O)[C@H](CC(C)C)[C@H](CSC=1SC=CC=1)C(=O)NO)C1=CC=CC=C1 XFILPEOLDIKJHX-QYZOEREBSA-N 0.000 description 1
- 229950001858 batimastat Drugs 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000005421 electrostatic potential Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- FVTCRASFADXXNN-SCRDCRAPSA-N flavin mononucleotide Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-SCRDCRAPSA-N 0.000 description 1
- FVTCRASFADXXNN-UHFFFAOYSA-N flavin mononucleotide Natural products OP(=O)(O)OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-UHFFFAOYSA-N 0.000 description 1
- 239000011768 flavin mononucleotide Substances 0.000 description 1
- 229940013640 flavin mononucleotide Drugs 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000012482 interaction analysis Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 238000001814 protein method Methods 0.000 description 1
- 230000006333 protein structural change Effects 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 235000019231 riboflavin-5'-phosphate Nutrition 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- IEDVJHCEMCRBQM-UHFFFAOYSA-N trimethoprim Chemical compound COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 IEDVJHCEMCRBQM-UHFFFAOYSA-N 0.000 description 1
- NOYPYLRCIDNJJB-UHFFFAOYSA-N trimetrexate Chemical compound COC1=C(OC)C(OC)=CC(NCC=2C(=C3C(N)=NC(N)=NC3=CC=2)C)=C1 NOYPYLRCIDNJJB-UHFFFAOYSA-N 0.000 description 1
- 229960001099 trimetrexate Drugs 0.000 description 1
- 238000003041 virtual screening Methods 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Library & Information Science (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Biochemistry (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
更に、本発明は、この方法で得られるリガンド、前期方法に使用可能なデータベース、データベース構造、及びコンピューターソフトプログラム、これを搭載したコンピュータやインターフェース等にも関する。
リガンドとタンパク質との相互作用における水素結合に着目し、タンパク質中の水素結合サイトを空間点として指定する。水素結合における重要事項は距離と角度である。つまり、角度を計算するためには、水素結合ドナー(以後、ドナー)に水素原子が必要になる。
リガンドの構造活性相関(SAR)情報に着目し、以下の項目を入力情報にすることにした。
Erot=Krot(φ―φ0)2
Erotはタンパク質の立体構造中において主鎖原子の2面角のエネルギーのことを示す。
φは主鎖原子の2面角。
φ0は主鎖原子の2面角の標準値。
Krotの値が大きい場合はφはφ0に拘束される。
Epos=Kpos(r−r0)2
Eposはタンパク質の立体構造中において主鎖原子の位置のエネルギーのことを示す。
rは主鎖原子の座標。
r0は主鎖原子の座標の標準値。
Kposの値が大きい場合はrはr0に拘束される。
Mは衝突を不許可とする活性部位の原子の数、Nはリガンドの原子の数、「K衝突」は1000.0であることが好ましい。「R衝突(i,j)」は活性部位のi番目の原子とリガンドのj番目の原子それぞれのVan der Waals半径の和とした。
Mは活性部位の原子の数、Nはリガンドの原子の数、「K衝突」は1000.0であることが好ましい。「R衝突(i,j)」は活性部位のi番目の原子とリガンドのj番目の原子それぞれのVan der Waals半径の和とした。
Ev=w(hard shape region)、E=0(soft shape region)
hard shape regionとは、タンパク質の立体構造中、動的挙動の小さい部分であり、soft shape regionとは、動的挙動の大きい部分のことを指す。Wは定数で100であることが好ましい。
3次元座標を含むリガンドデータベースを用意する。リガンドデータベースとしては、例えば、ACD等のような市販化合物データベース、化合物を描いて収集した仮想化合物データを用いることができる。ガンドのデータベースは分子力学法等に用いて3次元化することが望ましい。
ステップ0で定められたリガンドデータベースから特定リガンドを探索するための標的タンパク質を選択し、3次元座標を入手する。3次元座標は、公共データベースであるPDBやホモロジーモデリング法等で作成した立体構造座標を用いることが望ましい。
ステップ10で定められた参照タンパク質の動的挙動を表すパラメータを基準振動解析法による計算結果のデータベースもしくは二次構造判定計算をおこない取得する。まず、基準振動解析法によるタンパク質の動的挙動を表すパラメータ取得方法について下記に示す。
ただし、
ただし、基準振動
主鎖の位置拘束エネルギー「U位置」を導入し、初期の受容体骨格の変動を抑えながらAPRICOT[Yoneda S. & Umeyama H. (1992) Free energy perturbation calculations on multiple mutation bases J. Chem. Phys. 97, 6730−6736]を用いて最小化(条件:温度300K、受容体の表面から水分子が最低2分子配置できる箱状水槽、力場:AMBER[S. J. Weiner, P.A. Kollman, D.A. Case, U.C. Singh, C. Ghio, G. Alagona, S. Profeta, &, P. Weiner (1984) A new force field for molecular mechanical simulation of nucleic acids and proteins J. Am. Chem. Soc. 106, 765−784])を行った。
U位置 = K位置 * R2
ここで、「K位置」は300.0、Rは基準座標からのずれとした。
U二面角 = K二面角 * (θ−θ平衡)2
θは二面角(単位rad)。
ステップ30で作成した複数のタンパク質立体構造座標のうち1つをランダムに選択する。タンパク質座標中の空間点は例えば以下のような方法で発生させる。
リガンドとタンパク質との相互作用における水素結合に着目し、タンパク質中の水素結合サイトを空間点として指定する。水素結合における重要事項は距離と角度である。つまり、角度を計算するためには、水素結合ドナー(以後、ドナー)に水素原子が必要になる。そこで、活性部位及びリガンドに水素原子が含まれていない場合、以下の規則によりダミー水素原子を発生させた。
リガンドの構造活性相関(SAR)情報に着目し、以下の項目を入力情報にすることにした。
距離行列を用いたアライメント作成アルゴリズム(DALI)[Holm, L., & Sander, C. (1993) Protein Structure Comparison by Alignment of Distance Matrices J. Mol. Biol. 233, 123−138]を低分子用に改良した手法で初期座標とリガンドを重ね合わせた。
ステップ50で重ねあわせたリガンドに対してタンパク質との相互作用エネルギーをコンフォメーションを微調整しながら最適化計算する。リガンドのコンフォメーションの微調整は、ステップ50で算出されたリガンド座標を中心に並進、回転、シングルボンドまわりの角度をRSMDで0.3を越えない程度に座標変化させる。
2〕 x、y、z軸方向それぞれにおいて、ランダムに±1.0Åの範囲内でリガンドの並進運動を行う。この過程を2回に一度行う。
U最適=USAR+U水素+U疎水+Uスタッキング+U衝突+U内部
SAR情報に従う指標としてエネルギーUSARを定義した。
NはSAR情報の数、Rは「A原子」からリガンド側の相互作用原子までの距離、KSAR(i)はi番目の「C強さ」、RSAR(i)はi番目の「D距離」、δは20.0とした。
活性部位(ALA、CYS、PHE、ILE、LEU、MET、PRO、VAL、TRP、TYRの側鎖。ただし、TYRの水酸基は除く)及びリガンド(炭素原子)の疎水相互作用し得る原子に通し番号を付け、活性部位のi番目とリガンドのj番目との原子間距離Rがカットオフ以内にあるときψ(i,j)を計算するように定義した。
活性部位(クラスタリングの際に定義した、保存されている側鎖原子及び主鎖原子のみ)のi番目の原子とリガンドのj番目の原子との原子間距離Rが衝突距離「R衝突(i,j)」以内のとき、ψ(i,j)を計算するように定義した。
Mは衝突を不許可とする活性部位の原子の数、Nはリガンドの原子の数、「K衝突」は1000.0とした。「R衝突(i,j)」は活性部位のi番目の原子とリガンドのj番目の原子それぞれのVan der Waals半径の和とした。
Mは活性部位の原子の数、Nはリガンドの原子の数、「K衝突」は1000.0であることが好ましい。「R衝突(i,j)」は活性部位のi番目の原子とリガンドのj番目の原子それぞれのVan der Waals半径の和とした。
リガンドのコンフォメーションを大きく動かして、ステップ50から再スタートを行い、ステップ60までを繰り返して最適化を行う。コンフォメーション改変は、ステップ60で算出されたリガンド座標を中心に並進、回転、シングルボンドまわりの角度をRSMDで0.3以上になるよう座標変化させる。
ステップ40から70まで「U最適」が最適値となる最適なタンパク質とリガンドとの複合体座標、最適エネルギー「U最適」を算出する。
ステップ40から90まではステップ0中の化合物データベース中のリガンド全てについて行われる。
ステップ90まで評価されたタンパク質とリガンドとの複合体座標、最適エネルギー「U最適」を基にステップ0中のデータベース中のリガンドから該当タンパク質と結合する可能性のある化合物を選ぶ。
下記の実施例は、本発明の具体的な認識を得る一助と見るべきであり、本発明の範囲を何ら制限するものではない。
基準振動解析により二面角のゆらぎ値が計算される。本発明においては、二面角のゆらぎ値を分子動力学計算における拘束条件として、
U二面角 = K二面角 * (θ−θ平衡)2
θは二面角(単位rad)。
中の「K二面角」に適応する。実際には「K二面角」の最大値と最小値を指定することで、その範囲内で主鎖二面角揺らぎに対応するように各二面角に対して不均一な拘束がかかるようにしている。本実施例では、「K二面角」の適切な最大値と最小値を決定することを目的とする。
本発明によって開発された拘束パラメータを適応した分子動力学計算を2.0nsecまで行い、活性部位の主鎖原子の動的挙動が拘束パラメータを適応しない場合と比較して構造がどの程度変化するかを調べた。
ジヒドロ葉酸還元酵素(1LUDのMODEL1)を対象に検証した。結果を図19〜図21に示す。基準振動計算結果は。実施例1で求めた値を適応した。
ここでは、FMAS[Ogata K., Umeyama H. (2000) An automatic homology modeling method consisting of database searches and simulated annealing J. Mol. Graphics Mod. 18, 258−272]によりモデリングした構造(モデル構造)とX線構造を初期構造に選び、初期構造及び拘束の有無に依存することを検証した。また、リガンドの各原子から半径10Å以内に含まれる受容体残基を活性部位と定義した。
FlavodoxinのX線構造(PDB code:1J9G)を利用した。また、参照タンパク質にホモロジー29.2%のflavodoxin(PDB code:1AHN)を選び、図29のアライメントでモデル構造を作成した。図29には、1J9Gおよび1AHNのアライメントを示す。
Matrix metalloproteinase−8(MMP−8)のX線構造(PDB code:1MMB)を利用した。また、参照タンパク質にホモロジー55.0%のMMP−3(PDB code:1B3D)を選び、図36のアライメントでモデル構造を作成した。図36には、1MMBおよび1B3D_Aのアライメントを示す。
本発明により該当タンパク質に結合するリガンドの複合体立体構造が予測される。本実施例では、こうして予測された複合体立体構造座標の予測精度を検証する。検証には、複合体の立体構造が既知で、リガンドの有無もしくはリガンドの種類により活性部位の形が異なるInduced−Fit型のタンパク質を用いた。ここで、リガンドの各原子から半径10Å以内の残基をタンパク質の活性部位と定義した。また、X線構造またはNMR構造を初期構造に選んだMDでは、ほぼ一定の構造を保ち続けることが分かったのでMDを1.0nsecまで行うことにした。ただし、水素原子を除いて計算した。複合体モデル構築は、発明実施の形態に従って行った。
ジヒドロ葉酸還元酵素(DHFR)である1BZFと1LUDとはホモロジーが100.0%でかつ結合しているリガンドが異なることにより活性部位の形が異なる。そこで、1BZF(MODEL18)を初期構造として選択し、リガンドとして2,4−diamino−5−(3,4,5−trimethoxy−benzyl)−pyrimidin−1−ium(図49)を用い、本発明によるプログラムによってタンパク質/リガンド複合体モデルを作成し、正解構造である1LUD(MODEL4)と比較することで検証した(図43)。
heat shock protein 90(HSP90)である1YERと1YETはホモロジーが100.0%でリガンド結合の有無により活性部位の形が異なる。そこで、リガンド結合していない1YERを初期構造に選び、リガンドとしてgeldanamycinを用い、正解構造である1YETと比較することで検証した(図51)。図51は、heat shock protein 90の立体構造である。1YETの受容体(緑色A)とリガンド(赤色B)。1YERの受容体(青色C)。
mitogen−activated protein kinase(MAP kinase)である1A9Uと1OUKはホモロジー100.0%でかつ結合しているリガンドが異なることにより活性部位の形が異なる。そこで、1A9Uを初期構造に選び、リガンドとして1OUK中に含まれるリガンドを用い、正解構造である1OUKと比較することでと検証した(図58)。図58はmitogen−activated protein kinaseの立体構造。図58において、1OUKの受容体(緑色A)とリガンド(赤色B)。1A9Uの受容体(青色C)とリガンド(水色D)。
本発明により、セリンプロテアーゼの1種であるFxaの立体構造(図66)を用い、化合物データベースからFxaに結合する可能性のあるリガンドを探索した。立体構造には、1AIXを用い、リガンドデータベースとして、PDBデータベースより収集した3633種類のリガンドを用いた。発明実施の形態に従い、in silico screeningを行った。その結果を図67に示す。
構造活性相関(SAR)の情報により順位が変動することを検証する。また、受容体を固定した場合の順位の変動も検証する。
図79に活性部位内での空間指定を示す。図79は1UK4(B鎖)より得られた構造活性相関情報。
図84に1UK3の活性部位内での空間指定を示す。図84は1UK3(B鎖)より得られた構造活性相関情報。
図87に1UK3の活性部位内での空間指定を示す。図87は1UK3(B鎖)より得られた構造活性相関情報。
図90に1UK3の活性部位内での空間指定を示す。図90は1UK3(B鎖)より得られた構造活性相関情報。
図93に活性部位内での空間指定を示す。図93は1UK4(B鎖)より得られた構造活性相関情報。
FMN−binding proteinにおける二面角拘束MDパラメータの分布。
ここでは、1LUD以外のNMR構造でも二面角拘束分子動力学計算及びクラスタリングのパラメータが同様の結果を生じるのかを検証する。そこで、FMN−binding proteinのNMR構造(PDB code:1AXJ)のMODEL1を初期構造に選んだ。評価法は、受容体動的構造クラスタリングのパラメーター(α=80.0%、β=0.4Å)を固定したこと以外は実施例1に従った。
ここでは、主鎖二面角拘束MDで各原子の動的構造を検証する。また、時として基準振動解析が収束せず二面角揺らぎ情報が得られないことがある。そこで、図13により主鎖二面角に対して均一な拘束(500)でMDを行ったときでも良い結果になっていることから、この場合における動的構造も検証する。実施例1に従い、拘束なし、二面角揺らぎを用いた拘束及び均一な拘束(500)の条件のもとMDを行った。
ここでは、二面角拘束MD及びクラスタリングのパラメータが異なっても誘導が生じることを検証する。拘束の最大値100、最小値0及び受容体動的構造クラスタリング定数α=80.0%、β=1.0Åに設定して、その他は実施例2に従った。ただし、受容体動的構造クラスターには0〜0.1nsecの範囲内で100fsecごとの母集団で作られたものを使用した。また、活性部位の定義は、リガンドの各原子から半径6Å以内にある受容体残基とした。
(i) 1BZF(MODEL18)で、リガンド結合により活性部位の主鎖原子rmsで0.2686の誘導が生じた(図109)。活性部位全体のrmsでは0.1224の誘導。リガンドのrmsは0.8526。
(ii) 1YERで、リガンド結合により活性部位の主鎖原子rmsで0.2376の誘導が生じた(図110)。活性部位全体のrmsでは0.0816の誘導。リガンドのrmsは0.7246。
(iii) 1A9Uで、リガンド結合により活性部位の主鎖原子rmsで0.2150の誘導が生じた(図111)。活性部位全体のrmsでは0.0464の誘導。リガンドのrmsは0.9464。
ここでは、DHFRの1BZF及び1LUDはリガンドの結合様式が似ているので、構造活性相関情報を一部変更し1BZFのリガンドの結合解析を行う。条件としては、初期構造に1BZF(MODEL18)、0〜0.1nsecまでの母集団より作成したクラスターを使用した。
(i) 最適化したときの受容体には初期構造を選択し、リガンドのrmsは0.8884。(図113)
(ii) trimetrexate。1BZF(MODEL18)のリガンド。(図114)
Claims (12)
- 単数または複数鎖のタンパク質の座標データが与えられた場合に、当該タンパク質と結合するリガンドをコンピュータで下記のステップを実行することにより探索するリガンド
探索方法であって、
上記コンピュータは、処理手段と記憶手段とを少なくとも備え、
上記記憶手段は、
上記タンパク質の座標データと、
上記リガンドのリガンド座標データと、
上記タンパク質の活性部位の原子、当該原子と相互作用する上記リガンドの原子タイプ、上記原子と上記原子タイプとの相互作用の強さ、および、上記原子と上記原子タイプとの相互作用する距離、を少なくとも含む構造活性相関情報と、
を少なくとも記憶し、
上記処理手段において実行される、
上記記憶手段に記憶された上記タンパク質の上記座標データに対して、基準振動計算を行うことにより、各アミノ酸のゆらぎ値を、誘導適合を反映した誘導適合パラメータとして求め、当該誘導適合パラメータを拘束条件として用いた分子動力学計算を行うことにより、上記タンパク質の動的挙動を考慮した構造変化後タンパク質座標データを選択する構造変化後タンパク質座標データ選択ステップと、
上記構造変化後タンパク質座標データ選択ステップにて選択された上記構造変化後タンパク質座標データ、および、上記記憶手段に記憶された上記構造活性相関情報に基づいて、上記構造変換後タンパク質座標データ上に上記リガンドと重ね合わせを行う空間点を指定する空間点指定ステップと、
上記空間点指定ステップにて指定された上記空間点と、上記記憶手段に記憶された上記リガンドの上記リガンド座標データとを用いて、上記タンパク質と上記リガンドとが結合した場合の相互作用関数を計算する際、上記タンパク質の上記動的挙動を表現する動的性質関数を「弾性エネルギー」として加えて計算する相互作用関数計算ステップと、
を含み、
上記相互作用関数計算ステップにより計算された上記相互作用関数に基づいて当該タンパク質と結合する上記リガンドを評価し、選定することを特徴とするリガンド探索方法。 - 請求項1から3のいずれか1つに記載のリガンド探索方法において、上記相互作用関数計算ステップは、
上記相互作用関数のスコアが最大になるように最適化する相互作用関数最適化ステップ、
をさらに含むことを特徴とするリガンド探索方法。 - 請求項5から10のいずれか1つに記載のリガンド探索方法において、
上記処理手段において実行される、
上記相互作用エネルギー最適化ステップにより最適化した後に、上記リガンド立体構造データのコンフォメーションを大きく変動させた後、再度、上記相互作用関数計算ステップを実行し、上記相互作用関数計算ステップにより計算された上記相互作用関数に基づいて当該タンパク質と結合する上記リガンドの再評価を行う再評価ステップ、
をさらに含むことを特徴とするリガンド探索方法。 - 請求項1から11のいずれか1つに記載のリガンド探索方法において、上記構造変化後タンパク質座標データ選択ステップは、
上記誘導適合パラメータに、上記タンパク質の基準振動解析結果または二次構造判定結果を用いること、
を特徴とするリガンド探索方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004048767A JP4314128B2 (ja) | 2004-02-24 | 2004-02-24 | タンパク質立体構造と誘導適合を利用したリガンド探索方法 |
EP05710781A EP1724697A4 (en) | 2004-02-24 | 2005-02-24 | LIGAND SEARCH, LIGAND SEARCH, PROGRAM AND RECORD MEDIUM |
US10/590,116 US8036831B2 (en) | 2004-02-24 | 2005-02-24 | Ligand searching device, ligand searching method, program, and recording medium |
PCT/JP2005/003558 WO2005083616A1 (ja) | 2004-02-24 | 2005-02-24 | リガンド探索装置、リガンド探索方法、プログラム、および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004048767A JP4314128B2 (ja) | 2004-02-24 | 2004-02-24 | タンパク質立体構造と誘導適合を利用したリガンド探索方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005242493A JP2005242493A (ja) | 2005-09-08 |
JP2005242493A5 JP2005242493A5 (ja) | 2005-12-08 |
JP4314128B2 true JP4314128B2 (ja) | 2009-08-12 |
Family
ID=34908555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004048767A Expired - Fee Related JP4314128B2 (ja) | 2004-02-24 | 2004-02-24 | タンパク質立体構造と誘導適合を利用したリガンド探索方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8036831B2 (ja) |
EP (1) | EP1724697A4 (ja) |
JP (1) | JP4314128B2 (ja) |
WO (1) | WO2005083616A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4314128B2 (ja) | 2004-02-24 | 2009-08-12 | 株式会社インシリコサイエンス | タンパク質立体構造と誘導適合を利用したリガンド探索方法 |
PL1856244T3 (pl) * | 2005-03-11 | 2014-03-31 | Schroedinger Llc | Przewidująca funkcja oceniająca do szacowania powinowactwa wiązania |
JP2007219760A (ja) * | 2006-02-15 | 2007-08-30 | Fujitsu Ltd | ドッキングシミュレーションプログラム、該プログラムを記録した記録媒体、ドッキングシミュレーション装置、およびドッキングシミュレーション方法 |
JP5142179B2 (ja) * | 2006-04-28 | 2013-02-13 | 一徳 辻 | 生体高分子における相互作用部位の予測方法 |
US11152081B2 (en) | 2008-02-05 | 2021-10-19 | Zymeworks Inc. | Methods for determining correlated residues in a protein or other biopolymer using molecular dynamics |
US9404928B2 (en) | 2008-02-05 | 2016-08-02 | Zymeworks Inc. | Methods for determining correlated residues in a protein or other biopolymer using molecular dynamics |
KR101289948B1 (ko) | 2012-06-11 | 2013-07-26 | 인제대학교 산학협력단 | 분자 진동수 패턴을 이용한 리간드 분류 방법 및 장치 |
FI127924B (en) * | 2014-02-27 | 2019-05-31 | Oy Medix Biochemica Ab | METHOD OF MEASURING MMP-8 ACTIVATION |
EP3327604B1 (en) | 2015-07-23 | 2019-10-16 | Fujitsu Limited | Method for calculating binding free energy, calculation device, and program |
CN117912601A (zh) * | 2024-01-26 | 2024-04-19 | 苏州腾迈医药科技有限公司 | 分子构象的展示方法及装置、介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993020525A1 (en) * | 1992-03-27 | 1993-10-14 | Akiko Itai | Method of searching the structure of stable biopolymer-ligand molecule composite |
WO1996013785A1 (fr) | 1994-10-31 | 1996-05-09 | Akiko Itai | Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle |
WO2002057954A1 (fr) | 2001-01-19 | 2002-07-25 | Mitsubishi Chemical Corporation | Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation |
AU2003224651A1 (en) | 2002-02-27 | 2003-09-09 | Protein Mechanics, Inc. | Clustering conformational variants of molecules and methods of use thereof |
US6947847B2 (en) * | 2002-03-08 | 2005-09-20 | Wisconsin Alumni Research Foundation | Method to design therapeutically important compounds |
JP4314128B2 (ja) | 2004-02-24 | 2009-08-12 | 株式会社インシリコサイエンス | タンパク質立体構造と誘導適合を利用したリガンド探索方法 |
-
2004
- 2004-02-24 JP JP2004048767A patent/JP4314128B2/ja not_active Expired - Fee Related
-
2005
- 2005-02-24 US US10/590,116 patent/US8036831B2/en not_active Expired - Fee Related
- 2005-02-24 EP EP05710781A patent/EP1724697A4/en not_active Withdrawn
- 2005-02-24 WO PCT/JP2005/003558 patent/WO2005083616A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP1724697A4 (en) | 2010-01-20 |
JP2005242493A (ja) | 2005-09-08 |
EP1724697A1 (en) | 2006-11-22 |
WO2005083616A1 (ja) | 2005-09-09 |
US8036831B2 (en) | 2011-10-11 |
US20070166760A1 (en) | 2007-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kitchen et al. | Docking and scoring in virtual screening for drug discovery: methods and applications | |
Muegge et al. | Small molecule docking and scoring | |
Diller et al. | High throughput docking for library design and library prioritization | |
Holtje et al. | Molecular modeling | |
Zacharias | Rapid protein–ligand docking using soft modes from molecular dynamics simulations to account for protein deformability: Binding of FK506 to FKBP | |
Ahmed et al. | A normal mode-based geometric simulation approach for exploring biologically relevant conformational transitions in proteins | |
Danishuddin et al. | Structure based virtual screening to discover putative drug candidates: necessary considerations and successful case studies | |
Amadasi et al. | Mapping the energetics of water–protein and water–ligand interactions with the “natural” HINT forcefield: predictive tools for characterizing the roles of water in biomolecules | |
Baldi | Computational approaches for drug design and discovery: An overview | |
US8036831B2 (en) | Ligand searching device, ligand searching method, program, and recording medium | |
Eweas et al. | Advances in molecular modeling and docking as a tool for modern drug discovery | |
EP0592421A4 (ja) | ||
US7890313B2 (en) | Method and apparatus for analysis of molecular combination based on computations of shape complementarity using basis expansions | |
JP2007511470A (ja) | リード分子交差反応の予測・最適化システム | |
Kroemer | Molecular modelling probes: docking and scoring | |
US7801685B2 (en) | System and method for improved computer drug design | |
US7065453B1 (en) | Molecular docking technique for screening of combinatorial libraries | |
JP4314206B2 (ja) | リガンド探索装置、リガンド探索方法、プログラム、および記録媒体 | |
EP2764457B1 (en) | Method of exploring the flexibility of macromolecular targets and its use in rational drug design | |
JP2005508487A (ja) | 生体標的に対するコンビナトリアル・ライブラリーの相補性を評価するための分子ドッキング法 | |
Basciu et al. | No dance, no partner! A tale of receptor flexibility in docking and virtual screening | |
Novič et al. | The comparison of docking search algorithms and scoring functions: an overview and case studies | |
WO2008091225A1 (en) | Comparative detection of structure patterns in interaction sites of molecules | |
Panday et al. | In silico structure-based prediction of receptor–ligand binding affinity: current progress and challenges | |
Kaapro et al. | Protein docking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051020 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090428 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090518 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120522 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |