JP4315960B2 - タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法 - Google Patents
タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法 Download PDFInfo
- Publication number
- JP4315960B2 JP4315960B2 JP2006013792A JP2006013792A JP4315960B2 JP 4315960 B2 JP4315960 B2 JP 4315960B2 JP 2006013792 A JP2006013792 A JP 2006013792A JP 2006013792 A JP2006013792 A JP 2006013792A JP 4315960 B2 JP4315960 B2 JP 4315960B2
- Authority
- JP
- Japan
- Prior art keywords
- protein
- dimensional structure
- ligand
- structure information
- binding site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 102000004169 proteins and genes Human genes 0.000 title claims description 279
- 108090000623 proteins and genes Proteins 0.000 title claims description 279
- 239000003446 ligand Substances 0.000 title claims description 180
- 238000000034 method Methods 0.000 title claims description 128
- 238000004364 calculation method Methods 0.000 claims description 72
- 238000004458 analytical method Methods 0.000 claims description 36
- 150000003384 small molecules Chemical class 0.000 claims description 29
- 238000010276 construction Methods 0.000 claims description 27
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 26
- 150000001875 compounds Chemical class 0.000 claims description 24
- 238000005381 potential energy Methods 0.000 claims description 11
- 239000003125 aqueous solvent Substances 0.000 claims description 9
- 238000007621 cluster analysis Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 7
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 81
- 125000004429 atom Chemical group 0.000 description 81
- 108090000631 Trypsin Proteins 0.000 description 36
- 102000004142 Trypsin Human genes 0.000 description 36
- 239000012588 trypsin Substances 0.000 description 34
- 230000006870 function Effects 0.000 description 32
- 101000984722 Bos taurus Pancreatic trypsin inhibitor Proteins 0.000 description 31
- 239000003814 drug Substances 0.000 description 27
- 229940079593 drug Drugs 0.000 description 25
- 239000012454 non-polar solvent Substances 0.000 description 25
- 102000005962 receptors Human genes 0.000 description 25
- 108020003175 receptors Proteins 0.000 description 25
- 238000000329 molecular dynamics simulation Methods 0.000 description 22
- 238000005457 optimization Methods 0.000 description 19
- 238000003032 molecular docking Methods 0.000 description 16
- 239000003905 agrochemical Substances 0.000 description 15
- 125000003275 alpha amino acid group Chemical group 0.000 description 15
- 238000013461 design Methods 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 12
- 230000006399 behavior Effects 0.000 description 12
- 239000002904 solvent Substances 0.000 description 12
- 239000000126 substance Substances 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 239000001257 hydrogen Substances 0.000 description 9
- 229910052739 hydrogen Inorganic materials 0.000 description 9
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 238000002922 simulated annealing Methods 0.000 description 8
- 102100039705 Beta-2 adrenergic receptor Human genes 0.000 description 7
- 238000002441 X-ray diffraction Methods 0.000 description 7
- 108010014499 beta-2 Adrenergic Receptors Proteins 0.000 description 7
- 238000006073 displacement reaction Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical compound O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 description 6
- 102000004330 Rhodopsin Human genes 0.000 description 6
- 108090000820 Rhodopsin Proteins 0.000 description 6
- 101710162629 Trypsin inhibitor Proteins 0.000 description 6
- 229940122618 Trypsin inhibitor Drugs 0.000 description 6
- 125000004432 carbon atom Chemical group C* 0.000 description 6
- 239000013078 crystal Substances 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 230000000737 periodic effect Effects 0.000 description 6
- 239000002753 trypsin inhibitor Substances 0.000 description 6
- 238000002424 x-ray crystallography Methods 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 5
- 238000000324 molecular mechanic Methods 0.000 description 5
- 238000005481 NMR spectroscopy Methods 0.000 description 4
- 244000018633 Prunus armeniaca Species 0.000 description 4
- 235000009827 Prunus armeniaca Nutrition 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 238000009792 diffusion process Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 101800001554 RNA-directed RNA polymerase Proteins 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 238000002939 conjugate gradient method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000008187 granular material Substances 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000000575 pesticide Substances 0.000 description 3
- 239000008194 pharmaceutical composition Substances 0.000 description 3
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- KXDAEFPNCMNJSK-UHFFFAOYSA-N Benzamide Chemical compound NC(=O)C1=CC=CC=C1 KXDAEFPNCMNJSK-UHFFFAOYSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 108010038061 Chymotrypsinogen Proteins 0.000 description 2
- RGSFGYAAUTVSQA-UHFFFAOYSA-N Cyclopentane Chemical compound C1CCCC1 RGSFGYAAUTVSQA-UHFFFAOYSA-N 0.000 description 2
- STECJAGHUSJQJN-USLFZFAMSA-N LSM-4015 Chemical compound C1([C@@H](CO)C(=O)OC2C[C@@H]3N([C@H](C2)[C@@H]2[C@H]3O2)C)=CC=CC=C1 STECJAGHUSJQJN-USLFZFAMSA-N 0.000 description 2
- 238000002940 Newton-Raphson method Methods 0.000 description 2
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical group NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- UCTWMZQNUQWSLP-UHFFFAOYSA-N adrenaline Chemical compound CNCC(O)C1=CC=C(O)C(O)=C1 UCTWMZQNUQWSLP-UHFFFAOYSA-N 0.000 description 2
- 150000001555 benzenes Chemical class 0.000 description 2
- 244000309464 bull Species 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 229960002376 chymotrypsin Drugs 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 229940000406 drug candidate Drugs 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 230000005661 hydrophobic surface Effects 0.000 description 2
- 150000002611 lead compounds Chemical class 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 125000004433 nitrogen atom Chemical group N* 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 230000000361 pesticidal effect Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000012887 quadratic function Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 108060003345 Adrenergic Receptor Proteins 0.000 description 1
- 102000017910 Adrenergic receptor Human genes 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- ANGAOPNEPIDLPO-XVYDVKMFSA-N Ala-His-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N ANGAOPNEPIDLPO-XVYDVKMFSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- LDLZOAJRXXBVGF-GMOBBJLQSA-N Asp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N LDLZOAJRXXBVGF-GMOBBJLQSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 1
- KEBJBKIASQVRJS-WDSKDSINSA-N Cys-Gln-Gly Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N KEBJBKIASQVRJS-WDSKDSINSA-N 0.000 description 1
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 1
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 1
- NIXHTNJAGGFBAW-CIUDSAMLSA-N Cys-Lys-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N NIXHTNJAGGFBAW-CIUDSAMLSA-N 0.000 description 1
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- NVHJGTGTUGEWCG-ZVZYQTTQSA-N Gln-Trp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O NVHJGTGTUGEWCG-ZVZYQTTQSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- WPUAVVXYEJAWIV-KKUMJFAQSA-N His-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WPUAVVXYEJAWIV-KKUMJFAQSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- 241001599018 Melanogaster Species 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- OHLUUHNLEMFGTQ-UHFFFAOYSA-N N-methylacetamide Chemical compound CNC(C)=O OHLUUHNLEMFGTQ-UHFFFAOYSA-N 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- UEHNWRNADDPYNK-DLOVCJGASA-N Phe-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N UEHNWRNADDPYNK-DLOVCJGASA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- BVRBCQBUNGAWFP-KKUMJFAQSA-N Pro-Tyr-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O BVRBCQBUNGAWFP-KKUMJFAQSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- PFMAFMPJJSHNDW-ZKWXMUAHSA-N Val-Cys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PFMAFMPJJSHNDW-ZKWXMUAHSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 239000012872 agrochemical composition Substances 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002447 crystallographic data Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000010894 electron beam technology Methods 0.000 description 1
- 238000005421 electrostatic potential Methods 0.000 description 1
- -1 elixirs Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 230000009969 flowable effect Effects 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 238000012617 force field calculation Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- DMEGYFMYUHOHGS-UHFFFAOYSA-N heptamethylene Natural products C1CCCCCC1 DMEGYFMYUHOHGS-UHFFFAOYSA-N 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
Images
Landscapes
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
先ず、本発明の誘導適合を含めた立体構造の構築方法について説明する。
先ず、目的タンパク質の立体構造の構築において、目的タンパク質のアミノ酸配列を入力し、参照するタンパク質(参照タンパク質)を選定する。参照タンパク質の選定は、それ自体既知の通常用いられるアライメントソフトウエアを用いて行われる。この参照タンパク質の原子座標を、適当な立体構造データベースから収得する。この原子座標には、アミノ酸の骨格を作る窒素原子等に結合している水素原子はなく、ステップI-20の基準振動解析法の計算に水素原子が必要な場合は水素原子を発生させる。参照タンパク質の原子座標から構成される目的関数を用いて原子座標を最適化する。
上記ステップI-10で作成された最適化座標を用いて、その原子座標の変位を行う。原子座標の変位は、基準振動解析法を行い、各固有値の固有ベクトルを得ることにより行うのが好ましい。その際、最適化した自由度の一部を自由度とする座標系を用いても良い。この場合、一部の自由度に対しても最適化が達成されている。
上記ステップI-20で得られた固有値、固有ベクトルを用いて、ある温度・ある固有値でのCα原子の位置ゆらぎを計算する。固有値の数と等しい位置ゆらぎが得られる。参照タンパク質のCα原子の温度因子を位置ゆらぎに換算し、各Cα原子について基準振動解析法の位置ゆらぎとの比を計算し、平均の比を求める。この平均の比は、使用した固有値の数だけあり、この比を掛けたこの固有値に属する固有ベクトルを構造最適化前の参照タンパク質の原子座標に加え、この変位させた原子座標からなる立体構造、即ち、誘導適合(induced fit)を含めた立体構造を参照タンパク質の立体構造の1つとする。以下これを、誘導適合(induced fit)型参照タンパク質、立体構造、座標として引用する。
上記ステップI-30で得られた参照タンパク質の立体構造セットを参照して、適当なホモロジー・モデリング・プログラム、例えばFAMSにより目的タンパク質の立体構造セットを構築する。参照タンパク質の立体構造の数と同じ数の目的タンパク質の立体構造が構築される。即ち、使用した固有値の数の4倍だけある誘導適合(induced fit)型と非誘導適合(no induced fit)型目的タンパク質立体構造が構築され、これらを、目的タンパク質立体構造セット、すなわち誘導適合(induced fit)を含めた立体構造とする。
ステップI-30からの参照タンパク質セットおよびアライメント情報を受けて、参照タンパク質から挿入および欠損のあるアミノ酸残基についての情報をえる。アライメントにおいて連続して三残基以上のアミノ酸が対応しているギャップの無い領域を選び出し、その領域においては、これらの残基ペアにおいて、目的タンパク質のCα原子は参照タンパク質と同一のものを当てはめておく。Cα原子が求められなかった場合には、予め作成してある断片のデータベースから座標を当てはめる(第2図参照)。
上記ステップI-41で作成されたCα原子はシミュレーティッドアニーリングのプロセスを用いて参照タンパク質の座標から構成される関数を用いて最適化される。この目的関数は下記式(11)のとおりである。
ステップI-41(1)のCαの原子座標に主鎖の他の原子を付加し、シミュレーティッドアニーリング法によって目的関数を最小化するようにする。まず、Cα原子の立体的な重ねあわせを行い、Cαの原子間距離が2.5Å以下の残基が取り上げられる。Cαを除く主鎖の原子座標はCα原子間距離が最小になるように参照タンパク質の座標から取得しモデル構造とする。
Knonは定数で0.25とし、カットオフは8Åとする。
Kposは定数であり0.3である。
側鎖の構築は、大きく2段階に分かれており、「構造保存部位の側鎖構築」(スッテプI-43(1))と「全体の側鎖構築」(スッテプI-43(2))に分けられる。
算出された主鎖原子に対して、以前の研究における方法を用いてホモロガスなタンパク質から側鎖のねじれ角を得る。この方法の詳細は、"The role of played by environmental residues in side-chain torsional angles within homologous families of proteins: A new method of side chain modeling." Ogata K and Umeyama H, Prot. Struct. Funct. Genet. 1998, 31, 255-369に記載されている。
側鎖の構築は固定した主鎖およびCβ原子のもとで行う。これは上記したOgata K and Umeyama H, Prot. Struct. Funct. Genet. 1998, 31, 255-369に開示されている研究成果をもって行われ、それを用いることにより短時間で正確なモデルを与えることができる。次に主鎖構造は低温におけるモンテカルロ法によって最適化され、温度は0.001に設定され式(17)の目的関数Unon-bondを用い、全ての主鎖と側鎖の原子で計算される。そして、N、Cα、C、Cβ原子の最適化の過程で側鎖のねじれ角を最適化された状態を保つように側鎖の座標を再配置する。原子の摂動は0.5Å以内とする。次に側鎖は削除され、上記の側鎖構築が繰り返される。このプロセスは2.4Åの原子同士のぶつかり合いがなくなり、且つN-Cα-Cβ-Cのねじれ角が-120±15°の範囲に収まるまで繰り返される。
かくして、任意の目的タンパク質の非誘導適合(no induced fit)型と誘導適合(induced fit)型の立体構造を規定する原子座標を得ることができる。
次に、本発明の別の態様であるタンパク質−リガンド複合体の立体構造構築方法について、図面を参照して説明する。第5図は、目的とするタンパク質−リガンド複合体の立体構造構築方法、即ち誘導適合(induced fit)を含んだ複合体の立体構造構築方法の一例を示すフローチャートである。
目的タンパク質のモデリングは、次の3つのステップII-11:参照タンパク質の初期座標の最適化、II-12:最適化座標の基準振動解析、II-13:目的タンパク質のモデリングに分けられる。このステップは、前記I-10〜I-44と同様に行われる。かくして、基準振動解析法の振動モードに基づく立体構造、すなわち誘導適合(induced fit)を含んだ目的タンパク質の立体構造が構築できる。
基準振動モードを考慮した目的タンパク質の複数の立体構造モデルに対してリガンドのドッキングを行なう。目的タンパク質のリガンド結合サイトと考えられる位置にドッキングさせる。このステップは、PDB形式のファイルが入出力できる市販のソフトウエア、例えばBIOCES(NEC社製)、Cerius2(Accelrys社製)、SYBYL(TRIPOS社製)、HyperChem(Hypercube社製)等を用いて行なう。一般的にはドッキングはステレオ表示が可能なディスプレイ上でリガンドを回転、並進して行なう。また簡易的エネルギー計算手法を含めたドッキングを行なってもよい。
ステップII-20で得られたタンパク質−リガンド複合体構造モデルについて、目的タンパク質の1つの構造とリガンドとの構造の経験的分子エネルギー計算を、目的タンパク質の構造の数だけ行い、その際、目的タンパク質側は、複数の構造それぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンドの原子座標を動かして、目的タンパク質の複数の立体構造に基づくリガンドの構造を求める。
次に、本発明の別の態様である、タンパク質のリガンド結合部位の特定方法について説明する。第6図は、タンパク質のリガンド結合部位の特定方法と、得られた結合部位にリガンドを結合させて、タンパク質−リガンド複合体の立体構造を構築する方法の一例を示すフローチャートである。
タンパク質とリガンドの結合部位の特定は、次の3つのステップ、 III-11:タンパク質周囲および/またはリガンド周囲への低分子化合物の発生、III-12:タンパク質および/またはリガンドの水溶媒中での経験的分子エネルギー計算(分子力学、分子動力学計算)による低分子化合物(例えば非極性溶媒等)の挙動検索、III-13:低分子化合物(例えば非極性溶媒等)の挙動から、タンパク質へのリガンド結合部位および/またはリガンドのタンパク質への結合部位の判定に分けられる。
先ず、タンパク質および/またはリガンドの周囲に水分子を発生させたのち、タンパク質周囲、リガンド周囲、ならびに低分子化合物が入り込める内部周囲にある水分子を低分子化合物で置換する。その場合、これらの置換はそれら周囲全体にわたり低分子化合物を配置してもよいし、疎水性や水素結合能を有するアミノ酸や官能基の周りにだけ低分子化合物を配置してもよい。ここで、リガンドがペプチドやタンパク質等の高分子物質である場合には、リガンド周囲へも低分子化合物を発生させ、タンパク質の場合と同様に経験的分子エネルギー計算による低分子化合物の挙動解析を行う。リガンドが医農薬分子等の分子量が小さい物質である場合は、どの部分が疎水性領域か等の判別できるので、通常、結合部位の特定の必要性は無い。しかし、リガンドが高分子物質である場合は、リガンド側の結合部位もタンパク質側の結合部位と同様に解析し、複合体の結合部位を特定することが必要である。
上記ステップIII-11で作成されたタンパク質(および/またはリガンド)と低分子化合物の原子座標を用いて、それら周囲に周期境界条件で水分子を発生させたのち、経験的分子エネルギー計算である分子力学計算で立体構造を最適化し、続いて分子動力学計算を行う。分子動力学計算が終了したのち、水分子を除去してタンパク質(および/またはリガンド)と低分子化合物との原子座標を得る。例えば、低分子化合物として非極性溶媒(ベンゼン)を配置した場合は、温度300°K、10〜20ps程度の分子動力学計算を行えば良い。これにより、タンパク質の周囲や内部への低分子化合物の拡散や集積が起こる。この拡散や集積の状態、即ち低分子化合物の挙動を、後記ステップIII-13の方法で解析することにより、タンパク質側のリガンド結合部位、リガンド側のタンパク質結合部位を特定することができる。
上記ステップIII-12で求まったタンパク質周囲および/またはリガンド周囲の低分子化合物、例えば非極性溶媒の分布について、これを対象としたクラスター解析を行い、得られたクラスターの大きさからリガンドがタンパク質にドッキングしやすい部位を判定する。
上記ステップIII-13で得られた低分子化合物、例えば非極性溶媒(ベンゼン)のクラスタリングで大きなクラスターとなったサイト同士をドッキングし、タンパク質−リガンド複合体構造の初期データとする。この際、低分子化合物、例えば非極性溶媒(ベンゼン)データはドッキングに際して除かれる。
上記ステップIII-20で得られたタンパク質−リガンド複合体の初期原子座標データは、それら周囲に周期境界条件で水分子を発生させたのち、分子力学計算で初期立体構造を最適化し、続いて分子動力学計算を行い、そして最終ステップの座標軌跡から水分子を取り除くことによりタンパク質−リガンド複合体の立体構造が得られる。
上記方法で得られたタンパク質の立体構造またはタンパク質−リガンド複合体の立体構造を規定する原子座標を、コンピュータが利用可能な所定の形式で適当な記録媒体に格納することにより、目的タンパク質の立体構造データベースが構築できる。本発明のデータベースは、好ましくは、上記原子座標とともに参照タンパク質と目的タンパク質のアライメント情報を含んでいても良い。また、データベースには、所望によりコード番号、参照タンパク質の参照領域の情報、目的タンパク質の情報、Cα原子間距離等が含まれる。
医農薬等の薬物分子設計を行うことができる適当なプログラムが動作するコンピュータで、上記方法で得られた薬物分子の標的となるタンパク質(以下これを「標的タンパク質」と称することがある)の構造座標の全て若しくは一部、又はそれらが記録されたデータベース若しくは記録媒体の構造座標の全て若しくは一部を使用して、標的タンパク質と相互作用をする薬物分子(拮抗薬または作動薬)を同定、検索、評価又は設計等を行うことができる。
上記方法により同定、検索、評価又は設計された医農薬候補分子は、その分子の性質に応じて、例えばそれ自体既知の化学合成法により得ることができる。しかしながら、薬物分子は、天然化合物、合成化合物のいずれでも良く、また、高分子化合物、低分子化合物のいずれでも良い。得られた医農薬候補分子は、更に、それ自体既知の方法により、試験管内や生体内における薬理学的または生理学的試験によりその活性を調べ、所望の活性を有する医農薬候補分子を選抜することにより実際に医農薬として応用可能なものを得ることができる。
上記スクリーニング方法により選択された医農薬等の薬物分子、例えば医薬分子は、それ自体単独で治療対象となる疾患等の患者に投与することができるが、これらの有効成分の1種又は2種以上を混合して投与することもできる。また、薬理学的に許容される製剤用添加物等を用いて該物質を医薬品組成物として製剤化し、これを投与するのが好ましい。例えば、必要に応じて糖衣を施した錠剤、カプセル剤、顆粒剤、細粒剤、散剤、丸剤、マイクロカプセル剤、リポソーム製剤、トローチ、舌下剤、液剤、エリキシル剤、乳剤、懸濁剤等として経口的に、あるいは無菌の水性液もしくは油性液として製造した注射剤や、座剤、軟膏、貼付剤等として非経口的に使用できる。これらは、例えば、該物質を生理学的に認められる担体、香味剤、賦形剤、ベヒクル、防腐剤、安定剤、結合剤などとともに一般に認められた製剤実施に要求される単位用量形態で混和し、充填又は打錠等の当業界で周知の方法を用いて製造することができる。これらの医薬組成物における有効成分量は指示された範囲の適当な容量が得られるようにするものである。
以下、実施例を挙げて本発明を更に具体的に説明するが、下記の実施例は、本発明の具体的な認識を得る一助と見なすべきであり、本発明の範囲を何ら制限するものではない。
β2アドレナリンレセプターの立体構造の構築
上記発明の実施形態のI-10〜I-40で詳述した方法に従って、次の通りヒト由来β2アドレナリンレセプターの誘導適合を含めた立体構造を構築した。第7図にフローチャートを示す。
として、第9図に最低固有値4.47cm-1のMv(=26.4)倍したゆらぎと換算した温度因子を示す。
型目的タンパク質立体構造と最低固有値の固有ベクトルを±2×Mv (±2×26.4)倍した誘
導適合(induced fit)型参照タンパク質立体構造から構築された誘導適合(induced fit)型目的タンパク質の立体構造の一部を示す。図中、中央の構造が非誘導適合型目的タンパク質である。
トリプシン単体およびトリプシン・インヒビター単体からの複合体の立体構造の構築
本例では受容体、リガンド、受容体−リガンド複合体のX線結晶解析が既知である牛膵臓由来のβ-Trypsin(トリプシン)とトリプシン・インヒビター(BPTI)の系を用いて、本発明のタンパク質−リガンド複合体の立体構造構築方法の検証を行った。ここではトリプシンが受容体タンパク質(目的タンパク質)、BPTIがリガンドである。
Ile Val Gly Gly Tyr Thr Cys Gly Ala Asn Thr Val Pro Tyr Gln Val
16 20 25 30
Ser Leu Asn Ser Gly Tyr His Phe Cys Gly Gly Ser Leu Ile Asn Ser
34 37 40 45
Gln Trp Val Val Ser Ala Ala His Cys Tyr Lys Ser Gly Ile Gln Val
50 55 60 65
Arg Leu Gly Glu Asp Asn Ile Asn Val Val Glu Gly Asn Glu Gln Phe
67 69 70 75 80
Ile Ser Ala Ser Lys Ser Ile Val His Pro Ser Tyr Asn Ser Asn Thr
85 90 95
Leu Asn Asn Asp Ile Met Leu Ile Lys Leu Lys Ser Ala Ala Ser Leu
100 105 110
Asn Ser Arg Val Ala Ser Ile Ser Leu Pro Thr Ser Cys Ala Ser Ala
115 120 125 127 130 132
Gly Thr Gln Cys Leu Ile Ser Gly Trp Gly Asn Thr Lys Ser Ser Gly
135 140 145
Thr Ser Tyr Pro Asp Val Leu Lys Cys Leu Lys Ala Pro Ile Leu Ser
150 155 160
Asp Ser Ser Cys Lys Ser Ala Tyr Pro Gly Gln Ile Thr Ser Asn Met
165 170 175 180
Phe Cys Ala Gly Tyr Leu Glu Gly Gly Lys Asp Ser Cys Gln Gly Asp
183 184A184 185 187 188A188 190
Ser Gly Gly Pro Val Val Cys Ser Gly Lys Leu Gln Gly Ile Val Ser
195 200 204 209 210
Trp Gly Ser Gly Cys Ala Gln Lys Asn Lys Pro Gly Val Tyr Thr Lys
215 217 219 220 221A221 225 230
Val Cys Asn Tyr Val Ser Trp Ile Lys Gln Thr Ile Ala Ser Asn
235 240 245
トリプシン、トリプシン・インヒビターそれぞれの結合部位の特定
前記ステップIII-10〜III-30で詳述した方法に従って、次の手順でトリプシンおよびBPTIの結合部位をそれぞれ特定し、それら部位を複合体のX線結晶解析データと比較検討した。本例では、タンパク質−リガンド複合体X線結晶解析が既知である牛膵臓由来のβ-Trypsin(トリプシン)とトリプシン・インヒビター(BPTI)の系を用いた。ここではトリプシンが受容体タンパク質(目的タンパク質)、BPTIがリガンドであるが、BPTIもタンパク質であるので、タンパク質側だけでなく、リガンド側の結合部位の特定も行った。用いたトリプシンおよびトリプシン・インヒビター(BPTI)アミノ酸配列は、それぞれSEQ ID No.3およびSEQ ID No.4に示した通りである。
Claims (4)
- コンピュータを用いて、タンパク質のリガンド結合部位の特定を行う方法であって、
上記コンピュータは、CPUと記憶手段とを少なくとも備え、
上記記憶手段は、上記タンパク質、低分子化合物および水分子の立体構造の原子座標を記述した立体構造情報を少なくとも記憶し、
上記CPUにおいて実行される、
(i)上記タンパク質の立体構造情報の周囲に上記低分子化合物の立体構造情報を配置し、
(ii)それらの周囲にさらに上記水分子の立体構造情報を配置し、水溶媒中での経験的分子エネルギー計算を行って、上記タンパク質と上記低分子化合物との原子座標を得、
(iii)得られた当該原子座標について、上記タンパク質の周囲および内部の、上記低分子化合物の挙動解析を行い、上記リガンドの結合部位を判定する、
各ステップを含み、
上記CPUにおいて実行される上記低分子化合物の挙動解析は、上記低分子化合物を対象としたクラスター解析により行われ、得られたクラスターのサイズを上記リガンドの結合可能性部位の順位として上記結合部位を判定すること
を特徴とするタンパク質のリガンド結合部位の特定方法。 - コンピュータを用いて、タンパク質のリガンド結合部位の特定を行う方法であって、
上記コンピュータは、CPUと記憶手段とを少なくとも備え、
上記記憶手段は、上記タンパク質、上記リガンド、低分子化合物および水分子の立体構造の原子座標を記述した立体構造情報を少なくとも記憶し、
上記CPUにおいて実行される、
(i) 上記タンパク質および上記リガンドの立体構造情報の周囲に上記低分子化合物の立体構造情報を配置し、
(ii)それらの周囲にさらに上記水分子の立体構造情報を配置し、水溶媒中での経験的分子エネルギー計算を行って、上記タンパク質と上記低分子化合物との原子座標を得、
(iii)得られた当該原子座標について、上記タンパク質および上記リガンドの周囲および内部の、上記低分子化合物の挙動解析を行い、タンパク質−リガンド複合体の結合部位を判定する、
各ステップを含み、
上記CPUにおいて実行される上記低分子化合物の挙動解析は、上記低分子化合物を対象としたクラスター解析により行われ、得られたクラスターのサイズを上記リガンドの結合可能性部位の順位として上記結合部位を判定すること
を特徴とするタンパク質−リガンド複合体の結合部位の特定方法。 - コンピュータを用いて、タンパク質−リガンド複合体の立体構造を構築する方法であって、
上記コンピュータは、CPUと記憶手段とを少なくとも備え、
上記記憶手段は、上記タンパク質、上記リガンド、低分子化合物および水分子の立体構造の原子座標を記述した立体構造情報を少なくとも記憶し、
上記CPUにおいて実行される、
請求項1または2に記載の方法により特定した上記タンパク質の立体構造情報の上記リガンド結合部位に上記リガンドの立体構造情報をドッキングし、経験的分子エネルギー計算により上記タンパク質−リガンドの複合体の立体構造を得る、タンパク質−リガンド複合体立体構造構築ステップ、
を含むことを特徴とするタンパク質−リガンド複合体の立体構造構築方法。 - 上記CPUにおいて実行される上記タンパク質−リガンド複合体立体構造構築ステップは、
(i)上記タンパク質の1つの立体構造情報と上記リガンドの立体構造情報との上記経験的分子エネルギー計算を、上記タンパク質の立体構造情報の数だけ行い、その際、
(ii)タンパク質側は、上記タンパク質の複数の立体構造情報のそれぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、
(iii)リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向に上記リガンド立体構造情報の原子座標を動かして、
(iv)上記タンパク質の複数の立体構造情報に基づく上記リガンドの立体構造情報を求める、
各ステップを含むことを特徴とする請求項3に記載のタンパク質−リガンド複合体の立体構造構築方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006013792A JP4315960B2 (ja) | 2001-01-19 | 2006-01-23 | タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001011783 | 2001-01-19 | ||
JP2006013792A JP4315960B2 (ja) | 2001-01-19 | 2006-01-23 | タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002558170A Division JP3843260B2 (ja) | 2001-01-19 | 2002-01-17 | 誘導適合を含めたタンパク質の立体構造構築方法およびその利用 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006209764A JP2006209764A (ja) | 2006-08-10 |
JP4315960B2 true JP4315960B2 (ja) | 2009-08-19 |
Family
ID=36966478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006013792A Expired - Fee Related JP4315960B2 (ja) | 2001-01-19 | 2006-01-23 | タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4315960B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6186848B2 (ja) * | 2013-04-26 | 2017-08-30 | 富士通株式会社 | 結合構造の算出方法、及び算出装置、プログラム、並びに記録媒体 |
JP6311320B2 (ja) * | 2014-01-15 | 2018-04-18 | 富士通株式会社 | 結合構造の算出方法、及び算出装置、プログラム、並びに記録媒体 |
JP6409880B2 (ja) | 2014-12-24 | 2018-10-24 | 富士通株式会社 | 相互作用エネルギーの算出方法、及び算出装置、並びにプログラム |
JP6610182B2 (ja) * | 2015-11-09 | 2019-11-27 | 富士通株式会社 | 結合自由エネルギー計算の前処理方法、結合自由エネルギーの算出方法、及び装置、並びにプログラム |
JP6940752B2 (ja) * | 2017-06-01 | 2021-09-29 | 富士通株式会社 | プローブ分子の配置方法、及び配置装置、標的分子の結合サイトの探索方法、及び探索装置、並びにプログラム |
CN111683685A (zh) * | 2017-12-07 | 2020-09-18 | 桑福德伯纳姆普雷比医学发现研究所 | 治疗神经系统损伤的组合物和方法 |
JP7029098B2 (ja) | 2018-07-27 | 2022-03-03 | 富士通株式会社 | 集団座標の決定方法、及び決定装置、並びにプログラム |
JP7347113B2 (ja) | 2019-10-21 | 2023-09-20 | 富士通株式会社 | ペプチド分子の改変箇所の探索方法、及び探索装置、並びにプログラム |
-
2006
- 2006-01-23 JP JP2006013792A patent/JP4315960B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006209764A (ja) | 2006-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4315960B2 (ja) | タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法 | |
Bakan et al. | Druggability assessment of allosteric proteins by dynamics simulations in the presence of probe molecules | |
Bruno et al. | The in silico drug discovery toolbox: applications in lead discovery and optimization | |
US20060217894A1 (en) | Use of computationally derived protein structures of genetic polymorphisms in pharmacogenomics for drug design and clinical applications | |
Giganti et al. | Comparative evaluation of 3D virtual ligand screening methods: impact of the molecular alignment on enrichment | |
JPWO2009064015A1 (ja) | インシリコスクリーニング装置、および、インシリコスクリーニング方法 | |
Hoffer et al. | S4MPLE–sampler for multiple protein–ligand entities: Simultaneous docking of several entities | |
CA2542456A1 (en) | Lead molecule cross-reaction prediction and optimization system | |
US20070134662A1 (en) | Structural interaction fingerprint | |
Zeng | Mini-review: computational structure-based design of inhibitors that target protein surfaces | |
US7826979B2 (en) | Method of modeling complex formation between a query ligan and a target molecule | |
US20090018777A1 (en) | Systems and Methods for Predicitng Ligand-Protein Binding Interactions | |
Hema et al. | Atomic resolution homology models and molecular dynamics simulations of Plasmodium falciparum tubulins | |
US20030228624A1 (en) | Molecular docking methods for assessing complementarity of combinatorial libraries to biotargets | |
JP3843260B2 (ja) | 誘導適合を含めたタンパク質の立体構造構築方法およびその利用 | |
Moon et al. | 3D database searching and de novo construction methods in molecular design | |
Stavrakoudis | Conformational flexibility in designing peptides for immunology: the molecular dynamics approach | |
JP4314128B2 (ja) | タンパク質立体構造と誘導適合を利用したリガンド探索方法 | |
CA2391987A1 (en) | System and method for searching a combinatorial space | |
Oshiro et al. | Characterization of receptors with a new negative image: use in molecular docking and lead optimization | |
US20060141480A1 (en) | Use of computationally derived protein structures of genetic polymorphisms in pharmacogenomics and clinical applications | |
Gadhe et al. | Binding site exploration of CCR5 using in silico methodologies: A 3D-QSAR approach | |
JP4118680B2 (ja) | タンパク質の立体構造構築方法 | |
WO2001088847A2 (en) | Lead molecule generation | |
US7716030B2 (en) | Target ligand generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090512 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090519 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |