JP5142179B2 - Prediction method of interaction sites in biopolymers - Google Patents
Prediction method of interaction sites in biopolymers Download PDFInfo
- Publication number
- JP5142179B2 JP5142179B2 JP2006125188A JP2006125188A JP5142179B2 JP 5142179 B2 JP5142179 B2 JP 5142179B2 JP 2006125188 A JP2006125188 A JP 2006125188A JP 2006125188 A JP2006125188 A JP 2006125188A JP 5142179 B2 JP5142179 B2 JP 5142179B2
- Authority
- JP
- Japan
- Prior art keywords
- interaction
- biopolymer
- interaction point
- information
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims description 509
- 229920001222 biopolymer Polymers 0.000 title claims description 197
- 238000000034 method Methods 0.000 title claims description 85
- 108090000623 proteins and genes Proteins 0.000 claims description 74
- 102000004169 proteins and genes Human genes 0.000 claims description 73
- 239000000470 constituent Substances 0.000 claims description 57
- 239000002904 solvent Substances 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 9
- 239000003086 colorant Substances 0.000 claims description 4
- 125000004429 atom Chemical group 0.000 description 114
- 235000018102 proteins Nutrition 0.000 description 75
- 239000003446 ligand Substances 0.000 description 54
- 150000001875 compounds Chemical class 0.000 description 33
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 33
- 239000000126 substance Substances 0.000 description 28
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 description 26
- 210000004027 cell Anatomy 0.000 description 26
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 25
- 230000009918 complex formation Effects 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 15
- 150000003384 small molecules Chemical class 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 description 13
- 229960003471 retinol Drugs 0.000 description 13
- 235000020944 retinol Nutrition 0.000 description 13
- 239000011607 retinol Substances 0.000 description 13
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 12
- 210000003888 boundary cell Anatomy 0.000 description 12
- 239000000523 sample Substances 0.000 description 12
- 229920000642 polymer Polymers 0.000 description 10
- 230000006641 stabilisation Effects 0.000 description 10
- 238000011105 stabilization Methods 0.000 description 10
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 229910052799 carbon Inorganic materials 0.000 description 9
- 230000009881 electrostatic interaction Effects 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 9
- 102000029752 retinol binding Human genes 0.000 description 9
- 108091000053 retinol binding Proteins 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 8
- 238000003032 molecular docking Methods 0.000 description 8
- 239000000556 agonist Substances 0.000 description 7
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 7
- 235000001014 amino acid Nutrition 0.000 description 7
- 229940024606 amino acid Drugs 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 150000007523 nucleic acids Chemical class 0.000 description 7
- 125000004430 oxygen atom Chemical group O* 0.000 description 7
- 102000005962 receptors Human genes 0.000 description 7
- 108020003175 receptors Proteins 0.000 description 7
- 102000003702 retinoic acid receptors Human genes 0.000 description 7
- 108090000064 retinoic acid receptors Proteins 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 235000000346 sugar Nutrition 0.000 description 7
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 6
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 6
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- 239000005642 Oleic acid Substances 0.000 description 6
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 6
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 6
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 239000002184 metal Substances 0.000 description 6
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 6
- 229930002330 retinoic acid Natural products 0.000 description 6
- 150000008163 sugars Chemical class 0.000 description 6
- 229960001727 tretinoin Drugs 0.000 description 6
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 5
- 238000005481 NMR spectroscopy Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000013078 crystal Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- -1 ligands Chemical class 0.000 description 5
- IWDCLRJOBJJRNH-UHFFFAOYSA-N p-cresol Chemical compound CC1=CC=C(O)C=C1 IWDCLRJOBJJRNH-UHFFFAOYSA-N 0.000 description 5
- 238000007614 solvation Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 238000004381 surface treatment Methods 0.000 description 5
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 4
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 4
- 102000004894 Glutamine-fructose-6-phosphate transaminase (isomerizing) Human genes 0.000 description 4
- 108090001031 Glutamine-fructose-6-phosphate transaminase (isomerizing) Proteins 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- BAVYZALUXZFZLV-UHFFFAOYSA-O Methylammonium ion Chemical compound [NH3+]C BAVYZALUXZFZLV-UHFFFAOYSA-O 0.000 description 3
- 102000034527 Retinoid X Receptors Human genes 0.000 description 3
- 108010038912 Retinoid X Receptors Proteins 0.000 description 3
- 102000004357 Transferases Human genes 0.000 description 3
- 108090000992 Transferases Proteins 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 125000003158 alcohol group Chemical group 0.000 description 3
- 239000005557 antagonist Substances 0.000 description 3
- 125000003636 chemical group Chemical group 0.000 description 3
- 238000007876 drug discovery Methods 0.000 description 3
- 150000004676 glycans Chemical class 0.000 description 3
- ISNICOKBNZOJQG-UHFFFAOYSA-O guanidinium ion Chemical compound C[NH+]=C(N(C)C)N(C)C ISNICOKBNZOJQG-UHFFFAOYSA-O 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 238000012821 model calculation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 230000000087 stabilizing effect Effects 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 125000004066 1-hydroxyethyl group Chemical group [H]OC([H])([*])C([H])([H])[H] 0.000 description 2
- BHNHHSOHWZKFOX-UHFFFAOYSA-N 2-methyl-1H-indole Chemical compound C1=CC=C2NC(C)=CC2=C1 BHNHHSOHWZKFOX-UHFFFAOYSA-N 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical group CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- QMMFVYPAHWMCMS-UHFFFAOYSA-N Dimethyl sulfide Chemical group CSC QMMFVYPAHWMCMS-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- LSDPWZHWYPCBBB-UHFFFAOYSA-N Methanethiol Chemical compound SC LSDPWZHWYPCBBB-UHFFFAOYSA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N aldehydo-D-ribose Chemical class OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000005515 coenzyme Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000005661 hydrophobic surface Effects 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 238000012482 interaction analysis Methods 0.000 description 2
- 125000005647 linker group Chemical group 0.000 description 2
- 125000001570 methylene group Chemical group [H]C([H])([*:1])[*:2] 0.000 description 2
- 230000004879 molecular function Effects 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- ZFRKQXVRDFCRJG-UHFFFAOYSA-N skatole Chemical compound C1=CC=C2C(C)=CNC2=C1 ZFRKQXVRDFCRJG-UHFFFAOYSA-N 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 238000001644 13C nuclear magnetic resonance spectroscopy Methods 0.000 description 1
- 125000003287 1H-imidazol-4-ylmethyl group Chemical group [H]N1C([H])=NC(C([H])([H])[*])=C1[H] 0.000 description 1
- 125000000980 1H-indol-3-ylmethyl group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[*])C2=C1[H] 0.000 description 1
- 125000000134 2-(methylsulfanyl)ethyl group Chemical group [H]C([H])([H])SC([H])([H])C([H])([H])[*] 0.000 description 1
- 125000000979 2-amino-2-oxoethyl group Chemical group [H]C([*])([H])C(=O)N([H])[H] 0.000 description 1
- ZVQAVWAHRUNNPG-LMVFSUKVSA-N 2-deoxy-alpha-D-ribopyranose Chemical class O[C@@H]1C[C@H](O)[C@H](O)CO1 ZVQAVWAHRUNNPG-LMVFSUKVSA-N 0.000 description 1
- 125000003974 3-carbamimidamidopropyl group Chemical group C(N)(=N)NCCC* 0.000 description 1
- 125000004042 4-aminobutyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])N([H])[H] 0.000 description 1
- 125000003143 4-hydroxybenzyl group Chemical group [H]C([*])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical group NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 238000004615 MNDO calculation Methods 0.000 description 1
- OHLUUHNLEMFGTQ-UHFFFAOYSA-N N-methylacetamide Chemical compound CNC(C)=O OHLUUHNLEMFGTQ-UHFFFAOYSA-N 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000008484 agonism Effects 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 150000004347 all-trans-retinol derivatives Chemical class 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Chemical class OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Chemical class OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical group 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001687 destabilization Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000005421 electrostatic potential Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 125000005313 fatty acid group Chemical group 0.000 description 1
- 238000012617 force field calculation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- XHMJOUIAFHJHBW-VFUOTHLCSA-N glucosamine 6-phosphate Chemical compound N[C@H]1[C@H](O)O[C@H](COP(O)(O)=O)[C@H](O)[C@@H]1O XHMJOUIAFHJHBW-VFUOTHLCSA-N 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000008204 material by function Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229920005615 natural polymer Polymers 0.000 description 1
- 238000011328 necessary treatment Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 102000006255 nuclear receptors Human genes 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000005624 perturbation theories Effects 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000000425 proton nuclear magnetic resonance spectrum Methods 0.000 description 1
- 125000000561 purinyl group Chemical class N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 150000003214 pyranose derivatives Chemical group 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000003077 quantum chemistry computational method Methods 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000005556 structure-activity relationship Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000002653 sulfanylmethyl group Chemical group [H]SC([H])([H])[*] 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000003041 virtual screening Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、生体高分子が低分子や高分子などの外部因子と相互作用または複合体形成する相互作用点を予測する方法およびプログラムに関する。 The present invention relates to a method and a program for predicting an interaction point at which a biopolymer interacts or forms a complex with an external factor such as a small molecule or a polymer.
現在はポストゲノム時代といわれ、膨大な数の遺伝子解析がなされた結果、多数の生体高分子が同定あるいはその存在が予測されている。一方で、生体高分子の機能に着目した機能材料、燃料や新素材などのライフサイエンス分野もまた注目されている。
これら生体高分子およびこれを模擬した非天然の高分子のほとんどは単独でその機能を発揮するのではなく、金属原子や低分子あるいは同種や異種の高分子と相互作用あるいは複合体形成して初めて機能を発揮する。また、外部因子と相互作用することで該生体高分子の高次構造に変化が生じ、その結果として自身の遠隔構造との相互作用によって機能発現する場合もある。本来、生体高分子の高次構造自体が外部因子(例えば水など)との相互作用あるいは複合体形成、さらには生体装置と呼ばれる巨大生体分子システムの形成によって維持されている。
しかしながら、これら生体高分子の大部分において相互作用または複合体形成して機能発現に関わる外部因子が不明であり、また、外部因子が既知の場合でも生体高分子との相互作用部位あるいは複合体形成部位を特定できていないことがほとんどである。
生体高分子の機能を効果的、選択的、安全に発揮させるためには、生体高分子における相互作用部位あるいは複合体形成部位を特定し、原子レベルで解析する必要がある。こうした手続きは天然の外部因子の探索のみならず、新規因子の探索や既知因子に対する構造修飾等においても迅速であり、かつ最も論理的といえる。
The post-genome era is now called, and as a result of a huge number of gene analyses, many biopolymers have been identified or predicted to exist. On the other hand, the field of life science such as functional materials focusing on the functions of biopolymers, fuels and new materials is also attracting attention.
Most of these biopolymers and non-natural polymers simulating them do not perform their functions alone, but only after interacting with or forming complexes with metal atoms, low molecules, or similar or different polymers. Demonstrate the function. In addition, interaction with an external factor may cause a change in the higher-order structure of the biopolymer, and as a result, the function may be expressed by interaction with its own remote structure. Originally, the higher-order structure of a biopolymer itself is maintained by interaction with external factors (for example, water) or complex formation, and further by formation of a macrobiomolecule system called a biological device.
However, in most of these biopolymers, external factors involved in functional expression through interaction or complex formation are unknown, and even when external factors are known, interaction sites with biopolymers or complex formation In most cases, the site has not been identified.
In order to effectively, selectively, and safely exert the function of the biopolymer, it is necessary to identify the interaction site or complex formation site in the biopolymer and analyze it at the atomic level. Such a procedure is not only a search for natural external factors but also a rapid and most logical search for new factors and structural modifications to known factors.
構造ベース創薬では標的生体高分子の立体構造、厳密には安定立体構造の原子座標が必須であり、これは現在、X線結晶構造解析、核磁気共鳴(NMR)または科学的根拠をもったホモロジーモデリング等の分子モデリングで得られる。
しかしながら、生体高分子の立体構造は、教科書等で表現される明確な「鍵と鍵穴」の形状を持っている訳ではなく、外観からはどの位置が相互作用部位または複合体形成部位であるか一切判断できない。
現在のところ、X線結晶構造解析の技術を用いることによってリガンドの複合体形成部位(すなわち、リガンド結合部位)および高分子等の複合体形成部位を特定できるが、得られた立体構造中にリガンド等が複合体を形成しているかどうかは偶然に頼らざるを得ず、リガンド結合部位あるいは高分子等の複合体形成部位の特定に至らない場合が大部分である。
その他の技術として、ポイントミューテーションや放射線標識といった化学的手法やNMRや蛍光などの分光学的手法が存在するが、いずれも膨大な実験と労力を必要とする一方で、成功した場合であっても非常に広範囲にわたる大まかな領域を推定できる程度の結果しか得られない。
一方、リガンド結合部位や高分子との複合体形成部位を予測するアルゴリズムもわずかであるが知られている。
例えばリガンド結合部位を予測するアルゴリズムに関して言えば、これらはいずれもプローブ原子やプローブ分子を用いて、必要処理を施した生体高分子全体あるいは一部を一定間隔の立方体の集合(すなわち、グリッド)で分割して、各格子点上に該プローブを配置して相互作用エネルギーを見積もる方法(すなわち、グリッドベース)(例えば、非特許文献1および非特許文献2参照)または非グリッドベースの手法(非特許文献3参照)である。
Structure-based drug discovery requires the three-dimensional structure of the target biopolymer, strictly speaking, the atomic coordinates of the stable three-dimensional structure, which currently has X-ray crystal structure analysis, nuclear magnetic resonance (NMR), or scientific evidence. Obtained by molecular modeling such as homology modeling.
However, the three-dimensional structure of biopolymers does not have a clear “key and keyhole” shape expressed in textbooks, etc., and what position is the interaction site or complex formation site from the appearance I cannot judge at all.
At present, by using the X-ray crystal structure analysis technique, a complex formation site of a ligand (that is, a ligand binding site) and a complex formation site such as a polymer can be specified. In most cases, it is impossible to identify a ligand-binding site or a complex-forming site such as a polymer.
Other technologies include chemical methods such as point mutation and radiolabeling, and spectroscopic methods such as NMR and fluorescence, all of which require enormous experimentation and effort, but are successful. However, it is possible to obtain only a result that can estimate a very broad area.
On the other hand, few algorithms are known for predicting a ligand-binding site or a complex-forming site with a polymer.
For example, with regard to algorithms for predicting ligand binding sites, these are all a set of cubes (ie, grids) at regular intervals, using probe atoms and probe molecules, and all or part of the biopolymer that has undergone the necessary treatment. A method of dividing and arranging the probe on each lattice point to estimate the interaction energy (that is, grid-based) (for example, see Non-Patent Document 1 and Non-Patent Document 2) or a non-grid-based method (non-patent) Reference 3).
プローブ原子やプローブ分子を用いたこれら手法は、以下に述べる多くの問題を含んでいる。
すなわち、これら手法では、(1)相互作用エネルギーを概算するために、提供される生体高分子システムのデータから生体高分子以外の分子や金属原子などの成分データを除去しなければならず、これら除去した成分からのエネルギー寄与を無視しなければならないだけでなく、これに伴う余分な作業が生じるとともに、特殊な作業知識が必要になる、(2)プローブ原子やプローブ分子にサイズがある(すなわち、原子半径あるいは分子半径を持っている)ことにより、狭い空間を探索できず、複合体形成部位を見逃すことがある、(3)生体高分子の座標を読み込んだ後に全格子点上あるいは生体高分子表面上をプローブ原子やプローブ分子で走査して相互作用エネルギーを計算しなければならず、これに伴う余分な作業が生じる、(4)プローブ分子を用いた場合には生体高分子内部座標系に対するプローブ分子の配向の問題が生じる、(5)現状において、相互作用エネルギーの概算には力場計算レベルしか利用できないが、力場計算レベルでは電子相関相互作用の寄与が大きい相互作用エネルギーを大幅に過小評価して、複合体形成部位を見逃すことがある、等の問題点を生じる。(5)については、特にリガンド結合部位は疎水的な環境にあることが多いので、この問題は重大である。疎水的なプローブ分子を用いて予測精度が向上したとする非特許文献1および非特許文献2の結果はこのためであり、該プローブ分子を用いた場合には逆に静電相互作用の寄与が大きい相互作用エネルギーを大幅に過小評価して複合体形成部位を見逃すことにつながり、本質的な解決にならない。さらに、グリッドベースのアルゴリズムでは、格子点の周囲に急激に安定化するエネルギー極小点がある場合、複合体形成部位を見逃すことがある他、非特許文献3で述べられるように、同じグリッド距離でもグリッドを作成する始点によって格子点位置がずれてエネルギー値が異なってしまい、その結果として予測位置の再現性を失うというグリッドベース特有の欠点をさらに含んでいる。
These methods using probe atoms and probe molecules have many problems described below.
That is, in these methods, (1) in order to estimate the interaction energy, component data such as molecules other than biopolymers and metal atoms must be removed from the data of the provided biopolymer system. In addition to ignoring the energy contribution from the removed components, extra work is involved and special working knowledge is required. (2) Probe atoms and probe molecules are sized (ie (It has an atomic radius or a molecular radius), and a narrow space cannot be searched, and the complex formation site may be missed. (3) After reading the coordinates of the biopolymer, or on the whole lattice point The interaction energy must be calculated by scanning the surface of the molecule with probe atoms or molecules, resulting in extra work ( ) When probe molecules are used, the problem of orientation of probe molecules with respect to the internal coordinate system of biopolymers arises. (5) At present, only the force field calculation level can be used to estimate the interaction energy. At the level, the interaction energy greatly contributed by the electron correlation interaction is greatly underestimated, and the complex formation site may be missed. For (5), this problem is significant, especially since the ligand binding site is often in a hydrophobic environment. This is the result of Non-Patent Document 1 and Non-Patent Document 2 that the prediction accuracy is improved by using a hydrophobic probe molecule, and conversely, when the probe molecule is used, the contribution of electrostatic interaction is The large interaction energy is greatly underestimated, leading to missed complex formation sites and is not an essential solution. Furthermore, in the grid-based algorithm, when there is an energy minimum point that rapidly stabilizes around the lattice point, a complex formation site may be missed, and as described in Non-Patent Document 3, even with the same grid distance, The grid base position is shifted depending on the starting point for creating the grid, resulting in a difference in energy value. As a result, there is a further disadvantage inherent to the grid base in that the reproducibility of the predicted position is lost.
また、高分子との複合体形成部位に関しては、現在知られるアルゴリズムは本質的に生体高分子の疎水的な表面を探索して推定する方法程度でしかない。
上記の問題点を克服する方法については、現在、国家プロジェクトとして、全世界で様々な方面から巨額を投じ、しのぎを削って研究されているにもかかわらず、有効な手法は知られていない。
ドッキングシミュレーションやバーチャルスクリーニング等の構造ベース創薬は、いずれもリガンド結合部位が特定された後に使用される技術であり、リガンド結合部位または高分子との複合体形成部位が不明な大部分の生体高分子については、これらの技術を適用できないのは言うまでもない。逆に、リガンド結合部位または高分子との複合体形成部位が正確に予測することが可能となれば、その後の様々な応用が期待される。
In addition, regarding a complex formation site with a polymer, the currently known algorithm is essentially only a method of searching and estimating a hydrophobic surface of a biopolymer.
As for a method for overcoming the above problems, an effective method is not known, although it is currently being studied as a national project by investing a huge amount of money from various directions all over the world.
Structure-based drug discovery, such as docking simulation and virtual screening, is a technique that is used after the ligand binding site has been identified. Needless to say, these techniques cannot be applied to molecules. On the other hand, if it is possible to accurately predict the ligand binding site or the site where the complex is formed with the polymer, various subsequent applications are expected.
本発明は、生体高分子における内部遠隔構造あるいは金属原子、低分子や高分子などの外部因子との相互作用部位を探索し、該相互作用部位に親和性のある化学基、化学種または分子種を予測する方法を提供するものである。 The present invention searches for an internal remote structure in a biopolymer or an interaction site with an external factor such as a metal atom, a small molecule or a polymer, and has a chemical group, species or molecular species having an affinity for the interaction site. The method of predicting is provided.
本発明者は、生体高分子全体構造を取り扱う既存の手法とは全く異なった視点、すなわち、生体高分子を構成し、化学的性質を損なわない程度まで最小化した基本フラグメントに生体高分子全体構造を分割し、該基本フラグメントから全体構造を再構築することで、高度に複雑化した生体高分子のエネルギー的性質を基本フラグメントにおけるより単純化されたエネルギー的性質に帰属させるという方法により本課題を解決した。
すなわち、本発明者は、生体高分子構成原子の相互作用点情報をデータベース化し、前記データベースを参照して、任意の生体高分子構成原子の原子座標情報から相互作用点の位置(座標)を算出することによって、前記生体高分子の相互作用部位を予測する方法を開発することに成功した。
The present inventor has a completely different viewpoint from the existing method of handling the entire structure of the biopolymer, that is, the entire structure of the biopolymer is made into a basic fragment that constitutes the biopolymer and is minimized to the extent that the chemical properties are not impaired. And restructuring the entire structure from the basic fragment, thereby assigning the energy properties of highly complex biopolymers to the simplified energy properties of the basic fragments. Settled.
That is, the present inventor creates a database of interaction point information of biopolymer constituent atoms and calculates the position (coordinate) of the interaction point from the atomic coordinate information of any biopolymer constituent atom with reference to the database. By doing so, the inventors succeeded in developing a method for predicting the interaction site of the biopolymer.
即ち、本発明は、
生体高分子における相互作用部位を予測する方法であって、
生体高分子の原子座標情報を準備する第一工程、
相互作用点情報データベースに基づいて前記生体高分子の相互作用点候補の座標を特定する第二工程であって、前記相互作用点情報データベースは生体高分子構成単位の相互作用点の座標を特定するための位置情報を含み、該情報を、与えられた生体高分子の構成単位の原子座標情報に適用することによって相互作用点候補の位置を特定する工程、
第二工程で特定した相互作用点候補のうち、生体高分子の構成原子との相互作用に関与する相互作用点候補を除去する第三工程、
を含む、上記方法を提供する。
That is, the present invention
A method for predicting an interaction site in a biopolymer,
The first step of preparing atomic coordinate information of biopolymers,
A second step of identifying coordinates of the interaction point candidate of the biopolymer based on the interaction point information database, wherein the interaction point information database identifies the coordinates of the interaction point of the biopolymer constituent unit Identifying the position of a candidate interaction point by applying the information to atomic coordinate information of a given biopolymer constituent unit,
Of the interaction point candidates identified in the second step, the third step of removing the interaction point candidates involved in the interaction with the constituent atoms of the biopolymer,
The above method is provided.
また、本発明は、
第三工程の後に、さらに
生体高分子の表面と溶媒分子との相互作用に関与する相互作用点候補を除去する第四工程、
を含む、生体高分子における相互作用部位を予測する方法を提供する。
The present invention also provides:
After the third step, a fourth step of further removing interaction point candidates involved in the interaction between the surface of the biopolymer and the solvent molecule,
A method for predicting an interaction site in a biopolymer is provided.
さらに、本発明は、
生体高分子における相互作用部位を予測するコンピュータプログラムであって、
生体高分子の原子座標情報を読み込む第一手順、
相互作用点情報データベースを参照して前記生体高分子の相互作用点候補の座標を特定する手順であって、前記相互作用点情報データベースは生体高分子構成単位の相互作用点の座標を特定するための位置情報を含み、該情報を、与えられた生体高分子の構成単位の原子座標情報に適用することによって相互作用点候補の位置を特定する第二手順、
第二手順で特定した相互作用点候補について、
該相互作用点候補から所定距離内に生体高分子の構成原子が存在するか否かを判定し、所定距離内に存在するときは、前記相互作用点候補を除去する第三手順、
予測された相互作用点の位置をディスプレイ上に表示する手順
をコンピュータに実行させるための、上記コンピュータプログラムを提供する。
Furthermore, the present invention provides
A computer program for predicting an interaction site in a biopolymer,
First step to read atomic coordinate information of biopolymer,
A procedure for identifying coordinates of interaction point candidates of the biopolymer with reference to an interaction point information database, the interaction point information database identifying coordinates of interaction points of biopolymer constituent units A second procedure for identifying a position of a candidate interaction point by applying the information to atomic coordinate information of a given biopolymer constituent unit,
For the interaction point candidates identified in the second step,
Determining whether or not a constituent atom of the biopolymer exists within a predetermined distance from the interaction point candidate, and when present within the predetermined distance, a third procedure for removing the interaction point candidate;
A computer program for causing a computer to execute a procedure for displaying a predicted position of an interaction point on a display is provided.
また、本発明は、
生体高分子における相互作用部位を予測するコンピュータプログラムであって、
生体高分子の原子座標情報を読み込む第一手順、
相互作用点情報データベースを参照して前記生体高分子の相互作用点候補の座標を特定する手順であって、前記相互作用点情報データベースは生体高分子構成単位の相互作用点の座標を特定するための位置情報を含み、該情報を、与えられた生体高分子の構成単位の原子座標情報に適用することによって相互作用点候補の位置を特定する第二手順、
第二手順で特定した相互作用点候補について、
該相互作用点候補から所定距離内に生体高分子の構成原子が存在するか否かを判定し、所定距離内に存在するときは前記相互作用点候補を除去する第三手順、
各相互作用点候補について、生体高分子の溶媒接触表面またはファンデルワールス表面の外側に存在する場合に、前記相互作用点候補を除去する第四手順。
予測された相互作用点の位置をディスプレイ上に表示する手順
をコンピュータに実行させるための、上記コンピュータプログラムを提供する。
The present invention also provides:
A computer program for predicting an interaction site in a biopolymer,
First step to read atomic coordinate information of biopolymer,
A procedure for identifying coordinates of interaction point candidates of the biopolymer with reference to an interaction point information database, the interaction point information database identifying coordinates of interaction points of biopolymer constituent units A second procedure for identifying a position of a candidate interaction point by applying the information to atomic coordinate information of a given biopolymer constituent unit,
For the interaction point candidates identified in the second step,
A third procedure for determining whether or not a constituent atom of a biopolymer exists within a predetermined distance from the interaction point candidate, and removing the interaction point candidate when present within a predetermined distance;
A fourth procedure of removing each interaction point candidate when the interaction point candidate exists outside the solvent contact surface or van der Waals surface of the biopolymer.
A computer program for causing a computer to execute a procedure for displaying a predicted position of an interaction point on a display is provided.
本発明により、任意生体高分子システムの全体構造あるいは部分構造のみから自動的かつ正確に外部因子の複合体形成部位を特定できるようになる。また、前記部位の物理化学情報を提供することによって、前記複合体形成部位で複合体を形成しうる外部因子の形状および詳細な化学的要求性を識別することが可能となる。 According to the present invention, a complex formation site of an external factor can be specified automatically and accurately only from the entire structure or partial structure of an arbitrary biopolymer system. In addition, by providing the physicochemical information of the site, it is possible to identify the shape and detailed chemical requirement of external factors that can form a complex at the complex-forming site.
以下、本発明を詳細に説明する。必要により本発明の工程を示した図1を参照されたい。
本明細書において、「生体高分子」とは、タンパク質、核酸、糖などの生体内に一般に存在する高分子化合物を含む。なお、生体高分子は天然のものである必要はなく、それらを改変したもの、またはそれらを模倣して人工的に合成したものであってもよい。本発明において特に好ましい生体高分子はタンパク質である。また、生体高分子は、水分子、リガンドなどの低分子、金属原子、生体膜の成分等の他の分子が生体内と同じ状態として、あるいはアーティファクトとして結合してもよく、他の分子等が含まれる場合、生体高分子および前記他の分子をまとめて生体高分子システムという用語で表す。
本明細書において、「相互作用点」とは、生体高分子構成原子との間で生じる相互作用エネルギー極小点、またはその周辺の局所的な領域を意味し、例えばファンデルワールス相互作用、静電相互作用などのエネルギー極小点が挙げられる。また、相互作用点を含み、生体高分子において外部因子と相互作用すると認識される領域全体を相互作用部位と表す。外部因子とは、生体高分子に構造的、機能的、または物性的影響を及ぼすか、あるいは情報伝達などに関わる原子や分子を意味し、例えば金属原子、補酵素、活性化因子や抑制因子などの補因子、低分子化合物、核酸や糖などの生体高分子または水分子などが挙げられる。特に、外部因子が生体高分子に特異的な低分子化合物である場合には、リガンドまたは基質という用語を用いる。複合体形成部位とは、該生体高分子に特異的なリガンド、補因子、または生体高分子が結合する特定の相互作用部位を意味する。
Hereinafter, the present invention will be described in detail. Please refer to FIG. 1 showing the process of the present invention if necessary.
In the present specification, the “biopolymer” includes a high molecular compound generally present in the living body such as protein, nucleic acid, sugar and the like. The biopolymers need not be natural, and may be modified from them or artificially synthesized by imitating them. Particularly preferred biopolymers in the present invention are proteins. Biomolecules may be water molecules, small molecules such as ligands, other molecules such as metal atoms, components of biological membranes, or the like in the living body or bound as artifacts. When included, the biopolymer and the other molecules are collectively represented by the term biopolymer system.
In the present specification, the “interaction point” means a minimum point of interaction energy generated with a biopolymer constituent atom or a local region around it, for example, van der Waals interaction, electrostatic Energy minimum points such as interaction are listed. In addition, the entire region that includes the interaction point and is recognized to interact with the external factor in the biopolymer is represented as an interaction site. External factors refer to atoms or molecules that have structural, functional, or physical effects on biopolymers or are involved in information transmission, such as metal atoms, coenzymes, activators, suppressors, etc. Cofactors, low molecular weight compounds, biopolymers such as nucleic acids and sugars, or water molecules. In particular, the term ligand or substrate is used when the external factor is a low molecular weight compound specific for a biopolymer. The complex formation site means a specific interaction site to which a ligand, cofactor or biopolymer specific for the biopolymer binds.
また、本明細書において「相互作用形態」とは、ある相互作用に関与している要素(ここでは化学結合環境の異なる原子や原子団)の種類および各要素間の位置関係を意味する。例えば、代表的な相互作用形態として、古典的な水素結合や塩橋、あるいはCH−π相互作用等が挙げられる。
また、ある相互作用形態を構成する個別の原子や原子団を、その化学結合環境や隣接する重原子の種類により分類して表したものを本明細書では「相互作用形態タイプ」と表す。例えば、前述の相互作用形態の1つである古典的な水素結合を構成する相互作用形態タイプとしては酸性プロトン(またはこれを含む原子団)とその受容体である塩基性ヘテロ原子(またはこれを含む原子団)、別の相互作用形態である塩橋を構成する相互作用形態タイプとしてはカルボキシルアニオンとアンモニウムイオン、また別の相互作用形態であるCH−π相互作用を構成する相互作用形態タイプとしては中性炭素に結合した水素原子(またはこれらを含む原子団)とπ結合性炭素原子(またはこれを含む原子団)が挙げられる。各相互作用形態タイプは、原子および原子団の種類から、その化学結合環境や隣接する重原子の種類に基づいて定義されるため、その原子および原子団の関与する相互作用点も各相互作用形態タイプに特有なものとなる。
In the present specification, the “interaction form” means the type of elements (in this case, atoms and atomic groups having different chemical bonding environments) involved in a certain interaction and the positional relationship between the elements. For example, typical hydrogen bonds, salt bridges, CH-π interactions, and the like are given as typical interaction forms.
Further, in the present specification, an “interaction form type” is a classification of individual atoms and atomic groups constituting a certain interaction form classified according to the chemical bonding environment and the type of adjacent heavy atoms. For example, one of the interaction forms described above is an interaction form type that forms a classical hydrogen bond, which includes an acidic proton (or an atomic group containing it) and a basic heteroatom (or this) that accepts it. As an interaction form type that constitutes a salt bridge that is another interaction form, a carboxyl anion and an ammonium ion, and an interaction form type that constitutes a CH-π interaction, which is another interaction form. Includes a hydrogen atom (or an atomic group containing them) bonded to a neutral carbon and a π-bonded carbon atom (or an atomic group containing them). Each interaction form type is defined based on the type of atom and atomic group, based on its chemical bonding environment and the type of adjacent heavy atom, so that the interaction point involving the atom and atomic group also depends on the interaction form. It will be specific to the type.
1、第一工程
本発明の第一工程では、生体高分子の原子座標情報が準備される。この場合、生体高分子に結合した他の分子も含めて一体として扱ってもよい。本明細書において、原子座標情報は、生体高分子の構成原子の位置を特定する情報であればどのような形式のものでもよいが、三次元座標系で特定されることが好ましい。これは、例えばX線結晶構造解析やNMR解析等の手法によって決定されるものであり、本発明に使用し得る原子座標情報として、例えば「プロテインデータバンク(http://pdbj.protein.osaka-u.ac.jp/)」に公開される情報が挙げられる。
通常、生体高分子システムの原子座標を読み込む時点では水素原子は立体構造に付加されていない。これは、生体高分子の水素原子に関する原子座標は一般に実験的に得られないことによる。一般的に、水素原子は文献値の距離、結合する重原子の原子価からその結合角および隣接重原子上の結合情報から二面角が自動的に算出され、該水素原子が回転可能な結合上にある場合は、トランスコンフォメーションで付加することができる。このように、アミノ酸残基の構造から、そのアミノ酸残基に含まれる水素原子の原子座標を計算することは当業者が容易に行い得ることであり、この計算を自動的に行うさまざまなプログラムも存在する(HyperChem(TM) Professional 7.51, Hypercube, Inc., 1115 NW 4th Street, Gainesville, Florida 32601, USA)。例えば、Homology Modeling for HyperChem, Revision A3 (Institute of Molecular Function; Saitama, Japan, http://www.molfunction.com)の水素原子初期座標評価プログラム(http://www.molfunction.com/algorithm.htm) を用いて決定することも可能であるが、いずれの方法、プログラムを採用してもよい。なお、後述するように、水素原子に関わる相互作用点を、該水素原子が結合する重原子から定義し、水素原子との距離を考慮した上で一定の回転角度毎に複数に定義しておけば、水素原子は任意の方向に配置されていてもよい。
1. First Step In the first step of the present invention, atomic coordinate information of a biopolymer is prepared. In this case, it may be handled as one body including other molecules bonded to the biopolymer. In this specification, the atomic coordinate information may be in any format as long as it is information for specifying the position of the constituent atom of the biopolymer, but is preferably specified in a three-dimensional coordinate system. This is determined, for example, by a technique such as X-ray crystal structure analysis or NMR analysis. As atomic coordinate information that can be used in the present invention, for example, “Protein Data Bank (http: //pdbj.protein.osaka- u.ac.jp/) ”.
Normally, hydrogen atoms are not added to the three-dimensional structure at the time of reading the atomic coordinates of the biopolymer system. This is because the atomic coordinates regarding the hydrogen atom of the biopolymer are generally not experimentally obtained. In general, for hydrogen atoms, the dihedral angle is automatically calculated from the distance of literature values, the bond angle from the valence of the heavy atom to be bonded, and the bond information on the adjacent heavy atom, and the hydrogen atom can rotate. If it is above, it can be added in a trans conformation. Thus, it is easy for those skilled in the art to calculate the atomic coordinates of the hydrogen atom contained in an amino acid residue from the structure of the amino acid residue, and various programs that automatically perform this calculation are also available. Exists (HyperChem ™ Professional 7.51, Hypercube, Inc., 1115 NW 4th Street, Gainesville, Florida 32601, USA). For example, Homology Modeling for HyperChem, Revision A3 (Institute of Molecular Function; Saitama, Japan, http://www.molfunction.com), an initial coordinate evaluation program for hydrogen atoms (http://www.molfunction.com/algorithm.htm) ) Can be used, but any method or program may be adopted. As will be described later, the interaction point related to a hydrogen atom is defined from the heavy atom to which the hydrogen atom is bonded, and in consideration of the distance from the hydrogen atom, a plurality of interaction points can be defined at a certain rotation angle. For example, the hydrogen atoms may be arranged in any direction.
2、第二工程
(1)相互作用点情報データベースの内容
本発明の第二工程では、相互作用点情報データベースに基づいて、生体高分子の相互作用点の位置が特定される。相互作用点情報データベースとは、生体高分子の構成単位(例えばタンパク質であれば二十種類のアミノ酸、核酸では五種類の核酸塩基と二種類の糖、多糖では代表的な単糖類)についての相互作用点の情報を予め収集し、参照可能な状態にしたデータベースを意味する。
前記相互作用点情報データベースには、生体高分子の構成単位(例えば二十種類の各アミノ酸)に対する相互作用点の位置を特定するための「位置情報」が少なくとも含まれる。さらには、各相互作用点の「物理化学情報」を含むことが好ましい。
ここで、「位置情報」とは、生体高分子の相互作用点の位置を決定するのに必要な情報を意味し、三次元空間における相互作用点の位置を特定し得る限りいずれの形式で作成されてもよい。例えば、生体高分子構成単位中の3個の原子(アルファ位、ベータ位、ガンマ位)を指定し、それらに対する距離、結合角および二面角を特定することにより、相互作用点の座標を一義的に決定することができるため、これらの情報をマトリクス形式にしたものが一例として挙げられる。
2. Contents of the second step (1) interaction point information database In the second step of the present invention, the position of the interaction point of the biopolymer is specified based on the interaction point information database. The interaction point information database refers to the mutual relationship between structural units of biopolymers (for example, 20 types of amino acids for proteins, 5 types of nucleobases and 2 types of sugars for nucleic acids, and typical monosaccharides for polysaccharides). It means a database where action point information has been collected in advance and made available for reference.
The interaction point information database includes at least “position information” for specifying the position of an interaction point with respect to a structural unit (for example, each of twenty kinds of amino acids) of a biopolymer. Furthermore, it is preferable to include “physicochemical information” of each interaction point.
Here, “positional information” means information necessary to determine the position of the interaction point of the biopolymer, and is created in any format as long as the position of the interaction point in the three-dimensional space can be specified. May be. For example, by specifying three atoms (alpha position, beta position, and gamma position) in the biopolymer structural unit, and specifying the distance, bond angle, and dihedral angle to them, the coordinates of the interaction point are unambiguous. As an example, the information in the form of a matrix can be given.
また、相互作用点の「物理化学情報」とは、生体高分子構成原子の物理的または化学的性質に基づいて求められる、該原子に由来する相互作用点の性質を表すための情報を意味する。なお、この情報は相互作用点の位置の決定には関係しない。
本発明においては、例えば、「物理化学情報」として、相互作用点を生成する原子を含む相互作用形態の相互作用エネルギーが、電子相関相互作用エネルギーの寄与を主成分とするか(電子相関項支配)または静電相互作用エネルギーの寄与を主成分とするか(静電項支配)、さらに、静電相互作用エネルギーの寄与を主成分とする場合には該相互作用点を生成する原子が正電荷(すなわち、電子受容性)であるか、負電荷(すなわち、電子供与性)であるかの3種類で分類して、それぞれC、P,およびNなどとしてデータベースに記録しておくことができる。
また別の態様においては、相互作用点を生成する原子のマリケン原子電荷を情報としてデータベースに加えておくと、電子相関項支配の相互作用点を生成する原子の電荷がゼロに近くなるため、電荷を指標として、潜在的な相互作用相手の重原子上の化学的要求性を判別できるようになる。
In addition, the “physicochemical information” of the interaction point means information for expressing the property of the interaction point derived from the atom, which is obtained based on the physical or chemical property of the biopolymer constituent atom. . This information is not related to the determination of the position of the interaction point.
In the present invention, for example, as “physicochemical information”, whether the interaction energy of the interaction form including the atom that generates the interaction point is based on the contribution of the electron correlation interaction energy (dominance of the electron correlation term). ) Or the contribution of electrostatic interaction energy as the main component (dominance of electrostatic term), and when the contribution of electrostatic interaction energy is the main component, the atom generating the interaction point is positively charged (Ie, electron accepting) or negative charge (ie, electron donating), and can be recorded in the database as C, P, N, etc., respectively.
In another embodiment, if the Mariken atom charge of the atom that generates the interaction point is added to the database as information, the charge of the atom that generates the interaction point dominated by the electron correlation term is close to zero. Using this as an index, the chemical requirement on the heavy atom of the potential interaction partner can be determined.
ある相互作用形態の安定化(または不安定化)に寄与する全相互作用エネルギー、Etot、は、電子相関、特に、分散力のエネルギー寄与(すなわち、電子相関相互作用エネルギー、Ecorr;以下、単に電子相関項と表す)と静電相互作用のエネルギー寄与(すなわち、静電相互作用エネルギー、Ees;以下、単に静電項と表す)から規定することが可能であり、複合体計算に対して電子相関を取り扱える理論計算を利用するかぎりにおいて、当業者が任意の方法で計算することができる。例えば、複合体計算に対して電子相関を取り扱える理論計算としてメラー・プレセット2次相関摂動理論を用いる場合には、式1から概算できる。また、他の理論を用いた場合には式1のEMP2を該理論から得られる相互作用エネルギーに置き換えるだけでよい。但し、本発明を実施する上では、これらの絶対値よりはむしろ相対的な強弱が分かれば十分である。
なお、本明細書では、ある相互作用形態における全相互作用エネルギーの過半数以上の安定化に、電子相関相互作用エネルギーが寄与している場合を電子相関項支配、逆に静電相互作用エネルギーが寄与している場合を静電項支配と表す。
The total interaction energy, E tot , that contributes to the stabilization (or destabilization) of a certain interaction form is the electron correlation, in particular the energy contribution of the dispersion force (ie the electron correlation interaction energy, E corr ; Can be defined from the energy contribution of the electrostatic interaction (ie, the electrostatic interaction energy, E es ; hereinafter simply referred to as the electrostatic term) As long as a theoretical calculation that can handle electron correlation is used, a person skilled in the art can perform the calculation by an arbitrary method. For example, when the Meller-preset second-order correlation perturbation theory is used as the theoretical calculation that can handle the electron correlation for the complex calculation, it can be estimated from Equation 1. Further, in the case of using other theories need only replace the interaction energy obtained the E MP2 of formula 1 from該理theory. However, in practicing the present invention, it is sufficient to know the relative strength rather than the absolute value.
In this specification, the case where the electron correlation interaction energy contributes to the stabilization of more than a majority of the total interaction energy in a certain interaction form is governed by the electron correlation term, and conversely the electrostatic interaction energy contributes. This is expressed as electrostatic term control.
式1
Formula 1
相互作用点の物理化学情報としては、前述の通り、相互作用に関与する原子が正電荷であるか、負電荷であるか、またはそれ以外であるかという3種類だけでも情報として有用であるが、さらに詳細に分類しておくことも可能である。
例えば、アラニン、ロイシン、バリン、イソロイシン、およびトレオニン側鎖末端メチル基における水素原子および炭素原子は全体としてはそれぞれの残基上の異なる環境にあるが、化学的環境としては同等であり、したがって、これらが関与する相互作用形態、および該相互作用形態における相互作用の物理化学的性質(例えば相互作用エネルギー、相互作用距離や角度)が同等であるため、一つのタイプ、すなわち一つの相互作用形態タイプとして取り扱うことができる。
ここで、化学的環境として同等とは、化学結合環境や隣接する重原子が同じであるという意味であり、厳密な化学的等価性を意味するものではない。例えば、化学結合環境を反映するNMRや赤外吸収(IR)などの分光学を用いた場合、遠隔の原子や原子団による遮蔽効果がなければ、プロトンNMRでは前記各末端メチル基のプロトンのエネルギー吸収位置は互いに区別できないし、カーボンNMRでも同様に各メチル基の炭素原子のエネルギー吸収位置は互いに区別が困難なほど近接しているはずである。IRでも同様にこれらの赤外線吸収位置は重なっているはずである。このように、当業者であればタンパク質分子内に見出される相互作用形態タイプを化学結合環境に基づいて設定することは可能である。但し、相互作用形態タイプの設定は化学的性質を大きく損なわなければ様々に可能であり、本発明で利用する相互作用形態タイプはこれらに限定されるものではない。
As described above, as the physicochemical information of the interaction point, only three types of information whether the atom involved in the interaction is positively charged, negatively charged, or otherwise are useful as information. It is also possible to classify in more detail.
For example, the hydrogen and carbon atoms in the alanine, leucine, valine, isoleucine, and threonine side chain terminal methyl groups are generally in different environments on their respective residues, but are equivalent in chemical environment, and therefore Since the interaction forms that involve them and the physicochemical properties of the interactions in the interaction forms (eg, interaction energy, interaction distance and angle) are equivalent, one type, ie one interaction form type Can be handled as
Here, the equivalent chemical environment means that the chemical bonding environment and adjacent heavy atoms are the same, and does not mean strict chemical equivalence. For example, in the case of using NMR or infrared absorption (IR) reflecting the chemical bonding environment, if there is no shielding effect by remote atoms or atomic groups, in proton NMR, the proton energy of each terminal methyl group The absorption positions cannot be distinguished from each other. Similarly, in carbon NMR, the energy absorption positions of the carbon atoms of each methyl group should be close enough to be difficult to distinguish from each other. In the IR as well, these infrared absorption positions should overlap. Thus, those skilled in the art can set the interaction form type found in a protein molecule based on the chemical binding environment. However, the interaction form type can be variously set as long as the chemical properties are not greatly impaired, and the interaction form type used in the present invention is not limited to these.
表1はタンパク質分子についての相互作用形態タイプの例を示すものである。タンパク質については相互作用形態タイプを以下の表から特定して、データベース上に各原子の情報として登録しておくことができる。
表1 相互作用形態タイプの略語表記
Table 1 shows examples of interaction morphology types for protein molecules. For proteins, the interaction form type can be specified from the following table and registered as information of each atom on the database.
Table 1 Abbreviation notation of interaction form type
上記の表において、例えば「メチル、メチレンプロトン」とは、1級炭素上(メチル基)の3つの水素原子および2級炭素上(メチレン基)の2個の水素原子で化学結合環境が同等なタンパク質を構成するアミノ酸の原子団(または原子)を意味する。
各相互作用形態タイプについて、モデル化合物を用いた複合体解析等を行うことによって、後述する相互作用点情報データベースの作成に必要な位置情報を収集することができる。
さらに、実際の相互作用エネルギー値、またはエネルギー的に安定化する相互作用であるか不安定化する相互作用であるかという情報を収集することも可能であり、これらの情報は、具体的な生体高分子とリガンドとの間の相互作用を調べる際、例えば相互作用点の分子重ね合わせを行う際に有用となる。
In the above table, for example, “methyl, methylene proton” means that the chemical bonding environment is equivalent for three hydrogen atoms on the primary carbon (methyl group) and two hydrogen atoms on the secondary carbon (methylene group). It means an atomic group (or atom) of amino acids constituting a protein.
By performing complex analysis using a model compound for each interaction form type, position information necessary for creating an interaction point information database described later can be collected.
Furthermore, it is also possible to collect information about the actual interaction energy value, or whether the interaction is energetically stabilized or destabilized. This is useful when examining the interaction between the polymer and the ligand, for example, when performing molecular superposition of interaction points.
(2)相互作用点情報データベースの作成
相互作用点情報データベースの作成に必要な位置情報および物理化学情報は、当技術分野に知られる方法、例えば、生体高分子の構成単位(例えばタンパク質分子については二十種類のアミノ酸、核酸では五種類の核酸塩基と二種類の糖、多糖では代表的な単糖類)に含まれる構成フラグメントに対応する低分子モデル化合物間の二体間、または必要に応じて多体間複合体モデルの高レベル量子化学計算、すなわち、十分量の基底関数を持ち、複合体計算で電子相関を取り扱えるレベルの理論計算を網羅的に実施することによって得ることができる。
ここで、フラグメントとは、例えば、タンパク質分子ではプロトン化状態も含む二十種類のアミノ酸側鎖および主鎖アミド、さらには、これらアミノ酸側鎖を構成するさらに分割された少数の原子団を意味する。フラグメントに対応する低分子モデル化合物は、例えば、アラニン側鎖はメタン分子としてモデル化することが可能であり、ロイシン、イソロイシン、バリンやトレオニンの末端メチル基のモデル化合物は同様にメタン分子とすることができる(図2参照)。なお、モデル化合物はタンパク質内に見出される相互作用形態タイプそのものであることも該タイプを部分構造として含んでいる場合もある。このように、化学的性質を大きく損なわない最小単位の構造に分割したフラグメントあるいはフラグメントに対応するモデル化合物から生体高分子全体の電子状態を再構築することができる。但し、フラグメント化の方法は化学的性質を大きく損なわなければ様々に可能であり、本発明で利用するモデル化合物はこれらに限定されるものではない。
(2) Creation of interaction point information database The positional information and physicochemical information necessary for the creation of the interaction point information database are obtained by methods known in the art, for example, biopolymer constituent units (for example, for protein molecules). Between two bodies between low-molecular-weight model compounds corresponding to constituent fragments contained in 20 types of amino acids, 5 types of nucleic acid bases and 5 types of nucleobases and 2 types of sugars, and 1 type of polysaccharides) It can be obtained by comprehensively performing a high-level quantum chemical calculation of an inter-body complex model, that is, a theoretical calculation at a level that has a sufficient amount of basis functions and can handle electron correlation in the complex calculation.
Here, the fragment means, for example, twenty kinds of amino acid side chains and main chain amides including a protonated state in a protein molecule, and further, a small number of further divided atomic groups constituting these amino acid side chains. . The low molecular weight model compound corresponding to the fragment can be modeled, for example, with the alanine side chain as a methane molecule, and the model compound of the terminal methyl group of leucine, isoleucine, valine or threonine should be a methane molecule as well. (See FIG. 2). The model compound may be an interaction form type itself found in a protein or may include the type as a partial structure. Thus, the electronic state of the entire biopolymer can be reconstructed from the fragment or the model compound corresponding to the fragment divided into the minimum unit structure that does not significantly impair the chemical properties. However, various fragmentation methods can be used as long as the chemical properties are not significantly impaired, and the model compounds used in the present invention are not limited to these.
なお、モデル化合物はできる限り対称性の高い構造の化合物を利用することが好ましく、二体間の複合体モデルの初期構造も対称性を考慮して作成することが好ましい(図3)。対称性を考慮することで、相互作用解析が単純となり、実際の計算資源も圧倒的に少なくて済む。さらに、対称性の高い幾何学はエネルギー的な極小点あるいは極大点である可能性が高いため、効率的にエネルギー極小点を探索することができるという利点もある。
得られた計算結果を基に、フラグメントに対応する生体高分子の各原子のパラメータとして、モデル化合物間で相互作用に関与している重原子間の距離、角度および相互作用形態に関する「物理化学情報」(例えば相互作用エネルギー、電子相関相互作用エネルギー、静電相互作用エネルギー、マリケン原子電荷など)等の相互作用点情報が収集される。 例えば、以下の文献では、メチルアンモニウムイオンとベンゼン、メチルアンモニウムイオンと酢酸、ベンゼンとメタン、ベンゼンとアンモニア、ベンゼンと水、トルエンとアンモニウムイオン、p-クレゾールとアンモニウムイオン、メチルインドールとアンモニウムイオン、トルエンとグアニジニウムイオン、p-クレゾールとグアニジニウムイオン、メチルインドールとグアニジニウムイオンを使用して相互作用解析を実際に行った事例について示している。
(1)Gallivan, et.al.; J. Am. Chem. Soc, 2000, 122 870-874
(2)Tsuzuki, et.al.; J. Am. Chem. Soc, 2000, 122 3746-3753
(3)Tsuzuki, et.al.; J. Am Am. Chem. Soc, 2000, 122 11450-11458
(4)Tarukeshwar, et.al.; J. Am. Chem. Soc, 2000, 123 3323-3331
(5)Minoux, et.al.; J. Am. Chem. Soc, 1999, 121 10366-10372
In addition, it is preferable to use a compound having a structure with as high a symmetry as possible as a model compound, and it is preferable to create an initial structure of a complex model between two bodies in consideration of symmetry (FIG. 3). By considering symmetry, the interaction analysis is simplified and the actual computational resources are overwhelmingly small. Furthermore, since there is a high possibility that a highly symmetrical geometry is an energy minimum or maximum point, there is an advantage that an energy minimum point can be efficiently searched.
Based on the calculated results, as parameters of each atom of the biopolymer corresponding to the fragment, “physicochemical information on distance, angle and interaction form between heavy atoms involved in the interaction between model compounds” ”(Eg, interaction energy, electron correlation interaction energy, electrostatic interaction energy, Mulliken atomic charge, etc.) is collected. For example, in the following documents, methylammonium ion and benzene, methylammonium ion and acetic acid, benzene and methane, benzene and ammonia, benzene and water, toluene and ammonium ion, p-cresol and ammonium ion, methylindole and ammonium ion, toluene This is a case where interaction analysis was actually performed using guanidinium ion, p-cresol and guanidinium ion, methylindole and guanidinium ion.
(1) Gallivan, et.al .; J. Am. Chem. Soc, 2000, 122 870-874
(2) Suzuki, et.al .; J. Am. Chem. Soc, 2000, 122 3746-3753
(3) Suzuki, et.al .; J. Am Am. Chem. Soc, 2000, 122 11450-11458
(4) Tarukeshwar, et.al .; J. Am. Chem. Soc, 2000, 123 3323-3331
(5) Minoux, et.al .; J. Am. Chem. Soc, 1999, 121 10366-10372
本発明の実施に用いられるデータベースの作成においては、例えば、アラニン側鎖のモデル化合物としてメタン、システイン側鎖のモデル化合物としてメタンチオール、アスパラギン酸アニオン側鎖のモデル化合物として酢酸アニオン、フェニルアラニン側鎖のモデル化合物としてトルエン、プロトン化ヒスチジン側鎖のモデル化合物として5-メチル-3H-イミダゾールイオン、リジン側鎖末端アンモニウム基のモデル化合物としてメチルアンモニウムイオン、メチオニン側鎖末端メチル基のモデル化合物としてジメチルチオエーテル、アスパラギン側鎖のモデル化合物としてアセタミド、アルギニン側鎖グアニジニウム基のモデル化合物としてN-メチルグアニジニウムイオン、セリン側鎖のモデル化合物としてメタノール、トリプトファン側鎖のモデル化合物として3-メチル-1H-インドール、チロシン側鎖のモデル化合物としてp-クレゾール、また、主鎖ペプチドのモデル化合物としてN-メチルアセタミドを用いることができる。 In the creation of the database used in the practice of the present invention, for example, methane as the model compound of the alanine side chain, methane thiol as the model compound of the cysteine side chain, acetate anion as the model compound of the aspartate anion side chain, phenylalanine side chain Toluene as a model compound, 5-methyl-3H-imidazole ion as a model compound of protonated histidine side chain, methylammonium ion as a model compound of lysine side chain terminal ammonium group, dimethylthioether as a model compound of methionine side chain terminal methyl group, Acetamide as a model compound of asparagine side chain, N-methylguanidinium ion as a model compound of arginine side chain guanidinium group, methanol, tryptophan side chain as a model compound of serine side chain As a model compound 3-methyl -1H- indole, p- cresol as a model compound of tyrosine side chains, also can be used N- methylacetamide as a model compound in the main chain peptides.
前述の通り、原子団についてのエネルギー極小点、すなわち相互作用点となり得る点を探索する方法は、当該技術分野に知られるものである。各アミノ酸残基の側鎖等についても上記のようにモデル化合物を利用して同様にエネルギー極小点を求めることも当業者が通常の方法で行うことが可能であり(Tsuzuki, et.al.; J. Am. Chem. Soc, 2000, 122 3746-3753、Tsuzuki, et.al.; J. Am Am. Chem. Soc, 2000, 122 11450-11458参照)、実際にアミノ酸残基に対して良く知られ、相互作用エネルギーの比較的大きな、いわゆる水素結合や塩橋などに関与する、古典的な相互作用点も多い。以上のように、各アミノ酸に対する相互作用点の情報は、発明を実施する者が、既知の情報から任意に選択、または上記のような計算を行って独自に収集することが可能であり、本発明においてはいずれの方法に収集された情報を含む相互作用点情報データベースを使用し得る。
なお、相互作用点を特定するための位置情報は重原子間の距離と角度を採用することが望ましいが、水素原子が相互作用に関与している場合、該水素原子との距離も考慮して結合している重原子から定義しても、該水素原子から定義してもよい。また、該水素原子が回転可能な場合は、結合している重原子から相互作用点を単一あるいは一定の回転角度毎に複数に定義してもよい。相互作用相手が水素原子の場合にも、該水素原子が結合する重原子までの距離と角度を採用することが好ましい。こうすることで、予測される相互作用点の位置が理想的には相手側重原子の最安定位置に算出されることになるので、予測された複合体形成部位に親和性のある外部因子の形状および相補的に化学的要求性が重原子を基に推定、視覚化されるようになる。
As described above, a method for searching for an energy minimum point for an atomic group, that is, a point that can be an interaction point is known in the art. It is also possible for those skilled in the art to obtain the energy minimum point similarly for the side chain of each amino acid residue using the model compound as described above (Tsuzuki, et.al .; J. Am. Chem. Soc, 2000 , 122 3746-3753, Tsuzuki, see et.al .; J. Am Am. Chem. Soc, 2000, 122 11450-11458), in fact well known to the amino acid residues There are also many classical interaction points that are involved in so-called hydrogen bonds and salt bridges, which have a relatively large interaction energy. As described above, the information on the interaction point for each amino acid can be collected by the person who implements the invention, arbitrarily selecting from known information, or by performing the above-described calculation. In the invention, an interaction point information database containing information collected by either method can be used.
In addition, it is desirable to adopt the distance and angle between heavy atoms as the positional information for specifying the interaction point. However, when a hydrogen atom is involved in the interaction, the distance from the hydrogen atom is also taken into consideration. It may be defined from the bonded heavy atom or from the hydrogen atom. In addition, when the hydrogen atom is rotatable, the interaction point may be defined as a single or a plurality of constant rotation angles from the bonded heavy atoms. Even when the interaction partner is a hydrogen atom, it is preferable to adopt the distance and angle to the heavy atom to which the hydrogen atom is bonded. By doing this, the position of the predicted interaction point is ideally calculated as the most stable position of the counterpart heavy atom, so the shape of the external factor having an affinity for the predicted complex formation site Complementary chemical requirements are estimated and visualized based on heavy atoms.
なお、各アミノ酸残基のデータベースに含まれる相互作用点の数は少なくとも1個以上、例えば5個以上、例えば5〜40個であることが好ましいが、それぞれが相互作用点であると科学的に判断される限り、個数の上限、下限に制約はなく、発明を実施する者が自由に設定することができる。例えば、特定のアミノ酸残基についての相互作用点が設定されていないような状況も許容される。さらには、例えば電子相関項支配の相互作用点だけを予測することを目的とする場合など、状況に応じてデータベースに含まれる相互作用点を予め取捨選択しておくことも当然可能である。データベース上の各相互作用点は、与えられる生体高分子の相互作用点として考えられ得る候補として収集されるものである。従って、データベースに登録された相互作用点の数が多ければ最終的に予測される(即ち候補として最後まで残る)生体高分子の相互作用点の数も多くなることは考えられるものの、本発明が実施可能であるか否かという問題とは本質的に無関係である。
相互作用点情報データベースは、位置情報(すなわち、相互作用点情報における距離と角度)は、生体高分子の内部的な位置情報(例えば、PDB形式で与えられる原子の名前)を利用してZ−マトリクス等の相対的な座標系でデータベース化され、好ましくはこれに相互作用形態タイプや物理化学情報(例えばマリケン原子電荷など)が加えられる。このように相互作用点情報をデータベース化しておくことで、生体高分子システムの原子座標を読み込むと同時に、相互作用点情報データベースの位置情報を参照して生体高分子立体構造上の相互作用点の座標をほぼ瞬時に算出できるようになる。
The number of interaction points included in each amino acid residue database is preferably at least 1 or more, for example, 5 or more, for example 5 to 40, but scientifically, each is an interaction point. As long as it is judged, there is no restriction on the upper limit and the lower limit of the number, and those who carry out the invention can freely set them. For example, a situation where an interaction point for a specific amino acid residue is not set is allowed. Furthermore, for example, when it is intended to predict only the interaction point dominated by the electron correlation term, it is naturally possible to select in advance the interaction points included in the database according to the situation. Each interaction point on the database is collected as a candidate that can be considered as an interaction point of a given biopolymer. Therefore, although it is conceivable that the number of interaction points of the biopolymer that is finally predicted (that is, remains until the end as a candidate) increases if the number of interaction points registered in the database is large, the present invention is It is essentially unrelated to the question of whether it is feasible.
In the interaction point information database, the position information (that is, the distance and angle in the interaction point information) is Z- using the internal position information of the biopolymer (for example, the name of an atom given in PDB format). A database is created in a relative coordinate system such as a matrix, and preferably, an interaction form type and physicochemical information (for example, a Maliken atomic charge) are added thereto. By making the interaction point information in a database in this way, the atomic coordinates of the biopolymer system are read, and at the same time, the interaction points on the biopolymer three-dimensional structure are referred to by referring to the position information in the interaction point information database. Coordinates can be calculated almost instantaneously.
図4に、アラニン残基に対する相互作用点(本例の場合11箇所)の相互作用点情報をZ−マトリクスの形式としてデータベース化した相互作用点情報データベースの一例を示す。また、図5は、その11個の相互作用点の「位置」および「物理化学情報」を、アラニン残基との関係において図示したものである。
図4のマトリクスでは、11行の各行がそれぞれ1つの相互作用点の情報を表す。5〜7列で指定したアルファ位、ベータ位およびガンマ位の原子を基準として、2〜4列の(距離、結合角、二面角)の値を適用することにより、相互作用点の位置が一義的に特定される。即ち、2〜7列の情報によってアラニン残基の相互作用点の位置を一義的に決定することが可能であり、この2〜7列の情報が「位置情報」に該当する。9列には「物理化学情報」としてマリケン原子電荷をデータベースに加えており、図5では、マリケン原子電荷の値によって相互作用点を色分けして表示している。また、8列に相互作用形態タイプの表記している。
以上のように、「位置情報」および「物理化学情報」を予めデータベース化して参照可能な状態にしておくことにより、与えられた生体高分子を構成する各アラニン残基に対して、その相互作用点の位置および性質を瞬時に割り出し、必要により視覚化することが可能となる。例えばタンパク質に関して言えば、二十種類のアミノ酸についての相互作用点情報データベースが存在すれば、与えられたタンパク質に含まれる全てのアミノ酸残基に対する相互作用点を瞬時に割り出し、画像表示することができる。
FIG. 4 shows an example of an interaction point information database in which interaction point information of interaction points with respect to an alanine residue (11 positions in this example) is converted into a database in the form of a Z-matrix. FIG. 5 shows the “position” and “physicochemical information” of the 11 interaction points in relation to the alanine residue.
In the matrix of FIG. 4, each of 11 rows represents information of one interaction point. By applying the values of (distance, bond angle, dihedral angle) in 2-4 columns with the alpha, beta, and gamma positions specified in columns 5-7 as the reference, the position of the interaction point is It is uniquely identified. That is, the position of the interaction point of the alanine residue can be uniquely determined by the information of 2 to 7 columns, and the information of 2 to 7 columns corresponds to “position information”. In column 9, the malken atomic charge is added to the database as “physicochemical information”, and in FIG. 5, the interaction points are displayed in different colors according to the value of the malicen atomic charge. Moreover, the interaction form type is described in 8 columns.
As described above, “positional information” and “physicochemical information” are stored in a database in advance so that they can be referred to, so that each alanine residue constituting a given biopolymer can interact with each other. The position and nature of the points can be determined instantaneously and visualized if necessary. For example, with regard to proteins, if there is an interaction point information database for 20 types of amino acids, interaction points for all amino acid residues contained in a given protein can be instantly determined and displayed as an image. .
(3)相互作用点候補の位置の特定
前述の通り、本工程においては、入力した生体高分子の原子座標から、相互作用点情報データベースを参照して、そこに含まれる位置情報に基づいて該構成原子に対する相互作用点の座標が特定される。この工程で行われる相互作用点の座標の決定は、データベース化した位置情報を生体高分子の構成単位の原子座標に適用、即ち機械的に当てはめるだけであり、既知の方法により容易に実施し得る。その際、生体高分子全体に含まれる構成原子を対象としてもよいし、例えば目的領域がある場合や、他の分子が結合している場合などには、一部の領域を指定して処理してもよい。
(3) Identification of the position of the interaction point candidate As described above, in this step, the interaction point information database is referred to from the atomic coordinates of the input biopolymer and based on the position information contained therein. The coordinates of the interaction point with respect to the constituent atoms are specified. The determination of the coordinates of the interaction point performed in this step can be easily performed by a known method simply by applying the position information stored in the database to the atomic coordinates of the structural unit of the biopolymer, that is, mechanically. . At that time, constituent atoms contained in the entire biopolymer may be targeted.For example, when there is a target region or when other molecules are bonded, a part of the region is designated and processed. May be.
本発明の第二工程の実施態様の一例を以下に示す。
生体高分子(例えばタンパク質)の原子座標を入力する。必要であれば対象範囲を選択する。生体高分子の構成原子を選択する。相互作用点情報データベースにアクセスし、前記構成原子に対応する位置情報を該原子の名前(例えばPDB形式で与えられる原子の名前)と所属する構成単位の名前(例えばアミノ酸名)のマッチングを用いて取得する。前記位置情報に基づいて、前記生体高分子の相互作用点候補の位置を決定する。他の構成原子が残っている場合は次の構成原子を選択。残っていない場合には終了とする。
An example of an embodiment of the second step of the present invention is shown below.
Enter the atomic coordinates of a biopolymer (eg, protein). Select the target range if necessary. Select the constituent atoms of the biopolymer. Accessing the interaction point information database, the position information corresponding to the constituent atom is matched with the name of the atom (for example, the name of the atom given in PDB format) and the name of the constituent unit (for example, the amino acid name) to which it belongs. get. The position of the interaction point candidate of the biopolymer is determined based on the position information. If other constituent atoms remain, select the next constituent atom. If it does not remain, the process ends.
この工程によって、従来の技術のように生体高分子全体の特徴(例えばタンパク質であれば疎水性表面領域の分布や、表面凹凸の形状など)を考慮することなく、その座標情報から相互作用点の候補の位置を特定することが可能となり、必要により生体高分子の構造と共に立体表示することもできる。また、相互作用点情報データベースが物理化学情報を含む場合には、物理化学情報を例えば文字表記、色分け等で視覚化して生体高分子と共に立体表示することによって、相互作用点の位置と物理化学情報を同時に参照することが可能となる。
特に、相互作用点候補の物理化学情報にマリケン原子電荷を含む場合には、得られた相互作用点候補を2〜3Å程度の球で表示することで、生体高分子表面における疎水性領域や親水性領域の分布が、生体高分子のファンデルワールス表面に静電ポテンシャルをマッピングするのと同等に情報化される。さらに、三次元座標のクリッピングを適用することで、生体高分子内部の静電的な状態をもスライスしながら確認できるようになる。
なお、この工程で算出された相互作用点を、本明細書において以後、文面に応じて「算出された相互作用点」または「算出相互作用点」または「相互作用点候補」と表現する場合があるが、本工程で算出された相互作用点は、構成原子の相互作用点を、生体高分子(例えばタンパク質)そのものの相互作用点の候補として網羅的に、かつ、機械的に示したものに過ぎず、生体高分子において実際にリガンド等に対する相互作用に関与する点を意味するものではない。
This process allows the interaction point to be determined from the coordinate information without considering the characteristics of the entire biopolymer (for example, the distribution of the hydrophobic surface region and the shape of the surface irregularities in the case of proteins) as in the conventional technique. Candidate positions can be specified, and three-dimensional display can be performed together with the structure of the biopolymer if necessary. In addition, when the interaction point information database includes physicochemical information, the position of the interaction point and the physicochemical information are obtained by visualizing the physicochemical information by, for example, character notation, color coding, etc. Can be referenced simultaneously.
In particular, when the physicochemical information of the interaction point candidate includes a maliken atom charge, the obtained interaction point candidate is displayed as a sphere of about 2 to 3 mm, so that the hydrophobic region or hydrophilicity on the surface of the biopolymer is displayed. The distribution of the sex region is computerized in the same way as mapping the electrostatic potential on the surface of the biopolymer van der Waals. Furthermore, by applying clipping of three-dimensional coordinates, the electrostatic state inside the biopolymer can be confirmed while slicing.
Note that the interaction points calculated in this step may be expressed as “calculated interaction points”, “calculated interaction points” or “interaction point candidates” in the following description in accordance with the text. However, the interaction points calculated in this step are the ones that comprehensively and mechanically indicate the interaction points of the constituent atoms as candidates for the interaction points of the biopolymer (eg protein) itself. However, this does not mean that the biopolymer is actually involved in the interaction with a ligand or the like.
3、第三工程
本発明の第三工程では、第二工程で特定された相互作用点候補のうち、生体高分子の構成原子との相互作用に関与する相互作用点が除去される。
本明細書において、生体高分子システム内部構造とは、生体高分子表面と、その内部を区別するためだけの用語としての意味である。この区別は、生体高分子の内部に埋もれている構成原子はその周囲にある構成原子との相互作用によって安定化しているのに対して、生体高分子表面に張り出している構成原子は溶媒分子などとの相互作用によってもエネルギー的な安定化(溶媒和エネルギー)を獲得しているという大きな違いによるものである。
構成原子との相互作用に寄与すると判断される相互作用点は、既に生体高分子の内部構造の安定化に関与しており、リガンド結合などの他の目的に関与する余地はないと考えられる。従って、本工程においては、第二工程で算出された各相互作用点について、それが生体高分子の構成原子との相互作用に寄与するか否かを一定の基準に従って判定し、寄与すると判断されるものは算出相互作用点から除去される。
構成原子との相互作用に寄与するか否かを判定する基準としては、例えば「相互作用点候補と生体高分子の構成原子との距離」が挙げられる。即ち、生体高分子の構成原子と一定の距離条件(以下、相互作用距離条件ともいう)を満たす相互作用点を排除するとすることができる。即ち、本工程においては、好ましくは、第二工程で特定した各相互作用点候補について、その所定距離内に生体高分子の構成原子が存在する場合に、前記相互作用点候補を除去する。
3. Third Step In the third step of the present invention, among the interaction point candidates identified in the second step, the interaction points involved in the interaction with the constituent atoms of the biopolymer are removed.
In the present specification, the internal structure of the biopolymer system means a term only for distinguishing the biopolymer surface from the inside thereof. This distinction is made because constituent atoms buried inside biopolymers are stabilized by interaction with surrounding constituent atoms, while constituent atoms protruding on the surface of biopolymers are solvent molecules, etc. This is due to the great difference that the energy stabilization (solvation energy) is also obtained by the interaction.
The interaction point that is determined to contribute to the interaction with the constituent atoms is already involved in the stabilization of the internal structure of the biopolymer, and is considered to have no room for other purposes such as ligand binding. Therefore, in this step, it is determined whether each interaction point calculated in the second step contributes to the interaction with the constituent atoms of the biopolymer according to a certain standard, and is determined to contribute. Things are removed from the calculated interaction point.
Examples of the criterion for determining whether or not to contribute to the interaction with the constituent atom include “distance between the interaction point candidate and the constituent atom of the biopolymer”. That is, it is possible to exclude an interaction point that satisfies a certain distance condition (hereinafter also referred to as an interaction distance condition) with a constituent atom of the biopolymer. That is, in this step, preferably, for each interaction point candidate specified in the second step, the interaction point candidate is removed when a constituent atom of the biopolymer exists within the predetermined distance.
相互作用距離条件は生体高分子を構成する重原子の非結合性相互作用平衡距離からの相互作用有効距離の平均的な距離から当業者が原子間エネルギー曲線に従って設定することが可能であり、例えば生体高分子システム内の重原子のみに相互作用条件を適用する場合について、例えば2〜4Åの範囲で設定することが可能であり、このうち、生体高分子構成重原子の前記非結合性相互作用の一般的な有効距離である3〜4Åから設定されるのが好ましく、3.5Åが特に好ましい。水素原子にも相互作用条件を適用することが可能であり(図6参照)、その場合に採用し得る相互作用距離条件は前記相互作用有効距離から水素原子のファンデルワールス半径を差し引いた2〜3Åから設定されるのが好ましく、2.5Åが特に好ましい。また、すべての相互作用点候補について同一の距離条件を適用する必要はなく、例えば相互作用点候補の物理化学的性質が判明している場合には、その性質を有する相互作用点について個別に距離条件を設定してもよい。 The interaction distance condition can be set by a person skilled in the art according to the interatomic energy curve from the average distance of the effective interaction distance from the non-bonding interaction equilibrium distance of the heavy atoms constituting the biopolymer, for example, In the case where the interaction condition is applied only to the heavy atoms in the biopolymer system, it is possible to set, for example, in the range of 2 to 4 cm, and among these, the non-bonding interaction of the biopolymer constituent heavy atoms It is preferably set from 3 to 4 mm which is a general effective distance of 3.5 mm, particularly preferably 3.5 mm. It is possible to apply the interaction condition to the hydrogen atom (see FIG. 6). The interaction distance condition that can be adopted in this case is 2 to 2 obtained by subtracting the van der Waals radius of the hydrogen atom from the effective interaction distance. It is preferable to set from 3 mm, and 2.5 mm is particularly preferable. In addition, it is not necessary to apply the same distance condition to all interaction point candidates. For example, when the physicochemical properties of the interaction point candidates are known, the distances are individually determined for the interaction points having the properties. Conditions may be set.
以下に、重原子の非結合性相互作用平衡距離からの相互作用有効距離の平均的な距離について具体的に説明する。例えば近距離相互作用であるファンデルワールス相互作用(生体高分子内部相互作用の大部分を占める)、軌道相互作用、電荷移動相互作用などはこれら非結合性相互作用に関与する原子のファンデルワールス半径付近を相互作用エネルギー極小点(平衡距離)として、該原子のファンデルワールス半径に依存する相互作用安定化領域(平衡距離からの相互作用有効距離)が存在する。タンパク質分子の主な構成重原子である炭素、窒素、酸素原子のファンデルワールス半径がほぼ等しいことから、必然的にこれら重原子が関与する近距離相互作用の有効距離もほぼ同等となり、該有効距離を平均的な距離として利用できる。なお、静電相互作用、双極子相互作用などは遠距離(10Å以上)まで有効距離のある相互作用であるが、遠距離相互作用は密にパッキングしている生体高分子内部では近隣との強い相互作用によって相殺されるためにまれであり、また生体高分子表面においては高い誘電率のためにこれら遠距離相互作用の効果がほとんどなくなると考えられ、本明細書では静電相互作用や双極子相互作用などの場合は近距離のみ考慮していることになる。
各相互作用点候補と、生体高分子の構成原子との距離は当業者が任意の方法で計算し得る。生体高分子の構成原子、相互作用点の座標は特定されているため、それらの任意の二点間の距離を容易に算出し得ることは明らかである。
生体高分子の構成原子と算出相互作用点の全組み合わせについて二点間の距離を網羅的に計算してもよいが、例えば空間的範囲を限定するなどして計算速度を向上させることも可能である。一例として、生体高分子の立体構造を扱う場合に三次元空間をグリッドで分割して計算を簡略化することが当技術分野で一般に行われている。
The average distance of the effective interaction distance from the non-bonding interaction equilibrium distance of heavy atoms will be specifically described below. For example, van der Waals interactions (which account for the majority of biopolymer internal interactions), orbital interactions, and charge transfer interactions, which are short-range interactions, are atomic van der Waals involved in these non-binding interactions. There exists an interaction stabilization region (interaction effective distance from the equilibrium distance) that depends on the van der Waals radius of the atom, with the interaction energy minimum point (equilibrium distance) near the radius. Since the van der Waals radii of carbon, nitrogen, and oxygen atoms, which are the main constituent heavy atoms of protein molecules, are almost equal, the effective distances of short-range interactions involving these heavy atoms inevitably become almost the same. The distance can be used as an average distance. Electrostatic interaction, dipole interaction, etc. are interactions that have an effective distance up to a long distance (10 cm or more), but the long distance interaction is strong within the densely packed biopolymer. It is rare to be canceled out by interaction, and it is considered that the effects of these long-range interactions are almost eliminated due to the high dielectric constant on the surface of biopolymers. In the case of interactions, only short distances are considered.
A person skilled in the art can calculate the distance between each interaction point candidate and a constituent atom of the biopolymer by any method. Since the coordinates of the constituent atoms and interaction points of the biopolymer are specified, it is clear that the distance between these two arbitrary points can be easily calculated.
The distance between two points may be calculated comprehensively for all combinations of constituent atoms and calculated interaction points of the biopolymer, but it is also possible to improve the calculation speed by limiting the spatial range, for example. is there. As an example, in the case of dealing with a three-dimensional structure of a biopolymer, it is generally performed in this technical field to simplify a calculation by dividing a three-dimensional space with a grid.
例えば以下の方法を採用し得る。生体高分子システム全体または特定領域を一定間隔のグリッドで分割し、該グリッドを構成する各立方体(以下、セルという)に生体高分子システムの構成原子が含まれているか否かを記録しておき、相互作用点を含むセルと同じセルまたは該セルに隣接するセルに相互作用距離条件を満たす生体高分子システムの原子が含まれている場合、それらの原子と算出相互作用点との距離を計算するとする方法を採用し得る。
なお、グリッドの間隔は、採用する相互作用距離条件との関係において本発明を実施するものが任意に決定することができるが、一般に、相互作用距離条件以上の任意の値であればいいのは明らかである。また、本明細書において、「隣接するセル」とは、特定のセルを中心として、該セルといずれかの面、辺、または頂点を共有する26の各セルを意味する。
上記方法を採用することにより、相互作用点候補と生体高分子構成原子との全ての組み合わせについて網羅的に計算するよりも圧倒的に高速に計算することが可能となる。
For example, the following method can be adopted. Divide the entire biopolymer system or a specific area with a grid at regular intervals, and record whether each cube constituting the grid (hereinafter referred to as a cell) contains constituent atoms of the biopolymer system. If the cells of the biopolymer system that satisfy the interaction distance condition are included in the same cell as the cell containing the interaction point or in a cell adjacent to the cell, the distance between those atoms and the calculated interaction point is calculated. Then, the method to do can be adopted.
It should be noted that the grid spacing can be arbitrarily determined by those implementing the present invention in relation to the interaction distance condition to be adopted, but in general, any value above the interaction distance condition may be used. it is obvious. Further, in this specification, “adjacent cells” mean 26 cells that share a certain cell, side, or vertex with a specific cell as the center.
By adopting the above method, it is possible to perform calculation at an overwhelmingly higher speed than the exhaustive calculation for all combinations of interaction point candidates and biopolymer constituent atoms.
本発明の第三工程の実施態様の一例を以下に示す。
計算が必要な範囲を選択し、グリッドで分割する。相互作用点候補を1つ指定する。該相互作用点候補を含むセルと該セルに隣接するセルに、生体高分子の原子が存在するか調べる。存在しない場合は、次の相互作用点候補を指定する。存在する場合は、前記相互作用点候補と前記生体高分子の原子との距離を計算し、相互作用距離条件を満たすか否か確認する。相互距離条件を満たす原子がある場合、前記相互作用点候補を削除する。満たすものがない場合は、次の相互作用点候補を指定する。相互作用点候補が残っていない場合は、終了する。
An example of the embodiment of the third step of the present invention is shown below.
Select the range that needs to be calculated and divide it in a grid. Specify one interaction point candidate. It is examined whether or not a biopolymer atom exists in a cell including the interaction point candidate and a cell adjacent to the cell. If it does not exist, specify the next interaction point candidate. If it exists, the distance between the interaction point candidate and the biopolymer atom is calculated, and it is confirmed whether or not the interaction distance condition is satisfied. If there is an atom that satisfies the mutual distance condition, the interaction point candidate is deleted. If there is nothing to satisfy, specify the next candidate interaction point. If no interaction point candidates remain, the process ends.
4、第四工程
本発明の第四工程では、第三工程後に残存する相互作用点候補のうち、生体高分子システムの表面と溶媒分子との相互作用に関与する相互作用点が除去される。なお、本発明の第四工程を実施する場合には、第二工程で特定された相互作用点候補を対象として第四工程を先に実施し、その後に第三工程を実施するとすることも可能である。
生体高分子は通常、周囲の水分子と相互作用しており、溶液中では溶媒和している。すなわち、常温では溶媒分子は振動しながら生体高分子表面と結合と解離の平衡状態にあり、生体高分子表面に算出された相互作用点の大部分は溶媒分子との溶媒和に関与していると考えられる。従って、溶媒分子との相互作用に関与している相互作用点候補を除去することによって、相互作用点候補の絞込みを行うことができる。
生体高分子の表面と溶媒分子との相互作用に関与する相互作用点とは、生体高分子の溶媒和エネルギーによる安定化(すなわち、生体高分子が溶媒に溶ける)に寄与する相互作用位置を意味する。ある相互作用点候補が溶媒分子との相互作用に関与する相互作用点であるか否かの判断基準は、科学的根拠に基づいて当業者が任意に設定することが可能であり、例えば生体高分子の分子表面構成原子との距離条件を基準に定めることができる。例えば、生体高分子のX線結晶解析で得られる結晶水の内、生体高分子と優位に水素結合しているとされるものは、水素原子から2.0〜2.5Åの距離にあり、これは水分子のファンデルワールス半径と生体高分子表面構成原子のファンデルワールス半径の和、すなわち溶媒接触表面、に相当する。
採用し得る分子表面としては、例えば溶媒接触表面およびファンデルワールス表面が挙げられる。即ち、本発明の第四工程においては、好ましくは、生体高分子の溶媒接触表面またはファンデルワールス表面の外側に存在する相互作用点候補を除去する。
4. Fourth Step In the fourth step of the present invention, among the interaction point candidates remaining after the third step, the interaction points involved in the interaction between the surface of the biopolymer system and the solvent molecules are removed. When performing the fourth step of the present invention, the fourth step may be performed first for the interaction point candidate specified in the second step, and then the third step may be performed. It is.
Biopolymers usually interact with surrounding water molecules and are solvated in solution. In other words, at normal temperature, the solvent molecules are in equilibrium with the biopolymer surface while oscillating, and most of the interaction points calculated on the biopolymer surface are involved in solvation with the solvent molecules. it is conceivable that. Therefore, the interaction point candidates can be narrowed down by removing the interaction point candidates involved in the interaction with the solvent molecule.
The interaction point involved in the interaction between the surface of the biopolymer and the solvent molecule means the interaction position that contributes to the stabilization of the biopolymer by the solvation energy (ie, the biopolymer is soluble in the solvent). To do. Criteria for determining whether or not a candidate interaction point is an interaction point involved in interaction with a solvent molecule can be arbitrarily set by those skilled in the art based on scientific evidence. It can be determined on the basis of the distance condition between the molecule surface constituent atoms. For example, among the crystal water obtained by X-ray crystallographic analysis of the biopolymer, what is said to be predominantly hydrogen-bonded to the biopolymer is at a distance of 2.0 to 2.5 cm from the hydrogen atom, This corresponds to the sum of the van der Waals radius of the water molecule and the van der Waals radius of the atoms constituting the surface of the biopolymer, that is, the solvent contact surface.
Examples of molecular surfaces that can be employed include solvent contact surfaces and van der Waals surfaces. That is, in the fourth step of the present invention, preferably, interaction point candidates existing outside the solvent contact surface or van der Waals surface of the biopolymer are removed.
ここでファンデルワールス表面とは、分子を構成する各原子のファンデルワールス半径で形成される表面を意味する。また、溶媒接触表面とは、一般に、ファンデルワールス表面を溶媒分子のファンデルワールス半径(水分子では一般に1.4Åが用いられる)を持つ球が自由に移動したときの球の中心の軌跡により表される表面を意味するが、本明細書においては、前記球の半径は必ずしも水分子のファンデルワールス半径である必要は無く、本発明を実施する際に、所望する絞り込みの程度などに応じて発明を実施する者が任意に設定し得る。例えば、外側の相互作用点も残しておきたい場合や、高分子などの外部因子と分子表面の凸部分で複合体を形成するような領域を探索するのであれば、溶媒のファンデルワールス半径に相当する距離条件を大きくし得る(例えば1.5〜2.5Å)。また、水分子との溶媒和に関わる相互作用点を除去するのであれば、水のファンデルワールス半径よりも2〜3割程度小さい半径、例えば1.0Åを用いるべきであるし、タンパク質表面の小さな凹みで複合体を形成するような領域を探索するために、タンパク質表面に算出されるその他の相互作用点と区別したい場合などには、距離条件を小さくし得るし(例えば0.5〜1.0Å)、そもそもこの工程を実施しなくてもよい。
即ち、本工程においては、好ましくは、ここで溶媒接触表面とファンデルワールス表面のいずれを適用するかは発明を実施する者が選択し得る。例えば、生体高分子表面上の浅い凹みにある基質結合部位等の相互作用点を見逃したくない場合には溶媒接触表面を利用し得るし、タンパク質内部の空洞部分にリガンド結合部位があると分かっている場合にはより内側にあるファンデルワールス表面を使用してタンパク質表面外のすべての相互作用点候補を除去し得る。
Here, the van der Waals surface means a surface formed by the van der Waals radius of each atom constituting the molecule. The solvent contact surface is generally defined by the locus of the center of the sphere when the sphere having the van der Waals radius of the solvent molecule (1.4 Å is generally used for water molecules) freely moves on the van der Waals surface. In the present specification, the radius of the sphere does not necessarily need to be the van der Waals radius of water molecules, and it depends on a desired degree of narrowing down when the present invention is carried out. The person who implements the invention can arbitrarily set. For example, if you want to keep the outer interaction point, or if you want to search for a region that forms a complex with an external factor such as a polymer and a convex part on the surface of the molecule, set the van der Waals radius of the solvent. The corresponding distance condition can be increased (for example, 1.5 to 2.5 mm). Further, if the interaction point related to solvation with water molecules is to be removed, a radius that is about 20-30% smaller than the van der Waals radius of water, for example, 1.0 kg, should be used. In order to search for a region that forms a complex with a small dent, in order to distinguish from other interaction points calculated on the protein surface, the distance condition can be reduced (for example, 0.5 to 1). 0.0Å), it is not necessary to carry out this process in the first place.
That is, in this step, it is preferable that a person implementing the invention can select which of the solvent contact surface and the van der Waals surface is applied here. For example, if you do not want to miss the interaction point such as the substrate binding site in the shallow depression on the biopolymer surface, you can use the solvent contact surface and know that there is a ligand binding site in the cavity inside the protein The inner van der Waals surface may be used to remove all candidate interaction points outside the protein surface.
各相互作用点候補が、生体高分子の溶媒接触表面またはファンデルワールス表面の外側に存在するか否かの判定は、当業者が任意の方法で行い得る。例えば、ConnollyらのMolecular Surface Package(http://www.biohedron.com/)などで得た表面座標を利用して判定してもよい。また、例えば、生体高分子を立方体で覆い、グリッドで分割し、分子表面の境界セルを決定してその内側であるか外側であるかを基準として距離を判定することが可能である(図7参照)。ここで、境界セルは、当業者に知られるいずれの方法により決定してもよい。例えば図7を参照されたい。即ち、第四工程においては、生体高分子をグリッドで分割し、溶媒接触表面またはファンデルワールス表面の境界セルを決定し、該境界セルの外側に含まれる相互作用点候補を除去することにより行うことが可能である。 A person skilled in the art can determine whether each interaction point candidate exists outside the solvent contact surface or van der Waals surface of the biopolymer by any method. For example, the determination may be made using surface coordinates obtained by the Connolly et al. Molecular Surface Package (http://www.biohedron.com/). Further, for example, it is possible to cover the biopolymer with a cube, divide it with a grid, determine the boundary cell on the molecular surface, and determine the distance based on whether it is inside or outside (FIG. 7). reference). Here, the border cell may be determined by any method known to those skilled in the art. See, for example, FIG. That is, in the fourth step, the biopolymer is divided by a grid, the boundary cell of the solvent contact surface or van der Waals surface is determined, and the interaction point candidates included outside the boundary cell are removed. It is possible.
本発明の第四工程の実施態様の一例を以下に示す。
境界セルを決定する。以下のような方法で決定し得る。
(1)ファンデルワールス表面を用いる場合
(i)生体高分子システム全体を一定間隔のグリッドで分割する。グリッドの間隔は、小さければ小さいほど精度が増すが、計算機資源を考慮すると、1.5Å程度で十分である。
(ii)グリッドを構成する各立方体(以下、セルという)に生体高分子の構成原子が含まれるか否かを記録する。
(iii)x、y、z方向のそれぞれで、セルが一列に並んだ列をすべて両端から走査し、各走査において、生体高分子の構成原子が最初に出現したセルに含まれる原子種のファンデルワールス半径距離分だけ外側にある全セルにフラグを設定する。
(iv)x−y平面、y−z平面、z−x平面すべてに対して再び両端から走査し、最初に出現したフラグ化されたセルを境界セルとして全境界セルを決定する。
An example of an embodiment of the fourth step of the present invention is shown below.
Determine the border cell. It can be determined by the following method.
(1) When van der Waals surface is used
(i) The entire biopolymer system is divided by a grid with a constant interval. The smaller the grid interval, the higher the accuracy. However, in consideration of computer resources, about 1.5 mm is sufficient.
(ii) Record whether or not each of the cubes constituting the grid (hereinafter referred to as cells) contains constituent atoms of the biopolymer.
(iii) A row of cells arranged in a line in each of the x, y, and z directions is scanned from both ends, and in each scan, a fan of atomic species included in the cell in which the constituent atoms of the biopolymer first appear Flags all cells that are outside by the distance of the Delwals radius.
(iv) The xy plane, the yz plane, and the zx plane are scanned again from both ends, and all the boundary cells are determined by using the flagged cell that appears first as the boundary cell.
(2)溶媒接触表面を用いる場合
(i)生体高分子システム全体を一定間隔のグリッドで分割する。ここで、グリッドの間隔は、所望の距離条件の値、例えば1.4Åとすることができる。
(ii)グリッドを構成する各セルに生体高分子の構成原子が含まれるか否かを記録する。
(iii)x、y、z方向のそれぞれで、セルが一列に並んだ列をすべて両端から走査し、各走査において、生体高分子の構成原子が最初に出現したセルに含まれる原子種のファンデルワールス半径距離分だけ外側にあるセルの全隣接セルにフラグを設定する。
(iv)x−y平面、y−z平面、z−x平面すべてに対して再び両端から走査し、最初に出現したフラグ化されたセルを境界セルとして全境界セルを決定する。
上記(1)または(2)の方法により境界セルを決定した後に、該境界セルの外側に存在する相互作用点候補を削除する。
(2) When using a solvent contact surface
(i) The entire biopolymer system is divided by a grid with a constant interval. Here, the grid interval can be a value of a desired distance condition, for example, 1.4 mm.
(ii) Record whether each cell constituting the grid contains a constituent atom of the biopolymer.
(iii) A row of cells arranged in a line in each of the x, y, and z directions is scanned from both ends, and in each scan, a fan of atomic species included in the cell in which the constituent atoms of the biopolymer first appear Flags all adjacent cells of the cell that is outside by the distance of the Delwars radius.
(iv) The xy plane, the yz plane, and the zx plane are scanned again from both ends, and all the boundary cells are determined by using the flagged cell that appears first as the boundary cell.
After the boundary cell is determined by the above method (1) or (2), the interaction point candidates existing outside the boundary cell are deleted.
以上のように本発明の第三工程および第四工程では、算出した相互作用点が生体高分子の内部構造の安定化にすでに利用されているかどうか、および生体高分子システム表面に関しては、溶媒分子との相互作用に関与しているかどうかを判定できるようにした。つまり、相互作用点がいずれにも関与していない場合、これら相互作用点が他の外部因子との相互作用あるいは自身の立体構造不明領域との相互作用に関わっている可能性が非常に高い。利用されていない相互作用点を立体構造可視化プログラム上で生体高分子とともに表示できるようにしたところ、後述の実施例に示すように、これら相互作用点が存在する部位と実際の外部因子の複合体形成部位が完全に一致するだけでなく、予測された相互作用部位における複数の相互作用点を三次元的に結びつけて得られる形状および相互作用点の物理化学情報から、それぞれ潜在的な外部因子の形状および潜在的な外部因子の化学的要求性までもが正確に予測できることが分かった。 As described above, in the third step and the fourth step of the present invention, whether the calculated interaction point has already been used for stabilizing the internal structure of the biopolymer, and regarding the surface of the biopolymer system, the solvent molecule It was made possible to determine whether or not it is involved in the interaction. In other words, when interaction points are not involved in any of these, it is very likely that these interaction points are involved in interaction with other external factors or interaction with their own three-dimensional structure unknown region. When interaction points that have not been used can be displayed together with biopolymers on the three-dimensional structure visualization program, as shown in the examples below, a complex of the site where these interaction points exist and the actual external factors Not only does the formation site completely match, but also the shape and interaction physicochemical information obtained by three-dimensionally connecting multiple interaction points at the predicted interaction site. It was found that the shape and even chemical requirements of potential external factors can be accurately predicted.
また、本発明は、タンパク質のみならず、核酸および糖などの他の生体高分子に対しても実施することが可能である。その場合、前述の通り、各生体高分子を構成する原子団(核酸であれば例えばその構成単位である五種類の核酸塩基と二種類の糖、多糖では代表的な単糖類が好ましい)についての相互作用点の「位置情報」および必要により「物理化学情報」を本明細書に示した方法等に従って収集し、本明細書に示したと同様のデータベースを作成して参照可能な状態にすれば十分である。例えば、各塩基について、置換プリン、置換ピリミジン、D-リボースおよびD-2-デオキシリボースをモデル化合物としてエネルギー極小点を計算することができる。なお、核酸や糖は、タンパク質に比べ圧倒的に親水的であるため、モデル計算には溶媒和効果を加味した反応場モデル計算を利用する必要があり、特に、誘電率に大きく左右される静電相互作用や双極子相互作用のようなタンパク質内部では強力な安定化相互作用がこれら生体高分子ではほとんど寄与してこないという違いはあるものの(Gallivan, et.al.; J. Am. Chem. Soc, 2000, 122 870-874参照)、相互作用自体の本質が変わるわけではなく、該相互作用点データを利用する本手法においてはあらゆる分子が対象となることはいうまでもない。 The present invention can be applied not only to proteins but also to other biopolymers such as nucleic acids and sugars. In that case, as described above, the atomic group constituting each biopolymer (for example, five types of nucleobases and two types of sugars, which are the structural units of nucleic acids, and a typical monosaccharide is preferable for polysaccharides). It is sufficient to collect “location information” of interaction points and, if necessary, “physicochemical information” according to the method shown in this specification, and to create a database similar to that shown in this specification so that it can be referred to. It is. For example, for each base, the energy minimum can be calculated using substituted purine, substituted pyrimidine, D-ribose and D-2-deoxyribose as model compounds. Since nucleic acids and sugars are overwhelmingly hydrophilic compared to proteins, it is necessary to use reaction field model calculations that take into account the solvation effect in model calculations. Although there is a difference that strong stabilizing interactions such as electric interactions and dipolar interactions hardly contribute to these biopolymers (Gallivan, et.al .; J. Am. Chem. Soc, 2000, 122 870-874), the essence of the interaction itself does not change, and it goes without saying that all molecules are targeted in this method using the interaction point data.
5、相互作用点の利用
本発明を実施した場合には、相互作用点予測は、比較的大きな生体高分子システムであっても、一般的なパーソナルコンピュータでもわずか数秒で完了する。また、通常のプログラムでは水素原子は自動的に付加されるため、プロテインデータバンクから提供される生体高分子のデータを編集する等の特別の処理も一切必要としない。ただし、より精度良く相互作用点を算出したい場合には自動付加された水素原子、または側鎖に対する構造最適化を実施しても良い。
本発明においては、好ましくは、予測された相互作用点がディスプレイあるいはその他の媒体上に表示される。表示は、生体高分子とともにに、好ましくは立体的に表示される。また、相互作用点情報データベースに物理化学情報が含まれる場合には、それらの情報を分類して、例えばその相互作用点における相互作用エネルギーが電子相関項支配および静電項支配のいずれであるかを区別し得るように色分けして表示することができる。ここで、色分けとは視覚的に判別可能であればよく、広く色彩、模様等により区別された表示を含む。以上のように、生体高分子とともに、予測された相互作用点の位置およびその物理化学情報をコンピュータ画面上に表示することにより、相互作用点の情報を容易に認識することが可能となる。なお、生体高分子および相互作用点の表示には、プロテインデータバンクから提供される座標形式(PDB形式)を認識できるものであれば、すべてのプログラム、例えばHyperChem、RasMol、Swiss-PDB Viewerなどを使用することが可能である。
5. Utilization of Interaction Point When the present invention is implemented, the interaction point prediction can be completed in only a few seconds even with a relatively large biopolymer system or a general personal computer. In addition, since a hydrogen atom is automatically added in a normal program, no special processing such as editing biopolymer data provided from a protein data bank is required. However, when it is desired to calculate the interaction point with higher accuracy, structure optimization may be performed on the automatically added hydrogen atom or side chain.
In the present invention, the predicted interaction points are preferably displayed on a display or other medium. The display is preferably three-dimensionally displayed together with the biopolymer. If the interaction point information database contains physicochemical information, categorize the information, for example, whether the interaction energy at the interaction point is dominated by electronic correlation terms or electrostatic terms. Can be displayed in different colors so that they can be distinguished. Here, the color classification is not limited as long as it can be visually discriminated, and includes display widely distinguished by colors, patterns, and the like. As described above, by displaying the predicted interaction point position and its physicochemical information on the computer screen together with the biopolymer, the interaction point information can be easily recognized. For the display of biopolymers and interaction points, all programs such as HyperChem, RasMol, Swiss-PDB Viewer etc. can be used as long as they can recognize the coordinate format (PDB format) provided by Protein Data Bank. It is possible to use.
本発明により得られる相互作用点は相互作用相手となる分子や原子の重原子位置に「点」として特定され、場合により該相互作用点の物理化学情報が加わるため、漠然と領域のみを予測する既存方法とは異なり、相互作用相手の形状(スキャッホールド)および化学的要求性(ファーマコホア)までも正確に予測し、かつ構造ベース創薬の中核をなす分子重ね合わせ技術のための最も重要な情報である、科学的に意味を持った「点」の情報を提供することが可能となる。
予測された相互作用点は対象の生体高分子における潜在的な相互作用点であり、相互作用点が複数分布している部位は潜在的な相互作用部位である。すなわち、単発的、局所的に予測された相互作用点は生体高分子システムを構成する金属原子、水分子あるいはリン酸分子などの比較的小さな低分子が相互作用する位置と推測でき、複数の相互作用点が分布している部位はリガンドや補酵素などの低分子化合物の複合体形成部位、コファクターや他の生体高分子の複合体形成部位、または自身の遠隔構造との相互作用部位と推測できる。さらに、リガンドなどの外部因子との複合体に対して本発明を実施した場合、該リガンドの周辺に相互作用点が算出されれば、これがリガンドの親和性向上のための構造修飾に関する指針、さらには、リガンドのアゴニズムとアンタゴニズムの制御に関わる構造要求性などについての指針として役立つ。また、生体高分子の側鎖や主鎖コンフォメーションに関しては、複合体形成に伴う誘導適合効果などの予測に役立つ。その他、生体高分子の全体あるいは部分的なモデリングにおいては、相互作用点情報を利用して安定なコンフォメーションを探索するなど、生体高分子の安定性を評価するのに役立つ。
The interaction point obtained by the present invention is specified as a “point” at the heavy atom position of the molecule or atom that is the interaction partner, and in some cases physicochemical information of the interaction point is added, so vaguely predicting only the region Unlike methods, the most important information for molecular superposition technology that accurately predicts the shape (scaffold) and chemical requirements (pharmacophore) of the interaction partner and forms the core of structure-based drug discovery It is possible to provide scientifically meaningful “point” information.
The predicted interaction point is a potential interaction point in the target biopolymer, and a site where a plurality of interaction points are distributed is a potential interaction site. In other words, the interaction points predicted once and locally can be assumed to be positions where relatively small small molecules such as metal atoms, water molecules, and phosphate molecules that compose a biopolymer system interact. The site where the site of action is distributed is presumed to be a complex formation site of low molecular weight compounds such as ligands and coenzymes, a complex formation site of cofactors and other biopolymers, or an interaction site with its own remote structure it can. Furthermore, when the present invention is applied to a complex with an external factor such as a ligand, if an interaction point is calculated around the ligand, this is a guideline for structural modification for improving the affinity of the ligand. Is useful as a guide for structural requirements related to ligand agonism and antagonism control. In addition, the side chains and main chain conformations of biopolymers are useful for predicting the induction conformity effect associated with complex formation. In addition, in the whole or partial modeling of a biopolymer, it is useful for evaluating the stability of the biopolymer, such as searching for a stable conformation using interaction point information.
本発明においては、予測された相互作用部位における個々の相互作用点を生体高分子側の重ね合わせ点として利用し、任意の低分子化合物と重ね合わせを実施することで、前記相互作用点または相互作用部位の安定化に寄与する化学基、化学種あるいは分子種等を推定することが可能である。これにより、任意の分子が該相互作用部位に複合体形成可能かどうかを推定でき、また、重ね合わせに成功した単一あるいは複数の低分子化合物の構造から、個々の相互作用点との相互作用に有効な化学基等を推定することが可能となる。
重ね合わせを行うためには、当技術分野に知られるいずれの方法、アルゴリズム等を用いてもよい。例えば、最小二乗法を用いた重ね合わせが挙げられる。
予測された相互作用部位において、コンピュータの計算処理能力を考慮して例えば3〜5個の相互作用点を重ね合わせに用いるのが最適であるが、予測された全相互作用点あるいは最低1個以上の任意の数の相互作用点を用いてもよい。
In the present invention, each interaction point in the predicted interaction site is used as a superposition point on the biopolymer side, and superposition with an arbitrary low molecular weight compound, whereby the above interaction point or mutual point is achieved. It is possible to estimate chemical groups, chemical species, molecular species, etc. that contribute to the stabilization of the action site. As a result, it is possible to estimate whether any molecule can form a complex at the interaction site, and the interaction with individual interaction points can be determined from the structure of single or multiple small molecule compounds that have been successfully superimposed. It is possible to estimate chemical groups and the like that are effective.
Any method, algorithm, etc. known in the art may be used to perform superposition. For example, superposition using the least square method can be mentioned.
In the predicted interaction site, it is optimal to use, for example, 3 to 5 interaction points for superimposition in consideration of the computer processing power. However, all the predicted interaction points or at least one or more interaction points are used. Any number of interaction points may be used.
また、重ね合わせに用いる化合物の各重原子に、前もって相互作用形態タイプを付加しておくことによって、より効率的な計算を行うことが可能である。
重ね合わせに用いる低分子化合物側の相互作用形態タイプは生体高分子側の重ね合わせ点との重ね合わせに利用するだけであるので、必ずしも全重原子に割り振っておく必要はなく、代表的な重原子だけに割り振っておくだけでもよい。また、該重原子がタンパク質内に見出される相互作用形態タイプと同等の化学結合環境にある場合は同じ物理化学情報が利用できるし、ハロゲン原子やその他医薬化合物等にみられる化学結合環境に対応した相互作用形態タイプを追加しておくこともでき、前記の表1以下に記したマトリクス形式のデータに各組み合わせの相互作用形態の物理化学情報を追加しておくことができる。
なお、重ね合わせの対象となる低分子化合物は安定コンフォメーションをもつ三次元構造で与えられることが好ましいが、座標が与えられていれば任意の二次元構造または三次元構造でもよい。このとき、低分子化合物は市販化合物、自前の化合物または仮想の化合物などのあらゆる化合物でよく、単体であっても複数分子を含んでもよい。
Moreover, it is possible to perform more efficient calculation by adding an interaction form type to each heavy atom of the compound used for superposition in advance.
Since the interaction mode type on the low molecular weight compound side used for superposition is only used for superposition with the superposition point on the biopolymer side, it is not always necessary to assign it to all heavy atoms. You can just assign them to atoms. In addition, if the heavy atom is in a chemical bond environment equivalent to the interaction form type found in the protein, the same physicochemical information can be used, and it corresponds to the chemical bond environment found in halogen atoms and other pharmaceutical compounds. The interaction form type can be added, and the physicochemical information of each combination of the interaction forms can be added to the matrix data described in Table 1 and below.
The low molecular weight compound to be superimposed is preferably given as a three-dimensional structure having a stable conformation, but may be any two-dimensional structure or three-dimensional structure as long as coordinates are given. At this time, the low molecular weight compound may be any compound such as a commercially available compound, an original compound, or a virtual compound, and may be a simple substance or may include a plurality of molecules.
重ね合わせは、生体高分子システム側の重ね合わせ点として選んだ相互作用点の数と低分子化合物の相互作用形態タイプを付加された原子の数から生じる全組み合わせについて実施することになるが、前記マトリクス形式のデータを参照して相互作用形態タイプの可能な組み合わせ(不安定化にならない組み合わせ)が全重ね合わせ点で成立している場合だけを考慮することで、化学的に無駄な重ね合わせを論理的に排除できる。これにより、膨大な数の不要な計算が論理的に省略でき、結果として高精度でかつ高速なドッキングシミュレーションを実現できるようになる。
後述の実施例で述べるように、相互作用点の全体あるいは一部を生体高分子側の重ね合わせ点として利用し、任意の低分子化合物とドッキングシミュレーションを行ったところ、最安定複合体構造が高精度に得られることが分かった。さらには、生体高分子内部構造の動的挙動、外部因子の親和性増強に関する指針までもが得られることが分かった。これにより、任意の生体高分子システムにおけるリガンドなどの外部因子あるいは自身の遠隔構造の認識に関係し、認識に必要な物理化学情報を保持した相互作用点を化学的根拠に基づいて予測し、さらにこれを利用することが可能となった。
The superposition is performed for all combinations resulting from the number of atoms added with the number of interaction points selected as the superposition point on the biopolymer system side and the interaction form type of the low molecular weight compound. By referring to data in matrix format and considering only possible combinations of interaction form types (combinations that do not destabilize) at all superposition points, chemically superimposing superposition is possible. Can be logically excluded. Thereby, a huge number of unnecessary calculations can be logically omitted, and as a result, a highly accurate and high-speed docking simulation can be realized.
As described in the examples below, when the docking simulation was performed with an arbitrary low molecular weight compound by using the whole or a part of the interaction point as a superposition point on the biopolymer side, the most stable complex structure was high. It was found that it can be obtained with accuracy. Furthermore, it has been found that even a guideline on dynamic behavior of the internal structure of the biopolymer and enhancement of affinity of external factors can be obtained. In this way, it is related to the recognition of external factors such as ligands or remote structures of its own in any biopolymer system, and predicts the interaction point that holds the physicochemical information necessary for recognition based on the chemical basis. It became possible to use this.
また、本発明においては、予測された単一または複数の相互作用点の相互作用点情報を利用し、生体高分子の相互作用部位で直接、医薬候補化合物などの機能低分子を設計する、いわゆるDe Novo設計を行うことも可能である。
相互作用点情報をデータベース化する工程において、相互作用点を相手側重原子の最安定位置に定義している場合、任意の相互作用点上に、相互作用形態タイプの可能な組み合わせを考慮して、重原子あるいは水素原子を付加した重原子を配置し、これら重原子が結合距離範囲内にあれば、結合で結ぶことができ、結合範囲外であれば任意のリンカーを介して結合で結ぶことができる。また、水素原子は生成した結合情報を基に各重原子に後から付加することもできる。
さらに、単一または複数の相互作用点と官能基や原子団との重ね合わせを部分的に実施して、配置された単一または複数の官能基や原子団を使って同様に化合物を設計することもできる。
以下、本発明の実施の実施例を示すが、本発明はこれに限定されるものではない。
Further, in the present invention, a low-function molecule such as a drug candidate compound is designed directly at an interaction site of a biopolymer using the interaction point information of the predicted single or plural interaction points. De Novo design is also possible.
In the process of creating the database of interaction point information, if the interaction point is defined as the most stable position of the partner heavy atom, considering possible combinations of interaction form types on any interaction point, If a heavy atom or a heavy atom to which a hydrogen atom is added is arranged and these heavy atoms are within the bond distance range, they can be connected by a bond, and if they are outside the bond range, they can be connected by a linker through an arbitrary linker. it can. Also, hydrogen atoms can be added later to each heavy atom based on the generated bond information.
In addition, by partially superimposing single or multiple interaction points and functional groups or atomic groups, the compounds are similarly designed using single or multiple functional groups or atomic groups arranged. You can also.
Examples of the present invention will be described below, but the present invention is not limited thereto.
本発明の有効性を示すために、プラズマヒトレチノール結合タンパクを一例として、天然リガンドであるレチノール分子と複合体を形成する以前の立体構造中(以下、アポ型と表す)に潜在的なリガンド結合部位を予測できることを示す。
生体高分子システムの前処理は、本願発明者が開発したHomology Modeling for HyperChem (Homology Modeling for HyperChem, Revision A3; Institute of Molecular Function; Saitama, Japan, http://www.molfunction.com) を用いて実施した。また、生体高分子システムの立体構造はプロテインデータバンク(以下、PDBと記す。http://www.pdbj.org/index.html)から提供されるものを使用した。相互作用点情報データベースは、本願発明者の作成したデータベース(2006年1月15日作成版)を使用した。
プラズマヒトレチノール結合タンパク質の立体構造は、PDBから提供されるPDB ID: 1BRQ を使用した。このタンパク質のN末端とC末端はツビッターイオンとして処理し、立体構造に含まれている水分子の水素原子の初期座標は、Homology Modeling for HyperChemの水素原子初期座標評価プログラム(http://www.molfunction.com/algorithm.htm) を用いて決定した。タンパク質システムに含まれる全水素原子に関して、Amber94力場、Polak-Ribiere極小化アルゴリズムを用いてRMS勾配1.0kcal/Åmolを終了条件として構造最適化した。
In order to show the effectiveness of the present invention, as an example of plasma human retinol-binding protein, potential ligand binding in the previous three-dimensional structure (hereinafter referred to as apo form) that forms a complex with the retinol molecule that is a natural ligand. It shows that a site can be predicted.
Pretreatment of the biopolymer system is performed using Homology Modeling for HyperChem (Homology Modeling for HyperChem, Revision A3; Institute of Molecular Function; Saitama, Japan, http://www.molfunction.com) developed by the present inventor. Carried out. In addition, the three-dimensional structure of the biopolymer system used was provided from Protein Data Bank (hereinafter referred to as PDB, http://www.pdbj.org/index.html). As the interaction point information database, a database created by the inventor of the present application (version created on January 15, 2006) was used.
The three-dimensional structure of plasma human retinol binding protein was PDB ID: 1BRQ provided by PDB. The N- and C-termini of this protein are treated as Zitter ions, and the initial coordinate of the hydrogen atom of the water molecule contained in the three-dimensional structure is the initial coordinate evaluation program for hydrogen atoms of Homology Modeling for HyperChem (http: // www .molfunction.com / algorithm.htm). All hydrogen atoms contained in the protein system were optimized using the Amber94 force field and Polak-Ribiere minimization algorithm with an RMS gradient of 1.0 kcal / Åmol as the termination condition.
相互作用点情報データベースに基づいて前記タンパク質上の相互作用点の位置を特定した。この際、水酸基とチオール基の水素原子に関する相互作用点を60度刻みで発生させ、水酸基、チオール基およびチオエーテルの重原子(すなわち酸素原子と硫黄原子)に関する相互作用点を同じく60度刻みで発生させた。生体高分子の構成原子との相互作用要件としては、水素原子との距離も考慮し、グリッドサイズを2.5Å、相互作用距離条件を同じく2.5Åとした(図6)。このとき、タンパク質システムに含まれる水分子は考慮しなかった。溶媒分子と相互作用する相互作用点除去の工程においては、実施例2と比較するため、0.8Åのグリッドによる境界セル条件(図7)とし、溶媒接触表面を用いた。以上の条件で相互作用点予測を行った。
図8に、アポ型レチノール結合タンパク質における相互作用点の予測結果を示す。なお、図中の細かな点は水分子の酸素原子である。得られた相互作用点の数は、タンパク質内部に16点、タンパク質表面上の4ヶ所に計5点の合計21点であった。タンパク質内部に算出された16点の相互作用点は限られた範囲内にまとまって予測されており、この部分が相互作用部位であることは容易に推測できる。また、タンパク質表面に算出された相互作用点は4ヶ所の場所に1点ないし2点ずつあり、これらはいずれも溶媒接触表面処理で完全に除去しきれなかった相互作用点候補か、溶媒分子などとの相互作用点であると判断でき、リガンド結合部位と明確に区別できる。相互作用点の物理化学情報としては、弱く正に荷電した静電項支配の相互作用点が、タンパク質内部に4点、およびタンパク質表面に1点算出された。また、タンパク質表面には強く正に荷電した静電項支配の相互作用点が1点あり(全体図で最も左側にある相互作用点の裏に隠れているため、表示されていない)、残りはいずれも電子相関項支配の相互作用点であった。
なお、各工程における相互作用点の数は、第2工程では3367点、第3工程では644点、第4工程では21点であった。
The position of the interaction point on the protein was identified based on the interaction point information database. At this time, interaction points for hydrogen atoms of hydroxyl groups and thiol groups are generated in increments of 60 degrees, and interaction points for heavy atoms of hydroxyl groups, thiol groups, and thioethers (ie, oxygen atoms and sulfur atoms) are also generated in increments of 60 degrees. I let you. The interaction requirement with the constituent atoms of the biopolymer was taken into consideration the distance to the hydrogen atom, and the grid size was set to 2.5 mm and the interaction distance condition was also set to 2.5 mm (FIG. 6). At this time, water molecules contained in the protein system were not considered. In the step of removing the interaction point that interacts with the solvent molecule, for comparison with Example 2, the boundary cell condition (FIG. 7) with a grid of 0.8 cm was used and the solvent contact surface was used. The interaction point was predicted under the above conditions.
FIG. 8 shows the prediction result of the interaction point in the apo-type retinol binding protein. The fine points in the figure are oxygen atoms of water molecules. The number of interaction points obtained was 21 in total, 16 points inside the protein and 5 points in total at 4 points on the protein surface. The 16 interaction points calculated inside the protein are predicted within a limited range, and it can be easily estimated that this part is an interaction site. In addition, there are one or two interaction points calculated on the protein surface, each of which is a candidate interaction point that could not be completely removed by solvent contact surface treatment, solvent molecules, etc. And can be clearly distinguished from the ligand binding site. As the physicochemical information of the interaction points, four weakly positively charged electrostatic term-dominated interaction points were calculated inside the protein and one point on the protein surface. Also, there is one strongly positively charged electrostatic term-dominated interaction point on the protein surface (not shown because it is hidden behind the leftmost interaction point in the overall view), and the rest is Both were interaction points governed by electron correlation terms.
The number of interaction points in each step was 3367 points in the second step, 644 points in the third step, and 21 points in the fourth step.
このタンパクには複数のキャビティーおよび凹凸が存在しているが、本発明を用いた場合には前述の通り1ヶ所の部位のみに集中的に複数の相互作用点が予測される。また、図8には、比較のため、複合体を形成(以下、ホロ型と表す)している同種レチノール結合タンパクの重ね合わせで得たレチノール分子も併せて示している。本発明で予測された該相互作用部位の一部は実際に複合体を形成しているレチノール分子の脂溶性部分と完全に一致していた。
一方、レチノール分子のアルコール部分に対応する相互作用点が予測されないが、その理由は、図8に示すように、アポ型レチノール結合タンパクではレチノール分子のアルコール官能基が相互作用するはずの相互作用点を該タンパク自身のフェニルアラニン側鎖が占有しているためである。言い換えれば、リガンド認識に関わる相互作用点あるいは相互作用部位は、アポ型では、内部構造の安定化に利用されているという重要な化学的考察をもたらす。
このように、本発明を用いた場合には、タンパク質内部あるいは表面に複数のキャビティーや凹凸が存在しても、さらに、内部で安定化してしまっているようなアポ型であっても、極めて正確に外部因子の複合体形成部位を予測できることが分かる。
This protein has a plurality of cavities and irregularities, but when the present invention is used, a plurality of interaction points are predicted intensively at only one site as described above. FIG. 8 also shows, for comparison, retinol molecules obtained by superimposing the same type retinol-binding proteins forming a complex (hereinafter referred to as holo). Some of the interaction sites predicted by the present invention were completely consistent with the fat-soluble portion of the retinol molecule that actually formed the complex.
On the other hand, although the interaction point corresponding to the alcohol part of the retinol molecule is not predicted, as shown in FIG. 8, the interaction point where the alcohol functional group of the retinol molecule should interact with the apo-type retinol-binding protein is shown in FIG. This is because the phenylalanine side chain of the protein itself is occupied. In other words, the interaction point or interaction site involved in ligand recognition brings about an important chemical consideration that the apo type is used for stabilization of the internal structure.
Thus, when the present invention is used, even if there are a plurality of cavities and irregularities in the inside or the surface of the protein, even if it is an apo type that has stabilized inside, It turns out that the complex formation site | part of an external factor can be estimated correctly.
次に、ホロ型では、リガンドの複合体形成部位のみならず、リガンド分子の形状およびリガンドの化学的要求性までもが正確に予測できることを示す。
タンパク質の立体構造はPDBから提供されるPDB ID: 1BRP を用いた。タンパク質システムの前処理では、水素原子の構造最適化を実施する直前に、レチノール分子に結合情報、水素原子、Amber94力場原子タイプおよびMNDO/d原子電荷を割り振った。その他の前処理、生体高分子の構成原子との相互作用条件(水分子に加え、レチノール分子も考慮しない)および溶媒分子との相互作用条件はすべて実施例1と同様に実施した。
図9にホロ型のプラズマヒトレチノール結合タンパクに対して相互作用点を予測した結果を示す。なお、図中の細かな点は水分子の酸素原子である。図には、比較のため、同時に複合体を形成しているレチノール分子も示している。得られた相互作用点の数はタンパク質内部に13点とタンパク質表面上の3ヶ所に計3点の合計16点であった。タンパク質表面に算出された相互作用点はいずれも溶媒接触表面処理で完全に除去しきれなかった相互作用点候補か、溶媒分子などとの相互作用点と判断される。これに対して、タンパク質内部に予測された13点を含む領域はリガンド結合部位と完全に一致していた。相互作用点の物理化学情報としては、弱く正に荷電した静電項支配の相互作用点がタンパク質内部に3点、およびタンパク質表面に2点あり、弱く負に荷電した静電項支配の相互作用点がタンパク質内部に1点あった。残りはいずれも電子相関項支配の相互作用点であった。
なお、各工程における相互作用点の数は、第2工程では3367点、第3工程では631点、第4工程では16点であった。
Next, it is shown that the holo type can accurately predict not only the complex formation site of the ligand but also the shape of the ligand molecule and the chemical requirement of the ligand.
The three-dimensional structure of the protein was PDB ID: 1BRP provided by PDB. In the pretreatment of the protein system, the retinol molecule was assigned binding information, hydrogen atom, Amber94 force field atom type, and MNDO / d atomic charge immediately before the optimization of the hydrogen atom structure. Other pretreatments, interaction conditions with constituent atoms of the biopolymer (in addition to water molecules, retinol molecules were not considered) and interaction conditions with solvent molecules were all carried out in the same manner as in Example 1.
FIG. 9 shows the result of predicting the interaction point for the holo-type plasma human retinol binding protein. The fine points in the figure are oxygen atoms of water molecules. The figure also shows retinol molecules forming a complex at the same time for comparison. The number of interaction points obtained was 16 in total, 13 points inside the protein and 3 points in total on the protein surface. Any interaction point calculated on the protein surface is determined to be an interaction point candidate that could not be completely removed by the solvent contact surface treatment, or an interaction point with a solvent molecule or the like. In contrast, the predicted region containing 13 points inside the protein was completely consistent with the ligand binding site. The physicochemical information of the interaction point is that there are three weakly positively charged electrostatic term-dominated interaction points inside the protein and two points on the protein surface, weakly negatively charged electrostatic term-dominated interactions There was one point inside the protein. The rest were all interaction points governed by electron correlation terms.
The number of interaction points in each step was 3367 points in the second step, 631 points in the third step, and 16 points in the fourth step.
リガンド結合部位に予測された相互作用点を三次元的に結びつけて推測される形状は複合体を形成しているレチノール分子とかなり良く一致することが分かる。また、ホロ型ではフェニルアラニンによる占有がなくなり、レチノール分子のアルコール酸素原子上に、正に荷電した静電項支配の相互作用点、したがって、レチノール分子の負電荷の大きいアルコール酸素と静電相互作用によって安定化する相互作用点が予測されている。
さらに、ホロ型のフェニルアラニンは図8のアポ型で予測された上方の相互作用点上に移動しており、このことは、本発明が誘導適合効果等の生体高分子内部構造の動的挙動までも予測できることを示している。
予測された相互作用点の物理化学情報はレチノールの脂溶性部分に対応する相互作用点ではいずれも電子相関項支配であり、アルコール部分に対応する相互作用点では先に述べたように正に荷電した静電項支配であると正確に予測されている。また、1点の弱く正に荷電した静電項支配の相互作用点が共役オレフィン面上に正しく予測されている。
It can be seen that the shape presumed by three-dimensionally connecting the predicted interaction point to the ligand binding site agrees fairly well with the retinol molecule forming the complex. Also, in the holo type, the occupation by phenylalanine is eliminated, and the positively charged electrostatic term-dominated interaction point on the alcohol oxygen atom of the retinol molecule, therefore, due to the electrostatic interaction with the alcohol oxygen having a large negative charge of the retinol molecule. A stabilizing interaction point is predicted.
Furthermore, the holo-type phenylalanine has moved to the upper interaction point predicted by the apo-type of FIG. 8, which indicates that the present invention has been applied to the dynamic behavior of the internal structure of the biopolymer, such as the induction fitting effect. It also shows that it can be predicted.
The predicted physicochemical information of the interaction point is dominated by the electron correlation term at the interaction point corresponding to the fat-soluble part of retinol, and positively charged at the interaction point corresponding to the alcohol part as described above. Is accurately predicted to be dominated by the electrostatic term. Also, one weakly positively charged electrostatic term dominated interaction point is correctly predicted on the conjugated olefin surface.
次に、大腸菌グルタミンアミドトランスフェラーゼのグルコサミン−6−リン酸シンターゼ領域の相互作用点予測について説明する。この酵素はタンパク質表面のかなり浅い凹みに基質結合部位があり、複数のキャビティーや凹凸が存在していることが特徴である。本発明はこのような場合にも正確に相互作用点を予測し得ることを示す。
この酵素の立体構造は、PDBから提供されるPDB ID: 1MOR を用いた。溶媒分子との相互作用条件として1.0Åの境界セル条件による溶媒接触表面を用いた以外は、実施例2と同様の条件を採用した。
なお、各工程における相互作用点の数は、第2工程では6676点、第3工程では986点、第4工程では21点であった。
図10には大腸菌グルタミンアミドトランスフェラーゼのグルコサミン−6−リン酸シンターゼ領域に対して相互作用点を予測した結果を示す。なお、図中の細かな点は水分子の酸素原子である。図には、比較のため、同時に複合体を形成しているグルコース−6−リン酸分子も示している。
Next, the interaction point prediction of the glucosamine-6-phosphate synthase region of Escherichia coli glutamine amide transferase will be described. This enzyme is characterized by a substrate-binding site in a fairly shallow dent on the protein surface and multiple cavities and irregularities. The present invention shows that the interaction point can be accurately predicted even in such a case.
As the three-dimensional structure of this enzyme, PDB ID: 1MOR provided by PDB was used. The same conditions as in Example 2 were adopted except that a solvent contact surface under a boundary cell condition of 1.0 mm was used as an interaction condition with solvent molecules.
The number of interaction points in each process was 6676 points in the second process, 986 points in the third process, and 21 points in the fourth process.
FIG. 10 shows the result of predicting the interaction point for the glucosamine-6-phosphate synthase region of E. coli glutamine amide transferase. The fine points in the figure are oxygen atoms of water molecules. The figure also shows glucose-6-phosphate molecules forming a complex at the same time for comparison.
相互作用点はタンパク質表面上の6ヶ所に計19点、タンパク質内部の2ヶ所に計2点の合計21点であった。タンパク質表面に予測された6ヶ所のうち、4ヶ所が結晶水の座標と完全に一致していた。また、図10の全体図で最も上に算出されている負に荷電した静電項支配の相互作用点は、溶媒接触表面処理で完全に除去しきれなかった相互作用点候補、または溶媒分子との相互作用点と推測でき、14点の相互作用点がまとまって予測されている残りの1ヶ所は、グルコサミン−6−リン酸シンターゼ領域の基質結合部位と完全に一致した。なお、タンパク質内部には2ヶ所の異なる位置に1点ずつ電子相関項支配の相互作用点が予測されているが(1点は全体図のほぼ中央に、もう1点はグルコース−6−リン酸分子の真下にあり、図では隠れてしまっている)、本酵素はグルコース−6−リン酸が結合している部位とはかなり離れた位置からアンモニア分子が移動してくるためのトンネル機構を有しており、これらタンパク質内部の相互作用点はこのトンネル内に予測されている可能性がある。
グルコサミン−6−リン酸結合部位における14点の各相互作用点の物理化学情報はグルコース−6−リン酸分子のピラノース環上では電子相関項支配の相互作用点と弱く正に荷電した静電項支配の相互作用点が複数ずつ予測されており、また、リン酸部分では正に荷電した静電項支配の相互作用点のみが複数予測されていることから、結合しているグルコース−6−リン酸分子、あるいは既知基質の化学的特長を正確に予測していた。
There were a total of 21 interaction points, a total of 19 points at 6 locations on the protein surface and 2 points at 2 locations inside the protein. Of the six predicted on the protein surface, four were in full agreement with the coordinates of the crystal water. In addition, the negatively charged electrostatic term-dominated interaction point calculated at the top in the overall diagram of FIG. 10 is an interaction point candidate or solvent molecule that could not be completely removed by the solvent contact surface treatment. The remaining one point where 14 interaction points were predicted was perfectly consistent with the substrate binding site of the glucosamine-6-phosphate synthase region. In addition, although interaction points dominated by the electron correlation term are predicted one by one at two different positions in the protein (one point is almost in the center of the whole figure, and the other point is glucose-6-phosphate. This enzyme has a tunnel mechanism for ammonia molecules to move from a position far away from the site where glucose-6-phosphate is bound. The interaction points inside these proteins may be predicted within this tunnel.
The physicochemical information of each of the 14 interaction points at the glucosamine-6-phosphate binding site is based on the interaction point dominated by the electron correlation term and the weakly positively charged electrostatic term on the pyranose ring of the glucose-6-phosphate molecule. A plurality of dominant interaction points are predicted, and only a plurality of positively charged electrostatic term-dominated interaction points are predicted in the phosphate portion. It accurately predicted the chemical characteristics of acid molecules or known substrates.
次に、別のタンパク質、すなわち、アゴニストコンフォメーションを採用するヒトレチノイン酸レセプターリガンド結合領域(ガンマサブタイプ)と天然リガンドであるレチノイン酸を用いて本発明の有効性を示す。本レセプターはリガンド結合部位をタンパク質内部の空洞(キャビティー)にもつことが特徴である。
前記レセプターの立体構造はPDBから提供されるPDB ID: 2LBD を用いた。採用した条件は、生体高分子の構成原子との相互作用点条件として相互作用距離条件2.4Åを用いた以外は、実施例2と同様であった。
なお、各工程における相互作用点の数は、第2工程では4420点、第3工程では765点、第4工程では26点であった。
図11および図12には予測した相互作用点および複合体を形成しているレチノイン酸分子を比較のために同時に示しており、それぞれ前面図(図11)と側面図(図12)である。なお、図中の細かな点は水分子の酸素原子である。実施例1から3と同様に、このタンパク質には複数のキャビティーや凹凸が存在しているが、予測された相互作用部位は実際の複合体形成部位と完全に一致する。得られた相互作用点の数は、タンパク質表面の6ヶ所に計8点、タンパク質内部に18点の合計26点であった。タンパク質表面に算出された相互作用点のいくつかは溶媒接触表面処理で完全に除去しきれなかった相互作用点候補か、溶媒分子などとの相互作用点と判断されるが、このうち2ヶ所の3点はC末端付近にあり、他の核内レセプターでF領域と呼ばれる該C末端に続く構造が結合している部分と同一の場所にあった。また、もう1ヶ所の1点は活性化因子または抑制因子が結合する部分に予測されていた。相互作用点の物理化学情報としては、弱く正に荷電した静電項支配の相互作用点が3ヶ所のタンパク質表面にそれぞれ1点ずつとリガンド結合部位に2点あり、弱く負に荷電した静電項支配の相互作用点が2ヶ所のタンパク質表面にそれぞれ1点ずつ予測されていた。残りはいずれも電子相関項支配の相互作用点であった。
リガンド結合部位に予測された相互作用点を三次元的に結びつけて推測される形状および各相互作用点の物理化学情報は天然リガンドの候補を膨大な有機化合物の中から絞り込む上で極めて有用な情報となっていることが分かる。すなわち、各相互作用点における物理化学情報がレチノイン酸の脂溶性部分ではいずれも電子相関項支配であり、カルボン酸部分では正に荷電した静電項支配であると予測されており、予測された相互作用点から推測される形状情報とあわせることで、天然リガンドが不明な場合でも、該レセプターの天然リガンドが脂肪酸であることは、これらの情報から容易に推測できる。
Next, the effectiveness of the present invention is demonstrated using another protein, namely, a human retinoic acid receptor ligand binding region (gamma subtype) employing an agonist conformation and a natural ligand, retinoic acid. This receptor is characterized by having a ligand binding site in the cavity inside the protein.
As the three-dimensional structure of the receptor, PDB ID: 2LBD provided by PDB was used. The employed conditions were the same as those in Example 2 except that the interaction distance condition 2.4 Å was used as the interaction point condition with the constituent atoms of the biopolymer.
The number of interaction points in each step was 4420 points in the second step, 765 points in the third step, and 26 points in the fourth step.
FIG. 11 and FIG. 12 simultaneously show the predicted interaction points and retinoic acid molecules forming the complex for comparison, and are a front view (FIG. 11) and a side view (FIG. 12), respectively. The fine points in the figure are oxygen atoms of water molecules. As in Examples 1 to 3, this protein has a plurality of cavities and irregularities, but the predicted interaction site completely matches the actual complex formation site. The total number of interaction points obtained was 26 on a total of 8 points on 6 protein surfaces and 18 on the inside of the protein. Some of the interaction points calculated on the protein surface are considered as interaction point candidates that could not be completely removed by solvent contact surface treatment, or interaction points with solvent molecules. The three points were near the C-terminal and were in the same location as the part where the structure following the C-terminal called the F region was bound in other nuclear receptors. In addition, one other point was predicted at a portion where an activator or a suppressor is bound. As the physicochemical information of the interaction point, there are weakly positively charged electrostatic term-dominated interaction points, one on each protein surface and two on the ligand binding site, weakly negatively charged electrostatic One term-dominated interaction point was predicted for each of the two protein surfaces. The rest were all interaction points governed by electron correlation terms.
The shape estimated by three-dimensionally connecting the predicted interaction points to the ligand binding site and the physicochemical information of each interaction point are extremely useful information for narrowing down natural ligand candidates from a vast number of organic compounds. It turns out that it is. That is, the physicochemical information at each interaction point is predicted to be dominated by the electron correlation term in the fat-soluble part of retinoic acid, and dominated by the positively charged electrostatic term in the carboxylic acid part. By combining with the shape information inferred from the interaction point, even if the natural ligand is unknown, it can be easily inferred from this information that the natural ligand of the receptor is a fatty acid.
次に、本発明で予測した相互作用点情報が高親和性を目指したリガンドの構造修飾または新規低分子化合物の設計、探索に対して効果的な指針を提供できる実例を示す。
図13にはアンタゴニストコンフォメーションを採用したマウスレチノイドXレセプターリガンド結合領域F318Aミュータント(アルファサブタイプ)のリガンド結合部位とその部位で複合体を形成しているオレイン酸分子を示している。なお、図中の細かな点は水分子の酸素原子である。
このレセプターの立体構造は、PDBから提供されるPDB ID: 1DFK を用いた。1DFKはレチノイン酸レセプターとのヘテロダイマーであるので、前記レセプターから4Å内にある水分子および前記レセプター内部に取り込まれたオレイン酸分子以外の分子を切り離して利用した。また、前記レセプターのへリックス1−へリックス3ループはアゴニストコンフォメーションを採用したヒトレチノイドXレセプターリガンド結合領域(アルファサブタイプ)の主鎖の座標を鋳型にモデリングした。生体高分子の構成原子との相互作用判定として水分子も考慮した上で相互作用距離条件を2.1Åとし、溶媒分子との相互作用条件として1.5Åのグリッドの境界セル条件によるファンデルワールス表面を用いた以外は実施例2と同様の前処理および条件にて相互作用点予測を実施した。
なお、各工程における相互作用点の数は、第2工程では4234点、第3工程では767点、第4工程では25点であった。
Next, an example will be shown in which interaction point information predicted by the present invention can provide effective guidelines for structural modification of a ligand aiming at high affinity or design and search of a novel low molecular weight compound.
FIG. 13 shows a ligand binding site of mouse retinoid X receptor ligand binding region F318A mutant (alpha subtype) adopting antagonist conformation and an oleic acid molecule forming a complex at that site. The fine points in the figure are oxygen atoms of water molecules.
The three-dimensional structure of this receptor was PDB ID: 1DFK provided by PDB. Since 1DFK is a heterodimer with the retinoic acid receptor, water molecules within 4Å from the receptor and molecules other than the oleic acid molecule incorporated into the receptor were separated and used. The receptor helix 1-helix 3 loop was modeled using the coordinates of the main chain of the human retinoid X receptor ligand binding region (alpha subtype) adopting agonist conformation as a template. The interaction distance condition is set to 2.1 mm in consideration of water molecules in determining the interaction with the constituent atoms of the biopolymer, and the van der Waals surface by the boundary cell condition of 1.5 mm grid is used as the interaction condition with the solvent molecules. The interaction point prediction was performed under the same pretreatment and conditions as in Example 2 except that they were used.
The number of interaction points in each process was 4234 in the second process, 767 in the third process, and 25 in the fourth process.
前述までの実施例同様に該タンパク質には複数のキャビティーや凹凸が存在しているが、予測された相互作用部位は実際の複合体形成部位と完全に一致する。得られた相互作用点の数はタンパク質表面の4ヶ所に計4点、タンパク質内部の2ヶ所に計21点の合計25点であった。タンパク質表面に算出された相互作用点はいずれもファンデルワールス表面処理で完全に除去しきれなかった相互作用点候補か、溶媒分子などとの相互作用点と判断される。タンパク質内部の2ヶ所の相互作用部位のうち、リガンド結合部位には19点の相互作用点がまとまって予測されていた。これに対し、タンパク質内部の残り1ヶ所は、アンタゴニストフォームを採用したへリックス12、活性化因子または抑制因子が結合する部分と一致していた。相互作用点の物理化学情報としては、弱く正に荷電した静電項支配の相互作用点がタンパク質表面に2点、リガンド結合部位に1点あり、弱く負に荷電した静電項支配の相互作用点も同様にタンパク質表面に2点、リガンド結合部位のオレイン酸分子に占有されていない部分に1点あった。残りはいずれも電子相関項支配の相互作用点であった。
これらの相互作用点から推測される形状および物理化学情報は前述までの実施例同様にリガンドの形状およびリガンドの構成重原子上の物理化学的性質、言い換えれば、リガンドの化学的要求性を極めて精度良く予測している。つまり、オレイン酸分子の炭素原子上に位置する17点の相互作用点はすべて電子相関項支配であり、カルボン酸酸素原子上に位置する1点の相互作用点だけが正に荷電した静電項支配の相互作用点であった。
As in the previous examples, the protein has a plurality of cavities and irregularities, but the predicted interaction site completely coincides with the actual complex formation site. The total number of interaction points obtained was a total of 25 points, 4 points at 4 locations on the protein surface and 21 points at 2 locations inside the protein. Any interaction point calculated on the protein surface is determined to be an interaction point candidate that could not be completely removed by van der Waals surface treatment, or an interaction point with a solvent molecule or the like. Of the two interaction sites inside the protein, 19 interaction points were predicted for the ligand binding site. On the other hand, the remaining one part in the protein coincided with a portion to which helix 12, an activator or an inhibitor that adopts the antagonist form is bound. As the physicochemical information of the interaction point, there are two weakly positively charged electrostatic term-dominated interaction points on the protein surface and one point on the ligand binding site, and the weakly negatively charged electrostatic term-dominated interaction. Similarly, there were 2 points on the protein surface and 1 point on the portion of the ligand binding site not occupied by the oleic acid molecule. The rest were all interaction points governed by electron correlation terms.
The shape and physicochemical information inferred from these interaction points is the same as in the previous examples. I predict well. In other words, the 17 interaction points located on the carbon atom of the oleic acid molecule are all governed by the electron correlation term, and only one interaction point located on the carboxylate oxygen atom is a positively charged electrostatic term. It was the interaction point of dominance.
複合体形成部位には、さらに、オレイン酸の構造で占有されない1つの弱く負に荷電した静電項支配の相互作用点が予測されている。
すなわち、オレイン酸の任意の位置より、この相互作用点で安定化をもたらす弱く正に荷電した置換基を導入することができれば、さらにこの複合体を安定化できることを示唆している。
また、先のホロ型レチノール結合タンパクにおいても(図9)、レチノールのヨノン環下部に、該リガンドに占有されない弱く正に荷電した静電項支配の相互作用点が予測されており、ヨノン環の対応する位置で酸化されているレチノール誘導体が該タンパク質のリガンドになりうる可能性を示唆している。
In addition, one weakly negatively charged electrostatic term dominated interaction point that is not occupied by the structure of oleic acid is predicted at the complex formation site.
That is, from any position of oleic acid, if it is possible to introduce a substituent charged weakly positive results in the stabilization in the interaction point, suggesting that can further stabilize the complex.
Also, in the previous holo-type retinol-binding protein (FIG. 9), a weakly positively charged electrostatic term-dominated interaction point that is not occupied by the ligand is predicted at the lower part of the yonon ring of retinol. This suggests the possibility that a retinol derivative oxidized at the corresponding position can be a ligand of the protein.
最後に、予測された相互作用点情報を利用して、該生体高分子と任意低分子化合物との間の最安定複合体構造の予測についての実施例を以下に示す。
実施例4で用いたアゴニストコンフォメーションを採用するヒトレチノイン酸レセプターリガンド結合領域(水分子も含む。)に対して、分子動力学計算で別途、単独で安定コンフォメーションを用意した代表的レチノイドであるAm80をドッキングする一態様の手順を図14に示す。
実施例4とは異なり、生体高分子の構成原子との相互作用判定に水分子も考慮しているため、タンパク質表面における単発的な相互作用点は予測されず、実際のリガンド結合部位のみに相互作用点が予測される。
予測された相互作用点は合計で16点であるが、今回は図11においてレチノイン酸のヨノン環メチル基、10位のオレフィン炭素上、14位のカルボキシル基アルファ位炭素上に位置する電子相関項支配の3点の相互作用点をタンパク質側の重ね合わせ点として利用した。
Am80の4つのねじれ結合を60度刻みで回転させ(81個のコンフォメーションを発生)、各相互作用点上の相互作用形態タイプとAm80を構成する各重原子上に割り振った同情報の可能な組み合わせ(1コンフォメーションあたり9240通り)に関して重ね合わせを実施して、ドッキング可能な組み合わせに対しては、さらにAm80を構造最適化し、相互作用エネルギーを見積もった。
図14の右下の図はドッキングシミュレーションで得られたAm80の最安定複合体構造を示しており、図14の左下の図は実際のレチノイン酸との複合体構造を示している。
ドッキングシミュレーションで得られたAm80の最安定複合体構造は実際のレチノイン酸との複合体構造と極めて類似していることが分かり、本発明で予測される相互作用点情報がドッキングシミュレーションで極めて有効であることが示された。
Finally, an example of predicting the most stable complex structure between the biopolymer and any low molecular weight compound using the predicted interaction point information is shown below.
It is a representative retinoid that has a stable conformation separately for the human retinoic acid receptor ligand binding region (including water molecules) that adopts the agonist conformation used in Example 4 by molecular dynamics calculation. FIG. 14 shows a procedure of one aspect for docking Am80.
Unlike Example 4, water molecules are also considered in the interaction determination with the constituent atoms of the biopolymer, so that a single interaction point on the protein surface is not predicted, and only the actual ligand binding site interacts. The point of action is predicted.
The total number of interaction points predicted is 16, but this time in FIG. 11, the electron correlation term located on the methyl group of the nonone ring of retinoic acid, the olefinic carbon at the 10th position, and the alpha carbon at the 14th position The three dominant interaction points were used as the superposition points on the protein side.
The four twisted bonds of Am80 are rotated in 60 degree increments (81 conformations are generated), allowing the same information assigned to each interaction atom type and each heavy atom constituting Am80. Overlay was performed on combinations (9240 per conformation), and for dockable combinations, Am80 was further structurally optimized and the interaction energy was estimated.
The lower right figure of FIG. 14 shows the most stable complex structure of Am80 obtained by docking simulation, and the lower left figure of FIG. 14 shows the actual complex structure with retinoic acid.
The most stable complex structure of Am80 obtained by docking simulation is found to be very similar to the actual complex structure with retinoic acid, and the interaction point information predicted by the present invention is extremely effective in docking simulation. It was shown that there is.
Claims (10)
生体高分子の原子座標情報を読み込む第一工程、
相互作用点情報データベースに基づいて前記生体高分子の相互作用点候補の座標を特定する第二工程であって、前記相互作用点情報データベースは、前記生体高分子の個々の構成単位に対する相互作用点の位置を、前記構成単位に対する相対的な座標系により規定する位置情報を含み、前記生体高分子の構成単位について、前記データベースにアクセスして対応する相互作用点の位置情報を取得し、該情報及び前記生体高分子の構成単位の原子座標情報に基づいて相互作用点候補の位置を特定する前記工程、
第二工程で特定した相互作用点候補のうち、生体高分子の構成原子との相互作用に関与する相互作用点候補を除去する第三工程、
を含む、上記方法。 Interaction sites in biopolymersBy computerA prediction method,
Atomic coordinate information of biopolymersReadFirst step,
In the second step of identifying the coordinates of the interaction point candidate of the biopolymer based on the interaction point information database, the interaction point information database isThe position of the interaction point with respect to each constituent unit of the biopolymer is defined by a relative coordinate system with respect to the constituent unit.Including location information,For the structural unit of the biopolymer, access to the database to obtain the position information of the corresponding interaction point,The informationAnd saidFor atomic coordinate information of structural units of biopolymersOn the basis ofThe step of identifying the location of the interaction point candidate;
Of the interaction point candidates identified in the second step, the third step of removing the interaction point candidates involved in the interaction with the constituent atoms of the biopolymer,
Including the above method.
生体高分子の表面と溶媒分子との相互作用に関与する相互作用点候補を除去する第四工程、
を実行する、請求項1または2に記載の方法。 The computer further includes, after the third step,
A fourth step of removing candidate interaction points involved in the interaction between the surface of the biopolymer and the solvent molecule;
The execution method according to claim 1 or 2.
生体高分子の原子座標情報を読み込む第一手順、
相互作用点情報データベースを参照して前記生体高分子の相互作用点候補の座標を特定する第二手順であって、前記相互作用点情報データベースは、前記生体高分子の個々の構成単位に対する相互作用点の位置を、前記構成単位に対する相対的な座標系により規定する位置情報を含み、前記生体高分子の構成単位について、前記データベースにアクセスして対応する相互作用点の位置情報を取得し、該情報及び前記生体高分子の構成単位の原子座標情報に基づいて相互作用点候補の位置を特定する第二手順、
第二手順で特定した相互作用点候補について、
該相互作用点候補から所定距離内に生体高分子の構成原子が存在するか否かを判定し、所定距離内に存在するときは、前記相互作用点候補を除去する第三手順、
予測された相互作用点の位置をディスプレイ上に表示する手順
をコンピュータに実行させるための、上記コンピュータプログラム。 A computer program for predicting an interaction site in a biopolymer,
First step to read atomic coordinate information of biopolymer,
A second procedure for specifying coordinates of the interaction point candidate of the biopolymer with reference to an interaction point information database, wherein the interaction point information database is an interaction for each structural unit of the biopolymer. Including position information defining a position of a point by a relative coordinate system with respect to the structural unit, and for the structural unit of the biopolymer, accessing the database to obtain position information of a corresponding interaction point; second instructions for identifying the location of the interaction point candidates based on the information and the atomic coordinate information of the structural unit of the biopolymer,
For the interaction point candidates identified in the second step,
Determining whether or not a constituent atom of the biopolymer exists within a predetermined distance from the interaction point candidate, and when present within the predetermined distance, a third procedure for removing the interaction point candidate;
A computer program for causing a computer to execute a procedure for displaying a predicted position of an interaction point on a display.
生体高分子の原子座標情報を読み込む第一手順、
相互作用点情報データベースを参照して前記生体高分子の相互作用点候補の座標を特定する第二手順であって、前記相互作用点情報データベースは、前記生体高分子の個々の構成単位に対する相互作用点の位置を、前記構成単位に対する相対的な座標系により規定する位置情報を含み、該情報及び前記生体高分子の構成単位の原子座標情報に基づいて相互作用点候補の位置を特定する第二手順、
第二手順で特定した相互作用点候補について、
該相互作用点候補から所定距離内に生体高分子の構成原子が存在するか否かを判定し、所定距離内に存在するときは、前記相互作用点候補を除去する第三手順、
生体高分子の溶媒接触表面またはファンデルワールス表面の外側に存在する相互作用点候補を除去する第四手順、
予測された相互作用点の位置をディスプレイ上に表示する手順
をコンピュータに実行させるための、上記コンピュータプログラム。 A computer program for predicting an interaction site in a biopolymer,
First step to read atomic coordinate information of biopolymer,
A second procedure for specifying coordinates of the interaction point candidate of the biopolymer with reference to an interaction point information database, wherein the interaction point information database is an interaction for each structural unit of the biopolymer. the position of the point includes position information defining the relative coordinate system with respect to the structural unit, the second for identifying the position of the interaction point candidates based on the information and the atomic coordinate information of the structural unit of the biopolymer procedure,
For the interaction point candidates identified in the second step,
Determining whether or not a constituent atom of the biopolymer exists within a predetermined distance from the interaction point candidate, and when present within the predetermined distance, a third procedure for removing the interaction point candidate;
A fourth procedure for removing candidate interaction points existing outside the solvent contact surface or van der Waals surface of the biopolymer,
A computer program for causing a computer to execute a procedure for displaying a predicted position of an interaction point on a display.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006125188A JP5142179B2 (en) | 2006-04-28 | 2006-04-28 | Prediction method of interaction sites in biopolymers |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006125188A JP5142179B2 (en) | 2006-04-28 | 2006-04-28 | Prediction method of interaction sites in biopolymers |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007299125A JP2007299125A (en) | 2007-11-15 |
JP5142179B2 true JP5142179B2 (en) | 2013-02-13 |
Family
ID=38768575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006125188A Active JP5142179B2 (en) | 2006-04-28 | 2006-04-28 | Prediction method of interaction sites in biopolymers |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5142179B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3699916A4 (en) * | 2017-10-17 | 2020-11-04 | FUJIFILM Corporation | Feature quantity calculating method, feature quantity calculating program and feature quantity calculating device, screening method, screening program and screening device, compound creating method, compound creating program and compound creating device |
JP7214972B2 (en) * | 2018-03-30 | 2023-01-31 | 富士通株式会社 | Method for calculating stable three-dimensional structure, calculation device, and program |
JP7547799B2 (en) | 2020-06-05 | 2024-09-10 | 富士通株式会社 | Structure search method, structure search device, structure search program, and interaction potential specifying method |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3747048B2 (en) * | 1994-10-31 | 2006-02-22 | 昭子 板井 | Database creation method for searching new ligand compounds from 3D structure database |
JP2005018447A (en) * | 2003-06-26 | 2005-01-20 | Ryoka Systems Inc | Method for searcing acceptor-ligand stable complex structure |
JP4751822B2 (en) * | 2004-02-24 | 2011-08-17 | 株式会社インシリコサイエンス | Interaction site prediction apparatus, interaction site prediction method, program, and recording medium |
JP4314128B2 (en) * | 2004-02-24 | 2009-08-12 | 株式会社インシリコサイエンス | Ligand search method using protein conformation and induction fit |
JP4688467B2 (en) * | 2004-10-15 | 2011-05-25 | 株式会社菱化システム | Method for searching structure of receptor-ligand stable complex |
-
2006
- 2006-04-28 JP JP2006125188A patent/JP5142179B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007299125A (en) | 2007-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Feinstein et al. | Calculating an optimal box size for ligand docking and virtual screening against experimental and predicted binding pockets | |
E Lohning et al. | A practical guide to molecular docking and homology modelling for medicinal chemists | |
Geng et al. | Applications of molecular dynamics simulation in structure prediction of peptides and proteins | |
Amaro et al. | An improved relaxed complex scheme for receptor flexibility in computer-aided drug design | |
Stansfeld et al. | MemProtMD: automated insertion of membrane protein structures into explicit lipid membranes | |
Smith et al. | Prediction of protein–protein interactions by docking methods | |
Robertson et al. | GemSpot: a pipeline for robust modeling of ligands into cryo-EM maps | |
Amaro et al. | Emerging methods for ensemble-based virtual screening | |
Biesiada et al. | Survey of public domain software for docking simulations and virtual screening | |
US10002228B2 (en) | Method for binding site identification by molecular dynamics simulation (silcs: site identification by ligand competitive saturation) | |
Robertson et al. | Expanding the druggable space of the LSD1/CoREST epigenetic target: new potential binding regions for drug-like molecules, peptides, protein partners, and chromatin | |
JP5142179B2 (en) | Prediction method of interaction sites in biopolymers | |
Guterres et al. | CHARMM-GUI LBS finder & refiner for ligand binding site prediction and refinement | |
Günther et al. | Representation of target-bound drugs by computed conformers: implications for conformational libraries | |
US6970790B2 (en) | Method and apparatus for analysis of molecular combination based on computational estimation of electrostatic affinity using basis expansions | |
Barcelos et al. | Lead optimization in drug discovery | |
Chavda et al. | In Silico Protein Design and Virtual Screening | |
Spiriti et al. | Middle-way flexible docking: Pose prediction using mixed-resolution Monte Carlo in estrogen receptor α | |
Namitha et al. | Review of bioinformatic tools used in Computer Aided Drug Design (CADD) | |
Madan et al. | Principles and aspects of molecular docking: A bird’s eye view | |
US20140222398A1 (en) | Methods and apparatus for double-integration orthogonal space tempering | |
Totrov | Loop simulations | |
Emsley et al. | The use of molecular graphics in structure-based drug design | |
JP4688467B2 (en) | Method for searching structure of receptor-ligand stable complex | |
Poudyal | Molecular Docking Technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121105 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121114 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5142179 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |