JP7422591B2 - 対象分子中のアルギニン残基のプロテアーゼ耐性予測方法、及びこれを用いたプロテアーゼ耐性分子の合成方法、並びに、対象分子中のアルギニン残基の、プロテアーゼ耐性予測装置及びプロテアーゼ耐性予測プログラム - Google Patents
対象分子中のアルギニン残基のプロテアーゼ耐性予測方法、及びこれを用いたプロテアーゼ耐性分子の合成方法、並びに、対象分子中のアルギニン残基の、プロテアーゼ耐性予測装置及びプロテアーゼ耐性予測プログラム Download PDFInfo
- Publication number
- JP7422591B2 JP7422591B2 JP2020063929A JP2020063929A JP7422591B2 JP 7422591 B2 JP7422591 B2 JP 7422591B2 JP 2020063929 A JP2020063929 A JP 2020063929A JP 2020063929 A JP2020063929 A JP 2020063929A JP 7422591 B2 JP7422591 B2 JP 7422591B2
- Authority
- JP
- Japan
- Prior art keywords
- arginine
- protease resistance
- arginine residues
- target molecule
- protease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 title claims description 364
- 108091005804 Peptidases Proteins 0.000 title claims description 258
- 239000004365 Protease Substances 0.000 title claims description 258
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 title claims description 222
- 238000000034 method Methods 0.000 title claims description 126
- 230000002194 synthesizing effect Effects 0.000 title claims description 20
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 141
- 210000004369 blood Anatomy 0.000 claims description 18
- 239000008280 blood Substances 0.000 claims description 18
- 238000007069 methylation reaction Methods 0.000 claims description 16
- 238000007385 chemical modification Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 description 169
- 238000000329 molecular dynamics simulation Methods 0.000 description 122
- 102000035195 Peptidases Human genes 0.000 description 36
- 125000004429 atom Chemical group 0.000 description 28
- 238000009826 distribution Methods 0.000 description 27
- 125000000539 amino acid group Chemical group 0.000 description 26
- 230000006870 function Effects 0.000 description 22
- 102000004196 processed proteins & peptides Human genes 0.000 description 21
- 238000003860 storage Methods 0.000 description 20
- 238000004088 simulation Methods 0.000 description 19
- 235000018102 proteins Nutrition 0.000 description 18
- 108090000623 proteins and genes Proteins 0.000 description 18
- 102000004169 proteins and genes Human genes 0.000 description 17
- 238000012549 training Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 239000003814 drug Substances 0.000 description 13
- 229940079593 drug Drugs 0.000 description 12
- 238000005070 sampling Methods 0.000 description 11
- 150000001413 amino acids Chemical group 0.000 description 9
- 238000007876 drug discovery Methods 0.000 description 9
- 210000002966 serum Anatomy 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000033001 locomotion Effects 0.000 description 8
- 239000002904 solvent Substances 0.000 description 8
- 235000001014 amino acid Nutrition 0.000 description 7
- 229940024606 amino acid Drugs 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 125000004432 carbon atom Chemical group C* 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 239000004475 Arginine Substances 0.000 description 6
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 6
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- XWHHYOYVRVGJJY-QMMMGPOBSA-N 4-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-QMMMGPOBSA-N 0.000 description 5
- 239000007857 degradation product Substances 0.000 description 5
- 150000002500 ions Chemical class 0.000 description 5
- 238000012900 molecular simulation Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 238000000324 molecular mechanic Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- XQQBUAPQHNYYRS-UHFFFAOYSA-N 2-methylthiophene Chemical compound CC1=CC=CS1 XQQBUAPQHNYYRS-UHFFFAOYSA-N 0.000 description 3
- QENGPZGAWFQWCZ-UHFFFAOYSA-N Methylthiophene Natural products CC=1C=CSC=1 QENGPZGAWFQWCZ-UHFFFAOYSA-N 0.000 description 3
- 108090000190 Thrombin Proteins 0.000 description 3
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 3
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 125000004433 nitrogen atom Chemical group N* 0.000 description 3
- 229940012957 plasmin Drugs 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 229960004072 thrombin Drugs 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 108010069514 Cyclic Peptides Proteins 0.000 description 2
- 102000001189 Cyclic Peptides Human genes 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000009881 electrostatic interaction Effects 0.000 description 2
- 238000011067 equilibration Methods 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 238000004007 reversed phase HPLC Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 101001024391 Homo sapiens Neuromedin-U receptor 1 Proteins 0.000 description 1
- 108010067902 Peptide Library Proteins 0.000 description 1
- 101800001554 RNA-directed RNA polymerase Proteins 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005421 electrostatic potential Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 102000053120 human NMUR1 Human genes 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000003077 quantum chemistry computational method Methods 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
ここで、血中には、ペプチドやタンパク質におけるペプチド結合を加水分解する酵素であるプロテアーゼが存在し、血中に存在するプロテアーゼ(血中プロテアーゼ)としては、例えば、トロンビン、プラスミンなどが挙げられる。また、プラスミンについては、基質特異性がトリプシンと類似していることが報告されている(例えば、非特許文献1参照)。
このような血中プロテアーゼは、塩基性のアミノ酸であるアルギニンにおけるカルボキシ基側のペプチド結合を加水分解して切断する。
また、例えば、ペプチドが多数のアルギニン残基を有する場合に、全てのアルギニン残基をN-メチル化すると、N-メチル化の影響により、ペプチド自体の性質や立体構造が大きく変化してしまうときがある。このため、例えば、ペプチドのライブラリの中から探索した、N-メチル化していない状態では薬として作用し得るペプチドについて、当該ペプチドが有する全てのアルギニン残基をN-メチル化すると、薬として作用できない状態(例えば、標的分子に結合できない状態)に変化してしまう場合がある。
従来、ペプチドなどの分子中のアルギニン残基におけるプロテアーゼに対する耐性(切られにくさ)を、当該分子の構造などに基づいて予測できる技術は存在せず、プロテアーゼに対する耐性が低いアルギニン残基を、あらかじめ特定することはできなかった。
本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法は、対象分子の主鎖におけるアルギニン残基の結合状態と、当該アルギニン残基のプロテアーゼに対する耐性(プロテアーゼ耐性)とが相関するという本発明者の知見に基づくものである。そのため、まず、対象分子の主鎖におけるアルギニン残基の結合状態と、当該アルギニン残基のプロテアーゼ耐性との関係ついて説明する。
対象分子の一例であるペプチドやタンパク質におけるペプチド結合を加水分解して切断するプロテアーゼは、通常、ペプチドやタンパク質の分子構造を認識して、特定の部位でペプチドやタンパク質などの分子を切断する。上述したように、例えば、プロテアーゼの一例であるトリプシンなどにおいては、ペプチドやタンパク質が有する塩基性の残基であるアルギニン残基を認識して、当該アルギニン残基のペプチド結合を加水分解して分子を切断する。
さらに、本明細書中では、上記の化学式で表されるペプチド(A)における各残基を、以下のような略名で称する場合がある。
・2-メチルチオフェン:KC1
・トリプトファン:TRP
・4-フルオロフェニルアラニン:PHE(4F)
・アルギニン:ARG
・プロリン:PRO
・アスパラギン:ASN
なお、上記の化学式で表されるペプチド(A)における2つのアルギニン残基については、4位のアルギニン残基を「ARG4」と称し、6位のアルギニン残基を「ARG6」と称して、区別して取り扱う場合がある。
つまり、上記の文献では、ヒトの血清中のペプチド(A)においては、6位のアルギニン残基とアスパラギン残基の間のペプチド結合が先に切断され、4-フルオロフェニルアラニンと4位のアルギニン残基の間のペプチド結合が後に切断されることが、実験的に示されている。このことから、上記のペプチド(A)においては、4位のアルギニン残基(ARG4)と6位のアルギニン残基(ARG6)とでは、6位のアルギニン残基(ARG6)の方が、ヒトの血清に含まれるプロテアーゼにより切断されやすい(プロテアーゼ耐性が低い)ことがわかる。
一般に、アミノ酸残基で形成される分子中において、βストランド構造となっている部分は、他の特定の2次構造をとらない部分と比べて安定な状態となっている。特に、複数のβストランド構造によりβシート構造が形成されている場合は、βストランド構造どうしが水素結合を形成するため、より安定な状態となる。
これは、プロテアーゼによる切断(加水分解)の対象となるアルギニン残基においても、βストランド構造を形成している場合には、他の特定の2次構造をとらないアルギニン残基と比べて安定な状態であり、プロテアーゼ耐性が高くなるからであると考えることができる。
本発明者らは、アルギニン残基を有する対象分子における、当該アルギニン残基がβストランド構造を形成している比率と、当該アルギニン残基のプロテアーゼ耐性との相関を、より詳細に特定するため、上述した文献において、ヒトの血中での安定性(プロテアーゼ耐性)が既知となっているペプチド(A)について、コンピュータを用いた分子シミュレーションを実行し、ペプチド(A)が有する2つのアルギニン残基(ARG4及びARG6)がβストランド構造を形成している比率についての解析を行った。以下では、本発明者らが実行した分子シミュレーションの詳細について説明する。
また、この計算例では、上記のペプチド(A)が取り得る様々な立体構造をより広くサンプリングして、アルギニン残基がβストランド構造を形成している比率の計算結果の信頼性をより高くするため、拡張アンサンブル法の一つであるマルチカノニカル法を用いて、βストランド構造の比率を求めるための分子シミュレーションの初期構造を作成した。
このため、ここでは、ペプチド(A)における多様な構造をサンプリングするためのマルチカノニカル法による分子動力学計算(マルチカノニカルMD;McMD)と、ペプチド(A)におけるアルギニン残基がβストランド構造を形成している比率を求めるための分子動力学計算(カノニカルMD)とに分けて説明する。
まず、ペプチド(A)における多様な構造をサンプリングするためのマルチカノニカルMD(McMD)に用いるためのペプチド(A)の構造を、分子モデリングツールを用いて、上記のペプチド(A)をモデリングすることにより構築した。
続いて、ペプチド(A)の表面から10Å離れた領域までを1つのボックス(セル)として、ペプチド(A)の周りに水分子を配置し、Naイオン、Clイオンを生理的条件([NaCl]=100mM)で配置することで計算系の中性化を行った。なお、1Åは、0.1nmである。
エネルギー極小化計算は、最急降下法を用い、最初のステップでの原子移動距離RMSD=0.1[Å]、最大計算ステップ数50000、収束判定条件RMSF(原子に加わる力の自乗平均)=100.0[kJ/mol/nm]として行った。
なお、本計算例においては、分子力場として、通常のアミノ酸に対しては「Amber ff99SB-ILDN」を用いた。また、2-メチルチオフェン(KC1)対しては、部分電荷として非経験的量子化学計算法によって算出されるRESP(Restrained Electrostatic Potential)電荷を割り当て、他の各種力場パラメータとして上記の「Amber ff99SB-ILDN」と低分子化合物等の汎用力場であるGAFF(General AMBER force field)を用いた。
Fmc(r)=-grad Emc(r)
=-RT0 grad ln n(E)
=-RT0 d/dE ln n(E)grad E(r)
=RT0 γ(E) F(r)
ただし、上記の式において、
rは、計算系の全原子の位置を表す座標のベクトルである。
Emc(r)は、マルチカノニカル・アンサンブルにおける、rでの系のエネルギーである。
Rは、気体定数である。
T0は、温度を意味し、300Kである。
lnは、自然対数である。
n(E)は、系のエネルギーがEであるときの状態密度である。
E(r)は、カノニカルアンサンブルにおける、rでの系のエネルギーである。
γ(E)は、d/dE ln n(E)を意味する。
F(r)は、カノニカルアンサンブルにおける、rでの力である。
そして、最初の状態密度の推定のために、広い温度幅をカバーできる多様な温度でのMcMDを実行することにより、エネルギー分布ln Pcpreが得られる。エネルギー分布ln Pcpreから、状態密度ln npreを推定することができる。ただし、このエネルギー分布ln Pcpreは、通常、頂点付近において正確であるため、頂点付近のln Pcpreから状態密度ln npreを計算する。
そして、状態密度ln npreをエネルギーで微分して、γ(E)(=γ0(E))を得る。そうして、以下で述べるように、McMDを繰り返すことによりγ(E)を改善していく。
続いて、ln Pmc1stを多項式でフィッティングし、それを微分することにより、d/dE lnPmc1stを得る。そして、「γ1st(E)=γ0(E)+d/dE lnPmc1st」を計算することで、より正確なγ(E)を見積もる。
そして、エネルギー分布ln Pmc2ndを多項式でフィッティングし、エネルギーで微分することにより、「γ2nd(E)=γ1st(E)+d/dE lnPmc2nd」を計算することで、更に正確なγ(E)を見積もる。
ここで、仮に、j回目のMcMDにおけるγjth(E)が正確なものであるとすると、γjth(E)を用いたj+1回目のMcMDにより得られるエネルギー分布lnPmc(j+1)thは、平ら(フラット)な分布となる。言い換えると、McMDでは、より正確なγ(E)を求めることを繰り返すことにより、高温から低温まで広くカバーする平らなエネルギー分布をもつマルチカノニカル・アンサンブルを作成することができる。
このようにして、広いエネルギー領域(例えば、T=280K~700K)において、エネルギーの確率分布Pmc(E)が平らな分布(ヒストグラム)を作るためのMcMDは、training McMD(トレーニング マルチカノニカルMD)と称される。
productive McMDでは、上記のtraining McMDを行うことにより得た、広いエネルギー領域をカバーする平らなエネルギー分布Pmc(E)を満たすようにして、MDシミュレーションを行うことにより、ボルツマン分布に制限されることなく、対象とする分子が取り得る様々な立体構造をサンプリングすることができる。
本計算例においても、上記のようにして用意したペプチド(A)の計算系について、training McMDを行った後、productive McMDを行うことにより、ペプチド(A)が取り得る様々な立体構造を、広いサンプリング領域でサンプリングした。
以下では、本計算例におけるMcMDのより具体的な計算の手順について説明する。
本計算例においては、training McMDを、下記の手順に従って行った。
(1):training McMD1
上記のようにして用意したペプチド(A)の計算系について、高温(T=700K)に設定した条件における、シミュレーション時間1nsのカノニカルMD(通常のアンサンブルでのMDシミュレーション)を行う。
(2):training McMD2
設定したエネルギー領域において、エネルギーの確率分布Pmc(E)が平らな分布が得られるまで、McMDを繰り返す。
(2-1):Coverage run
設定したエネルギー領域を100%カバーするようにシミュレーション時間(1ns×Coverage率(0.0~1.0))を調整してシミュレーションを継続する。
ここで、Coverage率=(T0/γmin-T0/γmax)/(Tmax-Tmin)であり、T0=300K、Tmax=700K、Tmin=280Kである。
(2-2):Flatness run
Coverage率1.0を達成した後、設定した最大シミュレーション時間(250ns)の中で、設定したエネルギー領域においてエネルギー確率分布Pmc(E)が平らな分布(分布の平均値の標準偏差が0.2未満)になるまでシミュレーションを継続する。
次に、上記のtraining McMDにより得たγ(E)(=d/dE ln n(E))を用いて、ペプチド(A)の計算系についてのMDシミュレーションを行うことで、ペプチド(A)が取り得る様々な立体構造をサンプリングする。
図1の中央部にラインモデルで示した分子が、「KC1-TRP-PHE(4F)-ARG-PRO-ARG-ASN」の配列を有するペプチド(A)であり、その周囲に位置している多数の分子が水分子及びイオンである。
図2は、本発明の計算例において、ペプチド(A)についてのマルチカノニカルMDにおける、ペプチド(A)の立体構造の他の一例を示すスナップショットを示す図である。図2においては、周囲の水分子及びイオンを表示せずに、ペプチド(A)の立体構造を示している。
マルチカノニカルMD(McMD)を行うことによりサンプリングしたペプチド(A)の多数の立体構造(状態)には、様々なエネルギー状態の立体構造が含まれている。ここで、ペプチド(A)におけるアルギニン残基がβストランド構造を形成している比率を求めるための分子動力学計算(カノニカルMD)の初期構造としては、計算の信頼性を高めるという観点では、エネルギー的に安定な構造を選択すると共に、特定の局所解(極小値、ローカルミニマム)に限定されない構造を選択することが好ましい。
このため、本計算例においては、McMDによりサンプリングしたペプチド(A)の多数の立体構造から、自由エネルギー的に安定な複数種類の構造を特定して選択するために、McMDの計算結果についての自由エネルギー解析を行った。なお、以下に示すような自由エネルギーの解析は、上述したGROMACSのパッケージ及び本発明者らが作成した解析プログラムを用いて行った。
ここで、PMFは、計算系の自由エネルギー曲面(任意の反応座標に沿って自由エネルギーをプロットした曲面)を表すことができるものであり、例えば、特定の構造が出現する確率(出現確率、存在確率)を意味する量としても考えることができる。例えば、PMFが低い構造(自由エネルギーが低く安定な構造)は、計算系での出現確率が高くなると考えることができる。
より具体的には、McMDによりサンプリングしたペプチド(A)の全ての立体構造について、平均構造から座標変動の分散共分散行列を算出し、主成分解析を実施した。主成分分析においては、第1主成分を横軸、第2主成分を縦軸にとって、すべての構造をそれら2軸からなる2次元に射影し、そのマップ上で定義したi番目のbin(ビン)に含まれる全ての構造jに対して、確率Pc(Ej,300K)を算出しそれを足し合わせることでPMFを算出した。
ここで、i番目のbinにおけるPMFiは、以下の式で表すことができる。
PMFi=-RT0 ln Pi
ただし、上記の式において、
Rは、気体定数である。
T0は、温度を意味し、300Kである。
Piは、確率Pc(Ej,300K)をjについて足し合わせたものである。
Reweighting(Pc(E,T))=n(E)exp(-E/RT)/Zc
=Pmc(E)ZmcZc -1exp(-(E-Emc)/RT))
=Pmc(E)ZmcZc -1exp(-(E-RT ln n(E))/RT)
=Pmc(E)ZmcZc -1exp(-E/RT+ln n(E))
図3に示す自由エネルギーマップにおいては、上述したように、平均構造から座標変動の分散共分散行列を算出して主成分解析を行い、構造変化が最も大きくなるように第1主成分軸(PC1、横軸)を取り、第1主成分軸に直交するように第2主成分軸(PC2、縦軸)を取った。図3に示すペプチド(A)の自由エネルギーマップでは、自由エネルギーの高さを色の濃淡で示しており、色の薄い領域(白色に近い領域)の自由エネルギーが低く、色の濃い領域(黒色に近い領域)の自由エネルギーが高い。
より具体的には、上記のMcMDによりサンプリングされた全ての構造を、K-meansクラスタリング法によって10個のクラスターに分割(分類)し、それぞれのクラスターにおける代表構造を選択することにより、10個のカノニカルMDの初期構造を選択した。ここで、それぞれのクラスターにおける代表構造としては、それぞれのクラスターにおいて、平均構造に最も近い構造を選択した。
図4に示すように、本計算例では、McMDでサンプリングされた多数の立体構造の中から、立体構造(状態)が異なる10個の安定な構造を特定して選択しており、ペプチド(A)におけるアルギニン残基がβストランド構造を形成している比率を求めるためのカノニカルMDの初期構造として、好ましい構造を選択できていることがわかる。
続いて、本計算例では、上記のMcMDにより求めた10個の代表構造に対して、ペプチド(A)におけるアルギニン残基がβストランド構造を形成している比率を求めるためのカノニカルMDを行った。ここで、カノニカルMDとは、計算系の状態がカノニカルアンサンブルを満たす条件で行うMDシミュレーションを意味する。
本計算例においては、上記のMcMDにより求めた10個の代表構造のそれぞれに対して独立に、シミュレーション時間100ns(時間刻み幅Δt=2.0fs、計50,000,000 step)の速度スケーリング法を用いたNVT計算を、10本ずつ実施した。つまり、本計算例では、合計100本のカノニカルMDを実施した。なお、エネルギーや座標等のトラジェクトリは、1psごとに出力した(合計100,000 snapshots)。
ここで、分子動力学計算(MD)においては、計算(シミュレーション)の開始時における各原子の初期速度を、所定の分布(例えば、ボルツマン分布)となるように乱数を用いて設定することができる。この手法を用いる際には、同一の立体構造を初期構造として複数のMDを行う場合であっても、シミュレーションごとに原子の初期速度が異なるため、同一の条件での異なるトラジェクトリのデータを得ることができる。
本計算例においては、1つの代表構造について10本のカノニカルMDを行うことにより、各代表構造について信頼性の高い解析が可能となるトラジェクトリのデータを取得した。
本計算例で計算対象としているペプチド(A)の計算系を対象とした、シミュレーション時間100nsのカノニカルMDの計算にかかった計算時間は、5コア並列計算と1枚のGPUカードを利用した場合では、1つの計算系ついて約4.5時間であった。また、本計算例においては、複数のカノニカルMDを並行して実施したため、10個の代表構造を初期構造とした10本のカノニカルMDの計算(合計で100本のカノニカルMDの計算)に必要となった時間は、合計で約56時間であった。
そして、ペプチド(A)のアルギニン残基がβストランド構造を形成している比率を、上記の100nsのカノニカルMDにより取得したトラジェクトリを利用して解析した。
このような、分子における各残基の主鎖における結合状態(結合の角度)は、例えば、分子の主鎖における二面角で表すことができる。分子の主鎖における二面角(dihedral angle)とは、分子の主鎖において結合を持つ4つの連続する原子が作る2つの面の間の角度を意味する。
ペプチドやタンパク質などのアミノ酸により形成される分子の二面角においては、残基ごとに、主鎖におけるCα(不斉炭素原子)とN(窒素原子)の間の二面角φと、Cα(不斉炭素原子)とC(カルボニル基の炭素原子)の間の二面角ψとが変化し得る。なお、ペプチドやタンパク質などのアミノ酸により形成される分子の二面角において、主鎖におけるN(窒素原子)とC(カルボニル基の炭素原子)の間の二面角は、通常、180°又は0°となる。
ラマチャンドランプロットは、主鎖における二面角φとψのそれぞれを、-180°から180°でプロットしたものであり、ラマチャンドランプロットにφとψをプロットすることにより、分子の主鎖の構造を視覚的に把握することができる。
図5は、ラマチャンドランプロットにおける、アミノ酸残基の各二次構造が分布する領域の一例を示す図である。図5において、横軸は分子の主鎖におけるCα(不斉炭素原子)とN(窒素原子)の間の二面角φであり、縦軸は分子の主鎖におけるCα(不斉炭素原子)とC(カルボニル基の炭素原子)の間の二面角ψである。
また、図5における実線で囲まれた領域は、標準的な剛体球半径の条件において各構造を形成し得る領域であり、破線で囲まれた領域は、剛体球半径をより小さくした条件において各構造を形成し得る領域である。
このような統計的なラマチャンドランプロットにおいても、βストランド構造を取るアミノ酸残基は、図5に示したβストランドの領域にプロットされることが確かめられている。
ここで、本計算例では、ラマチャンドランプロットにおけるβストランド構造を形成する領域を、アルギニン残基における二面角φが-180°以上-30°以下、かつ、二面角ψが90°以上180°以下の領域として、解析を行った。
図6に示すように、本計算例では、ペプチド(A)のアルギニン残基についてのラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域に含まれる比率(存在比率)を、当該アルギニン残基がβストランド構造を形成している比率とみなして解析を行った。
図7及び図8に示したラマチャンドランプロットを作成する際には、上述したように、100nsのカノニカルMDの70nsから100nsのトラジェクトリに基づいて、ペプチド(A)のアルギニン残基における主鎖の二面角φとψを算出し、所定の時間間隔ごとに、二面角φとψの値をプロットした。また、図7及び図8は、10個の代表構造のうちの1つを初期構造とした1本のカノニカルMDのトラジェクトリから算出した二面角φとψの値をプロットしたものである。このように、図7及び図8では、本計算例における、アルギニン残基のラマチャンドランプロットのうちの一例について示したが、他のカノニカルMDのトラジェクトリに基づいて作成したラマチャンドランプロットにおいても、4位のアルギニン残基(ARG4)については図7と同様のプロットになり、6位のアルギニン残基(ARG6)については図8と同様のプロットとなった。
本計算例では、10個の代表構造を初期構造とした10本のカノニカルMD(合計で100本のカノニカルMD)から得られたトラジェクトリ(70nsから100ns)について、各アルギニン残基における二面角φとψが、図6に示した-180°≦φ≦-30°、かつ、90°≦ψ≦180°の領域に含まれる比率を、上記の「MDTraj」のライブラリを利用して作成したプログラムを用いて解析した。解析した結果を表1に示す。
また、表1において、「±(プラスマイナス)」の後の数値は、各カノニカルMD(100本のカノニカルMD)のトラジェクトリから算出した、各アルギニン残基における二面角φとψが、図6に示した-180°≦φ≦-30°、かつ、90°≦ψ≦180°の領域に含まれる比率の標準偏差を意味する。
したがって、ラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域に含まれる(βストランド構造を形成する)アルギニン残基は、安定な状態となっており、プロテアーゼにより切断されにくい(プロテアーゼ耐性が高い)と考えることができる。言い換えると、ラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域における存在比率が高いアルギニン残基は、プロテアーゼ耐性が高いと考えることができる。
そして、上述した計算例においても、4位のアルギニン残基(ARG4)と6位のアルギニン残基(ARG6)とでは、6位のアルギニン残基(ARG6)の方が、ラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域における存在比率が低く、プロテアーゼ耐性が低いと考えることができることが示されている。
このように、上記の計算例においては、2つのアルギニン残基を有するペプチド(A)に関して、各アルギニン残基のプロテアーゼ耐性について、実際の実験結果と対応する解析結果が得られた。
対象分子としては、少なくとも一部にアルギニン残基を含む主鎖を有する分子であれば特に制限はなく、目的に応じて適宜選択することができ、例えば、ペプチド、タンパク質などが挙げられる。これらの中でも、本発明においては、対象分子がペプチドであることが好ましい。
ここで、天然ペプチドとしては、例えば、生体内でタンパク質の合成に用いられる20種類のアミノ酸が直鎖状にペプチド結合して形成されたものとすることができる。なお、本発明における天然ペプチドは、厳密な意味で天然由来のものである必要は無く、例えば、立体構造を形成可能又は機能を発揮可能なものであれば、糖鎖やその他のペプチド部分を欠失させたものであってもよい。
また、特殊ペプチドとしては、例えば、上述の20種類のアミノ酸以外のアミノ酸を含むもの、アミノ酸残基の一部が化学修飾されているもの、主鎖が環状構造を有するもの(環状ペプチド)などが挙げられる。なお、特殊ペプチドは、人工的に合成されたものに限られるものではなく、天然由来のものであってもよい。
このように、対象分子が2以上のアルギニン残基を有する場合、本発明では、対象分子が有する全てのアルギニン残基について、プロテアーゼ耐性を予測することが好ましい。こうすることにより、対象分子中における複数のアルギニン残基のそれぞれについて、プロテアーゼ耐性を比較することが可能となり、例えば、対象分子中で最もプロテアーゼ耐性が低い(プロテアーゼにより切断されやすい)アルギニン残基を特定することができる。
なお、本発明において、対象分子が2以上のアルギニン残基を有する場合に、全てのアルギニン残基についてプロテアーゼ耐性を予測することは必須ではなく、例えば、プロテアーゼ耐性が既知のアルギニン残基については予測を行わないようにしてもよい。
本発明において、対象分子の主鎖における二面角のラマチャンドランプロットとしては、アルギニン残基の二面角φとψについて、所定の領域の存在確率を求めることができるものであれば特に制限はなく、目的に応じて適宜選択することができる。ラマチャンドランプロットについては、上記の<分子動力学計算の計算例>で説明したものを、適宜目的に応じて用いることができるが、これに限られるものではない。
ラマチャンドランプロットとしては、例えば、図5から8に示したようなもの用いることができるが、これに限定されるものではなく、例えば、縦軸として二面角φを取り、横軸として二面角ψを取ったものであってもよい。
ラマチャンドランプロットを作成するための分子動力学計算の手法については、上記の<分子動力学計算の計算例>で説明した手法を、適宜目的に応じて用いることができるが、これに限られるものではない。
以下では、分子動力学計算の詳細について説明する。
続いて、分子動力学法では、変化後の原子の位置を新たな起点として、同様の計算を再び行う。非常に短い時間の刻みでこれを繰り返すと、原子が徐々に動く様子が再現できる。このように、分子動力学法においては、(i)原子の位置の決定、(ii)原子に働く力の計算、(iii)原子の動きの計算、という(i)~(iii)の工程を計算機で繰り返し、時間の経過に伴って変化する物理量や立体構造を任意に抽出し、抽出したデータに基づいて統計処理や、立体構造の画像を表示するなどして、分子の構造、物性を解析する。
その後、平衡化の計算で得られた最終構造のセルサイズを用いてNVT計算又はNPT計算を実施することにより、安定なシミュレーションを継続して行うことができる。
また、上記の短い刻みの時間は、0.1fs(フェムト秒)以上10fs以下であることが好ましく、0.5fs以上2.0fs以下であることがより好ましい。なお、短い刻みの時間を「ステップ時間」又は「時間刻み幅」と称することがある。本発明では、特段の断りが無い限り、時間刻み幅は2.0fsとする。
ここで、ステップ時間での原子の位置の変化を繰り返し計算する際における繰り返し回数を「ループ回数」とすると、シミュレーション時間は、ステップ時間とループ回数の積で表される。本発明においては、例えば、ラマチャンドランプロットを作成するためのトラジェクトリを得る目的で行う計算(カノニカルMD)については、シミュレーション時間を100ns以上とすることが好ましいが、これに限定されるものではない。
本発明に用いることができる分子力場としては、特に制限なく、目的に応じて適宜選択することができ、例えば、Amber系の分子力場、CHARMm系の分子力場、OPLS系の分子力場などが挙げられる。Amber系の分子力場としては、例えば、Amber ff99SB-ILDN、Amber 12SBなどが挙げられる。CHARMm系の分子力場としては、例えば、CHARMm36などが挙げられる。
つまり、本発明においては、対象分子における多様な構造をサンプリングするためのマルチカノニカル法による分子動力学計算(マルチカノニカルMD;McMD)と、対象分子におけるラマチャンドランプロットの作成に用いるトラジェクトリを求めるため(βストランド構造を形成している比率を求めるため)の分子動力学計算(カノニカルMD)とを行うことが好ましい。
なお、McMD及びカノニカルMDについては、上記の<分子動力学計算の計算例>で説明した手法を、適宜目的に応じて用いることができるが、これに限られるものではない。
高温に設定したMDによりランダムな構造を複数作成し、作成したランダムな構造を初期構造として室温のMDを行う手法としては、対象分子が残基数の少ない(短い)ペプチドである場合は、例えば、700K程度に設定したMDにより当該ペプチドのランダムな構造を複数作成し、作成した複数の構造のそれぞれについて、300K程度の室温のMDを行うことにより、複数の安定な当該ペプチドの構造を作成してサンプリングすることができる。
McMDにおいては、上記の<分子動力学計算の計算例>で説明したように、training McMDとproductive McMDと行い、広いエネルギー領域をカバーする平らなエネルギー分布に基づいて、サンプリングのためのMDを行うことが好ましい。
このような手法としては、例えば、多数の立体構造をサンプリングするために行ったMD(例えば、McMD)の計算結果に対して、自由エネルギー解析を行うことにより、自由エネルギー的に安定な複数種類の構造を特定して選択することが好ましい。
対象分子についてのPMFを算出して自由エネルギーマップを作成する手法として、上記の<分子動力学計算の計算例>で説明した手法を、適宜目的に応じて用いることができるが、これに限られるものではない。
クラスタリングしたクラスターにおける代表構造を選択する手法としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、それぞれのクラスターにおいて平均構造に最も近い構造を選択する手法を用いることができる。
また、ラマチャンドランプロットの作成に用いるトラジェクトリを求めるための分子動力学計算における計算系のアンサンブルとしては、上記の<分子動力学計算の計算例>で説明したカノニカルアンサンブル(NVT;計算系の粒子数、体積、及び温度が一定の条件)に限られるものではなく、例えば、NPTアンサンブル(計算系の粒子数、圧力、及び温度が一定の条件)であってもよい。
なお、本発明においては、例えば、アルギニン残基の二面角φとψの値を、分子動力学計算により得られたトラジェクトリに基づいて、実際に多数の点としてプロットし、ラマチャンドランプロットを作成して出力することは必須ではなく、コンピュータ内の処理において、ラマチャンドランプロットを仮想して、ラマチャンドランプロットの所定の領域におけるアルギニン残基の存在比率を求めるようにしてもよい。
本発明では、ラマチャンドランプロットにおいて、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率に応じて、当該アルギニン残基のプロテアーゼ耐性を予測する。
ここで、上述したように、ラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域に含まれるアルギニン残基は、βストランド構造を形成していると考えることができる。このため、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率を求めることにより、アルギニン残基がβストランド構造を形成している比率(割合)を求めることができる。
さらに、βストランド構造を形成しているアルギニン残基は、他の特定の2次構造をとらないアルギニン残基と比べて安定な状態であるため、ラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域における存在比率が高いアルギニン残基は、プロテアーゼ耐性が高いと考えることができる。
つまり、本発明においては、アルギニン残基の存在比率が低い程、当該アルギニン残基のプロテアーゼ耐性が低いと予測することが好ましい。こうすることにより、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率に応じて、プロテアーゼ耐性の低いアルギニン残基を、より適切に特定することができる。このため、例えば、対象分子におけるプロテアーゼ耐性の低いアルギニン残基を化学修飾(例えば、N-メチル化)により保護する必要があるときに、化学修飾すべきアルギニン残基を、より正確に予測することができる。
こうすることにより、対象分子中における複数のアルギニン残基のそれぞれについて、プロテアーゼ耐性を比較することが可能となり、例えば、対象分子中で最もプロテアーゼ耐性が低い(プロテアーゼにより切断されやすい)アルギニン残基を特定することができる。このため、対象分子におけるプロテアーゼ耐性の低いアルギニン残基を化学修飾(例えば、N-メチル化)により保護する必要があるときに、プロテアーゼ耐性が最も低く、化学修飾する必要性が最も高いアルギニン残基を、より正確に予測することができる。
このため、「-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率」は、ラマチャンドランプロットにおけるプロットの数に基づいて算出することができる。なお、上記のアルギニン残基の存在比率の算出方法は、実際に作成したラマチャンドランプロットのプロット数に基づいて算出する方法に限られるわけではなく、例えば、コンピュータ内の処理において、ラマチャンドランプロットを仮想して、分子動力学計算のトラジェクトリのデータに基づいて、アルギニン残基の二面角φとψを直接計算し、-180°<φ<-30°、かつ、90°<ψ<180°、の条件を満たす立体構造の比率(割合)を求める方法を用いることもできる。
こうすることにより、例えば、対象分子を薬として用いる場合に重要となる、血中でのプロテアーゼ耐性、即ち血中での対象分子の安定性を予測することができ、創薬の場面でより好適に用いることができる。
上述したように、例えば、対象分子を薬として用いる場合には、プロテアーゼにより切断されやすいアルギニン残基を、化学修飾(例えば、N-メチル化)して保護することにより、血中プロテアーゼに対する耐性を向上させる場合がある。本発明では、アルギニン残基を有する対象分子における、アルギニン残基のプロテアーゼに対する耐性を予測できるため、化学修飾により保護すべきアルギニン残基を予測することができる。
このため、本発明を用いることにより、対象分子(例えば、ペプチド)に含まれるアルギニン残基に対するN-メチル化などの化学修飾を適切に行うことができ、プロテアーゼに対する耐性を向上させることができる。したがって、本発明を用いることにより、N-メチル化を行うための実験(処理)に必要となる時間を短くできると共に、実験に必要となるコストも抑制することができる。
その他の工程としては、特に制限はなく、目的に応じて適宜選択することができる。
本発明のプロテアーゼ耐性分子の合成方法は、本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法により、プロテアーゼ耐性が低いと予測されたアルギニン残基を化学修飾する工程を含む。
つまり、本発明のプロテアーゼ耐性分子の合成方法においては、アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率に応じて予測したプロテアーゼ耐性が低いアルギニン残基を化学修飾する。
N-メチル化とは、アミノ酸残基などにおけるNH基のH(水素)を、CH3(メチル)で置換する化学修飾を意味する。プロテアーゼ耐性が低いと予測されたアルギニン残基をN-メチル化して保護することにより、プロテアーゼ耐性(特に血中プロテアーゼ耐性)を向上させることができる。
こうすることにより、プロテアーゼ耐性がより低いアルギニン残基を選択的に化学修飾することができ、効果的に分子のプロテアーゼ耐性を向上させることができることに加え、化学修飾に必要となる時間を短くできると共に、必要となるコストも抑制することができる。
本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測装置は、アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率に応じて、当該アルギニン残基のプロテアーゼ耐性を予測する予測部を有する。
本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測装置は、例えば、上述した本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法を行う装置とすることができる。このため、対象分子中のアルギニン残基のプロテアーゼ耐性予測装置における好ましい形態は、上記の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法と同様とすることができる。
なお、対象分子中のアルギニン残基のプロテアーゼ耐性予測装置の具体的な構成例などについては後述する。
本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラムは、アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率に応じて、当該アルギニン残基のプロテアーゼ耐性を予測する処理をコンピュータに行わせる。
本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラムは、例えば、上記の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法をコンピュータにより実現させるためのプログラムとすることができる。言い換えると、本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラムをコンピュータにより実行することで、コンピュータを上記の対象分子中のアルギニン残基のプロテアーゼ耐性予測装置として機能させることができる。このため、本発明の実対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラムにおける好ましい形態は、上記の対象分子中のアルギニン残基のプロテアーゼ耐性予測装置及び対象分子中のアルギニン残基のプロテアーゼ耐性予測方法と同様とすることができる。
また、コンピュータから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータなど)に、本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラムを記録しておいてもよい。この場合、外部記憶領域に記録された本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラムを、必要に応じて、外部記憶領域から情報通信ネットワークを通じて、ハードディスクにインストールして使用することができる。
なお、本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラムは、複数の記憶媒体に、任意の処理毎に分割されて記録されていてもよい。
以下では、本発明のより具体的な実施形態について、図面を参照して説明する。
プロテアーゼ耐性予測装置100においては、例えば、制御部101、主記憶装置102、補助記憶装置103、I/Oインターフェイス104、通信インターフェイス105、入力装置106、出力装置107、表示装置108が、システムバス109を介して接続されている。
制御部101は、例えば、主記憶装置102などに読み込まれたプログラム(例えば、プロテアーゼ耐性予測プログラムなど)を実行することにより、種々の機能を実現する。
本発明のプロテアーゼ耐性予測装置における予測部が行う処理は、例えば、制御部101により行うことができる。
ROMは、例えば、BIOS(Basic Input/Output System)などの各種プログラムなどを記憶する。また、ROMとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、マスクROM、PROM(Programmable ROM)などが挙げられる。
RAMは、例えば、ROMや補助記憶装置103などに記憶された各種プログラムが、制御部101により実行される際に展開される作業範囲として機能する。RAMとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、DRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory)などが挙げられる。
また、本発明のプロテアーゼ耐性予測プログラムは、例えば、補助記憶装置103に格納され、主記憶装置102のRAM(主メモリ)にロードされ、制御部101により実行される。
入力装置106としては、プロテアーゼ耐性予測装置100に対する各種要求や情報の入力を受け付けることができれば特に制限はなく、適宜公知のものを用いることができ、例えば、キーボード、マウス、タッチパネル、マイクなどが挙げられる。また、入力装置106がタッチパネル(タッチディスプレイ)である場合は、入力装置106が表示装置108を兼ねることができる。
表示装置108としては、特に制限はなく、適宜公知のものを用いることができ、例えば、液晶ディスプレイ、有機ELディスプレイなどが挙げられる。
図10に示す例において、プロテアーゼ耐性予測装置100は、ラマチャンドランプロットにおけるアルギニン残基の存在比率に応じて、アルギニン残基のプロテアーゼ耐性を予測する処理を行う端末装置200と、当該アルギニン残基の存在確率を求めるための分子動力学計算(MDシミュレーション)を行うサーバーコンピュータ300とに分かれている。また、図10に示す例において、プロテアーゼ耐性予測装置100における端末装置200とサーバーコンピュータ300は、ネットワーク400により接続されている。
図10に示す例では、例えば、端末装置200としては、通常のパーソナルコンピュータを用いることができ、サーバーコンピュータ300としては、複数のコンピュータを接続したコンピュータクラスターや、スーパーコンピュータなどの大型で高性能のコンピュータを用いることができる。なお、サーバーコンピュータ300としては、クラウド上のコンピュータ群であってもよい。
また、端末装置200とサーバーコンピュータ300とを接続するネットワーク400としては、例えば、SSH(Secure Shell)などの通信規格を用いることができる。
次いで、サーバーコンピュータ300により、対象分子のラマチャンドランプロットを作成するための分子動力学計算を実行する。そして、分子動力学計算の結果のデータ(トラジェクトリのファイルなど)を、サーバーコンピュータ300から端末装置200にネットワーク400を介して送信する。
続いて、端末装置200により、受信した分子動力学計算の結果のデータに基づいて、ラマチャンドランプロットを作成し、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率を求めることで、当該アルギニン残基のプロテアーゼ耐性を予測する。
図11に示すように、プロテアーゼ耐性予測装置100は、通信機能部120と、入力機能部130と、出力機能部140と、表示機能部150と、記憶機能部160と、制御機能部170とを備える。
入力機能部130は、例えば、プロテアーゼ耐性予測装置100に対する各種指示を受け付ける。
出力機能部140は、例えば、作成したラマチャンドランプロット、アルギニン残基の存在比率の値、対象分子の立体構造などをプリントして出力する。
表示機能部150は、例えば、作成したラマチャンドランプロット、アルギニン残基の存在比率の値、対象分子の立体構造などをディスプレイに表示する。
記憶機能部160は、例えば、各種プログラム、分子動力学計算より得られたトラジェクトリなどを記憶する。
予測部171は、例えば、アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率に応じて、当該アルギニン残基のプロテアーゼ耐性を予測する処理を行う。
分子動力学計算部172は、例えば、ラマチャンドランプロットにおける、所定の領域でのアルギニン残基の存在確率を求めるための分子動力学計算(MDシミュレーション)を行う。
続いて、S102では、構築した計算系に対して、エネルギー極小化計算及び短時間の構造緩和計算を行うことにより、マルチカノニカルMD(McMD)の初期構造を作成する。言い換えると、S102においては、S101で構築した計算系に対して、分子力学計算によるエネルギー極小化計算を行って、不自然な構造の歪みを取り除いた後、溶媒の平衡化などのために、短時間の構造緩和計算(NVT計算及びNPT計算)を行い、McMDの初期構造を作成する。
そして、S104では、サンプリングした多数の立体構造について、PMFを算出することにより、自由エネルギーマップを作成する。言い換えると、S104においては、S103でサンプリングした多数の立体構造の全てについて、平均構造から座標変動の分散共分散行列を算出し、主成分解析を実施することによりPMFを算出して、自由エネルギーマップ(自由エネルギー曲面)を作成する。
続いて、S106では、クラスターごとに、平均構造に最も近い構造を選択して、クラスターの代表構造とする。言い換えると、S106においては、S105で分類した各クラスターについて、当該クラスターにおいて平均構造に最も近い構造を選択することで、各クラスターの代表構造を特定する。
そして、S108では、カノニカルMDのトラジェクトリのデータに基づいて、ラマチャンドランプロットを作成する。言い換えると、S108においては、S107で行ったカノニカルMDの計算結果としてのトラジェクトリ(原子の運動の軌跡)のデータに基づいて、各シミュレーション時間におけるアルギニン残基の二面角φとψを算出して、二次元にプロットすることにより、ラマチャンドランプロットを作成する。
続いて、S110では、求めた存在比率に応じて、アルギニン残基のプロテアーゼ耐性を予測すると、処理を終了させる。言い換えると、S110においては、S109で求めた、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率に応じて、当該アルギニン残基のプロテアーゼ耐性を予測すると、処理を終了させる。より具体的には、S110では、例えば、-180°<φ<-30°、かつ、90°<ψ<180°、の領域におけるアルギニン残基の存在比率が低い程、当該アルギニン残基のプロテアーゼ耐性が低いと予測すると、処理を終了させる。
これにより、本発明の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法は、アルギニン残基を有する対象分子における、アルギニン残基のプロテアーゼに対する耐性を予測できる。
<1> アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°<φ<-30°、かつ、90°<ψ<180°、の領域における前記アルギニン残基の存在比率に応じて、前記アルギニン残基のプロテアーゼ耐性を予測することを特徴とする対象分子中のアルギニン残基のプロテアーゼ耐性予測方法である。
<2> 前記アルギニン残基の存在比率が低い程、前記アルギニン残基のプロテアーゼ耐性が低いと予測する、前記<1>に記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法である。
<3> 前記対象分子がペプチドである、前記<1>から<2>のいずれかに記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法である。
<4> 前記対象分子における前記アルギニン残基の数が2以上である、前記<1>から<3>のいずれかに記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法である。
<5> 2以上の前記アルギニン残基の内の、ひとつのアルギニン残基の存在比率と、他のアルギニン残基の存在比率とを比較し、存在比率の値が小さい方のアルギニン残基が他方のアルギニン残基よりもプロテアーゼ耐性が低いと予測する、前記<4>に記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法である。
<6> 前記プロテアーゼ耐性が血中プロテアーゼ耐性である、前記<1>から<5>のいずれかに記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法である。
<7> アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°<φ<-30°、かつ、90°<ψ<180°、の領域における前記アルギニン残基の存在比率に応じて、前記アルギニン残基のプロテアーゼ耐性を予測する予測部を有することを特徴とする対象分子中のアルギニン残基のプロテアーゼ耐性予測装置である。
<8> アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°<φ<-30°、かつ、90°<ψ<180°、の領域における前記アルギニン残基の存在比率に応じて、前記アルギニン残基のプロテアーゼ耐性を予測する処理をコンピュータに行わせることを特徴とする対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラムである。
<9> 前記<1>から<6>のいずれかに記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法により、プロテアーゼ耐性が低いと予測された前記アルギニン残基を化学修飾する工程を含むことを特徴とするプロテアーゼ耐性分子の合成方法である。
<10> 2以上の前記アルギニン残基の内、プロテアーゼ耐性が他のアルギニン残基よりも低いと予測した前記アルギニン残基を化学修飾する、前記<9>に記載のプロテアーゼ耐性分子の合成方法である。
<11> 前記化学修飾がN-メチル化である、前記<9>から<10>のいずれかに記載のプロテアーゼ耐性分子の合成方法である。
200 端末装置
300 サーバーコンピュータ
171 予測部
Claims (11)
- アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域における前記アルギニン残基の存在比率に応じて、前記アルギニン残基のプロテアーゼ耐性を予測することを特徴とする対象分子中のアルギニン残基のプロテアーゼ耐性予測方法。
- 前記アルギニン残基の存在比率が低い程、前記アルギニン残基のプロテアーゼ耐性が低いと予測する、請求項1に記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法。
- 前記対象分子がペプチドである、請求項1から2のいずれかに記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法。
- 前記対象分子における前記アルギニン残基の数が2以上である、請求項1から3のいずれかに記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法。
- 2以上の前記アルギニン残基の内の、ひとつのアルギニン残基の存在比率と、他のアルギニン残基の存在比率とを比較し、存在比率の値が小さい方のアルギニン残基が他方のアルギニン残基よりもプロテアーゼ耐性が低いと予測する、請求項4に記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法。
- 前記プロテアーゼ耐性が血中プロテアーゼ耐性である、請求項1から5のいずれかに記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法。
- アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域における前記アルギニン残基の存在比率に応じて、前記アルギニン残基のプロテアーゼ耐性を予測する予測部を有することを特徴とする対象分子中のアルギニン残基のプロテアーゼ耐性予測装置。
- アルギニン残基を有する対象分子の主鎖における二面角のラマチャンドランプロットにおいて、-180°≦φ≦-30°、かつ、90°≦ψ≦180°、の領域における前記アルギニン残基の存在比率に応じて、前記アルギニン残基のプロテアーゼ耐性を予測する処理をコンピュータに行わせることを特徴とする対象分子中のアルギニン残基のプロテアーゼ耐性予測プログラム。
- 請求項1から6のいずれかに記載の対象分子中のアルギニン残基のプロテアーゼ耐性予測方法により、プロテアーゼ耐性が低いと予測された前記アルギニン残基を、化学修飾する工程を含むことを特徴とするプロテアーゼ耐性分子の合成方法。
- 2以上の前記アルギニン残基の内、プロテアーゼ耐性が他のアルギニン残基よりも低いと予測した前記アルギニン残基を化学修飾する、請求項9に記載のプロテアーゼ耐性分子の合成方法。
- 前記化学修飾がN-メチル化である、請求項9から10のいずれかに記載のプロテアーゼ耐性分子の合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020063929A JP7422591B2 (ja) | 2020-03-31 | 2020-03-31 | 対象分子中のアルギニン残基のプロテアーゼ耐性予測方法、及びこれを用いたプロテアーゼ耐性分子の合成方法、並びに、対象分子中のアルギニン残基の、プロテアーゼ耐性予測装置及びプロテアーゼ耐性予測プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020063929A JP7422591B2 (ja) | 2020-03-31 | 2020-03-31 | 対象分子中のアルギニン残基のプロテアーゼ耐性予測方法、及びこれを用いたプロテアーゼ耐性分子の合成方法、並びに、対象分子中のアルギニン残基の、プロテアーゼ耐性予測装置及びプロテアーゼ耐性予測プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021158986A JP2021158986A (ja) | 2021-10-11 |
JP7422591B2 true JP7422591B2 (ja) | 2024-01-26 |
Family
ID=78001504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020063929A Active JP7422591B2 (ja) | 2020-03-31 | 2020-03-31 | 対象分子中のアルギニン残基のプロテアーゼ耐性予測方法、及びこれを用いたプロテアーゼ耐性分子の合成方法、並びに、対象分子中のアルギニン残基の、プロテアーゼ耐性予測装置及びプロテアーゼ耐性予測プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7422591B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010522368A (ja) | 2007-03-13 | 2010-07-01 | サノフィ−アベンティス | ペプチドライブラリを製造するための方法およびその使用 |
JP6266810B2 (ja) | 2014-12-12 | 2018-01-24 | 日立オートモティブシステムズ株式会社 | 内燃機関のバルブタイミング制御装置 |
-
2020
- 2020-03-31 JP JP2020063929A patent/JP7422591B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010522368A (ja) | 2007-03-13 | 2010-07-01 | サノフィ−アベンティス | ペプチドライブラリを製造するための方法およびその使用 |
JP6266810B2 (ja) | 2014-12-12 | 2018-01-24 | 日立オートモティブシステムズ株式会社 | 内燃機関のバルブタイミング制御装置 |
Non-Patent Citations (3)
Title |
---|
LEE, WL et al.,Organization and ligand binding properties of the tail of Acanthamoeba myosin-IA: Identification of an actin-binding site in the basic (tail homology-1) domain,J Biol Chem,274(49),1999年12月03日,pp.35159-35171 |
SARAVANAN, KM and KRISHNASWAMY, S ,Analysis of dihedral angle preferences for alanine and glycine residues in alpha and beta transmembrane regions ,J Biomol Struct Dyn,33(3),2015年,pp.552-562 |
TAKAYAMA, K et al.,Discovery of potent hexapeptide agonists to human neuromedian u receptor 1 and identification of their serum metabolites,ACS Med Chem Lett,6(3),2015年01月28日,pp.302-307 |
Also Published As
Publication number | Publication date |
---|---|
JP2021158986A (ja) | 2021-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lee et al. | Ab initio protein structure prediction | |
Blaszczyk et al. | Modeling of protein–peptide interactions using the CABS-dock web server for binding site search and flexible docking | |
Zagrovic et al. | β-hairpin folding simulations in atomistic detail using an implicit solvent model | |
Simonson | Macromolecular electrostatics: continuum models and their growing pains | |
Wiltgen | Algorithms for structure comparison and analysis: Homology modelling of proteins | |
Walsh | Pathways to structure–property relationships of peptide–materials interfaces: Challenges in predicting molecular structures | |
Best et al. | Optimization of the additive CHARMM all-atom protein force field targeting improved sampling of the backbone ϕ, ψ and side-chain χ1 and χ2 dihedral angles | |
Mucs et al. | The application of quantum mechanics in structure-based drug design | |
Huang et al. | Statistical mechanics‐based method to extract atomic distance‐dependent potentials from protein structures | |
Hassan et al. | Molecular dynamics simulations of peptides and proteins with a continuum electrostatic model based on screened Coulomb potentials | |
King et al. | Structure‐based prediction of protein–peptide specificity in rosetta | |
JP2002536301A (ja) | タンパク質モデリングツール | |
Dodd et al. | Simulation-based methods for model building and refinement in cryoelectron microscopy | |
Li | Conformational sampling in template-free protein loop structure modeling: An overview | |
Geist et al. | Replica-based protein structure sampling methods II: advanced hybrid solvent TIGER2hs | |
Reif et al. | Improving the potential of mean force and nonequilibrium pulling simulations by simultaneous alchemical modifications | |
Suresh et al. | Ligand-induced stabilization of a duplex-like architecture is crucial for the switching mechanism of the SAM-III riboswitch | |
JP7422591B2 (ja) | 対象分子中のアルギニン残基のプロテアーゼ耐性予測方法、及びこれを用いたプロテアーゼ耐性分子の合成方法、並びに、対象分子中のアルギニン残基の、プロテアーゼ耐性予測装置及びプロテアーゼ耐性予測プログラム | |
JP2003524831A (ja) | 組み合わせ空間を探索するためのシステムおよび方法 | |
JP2006252485A (ja) | リガンド探索装置、リガンド探索方法、プログラム、および記録媒体 | |
Jones et al. | Computational analysis of the soluble form of the intracellular chloride ion channel protein CLIC1 | |
Profantova et al. | Protonation effect of tyrosine in a segment of the SRF transcription factor: a combined optical spectroscopy, molecular dynamics, and density functional theory calculation study | |
Jani et al. | Protein analysis: from sequence to structure | |
Blaszczyk et al. | Protein structure prediction using coarse-grained models | |
Redkar et al. | Modeling and simulation of peptides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20220523 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230127 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231227 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7422591 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |