JP4612270B2 - Design method of bioactive peptide and use thereof - Google Patents

Design method of bioactive peptide and use thereof Download PDF

Info

Publication number
JP4612270B2
JP4612270B2 JP2002258305A JP2002258305A JP4612270B2 JP 4612270 B2 JP4612270 B2 JP 4612270B2 JP 2002258305 A JP2002258305 A JP 2002258305A JP 2002258305 A JP2002258305 A JP 2002258305A JP 4612270 B2 JP4612270 B2 JP 4612270B2
Authority
JP
Japan
Prior art keywords
amino acid
acid sequence
complementary
target
intermolecular energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002258305A
Other languages
Japanese (ja)
Other versions
JP2004081178A (en
Inventor
靖一 田沼
篤史 吉森
Original Assignee
靖一 田沼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 靖一 田沼 filed Critical 靖一 田沼
Priority to JP2002258305A priority Critical patent/JP4612270B2/en
Priority to EP03794196A priority patent/EP1553177A4/en
Priority to CA002497477A priority patent/CA2497477A1/en
Priority to PCT/JP2003/011237 priority patent/WO2004022737A1/en
Priority to AU2003261900A priority patent/AU2003261900A1/en
Priority to US10/526,406 priority patent/US7660677B2/en
Publication of JP2004081178A publication Critical patent/JP2004081178A/en
Application granted granted Critical
Publication of JP4612270B2 publication Critical patent/JP4612270B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、有益なペプチド性医薬品の開発法に関する。特に、本発明は、あるタンパク質上の任意の連続するアミノ酸配列及び不連続なアミノ酸配列からなる標的部位に対して結合しうる生理活性ペプチドを設計する方法、そのための装置、前記方法を具体的にコンピュータに実行させるためのプログラム、及び該プログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
生体内に張り巡らされた細胞外情報伝達系(神経系、内分泌系、免疫系)から発せられる様々な生体シグナル(神経伝達物質、ホルモン、サイトカイン)は、標的細胞において細胞内情報伝達系により受容・伝達され、適正な応答がなされる。ここで生体シグナルの多くは、タンパク質間の相互作用により伝達される。例えば、細胞表面の受容体とその特異的リガンドの結合、さらに細胞内の細胞質から核へのシグナル伝達にも様々なタンパク質間相互作用が関与している。従って、細胞内情報伝達系の変調や異常は、多くの重篤な疾患の発症に密接に関わっている。そこで、タンパク質間相互作用を標的として、そこを制御(促進又は抑制)し得る分子を創製することが急務となっている。現在、リガンド−受容体などのタンパク質間相互作用を解明する手段として、またシグナルカスケードの異常に起因する疾患の治療手段として、標的タンパク質と相互作用し得る生理活性ペプチドの研究開発が盛んに行なわれている。
【0003】
生理活性ペプチドは、生体内の情報伝達物質として様々な生理機能の制御に重要な役割を担っている。しかしながら、天然において、生理活性ペプチドは微量にしか存在せず、精製が非常に困難であるため、これまで100種も見出されていない。一方、ゲノムデータベースの蓄積により、生理活性ペプチド受容体と考えられるオーファン受容体が相当数存在することが推測されており、そのリガンドの探索は、新薬開発の重要な鍵となっている。現在臨床応用されているペプチド性医薬品、及び開発が実施されている医薬品の例としては、1)視床下部ホルモン誘導体、2)下垂体後葉ホルモン誘導体、3)ANP誘導体、4)カルシウム調節ホルモン、5)ペプチド性抗生物質などがある。また最近、新規な生理活性ペプチドがオーファン受容体を発現させた細胞を使用して発見されている。この手法を用いて、武田薬品工業はガン転移を抑制するオーファン受容体のペプチド性リガンド「メタスチン」を発見した[参考文献1]。今後さらに生理活性ペプチドの探索が進められ有益なペプチド性医薬品が開発されるものと期待される。
【0004】
しかしながら、タンパク質の任意のアミノ酸配列と結合して相互作用し得るペプチドのアミノ酸配列を予測する有効な方法論は、現在のところ確立されておらず、通常は生化学的な手法により生理活性ペプチドがスクリーニングされている。例えば、あるタンパク質と結合するとわかっている別のタンパク質から、N末端よりC末端までの10〜20個のアミノ酸からなる連続する複数のペプチドを合成し、その中から生理活性ペプチドを選別することや、またはファージライブラリーを用い、randomized peptide libraryより生理活性ペプチドを選別するといった手法が用いられている。しかし、このような生化学的な方法は、費用および時間がかかるという問題があった。そこで、従来の手法ではなく、理論的かつより経済的で簡便に生理活性ペプチドを設計する手法の開発が待たれていた。
【0005】
一方、標的アミノ酸配列に対する生理活性ペプチド配列を予測する理論が、現在までにいくつか提唱されている。ワトソン−クリックは、DNAラセンモデルを発表するとともに、塩基ペアは存在するが、アミノ酸ペアは存在しないと主張したが、アミノ酸ペアは存在するかもしれないという少数意見は、もともと存在していた(例えば、非特許文献1参照)。
【0006】
Blalockらが提唱したセンス−アンチセンス理論(例えば、非特許文献2参照)も、アミノ酸ペアを前提としたもので、その内容は、相補的な2つのDNAがコードする2つのペプチドは、塩基同様、相互作用するという仮説である。この理論に基づき、いくつかのアンチセンスペプチドがセンスペプチドと相互作用することが実験的に確認されている。
【0007】
一方、センスペプチドとアンチセンスペプチドは<疎水度的相補性>が高いというB1alockらによる指摘を受け、Fassinaらは、あるペプチドの中で連続する5以上の奇数個のアミノ酸の平均疎水度に対して相補的な(絶対値が同じで正負が逆の)疎水度をもつような相補ペプチドがもとのペプチドと結合することをいくつかの実験において示した(例えば、非特許文献3参照)。しかしながら、いずれの理論においても数多くの失敗例が報告されており、一般的な生理活性ペプチドの予測への適用には十分とは云えない。また、いずれの理論においても、標的アミノ酸配列の1つのアミノ酸に対して、複数のアミノ酸の候補が考えられるため、結果的に予測されるペプチドの候補は膨大な数にのぼり、それらの全てについて検討することはやはり膨大な時間、費用、労力を有する。
【0008】
また、標的アミノ酸配列に対して相互作用するアミノ酸配列からなる生理活性ペプチドを得ることに仮に成功したとしても、さらなる問題が存在する。創薬のターゲットとなるタンパク質標的部位としては、リガンド結合部位(例えば、受容体の場合)、基質結合部位(例えば、酵素の場合)、タンパク質間相互作用部位(例えば、転写因子、多量体(例えば、二量体)形成タンパク質の場合)等が挙げられるが、これらの標的部位は、1つの連続したアミノ酸配列から構成される場合よりも、むしろ1次構造上では離れて局在している複数の部分アミノ酸配列から構成される場合が非常に多い。従って、標的アミノ酸配列に対して相互作用するアミノ酸配列からなる生理活性ペプチドが得られたとしても、その標的部位に存在する他のアミノ酸配列にとって、そのアミノ酸配列は好ましいものではないことも多い。
【0009】
また、標的タンパク質の標的部位が、1次構造上では離れて局在している複数の部分アミノ酸配列から構成される場合には、従来、標的タンパク質の標的部位に対して特定のペプチドが相互作用するか否かは、例えば、分子モデリングを用いてドッキングさせ、エネルギー的に評価することによって行なわれていた。このような手法によってより多くのペプチドを評価するためには、現実的には、例えば、数千〜数十万の低分子を含むライブラリを用いたドッキングにおいて、1化合物当たりの評価時間はせいぜい1分程度に抑えなければならない。しかしながら4残基でさえペプチドの可変部位は側鎖のみでも最大20と多いため、例えば、AutoDock(例えば、非特許文献4参照)を利用したFlexible Dockingでは、Compac Alpha DS20E上での評価時間は、1ペプチド当たり約10分必要であった。例えば、3残基ペプチドの場合は203、すなわち8000回、6残基ペプチドの場合においては、64,000,000回のドッキングを実施する必要があり、網羅的スクリーニングは現実的には極めて困難である。
【0010】
以上の理由により、あるタンパク質の標的部位に対して優れた結合能を有し、かつ迅速な生理活性ペプチドの設計手法の開発が切望されていた。
【0011】
【非特許文献1】
「ジャーナル・オブ・セオレティカル・バイオロジー(Journal of theoretical Biology)」,1982年,94巻,p885−894
【非特許文献2】
「バイオケミカル・バイオフィジカル・リサーチ・コミュニケーション(Biochemical Biophysical Research Communication)」,1984年,121巻,p203−207
【非特許文献3】
「アーカイブズ・オブ・バイオケミストリ・アンド・バイオフィジクス(Archives of Biochemistry and Biophysics)」,1992年,296巻,p137−143
【非特許文献4】
「ジャーナル・オブ・コンピューテーショナル・ケミストリ(Journal of Computational Chemistry)」,1998年,19巻,p1639−1662
【0012】
【発明が解決しようとする課題】
本発明の目的は、標的アミノ酸配列の一次構造から、数学的手法によって従来よりも高い確実性をもって生理活性ペプチドを設計する手段を提供することである。本発明のさらなる目的は、標的アミノ酸配列のみならず、その標的アミノ酸配列を含む標的タンパク質自体をも考慮して好ましい生理活性ペプチドを設計する手段を提供することである。
【0013】
【課題を解決するための手段】
本発明者らは、上記目的を達成するため鋭意研究を行なった結果、標的アミノ酸配列に任意のアミノ酸指標、例えば、疎水度及び電気的特性に基づく指標等を当てはめて作成したプロファイル波形に対し、以下に詳述する相補性定義を満たす相補アミノ酸配列を順位付けして抽出することができる新規プログラムを独自に開発することに成功した。また、本発明者らは、標的タンパク質の標的部位が、1次構造上で離れて局在している複数の部分アミノ酸配列から構成される場合に、この標的部位に相互作用するアミノ酸配列の設計において特に有用である新規プログラムを独自に開発することにも成功した。
【0014】
本発明者らはさらに、標的アミノ酸配列を含む標的タンパク質自体に対して、上記で抽出した相補アミノ酸配列が好ましい生理活性ペプチドとして作用し得るか否かを予測できる方法、プログラム、コンピュータ読み取り可能な記録媒体及び装置を独自に開発し、本発明を完成するに至った。
【0015】
即ち、本発明は、以下の特徴を有するものである。
(1)標的アミノ酸配列と相互作用し得る生理活性ペプチドを設計する方法であって、
(a1)標的アミノ酸配列の配列データ入力を受け付けるステップと、
(b1)1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を1以上の移動平均プロファイル波形に変換するステップと、
(c1)標的アミノ酸配列の相補アミノ酸配列候補を生成して、ステップ(b1)と同一の1以上のアミノ酸指標を使用して1以上の相補移動平均プロファイル波形に変換するステップと、
(d1)同一のアミノ酸指標に由来する相補度パラメータを、該標的アミノ酸配列に対する1以上の移動平均プロファイル波形と相補アミノ酸配列候補の1以上の相補移動平均プロファイル波形との間でそれぞれ計算するステップと、
(e1)相補アミノ酸配列候補を、該相補度パラメータととともに記憶手段に記憶するステップと、
(f1)ステップ(e1)によって記憶された情報に基づいて、所定の数の相補アミノ酸配列を抽出するステップと、
(g1)抽出された相補アミノ酸配列を、生理活性ペプチドの候補として表示するステップとを包含する、方法。
【0016】
(2)該相補度パラメータが、該標的アミノ酸配列に対する移動平均プロファイル波形と相補アミノ酸配列候補の相補移動平均プロファイル波形との間の相関係数である、上記(1)の方法。
【0017】
(3)該アミノ酸指標が、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、及び側鎖体積の相対的な大きさを表す指標から選ばれる1以上の指標である、上記(1)または(2)の方法。
【0018】
(4)1以上の所定のアミノ酸指標を使用してステップ(a1)〜(f1)で抽出された所定の数の相補アミノ酸配列に対して、1以上の別のアミノ酸指標を使用してステップ(b1)〜(f1)を行なうということを1回以上繰り返すことにより、生理活性ペプチドとして抽出される相補アミノ酸配列候補をさらに絞り込むことを特徴とする、上記(1)〜(3)のいずれかに記載の方法。
【0019】
(5)標的タンパク質と相互作用し得る生理活性ペプチドを設計する方法であって、
(a1’)標的タンパク質中の標的アミノ酸配列の配列データ入力を受け付けるステップと、
(b1’)1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を1以上の移動平均プロファイル波形に変換するステップと、
(c1’)標的アミノ酸配列の相補アミノ酸配列候補を生成して、ステップ(b1’)と同一の1以上のアミノ酸指標を使用して1以上の相補移動平均プロファイル波形に変換するステップと、
(d1’)同一のアミノ酸指標に由来する相補度パラメータを、該標的アミノ酸配列に対する1以上の移動平均プロファイル波形と相補アミノ酸配列候補の1以上の相補移動平均プロファイル波形との間でそれぞれ計算するステップと、
(e1’)相補アミノ酸配列候補を、該相補度パラメータととともに記憶手段に記憶するステップと、
(f1’)ステップ(e1’)によって記憶された情報に基づいて、所定の数の相補アミノ酸配列候補を抽出するステップと、
(g1’)抽出された相補アミノ酸配列候補について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(h1’)相補アミノ酸配列候補を、該分子間エネルギーパラメータとともに記憶手段に記憶するステップと、
(i1’)ステップ(h1’)によって記憶された情報に基づいて、所定の数の相補アミノ酸配列を抽出するステップと、
(j1’)抽出された相補アミノ酸配列を、生理活性ペプチドの候補として表示するステップとを包含する、方法。
【0020】
(6)該相補度パラメータが、該標的アミノ酸配列に対する移動平均プロファイル波形と相補アミノ酸配列候補の相補移動平均プロファイル波形との間の相関係数である、上記(5)の方法。
【0021】
(7)該アミノ酸指標が、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、及び側鎖体積の相対的な大きさを表す指標から選ばれる1以上の指標である、上記(5)または(6)の方法。
【0022】
(8)1以上の所定のアミノ酸指標を使用してステップ(a1’)〜(f1’)で抽出された所定の数の相補アミノ酸配列候補に対して、1以上の別のアミノ酸指標を使用してステップ(b1’)〜(f1’)を行なうということを1回以上繰り返すことによって相補アミノ酸配列候補を絞り込んだ後に、ステップ(g1’)〜(i1’)を行なうことを特徴とする、上記(5)〜(7)のいずれかに記載の方法。
【0023】
(9)標的アミノ酸配列と相互作用し得る生理活性ペプチドを設計するためのプログラムであって、
(a1)標的アミノ酸配列の配列データ入力を受け付けるステップと、
(b1)1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を1以上の移動平均プロファイル波形に変換するステップと、
(c1)標的アミノ酸配列の相補アミノ酸配列候補を生成して、ステップ(b1)と同一の1以上のアミノ酸指標を使用して1以上の相補移動平均プロファイル波形に変換するステップと、
(d1)同一のアミノ酸指標に由来する相補度パラメータを、該標的アミノ酸配列に対する1以上の移動平均プロファイル波形と相補アミノ酸配列候補の1以上の相補移動平均プロファイル波形との間でそれぞれ計算するステップと、
(e1)相補アミノ酸配列候補を、該相補度パラメータととともに記憶手段に記憶するステップと、
(f1)ステップ(e1)によって記憶された情報に基づいて、所定の数の相補アミノ酸配列を抽出するステップと、
(g1)抽出された相補アミノ酸配列を、生理活性ペプチドの候補として表示するステップとを、コンピュータに実行させるためのプログラム。
【0024】
(10)該相補度パラメータが、該標的アミノ酸配列に対する移動平均プロファイル波形と相補アミノ酸配列候補の相補移動平均プロファイル波形との間の相関係数である、上記(9)のプログラム。
【0025】
(11)該アミノ酸指標が、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、及び側鎖体積の相対的な大きさを表す指標から選ばれる1以上の指標である、上記(9)または(10)のプログラム。
【0026】
(12)1以上の所定のアミノ酸指標を使用してステップ(a1)〜(f1)で抽出された所定の数の相補アミノ酸配列に対して、1以上の別のアミノ酸指標を使用してステップ(b1)〜(f1)を行なうということを1回以上繰り返すことにより、生理活性ペプチドとして抽出される相補アミノ酸配列候補をさらに絞り込むことを特徴とする、上記(9)〜(11)のいずれかに記載のプログラム。
【0027】
(13)標的タンパク質と相互作用し得る生理活性ペプチドを設計するためのプログラムであって、
(a1’)標的タンパク質中の標的アミノ酸配列の配列データ入力を受け付けるステップと、
(b1’)1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を1以上の移動平均プロファイル波形に変換するステップと、
(c1’)標的アミノ酸配列の相補アミノ酸配列候補を生成して、ステップ(b1’)と同一の1以上のアミノ酸指標を使用して1以上の相補移動平均プロファイル波形に変換するステップと、
(d1’)同一のアミノ酸指標に由来する相補度パラメータを、該標的アミノ酸配列に対する1以上の移動平均プロファイル波形と相補アミノ酸配列候補の1以上の相補移動平均プロファイル波形との間でそれぞれ計算するステップと、
(e1’)相補アミノ酸配列候補を、該相補度パラメータととともに記憶手段に記憶するステップと、
(f1’)ステップ(e1’)によって記憶された情報に基づいて、所定の数の相補アミノ酸配列候補を抽出するステップと、
(g1’)抽出された相補アミノ酸配列候補について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(h1’)相補アミノ酸配列候補を、該分子間エネルギーパラメータとともに記憶手段に記憶するステップと、
(i1’)ステップ(h1’)によって記憶された情報に基づいて、所定の数の相補アミノ酸配列を抽出するステップと、
(j1’)抽出された相補アミノ酸配列を、生理活性ペプチドの候補として表示するステップとを、コンピュータに実行させるためのプログラム。
【0028】
(14)該相補度パラメータが、該標的アミノ酸配列に対する移動平均プロファイル波形と相補アミノ酸配列候補の相補移動平均プロファイル波形との間の相関係数である、上記(13)のプログラム。
【0029】
(15)該アミノ酸指標が、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、及び側鎖体積の相対的な大きさを表す指標から選ばれる1以上の指標である、上記(13)または(14)のプログラム。
【0030】
(16)1以上の所定のアミノ酸指標を使用してステップ(a1’)〜(f1’)で抽出された所定の数の相補アミノ酸配列候補に対して、1以上の別のアミノ酸指標を使用してステップ(b1’)〜(f1’)を行なうということを1回以上繰り返すことによって相補アミノ酸配列候補を絞り込んだ後に、ステップ(g1’)〜(i1’)を行なうことを特徴とする、上記(13)〜(15)のいずれかに記載のプログラム。
【0031】
(17)上記(9)〜(16)のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0032】
(18)標的アミノ酸配列と相互作用し得る生理活性ペプチドを設計するための装置であって、(イ)データ入力部と、(ロ)データ編集部と、(ハ)相補アミノ酸配列候補生成部と、(ニ)相補度計算部と、(ホ)相補アミノ酸配列候補記憶部と、(ヘ)相補アミノ酸配列探索部と、(ト)相補アミノ酸配列表示部とを備え、
該データ入力部は、(a1)標的アミノ酸配列の配列データ入力を受け付ける手段を含み、
該データ編集部は、(b1)1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を1以上の移動平均プロファイル波形に変換する手段を含み、
該相補アミノ酸配列候補生成部は、(c1)標的アミノ酸配列の相補アミノ酸配列候補を生成して、ステップ(b1)と同一の1以上のアミノ酸指標を使用して1以上の相補移動平均プロファイル波形に変換する手段を含み、
該相補度計算部は、(d1)同一のアミノ酸指標に由来する相補度パラメータを、該標的アミノ酸配列に対する1以上の移動平均プロファイル波形と相補アミノ酸配列候補の1以上の相補移動平均プロファイル波形との間でそれぞれ計算する手段を含み、
該相補アミノ酸配列候補記憶部は、(e1)相補アミノ酸配列候補を、該相補度パラメータととともに記憶する手段を含み、
該相補アミノ酸配列探索部は、(f1)手段(e1)で記憶された情報に基づいて、所定の数の相補アミノ酸配列を抽出する手段を含み、
該相補アミノ酸配列表示部は、(g1)手段(f1)で抽出された相補アミノ酸配列を、生理活性ペプチドの候補として表示する手段を含む、装置。
【0033】
(19)該相補度パラメータが、該標的アミノ酸配列に対する移動平均プロファイル波形と相補アミノ酸配列候補の相補移動平均プロファイル波形との間の相関係数である、上記(18)の装置。
【0034】
(20)該アミノ酸指標が、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、及び側鎖体積の相対的な大きさを表す指標から選ばれる1以上の指標である、上記(18)または(19)の装置。
【0035】
(21)標的タンパク質と相互作用し得る生理活性ペプチドを設計するための装置であって、(イ)データ入力部と、(ロ)データ編集部と、(ハ)相補アミノ酸配列候補生成部と、(ニ)相補度計算部と、(ホ)相補アミノ酸配列候補記憶部と、(ヘ)相補アミノ酸配列探索部と、(ト)相補アミノ酸配列表示部とを備え、
該データ入力部は、(a1’)標的タンパク質中の標的アミノ酸配列の配列データ入力を受け付ける手段を含み、
該データ編集部は、(b1’)1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を1以上の移動平均プロファイル波形に変換する手段を含み、
該相補アミノ酸配列候補生成部は、(c1’)標的アミノ酸配列の相補アミノ酸配列候補を生成して、手段(b1’)と同一の1以上のアミノ酸指標を使用して1以上の相補移動平均プロファイル波形に変換する手段を含み、
該相補度計算部は、(k1’)同一のアミノ酸指標に由来する相補度パラメータを、該標的アミノ酸配列に対する1以上の移動平均プロファイル波形と相補アミノ酸配列候補の1以上の相補移動平均プロファイル波形との間でそれぞれ計算し、さらに標的タンパク質の標的部位との分子間エネルギーパラメータを計算する手段を含み、
該相補アミノ酸配列候補記憶部は、(l1’)相補アミノ酸配列候補を、該相補度パラメータおよび該分子間エネルギーパラメータとともに記憶する手段を含み、
該相補アミノ酸配列探索部は、(m1’)手段(k1’)によって記憶された情報に基づいて、所定の数の相補アミノ酸配列を抽出する手段を含み、
該相補アミノ酸配列表示部は、(n1’)該相補アミノ酸配列探索部によって抽出された相補アミノ酸配列を、生理活性ペプチドの候補として表示する手段を含む、装置。
【0036】
(22)該相補度パラメータが、該標的アミノ酸配列に対する移動平均プロファイル波形と相補アミノ酸配列候補の相補移動平均プロファイル波形との間の相関係数である、上記(21)の装置。
【0037】
(23)該アミノ酸指標が、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、及び側鎖体積の相対的な大きさを表す指標から選ばれる1以上の指標である、上記(21)または(22)の装置。
【0038】
(24)さらに、ステップ(i1’)とステップ(j1’)との間において、
(I)ステップ(i1’)で抽出されたアミノ酸配列に対しアミノ酸変異を導入したアミノ酸配列を生成するステップと、
(II)ステップ(I)で生成されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(III)ステップ(i1’)で抽出されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを対照として、ステップ(II)で計算された分子間エネルギーパラメータを比較し、対照の分子間エネルギーパラメータよりも安定な分子間エネルギーパラメータを有するアミノ酸配列を抽出するステップとを含む、上記(13)〜(16)のいずれかのプログラム。
【0039】
(25)標的タンパク質と相互作用し得る生理活性ペプチドを設計するためのプログラムであって、
(a2)標的タンパク質の標的部位と相互作用するタンパク質中の相互作用領域を特定するステップと、
(b2)該相互作用領域から任意の長さのアミノ酸配列を抽出するステップとを、コンピュータに実行させるためのプログラム。
【0040】
(26)標的タンパク質と相互作用し得る生理活性ペプチドを設計するためのプログラムであって、
(a2’)標的タンパク質の標的部位と相互作用するタンパク質中の相互作用領域を特定するステップと、
(b2’)該相互作用領域から任意の長さのアミノ酸配列を抽出するステップと、
(c2’)抽出されたアミノ酸配列について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(d2’)該アミノ酸配列を、該分子間エネルギーパラメータとともに記憶手段に記憶するステップと、
(e2’)ステップ(d2’)によって記憶された情報に基づいて、所定の数のアミノ酸配列を抽出するステップと、
(f2’)抽出されたアミノ酸配列を、生理活性ペプチドの候補として表示するステップとを、コンピュータに実行させるためのプログラム。
【0041】
(27)さらに、ステップ(e2’)とステップ(f2’)との間において、
(I)ステップ(e2’)で抽出されたアミノ酸配列に対しアミノ酸変異を導入したアミノ酸配列を生成するステップと、
(II)ステップ(I)で生成されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(III)ステップ(e2’)で抽出されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを対照として、ステップ(II)で計算された分子間エネルギーパラメータを比較し、対照の分子間エネルギーパラメータよりも安定な分子間エネルギーパラメータを有するアミノ酸配列を抽出するステップとを含む、上記(26)のプログラム。
【0042】
(28)標的タンパク質と相互作用し得る生理活性ペプチドを設計するためのプログラムであって、
(a3)一定の長さのアミノ酸配列を網羅的に生成し、その中からランダムにアミノ酸配列を選択して解析用ライブラリとして抽出するステップと、
(b3)解析用ライブラリとして抽出された各アミノ酸配列について分子間エネルギーパラメータを計算するステップと、
(c3)ステップ(b3)で計算された分子間エネルギーパラメータを用いて、アミノ酸出現頻度に基づくスコアマトリクスを生成するステップと、
(d3)アミノ酸出現頻度に基づくスコアマトリクスを用いて、アミノ酸出現頻度に基づくスコアを計算するステップと、
(e3)ステップ(b3)で計算された分子間エネルギーパラメータと該スコアとの間で相関解析を行い、回帰式を得るステップと、
(f3)該回帰式を用いて、アミノ酸出現頻度に基づくスコアマトリクスを、アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスに変換するステップと、
(g3)アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスから、アミノ酸位置依存的な分子間エネルギーパラメータ値を計算するステップと、
(h3)所定のアミノ酸位置依存的な分子間エネルギーパラメータ値以下のアミノ酸配列を抽出するステップとを、コンピュータに実行させるためのプログラム。
【0043】
(29)標的タンパク質と相互作用し得る生理活性ペプチドを設計するためのプログラムであって、
(a3’)一定の長さのアミノ酸配列を網羅的に生成し、その中からランダムにアミノ酸配列を選択して解析用ライブラリとして抽出するステップと、
(b3’)解析用ライブラリとして抽出された各アミノ酸配列について分子間エネルギーパラメータを計算するステップと、
(c3’)ステップ(b3’)で計算された分子間エネルギーパラメータを用いて、アミノ酸出現頻度に基づくスコアマトリクスを生成するステップと、
(d3’)アミノ酸出現頻度に基づくスコアマトリクスを用いて、アミノ酸出現頻度に基づくスコアを計算するステップと、
(e3’)ステップ(b3’)で計算された分子間エネルギーパラメータと該スコアとの間で相関解析を行い、回帰式を得るステップと、
(f3’)該回帰式を用いて、アミノ酸出現頻度に基づくスコアマトリクスを、アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスに変換するステップと、
(g3’)アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスから、アミノ酸位置依存的な分子間エネルギーパラメータ値を計算するステップと、
(h3’)所定のアミノ酸位置依存的な分子間エネルギーパラメータ値以下のアミノ酸配列を抽出するステップと、
(i3’)抽出されたアミノ酸配列について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(j3’)該アミノ酸配列を、該分子間エネルギーパラメータとともに記憶手段に記憶するステップと、
(k3’)ステップ(j3’)によって記憶された情報に基づいて、所定の数のアミノ酸配列を抽出するステップと、
(l3’)ステップ(k3’)によって抽出されたアミノ酸配列を、生理活性ペプチドの候補として表示するステップとを、コンピュータに実行させるためのプログラム。
【0044】
(30)さらに、ステップ(k3’)とステップ(l3’)との間において、
(I)ステップ(k3’)で抽出されたアミノ酸配列に対しアミノ酸変異を導入したアミノ酸配列を生成するステップと、
(II)ステップ(I)で生成されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(III)ステップ(k3’)で抽出されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを対照として、ステップ(II)で計算された分子間エネルギーパラメータを比較し、対照の分子間エネルギーパラメータよりも安定な分子間エネルギーパラメータを有するアミノ酸配列を抽出するステップとを含む、上記(29)のプログラム。
【0045】
(31)標的タンパク質と相互作用し得る生理活性ペプチドを設計するための装置であって、(イ2)相互作用領域特定部と、(ロ2)アミノ酸配列第1探索部と、(ハ2)分子間エネルギー計算部と、(ニ2)アミノ酸配列記憶部と、(ホ2)アミノ酸配列第2探索部と、(ヘ2)アミノ酸配列表示部とを備え、
該相互作用領域特定部は、(a2’)標的タンパク質の標的部位と相互作用するタンパク質分子中の相互作用領域を特定する手段を含み、
該アミノ酸配列第1探索部は、(b2’)該相互作用領域から任意の長さのアミノ酸配列を抽出する手段を含み、
該分子間エネルギー計算部は、(c2’)抽出されたアミノ酸配列について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算する手段を含み、
該アミノ酸配列記憶部は、(d2’)該アミノ酸配列を、該分子間エネルギーパラメータとともに記憶手段に記憶する手段を含み、
該アミノ酸配列第2探索部は、(e2’)ステップ(d2’)によって記憶された情報に基づいて、所定の数のアミノ酸配列を抽出する手段を含み、
該アミノ酸配列表示部は、(f2’)抽出されたアミノ酸配列を、生理活性ペプチドの候補として表示する手段を含む、装置。
【0046】
(32)標的タンパク質と相互作用し得る生理活性ペプチドを設計するための装置であって、(イ3)アミノ酸配列第1探索部と、(ロ3)分子間エネルギー第1計算部と、(ハ3)スコアマトリクス生成部と、(ニ3)スコア計算部と、(ホ3)回帰式形成部と、(ヘ3)マトリクス変換部と、(ト3)アミノ酸位置依存的エネルギー計算部と、(チ3)アミノ酸配列第2探索部と、(リ3)分子間エネルギー第2計算部と、(ヌ3)アミノ酸配列記憶部と、(ル3)アミノ酸配列第3探索部と、(オ3)アミノ酸配列表示部とを備え、
該アミノ酸配列第1探索部は、(a3’)一定の長さのアミノ酸配列を網羅的に生成し、その中からランダムにアミノ酸配列を選択して解析用ライブラリとして抽出する手段を含み、
該分子間エネルギー第1計算部は、(b3’)解析用ライブラリとして抽出された各アミノ酸配列について分子間エネルギーパラメータを計算する手段を含み、
該スコアマトリクス生成部は、(c3’)ステップ(b3’)で計算された分子間エネルギーパラメータを用いて、アミノ酸出現頻度に基づくスコアマトリクスを生成する手段を含み、
該スコア計算部は、(d3’)アミノ酸出現頻度に基づくスコアマトリクスを用いて、アミノ酸出現頻度に基づくスコアを計算する手段を含み、
該回帰式形成部は、(e3’)ステップ(b3’)で計算された分子間エネルギーパラメータと該スコアとの間で相関解析を行い、回帰式を得る手段を含み、
該マトリクス変換部は、(f3’)該回帰式を用いて、アミノ酸出現頻度に基づくスコアマトリクスを、アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスに変換する手段を含み、
該アミノ酸位置依存的エネルギー計算部は、(g3’)アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスから、アミノ酸位置依存的な分子間エネルギーパラメータ値を計算する手段を含み、
該アミノ酸配列第2探索部は、(h3’)所定のアミノ酸位置依存的な分子間エネルギーパラメータ値以下のアミノ酸配列を抽出する手段を含み、
該分子間エネルギー第2計算部は、(i3’)抽出されたアミノ酸配列について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算する手段を含み、
該アミノ酸配列記憶部は、(j3’)該アミノ酸配列を、該分子間エネルギーパラメータとともに記憶手段に記憶する手段を含み、
該アミノ酸配列探索部は、(k3’)ステップ(j3’)によって記憶された情報に基づいて、所定の数のアミノ酸配列を抽出する手段を含み、
該アミノ酸配列表示部は、(l3’)ステップ(k3’)によって抽出されたアミノ酸配列を、生理活性ペプチドの候補として表示する手段を含む、装置。
【0047】
【発明の実施の形態】
先ず、本明細書で用いている語句及び方法について、1次スクリーニング、2次スクリーニング及び3次スクリーニングの順に説明する。なお、1次スクリーニングとしては複数の評価法を用いることができるが、標的タンパク質に応じたより適した評価法を適宜選択することができる。この選択は、標的タンパク質の種類、標的となるタンパク質の標的部位の特徴、既知のリガンド(タンパク質)が存在するか否か、その相互作用領域が特定されているか否かなどの観点から行なわれる。
【0048】
I.1次スクリーニング
1次スクリーニングとしては、アミノ酸相補プロファイル波形評価、アミノ酸相互作用領域評価、及びアミノ酸位置依存的結合有意性評価による方法を用いることができる。アミノ酸相補プロファイル波形評価は、主として、連続するアミノ酸配列からなる標的部位に対して相互作用する生理活性ペプチドを設計するのに有用である。一方、アミノ酸相互作用領域評価及びアミノ酸位置依存的結合有意性評価は、連続するアミノ酸配列からなる標的部位に相互作用する生理活性ペプチドの設計に有用であるばかりでなく、標的タンパク質の標的部位が、1次構造上で離れて局在している複数の部分アミノ酸配列から構成される場合に、この標的部位に相互作用する生理活性ペプチドの設計にも有用である。具体的には、1次スクリーニングにおける設計手法は、標的タンパク質に応じて選択される。設計手法は、リガンド情報の有無、標的部位の連続・不連続、酵素又は表面にポケットを持つかどうかの3つの判断基準により、最も適切なものを選択することができる。それぞれについての概要を以下の表1に示し、さらに、それぞれについて、順番に説明する。
【0049】
【表1】

Figure 0004612270
【0050】
A.アミノ酸相補プロファイル波形評価(相補ペプチドライブラリの生成)
アミノ酸相補プロファイル波形評価とは、標的アミノ酸配列の物理化学的なアミノ酸指標を基に、標的アミノ酸配列と相互作用するアミノ酸配列を有するペプチドを評価する方法である。この評価法は、標的タンパク質の標的部位が1つの連続するアミノ酸配列からなる場合に特に有用である。以下、アミノ酸相補プロファイル波形評価において用いられる用語及びこの評価の概要について述べる。
【0051】
「標的アミノ酸配列」とは、相補アミノ酸配列の設計において標的となるアミノ酸配列をいう。即ち、本発明は、この「標的アミノ酸配列」に相互作用するアミノ酸配列(相補アミノ酸配列)からなる生理活性ペプチドを設計することを目的とする。好ましくは、標的アミノ酸配列は、創薬のターゲットとなる標的タンパク質(例えば、受容体、酵素等)中に見出されるアミノ酸配列である。
【0052】
「相補アミノ酸配列」とは、本発明における相補(性)の定義を満たすアミノ酸配列をいう。
【0053】
「相補(性)」とは、標的アミノ酸配列に任意のアミノ酸指標を当てはめたプロファイル波形に対し、移動平均により低域通過させた移動平均プロファイル波形に負の相関性を持つ相補移動平均プロファイル波形を近似するプロファイル波形をもつアミノ酸配列と標的アミノ酸配列との間の関係のことをいう。したがって、あるアミノ酸配列の移動平均プロファイル波形が、他のアミノ酸配列の移動平均プロファイル波形よりも、標的アミノ酸配列の相補移動平均プロファイル波形との相関係数R(以下に説明)が小さい場合、当該アミノ酸配列は、標的アミノ酸配列に「より相補的」である。
【0054】
「プロファイル波形」とは、アミノ酸配列にアミノ酸指標を当てはめることにより生成される波形のことをいう。
【0055】
「移動平均プロファイル波形」とは、プロファイル波形を所定のウィンドウ幅で移動平均させた波形をいう。標的アミノ酸配列に任意のアミノ酸指標を当てはめたプロファイル波形をTiとすると、任意(奇数)のウィンドウ幅wでの移動平均プロファイル波形xjは、[式1]によって示される。
【0056】
【数1】
Figure 0004612270
【0057】
また、本明細書中では特に、相補アミノ酸配列の移動平均プロファイル波形を、「相補移動平均プロファイル波形」と呼ぶ。相補アミノ酸配列候補に任意のアミノ酸指標を当てはめたプロファイル波形をCiとすると、任意(奇数)のウィンドウ幅wでの相補移動平均プロファイル波形yjは、[式2]によって示される。
【0058】
【数2】
Figure 0004612270
【0059】
「ウィンドウ(Window)幅」とは、移動平均プロファイル波形を作成する際、プロファイル波形を足し合わせる範囲の幅をいう。ウィンドウ幅は、任意の奇数に設定可能であるが、通常は1〜13、好ましくは3〜13、より好ましくは5〜11に設定される。
【0060】
「アミノ酸指標」とは、アミノ酸の物理化学的特徴を数値化した指標のことをいう。アミノ酸指標は、現在までに400種類以上蓄積されており、例えば、京都大学化学研究所が提供するデータベースAAindexなどから、これらの指標を検索することができる。これらのアミノ酸の指標は、疎水性、β構造形成のしやすさ、αヘリックス形成及びターン形成のしやすさ、並びに側鎖の物理化学的性質(例えば、側鎖体積の相対的な大きさ)の5つの特徴に大別できる(例えば、Tomii and Kanehisa, Protein Eng., 9, 27-36 (1996)を参照のこと)。本発明において、プロファイル波形を生成する際のアミノ酸指標は、約400種類から選択可能である。また、上記データベースは、当該プログラムに付帯して当該装置(後述)の記憶装置に格納されたものであってもよく、また、インターネットなどの通信によって参照可能な外部の記憶装置に格納されたものであってもよい。
【0061】
本発明において用いられる好ましいアミノ酸指標の例としては、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、側鎖体積の相対的な大きさを表す指標が挙げられるが、アミノ酸指標は、より好ましくは、疎水度に基づく指標及び電気的特性に基づく指標から選択される。疎水度に基づく指標としては、例えば、Kyte-Doolittleのhydropathy index、Jonesらのhydrophobicity、およびConsensus Normalized Hydrophobicity scale [参考文献3]等が挙げられるが、特に、Consensus Normalized Hydrophobicity scaleが好ましい。また、電気的特性に基づく指標とは、分子の分極度合、静電的な相互作用を表す指標をいい、例えば、FauchereらのLocalized electrical effect、GranthamらのPolarity、およびElectron-ion interaction potential(EIIP)[参考文献4]等が挙げられるが、特に、Electron-ion interaction potential(EIIP)が好ましい [参考文献4]。
【0062】
「相補度パラメータ」とは、標的アミノ酸配列の移動平均プロファイル波形と相補アミノ酸配列の相補移動平均プロファイル波形との間の相補性を示す値をいう。相補度パラメータの一例は、以下[式3]に示される相関係数Rである。
【0063】
【数3】
Figure 0004612270
【0064】
ここで、移動平均プロファイル波形の平均値は、[式4]で示される。
【0065】
【数4】
Figure 0004612270
【0066】
また、相補移動平均プロファイル波形の平均値は、[式5]で示される。
【0067】
【数5】
Figure 0004612270
【0068】
当業者は、上記[式3]の相関係数に加え、上記[式3]から誘導される数式より算出される値を相補度パラメータとして使用することができる。
【0069】
「平均値パラメータ(Pave)」とは、(i)以下[式6]に示される、標的アミノ酸配列のプロファイル波形の平均値
【0070】
【数6】
Figure 0004612270
【0071】
または(ii)以下[式7]に示される、使用したアミノ酸指標の平均値
【0072】
【数7】
Figure 0004612270
【0073】
をいう。
【0074】
「フィルター値」とは、相補アミノ酸配列候補数を絞り込むために設定される値をいうが、本発明では、特に、相補度パラメータに関するフィルター値および平均値パラメータに関するフィルター値が利用される。
【0075】
相補度パラメータに関するフィルター値としては、例えば、相関係数フィルター値Rt(この値Rtに基づき、R<Rtに該当する相関係数Rを有する相補アミノ酸配列候補のみが選択される)が利用される。好ましくは、標的アミノ酸配列の移動平均プロファイル波形と相補アミノ酸配列の相補移動平均プロファイル波形との間には負の相関性が必要とされる。従って、相関係数フィルター値Rtは、−1以上の任意の負の数に設定可能であるが、好ましくはRt≦−0.9に設定される。なお、相補度パラメータに関するフィルター値は、相補度パラメータの計算前に予め設定されていてもよいし、計算の後に適宜設定してもよい。
【0076】
また、平均値パラメータに関するフィルター値として、Paveフィルター値a,bが設定される。この値a,bに基づき、a<Pave<bに該当するPaveを有する相補アミノ酸配列候補のみが選択される。なお、Paveが疎水度の高い値をとる場合には、得られる生理活性ペプチドが不溶性になり実験が困難になるので、a,bの値は、好ましくは、親水度が高い値に設定される。なお、Paveフィルター値は、Paveの計算前に予め設定されていてもよいし、Pave計算の後に適宜設定してもよい。
【0077】
フィルター値として、相関係数フィルター値Rtのみを用いてもよいが、好ましくは、Paveフィルター値a,bがさらに用いられる。この場合には、条件式は以下の通りである。
【0078】
【数8】
Figure 0004612270
【0079】
本評価法によって選択されたアミノ酸配列(相補ペプチドライブラリ)は、好ましくは、後述の2次スクリーニングに供される。
【0080】
B.アミノ酸相互作用領域評価(断片化ペプチドライブラリの生成)
アミノ酸相互作用領域評価とは、標的タンパク質と相互作用するタンパク質の一次構造(アミノ酸配列)情報を利用して、標的タンパク質に結合しうるペプチドを設計する方法をいう。この評価法は、標的タンパク質に相互作用する、若しくは相互作用が予測されるタンパク質の一次構造(アミノ酸配列)が既知である場合に特に有用である。以下、アミノ酸相互作用領域評価において用いられる用語及びこの評価の概要について述べる。
【0081】
標的タンパク質の標的部位と相互作用するタンパク質中の「相互作用領域」については、ある標的タンパク質と相互作用しうる領域が既に特定されているタンパク質が存在する場合には、その領域を選択する。1つのタンパク質内に複数の相互作用領域が存在する場合には、それらの複数の領域を相互作用領域として選択する。ある標的タンパク質と相互作用し得るタンパク質が複数知られている場合には、これらのタンパク質から複数の相互作用領域を取得することもできる。一方、標的タンパク質と相互作用するタンパク質自体は既知であるが、その相互作用する領域が特定されていない場合には、当該分野で周知の方法(例えば、RBD法[参考文献5])によってこの領域を選択することができる。尚、ある標的タンパク質と相互作用するタンパク質自体が未知の場合にも本評価法は適用可能であるが、好ましくは、ある標的タンパク質と相互作用するタンパク質自体が既知の場合に本評価法は適用される。
【0082】
本評価法において抽出されるアミノ酸配列の長さ(即ち、アミノ酸残基の数)としては、上記の相互作用領域の全長以内であれば、任意の長さのアミノ酸配列を抽出することが可能であるが、好ましくは、3〜7個のアミノ酸残基からなるアミノ酸配列、より好ましくは4個のアミノ酸残基からなるアミノ酸配列を抽出することができる。なお、アミノ酸配列の抽出は網羅的に行なわれる。例えば、X個のアミノ酸残基からなるアミノ酸配列を抽出する場合には、上記の相互作用領域のN末端からC末端にかけて、N−X+1個のアミノ酸配列が抽出され、断片化ペプチドライブラリとして格納される。また、抽出されるアミノ酸配列の長さは統一してもよいが、変動させてもよい。例えば、X個のアミノ酸残基からなるアミノ酸配列を、相互作用領域から網羅的にN−X+1個抽出し、X’個(Xとは異なる数)のアミノ酸残基からなるアミノ酸配列を、同じ相互作用領域から重複して網羅的にN−X’+1個抽出して、長さの異なるアミノ酸配列を断片化ペプチドライブラリに格納してもよい。本評価法によって抽出されたアミノ酸配列(断片化ペプチドライブラリ)は、後述の2次スクリーニングによって選択される。
【0083】
C.アミノ酸位置依存的結合有意性評価(位置スコアペプチドライブラリの生成)
アミノ酸位置依存的結合有意性評価は、千〜数十万にも及ぶアミノ酸配列を含むペプチドライブラリからランダムにわずか数%のアミノ酸配列を取得し、標的タンパク質との相互作用エネルギーを評価することにより、高速なΔG計算を可能とするスコアマトリクスを構築し、ペプチド設計を実施することを特徴とする。なお、この評価法は、基質特異性が似ている複数のタンパク質が存在する場合に、このうちの1つのタンパク質を標的タンパク質として選択し、この標的タンパク質に特異性が高いペプチドを設計することもできる。
【0084】
本評価法は、任意の標的タンパク質に対して適用可能であるが、好ましくは、標的タンパクとして分子表面にポケットを持ち、かつ結合に伴う構造変化が少ないと考えられる酵素など(例えば、ペプチダーゼ)に対して適用される。これはスコアマトリクスの作成の際、位置依存的なアミノ酸出現頻度をその基盤としているところに由来している。すなわち、本評価法は、ペプチドとの結合の際、限定された骨格及び結合様式を必要とするものに対して好ましい。
【0085】
「解析用ライブラリ」は、一定の長さのアミノ酸配列(即ち、特定の数のアミノ酸残基からなるアミノ酸配列)を網羅的に生成したものからランダムに抽出されたアミノ酸配列の集合からなる。解析用ライブラリに含まれるアミノ酸配列の数は、網羅的に生成された一定の長さのアミノ酸配列の総数に対して数%でよい。例えば、X個のアミノ酸残基からなるアミノ酸配列を設計する場合には、20Xの組み合わせを網羅的に生成し、生成された20X個のアミノ酸配列から数%をランダムに選択して解析用ライブラリとして使用する。また、解析用ライブラリとして選択されるアミノ酸配列の数は、特定の数に限定されるものではなく、適宜設定可能である。なお、本評価で設計可能なアミノ酸配列の長さは特に限定されないが、2〜10個のアミノ酸残基からなるアミノ酸配列が好ましく、3〜5個のアミノ酸残基からなるアミノ酸配列がより好ましい。また、「解析用ライブラリ」の妥当性を評価するために、「評価用ライブラリ」の生成も必要に応じて行なわれる。「評価用ライブラリ」としては、網羅的に生成されたアミノ酸配列のうち、「解析用ライブラリ」に用いられたアミノ酸配列を除いたものから選択される。「評価用ライブラリ」として用意されるアミノ酸配列の数は、特に限定されないが、「解析用ライブラリ」として用意されるアミノ酸配列の数よりも少ない数に設定される。
【0086】
「分子間エネルギーパラメータ」については、後述の「II.2次スクリーニング」に記載したものと同義であり、その計算についても後述の方法と同様に行なわれる。
【0087】
「アミノ酸出現頻度に基づくスコアマトリクス」とは、アミノ酸出現頻度に基づいて生成されたマトリクスであるならばいかなるものをも意味する。「アミノ酸出現頻度に基づくスコアマトリクス」の例は、下記[式9]に従い生成されるPSSマトリクス(Positional Scanning Score−MATRIX)である。なお、aijは、解析用ライブラリに含まれる全ペプチド群中のポジションjにおけるアミノ酸iの出現回数を示し、bijは、解析用ライブラリに含まれる閾値ΔG以下のペプチド群中のポジションjにおけるアミノ酸iの出現回数である。なお、上記では、閾値ΔGは、予め設定されていてもよいが、後述する方法で設定されてもよい。
【0088】
【数9】
Figure 0004612270
【0089】
「アミノ酸出現頻度に基づくスコア」は、上記「アミノ酸出現頻度に基づくスコアマトリクス」に従って計算されるものを意味し、その一例は、下記[式10]によって計算されるPSS(Positional Scanning Score)である[参考文献6]。なお、下記[式10]において、nは、決定されるべきアミノ酸の数を示し、Cijは、20×nのマトリクスであり、0若しくは1の値で構成される。また、任意のアミノ酸配列中のポジションjにおけるアミノ酸iと一致する要素は1、不一致の要素は0とする。
【0090】
【数10】
Figure 0004612270
【0091】
「アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクス」とは、解析用ライブラリとして抽出された各アミノ酸配列について計算された「分子間エネルギーパラメータ」と「アミノ酸出現頻度に基づくスコア」との間の相関解析で得られた回帰式を用いて、「アミノ酸出現頻度に基づくスコアマトリクス」を変換したものをいう。一例は、PSGマトリクス(Positional Scanning ΔG−MATRIX)である。なお、「アミノ酸出現頻度に基づくスコアマトリクス」に変換する際に、好ましくは、定数項は各ポジションに均一に分配される。
【0092】
「アミノ酸位置依存的な分子間エネルギーパラメータ値」とは、上記「アミノ酸出現頻度に基づくスコアマトリクス」によって計算されるものであり、その一例は、下記式[式11]によって計算されるPSG(Positional Scanning ΔG)であるが、自由エネルギーと同義のパラメータをも使用可能である。なお、下記[式11]において、PSGijはPSGマトリクス中のijの要素を示す。
【0093】
【数11】
Figure 0004612270
【0094】
本評価法によって選択されたアミノ酸配列(位置スコアペプチドライブラリ)は、好ましくは、後述の2次スクリーニングに供される。
【0095】
II.2次スクリーニング
「分子間エネルギーパラメータ」とは、相補アミノ酸配列と標的タンパク質の標的部位との間の分子間エネルギーに基づくパラメータをいう。分子間エネルギーパラメータは、当該分野で公知である任意の方法により算出される分子間エネルギーに関するパラメータを意味する。当該分野で公知である任意の方法により算出される分子間エネルギーパラメータとしては、例えば、MM3[参考文献7]、Amber[参考文献9]、Charmm[参考文献10]力場によって算出されるものが挙げられる。好ましくは、分子間エネルギーパラメータとして、Amber力場を用いた分子間エネルギー(Emol)および阻害定数(Ki)が利用される。
【0096】
「分子間エネルギー(Emol)」は、下記[式12](Amber力場[参考文献9、11]を利用)によって計算される。
【0097】
【数12】
Figure 0004612270
【0098】
ここで、好ましくは、[式12]の各係数は、Amber力場により経験的パラメータとして与えられているものである。
【0099】
「阻害定数(Ki)」は、下記[式13]によって計算される。
【0100】
【数13】
Figure 0004612270
【0101】
なお、ΔGは、標的タンパク質の標的部位と相補アミノ酸配列からなるペプチド候補との間での複合体生成によるものであり、当該分野で公知の任意のエネルギー関数を用いて計算されるが、好ましくは、AutoDockエネルギー関数[参考文献2]を用いて計算される。
【0102】
標的タンパク質の標的部位に対して好ましい生理活性ペプチドは、任意の分子間エネルギーパラメータに対して設定される閾値条件を満たすことが必要とされる。好ましくは、分子間エネルギーパラメータとして上記Emol又はKiが利用される場合、以下の[式14]又は[式15]のいずれかを満たすことが必要とされる。
【0103】
【数14】
Figure 0004612270
【0104】
又は
【0105】
【数15】
Figure 0004612270
【0106】
これまで1次スクリーニング、2次スクリーニングについて述べてきたが、以降は、2次スクリーニングで得られたアミノ酸配列を有するペプチドを、便宜上「リードペプチド」と呼ぶこともある。
【0107】
III.3次スクリーニング
3次スクリーニングとして、「アミノ酸変異ΔE(例えば、ΔG)評価」によってリードペプチドの変異を実施することができる。アミノ酸変異ΔE評価とは、リードペプチドを構成する各アミノ酸を、それ以外のアミノ酸に置換して変異ペプチドを作成し、この変異ペプチドと標的タンパク質とのΔEmutant(例えば、ΔGmutant)を計算して、変異ペプチドを評価する方法をいう。例えば、2次スクリーニングで得られたペプチドが4個のアミノ酸残基から構成され、このうち1個のアミノ酸残基のみを他の天然アミノ酸に置換する場合には、4×19個の変異ペプチドを網羅的に作成し、これらの変異ペプチドと標的タンパク質とのΔEmutant(例えば、ΔGmutant)をそれぞれ計算する。ΔEmutant(例えば、ΔGmutant)の計算は、2次スクリーニングでの計算と同様に、当該分野で公知の任意のエネルギー関数を用いて計算されるが、好ましくは、AutoDockエネルギー関数を用いて計算される。一例では、ΔEとして結合自由エネルギーを用いる場合、各変異ペプチドについて得られたΔGmutantとリードペプチドのΔGleadとの差であるΔΔGを下記[式16]により計算する。
【0108】
【数16】
Figure 0004612270
【0109】
上記式から、ΔΔGが負になる変異ペプチドは、リードペプチドに比べて、標的タンパク質とより安定な複合体を形成すること、並びにΔΔGが正になる変異ペプチドは、リードペプチドと比べて、標的タンパク質とより不安定な複合体を形成することが理解される。従って、3次スクリーニングにおいては、ΔΔGが負となるようなアミノ酸変異の導入が好ましい。尚、上記の例示では、リードペプチドを構成するアミノ酸残基のうち1個のアミノ酸残基のみを置換したが、ΔΔGが負になるアミノ酸変異を組み合わせて、2個又は3個のアミノ酸残基の置換を実施してもよい。上述のごとく3次スクリーニングを行なうことにより、より最適な生理活性ペプチドを設計することができる。
【0110】
アミノ酸の置換では、リードペプチド中の各アミノ酸を、それ以外の19種類の天然アミノ酸に置換することができる。また、天然アミノ酸以外にも、さらに、任意のα−アミノ酸、β−アミノ酸、γ−アミノ酸などの非天然アミノ酸で置換することもできる。但し、α−アミノ酸以外での置換は、主鎖の配置に変化をもたらす可能性が高いため、任意の非天然α−アミノ酸での置換が好ましい。また、L体、D体のいずれのアミノ酸にも置換可能である。
【0111】
また、このアミノ酸の置換は、「アミノ酸の側鎖の最適化」という観点から捉えることもできる。例えば、1次スクリーニング、2次スクリーニングを経て上記「アミノ酸変異ΔE(例えば、ΔG)評価」を行い、ある標的タンパク質の標的部位に対して最も好ましいペプチドAla−Cys−Phe−Valが得られたと仮定する。このような場合、このペプチドAla−Cys−Phe−Valをベースにしてより好ましいペプチドを得るために、このペプチドを構成する各アミノ酸の側鎖について再検証することも可能である。具体的には、Metの側鎖(−CH2CH2SCH3)において水素原子の代わりにハロゲン原子を導入した側鎖やさらなる基を導入した側鎖について、上記「アミノ酸変異ΔE(例えば、ΔG)評価」を行い、より適切な変異ペプチドを得ることも可能である。上記では例としてMetの側鎖の変異について述べたが、もちろん、Met以外の天然アミノ酸の側鎖、及び非天然アミノ酸(好ましくは、非天然α−アミノ酸)の側鎖についても同様に再検証することが可能である。一般論として、ある程度大きなタンパク質の場合には、アミノ酸置換は天然アミノ酸に制限されやすい。なぜならば、実際にそのようなタンパク質を合成する場合、DNAのコード領域を変異し、細胞系や無細胞系による翻訳によって変異(置換)タンパク質を合成するからである。しかし、低分子ペプチドの場合は、そのペプチドを構成するアミノ酸の種類は天然アミノ酸に制限されない。なぜなら、低分子ペプチドは固相合成によって容易に合成可能であり、原料となるアミノ酸の供給さえ可能であれば、天然アミノ酸や非天然アミノ酸に限らず重合反応は容易だからである。従って、「アミノ酸変異ΔE(例えば、ΔG)評価」を行なう3次スクリーニングは、アミノ酸側鎖をより最適化し、さらに特異性の高い生理活性ペプチドの取得を可能にする。
【0112】
なお、「I.1次スクリーニング」、「II.2次スクリーニング」、「III.3次スクリーニング」の中で挙げた特定の式はあくまで例示であり、それと同義の式やそれから誘導される式も全て各計算において本発明で利用されるものとする。
【0113】
以下、本発明を詳述する。
本発明の方法は、上記(1)に示すとおり、上記(a1)〜(g1)のステップを有するものであればよく、また、上記(5)に示すとおり、上記(a1’)〜(i1’)のステップを有するものであればよい。
【0114】
これら本発明による方法を実施するための具体的な手段・形態は限定されないが、処理すべきデータ量が膨大であることを考慮すれば、上記(9)〜(12)、および上記(13)〜(16)に挙げた、本発明によるプログラムによるコンピュータ処理が最も好ましい実施形態である。本発明によるプログラムに含まれる処理ステップは、本発明による方法の発明の各ステップの技術的思想と等しい。よって、以下に、本発明によるプログラムを詳細に説明することによって、本発明による方法をも同時に説明するものとする。
【0115】
本発明のプログラムは、標的アミノ酸配列と相互作用する生理活性ペプチドの設計、および標的タンパク質と相互作用する生理活性ペプチドの設計(即ち、標的アミノ酸配列のみならず、標的タンパク質の標的部位に存在する他のアミノ酸配列との相互作用をも考慮する生理活性ペプチドの設計)という観点から大きく2つに分けることができる。一方は、上記(9)〜(12)に示すプログラムであり、これは、標的アミノ酸配列と相互作用する生理活性ペプチドの設計を行うものである。特に、上記(9)のプログラムに含まれる上記(a1)〜(f1)のステップを「1次スクリーニング」と呼ぶこともできる。
【0116】
また、本発明によるプログラムのうち、他方は、上記(13)〜(16)に示すプログラムであり、これは、標的タンパク質と相互作用する生理活性ペプチドの設計を行うものである。特に、上記(13)に含まれる上記(a1’)〜(f1’)のステップを「1次スクリーニング」と呼び、さらに上記(g1’)〜(i1’)のステップを「2次スクリーニング」と呼ぶこともできる。これら、「1次スクリーニング」と「2次スクリーニング」とを組み合わせることによって、標的タンパク質の標的部位に対してより適切な生理活性ペプチドを取得することが可能になる。
【0117】
さらに、上記(13)〜(16)のプログラムに対し、上記(24)に含まれる上記(I)〜(III)のステップを組み合わせることもできる。この上記(I)〜(III)のステップを「3次スクリーニング」と呼ぶこともできる。「1次スクリーニング」、「2次スクリーニング」にさらに「3次スクリーニング」を組み合わせることによって、より標的タンパク質の標的部位に対して特異性の高い生理活性ペプチドを取得することが可能になる。
【0118】
別の局面では、本発明は、上記(25)及び(26)のプログラムを提供する。なお、上記(25)のプログラムに含まれる上記(a2)〜(b2)のステップを「1次スクリーニング」と呼ぶこともできる。また、上記(26)のプログラムに含まれる上記(a2’)〜(b2’)のステップを「1次スクリーニング」と呼ぶことができ、さらに、上記(c2’)〜(e2’)のステップを「2次スクリーニング」と呼ぶことができる。なお、上記(26)のプログラムに、上記(27)に含まれる上記(I)〜(III)のステップ(「3次スクリーニング」)を組み合わせることもできる。
【0119】
さらに別の局面では、本発明は、上記(28)及び(29)のプログラムを提供する。なお、上記(28)のプログラムに含まれる上記(a3)〜(h3)のステップを「1次スクリーニング」と呼ぶこともできる。また、上記(29)のプログラムに含まれる上記(a3’)〜(h3’)のステップを「1次スクリーニング」と呼ぶことができ、さらに、上記(i2’)〜(k2’)のステップを「2次スクリーニング」と呼ぶことができる。なお、上記(29)のプログラムに、上記(30)に含まれる上記(I)〜(III)のステップ(「3次スクリーニング」)を組み合わせることもできる。
【0120】
本発明における生理活性ペプチド設計の一例を図1に示し、さらに本発明のシステム全体を図2に示す。なお、図1及び図2には2次スクリーニングが記載されているが、この2次スクリーニングは、必要に応じて行なわれるものであり、さらに図2に記載されている3次スクリーニングを併用してもよい。
【0121】
本発明において、1次スクリーニングは、3種類のプログラムから構成されており、標的タンパク質の性質等に応じて使い分けられる。一方、2次スクリーニングは、全て共通したプログラムであり、また、3次スクリーニングも全て共通したプログラムである。先ず、1次スクリーニングの選択について説明する。
【0122】
図3は、1次スクリーニングの選択におけるプログラムフローを示すフローチャートである。1次スクリーニングの種類としては、リガンド情報の有無、標的部位の連続・不連続、酵素又は表面にポケットを持つかどうかの3つの判断基準により、最も適切なものを選択することができる。以下、1次スクリーニングの選択について、図3のステップ501〜506を参照して詳細に説明する。
【0123】
図3のステップ501は、ある標的タンパク質に対してリガンドとなるペプチドが存在するか否かを判断するステップである。即ち、ある標的タンパク質に対するリガンドが未知である場合には、図3のステップ502に進み、リガンドが既知である場合には、図3のステップ504に進む。
【0124】
図3のステップ502は、標的タンパク質の標的部位が、連続するアミノ酸配列から主に構成されているか否かを判断するステップである。標的タンパク質の標的部位が、例えば、結晶構造の解析により解明されている場合は、その情報をもとにして判断する。標的タンパク質の標的部位が未知の場合は、例えば、当該分野で公知の立体構造予測プログラムによって判断する。その結果、標的タンパク質の標的部位が、不連続なアミノ酸配列から構成される場合には、アミノ酸位置依存的結合有意性評価が1次スクリーニングとして行なわれる。一方、標的タンパク質の標的部位が、連続するアミノ酸配列から主に構成される場合には、図3のステップ503へと進む。
【0125】
図3のステップ503は、標的タンパク質が、酵素であるか否か、又は表面にポケットを持つタンパク質であるか否かを判断するステップである。表面にポケットを持つタンパク質としては、例えば、受容体が挙げられる。また、標的タンパク質の種類(例えば、酵素、受容体等)が未知である場合には、例えば、相同性検索によって、その標的タンパク質の種類を予測することができる。図3のステップ503において、標的タンパク質が、酵素でも、表面にポケットを持つタンパク質でもないと判断された場合には、1次スクリーニングとしてアミノ酸相補プロファイル波形評価が用いられる。一方、標的タンパク質が、酵素、又は表面にポケットを持つタンパク質のいずれかであると判断された場合には、1次スクリーニングとして、アミノ酸相補プロファイル波形評価又はアミノ酸位置依存的結合有意性評価が用いられるが、好ましくは、アミノ酸位置依存的結合有意性評価が用いられる。
【0126】
図3のステップ504は、標的タンパク質の標的部位が、連続するアミノ酸配列から主に構成されているか否かを判断するステップである。なお、図3のステップ504では、図3のステップ502と同様にして判断される。その結果、標的タンパク質の標的部位が、不連続なアミノ酸配列から構成されると判断される場合には、図3のステップ505に進む。一方、標的タンパク質の標的部位が、連続するアミノ酸配列から主に構成されると判断される場合には、図3のステップ506へと進む。
【0127】
図3のステップ505は、標的タンパク質が、酵素であるか否か、又は表面にポケットを持つタンパク質であるか否かを判断するステップである。図3のステップ505では、図3のステップ503と同様にして判断される。標的タンパク質が、酵素でも、表面にポケットを持つタンパク質でもないと判断された場合には、1次スクリーニングとしてアミノ酸相互作用領域評価が用いられる。一方、標的タンパク質が、酵素、又は表面にポケットを持つタンパク質のいずれかであると判断された場合には、1次スクリーニングとして、アミノ酸相互作用領域評価又はアミノ酸位置依存的結合有意性評価が用いられるが、好ましくは、アミノ酸相互作用領域評価が用いられる。
【0128】
図3のステップ506は、標的タンパク質が、酵素であるか否か、又は表面にポケットを持つタンパク質であるか否かを判断するステップである。図3のステップ506では、図3のステップ503と同様にして判断される。標的タンパク質が、酵素でも、表面にポケットを持つタンパク質でもないと判断された場合には、1次スクリーニングとして、アミノ酸相補プロファイル波形評価又はアミノ酸相互作用領域評価が用いられるが、好ましくは、アミノ酸相互作用領域評価が用いられる。一方、標的タンパク質が、酵素、又は表面にポケットを持つタンパク質のいずれかであると判断された場合には、1次スクリーニングとして、アミノ酸相補プロファイル波形評価、アミノ酸相互作用領域評価又はアミノ酸位置依存的結合有意性評価のいずれを用いてもよいが、好ましくは、アミノ酸相互作用領域評価又はアミノ酸位置依存的結合有意性評価が用いられ、より好ましくは、アミノ酸相互作用領域評価が用いられる。
【0129】
以下、1次スクリーニングに関しては、図4のステップ101〜111(アミノ酸相補プロファイル波形評価)、図6のステップ301〜302(アミノ酸相互作用領域評価)及び図8のステップ401〜408(アミノ酸位置依存的結合有意性評価)を参照して説明する。2次スクリーニングに関しては、図4のステップ112以降を参照して説明する。また、3次スクリーニングに関しては、図5のステップ201〜204を参照して説明する。
【0130】
図4は、上記(9)および(13)のプログラムフローを示すフローチャートである。先ず、上記(9)のプログラムについて以下に詳述する。
【0131】
上記ステップ(a1)は、図4のフローチャートにおけるステップ101に対応する。データ入力手段としては、例えば、タッチパネル、キーボード、マウス等が挙げられる。他の入力手段として、ペンタブレット、音声入力装置などを用いることもできる。入力される標的アミノ酸配列としては、リガンド結合部位、基質結合部位、タンパク質間相互作用部位等のアミノ酸配列が適宜選択される。当業者は、あるタンパク質に関するX線解析データに基づき、又はあるタンパク質に関する一般的なタンパク質立体構造予測プログラム等の予測に基づき、標的アミノ酸配列を適宜選択し、その配列データを入力することができる。また、上記のような手法によらず仮想的に設定したアミノ酸配列(即ち、任意のアミノ酸配列)を標的アミノ酸配列としてデータ入力してもよい。
【0132】
上記(9)のプログラムは、図4のフローチャートに示すステップ102に対応するステップを含んでいないが、必要に応じて図4のステップ102に対応するステップを含むことができる。図4のステップ102では、1以上のアミノ酸指標、およびウィンドウ幅の入力が可能であり、具体的には記載されてはいないものの、相補度パラメータのフィルター値(例えば、相関係数フィルター値Rt)、Paveフィルター値a,b、分子間エネルギーパラメータの閾値(例えば、
【0133】
【数17】
Figure 0004612270
【0134】
)等の入力を受け付けることもできる。入力手段としては、図4のステップ101で用いた入力手段と同様のものを使用できる。これらのパラメータは、操作時に逐一ユーザーが選択入力する形式であっても、予め初期値が設定されており、所望によりユーザーが変更し得る形式であってもよい。
【0135】
上記ステップ(b1)は、図4のステップ103に対応する。上記ステップ(b1)では、図4のステップ102で設定されている1以上のアミノ酸指標に従って、図4のステップ101で入力された標的アミノ酸配列の配列データから1以上のプロファイル波形を生成し、次いで1以上の移動平均プロファイル波形に変換する(図4のステップ103)。具体的には、得られた標的アミノ酸配列について上記[式1]で示される演算処理を実行する。標的アミノ酸配列に関する1以上の移動平均プロファイル波形のデータは、図4のステップ107へと送られる。
【0136】
上記ステップ(c1)は、図4のステップ104、ステップ105に対応する。上記ステップ(c1)では、相補アミノ酸配列候補が生成され(図4のステップ104)、生成された相補アミノ酸配列について、図4のステップ102で設定されている1以上のアミノ酸指標に従って1以上のプロファイル波形が生成され、次いで1以上の相補移動平均プロファイル波形に変換される(図4のステップ105)。具体的には、得られた相補アミノ酸配列候補について上記[式2]で示される演算処理を実行する。相補アミノ酸配列候補に関する1以上の相補移動平均プロファイル波形のデータは、相補度パラメータの計算のために、図4のステップ107へと送られる。
【0137】
上記(9)のプログラムは、図4のステップ106に対応するステップを含んでいないが、必要に応じて図4のステップ106に対応するステップを含むことができる。標的アミノ酸配列のアミノ酸残基数がnの場合、20n個の相補アミノ酸配列候補が生成され、それらのそれぞれが1以上の相補移動平均プロファイル波形に変換されるまで、図4のステップ106は、図4のステップ104、ステップ105を繰り返すように指令する。20n個の相補アミノ酸配列候補が生成され、それらのそれぞれが1以上の相補移動平均プロファイル波形に変換された場合には、相補アミノ酸配列候補の生成(図4のステップ104)およびそれに伴う相補移動平均プロファイル波形の生成(図4のステップ105)が終了する。
【0138】
上記ステップ(d1)は、図4のステップ107に対応する。上記ステップ(d1)では、同一のアミノ酸指標に由来する1以上の相補度パラメータ(例えば、[式3]で示される相関係数)が、標的アミノ酸配列に対する1以上の移動平均プロファイル波形と相補アミノ酸配列候補の1以上の相補移動平均プロファイル波形との間でそれぞれ計算される(図4のステップ107)。
【0139】
例えば、標的アミノ酸配列の移動平均プロファイル波形および相補アミノ酸配列の相補移動平均プロファイル波形への変換の際に、1つのアミノ酸指標のみを使用した場合には、1つの相補度パラメータのみが図4のステップ107で算出される。
【0140】
また、標的アミノ酸配列の移動平均プロファイル波形および相補アミノ酸配列の相補移動平均プロファイル波形への変換の際に、2以上のアミノ酸指標を使用した場合には、2以上の相補度パラメータが図4のステップ107で算出される。
【0141】
上記(9)のプログラムは、図4のステップ108に対応するステップを含んでいないが、必要に応じて図4のステップ108に対応するステップを含むことができる。図4のステップ108では、使用された1以上のアミノ酸指標に基づいて1以上の平均値パラメータが算出される。
【0142】
上記ステップ(e1)は、図4に具体的には示されていない。しかし、上記ステップ(e1)を、図4のステップ108とステップ109との間に含むことができる。上記ステップ(e1)では、相補アミノ酸配列候補が、図4のステップ107で算出された1以上の該相補度パラメータ(必要に応じて、図4のステップ108で算出された1以上の平均値パラメータ)とともに記憶手段に記憶される。
【0143】
上記ステップ(f1)は、図4のステップ109に対応する。上記ステップ(f1)では、図4のステップ107で算出された1以上の相補度パラメータ(必要に応じて、図4のステップ108で算出された1以上の平均値パラメータ)に基づき相補アミノ酸配列候補を抽出する。抽出は、フィルター値による条件に基づいて行なわれる。フィルター値は、操作時に逐一ユーザーが選択入力する形式であっても、予め初期値が設定されており、所望によりユーザーが変更し得る形式であってもよい。
【0144】
上記ステップ(d1)において標的アミノ酸配列と相補アミノ酸配列との間で1つの相補度パラメータのみが算出される場合には、上記ステップ(f1)において、相補アミノ酸配列候補は、その1つの相補度パラメータに対するフィルター値の条件を満たすように抽出される。なお、この抽出処理において、1つの平均値パラメータのフィルター値を併用することもできる。
【0145】
上記ステップ(d1)において、標的アミノ酸配列と相補アミノ酸配列との間で2以上の相補度パラメータが算出される場合には、上記ステップ(f1)において、2以上の相補度パラメータを総合的に考慮し、相補アミノ酸配列候補を抽出する。なお、この抽出処理において、2以上の平均値パラメータを総合的に考慮して併用することもできる。当業者は、2以上の相補度パラメータ(必要に応じて、2以上の平均値パラメータ)を算出した場合には、重要視するパラメータを優先的に考慮し、所望の相補アミノ酸配列候補を抽出するように条件設定することができる。
【0146】
上記プログラム(9)は、図4のステップ110に対応するステップを含んでいないが、必要に応じて図4のステップ110に対応するステップを含むこともできる。図4のステップ110では、別のアミノ酸指標を用いて相補アミノ酸配列候補をさらに選別するか否かが決定される。具体的には、上記ステップ(f1)で抽出された相補アミノ酸配列候補について、図4のステップ102で設定されているアミノ酸指標(以前のアミノ酸指標とは異なる)に従い、さらに上記ステップ(b1)〜(f1)を1回以上繰り返すか否かが決定される。上記ステップ(b1)〜(f1)を1回以上繰り返すか否か、その繰り返す回数、およびその際に使用する1以上のアミノ酸指標は、操作時に逐一ユーザーが選択入力する形式であっても、予め設定されており、所望によりユーザーが変更し得る形式であってもよい。
【0147】
図4のステップ110において、別のアミノ酸指標を用いて相補アミノ酸配列候補をさらに選別する必要がないと判断される場合には、図4のステップ111へと進み、標的タンパク質との相互作用を考慮するか否かが決定される。なお、上記プログラム(9)は、標的アミノ酸配列との相互作用を考慮するためのものであり、標的タンパク質自体との相互作用を考慮しない実施形態であるため、図4のステップ111では常にNと判断される。
【0148】
上記ステップ(g1)は、図4に示されていないが、図4のステップ111のNの後に含めることもできる。上記ステップ(g1)は、標的アミノ酸配列に対する相補アミノ酸配列候補を、その相補度パラメータ等とともに表示する。表示手段としては、通常のディスプレイ装置やプリンター等が用いられる。好ましくは、抽出された相補アミノ酸配列候補は、各パラメータ毎に順位付けされて上位から、又は各パラメータを総合的に考慮して上位から表示される。
【0149】
次に、上記(13)のプログラムについて以下に詳述する。このプログラムは、標的アミノ酸配列との相互作用に加え、標的タンパク質の標的部位との相互作用をも考慮するものである。
【0150】
上記(13)のプログラムの上記ステップ(a1’)〜(f1’)は、上記(9)のプログラムのステップ(a1)〜(f1)に対応している。従って、上記(13)のプログラムのステップ(a1’)〜(f1’)は、上記(9)のプログラムのステップ(a1)〜(f1)と同様に行なわれる。但し、図4のステップ102では、標的タンパク質に関するデータ(例えば、標的タンパク質のアミノ酸配列データ、標的タンパク質の標的部位についてのデータ等)を入力することが可能である。なお、上記プログラム(13)は、標的タンパク質自体との相互作用を考慮する実施形態であるため、図4のステップ111では常にYと判断される。
【0151】
上記ステップ(g1’)は、図4のステップ112に対応する。ステップ(g1’)では、標的タンパク質の標的部位と相補アミノ酸配列候補との分子間エネルギーパラメータが計算される。この計算は、図4のステップ102に入力されている標的タンパク質に関するデータ(例えば、標的タンパク質のアミノ酸配列データ、標的タンパク質の標的部位についてのデータ等)、相補アミノ酸配列候補の配列データ等を利用して実行される。
【0152】
上記ステップ(h1’)は、図4には示されていないものの、図4のステップ112とステップ113との間に含めることができる。上記ステップ(h1’)では、相補アミノ酸配列候補が、図4のステップ112で算出された分子間エネルギーパラメータとともに記憶手段に記憶される。
【0153】
上記ステップ(i1’)は、図4のステップ113に対応する。上記ステップ(i1’)では、記憶手段に記憶された情報に基づき、分子間エネルギーパラメータの閾値条件を満たす相補アミノ酸配列候補が抽出される。
【0154】
上記ステップ(j1’)は、図4に示されてはいないものの、図4のステップ113のYの後に含めることができる。上記ステップ(j1’)では、標的アミノ酸配列に対する相補アミノ酸配列候補を、その相補度パラメータ等とともに表示する。表示手段としては、通常のディスプレイ装置やプリンター等が用いられる。好ましくは、抽出された相補アミノ酸配列は、良好な分子間エネルギーパラメータに基づいて順位付けして表示される。
【0155】
また、上記ステップ(i1’)とステップ(j1’)の間に、上記ステップ(I)〜(III)を含めることができる。上記ステップ(I)〜(III)は、図5のステップ201〜203にそれぞれ対応する。以下、上記ステップ(I)〜(III)について詳述する。
【0156】
上記ステップ(I)は、図5のステップ201に対応する。上記ステップ(I)では、上記ステップ(i1’)で抽出されたアミノ酸配列に対しアミノ酸変異を導入したアミノ酸配列が生成される。上記ステップ(i1’)で抽出されたアミノ酸配列に対し、1つのアミノ酸を置換する場合には、もとのアミノ酸以外の19種類の天然アミノ酸で置換したアミノ酸配列が網羅的に生成される。また、上記ステップ(i1’)で抽出されたアミノ酸配列に対し、複数(2又は3以上)のアミノ酸を置換して、それらのアミノ酸配列が網羅的に生成される(例えば、2個のアミノ酸を他の天然アミノ酸で置換する場合には19×19個のアミノ酸配列が生成される)。さらに、天然アミノ酸のみならず非天然アミノ酸配列をもアミノ酸置換に利用可能である。これらのアミノ酸のデータは予め記憶されているものを利用する形式であっても、外部のデータベースを参照して必要なデータを取り込む形式であってもよい。
【0157】
上記ステップ(II)は、図5のステップ202に対応する。上記ステップ(II)では、上記ステップ(I)で生成された全てのアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータが計算される。この計算は、上記ステップ(g1’)と同様にして行なわれる。
【0158】
上記ステップ(III)は、図5のステップ203に対応する。上記ステップ(III)では、上記ステップ(i1’)で抽出されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを対照として、上記ステップ(II)で計算された分子間エネルギーパラメータを比較し、対照の分子間エネルギーパラメータよりも安定な分子間エネルギーパラメータを有するアミノ酸配列を抽出する。上記ステップ(i1’)で抽出されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータとしては、ステップ(g1’)で計算された値を使用することができる。比較の結果、対照の分子間エネルギーパラメータよりも安定な分子間エネルギーパラメータを有するアミノ酸配列が抽出される。
【0159】
なお、上記ステップ(III)の後に、図5のステップ204を含ませることもできる。図5のステップ204では、上記ステップ(III)で抽出されたアミノ酸配列について上記ステップ(I)〜(III)を再度繰り返すかが決定される。図5のステップ204において上記ステップ(I)〜(III)を再度繰り返す必要がないと判断された場合に、アミノ酸配列の抽出が終了し、上記ステップ(j1’)へと進む。但し、図5のステップ204の後に、各アミノ酸側鎖の最適化処理を行なうステップも設けることができる。このような場合には、各アミノ酸側鎖の最適化処理を行なうステップの終了後に、上記ステップ(j1’)へと進む。
【0160】
図6は、上記(25)、及び上記(26)の一部についてのプログラムフローを示すフローチャートである。このプログラムは、標的タンパク質に相互作用する、若しくは相互作用が予測されるタンパク質の一次構造(アミノ酸配列)が既知である場合に特に有用である。先ず、上記(25)のプログラムについて以下に詳述する。
【0161】
上記(25)のプログラムにおける上記ステップ(a2)は、図6のステップ301に対応する。上記ステップ(a2)では、標的タンパク質の標的部位と相互作用するタンパク質中の相互作用領域が特定される。標的タンパク質と相互作用しうる領域が既に特定されているタンパク質が存在する場合には、その領域が選択される。1つのタンパク質内に複数の相互作用領域が存在する場合には、それらの複数の領域を相互作用領域として選択する。標的タンパク質と相互作用し得るタンパク質が複数知られている場合には、これらのタンパク質のそれぞれから複数の相互作用領域を選択することもできる。一方、標的タンパク質と相互作用するタンパク質自体は既知であるが、その相互作用する領域が特定されていない場合には、当該分野で周知の方法(例えば、RBD法[参考文献5])によってこの領域を選択することができる。
【0162】
上記ステップ(b2)は、図6のステップ302に対応する。上記ステップ(b2)では、該相互作用領域から任意の長さのアミノ酸配列を抽出する。上記ステップ(b2)で実行されるアミノ酸配列の抽出についての概要を図7に示す。上記ステップ(b2)で抽出されるアミノ酸配列の長さ(即ち、アミノ酸残基の数)としては、上記の相互作用領域の全長以内であれば、任意の長さのアミノ酸配列を抽出することが可能である。なお、アミノ酸配列の抽出は網羅的に行なわれる。例えば、X個のアミノ酸残基からなるアミノ酸配列を抽出する場合には、上記の相互作用領域のN末端からC末端にかけて、N−X+1個のアミノ酸配列を抽出する。また、抽出されるアミノ酸配列の長さは統一してもよいが、異なる長さのアミノ酸配列についても網羅的に抽出してもよい。
【0163】
次に、上記(26)のプログラムについて以下に詳述する。
【0164】
上記(26)のプログラムの上記ステップ(a2’)〜(b2’)は、上記(25)のプログラムの上記ステップ(a2)〜(b2)に対応している。従って、上記(26)のプログラムの上記ステップ(a2’)〜(b2’)は、上記(25)のプログラムの上記ステップ(a2)〜(b2)と同様に行なわれる。
【0165】
また、上記(26)のプログラムの上記ステップ(c2’)〜(f2’)は、上記(13)のプログラムの上記ステップ(g1’)〜(j1’)に対応している。従って、上記(26)のプログラムの上記ステップ(c2’)〜(f2’)は、上記(13)のプログラムの上記ステップ(g1’)〜(j1’)と同様に行なわれる。
【0166】
また、上記ステップ(e2’)とステップ(f2’)の間に、上記ステップ(I)〜(III)を含めることができる。上記ステップ(I)〜(III)は、上記と同様に行なわれる。
【0167】
図8は、上記(28)、及び上記(29)の一部についてのプログラムフローを示すフローチャートである。このプログラムは、標的タンパク質として分子表面にポケットを持ち、かつ結合に伴う構造変化が少ないと考えられる酵素など(例えば、ペプチダーゼ)に特に有用である。なお、上記(28)で行なわれる処理についての概要を図9に示す。以下、上記(28)のプログラムについて詳述するが、より理解を深めるため、標的タンパク質としてカスパーゼを例に挙げて順次説明する。
【0168】
先ず、カスパーゼの基質となるタンパク質について説明し、そのアミノ酸位置について定義する。カスパーゼの基質となるタンパク質の切断部位のアミノ酸配列はX−X−X−Dモチーフである。モチーフ中のDの位置は、基質切断部位のN末端側であるP1部位を示している。P1位はアスパラギン酸を必須とし、各カスパーゼに認識される阻害ペプチドの違いは、残りのP2〜P4位のアミノ酸配列に依存していると考えられる。よって以降は、X−X−X−Dモチーフ中の各アミノ酸位置を明確に示すため、P4−P3−P2−Dとして表現する。
【0169】
上記(28)のプログラムにおける上記ステップ(a3)は、図8のステップ401に対応する。上記ステップ(a3)では、一定の長さのアミノ酸配列を網羅的に生成し、その中からランダムにアミノ酸配列を選択して解析用ライブラリとして抽出する。なお、上記ステップ(a3)には含めていないが、図8のステップ401においてさらに評価用ライブラリを抽出するステップを含めることもできる。上記ステップ(a3)で網羅的に生成されるアミノ酸配列の「一定の長さ」(即ち、アミノ酸残基の数)は、特に限定されないが、好ましくは、2〜10個のアミノ酸残基程度の長さであり、より好ましくは、3〜5個のアミノ酸残基程度の長さである。
【0170】
例えば、P4−P3−P2−Dモチーフを網羅的に解析するには、4個のアミノ酸残基のアミノ酸配列について203、即ち8000通りの組み合わせを考えなければならない(Dは固定されている)。ここでは、例えば、その5%に当たる400個のアミノ酸配列をランダムに選択し、解析用ライブラリとして360個のアミノ酸配列、評価用ライブラリとして40個のアミノ酸配列を抽出することもできる。また、カスパーゼについてはその阻害ペプチドが既知であるが、カスパーゼ阻害ペプチドの複合体結晶構造中の阻害ペプチドは、どのカスパーゼにおいても、ほぼ同じ主鎖構造を保持している。すなわち、カスパーゼ活性部位の形状及び触媒機構がそれを限定しているものと考えられる。このような知見を、ペプチド配座を発生させる際に役立てることもできる。例えば、ペプチド配座を発生させる際、主鎖の構造は結晶構造中の構造を用い、側鎖を付加することにより任意のペプチドを構築することもできる。また、側鎖のVDW接触を除外するためTINKER[参考文献12]を用いてエネルギー最適化を実施することもできる。このとき主鎖はINACTIVEコマンドを用いて固定されてもよい。
【0171】
上記ステップ(b3)は、図8のステップ402に対応する。上記ステップ(b3)では、解析用ライブラリとして抽出された各アミノ酸配列について分子間エネルギーパラメータを計算する。この計算は、上記プログラム(13)の上記ステップ(g1’)と同様にして行なわれる。例えば、P4−P3−P2−Dモチーフに対して網羅的に生成された8000通りのアミノ酸配列について、AutoDockを用いて下記[式18]で示される計算を行うこともできる。
【0172】
【数18】
Figure 0004612270
【0173】
上記式の各係数は、30個のタンパク質−リガンド複合体構造とその実測されたKi値を用いて回帰分析により経験的に定められた値である。なお、AutoDock3.0より配置探索にはラマルク進化論に基づく遺伝的アルゴリズムを新たに採用している。また、ここでは、4残基ペプチドの主鎖を固定し、側鎖を可変としている。設定されるパラメータ値の例を表2に示す。上記のように、計算条件の詳細については、適宜設定可能である。
【0174】
【表2】
Figure 0004612270
【0175】
また、上記ステップ(b3)には含めていないが、抽出されたアミノ酸配列の配置(例えば、RMS(主鎖)に基づくもの)を、対照(例えば、結晶構造中のペプチド)の配置と比較して、不適切な配置をとるものを以降の計算から除外するステップを上記ステップ(b3)に含めることもできる。例えば、P4−P3−P2−Dモチーフのアミノ酸配列について、結晶構造中の阻害ペプチドとのRMS(主鎖)によりその配置を確認する。そして、RMSが大きいものについては、カスパーゼ活性部位に適切に配置されず基質としては機能しないと考え、以降の計算から除外することもできる。どのような配置であれ強く結合すれば問題ないと思われるかもしれないが、FMK、CHOのような修飾基がカスパーゼ活性中心に配置されるためには、ペプチドの適切な配置が必須因子となるためである。
【0176】
上記ステップ(c3)は、図8のステップ403に対応する。上記ステップ(c3)では、上記ステップ(b3)で計算された分子間エネルギーパラメータを用いて、アミノ酸出現頻度に基づくスコアマトリクスが生成される。なお、分子間エネルギーパラメータの閾値(例えば、ΔGの閾値)は、予め設定されていてもよいし、後述するように設定されてもよい。例えば、360個のアミノ酸配列を含む解析用ライブラリを用いて、各ポジションP4、P3、P2における20種類のアミノ酸出現頻度に基づいたPSSマトリクスを生成する。ポジションjにおけるアミノ酸iのPSSijは、上記[式9]により計算される。この場合、ポジションjの範囲は1〜3であり、それぞれP4〜P2に対応し、アミノ酸iの範囲は1〜20であり、それぞれのアミノ酸種に対応する。
【0177】
上記ステップ(d3)は、図8のステップ404に対応する。上記ステップ(d3)では、アミノ酸出現頻度に基づくスコアマトリクスを用いて、アミノ酸出現頻度に基づくスコアを計算する。例えば、PSSマトリクスを用いることにより、4個のアミノ酸残基からなる任意のアミノ酸配列(P4−P3−P2−Dモチーフ:P1はD固定なので考慮しない)のカスパーゼに対する結合力の強さを、上記[式10]により、PSSとして計算することができる。この場合、Cijは20×3のマトリクスであり、0若しくは1の値で構成される。任意のアミノ酸配列のポジションjにおけるアミノ酸iと一致する要素は1、不一致の要素は0とする。
【0178】
上記ステップ(e3)は、図8のステップ405に対応する。上記ステップ(e3)では、ステップ(b3)で計算された分子間エネルギーパラメータと該スコアとの間で相関解析を行い、回帰式を得る。解析用ライブラリに含まれる各アミノ酸配列について、PSSと分子間エネルギーパラメータ(例えば、結合自由エネルギー)との間に高い相関性があれば、新たなアミノ酸配列について高速に分子間エネルギーパラメータを予測することが可能となる。もちろんPSSは各ポジション独立にしか評価できないため、ポジション間におけるアミノ酸の組み合わせによる影響は考慮できない。なお、上記ステップ(c3)で述べた分子間エネルギーパラメータの閾値(例えば、ΔGの閾値)は、PSSと分子間エネルギーパラメータの閾値(例えば、ΔGの閾値)との間の相関係数Rを最大にするように設定されてもよい。この場合には、相関係数Rを最大にするように設定された閾値が、再度、上記ステップ(c3)にフィードバックされ、上記ステップ(c3)、上記ステップ(d3)及び上記ステップ(e3)が再度行なわれる。
【0179】
上記ステップ(f3)は、図8のステップ406に対応する。上記ステップ(f3)では、該回帰式を用いて、アミノ酸出現頻度に基づくスコアマトリクスがアミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスに変換される。この変換では、例えば、上述したPSGマトリクスが作成される。なお、回帰式における定数項は、各ポジションに不均一に分配してもよいが、好ましくは、各ポジションに均一に分配される。
【0180】
上記ステップ(g3)は、図8のステップ407に対応する。上記ステップ(g3)では、アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスから、アミノ酸位置依存的な分子間エネルギーパラメータ値が計算される。例えば、PSGマトリクスを用いることにより、任意の4残基ペプチド(P4−P3−P2−Dモチーフ:P1はD固定なので考慮しない)とカスパーゼ間の結合自由エネルギーをPSGとして高速に計算することができる。
【0181】
上記ステップ(h3)は、図8のステップ408に対応する。上記ステップ(h3)では、所定のアミノ酸位置依存的な分子間エネルギーパラメータ値以下のアミノ酸配列、即ち、閾値以下のアミノ酸配列が抽出される。この値は、予め設定されている値を使用してもよいし、抽出時に設定してもよい。
【0182】
次に、上記(29)のプログラムについて以下に詳述する。
【0183】
上記(29)のプログラムの上記ステップ(a3’)〜(h3’)は、上記(28)のプログラムの上記ステップ(a3)〜(h3)に対応している。従って、上記(29)のプログラムの上記ステップ(a3’)〜(h3’)は、上記(28)のプログラムの上記ステップ(a3)〜(h3)と同様に行なわれる。
【0184】
また、上記(29)のプログラムの上記ステップ(i3’)〜(l3’)は、上記(26)のプログラムの上記ステップ(c2’)〜(f2’)に対応している。従って、上記(29)のプログラムの上記ステップ(i3’)〜(l3’)は、上記(26)のプログラムの上記ステップ(c2’)〜(f2’)と同様に行なわれる。
【0185】
さらに、上記ステップ(k3’)とステップ(l3’)の間に、上記ステップ(I)〜(III)を含めることができる。上記ステップ(I)〜(III)は、上記と同様に行なわれる。
【0186】
また、基質特異性が似ている複数のタンパク質が存在している場合に、これらタンパク質のうちの1つを標的タンパク質として選択し、これに特異的なペプチドを設計する際にも、上記(28)および(29)のプログラムは有用である。例として、上記(28)のプログラムにより説明する。まず、基質特異性が似ている各タンパク質について、上記プログラム(28)の上記ステップ(a3)〜(h3)を行なう。なお、各タンパク質について、上記ステップ(a3)〜(h3)を並行して行ってもよいし、上記ステップ(a3)〜(h3)を順番に行なってもよい。次いで、標的タンパク質とそれ以外のタンパク質について、アミノ酸位置依存的な分子間エネルギーパラメータ値(例えば、PSG)の差を計算し、その差によってフィルターをかけるステップを設ける。この差は、適宜設定可能である。例えば、標的タンパク質に対するKi値が、他のタンパク質のKi値よりも二桁低いものを希望する場合には、ΔGでは、2.728kcal/molに相当するため、これをフィルターとして用いることができる。もちろん、上記プログラム(29)の上記ステップ(h3’)の後に、同様のステップを設け、次いで上記ステップ(i3’)へと進むこともできる。簡単に説明したが、本発明は、上記(28)および(29)のプログラムに、さらに上述したようなステップを含むこともできる。このようなプログラムも本発明の範囲に含まれる。なお、さらなる具体例については、実施例3に記載されており、このようなプログラムの理解に役立つであろう。
【0187】
本発明の上記(17)の記録媒体は、上記した本発明のプログラム(9)〜(16)が、コンピュータ読み取り可能な記録媒体に記録されたものである。ここで「コンピュータ読み取り可能な記録媒体」とは、電子データを記録することができ、且つ必要に応じてコンピュータが読み出すことができる任意の記録媒体をいい、例えば、磁気テープ、磁気ディスク、磁気ドラム、ICカード、光読み取り式ディスク(例えば、CD、DVD)等の可搬情報記録媒体が挙げられる。
【0188】
本発明による上記(18)〜(20)の抽出処理装置、上記(21)〜(23)の抽出処理装置、および上記(31)、(32)の装置は、中央処理装置とメモリとを備えたコンピュータを主体として構成され、上記した本発明のプログラムを実行可能なように有する、生理活性ペプチド抽出処理のための専用機である。
【0189】
上記(18)〜(23)の装置は、標的アミノ酸配列と相互作用する生理活性ペプチドの設計、および標的タンパク質と相互作用する生理活性ペプチドの設計という観点から大きく2つに分けることができる。一方は、上記(18)〜(20)に示す装置であり、これは、標的アミノ酸配列と相互作用する生理活性ペプチドの設計を行うものである。他方は、上記(21)〜(23)に示す装置であり、これは、標的アミノ酸配列との相互作用に加え、標的タンパク質自体との相互作用を考慮して生理活性ペプチドの設計を行うものである。
【0190】
上記(18)〜(20)の装置は、図10に示すように、データ入力部イ、データ編集部ロ、相補アミノ酸配列候補生成部ハ、相補度計算部ニ、相補アミノ酸配列候補記憶部ホ、相補アミノ酸配列探索部ヘ、及び相補アミノ酸配列表示部トを含んで構成される。
上記(18)〜(20)の装置において、該データ入力部イは、上記ステップ(a1)を実行する手段を含み、該データ編集部ロは、上記ステップ(b1)を実行する手段を含み、該相補アミノ酸配列候補生成部ハは、上記ステップ(c1)を実行する手段を含み、該相補度計算部ニは、上記ステップ(d1)を実行する手段を含み、該相補アミノ酸配列候補記憶部ホは、上記ステップ(e1)を実行する手段を含み、該相補アミノ酸配列探索部ヘは、上記ステップ(f1)を実行する手段を含み、該相補アミノ酸配列表示部トは、上記ステップ(g1)を実行する手段を含む。
【0191】
上記(21)〜(23)の装置は、上記(18)〜(20)の装置と同様、図10に示すように、データ入力部イ、データ編集部ロ、相補アミノ酸配列候補生成部ハ、相補度計算部ニ、相補アミノ酸配列候補記憶部ホ、相補アミノ酸配列探索部ヘ、及び相補アミノ酸配列表示部トを含んで構成される。
上記(21)〜(23)の装置において、該データ入力部イは、上記ステップ(a1’)を実行する手段を含み、該データ編集部ロは、上記ステップ(b1’)を実行する手段を含み、該相補アミノ酸配列候補生成部ハは、上記ステップ(c1’)を実行する手段を含み、該相補度計算部ニは、ステップ(k1’)同一のアミノ酸指標に由来する相補度パラメータを、該標的アミノ酸配列に対する1以上の移動平均プロファイル波形と相補アミノ酸配列候補の1以上の相補移動平均プロファイル波形との間でそれぞれ計算し、さらに標的タンパク質の標的部位との分子間エネルギーパラメータを計算する手段(上記ステップ(d1’)(g1’)を実行する手段)を含み、該相補アミノ酸配列候補記憶部ホは、ステップ(l1’)相補アミノ酸配列候補を、該相補度パラメータおよび該分子間エネルギーパラメータとともに記憶する手段(上記ステップ(e1’)(h1’)を実行する手段)を含み、該相補アミノ酸配列探索部ヘは、ステップ(m1’)手段(k1’)によって記憶された情報に基づいて、所定の数の相補アミノ酸配列を抽出する手段(上記ステップ(f1’)(i1’)を実行する手段)を含み、該相補アミノ酸配列表示部トは、ステップ(n1’)該相補アミノ酸配列探索部によって抽出された相補アミノ酸配列を、生理活性ペプチドの候補として表示する手段(上記ステップ(i1’)を実行する手段)を含む。
【0192】
上記(31)、(32)の装置についても、上記(18)〜(23)の装置と同様であって、上記(31)の装置に含まれる「(イ2)相互作用領域特定部、(ロ2)アミノ酸配列第1探索部、(ハ2)分子間エネルギー計算部、(ニ2)アミノ酸配列記憶部、(ホ2)アミノ酸配列第2探索部、(ヘ2)アミノ酸配列表示部」、および、上記(32)の装置に含まれる、「(イ3)アミノ酸配列第1探索部、(ロ3)分子間エネルギー第1計算部、(ハ3)スコアマトリクス生成部、(ニ3)スコア計算部、(ホ3)回帰式形成部、(ヘ3)マトリクス変換部、(ト3)アミノ酸位置依存的エネルギー計算部、(チ3)アミノ酸配列第2探索部、(リ3)分子間エネルギー第2計算部、(ヌ3)アミノ酸配列記憶部、(ル3)アミノ酸配列第3探索部、(オ3)アミノ酸配列表示部」は、いずれも、上記(26)、(29)のプログラムと、該プログラムを実行するよう構成されたコンピュータ(中央演算装置(CPU)、記憶装置(メモリー))、その他、必要に応じてさらに加えられる周辺装置(外部記憶装置、入力装置、表示装置など)によって構成され、さらには他のコンピュータとのネットワークを構成に加えてもよい。
上記(31)の装置に含まれる各部(イ2)〜(ヘ2)、上記(32)の装置に含まれる各部(イ3)〜(オ3)については、それぞれ、上記(26)、(29)のプログラムの説明において、詳細に述べたとおりである。
【0193】
本発明装置は、表示されたデータを印刷するプリンター等の出力装置や、データを保存するための外部記憶装置、本発明のプログラムの実行に必要なデータベースが保存された外部記憶装置等、生理活性ペプチドの設計においてユーザーに利便性を与える他の機器を、構成としてさらに包含することができる。
【0194】
【実施例】
以下、実施例を示して本発明を説明するが、本発明は、以下の特定の実施例に限定されるものではない。
【0195】
実施例1 カスパーゼ−3に対する生理活性ペプチド(阻害ペプチド)の設計カスパーゼ−3の206〜209位のアミノ酸配列WRNS(配列番号109)を標的アミノ酸配列として、それと結合しカスパーゼ−3の活性を阻害するペプチド候補を本発明のプログラムを用いて予測した。アミノ酸指標として疎水度に基づく指標[参考文献3]を用い、ウィンドウ幅は1に設定した。Paveの範囲は−0.39から−0.37、Rtは−0.9と設定し1次スクリーニングにより、105個の相補アミノ酸配列を有するペプチド候補を得た(表3)。なお、表3の順位1〜105の配列を、それぞれ順番に、配列番号4〜108とする。
【0196】
【表3】
Figure 0004612270
Figure 0004612270
【0197】
次いで2次スクリーニングにより結合力の強い相補アミノ酸配列DNLD(配列番号97)(Ki=0.0309nM:1位)、DEVD(配列番号88)(Ki=0.149nM:2位)を得た(表3)。
【0198】
DEVD(配列番号88)はカスパーゼ−3阻害ペプチドとして既知のアミノ酸配列でありKiの実測値および結晶構造が知られている。図11は本発明により予測された相補アミノ酸配列DEVDと結晶構造との比較図を示す。RMS (root mean squar, 原子間の平均的ずれ)(全原子)が2.4Åと結晶構造と非常に近い構造予測に成功している。又、本発明により予測されたKi値が0.149nMに対し、実測値[参考文献13]Kiは0.23nMであった。
【0199】
また、現在知られていないDNLD(配列番号97)というKi値が最も低い0.0309nMの相補アミノ酸配列を得た。DEVDはもともと基質となるタンパク質のアミノ酸配列より得られたものであり、しかもカスパーゼ−3以外にもカスパーゼ−7、カスパーゼ−8に強く結合[参考文献13]し、阻害するという特性があり、特異的阻害剤としての問題点も指摘されている。本システムで提示されるペプチド配列DNLDは全くの新規配列であるため、この特異性の問題を解決できる可能性も与える。
【0200】
以上の結果から、本発明のプログラムは、相補アミノ酸候補の設計において非常に有用であることが確認された。
【0201】
実施例2 Fas(Receptor)に対する生理活性ペプチドの設計
Fas(Receptor)の97〜110位のアミノ酸配列FSSKCRRCRLCDEG(配列番号1)を標的アミノ酸配列として、それと結合して相互作用し得る生理活性ペプチドの候補を、本発明のプログラムを用いて予測した。アミノ酸指標として疎水度に基づく指標[参考文献3]を用い、ウィンドウ幅は5に設定した。Paveの範囲は、−0.15から+0.15、Rtは−0.9と設定し、1次スクリーニングにより、相補アミノ酸配列を有するペプチド候補を得た。次いで、2次スクリーニングにおいて分子間エネルギーを計算した。最終的に相補アミノ酸配列EPPMTFISIHTMCH(配列番号2)を得た。
【0202】
試験例1 相補アミノ酸配列(配列番号2)からなるペプチドによるアポトーシスの誘導
上記実施例1で得られた相補アミノ酸配列(配列番号2)からなるペプチド(以下、Fas相補ペプチドと省略する)を化学合成した。次いで、Fasを発現しているヒト卵巣癌培養細胞株NOS4を用いて、Fas相補ペプチドによるアポトーシス誘導能をそのスクランブルペプチドTFIHPSMHTCMPEI(配列番号3)と比較解析した。なお、NOS4は、重症の卵巣癌患者から切除した癌細胞より、本発明者らの研究室で樹立され、維持されている。ヒト卵巣癌培養細胞株NOS4は、10%ウシ胎仔血清含有RPMI培地中、5%CO2湿気下、37℃で培養した。5×106個のヒト卵巣癌培養細胞株NOS4を、100μg/mlの相補ペプチドの存在下で37℃、24時間処理し、次いでDNA断片化を測定した。DNA断片化は、細胞核をヨウ化プロピジウムで染色し、FACS装置(FACSCalibur, Jose., CA)を用いたフローサイトメトリーにより測定した。その結果、Fas相補ペプチドは、100μg/mlの濃度において、約40%の細胞でアポトーシスを誘導した。以上の結果により、Fas相補ペプチドがFasに対する生理活性ペプチドとして機能することが確認された。
【0203】
【表4】
Figure 0004612270
【0204】
試験例2 Fas相補ペプチドテトラマーによるアポトーシスの誘導
Fas相補ペプチド(以下、FRP−2と省略する場合がある)をリジンポリマー(MAP)の4ブランチに結合させたFas相補ペプチドのテトラマー[(FRP−2)4−MAP]を化学合成した。次いで、(FRP−2)4−MAPのアポトーシス誘導能を上記試験例1と同様の方法を用いて調べた。その結果、Fas相補ペプチドのテトラマーは、5mg/mlの濃度において、約50%のヒト卵巣癌培養細胞株NOS4にアポトーシスを誘導した(図12)。以上の結果から、Fas相補ペプチドはMAPを用いてマルティマー(maltimer)にすることによって、モノマーに比べ約30倍強いアポトーシス誘導能を有することが判明した。
【0205】
試験例3 Fas相補ペプチドのテトラマーによるin vivoにおけるアポトーシス誘導
ヒトグリオーマ細胞株(U251−SP)をヌードマウスの脳内に移植した担癌動物実験系を用いて、(FRP−2)4−MAPのin vivoにおける抗腫瘍効果を調べた。U251−SPをヌードマウスの脳内に移植して1週間後に、(FRP−2)4−MAPを2μg/2μlで脳内の癌組織に局所内注入した。30日後に解剖し、常法によりホルマリン固定による脳組織切断プレパラートを作成し、光学顕微鏡下で観察した。その結果、Fas相補ペプチドのテトラマー処理群では、アポトーシスの誘発による癌細胞死による癌の萎縮が認められた(図13)。以上の一連の結果から、本発明のプログラムは、生理活性ペプチドの設計において非常に有用であることが確認された。
【0206】
実施例3 既存のカスパーゼペプチド阻害剤の評価
まず初めに、カスパーゼ-3,-7,-8,-9を用いて1次スクリーニングを実施した。結果を図14〜17に示す。どのカスパーゼにおいてもPSSとΔGcalcの間に平均-0.71の相関係数R (図14D、15D、16D、17D)を得ることができた。
【0207】
次いで、PSSの予測能力を評価するために、評価用ライブラリに含まれる40ペプチドのPSSを用いΔGcalcとの相関解析(図14E、15E、16E、17E)を実施した。解析ライブラリと同様の値、平均-0.66の相関係数Rを得ることができた。したがって、膨大なペプチドライブラリの1次スクリーニングとして十分に利用可能であると言える。
【0208】
各カスパーゼのPSG評価は、実測Ki値(表5)[参考文献13]が既知の阻害ペプチドAc-WEHD-CHO(配列番号110), Ac-YVAD-CHO(配列番号111), Ac-DEVD-CHO(配列番号112), Boc-IETD-CHO(配列番号113), Boc-AEVD-CHO(配列番号114)を用いて実施した。
【0209】
【表5】
Figure 0004612270
【0210】
Ki値が、10,000nM以上のものは10,000nMとして設定し、Ki値は[式19]によりΔGに変換した(表6)。
【0211】
【数19】
Figure 0004612270
【0212】
【表6】
Figure 0004612270
【0213】
また、5つの阻害ペプチドの予測ΔGは、カスパーゼ-3,-7,-8,-9それぞれのPSGマトリクスを用いて[式4]により計算した。実測値との比較を表6に示す。
【0214】
全体的に予測値は実測値と比較して低い値となっているが、相関係数Rpepを計算すると、その値は平均0.93と高い。これはカスパーゼに対する阻害ペプチドの相対的な親和性予測が可能であることを示す。また相関係数Rcaspを計算すると、その値の平均は0.71であった。これはカスパーゼに対する阻害ペプチドの特異性予測が可能であることを示す。
【0215】
実施例4 カスパーゼ-3特異的阻害ペプチドの設計
PSGマトリクスは高速な親和性及び特異性予測を可能とする。P4-P3-P2-Dで表現可能な8000ペプチドの各カスパーゼに対するΔGは、PSGを用いて高速に計算することができる。カスパーゼ-3特異的阻害ペプチド設計を例として述べる。システム構成は図18に示す。
【0216】
まず、8000ペプチドを含むVirtual Libraryからペプチドを1つ取り出し、カスパーゼ-3,-7,-8,-9それぞれのPSGマトリクスを用いて、PSGcasp-3, PSGcasp-7, PSGcasp-8, PSGcasp-9を計算する。次に下記[式20]を用いてカスパーゼ-7,-8,-9とカスパーゼ-3とのPSGの差を計算する。
【0217】
【数20】
Figure 0004612270
【0218】
本システムにおいてカスパーゼ-3特異的阻害ペプチド候補は、カスパーゼ-7,-8,-9全てに対して二桁低いKi値を有するペプチドとして定義した。Ki値二桁の差はΔGでは約2.728kcal/molの差に相当する。よって各カスパーゼのフィルターとして[式21]を用いた。
【0219】
【数21】
Figure 0004612270
【0220】
以上の操作を8000ペプチド全てに実施し、各カスパーゼのフィルターを全て通過できたペプチドのみが2次スクリーニングにより評価されることになる。最終的に2次スクリーニングで選定された阻害ペプチドを設計ペプチドとしてin vitro及びin vivoで評価する。
【0221】
カスパーゼ-7,-8,-9全てにおいて[式20]を満たすペプチド配列を8000ペプチド配列より選択した。結果を表7に示す。
【0222】
【表7】
Figure 0004612270
【0223】
表7では、各カスパーゼに対するPSGと2次スクリーニング結果であるΔGcalcが示されている。PPVD(配列番号115), QPVD(配列番号116), TPVD(配列番号117)の3ペプチドに関してはPSGとΔGcalcの間に0.93以上の高い相関が見られた。一方SPVD(配列番号118)では上記3ペプチドと比較して、0.73という低い相関であった。SPVDのカスパーゼ-8に対する結合自由エネルギーはPSGでは-9.99kcal/molと予測されたのに対しΔGcalcでは-10.92kcal/molであった。カスパーゼ-3に対するΔGcalcが-11.20kcal/molと高く評価されたことも重なって、カスパーゼ-3,-8においてΔGcalcの差が0.28kcal/molしかない。この結果からカスパーゼ-3特異的阻害ペプチドとして機能しないことが示唆される。
【0224】
PPVD,QPVD,TPVDにおいてもカスパーゼ-3に対するΔGcalcがPSGと比較して高く予測されているため、Ki値で二桁差までは期待できないもののカスパーゼ-3阻害ペプチドとして十分に機能するものと考えられる。
【0225】
結果としてカスパーゼ-3特異的阻害ペプチドとして以下の3つの候補ペプチドを提示する。
【0226】
【表8】
Figure 0004612270
【0227】
実施例5 FasL中のFas結合領域を用いたアポトーシス誘導ペプチドの設計
断片化ペプチドライブラリの作成はまずFas Ligandの細胞外領域にあたる144〜281位をRBD法にかけ、Fasとの結合領域を151〜176位と同定した。次に、この限定領域を,N末側から4残基ずつ抽出し、計23個の断片化ペプチドを得た。
【0228】
Fas(Receptor)に対してもFasLとの結合領域をRBD法により99〜102位に同定した。この99〜102位のアミノ酸配列SKCR(配列番号119)を標的領域として、それと結合して相互作用し得るペプチドを、断片化ペプチドライブラリを用いて、2次スクリーニングより選別した。
【0229】
結果として、Fas Ligand上の領域162〜165のアミノ酸配列WEDT(配列番号120)(Ki=0.19μM)がもっとも結合力のある配列であった(図19)。この領域は、Fas-Fas Ligand複合体モデルからもFASとの結合領域であることが確認されている。
【0230】
次に、3次スクリーニングとして、WEDTをリードペプチドとして1残基目から4残基目まで一残基アミノ酸置換を実施し、変異を実施した(表9)。
【0231】
【表9】
Figure 0004612270
【0232】
表9より、WEWT(配列番号121)のKi値は0.083μMであった。WEWTはWEDTよりもΔGが0.52kcal/mol低くなり、より結合力のあるペプチドと予測され、WEWTを生理活性ペプチド候補として設計した。
【0233】
試験例4 FasL様ペプチドテトラマーによるアポトーシス誘導
Fasは3量体となって作用することから、Fas3量体の形成する空間37Å四方にWEWTペプチド(配列番号121)がうまくはまり込むようにするために、本ペプチドをMAP-8の4アミノ基を保護化した残り4つのブランチに結合させMAP化し、候補ペプチドを作成した(以下,(FLLP-1)4-MAP8と略す。)(図20)。次いで、(FLLP-1)4-MAP8のアポトーシス誘導能を上記試験例1と同様の方法を用いて調べた。その結果、(FLLP-1)4-MAP8は、約0.1μg/mlの濃度において、約50%のヒト卵巣癌培養細胞株NOS4にアポトーシスを誘導した(表10)。
【0234】
【表10】
Figure 0004612270
【0235】
以上の結果より、本手法は極めて有用であることが確認された。
【0236】
参考文献
[1] Nature, 411, 613 (2001)
[2] Morris,G.M. et al, J. Comp. Chem.,19, 1639-1662, (1998)
[3] Eisenberg D, et al., J. Ann. Rev. Biochem., 53, 596-623 (1984)
[4] Cosic I, et al., J IEEE Trans. Biomed. Eng., 32, 337-341 (1985)
[5] Gallet X. et al, J. Mol. Biol., 302, 917-926 (2000)
[6] Zhao, Y. et al., J. Immunol. 167, 2130-2141 (2001)
[7] Eisenberg D, et al., Proc. Natl. Acad. Sci. USA, 81, 140 (1984)
[8] Allinger NL, et al. J. Am. Chem. Soc., 99, 8127-8134 (1977)
[9] Weiner SJ, et al., J. Am. Chem. Soc., 106, 765-784 (1984)
[10] Brooks BR, et al., J. Comput. Chem., 4, 187 (1983)
[11] Wang J, et al., Proteins, 36, 1-19 (1999)
[12] Pappu,R.V. et al, J. Phys. Chem. B, 102, 9725-9742 (1998)
[13] Garcia-Calvo M, et al., J. Biol. Chem., 273, 32608-32613 (1998)
【0237】
【発明の効果】
本発明によれば、費用及び時間のかかる生化学的手法や、信頼性に乏しく候補の絞り込みが不可能な従来の生理活性ペプチド予測理論を用いることなく、経済的で迅速かつ効率的な生理活性ペプチドの設計が数学的計算によって可能となる。また、本発明によれば、1次スクリーニングとして複数の評価法を、標的タンパク質の性質に応じて適宜選択できる。さらに、本発明によれば、3次スクリーニングにおいてアミノ酸置換を施しそれらを評価することによって、最適化されたアミノ酸配列を有する生理活性ペプチドの取得が可能になる。
【0238】
【配列表フリーテキスト】
配列番号1:Fasの97〜110位のアミノ酸配列。
配列番号2:Fasの97〜110位のアミノ酸配列に相補的なアミノ酸配列。
配列番号3:配列番号2のアミノ酸配列をスクランブルしたアミノ酸配列。
配列番号4〜108:カスパーゼ−3の206〜209位のアミノ酸配列に相補的なアミノ酸配列候補。
配列番号109:カスパーゼ−3の206〜209位のアミノ酸配列。
配列番号110:カスパーゼ阻害剤のアミノ酸配列。
配列番号111:カスパーゼ阻害剤のアミノ酸配列。
配列番号112:カスパーゼ阻害剤のアミノ酸配列。
配列番号113:カスパーゼ阻害剤のアミノ酸配列。
配列番号114:カスパーゼ阻害剤のアミノ酸配列。
配列番号115:カスパーゼ−3特異的阻害剤のアミノ酸配列。
配列番号116:カスパーゼ−3特異的阻害剤のアミノ酸配列。
配列番号117:カスパーゼ−3特異的阻害剤のアミノ酸配列。
配列番号118:カスパーゼ−3非特異的阻害剤のアミノ酸配列。
配列番号119:Fasの99〜102位のアミノ酸配列。
配列番号120:Fasリガンドの162〜165位のアミノ酸配列。
配列番号121:アポトーシス誘導ペプチドのアミノ酸配列。
【0239】
【配列表】
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270

【図面の簡単な説明】
【図1】生理活性ペプチド設計の一例を示す。
【図2】生理活性ペプチド設計における本発明のシステム全体を示す。
【図3】1次スクリーニングの選択に用いられるプログラムのフローチャートを示す。
【図4】生理活性ペプチドの設計に用いられるプログラムのフローチャートを示す。なお、このフローチャートは、1次スクリーニングとしてアミノ酸相補プロファイル波形評価を行い、さらに2次スクリーニングを行なったものに対応する。
【図5】生理活性ペプチド設計における、3次スクリーニングについてのプログラムのフローチャートを示す。
【図6】アミノ酸相互作用領域評価(1次スクリーニング)についてのプログラムのフローチャートを示す。
【図7】リガンド(タンパク質)のアミノ酸配列からの断片化ペプチドの抽出を示す。
【図8】アミノ酸位置依存的結合有意性評価(1次スクリーニング)についてのプログラムのフローチャートを示す。
【図9】アミノ酸位置依存的結合有意性評価(1次スクリーニング)の概要を示す。
【図10】生理活性ペプチドを設計するための装置の構成の例を示す。
【図11】相補アミノ酸配列DEVDと結晶構造の重ね合わせを示す。
【図12】Fas相補ペプチドテトラマーのアポトーシス誘導能を示す。
【図13】Fas相補ペプチドテトラマーで処理したマウス脳組織と腫瘍体積の統計データを示す。
【図14】カスパーゼー3を標的タンパク質として、1次スクリーニング(アミノ酸位置依存的結合有意性評価)を行なった結果について示す。図14Aは、モチーフの各位置でのPSSを示す。図14Bは、モチーフの各位置でのPSSマトリクスを示す。図14Cは、モチーフの各位置でのPSGマトリクスを示す。図14Dは、解析用ライブラリを用いた相関解析を示す。図14Eは、評価用ライブラリを用いた相関解析を示す。
【図15】カスパーゼー7を標的タンパク質として、1次スクリーニング(アミノ酸位置依存的結合有意性評価)を行なった結果について示す。図15Aは、モチーフの各位置でのPSSを示す。図15Bは、モチーフの各位置でのPSSマトリクスを示す。図15Cは、モチーフの各位置でのPSGマトリクスを示す。図15Dは、解析用ライブラリを用いた相関解析を示す。図15Eは、評価用ライブラリを用いた相関解析を示す。
【図16】カスパーゼー8を標的タンパク質として、1次スクリーニング(アミノ酸位置依存的結合有意性評価)を行なった結果について示す。図16Aは、モチーフの各位置でのPSSを示す。図16Bは、モチーフの各位置でのPSSマトリクスを示す。図16Cは、モチーフの各位置でのPSGマトリクスを示す。図16Dは、解析用ライブラリを用いた相関解析を示す。図16Eは、評価用ライブラリを用いた相関解析を示す。
【図17】カスパーゼー9を標的タンパク質として、1次スクリーニング(アミノ酸位置依存的結合有意性評価)を行なった結果について示す。図17Aは、モチーフの各位置でのPSSを示す。図17Bは、モチーフの各位置でのPSSマトリクスを示す。図17Cは、モチーフの各位置でのPSGマトリクスを示す。図17Dは、解析用ライブラリを用いた相関解析を示す。図17Eは、評価用ライブラリを用いた相関解析を示す。
【図18】カスパーゼ−3特異的阻害ペプチドの設計におけるシステム構成を示す。
【図19】Fas(99−102)に対するFas Ligand4残基ペプチドの結合自由エネルギーを示す。
【図20】4つのWEWTペプチドをMAP−8に結合させることによって得られたペプチドを示す。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a method for developing useful peptidic drugs. In particular, the present invention specifically describes a method for designing a physiologically active peptide capable of binding to a target site consisting of an arbitrary continuous amino acid sequence and a discontinuous amino acid sequence on a protein, an apparatus therefor, and the method described above. The present invention relates to a program for causing a computer to execute, and a computer-readable recording medium on which the program is recorded.
[0002]
[Prior art]
Various biological signals (neurotransmitters, hormones, cytokines) emitted from the extracellular information transmission system (neural system, endocrine system, immune system) stretched in the body are received by the intracellular information transmission system in the target cell.・ It is transmitted and an appropriate response is made. Here, many biological signals are transmitted by interaction between proteins. For example, various protein-protein interactions are involved in the binding of cell surface receptors and their specific ligands, as well as in signal transduction from intracellular cytoplasm to the nucleus. Therefore, the modulation and abnormality of the intracellular information transmission system are closely related to the development of many serious diseases. Therefore, there is an urgent need to create molecules that can control (promote or suppress) protein-protein interactions as targets. At present, research and development of bioactive peptides capable of interacting with target proteins are actively conducted as a means of elucidating protein-protein interactions such as ligand-receptors and as a means of treating diseases caused by abnormal signal cascades. ing.
[0003]
Biologically active peptides play an important role in the control of various physiological functions as information transmitters in vivo. However, since there are only a small amount of physiologically active peptides in nature and it is very difficult to purify, 100 species have not been found so far. On the other hand, it is speculated that there are a considerable number of orphan receptors that are considered to be physiologically active peptide receptors due to the accumulation of genome databases, and the search for their ligands is an important key for the development of new drugs. Examples of peptidic drugs currently in clinical application and those being developed include 1) hypothalamic hormone derivatives, 2) posterior pituitary hormone derivatives, 3) ANP derivatives, 4) calcium-regulating hormones, 5 ) Peptide antibiotics. Recently, a novel bioactive peptide has been discovered using cells in which orphan receptors are expressed. Using this technique, Takeda Pharmaceutical Industries discovered a peptide ligand “metastin” for orphan receptors that suppresses cancer metastasis [Reference 1]. It is expected that useful peptide drugs will be developed as bioactive peptides are further searched in the future.
[0004]
However, an effective methodology for predicting the amino acid sequence of a peptide that can bind to and interact with any amino acid sequence of a protein has not been established at present, and bioactive peptides are usually screened by biochemical techniques. Has been. For example, synthesizing a plurality of continuous peptides consisting of 10 to 20 amino acids from the N-terminal to the C-terminal from another protein known to bind to a certain protein, and selecting a bioactive peptide from them Alternatively, a method is used in which a bioactive peptide is selected from a randomized peptide library using a phage library. However, such a biochemical method has a problem of being expensive and time consuming. Therefore, development of a method for designing a physiologically active peptide in a theoretical, more economical and simple manner has been awaited instead of the conventional method.
[0005]
On the other hand, several theories for predicting a bioactive peptide sequence for a target amino acid sequence have been proposed so far. Watson-Crick published a DNA helical model and claimed that there were base pairs but no amino acid pairs, but a minority opinion that amino acid pairs may exist was originally present (e.g. Non-Patent Document 1).
[0006]
The sense-antisense theory proposed by Blalock et al. (See, for example, Non-Patent Document 2) is also premised on amino acid pairs. The contents of two peptides encoded by two complementary DNAs are the same as the bases. The hypothesis that they interact. Based on this theory, it has been experimentally confirmed that several antisense peptides interact with sense peptides.
[0007]
On the other hand, B1alock et al. Pointed out that the sense peptide and antisense peptide have high <hydrophobic complementarity>, and Fassina et al. Reported that the average hydrophobicity of five or more consecutive odd amino acids in a peptide In some experiments, it was shown that a complementary peptide having a complementary hydrophobicity (with the same absolute value and opposite positive and negative) binds to the original peptide (see, for example, Non-Patent Document 3). However, many theories have been reported in any theory, and it cannot be said that it is sufficient for application to prediction of general bioactive peptides. In any theory, multiple amino acid candidates can be considered for one amino acid in the target amino acid sequence. As a result, the number of peptide candidates predicted is enormous, and all of them are studied. To do still has a tremendous amount of time, money and effort.
[0008]
Further, even if it succeeds in obtaining a physiologically active peptide consisting of an amino acid sequence that interacts with a target amino acid sequence, there are further problems. Protein target sites for drug discovery include ligand binding sites (eg receptors), substrate binding sites (eg enzymes), protein interaction sites (eg transcription factors, multimers (eg , Dimer) in the case of forming protein), etc., but these target sites are separated from each other on the primary structure rather than composed of one continuous amino acid sequence. It is very often composed of the partial amino acid sequence. Therefore, even if a bioactive peptide comprising an amino acid sequence that interacts with a target amino acid sequence is obtained, the amino acid sequence is often not preferred for other amino acid sequences present at the target site.
[0009]
In addition, when the target site of the target protein is composed of a plurality of partial amino acid sequences that are located apart on the primary structure, conventionally, a specific peptide interacts with the target site of the target protein. Whether or not to do so has been performed, for example, by docking using molecular modeling and evaluating energetically. In order to evaluate more peptides by such a technique, practically, for example, in docking using a library containing thousands to hundreds of thousands of small molecules, the evaluation time per compound is 1 at most. It must be kept to a minute. However, even with 4 residues, there are as many as 20 variable sites on the side chain alone. For example, in Flexible Docking using AutoDock (see, for example, Non-Patent Document 4), the evaluation time on the Compac Alpha DS20E is: Approximately 10 minutes were required per peptide. For example, 20 for a 3-residue peptideThreeThat is, in the case of a 8000 times 6-residue peptide, it is necessary to carry out 64,000,000 times of docking, and comprehensive screening is extremely difficult in practice.
[0010]
For the above reasons, development of a rapid bioactive peptide design method having excellent binding ability to a target site of a protein has been desired.
[0011]
[Non-Patent Document 1]
"Journal of the Theoretical Biology", 1982, 94, p885-894.
[Non-Patent Document 2]
“Biochemical Biophysical Research Communication”, 1984, 121, p203-207.
[Non-Patent Document 3]
“Archives of Biochemistry and Biophysics”, 1992, 296, p137-143.
[Non-Patent Document 4]
“Journal of Computational Chemistry”, 1998, Vol. 19, p 1639-1662
[0012]
[Problems to be solved by the invention]
An object of the present invention is to provide a means for designing a bioactive peptide with higher certainty by a mathematical technique from the primary structure of a target amino acid sequence. A further object of the present invention is to provide means for designing a preferred bioactive peptide in consideration of not only the target amino acid sequence but also the target protein itself containing the target amino acid sequence.
[0013]
[Means for Solving the Problems]
As a result of diligent research to achieve the above object, the inventors of the present invention applied a profile waveform created by applying an arbitrary amino acid index to the target amino acid sequence, for example, an index based on hydrophobicity and electrical characteristics. We have successfully developed a new program that can rank and extract complementary amino acid sequences that satisfy the complementarity definition detailed below. In addition, the present inventors have designed an amino acid sequence that interacts with a target site when the target site of the target protein is composed of a plurality of partial amino acid sequences that are located apart on the primary structure. We have also succeeded in developing our own new programs that are particularly useful in Japan.
[0014]
The present inventors further provide a method, program, and computer-readable record that can predict whether or not the complementary amino acid sequence extracted above can act as a preferred bioactive peptide for the target protein itself including the target amino acid sequence. Media and apparatus were independently developed to complete the present invention.
[0015]
That is, the present invention has the following characteristics.
(1) A method for designing a bioactive peptide capable of interacting with a target amino acid sequence,
(A1) receiving sequence data input of a target amino acid sequence;
(B1) converting the target amino acid sequence into one or more moving average profile waveforms according to one or more predetermined amino acid indices;
(C1) generating a complementary amino acid sequence candidate of the target amino acid sequence and converting it into one or more complementary moving average profile waveforms using the same one or more amino acid indices as in step (b1);
(D1) calculating a complementarity parameter derived from the same amino acid index between at least one moving average profile waveform for the target amino acid sequence and at least one complementary moving average profile waveform of the complementary amino acid sequence candidate; ,
(E1) storing a complementary amino acid sequence candidate together with the complementation parameter in a storage means;
(F1) extracting a predetermined number of complementary amino acid sequences based on the information stored in step (e1);
(G1) displaying the extracted complementary amino acid sequence as a candidate for a physiologically active peptide.
[0016]
(2) The method according to (1) above, wherein the complementarity parameter is a correlation coefficient between a moving average profile waveform for the target amino acid sequence and a complementary moving average profile waveform of a complementary amino acid sequence candidate.
[0017]
(3) The amino acid index is based on an index based on hydrophobicity, an index based on electrical characteristics, an index representing the ease of taking α-helix and β-sheet, and an index representing the relative size of the side chain volume. The method of (1) or (2) above, which is one or more selected indicators.
[0018]
(4) Steps using one or more different amino acid indices for the predetermined number of complementary amino acid sequences extracted in steps (a1) to (f1) using one or more predetermined amino acid indices ( Any one of the above (1) to (3), wherein the complementary amino acid sequence candidates extracted as bioactive peptides are further narrowed down by repeating the steps b1) to (f1) one or more times. The method described.
[0019]
(5) A method of designing a physiologically active peptide capable of interacting with a target protein,
(A1 ') receiving sequence data input of a target amino acid sequence in the target protein;
(B1 ') converting the target amino acid sequence into one or more moving average profile waveforms according to one or more predetermined amino acid indices;
(C1 ′) generating a complementary amino acid sequence candidate of the target amino acid sequence and converting it to one or more complementary moving average profile waveforms using the same one or more amino acid indices as in step (b1 ′);
(D1 ′) calculating a complementation parameter derived from the same amino acid index between one or more moving average profile waveforms for the target amino acid sequence and one or more complementary moving average profile waveforms of the complementary amino acid sequence candidates, respectively When,
(E1 ') storing a complementary amino acid sequence candidate together with the complementation parameter in a storage means;
(F1 ') extracting a predetermined number of complementary amino acid sequence candidates based on the information stored in step (e1');
(G1 ') for the extracted complementary amino acid sequence candidates, calculating an intermolecular energy parameter with the target site of the target protein;
(H1 ') storing a complementary amino acid sequence candidate together with the intermolecular energy parameter in a storage means;
(I1 ') extracting a predetermined number of complementary amino acid sequences based on the information stored in step (h1');
(J1 ′) displaying the extracted complementary amino acid sequence as a candidate for a bioactive peptide.
[0020]
(6) The method according to (5) above, wherein the complementarity parameter is a correlation coefficient between a moving average profile waveform for the target amino acid sequence and a complementary moving average profile waveform of a complementary amino acid sequence candidate.
[0021]
(7) The amino acid index is based on an index based on hydrophobicity, an index based on electrical characteristics, an index representing the ease of taking α-helix and β-sheet, and an index representing the relative size of the side chain volume. The method of (5) or (6) above, which is one or more selected indicators.
[0022]
(8) One or more other amino acid indices are used for the predetermined number of complementary amino acid sequence candidates extracted in steps (a1 ′) to (f1 ′) using one or more predetermined amino acid indices. Step (b1 ′) to (f1 ′) is repeated one or more times to narrow down complementary amino acid sequence candidates, and then steps (g1 ′) to (i1 ′) are performed. The method according to any one of (5) to (7).
[0023]
(9) A program for designing a bioactive peptide capable of interacting with a target amino acid sequence,
(A1) receiving sequence data input of a target amino acid sequence;
(B1) converting the target amino acid sequence into one or more moving average profile waveforms according to one or more predetermined amino acid indices;
(C1) generating a complementary amino acid sequence candidate of the target amino acid sequence and converting it into one or more complementary moving average profile waveforms using the same one or more amino acid indices as in step (b1);
(D1) calculating a complementarity parameter derived from the same amino acid index between at least one moving average profile waveform for the target amino acid sequence and at least one complementary moving average profile waveform of the complementary amino acid sequence candidate; ,
(E1) storing a complementary amino acid sequence candidate together with the complementation parameter in a storage means;
(F1) extracting a predetermined number of complementary amino acid sequences based on the information stored in step (e1);
(G1) A program for causing a computer to execute the step of displaying the extracted complementary amino acid sequence as a candidate for a physiologically active peptide.
[0024]
(10) The program according to (9), wherein the complementarity parameter is a correlation coefficient between a moving average profile waveform for the target amino acid sequence and a complementary moving average profile waveform for a complementary amino acid sequence candidate.
[0025]
(11) The amino acid index is based on an index based on hydrophobicity, an index based on electrical characteristics, an index representing the ease of taking α-helix and β-sheet, and an index representing the relative size of the side chain volume. The program according to (9) or (10), which is one or more selected indices.
[0026]
(12) Steps using one or more different amino acid indexes for the predetermined number of complementary amino acid sequences extracted in steps (a1) to (f1) using one or more predetermined amino acid indexes ( Any one of (9) to (11) above, wherein the complementary amino acid sequence candidates extracted as the bioactive peptide are further narrowed down by repeating the steps b1) to (f1) one or more times. The listed program.
[0027]
(13) A program for designing a bioactive peptide capable of interacting with a target protein,
(A1 ') receiving sequence data input of a target amino acid sequence in the target protein;
(B1 ') converting the target amino acid sequence into one or more moving average profile waveforms according to one or more predetermined amino acid indices;
(C1 ′) generating a complementary amino acid sequence candidate of the target amino acid sequence and converting it to one or more complementary moving average profile waveforms using the same one or more amino acid indices as in step (b1 ′);
(D1 ′) calculating a complementation parameter derived from the same amino acid index between one or more moving average profile waveforms for the target amino acid sequence and one or more complementary moving average profile waveforms of the complementary amino acid sequence candidates, respectively When,
(E1 ') storing a complementary amino acid sequence candidate together with the complementation parameter in a storage means;
(F1 ') extracting a predetermined number of complementary amino acid sequence candidates based on the information stored in step (e1');
(G1 ') for the extracted complementary amino acid sequence candidates, calculating an intermolecular energy parameter with the target site of the target protein;
(H1 ') storing a complementary amino acid sequence candidate together with the intermolecular energy parameter in a storage means;
(I1 ') extracting a predetermined number of complementary amino acid sequences based on the information stored in step (h1');
(J1 ') A program for causing a computer to execute the step of displaying the extracted complementary amino acid sequence as a candidate for a physiologically active peptide.
[0028]
(14) The program according to (13), wherein the complementarity parameter is a correlation coefficient between a moving average profile waveform for the target amino acid sequence and a complementary moving average profile waveform of a complementary amino acid sequence candidate.
[0029]
(15) The amino acid index is based on an index based on hydrophobicity, an index based on electrical characteristics, an index representing the ease of taking α-helix and β-sheet, and an index representing the relative size of the side chain volume. The program according to (13) or (14), which is one or more selected indices.
[0030]
(16) One or more different amino acid indices are used for the predetermined number of complementary amino acid sequence candidates extracted in steps (a1 ′) to (f1 ′) using one or more predetermined amino acid indices. Step (b1 ′) to (f1 ′) is repeated one or more times to narrow down complementary amino acid sequence candidates, and then steps (g1 ′) to (i1 ′) are performed. (13) The program according to any one of (15).
[0031]
(17) A computer-readable recording medium on which the program according to any one of (9) to (16) is recorded.
[0032]
(18) A device for designing a physiologically active peptide capable of interacting with a target amino acid sequence, comprising (a) a data input unit, (b) a data editing unit, and (c) a complementary amino acid sequence candidate generation unit. , (D) a complementation degree calculation unit, (e) a complementary amino acid sequence candidate storage unit, (f) a complementary amino acid sequence search unit, and (g) a complementary amino acid sequence display unit,
The data input unit includes (a1) means for receiving sequence data input of a target amino acid sequence,
The data editing unit includes (b1) means for converting the target amino acid sequence into one or more moving average profile waveforms according to one or more predetermined amino acid indices.
The complementary amino acid sequence candidate generation unit (c1) generates a complementary amino acid sequence candidate of the target amino acid sequence, and generates one or more complementary moving average profile waveforms using the same one or more amino acid indices as in step (b1). Including means for converting,
The complementation degree calculation unit (d1) calculates a complementation parameter derived from the same amino acid index as one or more moving average profile waveforms for the target amino acid sequence and one or more complementary moving average profile waveforms of complementary amino acid sequence candidates. Including means for calculating each between
The complementary amino acid sequence candidate storage unit includes (e1) means for storing a complementary amino acid sequence candidate together with the complementation degree parameter,
The complementary amino acid sequence searching unit includes (f1) means for extracting a predetermined number of complementary amino acid sequences based on the information stored in the means (e1),
The complementary amino acid sequence display unit includes (g1) means for displaying the complementary amino acid sequence extracted by the means (f1) as a candidate for a physiologically active peptide.
[0033]
(19) The apparatus according to (18), wherein the complementarity parameter is a correlation coefficient between a moving average profile waveform for the target amino acid sequence and a complementary moving average profile waveform of a complementary amino acid sequence candidate.
[0034]
(20) The amino acid index includes an index based on hydrophobicity, an index based on electrical characteristics, an index indicating ease of taking α-helix and β-sheet, and an index indicating the relative size of side chain volume. The apparatus according to (18) or (19), which is one or more selected indicators.
[0035]
(21) A device for designing a physiologically active peptide capable of interacting with a target protein, comprising (a) a data input unit, (b) a data editing unit, (c) a complementary amino acid sequence candidate generation unit, (D) a complementation degree calculation unit, (e) a complementary amino acid sequence candidate storage unit, (f) a complementary amino acid sequence search unit, and (g) a complementary amino acid sequence display unit,
The data input unit includes (a1 ′) means for receiving sequence data input of a target amino acid sequence in the target protein,
The data editing unit includes (b1 ') means for converting the target amino acid sequence into one or more moving average profile waveforms according to one or more predetermined amino acid indices.
The complementary amino acid sequence candidate generation unit (c1 ′) generates a complementary amino acid sequence candidate of the target amino acid sequence, and uses one or more complementary moving average profiles using the same one or more amino acid indices as the means (b1 ′). Including means for converting to a waveform;
The complementation degree calculation unit includes (k1 ′) a complementation parameter derived from the same amino acid index, one or more moving average profile waveforms for the target amino acid sequence, and one or more complementary moving average profile waveforms of complementary amino acid sequence candidates. Means for calculating the intermolecular energy parameter with the target site of the target protein,
The complementary amino acid sequence candidate storage unit includes means for storing (11 ') complementary amino acid sequence candidates together with the complementarity parameter and the intermolecular energy parameter;
The complementary amino acid sequence search unit includes means for extracting a predetermined number of complementary amino acid sequences based on the information stored by the (m1 ′) means (k1 ′),
The complementary amino acid sequence display unit includes (n1 ′) means for displaying the complementary amino acid sequence extracted by the complementary amino acid sequence search unit as a candidate for a physiologically active peptide.
[0036]
(22) The apparatus according to (21), wherein the complementarity parameter is a correlation coefficient between a moving average profile waveform for the target amino acid sequence and a complementary moving average profile waveform of a complementary amino acid sequence candidate.
[0037]
(23) The amino acid index is based on an index based on hydrophobicity, an index based on electrical characteristics, an index representing the ease of taking α-helix and β-sheet, and an index representing the relative size of the side chain volume. The apparatus according to (21) or (22), which is one or more selected indices.
[0038]
(24) Furthermore, between step (i1 ') and step (j1'),
(I) generating an amino acid sequence in which an amino acid mutation is introduced into the amino acid sequence extracted in step (i1 ');
(II) calculating an intermolecular energy parameter between the amino acid sequence generated in step (I) and the target site of the target protein;
(III) The intermolecular energy parameter calculated in step (II) is compared with the intermolecular energy parameter between the amino acid sequence extracted in step (i1 ′) and the target site of the target protein as a control. And extracting an amino acid sequence having an intermolecular energy parameter that is more stable than the energy parameter, the program according to any one of (13) to (16) above.
[0039]
(25) A program for designing a physiologically active peptide capable of interacting with a target protein,
(A2) identifying an interaction region in the protein that interacts with the target site of the target protein;
(B2) A program for causing a computer to execute the step of extracting an amino acid sequence having an arbitrary length from the interaction region.
[0040]
(26) A program for designing a physiologically active peptide capable of interacting with a target protein,
(A2 ') identifying an interaction region in the protein that interacts with the target site of the target protein;
(B2 ') extracting an amino acid sequence of an arbitrary length from the interaction region;
(C2 ') calculating an intermolecular energy parameter with the target site of the target protein for the extracted amino acid sequence;
(D2 ') storing the amino acid sequence together with the intermolecular energy parameter in a storage means;
(E2 ') extracting a predetermined number of amino acid sequences based on the information stored in step (d2');
(F2 ') A program for causing a computer to execute the step of displaying the extracted amino acid sequence as a candidate for a physiologically active peptide.
[0041]
(27) Further, between step (e2 ') and step (f2'),
(I) generating an amino acid sequence in which an amino acid mutation is introduced into the amino acid sequence extracted in step (e2 ');
(II) calculating an intermolecular energy parameter between the amino acid sequence generated in step (I) and the target site of the target protein;
(III) The intermolecular energy parameter calculated in step (II) is compared with the intermolecular energy parameter between the amino acid sequence extracted in step (e2 ′) and the target site of the target protein as a control. And extracting an amino acid sequence having an intermolecular energy parameter that is more stable than the energy parameter.
[0042]
(28) A program for designing a bioactive peptide capable of interacting with a target protein,
(A3) comprehensively generating an amino acid sequence of a certain length, randomly selecting an amino acid sequence from the amino acid sequence and extracting it as an analysis library;
(B3) calculating an intermolecular energy parameter for each amino acid sequence extracted as an analysis library;
(C3) generating a score matrix based on the appearance frequency of amino acids using the intermolecular energy parameter calculated in step (b3);
(D3) calculating a score based on the amino acid appearance frequency using a score matrix based on the amino acid appearance frequency;
(E3) performing a correlation analysis between the intermolecular energy parameter calculated in step (b3) and the score to obtain a regression equation;
(F3) converting the score matrix based on the amino acid appearance frequency into a matrix based on the amino acid position-dependent intermolecular energy parameter using the regression equation;
(G3) calculating an amino acid position-dependent intermolecular energy parameter value from a matrix based on the amino acid position-dependent intermolecular energy parameter;
(H3) A program for causing a computer to execute a step of extracting an amino acid sequence that is equal to or less than a predetermined amino acid position-dependent intermolecular energy parameter value.
[0043]
(29) A program for designing a bioactive peptide capable of interacting with a target protein,
(A3 ′) comprehensively generating an amino acid sequence of a certain length, randomly selecting an amino acid sequence from the amino acid sequence, and extracting it as an analysis library;
(B3 ') calculating an intermolecular energy parameter for each amino acid sequence extracted as an analysis library;
(C3 ′) using the intermolecular energy parameter calculated in step (b3 ′) to generate a score matrix based on the appearance frequency of amino acids;
(D3 ') calculating a score based on the amino acid appearance frequency using a score matrix based on the amino acid appearance frequency;
(E3 ') performing a correlation analysis between the intermolecular energy parameter calculated in step (b3') and the score to obtain a regression equation;
(F3 ') using the regression equation, converting a score matrix based on the amino acid appearance frequency into a matrix based on an amino acid position-dependent intermolecular energy parameter;
(G3 ') calculating an amino acid position-dependent intermolecular energy parameter value from a matrix based on the amino acid position-dependent intermolecular energy parameter;
(H3 ') extracting an amino acid sequence equal to or lower than a predetermined amino acid position-dependent intermolecular energy parameter value;
(I3 ') calculating an intermolecular energy parameter with the target site of the target protein for the extracted amino acid sequence;
(J3 ') storing the amino acid sequence together with the intermolecular energy parameter in a storage means;
(K3 ') extracting a predetermined number of amino acid sequences based on the information stored in step (j3');
(L3 ') A program for causing a computer to execute the step of displaying the amino acid sequence extracted in step (k3') as a candidate for a bioactive peptide.
[0044]
(30) Further, between step (k3 ') and step (l3'),
(I) generating an amino acid sequence in which an amino acid mutation is introduced into the amino acid sequence extracted in step (k3 ');
(II) calculating an intermolecular energy parameter between the amino acid sequence generated in step (I) and the target site of the target protein;
(III) The intermolecular energy parameter calculated in step (II) is compared with the intermolecular energy parameter between the amino acid sequence extracted in step (k3 ′) and the target site of the target protein as a control. And extracting an amino acid sequence having an intermolecular energy parameter that is more stable than the energy parameter.
[0045]
(31) A device for designing a physiologically active peptide capable of interacting with a target protein, wherein (b) an interaction region specifying part, (b) an amino acid sequence first search part, and (c) 2) An intermolecular energy calculation unit; (d) an amino acid sequence storage unit; (e) an amino acid sequence second search unit; (f) an amino acid sequence display unit;
The interaction region specifying unit includes (a2 ′) means for specifying an interaction region in a protein molecule that interacts with a target site of a target protein,
The amino acid sequence first search unit includes (b2 ') means for extracting an amino acid sequence of an arbitrary length from the interaction region,
The intermolecular energy calculation unit includes (c2 ′) a means for calculating an intermolecular energy parameter between the extracted amino acid sequence and the target site of the target protein,
The amino acid sequence storage unit includes (d2 ′) means for storing the amino acid sequence together with the intermolecular energy parameter in a storage means,
The amino acid sequence second search unit includes means for extracting a predetermined number of amino acid sequences based on the information stored in (e2 ′) step (d2 ′),
The amino acid sequence display unit includes (f2 ′) means for displaying the extracted amino acid sequence as a candidate for a bioactive peptide.
[0046]
(32) An apparatus for designing a physiologically active peptide capable of interacting with a target protein, comprising (a) an amino acid sequence first search unit, (b) a first intermolecular energy first calculation unit, 3) a score matrix generation unit, (d) 3) a score calculation unit, (e) 3) a regression formula formation unit, (f) a matrix conversion unit, (g) an amino acid position-dependent energy calculation unit, (3) Amino acid sequence second search unit, (3) Intermolecular energy second calculation unit, (3) Amino acid sequence storage unit, (3) Amino acid sequence third search unit, (3) An amino acid sequence display unit,
The amino acid sequence first search unit includes (a3 ′) a means for comprehensively generating an amino acid sequence of a certain length, selecting an amino acid sequence randomly from among them, and extracting it as an analysis library,
The intermolecular energy first calculation unit includes (b3 ') means for calculating an intermolecular energy parameter for each amino acid sequence extracted as an analysis library,
The score matrix generator includes (c3 ′) means for generating a score matrix based on the appearance frequency of amino acids using the intermolecular energy parameter calculated in step (b3 ′),
The score calculator includes (d3 ′) means for calculating a score based on the appearance frequency of amino acids using a score matrix based on the appearance frequency of amino acids,
The regression equation forming unit includes means for performing a correlation analysis between the intermolecular energy parameter calculated in (e3 ′) step (b3 ′) and the score to obtain a regression equation,
The matrix conversion unit includes (f3 ′) means for converting a score matrix based on an amino acid appearance frequency into a matrix based on an amino acid position-dependent intermolecular energy parameter using the regression equation,
The amino acid position-dependent energy calculation unit includes (g3 ′) means for calculating an amino acid position-dependent intermolecular energy parameter value from a matrix based on the amino acid position-dependent intermolecular energy parameter,
The amino acid sequence second search unit includes (h3 ′) means for extracting an amino acid sequence that is equal to or lower than a predetermined amino acid position-dependent intermolecular energy parameter value,
The intermolecular energy second calculation unit includes (i3 ′) means for calculating an intermolecular energy parameter with the target site of the target protein for the extracted amino acid sequence,
The amino acid sequence storage unit includes (j3 ′) means for storing the amino acid sequence together with the intermolecular energy parameter in a storage means,
The amino acid sequence search unit includes means for extracting a predetermined number of amino acid sequences based on the information stored in (k3 ′) step (j3 ′),
The amino acid sequence display unit includes means for displaying the amino acid sequence extracted in step (l3 ′) in step (k3 ′) as a candidate for a bioactive peptide.
[0047]
DETAILED DESCRIPTION OF THE INVENTION
First, terms and methods used in this specification will be described in the order of primary screening, secondary screening, and tertiary screening. In addition, although several evaluation methods can be used as a primary screening, the more suitable evaluation method according to the target protein can be selected suitably. This selection is performed from the viewpoint of the type of the target protein, the characteristics of the target site of the target protein, whether or not a known ligand (protein) is present, and whether or not its interaction region is specified.
[0048]
I. Primary screening
As the primary screening, a method based on amino acid complementary profile waveform evaluation, amino acid interaction region evaluation, and amino acid position-dependent binding significance evaluation can be used. Amino acid complementation profile waveform assessment is primarily useful for designing bioactive peptides that interact with target sites consisting of contiguous amino acid sequences. On the other hand, amino acid interaction region evaluation and amino acid position-dependent binding significance evaluation are not only useful for designing a bioactive peptide that interacts with a target site consisting of a continuous amino acid sequence, but the target site of the target protein is When it is composed of a plurality of partial amino acid sequences that are located apart on the primary structure, it is also useful for designing a bioactive peptide that interacts with this target site. Specifically, the design method in the primary screening is selected according to the target protein. As a design method, the most appropriate one can be selected according to three judgment criteria including presence / absence of ligand information, continuity / discontinuity of the target site, and whether the enzyme has a pocket on the surface. An overview of each is shown in Table 1 below, and each is described in turn.
[0049]
[Table 1]
Figure 0004612270
[0050]
A. Amino acid complementary profile waveform evaluation (generation of complementary peptide library)
The amino acid complementary profile waveform evaluation is a method for evaluating a peptide having an amino acid sequence that interacts with a target amino acid sequence based on a physicochemical amino acid index of the target amino acid sequence. This evaluation method is particularly useful when the target site of the target protein consists of one continuous amino acid sequence. The terms used in the evaluation of amino acid complementary profile waveforms and the outline of the evaluation are described below.
[0051]
The “target amino acid sequence” refers to an amino acid sequence that is a target in designing a complementary amino acid sequence. That is, an object of the present invention is to design a physiologically active peptide consisting of an amino acid sequence (complementary amino acid sequence) that interacts with this “target amino acid sequence”. Preferably, the target amino acid sequence is an amino acid sequence found in a target protein (eg, receptor, enzyme, etc.) that is a target for drug discovery.
[0052]
“Complementary amino acid sequence” refers to an amino acid sequence that satisfies the definition of complementarity in the present invention.
[0053]
“Complementary” refers to a complementary moving average profile waveform that has a negative correlation with a moving average profile waveform that has been passed through a low frequency by moving average with respect to a profile waveform in which an arbitrary amino acid index is applied to the target amino acid sequence. The relationship between an amino acid sequence having an approximate profile waveform and a target amino acid sequence. Therefore, when a moving average profile waveform of a certain amino acid sequence has a smaller correlation coefficient R (described below) with a complementary moving average profile waveform of a target amino acid sequence than a moving average profile waveform of another amino acid sequence, The sequence is “more complementary” to the target amino acid sequence.
[0054]
“Profile waveform” refers to a waveform generated by applying an amino acid index to an amino acid sequence.
[0055]
“Moving average profile waveform” refers to a waveform obtained by moving and averaging a profile waveform with a predetermined window width. A profile waveform obtained by applying an arbitrary amino acid index to a target amino acid sequence is represented by TiThen, the moving average profile waveform x at an arbitrary (odd) window width wjIs represented by [Equation 1].
[0056]
[Expression 1]
Figure 0004612270
[0057]
In this specification, the moving average profile waveform of a complementary amino acid sequence is particularly referred to as a “complementary moving average profile waveform”. A profile waveform obtained by applying an arbitrary amino acid index to a complementary amino acid sequence candidate is represented by CiThen, the complementary moving average profile waveform y with an arbitrary (odd) window width wjIs represented by [Equation 2].
[0058]
[Expression 2]
Figure 0004612270
[0059]
“Window width” refers to the width of a range in which profile waveforms are added when a moving average profile waveform is created. The window width can be set to any odd number, but is usually set to 1 to 13, preferably 3 to 13, and more preferably 5 to 11.
[0060]
The “amino acid index” refers to an index that quantifies the physicochemical characteristics of amino acids. More than 400 types of amino acid indices have been accumulated so far, and for example, these indices can be searched from a database AAindex provided by the Institute for Chemical Research, Kyoto University. The indicators of these amino acids are hydrophobicity, ease of β structure formation, ease of α helix formation and turn formation, and side chain physicochemical properties (eg, relative size of side chain volume). (See, for example, Tomii and Kanehisa, Protein Eng., 9, 27-36 (1996)). In the present invention, the amino acid index for generating the profile waveform can be selected from about 400 types. The database may be stored in a storage device of the device (described later) attached to the program, or stored in an external storage device that can be referred to by communication such as the Internet. It may be.
[0061]
Examples of preferable amino acid index used in the present invention include an index based on hydrophobicity, an index based on electrical characteristics, an index indicating ease of taking α-helix and β-sheet, and a relative size of side chain volume. The amino acid index is more preferably selected from an index based on hydrophobicity and an index based on electrical characteristics. Examples of the index based on the degree of hydrophobicity include Kyte-Doolittle hydropathy index, Jones et al. Hydrophobicity, and Consensus Normalized Hydrophobicity scale [Reference 3]. In particular, Consensus Normalized Hydrophobicity scale is preferable. The index based on electrical characteristics refers to an index representing the degree of polarization of a molecule and electrostatic interaction. For example, Fauchere et al. Localized electrical effect, Grantham et al. Polarity, and Electron-ion interaction potential ( EIIP) [Reference 4] and the like, and in particular, Electron-ion interaction potential (EIIP) is preferable [Reference 4].
[0062]
The “complementarity parameter” refers to a value indicating complementarity between the moving average profile waveform of the target amino acid sequence and the complementary moving average profile waveform of the complementary amino acid sequence. An example of the complementarity parameter is a correlation coefficient R shown in [Equation 3] below.
[0063]
[Equation 3]
Figure 0004612270
[0064]
Here, the average value of the moving average profile waveform is represented by [Equation 4].
[0065]
[Expression 4]
Figure 0004612270
[0066]
The average value of the complementary moving average profile waveform is expressed by [Formula 5].
[0067]
[Equation 5]
Figure 0004612270
[0068]
A person skilled in the art can use, as a complementarity parameter, a value calculated from an equation derived from [Equation 3] in addition to the correlation coefficient of [Equation 3].
[0069]
“Average parameter (Pave“)” Means (i) the average value of the profile waveform of the target amino acid sequence shown in [Equation 6] below
[0070]
[Formula 6]
Figure 0004612270
[0071]
Or (ii) The average value of the used amino acid indices shown in [Formula 7] below
[0072]
[Expression 7]
Figure 0004612270
[0073]
Say.
[0074]
“Filter value” refers to a value set to narrow down the number of complementary amino acid sequence candidates. In the present invention, in particular, a filter value related to a complementation parameter and a filter value related to an average value parameter are used.
[0075]
As a filter value related to the complementarity parameter, for example, a correlation coefficient filter value Rt(This value RtR <RtOnly candidate complementary amino acid sequences having a correlation coefficient R corresponding to the above are selected). Preferably, a negative correlation is required between the moving average profile waveform of the target amino acid sequence and the complementary moving average profile waveform of the complementary amino acid sequence. Therefore, the correlation coefficient filter value RtCan be set to any negative number greater than or equal to -1, but preferably Rt≦ −0.9 is set. The filter value related to the complementarity parameter may be set in advance before the calculation of the complementarity parameter, or may be set as appropriate after the calculation.
[0076]
In addition, as a filter value related to the average value parameter, PaveFilter values a and b are set. Based on these values a and b, a <Pave<P corresponding to baveOnly candidate complementary amino acid sequences having are selected. PaveSince the physiologically active peptide to be obtained becomes insoluble and experiments are difficult, the values of a and b are preferably set to values with high hydrophilicity. PaveThe filter value is PaveMay be preset before the calculation of P, or PaveYou may set suitably after calculation.
[0077]
As a filter value, correlation coefficient filter value RtMay be used, but preferably PaveThe filter values a and b are further used. In this case, the conditional expression is as follows.
[0078]
[Equation 8]
Figure 0004612270
[0079]
The amino acid sequence (complementary peptide library) selected by this evaluation method is preferably subjected to the secondary screening described later.
[0080]
B. Amino acid interaction region evaluation (generation of fragmented peptide library)
Amino acid interaction region evaluation refers to a method of designing a peptide that can bind to a target protein using information on the primary structure (amino acid sequence) of the protein that interacts with the target protein. This evaluation method is particularly useful when the primary structure (amino acid sequence) of a protein that interacts with or is predicted to interact with a target protein is known. The terms used in the evaluation of amino acid interaction regions and the outline of the evaluation are described below.
[0081]
Regarding the “interaction region” in the protein that interacts with the target site of the target protein, if there is a protein in which a region that can interact with a certain target protein already exists, that region is selected. When a plurality of interaction regions are present in one protein, the plurality of regions are selected as interaction regions. When a plurality of proteins that can interact with a certain target protein are known, a plurality of interaction regions can be obtained from these proteins. On the other hand, if the protein itself that interacts with the target protein is known, but the interacting region is not specified, this region is obtained by a method well known in the art (for example, the RBD method [reference document 5]). Can be selected. This evaluation method can also be applied when the protein itself that interacts with a certain target protein is unknown, but preferably this evaluation method is applied when the protein itself that interacts with a certain target protein is known. The
[0082]
As long as the length of the amino acid sequence extracted in this evaluation method (that is, the number of amino acid residues) is within the total length of the above interaction region, an amino acid sequence of any length can be extracted. However, preferably, an amino acid sequence consisting of 3 to 7 amino acid residues, more preferably an amino acid sequence consisting of 4 amino acid residues can be extracted. In addition, extraction of an amino acid sequence is performed exhaustively. For example, when extracting an amino acid sequence consisting of X amino acid residues, N−X + 1 amino acid sequences are extracted from the N-terminal to the C-terminal of the above interaction region and stored as a fragmented peptide library. The Moreover, the length of the extracted amino acid sequence may be unified, but may be varied. For example, an amino acid sequence consisting of X amino acid residues is comprehensively extracted from the interaction region by N−X + 1, and an amino acid sequence consisting of X ′ amino acid residues (number different from X) It is also possible to extract NX ′ + 1 comprehensively from the action region and store amino acid sequences having different lengths in the fragmented peptide library. The amino acid sequence (fragmented peptide library) extracted by this evaluation method is selected by secondary screening described later.
[0083]
C. Amino acid position-dependent binding significance evaluation (generation of position score peptide library)
Amino acid position-dependent binding significance evaluation is performed by obtaining only a few percent of amino acid sequences at random from a peptide library containing thousands to hundreds of thousands of amino acid sequences and evaluating the interaction energy with the target protein. A score matrix that enables high-speed ΔG calculation is constructed, and peptide design is performed. In this evaluation method, when there are multiple proteins with similar substrate specificities, one of these proteins can be selected as the target protein, and a peptide with high specificity can be designed for this target protein. it can.
[0084]
Although this evaluation method can be applied to any target protein, it is preferably used for an enzyme or the like (for example, peptidase) that has a pocket on the molecular surface as a target protein and is considered to have little structural change due to binding. It applies to. This is because the score matrix is created based on the position-dependent amino acid appearance frequency. That is, this evaluation method is preferable for those requiring a limited backbone and mode of conjugation upon conjugation with a peptide.
[0085]
The “analysis library” is composed of a set of amino acid sequences randomly extracted from a comprehensively generated amino acid sequence of a certain length (that is, an amino acid sequence consisting of a specific number of amino acid residues). The number of amino acid sequences included in the analysis library may be several percent with respect to the total number of amino acid sequences of a certain length that have been exhaustively generated. For example, when designing an amino acid sequence consisting of X amino acid residues,XA comprehensive set of combinations ofXSeveral percent of amino acid sequences are randomly selected and used as a library for analysis. The number of amino acid sequences selected as the analysis library is not limited to a specific number and can be set as appropriate. The length of the amino acid sequence that can be designed in this evaluation is not particularly limited, but an amino acid sequence consisting of 2 to 10 amino acid residues is preferable, and an amino acid sequence consisting of 3 to 5 amino acid residues is more preferable. Further, in order to evaluate the validity of the “analysis library”, an “evaluation library” is also generated as necessary. The “evaluation library” is selected from the comprehensively generated amino acid sequences excluding the amino acid sequences used in the “analysis library”. The number of amino acid sequences prepared as the “evaluation library” is not particularly limited, but is set to a number smaller than the number of amino acid sequences prepared as the “analysis library”.
[0086]
The “intermolecular energy parameter” has the same meaning as that described in “II. Secondary screening” described later, and the calculation is performed in the same manner as described later.
[0087]
The “score matrix based on the appearance frequency of amino acids” means any matrix generated based on the appearance frequency of amino acids. An example of a “score matrix based on the appearance frequency of amino acids” is a PSS matrix (Positional Scanning Score-MATRIX) generated according to the following [Equation 9]. AijIndicates the number of occurrences of amino acid i at position j in all peptide groups included in the library for analysis, bijIs the number of occurrences of amino acid i at position j in the peptide group below the threshold ΔG included in the library for analysis. In the above, the threshold value ΔG may be set in advance, but may be set by a method described later.
[0088]
[Equation 9]
Figure 0004612270
[0089]
The “score based on amino acid appearance frequency” means that calculated according to the above “score matrix based on amino acid appearance frequency”, and an example thereof is PSS (Positional Scanning Score) calculated by the following [Equation 10]. [Reference 6]. In the following [Formula 10], n represents the number of amino acids to be determined, and CijIs a 20 × n matrix and is composed of 0 or 1 values. In addition, an element that matches amino acid i at position j in an arbitrary amino acid sequence is 1 and an element that does not match is 0.
[0090]
[Expression 10]
Figure 0004612270
[0091]
The “matrix based on amino acid position-dependent intermolecular energy parameters” refers to the relationship between the “intermolecular energy parameters” calculated for each amino acid sequence extracted as an analysis library and the “score based on amino acid appearance frequency”. “Score matrix based on amino acid appearance frequency” is converted using the regression equation obtained by correlation analysis. An example is a PSG matrix (Positional Scanning ΔG-MATRIX). In addition, when converting into the “score matrix based on the appearance frequency of amino acids”, preferably, the constant term is uniformly distributed to each position.
[0092]
The “amino acid position-dependent intermolecular energy parameter value” is calculated by the above “score matrix based on the appearance frequency of amino acids”, and an example thereof is PSG (Positional) calculated by the following formula [Formula 11]. Scanning [Delta] G), but parameters equivalent to free energy can also be used. In the following [Formula 11], PSGijIndicates an element of ij in the PSG matrix.
[0093]
## EQU11 ##
Figure 0004612270
[0094]
The amino acid sequence (position score peptide library) selected by this evaluation method is preferably subjected to the secondary screening described later.
[0095]
II. Secondary screening
“Intermolecular energy parameter” refers to a parameter based on intermolecular energy between a complementary amino acid sequence and a target site of a target protein. The intermolecular energy parameter means a parameter related to intermolecular energy calculated by any method known in the art. Examples of the intermolecular energy parameter calculated by an arbitrary method known in the art include those calculated by MM3 [Reference 7], Amber [Reference 9], and Charmm [Reference 10] force field. Can be mentioned. Preferably, as the intermolecular energy parameter, the intermolecular energy (Emol) And inhibition constant (Ki) Is used.
[0096]
“Intermolecular energy (Emol) "Is calculated by the following [Equation 12] (using the Amber force field [references 9 and 11]).
[0097]
[Expression 12]
Figure 0004612270
[0098]
Here, preferably, each coefficient of [Equation 12] is given as an empirical parameter by the Amber force field.
[0099]
“Inhibition constant (Ki) "Is calculated by the following [Equation 13].
[0100]
[Formula 13]
Figure 0004612270
[0101]
ΔG is based on complex formation between the target site of the target protein and a peptide candidate consisting of a complementary amino acid sequence, and is calculated using an arbitrary energy function known in the art, preferably , Calculated using the AutoDock energy function [Ref 2].
[0102]
A preferred bioactive peptide for the target site of the target protein is required to satisfy a threshold condition set for any intermolecular energy parameter. Preferably, as the intermolecular energy parameter, EmolOr KiWhen is used, it is necessary to satisfy either [Expression 14] or [Expression 15] below.
[0103]
[Expression 14]
Figure 0004612270
[0104]
Or
[0105]
[Expression 15]
Figure 0004612270
[0106]
The primary screening and the secondary screening have been described so far. Hereinafter, a peptide having an amino acid sequence obtained by the secondary screening may be referred to as a “lead peptide” for convenience.
[0107]
III. Third screening
As the third screening, mutation of the lead peptide can be performed by “amino acid mutation ΔE (eg, ΔG) evaluation”. In the amino acid mutation ΔE evaluation, each amino acid constituting the lead peptide is replaced with another amino acid to create a mutant peptide, and ΔE between the mutant peptide and the target proteinmutant(For example, ΔGmutant) Is calculated and the mutant peptide is evaluated. For example, when the peptide obtained by the secondary screening is composed of 4 amino acid residues and only one amino acid residue is replaced with another natural amino acid, 4 × 19 mutant peptides are used. Comprehensive creation of ΔE between these mutant peptides and target proteinsmutant(For example, ΔGmutant) Respectively. ΔEmutant(For example, ΔGmutant) Is calculated using any energy function known in the art, but is preferably calculated using the AutoDock energy function, similar to the calculation in the secondary screening. In one example, ΔG obtained for each mutant peptide when binding free energy is used as ΔE.mutantAnd lead peptide ΔGleadΔΔG, which is a difference from the above, is calculated by the following [Equation 16].
[0108]
[Expression 16]
Figure 0004612270
[0109]
From the above formula, the mutant peptide in which ΔΔG is negative forms a more stable complex with the target protein than the lead peptide, and the mutant peptide in which ΔΔG is positive is compared with the target peptide. And forms a more unstable complex. Therefore, in the tertiary screening, it is preferable to introduce amino acid mutations that make ΔΔG negative. In the above example, only one amino acid residue is substituted among the amino acid residues constituting the lead peptide, but by combining amino acid mutations that make ΔΔG negative, two or three amino acid residues are combined. Substitution may be performed. By performing the tertiary screening as described above, a more optimal physiologically active peptide can be designed.
[0110]
In amino acid substitution, each amino acid in the lead peptide can be substituted with 19 other natural amino acids. In addition to natural amino acids, any other non-natural amino acids such as α-amino acids, β-amino acids, and γ-amino acids can be substituted. However, since substitution with other than α-amino acid is likely to cause a change in the arrangement of the main chain, substitution with any unnatural α-amino acid is preferred. Moreover, it can be substituted with any amino acid of L-form and D-form.
[0111]
This amino acid substitution can also be understood from the viewpoint of “optimization of amino acid side chains”. For example, it is assumed that the above-mentioned “amino acid mutation ΔE (eg, ΔG) evaluation” is performed through primary screening and secondary screening, and the most preferable peptide Ala-Cys-Phe-Val is obtained for a target site of a certain target protein. To do. In such a case, in order to obtain a more preferable peptide based on this peptide Ala-Cys-Phe-Val, it is possible to re-verify the side chain of each amino acid constituting this peptide. Specifically, the Met side chain (-CH2CH2SCHThree), The above “amino acid mutation ΔE (for example, ΔG) evaluation” can be performed on the side chain into which a halogen atom is introduced instead of a hydrogen atom or a side chain into which a further group is introduced, to obtain a more appropriate mutant peptide is there. In the above description, the side chain mutation of Met has been described as an example. Of course, the side chain of a natural amino acid other than Met and the side chain of a non-natural amino acid (preferably, a non-natural α-amino acid) are similarly revalidated. It is possible. In general, in the case of a somewhat large protein, amino acid substitutions are likely to be limited to natural amino acids. This is because when actually synthesizing such a protein, the coding region of DNA is mutated and a mutated (substituted) protein is synthesized by translation using a cell system or a cell-free system. However, in the case of a low molecular weight peptide, the type of amino acid constituting the peptide is not limited to a natural amino acid. This is because low-molecular peptides can be easily synthesized by solid-phase synthesis, and the polymerization reaction is not limited to natural amino acids and non-natural amino acids as long as amino acids as raw materials can be supplied. Therefore, the tertiary screening in which “evaluation of amino acid mutation ΔE (for example, ΔG)” optimizes the amino acid side chain and enables acquisition of a highly specific physiologically active peptide.
[0112]
The specific formulas listed in “I. Primary Screening”, “II. Secondary Screening”, and “III. Tertiary Screening” are merely examples, and formulas synonymous with them and formulas derived therefrom are also included. All are used in the present invention in each calculation.
[0113]
The present invention is described in detail below.
The method of the present invention only needs to have the steps (a1) to (g1) as shown in (1) above, and the above (a1 ′) to (i1) as shown in (5) above. It suffices if it has the step of ').
[0114]
Specific means and form for carrying out the method according to the present invention are not limited, but considering the huge amount of data to be processed, the above (9) to (12) and (13) The computer processing by the program according to the present invention listed in (16) is the most preferred embodiment. The processing steps included in the program according to the present invention are equal to the technical idea of each step of the method invention according to the present invention. Therefore, hereinafter, the program according to the present invention will be described in detail to simultaneously describe the method according to the present invention.
[0115]
The program of the present invention is designed to design a bioactive peptide that interacts with a target amino acid sequence and a bioactive peptide that interacts with a target protein (that is, not only the target amino acid sequence, From the viewpoint of designing a physiologically active peptide that also takes into account the interaction with the amino acid sequence of (2), it can be roughly divided into two. One is a program shown in the above (9) to (12), which designs a bioactive peptide that interacts with a target amino acid sequence. In particular, the steps (a1) to (f1) included in the program (9) can also be referred to as “primary screening”.
[0116]
The other of the programs according to the present invention is the program shown in the above (13) to (16), which designs a bioactive peptide that interacts with a target protein. In particular, the steps (a1 ′) to (f1 ′) included in (13) are referred to as “primary screening”, and the steps (g1 ′) to (i1 ′) are referred to as “secondary screening”. It can also be called. By combining these “primary screening” and “secondary screening”, it is possible to obtain a more appropriate physiologically active peptide for the target site of the target protein.
[0117]
Furthermore, the steps (I) to (III) included in the above (24) can be combined with the above programs (13) to (16). These steps (I) to (III) can also be referred to as “tertiary screening”. By further combining “tertiary screening” with “primary screening” and “secondary screening”, it becomes possible to obtain a physiologically active peptide with higher specificity for the target site of the target protein.
[0118]
In another aspect, the present invention provides the programs of (25) and (26) above. The steps (a2) to (b2) included in the program (25) can also be called “primary screening”. The steps (a2 ′) to (b2 ′) included in the program (26) can be called “primary screening”, and the steps (c2 ′) to (e2 ′) This can be called “secondary screening”. Note that the steps (I) to (III) (“tertiary screening”) included in (27) can be combined with the program (26).
[0119]
In still another aspect, the present invention provides the programs of (28) and (29) above. The steps (a3) to (h3) included in the program (28) can also be referred to as “primary screening”. The steps (a3 ′) to (h3 ′) included in the program (29) can be referred to as “primary screening”, and the steps (i2 ′) to (k2 ′) This can be called “secondary screening”. In addition, the steps (I) to (III) (“tertiary screening”) included in the above (30) can be combined with the above program (29).
[0120]
An example of the bioactive peptide design in the present invention is shown in FIG. 1, and the entire system of the present invention is shown in FIG. In addition, although the secondary screening is described in FIG.1 and FIG.2, this secondary screening is performed as needed, and also combined with the tertiary screening described in FIG. Also good.
[0121]
In the present invention, the primary screening is composed of three types of programs, which are properly used according to the properties of the target protein. On the other hand, the secondary screening is a common program, and the tertiary screening is a common program. First, selection of primary screening will be described.
[0122]
FIG. 3 is a flowchart showing a program flow in selection of primary screening. As the kind of primary screening, the most appropriate one can be selected according to three judgment criteria including presence / absence of ligand information, continuity / discontinuity of the target site, whether the enzyme has a pocket on the surface. Hereinafter, selection of primary screening will be described in detail with reference to steps 501 to 506 in FIG.
[0123]
Step 501 in FIG. 3 is a step of determining whether or not there is a peptide serving as a ligand for a certain target protein. That is, when the ligand for a certain target protein is unknown, the process proceeds to step 502 in FIG. 3, and when the ligand is known, the process proceeds to step 504 in FIG.
[0124]
Step 502 in FIG. 3 is a step of determining whether or not the target site of the target protein is mainly composed of a continuous amino acid sequence. When the target site of the target protein has been elucidated, for example, by analyzing the crystal structure, the determination is made based on the information. When the target site of the target protein is unknown, for example, it is determined by a three-dimensional structure prediction program known in the art. As a result, when the target site of the target protein is composed of a discontinuous amino acid sequence, amino acid position-dependent binding significance evaluation is performed as a primary screening. On the other hand, when the target site of the target protein is mainly composed of a continuous amino acid sequence, the process proceeds to step 503 in FIG.
[0125]
Step 503 in FIG. 3 is a step of determining whether the target protein is an enzyme or a protein having a pocket on the surface. An example of a protein having a pocket on the surface is a receptor. Further, when the type of the target protein (for example, enzyme, receptor, etc.) is unknown, the type of the target protein can be predicted by, for example, homology search. In step 503 of FIG. 3, when it is determined that the target protein is neither an enzyme nor a protein having a pocket on the surface, amino acid complementation profile waveform evaluation is used as the primary screening. On the other hand, when it is determined that the target protein is either an enzyme or a protein having a pocket on the surface, amino acid complementation profile waveform evaluation or amino acid position-dependent binding significance evaluation is used as the primary screening. Preferably, however, amino acid position dependent binding significance assessment is used.
[0126]
Step 504 in FIG. 3 is a step of determining whether or not the target site of the target protein is mainly composed of a continuous amino acid sequence. In step 504 in FIG. 3, the determination is made in the same manner as in step 502 in FIG. As a result, when it is determined that the target site of the target protein is composed of a discontinuous amino acid sequence, the process proceeds to step 505 in FIG. On the other hand, if it is determined that the target site of the target protein is mainly composed of a continuous amino acid sequence, the process proceeds to step 506 in FIG.
[0127]
Step 505 in FIG. 3 is a step for determining whether the target protein is an enzyme or a protein having a pocket on the surface. In step 505 of FIG. 3, the determination is made in the same manner as in step 503 of FIG. When it is determined that the target protein is neither an enzyme nor a protein having a pocket on the surface, amino acid interaction region evaluation is used as the primary screening. On the other hand, when the target protein is determined to be either an enzyme or a protein having a pocket on the surface, amino acid interaction region evaluation or amino acid position-dependent binding significance evaluation is used as the primary screening. Preferably, however, amino acid interaction region assessment is used.
[0128]
Step 506 in FIG. 3 is a step of determining whether the target protein is an enzyme or a protein having a pocket on the surface. In step 506 of FIG. 3, the determination is made in the same manner as in step 503 of FIG. When it is determined that the target protein is neither an enzyme nor a protein having a pocket on the surface, amino acid complementation profile waveform evaluation or amino acid interaction region evaluation is used as the primary screening. Region evaluation is used. On the other hand, when the target protein is determined to be either an enzyme or a protein having a pocket on the surface, as a primary screening, amino acid complementation profile waveform evaluation, amino acid interaction region evaluation, or amino acid position-dependent binding Any of significance evaluation may be used, but preferably, amino acid interaction region evaluation or amino acid position-dependent binding significance evaluation is used, and more preferably, amino acid interaction region evaluation is used.
[0129]
Hereinafter, with respect to the primary screening, steps 101 to 111 (amino acid complementary profile waveform evaluation) in FIG. 4, steps 301 to 302 (amino acid interaction region evaluation) in FIG. 6 and steps 401 to 408 in FIG. This will be described with reference to (joining significance evaluation). The secondary screening will be described with reference to step 112 and subsequent steps in FIG. The tertiary screening will be described with reference to steps 201 to 204 in FIG.
[0130]
FIG. 4 is a flowchart showing the program flow of the above (9) and (13). First, the program (9) will be described in detail below.
[0131]
Step (a1) corresponds to step 101 in the flowchart of FIG. Examples of the data input means include a touch panel, a keyboard, and a mouse. As other input means, a pen tablet, a voice input device, or the like can be used. As an input target amino acid sequence, an amino acid sequence such as a ligand binding site, a substrate binding site, a protein interaction site, and the like is appropriately selected. A person skilled in the art can appropriately select a target amino acid sequence and input the sequence data based on X-ray analysis data on a certain protein or based on a prediction such as a general protein three-dimensional structure prediction program regarding a certain protein. In addition, a virtually set amino acid sequence (that is, an arbitrary amino acid sequence) may be input as a target amino acid sequence regardless of the above method.
[0132]
The program (9) does not include a step corresponding to step 102 shown in the flowchart of FIG. 4, but may include a step corresponding to step 102 of FIG. 4 as necessary. In step 102 of FIG. 4, one or more amino acid indices and a window width can be input, and although not specifically described, a filter value of the complementarity parameter (for example, correlation coefficient filter value Rt), PaveFilter values a and b, threshold values of intermolecular energy parameters (for example,
[0133]
[Expression 17]
Figure 0004612270
[0134]
) Etc. can also be accepted. As the input means, the same input means used in step 101 of FIG. 4 can be used. These parameters may be in a format that the user selects and inputs one by one at the time of operation, or may have a format in which initial values are set in advance and can be changed by the user as desired.
[0135]
The step (b1) corresponds to step 103 in FIG. In step (b1) above, one or more profile waveforms are generated from the sequence data of the target amino acid sequence input in step 101 of FIG. 4 according to the one or more amino acid indices set in step 102 of FIG. Conversion into one or more moving average profile waveforms (step 103 in FIG. 4). Specifically, the arithmetic processing represented by the above [Formula 1] is performed on the obtained target amino acid sequence. The data of one or more moving average profile waveforms for the target amino acid sequence is sent to step 107 in FIG.
[0136]
Step (c1) corresponds to step 104 and step 105 in FIG. In the above step (c1), a complementary amino acid sequence candidate is generated (step 104 in FIG. 4), and one or more profiles are generated according to the one or more amino acid indices set in step 102 in FIG. A waveform is generated and then converted to one or more complementary moving average profile waveforms (step 105 of FIG. 4). Specifically, the arithmetic processing shown in the above [Formula 2] is executed for the obtained complementary amino acid sequence candidates. The one or more complementary moving average profile waveform data for the complementary amino acid sequence candidates is sent to step 107 of FIG. 4 for calculation of the complementarity parameter.
[0137]
The program (9) does not include a step corresponding to step 106 in FIG. 4, but may include a step corresponding to step 106 in FIG. 4 as necessary. When the number of amino acid residues in the target amino acid sequence is n, 20nStep 106 in FIG. 4 instructs to repeat Step 104 and Step 105 in FIG. 4 until candidate complementary amino acid sequences are generated and each of them is converted into one or more complementary moving average profile waveforms. 20nWhen complementary amino acid sequence candidates are generated and each of them is converted into one or more complementary moving average profile waveforms, generation of complementary amino acid sequence candidates (step 104 in FIG. 4) and the accompanying complementary moving average profile Waveform generation (step 105 in FIG. 4) ends.
[0138]
Step (d1) corresponds to step 107 in FIG. In the step (d1), one or more complementation parameters derived from the same amino acid index (for example, the correlation coefficient represented by [Equation 3]) are one or more moving average profile waveforms for the target amino acid sequence and complementary amino acids. Calculations are made between one or more complementary moving average profile waveforms of sequence candidates (step 107 in FIG. 4).
[0139]
For example, when only one amino acid index is used in the conversion of the moving average profile waveform of the target amino acid sequence and the complementary moving average profile waveform of the complementary amino acid sequence, only one complementarity parameter is the step of FIG. Calculated at 107.
[0140]
Further, when two or more amino acid indices are used in the conversion of the moving average profile waveform of the target amino acid sequence and the complementary moving average profile waveform of the complementary amino acid sequence, the two or more complementation parameters are the steps in FIG. Calculated at 107.
[0141]
The program (9) does not include a step corresponding to step 108 in FIG. 4, but may include a step corresponding to step 108 in FIG. 4 as necessary. In step 108 of FIG. 4, one or more average value parameters are calculated based on the one or more amino acid indices used.
[0142]
The step (e1) is not specifically shown in FIG. However, the step (e1) can be included between the step 108 and the step 109 in FIG. In the above step (e1), the complementary amino acid sequence candidates are converted into one or more of the complementation parameters calculated in step 107 of FIG. 4 (if necessary, one or more average value parameters calculated in step 108 of FIG. 4). ) And the storage means.
[0143]
The step (f1) corresponds to step 109 in FIG. In step (f1) above, complementary amino acid sequence candidates based on one or more complementation parameters calculated in step 107 of FIG. 4 (if necessary, one or more average value parameters calculated in step 108 of FIG. 4). To extract. The extraction is performed based on a condition based on the filter value. The filter value may be in a format that is selected and input by the user one by one at the time of operation, or may be in a format in which an initial value is set in advance and the user can change as desired.
[0144]
When only one complementarity parameter is calculated between the target amino acid sequence and the complementary amino acid sequence in the step (d1), the complementary amino acid sequence candidate is the one complementarity parameter in the step (f1). Extracted so as to satisfy the filter value condition for. In this extraction process, a filter value of one average value parameter can be used together.
[0145]
In the step (d1), when two or more complementarity parameters are calculated between the target amino acid sequence and the complementary amino acid sequence, the two or more complementarity parameters are comprehensively considered in the step (f1). Then, complementary amino acid sequence candidates are extracted. In this extraction process, two or more average value parameters can be used in a comprehensive manner. When a person skilled in the art calculates two or more complementarity parameters (an average value parameter of two or more if necessary), the parameter to be regarded as important is preferentially considered and a desired complementary amino acid sequence candidate is extracted. The conditions can be set as follows.
[0146]
The program (9) does not include a step corresponding to step 110 in FIG. 4, but may include a step corresponding to step 110 in FIG. 4 as necessary. In step 110 of FIG. 4, it is determined whether or not to further select complementary amino acid sequence candidates using another amino acid index. Specifically, with respect to the complementary amino acid sequence candidates extracted in the step (f1), according to the amino acid index (different from the previous amino acid index) set in the step 102 of FIG. It is determined whether (f1) is repeated one or more times. Whether or not the above steps (b1) to (f1) are repeated one or more times, the number of repetitions, and one or more amino acid indices used at that time may be selected in advance even if the user selects and inputs one by one at the time of operation. The format may be set and can be changed by the user as desired.
[0147]
If it is determined in step 110 of FIG. 4 that it is not necessary to further select complementary amino acid sequence candidates using another amino acid index, the process proceeds to step 111 of FIG. 4 to consider the interaction with the target protein. It is determined whether or not to do so. The program (9) is an embodiment for considering the interaction with the target amino acid sequence, and is an embodiment not considering the interaction with the target protein itself. Therefore, in step 111 of FIG. To be judged.
[0148]
The above step (g1) is not shown in FIG. 4, but can be included after N in step 111 in FIG. In the step (g1), a complementary amino acid sequence candidate for the target amino acid sequence is displayed together with its complementation parameter and the like. As the display means, a normal display device, a printer, or the like is used. Preferably, the extracted complementary amino acid sequence candidates are ranked for each parameter and displayed from the top or from the top considering each parameter comprehensively.
[0149]
Next, the program (13) will be described in detail below. This program considers the interaction with the target site of the target protein in addition to the interaction with the target amino acid sequence.
[0150]
Steps (a1 ') to (f1') of the program (13) correspond to steps (a1) to (f1) of the program (9). Accordingly, steps (a1 ') to (f1') of the program (13) are performed in the same manner as steps (a1) to (f1) of the program (9). However, in step 102 of FIG. 4, it is possible to input data on the target protein (for example, amino acid sequence data of the target protein, data on the target site of the target protein, etc.). In addition, since the said program (13) is embodiment which considers interaction with target protein itself, it is always judged as Y in step 111 of FIG.
[0151]
The step (g1 ') corresponds to step 112 in FIG. In step (g1 '), an intermolecular energy parameter between the target site of the target protein and the complementary amino acid sequence candidate is calculated. This calculation uses data on the target protein (for example, target protein amino acid sequence data, target protein target site data, etc.), complementary amino acid sequence candidate sequence data, etc., input in step 102 of FIG. Executed.
[0152]
Although the step (h1 ') is not shown in FIG. 4, it can be included between step 112 and step 113 in FIG. In the step (h1 ′), the complementary amino acid sequence candidates are stored in the storage unit together with the intermolecular energy parameter calculated in step 112 in FIG.
[0153]
Step (i1 ') corresponds to step 113 in FIG. In the step (i1 ′), complementary amino acid sequence candidates that satisfy the threshold value of the intermolecular energy parameter are extracted based on the information stored in the storage means.
[0154]
Although the step (j1 ') is not shown in FIG. 4, it can be included after Y in step 113 in FIG. In the step (j1 ′), complementary amino acid sequence candidates for the target amino acid sequence are displayed together with their complementation parameters and the like. As the display means, a normal display device, a printer, or the like is used. Preferably, the extracted complementary amino acid sequences are ranked and displayed based on good intermolecular energy parameters.
[0155]
Further, the steps (I) to (III) can be included between the step (i1 ') and the step (j1'). The steps (I) to (III) correspond to steps 201 to 203 in FIG. Hereinafter, the steps (I) to (III) will be described in detail.
[0156]
Step (I) corresponds to step 201 in FIG. In the step (I), an amino acid sequence in which an amino acid mutation is introduced into the amino acid sequence extracted in the step (i1 ′) is generated. When one amino acid is substituted for the amino acid sequence extracted in the above step (i1 '), an amino acid sequence substituted with 19 kinds of natural amino acids other than the original amino acid is comprehensively generated. Further, a plurality of (2 or 3 or more) amino acids are substituted into the amino acid sequence extracted in the above step (i1 ′), and these amino acid sequences are comprehensively generated (for example, two amino acids are When substituting with other natural amino acids, a 19 × 19 amino acid sequence is generated). Furthermore, not only natural amino acids but also non-natural amino acid sequences can be used for amino acid substitution. These amino acid data may be in a format that uses data stored in advance, or may be in a format that takes in necessary data by referring to an external database.
[0157]
Step (II) corresponds to step 202 in FIG. In the step (II), intermolecular energy parameters between all the amino acid sequences generated in the step (I) and the target site of the target protein are calculated. This calculation is performed in the same manner as in the above step (g1 ').
[0158]
The above step (III) corresponds to step 203 in FIG. In the step (III), the intermolecular energy parameter calculated in the step (II) is compared with the intermolecular energy parameter between the amino acid sequence extracted in the step (i1 ′) and the target site of the target protein as a control. Then, an amino acid sequence having an intermolecular energy parameter that is more stable than the control intermolecular energy parameter is extracted. As the intermolecular energy parameter between the amino acid sequence extracted in step (i1 ′) and the target site of the target protein, the value calculated in step (g1 ′) can be used. As a result of the comparison, an amino acid sequence having an intermolecular energy parameter that is more stable than the control intermolecular energy parameter is extracted.
[0159]
Note that step 204 in FIG. 5 may be included after step (III). In step 204 of FIG. 5, it is determined whether the steps (I) to (III) are repeated again for the amino acid sequence extracted in step (III). When it is determined in step 204 in FIG. 5 that the above steps (I) to (III) do not need to be repeated again, the extraction of the amino acid sequence is completed, and the process proceeds to step (j1 ′). However, a step of performing optimization processing of each amino acid side chain can also be provided after step 204 of FIG. In such a case, after the step of optimizing each amino acid side chain is completed, the process proceeds to step (j1 ′).
[0160]
FIG. 6 is a flowchart showing a program flow for the above (25) and a part of the above (26). This program is particularly useful when the primary structure (amino acid sequence) of a protein that interacts with or is predicted to interact with a target protein is known. First, the program (25) will be described in detail below.
[0161]
Step (a2) in the program (25) corresponds to step 301 in FIG. In the step (a2), the interaction region in the protein that interacts with the target site of the target protein is identified. When there is a protein in which a region that can interact with the target protein already exists, that region is selected. When a plurality of interaction regions are present in one protein, the plurality of regions are selected as interaction regions. When a plurality of proteins that can interact with the target protein are known, a plurality of interaction regions can be selected from each of these proteins. On the other hand, if the protein itself that interacts with the target protein is known, but the interacting region is not specified, this region is obtained by a method well known in the art (for example, the RBD method [reference document 5]). Can be selected.
[0162]
Step (b2) corresponds to step 302 in FIG. In the step (b2), an amino acid sequence having an arbitrary length is extracted from the interaction region. FIG. 7 shows an outline of the amino acid sequence extraction performed in the above step (b2). As long as the length of the amino acid sequence extracted in the step (b2) (that is, the number of amino acid residues) is within the total length of the interaction region, an amino acid sequence having an arbitrary length can be extracted. Is possible. In addition, extraction of an amino acid sequence is performed exhaustively. For example, when extracting an amino acid sequence consisting of X amino acid residues, N−X + 1 amino acid sequences are extracted from the N-terminal to the C-terminal of the interaction region. Further, the lengths of the extracted amino acid sequences may be unified, but amino acid sequences having different lengths may be comprehensively extracted.
[0163]
Next, the program (26) will be described in detail below.
[0164]
The steps (a2 ') to (b2') of the program (26) correspond to the steps (a2) to (b2) of the program (25). Accordingly, the steps (a2 ') to (b2') of the program (26) are performed in the same manner as the steps (a2) to (b2) of the program (25).
[0165]
The steps (c2 ') to (f2') of the program (26) correspond to the steps (g1 ') to (j1') of the program (13). Therefore, the steps (c2 ') to (f2') of the program (26) are performed in the same manner as the steps (g1 ') to (j1') of the program (13).
[0166]
Further, the steps (I) to (III) can be included between the step (e2 ') and the step (f2'). The steps (I) to (III) are performed in the same manner as described above.
[0167]
FIG. 8 is a flowchart showing the program flow for part (28) and part (29). This program is particularly useful for an enzyme or the like (for example, peptidase) that has a pocket on the surface of a molecule as a target protein and is considered to have little structural change due to binding. An outline of the process performed in (28) is shown in FIG. Hereinafter, the program (28) will be described in detail, but in order to deepen the understanding, caspases will be sequentially described as an example of the target protein.
[0168]
First, a protein serving as a caspase substrate will be described, and its amino acid position will be defined. The amino acid sequence of the cleavage site of the protein serving as a caspase substrate is the XXXDD motif. The position of D in the motif indicates the P1 site on the N-terminal side of the substrate cleavage site. Aspartic acid is essential at the P1 position, and the difference in inhibitory peptide recognized by each caspase is considered to depend on the remaining amino acid sequences at the P2 to P4 positions. Therefore, hereinafter, in order to clearly show each amino acid position in the XXXXD motif, it is expressed as P4-P3-P2-D.
[0169]
Step (a3) in the program (28) corresponds to step 401 in FIG. In the step (a3), an amino acid sequence having a certain length is comprehensively generated, and an amino acid sequence is randomly selected from the amino acid sequences and extracted as an analysis library. Although not included in the above step (a3), a step of extracting an evaluation library can be further included in step 401 of FIG. The “constant length” (that is, the number of amino acid residues) of the amino acid sequence comprehensively generated in the step (a3) is not particularly limited, but preferably about 2 to 10 amino acid residues. The length is more preferably about 3 to 5 amino acid residues.
[0170]
For example, to comprehensively analyze the P4-P3-P2-D motif, the amino acid sequence of 4 amino acid residues is 20ThreeThat is, 8000 combinations must be considered (D is fixed). Here, for example, 400 amino acid sequences corresponding to 5% thereof are randomly selected, and 360 amino acid sequences can be extracted as an analysis library and 40 amino acid sequences can be extracted as an evaluation library. In addition, for caspases, the inhibitory peptides are known, but the inhibitory peptides in the complex crystal structure of caspase inhibitory peptides retain almost the same main chain structure in any caspase. That is, it is considered that the shape of the caspase active site and the catalytic mechanism limit it. Such knowledge can also be used in generating peptide conformations. For example, when generating a peptide conformation, the structure of the main chain is the structure in the crystal structure, and any peptide can be constructed by adding a side chain. Energy optimization can also be performed using TINKER [Ref 12] to exclude side chain VDW contact. At this time, the main chain may be fixed using the INACTIVE command.
[0171]
The step (b3) corresponds to step 402 in FIG. In the step (b3), an intermolecular energy parameter is calculated for each amino acid sequence extracted as the analysis library. This calculation is performed in the same manner as the step (g1 ') of the program (13). For example, the calculation shown by the following [Equation 18] can also be performed using AutoDock for 8000 amino acid sequences exhaustively generated for the P4-P3-P2-D motif.
[0172]
[Expression 18]
Figure 0004612270
[0173]
Each coefficient of the above formula is a value empirically determined by regression analysis using 30 protein-ligand complex structures and their measured Ki values. In AutoDock 3.0, a genetic algorithm based on Lamarck's evolution theory is newly adopted for location search. Here, the main chain of the 4-residue peptide is fixed, and the side chain is variable. Examples of parameter values to be set are shown in Table 2. As described above, the details of the calculation conditions can be set as appropriate.
[0174]
[Table 2]
Figure 0004612270
[0175]
In addition, although not included in the above step (b3), the arrangement of the extracted amino acid sequence (eg, based on RMS (main chain)) is compared with the arrangement of the control (eg, peptide in the crystal structure). Thus, the step (b3) may include a step of excluding the improper arrangement from the subsequent calculation. For example, the arrangement of the amino acid sequence of the P4-P3-P2-D motif is confirmed by RMS (main chain) with the inhibitory peptide in the crystal structure. And what has a large RMS can be excluded from the subsequent calculations because it is considered not to be properly placed in the caspase active site and function as a substrate. It may seem that there is no problem if it is strongly bound in any arrangement, but in order for a modifying group such as FMK and CHO to be arranged at the caspase active center, proper arrangement of the peptide is an essential factor. Because.
[0176]
Step (c3) corresponds to step 403 in FIG. In the step (c3), a score matrix based on the appearance frequency of amino acids is generated using the intermolecular energy parameter calculated in the step (b3). The intermolecular energy parameter threshold (for example, ΔG threshold) may be set in advance or may be set as described later. For example, a PSS matrix based on the appearance frequency of 20 types of amino acids at each position P4, P3, and P2 is generated using an analysis library including 360 amino acid sequences. PSS of amino acid i at position jijIs calculated by the above [Equation 9]. In this case, the range of position j is 1 to 3, corresponding to P4 to P2, respectively, and the range of amino acid i is 1 to 20, corresponding to each amino acid type.
[0177]
The step (d3) corresponds to step 404 in FIG. In the step (d3), a score based on the amino acid appearance frequency is calculated using a score matrix based on the amino acid appearance frequency. For example, by using a PSS matrix, the strength of the binding force to a caspase of an arbitrary amino acid sequence consisting of four amino acid residues (P4-P3-P2-D motif: P1 is not fixed since D1 is fixed) [Formula 10] can be calculated as PSS. In this case, CijIs a 20 × 3 matrix and is composed of 0 or 1 values. The element that matches amino acid i at position j of any amino acid sequence is 1 and the element that does not match is 0.
[0178]
Step (e3) corresponds to step 405 in FIG. In the step (e3), a correlation analysis is performed between the intermolecular energy parameter calculated in the step (b3) and the score to obtain a regression equation. For each amino acid sequence included in the library for analysis, if there is a high correlation between the PSS and the intermolecular energy parameter (for example, binding free energy), the intermolecular energy parameter is predicted at high speed for a new amino acid sequence. Is possible. Of course, since PSS can only be evaluated independently for each position, the influence of amino acid combinations between positions cannot be considered. Note that the intermolecular energy parameter threshold (eg, ΔG threshold) described in step (c3) above maximizes the correlation coefficient R between the PSS and the intermolecular energy parameter threshold (eg, ΔG threshold). It may be set to be. In this case, the threshold value set to maximize the correlation coefficient R is fed back to the step (c3) again, and the step (c3), the step (d3), and the step (e3) are performed. Again.
[0179]
Step (f3) corresponds to step 406 in FIG. In the step (f3), the regression matrix is used to convert the score matrix based on the amino acid appearance frequency into a matrix based on the amino acid position-dependent intermolecular energy parameter. In this conversion, for example, the above-described PSG matrix is created. The constant term in the regression equation may be distributed unevenly to each position, but is preferably distributed uniformly to each position.
[0180]
Step (g3) corresponds to step 407 in FIG. In the step (g3), an amino acid position-dependent intermolecular energy parameter value is calculated from a matrix based on the amino acid position-dependent intermolecular energy parameter. For example, by using a PSG matrix, the free energy of binding between an arbitrary 4-residue peptide (P4-P3-P2-D motif: P1 is fixed because D1 is fixed) and caspase can be calculated at high speed as PSG. .
[0181]
Step (h3) corresponds to step 408 in FIG. In the step (h3), an amino acid sequence that is not more than a predetermined amino acid position-dependent intermolecular energy parameter value, that is, an amino acid sequence that is not more than a threshold value is extracted. This value may be a preset value or may be set at the time of extraction.
[0182]
Next, the program (29) will be described in detail below.
[0183]
The steps (a3 ') to (h3') of the program (29) correspond to the steps (a3) to (h3) of the program (28). Accordingly, the steps (a3 ') to (h3') of the program (29) are performed in the same manner as the steps (a3) to (h3) of the program (28).
[0184]
The steps (i3 ′) to (l3 ′) of the program (29) correspond to the steps (c2 ′) to (f2 ′) of the program (26). Accordingly, the steps (i3 ') to (l3') of the program (29) are performed in the same manner as the steps (c2 ') to (f2') of the program (26).
[0185]
Further, the steps (I) to (III) can be included between the step (k3 ′) and the step (l3 ′). The steps (I) to (III) are performed in the same manner as described above.
[0186]
In addition, when a plurality of proteins having similar substrate specificities are present, one of these proteins is selected as a target protein and a peptide specific to this protein is designed (28 ) And (29) are useful. As an example, the above program (28) will be described. First, the steps (a3) to (h3) of the program (28) are performed for each protein having similar substrate specificity. In addition, about each protein, the said step (a3)-(h3) may be performed in parallel, and the said step (a3)-(h3) may be performed in order. Next, a difference between amino acid position-dependent intermolecular energy parameter values (for example, PSG) is calculated for the target protein and other proteins, and a step of filtering by the difference is provided. This difference can be set as appropriate. For example, when the Ki value for the target protein is desired to be two orders of magnitude lower than that of other proteins, ΔG corresponds to 2.728 kcal / mol, and this can be used as a filter. Of course, a similar step can be provided after the step (h3 ') of the program (29), and then the process can proceed to the step (i3'). As briefly described, the present invention may further include the steps described above in the programs (28) and (29). Such a program is also included in the scope of the present invention. Further specific examples are described in Example 3 and will be helpful in understanding such programs.
[0187]
The recording medium (17) of the present invention is a recording medium in which the above-described programs (9) to (16) of the present invention are recorded on a computer-readable recording medium. Here, the “computer-readable recording medium” refers to any recording medium that can record electronic data and can be read by a computer as necessary. For example, a magnetic tape, a magnetic disk, a magnetic drum And portable information recording media such as an IC card and an optically readable disc (eg, CD, DVD).
[0188]
The extraction processing devices (18) to (20), the extraction processing devices (21) to (23), and the devices (31) and (32) according to the present invention each include a central processing unit and a memory. This is a dedicated machine for the bioactive peptide extraction process, which is mainly composed of a computer and has the above-described program of the present invention so that it can be executed.
[0189]
The devices (18) to (23) can be roughly divided into two from the viewpoints of designing a bioactive peptide that interacts with a target amino acid sequence and designing a bioactive peptide that interacts with a target protein. One is an apparatus shown in the above (18) to (20), which designs a bioactive peptide that interacts with a target amino acid sequence. The other is the apparatus shown in the above (21) to (23), which is designed to design a bioactive peptide in consideration of the interaction with the target protein itself in addition to the interaction with the target amino acid sequence. is there.
[0190]
As shown in FIG. 10, the apparatus of (18) to (20) includes a data input unit A, a data editing unit B, a complementary amino acid sequence candidate generation unit C, a complementation degree calculation unit D, and a complementary amino acid sequence candidate storage unit E. , A complementary amino acid sequence search unit, and a complementary amino acid sequence display unit.
In the apparatus of (18) to (20), the data input unit (a) includes means for executing the step (a1), and the data editing unit (b) includes means for executing the step (b1), The complementary amino acid sequence candidate generation unit c includes means for executing the step (c1), and the complementation degree calculation unit d includes means for executing the step (d1). Includes means for executing the step (e1), the complementary amino acid sequence search unit includes means for executing the step (f1), and the complementary amino acid sequence display unit performs the step (g1). Including means for performing.
[0191]
The devices (21) to (23) are similar to the devices (18) to (20) described above, as shown in FIG. 10, the data input unit A, the data editing unit B, the complementary amino acid sequence candidate generation unit C, Complement degree calculation unit D, complementary amino acid sequence candidate storage unit E, complementary amino acid sequence search unit F, and complementary amino acid sequence display unit G are included.
In the devices (21) to (23), the data input unit a includes means for executing the step (a1 ′), and the data editing unit B includes means for executing the step (b1 ′). The complementary amino acid sequence candidate generation unit c includes means for executing the step (c1 ′), and the complementation degree calculation unit D includes a complementation parameter derived from the same amino acid index in the step (k1 ′), Means for calculating between one or more moving average profile waveforms for the target amino acid sequence and one or more complementary moving average profile waveforms of candidate complementary amino acid sequences, and for calculating an intermolecular energy parameter with the target site of the target protein (Means for executing the above steps (d1 ′) and (g1 ′)), the complementary amino acid sequence candidate storage unit e Means for storing a sequence candidate together with the complementarity parameter and the intermolecular energy parameter (means for executing the above steps (e1 ′) and (h1 ′)), and the complementary amino acid sequence search unit includes a step (m1 ′ ) Including means for extracting a predetermined number of complementary amino acid sequences based on the information stored by the means (k1 ′) (means for executing the steps (f1 ′) and (i1 ′)), and displaying the complementary amino acid sequence The section includes a step (n1 ′) means for displaying the complementary amino acid sequence extracted by the complementary amino acid sequence searching section as a candidate for a physiologically active peptide (means for executing the step (i1 ′)).
[0192]
The devices (31) and (32) are the same as the devices (18) to (23) described above, and are included in the device (31) “(A2) interaction region specifying unit, ( (B) 2) amino acid sequence first search unit, (c2) intermolecular energy calculation unit, (d2) amino acid sequence storage unit, (e2) amino acid sequence second search unit, (f2) amino acid sequence display unit " And (b) a first amino acid sequence search unit, (b) a first intermolecular energy calculation unit, (c) a score matrix generation unit, and (d) a score included in the apparatus of (32) above. Calculation unit, (e 3) regression equation formation unit, (f 3) matrix conversion unit, (g 3) amino acid position-dependent energy calculation unit, (q 3) amino acid sequence second search unit, (li 3) intermolecular energy Second calculation unit, (nu 3) amino acid sequence storage unit, (le 3) amino acid sequence “3 search unit, (e 3) amino acid sequence display unit” are all the programs (26) and (29) and a computer (central processing unit (CPU), storage device) configured to execute the program. (Memory)) and other peripheral devices (external storage device, input device, display device, etc.) that are further added as necessary, and a network with another computer may be added to the configuration.
The parts (A2) to (F2) included in the device (31) and the parts (A3) to (O3) included in the device (32) are respectively (26) and (26). This is as described in detail in the description of the program 29).
[0193]
The device of the present invention is a physiologically active device such as an output device such as a printer for printing the displayed data, an external storage device for storing data, an external storage device storing a database necessary for executing the program of the present invention, etc. Other devices that provide convenience to the user in peptide design can further be included in the configuration.
[0194]
【Example】
EXAMPLES Hereinafter, the present invention will be described with reference to examples. However, the present invention is not limited to the following specific examples.
[0195]
Example 1 Design of Bioactive Peptide (Inhibitory Peptide) for Caspase-3 Amino acid sequence WRNS (SEQ ID NO: 109) at positions 206 to 209 of caspase-3 is used as a target amino acid sequence to bind to and inhibit caspase-3 activity Peptide candidates were predicted using the program of the present invention. The index based on hydrophobicity [reference 3] was used as the amino acid index, and the window width was set to 1. PaveRange from -0.39 to -0.37, RtWas set to −0.9, and peptide candidates having 105 complementary amino acid sequences were obtained by primary screening (Table 3). In addition, the arrangement | sequences of the ranks 1-105 of Table 3 are made into arrangement number 4-108 in order, respectively.
[0196]
[Table 3]
Figure 0004612270
Figure 0004612270
[0197]
Subsequently, a complementary amino acid sequence DNLD (SEQ ID NO: 97) (Ki= 0.0309 nM: 1st), DEVD (SEQ ID NO: 88) (Ki= 0.149 nM: 2nd position) (Table 3).
[0198]
DEVD (SEQ ID NO: 88) is an amino acid sequence known as a caspase-3 inhibitory peptideiThe measured value and crystal structure of are known. FIG. 11 shows a comparison between the complementary amino acid sequence DEVD predicted by the present invention and the crystal structure. RMS (root mean squar, average deviation between atoms) (all atoms) is 2.4Å, and the structure prediction is very close to the crystal structure. The K predicted by the present inventioniMeasured value [Ref. 13] K for a value of 0.149 nMiWas 0.23 nM.
[0199]
In addition, the currently unknown DNLD (SEQ ID NO: 97) KiThe lowest 0.0309 nM complementary amino acid sequence was obtained. DEVD was originally obtained from the amino acid sequence of the protein used as a substrate, and also has the property of binding strongly to caspase-7 and caspase-8 in addition to caspase-3 [Ref. 13] and inhibiting it. It has also been pointed out as a problem as a chemical inhibitor. Since the peptide sequence DNLD presented in this system is a completely new sequence, the possibility of solving this specificity problem is also given.
[0200]
From the above results, it was confirmed that the program of the present invention is very useful in designing complementary amino acid candidates.
[0201]
Example 2 Design of Bioactive Peptide for Fas (Receptor)
Using the amino acid sequence FSSKCRRCRLCDEG (SEQ ID NO: 1) at positions 97 to 110 of Fas (Receptor) as a target amino acid sequence, candidates for physiologically active peptides that can bind to and interact with the target amino acid sequence were predicted using the program of the present invention. An index based on hydrophobicity [reference 3] was used as the amino acid index, and the window width was set to 5. PaveRange from -0.15 to +0.15, RtWas set to −0.9, and peptide candidates having complementary amino acid sequences were obtained by primary screening. The intermolecular energy was then calculated in the secondary screen. Finally, the complementary amino acid sequence EPPMTFISIHTMCH (SEQ ID NO: 2) was obtained.
[0202]
Test Example 1 Induction of apoptosis by a peptide consisting of a complementary amino acid sequence (SEQ ID NO: 2)
A peptide consisting of the complementary amino acid sequence (SEQ ID NO: 2) obtained in Example 1 (hereinafter abbreviated as Fas complementary peptide) was chemically synthesized. Subsequently, using a human ovarian cancer cell line NOS4 expressing Fas, the ability of the Fas complementary peptide to induce apoptosis was compared with that of the scrambled peptide TFIHPSMMTMPEI (SEQ ID NO: 3). NOS4 has been established and maintained in our laboratory from cancer cells excised from severe ovarian cancer patients. Human ovarian cancer cell line NOS4 is 5% CO 2 in RPMI medium containing 10% fetal calf serum.2Culturing was performed at 37 ° C. under humidity. 5 × 106One human ovarian cancer cell line NOS4 was treated for 24 hours at 37 ° C. in the presence of 100 μg / ml complementary peptide, and then DNA fragmentation was measured. DNA fragmentation was measured by flow cytometry using a FACS apparatus (FACSCalibur, Jose., CA) after staining the cell nucleus with propidium iodide. As a result, the Fas complementary peptide induced apoptosis in about 40% of cells at a concentration of 100 μg / ml. From the above results, it was confirmed that the Fas complementary peptide functions as a physiologically active peptide for Fas.
[0203]
[Table 4]
Figure 0004612270
[0204]
Test Example 2 Induction of apoptosis by Fas complementary peptide tetramer
Tetramer of Fas complementary peptide in which Fas complementary peptide (hereinafter sometimes abbreviated as FRP-2) is bound to 4 branches of lysine polymer (MAP) [(FRP-2)Four-MAP] was chemically synthesized. Next, (FRP-2)Four-The apoptosis-inducing ability of MAP was examined using the same method as in Test Example 1. As a result, the tetramer of Fas-complementary peptide induced apoptosis in about 50% of human ovarian cancer cell line NOS4 at a concentration of 5 mg / ml (FIG. 12). From the above results, it was found that Fas-complementary peptide has about 30 times stronger apoptosis-inducing ability than monomer by using MAP as a maltimer.
[0205]
Test Example 3 In vivo apoptosis induction by tetramers of Fas complementary peptides
Using a tumor-bearing animal experimental system in which a human glioma cell line (U251-SP) was transplanted into the brain of a nude mouse, (FRP-2)Four-The anti-tumor effect of MAP in vivo was examined. One week after transplantation of U251-SP into the brain of nude mice, (FRP-2)Four-MAP was injected locally at 2 μg / 2 μl into cancerous tissue in the brain. After 30 days, the patient was dissected and a brain tissue cut preparation prepared by formalin fixation was prepared by a conventional method and observed under an optical microscope. As a result, in the tetramer-treated group of Fas-complementary peptide, cancer atrophy due to cancer cell death due to induction of apoptosis was observed (FIG. 13). From the above series of results, it was confirmed that the program of the present invention is very useful in designing bioactive peptides.
[0206]
Example 3 Evaluation of existing caspase peptide inhibitors
First, primary screening was performed using caspase-3, -7, -8, -9. The results are shown in FIGS. PSS and ΔG in any caspasecalcMean correlation coefficient R (FIG. 14D, 15D, 16D, 17D) was obtained.
[0207]
Next, in order to evaluate the predictive ability of PSS, ΔG was used using 40 peptides of PSS included in the library for evaluation.calc(FIGS. 14E, 15E, 16E, and 17E). A correlation coefficient R having the same value as the analysis library and an average of −0.66 was obtained. Therefore, it can be said that it can be sufficiently used as a primary screening of a huge peptide library.
[0208]
PSG evaluation of each caspase is based on the inhibitory peptides Ac-WEHD-CHO (SEQ ID NO: 110), Ac-YVAD-CHO (SEQ ID NO: 111), Ac-DEVD-, whose known Ki values (Table 5) [Reference 13] are known. This was carried out using CHO (SEQ ID NO: 112), Boc-IETD-CHO (SEQ ID NO: 113), and Boc-AEVD-CHO (SEQ ID NO: 114).
[0209]
[Table 5]
Figure 0004612270
[0210]
A Ki value of 10,000 nM or more was set as 10,000 nM, and the Ki value was converted to ΔG by [Equation 19] (Table 6).
[0211]
[Equation 19]
Figure 0004612270
[0212]
[Table 6]
Figure 0004612270
[0213]
In addition, the predicted ΔG of the five inhibitory peptides was calculated by [Equation 4] using the PSG matrices of caspase-3, -7, -8, and -9, respectively. Table 6 shows a comparison with actual measurement values.
[0214]
Overall, the predicted value is lower than the measured value, but the correlation coefficient RpepThe average value is 0.93, which is high. This indicates that it is possible to predict the relative affinity of the inhibitory peptide for caspase. Correlation coefficient RcaspThe average of the values was 0.71. This shows that the specificity of the inhibitory peptide for caspase can be predicted.
[0215]
Example 4 Design of caspase-3 specific inhibitory peptide
The PSG matrix enables fast affinity and specificity prediction. ΔG for each caspase of 8000 peptides that can be expressed by P4-P3-P2-D can be calculated at high speed using PSG. The design of caspase-3 specific inhibitory peptide will be described as an example. The system configuration is shown in FIG.
[0216]
First, one peptide is extracted from the Virtual Library containing 8000 peptides, and the PSG matrix of caspase-3, -7, -8, -9 is used.casp-3, PSGcasp-7, PSGcasp-8, PSGcasp-9Calculate Next, the difference in PSG between caspase-7, -8, -9 and caspase-3 is calculated using the following [Equation 20].
[0217]
[Expression 20]
Figure 0004612270
[0218]
In this system, caspase-3 specific inhibitory peptide candidates were defined as peptides having Ki values two orders of magnitude lower than all of caspase-7, -8, and -9. A difference of two digits in Ki value corresponds to a difference of about 2.728 kcal / mol in ΔG. Therefore, [Formula 21] was used as a filter for each caspase.
[0219]
[Expression 21]
Figure 0004612270
[0220]
The above operation is performed on all 8000 peptides, and only the peptides that have passed through all the caspase filters are evaluated by the secondary screening. The inhibitory peptide finally selected in the secondary screening is evaluated in vitro and in vivo as a designed peptide.
[0221]
Peptide sequences satisfying [Formula 20] in all caspases-7, -8, and -9 were selected from 8000 peptide sequences. The results are shown in Table 7.
[0222]
[Table 7]
Figure 0004612270
[0223]
In Table 7, PSG for each caspase and ΔGcalc which is the secondary screening result are shown. For the three peptides PPVD (SEQ ID NO: 115), QPVD (SEQ ID NO: 116), and TPVD (SEQ ID NO: 117), a high correlation of 0.93 or higher was observed between PSG and ΔGcalc. On the other hand, SPVD (SEQ ID NO: 118) showed a low correlation of 0.73 compared to the above three peptides. The binding free energy of SPVD to caspase-8 was predicted to be -9.99kcal / mol for PSG, whereas it was -10.92kcal / mol for ΔGcalc. Overlapping with the fact that ΔGcalc for caspase-3 was highly evaluated as -11.20 kcal / mol, the difference in ΔGcalc between caspase-3 and -8 is only 0.28 kcal / mol. This result suggests that it does not function as a caspase-3 specific inhibitory peptide.
[0224]
In PPVD, QPVD, and TPVD, ΔGcalc for caspase-3 is predicted to be higher than that of PSG, so although it cannot be expected to have a two-digit difference in Ki value, it is considered to function well as a caspase-3 inhibitory peptide. .
[0225]
As a result, the following three candidate peptides are presented as caspase-3 specific inhibitory peptides.
[0226]
[Table 8]
Figure 0004612270
[0227]
Example 5 Design of apoptosis-inducing peptide using Fas binding region in FasL
For the preparation of a fragmented peptide library, first, the 144 to 281 positions in the extracellular region of Fas Ligand were subjected to the RBD method, and the binding region to Fas was identified as the 151 to 176 positions. Next, this limited region was extracted 4 residues from the N-terminal side to obtain a total of 23 fragmented peptides.
[0228]
For Fas (Receptor), the binding region with FasL was identified at positions 99-102 by the RBD method. Using the amino acid sequence SKCR (SEQ ID NO: 119) at positions 99 to 102 as a target region, peptides capable of binding and interacting with the target region were selected by secondary screening using a fragmented peptide library.
[0229]
As a result, the amino acid sequence WEDT (SEQ ID NO: 120) (Ki = 0.19 μM) in regions 162 to 165 on Fas Ligand was the most binding sequence (FIG. 19). This region has also been confirmed to be a FAS binding region from the Fas-Fas Ligand complex model.
[0230]
Next, as the third screening, WEDT was used as a lead peptide, and amino acid substitution was performed for one residue from the first residue to the fourth residue, and mutation was performed (Table 9).
[0231]
[Table 9]
Figure 0004612270
[0232]
From Table 9, the Ki value of WEWT (SEQ ID NO: 121) was 0.083 μM. WEWT was predicted to be a peptide having a higher binding force with a ΔG of 0.52 kcal / mol lower than WEDT, and WEWT was designed as a bioactive peptide candidate.
[0233]
Test Example 4 Induction of apoptosis by FasL-like peptide tetramer
Since Fas acts as a trimer, in order to allow the WEWT peptide (SEQ ID NO: 121) to fit well into the space 37Å formed by the Fas trimer, this peptide is used as the 4-amino group of MAP-8. Was combined with the remaining four protected branches to create a candidate peptide (hereinafter referred to as (FLLP-1)Four-MAP8Abbreviated. (FIG. 20). Then (FLLP-1)Four-MAP8The apoptosis-inducing ability of was examined using the same method as in Test Example 1 above. As a result, (FLLP-1)Four-MAP8Induced apoptosis in about 50% of human ovarian cancer cell line NOS4 at a concentration of about 0.1 μg / ml (Table 10).
[0234]
[Table 10]
Figure 0004612270
[0235]
From the above results, it was confirmed that this method is extremely useful.
[0236]
References
[1] Nature, 411, 613 (2001)
[2] Morris, G.M. et al, J. Comp. Chem., 19, 1639-1662, (1998)
[3] Eisenberg D, et al., J. Ann. Rev. Biochem., 53, 596-623 (1984)
[4] Cosic I, et al., J IEEE Trans. Biomed. Eng., 32, 337-341 (1985)
[5] Gallet X. et al, J. Mol. Biol., 302, 917-926 (2000)
[6] Zhao, Y. et al., J. Immunol. 167, 2130-2141 (2001)
[7] Eisenberg D, et al., Proc. Natl. Acad. Sci. USA, 81, 140 (1984)
[8] Allinger NL, et al. J. Am. Chem. Soc., 99, 8127-8134 (1977)
[9] Weiner SJ, et al., J. Am. Chem. Soc., 106, 765-784 (1984)
[10] Brooks BR, et al., J. Comput. Chem., 4, 187 (1983)
[11] Wang J, et al., Proteins, 36, 1-19 (1999)
[12] Pappu, R.V. et al, J. Phys. Chem. B, 102, 9725-9742 (1998)
[13] Garcia-Calvo M, et al., J. Biol. Chem., 273, 32608-32613 (1998)
[0237]
【The invention's effect】
According to the present invention, an economical, rapid and efficient physiological activity can be achieved without using costly and time-consuming biochemical techniques or conventional biologically active peptide prediction theory that is not reliable and cannot be used to narrow down candidates. Peptide design is made possible by mathematical calculations. Further, according to the present invention, a plurality of evaluation methods can be appropriately selected as primary screening depending on the properties of the target protein. Furthermore, according to the present invention, it is possible to obtain a physiologically active peptide having an optimized amino acid sequence by performing amino acid substitution in the tertiary screening and evaluating them.
[0238]
[Sequence Listing Free Text]
SEQ ID NO: 1: amino acid sequence at positions 97 to 110 of Fas.
SEQ ID NO: 2: Amino acid sequence complementary to the amino acid sequence at positions 97 to 110 of Fas.
SEQ ID NO: 3: Amino acid sequence obtained by scrambling the amino acid sequence of SEQ ID NO: 2.
SEQ ID NOs: 4 to 108: Amino acid sequence candidates complementary to the amino acid sequences at positions 206 to 209 of caspase-3.
SEQ ID NO: 109: amino acid sequence at positions 206 to 209 of caspase-3.
SEQ ID NO: 110: amino acid sequence of caspase inhibitor.
SEQ ID NO: 111: Amino acid sequence of caspase inhibitor.
SEQ ID NO: 112: amino acid sequence of caspase inhibitor.
SEQ ID NO: 113: amino acid sequence of caspase inhibitor.
SEQ ID NO: 114: amino acid sequence of caspase inhibitor.
SEQ ID NO: 115: amino acid sequence of caspase-3 specific inhibitor.
SEQ ID NO: 116 amino acid sequence of a caspase-3 specific inhibitor.
SEQ ID NO: 117: amino acid sequence of caspase-3 specific inhibitor.
SEQ ID NO: 118: amino acid sequence of caspase-3 non-specific inhibitor.
SEQ ID NO: 119: Amino acid sequence at positions 99 to 102 of Fas.
SEQ ID NO: 120: amino acid sequence at positions 162 to 165 of Fas ligand.
SEQ ID NO: 121: amino acid sequence of apoptosis-inducing peptide.
[0239]
[Sequence Listing]
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270
Figure 0004612270

[Brief description of the drawings]
FIG. 1 shows an example of bioactive peptide design.
FIG. 2 shows the entire system of the present invention in bioactive peptide design.
FIG. 3 shows a flowchart of a program used for selection of primary screening.
FIG. 4 shows a flowchart of a program used for designing a bioactive peptide. This flowchart corresponds to the case where the amino acid complement profile waveform evaluation is performed as the primary screening and the secondary screening is performed.
FIG. 5 shows a flowchart of a program for tertiary screening in bioactive peptide design.
FIG. 6 shows a flowchart of a program for amino acid interaction region evaluation (primary screening).
FIG. 7 shows the extraction of fragmented peptides from the amino acid sequence of a ligand (protein).
FIG. 8 shows a flowchart of a program for amino acid position-dependent binding significance evaluation (primary screening).
FIG. 9 shows an outline of amino acid position-dependent binding significance evaluation (primary screening).
FIG. 10 shows an example of the configuration of an apparatus for designing a bioactive peptide.
FIG. 11 shows the superposition of the complementary amino acid sequence DEVD and the crystal structure.
FIG. 12 shows the ability of Fas-complementary peptide tetramers to induce apoptosis.
FIG. 13 shows statistical data of mouse brain tissue and tumor volume treated with Fas complementary peptide tetramer.
FIG. 14 shows the results of primary screening (amino acid position-dependent binding significance evaluation) using caspase 3 as a target protein. FIG. 14A shows the PSS at each position of the motif. FIG. 14B shows the PSS matrix at each position of the motif. FIG. 14C shows the PSG matrix at each position of the motif. FIG. 14D shows a correlation analysis using the analysis library. FIG. 14E shows a correlation analysis using the evaluation library.
FIG. 15 shows the results of primary screening (amino acid position-dependent binding significance evaluation) using caspase 7 as a target protein. FIG. 15A shows the PSS at each position of the motif. FIG. 15B shows the PSS matrix at each position of the motif. FIG. 15C shows the PSG matrix at each position of the motif. FIG. 15D shows a correlation analysis using the analysis library. FIG. 15E shows a correlation analysis using the evaluation library.
FIG. 16 shows the results of primary screening (amino acid position-dependent binding significance evaluation) using caspase 8 as a target protein. FIG. 16A shows the PSS at each position of the motif. FIG. 16B shows the PSS matrix at each position of the motif. FIG. 16C shows the PSG matrix at each position of the motif. FIG. 16D shows a correlation analysis using the analysis library. FIG. 16E shows a correlation analysis using the evaluation library.
FIG. 17 shows the results of primary screening (amino acid position-dependent binding significance evaluation) using caspase 9 as a target protein. FIG. 17A shows the PSS at each position of the motif. FIG. 17B shows the PSS matrix at each position of the motif. FIG. 17C shows the PSG matrix at each position of the motif. FIG. 17D shows the correlation analysis using the analysis library. FIG. 17E shows a correlation analysis using the evaluation library.
FIG. 18 shows the system configuration in designing caspase-3 specific inhibitory peptides.
FIG. 19 shows binding free energy of Fas Ligand 4-residue peptide to Fas (99-102).
FIG. 20 shows the peptide obtained by conjugating 4 WEWT peptides to MAP-8.

Claims (15)

標的タンパク質と相互作用し得る生理活性ペプチドを設計する方法であって、
(a3)アミノ酸配列第1探索部で、2〜10個のアミノ酸残基からなるアミノ酸配列を網羅的に生成し、その中からランダムにアミノ酸配列を選択して解析用ライブラリとして抽出するステップと、
(b3)分子間エネルギー第1計算部で、解析用ライブラリとして抽出された各アミノ酸配列と該標的タンパク質の標的部位との間の分子間エネルギーパラメータを計算するステップと、
(c3)スコアマトリクス生成部で、ステップ(b3)で計算された分子間エネルギーパラメータを用いて、
【数1】
[式9]
Figure 0004612270
[式中、aijは、解析用ライブラリに含まれる全ペプチド群中のポジションjにおけるアミノ酸iの出現回数を示し、bijは、解析用ライブラリに含まれる閾値ΔG以下のペプチド群中のポジションjにおけるアミノ酸iの出現回数である]によって生成されるアミノ酸出現頻度に基づくスコアマトリクスPSSijを生成するステップと、
(d3)スコア計算部で、アミノ酸出現頻度に基づくスコアマトリクスPSSijを用いて、
【数2】
[式10]
Figure 0004612270
[式中、nは、決定されるべきアミノ酸の数を示し、Cijは、20×nのマトリクスであり、0若しくは1の値で構成される。また、任意のアミノ酸配列中のポジションjにおけるアミノ酸iと一致する要素は1、不一致の要素は0とする]によって計算されるアミノ酸出現頻度に基づくスコアPSSを計算するステップと、
(e3)回帰式形成部で、ステップ(b3)で計算された分子間エネルギーパラメータと該スコアPSSとの間で相関解析を行い、
Figure 0004612270
[式中、aおよびbは相関解析によって定められる定数である]と表現される回帰式を得るステップと、
(f3)マトリクス変換部で、該回帰式を用いて、アミノ酸出現頻度に基づくスコアマトリクスPSSijを、
Figure 0004612270
[式中、aおよびbはステップ(e3)の回帰式と同じ定数であり、nは、決定されるべきアミノ酸の数である]によって変換されるアミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスPSGijに変換するステップと、
(g3)アミノ酸位置依存的エネルギー計算部で、アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスPSGijから、
【数5】
[式11]
Figure 0004612270
[式中、nは、決定されるべきアミノ酸の数を示し、Cijは、20×nのマトリクスであり、0若しくは1の値で構成される。また、任意のアミノ酸配列中のポジションjにおけるアミノ酸iと一致する要素は1、不一致の要素は0とする。PSGijはアミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクス中のijの要素を示す]によって計算されるアミノ酸位置依存的な分子間エネルギーパラメータPSG値を計算するステップと、
(h3)アミノ酸配列第2探索部で、アミノ酸位置依存的な分子間エネルギーパラメータPSG値が−8.83以下のアミノ酸配列を抽出するステップとを包含する、方法。
A method for designing a bioactive peptide capable of interacting with a target protein, comprising:
(A3) in the amino acid sequence first search part, comprehensively generating an amino acid sequence consisting of 2 to 10 amino acid residues, randomly selecting an amino acid sequence from the amino acid sequence and extracting it as an analysis library;
(B3) In the intermolecular energy first calculation unit, calculating an intermolecular energy parameter between each amino acid sequence extracted as the analysis library and the target site of the target protein;
(C3) In the score matrix generation unit, using the intermolecular energy parameter calculated in step (b3),
[Expression 1]
[Formula 9]
Figure 0004612270
[ Where a ij represents the number of occurrences of amino acid i at position j in all peptide groups included in the library for analysis, and b ij represents position j in peptide groups equal to or less than the threshold ΔG included in the library for analysis. Generating a score matrix PSS ij based on the appearance frequency of amino acids generated by
(D3) In the score calculation unit, using the score matrix PSS ij based on the appearance frequency of amino acids,
[Expression 2]
[Formula 10]
Figure 0004612270
[In the formula, n represents the number of amino acids to be determined, and C ij is a 20 × n matrix, and is composed of 0 or 1 values. And calculating a score PSS based on the frequency of appearance of amino acids calculated by: 1 for an element that matches amino acid i at position j in any amino acid sequence, and 0 for a mismatched element;
(E3) The regression equation forming unit performs a correlation analysis between the intermolecular energy parameter calculated in step (b3) and the score PSS,
Figure 0004612270
Obtaining a regression equation expressed as [where a and b are constants determined by correlation analysis];
(F3) In the matrix conversion unit, the regression matrix is used to calculate the score matrix PSS ij based on the amino acid appearance frequency,
Figure 0004612270
Where a and b are the same constants as in the regression equation of step (e3) and n is the number of amino acids to be determined matrix based on amino acid position dependent intermolecular energy parameters converted by Converting to PSG ij ;
(G3) In the amino acid position-dependent energy calculation unit, from the matrix PSG ij based on the amino acid position-dependent intermolecular energy parameter,
[Equation 5]
[Formula 11]
Figure 0004612270
[In the formula, n represents the number of amino acids to be determined, and C ij is a 20 × n matrix, and is composed of 0 or 1 values. In addition, an element that matches amino acid i at position j in an arbitrary amino acid sequence is 1 and an element that does not match is 0. PSG ij represents an element of ij in the matrix based on the amino acid position-dependent intermolecular energy parameter] calculating the amino acid position-dependent intermolecular energy parameter PSG value calculated by:
(H3) including a step of extracting an amino acid sequence having an amino acid position-dependent intermolecular energy parameter PSG value of −8.83 or less in an amino acid sequence second search unit.
手法1により、標的タンパク質の標的アミノ酸配列に任意のアミノ酸指標を当てはめたプロファイル波形に対し、移動平均により低域通過させた移動平均プロファイル波形に負の相関性を持つ相補平均プロファイル波形を近似するプロファイル波形をもつことを特徴とするアミノ酸配列(相補アミノ酸配列)を抽出すること、および/または、手法2により、標的タンパク質に対する相互作用領域から任意の長さのアミノ酸配列を抽出することをステップ(a3)とステップ(b3)との間にさらに含む、請求項1記載の方法であって、該手法1は、
(a1)データ入力部で、標的アミノ酸配列の配列データ入力を受け付けるステップと、
(b1)データ編集部で、1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を
【数6】
[式1]
Figure 0004612270
[式中、wは1〜13の奇数で設定され、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長であり、Tiは標的アミノ酸配列に任意のアミノ酸指標を当てはめたプロファイル波形である]によって変換される1以上の移動平均プロファイル波形xに変換するステップと、
(c1)相補アミノ酸配列候補生成部で、標的アミノ酸配列の相補アミノ酸配列候補を生成して、
【数7】
[式2]
Figure 0004612270
[式中、wは1〜13の奇数で設定され、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長であり、Ciは相補アミノ酸配列候補にステップ(b1)と同一の1以上のアミノ酸指標を当てはめたプロファイル波形である]によって変換される1以上の相補移動平均プロファイル波形yに変換するステップと、
(d1)相補度計算部で、
【数8】
[式3]
Figure 0004612270
[式中、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長である]によって計算される同一のアミノ酸指標に由来する相補度パラメータRを計算するステップと、
(e1)相補アミノ酸配列候補記憶部で、相補アミノ酸配列候補を、該相補度パラメータRとともに記憶手段に記憶するステップと、
(f1)相補アミノ酸配列探索部で、ステップ(e1)によって記憶された情報に基づいて、該相補度パラメータRが−0.9未満の相補アミノ酸配列を抽出するステップとを包含し、該手法2は、
(a2)相互作用領域特定部で、標的タンパク質の標的部位と相互作用することが既知であるタンパク質中の既に相互作用することが特定されている相互作用領域を選択するステップと、
(b2)アミノ酸配列第1探索部で、該相互作用領域から3〜7個のアミノ酸残基からなるアミノ酸配列を抽出するステップとを包含する、方法。
A profile that approximates a complementary average profile waveform that has a negative correlation with a moving average profile waveform that has been passed through a low-frequency range by moving average with respect to a profile waveform in which an arbitrary amino acid index is applied to the target amino acid sequence of the target protein by Method 1. Extracting an amino acid sequence (complementary amino acid sequence) characterized by having a waveform and / or extracting an amino acid sequence of an arbitrary length from the interaction region for the target protein by the method 2 (a3 ) And step (b3), wherein the method 1 comprises:
(A1) accepting sequence data input of the target amino acid sequence in the data input unit;
(B1) In the data editing unit, the target amino acid sequence is expressed as follows according to one or more predetermined amino acid indices:
[Formula 1]
Figure 0004612270
[Wherein w is an odd number from 1 to 13, s is an integer part of w / 2, j is in the range of s to (ns-1), n is the target sequence length, T i is a profile waveform obtained by applying an arbitrary amino acid index to the target amino acid sequence], and converting to one or more moving average profile waveforms x j converted by
(C1) The complementary amino acid sequence candidate generation unit generates a complementary amino acid sequence candidate of the target amino acid sequence,
[Expression 7]
[Formula 2]
Figure 0004612270
[Wherein w is an odd number from 1 to 13, s is an integer part of w / 2, j is in the range of s to (ns-1), n is the target sequence length, C i is a profile waveform obtained by fitting one or more amino acid indices identical to those in step (b1) to complementary amino acid sequence candidates] to convert to one or more complementary moving average profile waveforms y j converted by
(D1) Complement degree calculation unit,
[Equation 8]
[Formula 3]
Figure 0004612270
Where s is an integer part of w / 2, j is in the range of s to (ns-1), and n is the target sequence length. Calculating a complementarity parameter R;
(E1) In the complementary amino acid sequence candidate storage unit, storing the complementary amino acid sequence candidate together with the complementarity parameter R in the storage means;
(F1) a complementary amino acid sequence search unit, based on the information stored in step (e1), extracting a complementary amino acid sequence having a complementarity parameter R of less than −0.9, and the method 2 Is
(A2) selecting an interaction region that has already been identified to interact in a protein that is known to interact with the target site of the target protein in the interaction region identification unit;
(B2) including a step of extracting an amino acid sequence consisting of 3 to 7 amino acid residues from the interaction region in the amino acid sequence first search part.
該アミノ酸指標が、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、及び側鎖体積の相対的な大きさを表す指標から選ばれる1以上の指標である、請求項2に記載の方法。  The amino acid index is selected from an index based on hydrophobicity, an index based on electrical characteristics, an index representing ease of taking α-helix and β-sheet, and an index representing the relative size of side chain volume The method according to claim 2, which is the above index. 1以上の所定のアミノ酸指標を使用してステップ(a1)〜(f1)で抽出された所定の数の相補アミノ酸配列に対して、1以上の別のアミノ酸指標を使用してステップ(b1)〜(f1)を行なうということを1回以上繰り返すことにより、生理活性ペプチドとして抽出される相補アミノ酸配列候補をさらに絞り込むことを特徴とする、請求項2または3に記載の方法。  For a predetermined number of complementary amino acid sequences extracted in steps (a1) to (f1) using one or more predetermined amino acid indexes, steps (b1) to 4. The method according to claim 2 or 3, further comprising further narrowing down complementary amino acid sequence candidates extracted as physiologically active peptides by repeating (f1) one or more times. (i)分子間エネルギー第2計算部で、当該抽出された各アミノ酸配列について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(ii)アミノ酸配列記憶部で、該アミノ酸配列を、該分子間エネルギーパラメータとともに記憶手段に記憶するステップと、
(iii)アミノ酸配列第3探索部で、ステップ(ii)によって記憶された情報に基づいて、分子間エネルギーパラメータPSG値が−12.0以下のアミノ酸配列を抽出するステップと、
(iv)アミノ酸配列表示部で、ステップ(iii)によって抽出されたアミノ酸配列を、生理活性ペプチドの候補として表示するステップとをさらに包含する、請求項1〜4のいずれか1項記載の方法。
(I) a step of calculating an intermolecular energy parameter with the target site of the target protein for each extracted amino acid sequence in the intermolecular energy second calculation unit;
(Ii) in the amino acid sequence storage unit, storing the amino acid sequence together with the intermolecular energy parameter in a storage means;
(Iii) a step of extracting an amino acid sequence having an intermolecular energy parameter PSG value of −12.0 or less based on the information stored in step (ii) in the amino acid sequence third search unit;
The method according to any one of claims 1 to 4, further comprising: (iv) a step of displaying the amino acid sequence extracted in step (iii) as a candidate for a bioactive peptide in an amino acid sequence display unit.
ステップ(iii)とステップ(iv)との間において、
(I)ステップ(iii)で抽出されたアミノ酸配列に対しアミノ酸変異を導入したアミノ酸配列を生成するステップと、
(II)ステップ(I)で生成されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(III)ステップ(iii)で抽出されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを対照として、ステップ(II)で計算された分子間エネルギーパラメータを比較し、対照の分子間エネルギーパラメータよりも安定な分子間エネルギーパラメータを有するアミノ酸配列を抽出するステップとをさらに包含する、請求項5記載の方法。
Between step (iii) and step (iv),
(I) generating an amino acid sequence in which an amino acid mutation is introduced into the amino acid sequence extracted in step (iii);
(II) calculating an intermolecular energy parameter between the amino acid sequence generated in step (I) and the target site of the target protein;
(III) The intermolecular energy parameter calculated in step (II) is compared with the intermolecular energy parameter between the amino acid sequence extracted in step (iii) and the target site of the target protein as a control, and the intermolecular energy of the control is compared. And extracting the amino acid sequence having an intermolecular energy parameter that is more stable than the parameter.
標的タンパク質と相互作用し得る生理活性ペプチドを設計するためのプログラムであって、
(a3)アミノ酸配列第1探索部で、2〜10個のアミノ酸残基からなるアミノ酸配列を網羅的に生成し、その中からランダムにアミノ酸配列を選択して解析用ライブラリとして抽出するステップと、
(b3)分子間エネルギー第1計算部で、解析用ライブラリとして抽出された各アミノ酸配列と該標的タンパク質の標的部位との間の分子間エネルギーパラメータを計算するステップと、
(c3)スコアマトリクス生成部で、ステップ(b3)で計算された分子間エネルギーパラメータを用いて、
【数9】
[式9]
Figure 0004612270
[式中、aijは、解析用ライブラリに含まれる全ペプチド群中のポジションjにおけるアミノ酸iの出現回数を示し、bijは、解析用ライブラリに含まれる閾値ΔG以下のペプチド群中のポジションjにおけるアミノ酸iの出現回数である]によって生成されるアミノ酸出現頻度に基づくスコアマトリクスPSSijを生成するステップと、
(d3)スコア計算部で、アミノ酸出現頻度に基づくスコアマトリクスPSSijを用いて、
【数10】
[式10]
Figure 0004612270
[式中、nは、決定されるべきアミノ酸の数を示し、Cijは、20×nのマトリクスであり、0若しくは1の値で構成される。また、任意のアミノ酸配列中のポジションjにおけるアミノ酸iと一致する要素は1、不一致の要素は0とする]によって計算されるアミノ酸出現頻度に基づくスコアPSSを計算するステップと、
(e3)回帰式形成部で、ステップ(b3)で計算された分子間エネルギーパラメータと該スコアPSSとの間で相関解析を行い、
Figure 0004612270
[式中、aおよびbは相関解析によって定められる定数である]と表現される回帰式を得るステップと、
(f3)マトリクス変換部で、該回帰式を用いて、アミノ酸出現頻度に基づくスコアマトリクスPSSijを、
Figure 0004612270
[式中、aおよびbはステップ(e3)の回帰式と同じ定数であり、nは、決定されるべきアミノ酸の数である]によって変換されるアミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスPSGijに変換するステップと、
(g3)アミノ酸位置依存的エネルギー計算部で、アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスPSGijから、
【数13】
[式11]
Figure 0004612270
[式中、nは、決定されるべきアミノ酸の数を示し、Cijは、20×nのマトリクスであり、0若しくは1の値で構成される。また、任意のアミノ酸配列中のポジションjにおけるアミノ酸iと一致する要素は1、不一致の要素は0とする。PSGijはPSGマトリクス中のijの要素を示す]によって計算されるアミノ酸位置依存的な分子間エネルギーパラメータPSG値を計算するステップと、
(h3)アミノ酸配列第2探索部で、アミノ酸位置依存的な分子間エネルギーパラメータPSG値が−8.83以下のアミノ酸配列を抽出するステップとを、コンピュータに実行させるためのプログラム。
A program for designing a bioactive peptide capable of interacting with a target protein,
(A3) in the amino acid sequence first search part, comprehensively generating an amino acid sequence consisting of 2 to 10 amino acid residues, randomly selecting an amino acid sequence from the amino acid sequence and extracting it as an analysis library;
(B3) In the intermolecular energy first calculation unit, calculating an intermolecular energy parameter between each amino acid sequence extracted as the analysis library and the target site of the target protein;
(C3) In the score matrix generation unit, using the intermolecular energy parameter calculated in step (b3),
[Equation 9]
[Formula 9]
Figure 0004612270
[ Where a ij represents the number of occurrences of amino acid i at position j in all peptide groups included in the library for analysis, and b ij represents position j in peptide groups equal to or less than the threshold ΔG included in the library for analysis. Generating a score matrix PSS ij based on the appearance frequency of amino acids generated by
(D3) In the score calculation unit, using the score matrix PSS ij based on the appearance frequency of amino acids,
[Expression 10]
[Formula 10]
Figure 0004612270
[In the formula, n represents the number of amino acids to be determined, and C ij is a 20 × n matrix, and is composed of 0 or 1 values. And calculating a score PSS based on the frequency of appearance of amino acids calculated by: 1 for an element that matches amino acid i at position j in any amino acid sequence, and 0 for a mismatched element;
(E3) The regression equation forming unit performs a correlation analysis between the intermolecular energy parameter calculated in step (b3) and the score PSS,
Figure 0004612270
Obtaining a regression equation expressed as [where a and b are constants determined by correlation analysis];
(F3) In the matrix conversion unit, the regression matrix is used to calculate the score matrix PSS ij based on the amino acid appearance frequency,
Figure 0004612270
Where a and b are the same constants as in the regression equation of step (e3) and n is the number of amino acids to be determined matrix based on amino acid position dependent intermolecular energy parameters converted by Converting to PSG ij ;
(G3) In the amino acid position-dependent energy calculation unit, from the matrix PSG ij based on the amino acid position-dependent intermolecular energy parameter,
[Formula 13]
[Formula 11]
Figure 0004612270
[In the formula, n represents the number of amino acids to be determined, and C ij is a 20 × n matrix, and is composed of 0 or 1 values. In addition, an element that matches amino acid i at position j in an arbitrary amino acid sequence is 1 and an element that does not match is 0. Calculating an amino acid position-dependent intermolecular energy parameter PSG value calculated by PSG ij indicates an element of ij in the PSG matrix;
(H3) A program for causing a computer to execute the step of extracting an amino acid sequence having an amino acid position-dependent intermolecular energy parameter PSG value of −8.83 or less in an amino acid sequence second search unit.
以下のステップ(a1)〜(f1):
(a1)データ入力部で、標的タンパク質の標的アミノ酸配列の配列データ入力を受け付けるステップと、
(b1)データ編集部で、1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を
【数14】
[式1]
Figure 0004612270
[式中、wは1〜13の奇数で設定され、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長であり、Tiは標的アミノ酸配列に任意のアミノ酸指標を当てはめたプロファイル波形である]によって変換される1以上の移動平均プロファイル波形xに変換するステップと、
(c1)相補アミノ酸配列候補生成部で、標的アミノ酸配列に任意のアミノ酸指標を当てはめたプロファイル波形に対し、移動平均により低域通過させた移動平均プロファイル波形に負の相関性を持つ相補平均プロファイル波形を近似するプロファイル波形をもつことを特徴とするアミノ酸配列(相補アミノ酸配列)候補を生成して、
【数15】
[式2]
Figure 0004612270
[式中、wは1〜13の奇数で設定され、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長であり、Ciは相補アミノ酸配列候補にステップ(b1)と同一の1以上のアミノ酸指標を当てはめたプロファイル波形である]によって変換される1以上の相補移動平均プロファイル波形yに変換するステップと、
(d1)相補度計算部で、
【数16】
[式3]
Figure 0004612270
[式中、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長である]によって計算される同一のアミノ酸指標に由来する相補度パラメータRを計算するステップと、
(e1)相補アミノ酸配列候補記憶部で、相補アミノ酸配列候補を、該相補度パラメータRとともに記憶手段に記憶するステップと、
(f1)相補アミノ酸配列探索部で、ステップ(e1)によって記憶された情報に基づいて、該相補度パラメータRが−0.9未満の相補アミノ酸配列を抽出するステップ、および/または以下のステップ(a2)〜(b2):
(a2)相互作用領域特定部で、標的タンパク質の標的部位と相互作用することが既知であるタンパク質中の既に相互作用することが特定されている相互作用領域を選択するステップと、
(b2)アミノ酸配列第1探索部で、該相互作用領域から3〜7個のアミノ酸残基からなるアミノ酸配列を抽出するステップとを、コンピュータにステップ(a3)とステップ(b3)との間にさらに実行させるための、請求項7記載のプログラム。
The following steps (a1) to (f1):
(A1) receiving a sequence data input of the target amino acid sequence of the target protein in the data input unit;
(B1) In the data editing unit, the target amino acid sequence is expressed as follows according to one or more predetermined amino acid indices:
[Formula 1]
Figure 0004612270
[Wherein w is an odd number from 1 to 13, s is an integer part of w / 2, j is in the range of s to (ns-1), n is the target sequence length, T i is a profile waveform obtained by applying an arbitrary amino acid index to the target amino acid sequence], and converting to one or more moving average profile waveforms x j converted by
(C1) A complementary average profile waveform having a negative correlation with a moving average profile waveform that has been passed through a low frequency by moving average with respect to a profile waveform in which an arbitrary amino acid index is applied to a target amino acid sequence in a complementary amino acid sequence candidate generation unit An amino acid sequence (complementary amino acid sequence) candidate characterized by having a profile waveform that approximates
[Expression 15]
[Formula 2]
Figure 0004612270
[Wherein w is an odd number from 1 to 13, s is an integer part of w / 2, j is in the range of s to (ns-1), n is the target sequence length, C i is a profile waveform obtained by fitting one or more amino acid indices identical to those in step (b1) to complementary amino acid sequence candidates] to convert to one or more complementary moving average profile waveforms y j converted by
(D1) Complement degree calculation unit,
[Expression 16]
[Formula 3]
Figure 0004612270
Where s is an integer part of w / 2, j is in the range of s to (ns-1), and n is the target sequence length. Calculating a complementarity parameter R;
(E1) In the complementary amino acid sequence candidate storage unit, storing the complementary amino acid sequence candidate together with the complementarity parameter R in the storage means;
(F1) The complementary amino acid sequence search unit extracts a complementary amino acid sequence having a complementarity parameter R less than −0.9 based on the information stored in step (e1), and / or the following steps ( a2) to (b2):
(A2) selecting an interaction region that has already been identified to interact in a protein that is known to interact with the target site of the target protein in the interaction region identification unit;
(B2) The step of extracting an amino acid sequence consisting of 3 to 7 amino acid residues from the interaction region in the amino acid sequence first search unit is performed between step (a3) and step (b3). The program according to claim 7 for further execution.
該アミノ酸指標が、疎水度に基づく指標、電気的特性に基づく指標、α−ヘリックスおよびβ−シートのとりやすさを表す指標、及び側鎖体積の相対的な大きさを表す指標から選ばれる1以上の指標である、請求項8に記載のプログラム。  The amino acid index is selected from an index based on hydrophobicity, an index based on electrical characteristics, an index representing ease of taking α-helix and β-sheet, and an index representing the relative size of side chain volume The program according to claim 8, which is the above index. 1以上の所定のアミノ酸指標を使用してステップ(a1)〜(f1)で抽出された所定の数の相補アミノ酸配列に対して、1以上の別のアミノ酸指標を使用してステップ(b1)〜(f1)を行なうということを1回以上繰り返すことにより、生理活性ペプチドとして抽出される相補アミノ酸配列候補をさらに絞り込むことを特徴とする、請求項8または9に記載のプログラム。  For a predetermined number of complementary amino acid sequences extracted in steps (a1) to (f1) using one or more predetermined amino acid indexes, steps (b1) to The program according to claim 8 or 9, wherein the candidate of complementary amino acid sequence extracted as a physiologically active peptide is further narrowed down by repeating (f1) one or more times. (i)分子間エネルギー第2計算部で、当該抽出されたアミノ酸配列について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(ii)アミノ酸配列記憶部で、該アミノ酸配列を、該分子間エネルギーパラメータとともに記憶手段に記憶するステップと、
(iii)アミノ酸配列第3探索部で、ステップ(ii)によって記憶された情報に基づいて、アミノ酸位置依存的な分子間エネルギーパラメータPSG値が−12.0以下のアミノ酸配列を抽出するステップと、
(iv)アミノ酸配列表示部で、ステップ(iii)によって抽出されたアミノ酸配列を、生理活性ペプチドの候補として表示するステップとを、コンピュータにさらに実行させるための、請求項7〜10のいずれか1項記載のプログラム。
(I) a step of calculating an intermolecular energy parameter with the target site of the target protein for the extracted amino acid sequence in the intermolecular energy second calculation unit;
(Ii) in the amino acid sequence storage unit, storing the amino acid sequence together with the intermolecular energy parameter in a storage means;
(Iii) in the amino acid sequence third search unit, based on the information stored in step (ii), extracting an amino acid sequence having an amino acid position-dependent intermolecular energy parameter PSG value of −12.0 or less;
(Iv) In the amino acid sequence display unit, the computer further executes a step of displaying the amino acid sequence extracted in step (iii) as a candidate for a bioactive peptide. Program described in the section.
さらに、ステップ(iii)とステップ(iv)との間において、
(I)ステップ(iii)で抽出されたアミノ酸配列に対しアミノ酸変異を導入したアミノ酸配列を生成するステップと、
(II)ステップ(I)で生成されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを計算するステップと、
(III)ステップ(iii)で抽出されたアミノ酸配列と標的タンパク質の標的部位との分子間エネルギーパラメータを対照として、ステップ(II)で計算された分子間エネルギーパラメータを比較し、対照の分子間エネルギーパラメータよりも安定な分子間エネルギーパラメータを有するアミノ酸配列を抽出するステップとを含む、請求項11記載のプログラム。
Furthermore, between step (iii) and step (iv),
(I) generating an amino acid sequence in which an amino acid mutation is introduced into the amino acid sequence extracted in step (iii);
(II) calculating an intermolecular energy parameter between the amino acid sequence generated in step (I) and the target site of the target protein;
(III) The intermolecular energy parameter calculated in step (II) is compared by comparing the intermolecular energy parameter between the amino acid sequence extracted in step (iii) and the target site of the target protein. And extracting an amino acid sequence having an intermolecular energy parameter that is more stable than the parameter.
請求項7〜12のいずれか1項記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。  The computer-readable recording medium which recorded the program of any one of Claims 7-12. 標的タンパク質と相互作用し得る生理活性ペプチドを設計するための装置であって、(イ3)アミノ酸配列第1探索部と、(ロ3)分子間エネルギー第1計算部と、(ハ3)スコアマトリクス生成部と、(ニ3)スコア計算部と、(ホ3)回帰式形成部と、(ヘ3)マトリクス変換部と、(ト3)アミノ酸位置依存的エネルギー計算部と、(チ3)アミノ酸配列第2探索部と、(リ3)分子間エネルギー第2計算部と、(ヌ3)アミノ酸配列記憶部と、(ル3)アミノ酸配列第3探索部と、(オ3)アミノ酸配列表示部とを備え、
該アミノ酸配列第1探索部は、(a3)2〜10個のアミノ酸残基からなるアミノ酸配列を網羅的に生成し、その中からランダムにアミノ酸配列を選択して解析用ライブラリとして抽出する手段を含み、該分子間エネルギー第1計算部は、(b3)解析用ライブラリとして抽出された各アミノ酸配列と該標的タンパク質の標的部位との間の分子間エネルギーパラメータを計算する手段を含み、
該スコアマトリクス生成部は、(c3)ステップ(b3)で計算された分子間エネルギーパラメータを用いて、
【数17】
[式9]
Figure 0004612270
[式中、aijは、解析用ライブラリに含まれる全ペプチド群中のポジションjにおけるアミノ酸iの出現回数を示し、bijは、解析用ライブラリに含まれる閾値ΔG以下のペプチド群中のポジションjにおけるアミノ酸iの出現回数である]によって生成されるアミノ酸出現頻度に基づくスコアマトリクスPSSijを生成する手段を含み、
該スコア計算部は、(d3)アミノ酸出現頻度に基づくスコアマトリクスPSSijを用いて、
【数18】
[式10]
Figure 0004612270
[式中、nは、決定されるべきアミノ酸の数を示し、Cijは、20×nのマトリクスであり、0若しくは1の値で構成される。また、任意のアミノ酸配列中のポジションjにおけるアミノ酸iと一致する要素は1、不一致の要素は0とする]によって計算されるアミノ酸出現頻度に基づくスコアPSSを計算する手段を含み、
該回帰式形成部は、(e3)ステップ(b3)で計算された分子間エネルギーパラメータと該スコアPSSとの間で相関解析を行い、
Figure 0004612270
[式中、aおよびbは相関解析によって定められる定数である]と表現される回帰式を得る手段を含み、該マトリクス変換部は、(f3)該回帰式を用いて、アミノ酸出現頻度に基づくスコアマトリクスPSSijを、
Figure 0004612270
[式中、aおよびbはステップ(e3)の回帰式と同じ定数であり、nは、決定されるべきアミノ酸の数である]によって変換されるアミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスPSGijに変換する手段を含み、
該アミノ酸位置依存的エネルギー計算部は、(g3)アミノ酸位置依存的な分子間エネルギーパラメータに基づくマトリクスPSGijから、
【数21】
[式11]
Figure 0004612270
[式中、nは、決定されるべきアミノ酸の数を示し、Cijは、20×nのマトリクスであり、0若しくは1の値で構成される。また、任意のアミノ酸配列中のポジションjにおけるアミノ酸iと一致する要素は1、不一致の要素は0とするPSGijはPSGマトリクス中のijの要素を示す]によって計算されるアミノ酸位置依存的な分子間エネルギーパラメータPSG値を計算する手段を含み、
該アミノ酸配列第2探索部は、(h3)アミノ酸位置依存的な分子間エネルギーパラメータPSG値が−8.83以下のアミノ酸配列を抽出する手段を含み、
該分子間エネルギー第2計算部は、(i)抽出されたアミノ酸配列について、標的タンパク質の標的部位との分子間エネルギーパラメータを計算する手段を含み、
該アミノ酸配列記憶部は、(ii)該アミノ酸配列を、該分子間エネルギーパラメータとともに記憶する手段を含み、
該アミノ酸配列第3探索部は、(iii)ステップ(ii)によって記憶された情報に基づいて、所定の数のアミノ酸配列を抽出する手段を含み、
該アミノ酸配列表示部は、(iv)ステップ(iii)によって抽出されたアミノ酸配列を、生理活性ペプチドの候補として表示する手段を含む、装置。
A device for designing a physiologically active peptide capable of interacting with a target protein, comprising (a) an amino acid sequence first search unit, (b) a first intermolecular energy calculation unit, and (c) a score. A matrix generation unit; (d) 3) a score calculation unit; (e) 3) a regression equation formation unit; (f) a matrix conversion unit; (d) 3) an amino acid position-dependent energy calculation unit; Amino acid sequence second search unit, (Li 3) intermolecular energy second calculation unit, (nu 3) amino acid sequence storage unit, (le 3) amino acid sequence third search unit, and (e 3) amino acid sequence display With
The amino acid sequence first search unit (a3) includes means for comprehensively generating an amino acid sequence consisting of 2 to 10 amino acid residues, selecting an amino acid sequence randomly from among them, and extracting it as an analysis library The intermolecular energy first calculation unit includes (b3) means for calculating an intermolecular energy parameter between each amino acid sequence extracted as the analysis library and the target site of the target protein,
The score matrix generation unit uses the intermolecular energy parameter calculated in (c3) step (b3),
[Expression 17]
[Formula 9]
Figure 0004612270
[ Where a ij represents the number of occurrences of amino acid i at position j in all peptide groups included in the library for analysis, and b ij represents position j in peptide groups equal to or less than the threshold ΔG included in the library for analysis. Means for generating a score matrix PSS ij based on the frequency of occurrence of amino acids generated by
The score calculation unit uses (d3) score matrix PSS ij based on the appearance frequency of amino acids,
[Formula 18]
[Formula 10]
Figure 0004612270
[In the formula, n represents the number of amino acids to be determined, and C ij is a 20 × n matrix, and is composed of 0 or 1 values. An element that matches amino acid i at position j in any amino acid sequence is 1 and an element that does not match is 0.
The regression equation forming unit (e3) performs a correlation analysis between the intermolecular energy parameter calculated in step (b3) and the score PSS,
Figure 0004612270
[Wherein, a and b are constants determined by correlation analysis], and the matrix conversion unit (f3) uses the regression expression to determine the frequency of occurrence of amino acids. Score matrix PSS ij
Figure 0004612270
Where a and b are the same constants as in the regression equation of step (e3) and n is the number of amino acids to be determined Means for converting to PSG ij ,
The amino acid position-dependent energy calculation unit (g3) from the matrix PSG ij based on the amino acid position-dependent intermolecular energy parameter,
[Expression 21]
[Formula 11]
Figure 0004612270
[In the formula, n represents the number of amino acids to be determined, and C ij is a 20 × n matrix, and is composed of 0 or 1 values. In addition, an element that matches amino acid i at position j in an arbitrary amino acid sequence is 1 and an element that does not match is 0. PSG ij indicates an element of ij in the PSG matrix] Means for calculating the interstitial energy parameter PSG value,
The amino acid sequence second search unit includes (h3) means for extracting an amino acid sequence having an amino acid position-dependent intermolecular energy parameter PSG value of −8.83 or less,
The intermolecular energy second calculation unit includes (i) a means for calculating an intermolecular energy parameter with the target site of the target protein for the extracted amino acid sequence,
The amino acid sequence storage unit includes (ii) means for storing the amino acid sequence together with the intermolecular energy parameter;
The amino acid sequence third search part includes (iii) means for extracting a predetermined number of amino acid sequences based on the information stored in step (ii),
The amino acid sequence display unit includes: (iv) means for displaying the amino acid sequence extracted in step (iii) as a candidate for a bioactive peptide.
以下の構成1:
(イ)データ入力部と、(ロ)データ編集部と、(ハ)相補アミノ酸配列候補生成部と、(ニ)相補度計算部と、(ホ)相補アミノ酸配列候補記憶部と、(ヘ)相補アミノ酸配列探索部、および/または以下の構成2:
(イ2)相互作用領域特定部と、(ロ2)相互領域アミノ酸配列第1探索部を(イ3)アミノ酸配列第1探索部と、(ロ3)分子間エネルギー第1計算部との間で各手段が実行されるようにさらに備える、請求項14記載の装置であって、
該構成1において、
該データ入力部は、(a1)標的アミノ酸配列の配列データ入力を受け付ける手段を含み、
該データ編集部は、(b1)1以上の所定のアミノ酸指標に従い、該標的アミノ酸配列を
【数22】
[式1]
Figure 0004612270
[式中、wは1〜13の奇数で設定され、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長であり、Tiは標的アミノ酸配列に任意のアミノ酸指標を当てはめたプロファイル波形である]によって変換される1以上の移動平均プロファイル波形xに変換する手段を含み、
該相補アミノ酸配列候補生成部は、(c1)標的アミノ酸配列に任意のアミノ酸指標を当てはめたプロファイル波形に対し、移動平均により低域通過させた移動平均プロファイル波形に負の相関性を持つ相補平均プロファイル波形を近似するプロファイル波形をもつことを特徴とするアミノ酸配列候補(相補アミノ酸配列)を生成して、
【数23】
[式2]
Figure 0004612270
[式中、wは1〜13の奇数で設定され、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長であり、Ciは相補アミノ酸配列候補にステップ(b1)と同一の1以上のアミノ酸指標を当てはめたプロファイル波形である]によって変換される1以上の相補移動平均プロファイル波形yに変換する手段を含み、
該相補度計算部は、(d1)
【数24】
[式3]
Figure 0004612270
[式中、sはw/2の整数部分であり、jはsから(n−s−1)の範囲であり、nは標的配列長である]によって計算される同一のアミノ酸指標に由来する相補度パラメータRを計算する手段を含み、
該相補アミノ酸配列候補記憶部は、(e1)相補アミノ酸配列候補を、該相補度パラメータととともに記憶する手段を含み、
該相補アミノ酸配列探索部は、(f1)手段(e1)で記憶された情報に基づいて、該相補度パラメータRが−0.9未満の相補アミノ酸配列を抽出する手段を含み、
該構成2において、
該相互作用領域特定部は、(a2)標的タンパク質の標的部位と相互作用することが既知であるタンパク質分子中の既に相互作用することが特定されている相互作用領域を選択する手段を含み、
該アミノ酸配列第1探索部は、(b2)該相互作用領域から3〜7個のアミノ酸残基からなるアミノ酸配列を抽出する手段を含み、
手段(f1)および/または(b2)によって抽出されたアミノ酸配列が、該分子間エネルギー第2計算部、該アミノ酸配列記憶部、該アミノ酸配列第3探索部、並びに該アミノ酸配列表示部で処理される、装置。
The following configuration 1:
(B) a data input unit; (b) a data editing unit; (c) a complementary amino acid sequence candidate generation unit; (d) a complementation degree calculation unit; (e) a complementary amino acid sequence candidate storage unit; Complementary amino acid sequence search part and / or the following configuration 2:
(B) The interaction region specifying part, (b) The mutual region amino acid sequence first search part, (b) The amino acid sequence first search part, and (b) The intermolecular energy first calculation part. 15. The apparatus of claim 14, further comprising:
In the configuration 1,
The data input unit includes (a1) means for receiving sequence data input of a target amino acid sequence,
The data editing unit (b1) determines the target amino acid sequence according to a predetermined amino acid index of 1 or more as follows:
[Formula 1]
Figure 0004612270
[Wherein w is an odd number from 1 to 13, s is an integer part of w / 2, j is in the range of s to (ns−s−1), n is the target sequence length, T i is a profile waveform obtained by applying an arbitrary amino acid index to the target amino acid sequence], and includes means for converting into one or more moving average profile waveforms x j converted by
The complementary amino acid sequence candidate generation unit (c1) is a complementary average profile having a negative correlation with a moving average profile waveform that has been passed through a low frequency by moving average with respect to a profile waveform in which an arbitrary amino acid index is applied to a target amino acid sequence Generate an amino acid sequence candidate (complementary amino acid sequence) characterized by having a profile waveform that approximates the waveform,
[Expression 23]
[Formula 2]
Figure 0004612270
[Wherein w is an odd number from 1 to 13, s is an integer part of w / 2, j is in the range of s to (ns−s−1), n is the target sequence length, C i is a profile waveform obtained by applying one or more amino acid indices identical to those in step (b1) to complementary amino acid sequence candidates], and includes means for converting into one or more complementary moving average profile waveforms y j converted by
The degree of complementation calculation part is (d1)
[Expression 24]
[Formula 3]
Figure 0004612270
Where s is the integer part of w / 2, j is in the range of s to (ns-1), and n is the target sequence length. Means for calculating a complementarity parameter R;
The complementary amino acid sequence candidate storage unit includes (e1) means for storing a complementary amino acid sequence candidate together with the complementation degree parameter,
The complementary amino acid sequence search unit includes: (f1) means for extracting a complementary amino acid sequence having a complementarity parameter R of less than −0.9 based on the information stored in the means (e1),
In the configuration 2,
The interaction region specifying part includes (a2) means for selecting an interaction region that has already been specified to interact in a protein molecule that is known to interact with a target site of a target protein,
The amino acid sequence first search unit includes (b2) means for extracting an amino acid sequence consisting of 3 to 7 amino acid residues from the interaction region,
The amino acid sequences extracted by the means (f1) and / or (b2) are processed by the intermolecular energy second calculation unit, the amino acid sequence storage unit, the amino acid sequence third search unit, and the amino acid sequence display unit. Equipment.
JP2002258305A 2002-06-27 2002-09-03 Design method of bioactive peptide and use thereof Expired - Fee Related JP4612270B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2002258305A JP4612270B2 (en) 2002-06-27 2002-09-03 Design method of bioactive peptide and use thereof
EP03794196A EP1553177A4 (en) 2002-09-03 2003-09-03 Method of designing physiologically active peptide and use thereof
CA002497477A CA2497477A1 (en) 2002-09-03 2003-09-03 Method of designing physiologically active peptide and use thereof
PCT/JP2003/011237 WO2004022737A1 (en) 2002-09-03 2003-09-03 Method of designing physiologically active peptide and use thereof
AU2003261900A AU2003261900A1 (en) 2002-09-03 2003-09-03 Method of designing physiologically active peptide and use thereof
US10/526,406 US7660677B2 (en) 2002-09-03 2003-09-03 Method of designing physiologically active peptide and use thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002188806 2002-06-27
JP2002258305A JP4612270B2 (en) 2002-06-27 2002-09-03 Design method of bioactive peptide and use thereof

Publications (2)

Publication Number Publication Date
JP2004081178A JP2004081178A (en) 2004-03-18
JP4612270B2 true JP4612270B2 (en) 2011-01-12

Family

ID=32071754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002258305A Expired - Fee Related JP4612270B2 (en) 2002-06-27 2002-09-03 Design method of bioactive peptide and use thereof

Country Status (1)

Country Link
JP (1) JP4612270B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITMI20041569A1 (en) * 2004-07-30 2004-10-30 Tecnogen Scpa "PEPTIDAL LIGANDS SPECIFIC FOR IMMUNOGLOBULINS"
EP1817328A2 (en) * 2004-11-24 2007-08-15 Theraptosis S.A. New peptides useful as dual caspase-2/-6 inhibitors and their biological applications
WO2008038766A1 (en) * 2006-09-29 2008-04-03 National University Corporation Gunma University Functional peptide having activity of stimulating immune cell
CN103232528B (en) * 2012-12-12 2014-12-24 上海交通大学 Bioactive polypeptide DELQ and preparation method and application thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003313200A (en) * 2002-02-21 2003-11-06 Hidechika Okada Evaluation system for active peptide and new active peptide

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003313200A (en) * 2002-02-21 2003-11-06 Hidechika Okada Evaluation system for active peptide and new active peptide

Also Published As

Publication number Publication date
JP2004081178A (en) 2004-03-18

Similar Documents

Publication Publication Date Title
Duan et al. Accelerated molecular dynamics simulation for helical proteins folding in explicit water
Grubert et al. Landscape of cohesin-mediated chromatin loops in the human genome
Scott et al. Small molecules, big targets: drug discovery faces the protein–protein interaction challenge
Karanicolas et al. The structural basis for biphasic kinetics in the folding of the WW domain from a formin-binding protein: Lessons for protein design?
Chothia et al. Genomic and structural aspects of protein evolution
Obarska-Kosinska et al. PepComposer: computational design of peptides binding to a given protein surface
Lewis et al. Current methods for site-directed structure generation
JP3588605B2 (en) Prediction method for protein-protein interaction
JP2002536301A (en) Protein modeling tools
Bacci et al. Amyloid β fibril elongation by monomers involves disorder at the tip
Bharatham et al. Ligand binding mode prediction by docking: mdm2/mdmx inhibitors as a case study
Rennella et al. The role of protein thermodynamics and primary structure in fibrillogenesis of variable domains from immunoglobulin light chains
Kroemer Molecular modelling probes: docking and scoring
Zhang et al. Design and optimization of a linker for fusion protein construction
Leclere et al. Dynamic evolution of the Cthrc1 genes, a newly defined collagen-like family
Ahmad et al. Analysis of the evolution of granule associated serine proteases of immune defence (GASPIDs) suggests a revised nomenclature
JP4612270B2 (en) Design method of bioactive peptide and use thereof
Sun et al. Inhibition of programmed cell death protein ligand-1 (PD-L1) by benzyl ether derivatives: Analyses of conformational change, molecular recognition and binding free energy
Zhang et al. CD155-prognostic and immunotherapeutic implications based on multiple analyses of databases across 33 human cancers
Calin et al. Genetic chaos and antichaos in human cancers
Kaga et al. Computationally assisted screening and design of cell-interactive peptides by a cell-based assay using peptide arrays and a fuzzy neural network algorithm
Moon et al. 3D database searching and de novo construction methods in molecular design
Chandrasekhar et al. Efficient exploration of conformational space using the stochastic search method: application to β‐peptide oligomers
Xu et al. Learning the drug target‐likeness of a protein
Tsiolaki et al. Mining databases for protein aggregation: a review

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20100809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100819

RD15 Notification of revocation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7435

Effective date: 20100819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100921

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101015

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4612270

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees