JP4315960B2

JP4315960B2 - タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法

Info

Publication number: JP4315960B2
Application number: JP2006013792A
Authority: JP
Inventors: 秀明梅山; 克一郎小松
Original assignee: IN-SILICO SCIENCES, INC.
Current assignee: IN-SILICO SCIENCES, INC.
Priority date: 2001-01-19
Filing date: 2006-01-23
Publication date: 2009-08-19
Anticipated expiration: 2022-01-17
Also published as: JP2006209764A

Description

本発明は、誘導適合を含めたタンパク質の立体構造構築方法およびその利用に関し、さらに詳しくは、参照タンパク質の立体構造とその原子座標を変位させた複数の立体構造セットを参照タンパク質の立体構造として目的タンパク質の複数の立体構造セットを作成することよりなるタンパク質の立体構造構築方法、該立体構造セットを用いるタンパク質−リガンド複合体の立体構造構築方法、およびタンパク質のリガンド結合部位の特定方法等に関する。

本発明の方法により提供される目的タンパク質の立体構造は、誘導適合（induced fit）を含めた立体構造であり、医農薬の分子設計に極めて有用である。

立体構造が既知のタンパク質に関する情報を利用し、立体構造が未知の目的タンパク質とのアライメントを得て、このアライメント情報に基づいて目的タンパク質の立体構造を、コンピュータを用いて作成することが可能であり、この手法は、通常ホモロジーモデリング(homology modeling)と呼ばれている。ホモロジーモデリングにより構築される立体構造の精度は、近年目覚ましく向上しているが、未だ解決すべき問題点も多い。

この方法を用いて受容体タンパク質の立体構造を構築する場合、リガンドが結合する空間の確保が不可欠である。しかしながら、従来の立体構造構築法ではリガンドが存在する空間や結合部位に構築された立体構造の主鎖または側鎖がパッキングされ、その空間が塞がれてしまい、リガンドが受容体タンパク質と接触し、その結合部位に存在できない等の問題が生じていた。

また、タンパク質−リガンド複合体の立体構造構築方法において、目的受容体タンパク質の立体構造が実験的に求まっていない場合、単にホモロジーモデリング(homology modeling)法により構築された受容体タンパク質の立体構造自身にリガンドをドッキングさせ、分子力場計算や分子動力学計算で、それらを最適化することにより受容体タンパク質−リガンド複合体の立体構造を得ていた。また、Multiple Copy Simultaneous Search (MCSS) 法を用いた研究においても、受容体タンパク質側の立体構造には基準振動モードは考慮されておらず、とくに分子の時間的にピコオーダーの振動を主とする長周期の熱揺らぎ(以下これを単に「熱揺らぎ」または「分子揺らぎ」と称することがある)は無視されていた。

更に、従来から、遠距離まで影響を及ぼす静電ポテンシャルによるタンパク質のリガンド結合部位を特定する方法や、類似化合物に基づいたタンパク質−リガンド複合体の立体構造の構築が行われているが、いずれも信頼性が低く、類似化合物の無い場合には信頼性のあるタンパク質−リガンド複合体の立体構造を導くことは困難であった。

本発明は、上記の状況を鑑みて、任意のタンパク質の立体構造を精度良く構築する方法、またタンパク質−リガンド複合体の立体構造を精度良く構築する方法等の提供を目的としてなされたものである。

本発明者等は、上記課題を達成すべく鋭意検討した結果、参照タンパク質の原子座標を基準振動解析法から得られる固有ベクトル方向に変位した原子座標を参照して受容体タンパク質の立体構造を構築すれば、リガンドが存在する空間や結合部位に立体構造の主鎖または側鎖がパッキングされてその空間が塞がれることが無く、受容体タンパク質の立体構造の精度を格段に向上させることができることを見出した。すなわち、基準振動モードに基づいて分子の熱揺らぎを考慮した複数の受容体タンパク質モデルが構築できることを見出した。

また、かくして構築された受容体タンパク質モデルにドッキングしたリガンドの立体構造を用いて、Multiple Copy Simultaneous Search (MCSS) 法の分子力学計算と分子動力学計算を適用して、分子の熱揺らぎを考慮した精度の高いタンパク質−リガンド複合体の立体構造構築が可能であることを見出した。

更に、本発明者等は、タンパク質−リガンド複合体には水溶液中での現象を考えると静電力よりも疎水相互作用の方が重要でないかという結論に達した。そこでタンパク質周囲および内部に溶媒を配置し、分子動力学による溶媒挙動（溶媒の拡散・集積）の解析からタンパク質に溶媒が集積する部位または溶媒が拡散しにくい部位が、リガンド結合部位と一致することを見出した。

本発明はこれらの知見に基づいて成し遂げられたものである。

即ち、本発明の方法により、（１）参照タンパク質と目的タンパク質とのアライメントを導き出し、該アライメントおよび参照タンパク質の立体構造情報に基づいて目的タンパク質の立体構造を構築する方法において、参照タンパク質の立体構造とその原子座標を変位させた複数の立体構造を参照タンパク質の立体構造として目的タンパク質の複数の立体構造セットを作成することを特徴とする誘導適合を含めたタンパク質の立体構造構築方法が提供される。

この発明の好ましい態様により（２）参照タンパク質の原子座標の変位が、基準振動解析法により行われることを特徴とする上記（１）に記載の方法、（３）立体構造の構築が、(i)アミノ酸中のCα原子について参照タンパク質の立体構造から座標を取得し、目的関数を最小化するようにCα原子座標を最適化し、(ii)最適化されたCαの原子座標に主鎖の他の原子を付加して目的関数を最小化するように主鎖の原子座標を最適化し、(iii)最適化された主鎖の原子座標に側鎖の他の原子を付加し目的関数を最小化するように最適化することにより行われることを特徴とする上記（１）又は（２）に記載の方法が提供される。

本発明の別の態様により、（４）(i)上記（１）〜（３）のいずれかに記載の方法により得られる目的タンパク質の複数の立体構造とリガンドとのドッキング操作を行い、(ii)目的タンパク質の１つの構造とリガンドとの構造の経験的分子エネルギー計算を、目的タンパク質の構造の数だけ行い、その際、(iii)目的タンパク質側は、複数の構造それぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、(iv)リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンドの原子座標を動かして、(v)目的タンパク質の複数の立体構造に基づくリガンドの立体構造を求めることを特徴とするタンパク質−リガンド複合体の立体構造構築方法が提供される。

この発明の好ましい態様により、（５）経験的分子エネルギー計算において、目的タンパク質の初期Cα原子座標の位置をオプションHarmonic関数として加えるか、あるいは目的タンパク質の主鎖のねじれ角を拘束するポテンシャル関数を加えることを特徴とする上記（４）に記載の方法が提供される。

本発明の別の態様により、（６）(i)タンパク質の立体構造の周囲に低分子化合物を配置し、(ii)それらの周囲にさらに水分子を配置し、水溶媒中での経験的分子エネルギー計算を行って、タンパク質と低分子化合物との原子座標を得、(iii)得られた原子座標について、タンパク質の周囲および内部の、低分子化合物の挙動解析を行い、リガンドの結合部位を判定することを特徴とするタンパク質のリガンド結合部位の特定方法、および、（７）(i)タンパク質およびリガンドの立体構造の周囲に低分子化合物を配置し、(ii)それらの周囲にさらに水分子を配置し、水溶媒中での経験的分子エネルギー計算を行って、タンパク質と低分子化合物との原子座標を得、(iii)得られた原子座標について、タンパク質およびリガンドの周囲および内部の、低分子化合物の挙動解析を行い、タンパク質−リガンド複合体の結合部位を判定することを特徴とするタンパク質−リガンド複合体の結合部位の特定方法が提供される。

この発明の好ましい態様により、（８）低分子化合物の挙動解析が、低分子化合物を対象としたクラスター解析により行われ、得られたクラスターのサイズをリガンドの結合可能性部位の順位として結合部位を判定することを特徴とする上記（６）または（７）に記載の方法が提供される。

本発明の別の態様により、（９）上記（６）〜（８）のいずれかに記載の方法により特定したタンパク質のリガンド結合部位にリガンドをドッキングし、経験的分子エネルギー計算によりタンパク質−リガンド複合体の立体構造を得ることを特徴とするタンパク質−リガンド複合体の立体構造構築方法が提供される。

本発明の別の態様により、（１０）上記（１）〜（５）および（９）のいずれかに記載の方法により得られるタンパク質の立体構造および／またはタンパク質−リガンド複合体の立体構造を規定する原子座標が記録されていることを特徴とするコンピュータ読みとり可能な記録媒体、または、該原子座標を含むことを特徴とするデータベースが提供される。

本発明の別の態様により、（１１）上記（１０）に記載の記録媒体またはデータベースから得られるタンパク質の立体構造を規定する原子座標を用いて、薬物候補分子の立体構造との相互作用に基づいて、目的とする薬物分子を同定、検索、評価または設計することを特徴とする薬物分子設計方法が提供される。

以下、本発明を更に詳細に説明する。本明細書において、幾つかの用語を使用するが、特に明記しない限り、次の意味を有する。

「目的タンパク質」とは、X線結晶解析やNMR解析等により完全な立体構造が決定されておらず、本発明において立体構造構築の対象となる任意のタンパク質を意味する。このタンパク質には、部分構造は解析されているが完全な立体構造が得られていないものも含まれる。本発明においては、立体構造が未知の受容体タンパク質、酵素等を目的タンパク質とするのが好ましい。ここで、X線結晶解析には、X線のみならず電子線および中性子線解析等も含まれる。

「受容体タンパク質」とは、細胞に存在し、外来性の物質あるいは物理的刺激を認識して、細胞に応答を誘起するタンパク質を意味する。この受容体タンパク質は、リガンドを特異的に結合する能力を有する。また、「リガンド」とは、タンパク質と特異的に結合する能力を有する物質を意味する。リガンドには、医農薬分子の様な低分子物質のみならず、抗体やタンパク質と相互作用をする特定のペプチドやタンパク質等の高分子物質も含まれる。

「参照タンパク質」とは、その立体構造の詳細がX線結晶解析やNMR解析等により既に決定されており、目的タンパク質の立体構造を規定する原子座標を構築するために参照するタンパク質を意味する。また「アライメント」とは、２種類以上のタンパク質についてアミノ酸配列の対応関係をつけることを意味する。

「原子座標」とは、三次元空間上で立体構造を記述するものである。それは空間上のある点を原点とする互いに垂直な三方向の相対的な距離であり、タンパク質中に存在する水素原子を除く原子一つあたりに３個の数字からなるベクトル量である。

「誘導適合（induced fit）」とは、タンパク質の立体構造は柔軟であり、リガンド、例えば医農薬分子と結合すると、それとより良く結合するようにタンパク質の立体構造が変化することを意味する。「誘導適合（induced fit）を含めた立体構造」とは、誘導適合により生じるタンパク質の立体構造変化を、例えば基準振動解析法で得られる固有ベクトルで表せると仮定し、誘導適合前の立体構造にこの固有ベクトルを加えて生成する立体構造を意味する。

「目的タンパク質−リガンド複合体」とは、X線結晶解析やNMR解析等により複合体の完全な立体構造が解明されておらず、本発明において立体構造の構築対象となるタンパク質−リガンド複合体を意味する。もちろんタンパク質としてX線結晶解析やNMR解析等により得られた立体構造を含むことは当然である。この複合体には、部分構造が解析されているが完全な立体構造が得られていないものも含まれる。タンパク質に結合したリガンド双方の複合体を意味する。

「Multiple Copy Simultaneous Search (MCSS) 法」とは、複数リガンドの立体構造を基にして目的タンパク質−リガンド複合体の立体構造を、経験的分子エネルギー計算法、すなわち分子力学、分子動力学計算で受容体タンパク質の立体構造を求める方法である。本発明では、それとは逆に、複数のタンパク質の立体構造を１つのリガンドの立体構造を基に目的とするタンパク質−リガンド複合体の立体構造を求める方法を意味する。

「経験的分子エネルギー計算」とは、分子力学計算と分子動力学計算を意味する。両者とも経験ポテンシャルを使った分子エネルギー計算である。

「MSAS(Maximum Solvent Accessibility of Sidechain)」とは、最大溶媒接触表面積のことであり、タンパク質を構成している各アミノ酸の側鎖の溶媒接触表面積と、そのアミノ酸がタンパク質を構成していない単独に存在する状態のときの側鎖の溶媒接触表面積との比を意味する。MSASの詳細は、K. Akahane, Y. Nagano and H. Umeyama, Chem. Pharm. Bull., 1989, 37(1) 86-92に記載されている。

後記Ｉ〜IIIの方法は、ホモロジーモデリングを行うことができる適当なコンピュータを用いて、後記方法を実行させる適当なプログラムを利用して実施することができる。

Ｉ．誘導適合を含めた立体構造の構築方法
先ず、本発明の誘導適合を含めた立体構造の構築方法について説明する。

第１図は、本発明の誘導適合（induced fit）を含めた立体構造構築方法の一例を示すフローチャートである。

ステップI-10において、目的タンパク質の配列を入力し、目的タンパク質の立体構造の構築に用いる参照タンパク質を選定し、参照タンパク質の立体構造から原子座標を収得し、目的関数を最小化するように原子座標を最適化する。ステップI-20において、最適化した原子座標の基準振動解析法を行う。ステップI-30において、固有ベクトル方向に参照タンパク質の原子座標を変位し、その構造を参照タンパク質に加え、参照タンパク質のセットを作成する。ステップI-40において、適当なホモロジー・モデリング・プログラム、例えばFAMSによりアライメント情報や参照タンパク質セットの各立体構造情報から目的タンパク質の立体構造のセットを構築する。かくして、目的タンパク質の誘導適合（induced fit）を含めた立体構造を精度良く構築することができる。以下、各ステップについて更に詳細に説明する。

ステップI-10：参照タンパク質の初期座標の最適化
先ず、目的タンパク質の立体構造の構築において、目的タンパク質のアミノ酸配列を入力し、参照するタンパク質（参照タンパク質）を選定する。参照タンパク質の選定は、それ自体既知の通常用いられるアライメントソフトウエアを用いて行われる。この参照タンパク質の原子座標を、適当な立体構造データベースから収得する。この原子座標には、アミノ酸の骨格を作る窒素原子等に結合している水素原子はなく、ステップI-20の基準振動解析法の計算に水素原子が必要な場合は水素原子を発生させる。参照タンパク質の原子座標から構成される目的関数を用いて原子座標を最適化する。

ここで、用いられる目的タンパク質のアミノ酸配列としては、データベースに登録されているもの、配列が始めて解析されたもの等の如何なる由来の配列であってもよい。用いられるアミノ酸配列データベースとしては、例えば、“An Internet review: the complete neuroscientist scours the World Wide Web.” Bloom FE, Science 1996; 274(5290): 1104-9に詳細が記載されているGCRDb (The G-protein-coupled Receptor Database): http://www.gcrdb.uthscsa.edu/、GPCRDB: http://www.gpcr.org/7tm/、ExPASy: http://www.expasy.ch/cgi-bin/sm-gpcr.pl、ORDB: http://ycmi.med.yale.edu/senselab/ordb/、GeneBank: ftp://ncbi.nlm.nih.gov/genbank/genomes/、PIR: http://www-nbrf.georgetown.edu/pir/ (National Biomedical Research Foundation(NBRF))、Swiss Plot: http://www.expasy.ch/sprot/sprot-top.html(Swiss Institute of Bioinformatics (SIB), European Bioinfomatics Institute (EBI))、TrEMBL (URL及び管理者ともにSwiss Plotと同じ)、TrEMBLNEW (URL及び管理者ともにSwiss Plotと同じ)、DAD: ftp://ftp.ddbj.nig.ac.jp(日本DNAデータバンク)等のデータベースに登録されているヒト(H. sapiens)、ショウジョウバエ(D. melanogaster)、線虫(C. elagans)、酵母(S. cerevisiae)、シロイヌナズナ(A. thaliana)等を挙げることができる。これらのデータベースは単なる例示であり、タンパク質のアミノ酸配列が登録されているものであれば如何なるデータベースを用いることもできる。

また、参照タンパク質の原子座標の収得に用いられる立体構造データベースとしては、例えばPDB (Protein Data Bank): http://www.rcsb.org/pdb/、CCDC (Cambridge Crystallographic Data Centre: http://www.ccdc.cam.au.uk/、 SCOP (Structure Classification of Protein): http://scop.mrc-lmb.cam.ac.uk/scop、CATH: http://www.biochem.ucl.ac.uk/bsm/cath等を挙げることができる。これらの立体構造データベースは、単独または組み合わせて用いることことができる。上記データベース中、SCOPおよびCATHは、ドメイン単位（タンパク質の立体構造で、３次構造の単位）に区切った立体構造データベースである。

アライメント用ソフトウエアとしては、例えばFASTAもしくはPSI-BLAST (Position-Specific Iterated BLAST)を使うのが好ましい。FASTAは目的配列と一致度の高い配列を立体構造データベースから探索し、最終的な目的配列と参照タンパク質との一致度をｅ値として算出するプログラムである。FASTAの詳細は“Effective protein sequence comparison.” Pearson WR, (1996) Methods Enzymol; 266:227-58に記載されている。

PSI-BLASTはプロファイルアライメントを行うようにプログラムされている。PSI-BLASTの詳細は、“Matching a protein sequence against a collection of PSI-BLAST-constructed position-specific score matrices.” Schaffer AA, Wolf YI, Ponting CP, Koonin EV, Aravind L and Altschul SF, Bioinformatics 1999, 12, 1000-11に記載されている。

参照タンパク質の原子座標の最適化を達成するための方法、座標系、目的関数等は特に制限されないが、例えば、最大傾斜法、共役勾配法、Newton-Raphson法等で行うのが好ましい。最大傾斜法は、数値的に計算された目的関数の１次微分を利用し、原子座標の目的関数に対する最適化を行う。共役勾配法には、多くの方式があるが、Fletcher-Reeves法（Fletcher, R., and Reeves, C. M. (1964) Function Minimization by Conjugate Gradients. Comput J, 7: 149-154）が標準的に用いられており、目的関数の1次微分を利用し、目的関数がｎ個の変数の厳密な二次関数である場合、多くともｎ回の繰り返しにより最適化に到達することが保証されている。Newton-Raphson法は、1次微分に加えて２次微分を利用し、初期構造が最適化構造に近い場合に効率が良い。これらの方法の詳細は、江口至洋「タンパク質工学の物理・化学的基礎（共立出版 1991）」とその中の文献に記載されている。

以下、上記の通り最適化した構造および座標を、それぞれ最適化構造および最適化座標として引用する。

ステップI-20：最適化座標の基準振動解析法
上記ステップI-10で作成された最適化座標を用いて、その原子座標の変位を行う。原子座標の変位は、基準振動解析法を行い、各固有値の固有ベクトルを得ることにより行うのが好ましい。その際、最適化した自由度の一部を自由度とする座標系を用いても良い。この場合、一部の自由度に対しても最適化が達成されている。

ここで、「基準振動解析法」とは、ポテンシャルエネルギーを変位の２次関数として近似し、運動方程式を厳密に解き、最適化構造の周りの微小な振動を解析する方法を意味する。「固有値」とは、微小な振動の周期を意味する。「固有ベクトル」とは、振動の方向を意味する。

基準振動解析法の解くべき固有値方程式は、下記式(1)または(2)である。

ここでω_kは固有値、U_ikは固有ベクトルであり、δ_ijはクロネッカーのデルタである。T_ijとV_ijはそれぞれ運動エネルギーE_kとポテンシャルエネルギーVに関係し、下記式(3)および(4)の通りである。

ここでq_iは振動の自由度に対応した座標、q_i ⁰は最適化座標、q_iはq_iの時間による微分である。A_jkは集団運動Q_kと個々の原子運動q_jを結ぶ係数であり、下記式(5)の通りである。

ここで、α_kとδ_kは初期条件で定められる。

上記した基準振動解析法の詳細は、Wilson, E. B., Decius, J. C., and Cross, P. C. 1955. Molecular Vibrations. McGraw-Hill.に記載されている。

ステップI-30：新規参照タンパク質の生成
上記ステップI-20で得られた固有値、固有ベクトルを用いて、ある温度・ある固有値でのCα原子の位置ゆらぎを計算する。固有値の数と等しい位置ゆらぎが得られる。参照タンパク質のCα原子の温度因子を位置ゆらぎに換算し、各Cα原子について基準振動解析法の位置ゆらぎとの比を計算し、平均の比を求める。この平均の比は、使用した固有値の数だけあり、この比を掛けたこの固有値に属する固有ベクトルを構造最適化前の参照タンパク質の原子座標に加え、この変位させた原子座標からなる立体構造、即ち、誘導適合（induced fit）を含めた立体構造を参照タンパク質の立体構造の１つとする。以下これを、誘導適合（induced fit）型参照タンパク質、立体構造、座標として引用する。

平均の比を２倍して同様に参照タンパク質の誘導適合（induced fit）型立体構造を作成する。固有ベクトルには順・逆の方向があり、固有ベクトルに−１を掛けた逆方向にも同様に変位させる。すなわち、誘導適合（induced fit）型には使用した固有値の数の４倍だけある。誘導適合（induced fit）型と非誘導適合（no induced fit）型参照タンパク質の立体構造を参照タンパク質立体構造セットとする。

ここで、温度因子と位置ゆらぎの関係は下記式(6)のとおりである。

ここで、B_iはPDBファイルから得られる原子の温度因子であり、πは円周率、D_iは位置ゆらぎに相当する。本発明ではCα原子に関してのみである。

基準振動法から得られる位置ゆらぎとPDBファイルの温度因子を換算した位置ゆらぎの比は下記式(7)のとおりである。

ここでF_i ^vは基準振動解析法から得られるv番目の固有値に対するi番目の原子の位置ゆらぎである。本発明では、Cα原子のみに対して行う。

比の平均は下記式(8)のとおりである。

ここでNは原子数であり、和は原子に対して行う。M^vはv番目の固有値に対する平均の比である。本発明では、Cα原子に対して行う。

誘導適合（induced fit）型参照タンパク質立体構造の原子座標は下記式(9)および(10)のとおりである。

ここでC_{i k} ⁰は参照タンパク質の原子座標、V_{i k} ^vはv番目の固有値に属する固有ベクトルの成分をあらわす。

ステップI-40：目的タンパク質のモデリング
上記ステップI-30で得られた参照タンパク質の立体構造セットを参照して、適当なホモロジー・モデリング・プログラム、例えばFAMSにより目的タンパク質の立体構造セットを構築する。参照タンパク質の立体構造の数と同じ数の目的タンパク質の立体構造が構築される。即ち、使用した固有値の数の４倍だけある誘導適合（induced fit）型と非誘導適合（no induced fit）型目的タンパク質立体構造が構築され、これらを、目的タンパク質立体構造セット、すなわち誘導適合（induced fit）を含めた立体構造とする。

次に、モデリング（立体構造の構築）手法の好適な一例としてFAMSの各ステップについて説明する。なお、下記のステップI-41〜43において記載されている計算回数、定数、カットオフ値等は、本発明者が最も好ましいと考えているパラメータの一例を示すものであり、本発明の範囲を何ら限定するものではない。なお、FAMSの詳細は、Koji Ogata and Hideaki Umeyama, “An automatic homology modeling method consisting of database searches and simulated annealing” Journal of Molecular Graphics and Modeling 18, 258-272, 2000に記載されている。

ステップI-41：Cα原子の初期座標の構築及び最適化
ステップI-30からの参照タンパク質セットおよびアライメント情報を受けて、参照タンパク質から挿入および欠損のあるアミノ酸残基についての情報をえる。アライメントにおいて連続して三残基以上のアミノ酸が対応しているギャップの無い領域を選び出し、その領域においては、これらの残基ペアにおいて、目的タンパク質のCα原子は参照タンパク質と同一のものを当てはめておく。Cα原子が求められなかった場合には、予め作成してある断片のデータベースから座標を当てはめる（第２図参照）。

ここで、本明細書においてCα原子とは、各アミノ酸の骨格の中心となる炭素原子を意味する。Cβ原子とは、Cα原子の側鎖側に結合する炭素原子を意味し、Cγ原子とは、Cβ原子の側鎖側に結合する炭素原子を意味する。また、C原子とは、カルボニル基の炭素原子を意味する。

ステップI-41(1)：Cα原子のシミュレーティッドアニーリング法による構築
上記ステップI-41で作成されたCα原子はシミュレーティッドアニーリングのプロセスを用いて参照タンパク質の座標から構成される関数を用いて最適化される。この目的関数は下記式(11)のとおりである。

ここでU_lenは、配列上隣の残基およびCys残基のペアのCα原子間の距離に関するもので下記式(12)のように設定される。

ここでDi,i+1は残基i と残基i+1のCα間距離である。D_i ^SSはジスルフィド結合を形成するCys残基のペア同士の距離である。K_l とK_SS は定数でありそれぞれ2および5と設定される。

UangはCα原子の結合角の関数であり下記式(13)のとおりである。

ここで θ_i(rad)は i, i+1, i+2番目の残基Cα原子の角度である。θ₀はPDBのX線構造から(100/180)・π(rad)と設定される。K_aは定数であり1とする。

Uposは、Cα原子の位置に関する関数であり、下記式(14)のとおりである。

ここで||・||が意味する所はノルムであり、M_iは構造を基にしたアライメント上で構造的に等価な位置にあるCα原子間の平均距離である。残基iについてΜ_iの値が求められないとき、Μ_iの値は10と設定される。ここでは、Cα原子の平均座標であり下記式(15)のとおりである。

ここでＸ_jiはj番目の参照タンパク質のi番目の残基のCαの原子座標である。ｗ_jiは、j番目の参照タンパク質のi番目の残基の重みである。この重みは目的タンパク質の大体の形を決定するため重要なパラメータであるが、これはローカルスペースホモロジー（LSH）と呼ばれる着目部位の12Å以内の空間的近傍の局所的な値によって決定している（第３図参照）。LSHと構造がよく保存されている部位（SCRs：Structural Conserved Regions）に存在する残基のペアの比率との相関は第４図に示されているように非常に高い。これは、高いLSH値を持つときは統計的にCα原子の位置が参照タンパク質構造と比べて1.0Å以内にあることを意味する。

U_vdwは下記式(16)のとおりである。

ここでK_vdwは0. 01(D_i,j < 3.2Å) と0.001(D_i,j > 3.2Å)と設定され6Åをカットオフ値とした。

Cα原子は式(11)に従って、シミュレーティッドアニーリング法を用いて最適化される。この最適化の段階でCα原子の摂動は1.0Å以内になるように設定する。またこのアニーリングの段階は全てのCα原子について、100回づつ計算される。そして、温度に相当するパラメータは、25から0.5回ごとに0.01減らし、そのパラメータは以後一定とした。

この大きな２つの段階、構造情報の取得とCα原子の構築は10回繰り返され、最小の目的関数値をもつCα原子の座標が最適解として算出される。

ステップI-42：主鎖原子座標の構築及び最適化
ステップI-41(1)のCαの原子座標に主鎖の他の原子を付加し、シミュレーティッドアニーリング法によって目的関数を最小化するようにする。まず、Cα原子の立体的な重ねあわせを行い、Cαの原子間距離が2.5Å以下の残基が取り上げられる。Cαを除く主鎖の原子座標はCα原子間距離が最小になるように参照タンパク質の座標から取得しモデル構造とする。

参照タンパク質の中に相当する残基が無い場合、主鎖の原子座標はデータベース中の相当する４残基のタンパク質断片から作成される。この過程の中で、残基iの主鎖原子はi-1番目からi+2番目までのCα原子間の最小のrmsd値を持つ残基から選ばれる。その際N末端の残基では、Cα原子座標の重ね合わせ範囲がi番目からi+3番目までとなり、C末端の残基およびそのひとつ前の残基では同様にi-3番目からi番目までおよびi-2番目からi+1番目までとなる。

主鎖原子の目的関数を元にシミュレーティッドアニーリング法によって最適化される。

目的関数は下記式(17)のとおりである。

ここでb_i ⁰は、標準の結合長でありそれぞれの化学結合の種類によって異なる。K_bは定数であり225とする。

U_angは結合角の関数で、下記式(19)のとおりである。

ここでθ_iはi番目の結合角であり、化学結合の種類によって異なる。K_aは定数で45と設定される。

U_non-bondは非結合の相互作用の関数で、下記式(20)のとおりである。

ここでε_i,j と r_i,j* は定数で原子の種類によって異なる。
K_nonは定数で0.25とし、カットオフは8Åとする。

U_ssはCys残基が生成するジスルフィド結合の関数で、下記式(21)のとおりである。

ここで K^SS _CαおよびK^SS _Cβは定数であり7.5である。

U_posは原子の位置に関する関数で、下記式(22)のとおりである。

式(22)の＜W_iＸ_i＞は、目的タンパク質および参照タンパク質の間の構造の重ねあわせから求める。
K_posは定数であり0.3である。

U_torは主鎖のねじれ角のものであり、下記式(24)のとおりである。

ここでφ_i0とψ_i0はRamachandranマップ上での最も近いねじれ角のφ_iおよびψ_iとする。またω_i0は0としてcis-Pro残基の場合のみπ(radian)とする。K_tおよびKωは定数であり、それぞれ10および50とする。

U_chiはCαのキラリティーに関するものであり、下記式(25)のとおりである。

ここでτ_iはN-Cα-Cβ-Cで定められるねじれ角でありK_chi は50とする。

U_hydrはホモロガスなタンパク質中で保存された主鎖の水素結合に関するもので、下記式(26)のとおり定められる。

水素結合は、N原子とO原子の距離が2.9± 0.5 Åにあるときに設定される。

複数の参照タンパク質中で水素結合があるか否かを判定するときは、75%以上の参照タンパク質が存在すると認めた場合に水素結合ありと判定する。K_hydrは定数であり0.6である。

次にCβを含む主鎖原子の最適化がシミュレーティッドアニーリングによって行われる。このアニーリングの過程で主鎖とCβの原子の摂動が初期の位置に対して1.0Å以内になるようにする。このアニーリングの段階は主鎖とCβの原子に対して200回行われる。温度に相当するパラメータは50もしくは25から始まり一回毎に0.5倍にしてゆき0.01になるまで続け、その後一定値とする。

主鎖の立体配置を幅広くサンプリングするために、本発明の方法では、好ましくは上記の方法を６回行い、最小の目的関数値を持つ主鎖の原子座標を最適解とする。そして、温度に相当するパラメータは、はじめの２回は50からスタートして3回目から25からスタートすることとする。

ステップI-43：側鎖原子座標の構築及び最適化
側鎖の構築は、大きく２段階に分かれており、「構造保存部位の側鎖構築」（スッテプI-43(1)）と「全体の側鎖構築」（スッテプI-43(2)）に分けられる。

ステップI-43(1)：構造保存部位の側鎖構築
算出された主鎖原子に対して、以前の研究における方法を用いてホモロガスなタンパク質から側鎖のねじれ角を得る。この方法の詳細は、"The role of played by environmental residues in side-chain torsional angles within homologous families of proteins: A new method of side chain modeling." Ogata K and Umeyama H, Prot. Struct. Funct. Genet. 1998, 31, 255-369に記載されている。

この方法の中でホモロガスなタンパク質中で保存されている側鎖の割合を算出し、この情報を元にして側鎖のモデリングを行う。側鎖の保存された部位の側鎖の原子座標は固定した主鎖原子に対して置かれる。例えば、ホモロガスなタンパク質中でアルギニン残基のχ¹角が保存されていれば、Cγ原子の座標を置くことができ、Phe残基でχ¹とχ²角が保存されていれば、全ての側鎖原子を置くことができる。式(17)を用いたシミュレーティッドアニーリングの最適化の過程は、主鎖とCβの原子のみ行われて、原子の摂動は1.0Å以内となるようにした。この主鎖とCβの原子のアニーリングの段階は200回行われる。そして、温度に相当するパラメータは25からスタートして一回毎に0.5倍にしてゆき0.01になるまで小さくなるようにする。式(17)の中のUnon-bondは主鎖原子と部分的に作成された側鎖原子について行われる。そのとき側鎖原子の座標は最適化の過程を通じて保存されるようにする。

構造の情報である M_iと水素結合のN−Oのペアは最適化の過程で用いられる。主鎖原子の配置を得るために、上記プロセスを3回繰り返し、目的関数の最小の主鎖原子の座標を算出構造とする。

ステップI-43(2)：全体の側鎖の構築
側鎖の構築は固定した主鎖およびCβ原子のもとで行う。これは上記したOgata K and Umeyama H, Prot. Struct. Funct. Genet. 1998, 31, 255-369に開示されている研究成果をもって行われ、それを用いることにより短時間で正確なモデルを与えることができる。次に主鎖構造は低温におけるモンテカルロ法によって最適化され、温度は0.001に設定され式(17)の目的関数U_non-bondを用い、全ての主鎖と側鎖の原子で計算される。そして、N、Cα、C、Cβ原子の最適化の過程で側鎖のねじれ角を最適化された状態を保つように側鎖の座標を再配置する。原子の摂動は0.5Å以内とする。次に側鎖は削除され、上記の側鎖構築が繰り返される。このプロセスは2.4Åの原子同士のぶつかり合いがなくなり、且つN-Cα-Cβ-Cのねじれ角が-120±15°の範囲に収まるまで繰り返される。

ステップI-44：最終構造の構築
かくして、任意の目的タンパク質の非誘導適合（no induced fit）型と誘導適合（induced fit）型の立体構造を規定する原子座標を得ることができる。

II．タンパク質−リガンド複合体の立体構造構築方法
次に、本発明の別の態様であるタンパク質−リガンド複合体の立体構造構築方法について、図面を参照して説明する。第５図は、目的とするタンパク質−リガンド複合体の立体構造構築方法、即ち誘導適合(induced fit)を含んだ複合体の立体構造構築方法の一例を示すフローチャートである。

まず、ステップII-10において、目的タンパク質のモデリングされた原子座標を得る。最適化された参照タンパク質の基準振動解析法を行なうことにより、基準振動モードが得られる。そして固有ベクトル方向に主に実験で得られた目的タンパク質の原子座標を変位し、複数の参照タンパク質のセットを作成する。それらの座標を参照して目的タンパク質の立体構造をホモロジーモデリング(homology modeling)により構築する。

ステップII-20で、得られた目的タンパク質の立体構造に対してリガンドをドッキングさせる操作を行なう。ステップII-30において、目的タンパク質のセットにドッキングしたリガンドに基づきMCSS法による経験的分子エネルギー計算を行ない、目的とするタンパク質−リガンド複合体の立体構造をシミュレートする。かくして得られる目的タンパク質−リガンド複合体の立体構造は、目的タンパク質の誘導適合(induce fit)、すなわち周期的熱運動(分子揺らぎ)を含めた立体構造であり、医農薬の精度の高い分子設計に用いることができる。

以下、各ステップについて更に詳しく説明する。

ステップII-10：目的タンパク質のモデリング
目的タンパク質のモデリングは、次の３つのステップII-11：参照タンパク質の初期座標の最適化、II-12：最適化座標の基準振動解析、II-13：目的タンパク質のモデリングに分けられる。このステップは、前記I-10〜I-44と同様に行われる。かくして、基準振動解析法の振動モードに基づく立体構造、すなわち誘導適合(induced fit)を含んだ目的タンパク質の立体構造が構築できる。

ステップII-20：目的タンパク質へのリガンドのドッキング
基準振動モードを考慮した目的タンパク質の複数の立体構造モデルに対してリガンドのドッキングを行なう。目的タンパク質のリガンド結合サイトと考えられる位置にドッキングさせる。このステップは、PDB形式のファイルが入出力できる市販のソフトウエア、例えばBIOCES(NEC社製)、Cerius2(Accelrys社製)、SYBYL(TRIPOS社製)、HyperChem(Hypercube社製)等を用いて行なう。一般的にはドッキングはステレオ表示が可能なディスプレイ上でリガンドを回転、並進して行なう。また簡易的エネルギー計算手法を含めたドッキングを行なってもよい。

用いるリガンドの結合部位は、特に限定されず、既に判明している結合部位、新たに特定した結合部位のいずれも用いることができる。リガンドの結合部位が未知のタンパク質については、後記IIIで述べる方法により、その部位を特定することもできる。

ステップII-30：目的タンパク質−リガンド複合体の立体構造の最適化
ステップII-20で得られたタンパク質−リガンド複合体構造モデルについて、目的タンパク質の１つの構造とリガンドとの構造の経験的分子エネルギー計算を、目的タンパク質の構造の数だけ行い、その際、目的タンパク質側は、複数の構造それぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンドの原子座標を動かして、目的タンパク質の複数の立体構造に基づくリガンドの構造を求める。

このステップII-30は、例えばMultiple Copy Simultaneous Search (MCSS) 法により行われ、リガンドにより複数の複合体構造が経験的分子エネルギー計算（分子力場法）により同時に最適化され、それらの原子座標は経験的分子エネルギー計算（分子動力学法）により、構造が、例えば温度300°Kで10ps間緩和され、さらにその原子座標は分子力場法により最適化されることにより行われる。もちろん温度、時間は計算している対象系によって変わることはある。

MCSS法は、複数のリガンドを用いて受容体タンパク質とリガンド双方の立体構造を最適化する手法としてA. Miranker and M. Karplus (Proteins, 1991, 11, 29-34）により提案されている。手法としては、個々のリガンドとタンパク質の経験的分子エネルギー計算を同時に行ない、受容体タンパク質のグラジエントについては平均をとるため、受容体タンパク質側は１つの立体構造として動く。

これに対して、本発明の方法では、タンパク質側は複数の分子構造、リガンド側は１つの分子構造を用いて、複数のタンパク質構造に基づくリガンドの構造を求めるものである。この時の経験的分子エネルギー計算において、タンパク質１構造とリガンド１構造の計算を、タンパク質構造の数だけ行い、リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンドの原子座標を動かす。一方、目的タンパク質側は、複数の構造それぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、目的タンパク質の複数の立体構造に基づくリガンドの構造が求められる。

上記の経験的分子エネルギー計算の方法は、特に限定されずそれ自体既知の方法で行えば良いが、発明者らが開発した apricotプログラム(Yoneda, S., and Umeyama, H., J Chem Phys 1992; 97: 6730-6736)を改良したapricot -MCSSプログラムを用いるのが好ましい。経験的ポテンシャル関数としてはAMBERタイプのポテンシャル関数 (S. J. Weiner, P. A. Kollman, D. A. Case, U. Chandra Singh, C. Ghio, G. Alagona, S. Profeta, Jr., P. Weiner, J. Am. Chem. Soc., 1984, 106, 765-784）を、パラメータとしてはpara89a Rev Aを用いるのが好ましい。もちろん他の経験ポテンシャルの使用も可能である。

分子動力学計算では、通常のエネルギー項の他にCα原子位置に対する拘束ポテンシャルを、例えば下記式(27)のようにHarmonic関数として加えることにより、目的タンパク質の初期立体構造が大きく壊れないようにするのが好ましい。これは計算の近似の粗さを補う意味で大切であるが、拘束ポテンシャルの範囲を主鎖全体に広げたりしてもよく、これに限定されるものではない。

ここでUxyzは目的タンパク質におけるCα原子位置に掛ける拘束のポテンシャルエネルギーで、Cαのオリジナル座標値がｘ0、更新された座標値がｘ、Kxyzが原子をどの程度拘束させるかのパラメータである。ここではKxyzとして10.0kcal/mol/Å²を用いたが、一例であるので、式の形を含めて本発明の範囲を限定するものではない。

またＣα原子のＸ，Ｙ，Ｚ座標に対する拘束ポテンシャルの代わりに、式(24)に示す目的タンパク質の主鎖のねじれ角に対する拘束に用いて、即ち経験的分子エネルギー計算において目的タンパク質の主鎖のねじれ角を拘束するポテシャル関数として加えることにより、初期立体構造が大きく壊れないようにしても良い。

かくして、目的タンパク質として誘導適合(induced fit)型の立体構造モデルを使えば、分子揺らぎを考慮した目的タンパク質−リガンド複合体の原子座標を得ることができる。

また、リガンド分子がタンパク質の場合には、上記と同様の方法で、リガンドの基準振動モードを含む複数の立体構造とタンパク質の単一立体構造からリガンド側の誘導適合(induced fit)を考慮したリガンド−タンパク質複合体の立体構造の構築も可能である。

III．タンパク質のリガンド結合部位の特定方法
次に、本発明の別の態様である、タンパク質のリガンド結合部位の特定方法について説明する。第６図は、タンパク質のリガンド結合部位の特定方法と、得られた結合部位にリガンドを結合させて、タンパク質−リガンド複合体の立体構造を構築する方法の一例を示すフローチャートである。

ステップIII-10で、タンパク質とリガンドの結合部位の特定（予測）を行う。このステップにおいて、タンパク質および／またはリガンドの周囲および内部、例えば疎水性表面に、低分子化合物、例えば非極性溶媒を発生させ、さらにそれら周囲に多数の水分子を追加して見かけ上水溶液中の分子動力学計算を行う。それらの結果に基づき、タンパク質および／またはリガンド表面の低分子化合物、例えば非極性溶媒の挙動から、タンパク質とリガンドの結合部位を検索する。ステップIII-20ではステップIII-10で得られたタンパク質とリガンドの結合推定部位を参考にして、それらをドッキングさせ、タンパク質−リガンド複合体の立体構造の初期原子座標を求める。そしてステップIII-30ではステップIII-20で得られたタンパク質−リガンド複合体の初期立体構造の周囲に水分子を発生させ、見かけ上水溶媒中の分子力学と分子動力学法を用いてタンパク質−リガンド複合体の立体構造の精密化を行う。

以下、各ステップについて更に詳しく説明する。

ステップIII-10：タンパク質のリガンド結合部位の特定
タンパク質とリガンドの結合部位の特定は、次の３つのステップ、 III-11：タンパク質周囲および／またはリガンド周囲への低分子化合物の発生、III-12：タンパク質および／またはリガンドの水溶媒中での経験的分子エネルギー計算（分子力学、分子動力学計算）による低分子化合物（例えば非極性溶媒等）の挙動検索、III-13：低分子化合物（例えば非極性溶媒等）の挙動から、タンパク質へのリガンド結合部位および／またはリガンドのタンパク質への結合部位の判定に分けられる。

ステップIII-11：タンパク質周囲および／またはリガンド周囲への低分子化合物の発生
先ず、タンパク質および／またはリガンドの周囲に水分子を発生させたのち、タンパク質周囲、リガンド周囲、ならびに低分子化合物が入り込める内部周囲にある水分子を低分子化合物で置換する。その場合、これらの置換はそれら周囲全体にわたり低分子化合物を配置してもよいし、疎水性や水素結合能を有するアミノ酸や官能基の周りにだけ低分子化合物を配置してもよい。ここで、リガンドがペプチドやタンパク質等の高分子物質である場合には、リガンド周囲へも低分子化合物を発生させ、タンパク質の場合と同様に経験的分子エネルギー計算による低分子化合物の挙動解析を行う。リガンドが医農薬分子等の分子量が小さい物質である場合は、どの部分が疎水性領域か等の判別できるので、通常、結合部位の特定の必要性は無い。しかし、リガンドが高分子物質である場合は、リガンド側の結合部位もタンパク質側の結合部位と同様に解析し、複合体の結合部位を特定することが必要である。

低分子化合物としては、例えば、エタン、シクロペンタン、ベンゼン等の非極性溶媒、Ｎ−メチルアセタミド、ベンズアミド等の水素結合能性溶媒、あるいは医農薬化合物でもよく特に限定されない。だがそれら配向の任意性を考えると、対象性を有する化合物が好ましい。非極性溶媒を用いると疎水性部分を有するタンパク質やリガンドの結合部位を特定することができる。また水素結合能性溶媒である酸アミド基を有する化合物を用いると、酸アミド基と水素結合しうる部分、すなわちβシート構造の露出部分やオキシアニオンホールを含むリガンドの結合部位を特定することができる。更に医農薬分子を用いると、医農薬分子が特異的に結合しうる部分を特定することができる。

具体的には、例えばベンゼン等の非極性溶媒をタンパク質の周囲に配置させる場合は、タンパク質の中でMSASの値が30% 以上のアミノ酸残基により形成される3.5Å 以内の表面にある水分子を非極性溶媒（ベンゼン）で置換すれば良い。また非極性溶媒（ベンゼン）同士が1.5Å 以内になるような場合には水分子の非極性溶媒への置換は行わなくて良い。非極性溶媒に置換されなかった水分子は一回すべて消去する。上記した水分子の非極性溶媒への置換基準は、ベンゼンを用いた場合の一例であり、本発明の範囲を限定するものではない。

ステップIII-12：タンパク質および／またはリガンドの水溶媒中での経験的分子エネルギー計算による低分子化合物の挙動検索
上記ステップIII-11で作成されたタンパク質（および／またはリガンド）と低分子化合物の原子座標を用いて、それら周囲に周期境界条件で水分子を発生させたのち、経験的分子エネルギー計算である分子力学計算で立体構造を最適化し、続いて分子動力学計算を行う。分子動力学計算が終了したのち、水分子を除去してタンパク質（および／またはリガンド）と低分子化合物との原子座標を得る。例えば、低分子化合物として非極性溶媒（ベンゼン）を配置した場合は、温度300°K、10〜20ps程度の分子動力学計算を行えば良い。これにより、タンパク質の周囲や内部への低分子化合物の拡散や集積が起こる。この拡散や集積の状態、即ち低分子化合物の挙動を、後記ステップIII-13の方法で解析することにより、タンパク質側のリガンド結合部位、リガンド側のタンパク質結合部位を特定することができる。

上記の経験的分子エネルギー計算の方法は、特に限定されないが、本発明者らが開発したapricotプログラムを用いるのが好ましい。経験的ポテンシャル関数としてはAMBERタイプのポテンシャル関数を用いるのが好ましい。もちろん他の経験ポテンシャルの使用も可能である。

ステップIII-13：低分子化合物の挙動からのリガンド結合部位の判定
上記ステップIII-12で求まったタンパク質周囲および／またはリガンド周囲の低分子化合物、例えば非極性溶媒の分布について、これを対象としたクラスター解析を行い、得られたクラスターの大きさからリガンドがタンパク質にドッキングしやすい部位を判定する。

ここで、クラスター解析とは、多次元空間において与えられたデータ集合を個体間の類似度(あるいは相違度)によってクラスター(塊)化する多変量解析法である。ここでは３次元空間における非極性溶媒の重心(ベンゼンでは６炭素原子の座標平均)間同士のユークリッド距離を計算し、閾値以内の距離の非極性溶媒があれば、距離が短い非極性溶媒同士からクラスター化していく。そのときクラスター化された非極性溶媒の集合についても、通常のクラスター解析と異なり、クラスターの重心からの距離ではなく、その中で最短距離の非極性溶媒同士が閾値以内であるかどうかを調べることにより、それらをクラスター化するか否かを判定する。非極性溶媒のベンゼンの場合、閾値については６Åを用いたが、その値は単なる例示であり本発明の範囲を限定するものではない。

例えば非極性溶媒（ベンゼン）を用いた場合、それらはいくつかのクラスターに分類されるが、大きなクラスターほどリガンドやタンパク質へのドッキング部位である可能性が高いと考えられる。クラスター化された非極性溶媒群はその形状を楕円球で表現できるが、座標の固有値問題を解くことにより、クラスターの長短方向が求まる。タンパク質側とリガンド側双方のクラスター同士を楕円球の長短方向を参考にしてドッキングし、タンパク質−リガンド複合体のモデルをいくつか作成する。もちろんタンパク質とリガンドが重なる配置になる複合体構造は自動的に取り除く。ドッキングされたモデルはステップII-20で記述したソフトウエアでタンパク質とリガンド配置の微調整を行う。

ステップIII-20：タンパク質へのリガンドのドッキング
上記ステップIII-13で得られた低分子化合物、例えば非極性溶媒（ベンゼン）のクラスタリングで大きなクラスターとなったサイト同士をドッキングし、タンパク質−リガンド複合体構造の初期データとする。この際、低分子化合物、例えば非極性溶媒（ベンゼン）データはドッキングに際して除かれる。

本ステップはPDB形式のファイルが入出力できる市販のソフトウエアを用いて行なうことができる。一般的にはドッキングはステレオ表示が可能なディスプレイ上でリガンドの回転、並進等により行なわれる。また簡易的エネルギー計算手法を含めたドッキングを行なってもよい。

ステップIII-30：タンパク質−リガンド複合体の立体構造の構築
上記ステップIII-20で得られたタンパク質−リガンド複合体の初期原子座標データは、それら周囲に周期境界条件で水分子を発生させたのち、分子力学計算で初期立体構造を最適化し、続いて分子動力学計算を行い、そして最終ステップの座標軌跡から水分子を取り除くことによりタンパク質−リガンド複合体の立体構造が得られる。

分子動力学計算の方法は、特に限定されず、例えば、温度300°K、10から20ps程度で行えばよい。用いるプログラムも特に限定されないが、発明者らが開発したapricotで、経験力場も AMBERタイプを用いるのが好ましい。しかし使用プログラム、力場とも単なる例示であり、本発明の範囲を限定するものではない。

かくして、タンパク質−リガンド複合体の生成過程が水溶液中であることを考慮して、水溶媒中での低分子化合物、例えば非極性溶媒の集積、拡散を利用して、タンパク質とリガンドの疎水性表面を見い出し、それら同士をドッキングするという方法でこれまでより精密なタンパク質−リガンド複合体の原子座標を得ることができる。

IV．タンパク質の立体構造を規定する原子座標が記録されている記録媒体、データベース
上記方法で得られたタンパク質の立体構造またはタンパク質−リガンド複合体の立体構造を規定する原子座標を、コンピュータが利用可能な所定の形式で適当な記録媒体に格納することにより、目的タンパク質の立体構造データベースが構築できる。本発明のデータベースは、好ましくは、上記原子座標とともに参照タンパク質と目的タンパク質のアライメント情報を含んでいても良い。また、データベースには、所望によりコード番号、参照タンパク質の参照領域の情報、目的タンパク質の情報、Ｃα原子間距離等が含まれる。

本発明においてデータベースとは、上記原子座標を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピュータシステムをも意味する。ここで適当な記録媒体としては、例えば、フロッピー（Ｒ）ディスク、ハードディスク、磁気テープ等の磁気媒体；CD-ROM、MO、CD-R、CD-RW等の光ディスク、半導体メモリ等を挙げることができる。

V．薬物の分子設計方法
医農薬等の薬物分子設計を行うことができる適当なプログラムが動作するコンピュータで、上記方法で得られた薬物分子の標的となるタンパク質（以下これを「標的タンパク質」と称することがある）の構造座標の全て若しくは一部、又はそれらが記録されたデータベース若しくは記録媒体の構造座標の全て若しくは一部を使用して、標的タンパク質と相互作用をする薬物分子（拮抗薬または作動薬）を同定、検索、評価又は設計等を行うことができる。

薬物分子の同定、検索、評価又は設計は、本発明の方法で得られた立体構造座標と薬物分子の立体構造座標との相互作用の有無やその程度に基づいて行われる。本明細書において、薬物分子の同定、検索、評価又は設計等を、単に薬物の分子設計ということがある。

タンパク質の立体構造座標と薬物候補分子の立体構造座標との相互作用に基づいて分子設計を行う際に用いられるコンピュータとしては、適当なプログラムが動作するように調整されているコンピュータであれば特に制限はない。また、コンピュータの記憶媒体にも特に制限はない。分子設計に用いるプログラムは、例えばアクセルリス(Accelrys)社製のコンピュータ・プログラムInsight II等を挙げることができる。特に、この目的のために特別に作成されたLudiやDOCKといったプログラムを単独又は組み合わせて用いることで、より容易に薬物分子を同定、検索、評価又は設計することができる。また、タンパク質の立体構造座標と薬物分子とのドッキング評価は、例えば前記ステップII-20に記載したNEC社製のBIOCES等のソフトウエアを用いて行うことができる。

ここで、薬物分子は、既知のものであっても、新たに合成された新規な化学構造を有する薬物分子であっても、その立体構造が得られるものであれば、いずれの薬物分子も本発明の方法で用いることができる。薬物分子の立体構造座標は、Ｘ線結晶解析やモデリング等のいずれの方法で得られたものでも良い。３次元構造座標が決定されているものは、適当なデータベース、例えばCCDC（Cambridge Crystallographic Data Centre: http://www.ccdc.cam.ac.uk/）やPDB （Protein Data Bank: http://www.rcsb.org/pdb/）等から収得することができる。

更には、標的タンパク質の立体構造を用いて、例えば特開2000-178209号公報に記載されている方法によっても、薬物分子を設計することができる。この様に、本発明の方法で得られたタンパク質の立体構造座標を用いることで、薬物分子のコンピュータによる分子設計が可能となる。ただし、本発明の分子設計方法は、これらのプログラムや手法を用いるものに限定されるものではない。

薬物の分子設計には、通常、概念的に２つの段階がある。最初の段階は、リード化合物を見つけだすものであり、次の段階はリード化合物の最適化である。どちらの段階も、標的タンパク質の立体構造座標を使用して、それ自体既知の方法により行うことができる。これにより最適な医農薬候補分子を得ることができる。

VI．分子設計方法により得られる医農薬候補分子のスクリーニング方法
上記方法により同定、検索、評価又は設計された医農薬候補分子は、その分子の性質に応じて、例えばそれ自体既知の化学合成法により得ることができる。しかしながら、薬物分子は、天然化合物、合成化合物のいずれでも良く、また、高分子化合物、低分子化合物のいずれでも良い。得られた医農薬候補分子は、更に、それ自体既知の方法により、試験管内や生体内における薬理学的または生理学的試験によりその活性を調べ、所望の活性を有する医農薬候補分子を選抜することにより実際に医農薬として応用可能なものを得ることができる。

VII．医農薬組成物の製造方法
上記スクリーニング方法により選択された医農薬等の薬物分子、例えば医薬分子は、それ自体単独で治療対象となる疾患等の患者に投与することができるが、これらの有効成分の１種又は２種以上を混合して投与することもできる。また、薬理学的に許容される製剤用添加物等を用いて該物質を医薬品組成物として製剤化し、これを投与するのが好ましい。例えば、必要に応じて糖衣を施した錠剤、カプセル剤、顆粒剤、細粒剤、散剤、丸剤、マイクロカプセル剤、リポソーム製剤、トローチ、舌下剤、液剤、エリキシル剤、乳剤、懸濁剤等として経口的に、あるいは無菌の水性液もしくは油性液として製造した注射剤や、座剤、軟膏、貼付剤等として非経口的に使用できる。これらは、例えば、該物質を生理学的に認められる担体、香味剤、賦形剤、ベヒクル、防腐剤、安定剤、結合剤などとともに一般に認められた製剤実施に要求される単位用量形態で混和し、充填又は打錠等の当業界で周知の方法を用いて製造することができる。これらの医薬組成物における有効成分量は指示された範囲の適当な容量が得られるようにするものである。

農薬分子について、実際に農薬として使用する場合には、担体若しくは希釈剤、添加剤および補助剤等と公知の方法で混合して、通常農薬として用いられている製剤形態（組成物）、例えば粉剤、粒剤、水和剤、乳剤、水溶剤、フロアブル剤等に調製して使用される。

[実施例]
以下、実施例を挙げて本発明を更に具体的に説明するが、下記の実施例は、本発明の具体的な認識を得る一助と見なすべきであり、本発明の範囲を何ら制限するものではない。

[実施例１]
β２アドレナリンレセプターの立体構造の構築
上記発明の実施形態のI-10〜I-40で詳述した方法に従って、次の通りヒト由来β２アドレナリンレセプターの誘導適合を含めた立体構造を構築した。第７図にフローチャートを示す。

立体構造モデルの構築は、NEC社製ワークステーション（機種: Express5800/120Rc-2、CPU: Pentium(R）III 933MHz x 2、OS: Red Hat Linux 6.2J、メモリ:1024Mbytes）を用いて行った。目的としたβ２アドレナリンレセプターのアミノ酸配列は、PIR；http://www-nbrf.georgetown.edu/pir/のID:QRHUB2より得た。

このβ２アドレナリンレセプターのアミノ酸配列を目的タンパク質の配列としてPSI-BLAST(Position-Specific Iterated BLAST)によるアライメントを行った。その際、モチーフプロファイルは、GCRDb; http://www.gcrdb.uthscsa.edu/の全配列892個を用いた。β２アドレナリンレセプターのアミノ酸配列を、SEQ ID No.1に示す。

参照するタンパク質の立体構造として、PDB(http://www.rcsb.org/pdb/)のID:1F88(ロドプシン)のＢ鎖の構造を用い、このＢ鎖に対してのアライメントを得た。1F88(ロドプシン)のＢ鎖の配列をSEQ ID No.2に、アライメント結果を第８図に示す。1F88(ロドプシン)の結晶格子中にはＡ鎖及びＢ鎖よりなるほぼ同一の立体構造を持つ２量体があり、Ｂ鎖を参照構造として用いた。またＡ鎖とＢ鎖の座標にはそれぞれ大きな欠損があり完全ではなく、前記ステップI-40で詳述したモデリング・プログラムFAMSを用いて1F88構造のモデリングを行い、構築された立体構造をβ２アドレナリンレセプターの参照タンパク質立体構造とした。

PDBファイルおよびFAMSでは適当な残基に水素原子が付加されないため、この参照タンパク質立体構造の適当な残基に水素原子を発生させ、基準振動解析法の入力座標となる初期原子座標を得た。

前記ステップI-10〜I-20のとおり、得られた初期原子座標のデカルト座標系による最適化、SS結合のポテンシャルパラメータの一部をゼロにしてデカルト座標系で再最適化、２面角座標系による基準振動解析法を行い、固有値・固有ベクトルを得た。

この際、パラメータはAMBERのparm89a Rev Aを用いた。非結合相互作用のカットオフ値は内側9.0Å、外側10.0Åとし、1-4相互作用のパラメータは非結合相互作用のそれに1/2を乗じたものを使用し、誘電率は距離依存型（1/rÅ）とした。最適化は、Fletcher-Reevesの共役勾配法を用いた。得られた初期原子座標のデカルト座標系による最適化をしたあと、SS結合の結合角、２面角のパラメータをゼロにする以外は同じ条件を使用してデカルト座標系で再最適化し、２面角座標系による基準振動解析法を行い、固有値・固有ベクトルを得た。

使用した最適化の条件は、Sumikawa, H., Suzuki, E.-I., Fukuhara, K.-I., Nakajima, Y., Kamiya, K., and Umeyama H. 1998. Dynamics structure of granulocyte colony-stimulating factor proteins studied by normal mode analysis: Two domain-type motions in low frequency modes. Chem Pharm Bull 46: 1069-1077に記載されている方法を用いた。また、２面角座標系による基準振動解析法の詳細は、Noguti, T., and Go, N. 1983. Dynamics of native globular proteins in terms of dihedral angles. J Phys Soc Jpn 52: 3283-3288およびNoguti, T., and Go, N. 1983. A method of rapid calculation of a second derivative matrix of conformational energy for large molecules. J Phys Soc Jpn 52: 3685-3690に記載されている方法を用いた。

前記ステップI-30のとおり、温度を300°Kとし、30cm^-1以下の各固有値に対するCα原子のゆらぎを求め、PDB ID:1F88（ロドプシン）のA鎖とB鎖の平均の温度因子から換算されるCα原子のゆらぎとの比をとり、各固有値に対する平均の比を得た。平均の比をこの固有値に属する固有ベクトルに掛けて、参照タンパク質の原子座標に加えて変位を行い、誘導適合（induced fit）型参照タンパク質の立体構造を規定する座標を得た。同様に固有ベクトルに−１を掛けた変位、２倍した平均の比を固有ベクトルに掛けた変位、さらに−１を掛けた変位を行った。ただし、ここで加える固有ベクトルは２面角座標からデカルト座標に変換してある。１つの固有値・固有ベクトルから４つの誘導適合（induced fit）型参照タンパク質の立体構造セットが得られる。用いた30cm^-1以下の固有値の数は118個であり、得られた誘導適合（induced fit）型の参照タンパク質の数は472個である。例
として、第９図に最低固有値4.47cm^-1のM^v(＝26.4)倍したゆらぎと換算した温度因子を示す。

前記ステップI-40のとおり、非誘導適合（no induced fit）型参照タンパク質立体構造と誘導適合（induced fit）型参照タンパク質立体構造セットからFAMSにより目的タンパク質であるβ2アドレナリンレセプターの立体構造をモデリングした。目的タンパク質の立体構造と参照タンパク質の立体構造は1対1の関係にあり、472個の誘導適合（induced fit）型目的タンパク質立体構造と従来の方法から得られる１個の非誘導適合（no induced fit）型目的タンパク質立体構造を得た。例として、第１０図に、上記で得られた非誘導適合（no induced fit）型参照タンパク質から構築された非誘導適合（no induced fit）
型目的タンパク質立体構造と最低固有値の固有ベクトルを±２×M^v (±2×26.4)倍した誘
導適合（induced fit）型参照タンパク質立体構造から構築された誘導適合（induced fit）型目的タンパク質の立体構造の一部を示す。図中、中央の構造が非誘導適合型目的タンパク質である。

[実施例２]
トリプシン単体およびトリプシン・インヒビター単体からの複合体の立体構造の構築
本例では受容体、リガンド、受容体−リガンド複合体のX線結晶解析が既知である牛膵臓由来のβ-Trypsin(トリプシン)とトリプシン・インヒビター(BPTI)の系を用いて、本発明のタンパク質−リガンド複合体の立体構造構築方法の検証を行った。ここではトリプシンが受容体タンパク質（目的タンパク質）、BPTIがリガンドである。

用いたトリプリンのアミノ酸配列をSEQ ID No.3に、トリプシン・インヒビター(BPTI)のアミノ酸配列をSEQ ID No.4に示す。なお、トリプシンのアミノ酸番号は、キモトリプシノーゲン(キモトリプシンの前駆体)のアミノ酸配列番号で記述するので、以下（図１７）に示す通り、アミノ酸番号16〜245までの223残基になる。途中、アミノ酸番号35、36、68、128、131、188、205、206、207、208に欠落が、184、188、221に重複(184A、188A、221Aで表示)がある。

Ile Val Gly Gly Tyr Thr Cys Gly Ala Asn Thr Val Pro Tyr Gln Val
16 20 25 30
Ser Leu Asn Ser Gly Tyr His Phe Cys Gly Gly Ser Leu Ile Asn Ser
34 37 40 45
Gln Trp Val Val Ser Ala Ala His Cys Tyr Lys Ser Gly Ile Gln Val
50 55 60 65
Arg Leu Gly Glu Asp Asn Ile Asn Val Val Glu Gly Asn Glu Gln Phe
67 69 70 75 80
Ile Ser Ala Ser Lys Ser Ile Val His Pro Ser Tyr Asn Ser Asn Thr
85 90 95
Leu Asn Asn Asp Ile Met Leu Ile Lys Leu Lys Ser Ala Ala Ser Leu
100 105 110
Asn Ser Arg Val Ala Ser Ile Ser Leu Pro Thr Ser Cys Ala Ser Ala
115 120 125 127 130 132
Gly Thr Gln Cys Leu Ile Ser Gly Trp Gly Asn Thr Lys Ser Ser Gly
135 140 145
Thr Ser Tyr Pro Asp Val Leu Lys Cys Leu Lys Ala Pro Ile Leu Ser
150 155 160
Asp Ser Ser Cys Lys Ser Ala Tyr Pro Gly Gln Ile Thr Ser Asn Met
165 170 175 180
Phe Cys Ala Gly Tyr Leu Glu Gly Gly Lys Asp Ser Cys Gln Gly Asp
183 184A184 185 187 188A188 190
Ser Gly Gly Pro Val Val Cys Ser Gly Lys Leu Gln Gly Ile Val Ser
195 200 204 209 210
Trp Gly Ser Gly Cys Ala Gln Lys Asn Lys Pro Gly Val Tyr Thr Lys
215 217 219 220 221A221 225 230
Val Cys Asn Tyr Val Ser Trp Ile Lys Gln Thr Ile Ala Ser Asn
235 240 245

前記ステップII-10〜II-30で詳述した方法に従って、次の手順でトリプシン−BPTI複合体の立体構造モデルを構築し、複合体活性部位の位置をそのX線結晶解析データと比較検討した。

受容体タンパク質−リガンド複合体の立体構造モデルの構築は、DEL社製パーソナルコンピュータ(機種: Dimension XPS B866、CPU: Pentinum III 864MHz、OS: RedHat Linux 6.2J、メモリ: 512Mbytes)を用いて行った。トリプシンと BPTI 単独のＸ線結晶解析の座標、ならびにトリプシン−BPTI 複合体のそれは、Protein Data Bank (PDB); http://www.rcsb.org/pdb/より、それぞれ 1TLD(トリプシン単体)、4PTI(BPTI)、2PTC(トリプシン−BPTI複合体)を取得して用いた。

トリプシンとBPTIの立体座標系は、トリプシン−BPTI複合体の結果を考察しやすいように1TLDと4PTIの座標系を2PTCの座標系に最小二乗フットによりスーパーインポーズした。トリプシンとBPTIの立体座標はヘテロ原子に水素原子を発生させたのち、それぞれ単体での初期座標の最適化を行った。次にトリプシンは BPTI を含まない系で基準振動解析を行い、波長ごとに対する振動ベクトルを求めた。

その中で、時間的に長周期な振動ベクトルからなる５つのトリプシンの立体構造に対して、BPTIの立体構造をドッキングしてapricot-MCSSプログラムによるMCSS計算を行い、トリプシン−BPTI複合体の立体構造を精密化した。MCSS計算の内訳は、最初に1000 ステップのトリプシン−BPTI複合体の分子力学計算による立体構造の最適化を行い、続いて 1fsを１ステップとする300°K、10psの分子動力学計算によりトリプシン−BPTI複合体の立体構造の緩和を行った。分子動力学計算では複合体の立体構造が大きく崩れないように式(27)に示した Cα原子に対する Kxyz = 10.0kcal/mol/Å²の拘束条件を加えた。そして10ps 後の立体構造について、トリプシン−BPTI複合体の座標データをPDBフォーマットで得た。

MCSS計算後のトリプシン−BPTI複合体系のトリプシンの立体構造を第１１図に示す。トリプシンの原子座標を眺めて見ると、主鎖、側鎖ともに大きくばらついている部分と、それらが余りばらついていない部分があった。その中でもトリプシン活性部位であるトリプシン側のHis57、Asp102、Gly193-Asp194-Ser195 (オキシアニオンホール) 部分は主鎖、側鎖ともよく一致していた。このことを利用するとリガンド結合部位に重要な受容体タンパク質側の部位を見つけられる。それは新たなリガンドをデザインする上でたいへん参考になる。

MCSS計算前のトリプシン−BPTI複合体の初期立体構造を第１２図に、MCSS計算後のトリプシン−BPTI複合体の立体構造を第１３図に、複合体のＸ線結晶解析の立体構造とともに示した。これらの図では、トリプシン−BPTI複合体の活性部位に当たる、トリプシン側では His57、Asp102、オキシアニオンホール(Gly193-Asp194-Ser195)を、BPTI側ではLys15だけを抜き出して表示した。黒色で表示されている線がトリプシン−BPTI 複合体のX線結晶解析の立体構造、灰色で表示されている線が本発明により組み立てられた複合体モデルの初期の立体構造(第１２図)と精密化された結果(第１３図)である。

トリプシンの活性部位であるHis57、Asp102、オキシアニオンホールは、MCSS計算前の初期立体構造(第１２図)とMCSS計算後の精密化された立体構造(第１３図)は主鎖、側鎖を含めてよく一致している。BPTIのLys15主鎖も、そのカルボニル酸素がオキシアニオンホールのGly193とSer195ペプチドNH基と２本の水素結合で結ばれているため、MCSSの計算前後でよく一致している。一方BPTIのLys15側鎖の方向は、MCSS計算前はトリプシンの活性ポケットに入っていないが、MCSS計算で立体構造を精密化することによりその活性ポケットに入り込み、トリプシン−BPTI複合体のX線結晶解析によく一致するようになる。

このことは、目的タンパク質の基準振動モードを含む複数のモデル立体構造を用いること、それらにドッキングして得られる目的タンパク質−リガンド複合体の初期立体構造をMCSS計算によりシミュレーションする手法が、目的とするタンパク質−リガンド複合体の立体構造の構築に有用であることを示している。

[実施例３]
トリプシン、トリプシン・インヒビターそれぞれの結合部位の特定
前記ステップIII-10〜III-30で詳述した方法に従って、次の手順でトリプシンおよびBPTIの結合部位をそれぞれ特定し、それら部位を複合体のX線結晶解析データと比較検討した。本例では、タンパク質−リガンド複合体X線結晶解析が既知である牛膵臓由来のβ-Trypsin(トリプシン)とトリプシン・インヒビター(BPTI)の系を用いた。ここではトリプシンが受容体タンパク質（目的タンパク質）、BPTIがリガンドであるが、BPTIもタンパク質であるので、タンパク質側だけでなく、リガンド側の結合部位の特定も行った。用いたトリプシンおよびトリプシン・インヒビター(BPTI)アミノ酸配列は、それぞれSEQ ID No.3およびSEQ ID No.4に示した通りである。

トリプシン−BPTI 複合体の立体構造座標は、Protein Data Bank (PDB); http://www.rcsb.org/pdb/より2PTCを得た。2PTCのトリプシン-BPTI複合体のＸ線結晶解析の立体構造を第１４図に示す。

タンパク質ならびにリガンドの結合部位の検索には、DEL社製パーソナルコンピュータ(機種: Dimension XPS B866、CPU: Pentinum III 864MHz、OS: RedHat Linux 6.2J、メモリ: 512Mbytes)を用いた。

トリプシンとBPTIの立体構造座標はそれぞれ別に扱い、ヘテロ原子に水素原子を発生させたのち、周囲に水溶媒を発生した。次にトリプシンとBPTIの中でMSASが30%以上のアミノ酸残基が形成する表面より3.5Å以内の水分子をベンゼン分子と置換した。その際ベンゼン同士が1.5Å以内になるときは水分子のベンゼンへの置換は行わなかった。そしてベンゼンへの置換が終了した時点で水分子は1回消去した。ベンゼン分子を含むトリプシンとBPTIの立体構造座標はそれら周囲に水分子を満たした周期ボックスを発生させたのち、水分子の周期境界条件のもとapricotプログラムによる経験的分子エネルギー計算を実行した。これらエネルギー計算の内訳は最初に1,000ステップの分子力学計算よる構造の最適化、続いて1fsを１ステップとする300°K、10psの分子動力学計算によるベンゼン分子の挙動探索である。分子動力学計算ではタンパク質の立体構造が大きく崩れないように全アミノ酸残基のCα原子に式(27)によるUxyz=10.0kcal/mol/Å²の拘束条件を加えた。

これら経験的分子エネルギー計算の終了した時点で、トリプシン、BPTIともに周期ボックス内の水分子を消去し、分子動力学計算10ps後のトリプシンとベンゼンの原子座標およびBPTIとベンゼンの原子座標をPDBフォーマットで得た。それらからトリプシンならびにBPTIを除いたベンゼンの分布について閾値を６Åとしたクラスター解析をそれぞれ行った。トリプシンとBPTI周囲にそれぞれ置かれた94個と40個のベンゼン分子のうち、一番大きなクラスターはそれぞれ29個、11個であった。トリプシンとBPTI周囲のベンゼン分子の分布を、トリプシンとBPTIとともに第１５図と第１６図にそれぞれ示す。

これらの図は、第１４図と同じ方向から見たものである。図中、黒線の六角形が一番大きなベンゼンクラスターである。

第１４図〜第１６図より、トリプシンとBPTI周囲の一番大きなベンゼンクラスター同士は方向的によく一致していることが分かる。すなわちタンパク質の疎水性残基の周囲にベンゼン分子を配置し、水溶媒中での分子動力学計算を行い、クラスター解析による大きなベンゼンクラスター分布を探索することにより、タンパク質のリガンドへの結合部位候補を特定できることが分かる。またグラフィックス上でこれらのクラスター同士を重ねるようにタンパク質とリガンドをドッキングさせると、タンパク質−リガンド複合体の初期立体配置をラフに予測できると考えられる。この初期立体配置は手動あるいは分子設計ソフトで調整することにより、タンパク質−リガンド複合体の立体配置の有力な候補の１つになる。

上記のとおり、本発明の方法は、従来の方法と比べて、より真に近いタンパク質の構造、特にリガンドと結合する近傍を精度良く構築しうる方法である。したがって、本発明の方法は医農薬分子の設計等に極めて有用である。

即ち、本発明の誘導適合を含めた立体構造の構築方法は、目的タンパク質のモデル立体構造による基準振動解析から得られる複数の座標データを用いるものであり、分子振動を考慮した平均のモデル立体構造が精度よく構築できる。とくに目的タンパク質−リガンド複合体の立体構造を予測する場合には、それに重要な誘導適合 (induced fit) を含められるので、それを考慮した精密な複合体のモデル立体構造を構築できる。また複数の受容体タンパク質の立体構造を１つのリガンドのそれで構造最適化させるMultiple Copy Simultaneous Search (MCSS) 法でタンパク質−リガンド複合体の立体構造をシミュレートすることにより、経時的に平均化された複合体の立体構造が得られる。

また、本発明のタンパク質−リガンド複合体の立体構造構築方法は、MCSS 計算後に、目的タンパク質−リガンド複合体モデルにおける受容体側の原子座標のばらつきを調べるものであり、活性に重要なサイトは原子座標のばらつきが比較的小さく、その他のサイトはそのばらつきが大きいことを利用して、新たなリガンドをデザインすることができ、医農薬分子設計において、有効に利用することができる。

本発明を詳細にまた特定の実施態様を参照して説明したが、本発明の精神と範囲を逸脱することなく様々な変更や修正を加えることができることは当業者にとって明らかである。

本出願は、２００１年１月１９日の日本特許出願（特願２００１−０１１７８３号）に基づくものであり、その内容はここに参照として取り込まれる。また、本明細書にて引用した文献の内容もここに参照として取り込まれる。

本発明の誘導適合を含めたタンパク質立体構造構築法の一例を示すフローチャートである。ステップI-41のCα原子座標の構築方法を示す図である。アライメントの一致部分は参照タンパク質から取得し、無い部分はＮ，Ｃ両端それぞれ重なった２残基の重ね合わせのrmsdが最小のものをデータベースから取得する。ローカルスペースホモロジー（LSH）を示す図である。図中のT残基に関する計算では、網をかけた（灰色の）残基が考慮される。図中下のアライメントにおける四角で囲った部分が考慮される残基ペアであり、＊のマークがあるところの比率がLSHである。この場合LSHは５６．２％である。 LSHと構造保存部位（SCRs）にある比率との関係を示す図である。LSHは目的タンパク質と参照タンパク質とのCα原子の重ね合わせから計算され、SCRsにある比率は目的タンパク質の全残基数に対するSCRs中の残基数である。本発明のタンパク質−リガンド複合体の立体構造構築法の一例を示すフローチャートである。本発明のリガンド結合部位の特定方法、該方法で特定された結合部位を用いるタンパク質−リガンド複合体の立体構造構築法の一例を示すフローチャートである。本発明の誘導適合を含めたタンパク質の立体構造構築方法の実施例の一例を示すフローチャートである。 1F88(ロドプシン)を参照タンパク質として得られたQRHUB2(β２アドレナリンレセプター)のアライメントを示す図である。図中、QRHUB2及び1F88の右側の数字は、各々のタンパク質のアミノ酸配列においてアライメントの対象となったアミノ酸数である。また、上段の配列はQRHUB2(β２アドレナリンレセプター)を示し、下段の配列は1F88(ロドプシン)を示す。各タンパク質のアミノ酸配列は１文字記号で示す。最低固有値4.47cm^-1のM^v(＝26.4)倍したゆらぎと換算した温度因子を示す図である。実線はPDB ID: 1F88のA鎖とB鎖平均の温度因子を換算したCα原子のゆらぎであり、点線は基準振動解析法から得られた4.47cm^-1のCα原子位置ゆらぎをM^v(＝26.4)倍したものである。目的タンパク質と±２×M^v (±2×26.4)倍した誘導適合（induced fit）型参照タンパク質から構築された誘導適合（induced fit）型目的タンパク質の立体構造の一部を示すディスプレイのプリントアウトの写真である。中央の構造が非誘導適合（no induced fit）型目的タンパク質である。 MCSS計算後のトリプシン−BPTI複合体系のトリプシンの立体構造を示すディスプレイのプリントアウトの写真である。 MCSS計算前のトリプシン−BPTI複合体の初期立体構造を示すディスプレイのプリントアウトの写真である。この図では、トリプシン−BPTI複合体の活性部位に当たる、トリプシン側では His57、Asp102、オキシアニオンホール(Gly193-Asp194-Ser195)を、BPTI側ではLys15だけを抜き出して表示してある。図中、黒色で表示されている線がトリプシン−BPTI 複合体のX線結晶解析の立体構造、灰色で表示されている線が組み立てられた複合体モデルの初期の立体構造である。 MCSS計算後のトリプシン−BPTI複合体の立体構造を示すディスプレイのプリントアウトの写真である。この図では、トリプシン−BPTI複合体の活性部位に当たる、トリプシン側では His57、Asp102、オキシアニオンホール(Gly193-Asp194-Ser195)を、BPTI側ではLys15だけを抜き出して表示してある。図中、黒色で表示されている線がトリプシン−BPTI 複合体のX線結晶解析の立体構造であり、灰色で表示されている線が組み立てられた複合体モデルの精密化された立体構造である。トリプシン−BPTI 複合体のＸ線結晶解析の立体構造座標を示すディスプレイのプリントアウトの写真である。トリプシン周囲のベンゼン分子の分布を示すディスプレイのプリントアウトの写真である。図中、黒線の六角形が一番大きなベンゼンクラスターである。 BPTI周囲のベンゼン分子の分布を示すディスプレイのプリントアウトの写真である。図中、黒線の六角形が一番大きなベンゼンクラスターである。トリプシンのアミノ酸番号をキモトリプシノーゲン(キモトリプシンの前駆体)のアミノ酸配列番号で記述した図である。

Claims

コンピュータを用いて、タンパク質のリガンド結合部位の特定を行う方法であって、
上記コンピュータは、ＣＰＵと記憶手段とを少なくとも備え、
上記記憶手段は、上記タンパク質、低分子化合物および水分子の立体構造の原子座標を記述した立体構造情報を少なくとも記憶し、
上記ＣＰＵにおいて実行される、
（ｉ）上記タンパク質の立体構造情報の周囲に上記低分子化合物の立体構造情報を配置し、
（ｉｉ）それらの周囲にさらに上記水分子の立体構造情報を配置し、水溶媒中での経験的分子エネルギー計算を行って、上記タンパク質と上記低分子化合物との原子座標を得、
（ｉｉｉ）得られた当該原子座標について、上記タンパク質の周囲および内部の、上記低分子化合物の挙動解析を行い、上記リガンドの結合部位を判定する、
各ステップを含み、
上記ＣＰＵにおいて実行される上記低分子化合物の挙動解析は、上記低分子化合物を対象としたクラスター解析により行われ、得られたクラスターのサイズを上記リガンドの結合可能性部位の順位として上記結合部位を判定すること
を特徴とするタンパク質のリガンド結合部位の特定方法。
コンピュータを用いて、タンパク質のリガンド結合部位の特定を行う方法であって、
上記コンピュータは、ＣＰＵと記憶手段とを少なくとも備え、
上記記憶手段は、上記タンパク質、上記リガンド、低分子化合物および水分子の立体構造の原子座標を記述した立体構造情報を少なくとも記憶し、
上記ＣＰＵにおいて実行される、
（ｉ）上記タンパク質および上記リガンドの立体構造情報の周囲に上記低分子化合物の立体構造情報を配置し、
（ｉｉ）それらの周囲にさらに上記水分子の立体構造情報を配置し、水溶媒中での経験的分子エネルギー計算を行って、上記タンパク質と上記低分子化合物との原子座標を得、
（ｉｉｉ）得られた当該原子座標について、上記タンパク質および上記リガンドの周囲および内部の、上記低分子化合物の挙動解析を行い、タンパク質−リガンド複合体の結合部位を判定する、
各ステップを含み、
上記ＣＰＵにおいて実行される上記低分子化合物の挙動解析は、上記低分子化合物を対象としたクラスター解析により行われ、得られたクラスターのサイズを上記リガンドの結合可能性部位の順位として上記結合部位を判定すること
を特徴とするタンパク質−リガンド複合体の結合部位の特定方法。
コンピュータを用いて、タンパク質−リガンド複合体の立体構造を構築する方法であって、
上記コンピュータは、ＣＰＵと記憶手段とを少なくとも備え、
上記記憶手段は、上記タンパク質、上記リガンド、低分子化合物および水分子の立体構造の原子座標を記述した立体構造情報を少なくとも記憶し、
上記ＣＰＵにおいて実行される、
請求項１または２に記載の方法により特定した上記タンパク質の立体構造情報の上記リガンド結合部位に上記リガンドの立体構造情報をドッキングし、経験的分子エネルギー計算により上記タンパク質−リガンドの複合体の立体構造を得る、タンパク質−リガンド複合体立体構造構築ステップ、
を含むことを特徴とするタンパク質−リガンド複合体の立体構造構築方法。
上記ＣＰＵにおいて実行される上記タンパク質−リガンド複合体立体構造構築ステップは、
（ｉ）上記タンパク質の１つの立体構造情報と上記リガンドの立体構造情報との上記経験的分子エネルギー計算を、上記タンパク質の立体構造情報の数だけ行い、その際、
（ｉｉ）タンパク質側は、上記タンパク質の複数の立体構造情報のそれぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、
（ｉｉｉ）リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向に上記リガンド立体構造情報の原子座標を動かして、
（ｉｖ）上記タンパク質の複数の立体構造情報に基づく上記リガンドの立体構造情報を求める、
各ステップを含むことを特徴とする請求項３に記載のタンパク質−リガンド複合体の立体構造構築方法。