JP2004206171A - タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体 - Google Patents

タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体 Download PDF

Info

Publication number
JP2004206171A
JP2004206171A JP2002371038A JP2002371038A JP2004206171A JP 2004206171 A JP2004206171 A JP 2004206171A JP 2002371038 A JP2002371038 A JP 2002371038A JP 2002371038 A JP2002371038 A JP 2002371038A JP 2004206171 A JP2004206171 A JP 2004206171A
Authority
JP
Japan
Prior art keywords
amino acid
acid residue
group
protein
cys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002371038A
Other languages
English (en)
Inventor
Mitsuto Wada
光人 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2002371038A priority Critical patent/JP2004206171A/ja
Priority to US10/516,133 priority patent/US20050130224A1/en
Priority to PCT/JP2003/006952 priority patent/WO2003107218A1/ja
Priority to EP03733232A priority patent/EP1510943A4/en
Publication of JP2004206171A publication Critical patent/JP2004206171A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】蛋白質の構造を分割しながら所望の原子座標の最適化を行うことのできるタンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体を提供することを課題とする。
【解決手段】本発明は、タンパク質の座標データを取得し、タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出し、近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加し、キャップ用置換基が付加された近傍アミノ酸残基群の全体の電荷を計算し、キャップ用置換基が付加された近傍アミノ酸残基群について、計算された電荷を用いて特定のアミノ酸残基の原子座標について構造最適化を実行し、最適化された原子座標を、タンパク質の座標データ上の対応する原子座標と置換する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体に関し、特に、蛋白質の構造を分割しながら所望の原子座標の最適化を行うことのできるタンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】
タンパク質の立体構造を基にしたドラッグデザインを行う際には、一般的に結晶構造が出発構造となる場合が多いが(例えば、非特許文献1参照。)、これには2つの問題がある。ひとつは、X線結晶回折では一般的には水素位置が決められないことである(例えば、非特許文献2参照。)。欠落している水素は、モデリングソフト(例えば、Accelrys Inc.(会社名)の「WebLab Viewer Pro 4.2」(製品名)や「Insight II」(製品名)(www.accelrys.com)、Tripos,Inc.(会社名)の「SYBYL 6.7」(製品名)(www.tripos.com)、CambridgeSoft Corporation(会社名)の「Chem3D 7.0」(製品名)(www.camsoft.com)など)を用いて機械的に付加することはできるが、エネルギー的に安定となる配向となるわけではない。もう一つの問題は、結晶構造中では分子がパッキングされるために、いわば「干物」のような状態となっており、その構造が必ずしも生体中で機能している構造を反映しているとは限らないことである。「生身の状態」に近づけるためには、少なくとも側鎖部分をリラックスさせる必要がある。そのため、局所的な原子構造の安定化のために、構造最適化が不可欠となる(例えば、非特許文献1参照。)。
【0003】
また、タンパク質の電子状態を計算する手法には、例えば、半経験的分子軌道計算プログラムである「MOPAC2000 ver.1.0」(製品名)(Fujitu Limited(会社名) Tokyo,2000)に実装されている「MOZYME法」(例えば、非特許文献3参照。)などがある。この方法を用いると、2万原子程度、1000残基のタンパク質の実用的なレベルで計算できる。ただし、これは「EF(Eigenvector Following)法」(例えば、非特許文献4参照。)や「BFGS(Broyden−Fletcher−Goldfarb−Shanno)法」(例えば、非特許文献5−8参照。)などの構造最適化を行わない場合である。MOPAC2000では通常、低分子に対しては信頼性の高いEF法が用いられ、高分子に対しては収束が速く必要メモリの少量化が図れるBFGS法が用いられる。
【0004】
また、生体分子の計算においては溶媒効果を考慮することが重要である(例えば、非特許文献1および非特許文献9参照。)。
【0005】
【非特許文献1】
H.−D.ヘルツェ,G.フォルカース著,江崎俊之訳,「分子モデリング」,地人書館,1998年
【非特許文献2】
平山令明著,「生命科学のための結晶解析入門」,丸善株式会社, 1996年
【非特許文献3】
J.J.P.Stewart,Int.J.Quant.Chem., 58,133,1996.
【非特許文献4】
J.Baker,J.Comp.Chem.,7,385,1986.
【非特許文献5】
C.G.Broyden,Computr Journal,13,317,1970.
【非特許文献6】
R.Fletcher,J.Inst.Math.Appl.,6,222,1970.
【非特許文献7】
D.Goldfarb,Mathematics of Computation,24,23,1970.
【非特許文献8】
D.F.Shanno,Mathematics of Computation,24,647,1970.
【非特許文献9】
櫻井 実,猪飼 篤編,「生物工学基礎コース 計算機化学入門」,丸善株式会社,1999
【0006】
【発明が解決しようとする課題】
しかしながら、蛋白質の全原子について上述したいずれかの手法により構造最適化を行う際の実用的な最適化計算は、水素原子だけ最適化する場合には800残基程度、側鎖を最適化する場合には500残基程度が限度となるというシステム構造上の問題点を有していた。
【0007】
ここで、本問題点は近傍に位置する原子の立体障害などが主要因であるため、何も全原子を一度に計算に考慮する必要はなく、それぞれの部位について、局所的に見て安定な構造を求めてあげれば良いはずである。つまり、全体構造を部分構造に分割し、局所的な構造最適化を繰り返すことで、この問題を実用的な計算資源を用いて解決することができる。しかしながら、従来の最適化計算において、蛋白質の構造を分割しながら高精度で最適化を行う手法は存在しなかった。
【0008】
生体分子の計算における溶媒効果の重要性について種々の文献により指摘されているが(例えば、非特許文献1および非特許文献9参照。)、従来の方法では溶媒効果を考慮に入れたタンパク質の構造最適化が不可能であった。
【0009】
本発明は上記問題点に鑑みてなされたもので、蛋白質の構造を分割しながら所望の原子座標の最適化を行うことのできる、タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体を提供することを目的としている。
【0010】
【課題を解決するための手段】
このような目的を達成するため、請求項1に記載のタンパク質構造最適化装置は、タンパク質の座標データを取得する座標データ取得手段と、上記タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出する近傍アミノ酸残基群抽出手段と、上記近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加するキャップ付加手段と、上記キャップ付加手段により上記キャップ用置換基が付加された上記近傍アミノ酸残基群の全体の電荷を計算する電荷計算手段と、上記キャップ付加手段により上記キャップ用置換基が付加された上記近傍アミノ酸残基群について、上記電荷計算手段により計算された上記電荷を用いて上記特定のアミノ酸残基の原子座標について構造最適化を実行する構造最適化手段と、上記構造最適化手段にて最適化された上記原子座標を、上記タンパク質の座標データ上の対応する原子座標と置換する原子座標置換手段とを備えたことを特徴とする。
【0011】
この装置によれば、タンパク質の座標データを取得し、タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出し、近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加し、キャップ用置換基が付加された近傍アミノ酸残基群の全体の電荷を計算し、キャップ用置換基が付加された近傍アミノ酸残基群について、計算された電荷を用いて特定のアミノ酸残基の原子座標について構造最適化を実行し、最適化された原子座標を、タンパク質の座標データ上の対応する原子座標と置換するので、水素位置の決定やパッキングの問題の解消を、実用的な計算資源を用いて行うことが可能となる。
【0012】
また、この装置によれば、既存の計算プログラムには一切手を加えずに最適化処理の高速化を図ることができる。すなわち、既存の分子軌道計算プログラムや、分子力学計算プログラムの入出力ファイルを用いて、本装置を実行することができる。但し、本装置のアルゴリズムを既存の分子軌道計算プログラムや、分子力学計算プログラムに組み込むことも可能である。
【0013】
また、この装置によれば、従来の方法では不可能な溶媒効果を考慮に入れたタンパク質の構造最適化が可能になる。
【0014】
また、請求項2に記載のタンパク質構造最適化装置は、請求項1に記載のタンパク質構造最適化装置において、上記キャップ用置換基は、水素原子(H)またはメチル基(CH3)であることを特徴とする。
【0015】
これはキャップ用置換基の一例を一層具体的に示すものである。この装置によれば、キャップ用置換基は、水素原子(H)またはメチル基(CH3)であるので、近傍アミノ酸残基群について機械的に座標を切り取ったときの切り口が、ラジカルとなり計算に不都合を生じることを容易に解消することができるようになる。
【0016】
また、請求項3に記載のタンパク質構造最適化装置は、請求項1または2に記載のタンパク質構造最適化装置において、近傍アミノ酸残基群抽出手段は、抽出した上記近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ上記近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えることを特徴とする。
【0017】
これは近傍アミノ酸残基群抽出手段の一例を一層具体的に示すものである。この装置によれば、近傍アミノ酸残基群抽出手段は、抽出した近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えるので、システイン間のジスルフィド結合を考慮して構造最適化を行うことができるようになる。
【0018】
また、本発明はタンパク質構造最適化方法に関するものであり、請求項4に記載のタンパク質構造最適化方法は、タンパク質の座標データを取得する座標データ取得ステップと、上記タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出する近傍アミノ酸残基群抽出ステップと、上記近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加するキャップ付加ステップと、上記キャップ付加ステップにより上記キャップ用置換基が付加された上記近傍アミノ酸残基群の全体の電荷を計算する電荷計算ステップと、上記キャップ付加ステップにより上記キャップ用置換基が付加された上記近傍アミノ酸残基群について、上記電荷計算ステップにより計算された上記電荷を用いて上記特定のアミノ酸残基の原子座標について構造最適化を実行する構造最適化ステップと、上記構造最適化ステップにて最適化された上記原子座標を、上記タンパク質の座標データ上の対応する原子座標と置換する原子座標置換ステップとを含むことを特徴とする。
【0019】
この方法によれば、タンパク質の座標データを取得し、タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出し、近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加し、キャップ用置換基が付加された近傍アミノ酸残基群の全体の電荷を計算し、キャップ用置換基が付加された近傍アミノ酸残基群について、計算された電荷を用いて特定のアミノ酸残基の原子座標について構造最適化を実行し、最適化された原子座標を、タンパク質の座標データ上の対応する原子座標と置換するので、水素位置の決定やパッキングの問題の解消を、実用的な計算資源を用いて行うことが可能となる。
【0020】
また、この方法によれば、既存の計算プログラムには一切手を加えずに最適化処理の高速化を図ることができる。すなわち、既存の分子軌道計算プログラムや、分子力学計算プログラムの入出力ファイルを用いて、本方法を実行することができる。但し、本方法のアルゴリズムを既存の分子軌道計算プログラムや、分子力学計算プログラムに組み込むことも可能である。
【0021】
また、この方法によれば、従来の方法では不可能な溶媒効果を考慮に入れたタンパク質の構造最適化が可能になる。
【0022】
また、請求項5に記載のタンパク質構造最適化方法は、請求項4に記載のタンパク質構造最適化方法において、上記キャップ用置換基は、水素原子(H)またはメチル基(CH3)であることを特徴とする。
【0023】
これはキャップ用置換基の一例を一層具体的に示すものである。この方法によれば、キャップ用置換基は、水素原子(H)またはメチル基(CH3)であるので、近傍アミノ酸残基群について機械的に座標を切り取ったときの切り口が、ラジカルとなり計算に不都合を生じることを容易に解消することができるようになる。
【0024】
また、請求項6に記載のタンパク質構造最適化方法は、請求項4または5に記載のタンパク質構造最適化方法において、近傍アミノ酸残基群抽出ステップは、抽出した上記近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ上記近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えることを特徴とする。
【0025】
これは近傍アミノ酸残基群抽出ステップの一例を一層具体的に示すものである。この方法によれば、近傍アミノ酸残基群抽出ステップは、抽出した近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えるので、システイン間のジスルフィド結合を考慮して構造最適化を行うことができるようになる。
【0026】
また、本発明はプログラムに関するものであり、請求項7に記載のプログラムは、タンパク質の座標データを取得する座標データ取得ステップと、上記タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出する近傍アミノ酸残基群抽出ステップと、上記近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加するキャップ付加ステップと、上記キャップ付加ステップにより上記キャップ用置換基が付加された上記近傍アミノ酸残基群の全体の電荷を計算する電荷計算ステップと、上記キャップ付加ステップにより上記キャップ用置換基が付加された上記近傍アミノ酸残基群について、上記電荷計算ステップにより計算された上記電荷を用いて上記特定のアミノ酸残基の原子座標について構造最適化を実行する構造最適化ステップと、上記構造最適化ステップにて最適化された上記原子座標を、上記タンパク質の座標データ上の対応する原子座標と置換する原子座標置換ステップとを含むタンパク質構造最適化方法をコンピュータに実行させることを特徴とする。
【0027】
このプログラムによれば、タンパク質の座標データを取得し、タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出し、近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加し、キャップ用置換基が付加された近傍アミノ酸残基群の全体の電荷を計算し、キャップ用置換基が付加された近傍アミノ酸残基群について、計算された電荷を用いて特定のアミノ酸残基の原子座標について構造最適化を実行し、最適化された原子座標を、タンパク質の座標データ上の対応する原子座標と置換するので、水素位置の決定やパッキングの問題の解消を、実用的な計算資源を用いて行うことが可能となる。
【0028】
また、このプログラムによれば、既存の計算プログラムには一切手を加えずに最適化処理の高速化を図ることができる。すなわち、既存の分子軌道計算プログラムや、分子力学計算プログラムの入出力ファイルを用いて、本プログラムを実行することができる。但し、本プログラムのアルゴリズムを既存の分子軌道計算プログラムや、分子力学計算プログラムに組み込むことも可能である。
【0029】
また、このプログラムによれば、従来のプログラムでは不可能な溶媒効果を考慮に入れたタンパク質の構造最適化が可能になる。
【0030】
また、請求項8に記載のプログラムは、請求項7に記載のプログラムにおいて、上記キャップ用置換基は、水素原子(H)またはメチル基(CH3)であることを特徴とする。
【0031】
これはキャップ用置換基の一例を一層具体的に示すものである。このプログラムによれば、キャップ用置換基は、水素原子(H)またはメチル基(CH3)であるので、近傍アミノ酸残基群について機械的に座標を切り取ったときの切り口が、ラジカルとなり計算に不都合を生じることを容易に解消することができるようになる。
【0032】
また、請求項9に記載のプログラムは、請求項7または8に記載のプログラムにおいて、近傍アミノ酸残基群抽出ステップは、抽出した上記近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ上記近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えることを特徴とする。
【0033】
これは近傍アミノ酸残基群抽出ステップの一例を一層具体的に示すものである。このプログラムによれば、近傍アミノ酸残基群抽出ステップは、抽出した近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えるので、システイン間のジスルフィド結合を考慮して構造最適化を行うことができるようになる。
【0034】
また、本発明は記録媒体に関するものであり、請求項10に記載の記録媒体は、上記請求項7から9のいずれか一つに記載されたプログラムを記録したことを特徴とする。
【0035】
この記録媒体によれば、当該記録媒体に記録されたプログラムをコンピュータに読み取らせて実行することによって、請求項7から9のいずれか一つに記載されたプログラムをコンピュータを利用して実現することができ、これら各方法と同様の効果を得ることができる。
【0036】
【発明の実施の形態】
以下に、本発明にかかるタンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
特に、以下の実施の形態においては、本発明を、富士通(会社名)の「MOPAC2000 ver.1.0」(製品名)に適用した例について説明するが、この場合に限られず、他のプログラムを用いても同様に適用することができる。
【0037】
[本発明の概要]
以下、本発明の概要について説明し、その後、本発明の構成および処理等について詳細に説明する。図1は本発明の基本原理を示すフローチャートである。
【0038】
本発明は、概略的に、以下の基本的特徴を有する。まず、本発明は、タンパク質の座標データを取得する(ステップSA−1)。ここで、取得するタンパク質の座標データは、例えば、X線結晶解析により求めた座標データに既知のモデリングソフト(例えば、Accelrys Inc.(会社名)の「WebLabViewer Pro 4.2」(製品名)や「Insight II」(製品名)(www.accelrys.com)、Tripos,Inc.(会社名)の「SYBYL 6.7」(製品名)(www.tripos.com)、CambridgeSoft Corporation(会社名)の「Chem3D 7.0」(製品名)(www.camsoft.com)など)を用いて水素を付加したものや、また、PDB(Protein Deta Base)などの既知の蛋白構造データベースに登録された座標データなど、あらゆるタンパク質の座標データを用いてもよい。
【0039】
そして、本発明は、タンパク質の座標データについて、特定のアミノ酸残基iから所定の距離(例えば、rÅ)内に含まれる近傍アミノ酸残基群の座標を抽出する(ステップSA−2)。すなわち、アミノ酸残基iに含まれる全原子から所定の距離内に存在する原子を含むアミノ酸残基の群が近傍アミノ酸残基群であり、この近傍アミノ酸残基群に含まれる全原子座標を抽出する。抽出した近傍アミノ酸残基群の中にシステイン(CYS)が含まれており、それが別のシステイン(CYS)とジスルフィド結合をしている場合には、その別のCYSも近傍アミノ酸残基群に加えてもよい。
【0040】
ステップSA−2の操作で機械的に座標を切り取った場合、その切り口がラジカルとなり計算に不都合が生じる。これを解消するために、本発明は、近傍アミノ酸残基群の切り口の部分にキャップ用置換基(例えば水素原子(H)またはメチル基(CH3)を付加する(ステップSA−3)。
【0041】
そして、本発明は、キャップ用置換基が付加された近傍アミノ酸残基群の全体の電荷を計算する(ステップSA−4)。電荷計算は、既知のあらゆる電荷計算手法を用いてもよいが、例えば、塩基性アミノ酸残基数から酸性アミノ酸残基数を減算することにより高速に計算することもできる。
【0042】
そして、本発明は、キャップ用置換基が付加された近傍アミノ酸残基群について、電荷を用いて、特定のアミノ酸残基iの原子座標について既知の分子軌道計算プログラム(例えば、「MOPAC2000 ver.1.0」(製品名)などの半経験的分子軌道計算プログラム)などを用いて構造最適化を実行する(ステップSA−5)。
【0043】
そして、本発明は、最適化された原子座標を、初期のタンパク質の座標データ上の対応する原子座標と置換する(ステップSA−6)。
【0044】
そして、本発明は、全てのアミノ酸残基iについてステップSA−2からステップSA−6を適用し(1番目のアミノ酸残基から最後のアミノ酸残基までiをインクリメントしてループ処理を行う。)、全てのアミノ酸残基について最適化を実行する(ステップSA−7)。
【0045】
そして、本発明は、ステップSA−7において得られた構造データを初期構造として、ステップSA−1からステップSA−7を複数回(n回)実行することにより、更に構造最適化の精度を上げることができる(ステップSA−8)。
【0046】
[システム構成]
まず、本システムの構成について説明する。図2は、本発明が適用される本システムの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。本システムは、概略的に、タンパク質構造最適化装置100と、タンパク質構造情報等に関する外部データベースやホモロジー検索等の外部プログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されている。
【0047】
図2においてネットワーク300は、タンパク質構造最適化装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
【0048】
図2において外部システム200は、ネットワーク300を介して、タンパク質構造最適化装置100と相互に接続され、利用者に対してタンパク質構造情報等に関する外部データベースやホモロジー検索やモチーフ検索等の外部プログラムを実行するウェブサイトを提供する機能を有する。
【0049】
ここで、外部システム200は、WEBサーバやASPサーバ等として構成してもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成してもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
【0050】
図2においてタンパク質構造最適化装置100は、概略的に、タンパク質構造最適化装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。さらに、このタンパク質構造最適化装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
【0051】
記憶部106に格納される各種のデータベースやテーブルなど(タンパク質構造情報データベース106a〜処理結果ファイル106b)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0052】
これら記憶部106の各構成要素のうち、タンパク質構造情報データベース106aは、タンパク質の立体構造の座標データ等を格納した座標データ格納手段である。タンパク質構造情報データベース106aは、インターネットを経由してアクセスするPDBなどの外部のデータベースであってもよく、また、これらのデータベースをコピーしたり、オリジナルの情報を格納したり、さらに独自のアノテーション情報等を付加したりして作成したインハウスデータベースであってもよい。
【0053】
また、処理結果ファイル106bは、タンパク質構造最適化装置100の制御部102の各処理による処理結果に関する情報等を格納する処理結果格納手段である。
【0054】
また、図2において、通信制御インターフェース部104は、タンパク質構造最適化装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
【0055】
また、図2において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力装置114をモニタとして記載する場合がある)。また、入力装置112としては、キーボード、マウス、および、マイク等を用いることができる。また、モニタも、マウスと協働してポインティングデバイス機能を実現する。
【0056】
また、図2において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、座標データ取得部102a、近傍アミノ酸残基群抽出部102b、キャップ付加部102c、電荷計算部102d、構造最適化部102e、および、原子座標置換部102fを備えて構成されている。
【0057】
このうち、座標データ取得部102aは、タンパク質の座標データを取得する座標データ取得手段である。また、近傍アミノ酸残基群抽出部102bは、タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出する近傍アミノ酸残基群抽出手段である。また、キャップ付加部102cは、近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加するキャップ付加手段である。また、電荷計算部102dは、キャップ付加手段により上記キャップ用置換基が付加された上記近傍アミノ酸残基群の全体の電荷を計算する電荷計算手段である。また、構造最適化部102eは、キャップ付加手段により上記キャップ用置換基が付加された上記近傍アミノ酸残基群について、上記電荷計算手段により計算された上記電荷を用いて上記特定のアミノ酸残基の原子座標について構造最適化を実行する構造最適化手段である。また、原子座標置換部102fは、構造最適化手段にて最適化された上記原子座標を、上記タンパク質の座標データ上の対応する原子座標と置換する原子座標置換手段である。なお、これら各部によって行なわれる処理の詳細については、後述する。
【0058】
[システムの処理]
次に、このように構成された本実施の形態における本システムの処理の一例について、以下に図3〜図19を参照して詳細に説明する。
【0059】
[メイン処理]
まず、メイン処理の詳細について図3を参照して説明する。図3は、本実施形態における本システムのメイン処理の一例を示すフローチャートである。
【0060】
タンパク質構造最適化装置100は、座標データ取得部102aの処理により、タンパク質構造情報データベース106aや外部システム200の外部データベースから所望のタンパク質の座標データを取得する(ステップSB−1)。ここで、取得するタンパク質の座標データは、例えば、X線結晶解析により求めた座標データに既知のモデリングソフト(例えば、Accelrys Inc.(会社名)の「WebLab Viewer Pro 4.2」(製品名)や「Insight II」(製品名)(www.accelrys.com)、Tripos,Inc.(会社名)の「SYBYL 6.7」(製品名)(www.tripos.com)、CambridgeSoft Corporation(会社名)の「Chem3D 7.0」(製品名)(www.camsoft.com)など)を用いて水素を付加したものや、また、PDB(Protein Deta Base)などの既知の蛋白構造データベースに登録された座標データなど、あらゆるタンパク質の座標データを用いてもよい。
【0061】
ここで、図4は、タンパク質の座標データの一例を示す図である。図4に示す例では、PDB形式の座標データを用いており、また、X線結晶解析で求めた構造情報に市販のプログラムにより水素を付加している。
【0062】
再び図3に戻り、タンパク質構造最適化装置100は、制御部102の処理により、処理回数を表すカウンターn(初期値は0)に1を加算する(ステップSB−2)。
【0063】
また、タンパク質構造最適化装置100は、制御部102の処理により、アミノ酸残基番号を表すカウンターi(初期値は0)に1を加算する(ステップSB−3)。
【0064】
そして、タンパク質構造最適化装置100は、近傍アミノ酸残基群抽出部102bの処理により、処理対象のタンパク質の座標データについて、特定のアミノ酸残基iから所定の距離(例えば、rÅ)内に含まれる近傍アミノ酸残基群の座標を抽出する(ステップSB−4)。すなわち、アミノ酸残基iに含まれる全ての原子jから所定の距離内に存在する原子lを含むアミノ酸残基k(k≠i)の群が近傍アミノ酸残基群であり、この近傍アミノ酸残基群に含まれる全ての原子mの座標を抽出する。
【0065】
また、抽出した近傍アミノ酸残基群の中にシステイン(CYS)が含まれており、それが別のシステイン(CYS)とジスルフィド結合をしている場合には、その別のシステイン(CYS)も近傍アミノ酸残基群に加えてもよい。すなわち、近傍アミノ酸残基群抽出部102bは、抽出した近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしている近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加える。
【0066】
ステップSB−4の操作で機械的に座標を切り取った場合、その切り口がラジカルとなり計算に不都合が生じる。これを解消するために、タンパク質構造最適化装置100は、キャップ付加部102cの処理により、近傍アミノ酸残基群の切り口の部分にキャップ用置換基(例えば水素原子(H)またはメチル基(CH3))を付加する(ステップSB−3)。キャップ用置換基として水素、メチル基のどちらを用いるかは、ユーザが目的に応じて判断する。
【0067】
ここで、キャップ付加部102cのよるキャップ付加処理の詳細について図5から図12を参照して説明する。
【0068】
図5は、本実施形態における切り口に水素原子を付加する場合のキャップ付加処理の一例を示すフローチャートである。また、図6は、もとの座標とキャップ置換基を付加した後の座標の概念を示す図である。図5は、図6に示すもとの座標(左側)に対してアミノ基側へキャップ付加(右側)をする際の処理の一例を示す。近傍アミノ酸残基群の任意の残基をjとする。
【0069】
キャップ付加部102cは、アミノ酸残基jがN端アミノ酸である場合(ステップSC−1)、アミノ酸残基jのアミノ側は切り口になっていないので、キャップ付加は不要とする(ステップSC−2)。
【0070】
そして、キャップ付加部102cは、アミノ酸残基jがN端アミノ酸でない場合には(ステップSC−1)、隣のアミノ酸残基j−1も抽出されたアミノ酸残基群に含まれる場合(ステップSC−3)、残基jのアミノ側は切り口になっていないので、キャップ付加は不要とする(ステップSC−4)。
【0071】
一方、キャップ付加部102cは、隣のアミノ酸残基j−1も抽出されたアミノ酸残基群に含まれない場合には(ステップSC−3)、アミノ酸残基j−1の主鎖カルボニル炭素をCj-1とする(ステップSC−5)。
【0072】
そして、キャップ付加部102cは、アミノ酸残基jの主鎖アミノ基窒素をNjとする(ステップSC−6)。
【0073】
そして、キャップ付加部102cは、付加するキャップ水素原子HCAPNの位置を以下の数式(1)に従って決める(ステップSC−7)。
【数1】
Figure 2004206171
【0074】
次に図7は、本実施形態における切り口に水素原子を付加する場合のキャップ付加処理の一例を示すフローチャートである。また、図8は、もとの座標とキャップ置換基を付加した後の座標の概念を示す図である。図7は、図8に示すもとの座標(左側)に対してカルボキシル基側へキャップ付加(右側)をする際の処理の一例を示す。近傍アミノ酸残基群の任意の残基をjとする。
【0075】
キャップ付加部102cは、アミノ酸残基jがC端アミノ酸である場合(ステップSD−1)、アミノ酸残基jのアミノ側は切り口になっていないので、キャップ付加は不要とする(ステップSD−2)。
【0076】
そして、キャップ付加部102cは、アミノ酸残基jがC端アミノ酸でない場合には(ステップSD−1)、隣のアミノ酸残基j+1も抽出されたアミノ酸残基群に含まれる場合(ステップSD−3)、残基jのアミノ側は切り口になっていないので、キャップ付加は不要とする(ステップSD−4)。
【0077】
一方、キャップ付加部102cは、隣のアミノ酸残基j+1も抽出されたアミノ酸残基群に含まれない場合には(ステップSD−3)、アミノ酸残基j+1の主鎖アミノ基窒素をNj+1とする(ステップSD−5)。
【0078】
そして、キャップ付加部102cは、アミノ酸残基jの主鎖カルボニル炭素をCjとする(ステップSD−6)。
【0079】
そして、キャップ付加部102cは、付加するキャップ水素原子HCAPCの位置を以下の数式(2)に従って決める(ステップSD−7)。
【数2】
Figure 2004206171
【0080】
次に図9は、本実施形態における切り口にメチル基を付加する場合のキャップ付加処理の一例を示すフローチャートである。また、図10は、もとの座標とキャップ置換基を付加した後の座標の概念を示す図である。図9は、図10に示すもとの座標(左側)に対してアミノ基側へキャップ付加(右側)をする際の処理の一例を示す。近傍アミノ酸残基群の任意の残基をjとする。
【0081】
キャップ付加部102cは、アミノ酸残基jがN端アミノ酸である場合(ステップSE−1)、アミノ酸残基jのアミノ側は切り口になっていないので、キャップ付加は不要とする(ステップSE−2)。
【0082】
そして、キャップ付加部102cは、アミノ酸残基jがN端アミノ酸でない場合には(ステップSE−1)、隣のアミノ酸残基j−1も抽出されたアミノ酸残基群に含まれる場合(ステップSE−3)、残基jのアミノ側は切り口になっていないので、キャップ付加は不要とする(ステップSE−4)。
【0083】
一方、キャップ付加部102cは、隣のアミノ酸残基j−1も抽出されたアミノ酸残基群に含まれない場合には(ステップSE−3)、アミノ酸残基j−1の主鎖カルボニル炭素をCj-1とする(ステップSE−5)。
【0084】
そして、キャップ付加部102cは、アミノ酸残基jの主鎖アミノ基窒素をNjとする(ステップSE−6)。
【0085】
そして、キャップ付加部102cは、アミノ酸残基jの主鎖α炭素をCAjとする(ステップSE−7)。
【0086】
そして、キャップ付加部102cは、付加するキャップメチル基炭素CCAPNの位置を以下の数式(3)に従って決める(ステップSE−8)。
【数3】
Figure 2004206171
【0087】
そして、キャップ付加部102cは、付加する3つのキャップメチル基水素HCAPNk(k=1,2,3)の位置を以下の条件(数式(4))で決める(ステップSE−9)。
【数4】
Figure 2004206171
【0088】
次に図11は、本実施形態における切り口にメチル基を付加する場合のキャップ付加処理の一例を示すフローチャートである。また、図12は、もとの座標とキャップ置換基を付加した後の座標の概念を示す図である。図11は、図12に示すもとの座標(左側)に対してカルボキシル基側へキャップ付加(右側)をする際の処理の一例を示す。近傍アミノ酸残基群の任意の残基をjとする。
【0089】
キャップ付加部102cは、アミノ酸残基jがC端アミノ酸である場合(ステップSF−1)、アミノ酸残基jのアミノ側は切り口になっていないので、キャップ付加は不要とする(ステップSF−2)。
【0090】
そして、キャップ付加部102cは、アミノ酸残基jがC端アミノ酸でない場合には(ステップSF−1)、隣のアミノ酸残基j+1も抽出されたアミノ酸残基群に含まれる場合(ステップSF−3)、残基jのアミノ側は切り口になっていないので、キャップ付加は不要とする(ステップSF−4)。
【0091】
一方、キャップ付加部102cは、隣のアミノ酸残基j+1も抽出されたアミノ酸残基群に含まれない場合には(ステップSF−3)、アミノ酸残基j+1の主鎖アミノ基窒素をNj+1とする(ステップSF−5)。
【0092】
そして、キャップ付加部102cは、アミノ酸残基jの主鎖カルボニル炭素をCjとする(ステップSF−6)。
【0093】
そして、キャップ付加部102cは、アミノ酸残基jの主鎖α炭素をCAjとする(ステップSF−7)。
【0094】
そして、キャップ付加部102cは、付加するキャップメチル基炭素CCAPCの位置を以下の数式(5)に従って決める(ステップSF−8)。
【数5】
Figure 2004206171
【0095】
そして、キャップ付加部102cは、付加する3つのキャップメチル基水素HCAPCk(k=1,2,3)の位置を以下の条件(数式(6))で決める(ステップSF−9)。
【数6】
Figure 2004206171
ここで、数式(1)〜数式(6)において、R、A、Dは、それぞれ、標準結合長、標準結合角、標準二面角であり、本条件で記した数値はその一例である(平野恒夫・田辺和俊編「分子軌道法MOPACガイドブック(3訂版)」海文堂出版,1999 参照。)。
これにて、キャップ付加処理が終了する。
【0096】
再び図3に戻り、タンパク質構造最適化装置100は、全ての近傍アミノ酸残基群の切口にキャップを付加すると、ステップSB−4で抽出したアミノ酸残基群全体の電荷計算を行う。すなわち、MOPAC2000に限らず、一般に分子軌道計算を行う際には対象となる系全体の電荷を入力データとして与えるため、タンパク質構造最適化装置100は、電荷計算部102dの処理により、キャップ用置換基が付加された近傍アミノ酸残基群の全体の電荷を計算する(ステップSB−6)。
【0097】
電荷計算は、既知のあらゆる電荷計算手法を用いてもよいが、例えば、以下の数式(7)を用いて、塩基性アミノ酸残基数から酸性アミノ酸残基数を減算することにより高速に計算することもできる。
(全体電荷)=(塩基性アミノ酸残基数)−(酸性アミノ残基数) (数7)
ここで、塩基性アミノ酸残基は、ARG、LYSなどであり、酸性アミノ酸残基は、ASP、GLUなどである。アミノ酸種別は、図13に示すように、入力データとして与えるPDB形式データの三文字表記(18−20カラムの文字)で判別する(「PDB File Format Contents Guide Version 2.2」(20 December 1996)参照)。また、中性アミノ酸残基(例えば、ARG、LYS、ASP、GLUなど)や、プロトン化したHIS(電荷+1)の表記法は、分子動力学計算プログラム「Amber 7」(University of California,2002.)の様式に従いARN,LYN,ASH,GLH,HIPとして、入力PDBデータで記述し判別する。また、非天然のアミノ酸残基や、ユーザ定義のアミノ酸、リガンド分子の電荷も個別に設定できるようにしておく。例えば、リン酸化したTHRをTPOと定義し、このアミノ酸に対しては−2の電荷を与えるようにプログラムで設定しておく。
【0098】
そして、タンパク質構造最適化装置100は、構造最適化部102eの処理により、MOPAC2000の入力ファイルを作成するために、アミノ酸残基iを構成する各原子に対して最適化処理対象の原子であることを表す「最適化フラグ」を設定する(ステップSC−7)。なお、MOPAC2000に限らず、一般に計算化学的手法(分子軌道法、分子力学法など)で構造最適化を行う際には、最適な位置に動かす原子と、座標を固定して位置を動かさない原子を設定し、部分構造最適化を行うこともできる。ここでは、最適な位置に動かす原子を入力データとして判別できるように設定する事を、MOPAC2000の慣例に倣って、「最適化フラグを設定する」と呼ぶことにする(「MOPAC2000 Manual」Fujitu Limited, Tokyo,2000 参照)。
【0099】
具体的には、構造最適化部102eは、水素の構造最適化を行う場合、アミノ酸残基iの水素原子に最適化フラグを設定する。図14は、アミノ酸残基iの水素原子に最適化フラグを設定する場合の一例を示す図である。図14は、PDBコードが「1CBI」のタンパク質に対して水素付加を行った入力PDBデータに対して、特定アミノ酸残基が50番目のアミノ酸残基(i=50)であり、距離が3.0オングストローム(r=3.0Å)のときに抽出される近傍アミノ酸残基群を示している。また、上述の方法により近傍アミノ酸残基群の切り口にキャップ置換基(水素原子)の付加も行っている。また、上述のステップSB−6では、ここに示した全原子を考慮して電荷計算を行っている。図14において、太線と球で表示されている部分が計算の中心残基であるPHE50(i=50のアミノ酸残基であるフェニルアラニン)である。このPHE50の中で最適化フラグを設定する水素原子を球で示している。
【0100】
また、構造最適化部102eは、側鎖の構造最適化を行う場合、アミノ酸残基iの水素と側鎖原子に最適化フラグを設定する。図15は、アミノ酸残基iの水素と側鎖原子に最適化フラグを設定する場合の一例を示す図である。図15は、PDBコードが「1CBI」のタンパク質に対して水素付加を行った入力PDBデータに対して、特定アミノ酸残基が50番目のアミノ酸残基(i=50)であり、距離が3.0オングストローム(r=3.0Å)のときに抽出される近傍アミノ酸残基群を示している。また、上述の方法により近傍アミノ酸残基群の切り口にキャップ置換基(水素原子)の付加も行っている。また、上述のステップSB−6では、ここに示した全原子を考慮して電荷計算を行っている。図15において、太線と球で表示されている部分が計算の中心残基であるPHE50(i=50のアミノ酸残基であるフェニルアラニン)である。このPHE50の中で最適化フラグを設定する水素原子と側鎖原子を球で示している。
【0101】
また、構造最適化部102eは、全原子の構造最適化を行う場合、アミノ酸残基iの全原子に最適化フラグを設定する。ただし、MOPAC2000を含め現状の分子軌道理論では、主鎖構造の2次構造を再現することが困難なため、主鎖原子の最適化は一般には行わないことが多いが2次構造を再現できる精度の高い理論が構築されれば、全構造最適化も有効となる。
【0102】
再び図3に戻り、タンパク質構造最適化装置100は、構造最適化部102eの処理により、MOPAC2000の入力ファイルを作成する(ステップSB−8)。図16は、MOPAC2000の入力ファイルの一例を示す図である。図16に示すように、電荷、近傍アミノ酸残基群の座標データ、最適化フラグなどを含む入力ファイルを作成する。
【0103】
そして、タンパク質構造最適化装置100は、構造最適化部102eの処理により、キャップ用置換基が付加された近傍アミノ酸残基群について、電荷を用いて、特定のアミノ酸残基の原子座標についてMOPAC2000を用いて構造最適化を実行する(ステップSB−9)。ここで、図17は、MOPAC2000による構造最適化処理の結果を示す出力ファイルの一例を示す図である。図17に示すように、構造最適化後の座標データが出力される。なお、図17において、「*」の付いた座標が最適化された部分を示している。
【0104】
そして、タンパク質構造最適化装置100は、原子座標置換部102fの処理により、最適化された原子座標を、初期のタンパク質の座標データ上の対応する原子座標と置換する(ステップSB−10)。すなわち、原子座標置換部102fは、MOPAC2000の処理結果(出力ファイル)の「*」の付いた座標が最適化部分であるため、この部分を抜き出しステップSB−1で用意した座標データの対応する座標部分と置き換える。
【0105】
そして、タンパク質構造最適化装置100は、全てのアミノ酸残基iについてステップSB−3からステップSB−10を適用し(1番目のアミノ酸残基から最後のアミノ酸残基までiをインクリメントしてループ処理を行う。)、全てのアミノ酸残基について最適化を実行する(ステップSB−11)。
【0106】
そして、タンパク質構造最適化装置100は、ステップSB−10において得られた構造データを初期構造として、ステップSB−2からステップSB−7を複数回(n回)実行することにより、更に構造最適化の精度を上げることができる(ステップSB−12)。すなわち、ステップSB−4からステップSB−10の処理をN残基からC端残基まで行うことで、すべてのアミノ酸残基について部分構造が最適化されたPDB形式の座標データが得られる。この座標データを入力として、座標は固定して(すべての原子に対して最適化フラグを設定せずに)MOPACでエネルギー計算を行う。また、上述のステップSB−4からステップSB−10の操作を含むループ処理は、例えばスクリプトプログラムを用いて実行してもよい。
これにて、メイン処理が終了する。
【0107】
[本発明による計算例]
次に、本発明による計算例の詳細について図18および図19などを参照して説明する。本計算例では、サンプル分子として「Japanese Pear S3−Ribonuclease」(PDB ID:1IQQA)を用いて、特定アミノ酸残基を200番目のアミノ酸残基(3262原子 C1047H1619 N285 O300 S11)をした場合である。また、本計算例で使用した計算機の機種名は、COMPAQ(会社名)の「AlphaServer ES40(CPU Alpha 21264 833MHz)」(製品名)である。図18は、従来の最適化手法(MOZYME法+BFGS法)と本発明の手法により水素構造を最適化した場合の計算結果を示す図である。また、図19は、従来の最適化手法(MOZYME法+BFGS法)と本発明の手法により側鎖構造を最適化した場合の計算結果を示す図である。図18および図19において、縦軸は、生成熱Heat of Formation(kcal mol-1)であり、横軸はCPU時間(秒)を示している。また、初期構造のHeat of Formationの値は、−1044.53571kcal・mol-1である。
【0108】
本計算例について計算時間とエネルギー(生成熱)の関係をみると、本発明の手法では、計算時間に対してエネルギーの収束が速く、全体のループを3〜5回繰り返すこと(n=3〜5)で、エネルギーが収束することがわかる。また、計算精度よりも計算時間を優先する場合には、rの値を小さめにとり、その逆に計算精度を求める場合には、rの値を大きめにとることもできる。
【0109】
また、本計算例について必要となる最大メモリ容量をみると、従来の手法では、水素構造最適化を行う場合は、506MB(メガバイト)であり、側鎖構造最適化を行う場合は、667MBであった。一方、本発明の手法では、水素構造最適化を行う場合は、301MBであり、側鎖構造最適化を行う場合は、301MBであった。このように、本発明の手法ではメモリの少量化も図ることができた。
【0110】
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
【0111】
例えば、タンパク質構造最適化装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、タンパク質構造最適化装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
【0112】
また、上述した実施の形態では、半経験的分子軌道プログラムであるMOPAC2000を用いる場合を一例として説明したが、他の既知の計算手法やプログラムを用いてもよい。例えば、分子軌道計算プログラムである「Gaussian 98 Rev. A.11.3」(製品名)(Gaussian, Inc.(会社名),Pittsburg PA, 2002)、「Gamess June 20 2002 R2」(製品名)(Iowa State University, 2002)などのプログラムに置き換えれば、アブイニシオ(ab initio)分子軌道法による構造最適化が可能になる。また、「Amber 7」(製品名)(University of California, 2002)や 、「Tinker 3.7」(製品名)(Washington University School of Medicine,2001)などに置き換えれば、分子力学計算の高速化も可能である。これらのプログラムの入出力データは、MOPAC2000の入力ファイルと座標パラメータの並び方などが異なるだけであるため、「Babel version 1.6」(製品名)(Pat Walters and Matt Stahl, 1996)等のプログラムを用いて容易にMOPAC2000の入出力データと変換することできる。MOPAC2000は半経験的分子軌道プログラムと呼ばれ半定量的な結果が得られる。一方、GaussianやGamessなどは、abinitio分子軌道計算プログラムと呼ばれ半経験的な方法よりも定量的な結果が得られるが、計算時間は半経験的な方法より格段にかかるのが一般的である。
【0113】
また、実施形態において説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
【0114】
また、タンパク質構造最適化装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、タンパク質構造最適化装置100の各部または各装置が備える処理機能、特に制御部102にて行なわれる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。なお、プログラムは、後述する記録媒体に記録されており、必要に応じてタンパク質構造最適化装置100に機械的に読み取られる。
【0115】
すなわち、ROMまたはHDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAM等にロードされることによって実行され、CPUと協働して制御部102を構成する。また、このコンピュータプログラムは、タンパク質構造最適化装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記録されてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
【0116】
また、本発明にかかるプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」や、各種コンピュータシステムに内蔵されるROM、RAM、HD等の任意の「固定用の物理媒体」、あるいは、LAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。
【0117】
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0118】
また、タンパク質構造最適化装置100は、さらなる構成要素として、マウス等の各種ポインティングデバイスやキーボードやイメージスキャナやデジタイザ等から成る入力装置(図示せず)、入力データのモニタに用いる表示装置(図示せず)、システムクロックを発生させるクロック発生部(図示せず)、および、各種処理結果その他のデータを出力するプリンタ等の出力装置(図示せず)を備えてもよく、また、入力装置、表示装置および出力装置は、それぞれ入出力インターフェースを介して制御部102に接続されてもよい。
【0119】
記憶部106に格納される各種のデータベース等(タンパク質構造情報データベース106a〜処理結果ファイル106b)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0120】
また、タンパク質構造最適化装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理端末等の情報処理装置にプリンタやモニタやイメージスキャナ等の周辺装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
【0121】
さらに、タンパク質構造最適化装置100の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。例えば、各データベースを独立したデータベース装置として独立に構成してもよく、また、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。
【0122】
また、ネットワーク300は、タンパク質構造最適化装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネットや、イントラネットや、LAN(有線/無線の双方を含む)や、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、IMT2000方式、GSM方式またはPDC/PDC―P方式等の携帯回線交換網/携帯パケット交換網や、無線呼出網や、Bluetooth等の局所無線網や、PHS網や、CS、BSまたはISDB等の衛星通信網等のうちいずれかを含んでもよい。すなわち、本システムは、有線・無線を問わず任意のネットワークを介して、各種データを送受信することができる。
【0123】
【発明の効果】
以上詳細に説明したように、本発明によれば、タンパク質の座標データを取得し、タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出し、近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加し、キャップ用置換基が付加された近傍アミノ酸残基群の全体の電荷を計算し、キャップ用置換基が付加された近傍アミノ酸残基群について、計算された電荷を用いて特定のアミノ酸残基の原子座標について構造最適化を実行し、最適化された原子座標を、タンパク質の座標データ上の対応する原子座標と置換するので、水素位置の決定やパッキングの問題の解消を、実用的な計算資源を用いて行うことが可能となるタンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体を提供することができる。
【0124】
また、本発明によれば、既存の計算プログラムには一切手を加えずに最適化処理の高速化を図ることができるタンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体を提供することができる。すなわち、既存の分子軌道計算プログラムや、分子力学計算プログラムの入出力ファイルを用いて、本装置を実行することができる。但し、本装置のアルゴリズムを既存の分子軌道計算プログラムや、分子力学計算プログラムに組み込むことも可能である。
【0125】
また、本発明によれば、従来の方法では不可能な溶媒効果を考慮に入れたタンパク質の構造最適化が可能になるタンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体を提供することができる。
【0126】
また、本発明によれば、キャップ用置換基は、水素原子(H)またはメチル基(CH3)であるので、近傍アミノ酸残基群について機械的に座標を切り取ったときの切り口が、ラジカルとなり計算に不都合を生じることを容易に解消することができるタンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体を提供することができる。
【0127】
さらに、本発明によれば、抽出した近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えるので、システイン間のジスルフィド結合を考慮して構造最適化を行うことができるタンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体を提供することができる。
【図面の簡単な説明】
【図1】本発明の基本原理を示すフローチャートである。
【図2】本発明が適用される本システムの構成の一例を示すブロック図である。
【図3】本実施形態における本システムのメイン処理の一例を示すフローチャートである。
【図4】タンパク質の座標データの一例を示す図である。
【図5】本実施形態における切り口に水素原子を付加する場合のキャップ付加処理の一例を示すフローチャートである。
【図6】もとの座標とキャップ置換基を付加した後の座標の概念を示す図である。
【図7】本実施形態における切り口に水素原子を付加する場合のキャップ付加処理の一例を示すフローチャートである。
【図8】もとの座標とキャップ置換基を付加した後の座標の概念を示す図である。
【図9】本実施形態における切り口にメチル基を付加する場合のキャップ付加処理の一例を示すフローチャートである。
【図10】もとの座標とキャップ置換基を付加した後の座標の概念を示す図である。
【図11】本実施形態における切り口にメチル基を付加する場合のキャップ付加処理の一例を示すフローチャートである。
【図12】もとの座標とキャップ置換基を付加した後の座標の概念を示す図である。
【図13】PDB形式データの三文字表記(18−20カラムの文字)でアミノ酸種別を判別する場合の概念を説明する図である。
【図14】アミノ酸残基iの水素原子に最適化フラグを設定する場合の一例を示す図である。
【図15】アミノ酸残基iの水素と側鎖原子に最適化フラグを設定する場合の一例を示す図である。
【図16】MOPAC2000の入力ファイルの一例を示す図である。
【図17】MOPAC2000による構造最適化処理の結果を示す出力ファイルの一例を示す図である。
【図18】従来の最適化手法(MOZYME法+BFGS法)と本発明の手法により水素構造を最適化した場合の計算結果を示す図である。
【図19】従来の最適化手法(MOZYME法+BFGS法)と本発明の手法により側鎖構造を最適化した場合の計算結果を示す図である。
【符号の説明】
100 タンパク質構造最適化装置
102 制御部
102a 座標データ取得部
102b 近傍アミノ酸残基群抽出部
102c キャップ付加部
102d 電荷計算部
102e 構造最適化部
102f 原子座標置換部
104 通信制御インターフェース部
106 記憶部
106a タンパク質構造情報データベース
106b 処理結果ファイル
108 入出力制御インターフェース部
112 入力装置
114 出力装置
200 外部システム
300 ネットワーク

Claims (10)

  1. タンパク質の座標データを取得する座標データ取得手段と、
    上記タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出する近傍アミノ酸残基群抽出手段と、
    上記近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加するキャップ付加手段と、
    上記キャップ付加手段により上記キャップ用置換基が付加された上記近傍アミノ酸残基群の全体の電荷を計算する電荷計算手段と、
    上記キャップ付加手段により上記キャップ用置換基が付加された上記近傍アミノ酸残基群について、上記電荷計算手段により計算された上記電荷を用いて上記特定のアミノ酸残基の原子座標について構造最適化を実行する構造最適化手段と、
    上記構造最適化手段にて最適化された上記原子座標を、上記タンパク質の座標データ上の対応する原子座標と置換する原子座標置換手段と、
    を備えたことを特徴とするタンパク質構造最適化装置。
  2. 上記キャップ用置換基は、水素原子(H)またはメチル基(CH3)であること、
    を特徴とする請求項1に記載のタンパク質構造最適化装置。
  3. 上記近傍アミノ酸残基群抽出手段は、
    抽出した上記近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ上記近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えること、
    を特徴とする請求項1または2に記載のタンパク質構造最適化装置。
  4. タンパク質の座標データを取得する座標データ取得ステップと、
    上記タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出する近傍アミノ酸残基群抽出ステップと、
    上記近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加するキャップ付加ステップと、
    上記キャップ付加ステップにより上記キャップ用置換基が付加された上記近傍アミノ酸残基群の全体の電荷を計算する電荷計算ステップと、
    上記キャップ付加ステップにより上記キャップ用置換基が付加された上記近傍アミノ酸残基群について、上記電荷計算ステップにより計算された上記電荷を用いて上記特定のアミノ酸残基の原子座標について構造最適化を実行する構造最適化ステップと、
    上記構造最適化ステップにて最適化された上記原子座標を、上記タンパク質の座標データ上の対応する原子座標と置換する原子座標置換ステップと、
    を含むことを特徴とするタンパク質構造最適化方法。
  5. 上記キャップ用置換基は、水素原子(H)またはメチル基(CH3)であること、
    を特徴とする請求項4に記載のタンパク質構造最適化方法。
  6. 上記近傍アミノ酸残基群抽出ステップは、
    抽出した上記近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ上記近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えること、
    を特徴とする請求項4または5に記載のタンパク質構造最適化方法。
  7. タンパク質の座標データを取得する座標データ取得ステップと、
    上記タンパク質の座標データについて、特定のアミノ酸残基から所定の距離内に含まれる近傍アミノ酸残基群の座標を抽出する近傍アミノ酸残基群抽出ステップと、
    上記近傍アミノ酸残基群の切り口の部分にキャップ用置換基を付加するキャップ付加ステップと、
    上記キャップ付加ステップにより上記キャップ用置換基が付加された上記近傍アミノ酸残基群の全体の電荷を計算する電荷計算ステップと、
    上記キャップ付加ステップにより上記キャップ用置換基が付加された上記近傍アミノ酸残基群について、上記電荷計算ステップにより計算された上記電荷を用いて上記特定のアミノ酸残基の原子座標について構造最適化を実行する構造最適化ステップと、
    上記構造最適化ステップにて最適化された上記原子座標を、上記タンパク質の座標データ上の対応する原子座標と置換する原子座標置換ステップと、
    を含むタンパク質構造最適化方法をコンピュータに実行させることを特徴とするプログラム。
  8. 上記キャップ用置換基は、水素原子(H)またはメチル基(CH3)であること、
    を特徴とする請求項7に記載のプログラム。
  9. 上記近傍アミノ酸残基群抽出ステップは、
    抽出した上記近傍アミノ酸残基群の中にシステイン(CYS)が含まれている場合には、当該システイン(CYS)とジスルフィド結合をしておりかつ上記近傍アミノ酸残基群には含まれない別のシステイン(CYS)が存在しているか判定し、当該別のシステイン(CYS)が存在する場合には当該別のシステイン(CYS)も近傍アミノ酸残基群に加えること、
    を特徴とする請求項7または8に記載のプログラム。
  10. 上記請求項7から9のいずれか一つに記載されたプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2002371038A 2002-05-31 2002-12-20 タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体 Pending JP2004206171A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002371038A JP2004206171A (ja) 2002-12-20 2002-12-20 タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体
US10/516,133 US20050130224A1 (en) 2002-05-31 2003-06-02 Interaction predicting device
PCT/JP2003/006952 WO2003107218A1 (ja) 2002-05-31 2003-06-02 相互作用予測装置
EP03733232A EP1510943A4 (en) 2002-05-31 2003-06-02 INTERACTION PREDICTION DEVICE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002371038A JP2004206171A (ja) 2002-12-20 2002-12-20 タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体

Publications (1)

Publication Number Publication Date
JP2004206171A true JP2004206171A (ja) 2004-07-22

Family

ID=32810031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002371038A Pending JP2004206171A (ja) 2002-05-31 2002-12-20 タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP2004206171A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100833988B1 (ko) 2006-10-12 2008-05-30 포항공과대학교 산학협력단 다극자 변형 표현을 이용한 단백질 분자 모양의 표현 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100833988B1 (ko) 2006-10-12 2008-05-30 포항공과대학교 산학협력단 다극자 변형 표현을 이용한 단백질 분자 모양의 표현 방법

Similar Documents

Publication Publication Date Title
Jendrusch et al. AlphaDesign: A de novo protein design framework based on AlphaFold
Pertsemlidis et al. Having a BLAST with bioinformatics (and avoiding BLASTphemy)
Pieper et al. MODBASE: a database of annotated comparative protein structure models and associated resources
Yu et al. The effects of organic solvents on the folding pathway and associated thermodynamics of proteins: a microscopic view
EP1510943A1 (en) Interaction predicting device
Tosatto et al. A divide and conquer approach to fast loop modeling
JP2004086862A (ja) タンパク質相互作用情報処理装置、タンパク質相互作用情報処理方法、プログラム、および、記録媒体
Allen et al. Customizable de novo design strategies for DOCK: Application to HIVgp41 and other therapeutic targets
Marsden et al. Comprehensive genome analysis of 203 genomes provides structural genomics with new insights into protein family space
Truong et al. Funneling and frustration in the energy landscapes of some designed and simplified proteins
JP3866210B2 (ja) 個人特定防止装置、個人特定防止方法、および、プログラム
Trevizani et al. Critical features of fragment libraries for protein structure prediction
Fornasari et al. Site-specific amino acid replacement matrices from structurally constrained protein evolution simulations
JP2004206171A (ja) タンパク質構造最適化装置、タンパク質構造最適化方法、プログラム、および、記録媒体
Rudnev et al. Current Approaches in Supersecondary Structures Investigation
Pierri et al. Lattices for ab initio protein structure prediction
Martínez-Castilla et al. A score of the ability of a three-dimensional protein model to retrieve its own sequence as a quantitative measure of its quality and appropriateness
Tao et al. Efficient 3D conformer generation of cyclic peptides formed by a disulfide bond
Nadaradjane et al. Docking proteins and peptides under evolutionary constraints in Critical Assessment of PRediction of Interactions rounds 38 to 45
Nguyen Complexity of free energy landscapes of peptides revealed by nonlinear principal component analysis
Tao et al. Docking cyclic peptides formed by a disulfide bond through a hierarchical strategy
Roche et al. Hybridized distance-and contact-based hierarchical structure modeling for folding soluble and membrane proteins
Ruiz-Gonzalez et al. Proteasome-related HslU and HslV genes typical of eubacteria are widespread in eukaryotes
Neelamraju et al. Chiral effects on helicity studied via the energy landscape of short (d, l)-alanine peptides
Segura et al. CAPS-DB: a structural classification of helix-capping motifs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081104