JP2006171982A - タンパク質の立体構造探索方法、立体構造探索用コンピュータプログラムおよび立体構造探索装置 - Google Patents
タンパク質の立体構造探索方法、立体構造探索用コンピュータプログラムおよび立体構造探索装置 Download PDFInfo
- Publication number
- JP2006171982A JP2006171982A JP2004361519A JP2004361519A JP2006171982A JP 2006171982 A JP2006171982 A JP 2006171982A JP 2004361519 A JP2004361519 A JP 2004361519A JP 2004361519 A JP2004361519 A JP 2004361519A JP 2006171982 A JP2006171982 A JP 2006171982A
- Authority
- JP
- Japan
- Prior art keywords
- dimensional structure
- protein
- radial distribution
- fragment
- searching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 83
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims description 61
- 238000004590 computer program Methods 0.000 title claims description 13
- 239000012634 fragment Substances 0.000 claims abstract description 95
- 238000000342 Monte Carlo simulation Methods 0.000 claims abstract description 30
- 238000004364 calculation method Methods 0.000 claims abstract description 30
- 238000013459 approach Methods 0.000 claims description 10
- 238000013467 fragmentation Methods 0.000 claims description 6
- 238000006062 fragmentation reaction Methods 0.000 claims description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 238000005315 distribution function Methods 0.000 description 6
- 238000004836 empirical method Methods 0.000 description 3
- 238000004215 lattice model Methods 0.000 description 3
- 238000000547 structure data Methods 0.000 description 3
- 235000019687 Lamb Nutrition 0.000 description 1
- 238000000367 ab initio method Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 238000001956 neutron scattering Methods 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 タンパク質の確からしい立体構造を効率的に探索することを可能とするタンパク質の立体構造探索技術を提供する。
【解決手段】 タンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定し、このタンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割し、上記決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用し、動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が真の動径分布に近づくように、各フラグメントの立体構造を最適化する。
【選択図】 図4
【解決手段】 タンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定し、このタンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割し、上記決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用し、動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が真の動径分布に近づくように、各フラグメントの立体構造を最適化する。
【選択図】 図4
Description
本発明は、連結構造データの分かっているタンパク質の立体構造を探索する方法に関する。
連結構造データの分かっているタンパク質の立体構造を探索する方法としては、そのエネルギー的側面に注目して、配列の指定されたペプチド鎖の自由エネルギー最小の立体構造を求める方法がある。
このうち、経験的な方法としてはホモロジーモデリングや3D−1D法などがあげられる。これらの方法は、予測すべき立体構造に類似の立体構造がすでに実験的に解かれていない場合には適用することができない。
このような制限のない非経験的な方法としては、シンプルなモデルを用いて明快かつ厳密な理論的解析を目指す格子モデル法、本来はタンパク質の動力学的性質を調べるためのモレキュラーダイナミクス法(MD法)、統計力学的性質を調べるためのモンテカルロ法(MC法)等を折り畳みシミュレーションに応用したもの等があげられる。
格子モデル法はタンパク質の立体構造をより単純な格子モデルに置き換え、様々なエネルギー計算やMC法と組み合わせてシミュレーションを行う方法であって、理論的扱いが他の方法と比較して容易である。
MD法は、単純化されたモデルではない実際の分子立体構造に忠実なモデルを用いるシミュレーション方法であり、ニュートン力学に基づいたシミュレーションにより、タンパク質を含む系がとりうるエネルギーの低い立体構造を求める。
MC法(たとえば特許文献1および非特許文献1参照)も、単純化されたモデルではない実際の分子立体構造に忠実なモデルを用いるシミュレーション方法であり、計算上で分子を人為的に変形させそのエネルギー変化に応じて立体構造を変えていく。この分子変形は 現実とは必ずしも対応しないという意味では欠点となっているが、この変形によって自由エネルギーの低い立体構造の探索を素早く、広範囲に行えるという意味では利点となっている。
特開2003−206246号公報(特許請求の範囲)
ハンスマン(Hansmann)・U・H・E,オカモト・Y,「タンパク質折り畳み構造に関する新モンテカルロ法アルゴリズム。構造生物学の最近の見解(New Monte Carlo algorithms for protein folding. Current Opinion in Structural Biology)」,199年,第9巻,p.177−183
これらの非経験的な方法は、いずれもペプチド鎖の自由エネルギー最小の立体構造を求めるものであるが、この自由エネルギーは理論計算に基づくものであり、実際のエネルギー極小点と一致する保証はない。しかも、実際の立体構造にはエネルギー極小点が多数存在するものと考えられ、これらの方法で立体構造を決定しようとする場合、理論計算では非常に多くの候補が挙げられてしまうことが多い。
本発明は、この問題を解決し、立体構造をより推定しやすい非経験的方法を提供することを目的としている。本発明のさらに他の目的および利点は、以下の説明から明らかになるであろう。
本発明の一態様によれば、タンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定し、このタンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割し、上記決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用し、動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が真の動径分布に近づくように、各フラグメントの立体構造を最適化するタンパク質の立体構造探索方法が提供される。
本発明の他の一態様によれば、コンピュータに、入力されたタンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定する手順と、このタンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割する手順と、上記決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用する手順と、入力された動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が真の動径分布に近づくように、各フラグメントの立体構造を最適化する手順とを含む手順を実行させるための、タンパク質の立体構造探索用コンピュータプログラムが提供される。
本発明の更に他の一態様によれば、タンパク質の連結構造、立体構造が既知な部分および動径分布の実験値を含む探索条件を入力する入力部と、立体構造の探索に使用するための立体構造既知部分を決定し、上記タンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割する入力処理部と、上記決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用して、動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が真の動径分布に近づくように、各フラグメントの立体構造を最適化する計算部とを含む、タンパク質の立体構造探索装置が提供される。
本発明の諸態様により、タンパク質の確からしい立体構造を効率的に探索することが可能となる。
上記いずれの態様においても、フラグメントの少なくともいずれか二つが、隣接するフラグメントと重複する部分を有するように、フラグメントへの分割を行うこと、フラグメントへの分割をランダムに決定すること、フラグメントへの分割を複数回行うこと、逆モンテカルロ法において、ペプチド構造の二面角ψおよび二面角φを変数として使用すること、が好ましい。
本発明により、タンパク質の確からしい立体構造を効率的に探索することが可能となる。
以下に、本発明の実施の形態を図、実施例等を使用して説明する。なお、これらの図、実施例等および説明は本発明を例示するものであり、本発明の範囲を制限するものではない。本発明の趣旨に合致する限り他の実施の形態も本発明の範疇に属し得ることは言うまでもない。
本発明に係るタンパク質の立体構造探索方法では、タンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定し、このタンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割し、上記決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用し、動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が真の動径分布に近づくように、各フラグメントの立体構造を最適化する。
このようにして、実験データおよびタンパク質の既知構造情報をもとに、確からしい立体構造を効率的に精度よく探索することが可能となる。
一般に、乱数発生によって初期立体構造モデルを生成して逆モンテカルロ法で実験データを再現するような立体構造モデルを探索していくことは、タンパク質のような複雑な形状を持った数千個原子のものでは不可能であった。これに対し、本発明では、上記に述べたように実験データを真として、この真の値とモデルの値との差を小さくするように立体構造モデルを探索することで効率的に最適化された立体構造が得られる。
なお、本発明において「タンパク質の連結構造」とはタンパク質分子を構成する各原子の繋がる順序を意味する。結合手の長さおよび結合角が判明している場合が多いので、通常、これらも含めたものをタンパク質の連結構造とするが、不明の場合には、これらの因子をタンパク質の連結構造には含めず、逆モンテカルロ法を実施する場合の変数として扱うこともできる。
また、上記において、立体構造既知部分とは、その構造部分を含む、任意の構造体中でその構造部分の立体構造が既知であることを意味するものであり、検討対象であるタンパク質中の構造として既知であることを条件とするものではない。このことを図1を使用して説明する。図1の(a)では、タンパク質の連結構造を一本の線で表している。この内、Xの部分については、たとえば、図1の(b)のように両端に−NH2と−COOHとを持つ構造について、その立体構造が知られていたとするとき、Xを立体構造既知部分と見なし、図1の(b)のXの部分の立体構造を、検討対象のタンパク質のX部分の初期条件として採用するのである。
本発明においては、このような立体構造を全て採用する必要はなく、収集された立体構造既知部分についての情報の中から立体構造の探索に実際に使用するための立体構造既知部分を選択決定して使用する。その決定方法については特に制限はなく、任意の方法を採用することができる。タンパク質によっては、更に別の分子または構造部分の一部としてX部分の立体構造が既知な場合もあり得る。このような場合は、そのいずれを採用するかも、任意に定めることができる。一般的に言えば、検討対象の連結構造との類似性の高い分子または構造部分のデータを採用することが好ましい。同一の個所について複数の立体構造を採用することもできる。
動径分布の実験値を真の動径分布として採用することにより、非経験的な方法であっても、実際に即した立体構造を迅速に探索することが可能となる。また、動径分布は一義的に定まり、エネルギー極小点のように複数の値を取らないため、この点でも立体構造を迅速に探索することが可能となる。動径分布の計算の基礎となる「与えられた各フラグメントの立体構造」は、最初は、初期状態の立体構造であり、その後は逆モンテカルロ法によって与えられる。
図2に本発明の原理図を示す。まず、図2の(a)のA,B,C,・・・に示すように、立体構造の探索に使用するための立体構造既知部分を決め、求めたいタンパク質の連結構造情報に対して、タンパク質の一分子をこれらの立体構造既知部分を含むフラグメントに分割する。この際、どのようにフラグメントに分割するかは任意に定めることができる。何らかの規則に従って自動的に分割してもよい。またランダムに行ってもよい。ランダムに行う方が、逆モンテカルロ法による探索がよりスムーズに行く場合が多い。一つのフラグメント中に含まれる立体構造既知部分は1個でも複数個でもよい。また立体構造既知部分を含まないフラグメントが存在していてもよい。
フラグメントへの分割は、一分子の全体について、一度におこなっても、フラグメントの立体構造の最適化を図りつつ、次のフラグメントの大きさを決めても、その他のどのような方法を採用してもよい。
また隣り合うフラグメントが重複する部分を有するようになっていてもよい。このようにするとセグメント同士の接続をより実状に近い状態として推定することができる。
なお、一般的には、検討対象であるタンパク質の一分子の全部をフラグメント化するが、部分的にフラグメント化しない部分を残してもよい。たとえば、検討対象であるタンパク質の一部として、立体構造が既知な部分あるいは立体構造がほぼ確実に解析されていると思われる部分については、フラグメント化せず、逆モンテカルロ法を実行する際に立体構造を固定しておいてもよい。
フラグメントへの分割は一種類に固定しておく必要はなく、逆モンテカルロ法を行う際に、新たな分割条件に変更することも可能である。分割条件の変更は、本発明に係るコンピュータプログラムにより自動的に行うこともできる。複数回分割を行うことで、最終的に得られる立体構造モデルの信頼性が向上する場合が多い。
フラグメントへの分割を複数回行うやり方も任意に定めることができる。一分子の全体のフラグメントを一時に変更しても、一部ずつ変更しても、その他のどのような方法を採用してもよい。
次に、立体構造の探索に使用するための立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用して、初期の立体構造を構築する。図2の(b)は、一分子の初期の立体構造を模式的に表した部分図である。この例では、立体構造既知部分以外は一分子の主鎖が一平面上にある状態を模式的に表している。
一方、中性子散乱等の実験結果を解析して得られた動径分布関数を真の動径分布関数として採用する。本発明では、図2の(c)に示すように、逆モンテカルロ法を用いて、与えられた立体構造から計算によって求められる動径分布関数が真の動径分布に近づくように、各フラグメントの立体構造を最適化する。すなわち、計算された動径分布関数と真の動径分布関数とを比較する。そして、この一連の操作を十分な収束が得られるまで繰り返して、図2の(d)に示すように確からしい立体構造の構造モデルを生成する。
所与の立体構造から動径分布関数を求める方法については、公知のどのような方法を採用してもよい。たとえば次のようにして計算できる。
このような立体構造探索方法は、コンピュータに、入力されたタンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定する手順と、このタンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割する手順と、上記決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用する手順と、入力された動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が真の動径分布に近づくように、各フラグメントの立体構造を最適化する手順とを含む手順を実行させるための、タンパク質の立体構造探索用コンピュータプログラムを使用して、コンピュータに行わせることができる。
また、上記のようにしてタンパク質の立体構造の探索を実行するためには、タンパク質の立体構造探索装置を使用することができる。この装置には、タンパク質の連結構造、立体構造が既知な部分および動径分布の実験値を含む探索条件を入力する入力部と、立体構造の探索に使用するための立体構造既知部分を決定し、上記タンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割する入力処理部と、上記決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用して、動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が真の動径分布に近づくように、各フラグメントの立体構造を最適化する計算部とが含まれる。
この様子を図5にブロック図として示してある。計算部には、図5に示すように、フラグメントを記憶するためのフラグメント記憶部、初期、中間および最終の立体構造を記憶しておくための構造データ記憶部、入力情報、中間情報、その他の諸情報を記憶するための各種記憶部や、タンパク質分子をフラグメントに分割するためのフラグメント分割処理部、どのフラグメントについて、逆モンテカルロ法によるシミュレーションを行うかを決めるフラグメント選択部、動径分布を計算するための動径分布計算部、計算された動径分布を真の動径分布と比較し、その差が充分小さくなったかどうかを判定するための比較判定部、逆モンテカルロ法によるシミュレーションを何回行ったかを判定するステップ数計数部、スィープ数計数部等を設けることができる。
これらの各部は独立に存在している必要はなく、一つの部で複数の機能を有していてもよい。なお、本発明では、一つのフラグメントについて、二面角ψとφとをいくつのグループに分けてシミュレーションを行う場合のそのグループ数と、一分子全体についてシミュレーションを行う場合のフラグメント数を掛け合わせたものを1モンテカルロステップと呼ぶ。
また、探索結果や中間および最終の立体構造を出力するための出力処理部および出力部が付設されていてもよい。
上記の好ましい方法を実行するためには、フラグメントの少なくともいずれか二つが、隣接するフラグメントと重複する部分を有するようにすること、フラグメントへの分割をランダムに決定すること、およびフラグメントへの分割を複数回行うことが可能であることが好ましいが、いずれもコンピュータプログラムにそのようなステップを設けることにより、あるいは、計算部にそのような機能を与えることにより、容易に実現することができる。
この様子を図4,5を使用して説明する。なお、この説明はあくまで例示的なものであり、他の方法を採用してもよいことは言うまでもない。図4は、本発明に係る方法を行うためのフローチャートであり、図5は、本発明に係るタンパク質の立体構造探索装置のブロック図である。
まず、図4のステップS1に従って、図5の入力部に探索条件を入力する。たとえば、タンパク質の連結構造、立体構造既知部分の情報および動径分布の実験値を含む探索条件を入力する。
例えば、タンパク質の連結構造の情報として、原子間の結合距離および結合角を入力する。また二面角φ,ψ,ωの内のωを既知のデータとして入力する。また、立体構造既知部分の情報としては、たとえば、原子間の結合距離、結合角、二面角φ,ψ,ωを入力する。
このほか、モンテカルロ法における条件を入力することも必要である。この例では、結合角と主鎖の二面角ωを固定し、二面角φとψとを変化させる。たとえば10°ずつ変化させることが多いがその他の条件であってもよい。さらに、フラグメントへの分割を行う条件やどの立体構造既知部分の立体構造を採用するかの情報、立体構造既知部分以外の部分の初期の立体構造条件等を含めることも有用である。
ついで、図4のステップS2に従って、図5の入力処理部で、立体構造の探索に使用するための立体構造既知部分を決定し、タンパク質の連結構造を、上記決定された立体構造既知部分を含むフラグメントに分割する。
ついで、あるフラグメントについて、図5の計算部で、図4のステップS3に従って、決定された立体構造既知部分についてはその立体構造を初期状態として採用し、その他の部分については任意の立体構造を初期状態として採用する。立体構造は、具体的には、例えば、原子間の結合距離、結合角、二面角φ,ψ,ωで定義される。
次に、図4のステップS4に従って、各フラグメントの立体構造から計算によって動径分布を求め、図4のステップS5に従って、上記動径分布の実験値と比較する。そして、二面角φとψとをランダムに変化させて、各フラグメントの立体構造を変え、このようにして与えられた各フラグメントの立体構造から計算によって得られた動径分布が動径分布の実験値に対し一定の条件を満たすようになるまで探索を続ける。たとえば、計算によって得られた動径分布と動径分布の実験値との差が一定値以下になるまで、あるいは計算によって得られた動径分布が動径分布の実験値に向けて収束するまで探索を続ける。
具体的には、たとえば、図4のステップS6に従って、計算によって得られた動径分布が動径分布の実験値に対し収束しているかどうかを判定し、NOであれば、図4のステップS7に従って、フラグメント内に1以上存在する二面角φとψとをランダムに変化させて、各フラグメントの立体構造を変え、図4のステップS4に戻って、各フラグメントの立体構造から計算によって動径分布を求める。
ステップS6でYESであれば、そのフラグメントの立体構造について探索が完了したものとして、次のフラグメントについて同様の探索を行う。
このようにして、実験データおよびタンパク質の既知構造情報をもとに、確からしい立体構造を効率的に探索することが可能となる。なお、全フラグメントについて、計算によって得られた動径分布が動径分布の実験値に向けて収束した後、あるいはその途中で、フラグメントの分割条件を変更してもよい。この変更は外部から入力することによって行ってもよく、タンパク質の立体構造探索装置が自動的に行うようにプログラムされていてもよい。
なお、上記に開示した内容から、下記の付記に示した発明が導き出せる。
(付記1)
タンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定し、
当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割し、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用し、
動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する
タンパク質の立体構造探索方法。
タンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定し、
当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割し、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用し、
動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する
タンパク質の立体構造探索方法。
(付記2)
前記フラグメントの少なくともいずれか二つが、隣接するフラグメントと重複する部分を有するように、前記フラグメントへの分割を行う、付記1に記載のタンパク質の立体構造探索方法。
前記フラグメントの少なくともいずれか二つが、隣接するフラグメントと重複する部分を有するように、前記フラグメントへの分割を行う、付記1に記載のタンパク質の立体構造探索方法。
(付記3)
フラグメントへの分割をランダムに決定する、付記1または2に記載のタンパク質の立体構造探索方法。
フラグメントへの分割をランダムに決定する、付記1または2に記載のタンパク質の立体構造探索方法。
(付記4)
前記フラグメントへの分割を複数回行う、付記1〜3のいずれかに記載のタンパク質の立体構造探索方法。
前記フラグメントへの分割を複数回行う、付記1〜3のいずれかに記載のタンパク質の立体構造探索方法。
(付記5)
前記逆モンテカルロ法において、ペプチド構造の二面角ψおよび二面角φを変数として使用する、付記1〜4のいずれかに記載のタンパク質の立体構造探索方法。
前記逆モンテカルロ法において、ペプチド構造の二面角ψおよび二面角φを変数として使用する、付記1〜4のいずれかに記載のタンパク質の立体構造探索方法。
(付記6)
コンピュータに、
入力されたタンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定する手順と、
当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割する手順と、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用する手順と、
入力された動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する手順と
を含む手順を実行させるための、タンパク質の立体構造探索用コンピュータプログラム。
コンピュータに、
入力されたタンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定する手順と、
当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割する手順と、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用する手順と、
入力された動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する手順と
を含む手順を実行させるための、タンパク質の立体構造探索用コンピュータプログラム。
(付記7)
前記フラグメントに分割する手順において、前記フラグメントの少なくともいずれか二つが、隣接するフラグメントと重複する部分を有するように分割が行われる、付記6に記載のコンピュータプログラム。
前記フラグメントに分割する手順において、前記フラグメントの少なくともいずれか二つが、隣接するフラグメントと重複する部分を有するように分割が行われる、付記6に記載のコンピュータプログラム。
(付記8)
前記フラグメントに分割する手順において、フラグメントへの分割がランダムに決定される、付記6または7に記載のコンピュータプログラム。
前記フラグメントに分割する手順において、フラグメントへの分割がランダムに決定される、付記6または7に記載のコンピュータプログラム。
(付記9)
前記フラグメントに分割する手順において、フラグメントへの分割が複数回行われる、付記6〜8のいずれかに記載のコンピュータプログラム。
前記フラグメントに分割する手順において、フラグメントへの分割が複数回行われる、付記6〜8のいずれかに記載のコンピュータプログラム。
(付記10)
前記逆モンテカルロ法において、ペプチド構造の二面角ψおよび二面角φが変数として使用される、付記6〜9のいずれかに記載のコンピュータプログラム。
前記逆モンテカルロ法において、ペプチド構造の二面角ψおよび二面角φが変数として使用される、付記6〜9のいずれかに記載のコンピュータプログラム。
(付記11)
タンパク質の連結構造、立体構造が既知な部分および動径分布の実験値を含む探索条件を入力する入力部と、
立体構造の探索に使用するための立体構造既知部分を決定し、当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割する入力処理部と、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用して、当該動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する計算部と
を含む、タンパク質の立体構造探索装置。
タンパク質の連結構造、立体構造が既知な部分および動径分布の実験値を含む探索条件を入力する入力部と、
立体構造の探索に使用するための立体構造既知部分を決定し、当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割する入力処理部と、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用して、当該動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する計算部と
を含む、タンパク質の立体構造探索装置。
(付記12)
前記入力処理部が、前記フラグメントの少なくともいずれか二つが隣接するフラグメントと重複する部分を有するように、前記フラグメントへの分割を行う、付記11に記載のタンパク質の立体構造探索装置。
前記入力処理部が、前記フラグメントの少なくともいずれか二つが隣接するフラグメントと重複する部分を有するように、前記フラグメントへの分割を行う、付記11に記載のタンパク質の立体構造探索装置。
(付記13)
前記入力処理部が、フラグメントへの分割をランダムに決定する、付記11または12に記載のタンパク質の立体構造探索装置。
前記入力処理部が、フラグメントへの分割をランダムに決定する、付記11または12に記載のタンパク質の立体構造探索装置。
(付記14)
前記入力処理部が、前記フラグメントへの分割を複数回行う、付記11〜13のいずれかに記載のタンパク質の立体構造探索装置。
前記入力処理部が、前記フラグメントへの分割を複数回行う、付記11〜13のいずれかに記載のタンパク質の立体構造探索装置。
(付記15)
前記計算部が、前記逆モンテカルロ法において、ペプチド構造の二面角ψおよび二面角φを変数として使用する、付記11〜14のいずれかに記載のタンパク質の立体構造探索装置。
前記計算部が、前記逆モンテカルロ法において、ペプチド構造の二面角ψおよび二面角φを変数として使用する、付記11〜14のいずれかに記載のタンパク質の立体構造探索装置。
Claims (5)
- タンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定し、
当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割し、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用し、
動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する
タンパク質の立体構造探索方法。 - 前記フラグメントの少なくともいずれか二つが、隣接するフラグメントと重複する部分を有するように、前記フラグメントへの分割を行う、請求項1に記載のタンパク質の立体構造探索方法。
- フラグメントへの分割をランダムに決定する、請求項1または2に記載のタンパク質の立体構造探索方法。
- コンピュータに、
入力されたタンパク質の連結構造の内、立体構造の探索に使用するための立体構造が既知な部分を決定する手順と、
当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割する手順と、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用する手順と、
入力された動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する手順と
を含む手順を実行させるための、タンパク質の立体構造探索用コンピュータプログラム。 - タンパク質の連結構造、立体構造が既知な部分および動径分布の実験値を含む探索条件を入力する入力部と、
立体構造の探索に使用するための立体構造既知部分を決定し、当該タンパク質の連結構造を、当該決定された立体構造既知部分を含むフラグメントに分割する入力処理部と、
当該決定された立体構造既知部分についてはその立体構造を初期状態として採用し、他の部分については任意の立体構造を初期状態として採用して、当該動径分布の実験値を真の動径分布とし、逆モンテカルロ法を用いて、与えられた各フラグメントの立体構造から計算によって求められる動径分布が当該真の動径分布に近づくように、各フラグメントの立体構造を最適化する計算部と
を含む、タンパク質の立体構造探索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004361519A JP2006171982A (ja) | 2004-12-14 | 2004-12-14 | タンパク質の立体構造探索方法、立体構造探索用コンピュータプログラムおよび立体構造探索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004361519A JP2006171982A (ja) | 2004-12-14 | 2004-12-14 | タンパク質の立体構造探索方法、立体構造探索用コンピュータプログラムおよび立体構造探索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006171982A true JP2006171982A (ja) | 2006-06-29 |
Family
ID=36672685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004361519A Withdrawn JP2006171982A (ja) | 2004-12-14 | 2004-12-14 | タンパク質の立体構造探索方法、立体構造探索用コンピュータプログラムおよび立体構造探索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006171982A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016153988A (ja) * | 2015-02-20 | 2016-08-25 | 富士通株式会社 | 情報処理装置、シミュレーションプログラムおよびシミュレーション方法 |
JP2020042576A (ja) * | 2018-09-11 | 2020-03-19 | 富士通株式会社 | 化合物探索装置、化合物探索方法、及び化合物探索プログラム |
-
2004
- 2004-12-14 JP JP2004361519A patent/JP2006171982A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016153988A (ja) * | 2015-02-20 | 2016-08-25 | 富士通株式会社 | 情報処理装置、シミュレーションプログラムおよびシミュレーション方法 |
JP2020042576A (ja) * | 2018-09-11 | 2020-03-19 | 富士通株式会社 | 化合物探索装置、化合物探索方法、及び化合物探索プログラム |
JP7139805B2 (ja) | 2018-09-11 | 2022-09-21 | 富士通株式会社 | 化合物探索装置、化合物探索方法、及び化合物探索プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Analysis of deep learning methods for blind protein contact prediction in CASP12 | |
Simonsen et al. | Rapid neighbour-joining | |
CN106295250B (zh) | 二代测序短序列快速比对分析方法及装置 | |
Yang et al. | Free energy simulations: use of reverse cumulative averaging to determine the equilibrated region and the time required for convergence | |
JP5493597B2 (ja) | 検索方法及び検索システム | |
JP2009528604A (ja) | 第一のコンピュータ援用3dモデルを第二のコンピュータ援用3dモデルと比較するための方法 | |
JP5403999B2 (ja) | トンネリング及びスライシング・ベースのbmc分解のためのシステム及び方法 | |
Molloy et al. | NJMerge: a generic technique for scaling phylogeny estimation methods and its application to species trees | |
Acar et al. | Adaptive inference on general graphical models | |
Rytsareva et al. | Parallel algorithms for clustering biological graphs on distributed and shared memory architectures | |
Elmsallati et al. | Index-based network aligner of protein-protein interaction networks | |
Oliveira Jr et al. | Visualization of protein folding funnels in lattice models | |
CN107567641B (zh) | 用于识别复制品的系统和方法 | |
Davidson et al. | Efficient quartet representations of trees and applications to supertree and summary methods | |
JP6500698B2 (ja) | 組み合わせ計算によるイベント駆動ソフトウェアのイベント・シーケンス構築 | |
JP2006171982A (ja) | タンパク質の立体構造探索方法、立体構造探索用コンピュータプログラムおよび立体構造探索装置 | |
JP2010257297A (ja) | 分子安定構造探索装置、分子安定構造探索プログラム、および分子安定構造探索方法 | |
Yang et al. | Large-scale metagenomic sequence clustering on map-reduce clusters | |
Weinbub et al. | Comparison of the parallel fast marching method, the fast iterative method, and the parallel semi-ordered fast iterative method | |
Estrada et al. | Reengineering high-throughput molecular datasets for scalable clustering using MapReduce | |
EP3959720B1 (en) | Method of aligning strings of characters representing genomic data and related hardware device | |
João et al. | On using consistency consistently in multiple sequence alignments | |
Alves et al. | Finding all maximal contiguous subsequences of a sequence of numbers in O (1) communication rounds | |
Milicchio et al. | Hercool: high-throughput error correction by oligomers | |
Eyal et al. | Improved maintenance of molecular surfaces using dynamic graph connectivity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080304 |