JP4209334B2 - 3次元分子構造の最適モデルを構築する方法及びシステム - Google Patents

3次元分子構造の最適モデルを構築する方法及びシステム Download PDF

Info

Publication number
JP4209334B2
JP4209334B2 JP2003579155A JP2003579155A JP4209334B2 JP 4209334 B2 JP4209334 B2 JP 4209334B2 JP 2003579155 A JP2003579155 A JP 2003579155A JP 2003579155 A JP2003579155 A JP 2003579155A JP 4209334 B2 JP4209334 B2 JP 4209334B2
Authority
JP
Japan
Prior art keywords
value
conformation
molecule
parameter
mols
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003579155A
Other languages
English (en)
Other versions
JP2005524129A (ja
Inventor
エヌ ゴーサム
ケー ベンガデサン
Original Assignee
カウンシル・オブ・サイエンティフィック・アンド・インダストリアル・リサーチ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by カウンシル・オブ・サイエンティフィック・アンド・インダストリアル・リサーチ filed Critical カウンシル・オブ・サイエンティフィック・アンド・インダストリアル・リサーチ
Publication of JP2005524129A publication Critical patent/JP2005524129A/ja
Application granted granted Critical
Publication of JP4209334B2 publication Critical patent/JP4209334B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Peptides Or Proteins (AREA)
  • Complex Calculations (AREA)

Description

本発明は、化学構造の知識からポテンシャルエネルギー関数の最低値に対応する分子構造の3次元モデルを構築する方法に関する。本発明は、ペプチド、タンパク質、ヌクレオチド、核酸、抗生物質、糖類などに限らず、これらを含むすべての分子の3次元構造モデル構築に用いる方法を明記する。本システムは相互直交ラテン方格を使用し立体配座空間(conformational space)を探索して最良の立体配座(conformation)を得る。本システムは生物分子構造に関するものに限らずすべての関数の最適化を得るのに使用することも可能である。本方法はコンピュータに組込まれ、このシステムも本発明を形成する。
特許文献1はモデルタンパク質の3次元構造をモデル化するコンピュータシステムの方法を開示している。このモデル化は、テンプレートタンパク質の3次元構造とテンプレートタンパク質及びモデルタンパク質のアミノ酸配列とに基づいている。モデルタンパク質の各アミノ酸に対して、テンプレートタンパク質がモデルタンパク質のアミノ酸と一致する配列のアミノ酸を有するとき、モデルタンパク質のアミノ酸と一致するアミノ酸のバックボーンの原子位置が、テンプレートタンパク質のアミノ酸配列のバックボーンの原子に位相的に対応する位置に基づいて確定される。しかしながら、この方法はモデルタンパク質の構造が既に知られているときにのみ使用できる。そのため、オリゴペプチドのような小さな分子や、核酸、糖類、抗生物質及び他の有機分子のような化学的に異なる分子には適用できない。タンパク質の構造の場合でさえ、この方法は始めてのタンパク質、即ち、最初にモデル構造のない場合の構造の決定には適用できない。
特許文献2は定量的にタンパク質の設計及び最適化を行う装置と方法に関する。この方法は既知のタンパク質バックボーン構造を受け取り、Dead−End Elimination methodを用いて側鎖の構造を構築する。この方法も上述のようにモデルタンパク質の構造が既に知られているときにのみ使用できる。それゆえ、オリゴペプチドのような小さな分子や、核酸、糖類、抗生物質及び他の有機分子のような化学的に異なる分子には適用できない。タンパク質の構造の場合でさえ、この方法は始めてのタンパク質構造の決定には適用できない、即ち、最初にモデル構造のない場合は既知なバックボーン構造のタンパク質を必要とするこの方法は使用できない。
文献1は相互直交ラテン方格の定義をそれを構成する方程式と共に教示する組合せ理論数学のテキストブックである。しかしながら、その方程式をいかにコンピュータプログラムに組入れるかについては説明がない。また、ポテンシャルエネルギー関数を含むすべての関数の最良値を見出すために相互直交ラテン方格(MOLS)を使用する方法についても述べておらず、分子構造の三次元構造を決定する方法についても述べていない。MOLSを構成するためにいかに記号を配分するかを記すのみで、記号を関数を定義するパラメータの値に置換する方法に付いては記載していない。更に、MOLSを構成した後の解析する計算についても記載していない。
文献2も相互直交ラテン方格の定義とそれを構成する方程式とを教示する組合せ理論数学の他のテキストブックである。しかしながら、方程式をコンピュータプログラムにする方法に付いては記載がない。また、ポテンシャルエネルギー関数を含むすべての関数の最良値を見出すために相互直交ラテン方格(MOLS)を使用する方法についても述べていず、分子構造の三次元構造を決定する方法についても述べていない。MOLSを構成するためにいかに記号を配分するかを記すのみで、記号を関数を定義するパラメータの値に置換する方法に付いては記載していない。更に、MOLSを構成した後の解析する計算についても記載していない。
文献3は農業や製薬の実験に相互直交ラテン方格を用いる方法を教示する実験計画に関するテキストブックである。しかしながら、これにはいかにMOSLを構成するかの記載はなく、それを行うコンピュータプログラムの明記もなく、分子構造の決定へのいかなる応用に関しても、関数の最良値を見出すための応用に関しても記載はない。このテキストブックに述べられている各副方格の解析計算は本発明に使用されるものより複雑である。
文献4はタンパク質分子構造を予言する遺伝子アルゴリズムの応用について記載している。しかしながら、この方法は始めての分子構造の予言については記載がない。即ち、2次的構造についての先駆情報がない場合はこの方法は使用できない。更に、この方法は如何なる形式のMOLSをも計算に用いていない。文献5は構造の予言にMOLSを使用する可能性についての極めて予備的な報告書である。しかしこの方法は未成熟であり適切に系統だてられてはいない。MOLSを予言する如何なる方程式も具体化されておらず、MOLSの記号をいかにして変数の値と関連させるかについての説明もない。副方格における計算値の解析に用いる方法についても説明はない。ペンタペプチドに応用していない。
文献6はタンパク質の構造を予言する構築方法を開示している。この方法は近範囲の相互作用の優勢に関連して近似探索を行う。このように徹底的なエネルギー最小化方法によって短鎖のlocal minimaを見出す。エネルギー最小化されるべく、各ステップにおいてストアされる鎖の構造の数は指数関数的に増加する。この方法では20のアミノ酸残基のポリペプチド鎖については収拾不能になってしまう。更に、この方法におけるMOLSの使用については如何なる形式においてもまったく記載はない。文献7は、ペプチド類の生来の構造における双極子は全分子とそれを取り巻く溶媒とにより発生する電界にほぼ最適の配向を有するという思想に基づくハートリーの方法(Self−Consistent Electrostatic Field)の使用について開示している。この方法は他のすべてのエネルギー条件は使用しない。静電界についてのみ説明している。これはペプチドのような小さい分子に適用することはできない。更に、この方法におけるMOLSの使用については如何なる形式においてもまったく記載はない。
文献8は、local minimaを見出す従来のエネルギー最小化と全組合せ最適化におけるメトロポリス・モンテ・カルロ法とを結合した、ポリペプチドとタンパク質の全最適化への確率的アプローチを開示している。これは決定的な探索方法ではなく、常に最良の構造を保証しない。更に、多大な計算を必要とし計算機の使用時間において非常に高価となる。この方法におけるMOLSの使用については如何なる形式においてもまったく記載はなく、本発明の方法とは異なる。文献9はポリペプチドの構造の超曲面を探索する反復方法を開示する。これも決定的な探索方法ではなく、常に最良の構造を保証しない。更に、多大な計算を必要とし計算機の使用時間において非常に高価となる。この方法におけるMOLSの使用については如何なる形式においてもまったく記載はない。
文献10は、次第に消失する浅いウエルを生成し一方そのために他のポテンシャルウエルが成長するような方法でポテンシャルエネルギーを表す多変数関数を変形した拡散方程式法の基本思想を使用することを開示している。この方法は複雑な構造には実際上容易に適用できない。これも決定的な探索方法ではなく、常に最良の構造を保証しない。更に、多大な計算を必要とし計算機の使用時間において非常に高価となる。この方法におけるMOLSの使用については如何なる形式においてもまったく記載はない。
文献11はDistance Scaling Methodを開示し、この方法はポテンシャルエネルギー超曲面を変形する方法であり、拡散方程式法を拡張したもので、同様の欠点を有する。これも決定的な探索方法ではなく、常に最良の構造を保証しない。更に、多大な計算を必要とし計算機の使用時間において非常に高価となる。この方法におけるMOLSの使用については如何なる形式においてもまったく記載はない。
文献12は先の構築法と遺伝子アルゴリズムの基本的局面を結合したもの開示している。これは初期段階で全体の構造空間を探索し、次いで低エネルギーの小領域の探索に局限する。しかしながら、全体の構造空間の探索にはかなり大量のコンピュータの時間を必要とする。それゆえ、多大な計算を必要とし計算機の使用時間において非常に高価となる。この方法におけるMOLSの使用については如何なる形式においてもまったく記載はない。
文献13は最近開発された二つの方法、united‐residuefield(UNRES)とCSA法とに基づく階層的アプローチを使用している。広範囲な構造探索はUNRES界を用いたCSA法により行われる。この方法は構造空間アニ−ル法と同様の欠点を有する。即ち、多大な計算を必要とし計算機の使用時間において非常に高価となる。この方法におけるMOLSの使用については如何なる形式においてもまったく記載はない。
文献14はTaboo Search法(TS)記載する。TSは、連続関数のmultiple minima問題を解く離散関数のグローヴァのタブー探索に基づく。この方法は分子構造の決定に関する応用については何も示唆していない。更に、多大な計算を必要とし計算機の使用時間において非常に高価となる。この方法におけるMOLSの使用については如何なる形式においてもまったく記載はない。
文献15は連続的な全体最適問題を解くTRUST(Terminal Repeller Unconstrained Sub−energy Tunneling algorithm)によるアプローチを示唆している。しかしながら、この方法は分子構造への応用は示しておらず、計算が極めて大変である。そのためコンピュータの時間において高価であり、この方法にもMOLSを使用する示唆はない。
USP5884230 “Method AND system for protein modeling” USP6188956“Apparatus AND method for automated protein design” Combinatorial Mathematics by H. J. Ryster Introduction to Combinatorial Mathematics by C. L. Liu Experimental Design AND Its Statistical Basis by D. J. Finney Methods in Molecular Biology (D Webster, ed.)2000, S. Schulze−Kremer "Genetic Algorithms AND Protein Folding" Current Science 1992, N. Gautham, Z.A. Rafi "Global Search for Optimal Biomolecular Structures using Mutually Orthogonal Latin Squares" Journal of Computational Chemistry 1987, K.D. Gibson, H.A. Scheraga "Revised algorithms for build−up procedure for predicting protein conformations by energy minimization" Biopolymers 1987, L. Piela, H.A. Scheraga "On the multiple−minima problem in the conformational analysis of polypeptides 1. Backbone degrees of freedom for a perturbed α−helix" Proceedings of the National Academy of Sciences 1987, Z. Li, H.A. Scheraga "Monte Carlo Minimization approach to the multiple−minima problem in protein folding" Biopolymers 1998, D.R. Ripoll, A. Liwo, H.A. Scheraga "New developments of the electrostatically driven Monte Carlo method - Test on the membrane bound portion of melittin" Journal of Physical Chemistry 1989, L. Piela, J. Kostrowicki, H.A. Scheraga "The multiple−minima problem in the conformational analysis of molecules−Deformation of the potential energy hypersurface by the diffusion equation method" Journal of Physical Chemistry 1995, J. Pillardy, L. Piela "Molecular dynamics on deformed potential energy hypersurface" Biopolymers 1998, J. Lee, H.A. Scheraga "Conformational analysis of the 20−residue membrane−bound portion of melittin by conformational space annealing" Proceedings of the National Academy of Science 1999, A. Liwo, D.R. Ripoll, J. Pillardy, H.A. Scheraga "Protein structure can be predicted by global optimization of a potential energy function" Science 1995, D. Cvijiovic, J. Klinowski "Taboo Search: An approach to the Multiple Minima Problem" Science 1997, J. Barthen, V. Protopopescu, D. Reister "TRUST: A deterministic algorithm for Global Optimization" Proceedings of National Academy of Science Vol. 84, 6611−6615 Z. Li, H.A. Scheraga Proceedings of National Academy of Science Vol. 83, 3272−3276 Griffin Journal of the Chemical Society vol.104, 2437−2444 Benedetti et al Journal of the Chemical Society, Chemical Communication 1978, 996 Shamala et al
本発明の主たる目的は、化学的構造の知識から分子構造の最適な3次元モデルを構築するための、上述の問題点を解決した方法を提供するにある。
本発明の他の目的は、タンパク質や核酸のような生物高分子の最小エネルギー構造を構築する方法及びシステムを提供するにある。
本発明の他の目的は、本発明による方法を関数の最適値を見出すために適用することにある。
本発明の他の目的は、本発明による方法を分子のポテンシャルエネルギー関数の最適値を見出すために適用することにある。
本発明の他の目的は、構造の決定方法をコンピュータの使用条件において簡単で単純であり且つ安価なものとすることにある。
本発明の他の目的は、本発明による方法を、複数のパラメータからなる関数で定義される物理的または化学的システムにおける種々の問題に適用し、前記関数の最適値であるパラメータの最適値を見出すことにより、本発明をこれらシステムにおける最適の構成の発見に使用することにある。
本発明の他の目的は、傾斜探索やシミュレーションアニールなどのような既知の方法と容易に結合できる方法を提供するにある。
本発明の他の目的は、前記方法を容易にプログラム化でき、並列のコンピュータを作動して貴重な時間を節約できるものとすることにある。
分子の立体配座のポテンシャルエネルギー関数の最低値に対応するものとして最適な立体配座を定める新規なアルゴリズムを使用し、3次元分子構造のモデルを構築するのに有用な、分子の立体配座のポテンシャルエネルギー関数の最低値を決定する、コンピュータによって実行される方法であって、
a)既知の方法によって、分子を構成する原子の座標により分子を表現するステップと、
b)組合せ配列n個のN次の相互直交ラテン方格(MOLS)であって、前記MOLSを前記分子の立体配座のパラメータに基づき構成し、前記分子の立体配座を定めるパラメータの数をnとし、各立体配座パラメータについてサンプリングされる値の数をmとし、n又はmのいずれか大きいほうに等しいものをNとし、パラメータの範囲をRとし、且つ、ステップサイズをR/mとしたとき、前記MOLSの各組がN個の副方格を有し、前記各副方格が前記分子の可能な立体配座に対応するような前記MOLSを用いて、全ての可能な立体配座から選択される立体配座の組を選択するステップと、
c)前記各副方格に1つの立体配座を当てて、いずれの副方格の立体配座も当該副方格の立体配座パラメータの値によって表現されるように、前記MOLSの前記副方格の各々を前記分子の1つの立体配座で埋めるステップと、
d)前記パラメータの数nと、該n個のパラメータの各範囲と、各パラメータについて合計m個のステップにわたって各パラメータの値がサンプリングされるときのステップサイズとを最初に特定して、θr、s(r=1〜n、s=1〜m)が前記立体配座パラメータの入力値の組として特定されるように、前記副方格の前記立体配座パラメータの値を選択するステップと、
e)u及びtを整数(u=1〜N、t=1〜N)として前記MOLSの副方格に指数(u,t)を付し、且つ、与えられたある副方格(u,t)のr番目のねじれ角の値が、指数uがu={(t−1)(r−1)+(s−1)}modulo(N)で与えられるときに、入力値の組θr、sからθ u,tr,sとして選択されるステップと、
f)前記uを前記ステップeで与えられる式により逐次計算しながら、r=1〜n、s=1〜m及びt=1〜Nの全ての値から選択したパラメータの値で前記副方格を埋める処理を繰り返し、これにより当該処理終了時には、前記MOLSのN個の副方格が、n個の立体配座パラメータの1つにそれぞれ対応するn個の値の組で埋められ、これにより、各副方格のn個の値の組が前記分子の1つの立体配座を定めるとともに、N個の立体配座ができるステップと、
g)前記MOLSの組のN個の副方格において表される前記分子のN個の立体配座のそれぞれのポテンシャルエネルギーを、Vu,t=V(θ u,t)で表されるポテンシャルエネルギー関数に従って計算するステップと、
h)各立体配座パラメータの最適値を決定するためにポテンシャルエネルギー関数のN個の値を解析するステップと、
i)立体配座のパラメータが当該立体配座を定めるものとして用いられている場合に、N個の立体配座の全てにおけるポテンシャルエネルギー関数の平均値を取り、n×m個の次式で表される平均値を求めることによって、各パラメータの各値についてポテンシャルエネルギー関数の平均値を決定することによって解析するステップと、

j)前記ポテンシャルエネルギー関数のn×m個の平均値の組を走査し、各立体配座パラメータについて、ポテンシャルエネルギー関数の最低平均値に対応するパラメータの値を得るとともに、次いで各パラメータに1つの値が対応しているn個の立体配座パラメータのn個の値を用いて、ポテンシャルエネルギー関数の最低値を有する前記分子の最適の立体配座を決定するステップと、
k)前記立体配座パラメータの異なる値の組を選択すると共に前記e〜kのステップを繰り返すことによって得られた結果を確認するステップと、からなることを特徴とする。
本発明の一実施の形態においては、前記方法は、パラメータの範囲における単一の既知の最適値をそれぞれ有する複数の単純な非線型関数の最適値を得ることを含む。
本発明の他の実施形態においては、前記方法は、異なる種類の多変数関数の最適値を見出すことにより行われる。
本発明の更なる実施の形態においては、前記方法は、ペプチド又はヌクレオチドといった小分子の最良の構造を得ることにより行われる。
本発明の更なる実施の形態においては、前記方法は、タンパク質又は核酸といった生化学高分子最良の構造を得ることにより行われる。
本発明の他の実施形態においては、前記方法は、複数のコンピュータを同時に並行して作動させることにより計算時間をさらに短縮する。
図1は、本発明の方法をより良く説明するための1組の直交相互ラテン方格(MOLS)の一例である。図のダイアグラムは、次数7の3MOLSの例であり、即ちn=3、m=7、N=7である。第1のラテン方格の記号はa1、a2、a3、a4、a5、a6、a7である。これら各記号は7回繰り返され、計49個の記号が与えられて、ラテン方格内に配置される。第2ラテン方格の記号はb1、b2、b3、b4、b5、b6、b7である。第2ラテン方格は第1のものと直交している。第1方格からの記号と第2方格からの記号との各組合わせは、正確に1回のみである。第3方格の記号はc1、c2、c3、c4、c5、c6、c7である。これも他の二つの方格と直交している。この図から明らかなように、N個の記号の3つの異なる組合せが用いられている。一つが、N個の記号の同一の組合せを用いて、次数NのN−1個のMOLSを形成することができる。MOLSの当該組合せのうちの1つの副方格に注目すると、その記号は、第1ラテン方格のa7、第2ラテン方格のb1、及び、第3方格のc5である。本発明においては、このような副方格の各々が分子の可能な立体配座を表す。このMOLS法においては、立体配座空間におけるこれらN個の全ての点について評価するためのポテンシャル関数が必要となる。
図2aは実施例1に記載した本MOLS法を適用して得られたペンタペプチド[Met]エンケファリン(Tyr−Gly−Gly−Phe−Met)分子の構造を示す。この分子立体配座のポテンシャルエネルギー関数の値は、−13.61kcal/molである。図2bは比較のため文献16に報告された同一分子の構造を示す。この構造との比較から二つの分子構造は同一であり、本MOLS法が正確な分子構造を成功裡に特定したことが明らかである。本MOLS法はこの分子構造及び99の他の構造をペンチアムIIIプロセッサを650MHzで作動させ総計65秒の計算時間で特定した。この時間は文献16の方法による時間より遥かに短時間である。
図3aは実施例1に記載した本MOLS法を適用して得られたペンタペプチド[Met]エンケファリン(Tyr−Gly−Gly−Phe−Met)分子の他の構造を示す。この分子構造のポテンシャルエネルギー関数の値は−8.53kcal/molである。図3bは文献17に報告された同一分子の実験的に決定された構造を示す。この構造との比較から二つの分子構造は同一であり、本MOLS法が正確な分子構造を成功裡に特定したことが明らかである。本MOLS法はこの分子構造及び図2に示す構造を含めた99の他の構造をペンチアムIIIプロセッサを650MHzで作動させ総計65秒の計算時間で特定した。
図4は異なる組合せの入力値について本方法を繰り返すことにより得られた図2、3の構造を含む100の異なる構造のRamachandranプロットを示す。これら構造のすべてがRamachandranマップの許容領域に対応しており、すべての構造がコンフォメーション的に最良の構造であることがRamachandranマップのテストにより図から明らかである。
図5a、bは本MOLS法によって得られたペンタペプチド(Aib)の二つの最小エネルギー構造(緑色)を示す。これら構造のポテンシャルエネルギー関数の値は5.19kcal/mol、9.41kcal/molである。比較のため、文献18,19に報告されている同分子の実験的に得られた構造(赤色)を重ね合わせた。この比較から本MOLS法が正確な分子構造を与えることが判る。これら二つの構造は他の98の異なる分子とともに、650MHzのペンチアムIIIプロセッサを使用して60分以下のトータル時間内に特定された。
図6は異なる入力値の組合せについて本方法を繰り返すことにより本特許による方法で得られた、図5に示した分子を含む1000の種々の分子構造に対するRamachandranプロットである。これらすべての構造はRamachandranマップの許容領域に対応していることから、この図はこれらすべての分子構造がRamachandranマップのテストによるコンホメーショナリーにベストの構造であることを明らかに示している。これら1000の分子構造は650MHzのペンチアムIIIプロセッサを使用して60分以下のトータル時間内に得られたものである。
本発明の方法は一連のステップを用いて最も良く説明される。MOLSの組の構成は、1組N個の記号がN×N個のマスに配置され、各記号が正確に各列に1個、各行に1個出現するように定められる、次数Nのラテン方格(LS)から構成される。2つのLSは直交しており、これらを重ね合わせると、第1方格の各記号は第2方格の各記号とただ一度だけ共に出現する。MOLSの組はLSの組合せであり、各対は直交している(図1)。Nがprime powerの場合、下記のように次数NのN−1のMOLSが構成出きることは従来知られている。記号N(ガロア域に属する)はb、i=1〜Nと表す。LSの(i,j)th要素にeを付すと、

(1)
ここで、上記の式(1)において、i=1〜N、j=1〜N、e=1〜N−1であり、演算xは乗法、演算+は加法である。
本アルゴリズムにおいては、記号bと分子の立体配座パラメータとの間に対応がなされる。例えば、これらをオリゴペプチドの立体配座を特徴付けるねじれ角度θ,i=1〜nとすることができる。分子の最良の立体配座は一つに定義され、それは立体配座パラメータの関数であるポテンシャルエネルギー関数の最小値を有する。言葉を代えて言えば、ポテンシャルエネルギー関数に最小値を与える立体配座パラメータの組を見出すと、その立体配座パラメータの組が分子の最良の立体配座である。各立体配座パラメータは特定の範囲において種々の値mをとる可能性があるものとして説明できる。これら立体配座パラメータに指標rを付し、各パラメータのとる値に指標sを付すと、θr、s、r=1〜n、s=1〜m、は入力する値の組であり、これら値のnの組合せの中から最良の立体配座の探索が遂行される。このようにして、例えば、第1のパラメータの第1値がθ1,1、第1パラメータの第2値がθ1,2、第2のパラメータの第1値がθ2,1、第2のパラメータの第2値がθ2,2、そして最終パラメータの最終値θn,mまで継続される。入力値はm×nの組み合わせであることは明らかである。
MOLSの組を構成するため、各立体配座パラメータは一つのLSに対応して配置され、立体配座パラメータの指標に対して式(1)が適用される。指標r、sは各々が要素mを伴うnのガロア組合わせと考えられる。即ち、指標対(r、s)はr番組のs番要素を形成する。MOLSの副方格は指標対(u,t)、u及びtは1〜Nの整数値、が付され、副方格(u,t)のr番目のねじれ角の値は値θr、sの入力値組から選択される。
上記式(2)で指標uは、u={(t−1)(r−1)+(s−1)}modulo(N)で与えられる。Nの値は(i)N−1≧最大(m,n)(ii)Nはprime powerとして選択される。最後の条件は、実際におけるサンプリンググリッドのステップサイズがR/Nとなるように選択されることが要求される。ここでRは立体配座パラメータの特定範囲である。r=1〜n、s=1〜N及びt=1〜Nのすべての値にこの方法を適用することは次数Nのn組のMOLSに帰する。これらのMOLSは、重ねると、N個の副方格を与え、各副方格はn個の立体配座パラメータの値の組を含む(図1)。パラメータの各値の組合せは、指標(u,t)が付され、ポリペプチド鎖の可能性ある立体配座の一つ、故に、n次元の立体配座空間の一点を表す。
本発明による方法は、可能性あるnのなかから、副方格で特定されたNの点で分子のポテンシャル面をサンプリングすれば全空間のマップを構築するに充分であり、このマップを最適を求める早い探索を遂行するために用いることが出きることを示す。この仮説はMOLSの組が暗示的にn次元空間のすべての2次元投射を含む事実によって支持される。
次のステップは、立体配座空間におけるエネルギー超表面のサンプリングである。これはNの点の各々についてポテンシャルエネルギー

を計算することにより行われる。ここで、u=1〜N、t=1〜Nである。このステップが完了し、ポテンシャルエネルギー関数のN値が計算された後、次のタスクは立体配座空間のエネルギーマップを再生することである。これを行うため、各立体配座パラメータのポテンシャルエネルギー関数Vの偏差の1次元表示を構築する。特定の値に特定の立体配座パラメータをセットする効果はMOLSに出現するパラメータの値のN点についてVの平均値を取ることにより推定される。即ち、

ここで、kはボルツマン定数、Tは温度である。
再度式(2)を用いて各値r、s及びtに対するuの値を計算する。各パラメータのステップ数mはNに等しくセットしてあるので、r=1〜nの各立体配座パラメータの平均値はNある。所与のパラメータに対するNの平均値はかかるパラメータの関数としてポテンシャルVの作用の表示を形成する。最終ステップは各1次元表示の検査である。これはそれぞれのめじれに対する最適値を表す。かくして、

(3)
であれば、θr,ωはパラメータrに対する最適値である。上記式(3)において、最適値θr,ω、r=1〜n、は分子の最適立体配座を定義する。これで本方法は完了する。
MOLSの構成で使用された指標r及びsは異なる方法(m!)におけるパラメータの数nの値mに割り当てることができる。本発明によれば割り当ての方法が如何になされようと、本方法は最適構造に帰結する。それゆえ、角度の異なる割当を選択することにより、得られた結果と同一となるかをチェックするために計算を繰り返すこともできる。
本発明の従来技術に対する新規性は下記の通りである。
・相互直交ラテン方格(MOLS)は最適な分子又は生体分子構造を発見するために従来使用されたことはない。
・MOLSは関数の最適値を発見するために従来使用されたことはない。
・MOLSは関数の大域的最良値を見出すために従来使用されたことはない。
・式(2)は従来記載されたことも、使用されたこともない。
・式(3)で与えられる平均を求める方法は従来使用されたことがない。
以下に示す実施例は、本発明の実例を説明するためのものであり、本発明の範囲を限定するものではない。
実施例1
例として本発明の方法を、ペンタペプチド[Met]エンケファリン(Tyr−Gly−Gly−Phe−Met)に適用した。文献に見出される値に固定されている側鎖のねじれ角を無視すると、8つのバックボーンねじれ角がある。これらは立体配座パラメータと考えられ、0から360°の間の範囲に亘る。これらの各々を10°の間隔でサンプリングすると、各次元について36個の点が必要となる。かくして、サーチ空間の合計は36または2.8×1012個の点となり、最適構造を徹底的にサーチするためには、最適なものを選択するためにこれらの各点についてエネルギー計算を行うことになろう。本発明の方法においては、エネルギーを計算するのは36個の点のみである。しかし、MOLSの次数は常に素数であり、36は素数でないので、実際には37個の点がサーチされる。第1ステップとして、考慮されるべき各ねじれ角の値の組が特定される。そして、第1ねじれ角の値は、0°、10°、20°、30°、・・・360°となりうる。同様に、第2ねじれ角の値は、0°、10°、・・・360°の値で考慮されるべきである。同様に、他のねじれ角のサンプリング点も特定される。かくして、r=1〜8、s=1〜37についての値θr,sが特定される。ここで、式(2)が、8個のねじれ角各々のこれら37個の値のコピーを37個の副方格に割り当てるために使用され、次数8の8個の相互直交ラテン方格の1組が形成される。そして、各副方格の8個の値は、分子の可能な立体配座の1つを形成する。これらの立体配座の幾つかは、原子同士が互いに貫通しあうという意味で、「不可能な」立体配座であることに注意しなければならない。しかしながら、本発明は、この37個の立体配座の組の中から最適な立体配座を導くためこれを許容する。
本方法における次のステップは、これら37個の各点について半実験的にポテンシャルエネルギーを計算することである。一度これらのエネルギーが計算されると、次のステップは、各ねじれ角の各値に関する平均エネルギーを確認することである。例えば、第1ねじれ角の第1の値は、0°である。第1ねじれ角の値が0°にセットされている分子の立体配座は37個あり、これらの全ての立体配座のポテンシャルエネルギー関数の値は上記方法で決定されている。これら37個のエネルギー値のボルツマン重み付け平均が取られ、それにより、この角をこの値にセットした結果、すなわち、第1ねじれ角を0°の値にセットした結果、を特定するものとして得られる単一の数字が得られる。同様に、第1ねじれ角を10°、20°、などとセットしたときの平均エネルギーが得られる。ここで注意すべき重要なことは、MOLSの特性により、各セッティングが37回(あるいはN回、ここでNはMOLSの次数)繰り返されることである。ことを注視する事が重要である。ねじれ角について37個のセッティングがあるので、37個の平均エネルギーがある。
次のステップは、これらの37個の平均を検査して、最低の平均エネルギーを生み出すねじれ角のセッティングの1つを特定することである。これがこのねじれ角に関する最適値である。この手続が次のねじれ角についても繰り返され、これに関する最適値も最初のものと全く同様の方法によって決定される。再び注意すべきは、MOLSの特性によって、第2のねじれ角の各値についても37回繰り返すことになる。他のねじれ角についても同じ方法が繰り返される。このステップの終了時に、本発明は8個のねじれ角各々についての最適なセッティングがそれぞれ決定されている。ここで、分子が、本発明によって特定された、これら8個のねじれ各の値によって構成されるとき、これが[Met]エンケファリンの最適な立体配座となる。異なる方法で選択されるθr,sについて、上述のすべての方法が繰り返される。ここで、θ1,1=0.0、θ1,2=10.0などと特定することに代えて、θ1,1=10.0、θ1,2=0.0などに対して値を特定する。その割当は乱数表を用いて行う。このステップが繰り返されて、当該分子の他の最適な立体配座が生成される。これを何度も繰り返して、必要なだけの多くの最適構造が生成される。本実施例においては、100個の最適構造を生成した。各構造は、ねじれ角の値に対して指標を種々割当ることによって得られたねじれ角θr,sの種々の入力値の組について上記方法を適用した結果である。この割当は乱数表を用いて選択された。これら全ての分子構造に対応するエネルギーは低く、最高が72.3kcal/mol、最低が−14.0kcal/molであり、100個の構造全ての平均が−7.34kcal/molであった。最適な構造を、図2、図3に示し、100個全ての構造の立体配座のRamachandranプロットを図4に示す。
実施例2
本発明の他の実施例として、立体配座パラメータに基づくポテンシャルエネルギー関数ではなく、任意の関数に適用する例を示す。下記のような最小値の既知の人為的な関数に本方法を適用する。
F=2(a−5)×3|b−2|×4|c−9|×5|d−6|×6|e−8|×6(f−8)×5(g−6)
×4(h−9)×3(i−2)×2|j−5|×(k−7.1)
この関数は11の変数a,b,c,d,e,f,g,h,i,j,k,を有し、1ステップでこれらは1.0〜13.0の範囲でサンプリングされる。この空間においてa=1.0、b=2.0、c=9.0、d=6.0、e=8.0、f=1.0、g=1.0、h=1.0、i=1.0、j=5.0、k=7.0のとき関数の最小となる。各11の変数に対する値の範囲、1.0、2.0、...13.0の値を用いて次数13の11MOLSの組合せを構成した。13×13の副方格で特定される各点において関数が評価された。平均をとり最小は1.0、1.0、8.0、5.0、8.0、2.0、1.0、1.0,1.0、5.0、7.0と特定された。この結果は先に記した理論的最小に極めて近似している。
実施例3
本実施例においては、ペンタペプチド(Aib)から選択した分子について本方法を適用した。実施例1のように、この分子の自由ねじれ角の数を8とした。これらは立体配座パラメータとして0〜360°の範囲から選択した。10°のステップにおいて、各ディメンションにつき37の点があり、MOLSの次数として37を選択した。実施例1に記載したように、37の立体配座の点がMOLSを用いて特定し、ポテンシャルエネルギー関数を計算し、平均をとり、最適立体配座を特定した。これを1000回繰り返し、1000すべての立体配座に対するコンピュータ計算のトータル時間は約1時間であった。これらのすべては低エネルギー値に見るようによい立体配座であった。これらの幾つかはα螺旋または回転のようなよく知られた構造に相当した。図5に最良の二つの構造を、図6に1000の立体配座すべてのRamachandranコンフォメーションプロットを示す。
本発明は異なる形式の関数にもよく対応した。特に、分子の構造解析において、本発明は全立体配座空間を合理的な時間内で画成する一手段であり、物理的に合理的な構造を特定する一手段である。
〔本発明の効果〕
1.本発明の主たる効果は、化学構造の知識から分子構造の3次元モデルを構築する従来の方法の欠点を解消した方法を提供することである。
2.本発明の他の効果は、タンパク質や核酸のような生化学高分子の最小エネルギー構造を構築する方法及びシステムを提供することである。
3.本発明の他の効果は、関数の最良値を見出すために適用できることである。
4.本発明の他の効果は、分子のポテンシャルエネルギー関数の最良値を見出すために適用できることである。
5.本発明の他の効果は、簡単で、回りくどくない方法であり、使用するコンピュータの時間が短く安価である。
6.本発明の他の効果は、パラメータの関数として定義される物理的または化学的システムにおける広く多様な問題に適用でき、関数の最良値を与えるパラメータの最良の値の組合せを見出すことにより、システムの最良の形態を見出すことに用いられることである。
7.本発明の他の効果は、傾斜サーチやアニールシミュレーションのような他の知られた方法と結合できることである。
8.本発明の他の効果は、並置するコンピュータで計算できるように容易にプログラム出きることである。
図1は本発明による方法を説明するための相互直交ラテン方格(MOLS)の一例である。 図2aは本MOLS法を適用して得られたペンタペプチド[Met]エンケファリン(Tyr−Gly−Gly−Phe−Met)分子の構造を示す。図2bは比較のため文献16に報告された同一分子の構造を示す。 図3aは本MOLS法を適用して得られたペンタペプチド[Met]エンケファリン(Tyr−Gly−Gly−Phe−Met)分子の他の構造を示す。図3bは文献17に報告された同一分子の実験的に決定された構造を示す。 図4は異なる組合せの入力値について本方法を繰り返すことにより得られた図2、3の構造を含む100の異なる構造のRamachandranプロットを示す。 図5a,bは本MOLS法によって得られたペンタペプチド(Aib)の二つの最小エネルギー構造(緑色)及び比較のため、文献18,19に報告されている同分子の実験的に得られた構造(赤色)を示す。 図6は異なる入力値の組合せについて本方法を繰り返すことにより得られた、図5に示した分子を含む1000の種々の分子構造に対するRamachandranプロットである。 図7aは本特許による方法を説明する詳細なフローチャートである。 図7bは本特許による方法を説明する詳細なフローチャートである。 図7cは本特許による方法を説明する詳細なフローチャートである。

Claims (5)

  1. 分子の立体配座のポテンシャルエネルギー関数の最低値に対応するものとして最適な立体配座を定める新規なアルゴリズムを使用し、3次元分子構造のモデル構築するのに有用な分子の立体配座のポテンシャルエネルギー関数の最低値を決定する、コンピュータによって実行される方法であって、
    a)既知の方法によって、分子を構成する原子の座標により分子を表現するステップと、
    b)組合せ配列n個のN次の相互直交ラテン方格(MOLS)であって、前記MOLSを前記分子の立体配座のパラメータに基づき構成し、前記分子の立体配座を定めるパラメータの数をnとし、各立体配座パラメータについてサンプリングされる値の数をmとし、n又はmのいずれか大きいほうに等しいものをNとし、パラメータの範囲をRとし、且つ、ステップサイズをR/mとしたとき、前記MOLSの各組がN 個の副方格を有し、前記各副方格が前記分子の可能な立体配座に対応するような前記MOLSを用いて、全ての可能な立体配座から選択される立体配座の組を選択するステップと、
    c)前記各副方格に1つの立体配座を当てて、いずれの副方格の立体配座も当該副方格の立体配座パラメータの値によって表現されるように、前記MOLSの前記副方格の各々を前記分子の1つの立体配座で埋めるステップと、
    d)前記パラメータの数nと、該n個のパラメータの各範囲と、各パラメータについて合計m個のステップにわたって各パラメータの値がサンプリングされるときのステップサイズとを最初に特定して、θ r、s (r=1〜n、s=1〜m)が前記立体配座パラメータの入力値の組として特定されるように、前記副方格の前記立体配座パラメータの値を選択するステップと、
    e)u及びtを整数(u=1〜N、t=1〜N)として前記MOLSの副方格に指数(u,t)を付し、且つ、与えられたある副方格(u,t)のr番目のねじれ角の値が、指数uがu={(t−1)(r−1)+(s−1)}modulo(N)で与えられるときに、入力値の組θ r、s からθ u,t = θ r,s として選択されるステップと、
    f)前記uを前記ステップeで与えられる式により逐次計算しながら、r=1〜n、s=1〜m及びt=1〜Nの全ての値から選択したパラメータの値で前記副方格を埋める処理を繰り返し、これにより当該処理終了時には、前記MOLSのN 個の副方格が、n個の立体配座パラメータの1つにそれぞれ対応するn個の値の組で埋められ、これにより、各副方格のn個の値の組が前記分子の1つの立体配座を定めるとともに、N 個の立体配座ができるステップと、
    g)前記MOLSの組のN 個の副方格において表される前記分子のN 個の立体配座のそれぞれのポテンシャルエネルギーを、V u,t =V(θ u,t )で表されるポテンシャルエネルギー関数に従って計算するステップと、
    h)各立体配座パラメータの最適値を決定するためにポテンシャルエネルギー関数のN 個の値を解析するステップと、
    i)立体配座のパラメータが当該立体配座を定めるものとして用いられている場合に、N個の立体配座の全てにおけるポテンシャルエネルギー関数の平均値を取り、n×m個の次式で表される平均値を求めることによって、各パラメータの各値についてポテンシャルエネルギー関数の平均値を決定することによって解析するステップと、
    j)前記ポテンシャルエネルギー関数のn×m個の平均値の組を走査し、各立体配座パラメータについて、ポテンシャルエネルギー関数の最低平均値に対応するパラメータの値を 得るとともに、次いで各パラメータに1つの値が対応しているn個の立体配座パラメータのn個の値を用いて、ポテンシャルエネルギー関数の最低値を有する前記分子の最適の立体配座を決定するステップと、
    k)前記立体配座パラメータの異なる値の組を選択すると共に前記e〜kのステップを繰り返すことによって得られた結果を確認するステップと、からなることを特徴とする方法。
  2. 前記立体配座パラメータの単一の最適値が、前記MOLSの副方格に付すための指数(u,t)、ポテンシャルエネルギー関数V u,t =V(θ u,t )、及びポテンシャルエネルギーの平均値を、前記ステップ(h)及び(i)で出された式に従って計算するために用いられることを特徴とする請求項1記載の方法。
  3. 前記分子がペプチド又はヌクレオチドから選択された小分子であることを特徴とする請求項1記載の方法。
  4. 前記分子がタンパク質又は核酸から選択された生化学高分子であることを特徴とする請求項1記載の方法。
  5. 前記計算のために複数のコンピュータを同時に並行して作動させることを特徴とする請求項1記載の方法。
JP2003579155A 2002-03-26 2002-03-26 3次元分子構造の最適モデルを構築する方法及びシステム Expired - Fee Related JP4209334B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
PCT/IN2002/000064 WO2003081510A1 (en) 2002-03-26 2002-03-26 Method and system to build optimal models of 3-dimensional molecular structures
US10/113,219 US7158891B2 (en) 2002-03-26 2002-03-28 Method and system to build optimal models of 3-dimensional molecular structures

Publications (2)

Publication Number Publication Date
JP2005524129A JP2005524129A (ja) 2005-08-11
JP4209334B2 true JP4209334B2 (ja) 2009-01-14

Family

ID=30002053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003579155A Expired - Fee Related JP4209334B2 (ja) 2002-03-26 2002-03-26 3次元分子構造の最適モデルを構築する方法及びシステム

Country Status (9)

Country Link
US (1) US7158891B2 (ja)
EP (1) EP1488364B1 (ja)
JP (1) JP4209334B2 (ja)
CN (1) CN1628316A (ja)
AT (1) ATE413655T1 (ja)
AU (1) AU2002249545B2 (ja)
DE (1) DE60229788D1 (ja)
ES (1) ES2315356T3 (ja)
WO (1) WO2003081510A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101129126B1 (ko) * 2003-10-14 2012-06-01 베르선 분자 배열과 결합에 관한 분석 방법과 장치
JP2006282929A (ja) * 2005-04-04 2006-10-19 Taiyo Nippon Sanso Corp 分子構造予測方法
JP5262709B2 (ja) * 2006-03-15 2013-08-14 日本電気株式会社 分子構造予測システム、方法及びプログラム
EP2253715A1 (en) 2009-05-14 2010-11-24 RWTH Aachen New targets for cancer therapy and/or diagnosis
JP5697638B2 (ja) * 2011-09-26 2015-04-08 富士フイルム株式会社 質点系の挙動を予測するシミュレーション装置およびシミュレーション方法並びにその方法を実行するためのプログラムおよび記録媒体
CN102864499A (zh) * 2012-08-09 2013-01-09 龙岩九健生物芯片技术研究所 一种生物芯片微阵列点阵方法
CN103500293B (zh) * 2013-09-05 2017-07-14 北京工业大学 一种非核糖体蛋白质‑rna复合物近天然结构的筛选方法
CN104965976B (zh) * 2015-06-12 2018-02-27 北京京东尚科信息技术有限公司 一种抽样方法和装置
US11515007B2 (en) 2016-03-11 2022-11-29 Merck Sharp & Dohme Llc In silico process for selecting protein formulation excipients
CN107704726A (zh) * 2017-10-13 2018-02-16 齐齐哈尔大学 一种利用粒子群模拟退火算法来进行蛋白质折叠预测的方法
CN112837415A (zh) * 2021-02-07 2021-05-25 浙江工业大学 一种蛋白质冷冻电镜投影图像的三维结构重建方法
CN114121146B (zh) * 2021-11-29 2023-10-03 山东建筑大学 一种基于并行和蒙特卡罗策略的rna三级结构预测方法
CN115328117B (zh) * 2022-07-15 2023-07-14 大理大学 基于强化学习的蛋白质动态配体通道最优路径分析方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5884230A (en) * 1993-04-28 1999-03-16 Immunex Corporation Method and system for protein modeling
WO1998047089A1 (en) * 1997-04-11 1998-10-22 California Institute Of Technology Apparatus and method for automated protein design
GB9724784D0 (en) * 1997-11-24 1998-01-21 Biofocus Plc Method of designing chemical substances
US6188956B1 (en) * 1998-12-30 2001-02-13 Garmin Corporation Navigation device and method for selectively displaying thoroughfare names

Also Published As

Publication number Publication date
ES2315356T3 (es) 2009-04-01
WO2003081510A1 (en) 2003-10-02
ATE413655T1 (de) 2008-11-15
AU2002249545B2 (en) 2007-10-18
CN1628316A (zh) 2005-06-15
DE60229788D1 (de) 2008-12-18
US20030187585A1 (en) 2003-10-02
US7158891B2 (en) 2007-01-02
EP1488364A1 (en) 2004-12-22
AU2002249545A1 (en) 2003-10-08
EP1488364B1 (en) 2008-11-05
JP2005524129A (ja) 2005-08-11

Similar Documents

Publication Publication Date Title
JP4209334B2 (ja) 3次元分子構造の最適モデルを構築する方法及びシステム
Holm et al. Fast and simple Monte Carlo algorithm for side chain optimization in proteins: application to model building by homology
Klimov et al. Cooperativity in protein folding: from lattice models with sidechains to real proteins
Etchebest et al. A structural alphabet for local protein structures: improved prediction methods
WO1994025860A1 (en) Method and system for protein modeling
JP2005519284A (ja) アミノ酸鎖に対する、化学修飾のセットの適合性の決定
Jothi Principles, challenges and advances in ab initio protein structure prediction
Huang et al. A sequence-based approach for predicting protein disordered regions
Stultz et al. Predicting protein structure with probabilistic models
Snow Powerful simulated‐annealing algorithm locates global minimum of protein‐folding potentials from multiple starting conformations
Chatterjee et al. A hybrid genetic algorithm with chemical reaction optimization for multiple sequence alignment
CN109243526B (zh) 一种基于特定片段交叉的蛋白质结构预测方法
Sinelnikova et al. Multiple scales and phases in discrete chains with application to folded proteins
JP2007505372A (ja) アミノ酸配列の立体構造を確定し、分析する方法
Braden A simple approach to protein structure prediction using genetic algorithms
Sundararajan et al. Parallel genetic algorithms on PARAM for conformation of biopolymers
Hsin et al. An ant colony optimization approach for the protein side chain packing problem
EP2481003A1 (en) New method of calculating areas
Gopal et al. TEXTALTM: Artificial Intelligence Techniques for Automated Protein Structure Determination.
Plewczynska et al. Protein Folding with a Reduced Model and Inaccurate Short‐Range Restraints
Eskow et al. An optimization approach to the problem of protein structure prediction
WO1992001933A1 (en) Generation of a complete set of structural coordinates of a molecule from a set of partial coordinates
Lavenier Genome Assembly
Kuric The Insulin Bio Code-Prima sequences
Reck et al. Decoy discrimination using contact potentials based on Delaunay tessellation of hydrated proteins

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071218

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080228

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080306

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080403

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081014

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081022

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees