JP2001184381A - 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体 - Google Patents

多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体

Info

Publication number
JP2001184381A
JP2001184381A JP36849899A JP36849899A JP2001184381A JP 2001184381 A JP2001184381 A JP 2001184381A JP 36849899 A JP36849899 A JP 36849899A JP 36849899 A JP36849899 A JP 36849899A JP 2001184381 A JP2001184381 A JP 2001184381A
Authority
JP
Japan
Prior art keywords
amino acid
population
protein
data
protein population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP36849899A
Other languages
English (en)
Other versions
JP3964087B2 (ja
Inventor
Soichi Morikawa
壮一 守川
Takanao Nakai
孝尚 中井
Kiyoto Ishii
清人 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kanegafuchi Chemical Industry Co Ltd
Original Assignee
Kanegafuchi Chemical Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kanegafuchi Chemical Industry Co Ltd filed Critical Kanegafuchi Chemical Industry Co Ltd
Priority to JP36849899A priority Critical patent/JP3964087B2/ja
Priority to EP00987705A priority patent/EP1241598A4/en
Priority to PCT/JP2000/009127 priority patent/WO2001048640A1/ja
Publication of JP2001184381A publication Critical patent/JP2001184381A/ja
Priority to US10/177,646 priority patent/US20030236629A1/en
Application granted granted Critical
Publication of JP3964087B2 publication Critical patent/JP3964087B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(57)【要約】 【課題】 組み合わせの数が膨大である多重変異蛋白質
集団の中から、特性値に基づいて最適解を、精度を低下
させることなく短時間で選択すること。 【解決手段】 多重変異蛋白質アミノ酸配列の最適化解
を算出する方法であって、多重変異蛋白質集団のメンバ
ーに対して、雛形蛋白質集団の立体構造データに基づい
て、該メンバーの各々のアミノ酸配列のアミノ酸側鎖立
体構造座標をデッドエンド排除(Dead End E
limination)アルゴリズムを用いて探索する
こと、および該メンバーの構造エネルギー極小化計算を
実行することによって、最適な多重変異蛋白質の立体構
造座標を算出するステップと、該最適な多重変異蛋白質
の立体構造座標から特性値を算出するステップと、該多
重変異蛋白質集団に対して遺伝的アルゴリズムを適用し
て、該特性値を最適化するメンバーを算出するステップ
とを包含する、方法。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、産業上有用な多
重変異蛋白質アミノ酸配列の最適化解を算出する方法、
多重変異蛋白質アミノ酸配列の最適化解を算出する装
置、および多重変異蛋白質アミノ酸配列の最適化解を算
出する方法を実行するプログラムを載せた記憶媒体に関
する。特に、産業上有用な酵素またはシグナル伝達蛋白
質の熱安定性、化学安定性、基質化学選択性、基質立体
選択性、至適pH値のいずれかまたはそれらの組み合わ
せを改変する方法および装置ならびにそのような方法を
記述するプログラムを載せた記憶媒体に関する。
【0002】
【従来の技術】所望の構造および機能を有する蛋白質を
自由に設計し、作製することは、分子生物学の主要な目
的の一つである。従来、このような改変蛋白質の分子設
計は、天然蛋白質のアミノ酸配列を、遺伝子改変または
合成化学によって改変することによって、蛋白質の改変
体を得、その蛋白質の改変体の生物学的機能(例えば、
酵素活性)および物理化学的性質(例えば、熱安定性)
などをもとの天然蛋白質と比較することによって分析す
ることにより、行われてきている。
【0003】既知の蛋白質を雛形として所望の特性をも
つ変異蛋白質を設計する情報科学的方法も開発されてい
る。その中でも、蛋白質分子原子座標を直接取り扱う設
計方法は特に設計の信頼性が高い。その代表例として
は、解候補となるすべての多重変異蛋白質のアミノ酸配
列について、それら各々の変異蛋白質分子原子座標を算
出した上でそれら各々の変異蛋白質の特性を算出し、そ
の結果をもって所望の特性を有する変異蛋白質を選択す
るという方法がある。
【0004】上記方法において、ある1つの解候補のみ
を考慮する場合、すなわちある1つの変異蛋白質分子の
原子座標を高速に算出する方法としては、野生型蛋白質
高次構造を雛形としてデッドエンド排除(dead e
nd elimination)法またはデッドエンド
排除アルゴリズムを用いた最適化方法を適用することに
より、変異蛋白質分子原子座標を良い精度で算出する方
法が知られている。
【0005】
【発明が解決しようとする課題】多重変異蛋白質の最適
解を求める際に、解候補となるすべての多重変異蛋白質
の原子座標を算出することは、解候補数が膨大な数とな
るため現実的には困難である。例えば、変異対象となる
蛋白質のアミノ酸配列中の任意の10残基について、そ
れらアミノ酸各々をすべて20種類の天然型アミノ酸に
置換した解候補を考えた場合、それらアミノ酸配列の組
み合わせは20の10乗(2010)個という膨大な組み
合わせ数となり、実用的な計算時間で多重変異蛋白質の
原子座標および蛋白質特性を算出することは難しい。
【0006】上記した膨大な数となる解候補の一部分の
みを考慮するだけであれば、実用的な計算時間で多重蛋
白質の原子座標および蛋白質特性を算出することが可能
である。しかしながら、解候補の一部分のみを無作為に
抽出し、その一部分のみの中から最適解を選択したとし
ても、全体の解候補の最適解である保証はまったくな
い。
【0007】本発明の目的は、上記した課題を解決する
ために、計算精度を低下させることなく、かつ実用的な
計算時間をもって多重変異蛋白質アミノ酸配列の最適化
解を算出する方法、多重変異蛋白質アミノ酸配列の最適
化解を算出する装置および多重変異蛋白質アミノ酸配列
の最適化解を算出する方法を載せた記録媒体を提供する
ことにある。
【0008】
【課題を解決するための手段】本発明の方法は、遺伝的
アルゴリズム(Genetic Algorithm:
以下、GAともいう)による最適化方法を多重変異蛋白
質のアミノ酸配列の最適化に適用し、得られた解候補で
ある個々の多重変異蛋白質の立体構造原子座標の最適化
に、デッドエンド排除(dead end elimi
nation)(DEE)アルゴリズムを方法適用する
ことにより、上記目的が達成される。
【0009】1つの局面において、本発明は多重変異蛋
白質アミノ酸配列の最適化解を算出する方法であって、
多重変異蛋白質集団のメンバーに対して、雛形蛋白質集
団の立体構造データに基づいて、上記メンバーの各々の
アミノ酸配列のアミノ酸側鎖立体構造座標をデッドエン
ド排除(Dead End Elimination)
アルゴリズムを用いて探索すること、および上記メンバ
ーの構造エネルギー極小化計算を実行することによっ
て、最適な多重変異蛋白質の立体構造座標を算出するス
テップと、上記最適な多重変異蛋白質の立体構造座標か
ら特性値を算出するステップと、上記多重変異蛋白質集
団に対して遺伝的アルゴリズムを適用して、上記特性値
を最適化するメンバーを算出するステップとを包含す
る、方法に関する。1つの実施態様において、上記最適
な多重変異蛋白質の立体構造座標を算出するステップ
は、雛形蛋白質の立体構造型をおおむね保持する束縛条
件下で行われ得る。
【0010】好ましく局面において、本発明は、多重変
異蛋白質アミノ酸配列の最適化解を算出する方法であっ
て、(a)雛型蛋白質集団の配列データおよび上記雛型
蛋白質集団の立体構造データを入力するステップと、
(b)上記雛型蛋白質集団の配列データおよび立体構造
データに基づいて、上記雛形蛋白質集団の各メンバーの
特性値を算出するステップと、(c)上記アルゴリズム
を実行する際に用いる計算パラメータおよび所望の特性
値を入力するステップと、(d)上記計算パラメータ、
所望の特性値および上記雛形蛋白質集団の各メンバーの
立体構造データおよび特性値に基づいて、上記雛形蛋白
質集団に遺伝的アルゴリズムを適用して、多重変異蛋白
質集団を生成するステップと、(e)上記多重変異蛋白
質集団の各メンバーのアミノ酸残基のアミノ酸側鎖に対
してデッドエンド排除アルゴリズムを適用して、上記ア
ミノ酸側鎖の位置を最適化し、次いで、エネルギー極小
化計算を実行するステップと、(f)エネルギー極小化
された上記多重変異蛋白質集団の各メンバーの立体構造
データおよび特性値を算出するステップと、(g)上記
計算パラメータ、上記所望の特性値、上記雛形蛋白質集
団の各メンバーの立体構造データおよび特性値、ならび
に上記多重変異蛋白質集団の各メンバーの立体構造デー
タおよび特性値に基づいて、ステップ(h)〜(j)を
実行する否か決定するステップと、(h)(g)で実行
すると決定される場合に、上記計算パラメータ、所望の
特性値および上記雛形蛋白質集団の特性値、ならびにこ
れまでに生成されたすべての多重変異蛋白質集団の各メ
ンバーの特性値に基づいて、上記雛形蛋白質集団に遺伝
的アルゴリズムを適用して、新たな多重変異蛋白質集団
を生成するステップと、(i)上記新たな多重変異蛋白
質集団の各メンバーのアミノ酸残基のアミノ酸側鎖に対
してデッドエンド排除(Dead End Elimi
nation)アルゴリズムを適用して、上記アミノ酸
側鎖の位置を最適化し、次いで、エネルギー極小化計算
を実行するステップと、(j)エネルギー極小化された
上記新たな多重変異蛋白質集団の各メンバーの立体構造
データおよび特性値を算出するステップと、(k)上記
計算パラメータ、上記所望の特性値、上記雛形蛋白質集
団の各メンバーの特性値、およびこれまでに生成された
すべての多重変異蛋白質集団の各メンバーの特性値に基
づいて、ステップ(h)〜(j)を実行する否か決定す
るステップと、(l)上記雛形蛋白質集団の各メンバー
の特性値およびこれまでに生成されたすべての多重変異
蛋白質集団の各メンバーの特性値から、上記所望の特性
値を有するメンバーを選択するステップと、(m)上記
選択されたメンバーの配列データおよび特性値を出力す
るステップとを包含する、方法に関する。1つの実施態
様において、上記雛形蛋白質集団の配列データがアミノ
酸配列および/または核酸配列であり得る。別の実施態
様において、上記雛形蛋白質集団の立体構造データは、
原子座標データ、分子トポロジーデータおよび分子力場
定数からなる群より選択される少なくとも1つのデータ
を含み得る。さらに別の実施態様において、上記雛形蛋
白質集団は1のメンバーを含み得る。別の実施態様にお
いて、上記雛形蛋白質集団が2以上のメンバーを含み得
る。別の実施態様において、上記特性値または上記所望
の特性値は、経験的分子力学ポテンシャル、半経験的量
子力学ポテンシャル、非経験的量子力学ポテンシャル、
電磁気学ポテンシャル、溶媒和ポテンシャルおよび構造
エントロピーからなる群より選択される少なくとも1つ
のデータを含み得る。別の実施態様において、上記計算
パラメータは、遺伝的アルゴリズムの計算パラメータで
あり得る。別の実施態様において、上記計算パラメータ
は、ステップ(g)においてなされる判断の基準となる
特性値を含み得る。別の実施態様において、上記計算パ
ラメータが、変異されるアミノ酸位置を特定する情報を
含み得る。別の実施態様において、上記デッドエンド排
除アルゴリズムは、1以上のアミノ酸残基に関して適用
され得る。他の実施態様において、上記デッドエンド排
除アルゴリズムは、すべてのアミノ酸残基に関して適用
され得る。別の実施態様において、改変される蛋白質の
特性は、熱安定性、化学安定性、基質化学選択性、基質
立体選択性および至適pH値から選択され得る。別の実
施態様において、上記アミノ酸配列は、天然アミノ酸、
化学改変アミノ酸、非天然アミノ酸からなる群より選択
される少なくとも1つの群から構成され得る。別の実施
態様において、上記多重変異蛋白質集団の各メンバー
は、複数の同種分子、複数の異種分子、またはそれらの
組み合わせから構成される少なくとも1つの蛋白質を含
む分子複合体であり得る。
【0011】本発明の別の局面において、本発明は、多
重変異蛋白質アミノ酸配列の最適化解を算出する装置で
あって、多重変異蛋白質集団のメンバーに対して、雛形
蛋白質集団の立体構造データに基づいて、上記メンバー
の各々のアミノ酸配列のアミノ酸側鎖立体構造座標をデ
ッドエンド排除(Dead End Eliminat
ion)アルゴリズムを用いて探索すること、および上
記メンバーの構造エネルギー極小化計算を実行すること
によって、最適な多重変異蛋白質の立体構造座標を算出
する手段と、上記最適な多重変異蛋白質の立体構造座標
から特性値を算出する手段と、上記多重変異蛋白質集団
に対して遺伝的アルゴリズムを適用して、上記特性値を
最適化するメンバーを算出する手段とを包含する、装置
に関する。1つの実施態様において、上記最適な多重変
異蛋白質の立体構造座標を算出する手段は、雛形蛋白質
の立体構造型をおおむね保持する束縛条件下で行われ得
る。
【0012】本発明の別の好ましい局面において、本発
明は、多重変異蛋白質アミノ酸配列の最適化解を算出す
る装置であって、(1)入力部と、(2)計算部と、
(3)出力部とを備え、ここで、上記入力部は、(a)
雛型蛋白質集団の配列データおよび上記雛型蛋白質集団
の立体構造データを入力する手段と(b)上記アルゴリ
ズムを実行する際に用いる計算パラメータおよび所望の
特性値を入力する手段とを含み、上記計算部は、(c)
上記雛型蛋白質集団の配列データおよび立体構造データ
に基づいて、上記雛形蛋白質集団の各メンバーの特性値
を算出する手段と、(d)上記計算パラメータ、所望の
特性値および上記雛形蛋白質集団の立体構造データおよ
び特性値、ならびにこれまでに生成されたすべての多重
変異蛋白質集団の特性値に基づいて、上記雛形蛋白質集
団に遺伝的アルゴリズムを適用して、多重変異蛋白質集
団を生成する手段と、(e)上記多重変異蛋白質集団の
各メンバーのアミノ酸残基のアミノ酸側鎖に対してデッ
ドエンド排除(Dead End Eliminati
on)アルゴリズムを適用して、上記アミノ酸側鎖の位
置を最適化し、次いで、エネルギー極小化計算を実行す
る手段と、(f)エネルギー極小化された上記多重変異
蛋白質集団の各メンバーの立体構造データおよび特性値
を算出し、そして上記算出された立体構造データおよび
特性値を格納する手段と、(g)上記計算パラメータ、
上記雛形蛋白質集団の各メンバーの特性値および上記多
重変異蛋白質集団の各メンバーの特性値に基づいて、
(d)〜(f)の手段において行われる集団生成ステッ
プを反復するかを決定する手段と、(i)上記雛形蛋白
質集団の各メンバーの特性値および上記多重変異蛋白質
集団の各メンバーの特性値から、上記所望の特性値を有
するメンバーを選択する手段とを含み、上記出力部は、
上記選択されたメンバーの配列データおよび特性値を出
力する手段を含む、装置に関する。
【0013】1つの実施態様において、上記雛形蛋白質
集団の配列データはアミノ酸配列および/または核酸配
列であり得る。別の実施態様において、上記雛形蛋白質
集団の立体構造データは、原子座標データ、分子トポロ
ジーデータおよび分子力場定数からなる群より選択され
る少なくとも1つのデータを含み得る。別の実施態様に
おいて、上記雛形蛋白質集団は1のメンバーを含み得
る。別の実施態様において、上記雛形蛋白質集団は2以
上のメンバーを含み得る。別の実施態様において、上記
特性値または上記所望の特性値は、経験的分子力学ポテ
ンシャル、半経験的量子力学ポテンシャル、非経験的量
子力学ポテンシャル、電磁気学ポテンシャル、溶媒和ポ
テンシャルおよび構造エントロピーからなる群より選択
される少なくとも1つのデータを含み得る。別の実施態
様において、上記計算パラメータが、遺伝的アルゴリズ
ムの計算パラメータであり得る。別の実施態様におい
て、上記計算パラメータが、手段(g)においてなされ
る判断の基準となる特性値を含み得る。別の実施態様に
おいて、上記計算パラメータが、変異されるアミノ酸位
置を特定する情報を含み得る。別の実施態様において、
上記デッドエンド排除アルゴリズムは、1以上のアミノ
酸残基に関して適用され得る。別の実施態様において、
上記デッドエンド排除アルゴリズムは、すべてのアミノ
酸残基に関して適用され得る。別の実施態様において、
改変される蛋白質の特性は、熱安定性、化学安定性、基
質化学選択性、基質立体選択性および至適pH値から選
択され得る。別の実施態様において、上記アミノ酸配列
は、天然アミノ酸、化学改変アミノ酸、非天然アミノ酸
からなる群より選択される少なくとも1つの群から構成
され得る。別の実施態様において、上記多重変異蛋白質
集団の各メンバーは、複数の同種分子、複数の異種分
子、またはそれらの組み合わせから構成される少なくと
も1つの蛋白質を含む分子複合体であり得る。別の実施
態様において、データ格納部をさらに備え得る。
【0014】本発明の別の局面において、本発明は、入
力されたデータに基づいて、多重変異蛋白質アミノ酸配
列の最適化解を算出する方法を実行するプログラムを記
録したコンピュータ読み取り可能な記録媒体であって、
上記方法は、多重変異蛋白質集団のメンバーに対して、
雛形蛋白質集団の立体構造データに基づいて、上記メン
バーの各々のアミノ酸配列のアミノ酸側鎖立体構造座標
をデッドエンド排除(Dead End Elimin
ation)アルゴリズムを用いて探索すること、およ
び上記メンバーの構造エネルギー極小化計算を実行する
ことによって、最適な多重変異蛋白質の立体構造座標を
算出するステップと、上記最適な多重変異蛋白質の立体
構造座標から特性値を算出するステップと、上記多重変
異蛋白質集団に対して遺伝的アルゴリズムを適用して、
上記特性値を最適化するメンバーを算出するステップと
を包含する、記憶媒体に関する。
【0015】本発明の別の好ましい局面において,本発
明は、入力されたデータに基づいて、多重変異蛋白質ア
ミノ酸配列の最適化解を算出する方法を実行するプログ
ラムを記録したコンピュータ読み取り可能な記録媒体で
あって、上記方法は、(a)雛型蛋白質集団の配列デー
タおよび上記雛型蛋白質集団の立体構造データを入力す
るステップと、(b)上記雛型蛋白質集団の配列データ
および立体構造データに基づいて、上記雛形蛋白質集団
の各メンバーの特性値を算出するステップと、(c)上
記アルゴリズムを実行する際に用いる計算パラメータお
よび所望の特性値を入力するステップと、(d)上記計
算パラメータ、所望の特性値および上記雛形蛋白質集団
の各メンバーの立体構造データおよび特性値に基づい
て、上記雛形蛋白質集団に遺伝的アルゴリズムを適用し
て、多重変異蛋白質集団を生成するステップと、(e)
上記多重変異蛋白質集団の各メンバーのアミノ酸残基の
アミノ酸側鎖に対してデッドエンド排除アルゴリズムを
適用して、上記アミノ酸側鎖の位置を最適化し、次い
で、エネルギー極小化計算を実行するステップと、
(f)エネルギー極小化された上記多重変異蛋白質集団
の各メンバーの立体構造データおよび特性値を算出する
ステップと、(g)上記計算パラメータ、上記所望の特
性値、上記雛形蛋白質集団の各メンバーの立体構造デー
タおよび特性値、ならびに上記多重変異蛋白質集団の各
メンバーの立体構造データおよび特性値に基づいて、ス
テップ(h)〜(j)を実行する否か決定するステップ
と、(h)(g)で実行すると決定される場合に、上記
計算パラメータ、所望の特性値および上記雛形蛋白質集
団の特性値、ならびにこれまでに生成されたすべての多
重変異蛋白質集団の各メンバーの特性値に基づいて、上
記雛形蛋白質集団に遺伝的アルゴリズムを適用して、新
たな多重変異蛋白質集団を生成するステップと、(i)
上記新たな多重変異蛋白質集団の各メンバーのアミノ酸
残基のアミノ酸側鎖に対してデッドエンド排除(Dea
d End Elimination)アルゴリズムを
適用して、上記アミノ酸側鎖の位置を最適化し、次い
で、エネルギー極小化計算を実行するステップと、
(j)エネルギー極小化された上記新たな多重変異蛋白
質集団の各メンバーの立体構造データおよび特性値を算
出するステップと、(k)上記計算パラメータ、上記所
望の特性値、上記雛形蛋白質集団の各メンバーの特性
値、およびこれまでに生成されたすべての多重変異蛋白
質集団の各メンバーの特性値に基づいて、ステップ
(h)〜(j)を実行する否か決定するステップと、
(l)上記雛形蛋白質集団の各メンバーの特性値および
これまでに生成されたすべての多重変異蛋白質集団の各
メンバーの特性値から、上記所望の特性値を有するメン
バーを選択するステップと、(m)上記選択されたメン
バーの配列データおよび特性値を出力するステップとを
包含する、記録媒体に関する。
【0016】
【発明の実施の形態】本発明は、遺伝的アルゴリズムを
遺伝子変異の生成に適用し、生成された変異体の座標最
適化にDEEを用いることによって達成された。
【0017】「遺伝的アルゴリズム(GA)」とは、進
化において中心課題である環境への適応現象を、遺伝的
な情報処理として捉えた最適化のためのアルゴリズムで
あり、総合進化理論体系の中の分子的プロセスである。
すなわち、遺伝的アルゴリズムは、生物にみられる目標
の認識、環境との相互作用、記憶保存の性質を複合的に
組み合わせたときに生じる自己組織化という学習に基づ
いた、適応のためのアルゴリズムであって、その情報の
基盤を遺伝においたものである(米沢保雄(199
3)、遺伝的アルゴリズム−進化理論の情報科学、森北
出版)。
【0018】生物は、その生存本能に基づいて、生き残
るために達成すべき「目標」を「認識」する。「目標の
認識」のために、生物は、進化の過程における淘汰(す
なわち、削除)の基準および判定に有用な情報を利用し
得る。生物はまた、生き残るための環境を予測する場合
に、自らが「環境との相互作用」を行い得、その結果、
生物は有効であった条件などを、「記憶保存」し得る。
この結果、生物は、「学習および適応」という活動を行
い得る。学習および適応において、生物の示す最大の特
性である、高度な「自己組織化」現象が達成される。
【0019】(遺伝的アルゴリズムの具体的な説明)以
下、遺伝的アルゴリズムの基本的スキームを説明する。
【0020】遺伝的アルゴリズムは、生物が利用する有
性生殖および自然選択という2つのプロセスを利用す
る。生物は、有性生殖において、精子と卵子との受精に
代表されるように、相同染色体において対合を起こす。
次いで、染色体の任意の地点で交叉が起き、遺伝子の交
換すなわち遺伝子組換えが起きる。遺伝子組換えは、突
然変異よりも有効かつ効率的な情報の多様化を達成す
る。自然選択において、有性生殖などによって多様化し
た個体群のいずれを残して次世代の生存生物すなわち適
応生物とするかが決定される。遺伝的アルゴリズムの特
徴として、従来のアルゴリズムとは異なり、局所解に落
ち込む危険性が大幅に回避されることが挙げられる。
【0021】遺伝的アルゴリズムの基本スキームを説明
する。遺伝的アルゴリズムは全体として、大別して次の
8つのプロセスを含む。
【0022】(1)遺伝子型の決定処理 (2)集団発生処理 (3)個体の評価処理 (4)淘汰(削除)処理 (5)増殖処理 (6)交叉(組換え)処理 (7)突然変異処理 (8)群評価処理。
【0023】(2)で生成した集団を(3)および
(4)によって淘汰し、(5)〜(7)によって多様化
し、得られた解を(8)で評価してその結果に応じて
(3)〜(7)(本明細書において1「世代」と呼ぶ)
を繰り返すという新個体生成および世代交代が遺伝的ア
ルゴリズムの基本的スキームである。このように遺伝的
アルゴリズムは、課題となる事象の集団(最適解領域;
単一解ではなく複数の解の区域)を人工的に進化(すな
わち、最適適応)させて、集団全体として真の最適値へ
近づける。ここで、(4)〜(7)の処理は、1つ以上
が省略されていてもよい。
【0024】次いで、遺伝的アルゴリズムの各処理につ
いて解説する。
【0025】(1)遺伝子型の決定処理 この処理では、遺伝子型を決定する処理を行う。事象ま
たはシステムのモデル化(すなわち、事象の構成要素へ
の分解、定義、および要素関係の定義)およびモデルの
記号表現であるので、DNAおよびアミノ酸で記述する
ことができる。代表的には二進数表現(ビット)、数
値、文字などが挙げられるがこれらに限定されない。事
象のモデル化がこのような記号表現に不向きであれば、
そのような事象はGAに適合しない。
【0026】(2)集団発生処理 多様性の生成処理を行う。基本的には、小さな違いを有
する個体を多数発生させる。ランダム法およびルール法
がある。ランダム法は、初期値が乱数発生に基づく。他
方、ルール法では、初期値は一定基準に基づく。
【0027】(3)個体の評価処理 この処理では、設定されている環境に適応度が高いもの
から低いものへのランキングを行う。蛋白質についての
評価パラメータとしては、例えば、経験的分子力学ポテ
ンシャル、半経験的量子力学ポテンシャル、非経験的量
子力学ポテンシャル、電磁気学的ポテンシャル、溶媒和
ポテンシャル、構造エントロピー、pIなどが挙げられ
るがこれらに限定されない。これらの評価パラメータ
は、蛋白質の生化学的性質と直接または間接の関連を有
し得る。
【0028】(4)淘汰(削除)処理 淘汰処理とは、(3)の評価関数での評価値に基づい
て、次期世代に残す個体を選別する処理である。従っ
て、ここでは、評価関数での評価に従って個体が削除さ
れる。淘汰は、その削除の様式によって大きく3つに分
類される。
【0029】(a)ランダム方式(ルーレット方式):
個体を、適応度の数値による足切り的選択を最初に行
い、その範囲内でランダムに選択する方式; (b)適応度順位方式(ランキング方式):適応度の数
値による足切り敵選択ではなく、所属する個体群での、
適応度順に並べた場合の順位によって選択確率を決めて
おり、その確率に基づいて選択する方式;および (c)高適応度抜粋方式(エリート保存方式):所属す
る群の中で、適応度が最大の個体を無条件で選択する方
式。
【0030】(5)増殖処理 この処理において、(4)での淘汰処理によって減少し
た個体数を増殖処理する。増殖処理は、予め決定した様
式に従って、淘汰後の個体総数から一定の割合で個体を
抽出して増殖処理することによって行われる。この処理
によって、集団全体の適応度の平均値が上昇する、増殖
処理は、例えば、評価値の高い個体を優先的に増殖させ
る処理、または残留した個体の割合に比例させて増殖さ
せる処理などが挙げられる。
【0031】(6)交叉(組換え)処理 交叉処理とは、遺伝子組換えでの交叉事象に倣い、ある
個体の特定の記号群を別の個体の対応する記号群と交換
する処理をいう。淘汰処理のみの処理では、その集団に
おける最高の評価値を超える評価値を有する個体は生じ
ないが、本処理によって、新たな高評価値を有する個体
が生成する可能性がある。
【0032】交叉には大きく分けて、1点交叉法、多点
交叉法、一様交叉法、順位交叉法、循環交叉法、部分的
交叉法などがある。
【0033】(7)突然変異処理 突然変異処理とは、個体の特定部位を一定の確率で変化
させる処理をいう。変化種は、全ての天然型アミノ酸
(20種類)であっても、特定のアミノ酸種から選択さ
れる群でもよい。また、変化種は、非天然型アミノ酸ま
たは修飾されたアミノ酸を含み得る。淘汰または交叉の
処理では、生じる最高値は初期値に拘束される。突然変
異によって、初期値に依存しない高適合度の個体を生成
することができる。突然変異には、その様式によって、
転座方式、重複方式、逆位方式、挿入方式、欠失方式な
どがある。
【0034】(8)生物集団の評価処理 この処理において、上記の処理によって得られた個体集
団を、一定の特性パラメータによって評価処理する。こ
こで、上記のプロセスを反復するか否かの収量条件が判
定される。
【0035】このような処理を、何世代かのルーチンで
繰り返すことにより、遺伝的アルゴリズムが達成され
る。
【0036】(デッドエンド排除法(DEE))デッド
エンド排除法(Dead End Eliminati
on)は、蛋白質においてアミノ酸の側鎖構造の最適値
すなわち全体極小化エネルギー構造(global m
inimum energy conformatio
n;GMEC)を予測する方法である(Desmet、
J.ら(1992)、356、539−542;Des
met、J.ら(1994)、The Protein
Folding Problem and Terti
ary Structure Prediction、
Merzら編、Birkhaeuser Bosto
n、307−337)。側鎖をいくつかの回転異性体
(rotamer)で近似すれば、仮定された主鎖構造
の位置での側鎖構造の予測は異性体の組合せの問題とな
る。例えば、各残基あたり3個の異性体があると仮定す
れば、3100の組合せが考えられる。ここで、ある残基
の1つの異性体について、他の残基の側鎖の異性体の構
造に拘らず、全体のエネルギーを非常に不利にすること
がわかる場合、その特定の残基の異性体を有する構造の
可能性はすべて評価対象から省略され得る。この判断を
厳密に行うのがデッドエンド理論(dead end
theorem)である。この方法によって、多くの蛋
白質で、主鎖構造が与えられた時点で最適な側鎖構造を
決定し得る。
【0037】デッドエンド理論の実際を以下説明する。
【0038】蛋白質結晶構造に関する統計学的分析によ
って、その蛋白質のアミノ酸側鎖は、その炭素鎖のねじ
れが一般に、ゴーシュ(+)型(+60°)、ゴーシュ
(−)型(−60°)、およびトランス型(180°)
の主として3つの立体配座をとることが明らかになって
きた。さらに、種々のアミノ酸の中でも、ベンゼン環を
有するトリプトファンまたはチロシンは90°に近いχ
2角度をとり、ヒスチジンおよびトリプトファンは+9
0°または−90°の立体配座をとることも明らかにな
っておる。一般に、側鎖が長いアミノ酸ほど、とり得る
立体配座の種類すなわち回転異性体(rotamer)
は多くなり、例えば、リジンでは51種類、アルギニン
では55種類ほどの立体配座が可能であると考えられて
いる(Desmet.ら(1992)前出)。
【0039】このように想定された種々の回転異性体に
ついて、ポテンシャルエネルギー関数すなわち評価関数
を生成する。この関数は、代表的に、結合の強さに関す
る項、結合角に関する項、結合のねじれに関する周期関
数、非結合原子対についてのレナード−ジョーンズポテ
ンシャル、水素結合についてのポテンシャル、および電
荷についてのクーロン関数を含む。このような評価関数
を用いて、回転異性体のエネルギーを算出し、以下使用
する。
【0040】デッドエンド排除アルゴリズムにおいて
は、所定のセットの回転可能な側鎖のGMECを算出す
ることが目的である。このアルゴリズムは、テンプレー
トと呼ばれる固定された参照構造を用いて、考えられ得
る種々の回転異性体を含む構造を比較する。テンプレー
トには、(1)主鎖の原子、(2)Cβ原子、(3)可
能性のあるリガンド(例えば、水分子、金属イオン、基
質、ヘム基など)、(4)相互作用する蛋白質(例え
ば、マルチマーを形成する場合の他のサブユニット)、
(5)モデリングの際に必要でない側鎖が含まれる。
【0041】ある残基の側鎖iの特定の回転異性体ir
について、別の回転異性体itが存在する場合、以下の
ように計算してその回転異性体irを考慮から消去する
か否かを決定する。ここで、ある残基の側鎖の回転異性
体について、評価関数を用いてその側鎖に独特の自己エ
ネルギーを算出する。さらに、テンプレートの固定原子
とこの側鎖原子との相互作用エネルギーを算出し、この
2つのエネルギーの和をその回転異性体の「固有エネル
ギー」(E(ir);irはある残基の特定の回転異性
体)という。次いで、この回転異性体上の原子と、別の
回転異性体上の原子との相互作用エネルギーの和を全て
の残基について積分し、この値を「非結合対相互作用エ
ネルギー」(ΣjE(irs); jsはiとは異なる残
基の特定の回転異性体)という。非結合対相互作用エネ
ルギーの各残基についての最小値の積分を「最小非結合
対相互作用エネルギー」(ΣjminsE(irs))と
いい、非結合対相互作用エネルギーの各残基についての
最大値の積分を「最大非結合対相互作用エネルギー」
(ΣjmaxsE(irs))という。
【0042】ここで、以下の関係:
【0043】
【数1】
【0044】すなわち、ある回転異性体irの固有エネ
ルギーおよび最小非結合対相互作用エネルギーの和が、
別の回転異性体itの固有エネルギーおよび最大非結合
対相互作用エネルギーの和よりも大きい場合は、回転異
性体irをGMECの計算の際から省略する。この計算
を順次各回転異性体について行うことにより、GMEC
に適合しない回転異性体をすべて省略し、GMEC計算
を行う。
【0045】計算には非必要な候補を効率的に省略でき
るので、DEEアルゴリズムを適用すれば、GMEC計
算を大幅に短縮し得る。
【0046】(エネルギー極小化計算)次にエネルギー
極小化計算について説明する。
【0047】エネルギー極小化法とは、蛋白質構造など
の系の安定構造を算出する方法である。エネルギー極小
化法では、出発構造からさほど遠くない局所的な安定構
造を求める。
【0048】エネルギー極小化法においては、まず初期
座標を与える。次に、この座標をエネルギーが低下する
と期待される方向に少しずつ変化させて次の座標を得
る。このステップを繰り返し、構造変化、エネルギー変
化および力が充分小さくなったときにこの繰り返しを停
止して、極小構造を得る(現代化学増刊13「新薬のリ
ードジェネレーション」13章、分子動力学設計システ
ム、東京化学同人を参照のこと)。
【0049】代表的には、ベクトル表現で、
【0050】
【数2】
【0051】と表され、ここで、〜付きのrは、nまた
はn+1ステップにおける座標であり、δは座標の変化
を表す。
【0052】δを得るためには、代表的には、最大降下
法、共役勾配法、Newton−Raphson法(N
R法)および適応基底Newton−Raphson法
(ABNR法)がある。
【0053】最大降下法は、δに対してポテンシャルエ
ネルギーの勾配をとる。
【0054】
【数3】
【0055】極小点から遠く離れた場所では効率よくエ
ネルギーが低下するが、極小点に近づくと、収束が遅く
なる傾向がある。kは、線上探索で使用するパラメー
ターである。
【0056】共役勾配法では、次のステップの座標を得
るのにエネルギーの勾配に加え、前回の勾配も利用す
る。一般的に、収束は最大降下法より優れているといわ
れる。
【0057】
【数4】
【0058】
【数5】
【0059】ここで、δ=−kn(▽nE)、αは、単純
な線上探索で最適値が決められるパラメーターである。
【0060】NR法では、δnの評価に対して一次微分
(勾配)に加えて、二次微分行列(曲率)を利用する。
【0061】
【数6】
【0062】
【数7】
【0063】この方法は、極小点付近の収束は極めて早
いが、力の定数の行列とその逆行列のに計算がかかりす
ぎるという欠点を有している。また、大きな記憶容量も
必要である。従って、巨大分子に適用するのは困難であ
る。
【0064】NR法が基底ベクトルを完全空間で解くの
に対して、ABNR法は、副空間で解くという簡易法で
あり、巨大分子に適用し得る。前回までのステップにお
いて最も大きな動きがあった部分を取り込むように、n
ステップ目の基底ベクトルは、過去p+1ステップの位
置ベクトルから形成される。
【0065】
【数8】
【0066】通常pは、4〜10の値が採用される。二
次微分マトリクスは、減少した基底ベクトルおよび一次
微分ベクトルから形成され、マトリクスの大きさは大幅
に減少するので、計算時間も記憶容量も少なくてすむ。
ABNR法は、一次微分法における計算の速さ、および
NR法の二次微分定法のうち、重要なもののみを取り込
むという利点を有している。初回のp+1回ステップ
は、最大降下法で計算され、続いてABNR法が適用さ
れる。
【0067】(定義)以下、本明細書において使用され
る主な用語の一部を定義する。
【0068】「雛形蛋白質集団」とは、本明細書におい
て遺伝的アルゴリズムにおいて使用される場合、計算の
基礎となる蛋白質の集団をいう。雛形蛋白質集団は、少
なくとも1つの蛋白質を含み、代表的には2以上の蛋白
質(すなわちメンバー)を含み、好ましくは、4以上の
蛋白質を含み、より好ましくは同定されている同一の蛋
白質スーパーファミリーに属する数の蛋白質を含むが、
これらに限定されない。「多重変異蛋白質集団」とは、
本発明の方法によって多重の変異が導入された蛋白質の
集団をいう。多重変異蛋白質集団は、複数の同種分子、
複数の異種分子、またはそれらの組み合わせから構成さ
れ得る。好ましくは、複数の同種分子から構成される。
また、好ましくは、複数の異種分子から構成される。ま
た、好ましくは、複数の同種分子と複数の異種分子との
組み合わせから構成される。前記多重変異蛋白質集団の
各メンバーは、複数の同種分子、複数の異種分子、また
はそれらの組み合わせから構成される少なくとも1つの
蛋白質を含む分子複合体であり得る。変異とは、蛋白質
のアミノ酸配列が変更されることをいい、蛋白質のアミ
ノ酸配列に、アミノ酸の置換、欠失、挿入が導入される
か、またはあるアミノ酸が修飾されることを含み得る。
本明細書においては、多重変異とは、通常複数の変異を
いうが、変異は1つでもあり得る。雛形蛋白質集団また
は多重変異蛋白質集団の「メンバー」とは、それぞれの
集団に属する蛋白質メンバーをいう。
【0069】蛋白質の「配列データ」とは、その蛋白質
のアミノ酸配列データまたは、そのアミノ酸配列をコー
ドする核酸配列データをいう。核酸配列は、公知の配列
またはアミノ酸配列から推定される配列であり得る。
【0070】蛋白質の「立体構造データ」とは、その蛋
白質の三次元構造に関するデータをいう。蛋白質の立体
構造データには、代表的に、原子座標データ、分子トポ
ロジー、分子力場定数が挙げられる。原子座標データ
は、代表的に、X線結晶構造解析またはNMR構造解析
から得られたデータであり、このような原子座標データ
は、新規にX線結晶構造解析またはNMR構造解析を行
って得られ得るか、または公知のデータベース(例え
ば、プロテイン・データ・バンク(PDB))から入手
し得る。原子座標データはまた、モデリングまたは計算
によって作成されたデータであり得る。本明細書におい
て、「立体構造型」または「フォールド」とは、蛋白質
内部の二次構造の配置の仕方またはトポロジーをいう。
本発明の方法は、好ましくは雛形蛋白質の立体構造型を
おおむね保持する束縛条件下で実行され得る。
【0071】分子トポロジーは、市販もしくはフリーウ
ェアのツールプログラムを用いて算出し得るが、自作プ
ログラムを用いてもよい。また、市販の分子力場計算プ
ログラム(例えば、PRESTO、蛋白工学研究所株式
会社、に付属のpreparプログラム)に付属の分子
トポロジー計算プログラムを使用し得る。
【0072】分子力場定数(または分子力場ポテンシャ
ル)もまた、市販もしくはフリーウェアのツールプログ
ラムを用いて算出し得るが、自作データを用いてもよ
い。また、市販の分子力場計算プログラム(例えば、A
MBER、Oxford Molecular)に付属
の分子力場定数データを使用し得る。
【0073】蛋白質の「特性値」とは、蛋白質の物理化
学的性質をいう。特性値は、配列データおよび/または
立体構造データから計算され得る。蛋白質の特性値に
は、代表的に、経験的分子力学ポテンシャル、半経験的
量子力学ポテンシャル、非経験的量子力学ポテンシャ
ル、電磁気学ポテンシャル、溶媒和ポテンシャルおよび
構造エントロピーが挙げられるが、これらに限定されな
い。蛋白質の特性値は、蛋白質の生化学的特性に関する
値でもあり得る。蛋白質の特性値は、酵素またはシグナ
ル伝達蛋白質のような蛋白質またはポリペプチドの熱安
定性、化学安定性、酵素の基質化学選択性または基質立
体選択性、至適pHなどの生化学的特性と直接または間
接的な関連を有し得る。これらの直接的な関連または間
接的な関連については、当業者は容易に認識し得る。従
って、当業者は、自己の目的に従って「所望の特性値」
を設定し、計算パラメータを決定し得る。ここで、所望
の特性値は、本明細書において、ある蛋白質についての
特性値を変更させる際の目標値をいう。
【0074】本明細書において、「計算パラメータ」と
は、本発明の方法を実行する際に必要となるパラメータ
をいう。計算パラメータには、代表的に遺伝的アルゴリ
ズムの計算パラメータである。このような計算パラメー
タには、集団数、集団中の個体数、世代数、淘汰率、増
殖率、交叉率、もしくは変異率のいずれか1つ、または
それらの組み合わせを変化させることに関するパラメー
タが含まれる。ここで、「世代数」とは、遺伝的アルゴ
リズムを適用する数をいう。また、計算パラメータに
は、遺伝的アルゴリズムの反復についての判断の基準と
なる特性値もまた含まれる。計算パラメータには、変異
されるアミノ酸位置を特定する情報も挙げられる。さら
に、計算パラメータには、世代数Nに関する計算パラメ
ータが含まれ、ここで、Nは、N−1回目までに算出さ
れた蛋白質の特性値の最適値と、N回目で算出された特
性値の最適値とが初めて等価になる回数である。このよ
うに、計算パラメータは、変異の対象となる蛋白質の生
化学的特性と、直接または間接的に関連し得、従って、
これらの計算パラメータを適切に操作することによっ
て、所望の生化学的特性を有するか、またた所望の生化
学的特性に近い特性を有する蛋白質を生成し得る。
【0075】本発明は、一つの局面において、多重変異
蛋白質の最適化解を算出する方法に関する。
【0076】本発明の多重変異蛋白質アミノ酸配列の最
適化解を算出する方法は、多重変異蛋白質集団のメンバ
ーに対して、雛形蛋白質集団の立体構造データに基づい
て、該メンバーの各々のアミノ酸配列のアミノ酸側鎖立
体構造座標をデッドエンド排除アルゴリズムを用いて探
索すること、および該メンバーの構造エネルギー極小化
計算を実行することによって、最適な多重変異蛋白質の
立体構造座標を算出するステップと、該最適な多重変異
蛋白質の立体構造座標から特性値を算出するステップ
と、該多重変異蛋白質集団に対して遺伝的アルゴリズム
を適用して、該特性値を最適化するメンバーを算出する
ステップとを包含する。
【0077】図1は、多重変異蛋白質の最適化解を算出
する方法を示す例示的なフローチャートである。図1に
示される方法の処理は、コンピュータ500によって実
行され得る。
【0078】図6は、本発明の多重変異蛋白質の最適化
解を算出する方法の処理を実行するコンピュータの50
0の構成例を示す。
【0079】コンピュータ500は、入力部501と、
CPU502と、出力部503と、メモリ504と、バ
ス505とを備える。入力部501と、CPU502
と、出力部503と、メモリ504とは、バス505に
よって相互に接続されている。入力部501と出力部5
03とは入出力装置506に接続されている。
【0080】以下、コンピュータ500によって実行さ
れる多重変異蛋白質の最適化解を算出する方法の処理の
概略を説明する。
【0081】図1に示される本発明の多重変異蛋白質ア
ミノ酸配列の最適解を算出する方法の処理を表現するプ
ログラム(以下、最適化プログラム)は、例えば、メモ
リ502に格納されている。あるいは、最適化プログラ
ムは、フロッピーディスク、MO、CD−ROM、DV
D−ROMのような任意のタイプの記録媒体に記録され
得る。そのような記録媒体に記録された最適化プログラ
ムは、出入力装置506(例えば、ディスクドライブ)
を介してコンピュータ500のメモリ504にロードさ
れる。CPU502が最適化プログラムを実行すること
によって、コンピュータ500は、本発明の多重変異蛋
白質アミノ酸配列の最適解を算出する方法の処理を実行
する装置として機能する。
【0082】入力部501を介して、雛形蛋白質集団の
配列データおよび雛形蛋白質集団の立体構造データおよ
び計算パラメータを入力する。
【0083】CPU502は、入力部501で入力され
た情報をもとに、雛形蛋白質集団の各メンバーの特性値
を算出し、メモリ504に特性値データを格納する。次
いで、CPU502は、計算パラメータ、所望の特性値
および雛形蛋白質集団の立体構造および特性値に基づい
て、雛形蛋白質集団に遺伝的アルゴリズムを適用して、
多重変異蛋白質集団を生成する。その後、CPU502
は、多重変異蛋白質集団の各メンバーのアミノ酸残基の
アミノ酸側鎖に対してデッドエンド排除(Dead E
nd Elimination)アルゴリズムを適用し
て、アミノ酸側鎖の位置を最適化し、エネルギー極小化
計算を実行する。次いで、CPU502は、エネルギー
極小化された該多重変異蛋白質集団の各メンバーの立体
構造データおよび特性値を算出し、この算出された立体
構造データおよび特性値をメモリ504に格納し得る。
【0084】次に、CPU502は、計算パラメータ、
雛形蛋白質集団の各メンバーの特性値および多重変異蛋
白質集団の各メンバーの特性値に基づいて、再度上記ア
ルゴリズムを反復するか決定する。上記アルゴリズムが
反復されると決定した場合には、CPU502はさら
に、上記アルゴリズムを反復し得る。
【0085】反復する場合は、CPU502は、計算パ
ラメータ、所望の特性値および雛形蛋白質集団の特性値
のほかに、これまでに算出された特性も考慮して、雛形
蛋白質集団に遺伝的アルゴリズムを適用し、多重変異蛋
白質集団を生成し、その後の処理を続ける。
【0086】CPU502が反復を中止する判断を下し
た場合、CPU502は、メモリ504に格納されてい
る雛形蛋白質集団の各メンバーの特性値および多重変異
蛋白質集団の各メンバーの特性値から、所望の特性値を
有するメンバーを選択する。
【0087】その後、出力部503は、CPU502が
選択したメンバーの配列データおよび特性値を出力す
る。出力されたデータは、入出力装置506から出力さ
れ得る。
【0088】以下、本発明の方法の詳細を、図1を参照
しながら説明する。
【0089】本発明の方法は、多重変異蛋白質の最適化
解を算出する方法であって、代表的には、以下のステッ
プ(10)〜(50)を包含する。各ステップは、入力
部501、CPU502または出力部503(図6)に
よって実行される。
【0090】ステップ10:入力部501に、雛型蛋白
質集団の配列データおよびこの雛型蛋白質集団の立体構
造データが入力される。
【0091】このステップでは、本発明の方法において
基本データと使用される雛型蛋白質集団の配列データお
よびその立体構造データを入力する。入力されたデータ
は、メモリ504に格納され得る。配列データは、アミ
ノ酸配列または核酸配列であり得る。アミノ酸配列は、
修飾基(たとえば、糖鎖、脂肪酸、硫酸基など)で修飾
されていてもよい。アミノ酸配列に使用されるアミノ酸
は、天然アミノ酸、非天然アミノ酸のいずれかまたはそ
の両方であり得る。アミノ酸配列または核酸配列のデー
タは、公知のデータベース(SwissProt、Ge
nBankなど)から入手し得るか、または当該分野で
周知の技術(例えば、サンガー法、エドマン法など)を
用いて新たに決定し得る。入力される立体構造データ
は、例えば、原子座標データなどであり得る。原子座標
は、例えば、X線構造解析などによる実験データ、もし
くは、モデリングまたは計算などによって作成された座
標データであり得る。立体構造データはまた、例えば、
公知のデータベース(例えば、PDBなど)から入手し
得る。
【0092】ステップ12:CPU502は、上記雛型
蛋白質集団の配列データおよび立体構造データに基づい
て、該雛形蛋白質集団の各メンバーの特性値を算出す
る。算出されたデータは、メモリ504に格納され得
る。ステップ10で入力されたデータに基づいて、本発
明の方法において用いる特性値の計算を行う。特性値
は、最適値を決定する際の決定要因である。本発明で使
用され得る特性値には、例えば、経験的分子力学ポテン
シャル、半経験的量子力学ポテンシャル、非経験的量子
力学ポテンシャル、電磁気学ポテンシャル、溶媒和ポテ
ンシャルおよび構造エントロピーが挙げられる。
【0093】ステップ14:入力部501において、下
記のアルゴリズムを実行する際に用いる計算パラメータ
および所望の特性値が入力される。
【0094】このステップにおいて、本発明の方法にお
いてアルゴリズムを実施する際の計算パラメータなどが
入力される。入力されたデータは、メモリ504に格納
され得る。入力され得る計算パラメータには、遺伝的ア
ルゴリズムのパラメータ、例えば、世代数、変異率、淘
汰率、淘汰方法、交叉率、交叉方法のようなパラメータ
が挙げられる。計算パラメータは、選択基準となる特性
値であり得る。計算パラメータはまた、世代間の評価で
あり得、例えば、第N−1世代までの最適値と第N世代
までの最適値が一致した場合に計算を終了するという条
件であり得る。
【0095】所望の特性値とは、本発明の方法によって
入手することを目的とする多重変異体蛋白質についての
任意の特性値である。所望の特性値には、経験的分子力
学ポテンシャル、半経験的量子力学ポテンシャル、非経
験的量子力学ポテンシャル、電磁気学ポテンシャル、溶
媒和ポテンシャルおよび構造エントロピーなどが挙げら
れる。所望の特性値は、蛋白質の生化学的特性値でもあ
り得る。あるいは、所望の特性値は、蛋白質の生化学的
特性値と直接または間接的に関連し得る。従って、所望
の特性値は、蛋白質の生化学的特性の変異の様式に応じ
て変更させ得る。
【0096】当業者が、計算パラメータを、所望の特性
値に応じて、適切に設定し得ることは明らかである。
【0097】ステップ20:CPU502は、上記計算
パラメータ、所望の特性値および上記雛形蛋白質集団の
特性値に基づいて、上記雛形蛋白質集団に遺伝的アルゴ
リズムを適用して、多重変異蛋白質集団を生成する。
【0098】このステップにおいて遺伝的アルゴリズム
を雛形蛋白質集団に適用する。遺伝的アルゴリズムは、
上記に記載したように、入力された集団に対して、各個
体の評価処理、淘汰処理、増殖処理、交叉処理、突然変
異処理、および群評価処理を行う。淘汰処理、増殖処
理、交叉処理および突然変異処理は、すべて行ってもよ
く、1以上の処理を行わなくてもよい。ステップ20は
第1回目の遺伝的アルゴリズムの適用であり、入力され
た雛形蛋白質集団に対して遺伝的アルゴリズムが適用さ
れる。必要に応じて、遺伝的アルゴリズムが局所解に陥
らないように、lこの1回目の遺伝的アルゴリズムの突
然変異率(例えば、50%、75%、100%など)を
高くし、多様性を充分担保することが好ましい。このス
テップで生成されたデータは、メモリ504に格納され
得る。
【0099】ステップ22:CPU502は、上記多重
変異蛋白質集団の各メンバーのアミノ酸残基のアミノ酸
側鎖に対してデッドエンド排除(Dead End E
limination)アルゴリズムを適用して、上記
アミノ酸側鎖の位置を最適化し、次いで、エネルギー極
小化計算を実行する。
【0100】このステップでは、ステップ20で生成し
た多重変異蛋白質集団の各メンバーのアミノ酸配列の各
アミノ酸残基について、デッドエンド排除アルゴリズム
によりそれらの原子座標を最適化し、エネルギー最小化
計算を行う。デッドエンド排除アルゴリズムにおいて
は、全てのアミノ酸残基について処理を行ってもよく、
変異されていないアミノ酸残基の一部またはすべてを固
定して処理を行ってもよい。好ましくは、変異したアミ
ノ酸残基およびそれらの近傍の変異されていないアミノ
酸残基に対して処理を行う。このステップで生成された
データは、メモリ504に格納され得るか、または出力
部503から出力され得る。ここで、出力されるデータ
は、例えば、蛋白質を構成する原子各々を一意的に示す
名称、およびそれらの原子の構造座標であり得る。
【0101】ステップ24:CPU502は、エネルギ
ー極小化された上記多重変異蛋白質集団の各メンバーの
立体構造データおよび特性値を算出する。
【0102】このステップにおいて、エネルギー極小化
計算を行った上記の蛋白質集団の立体構造データは上記
に記載した周知方法などにより計算され、そしてステッ
プ12で行ったのと同様な方法で特性値が算出される。
算出されたデータは、解候補であり、必要に応じて格納
部に格納され得る。このステップで生成されたデータ
は、メモリ504に格納され得る。
【0103】ステップ30:CPU502は、上記計算
パラメータ、上記所望の特性値、上記雛形蛋白質集団の
各メンバーの特性値、および上記多重変異蛋白質集団の
各メンバーの特性値に基づいて、以下のステップ21、
23および25を実行する否か決定する。
【0104】ステップ20、22および24において算
出された多重変異蛋白質集団の特性値を評価して、所望
の特性値が得られた否か、または入力された遺伝的アル
ゴリズムの計算パラメータのいずれかに基づいて、再度
の遺伝的アルゴリズムを適用するかを決定する。このス
テップでの判定は、回数で決定してもよく、この場合、
例えば、N(ここで、Nは、N−1回目までに算出され
た蛋白質の特性値の最適値と、N回目で算出された特性
値の最適値とが初めて等価になる回数である)回目で反
復を停止させ得る。ステップ21、23および25を実
行しないと決定した場合は、ステップ40に進む。
【0105】ステップ21:ステップ30で実行すると
決定された場合、または下記のステップ31において反
復すると決定された場合、CPU502は、上記計算パ
ラメータ、所望の特性値および上記雛形蛋白質集団の特
性値、ならびにこれまでに生成されたすべての多重変異
蛋白質集団の各メンバーの特性値に基づいて、上記雛形
蛋白質集団に遺伝的アルゴリズムを適用して、新たな多
重変異蛋白質集団を生成する。このステップで生成され
たデータは、メモリ504に格納され得る。
【0106】このステップにおいて遺伝的アルゴリズム
を、雛形蛋白質集団および上記で生成された多重変異蛋
白質集団を含む集団に適用する。遺伝的アルゴリズム
は、上記に記載したように、入力された集団に対して、
各個体の評価処理、淘汰処理、増殖処理、交叉処理、突
然変異処理、および群評価処理を行う。淘汰処理、増殖
処理、交叉処理および突然変異処理は、すべて行っても
よく、1以上の処理を行わなくてもよい。このステップ
は、2回目以降の遺伝的アルゴリズムの適用ステップで
ある。2回目以降の遺伝的アルゴリズムにおいて遺伝的
アルゴリズムが適用される集団は、雛形蛋白質集団に含
まれる蛋白質メンバーの他に、これまでの遺伝的アルゴ
リズムによって生成した多重変異蛋白質集団の蛋白質メ
ンバーも存在し得る。必要に応じて、遺伝的アルゴリズ
ムが局所解に陥らないように、突然変異率(例えば、5
0%、75%または100%など)を高くし、多様性を
充分担保してもよい。このステップで生成されたデータ
は、メモリ504に格納され得る。
【0107】ステップ23:CPU502は、上記新た
な多重変異蛋白質集団の各メンバーのアミノ酸残基のア
ミノ酸側鎖に対してデッドエンド排除(Dead En
dElimination)アルゴリズムを適用して、
上記アミノ酸側鎖の位置を最適化し、次いで、エネルギ
ー極小化計算を実行する。このステップで生成されたデ
ータは、メモリ504に格納され得る。
【0108】このステップにおいて、ステップ21で生
成した多重変異蛋白質集団の各メンバーのアミノ酸配列
の各アミノ酸残基について、デッドエンド排除アルゴリ
ズムにより最適化し、エネルギー極小化計算が行われ
る。なお、すでに極小化計算がなされた蛋白質メンバー
については、この極小化計算が省略され得る。デッドエ
ンド排除アルゴリズムにおいては、全てのアミノ酸残基
について処理を行ってもよく、変異されていないアミノ
酸残基を固定して処理を行ってもよい。
【0109】ステップ25;CPU502は、エネルギ
ー極小化された上記新たな多重変異蛋白質集団の各メン
バーの立体構造データおよび特性値を算出する。
【0110】このステップにおいて、ステップ23にお
いてエネルギー極小化計算を行った上記の蛋白質集団の
立体構造データを当該分野で周知の方法により計算し、
そして蛋白質集団の各蛋白質メンバーの特性値を、ステ
ップ12で行ったのと同様な方法で算出する。算出され
たデータは、解候補であり、メモリ504に格納され得
る。
【0111】ステップ31:CPU502は、上記計算
パラメータ、上記所望の特性値、上記雛形蛋白質集団の
各メンバーの特性値、およびこれまでに生成されたすべ
ての多重変異蛋白質集団の各メンバーの特性値に基づい
て、さらにステップ21、23および25を実行する否
か決定する。このステップでの判定は、回数で決定して
もよく、この場合、例えば、N(ここで、Nは、N−1
回目までに算出された蛋白質の特性値の最適値と、N回
目で算出された特性値の最適値とが初めて等価になる回
数である)回目で反復を停止させ得る。ステップ21、
23および25を実行しないと決定した場合は、ステッ
プ40に進む。
【0112】ステップ40:CPU502は、上記雛形
蛋白質集団の各メンバーの特性値およびこれまでに生成
されたすべての多重変異蛋白質集団の各メンバーの特性
値から、上記所望の特性値を有するメンバーを選択す
る。
【0113】多重変異蛋白質集団の生成が終了した後、
このステップにおいて、これまでに得られた各蛋白質メ
ンバーの特性値を比較し、所望の特性値を有する蛋白質
メンバーを選択する。選択されるメンバーは、メモリ5
04に格納されているデータから選択され得る。選択す
る数は、1つでも、複数でもよく、例えば、少なくとも
5、10、20,50、100または200個選択し得
る。場合によっては、雛形蛋白質集団のメンバーから所
望の特性値を有するものが選ばれ得るが、通常は多重変
異蛋白質集団からのメンバーが所望の特性値を有する。
所望の特性値を有する個体は、必ずしも集団内での存在
比は高くならないことに注意する。
【0114】ステップ50:出力部503は、上記選択
されたメンバーの配列データおよび特性値を出力する。
このステップにおいて、ステップ40で選択された所望
の特性値を有する蛋白質メンバーの配列データおよび特
性値を出力する。出力形式は、どんな形式でもよいが、
例えば、特性値を階級付けし、最適値からランク付けし
てリスト形式で出力し得る。出力されるデータは、紙に
プリントアウトされてもよく、記憶媒体(例えば、磁気
記憶装置(例えば、ハードディスク、フロッピーディス
クなど)、光学記憶装置(例えば、MOディスクなど)
など)に格納されてもよい。
【0115】なお、図6に示される例では、多重変異蛋
白質の最適化解を算出する装置に含まれる各部が、ソフ
トウェアによって実現されている。しかし、多重変異蛋
白質の最適化解を算出する装置に含まれる各部の機能を
ハードウェア(回路)によって実現することも可能であ
る。
【0116】次に、本発明に適用される遺伝的アルゴリ
ズムを説明する。
【0117】図2は、GAにおけるある1世代のスキー
ムを示す。現世代の多重変異蛋白質アミノ酸配列集団
(201)に対してGAプロセスを実行する。本発明に
おけるGAプロセスは、対応する現世代の多重変異蛋白
質特性値データベース(203)より得た蛋白質特性値
および淘汰率により淘汰を実行するプロセス(20
2)、集団中の個体数変化および増殖率により増殖を実
行するプロセス(204)、交叉率により交叉を実行す
るプロセス(206)、突然変異率により突然変異プロ
セス(208)の組み合わせにより実行される。これら
のプロセスを順次実行し、次世代の多重変異蛋白質アミ
ノ酸配列集団(210)を得る。プロセス(202)〜
(208)の実行順序は図2と異なっていてもよく、い
ずれかのプロセスを実行しなくともよい。プロセス(2
02)〜(208)において使用されるGAの変数、す
なわち集団中の個体数、世代数、淘汰率、増殖率、交叉
率および突然変異率は各世代および各集団ごとに変更す
ることができ、かつ変異が許容されるアミノ酸種を限定
することができる。
【0118】以下、本発明において適用されるデッドエ
ンド排除(DEE)アルゴリズムを、説明する。
【0119】図3は、GAにおけるある1世代に対し
て、その世代に含まれる変異蛋白質集団各々の立体構造
原子座標を算出し、ついで各々の蛋白質特性値を算出す
るプロセスを示す。まず、現世代の多重変異蛋白質アミ
ノ酸配列集団(201)から、順次あるひとつの多重変
異蛋白質アミノ酸配列(220)を選択する。そのアミ
ノ酸配列情報を用いて、仮の変異蛋白質アミノ酸原子座
標を、雛形となる蛋白質立体構造原子座標(101)に
スーパーインポーズする(222)。この仮の原子座標
に対して、デッドエンド排除アルゴリズムを適用した操
作を実行し、変異蛋白質のアミノ酸側鎖原子座標を部分
最適化する(224)。さらにエネルギー極小化計算を
実行し、変異蛋白質のアミノ酸側鎖原子座標を全体最適
化し(226)、最適化された多重変異蛋白質原子座標
(228)を得る。プロセス(222)〜(226)を
順次実行し、現世代の多重蛋白質原子座標集団(23
0)を得る。これらの蛋白質原子座標を用いて、各々の
蛋白質特性値を算出し(240)、現世代の多重変異蛋
白質特性値データベース(242)を作成する。この特
性値データベースをGAにおける計算パラメータとして
用い得る。
【0120】一般に、蛋白質アミノ酸配列が多重変異す
る場合、各々のアミノ酸変異が蛋白質の特性に与える影
響はほぼ相加的であり、まれに特定の複数アミノ酸変異
が非相加的に影響を与えることが知られている。したが
って、所望の特性をもつ変異蛋白質を効率よく設計する
ためには、所望の特性を変異蛋白質に相加的に与える各
々のアミノ酸変異を組み合わせていくプロセスと、非相
加的な複数アミノ酸変異を同時に考慮するプロセスとを
組み合わせた方法が必要となる。広域的最適化方法であ
るGAはその探索特性により、上記した相加的なアミノ
酸変異と非相加的な複数アミノ酸変異とを同時に考慮し
て、多重変異蛋白質のアミノ酸配列を最適化することが
できる。
【0121】GAを適用することにより、解候補である
多重変異蛋白質アミノ酸配列のすべてに対して対応する
蛋白質立体構造原子座標および蛋白質特性値を算出する
ことなく、解候補の一部に対してのみ対応する蛋白質立
体構造原子座標および蛋白質特性値を算出し得、かつ計
算精度を低下させることなく、計算時間を大幅に短縮す
ることができる。
【0122】本発明の多重変異蛋白質アミノ酸配列の最
適解を算出する方法において、解候補である多重変異蛋
白質アミノ酸配列に対して、雛形となる蛋白質高次構造
をおおむね保持するという束縛条件下において、変異蛋
白質のアミノ酸側鎖立体構造に対してDEE計算を実行
し、ついでエネルギー極小化計算を適用することによ
り、多重変異蛋白質の立体構造原子座標を良い精度で算
出し得る。解候補である多重変異蛋白質の立体構造原子
座標は未知であることが多く、また新たに実験的に原子
座標を決定することは多くの資源を消費するので、前記
方法により、すべての候補について計算することなく原
子座標が精度良く算出できることは有用である。
【0123】得られた多重変異蛋白質の立体構造原子座
標を用いることにより、有用な蛋白質の特性値を精度よ
く算出することができる。多重変異蛋白質のアミノ酸配
列のみから得られる蛋白質の特性値は通常限られたもの
であり、また精度の高い特性値が得られない場合が多
い。立体構造原子座標を用いることにより、例えば変異
蛋白質の分子力学ポテンシャルまたは量子力学ポテンシ
ャルを算出し、変異蛋白質が熱変性する過程での自由エ
ネルギー変化量を算出することができる。この変化量は
蛋白質の熱的安定性や化学的安定性、さらには蛋白質と
他分子とが会合する過程での結合の強さを算出すること
ができる。
【0124】GAにおけるアミノ酸配列の変異におい
て、集団数、集団中の個体数、世代数、淘汰率、増殖
率、交叉率、突然変異率を変化させることにより、所望
の設計パラメータに応じた多重変異蛋白質アミノ酸配列
の最適化を行なうことができる。例えば集団中の個体数
と交叉率や突然変異率を適切に設定することにより、雛
形となる蛋白質のアミノ酸配列と、解候補とする多重変
異型アミノ酸配列との差異の大小を制御することが可能
であり、雛型に近い変異型または雛型から遠い変異型へ
の最適化を選択的に行なうことができる。
【0125】GAにおけるアミノ酸配列の変異におい
て、各々のアミノ酸の変異が許容されるアミノ酸種を限
定することにより、所望の設計諸元に応じた多重変異蛋
白質アミノ酸配列の最適化を行なうことができる。例え
ば特定のアミノ酸変異部位について、そのアミノ酸種を
塩基性アミノ酸種または酸性アミノ酸種等に限定するこ
とにより、多重変異蛋白質の静電的特性を雛形蛋白質と
変えることなく、変異蛋白質の熱安定性を最適化するこ
とができる。
【0126】
【実施例】DNA転写制御因子であるλ−リプレッサー
蛋白質の耐熱性向上設計を試みた実施例を以下に示す。
大腸菌の野生型λ−リプレッサー蛋白質の立体構造原子
座標はプロテイン・データ・バンク(Protein
Data Bank)に登録公開されており(登録番号
1LMB)、この原子座標を雛形蛋白質として用いた。
【0127】野生型λ−リプレッサー蛋白質のバリン−
36位、メチオニン−40位およびバリン−47位アミ
ノ酸残基はいわゆる疎水性コア部分に位置しており、こ
れら3残基を多重変異させることにより、野生型よりも
耐熱性に優れた変異型λ−リプレッサー蛋白質を設計で
きることが期待された。
【0128】実際の多重突然変異計算にあたっては、本
発明のアルゴリズムを実装した計算機プログラムshr
ike(鐘淵化学工業から入手可能)を用い、上記耐熱
性向上設計を実施した。この実装構成例を図4に示す。
【0129】GAプロセスにおける計算パラメータとし
ては、計算実施回数つまり集団数を2、変異蛋白質集団
のメンバー数つまり個体数を100、世代数を40、突
然変異率を初回のみ100%および次回以降を20%、
淘汰率すなわち生残率を70%、、交叉率を20%と
し、増殖率は個体数不変とした。変異蛋白質立体構造最
適化プロセスにおける所望の特性値としては、AMBE
R分子力場ポテンシャルおよび溶媒和ポテンシャルを用
いた。蛋白質特性算出プロセスにおける特性値として
は、 AMBER分子力場ポテンシャルおよび溶媒和ポ
テンシャルを用いて蛋白質全構造エネルギーを算出し、
そのエネルギー値を蛋白質の特性値として用いた。多重
変異蛋白質集団の相異なる2つのメンバーの該構造エネ
ルギー値の差を、それら2つの変異蛋白質の熱安定性の
指標とした。アミノ酸変異種の制約は、天然型アミノ酸
20種類のいずれへも変異可能であるという条件を用い
た。
【0130】GAプロセスにおいて算出されたすべての
多重変異蛋白質アミノ酸配列について、算出された上記
構造エネルギー値を指標として整理し、設計結果とし
た。その結果のうち上位120種の多重変異蛋白質につ
いて、それらの36位、40位および47位の変異型ア
ミノ酸配列をアミノ酸1文字コードを用いて図5Aおよ
び図5Bに示すとともに、それらの蛋白質特性値すなわ
ち上記構造エネルギー差の値もまた図5Aおよび図5B
に示す。
【0131】図5Aおよび図5Bに示した計算および設
計結果と、合成された該変異蛋白質の実験結果のうちで
データ入手が可能なものとの比較を以下に示す。すなわ
ち、文献 Journal of Molecular
Biology (1991) vol.219 3
59−376頁に記載の実験結果によれば、図5Aおよ
び図5B中の順位7位であるLeu−36、Leu−4
0、Ile−47変異蛋白質および順位44位であるI
le−36、Met−40、Val−47変異蛋白質
は、図5Aおよび図5B中の順位109位であるVal
−36、Met−40、Val−47野生型蛋白質より
も高い耐熱性を備えていることが示されている。
【0132】
【表1】
【0133】この結果をもって、本発明による変異蛋白
質設計手段を用いることにより、目的特性値を最適にす
る変異蛋白質設計案を、精度を低下させることなく選択
できることが示された。
【0134】本実施例において結果として出力された変
異蛋白質のアミノ酸の総数は、516であった。また、
本実施例に要した計算時間は、計算機としてSGI社O
rigin200を用いて3.6時間であった。一方、
本発明で示されたGAプロセスを適用せずに考えられる
すべてのアミノ酸配列の組み合わせを計算した場合、す
なわち変異箇所3箇所各々について20種類の天然型ア
ミノ酸変異(すなわち、合計8000個)を行なった場
合、上記計算機を用いて31.4時間の計算時間を要し
た。
【0135】本発明の方法での出力結果のうち上位20
0個と、従来技術の方法での出力結果のうち上位200
個とを比較すると、198個が重複していた。したがっ
て、上位200個を算出することに関する計算精度につ
いて、99%の計算精度を有することが明らかになっ
た。
【0136】このように、本発明の方法を用いると、計
算精度を低下させずに、時間を約1/10に短縮するこ
とが可能である。この結果をもって、本発明による変異
蛋白質設計手段を用いることにより、目的特性値を最適
にする変異蛋白質設計案を、短時間で選択できることが
示される。さらに、本発明の方法は、DEEアルゴリズ
ムのみを用いた蛋白質設計技術(Malakauska
s、S.ら(1998)、Nature Struct
ual Biology、5、470−475)では達
成されなかった、自然界での分子進化に近い最適解を得
ることができるという従来では予測不可能であった効果
が達成された。
【0137】
【発明の効果】変異蛋白質について自然条件に適合した
最適解を、迅速かつ精度を落とさずに求めることができ
る。
【図面の簡単な説明】
【図1】 遺伝的アルゴリズムを用いた変異蛋白質設計
方法のフローチャートである。
【図2】 変異蛋白質配列制御部の詳細構成例である。
【図3】 変異蛋白質立体構造最適化装置および変異蛋
白質特性値算出部の詳細構成例である。
【図4】 本発明の実装構成例である。
【図5A】 実施例の結果説明図である。
【図5B】 実施例の結果説明図の続きである。
【図6】 本発明を実行するコンピュータ500の構成
例である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 石井 清人 兵庫県明石市大蔵谷東山478番地の6 302 号室 Fターム(参考) 4B024 AA19 AA20 BA07 BA80 GA25 4H045 AA50 DA89 5B046 AA00 CA07 JA08 5B049 AA00 CC00 DD05 EE03 EE05 EE31 5B075 MM01 MM11 ND20 ND30 NK10 UU19

Claims (35)

    【特許請求の範囲】
  1. 【請求項1】 多重変異蛋白質アミノ酸配列の最適化解
    を算出する方法であって、 多重変異蛋白質集団のメンバーに対して、雛形蛋白質集
    団の立体構造データに基づいて、該メンバーの各々のア
    ミノ酸配列のアミノ酸側鎖立体構造座標をデッドエンド
    排除(Dead End Elimination)ア
    ルゴリズムを用いて探索すること、および該メンバーの
    構造エネルギー極小化計算を実行することによって、最
    適な多重変異蛋白質の立体構造座標を算出するステップ
    と、 該最適な多重変異蛋白質の立体構造座標から特性値を算
    出するステップと、 該多重変異蛋白質集団に対して遺伝的アルゴリズムを適
    用して、該特性値を最適化するメンバーを算出するステ
    ップとを包含する、方法。
  2. 【請求項2】 前記最適な多重変異蛋白質の立体構造座
    標を算出するステップが、雛形蛋白質の立体構造型をお
    おむね保持する束縛条件下で行われる、請求項1に記載
    の方法。
  3. 【請求項3】 多重変異蛋白質アミノ酸配列の最適化解
    を算出する方法であって、 (a)雛型蛋白質集団の配列データおよび該雛型蛋白質
    集団の立体構造データを入力するステップと、 (b)該雛型蛋白質集団の配列データおよび立体構造デ
    ータに基づいて、該雛形蛋白質集団の各メンバーの特性
    値を算出するステップと、 (c)該アルゴリズムを実行する際に用いる計算パラメ
    ータおよび所望の特性値を入力するステップと、 (d)該計算パラメータ、所望の特性値および該雛形蛋
    白質集団の各メンバーの立体構造データおよび特性値に
    基づいて、該雛形蛋白質集団に遺伝的アルゴリズムを適
    用して、多重変異蛋白質集団を生成するステップと、 (e)該多重変異蛋白質集団の各メンバーのアミノ酸残
    基のアミノ酸側鎖に対してデッドエンド排除アルゴリズ
    ムを適用して、該アミノ酸側鎖の位置を最適化し、次い
    で、エネルギー極小化計算を実行するステップと、 (f)エネルギー極小化された該多重変異蛋白質集団の
    各メンバーの立体構造データおよび特性値を算出するス
    テップと、 (g)該計算パラメータ、該所望の特性値、該雛形蛋白
    質集団の各メンバーの立体構造データおよび特性値、な
    らびに該多重変異蛋白質集団の各メンバーの立体構造デ
    ータおよび特性値に基づいて、ステップ(h)〜(j)
    を実行する否か決定するステップと、 (h)(g)で実行すると決定される場合に、該計算パ
    ラメータ、所望の特性値および該雛形蛋白質集団の特性
    値、ならびにこれまでに生成されたすべての多重変異蛋
    白質集団の各メンバーの特性値に基づいて、該雛形蛋白
    質集団に遺伝的アルゴリズムを適用して、新たな多重変
    異蛋白質集団を生成するステップと、 (i)該新たな多重変異蛋白質集団の各メンバーのアミ
    ノ酸残基のアミノ酸側鎖に対してデッドエンド排除(D
    ead End Elimination)アルゴリズ
    ムを適用して、該アミノ酸側鎖の位置を最適化し、次い
    で、エネルギー極小化計算を実行するステップと、 (j)エネルギー極小化された該新たな多重変異蛋白質
    集団の各メンバーの立体構造データおよび特性値を算出
    するステップと、 (k)該計算パラメータ、該所望の特性値、該雛形蛋白
    質集団の各メンバーの特性値、およびこれまでに生成さ
    れたすべての多重変異蛋白質集団の各メンバーの特性値
    に基づいて、ステップ(h)〜(j)を実行する否か決
    定するステップと、 (l)該雛形蛋白質集団の各メンバーの特性値およびこ
    れまでに生成されたすべての多重変異蛋白質集団の各メ
    ンバーの特性値から、該所望の特性値を有するメンバー
    を選択するステップと、 (m)該選択されたメンバーの配列データおよび特性値
    を出力するステップとを包含する、方法。
  4. 【請求項4】 前記雛形蛋白質集団の配列データがアミ
    ノ酸配列および/または核酸配列である、請求項1また
    は3に記載の方法。
  5. 【請求項5】 前記雛形蛋白質集団の立体構造データ
    が、原子座標データ、分子トポロジーデータおよび分子
    力場定数からなる群より選択される少なくとも1つのデ
    ータを含む、請求項1または3に記載の方法。
  6. 【請求項6】 前記雛形蛋白質集団が1のメンバーを含
    む、請求項1または3に記載の方法。
  7. 【請求項7】 前記雛形蛋白質集団が2以上のメンバー
    を含む、請求項1または3に記載の方法。
  8. 【請求項8】 前記特性値または前記所望の特性値が、
    経験的分子力学ポテンシャル、半経験的量子力学ポテン
    シャル、非経験的量子力学ポテンシャル、電磁気学ポテ
    ンシャル、溶媒和ポテンシャルおよび構造エントロピー
    からなる群より選択される少なくとも1つのデータを含
    む、請求項1または3に記載の方法。
  9. 【請求項9】 前記計算パラメータが、遺伝的アルゴリ
    ズムの計算パラメータである、請求項3に記載の方法。
  10. 【請求項10】 前記計算パラメータが、ステップ
    (g)においてなされる判断の基準となる特性値を含
    む、請求項3に記載の方法。
  11. 【請求項11】 前記計算パラメータが、変異されるア
    ミノ酸位置を特定する情報を含む、請求項3に記載の方
    法。
  12. 【請求項12】 前記デッドエンド排除アルゴリズム
    が、1以上のアミノ酸残基に関して適用される、請求項
    1または3に記載の方法。
  13. 【請求項13】 前記デッドエンド排除アルゴリズム
    が、すべてのアミノ酸残基に関して適用される、請求項
    1または3に記載の方法。
  14. 【請求項14】 改変される蛋白質の特性が、熱安定
    性、化学安定性、基質化学選択性、基質立体選択性およ
    び至適pH値から選択される、請求項1または3に記載
    の方法。
  15. 【請求項15】 前記アミノ酸配列が、天然アミノ酸、
    化学改変アミノ酸、非天然アミノ酸からなる群より選択
    される少なくとも1つの群から構成される、請求項4に
    記載の方法。
  16. 【請求項16】 前記多重変異蛋白質集団の各メンバー
    が、複数の同種分子、複数の異種分子、またはそれらの
    組み合わせから構成される少なくとも1つの蛋白質を含
    む分子複合体である、請求項1または3に記載の方法。
  17. 【請求項17】 多重変異蛋白質アミノ酸配列の最適化
    解を算出する装置であって、 多重変異蛋白質集団のメンバーに対して、雛形蛋白質集
    団の立体構造データに基づいて、該メンバーの各々のア
    ミノ酸配列のアミノ酸側鎖立体構造座標をデッドエンド
    排除(Dead End Elimination)ア
    ルゴリズムを用いて探索すること、および該メンバーの
    構造エネルギー極小化計算を実行することによって、最
    適な多重変異蛋白質の立体構造座標を算出する手段と、 該最適な多重変異蛋白質の立体構造座標から特性値を算
    出する手段と、 該多重変異蛋白質集団に対して遺伝的アルゴリズムを適
    用して、該特性値を最適化するメンバーを算出する手段
    とを包含する、装置。
  18. 【請求項18】 前記最適な多重変異蛋白質の立体構造
    座標を算出する手段が、雛形蛋白質の立体構造型をおお
    むね保持する束縛条件下で行われる、請求項17に記載
    の方法。
  19. 【請求項19】 多重変異蛋白質アミノ酸配列の最適化
    解を算出する装置であって、 (1)入力部と、 (2)計算部と、 (3)出力部とを備え、 ここで、該入力部は、 (a)雛型蛋白質集団の配列データおよび該雛型蛋白質
    集団の立体構造データを入力する手段と (b)該アルゴリズムを実行する際に用いる計算パラメ
    ータおよび所望の特性値を入力する手段とを含み、 該計算部は、 (c)該雛型蛋白質集団の配列データおよび立体構造デ
    ータに基づいて、該雛形蛋白質集団の各メンバーの特性
    値を算出する手段と、 (d)該計算パラメータ、所望の特性値および該雛形蛋
    白質集団の立体構造データおよび特性値、ならびにこれ
    までに生成されたすべての多重変異蛋白質集団の特性値
    に基づいて、該雛形蛋白質集団に遺伝的アルゴリズムを
    適用して、多重変異蛋白質集団を生成する手段と、 (e)該多重変異蛋白質集団の各メンバーのアミノ酸残
    基のアミノ酸側鎖に対してデッドエンド排除(Dead
    End Elimination)アルゴリズムを適
    用して、該アミノ酸側鎖の位置を最適化し、次いで、エ
    ネルギー極小化計算を実行する手段と、 (f)エネルギー極小化された該多重変異蛋白質集団の
    各メンバーの立体構造データおよび特性値を算出し、そ
    して該算出された立体構造データおよび特性値を格納す
    る手段と、 (g)該計算パラメータ、該雛形蛋白質集団の各メンバ
    ーの特性値および該多重変異蛋白質集団の各メンバーの
    特性値に基づいて、(d)〜(f)の手段において行わ
    れる集団生成ステップを反復するかを決定する手段と、 (i)該雛形蛋白質集団の各メンバーの特性値および該
    多重変異蛋白質集団の各メンバーの特性値から、該所望
    の特性値を有するメンバーを選択する手段とを含み、 該出力部は、 該選択されたメンバーの配列データおよび特性値を出力
    する手段を含む、装置。
  20. 【請求項20】 前記雛形蛋白質集団の配列データがア
    ミノ酸配列および/または核酸配列である、請求項17
    または19に記載の装置。
  21. 【請求項21】 前記雛形蛋白質集団の立体構造データ
    が、原子座標データ、分子トポロジーデータおよび分子
    力場定数からなる群より選択される少なくとも1つのデ
    ータを含む、請求項17または19に記載の装置。
  22. 【請求項22】 前記雛形蛋白質集団が1のメンバーを
    含む、請求項17または19に記載の装置。
  23. 【請求項23】 前記雛形蛋白質集団が2以上のメンバ
    ーを含む、請求項17または19に記載の装置。
  24. 【請求項24】 前記特性値または前記所望の特性値
    が、経験的分子力学ポテンシャル、半経験的量子力学ポ
    テンシャル、非経験的量子力学ポテンシャル、電磁気学
    ポテンシャル、溶媒和ポテンシャルおよび構造エントロ
    ピーからなる群より選択される少なくとも1つのデータ
    を含む、請求項17または19に記載の装置。
  25. 【請求項25】 前記計算パラメータが、遺伝的アルゴ
    リズムの計算パラメータである、請求項19に記載の装
    置。
  26. 【請求項26】 前記計算パラメータが、手段(g)に
    おいてなされる判断の基準となる特性値を含む、請求項
    19に記載の装置。
  27. 【請求項27】 前記計算パラメータが、変異されるア
    ミノ酸位置を特定する情報を含む、請求項19に記載の
    装置。
  28. 【請求項28】 前記デッドエンド排除アルゴリズム
    が、1以上のアミノ酸残基に関して適用される、請求項
    17または19に記載の装置。
  29. 【請求項29】 前記デッドエンド排除アルゴリズム
    が、すべてのアミノ酸残基に関して適用される、請求項
    17または19に記載の装置。
  30. 【請求項30】 改変される蛋白質の特性が、熱安定
    性、化学安定性、基質化学選択性、基質立体選択性およ
    び至適pH値から選択される、請求項17または19に
    記載の装置。
  31. 【請求項31】 前記アミノ酸配列が、天然アミノ酸、
    化学改変アミノ酸、非天然アミノ酸からなる群より選択
    される少なくとも1つの群から構成される、請求項20
    に記載の装置。
  32. 【請求項32】 前記多重変異蛋白質集団の各メンバー
    が、複数の同種分子、複数の異種分子、またはそれらの
    組み合わせから構成される少なくとも1つの蛋白質を含
    む分子複合体である、請求項17または19に記載の装
    置。
  33. 【請求項33】 データ格納部をさらに備える、請求項
    17または19に記載の装置。
  34. 【請求項34】 入力されたデータに基づいて、多重変
    異蛋白質アミノ酸配列の最適化解を算出する方法を実行
    するプログラムを記録したコンピュータ読み取り可能な
    記録媒体であって、 該方法は、多重変異蛋白質集団のメンバーに対して、雛
    形蛋白質集団の立体構造データに基づいて、該メンバー
    の各々のアミノ酸配列のアミノ酸側鎖立体構造座標をデ
    ッドエンド排除(Dead End Eliminat
    ion)アルゴリズムを用いて探索すること、および該
    メンバーの構造エネルギー極小化計算を実行することに
    よって、最適な多重変異蛋白質の立体構造座標を算出す
    るステップと、 該最適な多重変異蛋白質の立体構造座標から特性値を算
    出するステップと、 該多重変異蛋白質集団に対して遺伝的アルゴリズムを適
    用して、該特性値を最適化するメンバーを算出するステ
    ップとを包含する、記憶媒体。
  35. 【請求項35】 入力されたデータに基づいて、多重変
    異蛋白質アミノ酸配列の最適化解を算出する方法を実行
    するプログラムを記録したコンピュータ読み取り可能な
    記録媒体であって、 該方法は、(a)雛型蛋白質集団の配列データおよび該
    雛型蛋白質集団の立体構造データを入力するステップ
    と、 (b)該雛型蛋白質集団の配列データおよび立体構造デ
    ータに基づいて、該雛形蛋白質集団の各メンバーの特性
    値を算出するステップと、 (c)該アルゴリズムを実行する際に用いる計算パラメ
    ータおよび所望の特性値を入力するステップと、 (d)該計算パラメータ、所望の特性値および該雛形蛋
    白質集団の各メンバーの立体構造データおよび特性値に
    基づいて、該雛形蛋白質集団に遺伝的アルゴリズムを適
    用して、多重変異蛋白質集団を生成するステップと、 (e)該多重変異蛋白質集団の各メンバーのアミノ酸残
    基のアミノ酸側鎖に対してデッドエンド排除アルゴリズ
    ムを適用して、該アミノ酸側鎖の位置を最適化し、次い
    で、エネルギー極小化計算を実行するステップと、 (f)エネルギー極小化された該多重変異蛋白質集団の
    各メンバーの立体構造データおよび特性値を算出するス
    テップと、 (g)該計算パラメータ、該所望の特性値、該雛形蛋白
    質集団の各メンバーの立体構造データおよび特性値、な
    らびに該多重変異蛋白質集団の各メンバーの立体構造デ
    ータおよび特性値に基づいて、ステップ(h)〜(j)
    を実行する否か決定するステップと、 (h)(g)で実行すると決定される場合に、該計算パ
    ラメータ、所望の特性値および該雛形蛋白質集団の特性
    値、ならびにこれまでに生成されたすべての多重変異蛋
    白質集団の各メンバーの特性値に基づいて、該雛形蛋白
    質集団に遺伝的アルゴリズムを適用して、新たな多重変
    異蛋白質集団を生成するステップと、 (i)該新たな多重変異蛋白質集団の各メンバーのアミ
    ノ酸残基のアミノ酸側鎖に対してデッドエンド排除(D
    ead End Elimination)アルゴリズ
    ムを適用して、該アミノ酸側鎖の位置を最適化し、次い
    で、エネルギー極小化計算を実行するステップと、 (j)エネルギー極小化された該新たな多重変異蛋白質
    集団の各メンバーの立体構造データおよび特性値を算出
    するステップと、 (k)該計算パラメータ、該所望の特性値、該雛形蛋白
    質集団の各メンバーの特性値、およびこれまでに生成さ
    れたすべての多重変異蛋白質集団の各メンバーの特性値
    に基づいて、ステップ(h)〜(j)を実行する否か決
    定するステップと、 (l)該雛形蛋白質集団の各メンバーの特性値およびこ
    れまでに生成されたすべての多重変異蛋白質集団の各メ
    ンバーの特性値から、該所望の特性値を有するメンバー
    を選択するステップと、 (m)該選択されたメンバーの配列データおよび特性値
    を出力するステップとを包含する、記録媒体。
JP36849899A 1999-12-24 1999-12-24 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体 Expired - Fee Related JP3964087B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP36849899A JP3964087B2 (ja) 1999-12-24 1999-12-24 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体
EP00987705A EP1241598A4 (en) 1999-12-24 2000-12-21 METHOD AND DEVICE FOR CALCULATING THE OPTIMIZATION SOLUTION OF A MULTI-MUTANT PROTEIN AMINO ACID SEQUENCE, AND PROGRAM STORAGE MEDIUM FOR PERFORMING SAID METHOD
PCT/JP2000/009127 WO2001048640A1 (fr) 1999-12-24 2000-12-21 Procede et dispositif de calcul de la solution d'optimisation d'une sequence d'acides amines de proteines mutantes multiples, et support de stockage du programme permettant l'execution dudit procede
US10/177,646 US20030236629A1 (en) 1999-12-24 2002-06-20 Method and apparatus for calculating optimized solution of amino acid sequences of multiple-mutated proteins and storage medium storing program for executing the method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP36849899A JP3964087B2 (ja) 1999-12-24 1999-12-24 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体
US10/177,646 US20030236629A1 (en) 1999-12-24 2002-06-20 Method and apparatus for calculating optimized solution of amino acid sequences of multiple-mutated proteins and storage medium storing program for executing the method

Publications (2)

Publication Number Publication Date
JP2001184381A true JP2001184381A (ja) 2001-07-06
JP3964087B2 JP3964087B2 (ja) 2007-08-22

Family

ID=32232553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36849899A Expired - Fee Related JP3964087B2 (ja) 1999-12-24 1999-12-24 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体

Country Status (4)

Country Link
US (1) US20030236629A1 (ja)
EP (1) EP1241598A4 (ja)
JP (1) JP3964087B2 (ja)
WO (1) WO2001048640A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009095322A (ja) * 2007-10-19 2009-05-07 National Institute Of Advanced Industrial & Technology 安定な変異型タンパク質の製造方法
JP2009157896A (ja) * 2007-12-07 2009-07-16 National Institute Of Advanced Industrial & Technology 変異型タンパク質のアミノ酸配列設計方法および装置。
JP2010004763A (ja) * 2008-06-25 2010-01-14 Kaneka Corp β−ケトチオラーゼ変異体
WO2011090054A1 (ja) 2010-01-20 2011-07-28 株式会社カネカ 安定性が向上したnadhオキシダーゼ変異体とその利用法
WO2013002277A1 (ja) 2011-06-28 2013-01-03 株式会社カネカ 酵素機能改変方法及びその変異体
JP2016166159A (ja) * 2015-03-10 2016-09-15 一夫 桑田 プログラムおよび支援方法
JP2022512637A (ja) * 2018-10-11 2022-02-07 バークレー ライツ,インコーポレイテッド 最適化タンパク質生成の同定のためのシステム及び方法並びにそのためのキット
CN115409174A (zh) * 2022-11-01 2022-11-29 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100042375A1 (en) * 2007-08-08 2010-02-18 Wisconsin Alumni Research Foundation System and Method for Designing Proteins

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2286262A1 (en) * 1997-04-11 1998-10-22 California Institute Of Technology Apparatus and method for automated protein design

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009095322A (ja) * 2007-10-19 2009-05-07 National Institute Of Advanced Industrial & Technology 安定な変異型タンパク質の製造方法
JP2009157896A (ja) * 2007-12-07 2009-07-16 National Institute Of Advanced Industrial & Technology 変異型タンパク質のアミノ酸配列設計方法および装置。
JP2010004763A (ja) * 2008-06-25 2010-01-14 Kaneka Corp β−ケトチオラーゼ変異体
WO2011090054A1 (ja) 2010-01-20 2011-07-28 株式会社カネカ 安定性が向上したnadhオキシダーゼ変異体とその利用法
WO2013002277A1 (ja) 2011-06-28 2013-01-03 株式会社カネカ 酵素機能改変方法及びその変異体
JP2016166159A (ja) * 2015-03-10 2016-09-15 一夫 桑田 プログラムおよび支援方法
JP2022512637A (ja) * 2018-10-11 2022-02-07 バークレー ライツ,インコーポレイテッド 最適化タンパク質生成の同定のためのシステム及び方法並びにそのためのキット
CN115409174A (zh) * 2022-11-01 2022-11-29 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置
CN115409174B (zh) * 2022-11-01 2023-03-31 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置

Also Published As

Publication number Publication date
EP1241598A1 (en) 2002-09-18
EP1241598A4 (en) 2006-07-26
US20030236629A1 (en) 2003-12-25
WO2001048640A1 (fr) 2001-07-05
JP3964087B2 (ja) 2007-08-22

Similar Documents

Publication Publication Date Title
Kuhlman et al. Advances in protein structure prediction and design
Pedersen et al. Genetic algorithms for protein structure prediction
Judson Genetic algorithms and their use in chemistry
Schnell et al. Reaction kinetics in intracellular environments with macromolecular crowding: simulations and rate laws
Gautheret et al. Modeling the three-dimensional structure of RNA using discrete nucleotide conformational sets
Yavuz et al. Prediction of protein secondary structure with clonal selection algorithm and multilayer perceptron
CN113593634B (zh) 一种融合dna形状特征的转录因子结合位点预测方法
Hu et al. Selection of long oligonucleotides for gene expression microarrays using weighted rank-sum strategy
Jääskinen et al. Sparse Markov chains for sequence data
JP2001184381A (ja) 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体
Luo et al. Multi-resolution rigidity-based sampling of protein conformational paths
Skolnick et al. Computational studies of protein folding
Patel et al. Protein secondary structure prediction using support vector machines (SVMs)
Congdon et al. Preliminary results for GAMI: A genetic algorithms approach to motif inference
JP2005503535A (ja) 分子相互作用ネットワークの予測方法
Borrero et al. Folding kinetics of a lattice protein via a forward flux sampling approach
Bertrand et al. Topological rearrangements and local search method for tandem duplication trees
Nielsen Inferring gene flow between populations using statistical methods
Rocha et al. A multiobjective approach for protein structure prediction using a steady-state genetic algorithm with phenotypic crowding
Mirabello et al. Unmasking AlphaFold: integration of experiments and predictions in multimeric complexes
Dandekar et al. Computational methods for the prediction of protein folds
Berryman et al. Review of signal processing in genetics
Rocha et al. Using crowding-distance in a multiobjective genetic algorithm for protein structure prediction
Zhang What Has Genomics Taught An Evolutionary Biologist?
WO2008134261A2 (en) A method for protein structure determination, gene identification, mutational analysis, and protein design

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070523

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130601

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130601

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140601

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees