JPH0713959A - タンパク質立体構造予測方法 - Google Patents

タンパク質立体構造予測方法

Info

Publication number
JPH0713959A
JPH0713959A JP12481792A JP12481792A JPH0713959A JP H0713959 A JPH0713959 A JP H0713959A JP 12481792 A JP12481792 A JP 12481792A JP 12481792 A JP12481792 A JP 12481792A JP H0713959 A JPH0713959 A JP H0713959A
Authority
JP
Japan
Prior art keywords
protein
rule
learning
secondary structure
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP12481792A
Other languages
English (en)
Other versions
JP2551297B2 (ja
Inventor
Hiroshi Mamizuka
拓 馬見塚
Kenji Yamanishi
健司 山西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP12481792A priority Critical patent/JP2551297B2/ja
Publication of JPH0713959A publication Critical patent/JPH0713959A/ja
Application granted granted Critical
Publication of JP2551297B2 publication Critical patent/JP2551297B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【目的】 構造未知のタンパク質のアミノ酸配列情報か
ら、それに対応する二次構造(αヘリックス)を高い信
頼性で予測する。 【構成】 ステップ60で構造既知及び未知のタンパク
質アミノ酸配列を入力とし、それらのアライメント(整
合)から二次構造領域の正例を出力し、ステップ70で
構造既知のタンパク質アミノ酸配列を入力とし、それら
のアライメントから二次構造領域の負例を出力し、ステ
ップ80で前記正例と負例を入力とし、これら訓練デー
タのアミノ酸の実数値属性から確率的規則の実数値パラ
メータの推定値を出力し、ステップ90で情報量規準を
用いて前記確率的規則の最適化したセル数を出力とし、
ステップ100でテストデータ配列を入力とし、前記確
率的規則を使用し、計算を行ったテストデータ配列の各
領域に対する活性度を出力し、ステップ110で前記活
性度を入力とし、その中から最適値を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、構造未知のタンパク質
アミノ酸配列から、そのタンパク質の立体構造を予測す
る方法に関する。
【0002】
【従来の技術】タンパク質のアミノ酸配列情報を用い
て、そのタンパク質内の立体構造を予測する問題の一つ
として、タンパク質二次構造予測問題がある。二次構造
とは、αヘリックスやβシートといったタンパク質内部
でのまとまりのある構造を指し、二次構造予測問題は、
タンパク質のアミノ酸配列情報を用いて、3(あるいは
4)種類の二次構造の中から、一次配列の各残基(以
下、予測対象となる残基を中心残基とする)に対応する
一つの二次構造を予測する問題であり、二次構造予測が
可能になることにより、タンパク質の立体的な構造予測
も可能になると考えられている。図3は、本発明の二次
構造(αヘリックス)領域予測方法を示す模式図である
が、従来技術によるタンパク質の二次構造を予測する方
法として、例えば、1974年発行の米国の雑誌「バイ
オケミストリー」(Biochemistry)の第2
3巻222−245頁掲載のチョウ(Chou)とファ
スマン(Fasman)による論文「プレディクション
オブ プロテイン コンホメーション」(Predi
ction of protein conforma
tion)(以下、CF法と略す)、1978年発行の
米国の雑誌「ジャーナルオブ モレキュラ バイオロジ
ー」(Journal of Molecular B
iology)の第120巻97−120頁掲載のガル
ニエ(Garnier)らによる論文「アナリシス オ
ブ ザ アキュレシー アンド インプリケーションズ
オブ シンプル メソード フォー プレディクティ
ング ザ セコンダリー ストラクチャー オブ グロブラー プ
ロテインズ」(Analysis of the ac
curacy and implications o
f simple method for predi
cting the secondary struc
ture of globular protein
s)(以下、GOR法と略す)、1987年発行の米国
の雑誌「ジャーナル オブ モレキュラ バイオロジ
ー」(Jouranal of Molecular
Biology)の第198巻425−443頁掲載の
ギブラト(Gibrat)らによる論文「ファザー デ
ベロプメンツ オブ プロテイン セコンダリー ストラクチャ プレディクション ユー
ジング インホメーション セオリー:ニュー パラメ
ータズ アンド コンシダレーション オブ レジデュー ペアズ」(Further develo
pments of protein seconda
ry structure prediction u
sing information theory:N
ew parameters and conside
ration ofresidue pairs)(以
下、GGR法と略す)、及び1988年発行の米国の雑
誌「ジャーナル オブ モレキュラ バイオロジー」
(Journal of Molecular Bio
logy)の第202巻865−884頁掲載のキャン
(Qian)らによる論文「プレディクティング ザ
セコンダリー ストラクチャー オブ グロブラー
プロテインズ ユージング ニューラル ネットワーク
モデルズ」(Predicting the seco
ndary structure of globul
ar proteins using neural
network models)(以下、QS法と略
す)などがある。CF法は、タンパク質構造のデータベ
ースから各二次構造におけるアミノ酸の統計的な出現頻
度を求め、この頻度表を使用し、経験的な規則に基づく
予測を行っている。また、GOR法は、中心残基の二次
構造に対して、その残基から数残基離れた残基により独
立にもたらされる情報量の和を計算し、その相対値から
予測を行い、GGR法は、中心残基の二次構造に対し
て、その残基及びその残基から数残基離れた残基により
もたらされる情報量の和から予測を行っている。さら
に、QS法は、3層のフィードフォワード型のネットワ
ークを使用し、中心残基の前後8残基を含む配列を入力
とし、二次構造に対する中心残基及び周辺残基からの寄
与をニューラルネットワークを用いて抽出することによ
り予測を行っている。
【0003】
【発明が解決しようとする課題】3種類の二次構造の中
からアミノ酸配列の各残基に対応する二次構造を選択す
る予測を3状態予測と呼ぶが、その予測結果の尺度であ
る予測率は、従来の技術のいずれの方法も3状態予測で
60%台であり、αヘリックスにだけ限ってより予測率
の高い予測手法が望まれていた。また、従来の予測結果
は、アミノ酸一次配列内の各中心残基に対応する二次構
造を予測する残基対応の予測であり、一次配列内のどの
領域がどの二次構造に相当するかといった領域対応の予
測を行うことも重要であるにも関わらず、このような予
測方式に十分な検討がなされていなかった。さらに、ア
ミノ酸配列を文字列としてのみならず、そのアミノ酸の
性質(疎水性、分子量など)を考慮した予測を行うこと
による予測法も全く確立されていなかった。
【0004】
【課題を解決するための手段】第1の発明は、タンパク
質のアミノ酸配列からタンパク質の構造予測を行うため
の訓練データを抽出する訓練データ抽出手段と、訓練デ
ータから確率的規則の学習を行う学習手段と、学習され
た確率的規則を用いてテストアミノ酸配列データに対し
てテストを行うテスト手段とから成ることを特徴とす
る。
【0005】第2の発明は、前記訓練データ抽出手段
が、構造既知のタンパク質のアミノ酸配列に対して、同
じファミリーに属するタンパク質のアライメント(整
合)をとり、予測対象とする二次構造領域に対応する部
分配列を、二次構造領域の正例として抽出するステップ
と、構造既知のタンパク質の予測対象とする二次構造に
対応する部分配列に対して、構造既知のタンパク質から
なるデータベースの各配列のアライメントをとり、予測
対象とする二次構造に対応しない部分配列を、二次構造
領域の負例として抽出するステップとから成ることを特
徴とする。
【0006】第3の発明は、前記学習手段が、前記正例
と前記負例とからなる学習データのアミノ酸の種類か
ら、確率的規則を用いることにより、この確率的規則の
実数値パラメータを推定することを特徴とする。
【0007】第4の発明は、前記学習手段が、前記正例
と前記負例とからなる学習データのアミノ酸の実数値属
性から、確率的規則を用いることにより、この確率的規
則の実数値パラメータを推定することを特徴とする。
【0008】第5の発明は、前記学習手段が、前記正例
と前記負例とからなる学習データのアミノ酸の実数値属
性から、確率的規則を用いることにより、この確率的規
則の実数値パラメータを推定するステップと、前記ステ
ップの確率的規則におけるモデルを情報量規準を用いて
最適化するステップとから成ることを特徴とする。
【0009】第6の発明は、前記テストデータ配列に対
するテスト手段が、前記学習方法により学習された確率
的規則を使用し、テストデータ配列の各領域に対して、
その活動度を計算するステップと、計算された活動度の
中から最適値を選出するステップとから成ることを特徴
とする。
【0010】
【実施例】次に、本発明について図面を参照して詳細に
説明する。
【0011】図1は、本発明のタンパク質立体構造予測
方法の実施例を説明するフローチャートである。本実施
例では、対象とする二次構造としてαヘリックスを扱う
ものとする。
【0012】ステップ10は、第2の発明に含まれる。
このステップでは、αヘリックスの領域がわかっている
タンパク質のアミノ酸配列に対して、同じファミリーの
タンパク質、例えば、種が異なる同じタンパク質のアラ
イメント(整合)をとり、αヘリックスに対応する部分
配列を、αヘリックスの正例として抽出する。
【0013】例えば、ヘモグロビンというタンパク質の
β鎖の場合には、ヒトのヘモグロビンのαヘリックスの
位置は、X線結晶回折の結果から明らかになっており、
8個のαヘリックスの領域を有することが知られてい
る。従って、ヒトのヘモグロビンβ鎖に対して、他の
種、例えば、チンパンジー、ウマなどの他の種のヘモグ
ロビンβ鎖のアライメントをとり、8個のαヘリックス
に対応する領域をαヘリックスの正例として抽出する。
【0014】ステップ20は、第2の発明に含まれる。
このステップでは、αヘリックス位置の知られているタ
ンパク質のαヘリックスに対応する部分配列に対して、
αヘリックス位置の知られているアミノ酸配列データベ
ースの各配列のアライメントをとり、αヘリックスに対
応しない部分配列を、ステップ10で抽出されたαヘリ
ックスの正例に対する負例として抽出する。
【0015】ヘモグロビンβ鎖の例では、8個のαヘリ
ックスに対応する部分配列に対して、例えば、PDB
(Protein Data Bank)などのタンパ
ク質構造データベース内のいくつかの配列に対してアラ
イメントを行い、アライメントの結果得られた各部分配
列において、その配列の構造がαヘリックスではない場
合に、それらを負例として抽出する。例えば、負例抽出
の際のアライメントでは、一定の割合以上の相同性を保
持する部分配列を負例とすることが考えられる。具体的
には、アライメントによる相同性が30%以上の部分配
列を負例とする方法などがある。
【0016】抽出するデータ数については、例えば、α
ヘリックスの正例となる各領域における正例と負例との
割合を各領域についてそれぞれ等しくすることが考えら
れ、また例えば、その割合として正例、負例を同数とす
ることが考えられる。
【0017】ステップ30は、第3の発明、第4の発
明、第5の発明に共通に含まれ、確率的規則の実数値パ
ラメータを推定するステップである。このステップで
は、ステップ10で求めた正例とステップ20で求めた
負例からなる学習データから、確率的規則を用いること
により、この確率的規則の実数値パラメータを推定す
る。このステップでの確率的規則の構造を、以下に示
す。
【0018】確率的規則とは、ここでは任意の与えられ
た配列の領域に対して、αヘリックスが対応する確率を
与える確率分布のことである。各χi (i=1,…,
n)をそれぞれ属性値の空間として、χをそれらの直
積、すなわち、χ=χ1 ×χ2 ×・・・×χn と書く。
【0019】例えば、χは20種類のアミノ酸からなる
一つの集合を表す場合や、またχ=χ1 ×χ2 で、χ1
が疎水性を表す数値の範囲かつχ2 が分子量を表す数値
の範囲を表す場合などがある。この例での前者の場合が
第3の発明で使用され、それ以外の場合が第4の発明及
び第5の発明で使用される。Sをある領域の長さWの配
列であり、各Sはχ×χ×・・・×χの元とみなし、ま
た、Xi を配列Sの左から数えてi番目の残基であり、
P(α|Xi )が、Xi に対応する二次構造がαヘリッ
クスである確率とする。ここで、配列S に対応する二次
構造がαヘリックスである確率P(α|S)は、P(α
|Xi )の積として次のようにかけるものと仮定する。
【0020】 P(α|S)=Пi = 1 w P(α|Xi ) さらに、各P(α|Xi )の具体的表現として、例え
ば、有限分割型確率的規則を使用する。有限分割型確率
的規則は次のような構造をもつ条件付き確率分布であ
り、以下のように構成する。前記配列Sのi番目の残基
における属性の実数値のとり得る範囲を重なり合わない
部分領域(以下、これをセルと呼ぶ)に分割し、mを全
セル数、Ck をk番目のセルとした時に、Xi がm個の
セルの内のCk に含まれる場合に、P(α|Xi )=P
k (i)とする。ここで、
【0021】
【数1】
【0022】であり、これを確率パラメータと呼ぶ。図
4は、有限分割型確率規則の構造を示す模式図である
が、この図では、一例として、値が0から1の範囲をと
る一つの属性により確率パラメータを推定する場合を示
す。
【0023】確率パラメータは、各セルに含まれる正例
及び負例のデータ数を用いて推定する。mをセルの数、
k + (i)をi番目の位置でのk番目のセルに含まれ
る正例数、Nk - (i)をi番目の位置でのk番目のセ
ルに含まれる負例数、Nk (i)をi番目の位置でのk
番目のセルに含まれる正例数と負例数の和とし、i番目
の位置でのk番目のセルにおける推定値を
【0024】
【数2】
【0025】とする。例えば、次式のラプラス推定量に
よって、各セルに対する確率パラメータを計算する。
【0026】
【数3】
【0027】ただし、推定量はラプラス推定量のみなら
ず、多くの推定量が使用できる。
【0028】ステップ40は、第6の発明に含まれる。
このステップでは、ステップ30において学習された確
率的規則を使用し、テストデータ配列の各領域に対し
て、その活性度を計算する。
【0029】ここでは、活性度として尤度を使用する。
【0030】具体的には、確率的規則が構成された長さ
wのあるαヘリックス領域を考える。テストデータのア
ミノ酸配列に対して、前記領域の長さwより小さな長さ
tのw−t+1個のすべての部分領域を設け、このw−
t+1個の部分領域それぞれをテストアミノ酸配列の左
から順にあてはめていき、テスト配列の各領域の尤度を
計算する。
【0031】さて、k番目の長さtの部分領域に対し
て、αヘリックス領域の確率パラメータを左から順に並
べたものをξk =(θ1 ,…,θt ),θi =(P
1 (i),…,Pm (i))(i=1,…,t)と書
く。
【0032】ここで、mはセルの数であり、θi は既に
学習によって値が求められている。
【0033】w−t+1個の部分領域の位置に対応し
て、このmt次元パラメータは、w−t+1個求められ
るので、それをξ1 ,…,ξw - t + 1 とする。
【0034】前記パラメータを使用して、任意の長さt
のテストアミノ酸配列Гに対して、尤度がw−t+1通
り次のように計算できる。
【0035】 P(α|Г:ξk )(k=1,…,w−t+1) ただし、各kについて、 P(α|Г:ξk )=Πi = 1 t P(α|Г:θi ) ここで、P(α|Г:θi )はXi がl番目のセルに入
れば、P(i)(l=1,…,m)と計算する。ま
た、PI (i)(l=1,…,m)はすでに学習されて
いる。
【0036】例えば、前記有限分割型確率的規則でのア
ミノ酸の属性値の空間がある一つの属性値のみからなる
場合で、またセルの数が3であり、セルに入る推定量は
ラプラス推定量により求めるとする。このとき、あるα
ヘリックス領域のk番目の長さ5の部分領域のi番目の
位置でのl番目のセルの正例数をNl + (i)、l番目
のセルの負例数をNl - (i)、正例数と負例数の和を
l (i)とする。すると、i番目の位置でのl番目の
セルの推定量は、例えば、Pl (i)=(Nl + (i)
+1)/(Nl (i)+2)として得られる。
【0037】ここで、テストアミノ酸配列のウィンドウ
の大きさ5の領域Гに対してテストを行うとし、領域Г
のそれぞれの残基は前記部分領域での構成された学習規
則での各1,2,3,2,1番目のセルに入る属性の実
数値を有するとする。すると、前記k番目の部分領域に
よるテストアミノ酸配列の領域Гの活性度は尤度P(α
|Г:k)として、次式のように計算される。 P(α|Г:k)={(N1 + (1)+1)/(N
1 (1)+2)}{(N2 +(2)+1)/(N
2 (2)+2)}{(N3 + (3)+1)/(N
3 (3)+2)}{(N2 + (4)+1)/(N
2 (4)+2)}{(N1 + (5)+1)/(N
1 (5)+2)} w−t+1個の部分領域により、テストアミノ酸配列の
とり得るすべての領域に対して、この尤度計算を行う。
また、αヘリックス領域が複数個存在すれば、その各領
域について同様の尤度計算を行う。
【0038】従って、テストアミノ酸配列内でのウィン
ドウの大きさに対応したすべての領域に対して、尤度が
出力として得られることになる。
【0039】以上のウィンドウを使用した各領域に対応
する尤度計算により、一つ一つの残基に対してαヘリッ
クスが対応する確率を計算するのではなく、テストアミ
ノ酸配列の各部分領域にαヘリックスが対応する確率を
尤度として計算することができる。
【0040】ステップ50は、第6の発明に含まれる。
このステップでは、前記ステップ40により計算された
複数の活性度の中で、Гに対して最適な一つの活性度を
求め、さらにテストアミノ酸配列全体における活性度の
変化を出力する。
【0041】ステップ40に引き続きここでは、活性度
として尤度を使用する。
【0042】例えば、最適値P(α|Г:ξk * )を以
下で定める。 P(α|Г:ξk * )=max{P(α|Г:ξ1 ),
…,P(α|Г:ξw -t + 1 )}. αヘリックス領域が複数個あれば、各領域について、同
じГに対して同様な尤度計算を行ない、αヘリックス領
域全体を通じて最大の尤度を最適値として選ぶ方法も考
えられる。
【0043】さらに、テスト配列内の尤度が与えられた
各領域において、最大の尤度を領域内の各残基の最適値
とする、あるいは、領域内の各残基に対しては、その残
基を含む領域の得られた尤度の平均を各残基の最適値と
する、などの方法を使用し、テストアミノ酸配列全体に
対する尤度の変化を出力する。
【0044】以上の図1における学習及び予測方法は、
αヘリックス以外の二次構造予測についても適用でき
る。
【0045】図2は、本発明のタンパク質立体構造予測
方法の実施例を説明するフローチャートである。本実施
例では、対象とする二次構造としてαヘリックスを扱う
ものとする。
【0046】ステップ60は、図1のステップ10と同
じ処理を行ないαヘリックス領域予測のために必要な正
例を抽出する。
【0047】ステップ70は、図1のステップ20と同
じ処理を行ないαヘリックス領域予測のために必要な負
例を抽出する。
【0048】ステップ80は、図1のステップ30と同
じ処理を行ない確率的規則を適用し、この確率的規則の
実数値パラメータを推定する。
【0049】ステップ90は、第5の発明にのみ含まれ
る。このステップでは、確率的規則のモデルを情報量規
準を用いて最適化する。使用する情報量規準としては、
例えば、MDL(minimum descripti
on length)規準などが考えられる。
【0050】前記有限分割型確率的規則にあてはめる
と、MDL原理は、データ記述長と有限分割型確率的規
則による記述長との和が最小である時に最適な確率的規
則が構成されているとする。なお、MDL原理について
は、1978年発行の米国の雑誌「オートマティカ」
(Automatica)の第14巻465−471頁
記載のリサネン(Rissanen)による論文「モデ
リング バイ ショーテスト データ ディスクリプシ
ョン」(Modeling by shortest
data description)に詳しく記載され
ている。
【0051】前記有限分割型確率的規則に対するデータ
の記述長は、規則の対数尤度の負をとることによって、
次のように計算できる。ただし、以下では対数の底はす
べて2とする。
【0052】
【数4】
【0053】また、前記有限分割型確率的規則の記述長
は、各確率パラメータpK (i)の推定値はおよそlo
g Nk (i)ビットで記述できるから、次のように計
算できる。
【0054】
【数5】
【0055】したがって、MDL原理によれば、次式が
最小になるセル数mの大きさを確率規則を構成する最適
なセル数とする。
【0056】
【数6】
【0057】ステップ100は、図1のステップ40と
同じ処理を行ない、ステップ90を使用してモデルが最
適化された確率的規則を使用し、テストアミノ酸配列デ
ータの各領域に対して、その活性度を計算する。
【0058】ステップ110は、図1のステップ50と
同じ処理を行ないステップ40により求められた複数の
活性度から、配列全体に対する活性度の変化を出力す
る。
【0059】以上の図2における学習及び予測方法は、
αヘリックス以外の二次構造予測についても適用でき
る。
【0060】
【発明の効果】二次構造既知のタンパク質のアミノ酸配
列情報から、二次構造未知のタンパク質の二次構造を従
来技術に対して高い精度で予測することができる。特
に、アルブミンのαヘリックス領域を70%以上の高い
精度で予測可能である。また、MDL原理などの情報量
規準によりモデルを最適化することにより、確率的規則
の構造を理論的に最適化することが可能になる。
【図面の簡単な説明】
【図1】本発明のタンパク質立体構造予測方法の一実施
例を示すフローチャート
【図2】本発明のタンパク質立体構造予測方法の一実施
例を示すフローチャート
【図3】本発明の二次構造(αヘリックス)領域予測方
法の模式図
【図4】本発明で使用する確率規則の一例である有限分
割型確率規則の具体例を示す模式図
【符号の説明】
10 正例抽出 20 負例抽出 30 確率的規則による実数値パラメータ推定 40 テスト配列各領域に対する活性度計算 50 テスト配列に対する予測値算出 60 正例抽出 70 負例抽出 80 確率的規則による実数値パラメータ推定 90 情報量規準による最適化 100 テスト配列各領域に対する活性度計算 110 テスト配列に対する予測値算出

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 タンパク質のアミノ酸配列からタンパク
    質の構造予測を行うための訓練データを抽出する訓練デ
    ータ抽出手段と、訓練データから確率的規則の学習を行
    う学習手段と、学習された確率的規則を用いてテストア
    ミノ酸配列データに対してテストを行うテスト手段とか
    ら成ることを特徴とするタンパク質立体構造予測方法。
  2. 【請求項2】 前記訓練データ抽出手段が、構造既知の
    タンパク質のアミノ酸配列に対して、同じファミリーに
    属するタンパク質のアライメント(整合)をとり、予測
    対象とする二次構造領域に対応する部分配列を、二次構
    造領域の正例として抽出するステップと、構造既知のタ
    ンパク質の予測対象とする二次構造に対応する部分配列
    に対して、構造既知のタンパク質からなるデータベース
    の各配列のアライメントをとり、予測対象とする二次構
    造に対応しない部分配列を、二次構造領域の負例として
    抽出するステップとから成ることを特徴とする請求項1
    記載のタンパク質立体構造予測方法。
  3. 【請求項3】 前記学習手段が、前記正例と前記負例と
    からなる学習データのアミノ酸の種類から、確率的規則
    を用いることにより、この確率的規則の実数値パラメー
    タを推定することを特徴とする請求項1記載のタンパク
    質立体構造予測方法。
  4. 【請求項4】 前記学習手段が、前記正例と前記負例と
    からなる学習データのアミノ酸の実数値属性から、確率
    的規則を用いることにより、この確率的規則の実数値パ
    ラメータを推定することを特徴とする請求項1記載のタ
    ンパク質立体構造予測方法。
  5. 【請求項5】 前記学習手段が、前記正例と前記負例と
    からなる学習データのアミノ酸の実数値属性から、確率
    的規則を用いることにより、この確率的規則の実数値パ
    ラメータを推定するステップと、前記ステップの確率的
    規則におけるモデルを情報量規準を用いて最適化するス
    テップとから成ることを特徴とする請求項1記載のタン
    パク質立体構造予測方法。
  6. 【請求項6】 前記テストデータ配列に対するテスト手
    段が、前記学習方法により学習された確率的規則を使用
    し、テストデータ配列の各領域に対して、その活動度を
    計算するステップと、計算された活動度の中から最適値
    を選出するステップとから成ることを特徴とする請求項
    1記載のタンパク質立体構造予測方法。
JP12481792A 1992-05-18 1992-05-18 タンパク質立体構造予測方法 Expired - Fee Related JP2551297B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12481792A JP2551297B2 (ja) 1992-05-18 1992-05-18 タンパク質立体構造予測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12481792A JP2551297B2 (ja) 1992-05-18 1992-05-18 タンパク質立体構造予測方法

Publications (2)

Publication Number Publication Date
JPH0713959A true JPH0713959A (ja) 1995-01-17
JP2551297B2 JP2551297B2 (ja) 1996-11-06

Family

ID=14894851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12481792A Expired - Fee Related JP2551297B2 (ja) 1992-05-18 1992-05-18 タンパク質立体構造予測方法

Country Status (1)

Country Link
JP (1) JP2551297B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09159666A (ja) * 1995-12-08 1997-06-20 Fujitsu Ltd 蛋白質の二次構造予測方法及び装置
WO1999018440A1 (en) * 1997-10-02 1999-04-15 Akiko Itai Method of inferring three-dimensional structure of protein
WO2020203551A1 (ja) * 2019-03-29 2020-10-08 富士フイルム株式会社 特徴量算出方法、特徴量算出プログラム、及び特徴量算出装置、スクリーニング方法、スクリーニングプログラム、及びスクリーニング装置、化合物創出方法、化合物創出プログラム、及び化合物創出装置
JP2022531295A (ja) * 2019-05-02 2022-07-06 ボード オブ リージェンツ,ザ ユニバーシティ オブ テキサス システム 合成タンパク質の安定性を高めるためのシステムおよび方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09159666A (ja) * 1995-12-08 1997-06-20 Fujitsu Ltd 蛋白質の二次構造予測方法及び装置
WO1999018440A1 (en) * 1997-10-02 1999-04-15 Akiko Itai Method of inferring three-dimensional structure of protein
US7212924B1 (en) 1997-10-02 2007-05-01 Akiko Itai Method of inferring three-dimensional structure of protein
WO2020203551A1 (ja) * 2019-03-29 2020-10-08 富士フイルム株式会社 特徴量算出方法、特徴量算出プログラム、及び特徴量算出装置、スクリーニング方法、スクリーニングプログラム、及びスクリーニング装置、化合物創出方法、化合物創出プログラム、及び化合物創出装置
JPWO2020203551A1 (ja) * 2019-03-29 2020-10-08
JP2022531295A (ja) * 2019-05-02 2022-07-06 ボード オブ リージェンツ,ザ ユニバーシティ オブ テキサス システム 合成タンパク質の安定性を高めるためのシステムおよび方法

Also Published As

Publication number Publication date
JP2551297B2 (ja) 1996-11-06

Similar Documents

Publication Publication Date Title
JP6890607B2 (ja) 自動多閾値特徴フィルタリング方法及び装置
Lin et al. An efficient deep reinforcement learning model for urban traffic control
Imoto et al. Combining microarrays and biological knowledge for estimating gene networks via Bayesian networks
CN105279397B (zh) 一种识别蛋白质相互作用网络中关键蛋白质的方法
CN108197427B (zh) 基于深度卷积神经网络的蛋白质亚细胞定位方法和装置
WO2021218791A1 (zh) 一种配体-蛋白质相互作用的预测方法及装置
Yan et al. Hm-nas: Efficient neural architecture search via hierarchical masking
CN113517076A (zh) 基于图神经网络与迁移学习的疾病病例数预测方法及系统
JPH11316754A (ja) 実験計画法及び実験計画プログラムを記録した記録媒体
JP2551297B2 (ja) タンパク質立体構造予測方法
EP4250301A1 (en) Method for estimating a variable of interest associated to a given disease as a function of a plurality of different omics data, corresponding device, and computer program product
CN112270950A (zh) 一种基于网络增强和图正则的融合网络药物靶标关系预测方法
CN113296947B (zh) 基于改进XGBoost模型的资源需求预测方法
JPH07105179A (ja) タンパク質立体構造予測方法
CN114120367A (zh) 元学习框架下基于圆损失度量的行人重识别方法及系统
JP2940529B2 (ja) タンパク質立体構造予測方法
WO2019205811A1 (zh) 一种随机权网络泛化能力改进方法、装置和计算机可读存储介质
Alrubaie Cascade-Forward neural network for volterra integral equation solution
Chung et al. Predicting protein-protein interactions from one feature using SVM
JP2005258480A (ja) 能動学習システム及びそれに用いる能動学習法並びにそのプログラム
Singh et al. Multi-statistic approximate Bayesian computation with multi-armed bandits
Zakrisson et al. A tree-based varying coefficient model
JP2658823B2 (ja) タンパク質立体構造予測方法
GB2508056A (en) Methods for calling a genomic sequence
Bertl et al. Approximate maximum likelihood estimation

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19960702

LAPS Cancellation because of no payment of annual fees