JP3370942B2 - タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体 - Google Patents

タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体

Info

Publication number
JP3370942B2
JP3370942B2 JP02299799A JP2299799A JP3370942B2 JP 3370942 B2 JP3370942 B2 JP 3370942B2 JP 02299799 A JP02299799 A JP 02299799A JP 2299799 A JP2299799 A JP 2299799A JP 3370942 B2 JP3370942 B2 JP 3370942B2
Authority
JP
Japan
Prior art keywords
protein
amino acid
designated
compound
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02299799A
Other languages
English (en)
Other versions
JP2000222421A (ja
Inventor
正人 北島
倫宏 大屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP02299799A priority Critical patent/JP3370942B2/ja
Publication of JP2000222421A publication Critical patent/JP2000222421A/ja
Application granted granted Critical
Publication of JP3370942B2 publication Critical patent/JP3370942B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、タンパク質の性質
を解析するために有益な情報を得るためのタンパク質解
析支援装置に係り、詳しくは、タンパク質を一次配列記
述したアミノ酸残基列から低分子化合物と相互作用する
と予想される部分を構成するアミノ酸残基の配列パター
ンを抽出するようにしたタンパク質解析支援装置に関す
る。
【0002】また、本発明は、上記のようなタンパク質
解析支援装置での処理をコンピュータに行わせるための
プログラムを格納したプログラムを格納した記憶媒体に
関する。
【0003】
【従来の技術】低分子化合物と相互作用を行うタンパク
質を予測することは、低分子化合物(基質)を変化さる
ために必要となるタンパク質(酵素)が予測できるな
ど、製薬の分野や生化学の分野において重要なことであ
る。タンパク質とその複雑に折れ曲がった糸状のタンパ
ク質に絡み合うように存在する低分子化合物との三次元
構造について記述したデータベース(例えば、PDB:
Protein Data Bank )が提供されている。
【0004】従来、このようなデータベースを用いて、
低分子化合物(結合物質)と相互作用(結合)するタン
パク質のアミノ酸残基列を検索する装置が提案されてい
る(特開平7−056931)。この従来の装置では、
タンパク質と低分子化合物を指定すると、データベース
に記述されるその指定タンパク質及び低分子化合物の三
次元構造データに基づいて、低分子化合物の各要素から
所定距離以内のタンパク質のアミノ酸残基列を低分子化
合物との結合部位として抽出している。
【0005】
【発明が解決しようとする課題】例えば、図1に示すよ
うに、タンパク質Pは、糸状に複雑に折れ曲がった構造
となっているため、そのタンパク質Pに絡まった状態で
存在する低分子化合物Cと近接する(所定距離以内)タ
ンパク質Pのアミノ酸残基部分C1、C2は、一次配列
されたアミノ酸残基列中において、とびとびに存在する
ことになる。従って、上述した従来の装置では、この結
合部位として抽出されるアミノ酸残基列C1、C2が個
別的に得られるだけである。
【0006】タンパク質の性質はその三次元構造に依存
するものであり、上記のように個別的に抽出されたアミ
ノ酸残基列C1、C2だけでは、アミノ酸残基列C1と
C2の配列順序や、その間の条件が不明であり、三次元
構造に依存するタンパク質の性質を解析するうえで、十
分有益な情報とはいえない。即ち、アミノ酸残基の一次
配列により記述されたタンパク質のなかで、個別的に抽
出されたアミノ酸残基列C1、C2が、C1、C2の順
序で存在するのか、C2、C1の順序で存在するのか、
あるいは、C1とC2との間は、どのような条件となっ
ているのか等の情報が不明である。
【0007】そこで、本発明の第一の課題は、低分子化
合物と相互作用するタンパク質のアミノ酸残基部分を当
該タンパク質の構造に関する情報をより多く含む形で抽
出できるようにしたタンパク質解析支援装置を提供する
ことである。本発明の第二の課題は、上記のようなタン
パク質解析支援装置での処理をコンピュータで行わせる
ためのプログラムを格納した記憶媒体を提供することで
ある。
【0008】
【課題を解決するための手段】上記第一の課題を解決す
るため、本発明は、請求項1に記載されるように、タン
パク質とそのタンパク質の近傍に存在する化合物の三次
元構造データを記述したデータベースを用いて、指定さ
れた化合物と相互作用すると予測される指定されたタン
パク質のアミノ酸残基部分の情報を得るためのタンパク
質解析支援装置において、指定された化合物において指
定された種類の各原子と所定距離範囲内に存在する指定
されたタンパク質において指定された種類の原子を含む
アミノ酸残基を上記データベースの情報を用いて検索す
る検索手段と、該検索手段での検索結果として得られた
各アミノ酸残基を所定の表記規則に従って当該指定され
たタンパク質を構成するアミノ酸残基の一次配列の順に
配列してパターン化した配列パターンを生成する配列パ
ターン生成手段とを有し、この配列パターンを指定され
た化合物と相互作用するタンパク質のアミノ酸残基部分
を含む部分の一次配列構造を表す情報として得るように
構成される。
【0009】このようなタンパク質解析支援装置では、
検索結果として得られた各アミノ酸残基が所定の表記規
則に従って指定されたタンパク質を構成するアミノ酸残
基の一次配列の順に配列されてパターン化される。従っ
て、このパターン化の結果として得られた配列パターン
は、得られたアミノ酸残基が当該一次配列の順に従って
離散していても統合された配列パターンとして表現され
る。その結果、この配列パターンから、離散されたアミ
ノ酸残基の配列順序や、化合物と相互作用する部分を含
むタンパク質の残基部分の大まかな一次配列構造を把握
することができる。
【0010】なお、上記所定の表記規則は、特に限定さ
れないが、生成される配列パターンの情報を利用するシ
ステムでの要求(表示の見易さ、配列パターンの検索ア
ルゴリズムの簡便さ等)を満たすことが好ましい。より
簡単に表記された配列パターンが得られるという観点か
ら、本発明においては、請求項2に記載されるように、
上記配列パターン生成手段は、1文字表記されたアミノ
酸残基を当該指定されたタンパク質を構成するアミノ酸
残基の一次配列の順に配列すると共に、該一次配列の順
において離散して存在するアミノ酸残基間に所定のパタ
ーン表記体を挿入して配列パターン情報を生成するよう
に構成することができる。
【0011】このようなタンパク質解析支援装置では、
タンパク質を構成するアミノ酸残基の一次配列の順にア
ミノ酸残基を表す文字と所定のパターン表記体が連続し
て配列された配列パターンが得られる。上記データベー
スは、当該タンパク質解析支援装置内に備えていてもよ
いし、また、インターネット等の外部通信網から入手す
るようにしてもよい。また、外部通信網から入手する場
合では、データベースの情報を全部装置内にダウンロー
ドすることも可能であるし、また、通信回線を接続した
状態で利用することも可能である。
【0012】生成された配列パターンは、新たに発見さ
れたタンパク質の性質を解析するために、その新たなタ
ンパク質を構成するアミノ酸残基列から、当該生成され
た配列パターンで表されるアミノ酸残基列を検索するシ
ステムで利用することができる。また、生成された配列
パターンを単に表示して、研究者等が利用することもで
きる。
【0013】上記のようにデータベースを装置内に備
え、生成された配列パターンを表示する機能を備えたタ
ンパク質解析支援装置を提供するという観点から、本発
明は、請求項3に記載されるように、タンパク質とその
タンパク質の近傍に存在する化合物の三次元構造データ
を記述したデータベースを用いて、指定された化合物と
相互作用すると予測される指定されたタンパク質のアミ
ノ酸残基部分の情報を得るためのタンパク質解析支援装
置において、上記データベースを格納するデータベース
格納手段と、指定された化合物において指定された種類
の各原子と所定距離範囲内に存在する指定されたタンパ
ク質において指定された種類の原子を含むアミノ酸残基
を上記格納手段から読み出されたデータベースの情報を
用いて検索する検索手段と、該検索手段での検索結果と
して得られた各アミノ酸残基を所定の表記規則に従って
当該指定されたタンパク質を構成するアミノ酸残基の一
次配列の順に配列してパターン化した配列パターンを生
成する配列パターン生成手段と、この配列パターンをを
指定された化合物と相互作用するタンパク質のアミノ酸
残基部分を含む部分の一次配列構造を表す情報として表
示する表示手段とを有するように構成される。
【0014】上記本発明の第二の課題を解決するため、
本発明は、請求項4に記載されるように、タンパク質と
そのタンパク質の近傍に存在する化合物の三次元構造デ
ータを記述したデータベースを用いて、指定された化合
物と相互作用すると予測される指定されたタンパク質の
アミノ酸残基部分の情報を得るためのタンパク質解析支
援装置での処理をコンピュータに行わせるためのプログ
ラムを格納した記憶媒体において、指定された化合物に
おいて指定された種類の各原子と所定距離範囲内に存在
する指定されたタンパク質において指定された種類の原
子を含むアミノ酸残基を上記データベースの情報を用い
て検索する検索手順と、該検索手段での検索結果として
得られた各アミノ酸残基を所定の表記規則に従って当該
指定されたタンパク質を構成するアミノ酸残基の一次配
列の順に配列してパターン化した配列パターンを生成す
る配列パターン生成手順とを有し、この配列パターンを
指定された化合物と相互作用するタンパク質のアミノ酸
残基部分を含む部分の一次配列構造を表す情報として得
るようにしたプログラムを格納した記憶媒体として構成
される。
【0015】この記憶媒体は、コンピュータによるプロ
グラムの読み出しが可能であるものであれば特に制限さ
れるものではなく、機械的に書き込んだプログラムを光
学的に読み出すCD−ROM等の媒体、磁気的にプログ
ラムの記録再生を行う磁気ディスク等の媒体、電気的に
プログラムの読み出し、書き込みを行う半導体メモリ等
の媒体、光、磁気を用いてプログラムの読み出し、書き
込みを行う光磁気ディスク等の媒体等を用いることがで
きる。
【0016】
【発明の実施の形態】以下、本発明の実施の一形態を図
面に基づいて説明する。本発明の実施の一形態に係るタ
ンパク質解析支援装置が適用されるシステムの基本的な
構成は、例えば、図2に示すようになっている。図2に
おいて、このシステムは、所謂クライアント−サーバシ
ステムであり、複数のクライアント端末10、11、1
2とサーバ20がLANによって接続されている。サー
バ20は、タンパク質及びタンパク質の糸状鎖内に含ま
れる低分子化合物の三次元構造を記述したデーターベー
ス(PDB)を有している。各クライアント端末10、
11、及びサーバ20は、一般的なコンピュータシステ
ムにて構成され、例えば、図3に示すように構成されて
いる。
【0017】図3において、このコンピュータシステム
は、CPU101、メモリユニット102、LANユニ
ット103、入力ユニット104、表示ユニット10
5、CD−ROMドライブユニット106及び補助記憶
装置(例えば、ディスク装置)107を有している。各
ユニットは、バスBにて接続されている。CPU101
は、メモリユニット102に格納されるプログラムに従
って、システム全体を制御すると共に、後述するような
タンパク質の解析処理を実行する。メモリユニット10
2は、ROM及びRAMを備え、CPU10にて実行さ
れるプログラムを格納すると共に、テーブルやCPU1
01での処理にて得られた各種情報を格納する。LAN
ユニット103は、LANを介してクライアント−サー
バ間のデータ通信制御を行う。
【0018】入力ユニット104は、マウス及びキーボ
ードを有し、ユーザが必要な情報をシステムに入力する
ために用いられる。表示ユニット105は、上述したタ
ンパク質の解析処理において必要なデータの表示やその
解析結果等を表示する。CD−ROMドライブユニット
106は、セットされたCD−ROM200から情報を
読み出す。CPU101による制御に従って、CD−R
OM200に格納されたプログラムやデータベースは、
CD−ROMドライブユニット106にて読み出され
て、補助記憶装置107に格納される。補助記憶装置1
07に格納されたプログラムは、システムの起動時にメ
モリユニット102に移され、CPU101がこのメモ
リユニット102に格納されたプログラムに従って処理
を実行する。特に、サーバ20においては、上述したP
DB(Protein Data Bank)が、例えば、CD−ROM2
00にて提供され、このPDBが補助記憶装置107に
格納される。なお、このPDBは、例えば、インターネ
ット等の外部の通信網を介してサーバ20に提供するこ
ともできる。
【0019】PDBは、例えば、図4及び図5に示すよ
うな情報が予め登録されている。図4はタンパク質に関
する情報(ATOM行)を示す。即ち、タンパク質を構
成する各アミノ酸残基名(MET、THR、GLU(以
上、3文字表記例)等)、そのアミノ酸残基を構成する
原子、各原子の三次元位置座標(三次元構造)及びタン
パク質を特定するID名等が登録されている。図5は、
図1に示すようにタンパク質Pの糸状鎖内に存在するこ
とが判明している低分子化合物に関する情報(HETA
TOM行)を示す。即ち、化合物名(GNP(三文字表
記例)等)、その化合物を構成する原子、各原子の三次
元位置座標(三次元構造)及び当該低分子化合物を特定
するID名等が登録されている。
【0020】ユーザが、例えば、クライアント端末10
を用いてタンパク質の解析を行う場合、クライアント端
末10のCPU101は、図6に示す手順に従って処理
を実行する。図6において、ユーザが入力ユニット10
4にて解析処理の開始操作を行うと、PDBの読み込み
処理が行われる(S1)。このPDBの読み込み処理で
は、まず、LANユニット103及びLANを介してサ
ーバ20に対してPDBの要求を行う。その応答とし
て、PDBがサーバ20から返送されてLANユニット
103にて受信されると、そのPDBが補助記憶装置1
07に格納される。
【0021】PDBがこのようにクライアント端末10
に読み込まれると、PDBに記述されたタンパク質及び
低分子化合物名(図4及び図5参照)が表示ユニット1
05に表示される。そして、ユーザが表示されたタンパ
ク質及び低分子化合物から入力ユニット104の操作に
よって対象となるタンパク質及び低分子化合物を指定す
ると、その指定されたタンパク質及び低分子化合物が取
得される(S2)。CPU101がユーザ指定のタンパ
ク質及び低分子化合物を取得すると、それらを構成する
原子種のリストが表示ユニット105に表示される。
【0022】タンパク質及び低分子化合物のそれぞれを
構成する原子種からユーザが入力ユニット104の操作
によって相互作用の有無を調べるべき低分子化合物の原
子種を指定すると共に、タンパク質の原子種を指定する
と、それら原子種対が取得される(S3、S4)。そし
て、更に、ユーザが相互作用すると予測される原子間距
離の範囲を入力ユニット104の操作によって指定する
と、その原子間距離の範囲が取得される(S5)。
【0023】上記のようにして、タンパク質及び低分子
化合物の各原子種及び原子間距離の範囲が取得される
と、それらの情報に基づいて検索条件が作成され、登録
される(メモリユニット102の所定領域に格納され
る)(S6)。この検索条件は、例えば、 タンパク質 低分子化合物 原子間距離の範囲 C(炭素) O(酸素) 3.5Å以下 のようになる。即ち、この場合、検索条件は、「低分子
化合物の酸素原子Oに対して距離が3.5Å以下となる
タンパク質の炭素原子C」になる。
【0024】ユーザによって検索条件設定処理の終了操
作がなされたか否かが判定され(S7)、まだ、当該終
了操作がなされなければ、ユーザからの操作入力に従っ
て上述した処理(S3、S4、S5、S6)が繰り返し
実行され、上述したようなタンパク質及び低分子化合物
の各原子種及び原子間距離の範囲にて記述される検索条
件が順次登録される。
【0025】検索条件設定処理の終了操作がなされる
と、各検索条件を記述した条件ファイルがメモリユニッ
ト102から読み出されてLANユニット103からL
ANを介してサーバ20に送信される(S8)。そし
て、当該クライアント端末10のCPU101は、サー
バ20からの応答の待ち状態となる(S9)。上記のよ
うにしてクライアント端末10から送信された条件ファ
イルをサーバ20が受信すると、サーバ20のCPU1
01は、例えば、図7の手順に従って処理を実行する。
【0026】図7において、上述した条件ファイルをL
ANユニット103にて受信すると(S21)、その条
件ファイルがメモリユニット102に展開される。この
状態で、当該条件ファイルを参照して、まず、1番目の
条件(原子種対、原子間距離の範囲)が取得される(S
22)。このように条件が取得されると、補助記憶装置
107に格納されたPDB(図4及び図5参照)を参照
して、対象となる低分子化合物及びタンパク質につい
て、取得された条件に合致する低分子化合物及びタンパ
ク質の原子、及びタンパク質の当該原子の属するアミノ
酸残基が特定される(S23)。この処理は、例えば、
次のようになされる。
【0027】まず、検索条件となる低分子化合物の原子
種(例えば、酸素原子O)に属する原子(例えば、O1
A、O2*、O2B、・・・)が全て抽出されると共
に、検索条件となるタンパク質の原子種(例えば、炭素
原子C)に属する原子(例えば、CA、CB、CE、・
・・)が全て抽出される。そして、低分子化合物の抽出
された各原子からタンパク質の抽出された各原子までの
距離がPDBの各原子の三次元位置座標データを用いて
演算される。そして、その距離が検索条件における原子
間距離の範囲の条件(例えば、3.5Å以下)を満足す
る原子対が特定されると共に及びその原子間距離が特定
される。そして、対となった一方のタンパク質の原子を
含むアミノ酸残基が特定される。
【0028】上記のようにして、検索条件を満足する原
子対等が抽出されると、受信した条件ファイルにまだ検
索条件が含まれているか否かが判定され(S24)、ま
だ、含まれている場合には、次の検索条件について上述
の処理(S22、S23)が実行される。以後、受信し
た条件ファイルに含まれる検索条件全てについて同様の
処理が繰り返し実行される。
【0029】受信した条件ファイルに含まれる全ての検
索条件についての処理が終了すると、その結果のファイ
ルが作成される(S25)。このファイルには、例え
ば、図8に示すように、抽出された原子対の原子間距
離、原子対の一方のタンパク質の原子、その原子を含む
アミノ酸残基、その残基番号、原子対の他方の低分子化
合物の原子等が記述される。そして、このように作成さ
れた結果のファイルの内容に基づいて、低分子化合物の
指定原子と相互作用すると予測されるタンパク質の原子
を含むアミノ酸残基の配列パターンがモチーフパターン
として生成される(S26)。
【0030】モチーフパターンは、次のようにして生成
される。例えば、図8に示すような抽出結果が得られた
場合、アミノ酸残基を1文字表記して、そのアミノ酸残
基を残基番号の順に配列すると、 GKSA・・・F・・D・・T のようになる。これは、残基番号(16)から(18)
まで連続して配列されるアミノ酸残基列「GKSA」
と、残基番号(28)に位置するアミノ酸残基F、残基
番号(30)に位置するアミノ酸残基D、及び残基番号
(35)に位置するアミノ酸残基Tが順次配列されてい
ることを表す。
【0031】ここで、残基番号(18)と(28)の間
のアミノ酸残基は、低分子化合物の酸素Oと相互作用す
ると予測される炭素Cを含んでいない。そこで、アミノ
酸残基A(残基番号(18))とアミノ酸残基F(残基
番号(28))との間の条件を、例えば、「.」と
「*」を連結して「.*」と記述する。「.」は、任意
のアミノ酸残基の存在を定義し、「*」は、繰り返しを
定義する。従って、「.*」は、任意のアミノ酸残基
(文字)が任意の長さで配列されることを意味すること
になる。このように定義された記号「.」及び「*」を
用いることにより、アミノ酸残基F(残基番号(2
8))とD(残基番号(30))との間の条件及びアミ
ノ酸残基D(残基番号(30))とF(残基番号(3
5))との間の条件もまた、それぞれ「.*」で表現で
きる。その結果、上記のように抽出されたアミノ酸残基
列「GKSA・・・F・・D・・F」は、「GKSA.
*F.*D.*F」というアミノ酸残基の配列パターン
(モチーフパターン)として記述される。
【0032】このモチーフパターンは、「連続するアミ
ノ酸残基列GKSA、任意個数の任意のアミノ酸残基
列、アミノ酸残基F、任意個数の任意のアミノ酸残基
列、アミノ酸残基D、任意個数の任意のアミノ酸残基列
及びアミノ酸残基Tが順次配列された」状態を記述した
ことになる。即ち、このモチーフパターンは、個別的に
抽出されたアミノ酸残基G、K、S、A、F、D、Fの
配列順序及びアミノ酸残基の連続性、及び離散するアミ
ノ酸残基間の条件の各情報を含むことになる。
【0033】上記のようにしてモチーフパターンが生成
されると、そのモチーフパターンが上記抽出結果ファイ
ル(図8参照)と共にLANユニット103からLAN
を介してクライアント10に送信される(S27)。サ
ーバ20での一連の処理がこれで終了する。図6に戻っ
て、サーバ20からの応答の待ち状態となっていたクラ
イアント10のCPU101は、サーバ20からの抽出
結果ファイル及びモチーフパターンをLANユニット1
03にて受信したことを判定すると、その受信した情報
の表示処理を行う(S10)。この表示処理では、上記
抽出結果ファイルの内容(図8参照)及び上記モチーフ
パターン(例えば、「GKSA.*F.*D.*F」)
を表示ユニット105の所定のウインドウに表示させ
る。
【0034】ユーザは、例えば、解析によってアミノ酸
残基の一次配列が得られた新たなタンパク質に上記モチ
ーフパターンが存在する否かを目視によって確かめるこ
とができる。もし、そのようなモチーフパターンが存在
すれば、この新たなタンパク質も上記指定した低分子化
合物と相互作用すると予測することができる。上記例で
は、モチーフパターンを得るための処理をクライアント
とサーバに分散して行うようにしたが、クライアント側
だけで実行すること(スタンドアロン)も可能である。
この場合、PDBは、サーバから受信するようにしても
よいが、CD−ROM等によって直接クライアントに供
することもできる。
【0035】また、PDBをクライアント側に備え、ク
ライアントから条件ファイルをサーバに送信する際に
(図6のS6)、PDBに記述された指定の低分子化合
物及びタンパク質に関する情報(三次元構造を含む)を
サーバに送信するよう構成することもできる。この場
合、サーバは、受信した低分子化合物及びタンパク質の
情報から検索条件を満足するアミノ酸残基等を抽出す
る。
【0036】なお、上記の例では、1つの検索条件(タ
ンパク質及び低分子化合物の原子対と、原子間距離の範
囲)での処理結果(図8参照)であったが、複数の検索
条件での処理結果は、各検索条件での処理結果を重ね合
わせたものとなる。更にまた、例えば、本願出願人が既
に出願している特願平10−109139に開示される
文字列検索システムによれば、新たなタンパク質のアミ
ノ酸残基列から上述したようなモチーフパターンを自動
的に検索することもできる。
【0037】この既に出願済の文字列検索システムにて
実行される文字列検索処理では、例えば、次のような規
則(1)乃至(8)に従ってアミノ酸残基を表す文字の
配列条件が指定できる。 (1)特定の文字の指定 記述例:A 意味 :文字Aを指定 (2)複数の文字の指定 記述例:[ABC] 意味 :A、B、Cのいずれかの文字の指定 (3)特定の文字と異なる文字の指定 記述例:[^A] 意味 :Aではない文字の指定 (4)任意の文字(何でもよい)の指定 記述例: . 意味 :任意の文字の指定 (5)繰り返しの指定 記述例:* 意味 :直前のパターン(文字)を0回以上繰り返す (6)指定回数の繰り返しの指定 記述例:\ {3\} 意味 :直前のパターン(文字)を3回繰り返す (7)指定範囲回数の繰り返し指定 記述例:\ {3,5\} 意味 :直前のパターン(文字)を3回から5回繰り返
す (8)複数の文字列の指定 記述例:(XXX|YYY|XXX) 意味 :XXX、YYY、ZZZのいずれかの文字列の
指定 以上のような規則(配列条件)に従って文字列を指定す
る場合、検索条件を記述した検索条件情報によって、例
えば、次のような文字列の指定が可能となる。
【0038】上記規則1)に従って「ABCDE」とい
う検索条件情報を入力することによって、文字列「AB
CDE」が指定される。上記規則1)及び2)に従って
「AB[CDE]FG」という検索条件情報を入力する
ことによって、文字列「ABCFG」、「ABDF
G」、「ABEFG」が指定される。
【0039】上記規則1)及び3)に従って「ABC
[^D]E」という検索条件情報を入力することによっ
て、文字列「ABCAE」、「ABCBE」、「ABC
CE」、「ABCEC」、・・・が指定される。上記規
則1)及び4)に従って、「AB.CD」という検索条
件情報を入力することによって、文字列「ABAC
D」、「ABBCD」、「ABCCD」、「ABDC
D」、・・・が指定される。
【0040】上記規則1)及び5)に従って、「AB*
CD」という検索条件情報を入力することによって、文
字列「ACD」、「ABCD」、「ABBCD」、「A
BBBCD」、・・・が指定される。上記規則1)、
4)及び5)に従って、「AB.*CD」という検索条
件情報を入力することによって、文字列「ABCD」、
「ABXCD」、「ABXYZCD」、・・・が指定さ
れる。
【0041】上記規則1)及び6)に従って、「AB\
{4\}CD」という検索条件情報を入力することによっ
て、文字列「ABBBBCD」が指定される。上記規則
1)及び7)に従って、「AB\ {2,4\}CD」という
検索条件情報を入力するとことによって、文字列「AB
BCD」、「ABBBCD」、「ABBBBCD」が指
定される。
【0042】上記規則1)及び8)に従って、「AB
(CDE|F)GH」という検索条件情報を入力するこ
とにより、文字列「ABCDEGH」、「ABFGH」
が指定される。上記のような文字列検索システムに入力
する情報としてのモチーフパターンを生成する場合、個
別的に抽出された低分子化合物と相互作用を行うと予測
されるアミノ酸残基部分を種々の規則性に着目して統合
したモチーフパターンを生成することができるようにな
る。
【0043】上記例において、図7におけるステップS
22乃至S25での処理が検索手段に対応し、ステップ
S26での処理が配列パターン生成手段に対応する。ま
た、補助記憶装置107がデータベース格納手段に対応
し、図10におけるステップS10での処理及び表示ユ
ニット105が表示手段に対応する。
【0044】
【発明の効果】以上、説明してきたように、請求項1乃
至3記載の本願発明によれば、このパターン化の結果と
して得られた配列パターンは、得られたアミノ酸残基が
当該一次配列の順に従って離散していても統合された配
列パターンとして表現され、その配列パターンから、離
散されたアミノ酸残基の配列順序や、化合物と相互作用
する部分を含むタンパク質の残基部分の大まかな一次配
列構造を把握することができる等、低分子化合物と相互
作用するタンパク質のアミノ酸残基部分を当該タンパク
質の構造に関する情報をより多く含む形で抽出できるよ
うになる。
【0045】また、請求項4記載の本願発明によれば、
上記のようなタンパク質解析支援装置での処理をコンピ
ュータで行わせるためのプログラムを格納した記憶媒体
を提供することができる。
【図面の簡単な説明】
【図1】タンパク質とその近傍に存在する低分子化合物
の関係の一例を示す図である。
【図2】本発明の実施の一形態に係るタンパク質解析支
援装置が適用されるシステムの一例を示すブロック図で
ある。
【図3】図2に示す各クライアント及びサーバの基本的
な構成例を示すブロック図である。
【図4】PDBに登録されたタンパク質に関する情報の
例を示す図である。
【図5】PDBに登録された化合物に関する情報の例を
示す図である。
【図6】クライアント端末で実行される条件ファイル作
成のための処理の手順を示すフローチャートである。
【図7】サーバで実行されるモチーフパターンを作成す
るための処理の手順を示すフローチャートである。
【図8】検索条件に従って抽出された情報の例を示す図
である。
【符号の説明】
10、11、12 クライアント端末 20 サーバ 101 CPU 102 メモリユニット 103 LANユニット 104 入力ユニット 105 表示ユニット 106 CD−ROMドライブユニット 107 補助記憶装置 200 CD−ROM
フロントページの続き (56)参考文献 西岡,須山,リガンドの化学構造によ るアミノ酸配列の特徴づけに関する研 究,ゲノム解析に伴う大量知識情報処理 の研究平成5年度研究成果報告書,日 本,1994年3月,p.56−60 金久実,特集/タンパク質・核酸に関 する新展開 蛋白質・核酸の機能部位の コンピュータ解析,病態生理,日本, 1990年,p.465−470 野口保,蛋白質の構造機能相関及び蛋 白質部分構造データベース構築,スーパ ーコンピューターラボラトリー 平成6 年度研究成果報告書,日本,1995年5月 19日,p.137−139 菰岡、梅山,タンパク質シークエンス 解析のエキスパートシステム,情報化学 討論会・構造活性相関シンポジウム講演 要旨集,日本,1991年,14−19回,p. 70−73 松田、橋本,遺伝子情報解析の計算機 支援,電子情報通信学会誌,日本,社団 法人電子情報通信学会,1996年12月25 日,Vol.79,No.12,p.1204− 1212 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G01N 33/50 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】タンパク質とそのタンパク質の近傍に存在
    する化合物の三次元構造データを記述したデータベース
    を用いて、指定された化合物と相互作用すると予測され
    る指定されたタンパク質のアミノ酸残基部分の情報を得
    るためのタンパク質解析支援装置において、 指定された化合物において指定された種類の各原子と所
    定距離範囲内に存在する指定されたタンパク質において
    指定された種類の原子を含むアミノ酸残基を上記データ
    ベースの情報を用いて検索する検索手段と、 該検索手段での検索結果として得られた各アミノ酸残基
    を所定の表記規則に従って当該指定されたタンパク質を
    構成するアミノ酸残基の一次配列の順に配列してパター
    ン化した配列パターンを生成する配列パターン生成手段
    とを有し、この配列パターンを指定された化合物と相互
    作用するタンパク質のアミノ酸残基部分を含む部分の一
    次配列構造を表す情報として得るようにしたタンパク質
    解析支援装置。
  2. 【請求項2】請求項1記載のタンパク質解析支援装置に
    おいて、 上記配列パターン生成手段は、1文字表記されたアミノ
    酸残基を当該指定されたタンパク質を構成するアミノ酸
    残基の一次配列の順に配列すると共に、該一次配列の順
    において離散して存在するアミノ酸残基間に所定のパタ
    ーン表記体を挿入して配列パターン情報を生成するよう
    にしたタンパク質解析支援装置。
  3. 【請求項3】タンパク質とそのタンパク質の近傍に存在
    する化合物の三次元構造データを記述したデータベース
    を用いて、指定された化合物と相互作用すると予測され
    る指定されたタンパク質のアミノ酸残基部分の情報を得
    るためのタンパク質解析支援装置において、 上記データベースを格納するデータベース格納手段と、 指定された化合物において指定された種類の各原子と所
    定距離範囲内に存在する指定されたタンパク質において
    指定された種類の原子を含むアミノ酸残基を上記格納手
    段から読み出されたデータベースの情報を用いて検索す
    る検索手段と、 該検索手段での検索結果として得られた各アミノ酸残基
    を所定の表記規則に従って当該指定されたタンパク質を
    構成するアミノ酸残基の一次配列の順に配列してパター
    ン化した配列パターンを生成する配列パターン生成手段
    と、 この配列パターンをを指定された化合物と相互作用する
    タンパク質のアミノ酸残基部分を含む部分の一次配列構
    造を表す情報として表示する表示手段とを有するタンパ
    ク質解析支援装置。
  4. 【請求項4】タンパク質とそのタンパク質の近傍に存在
    する化合物の三次元構造データを記述したデータベース
    を用いて、指定された化合物と相互作用すると予測され
    る指定されたタンパク質のアミノ酸残基部分の情報を得
    るためのタンパク質解析支援装置での処理をコンピュー
    タに行わせるためのプログラムを格納した記憶媒体にお
    いて、 指定された化合物において指定された種類の各原子と所
    定距離範囲内に存在する指定されたタンパク質において
    指定された種類の原子を含むアミノ酸残基を上記データ
    ベースの情報を用いて検索する検索手順と、 該検索手段での検索結果として得られた各アミノ酸残基
    を所定の表記規則に従って当該指定されたタンパク質を
    構成するアミノ酸残基の一次配列の順に配列してパター
    ン化した配列パターンを生成する配列パターン生成手順
    とを有し、この配列パターンを指定された化合物と相互
    作用するタンパク質のアミノ酸残基部分を含む部分の一
    次配列構造を表す情報として得るようにしたプログラム
    を格納した記憶媒体。
JP02299799A 1999-01-29 1999-01-29 タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体 Expired - Fee Related JP3370942B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02299799A JP3370942B2 (ja) 1999-01-29 1999-01-29 タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02299799A JP3370942B2 (ja) 1999-01-29 1999-01-29 タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JP2000222421A JP2000222421A (ja) 2000-08-11
JP3370942B2 true JP3370942B2 (ja) 2003-01-27

Family

ID=12098174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02299799A Expired - Fee Related JP3370942B2 (ja) 1999-01-29 1999-01-29 タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP3370942B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100458609B1 (ko) * 2001-12-13 2004-12-03 주식회사 엘지생명과학 단백질간 상호작용 예측 시스템 및 그 방법
WO2005104754A2 (en) * 2004-04-28 2005-11-10 Samuel Bogoch System and method for identifying complex patterns of amino acids
KR100785780B1 (ko) 2005-12-08 2007-12-18 한국전자통신연구원 규칙 기반 템플릿을 이용한 바이오 콤플렉스의 탐색 방법및 장치
US7869960B2 (en) 2005-12-08 2011-01-11 Electronics And Telecommunications Research Institute Method and apparatus for detecting bio-complexes using rule-based templates

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
松田、橋本,遺伝子情報解析の計算機支援,電子情報通信学会誌,日本,社団法人電子情報通信学会,1996年12月25日,Vol.79,No.12,p.1204−1212
菰岡、梅山,タンパク質シークエンス解析のエキスパートシステム,情報化学討論会・構造活性相関シンポジウム講演要旨集,日本,1991年,14−19回,p.70−73
西岡,須山,リガンドの化学構造によるアミノ酸配列の特徴づけに関する研究,ゲノム解析に伴う大量知識情報処理の研究平成5年度研究成果報告書,日本,1994年3月,p.56−60
野口保,蛋白質の構造機能相関及び蛋白質部分構造データベース構築,スーパーコンピューターラボラトリー 平成6年度研究成果報告書,日本,1995年5月19日,p.137−139
金久実,特集/タンパク質・核酸に関する新展開 蛋白質・核酸の機能部位のコンピュータ解析,病態生理,日本,1990年,p.465−470

Also Published As

Publication number Publication date
JP2000222421A (ja) 2000-08-11

Similar Documents

Publication Publication Date Title
Basten et al. QTL Cartographer, version 1.17
Johnson Using NMRView to visualize and analyze the NMR spectra of macromolecules
US7269580B2 (en) Application integration system and method using intelligent agents for integrating information access over extended networks
US6460060B1 (en) Method and system for searching web browser history
Bertsch et al. OpenMS and TOPP: open source software for LC-MS data analysis
US20060117055A1 (en) Client-based web server application verification and testing system
US20040268303A1 (en) System, method, and computer program product for generating a web application with dynamic content
JP3777087B2 (ja) デ―タ表示システム、データ表示方法、コンピュータシステムおよび記録媒体
JPH08221435A (ja) 特許マップ生成方法
WO1996029659A1 (fr) Processeur, methode de traitement et support d'enregistrement d'informations biochimiques
Jareborg et al. Alfresco—a workbench for comparative genomic sequence analysis
JP3370942B2 (ja) タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体
KR100650203B1 (ko) 유전체 서열 분석 및 데이터 관리 시스템 및 그 방법
JP2005174138A (ja) コンテンツ検索方法およびシステム、プログラムおよびプログラム記録媒体
JP4040764B2 (ja) 遺伝子のモチーフ抽出処理装置及び遺伝子のモチーフ抽出処理方法並びに遺伝子のモチーフ抽出処理プログラムを記録した記録媒体
US20050240358A1 (en) Genome information display system
US8479222B2 (en) Simplifying interaction with multiple applications when using forms via a common interface
CN109634799B (zh) 分析系统、分析数据收集系统及其数据库登记装置及方法
JP2006127117A (ja) Web閲覧操作の記録・再生方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP4021227B2 (ja) 付箋機能追加プログラム及び付箋貼付方法
WO2024122290A1 (ja) データ表示装置、解析システム、データ表示方法及びプログラム
KR20020080270A (ko) 개인화된 포탈 서비스 방법 및 시스템
WO2001095143A1 (en) Method for web browser automation
JP2004302618A (ja) キーワード頻度算出方法及びそれを実行するプログラム
JP3536302B2 (ja) データ管理装置および方法、検索装置および方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021105

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081115

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081115

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091115

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101115

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101115

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111115

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111115

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121115

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121115

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131115

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees