JP3881224B2 - 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体 - Google Patents

配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体 Download PDF

Info

Publication number
JP3881224B2
JP3881224B2 JP2001367741A JP2001367741A JP3881224B2 JP 3881224 B2 JP3881224 B2 JP 3881224B2 JP 2001367741 A JP2001367741 A JP 2001367741A JP 2001367741 A JP2001367741 A JP 2001367741A JP 3881224 B2 JP3881224 B2 JP 3881224B2
Authority
JP
Japan
Prior art keywords
sequence
information
partial
mutant
sequence information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001367741A
Other languages
English (en)
Other versions
JP2003167883A (ja
Inventor
尚幸 蓬莱
洋文 土居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2001367741A priority Critical patent/JP3881224B2/ja
Publication of JP2003167883A publication Critical patent/JP2003167883A/ja
Application granted granted Critical
Publication of JP3881224B2 publication Critical patent/JP3881224B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体に関し、特に、DNA塩基配列またはアミノ酸配列の部分配列を処理する配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】
バイオインフォマティクス分野において広く利用される情報として、塩基またはアミノ酸の配列データがある。各種のデータベースに蓄積された配列データに基づいてホモロジー検索やモチーフ検索などを行うことにより、現在、様々な生命現象の分析が行われている。ここで、配列情報を用いた生命現象の分析の過程において、配列の部分配列を用いた解析手法が近年になって研究されている。
【0003】
たとえば、特開平10−45795号公報に開示された発明は、部分配列を用いて機能未知の蛋白質の機能や機能部位、あるいは、機能が既知で機能部位が未知の蛋白質の機能部位を推定するための蛋白質データベース・システム並びに蛋白質の機能および機能部位の推定方法に関するものである。特開平10−45795号公報には、特定の蛋白質のアミノ酸配列情報の一部分であるオリゴペプチドとそのオリゴペプチドを含む蛋白質に関する機能等の情報や、オリゴペプチドの出現頻度等を出力装置に表示する発明が開示されている。
【0004】
また、特願2000−72485号に開示された発明は、部分配列を用いた蛋白質間相互作用予測方法及び該予測プログラムを担持した記録媒体に関するものである。特願2000−72485号には、特定の蛋白質のアミノ酸配列の一部分であるオリゴペプチドの配列情報や、そのオリゴペプチドの配列情報を持つ他の蛋白質とのアラインメント結果や蛋白質におけるそのオリゴペプチドの出現頻度等に関する情報を利用して蛋白質間の相互作用を予測する発明が開示されている。
【0005】
【発明が解決しようとする課題】
しかしながら、これらの従来技術においては、すべてのオリゴペプチド等の部分配列に関する情報を網羅的に収集し、分かり易く表形式でまとめて表示するものが存在しなかったという問題点を有していた。すなわち、部分配列に関するあらゆる情報を当該部分配列と関連付けて整理、格納、検索、管理などを行うものは存在しなかった。
【0006】
例えば、上述した特開平10−45795号公報および特願2000−72485号に開示された発明においては、オリゴペプチドの配列データに関連する大量の情報について出力装置に表示させる際に、どの情報をどの程度表示するかについて、利用者がその値を容易に設定し、かつ、その設定を保存しておき、後から設定を検索して再利用することはできなかった。
【0007】
すなわち、従来技術においては、表示する情報の取捨選択を、利用者が容易に設定し、その設定を保存し、また後からその設定を検索することにより再利用することができなかった。
【0008】
また、従来のオリゴペプチドの解析手法は、そのオリゴペプチドのミュータントにまで検索範囲を自動的に拡大して配列情報を検索するものは存在しなかった。
【0009】
このように、部分配列の解析は、特に、アミノ酸配列の部分配列であるオリゴペプチドの解析は蛋白質の機能や相互作用などを推定する場合にも利用できることがわかっているため極めて有効であるが、従来技術は上述したような数々の問題点を有しており、その結果、配列情報表示装置の利用者および管理者のいずれにとっても、利便性が悪く、また、利用効率が悪いものであった。
【0010】
なお、これまで説明した従来の技術および発明が解決しようとする課題は、オリゴペプチドに関する配列情報を表示するシステムに限られず、あらゆる配列情報の部分配列を表示する全てのシステムにおいて、同様に考えることができる。
【0011】
本発明は上記問題点に鑑みてなされたもので、出力装置に表示する配列情報とその関連情報の取捨選択を、利用者が容易に設定し、その設定を保存し、また後からその設定を検索することにより再利用することのできる、配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することを目的としている。
【0012】
【課題を解決するための手段】
このような目的を達成するため、請求項1に記載の配列情報処理装置は、制御装置と記憶装置と出力装置とを少なくとも備えた配列情報処理装置であって、上記記憶装置は、複数の塩基またはアミノ酸の配列情報を格納する配列情報格納手段と、上記配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納するミュータント配列情報格納手段と、を備え、上記制御装置は、上記配列情報格納手段により格納された上記配列情報のうち利用者にターゲット配列を選択させるターゲット配列選択手段と、上記配列情報格納手段により格納された上記配列情報のうち検索の対象となる母集団の配列情報を上記利用者に選択させる母集団選択手段と、上記ターゲット配列選択手段により選択された上記ターゲット配列を上記利用者が指定した長さの部分配列に分割する配列分割手段と、上記配列分割手段にて分割された上記部分配列に対するミュータント配列情報を、上記ミュータント配列情報格納手段に格納された上記ミュータント配列情報から検索するミュータント配列検索手段と、上記配列分割手段にて分割された上記部分配列、および、上記ミュータント配列検索手段にて検索された上記部分配列に対する上記ミュータント配列情報を上記母集団から検索する検索手段と、上記検索手段にて検索された全ての上記部分配列について、上記部分配列と、上記配列分割手段にて上記部分配列を分割したときの上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索手段により上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを含む分析結果情報を作成し、上記記憶装置に格納する分析結果情報作成手段と、上記分析結果情報作成手段にて上記記憶装置に格納された全ての上記部分配列に対する上記分析結果情報を検索し、上記部分配列と、上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索手段により上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを上記出力装置にテーブル形式で出力するテーブル出力手段と、を備えたことを特徴とする。
【0013】
この装置によれば、塩基またはアミノ酸の配列情報と当該配列情報に関連する配列関連情報とを対応付けて格納し、格納された配列情報のうち利用者にターゲット配列を選択させ、格納された配列情報のうち検索の対象となる母集団の配列情報を利用者に選択させ、選択されたターゲット配列を利用者が指定した長さの部分配列に分割し、分割された部分配列に対するミュータント配列情報を、格納されたミュータント配列情報から検索し、分割された部分配列、および、検索された部分配列に対するミュータント配列情報を母集団から検索し、検索された全ての部分配列について、部分配列と、部分配列を分割したときのターゲット配列の先頭からの位置と、部分配列に対するミュータント配列情報と、部分配列およびミュータント配列情報が母集団から検索された個数とを含む分析結果情報を作成し、記憶装置に格納し格納された全ての部分配列に対する分析結果情報を検索し、部分配列と、ターゲット配列の先頭からの位置と、部分配列に対するミュータント配列情報と、部分配列およびミュータント配列情報が母集団から検索された個数とを出力装置にテーブル形式で出力するので、処理結果として表示される配列情報とその分析情報の取捨選択を、利用者が容易に設定し、その設定を保存し、また後からその設定を再利用することができる。
【0015】
この装置によれば、配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納し、分割された部分配列に対するミュータント配列情報を、格納されたミュータント配列情報から検索し、検索された部分配列に対するミュータント配列情報を母集団から検索するので、検索対象の部分配列のミュータントにまで検索範囲を拡張することができ、より有益な生物学情報の解析に利用することができるようになる。
【0020】
また、請求項に記載の配列情報処理装置は、請求項に記載の配列情報処理装置において、上記部分配列の長さは4〜7であることを特徴とする。
【0021】
これは部分配列の長さの一例を一層具体的に示すものである。この装置によれば部分配列の長さは4〜7であるので、生物学的に有効なデータを適切なコンピュータの演算時間で集計できるようになる。
【0028】
また、本発明は配列情報処理方法に関するものであり、請求項に記載の配列情報処理方法は、制御装置と記憶装置と出力装置とを少なくとも備えた配列情報処理装置における配列情報処理方法であって、上記記憶装置は、複数の塩基またはアミノ酸の配列情報を格納する配列情報格納手段と、上記配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納するミュータント配列情報格納手段と、を備え、上記制御装置において実行される、上記配列情報格納手段により格納された上記配列情報のうち利用者にターゲット配列を選択させるターゲット配列選択ステップと、上記配列情報格納手段により格納された上記配列情報のうち検索の対象となる母集団の配列情報を上記利用者に選択させる母集団選択ステップと、上記ターゲット配列選択ステップにより選択された上記ターゲット配列を上記利用者が指定した長さの部分配列に分割する配列分割ステップと、上記配列分割ステップにて分割された上記部分配列に対するミュータント配列情報を、上記ミュータント配列情報格納手段に格納された上記ミュータント配列情報から検索するミュータント配列検索ステップと、上記配列分割ステップにて分割された上記部分配列、および、上記ミュータント配列検索ステップにて検索された上記部分配列に対する上記ミュータント配列情報を上記母集団から検索する検索ステップと、上記検索ステップにて検索された全ての上記部分配列について、上記部分配列と、上記配列分割手段にて上記部分配列を分割したときの上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索ステップにより上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを含む分析結果情報を作成し、上記記憶装置に格納する分析結果情報作成ステップと、上記分析結果情報作成ステップにて上記記憶装置に格納された全ての上記部分配列に対する上記分析結果情報を検索し、上記部分配列と、上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索ステップにより上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを上記出力装置にテーブル形式で出力するテーブル出力ステップと、を含むことを特徴とする。
【0029】
この方法によれば、塩基またはアミノ酸の配列情報と当該配列情報に関連する配列関連情報とを対応付けて格納し、格納された配列情報のうち利用者にターゲット配列を選択させ、格納された配列情報のうち検索の対象となる母集団の配列情報を利用者に選択させ、選択されたターゲット配列を利用者が指定した長さの部分配列に分割し、分割された部分配列に対するミュータント配列情報を、格納されたミュータント配列情報から検索し、分割された部分配列、および、検索された部分配列に対するミュータント配列情報を母集団から検索し、検索された全ての部分配列について、部分配列と、部分配列を分割したときのターゲット配列の先頭からの位置と、部分配列に対するミュータント配列情報と、部分配列およびミュータント配列情報が母集団から検索された個数とを含む分析結果情報を作成し、記憶装置に格納し格納された全ての部分配列に対する分析結果情報を検索し、部分配列と、ターゲット配列の先頭からの位置と、部分配列に対するミュータント配列情報と、部分配列およびミュータント配列情報が母集団から検索された個数とを出力装置にテーブル形式で出力するので、処理結果として表示される配列情報とその分析情報の取捨選択を、利用者が容易に設定し、その設定を保存し、また後からその設定を再利用することができる。
【0031】
この方法によれば、配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納し、分割された部分配列に対するミュータント配列情報を、格納されたミュータント配列情報から検索し、検索された部分配列に対するミュータント配列情報を母集団から検索するので、検索対象の部分配列のミュータントにまで検索範囲を拡張することができ、より有益な生物学情報の解析に利用することができるようになる。
【0036】
また、請求項に記載の配列情報処理方法は、請求項に記載の配列情報処理方法において、上記部分配列の長さは4〜7であることを特徴とする。
【0037】
これは部分配列の長さの一例を一層具体的に示すものである。この方法によれば部分配列の長さは4〜7であるので、生物学的に有効なデータを適切なコンピュータの演算時間で集計できるようになる。
【0044】
また、本発明はプログラムに関するものであり、請求項に記載のプログラムは、制御装置と記憶装置と出力装置とを少なくとも備えた配列情報処理装置において実行されるプログラムであって、上記記憶装置は、複数の塩基またはアミノ酸の配列情報を格納する配列情報格納手段と、上記配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納するミュータント配列情報格納手段と、を備え、上記制御装置において実行される、上記配列情報格納手段により格納された上記配列情報のうち利用者にターゲット配列を選択させるターゲット配列選択ステップと、上記配列情報格納手段により格納された上記配列情報のうち検索の対象となる母集団の配列情報を上記利用者に選択させる母集団選択ステップと、上記ターゲット配列選択ステップにより選択された上記ターゲット配列を上記利用者が指定した長さの部分配列に分割する配列分割ステップと、上記配列分割ステップにて分割された上記部分配列に対するミュータント配列情報を、上記ミュータント配列情報格納手段に格納された上記ミュータント配列情報から検索するミュータント配列検索ステップと、上記配列分割ステップにて分割された上記部分配列、および、上記ミュータント配列検索ステップにて検索された上記部分配列に対する上記ミュータント配列情報を上記母集団から検索する検索ステップと、上記検索ステップにて検索された全ての上記部分配列について、上記部分配列と、上記配列分割手段にて上記部分配列を分割したときの上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索ステップにより上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを含む分析結果情報を作成し、上記記憶装置に格納する分析結果情報作成ステップと、上記分析結果情報作成ステップにて上記記憶装置に格納された全ての上記部分配列に対する上記分析結果情報を検索し、上記部分配列と、上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索ステップにより上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを上記出力装置にテーブル形式で出力するテーブル出力ステップと、を含むことを特徴とする。
【0045】
このプログラムによれば、塩基またはアミノ酸の配列情報と当該配列情報に関連する配列関連情報とを対応付けて格納し、格納された配列情報のうち利用者にターゲット配列を選択させ、格納された配列情報のうち検索の対象となる母集団の配列情報を利用者に選択させ、選択されたターゲット配列を利用者が指定した長さの部分配列に分割し、分割された部分配列に対するミュータント配列情報を、格納されたミュータント配列情報から検索し、分割された部分配列、および、検索された部分配列に対するミュータント配列情報を母集団から検索し、検索された全ての部分配列について、部分配列と、部分配列を分割したときのターゲット配列の先頭からの位置と、部分配列に対するミュータント配列情報と、部分配列およびミュータント配列情報が母集団から検索された個数とを含む分析結果情報を作成し、記憶装置に格納し格納された全ての部分配列に対する分析結果情報を検索し、部分配列と、ターゲット配列の先頭からの位置と、部分配列に対するミュータント配列情報と、部分配列およびミュータント配列情報が母集団から検索された個数とを出力装置にテーブル形式で出力するので、処理結果として表示される配列情報とその分析情報の取捨選択を、利用者が容易に設定し、その設定を保存し、また後からその設定を再利用することができる。
【0047】
このプログラムによれば、配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納し、分割された部分配列に対するミュータント配列情報を、格納されたミュータント配列情報から検索し、検索された部分配列に対するミュータント配列情報を母集団から検索するので、検索対象の部分配列のミュータントにまで検索範囲を拡張することができ、より有益な生物学情報の解析に利用することができるようになる。
【0052】
また、請求項に記載のプログラムは、請求項に記載のプログラムにおいて、上記部分配列の長さは4〜7であることを特徴とする。
【0053】
これは部分配列の長さの一例を一層具体的に示すものである。このプログラムによれば部分配列の長さは4〜7であるので、生物学的に有効なデータを適切なコンピュータの演算時間で集計できるようになる。
【0060】
また、本発明は記録媒体に関するものであり、請求項に記載の記録媒体は、上記請求項5または6に記載されたプログラムを記録したことを特徴とする。
【0061】
この記録媒体によれば、当該記録媒体に記録されたプログラムをコンピュータに読み取らせて実行することによって、請求項5または6に記載されたプログラムをコンピュータを利用して実現することができ、これら各プログラムと同様の効果を得ることができる。
【0062】
【発明の実施の形態】
以下に、本発明にかかる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
特に、以下の実施の形態においては、本発明を、オリゴペプチドに関する配列情報を表示するシステムに適用した例について説明するが、この場合に限られず、あらゆる配列情報の部分配列を表示する全てのシステムにおいて、同様に適用することができる。
【0063】
[本システムの概要]
以下、本システムの原理構成について説明し、その後、本システムの構成および処理等について詳細に説明する。図1は本システムの基本原理の一例を示す原理構成図であり、該システム構成のうち本発明に関係する部分のみを概念的に示している。
【0064】
本システムは、ターゲットとなる蛋白質のアミノ酸配列に関するオリゴペプチドベースの分析結果を、利用者が所望のテーブル形式にまとめて出力するためのシステムである。まず利用者は、ターゲットとなる蛋白質のアミノ酸配列を配列情報データベースから指定する。指定方法は画面上に指定可能な情報を出力して、利用者がその中から所望のアミノ酸配列を選択するようにしてもよく、また、利用者がスクリプト言語などで直接的に所望のアミノ酸配列を特定して当該スクリプトなどを実行することにより指定してもよい。以下においても同様に利用者の指定方法について既存のいかなる指定方法を用いてもよい。
【0065】
ここで、配列情報データベースは、例えば、SWISS−PROT、TrEMBL、PIR、GenPept、PRF/SEQDBなどのインターネットを経由してアクセスする外部のアミノ酸配列データベースであってもよく、また、これらのデータベースをコピーしたり、オリジナルの配列情報を格納したり、さらに独自のアノテーション情報等を付加したりして作成したインハウスデータベースであってもよい。
【0066】
そして、利用者は、予め作成した蛋白質集合(PS;Protein Set)データベースから検索の対象となる母集団を抽出するための条件を指定する。ここで、PSDBは、特定の性質を備える蛋白質に関する配列情報を収集して作成されたデータベースであり、例えば、ヒトの蛋白質に関する配列情報をまとめたPSDB等である。また、PSDBは、例えば、外部データベースやインハウスデータベースから所定のキーワード(例えば、「ヒト」または「human」など)に合致する配列情報を、自然言語検索などを行うことにより抽出して作成してもよい。
【0067】
また、利用者は、検索範囲をミュータントまで検索するか否かを指定する。ミュータントとは、所定のオリゴペプチド配列が変異する可能性のあるものであり、ミューテーションテーブルに予め各オリゴペプチド配列とそのミュータント配列との対応が格納されている。
【0068】
このようにして、利用者がスライドサーチのための条件等の指定が完了すると(ステップSA−1)、本発明の配列情報処理装置においてスライドサーチが実行される(ステップSA−2)。スライドサーチとは、ターゲット配列の先頭から利用者が指定した長さの部分配列に分割し、この部分配列を母集団の配列情報から検索していくことにより、ターゲット配列について各種の分析を行うことをいう。スライドサーチの基本的な手法については後述する。
【0069】
つぎに、スライドサーチの分析結果を、利用者が予め指定したパラメータ等により定められた出力形式に従って関連情報等と一緒にテーブル形式にまとめる(ステップSA−3)。
【0070】
そして、作成したテーブルをディスプレイ装置などの出力装置に出力する(ステップSA−4)。これにより、利用者が必要な部分配列情報に関連する情報をテーブル形式で見易く表示等することが可能になる。
【0071】
[システム構成]
以下、このような基本的特徴を具現化するための、本システムの構成について説明する。
【0072】
[システム構成]
まず、本システムの構成について説明する。図2は、本発明が適用される本システムの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。本システムは、概略的に、配列情報を処理する配列情報処理装置である配列情報処理装置100と、配列情報等に関するデータベースやホモロジー検索用のプログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されている。
【0073】
図2においてネットワーク300は、配列情報処理装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
【0074】
図2において外部システム200は、ネットワーク300を介して、配列情報処理装置100と相互に接続され、利用者に対して配列情報等に関する外部データベースやホモロジー検索やモチーフ検索等の外部分析プログラムを実行するウェブサイトを提供する機能を有する。
【0075】
ここで、外部システム200は、WEBサーバやASPサーバ等として構成してもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成してもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
【0076】
図2において配列情報処理装置100は、概略的に、配列情報処理装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112および出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブル(蛋白質集合(PS)データベース106a〜テーブル106d)を格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。さらに、この配列情報処理装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
【0077】
記憶部106に格納される各種のデータベース(蛋白質集合(PS)データベース106a〜テーブル106d)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0078】
これら記憶部106の各構成要素のうち、蛋白質集合(PS)データベース106aは、特定の性質を備える蛋白質に関する配列情報を収集して作成されたデータベースである。また、インハウスデータベース106bは、塩基またはアミノ酸の配列情報と当該配列情報に関連する配列関連情報とを対応付けて格納する配列情報格納手段である。ここで、配列関連情報は、当該配列の名称、由来する生物名、対応する蛋白質の名称、蛋白質の機能、および/または、関連データベースのアドレスのうち少なくとも一つに関する情報を含む。
【0079】
また、ミューテーションテーブル106cは、配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納するミュータント配列情報格納手段である。また、テーブル106dは、利用者の指定した出力形式に従って、部分配列に関する部分配列情報とスライドサーチによる分析結果とを用いて作成した情報である。
【0080】
また、図2において、通信制御インターフェース部104は、配列情報処理装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
【0081】
また、図2において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力装置をモニタとして記載する)。また、入力装置112としては、キーボード、マウス、および、マイク等を用いることができる。また、モニタも、マウスと協働してポインティングデバイス機能を実現する。
【0082】
また、図2において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、スライドサーチ実行部102a、および、テーブル作成部102bを備えて構成されている。
【0083】
このうち、スライドサーチ実行部102aは、ターゲット配列の先頭から利用者が指定した長さの部分配列に分割し、この部分配列を母集団の配列情報から検索していくことにより、ターゲット配列について各種の分析を行う手段である。また、テーブル作成部102bは、スライドサーチの分析結果を、利用者が予め指定したパラメータ等により定められた出力形式に従って関連情報等と一緒にテーブル形式にまとめる手段である。なお、これら各部によって行なわれる処理の詳細については、後述する。
【0084】
ここで、図3は、スライドサーチ実行部102aの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。スライドサーチ実行部102aは、概略的に、サーチ条件設定部102c、シンプルスライドサーチ(SSS)実行部102d、および、ミューテーションスライドサーチ(MSS)実行部102eを備えて構成されている。
【0085】
このうち、サーチ条件設定部102cは、利用者にスライドサーチの各種の条件を設定させる手段であって、インハウスデータベース106bに格納された配列情報のうち利用者にターゲット配列を選択させるターゲット配列選択手段、蛋白質集合(PS)データベース106aに格納された配列情報のうち検索の対象となる母集団の配列情報を利用者に選択させる母集団選択手段、部分配列の長さを利用者に指定させる手段、および、後述するシンプルスライドサーチを行うか、またはミューテーションスライドサーチを行うかを利用者に選択させる手段などとして機能する。
【0086】
また、シンプルスライドサーチ(SSS)実行部102dは、後述するシンプルスライドサーチを実行する手段である。また、ミューテーションスライドサーチ(MSS)実行部102eは、後述する対象範囲を部分配列のミュータントまで拡大して検索するミューテーションスライドサーチを実行する手段である。
【0087】
ここで、図4は、シンプルスライドサーチ(SSS)実行部102dの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。シンプルスライドサーチ(SSS)実行部102dは、概略的に、オリゴペプチド配列作成部102k、蛋白質集合データベース(PSDB)検索部102m、および、分析結果作成部102nを備えて構成されている。
【0088】
このうち、オリゴペプチド配列作成部102kは、ターゲット配列を利用者が指定した長さの部分配列に分割する配列分割手段である。また、蛋白質集合データベース(PSDB)検索部102mは、オリゴペプチド配列作成部102kにより分割された部分配列を蛋白質集合(PS)データベース106aから抽出した母集団から検索する検索手段である。また、分析結果作成部102nは、オリゴペプチド配列作成部102kによる検索結果に基づいてターゲット配列に関する分析結果を作成する分析結果情報作成手段である。
【0089】
ここで、図5は、ミューテーションスライドサーチ(MSS)実行部102eの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。ミューテーションスライドサーチ(MSS)実行部102eは、概略的に、オリゴペプチド配列作成部102p、ミューテーションテーブル検索部102q、蛋白質集合データベース(PSDB)検索部102r、および、分析結果作成部102sを備えて構成されている。
【0090】
このうち、オリゴペプチド配列作成部102pは、ターゲット配列を利用者が指定した長さの部分配列に分割する配列分割手段である。また、ミューテーションテーブル検索部102qは、部分配列のミュータントをミューテーションテーブル106cから取得する手段である。また、蛋白質集合データベース(PSDB)検索部102rは、オリゴペプチド配列作成部102pにより分割された部分配列を蛋白質集合(PS)データベース106aから抽出した母集団から検索する検索手段である。また、分析結果作成部102sは、蛋白質集合データベース(PSDB)検索部102rによる検索結果に基づいてターゲット配列に関する分析結果を作成する分析結果情報作成手段である。
【0091】
ここで、図6は、テーブル作成部102bの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。テーブル作成部102bは、概略的に、パラメータ設定部102f、列データ作成部102g、外部分析プログラム実行部102h、テーブル整形部102i、および、出力形式変換部102jを備えて構成されている。
【0092】
このうち、パラメータ設定部102fは、出力するテーブルの各種パラメータを利用者に設定させるパラメータ設定手段である。また、列データ作成部102gは、利用者が設定したパラメータに従って部分配列に関する部分配列情報とスライドサーチの分析結果情報とからテーブルの列データを作成する列データ作成手段である。また、外部分析プログラム実行部102hは、分析結果情報に基づいて外部プログラム(例えば、ホモロジー検索やモチーフ検索など)を実行してその実行結果を分析結果情報に追加する外部分析プログラム実行手段である。
【0093】
また、テーブル整形部102iは、利用者の指定したパラメータに従って、部分配列情報と分析結果情報とをテーブル形式に整形するテーブル整形手段である。また、出力形式変換部102jは、テーブル整形部102iにより整形されたテーブルのデータを利用者が指定した表示用データの記述言語(例えば、SGML、HTML、XML、オリジナル記述言語等)に変換する出力形式変換手段である。
【0094】
[本システムの処理]
次に、このように構成された本実施の形態における本システムの処理の一例について、以下に図7〜図13を参照して詳細に説明する。
【0095】
[スライドサーチ処理]
次に、スライドサーチ処理の詳細について図7〜図9に示すフローチャートおよび図13〜図18に示す表示画面図等を参照して説明する。図7は、本実施形態における本システムのスライドサーチ処理の一例を示すフローチャートである。
【0096】
まず、配列情報処理装置100は、サーチ条件設定部102cの処理により、利用者にスライドサーチの各種の条件や、スライドサーチの分析結果などを表示するテーブルの表示条件などを設定させる(ステップSB−1)。
【0097】
ここで、図13は、サーチ条件設定部102cの処理により出力装置114に出力されるテーブル・パラメータ設定画面の一例を示す図である。図13に示すように、テーブル・パラメータ設定画面は、テーブル名の入力領域MA−1、ターゲット蛋白質のデータベース名や蛋白質名の入力領域MA−2、オリゴペプチド長の入力領域MA−3、ヘッダ行数の入力領域MA−4、テーブルの列数の入力領域MA−5等を含んで構成される。
【0098】
利用者がテーブル・パラメータ設定画面を用いて、入力装置112を用いてMA−1からMA−5の各項目の入力を完了すると、サーチ条件設定部102cは当該入力情報を記憶部106に格納する。
【0099】
なお、オリゴペプチド長の入力領域MA−2に入力される部分配列の長さは、好ましくは2〜10であり、さらに好適な長さは4〜7であり、その中で特に好適な長さは4または5である。
【0100】
また、ヘッダ行数の入力領域MA−4に利用者がヘッダ行数を入力すると、サーチ条件設定部102cは、図13に示すように入力されたヘッダ行数分のヘッダ・パラメータ設定画面リンクボタン(図中の「ヘッダ行1」、「ヘッダ行2」が対応する)を表示する。利用者が、当該ヘッダ・パラメータ設定画面リンクボタンを入力装置112を用いて選択すると、サーチ条件設定部102cは、図17に示すヘッダ・パラメータ設定画面を出力装置114に表示する。
【0101】
ここで、図17は、サーチ条件設定部102cの処理により出力装置114に出力されるヘッダ・パラメータ設定画面の一例を示す図である。
図17に示すように、ヘッダ・パラメータ設定画面は、ヘッダ行の行数および総列数の表示領域ME−1、および、開始列数と終了列数と表示項目とから構成されるヘッダフォーマット情報の入力領域ME−2等を含んで構成される。ヘッダフォーマット情報入力領域ME−2に利用者が終了列数を設定すると、サーチ条件設定部102cは次の列の開始列数を自動的に表示する。
【0102】
利用者がヘッダ・パラメータ設定画面を用いて、入力装置112を用いてヘッダフォーマット情報入力領域ME−2の各項目の入力を完了すると、サーチ条件設定部102cは当該入力情報を記憶部106に格納する。
【0103】
再び図13に戻り、列数の入力領域MA−5に利用者がテーブルの列数を入力すると、サーチ条件設定部102cは、図13に示すように列数分の列パラメータ設定画面リンクボタン(図中の「列1」から「列14」が対応する)を表示する。利用者が、当該列パラメータ設定画面リンクボタンを入力装置112を用いて選択すると、サーチ条件設定部102cは、図14に示す列パラメータ設定画面(1)を出力装置114に表示する。
【0104】
ここで、図14は、サーチ条件設定部102cの処理により出力装置114に出力される列パラメータ設定画面(1)の一例を示す図である。
図14に示すように、列パラメータ設定画面(1)は、オリゴペプチドをテーブルの列に表示することを選択するための選択ボタンMB−1、外部分析プログラムの実行結果をテーブルの列に表示することを選択するための選択ボタンMB−2、外部分析プログラムのアドレスなどを入力するためのHTMLリンク情報入力領域MB−3、スライドサーチの分析結果情報をテーブルの列に表示することを選択するための選択ボタンMB−4等を含んで構成される。
【0105】
MB−4において利用者がスライドサーチ結果を選択すると、サーチ条件設定部102cは、図14に示すように、スライドサーチの種別(SSS、MSS)を選択するための選択ボタンMB−5、検索対象母集団名の入力領域MB−6、表示情報の選択領域MB−7(例えば、蛋白質の抽出件数(数字形式で表示するか、または、図形形式(グラフなど)で表示するかをさらに選択する)、蛋白質名、オリゴペプチドの抽出件数(数字形式で表示するか、または、図形形式(グラフなど)で表示するかをさらに選択する)、オリゴペプチドがある蛋白質名とその位置など)、テーブルに情報を表示する際の制約を設定する制約パラメータ設定画面に移行するための制約パラメータ設定画面リンクボタンMB−8などを自動的に表示する。
【0106】
また、スライドサーチの種別(SSS、MSS)を選択するための選択ボタンMB−5において、利用者がミューテーション(MSS)を選択した場合には、サーチ条件設定部102cは、図15に示す列パラメータ設定画面(2)を表示する。
【0107】
ここで、図15は、サーチ条件設定部102cの処理により出力装置114に出力される列パラメータ設定画面(2)の一例を示す図である。
図15に示すように、列パラメータ設定画面(2)は、オリゴペプチドをテーブルの列に表示することを選択するための選択ボタンMC−1、外部分析プログラムの実行結果をテーブルの列に表示することを選択するための選択ボタンMC−2、外部分析プログラムのアドレスなどを入力するためのHTMLリンク情報入力領域MC−3、スライドサーチの分析結果情報をテーブルの列に表示することを選択するための選択ボタンMC−4等を含んで構成される。
【0108】
MC−4において利用者がスライドサーチ結果を選択すると、サーチ条件設定部102cは、図15に示すように、スライドサーチの種別(SSS、MSS)を選択するための選択ボタンMC−5、検索対象母集団名の入力領域MC−6、表示情報の選択領域MC−7(例えば、蛋白質の抽出件数(数字形式で表示するかまたは図形形式(グラフなど)で表示するか、オリゴペプチド単位で集計するかまたはミュータント単位で集計するかなどをさらに選択する)、ミュータント名、蛋白質名、オリゴペプチドの抽出件数(数字形式で表示するかまたは図形形式(グラフなど)で表示するか、オリゴペプチド単位で集計するかまたはミュータント単位で集計するかなどをさらに選択する)、オリゴペプチドのミュータント配列、オリゴペプチドがある蛋白質名とその蛋白質のアミノ酸配列の先頭からの位置など)、テーブルに情報を表示する際の制約を設定する制約パラメータ設定画面に移行するための制約パラメータ設定画面リンクボタンMC−8などを自動的に表示する。
【0109】
利用者が列パラメータ設定画面(1)または列パラメータ設定画面(2)を用いて、入力装置112を用いて各項目の入力や選択を完了すると、サーチ条件設定部102cは当該入力情報を記憶部106に格納する。
【0110】
また、利用者が列パラメータ設定画面(1)または列パラメータ設定画面(2)を用いて、入力装置112を用いて制約パラメータ設定画面リンクボタンMB−8またはMC−8を選択すると、サーチ条件設定部102cは、図16に示す制約パラメータ設定画面を表示する。
【0111】
ここで、図16は、サーチ条件設定部102cの処理により出力装置114に出力される制約パラメータ設定画面の一例を示す図である。図16に示すように、制約パラメータ設定画面は、検索結果の件数の上限数やミュータントの個数の上限数を入力するための入力領域MD−1、ターゲット蛋白質内で無視するオリゴペプチドと開始位置の入力領域MD−2、検索結果内で無視するミュータントや蛋白質や蛋白質と開始位置の入力領域MD−3、外部分析プログラムの入力領域MD−4等を含んで構成される。
【0112】
利用者が制約パラメータ設定画面を用いて、入力装置112を用いてMD−1からMD−4の各項目の入力を完了すると、サーチ条件設定部102cは当該入力情報を記憶部106に格納する。
【0113】
ついで、スライドサーチ実行部102aは、インハウスデータベース106bにアクセスして利用者が指定したターゲット配列を取得する(ステップSB−2)。
【0114】
ついで、スライドサーチ実行部102aは、蛋白質集合(PS)データベース106aにアクセスして利用者が指定した母集団の条件に合致する配列情報を抽出して母集団を作成する(ステップSB−3)。
【0115】
ついで、スライドサーチ実行部102aは、利用者が指定したサーチ種別を判定し(ステップSB−4)、サーチ種別がSSSの場合には、シンプルスライドサーチ(SSS)実行部102dの処理により、後述するSSS処理を実行する(ステップSB−5)。
【0116】
一方、サーチ種別がMSSの場合には、ミューテーションスライドサーチ(MSS)実行部102eの処理により、ミューテーションテーブル106cを参照して後述するMSS処理を実行する(ステップSB−6)。
【0117】
そして、スライドサーチ実行部102aは、SSSまたはMSSの分析結果情報を記憶部106に格納する(ステップSB−7)。これにて、スライドサーチ処理が終了する。
【0118】
[シンプルスライドサーチ(SSS)処理]
次に、シンプルスライドサーチ(SSS)処理の詳細について図8を参照して説明する。図8は、本実施形態における本システムのシンプルスライドサーチ(SSS)処理の一例を示すフローチャートである。
【0119】
まず、シンプルスライドサーチ(SSS)実行部102dは、ターゲット配列の先頭からの位置を示す情報(i)に1を設定する(ステップSC−1)。
【0120】
次に、オリゴペプチド配列作成部102kは、ターゲット配列(アミノ酸配列)のi番目から予め利用者が設定した長さの部分配列(オリゴペプチド配列)を取得する(ステップSC−2)。
【0121】
ここで、図11は、ターゲット配列(アミノ酸配列)のi番目から予め利用者が設定した長さの部分配列(オリゴペプチド配列)を取得する場合の一例を示した概念図であり、図12は、図11で用いられたアミノ酸の1文字記号に対応する3文字記号とアミノ酸の名称の一覧を示す図である。
【0122】
ついで、蛋白質集合データベース(PSDB)検索部102mは、オリゴペプチド配列を母集団から検索して(ステップSC−3)、母集団の中にオリゴペプチド配列が存在する場合には(ステップSC−4)、iと、検索に用いたオリゴペプチド配列と、母集団中に存在した個数と、当該オリゴペプチド配列が存在した蛋白質名とを検索結果情報として抽出して記憶部106に格納する(ステップSC−5)。
【0123】
ついで、シンプルスライドサーチ(SSS)実行部102dは、iに1を加算してインクリメントする(ステップSC−6)。
【0124】
ついで、シンプルスライドサーチ(SSS)実行部102dは、ターゲット配列の最後であるか判断して(ステップSC−7)、最後ではない場合にはステップSC−2に処理を戻す。
【0125】
一方、ターゲット配列の最後である場合には、分析結果作成部102nは、全ての部分配列情報に関する検索結果情報を集計してターゲット配列に関する分析結果情報を作成する(ステップSC−8)。これにて、シンプルスライドサーチ(SSS)処理が終了する。
【0126】
[ミューテーションスライドサーチ(MSS)処理]
次に、ミューテーションスライドサーチ(MSS)処理の詳細について図9を参照して説明する。図9は、本実施形態における本システムのミューテーションスライドサーチ(MSS)処理の一例を示すフローチャートである。
【0127】
まず、ミューテーションスライドサーチ(MSS)実行部102eは、ターゲット配列の先頭からの位置を示す情報(i)に1を設定する(ステップSD−1)。
【0128】
次に、オリゴペプチド配列作成部102pは、ターゲット配列(アミノ酸配列)のi番目から予め利用者が設定した長さの部分配列(オリゴペプチド配列)を取得する(ステップSD−2)。
【0129】
ここで、図11は、ターゲット配列(アミノ酸配列)のi番目から予め利用者が設定した長さの部分配列(オリゴペプチド配列)を取得する場合の一例を示した概念図であり、図12は、図11で用いられたアミノ酸の1文字記号に対応する3文字記号とアミノ酸の名称の一覧を示す図である。
【0130】
ついで、ミューテーションテーブル検索部102qは、オリゴペプチド配列に基づいてミューテーションテーブル106cにアクセスして当該オリゴペプチド配列に対応するミュータントの配列を取得する(ステップSD−3)。
【0131】
ついで、蛋白質集合データベース(PSDB)検索部102rは、オリゴペプチド配列およびそのミュータントを母集団から検索して(ステップSD−4)、母集団の中にオリゴペプチド配列またはミュータントが存在する場合には(ステップSD−5)、iと、検索に用いたオリゴペプチドまたはミュータントの配列と、母集団中に存在した個数と、当該オリゴペプチドまたはミュータントの配列が存在した蛋白質名とを検索結果情報として抽出して記憶部106に格納する(ステップSD−6)。
【0132】
ついで、ミューテーションスライドサーチ(MSS)実行部102eは、iに1を加算してインクリメントする(ステップSD−7)。
【0133】
ついで、ミューテーションスライドサーチ(MSS)実行部102eは、ターゲット配列の最後であるか判断して(ステップSD−8)、最後ではない場合にはステップSD−2に処理を戻す。
【0134】
一方、ターゲット配列の最後である場合には、分析結果作成部102sは、全ての部分配列情報に関する検索結果情報を集計してターゲット配列に関する分析結果情報を作成する(ステップSD−9)。これにて、ミューテーションスライドサーチ(MSS)処理が終了する。
【0135】
[テーブル作成処理]
次に、テーブル作成処理の詳細について図10を参照して説明する。図10は、本実施形態における本システムのテーブル作成処理の一例を示すフローチャートである。
【0136】
まず、パラメータ設定部102fは、記憶部106を参照して、利用者が予め設定したテーブルの各種パラメータを取得する(ステップSE−1)。すなわち、上述した図13から図17の各種のパラメータ設定画面などを用いて利用者が設定したパラメータを記憶部106を参照して取得する。
【0137】
ついで、テーブル作成部102bは、記憶部106に格納されたスライドサーチ実行部102aによるスライドサーチ処理の分析結果情報を取得する(ステップSE−2)。
【0138】
ついで、列データ作成部102gは、利用者が設定したテーブルのパラメータに従って、分析結果情報の各項目についてテーブルの列データを作成する。まず、列データ作成部102gは、列ごとに外部分析プログラムの呼び出しを指定しているかを判定する(ステップSE−3)。
【0139】
ステップSE−3において、外部分析プログラムの実行を選択していない場合には、スライドサーチの分析結果に基づいて列データを作成する(ステップSE−4)。
【0140】
一方、ステップSE−3において、外部分析プログラム(例えば、ホモロジー検索、モチーフ検索等)の実行を選択した場合には、列データ作成部102gは、HTMLリンク情報で指定された外部システム200に対してコマンドや引数等を通信制御インターフェース部104を介して送信して、外部分析プログラムの実行を依頼し、外部システム200からその実行結果を受信する(ステップSE−5)。
【0141】
そして、列データ作成部102gは、外部分析プログラムの実行結果およびスライドサーチの分析結果に基づいて列データを作成する(ステップSE−6)。
【0142】
全ての列について、列データの作成と外部分析プログラムの実行が完了した後、テーブル整形部102iの処理により、外部分析プログラムの実行結果等について見易い形式に整形したり、表示されるテーブルの列数や行数について整形処理を行ったりした後(ステップSE−7)、出力形式変換部102jの処理により、既存の変換技術を用いて利用者が設定したテーブルの表示用データの記述言語(例えばHTMLやXMLなど)に変換する(ステップSE−8)。
【0143】
ついで、出力形式変換部102jは、作成したテーブルの表示用データを記憶部106に格納し(ステップSE−9)、所望のタイミングで出力装置114に送信して出力する。
【0144】
図18は、配列情報処理装置100の出力装置114に出力されたテーブルの一例を示す図である。図18に示すように、テーブルは、ヘッダの出力領域MF−1と、そのヘッダに対応する上述した列データとを含んで構成される。
【0145】
図18の例では、ヘッダは、先頭からの位置MF−2、ターゲット配列の部分配列であるオリゴペプチド配列MF−3、母集団における抽出件数およびその件数の図形表示MF−4、ミュータント配列MF−5、抽出した蛋白質名MF−6、母集団抽出の条件MF−7、および、サーチ種別MF−8を含んで構成される。
【0146】
また、蛋白質名は、関連するウェブサイトのWWWリンク情報が埋め込まれており、利用者が当該蛋白質名をクリックすると既存のWWWのハイパーリンク構造のウェブページ表示技術を用いてそのウェブサイトの情報を表示させることができる(MF−9)。
【0147】
また、利用者が設定した抽出件数の上限値を超える場合には、膨大な量の情報を表示しないように制御することができる(MF−10)。これにて、テーブル作成処理が終了する。
【0148】
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
【0149】
例えば、テーブル・パラメータ設定画面や列パラメータ設定画面やヘッダ・パラメータ設定画面や制約パラメータ設定画面などで利用者が入力する各種の情報は、スクリプト言語などによりプログラム形式で指定することにより情報の定義および設定を行ってもよい。
【0150】
また、実施形態において説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
【0151】
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
【0152】
また、配列情報処理装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
【0153】
例えば、配列情報処理装置100の各サーバが備える処理機能、特に制御部102にて行なわれる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。なお、プログラムは、後述する記録媒体に記録されており、必要に応じて配列情報処理装置100に機械的に読み取られる。
【0154】
記憶部106に格納される各種のデータベース等(蛋白質集合(PS)データベース106a〜テーブル106d)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0155】
また、配列情報処理装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理端末等の情報処理装置にプリンタやモニタやイメージスキャナ等の周辺装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
【0156】
さらに、配列情報処理装置100の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。例えば、各データベースを独立したデータベース装置として独立に構成してもよく、また、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。
【0157】
また、本発明にかかるプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」や、各種コンピュータシステムに内蔵されるROM、RAM、HD等の任意の「固定用の物理媒体」、あるいは、LAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。
【0158】
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0159】
また、ネットワーク300は、配列情報処理装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネットや、イントラネットや、LAN(有線/無線の双方を含む)や、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、IMT2000方式、GSM方式またはPDC/PDC―P方式等の携帯回線交換網/携帯パケット交換網や、無線呼出網や、Bluetooth等の局所無線網や、PHS網や、CS、BSまたはISDB等の衛星通信網等のうちいずれかを含んでもよい。すなわち、本システムは、有線・無線を問わず任意のネットワークを介して、各種データを送受信することができる。
【0160】
【発明の効果】
以上詳細に説明したように、本発明によれば、塩基またはアミノ酸の配列情報と当該配列情報に関連する配列関連情報とを対応付けて格納し、格納された配列情報のうち利用者にターゲット配列を選択させ、格納された配列情報のうち検索の対象となる母集団の配列情報を利用者に選択させ、選択されたターゲット配列を利用者が指定した長さの部分配列に分割し、分割された部分配列を母集団から検索し、検索結果情報からターゲット配列に関する分析結果情報を作成し、利用者の設定したパラメータに従って、部分配列に関する部分配列情報と分析結果情報とをテーブル形式で出力するので、処理結果として表示される配列情報とその分析情報の取捨選択を、利用者が容易に設定し、その設定を保存し、また後からその設定を再利用することができる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。
【0161】
また、本発明によれば、配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納し、分割された部分配列に対するミュータント配列情報を、格納されたミュータント配列情報から検索し、検索された部分配列に対するミュータント配列情報を母集団から検索するので、検索対象の部分配列のミュータントにまで検索範囲を拡張することができ、より有益な生物学情報の解析に利用することができる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。
【0162】
また、本発明によれば、配列関連情報は、当該配列の名称、由来する生物名、対応する蛋白質の名称、蛋白質の機能、および/または、関連データベースのアドレスのうち少なくとも一つに関する情報を含むので、これらの項目をターゲット配列に関する分析情報として利用することができる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。
【0163】
また、本発明によれば、母集団は、特定の性質を備える蛋白質に関する配列情報を収集して作成するので、分析情報として抽出する必要のある蛋白質を限定することができ、検索時間を短縮化できる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。また、本発明によれば、母集団に対して別のターゲット配列で分析することができる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。
【0164】
また、本発明によれば、部分配列の長さは4〜7であるので、生物学的に有効なデータを適切なコンピュータの演算時間で集計できる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。
【0165】
また、本発明によれば、部分配列情報は、ターゲット配列の先頭からの位置、および/または、部分配列のうち少なくとも一つに関する情報を含むので、部分配列とその位置を任意に表示できる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。
【0166】
また、本発明によれば、分析結果情報は、部分配列毎に、抽出した件数、検索に用いた上記ミュータント配列情報、抽出した配列の名称、抽出した配列の由来する生物名、抽出した配列に対応する蛋白質の名称、抽出した配列の蛋白質の機能、外部プログラムの実行結果、および/または、抽出した配列の関連データベースのアドレスのうち少なくとも一つに関する情報を含むので、これらの各項目を任意に表示できる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。
【0167】
また、本発明によれば、パラメータは、分析結果情報に含まれる各情報の出力可否、抽出した件数のうち出力する際の上限数、分析結果情報の各情報の図形表示可否、テーブルのヘッダのフォーマット、および/または、テーブルの表示用データの記述言語のうち少なくとも一つに関する情報を含むので、これらの各項目を任意に表示できる配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体を提供することができる。
【図面の簡単な説明】
【図1】本システムの基本原理の一例を示す原理構成図である。
【図2】本発明が適用される本システムの構成の一例を示すブロック図である。
【図3】スライドサーチ実行部102aの構成の一例を示すブロック図である。
【図4】シンプルスライドサーチ(SSS)実行部102dの構成の一例を示すブロック図である。
【図5】ミューテーションスライドサーチ(MSS)実行部102eの構成の一例を示すブロック図である。
【図6】テーブル作成部102bの構成の一例を示すブロック図である。
【図7】本実施形態における本システムのスライドサーチ処理の一例を示すフローチャートである。
【図8】本実施形態における本システムのシンプルスライドサーチ(SSS)処理の一例を示すフローチャートである。
【図9】本実施形態における本システムのミューテーションスライドサーチ(MSS)処理の一例を示すフローチャートである。
【図10】本実施形態における本システムのテーブル作成処理の一例を示すフローチャートである。
【図11】ターゲット配列(アミノ酸配列)のi番目から予め利用者が設定した長さの部分配列(オリゴペプチド配列)を取得する場合の一例を示した概念図である。
【図12】図11で用いられたアミノ酸の1文字記号に対応する3文字記号とアミノ酸の名称の一覧を示す図である。
【図13】サーチ条件設定部102cの処理により出力装置114に出力されるテーブル・パラメータ設定画面の一例を示す図である。
【図14】サーチ条件設定部102cの処理により出力装置114に出力される列パラメータ設定画面(1)の一例を示す図である。
【図15】サーチ条件設定部102cの処理により出力装置114に出力される列パラメータ設定画面(2)の一例を示す図である。
【図16】サーチ条件設定部102cの処理により出力装置114に出力される制約パラメータ設定画面の一例を示す図である。
【図17】サーチ条件設定部102cの処理により出力装置114に出力されるヘッダ・パラメータ設定画面の一例を示す図である。
【図18】配列情報処理装置100の出力装置114に出力されたテーブルの一例を示す図である。
【符号の説明】
100 配列情報処理装置
102 制御部
102a スライドサーチ実行部
102b テーブル作成部
102c サーチ条件設定部
102d シンプルスライドサーチ(SSS)実行部
102e ミューテーションスライドサーチ(MSS)実行部
102f パラメータ設定部
102g 列データ作成部
102h 外部分析プログラム実行部
102i テーブル整形部
102j 出力形式変換部
102k オリゴペプチド配列作成部
102m 蛋白質集合データベース(PSDB)検索部
102n 分析結果作成部
102p オリゴペプチド配列作成部
102q ミューテーションテーブル検索部
104 通信制御インターフェース部
106 記憶部
106a 蛋白質集合(PS)データベース
106b インハウスデータベース
106c ミューテーションテーブル
106d テーブル
108 入出力制御インターフェース部
112 入力装置
114 出力装置
200 外部システム
300 ネットワーク

Claims (7)

  1. 制御装置と記憶装置と出力装置とを少なくとも備えた配列情報処理装置であって、
    上記記憶装置は、
    複数の塩基またはアミノ酸の配列情報を格納する配列情報格納手段と、
    上記配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納するミュータント配列情報格納手段と、
    を備え、
    上記制御装置は、
    上記配列情報格納手段により格納された上記配列情報のうち利用者にターゲット配列を選択させるターゲット配列選択手段と、
    上記配列情報格納手段により格納された上記配列情報のうち検索の対象となる母集団の配列情報を上記利用者に選択させる母集団選択手段と、
    上記ターゲット配列選択手段により選択された上記ターゲット配列を上記利用者が指定した長さの部分配列に分割する配列分割手段と、
    上記配列分割手段にて分割された上記部分配列に対するミュータント配列情報を、上記ミュータント配列情報格納手段に格納された上記ミュータント配列情報から検索するミュータント配列検索手段と、
    上記配列分割手段にて分割された上記部分配列、および、上記ミュータント配列検索手段にて検索された上記部分配列に対する上記ミュータント配列情報を上記母集団から検索する検索手段と、
    上記検索手段にて検索された全ての上記部分配列について、上記部分配列と、上記配列分割手段にて上記部分配列を分割したときの上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索手段により上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを含む分析結果情報を作成し、上記記憶装置に格納する分析結果情報作成手段と、
    上記分析結果情報作成手段にて上記記憶装置に格納された全ての上記部分配列に対する上記分析結果情報を検索し、上記部分配列と、上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索手段により上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを上記出力装置にテーブル形式で出力するテーブル出力手段と、
    を備えたことを特徴とする配列情報処理装置。
  2. 上記部分配列の長さは4〜7であることを特徴とする請求項に記載の配列情報処理装置。
  3. 制御装置と記憶装置と出力装置とを少なくとも備えた配列情報処理装置における配列情報処理方法であって、
    上記記憶装置は、
    複数の塩基またはアミノ酸の配列情報を格納する配列情報格納手段と、
    上記配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納するミュータント配列情報格納手段と、
    を備え、
    上記制御装置において実行される、
    上記配列情報格納手段により格納された上記配列情報のうち利用者にターゲット配列を選択させるターゲット配列選択ステップと、
    上記配列情報格納手段により格納された上記配列情報のうち検索の対象となる母集団の配列情報を上記利用者に選択させる母集団選択ステップと、
    上記ターゲット配列選択ステップにより選択された上記ターゲット配列を上記利用者が指定した長さの部分配列に分割する配列分割ステップと、
    上記配列分割ステップにて分割された上記部分配列に対するミュータント配列情報を、上記ミュータント配列情報格納手段に格納された上記ミュータント配列情報から検索する ミュータント配列検索ステップと、
    上記配列分割ステップにて分割された上記部分配列、および、上記ミュータント配列検索ステップにて検索された上記部分配列に対する上記ミュータント配列情報を上記母集団から検索する検索ステップと、
    上記検索ステップにて検索された全ての上記部分配列について、上記部分配列と、上記配列分割手段にて上記部分配列を分割したときの上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索ステップにより上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを含む分析結果情報を作成し、上記記憶装置に格納する分析結果情報作成ステップと、
    上記分析結果情報作成ステップにて上記記憶装置に格納された全ての上記部分配列に対する上記分析結果情報を検索し、上記部分配列と、上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索ステップにより上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを上記出力装置にテーブル形式で出力するテーブル出力ステップと、
    を含むことを特徴とする配列情報処理方法。
  4. 上記部分配列の長さは4〜7であることを特徴とする請求項に記載の配列情報処理方法。
  5. 制御装置と記憶装置と出力装置とを少なくとも備えた配列情報処理装置において実行されるプログラムであって、
    上記記憶装置は、
    複数の塩基またはアミノ酸の配列情報を格納する配列情報格納手段と、
    上記配列情報と、当該配列情報が変異する可能性があるミュータント配列に関するミュータント配列情報とを対応付けて格納するミュータント配列情報格納手段と、
    を備え、
    上記制御装置において実行される、
    上記配列情報格納手段により格納された上記配列情報のうち利用者にターゲット配列を選択させるターゲット配列選択ステップと、
    上記配列情報格納手段により格納された上記配列情報のうち検索の対象となる母集団の配列情報を上記利用者に選択させる母集団選択ステップと、
    上記ターゲット配列選択ステップにより選択された上記ターゲット配列を上記利用者が指定した長さの部分配列に分割する配列分割ステップと、
    上記配列分割ステップにて分割された上記部分配列に対するミュータント配列情報を、上記ミュータント配列情報格納手段に格納された上記ミュータント配列情報から検索するミュータント配列検索ステップと、
    上記配列分割ステップにて分割された上記部分配列、および、上記ミュータント配列検索ステップにて検索された上記部分配列に対する上記ミュータント配列情報を上記母集団から検索する検索ステップと、
    上記検索ステップにて検索された全ての上記部分配列について、上記部分配列と、上記配列分割手段にて上記部分配列を分割したときの上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索ステップにより上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを含む分析結果情報を作成し、上記記憶装置に格納する分析結果情報作成ステップと、
    上記分析結果情報作成ステップにて上記記憶装置に格納された全ての上記部分配列に対する上記分析結果情報を検索し、上記部分配列と、上記ターゲット配列の先頭からの位置と、上記部分配列に対する上記ミュータント配列情報と、上記検索ステップにより上記部分配列および上記ミュータント配列情報が上記母集団から検索された個数とを上記出力装置にテーブル形式で出力するテーブル出力ステップと、
    を含むことを特徴とするプログラム。
  6. 上記部分配列の長さは4〜7であることを特徴とする請求項に記載のプログラム。
  7. 上記請求項5または6に記載されたプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2001367741A 2001-11-30 2001-11-30 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体 Expired - Fee Related JP3881224B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001367741A JP3881224B2 (ja) 2001-11-30 2001-11-30 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001367741A JP3881224B2 (ja) 2001-11-30 2001-11-30 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2003167883A JP2003167883A (ja) 2003-06-13
JP3881224B2 true JP3881224B2 (ja) 2007-02-14

Family

ID=19177445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001367741A Expired - Fee Related JP3881224B2 (ja) 2001-11-30 2001-11-30 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP3881224B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018016556A1 (ja) * 2016-07-21 2018-01-25 石原産業株式会社 ジェミニウイルス病の防除に有効なペプチドとその利用法
CN115409174B (zh) * 2022-11-01 2023-03-31 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69333422T2 (de) * 1992-07-31 2004-12-16 International Business Machines Corp. Auffindung von Zeichenketten in einer Datenbank von Zeichenketten
JP3370787B2 (ja) * 1993-08-10 2003-01-27 株式会社日立製作所 文字配列検索方法
JP3476310B2 (ja) * 1996-08-01 2003-12-10 富士通株式会社 蛋白質データベース・システム並びに蛋白質の名前および機能の表示方法
JP3801714B2 (ja) * 1997-01-31 2006-07-26 独立行政法人科学技術振興機構 蛋白質の機能部位予測方法と機能部位予測装置 並びに蛋白質の機能改良方法
JP2000099542A (ja) * 1998-09-25 2000-04-07 Ricoh Co Ltd 生産実績の問い合わせ及びデータベースの問い合わせ装置
US6453241B1 (en) * 1998-12-23 2002-09-17 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data

Also Published As

Publication number Publication date
JP2003167883A (ja) 2003-06-13

Similar Documents

Publication Publication Date Title
US6408308B1 (en) System and method for generating, analyzing and storing normalized expression datasets from raw expression datasets derived from microarray includes nucleic acid probe sequences
EP1505517A1 (en) Mutant sequence analyzer
JP3866210B2 (ja) 個人特定防止装置、個人特定防止方法、および、プログラム
JP3881224B2 (ja) 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体
WO2003081471A1 (fr) Dispositif de gestion de donnees d'expression genetique
EP2015208A1 (en) Bioitem searcher, bioitem search terminal, bioitem search method, and program
JP2003203076A (ja) 知見探索装置、知見探索方法、プログラム、および、記録媒体
JP3880417B2 (ja) 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体
JP5639237B2 (ja) ネットワークモデル統合装置、ネットワークモデル統合システム、ネットワークモデル統合方法、および、プログラム
JP3881238B2 (ja) Rna配列解析装置、rna配列解析方法、プログラム、および、記録媒体
Piovesan et al. Databases for intrinsically disordered proteins
JP2002202992A (ja) ホームページ検索システム
JP4054574B2 (ja) 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体
JP2006004152A (ja) 検索装置、検索方法、情報処理システム
JP4362290B2 (ja) ハプロタイプ解析装置、および、ハプロタイプ解析方法をコンピュータに実行させることを特徴とするプログラム
EP2209075A1 (en) Base sequence determination program, base sequence determination system and base sequence determination method
JP4362292B2 (ja) Snp情報データ処理装置、および、snp情報データ処理方法をコンピュータに実行させるプログラム
JP2007334769A (ja) 配列抽出装置、配列抽出方法、プログラムおよび記録媒体
JP4055772B2 (ja) タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体
EP1460560A1 (en) Apparatus for predicting interaction site, method of predicting interaction site, program and recording medium
JP4343222B2 (ja) 薬物代謝酵素予測装置
WO2003056461A1 (fr) Dispositif de prediction de structure proteique, procede de prediction de structure proteique, programme et support d'enregistrement associes
JP2004234105A (ja) アナリシスセットデータ作成装置、および、アナリシスセットデータ作成方法をコンピュータに実行させるプログラム
JP2002215638A (ja) ノウハウ情報処理システム、ノウハウ情報処理装置、情報端末装置、ノウハウ情報処理方法、および、プログラム
JP2004147640A (ja) insituハイブリダイゼーション解析管理方法およびinsituハイブリダイゼーション解析管理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061109

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091117

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131117

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees