JP2003167883A - 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体 - Google Patents

配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体

Info

Publication number
JP2003167883A
JP2003167883A JP2001367741A JP2001367741A JP2003167883A JP 2003167883 A JP2003167883 A JP 2003167883A JP 2001367741 A JP2001367741 A JP 2001367741A JP 2001367741 A JP2001367741 A JP 2001367741A JP 2003167883 A JP2003167883 A JP 2003167883A
Authority
JP
Japan
Prior art keywords
sequence
information
array
partial
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001367741A
Other languages
English (en)
Other versions
JP3881224B2 (ja
Inventor
Naoyuki Horai
尚幸 蓬莱
Hirofumi Doi
洋文 土居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2001367741A priority Critical patent/JP3881224B2/ja
Publication of JP2003167883A publication Critical patent/JP2003167883A/ja
Application granted granted Critical
Publication of JP3881224B2 publication Critical patent/JP3881224B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 利用者が必要な部分配列情報に関連する情報
をテーブル形式で見易く表示等することが可能な配列情
報処理装置等を提供することを課題とする。 【解決手段】 本発明にかかるシステムは、配列情報を
処理する配列情報処理装置である配列情報処理装置10
0と、配列情報等に関するデータベースやホモロジー検
索用のプログラム等を提供する外部システム200と
を、ネットワーク300を介して通信可能に接続して構
成されている。配列情報処理装置100は、配列情報処
理装置100の全体を統括的に制御するCPU等の制御
部102、通信回線等に接続されるルータ等の通信装置
に接続される通信制御インターフェース部104、入力
装置112および出力装置114に接続される入出力制
御インターフェース部108、および、各種のデータベ
ースやテーブルを格納する記憶部106を備えて構成さ
れている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、配列情報処理装
置、配列情報処理方法、プログラム、および、記録媒体
に関し、特に、DNA塩基配列またはアミノ酸配列の部
分配列を処理する配列情報処理装置、配列情報処理方
法、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】バイオインフォマティクス分野において
広く利用される情報として、塩基またはアミノ酸の配列
データがある。各種のデータベースに蓄積された配列デ
ータに基づいてホモロジー検索やモチーフ検索などを行
うことにより、現在、様々な生命現象の分析が行われて
いる。ここで、配列情報を用いた生命現象の分析の過程
において、配列の部分配列を用いた解析手法が近年にな
って研究されている。
【0003】たとえば、特開平10−45795号公報
に開示された発明は、部分配列を用いて機能未知の蛋白
質の機能や機能部位、あるいは、機能が既知で機能部位
が未知の蛋白質の機能部位を推定するための蛋白質デー
タベース・システム並びに蛋白質の機能および機能部位
の推定方法に関するものである。特開平10−4579
5号公報には、特定の蛋白質のアミノ酸配列情報の一部
分であるオリゴペプチドとそのオリゴペプチドを含む蛋
白質に関する機能等の情報や、オリゴペプチドの出現頻
度等を出力装置に表示する発明が開示されている。
【0004】また、特願2000−72485号に開示
された発明は、部分配列を用いた蛋白質間相互作用予測
方法及び該予測プログラムを担持した記録媒体に関する
ものである。特願2000−72485号には、特定の
蛋白質のアミノ酸配列の一部分であるオリゴペプチドの
配列情報や、そのオリゴペプチドの配列情報を持つ他の
蛋白質とのアラインメント結果や蛋白質におけるそのオ
リゴペプチドの出現頻度等に関する情報を利用して蛋白
質間の相互作用を予測する発明が開示されている。
【0005】
【発明が解決しようとする課題】しかしながら、これら
の従来技術においては、すべてのオリゴペプチド等の部
分配列に関する情報を網羅的に収集し、分かり易く表形
式でまとめて表示するものが存在しなかったという問題
点を有していた。すなわち、部分配列に関するあらゆる
情報を当該部分配列と関連付けて整理、格納、検索、管
理などを行うものは存在しなかった。
【0006】例えば、上述した特開平10−45795
号公報および特願2000−72485号に開示された
発明においては、オリゴペプチドの配列データに関連す
る大量の情報について出力装置に表示させる際に、どの
情報をどの程度表示するかについて、利用者がその値を
容易に設定し、かつ、その設定を保存しておき、後から
設定を検索して再利用することはできなかった。
【0007】すなわち、従来技術においては、表示する
情報の取捨選択を、利用者が容易に設定し、その設定を
保存し、また後からその設定を検索することにより再利
用することができなかった。
【0008】また、従来のオリゴペプチドの解析手法
は、そのオリゴペプチドのミュータントにまで検索範囲
を自動的に拡大して配列情報を検索するものは存在しな
かった。
【0009】このように、部分配列の解析は、特に、ア
ミノ酸配列の部分配列であるオリゴペプチドの解析は蛋
白質の機能や相互作用などを推定する場合にも利用でき
ることがわかっているため極めて有効であるが、従来技
術は上述したような数々の問題点を有しており、その結
果、配列情報表示装置の利用者および管理者のいずれに
とっても、利便性が悪く、また、利用効率が悪いもので
あった。
【0010】なお、これまで説明した従来の技術および
発明が解決しようとする課題は、オリゴペプチドに関す
る配列情報を表示するシステムに限られず、あらゆる配
列情報の部分配列を表示する全てのシステムにおいて、
同様に考えることができる。
【0011】本発明は上記問題点に鑑みてなされたもの
で、出力装置に表示する配列情報とその関連情報の取捨
選択を、利用者が容易に設定し、その設定を保存し、ま
た後からその設定を検索することにより再利用すること
のできる、配列情報処理装置、配列情報処理方法、プロ
グラム、および、記録媒体を提供することを目的として
いる。
【0012】
【課題を解決するための手段】このような目的を達成す
るため、請求項1に記載の配列情報処理装置は、塩基ま
たはアミノ酸の配列情報と当該配列情報に関連する配列
関連情報とを対応付けて格納する配列情報格納手段と、
上記配列情報格納手段により格納された上記配列情報の
うち利用者にターゲット配列を選択させるターゲット配
列選択手段と、上記配列情報格納手段により格納された
上記配列情報のうち検索の対象となる母集団の配列情報
を上記利用者に選択させる母集団選択手段と、上記ター
ゲット配列選択手段により選択された上記ターゲット配
列を上記利用者が指定した長さの部分配列に分割する配
列分割手段と、上記配列分割手段にて分割された上記部
分配列を上記母集団から検索する検索手段と、上記検索
手段の検索結果情報から上記ターゲット配列に関する分
析結果情報を作成する分析結果情報作成手段と、上記利
用者の設定したパラメータに従って、上記部分配列に関
する部分配列情報と上記分析結果情報とをテーブル形式
で出力するテーブル出力手段とを備えたことを特徴とす
る。
【0013】この装置によれば、塩基またはアミノ酸の
配列情報と当該配列情報に関連する配列関連情報とを対
応付けて格納し、格納された配列情報のうち利用者にタ
ーゲット配列を選択させ、格納された配列情報のうち検
索の対象となる母集団の配列情報を利用者に選択させ、
選択されたターゲット配列を利用者が指定した長さの部
分配列に分割し、分割された部分配列を母集団から検索
し、検索結果情報からターゲット配列に関する分析結果
情報を作成し、利用者の設定したパラメータに従って、
部分配列に関する部分配列情報と分析結果情報とをテー
ブル形式で出力するので、処理結果として表示される配
列情報とその分析情報の取捨選択を、利用者が容易に設
定し、その設定を保存し、また後からその設定を再利用
することができる。
【0014】また、請求項2に記載の配列情報処理装置
は、請求項1に記載の配列情報処理装置において、上記
配列情報と、当該配列情報が変異する可能性があるミュ
ータント配列に関するミュータント配列情報とを対応付
けて格納するミュータント配列情報格納手段と、上記配
列分割手段にて分割された上記部分配列に対するミュー
タント配列情報を、上記ミュータント配列情報格納手段
にて格納された上記ミュータント配列情報から検索する
ミュータント配列検索手段とをさらに備え、上記検索手
段は、上記ミュータント配列検索手段にて検索された上
記部分配列に対する上記ミュータント配列情報を上記母
集団から検索することを特徴とする。
【0015】この装置によれば、配列情報と、当該配列
情報が変異する可能性があるミュータント配列に関する
ミュータント配列情報とを対応付けて格納し、分割され
た部分配列に対するミュータント配列情報を、格納され
たミュータント配列情報から検索し、検索された部分配
列に対するミュータント配列情報を母集団から検索する
ので、検索対象の部分配列のミュータントにまで検索範
囲を拡張することができ、より有益な生物学情報の解析
に利用することができるようになる。
【0016】また、請求項3に記載の配列情報処理装置
は、請求項1または2に記載の配列情報処理装置におい
て、上記配列関連情報は、当該配列の名称、由来する生
物名、対応する蛋白質の名称、蛋白質の機能、および/
または、関連データベースのアドレスのうち少なくとも
一つに関する情報を含むことを特徴とする。
【0017】これは配列関連情報の一例を一層具体的に
示すものである。この装置によれば、配列関連情報は、
当該配列の名称、由来する生物名、対応する蛋白質の名
称、蛋白質の機能、および/または、関連データベース
のアドレスのうち少なくとも一つに関する情報を含むの
で、これらの項目をターゲット配列に関する分析情報と
して利用することができるようになる。
【0018】また、請求項4に記載の配列情報処理装置
は、請求項1から3のいずれか一つに記載の配列情報処
理装置において、上記母集団は、特定の性質を備える蛋
白質に関する配列情報を収集して作成することを特徴と
する。
【0019】これは検索対象の母集団の一例を一層具体
的に示すものである。この装置によれば、母集団は、特
定の性質を備える蛋白質に関する配列情報を収集して作
成するので、分析情報として抽出する必要のある蛋白質
を限定することができ、検索時間を短縮化できるように
なる。また、母集団に対して別のターゲット配列で分析
することができるようになる。
【0020】また、請求項5に記載の配列情報処理装置
は、請求項1から4のいずれか一つに記載の配列情報処
理装置において、上記部分配列の長さは4〜7であるこ
とを特徴とする。
【0021】これは部分配列の長さの一例を一層具体的
に示すものである。この装置によれば部分配列の長さは
4〜7であるので、生物学的に有効なデータを適切なコ
ンピュータの演算時間で集計できるようになる。
【0022】また、請求項6に記載の配列情報処理装置
は、請求項1から5のいずれか一つに記載の配列情報処
理装置において、上記部分配列情報は、上記ターゲット
配列の先頭からの位置、および/または、部分配列のう
ち少なくとも一つに関する情報を含むことを特徴とす
る。
【0023】これは部分配列情報の一例を一層具体的に
示すものである。この装置によれば部分配列情報は、タ
ーゲット配列の先頭からの位置、および/または、部分
配列のうち少なくとも一つに関する情報を含むので、部
分配列とその位置を任意に表示できるようになる。
【0024】また、請求項7に記載の配列情報処理装置
は、請求項1から6のいずれか一つに記載の配列情報処
理装置において、上記分析結果情報は、上記部分配列毎
に、抽出した件数、検索に用いた上記ミュータント配列
情報、抽出した配列の名称、抽出した配列の由来する生
物名、抽出した配列に対応する蛋白質の名称、抽出した
配列の蛋白質の機能、外部プログラムの実行結果、およ
び/または、抽出した配列の関連データベースのアドレ
スのうち少なくとも一つに関する情報を含むことを特徴
とする。
【0025】これは分析結果情報の一例を一層具体的に
示すものである。この装置によれば分析結果情報は、部
分配列毎に、抽出した件数、検索に用いた上記ミュータ
ント配列情報、抽出した配列の名称、抽出した配列の由
来する生物名、抽出した配列に対応する蛋白質の名称、
抽出した配列の蛋白質の機能、外部プログラムの実行結
果、および/または、抽出した配列の関連データベース
のアドレスのうち少なくとも一つに関する情報を含むの
で、これらの各項目を任意に表示できるようになる。
【0026】また、請求項8に記載の配列情報処理装置
は、請求項1から7のいずれか一つに記載の配列情報処
理装置において、上記パラメータは、上記分析結果情報
に含まれる各情報の出力可否、抽出した件数のうち出力
する際の上限数、上記分析結果情報の各情報の図形表示
可否、上記テーブルのヘッダのフォーマット、および/
または、上記テーブルの表示用データの記述言語のうち
少なくとも一つに関する情報を含むことを特徴とする。
【0027】これは分析結果情報の一例を一層具体的に
示すものである。この装置によればパラメータは、分析
結果情報に含まれる各情報の出力可否、抽出した件数の
うち出力する際の上限数、分析結果情報の各情報の図形
表示可否、テーブルのヘッダのフォーマット、および/
または、テーブルの表示用データの記述言語のうち少な
くとも一つに関する情報を含むので、これらの各項目を
任意に表示できるようになる。
【0028】また、本発明は配列情報処理方法に関する
ものであり、請求項9に記載の配列情報処理方法は、塩
基またはアミノ酸の配列情報と当該配列情報に関連する
配列関連情報とを対応付けて格納する配列情報格納ステ
ップと、上記配列情報格納ステップにより格納された上
記配列情報のうち利用者にターゲット配列を選択させる
ターゲット配列選択ステップと、上記配列情報格納ステ
ップにより格納された上記配列情報のうち検索の対象と
なる母集団の配列情報を上記利用者に選択させる母集団
選択ステップと、上記ターゲット配列選択ステップによ
り選択された上記ターゲット配列を上記利用者が指定し
た長さの部分配列に分割する配列分割ステップと、上記
配列分割ステップにて分割された上記部分配列を上記母
集団から検索する検索ステップと、上記検索ステップの
検索結果情報から上記ターゲット配列に関する分析結果
情報を作成する分析結果情報作成ステップと、上記利用
者の設定したパラメータに従って、上記部分配列に関す
る部分配列情報と上記分析結果情報とをテーブル形式で
出力するテーブル出力ステップとを含むことを特徴とす
る。
【0029】この方法によれば、塩基またはアミノ酸の
配列情報と当該配列情報に関連する配列関連情報とを対
応付けて格納し、格納された配列情報のうち利用者にタ
ーゲット配列を選択させ、格納された配列情報のうち検
索の対象となる母集団の配列情報を利用者に選択させ、
選択されたターゲット配列を利用者が指定した長さの部
分配列に分割し、分割された部分配列を母集団から検索
し、検索結果情報からターゲット配列に関する分析結果
情報を作成し、利用者の設定したパラメータに従って、
部分配列に関する部分配列情報と分析結果情報とをテー
ブル形式で出力するので、処理結果として表示される配
列情報とその分析情報の取捨選択を、利用者が容易に設
定し、その設定を保存し、また後からその設定を再利用
することができる。
【0030】また、請求項10に記載の配列情報処理方
法は、請求項9に記載の配列情報処理方法において、上
記配列情報と、当該配列情報が変異する可能性があるミ
ュータント配列に関するミュータント配列情報とを対応
付けて格納するミュータント配列情報格納ステップと、
上記配列分割ステップにて分割された上記部分配列に対
するミュータント配列情報を、上記ミュータント配列情
報格納ステップにて格納された上記ミュータント配列情
報から検索するミュータント配列検索ステップとをさら
に含み、上記検索ステップは、上記ミュータント配列検
索ステップにて検索された上記部分配列に対する上記ミ
ュータント配列情報を上記母集団から検索することを特
徴とする。
【0031】この方法によれば、配列情報と、当該配列
情報が変異する可能性があるミュータント配列に関する
ミュータント配列情報とを対応付けて格納し、分割され
た部分配列に対するミュータント配列情報を、格納され
たミュータント配列情報から検索し、検索された部分配
列に対するミュータント配列情報を母集団から検索する
ので、検索対象の部分配列のミュータントにまで検索範
囲を拡張することができ、より有益な生物学情報の解析
に利用することができるようになる。
【0032】また、請求項11に記載の配列情報処理方
法は、請求項9または10に記載の配列情報処理方法に
おいて、上記配列関連情報は、当該配列の名称、由来す
る生物名、対応する蛋白質の名称、蛋白質の機能、およ
び/または、関連データベースのアドレスのうち少なく
とも一つに関する情報を含むことを特徴とする。
【0033】これは配列関連情報の一例を一層具体的に
示すものである。この方法によれば、配列関連情報は、
当該配列の名称、由来する生物名、対応する蛋白質の名
称、蛋白質の機能、および/または、関連データベース
のアドレスのうち少なくとも一つに関する情報を含むの
で、これらの項目をターゲット配列に関する分析情報と
して利用することができるようになる。
【0034】また、請求項12に記載の配列情報処理方
法は、請求項9から11のいずれか一つに記載の配列情
報処理方法において、上記母集団は、特定の性質を備え
る蛋白質に関する配列情報を収集して作成することを特
徴とする。
【0035】これは検索対象の母集団の一例を一層具体
的に示すものである。この方法によれば、母集団は、特
定の性質を備える蛋白質に関する配列情報を収集して作
成するので、分析情報として抽出する必要のある蛋白質
を限定することができ、検索時間を短縮化できるように
なる。また、母集団に対して別のターゲット配列で分析
することができるようになる。
【0036】また、請求項13に記載の配列情報処理方
法は、請求項9から12のいずれか一つに記載の配列情
報処理方法において、上記部分配列の長さは4〜7であ
ることを特徴とする。
【0037】これは部分配列の長さの一例を一層具体的
に示すものである。この方法によれば部分配列の長さは
4〜7であるので、生物学的に有効なデータを適切なコ
ンピュータの演算時間で集計できるようになる。
【0038】また、請求項14に記載の配列情報処理方
法は、請求項9から13のいずれか一つに記載の配列情
報処理方法において、上記部分配列情報は、上記ターゲ
ット配列の先頭からの位置、および/または、部分配列
のうち少なくとも一つに関する情報を含むことを特徴と
する。
【0039】これは部分配列情報の一例を一層具体的に
示すものである。この方法によれば部分配列情報は、タ
ーゲット配列の先頭からの位置、および/または、部分
配列のうち少なくとも一つに関する情報を含むので、部
分配列とその位置を任意に表示できるようになる。
【0040】また、請求項15に記載の配列情報処理方
法は、請求項9から14のいずれか一つに記載の配列情
報処理方法において、上記分析結果情報は、上記部分配
列毎に、抽出した件数、検索に用いた上記ミュータント
配列情報、抽出した配列の名称、抽出した配列の由来す
る生物名、抽出した配列に対応する蛋白質の名称、抽出
した配列の蛋白質の機能、外部プログラムの実行結果、
および/または、抽出した配列の関連データベースのア
ドレスのうち少なくとも一つに関する情報を含むことを
特徴とする。
【0041】これは分析結果情報の一例を一層具体的に
示すものである。この方法によれば分析結果情報は、部
分配列毎に、抽出した件数、検索に用いた上記ミュータ
ント配列情報、抽出した配列の名称、抽出した配列の由
来する生物名、抽出した配列に対応する蛋白質の名称、
抽出した配列の蛋白質の機能、外部プログラムの実行結
果、および/または、抽出した配列の関連データベース
のアドレスのうち少なくとも一つに関する情報を含むの
で、これらの各項目を任意に表示できるようになる。
【0042】また、請求項16に記載の配列情報処理方
法は、請求項9から15のいずれか一つに記載の配列情
報処理方法において、上記パラメータは、上記分析結果
情報に含まれる各情報の出力可否、抽出した件数のうち
出力する際の上限数、上記分析結果情報の各情報の図形
表示可否、上記テーブルのヘッダのフォーマット、およ
び/または、上記テーブルの表示用データの記述言語の
うち少なくとも一つに関する情報を含むことを特徴とす
る。
【0043】これは分析結果情報の一例を一層具体的に
示すものである。この方法によればパラメータは、分析
結果情報に含まれる各情報の出力可否、抽出した件数の
うち出力する際の上限数、分析結果情報の各情報の図形
表示可否、テーブルのヘッダのフォーマット、および/
または、テーブルの表示用データの記述言語のうち少な
くとも一つに関する情報を含むので、これらの各項目を
任意に表示できるようになる。
【0044】また、本発明はプログラムに関するもので
あり、請求項17に記載のプログラムは、塩基またはア
ミノ酸の配列情報と当該配列情報に関連する配列関連情
報とを対応付けて格納する配列情報格納ステップと、上
記配列情報格納ステップにより格納された上記配列情報
のうち利用者にターゲット配列を選択させるターゲット
配列選択ステップと、上記配列情報格納ステップにより
格納された上記配列情報のうち検索の対象となる母集団
の配列情報を上記利用者に選択させる母集団選択ステッ
プと、上記ターゲット配列選択ステップにより選択され
た上記ターゲット配列を上記利用者が指定した長さの部
分配列に分割する配列分割ステップと、上記配列分割ス
テップにて分割された上記部分配列を上記母集団から検
索する検索ステップと、上記検索ステップの検索結果情
報から上記ターゲット配列に関する分析結果情報を作成
する分析結果情報作成ステップと、上記利用者の設定し
たパラメータに従って、上記部分配列に関する部分配列
情報と上記分析結果情報とをテーブル形式で出力するテ
ーブル出力ステップとを含む配列情報処理方法をコンピ
ュータに実行させることを特徴とする。
【0045】このプログラムによれば、塩基またはアミ
ノ酸の配列情報と当該配列情報に関連する配列関連情報
とを対応付けて格納し、格納された配列情報のうち利用
者にターゲット配列を選択させ、格納された配列情報の
うち検索の対象となる母集団の配列情報を利用者に選択
させ、選択されたターゲット配列を利用者が指定した長
さの部分配列に分割し、分割された部分配列を母集団か
ら検索し、検索結果情報からターゲット配列に関する分
析結果情報を作成し、利用者の設定したパラメータに従
って、部分配列に関する部分配列情報と分析結果情報と
をテーブル形式で出力するので、処理結果として表示さ
れる配列情報とその分析情報の取捨選択を、利用者が容
易に設定し、その設定を保存し、また後からその設定を
再利用することができる。
【0046】また、請求項18に記載のプログラムは、
請求項17に記載のプログラムにおいて、上記配列情報
と、当該配列情報が変異する可能性があるミュータント
配列に関するミュータント配列情報とを対応付けて格納
するミュータント配列情報格納ステップと、上記配列分
割ステップにて分割された上記部分配列に対するミュー
タント配列情報を、上記ミュータント配列情報格納ステ
ップにて格納された上記ミュータント配列情報から検索
するミュータント配列検索ステップとをさらに含み、上
記検索ステップは、上記ミュータント配列検索ステップ
にて検索された上記部分配列に対する上記ミュータント
配列情報を上記母集団から検索することを特徴とする。
【0047】このプログラムによれば、配列情報と、当
該配列情報が変異する可能性があるミュータント配列に
関するミュータント配列情報とを対応付けて格納し、分
割された部分配列に対するミュータント配列情報を、格
納されたミュータント配列情報から検索し、検索された
部分配列に対するミュータント配列情報を母集団から検
索するので、検索対象の部分配列のミュータントにまで
検索範囲を拡張することができ、より有益な生物学情報
の解析に利用することができるようになる。
【0048】また、請求項19に記載のプログラムは、
請求項17または18に記載のプログラムにおいて、上
記配列関連情報は、当該配列の名称、由来する生物名、
対応する蛋白質の名称、蛋白質の機能、および/また
は、関連データベースのアドレスのうち少なくとも一つ
に関する情報を含むことを特徴とする。
【0049】これは配列関連情報の一例を一層具体的に
示すものである。このプログラムによれば、配列関連情
報は、当該配列の名称、由来する生物名、対応する蛋白
質の名称、蛋白質の機能、および/または、関連データ
ベースのアドレスのうち少なくとも一つに関する情報を
含むので、これらの項目をターゲット配列に関する分析
情報として利用することができるようになる。
【0050】また、請求項20に記載のプログラムは、
請求項17から19のいずれか一つに記載のプログラム
において、上記母集団は、特定の性質を備える蛋白質に
関する配列情報を収集して作成することを特徴とする。
【0051】これは検索対象の母集団の一例を一層具体
的に示すものである。このプログラムによれば、母集団
は、特定の性質を備える蛋白質に関する配列情報を収集
して作成するので、分析情報として抽出する必要のある
蛋白質を限定することができ、検索時間を短縮化できる
ようになる。また、母集団に対して別のターゲット配列
で分析することができるようになる。
【0052】また、請求項21に記載のプログラムは、
請求項17から20のいずれか一つに記載のプログラム
において、上記部分配列の長さは4〜7であることを特
徴とする。
【0053】これは部分配列の長さの一例を一層具体的
に示すものである。このプログラムによれば部分配列の
長さは4〜7であるので、生物学的に有効なデータを適
切なコンピュータの演算時間で集計できるようになる。
【0054】また、請求項22に記載のプログラムは、
請求項17から21のいずれか一つに記載のプログラム
において、上記部分配列情報は、上記ターゲット配列の
先頭からの位置、および/または、部分配列のうち少な
くとも一つに関する情報を含むことを特徴とする。
【0055】これは部分配列情報の一例を一層具体的に
示すものである。このプログラムによれば部分配列情報
は、ターゲット配列の先頭からの位置、および/また
は、部分配列のうち少なくとも一つに関する情報を含む
ので、部分配列とその位置を任意に表示できるようにな
る。
【0056】また、請求項23に記載のプログラムは、
請求項17から22のいずれか一つに記載のプログラム
において、上記分析結果情報は、上記部分配列毎に、抽
出した件数、検索に用いた上記ミュータント配列情報、
抽出した配列の名称、抽出した配列の由来する生物名、
抽出した配列に対応する蛋白質の名称、抽出した配列の
蛋白質の機能、外部プログラムの実行結果、および/ま
たは、抽出した配列の関連データベースのアドレスのう
ち少なくとも一つに関する情報を含むことを特徴とす
る。
【0057】これは分析結果情報の一例を一層具体的に
示すものである。このプログラムによれば分析結果情報
は、部分配列毎に、抽出した件数、検索に用いた上記ミ
ュータント配列情報、抽出した配列の名称、抽出した配
列の由来する生物名、抽出した配列に対応する蛋白質の
名称、抽出した配列の蛋白質の機能、外部プログラムの
実行結果、および/または、抽出した配列の関連データ
ベースのアドレスのうち少なくとも一つに関する情報を
含むので、これらの各項目を任意に表示できるようにな
る。
【0058】また、請求項24に記載のプログラムは、
請求項17から23のいずれか一つに記載のプログラム
において、上記パラメータは、上記分析結果情報に含ま
れる各情報の出力可否、抽出した件数のうち出力する際
の上限数、上記分析結果情報の各情報の図形表示可否、
上記テーブルのヘッダのフォーマット、および/また
は、上記テーブルの表示用データの記述言語のうち少な
くとも一つに関する情報を含むことを特徴とする。
【0059】これは分析結果情報の一例を一層具体的に
示すものである。このプログラムによればパラメータ
は、分析結果情報に含まれる各情報の出力可否、抽出し
た件数のうち出力する際の上限数、分析結果情報の各情
報の図形表示可否、テーブルのヘッダのフォーマット、
および/または、テーブルの表示用データの記述言語の
うち少なくとも一つに関する情報を含むので、これらの
各項目を任意に表示できるようになる。
【0060】また、本発明は記録媒体に関するものであ
り、請求項25に記載の記録媒体は、上記請求項17か
ら24のいずれか一つに記載されたプログラムを記録し
たことを特徴とする。
【0061】この記録媒体によれば、当該記録媒体に記
録されたプログラムをコンピュータに読み取らせて実行
することによって、請求項17から24のいずれか一つ
に記載されたプログラムをコンピュータを利用して実現
することができ、これら各プログラムと同様の効果を得
ることができる。
【0062】
【発明の実施の形態】以下に、本発明にかかる配列情報
処理装置、配列情報処理方法、プログラム、および、記
録媒体の実施の形態を図面に基づいて詳細に説明する。
なお、この実施の形態によりこの発明が限定されるもの
ではない。特に、以下の実施の形態においては、本発明
を、オリゴペプチドに関する配列情報を表示するシステ
ムに適用した例について説明するが、この場合に限られ
ず、あらゆる配列情報の部分配列を表示する全てのシス
テムにおいて、同様に適用することができる。
【0063】[本システムの概要]以下、本システムの
原理構成について説明し、その後、本システムの構成お
よび処理等について詳細に説明する。図1は本システム
の基本原理の一例を示す原理構成図であり、該システム
構成のうち本発明に関係する部分のみを概念的に示して
いる。
【0064】本システムは、ターゲットとなる蛋白質の
アミノ酸配列に関するオリゴペプチドベースの分析結果
を、利用者が所望のテーブル形式にまとめて出力するた
めのシステムである。まず利用者は、ターゲットとなる
蛋白質のアミノ酸配列を配列情報データベースから指定
する。指定方法は画面上に指定可能な情報を出力して、
利用者がその中から所望のアミノ酸配列を選択するよう
にしてもよく、また、利用者がスクリプト言語などで直
接的に所望のアミノ酸配列を特定して当該スクリプトな
どを実行することにより指定してもよい。以下において
も同様に利用者の指定方法について既存のいかなる指定
方法を用いてもよい。
【0065】ここで、配列情報データベースは、例え
ば、SWISS−PROT、TrEMBL、PIR、G
enPept、PRF/SEQDBなどのインターネッ
トを経由してアクセスする外部のアミノ酸配列データベ
ースであってもよく、また、これらのデータベースをコ
ピーしたり、オリジナルの配列情報を格納したり、さら
に独自のアノテーション情報等を付加したりして作成し
たインハウスデータベースであってもよい。
【0066】そして、利用者は、予め作成した蛋白質集
合(PS;Protein Set)データベースから
検索の対象となる母集団を抽出するための条件を指定す
る。ここで、PSDBは、特定の性質を備える蛋白質に
関する配列情報を収集して作成されたデータベースであ
り、例えば、ヒトの蛋白質に関する配列情報をまとめた
PSDB等である。また、PSDBは、例えば、外部デ
ータベースやインハウスデータベースから所定のキーワ
ード(例えば、「ヒト」または「human」など)に
合致する配列情報を、自然言語検索などを行うことによ
り抽出して作成してもよい。
【0067】また、利用者は、検索範囲をミュータント
まで検索するか否かを指定する。ミュータントとは、所
定のオリゴペプチド配列が変異する可能性のあるもので
あり、ミューテーションテーブルに予め各オリゴペプチ
ド配列とそのミュータント配列との対応が格納されてい
る。
【0068】このようにして、利用者がスライドサーチ
のための条件等の指定が完了すると(ステップSA−
1)、本発明の配列情報処理装置においてスライドサー
チが実行される(ステップSA−2)。スライドサーチ
とは、ターゲット配列の先頭から利用者が指定した長さ
の部分配列に分割し、この部分配列を母集団の配列情報
から検索していくことにより、ターゲット配列について
各種の分析を行うことをいう。スライドサーチの基本的
な手法については後述する。
【0069】つぎに、スライドサーチの分析結果を、利
用者が予め指定したパラメータ等により定められた出力
形式に従って関連情報等と一緒にテーブル形式にまとめ
る(ステップSA−3)。
【0070】そして、作成したテーブルをディスプレイ
装置などの出力装置に出力する(ステップSA−4)。
これにより、利用者が必要な部分配列情報に関連する情
報をテーブル形式で見易く表示等することが可能にな
る。
【0071】[システム構成]以下、このような基本的
特徴を具現化するための、本システムの構成について説
明する。
【0072】[システム構成]まず、本システムの構成
について説明する。図2は、本発明が適用される本シス
テムの構成の一例を示すブロック図であり、該構成のう
ち本発明に関係する部分のみを概念的に示している。本
システムは、概略的に、配列情報を処理する配列情報処
理装置である配列情報処理装置100と、配列情報等に
関するデータベースやホモロジー検索用のプログラム等
を提供する外部システム200とを、ネットワーク30
0を介して通信可能に接続して構成されている。
【0073】図2においてネットワーク300は、配列
情報処理装置100と外部システム200とを相互に接
続する機能を有し、例えば、インターネット等である。
【0074】図2において外部システム200は、ネッ
トワーク300を介して、配列情報処理装置100と相
互に接続され、利用者に対して配列情報等に関する外部
データベースやホモロジー検索やモチーフ検索等の外部
分析プログラムを実行するウェブサイトを提供する機能
を有する。
【0075】ここで、外部システム200は、WEBサ
ーバやASPサーバ等として構成してもよく、そのハー
ドウェア構成は、一般に市販されるワークステーショ
ン、パーソナルコンピュータ等の情報処理装置およびそ
の付属装置により構成してもよい。また、外部システム
200の各機能は、外部システム200のハードウェア
構成中のCPU、ディスク装置、メモリ装置、入力装
置、出力装置、通信制御装置等およびそれらを制御する
プログラム等により実現される。
【0076】図2において配列情報処理装置100は、
概略的に、配列情報処理装置100の全体を統括的に制
御するCPU等の制御部102、通信回線等に接続され
るルータ等の通信装置(図示せず)に接続される通信制
御インターフェース部104、入力装置112および出
力装置114に接続される入出力制御インターフェース
部108、および、各種のデータベースやテーブル(蛋
白質集合(PS)データベース106a〜テーブル10
6d)を格納する記憶部106を備えて構成されてお
り、これら各部は任意の通信路を介して通信可能に接続
されている。さらに、この配列情報処理装置100は、
ルータ等の通信装置および専用線等の有線または無線の
通信回線を介して、ネットワーク300に通信可能に接
続されている。
【0077】記憶部106に格納される各種のデータベ
ース(蛋白質集合(PS)データベース106a〜テー
ブル106d)は、固定ディスク装置等のストレージ手
段であり、各種処理に用いる各種のプログラムやテーブ
ルやファイルやデータベースやウェブページ用ファイル
等を格納する。
【0078】これら記憶部106の各構成要素のうち、
蛋白質集合(PS)データベース106aは、特定の性
質を備える蛋白質に関する配列情報を収集して作成され
たデータベースである。また、インハウスデータベース
106bは、塩基またはアミノ酸の配列情報と当該配列
情報に関連する配列関連情報とを対応付けて格納する配
列情報格納手段である。ここで、配列関連情報は、当該
配列の名称、由来する生物名、対応する蛋白質の名称、
蛋白質の機能、および/または、関連データベースのア
ドレスのうち少なくとも一つに関する情報を含む。
【0079】また、ミューテーションテーブル106c
は、配列情報と、当該配列情報が変異する可能性がある
ミュータント配列に関するミュータント配列情報とを対
応付けて格納するミュータント配列情報格納手段であ
る。また、テーブル106dは、利用者の指定した出力
形式に従って、部分配列に関する部分配列情報とスライ
ドサーチによる分析結果とを用いて作成した情報であ
る。
【0080】また、図2において、通信制御インターフ
ェース部104は、配列情報処理装置100とネットワ
ーク300(またはルータ等の通信装置)との間におけ
る通信制御を行う。すなわち、通信制御インターフェー
ス部104は、他の端末と通信回線を介してデータを通
信する機能を有する。
【0081】また、図2において、入出力制御インター
フェース部108は、入力装置112や出力装置114
の制御を行う。ここで、出力装置114としては、モニ
タ(家庭用テレビを含む)の他、スピーカを用いること
ができる(なお、以下においては出力装置をモニタとし
て記載する)。また、入力装置112としては、キーボ
ード、マウス、および、マイク等を用いることができ
る。また、モニタも、マウスと協働してポインティング
デバイス機能を実現する。
【0082】また、図2において、制御部102は、O
S(Operating System)等の制御プロ
グラム、各種の処理手順等を規定したプログラム、およ
び所要データを格納するための内部メモリを有し、これ
らのプログラム等により、種々の処理を実行するための
情報処理を行う。制御部102は、機能概念的に、スラ
イドサーチ実行部102a、および、テーブル作成部1
02bを備えて構成されている。
【0083】このうち、スライドサーチ実行部102a
は、ターゲット配列の先頭から利用者が指定した長さの
部分配列に分割し、この部分配列を母集団の配列情報か
ら検索していくことにより、ターゲット配列について各
種の分析を行う手段である。また、テーブル作成部10
2bは、スライドサーチの分析結果を、利用者が予め指
定したパラメータ等により定められた出力形式に従って
関連情報等と一緒にテーブル形式にまとめる手段であ
る。なお、これら各部によって行なわれる処理の詳細に
ついては、後述する。
【0084】ここで、図3は、スライドサーチ実行部1
02aの構成の一例を示すブロック図であり、該構成の
うち本発明に関係する部分のみを概念的に示している。
スライドサーチ実行部102aは、概略的に、サーチ条
件設定部102c、シンプルスライドサーチ(SSS)
実行部102d、および、ミューテーションスライドサ
ーチ(MSS)実行部102eを備えて構成されてい
る。
【0085】このうち、サーチ条件設定部102cは、
利用者にスライドサーチの各種の条件を設定させる手段
であって、インハウスデータベース106bに格納され
た配列情報のうち利用者にターゲット配列を選択させる
ターゲット配列選択手段、蛋白質集合(PS)データベ
ース106aに格納された配列情報のうち検索の対象と
なる母集団の配列情報を利用者に選択させる母集団選択
手段、部分配列の長さを利用者に指定させる手段、およ
び、後述するシンプルスライドサーチを行うか、または
ミューテーションスライドサーチを行うかを利用者に選
択させる手段などとして機能する。
【0086】また、シンプルスライドサーチ(SSS)
実行部102dは、後述するシンプルスライドサーチを
実行する手段である。また、ミューテーションスライド
サーチ(MSS)実行部102eは、後述する対象範囲
を部分配列のミュータントまで拡大して検索するミュー
テーションスライドサーチを実行する手段である。
【0087】ここで、図4は、シンプルスライドサーチ
(SSS)実行部102dの構成の一例を示すブロック
図であり、該構成のうち本発明に関係する部分のみを概
念的に示している。シンプルスライドサーチ(SSS)
実行部102dは、概略的に、オリゴペプチド配列作成
部102k、蛋白質集合データベース(PSDB)検索
部102m、および、分析結果作成部102nを備えて
構成されている。
【0088】このうち、オリゴペプチド配列作成部10
2kは、ターゲット配列を利用者が指定した長さの部分
配列に分割する配列分割手段である。また、蛋白質集合
データベース(PSDB)検索部102mは、オリゴペ
プチド配列作成部102kにより分割された部分配列を
蛋白質集合(PS)データベース106aから抽出した
母集団から検索する検索手段である。また、分析結果作
成部102nは、オリゴペプチド配列作成部102kに
よる検索結果に基づいてターゲット配列に関する分析結
果を作成する分析結果情報作成手段である。
【0089】ここで、図5は、ミューテーションスライ
ドサーチ(MSS)実行部102eの構成の一例を示す
ブロック図であり、該構成のうち本発明に関係する部分
のみを概念的に示している。ミューテーションスライド
サーチ(MSS)実行部102eは、概略的に、オリゴ
ペプチド配列作成部102p、ミューテーションテーブ
ル検索部102q、蛋白質集合データベース(PSD
B)検索部102r、および、分析結果作成部102s
を備えて構成されている。
【0090】このうち、オリゴペプチド配列作成部10
2pは、ターゲット配列を利用者が指定した長さの部分
配列に分割する配列分割手段である。また、ミューテー
ションテーブル検索部102qは、部分配列のミュータ
ントをミューテーションテーブル106cから取得する
手段である。また、蛋白質集合データベース(PSD
B)検索部102rは、オリゴペプチド配列作成部10
2pにより分割された部分配列を蛋白質集合(PS)デ
ータベース106aから抽出した母集団から検索する検
索手段である。また、分析結果作成部102sは、蛋白
質集合データベース(PSDB)検索部102rによる
検索結果に基づいてターゲット配列に関する分析結果を
作成する分析結果情報作成手段である。
【0091】ここで、図6は、テーブル作成部102b
の構成の一例を示すブロック図であり、該構成のうち本
発明に関係する部分のみを概念的に示している。テーブ
ル作成部102bは、概略的に、パラメータ設定部10
2f、列データ作成部102g、外部分析プログラム実
行部102h、テーブル整形部102i、および、出力
形式変換部102jを備えて構成されている。
【0092】このうち、パラメータ設定部102fは、
出力するテーブルの各種パラメータを利用者に設定させ
るパラメータ設定手段である。また、列データ作成部1
02gは、利用者が設定したパラメータに従って部分配
列に関する部分配列情報とスライドサーチの分析結果情
報とからテーブルの列データを作成する列データ作成手
段である。また、外部分析プログラム実行部102h
は、分析結果情報に基づいて外部プログラム(例えば、
ホモロジー検索やモチーフ検索など)を実行してその実
行結果を分析結果情報に追加する外部分析プログラム実
行手段である。
【0093】また、テーブル整形部102iは、利用者
の指定したパラメータに従って、部分配列情報と分析結
果情報とをテーブル形式に整形するテーブル整形手段で
ある。また、出力形式変換部102jは、テーブル整形
部102iにより整形されたテーブルのデータを利用者
が指定した表示用データの記述言語(例えば、SGM
L、HTML、XML、オリジナル記述言語等)に変換
する出力形式変換手段である。
【0094】[本システムの処理]次に、このように構
成された本実施の形態における本システムの処理の一例
について、以下に図7〜図13を参照して詳細に説明す
る。
【0095】[スライドサーチ処理]次に、スライドサ
ーチ処理の詳細について図7〜図9に示すフローチャー
トおよび図13〜図18に示す表示画面図等を参照して
説明する。図7は、本実施形態における本システムのス
ライドサーチ処理の一例を示すフローチャートである。
【0096】まず、配列情報処理装置100は、サーチ
条件設定部102cの処理により、利用者にスライドサ
ーチの各種の条件や、スライドサーチの分析結果などを
表示するテーブルの表示条件などを設定させる(ステッ
プSB−1)。
【0097】ここで、図13は、サーチ条件設定部10
2cの処理により出力装置114に出力されるテーブル
・パラメータ設定画面の一例を示す図である。図13に
示すように、テーブル・パラメータ設定画面は、テーブ
ル名の入力領域MA−1、ターゲット蛋白質のデータベ
ース名や蛋白質名の入力領域MA−2、オリゴペプチド
長の入力領域MA−3、ヘッダ行数の入力領域MA−
4、テーブルの列数の入力領域MA−5等を含んで構成
される。
【0098】利用者がテーブル・パラメータ設定画面を
用いて、入力装置112を用いてMA−1からMA−5
の各項目の入力を完了すると、サーチ条件設定部102
cは当該入力情報を記憶部106に格納する。
【0099】なお、オリゴペプチド長の入力領域MA−
2に入力される部分配列の長さは、好ましくは2〜10
であり、さらに好適な長さは4〜7であり、その中で特
に好適な長さは4または5である。
【0100】また、ヘッダ行数の入力領域MA−4に利
用者がヘッダ行数を入力すると、サーチ条件設定部10
2cは、図13に示すように入力されたヘッダ行数分の
ヘッダ・パラメータ設定画面リンクボタン(図中の「ヘ
ッダ行1」、「ヘッダ行2」が対応する)を表示する。
利用者が、当該ヘッダ・パラメータ設定画面リンクボタ
ンを入力装置112を用いて選択すると、サーチ条件設
定部102cは、図17に示すヘッダ・パラメータ設定
画面を出力装置114に表示する。
【0101】ここで、図17は、サーチ条件設定部10
2cの処理により出力装置114に出力されるヘッダ・
パラメータ設定画面の一例を示す図である。図17に示
すように、ヘッダ・パラメータ設定画面は、ヘッダ行の
行数および総列数の表示領域ME−1、および、開始列
数と終了列数と表示項目とから構成されるヘッダフォー
マット情報の入力領域ME−2等を含んで構成される。
ヘッダフォーマット情報入力領域ME−2に利用者が終
了列数を設定すると、サーチ条件設定部102cは次の
列の開始列数を自動的に表示する。
【0102】利用者がヘッダ・パラメータ設定画面を用
いて、入力装置112を用いてヘッダフォーマット情報
入力領域ME−2の各項目の入力を完了すると、サーチ
条件設定部102cは当該入力情報を記憶部106に格
納する。
【0103】再び図13に戻り、列数の入力領域MA−
5に利用者がテーブルの列数を入力すると、サーチ条件
設定部102cは、図13に示すように列数分の列パラ
メータ設定画面リンクボタン(図中の「列1」から「列
14」が対応する)を表示する。利用者が、当該列パラ
メータ設定画面リンクボタンを入力装置112を用いて
選択すると、サーチ条件設定部102cは、図14に示
す列パラメータ設定画面(1)を出力装置114に表示
する。
【0104】ここで、図14は、サーチ条件設定部10
2cの処理により出力装置114に出力される列パラメ
ータ設定画面(1)の一例を示す図である。図14に示
すように、列パラメータ設定画面(1)は、オリゴペプ
チドをテーブルの列に表示することを選択するための選
択ボタンMB−1、外部分析プログラムの実行結果をテ
ーブルの列に表示することを選択するための選択ボタン
MB−2、外部分析プログラムのアドレスなどを入力す
るためのHTMLリンク情報入力領域MB−3、スライ
ドサーチの分析結果情報をテーブルの列に表示すること
を選択するための選択ボタンMB−4等を含んで構成さ
れる。
【0105】MB−4において利用者がスライドサーチ
結果を選択すると、サーチ条件設定部102cは、図1
4に示すように、スライドサーチの種別(SSS、MS
S)を選択するための選択ボタンMB−5、検索対象母
集団名の入力領域MB−6、表示情報の選択領域MB−
7(例えば、蛋白質の抽出件数(数字形式で表示する
か、または、図形形式(グラフなど)で表示するかをさ
らに選択する)、蛋白質名、オリゴペプチドの抽出件数
(数字形式で表示するか、または、図形形式(グラフな
ど)で表示するかをさらに選択する)、オリゴペプチド
がある蛋白質名とその位置など)、テーブルに情報を表
示する際の制約を設定する制約パラメータ設定画面に移
行するための制約パラメータ設定画面リンクボタンMB
−8などを自動的に表示する。
【0106】また、スライドサーチの種別(SSS、M
SS)を選択するための選択ボタンMB−5において、
利用者がミューテーション(MSS)を選択した場合に
は、サーチ条件設定部102cは、図15に示す列パラ
メータ設定画面(2)を表示する。
【0107】ここで、図15は、サーチ条件設定部10
2cの処理により出力装置114に出力される列パラメ
ータ設定画面(2)の一例を示す図である。図15に示
すように、列パラメータ設定画面(2)は、オリゴペプ
チドをテーブルの列に表示することを選択するための選
択ボタンMC−1、外部分析プログラムの実行結果をテ
ーブルの列に表示することを選択するための選択ボタン
MC−2、外部分析プログラムのアドレスなどを入力す
るためのHTMLリンク情報入力領域MC−3、スライ
ドサーチの分析結果情報をテーブルの列に表示すること
を選択するための選択ボタンMC−4等を含んで構成さ
れる。
【0108】MC−4において利用者がスライドサーチ
結果を選択すると、サーチ条件設定部102cは、図1
5に示すように、スライドサーチの種別(SSS、MS
S)を選択するための選択ボタンMC−5、検索対象母
集団名の入力領域MC−6、表示情報の選択領域MC−
7(例えば、蛋白質の抽出件数(数字形式で表示するか
または図形形式(グラフなど)で表示するか、オリゴペ
プチド単位で集計するかまたはミュータント単位で集計
するかなどをさらに選択する)、ミュータント名、蛋白
質名、オリゴペプチドの抽出件数(数字形式で表示する
かまたは図形形式(グラフなど)で表示するか、オリゴ
ペプチド単位で集計するかまたはミュータント単位で集
計するかなどをさらに選択する)、オリゴペプチドのミ
ュータント配列、オリゴペプチドがある蛋白質名とその
蛋白質のアミノ酸配列の先頭からの位置など)、テーブ
ルに情報を表示する際の制約を設定する制約パラメータ
設定画面に移行するための制約パラメータ設定画面リン
クボタンMC−8などを自動的に表示する。
【0109】利用者が列パラメータ設定画面(1)また
は列パラメータ設定画面(2)を用いて、入力装置11
2を用いて各項目の入力や選択を完了すると、サーチ条
件設定部102cは当該入力情報を記憶部106に格納
する。
【0110】また、利用者が列パラメータ設定画面
(1)または列パラメータ設定画面(2)を用いて、入
力装置112を用いて制約パラメータ設定画面リンクボ
タンMB−8またはMC−8を選択すると、サーチ条件
設定部102cは、図16に示す制約パラメータ設定画
面を表示する。
【0111】ここで、図16は、サーチ条件設定部10
2cの処理により出力装置114に出力される制約パラ
メータ設定画面の一例を示す図である。図16に示すよ
うに、制約パラメータ設定画面は、検索結果の件数の上
限数やミュータントの個数の上限数を入力するための入
力領域MD−1、ターゲット蛋白質内で無視するオリゴ
ペプチドと開始位置の入力領域MD−2、検索結果内で
無視するミュータントや蛋白質や蛋白質と開始位置の入
力領域MD−3、外部分析プログラムの入力領域MD−
4等を含んで構成される。
【0112】利用者が制約パラメータ設定画面を用い
て、入力装置112を用いてMD−1からMD−4の各
項目の入力を完了すると、サーチ条件設定部102cは
当該入力情報を記憶部106に格納する。
【0113】ついで、スライドサーチ実行部102a
は、インハウスデータベース106bにアクセスして利
用者が指定したターゲット配列を取得する(ステップS
B−2)。
【0114】ついで、スライドサーチ実行部102a
は、蛋白質集合(PS)データベース106aにアクセ
スして利用者が指定した母集団の条件に合致する配列情
報を抽出して母集団を作成する(ステップSB−3)。
【0115】ついで、スライドサーチ実行部102a
は、利用者が指定したサーチ種別を判定し(ステップS
B−4)、サーチ種別がSSSの場合には、シンプルス
ライドサーチ(SSS)実行部102dの処理により、
後述するSSS処理を実行する(ステップSB−5)。
【0116】一方、サーチ種別がMSSの場合には、ミ
ューテーションスライドサーチ(MSS)実行部102
eの処理により、ミューテーションテーブル106cを
参照して後述するMSS処理を実行する(ステップSB
−6)。
【0117】そして、スライドサーチ実行部102a
は、SSSまたはMSSの分析結果情報を記憶部106
に格納する(ステップSB−7)。これにて、スライド
サーチ処理が終了する。
【0118】[シンプルスライドサーチ(SSS)処
理]次に、シンプルスライドサーチ(SSS)処理の詳
細について図8を参照して説明する。図8は、本実施形
態における本システムのシンプルスライドサーチ(SS
S)処理の一例を示すフローチャートである。
【0119】まず、シンプルスライドサーチ(SSS)
実行部102dは、ターゲット配列の先頭からの位置を
示す情報(i)に1を設定する(ステップSC−1)。
【0120】次に、オリゴペプチド配列作成部102k
は、ターゲット配列(アミノ酸配列)のi番目から予め
利用者が設定した長さの部分配列(オリゴペプチド配
列)を取得する(ステップSC−2)。
【0121】ここで、図11は、ターゲット配列(アミ
ノ酸配列)のi番目から予め利用者が設定した長さの部
分配列(オリゴペプチド配列)を取得する場合の一例を
示した概念図であり、図12は、図11で用いられたア
ミノ酸の1文字記号に対応する3文字記号とアミノ酸の
名称の一覧を示す図である。
【0122】ついで、蛋白質集合データベース(PSD
B)検索部102mは、オリゴペプチド配列を母集団か
ら検索して(ステップSC−3)、母集団の中にオリゴ
ペプチド配列が存在する場合には(ステップSC−
4)、iと、検索に用いたオリゴペプチド配列と、母集
団中に存在した個数と、当該オリゴペプチド配列が存在
した蛋白質名とを検索結果情報として抽出して記憶部1
06に格納する(ステップSC−5)。
【0123】ついで、シンプルスライドサーチ(SS
S)実行部102dは、iに1を加算してインクリメン
トする(ステップSC−6)。
【0124】ついで、シンプルスライドサーチ(SS
S)実行部102dは、ターゲット配列の最後であるか
判断して(ステップSC−7)、最後ではない場合には
ステップSC−2に処理を戻す。
【0125】一方、ターゲット配列の最後である場合に
は、分析結果作成部102nは、全ての部分配列情報に
関する検索結果情報を集計してターゲット配列に関する
分析結果情報を作成する(ステップSC−8)。これに
て、シンプルスライドサーチ(SSS)処理が終了す
る。
【0126】[ミューテーションスライドサーチ(MS
S)処理]次に、ミューテーションスライドサーチ(M
SS)処理の詳細について図9を参照して説明する。図
9は、本実施形態における本システムのミューテーショ
ンスライドサーチ(MSS)処理の一例を示すフローチ
ャートである。
【0127】まず、ミューテーションスライドサーチ
(MSS)実行部102eは、ターゲット配列の先頭か
らの位置を示す情報(i)に1を設定する(ステップS
D−1)。
【0128】次に、オリゴペプチド配列作成部102p
は、ターゲット配列(アミノ酸配列)のi番目から予め
利用者が設定した長さの部分配列(オリゴペプチド配
列)を取得する(ステップSD−2)。
【0129】ここで、図11は、ターゲット配列(アミ
ノ酸配列)のi番目から予め利用者が設定した長さの部
分配列(オリゴペプチド配列)を取得する場合の一例を
示した概念図であり、図12は、図11で用いられたア
ミノ酸の1文字記号に対応する3文字記号とアミノ酸の
名称の一覧を示す図である。
【0130】ついで、ミューテーションテーブル検索部
102qは、オリゴペプチド配列に基づいてミューテー
ションテーブル106cにアクセスして当該オリゴペプ
チド配列に対応するミュータントの配列を取得する(ス
テップSD−3)。
【0131】ついで、蛋白質集合データベース(PSD
B)検索部102rは、オリゴペプチド配列およびその
ミュータントを母集団から検索して(ステップSD−
4)、母集団の中にオリゴペプチド配列またはミュータ
ントが存在する場合には(ステップSD−5)、iと、
検索に用いたオリゴペプチドまたはミュータントの配列
と、母集団中に存在した個数と、当該オリゴペプチドま
たはミュータントの配列が存在した蛋白質名とを検索結
果情報として抽出して記憶部106に格納する(ステッ
プSD−6)。
【0132】ついで、ミューテーションスライドサーチ
(MSS)実行部102eは、iに1を加算してインク
リメントする(ステップSD−7)。
【0133】ついで、ミューテーションスライドサーチ
(MSS)実行部102eは、ターゲット配列の最後で
あるか判断して(ステップSD−8)、最後ではない場
合にはステップSD−2に処理を戻す。
【0134】一方、ターゲット配列の最後である場合に
は、分析結果作成部102sは、全ての部分配列情報に
関する検索結果情報を集計してターゲット配列に関する
分析結果情報を作成する(ステップSD−9)。これに
て、ミューテーションスライドサーチ(MSS)処理が
終了する。
【0135】[テーブル作成処理]次に、テーブル作成
処理の詳細について図10を参照して説明する。図10
は、本実施形態における本システムのテーブル作成処理
の一例を示すフローチャートである。
【0136】まず、パラメータ設定部102fは、記憶
部106を参照して、利用者が予め設定したテーブルの
各種パラメータを取得する(ステップSE−1)。すな
わち、上述した図13から図17の各種のパラメータ設
定画面などを用いて利用者が設定したパラメータを記憶
部106を参照して取得する。
【0137】ついで、テーブル作成部102bは、記憶
部106に格納されたスライドサーチ実行部102aに
よるスライドサーチ処理の分析結果情報を取得する(ス
テップSE−2)。
【0138】ついで、列データ作成部102gは、利用
者が設定したテーブルのパラメータに従って、分析結果
情報の各項目についてテーブルの列データを作成する。
まず、列データ作成部102gは、列ごとに外部分析プ
ログラムの呼び出しを指定しているかを判定する(ステ
ップSE−3)。
【0139】ステップSE−3において、外部分析プロ
グラムの実行を選択していない場合には、スライドサー
チの分析結果に基づいて列データを作成する(ステップ
SE−4)。
【0140】一方、ステップSE−3において、外部分
析プログラム(例えば、ホモロジー検索、モチーフ検索
等)の実行を選択した場合には、列データ作成部102
gは、HTMLリンク情報で指定された外部システム2
00に対してコマンドや引数等を通信制御インターフェ
ース部104を介して送信して、外部分析プログラムの
実行を依頼し、外部システム200からその実行結果を
受信する(ステップSE−5)。
【0141】そして、列データ作成部102gは、外部
分析プログラムの実行結果およびスライドサーチの分析
結果に基づいて列データを作成する(ステップSE−
6)。
【0142】全ての列について、列データの作成と外部
分析プログラムの実行が完了した後、テーブル整形部1
02iの処理により、外部分析プログラムの実行結果等
について見易い形式に整形したり、表示されるテーブル
の列数や行数について整形処理を行ったりした後(ステ
ップSE−7)、出力形式変換部102jの処理によ
り、既存の変換技術を用いて利用者が設定したテーブル
の表示用データの記述言語(例えばHTMLやXMLな
ど)に変換する(ステップSE−8)。
【0143】ついで、出力形式変換部102jは、作成
したテーブルの表示用データを記憶部106に格納し
(ステップSE−9)、所望のタイミングで出力装置1
14に送信して出力する。
【0144】図18は、配列情報処理装置100の出力
装置114に出力されたテーブルの一例を示す図であ
る。図18に示すように、テーブルは、ヘッダの出力領
域MF−1と、そのヘッダに対応する上述した列データ
とを含んで構成される。
【0145】図18の例では、ヘッダは、先頭からの位
置MF−2、ターゲット配列の部分配列であるオリゴペ
プチド配列MF−3、母集団における抽出件数およびそ
の件数の図形表示MF−4、ミュータント配列MF−
5、抽出した蛋白質名MF−6、母集団抽出の条件MF
−7、および、サーチ種別MF−8を含んで構成され
る。
【0146】また、蛋白質名は、関連するウェブサイト
のWWWリンク情報が埋め込まれており、利用者が当該
蛋白質名をクリックすると既存のWWWのハイパーリン
ク構造のウェブページ表示技術を用いてそのウェブサイ
トの情報を表示させることができる(MF−9)。
【0147】また、利用者が設定した抽出件数の上限値
を超える場合には、膨大な量の情報を表示しないように
制御することができる(MF−10)。これにて、テー
ブル作成処理が終了する。
【0148】[他の実施の形態]さて、これまで本発明
の実施の形態について説明したが、本発明は、上述した
実施の形態以外にも、上記特許請求の範囲に記載した技
術的思想の範囲内において種々の異なる実施の形態にて
実施されてよいものである。
【0149】例えば、テーブル・パラメータ設定画面や
列パラメータ設定画面やヘッダ・パラメータ設定画面や
制約パラメータ設定画面などで利用者が入力する各種の
情報は、スクリプト言語などによりプログラム形式で指
定することにより情報の定義および設定を行ってもよ
い。
【0150】また、実施形態において説明した各処理の
うち、自動的に行なわれるものとして説明した処理の全
部または一部を手動的に行うこともでき、あるいは、手
動的に行なわれるものとして説明した処理の全部または
一部を公知の方法で自動的に行うこともできる。
【0151】この他、上記文書中や図面中で示した処理
手順、制御手順、具体的名称、各種の登録データや検索
条件等のパラメータを含む情報、画面例、データベース
構成については、特記する場合を除いて任意に変更する
ことができる。
【0152】また、配列情報処理装置100に関して、
図示の各構成要素は機能概念的なものであり、必ずしも
物理的に図示の如く構成されていることを要しない。
【0153】例えば、配列情報処理装置100の各サー
バが備える処理機能、特に制御部102にて行なわれる
各処理機能については、その全部または任意の一部を、
CPU(Central Processing Un
it)および当該CPUにて解釈実行されるプログラム
にて実現することができ、あるいは、ワイヤードロジッ
クによるハードウェアとして実現することも可能であ
る。なお、プログラムは、後述する記録媒体に記録され
ており、必要に応じて配列情報処理装置100に機械的
に読み取られる。
【0154】記憶部106に格納される各種のデータベ
ース等(蛋白質集合(PS)データベース106a〜テ
ーブル106d)は、RAM、ROM等のメモリ装置、
ハードディスク等の固定ディスク装置、フレキシブルデ
ィスク、光ディスク等のストレージ手段であり、各種処
理やウェブサイト提供に用いる各種のプログラムやテー
ブルやファイルやデータベースやウェブページ用ファイ
ル等を格納する。
【0155】また、配列情報処理装置100は、既知の
パーソナルコンピュータ、ワークステーション等の情報
処理端末等の情報処理装置にプリンタやモニタやイメー
ジスキャナ等の周辺装置を接続し、該情報処理装置に本
発明の方法を実現させるソフトウェア(プログラム、デ
ータ等を含む)を実装することにより実現してもよい。
【0156】さらに、配列情報処理装置100の分散・
統合の具体的形態は図示のものに限られず、その全部ま
たは一部を、各種の負荷等に応じた任意の単位で、機能
的または物理的に分散・統合して構成することができ
る。例えば、各データベースを独立したデータベース装
置として独立に構成してもよく、また、処理の一部をC
GI(Common Gateway Interfa
ce)を用いて実現してもよい。
【0157】また、本発明にかかるプログラムを、コン
ピュータ読み取り可能な記録媒体に格納することもでき
る。ここで、この「記録媒体」とは、フレキシブルディ
スク、光磁気ディスク、ROM、EPROM、EEPR
OM、CD−ROM、MO、DVD等の任意の「可搬用
の物理媒体」や、各種コンピュータシステムに内蔵され
るROM、RAM、HD等の任意の「固定用の物理媒
体」、あるいは、LAN、WAN、インターネットに代
表されるネットワークを介してプログラムを送信する場
合の通信回線や搬送波のように、短期にプログラムを保
持する「通信媒体」を含むものとする。
【0158】また、「プログラム」とは、任意の言語や
記述方法にて記述されたデータ処理方法であり、ソース
コードやバイナリコード等の形式を問わない。なお、
「プログラム」は必ずしも単一的に構成されるものに限
られず、複数のモジュールやライブラリとして分散構成
されるものや、OS(Operating Syste
m)に代表される別個のプログラムと協働してその機能
を達成するものをも含む。なお、実施の形態に示した各
装置において記録媒体を読み取るための具体的な構成、
読み取り手順、あるいは、読み取り後のインストール手
順等については、周知の構成や手順を用いることができ
る。
【0159】また、ネットワーク300は、配列情報処
理装置100と外部システム200とを相互に接続する
機能を有し、例えば、インターネットや、イントラネッ
トや、LAN(有線/無線の双方を含む)や、VAN
や、パソコン通信網や、公衆電話網(アナログ/デジタ
ルの双方を含む)や、専用回線網(アナログ/デジタル
の双方を含む)や、CATV網や、IMT2000方
式、GSM方式またはPDC/PDC―P方式等の携帯
回線交換網/携帯パケット交換網や、無線呼出網や、B
luetooth等の局所無線網や、PHS網や、C
S、BSまたはISDB等の衛星通信網等のうちいずれ
かを含んでもよい。すなわち、本システムは、有線・無
線を問わず任意のネットワークを介して、各種データを
送受信することができる。
【0160】
【発明の効果】以上詳細に説明したように、本発明によ
れば、塩基またはアミノ酸の配列情報と当該配列情報に
関連する配列関連情報とを対応付けて格納し、格納され
た配列情報のうち利用者にターゲット配列を選択させ、
格納された配列情報のうち検索の対象となる母集団の配
列情報を利用者に選択させ、選択されたターゲット配列
を利用者が指定した長さの部分配列に分割し、分割され
た部分配列を母集団から検索し、検索結果情報からター
ゲット配列に関する分析結果情報を作成し、利用者の設
定したパラメータに従って、部分配列に関する部分配列
情報と分析結果情報とをテーブル形式で出力するので、
処理結果として表示される配列情報とその分析情報の取
捨選択を、利用者が容易に設定し、その設定を保存し、
また後からその設定を再利用することができる配列情報
処理装置、配列情報処理方法、プログラム、および、記
録媒体を提供することができる。
【0161】また、本発明によれば、配列情報と、当該
配列情報が変異する可能性があるミュータント配列に関
するミュータント配列情報とを対応付けて格納し、分割
された部分配列に対するミュータント配列情報を、格納
されたミュータント配列情報から検索し、検索された部
分配列に対するミュータント配列情報を母集団から検索
するので、検索対象の部分配列のミュータントにまで検
索範囲を拡張することができ、より有益な生物学情報の
解析に利用することができる配列情報処理装置、配列情
報処理方法、プログラム、および、記録媒体を提供する
ことができる。
【0162】また、本発明によれば、配列関連情報は、
当該配列の名称、由来する生物名、対応する蛋白質の名
称、蛋白質の機能、および/または、関連データベース
のアドレスのうち少なくとも一つに関する情報を含むの
で、これらの項目をターゲット配列に関する分析情報と
して利用することができる配列情報処理装置、配列情報
処理方法、プログラム、および、記録媒体を提供するこ
とができる。
【0163】また、本発明によれば、母集団は、特定の
性質を備える蛋白質に関する配列情報を収集して作成す
るので、分析情報として抽出する必要のある蛋白質を限
定することができ、検索時間を短縮化できる配列情報処
理装置、配列情報処理方法、プログラム、および、記録
媒体を提供することができる。また、本発明によれば、
母集団に対して別のターゲット配列で分析することがで
きる配列情報処理装置、配列情報処理方法、プログラ
ム、および、記録媒体を提供することができる。
【0164】また、本発明によれば、部分配列の長さは
4〜7であるので、生物学的に有効なデータを適切なコ
ンピュータの演算時間で集計できる配列情報処理装置、
配列情報処理方法、プログラム、および、記録媒体を提
供することができる。
【0165】また、本発明によれば、部分配列情報は、
ターゲット配列の先頭からの位置、および/または、部
分配列のうち少なくとも一つに関する情報を含むので、
部分配列とその位置を任意に表示できる配列情報処理装
置、配列情報処理方法、プログラム、および、記録媒体
を提供することができる。
【0166】また、本発明によれば、分析結果情報は、
部分配列毎に、抽出した件数、検索に用いた上記ミュー
タント配列情報、抽出した配列の名称、抽出した配列の
由来する生物名、抽出した配列に対応する蛋白質の名
称、抽出した配列の蛋白質の機能、外部プログラムの実
行結果、および/または、抽出した配列の関連データベ
ースのアドレスのうち少なくとも一つに関する情報を含
むので、これらの各項目を任意に表示できる配列情報処
理装置、配列情報処理方法、プログラム、および、記録
媒体を提供することができる。
【0167】また、本発明によれば、パラメータは、分
析結果情報に含まれる各情報の出力可否、抽出した件数
のうち出力する際の上限数、分析結果情報の各情報の図
形表示可否、テーブルのヘッダのフォーマット、および
/または、テーブルの表示用データの記述言語のうち少
なくとも一つに関する情報を含むので、これらの各項目
を任意に表示できる配列情報処理装置、配列情報処理方
法、プログラム、および、記録媒体を提供することがで
きる。
【図面の簡単な説明】
【図1】本システムの基本原理の一例を示す原理構成図
である。
【図2】本発明が適用される本システムの構成の一例を
示すブロック図である。
【図3】スライドサーチ実行部102aの構成の一例を
示すブロック図である。
【図4】シンプルスライドサーチ(SSS)実行部10
2dの構成の一例を示すブロック図である。
【図5】ミューテーションスライドサーチ(MSS)実
行部102eの構成の一例を示すブロック図である。
【図6】テーブル作成部102bの構成の一例を示すブ
ロック図である。
【図7】本実施形態における本システムのスライドサー
チ処理の一例を示すフローチャートである。
【図8】本実施形態における本システムのシンプルスラ
イドサーチ(SSS)処理の一例を示すフローチャート
である。
【図9】本実施形態における本システムのミューテーシ
ョンスライドサーチ(MSS)処理の一例を示すフロー
チャートである。
【図10】本実施形態における本システムのテーブル作
成処理の一例を示すフローチャートである。
【図11】ターゲット配列(アミノ酸配列)のi番目か
ら予め利用者が設定した長さの部分配列(オリゴペプチ
ド配列)を取得する場合の一例を示した概念図である。
【図12】図11で用いられたアミノ酸の1文字記号に
対応する3文字記号とアミノ酸の名称の一覧を示す図で
ある。
【図13】サーチ条件設定部102cの処理により出力
装置114に出力されるテーブル・パラメータ設定画面
の一例を示す図である。
【図14】サーチ条件設定部102cの処理により出力
装置114に出力される列パラメータ設定画面(1)の
一例を示す図である。
【図15】サーチ条件設定部102cの処理により出力
装置114に出力される列パラメータ設定画面(2)の
一例を示す図である。
【図16】サーチ条件設定部102cの処理により出力
装置114に出力される制約パラメータ設定画面の一例
を示す図である。
【図17】サーチ条件設定部102cの処理により出力
装置114に出力されるヘッダ・パラメータ設定画面の
一例を示す図である。
【図18】配列情報処理装置100の出力装置114に
出力されたテーブルの一例を示す図である。
【符号の説明】
100 配列情報処理装置 102 制御部 102a スライドサーチ実行部 102b テーブル作成部 102c サーチ条件設定部 102d シンプルスライドサーチ(SSS)実行部 102e ミューテーションスライドサーチ(MSS)
実行部 102f パラメータ設定部 102g 列データ作成部 102h 外部分析プログラム実行部 102i テーブル整形部 102j 出力形式変換部 102k オリゴペプチド配列作成部 102m 蛋白質集合データベース(PSDB)検索部 102n 分析結果作成部 102p オリゴペプチド配列作成部 102q ミューテーションテーブル検索部 104 通信制御インターフェース部 106 記憶部 106a 蛋白質集合(PS)データベース 106b インハウスデータベース 106c ミューテーションテーブル 106d テーブル 108 入出力制御インターフェース部 112 入力装置 114 出力装置 200 外部システム 300 ネットワーク
───────────────────────────────────────────────────── フロントページの続き (72)発明者 土居 洋文 千葉県千葉市美浜区中瀬1丁目3番地 幕 張テクノガーデンD17 セレスター・レキ シコ・サイエンシズ株式会社内 Fターム(参考) 4B024 AA11 AA20 CA04 HA11 HA19 5B075 ND02 NS10 PP03 PP12 PQ02 PQ15 UU19

Claims (25)

    【特許請求の範囲】
  1. 【請求項1】 塩基またはアミノ酸の配列情報と当該配
    列情報に関連する配列関連情報とを対応付けて格納する
    配列情報格納手段と、 上記配列情報格納手段により格納された上記配列情報の
    うち利用者にターゲット配列を選択させるターゲット配
    列選択手段と、 上記配列情報格納手段により格納された上記配列情報の
    うち検索の対象となる母集団の配列情報を上記利用者に
    選択させる母集団選択手段と、 上記ターゲット配列選択手段により選択された上記ター
    ゲット配列を上記利用者が指定した長さの部分配列に分
    割する配列分割手段と、 上記配列分割手段にて分割された上記部分配列を上記母
    集団から検索する検索手段と、 上記検索手段の検索結果情報から上記ターゲット配列に
    関する分析結果情報を作成する分析結果情報作成手段
    と、 上記利用者の設定したパラメータに従って、上記部分配
    列に関する部分配列情報と上記分析結果情報とをテーブ
    ル形式で出力するテーブル出力手段と、 を備えたことを特徴とする配列情報処理装置。
  2. 【請求項2】 上記配列情報と、当該配列情報が変異す
    る可能性があるミュータント配列に関するミュータント
    配列情報とを対応付けて格納するミュータント配列情報
    格納手段と、 上記配列分割手段にて分割された上記部分配列に対する
    ミュータント配列情報を、上記ミュータント配列情報格
    納手段にて格納された上記ミュータント配列情報から検
    索するミュータント配列検索手段と、 をさらに備え、 上記検索手段は、上記ミュータント配列検索手段にて検
    索された上記部分配列に対する上記ミュータント配列情
    報を上記母集団から検索することを特徴とする請求項1
    に記載の配列情報処理装置。
  3. 【請求項3】 上記配列関連情報は、当該配列の名称、
    由来する生物名、対応する蛋白質の名称、蛋白質の機
    能、および/または、関連データベースのアドレスのう
    ち少なくとも一つに関する情報を含むことを特徴とする
    請求項1または2に記載の配列情報処理装置。
  4. 【請求項4】 上記母集団は、特定の性質を備える蛋白
    質に関する配列情報を収集して作成することを特徴とす
    る請求項1から3のいずれか一つに記載の配列情報処理
    装置。
  5. 【請求項5】 上記部分配列の長さは4〜7であること
    を特徴とする請求項1から4のいずれか一つに記載の配
    列情報処理装置。
  6. 【請求項6】 上記部分配列情報は、上記ターゲット配
    列の先頭からの位置、および/または、部分配列のうち
    少なくとも一つに関する情報を含むことを特徴とする請
    求項1から5のいずれか一つに記載の配列情報処理装
    置。
  7. 【請求項7】 上記分析結果情報は、上記部分配列毎
    に、抽出した件数、検索に用いた上記ミュータント配列
    情報、抽出した配列の名称、抽出した配列の由来する生
    物名、抽出した配列に対応する蛋白質の名称、抽出した
    配列の蛋白質の機能、外部プログラムの実行結果、およ
    び/または、抽出した配列の関連データベースのアドレ
    スのうち少なくとも一つに関する情報を含むことを特徴
    とする請求項1から6のいずれか一つに記載の配列情報
    処理装置。
  8. 【請求項8】 上記パラメータは、上記分析結果情報に
    含まれる各情報の出力可否、抽出した件数のうち出力す
    る際の上限数、上記分析結果情報の各情報の図形表示可
    否、上記テーブルのヘッダのフォーマット、および/ま
    たは、上記テーブルの表示用データの記述言語のうち少
    なくとも一つに関する情報を含むことを特徴とする請求
    項1から7のいずれか一つに記載の配列情報処理装置。
  9. 【請求項9】 塩基またはアミノ酸の配列情報と当該配
    列情報に関連する配列関連情報とを対応付けて格納する
    配列情報格納ステップと、 上記配列情報格納ステップにより格納された上記配列情
    報のうち利用者にターゲット配列を選択させるターゲッ
    ト配列選択ステップと、 上記配列情報格納ステップにより格納された上記配列情
    報のうち検索の対象となる母集団の配列情報を上記利用
    者に選択させる母集団選択ステップと、 上記ターゲット配列選択ステップにより選択された上記
    ターゲット配列を上記利用者が指定した長さの部分配列
    に分割する配列分割ステップと、 上記配列分割ステップにて分割された上記部分配列を上
    記母集団から検索する検索ステップと、 上記検索ステップの検索結果情報から上記ターゲット配
    列に関する分析結果情報を作成する分析結果情報作成ス
    テップと、 上記利用者の設定したパラメータに従って、上記部分配
    列に関する部分配列情報と上記分析結果情報とをテーブ
    ル形式で出力するテーブル出力ステップと、 を含むことを特徴とする配列情報処理方法。
  10. 【請求項10】 上記配列情報と、当該配列情報が変異
    する可能性があるミュータント配列に関するミュータン
    ト配列情報とを対応付けて格納するミュータント配列情
    報格納ステップと、 上記配列分割ステップにて分割された上記部分配列に対
    するミュータント配列情報を、上記ミュータント配列情
    報格納ステップにて格納された上記ミュータント配列情
    報から検索するミュータント配列検索ステップと、 をさらに含み、 上記検索ステップは、上記ミュータント配列検索ステッ
    プにて検索された上記部分配列に対する上記ミュータン
    ト配列情報を上記母集団から検索すること、 を特徴とする請求項9に記載の配列情報処理方法。
  11. 【請求項11】 上記配列関連情報は、当該配列の名
    称、由来する生物名、対応する蛋白質の名称、蛋白質の
    機能、および/または、関連データベースのアドレスの
    うち少なくとも一つに関する情報を含むことを特徴とす
    る請求項9または10に記載の配列情報処理方法。
  12. 【請求項12】 上記母集団は、特定の性質を備える蛋
    白質に関する配列情報を収集して作成することを特徴と
    する請求項9から11のいずれか一つに記載の配列情報
    処理方法。
  13. 【請求項13】 上記部分配列の長さは4〜7であるこ
    とを特徴とする請求項9から12のいずれか一つに記載
    の配列情報処理方法。
  14. 【請求項14】 上記部分配列情報は、上記ターゲット
    配列の先頭からの位置、および/または、部分配列のう
    ち少なくとも一つに関する情報を含むことを特徴とする
    請求項9から13のいずれか一つに記載の配列情報処理
    方法。
  15. 【請求項15】 上記分析結果情報は、上記部分配列毎
    に、抽出した件数、検索に用いた上記ミュータント配列
    情報、抽出した配列の名称、抽出した配列の由来する生
    物名、抽出した配列に対応する蛋白質の名称、抽出した
    配列の蛋白質の機能、外部プログラムの実行結果、およ
    び/または、抽出した配列の関連データベースのアドレ
    スのうち少なくとも一つに関する情報を含むことを特徴
    とする請求項9から14のいずれか一つに記載の配列情
    報処理方法。
  16. 【請求項16】 上記パラメータは、上記分析結果情報
    に含まれる各情報の出力可否、抽出した件数のうち出力
    する際の上限数、上記分析結果情報の各情報の図形表示
    可否、上記テーブルのヘッダのフォーマット、および/
    または、上記テーブルの表示用データの記述言語のうち
    少なくとも一つに関する情報を含むことを特徴とする請
    求項9から15のいずれか一つに記載の配列情報処理方
    法。
  17. 【請求項17】 塩基またはアミノ酸の配列情報と当該
    配列情報に関連する配列関連情報とを対応付けて格納す
    る配列情報格納ステップと、 上記配列情報格納ステップにより格納された上記配列情
    報のうち利用者にターゲット配列を選択させるターゲッ
    ト配列選択ステップと、 上記配列情報格納ステップにより格納された上記配列情
    報のうち検索の対象となる母集団の配列情報を上記利用
    者に選択させる母集団選択ステップと、 上記ターゲット配列選択ステップにより選択された上記
    ターゲット配列を上記利用者が指定した長さの部分配列
    に分割する配列分割ステップと、 上記配列分割ステップにて分割された上記部分配列を上
    記母集団から検索する検索ステップと、 上記検索ステップの検索結果情報から上記ターゲット配
    列に関する分析結果情報を作成する分析結果情報作成ス
    テップと、 上記利用者の設定したパラメータに従って、上記部分配
    列に関する部分配列情報と上記分析結果情報とをテーブ
    ル形式で出力するテーブル出力ステップと、を含むこと
    を特徴とする配列情報処理方法をコンピュータに実行さ
    せることを特徴とするプログラム。
  18. 【請求項18】 上記配列情報と、当該配列情報が変異
    する可能性があるミュータント配列に関するミュータン
    ト配列情報とを対応付けて格納するミュータント配列情
    報格納ステップと、 上記配列分割ステップにて分割された上記部分配列に対
    するミュータント配列情報を、上記ミュータント配列情
    報格納ステップにて格納された上記ミュータント配列情
    報から検索するミュータント配列検索ステップと、 をさらに含み、 上記検索ステップは、上記ミュータント配列検索ステッ
    プにて検索された上記部分配列に対する上記ミュータン
    ト配列情報を上記母集団から検索すること、 を特徴とする請求項17に記載のプログラム。
  19. 【請求項19】 上記配列関連情報は、当該配列の名
    称、由来する生物名、対応する蛋白質の名称、蛋白質の
    機能、および/または、関連データベースのアドレスの
    うち少なくとも一つに関する情報を含むことを特徴とす
    る請求項17または18に記載のプログラム。
  20. 【請求項20】 上記母集団は、特定の性質を備える蛋
    白質に関する配列情報を収集して作成することを特徴と
    する請求項17から18のいずれか一つに記載のプログ
    ラム。
  21. 【請求項21】 上記部分配列の長さは4〜7であるこ
    とを特徴とする請求項17から20のいずれか一つに記
    載のプログラム。
  22. 【請求項22】 上記部分配列情報は、上記ターゲット
    配列の先頭からの位置、および/または、部分配列のう
    ち少なくとも一つに関する情報を含むことを特徴とする
    請求項17から21のいずれか一つに記載のプログラ
    ム。
  23. 【請求項23】 上記分析結果情報は、上記部分配列毎
    に、抽出した件数、検索に用いた上記ミュータント配列
    情報、抽出した配列の名称、抽出した配列の由来する生
    物名、抽出した配列に対応する蛋白質の名称、抽出した
    配列の蛋白質の機能、外部プログラムの実行結果、およ
    び/または、抽出した配列の関連データベースのアドレ
    スのうち少なくとも一つに関する情報を含むことを特徴
    とする請求項17から22のいずれか一つに記載のプロ
    グラム。
  24. 【請求項24】 上記パラメータは、上記分析結果情報
    に含まれる各情報の出力可否、抽出した件数のうち出力
    する際の上限数、上記分析結果情報の各情報の図形表示
    可否、上記テーブルのヘッダのフォーマット、および/
    または、上記テーブルの表示用データの記述言語のうち
    少なくとも一つに関する情報を含むことを特徴とする請
    求項17から23のいずれか一つに記載のプログラム。
  25. 【請求項25】 上記請求項17〜24のいずれか一つ
    に記載されたプログラムを記録したことを特徴とするコ
    ンピュータ読み取り可能な記録媒体。
JP2001367741A 2001-11-30 2001-11-30 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体 Expired - Fee Related JP3881224B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001367741A JP3881224B2 (ja) 2001-11-30 2001-11-30 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001367741A JP3881224B2 (ja) 2001-11-30 2001-11-30 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2003167883A true JP2003167883A (ja) 2003-06-13
JP3881224B2 JP3881224B2 (ja) 2007-02-14

Family

ID=19177445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001367741A Expired - Fee Related JP3881224B2 (ja) 2001-11-30 2001-11-30 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP3881224B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018016556A1 (ja) * 2016-07-21 2018-01-25 石原産業株式会社 ジェミニウイルス病の防除に有効なペプチドとその利用法
JP2022521052A (ja) * 2019-02-07 2022-04-05 バイオストランド ビーブイ 生物学的情報の取り扱い
CN115409174A (zh) * 2022-11-01 2022-11-29 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0698770A (ja) * 1992-07-31 1994-04-12 Internatl Business Mach Corp <Ibm> トークン列データベースにおけるトークンシーケンスの探索
JPH07105224A (ja) * 1993-08-10 1995-04-21 Hitachi Ltd 文字配列検索方法
JPH1045795A (ja) * 1996-08-01 1998-02-17 Fujitsu Ltd 蛋白質データベース・システム並びに蛋白質の機能および機能部位の推定方法
JPH10222486A (ja) * 1997-01-31 1998-08-21 Kagaku Gijutsu Shinko Jigyodan 蛋白質の機能部位予測方法と機能部位予測装置 並びに蛋白質の機能改良方法
JP2000099542A (ja) * 1998-09-25 2000-04-07 Ricoh Co Ltd 生産実績の問い合わせ及びデータベースの問い合わせ装置
WO2000039338A1 (en) * 1998-12-23 2000-07-06 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0698770A (ja) * 1992-07-31 1994-04-12 Internatl Business Mach Corp <Ibm> トークン列データベースにおけるトークンシーケンスの探索
JPH07105224A (ja) * 1993-08-10 1995-04-21 Hitachi Ltd 文字配列検索方法
JPH1045795A (ja) * 1996-08-01 1998-02-17 Fujitsu Ltd 蛋白質データベース・システム並びに蛋白質の機能および機能部位の推定方法
JPH10222486A (ja) * 1997-01-31 1998-08-21 Kagaku Gijutsu Shinko Jigyodan 蛋白質の機能部位予測方法と機能部位予測装置 並びに蛋白質の機能改良方法
JP2000099542A (ja) * 1998-09-25 2000-04-07 Ricoh Co Ltd 生産実績の問い合わせ及びデータベースの問い合わせ装置
WO2000039338A1 (en) * 1998-12-23 2000-07-06 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
宮崎智: "配列を手に入れる DDBJが提供するSRSシステムによる検索の仕方", 蛋白質 核酸 酵素, vol. 第46巻,第6号, CSND200500272002, 1 May 2001 (2001-05-01), JP, pages 764 - 770, ISSN: 0000782912 *
金久實: "モチーフ辞書による配列データの知識処理", ゲノム解析に伴う大量知識情報処理の研究 平成5年度研究成果報告書 平成6年3月, CSNG200301418004, 31 March 1994 (1994-03-31), JP, pages 20 - 25, ISSN: 0000782911 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018016556A1 (ja) * 2016-07-21 2018-01-25 石原産業株式会社 ジェミニウイルス病の防除に有効なペプチドとその利用法
CN109477093A (zh) * 2016-07-21 2019-03-15 石原产业株式会社 对双生病毒病的防治有效的肽及其利用法
JPWO2018016556A1 (ja) * 2016-07-21 2019-05-09 石原産業株式会社 ジェミニウイルス病の防除に有効なペプチドとその利用法
CN109477093B (zh) * 2016-07-21 2022-08-26 石原产业株式会社 对双生病毒病的防治有效的肽及其利用法
US11427833B2 (en) 2016-07-21 2022-08-30 Ishihara Sangyo Kaisha, Ltd. Peptide effective in control of geminivirus disease and use thereof
JP7369522B2 (ja) 2016-07-21 2023-10-26 石原産業株式会社 ジェミニウイルス病の防除に有効なペプチドとその利用法
JP2022521052A (ja) * 2019-02-07 2022-04-05 バイオストランド ビーブイ 生物学的情報の取り扱い
JP7602264B2 (ja) 2019-02-07 2024-12-18 バイオストランド ビーブイ 生物学的情報の取り扱い
CN115409174A (zh) * 2022-11-01 2022-11-29 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置
CN115409174B (zh) * 2022-11-01 2023-03-31 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置

Also Published As

Publication number Publication date
JP3881224B2 (ja) 2007-02-14

Similar Documents

Publication Publication Date Title
US6408308B1 (en) System and method for generating, analyzing and storing normalized expression datasets from raw expression datasets derived from microarray includes nucleic acid probe sequences
KR100686910B1 (ko) 생체 상태 정보 처리 장치, 생체 상태 정보 처리 방법, 생체 상태 정보 관리 시스템 및 기록 매체
EP2624144A1 (en) Network model integration device, network model integration system, network model integration method, and program
Mao et al. ESTAP—an automated system for the analysis of EST data
EP1505517A1 (en) Mutant sequence analyzer
Piovesan et al. Databases for intrinsically disordered proteins
EP2015208A1 (en) Bioitem searcher, bioitem search terminal, bioitem search method, and program
WO2003081471A1 (en) Apparatus for managing gene expression data
JP2003167883A (ja) 配列情報処理装置、配列情報処理方法、プログラム、および、記録媒体
JP2008129942A (ja) コンテンツ検索装置
JP2003203076A (ja) 知見探索装置、知見探索方法、プログラム、および、記録媒体
JP3880417B2 (ja) 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体
KR100650203B1 (ko) 유전체 서열 분석 및 데이터 관리 시스템 및 그 방법
WO2004036283A1 (ja) 顕微鏡画像処理システム、顕微鏡画像処理方法、プログラム、および、記録媒体
JP3881238B2 (ja) Rna配列解析装置、rna配列解析方法、プログラム、および、記録媒体
Sansom Database searching with DNA and protein sequences: an introduction
WO2003091720A1 (en) Method of analyzing protein structure, protein structure analyzer, program and recording medium
JP4054574B2 (ja) 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体
JP2003196290A (ja) 相互作用部位予測装置、相互作用部位予測方法、プログラム、および、記録媒体
JP4362290B2 (ja) ハプロタイプ解析装置、および、ハプロタイプ解析方法をコンピュータに実行させることを特徴とするプログラム
JP2003196575A (ja) 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体
JP2004109053A (ja) 結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体
JP2004147640A (ja) insituハイブリダイゼーション解析管理方法およびinsituハイブリダイゼーション解析管理装置
JP5247009B2 (ja) 配列抽出装置、配列抽出方法、プログラムおよび記録媒体
JP2007164727A (ja) 料理レシピの検索表示システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061109

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091117

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131117

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees