JPH08110910A - 文字配列検索方法 - Google Patents

文字配列検索方法

Info

Publication number
JPH08110910A
JPH08110910A JP6247507A JP24750794A JPH08110910A JP H08110910 A JPH08110910 A JP H08110910A JP 6247507 A JP6247507 A JP 6247507A JP 24750794 A JP24750794 A JP 24750794A JP H08110910 A JPH08110910 A JP H08110910A
Authority
JP
Japan
Prior art keywords
character
array
sequence
dynamic programming
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6247507A
Other languages
English (en)
Inventor
Tetsuo Nishikawa
哲夫 西川
Keiichi Nagai
啓一 永井
Susumu Hiraoka
進 平岡
Naoko Kasahara
直子 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6247507A priority Critical patent/JPH08110910A/ja
Publication of JPH08110910A publication Critical patent/JPH08110910A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 DNAやRNAの塩基配列、あるいはアミノ酸配列
をダイナミックプログラミング法によって比較する方法
において、比較する二つの文字配列間に長さのアンバラ
ンスがある場合に、双方の配列長の積ではなく、短い方
の配列長の二乗に比例した計算時間で検索する手段を提
供する。 【構成】 短い方の配列中に一定長の任意の文字配列が
存在するか否かを表に記録した文字成分表を用いて、長
い方の配列内の部分配列が持つ文字成分がどの程度短い
方の配列中の文字成分と一致するかによって、ダイナミ
ックプログラミング法を行う領域を長い方の配列内で予
め決定するステップを設ける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字配列、特にDNA,RNA
やアミノ酸の配列の検索方法に関する。
【0002】
【従来の技術】従来、文字配列、特にDNA,RNAやアミノ
酸の配列の比較を行う方法として、ダイナミックプログ
ラミング(DP)法に基づいたスミス・ウォーターマン
(Smith-Waterman)の方法が最も厳密な方法として知ら
れている(ジャーナル オブ モレキュラー バイオロジ
ー,147巻,195〜197頁,1981年,/J. Mol. Biol. Vo
l.147, pp195-197,1981)。
【0003】Smith-Watermanの方法は、二つの文字配列
を比較する際に、文字の一致にプラスのスコアを、不一
致、欠失、挿入にマイナスのスコアを与えた上で、二つ
の文字配列の並置を行い、あらゆる並置の中からスコア
の総計が最大になるような並置を求める方法である。あ
らゆる並置を考慮しているため最も厳密な検索が可能で
あるが、検索配列長とデータベース配列長の総和の積に
比例した検索時間が必要であり、大規模なデータベース
に対して検索を行う場合は検索時間が膨大になる。DNA
の公共データベースであるGenBankへの塩基配列の登録
件数は年々増大しており、現在では全体の塩基数が108
に達している。GenBank全体をSmith-Watermanの方法で
検索した場合、ワークステーションを用いると数10時間
以上かかることが知られている。
【0004】そこで、検索時間を短縮するために、FAST
Aと呼ばれる方法が開発されている(プロシーデイング
オブ ナショナル アカデミック オブ サイエンス イン
ユーエスエイ,85巻,2444〜2448頁,1988年/Proc. Na
tl. Acad. Sci. USA, 1988, Vol.85, pp2444-2448)。
この方法は2段階の検索からなる。
【0005】第1段階の検索では、データベース内の全
ての配列と簡略化した比較を行う。二つの配列間で一定
文字長(1〜6)の部分文字列の一致部分を抽出し、それ
らの一致文字列間に重なりがあれば延長していき、得ら
れた最大の一致部分の長さに応じてスコア値を与える。
このスコア値が設定された或値を越えた配列のみに対し
て第2段階の検索を行う。
【0006】第2段階の検索では、前述したSmith-Wate
rmanの方法を用いてスコア値を計算する。このスコア値
に基づいて塩基配列間の相同性や類似性の判定を行う。
ここで用いられるSmith-Watermanの方法では、第1段階
の検索で得られた最大一致部分を中心にした限られた範
囲での比較を行うことによって、検索時間を短縮してい
る。
【0007】FASTAでは、第1段階の検索で部分的な一
致も存在しない無関係な配列をふるい落として、厳密に
検索する配列数を絞り込むことによって高速化を達成し
ている。FASTAによるGenBank全体の検索速度はワークス
テーションを用いた場合数分程度であるが、不十分な点
として第1段階の検索において検索もれがあることが知
られている。FASTAでは、部分的な一致度が平均的に悪
くても全体的には一致度が高いような配列を拾い落とす
可能性がある。また、上述した第2段階のSmith-Waterm
an法における範囲の限定が漏れを生じさせる可能性もあ
る。
【0008】BLASTはFASTAよりも高速な検索を実現する
ために考案された(ジャーナル オブ モレキュラー バ
イオロジー,215巻,403〜410頁,1990年/J. Mol. Bio
l. 1990, 215, 403-410.)。BLASTではFASTAにおける第
2段階の検索、及び並置の部分を省き、部分的な一致度
のみによる検索を行う。その際、部分的な塩基配列の一
致が生じる確率を計算し評価することによって、統計的
に有意な部分一致配列を検索するようにしている。しか
し、FASTAとのアルゴリズムの類似性から、BLASTは漏れ
を生じる可能性がある。また、部分的な一致度のみによ
る検索で最適並置を求めないため、配列どうしが実際に
どのように並置しているのかがわからないという欠点が
ある。
【0009】以上のように、近似を用いないSmith-Wate
rman法が漏れのない配列の比較方法として適している。
しかし、Smith-Waterman法は上述したように計算時間が
比較する二つの配列の配列長の積に比例する。例えば、
一方の配列がDNAシーケンサーからの出力配列の場合、
配列長は400塩基程度である。もう一方がGenBank等のDN
Aデータベース中の塩基配列の場合、10000塩基以上の長
い配列が多く存在する。このような場合、400×10000に
比例した計算時間が必要である。
【0010】
【発明が解決しようとする課題】本発明の解決しようと
する課題は、DNAやRNAの塩基配列、あるいはアミノ酸配
列をSmith-Waterman法等のダイナミックプログラミング
法によって比較する場合において、比較する二つの文字
配列間に長さのアンバランスがある場合に、双方の配列
長の積ではなく、短い方の配列長の二乗に比例した計算
時間で検索する手段を提供することにある。
【0011】
【課題を解決するための手段】上記課題を解決するため
に本発明においては、以下の処理ステップ (1)比較する二つの文字配列のうち短い方の配列中に
一定長kの任意の文字配列が存在するか否かを表に記録
した文字成分表を作成するステップ (2)比較する二つの文字配列のうち長い方の配列中の
一定長部分配列を出発点をずらして長さkの互いに重な
らない文字成分に分解するステップ (3)該一定長部分配列内の該各出発点から得られた文
字成分が該文字成分表中に記された検索配列中の文字成
分と一致する数を各出発点毎にスコアとして計算するス
テップ (4)該部分配列を長い方文字の配列内でスキャンし、
全ての出発点に対して該部分配列の中で一定のしきい値
以上のスコアを持つ領域を求めるステップ (5)上記領域を含む領域をダイナミックプログラミン
グ法を行う領域とするステップ から構成される方法によって、ダイナミックプログラミ
ング法を行う前にダイナミックプログラミング法を行う
領域を予め決定する。
【0012】
【作用】上記のように、短い方の配列中に一定長kの任
意の文字配列が存在するか否かを表に記録した文字成分
表を用いて、長い方の配列内の部分配列が持つ文字成分
がどの程度短い方の配列中の文字成分と一致するかによ
って、ダイナミックプログラミング法を行う前にダイナ
ミックプログラミング法を行う領域を長い方の配列内で
予め決定することによって、長い方の配列長に依存せず
短い方の配列長のみに依存した時間、すなわち短い方の
配列長の二乗に比例した計算時間でダイナミックプログ
ラミング法を用いた検索が可能である。
【0013】
【実施例】
(実施例1)以下、本発明の第一の実施例について図1
を用いて説明する。本実施例においては、二つの配列を
比較する場合の例として、与えられたDNAの塩基配列
(これを以下では検索配列と称する)をGenBank等のデ
ータベース内の塩基配列に対して検索する場合を説明す
る。
【0014】本装置は、ディスプレイ100、キーボード1
01、中央制御装置CPU102、フロッピーディスクドライバ
103、主メモリ200、磁気ディスク106から構成される。
主メモリ200には、文字配列成分表作成登録プログラム2
01、ダイナミックプログラミング法領域決定プログラム
202、ダイナミックプログラミング法実行プログラム203
が格納されると共に、データエリア204が確保されてい
る。これらのプログラムはCPU102で実行される。
【0015】検索の際には、キーボード101あるいはフ
ロッピーディスクドライバ105に挿入されるフロッピー
ディスクから入力された検索文字配列205、及びダイナ
ミックプログラミング法領域決定の際に必要なパラメー
タである部分配列長と誤り許容率が、CPU102に送られ、
主メモリ200に格納される。次にCPU102は、文字配列成
分表作成登録プログラム201を実行して、検索文字配列2
05中で用いられている一定長の文字成分を重複なく集め
た文字配列成分表を作成し、これを文字配列成分表206
として主メモリ200中のデータエリア204へ格納する。
【0016】CPU102は、まずダイナミックプログラミン
グ法領域決定プログラム202、ダイナミックプログラミ
ング法実行プログラム203を順次実行する。ダイナミッ
クプログラミング法領域決定ステップでは、最初に与え
られた部分配列長で与えられた誤り許容率以上のデータ
ベース内の領域を、文字成分表を参照して求め、上記領
域を含む領域をダイナミックプログラミング法を行う領
域として決定する。次に、ダイナミックプログラミング
法ステップでは上記領域に限定してダイナミックプログ
ラミング法を行う。以上が本発明の第一の文字配列検索
装置の概略である。
【0017】以下、本発明の特徴であるダイナミックプ
ログラミング法領域決定方法について、DNA塩基配列の
検索を例にとって説明する。まず、検索文字配列、及び
ダイナミックプログラミング法領域決定の際に必要なパ
ラメータである部分配列長と誤り許容率の入力を行う。
次に、検索DNA塩基配列から文字配列成分表を作成す
る。
【0018】図2にその方法を示す。DNAの塩基配列
は、図2に示したようにアデニンA、シトシンC、グアニ
ンG、チミンTの4種類の塩基文字の並びで表せられる。
検索DNA塩基配列からの文字配列成分の抽出を行う。DNA
塩基配列からの文字配列成分の抽出は、図2中に示した
ように、一定長(この場合6塩基長)の塩基配列成分
を、DNA塩基配列の一方の末端からもう一方の末端に達
するまで、1塩基ずつずらして抽出していくことによっ
て行われる。
【0019】次に、こうやって抽出した塩基配列成分を
DNA塩基配列文字成分表に登録する。DNA塩基配列文字成
分表は、可能な全ての塩基配列成分種(この場合は6塩
基長文字配列成分であるから、成分種の数は4の6乗=40
96)に対する1ビットの情報で表現される。すなわち、D
NA塩基配列文字成分表中で抽出された塩基配列成分に対
応する項に’1’を設定し、それ以外の項に’0’を設定
する。図2中の例では、検索DNA塩基配列 には塩基配
列成分AAAAAAは存在しないので、塩基配列文字成分表中
のAAAAAAの項には’0’が設定される。また、塩基配列
成分AAAAAC,AAAACC,TTTTTTは存在するので、DNA塩基
配列文字成分表中のAAAAAC,AAAACC,TTTTTTの項には’
1’が設定される。こうやって作成されたDNA塩基配列文
字成分表は、メモリ中に格納される。
【0020】次に、上述した文字成分表を用いてダイナ
ミックプログラミング法領域を決定する方法を図3〜図
7を用いて説明する。
【0021】図3に示したように、ダイナミックプログ
ラミング法領域の決定は、データベース配列から部分配
列の抽出ステップ、部分配列からサブ部分配列の抽出ス
テップ、サブ部分配列を用いたスコアの計算ステップ、
ヒットサブ部分配列の同定ステップ、ヒット部分配列の
同定ステップ、及びDP領域の決定ステップから構成され
る。
【0022】まず図4に示したように、検索配列を末端
がS塩基ずつずれた長さNPの互いに重なる部分配列に分
割する。パラメータSの値は予め与えられる。次に図5
に示すように、各部分配列からサブ部分配列を生成す
る。サブ部分配列の1番目は、部分配列自体である。サ
ブ部分配列の2番目以降は次のようにして求める。図5
中で左の末端を1塩基ずつ右にずらしていき、配列長NS
が文字成分表で用いた文字成分長の倍数でかつもう一方
の末端が部分配列を越えないように、サブ部分配列を設
定する。
【0023】次に図6に示したように、サブ部分配列と
検索配列から作成した文字配列成分表を用いたスコアの
計算を行う。まず、サブ部分配列を互いに重複しない一
定長の文字成分に分割する。この際、文字成分長は、検
索配列から作成した文字配列成分表で用いた文字成分長
と同一にとる。次に、それらの文字成分に対応する部位
を検索配列から作成した文字配列成分表中で参照し、そ
の部位における数字を、サブ部分配列内の重複しない文
字成分の全てに対して加算したものをスコアとする。
【0024】図6の例の場合、スコアは2となる。こう
して得られたスコアが図7に示すように一定のしきい値
以上であるサブ部分配列をヒットサブ部分配列として同
定する。この際、判定結果は図7に示すようにデータベ
ース中のエントリー順に並んだビット列Rとして格納さ
れる。ここで、ビット列中の1はヒットを、0はヒット
しないことを意味する。ここでヒット判定に用いられる
しきい値としては、数1が用いられる。
【0025】
【数1】
【0026】しきい値をこのように定義することによっ
て、与えられた誤り許容率以内のサブ部分配列を漏れな
く拾いだすことが可能である。ヒット部分配列の同定
は、このようにして得られた部分配列内の全てのサブ部
分配列のRどうしのビット積を行うことによって実行さ
れる。すなわちこのビット積におけるビット=1の部分
配列がヒット部分配列とみなされる。このビット積によ
って、スコア計算において誤りが少数の文字成分中に集
中した時に生じる判定ノイズを減少させることが可能で
ある。
【0027】最後にヒット部分配列を含む領域をダイナ
ミックプログラミング法を行う領域として決定する。ヒ
ット部分配列領域の両側に部分配列長分だけ延長した領
域を、ダイナミックプログラミング法を行う領域として
決定すれば、類似性の高い領域を確実にカバーすること
が可能である。こうやって得られた領域に限定して、次
のステップでダイナミックプログラミング法を行う。
【0028】以上のステップを実行することによって、
データベース配列が検索配列よりも非常に長い場合にお
いても、ダイナミックプログラミング法を実効的に検索
配列長の配列どうしの計算で実行することが可能であ
る。
【0029】例えば、DNA配列の公共データベースであ
るGenBank中の配列は平均長が1000塩基で、長いもので
は10000塩基以上のものが多数登録されている。検索配
列としてはDNAシーケンサーからの出力配列を用いるこ
とが多く、その長さは400塩基程度である。従って本方
法を実行することによって、平均的には2.5倍、ある場
合には25倍以上のダイナミックプログラミング法計算の
高速化が可能になる。ここで、ダイナミックプログラミ
ング法の領域決定は文字成分表を参照した単純な和を行
う計算であるため、ダイナミックプログラミング法自体
よりも少ない計算時間で実行することが可能である。従
って、全体としての高速化が実現できることになる。
【0030】以上では、部分配列からサブ部分配列を抽
出してダイナミックプログラミング法を行う領域を決定
したが、部分配列からサブ部分配列を抽出せずに同様の
ことを行うことも可能である。この場合はRのビット積
が不要になる。これによって、スコア計算及びヒット判
定計算の量が低減し、より少ない計算時間でダイナミッ
クプログラミング法を行う領域の決定が行えるようにな
る。
【0031】しかし、データベース配列中から検索配列
に似た領域を探す際に、より多くのノイズ領域がヒット
してくる可能性が大きくなる。ノイズ領域がヒットすれ
ば、その分だけよけいにダイナミックプログラミング法
を行う必要が生じる。従って、サブ部分配列への分割を
行うかどうかは、使用するデータベースに応じて全体の
検索時間が小さくなるかどうかで決定すればよい。
【0032】
【発明の効果】本発明によれば、検索配列中に一定長k
の任意の文字配列が存在するか否かを表に記録した文字
成分表を用いて、データベース配列内の部分配列が持つ
文字成分がどの程度検索配列中の文字成分と一致するか
によって、ダイナミックプログラミング法を行う前にダ
イナミックプログラミング法を行う領域をデータベース
配列内で予め決定することが可能である。これによっ
て、データベース配列が検索配列よりも非常に長い場合
においても、データベース配列長に依存せず検索配列長
のみに依存した時間でダイナミックプログラミング法を
用いた検索が可能となり、全体として検索時間を低減さ
せることが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施例の構成を示す図。
【図2】検索DNA塩基配列から文字成分表を作成する方
法を示す図。
【図3】文字成分表を用いてダイナミックプログラミン
グ法領域を決定する方法のフローチャート。
【図4】データベース配列から部分配列を抽出する方法
を示す図。
【図5】部分配列からサブ部分配列を抽出する方法を示
す図。
【図6】サブ部分配列から文字成分表を用いてスコアを
計算する方法を示す図。
【図7】スコア判定条件、及び判定結果の登録方法を示
す図。
【符号の説明】
100…ディスプレイ、101…キーボード、102…中央制御
装置CPU、103…フロッピーディスクドライバ、104…フ
ロッピーディスク、105…文字配列、10…磁気ディス
ク、200…主メモリ、201…文字配列成分表作成登録プロ
グラム、202…ダイナミックプログラミング法領域決定
プログラム、203…ダイナミックプログラミング法実行
プログラム、204…データエリア、205…検索文字配列、
206…文字配列成分表、300…検索DNA塩基配列からの文
字配列成分の抽出ステップ、301…DNA塩基配列成分表作
成ステップ、400…データベース配列から部分配列の抽
出ステップ、401…部分配列からサブ部分配列の抽出ス
テップ、402…サブ部分配列を用いたスコアの計算ステ
ップ、403…ヒットサブ部分配列の同定ステップ、404…
ヒット部分配列の同定ステップ、405…DP領域の決定ス
テップ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G01N 33/68 (72)発明者 笠原 直子 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】長さの異なる二つの文字配列をダイナミッ
    クプログラミング法で比較する方法において、短い文字
    配列中の一定長文字配列成分を一定数以上含む長い文字
    配列中の領域を探索し、この領域にダイナミックプログ
    ラミング計算を限定することを特徴とする文字配列検索
    方法。
  2. 【請求項2】請求項1記載の文字配列比較方法におい
    て、長い文字配列の中でダイナミックプログラミング計
    算を行う領域を限定するステップが、短い文字配列中に
    一定長kの任意の文字配列が存在するか否かを表に記録
    した文字成分表を作成するステップと、長い文字配列中
    の一定長部分配列を長さkの互いに重ならない文字成分
    に分解し、それらの文字成分が該文字成分表中に記され
    た短い文字配列中の文字成分と一致する数をスコアとし
    て、該部分配列を長い文字配列内でスキャンし、該部分
    配列の中で一定のしきい値以上のスコアを持つ領域を含
    む領域を、ダイナミックプログラミング計算を行う領域
    とするステップから成ることを特徴とする文字配列検索
    方法。
  3. 【請求項3】請求項1記載の文字配列比較方法におい
    て、長い文字配列の中でダイナミックプログラミング計
    算を行う領域を限定するステップが、短い文字配列中に
    一定長kの任意の文字配列が存在するか否かを表に記録
    した文字成分表を作成するステップと、長い文字配列中
    の一定長部分配列内から出発点をずらして長さkの互い
    に重ならない文字成分に分解し、各出発点から得られた
    文字成分が該文字成分表中に記された短い文字配列中の
    文字成分と一致する数をスコアとして、該部分配列をデ
    ータベース配列内でスキャンし、全ての出発点に対して
    該部分配列の中で一定のしきい値以上のスコアを持つ領
    域を求め、この領域を含む領域をダイナミックプログラ
    ミング計算を行う領域とするステップから成ることを特
    徴とする文字配列検索方法。
JP6247507A 1994-10-13 1994-10-13 文字配列検索方法 Pending JPH08110910A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6247507A JPH08110910A (ja) 1994-10-13 1994-10-13 文字配列検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6247507A JPH08110910A (ja) 1994-10-13 1994-10-13 文字配列検索方法

Publications (1)

Publication Number Publication Date
JPH08110910A true JPH08110910A (ja) 1996-04-30

Family

ID=17164511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6247507A Pending JPH08110910A (ja) 1994-10-13 1994-10-13 文字配列検索方法

Country Status (1)

Country Link
JP (1) JPH08110910A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH105000A (ja) * 1996-06-27 1998-01-13 Hitachi Ltd Dnaアミノ酸配列比較方法
JPH1045795A (ja) * 1996-08-01 1998-02-17 Fujitsu Ltd 蛋白質データベース・システム並びに蛋白質の機能および機能部位の推定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH105000A (ja) * 1996-06-27 1998-01-13 Hitachi Ltd Dnaアミノ酸配列比較方法
JPH1045795A (ja) * 1996-08-01 1998-02-17 Fujitsu Ltd 蛋白質データベース・システム並びに蛋白質の機能および機能部位の推定方法

Similar Documents

Publication Publication Date Title
JP3672242B2 (ja) パターン検索方法、パターン検索装置、コンピュータプログラム及び記憶媒体
Pavesi et al. An algorithm for finding signals of unknown length in DNA sequences
US10453559B2 (en) Method and system for rapid searching of genomic data and uses thereof
US6633817B1 (en) Sequence database search with sequence search trees
CN107403075B (zh) 比对方法、装置及系统
CN111324750B (zh) 一种大规模文本相似度计算及文本查重方法
JP5183155B2 (ja) 大量配列の一括検索方法及び検索システム
KR20070083641A (ko) 전사 맵핑을 위한 유전자 식별 기호 분석방법
US20110295977A1 (en) Base sequence cluster generating system, base sequence cluster generating method, program for performing cluster generating method, and computer readable recording medium on which program is recorded and system for providing base sequence information
EP0889424A2 (en) Method and apparatus for estimating the number of distinct values in a database
CN108140071B (zh) 使用分级反向索引表的dna比对
US7085651B2 (en) Method and device for assembling nucleic acid base sequences
JP3370787B2 (ja) 文字配列検索方法
US20130041593A1 (en) Method for fast and accurate alignment of sequences
Wei et al. A branch elimination-based efficient algorithm for large-scale multiple longest common subsequence problem
US20080046187A1 (en) Method, system and software arrangement for detecting or determining similarity regions between datasets
US20040153307A1 (en) Discriminative feature selection for data sequences
JPH08110910A (ja) 文字配列検索方法
Wong et al. Predicting approximate protein-DNA binding cores using association rule mining
CN111814781A (zh) 用于对图像块识别结果进行校正的方法、设备和存储介质
KR100538451B1 (ko) 분산 컴퓨팅 환경에서의 유전자 및 단백질 유사서열 검색시스템 및 그 방법
JP3131142B2 (ja) 地図データリンケージシステム
Bell et al. Content based searching of gene expression databases using binary fingerprints of differential expression profiles
JPH05257982A (ja) 文字列認識方法
JP3534471B2 (ja) マージソート方法及びマージソート装置