JPH10334104A - Dna塩基配列比較方法 - Google Patents
Dna塩基配列比較方法Info
- Publication number
- JPH10334104A JPH10334104A JP10053102A JP5310298A JPH10334104A JP H10334104 A JPH10334104 A JP H10334104A JP 10053102 A JP10053102 A JP 10053102A JP 5310298 A JP5310298 A JP 5310298A JP H10334104 A JPH10334104 A JP H10334104A
- Authority
- JP
- Japan
- Prior art keywords
- amino acid
- acid sequence
- sequence
- matrix
- translated amino
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
る場合にも、翻訳アミノ酸配列を介在させて類似度の比
較が可能なDNA塩基配列比較方法を提供する。 【解決手段】 検索DNA塩基配列、データベースから
読み出したDNA塩基配列を各々アミノ酸配列に翻訳し
(304、306)、塩基、アミノ酸の挿入、欠失を考
慮して翻訳アミノ酸配列の間での類似度を算出し、動的
計画法によるスコア総計の演算(307)を実行し、比
較検索の結果得られた上位スコア総計を与える2つの翻
訳アミノ酸配列に対する、動的計画法による上位スコア
総計及び経路の演算(312)と、スコア総計の最大値
を与える経路のトレース演算(313)とを実行して、
翻訳アミノ酸配列間での並置結果をDNA塩基配列の並
置と併せて表示する。 【効果】 検索の感度が向上する。
Description
較方法、検索方法に関し、特にDNA塩基配列の間での
類似度を感度良く検出する方法、及びDNA塩基配列が
コードするアミノ酸配列の推定法に関する。
定し、DNA塩基配列によりコードされる蛋白質の機能
を解析する動きが盛んになっている。DNA塩基配列
は、4種類の塩基A、C、G、Tの配列であり、DNA
塩基配列の一部が各々生体で機能する蛋白質をコードし
ている。重要な機能を持つ蛋白質は薬剤の設計、開発等
に利用でき、DNA塩基配列がコードする蛋白質の機能
を正確に推定する技術が望まれている。実験的な蛋白質
の配列の決定よりも、一般的にDNA塩基配列の決定の
方が技術的に容易である。
ードされる蛋白質の機能の推定では、周知のコドン表
(3塩基単位(コドン単位))の各々に対応して、アミ
ノ酸への翻訳の開始点、アミノ酸への翻訳の終了点、ア
ミノ酸の種類が規定される)を使用して、DNA塩基配
列をアミノ酸配列(このアミノ酸配列から蛋白質配列が
得られる)に翻訳して、得られた蛋白質配列と機能が既
知である蛋白質に関するデータとを比較参照して、類似
しているか否かの判定を実行している。
んでいるエクソンの領域がアミノ酸に翻訳される領域で
ある。コドンからアミノ酸への翻訳は一意的に行なわ
れ、DNA塩基配列の翻訳方向と翻訳開始点が分かれ
ば、DNA塩基配列から3塩基づつを取り出して、DN
A塩基配列をアミノ酸の配列、即ち蛋白質に翻訳でき
る。しかし、DNA塩基配列に於いて、DNA塩基配列
に塩基の挿入、又は欠失による誤りが存在する場合に
は、DNA塩基配列のエクソンの領域がずれてしまう。
DNA塩基配列はコドン単位でアミノ酸に翻訳されるた
めに、塩基の挿入、又は欠失が存在する場合には、全く
異なるアミノ酸として翻訳されてしまうことがある。
つのDNA塩基配列をそれぞれアミノ酸配列に翻訳して
得る翻訳アミノ酸配列どうしを比較して実行するには、
各DNA塩基配列から翻訳アミノ酸配列を決定する必要
がある。
へ翻訳する際のDNA塩基配列に対する6種類の読み枠
を説明する図である((第1の従来技術):例えば、文
献1:バイオテクノロジー教科書シリーズ11「バイオ
テクノロジーのためのコンピュータ入門」、中村春木・
中井謙太共著、第66頁から67頁(1995年)(東
京:コロナ社))。
(1):DNA塩基配列の5’末端から順次コドン単位
でアミノ酸に翻訳するフレーム、フレーム(2):コド
ンの開始位置をフレーム(1)より順次1塩基ずらし(s
hift)てアミノ酸に翻訳するフレーム、フレーム
(3):コドンの開始位置をフレーム(1)の開始位置
より順次2塩基ずらしてアミノ酸に翻訳するフレーム、
フレーム(4):DNA塩基配列の相補鎖の5’末端か
ら順次コドン単位でアミノ酸への翻訳を開始するフレー
ム、フレーム(5):フレーム(4)の翻訳開始位置か
ら順次1塩基ずらしてアミノ酸への翻訳を開始するフレ
ーム、フレーム(6):フレーム(4)の翻訳開始位置
から順次2塩基ずらしてアミノ酸への翻訳を開始するフ
レームからなる。
末端から順次1塩基づつずらされ、フレーム(4)から
フレーム(6)はオリジナルのDNA塩基配列の相補鎖
の5’末端(オリジナルのDNA塩基配列の3’末端)
から順次1塩基づつずらされていくので、翻訳フレーム
は、フレーム(1)からフレーム(6)の6種類が存在
する。フレーム(1)からフレーム(6)に関して、D
NA塩基配列をアミノ酸配列に翻訳する。2つの各DN
A塩基配列に関して同種類のフレームを使用し翻訳され
て得られた翻訳アミノ酸配列の間で比較が行なわれ、合
計6種類の翻訳アミノ酸配列の間での比較が行なわれ
る。
してソースプログラムが公開されている、米国NIHの
組織であるNCBIのAltshulらにより開発され
たBLASTが広く知られている(例えば、文献1の第
141頁から143頁)。BLASTファミリーには、
DNA塩基配列どうしを比較するBLASTN、アミノ
酸配列どうしを比較するBLASTP、DNA塩基配列
を上記の6種類のフレームについて機械的に翻訳して得
られた6種類の翻訳アミノ酸配列の各々をアミノ酸配列
データベースを使用して検索するBLASTX、及び、
検索DNA塩基配列(Query DNA base
sequence)とDNA塩基配列のデータベースか
ら読み出したDNA塩基配列(Target DNA
basesequence)の第1、第2の各DNA塩
基配列を、上記の6種類のフレームについて各々機械的
に翻訳し、第1、第2の組の翻訳アミノ酸配列(各6種
類)の間での36種類の全ての組合せについて比較を行
なうTBLASTXがある。BLASTファミリーで
は、最初に、Query DNA base sequ
enceの一定長の塩基列とTarget DNA b
ase sequenceとの高速パターンマッチング
を行ない、Target DNA baseseque
nceに於ける検出された一定長の塩基列の位置を基に
して、Query DNA base sequenc
eと類似する領域を検出する。
uery DNA base sequenceとTa
rget DNA base sequenceの2つ
のDNA塩基配列の塩基を1塩基づつ比較して、塩基対
に応じたスコア(類似度)を付与して総計し、スコア
(類似度)総計が最大となる経路(アライメント、並
置)を探索する((第3の従来技術):例えば、文献
2:「Identification of Comm
on Molecular Subsequence
s」、ジャーナル・オブ・モレキュラー・バイオロジ
ー、147(1981)第195頁−197頁(J.M
ol.Biol、147(1981)pp195−19
7))。
列の間で動的計画法(ダイナミックプログラミング法を
使用して、塩基対の比較を行ない、2つのDNA塩基配
列の間でのスコアを求める。特定の注目するDNA塩基
配列(以下、検索DNA塩基配列(Query DNA
base sequence)、又は第1のDNA塩
基配列という)と類似するDNA塩基配列をDNA塩基
配列データベースから検索する際に、検索DNA塩基配
列(塩基数をMとする)を第1の軸(例えば、x軸)
に、DNA塩基配列データベースから読み出したDNA
塩基配列(塩基数をNとし、以下、Target DN
A base sequence、又は第2のDNA塩
基配列という)を第2の軸(例えば、y軸)に沿って、
5’末端より配列し、マトリックス(以下、本願発明で
はスコアマトリックスと呼ぶ。)を形成する(図2)。
較を行なう際のスコアの加算経路を説明する図である。
第1、第2のDNA塩基配列の間での塩基の対はスコア
マトリックス要素(i、j)(但し、i=1、2、…、
M、j=1、2、…、N)の位置で表される。
法)では、スコアマトリックス要素(i、j)に至る、
縦、横、斜めの3方向(図2に示す、a、b、c)での
移動経路(検索経路)を考え、iを1、2、→M、jを
=1、2、→Nと変化させて、図2に示す左上末端のス
コアマトリックス要素(1、1)から右下末端のスコア
マトリックス要素(M、N)の方向に向かって(i、
j)の位置を移動させて、第1のDNA塩基配列と第2
のDNA塩基配列の各塩基の間での最適な類似対応関係
を表わす、最適経路(最適アライメント、最適並置)を
求める。
(i、j)は、第1のDNA塩基配列のi番目の塩基ま
での塩基配列と第2のDNA塩基配列のj番目の塩基ま
での塩基配列との間における全体としての類似度(スコ
ア)の総計を表わす。図2に示す、a、b、cの各方向
の移動経路に対応して、類似度(スコア)の総計H
a(i、j)、Hb(i、j)、Hc(i、j)が、第1
のDNA塩基配列のi番目の塩基と第2のDNA塩基配
列のj番目の塩基との類似度を表わすスコアs(i、
j)と、ギャップペナルティスコアpと、及び、移動も
とのスコアマトリックス要素(i−1、j−1)、(i
−1、j)、(i、j−1)に於ける類似度(スコア)
の総計H(i−1、j−1)、H(i−1、j)、H
(i、j−1)を使用して、(数1)、(数2)、(数
3)により各々定義される。H(i、j)として、Ha
(i、j)、Hb(i、j)、Hc(i、j)のうちの最
大値((数4))を選ぶ。なお、上記のスコアs(i、
j)は、予め記憶されているスコアテーブルを使用して
決定でき、例えば、一致する1塩基の対に対するスコア
は4点、n塩基の挿入、又は欠失が存在する時のスコア
は(−8n−4)点、異なる1塩基の対に対するスコア
は(−3)点が設定されている。
ィスコアpは、第1のDNA塩基配列のi番目の塩基の
後の塩基の欠失の存在に対応し、移動経路cに於いて加
算されるギャップペナルティスコアpは、第2のDNA
塩基配列のj番目の塩基の後の塩基の欠失の存在に対応
する。
コアマトリックス要素(M、N)に向かう移動経路に沿
って、iを1、2、→M、jを=1、2、→Nと変化さ
せて、第1、第2のDNA塩基配列の比較を行ない、移
動経路に応じてスコア、又はギャップペナルティスコア
を加算して行き、第1のDNA塩基配列と第2のDNA
塩基配列との間での全体としての類似度(スコア)の総
計が最大となるH*=H(M、N)が求められ、この結
果、第1、第2のDNA塩基配列の間での類似性が最も
良くなる並べ方、即ち、第1のDNA塩基配列の各塩基
と、第2のDNA塩基配列の各塩基の最適な対応関係を
表わす最適並置(アラインメント)を求めることができ
る。
基配列の類似性の検討の他に、2つのアミノ酸配列の類
似性の検討にも使用できる。
では、DNA塩基配列に塩基の挿入、又は欠失が存在す
る場合には、塩基の挿入、又は欠失が存在する箇所でフ
レームシフトが起こり、このフレームシフトを起した位
置より後の塩基配列では、本来有するアミノ酸配列の類
似性を失ない、本来有するはずのアミノ酸配列を抽出で
きず検索もれを生じるという問題がある。6種類のフレ
ームのうち、例えば、一方のDNA塩基配列のフレーム
(1)で翻訳されたアミノ酸配列に非常に類似するアミ
ノ酸配列が、他方のDNA塩基配列の翻訳アミノ酸配列
に存在したとしても、DNA塩基配列の塩基の挿入、又
は欠失が存在する場合には、挿入、又は欠失が存在する
場所から後の塩基配列ではフレームの位置がフレーム
(2)、又は(3)に変更されてしまう。従来技術で
は、DNA塩基配列に於ける塩基の挿入、又は欠失によ
り生じる読み枠の位置に変更が生じる場合を考慮したD
NA塩基配列比較方法、検索方法は開示されていない。
を含むBLASTファミリーでは、計算の高速化を確保
するために、DNA塩基配列に於ける塩基、又はアミノ
酸配列に於けるアミノ酸の挿入、又は欠失によるギャッ
プを考慮していないため、検索もれが生じるという問題
がある。
の1つであるが、DNA塩基配列の1塩基毎に関して比
較を実行するため長時間を要するという問題がある。ま
た、第3の従来技術に第1の従来技術を組合せて、2つ
のDNA塩基配列(Query DNA base s
equenceとTarget DNA basese
quence)を各々アミノ酸配列に翻訳した後に、翻
訳アミノ酸配列どうしを比較する場合には、第1の従来
技術で説明した6種類フレームに対応して翻訳されて得
られた第1、第2のDNA塩基配列に関する翻訳アミノ
酸配列の組合せ(36種類)の各々に対して比較を実行
する必要があるために、更に検索時間を要するという問
題がある。
terman法を第1の従来技術と組合せた場合、アミ
ノ酸単位、又はDNA塩基配列のコドン単位での挿入又
は欠失を考慮できるが、DNA塩基配列に於けるコドン
単位の倍数以外の塩基単位での挿入又は欠失を考慮でき
ないという問題、従って、フレームの位置の変更を考慮
できないという問題点がある。
る、塩基の挿入、又は欠失が原因で生じる誤った検索結
果の発生を防止することは、考慮されていなかった。即
ち、塩基の挿入、又は欠失の存在を考慮してDNA塩基
配列をアミノ酸配列に翻訳することは考慮されていなか
った公知文献ではないが、特願平7−265157号
(文献3)には、第1、第2のDNA塩基配列を各々3
塩基づつに区分して第1、第2の中間DNA塩基配列を
生成し、第1、第2の中間DNA塩基配列をアミノ酸に
翻訳して第1、第2の翻訳アミノ酸配列を生成し、第1
のDNA塩基配列と第1の中間DNA塩基配列との間で
の第1の類似度と、第2のDNA塩基配列と第2の中間
DNA塩基配列との間での第2の類似度と、第1の翻訳
アミノ酸配列と第2の翻訳アミノ酸配列との間での第3
の類似度とを求め、第1、第2、第3の類似度から所定
の関数を使用して得られるパラメータが最大となるよう
に第1と第2の中間DNA塩基配列、及び第1と第2の
翻訳アミノ酸配列を選択する、DNA塩基配列比較方法
が開示されている。
67770号(文献4)には、検索DNA塩基配列(Q
uery DNA base sequence)を塩
基の挿入、又は欠失を考慮してアミノ酸に翻訳して得ら
れた翻訳アミノ酸配列と、アミノ酸データベースから読
み出したアミノ酸配列(Target aminoac
id sequence)とを、Smith−Wate
rman法に基づいて比較し、翻訳アミノ酸配列のi番
目のアミノ酸とTarget aminoacid s
equenceのj番目のアミノ酸との比較に於けるス
コア(類似度)を7種類の経路を考慮して評価して、翻
訳アミノ酸配列とTarget amino acid
sequenceとの置を行なう配列比較方法が開示
される。
於ける具体的な経路に関する技術は開示されていない。
更に、文献4に、検索DNA塩基配列をアミノ酸配列に
翻訳する際に、1、又は2塩基ずらしてコドンを切り出
してアミノ酸に翻訳する方法(本発明の第1の翻訳方法
に対応する)の開示があるが、後で詳細に説明する本発
明の第2、及び第3の翻訳方法の開示はない。また、文
献4には、検索DNA塩基配列から得られる翻訳アミノ
酸配列を、DNA塩基配列データベースから読み出され
たDNA塩基配列をアミノ酸に翻訳された翻訳アミノ酸
配列と比較する技術は開示されていない。
る塩基の挿入、及び欠失を考慮して、検索DNA塩基配
列(Query DNA base sequenc
e)、DNA塩基配列データベースから読み出されたD
NA塩基配列(TargetDNA base seq
uence)を、各々アミノ酸配列に翻訳することによ
り、翻訳アミノ酸配列を介在させて2つのDNA塩基配
列の間での比較を行ない、検索もれの少ないDNA塩基
配列比較方法を提供し、特にDNA塩基配列の間での類
似度を感度良く検出する方法、及び検索DNA塩基配列
がコードするアミノ酸配列の推定法を提供することにあ
る。
比較方法では、先ず、第1と第2のDNA塩基配列の間
での類似度を比較する際に、各DNA塩基配列を挿入、
又は欠失を含む3塩基毎に分割する。分割された各3塩
基をコドン表に基づいてアミノ酸に翻訳し、得られた第
1と第2の翻訳アミノ酸配列の間で、各アミノ酸配列で
のアミノ酸の挿入、及び欠失を考慮してアミノ酸どうし
の類似度を総計してスコア(類似度)総計を得る。類似
度の総計(スコア総計)が最大となる、第1と第2の翻
訳アミノ酸配列のアミノ酸どうしの組合せを求め、スコ
ア総計の最大値と、第1と第2の翻訳アミノ酸配列の並
置と、第1の翻訳アミノ酸配列に対応するDNA塩基配
列と第2の翻訳アミノ酸配列に対応するDNA塩基配列
との間での並置を得る。上記第1のDNA塩基配列とし
て検索DNA塩基配列(特定の注目するDNA塩基配
列、Query DNA base sequenc
e)を、上記第2のDNA塩基配列として、各種のDN
A塩基配列データベースから読み出した既知のDNA塩
基配列(Target DNA base seque
nce)を使用する。
る、DNA塩基配列からアミノ酸配列への翻訳方法で
は、第1、第2、及び第3の翻訳方法を組合せて使用す
る。
み出すフレームを、DNA塩基配列の末端から3塩基単
位で順次1塩基づつずらしながら、所定の翻訳規則に従
ってアミノ酸配列に翻訳する。
み出すフレームを、DNA塩基配列の末端から4塩基単
位で順次1塩基づつずらし、4塩基のうちの2番目の塩
基を挿入された塩基と見做して、4塩基のうちの残りの
3塩基を使用して、所定の翻訳規則に従ってアミノ酸配
列に翻訳する。
み出すフレームを、DNA塩基配列の末端から4塩基単
位で順次1塩基づつずらし、4塩基のうちの3番目の塩
基を挿入された塩基と見做して、4塩基のうちの残りの
3塩基を使用して、所定の翻訳規則に従ってアミノ酸配
列に翻訳する。
1、第2のDNA塩基配列から翻訳された第1、第2の
翻訳アミノ酸配列どうしの配列比較方法として、スコア
(類似度)総計を求める計算方法に動的計画法を用い
る。動的計画法に於ける演算では、第1、第2のDNA
塩基配列から上記の第1の翻訳方法によって各々翻訳さ
れた、第1、第2の翻訳アミノ酸配列で構成されるスコ
アマトリックスの要素(i、j)で表わされる第1の翻
訳アミノ酸配列のi番目のアミノ酸と第2の翻訳アミノ
酸配列のj番目のアミノ酸のスコア(類似度)を総計す
る際に、k≧1、m≧1を満たす整数、n≧2を満たす
整数とする時に、スコアマトリックス要素、(i−3、
j−3)、(i、j−3k)、(i−3k、j)、(i
−3n+1、j−3n)、(i−3n、j−3n+
1)、(i−3m、j−3m−1)、(i−3m−1、
j−3m)からの7つの経路を考慮する。k=1、m=
1、n=2の場合には、スコアマトリックス要素、(i
−3、j−3)、(i、j−3)、(i−3、j)、
(i−5、j−6)、(i−6、j−5)、(i−3、
j−4)、(i−4、j−3)からの経路を考慮するこ
とになる。但し、( )内の各要素は正の数とする。な
お、i≦M(Mは、第1の翻訳アミノ酸配列に於けるア
ミノ酸の数)、j≦N(Nは、第2の翻訳アミノ酸配列
に於けるアミノ酸の数)である。
使用して要約すると以下の通りである。検索DNA塩基
配列、データベースから読み出したDNA塩基配列を各
々アミノ酸配列に翻訳し(304、306)、塩基、ア
ミノ酸の挿入、欠失を考慮して翻訳アミノ酸配列の間で
の類似度を算出し、動的計画法によるスコア総計の演算
(307)を実行し、比較検索の結果得られた上位スコ
ア総計を与える2つの翻訳アミノ酸配列に対する、動的
計画法による上位スコア総計及び経路の演算(312)
と、スコア総計の最大値を与える経路のトレース演算
(313)とを実行して、翻訳アミノ酸配列間での並置
結果をDNA塩基配列の並置と併せて表示する。比較す
る2つのDNA塩基配列に挿入、欠失が存在する場合に
も、翻訳アミノ酸配列を介在させてDNA塩基配列間で
の類似度の比較は可能となり、検索の感度が向上する。
スを使用して、検索DNA塩基配列(問い合わせのDN
A塩基配列)に対する検索を実行する例をとって説明す
る。
の例を説明するフロー図である。図3を使用して、本発
明の実施例のDNA塩基配列比較方法の概要を説明す
る。先ず、(工程301)から(工程304)を実行す
る。
表わすスコアテーブルを入力する。
ースを検索した結果、出力装置に出力表示する、上位ス
コア総計を持つ検索結果の出力数を入力する。
uery DNA base sequence)を入
力する。
検索DNA塩基配列の相補鎖配列を、後で説明する第
1、第2、第3の各翻訳方法により、アミノ酸配列に翻
訳して翻訳アミノ酸配列A1、A2、A3、A4、A5、A6
を得る。
列から第1の翻訳方法により翻訳される。翻訳アミノ酸
配列A2は検索DNA塩基配列の相補鎖配列から第1の
翻訳方法により翻訳される。翻訳アミノ酸配列A3は検
索DNA塩基配列から第2の翻訳方法により翻訳され
る。翻訳アミノ酸配列A4は検索DNA塩基配列から第
3の翻訳方法により翻訳される。翻訳アミノ酸配列A5
は検索DNA塩基配列の相補鎖配列から第2の翻訳方法
により翻訳される。翻訳アミノ酸配列A6は検索DNA
塩基配列の相補鎖配列から第3の翻訳方法により翻訳さ
れる。
み出された全てのDNA塩基配列(Target DN
A base sequence)に対して、以下の
(工程305)から(工程308)を実行する。
ースからDNA塩基配列(Target DNA ba
se sequence)を読み出す。
配列、及び読み出されたDNA塩基配列の相補鎖配列
を、後で説明する第1、第2、第3の各翻訳方法によ
り、アミノ酸配列に翻訳して翻訳アミノ酸配列B1、
B2、B3、B4、B5、B6を得る。
A塩基配列から第1の翻訳方法により翻訳される。翻訳
アミノ酸配列B2は読み出されたDNA塩基配列の相補
鎖配列から第1の翻訳方法により翻訳される。翻訳アミ
ノ酸配列B3は読み出されたDNA塩基配列から第2の
翻訳方法により翻訳される。翻訳アミノ酸配列B4は読
み出されたDNA塩基配列から第3の翻訳方法により翻
訳される。翻訳アミノ酸配列B5は読み出されたDNA
塩基配列の相補鎖配列から第2の翻訳方法により翻訳さ
れる。翻訳アミノ酸配列B6は読み出されたDNA塩基
配列の相補鎖配列から第3の翻訳方法により翻訳され
る。
程(306)で得られた4種類の翻訳アミノ酸配列の組
合せ、即ち、(a)翻訳アミノ酸配列A1とB1の組合
せ、(b)翻訳アミノ酸配列A1とB2の組合せ、(c)
翻訳アミノ酸配列A2とB1の組合せ、(d)翻訳アミノ
酸配列A2とB2の組合せ、の4種の組合せに対して、翻
訳アミノ酸配列どうしの類似度の総計を、動的計画法に
より各々算出する。
上位スコア総計を持つDNA塩基配列を選択し、上位ス
コア総計を持つDNA塩基配列の情報をDNA塩基配列
データベースから読み出して記憶しておく。
み出された全てのDNA塩基配列に対して、以下の(工
程305)から(工程308)を実行した後に、(工程
309)から(工程311)を実行する。
の値の大きい方から並べて、検索結果の出力数に対応す
る上位スコア総計をソートする。
NA塩基配列を、ディスプレイ(図18の403)に表
示する。この時、上位スコア総計を持つDNA塩基配列
をハードディスク等の外部記憶装置(図18の404)
に出力しても良い。
された上位スコア総計から判断して、並置結果の表示を
行なうことが望ましいと考えられる検索比較結果の数
(並置結果の出力数)を入力する。
(Target DNA basesequenc
e))の全てについて、(工程312)から(工程31
4)を実行する。
総計及び経路を演算する。
のトレースを演算することにより、検索DNA塩基配列
とDNA塩基配列データベースのDNA塩基配列から得
られた2つの翻訳アミノ酸配列の間での並置結果と、各
翻訳アミノ酸配列に対応するDNA塩基配列の間での並
置結果を得る。
た並置結果をディスプレイ(図18の403)に表示す
る。同時にハードディスク等の外部記憶装置(図18の
404)に出力しても良い。
た、アミノ酸の対に付与するスコアを規定する従来技術
のテーブルの一例である、Blosum62を示す図で
ある。図4の横軸、及び縦軸に示す、A、R、N、…、
W、Y、Vは、アミノ酸の略号である。記号「B(As
*)」は、Asn、又はAspの何れかであることを示
し、記号「Z(Gl*)」は、Gln、又はGluの何
れかであることを示し、記号「X(***)」は、翻訳
不能か不明のアミノ酸を示し、号「O(Stp)」は、
終了コドンを示す。
存在することを考慮した、検索DNA塩基配列、DNA
塩基配列データベースから読み出されたDNA塩基配列
の各塩基配列を、各々アミノ酸配列に翻訳する方法
((工程304)、(工程306)について説明する。
位)の各々に対応して、アミノ酸への翻訳の終止、アミ
ノ酸の種類を規定する、従来技術のコドン表を示す図で
ある。( )内の記号は1文字表記のアミノ酸の略号を
示す。図5に従って、DNA塩基配列は3塩基単位(コ
ドン)毎に1種類のアミノ酸にコードされる。
塩基配列をアミノ酸配列に翻訳するする第1の翻訳方法
を説明する図である。第1の翻訳方法では、DNA塩基
配列の5’末端からコドン(3塩基)を切り出して図5
に従ってアミノ酸に翻訳し、次に、1塩基ずらしてコド
ンを切り出して図5に従ってアミノ酸に翻訳する。以下
同様に、1塩基づつずらして翻訳を続け、切り出された
コドンの最後の塩基が、DNA塩基配列の3’末端の最
後の塩基と一致するまで繰り返し、DNA塩基配列をア
ミノ酸配列に翻訳して、翻訳アミノ酸配列A1、又はB1
を得る。DNA塩基配列の相補鎖配列についても同様に
図5に従ってアミノ酸配列に翻訳して、翻訳アミノ酸配
列A2、又はB2を得る。この結果、第1の翻訳方法を使
用して合計2種類の翻訳アミノ酸配列(A1、A2;又
は、B1、B2)が得られる。
して、ATGCC、…、CGATを選んでおり、5’末
端からコドンATGを切り出して図5に従ってアミノ酸
Mに翻訳し、1塩基ずらしてコドンTGCを切り出して
図5に従ってアミノ酸Cに翻訳し、以下同様に、1塩基
づつずらしてコドンGCC、…、CGA、GATを切り
出して、アミノ酸A、…、R、Dに翻訳する。この結果
得られる翻訳アミノ酸配列は、MCA、…、RDとな
る。図6に示すように、DNA塩基配列の相補鎖配列A
TCG、…、GGCATについても同様に図5に従って
アミノ酸配列に翻訳して、翻訳アミノ酸配列として、I
S、…、GAHを得る。
塩基配列をアミノ酸配列に翻訳する第2、第3の翻訳方
法を説明する図である。
5’末端から4塩基を切り出し、2番目の塩基を挿入と
見做して、残りの3塩基(第1の補正DNA塩基配列)
を使用して図5に従ってアミノ酸に翻訳する。次に、1
塩基ずらして同様の翻訳を図5に従って行ない、切り出
した4塩基の最後の塩基が、DNA塩基配列の3’末端
の最後の塩基に一致するまで、翻訳を繰り返し、DNA
塩基配列をアミノ酸配列に翻訳して、翻訳アミノ酸配列
A3、又はB3を得る。
5’末端から4塩基を切り出し、3番目の塩基を挿入と
見做して、残りの3塩基(第2の補正DNA塩基配列)
を使用して図5に従ってアミノ酸に翻訳する。次に、1
塩基ずらして同様の翻訳を図5に従って行ない、切り出
した4塩基の最後の塩基が、DNA塩基配列の3’末端
の最後の塩基に一致するまで、翻訳を繰り返し、DNA
塩基配列をアミノ酸配列に翻訳して、翻訳アミノ酸配列
A4、又はB4を得る。
して、第2、第3の翻訳方法を適用して、図示しない翻
訳アミノ酸配列A5、又はB5;及びA6、又はB6を得
る。この結果、第2の翻訳方法を使用して合計4種類の
翻訳アミノ酸配列(A3、A5;又は、B3、B5)が得ら
れ、第3の翻訳方法を使用して合計4種類の翻訳アミノ
酸配列(A4、A6;又は、B4、B6)が得られる。
C、…、CGATであるので、第2、第3の翻訳方法に
従ってアミノ酸配列に翻訳する際、先ず、5’末端から
ATGCの4塩基を切り出し、2番目の塩基Tを挿入と
見做したAGC(第1の補正DNA塩基配列)、及び3
番目の塩基Gを挿入と見做したATC(第2の補正DN
A塩基配列)を、図5に従って各々アミノ酸S、Iに翻
訳する。次に1塩基ずらしたTGCCの4塩基から得ら
れるTCC(第1の補正DNA塩基配列)、TGC(第
2の補正DNA塩基配列)を図5に従ってアミノ酸S、
Cに翻訳する。以下同様にして、1塩基づつずらしなが
ら翻訳を続けて、DNA塩基配列から翻訳アミノ酸配列
を得る。この結果得られる、翻訳アミノ酸配列は、S
S、…、Hであり、翻訳アミノ酸配列は、IC、…、R
である。更に、図7に示すDNA塩基配列の相補鎖AT
CG、…、GGCATを、同様にして、第2、第3の翻
訳方法に従ってアミノ酸配列に翻訳して、図7に図示し
ない翻訳アミノ酸配列を得る。
総計を算出するための動的計画法によるスコア総計を求
める(工程307)について詳しく説明する。
aterman法に基づくDNA塩基配列の比較を行な
うスコアマトリックスを変更して、アミノ酸配列の比較
を行なうスコアマトリックスを構成し、図4に示すアミ
ノ酸の対に対して規定されるスコアテーブルを使用し
て、比較すべき2つの翻訳アミノ酸配列の間でのアミノ
酸の対の類似度を求めて、類似度の総計を評価する。
(工程304)で得た翻訳アミノ酸配列A1、A2、
A3、A4、A5、A6、及び(工程306)で得た翻訳ア
ミノ酸配列B1、B2、B3、B4、B5、B6を使用して、
翻訳アミノ酸配列どうしの類似度の総計を動的計画法に
より算出する。
翻訳アミノ酸配列(A1、又はA2)を、第2の軸(例え
ば、y軸)に沿って第2の翻訳アミノ酸配列(B1、又
はB2)を、第1、第2の翻訳アミノ酸配列の各々の塩
基配列の5’末端より配列して、マトリックス要素
(i、j)の値H(i、j)が、第1の翻訳アミノ酸配
列のi番目のアミノ酸までのアミノ酸配列と、第2の翻
訳アミノ酸配列のj番目のアミノ酸までのアミノ酸配列
との間における類似度の総計を表わす、スコアマトリッ
クスHを構成する。第1の軸に沿って第1、第3、第
5、第7、又は第9の翻訳アミノ酸配列(A1、、A2、
A3、A4、A5、A6の何れか)を、第2の軸に沿って第
2、第4、第6、第8、又は第10の翻訳アミノ酸配列
(B1、B2、B3、B4、B5、B6の何れか)を、翻訳ア
ミノ酸配列の各々の塩基配列の5’末端より配列して、
アミノ酸の対のスコア(類似度)を表わす第1、第2、
第3、第4、第5のマトリックス(s1(i、j)〜s5
(i、j))を構成する。翻訳アミノ酸配列A1、A2、
A3、A4、A5、A6と、翻訳アミノ酸配列B1、B2、B
3、B4、B5、B6との組合せにより形成される、5つの
マトリックスからなる第1から第4のマトリックス群を
形成する。5つの各マトリックスに於ける第1、及び第
2の軸に沿って配列される翻訳アミノ酸配列をAi、及
びBjとし、簡単ために配列(Ai、Bj)により各マト
リックスに於ける第1、及び第2の軸に沿って配列され
る翻訳アミノ酸配列を表わす。
び第5の翻訳アミノ酸配列をA1、第7の翻訳アミノ酸
配列をA3、第9の翻訳アミノ酸配列をA4とし、第2、
第第8、及び第10の翻訳アミノ酸配列をB1とし、第
4の翻訳アミノ酸配列をB3、第6の翻訳アミノ酸配列
をB4として、配列(A1、B1)を持つスコアマトリッ
クスHと、配列(A1、B1)を持つ第1のマトリックス
s1と、配列(A1、B3)を持つ第2のマトリックスs2
と、配列(A1、B4)を持つ第3のマトリックスs
3と、配列(A3、B1)を持つ第4のマトリックスs
4と、配列(A4、B1)を持つ第5のマトリックスs5と
からなる。
び第5の翻訳アミノ酸配列をA1、第7の翻訳アミノ酸
配列をA3、第9の翻訳アミノ酸配列をA4とし、第2、
第第8、及び第10の翻訳アミノ酸配列をB2とし、第
4の翻訳アミノ酸配列をB5、第6の翻訳アミノ酸配列
をB6として、配列(A1、B2)を持つスコアマトリッ
クスHと、配列(A1、B2)を持つ第1のマトリックス
s1と、配列(A1、B5)を持つ第2のマトリックスs2
と、配列(A1、B6)を持つ第3のマトリックスs
3と、配列(A3、B2)を持つ第4のマトリックスs
4と、配列(A4、B2)を持つ第5のマトリックスs5と
からなる。
び第5の翻訳アミノ酸配列をA2、第7の翻訳アミノ酸
配列をA5、第9の翻訳アミノ酸配列をA6とし、第2、
第第8、及び第10の翻訳アミノ酸配列をB1とし、第
4の翻訳アミノ酸配列をB3、第6の翻訳アミノ酸配列
をB4として、配列(A2、B1)を持つスコアマトリッ
クスHと、配列(A2、B1)を持つ第1のスコアマトリ
ックスs1と、配列(A2、B3)を持つ第2のスコアマ
トリックスs2と、配列(A2、B4)を持つ第3のスコ
アマトリックスs3と、配列(A5、B1)を持つ第4の
スコアマトリックスs4と、配列(A6、B1)を持つ第
5のスコアマトリックスs5とからなる。
び第5の翻訳アミノ酸配列をA2、第7の翻訳アミノ酸
配列をA5、第9の翻訳アミノ酸配列をA6とし、第2、
第第8、及び第10の翻訳アミノ酸配列をB2とし、第
4の翻訳アミノ酸配列をB5、第6の翻訳アミノ酸配列
をB6として、配列(A2、B2)を持つスコアマトリッ
クスHと、配列(A2、B2)を持つ第1のマトリックス
s1と、配列(A2、B5)を持つ第2のマトリックスs2
と、配列(A2、B6)を持つ第3のマトリックスs
3と、配列(A5、B2)を持つ第4のマトリックスs
4と、配列(A6、B2)を持つ第5のマトリックスs5と
からなる。
ミノ酸配列の比較を行なう際のスコアの加算経路を説明
する図である。
用して、各マトリックス群毎に動的計画法により、スコ
アマトリックス要素(i、j)に至る、図8に示す経路
〜の9方向での移動経路(検索経路)を考え、iを
1、2、→M(スコアマトリックの第1軸に配列される
アミノ酸配列を構成するアミノ酸の数)、jを=1、
2、→N(スコアマトリックの第2軸に配列されるアミ
ノ酸配列を構成するアミノ酸の数)と変化させて、図8
に示す左上末端のスコアマトリックス要素(1、1)か
ら右下末端のスコアマトリックス要素(M、N)の方向
に向かって(i、j)の位置を移動させて、第1の翻訳
アミノ酸配列と第2のアミノ酸配列の各アミノ酸の間で
の最適な類似対応関係を表わす、最適経路(最適アライ
メント、最適並置)を求める。
(i、j)は、第1の翻訳アミノ酸配列のi番目のアミ
ノ酸までのアミノ酸配列と第2の翻訳アミノ酸配列のj
番目のアミノ酸までのアミノ酸配列との間における全体
としての類似度(スコア)の総計を表わす。
ら点(i、j)向かう9方向の移動経路(から)に
対応して、類似度(スコア)の総計H(i、j)とし
て、H1(i、j)からH11(i、j)のうちの最大値
((数16))を選ぶ。なお、スコアs1(i、j)か
らs5(i、j)を求めるには、図4に示すスコアテー
ブルを使用する。H1(i、j)からH11(i、j)
は、第1の軸に配列されたアミノ酸配列のi番目のアミ
ノ酸と第2の軸に配列されたアミノ酸配列のj番目のア
ミノ酸との類似度を表わすスコアs1(i、j)〜スコ
アs5(i、j)と、ギップペナルティスコアwa、wn
と、及び、移動もとのスコアマトリックス要素の値H
(i−3、j−3)、H(i−3、j)、H(i、j−
3)、H(i−5、j−6)、H(i−6、j−5)、
H(i−3、j−4)、H(i−4、j−3)、H(i
−6、j−7)、H(i−7、j−6)を使用して、
(数5)から(数15)により各々定義される。
及びH9(i、j)の第1項の(i−6、j−7)と
(i、j)との位置関係を示す。図11、図12は、H
10(i、j)、及びH11(i、j)の第1項の(i−
7、j−6)と(i、j)との関係を示す。図9、及び
図10に於ける点(i−3、j−4)は、スコアs4を
求める点、図11、及び図12に於ける点(i−4、j
−3)は、スコアs5を求める点を示す。
j)への移動経路に対応する。
への移動経路に対応する。
への移動経路に対応する。
j)への移動経路に対応する。
j)への移動経路に対応する。
j)への移動経路に対応する。
j)への移動経路に対応する。
7)から点(i、j)への移動経路を含む。
6)から点(i、j)への移動経路を含む。
DNA base sequence(A*とする))
のi番目のコドン(3塩基)である。B* jは、第2の翻
訳アミノ酸配列(Target DNA base s
equence(B*とする))のj番目のコドン(3
塩基)である。aiはA*のi番目の塩基、bjはB*のj
番目の塩基である。(数17)から(数21)の右辺
は、コドン間のスコアを示すので、各コドンを図5に従
ってアミノ酸に翻訳して、図4のスコアテーブルを使用
して決定できる。
ックス群を独立に使用して、各マトリックス群毎に動的
計画法により、第1の翻訳アミノ酸配列と第2のアミノ
酸配列の各アミノ酸の間での最適な類似対応関係を表わ
す、最適経路(最適アライメント、最適並置)を求め
る。
配列の塩基の挿入、欠失に伴うギャップペナルティを表
わす。本実施例では、wa=wn=−12とした。また、
アミノ酸の挿入、欠失が連続して出現する場合には、1
回目の出現では、wa=−12として、2回目以降の出
現では、wa=−4とした。
よるスコア総計及び経路を演算する(工程312)、及
びスコア総計の最大値を与える経路をトレースする演算
を実行する(工程313)について詳細に説明する。
とDNA塩基配列データベースのDNA塩基配列から得
られた、上位スコア総計を与える2つのアミノ酸配列に
対して、(工程307)と同様の演算を行ない動的計画
法によるスコア総計を求める。但し、類似度(スコア)
の総計の他に、スコアマトリックスの各要素に対して、
(数5)から(数16)により表わされる何れの演算経
路が選択されたかの情報、及び類似度(スコア)の総計
の最大値を与える移動経路を、スコアマトリックスの要
素の最終点の位置(i、j)として記憶しておく。
いて記憶された類似度の総計の最大値を与えるスコアマ
トリックスの要素の最終点の位置(i、j)から、各要
素で記憶されている演算経路を逆にトレースして、類似
度(スコア)の総計の最大値を与える翻訳アミノ酸配列
の間での並置結果を得ることができる。
計画法の演算での9種類の方向の各移動経路に対応する
並置結果の一般例を示す図である。
計画法の演算での9種類の方向の各移動経路に対応する
並置結果の具体例を示す図である。
行は第1のDNA塩基配列、第2行は第1のDNA塩基
配列から翻訳された翻訳アミノ酸、第3行は第2のDN
A塩基配列から翻訳された翻訳アミノ酸、第4行は第2
のDNA塩基配列を表わす。また、記号「−」は、配
列、又はアミノ酸配列の欠失を表わし、記号「*」は、
塩基の欠失、又はa、c、g、tの何れとも決定されて
ていない不定のnの存在により翻訳不能のアミノ酸を表
わす。
明する。DNA塩基配列の公共データベースであるGe
nBankのESTデータベースに登録されている、シ
ロイヌナズナ(arabidopsis thalia
na)に関する検索塩基配列(Query seque
nce)を選び、ESTデータベースに登録されてい
る、ライス(oriza sativa)由来の全配列
を比較検索の対象(Target sequence)
とした。ESTデータベースに登録されているDNA塩
基配列は、DNAシーケンサの出力結果をそのまま登録
しているため、一定量のシーケンスエラーを含んでお
り、比較する2つのDNA塩基配列に存在する塩基の挿
入、及び欠失を考慮に入れ、アミノ酸配列を介在させて
比較を行なう本発明の有効性を確認する好適な例であ
る。
例の比較検索で得られた並置結果例を示す図である。以
下、比較検索を行なった結果について説明する。図1
5、図16、図17に於いて、Query seque
nceの欄には、検索DNA塩基配列に付けられた名
称、及び簡単な説明が記載され、Target seq
uenceの欄には、比較検索により抽出されたEST
データベースからのDNA塩基配列に付けられた名称、
及び簡単な説明が記載されている。Scoreの欄に
は、類似度(スコア)の総計が記載され、その他、Qu
ery、及びTargetの長さ、並置されるQuer
y、及びTarget領域が記載されている。
段から、検索DNA塩基配列(Query seque
nce)と検索DNA塩基配列から翻訳された翻訳アミ
ノ酸配列が記載され、並値結果を表わすTarget
sequenceの欄には、下段から比較検索により抽
出されたDNA塩基配列とこのDNA塩基配列から翻訳
された翻訳アミノ酸配列が記載されている。
の欄のDNA塩基配列、翻訳アミノ酸配列は、各々配列
番号1、2により示され、並値結果を表わすTarge
tの欄の翻訳アミノ酸配列、DNA塩基配列は、各々配
列番号3、4により示される。図16に示す並値結果を
表わすQueryの欄のDNA塩基配列、翻訳アミノ酸
配列は、各々配列番号5、6により示され、並値結果を
表わすTargetの欄の翻訳アミノ酸配列、DNA塩
基配列は、各々配列番号7、8により示される。図17
に示す並値結果を表わすQueryの欄のDNA塩基配
列、翻訳アミノ酸配列は、各々配列番号9、10により
示され、並値結果を表わすTargetの欄の翻訳アミ
ノ酸配列、DNA塩基配列は、各々配列番号11、12
により示される。
上下段の翻訳アミノ酸配列を結ぶ、記号「:」は、対応
する翻訳アミノ酸が一致することを示し、記号「.」
は、対応するアミノ酸の間の対に対応するスコアマトリ
ックスの値が正であること示す。記号「 」(ブラン
ク)は、対応するアミノ酸の間の対に対応するスコアマ
トリックスの値が、0又は負であること示す。記号
「−」は、塩基、又はアミノ酸配列の欠失を示す。記号
「n」は、a、c、g、tの何れとも決定されておらず
不定であることを示す。記号「*」は、塩基の欠失、又
は不定のnの存在により翻訳不能のアミノ酸を表わす。
c、d、eに関して以下説明する。領域b、b’は、ア
ミノ酸の挿入、又は欠失、即ち(数6)、又は(数7)
に対応する結果を最適経路に含むことを示す。領域c
は、塩基の欠失、即ち(数8)、又は(数9)を含むこ
とを示す。領域d、eは、塩基の挿入に相当し、領域d
は(数10)、又は(数11)に対応する結果を最適経
路に含むことを示し、領域eは、(数12)〜(数1
5)の何れかに対応する結果を最適経路に含むことを示
す。
みが、従来技術のTBLASTXを適用して得られた領
域である。本発明の方法では、従来技術のTBLAST
Xを適用して得られない領域に関して、翻訳アミノ酸配
列を介して2つの塩基配列に関する類似関係に関する情
報が得られる。特に、図16に示す結果例を、従来技術
のTBLASTXによる結果と比較すると、本願発明の
結果の方が、連続したより広い領域での類似関係に関す
る情報が得られている。特に、図17に示す例では、本
発明の方法では、従来技術のTBLASTXによる方法
よりも3倍長い領域での類似関係に関する情報が得られ
ている。
A塩基配列の塩基の挿入、欠失を全て考慮しているた
め、より高い類似度(スコアの総計が大きい)で、塩基
配列の広い領域にわたって比較、検索を行なうことがで
き、塩基配列の広い領域での並置結果を得ることができ
る。この結果、DNA塩基配列がコードしているアミノ
酸配列に関して、より完全な配列を得ることが可能とな
る。DNA塩基配列がコードしている蛋白質のアミノ酸
配列を知ることは、遺伝子の生物学的機能の解析を進め
る上での第1歩となる。現在、利用可能なアミノ酸配列
データベースのデータ数はDNA塩基配列データベース
と比較するとはるかに少なく、測定の結果得られたDN
A塩基配列から本発明の方法により、アミノ酸配列を介
在させてアミノ酸配列に関する情報を知ることは、蛋白
質の機能の解析に有用な情報を与える。
法が実施される装置の構成を示す図である。本発明のD
NA塩基配列比較方法が実行される装置は、上記の第1
と第2のDNA塩基配列を入力する装置401と、DN
A塩基配列からアミノ酸配列へ翻訳する翻訳プログラ
ム、上記の第1と第2の翻訳アミノ酸配列の配列比較プ
ログラム、第1と第2の翻訳アミノ酸配列どうしの並
置、及び第1と第2の翻訳アミノ酸配列に各々対応する
DNA塩基配列の並置を実行するプログラムを内蔵する
演算処理装置402と、類似度の総計の最大値と第1と
第2の翻訳アミノ酸配列の並置結果、及び第1と第2の
翻訳アミノ酸配列に各々対応するDNA塩基配列の並置
結果を出力する出力装置403と、各種のDNA塩基配
列データベース、各種のアミノ酸配列データベース、ス
コアテーブル、コドン表等を記憶格納する外部記憶装置
404とを含んでいる。
発明は、(A)(1)第1、及び第2のDNA塩基配列
を、3塩基長の塩基群に各々分割し、各塩基群をアミノ
酸に翻訳して、第1、及び第2のアミノ酸配列を求める
工程と、(2)第1、及び第2のDNA塩基配列に於け
る塩基の挿入、欠失、及び、第1、及び第2の翻訳アミ
ノ酸配列に於けるアミノ酸の挿入、及び欠失を各々考慮
して、第1の翻訳アミノ酸配列と第2の翻訳アミノ酸配
列に於ける各アミノ酸の配列の比較の結果得られる類似
度を総計して、類似度の総計が最大となるような、第
1、及び第2の翻訳アミノ酸配列の各アミノ酸どうしの
対応関係を求める工程と、(3)類似度の総計の最大値
と、第1と第2の翻訳アミノ酸配列との並置と、第1の
翻訳アミノ酸配列と第1のDNA塩基配列との間の並置
と、第2の翻訳アミノ酸配列と第2のDNA塩基配列と
の間の並置とを出力する工程とを有し、工程(1)は、
第1、及び第2のDNA塩基配列を各々、(I)末端か
ら3塩基の単位で順次1塩基づつずらしながらアミノ酸
配列に翻訳すること、(II)末端から4塩基の単位で
順次1塩基づつずらし、4塩基のうちの2番目の塩基を
除く4塩基のうちの残りの3塩基をアミノ酸配列に翻訳
すること、(III)末端から4塩基の単位で順次1塩
基づつずらし、4塩基のうちの3番目の塩基を除く4塩
基のうちの残りの3塩基をアミノ酸配列に翻訳するこ
と、を含み、第1と第2のDNA塩基配列の間の類似度
を比較するDNA塩基配列比較方法に特徴がある。
整数、n≧2を満たす整数とし、i≦M(Mは、第1の
翻訳アミノ酸配列に於けるアミノ酸の数)、j≦N(N
は、第2の翻訳アミノ酸配列に於けるアミノ酸の数)と
する時、工程(2)に於いて、第1の翻訳アミノ酸配列
の各アミノ酸を順次第1の軸の方向に配列し、第2の翻
訳アミノ酸配列の各アミノ酸を順次第2の軸の方向に配
列して得られるマトリックスを形成し、第1の翻訳アミ
ノ酸配列のi番目のアミノ酸と、第2の翻訳アミノ酸配
列のj番目のアミノ酸との対の位置を表わす、マトリッ
クスの要素(i、j)に於ける類似度を総計を求める際
に、マトリックスの要素(i、j)に至る、マトリック
スの要素、(i−3、j−3)、(i、j−3k)、
(i−3k、j)、(i−3n+1、j−3n)、(i
−3n、j−3n+1)、(i−3m、j−3m−
1)、(i−3m−1、j−3m)の7つの経路のうち
から、類似度の総和が最大となるように何れかの経路を
選ぶことに特徴がある。
第2のDNA塩基配列を、3塩基長の塩基群に各々分割
し、各塩基群をアミノ酸に翻訳して、第1、及び第2の
アミノ酸配列を求める工程と、(2)第1、及び第2の
DNA塩基配列に於ける塩基の挿入、欠失、及び、第
1、及び第2の翻訳アミノ酸配列に於けるアミノ酸の挿
入、及び欠失を各々考慮して、第1の翻訳アミノ酸配列
と第2の翻訳アミノ酸配列に於ける各アミノ酸の配列の
比較の結果得られる類似度を総計して、類似度の総計が
最大となるような、第1、及び第2の翻訳アミノ酸配列
の各アミノ酸どうしの対応関係を求める工程と、(3)
類似度の総計の最大値と、第1と第2の翻訳アミノ酸配
列との並置と、第1の翻訳アミノ酸配列と第1のDNA
塩基配列との間の並置と、第2の翻訳アミノ酸配列と第
2のDNA塩基配列との間の並置と出力する工程とを有
し、第1と第2のDNA塩基配列の間の類似度を比較す
るDNA塩基配列比較方法に特徴がある。
のDNA塩基配列を、第1のDNA塩基配列の相補鎖塩
基配列に置き換え、第2のDNA塩基配列を、第2のD
NA塩基配列の相補鎖塩基配列に置き換えて、工程
(1)、(2)、(3)を行なう工程を有することに特
徴を有する。
するDNA塩基配列の間での類似度の比較が可能となる
ため、類似度の比較の際に使用するスコアテーブルに、
アミノ酸の一致、不一致の他に、アミノ酸の親水性、又
は疎水性等の化学的特性や、アミノ酸の大きさ等の物理
的特性を反映させておくことにより、きめの細かい比較
が可能となり、DNA塩基配列間の類似度検索の感度が
向上する。
入、欠失、及び翻訳アミノ酸配列中のアミノ酸の挿入、
欠失を考慮した比較が実現できるため、検索もれを少な
くできる。
酸配列へ翻訳する際のDNA塩基配列に対する6種類の
読み枠を説明する図。
使用して、DNA塩基配列の比較を行なう際のスコアの
加算経路を説明する図。
るフロー図。
対に付与するスコアを規定する従来技術のテーブルの一
例を示す図。
対応して、アミノ酸への翻訳の終止、アミノ酸の種類を
規定する、従来技術のコドン表を示す図。
ミノ酸配列に翻訳する第1の翻訳方法を説明する図。
ミノ酸配列に翻訳する第2、第3の翻訳方法を説明する
図。
比較を行なう際のスコアの加算経路を説明する図。
3、j−4)を求める点(i−3、j−4)を示す図。
3、j−4)を求める点(i−3、j−4)を示す図。
4、j−3)を求める点(i−4、j−3)を示す図。
4、j−3)を求める点(i−4、j−3)を示す図。
での9種類の方向の各移動経路に対応する並置結果の一
般例を示す図。
での9種類の方向の各移動経路に対応する並置結果の具
体例を示す図。
果例を示す図。
果例を示す図。
果例を示す図。
る装置の構成を示す図。
結果の出力数を入力する工程、303…検索DNA塩基
配列を入力する工程、304…検索DNA塩基配列をア
ミノ酸配列に翻訳する工程、305…DNA塩基配列を
読み出す工程、306…DNA塩基配列をアミノ酸配列
に翻訳する工程、307…動的計画法によるスコア総計
の工程、308…検索結果の出力数までの上位スコア総
計を持つDNA塩基配列を選択する工程、309…上位
スコア総計をソートする工程、310…上位スコア総計
を持つDNA塩基配列を表示する工程、311…並置結
果の出力数を入力する工程、312…動的計画法による
スコア総計及び経路を演算する工程、313…スコア総
計の最大値を与える経路のトレースを演算する工程、3
14…並置結果を表示する工程、401…入力装置、4
02…演算処理装置、403…出力装置、404…外部
記憶装置。
Claims (7)
- 【請求項1】(1) 第1、及び第2のDNA塩基配列
を、3塩基長の塩基群に各々分割し、各塩基群をアミノ
酸に翻訳して、第1、及び第2のアミノ酸配列を求める
工程と、(2)前記第1、及び前記第2のDNA塩基配
列に於ける塩基の挿入、欠失、及び、前記第1、及び前
記第2の翻訳アミノ酸配列に於けるアミノ酸の挿入、及
び欠失を各々考慮して、前記第1の翻訳アミノ酸配列と
前記第2の翻訳アミノ酸配列に於ける各アミノ酸の配列
の比較の結果得られる類似度を総計して、前記類似度の
総計が最大となるような、前記第1、及び第2の翻訳ア
ミノ酸配列の各アミノ酸どうしの対応関係を求める工程
と、(3)前記類似度の総計の最大値と、前記第1と第
2の翻訳アミノ酸配列との並置と、前記第1の翻訳アミ
ノ酸配列と前記第1のDNA塩基配列との間の並置と、
前記第2の翻訳アミノ酸配列と前記第2のDNA塩基配
列との間の並置とを出力する工程とを有し、前記工程
(1)は、前記第1、及び第2のDNA塩基配列を各
々、(I)5’末端から3塩基の単位で順次塩基づつず
らしながらアミノ酸配列に翻訳すること、(II)5’
末端から4塩基の単位で順次1塩基づつずらし、前記4
塩基のうちの2番目の塩基を除く前記4塩基のうちの残
りの3塩基をアミノ酸配列に翻訳すること、(III)
5’末端から4塩基の単位で順次1塩基づつずらし、前
記4塩基のうちの3番目の塩基を除く前記4塩基のうち
の残りの3塩基をアミノ酸配列に翻訳すること、を含
み、前記第1と第2のDNA塩基配列の間の類似度を比
較するDNA塩基配列比較方法。 - 【請求項2】クレーム1のDNA塩基配列比較方法に於
いて、k≧1、m≧1を満たす整数、n≧2を満たす整
数とし、i≦M(Mは、前記第1の翻訳アミノ酸配列に
於けるアミノ酸の数)、j≦N(Nは、前記第2の翻訳
アミノ酸配列に於けるアミノ酸の数)とする時、前記工
程(2)に於いて、前記第1の翻訳アミノ酸配列の各ア
ミノ酸を順次第1の軸の方向に配列し、前記第2の翻訳
アミノ酸配列の各アミノ酸を順次第2の軸の方向に配列
して得られるマトリックスを形成し、前記第1の翻訳ア
ミノ酸配列のi番目のアミノ酸と、前記第2の翻訳アミ
ノ酸配列のj番目のアミノ酸との対の位置を表わす、前
記マトリックスの要素(i、j)に於ける前記類似度を
総計を求める際に、前記マトリックスの要素(i、j)
に至る、前記マトリックスの要素、(i−3、j−
3)、(i、j−3k)、(i−3k、j)、(i−3
n+1、j−3n)、(i−3n、j−3n+1)、
(i−3m、j−3m−1)、(i−3m−1、j−3
m)から、前記類似度の総和が最大となるように何れか
前記経路を選ぶDNA塩基配列比較方法。 - 【請求項3】クレーム1のDNA塩基配列比較方法に於
いて、i≦M(Mは、前記第1の翻訳アミノ酸配列に於
けるアミノ酸の数)、j≦N(Nは、前記第2の翻訳ア
ミノ酸配列に於けるアミノ酸の数)とする時、前記工程
(2)に於いて、前記第1の翻訳アミノ酸配列の各アミ
ノ酸を順次第1の軸の方向に配列し、前記第2の翻訳ア
ミノ酸配列の各アミノ酸を順次第2の軸の方向に配列し
て得られるマトリックスを形成し、前記第1の翻訳アミ
ノ酸配列のi番目のアミノ酸と、前記第2の翻訳アミノ
酸配列のj番目のアミノ酸との対の位置を表わす、前記
マトリックスの要素(i、j)に於ける前記類似度を総
計を求める際に、前記マトリックスの要素(i、j)に
至る、前記マトリックスの要素、(i−3、j−3)、
(i、j−3)、(i−3、j)、(i−5、j−
6)、(i−6、j−5)、(i−3、j−4)、(i
−4、j−3)から、前記類似度の総和が最大となるよ
うに何れかの前記経路を選ぶDNA塩基配列比較方法。 - 【請求項4】クレーム1のDNA塩基配列比較方法に於
いて、前記第1のDNA塩基配列を、前記第1のDNA
塩基配列の相補鎖塩基配列に置き換え、前記第2のDN
A塩基配列を、前記第2のDNA塩基配列の相補鎖塩基
配列に置き換えて、前記工程(1)、(2)、(3)を
行なう工程を有するDNA塩基配列比較方法。 - 【請求項5】(1) 第1、及び第2のDNA塩基配列
を、3塩基長の塩基群に各々分割し、各塩基群をアミノ
酸に翻訳して、第1、及び第2のアミノ酸配列を求める
工程と、(2)前記第1、及び前記第2のDNA塩基配
列に於ける塩基の挿入、欠失、及び、前記第1、及び前
記第2の翻訳アミノ酸配列に於けるアミノ酸の挿入、及
び欠失を各々考慮して、前記第1の翻訳アミノ酸配列と
前記第2の翻訳アミノ酸配列に於ける各アミノ酸の配列
の比較の結果得られる類似度を総計して、前記類似度の
総計が最大となるような、前記第1、及び第2の翻訳ア
ミノ酸配列の各アミノ酸どうしの対応関係を求める工程
と、(3)前記類似度の総計の最大値と、前記第1と第
2の翻訳アミノ酸配列との並置と、前記第1の翻訳アミ
ノ酸配列と前記第1のDNA塩基配列との間の並置と、
前記第2の翻訳アミノ酸配列と前記第2のDNA塩基配
列との間の並置と出力する工程とを有し、前記第1と第
2のDNA塩基配列の間の類似度を比較するDNA塩基
配列比較方法。 - 【請求項6】クレーム5のDNA塩基配列比較方法に於
いて、前記第1のDNA塩基配列を、前記第1のDNA
塩基配列の相補鎖塩基配列に置き換え、前記第2のDN
A塩基配列を、前記第2のDNA塩基配列の相補鎖塩基
配列に置き換えて、前記工程(1)、(2)、(3)を
行なう工程を有するDNA塩基配列比較方法。 - 【請求項7】(1)第1、第2のDNA塩基配列を5’
末端から1塩基ずらして3塩基を切り出して順次アミノ
酸に翻訳して翻訳アミノ酸配列A1、B1を各々得る工程
と、(2)前記第1、第2のDNA塩基配列の相補鎖配
列を5’末端から1塩基ずらして3塩基を切り出して順
次アミノ酸に翻訳して翻訳アミノ酸配列A2、B2を各々
得る工程と、(3)前記第1、第2ののDNA塩基配列
を5’末端から1塩基ずらして4塩基を切り出して2番
目の塩基を除く3塩基をアミノ酸に翻訳することを、4
塩基を切り出し毎に順次行ない翻訳アミノ酸配列A3、
B3を各々得る工程と、(4)前記DNA塩基配列の
5’末端から1塩基ずらして4塩基を切り出して3番目
の塩基を除く3塩基をアミノ酸に翻訳することを、4塩
基の切り出し毎に順次行ない翻訳アミノ酸配列A4、B4
を各々得る工程と、(5)前記第1のDNA塩基配列の
相補鎖配列を5’末端から1塩基ずらして4塩基を切り
出して2番目の塩基を除く3塩基をアミノ酸に翻訳する
ことを、4塩基を切り出し毎に順次行ない翻訳アミノ酸
配列A5、B5を各々得る工程と、(6)前記第1、第2
のDNA塩基配列の相補鎖配列の5’末端から1塩基ず
らして4塩基を切り出して3番目の塩基を除く3塩基を
アミノ酸に翻訳することを、4塩基の切り出し毎に順次
行ない翻訳アミノ酸配列A6、B6を各々得る工程と、
(7)前記翻訳アミノ酸配列A1、又はA2からなる第1
の翻訳アミノ酸配列を第1の軸に沿って、前記翻訳アミ
ノ酸配列B1、又はB2からなる第2の翻訳アミノ酸配列
を第2の軸に沿って、前記第1、第2の翻訳アミノ酸配
列の塩基配列を5’末端より各々配列してマトリックス
を形成し、マトリックス要素(i、j)の値が、前記第
1の翻訳アミノ酸配列のi番目のアミノ酸までのアミノ
酸配列と前記第2の翻訳アミノ酸配列のj番目のアミノ
酸までのアミノ酸配列との間における類似度の総計を表
わす、スコアマトリックスHと、前記翻訳アミノ酸配列
A1、A2、A3、A4、A5、A6から選択される前記翻訳
アミノ酸配列を、第1、第3、第5、第7、又は第9の
翻訳アミノ酸配列として第1の軸に沿って、前記翻訳ア
ミノ酸配列B1、B2、B3、B4、B5、B6から選択され
る前記翻訳アミノ酸配列を、第2、第4、第6、第8、
又は第10の翻訳アミノ酸配列として第2の軸に沿っ
て、前記翻訳アミノ酸の各々の塩基配列の5’末端より
配列して、前記翻訳アミノ酸配列のi番目のアミノ酸と
前記翻訳アミノ酸配列のj番目のアミノ酸との類似度を
表わす、第1、第2、第3、第4、第5のマトリックス
s1(i、j)、s2(i、j)、s(i、j)3、s
(i、j)4、s5(i、j)との5つのマトリックスか
らなる、第1、第1、第3、第4、第5のマトリックス
群からなり、前記第1のマトリックス群は、前記翻訳ア
ミノ酸配列A1及び前記翻訳アミノ酸配列B1から構成さ
れるスコアマトリックスHと、前記翻訳アミノ酸配列A
1及び前記翻訳アミノ酸配列B1から構成される第1のマ
トリックスs1と、前記翻訳アミノ酸配列A1及び前記翻
訳アミノ酸配列B3から構成される第2のマトリックス
s2と、前記翻訳アミノ酸配列A1及び前記翻訳アミノ酸
配列B4から構成される第3のマトリックスs3と、前記
翻訳アミノ酸配列A3及び前記翻訳アミノ酸配列B1から
構成される第4のマトリックスs4と、前記翻訳アミノ
酸配列A4及び前記翻訳アミノ酸配列B1から構成される
第5のマトリックスs5とからなり、前記第2のマトリ
ックス群は、前記翻訳アミノ酸配列A1及び前記翻訳ア
ミノ酸配列B2から構成される第1のスコアマトリック
スHと、前記翻訳アミノ酸配列A1及び前記翻訳アミノ
酸配列B2から構成される第1のマトリックスs1と、前
記翻訳アミノ酸配列A1及び前記翻訳アミノ酸配列B5か
ら構成される第2のマトリックスs2と、前記翻訳アミ
ノ酸配列A1及び前記翻訳アミノ酸配列B6から構成され
る第3のマトリックスs3と、前記翻訳アミノ酸配列A3
及び前記翻訳アミノ酸配列B2から構成される第4のマ
トリックスs4と、前記翻訳アミノ酸配列A4及び前記翻
訳アミノ酸配列B2から構成される第5のマトリックス
s5とからなり、前記第3のマトリックス群は、前記翻
訳アミノ酸配列A2及び前記翻訳アミノ酸配列B1から構
成される第1のスコアマトリックスHと、前記翻訳アミ
ノ酸配列A2及び前記翻訳アミノ酸配列B1から構成され
る第1のマトリックスs1と、前記翻訳アミノ酸配列A2
及び前記翻訳アミノ酸配列B3から構成される第2のマ
トリックスs2と、前記翻訳アミノ酸配列A2及び前記翻
訳アミノ酸配列B4から構成される第3のマトリックス
s3と、前記翻訳アミノ酸配列A5及び前記翻訳アミノ酸
配列B1から構成される第4のマトリックスs4と、前記
翻訳アミノ酸配列A6、B1から構成される第5のマトリ
ックスs5とからなり、前記第4のマトリックス群は、
前記翻訳アミノ酸配列A2及び前記翻訳アミノ酸配列B2
から構成される第1のスコアマトリックスHと、前記翻
訳アミノ酸配列A2及び前記翻訳アミノ酸配列B2から構
成される第1のスコアマトリックスs1と、前記翻訳ア
ミノ酸配列A2及び前記翻訳アミノ酸配列B5から構成さ
れる第2のスコアマトリックスs2と、前記翻訳アミノ
酸配列A2及び前記翻訳アミノ酸配列B6から構成される
第3のスコアマトリックスs3と、前記翻訳アミノ酸配
列A5及び前記翻訳アミノ酸配列B2から構成される第4
のスコアマトリックスs4と、前記翻訳アミノ酸配列A6
及び前記翻訳アミノ酸配列B2から構成される第5のス
コアマトリックスs5とからなり、(8)waをアミノ酸
配列、wnをDNA塩基配列の塩基の挿入、欠失に伴う
ギャップペナルティを表わす数値として、前記第1から
第4のマトリックス群の各マトリックス群毎に、前記マ
トリックスの要素(i−3、j−3)から前記マトリッ
クスの要素(i、j)への経路に対応する類似度の総計
H1(i、j)、 H1(i、j)=H(i−3、j−3)+s1(i、j) 前記マトリックスの要素(i、j−3)から前記マトリ
ックスの要素(i、j)への経路に対応する類似度の総
計H2(i、j)、 H2(i、j)=H(i、j−3)+wa 前記マトリックスの要素(i−3、j)から前記マトリ
ックスの要素(i、j)への経路に対応する類似度の総
計H3(i、j)、 H3(i、j)=H(i−3、j)+wa 前記マトリックスの要素(i−5、j−6)から前記マ
トリックスの要素(i、j)への経路に対応する類似度
の総計H4(i、j)、 H4(i、j)=H(i−5、j−6)+wn+s1(i、j) 前記マトリックスの要素(i−6、j−5)から前記マ
トリックスの要素(i、j)への経路に対応する類似度
の総計H5(i、j)、 H5(i、j)=H(i−6、j−5)+wn+s1(i、j) 前記マトリックスの要素(i−3、j−4)から前記マ
トリックスの要素(i、j)への経路に対応する類似度
の総計H6(i、j)、 H6(i、j)=H(i−3、j−4)+wn+s1(i、j) 前記マトリックスの要素(i−4、j−3)から前記マ
トリックスの要素(i、j)への経路に対応する類似度
の総計H7(i、j)、 H7(i、j)=H(i−4、j−3)+wn+s1(i、j) 前記マトリックスの要素(i−6、j−7)から前記マ
トリックスの要素(i、j)への経路に対応する類似度
の総計H8(i、j)及びH9(i、j)、 H8(i、j)=H(i−6、j−7)+wn+s2(i−3、j−4) +s1(i、j) H9(i、j)=H(i−6、j−7)+wn+s3(i−3、j−4) +s1(i、j) 前記マトリックスの要素(i−7、j−6)から前記マ
トリックスの要素(i、j)への経路に対応する類似度
の総計H10(i、j)及びH11(i、j)、 H10(i、j)=H(i−7、j−6)+wn+s4(i−4、j−3) +s1(i、j) H11(i、j)=H(i−7、j−6)+wn+s5(i−4、j−3) +s1(i、j) の最大値でありH(i、j)、前記スコアマトリックス
の要素(i、j)に至る、前記スコアマトリックスの要
素、(i−3、j−3)、(i−3、j)、(i、j−
3)、(i−5、j−6)、(i−6、j−5)、(i
−3、j−4)、(i−4、j−3)、(i−6、j−
7)、(i−7、j−6)から、前記類似度の総和が最
大となるように何れかの前記経路を選ぶことにより得ら
れる、前記最大値を、 H(i、j)=max{H1(i、j)、H2(i、
j)、H3(i、j)、H4(i、j)、H5(i、
j)、H6(i、j)、H7(i、j)、H8(i、
j)、H9(i、j)、H10(i、j)、H11(i、
j)} 前記第1の翻訳アミノ酸配列のi番目のアミノ酸までの
アミノ酸配列と前記第2の翻訳アミノ酸配列のj番目の
アミノ酸までのアミノ酸配列との間における前記類似度
の総計を表わす、前記スコアマトリックスの要素H
(i、j)の値として求める工程と、(9)前記第1か
ら第4のマトリックス群に於ける複数の前記スコアマト
リックスHから、前記第1の翻訳アミノ酸配列と前記第
2のアミノ酸配列の各アミノ酸の間での最適な類似対応
関係を表わす最適アライメントを求める工程と、を有す
るDNA塩基配列比較方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05310298A JP3395633B2 (ja) | 1997-03-31 | 1998-03-05 | Dna塩基配列比較方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7958697 | 1997-03-31 | ||
JP9-79586 | 1997-03-31 | ||
JP05310298A JP3395633B2 (ja) | 1997-03-31 | 1998-03-05 | Dna塩基配列比較方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10334104A true JPH10334104A (ja) | 1998-12-18 |
JP3395633B2 JP3395633B2 (ja) | 2003-04-14 |
Family
ID=26393813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05310298A Expired - Fee Related JP3395633B2 (ja) | 1997-03-31 | 1998-03-05 | Dna塩基配列比較方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3395633B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001155009A (ja) * | 1999-11-29 | 2001-06-08 | Inst Of Physical & Chemical Res | エキソンイントロンジャンクション決定装置および遺伝子領域決定装置並びにそれらの決定方法 |
WO2001065249A1 (fr) * | 2000-03-03 | 2001-09-07 | Riken | Procede et dispositif de correction de la mutation de changement de phase d'une sequence d'adn complementaire, et support ou est enregistre un logiciel de mise en oeuvre du procede |
KR20030008384A (ko) * | 2001-07-18 | 2003-01-29 | 이경호 | 인터넷을 이용한 무연고묘의 가족 검색시스템 |
WO2005029386A1 (ja) * | 2003-09-19 | 2005-03-31 | Japan As Represented By The President Of National Institute Of Genetics | 塩基配列の分類システム |
KR100481878B1 (ko) * | 2000-07-19 | 2005-04-11 | 주식회사 바이오그랜드 | 혈연관계 검색 시스템 및 검색 방법 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3467690A1 (en) * | 2017-10-06 | 2019-04-10 | Emweb bvba | Improved alignment method for nucleic acid sequences |
-
1998
- 1998-03-05 JP JP05310298A patent/JP3395633B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001155009A (ja) * | 1999-11-29 | 2001-06-08 | Inst Of Physical & Chemical Res | エキソンイントロンジャンクション決定装置および遺伝子領域決定装置並びにそれらの決定方法 |
WO2001065249A1 (fr) * | 2000-03-03 | 2001-09-07 | Riken | Procede et dispositif de correction de la mutation de changement de phase d'une sequence d'adn complementaire, et support ou est enregistre un logiciel de mise en oeuvre du procede |
KR100481878B1 (ko) * | 2000-07-19 | 2005-04-11 | 주식회사 바이오그랜드 | 혈연관계 검색 시스템 및 검색 방법 |
KR20030008384A (ko) * | 2001-07-18 | 2003-01-29 | 이경호 | 인터넷을 이용한 무연고묘의 가족 검색시스템 |
WO2005029386A1 (ja) * | 2003-09-19 | 2005-03-31 | Japan As Represented By The President Of National Institute Of Genetics | 塩基配列の分類システム |
Also Published As
Publication number | Publication date |
---|---|
JP3395633B2 (ja) | 2003-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Snyder et al. | Identification of protein coding regions in genomic DNA | |
US6807491B2 (en) | Method and apparatus for combining gene predictions using bayesian networks | |
Quandt et al. | Matlnd and Matlnspector: new fast and versatile tools for detection of consensus matches in nucleotide sequence data | |
KR20140061223A (ko) | 차세대 시퀀싱 데이터의 질병변이마커 검출 방법 | |
WO2002067181A1 (en) | Methods for establishing a pathways database and performing pathway searches | |
Bateman et al. | HMM-based databases in InterPro | |
JPH10334104A (ja) | Dna塩基配列比較方法 | |
Liang et al. | Highly contiguous genome resource of Colletotrichum fructicola generated using long-read sequencing | |
EP1232282B8 (en) | Automated method for identifying related biomolecular sequences | |
JP2005176730A (ja) | cDNA配列をゲノム配列にマッピングする方法 | |
US8024127B2 (en) | Local-global alignment for finding 3D similarities in protein structures | |
KR101046689B1 (ko) | 유전자 온톨로지 트리를 이용한 생물학적 시료의 유전자 발현 패턴 시각화 및 분석 장치 및 그 방법 | |
Teppa et al. | Coevolution analysis of amino-acids reveals diversified drug-resistance solutions in viral sequences: a case study of hepatitis B virus | |
US20010010903A1 (en) | Method for comparison of dna base sequences | |
Schächter | Bioinformatics of large-scale protein interaction networks | |
EP1230615A2 (en) | Method for manipulating protein or dna sequence data in order to generate complementary peptide ligands | |
Spang et al. | Sequence database search using jumping alignments. | |
TW200426614A (en) | Method and apparatus for sequence annotation | |
JPH105000A (ja) | Dnaアミノ酸配列比較方法 | |
Fan et al. | Genome sequence resource of Colletotrichum horii, an important pathogenic fungus threatening persimmon production | |
Buellesbach et al. | Genetic and genomic architecture of species-specific cuticular hydrocarbon variation in parasitoid wasps | |
US20060269939A1 (en) | Method for conversion of a DNA sequence to a number string and applications thereof in the field of accelerated drug design | |
JPH09105748A (ja) | Dna配列比較方法 | |
Asaoka et al. | Development of a structure based protein function prediction method: Calcium binding protein | |
Pabst | Database Assembly for Peptide Mass Fingerprinting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080207 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090207 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090207 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100207 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100207 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110207 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120207 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120207 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130207 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |