JPH07115959A - 複数配列比較装置 - Google Patents

複数配列比較装置

Info

Publication number
JPH07115959A
JPH07115959A JP5265974A JP26597493A JPH07115959A JP H07115959 A JPH07115959 A JP H07115959A JP 5265974 A JP5265974 A JP 5265974A JP 26597493 A JP26597493 A JP 26597493A JP H07115959 A JPH07115959 A JP H07115959A
Authority
JP
Japan
Prior art keywords
sequence
sequences
selection
similarity
crossover
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5265974A
Other languages
English (en)
Inventor
Koji Tajima
耕治 田嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5265974A priority Critical patent/JPH07115959A/ja
Publication of JPH07115959A publication Critical patent/JPH07115959A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】文字列で表される複数本の配列を比較する複数
配列比較装置に関し,要素の挿入,欠失,置換を考慮に
入れて,最も類似度が高くなるようにギャップを含めて
配列要素を並べ換えた結果を,少ない計算量で高速に得
ることができるようにすることを目的とする。 【構成】配列生成手段2により,比較すべき配列にギャ
ップを直接かつランダムに挿入して配列を生成し,配列
比較手段3により,各々の配列の類似度を求め,その類
似度を基に確率的に選択・複製,交配交叉,突然変異を
行って類似度の高い配列を得るという処理を繰り返し,
最も高い類似度の配列を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,複数本の配列が与えら
れたとき,要素の挿入,欠失,置換を考慮に入れて,最
もよく照合するようにギャップを含めて配列要素を並べ
換えた比較結果を出力する複数配列比較装置に関する。
【0002】塩基配列で表現されるDNAなどを用いて
生物の進化系統樹を構成したり,分子進化の過程で保存
される機能モチーフや構造モチーフなどの共通な部分配
列を求める場合,数多くの配列を同時に比較することが
必要とされている。
【0003】ここで配列比較とは,与えられた配列にギ
ャップ(空文字)を挿入することを許して,それらを並
べて書いたもの(マルチプルアラインメントと呼ばれ
る)に対して,同じ列位置にある要素間の類似度の総和
を求め,得られた総和をさらに行方向に加算した総和が
最大となる配列の組を求めることである。
【0004】言い換えれば,類似度の総和が最大となる
ギャップ(空文字)の位置を持つ配列の組み合わせを求
めることである。
【0005】
【従来の技術】比較する配列にギャップを含めて照合す
る手法として,いわゆる動的計画法(DP法)が最もよ
く用いられている。アミノ酸配列などの複数の配列を同
時に比較する際,比較する配列が2本のときは,2次元
の動的計画法によるNeedlemanand Wunsch アルゴリ
ズムにより求めることが可能である。 〔参考文献〕Needleman,S.B. and Wunsch,C.D., “A ge
neral method applicable to the search for similari
ties in the amino acid sequences of two proteins,
J.Mol.Biol., 48, 445-453, 1970。
【0006】2本を超える本数の配列を比較する場合に
は,前述のNeedleman and Wunschアルゴリズムを拡張
して,多次元の動的計画法により厳密に最適なマルチプ
ルアラインメントを求めることが数学的に可能とされて
いる。しかし,これには後述するような問題があった。
【0007】また,2本を超える本数の配列を比較する
場合に,多次元の動的計画法を用いる代わりに,2本を
超える複数の配列から各2本を1組とする組み合わせを
作り,それぞれの配列の組み合わせに対して2次元の動
的計画法を繰り返して比較する方法があった。しかし,
これも後述するような問題があった。
【0008】ところで,配列比較ではなく,一般的な組
み合わせ問題等の最適解を求める方法として,遺伝的ア
ルゴリズムが知られている。遺伝的アルゴリズムとは,
生物の進化過程における自然淘汰や遺伝子の交叉,突然
変異などのメカニズムをまねて考案された計算機による
処理アルゴリズムであって,工学的に組み合わせ最適化
問題等を解くための方法として用いられる。 〔参考文献〕Goldberg,D.E. Genetic Algorithms in Se
arch, Optimization, and Machine Learning, Addison-
Wesley Publishing Company, Inc., 1989 。
【0009】遺伝的アルゴリズムの処理手順は,以下の
ようになる。 (1) ある遺伝子型として染色体に1次元的に表わした個
体(解の候補)をランダムに生成し,予め定められた数
の初期遺伝子集団(解集団)とする。
【0010】(2) それぞれの個体に対して予め定められ
た方法により適応度の評価を行う。一般的に,より優秀
な個体が高い適応度を得る。 (3) 適応度を基に,選択・増殖(複製)を行う。適応度
の高い染色体が確率的に選択され,複製される。これに
より適応度の高い,より優秀な染色体を持つ個体数の割
合が増加する。
【0011】(4) 遺伝子集団内でランダムにペアを作
り,ある確率で交叉を行う。交叉とは,染色体を交叉点
でいくつかの部分に区切り,ペアの染色体間でその部分
を交換することである。
【0012】(5) ある確率で染色体上の対立遺伝子の突
然変異を行う。突然変異とは,1つの染色体上における
対立遺伝子の変更である。 以上の(2) から(5) までの処理を経て1世代の終了とな
る。その結果生成された個体集団を次の世代として,同
様に(2) から(5) までの処理を繰り返す。これによっ
て,適応度のより高い個体の集団(解候補の集団)が残
っていくことになり,所定の打ち切り条件が満たされる
まで繰り返すことにより,最適解が求められる。
【0013】このような遺伝的アルゴリズムの手法は,
従来,例えば巡回セールスマン問題に代表されるような
最適化処理問題等では利用されていたが,配列の類似度
を求める比較手段として使用されていなかった。
【0014】
【発明が解決しようとする課題】実際に配列比較を行う
場合,比較対象となる配列は,一般に数十ないし数百の
要素からなるような長い配列であり,比較すべき配列本
数も多い場合がほとんどである。前述のNeedleman and
Wunsch アルゴリズムを拡張して,多次元の動的計画法
により,厳密に最適なマルチプルアラインメントを求め
ることは,長さLの配列がN本あるとして,その計算量
はO(LN )と膨大になり,計算時間と記憶容量の面か
ら実用的ではない。したがって,多数の配列を同時に比
較することは事実上非常に困難である。
【0015】また,2次元の動的計画法を各配列のペア
に対して繰り返す方法は,計算量はO(NL2 )と多次
元の動的計画法を用いる時より小さくなる反面,近似的
な解しか得ることができないという問題がある。
【0016】本発明は上記問題点の解決を図り,本数の
多い配列を同時に比較する場合にも,実際的な最適解を
高速に得ることを可能にすることを目的とする。
【0017】
【課題を解決するための手段】図1は,本発明の構成例
を示す図である。複数配列比較装置1は,CPUやメモ
リなどからなり,配列生成手段2,配列比較手段3,配
列出力手段7を備える。
【0018】配列生成手段2は,与えられた比較すべき
配列に,ギャップ(空文字)を直接,かつランダムに挿
入することによりいくつかの配列を生成する手段であ
る。配列比較手段3は,配列生成手段2により生成され
た配列の類似度(適応度)を算出し,類似度の高い配列
を選出して最適解を求める手段であり,遺伝的アルゴリ
ズムを適用するための選択・複製手段4,交叉手段5,
突然変異手段6を備える。
【0019】選択・複製手段4は,類似度を算出し,類
似度に従って各配列の選択および複製を行う手段であ
る。この選択・複製では,類似度に応じたルーレット選
択等によって,類似度の高い配列が確率的に選択され,
複製される。
【0020】交叉手段5は,マルチプルアラインメント
集団内でランダムにペアを作り,ある確率で交叉を行う
手段である。交叉とは配列を任意の部分に分割し,ペア
の配列間でその部分を交換することである。交叉手段5
は,配列に付加された補助数列を用いることにより,交
叉位置を補助数列における同じパターンが対応する位置
となるように調整する。
【0021】突然変異手段6は,ある確率で配列上の要
素の突然変異を行う手段である。ここでは,例えば配列
要素間にギャップ(空文字)を挿入したり,ギャップを
削除したりする突然変異を行う。
【0022】配列出力手段7は,配列比較手段3により
選び出された最も類似度の高い配列を出力する手段であ
る。
【0023】
【作用】本発明は,動的計画法によって最適解を求める
のではなく,厳密な意味での最適解は必ずしも得られな
いが,最適解に極めて近い解を高速に求めることができ
る遺伝的アルゴリズム(GA)を応用して,マルチプル
アラインメントを求める比較手段を有する。
【0024】これにより,複数本の配列比較をN次元の
動的計画法より短い計算時間で求めることができ,ま
た,2次元の動的計画法による対ごとの比較の繰り返し
による手段よりも類似度の高いアラインメントを得るこ
とができる。
【0025】通常の遺伝的アルゴリズムでは問題の解の
候補を遺伝操作のために変換しなければならないが,そ
の与えられた配列にギャップを直接,ランダムに挿入し
て遺伝操作の対象となる集団を生成するため,すなわち
比較すべき配列の形式をそのまま利用して遺伝操作を行
うため,簡単に遺伝操作を行うことができる。
【0026】さらに,交叉処理を行う時に,補助的な数
字列を生成し,交叉のための分割位置の決定に用いるこ
とにより,致死となる(無意味なまたは不完全な)配列
を排除して効率的に交叉を行うことができる。
【0027】
【実施例】図2は本発明の実施例フローチャートを示
す。図2に示すステップS1では,配列生成手段2によ
り,比較すべき配列のアラインメントの初期値として,
与えられた配列にランダムにギャップ(空文字)を挿入
したものを生成し,これらを初期の解候補の集団とす
る。次にステップS2では,選択・複製手段4により,
それらの解候補について類似度(適応度に対応)を計算
し,その高さに応じた選択・複製を行い,次世代の集団
において生き残るものを決める。ステップS3では,交
叉手段5により,選択・複製されたアラインメントのう
ちいくつかを交叉させ,新しいアラインメントを作る。
また,ステップS4では,突然変異手段6により,解候
補集団のアラインメントにランダムにギャップを挿入し
て,アラインメントに突然変異を起こさせる。この結果
の集団が,次世代の解候補集団となる。
【0028】ステップS5により,決められた世代数を
繰り返したかどうか,または解が収束したかどうかなど
の終了条件を判定し,所定の終了条件になるまで,ステ
ップS2〜S4を繰り返す。所定の終了条件が満たされ
たならば,繰り返しを終了してステップS6へ移り,配
列出力手段7により解候補集団の中で最適な解を出力す
る。
【0029】次に各手段についての具体的な処理につい
て説明する。比較する対象として,次のような長さ7の
3本の配列が与えられたとする。配列中の各アルファベ
ットは,各々遺伝子に現れる20種類のアミノ酸の中の
1つを表す。これらの各文字およびギャップに相当する
空文字を遺伝的アルゴリズムにおける対立遺伝子とす
る。本実施例ではギャップを「−」の文字で表す。
【0030】 EVQLVQS QLVQSGG VQSGGGV (1)配列生成手段 図3は本発明の実施例による配列生成説明図である。
【0031】配列生成手段2は,図3に示すに示すよう
に,与えられた配列10のアラインメントにランダムに
ギャップを挿入したものを定められた数だけ生成する。
生成された配列11,12,13,…を初期の集団とす
る。また,後述する交叉において致死遺伝子を生じさせ
ないために用いる補助数列11′,12′,13′,…
も同時に生成し,各配列11,12,13,…に付加す
る。補助数列とは,配列の文字に基づいて先頭から順に
番号を付けたものである。ただし,ギャップのある位置
では値を変えない。すなわち,ギャップでは1つ前の数
字を繰り返し,先頭のギャップには0を割り当てる。こ
の補助数列は,交叉処理時に動的に生成するようにして
もよい。
【0032】生成されたアラインメントは配列比較手段
3へ渡される。 (2)選択・複製手段 配列比較手段3では,選択・複製手段4により,各アラ
インメントごとの類似度を計算する。類似度は,通常の
遺伝的アルゴリズムにおける適応度に対応するものであ
る。類似度は,同じ列位置にあるすべての文字間の類似
度の総和を列ごとに算出し,さらにその列ごとの総和を
行方向に加算した総和である。ただし,列で2つの文字
を選ぶ場合には重複を除く。i番目の配列のj番目の要
素をa(i,j) で表し,2つの文字間の類似度をs(a
(i,j) ,a(m,n) )で表すとすると,類似度は次の式で
定義できる。
【0033】 類似度=Σ3 Σ2 Σ1 s(a(i,j),a(k,j) ) ただし,Σ1 はk=2からN(配列数)までの総和,Σ
2 はi=1からk−1までの総和,Σ3 はj=1からL
(配列の長さ)までの総和を表す。
【0034】すなわち, 類似度=s(a(1,1) ,a(2,1) )+s(a(1,1) ,a(3,1) )+ … s(a(1,2) ,a(2,2) )+s(a(1,2) ,a(3,2) )+ … … … s(a(1,L) ,a(2,L) )+s(a(1,L) ,a(3,L) )+ … であり,例えば前述の与えられた配列の類似度は, s(E,Q) +s(E,V) +s(Q,V) + … +s(S,G) +s
(S,V) +s(G,V) である。
【0035】ここで,2つの文字間の類似度s(a(i,
j) ,a(m,n) )の値は,アミノ酸間の物理化学的類似
性に基づいてあらかじめ求められているアミノ酸の類似
度行列を用いて定める。図4はそのアミノ酸の類似度行
列の例を示す。 〔参考文献〕Dayhoff,M.O., Schwartz,R.M. and Orcut
t,B.C., A model of revolutionalry change in protei
ns. Matrices for detecting distant relationships:c
omputer methods and results. In Atlas of Protein S
equence and Structure (Dayhoff,M.O.,ed.), vol.5, s
uppl.3,345-358, National Biomedical Research Found
ation, Washington,D.C., 1978 。
【0036】例えば,s(E,Q) =10,s(E,V) =6,
s(Q,V) =6,……s(S,G) =9, s(S,V) =7,s
(G,V) =7である。選択・複製手段4は,以上のように
して算出された類似度の高さに応じて次世代に生存させ
るアラインメントを選択・複製する。通常は,類似度
(適応度)に比例した確率で解候補(個体)を複製す
る,いわゆるルーレット選択法などを用いる。乱数を発
生することにより,複製の個数を決めることができる。
確率的に類似度の低いアラインメントの解の候補は自然
淘汰される。
【0037】(3)交叉手段 交叉手段5は,選択・複製された解候補の集団の中から
ランダムに一対のアラインメントを選び,ある与えられ
た確率で交叉を行う。このとき,交叉後も意味のある正
しいアラインメントとなるようにする必要がある。交叉
により,1本の配列中に同じ文字の部分列が重複して現
れたり,元の要素が失われてしまうような配列は,いわ
ゆる致死遺伝子であり,解の候補とはなり得ない。ラン
ダムに交叉を行った後に致死遺伝子のものを消滅させて
もよいが,ここでは処理の効率化のため,前述した補助
数列を用いる。これらの補助数列は,多次元空間でのマ
ッチングパスの座標値を意味している。
【0038】例えば説明を簡単にするために,次の2本
の配列からなる2組の解候補A,Bの間で交叉を行うも
のとする。 (A) EVQLVQS−GGG−−− −VQL−E−Q−−SGPG (B) EVQLV−QSG−G−G−−− V−−Q−L−−−EQS−GPG 図5(a)は,これらのマッチングパスを2次元空間で
示したものである。すなわち,アラインメントの格子座
標点表現と交叉点は,図5(a)に示すようになる。図
5(a)において,○を付けた部分を交叉における分割
点とすれば,交叉を行っても致死遺伝子は生じない。こ
のような交叉可能点を求めるには,図5(b)に示すよ
うに各アラインメントの補助数列において,同じ数字対
の位置を探す。図示のP1〜P7が致死遺伝子を生じさ
せない交叉可能点である。交叉可能点が複数ある場合に
は,ランダムにどれかを選択する。また,交叉させる対
をランダムに決めるのではなく,1つの解に対して類似
度の向上が得られる相手を検索することにより,選ぶこ
とも可能である。
【0039】図6は交叉の例を示す。図6に示す(a)
のアラインメントと(b)のアラインメントが交叉のペ
アとして選ばれたとする。これらの補助数列を比較する
と,(a)の3文字目と(b)の先頭位置に,共通の数
字パターン「111」が現れている。そこで,この位置
で交叉を行い,後方の文字列を入れ替えると,(a′)
および(b′)に示すような交叉結果が得られる。
【0040】(4)突然変異手段 次に,突然変異手段6により,ある与えられた確率によ
る突然変異を行う。ここでの突然変異とは,解候補の配
列のある部分にギャップを挿入することである。また
は,ギャップの挿入だけでなく,配列中に存在するギャ
ップを削除する突然変異を所定の確率によって行うよう
にしてもよい。このとき,アラインメントの部分的な類
似度に基づいて突然変異を行うと,より効率的になる。
例えば各位置の類似度の高さに応じて,その位置にギャ
ップを発生させる確率を決める。あるいは,各位置でギ
ャップを挿入した場合の類似度を予め計算しておき,そ
のうち最も類似度が高くなるような位置にのみギャップ
の挿入を行う。
【0041】図7は突然変異説明図である。例えば,図
7(a)に示すような解候補の3本目の配列において,
4文字目に現れる「Q」が突然変異点として選ばれたと
する。図7(b)に示すように,その文字「Q」の前に
ギャップを挿入する。この例のように,3本の配列の同
じ文字位置がすべてギャップになった場合,ギャップは
不要であるので削除し,図7(c)に示すように文字列
を並べ換える。
【0042】以上の処理によって,次世代の解候補の集
団が作られる。 (5)実行例 図8ないし図12に本発明の実行例を示す。
【0043】比較する対象として与えられた配列は,次
の3本である。 EVQLVQS QLVQSGG VQSGGGV 集団の大きさ,すなわち個体数を300として実行した
が,図8以下では,図をわかりやすくするために,6個
分の個体数だけを示す。
【0044】図8に示すアラインメント21〜26は,
与えられた配列にギャップをランダムに挿入して得られ
た解候補の初期集団である。各アラインメント21〜2
6には補助数列が付加され,また各アラインメント21
〜26についての類似度(適応度)が計算される。
【0045】図9は,図8に示す初期集団に対して,類
似度に応じた確率でランダムに選択・複製を行った結果
の例を示す。ここでは,図8に示す初期集団において最
も類似度の高いアラインメント21がさらに2組複製さ
れ,類似度の低いアラインメント22,25と置き換え
られている。
【0046】図10は,図9に示す解候補の集団からラ
ンダムに選択されたアラインメント21とアラインメン
ト26に対して,交叉処理が行われた結果を示す。ここ
では,補助数列において「444」の同じ数字パターン
が並ぶ位置で交叉が行われ,新しいアラインメント21
c,アラインメント26aが作り出されている。なお,
この例では交叉点から後ろの文字列がすべて同じである
ため,交叉結果についての実質的な変化はないが,一般
には交叉によって元のアラインメントとは異なる新しい
アラインメントが作り出されることになる。
【0047】図11は,図9に示すアラインメント21
a,アラインメント26が突然変異の対象として選ば
れ,突然変異が行われた結果を示す。図11に示すアラ
インメント21dと,アラインメント26aにおいて,
四角で囲まれた部分が突然変異の起きた部分であり,こ
の部分にギャップが挿入されている。
【0048】このようにして得られたアラインメントを
次世代の集団とし,予め定められた条件を満たすまで,
同様に選択・複製,交叉,突然変異を繰り返す。所定の
終了条件が満たされたならば,最終結果の解候補の中か
ら最も類似度のの高いアラインメントを出力する。
【0049】図12は,前述した長さ7の3本の配列に
ついて,個体数300で,99世代繰り返した時の最終
的な出力結果を示す。この出力アラインメント30にお
いて3文字目と4文字目の点線で囲んだ部分に,同じ文
字列VQが現れている。出力結果を可視的に表示する場
合には,このような部分を強調して表示する。この出力
アラインメント30の類似度(適応度)は168であ
る。ちなみに,従来の2次元動的計画法を繰り返す方法
では,162の類似度しか得られなかった。
【0050】多数の配列を同時に比較し,類似度の高い
最適なマルチプルアラインメントを求めることにより,
分子進化の過程で保存される機能モチーフや構造モチー
フなどの共通な部分配列を容易に迅速に求めることがで
きるようになる。
【0051】
【発明の効果】以上説明したように,本発明によれば,
複数本の配列比較を,遺伝的アルゴリズムを直接応用し
て行うことにより,次のような効果がある。
【0052】(1) 多次元の動的計画法より少ない計算時
間で解を求めることができる。長さLの配列がN本ある
場合,従来のN次元動的計画法によれば,O(LN )の
計算量となるのに対し,集団の個体数をP,世代数をG
とすれば,本発明による計算量はNLPGのオーダであ
る。
【0053】(2) 2次元の動的計画法等を用いた対ごと
の比較の繰り返しによる配列比較よりも,類似度の高い
アラインメントを得るとができる。 (3) 配列の要素をそのままの形で染色体表現とすること
により遺伝子型への変換が不要である。
【0054】(4) 交叉処理時に補助数列を用いることに
より,交叉による致死遺伝子の発生を防ぐことができ,
交叉を効率的に行うことが可能となる。 (5) 突然変異処理時に,各位置の類似度に応じてギャッ
プ挿入確率を決めることにより,効率的な突然変異を生
じさせることができる。
【図面の簡単な説明】
【図1】本発明の構成例を示す図である。
【図2】本発明の実施例フローチャートを示す。
【図3】本発明の実施例による配列生成説明図である。
【図4】本発明の実施例において類似度計算に用いるア
ミノ酸の類似度行列を示す図である。
【図5】本発明の実施例による交叉説明図である。
【図6】本発明の実施例による交叉の例を示す図であ
る。
【図7】本発明の実施例による突然変異説明図である。
【図8】実行例における初期集団の例を示す図である。
【図9】実行例における選択・複製処理結果の例を示す
図である。
【図10】実行例における交叉処理結果の例を示す図で
ある。
【図11】実行例における突然変異処理結果の例を示す
図である。
【図12】実行例における最終的比較結果の例を示す図
である。
【符号の説明】
1 複数配列比較装置 2 配列生成手段 3 配列比較手段 4 選択・複製手段 5 交叉手段 6 突然変異手段 7 配列出力手段

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 与えられた複数本の配列について,最も
    よく照合するように配列中にギャップを挿入した結果を
    出力する複数配列比較装置において,与えられた比較す
    べき各配列にギャップを直接,ランダムに挿入すること
    により複数組の配列を生成する配列生成手段(2) と,前
    記配列生成手段(2) により生成された配列の類似度を比
    較する配列比較手段(3) と,前記配列比較手段(3) によ
    り最も類似度の高い配列を選び出し出力する配列出力手
    段(7) とを有することを特徴とする複数配列比較装置。
  2. 【請求項2】 請求項1記載の複数配列比較装置におい
    て,前記配列比較手段(3) は,前記配列生成手段(2) に
    より生成された配列をその類似度の値に基づいて選択,
    複製する選択・複製手段(4) と,前記選択・複製手段
    (4) により選択・複製された配列のうちのいくつかに配
    列中の一部を他の配列の一部と組み換える交叉を行う交
    叉手段(5) とを持ち,解の候補となる配列の集団に対
    し,前記選択・複製手段(4) による選択・複製の操作
    と,前記交叉手段(5) による交叉の操作とを繰り返すよ
    うに構成されていることを特徴とする複数配列比較装
    置。
  3. 【請求項3】 請求項1記載の複数配列比較装置におい
    て,前記配列比較手段(3) は,前記配列生成手段(2) に
    より生成された配列をその類似度の値に基づいて選択,
    複製する選択・複製手段(4) と,前記選択・複製手段
    (4) により選択・複製された配列のうちのいくつかに突
    然変異を行う突然変異手段(6) とを持ち,解の候補とな
    る配列の集団に対し,前記選択・複製手段(4) による選
    択・複製の操作と,前記突然変異手段(6) による突然変
    異の操作とを繰り返すように構成されていることを特徴
    とする複数配列比較装置。
  4. 【請求項4】 請求項1記載の複数配列比較装置におい
    て,前記配列比較手段(3) は,前記配列生成手段(2) に
    より生成された配列をその類似度の値に基づいて選択,
    複製する選択・複製手段(4) と,前記選択・複製手段
    (4) により選択・複製された配列のうちのいくつかに配
    列中の一部を他の配列の一部と組み換える交叉を行う交
    叉手段(5) と,前記選択・複製手段(4) により選択・複
    製された配列のうちのいくつかに突然変異を行う突然変
    異手段(6) とを持ち,解の候補となる配列の集団に対
    し,前記選択・複製手段(4) による選択・複製の操作
    と,前記交叉手段(5) による交叉の操作と,前記突然変
    異手段(6) による突然変異の操作とを繰り返すように構
    成されていることを特徴とする複数配列比較装置。
  5. 【請求項5】 請求項2または請求項4記載の複数配列
    比較装置において,前記交叉手段(5) は,比較すべき配
    列に補助的な数字列を付加し,その補助的な数字列を用
    いて交叉の可否または交叉の位置を決定する手段を持つ
    ことを特徴とする複数配列比較装置。
  6. 【請求項6】 請求項3または請求項4記載の複数配列
    比較装置において,前記突然変異手段(6) は,比較すべ
    き配列のアラインメントの部分的な類似度に基づいて突
    然変異を生じさせる部分を決定する手段を持つことを特
    徴とする複数配列比較装置。
JP5265974A 1993-10-25 1993-10-25 複数配列比較装置 Withdrawn JPH07115959A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5265974A JPH07115959A (ja) 1993-10-25 1993-10-25 複数配列比較装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5265974A JPH07115959A (ja) 1993-10-25 1993-10-25 複数配列比較装置

Publications (1)

Publication Number Publication Date
JPH07115959A true JPH07115959A (ja) 1995-05-09

Family

ID=17424624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5265974A Withdrawn JPH07115959A (ja) 1993-10-25 1993-10-25 複数配列比較装置

Country Status (1)

Country Link
JP (1) JPH07115959A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11296553A (ja) * 1998-04-10 1999-10-29 Nec Corp 複数文字列アライメント方法およびシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11296553A (ja) * 1998-04-10 1999-10-29 Nec Corp 複数文字列アライメント方法およびシステム

Similar Documents

Publication Publication Date Title
Burks et al. Towards modeling DNA sequences as automata
Karp Mathematical challenges from genomics and molecular biology
CN107798216A (zh) 采用分治法进行高相似性序列的比对方法
Yap et al. High performance computational methods for biological sequence analysis
Jain et al. Adaptation in simple and complex fitness landscapes
WO2022159635A1 (en) Systems and methods for evaluation of structure and property of polynucleotides
Attie et al. Genetic codes optimized as a traveling salesman problem
Sammeth et al. Comparing tandem repeats with duplications and excisions of variable degree
JPH07115959A (ja) 複数配列比較装置
Pankratov et al. Spectral analysis for identification and visualization of repeats in genetic sequences
Gupta et al. Genetic algorithm based approach for obtaining alignment of multiple sequences
Zimrnermann An introduction to protein informatics
De Clercq et al. Deep learning for classification of DNA functional sequences
Al-Barhamtoshy et al. DNA sequence error corrections based on TensorFlow
Dubé et al. From bits to bases: Evolving a versatile construct for biological sequence and network data
Beslon et al. From digital genetics to knowledge discovery: Perspectives in genetic network understanding
US11566241B2 (en) Methods and systems for modeling of design representation in a library of editing cassettes
Ancliff et al. Evolution dynamics of a model for gene duplication under adaptive conflict
Daudey et al. Aevol_4b: Bridging the gap between artificial life and bioinformatics
CN109461472B (zh) 一种基于副本交换和有偏分布估计的蛋白质构象空间优化方法
Dey et al. A survey on multiple sequence alignment using metaheuristics
Joachimczak et al. Complexity of the search space in a model of artificial evolution of gene regulatory networks controlling 3D multicellular morphogenesis
Gaad et al. Exploring Reinforcement Learning Methods for Multiple Sequence Alignment: A Brief Review
Rautiainen Sequence to Graph Alignment: Theory, Prac ce and Applica ons
Rechenmann et al. Interpreting the genome

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20001226