JPH05128171A - Phylogenetic tree output device - Google Patents

Phylogenetic tree output device

Info

Publication number
JPH05128171A
JPH05128171A JP3293215A JP29321591A JPH05128171A JP H05128171 A JPH05128171 A JP H05128171A JP 3293215 A JP3293215 A JP 3293215A JP 29321591 A JP29321591 A JP 29321591A JP H05128171 A JPH05128171 A JP H05128171A
Authority
JP
Japan
Prior art keywords
phylogenetic tree
similarity
node
array
phylogenetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3293215A
Other languages
Japanese (ja)
Inventor
Koji Tajima
耕治 田嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3293215A priority Critical patent/JPH05128171A/en
Publication of JPH05128171A publication Critical patent/JPH05128171A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To generate phylogenetic tree information in which two arrangements having maximum similarity are reconstructed into one new arrangement from a similarity matrix, to obtain the maximum similarity of each node based on the phylogenetic tree information, to generate the phylogenetic trees in order of maximum similarity and to arrange the phylogenetic trees in the ascending order of similarity so as to facilitate the recognition and comparison of them. CONSTITUTION:Phylogenetic tree information 5 is prepared by repeatedly generating new arrangement and similarity for a pair consisting of a similarity matrix 4 formed of the similarity between the arrangements preliminarily obtained and the maximum similarity in the similarity matrix 4. A larger one of the arrangement of the pair of the phylogenetic tree information 5 is obtained as maximum similarity and added to the information 5. Then the phylogenetic tree is generated in the order of maximum similarity of the added phylogenetic tree information 5 and outputted.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、系統樹を出力する系統
樹出力装置に関するものである。分子生物学の分野で
は、進化の過程における種々の遺伝子の系統関係を見る
ことが必要となる。図14はその例を示す。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system tree output device for outputting a system tree. In the field of molecular biology, it is necessary to look at the phylogenetic relationships of various genes during evolution. FIG. 14 shows an example thereof.

【0002】DNAやタンパク質配列の系統樹を図で計
算機上に表示するには、グラフィックソフトを用いる必
要があるが、これは用いる計算機の種類やソフトウェア
の種類に依存するので、表示ツールやその結果をより広
く用いるには制約となる。そこでそのような制約を受け
にくい方法の開発が望まれている。
Graphic software must be used to graphically display a phylogenetic tree of DNA or protein sequences on a computer. However, this depends on the type of computer and software used, and therefore the display tool and its result. Is a constraint to use more widely. Therefore, it is desired to develop a method that does not easily suffer such restrictions.

【0003】[0003]

【従来の技術】通常のUPGMA法(館野:分子系統樹
の作り方とその評価、木村編、分子進化学入門、培風
館、1984)などで系統樹を表示すると、類似度ある
いは距離の値から言って、単調に増加するような枝の配
置にならず、図14に示すように、不揃いとなる。以下
上述のUPGMA方法による系統樹の作成法について簡
単に説明する。
2. Description of the Related Art When a phylogenetic tree is displayed by the usual UPGMA method (Tateno: How to make and evaluate molecular phylogenetic tree, Kimura ed., Introduction to Molecular Susumu Kagaku, Baifukan, 1984), the similarity or distance value The arrangement of the branches does not increase monotonically, resulting in unevenness as shown in FIG. The method of creating a phylogenetic tree by the UPGMA method described above will be briefly described below.

【0004】(1) 表示しようとする配列について予
め求めた類似度行列中の類似度S(i、j)(i、jは
配列の番号であって1ないしN)のうちで、最大値を求
める。そのときのS(i、j)をsmax、対となる配
列番号i、jの値をimax、jmaxで表す。
(1) The maximum value of the similarity S (i, j) (i, j is the array number, 1 to N) in the similarity matrix previously obtained for the array to be displayed is Ask. At that time, S (i, j) is represented by smax, and the values of the paired array element numbers i, j are represented by imax, jmax.

【0005】(2) この2つの値imax、jmax
を持つ配列を配列グループN+1とする。このグループ
化によって、その他の配列とのS(i、j)は計算し直
される。k番目の配列とimax、jmaxをひとまと
めにした配列グループN+1との類似度S(k、N+
1)は、S(k、imax)とS(k、jmax)の平
均値とする。imax>Nあるいはjmax>Nのとき
は、そのノードに含まれる配列どうしの類似度すべてに
ついての平均値を計算する。
(2) These two values imax, jmax
An array having N is set as an array group N + 1. By this grouping, S (i, j) with other arrays is recalculated. The similarity S (k, N +) between the k-th array and the array group N + 1 in which imax and jmax are grouped together
1) is an average value of S (k, imax) and S (k, jmax). When imax> N or jmax> N, the average value of all the similarities between the sequences included in the node is calculated.

【0006】(3) 以上の手順を最後の一組の配列グ
ループ2N−1になるまで繰り返す。結果として、各ス
テップでのimax、jmax、S(imax、jma
x)を記憶する。これらの結果を用いて系統樹を書く
と、図14のようになる(詳細は上述した書籍を参
照)。
(3) The above procedure is repeated until the final set of array groups 2N-1 is reached. As a result, imax, jmax, S (imax, jma at each step
x) is stored. When a phylogenetic tree is written using these results, it becomes like FIG. 14 (for details, refer to the above-mentioned book).

【0007】[0007]

【発明が解決しようとする課題】上述した図14に示す
ような系統樹は、類似度や距離が単調に増加せず、不揃
いとなり遺伝子のタンパク質の配列のグループを見分け
るのに不都合であるという問題があった。また、マルチ
プルアライメントの表示でも類似度あるいは距離の値か
らグループにまとめてながめるのにも不都合であるとい
う問題があった。そこで、このような不揃いのない系統
樹の表示法が望まれている。
The problem with the phylogenetic tree as shown in FIG. 14 is that the degree of similarity and distance do not increase monotonically, resulting in misalignment and inconvenience in distinguishing groups of protein sequences of genes. was there. Further, there is a problem that even in the case of displaying multiple alignment, it is inconvenient to read the values of the similarity or the distance in a group. Therefore, a method for displaying a phylogenetic tree without such irregularity is desired.

【0008】本発明は、類似度行列から最大の類似度の
2つの配列を新たな1つの配列にした系統樹情報を生成
し、この系統樹情報をもとに各ノードの最大類似度を求
め、この最大類似度の順に系統樹を生成し、類似度が徐
々に増加するように揃えて配置して見やすくかつ比較し
易くすることを目的としている。
According to the present invention, phylogenetic tree information in which two sequences having the maximum similarity are converted into a new sequence from the similarity matrix, and the maximum similarity of each node is obtained based on this phylogenetic tree information. The purpose is to generate phylogenetic trees in the order of the maximum similarity and arrange them so that the similarity gradually increases so that they are easy to see and compare.

【0009】[0009]

【課題を解決するための手段】図1は、本発明の原理構
成図を示す。図1において、系統樹処理部2は、類似度
行列4をもとに系統樹情報5を生成したり、この系統樹
情報5から最大類似度を求めて付加したり、最大類似度
を付加した系統樹情報5をもとに系統樹6を生成したり
するものである。
FIG. 1 is a block diagram showing the principle of the present invention. In FIG. 1, the phylogenetic tree processing unit 2 generates phylogenetic tree information 5 based on the similarity matrix 4, obtains and adds the maximum similarity from the phylogenetic tree information 5, and adds the maximum similarity. A phylogenetic tree 6 is generated based on the phylogenetic tree information 5.

【0010】類似度行列4は、配列の間の類似度を予め
求めて行列としたものである。系統樹情報5は、類似度
行列4中の最大類似度の対の配列について新たな配列お
よび類似度を生成することを繰り返して作成、および当
該系統樹情報5の対の配列のうちの大きい方の類似度を
最大類似度として求めて付加したものである。
The similarity matrix 4 is a matrix in which the similarity between arrays is obtained in advance. The phylogenetic tree information 5 is created by repeatedly generating a new sequence and similarity for the pair of sequences having the maximum similarity in the similarity matrix 4, and the larger one of the paired sequences of the phylogenetic tree information 5 is generated. Is calculated and added as the maximum similarity.

【0011】系統樹6は、系統樹情報5から生成した配
列を見やすく配置した系統樹である。出力部3は、系統
樹6をディスプレイ7やプリンタ8に出力するものであ
る。
The phylogenetic tree 6 is a phylogenetic tree in which the sequences generated from the phylogenetic tree information 5 are arranged in an easy-to-see manner. The output unit 3 outputs the system tree 6 to the display 7 and the printer 8.

【0012】[0012]

【作用】本発明は、図1に示すように、系統樹処理部2
が予め求めた類似度行列4の配列中の最大類似度の対の
配列について新たな配列および類似度を生成することを
繰り返して系統樹情報5を作成およびこの系統樹情報5
の対の配列のうちの大きい方の類似度を最大類似度とし
て求めて付加し、この付加した系統樹情報5の最大類似
度の順に系統樹6を生成し、出力部3がこの系統樹6を
出力(表示、印刷)するようにしている。
In the present invention, as shown in FIG. 1, the phylogenetic tree processing unit 2
Generate a new phylogenetic tree information 5 by repeatedly generating new sequences and similarities with respect to the pair of sequences having the maximum similarity in the sequence of the similarity matrix 4 obtained in advance and the phylogenetic tree information 5
The larger similarity of the paired sequences is calculated as the maximum similarity and added, and the phylogenetic tree 6 is generated in the order of the maximum similarity of the added phylogenetic tree information 5, and the output unit 3 outputs the phylogenetic tree 6 Is output (displayed, printed).

【0013】最大類似度を付加した系統樹情報5の最大
類似度の順に順次系統樹をキャラクタ(例えば+、−、
|など)を用いて出力するようにしている。また、最大
類似度を付加した系統樹情報5の最大類似度の昇順(あ
るいは降順)に展開して配列番号、配列名を並べ、垂直
方向にこれら配列番号、配列名を出力、およびこれらに
子供を結合して系統樹をグラフィカルに生成して出力す
るようにしている。
Characters of the phylogenetic tree (eg, +,-,
| Etc.) is used for output. Also, the sequence numbers and sequence names are arranged in ascending order (or descending sequence) of the maximum similarity of the phylogenetic tree information 5 with the maximum similarity added, and these sequence numbers and sequence names are output in the vertical direction Are combined to generate a graphical tree and output it graphically.

【0014】従って、類似度行列4から最大の類似度の
2つの配列を新たな1つの配列にした系統樹情報5を生
成し、この系統樹情報5をもとに各ノードの最大類似度
を求めて付加し、この最大類似度の順に系統樹を生成す
ることにより、類似度が徐々に増加するように揃えて配
置して見やすくかつ比較し易くすることが可能となる。
Therefore, from the similarity matrix 4, the phylogenetic tree information 5 in which the two arrays having the maximum similarity are combined into a new array is generated, and based on this phylogenetic tree information 5, the maximum similarity of each node is calculated. By obtaining and adding and generating a phylogenetic tree in the order of the maximum similarity, it is possible to arrange them so that the similarity gradually increases so that they are easy to see and compare.

【0015】[0015]

【実施例】次に、図1から図13を用いて本発明の実施
例の構成および動作を順次詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the construction and operation of an embodiment of the present invention will be sequentially described in detail with reference to FIGS.

【0016】図1は、本発明の原理構成図を示す。図1
において、系統樹出力装置1は、予め求めた配列の類似
度行列4から類似度が徐々に増加するように揃えて見や
すく配置した系統樹を出力するものであって、系統樹処
理部2および出力部3などから構成されるものである。
FIG. 1 is a block diagram showing the principle of the present invention. Figure 1
In the above, the phylogenetic tree output device 1 outputs a phylogenetic tree arranged in an easy-to-read manner so that the similarity gradually increases from the similarity matrix 4 of the array obtained in advance. It is composed of the unit 3 and the like.

【0017】系統樹処理部2は、類似度行列4をもとに
系統樹情報5を生成したり、この系統樹情報5から最大
類似度を求めて付加したり、最大類似度を付加した系統
樹情報5をもとに系統樹6を生成したりなどするもので
ある。
The phylogenetic tree processing unit 2 generates phylogenetic tree information 5 based on the similarity matrix 4, finds and adds the maximum similarity from the phylogenetic tree information 5, and adds the maximum similarity to the system. For example, a phylogenetic tree 6 is generated based on the tree information 5.

【0018】出力部3は、系統樹6をディスプレイ7や
プリンタ8に出力するものである。類似度行列4は、配
列の間の類似度を予め求めて行列としたものであって、
図2の(イ)に示すように配列の対の類似度を予め求め
て行列としたものである。
The output unit 3 outputs the system tree 6 to the display 7 and the printer 8. The similarity matrix 4 is a matrix in which the similarity between arrays is obtained in advance,
As shown in FIG. 2A, the similarity between pairs of arrays is obtained in advance and formed into a matrix.

【0019】系統樹情報5は、類似度行列4中の最大類
似度の対の配列について新たな配列を生成および両者の
配列の類似度の平均を新たな配列の類似度とすることを
繰り返して生成したり(図2の(ロ)参照)、当該系統
樹情報5の対の配列のうちの大きい方の類似度を最大類
似度として求めて付加(図4参照)したものである。
The phylogenetic tree information 5 is repeated by generating a new sequence for the pair of sequences having the maximum similarity in the similarity matrix 4 and using the average of the similarities of the two sequences as the similarity of the new sequence. It is generated (see (b) of FIG. 2) or obtained by adding the similarity of the larger of the paired sequences of the phylogenetic tree information 5 as the maximum similarity (see FIG. 4).

【0020】系統樹6は、系統樹情報5から生成した配
列を見やすく配置した系統樹である(図9、図10、図
13)。ディスプレイ7は、系統樹を表示などするもの
である。
The phylogenetic tree 6 is a phylogenetic tree in which the sequences generated from the phylogenetic tree information 5 are arranged in an easy-to-see manner (FIG. 9, FIG. 10, FIG. 13). The display 7 displays a phylogenetic tree.

【0021】プリンタは、系統樹を印字するものであ
る。次に、図2から図10を用いて本発明の1実施例の
構成の動作を順次具体的に説明する。
The printer prints a tree. Next, the operation of the configuration of the first embodiment of the present invention will be sequentially and specifically described with reference to FIGS.

【0022】ここで、N本の遺伝子配列が与えられてい
て、i番目の配列とj番目の配列の間の類似度(あるい
は距離)がS(i,j)で表されるものとする。ここ
で、i,j=1,2・・・Nである。配列間の類似度
(あるいは距離)は、Needlemanand Wunschアルゴリズ
ム(Needleman,S,B,and Wunsch,C.D.,"A general method
applicable to the search for similarities in the
amino acid sequences oftwo proteins,J.Mol,Biol.,4
8,445-453,1970)その他で求めることができる。
Here, it is assumed that N gene sequences are given and the similarity (or distance) between the i-th sequence and the j-th sequence is represented by S (i, j). Here, i, j = 1, 2 ... N. The similarity (or distance) between sequences is determined by the Needleman and Wunsch algorithm (Needleman, S, B, and Wunsch, CD, "A general method
applicable to the search for similarities in the
amino acid sequences of two proteins, J. Mol, Biol., 4
8,445-453,1970) and others.

【0023】よく知られたUPGMA法で系統樹を作成
する方法について説明する。まず類似度S(i,j)の
うちで、最大値を求める。そのときのS(i,j)の値
をsmax、対となる配列番号i、jの値をimax、
jmaxで表す。次のこの2つの配列imax、jma
xをひとつの配列グループN+1とする。このグループ
化によって、その他の配列とのS(i,j)は計算しな
おす。k番目の配列とimax、jmaxをひとまとめ
にした配列グループN+1との類似度S(k,N+1)
は、S(k,jmax)とS(s,imax)の平均値
とする。imax>Nあるいはjmas>Nのときは、
そのノードに含まれる配列どうしの類似度は全てについ
ての平均値を計算する。
A method of creating a phylogenetic tree by the well-known UPGMA method will be described. First, of the similarities S (i, j), the maximum value is obtained. At that time, the value of S (i, j) is smax, the value of paired array element numbers i and j is imax,
It is represented by jmax. Next these two arrays imax, jma
Let x be one array group N + 1. By this grouping, S (i, j) with other arrays is recalculated. Similarity S (k, N + 1) between the k-th array and the array group N + 1 in which imax and jmax are grouped together
Is an average value of S (k, jmax) and S (s, imax). When imax> N or jmas> N,
For the similarity between the arrays included in the node, the average value for all is calculated.

【0024】以上の手順を最後の一組の配列グループ2
N−1になるまで繰り返す。結果として、各ステップで
のimax、jmax、S(imax、jmax)を記
憶する。これらの結果を用いて系統樹を描くことができ
る。
The above procedure is followed by the final set of sequence group 2
Repeat until N-1. As a result, imax, jmax, S (imax, jmax) at each step are stored. A phylogenetic tree can be drawn using these results.

【0025】図2は、本発明の類似度行列/系統樹情報
を示す。図2の(イ)は、27本の配列の場合の類似度
の例を示す。ここで、配列1の配列名はHBA$AEG
MOである。配列2から配列27は図示のような配列名
である。横軸は配列番号1ないし26を表し、縦軸は配
列番号2ないし27と配列名を表す。中央の1792な
どの4桁の数字は類似度を表す。従って、ここでは配列
1ないし配列27について相互の間の類似度を図示のよ
うに予め求めたとし、以下にこれから系統樹を生成する
手順を説明する。
FIG. 2 shows similarity matrix / phyloge tree information of the present invention. FIG. 2A shows an example of the degree of similarity in the case of 27 arrays. Here, the array name of array 1 is HBA $ AEG
MO. Arrays 2 to 27 are array names as shown. The horizontal axis represents the sequence numbers 1 to 26, and the vertical axis represents the sequence numbers 2 to 27 and the sequence names. A 4-digit number such as 1792 in the center indicates the degree of similarity. Therefore, here, it is assumed that the degree of similarity between the arrays 1 to 27 is previously obtained as shown in the figure, and the procedure for generating a phylogenetic tree from this is described below.

【0026】図2の(ロ)は、図2の(イ)の類似度行
列から配列番号28の新たは配列および類似度を求めた
例を示す。求め方は、図2の(イ)の類似度行列の中で
類似度の最大値は1792であり、配列17と配列3を
ひとまとめにして配列28を生成する。配列28と配列
1との類似度は (S(3,1)+S(17,1))/2=(1660+1665)/2 =1662.5・・・・・・・・・・・・・・・・・・・・・・・・・(1) となる。同様に、配列2、4・・・37との類似度を計
算し、図2の(ロ)のように求める。
FIG. 2B shows an example in which the new sequence and similarity of the array element number 28 are obtained from the similarity matrix of FIG. The maximum value of the similarity is 1792 in the similarity matrix of FIG. 2A, and the array 17 and the array 3 are put together to generate the array 28. The similarity between the array 28 and the array 1 is (S (3,1) + S (17,1)) / 2 = (1660 + 1665) /2=1662.5 ...・ ・ ・ ・ ・ ・ ・ ・ ・ (1) Similarly, the degree of similarity with the arrays 2, 4, ... 37 is calculated and determined as shown in (b) of FIG.

【0027】次に、図2の(ロ)の類似度行列の中で最
大の類似度は1789で配列6と配列5ををひとまとめ
にして配列29を生成する。配列29と配列1との類似
度は式(1)と同様にして類似度を求める。以下同様の
手順を繰り返す。この際、系統樹を作図するのに必要な
ノード、類似度、その子供である配列1、配列2をここ
では系統樹情報として記憶しておく。
Next, the maximum similarity is 1789 in the similarity matrix of FIG. 2B, the arrays 6 and 5 are grouped together to generate an array 29. The similarity between the array 29 and the array 1 is calculated in the same manner as in the equation (1). The same procedure is repeated thereafter. At this time, the nodes necessary for drawing the phylogenetic tree, the degree of similarity, and the children, Array 1 and Array 2, are stored here as phylogenetic tree information.

【0028】図2の(ハ)は、系統樹情報を示す。これ
は、上述した図2の(イ)の類似度行列から図2の
(ロ)の類似度行列28およびこれに続く29ないし5
3を求めた際のノード、類似度、配列1、配列2を記憶
したものである。例えばは、図2の(ロ)の配列28
が、図2の(イ)の類似度行列の最大の類似度1792
であって、まとめる対象となる対の配列が配列3と配列
17であってこれは配列1、配列2となる。従って、図
示のように、ノード、類似度、配列1、配列2として、
28、1792、3、17が得られ、これを図示のよう
に系統樹情報5として記憶する。以下同様に、図示のよ
うに記憶する。
FIG. 2C shows phylogenetic tree information. This is based on the similarity matrix of FIG. 2A described above from the similarity matrix 28 of FIG.
3 stores the node, the degree of similarity, the array 1, and the array 2 at the time of obtaining 3. For example, the array 28 in FIG.
Is the maximum similarity 1792 of the similarity matrix of FIG.
The paired sequences to be combined are the sequence 3 and the sequence 17, which are the sequence 1 and the sequence 2. Therefore, as shown in the figure, the node, the similarity, the array 1, and the array 2 are
28, 1792, 3, 17 are obtained and stored as the phylogenetic tree information 5 as shown. Similarly, the following is stored as illustrated.

【0029】以上の手順によって求めた図2の(ハ)の
系統樹情報および図2の(イ)の類似度行列をもとに系
統樹を描くと、通常、図14に示す従来の系統樹のよう
になり、類似度が不揃いとなり見難いので、本実施例で
は、系統樹を見やすく類似度順に描くために以下の手順
を行う。
When a phylogenetic tree is drawn based on the phylogenetic tree information shown in FIG. 2C and the similarity matrix shown in FIG. 2A, the conventional phylogenetic tree shown in FIG. 14 is usually obtained. As described above, the similarities are not uniform and difficult to see. Therefore, in the present embodiment, the following procedure is performed in order to make the phylogenetic tree easy to see and to draw the descending order of the similarities.

【0030】図3は、本発明の最大類似度と子供の関係
を示す。ここで、ひとまとめにした配列グループ(図3
では例えばnode48)に、類似度S(i,j)とは
別に、新しい変数、最大類似度simmax(k)(k
=N+1、N+2・・・2N−1)を定義する。これ
は、imaxとjmax(図3ではnode28、4
3)のそれぞれの最大類似度simmax(imax)
とsimmax(jmax)の大きい方を代入する。但
し、jmax<Nかつimax<Nのときは最大類似度
は未だ定義されていないので類似度をそのまま用いて、
simmax(node)=S(imax,jmax)
とする。jmax<Nかつimax>Nのときはsim
max(node)=simmax(imax)とす
る。jmax>Nかつimax<Nのときはsimma
x(node)=simmax(jmax)とする。そ
してsimmaxの値の大きい方からグループ内での配
列順序をつけて表示する。つまり、imax、jmax
あるいはjmax、imaxの順とする。図3の例で
は、simmax(jmax)>simmax(ima
x)の場合で、28、43の順序となる。
FIG. 3 shows the relationship between the maximum similarity and the child according to the present invention. Here, the collected sequence groups (Fig. 3
Then, for example, in the node 48), in addition to the similarity S (i, j), a new variable, maximum similarity simmax (k) (k
= N + 1, N + 2 ... 2N-1) is defined. This means imax and jmax (node 28, 4 in FIG. 3).
3) Maximum similarity simmax (imax) of each
And simmax (jmax) are substituted. However, when jmax <N and imax <N, the maximum similarity is not yet defined, so the similarity is used as it is,
simmax (node) = S (imax, jmax)
And If jmax <N and imax> N, then sim
Let max (node) = simmax (imax). When jmax> N and imax <N, simma
Let x (node) = simmax (jmax). Then, the larger the value of simmax, the more the arrangement order within the group is displayed. That is, imax, jmax
Alternatively, the order is jmax and imax. In the example of FIG. 3, simmax (jmax)> simmax (ima
In the case of x), the order is 28, 43.

【0031】同様にして図2の(イ)ないし(ハ)で説
明した27本の配列の例では、最大類似度と配列1、配
列2の順序について、図4のような結果が得られる。図
4は、本発明の系統樹情報を示す。この系統樹情報5
は、図2の(ハ)の系統樹情報5に対して、図3で説明
した最大類似度をノード28から53についてそれぞれ
求めて付加したものである。これを用いてノードを描く
ときは、例えばノード33を描く場合、最大類似度の大
きいノード31の方から先に描き、次に最大類似度の小
さいノード30を描くとよく、これにより得られる系統
樹は希望の類似度順の見やすい形となる。
Similarly, in the example of the 27 arrays described in (a) to (c) of FIG. 2, the results shown in FIG. 4 are obtained with respect to the maximum similarity and the order of array 1 and array 2. FIG. 4 shows phylogenetic tree information of the present invention. This phylogenetic tree information 5
3 is obtained by adding the maximum similarity described with reference to FIG. 3 to the nodes 28 to 53 to the phylogenetic tree information 5 of FIG. When drawing a node using this, for example, when drawing a node 33, it is better to draw the node 31 with the largest similarity and then the node 30 with the smallest similarity. The tree will be in a shape that is easy to see in the order of desired similarity.

【0032】図5は、グラフイックスとキャラクタでの
系統樹の基本形の対応例を示す。図5の(イ)は、グラ
フィックスで系統樹を描く例を示す。図5の(ロ)は、
キャラクタで系統樹を描く本実施例の例を示す。ここで
は、系統樹の表示に用いるキャラクタとして、−、+、
|の3種類を用いる。FORTRANのように記号|が
利用できないときは、:やIを代用すればよい。このよ
うにキャラクタを用いて系統樹を表示するため、通常の
プリンタによって容易に系統樹を印字したりなどするこ
とが可能となる。
FIG. 5 shows an example of correspondence between basic forms of phylogenetic trees in graphic and characters. FIG. 5A shows an example of drawing a phylogenetic tree by graphics. (B) of FIG.
An example of the present embodiment in which a character tree is drawn with a character is shown. Here, as the characters used for displaying the phylogenetic tree, −, +,
Three types of | are used. If the symbol | cannot be used as in FORTRAN, then: or I may be used instead. In this way, since the tree is displayed using the characters, it is possible to easily print the tree using a normal printer.

【0033】図6は、levelとdepthの関係を
示す。これは、図2および図4で得られた情報(ima
x、jmax、s(imax、jmax)、simma
x(i))をもとにして、最後のノード2N−1(ここ
ではノード53)から逆方向に、対になっている配列グ
ループを辿っていきながら、系統図を作図してゆく際
の、下記7つの変数のうちの2つの変数、levelと
depthの関係を模式的に表したものである。例えば
図中に示すように、左のnode53はlevel
(0)であり、右のnode4はlevel(1)であ
る。このlevelの深さをdepth=1とする。
FIG. 6 shows the relationship between level and depth. This is due to the information (ima
x, jmax, s (imax, jmax), simma
Based on x (i)), when the systematic diagram is drawn while tracing the paired array groups in the opposite direction from the last node 2N-1 (here, node 53) 2 schematically shows the relationship between two variables out of the following seven variables, level and depth. For example, as shown in the figure, the left node 53 is level
(0), and the right node4 is level (1). The depth of this level is depth = 1.

【0034】node:各ノードの番号 level(k):depth=kのノード番号 flg:そのノードあるいは配列名が出力されたかどう
かを表す depth:世代 bar:縦棒を出力するかどうかを指定 position:2つの子供のうちどちらか leaf:出力された配列名の総数 次に、図7のフローチャートを参照して系統樹の作図の
手順を詳細に説明する。
Node: number of each node level (k): node number of depth = k flg: indicates whether the node or array name is output depth: generation bar: specifies whether to output vertical bars position: Either of the two children leaf: Total number of output sequence names Next, the procedure for drawing a phylogenetic tree will be described in detail with reference to the flowchart in FIG. 7.

【0035】最初、初期値として、各ノードに旗、fl
g(i)(i=1、2・・・2N−1)を立てる。も
し、2つの配列がまだ処理されていないときは、0の値
を入れる。根からの距離としてdepth変数を定義
し、初期値として0を入れる。縦棒記号|を書くための
選択変数として、bar(k)(k=N、N+1・・・
2N−1)を定義し、初期値として0を代入する。各レ
ベルでの値levelを定義し、初期値level
(0)として2N−1を代入する。いま着目するノード
nodeの初期値として2N−1とおく。leafは0
とする。
First, as an initial value, each node has a flag, fl.
Set up g (i) (i = 1, 2 ... 2N-1). If the two arrays have not yet been processed, enter a value of 0. Define the depth variable as the distance from the root, and enter 0 as the initial value. As a selection variable for writing the vertical bar symbol |, bar (k) (k = N, N + 1 ...
2N-1) is defined and 0 is substituted as an initial value. Defines the value level at each level, and the initial value level
Substitute 2N-1 as (0). 2N-1 is set as the initial value of the node node of interest. leaf is 0
And

【0036】(A) 今着目するノードnodeの子供
の2つのノードについて次の3通り(図7ではS2、S
3、S4)を調べる(図7ではS1であって、図8の
(ニ)のnode=53、その子供は4と52(図4参
照))。
(A) The following three ways (S2, S in FIG. 7) of the two children of the node node of interest
3, S4) (S1 in FIG. 7, node = 53 in FIG. 8D, the children are 4 and 52 (see FIG. 4)).

【0037】(1) 両方の旗flgが0の場合(図7
ではS2): (1−1) 子供のノードが両方ともN以下のときは、
番号の大きい方を子供1にして、小さい方を子供2にす
る(図8の(ニ)ではノード28の場合、子供1=1
7、子供2=3)。
(1) When both flags flg are 0 (see FIG. 7)
Then S2): (1-1) When both child nodes are N or less,
The child with the larger number is the child 1, and the child with the smaller number is the child 2 (in the case of node 28 in FIG.
7, children 2 = 3).

【0038】(1−2) 子供のノードが両方ともN以
上のときは、simmaxの小さい方を子供1にして、
大きい方を子供2にする(図8の(ニ)ではノード52
の場合、子供1=47、simmax(47)=168
4、子供2=51、simmax(51)=179
2)。
(1-2) When both children's nodes are equal to or more than N, the one with smaller simmax is set to the child 1,
The larger one is the child 2 (node 52 in FIG. 8D)
, Child 1 = 47, simmax (47) = 168
4, children 2 = 51, simmax (51) = 179
2).

【0039】nodeを子供1にして、posion=
1とする(図8の(ニ)ではnode=4)。 depthに1を加える。
Set node to child 1 and position =
1 (node = 4 in (d) of FIG. 8). Add 1 to depth.

【0040】更にそのノードの両方の子供の旗flgが
0ならば、barの値を1にする。 bar(level(depth−1))=1 そして、(B)に進む。
Further, if the flags flg of both children of the node are 0, the value of bar is set to 1. bar (level (depth-1)) = 1 Then, the process proceeds to (B).

【0041】(2) もし子供がどちらかの旗が1なら
ば(図7ではS3)、0の方をnodeに選択する。p
ositionの値を子供の番号にする。即ち子供1の
旗が0ならば、position=1、子供2の旗が0
ならば、position=2とする。
(2) If the child has either flag of 1 (S3 in FIG. 7), 0 is selected as the node. p
Set the value of position to the child's number. That is, if the flag of child 1 is 0, position = 1 and the flag of child 2 is 0.
If so, position = 2.

【0042】depthに1を加える。次に(B)に進
む。 (3) もし子供の両方ともflgが1ならば(図7で
はS4であって、図8の(ニ)で配列番号22、21を
出力した後のnode=47)。
Add 1 to the depth. Then proceed to (B). (3) If both children have flg of 1 (S4 in FIG. 7, node = 47 after outputting sequence numbers 22 and 21 in (d) of FIG. 8).

【0043】いまのノード(図8の(ニ)ではノード4
7)の旗を1にする。depthから1を引く。そして
1段前のノードに戻る(node=level(dep
th)、図8の(ニ)ではnode=52)。
The current node (node 4 in (d) of FIG. 8)
Set the flag of 7) to 1. Subtract 1 from depth. Then, return to the node one step before (node = level (dep
th), and in FIG. 8D, node = 52).

【0044】そしてもしそのノードの子孫の2番目(図
8の(ニ)ではノード51)の旗が0で、子供1(図8
の(ニ)ではノード47)の旗が1のときは、k=2N
−1、2N−2・・・node−1について、bar
(k)=0ならば空白を、bar(k)=1ならば縦棒
と空白を書く(図7ではS5)。
If the flag of the second descendant of the node (node 51 in FIG. 8 (d)) is 0, and child 1 (FIG. 8).
In (d), when the flag of node 47) is 1, k = 2N
-1, 2N-2 ... For node-1, bar
If (k) = 0, write a blank, and if bar (k) = 1, write a vertical bar and a blank (S5 in FIG. 7).

【0045】そして、手順の先頭(A)に戻る。 (B) 次に、level(depth)=nodeと
する。nodeの値で次のどちらかに進む。
Then, the procedure returns to the beginning (A) of the procedure. (B) Next, level (depth) = node is set. Depending on the value of node, proceed to either of the following.

【0046】(1) もし、node>Nならば(図7
ではS6)、+記号を書く。もし、level(dep
th−1)−node−1>1ならば、その値の数だけ
----を書く(図7ではS7)。
(1) If node> N (see FIG. 7)
Then S6), write the + sign. If level (dep
th-1) -node-1> 1, if the number of values
Write ---- (S7 in Fig. 7).

【0047】そして、node番号を書く。もし、po
sition=2ならば、bar(level(dep
th−1))=0とする。
Then, write the node number. If po
If position = 2, bar (level (dep
th-1)) = 0.

【0048】(2) もし、node<Nならば(図7
ではS8)、+記号を書く。level(depth−
1)−N個の----を書く。ノード番号と配列名を書く。
改行する(図7ではS8)。
(2) If node <N (see FIG. 7)
Then S8), write the + sign. level (depth-
1) Write N --- pieces. Write the node number and array name.
A line feed is made (S8 in FIG. 7).

【0049】position=2ならば、bar(l
evel(depth−1))=0とする。このノード
の旗を1にする。
If position = 2, bar (l
It is set as (ever (depth-1)) = 0. Set the flag of this node to 1.

【0050】葉の数を1増加させる。次のノードをde
pth−1にする。もし、position=1で、d
epth>1ならば、2N−1−node+1個の空白
または|を書く(図7ではS10)。
Increase the number of leaves by one. De next node
Set to pth-1. If position = 1, d
If ept> 1, write 2N-1-node + 1 blanks or | (S10 in FIG. 7).

【0051】depthの値を1引く。もし、葉の数が
N以下であれば、手順の先頭(A)に戻る。Nであれ
ば、手順を終了する。
Subtract 1 from the value of depth. If the number of leaves is N or less, the process returns to the beginning (A) of the procedure. If N, the procedure ends.

【0052】以上の手順で得られた出力結果を最終行か
ら逆に書くと、希望の系統樹が得られる。次に、図8か
ら図10を用いて具体的に説明する。
By writing the output results obtained by the above procedure in reverse order from the last line, a desired phylogenetic tree can be obtained. Next, a specific description will be given with reference to FIGS.

【0053】既述した27本の配列の例(図4)では、
ノード53から始める。53を出力する。(A)につい
ては、図4からその子供は4と52である(図7のS
1)。両方ともにまだ旗flgが0である(図7のS
2)。node=4、posion=1、depth=
1として、(B)に進む。level(1)=4とす
る。4<N=27なので(図7のS8)、+を出力する
(図7のS9)。level(depth−1)−N=
53−27個の---を出力(図7のS9)。配列番号と
配列名を出力して、改行する(図7のS9)。配列番号
4についてflg=1とする(図7のS9)。配列4を
出力したので、葉の下図(leaf)を1とする。ここ
までの手順で、図8の(イ)の出力結果が得られる。
In the example of the 27 arrays described above (FIG. 4),
Start at node 53. 53 is output. For (A), the children are 4 and 52 from FIG. 4 (S in FIG. 7).
1). In both cases, the flag flg is still 0 (S in FIG. 7).
2). node = 4, position = 1, depth =
If the value is 1, proceed to (B). Let level (1) = 4. Since 4 <N = 27 (S8 in FIG. 7), + is output (S9 in FIG. 7). level (depth-1) -N =
53-27 pieces of --- are output (S9 in FIG. 7). The array number and array name are output and a line feed is performed (S9 in FIG. 7). Flg = 1 is set for SEQ ID NO: 4 (S9 in FIG. 7). Since the array 4 has been output, the lower leaf (leaf) is set to 1. By the procedure up to this point, the output result of (a) in FIG. 8 is obtained.

【0054】node=level(depth−1)
=53とする。depthから1を引く。(A)に戻る
(S10は実行しない)。ノード53の片方の子供1
(配列番号4)の旗flgが1なので(図7のS6)、
(A)の(2)からnode=52、position
=2、depth=1として、(B)に進む。node
=52>N=27なので(図7のS6)、+を出力、ノ
ード番号52を出力する(図7のS7)。positi
on=2なので、bar(53)=0とする。(A)に
戻る。
Node = level (depth-1)
= 53. Subtract 1 from depth. The process returns to (A) (S10 is not executed). One child of node 53
Since the flag flg of (SEQ ID NO: 4) is 1 (S6 in FIG. 7),
From (2) of (A), node = 52, position
= 2 and depth = 1, the process proceeds to (B). node
Since = 52> N = 27 (S6 in FIG. 7), + is output and the node number 52 is output (S7 in FIG. 7). postiti
Since on = 2, bar (53) = 0 is set. Return to (A).

【0055】ノード52と子供47と51のflgが0
である(図7のS2)。(A)の(1)の(1−2)か
らsimmaxの小さいノード47を子供1にする。図
7のS6、S7に進み、+と--と47を出力する。
The flg of the node 52 and the children 47 and 51 is 0.
(S2 in FIG. 7). From (1-2) of (1) of (A), a node 47 having a small simmax is set as a child 1. Proceeding to S6 and S7 in FIG. 7, +,-, and 47 are output.

【0056】(A)に戻り、ノード47の子供22と2
1のflgが0である(図7のS2)。(A)の(1)
の(1−1)から番号の大きいノード22を子供1とす
る。22<N=27なので、+と--と配列番号と配列名
を出力する(図7のS9)。配列22は、positi
on=1でdepth=2>1なので、空白と縦棒|を
出力する(図7のS10)。depthから1を引いて
(A)に戻る。ここまでの手順で、図8の(ロ)の出力
結果が得られる。
Returning to (A), children 22 and 2 of node 47
The flg of 1 is 0 (S2 in FIG. 7). (1) of (A)
The node 22 having a larger number from (1-1) in FIG. Since 22 <N = 27, +,-, the array element number and the array name are output (S9 in FIG. 7). Sequence 22 is a positioni
Since on = 1 and depth = 2> 1, blank and vertical bar | are output (S10 in FIG. 7). Subtract 1 from depth and return to (A). By the procedure up to this point, the output result of (b) in FIG. 8 is obtained.

【0057】いまノードは47である。子供2の配列2
1の処理がまだなので(図7のS3)、それを実行し、
21の配列名まで出力する(図7のS8、S9)。また
1世代前のノード47に戻る。depthから1を引
く。(A)へ戻る。この時点でノード47の子供は両方
ともflg=1なので(図7のS4)、1世代前のノー
ド52に戻る。ここでノード52の子供1はflg=1
で子供2はflg=0なので、必要な個数の空白を出力
する(図7のS5)。(A)で戻り、ノード52の子供
1はflg=1で子供2(ノード51)はflg=0な
ので(図7のS3)、(B)へ進む。ノード51につい
て+とノード番号を出力する(図7のS6、S7)。こ
こまでの手順で、図8の(ハ)の出力結果が得られる。
There are now 47 nodes. Child 2 array 2
Since the process of 1 is not done yet (S3 in FIG. 7), execute it,
Up to 21 array names are output (S8 and S9 in FIG. 7). Also, the process returns to the node 47 one generation before. Subtract 1 from depth. Return to (A). At this point, both children of the node 47 have flg = 1 (S4 in FIG. 7), and the process returns to the node 52 one generation before. Here, the child 1 of the node 52 has flg = 1.
Since child 2 has flg = 0, it outputs the necessary number of blanks (S5 in FIG. 7). Returning to (A), the child 1 of the node 52 has flg = 1 and the child 2 (node 51) has flg = 0 (S3 in FIG. 7), and the process proceeds to (B). The + and the node number are output for the node 51 (S6 and S7 in FIG. 7). By the procedure up to this point, the output result of FIG. 8C is obtained.

【0058】以下このような手順を進めて+、--、|、
ノード番号、配列名を出力していく。結局、葉の数(l
eaf)が27になったところで、図8の(ニ)に示す
ような系統樹が得られる。
The procedure described above is then advanced to +,-, |,
The node number and array name are output. After all, the number of leaves (l
When eaf) becomes 27, a phylogenetic tree as shown in (d) of FIG. 8 is obtained.

【0059】この図8の(ニ)のキャラクタによる系統
図では、類似度の低い配列対から出力しているので、こ
れを逆に描くことにより類似度の高い配列対から出力し
た系統樹として、図9の系統樹を得ることができる。
In the systematic diagram by the character (d) of FIG. 8, since the output is made from the sequence pair having a low degree of similarity, the systematic tree output from the sequence pair having a high degree of similarity can be drawn by reversing this. The phylogenetic tree of FIG. 9 can be obtained.

【0060】図9は、本発明のキャラクタによる系統樹
の表現例を示す。これは、既述した手順によって、図8
の(ニ)のように求めたものを逆に描き、類似度の高い
配列対から出力した系統樹である。ここで、キャラクタ
として、+、--、|の3種類を用いたが、他のもの(例
えば:、I)を用いてもよい。また、枝を描くための--
--の個数を任意に変えてもよい。ノード番号を記入せず
に系統樹を描いてもよい。
FIG. 9 shows an example of representation of a phylogenetic tree by the character of the present invention. This is shown in FIG.
This is a phylogenetic tree that was drawn in reverse from the one obtained in (d) and output from the pair of sequences with high similarity. Here, three types of characters, +,-, and | are used, but other types (for example,:, I) may be used. Also for drawing branches--
The number of --may be changed arbitrarily. A phylogenetic tree may be drawn without entering the node number.

【0061】図10は、本発明の他のキャラクタによる
系統樹の表現例を示す。これは、マルチプルアライメン
トの結果との合成例であって、図9とは異なる配列デー
タや類似度の値となっている。
FIG. 10 shows an example of representation of a phylogenetic tree by another character of the present invention. This is an example of composition with the result of multiple alignment, and has different sequence data and similarity values from those in FIG. 9.

【0062】次に、図11から図13を用いて他の実施
例の構成および動作を詳細に説明する。 (1) 既述した最大類似度とそれによる配列1、配列
2の順序についての情報を利用し、グラフィックで系統
樹を表示する例を示す。27本の配列の場合、まず図4
から、ノード53はノード52とノード4の順序であ
る。更にノード52はノード51とノード47の順序で
ある。以下ノード28まで配列順序を展開して辿ってい
くと、27本全体の配列順序が3、17、5、6、1
8、7、16、8、1、11、9、12、13、24、
25、26、27、19、14、15、2、20、2
3、10、21、22、4となる。そこでこの順序で配
列番号と配列名を垂直方向に単位長さづつシフトしなが
らグラフィックの出力として描いていく(図11のS2
1、図12の21)。
Next, the configuration and operation of another embodiment will be described in detail with reference to FIGS. 11 to 13. (1) An example in which a phylogenetic tree is graphically displayed by using the above-described maximum similarity and the information about the order of the array 1 and the array 2 resulting therefrom is shown. In the case of 27 arrays, first, FIG.
Therefore, the node 53 is the order of the node 52 and the node 4. Further, the node 52 is the order of the node 51 and the node 47. When the array order is expanded to the node 28 and traced below, the array order of the entire 27 lines is 3, 17, 5, 6, 1.
8, 7, 16, 8, 1, 11, 9, 12, 13, 24,
25, 26, 27, 19, 14, 15, 2, 20, 2
It becomes 3, 10, 21, 22, and 4. Therefore, in this order, the array number and the array name are vertically shifted by a unit length and drawn as a graphic output (S2 in FIG. 11).
1, 21 in FIG. 12).

【0063】(2) 次に、図4のノード28からその
子供を結合していく。ノード28の子供は3と17なの
で(図11のS22、図12のS22)、図12の
(イ)のようになる。ここで、枝の水平方向の長さは類
似度から決める。同様にして、次のノード29について
もその子供を結合し、図12の(ロ)に示すようにな
る。以下同様にしてノード53までその子供を結合する
と、図13に示すような系統樹が描ける。
(2) Next, the child is joined from the node 28 in FIG. Since the children of the node 28 are 3 and 17 (S22 of FIG. 11 and S22 of FIG. 12), the result is as shown in FIG. Here, the horizontal length of the branch is determined from the similarity. Similarly, the children of the next node 29 are also combined, as shown in FIG. When the children are connected to the node 53 in the same manner, a phylogenetic tree as shown in FIG. 13 can be drawn.

【0064】[0064]

【発明の効果】以上説明したように、本発明によれば、
類似度行列4から最大の類似度の2つの配列を新たな1
つの配列にした系統樹情報5を生成し、この系統樹情報
5をもとに各ノードの最大類似度を求めて付加し、この
最大類似度の順に系統樹を生成する構成を採用している
ため、類似度が徐々に増加するように揃えて配置して見
やすくかつ比較し易い系統樹を描くことができる。これ
により、 (1) 類似度(あるいは距離)の値から見やすい系統
樹を作図できる。
As described above, according to the present invention,
From the similarity matrix 4, the two arrays with the maximum similarity are added to the new 1
Generating the phylogenetic tree information 5 in one array, finding the maximum similarity of each node based on this phylogenetic tree information 5 and adding it, the phylogenetic tree is generated in the order of this maximum similarity. Therefore, it is possible to draw phylogenetic trees that are easy to see and compare by arranging them so that the similarity gradually increases. As a result, (1) it is possible to draw a phylogenetic tree that is easy to see from the value of similarity (or distance).

【0065】(2) キャラクタ表示/印刷により広範
囲の計算機で、グラフィックスソフトに影響されずに利
用できる。 (3) マルチプルアライメントと並べて表示/印刷す
ることにより、アライメント結果を理解するのに役立
つ。
(2) Character display / printing enables use in a wide range of computers without being affected by graphics software. (3) Displaying / printing side by side with multiple alignment helps to understand the alignment result.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.

【図2】本発明の類似度行列/系統樹情報である。FIG. 2 is similarity matrix / phyloge tree information of the present invention.

【図3】本発明の最大類似度と子供の関係図である。FIG. 3 is a relationship diagram between the maximum similarity and the child according to the present invention.

【図4】本発明の系統樹情報である。FIG. 4 is phylogenetic tree information of the present invention.

【図5】グラフィックスとキャラクタでの系統樹の基本
形の対応例である。
FIG. 5 is an example of correspondence between basic forms of a phylogenetic tree in graphics and characters.

【図6】levelとdepthの関係図である。FIG. 6 is a relationship diagram between level and depth.

【図7】本発明の動作説明フローチャートである。FIG. 7 is a flowchart for explaining the operation of the present invention.

【図8】本発明のキャラクタによる系統樹の表現例であ
る。
FIG. 8 is an example of representation of a phylogenetic tree by the character of the present invention.

【図9】本発明のキャラクタによる系統樹の表現例であ
る。
FIG. 9 is an example of representation of a phylogenetic tree by the character of the present invention.

【図10】本発明の他のキャラクタによる系統樹の表現
例である。
FIG. 10 is a representation example of a phylogenetic tree by another character of the present invention.

【図11】本発明の他のグラフィックで系統樹を作図す
る手順である。
FIG. 11 is a procedure for drawing a phylogenetic tree with another graphic according to the present invention.

【図12】本発明の他の実施例の説明図である。FIG. 12 is an explanatory diagram of another embodiment of the present invention.

【図13】本発明の他の系統樹である。FIG. 13 is another phylogenetic tree of the present invention.

【図14】従来の系統樹例である。FIG. 14 is an example of a conventional phylogenetic tree.

【符号の説明】[Explanation of symbols]

1:系統樹出力装置 2:系統樹処理部 3:出力部 4:類似度行列 5:系統樹情報 6:系統樹 7:ディスプレイ 8:プリンタ 1: Phylogenetic tree output device 2: Phylogenetic tree processing unit 3: Output unit 4: Similarity matrix 5: Phylogenetic tree information 6: Phylogenetic tree 7: Display 8: Printer

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 系統樹を出力する系統樹出力装置におい
て、 配列の間の類似度を予め求めて行列とした類似度行列
(4)と、 この類似度行列(4)中の最大類似度の対の配列につい
て新たな配列および類似度を生成することを繰り返し、
作成した系統樹情報(5)と、 この系統樹情報(5)の対の配列のうちの大きい方の類
似度を最大類似度として求めて上記系統樹情報(5)に
付加し、 この付加した系統樹情報(5)の最大類似度の順に系統
樹を生成して出力するように構成したことを特徴とする
系統樹出力装置。
1. A phylogenetic tree output device for outputting a phylogenetic tree, comprising: a similarity matrix (4) which is a matrix in which the similarity between arrays is obtained in advance; and a maximum similarity of the similarity matrix (4). Repeating the generation of new sequences and similarities for the paired sequences,
The similarity of the created phylogenetic tree information (5) and the larger of the paired sequences of the phylogenetic tree information (5) is obtained as the maximum similarity, and is added to the phylogenetic tree information (5). A phylogenetic tree output device configured to generate and output a phylogenetic tree in the order of maximum similarity of the phylogenetic tree information (5).
【請求項2】 上記付加した系統樹情報(5)の最大類
似度の順に順次系統樹をキャラクタ(例えば+、−、|
など)を用いて出力するように構成したことを特徴とす
る請求項第1項記載の系統樹出力装置。
2. A phylogenetic tree is sequentially displayed in the order of maximum similarity of the added phylogenetic tree information (5) as characters (for example, +, −, |
And the like) are used to output the system tree output device according to claim 1.
【請求項3】 上記付加した系統樹情報(5)の最大類
似度の昇順(あるいは降順)に展開して配列番号、配列
名を並べ、垂直方向にこれら配列番号、配列名を出力、
およびこれらに子供を結合して系統樹をグラフィカルに
生成して出力するように構成したことを特徴とする請求
項第1項記載の系統樹出力装置。
3. The sequence numbers and sequence names are arranged by expanding the added phylogenetic tree information (5) in ascending order (or descending order) of the maximum similarity, and outputting these sequence numbers and sequence names in the vertical direction.
2. The phylogenetic tree output device according to claim 1, wherein the phylogenetic tree is configured so that a child is connected to these and the phylogenetic tree is graphically generated and output.
JP3293215A 1991-11-08 1991-11-08 Phylogenetic tree output device Withdrawn JPH05128171A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3293215A JPH05128171A (en) 1991-11-08 1991-11-08 Phylogenetic tree output device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3293215A JPH05128171A (en) 1991-11-08 1991-11-08 Phylogenetic tree output device

Publications (1)

Publication Number Publication Date
JPH05128171A true JPH05128171A (en) 1993-05-25

Family

ID=17791917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3293215A Withdrawn JPH05128171A (en) 1991-11-08 1991-11-08 Phylogenetic tree output device

Country Status (1)

Country Link
JP (1) JPH05128171A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007207113A (en) * 2006-02-03 2007-08-16 Hitachi Software Eng Co Ltd Genealogical tree display system
WO2009023821A1 (en) * 2007-08-15 2009-02-19 Opgen, Inc. Method, system and software arrangement for comparative analysis and phylogeny with whole-genome optical maps
EP2423842A1 (en) 2010-05-25 2012-02-29 Sony Corporation Information processing apparatus, method and program for phylogeny analysis

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007207113A (en) * 2006-02-03 2007-08-16 Hitachi Software Eng Co Ltd Genealogical tree display system
WO2009023821A1 (en) * 2007-08-15 2009-02-19 Opgen, Inc. Method, system and software arrangement for comparative analysis and phylogeny with whole-genome optical maps
EP2423842A1 (en) 2010-05-25 2012-02-29 Sony Corporation Information processing apparatus, method and program for phylogeny analysis

Similar Documents

Publication Publication Date Title
Benson et al. Reconstructing the duplication history of a tandem repeat.
Della Croce et al. A genetic algorithm for the job shop problem
Searls The linguistics of DNA
US7016896B2 (en) Pattern search method, pattern search apparatus and computer program therefor, and storage medium thereof
KR20060008292A (en) System and method for storing and accessing data in an interlocking trees datastore
DE69428265T2 (en) METHOD AND SYSTEM FOR THE PRODUCTION, SPECIFICATION AND GENERATION OF PARAMETRIC FONTS
Herman Computing ability of a developmental model for filamentous organisms
Kari et al. Computational power of gene rearrangement.
US6862532B2 (en) Apparatus for manifesting latent characteristics existing in sequences of symbols
JPH05128171A (en) Phylogenetic tree output device
CN113326329A (en) Method for pushing account-keeping person based on block chain consensus
US8280641B1 (en) Utility of genomic fractals resulting in fractals of organisms
Snider et al. U-parking functions and (p, q)-parking functions
Matsumoto et al. Learning pattern languages using queries
JPH0337697A (en) Character generator
Ashlock et al. Single parent generalization of cellular automata rules
Reinert A polyhedral approach to sequence alignment problems
Akanbasiam et al. The Genetic Code: A Case of Residue Number System (Rns)
CN117116361B (en) 12sRNA secondary structure visualization method based on fixed frame
Ferretti et al. On the universality of Post and splicing systems
Martin Transformations between tree permutations and inversion tables
JPH06215044A (en) Information retrieval processor
CN106022006A (en) Storage method for conducting binary representation on gene information
Alberti Dynamic and probabilistic aspects of recombination
Goodwin-Schoen et al. Modular, Articulated Models of DNA and Peptide Nucleic Acids for Nanotechnology Education

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990204