JP2003271667A - 木構造間距離計算装置および方法 - Google Patents

木構造間距離計算装置および方法

Info

Publication number
JP2003271667A
JP2003271667A JP2002071274A JP2002071274A JP2003271667A JP 2003271667 A JP2003271667 A JP 2003271667A JP 2002071274 A JP2002071274 A JP 2002071274A JP 2002071274 A JP2002071274 A JP 2002071274A JP 2003271667 A JP2003271667 A JP 2003271667A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
distance
stored
trees
part
memories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002071274A
Other languages
English (en)
Inventor
Tsuguaki Ryu
紹明 劉
Original Assignee
Fuji Xerox Co Ltd
富士ゼロックス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

(57)【要約】 【課題】 根があり順序がない木の間の距離を頂点間と
辺間の対応関係を考慮して計算する。 【解決手段】 メモリ2,3は,外部記録装置1の木構
造データを記録する。データ変換部4はメモリ2,3に
格納している木構造データを用いて根からプリオーダー
順で頂点と辺を番号付け,距離計算に必要なデータを付
加し,その結果をメモリ5,6に格納する。森間の距離
計算部9は,メモリ5,6に記録されている森に対し
て,メモリ7に格納している森に属している部分木間の
距離を用いて森間の距離を求め,その結果を部分木間の
距離計算部8に提供する。部分木間の距離計算部8は,
メモリ5,6に記録されている部分木に対して,メモリ
7に格納している部分木間の距離及び森間の距離計算部
9から提供された森の距離の値を利用して,部分木間の
距離を求め,その結果をメモリ7に格納させる。

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は木構造を持つものの
間の類似性を計るための尺度である距離を計算する木構
造間距離計算技術に関し,特に,頂点と辺が同時に情報
を持ち,根があり順序がない木構造の間の距離を計算す
るようにしたものである。 【0002】 【従来の技術】木構造をしている対象は世の中に数多く
存在する。例えば,文字列,RNAの2次構造,地震
波,文脈構造,構文・意味解析の結果,化合物の分子構
造等はグラフで表現できる。それらがどの程度似ている
かを調べたり,ある対象の構造と似たものが他の対象の
中に存在しているかどうかを知ったり,2つの対象の中
にもっともよく似ている部分構造を知りたいことがあ
る。これらの問題をグラフ理論上の距離問題,最大類似
部分問題,最大共通類似部分問題に帰着することができ
る。 【0003】距離問題は構造により系列間距離問題,図
形間距離問題,木の間の距離問題,グラフ間距離問題に
分けることができる。系列間距離問題は遺伝子を比較し
て系統図を推定する問題,符号理論,音声認識などの分
野から出てきたものであり,よく研究されている。系列
間距離の拡張として,図形間距離,木の間の距離があ
る。木の距離に関する研究は,例えば,論文「The tree
-to-tree correction problem」(JACM,vol.26,no.3,pp.
422-433,1979,K.C. Tai),論文「強構造保存写像に基
づく木の間の距離とその計算法」(信学論,vol.J67-D,
no.6,pp.722-723,1984,田中)に記載されているよう
に,根があり順序がある木の研究から,論文「The dist
ances between unrooted and cyclically ordered tree
s and their computing methods」(IEICE Trans. Inf.
& Syst., vol.E77-D, no.10, pp.1094-1105,1994,S.M.
Liu, E. Tanaka and S. Masuda),論文「A metric bet
weenunrooted and unordered trees and its bottom-up
computing method」(IEEETrans. Pattern Anal. & Mac
h. Intell., vol.16,no.12,pp.1233-1238,1994,E.Tanak
a),論文「順序がない木の距離を求めるアルゴリズム」
(信学論,vol.J78-A,no.10,pp.1358-1371,1995,
劉,田中) に記載されているように,平面に埋め込まれ
た木や根がなく順序がない木へと拡がりつつある。最大
類似部分問題と最大共通類似部分問題に対して,論文
「木の最大類似部分問題とそのアルゴリズム」(信学
論,vol.J78-A,no.10,pp.1348-1357,1995,劉,田
中,増田),論文「Efficient algorithms for finding
largest similar substructures in unordered trees」
(IEICE Trans. Fundamentals, vol.E79-A,no.4, pp.428
-440, 1996,S.M. Liu and E. Tanaka),論文「The lar
gest common similar substructure problem」(IEICE T
rans. Fundamentals, vol. E80-A,no.4, pp.643-650,
1997,S.M. Liu and E. Tanaka)に記載されているよう
に,木を対象とした研究が行われている。しかし,木に
おける距離,最大類似部分及び最大共通類似部分は,木
の頂点間の写像に基づいて定義されたものであり,辺間
の対応関係を考慮していなかった。現実には,木構造を
している対象の情報は木の頂点に格納する場合もある
し,木の辺に格納する場合もある。また,頂点と辺に同
時に情報を記憶する場合もある。例えば,テキスト文の
構文・意味解析の結果に対して,単語の情報(単語,品
詞,素性など)が木の頂点に格納され,単語の格情報が
木の辺に格納されるので,テキスト文間の類似性を求め
るために,頂点間と辺間の対応関係に基づく写像,及び
その写像に基づく木の間の距離を獲得しなければならな
い。さらに,木の各頂点の下方向につながっている頂点
間に順序がない場合があるので,根があり順序がない木
の間の距離とその距離の計算方法を獲得する必要があ
る。 【0004】 【発明が解決しようとする課題】本発明は,上述した事
情に鑑みてなされたものであり,従来の木の間の距離は
辺の対応関係を考慮していないという問題を解決するた
めに,根があり順序がない木の間において,頂点間と辺
間の対応関係を考慮した距離を効率よく計算する計算手
法を提供することを目的とするものである。 【0005】 【課題を解決するための手段】本発明によれば,上述の
目的を達成するために,特許請求の範囲に記載のとおり
の構成を採用している。 【0006】本発明の原理的な構成によれば,まず,木
構造を持つものを,根があり順序がない木で表現し,頂
点間と辺間の対応関係を同時に考慮する木の間の強構造
保存写像を定義し,その写像に基づく木の間の距離を定
義する。続いて,その距離を効率よく求めるために,木
の葉を根とする部分木間の距離を最初に求め,順次に頂
点数の多い部分木間の距離を求めることにより,与えら
れた二つの木の間の距離を効率良く求めることにより上
記の課題を解決でき,頂点と辺に同時に情報をもつ木構
造間の類似性を計ることが可能になる。 【0007】さらに本発明について説明する。なお,説
明の便宜上,後述する図1で用いた符号を対応部分に付
した。 【0008】本発明の一側面によれば,木構造を持つ対
象の間の類似性を表す尺度である距離を計算する木構造
間距離計算装置に:木構造を持つ対象を,根があり順序
がない木で表現する木構造情報を,前記木の各頂点と各
辺にラベルを付して記憶する木構造情報記憶手段(1)
と;木の各頂点と各辺に,他の木の各頂点と各辺との対
応関係を与える番号を付ける番号付け手段(4)と;頂
点間の対応関係と辺間の対応関係に基づく写像条件に従
う,木の間の各写像を決定する手段(14)と;前記木
の間の各写像の重みを少なくとも前記各頂点および各辺
のラベルに従って決定する手段(8の一部)と;前記木
の間の各写像の重みに基づいて前記木の間の類似性を表
す尺度である距離を決定する手段(8)とを設けてい
る。 【0009】この構成においては,木の頂点および辺に
ラベルが付されているので,頂点のみでなく辺に情報を
付した木の間でも距離を扱うことができる。 【0010】また,本発明の他の側面によれば,木構造
を持つ対象の間の類似性を計るための尺度である距離を
計算する木構造間距離計算装置に:木構造を持つ対象
を,根があり順序がない木で表現する木構造情報を生成
する木構造情報生成手段(12)と;木の各頂点と各辺
にラベルを付けるラベル付け手段(13)と;木の各頂
点と各辺に,他の木の各頂点と各辺との対応関係を与え
る番号を付ける番号付け手段と;頂点間の対応関係と辺
間の対応関係に基づく写像条件に従う,木の間の各写像
を決定する手段(14)と;前記木の間の各写像に対応
する,森(木の根を除いて残した部分)の間の写像を決定
する手段と;前記森の間の各写像の重みを決定する手段
(9の一部)と;前記森の間の各写像の重みに基づいて
前記森の間の類似性を表す尺度である森の間の距離を決
定する手段(9)と;前記森の間の距離に基づいて前記
木の間の各写像の重みを決定する手段(8の一部)と;
前記木の間の各写像の重みに基づいて前記木の間の類似
性を表す尺度である距離を決定する手段(8)とを設け
ている。 【0011】この構成においては,森という概念を導入
し,木の間の距離を森の間の距離から求めるようにし,
より簡易に木構造間の距離を計算することが可能とな
る。 【0012】なお,本発明は装置またはシステムの形態
のほかに,方法の形態で実現することも可能である,さ
らに少なくともその一部をコンピュータプログラムとし
て実現することも可能である。 【0013】本発明の上述の側面および本発明の他の側
面は特許請求の範囲に記載され,以下実施例を用いて詳
細に説明される。 【0014】 【発明の実施の形態】以下,本発明の実施例について詳
細に説明する。この実施例においては,木構造間の距離
を,部分木の距離の計算に帰着させ,最終的な部分木で
ある葉の間の距離からブートストラップの態様で木構造
間の距離を計算する。さらに部分木をその森(部分木の
頂点を除いたもの)と頂点に分解して,森の間の距離を
利用して当該部分木の距離を求める。この実施例では,
最終的な木の間の距離が求められるまで,森の間の距離
の計算および部分木の距離の計算が繰り返し実行され
る。 【0015】図1は,本発明の木構造間距離計算装置の
実施例の構成を全体として示すブロック図である。図
中,1は外部記憶装置,2,3,5,6はメモリ,4は
距離の計算に必要なデータを生成するデータ変換部,7
は部分木間の距離を記憶するメモリ,8は部分木間の距
離計算部,9は森間の距離計算部,10は距離計算制御
部,11は記憶部である。 【0016】外部記録装置1には,木構造データが格納
されている。木構造データはラベル付け部13およびラ
ベル付木構造データ生成部12により,距離測定対象
(文字列,構文・意味解析結果等)の属性に基づいて生
成される。木構造データは,場合によっては,予め用意
され,外部から入力される。メモリ2,3は,それぞ
れ,外部記録装置1に格納されている木構造データの一
つの木構造データを記録する。データ変換部4はメモリ
2,3に格納している木構造データを用いて根からプリ
オーダー順で頂点と辺を番号付け,距離計算に必要なデ
ータを付加し,その結果をそれぞれメモリ5,6に格納
させる。ここで,メモリ2,3,メモリ5,6を1つに
まとめた構成,さらにはメモリ2,3,メモリ5,6を
設けない構成であってもよい。 【0017】森間の距離計算部9は,メモリ5,6に記
録されている森に対して,メモリ7に格納している森に
属している部分木間の距離を用いて森間の距離を求め,
その結果を部分木間の距離計算部8に提供する。部分木
間の距離計算部8は,メモリ5,6に記録されている部
分木に対して,メモリ7に格納している部分木間の距離
及び森間の距離計算部9から提供された森の距離の値を
利用して,部分木間の距離を求め,その結果をメモリ7
に格納させる。 【0018】距離計算制御部10は,木の葉を根とする
部分木間の距離を最初に計算し,順次頂点数の大きい部
分木間の距離を計算することを制御する。すべての部分
木間の距離が求められたら,頂点数が一番大きい部分木
間の距離が入力された二つの木の間の距離であり,その
値を記憶部11に記憶させる。 【0019】部分木間の距離計算部8および森間の距離
計算部9は,以下に詳述する写像条件を満たす写像の各
々について重みを計算し,この重みに基づいて木の間お
よび森の間の距離を計算する。距離計算制御部10の写
像部14は,写像条件を満たす写像を求めるものであ
る。 【0020】次に本発明の木構造間距離計算装置の実装
例として,情報端末装置に適用させた場合の装置構成に
ついて説明する。図2は本発明の木構造間とその距離の
計算方法を情報端末装置に適用させた場合の装置構成を
示す図である。 【0021】図2において,情報端末装置20は,外部
記憶装置21,キーボート22,ディスプレイ23,プ
ロセッサ部24から構成される。外部記憶装置21は,
入力された木構造データや,求められた木の間の距離の
結果や,計算に必要な記憶空間や,ソフトウエアなどを
格納する。外部記憶装置21の具体例として,例えばハ
ードディスクなどで構成することができる。キーボート
22は,ユーザが操作を指示するための入力装置であ
り,その他の入力装置が付加されていてもよい。ディス
プレイ23は,ユーザに対するメッセージや木構造の情
報データ,距離の計算結果などを表示するための出力装
置である。勿論他の出力装置が付加されていてもよい。
プロセッサ部24は,外部記憶装置21に格納されてい
るソフトウェアなどに従って,実際の処理を行う。プロ
セッサ部24は,具体的にマイクロプロセッサや,パー
ソナルコンピュータなどのコンピュータシステムで構成
することができる。そして,図1のデータ変換部5,部
分木間の距離計算部8,森間の距離計算部9,距離計算
制御部10は,このプロセッサ部24の上で動作するソ
フトウェアによって構成することができる。 【0022】次に本発明の木構造間の距離の計算方法の
動作をさらに詳細に説明する。外部記憶装置1には,木
構造データを格納している。外部記憶装置1から二つの
木構造データを読み出し,メモリ2とメモリ3にそれぞ
れ記憶させ,データ変換部4において木の各頂点と辺が
番号付けられ,距離計算に必要なデータが付加される。
図3は,一つの木構造を表し,その木構造のデータが図
4(a)のフォーマットに従って外部記憶装置1に記憶
されている。図4(b)は図1に示す木構造の記憶デー
タ形式である。勿論,木構造の付加データを記憶しても
よいし,他のフォーマットで記憶してもかまわない。 【0023】データ変換部4は,メモリ2とメモリ3に
記憶された木構造データを,図5に示すように,木の頂
点と辺を根からプリオーダー順で番号を付け,距離計算
に必要なデータ,例えば,親へのポイント,左右兄弟へ
のポイント,子供の数,家族の頂点の数と辺の数などを
付加する。図6はデータ変換部4によって変換されたデ
ータのフォーマットである。ここで,頂点と該頂点の親
間の辺に同じ番号を付ける。勿論,異なる番号をつけて
もかまわない。区別するために,頂点の番号をx,y等
のアルファベットで表し,頂点と親間の辺の番号を該当
するアルファベットにチルダを付して表す。 【0024】部分木間の距離計算部8と森間の距離計算
部9を説明する前に,計算方法に使用された記号,木の
間の写像,写像の重みと木の間の距離を定義する。 【0025】 【表14】【0026】 【表15】【0027】 【表16】【0028】 【表17】【0029】 【表18】 【0030】 【表19】【0031】 【表20】 【0032】 【表21】【0033】 【表22】 【0034】 【表23】【0035】 【表24】【0036】 【表25】【0037】 【表26】【0038】 【表27】【0039】 【表28】【0040】 【表29】 【0041】 【表30】【0042】 【表31】 【0043】 【表32】【0044】 【表33】 【0045】 【表34】【0046】 【表35】 【0047】 【表36】【0048】 【表37】【0049】 【表38】【0050】 【表39】【0051】 【表40】【0052】 【表41】【0053】 【表42】【0054】 【表43】【0055】 【発明の効果】以上の説明から明らかなように,本発明
の木構造間距離計算手法では,木構造を根があり順序が
ない木で表現し,木の各頂点と辺を番号付け,頂点間と
辺間の対応関係を同時に考慮した木の間の強構造保存写
像を定義し,その写像に基づく木の間の距離を計算する
ことができる。本発明により,木構造を持つもの間の類
似性を数学的定量的に定義でき,実用時間で求めること
ができる。特に,頂点と辺が同時に情報をもつ対象間の
類似性を計るための距離の数学的定量的な定義と計算が
可能になった。

【図面の簡単な説明】 【図1】 本発明の木構造間距離計算装置の実施例を示
すブロック図である。 【図2】 本発明の木構造間距離計算装置に実装例を示
す図である。 【図3】 本発明の木構造を説明する図である。 【図4】 本発明の木構造データのフォーマットと記憶
形式の例を示す図である。 【図5】 本発明における根があり順序がない木の頂点
と辺の番号付けを説明する図である。 【図6】 本発明における距離を計算するための木のデ
ータ構造を示す図である。 【図7】 本発明における部分木と森を説明する図であ
る。 【図8】 本発明における強構造保存写像を説明する図
である。 【図9】 頂点間と辺間の対応関係に基づく木(根の
上に辺を持たない)から木(同)への写像種類の説明図
である。 【図10】 頂点間と辺間の対応関係に基づく木(根の
上に辺を持つ)から木(同)への写像種類の説明図であ
る。 【図11】 頂点間と辺間の対応関係に基づく木(根の
上に辺を持つ)から木(根の上に辺を持たない)への写
像種類の説明図である。 【図12】 頂点間と辺間の対応関係に基づく木(根の
上に辺を持たない)から木(根の上に辺を持つ)への写
像種類の説明図である。 【図13】 森間の写像の説明図である。 【図14】 部分木から2部グラフを生成する様子を説
明する図である。 【図15】 木の間の距離を求めるアルゴリズムであ
る。 【符号の説明】 1 外部記憶装置 2,3,5,6,7 メモリ 4 データ変換部 8 部分木間の距離計算部 9 森間の距離計算部 10 距離計算制御部 11 記憶部 12 ラベル付木構造データ生成部 13 ラベル付け部 14 写像部

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 木構造を持つ対象の間の類似性を表す尺
    度である距離を計算する木構造間距離計算装置におい
    て,木構造を持つ対象を,根があり順序がない木で表現
    する木構造情報を,前記木の各頂点と各辺にラベルを付
    して記憶する木構造情報記憶手段と,木の各頂点と各辺
    に,他の木の各頂点と各辺との対応関係を与える番号を
    付ける番号付け手段と,頂点間の対応関係と辺間の対応
    関係に基づく写像条件に従う,木の間の各写像を決定す
    る手段と,前記木の間の各写像の重みを少なくとも前記
    各頂点および各辺のラベルに従って決定する手段と,前
    記木の間の各写像の重みに基づいて前記木の間の類似性
    を表す尺度である距離を決定する手段とを有することを
    特徴とする木構造間距離計算装置。 【請求項2】 木構造を持つ対象の間の類似性を計るた
    めの尺度である距離を計算する木構造間距離計算装置に
    おいて,木構造を持つ対象を,根があり順序がない木で
    表現する木構造情報を生成する木構造情報生成手段と,
    木の各頂点と各辺にラベルを付けるラベル付け手段と,
    木の各頂点と各辺に,他の木の各頂点と各辺との対応関
    係を与える番号を付ける番号付け手段と,頂点間の対応
    関係と辺間の対応関係に基づく写像条件に従う,木の間
    の各写像を決定する手段と,前記木の間の各写像に対応
    する,森(木の根を除いて残した部分)の間の各写像の重
    みを決定する手段と,前記森の間の各写像の重みに基づ
    いて前記森の間の類似性を表す尺度である森の間の距離
    を決定する手段と,前記森の間の距離に基づいて前記木
    の間の各写像の重みを決定する手段と,前記木の間の各
    写像の重みに基づいて前記木の間の類似性を表す尺度で
    ある距離を決定する手段とを有することを特徴とする木
    構造間距離計算装置。 【請求項3】 前記木構造を持つ対象を,根があり順序
    がない木で表現する木構造情報を生成する木構造情報生
    成手段は,木構造を持つ対象に対して,グラフ理論上の
    根があり順序がない木で表現し,木の各頂点と辺に木構
    造を持つ対象の情報を格納することを特徴とする請求項
    2に記載の木構造間距離計算装置。 【請求項4】 前記木の各頂点と各辺にラベルを付ける
    ラベル付け手段は,木の頂点と辺に格納している情報を
    それぞれ頂点と辺のラベルとすることを特徴とする請求
    項1または2に記載の木構造間距離計算装置。 【請求項5】 前記木の各頂点と辺に番号を付ける番号
    付け手段は,木の根からプリオーダー順で木の各頂点と
    各辺に番号を付け,辺の番号が該辺の下方に接続してい
    る頂点の番号と同じように付けることを特徴とする請求
    項1または2に記載の木構造間距離計算装置。 【請求項6】 前記頂点間と辺間の対応関係に基づく写
    像条件は,次の(a1)〜(a10)であることを特徴とする請
    求項1または2に記載の木構造間距離計算装置。 【表1】【請求項7】 前記頂点間の対応関係と辺間の対応関係
    に基づく写像条件に従う,木の間の各写像を決定する手
    段は,木から木への写像Mについて以下の条件を満たす
    ことを特徴とする木構造間距離計算装置。 【表2】 【請求項8】 前記森の間の写像を決定する手段は,森
    から森への写像Mについて以下の条件を満たすことを特
    徴とする請求項2に記載の木構造間距離計算装置。 【表3】 【請求項9】 前記木の間の各写像の重みを決定する手
    段は,つぎのように重みを決定することを特徴とする請
    求項1または2に記載の木構造間距離計算装置。 【表4】【請求項10】 前記森の間の距離を決定する手段は,
    つぎのように森の間の距離を決定することを特徴とする
    請求項2記載の木構造間距離計算装置。 【表5】 【請求項11】 前記木の間の距離を決定する手段は,
    つぎのように木の間の距離を決定することを特徴とする
    請求項1または2に記載の木構造間距離計算装置。 【表6】 【請求項12】 前記木の間の距離を決定する手段は,
    前記木の部分木の間の距離を決定する手段と,前記森の
    間の距離を決定する手段と,前記部分木の間の距離およ
    び前記森の間の距離を用いて前記木の間の距離を決定す
    る手段とを有することを特徴とする請求項1または2に
    記載の木構造間距離計算装置。 【請求項13】 前記部分木の間の距離を決定する手段
    はつぎのように前記部分木の間の距離を決定することを
    特徴とする請求項12に記載の木構造間距離計算装置。 【表7】 【請求項14】 前記部分木の間の距離を決定する手段
    はつぎのように前記部分木の間の距離を決定することを
    特徴とする請求項12に記載の木構造間距離計算装置。 【表8】 【請求項15】 前記部分木の間の距離を決定する手段
    はつぎのように前記部分木の間の距離を決定することを
    特徴とする請求項12に記載の木構造間距離計算装置。 【表9】【請求項16】 前記部分木の間の距離を決定する手段
    はつぎのように前記部分木の間の距離を決定することを
    特徴とする請求項12に記載の木構造間距離計算装置。 【表10】 【請求項17】 前記森の間の距離を決定する手段はつ
    ぎのように前記森の間の距離を決定することを特徴とす
    る請求項12記載の木構造間距離計算装置。 【表11】 【請求項18】 つぎのような2部グラフの頂点間の辺
    の重みを用いて前記2部グラフの最大マッチングの重み
    を決定することを特徴とする請求項17記載の木構造間
    距離計算装置。 【表12】 【請求項19】 前記森の間の距離を決定する手段はつ
    ぎのように前記森の間の距離を決定することを特徴とす
    る請求項18記載の木構造間距離計算装置。 【表13】 【請求項20】 前記木の間の距離を決定する手段は,
    木の葉を根とする部分木間の距離から,順次サイズが大
    きい部分木間の距離を求めることにより,与えられた木
    の間の距離を求めることを特徴とする請求項12に記載
    の木構造間距離計算装置。 【請求項21】 木構造を持つ対象の間の類似性を表す
    尺度である距離を計算する木構造間距離計算方法におい
    て,木構造を持つ対象を,根があり順序がない木で表現
    する木構造情報を,前記木の各頂点と各辺にラベルを付
    して記憶する木構造情報記憶ステップと,木の各頂点と
    各辺に番号を付ける番号付けステップと,頂点間の対応
    関係と辺間の対応関係に基づく写像条件に従う,木の間
    の各写像を決定するステップと,前記木の間の各写像の
    重みを少なくとも前記各頂点および各辺のラベルに従っ
    て決定するステップと,前記木の間の各写像の重みに基
    づいて前記木の間の類似性を表す尺度である距離を決定
    するステップとを有することを特徴とする木構造間距離
    計算方法。 【請求項22】 木構造を持つ対象の間の類似性を計る
    ための尺度である距離を計算する木構造間距離計算方法
    において,木構造を持つ対象を,根があり順序がない木
    で表現する木構造情報を生成する木構造情報生成ステッ
    プと,木の各頂点と各辺にラベルを付けるラベル付けス
    テップと,木の各頂点と各辺に番号を付ける番号付けス
    テップと,頂点間の対応関係と辺間の対応関係に基づく
    写像条件に従う,木の間の各写像を決定するステップ
    と,前記木の間の各写像に対応する,森(木の根を除い
    て残した部分)の間の写像を決定するステップと,前記
    森の間の各写像の重みを決定するステップと,前記森の
    間の各写像の重みに基づいて前記森の間の類似性を表す
    尺度である森の間の距離を決定するステップと,前記森
    の間の距離に基づいて前記木の間の各写像の重みを決定
    するステップと,前記木の間の各写像の重みに基づいて
    前記木の間の類似性を表す尺度である距離を決定するス
    テップとを有することを特徴とする木構造間距離計算方
    法。 【請求項23】 木構造を持つ対象の間の類似性を表す
    尺度である距離を計算するための木構造間距離計用のコ
    ンピュータプログラムにおいて,木構造を持つ対象を,
    根があり順序がない木で表現する木構造情報を,前記木
    の各頂点と各辺にラベルを付して記憶する木構造情報記
    憶ステップと,木の各頂点と各辺に番号を付ける番号付
    けステップと,頂点間の対応関係と辺間の対応関係に基
    づく写像条件に従う,木の間の各写像を決定するステッ
    プと,前記木の間の各写像の重みを少なくとも前記各頂
    点および各辺のラベルに従って決定するステップと,前
    記木の間の各写像の重みに基づいて前記木の間の類似性
    を表す尺度である距離を決定するステップとをコンピュ
    ータに実行させるために用いられることを特徴とする木
    構造間距離計算用コンピュータプログラム。 【請求項24】 木構造を持つ対象の間の類似性を計る
    ための尺度である距離を計算するための木構造間距離計
    算用コンピュータプログラムにおいて,木構造を持つ対
    象を,根があり順序がない木で表現する木構造情報を生
    成する木構造情報生成ステップと,木の各頂点と各辺に
    ラベルを付けるラベル付けステップと,木の各頂点と各
    辺に番号を付ける番号付けステップと,頂点間の対応関
    係と辺間の対応関係に基づく写像条件に従う,木の間の
    各写像を決定するステップと,前記木の間の各写像に対
    応する,森(木の根を除いて残した部分)の間の写像を決
    定するステップと,前記森の間の各写像の重みを決定す
    るステップと,前記森の間の各写像の重みに基づいて前
    記森の間の類似性を表す尺度である森の間の距離を決定
    するステップと,前記森の間の距離に基づいて前記木の
    間の各写像の重みを決定するステップと,前記木の間の
    各写像の重みに基づいて前記木の間の類似性を表す尺度
    である距離を決定するステップとをコンピュータに実行
    させるために用いられることを特徴とする木構造間距離
    計算用コンピュータプログラム。
JP2002071274A 2002-03-15 2002-03-15 木構造間距離計算装置および方法 Pending JP2003271667A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002071274A JP2003271667A (ja) 2002-03-15 2002-03-15 木構造間距離計算装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002071274A JP2003271667A (ja) 2002-03-15 2002-03-15 木構造間距離計算装置および方法

Publications (1)

Publication Number Publication Date
JP2003271667A true true JP2003271667A (ja) 2003-09-26

Family

ID=29201597

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002071274A Pending JP2003271667A (ja) 2002-03-15 2002-03-15 木構造間距離計算装置および方法

Country Status (1)

Country Link
JP (1) JP2003271667A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258624A (ja) * 2004-03-10 2005-09-22 Fuji Xerox Co Ltd 言語処理装置、言語処理方法およびプログラム
JP2006113900A (ja) * 2004-10-15 2006-04-27 Fuji Xerox Co Ltd 情報処理システム及び情報処理方法、並びにコンピュータ・プログラム
JP2012248144A (ja) * 2011-05-31 2012-12-13 Fuji Xerox Co Ltd データ構造比較プログラム及びデータ構造比較装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258624A (ja) * 2004-03-10 2005-09-22 Fuji Xerox Co Ltd 言語処理装置、言語処理方法およびプログラム
JP4622272B2 (ja) * 2004-03-10 2011-02-02 富士ゼロックス株式会社 言語処理装置、言語処理方法およびプログラム
JP2006113900A (ja) * 2004-10-15 2006-04-27 Fuji Xerox Co Ltd 情報処理システム及び情報処理方法、並びにコンピュータ・プログラム
US7577102B2 (en) 2004-10-15 2009-08-18 Fuji Xerox Co., Ltd. Information processing system, information processing method, and computer readable medium
JP4543871B2 (ja) * 2004-10-15 2010-09-15 富士ゼロックス株式会社 情報処理システム及び情報処理方法、並びにコンピュータ・プログラム
JP2012248144A (ja) * 2011-05-31 2012-12-13 Fuji Xerox Co Ltd データ構造比較プログラム及びデータ構造比較装置

Similar Documents

Publication Publication Date Title
US7158961B1 (en) Methods and apparatus for estimating similarity
US20040167904A1 (en) Semi-structured data storage schema selection
Claude Morphometrics with R
US6760714B1 (en) Representation and retrieval of images using content vectors derived from image information elements
US6173275B1 (en) Representation and retrieval of images using context vectors derived from image information elements
US20040162806A1 (en) Text sentence comparing apparatus
Wolin et al. ShortStraw: A Simple and Effective Corner Finder for Polylines.
US20040215660A1 (en) Image search method and apparatus
Aichholzer et al. Medial axis computation for planar free–form shapes
US20020031260A1 (en) Text mining method and apparatus for extracting features of documents
Buchin et al. Exact algorithms for partial curve matching via the Fréchet distance
US6363174B1 (en) Method and apparatus for content identification and categorization of textual data
JP2005242579A (ja) 文書処理装置、文書処理方法、および文書処理プログラム
US20090106015A1 (en) Statistical machine translation processing
Ascher et al. A first course on numerical methods
Wang et al. Clustering aggregation by probability accumulation
Belazzougui et al. Alphabet-independent compressed text indexing
Platt Fast embedding of sparse similarity graphs
US6671403B1 (en) Pattern recognition apparatus and method utilizing conversion to a common scale by a linear function
US20120269432A1 (en) Image retrieval using spatial bag-of-features
Kolesnikov et al. Polygonal approximation of closed discrete curves
von Haeseler et al. Network models for sequence evolution
Xia et al. Local and global approaches of affinity propagation clustering for large scale data
JP2006190191A (ja) 情報処理装置および方法、並びにプログラム
Beller et al. Computing the longest common prefix array based on the Burrows–Wheeler transform

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040921

A977 Report on retrieval

Effective date: 20071018

Free format text: JAPANESE INTERMEDIATE CODE: A971007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Written amendment

Effective date: 20071227

Free format text: JAPANESE INTERMEDIATE CODE: A523

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080212