JP3673487B2

JP3673487B2 - 階層的統計分析のシステム及び方法

Info

Publication number: JP3673487B2
Application number: JP2001209268A
Authority: JP
Inventors: マーティン・エイチ・ハイアット
Original assignee: Northrop Grumman Space and Mission Systems Corp
Current assignee: Northrop Grumman Space and Mission Systems Corp
Priority date: 2000-07-10
Filing date: 2001-07-10
Publication date: 2005-07-20
Anticipated expiration: 2021-07-10
Also published as: EP1172737A2; US6678692B1; JP2002041546A; EP1172737A3

Description

【０００１】
【発明の技術分野】
本発明は、階層構造内のデータの分析に関し、より具体的には、テキスト・データの分析に関する。
【０００２】
【従来の技術】
コンピュータの多くのユーザは、文書がユーザ提供のキーワードを含んでいる場合に、データベース中の文書が選択されるという、テキスト検索技術に精通している。いくつかのテキスト検索エンジンは、ＡＮＤ、ＯＲ、ＮＯＴ、あるいはＮＥＡＲといったブール論理結合において、ユーザが、キーワードすなわちフレーズを特定できるようにしている。他の、より高度なテキスト検索エンジンには、ユーザに対して、より関連する文書を提示する目的で、特定のワードの発生回数を数えるものもある。しかしながら、頻繁に起こることであるが、ユーザにとって全く興味のない、多数の文書が見いだされる結果に終わることがある。そのキーワードは、偶然、多くの文書で用いられている場合もあり、あるいは興味のない文書を与えるコンテキストにおいて用いられている場合もある。従って、興味のある文書を見つけだすことができない場合がある。その時、ユーザは、これらの不必要な文書を閲覧して廃棄するか、あるいは検索を洗練して繰り返さなければならない。すべてのキーワードを検索する技術の主要な欠点は、それらが、コンテキストあるいは表現されたアイデアや概念を考慮せずに、文書の文字どおりの形式あるいは表現を検索することを基本にしているということである。
【０００３】
任意のコンテキストの中で用いられるキーワードを完全に付き合わせるのではなく、内容認識に基づいて、選択された概念又はアイデアを付き合わせることによって、ユーザが文書を見つけることができるテキスト検索技術に対する必要性が長らく存在してきた。
本発明は、この必要性を満たし、テキストでないデータの分析及び検索に対しても適用できる、システム及び方法を提供することを目的としている。
【０００４】
【発明の概要】
本発明は、データ・サンプルを階層構造において特徴づけるためのシステム及び対応する方法にあり、具体的なデータ内容よりもむしろ、階層的な分類あるいは特徴に基づくことにより、データ検索を容易にする。概して言えば、本発明の方法は、ノードとブランチを持ち、各ノードがその階層構造の特徴を表すシソーラス状のツリー構造に配列された特徴の階層構造を提供するステップと、各データベースのレコードに対してレコードを特徴づける複数のキーとなる特徴を識別するステップと、識別するステップで得られた複数のキーとなる特徴から、データベースのレコードを最もよく特徴づける優勢な特徴に対応する階層構造内のノードを選択するステップと、その優勢な特徴及び階層構造内でのそれの位置をそのデータベースのレコードと関連させるステップとを含む。これにより、データベースのレコードは、具体的な内容によってではなく、それらの優勢な特徴によってアクセス可能となる。
【０００５】
より具体的に言えば、優勢な特徴に対応する階層構造内のノードを選択するステップは、レコード内の選択されたキーとなる特徴の各々を階層構造内の特徴と比較するステップと、レコードのキーとなる特徴と階層構造の特徴との間のマッチングの発生回数及びそれらのノード位置を記録するステップと、そのノードが十分に汎用的でありそのマッチングの大部分を包含しているか、あまり汎用的でなくて階層構造内のマッチングの位置から遠く離れすぎているかどうかに基づいて、どのノードを選択すべきかを判定するステップとを含む。
【０００６】
さらに、どのノードを選択すべきであるかを判定するステップは、階層構造の各ブランチに対する収束値を計算するステップであって、その収束値が、それより以下の、かつブランチに接続されるノードに記録されたすべてのマッチングの合計によって与えられる、計算するステップと、階層構造の各ブランチに対する反収束値を計算するステップであって、前記反収束値が、階層構造内でのマッチングの数の合計と、ブランチに対する収束値との間の差によって与えられる、計算するステップと、階層構造のノードに対する距離値を計算するステップとを含む。任意のノードに対する距離値は、最上層ノードと距離値が計算されるノードとの間に存在するブランチの収束値及び反収束値の関数である。選択されるノードは、最低の距離値を備えたノードである。
【０００７】
さらにより具体的に言えば、距離値を計算するステップは、階層構造の最上層ノードに比較的大きな距離値を割り当てるステップと、あるブランチを介して最上層ノードに接続されるノードに対する距離値を計算するステップであって、そのブランチの収束値だけ最上層ノードの距離値を減少させ、その結果を、ファクタａが単位元より大きい場合に、そのブランチの反収束値にファクタ「ａ」を掛けた値だけ増大させることによって、距離値を計算するステップと、同じような方式でその階層構造内の他のノードに対する距離値を計算するステップであって、ブランチの下端ノードに対する距離値が、上端ノードの距離値からそのブランチの収束値だけを減少させ、その結果に、ブランチの反収束値にファクタ「ａ」を掛けた値を加えることによって得られる、計算するステップとを含む。
【０００８】
基本的に、距離値は、階層構造の最上層で始まる連続ノードに対して計算される。ある距離値を最上層ノードに割り当てた後、さらに他のノードに対して距離値を計算した後にも、本発明の方法はさらに、距離値が計算されようとしている次のノードに、収束値が最大のブランチを選択するステップを含む。選択されるブランチは、階層構造内の等レベルにある他のすべてのブランチよりも大きな収束値を持つ。距離値は、階層構造の各レベルを通して、収束値が最大のブランチを通過する経路に沿ったノードに対してのみ、計算される必要がある。
【０００９】
本発明はまた、優勢な特徴に従って、データベースのレコードを分類するためのシステムとしても定義される。概して言えば、システムは、特徴の階層構造、ノード及びブランチを持つツリー構造、及び階層構造内の特徴を表す各ノードを定義する少なくとも１つのシソーラス状のツリー構造と、その各々が優勢な特徴に従って分類されようとしているレコードからなるデータベースと、該データベース、及びシソーラス状のツリー構造に連結されるシステム・プロセッサとを含む。該システム・プロセッサは、各データベースのレコードに対して、レコードを特徴づける複数のキーとなる特徴を識別するための手段と、複数のキーとなる特徴から、データベースのレコードを最もよく特徴づける優勢な特徴に対応する階層構造内の１つのノードを選択するための手段と、その優勢な特徴及び階層構造内でのそれの位置をデータベースのレコードと関連させるための手段とを含む。これにより、データベースのレコードは、特定のコンテンツによってではなく、これらの優勢な特徴によってアクセス可能となる。
【００１０】
優勢な特徴に対応する階層構造内の１つのノードを選択するための手段は、レコード内の選択されるキーとなる特徴の各々を階層構造内の特徴と比較するための手段と、レコードのキーとなる特徴と階層構造の特徴との間でのマッチングの発生回数及びそれらのノード位置を記録するための手段と、該ノードが十分に汎用的でありマッチングの大部分を包含しているか、又は、あまり汎用的でなくてマッチングから遠く離れすぎているかどうかに基づいて、どのノードを選択すべきであるかを判定するための手段とを含む。より具体的に言えば、どのノードを選択すべきであるかを判定するための手段が、階層構造の各ブランチに対して収束値を計算するための手段であって、収束値が、それより以下の、かつブランチに接続されるノードに記録されたすべてのマッチングの合計によって与えられる、手段と、階層構造の各ブランチに対する反収束値を計算するための手段であって、反収束値が、階層構造内でのマッチング数の合計と、ブランチに対する収束値との間の差によって与えられる、手段と、階層構造のノードに対する距離値を計算するための手段であって、任意のノードに対する距離値が、最上層のノードとその距離値が計算されるノードとの間のブランチの収束値及び反収束値の関数である、手段と、最低の距離値を備えたノードを選択するための手段とを含む。
【００１１】
本発明におけるシステムにおいて、距離値を計算するための手段は、階層構造の最上層ノードに比較的大きな距離値を割り当てる手段と、あるブランチを介して最上層ノードに接続されるノードから始めて、他のノードに対する距離値を計算する手段であって、そのブランチの収束値だけ最上層ノードの距離値を減少させ、その結果を、ファクタ「ａ」が単位元より大きい場合に、そのブランチの反収束値にファクタａを掛けた値だけ増大させることによって、距離値を計算する手段とを含む。また距離値を計算する手段は、同じような方式でその階層構造内の他のノードに対して距離値を計算する。ブランチの下端ノードに対する距離値は、上端ノードの距離値からそのブランチの収束値だけを減少させ、その結果に、ブランチの反収束値にファクタ「ａ」を掛けた値を加えることによって得られる。
【００１２】
本発明のシステムはさらに、距離値が計算されようとしている次のノードに、収束値が最大のブランチを選択するための手段を含む。その選択されるブランチは、階層構造内の等レベルにある他のすべてのブランチよりも大きな収束値を持ち、距離値は、収束値が最大のブランチを通過する経路に沿ったノードに対してのみ計算される必要がある。
【００１３】
また、本発明は、優勢な概念に従ってデータベース文書を分類するための方法及びシステムにおいても具体化される。該方法は、ノードとブランチを持ち、各ノードがその階層構造の概念を表すシソーラス状のツリー構造に配列される概念の階層構造を提供するステップと、各データベース文書に対して文書を特徴づける複数のキーとなるワードを識別するステップと、識別するステップで得られた複数のキーとなる概念から、データベース文書を最もよく特徴づける優勢な概念に対応する階層構造内のノードを選択するステップと、その優勢な概念及び階層構造内でのそれの位置をそのデータベース文書と関連させるステップとを含む。これにより、データベース文書は、具体的なコンテンツによってではなく、それらの優勢な概念によってアクセス可能となる。
【００１４】
より具体的に言えば、優勢な概念に対応する階層構造内のノードを選択するステップは、データベース文書内の選択されたキーとなるワードの各々を階層構造内の概念と比較するステップと、データベース文書のキーとなるワードと階層構造の概念との間のマッチングの発生回数及びそれらのノード位置を記録するステップと、該ノードが十分に汎用的でありそのマッチングの大部分を包含しているか、又は、あまり汎用的でなくて階層構造内のマッチングの位置から遠く離れすぎているかどうかに基づいて、どのノードを選択すべきかを判定するステップとを含む。どのノードを選択すべきであるかを判定するステップは、階層構造の各ブランチに対する収束値を計算するステップであって、収束値が、ブランチより以下の該ブランチに接続されるノードに記録されたすべてのマッチングの合計によって与えられる、ステップと、階層構造の各ブランチに対する反収束値を計算するステップであって、反収束値が、階層構造内でのマッチングの数の合計と、ブランチに対する収束値との間の差によって与えられる、ステップと、階層構造のノードに対する距離値を計算するステップであって、任意のノードに対する距離値が、最上層ノードと距離値が計算されるノードとの間にあるブランチの収束値及び反収束値の関数として計算される、ステップとを含む。選択されるノードは、最低の距離値を備えたノードである。
【００１５】
距離値を計算するステップは、階層構造の最上層ノードに比較的大きな距離値を割り当てるステップと、あるブランチを介して最上層ノードに接続されるノードに対する距離値を計算するステップであって、そのブランチの収束値だけ最上層ノードの距離値を減少させ、その結果を、ファクタａが単位元より大きい場合に、そのブランチの反収束値にファクタ「ａ」を乗算した値だけ増大させることによって、距離値を計算するステップと、同じような方式で該階層構造内の他のノードに対する距離値を計算するステップとを含む。ブランチの下端ノードに対する距離値は、上端ノードの距離値からそのブランチの収束値だけを減少させ、その結果に、ブランチの反収束値にファクタ「ａ」を掛けた値を加えることによって得られる。また本発明の方法は、距離値が計算されようとしている次のノードに、収束値が最大のブランチを選択するステップであって、その選択されるブランチを、階層構造内の等レベルにある他のすべてのブランチよりも大きな収束値を持つものとして選択するステップを含む。距離値は、収束値が最大のブランチを通過する経路に沿ったノードに対してのみ計算される必要がある。
【００１６】
本発明はまた、レコードの各々が少なくとも１つの優勢な概念によって最もよく特徴づけられるように分類されたレコードのデータベースを検索するための方法として定義され、その方法は、その概念のシソーラス状の階層構造内に興味のある概念を、ユーザ・インターフェースを通して提供するステップと、興味のある概念によって最もよく特徴付けられるように分類されたレコードをデータベースから取り出すステップと、その取り出されたレコードを、ユーザ・インターフェースを通してユーザに提供するステップとを含む。興味のある概念を提供するステップは、興味のある概念を配列し選択するために、ユーザ・インターフェースでもってシソーラス状の構造内をブラウジングするステップを含んでもよい。その代わりとして、興味のある概念を提供するステップは、ユーザに興味のあるキーワードを提供するステップと、そのキーワードから興味のある概念を決定するステップとを含んでもよい。該方法は、ユーザ・インターフェースを通して提供されたレコードを閲覧するステップと、提供されたレコードを閲覧した後に、興味のある概念を変更することにより検索を洗練するステップと、検索を繰り返すステップとを含んでもよい。
【００１７】
本発明がデータベース検索の分野において重大な完全を提供することが、先の記述から理解されるだろう。優勢な特徴あるいはキーとなる鍵の概念に従ってデータベースのレコードを分類することは、具体的なコンテンツではなく概念による検索を容易にし、検索がテキスト内容のような具体的なレコード・コンテンツに基づいてなされる時に得られる、不満足な検索結果を減少させるか、又は除去する。本発明の他の側面及び利点は、添附図面と共に、次のより多くの詳細な説明がなされることで、明らかになるであろう。
【００１８】
【発明の実施の態様】
本発明を、テキスト・データの特徴及び検索の問題というコンテキストにおいて記述するが、本発明が他のデータ検索の問題にも広く適用可能であることは明らかであるだろう。図に示すように、本発明は、テキスト・データの場合には、文書であるデータ・レコードを、階層構造において表わされた概念あるいはキーとなる特徴に基づいて、ユーザが取り出せるようにする階層分析システム及び方法に関係する。テキスト・データの従来の検索では、キーワードがユーザによって特定され、そのキーワードが現われる文書をすべて配置するために、データベース内の多くの文書が検索される。いくつかのシステムでは、文書の全文が検索される。検索工程の速度を上げるため、全文の代わりに検索されるキーワードあるいは要約を引き出すために文書が前処理される場合もある。いずれの場合も、その検索工程は通常、ユーザにとって興味のないキーワード発生あるいは「ヒット」を持つ多くの不必要な文書を抽出することになる。その時、ユーザは、閲覧して不必要な文書を廃棄するか、あるいは、他のキーワードを特定することで検索の幅を狭めるかのどちらかをしなければならないが、その工程は、多くの場合、ユーザにとって時間を消費し、苛立たしいことである。
【００１９】
本発明をテキスト検索に適用する場合、データベースに記憶保管される文書は、まずキーワードを引き出すために前処理され、次に、シソーラス状の階層構造に対してその文書がどこに最もよく適合するかを判定するために、各文書からのキーワードが分析される。この前処理技術は、シソーラス状の階層構造内での１つ以上の選択された位置によってデータベース内の各文書が特徴づけられることを可能にする。その位置が階層構造内での大部分のキーワード「ヒット」に接近していることと、その位置が大部分のキーワード・ヒットを包含するのに十分に高い抽出レベルにあることにより、階層構造内で各々が選択された概念位置が、「概念空間」の中で文書を特徴づける。
１つの文書中の複数のキーワードが、その文書に提供されるか、又は文書の全文をシソーラス状の階層構造と比較することによって、生成される。階層構造内でのヒットの数は、正確に文書を特徴づけるキーワードを識別するためと、ワードの付帯的な使用にのみ関係している少数のヒットを取り除くために、分析される。
【００２０】
文書の概念（コンセプト）位置を見つけることは、汎用性のレベルと、キーワードを十分に高い割合で包含することとの交換を伴う。図１に示すように、概念の階層構造は、逆ツリー構造１０として表すことができ、図示のように構造の最上層１２にルート（根）を持ち、最上層から下に延びる複数のブランチ（分岐）１４を持つ。ツリー構造１０中のブランチの点はノードと呼ばれ、階層構造の下位レベルに到達するにつれて増大するという特異性を備えた構造内に、包含される概念を定義するために必要とされる数のノード及びブランチがある。例えば、図１に示される構造がアメリカ合衆国に関する文書の地理的なデータベースを表す場合、最上層のノード１２は「アメリカ合衆国」と指定される。ノード１２の次のより低い層は、地理的な地域を指定するために用いられてもよい。例えば、２つのノード１６及び１８は、「パシフィック地域」及び「セントラル地域」とそれぞれ指定される。その次の下のレベルは、各地域内の州を表すために用いられ、図の最下位に示される下位レベルは、各州内の都市、あるいは郡を表すために用いられることができる。例えば、ノード２０及び２２が、「カリフォルニア」及び「ワシントン」に指定され、ノード２４、２６、２８、３０及び３２が「サンディエゴ」、「ロサンゼルス」、「サンフランシスコ」、「シアトル」及び「タコマ」にそれぞれ指定されると仮定する。１つの文書が概念位置に対して分析され、図１の左側の部分の星によって示されるような、ノード２２（ワシントン）、２６（ロサンゼルス）、２８（サンフランシスコ）、３０（シアトル）及び３２（タコマ）に関してキーワード・ヒットがあることが分かる。
【００２１】
図１の右側の部分は、その文書が分析されて、星印３４として示される、適切な概念位置を図示する。ノード１０（アメリカ合衆国）にその文書を分類すると、確かにすべてのキーワード・ヒットを包含するが、最上層のカテゴリは、ほとんどの目的に対して、あまりにも汎用的過ぎる。ノード２２（ワシントン）にその文書を分類すると、カリフォルニアの市のヒットを含まないので、狭すぎる。直観的に、適切な概念カテゴリは、ツリー（系図）のワシントンより高いところにあるが、アメリカ合衆国より低いところにあることが理解される。図示される例において、ノード１６（パシフィック地域）が、最良の選択であるように見えるであろう。
【００２２】
星印３４がノード１６の下に配列されている図１の右側の部分に示されるように、おそらく最良のカテゴリは、ノード１６と次のより低いノード２０及び２２の州との間にあるであろうが、現行ではノード１４と次のより低いノードとの間にはいかなるノードも存在しない。階層構造が「地域」と「州」の間の地理的な呼称を含むよう拡張されたならば、この分析中の文書は、より正確に配列される可能性がある。都市レベルでのヒットのすべてが、ちょうど太平洋岸に位置するので、適切なサブ地域の呼称は「海岸」、「山地」及び「砂漠」であろう。本発明は、この方式で階層構造を拡張する可能性には関係しないが、図１で示されるような既存の階層構造に対して、自動的に文書を分類するためのシステム及び方法に部分的に関係する。
図１の例は、地理的な類型に基づいた概念の分類を示す。該同じ文書が、複数の階層構造でキーワード・ヒットを有する場合がある。例えば、文書がその言及された都市に関係する環境汚染のような技術的問題を扱う場合、文書は、大洋に関する環境工学に関係する概念階層構造内に適切に配列されるであろう。
【００２３】
図２は、本発明を実現する装置の主な構成要素を示すシステム・ブロック図であり、システム・プロセッサ４０、ユーザ・インターフェース４２、及び文書データベース４４及び４６に複数のシソーラス状の階層構造を保持するためのストレージ装置を含む。線５０で示すように、様々な従来の情報源から引き出される文書４８が、文書データベース４４に入力される。線５２で示されるように、任意の適切な高速コンピュータ・システムであるシステム・プロセッサ４０は、処理のためにデータベース４４から文書を取り出し、線５４で示すように、処理された文書に関する概念位置をそのデータベースに戻し格納する。線５６及び５８で示すように、ユーザ・インターフェース４２は、システム・プロセッサ４０とやりとりし、キーワードを提供するか、あるいは文書を取り出すための位置を概念階層構造４６の中から選択するかのどちらかによって、ユーザがデータベース４４の検索を開始できるようにする。
【００２４】
図３は、文書の概念を査定（アセスメント）するために実行される主要な機能を描くフローチャートである。ブロック６０で示すように、概念査定のために、文書がまず選択される。破線６２で示すように、文書は、データベース４４か、あるいは別の情報源からダイレクトに取り出されてもよい。その後、ブロック６４で示すように、その文書が精査されて、文書の主題を特徴づけるキーワードが識別される。これは独立した処理であってもよいし、キーワードは、その文書を階層構造４６内のワードと比較することにより、識別されてもよい。
【００２５】
その後、ブロック６６で示すように、階層構造４６内での適切な概念位置（複数可）を決定するために、文書のこれらキーワードが用いられる。これについては以下に、より詳細に説明する。そして、文書が、ブロック６８に示すように、概念位置（複数可）に「マッピング」される。該マッピングは、破線７０で示すように、例えば文書と関連してデータベース４４に概念位置（複数可）を記憶保管することによって、選択された概念位置（複数可）が文書に対応付けられることを意味する。概念位置へ文書をマッピングすることは、テキスト内容（コンテンツ）の代わりに、概念（コンセプト）に基づいた文献検索を可能にする。各文書がその概念位置（複数可）を決定するために査定された後、工程は再びブロック６０に戻り、新しい文書が概念査定のために選択される。
ユーザは、特定の概念に付随する、新らしく処理された文書を受け取るリクエストをしてもよい。概念位置が新しい文書のために決定されたならば、ブロック７２で示すように、概念位置がこのタイプのユーザ・リクエストと比較され、マッチングすることが分かった場合、文書のコピーがユーザに配信される。
【００２６】
図４は、データベース４４の検索において実行される主要な機能を描くフローチャートであるが、そのデータベース内では、すべての文書がその各々を階層構造４６内の１以上の概念位置にマッピングするための処理を終えている。検索を開始したいユーザは、ブロック８０で示すように、１以上のキーワードか、あるいは、ブロック８２で示すように、１以上の概念位置のどちらかを、ユーザ・インターフェース４２を通して入力する。ユーザがキーワードを提供すれば、ブロック８４で示すように、システムはまず、キーワードから対応する概念位置を決定する。これは、各文書の概念位置を決定するために用いられた工程と基本的に同じものである。キーワードは、階層構造４６と比較され、集められたキーワードを最もよく特徴づける概念位置が選択される。
【００２７】
概念位置が、決定されるか、あるいはユーザによって提供されたならば、システムは、ブロック８６で示すように、同じ概念位置にマッピングされた文書を取り出し、そして、ブロック８８で示すように、これらの文書をユーザに配信する。文書は、まず、題名、要約、あるいは他の短い要旨によって配信され、次いで、ユーザが検索に関連しない文書を廃棄できるようにするという従来の考え方が、文書配信の工程においては本来的である。その後、選択された文書の全文が、ユーザに配信される。ブロック９０で示すように、ユーザは、随意に、初めに配信された結果に基づいて修正された入力キーワードあるいは概念に基づいた検索を繰り返し、その検索を洗練してもよい。
【００２８】
本発明の主たる特徴は、選択された位置が本当にその文書を代表するように、データベース４４における各文書に対する概念空間内で位置を決定することである（複数可）。図１に示した単純な例において、ほとんどのワードの「ヒット」を包含するほどに十分に高いレベルの抽出がなされ、しかも、ヒット位置から遠く離れすぎて汎用的になり過ぎないように、位置が選択される。この概念位置は、階層ツリー構造におけるヒットの位置を見ている人間の観測者にとっては直観的に明白であるかもしれないが、本発明の目標は、プログラム可能なプロセッサにおいてそれを容易に実行することができる方法で、その選択工程を定義することである。
次に、この概念位置選択工程について詳細に説明する。
【００２９】
図５は、文書のための概念位置を決定する工程を示すフローチャートである。該フローチャートに示される機能は、既に精査された概念階層構造について、特定の文書に対するキーワード「ヒット」の位置を判定するために実行される。ブロック６６（図３）で示した概念位置を決定する大まかなステップは、文書のキーワードを概念階層構造と対象して比較する予備ステップを含む。図６は、適切な概念位置がどう決定されるかを説明するために、図５のフローチャートと共に用いられる階層構造の一部を示している。図６の階層構造は、地理的な位置の階層構造か、あるいは他のタイプの階層構造でもよく、その中の概念ノードは、科学及び技術、政策、人員組織、産業、政府、軍隊組織などに関係する。関与する階層構造のタイプにかかわらず、付随する処置は同じである。その構造の各ノードでのキーワードのヒット数を記録するために、階層構造が精査される。その後、構造及びヒット数が、図５に示した工程を用いて分析され、その文書に対する適切な概念位置が決定される。自動的なやり方で、ある文書に包含されている概念（複数可）を識別するには、その記述された手続きを、複数の階層構造あるいはシソーラスに適用することが必要であることが理解されるであろう。
【００３０】
自動的に概念位置を見つける工程は、階層構造の各ブランチに関連する２つの数量を必要とする。そのブランチ数量は「収束値」及び「反収束値」を含み、これらは、単純に定義される。３番目の数量である「距離」は、階層構造中の各ノードに対応付けられる。距離は、まず最上層のノードに対して計算され、それから、より低いノードに到達するまでに付随するブランチの収束値及び反収束値に基づいて、順次より低いノードに対して計算される。
あるブランチの収束値は、ブランチによって「カバーされる」ヒット数、つまり、そのブランチより以下に位置する階層構造内のノードでのすべてのキーワード・ヒットの合計数として計算される。したがって、階層構造の最下層のブランチの収束値は、もしあれば、単にブランチの下端ノードでのヒット数である。階層構造の最下層でないブランチについて、その収束値は、ブランチの下端ノードから下降していくブランチの各々の収束値の合計に等しい。
【００３１】
あるブランチの「反収束値」は、このブランチより１つ上のブランチの反収束値と、このブランチの上位ノードでのヒット数と、このブランチの上位ノードから下降していく他の各々のブランチの収束値の合計とを加算したものである。あるブランチの反収束値は、全階層構造上のヒットの合計数と、同じブランチの収束値との間の差として、もっと簡単に表わされる。したがって、あるブランチの収束値がＣで、階層構造中のすべてのノード上のヒットの合計数がＴである場合、そのブランチの反収束値は、Ｔ−Ｃである。
【００３２】
収束値は、ヒットを有するノードを通して階層構造を１つ上がるにつれて増大し、ある上位のブランチ（複数可）で最大に達する。収束値は、ツリー構造の「アップ」距離の指標を提供するものと見なされる。「アップ」という言葉は、「アップ」の方向が、逆ツリー構造のルートあるいは幹線の方向である。反収束値は、ヒットを持つノードを通して階層構造を１つ下がるにつれて増大し、収束値が最低になるブランチにおいて最大値に達する。反収束値は、ツリー構造の「ダウン」距離の指標を提供するものと見なされる。階層構造を通して、ヒットを持たないノードを横断するいくつかの経路は、ゼロ収束値及び最大の反収束値を備えたブランチを持つことになるが、これらは通常、記述される工程中では省略される。
【００３３】
図５のブロック１００で示される最初の第１ステップでは、階層構造中のすべてのブランチに対して、収束値及び反収束値をゼロに初期化し、そして、階層構造中のすべてのノードに対して距離値をゼロに設定する。最初は、この工程は、ブランチが階層構造の最下の層すなわち最下レベルにあるものと設定される。
ブロック１０２に示す次のステップでは、現行レベルでの各ブランチに対する収束値を計算する。あるブランチに対する収束値は、ブランチの下位ノードでのヒット数に、もしあれば、下位ノードから下って、すべてのブランチの収束値を加えて計算される。したがって、階層構造での最も低いレベルについて、その収束値は、もしあれば、そのブランチの下位ノードでの単なるヒット数である。次に、ブロック１０４で示すように、その収束値がそれぞれのブランチ・アドレスに関連して記憶される。ブロック１０６で示すように、階層構造の最上層に到達しなかった場合は、ブロック１０８で示すように、工程が１レベル「アップ」し、ブロック１０２で、階層構造の次の上のレベルにあるブランチのそれぞれに対して処理を継続する。ブロック１０２、１０４、１０６及び１０８を通してのこの処理のサイクルは、階層構造の最上層がブロック１０６で検出されるまで続く。検出された時点で、収束値が、階層構造内のすべてのブランチに対応付けられる。
【００３４】
上に記述され、さらに以下で説明する工程は、階層構造のトポロジが、階層構造データベースの一部として記憶保管されることを必要とする。これを達成するための多くの従来技術がある。最も単純なものでは、ノード及びブランチが、ユニークな数値あるいは「アドレス」を割り当てられる。各ブランチを上位及び下位ノード番号と関連させること、あるいは、各ノードをノードに接続されるブランチ数と関連させることが、あいまいさのないトポロジを定義する。このような手段又は同様の手段によって、階層構造のどのレベルが処理されつつあるのか、及び図５に関して記述された演算を実行するための適切なノード及びブランチをいかにして見いだすかが「分かる」。
【００３５】
判定ブロック１０６において、構造の最上層に到達したと判定すると、次に、ブロック１１０において、最上層ノードから下降していくブランチのうちの１つがそのブランチの中で最大の収束値を提供しているかどうかを判定する。例えば、最上層ノードが等しい収束値を備えた２つの下降ブランチを持つ場合、最上層ノードがおそらく概念位置の最良の選択であり、反収束値の演算は必要とされない。ブロック１１０において、最上層ノードからの１つのブランチが最大の収束値を持つと判定した場合、反収束値を決定する処理が継続する。
【００３６】
次に、ブロック１１２で示すように、反収束値が現行のブランチに対して計算される。ブロック１１２を最初に通過する際には、反収束値が計算されるブランチは、判定ブロック１１０で決定されたように、最大の収束値を備えた上位のブランチである。任意のブランチのための反収束値は、２つの方法の一方で計算される。最初に、反収束値（ＡＣ）は、

で与えられる。単純に言えば、任意のブランチに対する反収束値は、全階層構造中のヒットの合計数とその同じブランチの収束値との間の差に等しい。
【００３７】
ブロック１１４に示すように、反収束値は対応するブランチ・アドレスと関連させて記憶される。判定ブロック１１６では、階層構造の最下層レベルに到達したかどうかを判定する。到達していない場合は、反収束値が今しがた計算されたブランチより下のブランチ（複数可）を考慮し、ブロック１１８に示すように、これらのブランチのいずれか１つが他のものより大きな収束値を持っているかどうかを判定する。最大の収束値を備えた単一ブランチがない場合、分析は終了する。最大の収束値を備えたブランチがある場合、ブロック１２０で示すように、このブランチは次の下位レベルに移り、ブロック１１２で示すように、そのブランチの反収束値が計算され、ブロック１１４で示すように、計算された反収束値がブランチ・アドレスと関連させて記憶される。判定ブロック１１６で階層構造の最下層に到達したことを判定するまで、処理は継続する。最下層に到達した時点で、ブロック１２２で示すように、階層構造の最上層ノードに焦点を合わせ、距離値が階層構造内の関連するノードに対して計算される。
【００３８】
階層構造内の最上層ノードに対する距離値は、階層構造内のすべてのブランチの収束値の合計であると定義する。最上層ノードに対しては、いかなる適度な大きさの距離値でも割り当てることは可能である。便宜上、すべての収束値の合計を用いることにより、いかなるノードもマイナスの距離値を持たないように保証される。しかしながら、本発明の処理は、最上層ノードに割り当てられた距離値にかかわらず有効である。ブロック１２４に示すように、最上層のノード距離値の演算を、ブランチの収束値の合計としている。次に、ブロック１２６で示すように、最大の収束値ブランチは次の下位レベルのノードに移る。その後、ブロック１２８で示すように、このノードに対する距離値が計算される。（最上層ノード以外の）現行ノードの距離値は、１つ高位のノードの距離値と、現行ノードの直ぐ上のブランチの収束値及び反収束値との関数である。具体的には、現行ノードの距離値は、所定の定数「ａ」を反収束値に掛けた値とその収束値との差を、１つ高位ノードの距離値から差し引いて計算される。反収束値を計算する時、各レベルで最大の収束値を持つブランチを取りながら、階層構造の最上層から最下層までの１つの経路に従う。距離値を計算する際にも同じ経路に従う。判定ブロック１３０は、いつ階層構造の最下層に到達し、そして必要な距離値の全部が計算されたかを判定する。ブロック１３２で示すように、最低の距離値を備えたノードを選択することにより、終了する。
【００３９】
上に記述したように、階層構造内のすべてのブランチに対して収束値を計算するが、階層構造内のヒットの最大のグループ化によって決定されるような、選択されたブランチ及びノードに対してだけ、反収束値及び距離値を計算する。説明のために、ブランチの全部に対する反収束値、及びノードの全部に対する距離値を、図６に示す。反収束値及び距離値の全部を計算することが必要でないことは、この例から明かであるだろう。
【００４０】
図６に示される階層構造は、Ａ〜Ｎの参照文字によって示されるノード、及び識別されていない他のノードを含む。この説明の中で、ブランチは、ブランチの上位及び下位ノードによって識別される。例えば、ブランチＡＢは、ノードＡ及びＢに接続される。ノードＡは、構造内の最上層ノードであり、ノードＢ及びＬは次の下位レベルにあり、ノードＣ、Ｋ、Ｍ及びＮは、最上層から３番目のレベルにある。ノードＣ及びＫは、ノードＢへのブランチＢＣ及びＢＫによって接続され、ノードＭ及びＮは、ノードＬへのブランチＬＭ及びＬＮによって接続される。ノードＣの下に、次の下位レベルである２つのノードＤ及びＥがある。ノードＥには２つの下位ノードＩ及びＪが接続され、そしてノードＤには３つの下位ノードが接続され、それらの内の２つは、ノードＦ及びＧである。ノードＦ、Ｇ、Ｉ及びＪは、同じレベルにあり、ノードＤ及びＥより１つ下の位置である。階層構造内での最下位のレベルは、ノードＦ及びＧより下の他のノードを含み、そのうちの１つはノードＨとして識別される。
各ノードの「ヒット」数は、円内の数によって示される。ノードＤには８、ノードＥには６、ノードＦには４、ノードＧには２、ノードＩには２、及びノードＪには１つのヒットがあり、合計で２３のヒットがあることを示している。各ブランチの収束値は、該ブランチの近くに示される０〜２３の数字によって示される。各収束値に続く括弧内の数は、ブランチに対する反収束値である。
【００４１】
ブロック１０２（図５）を参照して上に記述したように、収束値が、階層構造内の最下位のブランチから開始して、計算される。ノードＦ、Ｇ、Ｉ及びＪのレベル以下にヒットがなかったので、ブランチＧＨのようなこのレベルより下のブランチは、０の収束値を持つ。ブランチＤＦは、下部のノードＦに４つのヒットがあったので、４の収束値を持つ。同様に、ブランチＤＧは２の収束値を持ち、ブランチＥＩは２の収束値を持ち、ブランチＥＪは１の収束値を持つ。高位レベルのブランチＣＤは、以下のブランチの収束値（４＋２）に、ノードＤでのヒット数（８）を加えて計算されて、合計で１４の収束値を持つ。同様に、ブランチＣＥは、ブランチＥＩ及びＥＪの収束値の合計（２＋１）に、ノードＥでのヒット数（６）を加えて計算されて、合計で１４の収束値を持つ。ブランチＢＣの収束値は、ブランチＣＤ及びＣＥの収束値の合計（１４＋９＝２３）として計算され、この収束値はまた高位のブランチ（ＡＢ）にも当てはまる。ノードＫ、Ｌ、ＭあるいはＮには全くヒットがなかったので、ブランチＢＫ、ＡＬ、ＬＭ及びＬＮの収束値は、すべてゼロである。
【００４２】
各ブランチに対する反収束値は、ヒットの合計数（２３）とそのブランチに対する収束値との差である。したがって、ゼロ収束値である各ブランチに対する反収束値は２３である。最大の収束値（Ａ−Ｂ−Ｃ−Ｄ−Ｆ）の経路について、収束値が、階層構造の最下層のゼロから最上層のブランチでの最大値（２３）まで変動することが明らかであろう。この経路に沿った反収束値は、最上層でのゼロから最下層での最大値まで変動する。ヒットがない階層構造の領域では、収束値がゼロで、反収束値は最大となる。
【００４３】
図７は、図６内のＡ〜Ｎのノードの各々に対して、対応する距離値がどのように計算されるかを示すテーブルである。上に記述された処理の実際的な実行においては、距離値が経路Ａ−Ｂ−Ｃ−Ｄ―Ｆに沿ったノードに対してだけ計算されるが、説明の目的のために、距離及び関連する値が、Ａ〜Ｎのノード全部に対して示されている。上に記述されるように、最上層ノード（Ａ）に対する距離値は、階層構造内のすべてのブランチに対するすべての収束値の合計として計算される。この場合、収束値の合計は７８である。下位ノードについて、その距離値は、１つ高位のノードの距離値から、（このノードと１つ高位のノードの間に）介在するブランチの収束値を引いて、そのブランチの反収束値にファクタ「ａ」を掛けた値を加えて計算される。
【００４４】
図７の第２列で、階層構造の「アップ」距離が示される。これは距離値に対する表現における２つのワードの第１のものであり、すなわち１つ高位ノードの距離値と、介在するブランチの収束値との間の差である。例えば、ノードＢについては、この「アップ」距離が、７８―２３＝５５によって与えられる。任意のノードに対する「アップ」距離は、階層構造の最下層からの収束値の指標を見なすことができる。ノードＡは、定義によって最も高い「アップ」距離を持ち、最低の階層構造の「アップ」距離を備えたノードは、ノードＦ及びそれ以下のノードである。階層構造の「ダウン」距離は、図７の第３列に示すように、ブランチの反収束値からダイレクトに計算される。最上層ノードＡはもちろん、階層構造「ダウン」距離がゼロである。ブランチＡＢ及びＢＣがゼロの反収束値を持つので、ノードＢ及びＣもまた階層構造「ダウン」距離がゼロである。ノードＤに対する「ダウン」距離は、ノードＤの直ぐ上のブランチＣＤに対する反収束値の９である。同様に、ノードＦに対する「ダウン」距離は１９であり、以下同様である。
【００４５】
第４列（説明のためだけに含まれる）は、各ノードに対する「アップ」距離及び「ダウン」距離の合計を示す。事実上、これは「ａ」＝１．０にした時の距離値である。この列のノードＤに矢線によって示すように、この列の最小距離値はノードＤに対する値「２７」である。その階層構造の線図内に示されるヒットを生じる文書に対する概念位置として、このノードを選択することは、ノードＥ、Ｉ、及びＪでのヒットを含んでいないので、明らかに不適当であることが分かる。直観的に、より適切な選択は、十分に汎用的でありヒットを備えたすべてのノードを包含しているノードＣであることが理解される。ただノードＤは、特定し過ぎであり、ノードＢあるいはＡといった高位のノードは、不必要に汎用的である。
【００４６】
図７の第５列は、ファクタ［ａ］を２．０に設定する場合の影響を示す。これは、階層構造「ダウン」距離に等しい量だけ、つまりそのノードの上のブランチの反収束値だけ、各ノードに対する距離値を増大させる効果がある。より高い階層構造「ダウン」距離を備えたノードに対しては、より低い、あるいはゼロの階層構造「ダウン」距離を備えたノードに対してよりも、距離値が増大させられる。この例の中で、Ｄ、Ｅ、及びそれより下のノードに対する距離値は、増大させられるが、ノードＡ、Ｂ及びＣは影響されない。その結果、最低の距離値を備えたノードの位置が、階層構造の上方に上がる。具体的に言うと、この列の矢線によって示すように、ノードＣが最低の距離値（３２）を持っており、この分析中の文書のための概念位置として、選択される。
【００４７】
最後の列は、「ａ」＝１．６１８を用いて計算された距離値を示す。ノードＣが最小距離値（３２）を持つので、再度、ノードＣが、その文書のための概念位置として選択される。ファクタ「ａ」は、データベース階層構造内の異なるタイプの主題に対しては、異なるタイプの主題を持つ文書を分析した経験に基づいて変更されてもよい。現時点では、［ａ］の値として１．５〜４．０の間の任意の値を用いることが、有効な結果をもたらすことがわかっている。
本発明に従って、１つのレベルから次のレベルまでのノード距離値が、そのレベル間に横断するるブランチに対する収束値及び反収束値の関数として計算されるが、反収束値は、選択されたファクタ「ａ」によって、収束値より多くの重みを与えられる。この非対称が、図６及び７を参照して説明された例において示されるように、位置選択過程に上へ押し上げる力を及ぼし、より汎用的な概念位置を選択する結果になる。
【００４８】
上に説明された原理に従って、概念に対する分析がなされたデータベースを検索することは、いくつかの重要な点において、キーワードを用いる従来のテキスト検索とは異なる。理想的には、ユーザは、既存の階層構造あるいはシソーラスに適合する指定された概念（複数可）から、興味のある分野を特定するだろう。例えば、ユーザが朝鮮半島上の位置に関係する文書を見つけることに興味があると仮定する。ユーザは、まず「位置」シソーラス、つまり、その文書が関係する地理的な位置の観点から分類された、文書との関連性を持つシソーラスを選択する。その検索する工程により、ユーザに対して、ユーザ・インターフェース上に、位置シソーラスをブラウジングするためのメカニズムを提供することが理想的である。シソーラスは、メニュー構造に似たテキスト形式で与えられてもよいし、あるいは、シソーラスのツリー構造を提示し、その構造内に各ノードについての情報をユーザに提供するグラフィック形式で与えられてもよい。
【００４９】
図８は、シソーラス画面１５０を持つ上記後のタイプを取り入れたユーザ・インターフェースを示す。シソーラスの主要なノードは、スペースが許すなら、その画面の右に示されてもよく、ユーザは、各ノードについてのより具体的な情報を得るためのメカニズムを提供される。これを実行する１つの方法は、マウス・カーソルを興味のあるノードに置くと、画面上に情報の補足「バブル」が提供されることである。ユーザは、ツリー構造を横切ってカーソルを移動させることによって、選択されたシソーラスをナビゲートして、特に興味のあるノード（複数可）を見つける。シソーラスは、画面の別領域１５２で選択される。ユーザが興味のあるノードを見つけると、ユーザ・インターフェースは、そのノードで分類された文書のリストのような、そのノードに関する追加情報を提供する。その後、ユーザは、選択されたノードにマッピングされた文書をブラウジングすることができ、それらの題名、日付あるいは著者名から、興味のありそうな任意の文書に関するより詳細な情報を選択することができる。
【００５０】
示されたユーザ・インターフェースはさらに、ウィンドウ１５４に示されるように、ユーザが、階層構造の複数のノードの中で興味のあるレベルを特定できるようにする。例えば、ユーザは、「朝鮮半島」ノード、「北朝鮮」ノード、及び「非武装地帯（ＤＭＺ）」ノードにマッピングされた文書に興味があるかもしれない。興味のある３つのノードの各々のためのスクロール・バーを用いて、ユーザは、各々に対する興味のレベルを「低い」から「高い」の範囲で提示する。ユーザが画面上の「再ランク」ボタンを始動させると、３つのノードにマッピングされた文書が、ユーザの特定した興味のレベルに従ってランク付けされる。詳細な階層構造では、ユーザが、興味のある単一のノードからの文書だけでなく、階層構造内の近くのノードから他の文書も取り出したいと思う場合がある。興味があることを指定にされたノードから取り出される文書は、最高のランクを与えられ、他のノードからの文書は、主として興味のある選択されたノードへの接近度に依存して、より低いランク付がなされる。さらにこれらの格付は、ユーザによって提供される「興味のレベル」指示によって、重み付がなされる。ユーザがこれらのレベルを変更して再ランク・ボタンをオンさせると、文書はユーザのより詳細な分析のために再びランク付けされて、表示される。
【００５１】
複数の階層構造へ文書をマッピングすることによって、文書のテキスト内容ではなく、文書が関係する概念に基づいた多くの異なる方法で検索することができる文書データベースが提供される。しかしながら、本発明は、文書データベースの検索に制限されるものではない。同じ原理が、階層構造内に存在するデータを記述する要望がある、すべてのアプリケーションに適用されてもよい。例えば、優勢な病理に関係する階層構造の観点から分類されることが、病院患者にとって有用である。この場合、階層構造内の「概念位置」は、患者の状態を最もよく表現する疾患カテゴリである。この方式での患者の分類は、患者チャートを精査すること、及び病理階層構造で達成される「ヒット」を記録すること、それから患者の優勢な病理を最もよく特徴づける階層構造内での適切なノードを決定することによって、達成される。
別のアプリケーション例は、複数の未知の情報源からの通信信号の分析である。信号は、信号強度、方向、周波数、帯域幅、変調タイプなどのような様々なパラメータの観点で分析される。複数の信号がそれらの優勢な特性に従ってマッピングされる階層構造であって、複数の信号の分析及び検索を容易にするために用いられる階層構造の基本として、これらのタイプのカテゴリの任意のものを用いることができる。
【００５２】
本発明は説明の目的のために詳細に記述されたが、本発明の技術的思想及び範囲から逸脱することなく、様々な変更が可能であることが、先の記述から理解されるであろう。従って、本発明は、添付された特許請求の範囲に記載された事項によってのみ、規定されるものである。
【図面の簡単な説明】
【図１】文書の概念位置がどのようにして発見されるかを説明するための階層ツリー構造の図である。
【図２】本発明を具体化するシステムのブロック図である。
【図３】シソーラス状の階層構造に関わる概念位置を決定するために、文書を分析する際に実行される機能を示したフローチャートである。
【図４】概念によって文書を分類するために処理された文書データベースを検索する際に実行される機能を示したフローチャートである。
【図５】文書のための概念位置を決定する際に実行される機能をより詳細に示すフローチャートである。
【図６】図５のフローチャートで描かれた工程に従って、概念位置がどう決定されるかについての具体的な例を提供するための、概念の階層構造あるいはシソーラスの線図である。
【図７】図６の階層構造中の各ノードのために、３つの異なった重みファクタを用いる距離値の計算法を示すテーブルである。
【図８】本発明の１つの側面に従って文書のデータベースを検索する際に使用されるユーザ・インターフェースを説明するための図である。

Claims

優勢な特徴に従ってデータベースのレコードを分類するためのシステムにおいて、
特徴の階層構造を定義し、複数のノード及び複数のブランチを持つシソーラス状のツリー構造であって、各ノードが階層構造内の１つの特徴を表している、シソーラス状のツリー構造と、
各々が優勢な特徴に従って分類されるレコードからなるデータベースと、
レコードからなるデータベース及びシソーラス状のツリー構造に接続されるシステム・プロセッサであって、データベースの各レコードに関して、レコードを特徴づける複数のキーとなる特徴を識別する手段と、複数のキーとなる特徴から、データベースの当該レコードを最もよく特徴づける優勢な特徴に対応する階層構造内の１つのノードを選択する手段と、該優勢な特徴及び階層構造内でのその位置をデータベースの当該レコードと関連させる手段とを含み、データベースのレコードを、特定のコンテンツによってではなく、それらの優勢な特徴によってアクセス可能にする、システム・プロセッサと
を含み、
該システム・プロセッサの、優勢な特徴に対応する階層構造内の１つのノードを選択する手段は、
レコードにおける選択されるキーとなる特徴の各々を、階層構造内の特徴と比較するための手段と、
レコードのキーとなる特徴と階層構造の特徴との間でのマッチングの発生回数及びそれらのノード位置を記録する手段と、
ノードが、生じたマッチングの所定大部分を包含する位置であるかどうかに応じて、どのノードを選択すべきか判定し選択する判定選択手段であって、
階層構造の各ブランチに関する収束値であって、当該ブランチより下でかつ該ブランチに接続されるノードに記録されたすべてのマッチングの合計によって与えられる収束値を計算する手段と、
階層構造の各ブランチに関する反収束値であって、階層構造内でのマッチング数の合計と当該ブランチに関する収束値との間の差によって与えられる反収束値を計算する手段と、
階層構造のノードに関する距離値を計算する手段であって、任意のノードに対する距離値を、最上層ノードと距離値が計算されるノードとの間にあるブランチの収束値及び反収束値の関数として計算する手段と、
最低の距離値を備えたノードを選択する手段と
を含む判定選択手段
を備えていることを特徴とするシステム。
請求項１記載のシステムにおいて、距離値を計算する手段は、
階層構造の最上層ノードに相対的に大きな距離値を割り当てる手段と、
あるブランチを介して該最上層ノードに接続されたノードから始めて、距離値を計算する手段であって、該ブランチの収束値だけ最上層ノードの距離値を減少させ、そして、その結果を、該ブランチの反収束値にファクタａ（ただし、ａは単位元より大きい）を乗算した値だけ増大させることによって、距離値を計算する手段と
を含み、
距離値を計算する手段はさらに、上記と同様な方式で階層構造内の他のノードに関して距離値を計算し、ブランチの下端ノードに関する距離値を、上端ノードの距離値からそのブランチの収束値だけを減少させ、そして、その結果に、ブランチの反収束値にファクタ「ａ」を乗算した値を加えることによって得るようにした
ことを特徴とするシステム。
請求項２記載のシステムにおいて、該システムはさらに、
距離値が計算されようとしている次のノードとして、収束値が最大のブランチを選択する手段であって、選択されるブランチが階層構造内の等レベルにある他のすべてのブランチよりも大きな収束値を持ち、かつ、距離値が最大の収束値のブランチを通過する経路に沿ったノードに対してのみ計算される、手段
を含み、距離値を最上層ノードに割り当て、さらに他のノードに対して距離値を計算した直後に、収束値が最大のブランチを選択するための手段が動作することを特徴とするシステム。