JPH04137069A

JPH04137069A - データベースの登録簿を探索する方法

Info

Publication number: JPH04137069A
Application number: JP2405118A
Authority: JP
Inventors: Ronald E Dann; ロナルド・エバーレット・ダン
Original assignee: Bull HN Information Systems Inc
Current assignee: Bull HN Information Systems Inc
Priority date: 1989-12-22
Filing date: 1990-12-21
Publication date: 1992-05-12
Anticipated expiration: 2012-08-06
Also published as: AU6696790A; DE69032693T2; ES2121744T3; EP0433964A3; CN1053852A; CA2030909A1; AU631276B2; EP0433964B1; DE69032693D1; US5333317A; EP0433964A2; JP2638307B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

［０００１］

【関連出願とのクロスリファレンス】

この特許出願は、１９８９年８月２８日こ出願されこの
特許出願の譲受人に譲渡された、５ｔｅｖｅｎ　　Ｐ、
Ｎ１ｃｋｅｌによるアメリカ特許出願番号ＮＯ。４１４．０４５、名称［Ｐｒｅｆｉｘ　　５ｅａｒｃｈ
　　Ｔｒｅｅ　　ｗｉｔｈ　　Ｐａｒｔｉａｌ　　Ｔｒ
ｅｅ　　ＢｒａｎｃｈｉｎｇＪに関連する。［０００２］

【産業上の利用分野】

この発明はデータベースにおける情報の位置に関し、さ
らに詳しくは、使用者により提供された主張芯を伴うデ
ータベース登録簿に記憶された名前のような情報識別名
を解明することによる情報の位置決めに関する。［０００３］

【従来の技術】

データベースにおいてよく再発する問題は、特にコンピ
ュータシステムにおいて起り勝ちな問題とは、データベ
ースのエントリに記憶された情報の規定項目の探索と位
置とに関する問題である。このような探索では一般にそ
のデータベースの登録簿を作ることによって実施され、
この場合、この登録簿にはデータベースエントリの索引
が含まれている。この索引は、順次に、このデータベー
スエントリに記憶された項目に関連するキーを含んでお
り、個々のキーに対しては、対応するエントリのデータ
ベース内の位置を含んでいる。その結果、使用者はその
エントリの位置を見出すための登録簿を探索するため、
エントリ内のデータの所定の項目と関連するキーを使用
する。登録簿索引で用いられるキーの最も普通の形態の
１つは、その情報と何らか識別する関係をもつ名前であ
る。例えば、名前の分解法に対する特許出願原本に含ま
れているワード処理ファイルから成るエントリは、「ｎ
ａｍｅｒａｓＪという名前が与えられる。これにより使
用者は「ｎａｍｅｒａｓＪ用の登録簿を探索することに
より原文ファイルを見出す。［０００４］データベース内の情報の位置決めするために索引に記憶
された名前を使うことは、それ自体特定な問題にぶつか
る。所定の情報項目あるいは命名規制に不慣れな使用者
は、その索引の中に名前を見出すことが困難であり、そ
のような索引はしばしば、無作為探索用としてはあまり
にも膨大すぎることがある。しかも、使用者がたとえ所
定のデータベースエントリに慣れていても、命名規制は
、しばしば所定のエントリの正確な名前を忘れてしまう
。問題は、従って使用者にとって親しみ易い登録簿の名
前探索及び解明を提供することにある。［０００５］上述の諸問題点は多分、個人についての情報の登録簿を
構成するデータベースにより最もよく図解される。例え
ば、このようなデータベースは、個人の電話番号、住所
、回路網位置、場所などと共に、大型コンピュータある
いは通信網に連結された全ての個人に関する情報を含有
する。データベースのこの場合の例では多分、この登録
簿の索引内の名前を識別しあるいは位置決めと分解をす
るためには最も複雑であり、しかも、この発明はこの特
殊なデータベースの形態あるいは索引命名規制に限定す
るものではないが、この場合の例は、この発明について
の以下の説明の中で最も高頻度に用いられる事例である
。［０００６］先行技術においてしばしば用いられている命名法の１つ
は「記述式名前」であり、この場合は個々の名前は属性
のセット（−組を構成したもの）から成っている。個々
の属性はそのデータベースにおける対象物すなわちエン
トリに関する特定の種類の情報の断片であり、所定の例
の属性の値は、関連するデータベースエントリに関する
特殊情報により決定される。例えば、１つのエントリの
創作の日付はその登録簿者の属性であり、その属性値は
そのエントリが創り出された日付である。所定の「名前
」は、従って１つあるいはそれ以上の属性値表明、すな
わち属性の種類／属性値の対により規制される。一般に
、属性値表明の順序は大して重要ではないが、使用者は
、対応するデータエントリを明確に識別するために必要
な出来るだけ多くの属性値表明を提供することを要求す
る。このような対処方法に伴う問題は、使用者は、「名
前」を形成するために選択した特定の属性に慣れている
ばかりでなく、表明が名前の中に現われるとき正確に少
くとも最小限の数の表明の値を得なければならない。す
なわち、１つの属性値として「Ｋａｔｙ」を用いること
は、もしも索引中に記憶された値がｌ’−ＫａｔｅＪで
あるならば一致を生ずることはない筈である。［０００７］異名は、その属性の変形を介して識別できるが、また使
用者に親愛を鞄かせるように使われると考えられて来た
。例えば、もし登録簿が属性値表明で、「国名＝ＵＳＪ
及び「州名＝マサチェーセッツ」をもつ名前を含んでお
れば、この異名は、「国名＝ＵＳ、州名＝ＭａｓｓＪ及
び、［国名＝ＵＳ、州名＝ＭＡＪが、この名前をもつエ
ントリを位置決めする上で使用者に許容しよう。［０００８］しかしこの方法は厳格な制限条件を有しており、その制
限条件では、分離した異名エントリはあらゆる命名変形
に対する登録簿に現われなければならないし、しかも多
くの可能性のある変形をもつ属性値表明は多くの異名を
必要とするということである。この条件は登録簿の大き
さ及びこの登録簿を維持する上での管理用オーバヘッド
の双方の著しい拡大をする。この問題は所定の名前から
成る多数の属性値表明を共に増大する。すなわち、１つ
の名前を支持するために必要な異名の全数はその名前の
個々の属性値表明に対する多数の変形の魔物である。加
えて、１つの所定の属性値表明は多数の異る名前で、し
かも他の属性の可変セットと関連して出現できる。例え
ば、「州名＝マサチューセラ・刈は、１つの名前では「
国名＝ＵＳＪで現われ、だの名前では「機関＝ＨＢＩＪ
で現われる、従ってこの場合には、「国名＝マサチュー
セッツ」のもつ３つの変形を支持するには６つの異名が
必要となる。［０００９］上記に論じた諸問題は、登録簿の名前が属性として「普
通名」を用いることに基づく場合−層深刻となる。「普
通名」は、時に、「この名前によって対象物がある定義
をされ、限られた範囲において一般に知られる名前」と
して定義されている。例えば、英語を話す国に於ける人
間の「普通名」にもとづく登録簿は、個人の称号、例え
ばＭｒ、、Ｍｒ　ｓ、、Ｍｓあるいは博士、第１名、１
つまたはそれ以上の中間名、最終名及びＪｒ、あるいは
ＩＩなどの世代を表わす指示から成っている。ある英語
を話す文化圏における普通名は、更に、称号、勲位及び
栄誉が含まれる。登録簿の名前に使うことができる属性
の他の種類のほとんど大部分のものと比較すると、人間
の普通名は非常に多数の変形をもっことができる。しか
し使用者に親しみ易い登録簿であるために、登録簿は、
普通名の属性の内のいくつかあるいは全部が無い場合に
登録簿エントリに対する要求を解明することができなく
てはならない、この場合、提供された構成成分はこのエ
ントリを識別する上で充分後に立ち、その成分の代替成
分すなわち変形は受入れられることだけはなされねばな
らない。［００１０］この問題の重大性は１事例、すなわち、名前「Ｍｒ、Ｒ
ｏｂｉｎ　　Ｌａｃｈｌａｎ　　ＭｃＬｅｏｄ　　ＢＳ
ｃ　（ｈｏｎｓ）ＣＥｎｇ　　ＭＩＥＥＪによッテ図解
できるが、この名前は典型的な英国人名である。もし最
後名がこの人物を明確に識別するに充分役立つならば、
登録簿は、この名前を、称号、第１名、中間温及び栄誉
の各成分を全て除いて、あるいは現在のこれら構成成分
のうちの若干を組合わせて他は除いて解明されねばなら
ない。登録簿は、もし第１名及び中間温が全体温あるい
は頭文字の何れかで提供されるならば、あるいはニック
ネームやその頭文字が第１名の代りに提供されるならば
、その名前を解明しなければならない。このように称号
及び栄誉のそれぞれに対して２つの変形があり、中間温
に対しては３つの変形が、そして第１名に対しては５つ
の変形がある。第１名あるいは頭文字なしに、中間温あ
るいは頭文字としてこのような変形を許さなければ、有
効な変形の数は５２となる。もし名前中に世代表示、例
えばＪｒ、とかＩＩなどが入れば変形は１０４となり、
その人物が２つあるいはそれ以上の中間温を、一般の英
国におけるように、もっているならば、その変形の数は
それぞれの付加的名前の３倍となるであろう。期間の有
る場合、無い場合双方における栄誉と頭文字の部分集合
を許すと、許容すべき変形の数は更に増大する。［００１１３普通名解明の問題を更に図解する場合、ある国において
は別名がその人物の名前の第１要素として現われる。な
お他の国においては、多語第１名が比較的一般的であり
、アメリカ合衆国における例では、Ｍａｒｙ　　Ａｎｎ
とが、Ｂ１１１ｙＢｏｂなどがその例であり、Ｄｅ　　
Ｔｏｍａｓｏ及びｃｏｎａｎ　　Ｄｏｙｌｅのような多
語最終名と同様であって２つの成分がハイフンで結ばれ
ている。スペイン語を話す国においては、ある人物の法
律名は、第１名、多語中間名・父親からもらった別名及
び母親の独身名から成り、しばしば共通利用される。［００１２］普通名登録簿の全ての受入れ可能変形名を徹底的に目録
に載せる登録簿は、異名としであるいは付加的属性値と
して、登録簿の大きさ及びこの登録簿を維持するための
努力の両方に関して実用的でないということが、正にこ
の事例から明らかである。先行技術に関する上述の諸問題、ならびに他の諸問題に
関する解答は、データベース登録簿における普通名の解
明に関するこの発明の方法により提供される。［００１３］

【発明の目的】

従って、１つの登録簿における索引の中の名前のエント
リを介してデータベースエントリを位置決定するための
改善方法を提供することがこのシステムの目的であり、
特に、名前が個人名であって、エントリが普通名を提供
した使用者を介して位置決定されるべきであってその普
通名はその索引中の対応する形とはかなり異っているそ
のようなシステムの中においてこの改善分法を提供する
のである［００１４］

【この発明の概要】この発明は、データベースとそのデータベース内のエン
トリの索引とをもつ情報処理システムで用いられ、そし
て索引内に記憶されたデータベースエントリ名によりデ
ータベースエントリを識別するように主張された普通名
を解明する方法を提供する。主張名とエントリ名とは個
々に、第１フィールド、第２フィールド及び第３フィー
ルドから成り、この中で少くとも第１フィールドは少く
とも１語を有する。データベースエントリが、普通名を
介して位置決定されている人物に関する情報を有してい
る事例においては、その主張名とエントリ名の第１、第
２及び第３の各フィールドは、その人物の別名、世代指
示及び栄誉称号、そして第１、中間及びニックネームを
それそ゛れ有している。［００１５］主張名は、普通名の形式に相当する正規化された形で名
前解明処理方法に提供される。これは簡単な、自由形の
形式であり、システムに最小限度の標準化を強いるもの
であり、この場合、フィールドは、連続状に、「（個人
名）（別名）（世代及び栄誉）」に現われ、そして、こ
の場合、個人名フィールドは第１、中間及びニックネー
ム語を有し、ここで、ニックネームは、例えば代替第１
名である。個人名及び別名フィールドの語は互いに他か
ら遊離しておらず、あるいは別途に識別され、個人名フ
ィールドも別名フィールドも共に要語を有している。普
通名形式内の３フィールド内の分離符号だけが、別名フ
ィールドと世代及び栄誉フィールドとの間に現われ、例
えば、コンマ符号をもって現われる。索引内に記憶され
たエントリ名は、同様な標準の、正規化された形で記憶
され、この発明では、普通名形式よりも大きな構造を提
供するエントリ名形式を開示しているが、この発明の方
法は、普通名形式内の索引に記憶されたエントリ名を用
いる実施を考えている。エントリ名のフィールドは、し
かしもっと容易に識別されるのであって、この場合、個
人に属する索引エントリ名は、普通多属性と同様に別名
属性をもっている。［００１６］この発明によれば、この名前解明作業は、主張名とエン
トリ名との間の正確な一致を表わす一致スコアと計数値
のセットの初期設定とを決めることによって開始し、こ
こにおいて個々の計数値は主張名のフィールドとエント
リ名の対応するフィールドとの間の同一′ｉ生を表わす
。［００１７］次いで、この作業は、主張名から第１　（別名）フィー
ルドを選択して、その後主張した第１　（別名）フィー
ルドと同じ第１　（別名）フィールドをもつエントリ名
を識別することにより、主張した語の第１　（別名）フ
ィールドと一致する第１（別名）フィールドをもつ全て
の索引エントリのセットを構成する。

【００１８］この段階において、この作業は、第２（世代及び栄誉）
フィールドを構成し主張名の残余の部分を採り上げるよ
うに、分離符号すなわちコンマに続く主張名の全ての部
分・すなわち、第１　（別名）フィールドを構成するよ
うに分離符号に先行する主張名の全ての部分を識別する
ことによって、主張名の別名フィールドを選択する。［００１９］ドとして識別されるようにその名前の最終語を選択する
。この作業は次いで、（ａ）主張名「別名」フィールド
の最終語に等しい別名か、あるいは、（ｂ）主張名「別
名」フィールドの最終語に等しい最終語をもつ多語別名
か、何れかを有する全ての索引エントリを識別する。［００２０］多語別名をもつ索引エントリの事例においては、この場
合、索引エントリの別名フィールドにおける語の数は、
ｎ個であるが、この作業では、頭文字推測語で終ってい
てしかも索引芯別名フィールドの最後のｎ語をもって成
る主張名別名フィールドの最後のｎ語を比較し、そして
その２つの名前のｎ語が等しいかどうか一致を識別する
。［００２１］別名フィールドに従って主張名に一致する可能性をもつ
索引エントリのセットを構成しておいて、この作業はこ
のセットの中の個々のエントリ名に対して、このエント
リ名の第１フィールドを主張名の第１フィールドと比較
し、もし主張名とエントリ名の第１フィールドが一致し
なければ、そのセットからもう１つの別のエントリ名を
選択する。主張名の第１フィールドは、エントリ名の別
名における語の数により変化することを注意すべきであ
る。もし主張名とエントリ名の第１フィールドが一致す
れば、この作業は、その一致が単一語の別名間に存在す
るのかあるいは多語別名の間に存在するのかその何れか
に従って、対応する計数値を増す。［００２２］次にこの作業は主張名から第２（世代及び栄誉）フィー
ルドを選択し主張名とエントリ名との第２フィールドを
比較する。もし、これら第２フィールドに一致が見出さ
れれば、この作業は再び対応する計数値を増加する。こ
の比較作業において、第２（世代ならびに栄誉）フィー
ルドにおける語順は大した問題ではないすなわちこのフ
ィールドにおける一致語の数だけが重要であってそれら
語のフィールドにおける順序すなわち連続状態は重要で
はない。１つの計数フィールドが見出された各個の一致
に加えられ、一致において加えられた他の計数フィール
ドは、主張名及び索引芯の第２（世代ならびに栄誉）フ
ィールドの全ての語間において見出され、この場合、や
はり語の順序には関係がない。［００２３］この作業は主張名から第３（個人名）フィールドを選択
し主張名の第３フイルドにおける各個の語に対して以下
の段階順序を実施する。この第３フィールドは主張名に
おける別名に先行する全ての語を含んでいる。［００２４］この作業では主張名の選択語をエントリ名の第３フィー
ルドにおける同位置の語と比較する。もしそれら語の一
致があればこの作業では対応する計数値を増しその主張
名の第３（個人名）フィールド内の次の語を選択しこの
一連の段階の開始段階に戻る。［００２５］これら語の一致が見出されなければ、しかし１つの語カ
ミ主張名の第３フィールドから選択された語と比較でき
るエントリ名の第３フィールド内に存在していれば、こ
の作業では主張名及びエントリ名の第３フィールドにお
ける語の頭文字を比較する。１つの名前の第３フィール
ドの語がもし短縮形語であれば、すなわち、頭文字であ
るとか他の名前の第３フィールドの語の形をもつとかす
れば、この作業は対応する計数値を増して主張名の第３
フィールドから次の語を選択してこの一連の作業段階の
開始点にまで戻る。［００２６］もし、直前の２つの作業段階において、この作業が主張
名の第３フィールドから選択した語とエントリ名の第３
フィールドから選択した語との間において正確な一致も
しくは短縮的一致のつずれかを見出せば、しかもこの一
致は主張名の第３フィールドの最終語であった場合、こ
の作業では更にもう１つの計数値を加えて比較スコアを
算出するために最終段階に進む。［００２７］もし、主張名の第３フィールドから選択した語がエント
リ名の第３フィールドにおいて正確もしくは短縮形の何
れがの一致をしなければ不一致が起きている・この作業
ではこの場合エントリ名のセットからこのエントリ名を
落としそのセットの次のエントリ名に進み前記法のエン
トリ名に対する全作業を再び開始する。［００２８］この発明の作業の代替実施態様もしくは付加的実施態様
では、また、特に個人名の最初の語に代替えする形に対
して、第３（個人名）フィールドにおける代替芯もしく
は異名に対する、上記一連の作業段階における付加的比
較を提供する。例えば、１つのエントリ名の第３フィールドがもしＩ−
ＲｏｎａｌｄＪという語を有すれば、この語はこれに関
連した代替もしくは異名として１ＲｏｎＪという語をも
つことができる。［ＲｏｎＪという形をもつ主張名は、
従って、「ＲｏｎａｌｄＪもしくはその短縮形すなわち
ｒＲＪという頭文字との正確な一致を見出すか、または
「Ｒｏｎｊという形の語との一致を見出す筈である。［００２９］次いで、この作業の最終段階では、計数値の重みづけ合
計値として、上述した比較結果から、主張名とエントリ
名の間の同一性の程度に対する比較スコアを決定する。この点において、この作業はそのセットのエントリ名を
、もしあれば主張名に対する最も可能性のある対応色と
して識別する。もし比較スコアが正確な一致スコアと等
しければ、このシステムはこの名前解明の作業を終了し
、このエントリ名を主張名に対応するものとして提供す
る。もし比較スコアが正確な一致スコアと等しくなけれ
ば、このシステムではその比較スコアを記録し、そのセ
ットからもう１つ別のエントリ名を選択し、そしてもう
１つのエントリ名に対する解明作業を繰り返し実施する
。しかし、このセットの中に解明さるべきエントリ名が
他になければ、このシステムはこの名前解明作業を終了
し、そして少くともこのエントリ名をその主張名に最も
よく対応するものとして提供する。［００３０］この発明についてこれまで述べて来たところの、そして
その他のこの発明の目的、特徴及び利点についてはこの
発明ならびにその実施態様に関する以下の説明から明ら
かであろう。［００３１］【実施例】Ａ、登録簿システム１０の一般的説明（第１図）。ステムにこの発明が組込まれている。この発明が実施さ
れる環境事情を明らかに示すために基本的にこの登録簿
１０が開示される限り、そしてまたこの発明の実施態様
を定義でしばるのでもなくまた限定条件を与えることも
せずに、登録簿システム１０は単に一般的水準において
説明が展開されよう。［００３２］登録簿システム１０内で扱われる登録簿は、一連の推奨
標準類、ｌ５Ｏ９５９４及びＣＣＩＴＴＸ、５００で述
べられているように論理データベースであって、対象物
のセットに関する情報を包有しており、この中で各個の
対象物は、データ、プログラム、データとプログラム、
そして一般的に何れかの形態の情報を保有する論理的「
容器」　（コンテナ）と普通は定義される。このような
個々の対象物はその対象物の多数の属性を包含する登録
簿エントリにより表現される。この点について、１つの
対象物の１つの属性はその対象物の識別特性を若干定め
てもっており；例えば、ある個人についてのいくつかの
属性と言えば、その別名、第１名及び中間色、住所、電
話番号及び誕生日などがある。この登録簿エントリに記
憶されるものは実際に何であるかというとそれはこの対
象物用の属性の特定値であり、例えば、実際の最終名、
第１名、中間色、住所、電話番号及び誕生日などである
。事例で説明するために、所定の対象物に属性の「別名
」と「個人名」を与え、この特定の対象物の事例では、
これら属性の値は、個々に「Ｃｅｃｈ。ｎｙＪと「Ｇｅ　ｒ　ｒ　ｙＪである。［００３３］エントリが登録簿に記憶されている対象物は、しばしば
、例えば人々の名前、場所、電話と回路網の位置あるい
は番号、コンピュータシステムの場所、取付は位置及び
記憶源及びＯ３Ｉ適用プログラムとしての事物などの電
気通信システムに関連している。対象物として許容され
る種類は上記の参考標準文献類に定められており、これ
ら文献には例えば、人物の対象級に対しては、個人の名
前、電話番号、通信網の場所及びパスワードなどの関連
する属性の種類が含まれている。［００３４］この登録簿は、階層型名前間隔をもった分布階層型デー
タベースとして論理的モデルをもっている。個々のエン
トリは、１つあるいはそれ以上の属性の種類／属性値（
ＡＶＡ）の対から成っている相対的識別名（ＲＤＮ）も
しくは局部名によって名前間隔の中に位置による識別を
されて含まれている。１つの両親エントリの子供である
所定のエントリのＲＤＮはその両親エントリの他の子供
エントリの全てのエントリの中で独特のエントリである
。［００３５］１つのエントリはその識別名（ＤＮ）によって名前間隔
全体に対して識別されこのＤＮは全体的にみて独特であ
り、しかもそのＲＤＮとは、その先祖から伝わるエント
リの全てのＲＤＮをもってそのＲＤＮと連鎖状に連結さ
れており、すなわち、降下−直線内で、これより上の全
ての高度に祖先にさかのぼるエントリ全てのＲＤＮをも
って連結されて成る。［００３６］図示のように、実施例としての登録システム１０は使用
者に対して登録簿業務を施行する場合に共同するサブシ
ステムのセットから成っている。登録簿システム１０は
この明細書中に例示するようにシステム使用者（ＵＳＥ
Ｒ）１２を有しこのＵＳＥＲ１２は登録簿業務を要請し
て受は入れ、例えばＣＲＴ表示器及びキーボードあるい
はマウスを介して登録簿使用者代理人（ＤＵＡ）１４と
連通ずる。その名前から分るように、ＤＵＡ１４はその
使用者に代って動作を実施し、その中にはこの登録簿に
対する接近を特定の登録簿使用者に提供することも含ま
れており、この意味でこの使用者はＵＳＥＲ１２に限定
されるのでなく１人の人物すなわちＵＳＥＲ１２もしく
は１つの適用プログラムであってよい。［００３７］例えば、ＤＵＡ１４はパーソナルコンピュータ、ワーク
ステーションもしくは端子をもったコンピュータシステ
ムであり、プログラムインターフェイス（Ｐ　Ｉ〕ｎを
もち、このＰＩを介してアプリケーションが登録簿及び
１つあるいはそれ以上のアプリケーションプログラム（
ＡＰ）１８に対するアクセスが得られる。適用フログラム１８は順に使用者インターフェイス（Ｕ
Ｉ）２０を含み、このものはＵＳＥＲ１２から入力指令
と要求とを受は取り、ＵＳＥＲ１２に出力を提供して、
順次、Ｐ１１６及び他のＡＰ　１８と連絡する。登録簿
システム１０について現在考えられている実施態様にお
いては、ＵＩ２０は、ＭＩＴのＸ−窓にもとづくマイク
ロソフト窓の実施か開放型システム間相互接続（Ｏ３Ｉ
）図面インターフェイスのようなスクリーン画面式（ｓ
ｃｒｅｅｎ　　ｂａｓｅｄ　　ｇｒａｐｈｉｃａ１）使
用者インターフェイスプログラムである。［００３８］Ｐ１１６は、登録簿が関与する要求を満すように求めら
れる機能を提供する。この実施態様においては、Ｐ１１６は登録簿要求を、標
準のＣ語データ形式として符号化された独立変数の形で
受取り、これら受取った要求を、工業標準の抽象構文記
法１（ＡＮＳＩ　　１）符号化ストリング（列）に変換
する。登録簿作業の結果は、ＡＮＳＩ　　１ストリング
の形でＰ１１６により受取られ、そして標準Ｃ語データ
に変換されてＰ１１６によりアプリケーションに提供さ
れる。［００３９］ＤＵＡ１４のＰ１１６はプロトコール（通信上の規約〕
ｎを介して登録簿業務代理器（ＤＳＡ）２２と連絡する
、そして登録簿アクセスプロトコール（ＤＡＰ）２４及
びＤＳＡ２２の手続きは、順に、登録簿、登録簿情報ベ
ース管理及びアクセス動作を実施する。ＤＳＡは再び汎
用コンピュータシステムとして実施され、図示のように
登録簿動作管理器（ＤＯＭ）２６を有しこの管理人は動
作システムに対してアナログ動作をし、登録簿要求の管
理機能と他のＤＳＡ２２との動作を提供する。［００４０］ＤＳＡはまた、ＤＯＭ２６と関連しそしてその一部とし
て登録簿管理人（ＤＭ）２８を含み、このものは登録簿
と、データベース管理と登録簿アクセス機能と名前解明
器（ＮＲ）３０とを提供する、そしてこのＮＲ３０はこ
の発明の一部をなし以下にその詳細を説明しよう。［００４１］ＤＳＡ２２は、順次ＤＯＭ２６、ＤＭ２８及びＮＲ３０
を介して実際の登録簿３２に連結する。登録簿３２は索
引３４と、そして登録簿情報ベースエントリ（ＤＩＢＥ
ｓ）３８から成る登録簿情報ベースエントリ（ＤＩＢ）
３６を含む・ＤＩＢ３６は全地球規模の登録簿に相当す
ること、また何れの単一ＤＳＡ２２もＤＩＢ３６の断片
体であるということを注意すべきである。登録簿３２は
基本的にはファイル管理能力をもった大容量記憶装置で
あり、例えば関連のディスク駆動機構をもった汎用コン
ピュータシステムとして、あるいは当業者に公知技術と
なっているように特定ファイル処理システムとして実施
される。［００４２］索引３４はＤＩＢ３６から成る登録簿への索引から成り
、一方、ＤＩＢ３６のＤＩＢＥ３８は順に登録簿エント
リを含有する。これら構成成分のそれぞれはその詳細を
以下に述べられよう。［００４３］最後に、しかも再びＤＳＡ２２を参照すると、第１図に
やや詳細に示しであるＤＯＭ２６は登録簿業務プロトコ
ール（ＤＳＰ）４０を介して１つあるいはそれ以上の他
のＤＳＡ２２と連結して成るということ、またこれら他
のＤＳＡ２２は順に他の登録簿３２、ＤＵＡ１４及びＵ
ＳＥＲ１２と関連している。［００４４］すでに説明したように、登録簿システム１０は、登録簿
３２、ＤＳＡ２２．１つあるいはそれ以上のＤＵＡ１４
及び多重ＵＳＥＲ１２から成っていてしかも登録簿シス
テム１０のより大きいシステムもしくは回路網中に１つ
の領域あるいは節点を有している筈であり、これにより
極めて大規模な、分布データベースに対する登録簿業務
を提供する。個々の領域もしくは節点は局部的常駐をし
維持されているデータのためのデータベースと関連登録
簿をもっている筈であり、登録簿エントリもしくは同様
な他の領域もしくは節点の転記を記憶すべきである。こ
のシステムの領域もしくは節点上のＵＳＥＲ１２は、従
って全システムに対する登録簿業務を具備している。全
体システムのＤＳＡ２２は、従ってＤＳＰ４０を介して
相互連結され、その結果登録簿情報を互いに交換し登録
簿業務と全システムを横切るデータベースアクセスとを
提供する。［００４５］Ｂ、索引３４の説明（第２図、第３図）第２図及び第３
図を参照すると、この発明の実施に係る索引３４の概略
図が示しである。この索引３４は接頭相構造をもちこの
構造は、１９８９年８月２８日に出願され、この特許出
願の譲受人に譲渡された、５ｔｅｖｅｎ　　Ｐ、Ｎｉｃ
ｋｅｌによるアメリカ特許出願番号Ｎｏ、４１４，０４
５、名称、１−ＰｒｅｆｉｘＳｅａｒｃｈ　　Ｔｒｅｅ
　　Ｗｉｔｈ　　Ｐａｒｔｉａｌ　　Ｔｒｅｅ　　Ｂｒ
ａｎｃｈｉｎｇＪに開示されている。［００４６］１つのデータベースに対する１つの索引は時に分岐によ
って連結された１つもしくはそれ以上の個数の節点から
成る樹として構成される。個々の節点は一般に探索を指
示する情報を含有する１つまたはそれ以上の分岐フィー
ルドを有し、その中で個々のそれら分岐フィールドは常
にポインタあるいは分岐をもう１つの節点、ならびにそ
の節点からその分岐に沿って位置する情報の範囲もしく
は種類を指示する関連の分岐キーに対して、含有して成
る。この樹、そしてこの樹の何れかの探索はルート節点
とされる単一節点から始まり、下方に向って各種分岐節
点を経て進み、情報の項目もしくは、もっと一般的に情
報の項目のポインタの何れかを含む節点が到達するまで
下降する。節点に関連する情報はしばしば葉ノード（節
点）と言われ、あるいは、失敗、破壊節点を継続するが
どうが探索する水準だからこう呼ばれるのである。樹の
中の何れの節点もその節点から出発して全ての節点に対
してルート節点あり、１本の樹の中のその様な副次構造
はその節点に関して時にサブトリーと言われる。［００４７］１つの探索において遭遇する個々の節点において、探索
キーとその節点に記憶された分岐キーとを比較すること
によって、その探索においては樹を介して何れの方向も
しくは分岐をとるべきかについての決定がなされる。こ
の比較の結果が所定の節点からの従属分岐の内の何れが
この探索の次の段階に続くかを決定することになる。こ
の点に関して、探索キーは最も一般的に、探索されるべ
き情報の項目に関連している文字あるいは数字のストリ
ングから成っている。［００４８］登録システム１０の現在実施しているものの索引３４は
、可変長さ、文字指向のキーを用い高濃度の索引構造を
提供する接頭語探索樹として構成されている・分岐は何
れの水準においても、キー全体によるよりもむしろキー
の一部により決定され、樹の構造は、その樹が構成され
ている順序には依存しない。［００４９］初めに索引３４の一般的構造を考えると、索引３４は、
空かあるｌｊ）は１より大きいか１に等しい高さ、すな
わち１あるいはそれ以上の水準をもつ樹であり、次の性
質を満足する：（ｉ）この樹の何れかの節点、Ｔ、はその形と種類は、
Ｐ、Ｓ、（Ｐｉ　　　−Ｐｐ）、Ｄ、（（Ｂｉ、Ｓｉ）
　　　　　（Ｂｓ、５ｓ））ここでＰｉ、Ｏ＜ｉ≦Ｐは
接頭諸相を表わし、順組（ＢｉＳｉ）　　０＜ｉ≦Ｓは
分岐文字とサブトリーＴをそれぞれ表わし、Ｄはデータ
記録のポインタであり；（ｉ　ｉ）接頭語（Ｐｉ　　　
−Ｐｐ）は、Ｔ（及びＴから従属するサブトリー）に含
まれるあらゆるキーにより分離された前方文字の最長ス
トリングを含み；（ｉ　ｉ　ｉ）　Ｄは長さｐのキーを
もつ記録へのポインターであるかあるいはこのようなキ
ーがない場合、Ｏであり；（ｉ　ｖ）個々のＢｉ、Ｏ＜ｉ≦ＳはＴにおけるあるキ
ーの、すなわちＴから従属のサブトリーの第ｐ＋１番目
の独特な文字であり、その長さはｐよりも長く；（ｖ）
Ｂｉ＜Ｂｉ＋１．Ｏ＜ｉ＜ｓ　；（ｖｉ）個々のＳｉは
Ｔから従属の接頭語探索樹に対するポインターであり；
そして、（ｖｉｉ）Ｓｉ、０＜ｉ≦Ｓによって表わされたサブト
リーにおけるキーは、頭文字ｐ＋１文字を除くことによ
ってｐ＋１番目の文字としてＢｉをもつＴにおけるキー
のセットから形成される。［００５０１索引３４の構造に関する上記説明は第２図及び第３図に
図解されており、その中で、第２図は、上記の定義に従
う樹４４の単一節点（Ｔ）４２の構造及び形式について
の概略図である。図示のように、Ｔ４２は接頭語フィー
ルド（ＰＦ）４６を有しこのものは節点Ｔ４２から出て
いる全てのサブトリーの全てのキーによって分けられて
いる文字の最長のストリングから成る長ｇｐ（Ｐｉ　　
　　Ｐｐ）の接頭語を有し、またＴ４２には、データポ
インタフィールド（Ｄ）４８が含まれていてこのものは
、もしそのようなキー及びデータ記録がなければ、キー
（Ｐｉ　　　−Ｐｐ〕ｎをもつデータ記録に対するポイ
ンタをもっている。Ｔ４２はまた１つあるいはそれ以上
の分岐フィールド（ＢＦ）５０をもち、このもののそれ
ぞれは、分岐文字Ｂｊを記憶するための分岐文字フィー
ルド（ＢＣ）５２と、対応する分岐ポインタＳｊを記憶
するための分岐ポインタフィールド（ＢＰ）５４から成
っている。説明したように、個々のＢｊ！、ｔＴ４２か
らのサブトリーの長さｐよりも長い長さをもつキーのｐ
＋１番目の文字であり、一方何々の関連したＳｊはその
サブトリーの節点Ｔ４２に対するポインターである。最
後に、個々の節点Ｔ４２は、節点４２から出ているＰＦ
４６及びサブトリー（あるいはデータ記録）の数、すな
わち節点Ｔ４２に含まれているＢＦ３０の数に記憶され
た接頭語において、長さと文字の数とをそれぞれ含むｐ
フィールド５６とＳフィールド５８とを有する。ｐフィ
ールド５６とＳフィールド５８とは節点Ｔ４２の構造の
必要な部分ではないが、これらのフィールドはこの節点
を処理する場合登録簿システム１０を援助するために用
いられる。すなわち、この情報をＰＦ４８及びＢＦ３０
から抽出するシステムをもつことよりも、ＰＦ４８に含
まれる接頭語の長さに関して、また分岐フィールド５０
の数に関してプロセッサに情報を与えることの方が一層
効率的である。［００５１］樹４４のある節点は葉ノーズであり、このものはその構
造において分岐節点Ｔ４２と同一であり、ただし、これ
らの節点は分岐がＯであるので分岐フィールド５０をも
たず、しかし登録簿１０のデータベース内のデータ記録
に対する基準をもつＤフィールド４８を有している点だ
けが異っている。［００５２］第３図では、キー値、”Ｂｔｒｅｅ　　、　　”Ｂｉｎ
ａｒｙ”　　”ＢｉｎａｒｙＳｅａｒｃｈ”、　　”Ｂ
ｉｎａｒｙＴｒｅｅ　　、　　”ＨａｓｈＴａｂｌｅ”
、　　”ＨａｓｈＦｕｎｃ　ｔ　ｉｏｎ”　、及び’Ｈ
ａ　ｓｈｅ　ｄＦ　ｉ　ｌ　ｅ　　を用いる樹４４を伴
う牽引３４の構造を図解しである。［００５３］ルート節点から出ている２つの分岐あるいはサブトリー
をこの樹がも′：）７あ６うということがこの事例のた
めに用いられるキーを調査して明らかになった。１つの
分岐では頭文字”Ｂ”　　（Ｂｔｒｅｅ、Ｂｉｎａｒｙ
、ＢｉｎａｒｙＳｅａｒＣｈ、及ヒＢ　ｉ　ｎ　ａ　ｒ
　ｙＴｒ　ｅ　ｅ〕ｎをもつキーのための節点を有し、
他の分岐は頭文字”Ｈ”　　（ＨａｓｈＴａｂｌｅ、Ｈ
ａｓｈＦｕｎｃ　ｔ　ｉｏｎ、及びＨａｓｈｅｄＦｉｌ
ｅ〕ｎをもつキーのための節点をもつ。従って、ルート
節点Ｔ４２ＡのＰＦ４６はＯであり、何となればＩＩ　
Ｂ　ＩＩで始まるキーと、“′Ｈ゛°で始まるキーとの
間に分離される共通の接頭語がないからであり、またＴ
４２ＡのＤフィールド４８は、またＯであって、そのわ
けはＴ４２Ａから出るデータ記録がなＸＪ）からである
。Ｔ４２Ａは、頭文字で′Ｂ″をもつ全てのキーをもつ
Ｔ４２Ａサブトリー用の第１ＢＦ５０フィールドと、頭
文字”ｒ　Ｈｌ″をもつこれらのキー用の第２８Ｆ５０
フィールドとをもつ筈である。第１ＢＦ５０フィールド
を考えてみると、このフィールドにおけるＢＦ３２フィ
ールドＢｊは文字“Ｂ”であり、何となれば１１　Ｂ　
ＩＩはＴ４２Ａの対応するサブトリーのキーの第ｐ＋１
番目の文字であり、ＢＦ３４フィールドはこのサブトリ
ーＴ４２Ｂにおける第１節点に対するＳｊポインターＳ
Ｂを有するであろう。Ｔ４２Ａの第２ＢＦ５０フィール
ドは、ＢＣ５２フィールド内のそのＢｊとして文字１１
　ＨＩＩを有し、何となればこれは対応するサブトリー
のキーの第ｐ＋１番目の文字だからである、そしてＢＦ
３４フィールド内のＳｊポインターはこのサブトリーＴ
４２Ｃの第１節点に対するポインターＳ　であろう。Ｔ
４２Ａのｐフィールド５６とＳフィールド５８とは、そ
れぞれＴ４２ＡのＰＦ４６フィールドは接頭語文字を有
しておらず、すなわちＯであることを表わすＯと、そし
て、Ｔ４２Ａは２つの「子供」、すなわちＴ４２Ａから
の２つの分岐があることを表わす２を含んで成る。［００５４］Ｔ４２Ｂについて考えると、頭文字”　Ｂ　”　をもつ
キーの次の分岐は、第２番目の文字として“ｔ１１をも
つキー”Ｂｔｒｅｅ　　と、２番目の文字、（Ｂ　ｉ　
ｎ　ａ　ｒｙ、ＢｉｎａｒｙＳｅａｒｃｈ、及びＢｉｎ
ａｒｙＴｒｅｅ）”ｉ”をもつキーとの間に生ずる。こ
の節点から分岐するキーの間において分離する共通の接
頭語文字はもはやないので、Ｔ４２８　　ＰＦ４６フィ
ールドはＯを含み、Ｔ４２ＢのＤフィールド４８も同じ
である。Ｔ４２Ｂは再び２つのＢＦ３０を有し、この場
合最初の文字はｉ″のＢｊをもち２番目の文字（よ“ｔ
ＩＴのＢｊをもち、　１４　ｉ　１１とパｔ“とは、こ
れら分岐から出たサブトリーのキーの第ｐ＋１番目の文
字である。対応するＳｊポインターは、それぞれ節点Ｔ
４２Ｄ及びＴ４２Ｅに対するポインターＳｉ及びＳｔで
ある。Ｔ４２Ｂのｐフィールド５６及びＳフィールド５
８は、ＰＥ４６フィールドは接頭語文字をもたないこと
を示すＯを有し、またＴ４２Ｂは２つの子供、すなわち
分岐をもつことを示す２を、それぞれ有する。［００５５］次にＴ４２Ｅについて考えると、この節点はデータ記録
の基準をもつが更に他の節点に対する分岐をもたない。そのため、Ｔ４２ＥのＰＥ５０フィールドはＯを有し、
すなわちこの節点はＰＥ５０フィールドをもたない。Ｔ
４２ＥのＰＥ４６フィールドは関連するデータ記録に対
するキーの最終部分、Ｔ４２Ｅの場合の文字ストリング
゛’ｒｅｅ”及びこのデータ記録に対するポインターを
含むＤフィールド４８を有する。ｐフィールド５６とＳ
フィールド５８とは、それぞれＰＥ４６フィールドが３
文字をもつことを示す３と、リーフ（葉ノード）４２Ａ
がサブトリーに対する復帰をもたないことを示す０を有
する。［００５６］次にＴ４２Ｄについて考えると、節点４２Ｂから出てい
る他の節点であってその節点のサブトリーであるＴ４２
Ｄはルート節点であってキーの’Ｂ　ｉ　ｎ　ａ　ｒ　
ｙ”　　　”Ｂｉｎａｒｙ　　５ｅａｒｃｈ”　　及び
’ＢｉｎａｒｙＴｒｅｅ　　を含んでおり、この中でこ
れらのキーの接頭語”　Ｂ　”及びＩＩ　ｉ　！＋はＢ
Ｃ５２フィールドにおける接頭語としてそれぞれＴ４２
ＡとＴ４２Ｂとに記憶される。これらキーの残り部分、
すなわち、”ｎａｒｙ、　　”ｎａｒｙＳｅａｒｃｈ”
、及び”ｎａｒｙＴｒｅｅ”にとって共通の最長の接頭
語は、文字列（ストリング、Ｓｔｒ　ｉｎｇ）“ｎａｒ
ｙ“である。そんなわけで文字列　ｎａｒｙ　　はＴ４
２ＤのＰＥ４６フィールドの接頭語として記憶される。［００５７］このサブトリーにおける３つのキーについては、全ての
３つのキーは、“ｎａｒｙ”に続く次の文字が全て異り
、Ｔ４２Ｄは３つの分岐をもっことになる。しかし、”
ｎ　ａ　ｒ　ｙ”はキー　”Ｂｉｎａｒｙ”の最終部分
であるため、もう１つ別の節点への分岐にむしろ生じ、
このキー”Ｂｉｎａｒｙ　　は、Ｔ４２ＤのＤフィール
ド４８の中に書き込まれているキー”Ｂｉｎａｒｙ”に
関連したデータ記録に対するポインターの中に生ずる。［００５８］しかし、キー”Ｂｉｎａｒｙ　　５ｅａｒｃｈ”　と”
Ｂｉｎａｒｙ　　Ｔｒｅｅ”とは、’ｎ　ａ　ｒ　ｙ　
　に後続する残余の文字列を有しＴ４２Ｄからの分岐の
中に生ずる。”Ｂｉｎａｒｙ　　５ｅａｒｃｈ”の第ｐ
＋１番目の文字は’ｓ”であり、そのため″“Ｓ１１は
、ＢＰフィールド５４内の関連節点Ｔ４２Ｆに対するＳ
ｊポインターＳｓと共に、最初（７）ＢＦ　５０（７）
Ｂ　ｊとして現われる。”ＢｉｎａｒｙＴｒｅｅ”の第
ｐ＋１番目の文字は”Ｔ”であるから、　”Ｔ”は、Ｂ
Ｐフィールド５４内の関連節点Ｔ４２Ｇに対するＳｊポ
インターＳ１と共に、２番目のＢＦ３０のＢｊとして現
われる。Ｔ４２Ｄのｐフィールド５６とＳフィールド５
８は、それぞれ、ＰＦ４６フィールドが４つの文字列を
もつことを示す４と、Ｔ４２Ｄから２つの分岐があるこ
とを示す２とを有している。［００５９］Ｔ４２Ｆ及びＴ４２ＧＨ共にＴ４２Ｅに等しく、Ｔ４２
Ｅにおいてはこれらの節点は他の節点に対してこれ以上
の分岐をもたず、非実在のＢＦ３０フィールドをもち、
個々のＤ４８フィールドにおける関連データ記録に対す
るポインターをもっている。Ｔ４２ＦのＰＦ４６フィー
ルドは文字列”ｅ　ａ　ｒ　ｃ　ｈ”を有し、この文字
列はキー”Ｂｉｎａｒｙ　　５ｅａｒｃｈ”の最終部分
であって、一方Ｔ４２ＧのＰＦ４６フィールドは文字列
　ｒｅｅ　　を有しこの文字列はキー”Ｂｉｎａｒｙ　
　Ｔｒｅｅ”（７）最終部分である。Ｔ４２Ｆのｐフィ
ールド５６は、　”ｅａｒｃｈ”における５文字に対す
る５を含み、Ｔ４２Ｇのｐフィールド５６はｒｅｅ”に
おける３文字に対する３を有する。そして一方では、各
個の節点のＳフィールド５８は、何れの節点からも分岐
のないことを示す０をもっている。［００６０１節点Ｔ４２Ｃ，Ｔ４２Ｈ，Ｔ４２Ｉ及びＴ４２Ｊから成
る第３図のトリー（樹）４４の右手のサブトリーについ
て簡単に述べると、このサブトリーは上述したところと
全く同じ原理で構成されている。このサブトリーに含ま
れるキーは・ＨａｓｈＴａｂｌｅ　　　”Ｈａｓｈｆｕ
ｎｃｔｉｏｎ”　　及び”ＨａｓｈｅｄＦｉｌｅ”であ
り、全ての３つのキー（７）　”Ｈ”は、Ｔ４２ＡのＰ
Ｆ４６に現われる接頭語の第ｐ＋１番目の文字としてＴ
４２Ａの対応するＢＦ３０のＢｊとして現われる。前に
も述べたように、Ｔ４２ＡのＰＦ４６は、Ｔ４２Ａから
の２つの分岐の間に共通の接頭語文字がないので、文字
列はＯとなっている。［００６１］これらのキーの残余の部分、すなわち、　”ａｓｈＴａ
ｂｌｅ”　　　”ａｓｈＦｕｎｃｔｉｏｎ”及び’ａｓ
ｈｅｄＦｉｌｅ　　に共通な最長の接頭語列は、文字列
“ａｓｈ’”であり、従って　ａｓｈ”はＴ４２ＣのＰ
Ｆ４６フィールドに現われる。共通接頭語列“’ａｓｈ
”をもつ３つのキーがあるので、Ｔ４２Ｃからの分岐は
３つある筈である。これら３つのキーの残余の部分の第
ｐ＋１番目の文字は、’ａｓｈ”　を除いた後では、そ
れぞれ、ＩＩ　Ｆ　ＩＴ　　　“Ｔ″及び′ｅ　である
。従って、”　Ｆ　”　とｌ　Ｔ　Ｔ１　と１１　ｅｌ
ｌ　とは、節点、Ｔ４２Ｈ，Ｔ４２　Ｉ及びＴ４２Ｊに
対応するＳｊポインター神、Ｓ、及びＳｅと共にＴ４２
ＣのＢＦ３０内のＢｊＳとして現われる。Ｔ４２Ｃのｐ
フィールド５６とＳフィールド５８とは、それぞれ、Ｐ
Ｆ４６の３文字の文字列を示す３と、Ｔ４２Ｃから３つ
の分岐があることを示す３とをもつ。［００６２］節点Ｔ４２Ｈ，Ｔ４２　Ｉ及びＴ４２　Ｊもまたリーフ
節点であり、これらの節点において、それらのＤフィー
ルド４８内のデータ記録に対するポインターを有するが
、それ以上の分岐はなく、従ってＢＦ３０も存在しない
。Ｔ４２ＨのＰＦフィールドは文字列゛ｕｎｃｔｉｏｎ
”を有し、この文字列はキー　“’ＨａｓｈＦｕｎｃｔ
ｉｏｎ”の残余部分であり、一方、Ｔ４２Ｉ及びＴ４２
Ｊ（７）ＰＦ４６フィールドは、それぞれ、　　ａｂｌ
ｅ”　と“”ｄＦｉｌｅ　　とを有し、　　これらは何
れもキー　”Ｈａ　ｓ　ｈＴａ　ｂ　ｌ　ｅ　　及び’
ＨａｓｈｅｄＦｉｌｅ　　の最終部分である。これらの
節点からは分岐がないので、これらの節点の個々のＳフ
ィールド５８はＯをもつ。これらの節点のｐフィールド
５６はそれぞれ７．４及び５を１個づつ含み、これら節
点のＰＦ４６フィールドに記憶されたキーの残余部分に
ある文字の数を示す。［００６３］索引３４内の所定のキー値に対する探索を進めるために
、システム１０はルート節点において始められ、節点毎
に索引３４を介して進められこの探索が故障節点、すな
わち探索キーに対する一致をもたない節点に達するまで
進めるか、あるいはその探索キーに対応するデータ記録
を見出すことによって進める。［００６４］各個の節点において、このシステムは、長さすなわち文
字の数ｋをもつ探索キー（Ｋ〕ｎをその節点のＰＦ４６
内に記憶された長さｐをもつ接頭語文字列（Ｐ）と比較
し、この接頭語が少くともこの探索キーの頭文字と一致
するかどうかを決定する。すなわち、全てのｉ≦ｐに対
して、ｋ≦ｐ及びＫｉ＝Ｐｉの何れかを決定する。これ
に関して、もしも、接頭語Ｐ＝０であるか、または探索
キーに＝０の何れかであれば、すなわちもしも何れかが
０列であったならば探索キー及び接頭語の文字の内で一
致するものは存在しないことになる。［００６５］探索キー文字列の少くとも頭文字部分において一致が見
出せないならば、そのキー値はその節点内に含まれず、
その探索は失敗に終ったことになる。もし、探索キーに
と接頭語Ｐとの間に完全一致があれば、すなわち、Ｐ＝
にならば、対応するデータ記録はその節点のＤフィール
ド４８に記憶されたポインターにより指摘される。［００６６］長さｐをもつ接頭語文字列と、探索キー文字列の最初の
ｐ文字との間に一致がある場合、このシステムは、キー
Ｋ（Ｋｐ＋１）の第ｐ＋１番目の文字と一致するＢｊを
見出すために、ＢＦ３０のＢＣ５２フィールドのＢｊｓ
を探索する。もしこの探索が、Ｂｊ＝Ｋｐ＋１を見出さ
なかったならば、この時はキー値はその節点に含まれて
おらずその探索は失敗である。［００６７］その探索がＢｊ＝Ｋｐ＋１を見出したならば、対応する
次の節点に対して関連Ｓｊポインターを追及し、他の節
点に対する接頭語の一致が見られない分岐節点、すなわ
ちその探索が失敗したのか、あるいは一致した接頭語と
データ項目に対するポインターとをもつ１つの節点の何
れかに達するまでその探索を続ける。トリー（樹）の中
の各個の連続した節点の接頭語は、前の節点の接頭語の
中に組込まれている先頭の接頭語文字を除いた後の、こ
のキーの残余部分にとって共通な最長の接頭語文字列か
ら成っているということを思い起すべきである。同様に
、このトリーの次の節点を探索するために用いたキーは
、新らしいキー値、すなわち、Ｋｐ＋１　　　・Ｋｋを
もち、このキー値は、前の節点における接頭後及びＢｊ
文字に一致している先頭のキー文字を除いた後の残余の
探索キーの部分から成っている。［００６８］従って、索引３４のトリー構造はこれ自体を１種の階層
型の名前の解明に与えられ、この中で、このトリーを介
して降って来る連続節点の各個は、相対的識別名（ＲＤ
Ｎ）である接頭語により識別され、またこの中で、この
節点の識別名（ＤＮ）は、その先祖から伝わる節点の全
てのＲＤＮもしくは接頭語をもつそのＤＮのＲＤＮの連
続体である。この節点のＲＤＮとＤＮとは、もちろんＤ
ＩＢ３６の中の何れかの対応する登録簿エントリー（Ｄ
ＩＢＥ３８）のＲＤＮとＤＮとである。［００６９］従って、前に説明したように、１つの節点に含まれる個
々の接頭語は１つあるいはそれ以上のＡＶＡ、すなわち
、ＲＤＮから成るところの属性の種類／属性値の対から
成っている。これもまた説明したことだ力板所定の節点
のＤＮとＤＩ８３６における対応するＤＩＢＥ３６とは
、所定の節点のＲＤＮをもつ全ての先祖から伝わる節点
のＲＤＮを連鎖状につなげて構成される。［００７０１一般に、索引３４の何れの探索であってもルート節点か
ら開始され、そして各種分岐節点を通って下方に進み、
情報の項目あるいはもっと一般的に言って情報の項目に
対するポインターをもつ節点に到達するまで探索を進め
る。個々、の節点において、この節点の接頭語フィール
ド４６内に住むＲＤＮから成るＡＶＡは解明され、ある
いは、この探索がもう１つの別の節点そして他の節点へ
と続けられるのかどうか、あるいはこの探索は最終的に
主張されたＤＮを解明したのかどうか、これを決定する
ために使用者によって提供された、主張されたＤＮの対
応するＡＶＡと比較される。もし、主張されたＤＮが１
つの節点のＤＮにより成功裡に解明されているならば、
その節点のＤフィールド４８の内容は、そのＤＮをもつ
ＤＩＢＥ３８に指示されよう。［００７１］Ｃ０登録簿情報ベース（ＤＩＢ）３６　（第４図）第４
図を参照すると、登録簿情報ベースエントリー（ＤＩＢ
Ｅ）３８の概略図が示しである。すでに前に述べたよう
に、登録簿３２に住む個々のＩ）Ｎは索引３４及びＤＩ
Ｂ３６内の対応するＤＩＢＥ３８の中に対応するリーフ
節点をもっている。探索ずみ情報をもつＤＩＢＥ３８は
、以下に説明するように、このリーフ［００７２］ＤＩＢＥ３８の他の要素に対するポインターのセットを
含むＤＩＢヘッダー６０に加えて、このＤＩＢＥ３８は
基準ブロック６２と受容器ブロック６４とを有し、しか
もＲＤＮヘッダブロック６６、エントリヘッダブロック
６８、そして実際の登録簿エントリを構成するエントリ
データブロック７０とを有し−でいる。この発明に組込
まれたシステムの現在の実施態様においては、これらの
構成要素は登録簿データベースに記憶された単一ファイ
ルの中に含まれている。［００７３］個々のＤＩＢヘッダー６０は、関連のＤＮ用のＤＩＢＥ
６０に記憶された情報すなわちデータの種類を識別する
情報を記憶するためのフィールドを有する情報マスフィ
ールド７２をもっている。このような情報は、例えば、
このデータが登録簿エントリの基本コピーであるかどう
か、他のＤＳＡ２２がそのエントリのコピーをもってい
るかどうか、あるいはそのエントリが他のＤＳＡ２２に
よって保持されているエントリの、いわゆる陰影コピー
であるがどうかを含んでいる。［００７４］ＤＩＢヘッダ６０は、エントリに含まれる情報の種類に
より、多数の他のフィールドを有している。例えば、あ
るエントリは「航行」　（移動）　すなわち大域ＤＩＢ
内の局部エントリに種すために用いられる「知識基準」
である。ＤＩＢＥオフセットの対応するセットを有して
いる。ＤＩＢヘッダーはこのように基準ブロック６２を
指示する基準ヘッダーフィールド７４を含む。［００７５］もし他のＤＳＡ２２が登録簿エントリの陰影コピーを有
すれば、そのＤＩＢＥ３８は受容器の数の計数値とその
受容器を識別する記録に対するオフセットの対応するセ
ットとを含む受容器ブロック６４を有するであろう。Ｄ
ＩＢヘッダ６０は更に受容器ブロック６４を指示する受
容器ヘッダーフィールド７６を含む筈である。［００７６］ＤＩＢヘッダー６０は、ＲＤＮヘッダーブロック６６の
登録簿３２データベースにおける場所と大きさを含むＲ
ＤＮヘッダーオフセット／長かフィールド７８を有する
であろう。ＲＤＮヘッダーブロック６６は、順次、デー
タベース内のＡＶＡの対応するセットの場所と大きさを
、同様に識別する、ＡＶＡオフセット／長かフィールド
８０のセットを有する。これらのＡＶＡエントリは順に
、その登録簿エントリのＲＤＮを含む特殊な登録簿の値
を有している。ＲＤＮヘッダーブロック６６はまた、Ｒ
ＤＮを含むＡＶＡエントリの数を指示するＡＶＡ数８２
を有する。［００７７］ＤＩＢヘッダー６０はまたＤＩＢ３８ファイルの中のエ
ントリヘッダーブロック６８の場所を含むエントリヘッ
ダオフセット／長さフィールド８４を有する。エントリヘッダーブロック６８は順に、このシステムの
何の使用者もしくは要素がこのエントリアクセスをもつ
か識別するＡＣＬの場所を記憶するためのエントリアク
セス制御リスト（エントリＡＣＬ）と、そして、エント
リデータブロック７０の大きさとこのエントリの中に現
われる登録簿の異る種類の数を記憶する多数の登録簿の
種類フィールド９０を有している。最後に、エントリヘ
ッダーブロック６８は、エントリデータブロック７ｏに
記憶された個々の属性のための属性の種類オフセットフ
ィールド９２をもっている。更に次に説明されようが、
このエントリに現われる個々の属性の種類はエントリデ
ータブロック７ｏに記憶された１つ以上の値を有し；個
々の属性の種類オフセットフィールド９２は対応する属
性の種類の最初の値エントリのオフセットを、登録簿３
２のＤＩＢＥ３８ファイルの開始に相対して、保有して
いる。［００７８］エントリデータブロック７０を参照すると、エントリデ
ータブロック７０はこのエントリに現われる個々の属性
用の属性フィールド９４のセットを有する。属性フィー
ルド９４は属性種類ＡＣＬオフセットフィールド９６を
有しこのものは属性全体に適用する何れのＡＣＬの場所
でも識別する、そして属性の種類フィールド９４にはそ
の属性の種類用の識別名を含む属性の種類フィールド９
８が含まれる。属性のフィールド９４の動作開始は、エ
ントリヘッダブロック６８の属性の種類のオフセットフ
ィールド９２により指示される。［００７９］属性フィールド９４は更に最初の属性値フィールド１０
０を有し、このものは順次に、このエントリに現われる
属性の最初の値を含む属性値フィールド１０４と、その
属性の最初の値に適用する何れかのＡＣＬの場所を識別
する属性値ＡＣＬオフセットフィールド１０２とを有す
る。［００８０］属性フィールド９４またそのエントリ中に現われる属性
の各個の残余の値に対する属性値フィールド１０６を有
する。個々の属性値フィールド１０６は、属性値フィー
ルド１０４と属性ＡＣＬオフセットフィールド１０２と
を、最初の属性フィールド１００と同様な方法で有する
。［００８１］エントリに対する最初の属性フィールド９４の場所は、
その属性がもしそのエントリのＲＤＮの一部分であるな
らば、ＲＤＮヘッダブロック６６のＡＶＡオフセット／
長さフィールド８０により指示される。［００８２］最後に、そしてエントリに現われる個々の属性の属性フ
ィールド９４に関連して、アクセス制御フィールド１０
８の１セツトがあり、このものは属性の後のファイルに
現われる。アクセス制御フィールド１０８は、個々の保
護項目（エンドの属性にアクセスをもつ使用者もしくは
使用者のグループの識別名を識別する。［００８３］最後に、このエントリがもしもう１つ別のＤＳＡ２２に
住むエントリの陰影コピーであるならば、ＤＩＢヘッダ
６０は、この陰影コピーが作られた日付を示す日付／時
間捺印フィールド１１０を含むであろう。［００８４］これまでの説明で、この発明が実施される環境について
図解して来た。以下の説明ではエントリがそれらのＤＮ
ならびにＲＤＮをＡＶＡ対から解明することによりどの
ように位置設定されるか、特に、使用者にとって親しみ
のもてる名前の解明方法に関するこの発明の方法につい
て述べよう。［００８５］０１名前の解明方法（第５図と第６図）説明したように
、この発明の目的は、「使用者」、例えば登録簿に記憶
された名前に対するシステムの使用者とか適用業務プロ
グラムあるいはシステム水準プログラム、によって提供
される主張名に関する、すなわち解明する方法を提供す
るにある。特に、以下の説明では主張された名前が登録
簿に入れられるときどうしてもＤＮと完全一致をみない
場合、例えば、主張名がＤＮの一部しか含んでいない場
合、あるいは主張名の各部分がＤＮの対応部分の式と異
っている場合に、その名前を解明する方法について述べ
る。［００８６］この発明の詳細な説明は個人名の場合の図解である。す
でに説明したように、個人名は名前解明作業において通
常でない困難性を示しそれは個人名がもつことのできる
形態上の多様性によるものであり、例えば、国家的なそ
して言語学上の特性により、しかも使用者が主張名を構
成する場合の多様性によるのである。［００８７］使用者により示され、しかもその中にＲＤＮが登録簿３
２を記憶する筈の形式を考えることが先ず初めに必要で
ある。［００８８］主張名及びエントリ名の両方の場合に、名前の解明プロ
グラムに関する必要条件を減らすために少くとも最小限
度の標準化を施すことが望ましい。しかし、必要以上の
標準化をしないことも同様に望ましいのであって、主張
名の形式は個人名の形の可能な限り広い範囲にわたって
適用できる融通性をもったものであり、また使用者が慣
習的やり方、あるいは手慣れたやり方で主張名を表現す
る自由をもつものである。［００８９］このような理由で、登録簿システム１０は、主張名に対
してもエントリ名に対しても普通名形式（ｐｕｒｐｏｒ
ｔｅｄＣＮ〕ｎを使用し、次の拡大したＢａｃｋｕｓ−
Ｎａｕｒ形式で表わされる：ｐｕｒｐｏｒ　ｔｅｄＣＮ：　：＝　Ｃ個人名〕別名〔
９世代及び栄誉〕この〔個人名〕副成分はなるべく１個
の要語第１名もしくは代替第１名（「ニックネーム」は
その個人の実際名とは全く無関係なことがあるが、この
場合、特にニックネームが当てられる）、そして１つあ
るいはそれ以上の中間名、をこの順とし、この場合、こ
れら名前の構成成分の何れであっても、後続期間（′、
）があってもなくても頭文字により置き換えできる。ハ
イフンで結んだ名前、例えばＪｅａｎ−Ｐａｕｌなどは
次のような３種のやり方、すなわち、　”Ｊ”　　　’
“ＪＰ”あるいは”Ｊ−Ｐ”の何れかに短縮できる。別
名の副成分は１個あるいはそれ以上の語を含ませ、また
ハイフンで結んだ成分を含んでもよくこの場合全語を供
給しなければならない。「世代と栄誉」の副成分、すな
わちＪｒ、あるいは■工あるいは名誉と栄誉称号は並べ
順は何れでよく、その個人の現実の世代ならびに栄誉名
成分の何れのサブセットでもよい、ただし世代成分は一
般に成分の順位の最初に置かれる。この標準化は大力の
主張された普通名に対する正確な語の解剖を許すに充分
である。しかしほとんどの場合、この標準に対して、外
国の使用者をも含めて使用者が太いに注意を払わなけれ
ば馴れることができないほど厳しいものでもない。［００９０］ＤＮ用の形式について言えば、登録簿シス１ｏの意図す
るところは、前もって定義をした普通名を用いることに
よってＤＮの解明許すことであり、従って普通名は登録
簿１０においては属性の１種類である。［００９１］この発明に含まれるシステムの代替実施態様においては
、例えば、この中ではこのシステムは単一管理による完
全制御下にあった、そして「外国」システムとの連絡は
なかった、あるいは、この場合、高度に可能性のある非
両立性が許され高度な構造及び定義をもった名前形式を
用いることが可能である。［００９２］このシステムの代替実施態様は、従って正確に識別され
るべき個人名の副成分を許容する筈の普通名の属性の種
類の値に対する代替形式を定義する。説明したように、
登録簿システム１０は対象に基礎をおくシステムであり
、個人に関する対象物が個人の対象クラス及びサブクラ
スの対象物であると定義する。［００９３］従って登録簿システム１０の代替実施態様は、個人区分
対象物の属性を定義するために、人物名の対応する属性
の種類を用いる。［００９４］人物名は個人名に特有であり、次のようにＡＳＮ、１を
用いて登録簿システム１０に定義されている：人物名：：＝シーケンス（別名　　　　　　　　　　　名前成分第１名　　　　　〔Ｏ〕　　名前成分、任意代替第１名
　　　〔１〕　　名前成分のセット任意。中間芯　　　　　〔２〕　　名前成分のシーケンス。任意。勲位または栄誉　〔３〕　　名前成分のセット任意。世代　　　　　　〔４〕　　名前成分、任意）ココで、
個々の「名前成分」は各場合の無感応の文字列として表
わされる。［００９５］主張基と個人名ＲＤＮの普通名形式は、従ってＤＩＢ３
６に記憶されたようにこれらが名前解明作業にかけられ
る前に普通名に正規化される。［００９６］効率の理由から、ＤＩＢ３６に記憶された個々のＲＤＮ
の普通名属性は、個々の索引３４探索作業のために正規
化されず、しかし索引３４の節点が構成されＤＩＢ３６
のＲＤＮが、前にも説明したように索引３４の接頭語フ
ィールド４６にその正規化された形で記憶される。必要
ならば、個人名ＲＤＮの原の普通名属性の形は登録簿エ
ントリから回収される。索引３４中で探索するために使
用者により提出された主張芯は、探索作業に提出された
時点でもちろん正規化される。［００９７］正規化は、これは第５図に図解しであるが、正規には４
つの位相をもって発生し、その場合個々の位相は前回の
正規化作業の結果を踏襲し、個々の位相はＡＶＡからＡ
ＶＡの状態を基準として実施される。このような正規化
作業については同業技術者の間では公知であるので、次
の正規化作業についてこの説明は簡略化し、普通名形式
に対する第５図において段階毎に進むやり方を基本とし
て図解する。［００９８］最初の位相はＡＳＮ、１水準において起り、標準形に対
する属性のＡＳＮ３゜１符号化を減らすのであってこの
標準形は２つの符号化が同一であるかどうかを決定する
ためにＡＮＳ、１符号化の直接比較を許している。この
位相において：段階１１２−構成された文字列は原の文
字列にまで減らされる；段階１１４−不正確な長さの形
は一定の長さをもつ形に変換され、そしてもし出来るな
らば長尺形は短尺形に変換される；そして、段階１１６
−属性値は、プール値及びビット列のような標準形に減
じられ、セットの要素はそれらの札及び値の順序に従っ
て分類される。［００９９］第２の位相がシンタックス（文章構造法）水準で行われ
る、そして：段階１１８−その属性シンタックスにより
指向されたように個々の属性値を再形成し；そして段階１２０−属性値の属性シンタックスに対する整合性
を点検する。これらの作業はシンタックスの個々の種類
に依って決まる。［０１００１正規化の第３の位相は属性の種類の水準で起る、そして
：段階１２２−属性の値が属性値上の限界内に落ちるこ
とを試験し、属性の種類により指向されたように値を再
構成する。［０１０１］この発明の名前解明方法を用いるように、普通名属性値
が再構成されることが正規化の第３の位相である。この
名前解明方法に実際に用いられる属性値だけが再構成さ
れ、そしてこの作業は次の各段階を伴う：段階１２４−
下段盤文字を上段盤文字に置換する；段階１２６−前方
間隔もしくは後方間隔、及び余分な埋め込み間隔を除く
　（注：この段階は実際には段階１１８によって実行さ
れるが、もしも段階１１８において前以って実施されて
いなければ段階１２６として実施される）；段階１２８
−全ての期間（′、）文字を除く；そして段階１３〇−
属性値から最左翼のコンマを全て除く：次の段階はこの
システムが、この明細書の何処かに述べであるように、
牽引３４に加えるために主張された普通名を正規化する
ように正確な一致算法を実施可能である場合においての
み用いられる；そうでなければ、この作業は直接段階１
３６に進む；段階１３２−別名成分を識別する；主張された普通名の場合においては：段階１３４−もしあれば最終コンマの前の名前における
最終語を位置決めする；あるいは、段階１３５−属性値の最終語の位置決めをする；段階１
３８−前述したように個人クラスの対象物に必要な属性
である普通名の別名を識別するか、あるいは、新しいエ
ントリがその個人クラスの対象物に対応シナケレハ段階
１３４及び段階１３５を追及する；そして、段階１３９
−その別名成分をその属性値の初めに移動し；段階１４
０−文字分離記号（ｃｈａｒａｃｔｅｒ　　５ｅｐａｒ
ａｔｏｒ）として機能させるために別名フィールドの後
方に二元零バイトを挿置し；段階１４２−この別名がも
し登録簿３２の新規データエントリ内に見出されるなら
ば、しかもこの別名が１語以上をもっているならばその
別名の再形成化した形になるようにその別名の語の順序
を反転する。［０１０２］最後に、正規化の第４番目の位相は索引３４に記憶され
たこれらＡＶＡに対してのみ提唱される。この最終的作
業は：段階１４４−属性値の符号化から最初の、そして
多分唯一の長さフィールドを除き；段階１４６−第２番目の零値に見出された各零バイトを
当て、そして；段階１４８−ＡＶＡ及びＲＤＮ終端接続
バイトコードを加える。［０１０３］この正規化作業の一第４位相における属性値の符号化か
ら最初の長さフィールドを除くことは、属性値の内容に
対する長さフィールドから索引３４の接頭語探索トリー
（樹）内の分岐点を移動することになり、この移動によ
って、その索引の圧縮をなし、この分岐を、名前探索の
見地からみて、あまり重要でない内容、すなわち長さフ
ィールドの内容におけるよりも、むしろ属性値上に発生
せしめる。［０１０４］この点において、別名は索引３４の探索において何時で
も用いられるようになっており、あるいは、登録簿３２
に付加されるべき個人名の場合は、個人名の正規化され
た形はすでに索引３４の節点の接頭語フィールドの中に
入れられるようになっている。［０１０５］以下の説明はここでこの発明の方法について述べるもの
である力板この発明により登録簿システム１０は使用者
によって提供された主張普通名に対して、この主張名に
対応する登録簿３２エントリを見出すために索引３４内
に正規化された形で記憶されているＲＤＮを用いて、そ
の主張普通名が、個別プログラムが、アプリケーション
プログラムかあるいはシステムレベルプログラムかを解
明する。［０１０６］登録簿システム１０は、例えば、もっと直接的な方法が
失敗し、またこの発明の方法を使用者が明らかに要請す
るならば、ＡＶＡからＡＶＡの一致算法がこの発明の方
法を実施するといった具合に、名前解明のために多数の
異った方法を用いることができるのである。前にも述べ
たように、この発明に係る名前の解明方法は、その意図
するところは、索引３４により探索されるべき主張普通
基が索引に記憶されている正規化されたＲＤＮと異る場
合に使用することである。例えばその主張普通基が不完
全であるとかあるいは索引３４に記憶された正規化個人
名の属性とは異った属性が用いられていると言った場合
に用いられる。［０１０７］主張普通基に最も密接に一致している索引３４エントリ
を見出すためのこの発明に係る方法は第６Ａ、第６Ｂ、
第６０及び第６Ｄの各図に図解してあり、以下のように
段階毎のやり方に基づいて説明しである：段階１５〇−
上述し、また第５図に図解しであるように主張普通基を
正規化する。段階１５２−分離用語と考えられている間隔及び／また
はコンマにより区分けされた個々の文字列を用いて、主
張普通基（ｐｕｒｐｏｒ　ｔ　ｅｄＣＮ）に現われてい
る語の数Ｎを計数する。段階１５４−この主張普通基と索引３４エントリとの間
の正確な一致（ＥＭ〕ｎを現わすスコアを次式の結果と
して決定する、ＥＭ＝Ｎ５十Ｎ４＋２゜主張普通基と索引３４エントリとの比較についての以下
の説明から明らかなように、ＥＭに関する上述の説明は
、主張普通基と索引３４エントリとの間に正確な一致が
ある場合の比較作業の結果を現わしている。段階１５６−１セツトをなす５個の計数フィールド値、
Ｃ１，Ｃ２，Ｃ３，Ｃ及びＣを頭文字化して零とする。後に説明するように、これらの計数フィールド値は、主
張普通基の全部分を、索引３４からの個々のそのような
正規化された名前とその主張基との比較中に、索引３４
から読み取った正規化芯の対応する部分と比較をした結
果を現わす値を記憶するために用いられる。最終的な計
数フィールド値は、個々の名前比較に対して、主張名と
索引３４の名前との一致の度合を表わすスコアを生ずる
ために使われる。［０１０８］比較スコア（ｃＳ）は、主張名の各部分と索引３４の対
応する部分との比較結果に対する重みづけ合計値として
得られ、これは次のように現わされる：Ｃ３＝ＣＮ　　
＋ＣＮ３＋ＣＮ２＋ＣＮ＋Ｃ。ここでＮは、上述したように、主張名の語数である。こ
の比較スコアはまた、正確な一致スコアとして、主張普
通名における語数Ｎに依存する。［０１０９］更に明言すれば、この名前解明作業についての以下の説
明にあるように、正確か大体か何れにせよ、主張名とエ
ントリ名との語の一致があった場合は何時でもＣ１は１
が加えられ、一方主張名とエントリ名との語の正確な一
致があった場合は常にＣ２に１が加えられる。エントリ
名における代替第１名の語が、主張名の副成分である個
人名の対応語と一致する場合は常に０３に１が加算され
る。エントリ名の副成分である個人名の語数が主張名の
副成分である個人名の対応語の頭文字形態になっておれ
ば、常にＣ４には１を加算する、以下同様である。そし
てエントリ名と主張名の世代ならびに栄誉に関する副成
分が同−言語数をもっていれば、あるいは、そのエント
リ名と主張名との個人名の副成分が同一語数をもってい
ればＣ５には１が加算される。［０１１０１計数フィールド値の各種の組合せは、Ｃ８に関する関係
式におけるＮのもつ各種の力による組合せと共に、これ
らの名前のある部分もしくはこれら名前の間の各種の一
致の度合または一致の種類が、２つの名前の間の一致の
度合を決定する上で多かれ少なかれ意味をもつように、
この比較スコアに対して、これらの名前のもつ各種要素
に対して重みづけをする。この実施例の場合、普通名の
全語は同じ重みづけをされ、しかし副成分もしくは語間
の正確な一致に対してはこの副成分または語の大体の一
致よりも大きい重みが与えられている。［０１１１］段階１５８−主張普通名からコンマの前の最終語、もし
コンマのない場合はその名前の最終語を選択してその主
張普通名の別名フィールドにおいて、初期推測をＬＧの
文字をこれに与える。［０１１２］段階１６０−別名フィールドの最終語として語Ｇをもち
、またもしあれば正しいもっと高次元のＡＶＡをもつ登
録簿３２において、全ての記憶された対象物のセットＳ
を形作る。［０１１３］これに関して、前に述べたように、索引３４から成るト
リー（樹）は、トリーのエントリーの名前から成るＡＶ
Ａの降下順序に従って降下するルート節点から構成され
る。索引３４の１つのエントリの所定のＤＮのＡＶＡは
、このエントリを含む節点の接頭語フィールドのエント
リとＡＶＡとを含んでいる節点よりも先祖的にさかのぼ
っている節点の接頭語フィールドに記憶されている連鎖
状のＡＶＡによって見出すことができる。このように識
別される高次元のＡＶＡは、次に主張普通名と同じ高次
元のＡＶＡをもつ節点のセットＳを識別するために、こ
の主張普通名の対応する高次元のＡＶＡと比較される。接頭語フィールドは、ＡＶＡ全体というよりはむしろ１
つのＡＶＡの１断片を含んだ方がよいということを注意
すべきである。また、名前解明作業は、ＲＤＮからＲＤ
Ｎのやり方に基づいて接頭語探索トリーに沿って下方に
進行する。従って、１つの普通基ＡＶＡが解明されるま
では、高次元ＡＶＡは、すでに具合よく一致している。［０１１４］段階１６２−これら別名フィールドの最終語として語Ｇ
を有する牽引３４エントリのセットＳの各要素ｅに対し
て、以下の各段階を実行する：段階１６４−ｅの別名を
調べる、そして、段階１６６−ｅの別名がもし単一語で
あれば、計数フィールド値Ｃ１どＣ２とに１を加算する
。段階１６８−ｅの別名がもし要語別名であって、Ｃｏｎ
ａｎ　　Ｄｏｙｌｅのようにｎ語長ければ、その主張普
通名において、Ｇよりも前方にＧの接頭語として（ｎ−
１）個の語を加えてその主張別名においてもう１つの推
測値Ｇ′　を形成する。段階１７０−Ｇ’　がもしこのｅの別名に等しくなけれ
ばｅをＳから除き、セットＳから、もう１つの要素ｅを
選択し、段階１６２に戻るか、そうでなければ、段階１
７２−計数フィールド値Ｃ及びＣ２にｎを加算する。段階１７４−正規化された主張普通名において、もしコ
ンマがあればこのコンマに続く語から、主張された世代
及び栄誉フィールドＧＡを形成する。段階１７６−ＧＡ内の個々の語に対して、要素ｅの世代
及び栄誉フィールドにおける何れかの位置にある同一語
を探す。段階１７８−もし一致がみつかれば、計数フィールド値
Ｃ１及びＣ２に１を加える。段階１８０−更に、ＧＡ及びｅの世代及び栄誉フィール
ドが正確に同一語を有するならば、語の順序には無関係
に計数フィールド値Ｃ５に１を加える。段階１８２−別名に先行する全ての語、すなわち、主張
普通名のＧもしくはＧの何れかから主張個人名、Ｐ、を
構成する。段階１８４−左から右方への順序でＰから選択した個々
の連続語Ｗに対して次の各段階を実行する：段階１８６−索引３４エントリの個人名成分から、Ｗが
Ｐにおいて行ったように、索引３４工ントリ個人名成分
の中に同じ位置を占める語Ｗ　を選択する。段階１８８−そのようなＷ′が存在しなければ段階２１
２に進む。段階１９０−もしもｗ＝ｗ　　であれば、計数フィール
ド値Ｃ１及びＣ２に１を加算する。段階１９２−もしもＷがＷ　と等しくなかったならば、
次の各段階に従って、ＷがＷ　の頭文字形態であるかど
うかを決定する：段階１９４−次式により語Ｗ′　を表
わすことによって語Ｗ　の頭文字を抽出する、１ｒ（−１ｒ）　　、ここでｉは、ハイフン結合の文字
を含んでいないＷ′の副文字列の頭文字であり、ｒはこ
の副文字列の多分零の残り値であり、そして、ｍは零よ
り大きい（≧０）整数である。［０１１５］名フィールドＷ′から成るそれぞれの副文字列の頭文字
を生ずる。事例により図解するため、個人名フィールド
Ｗ　は副文字列″’Ｊｏｈｎ”及び“’Ｐａｕｌ”°で
構成されていると仮定する。最初の副文字列ｉは′Ｊ“
°であり、そしてｒは′Ｏｈｎ”であり、２番目の副文
字列ｉはＩＩ　Ｐ　ＩＴであり、ｒは”ａｕｌ”であり
、従って、頭文字はＪとＰである。もし個人名フィール
ドＷ　がフッフン連結形、すなわち“Ｊｏｈｎ−Ｐａｕ
ｌ”であれば、この作業ではやはりＪとＰを生ずる。段階１９６−段階１９４で抽出されたように、Ｗ　の頭
文字をＷと比較する。Ｗが次の形、ｉ　（ｉ　ｌ−ｉ〕　　　ここで８≦ｍ、をもっておれ
ば、すなわち、少くともＷと同じ頭文字のいくつかをも
っていれば、Ｗ　と同じ語順序であってハイフンはあっ
てもなくともよいならば、計数フィールド値Ｃ及びＣ４
に１を加算する。段階１９８−もしもＷが、段階１９４ないし１９６によ
って得られた決定のように、Ｗ　の初期文字形でなけれ
ば段階１９２に戻り、そして、段階１９４から段階１９
６に到る作業においてＷ　とＷとの役割を互いに反転し
て、Ｗの初期形態であるかどうかを決定する。Ｗ　がも
しＷの初期形態であれば、計数フィールド値Ｃ１とＣ４
に１を加算する。段階２００−ｗ’　がＷの初期形態でなければＷはＷ′
の初期形態ではなく、要素ｅをセラ）Ｓから減じ、セッ
トＳから別の要素ｅを選択し、段階１６２に戻るそうで
なければ、段階２０２−ｗは主張個人名Ｐにおける最終語であり、
Ｗ　は索引３４に記憶された個人名の最終語であり、計
数フィールド値Ｃ５に１を加算する。［０１１６］段階２０４−次式を用いて要素ｅの「比較スコア」を決
定する：段階２０６−段階２０４で決定されたスコアＯ
８を段階１５４で決定された正確な一致（ＥＭ）に対す
るスコアと比較する。段階２０８−もしも、ＣＳ＝　（段階２０６におけるＥ
Ｍ）であれば、この名前解明作業は終了であり、その主
張普通名に対応するＤＩＢＥ３８を識別するため了する
。段階２１０−もしもＣ８がＥＭに等しくなくその名前解
明要求カミ　「近似な一致」は受入れられないというこ
とを明らかに定めていなければ、あるいは、もしも登録
簿エントリが適当な対象物クラス、例えば個人名の解明
の場合における個人対象物クラスの登録簿でなければ、
そこで要素ｅをセットＳから除き、セットＳからもう１
つ別の要素ｅを選択しそして段階１６２に戻る。そうで
なければ、段階２１２−もしも要素ｅが、「代替第１名
」の属性に対する１つあるいはそれ以上の値をもってお
れば段階１８４から段階２１０を繰り返し、この場合連
続して個人の代替第１名に対して繰り返す。代替第１名
に対するこのような段階１８４から段階２１０へのそれ
ぞれの繰り返し作業において、索引３４に記憶された普
通名における個人名成分の最初の語に対して個々の代替
第１名を置換するがしかし流通名“′Ｗ゛′が代替第１
名から引き出されているときは常に、段階１９段階２１
４−原の個人名成分及び全ての代替第１名の双方に対す
る段階１８２から２１０を介して通る全てにわたって得
られた最大スコアは貯えておいて、そしてこの最大スコ
アをもつ全てのエントリ名の計数及び識別名を記憶し、
あるいは、もし段階２１８の代替実施の１つが選択され
るならば、その最大スコアの所定の範囲の中にあるスコ
アをもつエントリ名の計数及び識別名を記憶する。段階２１６−セットＳのもう１つ別の要素ｅを選択して
段階１６２に戻る。段階２１８−この業務のこの段階は、もしセラ）Ｓの全
要素が調査されその結果索引３４に記憶された普通名内
の主張普通名に対する正確な一致が見出されなかった場
合は、ここに到達することになる。正確な一致が見出さ
れなければ、段階２０４で決定されたように最高スコア
をもつ要素をＳから選択する。もしたった１つの要素が
このスコアをもっていればその要素を、その主張普通名
に対する最良の合致としてその要素の識別名を戻す。１
個以上の要素がこのスコアをもっていれば、不確かな結
果の通知を戻すかこのスコアをもつ全要素の識別名を戻
す０この段階は、もしこの業務がすでに段階２０８で終
了しておらなければ、この［０１１７］Ｅ０名前解明手順の実施例。名前解明手順の図解により登録簿が以下の普通名をもつ
エントリをもつこと想定する：Ａｒｔｈｕｒ　　Ｃｏｎａｎ　　Ｄｏｙｌｅ、ここで’
Ｃｏｎａｎ　　Ｄｏｙｌｅは別名である：Ａｒｔｈｕｒ　　Ｄｏｙｌｅ：Ａｒｔｈｕｒ　　Ｃ，Ｄｏｙｌｅ、代替第１名”Ａｒｔ
”をもつ；Ｅｄｗａｒｄ　　Ｄｏｙｌｅ。これらは正規化された形で登録簿索引に記憶される。例
えば、　“’ＡｒｔｈｕｒＣｏｎａｎ　　Ｄｏｙｌｅ”
は正規化されて次のようになる：Ｄｏｙｌｅ　　Ｃｏｎ
ａｎ　Ｃ別名の分離文字、］Ａｎｔｈｕｒ　［ＡＶＡ分
離文字〕［’ＲＤＮ分離文字。主張普通名＝　”Ａ、Ｄｏｙｌ　ｅ”を与える、この主
張普通名はその、°°を除くことによって正規化される
。１つの正しい一致スコアが計算され、ここでは、Ｎ＝２
、ＥＭ＝５０を与え、計数フィールドは０（零）の頭文
字となる。主張別名の初期推測Ｇは、＝　”Ｄｏ　ｙ　ｌ　ｅ”の
ように形成される。次にこの手順では、　Ｄｏｙｌｅ”　という別名端末を
もつ全ての索引エントリのセットＳを構成し、その結果
、Ｓは上に表記したエントリの全形を含むことになる。（ｉ）　　ｅ＝　”Ａｒ　ｔｈｕｒ　　Ｃｏｎａｎ　　
Ｄｏｙｌｅこのエントリ名は多数語別名をもっているの
で、第２の推測Ｇ′が主張別名から形成される、ここで
、Ｇ’　＝　”Ａ、Ｄｏ　ｙ　ｌ　ｅ”である。Ｇ′　
は゛’Ｃｏｎａｎこのエントリ名は、　”Ｄ　ｏ　ｙ　
ｌ　ｅ”　という単一語別名をもち、この’Ｄｏｙｌｆ
ｌはＧと一致する、そこでＣは１に増加され、Ｃ２は１
に増加される。主張名もエントリ名も何れも世代及び栄誉成分をもって
いない。主張個人名Ｐは“′Ａ″である、何故なら、これは主張
別名Ｇに先行する全てであるからである。Ｐの中の唯一の語ＷがＡ”である、そしてエントリ名の
中の対応語Ｗ　が″“Ａｒｔｈｕｒ”であり；　　”Ａ
”　と”Ａｒ　ｔ　ｈ　ｕ　ｒ”　とは一致しない。１１ＡＩＩ　＝　ｉであるが、　”Ａｒ　ｔ　ｈ　ｕ　
ｒ”　（７）頭文字であり、Ｗはｗ（７）初期形でｗ　
（”Ａ”　）は主張個人名Ｐ（７）最終語であり、ｗ　
　（”Ａｒｔｈｕｒ”）はエントリ個人名の最終語であ
るから、Ｃ５は１に増加される。この要素に対する比較スコアは従って次のように計算さ
れる：＝４３（ｉｉｉ）　　　ｅ＝”Ａｒｔｈｕｒ　　Ｃ，Ｄｏｙｌ
ｅ”このエントリはやはりＧに等しい単一語別名をもつ
ので、Ｃは１に、Ｃ２はやはり１に増加される。主張、エントリ世代ならびに栄誉の両フィールドは共に
空である。主張個人名Ｐは“Ａｏｏである。Ｐの第１語Ｗは“Ａｏ
ｏであって、対応するエントリ語Ｗ　は’Ａｒｔｈｕｒ
”である。前に述べたように、ＷはＷ　とは等しくない
が、ＷはＷ　の初期形であり、そのため、Ｃ１は２に、
Ｃ４は１に増加される。ｗｌ；！、Ｐにおいて最終語だが、Ｗ　はエントリ個人
名において“′Ｃ″に続いており、Ｃ５は前のように増
加されない。従って、＝４２このエントリは、代替第１名の’Ａ　ｒ　ｔ　”をもつ
ので、この手順は、主張基゛Ａ°“の個人名成分を、置
き換えられた代替第１名、　“’ＡｒｔＣ”をもつエン
トリ個人名に一致させるように試みる段階を繰り返す。１１　Ａ　１１は’Ａｒｔ”の初期形であるのでＣは２
に、Ｃ４は１に増加される。この比較スコアは再度計算され、Ｃ３＝４２を再び見出
す。このエントリに対する両方のスコアは前のエントリにお
いて生じたスコア４３よりも小さい、このスコアは貯え
られない。（ｉｖ）　　　ｅ＝　”Ｅｄｗａ　ｒ　ｄ　　Ｄｏｙ　
ｌ　ｅ”は１に０２は１に増加される。主張個人名Ｐは“′Ａ′であり、エントリ個人名は“Ｅ
ｄｗａｒｄ”である。　“′Ａ”は’Ｅ　ｄｗ　ａ　ｒ
　ｄ”　と一致せず、また’Ｅ　ｄｗａ　ｒ　ｄ”　（
７）初期形でもない。従って、Ｃ８は次のように計算される、Ｃ３＝１×２　
＋１×２３＋０×２２＋０×２１＋Ｏ＝２４このスコアは現在の最大値４３よりもやはり小さく、そ
のためこのエントリは主張基に最もよく一致するもので
はない。このようにして、第２のエントリ、　”Ａｒｔｈｕｒ　
　Ｄｏｙｌｅ　　は主張基゛Ａ、Ｄｏｙｌｅ”に対する
最適な一致と考えられる。このエントリだけか、もしく
は最大値スコアのある規定された範囲内にある全てのエ
ントリの何れかがこの名前解明手順により戻される。［０１１８］Ｆ１名名前解明手順代替実施態様これまで述べて来た名前解明方法の現在の好適実施態様
は、登録簿１０のもつ特殊な実施態様において所望され
る特別な性質に依り、多数の代替実施態様、すなわち変
化を与えた態様に応用される。［０１１９］フィールド値Ｃに関する前もって説明した内容から明ら
かなことは、一致限界の相対的重みづけは、実質的に比
較スコア関係式に対する改変により動かされるというこ
とである。図解のために、比較スコアが段階１６８にお
いて計算される場もつより少数の識別に対する以上に普
通名成分のあまり正確でない多数の識別にになる。［０１２０１別な実施例において、最高の一致スコアをもつ名前のみ
を戻すよりもむしろ、この手順は、その上方の境界が最
高の一致スコアによって決められるそのような範囲の中
に落ちる一致スコアをもつ全ての名前を戻す。この事は
可能性のある一致のセットを要求者に提するであろうし
、そのため、この要求者は、所望した名前よりも最も密
接な一致を見るある種の名前を偶然に主張名として提供
するであろう、所望した名前は一致の可能性のある名前
のセット返戻されるであろうということ、そしてその要
求者によって識別されるであろうという合理的な確率が
存在している。［０１２１］名前解明方法の能力は、また、主張普通名、個人名及び
正規化された形式における名前の属性成分の定義を更に
拡大すれば変えられよう。例えば、現在は、主張名の世
代ならびに栄誉に関する属性は、索引３４に記憶された
名前の同等文字列と正しく一致しなければならない、す
なわち、Ｊｒ、はＪｕｎｉｏｒとは一致しない。主張名
の世代ならびに栄誉の属性と記憶された名前との間の一
致の確率は、例えばこれら記憶された名前の文字列の異
名もしくは代替基を用意するなどして増大できよう。［０１２２］更にもう１つの実施例では、別名に対する一致は、主張
普通名の別名が、索引３４　ニ記憶ｅ　している名前の
別名と正確に一致を見なければ認められない。この事は
１つの問題でありうるが、例えば、スペイン語を話す国
家図では個人が代替れを許し調査するということにより
提起されよう。［０１２３］同様に、名前に対する属性形式及び名前解明方法の現在
の実施は、主張名もしくは記憶された普通名の何れにお
いても、第１名と中間名の正確な分離がなされていない
。この事は、代替第１名をも含めて名前の解明作業中に
異常を強いることになる。すなわち、この解明作業の現
在の実施においては、代替第１名が常に、索引３４から
の記憶された普通名の最初の語と代替され、個人の第１
名が実際に１語以上、例えば、Ｍａｒｙ　　Ａｎｎとい
うように含まれていても代替される。例えば、登録簿３
２が、エントリ、〔普通名＝″’Ｍａｒｙ　　Ａｎｎ”
　と代替名＝“Ｂｕｆｆｙ”、］を含むと仮定し、ここ
ではＭａｒｙ　　Ａｎｎは多数語の第１名であり、エン
トリは〔普通名＝　”Ｍａ　ｒ　ｙ　　Ｓｍ　ｉ　ｔ　
ｈ”　と代替”Ｂｕｆｆｙ〕と仮定する。主張名の’Ｂ
ｕｆｆｙ　　Ａｎｎ　　Ｓｍ１ｔｈ”は、　”Ｍ　ａ　
ｒ　ｙＳｍｉｔｈ”　よりももっとよく　”Ｍａｒｙ　
　Ａｎｎ　　Ｓｍ１ｔｈ”に一致すると思われよう、こ
れらは共に論理的に等しい、良い一致をしている。さて
、この例は、主張普通名、人物名及び正規化された形成
者における名前の属性成分の一層明らかな特質を提供す
ることによってこの名前解明手順に提供される。しかし
この事は普通名形式に対する更に標準化や定義づけ、及
び普通名を表わす方法における登録簿システム１０の間
の融通性を更に対応して減らすことを強い要求するであ
ろう。前に説明したように、登録簿システム１０の現在
の実施は登録簿システム１０間の普通名の形式における
最大の融通性の提供を望んでいる。［０１２４］最後に、対応する索引３４エントリの対象物クラスが決
定される前に、主張名が完全に解明されることが、現在
の実施上必要である。そんなわけで、命名属性として普
通名を含む全ての登録簿３２エントリは、上述した普通
名解明作業に使用するために、その属性の値を個人名、
別名及び世代及び栄誉の各形式に記憶しなければならな
い。しかし、これらの特異性は、個人対象物クラスの登
録簿エントリに対してのみ有意義である。個人対象物ク
ラスのではなく、登録簿エントリ用の主張名を解明する
ための必要条件は、例えば、対応する索引３４エントリ
のＤフィールド４８内においてそのエントリが属する対
象物クラスの指示を含むことによって、登録簿３２の代
替実施態様において、除外され、もしくは削減される可
能性がある。従って、可能性のある一致名を含む索引３
４エントリに達すると、登録簿３２は、節点のＤフィー
ルド４８から対象物クラス指示器を読み取ることができ
、このエントリが個人対象物クラスのエントリでなけれ
ば、この名前解明作業は実施しない。［０１２５］従って、この発明は、この発明に係る好適実施態様とそ
の方法について特に図示し説明して来たが、通常の技術
をもつ同業技術者にとっては、形態、詳細ならびに実施
に関して各種の変更がなされ特許請求の範囲に定義され
たこの発明の思想と範囲にもとるものではないことは容
易に理解される筈である。

【図面の簡単な説明】

【図１】実施例としての登録簿システムのブロック概略図である
。

【図２】索引の単一節点の構成ならびに形式を示す概略図である
。

【図３１索引の概略図である。【図４】登録簿情報ペースエントリの概略図である。

【図５】名前の正規化を示す流れ概略図である。

【図６】この発明に係る名前解明方法の作業の流れを示す概略図
である。

【符号の説明】

１０　登録簿システム１２　使用者１４　登録簿使用者代理器（ＤＵＡ）１６　プログラム間インターフェース（ＰＩ）１８　ア
プリケーション（業務実施）プログラム（ＡＰ）２０　
使用者インターフェース（ＵＩ）２２　登録簿業務代理
器（ＤＳＡ）２６　登録簿業務管理器（ＤＯＭ）２８　登録簿管理器（ＤＭ）３０　名前解明器（ＮＲ）３４　索引３６　登録簿情報ベース（ＤＩＢ）４０　登録簿業務実施プロトコール（ＤＳＰ）４２　単
一節点（Ｔ）４６　接頭語フィールド（ＰＦ）５０　分岐フィールド（ＢＦ）５２　分岐文字フィールド（ＢＣ）５４　分岐ポインタフィールド（ＢＰ）Ｏ３Ｉ　　開放
型システム間相互接続ＤＮ　　　識別名ＡＶＡ　　属性種／属性値ＲＩ）Ｎ　　相対的識別名

【書類芯】図面

【図１】図面の浄書

【図２】

【図３】

【図４】

【図５】

【図６Ａ］【図６Ｂ］、ｂ之Ｐ鋒１６６女〆１ηう゛ら【図６Ｃ］【図６Ｄ］段階２０２　り゛ら【書類名】

【提出日】【あて先】【事件の表示】【出願番号】

【発明の名称】

【補正をする者】【事件との関係】【識別番号】【氏名又は名称】【代理人】【識別番号】【弁理士】【氏名又は名称ｌ【発送番号】

【手続補正　１】

【補正対象項目名】【補正対象項目名】【補正方法】【補正の内容】

手続補正書平成３年９月５日

Claims

【特許請求の範囲】

【請求項１】データベースとデータベースにおけるエン
トリーの索引とを有する情報処理システムにおいて、同
索引に記憶されているデータベースエントリ名によりデ
ータベースエントリを識別するように主張された普通名
を解明する方法であって、この方法において、各主張名
と各エントリ名とが別名フィールド、世代と栄誉フィー
ルド、そして個人名フィールドとから成り、しかもこの
方法において少くともこの別名フィールドが少くとも１
語を有しており：（ａ）主張名とエントリ名との間の正確な一致を表わす
一致スコアを決定し、（ｂ）個々の計数値が主張名のフィールドとエントリ名
の対応するフィールドとの間の同一性を表わしている計
数値のセットの初期設定をなし、（ｃ）主張名から別名フィールドを選択し、（ｄ）主張された別名フィールドと同じ別名フィールド
をもつ全てのエントリ名のセットを構成し、そして、（ｅ）このセットのエントリ名の各個に対して、（ｆ）エントリ名の別名フィールドを主張名の別名フィ
ールドと比較し、（ｇ）主張名とエントリ名の別名フィールドがもし一致
しなければ、段階（ｅ）に戻りそしてこのセットからも
う１つのエントリ名を選択し、（ｈ）主張名とエントリ名の別名フィールドが一致すれ
ば、対応する計数値を増加し、（ｉ）世代と栄誉フィールドを主張名から選択し、（ｊ）主張及びエントリ名の世代と栄誉フィールドを比
較し、そしてもし世代と栄誉フィールドに一致が見出さ
れれば対応する計数値を増し、（ｋ）個人名フィールドを主張名から選択しそして、主
張名の個人名フィールドにおける各語に対して、（ｌ）そのエントリ名のその個人名フィールドにおける
同じ位置にある語と主張名の選択語を比較し、（ｍ）エントリ名の個人名フィールド内に比較語が存在
しなければ、段階（ｒ）に進み、（ｎ）語が一致すれば
、対応する計数値を増して、段階（ｒ）に進み、（ｏ）語が不一致であれば、主張名とエントリ名の個人
名フィールドにおける個々の語の頭文字を比較し、そし
て、（ｐ）もし１つの名前の個人名フィールドの語が他の名
前の語の短縮形であるならば対応する計数値を増して段
階（ｒ）に進み、（ｑ）もし個人名フィールドの語が他の名前の短縮形で
ある名前でなければ、そのセットからもう１つのエント
リ名を選定して段階（ｅ）に戻り、（ｒ）主張名とエントリ名の間の同一度に対する比較ス
コアを計数値の重みづけ合計値として決定し、そして、（ｓ）このセットのエントリ名を主張名に対して最も対
応するに相応しい名前として識別する、これらの各段階
から成ることを特徴とする方法。
【請求項２】データベースとデータベースにおけるエン
トリーの索引とを有する情報システムにおいて、同索引
に記憶されているデータベースエントリ名によりデータ
ベースエントリを識別するように主張された普通名を解
明する方法であって、この方法において、各主張名と各
エントリ名とが第１フィールド、第２フィールド、そし
て第３フィールドとから成り、しかもこの方法において
少くともこの第１フィールドが少くとも１語を有してお
り：（ａ）主張名とエントリ名との間の正確な一致を表わす
一致スコアを決定し、（ｂ）個々の計数値が主張名のフィールドとエントリ名
の対応するフィールドとの間の同一性を表わしている計
数値のセットの初期設定をなし、（ｃ）主張名から第１フィールドを選択し、（ｄ）主張された第１フィールドと同じ第１フィールド
をもつ全てのエントリ名のセットを構成し、（ｅ）このセットのエントリ名の各個に対して、（ｆ）エントリ名の第１フィールドを主張名の第１フィ
ールドと比較し、（ｇ）主張名とエントリ名の第１フィールドがもし一致
しなければ、段階（ｅ）に戻りそしてこのセットからも
う１つのエントリ名を選択し、（ｈ）主張名とエントリ名の第１フィールドがもし一致
すれば、対応する計数値を増加し、（ｉ）第２フィールドをを主張名から選択し、（ｊ）主張名とエントリ名の第２フィールドを比較し、
そしてもし第２フィールドにおいて一致が見出されれば
対応する計数値を増し、（ｋ）主張名から第３フィールドを選択し、主張名の第
３フィールドの各語に対して、（ｌ）そのエントリ名の第３フィールドにおける同じ位
置にある語と主張名の選択語を比較し、（ｍ）エントリ名の第３フィールドに比較語がもしなけ
れば、段階（ｒ）に進み、（ｎ）語が一致すれば対応する計数値を増して段階（ｒ
）に進み、（ｏ）語が一致しなければ主張名とエントリ名の第３フ
ィールド内の個々の語の頭文字を比較し、そして、（ｐ）もし１つの名前の第３フィールドの語が他の名前
の第３フィールドの語の短縮形であれば、対応する計数
値を増して段階（ｒ）に進み、（ｑ）もしその名前の第３フィールドの語が他の名前の
短縮形でなければ他のそのセットから選択して段階（ｅ
）に戻り、（ｒ）主張名とエントリ名との間の同一度に対する比較
スコアを計数値の重みづけ合計値として決定し、そして
、（ｓ）このセットのエントリ名を主張名に対して最も対
応するに相応しい名前として識別する、これらの各段階
から成ることを特徴とする方法。
【請求項３】データベースエントリは個人に関する情報
を含み、主張名及びエントリ名は個人に関し、主張名及
びエントリ名の第１フィールドはその個人の別名に関す
る情報を含む別名フィールドであり、主張名及びエント
リ名の第２フィールドはその個人に関する世代及び栄誉
の情報を含む世代及び栄誉フィールドであり、そして、
主張名及びエントリ名の第３フィールドはその個人の個
人名に関する情報を含む個人名フィールドであることを
特徴とする請求項２の名前解明方法。
【請求項４】別名が多数の語から成ることを特徴とする
請求項３の名前解明方法。
【請求項５】多数語による個人名が２もしくは３つの語
をハイフンで結合して成ることを特徴とする請求項４の
名前解明方法。
【請求項６】個人名フィールドがその個人の第１名及び
中間名に関する情報を含むことを特徴とする請求項３の
名前解明方法。
【請求項７】個人名フィールドが代替の第１名を含むこ
とがあることを特徴とする請求項６の名前解明方法。
【請求項８】個人名フィールドがその個人の第１名及び
中間名の頭文字を含むことがあることを特徴とする請求
項６の名前解明方法。
【請求項９】第１名が多数語から成ることを特徴とする
請求項６の名前解明方法。
【請求項１０】段階（ｃ）で選択された第１フィールド
は主張名第１フィールドにおける頭初推測であり、そし
て、段階（ｅ）は更に、（ｅ１）エントリ名の第１フィ
ールドを調査し、（ｅ２）エントリ名の第１フィールド
がもし単一語を含んでおれば対応する計数値を増し、（ｅ３）エントリ名の第１フィールドがｎ個の語を含ん
でおれば、ここでこのｎは１よりも大きい値であり、（ｅ４）主張名第１フィールドにおける頭初推測の語の
第１語に続く（ｎ−１）個の語をその第１語の接頭語と
することによって主張名第１フィールドにおける第２の
推測を形成し、（ｅ５）主張名第１フィールドにおける第２の推測をエ
ントリ名の第１フィールドと比較し、（ｅ６）主張名第１フィールドにおける第２の推測とエ
ントリ名の第１フィールドとが、もし一致しなければそ
のセットから他のもう１つのエントリ名を選択して段階
（ｅ１）戻り、（ｅ７）主張名第１フィールドにおける第２の推測とエ
ントリ名の第１フィールドとがもし一致するならば、対
応する計数値を増加する、このような各段階を有して成
ることを特徴とする請求項２の名前解明方法。
【請求項１１】主張名及びエントリ名の第２フィールド
の比較が：（ｊ１）主張名の第２フィールドの各語に対
して、エントリ名の第２フィールドにおける何れかの位
置にある同一語に対するエントリ名の第２フィールドを
調査する段階により実施されることを特徴とする請求項
２の名前解明方法。
【請求項１２】段階（ｊ）が更に、（ｊ２）主張名及び
エントリ名の第２フィールドが、順序に無関係に、同一
の語を正しく含んでいるならば、対応する計数値を増加
する段階を含むことを特徴とする請求項１１の名前解明
方法。
【請求項１３】段階（ｏ）の主張名及びエントリ名の第
３フィールドの頭文字の比較が更に：（ｏ１）エントリ名の第３フィールドを、式ｉｒ〔−ｉ
ｒ〕＾ｍに従って形成し、ここでｉはハイフンで結ぶ文
字をもたないエントリ名の第３フィールドのサブストリ
ングの頭文字であり、ｒはそのサブストリングの多分ｏ
部分であり、そして、ｍはｏより大きい整数であり、そ
して、（ｏ２）主張名の第３フィールドが、ｎ≦ｍとした場合
、ｉ〔ｉ｜−ｉ〕＾ｎを形成するかどうかを決定する、
これらの各段階を有しており、しかも、もし主張名の第
３フィールドがこの形態であるならば、主張名の第３フ
ィールドはエントリ名の第３フィールドの頭初形態であ
り、そして、（ｏ３）もし主張名の第３フィールドがエントリの第３
フィールドの頭初形態でなければ、エントリ名の第３フ
ィールドが主張名の第３フィールドの頭初形態であるか
どうか決定するためにエントリ名と主張名との第３フィ
ールドを反転することによって段階（ｏ１）と（ｏ２）
を繰り返すことを特徴とする請求項２の名前解明方法。
【請求項１４】エントリ名の第３フィールドが代替名を
含むことができ、しかも段階（ｐ）は更に：（ｐ１）何れかの名前の第３フィールドの語が他の名前
の短縮形でなければ、このエントリ名の現在の第３フィ
ールド語に対応する代替名語を選択し、そして、（ｐ２）このエントリ名の現在の第３フィールド語に対
応するそれぞれ連続した代替名語に対して段階（ｍ）か
ら（ｐ）を繰り返し施行する、これらの各段階を有する
ことを特徴とする請求項２の名前解明方法。
【請求項１５】段階（ｓ）が：（ｓ１）もしも比較スコアが正しく一致スコアに等しけ
ればその名前分解動作を終結し、その主張名に対応する
エントリ名として提供し、（ｓ２）もしもその比較スコアが正確な一致スコアに等
しくなければそのセットからもう１つのエントリ名を選
択して段階（ｅ）に戻り、そして、（ｓ３）このセット内で分解されるエントリ名が更に存
在しなければこの名前分解を終結し少くともその主張名
に最も相応しく対応するエントリ名を提供する、これら
の各段階から成ることを特徴とする請求項２の名前解明
方法。
【請求項１６】個々の主張名の形態ならびに次の表記順
序、すなわち、〔個人名フィールド〕、〔別名フィールド〕、及び〔世代及び栄誉フィールド〕から成ることを特徴とする請求項３の名前解明方法。
【請求項１７】主張名から第１フィールドを選択する段
階（ｃ）が、更に主張名から、何れかのコンマの前の最
終語を選択し、コンマがない場合は主張名の最終語を選
択する段階を有することを特徴とする請求項１６の名前
解明方法。
【請求項１８】主張名の第２フィールドを選択する段階
（ｉ）が：主張名の中のコンマに続く語を選択する段階
を有することを特徴とする請求項１６の名前解明方法。
【請求項１９】主張名の第３フィールドを選択する段階
（ｋ）が：第１フィールドに先行する主張名の全ての語
から第３フィールドを構成する段階を含むことを特徴と
する請求項１６の名前解明方法。