JPH04137069A - データベースの登録簿を探索する方法 - Google Patents

データベースの登録簿を探索する方法

Info

Publication number
JPH04137069A
JPH04137069A JP2405118A JP40511890A JPH04137069A JP H04137069 A JPH04137069 A JP H04137069A JP 2405118 A JP2405118 A JP 2405118A JP 40511890 A JP40511890 A JP 40511890A JP H04137069 A JPH04137069 A JP H04137069A
Authority
JP
Japan
Prior art keywords
name
field
entry
word
alias
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2405118A
Other languages
English (en)
Other versions
JP2638307B2 (ja
Inventor
Ronald E Dann
ロナルド・エバーレット・ダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bull HN Information Systems Inc
Original Assignee
Bull HN Information Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bull HN Information Systems Inc filed Critical Bull HN Information Systems Inc
Publication of JPH04137069A publication Critical patent/JPH04137069A/ja
Application granted granted Critical
Publication of JP2638307B2 publication Critical patent/JP2638307B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q3/00Selecting arrangements
    • H04Q3/42Circuit arrangements for indirect selecting controlled by common circuits, e.g. register controller, marker
    • H04Q3/47Circuit arrangements for indirect selecting controlled by common circuits, e.g. register controller, marker using translators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[0001]
【関連出願とのクロスリファレンス】
この特許出願は、1989年8月28日こ出願されこの
特許出願の譲受人に譲渡された、5teven  P、
N1ckelによるアメリカ特許出願番号NO。 414.045、名称[Prefix  5earch
  Tree  with  Partial  Tr
ee  BranchingJに関連する。 [0002]
【産業上の利用分野】
この発明はデータベースにおける情報の位置に関し、さ
らに詳しくは、使用者により提供された主張芯を伴うデ
ータベース登録簿に記憶された名前のような情報識別名
を解明することによる情報の位置決めに関する。 [0003]
【従来の技術】
データベースにおいてよく再発する問題は、特にコンピ
ュータシステムにおいて起り勝ちな問題とは、データベ
ースのエントリに記憶された情報の規定項目の探索と位
置とに関する問題である。このような探索では一般にそ
のデータベースの登録簿を作ることによって実施され、
この場合、この登録簿にはデータベースエントリの索引
が含まれている。この索引は、順次に、このデータベー
スエントリに記憶された項目に関連するキーを含んでお
り、個々のキーに対しては、対応するエントリのデータ
ベース内の位置を含んでいる。その結果、使用者はその
エントリの位置を見出すための登録簿を探索するため、
エントリ内のデータの所定の項目と関連するキーを使用
する。登録簿索引で用いられるキーの最も普通の形態の
1つは、その情報と何らか識別する関係をもつ名前であ
る。例えば、名前の分解法に対する特許出願原本に含ま
れているワード処理ファイルから成るエントリは、「n
amerasJという名前が与えられる。これにより使
用者は「namerasJ用の登録簿を探索することに
より原文ファイルを見出す。 [0004] データベース内の情報の位置決めするために索引に記憶
された名前を使うことは、それ自体特定な問題にぶつか
る。所定の情報項目あるいは命名規制に不慣れな使用者
は、その索引の中に名前を見出すことが困難であり、そ
のような索引はしばしば、無作為探索用としてはあまり
にも膨大すぎることがある。しかも、使用者がたとえ所
定のデータベースエントリに慣れていても、命名規制は
、しばしば所定のエントリの正確な名前を忘れてしまう
。問題は、従って使用者にとって親しみ易い登録簿の名
前探索及び解明を提供することにある。 [0005] 上述の諸問題点は多分、個人についての情報の登録簿を
構成するデータベースにより最もよく図解される。例え
ば、このようなデータベースは、個人の電話番号、住所
、回路網位置、場所などと共に、大型コンピュータある
いは通信網に連結された全ての個人に関する情報を含有
する。データベースのこの場合の例では多分、この登録
簿の索引内の名前を識別しあるいは位置決めと分解をす
るためには最も複雑であり、しかも、この発明はこの特
殊なデータベースの形態あるいは索引命名規制に限定す
るものではないが、この場合の例は、この発明について
の以下の説明の中で最も高頻度に用いられる事例である
。 [0006] 先行技術においてしばしば用いられている命名法の1つ
は「記述式名前」であり、この場合は個々の名前は属性
のセット(−組を構成したもの)から成っている。個々
の属性はそのデータベースにおける対象物すなわちエン
トリに関する特定の種類の情報の断片であり、所定の例
の属性の値は、関連するデータベースエントリに関する
特殊情報により決定される。例えば、1つのエントリの
創作の日付はその登録簿者の属性であり、その属性値は
そのエントリが創り出された日付である。所定の「名前
」は、従って1つあるいはそれ以上の属性値表明、すな
わち属性の種類/属性値の対により規制される。一般に
、属性値表明の順序は大して重要ではないが、使用者は
、対応するデータエントリを明確に識別するために必要
な出来るだけ多くの属性値表明を提供することを要求す
る。このような対処方法に伴う問題は、使用者は、「名
前」を形成するために選択した特定の属性に慣れている
ばかりでなく、表明が名前の中に現われるとき正確に少
くとも最小限の数の表明の値を得なければならない。す
なわち、1つの属性値として「Katy」を用いること
は、もしも索引中に記憶された値がl’−KateJで
あるならば一致を生ずることはない筈である。 [0007] 異名は、その属性の変形を介して識別できるが、また使
用者に親愛を鞄かせるように使われると考えられて来た
。例えば、もし登録簿が属性値表明で、「国名=USJ
及び「州名=マサチェーセッツ」をもつ名前を含んでお
れば、この異名は、「国名=US、州名=MassJ及
び、[国名=US、州名=MAJが、この名前をもつエ
ントリを位置決めする上で使用者に許容しよう。 [0008] しかしこの方法は厳格な制限条件を有しており、その制
限条件では、分離した異名エントリはあらゆる命名変形
に対する登録簿に現われなければならないし、しかも多
くの可能性のある変形をもつ属性値表明は多くの異名を
必要とするということである。この条件は登録簿の大き
さ及びこの登録簿を維持する上での管理用オーバヘッド
の双方の著しい拡大をする。この問題は所定の名前から
成る多数の属性値表明を共に増大する。すなわち、1つ
の名前を支持するために必要な異名の全数はその名前の
個々の属性値表明に対する多数の変形の魔物である。加
えて、1つの所定の属性値表明は多数の異る名前で、し
かも他の属性の可変セットと関連して出現できる。例え
ば、「州名=マサチューセラ・刈は、1つの名前では「
国名=USJで現われ、だの名前では「機関=HBIJ
で現われる、従ってこの場合には、「国名=マサチュー
セッツ」のもつ3つの変形を支持するには6つの異名が
必要となる。 [0009] 上記に論じた諸問題は、登録簿の名前が属性として「普
通名」を用いることに基づく場合−層深刻となる。「普
通名」は、時に、「この名前によって対象物がある定義
をされ、限られた範囲において一般に知られる名前」と
して定義されている。例えば、英語を話す国に於ける人
間の「普通名」にもとづく登録簿は、個人の称号、例え
ばMr、、Mr s、、Msあるいは博士、第1名、1
つまたはそれ以上の中間名、最終名及びJr、あるいは
IIなどの世代を表わす指示から成っている。ある英語
を話す文化圏における普通名は、更に、称号、勲位及び
栄誉が含まれる。登録簿の名前に使うことができる属性
の他の種類のほとんど大部分のものと比較すると、人間
の普通名は非常に多数の変形をもっことができる。しか
し使用者に親しみ易い登録簿であるために、登録簿は、
普通名の属性の内のいくつかあるいは全部が無い場合に
登録簿エントリに対する要求を解明することができなく
てはならない、この場合、提供された構成成分はこのエ
ントリを識別する上で充分後に立ち、その成分の代替成
分すなわち変形は受入れられることだけはなされねばな
らない。 [0010] この問題の重大性は1事例、すなわち、名前「Mr、R
obin  Lachlan  McLeod  BS
c (hons)CEng  MIEEJによッテ図解
できるが、この名前は典型的な英国人名である。もし最
後名がこの人物を明確に識別するに充分役立つならば、
登録簿は、この名前を、称号、第1名、中間温及び栄誉
の各成分を全て除いて、あるいは現在のこれら構成成分
のうちの若干を組合わせて他は除いて解明されねばなら
ない。登録簿は、もし第1名及び中間温が全体温あるい
は頭文字の何れかで提供されるならば、あるいはニック
ネームやその頭文字が第1名の代りに提供されるならば
、その名前を解明しなければならない。このように称号
及び栄誉のそれぞれに対して2つの変形があり、中間温
に対しては3つの変形が、そして第1名に対しては5つ
の変形がある。第1名あるいは頭文字なしに、中間温あ
るいは頭文字としてこのような変形を許さなければ、有
効な変形の数は52となる。もし名前中に世代表示、例
えばJr、とかIIなどが入れば変形は104となり、
その人物が2つあるいはそれ以上の中間温を、一般の英
国におけるように、もっているならば、その変形の数は
それぞれの付加的名前の3倍となるであろう。期間の有
る場合、無い場合双方における栄誉と頭文字の部分集合
を許すと、許容すべき変形の数は更に増大する。 [00113 普通名解明の問題を更に図解する場合、ある国において
は別名がその人物の名前の第1要素として現われる。な
お他の国においては、多語第1名が比較的一般的であり
、アメリカ合衆国における例では、Mary  Ann
とが、B111yBobなどがその例であり、De  
Tomaso及びconan  Doyleのような多
語最終名と同様であって2つの成分がハイフンで結ばれ
ている。スペイン語を話す国においては、ある人物の法
律名は、第1名、多語中間名・父親からもらった別名及
び母親の独身名から成り、しばしば共通利用される。 [0012] 普通名登録簿の全ての受入れ可能変形名を徹底的に目録
に載せる登録簿は、異名としであるいは付加的属性値と
して、登録簿の大きさ及びこの登録簿を維持するための
努力の両方に関して実用的でないということが、正にこ
の事例から明らかである。 先行技術に関する上述の諸問題、ならびに他の諸問題に
関する解答は、データベース登録簿における普通名の解
明に関するこの発明の方法により提供される。 [0013]
【発明の目的】
従って、1つの登録簿における索引の中の名前のエント
リを介してデータベースエントリを位置決定するための
改善方法を提供することがこのシステムの目的であり、
特に、名前が個人名であって、エントリが普通名を提供
した使用者を介して位置決定されるべきであってその普
通名はその索引中の対応する形とはかなり異っているそ
のようなシステムの中においてこの改善分法を提供する
のである[0014]
【この発明の概要】 この発明は、データベースとそのデータベース内のエン
トリの索引とをもつ情報処理システムで用いられ、そし
て索引内に記憶されたデータベースエントリ名によりデ
ータベースエントリを識別するように主張された普通名
を解明する方法を提供する。主張名とエントリ名とは個
々に、第1フィールド、第2フィールド及び第3フィー
ルドから成り、この中で少くとも第1フィールドは少く
とも1語を有する。データベースエントリが、普通名を
介して位置決定されている人物に関する情報を有してい
る事例においては、その主張名とエントリ名の第1、第
2及び第3の各フィールドは、その人物の別名、世代指
示及び栄誉称号、そして第1、中間及びニックネームを
それそ゛れ有している。 [0015] 主張名は、普通名の形式に相当する正規化された形で名
前解明処理方法に提供される。これは簡単な、自由形の
形式であり、システムに最小限度の標準化を強いるもの
であり、この場合、フィールドは、連続状に、「(個人
名)(別名)(世代及び栄誉)」に現われ、そして、こ
の場合、個人名フィールドは第1、中間及びニックネー
ム語を有し、ここで、ニックネームは、例えば代替第1
名である。個人名及び別名フィールドの語は互いに他か
ら遊離しておらず、あるいは別途に識別され、個人名フ
ィールドも別名フィールドも共に要語を有している。普
通名形式内の3フィールド内の分離符号だけが、別名フ
ィールドと世代及び栄誉フィールドとの間に現われ、例
えば、コンマ符号をもって現われる。索引内に記憶され
たエントリ名は、同様な標準の、正規化された形で記憶
され、この発明では、普通名形式よりも大きな構造を提
供するエントリ名形式を開示しているが、この発明の方
法は、普通名形式内の索引に記憶されたエントリ名を用
いる実施を考えている。エントリ名のフィールドは、し
かしもっと容易に識別されるのであって、この場合、個
人に属する索引エントリ名は、普通多属性と同様に別名
属性をもっている。 [0016] この発明によれば、この名前解明作業は、主張名とエン
トリ名との間の正確な一致を表わす一致スコアと計数値
のセットの初期設定とを決めることによって開始し、こ
こにおいて個々の計数値は主張名のフィールドとエント
リ名の対応するフィールドとの間の同一′i生を表わす
。 [0017] 次いで、この作業は、主張名から第1 (別名)フィー
ルドを選択して、その後主張した第1 (別名)フィー
ルドと同じ第1 (別名)フィールドをもつエントリ名
を識別することにより、主張した語の第1 (別名)フ
ィールドと一致する第1(別名)フィールドをもつ全て
の索引エントリのセットを構成する。
【0018] この段階において、この作業は、第2(世代及び栄誉)
フィールドを構成し主張名の残余の部分を採り上げるよ
うに、分離符号すなわちコンマに続く主張名の全ての部
分・すなわち、第1 (別名)フィールドを構成するよ
うに分離符号に先行する主張名の全ての部分を識別する
ことによって、主張名の別名フィールドを選択する。 [0019] ドとして識別されるようにその名前の最終語を選択する
。この作業は次いで、(a)主張名「別名」フィールド
の最終語に等しい別名か、あるいは、(b)主張名「別
名」フィールドの最終語に等しい最終語をもつ多語別名
か、何れかを有する全ての索引エントリを識別する。 [0020] 多語別名をもつ索引エントリの事例においては、この場
合、索引エントリの別名フィールドにおける語の数は、
n個であるが、この作業では、頭文字推測語で終ってい
てしかも索引芯別名フィールドの最後のn語をもって成
る主張名別名フィールドの最後のn語を比較し、そして
その2つの名前のn語が等しいかどうか一致を識別する
。 [0021] 別名フィールドに従って主張名に一致する可能性をもつ
索引エントリのセットを構成しておいて、この作業はこ
のセットの中の個々のエントリ名に対して、このエント
リ名の第1フィールドを主張名の第1フィールドと比較
し、もし主張名とエントリ名の第1フィールドが一致し
なければ、そのセットからもう1つの別のエントリ名を
選択する。主張名の第1フィールドは、エントリ名の別
名における語の数により変化することを注意すべきであ
る。もし主張名とエントリ名の第1フィールドが一致す
れば、この作業は、その一致が単一語の別名間に存在す
るのかあるいは多語別名の間に存在するのかその何れか
に従って、対応する計数値を増す。 [0022] 次にこの作業は主張名から第2(世代及び栄誉)フィー
ルドを選択し主張名とエントリ名との第2フィールドを
比較する。もし、これら第2フィールドに一致が見出さ
れれば、この作業は再び対応する計数値を増加する。こ
の比較作業において、第2(世代ならびに栄誉)フィー
ルドにおける語順は大した問題ではないすなわちこのフ
ィールドにおける一致語の数だけが重要であってそれら
語のフィールドにおける順序すなわち連続状態は重要で
はない。1つの計数フィールドが見出された各個の一致
に加えられ、一致において加えられた他の計数フィール
ドは、主張名及び索引芯の第2(世代ならびに栄誉)フ
ィールドの全ての語間において見出され、この場合、や
はり語の順序には関係がない。 [0023] この作業は主張名から第3(個人名)フィールドを選択
し主張名の第3フイルドにおける各個の語に対して以下
の段階順序を実施する。この第3フィールドは主張名に
おける別名に先行する全ての語を含んでいる。 [0024] この作業では主張名の選択語をエントリ名の第3フィー
ルドにおける同位置の語と比較する。もしそれら語の一
致があればこの作業では対応する計数値を増しその主張
名の第3(個人名)フィールド内の次の語を選択しこの
一連の段階の開始段階に戻る。 [0025] これら語の一致が見出されなければ、しかし1つの語カ
ミ主張名の第3フィールドから選択された語と比較でき
るエントリ名の第3フィールド内に存在していれば、こ
の作業では主張名及びエントリ名の第3フィールドにお
ける語の頭文字を比較する。1つの名前の第3フィール
ドの語がもし短縮形語であれば、すなわち、頭文字であ
るとか他の名前の第3フィールドの語の形をもつとかす
れば、この作業は対応する計数値を増して主張名の第3
フィールドから次の語を選択してこの一連の作業段階の
開始点にまで戻る。 [0026] もし、直前の2つの作業段階において、この作業が主張
名の第3フィールドから選択した語とエントリ名の第3
フィールドから選択した語との間において正確な一致も
しくは短縮的一致のつずれかを見出せば、しかもこの一
致は主張名の第3フィールドの最終語であった場合、こ
の作業では更にもう1つの計数値を加えて比較スコアを
算出するために最終段階に進む。 [0027] もし、主張名の第3フィールドから選択した語がエント
リ名の第3フィールドにおいて正確もしくは短縮形の何
れがの一致をしなければ不一致が起きている・この作業
ではこの場合エントリ名のセットからこのエントリ名を
落としそのセットの次のエントリ名に進み前記法のエン
トリ名に対する全作業を再び開始する。 [0028] この発明の作業の代替実施態様もしくは付加的実施態様
では、また、特に個人名の最初の語に代替えする形に対
して、第3(個人名)フィールドにおける代替芯もしく
は異名に対する、上記一連の作業段階における付加的比
較を提供する。 例えば、1つのエントリ名の第3フィールドがもしI−
RonaldJという語を有すれば、この語はこれに関
連した代替もしくは異名として1RonJという語をも
つことができる。[RonJという形をもつ主張名は、
従って、「RonaldJもしくはその短縮形すなわち
rRJという頭文字との正確な一致を見出すか、または
「Ronjという形の語との一致を見出す筈である。 [0029] 次いで、この作業の最終段階では、計数値の重みづけ合
計値として、上述した比較結果から、主張名とエントリ
名の間の同一性の程度に対する比較スコアを決定する。 この点において、この作業はそのセットのエントリ名を
、もしあれば主張名に対する最も可能性のある対応色と
して識別する。もし比較スコアが正確な一致スコアと等
しければ、このシステムはこの名前解明の作業を終了し
、このエントリ名を主張名に対応するものとして提供す
る。もし比較スコアが正確な一致スコアと等しくなけれ
ば、このシステムではその比較スコアを記録し、そのセ
ットからもう1つ別のエントリ名を選択し、そしてもう
1つのエントリ名に対する解明作業を繰り返し実施する
。しかし、このセットの中に解明さるべきエントリ名が
他になければ、このシステムはこの名前解明作業を終了
し、そして少くともこのエントリ名をその主張名に最も
よく対応するものとして提供する。 [0030] この発明についてこれまで述べて来たところの、そして
その他のこの発明の目的、特徴及び利点についてはこの
発明ならびにその実施態様に関する以下の説明から明ら
かであろう。 [0031] 【実施例】 A、登録簿システム10の一般的説明(第1図)。 ステムにこの発明が組込まれている。この発明が実施さ
れる環境事情を明らかに示すために基本的にこの登録簿
10が開示される限り、そしてまたこの発明の実施態様
を定義でしばるのでもなくまた限定条件を与えることも
せずに、登録簿システム10は単に一般的水準において
説明が展開されよう。 [0032] 登録簿システム10内で扱われる登録簿は、一連の推奨
標準類、l5O9594及びCCITTX、500で述
べられているように論理データベースであって、対象物
のセットに関する情報を包有しており、この中で各個の
対象物は、データ、プログラム、データとプログラム、
そして一般的に何れかの形態の情報を保有する論理的「
容器」 (コンテナ)と普通は定義される。このような
個々の対象物はその対象物の多数の属性を包含する登録
簿エントリにより表現される。この点について、1つの
対象物の1つの属性はその対象物の識別特性を若干定め
てもっており;例えば、ある個人についてのいくつかの
属性と言えば、その別名、第1名及び中間色、住所、電
話番号及び誕生日などがある。この登録簿エントリに記
憶されるものは実際に何であるかというとそれはこの対
象物用の属性の特定値であり、例えば、実際の最終名、
第1名、中間色、住所、電話番号及び誕生日などである
。事例で説明するために、所定の対象物に属性の「別名
」と「個人名」を与え、この特定の対象物の事例では、
これら属性の値は、個々に「Cech。 nyJと「Ge r r yJである。 [0033] エントリが登録簿に記憶されている対象物は、しばしば
、例えば人々の名前、場所、電話と回路網の位置あるい
は番号、コンピュータシステムの場所、取付は位置及び
記憶源及びO3I適用プログラムとしての事物などの電
気通信システムに関連している。対象物として許容され
る種類は上記の参考標準文献類に定められており、これ
ら文献には例えば、人物の対象級に対しては、個人の名
前、電話番号、通信網の場所及びパスワードなどの関連
する属性の種類が含まれている。 [0034] この登録簿は、階層型名前間隔をもった分布階層型デー
タベースとして論理的モデルをもっている。個々のエン
トリは、1つあるいはそれ以上の属性の種類/属性値(
AVA)の対から成っている相対的識別名(RDN)も
しくは局部名によって名前間隔の中に位置による識別を
されて含まれている。1つの両親エントリの子供である
所定のエントリのRDNはその両親エントリの他の子供
エントリの全てのエントリの中で独特のエントリである
。 [0035] 1つのエントリはその識別名(DN)によって名前間隔
全体に対して識別されこのDNは全体的にみて独特であ
り、しかもそのRDNとは、その先祖から伝わるエント
リの全てのRDNをもってそのRDNと連鎖状に連結さ
れており、すなわち、降下−直線内で、これより上の全
ての高度に祖先にさかのぼるエントリ全てのRDNをも
って連結されて成る。 [0036] 図示のように、実施例としての登録システム10は使用
者に対して登録簿業務を施行する場合に共同するサブシ
ステムのセットから成っている。登録簿システム10は
この明細書中に例示するようにシステム使用者(USE
R)12を有しこのUSER12は登録簿業務を要請し
て受は入れ、例えばCRT表示器及びキーボードあるい
はマウスを介して登録簿使用者代理人(DUA)14と
連通ずる。その名前から分るように、DUA14はその
使用者に代って動作を実施し、その中にはこの登録簿に
対する接近を特定の登録簿使用者に提供することも含ま
れており、この意味でこの使用者はUSER12に限定
されるのでなく1人の人物すなわちUSER12もしく
は1つの適用プログラムであってよい。 [0037] 例えば、DUA14はパーソナルコンピュータ、ワーク
ステーションもしくは端子をもったコンピュータシステ
ムであり、プログラムインターフェイス(P I〕nを
もち、このPIを介してアプリケーションが登録簿及び
1つあるいはそれ以上のアプリケーションプログラム(
AP)18に対するアクセスが得られる。 適用フログラム18は順に使用者インターフェイス(U
I)20を含み、このものはUSER12から入力指令
と要求とを受は取り、USER12に出力を提供して、
順次、P116及び他のAP 18と連絡する。登録簿
システム10について現在考えられている実施態様にお
いては、UI20は、MITのX−窓にもとづくマイク
ロソフト窓の実施か開放型システム間相互接続(O3I
)図面インターフェイスのようなスクリーン画面式(s
creen  based  graphica1)使
用者インターフェイスプログラムである。 [0038] P116は、登録簿が関与する要求を満すように求めら
れる機能を提供する。 この実施態様においては、P116は登録簿要求を、標
準のC語データ形式として符号化された独立変数の形で
受取り、これら受取った要求を、工業標準の抽象構文記
法1(ANSI  1)符号化ストリング(列)に変換
する。登録簿作業の結果は、ANSI  1ストリング
の形でP116により受取られ、そして標準C語データ
に変換されてP116によりアプリケーションに提供さ
れる。 [0039] DUA14のP116はプロトコール(通信上の規約〕
nを介して登録簿業務代理器(DSA)22と連絡する
、そして登録簿アクセスプロトコール(DAP)24及
びDSA22の手続きは、順に、登録簿、登録簿情報ベ
ース管理及びアクセス動作を実施する。DSAは再び汎
用コンピュータシステムとして実施され、図示のように
登録簿動作管理器(DOM)26を有しこの管理人は動
作システムに対してアナログ動作をし、登録簿要求の管
理機能と他のDSA22との動作を提供する。 [0040] DSAはまた、DOM26と関連しそしてその一部とし
て登録簿管理人(DM)28を含み、このものは登録簿
と、データベース管理と登録簿アクセス機能と名前解明
器(NR)30とを提供する、そしてこのNR30はこ
の発明の一部をなし以下にその詳細を説明しよう。 [0041] DSA22は、順次DOM26、DM28及びNR30
を介して実際の登録簿32に連結する。登録簿32は索
引34と、そして登録簿情報ベースエントリ(DIBE
s)38から成る登録簿情報ベースエントリ(DIB)
36を含む・DIB36は全地球規模の登録簿に相当す
ること、また何れの単一DSA22もDIB36の断片
体であるということを注意すべきである。登録簿32は
基本的にはファイル管理能力をもった大容量記憶装置で
あり、例えば関連のディスク駆動機構をもった汎用コン
ピュータシステムとして、あるいは当業者に公知技術と
なっているように特定ファイル処理システムとして実施
される。 [0042] 索引34はDIB36から成る登録簿への索引から成り
、一方、DIB36のDIBE38は順に登録簿エント
リを含有する。これら構成成分のそれぞれはその詳細を
以下に述べられよう。 [0043] 最後に、しかも再びDSA22を参照すると、第1図に
やや詳細に示しであるDOM26は登録簿業務プロトコ
ール(DSP)40を介して1つあるいはそれ以上の他
のDSA22と連結して成るということ、またこれら他
のDSA22は順に他の登録簿32、DUA14及びU
SER12と関連している。 [0044] すでに説明したように、登録簿システム10は、登録簿
32、DSA22.1つあるいはそれ以上のDUA14
及び多重USER12から成っていてしかも登録簿シス
テム10のより大きいシステムもしくは回路網中に1つ
の領域あるいは節点を有している筈であり、これにより
極めて大規模な、分布データベースに対する登録簿業務
を提供する。個々の領域もしくは節点は局部的常駐をし
維持されているデータのためのデータベースと関連登録
簿をもっている筈であり、登録簿エントリもしくは同様
な他の領域もしくは節点の転記を記憶すべきである。こ
のシステムの領域もしくは節点上のUSER12は、従
って全システムに対する登録簿業務を具備している。全
体システムのDSA22は、従ってDSP40を介して
相互連結され、その結果登録簿情報を互いに交換し登録
簿業務と全システムを横切るデータベースアクセスとを
提供する。 [0045] B、索引34の説明(第2図、第3図)第2図及び第3
図を参照すると、この発明の実施に係る索引34の概略
図が示しである。この索引34は接頭相構造をもちこの
構造は、1989年8月28日に出願され、この特許出
願の譲受人に譲渡された、5teven  P、Nic
kelによるアメリカ特許出願番号No、414,04
5、名称、1−PrefixSearch  Tree
  With  Partial  Tree  Br
anchingJに開示されている。 [0046] 1つのデータベースに対する1つの索引は時に分岐によ
って連結された1つもしくはそれ以上の個数の節点から
成る樹として構成される。個々の節点は一般に探索を指
示する情報を含有する1つまたはそれ以上の分岐フィー
ルドを有し、その中で個々のそれら分岐フィールドは常
にポインタあるいは分岐をもう1つの節点、ならびにそ
の節点からその分岐に沿って位置する情報の範囲もしく
は種類を指示する関連の分岐キーに対して、含有して成
る。この樹、そしてこの樹の何れかの探索はルート節点
とされる単一節点から始まり、下方に向って各種分岐節
点を経て進み、情報の項目もしくは、もっと一般的に情
報の項目のポインタの何れかを含む節点が到達するまで
下降する。節点に関連する情報はしばしば葉ノード(節
点)と言われ、あるいは、失敗、破壊節点を継続するが
どうが探索する水準だからこう呼ばれるのである。樹の
中の何れの節点もその節点から出発して全ての節点に対
してルート節点あり、1本の樹の中のその様な副次構造
はその節点に関して時にサブトリーと言われる。 [0047] 1つの探索において遭遇する個々の節点において、探索
キーとその節点に記憶された分岐キーとを比較すること
によって、その探索においては樹を介して何れの方向も
しくは分岐をとるべきかについての決定がなされる。こ
の比較の結果が所定の節点からの従属分岐の内の何れが
この探索の次の段階に続くかを決定することになる。こ
の点に関して、探索キーは最も一般的に、探索されるべ
き情報の項目に関連している文字あるいは数字のストリ
ングから成っている。 [0048] 登録システム10の現在実施しているものの索引34は
、可変長さ、文字指向のキーを用い高濃度の索引構造を
提供する接頭語探索樹として構成されている・分岐は何
れの水準においても、キー全体によるよりもむしろキー
の一部により決定され、樹の構造は、その樹が構成され
ている順序には依存しない。 [0049] 初めに索引34の一般的構造を考えると、索引34は、
空かあるlj)は1より大きいか1に等しい高さ、すな
わち1あるいはそれ以上の水準をもつ樹であり、次の性
質を満足する: (i)この樹の何れかの節点、T、はその形と種類は、
P、S、(Pi   −Pp)、D、((Bi、Si)
     (Bs、5s))ここでPi、O<i≦Pは
接頭諸相を表わし、順組(BiSi)  0<i≦Sは
分岐文字とサブトリーTをそれぞれ表わし、Dはデータ
記録のポインタであり;(i i)接頭語(Pi   
−Pp)は、T(及びTから従属するサブトリー)に含
まれるあらゆるキーにより分離された前方文字の最長ス
トリングを含み;(i i i) Dは長さpのキーを
もつ記録へのポインターであるかあるいはこのようなキ
ーがない場合、Oであり; (i v)個々のBi、O<i≦SはTにおけるあるキ
ーの、すなわちTから従属のサブトリーの第p+1番目
の独特な文字であり、その長さはpよりも長く;(v)
Bi<Bi+1.O<i<s ;(vi)個々のSiは
Tから従属の接頭語探索樹に対するポインターであり;
そして、 (vii)Si、0<i≦Sによって表わされたサブト
リーにおけるキーは、頭文字p+1文字を除くことによ
ってp+1番目の文字としてBiをもつTにおけるキー
のセットから形成される。 [00501 索引34の構造に関する上記説明は第2図及び第3図に
図解されており、その中で、第2図は、上記の定義に従
う樹44の単一節点(T)42の構造及び形式について
の概略図である。図示のように、T42は接頭語フィー
ルド(PF)46を有しこのものは節点T42から出て
いる全てのサブトリーの全てのキーによって分けられて
いる文字の最長のストリングから成る長gp(Pi  
  Pp)の接頭語を有し、またT42には、データポ
インタフィールド(D)48が含まれていてこのものは
、もしそのようなキー及びデータ記録がなければ、キー
(Pi   −Pp〕nをもつデータ記録に対するポイ
ンタをもっている。T42はまた1つあるいはそれ以上
の分岐フィールド(BF)50をもち、このもののそれ
ぞれは、分岐文字Bjを記憶するための分岐文字フィー
ルド(BC)52と、対応する分岐ポインタSjを記憶
するための分岐ポインタフィールド(BP)54から成
っている。説明したように、個々のBj!、tT42か
らのサブトリーの長さpよりも長い長さをもつキーのp
+1番目の文字であり、一方何々の関連したSjはその
サブトリーの節点T42に対するポインターである。最
後に、個々の節点T42は、節点42から出ているPF
46及びサブトリー(あるいはデータ記録)の数、すな
わち節点T42に含まれているBF30の数に記憶され
た接頭語において、長さと文字の数とをそれぞれ含むp
フィールド56とSフィールド58とを有する。pフィ
ールド56とSフィールド58とは節点T42の構造の
必要な部分ではないが、これらのフィールドはこの節点
を処理する場合登録簿システム10を援助するために用
いられる。すなわち、この情報をPF48及びBF30
から抽出するシステムをもつことよりも、PF48に含
まれる接頭語の長さに関して、また分岐フィールド50
の数に関してプロセッサに情報を与えることの方が一層
効率的である。 [0051] 樹44のある節点は葉ノーズであり、このものはその構
造において分岐節点T42と同一であり、ただし、これ
らの節点は分岐がOであるので分岐フィールド50をも
たず、しかし登録簿10のデータベース内のデータ記録
に対する基準をもつDフィールド48を有している点だ
けが異っている。 [0052] 第3図では、キー値、”Btree  、  ”Bin
ary”  ”BinarySearch”、  ”B
inaryTree  、  ”HashTable”
、  ”HashFunc t ion” 、及び’H
a she dF i l e  を用いる樹44を伴
う牽引34の構造を図解しである。 [0053] ルート節点から出ている2つの分岐あるいはサブトリー
をこの樹がも′:)7あ6うということがこの事例のた
めに用いられるキーを調査して明らかになった。1つの
分岐では頭文字”B”  (Btree、Binary
、BinarySearCh、及ヒB i n a r
 yTr e e〕nをもつキーのための節点を有し、
他の分岐は頭文字”H”  (HashTable、H
ashFunc t ion、及びHashedFil
e〕nをもつキーのための節点をもつ。従って、ルート
節点T42AのPF46はOであり、何となればII 
B IIで始まるキーと、“′H゛°で始まるキーとの
間に分離される共通の接頭語がないからであり、またT
42AのDフィールド48は、またOであって、そのわ
けはT42Aから出るデータ記録がなXJ)からである
。T42Aは、頭文字で′B″をもつ全てのキーをもつ
T42Aサブトリー用の第1BF50フィールドと、頭
文字”r Hl″をもつこれらのキー用の第28F50
フィールドとをもつ筈である。第1BF50フィールド
を考えてみると、このフィールドにおけるBF32フィ
ールドBjは文字“B”であり、何となれば11 B 
IIはT42Aの対応するサブトリーのキーの第p+1
番目の文字であり、BF34フィールドはこのサブトリ
ーT42Bにおける第1節点に対するSjポインターS
Bを有するであろう。T42Aの第2BF50フィール
ドは、BC52フィールド内のそのBjとして文字11
 HIIを有し、何となればこれは対応するサブトリー
のキーの第p+1番目の文字だからである、そしてBF
34フィールド内のSjポインターはこのサブトリーT
42Cの第1節点に対するポインターS であろう。T
42Aのpフィールド56とSフィールド58とは、そ
れぞれT42AのPF46フィールドは接頭語文字を有
しておらず、すなわちOであることを表わすOと、そし
て、T42Aは2つの「子供」、すなわちT42Aから
の2つの分岐があることを表わす2を含んで成る。 [0054] T42Bについて考えると、頭文字” B ” をもつ
キーの次の分岐は、第2番目の文字として“t11をも
つキー”Btree  と、2番目の文字、(B i 
n a ry、BinarySearch、及びBin
aryTree)”i”をもつキーとの間に生ずる。こ
の節点から分岐するキーの間において分離する共通の接
頭語文字はもはやないので、T428  PF46フィ
ールドはOを含み、T42BのDフィールド48も同じ
である。T42Bは再び2つのBF30を有し、この場
合最初の文字はi″のBjをもち2番目の文字(よ“t
ITのBjをもち、 14 i 11とパt“とは、こ
れら分岐から出たサブトリーのキーの第p+1番目の文
字である。対応するSjポインターは、それぞれ節点T
42D及びT42Eに対するポインターSi及びStで
ある。T42Bのpフィールド56及びSフィールド5
8は、PE46フィールドは接頭語文字をもたないこと
を示すOを有し、またT42Bは2つの子供、すなわち
分岐をもつことを示す2を、それぞれ有する。 [0055] 次にT42Eについて考えると、この節点はデータ記録
の基準をもつが更に他の節点に対する分岐をもたない。 そのため、T42EのPE50フィールドはOを有し、
すなわちこの節点はPE50フィールドをもたない。T
42EのPE46フィールドは関連するデータ記録に対
するキーの最終部分、T42Eの場合の文字ストリング
゛’ree”及びこのデータ記録に対するポインターを
含むDフィールド48を有する。pフィールド56とS
フィールド58とは、それぞれPE46フィールドが3
文字をもつことを示す3と、リーフ(葉ノード)42A
がサブトリーに対する復帰をもたないことを示す0を有
する。 [0056] 次にT42Dについて考えると、節点42Bから出てい
る他の節点であってその節点のサブトリーであるT42
Dはルート節点であってキーの’B i n a r 
y”   ”Binary  5earch”  及び
’BinaryTree  を含んでおり、この中でこ
れらのキーの接頭語” B ”及びII i !+はB
C52フィールドにおける接頭語としてそれぞれT42
AとT42Bとに記憶される。これらキーの残り部分、
すなわち、”nary、  ”narySearch”
、及び”naryTree”にとって共通の最長の接頭
語は、文字列(ストリング、Str ing)“nar
y“である。そんなわけで文字列 nary  はT4
2DのPE46フィールドの接頭語として記憶される。 [0057] このサブトリーにおける3つのキーについては、全ての
3つのキーは、“nary”に続く次の文字が全て異り
、T42Dは3つの分岐をもっことになる。しかし、”
n a r y”はキー ”Binary”の最終部分
であるため、もう1つ別の節点への分岐にむしろ生じ、
このキー”Binary  は、T42DのDフィール
ド48の中に書き込まれているキー”Binary”に
関連したデータ記録に対するポインターの中に生ずる。 [0058] しかし、キー”Binary  5earch” と”
Binary  Tree”とは、’n a r y 
 に後続する残余の文字列を有しT42Dからの分岐の
中に生ずる。”Binary  5earch”の第p
+1番目の文字は’s”であり、そのため″“S11は
、BPフィールド54内の関連節点T42Fに対するS
jポインターSsと共に、最初(7)BF 50(7)
B jとして現われる。”BinaryTree”の第
p+1番目の文字は”T”であるから、 ”T”は、B
Pフィールド54内の関連節点T42Gに対するSjポ
インターS1と共に、2番目のBF30のBjとして現
われる。T42Dのpフィールド56とSフィールド5
8は、それぞれ、PF46フィールドが4つの文字列を
もつことを示す4と、T42Dから2つの分岐があるこ
とを示す2とを有している。 [0059] T42F及びT42GH共にT42Eに等しく、T42
Eにおいてはこれらの節点は他の節点に対してこれ以上
の分岐をもたず、非実在のBF30フィールドをもち、
個々のD48フィールドにおける関連データ記録に対す
るポインターをもっている。T42FのPF46フィー
ルドは文字列”e a r c h”を有し、この文字
列はキー”Binary  5earch”の最終部分
であって、一方T42GのPF46フィールドは文字列
 ree  を有しこの文字列はキー”Binary 
 Tree”(7)最終部分である。T42Fのpフィ
ールド56は、 ”earch”における5文字に対す
る5を含み、T42Gのpフィールド56はree”に
おける3文字に対する3を有する。そして一方では、各
個の節点のSフィールド58は、何れの節点からも分岐
のないことを示す0をもっている。 [00601 節点T42C,T42H,T42I及びT42Jから成
る第3図のトリー(樹)44の右手のサブトリーについ
て簡単に述べると、このサブトリーは上述したところと
全く同じ原理で構成されている。このサブトリーに含ま
れるキーは・HashTable   ”Hashfu
nction”  及び”HashedFile”であ
り、全ての3つのキー(7) ”H”は、T42AのP
F46に現われる接頭語の第p+1番目の文字としてT
42Aの対応するBF30のBjとして現われる。前に
も述べたように、T42AのPF46は、T42Aから
の2つの分岐の間に共通の接頭語文字がないので、文字
列はOとなっている。 [0061] これらのキーの残余の部分、すなわち、 ”ashTa
ble”   ”ashFunction”及び’as
hedFile  に共通な最長の接頭語列は、文字列
“ash’”であり、従って ash”はT42CのP
F46フィールドに現われる。共通接頭語列“’ash
”をもつ3つのキーがあるので、T42Cからの分岐は
3つある筈である。これら3つのキーの残余の部分の第
p+1番目の文字は、’ash” を除いた後では、そ
れぞれ、II F IT   “T″及び′e である
。従って、” F ” とl T T1 と11 el
l とは、節点、T42H,T42 I及びT42Jに
対応するSjポインター神、S、及びSeと共にT42
CのBF30内のBjSとして現われる。T42Cのp
フィールド56とSフィールド58とは、それぞれ、P
F46の3文字の文字列を示す3と、T42Cから3つ
の分岐があることを示す3とをもつ。 [0062] 節点T42H,T42 I及びT42 Jもまたリーフ
節点であり、これらの節点において、それらのDフィー
ルド48内のデータ記録に対するポインターを有するが
、それ以上の分岐はなく、従ってBF30も存在しない
。T42HのPFフィールドは文字列゛unction
”を有し、この文字列はキー “’HashFunct
ion”の残余部分であり、一方、T42I及びT42
J(7)PF46フィールドは、それぞれ、  abl
e” と“”dFile  とを有し、  これらは何
れもキー ”Ha s hTa b l e  及び’
HashedFile  の最終部分である。これらの
節点からは分岐がないので、これらの節点の個々のSフ
ィールド58はOをもつ。これらの節点のpフィールド
56はそれぞれ7.4及び5を1個づつ含み、これら節
点のPF46フィールドに記憶されたキーの残余部分に
ある文字の数を示す。 [0063] 索引34内の所定のキー値に対する探索を進めるために
、システム10はルート節点において始められ、節点毎
に索引34を介して進められこの探索が故障節点、すな
わち探索キーに対する一致をもたない節点に達するまで
進めるか、あるいはその探索キーに対応するデータ記録
を見出すことによって進める。 [0064] 各個の節点において、このシステムは、長さすなわち文
字の数kをもつ探索キー(K〕nをその節点のPF46
内に記憶された長さpをもつ接頭語文字列(P)と比較
し、この接頭語が少くともこの探索キーの頭文字と一致
するかどうかを決定する。すなわち、全てのi≦pに対
して、k≦p及びKi=Piの何れかを決定する。これ
に関して、もしも、接頭語P=0であるか、または探索
キーに=0の何れかであれば、すなわちもしも何れかが
0列であったならば探索キー及び接頭語の文字の内で一
致するものは存在しないことになる。 [0065] 探索キー文字列の少くとも頭文字部分において一致が見
出せないならば、そのキー値はその節点内に含まれず、
その探索は失敗に終ったことになる。もし、探索キーに
と接頭語Pとの間に完全一致があれば、すなわち、P=
にならば、対応するデータ記録はその節点のDフィール
ド48に記憶されたポインターにより指摘される。 [0066] 長さpをもつ接頭語文字列と、探索キー文字列の最初の
p文字との間に一致がある場合、このシステムは、キー
K(Kp+1)の第p+1番目の文字と一致するBjを
見出すために、BF30のBC52フィールドのBjs
を探索する。もしこの探索が、Bj=Kp+1を見出さ
なかったならば、この時はキー値はその節点に含まれて
おらずその探索は失敗である。 [0067] その探索がBj=Kp+1を見出したならば、対応する
次の節点に対して関連Sjポインターを追及し、他の節
点に対する接頭語の一致が見られない分岐節点、すなわ
ちその探索が失敗したのか、あるいは一致した接頭語と
データ項目に対するポインターとをもつ1つの節点の何
れかに達するまでその探索を続ける。トリー(樹)の中
の各個の連続した節点の接頭語は、前の節点の接頭語の
中に組込まれている先頭の接頭語文字を除いた後の、こ
のキーの残余部分にとって共通な最長の接頭語文字列か
ら成っているということを思い起すべきである。同様に
、このトリーの次の節点を探索するために用いたキーは
、新らしいキー値、すなわち、Kp+1   ・Kkを
もち、このキー値は、前の節点における接頭後及びBj
文字に一致している先頭のキー文字を除いた後の残余の
探索キーの部分から成っている。 [0068] 従って、索引34のトリー構造はこれ自体を1種の階層
型の名前の解明に与えられ、この中で、このトリーを介
して降って来る連続節点の各個は、相対的識別名(RD
N)である接頭語により識別され、またこの中で、この
節点の識別名(DN)は、その先祖から伝わる節点の全
てのRDNもしくは接頭語をもつそのDNのRDNの連
続体である。この節点のRDNとDNとは、もちろんD
IB36の中の何れかの対応する登録簿エントリー(D
IBE38)のRDNとDNとである。 [0069] 従って、前に説明したように、1つの節点に含まれる個
々の接頭語は1つあるいはそれ以上のAVA、すなわち
、RDNから成るところの属性の種類/属性値の対から
成っている。これもまた説明したことだ力板所定の節点
のDNとDI836における対応するDIBE36とは
、所定の節点のRDNをもつ全ての先祖から伝わる節点
のRDNを連鎖状につなげて構成される。 [00701 一般に、索引34の何れの探索であってもルート節点か
ら開始され、そして各種分岐節点を通って下方に進み、
情報の項目あるいはもっと一般的に言って情報の項目に
対するポインターをもつ節点に到達するまで探索を進め
る。個々、の節点において、この節点の接頭語フィール
ド46内に住むRDNから成るAVAは解明され、ある
いは、この探索がもう1つの別の節点そして他の節点へ
と続けられるのかどうか、あるいはこの探索は最終的に
主張されたDNを解明したのかどうか、これを決定する
ために使用者によって提供された、主張されたDNの対
応するAVAと比較される。もし、主張されたDNが1
つの節点のDNにより成功裡に解明されているならば、
その節点のDフィールド48の内容は、そのDNをもつ
DIBE38に指示されよう。 [0071] C0登録簿情報ベース(DIB)36 (第4図)第4
図を参照すると、登録簿情報ベースエントリー(DIB
E)38の概略図が示しである。すでに前に述べたよう
に、登録簿32に住む個々のI)Nは索引34及びDI
B36内の対応するDIBE38の中に対応するリーフ
節点をもっている。探索ずみ情報をもつDIBE38は
、以下に説明するように、このリーフ[0072] DIBE38の他の要素に対するポインターのセットを
含むDIBヘッダー60に加えて、このDIBE38は
基準ブロック62と受容器ブロック64とを有し、しか
もRDNヘッダブロック66、エントリヘッダブロック
68、そして実際の登録簿エントリを構成するエントリ
データブロック70とを有し−でいる。この発明に組込
まれたシステムの現在の実施態様においては、これらの
構成要素は登録簿データベースに記憶された単一ファイ
ルの中に含まれている。 [0073] 個々のDIBヘッダー60は、関連のDN用のDIBE
60に記憶された情報すなわちデータの種類を識別する
情報を記憶するためのフィールドを有する情報マスフィ
ールド72をもっている。このような情報は、例えば、
このデータが登録簿エントリの基本コピーであるかどう
か、他のDSA22がそのエントリのコピーをもってい
るかどうか、あるいはそのエントリが他のDSA22に
よって保持されているエントリの、いわゆる陰影コピー
であるがどうかを含んでいる。 [0074] DIBヘッダ60は、エントリに含まれる情報の種類に
より、多数の他のフィールドを有している。例えば、あ
るエントリは「航行」 (移動) すなわち大域DIB
内の局部エントリに種すために用いられる「知識基準」
である。DIBEオフセットの対応するセットを有して
いる。DIBヘッダーはこのように基準ブロック62を
指示する基準ヘッダーフィールド74を含む。 [0075] もし他のDSA22が登録簿エントリの陰影コピーを有
すれば、そのDIBE38は受容器の数の計数値とその
受容器を識別する記録に対するオフセットの対応するセ
ットとを含む受容器ブロック64を有するであろう。D
IBヘッダ60は更に受容器ブロック64を指示する受
容器ヘッダーフィールド76を含む筈である。 [0076] DIBヘッダー60は、RDNヘッダーブロック66の
登録簿32データベースにおける場所と大きさを含むR
DNヘッダーオフセット/長かフィールド78を有する
であろう。RDNヘッダーブロック66は、順次、デー
タベース内のAVAの対応するセットの場所と大きさを
、同様に識別する、AVAオフセット/長かフィールド
80のセットを有する。これらのAVAエントリは順に
、その登録簿エントリのRDNを含む特殊な登録簿の値
を有している。RDNヘッダーブロック66はまた、R
DNを含むAVAエントリの数を指示するAVA数82
を有する。 [0077] DIBヘッダー60はまたDIB38ファイルの中のエ
ントリヘッダーブロック68の場所を含むエントリヘッ
ダオフセット/長さフィールド84を有する。 エントリヘッダーブロック68は順に、このシステムの
何の使用者もしくは要素がこのエントリアクセスをもつ
か識別するACLの場所を記憶するためのエントリアク
セス制御リスト(エントリACL)と、そして、エント
リデータブロック70の大きさとこのエントリの中に現
われる登録簿の異る種類の数を記憶する多数の登録簿の
種類フィールド90を有している。最後に、エントリヘ
ッダーブロック68は、エントリデータブロック7oに
記憶された個々の属性のための属性の種類オフセットフ
ィールド92をもっている。更に次に説明されようが、
このエントリに現われる個々の属性の種類はエントリデ
ータブロック7oに記憶された1つ以上の値を有し;個
々の属性の種類オフセットフィールド92は対応する属
性の種類の最初の値エントリのオフセットを、登録簿3
2のDIBE38ファイルの開始に相対して、保有して
いる。 [0078] エントリデータブロック70を参照すると、エントリデ
ータブロック70はこのエントリに現われる個々の属性
用の属性フィールド94のセットを有する。属性フィー
ルド94は属性種類ACLオフセットフィールド96を
有しこのものは属性全体に適用する何れのACLの場所
でも識別する、そして属性の種類フィールド94にはそ
の属性の種類用の識別名を含む属性の種類フィールド9
8が含まれる。属性のフィールド94の動作開始は、エ
ントリヘッダブロック68の属性の種類のオフセットフ
ィールド92により指示される。 [0079] 属性フィールド94は更に最初の属性値フィールド10
0を有し、このものは順次に、このエントリに現われる
属性の最初の値を含む属性値フィールド104と、その
属性の最初の値に適用する何れかのACLの場所を識別
する属性値ACLオフセットフィールド102とを有す
る。 [0080] 属性フィールド94またそのエントリ中に現われる属性
の各個の残余の値に対する属性値フィールド106を有
する。個々の属性値フィールド106は、属性値フィー
ルド104と属性ACLオフセットフィールド102と
を、最初の属性フィールド100と同様な方法で有する
。 [0081] エントリに対する最初の属性フィールド94の場所は、
その属性がもしそのエントリのRDNの一部分であるな
らば、RDNヘッダブロック66のAVAオフセット/
長さフィールド80により指示される。 [0082] 最後に、そしてエントリに現われる個々の属性の属性フ
ィールド94に関連して、アクセス制御フィールド10
8の1セツトがあり、このものは属性の後のファイルに
現われる。アクセス制御フィールド108は、個々の保
護項目(エンドの属性にアクセスをもつ使用者もしくは
使用者のグループの識別名を識別する。 [0083] 最後に、このエントリがもしもう1つ別のDSA22に
住むエントリの陰影コピーであるならば、DIBヘッダ
60は、この陰影コピーが作られた日付を示す日付/時
間捺印フィールド110を含むであろう。 [0084] これまでの説明で、この発明が実施される環境について
図解して来た。以下の説明ではエントリがそれらのDN
ならびにRDNをAVA対から解明することによりどの
ように位置設定されるか、特に、使用者にとって親しみ
のもてる名前の解明方法に関するこの発明の方法につい
て述べよう。 [0085] 01名前の解明方法(第5図と第6図)説明したように
、この発明の目的は、「使用者」、例えば登録簿に記憶
された名前に対するシステムの使用者とか適用業務プロ
グラムあるいはシステム水準プログラム、によって提供
される主張名に関する、すなわち解明する方法を提供す
るにある。特に、以下の説明では主張された名前が登録
簿に入れられるときどうしてもDNと完全一致をみない
場合、例えば、主張名がDNの一部しか含んでいない場
合、あるいは主張名の各部分がDNの対応部分の式と異
っている場合に、その名前を解明する方法について述べ
る。 [0086] この発明の詳細な説明は個人名の場合の図解である。す
でに説明したように、個人名は名前解明作業において通
常でない困難性を示しそれは個人名がもつことのできる
形態上の多様性によるものであり、例えば、国家的なそ
して言語学上の特性により、しかも使用者が主張名を構
成する場合の多様性によるのである。 [0087] 使用者により示され、しかもその中にRDNが登録簿3
2を記憶する筈の形式を考えることが先ず初めに必要で
ある。 [0088] 主張名及びエントリ名の両方の場合に、名前の解明プロ
グラムに関する必要条件を減らすために少くとも最小限
度の標準化を施すことが望ましい。しかし、必要以上の
標準化をしないことも同様に望ましいのであって、主張
名の形式は個人名の形の可能な限り広い範囲にわたって
適用できる融通性をもったものであり、また使用者が慣
習的やり方、あるいは手慣れたやり方で主張名を表現す
る自由をもつものである。 [0089] このような理由で、登録簿システム10は、主張名に対
してもエントリ名に対しても普通名形式(purpor
tedCN〕nを使用し、次の拡大したBackus−
Naur形式で表わされる: purpor tedCN: := C個人名〕別名〔
9世代及び栄誉〕この〔個人名〕副成分はなるべく1個
の要語第1名もしくは代替第1名(「ニックネーム」は
その個人の実際名とは全く無関係なことがあるが、この
場合、特にニックネームが当てられる)、そして1つあ
るいはそれ以上の中間名、をこの順とし、この場合、こ
れら名前の構成成分の何れであっても、後続期間(′、
)があってもなくても頭文字により置き換えできる。ハ
イフンで結んだ名前、例えばJean−Paulなどは
次のような3種のやり方、すなわち、 ”J”   ’
“JP”あるいは”J−P”の何れかに短縮できる。別
名の副成分は1個あるいはそれ以上の語を含ませ、また
ハイフンで結んだ成分を含んでもよくこの場合全語を供
給しなければならない。「世代と栄誉」の副成分、すな
わちJr、あるいは■工あるいは名誉と栄誉称号は並べ
順は何れでよく、その個人の現実の世代ならびに栄誉名
成分の何れのサブセットでもよい、ただし世代成分は一
般に成分の順位の最初に置かれる。この標準化は大力の
主張された普通名に対する正確な語の解剖を許すに充分
である。しかしほとんどの場合、この標準に対して、外
国の使用者をも含めて使用者が太いに注意を払わなけれ
ば馴れることができないほど厳しいものでもない。 [0090] DN用の形式について言えば、登録簿シス1oの意図す
るところは、前もって定義をした普通名を用いることに
よってDNの解明許すことであり、従って普通名は登録
簿10においては属性の1種類である。 [0091] この発明に含まれるシステムの代替実施態様においては
、例えば、この中ではこのシステムは単一管理による完
全制御下にあった、そして「外国」システムとの連絡は
なかった、あるいは、この場合、高度に可能性のある非
両立性が許され高度な構造及び定義をもった名前形式を
用いることが可能である。 [0092] このシステムの代替実施態様は、従って正確に識別され
るべき個人名の副成分を許容する筈の普通名の属性の種
類の値に対する代替形式を定義する。説明したように、
登録簿システム10は対象に基礎をおくシステムであり
、個人に関する対象物が個人の対象クラス及びサブクラ
スの対象物であると定義する。 [0093] 従って登録簿システム10の代替実施態様は、個人区分
対象物の属性を定義するために、人物名の対応する属性
の種類を用いる。 [0094] 人物名は個人名に特有であり、次のようにASN、1を
用いて登録簿システム10に定義されている: 人物名::=シーケンス( 別名           名前成分 第1名     〔O〕  名前成分、任意代替第1名
   〔1〕  名前成分のセット任意。 中間芯     〔2〕  名前成分のシーケンス。 任意。 勲位または栄誉 〔3〕  名前成分のセット任意。 世代      〔4〕  名前成分、任意)ココで、
個々の「名前成分」は各場合の無感応の文字列として表
わされる。 [0095] 主張基と個人名RDNの普通名形式は、従ってDIB3
6に記憶されたようにこれらが名前解明作業にかけられ
る前に普通名に正規化される。 [0096] 効率の理由から、DIB36に記憶された個々のRDN
の普通名属性は、個々の索引34探索作業のために正規
化されず、しかし索引34の節点が構成されDIB36
のRDNが、前にも説明したように索引34の接頭語フ
ィールド46にその正規化された形で記憶される。必要
ならば、個人名RDNの原の普通名属性の形は登録簿エ
ントリから回収される。索引34中で探索するために使
用者により提出された主張芯は、探索作業に提出された
時点でもちろん正規化される。 [0097] 正規化は、これは第5図に図解しであるが、正規には4
つの位相をもって発生し、その場合個々の位相は前回の
正規化作業の結果を踏襲し、個々の位相はAVAからA
VAの状態を基準として実施される。このような正規化
作業については同業技術者の間では公知であるので、次
の正規化作業についてこの説明は簡略化し、普通名形式
に対する第5図において段階毎に進むやり方を基本とし
て図解する。 [0098] 最初の位相はASN、1水準において起り、標準形に対
する属性のASN3゜1符号化を減らすのであってこの
標準形は2つの符号化が同一であるかどうかを決定する
ためにANS、1符号化の直接比較を許している。この
位相において:段階112−構成された文字列は原の文
字列にまで減らされる;段階114−不正確な長さの形
は一定の長さをもつ形に変換され、そしてもし出来るな
らば長尺形は短尺形に変換される;そして、段階116
−属性値は、プール値及びビット列のような標準形に減
じられ、セットの要素はそれらの札及び値の順序に従っ
て分類される。 [0099] 第2の位相がシンタックス(文章構造法)水準で行われ
る、そして:段階118−その属性シンタックスにより
指向されたように個々の属性値を再形成し;そして 段階120−属性値の属性シンタックスに対する整合性
を点検する。これらの作業はシンタックスの個々の種類
に依って決まる。 [01001 正規化の第3の位相は属性の種類の水準で起る、そして
:段階122−属性の値が属性値上の限界内に落ちるこ
とを試験し、属性の種類により指向されたように値を再
構成する。 [0101] この発明の名前解明方法を用いるように、普通名属性値
が再構成されることが正規化の第3の位相である。この
名前解明方法に実際に用いられる属性値だけが再構成さ
れ、そしてこの作業は次の各段階を伴う:段階124−
下段盤文字を上段盤文字に置換する;段階126−前方
間隔もしくは後方間隔、及び余分な埋め込み間隔を除く
 (注:この段階は実際には段階118によって実行さ
れるが、もしも段階118において前以って実施されて
いなければ段階126として実施される);段階128
−全ての期間(′、)文字を除く;そして段階13〇−
属性値から最左翼のコンマを全て除く:次の段階はこの
システムが、この明細書の何処かに述べであるように、
牽引34に加えるために主張された普通名を正規化する
ように正確な一致算法を実施可能である場合においての
み用いられる;そうでなければ、この作業は直接段階1
36に進む; 段階132−別名成分を識別する; 主張された普通名の場合においては: 段階134−もしあれば最終コンマの前の名前における
最終語を位置決めする;あるいは、 段階135−属性値の最終語の位置決めをする;段階1
38−前述したように個人クラスの対象物に必要な属性
である普通名の別名を識別するか、あるいは、新しいエ
ントリがその個人クラスの対象物に対応シナケレハ段階
134及び段階135を追及する;そして、段階139
−その別名成分をその属性値の初めに移動し;段階14
0−文字分離記号(character  5epar
ator)として機能させるために別名フィールドの後
方に二元零バイトを挿置し;段階142−この別名がも
し登録簿32の新規データエントリ内に見出されるなら
ば、しかもこの別名が1語以上をもっているならばその
別名の再形成化した形になるようにその別名の語の順序
を反転する。 [0102] 最後に、正規化の第4番目の位相は索引34に記憶され
たこれらAVAに対してのみ提唱される。この最終的作
業は:段階144−属性値の符号化から最初の、そして
多分唯一の長さフィールドを除き; 段階146−第2番目の零値に見出された各零バイトを
当て、そして;段階148−AVA及びRDN終端接続
バイトコードを加える。 [0103] この正規化作業の一第4位相における属性値の符号化か
ら最初の長さフィールドを除くことは、属性値の内容に
対する長さフィールドから索引34の接頭語探索トリー
(樹)内の分岐点を移動することになり、この移動によ
って、その索引の圧縮をなし、この分岐を、名前探索の
見地からみて、あまり重要でない内容、すなわち長さフ
ィールドの内容におけるよりも、むしろ属性値上に発生
せしめる。 [0104] この点において、別名は索引34の探索において何時で
も用いられるようになっており、あるいは、登録簿32
に付加されるべき個人名の場合は、個人名の正規化され
た形はすでに索引34の節点の接頭語フィールドの中に
入れられるようになっている。 [0105] 以下の説明はここでこの発明の方法について述べるもの
である力板この発明により登録簿システム10は使用者
によって提供された主張普通名に対して、この主張名に
対応する登録簿32エントリを見出すために索引34内
に正規化された形で記憶されているRDNを用いて、そ
の主張普通名が、個別プログラムが、アプリケーション
プログラムかあるいはシステムレベルプログラムかを解
明する。 [0106] 登録簿システム10は、例えば、もっと直接的な方法が
失敗し、またこの発明の方法を使用者が明らかに要請す
るならば、AVAからAVAの一致算法がこの発明の方
法を実施するといった具合に、名前解明のために多数の
異った方法を用いることができるのである。前にも述べ
たように、この発明に係る名前の解明方法は、その意図
するところは、索引34により探索されるべき主張普通
基が索引に記憶されている正規化されたRDNと異る場
合に使用することである。例えばその主張普通基が不完
全であるとかあるいは索引34に記憶された正規化個人
名の属性とは異った属性が用いられていると言った場合
に用いられる。 [0107] 主張普通基に最も密接に一致している索引34エントリ
を見出すためのこの発明に係る方法は第6A、第6B、
第60及び第6Dの各図に図解してあり、以下のように
段階毎のやり方に基づいて説明しである:段階15〇−
上述し、また第5図に図解しであるように主張普通基を
正規化する。 段階152−分離用語と考えられている間隔及び/また
はコンマにより区分けされた個々の文字列を用いて、主
張普通基(purpor t edCN)に現われてい
る語の数Nを計数する。 段階154−この主張普通基と索引34エントリとの間
の正確な一致(EM〕nを現わすスコアを次式の結果と
して決定する、EM=N5十N4+2゜ 主張普通基と索引34エントリとの比較についての以下
の説明から明らかなように、EMに関する上述の説明は
、主張普通基と索引34エントリとの間に正確な一致が
ある場合の比較作業の結果を現わしている。 段階156−1セツトをなす5個の計数フィールド値、
C1,C2,C3,C及びCを頭文字化して零とする。 後に説明するように、これらの計数フィールド値は、主
張普通基の全部分を、索引34からの個々のそのような
正規化された名前とその主張基との比較中に、索引34
から読み取った正規化芯の対応する部分と比較をした結
果を現わす値を記憶するために用いられる。最終的な計
数フィールド値は、個々の名前比較に対して、主張名と
索引34の名前との一致の度合を表わすスコアを生ずる
ために使われる。 [0108] 比較スコア(cS)は、主張名の各部分と索引34の対
応する部分との比較結果に対する重みづけ合計値として
得られ、これは次のように現わされる:C3=CN  
+CN3+CN2+CN+C。 ここでNは、上述したように、主張名の語数である。こ
の比較スコアはまた、正確な一致スコアとして、主張普
通名における語数Nに依存する。 [0109] 更に明言すれば、この名前解明作業についての以下の説
明にあるように、正確か大体か何れにせよ、主張名とエ
ントリ名との語の一致があった場合は何時でもC1は1
が加えられ、一方主張名とエントリ名との語の正確な一
致があった場合は常にC2に1が加えられる。エントリ
名における代替第1名の語が、主張名の副成分である個
人名の対応語と一致する場合は常に03に1が加算され
る。エントリ名の副成分である個人名の語数が主張名の
副成分である個人名の対応語の頭文字形態になっておれ
ば、常にC4には1を加算する、以下同様である。そし
てエントリ名と主張名の世代ならびに栄誉に関する副成
分が同−言語数をもっていれば、あるいは、そのエント
リ名と主張名との個人名の副成分が同一語数をもってい
ればC5には1が加算される。 [01101 計数フィールド値の各種の組合せは、C8に関する関係
式におけるNのもつ各種の力による組合せと共に、これ
らの名前のある部分もしくはこれら名前の間の各種の一
致の度合または一致の種類が、2つの名前の間の一致の
度合を決定する上で多かれ少なかれ意味をもつように、
この比較スコアに対して、これらの名前のもつ各種要素
に対して重みづけをする。この実施例の場合、普通名の
全語は同じ重みづけをされ、しかし副成分もしくは語間
の正確な一致に対してはこの副成分または語の大体の一
致よりも大きい重みが与えられている。 [0111] 段階158−主張普通名からコンマの前の最終語、もし
コンマのない場合はその名前の最終語を選択してその主
張普通名の別名フィールドにおいて、初期推測をLGの
文字をこれに与える。 [0112] 段階160−別名フィールドの最終語として語Gをもち
、またもしあれば正しいもっと高次元のAVAをもつ登
録簿32において、全ての記憶された対象物のセットS
を形作る。 [0113] これに関して、前に述べたように、索引34から成るト
リー(樹)は、トリーのエントリーの名前から成るAV
Aの降下順序に従って降下するルート節点から構成され
る。索引34の1つのエントリの所定のDNのAVAは
、このエントリを含む節点の接頭語フィールドのエント
リとAVAとを含んでいる節点よりも先祖的にさかのぼ
っている節点の接頭語フィールドに記憶されている連鎖
状のAVAによって見出すことができる。このように識
別される高次元のAVAは、次に主張普通名と同じ高次
元のAVAをもつ節点のセットSを識別するために、こ
の主張普通名の対応する高次元のAVAと比較される。 接頭語フィールドは、AVA全体というよりはむしろ1
つのAVAの1断片を含んだ方がよいということを注意
すべきである。また、名前解明作業は、RDNからRD
Nのやり方に基づいて接頭語探索トリーに沿って下方に
進行する。従って、1つの普通基AVAが解明されるま
では、高次元AVAは、すでに具合よく一致している。 [0114] 段階162−これら別名フィールドの最終語として語G
を有する牽引34エントリのセットSの各要素eに対し
て、以下の各段階を実行する:段階164−eの別名を
調べる、そして、段階166−eの別名がもし単一語で
あれば、計数フィールド値C1どC2とに1を加算する
。 段階168−eの別名がもし要語別名であって、Con
an  Doyleのようにn語長ければ、その主張普
通名において、Gよりも前方にGの接頭語として(n−
1)個の語を加えてその主張別名においてもう1つの推
測値G′ を形成する。 段階170−G’ がもしこのeの別名に等しくなけれ
ばeをSから除き、セットSから、もう1つの要素eを
選択し、段階162に戻るか、そうでなければ、段階1
72−計数フィールド値C及びC2にnを加算する。 段階174−正規化された主張普通名において、もしコ
ンマがあればこのコンマに続く語から、主張された世代
及び栄誉フィールドGAを形成する。 段階176−GA内の個々の語に対して、要素eの世代
及び栄誉フィールドにおける何れかの位置にある同一語
を探す。 段階178−もし一致がみつかれば、計数フィールド値
C1及びC2に1を加える。 段階180−更に、GA及びeの世代及び栄誉フィール
ドが正確に同一語を有するならば、語の順序には無関係
に計数フィールド値C5に1を加える。 段階182−別名に先行する全ての語、すなわち、主張
普通名のGもしくはGの何れかから主張個人名、P、を
構成する。 段階184−左から右方への順序でPから選択した個々
の連続語Wに対して次の各段階を実行する: 段階186−索引34エントリの個人名成分から、Wが
Pにおいて行ったように、索引34工ントリ個人名成分
の中に同じ位置を占める語W を選択する。 段階188−そのようなW′が存在しなければ段階21
2に進む。 段階190−もしもw=w  であれば、計数フィール
ド値C1及びC2に1を加算する。 段階192−もしもWがW と等しくなかったならば、
次の各段階に従って、WがW の頭文字形態であるかど
うかを決定する:段階194−次式により語W′ を表
わすことによって語W の頭文字を抽出する、 1r(−1r)  、ここでiは、ハイフン結合の文字
を含んでいないW′の副文字列の頭文字であり、rはこ
の副文字列の多分零の残り値であり、そして、mは零よ
り大きい(≧0)整数である。 [0115] 名フィールドW′から成るそれぞれの副文字列の頭文字
を生ずる。事例により図解するため、個人名フィールド
W は副文字列″’John”及び“’Paul”°で
構成されていると仮定する。最初の副文字列iは′J“
°であり、そしてrは′Ohn”であり、2番目の副文
字列iはII P ITであり、rは”aul”であり
、従って、頭文字はJとPである。もし個人名フィール
ドW がフッフン連結形、すなわち“John−Pau
l”であれば、この作業ではやはりJとPを生ずる。 段階196−段階194で抽出されたように、W の頭
文字をWと比較する。 Wが次の形、 i (i l−i〕   ここで8≦m、をもっておれ
ば、すなわち、少くともWと同じ頭文字のいくつかをも
っていれば、W と同じ語順序であってハイフンはあっ
てもなくともよいならば、計数フィールド値C及びC4
に1を加算する。 段階198−もしもWが、段階194ないし196によ
って得られた決定のように、W の初期文字形でなけれ
ば段階192に戻り、そして、段階194から段階19
6に到る作業においてW とWとの役割を互いに反転し
て、Wの初期形態であるかどうかを決定する。W がも
しWの初期形態であれば、計数フィールド値C1とC4
に1を加算する。 段階200−w’ がWの初期形態でなければWはW′
の初期形態ではなく、要素eをセラ)Sから減じ、セッ
トSから別の要素eを選択し、段階162に戻るそうで
なければ、 段階202−wは主張個人名Pにおける最終語であり、
W は索引34に記憶された個人名の最終語であり、計
数フィールド値C5に1を加算する。 [0116] 段階204−次式を用いて要素eの「比較スコア」を決
定する:段階206−段階204で決定されたスコアO
8を段階154で決定された正確な一致(EM)に対す
るスコアと比較する。 段階208−もしも、CS= (段階206におけるE
M)であれば、この名前解明作業は終了であり、その主
張普通名に対応するDIBE38を識別するため了する
。 段階210−もしもC8がEMに等しくなくその名前解
明要求カミ 「近似な一致」は受入れられないというこ
とを明らかに定めていなければ、あるいは、もしも登録
簿エントリが適当な対象物クラス、例えば個人名の解明
の場合における個人対象物クラスの登録簿でなければ、
そこで要素eをセットSから除き、セットSからもう1
つ別の要素eを選択しそして段階162に戻る。そうで
なければ、段階212−もしも要素eが、「代替第1名
」の属性に対する1つあるいはそれ以上の値をもってお
れば段階184から段階210を繰り返し、この場合連
続して個人の代替第1名に対して繰り返す。代替第1名
に対するこのような段階184から段階210へのそれ
ぞれの繰り返し作業において、索引34に記憶された普
通名における個人名成分の最初の語に対して個々の代替
第1名を置換するがしかし流通名“′W゛′が代替第1
名から引き出されているときは常に、段階19段階21
4−原の個人名成分及び全ての代替第1名の双方に対す
る段階182から210を介して通る全てにわたって得
られた最大スコアは貯えておいて、そしてこの最大スコ
アをもつ全てのエントリ名の計数及び識別名を記憶し、
あるいは、もし段階218の代替実施の1つが選択され
るならば、その最大スコアの所定の範囲の中にあるスコ
アをもつエントリ名の計数及び識別名を記憶する。 段階216−セットSのもう1つ別の要素eを選択して
段階162に戻る。 段階218−この業務のこの段階は、もしセラ)Sの全
要素が調査されその結果索引34に記憶された普通名内
の主張普通名に対する正確な一致が見出されなかった場
合は、ここに到達することになる。正確な一致が見出さ
れなければ、段階204で決定されたように最高スコア
をもつ要素をSから選択する。もしたった1つの要素が
このスコアをもっていればその要素を、その主張普通名
に対する最良の合致としてその要素の識別名を戻す。1
個以上の要素がこのスコアをもっていれば、不確かな結
果の通知を戻すかこのスコアをもつ全要素の識別名を戻
す0この段階は、もしこの業務がすでに段階208で終
了しておらなければ、この[0117] E0名前解明手順の実施例。 名前解明手順の図解により登録簿が以下の普通名をもつ
エントリをもつこと想定する: Arthur  Conan  Doyle、ここで’
Conan  Doyleは別名である: Arthur  Doyle: Arthur  C,Doyle、代替第1名”Art
”をもつ;Edward  Doyle。 これらは正規化された形で登録簿索引に記憶される。例
えば、 “’ArthurConan  Doyle”
は正規化されて次のようになる:Doyle  Con
an C別名の分離文字、]Anthur [AVA分
離文字〕[’RDN分離文字。 主張普通名= ”A、Doyl e”を与える、この主
張普通名はその、°°を除くことによって正規化される
。 1つの正しい一致スコアが計算され、ここでは、N=2
、EM=50を与え、計数フィールドは0(零)の頭文
字となる。 主張別名の初期推測Gは、= ”Do y l e”の
ように形成される。 次にこの手順では、 Doyle” という別名端末を
もつ全ての索引エントリのセットSを構成し、その結果
、Sは上に表記したエントリの全形を含むことになる。 (i)  e= ”Ar thur  Conan  
Doyleこのエントリ名は多数語別名をもっているの
で、第2の推測G′が主張別名から形成される、ここで
、G’ = ”A、Do y l e”である。G′ 
は゛’Conanこのエントリ名は、 ”D o y 
l e” という単一語別名をもち、この’Doylf
lはGと一致する、そこでCは1に増加され、C2は1
に増加される。 主張名もエントリ名も何れも世代及び栄誉成分をもって
いない。 主張個人名Pは“′A″である、何故なら、これは主張
別名Gに先行する全てであるからである。 Pの中の唯一の語WがA”である、そしてエントリ名の
中の対応語W が″“Arthur”であり;  ”A
” と”Ar t h u r” とは一致しない。 11AII = iであるが、 ”Ar t h u 
r” (7)頭文字であり、Wはw(7)初期形でw 
(”A” )は主張個人名P(7)最終語であり、w 
 (”Arthur”)はエントリ個人名の最終語であ
るから、C5は1に増加される。 この要素に対する比較スコアは従って次のように計算さ
れる:=43 (iii)   e=”Arthur  C,Doyl
e”このエントリはやはりGに等しい単一語別名をもつ
ので、Cは1に、C2はやはり1に増加される。 主張、エントリ世代ならびに栄誉の両フィールドは共に
空である。 主張個人名Pは“Aooである。Pの第1語Wは“Ao
oであって、対応するエントリ語W は’Arthur
”である。前に述べたように、WはW とは等しくない
が、WはW の初期形であり、そのため、C1は2に、
C4は1に増加される。 wl;!、Pにおいて最終語だが、W はエントリ個人
名において“′C″に続いており、C5は前のように増
加されない。 従って、 =42 このエントリは、代替第1名の’A r t ”をもつ
ので、この手順は、主張基゛A°“の個人名成分を、置
き換えられた代替第1名、 “’ArtC”をもつエン
トリ個人名に一致させるように試みる段階を繰り返す。 11 A 11は’Art”の初期形であるのでCは2
に、C4は1に増加される。 この比較スコアは再度計算され、C3=42を再び見出
す。 このエントリに対する両方のスコアは前のエントリにお
いて生じたスコア43よりも小さい、このスコアは貯え
られない。 (iv)   e= ”Edwa r d  Doy 
l e”は1に02は1に増加される。 主張個人名Pは“′A′であり、エントリ個人名は“E
dward”である。 “′A”は’E dw a r
 d” と一致せず、また’E dwa r d” (
7)初期形でもない。 従って、C8は次のように計算される、C3=1×2 
+1×23+0×22+0×21+O=24 このスコアは現在の最大値43よりもやはり小さく、そ
のためこのエントリは主張基に最もよく一致するもので
はない。 このようにして、第2のエントリ、 ”Arthur 
 Doyle  は主張基゛A、Doyle”に対する
最適な一致と考えられる。このエントリだけか、もしく
は最大値スコアのある規定された範囲内にある全てのエ
ントリの何れかがこの名前解明手順により戻される。 [0118] F1名名前解明手順代替実施態様 これまで述べて来た名前解明方法の現在の好適実施態様
は、登録簿10のもつ特殊な実施態様において所望され
る特別な性質に依り、多数の代替実施態様、すなわち変
化を与えた態様に応用される。 [0119] フィールド値Cに関する前もって説明した内容から明ら
かなことは、一致限界の相対的重みづけは、実質的に比
較スコア関係式に対する改変により動かされるというこ
とである。図解のために、比較スコアが段階168にお
いて計算される場もつより少数の識別に対する以上に普
通名成分のあまり正確でない多数の識別にになる。 [01201 別な実施例において、最高の一致スコアをもつ名前のみ
を戻すよりもむしろ、この手順は、その上方の境界が最
高の一致スコアによって決められるそのような範囲の中
に落ちる一致スコアをもつ全ての名前を戻す。この事は
可能性のある一致のセットを要求者に提するであろうし
、そのため、この要求者は、所望した名前よりも最も密
接な一致を見るある種の名前を偶然に主張名として提供
するであろう、所望した名前は一致の可能性のある名前
のセット返戻されるであろうということ、そしてその要
求者によって識別されるであろうという合理的な確率が
存在している。 [0121] 名前解明方法の能力は、また、主張普通名、個人名及び
正規化された形式における名前の属性成分の定義を更に
拡大すれば変えられよう。例えば、現在は、主張名の世
代ならびに栄誉に関する属性は、索引34に記憶された
名前の同等文字列と正しく一致しなければならない、す
なわち、Jr、はJuniorとは一致しない。主張名
の世代ならびに栄誉の属性と記憶された名前との間の一
致の確率は、例えばこれら記憶された名前の文字列の異
名もしくは代替基を用意するなどして増大できよう。 [0122] 更にもう1つの実施例では、別名に対する一致は、主張
普通名の別名が、索引34 ニ記憶e している名前の
別名と正確に一致を見なければ認められない。この事は
1つの問題でありうるが、例えば、スペイン語を話す国
家図では個人が代替れを許し調査するということにより
提起されよう。 [0123] 同様に、名前に対する属性形式及び名前解明方法の現在
の実施は、主張名もしくは記憶された普通名の何れにお
いても、第1名と中間名の正確な分離がなされていない
。この事は、代替第1名をも含めて名前の解明作業中に
異常を強いることになる。すなわち、この解明作業の現
在の実施においては、代替第1名が常に、索引34から
の記憶された普通名の最初の語と代替され、個人の第1
名が実際に1語以上、例えば、Mary  Annとい
うように含まれていても代替される。例えば、登録簿3
2が、エントリ、〔普通名=″’Mary  Ann”
 と代替名=“Buffy”、]を含むと仮定し、ここ
ではMary  Annは多数語の第1名であり、エン
トリは〔普通名= ”Ma r y  Sm i t 
h” と代替”Buffy〕と仮定する。主張名の’B
uffy  Ann  Sm1th”は、 ”M a 
r ySmith” よりももっとよく ”Mary 
 Ann  Sm1th”に一致すると思われよう、こ
れらは共に論理的に等しい、良い一致をしている。さて
、この例は、主張普通名、人物名及び正規化された形成
者における名前の属性成分の一層明らかな特質を提供す
ることによってこの名前解明手順に提供される。しかし
この事は普通名形式に対する更に標準化や定義づけ、及
び普通名を表わす方法における登録簿システム10の間
の融通性を更に対応して減らすことを強い要求するであ
ろう。前に説明したように、登録簿システム10の現在
の実施は登録簿システム10間の普通名の形式における
最大の融通性の提供を望んでいる。 [0124] 最後に、対応する索引34エントリの対象物クラスが決
定される前に、主張名が完全に解明されることが、現在
の実施上必要である。そんなわけで、命名属性として普
通名を含む全ての登録簿32エントリは、上述した普通
名解明作業に使用するために、その属性の値を個人名、
別名及び世代及び栄誉の各形式に記憶しなければならな
い。しかし、これらの特異性は、個人対象物クラスの登
録簿エントリに対してのみ有意義である。個人対象物ク
ラスのではなく、登録簿エントリ用の主張名を解明する
ための必要条件は、例えば、対応する索引34エントリ
のDフィールド48内においてそのエントリが属する対
象物クラスの指示を含むことによって、登録簿32の代
替実施態様において、除外され、もしくは削減される可
能性がある。従って、可能性のある一致名を含む索引3
4エントリに達すると、登録簿32は、節点のDフィー
ルド48から対象物クラス指示器を読み取ることができ
、このエントリが個人対象物クラスのエントリでなけれ
ば、この名前解明作業は実施しない。 [0125] 従って、この発明は、この発明に係る好適実施態様とそ
の方法について特に図示し説明して来たが、通常の技術
をもつ同業技術者にとっては、形態、詳細ならびに実施
に関して各種の変更がなされ特許請求の範囲に定義され
たこの発明の思想と範囲にもとるものではないことは容
易に理解される筈である。
【図面の簡単な説明】
【図1】 実施例としての登録簿システムのブロック概略図である
【図2】 索引の単一節点の構成ならびに形式を示す概略図である
【図31 索引の概略図である。 【図4】 登録簿情報ペースエントリの概略図である。
【図5】 名前の正規化を示す流れ概略図である。
【図6】 この発明に係る名前解明方法の作業の流れを示す概略図
である。
【符号の説明】
10 登録簿システム 12 使用者 14 登録簿使用者代理器(DUA) 16 プログラム間インターフェース(PI)18 ア
プリケーション(業務実施)プログラム(AP)20 
使用者インターフェース(UI)22 登録簿業務代理
器(DSA) 26 登録簿業務管理器(DOM) 28 登録簿管理器(DM) 30 名前解明器(NR) 34 索引 36 登録簿情報ベース(DIB) 40 登録簿業務実施プロトコール(DSP)42 単
一節点(T) 46 接頭語フィールド(PF) 50 分岐フィールド(BF) 52 分岐文字フィールド(BC) 54 分岐ポインタフィールド(BP)O3I  開放
型システム間相互接続 DN   識別名 AVA  属性種/属性値 RI)N  相対的識別名
【書類芯】図面
【図1】 図面の浄書
【図2】
【図3】
【図4】
【図5】
【図6A] 【図6B] 、b之P鋒166女〆1ηう゛ら 【図6C] 【図6D] 段階 202 り゛ら 【書類名】
【提出日】 【あて先】 【事件の表示】 【出願番号】
【発明の名称】
【補正をする者】 【事件との関係】 【識別番号】 【氏名又は名称】 【代理人】 【識別番号】 【弁理士】 【氏名又は名称l 【発送番号】
【手続補正 1】
【補正対象項目名】 【補正対象項目名】 【補正方法】 【補正の内容】
手続補正書 平成3年9月5日

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】データベースとデータベースにおけるエン
    トリーの索引とを有する情報処理システムにおいて、同
    索引に記憶されているデータベースエントリ名によりデ
    ータベースエントリを識別するように主張された普通名
    を解明する方法であって、この方法において、各主張名
    と各エントリ名とが別名フィールド、世代と栄誉フィー
    ルド、そして個人名フィールドとから成り、しかもこの
    方法において少くともこの別名フィールドが少くとも1
    語を有しており: (a)主張名とエントリ名との間の正確な一致を表わす
    一致スコアを決定し、 (b)個々の計数値が主張名のフィールドとエントリ名
    の対応するフィールドとの間の同一性を表わしている計
    数値のセットの初期設定をなし、 (c)主張名から別名フィールドを選択し、 (d)主張された別名フィールドと同じ別名フィールド
    をもつ全てのエントリ名のセットを構成し、そして、 (e)このセットのエントリ名の各個に対して、 (f)エントリ名の別名フィールドを主張名の別名フィ
    ールドと比較し、 (g)主張名とエントリ名の別名フィールドがもし一致
    しなければ、段階(e)に戻りそしてこのセットからも
    う1つのエントリ名を選択し、 (h)主張名とエントリ名の別名フィールドが一致すれ
    ば、対応する計数値を増加し、 (i)世代と栄誉フィールドを主張名から選択し、 (j)主張及びエントリ名の世代と栄誉フィールドを比
    較し、そしてもし世代と栄誉フィールドに一致が見出さ
    れれば対応する計数値を増し、 (k)個人名フィールドを主張名から選択しそして、主
    張名の個人名フィールドにおける各語に対して、 (l)そのエントリ名のその個人名フィールドにおける
    同じ位置にある語と主張名の選択語を比較し、 (m)エントリ名の個人名フィールド内に比較語が存在
    しなければ、段階(r)に進み、(n)語が一致すれば
    、対応する計数値を増して、段階(r)に進み、 (o)語が不一致であれば、主張名とエントリ名の個人
    名フィールドにおける個々の語の頭文字を比較し、そし
    て、 (p)もし1つの名前の個人名フィールドの語が他の名
    前の語の短縮形であるならば対応する計数値を増して段
    階(r)に進み、 (q)もし個人名フィールドの語が他の名前の短縮形で
    ある名前でなければ、そのセットからもう1つのエント
    リ名を選定して段階(e)に戻り、 (r)主張名とエントリ名の間の同一度に対する比較ス
    コアを計数値の重みづけ合計値として決定し、そして、 (s)このセットのエントリ名を主張名に対して最も対
    応するに相応しい名前として識別する、これらの各段階
    から成ることを特徴とする方法。
  2. 【請求項2】データベースとデータベースにおけるエン
    トリーの索引とを有する情報システムにおいて、同索引
    に記憶されているデータベースエントリ名によりデータ
    ベースエントリを識別するように主張された普通名を解
    明する方法であって、この方法において、各主張名と各
    エントリ名とが第1フィールド、第2フィールド、そし
    て第3フィールドとから成り、しかもこの方法において
    少くともこの第1フィールドが少くとも1語を有してお
    り: (a)主張名とエントリ名との間の正確な一致を表わす
    一致スコアを決定し、 (b)個々の計数値が主張名のフィールドとエントリ名
    の対応するフィールドとの間の同一性を表わしている計
    数値のセットの初期設定をなし、 (c)主張名から第1フィールドを選択し、 (d)主張された第1フィールドと同じ第1フィールド
    をもつ全てのエントリ名のセットを構成し、 (e)このセットのエントリ名の各個に対して、 (f)エントリ名の第1フィールドを主張名の第1フィ
    ールドと比較し、 (g)主張名とエントリ名の第1フィールドがもし一致
    しなければ、段階(e)に戻りそしてこのセットからも
    う1つのエントリ名を選択し、 (h)主張名とエントリ名の第1フィールドがもし一致
    すれば、対応する計数値を増加し、 (i)第2フィールドをを主張名から選択し、 (j)主張名とエントリ名の第2フィールドを比較し、
    そしてもし第2フィールドにおいて一致が見出されれば
    対応する計数値を増し、 (k)主張名から第3フィールドを選択し、主張名の第
    3フィールドの各語に対して、 (l)そのエントリ名の第3フィールドにおける同じ位
    置にある語と主張名の選択語を比較し、 (m)エントリ名の第3フィールドに比較語がもしなけ
    れば、段階(r)に進み、 (n)語が一致すれば対応する計数値を増して段階(r
    )に進み、 (o)語が一致しなければ主張名とエントリ名の第3フ
    ィールド内の個々の語の頭文字を比較し、そして、 (p)もし1つの名前の第3フィールドの語が他の名前
    の第3フィールドの語の短縮形であれば、対応する計数
    値を増して段階(r)に進み、 (q)もしその名前の第3フィールドの語が他の名前の
    短縮形でなければ他のそのセットから選択して段階(e
    )に戻り、 (r)主張名とエントリ名との間の同一度に対する比較
    スコアを計数値の重みづけ合計値として決定し、そして
    、 (s)このセットのエントリ名を主張名に対して最も対
    応するに相応しい名前として識別する、これらの各段階
    から成ることを特徴とする方法。
  3. 【請求項3】データベースエントリは個人に関する情報
    を含み、主張名及びエントリ名は個人に関し、主張名及
    びエントリ名の第1フィールドはその個人の別名に関す
    る情報を含む別名フィールドであり、主張名及びエント
    リ名の第2フィールドはその個人に関する世代及び栄誉
    の情報を含む世代及び栄誉フィールドであり、そして、
    主張名及びエントリ名の第3フィールドはその個人の個
    人名に関する情報を含む個人名フィールドであることを
    特徴とする請求項2の名前解明方法。
  4. 【請求項4】別名が多数の語から成ることを特徴とする
    請求項3の名前解明方法。
  5. 【請求項5】多数語による個人名が2もしくは3つの語
    をハイフンで結合して成ることを特徴とする請求項4の
    名前解明方法。
  6. 【請求項6】個人名フィールドがその個人の第1名及び
    中間名に関する情報を含むことを特徴とする請求項3の
    名前解明方法。
  7. 【請求項7】個人名フィールドが代替の第1名を含むこ
    とがあることを特徴とする請求項6の名前解明方法。
  8. 【請求項8】個人名フィールドがその個人の第1名及び
    中間名の頭文字を含むことがあることを特徴とする請求
    項6の名前解明方法。
  9. 【請求項9】第1名が多数語から成ることを特徴とする
    請求項6の名前解明方法。
  10. 【請求項10】段階(c)で選択された第1フィールド
    は主張名第1フィールドにおける頭初推測であり、そし
    て、段階(e)は更に、(e1)エントリ名の第1フィ
    ールドを調査し、(e2)エントリ名の第1フィールド
    がもし単一語を含んでおれば対応する計数値を増し、 (e3)エントリ名の第1フィールドがn個の語を含ん
    でおれば、ここでこのnは1よりも大きい値であり、 (e4)主張名第1フィールドにおける頭初推測の語の
    第1語に続く(n−1)個の語をその第1語の接頭語と
    することによって主張名第1フィールドにおける第2の
    推測を形成し、 (e5)主張名第1フィールドにおける第2の推測をエ
    ントリ名の第1フィールドと比較し、 (e6)主張名第1フィールドにおける第2の推測とエ
    ントリ名の第1フィールドとが、もし一致しなければそ
    のセットから他のもう1つのエントリ名を選択して段階
    (e1)戻り、 (e7)主張名第1フィールドにおける第2の推測とエ
    ントリ名の第1フィールドとがもし一致するならば、対
    応する計数値を増加する、このような各段階を有して成
    ることを特徴とする請求項2の名前解明方法。
  11. 【請求項11】主張名及びエントリ名の第2フィールド
    の比較が:(j1)主張名の第2フィールドの各語に対
    して、エントリ名の第2フィールドにおける何れかの位
    置にある同一語に対するエントリ名の第2フィールドを
    調査する段階により実施されることを特徴とする請求項
    2の名前解明方法。
  12. 【請求項12】段階(j)が更に、(j2)主張名及び
    エントリ名の第2フィールドが、順序に無関係に、同一
    の語を正しく含んでいるならば、対応する計数値を増加
    する段階を含むことを特徴とする請求項11の名前解明
    方法。
  13. 【請求項13】段階(o)の主張名及びエントリ名の第
    3フィールドの頭文字の比較が更に: (o1)エントリ名の第3フィールドを、式ir〔−i
    r〕^mに従って形成し、ここでiはハイフンで結ぶ文
    字をもたないエントリ名の第3フィールドのサブストリ
    ングの頭文字であり、rはそのサブストリングの多分o
    部分であり、そして、mはoより大きい整数であり、そ
    して、 (o2)主張名の第3フィールドが、n≦mとした場合
    、i〔i|−i〕^nを形成するかどうかを決定する、
    これらの各段階を有しており、しかも、もし主張名の第
    3フィールドがこの形態であるならば、主張名の第3フ
    ィールドはエントリ名の第3フィールドの頭初形態であ
    り、そして、 (o3)もし主張名の第3フィールドがエントリの第3
    フィールドの頭初形態でなければ、エントリ名の第3フ
    ィールドが主張名の第3フィールドの頭初形態であるか
    どうか決定するためにエントリ名と主張名との第3フィ
    ールドを反転することによって段階(o1)と(o2)
    を繰り返すことを特徴とする請求項2の名前解明方法。
  14. 【請求項14】エントリ名の第3フィールドが代替名を
    含むことができ、しかも段階(p)は更に: (p1)何れかの名前の第3フィールドの語が他の名前
    の短縮形でなければ、このエントリ名の現在の第3フィ
    ールド語に対応する代替名語を選択し、そして、 (p2)このエントリ名の現在の第3フィールド語に対
    応するそれぞれ連続した代替名語に対して段階(m)か
    ら(p)を繰り返し施行する、これらの各段階を有する
    ことを特徴とする請求項2の名前解明方法。
  15. 【請求項15】段階(s)が: (s1)もしも比較スコアが正しく一致スコアに等しけ
    ればその名前分解動作を終結し、その主張名に対応する
    エントリ名として提供し、 (s2)もしもその比較スコアが正確な一致スコアに等
    しくなければそのセットからもう1つのエントリ名を選
    択して段階(e)に戻り、そして、 (s3)このセット内で分解されるエントリ名が更に存
    在しなければこの名前分解を終結し少くともその主張名
    に最も相応しく対応するエントリ名を提供する、これら
    の各段階から成ることを特徴とする請求項2の名前解明
    方法。
  16. 【請求項16】個々の主張名の形態ならびに次の表記順
    序、すなわち、〔個人名フィールド〕、 〔別名フィールド〕、及び 〔世代及び栄誉フィールド〕 から成ることを特徴とする請求項3の名前解明方法。
  17. 【請求項17】主張名から第1フィールドを選択する段
    階(c)が、更に主張名から、何れかのコンマの前の最
    終語を選択し、コンマがない場合は主張名の最終語を選
    択する段階を有することを特徴とする請求項16の名前
    解明方法。
  18. 【請求項18】主張名の第2フィールドを選択する段階
    (i)が:主張名の中のコンマに続く語を選択する段階
    を有することを特徴とする請求項16の名前解明方法。
  19. 【請求項19】主張名の第3フィールドを選択する段階
    (k)が:第1フィールドに先行する主張名の全ての語
    から第3フィールドを構成する段階を含むことを特徴と
    する請求項16の名前解明方法。
JP2405118A 1989-12-22 1990-12-21 データベースの登録簿を探索する方法 Expired - Lifetime JP2638307B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US45546689A 1989-12-22 1989-12-22
US455466 1989-12-22

Publications (2)

Publication Number Publication Date
JPH04137069A true JPH04137069A (ja) 1992-05-12
JP2638307B2 JP2638307B2 (ja) 1997-08-06

Family

ID=23808918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2405118A Expired - Lifetime JP2638307B2 (ja) 1989-12-22 1990-12-21 データベースの登録簿を探索する方法

Country Status (8)

Country Link
US (1) US5333317A (ja)
EP (1) EP0433964B1 (ja)
JP (1) JP2638307B2 (ja)
CN (1) CN1053852A (ja)
AU (1) AU631276B2 (ja)
CA (1) CA2030909A1 (ja)
DE (1) DE69032693T2 (ja)
ES (1) ES2121744T3 (ja)

Families Citing this family (162)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5311586A (en) * 1991-10-31 1994-05-10 At&T Bell Laboratories Dynamic routing-administration
CA2067650C (en) * 1991-07-24 1996-10-22 Eric Jonathan Bauer Method and apparatus for operating a computer-based file system
US5343517A (en) * 1991-10-31 1994-08-30 At&T Bell Laboratories Use-code based call-treatment selection
US5311584A (en) * 1991-10-31 1994-05-10 At&T Bell Laboratories Telecommunications call-processing arrangement
US5289535A (en) * 1991-10-31 1994-02-22 At&T Bell Laboratories Context-dependent call-feature selection
US5333188A (en) * 1991-10-31 1994-07-26 At&T Bell Laboratories Dialed number recognition arrangement
US5329582A (en) * 1991-10-31 1994-07-12 At&T Bell Laboratories Dynamic tone-administration
US5299261A (en) * 1992-02-24 1994-03-29 At&T Bell Laboratories Arrangement for effecting segmentation of a dialed number
US5412714A (en) * 1992-02-24 1995-05-02 At&T Corp. Mnemonic and synonymic addressing in a telecommunications system
US5515534A (en) * 1992-09-29 1996-05-07 At&T Corp. Method of translating free-format data records into a normalized format based on weighted attribute variants
US5446883A (en) * 1992-10-23 1995-08-29 Answer Systems, Inc. Method and system for distributed information management and document retrieval
JPH0798669A (ja) * 1993-08-05 1995-04-11 Hitachi Ltd 分散データベース管理システム
US5689700A (en) * 1993-12-29 1997-11-18 Microsoft Corporation Unification of directory service with file system services
US5724597A (en) * 1994-07-29 1998-03-03 U S West Technologies, Inc. Method and system for matching names and addresses
EP1313036A3 (en) 1994-09-01 2005-04-13 Computer Associates Think, Inc. X.500 System and methods relating to services
US7315860B1 (en) * 1994-09-01 2008-01-01 Computer Associates Think, Inc. Directory service system and method with tolerance for data entry storage and output
AU3734395A (en) * 1994-10-03 1996-04-26 Helfgott & Karas, P.C. A database accessing system
US5617568A (en) * 1994-12-14 1997-04-01 International Business Machines Corporation System and method for supporting file attributes on a distributed file system without native support therefor
US5566328A (en) * 1995-01-23 1996-10-15 Tandem Computers Incorporated Reconstructing directory pathnames from file handles in a computer system
US5724512A (en) * 1995-04-17 1998-03-03 Lucent Technologies Inc. Methods and apparatus for storage and retrieval of name space information in a distributed computing system
US5682524A (en) * 1995-05-26 1997-10-28 Starfish Software, Inc. Databank system with methods for efficiently storing non-uniform data records
US8065338B2 (en) * 1995-08-30 2011-11-22 Computer Associates Think, Inc. Directory searching methods and systems
US5873092A (en) * 1995-12-14 1999-02-16 International Business Machines Corporation Information handling system, method, and article of manufacture including persistent, distributed object name services including shared properties
GB9601925D0 (en) * 1996-01-31 1996-04-03 British Telecomm Database access
US6430596B1 (en) * 1996-03-27 2002-08-06 Intel Corporation Managing networked directory services with auto field population
US5923848A (en) * 1996-05-31 1999-07-13 Microsoft Corporation System and method for resolving names in an electronic messaging environment
US6412017B1 (en) * 1996-07-01 2002-06-25 Microsoft Corporation Urgent replication facility
US5857196A (en) * 1996-07-19 1999-01-05 Bay Networks, Inc. Method for storing a tree of potential keys in a sparse table
US5873078A (en) * 1996-07-19 1999-02-16 Bay Networks, Inc. Radix tree search logic
IL118959A (en) * 1996-07-26 1999-07-14 Ori Software Dev Ltd Database apparatus
US5745898A (en) * 1996-08-09 1998-04-28 Digital Equipment Corporation Method for generating a compressed index of information of records of a database
EP0831631A1 (fr) * 1996-09-18 1998-03-25 Koninklijke Philips Electronics N.V. Procédé de recherche d'une entrée dans un recueil d'informations, et équipement électronique dans lequel un tel procédé est mis en oeuvre
US6647393B1 (en) * 1996-11-22 2003-11-11 Mangosoft Corporation Dynamic directory service
US6401099B1 (en) 1996-12-06 2002-06-04 Microsoft Corporation Asynchronous binding of named objects
US6460058B2 (en) * 1996-12-06 2002-10-01 Microsoft Corporation Object-oriented framework for hyperlink navigation
US5890147A (en) * 1997-03-07 1999-03-30 Microsoft Corporation Scope testing of documents in a search engine using document to folder mapping
US6029169A (en) * 1997-05-01 2000-02-22 Stratum Technologies Corporation Universal software structure for representing model structures
US7631012B2 (en) 1997-05-22 2009-12-08 Computer Associates Think, Inc. System and method of operating a database
US5991758A (en) * 1997-06-06 1999-11-23 Madison Information Technologies, Inc. System and method for indexing information about entities from different information sources
US6065003A (en) * 1997-08-19 2000-05-16 Microsoft Corporation System and method for finding the closest match of a data entry
US6192362B1 (en) * 1997-12-15 2001-02-20 International Business Machines Corporation System and method for creating a search form for accessing directory information
JP4004619B2 (ja) * 1998-01-08 2007-11-07 富士通株式会社 自動在庫引当が可能な在庫管理装置
US6675173B1 (en) 1998-01-22 2004-01-06 Ori Software Development Ltd. Database apparatus
US8812300B2 (en) 1998-03-25 2014-08-19 International Business Machines Corporation Identifying related names
US8855998B2 (en) 1998-03-25 2014-10-07 International Business Machines Corporation Parsing culturally diverse names
US6963871B1 (en) * 1998-03-25 2005-11-08 Language Analysis Systems, Inc. System and method for adaptive multi-cultural searching and matching of personal names
US20050119875A1 (en) * 1998-03-25 2005-06-02 Shaefer Leonard Jr. Identifying related names
DE60002835T2 (de) * 1999-02-01 2004-03-11 Honeywell International Inc. Verfahren und vorrichtung zur erzeugung einer bodennäherungswarnung und computerprogramm zum kontrollierten verändern der basisbreite einer alarmhülle
FI991261A (fi) * 1999-06-02 2000-12-03 Nokia Networks Oy Trie-rakenteeseen perustuva funktionaalinen muisti
US6529892B1 (en) 1999-08-04 2003-03-04 Illinois, University Of Apparatus, method and product for multi-attribute drug comparison
US7904317B1 (en) * 1999-10-14 2011-03-08 The TriZetto Group Method and apparatus for repricing a reimbursement claim against a contract
US6532476B1 (en) * 1999-11-13 2003-03-11 Precision Solutions, Inc. Software based methodology for the storage and retrieval of diverse information
AUPQ428499A0 (en) 1999-11-26 1999-12-23 Computer Associates Pty. Ltd. A method and apparatus for operating a data base
KR100856149B1 (ko) * 1999-11-26 2008-09-03 네테카 인코포레이티드 전자 메일 서버 및 전자 메일 통신을 용이하게 하기 위한 방법
CA2312540A1 (en) * 2000-06-27 2001-12-27 Neteka Inc. Network address name resolution server
US6879959B1 (en) * 2000-01-21 2005-04-12 Quality Care Solutions, Inc. Method of adjudicating medical claims based on scores that determine medical procedure monetary values
US6675370B1 (en) * 2000-02-02 2004-01-06 International Business Machines Corporation System and method for imbedding hyperlinked language grammar notation in a “literate” programming environment
US6952805B1 (en) * 2000-04-24 2005-10-04 Microsoft Corporation System and method for automatically populating a dynamic resolution list
JP2001337980A (ja) * 2000-05-29 2001-12-07 Sony Corp 電子番組ガイド検索方法及び電子番組ガイド検索装置
US6948135B1 (en) 2000-06-21 2005-09-20 Microsoft Corporation Method and systems of providing information to computer users
US7191394B1 (en) 2000-06-21 2007-03-13 Microsoft Corporation Authoring arbitrary XML documents using DHTML and XSLT
US7155667B1 (en) 2000-06-21 2006-12-26 Microsoft Corporation User interface for integrated spreadsheets and word processing tables
US7346848B1 (en) 2000-06-21 2008-03-18 Microsoft Corporation Single window navigation methods and systems
AU2001264895A1 (en) 2000-06-21 2002-01-02 Microsoft Corporation System and method for integrating spreadsheets and word processing tables
US7000230B1 (en) 2000-06-21 2006-02-14 Microsoft Corporation Network-based software extensions
US7117435B1 (en) 2000-06-21 2006-10-03 Microsoft Corporation Spreadsheet fields in text
US6874143B1 (en) 2000-06-21 2005-03-29 Microsoft Corporation Architectures for and methods of providing network-based software extensions
US6883168B1 (en) 2000-06-21 2005-04-19 Microsoft Corporation Methods, systems, architectures and data structures for delivering software via a network
US7624356B1 (en) 2000-06-21 2009-11-24 Microsoft Corporation Task-sensitive methods and systems for displaying command sets
US6556991B1 (en) * 2000-09-01 2003-04-29 E-Centives, Inc. Item name normalization
AU2002225659A1 (en) 2000-11-21 2002-06-03 Myhealthbank, Inc. Health plan management method and apparatus
US6804677B2 (en) * 2001-02-26 2004-10-12 Ori Software Development Ltd. Encoding semi-structured data for efficient search and browsing
US6625600B2 (en) 2001-04-12 2003-09-23 Telelogue, Inc. Method and apparatus for automatically processing a user's communication
WO2003012685A2 (en) * 2001-08-03 2003-02-13 Tristlam Limited A data quality system
US6944610B2 (en) * 2001-10-31 2005-09-13 Bellsouth Intellectual Property Corporation System and method for searching heterogeneous electronic directories
US20030149566A1 (en) * 2002-01-02 2003-08-07 Esther Levin System and method for a spoken language interface to a large database of changing records
US7287033B2 (en) 2002-03-06 2007-10-23 Ori Software Development, Ltd. Efficient traversals over hierarchical data and indexing semistructured data
JP2003271656A (ja) * 2002-03-19 2003-09-26 Fujitsu Ltd 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
US6691103B1 (en) 2002-04-02 2004-02-10 Keith A. Wozny Method for searching a database, search engine system for searching a database, and method of providing a key table for use by a search engine for a database
US7415672B1 (en) 2003-03-24 2008-08-19 Microsoft Corporation System and method for designing electronic forms
US7275216B2 (en) 2003-03-24 2007-09-25 Microsoft Corporation System and method for designing electronic forms and hierarchical schemas
US7370066B1 (en) 2003-03-24 2008-05-06 Microsoft Corporation System and method for offline editing of data files
US7913159B2 (en) 2003-03-28 2011-03-22 Microsoft Corporation System and method for real-time validation of structured data files
US7296017B2 (en) 2003-03-28 2007-11-13 Microsoft Corporation Validation of XML data files
US7516145B2 (en) 2003-03-31 2009-04-07 Microsoft Corporation System and method for incrementally transforming and rendering hierarchical data files
US7168035B1 (en) 2003-06-11 2007-01-23 Microsoft Corporation Building a view on markup language data through a set of components
US7451392B1 (en) 2003-06-30 2008-11-11 Microsoft Corporation Rendering an HTML electronic form by applying XSLT to XML using a solution
US7197515B2 (en) 2003-06-30 2007-03-27 Microsoft Corporation Declarative solution definition
US7406660B1 (en) 2003-08-01 2008-07-29 Microsoft Corporation Mapping between structured data and a visual surface
US7581177B1 (en) 2003-08-01 2009-08-25 Microsoft Corporation Conversion of structured documents
US7334187B1 (en) 2003-08-06 2008-02-19 Microsoft Corporation Electronic form aggregation
US8819072B1 (en) 2004-02-02 2014-08-26 Microsoft Corporation Promoting data from structured data files
US7430711B2 (en) 2004-02-17 2008-09-30 Microsoft Corporation Systems and methods for editing XML documents
US7318063B2 (en) 2004-02-19 2008-01-08 Microsoft Corporation Managing XML documents containing hierarchical database information
US20070005586A1 (en) * 2004-03-30 2007-01-04 Shaefer Leonard A Jr Parsing culturally diverse names
US7496837B1 (en) 2004-04-29 2009-02-24 Microsoft Corporation Structural editing with schema awareness
US7568101B1 (en) 2004-05-13 2009-07-28 Microsoft Corporation Digital signatures with an embedded view
US7281018B1 (en) 2004-05-26 2007-10-09 Microsoft Corporation Form template data source change
US7774620B1 (en) 2004-05-27 2010-08-10 Microsoft Corporation Executing applications at appropriate trust levels
US7692636B2 (en) 2004-09-30 2010-04-06 Microsoft Corporation Systems and methods for handwriting to a screen
US7516399B2 (en) 2004-09-30 2009-04-07 Microsoft Corporation Structured-document path-language expression methods and systems
US8768729B2 (en) 2004-10-14 2014-07-01 Trizetto Corporation System and method for using a first electronic representation of contract terms for generating a second electronic representation of the contract terms
US8487879B2 (en) 2004-10-29 2013-07-16 Microsoft Corporation Systems and methods for interacting with a computer through handwriting to a screen
US7712022B2 (en) 2004-11-15 2010-05-04 Microsoft Corporation Mutually exclusive options in electronic forms
US7584417B2 (en) 2004-11-15 2009-09-01 Microsoft Corporation Role-dependent action for an electronic form
US8161020B2 (en) * 2004-11-15 2012-04-17 Zi Corporation Of Canada, Inc. Searching for and providing objects using byte-by-byte comparison
US7721190B2 (en) 2004-11-16 2010-05-18 Microsoft Corporation Methods and systems for server side form processing
US7509353B2 (en) 2004-11-16 2009-03-24 Microsoft Corporation Methods and systems for exchanging and rendering forms
US7904801B2 (en) 2004-12-15 2011-03-08 Microsoft Corporation Recursive sections in electronic forms
US7437376B2 (en) 2004-12-20 2008-10-14 Microsoft Corporation Scalable object model
US7937651B2 (en) 2005-01-14 2011-05-03 Microsoft Corporation Structural editing operations for network forms
US7725834B2 (en) 2005-03-04 2010-05-25 Microsoft Corporation Designer-created aspect for an electronic form template
US8010515B2 (en) 2005-04-15 2011-08-30 Microsoft Corporation Query to an electronic form
US7543228B2 (en) 2005-06-27 2009-06-02 Microsoft Corporation Template for rendering an electronic form
US8200975B2 (en) 2005-06-29 2012-06-12 Microsoft Corporation Digital signatures for network forms
US7613996B2 (en) 2005-08-15 2009-11-03 Microsoft Corporation Enabling selection of an inferred schema part
US20070174339A1 (en) * 2005-09-07 2007-07-26 Kolo Brian A System and method for determining personal genealogical relationships and geographical origins including a relative confidence
US20070218429A1 (en) * 2005-09-07 2007-09-20 Kolo Brian A System and method for determining personal genealogical relationships and geographical origins
US8001459B2 (en) 2005-12-05 2011-08-16 Microsoft Corporation Enabling electronic documents for limited-capability computing devices
US7779343B2 (en) 2006-01-30 2010-08-17 Microsoft Corporation Opening network-enabled electronic documents
US20070239735A1 (en) * 2006-04-05 2007-10-11 Glover Eric J Systems and methods for predicting if a query is a name
US7526486B2 (en) 2006-05-22 2009-04-28 Initiate Systems, Inc. Method and system for indexing information about entities with respect to hierarchies
US20080033750A1 (en) * 2006-06-02 2008-02-07 The Trizetto Group, Inc. Enhanced systems and methods for processing of healthcare information
WO2007143157A2 (en) 2006-06-02 2007-12-13 Initiate Systems, Inc. Automatic weight generation for probabilistic matching
US20080065621A1 (en) * 2006-09-13 2008-03-13 Kenneth Alexander Ellis Ambiguous entity disambiguation method
US8234379B2 (en) * 2006-09-14 2012-07-31 Afilias Limited System and method for facilitating distribution of limited resources
US7685093B1 (en) 2006-09-15 2010-03-23 Initiate Systems, Inc. Method and system for comparing attributes such as business names
US7698268B1 (en) 2006-09-15 2010-04-13 Initiate Systems, Inc. Method and system for filtering false positives
US8356009B2 (en) 2006-09-15 2013-01-15 International Business Machines Corporation Implementation defined segments for relational database systems
EP2078279A4 (en) * 2006-10-24 2011-09-28 Afilias Ltd SUPPLY CHAIN SERVICES DISCOVERY
US8006190B2 (en) * 2006-10-31 2011-08-23 Yahoo! Inc. Social namespace addressing for non-unique identifiers
US8599801B2 (en) * 2007-02-01 2013-12-03 Yahoo! Inc. Collecting implicit information for determining context of event actions
US8359339B2 (en) 2007-02-05 2013-01-22 International Business Machines Corporation Graphical user interface for configuration of an algorithm for the matching of data records
US8370349B2 (en) * 2007-02-28 2013-02-05 Yahoo! Inc. Instant contact searching and presentation by category
US8515926B2 (en) * 2007-03-22 2013-08-20 International Business Machines Corporation Processing related data from information sources
US8370355B2 (en) 2007-03-29 2013-02-05 International Business Machines Corporation Managing entities within a database
WO2008121824A1 (en) 2007-03-29 2008-10-09 Initiate Systems, Inc. Method and system for data exchange among data sources
WO2008121170A1 (en) * 2007-03-29 2008-10-09 Initiate Systems, Inc. Method and system for parsing languages
US8423514B2 (en) 2007-03-29 2013-04-16 International Business Machines Corporation Service provisioning
CN101884039B (zh) 2007-09-28 2013-07-10 国际商业机器公司 将多种语言的数据记录相关联的方法和系统
US8713434B2 (en) 2007-09-28 2014-04-29 International Business Machines Corporation Indexing, relating and managing information about entities
CN101878461B (zh) 2007-09-28 2014-03-12 国际商业机器公司 分析用于匹配数据记录的系统的方法和系统
KR20160078511A (ko) * 2008-03-10 2016-07-04 아필리어스 리미티드 플랫폼 독립적인 idn 이메일 저장소 변환
US10552391B2 (en) * 2008-04-04 2020-02-04 Landmark Graphics Corporation Systems and methods for real time data management in a collaborative environment
EP2131293A1 (en) 2008-06-03 2009-12-09 Alcatel Lucent Method for mapping an X500 data model onto a relational database
US9910875B2 (en) * 2008-12-22 2018-03-06 International Business Machines Corporation Best-value determination rules for an entity resolution system
KR101755365B1 (ko) 2009-11-13 2017-07-10 아브 이니티오 테크놀로지 엘엘시 레코드 포맷 정보의 관리
CN101727441B (zh) * 2009-12-25 2012-02-01 北京工业大学 一种面向中文人名识别系统的评测方法及评测系统
US8819148B2 (en) * 2010-03-10 2014-08-26 Afilias Limited Alternate E-mail delivery
US8756075B1 (en) 2011-05-18 2014-06-17 Trizetto Corporation System and method for processing payment bundles
US8706723B2 (en) * 2011-06-22 2014-04-22 Jostle Corporation Name-search system and method
US10296976B1 (en) 2011-09-23 2019-05-21 Cognizant Trizetto Software Group, Inc. System and method for calculating estimated payment based on partial coding data
US10318923B1 (en) 2012-08-01 2019-06-11 Cognizant Trizetto Software Group, Inc. Payment assurance and claim pre-validation
US20150227690A1 (en) * 2014-02-12 2015-08-13 Xerox Corporation System and method to facilitate patient on-boarding
US20160132830A1 (en) * 2014-11-12 2016-05-12 Adp, Llc Multi-level score based title engine
US10148662B1 (en) * 2015-01-21 2018-12-04 EMC IP Holding Company LLC De-duplication of access control lists
US10650020B1 (en) 2015-09-17 2020-05-12 Trifacta Inc. Analyzing transformations for preprocessing datasets
CN105373530A (zh) * 2015-12-03 2016-03-02 北京锐安科技有限公司 中文姓名的识别方法和装置
US10275450B2 (en) * 2016-02-15 2019-04-30 Tata Consultancy Services Limited Method and system for managing data quality for Spanish names and addresses in a database
CN110597800A (zh) * 2018-05-23 2019-12-20 杭州海康威视数字技术股份有限公司 一种注释信息确定、前缀树构建方法及装置
JP7183600B2 (ja) 2018-07-20 2022-12-06 株式会社リコー 情報処理装置、システム、方法およびプログラム
CN109784721B (zh) * 2019-01-15 2021-01-26 广东度才子集团有限公司 一种就业数据分析与数据挖掘分析的平台系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4382277A (en) * 1979-05-14 1983-05-03 System Development Corp. Method and means utilizing multiple processing means for determining degree of match between two data arrays
US4384325A (en) * 1980-06-23 1983-05-17 Sperry Corporation Apparatus and method for searching a data base using variable search criteria
US4422158A (en) * 1980-11-28 1983-12-20 System Development Corporation Method and means for interrogating a layered data base
EP0054588B1 (en) * 1980-12-19 1984-09-26 International Business Machines Corporation Interactive data retrieval apparatus
US4453217A (en) * 1982-01-04 1984-06-05 Bell Telephone Laboratories, Incorporated Directory lookup method and apparatus
US4674066A (en) * 1983-02-18 1987-06-16 Houghton Mifflin Company Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
US4823306A (en) * 1987-08-14 1989-04-18 International Business Machines Corporation Text search system

Also Published As

Publication number Publication date
AU6696790A (en) 1991-06-27
DE69032693T2 (de) 1999-07-22
ES2121744T3 (es) 1998-12-16
EP0433964A3 (en) 1993-03-31
CN1053852A (zh) 1991-08-14
CA2030909A1 (en) 1991-06-23
AU631276B2 (en) 1992-11-19
EP0433964B1 (en) 1998-10-07
DE69032693D1 (de) 1998-11-12
US5333317A (en) 1994-07-26
EP0433964A2 (en) 1991-06-26
JP2638307B2 (ja) 1997-08-06

Similar Documents

Publication Publication Date Title
JPH04137069A (ja) データベースの登録簿を探索する方法
US5148541A (en) Multilingual database system including sorting data using a master universal sort order for all languages
US6278992B1 (en) Search engine using indexing method for storing and retrieving data
JP3479877B2 (ja) 個別化ナビゲーション・ツリー構築方法
US7756859B2 (en) Multi-segment string search
US6560596B1 (en) Multiscript database system and method
US6728705B2 (en) System and method for selecting content for displaying over the internet based upon some user input
US20060173813A1 (en) System and method of providing ad hoc query capabilities to complex database systems
US7783660B2 (en) System and method for enhanced text matching
JPH06268715A (ja) トークン識別システム
JP2007535741A (ja) データベースアクセスのための2段階データ検証およびマッピング
US6430557B1 (en) Identifying a group of words using modified query words obtained from successive suffix relationships
US6970880B2 (en) System and method for creating and maintaining data records to improve accuracy thereof
US6691103B1 (en) Method for searching a database, search engine system for searching a database, and method of providing a key table for use by a search engine for a database
JPH09179872A (ja) 有限状態トランスデューサを用いてデータベースのインデックス付けを行う方法及び装置
CN110119404B (zh) 一种基于自然语言理解的智能取数系统及其方法
US9509757B2 (en) Parallel sorting key generation
US8682644B1 (en) Multi-language sorting index
KR100434718B1 (ko) 문서 색인 시스템 및 그 방법
US8745030B2 (en) Fast searching of directories
KR100440906B1 (ko) 문서 색인 시스템 및 그 방법
JPS60129873A (ja) 文書保管検索システム
KR100675161B1 (ko) 이동단말기를 이용한 검색 및 저장 방법
JPS6261118A (ja) 木構造インデクスの検索方式
JP2002063202A (ja) 情報検索システムおよび方法