JP3252104B2 - エンティティの一覧中に発見された所与のエンティティにマッチするものを等級分けする方法 - Google Patents

エンティティの一覧中に発見された所与のエンティティにマッチするものを等級分けする方法

Info

Publication number
JP3252104B2
JP3252104B2 JP23533197A JP23533197A JP3252104B2 JP 3252104 B2 JP3252104 B2 JP 3252104B2 JP 23533197 A JP23533197 A JP 23533197A JP 23533197 A JP23533197 A JP 23533197A JP 3252104 B2 JP3252104 B2 JP 3252104B2
Authority
JP
Japan
Prior art keywords
match
entity
attributes
attribute
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP23533197A
Other languages
English (en)
Other versions
JPH1153435A (ja
Inventor
エス. グスタフソン エリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DUN&BRADSTREET, INC
Original Assignee
DUN&BRADSTREET, INC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DUN&BRADSTREET, INC filed Critical DUN&BRADSTREET, INC
Priority to JP23533197A priority Critical patent/JP3252104B2/ja
Publication of JPH1153435A publication Critical patent/JPH1153435A/ja
Application granted granted Critical
Publication of JP3252104B2 publication Critical patent/JP3252104B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベースの利
用法に関し、特に多数の企業実体(ビジネスエンティテ
ィ)に関する情報を含むデータベース中において所与の
企業実体にマッチするものを発見するように構成された
方法に関するものである。
【0002】
【従来の技術】上述のタイプのシステムは、良く知られ
ている。例えば、信用業界では、信用の対象として考え
られている所定の企業実体に関する信用履歴情報は、ダ
ン・アンド・ブラッドストリート・データベース(Dun
& Bradstreet database)等の商用データベースを通じ
て処理される。利用者は、企業実体の名称をデータベー
スに接続されたプロセッサに入力することにより、この
与えられた企業実体の場所をデータベース中で特定し、
その信用履歴情報を取り出すことができる。この後、こ
の信用履歴情報は、この与えられた企業実体に対する信
用を認めるか、それとも差し控えるかに関する決定を行
うために使用される。
【0003】簡単な例として、利用者がXYZ社に掛け
売りを行うことについて関心がある場合を考える。ここ
で、XYZ社は、ある特定の市の特定の住所に位置して
いる。XYZ社は、「所与の企業実体」、すなわち「所
与のエントリ」である。利用者がこの識別情報を入力す
ると、データベースが検索され、同一市内の異なる住所
に位置するXYZ社に関するエントリがデータベースか
ら特定される。この後、この特定されたXYZ社が与え
られた企業実体XYZ社と同じであるかどうかについて
判定を行わなければならない。この判定の結果、両者が
同じということであれば、この特定されたXYZ社に関
するデータベースからの信用情報は、与えられた企業実
体との取引に関する信用決定をする際に使用される。
【0004】このようなデータベースシステムは、上述
のような信用業界の利用例に限らず、広範な利用例を有
している。他の例では、卸売流通企業実体が、製品情報
文書を定期的に配布して企業実体に小売をする場合もあ
る。これらの文書に関する費用は、安価な製品パンフレ
ット(例えば、一部50セント)から比較的高価な製品
カタログ(例えば、一部5.00ドル)まで幅がある場
合がある。これらの製品情報文書は多量に配布されるこ
とから、費用を節約するため、卸売流通企業実体は、比
較的高価なカタログを高い販売量を有する小売業者宛に
送り、比較的安価なパンフレットを販売量の低い小売業
者宛に送ることを希望する場合がある。このような利用
例では、データベースシステムは、信用履歴情報とは対
照的に、ある企業実体に関する販売情報を確認するため
にアクセスされる。
【0005】後述の説明から明らかになるように、本発
明は、前述の2つの利用例を含む広範囲の利用において
有用である。しかし、本発明の概念および内容をうまく
説明するため、以下で挙げる例は、上記の信用業界の利
用例にほぼ焦点を合わせている。
【0006】企業実体は、通常、属性と呼ぶことのでき
るものによりデータベース中に列挙される。最も一般的
な属性は、企業実体を特定するもの、例えば企業名や所
在地、である。所在地は、多数の属性に分割することが
できる。このような属性には、ストリート番号、ストリ
ート名、私書箱番号、市、町等、州(米国内にある場
合)または国、電話番号が含まれる。これらは、企業実
体に関する情報を伝える多数の商用データベース中に見
られる共通の属性である。しかしながら、時には、他の
属性も利用される。
【0007】このような企業実体の一覧において所与の
企業実体にマッチするものを発見することが望まれる場
合、列挙情報中の不一致がマッチング問題を生み出すこ
とがある。ある例では、データベース自身に記憶された
誤りのある情報から不一致が生じることがある。また、
マッチを望む人が所定の企業実体を特定する際に入力さ
れた誤りのある情報から不一致が生じることもある。別
の例では、単に、ある属性を特定するために使用された
異なるスタイル(例えば、省略形)のために不一致が生
じる場合がある。
【0008】信用調査部は、通常、データベースをダイ
アル呼び出しして信用情報を得る手続きを行う。通常、
特定するプロセスは、比較的簡単であり、自動的に実行
することが可能である。しかしながら、指定用の名称や
住所のスタイルが異なること、および収集情報には多数
の人間により様々な注意が払われていることにより、与
えられた企業実体とデータベース中の可能性のある突き
合わせ用企業実体との相関は、常に正確にマッチするわ
けではない。この場合、信用を認めるか或いは見送るか
の最終決定が可能になる前に、一つ以上の特定済み企業
実体のうちのどれが与えられた企業実体とマッチするの
かに関する中間決定をするために、しばしば人間の介入
が必要となる。適切な中間確認は、巨額の取引では特に
重要である。人間の介入には、通常、正しいマッチに関
してその場で判断したり、あるいは与えられた企業実体
を調査または確認するために再度電話をかけることが含
まれる。
【0009】与えられた企業実体が本物であるかどうか
を確認するために必要な時間量、およびこれらの決定を
行う人間(例えば、調査部長や事務員)に関する費用を
考えれば、信用承認手続におけるこの幾分世俗的な段階
が、大量のドル資産を消費する可能性があることが分か
る。実際、このような信用決定が多数行われる状況で
は、妥当と認められるリスク(すなわち、信頼できるマ
ッチがなされるもの)を分離させ、人間が介入する必要
なくこのようなリスクに信用を認めることが商用可能で
あると分かる。
【0010】企業実体の膨大な編集物(compilation)
または一覧中の任意に与えられた企業実体に対する「最
適なマッチ」を決定する一般的に利用可能なプロセスお
よび手続き、ならびに市販のソフトウェアパッケージが
存在している。例えば、サウンデックス(Soundex)と
して知られるシステムは有名である。このシステムは、
似たように聞こえるが綴りの異なる言葉を発見するため
に長い間使用されてきた。同様に、アドマッチ(AdMatc
h)として知られるシステムは、ベースアドレスを用い
て人間が適切な1970の国勢調査地域を発見するのを
補助するために使用された。
【0011】信用業界では、信用調査機関が前述のよう
なシステムを用いて、可能性のある突合せ用企業実体の
一覧を特定し、特定された各企業実体に対する特定用属
性(名称、住所、都市、その他)のマッチを採点する。
特に、自動化マッチングシステムを利用することが可能
である。このシステムは、与えられたエントリをパーズ
し、正規化し、更に処理して、高い確率でマッチするも
のを特定する。また、これらのシステムは、点数のよう
な属性ごとの情報を提供して、各属性のマッチの信頼度
を表すことができる。このため、利用者は、名称が正確
に一致して点数100%を有しており、ストリートアド
レスが点数63%を有し、町が79%を有し、電話番号
が記入なしの状態にあるいう試行マッチに直面する可能
性がある。しかし、普通は、再度、人間の介入が必要と
なる。これは、信用データベースによって提供された情
報が与えられた企業実体の特徴と実際にマッチするかど
うかを判定するためには、調査部長、事務員、あるいは
他の適切な人員がエントリ、点数、および要求の全背景
を調べなければならないからである。
【0012】より高性能なシステムも知られている。こ
のシステムでは、個々の属性点数は、合成点数を作成す
るため、経験データに基づく係数によって重み付けされ
ている。これらのシステムは、従来あまり有効でなく、
また、通常、プログラマが重み係数を継続的に調整して
新たな状況に適応させている。追加の経験データが集め
られるにつれて、重み付けアルゴリズムは更に改良され
る。このように、重み付け関数またはアルゴリズムは、
絶えず変化するデバイスであることが分かる。残念なが
ら、新規に調整された重み係数は、新たな状況にうまく
適応することができるが、しばしば他の演算に予期せぬ
悪影響を及ぼすので、正確な突合せという課題は依然と
して残っている。
【0013】信用承諾プロセスを更に自動化および改善
することによって大幅な費用節減を達成することがで
き、これにより、人間が個人的に関与する必要が低減、
あるいは除去される。
【0014】
【発明が解決しようとする課題】上記に鑑み、本発明
は、所与のエンティティをエンティティの膨大な一覧か
ら選択する際に必要となる人間の介入量を最小にするこ
とを全体的な目的としている。
【0015】本発明の他の目的は、所与のエンティティ
とデータベースから選択されたエンティティとの間のマ
ッチ全体に対する信頼度指標を自動的に提供することに
よって信用承諾プロセスをさらに合理化することであ
る。
【0016】このことに関して、本発明は、個々の属性
マッチング点数を合成点数に変換し、この点数に対する
信頼度指標を生成することを目的としている。
【0017】全体として、本発明の目的は、判断が必要
な状況に対して信用を承諾する際の人間の判断という限
られた資産および費用を維持し、自動突合せシステムが
精度に関して統計学的に高い信頼度水準を有するような
自動承諾可能な取引を特定することである。
【0018】
【課題を解決するための手段】上述の目的および他の目
的を達成するため、本発明は、情報を自動的に、かつ人
間の介入なしに利用および評価して、所与のエンティテ
ィを多数のエンティティを含む大規模なデータベースか
ら選択する方法を全体として指向している。本発明は、
データベース中に記憶された各エンティティが複数の属
性、例えば名称、住所、電話番号など、によって識別さ
れるシステムと共に動作することが意図されており、こ
のシステムは、密接にマッチするエンティティの同一性
を示すため、所与のエンティティの属性とデータベース
内に記憶されたエンティティの属性とを突き合わせるよ
うに動作する。更に、このシステムは、各属性に対して
点数を与え、これらの属性の各々のマッチの品質または
精度を示す。本発明の方法は、これら複数(n個)の各
属性の各点数に等級を割り当てる。この等級は、少数の
可能な等級から選択され、少なくとも、明らかなマッ
チ、明らかなミスマッチ、およびマッチの可能性ありを
区別する。この後、n個の属性に対してこれらの等級が
集められ、密接にマッチしているエンティティとして特
定されたエンティティの各々に対してキーが形成され
る。本方法は、この後、各キーを用いてメモリにアクセ
スし、マッチ指標、すなわち信頼度指標を作成する。こ
の指標は、特定のエンティティに対するマッチの全体的
な品質を表している。メモリ内に記憶されるこのマッチ
指標は、同一または類似のキーに対する試験マッチから
求められた同一または類似の等級キーに関する経験情報
に基づいている。
【0019】本発明の重要な特徴は、人間の介入および
人間の判断力の行使の必要性を大きく削減することであ
る。一例では、本発明は、特定のマッチに対する信頼度
コードに基づいて、自動的に信用を承諾または拒否する
ことにより、信用承諾/拒否プロセスの自動化を容易に
する。この事に関連して、特定された複数のエンティテ
ィのうちどれが与えられたエンティティとマッチするか
に関する中間決定を行うために、しきい信頼度コードが
用いられる。このしきい値は、要求された取引のタイプ
と規模に大きく依存するように設定されるのが好まし
い。例えば、少額のドル取引では、しきい信頼度コード
は、高額のドル取引よりも小さい。
【0020】
【発明の実施の形態】上述のように、信用調査機関は、
属性を特定することによって記憶および参照される複数
の企業実体からなるコンピュータデータベースを保持し
ている。最も一般的な属性は、企業実体の名称、住所、
及び電話番号を表す。本発明では、企業実体名、ストリ
ート番号、ストリート名、私書箱番号、都市及び/又は
郵便番号、州(アメリカ合衆国内にある場合)又は国、
並びに電話番号を使用するのが好適である。もちろん、
他の属性として、例えば、法人設立の州、およその雇用
者数、一般的に受容されている標準コード化形式を用い
た製造またはサービス組織コードなどが含まれていても
良い。
【0021】記憶された複数の企業実体からなるデータ
ベース中で所定の企業実体を検索していると、識別の不
一致がしばしば起こる。各属性は、通常、入力された情
報を有しているが、記憶されている属性に対して情報が
割り当てられない場合もある。別の例では、利用者が、
会社名や会社の郵便宛先のような必要な情報しか有さ
ず、電話番号に関する情報を有さない場合がある。また
別の例では、入力された電話番号が、所定の企業実体の
一般電話番号ではなく特定の直通内線番号に一致してい
る場合があり、これにより電話番号属性がマッチしない
場合がある。異常が起こりうる別の部分は、ストリート
名にある。例えば、ストリートアドレスにおける“Roa
d”又は“Rd.”の選択である。会社名を記録する際に用
いられる形式も、問題も生じさせる(例えば“Co.”と
“Corp.”)。
【0022】ここまで本発明の一般的な背景を説明して
きたが、以下では、図面を参照することにする。ここ
で、図1は、本発明の広範な概念を実現する際の主要な
段階を示すフローチャートである。すなわち、企業実体
を表す複数の属性を取得するステップ、企業実体のデー
タベースを検索するステップ、可能性の高い突合せ用企
業実体を一つ以上特定するステップ、及び正確なマッチ
である確率を表す信頼度指標を導出するステップであ
る。
【0023】好適な属性の一覧が、参照番号10によっ
て示されるブロック中に挙げられている。別の属性(上
述したようなもの)を追加したり、より少数の属性を使
用したり、異なる属性を使用しても良い。これらの属性
は、ここで説明する本発明によって達成される極めて有
効な照合率を依然として維持する。例えば、都市属性、
ストリート名属性、および郵便番号属性に対して得られ
るマッチング点数は、正確にマッチするものを確実に特
定するために十分なものであり、これにより州コードま
たは国コードを落とすことができる。同様に、効果的な
パージング及び正規化ルーチンを用いれば、企業実体
名、ストリート、および電話番号は、正確な結果を与え
るのに十分な属性である。別の予想される実施形態で
は、他の属性を現在の属性と置き換えること、例えば法
人設立州属性を州または国属性に置き換えることが望ま
れる場合もある。ここで説明し特許を請求する本発明の
概念は、特定の属性や特定数の属性に縛られるものでは
なく、前述の及び他の類似した状況の全てに適用され
る。
【0024】与えられたエントリの個々の属性の採点が
可能になる前に、与えられた企業実体の特定の属性とデ
ータベース中の企業実体の対応する属性とのマッチの品
質または可能性を等級付けするため、入力された各属性
はステップ12で前処理される。種々の技術が知られて
おり、属性を前処理するために過去使用されてきた。本
発明の方法ステップに先行して幾つかの技術が好適に実
施されており、したがって、種々の既知の技術の完璧な
説明はここでは行わない。
【0025】通常、前処理ステップは、「トークン」と
呼ばれることのある語に文字列をパーズすることから始
まる。この後、標準化ルーチン及び正規化ルーチンが実
行され、省略形の不一致を低減または除去する。標準化
プロセスでは、適当なときに、パーズされた各語が検討
され、工業規格の同義語に置き換えられる。例えば、
“Street”は、“St.”のようなあらかじめ定められた
表記に標準化される。“Connecticut”または “Con.”
は、“CT”に標準化される。郵便局は、特に宛先指定規
則に関する用語標準化の背後の推進力であった。正規化
プロセスは、非工業規格語を一定の共通形式に変換する
ことに関連することを除いて、標準化プロセスに非常に
似ている。たとえば、“manufacturing”という語(お
よびこの語の種々の形態)は、“mfg”に変換される。
また、正規化プロセスは、音声学を用いても良い。ここ
で、音声学は、母音および“ing”のような特定文字群
を除去する。この標準化及び正規化プロセス中、“a”
や“and”のような「雑音」語が消去され、雑多な句読
点は、全ての句読点を取り除くか、あるいは一貫した形
式で残すことにより処理される。さらに、この正規化ル
ーチンは、全ての文字を大文字または小文字に変換して
もよい。
【0026】いくつかの実施形態では、前処理ステップ
12は、辞書(lexicon)を用いて属性の標準化および
正規化を補助することも可能である。与えられたエント
リの属性を前処理する際に使用された同じルーチンが、
データベース上に保持される全てのエントリの最初の入
力および記憶中にも利用されることが好適である。この
ように一貫した前処理ルーチンを利用することにより、
データが多様なスタイルおよび省略形を用いて入力され
る場合でさえマッチをより正確に判断することが容易に
なる。これは、特定の企業実体の名称または住所を識別
するときに期待することができる。
【0027】次の広範なステップは、データベースを検
索して、可能性のある又は可能性の高い突合せ用エント
リの一覧を作成するステップである(ステップ14)。
巨大なエントリの一覧を検索して、与えられたエントリ
に対するマッチを位置決めするという問題を扱う方法
は、膨大な数にのぼる。この目的のために、“突合せキ
ー(Matchkey)”検索を用いてこのステップを達成する
ことができる。突合せキー検索は周知であり、一般に、
複数の属性から数個の文字を組み合わせて単一の突合せ
キーを作成することにより機能する。この突合せキー
は、この後、データベースエントリから形成された同様
の突合せキーと比較される。この点を説明するため、本
発明に関する突合せキーは、企業実体名からの最初の5
文字、ストリート名からの最初の4文字、および郵便番
号からの最初の3桁を集めることにより形成する場合が
ある。この集合体は、与えられた企業実体、および比較
のための各データベース企業実体から形成されることに
なる。所与の企業実体の突合せキーに一致する突合せキ
ーを有している全てのデータベースエントリは、マッチ
の可能性があるものと特定される。
【0028】検索ステップ14が完了した後、プロセッ
サは、各属性に点数または等級を割り当てる。この点数
は、与えられた企業実体からの特定の属性と特定済み企
業実体からの特定の属性との間のマッチの品質を表す統
計学的に生成された数値である。この数値が高いほどマ
ッチは密接であり、100は正確なマッチを表してい
る。好ましくは、与えられたエントリの各属性は、全て
の特定済みエントリの各属性と連続的に比較され、特定
の企業実体の各属性に対する点数が生成される。この統
計的比較を行うことのできる種々のアルゴリズムが知ら
れている。
【0029】上記の説明の中で述べたように、ある形式
の企業実体特定および属性採点を達成するシステムが知
られているが、本発明は、その結果を実現する特定の方
法またはアプローチに限定されるものではない。実際、
本発明の方法は、属性の点数を処理して信頼度指標を定
式化することに関する。この信頼度指標は、与えられた
企業実体と企業実体の巨大な一覧から特定された企業実
体とのマッチの全体的な品質を反映している。本発明の
幅広い概念を説明するため、以下では図2を参照する。
【0030】参照番号20は、企業実体を特定するため
に好んで使用される属性を列挙した表を示している。各
属性の隣には、各属性に割り当てられ、その属性に関す
るマッチ品質を表す点数がある。上述のように、この点
数は、マッチの正確さのパーセンテージを表す0から1
00までの数である。ここで、100パーセントは、完
全なマッチである。属性エントリが存在していない場合
は、データベース一覧中、あるいは利用者によって入力
される所与のエントリ中において、ヌル値が点数欄に挿
入される。好適な本実施形態において、非常に貧弱なマ
ッチ状態または非マッチ状態を表すゼロ点数値は、ヌル
値とは全く異なる。本発明を実施する際、ゼロという数
値を用いて非エントリ状態を表すことができ、1という
数値で非マッチ状態を表すことができるが、ヌル値(エ
ントリなし)の状態とゼロ値(非マッチ)の状態との間
で一定の区別がなされていることは重要である。0値
(非マッチ)状態は、マッチの確度を大きく低減し、し
たがって信頼度指標の値を低減するように機能する。こ
れとは対照的に、ヌル値は、情報が入力(または記憶)
されなかったことを単に示すだけであり、したがって、
信頼度指標の値をあまり低減することはできない。
【0031】採点の概要をより良く説明するため、図3
を参照する。ここで、図3は、企業実体名属性の採点の
四つの具体例を示す表である。この表は、4つの列を含
んでいる。第1の列は、データベースの中に記憶され、
既に標準化および正規化された企業実体名を列挙してい
る。第2の列は、利用者によって入力された企業実体名
を列挙し、第3の列は、標準化および正規化された後の
この入力名を列挙している。このため、第4の列で列挙
される点数は、第1列および第3列の企業実体名の間の
マッチ比較を反映している。
【0032】第1の例では、企業実体名“ABC Manufact
uring”は、利用者によって入力され、“ABC MFG”に正
規化され、“ABC MFG CO.”と比較されている。プロセ
ッサは、統計データに基づいて、これらの名称が全く同
一のものである可能性が高いと判定し、したがって、こ
の属性に極めて高いマッチング点数(ここで説明する実
施形態では、99.5パーセント)を割り当てる。第2
の例(標準化及び正規化の後におけるもの)は、“ABC
MFG CO.”を“ABC Widget MFG”と比較する。双方の名
称が“ABC”及び“MFG”を共有しているが、与えられた
企業実体は、名称中に“Widget”を有さない。再び統計
情報に基くところによれば、この省略は、単にエントリ
中における利用者の誤りの結果である可能性がある。従
って、プロセッサは、これらのエントリが同じものであ
ることのより低い可能性を反映して、73.0パーセン
トというマッチング点数を割り当てる。第3の例では、
名称“XYZ MFG”と“ABC Widget MFG”とが比較され、
非常に低い34.0パーセントのマッチング点数が割り
当てられている。これは、“MFG”しか共通の語がない
からである。
【0033】最後に、最終例は、エントリなしの状況を
示している。この状況では、利用者は、企業実体名情報
を何も入力していない。プロセッサは、利用者によって
入力された他の情報(例えば、住所および/または電話
番号)に基づいて、名称“ABC Widget MFG”を有する可
能性のある突合せ用データベースエントリを特定してい
る。それにもかかわらず、この名称と比較すべき属性が
ないので、ヌル値が点数列に与えられる。本発明のこの
好適な実施形態では、利用者が名称情報を入力しても、
識別されるデータベースエントリが名称情報を有さない
場合は、点数は同じ(すなわち、ヌル)である。すなわ
ち、与えられた企業実体属性または記憶された企業実体
属性のいずれかが記入なしであると、ヌル値が点数列に
与えられる。しかしながら、他の実施形態では、データ
ベース中に記憶されたエントリの属性のヌル状態を識別
し、これを、与えられたエントリの属性のヌル状態から
区別することが望まれる場合がある。
【0034】ここで図2に戻ると、個々の属性の点数
は、ステップ22で等級分けされる。ここでは、比較的
高い分解能のマッチング点数が、限られた等級セットに
区分される。この限られた等級セットには、明らかなマ
ッチ(“A”)、マッチの可能性あり(“B”)、明ら
かなミスマッチ(“F”)、および記入なし状態
(“Z”)といった可能性のある等級が含まれているの
が好ましい。好適なマッチ採点法を利用して、90〜1
00パーセントというマッチ点数には、“A”というマ
ッチ等級が与えられる。50〜89パーセントというマ
ッチ点数には、“B”というマッチ等級が与えられ、
“F”というマッチ等級には、50パーセント未満のマ
ッチ点数が割り当てられる。“Z”というマッチ等級
は、ヌル点数、すなわち記入なし状態に割り当てられ
る。
【0035】この等級分けステップ22を修正して追加
の段階を反映することが望まれる場合もある。例えば、
92〜100パーセントというマッチ点数に“A”を割
り当て、70〜91パーセントという点数に“B”を割
り当て、40〜69パーセントという点数に「C」を割
り当て、40パーセント未満の点数に“D”を割り当て
ることにより、より大きな結果分解能を提供することが
望まれる場合がある。これらのマッチ点数は、単に説明
のために選択されている。一つ以上のマッチ等級が現在
好適な4つ(A、B、F、およびZ)に追加されたとし
ても、マッチ点数の範囲は、経験的かつ統計的なデータ
によって必然的に決定される。しかしながら、全ての実
施形態は、記入なし状態を説明するためのマッチ等級を
保持している。同様に、「Z」という記入なし等級を除
去して、“A”、“B”、および“F”という等級しか
使用しないことが望まれる場合もある。
【0036】ステップ22で各属性にマッチ等級を割り
当てた後、これらのマッチ等級が集められ、24で表さ
れるキーが形成される。このキー24は、ルックアップ
テーブル26をアドレス指定して、マッチの全体的な信
頼度指標を取り出すために使用される。好適な本実施形
態では、個別の7個の属性が使用され、これらの各々
は、4個のマッチ等級のうちの一つに割り当てられてい
る。従って、キー24の組合せは16,384(47
通りある。このように、ルックアップテーブル26は、
16,384個のアドレス位置を有さなければならな
い。
【0037】図2における例示のマッチ等級およびキー
24に続いて、図4を参照する。ここで、図4は、ルッ
クアップテーブル26に対してキー24をアドレス指定
する方法を概念的に図示している。各属性に対して4個
の可能な等級が存在するため、テーブルアドレス空間の
4分の1が、マッチ等級“A”を有する企業実体名に写
像する。このため、このキーの第1の属性等級を考慮す
れば、ルックアップテーブルのアドレス空間は、符号3
0で表される4,096個のエントリに効率よく低減さ
れる。同様に、1,096個のテーブルエントリ(参照
番号32)は、企業実体名属性およびストリート番号属
性の双方に対してマッチ等級“A”を有する突合せキー
24に対応している。突合せキー24を通じて引き続
き、図4は、突合せキー24の属性等級が更に考慮され
るにつれて、ルックアップテーブルの大きさが連続した
4の倍数だけ効率よく低減する様子を示す。最終的に、
一つのテーブル位置34だけが残り、このテーブル位置
34が特定の突合せキーに対応する。このように、一つ
の特定テーブルアドレスは、可能性のある突合せキーの
各々に対応する。この図では、8および93.3という
値は、このアドレス位置に記憶されているように図示さ
れている。図示のように、“AABAFAZ”の等級キ
ーは、8という信頼度コードと、特定されたエントリが
利用者により与えられたエントリ入力と同じである9
3.3パーセントの可能性と、を有している。
【0038】図4は、単に概念的な説明のためにのみ提
示したものであり、特定のキーを特定のテーブル位置に
写像することはむしろ単純なタスクであり、このマッピ
ングは、極めてわずかな処理能力と極めて短い処理時間
で数学的に取り扱うことができる。例えば、4個のマッ
チ等級の各々には、0〜3の数値が割り当てられてもよ
い。0が“A”に割り当てられ、1が“B”に、2が
“F”に、3が“Z”に割り当てられると仮定する。こ
の突合せキー“AABAFAZ”は、4進数00102
03として扱うことができ、これは10進数の275に
等しい。この数値は、メモリルックアップテーブル26
をアドレスするために使用することができる。
【0039】前述したもの以外にも、突合せ等級キーを
ルックアップテーブルアドレスに写像することの可能な
様々な方法がある。実際、ここで述べた突合せ等級文字
は、主に例示の目的のためのものであり、他の実施形態
において、これらのマッチング点数は、例えば0〜3と
いった数値等級に直接写像されてもよい。従って、実際
上、等級キーは、文字の代わりに7個の数字からなる数
字列であってもよい。重要な点は、数値が、直接得られ
るか間接的に得られるかにかかわらず、ルックアップテ
ーブルエントリを記憶するメモリに直接アドレスするた
めに容易に利用できることである。更に、これら7個の
属性等級は、一定の方法で合成されて、7個未満の数字
を有するキーを形成しても良い。
【0040】図2の説明を続けると、ルックアップテー
ブル26は、記憶場所の集合体であり、ここで、各記憶
場所は、与えられた企業実体と識別された企業実体との
間のマッチの品質を表す2つの数値、すなわち信頼度コ
ードおよび精度パーセンテージを含んでいる。この信頼
度コードは、1〜10の範囲の数であり、1は、マッチ
品質の低い信頼度を表し、10は、高いマッチ品質を表
している。精度パーセンテージは、パーセンテージとし
て好んで表現される数値であり、100の値、すなわち
100パーセントが、完全なマッチを示している。これ
らの数値の一部は、経験的データから導出され、また、
一部は、統計公式から導出される。
【0041】16,384個のエントリからなる好適な
テーブルサイズを用いると、これらの数の最初の計算が
大変な作業となる場合がある。すなわち、16,384
個の数を生成してテーブルを最初に満たすためには、莫
大な時間が必要となる。ここで、各々の数は、統計的に
十分なテストケースのサンプリングに基づいている。従
って、このプロセスを簡略化する幾つかの手段を使用す
ると好適である。経験則を基本とすれば、本発明につい
て、導出された信頼度コード及びマッチパーセンテージ
をあまりゆがめることなく一定の仮定を行うことが可能
であることが分かった。例えば、州コードに対するマッ
チ等級は、マッチを生じさせるためには“A”でなけれ
ばならないことが分かっている。また、電話番号が非常
に制限された有用性を持つことも分かっている。実際、
この要素は、例えば、一つ以上の企業実体が、実質的に
等しいマッチング点数によって、可能性のある突合せ用
企業実体として識別されるタイブレーキング(tie-brea
king)状況でしか主として使用されなかった。
【0042】プロセスを単純化するためになされる別の
仮定は、ストリート番号および私書箱番号という要素を
無視することである。企業実体は、しばしば複数のビル
を有していたり、あるいは一つのビルの中に複数の部門
を有しているので、たとえこの企業実体が正確にマッチ
するものであるとしても、これらの要素は、しばしばマ
ッチに失敗する。しかし、主要な仮定は、州要素をマッ
チ等級“A”であると仮定することである。州要素は適
切に識別された企業実体と常にマッチすることが分かっ
ている。図6は、最初の信頼度コード及びマッチパーセ
ンテージを計算するためにテーブルサイズを簡略化する
際になされた種々の仮定を示す表である。この図に示さ
れるように、“F”及び“Z”のマッチ等級は、しばし
ばグループ化されている。最終的には、これらの仮定に
基づいて、16,384個のエントリテーブルが、36
系統の可能性のある要素マッチ組合せに簡略化される。
【0043】図6に示される36系統にテーブルを簡略
化した後、4,500以上のテスト企業実体がマッチ等
級を用いて査定され、この後、人間の手により確認され
る。信頼度コード及びマッチパーセンテージの値は、こ
の後、4,500以上の企業実体サンプリングからの正
確な及び不正確なマニュアル確認の数から導出される。
特定の系統に対応する値は、全16,384個のエント
リを満たすように、テーブル中の適切なロケーションに
書き込まれる。
【0044】前述のプロセスを開始して複数の値からな
る最初のテーブルを生成するが、このテーブルの管理は
進行中のプロセスである。特定のテーブルエントリ、あ
るいはグループまたは複数のエントリ、に対する信頼度
コード及びマッチパーセンテージは不正確であることが
分かっており、この値は更新しても良い。この場合、経
験データを維持してテーブルエントリを更新することが
望まれる場合がある。従って、時間外に、この表の分解
能は、36系統の値からなる最初の分解能から、より細か
く、より正確な値の分解能に移行する。前述のプロセス
も、単独で開始されて信頼度コード値およびパーセンテ
ージ値の最初の一組を生成するものと理解すべきであ
り、本発明の方法ステップを制限するものとして理解す
べきではない。
【0045】正確な及び誤った識別の記録を時間外に維
持することによって、ルックアップテーブル26に記憶
されたデータは、そこに記憶された信頼度コードの精度
及び分解能に変えることができるものと考えられる。こ
の場合、特定の突合せセットを数個のより小さな突合せ
セットに分割することが望まれる場合がある。もちろ
ん、ルックアップテーブル26の分解能が大きくなるに
つれて、記録の維持は大変になる。
【0046】前述のように、他の実施形態では、別の等
級を加えることによって突合せキーを更に区分すること
が望まれる場合がある。たとえば、別の等級C、D、お
よびEを追加しても良い。別の等級を加えることによ
り、ルックアップテーブル26のサイズは実質的に大き
くなる。例えば、追加の等級Cを加えると、テーブルサ
イズは、16,384(47)エントリから78,12
5(57)エントリに拡大する。更に別の実施形態で
は、突合せキーを生成するために使用される属性の数を
追加、あるいは削減することが望まれる場合がある。別
の属性を一つ追加して、全体で8個の属性を用意する
と、ルックアップテーブルサイズは、16,384エン
トリから65、536(48)エントリに増加すること
になる。同様に、属性を一つ削除して、属性の数を全体
で6個にすると、ルックアップテーブルサイズは、4,
096(46)エントリに減少することになる。
【0047】したがって、このトレードオフは、マッチ
等級や属性が追加されるに伴ってルックアップテーブル
26のサイズが増大するということである。確かに、現
在利用可能な記憶装置やプロセッサを用いれば、これら
の要素が、好適な16,384エントリサイズを超える
テーブルサイズの成長を制限することはない。しかしな
がら、テーブルに最初に入力される経験データを決定す
る際や、経験情報が更に得られたときの経験データの維
持を行う際には、相当な費用がかかる。一方では、テー
ブルサイズを大きくして、結果の精度または分解能を更
に高めることが望まれる場合がある。他方では、利用者
は、結局のところ与えられたエントリと識別されたエン
トリとがマッチする可能性が高いかどうかにしか関心が
なく、また、テーブルサイズを拡大することに伴う費用
は極めて高い。
【0048】前述のように、マッチ点数を単一の数値に
変換する数学的等式を導く公式的な方法を用いたシステ
ムが知られている。この方法では、経験データを用いる
ことにより、等式の一部を形成する重み係数が導出され
る。この等式の変化に影響を及ぼす新たな状況が発生す
るとき、すなわち新たな経験データが集まったとき、こ
の等式は、しばしば以前ほど効率よく前の状態を扱うこ
とができなくなる。
【0049】特定の突合せ等級キーおよびマッチ点数に
対して個別のロケーションおよび一定の値を有するルッ
クアップテーブル26を利用するという本発明の手法
は、前記した公式を用いる手法または等式を導出する手
法を超える大きな利点をもたらす。突合せキー“AAB
AFAZ”が信頼度コード8と精度パーセント値93.
3パーセントとを含んだルックアップテーブルの記憶場
所に写像されるという先の説明を続ける。追加の経験デ
ータが集められるにつれて、突合せキー“AABAFA
Z”が実際には95.6パーセントの精度であることが
はっきりしたとする。このとき、他の突合せキーから得
られる結果に影響を与えることなく、単一のテーブルロ
ケーションの数値を変えることができる。このように、
ルックアップテーブル26の値は、経験データが更に集
められるのに応じて更新することができる。公式を用い
る方法は、このような即座の調整には向かない。
【0050】所与の取引に対して信用を承諾または拒否
するという最終決断は、要求されたドル額およびマッチ
精度パーセンテージを含む要因の組合せに最終的に基づ
いて行うことができる。より高額なドル取引には、より
高い精度パーセンテージが必要とされる。このことに関
して述べると、信頼度指標として機能する、例えば1か
ら10までの範囲の単一の数値を用いて、精度パーセン
テージ値を補うことが望まれる場合がある。1という値
は、ルックアップテーブルから得られた値の低いパーセ
ンテージ値に対応し、このため、突合せの低い信頼度水
準を表す。一方、10という値は、ルックアップテーブ
ルからの値の高いパーセンテージ値に対応し、高い信頼
度水準を表す。
【0051】本発明を利用するシステムは、自動化の際
に信頼度指標を利用することが考慮されている。例え
ば、低額のドル取引に対しては、信用の要求を自動的に
承諾するために低い信頼度水準を用いることも可能であ
る。より高額のドル取引では、信頼度指標のしきい値が
高くなる。この点をより良く説明するために、図5を参
照する。この図は、本発明が信用の承諾/拒否という用
途で使用される場合において、本発明に関する論理フロ
ーを示したフローチャートである。
【0052】このプロセスは、ステップ50から始ま
る。このステップ50では、信用が要求されている所与
の企業実体について適切な属性を利用者が入力する。こ
の後、このシステムは、企業実体のデータベースを検索
して可能性のある(あるいは可能性の高い)突合せ用企
業実体の一覧を取り出し、各属性に点数を与え、各属性
の点数に等級を割り当てて等級キーを形成する(ステッ
プ52)。メモリルックアップテーブルは、この等級キ
ーを用いてアドレスされ、信頼度コードおよび精度パー
センテージの双方が取り出される(ステップ54)。上
述のように、この後、本発明は、要求された信用取引お
よび取り出された信用履歴情報とともに信頼度コードを
用いて、信用要求を承諾するか、あるいは拒否するかを
決定する。
【0053】具体的に述べると、ステップ54は、特定
された企業実体の各々に対して実行される。最高の精度
パーセンテージと信頼度コードを有する企業実体は、こ
の後、突合せ用企業実体として「選択」され、その後、
本システムは、その企業実体に「リスク値」(すなわ
ち、小、中、大)を割り当てる(ステップ55)。この
「リスク値」は、要求された信用額に一部基づいてい
る。このリスク値に基いて、信頼度コードに対するしき
い値は、信用履歴情報にアクセスしてこれを取り出す
(ステップ64)か、あるいは人間による再調査または
事務的な追跡調査(ステップ66)に着手するか、を判
定するために使用される。
【0054】極めて少額のドル取引では、信用データの
原価は支払うだけの価値があるとはみなされないので、
マッチするもの全体の出力およびこれに続く信用情報の
取り出しを避けてもよい。少額のドル取引では、マッチ
候補の再調査に関する原価は、信用情報の全原価の関連
原価部分である場合が多く、したがって、(例えば、本
プロセスを自動化することによって)削減することが好
ましい。ドル額が増えるにつれて、信用履歴情報にアク
セスするための原価を支払うだけの価値があるとする理
由は大きくなる。しかしながら、マッチの信頼度水準が
低下するにつれて、原価を価値ありとする理由も同様に
低下する。従って、リスク値および信頼度コードは、双
方とも、信用履歴情報にアクセスしてこれを取り出すか
どうかを決定する際の要素である。例えば、リスク値が
小である場合、信頼度に対するしきい値は、信用履歴情
報を取り出すためには、所定値Xよりも大きくなければ
ならない(ステップ58及び64)。リスク値が中の場
合、信頼度コードに対するしきい値は、信用履歴情報を
取り出すためには、所定値Yよりも大きくなければなら
ない(ステップ60及び64)。最後に、リスク値が大
の場合、信頼度コードに対するしきい値は、信用履歴情
報を取り出すためには、所定値Zよりも大きくなければ
ならない(ステップ62及び64)。これ以外の場合
は、人間の介入や事務的な追跡調査が必要になる(ステ
ップ66)。上述の例では、所定値Xは、Yよりも小さ
く、YはZよりも小さい。
【0055】信用履歴情報に対してアクセスを行う(ス
テップ64)これらの例では、本システムは、取り出し
た情報から得られる信用度の評価(credit rating)
を、要求された信用額と関連づけて評価し(ステップ6
8)、信用を承諾する(ステップ70)か、あるいは拒
否する(ステップ72)かを判定する。
【0056】上記の例は、特定の取引を自動化する際に
信頼度コードおよび/または精度パーセンテージを使用
することが可能な一つの方法を示すために挙げたもので
ある。信頼度コードの同様の使用は、他の用途(すなわ
ち、非信用業界の用途)を有するシステムでも可能であ
る。
【0057】この好適なシステムの別の重要な利点は、
記入なし状態への適応力にある。利用者が比較的一般的
な名称、例えば“ABC Tire Co”や“Your Tire Store”
や“ABC Locksmith”や“Just Tires”、を有する所与
の企業実体を検索しているときは、多数の企業実体が可
能性のある突合せ用企業実体として特定されることが多
いので、良好なマッチを達成できるように特定用の情報
をより十分に入力する必要がある。しかしながら、熟練
した利用者は、企業実体名が相当に独特なときには、単
に企業実体名を入力するだけでも正確な結果を得ること
ができることを分かっている。関連した方式では、利用
者は、ある種の取引に対して全ての属性より少ない数の
属性を入力できる場合がある。例えば、信用調査の状況
において、要求されたドル額が比較的少ないとき、利用
者は、全ての属性より少ない数の属性を入力することが
できる。しかし、高額のドル取引では、より高い信頼度
指標を確保するため、全ての属性を入力することが望ま
れる。
【0058】既に述べたように、追加の属性および/ま
たは他の属性を用いて企業実体を特定することが望まれ
る場合もある。同様に、本発明の他の形態では、信頼度
コードまたは精度パーセンテージを生成する際に、地理
的人口密度データを使用することができる。例えば、所
在位置属性において特定された都市が高い人口密度を有
する都市(例えば、ニューヨーク)に一致する場合、他
の全ての属性および点数が同じであると仮定すると、結
果として得られる精度パーセンテージおよび信頼度コー
ドは、より人口密度の低い都市(例えば、チャールスト
ンやサウスカリフォルニア)に対するものよりも小さく
なる。すなわち、ニューヨーク市の“ABC Tire Store”
に対する信頼度コードは、チャールストンの“ABC Tire
Store”に対する精度パーセンテージおよび信頼度コー
ドよりも低くなる可能性が高い。
【0059】上述した本発明の概念および内容は、デー
タベースとのダイレクトオンライン接続を呼び出すシス
テムや、バッチジョブをデータベースに提出するシステ
ムに等しく当てはまる。すなわち、少数の企業実体を捜
している利用者は、データベースへダイアルアップして
接続し、ダイレクトオンライン接続を確立することが可
能である。この後、データベースに対して企業実体属性
をリアルタイムで入力および検索することができる。こ
の他に、特に多数の企業実体が検索されることになって
いる場合には、この処理はバッチジョブとしてデータベ
ースに提出することができる。このことに関して述べる
と、利用者は、例えば、夜間のバッチ要求に数百、ある
いは数千の企業実体属性を含むファイルをつけ加えても
よい。この後、データベースは、一つずつ企業実体属性
を解析し、可能性のある突合せ用企業実体を特定し、信
頼度コード及びマッチ精度パーセンテージを参照し、適
切にマッチするものを選び、適切な情報およびデータを
つけ加える。
【0060】本発明の種々の好適な実施形態についての
上記説明は、例示および説明の目的のために述べたもの
である。全てを網羅する意図はなく、また、本発明をこ
こで開示した形態そのものに限定する意図もない。上記
の開示内容を考慮に入れた明らかな変形や変更が可能で
ある。ここで述べた実施形態は、本発明の原理およびそ
の実際の用途を最も良く表し、これにより当業者が本発
明を様々な形態で、意図された特定の使用に適する様々
な変形を加えて利用することが可能になるように選んで
説明したものである。このような全ての変形および変更
は、公平に、合法的に、かつ正当に権利が与えられる広
さに従って特許請求の範囲を解釈するときに特許請求の
範囲によって定められる本発明の範囲内にある。
【図面の簡単な説明】
【図1】与えられたエントリを求めてデータベースを検
索し、識別用の各属性にマッチ点数を与えるシステムに
よって実行される主要なステップを示すフローチャート
である。
【図2】本発明の好適な実施形態の主要な方法ステップ
を示す工程系統図である。
【図3】マッチ点数の例を示す表を示した図である。
【図4】本発明の好適な実施形態の突合せ等級キーメモ
リアドレス指定を概念的に示す図である。
【図5】信用の承諾/拒否の例において本発明の論理フ
ローを示すフローチャートである。
【図6】本発明の好適な突合せ実施形態において、信頼
度コード及びマッチングパーセンテージを最初に導出お
よび記憶する際になされる仮定を示す表である。
【符号の説明】
10、12、14および16…各属性にマッチ点数を与
えるシステムによって実行される主要なステップ、2
0、22、24および26…本発明の実施形態の主要な
ステップ。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/60

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】 突合せシステムから導出された情報を自
    動的に、かつ人間の介入なしに利用および評価する方法
    であって、前記突合せシステムは、記憶された複数のエ
    ンティティに関する情報を含んだ大規模データベースを
    検索するタイプであり、この各記憶エンティティは、複
    数の属性によって特定されるようになっており、前記シ
    ステムは、所与のエンティティの属性を前記データベー
    ス内の前記記憶エンティティの属性と突き合わせて、密
    接にマッチするエンティティの同一性を、前記属性の各
    々に対してマッチの品質を示す各属性の点数とともに示
    すようになっており、 n(nは複数)個の前記各属性の点数に等級を割り当て
    るステップであって、この等級は、少なくとも明らかな
    マッチ、明らかなミスマッチ、およびマッチの可能性あ
    り、という状態を区別する少数の可能性のある等級から
    選択されたものであるステップと、 前記n個の属性の各々に対する前記等級を集めて、密接
    にマッチしている特定のエンティティに対してキーを作
    成するステップと、 このキーを用いてメモリにアドレスすることにより、密
    接にマッチしている前記特定エンティティに対するマッ
    チの全体的な品質を示すマッチ指標を取り出すステップ
    であって、前記メモリは、同一または類似の等級キーに
    関する経験情報に基づいたマッチ指標を含んでいるステ
    ップと、を備える方法。
  2. 【請求項2】 前記メモリに記憶された前記マッチ指標
    は、さらに統計公式に基づいている請求項1記載の方
    法。
  3. 【請求項3】 前記等級キーは、n桁のキーである請求
    項1記載の方法。
  4. 【請求項4】 各属性等級は、その属性に対する前記点
    数に基づいている請求項1記載の方法。
  5. 【請求項5】 前記少数の可能性のある等級は、記入な
    し状態に対する等級を更に含んでいる請求項1記載の方
    法。
  6. 【請求項6】 前記所与のエンティティの属性の記入な
    し状態に記入なし等級が割り当てられる請求項5記載の
    方法。
  7. 【請求項7】 前記データベースに記憶されたエントリ
    の属性の記入なし状態に記入なし等級が割り当てられる
    請求項5記載の方法。
  8. 【請求項8】 前記少数の可能性のある等級は、前記所
    与のエンティティの属性の記入なし状態に割り当てられ
    る第1の記入なし等級、および前記データベースに記憶
    されたエントリの属性の記入なし状態に割り当てられる
    第2の記入なし等級を更に含んでいる請求項1記載の方
    法。
  9. 【請求項9】 複数の企業実体からなる大規模グループ
    に関する情報を記憶し、このグループの一員を所与の企
    業実体とのマッチの可能性が高いものとして選択するコ
    ンピュータ化システムであって、複数の属性に関する情
    報によって特定される企業実体の集合を記憶するデータ
    ベースと、所与の企業実体の属性を特定する情報を受け
    取り、前記集合を検索して、記憶されている前記企業実
    体がマッチの可能性のあるものであることを判断するプ
    ロセッサと、を備え、このプロセッサが、特定された企
    業実体の各属性に関して可能性のあるマッチの品質を採
    点するようにプログラムされているシステムにおいて、
    前記プロセッサによって作成されたマッチの品質を自動
    的に、かつ人間の介入なしに求める方法であって、 前記マッチの信頼度を等級分けするために用いられるn
    個の前記属性を選択するステップと、 このn個の属性の各々に対する点数に等級を割り当てる
    ステップであって、これらの等級は、マッチ、ミスマッ
    チ、マッチの可能性あり及び記入なしの状態に対する個
    別の等級を少なくとも含むように選択されるステップ
    と、 前記n個の属性に割り当てられた前記等級からキーを集
    成するステップと、 可能な全てのキーによってアドレス可能なメモリテーブ
    ルを設けるステップであって、このテーブルは、内部に
    記憶されたマッチ信頼度データを有しているステップ
    と、 前記テーブルにアドレスして、前記キーにより特定され
    る前記マッチ信頼度データを取得するステップと、 を備える方法。
  10. 【請求項10】 得られた前記信頼度データを解析し
    て、前記キーに対する信頼度水準を設けるステップを更
    に備える請求項9記載の方法。
  11. 【請求項11】 複数の属性を特定することによって記
    憶及び参照される多数の企業実体の一覧を、関連するビ
    ジネスデータとともに含む商用データベースにアクセス
    して商業取引を処理する方法であって、前記データベー
    スより導出された情報を自動的に、かつ人間の介入なし
    に処理するステップとして、 前記データベース内を自動的に検索し、複数の属性によ
    って特定された所与の企業実体とマッチする可能性のあ
    る特定された企業実体を発見するステップと、 各属性のマッチの品質を示す点数を取得するステップ
    と、 各属性に対する前記点数を、複数の等級からなる限定サ
    ブセットから選択された等級に変換するステップであっ
    て、前記サブセットの等級は、可能性の高いマッチ、非
    マッチ、およびマッチの可能性ありの状態を示している
    ステップと、 特定された企業実体の各々について、前記マッチの可能
    性のあるものに対する等級を用いてキーを作成するステ
    ップと、 このキーを用いてメモリテーブルにアドレスし、このメ
    モリ内に記憶された信頼度情報を取り出すステップであ
    って、この信頼度情報は、経験情報から求められたもの
    であるステップと、 前記信頼度情報を用いることにより、特定された企業実
    体の一覧からマッチする企業実体を選択するステップ
    と、 を備える方法。
  12. 【請求項12】 前記等級のサブセットは、エントリな
    し状態を示す等級を更に含んでいる請求項11記載の方
    法。
  13. 【請求項13】 選択された前記企業実体に関連するビ
    ジネスデータと共に前記信頼度情報を用いて、前記商業
    取引を処理するための結論に自動的に達するステップを
    更に備える請求項11記載の方法。
  14. 【請求項14】 前記商業取引は、信用承諾/拒否取引
    であり、前記関連ビジネスデータは、信用度の評価であ
    る請求項13記載の方法。
JP23533197A 1997-07-28 1997-07-28 エンティティの一覧中に発見された所与のエンティティにマッチするものを等級分けする方法 Expired - Lifetime JP3252104B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23533197A JP3252104B2 (ja) 1997-07-28 1997-07-28 エンティティの一覧中に発見された所与のエンティティにマッチするものを等級分けする方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23533197A JP3252104B2 (ja) 1997-07-28 1997-07-28 エンティティの一覧中に発見された所与のエンティティにマッチするものを等級分けする方法

Publications (2)

Publication Number Publication Date
JPH1153435A JPH1153435A (ja) 1999-02-26
JP3252104B2 true JP3252104B2 (ja) 2002-01-28

Family

ID=16984531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23533197A Expired - Lifetime JP3252104B2 (ja) 1997-07-28 1997-07-28 エンティティの一覧中に発見された所与のエンティティにマッチするものを等級分けする方法

Country Status (1)

Country Link
JP (1) JP3252104B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843501B2 (en) 2011-02-18 2014-09-23 International Business Machines Corporation Typed relevance scores in an identity resolution system

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7974875B1 (en) * 2000-03-21 2011-07-05 Aol Inc. System and method for using voice over a telephone to access, process, and carry out transactions over the internet

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843501B2 (en) 2011-02-18 2014-09-23 International Business Machines Corporation Typed relevance scores in an identity resolution system
US8856144B2 (en) 2011-02-18 2014-10-07 International Business Machines Corporation Typed relevance scores in an identity resolution system

Also Published As

Publication number Publication date
JPH1153435A (ja) 1999-02-26

Similar Documents

Publication Publication Date Title
US5659731A (en) Method for rating a match for a given entity found in a list of entities
US7155427B1 (en) Configurable search tool for finding and scoring non-exact matches in a relational database
US6542896B1 (en) System and method for organizing data
US6708166B1 (en) Method and apparatus for storing data as objects, constructing customized data retrieval and data processing requests, and performing householding queries
US8346794B2 (en) Method and apparatus for querying target databases using reference database records by applying a set of reference-based mapping rules for matching input data queries from one of the plurality of sources
US8185509B2 (en) Association of semantic objects with linguistic entity categories
US20080133522A1 (en) System and Methods for Improved Linguistic Pattern Matching
JP5536851B2 (ja) 情報のシンボルによるリンクとインテリジェントな分類を行う方法及びシステム
US10762114B1 (en) Ecosystem for providing responses to user queries entered via a conversational interface
EP1500003A1 (en) System and method for classification of documents
EP1185941A1 (en) System and method for enhancing e-commerce using natural language interface for searching database
WO2005033976A1 (en) System and method for classification of documents
KR20090014136A (ko) 표의문자적 내용을 가지는 데이터를 서치하고 매칭하기위한 시스템 및 방법
CN113342976B (zh) 一种自动采集处理数据的方法、装置、存储介质及设备
AU2008203532A1 (en) Method and System for Processing Information
CN110968800A (zh) 一种信息推荐方法、装置、电子设备及可读存储介质
US20050065920A1 (en) System and method for similarity searching based on synonym groups
CN112149387A (zh) 财务数据的可视化方法、装置、计算机设备及存储介质
CN111026787A (zh) 网点检索方法、装置及系统
US20050065947A1 (en) Thesaurus maintaining system and method
CN115757461B (zh) 一种银行数据库应用系统结果聚类方法
US20230153286A1 (en) Method and system for hybrid query based on cloud analysis scene, and storage medium
JP3252104B2 (ja) エンティティの一覧中に発見された所与のエンティティにマッチするものを等級分けする方法
US11880377B1 (en) Systems and methods for entity resolution
CN114238664A (zh) 一种海外商标检索方法、设备、介质及产品

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term