JPH11184884A - 同一人判定システムおよび方法 - Google Patents

同一人判定システムおよび方法

Info

Publication number
JPH11184884A
JPH11184884A JP35552697A JP35552697A JPH11184884A JP H11184884 A JPH11184884 A JP H11184884A JP 35552697 A JP35552697 A JP 35552697A JP 35552697 A JP35552697 A JP 35552697A JP H11184884 A JPH11184884 A JP H11184884A
Authority
JP
Japan
Prior art keywords
character
kanji
normalized
same person
personalized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP35552697A
Other languages
English (en)
Inventor
Yukio Yamaguchi
幸夫 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP35552697A priority Critical patent/JPH11184884A/ja
Publication of JPH11184884A publication Critical patent/JPH11184884A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 多数人の人定事項を登録した大規模なデータ
ベースから、同一人の重複登録を精度よく且つ効率よく
検出する。 【解決手段】 データベース内の各人の個人ファイル7
A、7B、7C、…には、各人の人定事項、例えば性
別、生年月日、カナ氏名、漢字氏名、カナ住所、漢字住
所などが登録されている。システム1は、まず、これら
の個人ファイル7A、7B、7C、…内のカナ氏名、漢
字氏名、カナ住所、漢字住所を統一した表記法による記
載に正規化する(処理31〜37)。次に、ファイル7
A、7B、7C、…間で正規化後の人定事項を対比する
ことにより、同一人か、別人か、同一人に疑わしいかを
判定する。この判定処理では、まず、性別、生年月日、
正規化カナ氏名に基づいて、同一人と疑わしいファイル
のグループを絞り込む(処理51)。次に、絞り込まれ
た各同一人グループ内で、カナ氏名、正規化漢字氏名、
正規化カナ住所、正規化漢字住所を用いて、同一人か別
人か同一人に疑わしいかの最終的判定を行う(処理5
3)。

Description

【発明の詳細な説明】
【0001】
【発明の技術分野】本発明は、複数人の人定事項を対比
して、それらが同一人を指すものか否かを判定するため
のシステムに関する。
【0002】
【従来の技術】多数人の情報をファイルに登録し管理す
る場合、同一人の情報が複数の別人のものとして重複登
録されないようにする必要がある。そこで、従来、二人
(複数人)の人間が同一人であるか否かを判定するため
に、カナ氏名、生年月日および性別における一致をチェ
ックしている。
【0003】
【発明が解決しようとする課題】生年月日および性別が
一致した場合、カナ氏名が一致するか否かで同一人か否
かを判定することになる。しかし、情報の管理状態によ
っては濁点、半濁点、スペース等の設定が不統一である
ために、本当は同一人であっても同一人として判定でき
ない場合がある。一方、生年月日、性別およびカナ氏名
が一致して同一人と判定したところ、実際には別人であ
って、漢字氏名や住所などが異なっているということも
ある。
【0004】このように、カナ氏名、生年月日および性
別に基づく従来の同一人判定方法は、精度が十分に高い
とはいえない。更に、従来のシステムは大量データの中
から同一人を割出す用途にはあまり適していない。
【0005】従って、本発明の目的は、同一人判定の精
度を高めることにある。
【0006】本発明の別の目的は、大量データから同一
人を割り出し易くすることにある。
【0007】本発明の更に別の目的は、同一人判定シス
テム等での利用に好適な文字列の正規化技術を提供する
ことにある。
【0008】
【課題を解決するための手段】本発明のシステムは、各
人の人定事項を示した個人情報を入力する手段と、入力
された前記個人情報内の人定事項を、統一した表記法に
従うものに正規化する正規化部と、正規化部によって正
規化された複数人の個人情報内の人定事項を対比するこ
とにより、同一人のものである複数の個人情報を検出す
る同一人判定部とを備える。
【0009】このシステムによれば、統一表記の正規化
された人定事項に基づいて同一人判定を行うので、判定
精度が高い。例えば、人定事項に、性別、生年月日、カ
ナ氏名、漢字氏名、カナ住所及び漢字住所などが含まれ
得る場合、正規化はカナ氏名、漢字氏名、カナ住所及び
漢字住所に対して行うことが望ましい。大抵の場合、氏
名と住所の表記が不統一であるからである。
【0010】正規化において、同義異表記の複数の漢字
文字(例えば、旧字と新字、類似文字など)を統一表記
の漢字文字に変換することは、判定精度を高める上で重
要である。その場合、変換対象の漢字はおびただしい種
類に及ぶため、予め漢字文字変換表を用意して、これを
参照して変換することが望ましい。また、漢字文字変換
表を用意しておくと、漢字の追加、削除、変換規則の変
更なども容易であり、実状に応じた柔軟な対応がとり易
い。
【0011】同一人判定の処理は、次のような2段階の
処理に分けて行うことができる。すなわち、第1段階
は、人定事項内の第1の項目又は第1の項目群をキーと
して用いて、同一人のものと疑わしき複数の個人情報を
グループ化する第一次絞り込み処理である。次の段階
は、第一次絞り込み処理で得られた各グループ内から、
人定事項に含まれている第2の項目又は第2の項目群を
キーとして用いて、同一人のものである複数の個人情報
を検出する第二次絞り込み処理である。このように段階
的に候補を絞り込むことにより、後段で処理すべきデー
タ量が減るので、大量のデータも扱いやすくなる。
【0012】好適な実施形態では、第一次絞り込み処理
で性別、生年月日及び正規化カナ氏名をキーとして用い
ており、これにより、同一人グループを効果的に小さく
絞り込むことができる。第二次絞り込み処理では、第一
次で十分小さく絞り込まれた各同一人グループ内から、
カナ氏名、正規化漢字氏名、正規化カナ住所及び正規化
漢字住所をキーとして用いて、最終的な判定結果を割り
出す。
【0013】また、同一人判定では、人定事項に含まれ
ている項目の一致・不一致の可能性あるパターンと、各
パターンに対する判定結果とを示した同一人判定表を予
め用意して、この同一人判定表を参照して判定結果を割
り出すことが、望ましい。これにより、複雑な判定を簡
単に行うことができると共に、同一人判定表内の判定結
果を必要に応じて変更することにより、事情に応じた柔
軟な対応が可能である。
【0014】本発明はまた文字列正規化のための装置及
び方法も提供する。この装置及び方法は、入力された文
字コード列からシフトコードを削除すると共に、個々の
文字のる文字コードを統一した表記法に従う所定の正規
化文字の文字コードに変換する。これにより、文字の開
始部や終了部に付与されているシフトコードが除去され
た純粋に文字のコードだけから成る文字コード列であっ
て、全ての文字が統一表記法に従がう正規化文字である
ような文字コード列が得られる。この正規化された文字
コード列を用いると、例えば氏名が一致してるか否かと
いった判断において、氏名の統一表記法に従った純粋な
文字構成だけから判断ができるので、高い判定精度が得
られる。なお、本発明の文字列正規化装置及び方法は、
同一人判定だけでなく、他の様々な用途にも広く利用す
ることができる。
【0015】本発明の同一人判定システムや文字列正規
化装置は典型的にはコンピュータを用いて実施すること
ができるが、そのためのプログラムは、各種のディスク
形ストレージや半導体メモリや通信回線などを媒介にし
て、コンピュータにインストール又はロードすることが
できる。
【0016】
【発明の実施の形態】図1は、本発明の同一人判定シス
テムの一実施形態の機能的な構成を示す。
【0017】この同一人判定システム1は、人情報デー
タベースから各人の人定事項がそれぞれ登録された個人
ファイル7A、7B、7C、…を読み込み、それら個人
ファイル7A、7B、7C、…間で各々の人定事項を対
比することにより、複数のファイルに重複登録されてい
る同一人を探し出すために使用される。このシステム1
は、典型的にはプログラムがインストールされた汎用コ
ンピュータによって実施することができるが、必ずしも
そうである必要はなく、その少なくとも一部の処理は専
用ハードウェア回路によって実施することもできる。図
示のように、このシステム1は、正規化部3と同一人判
定部5の2つの処理モジュールを有する。
【0018】正規化部3は、個人ファイル7A、7B、
7C、…内の各人の人定事項を正規化する、すなわち、
人定事項の表記法を統一化する。ここで、各人の人定事
項には、性別、生年月日、カナ氏名、漢字氏名、カナ住
所、および漢字住所が含まれている。正規化部3は、カ
ナ氏名正規化31、漢字氏名正規化33、カナ住所正規
化35および漢字住所正規化37の4種類の正規化処理
を行う。漢字氏名正規化33には、予め用意された漢字
文字正規化表9を参照して、所定の表記の漢字文字を同
義の正規化文字へ変換する文字正規化処理が含まれる。
性別と生年月日は、表記が不統一という問題が元来ない
ので、正規化の対象外である。
【0019】同一人判定部5は、正規化部3によって正
規化された多数の個人ファイル7A、7B、7C、…内
の人定事項を互いに対比することによって、それら個人
ファイル7A、7B、7C、…を、同一人のものと判定
される個人ファイルのグループ(同一人情報)と、同一
人のものである疑いのある個人ファイルのグループ(疑
同一人情報)と、それ以外のそれぞれ別人のものと判定
される個人ファイルのグループ(別人情報)とに分類す
る。これを行う際、判定部5は、第一次絞り込み処理5
1と第二次絞り込み処理53の2段階の処理を行う。
【0020】第一次絞り込み処理51では、性別、生年
月日及び正規化カナ氏名をキーに用いて、同一人のもの
と疑わしき個人ファイルのグループを抽出する。第二次
絞り込み処理55では、第一次絞り込み処理55で抽出
された各同一人ファイルグループ内で、カナ氏名、正規
化漢字氏名、正規化カナ住所および正規化漢字住所をキ
ーに用いて、最終的に同一人のものと判定される個人フ
ァイルのグループ(同一人情報)、及び同一人のものと
疑わしきファイルのグループ(疑同一人情報)を絞り込
む。この第二次絞り込み処理55において、全てのキー
にて完全に一致している複数のファイルは容易に同一人
情報と判定できるが、部分的に一致しているファイル同
士は同一人情報か疑同一人情報か別人情報か単純に判定
することができない。そこで、第二次絞り込み処理55
では、同一人判定表11を参照することにより判定結果
を割り出す。この同一人判定表11には、上記複数のキ
ー(氏名は姓と名に分けて)についての一致・不一致の
可能性ある全てのパターンと、各パターンに対する判定
結果とが予め記述されている。
【0021】以下、このシステム1で行われる処理を更
に具体的に説明する。
【0022】図2は、同一人が重複登録されている2つ
の個人ファイル(以下、Aファイル、Bファイルとい
う)の人定事項の例を示す。図示のように、両ファイル
は、カナ氏名、漢字氏名、カナ住所及び漢字住所に関し
て表記法が異なっている。
【0023】システム1はこのようなファイルを読み込
み、まず、カナ氏名、漢字氏名、カナ住所及び漢字住所
に関する正規化31〜37を次のように行なって表記法
を統一する。
【0024】1.カナ氏名正規化31 姓の前にスペースが存在する場合、そのスペースを
削除する。
【0025】 姓名の間にスペースが複数存在する場
合、それらスペースを1つにする。
【0026】 図3に例示するような文字変換を実施
する。この文字変換は、規則性をもたせるために、図3
に示した項番の順序で行う。
【0027】2.漢字氏名正規化33 (1)スペースおよびシフトコードの削除 姓の前にスペースが存在する場合、そのスペースを
削除する。
【0028】 姓名間のスペースおよびシフトコード
の削除 a.カナ文字間のスペースは、1バイト文字のスペース1
個にして、ANKシフトコード又は漢字シフトコードは
全て削除する。
【0029】b.漢字文字間のスペースは、2バイト文字
のスペース1個にして、ANKシフトコード又は漢字シ
フトコードは全て削除する。
【0030】c.カナ文字・漢字文字間のスペースは、1
バイト文字スペース1個+漢字シフトコード1個にし
て、他のスペース、シフトコードは全て削除する。
【0031】d.漢字文字・カナ文字間のスペースは、1
バイト文字スペース1個+漢字シフトコード1個にし
て、他のスペース、シフトコードは全て削除する。
【0032】なお、文字の開始及び終了部に付与されて
いるシフトコードを上記のように削除する理由は、純粋
に文字コードだけで氏名の同一性判定を行うためであ
る。
【0033】(2)文字の正規化 漢字文字正規化表9を参照して、1文字毎に入力漢字文
字を正規化漢字文字に変換する。漢字文字正規化表9の
一部を図4に例示する。図4に示すように、漢字文字正
規化表9は、同義異表記の幾つかの漢字文字がある場合
に、その中から予め定めた一つの表記の正規化漢字文字
へ、他の表記の入力漢字文字を変換するように構成され
ている。例えば、入力漢字文字「斉」、「齋」などは、
正規化漢字文字「斎」へ変換される。
【0034】3.カナ住所正規化35 先頭から最初の数字以降は、数字以外は削除し、数
字と数字の間は全て1バイト文字のハイフン「−」に置
換する。
【0035】 カナ住所のスペースはすべて削除す
る。
【0036】 、の処理後の文字列は左詰めとす
る。
【0037】 正規化は〜の順序で行う。
【0038】4.漢字住所正規化37 1バイト文字は2バイト文字に変換する。
【0039】 シフトコードは削除する。
【0040】 先頭から最初の数字以降は、数字以外
は削除し、数字と数字の間は全て2バイト文字のハイフ
ン「−」に置換する。
【0041】 漢字住所のスペースは全て削除する。
【0042】 〜の処理後の文字列は左詰めとす
る。
【0043】以上の正規化33〜35を行うと、例えば
図2に示した例では、Aファイルには変更がないが、B
ファイルは図5に示すように修正される。この正規化後
のBファイルの内容はAファイルの内容と全く同一のも
のである。このAファイルとBファイルの例のように、
元々同一の内容が表記だけ異なって記載されていた場合
には、正規化処理を行うと、かなり高い確率で同一の内
容になる。
【0044】次に、正規化した個人ファイルについて同
一人判定処理が行われる。この処理は、第一次絞り込み
処理51と第二次絞り込み処理53の2段階からなり、
その処理内容は次の通りである。
【0045】1.第一次絞り込み処理51 性別、生年月日、正規化カナ氏名の3項目を第一
次の絞り込みキーとして用いて、同一人のものと疑わし
い個人ファイルのグループを作成する。すなわち、この
3つのキーにおいて一致度の高い(例えば3つのキーの
全てで完全に一致している)複数の個人ファイルを、1
つの同一人グループに入れる。ここで、性別と生年月日
を第一次のキーとして用いている理由は、そのいずかが
不一致であれば、確実に同一人ではないと判断できるか
らである。更に、正規化カナ氏名もキーとして用いてい
る理由は、第1に、性別と生年月日だけによる絞り込み
では多くの別人ファイルがグループに含まれてしまい、
効果的にデータ量を減らすことができないからである。
第2に、カナ氏名は通常の人情報データベースにおける
収録必須項目であって、収録率が最も高く確実に利用で
きるからである。第3に、正規化カナ氏名は、非常に高
い確率で同一人に対して全く同じ表記になるので、これ
を用いて絞り込めば、精度良くかつ効果的にデータ量を
減らすことができるからである。
【0046】この第一次絞り込みによって、同一人の重
複登録による複数ファイルが、殆ど漏れなくグループ化
される。しかも、確実に別人を示す大多数のファイルは
グループから除外されるので、同一人グループのデータ
量は効果的に削減される。
【0047】なお、第一次絞り込み処理51で用いるキ
ーの項目や、同一人グループに入れるためのキー一致の
条件などは変更することができる。それにより、実状に
応じた柔軟な対応が可能である。
【0048】2.第二次絞り込み処理53 第一次絞り込み処理51で作成された個々の同一人グル
ープ内で、更に、(正規化前の)カナ氏名、正規化
漢字氏名、正規化カナ住所、正規化漢字住所の4項
目を絞り込みキーとして用いて、最終的な絞り込み(判
定)を行う。ここでは、同一人判定表11を参照して最
終的な判定結果を割り出す。この同一人判定表11の一
部分の例を図6に示す。この判定表11には、上記キー
についての一致・不一致の可能性ある全てのパターン
(一致・不一致だけでなく、未登録の場合も考慮に入っ
ている)と、各パターンに対する判定結果が示されてい
る。
【0049】この判定表11における判定結果は基本的
に次の考え方も基づいている。すなわち、正規化カナ住
所と正規化漢字住所は、地番以下まで対比するので、最
も重要なキーとして扱う。原則として、正規化カナ住所
と正規化漢字住所の双方で一致(全文字にて一致)すれ
ば同一人と判定し、不一致であれば別人と判定する。他
のキーであるカナ氏名や正規化漢字氏名については、双
方において不一致であれば殆ど確実に別人であるが、双
方において一致していても同姓同名の別人である可能性
があるため、住所が一致している(又は住所が未登録で
ある)場合に、別人と判定するか、疑同一人と判定する
かの参考項目として用いる。
【0050】更に、個人ファイルに、例えば、運転免
許、健康保険、社会保険、勤務先、学校、世帯内続柄な
どに関わる他の項目が含まれている場合、そうした項目
も追加のキーとして用いることができる。
【0051】なお、同一人判定表11の内容(特に、判
定結果)は変更することができ、それにより、実状に応
じた柔軟な対応が可能である。
【0052】以上の判定処理により、かなり高い確度で
同一人の重複登録を検出することができる。
【図面の簡単な説明】
【図1】本発明の同一人判定システムの一実施形態の機
能的な構成を示すブロック図。
【図2】同一人が重複登録されている2つの個人ファイ
ル内の人定事項の例を示す図。
【図3】文字変換の規則を例示する図。
【図4】漢字文字正規化表9の一部を例示する図。
【図5】正規化前と正規化後の例を示す図。
【図6】同一人判定表の一部を例示する図。
【符号の説明】
1 同一人判定システム 3 正規化部 5 同一人判定部 7 個人ファイル 9 漢字文字正規化表 11 同一人判定表

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 各人の人定事項を示した個人情報を入力
    する手段と、 入力された前記個人情報内の人定事項を、統一した表記
    法に従うものに正規化する正規化部と、 前記正規化部によって正規化された複数人の個人情報内
    の人定事項を対比することにより、同一人のものである
    複数の個人情報を検出する同一人判定部とを備えた同一
    人判定システム。
  2. 【請求項2】 前記人定事項が、性別、生年月日及びカ
    ナ氏名を少なくとも含み、更に漢字氏名、カナ住所及び
    漢字住所の少なくとも一つを含むことができ、 前記正規化部が、前記カナ氏名、漢字氏名、カナ住所及
    び漢字住所のうちの前記人定事項に含まれている項目を
    正規化する請求項1記載の同一人判定システム。
  3. 【請求項3】 前記正規化部が、所定の漢字を同義異表
    記の所定の正規化漢字に対応させた漢字文字変換表を有
    し、前記人定事項を正規化する過程で、前記漢字文字変
    換表を参照して前記人定事項内の所定の漢字を対応する
    前記正規化漢字に変換する請求項1記載の同一人判定シ
    ステム。
  4. 【請求項4】 前記同一人判定部が、 前記人定事項に含まれている第1の項目又は第1の項目
    群をキーとして用いて、同一人のものと疑わしき複数の
    個人情報をグループ化する第一次絞り込み処理と、 前記第一次絞り込み処理で得られた各グループ内から、
    前記人定事項に含まれている第2の項目又は第2の項目
    群をキーとして用いて、同一人のものである複数の個人
    情報を検出する第二次絞り込み処理とを行う請求項1記
    載の同一人判定システム。
  5. 【請求項5】 前記人定事項が、性別、生年月日及びカ
    ナ氏名を少なくとも含み、更に漢字氏名、カナ住所及び
    漢字住所の少なくとも一つを含むことができ、 前記第1の項目群が性別、生年月日及び正規化されたカ
    ナ氏名を含み、 前記第2の項目群がカナ氏名、正規化された漢字氏名、
    正規化されたカナ住所及び正規化された漢字住所を含む
    請求項4記載の同一人判定システム。
  6. 【請求項6】 前記同一人判定部が、前記人定事項に含
    まれている項目の一致・不一致の可能性あるパターン
    と、各パターンに対する判定結果とを示した同一人判定
    表を有し、この同一人判定表を参照して判定結果を割り
    出す請求項1記載の同一人判定システム。
  7. 【請求項7】 前記同一人判定表内の判定結果が変更可
    能である請求項6記載の同一人判定システム。
  8. 【請求項8】 各人の個人情報内の人定事項を、統一し
    た表記法に従うものに正規化する過程と、 正規化された複数人の個人情報内の人定事項を対比する
    ことにより、同一人のものである複数の個人情報を検出
    する過程と、を有した同一人判定方法。
  9. 【請求項9】 各人の人定事項を示した個人情報を入力
    する手段と、 入力された前記個人情報内の人定事項を、統一した表記
    法に従うものに正規化する正規化部と、 前記正規化部によって正規化された複数人の個人情報内
    の人定事項を対比することにより、同一人のものである
    複数の個人情報を検出する同一人判定部とを備えた同一
    人判定システムとして、コンピュータを機能させるため
    のコンピュータプログラムを担持したコンピュータ読み
    取り可能な記録媒体。
  10. 【請求項10】 文字列を表した文字コード列を入力す
    る文字入力手段と、 前記入力された文字コード列からシフトコードを削除す
    るシフトコード削除手段と、 前記入力された文字コード列内の個々の文字の文字コー
    ドを、統一した表記法に従う所定の正規化文字の文字コ
    ードに変換する文字変換手段と、を有する文字列正規化
    装置。
  11. 【請求項11】 文字列を表した文字コード列を入力す
    る過程と、 前記入力された文字コード列からシフトコードを削除す
    る過程と、 前記入力された文字コード列内の個々の文字の文字コー
    ドを、統一した表記法に従う所定の正規化文字の文字コ
    ードに変換する過程と、を有する文字列正規化方法。
  12. 【請求項12】 文字列を表した文字コード列を入力す
    る過程と、 前記入力された文字コード列からシフトコードを削除す
    る過程と、 前記入力された文字コード列内の個々の文字の文字コー
    ドを、統一した表記法に従う所定の正規化文字の文字コ
    ードに変換する過程と、を有する文字列正規化方法をコ
    ンピュータに実行させるためのプログラムを担持したコ
    ンピュータ読取可能な記録媒体。
JP35552697A 1997-12-24 1997-12-24 同一人判定システムおよび方法 Pending JPH11184884A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35552697A JPH11184884A (ja) 1997-12-24 1997-12-24 同一人判定システムおよび方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35552697A JPH11184884A (ja) 1997-12-24 1997-12-24 同一人判定システムおよび方法

Publications (1)

Publication Number Publication Date
JPH11184884A true JPH11184884A (ja) 1999-07-09

Family

ID=18444453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35552697A Pending JPH11184884A (ja) 1997-12-24 1997-12-24 同一人判定システムおよび方法

Country Status (1)

Country Link
JP (1) JPH11184884A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024539A (ja) * 2000-07-07 2002-01-25 Teranet:Kk 信用供与の個人識別システム
JP2006163941A (ja) * 2004-12-08 2006-06-22 Nec Corp 重複レコード検出システム、および重複レコード検出プログラム
JP2007172315A (ja) * 2005-12-22 2007-07-05 Nec Corp 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム
JP2008065494A (ja) * 2006-09-06 2008-03-21 Katsuyoshi Nagashima 住所名寄サーバおよび住所名寄方法
JP2008065592A (ja) * 2006-09-07 2008-03-21 Promise Co Ltd 信用情報照会システム及び信用情報照会方法、並びに信用情報照会プログラム及びこれを記憶した記憶媒体
JP2008192023A (ja) * 2007-02-07 2008-08-21 Promise Co Ltd 入金管理システム
JP2008192022A (ja) * 2007-02-07 2008-08-21 Promise Co Ltd 入金管理システム
JP2008192024A (ja) * 2007-02-07 2008-08-21 Promise Co Ltd 入金管理システム
JP2011511341A (ja) * 2008-01-16 2011-04-07 アビニシオ テクノロジー エルエルシー 近似文字列マッチングのためのアーカイブ管理法
JP2011181038A (ja) * 2010-03-04 2011-09-15 Nec System Technologies Ltd データ管理装置、データ登録方法、および、プログラム
US8484215B2 (en) 2008-10-23 2013-07-09 Ab Initio Technology Llc Fuzzy data operations
US8615521B2 (en) 2001-12-28 2013-12-24 International Business Machines Corporation Real time data warehousing
US9037589B2 (en) 2011-11-15 2015-05-19 Ab Initio Technology Llc Data clustering based on variant token networks
JP2015109027A (ja) * 2013-12-05 2015-06-11 テンソル・コンサルティング株式会社 情報処理装置、方法およびコンピュータプログラム

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024539A (ja) * 2000-07-07 2002-01-25 Teranet:Kk 信用供与の個人識別システム
US8615521B2 (en) 2001-12-28 2013-12-24 International Business Machines Corporation Real time data warehousing
JP2006163941A (ja) * 2004-12-08 2006-06-22 Nec Corp 重複レコード検出システム、および重複レコード検出プログラム
JP2007172315A (ja) * 2005-12-22 2007-07-05 Nec Corp 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム
JP2008065494A (ja) * 2006-09-06 2008-03-21 Katsuyoshi Nagashima 住所名寄サーバおよび住所名寄方法
JP2008065592A (ja) * 2006-09-07 2008-03-21 Promise Co Ltd 信用情報照会システム及び信用情報照会方法、並びに信用情報照会プログラム及びこれを記憶した記憶媒体
JP2008192023A (ja) * 2007-02-07 2008-08-21 Promise Co Ltd 入金管理システム
JP2008192022A (ja) * 2007-02-07 2008-08-21 Promise Co Ltd 入金管理システム
JP2008192024A (ja) * 2007-02-07 2008-08-21 Promise Co Ltd 入金管理システム
US8775441B2 (en) 2008-01-16 2014-07-08 Ab Initio Technology Llc Managing an archive for approximate string matching
JP2011511341A (ja) * 2008-01-16 2011-04-07 アビニシオ テクノロジー エルエルシー 近似文字列マッチングのためのアーカイブ管理法
US9563721B2 (en) 2008-01-16 2017-02-07 Ab Initio Technology Llc Managing an archive for approximate string matching
US8484215B2 (en) 2008-10-23 2013-07-09 Ab Initio Technology Llc Fuzzy data operations
US9607103B2 (en) 2008-10-23 2017-03-28 Ab Initio Technology Llc Fuzzy data operations
US11615093B2 (en) 2008-10-23 2023-03-28 Ab Initio Technology Llc Fuzzy data operations
JP2011181038A (ja) * 2010-03-04 2011-09-15 Nec System Technologies Ltd データ管理装置、データ登録方法、および、プログラム
US9037589B2 (en) 2011-11-15 2015-05-19 Ab Initio Technology Llc Data clustering based on variant token networks
US9361355B2 (en) 2011-11-15 2016-06-07 Ab Initio Technology Llc Data clustering based on candidate queries
US10503755B2 (en) 2011-11-15 2019-12-10 Ab Initio Technology Llc Data clustering, segmentation, and parallelization
US10572511B2 (en) 2011-11-15 2020-02-25 Ab Initio Technology Llc Data clustering based on candidate queries
JP2015109027A (ja) * 2013-12-05 2015-06-11 テンソル・コンサルティング株式会社 情報処理装置、方法およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
US11704494B2 (en) Discovering a semantic meaning of data fields from profile data of the data fields
US8452787B2 (en) Real time data warehousing
US8620937B2 (en) Real time data warehousing
US8015198B2 (en) Method for automatically indexing documents
JPH11184884A (ja) 同一人判定システムおよび方法
US6070169A (en) Method and system for the determination of a particular data object utilizing attributes associated with the object
JP4185399B2 (ja) 顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラムならびに顧客データ管理用プログラムを格納した記録媒体
CN115185980B (zh) 医院病案数据检索方法、装置、设备及存储介质
JP2018101244A (ja) データクレンジングシステム、データクレンジング方法及びデータクレンジングプログラム
CN114817686A (zh) 基于搜索排序的数据查询方法、装置、设备及介质
JP2019061492A (ja) 住所管理装置、住所管理方法、および、住所管理プログラム
JP2015106216A (ja) 住民住所管理システム及び住民住所管理方法
KR20220013314A (ko) 빅데이터 환경에서의 개인정보 비식별화 처리를 위한 데이터 필드 자동 분류 시스템 및 방법
CN116263774A (zh) 信息查询方法及查询装置
WO2023227186A1 (en) Pattern recognition and classification
JPS60247756A (ja) デ−タベ−ス装置
CN113626671A (zh) 基于字符匹配的数据分类方法、装置、设备以及存储介质
CN117786676A (zh) 一种敏感信息泄漏监测方法、装置、电子设备及存储介质
CN114356959A (zh) 基于多租户的sql解析方法、装置、计算机设备及存储介质
CN117056938A (zh) 一种基于公开漏洞的开源组件缺陷代码库建立方法及系统
JPH0934897A (ja) 図書管理システム
JPH0241565A (ja) シソーラス更新支援装置
JPH025130A (ja) 個人指紋照合方法
JPH07210578A (ja) 文字列特定方式
JPS6049480A (ja) データ検索装置

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040521

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20040526

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070807