JP2921522B1 - データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体 - Google Patents

データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体

Info

Publication number
JP2921522B1
JP2921522B1 JP10048175A JP4817598A JP2921522B1 JP 2921522 B1 JP2921522 B1 JP 2921522B1 JP 10048175 A JP10048175 A JP 10048175A JP 4817598 A JP4817598 A JP 4817598A JP 2921522 B1 JP2921522 B1 JP 2921522B1
Authority
JP
Japan
Prior art keywords
database
name
record
address
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP10048175A
Other languages
English (en)
Other versions
JPH11250079A (ja
Inventor
秀樹 川辺
裕明 唐沢
好美 福村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10048175A priority Critical patent/JP2921522B1/ja
Application granted granted Critical
Publication of JP2921522B1 publication Critical patent/JP2921522B1/ja
Publication of JPH11250079A publication Critical patent/JPH11250079A/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【要約】 【課題】 結合率、結合信頼性を高くし、処理時間を短
縮させ、人手が不要となるようなデータベース結合方法
及び装置及びデータベース結合プログラムを格納した記
憶媒体を提供する。 【解決手段】 本発明は、第1のDBの各レコードを読
み込み、名義、収容先名について単語に分割し、第2の
DBよりレコードを抽出し、名義と収容先名について必
要な補正を行い、第1のDBから照合対象となるレコー
ドを、住所コードの一致度により設けた住所ステージを
参照して、抽出し、第2のDBのレコードを、抽出され
た照合対象となるレコードとを単語単位に照合し、名義
及び収容先名の照合結果に基づいて、名義、収容先名の
一致度合いにより結合の確からしさを一致レベルとして
点数付けした照合マトリックスを参照し、一致レベルを
付与し、一致レベルに基づいて第1のDBのレコードと
第2のDBのレコードの結合の可否を判断し、結合可と
なったレコードを結合して、結合DBに格納する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベース結合
方法及び装置及びデータベース結合プログラムを格納し
た記憶媒体に係り、特に、データベース処理において、
複数のデータベースを利用して情報案内サービスを実現
する際に、データベースをそれらの共通項目である名
義、住所等により自動的に照合して結合するためのデー
タベース結合方法及び装置及びデータベース結合プログ
ラムを格納した記憶媒体に関する。
【0002】
【従来の技術】従来、データベースの結合は、人手で行
う方法が主流である。両方のデータベースを照合するキ
ーにより当該データベースの情報をソートしておき、一
方のデータベースから1レコード取り出し、もう一方の
データベースを人が目視により共通項目を比較すること
により、結合対象レコードを選択し、結合させるもので
ある。
【0003】また、自動的に行う方法としては、2つの
方法が考えられている。1つは、データベースのJOI
N操作を利用する方法であり、キー項目によりデータベ
ースをソートしておき、照合する方法である。もう一つ
は、特願平5−117251に開示されているように、
単なるJOIN操作ではなく、項目毎のゆらぎ処理を行
い、項目の内容を信頼性評価値を用いて自動的に結合す
る方法である。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の技術における人手による方法では、データベースが
数十件程度であればよいが、数百件あるいは、数百万件
と増えていくと、人手で行うと膨大な作業工数がかか
る。また、結合させたとしても両データベースの更新に
合わせた結合のメンテナンスを定期的に行うことを考え
ると、人手で行う方法は、実用上殆ど不可能である。
【0005】また、自動的に行う方法では、自動的に結
合させることによる人手作業の削減が可能であるが、結
合率、あるいは、自動結合の信頼性が問題になる。JO
IN操作による単純な結合では、結合率(自動的に結合
できるレコードの件数割合)は、40%程度である、残
りをやはり人手で結合させることになるため、人手作業
が半減するだけであり、実用的な方法ではない。
【0006】また、特願平5−117251で開示され
ている方法では、JOIN操作のみよりも結合率、結合
信頼性(自動的に結合されたレコードのうち正しく結合
されていた件数割合)とも高いが、やはり最後には人手
による結合が必要である。さらに、項目のゆらぎ処理を
行うため、処理時間がかかる。本発明は、上記の点に鑑
みなされたもので、結合率、結合信頼性を高くし、処理
時間を短縮させ、人手が不要となるようなデータベース
結合方法及び装置及びデータベース結合プログラムを格
納した記憶媒体を提供することを目的とする。
【0007】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明(請求項1)は、名
義、住所、収容先名、及びその他の情報を持つ2種類の
データベースを、該名義、該住所、該収容先名により照
合し、該2種類のデータベースを結合した結合データベ
ースを生成するデータベース結合方法において、第1の
データベースの各レコードを読み込み、名義、収容先名
について単語に分割し(ステップ1)、第2のデータベ
ースよりレコードを抽出し、名義と収容先名について、
単語分割及び必要な補正を行い(ステップ2)、第1の
データベースの読み込まれたレコードから照合対象とな
るレコードを、住所コードの一致度合いを定義した住所
ステージを参照して、抽出し(ステップ3)、第2のデ
ータベースのレコードを、抽出された照合対象となるレ
コードと単語単位に照合し、名義及び収容先名の照合結
果に基づいて、名義、収容先名の一致度合いにより結合
の確からしさを一致レベルとして点数付けした照合マト
リックスを参照し、一致レベルを付与し(ステップ
4)、一致レベルに基づいて第1のデータベースのレコ
ードと第2のデータベースのレコードの結合の可否を判
断し(ステップ5)、結合可となったレコードを結合し
て、結合データベースに格納する(ステップ6)。
【0008】本発明(請求項2)は、第2のデータベー
スより抽出されたレコードの住所コード及び職業コード
で、住所コード及び職業コード及び名義を含む抽出位置
が格納された対象掲載一覧記憶手段を参照して、照合に
使用する名義部分を抽出する。本発明(請求項3)は、
第2のデータベースのレコードを、抽出された照合対象
となるレコードと単語単位に照合する前に、第1のデー
タベースのレコード及び第2のデータベースのレコード
の名義及び収容先名に対して、少なくとも単語、住所コ
ード、頻度、単語の意味及び振り仮名が格納された振り
仮名辞書を参照して、単語単位に振り仮名を付与する。
【0009】本発明(請求項4)は、第1のデータベー
スの照合対象となるレコードを抽出する際に、住所コー
ドと該住所コードに隣接する住所の住所コードが格納さ
れている隣接住所テーブルを参照して抽出する。図2
は、本発明の原理構成図である。
【0010】本発明(請求項5)は、名義、住所、収容
先名、及びその他の情報を持つ2種類のデータベース
を、該名義、該住所、該収容先名により照合し、該2種
類のデータベースを結合した結合データベースを生成す
るデータベース結合装置であって、住所コードの一致度
合いを定義した住所ステージ1000と、名義、収容先
の一致度合いにより結合の確からしさを一致レベルとし
て点数付けした照合マトリックス700と、結合対象の
第1のデータベース200及び第2のデータベース30
0と、第1のデータベース200の各レコードを読み込
み、名義、収容先名について単語に分割する単語分割手
段110と、第2のデータベース300よりレコードを
抽出するレコード抽出手段120と、レコード抽出手段
120により抽出されたレコードの名義と収容先名につ
いて、単語分割及び必要な補正を行う単語分割/補正手
段140と、第1のデータベース200の読み込まれた
レコードから照合対象となるレコードを、住所ステージ
を参照して、抽出する照合対象レコード抽出手段170
と、第2のデータベース300のレコードと、抽出され
た照合対象となるレコードとを単語単位に照合し、名義
及び収容先名の照合結果に基づいて、照合マトリックス
700を参照し、一致レベルを付与する照合手段180
と、照合手段180で付与された一致レベルに基づいて
第1のデータベースのレコードと第2のデータベース3
00のレコードの結合の可否を判断する照合判定手段1
90と、結合可となったレコードを結合して、結合デー
タベース1100に格納する結合手段195とを有す
る。
【0011】本発明(請求項6)は、レコード抽出手段
120において、住所コード、職業コード及び名義を含
む抽出位置を格納する対象掲載一覧ファイルと、第2の
データベース300より抽出されたレコードの住所コー
ド及び職業コードで、対象掲載一覧記憶手段を参照し
て、照合に使用する名義部分を抽出する対象掲載抽出手
段とを含む。
【0012】本発明(請求項7)は、レコード抽出手段
120において、単語、住所コード、頻度、単語の意
味、及び振り仮名を含む振り仮名辞書と、第1のデータ
ベース200及び第2のデータベース300のレコード
の名義及び収容先名に対して、振り仮名辞書を参照し
て、振り仮名を単語単位に付与する振り仮名付与手段を
含む。
【0013】本発明(請求項8)は、照合対象レコード
抽出手段170において、住所コードと該住所コードに
隣接する住所の住所コードが格納された隣接住所記憶手
段と、第1のデータベース200のレコードを抽出する
際に、隣接住所記憶手段を参照して、照合対象となるレ
コードを抽出する手段を含む。
【0014】本発明(請求項9)は、名義、住所、収容
先名、及びその他の情報を持つ2種類のデータベース
を、該名義、該住所、該収容先名により照合し、該2種
類のデータベースを結合した結合データベースを生成す
るデータベース結合装置に搭載されるデータベース結合
プログラムを格納した記憶媒体であって、第1のデータ
ベースの各レコードを読み込み、名義、収容先名につい
て単語に分割する単語分割プロセスと、第2のデータベ
ースよりレコードを抽出し、名義と収容先名について、
単語の分割及び必要な補正を行う単語分割/補正プロセ
スと、第1のデータベースから照合対象となるレコード
を、住所コードの一致度合いを定義した住所ステージを
参照して、抽出する照合対象レコード抽出プロセスと、
第2のデータベースのレコードを、抽出された照合対象
となるレコードとを単語単位に照合し、名義及び収容先
名の照合結果に基づいて、名義、収容先名の一致度合い
により結合の確からしさを一致レベルとして点数付けし
た照合マトリックスを参照し、一致レベルを付与する照
合プロセスと、一致レベルに基づいて第1のデータベー
スのレコードと第2のデータベースのレコードの結合の
可否を判断する照合判定プロセスと、結合可となったレ
コードを結合して、結合データベースに格納する結合プ
ロセスとを有する。
【0015】本発明(請求項10)は、第2のデータベ
ースより抽出されたレコードの住所コード及び職業コー
ドで、住所コード及び職業コード及び名義を含む抽出位
置が格納された対象掲載一覧記憶手段を参照して、照合
に使用する名義部分を抽出するプロセスを含む。本発明
(請求項11)は、第2のデータベースのレコードを、
抽出された照合対象となるレコードとを単語単位に照合
する前に、第1及び第2のデータベースレコードの名義
及び収容先名に対して、少なくとも単語、住所コード、
頻度、単語の意味及び振り仮名が格納された振り仮名辞
書を参照して、単語単位に振り仮名を付与するプロセス
を含む。
【0016】本発明(請求項12)は、第1のデータベ
ースの照合対象となるレコードを抽出する際に、住所コ
ードと該住所コードに隣接する住所の住所コードが格納
されている隣接住所テーブルを参照して抽出するプロセ
スを含む。 上記のように、本発明では、データベース
の結合において、データベース内でゆらぎの少ない項目
により照合対象を絞って照合し、結合対象がない場合
に、順次照合レコードを拡大していくため、従来に較べ
て処理時間の短縮が可能となる。さらに、ゆらぎ処理を
高度化し、照合可否判断を各項目毎の一致度合いにより
詳細に設定しているため、高い結合率、結合信頼性の実
現が可能となる。
【0017】
【発明の実施の形態】図3は、本発明のデータベース結
合装置の構成を示す。同図に示すデータベース結合装置
100は、制御部101、前処理部110、レコード抽
出処理部120、対象掲載抽出処理部130、データ補
正処理部140、単語分割処理部150、振り仮名付与
部160、照合対象レコード抽出処理部170、照合処
理部180及び結合判定処理部190から構成される。
当該データベース結合装置100に接続され、各処理部
において使用されるデータベースB200、データベー
スA300、住所コード、職業コード及び名義等の抽出
位置を格納する対象掲載一覧ファイル400、単語と住
所コードと頻度と単語の意味と振り仮名等を格納する振
り仮名辞書500、住所コードとそれに隣接する住所の
住所コードを格納する隣接住所テーブル600、名義、
収容先の一致度合いにより結合の確からしさを一致レベ
ルとして点数付けした照合マトリックス700、ワーク
エリア800、ワークデータベース900、住所コード
の一致度合いを定義した住所ステージ1000及び結合
データベース1100がある。
【0018】前処理部110は、データベースA300
の各レコードを読み込み、名義、収容先名を単語に分割
する。また、分割された単語毎に振り仮名辞書500を
参照して振り仮名を付与する。レコード抽出処理部12
0は、データベースB200よりレコードを抽出する。
【0019】対象掲載抽出処理部130は、住所コー
ド、職業コード及び名義等の抽出一を格納する対象掲載
一覧ファイル400を参照し、照合に使用する名義部分
を抽出する。データ補正処理部140は、収容先、名義
に各種補正処理を加える。単語分割処理部150は、前
処理110で読み込まれたデータベースA300のレコ
ードを単語単位に分割する。
【0020】振り仮名付与処理部160は、単語分割処
理部150で分割された単語毎に振り仮名辞書500を
参照して振り仮名を付与する。照合対象レコード抽出処
理部170は、データベースB200から結合対象とな
るレコードを住所コードの一致度により設けた住所ステ
ージを参照し、抽出する。
【0021】照合処理部180は、データベースA30
0のレコードを、照合対象レコード抽出処理部170で
抽出されたデータベースB200のレコードとを単語単
位に照合し、当該名義、収容先名の照合結果により照合
マトリックス700を参照し、一致レベルを付与する。
照合判定処理部190は、照合処理部180で付与され
た一致レベルにより結合の可否を判定する。
【0022】図4は、本発明のデータベース結合処理の
動作を示すフローチャートである。 ステップ100) 前処理過程:データベースB200
の各レコードを読み込み、名義、収容先名を単語に分割
する。 ステップ200) レコード抽出処理過程:データベー
スA300よりレコードを抽出する。
【0023】ステップ300) 対象掲載抽出処理過
程:データベースA300の抽出されたレコードの住所
コード及び職業コードで対象掲載一覧ファイル400を
参照し、照合に使用する名義部分を抽出する。 ステップ400) データ補正処理過程:収容先、名義
に各種補正処理を加える。
【0024】ステップ500) 単語分割処理過程:デ
ータベースA300の1レコードを読み込み、名義、収
容先名を単語に分割する。 ステップ600) ふりがな付与処理過程:名義、収容
先に対して振り仮名辞書500を参照しながら、分割さ
れた単語に振り仮名を付与する。
【0025】ステップ700) 照合対象レコード抽出
処理過程:データベースB200から隣接住所テーブル
600も利用して照合対象となるレコードを住所コード
の一致度により設けられた住所ステージ1000を参照
し、抽出する。 ステップ800) 照合処理過程:データベースA30
0のレコードを照合対象レコード抽出処理過程(ステッ
プ700)で抽出された、データベースB200のレコ
ードと単語単位に照合し、名義、収容先名の照合結果に
より照合マトリックス700を参照し、一致レベルを付
与する。
【0026】ステップ900) 照合処理過程(ステッ
プ800)にて付与された一致レベルにより結合の可否
を判定する。結合可となったレコードを結合データベー
ス1000に格納する。
【0027】
【実施例】以下、図面と共に本発明の実施例を説明す
る。本実施例では、結合するデータベースのうち、デー
タベースA300を電話帳データベース300とし、デ
ータベースB200として地図データベース200を取
り上げ、電話帳データベース300と地図データベース
200を結合して結合データベース1100を生成する
処理を例として説明する。
【0028】図5は本発明の一実施例の電話帳データベ
ースの構成を示し、図6は本発明の一実施例の地図デー
タベースの構成を示し、図7は、本発明の一実施例の結
合データベースの構成を示す。図5に示す電話帳データ
ベース300は、名義、住所、ビル名、職業コード、電
話番号、及びその他の情報を格納する。
【0029】図6に示す地図データベース200は、名
義、住所、ビル名、地図座標及びその他の情報を格納す
る。電話帳データベース300と地図データベース20
0は、共通項目として、名義、住所、ビル名を持ってい
る。名義、ビル名は自然語で、住所は住所コードで記述
されている。住所コードは、都道府県コード部、市区コ
ード部、町コード部、丁目コード部、街区コード部、地
番コード部からなる。名義は、主掲載(会社名)と副掲
載(会社内の組織、部課名)の内容をスラッシュで区切
ってある。例えば、 日本電信電話株式会社/東京本社/総務部/総務課 のように区切られる。
【0030】図7に示す電話帳データベース300は、
電話番号、地図座標、及びその他の情報を格納する。以
下の実施例では、名義、住所、ビル名を利用した照合処
理を説明する。以下、図4のフローチャートに沿ってデ
ータベース結合処理の動作を説明する。
【0031】ステップ100) まず、地図データベー
ス200の各レコードを読み込み、名義、ビル名を単語
に分割し、振り仮名辞書500を参照しながら付与され
た振り仮名と併せて地図用のワークデータベース900
に格納する。単語分割処理は、名義、ビル名を構成する
単語に分割し、各単語に意味付けする形態素解析処理で
ある。例えば、ビル名を例にとってみると、 『NTT不動産築地ビル』 なるビル名に対して、単語分割処理を行い、 『NTT(企業名)/不動産(職業)/築地(地名)/
ビル(建物語尾)』 の出力を得る(上記において、括弧内は単語に付与した
意味を表す)。
【0032】ステップ200) 次に、レコード抽出処
理として、電話帳データベース300より1レコード取
り出し、ワークエリア800に格納する。抽出する電話
帳レコードがない場合には当該結合処理を終了する。ス
テップ300) ワークエリア800から1レコード取
り出し、当該レコードの住所コード及び職業レコードで
対象掲載一覧ファイル400を参照する。ここで、一致
する住所コードがなければ、レコードをワークエリア8
00にそのまま格納する。一致するレコードがある場合
には、一致レコードにて指示された掲載内該当部分のみ
を抽出し、ワークエリア400に格納する。以下に具体
的な例を示す。
【0033】電話帳レコードが、 住所コード:13(東京都)/101(千代田区) 名義 :警視庁/警察署/荻窪警察署 職業コード:89025 のとき、対象掲載一覧ファイル400を検索し、住所コ
ード及び職業コードが一致する 13,89025,3 を探し出す。住所コードは、都道府県コードから地番コ
ードまでのうち最長一致するコードを探し出す。選択掲
載番号が“3”のため、スラッシュで区切られた部分の
中から3番目の「荻窪警察署」を抽出する。当該過程
は、名義と地図上の名義の間で登録の差異を吸収するも
のである。電話帳上の名義は、お客さまから申告された
名義のあめ、組織階層構造が入っているが、地図上の名
義は、地図作成会社が独自に調べたもののため、組織階
層が正しく入っておらず、一般的に使われている名称部
分(上記の例では、実際の警察署名)のみが使われてい
る。一般的に使われる名称部分は、地域及び職業により
異なるため、本処理では、対象掲載一覧ファイル400
を利用し、照合に必要な部分のみを抽出する。電話帳デ
ータに職業コードがない場合は当該処理を実施しなけれ
ばよい。
【0034】ステップ400) 次に、データ補正処理
として、ワークエリア800から1レコード取り出し、
建物名、名義に各種補正処理を加え、ワークエリア80
0に格納する。各種補正処理は、以下の通りである。 ・長音の補正:先頭の長音類の削除等を行う。
【0035】例/ ーパークヒルズ → パークヒル
ズ ・濁音、半濁音の補正: 独立した濁音・半濁音を前方文字に結合する等の処理を
行う。 ・空白削除補正:空白を削除する。
【0036】例/ 山下△ビル → 山下ビル (△は
空白を表す) ・不要文字削除補正:「!」、「*」などの記号的文字
を削除する。 ・括弧補正:開き括弧と閉じ括弧の対応がない括弧を削
除する等の処理を行う。 例/ NTTビル(NTT生命 → NTTビル ・異体字補正:旧字を新字に変換する。 例/ 澤 → 沢 ステップ500) 単語分割処理過程では、電話帳デー
タベース300の1レコードを読み込み、名義、ビル名
を単語に分割し、ワークエリア800に格納する。地図
データの単語分割処理過程(ステップ100)と同様の
処理を行う。
【0037】ステップ600) 振り仮名付与処理過程
では、ワークエリア800から1レコード抽出し、名
義、ビル名に対して、振り仮名辞書500を参照しなが
ら、振り仮名を付与し、ワークエリア800に格納す
る。 ステップ700) 照合対象レコード抽出処理過程で
は、地図用のワークデータベース900から照合対象と
なるレコードを抽出し、ワークエリア800に格納す
る。
【0038】ステップ800) 照合処理過程では、電
話帳データベース300の1レコードをワークエリア8
00から取り出し、照合対象レコード抽出処理過程(ス
テップ700)で抽出されたワークエリア800内の各
地図レコードと照合し、一致レベルを付与する。 ステップ900) 最後に、照合判定処理では、照合マ
トリックス700を参照し、結合の可否を判断する。結
合可であれば、結合データベース1100に出力し、レ
コード抽出処理過程(ステップ200)に移行する。照
合対象レコード抽出処理過程(ステップ700)に移行
する。
【0039】次に、上記のステップ600における振り
仮名付与処理に過程における振り仮名付与処理について
具体的に説明する。本処理は、名義、ビル名に対して行
う。本処理は、単語分割された名義、ビル名にて、振り
仮名辞書500を検索し、振り仮名名を付与する処理で
ある。図8は、本発明の一実施例の振り仮名付与処理フ
ローチャートである。
【0040】ステップ601) 企業名振り仮名府書処
理では、振り仮名辞書500内で企業名の意味を付与さ
れている単語群を使い、振り仮名を付与する。本処理過
程では、企業名の意味を付与されている単語群のみを振
り仮名辞書検索の対象とする。まず、分割結果を全て連
結して振り仮名辞書500を検索する。ヒットしない場
合は、後から単語を1つずつ外し、再検索する。また、
ヒットした場合は、振り仮名辞書500にある意味を設
定し、単語分割方法を変更する。例を以下に示す。
【0041】NTT(企業名)/不動産(職業)/築地
(地名)/大和(地名)/ビル(建物語尾) に対し、振り仮名辞書500で『NTT不動産、築地、
大和』でヒットした場合、 NTT(企業名)/築地(地名)/大和(地名)/ビル
(建物語尾) のように、単語分割を変更し、 エヌティティフドウサン(企業名)/築地(地名)/大
和(地名)/ビル(建物語尾) の振り仮名を付与する。ヒットした場合は、意味付与し
た次の単語から上記手順を繰り返す。上記の例では、
『NTT不動産』に振り仮名を付与した後、『築地大和
ビル』で振り仮名辞書500を検索する。当該処理過程
を1単語でもヒットしなくなるまで繰り返す。全ての単
語に振り仮名の付与が完了した場合は、振り仮名付与処
理を終了する。
【0042】ステップ602) 住所単語振り仮名付与
処理過程では、振り仮名の付与されていない先頭単語に
て、振り仮名辞書500を検索し、振り仮名を付与す
る。本処理過程では、振り仮名辞書検索にて住所名の意
味を付与されている単語群の中で、住所コードに包含の
あるものを振り仮名辞書検索の対象とする。振り仮名検
索辞書検索にてヒットした場合は、住所コードをチェッ
クし、包含される住所の振り仮名を付与する。例えば、 築地(地名)/ビル(建物語尾) 住所:13(東京
都) に対して、振り仮名辞書500にて、 築地,ツキジ,13,頻度2 築地,チクシ,30,頻度3 がヒットした場合、住所の包含のある前者を選択し、
「ツキジ」の振り仮名を付与する。すべての単語に振り
仮名の付与が完了した場合は、振り仮名付与処理を終了
する。
【0043】ステップ603) 一般単語振り仮名付与
処理過程では、振り仮名の付与されていない先頭単語に
て、振り仮名辞書500を検索し、振り仮名を付与す
る。本処理過程では、振り仮名辞書検索にて住所名ある
いは、一般単語の意味を付与されている単語群を振り仮
名辞書検索の対象とする。振り仮名辞書500上の一般
単語及び住所単語の複数候補にヒットし、住所単語の住
所コードでの包含がない場合は、頻度をチェックし、頻
度の高い振り仮名を付与する。
【0044】例えば、 大和(地名)/ビル(建物語尾) 住所:13(東京
都) に対して、振り仮名辞書500にて、 大和,ヤマト,14, 頻度1 大和,ダイワ,37, 頻度3 がヒットした場合、頻度の高い後者を選択し、「ダイ
ワ」の振り仮名を付与する。すべての単語に振り仮名を
付与し終えた場合は、振り仮名付与処理を終了する。
【0045】ステップ604) 未知語処理過程では、
振り仮名の付与されていない先頭単語について、企業名
振り仮名付与処理過程(ステップ601)、住所単語振
り仮名付与処理過程(ステップ602)、一般単語振り
仮名付与処理過程(ステップ603)にて振り仮名を付
与できなかった単語について処理する。単語が英字、数
字、ひらなが、カタカナのみの文字種で構成されている
場合には、ひらがなをカタカナに変換する。単語に英
字、数字、ひらがな、カタカナ以外の文字種が含まれる
場合には未知語として“*”(アスタリスク1つ)を設
定しておく。振り仮名を付与していない単語が残ってい
る場合は、企業名振り仮名付与処理過程(ステップ60
1)に移行し、全ての単語に振り仮名名を付与し終えた
場合は、振り仮名付与処理を終了する。
【0046】次に、照合対象レコード抽出処理過程(ス
テップ700)における照合対象レコード抽出処理につ
いて説明する。図9は、本発明の一実施例の住所ステー
ジの例を示す。以下、同図を用いて説明する。照合対象
レコードは、図9の住所ステージ順に抽出する。各住所
ステージの条件に合致する地図レコードを抽出する。住
所ステージ番号の小さい方を上位ステージとし、後述の
照合判定処理過程(ステップ800)にて優先される候
補となる。
【0047】最初に本過程を実施する際は、「住所ステ
ージ1」の条件で候補を抽出する。照合対象レコードが
なければ、順次「住所ステージ2」、「住所ステージ
3」と、照合対象レコードあるまで行う。照合判定処理
過程(ステップ900)にて、結合確定にならずに他の
候補を探すべく本過程に遷移した場合は、前述した本過
程を実施した際に、照合候補を抽出した住所ステージの
次の住所ステージから照合候補を抽出する。
【0048】「住所ステージ1」にて照合候補を抽出
し、結合確定にならなかった場合は、「住所ステージ
2」から照合候補を探す。ここで、隣接町とは、各住所
に隣接する住所のことで、隣接町テーブル600に登録
されている。「住所ステージ7」の場合、電話帳レコー
ドに入っている住所にて隣接町テーブル600内のレコ
ードを都道府県コードから丁目コードまでがキー部で最
長で一致するものを条件として検索する。ヒットした場
合、該当する隣接住所を取得し、取得した住所内での地
図レコードを検索し、照合候補として抽出する。
【0049】次に、照合処理過程(ステップ800)に
ついて説明する。図10は、本発明の一実施例の照合処
理のフローチャートであり、図11は、本発明の一実施
例の照合マトリックスの例である。同図において、枠内
の数字がそれぞれの一致レベルを示す。以下、図10、
図11を用いて具体的に説明する。
【0050】この処理では、名義、ビル名の各々に対し
て、6種類の照合を行い、最後に照合マトリックス70
0により一致レベルを付与する。各照合では、電話帳と
地図の名義、ビル名をそれぞれ同じ意味が付与されてい
る単語単位に比較する。また、電話帳、地図のどちらか
のビル名、名義がない場合には、補完処理として、以下
の2つを行って照合する。 ・ビル名の比較において、ビル名のないレコードに対し
ては名義と照合する。 ・名義の比較において、名義のないレコードに対しては
ビル名と照合する。
【0051】以下に照合方法を説明する。 ステップ801) 完全一致1照合処理過程では、完全
に一致するかどうかを漢字表記、正規化後漢字表記、振
り仮名、正規化後振り仮名の4パターンにて照合する。 ステップ802) 完全一致2照合処理過程では、漢字
表記、正規化後漢字表記、振り仮名、正規化後振り仮名
の4パターンに対して、中点、スラッシュ、法人種別等
の補助文字を削除して照合する。
【0052】ステップ803) ゆらぎ削除一致照合処
理過程では、漢字表記、正規化後漢字表記、振り仮名、
正規化後振り仮名の4パターンに対して、長音、カタカ
ナ拗促音、ひらがな拗促音等のゆらぎ文字を削除して照
合する。揺らぎ文字削除は、例えば、「コンピュータ」
を「コンピタ」に変換するものである。 ステップ804) 核情報一致照合処理過程では、漢字
表記、正規化後漢字表記、振り仮名、正規化後振り仮名
の4パターンに対して、副掲載(部課等の会社内の組織
名)、棟名、階名、号名を照合対象外とし、さらに、
『寺処理』、『駅処理』を行った結果にて照合する。
【0053】『寺処理』は、最終単語の最終文字が
「寺」で、かつそれ以前に単語に最終文字が「宗」
「派」の単語がある場合、「宗」「派」より前を削除す
る処理である。例えば、「○○宗/××寺」を「××
寺」にする。『駅処理』は、最終単語の最終文字が
「駅」で、かつそれ以前に単語に最終文字が「線」の単
語がある場合、「線」より前を削除する処理である。
「○○線/××駅」を「××駅」にする。
【0054】ステップ805) 固有情報一致照合処理
過程では、漢字表記、正規化後漢字表記、振り仮名、正
規化後振り仮名の4パターンに対して、建物語尾、動
詞、商品、地名、職業語尾の意味の付いた単語を照合対
象外として照合する。 ステップ806) 姓情報一致照合処理過程では、漢字
表記、正規化後漢字表記、振り仮名、正規化後振り仮名
の4パターンに対して、姓、企業名、企業複合語名の意
味の付いた単語のみ照合対象として照合する。
【0055】各照合ステップにおける正規化とは、英数
字カタカナ変換処理、拗促音変換処理等からなる。各照
合にて一致した場合、一致レベルが割り振られる。一致
レベルは、照合マトリックス700を名義の一致ステッ
プ、ビル名の一致ステップの2項目により参照し、取得
する。図11に示す照合マトリックス700は、名義の
一致度とビル名の一致度毎に点数が付与されている。ま
た、後述する結合判定にて使用する情報である結合即確
定か、結合保留かの区別が記述されている。
【0056】本処理過程では、例えば、名義が完全一致
2、ビル名が固有名一致の場合、「19」という点数が
付与される。照合は完全一致1照合処理過程(ステップ
801)から始め、名義、ビル名とも照合対象の地図レ
コードすべてと照合し、照合対象の地図レコード全てに
一致レベルを付与する。次に、照合判定処理過程(ステ
ップ900)での結合確定判断方法について説明する。
図12は、本発明の一実施例の結合判定処理のフローチ
ャートである。
【0057】照合処理(ステップ800)にて結合候補
となった地図データの中で、どれを電話帳データと結合
するかを決定する。照合対象レコード抽出処理過程(ス
テップ700)にて照合対象の地図レコードを抽出した
住所ステージを考慮し、ステージ数の小さい方を上位ス
テージとする。また、一致レベルは数字の小さい方を一
致レベルが高いと考える。同一住所ステージの照合の中
で結合候補の地図データが複数存在する場合には、最も
一致レベルの高いものが採用される。結合判定するにあ
たり、各住所レベルごとに結合対象の確定判定レベルと
して以下の3レベルが予め設定されている。各レベルの
意味は以下の通りである。
【0058】[確定レベル]結合候補の中で最も一致レ
ベルが高いものが確定レベル以上である場合には、その
候補を結合対象とする。 [保留レベル]現住所ステージの結合候補の中で最も一
致レベルが高いものが確定レベルに達していない場合、
その候補が保留レベル以上であれば、その候補を保留
し、次の住所ステージの照合結果と共に判定する。
【0059】[保留採用レベル]現住所ステージの結合
候補の中で最も一致レベルが高いものが保留採用レベル
に達していない場合、上位住所ステージで保留されてい
る候補を結合対象とする。レベルの設定のイメージは、
以下の通りである。
【0060】
【表1】
【0061】例えば、住所ステージnでは、一致レベル
g以上であれば結合確定し、一致レベルi以下の候補は
保留される。住所ステージn+1に、一致レベルg以上
の候補があれば確定し、一致レベルf以下であれば住所
ステージnにて保留されていた候補に結合確定する。以
下に図12のフローチャートに基づいて詳細に説明す
る。
【0062】ステップ901) 現住所ステージにて、
照合処理を行った結果、結合対象候補があるかどうかを
チェックする。あれば条件2処理過程(ステップ90
2)に移行し、なければ条件5処理過程(ステップ90
6)に移行する。ステップ902) 条件2処理過程で
は、前住所ステージにて保留とされた候補があるかどう
かチェックする。あれば、条件3処理過程(ステップ9
03)へ、なければ条件4処理過程(ステップ905)
に移行する。
【0063】ステップ903) 条件3処理過程では、
現住所ステージでの候補は、保留採用レベル以下かどう
かをチェックする。保留採用レベル以上であれば候補選
定処理過程(ステップ904)へ、保留採用レベル以下
であれば、結合可否判定3処理(ステップ911)に移
行する。 ステップ904) 候補選定過程では、現住所ステージ
で見つけた候補と前住所ステージにて保留された候補の
うち、一致レベルの高い方を候補として残す。
【0064】ステップ905) 条件4処理過程では、
このされた候補が確定レベル以上かどうかをチェックす
る。確定レベル以上であれば、結合可否判定2処理過程
ステップ910に移行し、確定レベル以上でなければ結
合可否判定1処理過程(ステップ909)に移行する。 ステップ906) 条件5処理過程では、前ステージか
ら保留候補があるかどうかをチェックする。あれば条件
6処理過程(ステップ907)へ、なければ結合可否判
定5処理過程(ステップ913)に移行する。
【0065】ステップ907) 条件6処理過程では、
現住所ステージの保留採用レベルが設定されているかど
うかをチェックする。設定されていれば結合可否判定3
処理(ステップ911)へ移行し、設定されていなけれ
ば条件7処理過程(ステップ908)に移行する。 ステップ908) 条件7処理過程では、前ステージか
ら保留候補が確定レベル以上かどうかをチェックする。
確定レベル以上であれば、結合可否判定3処理過程(ス
テップ911)に移行し、そうでなければ、結合可否判
定4処理過程(ステップ912)に移行する。
【0066】ステップ909) 結合可否判定1処理過
程では、候補を保留候補として次の住所ステージに移行
する。 ステップ910) 結合可否判定2処理過程では、候補
を結合対象として確定し、次の電話帳レコードの照合に
移行する。 ステップ911) 結合可否判定3処理過程では、前住
所ステージの保留候補を結合対象として確定し、次の電
話帳レコードの照合に移行する。
【0067】ステップ912) 結合可否判定4処理過
程では、候補を一切保留せず、次の住所ステージに移行
する。 ステップ913) 結合可否判定5処理過程では、次の
住所ステージに移行する。 また、上記の実施例では、図3の構成及び図4の動作に
基づいて説明したが、この例に限定されることなく、図
3の構成要素における図4の動作をプログラムとして構
築し、データベース結合装置として利用されるコンピュ
ータに接続されるディスク装置や、フロッピーディスク
やCD−ROM等の可搬記憶媒体に格納しておき、本発
明を実施する際に、インストールすることにより容易に
本発明を実現することが可能である。
【0068】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0069】
【発明の効果】上述のように、本発明によれば、従来に
比べて、高い結合率、結合信頼性が実現できる。本発明
を実施した結果、結合率は90%、結合信頼性は訳95
%を実現している。人手による結合を行っても結合率は
90%なので、本発明により人手作業と略同じ結合率を
取得できることから人手作業が不要となる。また、処理
時間も短縮することができるため、データベースの結合
を利用した情報案内サービスが実用可能となる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明のデータベース結合装置の構成図であ
る。
【図4】本発明のデータベース結合処理の動作を示すフ
ローチャートである。
【図5】本発明の一実施例の電話帳データベースの構成
例である。
【図6】本発明の一実施例の地図データベースの構成例
である。
【図7】本発明の一実施例の結合データベースの構成例
である。
【図8】本発明の一実施例の振り仮名付与処理のフロー
チャートである。
【図9】本発明の一実施例の住所ステージの例である。
【図10】本発明の一実施例の照合処理のフローチャー
トである。
【図11】本発明の一実施例の照合マトリックスの例で
ある。
【図12】本発明の一実施例の結合判定処理のフローチ
ャートである。
【符号の説明】
100 データベース結合装置 101 制御部 110 前処理部、単語分割手段 120 レコード抽出処理部、レコード抽出手段 130 対象掲載抽出処理部 140 データ補正処理部、単語分割/補正手段 150 単語分割処理部 160 振り仮名付与処理部 170 照合対象レコード抽出部 180 照合処理部、照合手段 190 結合判定処理部、照合判定手段 195 結合手段 200 データベースB,第1のデータベース 300 データベースA,第2のデータベース 400 対象掲載一覧ファイル 500 振り仮名辞書 600 隣接住所テーブル 700 照合マトリックス 800 ワークエリア 900 ワークデータベース 1000 住所ステージ 1100 結合データベース
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 17/30 G06F 12/00 512 JICSTファイル(JOIS)

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 名義、住所、収容先名、及びその他の情
    報を持つ2種類のデータベースを、該名義、該住所、該
    収容先名により照合し、該2種類のデータベースを結合
    した結合データベースを生成するデータベース結合方法
    において、 第1のデータベースの各レコードを読み込み、前記名
    義、前記収容先名について単語に分割し、 第2のデータベースよりレコードを抽出し、前記名義と
    前記収容先名について、単語分割及び必要な補正を行
    い、 前記第1のデータベースの読み込まれたレコードから照
    合対象となるレコードを、住所コードの一致度合いを定
    義した住所ステージを参照して、抽出し、 前記第2のデータベースのレコードを、抽出された前記
    照合対象となるレコードと単語単位に照合し、前記名義
    及び前記収容先名の照合結果に基づいて、名義、収容先
    名の一致度合いにより結合の確からしさを一致レベルと
    して点数付けした照合マトリックスを参照し、一致レベ
    ルを付与し、 前記一致レベルに基づいて前記第1のデータベースのレ
    コードと前記第2のデータベースのレコードの結合の可
    否を判断し、 結合可となったレコードを結合して、結合データベース
    に格納することを特徴とするデータベース結合方法。
  2. 【請求項2】 前記第2のデータベースより抽出された
    レコードの住所コード及び職業コードで、住所コード及
    び職業コード及び名義を含む抽出位置が格納された対象
    掲載一覧記憶手段を参照して、照合に使用する名義部分
    を抽出する請求項1記載のデータベース結合方法。
  3. 【請求項3】 前記第2のデータベースのレコードを、
    抽出された前記照合対象となるレコードと単語単位に照
    合する前に、前記第1のデータベース及び第2のデータ
    ベースレコードの前記名義及び前記収容先名に対して、
    少なくとも単語、住所コード、頻度、単語の意味及び振
    り仮名が格納された振り仮名辞書を参照して、単語単位
    に振り仮名を付与する請求項1記載のデータベース結合
    方法。
  4. 【請求項4】 前記第1のデータベースの照合対象とな
    るレコードを抽出する際に、 住所コードと該住所コードに隣接する住所の住所コード
    が格納されている隣接住所テーブルを参照して抽出する
    請求項1記載のデータベース結合方法。
  5. 【請求項5】 名義、住所、収容先名、及びその他の情
    報を持つ2種類のデータベースを、該名義、該住所、該
    収容先名により照合し、該2種類のデータベースを結合
    した結合データベースを生成するデータベース結合装置
    であって、 住所コードの一致度合いを定義した住所ステージと、 名義、収容先の一致度合いにより結合の確からしさを一
    致レベルとして点数付けした照合マトリックスと、 結合対象の第1のデータベース及び第2のデータベース
    と、 前記第1のデータベースの各レコードを読み込み、前記
    名義、前記収容先名について単語に分割する単語分割手
    段と、 前記第2のデータベースよりレコードを抽出するレコー
    ド抽出手段と、 前記レコード抽出手段により抽出されたレコードの前記
    名義と前記収容先名について単語の分割及び必要な補正
    を行う単語分割/補正手段と、 前記第1のデータベースの読み込まれたレコードから照
    合対象となるレコードを、前記住所ステージを参照し
    て、抽出する照合対象レコード抽出手段と、 前記第2のデータベースのレコードと、抽出された前記
    照合対象となるレコードとを単語単位に照合し、前記名
    義及び前記収容先名の照合結果に基づいて、前記照合マ
    トリックスを参照し、一致レベルを付与する照合手段
    と、 前記照合手段で付与された前記一致レベルに基づいて前
    記第1のデータベースのレコードと前記第2のデータベ
    ースのレコードの結合の可否を判断する照合判定手段
    と、 結合可となったレコードを結合して、結合データベース
    に格納する結合手段とを有することを特徴とするデータ
    ベース結合装置。
  6. 【請求項6】 前記レコード抽出手段は、 住所コード、職業コード及び名義を含む抽出位置を格納
    する対象掲載一覧ファイルと、 前記第2のデータベースより抽出されたレコードの住所
    コード及び職業コードで、前記対象掲載一覧記憶手段を
    参照して、照合に使用する名義部分を抽出する対象掲載
    抽出手段とを含む請求項5記載のデータベース結合装
    置。
  7. 【請求項7】 前記レコード抽出手段は、 単語、住所コード、頻度、単語の意味、及び振り仮名を
    含む振り仮名辞書と、 前記第1のデータベース及び前記第2のデータベースの
    レコードの前記名義及び前記収容先名に対して、前記振
    り仮名辞書を参照して、単語単位に振り仮名付与する振
    り仮名付与手段を含む請求項5記載のデータベース結合
    装置。
  8. 【請求項8】 前記照合対象レコード抽出手段は、 住所コードと該住所コードに隣接する住所の住所コード
    が格納された隣接住所記憶手段と、 第1のデータベースのレコードを抽出する際に、前記隣
    接住所記憶手段を参照して、前記照合対象となるレコー
    ドを抽出する手段を含む請求項5記載のデータベース結
    合装置。
  9. 【請求項9】 名義、住所、収容先名、及びその他の情
    報を持つ2種類のデータベースを、該名義、該住所、該
    収容先名により照合し、該2種類のデータベースを結合
    した結合データベースを生成するデータベース結合装置
    に搭載されるデータベース結合プログラムを格納した記
    憶媒体であって、 第1のデータベースの各レコードを読み込み、前記名
    義、前記収容先名について単語に分割する単語分割プロ
    セスと、 第2のデータベースよりレコードを抽出し、前記名義と
    前記収容先名について単語分割及び必要な補正を行う単
    語分割/補正プロセスと、 前記第1のデータベースから照合対象となるレコード
    を、住所コードの一致度合いを定義した住所ステージを
    参照して、抽出する照合対象レコード抽出プロセスと、 前記第2のデータベースのレコードを、抽出された前記
    照合対象となるレコードとを単語単位に照合し、前記名
    義及び前記収容先名の照合結果に基づいて、名義、収容
    先名の一致度合いにより結合の確からしさを一致レベル
    として点数付けした照合マトリックスを参照し、一致レ
    ベルを付与する照合プロセスと、 前記一致レベルに基づいて前記第1のデータベースのレ
    コードと前記第2のデータベースのレコードの結合の可
    否を判断する照合判定プロセスと、 結合可となったレコードを結合して、結合データベース
    に格納する結合プロセスとを有することを特徴とするデ
    ータベース結合プログラムを格納した記憶媒体。
  10. 【請求項10】 前記第2のデータベースより抽出され
    たレコードの住所コード及び職業コードで、住所コード
    及び職業コード及び名義を含む抽出位置が格納された対
    象掲載一覧記憶手段を参照して、照合に使用する名義部
    分を抽出するプロセスを含む請求項9記載のデータベー
    ス結合プログラムを格納した記憶媒体。
  11. 【請求項11】 前記第2のデータベースのレコード
    を、抽出された前記照合対象となるレコードとを単語単
    位に照合する前に、前記第1のデータベースのレコード
    及び該第2のデータベースのレコードの前記名義及び前
    記収容先名に対して、少なくとも単語、住所コード、頻
    度、単語の意味及び振り仮名が格納された振り仮名辞書
    を参照して、単語単位に振り仮名付与するプロセスを含
    む請求項9記載のデータベース結合プログラムを格納し
    た記憶媒体。
  12. 【請求項12】 前記第1のデータベースの照合対象と
    なるレコードを抽出する際に、 住所コードと該住所コードに隣接する住所の住所コード
    が格納されている隣接住所テーブルを参照して抽出する
    プロセスを含む請求項9記載のデータベース結合プログ
    ラムを格納した記憶媒体。
JP10048175A 1998-02-27 1998-02-27 データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体 Expired - Lifetime JP2921522B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10048175A JP2921522B1 (ja) 1998-02-27 1998-02-27 データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10048175A JP2921522B1 (ja) 1998-02-27 1998-02-27 データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JP2921522B1 true JP2921522B1 (ja) 1999-07-19
JPH11250079A JPH11250079A (ja) 1999-09-17

Family

ID=12796061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10048175A Expired - Lifetime JP2921522B1 (ja) 1998-02-27 1998-02-27 データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP2921522B1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU780926B2 (en) * 1999-08-03 2005-04-28 Bally Technologies, Inc. Method and system for matching data sets
JP3466534B2 (ja) * 2000-04-03 2003-11-10 株式会社ゼンリンデータコム 地図用店舗登録装置および登録方法
JP2002157349A (ja) * 2000-09-08 2002-05-31 Shinken Ad:Kk 学生募集支援方法、そのプログラム、及び、そのプログラムが記録された記録媒体
JP2006260483A (ja) * 2005-03-18 2006-09-28 Toshiba Corp 顔照合システム及び顔照合方法
JP2008122183A (ja) * 2006-11-10 2008-05-29 Denso Corp 施設情報処理装置及びプログラム
WO2010134440A1 (ja) * 2009-05-19 2010-11-25 株式会社エヌ・ティ・ティ・ドコモ データ結合システム及びデータ結合方法
JP5606303B2 (ja) * 2010-12-17 2014-10-15 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム
JP5526057B2 (ja) * 2011-02-28 2014-06-18 株式会社東芝 データ分析支援装置およびプログラム
JP5356584B2 (ja) * 2012-07-26 2013-12-04 株式会社三菱東京Ufj銀行 認証システム、認証方法、及びプログラム

Also Published As

Publication number Publication date
JPH11250079A (ja) 1999-09-17

Similar Documents

Publication Publication Date Title
US6874002B1 (en) System and method for normalizing a resume
US6169972B1 (en) Information analysis and method
US5819265A (en) Processing names in a text
US5745745A (en) Text search method and apparatus for structured documents
US5832480A (en) Using canonical forms to develop a dictionary of names in a text
JPH10229449A (ja) 電話帳の登録項目から話を認識した語彙を自動的に生成する方法および装置、並びに、話認識システムにおいて使用される、話を認識した語彙を生成するためにコンピュータに命令をするためのプログラム要素を記録したコンピュータ読み取り可能な記録媒体
JP2921522B1 (ja) データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体
US20050065947A1 (en) Thesaurus maintaining system and method
JP4185399B2 (ja) 顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラムならびに顧客データ管理用プログラムを格納した記録媒体
JP2003173345A (ja) データベース生成装置、データベース生成方法及びデータベース生成処理プログラム
KR20000039018A (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
JP3517345B2 (ja) 住所情報による異種データの結合処理方法および装置
JP3350556B2 (ja) 検索システム
JP2019061492A (ja) 住所管理装置、住所管理方法、および、住所管理プログラム
JPH07192053A (ja) 顧客名の読みを決定する方法およびこの方法を実施する顧客名集約方法
JP2922365B2 (ja) Ocr処理システムにおける漢字住所データ処理方法
JP3317904B2 (ja) 省略名称抽出装置、方法および記録媒体
JP2001101000A (ja) 自然言語対話装置及び方法
JP2757769B2 (ja) 自動索引作成装置
JPH05334360A (ja) 名称認識方法
JPS61133487A (ja) 文字認識装置
JPS60247756A (ja) デ−タベ−ス装置
JP3495253B2 (ja) 住所情報を持つ異種データ自動結合の誤り排除方法およびその処理装置
JP2839515B2 (ja) 文字読取システム
JPH04211868A (ja) Cd―romデータの検索用キーワードの作成方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090430

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090430

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100430

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100430

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110430

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120430

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140430

Year of fee payment: 15

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term