JPH05135212A - 住所単語照合方法 - Google Patents
住所単語照合方法Info
- Publication number
- JPH05135212A JPH05135212A JP3323797A JP32379791A JPH05135212A JP H05135212 A JPH05135212 A JP H05135212A JP 3323797 A JP3323797 A JP 3323797A JP 32379791 A JP32379791 A JP 32379791A JP H05135212 A JPH05135212 A JP H05135212A
- Authority
- JP
- Japan
- Prior art keywords
- address
- word
- level
- display
- address word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
正確に再記入したり、正しい住所を入力し直さなくても
住所の照合を可能とする。 【構成】 照合すべき住所表示を都道府県レベルA、市
区郡レベルB及び区町村レベルCに区分して各レベル単
位で単語照合して実在する住所単語A,B,Cであるか
否かを判断し(ステップS1,S2)、いずれのレベル
の住所単語も実在する住所単語であれば、各レベル毎に
その上位レベルとの住所表示上の相関関係を判断し(ス
テップS9,S10)、相関関係がない場合は、相関関
係のある住所単語を各レベルの候補単語として単語辞書
から取り出して候補パターンとして保管し(ステップS
11〜S14)、エラーメッセージとともにその候補パ
ターンを表示する(ステップS8)。
Description
し、特に帳票などの被読取媒体から読み取りかつ文字認
識して得られる住所単語と辞書に登録されている住所単
語とを照合しつつ解読する光学式文字読取装置(以下、
OCR装置と称する)における住所単語照合方法に関す
るものである。
るOCR装置では、読取り認識率を向上させるために、
予め人名や地名等を辞書として保持しており、読み取っ
た単語と辞書の単語とを照合するようになっている。例
えば住所辞書の場合、1つの住所単語データが図5に示
す如きフォーマットとなっており、これら住所単語デー
タが、図6に示すように、都道府県レベル、市区郡レベ
ル及び区町村レベルの順に積み重ねられた階層構造とな
っている。
データ中に“県”や“市”などと思われる単語があった
場合、そこまでの文字列である住所単語、例えば“埼玉
県”を住所辞書と照合する。住所辞書には、埼玉県なら
ば、県内のすべての市郡レベル及び町村レベルの住所単
語が登録されているので、先ず“埼玉県”が照合されれ
ば、その先の単語照合では“埼玉県”の下位レベルを検
索していくようになっている。例えば、“埼玉県”の下
位レベルの“蕨市”、さらにその下位レベルの“中央”
というように上位レベルから下位レベルへ順に検索しつ
つ照合していくのである。
た従来の住所単語照合方法では、例えば記憶違いをして
媒体に例えば“埼玉県川口市中央……”と書いた場合な
どは、“埼玉県”の下位レベルの“川口市”までは辞書
通りであるが、住所表示上では、“川口市”の下位レベ
ルとして“中央”なる住所単語を含む住所が実在しない
ため、“川口市”の下位レベルを照合した時点で照合結
果がエラーとなり、住所を正確に再記入するか、正しい
住所を入力し直さなければならなかった。
のであって、住所の記載ミスなどがあった場合に、住所
を正確に再記入したり、正しい住所を入力し直さなくて
も住所の照合を可能とした住所単語照合方法を提供する
ことを目的とする。
合方法は、照合すべき住所表示を都道府県レベル、市区
郡レベル及び区町村レベルに区分して各レベル単位で単
語照合して実在する住所単語であるか否かを判断し、い
ずれのレベルの住所単語も実在する住所単語であれば、
各レベル毎にその上位レベルとの住所表示上の相関関係
を判断し、相関関係がない場合は、相関関係のある住所
単語を各レベルの候補単語として単語辞書から取り出し
て候補住所パターンを表示するようにしている。
た場合に、誤りである住所単語の上位レベルの住所単語
との住所表示上の相関関係から、正しい住所単語を候補
単語として選択することで、正しい住所表示の候補パタ
ーンを表示する。これにより、住所を正確に再記入した
り、正しい住所を入力し直す手間が省ける。
に説明する。図2は、本発明による住所単語照合方法が
適用されるOCR装置の構成の一例を示すブロック図で
ある。図において、帳票などの被読取媒体に記入された
住所は光学式読取部1によって読み取られる。この光学
式読取部1で読み取られた住所情報は文字認識部2に供
給される。この文字認識部2では、周知のパターンマッ
チング手法等を用いて文字の認識処理が行われ、候補文
字データがデータバッファに格納される。
録されており、その住所データのフォーマットは、図3
に示すように、住所単語の文字コードと、その上位レベ
ルのN個の親データの各アドレスとからなるデータ形式
となっている。そして、この単語単位の住所データは、
図4に示すような構成で住所辞書4に格納されている。
照合部3は例えばマイクロコンピュータによって構成さ
れており、この照合部3では、光学式読取部1で読み取
られかつ文字認識部2で文字認識して得られる住所情報
中の住所単語と住所辞書4に登録されている住所単語と
を照合する処理が後述する処理手順にしたがって行われ
る。その照合結果はディスプレイ5に表示される。
理手順につき、図1のフローチャートにしたがって説明
する。なお、本例では、都道府県レベルの住所単語を住
所単語A、市区郡レベルの住所単語を住所単語B、区町
村レベルの住所単語を住所単語Cとして説明する。
B,Cのそれぞれに関して住所辞書4を検索し(ステッ
プS1)、住所単語A,B,Cが共に存在するか、即ち
実在する住所単語であるか否かを判断する(ステップS
2)。住所単語A,B,Cのいずれか1つでも住所辞書
4に存在しなければ、住所として実在しないエラー単語
であるから、ディスプレイ5に単語エラーを表示出力し
(ステップS3)、本処理を終了する。
住所単語であれば、住所単語Cの上位レベルの親データ
DN 中に住所単語Bが存在するか否かを判断し(ステッ
プS4)、存在する場合には続いて、住所単語Bの上位
レベルの親データDN 中に住所単語Aが存在するか否か
を判断する(ステップS5)。住所単語Cの上位レベル
の親データDN 中に住所単語Bが存在し、さらに住所単
語Bの上位レベルの親データDN 中に住所単語Aが存在
する場合には、住所単語A,B,Cによる住所表示が正
規の住所表示であるから、本処理を終了する。
レベルの親データDN 中に住所単語Aが存在しないと判
定した場合には、住所単語Bの上位レベルの親データD
N を住所辞書4から取り出し(ステップS6)、この取
り出した親データDN を用いて正確な住所表示の候補パ
ターンとして住所単語DN ,B,Cを保管する(ステッ
プS7)。この場合、親データDN が複数存在する場合
には、当然のことながら候補パターンも同様に複数とな
る。そして、ディスプレイ5にエラーメッセージととも
に、全ての候補パターンを表示出力する(ステップS
8)。
の上位レベルの親データDN 中に住所単語Bが存在しな
いと判定した場合には、住所単語Cの上位レベルの親デ
ータDN 中に、住所単語Aを親データとして持っている
ものが存在するか否かを判断する(ステップS9)。例
えば、帳票の住所欄に“埼玉県川口市中央”と記載され
ていた場合、“川口市中央”という住所表示が実在しな
いことから、“中央”の上位の市区郡レベルの親データ
中に“川口市”が存在しないため、“中央”の上位の親
データ中に、“埼玉県”を親データとして持つ市区郡レ
ベルの住所単語を住所辞書4から検索するのである。
に、住所単語Aを親データとして持っているものが存在
しないと判定した場合には、住所単語Bの上位レベルの
親データDN 中に住所単語Aが存在するか否かを判断し
(ステップS10)、存在しない場合には、ステップS
8に移行する。この場合は、例えば“東京都蕨市千葉港
…”なる住所表示のように、全ての親データが異なる場
合であり、ステップS8ではエラーメッセージのみが表
示され、候補パターンの表示は行われないことになる。
DN 中に住所単語Aが存在する場合には、親データに住
所単語Bを持つデータを住所単語Dとして住所辞書4か
ら取り出し(ステップS11)、この取り出したデータ
Dを用いて正確な住所表示の候補パターンとして住所単
語A,B,Dを保管し(ステップS12)、しかる後ス
テップS8に移行してディスプレイ5にエラーメッセー
ジとともに、候補パターンを表示出力する。
レベルの親データDN 中に、住所単語Aを親データとし
て持っているものが存在すると判定した場合は、該当す
るデータを住所単語Dとして住所辞書4から取り出し
(ステップS13)、このデータDを用いて候補パター
ンの1つとして住所単語A,D,Cを保管する(ステッ
プS14)。例えば、“蕨市”が“埼玉県”を親データ
として持つ“中央”の親データであるから、候補パター
ンの1つ目の可能性として、“埼玉県蕨市中央”が挙げ
られる。
持したら、次にステップS10に移行して住所単語Bの
上位レベルの親データDN 中に住所単語Aが存在するか
否かを判断する。この場合、“川口市”の親データが
“埼玉県”であり、これは正しいため、“埼玉県川口
市”までが正しいという可能性を2つ目の候補パターン
とし(ステップS11,S12)、しかる後ステップS
8に移行してディスプレイ5にエラーメッセージととも
に、全ての候補パターンを表示出力する。
った場合に、誤りである住所単語の上位レベルの住所単
語との住所表示上の相関関係から、正しい住所単語を候
補単語として選択してエラーメッセージとともに候補パ
ターンを表示するようにしたことにより、住所を正確に
再記入したり、正しい住所を入力し直す手間が省け、住
所の記入ミスに対して即応できることになる。
れば、帳票等の住所欄への住所の記載ミスなどがあった
場合に、誤りである住所単語の上位レベルの住所単語と
の住所表示上の相関関係から、正しい住所単語を候補単
語として選択することで、正しい住所表示の候補パター
ンを表示するようにしたので、住所を正確に再記入した
り、正しい住所を入力し直す手間が省け、修正時間を短
縮できることになる。
すフローチャートである。
CR装置の構成の一例を示すブロック図である。
である。
る。
Claims (1)
- 【請求項1】 照合すべき住所表示を都道府県レベル、
市区郡レベル及び区町村レベルに区分して各レベル単位
で単語照合して実在する住所単語であるか否かを判断
し、 いずれのレベルの住所単語も実在する住所単語であれ
ば、各レベル毎にその上位レベルとの住所表示上の相関
関係を判断し、 相関関係がない場合は、相関関係のある住所単語を各レ
ベルの候補単語として単語辞書から取り出して候補住所
パターンを表示することを特徴とする住所単語照合方
法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3323797A JPH05135212A (ja) | 1991-11-12 | 1991-11-12 | 住所単語照合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3323797A JPH05135212A (ja) | 1991-11-12 | 1991-11-12 | 住所単語照合方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05135212A true JPH05135212A (ja) | 1993-06-01 |
Family
ID=18158723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3323797A Pending JPH05135212A (ja) | 1991-11-12 | 1991-11-12 | 住所単語照合方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05135212A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018116352A1 (ja) * | 2016-12-19 | 2018-06-28 | サン電子株式会社 | 情報処理装置 |
-
1991
- 1991-11-12 JP JP3323797A patent/JPH05135212A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018116352A1 (ja) * | 2016-12-19 | 2018-06-28 | サン電子株式会社 | 情報処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5933531A (en) | Verification and correction method and system for optical character recognition | |
JPS6262387B2 (ja) | ||
JPH05258099A (ja) | 文字認識処理装置 | |
JPH05135212A (ja) | 住所単語照合方法 | |
JPH064717A (ja) | 漢字住所補正処理方法 | |
JP2815707B2 (ja) | キーワード検索方法 | |
JP3361258B2 (ja) | 文字読取装置 | |
JP2000090192A (ja) | 住所および郵便番号の文字列修正方法 | |
JP2002207960A (ja) | 認識文字修正方法及び認識文字修正プログラム | |
JPH0546815A (ja) | 光学式文字読取装置における住所単語照合方法 | |
JP3045886B2 (ja) | 手書き入力機能付き文字処理装置 | |
JPH0256086A (ja) | 文字認識の後処理方法 | |
JP2942375B2 (ja) | 文字読取装置 | |
JP2000298701A (ja) | 宛先特定装置 | |
JP2922365B2 (ja) | Ocr処理システムにおける漢字住所データ処理方法 | |
JP2839515B2 (ja) | 文字読取システム | |
JP2002189743A (ja) | 情報登録システム | |
JPH04256193A (ja) | 認識文字の単語登録処理方式 | |
JP3335494B2 (ja) | 文字認識処理装置 | |
JPH01293463A (ja) | 文字処理装置 | |
JPS63268082A (ja) | パタ−ン認識装置 | |
JP2880387B2 (ja) | Ocr住所処理装置 | |
JPH0546806A (ja) | 文字認識方法 | |
JPH0589291A (ja) | 文字列認識装置 | |
JPS60138689A (ja) | 文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD04 | Notification of resignation of power of attorney |
Effective date: 20050905 Free format text: JAPANESE INTERMEDIATE CODE: A7424 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
A072 | Dismissal of procedure |
Effective date: 20051209 Free format text: JAPANESE INTERMEDIATE CODE: A072 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 7 Free format text: PAYMENT UNTIL: 20071208 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 8 Free format text: PAYMENT UNTIL: 20081208 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 8 Free format text: PAYMENT UNTIL: 20081208 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 9 Free format text: PAYMENT UNTIL: 20091208 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091208 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 10 Free format text: PAYMENT UNTIL: 20101208 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101208 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 11 Free format text: PAYMENT UNTIL: 20111208 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111208 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 12 Free format text: PAYMENT UNTIL: 20121208 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121208 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131208 Year of fee payment: 13 |
|
LAPS | Cancellation because of no payment of annual fees |