JP2000011096A - 文字認識処理装置及び方法並びに記憶媒体 - Google Patents

文字認識処理装置及び方法並びに記憶媒体

Info

Publication number
JP2000011096A
JP2000011096A JP10190964A JP19096498A JP2000011096A JP 2000011096 A JP2000011096 A JP 2000011096A JP 10190964 A JP10190964 A JP 10190964A JP 19096498 A JP19096498 A JP 19096498A JP 2000011096 A JP2000011096 A JP 2000011096A
Authority
JP
Japan
Prior art keywords
address
postal code
candidate
place name
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10190964A
Other languages
English (en)
Inventor
Shuichi Morisawa
秀一 森澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10190964A priority Critical patent/JP2000011096A/ja
Publication of JP2000011096A publication Critical patent/JP2000011096A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 住所の認識精度が向上すると共に処理効率及
び処理速度の向上が図れる文字認識処理装置及び方法並
びに記憶媒体を提供する。 【解決手段】 記載住所を読み取ったOCR1から認識
した文字列を受け取って、住所辞書を参照しながら解析
する住所の解析処理において、ステップS208、S2
09で全国の住所の県市町等各階層毎の地名と認識文字
を対比して地名候補の尤度付けを行い、ステップS21
3で認識文字列の解析が終了したときに、尤度が基準以
上の階層地名により複数の住所候補が選択され、ステッ
プS216において、指定地名に属する住所候補を決定
住所として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票等に記載され
た住所の文字列を文字読み取り装置で読み取り、読み取
った文字列から住所を認識する文字認識処理装置及び方
法並びにその方法を実行するプログラムを格納した記憶
媒体に関する。
【0002】
【従来の技術】帳票等に手書き等で記載された住所をO
CR等の文字読み取り装置で読み取り、読み取った文字
列に基づいて住所を認識する文字認識処理装置は従来知
られている。このような装置においては、文字読み取り
装置により認識した文字列が、日本全国の現存する住所
の内の一つに合致することにより住所を特定し出力す
る。この場合、文字読み取り装置により誤認識された文
字列の部分を住所辞書を参照して言語的に訂正した上で
住所を特定する。即ち、読みとられた文字列が住所辞書
中の住所のいずれとも一致しない場合は、誤って認識し
たと思われる文字列に対応する1又は2以上の住所候補
を住所辞書から読み出し、最も類似度が高い、即ち、尤
もらしさが一番大きい住所候補を選択するようにしてい
る。
【0003】例えば、記載された住所が「広島県福山
市」であった場合、OCR等の文字読み取り装置による
文字認識結果が「右島県郡山市」となったとする。この
ような住所辞書にはない住所が認識された場合、OCR
から入力した文字列「右島県郡山市」の第1文字「右」
に誤認されやすい文字の候補、第2文字である「島」に
誤認されやすい文字の候補と、文字列の全6文字に関す
る候補文字からなる住所候補を複数作成し、日本全国の
住所データを保持する住所辞書を参照して、尤もらしさ
(以下尤度という)が一番高い住所候補を選択して、認
識した住所として出力する。
【0004】上記例において、第1文字の「右」の候補
文字である「広」「福」の類似度及び第4文字の「郡」
の候補文字である「福」の類似度に基づく住所候補の尤
度を比較し、「福島県郡山市」のほうが僅かながらも尤
度が高い場合は無条件に「福島県郡山市」と特定し出力
していた。
【0005】このように、文字読み取り装置により住所
を解析処理する文字認識処理においては、日本全国の住
所データを保持する住所辞書はサイズが膨大なため外部
記憶装置に保持せざるを得ず、住所の解析時に必要に応
じて外部記憶装置にアクセスして処理装置のメモリに必
要な住所データをその都度転送して解析処理を行ってい
た。
【0006】
【発明が解決しようとする課題】記載された住所の文字
列を文字読み取り装置で読み取り、文字認識処理により
住所を認識する従来の方法においては、複数の住所候補
が存在する場合は、尤度の大きい方の住所候補を無条件
に認識した住所として出力しており、また、日本全国の
住所データを参照して、OCRによる文字の誤認識を同
一基準で訂正していたため、記載住所とはかけ離れた住
所を出力することがあり、認識精度が不十分であった。
【0007】更に、従来の住所解析処理を行う文字認識
処理においては、日本全国の住所データを保持する住所
辞書はサイズが膨大であるためディスク等の外部記憶装
置に保持させておき、住所解析処理に必要な住所データ
のみをその都度解析処理装置のメモリに転送させるた
め、外部記憶装置と解析処理装置間のデータの出し入れ
を頻繁に行わねばならず、住所データをデスクから読み
出す際のオーバーヘッドの発生により処理効率が悪く且
つ処理速度が低いものであった。
【0008】このような住所解析処理を行う文字認識処
理装置は、地方自治体の役所や企業の地方支店または営
業所で使用されることも多く、このような場合は記載さ
れた住所が役所等が存在する地域範囲に限定されている
ことが多い。
【0009】本発明はこのような点に着目し、解析処理
する頻度の高い住所の属する地域を予め指定することに
より、住所の認識精度が向上すると共に処理効率及び処
理速度の向上が図れる文字認識処理装置及び方法並びに
記憶媒体を提供することを目的とする。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、本発明の第1の発明の文字認識処理装置によれば、
文字読み取り装置で読み取られた文字列を受け取る文字
列受け取り手段と、住所の地名を階層化されたツリー構
造として記憶する住所辞書と、任意個数の地名を指定し
て入力する地名情報入力手段と、前記受け取った文字列
を前記住所辞書を参照しながら解析して住所候補を得る
解析手段と、前記解析手段より得られた住所候補が前記
地名情報入力手段により入力された指定地名に属するか
否かに基づいて住所を決定する住所決定手段とを備える
ことを特徴とする。
【0011】また、前記地名情報入力手段により入力さ
れる地名は、都道府県単位、または市区町村もしくはそ
れより細分化された単位の地名であってもよい。
【0012】また、前記地名情報入力手段は、前記地名
として任意桁の郵便番号を入力するようにしてもよい。
【0013】更にまた、前記解析手段は、前記住所辞書
中の前記地名情報入力手段により入力された地名に該当
する住所部分を地名情報入力時に前記解析手段の記憶手
段に格納することが好ましい。
【0014】上記目的を達成するため、本発明の第1の
発明の文字認識処理方法に依れば、文字読み取り装置で
読み取られた文字列を受け取る文字列受け取りステップ
と、任意個数の地名を指定して入力する地名情報入力ス
テップと、前記受け取った文字列を、住所の地名を階層
化されたツリー構造として記憶する住所辞書を参照しな
がら解析して住所候補を得る解析ステップと、前記解析
ステップより得られた住所候補が前記地名情報入力ステ
ップにより入力された指定地名に属するか否かに基づい
て住所を決定する住所決定ステップとを備えることを特
徴とする。
【0015】また、前記地名情報入力ステップにより入
力される地名は、都道府県単位、または市区町村もしく
はそれより細分化された単位の地名であってもよい。
【0016】また、前記地名情報入力ステップは、前記
地名として任意桁の郵便番号を入力するようにしてもよ
い。
【0017】更にまた、前記解析ステップは、前記住所
辞書中の前記地名情報入力ステップにより入力された地
名に該当する住所部分を地名情報入力時に前記解析手段
の記憶手段に格納することが好ましい。
【0018】上記目的を達成するため、本発明の第1の
発明の記憶媒体に依れば、文字認識処理方法を実行する
プログラムを格納した記憶媒体であって、前記文字認識
処理方法が、文字読み取り装置で読み取られた文字列を
受け取る文字列受け取りステップと、任意個数の地名を
指定して入力する地名情報入力ステップと、前記受け取
った文字列を、住所の地名を階層化されたツリー構造と
して記憶する住所辞書を参照しながら解析して住所候補
を得る解析ステップと、前記解析ステップより得られた
住所候補が前記地名情報入力ステップにより入力された
指定地名に属するか否かに基づいて住所を決定する住所
決定ステップとを備えることを特徴とする。
【0019】上記目的を達成するため、本発明の第2の
発明の文字認識処理装置に依れば、文字読み取り装置で
読み取られた文字列を受け取る文字列受け取り手段と、
住所の地名を階層化されたツリー構造として記憶する住
所辞書と、郵便番号と対応する地名を記憶する郵便番号
辞書と、前記受け取った文字列の郵便番号部分を前記郵
便番号辞書を参照しながら解析して郵便番号候補を得る
郵便番号解析手段と、前記郵便番号候補に対応する住所
を前記住所辞書より検索し、前記受け取った文字列の住
所部分を前記検索した住所を参照しながら解析して住所
候補を得る住所解析手段とを備えることを特徴とする。
【0020】上記目的を達成するため、本発明の第2の
発明の文字認識処理方法に依れば、文字読み取り装置で
読み取られた文字列を受け取る文字列受け取りステップ
と、前記受け取った文字列の郵便番号部分を、郵便番号
と対応する地名を記憶する郵便番号辞書を参照しながら
解析して郵便番号候補を得る郵便番号解析ステップと、
前記郵便番号候補に対応する住所を、住所の地名を階層
化されたツリー構造として記憶する住所辞書から検索
し、前記受け取った文字列の住所部分を、前記検索した
住所を参照しながら解析して住所候補を得る住所の解析
ステップとを備えることを特徴とする。
【0021】上記目的を達成するため、本発明の第2の
発明の記憶媒体に依れば、文字認識処理方法を実行する
プログラムを格納した記憶媒体であって、前記文字認識
処理方法が、文字読み取り装置で読み取られた文字列を
受け取る文字列受け取りステップと、前記受け取った文
字列の郵便番号部分を、郵便番号と対応する地名を記憶
する郵便番号辞書を参照しながら解析して郵便番号候補
を得る郵便番号解析ステップと、前記郵便番号候補に対
応する住所を、住所の地名を階層化されたツリー構造と
して記憶する住所辞書から検索し、前記受け取った文字
列の住所部分を、前記検索した住所を参照しながら解析
して住所候補を得る住所解析ステップとを備えることを
特徴とする。
【0022】上記目的を達成するため、本発明の第3の
発明の文字認識処理装置に依れば、文字読み取り装置で
読み取られた文字列を受け取る文字列受け取り手段と、
住所の地名を階層化されたツリー構造として記憶する住
所辞書と、郵便番号と対応する地名を記憶する郵便番号
辞書と、前記受け取った文字列の郵便番号部分を、前記
郵便番号辞書を参照しながら解析して郵便番号候補を得
る郵便番号解析手段と、前記受け取った文字列の住所部
分を、前記住所辞書を参照しながら解析して住所候補を
得る住所解析手段と、前記住所解析手段より得られた住
所候補が前記郵便番号解析手段により得られた郵便番号
候補に対応する住所に属するか否かに基づいて住所を決
定する住所決定手段とを備えることを特徴とする。
【0023】上記目的を達成するため、本発明の第3の
発明の文字認識処理法に依れば、文字読み取り装置で読
み取られた文字列を受け取る文字列受け取りステップ
と、前記受け取った文字列の郵便番号部分を、郵便番号
と対応する地名を記憶する郵便番号辞書を参照しながら
解析して郵便番号候補を得る郵便番号解析ステップと、
前記受け取った文字列の住所部分を、住所の地名を階層
化されたツリー構造として記憶する住所辞書を参照しな
がら解析して住所候補を得る住所解析ステップと、前記
住所解析ステップで得られた住所候補が前記郵便番号解
析ステップで得られた郵便番号候補に対応する住所に属
するか否かに基づいて住所を決定する住所決定ステップ
とを備えることを特徴とする。
【0024】上記目的を達成するため、本発明の第3の
発明の記憶媒体に依れば、文字認識処理方法を実行する
プログラムを格納した記憶媒体であって、前記文字認識
処理方法が、文字読み取り装置で読み取られた文字列を
受け取る文字列受け取りステップと、前記受け取った文
字列の郵便番号部分を、郵便番号と対応する地名を記憶
する郵便番号辞書を参照しながら解析して郵便番号候補
を得る郵便番号解析ステップと、前記受け取った文字列
の住所部分を、住所の地名を階層化されたツリー構造と
して記憶する住所辞書を参照しながら解析して住所候補
を得る住所解析ステップと、前記住所解析ステップで得
られた住所候補が前記郵便番号解析ステップで得られた
郵便番号候補に対応する住所に属するか否かに基づいて
住所を決定する住所決定ステップとを備えることを特徴
とする。
【0025】
【発明の実施の形態】以下、本発明の実施の形態を添付
図面を参照して詳細に説明する。
【0026】図1は、本発明に係る文字認識処理装置の
一実施の形態の主要構成を示すブロック図である。
【0027】図において、1はOCR(光学的文字読み
取り装置)であり、帳票等に記載された手書きによる住
所や郵便番号の文字列を読み取り、読み取った文字列の
画像データをキャラクタ・コードに変換する。2はキー
ボード等の文字入力装置であり、本装置のオペレータが
住所解析処理に必要な都道府県や郵便番号等の地名情報
を管内情報(地名情報)として必要に応じて入力する際
に用いる。3は管内情報記憶部であり、キーボード2か
ら入力された管内情報を記憶する。4は住所解析部であ
り、OCR1で読み取られた記載住所の認識文字列を受
け取り、住所辞書8を参照してOCR1からの誤認識文
字を考慮に入れながら、その候補文字を類似度の高い順
に組み合わせて、入力した認識文字列全体が住所辞書8
に存在する住所に一致する文字列となるように解析処理
を行って住所候補を作成し、各住所候補毎に候補文字の
類似度に基づいて尤度を算出する。
【0028】5は郵便番号解析部であり、OCR1で読
み取られた郵便番号の文字認識結果を受け取り、住所解
析部4が行うと同様の解析処理を郵便番号の認識文字列
について行う。即ち、候補文字を組み合わせ、後述する
郵便番号辞書を参照して該当する住所を住所候補として
作成する。6は最適住所候補作成部であり、住所解析部
4と郵便番号解析部5とにより得られた住所候補のうち
から、管内情報記憶部3及び後述する矛盾検出部からの
情報を参照しながら、OCR1の認識文字列から得られ
た最も適した住所を決定し出力する。
【0029】7は結果出力部であり、最適住所作成部6
で得られた住所を出力するためのもので、文字認識処理
装置がOCR1の付属装置である場合は当該住所は結果
出力部7からOCR1に転送され、OCR1とは独立し
た独自のGUI(graphical user in
terface)を持つ文字認識処理装置である場合
は、結果出力部7から出力する住所は当該GUIを介し
て表示される。8は住所辞書であり、日本全国の地名を
都道府県から区市郡、区町村または丁目レベルまで、ツ
リー状の階層構造で保持格納するものである。9は郵便
番号辞書であり、郵便番号から該当する住所を検索し、
また住所から郵便番号を検索するためのものである。1
0は候補矛盾検出部であり、住所解析部4と郵便番号解
析部5により作成された住所候補を比較し、矛盾する組
み合わせを排除するためのものである。
【0030】次に、図2乃至図6のフローチャートを参
照して、本実施の形態に係る文字認識処理方法による住
所解析処理について詳述する。尚、説明に用いる郵便番
号や住所は現実のものとは異なっているものを使用する
場合があるが、それにより本発明の効果が制限されるも
のではない。
【0031】帳票等の住所欄に記載された住所、例えば
「広島県福山市呉」をOCR1が読み取って、文字認識
結果を本文字認識処理装置に入力する。入力される文字
認識結果は、図7に示す如く、各文字位置における認識
された文字コードに、その文字コードが元の記載された
住所の文字と類似する度合いを表す「類似度」が付記さ
れた複数の候補文字が類似度の高い順に格納されたもの
である。図7には候補順位第1位から第3位までの候補
文字を示しているが、処理に必要な任意個数の候補文字
をOCR1から受け取ることができる。
【0032】図7におけるインデックスとは、入力する
文字列の各文字位置を表すもので、先頭文字位置が0で
始まる。この入力住所の例ではOCR1の文字認識結果
は、インデックス0の候補文字が類似度の高い順に
「山」(類似度20)、「川」(類似度15)、「徳」
(類似度10)であり、第2文字であるインデックス1
の候補文字が「島」(類似度20)、「鳥」(類似度1
5)、「烏」(類似度10)、第3文字であるインデッ
クス2の候補文字が「県」(類似度20)、「具」(類
似度15)、「見」(類似度10)である。以下図7に
例示する通りのインデックス3〜インデックス5の候補
文字とその類似度がOCR1から入力される。
【0033】図2に示すフローチャートのステップS1
01において、OCR1から受け取った文字認識結果中
に郵便番号があるか否かを判定し、上記例の場合のよう
に郵便番号の文字がない場合は、入力文字認識結果は住
所解析部4に渡されてステップS200において住所解
析が行われる。住所解析に先立ってステップS102に
おいて、指定地名が入力される。管内情報記憶部3に
は、予めオペレータによりキーボード1から「広島県」
が管内情報として入力されて記憶されている。住所辞書
8に格納されている住所データは、図8に示す通り日本
全国の住所を最上位階層の都道府県レベルから第2階層
の区市郡レベル、第3階層の区町丁村レベル、その下位
階層のレベルとで構成したツリー状の階層構造となって
いる。
【0034】先ず、図5及び図6を参照して、本発明の
第1の実施の形態であるステップS200における住所
解析の手順について説明する。この住所解析は住所解析
部4により行われる。図5のステップS201におい
て、入力した文字列の先頭文字、即ちインデックス0に
該当する候補文字をすべて切り出し、次いで最上位階層
の都道府県の文字に該当するインデックス2までの候補
文字を順次切り出す。ステップS202において、住所
辞書8の住所データから最上位階層の都道府県の地名を
すべて検索して地名リストを作成し、ステップS203
において、地名リスト中の都道府県名のインデックス毎
の文字と認識文字列の候補文字とを対比し、一致した候
補文字の類似度を該当する都道府県名毎に加算し、加算
した結果を当該都道府県名候補の尤度とする。
【0035】即ち、北海道から沖縄までの全都道府県名
の先頭文字とインデックス0の全候補文字とを対比す
る。次に地名の2番目の文字とインデックス1の全候補
文字とを対比し、一致した候補文字があるときは地名毎
に一致した候補文字の類似度を加算し、一致した候補文
字の類似度の合計を都道府県名毎の尤度とする。上記住
所例の場合、「北海道」ではインデックス0〜インデッ
クス2の候補文字中に一致する文字がないので、認識文
字が「北海道」である尤度は0+0+0=0となる。
「青森県」の場合は、インデックス0、インデックス1
には「青森」に該当する候補文字は無く、「県」のみが
該当するので、「青森県」の尤度は0+0+20=20
となる。「福島県」の場合は、「福」はインデックス0
の候補文字にはないが、「島県」は夫々インデックス
1、インデックス2の第1候補文字と一致するので、
「福島県」の尤度は40となる。
【0036】全都道府県名についてこのような候補文字
との一致による尤度を算出した結果、図9に示すように
「広島県」「福島県」が尤度40、「徳島県」が尤度5
0を夫々持つ。ステップS204において最大尤度を示
す住所候補の尤度が所定の基準以下であるか否かを判定
する。基準は対象となった地名階層の取り得る上限文字
数に依存して決定される。上記判定の結果、基準以下の
場合は、ステップS207において住所辞書8の第2階
層の区市郡レベルの全地名を検索して地名リストを作成
し、ステップS203に戻って入力した文字列と地名リ
スト中の区市郡の地名全てに対して上述と同様の対比を
行い地名ごとに尤度を付与する。帳票に記載された住所
に都道府県が省略されていた場合は、このような処理に
より区市郡名の住所候補が選択される。
【0037】例えば、記入住所が「大田区下丸子」であ
り、OCR1による認識文字が図10に示すような候補
文字となった場合、第1階層の都道府県レベルの地名候
補は第11図(a)に示すように「秋田県」が尤度2
0、「大阪府」が尤度15、「大分県」が尤度15でい
ずれもステップS204における判定において基準以下
となるとする。このような場合はステップS207で第
2階層の区市群レベルの地名リストが作成され、ステッ
プS203において、地名リスト中の全地名と図10に
示す候補文字とをインデックス順に対比し、地名候補の
尤度付けを行う。その結果、図11(a)に示すよう
に、上記3県の市レベルの地名はいずれも尤度35以下
であり、図11(b)に示す「太田市」が尤度55、
「大田区」が尤度45となる。
【0038】ステップS204において、都道府県また
はその下位層の区市群レベルの地名候補の最大尤度が基
準を越えると判定された場合は、ステップS205にお
いて尤度の大きい順に複数の候補が選択される。前記
「広島県福山市呉」の住所例の場合は「福島県」「広島
県」「徳島県」が候補として選択され、ステップS20
6において、これらの候補の第2階層の区市郡の地名を
住所辞書8から検索して地名リストを作成し、ステップ
S208において、入力した文字列から前ステップで解
析処理した都道府県階層に相当するインデックス0〜2
を除いたインデックス3の候補文字から順に切り出し、
ステップS209においてステップS203で行ったと
同様の処理を行い、第2階層の地名に対し尤度を計算す
る。
【0039】図7に示す候補文字を参照して尤度を算出
すると、「福島県」の第2階層の地名である「福島市」
の場合はインデックス3の第2候補文字と一致するので
類似度15が与えられ、「島」はインデックス4の候補
文字には無いが、「市」はインデックス5の第1候補文
字と一致するので「市」の類似度20が与えられ「福島
市」の尤度はこれらを合計した35となる。次に「郡山
市」について同様にインデックス3〜インデックス5の
候補文字との対比を行い尤度を算出する。「郡」は2
0、「山」も「郡」も20なので「郡山市」の尤度は6
0となる。「福島県」の第2階層の全地名に対する尤度
付けが終了したら、「広島県」「徳島県」の第2階層の
全地名に対しても同様の解析処理を行い、結果として図
9に示す結果を得る。即ち、上記福島県の両市以外では
「福山市」が尤度55を持ち、「徳島市」が尤度20を
持つ。
【0040】ステップS210において、上記第2階層
の地名候補の最大尤度が基準値以下か否かが判定され、
以下の場合はステップS212において、その下位階層
の地名が検索されてステップS208に戻って下位階層
の地名に対する同様の尤度付けの解析処理が行われる。
【0041】第2階層の地名が記載住所から抜け落ちて
いた場合の救済策として上記ステップを備えている。ス
テップS210の判定が基準を越えている場合は、ステ
ップS211において、住所候補の2階層分の地名の尤
度を加算して最大尤度を持つ住所候補すべてを選択す
る。又は、合計尤度の上位順に所定数を住所候補として
選択するようにしてもよい。ステップS213におい
て、2階層分の最大尤度が尤度が基準以下か否かが判定
され、基準以下の場合はステップS214においてOC
R1による文字認識結果が住所辞書に無いと判断してエ
ラー信号を結果出力部7に出力する。
【0042】最大尤度が基準を上回る場合は、ステップ
S215においてOCR1から入力した文字列が残って
いないか否かが判定され、残っている場合はステップS
201に戻って、選択した住所候補の下位階層の地名を
参照して残った候補文字の解析を行う。
【0043】「広島県福山市呉」の住所例の場合は、図
9に示す「福島県郡山市」と「広島県福山市」が住所候
補として選択される。「大田区下丸子」の住所例の場合
は、ステップS205で地名候補として「太田市」と
「大田区」が選択され、ステップS206においてその
下位の第3階層の地名を検索し、ステップS208にお
いてインデックス3からの候補文字が切り出されて、ス
テップS209で同様に尤度付けが行われ、図11
(b)に示すように2階層の得点の合計により、「大田
区下丸子」と「太田市下田島」が選択される。
【0044】ステップS201に戻って、選択された住
所候補の次階層の地名を対象とする処理が次のインデッ
クス番号の文字候補により行われ、OCR1から入力し
た候補文字列がなくなるまで同様の処理が行われる。ス
テップS215において、OCR1から受け取った文字
列がないと判定されると、最終的に選択された任意数の
住所候補は、最適住所候補作成部6に送出される。ステ
ップS216において、住所候補が指定地名と一致する
か否かが判定され、一致した住所候補が決定住所として
結果出力部7に出力される。即ち、最適住所候補作成部
6においては、先に、文字入力装置2からオペレータに
より入力された管内情報記憶部3の「広島県」という指
定地名に基づき「広島県福山市呉−−−」がより尤度の
大きい「福島県郡山市−−−」に優先して結果出力部7
に出力される。
【0045】管内情報記憶部3の記憶する指定地名とし
て「広島県」も「福島県」もない場合は、ステップS2
17でエラー信号を出力し、尤度の最も高い「福島県郡
山市−−−」を出力するか、または、警告情報と共にO
CR1の認識結果をそのまま出力するようにしてもよ
い。
【0046】本実施の形態においては、オペレータが管
内情報として「広島県」を指定した例を示したが、管内
情報は任意の数県を指定してもよく、営業所や支店等に
おいては管轄する地域に応じて、「中国地方」又は「東
北地方」と指定して当該地方に属する数県を纏めて指定
するよう構成することもできるし、また、区市群レベル
の地名を指定することもできる。又、郵便番号またはそ
の上位桁を文字入力装置2から入力することにより、管
内情報とすることもできる。例えば、前記「大田区下丸
子」の住所例の場合、文字入力装置2から郵便番号の上
位桁「123」を入力しておくと、当該郵便番号に該当
する地名である「東京都千代田区、文京区、大田区等」
の東京都の区部の地名が郵便番号辞書9により検索され
て管内情報記憶部3に記憶され、尤度に優先して「東京
都大田区下丸子」が最適住所として結果出力部7に出力
される。
【0047】以上説明したように、本実施の形態によれ
ば、複数の住所候補が最終的に残った場合、指定地名に
一致した住所候補を決定住所とするので、尤度のみに依
存するために起こる不適切な決定住所が出力されること
がなく住所の認識精度が向上する。更に、任意個数の指
定地名に属する住所データのみを、指定地名入力時に、
住所辞書8から住所解析処理を行うワークエリアのメモ
リに移送して常駐させる構成とすることもできる。かか
る構成とすることにより、地方の営業所や地方自治体に
おいて住所解析を行う場合のように、住所が所定地域に
限定される場合は、住所辞書にアクセスするためのオー
バヘッドが解消され、処理効率及び処理速度の向上を図
ることができる。
【0048】次に、本発明に係る住所解析処理方法の第
2の実施の形態である記載住所に郵便番号が付記されて
いる場合について説明する。図2のフローチャートのス
テップS101において、郵便番号があると判定される
と、ステップS103において郵便番号の認識文字列中
に認識不能のリジェクト文字が無いか否かが判定され
る。リジェクト文字がある場合は、図4に示すステップ
S120に進んで、住所解析が行われる。ステップS1
20における住所解析は、先にステップS200におい
て説明したステップS201〜ステップS213の住所
解析と同一の手順で行い住所候補を選択する。ステップ
S121において、郵便番号辞書9を用いて住所候補か
ら該当する郵便番号を検索する。上記ステップS121
により検索された郵便番号候補に対して、認識し得た郵
便番号の候補文字の類似度に基づく尤度を算出して、ス
テップS122において住所候補の尤度に郵便番号の尤
度を加算した合計尤度に基づいて順位付けを行う。ステ
ップS123において、最大尤度が基準以下か否かを判
定し、基準を越える場合は最大尤度の住所候補を認識し
た住所として結果出力部7に出力し、基準以下である場
合はエラー信号を出力する。
【0049】前記ステップS103においてリジェクト
文字が無いと判定された場合は、郵便番号辞書9から全
ての郵便番号を検索して、文字認識結果の候補文字(数
字)と対比して先に説明したと同様に候補文字の類似度
に基づく郵便番号候補の尤度を算出する。
【0050】例えば、帳票の住所記入欄に「〒7230
0 広島県福山市」と記入されていた場合、OCR1か
ら受け取る郵便番号の文字認識結果が図12(a)に示
すように、又住所欄の文字認識結果が図12(b)に示
すようになったとする。これらの文字認識結果は夫々郵
便番号解析部5、住所解析部4に送出される。尚、図1
2(a)、(b)では説明に必要な順位までの候補文字
のみ例示したが、実際には認識文字の全てについて、よ
り多くの候補文字をOCR1より受け取ることができる
ことは勿論である。
【0051】ステップS104において、郵便番号辞書
9から検索された全郵便番号について尤度付けを行う。
図12(a)に示す通り、インデックス0の候補文字は
「1」と「7」で類似度がそれぞれ20、10、インデ
ックス1の候補文字は「1」「2」で類似度が20、1
2、インデックス2の候補文字が「3」「8」で類似度
は20、15、インデックス3の候補文字が「0」
「8」で類似度が20、9、インデックス4の候補文字
は「0」「6」で類似度が20、8である。このような
候補文字の類似度を積算して郵便番号の各インデックス
の候補文字の組み合わせに対する尤度付けを行い、尤度
の大きいものから所定数選択する。
【0052】この場合選択する組み合わせの数は使用す
るコンピュータの処理能力に応じて適切な数を設定す
る。また、第1候補文字の類似度との差が別途定めた閾
値を越えた類似度を有する候補文字を組み合わせから除
外することにより組み合わせ数を限定することもでき
る。
【0053】図12(a)に示す例の場合、インデック
ス3、4の第2候補文字の類似度は第1候補文字「0」
の類似度との差が閾値を越えているので、インデックス
0〜2の上位3桁の組み合わせによる「11300」
「11800」「12300」等図13に示す8通りの
郵便番号候補が存在する。
【0054】ステップS105において、郵便番号候補
に該当する住所を郵便番号辞書9により検索し、検索に
より得られた住所を住所母集団として以下の解析処理を
行う。ステップS106において、ポインタを0にセッ
トし住所の認識文字のインデックス0の候補文字に合わ
せる。住所解析処理の最初の段階では、第1階層の地名
も決定していないので処理限定階層は0とする。ステッ
プS107において、住所母集団に属する全住所を都道
府県名に該当する階層から地区名に該当する階層までの
地名を網羅する地名リストを住所辞書8を用いて作成す
る。
【0055】ステップS108において、ステップS1
07で作成した地名リストの地名に対して、入力住所の
ポインタ位置であるインデックス0の候補文字から順次
対比して、前述と同様に候補文字の類似度に基づく地名
候補の尤度付けを行う。入力住所である記載住所に或る
階層が省略されている可能性があるので、インデックス
0から所定インデックスの候補文字について地名リスト
の全地名を対比し尤度付けを行うことが望ましい。ステ
ップS109において、地名リスト中の各地名の中の最
大尤度が所定の基準以下か否かを判定し、基準以下の場
合はステップS200に進んで、先に説明した住所解析
を行う。
【0056】ステップS109において最大尤度が基準
を越える場合は、ステップS110において、尤度が基
準を越える地名を或る階層に含む住所を尤度に応じて適
宜設定した数だけ選択する。即ち、住所母集団の中で或
る階層の地名の尤度の大きい順に、当該地名を含む住所
が選択される。ステップS108で付された尤度を当該
住所の第1階層尤度とする。
【0057】ステップS111において、選択された住
所の夫々に対して、第1階層尤度が付された地名の階層
より下位の全ての階層の地名からなる地名リストを作成
し、ステップS112において上記階層に該当する入力
文字列のインデックスの次インデックスの候補文字と地
名リスト中の地名とを対比して尤度付けを行う。本ステ
ップにおける尤度を第2階層尤度とする。ステップS1
13において、地名リスト中の地名の最大尤度が基準以
下か否かが判定され、全ての地名の尤度が基準以下の場
合はステップS200において入力住所の解析が行われ
る。
【0058】ステップS113において、最大尤度が基
準を越える地名が存在する場合はステップS114にお
いて第1階層尤度と第2階層尤度及び郵便番号の尤度と
が住所候補毎に積算され合計値が最大の住所の第1階層
の地名を含む住所が住所候補として決定される。ステッ
プS115において、決定した第1階層の地名を或る階
層に含む住所母集団の住所を住所候補として残し、ステ
ップS116において、入力住所のポインタを、決定し
た地名の文字数分進める。ステップS117において、
先に決定した地名の階層を処理限定階層とし、ステップ
S118においてOCR1から受け取った文字列がない
かを判定し、文字列が残っていれば、ステップS107
に戻って処理限定階層より下位の地名リストを作成し、
以下同様のステップ手順を踏んで次階層の地名を決定し
て処理限定階層を一階層増加し、更に次の下位階層の地
名をステップS107に戻って同様のステップにより解
析処理を行う。OCR1が認識した全ての文字について
解析処理を終了すると、結果的に最大尤度を有する住所
候補を決定した住所として結果出力部7に出力する。
【0059】「〒72300 広島県福山市」の住所例
の場合、郵便番号解析部5から図13に示す郵便番号の
尤度を持つ該当住所「東京都文京区根津」「東京都世田
谷区」「広島県福山市」等が最適住所候補作成部6に送
られ、前記郵便番号により指定された住所地域に属する
住所を母集団として解析処理された結果の住所候補「広
島県福山市」が、住所解析部4から最適住所候補作成部
6に送られる。住所解析による尤度と郵便番号の尤度と
の合計が最大の値の住所候補「〒72300広島県福山
市」が最適住所候補として結果出力部7に出力される。
【0060】本実施の形態においては、郵便番号の解析
処理を行い認識した郵便番号に基づいて住所母集団を決
定する解析処理方法について説明したが、第3の実施の
形態として後述するように郵便番号解析部5の解析処理
と住所解析部4の解析処理とを並行して行い、郵便番号
解析部5からの住所候補を管内情報として管内情報記憶
部3に記憶させ、前述した第1の実施の形態における指
定地名として用いることにより最適住所候補を決定する
構成とすることもできる。
【0061】次に、本発明の第3の実施の形態について
説明する。ステップS109及びステップS113で最
大尤度が基準以下と判定された場合は、ステップS20
0において入力住所の解析が住所解析部4で行われる。
本ステップにおける住所解析は、図5、図6を参照して
説明した住所解析と同様に住所辞書8の全地名を対象と
して行うが、本ステップの場合はステップS102にお
ける文字入力装置2から指定地名の入力はない。
【0062】図6に示すステップS215における判定
において、OCR1が認識した全ての文字について解析
処理が終了すると、住所解析部4から尤度が基準を越え
る複数の住所候補が最適住所候補作成部6に出力され、
郵便番号解析部5からはステップS105において得ら
れた郵便番号候補に該当する住所が郵便番号辞書9によ
り検索されて、郵便番号候補の尤度を有する住所として
管内情報記憶部3に格納される。ステップS216にお
いて最適住所候補作成部6に入力する住所候補のうち管
内情報記憶部3の住所候補と一致する住所候補が最適住
所としてけ結果出力部7に出力される。
【0063】上記解析処理方法は、ステップS109、
ステップS113において地名候補の尤度が基準以下の
場合の住所解析処理として説明したが、図2乃至図4に
示すステップS104〜ステップS118の解析処理に
替えて上記解析処理を同様に行ってもよい。即ち、郵便
番号解析部5におけるステップS104の解析処理で図
13に示す郵便番号が選択された場合は、当該郵便番号
に該当する住所を郵便番号辞書9を用いて検索し、指定
地名として管内情報記憶部3に記憶させる。一方、住所
解析部4は住所の認識文字列を受け取って、住所辞書8
の全住所地名を対象とした解析処理をステップ200で
説明した手順で行い、選択された住所候補を最適住所候
補作成部6に出力する。
【0064】例えば、記載住所が「〒12300 大田
区下丸子」の場合、郵便番号の解析結果が「1230
0」と「23700」になったとする。住所の認識文字
結果が図14に示す通りであり、住所解析部4の解析処
理の結果「太田市下田島」が尤度100、「大田区下丸
子」が尤度95で住所候補として最適住所候補作成部6
に入力される。郵便番号解析部5から「12300」に
該当する住所として「東京都区部の地名」が、「237
00」に該当する地名として「群馬県」が指定地名とし
て管内情報記憶部3に記憶される。最適住所候補作成部
6においては、指定地名と一致した住所候補を住所解析
部4における住所候補の尤度に優先して結果出力部7に
出力する。この場合は「〒12300 大田区下丸子」
が最適住所候補として出力される。
【0065】両住所候補に一致するものがない場合は、
郵便番号解析部5の結果と住所解析部4の結果が食い違
うことになり、矛盾検出部10が指摘して最適住所候補
の出力を行わず、記載された郵便番号と住所の記載に矛
盾があることをオペレータに警告する出力を行う。
【0066】以上説明した第2及び第3の実施の形態に
おける郵便番号の解析処理は、記載された郵便番号が何
らかの理由で桁数が不完全であっても、上位数桁の解析
処理により都道府県階層の認識が得られれば住所認識に
充分な効果を有するものである。地方の営業所や自治体
の役所等において、記載された住所の殆どが同一郵便番
号の場合は、文字入力装置2から郵便番号を入力して管
内情報記憶部3に該当住所として記憶させておくことに
より、郵便番号解析部5の解析処理を省略することがで
き、また、郵便番号に該当する住所を管内情報記憶部に
入力すると同時に、郵便番号の該当する地域の住所デー
タを住所解析部4のメモリに常時格納しておくこともで
きるため、認識精度が向上し、解析処理効率及び処理速
度の向上を図ることができる。
【0067】以上説明した本発明の文字認識処理方法を
実現するソフトウエアのプログラムコードを記録した記
憶媒体を、システムあるいは装置に供給し、そのシステ
ムあるいは装置のコンピュータが記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
本発明の目的が達成される。この場合、記憶媒体から読
み出されるプログラムコード自体が本発明の新規な機能
を実現することになり、そのプログラムコードを記憶し
た記憶媒体も本発明を構成することとなる。プログラム
コードを供給するための記憶媒体としては、例えば、フ
ロッピーディスク、ハードディスク、光ディスク、CD
ROM等を用いることができる。
【0068】
【発明の効果】以上説明したように、本発明の第1の発
明の文字認識処理装置及び方法並びにその記憶媒体によ
れば、受け取った文字列を住所の地名を階層化されたツ
リー構造として記憶する住所辞書を参照しながら解析し
て得られた住所候補が地名情報入力手段により入力され
た指定地名に属するか否かに基づいて住所を決定する構
成としたので、誤った住所を結果として出力することが
なく、住所の認識精度が向上すると共に、処理効率及び
処理速度の向上が図れる。
【0069】本発明の第2の発明の文字認識処理装置及
び方法並びにその記憶媒体によれば、受け取った文字列
の郵便番号部分を郵便番号辞書を参照しながら解析して
郵便番号候補を得て、前記郵便番号候補に対応する住所
を住所辞書より検索し、検索した住所を参照しながら住
所解析を行う構成としたので、誤った住所を結果として
出力することがなく、住所の認識精度が向上すると共
に、処理効率及び処理速度の向上が図れる。
【0070】本発明の第3の発明の文字認識処理装置及
び方法並びにその記憶媒体によれば、住所解析により得
られた住所候補が郵便番号解析により結果得られた住所
に属するか否かに基づいて住所を決定する構成としたの
で、誤った住所を結果として出力することがなく、郵便
番号が不完全であっても住所の認識精度が向上すると共
に、処理効率及び処理速度の向上が図れる。
【0071】更に、本発明によれば、前記住所解析手段
は、住所辞書中の前記地名情報入力手段により入力され
た地名若しくは郵便番号解析手段により得られた郵便番
号候補に対応する住所部分を記憶手段に格納する構成と
したので、住所辞書を格納する外部記憶装置へのアクセ
ス回数が減少しオーバーヘッドが解消され処理能率及び
処理速度の向上が図れる。
【図面の簡単な説明】
【図1】本発明の一実施の形態である文字認識処理装置
の主要構成を示すブロック図である。
【図2】本発明に係る文字認識処理の手順を示すフロー
チャートである。
【図3】本発明に係る文字認識処理の手順を示すフロー
チャートである。
【図4】本発明に係る文字認識処理の手順を示すフロー
チャートである。
【図5】本発明に係る文字認識処理の手順を示すフロー
チャートである。
【図6】本発明に係る文字認識処理の手順を示すフロー
チャートである。
【図7】文字読み取り装置から入力する文字列の一例を
示す図である。
【図8】住所辞書に格納された住所データーの構成の一
例を示す図である。
【図9】住所解析の結果の一例を示す図である。
【図10】文字読み取り装置から入力する文字列の一例
を示す図である。
【図11】住所解析の結果の一例を示す図である。
【図12】郵便番号と住所を読み取った文字読み取り装
置から入力する文字列の一例を示す図である。
【図13】郵便番号の解析結果を示す図である。
【図14】住所解析の結果の一例を示す図である。
【符号の説明】
1 OCR 2 文字入力装置 3 管内情報記憶部 4 住所解析部 5 郵便番号解析部 6 最適住所候補作成部 7 結果出力部 8 住所辞書 9 郵便番号辞書 10 候補矛盾検出部

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 文字読み取り装置で読み取られた文字列
    を受け取る文字列受け取り手段と、住所の地名を階層化
    されたツリー構造として記憶する住所辞書と、任意個数
    の地名を指定して入力する地名情報入力手段と、前記受
    け取った文字列を前記住所辞書を参照しながら解析して
    住所候補を得る解析手段と、前記解析手段より得られた
    住所候補が前記地名情報入力手段により入力された指定
    地名に属するか否かに基づいて住所を決定する住所決定
    手段とを備えることを特徴とする文字認識処理装置。
  2. 【請求項2】 前記地名情報入力手段により入力される
    地名は、都道府県単位、または市区町村もしくはそれよ
    り細分化された単位の地名であることを特徴とする請求
    項1記載の文字認識処理装置。
  3. 【請求項3】 前記地名情報入力手段は、前記地名とし
    て任意桁の郵便番号を入力することを特徴とする請求項
    1記載の文字認識処理装置。
  4. 【請求項4】 前記解析手段は、前記住所辞書中の前記
    地名情報入力手段により入力された地名に該当する住所
    部分を地名情報入力時に記憶手段に格納することを特徴
    とする請求項1乃至3のいずれか1項記載の文字認識処
    理装置。
  5. 【請求項5】 文字読み取り装置で読み取られた文字列
    を受け取る文字列受け取りステップと、任意個数の地名
    を指定して入力する地名情報入力ステップと、前記受け
    取った文字列を、住所の地名を階層化されたツリー構造
    として記憶する住所辞書を参照しながら解析して住所候
    補を得る解析ステップと、前記解析ステップより得られ
    た住所候補が前記地名情報入力ステップにより入力され
    た指定地名に属するか否かに基づいて住所を決定する住
    所決定ステップとを備えることを特徴とする文字認識処
    理方法。
  6. 【請求項6】 前記地名情報入力ステップにより入力さ
    れる地名は、都道府県単位、または市区町村もしくはそ
    れより細分化された単位の地名であることを特徴とする
    請求項5記載の文字認識処理方法。
  7. 【請求項7】 前記地名情報入力ステップは、前記地名
    として任意桁の郵便番号を入力することを特徴とする請
    求項5記載の文字認識処理方法。
  8. 【請求項8】 前記解析ステップは、前記住所辞書中の
    前記地名情報入力ステップにより入力された地名に該当
    する住所部分を地名情報入力時に記憶手段に格納するこ
    とを特徴とする請求項5乃至7のいずれか1項記載の文
    字認識処理方法。
  9. 【請求項9】 文字認識処理方法を実行するプログラム
    を格納した記憶媒体であって、前記文字認識処理方法
    が、文字読み取り装置で読み取られた文字列を受け取る
    文字列受け取りステップと、任意個数の地名を指定して
    入力する地名情報入力ステップと、前記受け取った文字
    列を、住所の地名を階層化されたツリー構造として記憶
    する住所辞書を参照しながら解析して住所候補を得る解
    析ステップと、前記解析ステップより得られた住所候補
    が前記地名情報入力ステップにより入力された指定地名
    に属するか否かに基づいて住所を決定する住所決定ステ
    ップとを備えることを特徴とする記憶媒体。
  10. 【請求項10】 文字読み取り装置で読み取られた文字
    列を受け取る文字列受け取り手段と、住所の地名を階層
    化されたツリー構造として記憶する住所辞書と、郵便番
    号と対応する地名を記憶する郵便番号辞書と、前記受け
    取った文字列の郵便番号部分を前記郵便番号辞書を参照
    しながら解析して郵便番号候補を得る郵便番号解析手段
    と、前記郵便番号候補に対応する住所を前記住所辞書よ
    り検索し、前記受け取った文字列の住所部分を前記検索
    した住所を参照しながら解析して住所候補を得る住所解
    析手段とを備えることを特徴とする文字認識処理装置。
  11. 【請求項11】 文字読み取り装置で読み取られた文字
    列を受け取る文字列受け取りステップと、前記受け取っ
    た文字列の郵便番号部分を、郵便番号と対応する地名を
    記憶する郵便番号辞書を参照しながら解析して郵便番号
    候補を得る郵便番号解析ステップと、前記郵便番号候補
    に対応する住所を、住所の地名を階層化されたツリー構
    造として記憶する住所辞書から検索し、前記受け取った
    文字列の住所部分を前記検索した住所を参照しながら解
    析して住所候補を得る住所解析ステップとを備えること
    を特徴とする文字認識処理方法。
  12. 【請求項12】 文字認識処理方法を実行するプログラ
    ムを格納した記憶媒体であって、前記文字認識処理方法
    が、文字読み取り装置で読み取られた文字列を受け取る
    文字列受け取りステップと、前記受け取った文字列の郵
    便番号部分を、郵便番号と対応する地名を記憶する郵便
    番号辞書を参照しながら解析して郵便番号候補を得る郵
    便番号解析ステップと、前記郵便番号候補に対応する住
    所を、住所の地名を階層化されたツリー構造として記憶
    する住所辞書から検索し、前記受け取った文字列の住所
    部分を前記検索した住所を参照しながら解析して住所候
    補を得る住所解析ステップとを備えることを特徴とする
    記憶媒体。
  13. 【請求項13】 文字読み取り装置で読み取られた文字
    列を受け取る文字列受け取り手段と、住所の地名を階層
    化されたツリー構造として記憶する住所辞書と、郵便番
    号と対応する地名を記憶する郵便番号辞書と、前記受け
    取った文字列の郵便番号部分を前記郵便番号辞書を参照
    しながら解析して郵便番号候補を得る郵便番号解析手段
    と、前記受け取った文字列の住所部分を前記住所辞書を
    参照しながら解析して住所候補を得る住所解析手段と、
    前記住所解析手段より得られた住所候補が前記郵便番号
    解析手段により得られた郵便番号候補に対応する住所に
    属するか否かに基づいて住所を決定する住所決定手段と
    を備えることを特徴とする文字認識処理装置。
  14. 【請求項14】 文字読み取り装置で読み取られた文字
    列を受け取る文字列受け取りステップと、前記受け取っ
    た文字列の郵便番号部分を、郵便番号と対応する地名を
    記憶する郵便番号辞書を参照しながら解析して郵便番号
    候補を得る郵便番号解析ステップと、前記受け取った文
    字列の住所部分を、住所の地名を階層化されたツリー構
    造として記憶する住所辞書を参照しながら解析して住所
    候補を得る住所解析ステップと、前記住所解析ステップ
    で得られた住所候補が前記郵便番号解析ステップで得ら
    れた郵便番号候補に対応する住所に属するか否かに基づ
    いて住所を決定する住所決定ステップとを備えることを
    特徴とする文字認識処理方法。
  15. 【請求項15】 文字認識処理方法を実行するプログラ
    ムを格納した記憶媒体であって、前記文字認識処理方法
    が、文字読み取り装置で読み取られた文字列を受け取る
    文字列受け取りステップと、前記受け取った文字列の郵
    便番号部分を、郵便番号と対応する地名を記憶する郵便
    番号辞書を参照しながら解析して郵便番号候補を得る郵
    便番号解析ステップと、前記受け取った文字列の住所部
    分を、住所の地名を階層化されたツリー構造として記憶
    する住所辞書を参照しながら解析して住所候補を得る住
    所解析ステップと、前記住所解析ステップで得られた住
    所候補が前記郵便番号の解析ステップで得られた郵便番
    号候補に対応する住所に属するか否か否かに基づいて住
    所を決定する住所決定ステップとを備えることを特徴と
    する記憶媒体。
  16. 【請求項16】 前記住所解析手段は、前記住所辞書中
    の前記郵便番号解析手段により得られた郵便番号候補に
    対応する地名に該当する住所部分を記憶手段に格納する
    ことを特徴とする請求項10または13記載の文字認識処
    理装置。
JP10190964A 1998-06-23 1998-06-23 文字認識処理装置及び方法並びに記憶媒体 Pending JP2000011096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10190964A JP2000011096A (ja) 1998-06-23 1998-06-23 文字認識処理装置及び方法並びに記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10190964A JP2000011096A (ja) 1998-06-23 1998-06-23 文字認識処理装置及び方法並びに記憶媒体

Publications (1)

Publication Number Publication Date
JP2000011096A true JP2000011096A (ja) 2000-01-14

Family

ID=16266613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10190964A Pending JP2000011096A (ja) 1998-06-23 1998-06-23 文字認識処理装置及び方法並びに記憶媒体

Country Status (1)

Country Link
JP (1) JP2000011096A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018101244A (ja) * 2016-12-20 2018-06-28 ソフトバンク株式会社 データクレンジングシステム、データクレンジング方法及びデータクレンジングプログラム
JP2020187622A (ja) * 2019-05-16 2020-11-19 株式会社Pfu 情報処理装置、制御方法及び制御プログラム
CN112364113A (zh) * 2020-11-13 2021-02-12 北京明略软件系统有限公司 一种地址纠错方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018101244A (ja) * 2016-12-20 2018-06-28 ソフトバンク株式会社 データクレンジングシステム、データクレンジング方法及びデータクレンジングプログラム
JP2020187622A (ja) * 2019-05-16 2020-11-19 株式会社Pfu 情報処理装置、制御方法及び制御プログラム
CN112364113A (zh) * 2020-11-13 2021-02-12 北京明略软件系统有限公司 一种地址纠错方法及系统

Similar Documents

Publication Publication Date Title
US7693853B2 (en) Method and apparatus for retrieving data representing a postal address from a plurality of postal addresses
US5745745A (en) Text search method and apparatus for structured documents
CN108287843B (zh) 一种兴趣点信息检索的方法和装置、及导航设备
KR101945749B1 (ko) 데이터베이스 검색방법, 네비게이션 장치 및 인덱스 구조 생성 방법
CN111324750B (zh) 一种大规模文本相似度计算及文本查重方法
CN111782892B (zh) 基于前缀树的相似字符识别方法、设备、装置和存储介质
JPH0869476A (ja) 検索システム
JP2000011096A (ja) 文字認識処理装置及び方法並びに記憶媒体
CN113535883A (zh) 商业场所实体链接方法、系统、电子设备及存储介质
JP3145071B2 (ja) 文字認識方法および装置
JP3621614B2 (ja) 住所解析方法、装置、住所解析プログラムを記録した記録媒体
JP3477822B2 (ja) 文書登録検索システム
JPH05250416A (ja) データベースの登録・検索装置
JP2000250931A (ja) 位置情報の自動抽出装置および自動抽出方法と記録媒体
JP3468668B2 (ja) 住所認識方法及び郵便区分機
JP2000251017A (ja) 単語辞書作成装置および単語認識装置
JP2991594B2 (ja) 郵便物の宛名読取装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JP2004506960A (ja) 蓋然論マッチング・エンジン
JP2996823B2 (ja) 文字認識装置
JPH1021252A (ja) 情報検索装置
CN114626960A (zh) 旅游产品录入信息查错方法、系统、设备及存储介质
JPH0757059A (ja) 文字認識装置
JP2000311170A (ja) テキスト情報抽出方法
CN116484068A (zh) 高性能防绕过关键词过滤的方法及系统