JPH06124366A - 住所読取装置 - Google Patents

住所読取装置

Info

Publication number
JPH06124366A
JPH06124366A JP4276259A JP27625992A JPH06124366A JP H06124366 A JPH06124366 A JP H06124366A JP 4276259 A JP4276259 A JP 4276259A JP 27625992 A JP27625992 A JP 27625992A JP H06124366 A JPH06124366 A JP H06124366A
Authority
JP
Japan
Prior art keywords
character
information
recognition
candidate
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4276259A
Other languages
English (en)
Inventor
Katsunori Oi
勝則 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4276259A priority Critical patent/JPH06124366A/ja
Publication of JPH06124366A publication Critical patent/JPH06124366A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】複数の文字切出し結果と、文字認識の効果が充
分に得られ、常に正確な認識結果を得ることができる住
所読取装置を提供する。 【構成】文字切出し部6は、町名処理部2から出力され
る街区認識候補画像情報に対して文字切出し処理を行な
い、複数の文字切出し結果を出力する。文字認識部7
は、この複数の文字切出し結果に対してそれぞれ文字認
識処理を行なう。候補出力部8は、文字切出し候補が候
補木で表される関係にある結果に対して候補木を作成
し、予め結果として考えられる街区認識候補を出力す
る。ラベル付け部9は、この各街区認識候補に対して文
字種によってラベル付けする。街区認識部10は、この
ラベル付けされた各街区認識候補についてラベルの種類
に応じた処理を行なうことにより認識処理を行なう。候
補選択部11は、この各認識結果から最も妥当な構造を
持つものを最終的な街区情報の認識結果として出力す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、たとえば、郵便物上に
記載されている住所情報を光学的に読取る住所読取装置
に係り、特に住所情報を構成する街区情報の認識手段に
関する。
【0002】
【従来の技術】従来、たとえば、郵便物上の住所情報を
読取る住所読取装置においては、その処理が複雑なため
様々な工夫がなされている。住所情報の読取りにおいて
問題になるのは、文字枠などの書式の制限がないことに
より、様々な大きさで、かつ、一定でない文字ピッチで
記入されるため、文字の切出し、文字の認識が確実に行
なえないということである。
【0003】住所情報を構成する町名情報の認識では、
周知の宛名情報の知識処理が有効に活用できる。たとえ
ば、「川崎市高津区*長」のように、1文字の認識が不
明な場合でも、宛名情報の知識処理を用いれば、「高津
区末長」と確定できる。しかし、住所情報を構成する街
区情報の認識には、このような知識処理は使用できな
い。
【0004】街区情報の認識は、町名情報までの認識が
行なわれているものに対して、丁目,番,号の認識を行
なうものである。街区情報で用いられる文字は、数字が
主で単純である。しかも、文字の大きさ、文字ピッチの
変動が大きく、さらに局所的に縦書き、横書きが混在す
るため、正確に文字を切出すことが困難である。
【0005】一般に、街区情報は、算用数字、漢数字、
区切情報(ハイフン、数文字の漢字、平仮名、片仮名な
ど、以降これらをデリミタと記す)で表わされ、文字数
全体でも40字前後である。しかし、これらの文字が単
純であるがために、その変形が大きく、文字認識の結果
を一意に決定することが困難である。また、丁目,番,
号は数字で表わされ、丁目,番,号を表わす数字の間に
はデリミタ(区切情報)が存在する。
【0006】そこで、従来の街区情報の認識方法は、文
字の切出し結果に対して候補木を展開し、その候補木を
いわゆるトップダウンに検索することにより、丁目に当
たる数字が検索されたら、次に丁目(デリミタ)を検索
し、同様に番,号を順次検索するという方法をとってい
た。
【0007】
【発明が解決しようとする課題】上記したように従来で
は、文字切出し結果の候補木の検索をトップダウンに処
理するため、1つの結果しか得られず、さらに、検索に
よって求めるため処理が複雑になり、複数の文字切出し
結果と、文字認識の効果が充分に得られず、常に正確な
認識結果を得ることができないという欠点があった。
【0008】そこで、本発明は、複数の文字切出し結果
と、文字認識の効果が充分に得られ、常に正確な認識結
果を得ることができる住所読取装置を提供することを目
的とする。
【0009】
【課題を解決するための手段】本発明の住所読取装置
は、記録媒体上に記録された町名情報と街区情報とから
なる住所情報を読取る住所読取装置において、前記記録
媒体上の画像情報を電気信号に変換して入力する画像入
力手段と、この画像入力手段で入力された画像情報に基
づき前記住所情報を構成する町名情報を認識し、それに
続く街区情報の候補を示す画像情報を出力する町名処理
手段と、この町名処理手段から出力される画像情報に対
して文字の切出し処理を行なうことにより複数の文字切
出し結果を出力する文字切出し手段と、この文字切出し
手段で切出された複数の文字切出し結果に対して、それ
ぞれ文字認識処理を行なう文字認識手段と、この文字認
識手段から得られる各認識結果に基づき、文字切出し候
補が候補木で表される関係にある結果に対して候補木を
作成することにより、あらかじめ結果として考えられる
街区認識候補を出力する候補出力手段と、この候補出力
手段から出力される街区認識候補に対して、文字種によ
ってラベル付けすることにより数値部と区切情報部とに
分類するラベル付け手段と、このラベル付け手段でラベ
ル付けされた街区認識候補について、数値部の値が住居
表示情報の取り得る範囲であるか否かを判定することに
より、最も妥当な構造を持つ街区認識候補を最終的な街
区情報の認識結果として出力する街区認識手段とを具備
している。
【0010】また、本発明の住所読取装置は、記録媒体
上に記録された町名情報と街区情報とからなる住所情報
を読取る住所読取装置において、前記記録媒体上の画像
情報を電気信号に変換して入力する画像入力手段と、こ
の画像入力手段で入力された画像情報に基づき前記住所
情報を構成する町名情報を認識し、それに続く街区情報
の候補を示す画像情報を出力する町名処理手段と、この
町名処理手段から出力される画像情報に対して文字の切
出し処理を行なうことにより複数の文字切出し結果を出
力する文字切出し手段と、この文字切出し手段で切出さ
れた複数の文字切出し結果に対して、それぞれ文字認識
処理を行なう文字認識手段と、この文字認識手段から得
られる各認識結果に基づき、文字切出し候補が候補木で
表される関係にある結果に対して候補木を作成すること
により、あらかじめ結果として考えられる街区認識候補
を出力する候補出力手段と、この候補出力手段から出力
される街区認識候補に対して、文字種によってラベル付
けすることにより数値部と区切情報部とに分類するラベ
ル付け手段と、このラベル付け手段でラベル付けされた
街区認識候補について、数値部と区切り情報部との組合
わせが住居表示情報の取り得る範囲であるか否かを判定
することにより、最も妥当な構造を持つ街区認識候補を
最終的な街区情報の認識結果として出力する街区認識手
段とを具備している。
【0011】また、本発明の住所読取装置は、記録媒体
上に記録された町名情報と街区情報とからなる住所情報
を読取る住所読取装置において、前記記録媒体上の画像
情報を電気信号に変換して入力する画像入力手段と、こ
の画像入力手段で入力された画像情報に基づき前記住所
情報を構成する町名情報を認識し、それに続く街区情報
の候補を示す画像情報を出力する町名処理手段と、この
町名処理手段から出力される画像情報に対して文字の切
出し処理を行なうことにより複数の文字切出し結果を出
力する文字切出し手段と、この文字切出し手段で切出さ
れた複数の文字切出し結果に対して、それぞれ文字認識
処理を行なう文字認識手段と、この文字認識手段から得
られる各認識結果に基づき、文字切出し候補が候補木で
表される関係にある結果に対して候補木を作成すること
により、あらかじめ結果として考えられる街区認識候補
を出力する候補出力手段と、この候補出力手段から出力
される街区認識候補に対して、文字種によってラベル付
けすることにより数値部と区切情報部とに分類するラベ
ル付け手段と、このラベル付け手段でラベル付けされた
街区認識候補について、数値部と区切り情報部との組合
わせが住居表示情報の取り得る範囲であるか否かを判定
することにより、最も妥当な構造を持つ街区認識候補を
最終的な街区情報の認識結果として出力する街区認識手
段と、誤認識し易い文字の種類をあらかじめ記憶してい
る記憶手段と、前記街区認識手段における数値部と区切
り情報部との組合わせが住居表示情報の取り得る範囲で
あるか否かの判定時、住居表示情報の取り得る範囲でな
いと判定されたとき、前記記憶手段の記憶内容を参照す
ることにより、その街区認識候補の中に誤認識し易い文
字が存在するか否かを確認し、存在する場合は文字の誤
認識であると判断し、その誤認識し易い文字が存在する
前記文字認識手段の他の認識結果を用いて前記誤認識さ
れた文字を訂正する文字訂正手段とを具備している。
【0012】さらに、本発明の住所読取装置は、記録媒
体上に記録された町名情報と街区情報とからなる住所情
報を読取る住所読取装置において、前記記録媒体上の画
像情報を電気信号に変換して入力する画像入力手段と、
この画像入力手段で入力された画像情報に基づき前記住
所情報を構成する町名情報を認識し、それに続く街区情
報の候補を示す画像情報を出力する町名処理手段と、こ
の町名処理手段から出力される画像情報に対して文字の
切出し処理を行なうことにより複数の文字切出し結果を
出力する文字切出し手段と、この文字切出し手段で切出
された複数の文字切出し結果に対して、それぞれ文字認
識処理を行なう文字認識手段と、この文字認識手段から
得られる各認識結果に基づき、文字切出し候補が候補木
で表される関係にある結果に対して候補木を作成するこ
とにより、あらかじめ結果として考えられる街区認識候
補を出力する候補出力手段と、この候補出力手段から出
力される街区認識候補に対して、文字種によってラベル
付けすることにより数値部と区切情報部とに分類するラ
ベル付け手段と、このラベル付け手段でラベル付けされ
た街区認識候補について、その処理に対応する処理文字
数を制限したプログラムを用いて、数値部と区切り情報
部との組合わせが住居表示情報の取り得る範囲であるか
否かを判定することにより、最も妥当な構造を持つ街区
認識候補を最終的な街区情報の認識結果として出力する
街区認識手段とを具備している。
【0013】
【作用】本発明によれば、考えられる候補を全て処理す
ることができ、さらに、文字種をラベル付けすることに
より、処理をラベルに応じて行なうだけでよいため、構
造が簡単になり、複数の文字切出し結果と、文字認識の
効果が充分に得られ、常に正しい認識結果を得ることが
できる。
【0014】
【実施例】以下、本発明の一実施例について図面を参照
して説明する。
【0015】図1は、本実施例に係る住所読取装置の構
成を概略的に示すものである。図において、1は画像入
力部で、たとえば、図示しない搬送路で搬送される郵便
物(記録媒体)上を光学的に走査することにより光電変
換し、郵便物上の住所情報を含む画像情報を入力するも
ので、郵便物上を照明する光源と、その反射光を受光し
て電気信号に変換する光電変換素子(CCD形センサな
ど)などによって構成されている。
【0016】画像入力部1から入力された画像情報は、
町名処理部2に送られる。町名処理部2は、画像入力部
1で入力された画像情報に基づき、郵便物上に記載され
た住所情報を構成する町名情報を認識し、それに続く街
区情報の候補を示す画像情報(以降、これを街区認識候
補画像情報と記す)を出力するもので、画像入力部1か
らの画像情報から文字部分を検出して切出す文字切出し
部3、この文字切出し部3で切出された文字を認識する
文字認識部4、および、この文字認識部4の認識結果に
基づき町名情報を認識する町名認識部5によって構成さ
れる。なお、これらは既に従来から周知の技術であるの
で、これ以上の説明は省略する。
【0017】町名処理部2から出力される街区認識候補
画像情報は、文字切出し部6に送られる。文字切出し部
6は、町名処理部2からの街区認識候補画像情報に対し
て、丁目,番,号が記載されていると考えられる文字部
分を検出して切出すことにより、複数の文字切出し結果
を出力し、文字認識部7へ送る。
【0018】文字認識部7は、文字切出し部6からの複
数の文字切出し結果について文字認識処理を行ない、そ
の各認識結果を候補出力部8に送る。候補出力部8は、
文字認識部7からの各認識結果に基づき、文字切出し候
補が候補木で表される関係にある結果に対して候補木を
作成し、あらかじめ結果として考えられる街区認識候補
を並べて出力し、ラベル付け部9へ送る。
【0019】ラベル付け部9は、候補出力部8からの各
街区認識候補に対して、それぞれ文字種によってラベル
付けすることにより数値部とデリミタ部とに分類し、そ
の処理結果を街区認識部10に送る。
【0020】街区認識部10は、後で詳細を説明する
が、ラベル付け部9でラベル付けされた各街区認識候補
について、ラベルの種類に応じた処理を行なうことによ
り認識処理を行ない、その各認識結果を候補選択部11
に送る。候補選択部11は、これも後で詳細を説明する
が、街区認識部10からの各認識結果から最も妥当な構
造を持つ街区認識候補を選択し、それを最終的な街区情
報の認識結果として出力する。次に、このような構成に
おいて、本発明の最も特徴とするところの街区情報の認
識処理について詳細に説明する。
【0021】まず、文字切出し部6について説明する。
前述したように、街区情報で用いられる文字は、数字が
主で単純である。しかも、文字の大きさ、文字ピッチの
変動が大きく、さらに局所的に縦書き、横書きが混在す
るため、正確に文字を切出すことが困難である。
【0022】そこで、本実施例では、文字切出し候補
を、アルゴリズム内におけるパラメータを複数用いるこ
とによって複数個出力し、文字切出し候補のなかに正解
が含まれる確率を高めている。
【0023】ここで、街区認識候補画像情報に対する文
字切出しの一例を図2に示す。図におけるアンダーライ
ンおよび数字は、文字切出し候補を表している。図2の
各文字切出し候補に対して、文字認識部7でそれぞれ文
字認識を行なった結果の一例が図3である。得られた文
字切出し候補は、図4に示すような候補木で表される関
係にある。
【0024】次に、文字認識部7について説明する。前
述したように、街区情報は、算用数字、漢数字、区切情
報としてのデリミタ(ハイフン、数文字の漢字、平仮
名、片仮名など)で表わされ、文字数全体でも40字前
後である。しかし、これらの文字が単純であるがため
に、その変形が大きく、文字認識の結果を一意に決定す
ることが困難である。
【0025】そこで、本実施例では、切出された文字領
域を識別する際にもパターンマッチング的手法と、構造
解析的手法による2種類のアルゴリズムによる処理を用
いることにより文字認識精度を高めている。
【0026】次に、街区認識部10について説明する。
候補出力部8で得られる候補木は、複数の街区認識候
補、すなわち、この例では図4の例に対して以下の4通
りの候補(仮説)を表している。 1−2−3−5−6−7−9 1−2−3−5−6−8 1−2−4−6−7−9 1−2−4−6−8
【0027】これらの中から適当な候補木を選択する。
この際、候補木をルートノードからたどってのトップダ
ウン検索をすることはない。これらの仮説全てを検証
し、正しく街区情報と解釈されるものを選択する。この
際、以下の2つの知識が重要である。
【0028】(1)住居表示番号(住居表示情報)の取
り得る範囲。すなわち、求められた町名により、街区情
報の数値部は、新住居表示であれば2桁、旧住居表示で
あれば4桁、と有効桁数が規定できる。たとえば、「宮
前区有馬」は、「1丁目から5丁目」までである。 (2)丁目,番,号を表す数字の間にはデリミタが存在
する。
【0029】すなわち、各街区認識候補について、記入
されている文字種により、数値部とデリミタ部に分け、
数値部では、求められた値が住居表示番号の取り得る範
囲であるがどうかの判定を行なう。デリミタ部では、そ
の正当性を調べることにより、各街区認識候補から妥当
な答えを選択する。
【0030】本実施例では、あらかじめ候補木を展開
し、各街区認識候補の文字認識結果の各文字を各文字種
によりラベル付けして処理している。以下の説明でも、
このラベルを用いる。
【0031】街区情報の認識においては、使用される文
字が算用数字、漢数字、デリミタで表わされ、使用され
る文字の種類は全体でも40字前後である。丁目,番,
号は算用数字または漢数字で表され、デリミタはそれ以
外の文字種で表される。そこで、文字認識結果を算用数
字と漢数字、デリミタの3種類に分類し、ラベル付けし
て表す。3種類のラベル例を表1に示す。
【0032】
【表1】
【0033】この場合、同じラベルが連続した部分をブ
ロックと呼ぶ。ここで、街区情報の表記に付いて、それ
ぞれのブロックを以下のように定義する。なお、漢数字
およびデリミタは、図5に示す候補出力部8から得られ
る街区認識候補の例を用いている。 4 …丁目フィールド − …丁目デリミタ 11…番フィールド − …番デリミタ 10…号フィールド 行末…号デリミタ なお、集合住宅の場合、号デリミタ以降に部屋番号が記
入される例があるが、本実施例では号デリミタまでの認
識例について説明している。ここで、文字のラベル付け
を図5の街区認識候補例に対して行なった結果の例を表
2に示す。
【0034】
【表2】 ところで、街区情報の表記部分を実際の郵便物の住所表
記を用いて調査した結果、以下に示す規則性があること
をみいだした。 (1)丁目,番,号……新住居表示の場合 ・数字、デリミタ、数字、デリミタ、数字、デリミタの
順番で表記される。 ・丁目は最大2桁、番,号は最大3桁の数字である。 (2)番地,号……旧住居表示の場合 ・数字、デリミタ、数字、デリミタの順番で表記され
る。 ・番においては最大4桁の数字である。 ・号においては最大3桁の数字である。 (3)デリミタは1文字、または2文字で表される。そ
こで、ラベル付けによって得られたブロックに対して、
上記(1)ないし(3)までの規則を用いて数字表記フ
ィールド、デリミタの評価を行なう。
【0035】まず、数字表記フィールドの評価を行な
う。すなわち、数字表記フィールドでは、住居表示番号
の取り得る範囲を用いてブロックの桁数の評価を行な
う。その他に以下の評価をも行なう。 ・文字種はフィールド内で固定であるか。ただし、算用
数字の「0」が漢数字と合わせて使用される場合があ
る。 例: 八0六 ・丁目,番,号フィールドでの漢数字、算用数字が混在
していないか。ただし、丁目フィールドが漢数字で、番
フィールドが算用数字である場合もある。 例: 五丁目3−3
【0036】次に、デリミタの評価を行なう。すなわ
ち、デリミタ部については、デリミタの正当性を評価す
る。デリミタは、丁目,番,号によって使用されるもの
が違う。また、漢数字表記と、算用数字表記で、さらに
縦書き、横書きによっても異なってくる。そこで、それ
ぞれについて用いられるデリミタを定義し、それに含ま
れるか否かの評価を行なう。ここで、漢数字縦書きにお
けるデリミタとしては以下のようなものがある。 丁目デリミタ…1文字…の,ノ,| 2文字…丁目 番デリミタ …1文字…の,ノ,|,番 2文字…番地 号デリミタ …1文字…の,ノ,|,号 また、漢数字横書きにおけるデリミタとしては以下のよ
うなものがある。 丁目デリミタ…1文字…の,ノ,〜,− 2文字…丁目 番デリミタ …1文字…の,ノ,〜,−,番 2文字…番地 号デリミタ …1文字…の,ノ,〜、−,号 同様に、算用数字のデリミタに対しても定義しておく。
【0037】さて、各街区認識候補に対して文字認識結
果が一意に決まるものであれば、前述のラベル付けによ
って得られたブロックについて評価を行なうだけでよ
い。しかし、文字認識において非常に似通った文字があ
り、一意に決定することは困難である。文字の誤認識の
例を表3に示す。
【0038】
【表3】
【0039】そこで、各文字認識候補について、たとえ
ば、図3に示すように複数の文字認識結果を得て、その
中から正当と評価されるものを選択する。ここで利用す
る知識は、前述した(1)〜(3)までの規則と、求め
られた町名に対して住居表示が、「新住居表示である
か、旧住居表示であるか」である。このとき、新住居表
示、旧住居表示の混在する町名については、新住居表示
での認識を優先する。
【0040】このような知識にしたがって評価を行な
い、ある認識結果が正当と評価されない場合には、正当
でない文字認識結果に対して別の文字認識結果を評価す
る。その際、やみくもに文字認識結果を選択することな
く、次のように積極的に正当と評価される結果を探索す
る。
【0041】まず、デリミタを数字に間違えた場合につ
いて説明する。たとえば、「1の2の3」を「102の
3」(ラベル付けはNNNDN)と認識した場合、求め
られた町名が新住居表示であれば、「102」という丁
目は存在しないので(ラベルの先頭がNNNは誤り)、
「0」がデリミタである文字認識結果がないかを探索す
る(ラベルの先頭がNDNの結果を探索する)。ここ
で、デリミタの種類も多いので、あらかじめ誤認識の性
質を事前に調査し、表3に示したような誤認識し易い文
字の種類をメモリに記憶しておくことにより、直ちに
「1の2の3」の認識結果がないかを探索する。それが
存在すれば、高速に正当な認識結果が得られる。
【0042】別の例として、漢数字横書きで、「五−四
−三」を「五一四一三」(ラベル付けはKKKKK)と
認識した場合、5桁の数字表記フィールドは存在しない
ので、いずれかがデリミタである文字認識結果を探索す
る。このとき、表3のデータを参照することにより、漢
数字の「一」とデリミタの「−」が誤り易いことを利用
する。
【0043】次に、数字をデリミタに間違えた場合につ
いて説明する。たとえば「1−2−3」を「ノ−2−
3」(ラベル付けはDDNDN)と認識した場合、デリ
ミタで始まる街区情報の表示(ラベルの先頭がD)はな
いので、先頭のデリミタが数字である文字認識結果を探
索する。このとき、表3のデータを参照することによ
り、数字の「1」と片仮名の「ノ」が誤り易いことを利
用する。
【0044】次に、候補選択部11について説明する。
上記したように、各街区認識候補について、それぞれ上
記の処理により1つの認識結果が得られる。これら中か
ら最終的な認識結果を1つ選択する。ただし、必ず全部
の認識候補から認識結果が得られる訳ではない。図6に
示す例では4通りの認識候補が作られたが、2通りは認
識ができないため、認識結果は2通りのみ得られてい
る。この他に、認識はできたが正当と評価されない認識
候補も除かれる。たとえば、図5の「4−11−目」、
「4−八−10」、「4−八−目」がその例である。い
くつかの候補が結果として得られた場合、これらの候補
から1つを選択する。その際には次の3つの手段によ
る。 (1)数字フィールドごとの取り得る値の範囲
【0045】たとえば、図7に示すような認識結果が得
られた場合、溝の口の番地の範囲が3000番地までと
定義されているので、「八0六」が選ばれる。全ての数
字フィールドについて、このように値の取り得る範囲が
定義されている。 (2)文字認識評価値 1文字の文字認識ごとに類似度(文字認識の確からし
さ)を求めている。ある候補の1文字あたりの類似度の
平均を求め、それの大きい候補を選ぶ。 (3)文字ピッチ
【0046】文字の切出しのピッチが一定に近い切出し
方をした認識候補を選ぶ。印刷活字で表記された住所情
報の場合には大変に有効である。さらに、たとえば、図
8に示すように手書き文字の場合にも使えることもあ
る。
【0047】このように、各街区認識候補に対して正当
か否かを評価し、もし正当でない場合には正当でない文
字認識結果に対し、別の文字認識結果の中から正当なも
のを選択する処理を行なうものである。この処理の高速
化のため、本実施例では、前述したようなラベル付けを
用い、かつ、ブロックのラベル付けごとに異なる処理モ
ジュール(処理プログラム)を用意している。
【0048】前述したた例で、「102の3」という認
識結果が得られた場合、そのラベル付け、「NNND
N」に対応する処理モジュールを呼ぶ。この処理モジュ
ールは、同時に与えられる新住居表示・旧住居表示およ
び縦書き・横書きの2つのパラメータを用いることによ
り、この認識結果が正当か否かを判断する。この場合、
前述したように正当ではないので、「0」の文字認識候
補の中から「の」を探索することにより、「1の2の
3」を出力する。ここに、認識結果の文字数の最大長を
10文字としたとき、考えられる処理モジュールの数
は、 310=59049 個であり、求められたラベル付けに対応する処理モジュ
ールの全てを用意するのは困難である。
【0049】しかし、たとえば、「5丁目55番地66
号」、「1234番地56号」などの住居表示において
は、少なくとも初めの5文字を見れば、新住居表示にお
いては丁目、旧住居表示においては4桁以上の番地は存
在しないので、番地までが特定できる。
【0050】そこで、本実施例では、ラベル付けの際に
初めの5文字についておおまかに分類しておき、処理で
きなかった部分については別の処理モジュールで処理す
るように工夫している。たとえば、「5丁目23番地3
号」では、ラベル付けすると「NDDNNDDND」と
なる。これは、「NDDNN」を処理するモジュールに
渡され、「5丁目」までの認識を行なう。この処理モジ
ュールでは、番地である「23」までが処理の対象であ
るが、番地のデリミタが含まれていないので、認識する
桁数が限定できない。
【0051】そこで、残された「23番地3号」につい
ては、「番地と号」を認識する共通の処理モジュールで
処理するようにしている。この他には、「番地のみ」、
「号のみ」を認識するものもある。これによって、 35 =243 個の基本モジュールで処理することが可能になる。さら
に、前述したように住所情報の表記には規則性があるの
で、これを積極的に利用することにより、処理モジュー
ルの数は更に減少する。すなわち、
【0052】(1)デリミタで始まる住所情報の表記は
ないので、ラベル「D」で始まるブロックに対応する処
理モジュールは基本的には不要である。実際には、文字
の認識誤りの回復を行なう処理モジュールのみでよい。 (2)丁目,番,号のフィールドでの漢数字、算用数字
の混在する住所情報の表記は少ない。
【0053】そこで、ラベル「N,K」が混在するブロ
ックは、理想的には不要である。たとえば、「1−2−
3」は「NKNKN」であるが、文字認識誤りであると
して「NDNDN」のラベル付けとする。もっとも、た
とえば、「五丁目10」のような例外があるが、これは
デリミタの評価時にあらかじめ考慮し、変換テーブルな
どを用いることにより対応すればよい。すなわち、この
場合のラベル付けは「KDDNN」ではなく、「KDD
KK」とするものである。
【0054】なお、前記実施例では、郵便物上に記載さ
れている住所情報を読取る住所読取装置に適用した場合
について説明したが、本発明はこれに限定されるもので
なく、たとえば、伝票などの帳票上に記載されている住
所情報、あるいは、住所録に記載されている住所情報を
読取る住所読取装置にも同様に適用できる。
【0055】
【発明の効果】以上詳述したように本発明によれば、考
えられる候補を全て処理することができ、さらに、文字
種をラベル付けすることにより、処理をラベルに応じて
行なうだけでよいため、構造が簡単になり、複数の文字
切出し結果と、文字認識の効果が充分に得られ、常に正
しい認識結果が得られる住所読取装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る住所読取装置の構成を
概略的に示すブロック図。
【図2】街区認識候補画像情報に対する文字切出しの例
を示す図。
【図3】文字認識部における文字認識結果の例を示す
図。
【図4】作成した文字切出し結果の候補木の例を示す
図。
【図5】候補出力部から出力される街区認識候補の例を
示す図。
【図6】文字認識結果が得られない文字認識候補を含む
例を説明する図。
【図7】有効番地数を用いた候補の選択例を説明する
図。
【図8】文字切出しピッチを用いた候補の選択例を説明
する図。
【符号の説明】
1……画像入力部、2……町名処理部、3……文字切出
し部、4……文字認識部、5……町名認識部、6……文
字切出し部、7……文字認識部、8……候補出力部、9
……ラベル付け部、10……街区認識部、11……候補
選択部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 記録媒体上に記録された町名情報と街区
    情報とからなる住所情報を読取る住所読取装置におい
    て、 前記記録媒体上の画像情報を電気信号に変換して入力す
    る画像入力手段と、 この画像入力手段で入力された画像情報に基づき前記住
    所情報を構成する町名情報を認識し、それに続く街区情
    報の候補を示す画像情報を出力する町名処理手段と、 この町名処理手段から出力される画像情報に対して文字
    の切出し処理を行なうことにより複数の文字切出し結果
    を出力する文字切出し手段と、 この文字切出し手段で切出された複数の文字切出し結果
    に対して、それぞれ文字認識処理を行なう文字認識手段
    と、 この文字認識手段から得られる各認識結果に基づき、文
    字切出し候補が候補木で表される関係にある結果に対し
    て候補木を作成することにより、あらかじめ結果として
    考えられる街区認識候補を出力する候補出力手段と、 この候補出力手段から出力される街区認識候補に対し
    て、文字種によってラベル付けすることにより数値部と
    区切情報部とに分類するラベル付け手段と、 このラベル付け手段でラベル付けされた街区認識候補に
    ついて、数値部の値が住居表示情報の取り得る範囲であ
    るか否かを判定することにより、最も妥当な構造を持つ
    街区認識候補を最終的な街区情報の認識結果として出力
    する街区認識手段とを具備したことを特徴とする住所読
    取装置。
  2. 【請求項2】 記録媒体上に記録された町名情報と街区
    情報とからなる住所情報を読取る住所読取装置におい
    て、 前記記録媒体上の画像情報を電気信号に変換して入力す
    る画像入力手段と、 この画像入力手段で入力された画像情報に基づき前記住
    所情報を構成する町名情報を認識し、それに続く街区情
    報の候補を示す画像情報を出力する町名処理手段と、 この町名処理手段から出力される画像情報に対して文字
    の切出し処理を行なうことにより複数の文字切出し結果
    を出力する文字切出し手段と、 この文字切出し手段で切出された複数の文字切出し結果
    に対して、それぞれ文字認識処理を行なう文字認識手段
    と、 この文字認識手段から得られる各認識結果に基づき、文
    字切出し候補が候補木で表される関係にある結果に対し
    て候補木を作成することにより、あらかじめ結果として
    考えられる街区認識候補を出力する候補出力手段と、 この候補出力手段から出力される街区認識候補に対し
    て、文字種によってラベル付けすることにより数値部と
    区切情報部とに分類するラベル付け手段と、 このラベル付け手段でラベル付けされた街区認識候補に
    ついて、数値部と区切り情報部との組合わせが住居表示
    情報の取り得る範囲であるか否かを判定することによ
    り、最も妥当な構造を持つ街区認識候補を最終的な街区
    情報の認識結果として出力する街区認識手段とを具備し
    たことを特徴とする住所読取装置。
  3. 【請求項3】 記録媒体上に記録された町名情報と街区
    情報とからなる住所情報を読取る住所読取装置におい
    て、 前記記録媒体上の画像情報を電気信号に変換して入力す
    る画像入力手段と、 この画像入力手段で入力された画像情報に基づき前記住
    所情報を構成する町名情報を認識し、それに続く街区情
    報の候補を示す画像情報を出力する町名処理手段と、 この町名処理手段から出力される画像情報に対して文字
    の切出し処理を行なうことにより複数の文字切出し結果
    を出力する文字切出し手段と、 この文字切出し手段で切出された複数の文字切出し結果
    に対して、それぞれ文字認識処理を行なう文字認識手段
    と、 この文字認識手段から得られる各認識結果に基づき、文
    字切出し候補が候補木で表される関係にある結果に対し
    て候補木を作成することにより、あらかじめ結果として
    考えられる街区認識候補を出力する候補出力手段と、 この候補出力手段から出力される街区認識候補に対し
    て、文字種によってラベル付けすることにより数値部と
    区切情報部とに分類するラベル付け手段と、 このラベル付け手段でラベル付けされた街区認識候補に
    ついて、数値部と区切り情報部との組合わせが住居表示
    情報の取り得る範囲であるか否かを判定することによ
    り、最も妥当な構造を持つ街区認識候補を最終的な街区
    情報の認識結果として出力する街区認識手段と、 誤認識し易い文字の種類をあらかじめ記憶している記憶
    手段と、 前記街区認識手段における数値部と区切り情報部との組
    合わせが住居表示情報の取り得る範囲であるか否かの判
    定時、住居表示情報の取り得る範囲でないと判定された
    とき、前記記憶手段の記憶内容を参照することにより、
    その街区認識候補の中に誤認識し易い文字が存在するか
    否かを確認し、存在する場合は文字の誤認識であると判
    断し、その誤認識し易い文字が存在する前記文字認識手
    段の他の認識結果を用いて前記誤認識された文字を訂正
    する文字訂正手段とを具備したことを特徴とする住所読
    取装置。
  4. 【請求項4】 記録媒体上に記録された町名情報と街区
    情報とからなる住所情報を読取る住所読取装置におい
    て、 前記記録媒体上の画像情報を電気信号に変換して入力す
    る画像入力手段と、 この画像入力手段で入力された画像情報に基づき前記住
    所情報を構成する町名情報を認識し、それに続く街区情
    報の候補を示す画像情報を出力する町名処理手段と、 この町名処理手段から出力される画像情報に対して文字
    の切出し処理を行なうことにより複数の文字切出し結果
    を出力する文字切出し手段と、 この文字切出し手段で切出された複数の文字切出し結果
    に対して、それぞれ文字認識処理を行なう文字認識手段
    と、 この文字認識手段から得られる各認識結果に基づき、文
    字切出し候補が候補木で表される関係にある結果に対し
    て候補木を作成することにより、あらかじめ結果として
    考えられる街区認識候補を出力する候補出力手段と、 この候補出力手段から出力される街区認識候補に対し
    て、文字種によってラベル付けすることにより数値部と
    区切情報部とに分類するラベル付け手段と、 このラベル付け手段でラベル付けされた街区認識候補に
    ついて、その処理に対応する処理文字数を制限したプロ
    グラムを用いて、数値部と区切り情報部との組合わせが
    住居表示情報の取り得る範囲であるか否かを判定するこ
    とにより、最も妥当な構造を持つ街区認識候補を最終的
    な街区情報の認識結果として出力する街区認識手段とを
    具備したことを特徴とする住所読取装置。
JP4276259A 1992-10-14 1992-10-14 住所読取装置 Pending JPH06124366A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4276259A JPH06124366A (ja) 1992-10-14 1992-10-14 住所読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4276259A JPH06124366A (ja) 1992-10-14 1992-10-14 住所読取装置

Publications (1)

Publication Number Publication Date
JPH06124366A true JPH06124366A (ja) 1994-05-06

Family

ID=17566939

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4276259A Pending JPH06124366A (ja) 1992-10-14 1992-10-14 住所読取装置

Country Status (1)

Country Link
JP (1) JPH06124366A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08167007A (ja) * 1994-12-14 1996-06-25 Nec Corp 記号列読み取り装置
JPH08171614A (ja) * 1994-12-20 1996-07-02 Nec Corp 文字列読み取り装置
JPH08171615A (ja) * 1994-12-20 1996-07-02 Nec Corp 住所読み取り装置
JPH08180142A (ja) * 1994-12-21 1996-07-12 Nec Corp 住所読み取り装置
JPH08185481A (ja) * 1994-12-28 1996-07-16 Nec Corp 文字認識装置
JP2009211432A (ja) * 2008-03-04 2009-09-17 Fujitsu Ltd 文書認識プログラム、文書認識装置、および文書認識方法
CN103729634A (zh) * 2012-10-11 2014-04-16 富士施乐株式会社 字符识别装置和字符识别方法
JP2016045943A (ja) * 2014-08-20 2016-04-04 三菱電機株式会社 シーンの取得画像を意味的にラベル付けする方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08167007A (ja) * 1994-12-14 1996-06-25 Nec Corp 記号列読み取り装置
JPH08171614A (ja) * 1994-12-20 1996-07-02 Nec Corp 文字列読み取り装置
JPH08171615A (ja) * 1994-12-20 1996-07-02 Nec Corp 住所読み取り装置
JPH08180142A (ja) * 1994-12-21 1996-07-12 Nec Corp 住所読み取り装置
JPH08185481A (ja) * 1994-12-28 1996-07-16 Nec Corp 文字認識装置
JP2009211432A (ja) * 2008-03-04 2009-09-17 Fujitsu Ltd 文書認識プログラム、文書認識装置、および文書認識方法
US8515175B2 (en) 2008-03-04 2013-08-20 Fujitsu Limited Storage medium, apparatus and method for recognizing characters in a document image using document recognition
CN103729634A (zh) * 2012-10-11 2014-04-16 富士施乐株式会社 字符识别装置和字符识别方法
JP2014078168A (ja) * 2012-10-11 2014-05-01 Fuji Xerox Co Ltd 文字認識装置及びプログラム
US9342739B2 (en) 2012-10-11 2016-05-17 Fuji Xerox Co., Ltd. Character recognition apparatus, non-transitory computer readable medium, and character recognition method
JP2016045943A (ja) * 2014-08-20 2016-04-04 三菱電機株式会社 シーンの取得画像を意味的にラベル付けする方法

Similar Documents

Publication Publication Date Title
US6782144B2 (en) Document scanner, system and method
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
JP3640972B2 (ja) ドキュメントの解読又は解釈を行う装置
JP2734386B2 (ja) 文字列読み取り装置
CN100540156C (zh) 利用改进的条码读取处理邮件项目的方法
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JPH11226513A (ja) 郵便物宛先読取装置及び郵便物区分装置
JP3388867B2 (ja) 宛名領域検出装置および宛名領域検出方法
JPH06124366A (ja) 住所読取装置
JP2004171316A (ja) Ocr装置及び文書検索システム及び文書検索プログラム
JP3201207B2 (ja) 住所読取装置及び方法
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JP2910630B2 (ja) 住所認識方法,住所認識装置および紙葉類自動処理システム
JP2000210624A (ja) 郵便宛名認識装置
JP2734387B2 (ja) 文字認識装置
JPH02242389A (ja) 郵便番号読取装置
KR20050047776A (ko) 배송분류정보 생성방법 및 장치, 그에 따른 운송장
JPH0793467A (ja) 住所読取システム
JP3088036B2 (ja) 宛名読取区分機
JPH05217015A (ja) 郵便物の宛名読取装置
JP3310063B2 (ja) 文書処理装置
JPH01316887A (ja) 宛名情報読取装置
JPH10432A (ja) 郵便物の住所読取方法及び郵便物の住所読取装置
JPH041882A (ja) 文字認識方法およびその装置
JP2001043318A (ja) 住所読取装置