JPH02242389A - 郵便番号読取装置 - Google Patents

郵便番号読取装置

Info

Publication number
JPH02242389A
JPH02242389A JP1063324A JP6332489A JPH02242389A JP H02242389 A JPH02242389 A JP H02242389A JP 1063324 A JP1063324 A JP 1063324A JP 6332489 A JP6332489 A JP 6332489A JP H02242389 A JPH02242389 A JP H02242389A
Authority
JP
Japan
Prior art keywords
character
recognition
postal code
address
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1063324A
Other languages
English (en)
Inventor
Yoshitaka Okazawa
岡沢 好高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1063324A priority Critical patent/JPH02242389A/ja
Publication of JPH02242389A publication Critical patent/JPH02242389A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、郵便物を郵便番号別に自動区分する郵便物自
動読取区分機において、郵便物上に記載されている郵便
番号を読取る郵便番号読取装置に関する。
(従来の技術) 従来、この種の郵便番号読取装置では、郵便物上に記載
されている郵便番号だけを読取り対象としていた。この
ため、たとえば郵便番号の一部がかすれていたり、ある
いは「0」や「8」などのようにループを持った文字の
ループ内がつぶれていたり、さらには文字が著しく変形
していたり、また、近年のオフィスオートメーション機
器の普及により、種々のプリンタから出力される様々な
フォントの文字が発生してくると、読取りが不可能であ
ったり、誤読をしてしまうという問題があった。
(発明が解決しようとする課題) 本発明は、上記したように郵便番号だけを読取り対象と
していたため、読取りが不可能であったり、誤読をして
しまうという問題点を解決すべくなされたもので、常に
正確に郵便番号を読取ることが可能となり、従来に比べ
著しく高性能で信頼性の高い郵便番号読取装置を提供す
ることを目的とする。
[発明の構成] (課題を解決するための手段) 本発明の郵便番号読取装置は、少なくとも郵便番号およ
び住所情報からなる宛先情報が記載されている郵便物上
の宛先情報記載面を光学的に走査することにより画像信
号を得る光電変換手段と、この光電変換手段で1りられ
た画像信号から前記宛先情報が記載されている領域を検
出する第1検出手段と、この第1検出手段で脱出された
領域内の画像信号から文字列を抽出し、その文字列中の
各文字を検出するとともに、その文字列の構成情報を検
出する第2検出手段と、この第2検出手段で検出された
各文字を文字認識辞書を用いて認識する第1認識手段と
、この第1認識手段で得られた各文字の認識結果および
前記第2検出手段で検出された文字列の構成情報により
、前記宛先情報内の住所情報を認識する第2認識手段と
、この第2認識手段で得られた住所情報の認識結果によ
り、対応する郵便番号の候補を決定する郵便番号候補決
定手段と、この郵便番号候補決定手段で決定された郵便
番号の候補と前記第1認識手段で得られた前記宛先情報
内の郵便番号の認識結果とを照合することにより、最終
的な郵便番号を決定する郵便番号編集手段と、前記第1
認識手段で得られた前記宛先情報内の郵便番号の認識結
果と前記郵便番号編集手段で最終的に決定した郵便番号
とを照合することにより、前記第1認識手段の認識結果
だけでは決定できなかった郵便番号について、その文字
の特徴情報を前記第1認識手段で用いる前記文字認識辞
書に追加登録する文字認識辞書自動更新手段とを具備し
ている。
(作 用) 郵便物上に記載されている郵便番号および住所情報を読
取り、その住所情報から決定する郵便番号の候補を利用
して上記読取った郵便番号を編集し、かつ住所情報の認
識結果を基に郵便番号の認識に用いる文字認識辞書を自
動更新することにより、常に正確に郵便番号を読取るこ
とが可能となる。
(実施例) 以下、本発明の一実施例について図面を参照して説明す
る。
第2図は、本発明に係る郵便物Pの一例を示すもので、
その表面には宛先情報1が記載されている。宛先情報l
は、たとえば郵便番号2、住所情報3および宛名情報4
などからなる。
第1図は、本発明に係る郵便番号読取装置の構成を概略
的に示すものである。すなわち、光電変換部(光電変換
手段)11は、図示矢印a方向に搬送される郵便物Pの
表面を光学的に走査して光電変換することにより多値の
デジタル画像信号を得るもので、たとえば郵便物Pの表
面を照明する光源、およびその反射光を受光して電気信
号に変換する自己走査形のCODイメージセンサなどに
よって構成されている。
画像メモリ12は、光電変換部11で得られた郵便物P
の1通分の画像信号を一時記憶するものである。
宛先情報検出切出部(第1検出手段)13は、画像メモ
リ12内の画像信号から窓、窓枠、ラベルなどが存在し
ているか、宛先情報としての行を構成しているかといっ
た特徴を分析することにより、宛先情報が記載されてい
る宛先記載領域を検出して切出す。なお、郵便番号につ
いては、特定の記入枠内に記載されている場合はそれを
検出し、さもなければ上記で検出した宛先記載領域内の
特定領域に存在していることがほとんどである。
文字検出切出部(第2検出手段)14は、宛先情報検出
切出部13で切出された宛先記載領域内の画像信号から
文字列(文字行)を抽出し、さらに各文字列内の各文字
を1文字ずつ検出して切出す。このとき、文字列の構成
情報、すなわち行数、各行内の単語数、各単語内の文字
数などを抽出する。
なお、文字列の抽出(検出切出)は、たとえば画像信号
に対して文字記載方向(行方向)への射影パターンを作
成し、その射影パターンの山谷を用いることにより文字
列の検出切出を行なう。また、文字の検出切出は、たと
えば画像信号に対して、X方向への射影であるXマスク
信号、およびY方向への射影であるYマスク信号を作成
し、これら両マスク信号により文字を1文字ずつ検出し
て切出す。
文字認識部(第1認識手段)15は、文字検出切出部1
4で切出された文字の特徴情報を抽出し、この抽出した
特徴情報を文字認識辞書16に登録されている特徴情報
と照合することにより文字を認識する。ここで、文字の
特徴情報とは、たとえば文字パターンそのもの、および
輪郭の方向特徴、黒領域の数とそれぞれの大きさ、ルー
プの数と位置、縦、横、斜めの方向に走査したときの走
査線の数などのことである。
住所認識部(第2認識手段)17は、文字認識部15で
得られた各文字の認識結果および文字検出切出部14で
得られた文字列の構成情報と、住所辞書18内の住所と
して存在する単語および住所の階層構造との照合を行な
うことにより住所認識を行なう。ここで、住所として存
在する単語としては、郵便番号の「〒146」や「トウ
キョウト」、「用崎市」などの地名、名称のことであり
、住所の階層構造とは、たとえば「トウキョウト」には
「ミナトク」などの区が存在し、さらに「ミナトク」に
は「シバウラ」などの町名が存在するということである
郵便番号候補抽出部(郵便番号候補決定手段)19は、
住所認識部17で得られた住所の認識結果を用いて、郵
便番号辞書20を検索し、住所から決定する郵便番号の
候補を抽出する。郵便番号辞書20には、住所から決定
する郵便番号の候補が記憶されており、たとえば「東京
都」の郵便番号ならば1桁目は「1」または「2」のい
ずれかであり、また「大田区Jならば上3桁がr143
J 、r144J 、r145J 、ri46Jのいず
れかであり、さらに「地上」ならばr146Jであると
いうような情報を持っている。
郵便番号編集部(郵便番号編集手段)21は、文字認識
部15で得られた郵便番号の文字認識結果と郵便番号候
補抽出部19で得られた郵便番号の候補とを照合するこ
とにより、最終的な正しい郵便番号を決定する。
文字認識辞書自動更新部(文字認識辞書自動更新手段)
22は、文字認識部15で得られた郵便番号の文字認識
結果が、読取不能であったり、郵便番号候補抽出部19
で得られた郵便番号の候補と不一致であった場合に、そ
の文字の特徴情報が文字認識辞書自動更新条件制限テー
ブル23に登録されている条件を満たしていれば、その
文字の特徴情報を用いて文字認識辞書16の内容を更新
する。
次に、このような構成において動作を説明する。
郵便物Pが搬送されてくると、光電変換部11は、郵便
物Pの表面を光学的に走査して光電変換することにより
、多値のデジタル画像信号を出力し、その画像信号を画
像メモリ12に送る。画像メモリ12は、光電変換部1
1から供給される画像信号を記憶する。
画像メモリ12に郵便物Pの1通分の画像信号が記憶さ
れると、宛先情報検出切出部13は、画像メモリ12内
の画像信号から窓、窓枠、ラベルなどが存在しているか
、宛先情報としての行を構成しているかといった特徴を
分析することにより、宛先情報1が記載されている宛先
記載領域を検出して切出す。なお、郵便番号については
、特定の記入枠内に記載されている場合はそれを検出し
、さもなければ上記で検出した宛先記載領域内の特定領
域に存在していることがほとんどである。
次に、文字検出切出部14は、宛先情報検出切出部13
で切出された宛先記載領域内の画像信号から文字列(文
字行)を抽出し、さらに各文字列内の各文字を1文字ず
つ検出して切出し、文字認識部15へ送る。このとき、
文字検出切出部14は、文字列の構成情報、すなわち行
数、各行内の単語数、各単語内の文字数などをも抽出す
る。
文字認識部15は、文字検出切出部14で切出された文
字の特徴情報を抽出し・、この抽出した特徴情報を文字
認識辞書16に登録されている特徴情報と照合すること
により文字認識を行ない、その認識結果を住所認識部1
7へ送る。住所認識部17は、文字認識部15で得られ
た各文字の認識結果および文字検出切出部14で得られ
た文字列の構成情報と、住所辞書18内の住所として存
在する単語および住所の階層構造との照合を行なうこと
により住所認識を行ない、その認識結果を郵便番号候補
抽出部1つへ送る。
ここで、住所認識部17の処理を第2図に示した宛先情
報の例で具体的に説明する。まず、1行目は、「〒」マ
ークで始まる4単語であるがら、後続の3文字は郵便番
号であると認識する。2行目は、6文字と3文字の2単
語で構成されており、各文字の認識結果と住所として存
在し得る単語とを照合することにより、1単語目は「ト
ウキョウト」、2単語目は「オオタク」と認識する。こ
のとき、住所辞書18には、住所の階層構造が記憶され
ているので、東京部内に存在する地名の中から2単語目
が選択される。同様に、3行目は、大田区内の「イケガ
ミ」、「1丁目1番1号」と認識する。
郵便番号候補抽出部19は、住所認識部17で得られた
住所の認識結果を用いて、郵便番号辞書20を検索し、
住所から決定する郵便番号の候補を抽出し、その抽出し
た郵便番号の候補を郵便番号編集部21へ送る。郵便番
号編集部21は、文字認識部15で得られた郵便番号の
文字認識結果と郵便番号候補抽出部19で得られた郵便
番号の候補とを照合することにより、最終的な正しい郵
便番号を決定し、それを出力する。
ここで、郵便番号編集部21の処理を第2図に示した宛
先情報の例で具体的に説明する。もし、住所として「東
京都大田区池上」まで認識できれば、たとえ郵便物P上
に郵便番号が記載されていなくても、正しい答r146
Jが出力できる。また、文字認識結果からだけでは、郵
便物P上に記載された郵便番号の1桁目が「1」が「7
」が判定できず、同様に、2桁目は文字として認識不能
であり、3桁目だけが「6」と認識できている場合、住
所として「東京都大田区」まで認識できていれば、答と
してr146Jと正しく出力することができる。同様に
、2桁目はr4J、3桁目は「6」と認識でき、1桁目
のみが「1」が「7」か判定できない場合、住所として
「東京都」が認識できていれば、正しい答r146Jを
出力できる。
なお、上記例では、郵便番号として上3桁を全て読取れ
る場合を示したが、たとえば郵便番号自動読取区分機に
適用した場合、たとえば郵便番号r140J〜r169
Jまでを区分する区分箱が割当てられていれば、住所と
して「東京都大田区」まで認識できれば、該当する区分
箱へ正しく区分することができる。
次に、文字認識辞書自動更新部22は、文字認識部15
で得られた郵便番号の文字認識結果が、読取不能であっ
たり、郵便番号候補抽出部19で住所の認識結果を基に
得られた郵便番号の候補と不一致であった場合には、そ
の文字の特徴情報が文字認識辞書自動更新条件制限テー
ブル23に登録されている条件と照合し、文字の特徴情
報がその条件を満たしていれば、その文字の特徴情報を
用いて文字認識辞書16の内容を更新する。
ここで、文字認識辞書自動更新部22の処理を第2図に
示した宛先情報の例で具体的に説明する。
例として、まず、住所認識部17において「トウキョウ
ト」まで認識されているが、文字認識部15における郵
便番号の1桁目の認識結果が「1」かr7Jか判定でき
なかった場合を考える。
このとき、文字認識辞書自動更新部22は、「1」の特
徴情報を用いて文字認識辞書16の内容を更新してよい
か否かを判断するために、文字認識辞書自動更新条件制
限テーブル23内の「1」のカテゴリに関する部分を参
照して、「1jの図形としての特徴情報、たとえば「1
」の縦棒と横棒の長さの比率あるいは縦棒の傾き角度な
どが、「7」と著しく類似していないか否かをチエツク
する。その結果、更新してもよいと判断されれば、文字
認識辞書16内の「1」のカテゴリの内容を更新する。
このとき、「1」のカテゴリの内容を更新するだけでは
不十分であれば、誤読する可能性のある「7」のカテゴ
リの内容も更新するように、文字認識辞書自動更新条件
制限テーブル23を記述することも可能である。
また、たった1回出現しただけで更新したときの誤読の
危険性を考慮して、文字認識辞書自動更新条件制限テー
ブル23の各制限条件ごとに出現頻度カウンタを設ける
ことにより、所定の頻度以上出現した時点で文字認識辞
書16の内容を更新するように構成することも実用的な
手法である。
このように、郵便物上に記載されている郵便番号および
住所情報を読取り、その住所情報から決定する郵便番号
の候補を利用して、上記読取った郵便番号を編集するこ
とにより、たとえば郵便番号の一部がかすれていたり、
あるいはループを持った文字のループ内がつぶれていた
り、また文字が著しく変形していたりしても、常に正確
に郵便番号を読取ることが可能となる。
さらに、郵便番号を認識する手段だけでは充分な認識性
能が得られなかった入力文字の特徴情報(認識するため
に必要な情報)を、住所情報を利用することによって判
明した正解を基に文字認識辞書に追加登録することによ
り、次に類似した特徴情報を持った郵便番号が記載され
た郵便物が入力されたときに、たとえ住所情報が認識で
きなくても、郵便番号だけで充分な認識性能を実現する
ことができる。これにより、近年のオフィスオートメー
ション機器の普及に伴う文字フォントの多様化に充分適
応することが可能となる。
したがって、従来のように読取りが不可能になったり、
誤読を招くようなことがなく、高性能で信頼性の高い郵
便番号読取装置を実現できる。
[発明の効果] 以上詳述したように本発明によれば、常に正確に郵便番
号を読取ることが可能となり、従来に比べ著しく高性能
で信頼性の高い郵便番号読取装置を提供できる。
【図面の簡単な説明】
図は本発明の一実施例を説明するためのもので、第1図
は本発明に係る郵便番号読取装置の構成を概略的に示す
構成図、第2図は郵便物上に記載された宛先情報の一例
を示す図である。 P・・・郵便物、1・・・宛先情報、2・・・郵便番号
、3・・・住所情報、11・・・光電変換部(光電変換
手段) 13・・・宛先情報検出切出部(第1検出手段
)、14・・・文字検出切出部(第2検出手段)、15
・・・文字認識部(第1認識手段)、16・・・文字認
識辞書、17・・・住所認識部(第2認識手段)、18
・・・住所辞書、19・・・郵便番号候補抽出部(郵便
番号候補決定手段)  20・・・郵便番号辞書、21
・・・郵便番号編集部(郵便番号編集手段)22・・・
文字認識辞書自動更新部(文字認識辞書自動更新手段)
、23・・・文字認識辞書自動更新条件制限テーブル。 出願人代理人 弁理士 鈴江武彦

Claims (1)

  1. 【特許請求の範囲】 少なくとも郵便番号および住所情報からなる宛先情報が
    記載されている郵便物上の宛先情報記載面を光学的に走
    査することにより画像信号を得る光電変換手段と、 この光電変換手段で得られた画像信号から前記宛先情報
    が記載されている領域を検出する第1検出手段と、 この第1検出手段で検出された領域内の画像信号から文
    字列を抽出し、その文字列中の各文字を検出するととも
    に、その文字列の構成情報を検出する第2検出手段と、 この第2検出手段で検出された各文字を文字認識辞書を
    用いて認識する第1認識手段と、 この第1認識手段で得られた各文字の認識結果および前
    記第2検出手段で検出された文字列の構成情報により、
    前記宛先情報内の住所情報を認識する第2認識手段と、 この第2認識手段で得られた住所情報の認識結果により
    、対応する郵便番号の候補を決定する郵便番号候補決定
    手段と、 この郵便番号候補決定手段で決定された郵便番号の候補
    と前記第1認識手段で得られた前記宛先情報内の郵便番
    号の認識結果とを照合することにより、最終的な郵便番
    号を決定する郵便番号編集手段と、 前記第1認識手段で得られた前記宛先情報内の郵便番号
    の認識結果と前記郵便番号編集手段で最終的に決定した
    郵便番号とを照合することにより、前記第1認識手段の
    認識結果だけでは決定できなかった郵便番号について、
    その文字の特徴情報を前記第1認識手段で用いる前記文
    字認識辞書に追加登録する文字認識辞書自動更新手段と を具備したことを特徴とする郵便番号読取装置。
JP1063324A 1989-03-15 1989-03-15 郵便番号読取装置 Pending JPH02242389A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1063324A JPH02242389A (ja) 1989-03-15 1989-03-15 郵便番号読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1063324A JPH02242389A (ja) 1989-03-15 1989-03-15 郵便番号読取装置

Publications (1)

Publication Number Publication Date
JPH02242389A true JPH02242389A (ja) 1990-09-26

Family

ID=13225969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1063324A Pending JPH02242389A (ja) 1989-03-15 1989-03-15 郵便番号読取装置

Country Status (1)

Country Link
JP (1) JPH02242389A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0997312A (ja) * 1995-09-29 1997-04-08 Fujitsu Ltd 認識文字補正装置およびデータベース検索装置
JP2002042054A (ja) * 2000-07-21 2002-02-08 Toshiba Corp 読取装置、読取方法、区分装置、及び区分方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0997312A (ja) * 1995-09-29 1997-04-08 Fujitsu Ltd 認識文字補正装置およびデータベース検索装置
JP2002042054A (ja) * 2000-07-21 2002-02-08 Toshiba Corp 読取装置、読取方法、区分装置、及び区分方法

Similar Documents

Publication Publication Date Title
Cattoni et al. Geometric layout analysis techniques for document image understanding: a review
EP0938057B1 (en) Mail address reading apparatus and mail sorting apparatus
CN100540156C (zh) 利用改进的条码读取处理邮件项目的方法
Shijian et al. Script and language identification in noisy and degraded document images
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
US5805740A (en) Bar-code field detecting apparatus performing differential process and bar-code reading apparatus
KR100536509B1 (ko) 우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치
JPH02242389A (ja) 郵便番号読取装置
JPH06124366A (ja) 住所読取装置
JPH01316888A (ja) 郵便番号読取装置
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JPH07271899A (ja) 文字認識装置
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JP3160347B2 (ja) 郵便物の宛名読取装置
JPH01316887A (ja) 宛名情報読取装置
JP2877380B2 (ja) 光学的文字読取装置
JP2924356B2 (ja) 光学文字読取装置
JPH0256086A (ja) 文字認識の後処理方法
JP2000331117A (ja) 文書読取システム
JPS59103177A (ja) 名刺読取装置
JPH08164365A (ja) 宛名読取装置
JP2000210624A (ja) 郵便宛名認識装置
JPH0475557B2 (ja)
JP2578767B2 (ja) 画像処理方法
JPH08155397A (ja) 郵便物区分装置およびバーコード印刷装置