JPH0929179A

JPH0929179A - 宛名読取装置

Info

Publication number: JPH0929179A
Application number: JP7179928A
Authority: JP
Inventors: Toru Shijo; 徹四條; Koji Yura; 浩司由良
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-07-17
Filing date: 1995-07-17
Publication date: 1997-02-04

Abstract

(57)【要約】【課題】郵便物上に記載された郵便番号、特に、郵便物
上にあらかじめ定められた郵便番号枠の外に印刷活字で
記載された郵便番号を含む住所等の宛名情報の認識精度
の向上が図れる宛名読取装置を提供する。【解決手段】郵便物Ｐの宛名情報の記載面の画像をもと
に、画像処理部３において、２値画像、ラベルデータを
作成し、さらに、それらをもとに複数の行候補を検出
し、その検出された複数の行候補の分布をもとに郵便番
号、住所等の記載された宛名領域候補を検出し、その宛
名領域候補内の行候補について、郵便番号に対応するラ
ベルが存在する可能性の高さを示す評価値を算出し、そ
の評価値と行候補の分布等をもとに、郵便番号の記載さ
れている可能性の高い行候補を検出し、その検出された
行候補について、その位置情報、評価値に基づく優先順
位に従って、認識部４、知識処理部６で宛名情報の認識
を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、郵便物の宛名記載
面の画像を読取って、その画像をもとに郵便物の郵便番
号を認識する宛名読取装置に関する。

【０００２】

【従来の技術】郵便物の処理分野においては、連日大量
に送られてくる郵便物を限られた時間内に処理しなけれ
ばならない。そこで、郵便物の機械化が進められ、郵便
局員の負担の軽減が図られている。その一例として、近
年普及している、大量の郵便物をそれぞれの宛先に応じ
て自動的に各配達区分毎に区分する郵便物処理装置は、
主に、郵便物上から郵便番号、住所等の宛名情報を読取
る宛名読取装置と、読取られた宛名情報をもとに、その
郵便物を宛先毎に区分する区分機とから構成される。

【０００３】このような郵便物処理装置は、まず、宛名
読取装置で、郵便物上の全面画像を光学的に読取り、そ
の読み取った画像に対し、所定の画像処理を施し宛名の
記載領域を抽出して、その抽出された宛名記載領域の郵
便番号および宛名文字の認識を行い、その認識結果をも
とに、区分機で郵便物を複数の配達区分毎に区分するよ
うになっている。

【０００４】郵便物上に記載された郵便番号、住所等を
光学的に読み取って、その文字認識をする際、特に、郵
便番号枠外に書かれた印活郵便番号を検出して認識する
のは難しい。

【０００５】従来の宛名読取装置では、郵便物上にあら
かじめ定められた郵便番号枠の外に印刷活字で記載され
た郵便番号（以下、印活郵便番号と呼ぶことがある）
は、宛名情報記載領域の検出処理及び住所記載行の検出
処理の過程で、その大きさや位置的特徴をもとに仮定さ
れ、文字認識の識別結果によって決定されるようになっ
ている。

【０００６】また、従来の宛名情報記載領域の検出処理
は、高速化の要求やハードウエアの制限から、郵便物上
の宛名情報の記載面に対し２ｍｍ間隔に走査された結果
得られた粗い画像情報にもとづき、宛名情報記載領域を
確定してから、その内部にあるはずの郵便番号行や住所
行を検出して認識するようになっている。

【０００７】

【発明が解決しようとする課題】このように、従来の宛
名読取装置は、郵便物処理の高速化が要求される中で、
最低限必要な処理を実現するために用いられてきたわけ
であるが、広告や様々な背景を含んだ郵便物上の郵便番
号や住所を正しく認識することは容易ではない。一度、
粗い画像に落した情報だけで宛名情報記載領域を捜し、
その領域内だけを処理して郵便番号、住所等の宛名情報
を認識処理を行うため、最初の領域検出を失敗すると取
り返しがつかない。従って、印活郵便番号行の検出の検
出をあるレベル以上は上げることができなかった。

【０００８】そこで、本発明は、郵便物上に記載された
郵便番号、特に、郵便物上にあらかじめ定められた郵便
番号枠の外に印刷活字で記載された郵便番号の認識精度
の向上が図れる宛名読取装置を提供することを目的とす
る。

【０００９】

【課題を解決する手段】本発明の宛名読取装置は、郵便
物上の所定の枠外に記載された郵便番号を含む宛名情報
の画像を読取る読取手段と、この読取手段で読取られた
宛名情報の画像を２値化して２値画像に変換する２値画
像変換手段と、この２値画像変換手段で変換された２値
画像から、その画素の連結成分をもとに外接矩形領域を
抽出して、その外接矩形領域の分布をもとに、複数の行
を検出する行検出手段と、この行検出手段で検出された
複数の行のそれぞれについて、その行内に含まれる前記
外接矩形領域の特徴に基づき、前記行を解析して、その
行に郵便番号が記載されている可能性の高さを示す評価
値を算出する評価値算出手段と、この評価値算出手段で
算出された評価値に基づき、前記行検出手段で検出され
た複数の行から前記郵便番号情報の記載されている可能
性の高い郵便番号記載行候補を抽出する行抽出手段と、
この行抽出手段で抽出された郵便番号記載行候補につい
て、前記評価値算出手段で算出された評価値および前記
郵便番号記載行候補の分布に基づく優先順位に従って、
前記郵便番号情報の認識を行う認識手段とを具備してい
る。

【００１０】また、本発明の宛名読取装置は、郵便物上
の所定の枠外に記載された郵便番号を含む宛名情報の画
像を読取る読取手段と、この読取手段で読取られた宛名
情報の画像を２値化して２値画像に変換する２値画像変
換手段と、この２値画像変換手段で変換された２値画像
から、その画素の連結成分をもとに外接矩形領域を抽出
して、その外接矩形領域の分布をもとに、複数の行を検
出する行検出手段と、この行検出手段で検出された複数
の行の分布をもとに前記宛名情報の記載されている宛名
記載領域を検出する宛名記載領域検出手段と、この宛名
記載領域検出手段で検出された宛名記載領域内に含まれ
る複数の行のそれぞれについて、その行内に含まれる前
記外接矩形領域を、その行の方向に垂直な方向に統合す
る統合手段と、この統合手段で統合された前記各行内の
外接矩形領域の特徴に基づき、前記行を解析して、その
行に前記郵便番号が記載されている可能性の高さを示す
評価値を算出する評価値算出手段と、この評価値算出手
段で算出された評価値に基づき、前記行検出手段で検出
された複数の行から前記郵便番号の記載されている可能
性の高い郵便番号記載行候補を抽出する抽出手段と、こ
の抽出手段で前記宛名記載領域内のそれぞれから抽出さ
れた郵便番号記載行候補について、前記評価値算出手段
で算出された評価値に基づく優先順位に従って、前記宛
名情報の認識を行う認識手段とを具備している。

【００１１】さらに、本発明の宛名読取装置は、郵便物
上の所定の枠外に記載された郵便番号を含む宛名情報の
画像を読取る読取手段と、この読取手段で読取られた宛
名情報の画像を２値化して２値画像に変換する２値画像
変換手段と、この２値画像変換手段で変換された２値画
像から、その画素の連結成分をもとに外接矩形領域を抽
出して、その外接矩形領域の分布をもとに、複数の行を
検出する行検出手段と、この行検出手段で検出された複
数の行の分布をもとに前記宛名情報の記載されている宛
名記載領域を検出する宛名記載領域検出手段と、この宛
名記載領域検出手段で検出された宛名記載領域内のそれ
ぞれの行について、その行内に含まれる前記外接矩形領
域を行頭からの距離の順に行方向に沿って、前記行の垂
直方向に存在する前記外接矩形領域を統合する統合手段
と、前記宛名記載領域検出手段で検出された宛名記載領
域内の複数の行のうち、その行に含まれる前記統合手段
で統合された外接矩形領域の総数があらかじめ定められ
た値以上のものを解析対象行として抽出する第１の抽出
手段と、この第１の抽出手段で抽出された解析対象行
に、前記郵便番号とその他の宛名情報との境界とみなさ
れる空白部分が存在するとき、前記行の行方向に沿って
前記空白部分の両側に存在する前記統合手段で統合され
た外接矩形領域から、それぞれ解析対象の外接矩形領域
を決定する第１の決定手段と、前記第１の抽出手段で抽
出された解析対象行に、前記空白部分が存在しないと
き、前記行の行方向およびその反対方向のそれぞれにつ
いて、前記統合手段で統合された外接矩形領域から解析
対象の外接矩形領域を決定する第２の決定手段と、前記
第１の抽出手段で抽出された解析対象行のうち、前記統
合手段で統合された外接矩形領域の総数があらかじめ定
めされた範囲内であるとき、前記行内に存在する全ての
外接矩形領域を解析対象の外接矩形領域として決定する
第３の決定手段と、前記第１の抽出手段で抽出された解
析対象行のそれぞれについて、前記第１、第２、第３の
決定手段のいずれかで決定された解析対象の外接矩形領
域、および、その外接矩形領域に対応する前記２値画像
の特徴に基づき、その解析対象行を解析する行解析手段
と、この行解析手段で前記解析対象行を解析した結果を
もとに、前記特徴が前記郵便番号が記載されている可能
性の高さを判断する際に重要な要素であるか否かに基づ
く重みを加味して、前記解析対象行に前記郵便番号が記
載されている可能性の高さを示す評価値を算出する評価
値算出手段と、この評価値算出手段で算出された評価値
に基づき、前記第１の抽出手段で抽出された行から前記
郵便番号が記載されている可能性の高い郵便番号記載行
候補を抽出する第２の抽出手段と、この第２の抽出手段
で前記宛名記載領域から抽出された郵便番号記載行候補
について、前記評価値算出手段で算出された評価値およ
び各郵便番号記載ぎょ候補の位置情報に基づく優先順位
に従って、前記宛名情報の認識を行う認識手段とを具備
している。

【００１２】このように、本発明の宛名読取装置は、郵
便物上の所定の枠外に記載された郵便番号を含む宛名情
報の画像を読取り、この読取られた宛名情報の画像を２
値化して２値画像に変換し、その２値画像から画素の連
結成分をもとに外接矩形領域を抽出して、その分布をも
とに、複数の行を検出し、この検出された複数の行の分
布をもとに前記宛名情報の記載されている宛名記載領域
を検出し、この検出された宛名記載領域に含まれる宛名
記載行候補について、その行内に含まれる前記外接矩形
領域を、その行に垂直な方向に統合し、この統合された
前記各行内の外接矩形領域の特徴に基づき、前記行を解
析して、その行に郵便番号が記載されている可能性の高
さを示す評価値を算出し、この算出された評価値に基づ
き、前記検出された複数の行から前記郵便番号の記載さ
れている可能性の高い郵便番号記載行候補を抽出し、こ
の抽出された郵便番号記載行候補に対して前記算出され
た評価値に基づく優先順位に従って、前記郵便番号の認
識を行うことにより、前記郵便物上に記載された郵便番
号、特に、郵便物上にあらかじめ定められた郵便番号枠
の外に印刷活字で記載された郵便番号の認識精度の向上
が図れる。

【００１３】

【発明の実施形態】以下、本発明の一実施形態について
図面を参照して説明する。尚、本実施形態の宛名読取装
置では、郵便番号がその郵便物にあらかじめ定められた
郵便番号枠の外に宛先住所、氏名等とともに活字印刷さ
れた郵便物を、処理対象の郵便物とする。また、郵便物
にあらかじめ定められた郵便番号枠の外に活字印刷され
た郵便番号を、以下、簡単に印活郵便番号と呼ぶことも
ある。

【００１４】図１は、本実施形態に係る宛名読取装置の
構成を概略的に示したもので、主に、宛名読取装置は、
光電変換回路２、画像処理部３、認識部４、文字辞書
５、知識処理部６、知識辞書７から構成される。

【００１５】図１において、郵便物Ｐの宛名情報の記載
面の画像は、スキャナ等により光学的に読み取られた
後、ＣＣＤセンサ等を用いた光電変換回路２によって電
気信号に変換される。電気信号に変換された入力画像
は、画像処理部３によって処理される。

【００１６】画像処理部３では、入力画像に対し、微分
処理等を施し、２値化画像、微分２値化画像に変換さ
れ、さらにラベリング、射影を行って、郵便物Ｐ上の画
像全体における行の候補領域を複数検出する。そして、
その検出された行の候補領域に対し、後述の評価処理を
行い、その結果、各行候補に与えられた優先順位に従っ
て文字検出切出し処理を行い、１文字づつ認識部４に送
られる。

【００１７】認識部４では、画像処理部３から送られて
くる１文字づつの領域に対して、文字辞書５を参照しな
がら対応の文字候補を挙げる。知識処理部６では、新認
識部４からの文字候補を配達対象地域についてあらかじ
め郵便番号や住所が登録された知識辞書３の内容と照合
して、郵便物Ｐ上に記載された郵便番号の情報を認識
し、その郵便番号情報の認識結果を読取結果処理部８に
出力する。

【００１８】尚、認識部４、知識処理部６での処理結果
は、必要に応じて画像処理部３にフィードバックされる
ようになっている。読取結果処理部８では、知識処理部
６での宛名情報の認識結果をもとに、郵便物Ｐを各宛先
毎に分けられた区分口に郵便物を搬送する処理を行う。

【００１９】次に、図２に示すフローチャート、およ
び、図３を参照して、図１の宛名読取装置の処理動作に
ついて説明する。尚、図３は、図２のフローチャートに
示した要部の処理の流れを説明するためのものである。

【００２０】まず、ステップＳ１に進み、スキャナ、光
電変換回路２を介して処理対象の郵便物Ｐの宛名情報の
記載面の画像が取り込まれる（図３（ａ）参照）。次
に、ステップＳ２に進み、画像処理部３では、まず、そ
の取り込まれた画像に対し、まず、２値画像及び微分２
値画像に変換する処理を行う。

【００２１】さらに、ステップＳ３に進み、２値画像あ
るいは微分２値画像に対して、ラベリング処理を行なう
ことによって、ラベルデータを作成する。また、郵便物
Ｐの画像上全体において、２値画像あるいは微分２値画
像を用いた射影情報の作成も行なう。

【００２２】ラベルデータとは、２値または微分２値画
像において黒画素の連結領域を１つのまとまりとした矩
形領域のデータで、例えば、理想的には、１つの文字、
１つの記号について、その外接矩形領域がそれぞれ１つ
のラベルデータとして抽出される。尚、１つの矩形領域
をラベル領域、あるいは、簡単にラベルとも呼ぶ。

【００２３】ステップＳ４では、このラベルデータや射
影データを基に行領域の検出を行なう。すなわち、ラベ
ルが連続して存在していたり、射影データの値が閾値を
越えている場合に、それらの情報をもとに行らしい領域
を行候補として検出する（図３（ｂ）参照）。

【００２４】図４は、郵便物Ｐの画像から得られた微分
２値画像をもとにした行に対する射影データを概念的に
示したものである。図４より、射影値がある値以上で、
しかも、連続している領域に行が存在することが理解で
きる。

【００２５】以上の処理から郵便物Ｐの画像全体から行
の候補領域が複数得られる。次に、ステップＳ５に進
み、ステップＳ４の処理で作成した行候補の分布から、
郵便番号、住所等の宛名情報がまとまって書かれている
と思われる領域の候補（宛名領域候補）を検出する（図
３（ｃ）参照）。

【００２６】各宛名領域内の行候補は、この時点ではそ
れぞれ何が書かれているか分からない。行の中になにが
書かれているかは、本来は識別や住所認識を行なって初
めて確定されるが、その前にできるだけ候補を絞り込め
れば、以後の処理量を減少させることができる。本発明
の要旨は、この行候補の絞り込み処理を各行内のラベル
データ及び二値画像を用いて行なうことであり、ステッ
プＳ６における行の評価処理、および、ステップＳ７に
おける行候補の絞り込みがこれに相当する。

【００２７】行候補自体の形状、郵便物上における位
置、行候補同士の相対位置等も印活郵便番号行や住所行
を見つけるための重要な情報として用いることができ
る。ステップＳ５、ステップＳ６では、これらの情報、
すなわち評価値をもとに郵便番号、住所等が記載されて
いる可能性の高い行以外を候補行から削除している。

【００２８】このようにして絞り込んだ行候補につい
て、ステップＳ８では、検出された宛名領域候補に含ま
れる行のうち、行分布、評価値をもとにした優先順位に
従って、各候補行に対して文字検出切り出し処理を行な
い、１文字ずつの領域に分離する（図３（ｄ）参照）。

【００２９】次に、この１文字ずつの領域に対して、ス
テップＳ９では、認識部４において、文字辞書５をもと
に文字識別処理を行なって、各文字領域に対する文字候
補を挙げ、ステップＳ１０では、さらに、知識処理部６
において、知識辞書７をもとに郵便番号を認識し、その
認識結果をステップ１１で、読取結果処理部８に出力す
る。

【００３０】ステップＳ９、Ｓ１０における文字識別処
理、郵便番号認識処理の結果、適当な認識結果が得られ
ないときは、次の優先順位の行について、ステップＳ８
〜ステップＳ１１の処理を繰り返す。

【００３１】次に、本発明の要旨であるステップＳ６の
行評価処理について、さらに詳しく説明する。ここでの
評価処理は、検出によって複数の行候補のうち、印活郵
便番号を含んでいる可能性が高いものに高い得点を与え
ることで、正解行を削除することなく候補を絞り込み、
性能を落とさずに処理量を軽減して高速化を図ることを
目的としている。高速化が目的であるから、絞り込み処
理自体が重い処理となってはいけない。

【００３２】まず、図５に示すフローチャートを参照し
て、行評価処理の概略を説明する。すなわち、ステップ
Ｓ５で検出された宛名領域内の行候補それぞれに対して
この処理を行なって印活郵便番号を含む行らしさの評価
値を計算する。

【００３３】ステップＳ２０に進み、１行分のラベルデ
ータと２値画像を読み込む。次に、ステップＳ２１に進
み、読み込んだ行の縦（行幅の長い方）、横（行幅の短
い方）の大きさが郵便番号を含む行として適当であるか
どうかを判断し、適当でないと判断されれば、直ちにス
テップＳ３２に進み、その行の評価値として最低点
「０」が与えられ、ステップＳ３３で出力される。

【００３４】一方、ステップＳ２１の条件判断で行大き
さが適当とみなされた場合は、ステップＳ２２に進み、
行内に存在するラベル数が適当であるかどうかを判定す
る。例えば、行内にラベルが２つしかない場合、郵便番
号は存在しないと考えられるため、ステップＳ３２に進
み、その行の評価値として最低点「０」が与えられ、ス
テップＳ３３で出力される。

【００３５】ステップＳ２２で行内ラベル数が不適当で
ないとされた場合は、ステップＳ２３に進み、ラベルの
座標の行内局所座標（ローカル座標）への変換処理を行
なう。ラベルの座標値はもともと郵便物Ｐ上の座標（グ
ローバル座標）で表されているもので、これをそれぞれ
の行内で、扱いやすい行内の座標（ローカル座標）に変
換する。この場合、ローカル座標の原点は、郵便物Ｐ内
グローバル座標における行左上端とする。図３（ｂ）に
おいて、郵便物Ｐの画像から検出された１０個の行候補
のそれぞれの左上端に与えられた黒丸点がそれに相当す
る。

【００３６】さらに、ここでは、印活郵便番号行が検出
対象であるので、ステップＳ２４では行候補が必ず横長
になるようにラベルデータの座標の回転を行なう。同時
に、行候補内の２値画像も回転させる。この回転は、単
に行を横長にするための処理である。尚、ここでの行候
補絞り込みは、両方向からの評価値がどちらも閾値より
低い場合に行候補を削除するから、正立と倒立の違いは
ほとんど影響しないはずである。行方向を指定してから
片方の行端を評価し、その値のみで候補を絞る方法もあ
る。但し、もともと横長の行領域であれば回転を行なう
必要はない。

【００３７】次に、ステップＳ２５に進み、ノイズラベ
ル除去処理を行なう。これは、背景の濃い郵便物によく
現れるゴミラベルや、下線等の巨大ラベル、広告や模様
等がもとになって発生する微小ラベル等を除去し、文字
に関する情報のみを評価するための前処理である。

【００３８】ステップＳ２５のノイズラベル除去処理
後、再び、ステップＳ２６において、行内ラベル数が適
当であるかどうかを判定する。もともと行内にノイズラ
ベルばかりであったとしたら、それは評価に値しないか
らである。不適当となれば、やはり、ステップＳ３２に
進み、その行の評価値として最低点「０」が与えられ、
ステップＳ３３で進み出力される。

【００３９】ステップＳ２６で行内ラベル数が適当であ
ると判定された場合は、ステップＳ２７に進み、行内ラ
ベル座標順にソート処理を行なう。この処理は、行内に
存在する全てのラベルの座標値を調べて、各ラベルの左
端を仮の行頭として回転した際の対象行画像の左端に近
い順に並べ換える。

【００４０】ステップＳ２７のソート処理について図６
を参照して具体的に説明する。図６（ａ）に示すよう
に、ステップＳ２４で横長に回転処理まで終了した１行
分のラベルデータがあったとする。回転処理を行ったた
めに、各ラベルデータの回転前の座標順は、回転後のロ
ーカル座標の原点（図６（ａ）に示した行候補の左上端
に与えられた黒丸点）からの座標順に対応していない。

【００４１】そこで、図６（ｂ）に示すように、行内に
存在する全てのラベルの座標値をもとに、各ラベルの左
端が、仮の行頭とした回転後対象行画像左端（回転後の
ローカル座標の原点）に近い順に並べ換える。その際、
各ラベルには、そのラベルのインデックスとして「０」
「１」「２」…と番号が付されているものとする。

【００４２】これは、図５の次のステップＳ２８の縦
（行に垂直）方向ラベル統合処理のために必要な処理で
ある。図５のステップＳ２８では、縦（行に垂直）方向
に分離しているが接近しているラベル同士、あるいは包
含関係にあるラベル同士を、その両者を含む最小のラベ
ルで置き換える処理である。これは、かすれで文字が細
かく分かれてしまった場合や、分離文字が行内に含まれ
る場合に、縦方向の分離ラベルを１つのラベルとして扱
うための補正処理である。

【００４３】図７を参照して、縦方向ラベル統合処理の
原理について説明する。図７（ａ）において、「三」と
いう文字からは、統合前では縦（行に垂直）に３つに並
んだラベルで構成されている。統合後では、図７（ｂ）
に示すように、３つの横長ラベルが、大きな一つのラベ
ルとなり１文字文のラベルが得られる。

【００４４】ステップＳ２８では、このような処理を行
内全てのラベルに対して行なう。次に、ステップＳ２９
に進み、再び行内ラベルの数をチェックして、不適当な
らば、ステップＳ３２によりその行の評価値として最低
点「０」が与えられて、ステップＳ３３で直ちに出力さ
れる。

【００４５】ステップＳ２９でラベル数に問題がなかっ
た場合は、次に、ステップＳ３０に進み、ここで、後述
の行内情報解析により、残ったラベルデータの様々な特
徴（例えば、ラベルデータの大きさの平均値や分散、２
値画像のクリップ数など）を解析する。

【００４６】次に、ステップＳ３１に進み、ステップＳ
２９で解析した行内ラベルデータの特徴及び行内２値画
像の特徴をもとに、対象行の郵便番号行らしさの評価値
を計算する。

【００４７】ステップＳ３３では、ステップＳ３１、ス
テップＳ３２で各候補に与えられた評価値が出力され
る。次に、図８、図９を参照して、縦（行に垂直）方向
ラベル統合処理の具体例について説明する。

【００４８】図５のステップＳ２７でソート処理が施さ
れた結果得られた図８（ａ）に示すラベルデータに対
し、ラベル統合処理を行う。まず、図８（ａ）におい
て、行頭にあるラベルインデックス「０」(i=0）のラベ
ルが基準ラベルとなり、統合対象ラベルは、ラベルイン
デックス「１」(j=1）のラベルである（図８（ａ）の左
図参照）。ラベルインデックス「１」の重心の行方向の
位置は、ラベルインデックス「０」の行方向範囲に含ま
れるから、それらは、互いに統合条件を満たすので、両
者を統合して、新たなラベルインデックス「０」のラベ
ルとする（図８（ａ）の右図参照）。

【００４９】次に、図８（ｂ）に示すように、先ほど更
新された新たなインデックス「０」のラベルを基準ラベ
ルとする。統合対象ラベルは、インデックス「２」のラ
ベルである（図８（ｂ）の左図参照）。これらは、統合
条件を満たさないため統合はされない（図８（ｂ）の右
図参照）。

【００５０】基準ラベルに対して統合処理が行われなか
ったので、次に、図８（ｃ）に示すように、基準ラベル
をインデックス「２」のラベルに移動し、統合対象ラベ
ルもインデックス「３」のラベルに移動する（図８
（ｃ）の左図参照）。この両者も統合条件を満たさない
ので、統合はされない（図８（ｃ）の右図参照）。

【００５１】従って、図８（ｄ）に示すように、再び基
準ラベルがインデックス「３」のラベルに移動し、統合
対象ラベルはインデックス「４」のラベルに移動する
（図８（ｄ）の左図参照）。この両者は統合条件を満た
すので、インデックス「４」のラベルがインデックス
「３」のラベルに統合されて、新たなインデックス
「３」のラベルが生成される（図８（ｄ）の右図参
照）。

【００５２】次に、図９（ａ）に示すように、基準ラベ
ルは更新されたばかりのインデックス「３」のラベルで
あるが、統合対象ラベルはインデックス「５」のラベル
に移動する（図９（ａ）の左図参照）。インデックス
「５」のラベルの重心はインデックス「３」の新たなラ
ベルに含まれるので、明らかに統合条件を満たす。従っ
て、両者は統合されて、インデックス「３」の新たなラ
ベルが生成される。

【００５３】次に、図９（ｂ）に示すように、再びイン
デックス「３」の新たなラベルを基準にして、さらなる
統合を試みる。インデックス「６」のラベルは統合条件
を満たさないので、図９（ｃ）に示すように、基準ラベ
ルがインデックス「６」のラベルに移動する。このよう
に、基準ラベルか統合対象ラベルのどちらかが移動しな
がら統合処理はなされるが、インデックス「６」のラベ
ルには、図９（ｃ）の左図からも明らかなように統合す
るべきラベルを持たないため、図９（ｃ）の右図に示し
たように統合は行なわれない。

【００５４】また、図９（ｄ）に示すように、基準ラベ
ルがインデックス「７」のラベルに移動すると、インデ
ックス「７」は行内の最終ラベルインデックスであるの
で統合候補ラベルがもともと存在しない。従って、直ち
に統合処理は終了される。

【００５５】図９（ｄ）の右図が、統合処理を完了した
ラベルデータとなる。次に、図５のステップＳ２８にお
ける縦方向ラベル統合処理について、図１０に示すフロ
ーチャートを参照して、さらに詳しく説明する。

【００５６】まず、ステップＳ４０に進み、ラベル統合
処理を残すのみとなった１行分のラベルデータを読み込
む。ステップＳ４１では、ラベル統合フラグ（以下、統
合フラグと略す）flagを「１」に初期化する。統合フラ
グは、後述のステップＳ４９〜ステップＳ５５のループ
内で実際に統合処理が行なわれたか否かを表すものであ
る。

【００５７】ステップＳ４２〜Ｓ４３のループは、各ラ
ベルが基準とされた場合の他ラベル統合回数を表す変数
connect[i]を初期化するためのものである。connect[i]
の値は、統合処理基準ラベルを移動する（ｉを増加させ
る）際にステップＳ５６で用いられる。すなわち、基準
ラベルに既に統合されたラベルをスキップするためのも
のである。

【００５８】行内のラベルは、行先端と仮定された端に
近い順番にインデックスを並べ直してあるので、その順
番に統合処理を行なっていく。ステップＳ４４でインデ
ックスｉを「０」とセットする。これは、処理対象の統
合基準ラベルをインデックス０のラベルとすることを意
味する（ステップＳ４５）。

【００５９】一般に、ｉ番目のラベルを基準ラベルとし
て、統合処理が行なわれる場合は次のように処理が進
む。まず、ステップＳ４６に進み、ｉが（ｌａｂ＿ｍａ
ｘ−１）以上の値を持たないか、すなわち現在の基準ラ
ベルが最後（行末）のラベルでないかどうかを調べる。
ここで、ｌａｂ＿ｍａｘは、処理対象行内に含まれるラ
ベルの総数を表す。

【００６０】統合基準ラベルが行末のラベルであるな
ら、もう後ろに統合されうるラベルが存在しないので、
ステップＳ５７に進み、統合処理を終了して、一度でも
基準ラベルとなったラベルのみを残す。なぜなら、基準
とならなかったラベルは基準ラベルに統合されたラベル
であるからである。

【００６１】ステップＳ４６の判定においてｉが（ｌａ
ｂ＿ｍａｘ−１）未満なら、現在の基準ラベルは行末の
ラベルでないから、後続のラベルを統合できる限り統合
し続ける。

【００６２】まず、ステップＳ４７で統合候補ラベルイ
ンデックスｊを(i+1）、すなわちラベルｉの次のラベル
にセットする。処理対象となる注目ラベルは一般にｉ番
目とｊ番目の２つのラベルである。

【００６３】次に、統合フラグflagを「０」とおく。fl
agがこの値のまま統合ループを抜けてステップＳ５５の
判定部に達すると、基準ラベルに対して統合処理が行な
われなかったこととなり、connect[i]の値は更新され
ず、さらに、ステップＳ５６に進み、ｉを更新して次の
インデックスに基準ラベルが移動する。

【００６４】ステップＳ４９では、ｊ番目のラベルがｉ
番目のラベルに統合できるかどうかを調べる。統合条件
はいろいろ考えられるが、例えば注目しているｉ番目の
ラベルの行長方向の重心がｊ番目のラベルに含まれる
か、あるいは逆にｊ番目のラベルの行長手方向の重心が
ｉ番目のラベルに含まれる場合に統合条件を満たすとす
る。

【００６５】統合できない場合は、ステップＳ５５に進
み、ここで前述の判定条件を満たすこととなり、connec
t[i]の値は更新されず、さらに、ステップＳ５６に進
み、変数ｉを更新して次のインデックスに基準ラベルが
移動する。

【００６６】ステップＳ４９の判定において、統合条件
を満たす場合は、ステップＳ５０に進み、ｊ番目のラベ
ルをｉ番目のラベルに統合する。統合処理とは、両ラベ
ルを含む最小のラベルを新たなｉ番目ラベルとすること
を意味する（後述）。

【００６７】さらに、ステップＳ５１に進み、統合処理
が為されたことを示す統合フラグflagを「１」にする。
次に、ステップＳ５２に進み、統合候補ラベルインデッ
クスｊのみを１つ増加させて統合候補ラベルを移動し、
ステップＳ５３では、基準ラベルｉに対して統合された
被統合ラベルの数を示すconnect[i]を１だけインクリメ
ントさせる。これは前述のように、基準ラベル移動（ｉ
の増加）の際に使用される。

【００６８】ステップＳ５４では、次の統合候補ラベル
となるインデックスｊの値を調べる。もし、次の統合候
補ラベルインデックスｊが最終ラベルのインデックスよ
り大きかったら、そのようなラベルは実際には存在しな
いので、基準ラベルｉに対する統合処理を中止して、ス
テップＳ５６に進み、基準ラベルの移動処理を行う。

【００６９】一方、ステップＳ５４で、次の統合候補ラ
ベルインデックスｊが最終ラベルのインデックスより大
きくないと判断されたときは、ステップＳ５５に進み、
統合フラグflagの値をチェックする。

【００７０】統合フラグflagが「１」のとき、ステップ
Ｓ４８を通してステップＳ４９に戻り、さきほど統合処
理によって更新されたばかりの新たな基準ラベルｉに対
して次の統合候補ラベルの統合を試みる。

【００７１】このように、統合できるラベルが存在する
限り基準ラベルを移動することはなく統合処理を続け、
１度でも統合条件が満たされない場合には必ず基準ラベ
ルが移動する。

【００７２】ステップＳ４６において、基準ラベルｉの
値が最終ラベルインデックス以上になったら統合処理を
終了してステップＳ５７に進む。ステップＳ５７では、
最低１回は基準ラベルとなったラベルのみを残して、ラ
ベルデータを前に詰める。基準ラベル以外は消滅するた
め、行内ラベル総数は基準ラベルの個数で置き換えられ
る。

【００７３】ステップＳ５８では、こうして作成された
統合処理済みの１行分ラベルデータが出力され、図４の
ステップＳ２９では、このラベルデータをもとに、行内
ラベルの数をチェックを行いう。すなわち、図４のステ
ップＳ２８の統合処理の結果得られたラベルデータをも
とに、行内ラベル数があらかじめ定められた閾値を越え
るものについてのみ、図４のステップＳ３０以下の処理
を行う。

【００７４】次に、図４のステップＳ３０における行内
情報解析処理につて説明する。行内情報解析処理は、正
立方向と倒立方向の両方向についての評価値２つを独立
に算出する。できるだけ行内に含まれる郵便番号のラベ
ルのみを評価するため、解析時には次の２つの処理が交
互に２回（２方向分）行なわれる。（１）評価対象ラベル決定処理（２）評価対象ラベルとして決定されたラベルデータ、
及びそれらの内部の２値画像特徴解析（後述の図１１の
ステップＳ６７、Ｓ７０、Ｓ７４、Ｓ７９、Ｓ８２の処
理）但し、行内のラベル総数があらかじめ定められた閾値Ｐ
ＲＯＣ＿ＭＡＸ以下であれば、行内全てのラベルが評価
対象となるので、その場合は正立・倒立両方向の行内特
徴量が同一になるため、両方向の評価値は一致する。こ
の場合、処理も１回しか行なわれない。尚、ラベル数の
閾値ＰＲＯＣ＿ＭＡＸ、ＰＲＯＣ＿ＭＩＮは、郵便番号
に対応するラベルを判断するために適当に定められた値
で、例えば、閾値ＰＲＯＣ＿ＭＡＸは「７」、閾値ＰＲ
ＯＣ＿ＭＩＮは「３」という値が用いられる。

【００７５】次に、図５のステップＳ３０における行内
情報解析処理の具体例について、図１１に示すフローチ
ャートを参照して説明する。まず、ステップＳ６０で
は、図５のステップＳ２８でラベル統合処理を完了し、
さらに、図５のステップＳ３０でのチェックの結果、ラ
ベル数が適当であると判断された１行分ラベルデータ及
び１行分の２値化画像を読み込む。

【００７６】ステップＳ６２では、対象行内のラベル間
隔を調べて、郵便番号と住所の境界を示す空白がないか
どうかを調べる。これは、郵便物上に記載された宛名情
報について、１行の中に郵便番号と住所が続けて書かれ
ていて、１行として候補となっている場合があり、この
ような場合に評価対象ラベルを限定して、できるだけ郵
便番号部分の特徴を的確に捉えるためである。

【００７７】相当する空白がただ１つだけ見つかった場
合は、ステップＳ６２に進み、それを境界スペースと呼
び、境界スペースが見つかったことを示すフラグspc-fl
agを「１」とする。

【００７８】境界スペースがみつからなかった場合は、
ステップＳ６３に進み、行内のラベル総数を調べ、閾値
ＰＲＯＣ＿ＭＡＸよりも大きな場合は、ステップＳ６４
に進み、フラグspc-flagを「０」にする。

【００７９】ステップＳ６３で、行内ラベル総数が、閾
値ＰＲＯＣ＿ＭＡＸ以下である場合は、ステップＳ６５
に進み、評価対象ラベル数procに、その行内のラベル総
数を設定し、ステップＳ６６では、行内の全ラベルを評
価対象ラベルとして、ステップＳ６７でそれらの特徴と
なる、ラベルの縦横それぞれの大きさ、ラベル縦横比、
ラベル重心高さ、ラベル間距離、行方向ラベル重心間距
離等の平均及び分散、または平均及び標準偏差、さらに
対象ラベル内の二値画像の特徴（クリップ数の平均値）
を求めて、ステップＳ１００で、その解析結果を出力す
る。

【００８０】ステップＳ６６で、評価対象ラベルが決定
される行は、例えば、図１２（ｇ）に示すものである。
ステップＳ６３で行内ラベル総数が閾値ＰＲＯＣ＿ＭＡ
Ｘを越えていて、ステップＳ６４でフラグspc-flagを
「０」にした場合、ステップＳ６８に進み、評価対象ラ
ベル数procに閾値ＰＲＯＣ＿ＭＡＸを設定し、ステップ
Ｓ６９で、その対象行の左側から閾値ＰＲＯＣ＿ＭＡＸ
個のラベルを評価対象に指定して、ステップＳ７０でそ
れらの特徴を解析する。

【００８１】ステップＳ６９で、評価対象ラベルが決定
される行は、例えば、図１２（ｅ）に示すものである。
ステップＳ６１で、境界スペースが見つかって、ステッ
プＳ６２でフラグspc-flagを「１」にした場合は、次
に、ステップＳ７１に進み、まず、その境界スペースの
左側にあるラベルの個数left-lab を調べ、郵便番号に
対応するラベルが存在するか否かが判断される。すなわ
ち、ラベル数left-lab が、閾値ＰＲＯＣ＿ＭＡＸより
少ない場合、郵便番号ラベルが、境界スペースの左側に
存在すると考えられ、その場合、ステップＳ７２に進
み、評価対象ラベル数procに、境界スペースの左側のラ
ベル数left-lad を設定し、ステップＳ７３で、境界ス
ペースの左側に存在するラベル数left-lad 個全てのラ
ベルを評価対象に指定し、ステップＳ７４でそれらの特
徴を解析する。

【００８２】ステップＳ７３で評価対象ラベルが決定さ
れる行は、例えば、図１２（ａ）に示すものである。ス
テップＳ７１の条件を満たさない、つまり境界スペース
左側にはラベルが少なくて郵便番号ラベルが存在しない
と考えられる場合、あるいはラベルが多すぎて郵便番号
以外のものが記載されているか郵便番号以外のラベルが
多く含まれると考えられる場合は、ステップＳ６８、Ｓ
６９に進み、行の左端から閾値ＰＲＯＣ＿ＭＡＸ個のラ
ベルを評価対象ラベルとして、ステップＳ７０で対象ラ
ベル及び対象各ラベル内の２値画像の特徴を解析する。

【００８３】この場合、ステップＳ６９で評価対象ラベ
ルが決定される行は、例えば、図１２（ｃ）に示すもの
である。ステップＳ７４の処理終了後、及びステップＳ
７０の処理終了後、ステップＳ７５の条件を満たさない
（境界スペースは見つかっている）場合は、いずれもス
テップＳ７６に進み、検出した境界スペースの右側に存
在する行内ラベル総数right ＿lab を調べ、郵便番号に
対応するラベルが存在するか否かが判断される。

【００８４】ステップＳ７１の判定条件の場合と同様
に、right ＿lab の値が閾値ＰＲＯＣ＿ＭＡＸより少な
い場合、郵便番号ラベルが、境界スペースの右側に存在
する確率が高いと考えられ、ステップＳ７７に進み、評
価対象ラベル数procに、境界スペースの右側のラベル数
right ＿lab を設定し、ステップＳ７８で境界スペース
右側に存在するラベル数right ＿lab 全部のラベルを評
価対象にして、ステップＳ７９でラベル及び内部の２値
画像の特徴を解析する。

【００８５】ステップＳ７８で評価対象ラベルが決定さ
れる行は、例えば、図１２（ｄ）に示すものである。ス
テップＳ７６の条件を満たさない場合は、境界ラベル右
側には郵便番号ラベルのみが存在するとは限らないとみ
なされ、ステップＳ８０に進み、評価対象ラベル数proc
に閾値ＰＲＯＣ＿ＭＡＸを設定し、ステップＳ８１で、
行の右端から閾値ＰＲＯＣ＿ＭＡＸ個のラベルを評価対
象として、ステップＳ８２でそれらの特徴を解析する。

【００８６】ステップＳ８１で評価対象ラベルが決定さ
れる行は、例えば図１２（ｂ）に示すものである。ステ
ップＳ６０で境界スペースが検出されず、ステップＳ６
３の行内ラベル総数が閾値ＰＲＯＣ＿ＭＡＸを越えると
判断された場合は、前述したように、ステップＳ７０で
特徴解析が行われるが、さらに、２回目の特徴解析（前
述のステップＳ８０〜ステップＳ８２の処理）も行う。
すなわち、ステップＳ８１では、対象行右端から閾値Ｐ
ＲＯＣ＿ＭＡＸ個のラベルが評価対象となり、それは、
例えば図１２（ｆ）に示すような行である。

【００８７】ステップＳ１００では、ある１行文のラベ
ルデータおよび２値化画像に対し、ステップＳ７４とス
テップＳ７９の特徴解析、ステップＳ７４とステップＳ
８２の特徴解析、ステップＳ６７の特徴解析といった５
種類の組合せのうち、いづれかの解析処理が施され、そ
の結果得られたラベル及び２値画像の解析データ（行内
情報解析データ）が対象行の特徴として出力される。

【００８８】この行内情報解析データをもとに、図５の
ステップＳ３１における評価値を算出する。次に、図１
１のステップＳ６７、Ｓ７０、Ｓ７４、Ｓ７９、Ｓ８２
における、評価対象ラベルデータおよびその２値化画像
の特徴解析処理について説明する。

【００８９】ラベルデータの特徴量として、図１３に示
したような、ラベルの縦方向の長さｅ、横方向の長さ
ｃ、行方向ラベル間距離ｂ、行方向ラベル重心間距離
ａ、ラベル重心（中心）の位置ｇ、ラベル重心高さｈ、
行幅ｄ、行の高さｆ、ラベルの縦方向の長さｅと横方向
の長さｃとの比（縦横比）等の値の評価対象ラベルにつ
いての平均及び分散（または標準偏差）等がある。

【００９０】また、それぞれのラベル形状から、ハイフ
ンラベル（例えば、横長さｃが行高さｆの0.1 倍〜0.2
倍の範囲で、縦横比が0.5 よりも小さいもの）数、数字
ラベル（例えば、縦横比が小さ過ぎず、ある程度の大き
さをもつもの）数、評価対象ラベル総数等をカウント
し、異常な場合には後述の評価値計算の際に減点要素と
して用いる。

【００９１】ハイフンラベルであるとみなされたラベル
は、ラベル縦長さｅの平均値・分散の計算および縦横比
の平均・分散の計算からは除外する（但し、横長さｃの
平均・分散の計算には用いる）。

【００９２】行の特徴解析は、行内に存在するラベルデ
ータだけでも有効であるが、できればそれ以外の特徴で
も行候補を絞り込めると、以後の処理対象をさらに削減
することができる。そのために候補行の評価対象ラベル
内の２値画像の特徴解析を行なう。

【００９３】２値画像の特徴量には、例えば、対象ラベ
ル内のクリップ数の平均を用いる。クリップ数とは、２
値画像を１方向にスキャンしていった時に白黒が反転す
る回数である。

【００９４】クリップ数の計算は、例えば文字幅が３０
ピクセル（pixel ）であった場合、通常は３０回縦方向
にスキャンし、総反転回数を文字幅「３０」で割ること
で計算する。しかし、画像の文字部分を全部スキャンす
ることは、処理量の増大を招く。そのため、例えば、文
字幅が５ピクセル（pixel ）を越える場合は、中心に近
い５ラインのみを、あるいは、図１４に示すように、全
体を等間隔で間引いて５ラインのみスキャンして、その
時の反転回数の平均をとることで計算量を軽減すること
ができる。

【００９５】次に、図５のステップＳ３１における行評
価値計算処理について、図１５に示すフローチャートを
参照して説明する。ここでは、図５のステップＳ３０に
おける行内情報解析結果にもとづき、各候補行に対して
評価値を与える。

【００９６】基本的には、特徴量が郵便番号らしい範囲
に入っている場合には、得点を与え、そうでない場合は
減点を与える。但し、必ず満たさなければならないよう
な重要な特徴の場合は、特徴を満たしても得点は与え
ず、満たさない場合に減点のみを与える場合がある。ま
た、その重要度によって減点幅も変えている。加点幅、
減点幅は一定（例えば、「１０」）であるので、候補行
はさまざまな特徴量において地道に得点を重ねなけれ
ば、高得点は得られない。

【００９７】図１５において、まず、特徴量の平均値に
基づく評価値の加点、減点処理を行う。まず、ステップ
Ｓ２００では、行内のラベルの特徴量に基づく、評価値
ｐｏｉｎｔを初期化（初期値「０」を設定）する。

【００９８】ステップＳ２０１〜Ｓ２０２では、ラベル
横幅ｃの平均値について、その値が、あらかじめ定めら
れたラベルの横幅平均の許容最小値ＸＬ＿ＭＩＮより大
きく、許容最大値ＸＬ＿ＭＡＸより小さい場合にのみ、
評価値ｐｏｉｎｔに一定値ＰＯＩＮＴを加算する。

【００９９】ステップＳ２０３〜Ｓ２０５では、ラベル
縦幅ｅの平均値について、その値が、あらかじめ定めら
れたラベルの縦幅平均の許容最小値ＹＬ＿ＭＩＮより大
きく、許容最大値ＹＬ＿ＭＡＸより小さい場合にのみ、
評価値ｐｏｉｎｔに一定値ＰＯＩＮＴを加算し、そうで
ない場合には評価値ｐｏｉｎｔから一定値ＰＯＩＮＴを
減算する。

【０１００】ステップＳ２０６〜Ｓ２０８では、ラベル
縦横比の平均値について、その値が、あらかじめ定めら
れたラベルの縦横比平均の許容最小値ＲＡＴＩＯ＿ＭＩ
Ｎより大きく、許容最大値ＲＡＴＩＯ＿ＭＡＸより小さ
い場合にのみ、評価値ｐｏｉｎｔに一定値ＰＯＩＮＴを
加算する。そうでない場合、ラベル縦横比は、少し重要
度が高い特徴であるとあらかじめ設定されているため、
減点幅を大きくして（例えば、「３０」）、評価値ｐｏ
ｉｎｔを減点する。

【０１０１】ステップＳ２０９〜Ｓ２１１では、ラベル
重心高さｈの平均値について、その値が、行高さｆの0.
3 倍〜0.7 倍の範囲であるときのみ、評価値ｐｏｉｎｔ
に一定値ＰＯＩＮＴを加算し、そうでない場合には評価
値ｐｏｉｎｔから一定値ＰＯＩＮＴを減算する。

【０１０２】ステップＳ２１２〜Ｓ２１４では、ラベル
重心間距離ａの平均値について、その値が、あらかじめ
定められたラベル重心間距離ａの許容最小値Ｇ＿ＳＴＰ
＿ＭＩＮより大きく、許容最大値Ｇ＿ＳＴＰ＿ＭＡＸよ
り小さい場合にのみ、評価値ｐｏｉｎｔに一定値ＰＯＩ
ＮＴを加算し、そうでない場合には評価値ｐｏｉｎｔか
ら一定値ＰＯＩＮＴを減点する。

【０１０３】ステップＳ２１５〜Ｓ２１７では、ラベル
間距離ｂの平均値について、その値が、あらかじめ定め
られたラベル間距離ｂの許容最小値ＳＴＥＰ＿ＭＩＮよ
り大きく、許容最大値ＳＴＥＰ＿ＭＡＸより小さい場合
にのみ、評価値ｐｏｉｎｔに一定値ＰＯＩＮＴを加算
し、そうでない場合には評価値ｐｏｉｎｔから一定値Ｐ
ＯＩＮＴを減算する。

【０１０４】次に、各特徴量の平均値以外の拘束条件に
基づく評価値の加点、減点処理を行う。ここでは、各特
徴量の平均値以外の拘束条件とは、例えば、評価対象ラ
ベル数、ハイフンの行端からの位置、ハイフンラベル
数、数字ラベルの個数、クリップ数平均等がある。

【０１０５】クリップ数の平均値が大きすぎる場合や数
字ラベルが少なすぎる場合は減点する。但し、数字ラベ
ルとは、例えば、ラベルの縦長さｅが行高さｆの0.5 〜
1.0倍で縦／横比が0.8 〜10というように、数字であり
得る大きさ及び形状を持ったラベルを指す。

【０１０６】ステップＳ２１８〜Ｓ２２０行内の評価対
象のラベル数について、その値が、あらかじめ定められ
たラベル数の許容最大値ＰＲＯＣ＿ＭＡＸより小さい場
合にのみ、評価値ｐｏｉｎｔに一定値ＰＯＩＮＴを加点
する。そうでない場合、行内のラベル数は、少し重要度
が高い特徴であるとあらかじめ設定されているため、減
点幅を大きくして（例えば、「３０」）、評価値ｐｏｉ
ｎｔを減点する。

【０１０７】さらに、ステップＳ２１８におけるチェッ
クの際、ラベル数が一定範囲内に入っている場合のみ、
ステップＳ２２１で、各特徴量の分散、標準偏差に基づ
く評価値の加点、減点処理を行う。これは、特に、対象
ラベル数が「３」より小さい場合は対象ラベルには郵便
番号が含まれないはずであること、ばらつきが意味をな
さないと考えられることからである。

【０１０８】標準偏差に基づく評価値の加点、減点処理
の具体例については後述する。ステップＳ２２２〜ステ
ップＳ２２６では、ハイフンラベルに基づく評価値の加
点、減点処理である。すなわち、ハイフンラベルが数が
「１」で、しかも、そのラベルの行端からの位置（行端
から何番目のラベルであるか）が、許容最小値ＭＩＮ＿
ＨＹＰＨ（例えば、「４」）以上で、許容最大値ＭＡＸ
＿ＨＹＰＨ（例えば「５」）以下の場合、評価値ｐｏｉ
ｎｔに一定値ＰＯＩＮＴを加算する。また、ハイフンラ
ベル数が「３」以上のときは、評価値ｐｏｉｎｔから一
定値ＰＯＩＮＴを減算する。

【０１０９】ステップＳ２２７〜ステップＳ２３０で
は、クリップ数の平均値に基づく評価値の加点、減点処
理である。すなわち、クリップ数の平均値が、大きすぎ
る場合（例えば「３２」以上）、そのラベルは、数字で
有り得る可能性が小さいので減点幅を大きくして（例え
ば、「５０」）、評価値ｐｏｉｎｔを減点する。また、
クリップ数の平均値がそれほど大きくはないが、しか
し、数字で有り得る可能性が小さい場合（例えば「２
７」以上「３２」未満）、減点幅を通常よりもやや大き
くして（例えば「３０」）、評価値ｐｏｉｎｔを減点す
る。

【０１１０】ステップＳ２３１〜ステップＳ２３２で
は、数字ラベル数に基づく評価値の加点、減点処理であ
る。すなわち、数字ラベル数が郵便番号のラベルである
として許容される最小ラベル数よりも小さい場合に、そ
のラベルは、郵便番号のラベルである可能性が小さいの
で減点幅を大きくして（例えば、「５０」）、評価値ｐ
ｏｉｎｔを減点する。

【０１１１】ステップＳ２３３〜ステップＳ２３４で
は、評価値ｐｏｉｎｔがマイナスになっている場合、そ
れを「０」とする。すなわち、評価値ｐｏｉｎｔの基準
（最低点）を「０」とするようにしている。

【０１１２】次に、図１６に示すフローチャートを参照
して、図１５のステップＳ２２１における標準偏差に基
づく評価値の加点、減点処理について説明する。尚、図
１６において、各標準偏差値に乗算されている整数値Ｄ
ＹＮＡ（例えば「１０」）は、浮動小数点演算を避ける
ために、値が１未満になる可能性があると考えられるも
のに対して、計算過程において乗算して整数値に直して
評価するためのものである。

【０１１３】ステップＳ２５０〜ステップＳ２５２で
は、ラベル横幅ｃの標準偏差に基づく評価値の加点、減
点処理である。ステップＳ２５３〜ステップＳ２５５で
は、ラベル縦幅ｅの標準偏差に基づく評価値の加点、減
点処理である。

【０１１４】ステップＳ２５６〜ステップＳ２５８で
は、ラベル縦横比の標準偏差に基づく評価値の加点、減
点処理である。ステップＳ２５９〜ステップＳ２６１で
は、ラベル重心高さｈの標準偏差に基づく評価値の加
点、減点処理である。

【０１１５】ステップＳ２６２〜ステップＳ２６４で
は、ラベル重心間距離ａの標準偏差に基づく評価値の加
点、減点処理である。ステップＳ２６５〜ステップＳ２
６７では、ラベル間距離ｂの標準偏差に基づく評価値の
加点、減点処理である。

【０１１６】いずれにおいても、各特徴量の標準偏差
は、郵便番号のラベルとして可能性のある範囲内に含ま
れるか否かが判断され、その範囲内であるときは、評価
値ｐｏｉｎｔは加点され、範囲外のときは、評価値ｐｏ
ｉｎｔは減点される。

【０１１７】その際、ステップＳ２５３のラベルの縦長
さｅの標準偏差に対しての条件を満たさない場合は大き
な減点幅（例えば、「５０」）となるようにしてある
（ステップＳ２５５）。その他の特徴に関しては一定値
の加点、減点である。

【０１１８】このようにして、各行毎にその行内のラベ
ルの評価値ｐｏｉｎｔを算出した結果は、その値が最も
高い行に郵便番号行が存在する可能性が最も高いことに
なる。

【０１１９】さて、図１の画像処理部３では、図５〜図
１０を参照して説明したように、検出された各行候補に
ついて、郵便番号行が存在する可能性の高さを示す評価
値ｐｏｉｎｔを算出すると、その評価値ｐｏｉｎｔが低
い行を郵便番号あるいは住所等が記載されている行の候
補から削除して、行の絞り込みを行い、その結果抽出さ
れた宛名記載行候補の分布から、郵便番号、住所等の宛
名情報がまとまって書かれていると思われる宛名領域候
補を検出して、その検出された宛名領域候補のうち、例
えば、評価値の最も高い行候補が存在するものから、宛
名記載行候補の分布および各行の評価値に基づく優先順
位に従って、その優先順位の高い候補行から順に認識部
４、知識処理部６で２値画像をもとに文字認識を行っ
て、宛名情報の認識を行う（図２のステップＳ８〜ステ
ップＳ１１）。適当な宛名情報の認識ができるまで、宛
名領域候補、行候補の分布、評価値に基づく優先順位に
従って、認識部４、知識処理部６で宛名情報の認識処理
を繰り返す。

【０１２０】郵便物処理部８では、画像処理部３で最終
的にその郵便物Ｐ上の画像から認識された宛名情報をも
とに、郵便物Ｐを各宛先毎に分けられた区分口に郵便物
を搬送する。

【０１２１】以上、説明したように、上記実施形態によ
れば、郵便物Ｐの宛名情報の記載面の画像を取込み、そ
の取り込んだ画像をもとに、画像処理部３において、２
値画像、ラベルデータを作成し、さらに、それらをもと
に複数の行候補を検出し、その検出された複数の行候補
にのそれぞれについて、その行内のラベルのうち、１文
字として統合され得るラベルについては統合して、その
後、各行内のラベルデータおよび２値画像の特徴を解析
して、郵便番号に対応するラベルが存在する可能性の高
さを示す評価値ｐｏｉｎｔを算出し、その評価値ｐｏｉ
ｎｔをもとに行候補を絞り込み、さらに、その絞り込ま
れた行候補の分布をもとに、郵便番号、住所等の記載さ
れた宛名領域候補を検出し、その検出された宛名領域候
補、行候補の分布、評価値に基づく優先順位に従って、
順次、行候補の２値画像をもとに文字認識を行って、宛
名情報の認識を行うことにより、印活字郵便番号や、住
所等の宛名情報の認識精度の向上が図れる。

【０１２２】また、検出された各行候補内のラベルの特
徴を解析して評価する際、郵便番号と住所が１行内に記
載されている場合でも、その間の空白（境界スペース）
を検出することにより、その検出された空白を境に行方
向に沿って両側に存在するラベルをそれぞれ正立方向の
評価対象ラベル、倒立方向の評価対象ラベルとして、評
価対象ラベルを調節できるので評価値の算出精度が上
り、郵便番号行の検出精度が向上する。

【０１２３】また、枠外郵便番号と住所は近い位置に書
かれていることが多いので、本実施形態の行内情報解析
による評価値を用いることによって宛名住所領域の検出
精度も、処置量をそれほど増大させることなく効果的に
向上させることができる。従って、宛名情報の認識精度
も向上する。

【０１２４】さらに、各行毎に行内情報の解析を行うこ
とにより、ノイズ行の削除に有効に働き、正解行を漏ら
すことなく候補数を大幅に削減することができ、処理の
高速化が図れる。

【０１２５】

【発明の効果】以上説明したように、本発明によれば、
郵便物上に記載された郵便番号、特に、郵便物上にあら
かじめ定められた郵便番号枠の外に印刷活字で記載され
た郵便番号を含む住所等の宛名情報の認識精度の向上が
図れる宛名読取装置を提供できる。

【図面の簡単な説明】

【図１】本発明の一実施形態に係る宛名読取装置の構成
を概略的に示した図。

【図２】郵便物処理装置の全体の処理動作を説明するた
めのフローチャート。

【図３】図２のフローチャートに示した要部の処理の流
れを説明するための図。

【図４】郵便物の画像から得られた微分２値画像をもと
にした行に対する射影データを概念的に示した図。

【図５】図２の行評価処理の概略を説明するためのフロ
ーチャート。

【図６】図５のソート処理を説明するための図で、
（ａ）図は行の回転前のラベルデータの様子を示し、
（ｂ）図は行の回転後のラベルデータの様子を示したも
のである。

【図７】縦方向ラベル統合処理の原理について説明する
ための図。

【図８】縦方向ラベル統合処理の具体例について説明す
るための図。

【図９】縦方向ラベル統合処理の具体例について説明す
るための図。

【図１０】縦方向ラベル統合処理の具体的な処理手順に
ついて説明するためのフローチャート。

【図１１】図５の行内情報解析処理の具体的な処理手順
について説明するためのフローチャート

【図１２】図１１の行内情報解析処理により評価対象ラ
ベルが決定される行の具体例を示した図。

【図１３】評価対象ラベルの特徴量を説明するための
図。

【図１４】評価対象ラベル内の２値画像の特徴量を説明
するための図。

【図１５】図５の行評価値計算処理の具体的な処理手順
について説明するためのフローチャート。

【図１６】図１５の標準偏差に基づく評価値の加点、減
点処理の具体的な処理手順について説明するためのフロ
ーチャート。

【符号の説明】

２…光電変換回路、３…画像処理部、４…認識部、５…
文字辞書、６…知識処理部、７…知識辞書、８…読取結
果処理部、Ｐ…郵便物。

Claims

【特許請求の範囲】

【請求項１】郵便物上の所定の枠外に記載された郵便
番号を含む宛名情報の画像を読取る読取手段と、この読取手段で読取られた宛名情報の画像を２値化して
２値画像に変換する２値画像変換手段と、この２値画像変換手段で変換された２値画像から、その
画素の連結成分をもとに外接矩形領域を抽出して、その
外接矩形領域の分布をもとに、複数の行を検出する行検
出手段と、この行検出手段で検出された複数の行のそれぞれについ
て、その行内に含まれる前記外接矩形領域の特徴に基づ
き、前記行を解析して、その行に郵便番号が記載されて
いる可能性の高さを示す評価値を算出する評価値算出手
段と、この評価値算出手段で算出された評価値に基づき、前記
行検出手段で検出された複数の行から前記郵便番号情報
の記載されている可能性の高い郵便番号記載行候補を抽
出する行抽出手段と、この行抽出手段で抽出された郵便番号記載行候補につい
て、前記評価値算出手段で算出された評価値および前記
郵便番号記載行候補の分布に基づく優先順位に従って、
前記郵便番号情報の認識を行う認識手段と、を具備したことを特徴とする宛名読取装置。
【請求項２】郵便物上の所定の枠外に記載された郵便
番号を含む宛名情報の画像を読取る読取手段と、この読取手段で読取られた宛名情報の画像を２値化して
２値画像に変換する２値画像変換手段と、この２値画像変換手段で変換された２値画像から、その
画素の連結成分をもとに外接矩形領域を抽出して、その
外接矩形領域の分布をもとに、複数の行を検出する行検
出手段と、この行検出手段で検出された複数の行の分布をもとに前
記宛名情報の記載されている宛名記載領域を検出する宛
名記載領域検出手段と、この宛名記載領域検出手段で検出された宛名記載領域内
に含まれる複数の行のそれぞれについて、その行内に含
まれる前記外接矩形領域を、その行の方向に垂直な方向
に統合する統合手段と、この統合手段で統合された前記各行内の外接矩形領域の
特徴に基づき、前記行を解析して、その行に前記郵便番
号が記載されている可能性の高さを示す評価値を算出す
る評価値算出手段と、この評価値算出手段で算出された評価値に基づき、前記
行検出手段で検出された複数の行から前記郵便番号の記
載されている可能性の高い郵便番号記載行候補を抽出す
る抽出手段と、この抽出手段で前記宛名記載領域内のそれぞれから抽出
された郵便番号記載行候補について、前記評価値算出手
段で算出された評価値に基づく優先順位に従って、前記
宛名情報の認識を行う認識手段と、を具備したことを特徴とする宛名読取装置。
【請求項３】前記統合手段は、前記行検出手段で検出
された複数の行のそれぞれについて、その行に含まれる
前記外接矩形領域を行頭からの距離の順に行方向に沿っ
て、前記行の垂直方向に存在する前記外接矩形領域を統
合することを特徴とする請求項２記載の宛名読取装置。
【請求項４】前記評価値算出手段は、前記行の行方向
およびその反対方向のそれぞれについて、前記統合手段
で統合された外接矩形領域から解析対象の外接矩形領域
を決定し、その外接矩形領域の特徴に基づき、前記行の
解析を行って、その行に前記郵便番号が記載されている
可能性の高さを示す評価値を算出することを特徴とする
請求項２記載の宛名読取装置。
【請求項５】前記評価値算出手段は、前記行検出手段
で検出された複数の行のうち、前記統合手段で統合され
た外接矩形領域の総数があらかじめ定められた値以上の
ものを解析対象行として抽出し、その抽出された解析対
象行のそれぞれについて、前記郵便番号とその他の宛名
情報との境界とみなされる空白部分を検出して、前記行
の行方向に沿って前記空白部分の両側に存在する前記外
接矩形領域から、それぞれ解析対象の外接矩形領域を決
定し、その解析対象の外接矩形領域の特徴に基づき、前
記解析対象行の解析を行って、前記解析対象行に前記郵
便番号が記載されている可能性の高さを示す評価値を算
出することを特徴とする請求項２記載の宛名読取装置。
【請求項６】前記評価値算出手段は、前記行検出手段
で検出された複数の行のうち、前記統合手段で統合され
た外接矩形領域の総数があらかじめ定めされた範囲内で
あるとき、前記行内に存在する全ての外接矩形領域を解
析対象の外接矩形領域として決定して、その解析対象の
外接矩形領域の特徴に基づき、前記行の解析を行い、前
記行に前記郵便番号が記載されている可能性の高さを示
す評価値を算出することを特徴とする請求項２記載の宛
名読取装置。
【請求項７】前記評価値算出手段は、前記行内の外接
矩形領域の大きさに基づく統計値に基づき、前記行を解
析して、その行に前記郵便番号が記載されている可能性
の高さを示す評価値を算出することを特徴とする請求項
２記載の宛名読取装置。
【請求項８】前記評価値算出手段は、前記行内の隣り
合う前記外接矩形領域の位置関係に基づく統計値に基づ
き、前記行を解析して、その行に前記郵便番号が記載さ
れている可能性の高さを示す評価値を算出することを特
徴とする請求項２記載の宛名読取装置。
【請求項９】前記評価値算出手段は、前記行内の外接
矩形領域に対応する前記２値画像について、１方向に複
数箇所走査した際に白黒が反転する回数に基づく前記２
値画像の特徴量に基づき、前記行を解析して、その行に
前記郵便番号が記載されている可能性の高さを示す評価
値を算出することを特徴とする請求項２記載の宛名読取
装置。
【請求項１０】前記評価値算出手段は、前記行内の外
接矩形領域の特徴に基づき、前記行を解析して、その行
に前記郵便番号が記載されている可能性の高さを示す評
価値を算出する際に、前記特徴が前記郵便番号が記載さ
れている可能性の高さを判断する際に重要な要素である
か否かに基づく重みを加味して評価値を算出することを
特徴とする請求項２記載の宛名読取装置。
【請求項１１】郵便物上の所定の枠外に記載された郵
便番号を含む宛名情報の画像を読取る読取手段と、この読取手段で読取られた宛名情報の画像を２値化して
２値画像に変換する２値画像変換手段と、この２値画像変換手段で変換された２値画像から、その
画素の連結成分をもとに外接矩形領域を抽出して、その
外接矩形領域の分布をもとに、複数の行を検出する行検
出手段と、この行検出手段で検出された複数の行の分布をもとに前
記宛名情報の記載されている宛名記載領域を検出する宛
名記載領域検出手段と、この宛名記載領域検出手段で検出された宛名記載領域内
のそれぞれの行について、その行内に含まれる前記外接
矩形領域を行頭からの距離の順に行方向に沿って、前記
行の垂直方向に存在する前記外接矩形領域を統合する統
合手段と、前記宛名記載領域検出手段で検出された宛名記載領域内
の複数の行のうち、その行に含まれる前記統合手段で統
合された外接矩形領域の総数があらかじめ定められた値
以上のものを解析対象行として抽出する第１の抽出手段
と、この第１の抽出手段で抽出された解析対象行に、前記郵
便番号とその他の宛名情報との境界とみなされる空白部
分が存在するとき、前記行の行方向に沿って前記空白部
分の両側に存在する前記統合手段で統合された外接矩形
領域から、それぞれ解析対象の外接矩形領域を決定する
第１の決定手段と、前記第１の抽出手段で抽出された解析対象行に、前記空
白部分が存在しないとき、前記行の行方向およびその反
対方向のそれぞれについて、前記統合手段で統合された
外接矩形領域から解析対象の外接矩形領域を決定する第
２の決定手段と、前記第１の抽出手段で抽出された解析対象行のうち、前
記統合手段で統合された外接矩形領域の総数があらかじ
め定めされた範囲内であるとき、前記行内に存在する全
ての外接矩形領域を解析対象の外接矩形領域として決定
する第３の決定手段と、前記第１の抽出手段で抽出された解析対象行のそれぞれ
について、前記第１、第２、第３の決定手段のいずれか
で決定された解析対象の外接矩形領域、および、その外
接矩形領域に対応する前記２値画像の特徴に基づき、そ
の解析対象行を解析する行解析手段と、この行解析手段で前記解析対象行を解析した結果をもと
に、前記特徴が前記郵便番号が記載されている可能性の
高さを判断する際に重要な要素であるか否かに基づく重
みを加味して、前記解析対象行に前記郵便番号が記載さ
れている可能性の高さを示す評価値を算出する評価値算
出手段と、この評価値算出手段で算出された評価値に基づき、前記
第１の抽出手段で抽出された行から前記郵便番号が記載
されている可能性の高い郵便番号記載行候補を抽出する
第２の抽出手段と、この第２の抽出手段で前記宛名記載領域から抽出された
郵便番号記載行候補について、前記評価値算出手段で算
出された評価値および各郵便番号記載ぎょ候補の位置情
報に基づく優先順位に従って、前記宛名情報の認識を行
う認識手段と、を具備したことを特徴とする宛名読取装置。