JPH09103747A - 宛名領域検出方法および宛名領域検出装置 - Google Patents

宛名領域検出方法および宛名領域検出装置

Info

Publication number
JPH09103747A
JPH09103747A JP7265854A JP26585495A JPH09103747A JP H09103747 A JPH09103747 A JP H09103747A JP 7265854 A JP7265854 A JP 7265854A JP 26585495 A JP26585495 A JP 26585495A JP H09103747 A JPH09103747 A JP H09103747A
Authority
JP
Japan
Prior art keywords
line
character
area
mail piece
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7265854A
Other languages
English (en)
Inventor
Koji Yura
浩司 由良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7265854A priority Critical patent/JPH09103747A/ja
Publication of JPH09103747A publication Critical patent/JPH09103747A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)

Abstract

(57)【要約】 【目的】郵便物の多様な書式に容易に対応でき、宛名領
域の検出の精度の向上が図れる宛名領域検出方法および
宛名領域検出装置を提供できる。 【構成】画像処理部2で入力書状の画像から検出された
行領域の集合と、モデル書状の文字行の集合とで、あら
かじめ参照テーブル記憶部5に登録された検索テーブル
を参照しながら、類似度算出部3で対応度を算出し、最
近傍行テーブル6を用いて行領域に対応するモデル書状
の文字行(対応行)を検出し、さらに各モデル書状毎の
類似度を算出して、宛名領域検出部4で、その類似度を
もとに入力書状に対応するモデル書状を選択し、そのモ
デル書状の宛名領域内の宛名文字行に対応する行を入力
書状の宛名行候補として検出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、郵便物の宛名記載
面の画像を読取って、その画像をもとに郵便物の宛名記
載領域を検出する宛名領域検出方法および宛名領域検出
装置に関する。
【0002】
【従来の技術】郵便物自動処理装置において、郵便物の
受取人宛名領域を検出する方法として、例えば、自由書
式で記載された定型郵便物の表面画像より、文字認識情
報を用いず、入力画像の特徴のみを使用し、高速に宛名
領域を検出するものがある。
【0003】すなわち、まず、入力された郵便物の表面
画像を画像解析に必要に特徴をもつ画像に変換するため
に、前処理としてエッジ強調処理を施す。この前処理に
より、線密度の高い宛名文字部と背景との差異を明確に
し、安定した2値化処理を可能とする。さらに、その2
値画像を入力として、入力画像領域をメッシュ状に分割
し、2値画像の頻度を多値化した新たな圧縮画像を生成
する。
【0004】次に、別の検知手段によって測った郵便物
サイズによって与えられる、複数の所定領域内での特徴
画像を検出する。すなわち、(1)料額印面の検出(位
置、種類)、(2)郵便番号記入枠の検出、(3)
(1)、(2)を使って入力郵便物の正逆搬送検出を行
い、そして、プロフィルを用いた宛名行の縦横判定を行
う。
【0005】このような書式判定結果に基づき、宛名行
方向が横と判定されたものを優先的に、正搬送では、最
先端行から始まる数ブロック分を宛名領域とする。上記
の処理対象とならなかった郵便物は行方向を縦と仮定し
て、さらに、線密度評価、ブロックの位置・サイズを統
計テーブルと照合して、宛名領域を決定する。
【0006】
【発明が解決しようとする課題】このように、従来の宛
名領域検出方法は、書式が多様な郵便物の宛名記載面の
画像から効率よく宛名領域を検出するために、様々な書
式から宛名行と宛名以外の領域の位置関係について、設
計者が分析と経験に基づいて、宛名行検出のアルゴリズ
ムを開発していた。従って、検出アルゴリズムが複雑化
し、性能の向上や書式の変化への対応が困難となるとい
う問題点があった。
【0007】そこで、本発明は、郵便物の多様な書式に
容易に対応でき、宛名領域の検出の精度の向上が図れる
宛名領域検出方法および宛名領域検出装置を提供するこ
とを目的とする。
【0008】
【課題を解決するための手段】本発明の宛名領域検出方
法は、入力された郵便物上の画像から複数の行領域を抽
出し、この抽出された複数の行領域の領域情報と、あら
かじめ記憶された複数種類の参照郵便物上の文字行の領
域情報をもとに、前記抽出された複数の行領域のそれぞ
れに対し前記文字行を対応付けて、この複数の行領域の
それぞに対し対応付けられた文字行に基づき、前記郵便
物と前記参照郵便物との類似度を算出し、この算出され
た類似度をもとに、前記郵便物に対応する前記参照郵便
物を選択し、その選択された参照郵便物上の複数の宛名
文字行で構成される宛名領域を前記郵便物の宛名領域と
して検出することにより、郵便物の多様な書式に容易に
対応でき、宛名領域の検出の精度の向上が図れる。
【0009】また、本発明の宛名領域検出装置は、あら
かじめ与えられた複数種類の参照郵便物上の文字行の領
域情報を前記参照郵便物に対応させて記憶する記憶手段
と、郵便物上の画像を電気信号に変換して入力する画像
入力手段と、この画像入力手段で入力された画像をもと
に、複数の行領域を抽出する行抽出手段と、この行抽出
手段で抽出された複数の行領域の領域情報と前記記憶手
段に記憶された文字行の領域情報をもとに、前記行抽出
手段で抽出された複数の行領域のそれぞれに対し前記文
字行を対応付ける対応付け手段と、前記行抽出手段で抽
出された複数の行領域と、この複数の行領域のそれぞに
対し前記対応付け手段で対応付けられた文字行に基づ
き、前記画像入力手段で画像が入力された郵便物と、前
記記憶手段に記憶された参照郵便物との類似度を算出す
る類似度算出手段と、この類似度算出手段で算出された
類似度をもとに、前記参照郵便物のうち、前記画像入力
手段で画像が入力された郵便物に対応する参照郵便物を
選択し、その選択された参照郵便物上の複数の宛名文字
行で構成される宛名領域を前記記憶手段から読出すこと
により、前記画像入力手段で画像が入力された郵便物の
宛名領域を検出する検出手段とを具備することにより、
郵便物の多様な書式に容易に対応でき、宛名領域の検出
の精度の向上が図れる。
【0010】さらに、前記記憶手段は、各文字行の端点
位置、中心位置についてハッシュ法に基づき作成された
前記文字行の検索テーブルを具備し、前記対応付け手段
は、前記検索テーブルを参照して、前記記憶手段に記憶
された文字行のうち、その中心位置が前記行抽出手段で
抽出された各行領域の中心位置の近傍にあるものを検索
して、その検索された文字行の中から前記行領域のそれ
ぞれに対し対応付けを行うことにより、前記対応付け手
段の処理動作が高速に行える。
【0011】
【発明の実施の形態】以下、本発明の一実施形態につい
て図面を参照して説明する。図1は、本実施形態に係る
宛名領域検出装置の構成を概略的に示すものである。
【0012】図1において、宛名領域検出装置は、画像
入力部1、画像処理部2、類似度算出部3、宛名領域検
出部4、参照パターン記憶部5から構成される。処理対
象の郵便物は、図示しない搬送手段により画像入力部1
に送られる。
【0013】画像入力部1は、例えば、スキゃナにより
光学的な走査によって、郵便物の宛名記載面の画像が光
電変換されることにより、郵便物(以下、書状ともい
う)上の画像が入力されるようになっている。
【0014】画像処理部2は、画像入力部1で入力され
た画像をもとに、その入力された書状の種類(はがき、
封書等)を識別するために必要な情報として、入力書状
の画像の大きさ、例えば、面積、縦横比等を求める。さ
らに、例えば、特願平6−64005号に記載されてい
る行検出処理を行って、行領域を複数個検出する画像処
理を行うようになっている。
【0015】ここで、特願平6−64005号に記載さ
れている行検出処理について簡単に説明する。まず、画
像入力部1で入力された画像は2値化処理が施され、そ
の2値化画像上の連結している画素領域を求め、その領
域に外接する矩形領域を求める。その後各矩形領域の形
状、位置などをあらかじめ容易した知識によって判定
し、例えば、書状上の汚れなどから生成される不要な矩
形データ(雑音)を除去する。そして、残った矩形デー
タは、郵便物の縦横2方向に文字の書かれている方向を
仮定し、それぞれの方向について独立に文字行の抽出を
行う。
【0016】図2に、画像処理部2で行検出処理を行っ
て検出される行領域の具体例を示す。図2(a)は、
x、y座標があらかじめ設定された書状の、そのx方向
に沿った行領域であるx方向行を示し、図2(b)は、
図2(a)と同様にx、y座標が設定された書状の、そ
のy方向に沿った行領域であるy方向行を示している。
【0017】このようにして検出されたx方向、y方向
の行領域の位置情報(各行領域の中心座標、端点の座標
等)は、類似度算出部3に供給される。なお、後述する
参照パターンの登録処理では、画像処理部2で検出され
た複数の行領域から、さらに、特願平6−64005号
に記載されているような処理を行って宛名領域を検出す
るようになっている。そして、検出された宛名領域の情
報と、その宛名領域内の文字行の情報は、参照パターン
登録処理部7に送られる。
【0018】ここで、特願平6−64005号に記載さ
れている宛名検出処理について簡単に説明する。すなわ
ち、前述したように検出された行領域(文字行)に対
し、x方向、y方向のそれぞれの方向で、例えば、ま
ず、各文字行データの形状に関してあらかじめ用意した
知識によって宛名記載対象データであるか否かを判断し
(文字行ブロックの評価)、その結果宛名記載対象デー
タと判定されたものについて、次に、x方向に外接矩形
データを統合することによって抽出されたx方向の文字
行ブロックデータにおいて、y方向に隣接する文字行ブ
ロック、および、x方向に一列に並んでいる文字行ブロ
ックを統合していくことにより、x方向の宛名領域を検
出する。また、y方向に外接矩形データを統合すること
によって抽出されたy方向の文字行ブロックデータにお
いて、x方向に隣接する文字行ブロック、および、y方
向に一列に並んでいる文字行ブロックを統合していくこ
とにより、y方向の宛名領域を検出する。
【0019】参照パターン登録処理部7は、画像処理部
2からの情報をもとに、各モデル書状毎の参照パターン
テーブルや、検索テーブルを作成して、参照パターン記
憶部5への登録処理を行うようになっている。
【0020】類似度算出部3は、参照パターン記憶部5
に記憶されている検索テーブル、参照パターンテーブル
を参照して、画像処理部2で検出された複数個の行領域
のそれぞれに最もマッチするモデル書状内の行(対応
行)を検出し、さらに、各行領域と、それに対応して検
出された対応行との対応度をもとに、入力書状と各モデ
ル書状との類似度を算出するようになっている。その
際、後述するように、最近傍行テーブル6を用いるよう
になっている。
【0021】宛名領域検出部4は、類似度算出部3で算
出された類似度をもとに、処理対象の書状に最もマッチ
するとして選択されたモデル書状の宛名領域の情報を参
照パターン記憶部5に記憶された参照パターンテーブル
から読出すことにより、処理対象の書状の宛名領域を検
出するようになっている。
【0022】さて、郵便物上には、宛名以外に広告文、
通信文、差出人住所氏名、料額印刷(切手、消印等)、
郵便番号記入枠などの情報が混在する。また、宛名は、
記載位置、縦書き・横書きなど記載方向が不定であり、
更に手書き宛名表記では文字の大きさが大きく変動する
などの問題点がある。このような問題点のある郵便物上
の画像から効率よく宛名領域を検出するために、本発明
では、様々な書式の郵便物を集めてモデル書状とし、各
モデル書状から、そのモデル書状の大きさ、宛名領域内
に含まれる行の情報等で構成される参照パターンを作成
して、参照パターン記憶部5にあらかじめ登録するよう
になっている。
【0023】次に、図3の示すフローチャートを参照し
て、参照パターンの登録処理について説明する。まず、
画像入力部1でモデル書状の宛名記載面の画像を入力す
る(ステップS1)。そして、この入力されたモデル書
状の画像をもとに画像処理部2で求められたモデル書状
の面積、縦横比等をもとに、参照パターン登録処理部7
では、まず、その書状が、はがきか封書かといった分類
を行い、これらを参照パターンテーブルに登録する(ス
テップS2)。
【0024】次に、画像処理部2で行検出処理を行い、
文字行の検出を行い(ステップS3)、その検出された
複数の文字行をもとに、宛名文字が記載されている複数
の文字行で構成される宛名領域を本装置の操作者により
指定する(ステップS4)。
【0025】モデル書状上の指定された宛名領域の情
報、その宛名領域内の文字行の位置情報等は、参照パタ
ーン登録処理部7で、参照パターンテーブルに登録され
る(ステップS5)。なお、以下の説明における座標と
は、書状の大きさに対する比率として正規化されている
ものとする。
【0026】このようにして、参照パターン記憶部5に
登録された参照パターンテーブルの記憶例を図4に示
す。すなわち、1つのモデル書状の参照パターンテーブ
ルには、新規なモデル書状が登録される毎に、参照パタ
ーン登録処理部7で発番されるモデル書状識別子、モデ
ル書状を分類するための面積、縦横比等の大きさに関す
る情報、はがきか封書かといった分類結果、宛名領域の
位置、大きさ、その宛名領域に含まれる文字行数等の宛
名領域情報、各文字行のそれぞれに対し発番された行識
別子と位置情報等が記憶されている。
【0027】図3の説明に戻る。図3のステップS1〜
ステップS5までの処理で登録された参照パターンテー
ブルの内容をもとに、参照パターン登録処理部7は、検
索テーブルを作成し、登録する(ステップS6)。すな
わち、ステップS2でなされた分類毎に、同じ分類に属
する全ての書状の文字行の端点と中心点の座標値から、
これらの行を高速に検索できるような検索テーブルを作
成する。例えば、図5(a)に示すようなx方向行の場
合、y方向の座標の範囲がy1≦y≦y2のとき、y
1、y2、(y1+y2)/2が検索データとなる。ま
た、図5(b)に示すようなy方向行の場合、x方向の
座標の範囲がx1≦x≦x2のとき、x1、x2、(x
1+x2)/2が検索データとなる。結局、各分類毎に
x方向行の検索テーブルとy方向行の検索テーブルが作
成されることになる。なお、この検索テーブルは、高速
な検索が可能なように、例えば、文字行の端点、中心点
の座標についてハッシュ法に基づき作成されたものであ
ってもよい。
【0028】図6は、検索テーブルの記憶例を示したも
ので、ここでは、x方向行検索テーブルの場合を示して
いるが、y方向行検索テーブルもこれと同様である。図
6に示したx方向行の検索テーブルには、例えば、文字
行の識別子と、その行の中心点の座標(x座標およびy
座標)、端点の座標、その文字行を含むモデル書状識別
子が記憶されている。また、必要に応じてそのモデル書
状の識別子に対応する参照パターンテーブルの記憶領域
のアドレス(ポインタ)が記憶されていてもよい。ここ
では、x方向行検索テーブルの場合を示しているが、y
方向行検索テーブルもこれとほぼ同様である。
【0029】以上の参照パターンの登録処理の結果、例
えば、図7に示すようなデータ構造の参照パターンが得
られることになる。すなわち、処理対象の書状の大きさ
をキーとして、はがき、封書等の書状の種類に分類し、
その各分類毎の検索テーブルの記憶領域のアドレスを示
す分類テーブル、x方向行検索テーブルとy方向行検索
テーブルを具備した各分類毎の検索テーブル、さらに、
各モデル書状毎の参照パターンテーブルで構成される。
【0030】次に、図8に示すフローチャートを参照し
て、図1に示した宛名領域検出装置における宛名領域の
検出処理動作について説明する。まず、画像入力部1で
処理対象の書状の宛名記載面の画像を入力する(ステッ
プS10)。そして、この入力された書状の画像をもと
に、画像処理部2では、その書状の面積、縦横比を求
め、さらに、行検出処理を行う(ステップS11)。
【0031】次に、類似度算出部3では、入力書状の画
像から求められた書状の面積、縦横比から、それに対応
する書状の種類を参照パターン記憶部5に記憶された分
類テーブルを参照して求める(ステップS12)。そし
て、最近傍行テーブル6を初期化する(ステップS1
3)。
【0032】図9は、類似度算出部3に具備される最近
傍行テーブル6の記憶例を示したものである。入力書状
の画像から検出された行領域の数をn個、モデル書状が
全部でm個あるとき、最近傍行テーブルはn×mのテー
ブルとなる。図9では、縦方向に入力書状から検出され
た行領域の識別子Li(i=1〜n)、横方向にモデル
書状の識別子Mj(j=1〜m)を設け、行領域識別子
とモデル書状識別子との交点にあたる要素を(Li、M
j)と表す。各要素(Li、Mj)には、識別子Miの
モデル書状から検出された識別子Liの行領域に対応す
る対応行の識別子と、その対応行との対応度を保持する
ようになっている。なお、対応度が大きいものほど行領
域とモデル書状の文字行が類似しているとするならば、
最近傍行テーブル6の各要素(Li、Mj)の初期値と
しては、有り得る値のうち最小の値、例えば「0」を設
定する。
【0033】最近傍行テーブル6の初期化が終了する
と、次に、検索テーブルを参照して、図9に示したよう
な最近傍行テーブル6を更新しながら、入力書状の各行
領域のそれぞれに最もマッチする対応行を検出する対応
行検出処理を行う(ステップS14)。その詳細は後述
する。そして、対応行が検出されたとき、最近傍行テー
ブルの所定の位置に、その検出された対応行の識別子
と、その対応行とそれに対応する行領域との対応度(例
えば、「1」)を記憶する。実際には、ステップS14
の対応行検出処理は、x方向行の検索テーブルとy方向
行の検索テーブルのそれぞれについて実行される。
【0034】次に、各モデル書状毎に類似度を算出する
(ステップS15)。すなわち、ステップS14での対
応行検出処理で、図9に示したような最近傍行テーブル
に記憶された行領域と検出された対応行との対応度をも
とに、各モデル書状毎の類似度を算出する。
【0035】ここでは、行の対応数(各モデル書状の行
のうち、入力書状から抽出された行領域に対応行として
対応付けされた文字行の数で、各モデル書状毎に、図9
に示す最近傍行テーブル6の縦方向に対応度「1」を加
算した値)の2倍を入力書状とモデル書状の行数の和で
割った値を、そのモデル書状と入力書状の類似度とす
る。
【0036】そして、宛名領域検出部4で、類似度が最
も高いものを入力書状に対応するモデル書状と判断し、
そのモデル書状の参照パターンテーブルから宛名領域情
報を読出し、それを入力書状の宛名領域情報とする(ス
テップS16)。
【0037】なお、このようにして検出された宛名領域
内の文字行のうち、この段階では、実際の入力書状に対
応する宛名文字行は唯一決定するのではない。従って、
例えば、特願平7−030717号に記載されている処
理により、複数の行候補から最終的な宛名文字行を検索
するようにしてもよい。従って、ステップS16では、
その検出された宛名領域情報をもとに、モデル書状の複
数の文字行に対応する入力書状の複数の行領域や、類似
度の高い複数のモデル書状の文字行に対応する入力書状
の複数の行領域を、実際の宛名文字行の候補として出力
することとなる。
【0038】次に、図10に示すフローチャートを参照
して、図8のステップS14の類似度算出部3における
対応行検出処理について詳細に説明する。まず、x方向
行の対応行検出処理を、図6に示すようなx方向行検索
テーブルを参照して行う。
【0039】画像処理部2で検出された、例えば、行領
域の端点、中心点の座標を入力書状の大きさに対する比
率として正規化する(ステップS20)。そして、例え
ば、図9に示した最近傍行テーブル6を用いて、行領域
の識別子L1から順次、入力書状の種類に対応する検索
テーブルを参照して対応行の検出処理を行う(ステップ
S21〜ステップS23)。
【0040】図11に示すように、行領域のうち、ある
注目行のx方向の範囲がu1≦x≦u2にあり、y方向
の範囲がv1≦y≦v2にある場合、その注目行の中心
点c1の座標は((u1+u2)/2、(v1+v2)
/2)である。
【0041】このとき、検索テーブルでの中心点のy方
向の検索範囲を適当な値Δyを用いて、 (v1+v2)/2−Δy≦y≦(v1+v2)/2+Δy …(1) とし、また、x方向の検索範囲を適当な値Δxを用い
て、 (u1+u2)/2−Δx≦x≦(u1+u2)/2+Δx …(2) とする。
【0042】そして、検索テーブルから、中心点が
(1)式を満たす行のうち、さらに(2)式を満たす文
字行を検索する。そのような文字行があれば、それを注
目行の対応行として、図9に示したような最近傍行テー
ブルの対応する要素(Li、Mj)に、その対応行の識
別子と対応度を登録する(ステップS24)。この場
合、対応度は、例えば、対応行があれば「1」、なけれ
ば初期値の「0」のままとする。
【0043】全ての行領域について対応行が検索される
まで(ステップS25、ステップS22)、ステップS
23〜24を繰り返す。次に、y方向行の対応行検出処
理を行う。y方向行の対応行検出処理も、図10に示す
たフローチャートと同様である。
【0044】以上が、検索対象を行の中心点に限定した
場合における入力書状の各行領域に対応するモデル書状
の宛名文字行(対応行)の検出方法である。さて、入力
書状の行領域とモデル書状の文字行との対応度の算出方
法は、上記した第1の方法以外にもいくつか考えられ
る。例えば、第2の方法として、図12に示すように、
行領域のうちある注目行の中心点C1と検索テーブルか
ら検索された対応行の中心点C2との距離を求め、それ
を対応度とすることもできる。この場合、図8のステッ
プS13で最近傍行テーブルを初期化する際に登録され
る対応度の初期値は、実際にあり得る距離よりも大きい
値とし、ステップS15で最終的に算出される各モデル
書状毎の距離が最も小さいものを、ステップS16で、
その入力書状のモデル書状と判断する。
【0045】また、第3の方法として、注目行と検索テ
ーブルから検索された対応行との位置関係から重複する
部分の面積を求め、それを対応度とすることもできる。
さらに、第4の方法として、注目行の面積Dtと、検索
テーブルから検索された対応行の面積Dmと、注目行と
対応行との重複する部分の面積D0をそれぞれ求め、2
D0/(Dt+Dm)を対応度とすることもできる。
【0046】対応度を上記第2〜第4の方法により算出
する場合の対応行検出処理について図13に示すフロー
チャートを参照して説明する。まず、x方向行の対応行
検出処理を、図6に示すようなx方向行検索テーブルを
参照して行う。
【0047】ステップS20〜ステップS22までの処
理は、図10と同様である。次に、ステップS30に進
み、図6に示すようなx方向行検索テーブルを参照し
て、例えば、注目行の中心点のy座標をもとに、(1)
式の条件を満たす文字行を検索し、対応行の候補となる
行(候補行)を選択する。なお、y方向行の対応行検出
処理を行う場合は、注目行の中心点のx座標が(2)式
の条件を満たす文字行を検索するようにすればよい。
【0048】候補行を選択する際に、さらに、上記の条
件に加えて、例えば、注目行の中心点と文字行の端点の
座標との比較結果を参照することにより、より精度のよ
い候補行の選択が可能となる。すなわち、x方向行の場
合、(1)式の条件を満たす文字行のうち、さらに、x
方向行検索テーブルを参照して、注目行の中心点が文字
行の端点のy座標の範囲内である文字行を検索すればよ
い (図5(a)参照)。また、y方向行の場合、
(2)式の条件を満たす文字行のうち、さらに、y方向
行検索テーブルを参照して、注目行の中心点が宛名文字
行の端点のx座標の範囲内である文字行を検索すればよ
い(図5(b)参照)。
【0049】そして、選択された候補行と、注目行との
対応度を前記第2〜第4の方法のいずれかの方法により
算出する(ステップS31)。ここでは、選択された候
補行の識別子をMLk、注目行の識別子をLiとする
と、このとき算出される対応度をS(Li、MLk)と
表す。また、選択された候補行のモデル書状の識別子を
Mjと表す。
【0050】さて、ここで、最近傍行テーブルの対応の
要素(Li、Mj)に、前回までに登録された対応度S
max(Li、Mj)と、今回算出された対応度S(L
i、MLk)を比較し、Smax(Li、Mj)の方が
大きい場合(第2の方法の場合、Smax(Li、M
j)の方が小さい場合)、ステップS34に進み、その
注目行について、対応行の検出処理(ステップS30〜
ステップS33)が、x方向行検索テーブル内に登録さ
れている全ての行について終了するまで実行する。
【0051】一方、S(Li、MLk)がSmax(L
i、Mj)より大きい場合(第2の方法の場合、S(L
i、Mj)がSmax(Li、Mj)より小さい場
合)、ステップS33に進み、最近傍行テーブルの対応
の要素(Li、Mj)に、今回算出された対応度S(L
i、MLk)と、その候補行の識別子を登録し、最近傍
行テーブルを更新する。そして、ステップS34に進
む。
【0052】ステップS34で、その注目行に対して、
x方向行検索テーブル内に登録されている全ての文字行
の検索が終了したとき、ステップS35に進み、iをイ
ンクリメントして、入力書状の他の行領域を注目行とし
て、ステップS22に戻る。
【0053】入力書状の画像から抽出された全ての行領
域について、前述のステップS30〜ステップS34の
処理が終了したら、x方向行の対応行検出処理を終了す
る(ステップS22)。
【0054】この時点で、最近傍行テーブル6の各要素
に記憶されているのは、入力書状の各行領域の対応行と
して検出されたモデル書状の文字行の識別子と、その対
応度である。すなわち、第2の方法による場合は、各行
領域に対して、中心点間の距離が最小となるモデル書状
の文字行が対応行として検出され、第3の方法、第4の
方法による場合は、各行領域に対して、その重複する面
積が最大となるモデル書状の文字行が対応行として検出
される。
【0055】次に、y方向行の対応行検出処理を行う。
y方向行の対応行検出処理も、図13に示すたフローチ
ャートと同様である。次に、対応度を上記第2〜第4の
方法により算出する場合、図8のステップS15におけ
る各モデル書状毎の類似度の算出方法について説明す
る。
【0056】第2の方法では、最近傍行テーブルに記憶
されている、対応度として求められた中心点間の距離の
平均値をそのモデル書状と入力書状の距離として、それ
を各モデル書状毎の類似度とする。ただし、対応行とし
て検出されなかった文字行については、その文字行の幅
の1/2を距離とする。
【0057】第3、第4の方法では、対応度として求め
られた重複面積の和を2倍した値を入力書状から検出さ
れたすべての行領域と、そのモデル書状の全ての文字行
の面積和で割った値を入力書状とモデル書状の類似度と
する。
【0058】以上のようにして、図1に示した宛名検出
装置は、入力書状の画像から検出された行領域の集合
と、モデル書状の文字行の集合とで対応度を算出し、そ
の算出された対応度をもとに、さらに入力書状とモデル
書状の類似度を算出して、入力書状に最もマッチするモ
デル書状を選択して、そのモデル書状の複数の文字行で
構成される宛名領域を入力書状の宛名領域として検出す
るようになっている。しかし、モデル書状として適切な
書状が選ばれなかったり、入力書状の行領域に対し適切
な対応行が選ばれなかった場合には、その入力書状をモ
デル書状として、前述の参照パターンの登録処理に従っ
て登録するばよい。その際、検索テーブルを再構築す
る。
【0059】以上、説明したように、上記実施形態によ
れば、様々な書式の郵便物を集めてモデル書状とし、各
モデル書状から、そのモデル書状の大きさ、宛名領域内
に含まれる文字行の情報等で構成される参照パターンを
作成して、参照パターン記憶部5にあらかじめ登録する
とともに、対応行検出のための検索テーブルを構築して
おき、一方、入力書状から宛名領域を検出する際には、
画像処理部2で入力書状の画像から検出された行領域の
集合と、モデル書状の文字行の集合とで、あらかじめ参
照テーブル記憶部5に登録された検索テーブルを参照し
ながら、類似度算出部3で対応度を算出し、最近傍行テ
ーブル6を用いて行領域に対応するモデル書状の文字
行、すなわち対応行を検出し、さらに、その検出された
対応行とその対応度をもとに、各モデル書状毎の類似度
を算出して、その類似度をもとに宛名領域検出部4で入
力書状に対応するモデル書状を選択し、そのモデル書状
の宛名領域内の文字行を入力書状の宛名行候補として検
出することにより、宛名領域の検出の精度の向上が図れ
る。
【0060】また、上記宛名領域の検出方法は、入力書
状の行領域とモデル書状の文字行との対応度、入力書状
とモデル書状との類似度をもとに、入力書状に最もマッ
チするモデル書状を選択するという簡単なアルゴリズム
で実現でき、さらに、モデル書状を追加登録することで
郵便物の多様な書式にも容易に対応できる。
【0061】
【発明の効果】以上説明したように、本発明によれば、
郵便物の多様な書式に容易に対応でき、宛名領域の検出
の精度の向上が図れる宛名領域検出方法および宛名領域
検出装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施形態にかかる宛名領域検出装置
の構成を概略的に示したブロック図。
【図2】画像処理部で行検出処理を行って検出される行
領域の具体例を示した図で、(a)図はx方向に沿った
行領域であるx方向行の具体例を示し、(b)図は、y
方向に沿った行領域であるy方向行の具体例を示してい
る。
【図3】参照パターンの登録処理について説明するため
のフローチャート。
【図4】参照パターンテーブルの記憶例を示した図。
【図5】検索テーブルを作成する際の検索データとなる
宛名文字行の中心点と端点について説明するための図
で、(a)図はx方向行の場合を示し、(b)図は方向
行の場合を示している。
【図6】参照パターン記憶部に記憶される検索テーブル
の記憶例を示したもので、特に、x方向行の検索テーブ
ルの場合を示している。
【図7】参照パターンのデータ構造の一具体例を説明す
るための図。
【図8】図1の宛名領域検出装置における宛名領域の検
出処理動作について説明するためのフローチャート。
【図9】最近傍行テーブルの記憶例を示した図。
【図10】類似度算出部における対応行検出処理の具体
例について説明するためのフローチャート。
【図11】行領域の中心点について説明するための図。
【図12】対応度の算出方法の一具体例である、行領域
の中心点と宛名文字行の中心点との間の距離を対応度と
して算出する方法について説明するための図。
【図13】類似度算出部における対応行検出処理の他の
具体例について説明するためのフローチャート。
【符号の説明】 1…画像入力部、、2…画像処理部、3…類似度算出
部、4…宛名領域検出部 5…参照パターン記憶部、6…最近傍行テーブル、7…
参照パターン登録処理部。

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 入力された郵便物上の画像から複数の行
    領域を抽出し、この抽出された複数の行領域の領域情報
    と、あらかじめ記憶された複数種類の参照郵便物上の文
    字行の領域情報をもとに、前記抽出された複数の行領域
    のそれぞれに対し前記文字行を対応付けて、この複数の
    行領域のそれぞに対し対応付けられた文字行に基づき、
    前記郵便物と前記参照郵便物との類似度を算出し、この
    算出された類似度をもとに、前記郵便物に対応する前記
    参照郵便物を選択し、その選択された参照郵便物上の複
    数の宛名文字行で構成される宛名領域を前記郵便物の宛
    名領域として検出することを特徴とする宛名領域検出方
    法。
  2. 【請求項2】 前記抽出された行領域の中心位置と前記
    文字行の中心位置をもとに、前記行領域のそれぞれに対
    し前記あらかじめ記憶された文字行を対応付け、前記参
    照郵便物毎に、その参照郵便物上の文字行のうち前記行
    領域に対応付けされた文字行の数を求め、その求めた値
    を2倍したものを、その参照郵便物上の文字行の数と前
    記抽出された行領域の数の和で除算することにより前記
    類似度を算出することを特徴とする請求項1記載の宛名
    領域検出方法。
  3. 【請求項3】 前記抽出された行領域の中心位置と前記
    文字行の中心位置との間の距離をもとに、前記行領域の
    それぞれに対し前記あらかじめ記憶された文字行を対応
    付け、前記参照郵便物毎に、その参照郵便物上の文字行
    のうち前記行領域に対応付けされた文字行の中心位置
    と、その文字行に対応する前記行領域の中心位置との間
    の距離の平均を算出して、それを前記類似度とすること
    を特徴とする請求項1記載の宛名領域検出方法。
  4. 【請求項4】 前記抽出された行領域と前記文字行の重
    複する領域の面積をもとに、前記行領域のそれぞれに対
    し前記あらかじめ記憶された文字行を対応付け、前記参
    照郵便物毎に、その参照郵便物上の文字行のうち前記行
    領域に対応付けされた文字行と、その文字行に対応する
    前記行領域との重複面積の和を求め、その求めた値を2
    倍したものを、その参照郵便物上の文字行の面積和と前
    記郵便物から抽出された行領域の面積和の和で除算する
    ことにより前記類似度を算出することを特徴とする請求
    項1記載の宛名領域検出方法。
  5. 【請求項5】 前記抽出された行領域と前記文字行の重
    複する領域の面積を2倍した値を、その行領域と文字行
    の面積の和で除算して得られた値をもとに前記行領域の
    それぞれに対し前記文字行を対応付け、前記参照郵便物
    毎に、その参照郵便物上の文字行のうち前記行領域に対
    応付けされた文字行と、その文字行に対応する前記行領
    域との重複面積の和を求め、その求めた値を2倍したも
    のを、その参照郵便物上の文字行の面積和と前記郵便物
    から抽出された行領域の面積和の和で除算することによ
    り前記類似度を算出することを特徴とする請求項1記載
    の宛名領域検出方法。
  6. 【請求項6】 前記あらかじめ記憶された文字行のう
    ち、その中心位置が前記郵便物から抽出された各行領域
    の中心位置の近傍にあるものをあらかじめ検索して、そ
    の検索された文字行の中から前記行領域のそれぞれに対
    し対応付けを行うことを特徴とする請求項1記載の宛名
    領域検出方法。
  7. 【請求項7】 前記参照郵便物上の文字行の少なくとも
    中心位置を検索項目として構築された文字行の検索テー
    ブルを参照して、前記文字行のうち、その中心位置が前
    記郵便物から抽出された行領域の中心位置の近傍にある
    ものを検索して、その検索された文字行の中から前記行
    領域のそれぞれに対し対応付けを行うことを特徴とする
    請求項1記載の宛名領域検出方法。
  8. 【請求項8】 前記文字行は、あらかじめ与えられた複
    数種類の参照郵便物のそれぞれから文字行を検出して、
    その検出された領域情報を前記参照郵便物に対応させて
    記憶されていることを特徴とする請求項1記載の宛名領
    域検出方法。
  9. 【請求項9】 あらかじめ与えられた複数種類の参照郵
    便物上の文字行の領域情報を前記参照郵便物に対応させ
    て記憶する記憶手段と、 郵便物上の画像を電気信号に変換して入力する画像入力
    手段と、 この画像入力手段で入力された画像をもとに、複数の行
    領域を抽出する行抽出手段と、 この行抽出手段で抽出された複数の行領域の領域情報と
    前記記憶手段に記憶された文字行の領域情報をもとに、
    前記行抽出手段で抽出された複数の行領域のそれぞれに
    対し前記文字行を対応付ける対応付け手段と、 前記行抽出手段で抽出された複数の行領域と、この複数
    の行領域のそれぞに対し前記対応付け手段で対応付けら
    れた文字行に基づき、前記画像入力手段で画像が入力さ
    れた郵便物と、前記記憶手段に記憶された参照郵便物と
    の類似度を算出する類似度算出手段と、 この類似度算出手段で算出された類似度をもとに、前記
    参照郵便物のうち、前記画像入力手段で画像が入力され
    た郵便物に対応する参照郵便物を選択し、その選択され
    た参照郵便物上の複数の宛名文字行で構成される宛名領
    域を前記記憶手段から読出すことにより、前記画像入力
    手段で画像が入力された郵便物の宛名領域を検出する検
    出手段と、 を具備したことを特徴とする宛名領域検出装置。
  10. 【請求項10】 前記対応付け手段は、前記行抽出手段
    で抽出された行領域の中心位置と前記記憶手段に記憶さ
    れた文字行の中心位置をもとに、前記行領域のそれぞれ
    に対し前記文字行を対応付け、 前記類似度算出手段は、前記記憶手段に記憶された参照
    郵便物毎に、その参照郵便物上の文字行のうち、前記対
    応付け手段で対応付けされた文字行の数を求め、その求
    めた値を2倍したものを、その参照郵便物上の文字行の
    数と前記行抽出手段で抽出された行領域の数の和で除算
    することにより前記類似度を算出することを特徴とする
    請求項9記載の宛名領域検出装置。
  11. 【請求項11】 前記対応付け手段は、前記行抽出手段
    で抽出された行領域の中心位置と前記記憶手段に記憶さ
    れた文字行の中心位置との間の距離をもとに、前記行領
    域のそれぞれに対し前記文字行を対応付け、 前記類似度算出手段は、前記記憶手段に記憶された参照
    郵便物毎に、その参照郵便物上の文字行のうち前記対応
    付け手段で対応付けされた文字行の中心位置と、その文
    字行に対応する前記行領域の中心位置との間の距離の平
    均を算出して、それを前記類似度とすることを特徴とす
    る請求項9記載の宛名領域検出装置。
  12. 【請求項12】 前記対応付け手段は、前記行抽出手段
    で抽出された行領域と前記記憶手段に記憶された文字行
    の重複する領域の面積をもとに、前記行領域のそれぞれ
    に対し前記文字行を対応付け、 前記類似度算出手段は、前記記憶手段に記憶された参照
    郵便物毎に、その参照郵便物上の文字行のうち前記対応
    付け手段で対応付けされた文字行と、その文字行に対応
    する前記行領域との重複面積の和を求め、その求めた値
    を2倍したものを、その参照郵便物上の文字行の面積和
    と前記行抽出手段で抽出された前記郵便物上の行領域の
    面積和の和で除算することにより前記類似度を算出する
    ことを特徴とする請求項9記載の宛名領域検出装置。
  13. 【請求項13】 前記対応付け手段は、前記行抽出手段
    で抽出された行領域と前記記憶手段に記憶された文字行
    の重複する領域の面積を2倍した値を、その行領域と文
    字行の面積の和で除算して、その結果をもとに、前記行
    領域のそれぞれに対し前記文字行を対応付け、 前記類似度算出手段は、前記記憶手段に記憶された参照
    郵便物毎に、その参照郵便物上の文字行のうち前記対応
    付け手段で対応付けされた文字行と、その文字行に対応
    する前記行領域との重複面積の和を求め、その求めた値
    を2倍したものを、その参照郵便物上の文字行の面積和
    と前記行抽出手段で抽出された前記郵便物上の行領域の
    面積和の和で除算することにより前記類似度を算出する
    ことを特徴とする請求項9記載の宛名領域検出装置。
  14. 【請求項14】 前記対応付け手段は、前記記憶手段に
    記憶された文字行のうち、その中心位置が前記行抽出手
    段で抽出された各行領域の中心位置の近傍にあるものを
    検索して、その検索された文字行の中から前記行領域の
    それぞれに対し対応付けを行うことを特徴とする請求項
    9記載の宛名領域検出装置。
  15. 【請求項15】 前記記憶手段は、各文字行の少なくと
    も中心位置を検索項目とする前記文字行の検索テーブル
    を具備し、 前記対応付け手段は、前記検索テーブルを参照して、前
    記記憶手段に記憶された文字行のうち、その中心位置が
    前記行抽出手段で抽出された各行領域の中心位置の近傍
    にあるものを検索して、その検索された文字行の中から
    前記行領域のそれぞれに対し対応付けを行うことを特徴
    とする請求項9記載の宛名領域検出装置。
  16. 【請求項16】 あらかじめ与えられた複数種類の参照
    郵便物のそれぞれから文字行を検出して、その検出され
    た領域情報を前記参照郵便物に対応させて前記記憶手段
    に登録する登録手段をさらに具備したことを特徴とする
    請求項9記載の宛名領域検出装置。
JP7265854A 1995-10-13 1995-10-13 宛名領域検出方法および宛名領域検出装置 Pending JPH09103747A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7265854A JPH09103747A (ja) 1995-10-13 1995-10-13 宛名領域検出方法および宛名領域検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7265854A JPH09103747A (ja) 1995-10-13 1995-10-13 宛名領域検出方法および宛名領域検出装置

Publications (1)

Publication Number Publication Date
JPH09103747A true JPH09103747A (ja) 1997-04-22

Family

ID=17423008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7265854A Pending JPH09103747A (ja) 1995-10-13 1995-10-13 宛名領域検出方法および宛名領域検出装置

Country Status (1)

Country Link
JP (1) JPH09103747A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009110538A1 (ja) * 2008-03-05 2009-09-11 日本電気株式会社 発送物区分装置、発送物区分方法、プログラムおよびコンピュータ読み取り可能な記録媒体
WO2011033857A1 (ja) * 2009-09-17 2011-03-24 日本電気株式会社 画像処理装置、画像処理方法、区分機およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009110538A1 (ja) * 2008-03-05 2009-09-11 日本電気株式会社 発送物区分装置、発送物区分方法、プログラムおよびコンピュータ読み取り可能な記録媒体
JP5447366B2 (ja) * 2008-03-05 2014-03-19 日本電気株式会社 発送物区分装置、発送物区分方法、プログラムおよびコンピュータ読み取り可能な記録媒体
WO2011033857A1 (ja) * 2009-09-17 2011-03-24 日本電気株式会社 画像処理装置、画像処理方法、区分機およびプログラム

Similar Documents

Publication Publication Date Title
JP3246432B2 (ja) 宛名読取り装置および郵便物等区分機
KR100532800B1 (ko) 우편물들상의 루팅 정보를 인식하기 위한 자동 판독 방법 및 장치
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JP3206579B2 (ja) 宛名領域検出装置
JP3388867B2 (ja) 宛名領域検出装置および宛名領域検出方法
JP2016159245A (ja) 配達物処理装置、および配達物処理プログラム
CN112381086A (zh) 一种结构化输出图像文字识别结果的方法及装置
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
JPH10198755A (ja) バーコード読み取り装置
KR20020062018A (ko) 4-상태 바코드 인쇄 및 판독 시스템과 그 제어 방법
CN111079709B (zh) 一种电子单据的生成方法、装置、计算机设备和存储介质
US8401310B2 (en) Image comparing method, apparatus and program
JP3232991B2 (ja) 文字読取り方法及び住所読取り方法
JPH09103747A (ja) 宛名領域検出方法および宛名領域検出装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US8818023B2 (en) Bulk region of interest learning
JPH09319824A (ja) 帳票認識方法
JPH06124366A (ja) 住所読取装置
Xue et al. Location and interpretation of destination addresses on handwritten Chinese envelopes
JP2827960B2 (ja) 宛名行抽出装置
JP2924896B1 (ja) 絵はがき判定方法及び絵はがき判定装置
JP3160347B2 (ja) 郵便物の宛名読取装置
JP3740271B2 (ja) 文字行記載領域読み取り方法及び郵便物等の宛名認識方法
JP3705216B2 (ja) 文字記入枠検出方法、文字記入枠検出装置及びプログラム
JP5257061B2 (ja) 画像処理装置、方法、プログラム、および発送物区分装置