JPH07265807A - 宛名領域検出装置 - Google Patents

宛名領域検出装置

Info

Publication number
JPH07265807A
JPH07265807A JP6064005A JP6400594A JPH07265807A JP H07265807 A JPH07265807 A JP H07265807A JP 6064005 A JP6064005 A JP 6064005A JP 6400594 A JP6400594 A JP 6400594A JP H07265807 A JPH07265807 A JP H07265807A
Authority
JP
Japan
Prior art keywords
image
character line
address
area
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6064005A
Other languages
English (en)
Other versions
JP3388867B2 (ja
Inventor
Akihiko Nakao
昭彦 中尾
Nobuaki Takagi
宣明 高木
Yoshikatsu Nakamura
好勝 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP06400594A priority Critical patent/JP3388867B2/ja
Priority to US08/413,890 priority patent/US5737437A/en
Publication of JPH07265807A publication Critical patent/JPH07265807A/ja
Application granted granted Critical
Publication of JP3388867B2 publication Critical patent/JP3388867B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Sorting Of Articles (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】郵便物上の宛名領域を高速かつ正確に検出でき
る宛名領域検出装置を提供する。 【構成】画像入力部302は、郵便物301上の画像を
光学的な走査により電気信号に変換して入力する。宛名
領域検出部303は、画像入力部302で入力された画
像を2値化画像に変換し、この2値化画像をその画像中
の画素連結成分を求めた外接矩形データに変換し、この
変換された外接矩形データの形状に関してあらかじめ用
意された知識により宛名表記対象データであるか否かを
判定し、宛名表記対象データであると判定された外接矩
形データに基づき郵便物301上の宛名情報が記載され
ている宛名領域を検出する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、たとえば、郵便物宛名
自動読取区分機などの郵便物処理装置において、郵便物
上の宛名情報が記載されている宛名領域を検出する宛名
領域検出装置に関する。
【0002】
【従来の技術】郵便物の処理分野においては、連日大量
に送られてくる郵便物を限られた時間内に処理して行か
ねばならない。そこで、郵便業務の機械化が進められ、
郵便局員の負担の軽減が図られている。その一例が、光
学的文字読取装置を用いて郵便物上の郵便番号を読取
り、その読取結果に応じて郵便物を複数の送達区域ごと
に区分する郵便番号自動読取区分機、あるいは、更に郵
便物上の宛名情報を読取り、その読取結果に基づき郵便
物を複数の送達区域ごとに区分する配達区分機である。
【0003】しかし、郵便物の書式にはほとんど制約が
設けられていないため、様々な書式の郵便物が存在し、
しかも、郵便物上には広告などの宛名情報以外の文字情
報、絵および写真といったものも存在し、それらの情報
が混在する中から宛名情報を正しく抽出することは非常
に困難である。今後も、ますます郵便物の量が増加して
いくことを考えると、従来手法よりも高性能の宛名読取
手法を求められている。
【0004】
【発明が解決しようとする課題】従来、たとえば、郵便
物宛名自動読取区分機では、郵便物上に記載された宛名
情報を読取る際、画像処理によって宛名情報が記載され
ていると推定される領域を1つ検出し、その宛名領域に
対して文字行検出、文字検出、文字識別、町名識別をパ
イプライン処理することによって宛名情報を認識してい
た。
【0005】しかし、このような従来の技術では、最初
に誤った領域を宛名領域として検出した場合、以降の処
理で宛名情報を正しく認識することは不可能であり、複
数個の領域を使用することは、1領域あたりの処理時間
が長いため、有効ではなかった。そこで、本発明は、郵
便物上の宛名領域を高速かつ正確に検出できる宛名領域
検出装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明の宛名領域検出装
置は、郵便物上の画像を電気信号に変換して入力する画
像入力手段と、この画像入力手段で入力された画像を2
値化し、この2値化画像をその画像中の画素連結成分を
求めた外接矩形データに変換する変換手段と、この変換
手段で変換された外接矩形データに基づき前記郵便物上
の宛名情報が記載されている宛名領域を検出する検出手
段とを具備している。
【0007】また、本発明の宛名領域検出装置は、郵便
物上の画像を電気信号に変換して入力する画像入力手段
と、この画像入力手段で入力された画像を2値化し、こ
の2値化画像をその画像中の画素連結成分を求めた外接
矩形データに変換する変換手段と、この変換手段で変換
された外接矩形データの形状に関してあらかじめ用意さ
れた知識により宛名表記対象データであるか否かを判定
する判定手段と、この判定手段で宛名表記対象データで
あると判定された外接矩形データに基づき前記郵便物上
の宛名情報が記載されている宛名領域を検出する検出手
段とを具備している。
【0008】また、本発明の宛名領域検出装置は、郵便
物上の画像を電気信号に変換して入力する画像入力手段
と、この画像入力手段で入力された画像を2値化し、こ
の2値化画像をその画像中の画素連結成分を求めた外接
矩形データに変換する変換手段と、この変換手段で変換
された外接矩形データの郵便物上における位置および密
度に関してあらかじめ用意された知識により宛名表記対
象データであるか否かを判定する判定手段と、この判定
手段で宛名表記対象データであると判定された外接矩形
データに基づき前記郵便物上の宛名情報が記載されてい
る宛名領域を検出する検出手段とを具備している。
【0009】また、本発明の宛名領域検出装置は、郵便
物上の画像を電気信号に変換して入力する画像入力手段
と、この画像入力手段で入力された画像を2値化し、こ
の2値化画像をその画像中の画素連結成分を求めた外接
矩形データに変換する変換手段と、この変換手段で変換
された外接矩形データについて、x方向およびy方向に
それぞれ隣接する矩形データを統合することにより、文
字行ブロックを抽出する文字行抽出手段と、この文字行
抽出手段で抽出された文字行ブロックに基づき前記郵便
物上の宛名情報が記載されている宛名領域を検出する検
出手段とを具備している。
【0010】また、本発明の宛名領域検出装置は、郵便
物上の画像を電気信号に変換して入力する画像入力手段
と、この画像入力手段で入力された画像を2値化し、こ
の2値化画像をその画像中の画素連結成分を求めた外接
矩形データに変換する変換手段と、この変換手段で変換
された外接矩形データについて、x方向およびy方向に
それぞれ隣接する矩形データを統合することにより、文
字行ブロックを抽出する文字行抽出手段と、この文字行
抽出手段で抽出された文字行ブロックの形状をあらかじ
め用意された知識によって判定し、宛名文字行の一部で
あるか否かを出力する判定手段と、この判定手段の判定
結果に基づき前記郵便物上の宛名情報が記載されている
宛名領域を検出する検出手段とを具備している。
【0011】また、本発明の宛名領域検出装置は、郵便
物上の画像を電気信号に変換して入力する画像入力手段
と、この画像入力手段で入力された画像を2値化し、こ
の2値化画像をその画像中の画素連結成分を求めた外接
矩形データに変換する変換手段と、この変換手段で変換
された外接矩形データについて、x方向およびy方向に
それぞれ隣接する矩形データを統合することにより、文
字行ブロックを抽出する文字行抽出手段と、この文字行
抽出手段で抽出された文字行ブロック内に含まれる外接
矩形データの形状をあらかじめ用意された知識によって
判定し、宛名文字行の一部であるか否かを出力する判定
手段と、この判定手段の判定結果に基づき前記郵便物上
の宛名情報が記載されている宛名領域を検出する検出手
段とを具備している。
【0012】また、本発明の宛名領域検出装置は、郵便
物上の画像を電気信号に変換して入力する画像入力手段
と、この画像入力手段で入力された画像を2値化し、こ
の2値化画像をその画像中の画素連結成分を求めた外接
矩形データに変換する変換手段と、この変換手段で変換
された外接矩形データについて、x方向およびy方向に
それぞれ隣接する矩形データを統合することにより、文
字行ブロックを抽出する文字行抽出手段と、この文字行
抽出手段で抽出されたx方向およびy方向の文字行ブロ
ックについて、それぞれの方向の隣接関係を判定して統
合していくことにより宛名領域候補を検出する宛名領域
候補検出手段と、この宛名領域候補検出手段の検出結果
に基づき前記郵便物上の宛名情報が記載されている宛名
領域を検出する検出手段とを具備している。
【0013】また、本発明の宛名領域検出装置は、郵便
物上の画像を電気信号に変換して入力する画像入力手段
と、この画像入力手段で入力された画像を2値化し、こ
の2値化画像をその画像中の画素連結成分を求めた外接
矩形データに変換する変換手段と、この変換手段で変換
された外接矩形データについて、x方向およびy方向に
それぞれ隣接する矩形データを統合することにより、文
字行ブロックを抽出する文字行抽出手段と、この文字行
抽出手段で抽出されたx方向およびy方向の文字行ブロ
ックについて、それぞれの方向の隣接関係を判定して統
合していくことにより宛名領域候補を検出する宛名領域
候補検出手段と、この宛名領域候補検出手段で検出され
た宛名領域候補の形状をあらかじめ用意された知識によ
って判定し、宛名領域である可能性があるか否かを判定
する判定手段と、この判定手段の判定結果に基づき前記
郵便物上の宛名情報が記載されている宛名領域を検出す
る検出手段とを具備している。
【0014】さらに、本発明の宛名領域検出装置は、郵
便物上の画像を電気信号に変換して入力する画像入力手
段と、この画像入力手段で入力された画像を2値化し、
この2値化画像をその画像中の画素連結成分を求めた外
接矩形データに変換する変換手段と、この変換手段で変
換された外接矩形データについて、x方向およびy方向
にそれぞれ隣接する矩形データを統合することにより、
文字行ブロックを抽出する文字行抽出手段と、この文字
行抽出手段で抽出されたx方向およびy方向の文字行ブ
ロックについて、それぞれの方向の隣接関係を判定して
統合していくことにより宛名領域候補を検出する宛名領
域候補検出手段と、この宛名領域候補検出手段で検出さ
れた宛名領域候補の位置を判定して評価することによ
り、上位複数候補を出力する宛名領域候補出力手段と、
この宛名領域候補出力手段から出力される宛名領域候補
に基づき前記郵便物上の宛名情報が記載されている宛名
領域を検出する検出手段とを具備している。
【0015】
【作用】本発明によれば、郵便物から最初に文字行を検
出し、隣接する文字行を統合して複数の宛名領域候補を
検出し、検出した各領域候補をあらかじめ用意された知
識に基づいて評価し、宛名書出部であると推定される文
字行を複数個検出することにより、郵便物上の宛名領域
を高速かつ正確に検出できるものである。
【0016】
【実施例】以下、本発明の一実施例について図面を参照
して説明する。図1は、本実施例に係る宛名領域検出装
置を概略的に示すものである。図において、処理対象と
なる郵便物301は、図示しない搬送手段によって画像
入力部302に送られ、ここで光学的な走査によって表
面の画像が光電変換されることにより、郵便物301上
の画像が入力され、宛名領域検出部303に送られる。
宛名領域検出部303では、後述する画像処理を施すこ
とによって、宛名情報の書出し部と推定される文字行を
複数個検出し、それらを文字認識部304に送る。文字
認識部304では、各文字行から文字を1つずつ切出し
て、1文字ずつ認識し、その認識結果を単語認識部30
5に送る。
【0017】単語認識部305では、文字認識部304
から送られてきた文字の認識結果を宛名のデータベース
に登録されている住所情報と照合することにより、その
認識結果を修正し、単語認識処理を行ない、その認識結
果を街区認識部306に送る。街区認識部306では、
認識した行の付近に書かれている〜丁目、〜番地の情報
を読取ることにより、街区認識処理を行ない、その認識
結果を宛名認識結果307として出力するようになって
いる。
【0018】図2は、前記宛名領域検出部303で行な
われる処理を説明するフローチャートであり、以下、こ
れに基づき処理動作を説明する。まず、画像入力部30
2で入力された郵便物301の画像は2値化処理を施さ
れる(ステップ1)。次に、2値化画像上の連結してい
る画素領域を求め、その領域に外接する矩形領域を求め
る(ステップ2)。その後、求めた各矩形領域の形状、
位置などをあらかじめ用意した知識によって判定し、不
要な矩形データ(雑音)を除去する(ステップ3)。
【0019】ステップ3の処理で残った矩形データは、
郵便物301の縦横2方向に文字の書かれている方向を
仮定し(ステップ4,5)、それぞれの方向について独
立に文字行の抽出(ステップ6,7)、文字行ブロック
の評価(ステップ8,9)、文字行ブロックを統合して
宛名領域候補の検出(ステップ10,11)の処理を行
なう。ステップ10,11の処理で検出された宛名領域
候補は、あらかじめ用意された知識に基づいて評価され
(ステップ12)、その評価結果のよいものから順に出
力される(ステップ13)。
【0020】次に、図2のステップ2で行なわれる外接
矩形データ作成処理について、図3を参照して説明す
る。まず、郵便物の2値化画像から画素が連結して固ま
りとなっている領域(20)を検出すると、その領域の
x方向、y方向の最大座標値、最小座標値を求め(2
1)、画素の固まりに外接する矩形領域を求める(2
2)。画素の連結を検出する際に1つの文字がいくつか
の部品に分かれて検出された場合(23)には、各部品
ごとに領域のx方向、y方向の最大座標値、最小座標値
を求め(24)、画素の固まりに外接する矩形領域を求
める(25)。
【0021】ここに、画素連結性分を抽出する手法とし
ては、たとえば、図4に示すように、注目している画素
のx方向、y方向に隣接する画素が存在すれば、その画
素と連結しているとして画素を統合していく4−近傍
(26)の考え方や、4−近傍の外に斜め4方向に隣接
する画素も統合対象とする8−近傍(27)の考え方が
ある。
【0022】次に、図2のステップ3で行なわれる雑音
除去処理について、図5を参照して説明する。図2のス
テップ2で作成された外接矩形データ(40)は、各矩
形データの形状に関してあらかじめ用意した知識によっ
て文字行検出対象データであるか否かが判定される(4
1)。ここで、不合格となった矩形データは以降の処理
の対象外となり(42)、合格した矩形データは文字行
検出処理対象データとなる(43)。
【0023】上記知識の例としては、図6に示すよう
に、2値化画像(44)から外接矩形データ(45)を
求めた際、ある設定値以上の面積を持つ矩形データを文
字行検出処理対象外のデータと判定する(46)。
【0024】図7に示すように、2値化画像(47)か
ら外接矩形データ(48)を求めた際、ある設定値以下
の面積を持つ矩形データを文字行検出処理対象外のデー
タと判定する(49)。
【0025】図8に示すように、2値化画像(50)か
ら外接矩形データ(51)を求めた際、ある設定値以下
の幅とある設定値以上の長さを持つ矩形データを文字行
検出処理対象外のデータとして判定する(52)。ここ
で、矩形の幅とは矩形の短辺長、矩形の長さは矩形の長
辺長のことを指す。
【0026】図9に示すように、2値化画像(53)か
ら外接矩形データ(54)を求めた際、ある設定値と同
程度の幅とある設定値と同程度の長さを持つ矩形があれ
ば、その領域内に含まれている矩形データを文字行検出
処理対象外のデータと判定する(55)。ここで、矩形
の幅とは矩形の短辺長、矩形の長さは矩形の長辺長のこ
とを指す。などがある。
【0027】図10は、図2のステップ3で行なわれる
雑音除去処理の別の例を示すものである。図2のステッ
プ2で作成された外接矩形データ(60)は、各矩形デ
ータの位置および密度に関してあらかじめ用意した知識
によって文字行検出対象データであるか否かが判定され
る(61)。ここで、不合格となった矩形データは以後
の処理の対象外となり(62)、合格した矩形データは
文字行検出処理対象データとなる(63)。
【0028】上記知識の例としては、図11に示すよう
に、画像(64)のある一定の領域(65)内にあらか
じめ設定されている幅、長さの外接矩形群(66)が存
在すれば、それらの外接矩形群は幅、長さの設定値に対
応して登録されている種類の情報を持つと判定する。
【0029】たとえば、郵便物の場合だと、郵便物の上
部の特定領域に一定サイズの外接矩形群が存在すれば、
郵便番号欄と判定する。などがある。
【0030】次に、図2のステップ4〜7で行なわれる
文字行の抽出処理について、図12を参照して説明す
る。まず、画像処理して得られた外接矩形データ(8
0)について、x方向に隣接している矩形データを統合
していく(81)ことにより、x方向の文字行を検出
(82)する。x方向の文字行検出処理と独立して、同
じ外接矩形データをy方向に統合していく(83)こと
により、y方向の文字行を検出(84)する。
【0031】矩形データを統合して文字行を検出する手
法の一例を図13のフローチャートに示す。以下、これ
に基づき処理動作を説明する。まず、前処理として、外
接矩形データのうち微小、過大なものを削除し(ステッ
プ100)、さらに、包含関係にある矩形を統合、整理
する(ステップ101)。次に、矩形データを統合する
方向を定め(ステップ102,103)、行検出処理に
入る(ステップ104)。
【0032】ステップ104の行検出処理においては、
まず、行数nを「1」に設定する(ステップ105)。
次に、まだどの行にも統合されていない矩形が存在する
か調べ(ステップ106)、もしなければ処理を終了す
る(ステップ107)。もしあれば、その中から1つ選
択し(ステップ108)、n番目の行領域を矩形の領域
に初期化する(ステップ109)。
【0033】次に、現在の行領域に対し、統合方向に隣
接する矩形が存在するか調べる(ステップ110)。も
しなければ、nを1つ増やして(ステップ115)、ス
テップ106に戻る。次に、ステップ110で選んだ矩
形−行間の距離を求める(ステップ111)。もし距離
がある設定値を越える場合は、その矩形をリストから削
除(ステップ112)してステップ110に戻る。
【0034】次に、ステップ110で選んだ矩形を行領
域に統合する前後で行幅変化率を調べる(ステップ11
3)。もし変化率がある設定値を越える場合は、その矩
形をリストから削除してステップ110に戻る。次に、
ステップ110で選んだ行を統合して行領域を変更する
(ステップ114)。そして、矩形をリストから削除し
てステップ110に戻る。
【0035】なお、上記行検出処理は、縦/横両方向に
ついて同じ矩形データを元に独立して行なわれる。次
に、図2のステップ8,9で行なわれる抽出された文字
行の評価処理について、図14を参照して説明する。ま
ず、抽出された文字行データ(120)は、各文字行デ
ータの形状に関してあらかじめ用意した知識によって宛
名表記対象データであるか否かが判定される(12
1)。不合格となった文字行データは以後の処理の対象
外となり(122)、合格した文字行データは宛名表記
対象データとなる(123)。
【0036】上記知識の例としては、図15に示すよう
に、求めた文字行ブロック(124)のうち、あらかじ
め定められた設定値以上の幅を持つブロックを宛名表記
対象外のデータと判定する(125)。
【0037】図16に示すように、求めた文字行ブロッ
ク(126)のうち、あらかじめ定められた設定値以下
の幅を持つブロックを宛名表記対象外のデータと判定す
る(127)。
【0038】図17に示すように、求めた文字行ブロッ
ク(128)のうち、長さと幅との比があらかじめ定め
られた設定値の範囲外にあるブロックを宛名表記対象外
のデータと判定する(129)。などがある。
【0039】図18は、図2のステップ8,9で行なわ
れる抽出された文字行の評価処理の別の例を示すもので
ある。まず、抽出された文字行データ(140)は、各
文字行データの形状に関する特性値を求めた(141)
後、各文字行データの形状に関してあらかじめ用意され
た評価関数(142)によって宛名表記対象データとし
て処理する優先順位を決めるための評価値が計算される
(143)。
【0040】上記文字行データの評価関数について説明
を補足すると、この評価関数は、文字行ブロックの幅に
関する評価と、文字行ブロックの文字数に関する評価を
行なう。
【0041】文字行ブロックの幅に関しては、 (1) 文字行の幅がある設定値の範囲内にあるか。 (2) 文字行の幅の文字行内に含まれる外接矩形の幅の平
均値に対する比がある設定値以下であるか。 といった項目について評価を行ない、項目の条件をよく
満たす文字行ブロックほど高い評価値を与える。ここ
で、文字行の幅とは、文字行の行方向と直交する方向の
大きさをいい、外接矩形の幅とは、外接矩形の行方向と
直交する方向の大きさをいう。
【0042】文字行ブロックの文字数に関しては、 (1) 文字行の文字数がある設定値の範囲内にあるか。 (2) 文字行内に含まれる外接矩形数の文字行の文字数に
対する比がある設定値以下であるか。 といった項目について評価を行ない、項目の条件をよく
満たす文字行ブロックほど高い評価値を与える。ここ
で、文字行の文字数は、文字行の長さを文字行の幅で割
った値、もしくは、文字行の長さを文字行内に含まれる
外接矩形の幅の平均値で割った値を用いるものとする。
なお、文字行の長さとは、文字行の行方向の大きさをい
う。
【0043】次に、図2のステップ10,11で行なわ
れている文字行ブロックを統合して文字記載領域を検出
する処理について、図19および図20を参照して説明
する。
【0044】まず、図19に示すように、x方向に外接
矩形データを統合することによって抽出されたx方向の
文字行ブロックデータ(160)において、y方向に隣
接する文字行ブロック、および、x方向に一列に並んで
いる文字行ブロックを統合していく(161)ことによ
り、x方向の文字記載領域を検出する(162)。
【0045】次に、図20に示すように、同様にy方向
に外接矩形データを統合することによって抽出されたy
方向の文字行ブロックデータ(163)において、x方
向に隣接する文字行ブロック、および、y方向に一列に
並んでいる文字行ブロックを統合していく(164)こ
とにより、y方向の文字記載領域を検出する(16
5)。
【0046】文字行ブロックを統合して文字記載領域を
検出する手法の一例を図21のフローチャートに示す。
以下、これに基づき処理動作を説明する。まず、郵便物
の短辺方向の行データ(180)は、統合方向を郵便物
の長辺方向に設定して(ステップ181)、領域検出処
理を行ない(ステップ182)、郵便物の長辺方向の行
データ(183)は、統合方向を郵便物の短辺方向に設
定して(ステップ184)、領域検出処理を行なう(ス
テップ185)。
【0047】ステップ182,185の領域検出処理に
おいては、まず、行数nを「1」に設定する(ステップ
186)。次に、まだどの行にも統合されていない矩形
が存在するか調べ(ステップ187)、もしなければ処
理を終了する(ステップ188)。もしあれば、その中
から1つ選択し(ステップ189)、n番目の文字記載
領域をその行領域に初期化する(ステップ190)。
【0048】次に、現在の行領域に対し、統合方向に隣
接する行が存在するか調べる(ステップ191)。もし
そのような行が存在すれば、その行をあらかじめ用意さ
れた知識を用いて判定し(ステップ192)、判定に合
格すれば、領域に行を統合して領域を更新する(ステッ
プ193)。そして、その行をリストから削除し(ステ
ップ194)、ステップ191に戻る。判定に不合格の
場合は、その行をリストから削除し(ステップ19
4)、ステップ191に戻る。
【0049】ステップ191において、もしそのような
行が存在しなければ、現在の領域に対し統合方向と直交
方向に隣接する行が存在するか調べる(ステップ19
5)。もしそのような行が存在すれば、その行をあらか
じめ用意された知識を用いて判定し(ステップ19
6)、判定に合格すれば、領域に行を統合して領域を更
新する(ステップ197)。そして、その行をリストか
ら削除し(ステップ198)、ステップ195に戻る。
判定に不合格の場合は、その行をリストから削除し(ス
テップ198)、ステップ195に戻る。
【0050】ステップ195において、もしそのような
行が存在しなければ、nを1つ増やして(ステップ19
9)、ステップ187に戻る。図21ステップ192で
行なわれる判定処理の一例を図22に示す。この判定処
理の例としては、図22(a)に示すように、統合方向
の領域・行間の距離d1 がある閾値以下であれば統合し
(200)、統合方向の領域・行間の距離d2 がある閾
値以上であれば統合しない(201)。
【0051】図22(b)に示すように、領域と行との
統合方向と垂直な方向のずれd3 ,d4 がある閾値以下
であれば統合し(202,203)、領域と行との統合
方向と垂直な方向のずれd5 ,d6 がある閾値以上であ
れば統合しない(204,205)。といったものがあ
る。
【0052】図21のステップ196で行なわれる判定
処理の一例を図23に示す。この判定処理の例として
は、図23(a)に示すように、統合方向と垂直な方向
の領域・行間の距離d7 がある閾値以下であれば統合し
(206)、統合方向と垂直な方向の領域・行間の距離
d8 がある閾値以上であれば統合しない(207)。
【0053】図23(b)に示すように、領域と行の統
合方向のずれd9 がある閾値以下であれば統合し(20
8)、領域と行の統合方向のずれd10がある閾値以上で
あれば統合しない(209)。といったものがある。な
お、上記閾値の値は、あらかじめ固定値の値を与えてお
く、あるいは、行サイズから計算して求める、といった
手段で設定する。
【0054】次に、図2のステップ12で行なわれる抽
出された文字記載領域の評価処理について、図24を参
照して説明する。抽出された文字記載領域データ(22
0)は、各領域の形状に関する特性値を求めた(22
1)後、各領域の形状、含まれる行数に関してあらかじ
め用意された評価関数(222)、および、各領域の位
置に関してあらかじめ用意された評価関数(223)に
よって、目的とする情報が記載されているとして処理す
る優先順位を決めるための評価値が計算される(22
4)。
【0055】上記評価関数について、図25を参照して
説明を補足すると、領域の形状、行数に関しては、 (1) 図25(a)に示すように、領域の|x|/|y|
の比がある設定値の範囲内にあるか(225,22
6)。
【0056】(2) 図25(b)に示すように、領域内に
含まれる行数がある設定値の範囲内にあるか(227,
228)。 といった項目について評価を行ない、項目の条件をよく
満たす領域ほど高い評価値を与える。行方向がx方向で
あるかy方向であるかによって、|x|/|y|の比お
よび領域内行数の設定値範囲は別々に用意する。
【0057】領域の位置に関しては、図26に示すよう
に、領域候補の選択基準として、郵便物の中心点(24
0)と各領域候補間の距離dとに基づいて優先順位付け
のための評価を行なう(241)。
【0058】図27に示すように、領域候補の選択基準
として、郵便物の上端部の中点(242)と各領域候補
間の距離dとに基づいて優先順位付けのための評価を行
なう(243)。
【0059】図28に示すように、領域候補の選択基準
として、郵便物の郵便番号欄(244)と各領域候補間
の距離dとに基づいて優先順位付けのための評価を行な
う(245)。
【0060】図29に示すように、領域候補の選択基準
として、郵便物の料額印面(246)と各領域候補間の
距離dとに基づいて優先順位付けのための評価を行なう
(247)。といった手法を用いる。
【0061】また、領域の位置評価の際に使用する基準
点の与え方としては、図30に示すように、x方向、y
方向の領域のどちらでも共通の基準点(260)からの
距離dによって評価を行なう(261)。
【0062】図31に示すように、x方向の領域はx方
向用の基準点(262)、y方向の領域はy方向用の基
準点(264)からの距離dによって評価を行なう(2
63,265)。といった手法を用いる。こうした評価
によって高い評価値を得た領域をn候補選択する。
【0063】n候補選択する手法としては、 (1) x方向、y方向の全領域を通じて評価値の高いもの
を上からn候補選択する。
【0064】(2) x方向、y方向の領域からm個、n−
m個づつ選択する。 といったものがある。次に、図2のステップ13で行な
われる宛名領域候補を総合的に評価して、評価値の高い
ものから上位n候補を出力する処理について、図32に
示すフローチャートを参照して説明する。前過程で選択
したn個の領域に含まれる文字行データ(280)に対
し、その行が属する領域内の外の行との位置関係に関し
て、あらかじめ用意された関数によって判定し(ステッ
プ281)、他行との位置関係に関する評価値を求める
(ステップ282)。この評価結果と、以前の処理で求
めておいた行の形状に関する評価結果(283)、およ
び、行の属する領域の評価結果(284)とを総合的に
評価して(ステップ285)、総合評価の高い行を上位
N候補出力する(ステップ286)。
【0065】以上説明したように、上記実施例によれ
ば、郵便物の宛名記載領域の算出に外接矩形データを用
いることにより、データ量圧縮の実現によって効率的な
処理が可能となる。
【0066】また、外接矩形データの形状、位置情報を
用いた宛名表記対象データであるか否かの判定により、
宛名情報以外に広告文、料額印、下線などが記載されて
いる郵便物から精度よく効率的に認識対象となる宛名領
域データを絞り込むことが可能となる。
【0067】また、文字行記載方向について、縦方向/
横方向の2方向への外接矩形データの統合判定を行なう
ため、文字行をあらかじめ1方向に決めて宛名領域を検
出する場合に比べ、宛名行検出精度の向上が図れる。
【0068】さらに、宛名領域候補を確信度付きで複数
候補選択することにより、画像処理の曖昧さを文字認
識、単語認識処理で解消し、単一候補のみの場合に比べ
宛名領域誤検出率を低下できる。
【0069】
【発明の効果】以上詳述したように本発明によれば、郵
便物上の宛名領域を高速かつ正確に検出できる宛名領域
検出装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る宛名領域検出装置の構
成を概略的に示すブロック図。
【図2】宛名領域検出部の処理動作を説明するフローチ
ャート。
【図3】外接矩形データ作成処理を説明する図。
【図4】外接矩形データ作成処理を説明する図。
【図5】雑音除去部の処理動作を説明する図。
【図6】雑音除去部の処理動作を説明する図。
【図7】雑音除去部の処理動作を説明する図。
【図8】雑音除去部の処理動作を説明する図。
【図9】雑音除去部の処理動作を説明する図。
【図10】雑音除去部の別の処理動作を説明する図。
【図11】雑音除去部の別の処理動作を説明する図。
【図12】文字行の抽出処理を説明する図。
【図13】外接矩形データを統合して文字行を検出する
手法の一例を説明するフローチャート。
【図14】抽出された文字行の評価処理を説明する図。
【図15】抽出された文字行の評価処理を説明する図。
【図16】抽出された文字行の評価処理を説明する図。
【図17】抽出された文字行の評価処理を説明する図。
【図18】抽出された文字行の別の評価処理を説明する
図。
【図19】文字行ブロックを統合して文字記載領域を検
出する処理を説明する図。
【図20】文字行ブロックを統合して文字記載領域を検
出する処理を説明する図。
【図21】文字行ブロックを統合して文字記載領域を検
出する手法の一例を説明するフローチャート。
【図22】図21で行なわれる判定処理の一例を説明す
る図。
【図23】図21で行なわれるもう1つの判定処理の一
例を説明する図。
【図24】抽出された文字記載領域の評価処理を説明す
る図。
【図25】抽出された文字記載領域の評価処理を説明す
る図。
【図26】領域の位置評価処理を説明する図。
【図27】領域の位置評価処理を説明する図。
【図28】領域の位置評価処理を説明する図。
【図29】領域の位置評価処理を説明する図。
【図30】領域の位置評価の際に使用する基準点の与え
方を説明する図。
【図31】領域の位置評価の際に使用する基準点の与え
方を説明する図。
【図32】宛名領域候補を総合的に評価して評価値の高
いものから候補を出力する処理を説明するフローチャー
ト。
【符号の説明】
301……郵便物、302……画像入力部、303……
宛名領域検出部、304……文字認識部、305……単
語認識部、306……街区認識部、307……宛名認識
結果。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データに基づき前記
    郵便物上の宛名情報が記載されている宛名領域を検出す
    る検出手段と、 を具備したことを特徴とする宛名領域検出装置。
  2. 【請求項2】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データの形状に関し
    てあらかじめ用意された知識により宛名表記対象データ
    であるか否かを判定する判定手段と、 この判定手段で宛名表記対象データであると判定された
    外接矩形データに基づき前記郵便物上の宛名情報が記載
    されている宛名領域を検出する検出手段と、 を具備したことを特徴とする宛名領域検出装置。
  3. 【請求項3】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データの郵便物上に
    おける位置および密度に関してあらかじめ用意された知
    識により宛名表記対象データであるか否かを判定する判
    定手段と、 この判定手段で宛名表記対象データであると判定された
    外接矩形データに基づき前記郵便物上の宛名情報が記載
    されている宛名領域を検出する検出手段と、 を具備したことを特徴とする宛名領域検出装置。
  4. 【請求項4】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データについて、x
    方向およびy方向にそれぞれ隣接する矩形データを統合
    することにより、文字行ブロックを抽出する文字行抽出
    手段と、 この文字行抽出手段で抽出された文字行ブロックに基づ
    き前記郵便物上の宛名情報が記載されている宛名領域を
    検出する検出手段と、 を具備したことを特徴とする宛名領域検出装置。
  5. 【請求項5】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データについて、x
    方向およびy方向にそれぞれ隣接する矩形データを統合
    することにより、文字行ブロックを抽出する文字行抽出
    手段と、 この文字行抽出手段で抽出された文字行ブロックの形状
    をあらかじめ用意された知識によって判定し、宛名文字
    行の一部であるか否かを出力する判定手段と、 この判定手段の判定結果に基づき前記郵便物上の宛名情
    報が記載されている宛名領域を検出する検出手段と、 を具備したことを特徴とする宛名領域検出装置。
  6. 【請求項6】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データについて、x
    方向およびy方向にそれぞれ隣接する矩形データを統合
    することにより、文字行ブロックを抽出する文字行抽出
    手段と、 この文字行抽出手段で抽出された文字行ブロック内に含
    まれる外接矩形データの形状をあらかじめ用意された知
    識によって判定し、宛名文字行の一部であるか否かを出
    力する判定手段と、 この判定手段の判定結果に基づき前記郵便物上の宛名情
    報が記載されている宛名領域を検出する検出手段と、 を具備したことを特徴とする宛名領域検出装置。
  7. 【請求項7】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データについて、x
    方向およびy方向にそれぞれ隣接する矩形データを統合
    することにより、文字行ブロックを抽出する文字行抽出
    手段と、 この文字行抽出手段で抽出されたx方向およびy方向の
    文字行ブロックについて、それぞれの方向の隣接関係を
    判定して統合していくことにより宛名領域候補を検出す
    る宛名領域候補検出手段と、 この宛名領域候補検出手段の検出結果に基づき前記郵便
    物上の宛名情報が記載されている宛名領域を検出する検
    出手段と、 を具備したことを特徴とする宛名領域検出装置。
  8. 【請求項8】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データについて、x
    方向およびy方向にそれぞれ隣接する矩形データを統合
    することにより、文字行ブロックを抽出する文字行抽出
    手段と、 この文字行抽出手段で抽出されたx方向およびy方向の
    文字行ブロックについて、それぞれの方向の隣接関係を
    判定して統合していくことにより宛名領域候補を検出す
    る宛名領域候補検出手段と、 この宛名領域候補検出手段で検出された宛名領域候補の
    形状をあらかじめ用意された知識によって判定し、宛名
    領域である可能性があるか否かを判定する判定手段と、 この判定手段の判定結果に基づき前記郵便物上の宛名情
    報が記載されている宛名領域を検出する検出手段と、 を具備したことを特徴とする宛名領域検出装置。
  9. 【請求項9】 郵便物上の画像を電気信号に変換して入
    力する画像入力手段と、 この画像入力手段で入力された画像を2値化し、この2
    値化画像をその画像中の画素連結成分を求めた外接矩形
    データに変換する変換手段と、 この変換手段で変換された外接矩形データについて、x
    方向およびy方向にそれぞれ隣接する矩形データを統合
    することにより、文字行ブロックを抽出する文字行抽出
    手段と、 この文字行抽出手段で抽出されたx方向およびy方向の
    文字行ブロックについて、それぞれの方向の隣接関係を
    判定して統合していくことにより宛名領域候補を検出す
    る宛名領域候補検出手段と、 この宛名領域候補検出手段で検出された宛名領域候補の
    位置を判定して評価することにより、上位複数候補を出
    力する宛名領域候補出力手段と、 この宛名領域候補出力手段から出力される宛名領域候補
    に基づき前記郵便物上の宛名情報が記載されている宛名
    領域を検出する検出手段と、 を具備したことを特徴とする宛名領域検出装置。
JP06400594A 1994-03-31 1994-03-31 宛名領域検出装置および宛名領域検出方法 Expired - Fee Related JP3388867B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP06400594A JP3388867B2 (ja) 1994-03-31 1994-03-31 宛名領域検出装置および宛名領域検出方法
US08/413,890 US5737437A (en) 1994-03-31 1995-03-30 Address region detecting apparatus using circumscribed rectangular data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06400594A JP3388867B2 (ja) 1994-03-31 1994-03-31 宛名領域検出装置および宛名領域検出方法

Publications (2)

Publication Number Publication Date
JPH07265807A true JPH07265807A (ja) 1995-10-17
JP3388867B2 JP3388867B2 (ja) 2003-03-24

Family

ID=13245654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06400594A Expired - Fee Related JP3388867B2 (ja) 1994-03-31 1994-03-31 宛名領域検出装置および宛名領域検出方法

Country Status (2)

Country Link
US (1) US5737437A (ja)
JP (1) JP3388867B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6035064A (en) * 1996-05-23 2000-03-07 Kabushiki Kaisha Toshiba Apparatus and method for detecting and recognizing character line using simplified projection information
US6574351B1 (en) 1999-01-13 2003-06-03 Nec Corporation Destination address area detection apparatus
US6683967B1 (en) 1999-10-06 2004-01-27 International Business Machines Corporation Area extraction method, address area extraction method, address area extraction apparatus, and image processing apparatus

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285777B2 (en) * 1997-11-26 2001-09-04 International Business Machines Corporation Internet assisted mail
JP3246432B2 (ja) * 1998-02-10 2002-01-15 株式会社日立製作所 宛名読取り装置および郵便物等区分機
JPH11226513A (ja) * 1998-02-18 1999-08-24 Toshiba Corp 郵便物宛先読取装置及び郵便物区分装置
US6104500A (en) * 1998-04-29 2000-08-15 Bcl, Computer Inc. Networked fax routing via email
US6738496B1 (en) * 1999-11-01 2004-05-18 Lockheed Martin Corporation Real time binarization of gray images
DE10021734C1 (de) * 2000-05-04 2001-05-23 Siemens Ag Verfahren und Vorrichtung zum Ermitteln von Gebieten mit Verteilinformationen auf Sendungen
US7058203B2 (en) * 2002-05-14 2006-06-06 Lockheed Martin Corporation Region of interest identification using region of adjacent pixels analysis
US8292619B2 (en) * 2004-02-27 2012-10-23 3M Deutschland Gmbh Dose delivery system
US20080101703A1 (en) * 2006-10-30 2008-05-01 Lockheed Martin Corporation Systems and methods for recognizing shapes in an image
EP2003599A1 (de) * 2007-06-14 2008-12-17 Sick Ag Optoelektronischer Sensor und Verfahren zur Erfassung von Codes
US8620080B2 (en) * 2008-09-26 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for locating text in a digital image
EP3176162B1 (en) 2012-07-19 2020-05-27 Cayman Chemical Company, Inc. Difluorolactam compounds as ep4 receptor-selective agonists for use in the treatment of ep4-mediated disease and conditions
CN105392505A (zh) 2013-07-19 2016-03-09 开曼化学股份有限公司 用于促进骨生长的方法、系统和组合物

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5845305B2 (ja) * 1976-11-16 1983-10-08 日本電気株式会社 宛名検知装置
JPS55127677A (en) * 1979-03-23 1980-10-02 Nec Corp Address position detector
JPS57101986A (en) * 1980-12-17 1982-06-24 Toshiba Corp Character detecting and cutting method
JPS57105088A (en) * 1980-12-22 1982-06-30 Toshiba Corp Character reader
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6035064A (en) * 1996-05-23 2000-03-07 Kabushiki Kaisha Toshiba Apparatus and method for detecting and recognizing character line using simplified projection information
US6574351B1 (en) 1999-01-13 2003-06-03 Nec Corporation Destination address area detection apparatus
US6683967B1 (en) 1999-10-06 2004-01-27 International Business Machines Corporation Area extraction method, address area extraction method, address area extraction apparatus, and image processing apparatus

Also Published As

Publication number Publication date
JP3388867B2 (ja) 2003-03-24
US5737437A (en) 1998-04-07

Similar Documents

Publication Publication Date Title
JP3388867B2 (ja) 宛名領域検出装置および宛名領域検出方法
KR100324847B1 (ko) 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법
US6687401B2 (en) Pattern recognizing apparatus and method
US6798895B1 (en) Character string extraction and image processing methods and apparatus
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JPH07256214A (ja) 郵便物の宛名読取装置および郵便物の宛名領域判別装置および郵便物の宛名印刷装置
JP3388829B2 (ja) 文字読取装置
CN111461133B (zh) 快递面单品名识别方法、装置、设备及存储介质
EP1299849A1 (en) Image processing for clustering related text objects
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH06124366A (ja) 住所読取装置
JPH09319824A (ja) 帳票認識方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH06180771A (ja) 英文字認識装置
Chandran et al. Structure recognition and information extraction from tabular documents
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JP2827960B2 (ja) 宛名行抽出装置
JP3372005B2 (ja) 文字認識装置
JP3160347B2 (ja) 郵便物の宛名読取装置
JPH08164365A (ja) 宛名読取装置
JPH0929179A (ja) 宛名読取装置
JP2571236B2 (ja) 文字切出し識別判定方法
JPH09103747A (ja) 宛名領域検出方法および宛名領域検出装置
JPH08224550A (ja) 宛名領域処理装置
JPH04205690A (ja) 文字認識装置、および文字認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100117

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110117

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120117

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130117

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees