JPH06274685A - 宛名画像抽出装置 - Google Patents

宛名画像抽出装置

Info

Publication number
JPH06274685A
JPH06274685A JP5065067A JP6506793A JPH06274685A JP H06274685 A JPH06274685 A JP H06274685A JP 5065067 A JP5065067 A JP 5065067A JP 6506793 A JP6506793 A JP 6506793A JP H06274685 A JPH06274685 A JP H06274685A
Authority
JP
Japan
Prior art keywords
image
character
address
area
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5065067A
Other languages
English (en)
Inventor
Masato Suda
正人 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5065067A priority Critical patent/JPH06274685A/ja
Publication of JPH06274685A publication Critical patent/JPH06274685A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】写真画像などが含まれる郵便物などの画像か
ら、宛名及び住所など所望文字のみを含む画像を抽出す
る。 【構成】画像データ内の所望領域を抽出する装置におい
て、画像メモリ(13)に格納された画像データ内で連
結している画像を検出する手段(14)と、前記連結画
像が文字を構成する画像として有効であるか判断する手
段(19)と、前記判断手段(19)によって有効と判
断された各連結画像間の遠近関係から、前記所望領域を
抽出する手段(20)と、前記所望領域内の前記連結画
像のみを提供する手段(24、25)とを具備する。郵
便物の画像から文字画像データのみが抽出され、次段の
文字解読部にその文字画像データが出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はOCR(光学文字読取装
置)に関し、特に広告等が混在する郵便物上の画像など
から宛名住所領域を抽出する装置に関する。
【0002】
【従来の技術】従来、汎用OCRは文書画像内の既に決
められた位置(文字記入枠)を目安に文字行及び文字の
検出を行っている。
【0003】一方、郵便物上の画像においては、宛名住
所、差出人住所、広告等が混在しており、そのためこれ
ら郵便物上の画像から宛名住所領域を検出する場合、二
値画像としての郵便物画像をラベル付けし、連結してい
る画像毎に矩形座標を生成する。文字又は文字の一部で
あろうと判定された画像は、所定範囲内の矩形座標を統
合することで住所矩形領域が造出される。住所領域の候
補が複数のときは、郵便物画像上での位置関係から宛名
住所領域を一意に決定し、その領域内の画像を次段の文
字行切出し部及び文字切出し部に転送し、主に射影を用
いて文字行切出し、文字切出しが行われる。
【0004】
【発明が解決しようとする課題】文字行切出し、文字切
出し処理は隣接文字との接触、入り込み等から射影によ
る方法が主に用いられる。そのため、領域検出された画
像は文字画像のみであることが望ましい。ところが、文
字領域として指定された矩形領域内に図7のように広告
等の雑音30を含んでいると、雑音を含んだ矩形領域の
画像全てを転送するため、次段の切出し処理を困難にし
てしまう。従って本発明の目的は、写真画像などが含ま
れる郵便物などの画像から、宛名及び住所など所望文字
のみを含む画像を抽出することである。
【0005】
【課題を解決するための手段及び作用】上記目的を達成
するために、本発明による装置は、画像データ内の所望
領域を抽出する装置であって、画像メモリに格納された
画像データ内の連結している画像を検出する手段と、前
記連結画像が文字を構成する画像として有効であるか判
断する手段と、前記判断手段によって有効と判断された
各連結画像間の遠近関係から、前記所望領域を抽出する
手段と、前記所望領域内の前記連結画像のみを提供する
手段とを具備する。郵便物の画像から文字画像データの
みが抽出され、次段の文字解読部にその文字画像データ
が出力される。
【0006】
【実施例】以下、図面を参照しながら本発明の実施例に
ついて説明する。
【0007】図1は本発明の一実施例である。二値画像
メモリ13はXアドレスA 11を主走査方向、Yアド
レスA 12を副走査方向として二値画像として格納さ
れた郵便物画像をラスター走査する。二値画像メモリ1
3から出力された郵便物画像は連結画像ラベル付け部1
4にて、連結している画像に同一ラベル番号が付けられ
る。更に、そのラベル番号付けに同期して連結テーブル
17へラベル番号が書き込まれる。連結座標メモリ18
にはラベル付けされた連結画像の始点・終点座標が書き
込まれる。連結テーブル17には新たなラベル番号が生
成されたとき、そのラベル番号をアドレスとして同一ラ
ベルデータが書き込まれる。連結座標メモリ18もその
ラベル番号をアドレスにして連結画像の始点・終点座標
としてXアドレスA、YアドレスAを入力にして大小比
較した座標が書き込まれる。連結対テーブル15は連結
画像において異種ラベルが交差したときにその継続性を
保存するために、それら交差した異種ラベルのラベル番
号対を格納する。
【0008】有効矩形検出部19は連結座標メモリ18
内に格納された連結画像を囲む矩形の始点・終点座標か
ら、その矩形領域の大きさを判断し、それが文字として
有効であるか判定する。宛名領域検出部20は有効とみ
なされた矩形座標同志の遠近関係から各文字画像を統合
して宛名領域を検出する。宛名領域内の矩形座標は領域
内座標メモリ21に格納され、更にマスクメモリ24に
セットされ、その矩形座標で囲まれる矩形領域は全て”
1”が書き込まれる。二値画像メモリ13の内容とマス
クメモリ24の内容はAND演算され、最終的に宛名領
域内の文字画像のみが出力される。
【0009】次に本発明の動作を詳細に説明する。郵便
物上の画像はCCD(charge couppled divice)(図示さ
れず)などを用いて読み込まれ、二値画像に変換されて
二値画像メモリ13に格納される。図2(a)に示すよ
うに二値画像メモリ13内の画像31は値”1”として
示される。画像31以外の部分は値”0”が格納されて
いる(図示されず)。連結画像ラベル付け部14は画像
31を左上からラスター走査(つまりx方向を主走査方
向、y方向を副走査方向として走査)し、図2(b)に
示すように、最初に検出された画像(画像31の”山”
の頂点画素)にラベル1を付加する。その後、画像が連
結していれば同一ラベル番号を付ける。新たな分離画像
が検出されたなら番号順に次のラベル番号を付加し連結
画像のラベル付けを行う。従って2番目に検出された画
像のラベル番号は”2”で、3番目に検出された画像の
ラベル番号は”3”であり、以下同様にしてラベルが付
けられる。そして連結画像ラベル付け部14は各連結画
像の始点・終点座標の大小を比較することで、各連結画
像を囲む矩形(図中点線で示される)の座標値を連結座
標メモリ18に格納する。例えばラベル番号1の場合、
始点として(xs1,ys1)、終点として(xe1,
ye1)が連結座標メモリ18に格納される。図2
(b)のラベル番号4とラベル番号1、及びラベル番号
1とラベル番号6のように異種ラベルが連結していると
き、連結画像ラベル付け部14は各ラベル間の連結性を
示すために、図3(a)のように互いに連結しているラ
ベル番号を(例えば、4と1、1と6、…のように)連
結対テーブル15に格納する。そして、図3(b)に示
すようにラスター走査終了と共に連結テーブル17には
アドレス1〜6に対応して、1〜6のラベル番号が格納
され、連結座標メモリ18には各ラベル番号1〜6を各
々囲む複数の矩形の始点・終点座標が格納される。
【0010】次に連結対テーブル15を用いて本来の連
結画像の統合を行う。画像の統合化処理は先ず図3
(b)に示されるアドレスをラベル番号とし、各ラベル
番号に結合している他のラベル番号を、図3(a)に示
される連結対テーブルを参照して検出する。即ち、一つ
の連結画像(図2(b)の文字画像”山”)に複数のラ
ベル番号(1,4,6)が付されている場合、その中で
最も小さい値(”1”)がその連結画像のラベル番号と
して選択される。つまり、ラベル番号4とラベル番号1
は互いに結合している連結画像であるから、これらのラ
ベルは1つの連結画像内に含まれていると判断され、ラ
ベル番号4はラベル番号1に変更される。同様に、ラベ
ル番号6とラベル番号1も互いに結合している連結画像
であるから、ラベル番号6はラベル番号1に変更され
る。このようにしてラベル番号4とラベル番号6がラベ
ル番号1に書き替えられる。次に連結テーブル17内の
同一ラベル番号の矩形を統合する。図3(b)の連結座
標メモリ18のアドレス1、アドレス4、アドレス6に
対応する各矩形の始点・終点座標の大小が各々比較され
る。つまり、アドレス1、4、6(全てラベル番号1)
が示す各矩形座標の開始x座標(xs1,xs4,xs
6)の中で最も小さい値xs4と、開始y座標(ys
1,ys4,ys6)の中で最も小さい値ys1が、統
合されたラベル1の開始xアドレスとして連結座標メモ
リ18に格納される。つまりアドレス1の内容は更新さ
れる。又、アドレス1、4、6が示す各矩形座標の終点
x座標(xe1,xe4,xe6)の中で最も大きな値
xe1(xe1とxe6は同じ値であるが、y座標の大
きなxe1が選択される)と、終点y座標(ye1,y
e4,ye6)の中で最も大きな値ye1が、統合され
たラベル1の終点yアドレスとして連結座標メモリ18
に格納される。このようにして、図(c)に示すよう
に、図3(b)のアドレス1、4、6が示す矩形全てを
囲む矩形の座標が図3(c)のアドレス1に格納され、
連結画像の統合が行われる。
【0011】有効矩形検出部19は図3(c)の連結座
標メモリ18の始点・終点座標から、その矩形領域の大
きさを判定する。以下、その判定方法を説明する。図4
(b)は図4(a)の郵便物画像を連結画像レベル付け
部14によって前述のように処理し、その結果統合され
た各連結画像を矩形で囲んだ例である。これらの矩形の
中で、所定の大きさ以下及び以上の矩形32は文字以外
の画像(例えば広告)と判定し、その矩形座標は無効と
する。有効矩形座標判定処理の流れを図5に示す。各矩
形座標のX方向の長さをXi、記載文字のX方向の長さ
の下限値をk、上限値をl、Y方向の長さをYj、記載
文字のY方向の長さの下限値をm、上限値をnとして、
Xi、Yjが共にこの範囲内にあれば有効矩形座標とし
て検出する。つまり、Xiが下限値kより大きく(ST
1)、且つ上限値lより小さく(ST2)、且つYjが
下限値mより大きく(ST3)、且つ上限値nより小さ
いければ(ST4)、その矩形は文字に関するものとし
て有効と判断される。上記以外の場合、その矩形は無効
と判断される(ST5)。k、l、m、nの値は郵便物
上に記載される文字の最大・最小値の推定値で設定す
る。
【0012】次に図4(b)に示すように、宛名領域検
出部20は有効とみなされた矩形座標同志の遠近関係か
ら文字画像の矩形座標を統合して、二値画像メモリ13
に格納された画像の宛名領域33を検出する。そして、
宛名領域を形成する各文字画像矩形座標の連結座標列を
領域内座標メモリ21に格納する。従って領域座標メモ
リ21には宛名領域33内の各矩形の座標が格納され、
写真領域として判断された矩形32の座標は格納されな
い。次に宛名領域内座標メモリ21の座標列を、順次X
アドレスB 22、YアドレスB 23にセットし、前
記座標列で示される各矩形領域に”1”を書き込む。マ
スクメモリ24のメモリ領域は二値画像メモリ13と同
等で、マスクメモリ24上の矩形データの位置は二値画
像メモリ13上の各文字位置に対応する。又、マスクメ
モリ24は二値メモリ13への画像入力時に”0”が書
き込まれている。
【0013】そして、宛名領域の画像抽出・出力転送に
おいては、二値画像メモリ13とマスクメモリ24の対
応するアドレスに格納されたデータはAND回路25に
よりANDされる。
【0014】図6(a)は前述のようにして二値画像メ
モリ13内の郵便物画像から検出された宛名領域33、
図6(b)はマスクメモリ24内のマスク画像である。
黒く塗り潰した部分が文字画像の矩形を示すマスク画像
である。図6の(c)は(a)と(b)の画像のAND
をとることによって得られる画像である。このように本
発明を用いることで広告部分を除く本来の宛名画像
(c)のみが出力転送される。
【0015】
【発明の効果】以上説明したように本発明によれば、検
出された宛名画像を抽出・転送において、宛名矩形領域
を形成する文字矩形座標内の画像のみを抽出・転送する
ことができ、宛名領域矩形内に含まれる文字以外の画像
を排除し、文字行切出し、文字切出しの負担および誤り
を軽減できる。
【図面の簡単な説明】
【図1】図1は本発明装置の一実施例の構成を概略的に
示すブロック図。
【図2】図2はラベル付けされる画像とその矩形座標を
示す図。
【図3】図3連結画像の統合処理に関する各種テーブル
を示す図。
【図4】図4は宛名検出処理に関する図。
【図5】図5は矩形画像を文字領域として判定する処理
を示すフローチャート。
【図6】図6はマスクメモリを用いた画像抽出と転送に
関する図。
【図7】図7は従来装置で転送される画像データ。
【符号の説明】
13…二値像メモリ、14…連結画像ラベル付け部、1
5…連結テーブル、17…連結テーブル、18…連結座
標メモリ、19…有効矩形検出部、20…宛名領域検出
部、21…領域内座標メモリ、24…マスクメモリ、2
5…AND回路。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】画像データ内の所望領域を抽出する装置に
    おいて、 画像メモリに格納された画像データ内で連結画像を検出
    する手段と、 前記連結画像が文字を構成する画像として有効であるか
    判断する手段と、 前記判断手段によって有効と判断された各連結画像間の
    遠近関係から、前記所望領域を抽出する手段と、 前記所望領域内の前記連結画像のみを提供する手段と、
    を具備することを特徴とする装置。
  2. 【請求項2】郵便物画像内の所望文字領域を抽出する装
    置を有するOCRにおいて、前記抽出する装置は、 前記画像を二値画像として格納する手段と、 前記画像格納手段内の連結画像を検出する手段と、 前記連結画像を統合して、統合連結画像を提供する手段
    と、 前記統合連結画像が文字を構成する画像として有効であ
    るか判断する手段と、 前記判断手段によって有効と判断された各統合連結画像
    間の遠近関係から、前記所望文字領域を抽出する手段
    と、 前記統合連結画像を囲む矩形内に同一データが書き込ま
    れたマスク画像を格納する手段と前記所望文字領域と前
    記マスク画像とを論理演算することで、前記郵便物画像
    内の所望文字を生成する手段と、を具備することを特徴
    とする装置。
JP5065067A 1993-03-24 1993-03-24 宛名画像抽出装置 Pending JPH06274685A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5065067A JPH06274685A (ja) 1993-03-24 1993-03-24 宛名画像抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5065067A JPH06274685A (ja) 1993-03-24 1993-03-24 宛名画像抽出装置

Publications (1)

Publication Number Publication Date
JPH06274685A true JPH06274685A (ja) 1994-09-30

Family

ID=13276241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5065067A Pending JPH06274685A (ja) 1993-03-24 1993-03-24 宛名画像抽出装置

Country Status (1)

Country Link
JP (1) JPH06274685A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002373341A (ja) * 2001-06-15 2002-12-26 Ricoh Co Ltd 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002373341A (ja) * 2001-06-15 2002-12-26 Ricoh Co Ltd 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体

Similar Documents

Publication Publication Date Title
JP2667435B2 (ja) 領域抽出方法
WO2020156552A1 (zh) 二维码生成、识别方法及装置
JP2940936B2 (ja) 表領域識別方法
US7170647B2 (en) Document processing apparatus and method
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH05250409A (ja) ページ方向の高速検出
JP2002298122A (ja) 情報公開システム
US5467410A (en) Identification of a blank page in an image processing system
JP3090848B2 (ja) 枠内領域矩形化装置
JPH06274685A (ja) 宛名画像抽出装置
US8295602B2 (en) Image processing apparatus and image processing method
JP2002342710A (ja) 文字切出し装置及びそれに用いる文字切出し方法並びにそのプログラム
JPS6214277A (ja) 画像処理方式
KR100309679B1 (ko) 문자열추출방법
JP3031565B2 (ja) 表領域判定方法
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JPH0728939A (ja) 表のベクトル化装置
JPH11242716A (ja) 画像処理方法および記録媒体
JP2844618B2 (ja) 文字切り出し装置
JPS61214082A (ja) 画像領域抽出装置
JPH03254275A (ja) 画像拡大縮小方法
JP2954218B2 (ja) 画像処理方法及び装置
JP2931041B2 (ja) 表内文字認識方法
JPH0660220A (ja) 文書画像の領域抽出方法
JP3007549B2 (ja) 文字記入領域抽出方法