JPH05274472A - 画像認識装置 - Google Patents

画像認識装置

Info

Publication number
JPH05274472A
JPH05274472A JP4070714A JP7071492A JPH05274472A JP H05274472 A JPH05274472 A JP H05274472A JP 4070714 A JP4070714 A JP 4070714A JP 7071492 A JP7071492 A JP 7071492A JP H05274472 A JPH05274472 A JP H05274472A
Authority
JP
Japan
Prior art keywords
rectangle
character
area
attribute
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4070714A
Other languages
English (en)
Inventor
Yumiko Ikemure
由美子 池牟▲禮▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4070714A priority Critical patent/JPH05274472A/ja
Publication of JPH05274472A publication Critical patent/JPH05274472A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 本発明は領域間の空白が狭い文書に対しても
正確に領域分割ができるとともに従来判別が不可能であ
った文字サイズ程度の図形領域をも判定できる認識精度
の著しく向上した画像認識装置の提供。 【構成】 本発明の画像認識装置は、二値化された文字
等の画像認識情報を縮小する手段6と、黒画素が連結し
ている黒のかたまりに外接する矩形を抽出する外接矩形
取得手段7と、外接矩形の大きさと矩形の縦横比から矩
形の属性を決定する矩形属性決定手段8と、矩形の属性
が文字の場合に文字矩形間の距離から文字の組方向を検
知して行を取得する行情報取得手段9と、検出された行
を統合して文字領域を抽出する文字領域抽出手段10
と、文字領域とならなかった文字候補矩形を図形候補に
変更する図形候補変更手段11,12とを備えた構成か
らなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像認識装置に関するも
のである。
【0002】
【従来の技術】近年、文字・表図形・写真が混在する印
刷文書を認識するために、スキャナ等の光学的手段を用
いて文書画像を取り込み、取り込んだ画像データを基に
文字ブロック・図形ブロック等に領域を分割する文字等
の画像認識装置が開発されている。
【0003】以下に従来の画像認識装置の領域分割方式
について、図面を参照しながら説明する。
【0004】図7は文字や表図形、写真が混在する画像
認識対象文書を示す図であり、図8は従来の画像認識装
置により領域分割された結果を示す図である。
【0005】まず、図7の印刷文書をスキャナによって
取り込み、取り込まれた二値データから水平方向と垂直
方向に対して、黒画素の連続数(以下、黒ランと呼
ぶ。)と白画素の連続数(以下、白ランと呼ぶ。)をカ
ウントしたランレングスを検出する。水平/垂直方向そ
れぞれに対して、白ランから予め定められた閾値以上の
幅と高さをもつ空白ブロックと、黒ランから予め定めら
れた閾値以上の長さをもつフィールドセパレータを検出
する。検出された水平/垂直空白ブロックとフィールド
セパレータに囲まれている部分を検出し領域として格納
する。
【0006】次に、抽出された領域内の黒画素密度(領
域内に占める黒画素の割合)から写真領域かそれ以外か
の属性を決定する。写真領域以外の場合は、外接矩形を
検出し外接矩形の大きさがあらかじめ定められた閾値以
上であれば図形領域とし、閾値未満であれば文字領域と
する。以上のようにして図7の領域を分割して図8に示
す領域分割結果が得られていた。
【0007】
【発明が解決しようとする課題】しかしながら従来の領
域分割方式を有する画像処理装置では、空白ブロック及
びフィールドセパレータに囲まれている部分を検出する
ことにより領域を抽出するため、空白の幅が狭い領域に
ついては、領域分割することができないという問題点が
あった。
【0008】また、領域属性判定については、外接矩形
の絶対サイズによってのみ、図形と文字領域を決定して
いるため、文字サイズ程度の図形については文字領域と
誤判定してしまうといった問題を有していた。
【0009】本発明は上記従来の問題点を解決するもの
で、領域間の空白が狭い文書に対しても正確に領域分割
ができるとともに従来判別が不可能であった文字サイズ
程度の図形領域をも判定できる認識精度の著しく向上し
た画像認識装置を提供することを目的とする。
【0010】
【課題を解決するための手段】この目的を達成するため
に本発明の画像認識装置は、二値化された文字等の画像
認識情報を縮小する手段と、黒画素が連結している黒の
かたまりに外接する矩形を抽出する外接矩形取得手段
と、外接矩形の大きさと矩形の縦横比から矩形の属性を
決定する矩形属性決定手段と、矩形の属性が文字の場合
に文字矩形間の距離から文字の組方向を検知して行を取
得する行情報取得手段と、検出された行を統合して文字
領域を抽出する文字領域抽出手段と、文字領域とならな
かった文字候補矩形を図形候補に変更する図形候補変更
手段と、を備えた構成を有している。
【0011】また、本発明の画像認識装置の領域分割方
式は次の動作からなる。スキャナ等により取り込んだ二
値データに対して縮小処理を行い、縮小されたデータに
対して黒画素の連結状態を調べ、黒画素が連結している
かたまりに外接する矩形の座標を検出し格納する。外接
矩形の大きさが予め定められた閾値以下の微小矩形であ
れば、その矩形はノイズ候補とする。外接矩形の縦横比
が閾値以上であればフィールドセパレータ候補とする。
更に、外接矩形の大きさを調べ、矩形の大きさが閾値以
上であればその矩形は表図形あるいは写真候補とし、閾
値未満の場合は文字候補とする。そして、検出された文
字候補矩形に対して以下の処理を行う。
【0012】基準となる文字候補矩形に対して最も近い
文字候補矩形を検出する。基準矩形と検出された文字候
補矩形との距離があらかじめ定められた閾値以内にあれ
ば2つの矩形は同一領域内に存在するとみなし矩形の統
合を行う。この際、基準矩形と検出された文字候補矩形
の位置関係から文字の組方向を決定する。
【0013】全文字候補矩形に対して、上記の処理を行
うことにより行検出が可能となる。次に、検出された行
情報から領域の抽出を行う。同一方向に隣合う行の幅が
等しく行間の距離が閾値以下であれば2つの行は同一領
域内にあるとして領域の統合を行う。領域に統合できな
かった文字候補矩形に対して、再度、文字か図形かの判
定を行う。
【0014】次に図形候補矩形の処理は、図形候補矩形
が重なっている場合はそれを1つに統合し、統合された
図形候補矩形を図形、あるいは、写真領域として領域抽
出する。そうして抽出された領域に対して、黒画素密度
や微小矩形の割合による属性の判定を行う。
【0015】
【作用】この構成によって、領域間の空白の狭い文書や
文字サイズ程度の図形が存在する文書についても領域の
分割を行うことができる。
【0016】また、行の抽出処理を行うので、従来必要
としていた文字組検出処理の後処理を省くことができ
る。
【0017】
【実施例】以下本発明の一実施例について、図面を参照
しながら説明する。
【0018】図1は本実施例の画像認識装置における領
域分割部のブロック構成図であり、図2はCPUの処理
ブロック図である。
【0019】1は領域分割プログラムが格納されている
ROMである。2は領域分割を行うCPUであって、図
2の画像データ縮小部6、外接矩形取得部7、外接矩形
の属性判定部8、文字矩形による行取得部9、行情報に
よる文字領域取得部10、外接矩形の属性再判定部1
1、文字以外の領域取得部12を有する。3はスキャナ
4によって取り込まれた二値データを格納するRAMで
ある。5はCPUによって分割された各領域の認識結果
を表示する表示装置である。
【0020】以上のように構成された本実施例の画像認
識装置について、以下その領域分割方式を図面を参照し
ながら説明する。
【0021】図3は図7の印刷文書を本実施例の画像認
識装置で外接矩形を抽出した外接矩形抽出例を示す図で
あり、図5は文字矩形による行抽出部での水平方向の行
抽出の際のフローチャートであり、図6は文字矩形によ
る行抽出部で抽出された行情報を示す図であり、図4は
本実施例の画像認識装置で領域分割された結果を示す図
である。
【0022】まず、行の検出を容易にするために、スキ
ャナ4によって取り込まれた解像度400DPIの画像
データを画像データ縮小部6で原画像データの4分の1
に画像を縮小する(面積比で表すと16分の1)。
【0023】次いで、外接矩形取得部7において、画像
データ縮小部6で縮小されたデータに対して、黒画素の
連結状態を調べ、黒画素が連結しているかたまりに外接
する矩形を取得し、その座標をRAM2に格納する。そ
の矩形の左上を開始座標として、水平方向の座標をx
1、垂直方向の座標をy1とする。また、矩形の右下を
終了座標として、水平方向の座標をx2、垂直方向の座
標をy2とする。
【0024】外接矩形検出部7より検出した外接矩形情
報を基に、外接矩形の属性判定部8において、外接矩形
を a.ノイズ候補矩形 b.フィールドセパレータ矩
形c.図形候補矩形 d.文字候補矩形の4つの属性に
振り分ける。aのノイズ候補矩形は、外接矩形内の黒画
素の数が閾値NOISE_MIN以下のものとする。b
のフィールドセパレータ矩形は矩形の縦横比が閾値FD
_RATIO_1ST以上のものと全てと矩形の縦横比
が閾値FD_RATIO_2NDで、かつ、矩形の長辺
が閾値FIELD_MIN以上で短辺が閾値DI_FI
ELD_WID以下のものとする。cの図形候補矩形は
矩形の短辺が閾値CHAR_MAX以上のもの全てと矩
形の長辺が閾値CHAR_MAX以上でかつ矩形の黒画
素密度が閾値PER_DIAG_MAX以上かあるい
は、閾値PER_DIAG_MIN以下のものとする。
上記の3つの条件に当てはまらずに残った矩形をdの文
字候補矩形とする。
【0025】文字矩形による行抽出部9では、まず水平
方向の行を抽出した後、続いて垂直方向の行を抽出す
る。水平方向の行抽出について図5を参照しながら説明
する。
【0026】文字候補矩形に対して、矩形が統合可能か
否かチェックするための回数を減らすために、文字候補
矩形をx1昇順にソートする(s1)。ソートされた1
番目の矩形を統合基準矩形carBoxとする(s
2)。図3の矩形1がこれにあたる。次に基準矩形の次
の矩形を統合チェック対象矩形objBoxとする(s
3)。図3では矩形2がこれにあたる。そして、統合チ
ェック矩形objBoxのx1の値が矩形統合範囲内に
入っているかチェックする(s4)。矩形統合範囲に入
っていればs5の処理を行い、入っていなければs11
にジャンプする。矩形統合範囲は、(基準矩形carB
oxのx2)+(carBoxの幅と高さの短い方/
3)である。s5では、2つの矩形が水平に並んでいる
かチェックする。水平に並んでいれば、2つの矩形の内
のどちらかに水平方向フラグがセットされているかチェ
ックする(s6)。水平フラグがセットされている場合
は2つの矩形を統合し、水平フラグをセットする(s
7,8)。2つの矩形のどちらとも水平方向フラグがセ
ットされていなければ、基準矩形carBoxと垂直方
向に対して最も近い矩形の距離を検出して、水平方向の
距離が垂直方向の距離よりも短ければ、2つの矩形を統
合し水平方向フラグをセットする(s9)。図3では、
基準矩形carBoxが矩形1で統合チェック対象矩形
objBoxが矩形21のときがこの場合にあたる。総
合チェック対象矩形objBoxのポインタを1つすす
め(s10)、s4に戻る。
【0027】統合チェック対象矩形が統合範囲外になっ
たら、基準矩形carBoxのポインタを1つすすめ
(s11)、基準矩形がなくなるまで処理を続ける(s
12)。以上のようにして抽出した行情報が図6であ
る。
【0028】垂直方向の行抽出と同様にして垂直方向の
行抽出を行い、先に検出された行情報を基に文字領域抽
出部10において、同一方向に隣合う行の幅が等しく行
間の距離が閾値TH_PITCH以下であれば2つの行
は同一領域内にあるとして領域の統合を行う。
【0029】外接矩形属性再判定部11では、文字領域
として統合されなかった文字候補矩形の属性の再設定を
行う。統合できなかった文字候補矩形の大きさが文字矩
形による行抽出部9によって検出された行の幅より大き
ければ図形候補矩形とする。図5の矩形Aがこの例にあ
たり、矩形Aはこの時点で図形候補となる。小さければ
文字候補矩形のままとなり、文字領域として抽出する。
【0030】文字以外の領域抽出部12では、外接矩形
属性判定部8でフィールドセパレータ矩形を罫線領域と
して抽出する。また、外接矩形属性判定部8で検出した
図形候補矩形と外接矩形属性再判定部で決定した図形候
補矩形の重なりを検出し、重なっている矩形は1つにま
とめる。統合処理を施した図形候補矩形は図形あるい
は、写真領域となり領域として抽出する。図形あるいは
写真領域として抽出された領域に関して、領域内の黒画
素密度および、微小矩形の割合等の情報から属性の判定
を行う。
【0031】以上のようにして領域分割され図4に示す
認識結果が得られる。尚、本実施例では、NOISE_
MIN、FD_RATIO_1ST、FD_RATIO
_2ND、FIELD_MIN、DI_FIELD_W
ID、PER_DIAG_MIN、PER_DIAG_
MAX、CHAR_MAX、TH_PITCHの値は以
下の値とした。
【0032】NOISE_MIN =2 FD_RATIO_1ST=30 FD_RATIO_2ND=12 FIELD_MIN =25 DI_FIELD_WID=6 PER_DIAG_MIN=15 PER_DIAG_MAX=80 CHAR_MAX =100 TH_PITCH =12
【0033】
【発明の効果】以上のように本発明は、文字候補外接矩
形から行を抽出し、さらに抽出された行情報から文字領
域を抽出するため、領域間の空白が狭い文書に対しても
正確に領域分割することができるとともに、行に統合で
きなかった文字候補矩形に対して、再度、矩形の属性判
定を行うので、従来判別できなかった文字サイズ程度の
図形領域の属性判定をも行うことができる。また、行の
抽出処理を行うことにより、後段での文字組検出処理を
不要とすることができる認識精度を著しく向上させた優
れた画像認識装置を実現できるものである。
【図面の簡単な説明】
【図1】本実施例の画像認識装置における領域分割部の
ブロック構成図
【図2】本実施例の画像認識装置のCPUの処理ブロッ
ク図
【図3】本実施例における外接矩形抽出例を示す図
【図4】本実施例の画像認識装置で領域分割された結果
を示す図
【図5】文字矩形による行抽出部での水平水平方向の行
抽出の際のフローチャート
【図6】文字矩形による行抽出部で抽出された行情報を
示す図
【図7】文字・表図形・写真が混在する画像認識対象文
書を示す図
【図8】従来の画像認識装置で領域分割された結果を示
す図
【符号の説明】
1 ROM 2 CPU 3 RAM 4 スキャナ 5 表示装置 6 画像データ縮小部 7 外接矩形取得部 8 外接矩形属性判定部 9 文字矩形による行抽出部 10 行情報による文字領域取得部 11 外接矩形属性再設定部 12 文字以外の領域取得部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】二値化された文字等の画像認識情報を縮小
    する手段と、黒画素が連結している黒のかたまりに外接
    する矩形を抽出する外接矩形取得手段と、外接矩形の大
    きさと矩形の縦横比から矩形の属性を決定する矩形属性
    決定手段と、矩形の属性が文字の場合に文字矩形間の距
    離から文字の組方向を検知して行を取得する行情報取得
    手段と、検出された行を統合して文字領域を抽出する文
    字領域抽出手段と、文字領域とならなかった文字候補矩
    形を図形候補に変更する図形候補変更手段と、を備えた
    ことを特徴とする画像認識装置。
JP4070714A 1992-03-27 1992-03-27 画像認識装置 Pending JPH05274472A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4070714A JPH05274472A (ja) 1992-03-27 1992-03-27 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4070714A JPH05274472A (ja) 1992-03-27 1992-03-27 画像認識装置

Publications (1)

Publication Number Publication Date
JPH05274472A true JPH05274472A (ja) 1993-10-22

Family

ID=13439521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4070714A Pending JPH05274472A (ja) 1992-03-27 1992-03-27 画像認識装置

Country Status (1)

Country Link
JP (1) JPH05274472A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556711B2 (en) * 1994-12-28 2003-04-29 Canon Kabushiki Kaisha Image processing apparatus and method
US6701008B1 (en) * 1999-01-19 2004-03-02 Ricoh Company, Ltd. Method, computer readable medium and apparatus for extracting characters from color image data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556711B2 (en) * 1994-12-28 2003-04-29 Canon Kabushiki Kaisha Image processing apparatus and method
US6701008B1 (en) * 1999-01-19 2004-03-02 Ricoh Company, Ltd. Method, computer readable medium and apparatus for extracting characters from color image data

Similar Documents

Publication Publication Date Title
JP3338537B2 (ja) 画像傾き検出装置
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
JPH03122773A (ja) 画像形成装置
JPH05233873A (ja) 領域分割方法
EP0809205A2 (en) Character line detecting apparatus using simplified projection information and method thereof and character recognition apparatus thereof and method thereof
JP3303246B2 (ja) 画像処理装置
JPH05274472A (ja) 画像認識装置
JP2868134B2 (ja) 画像処理方法及び装置
JP3443141B2 (ja) 画像傾き検出方法及び表処理方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3095470B2 (ja) 文字認識装置
JPH06187489A (ja) 文字認識装置
JPH0916713A (ja) 画像領域分割方法
JPH07160810A (ja) 文字認識装置
JPH0822507A (ja) 文書認識装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP2888885B2 (ja) 文字切出し装置
JP2715930B2 (ja) 線分検出方法
JPH05174179A (ja) 文書画像処理装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP3381803B2 (ja) 傾き角検出装置
JP2931041B2 (ja) 表内文字認識方法
JPH07168911A (ja) 文書認識装置
JP2004152048A (ja) 車両ナンバー読み取り装置