JPH05282489A - 文章画像の属性判別方法 - Google Patents

文章画像の属性判別方法

Info

Publication number
JPH05282489A
JPH05282489A JP4074051A JP7405192A JPH05282489A JP H05282489 A JPH05282489 A JP H05282489A JP 4074051 A JP4074051 A JP 4074051A JP 7405192 A JP7405192 A JP 7405192A JP H05282489 A JPH05282489 A JP H05282489A
Authority
JP
Japan
Prior art keywords
area
image
black
reduced
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4074051A
Other languages
English (en)
Other versions
JP2881066B2 (ja
Inventor
Makoto Torigoe
真 鳥越
Naohiro Amamoto
直弘 天本
Sadamasa Hirogaki
節正 広垣
Akitoshi Tsukamoto
明利 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP4074051A priority Critical patent/JP2881066B2/ja
Publication of JPH05282489A publication Critical patent/JPH05282489A/ja
Application granted granted Critical
Publication of JP2881066B2 publication Critical patent/JP2881066B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 単純2値化した構成要素を、レイアウトの複
雑さにかかわらず、5種類(文字(列)、図形、写真、
表、フィールドセパレータ)に分類する。 【構成】 2値化された文書画像が入力されると、その
文書画像を縮小し、さらにその中の各構成要素を、傾き
補正処理S18を併用し、領域内黒画素数S10、外接
矩形の縦横比と厚さS12、領域の矩形度と厚さS16
などを求め、それらを所定の閾値と比較することによ
り、文字(列)、図形、写真、表及びフィールドセパレ
ータの5種類に判別する。文書画像の縮小時の文字と文
字の接触領域については接触領域再分割及び属性判別処
理S24により原画像に戻してから領域分割し判別す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ファクシミリ等の通信
機器や文書画像データベース入力装置、光学的文字読取
り装置(OCR)等において、文書画像中の文字領域、
図形領域、写真領域、表領域及びフィールドセパレータ
領域といった構成要素の属性を判別する文書画像の属性
判別方法に関するものである。
【0002】
【従来の技術】従来、この種の属性判別方法としては、
例えば特開平03ー126181号公報に記載されるも
のがあった。
【0003】この文書画像の属性判別方法では、イメー
ジセンサにより、入力文書画像を走査して多値画像デー
タを読取る。読取られた多値画像データは、最適2値化
処理により、該多値画像データをその特徴及び性質を損
なうことなく2値画像データに変換される。即ち、この
最適2値化処理では、多値画像データを入力し、文字・
フィールドセパレータ領域は領域分離、図表・写真領域
はディザ処理(網点処理)を施し、それら両者の画像を
合成する。
【0004】この最適2値化処理により2値化された画
像は、領域分割によって複数のブロックに分割された
後、属性判別処理が行われる。属性判別処理では、領域
分割によって得られた各ブロックに対し、その特徴量と
して縦横比、面積、及び黒白反転密度(ブロック中での
黒白反転回数/面積)を算出し、これに基づいて領域を
フィールドセパレータ、写真、図形、及びその他の文字
の各領域に分類する。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
属性判別方法では、次のような課題があった。
【0006】(a)従来の属性判別方法では、最適2値
化処理画像を属性判別の処理対象としているため、前処
理として複雑な最適2値化処理を行うことが必要であ
る。しかも、図と表の判別を行っていないため、文書画
像中の図と表を分離することができないという問題点が
あった。
【0007】(b)前記(a)の問題点を解決するた
め、本願出願人は、先に特願平03ー082704号明
細書において属性判別方法を提案した。この提案では、
文書画像を単純2値化して2値化画像(原画像)を作成
し、さらに該2値化画像全体を縮小した後、該縮小画像
を構成要素に領域分割し、該分割された領域に対して、
該縮小画像領域内の黒画素数、領域外接矩形の縦横比、
領域の厚さ、及び領域の矩形度をそれぞれ求めてそれら
に対する閾値と比較する第1の処理と、傾き補正処理に
より、前記縮小画像領域の外接矩形の大きさに対する前
記縮小画像領域内での最長黒ランの長さの比率を求め、
それに対応する閾値と比較する第2の処理と、前記縮小
画像領域内の黒白反転密度を求め、それに対応する閾値
と比較する第3の処理とを実行して前記縮小画像領域を
文字(列)、図形、写真、表、及びフィールドセパレー
タの各領域に判別している。
【0008】ところが、この属性判別方法では、縮小画
像について領域分割及び属性判別を行っているため、文
書画像の縮小時に、図4に示した例のように黒丸で表わ
された文字と文字が接触してしまった場合、正しく領域
分割が出来ないため、属性判別を誤ってしまうという問
題点があった。
【0009】本発明は、前記従来技術が持っていた課題
として、文書画像の縮小時に文字と文字が接触した際、
精度よく属性を判別することが困難な点について解決し
た文書画像の属性判別方法を提供するものである。
【0010】
【課題を解決するための手段】本発明では前記課題を解
決するために、文書画像を単純2値化して2値化画像
(原画像)を作成し、さらに該2値化画像全体を縮小し
た後、該縮小画像を構成要素に領域分割し、該縮小画像
領域内の黒画素数、領域外接矩形の縦横比、領域の厚
さ、及び領域の矩形度をそれぞれ求めてそれらに対する
閾値と比較する第1の処理と、傾き補正処理により、前
記縮小画像領域の外接矩形の大きさに対する前記縮小画
像領域内での最長黒ランの長さの比率を求め、それに対
応する閾値と比較する第2の処理と、前記縮小画像領域
内の黒白反転密度を求め、それに対応する閾値と比較す
る第3の処理とを実行して前記縮小画像領域を文字
(列)、図形、写真、表、及びフィールドセパレータの
各領域に判別する文書画像の属性判別方法において、前
記縮小画像領域に該当する原画像の領域を求め、該原画
像の領域内における黒画素が存在しないライン及び黒画
素が少なくとも1つ存在するラインを求めることにより
原画像の領域を分割する第4の処理と、該第4の処理で
求めた原画像の分割領域の中で最大の高さ及び最大の幅
をそれぞれ求めてそれらに対する閾値と比較する第5の
処理とを実行して前記縮小画像領域を文字(列)領域及
び図形領域の各領域に判別するようにしている。
【0011】
【作用】本発明によれば、以上のように文書画像の属性
判別方法を構成したので、第4の処理では、文字と文字
が接触していると思われる領域に該当する原画像の領域
を求め、該原画像の領域内における黒画素が存在しない
ライン及び黒画素が少なくとも1つ存在するラインを求
めることにより原画像の領域を分割する。次に、第4の
処理で求めた原画像の分割領域の中で最大の高さ及び最
大の幅をそれぞれ求めてそれらに対する閾値と比較する
第5の処理とを実行することにより文字(列)領域及び
図形領域の各領域を判別することができる。従って、前
記課題を解決できるのである。
【0012】
【実施例】図5は、本発明の実施例を示すもので、画像
処理の全体の処理内容を示す図である。まず、前処理と
して、単純2値化処理1では、イメージセンサ等によっ
て入力文書画像が走査され、適当な閾値で単純2値化さ
れて2値化画像が生成される。該2値化画像は原画像メ
モリ2に格納されるとともに画像縮小処理3へ送られ
る。画像縮小処理3では、該原画像を縮小し縮小画像を
生成し、領域分割処理5にするとともに、縮小画像メモ
リ4に格納する。
【0013】領域分割処理5では、縮小画像を入力し、
それを文字(列)、図、表、写真、及びフィールドセパ
レータ等の構成要素に分割して分割領域6を生成する。
この構成要素に領域分割された分割領域6のデータは、
本実施例の特徴である属性判別処理7に送られる。
【0014】前処理の領域分割処理5では、本願出願人
による前記特開平03ー126181号公報記載した分
割方法などを用いることができる。該分割方法は、横方
向及び縦方向の走査を2回繰り返して行い、黒画素の存
在しない行及び列で画像を分割し、文字領域のものに対
してはそれらを統合することによって構成要素の分割領
域6を得るようにしている。
【0015】このような分割処理が終わると、属性判別
処理7が行われる。この属性判別処理7では、前処理で
得られた分割領域6に対し、属性の判別を行い、各領域
の属性情報8を出力する。この属性判別処理7の処理内
容を図1に示す。
【0016】図1〜図3は、本発明の実施例の属性判別
方法を用いた属性判別処理のフローチャートである。な
お、図中のS10〜S24,S30〜S39,S50〜
S58は、各処理のステップを示す。
【0017】この属性判別処理では、分割領域6のデー
タを入力すると、領域内の黒画素数を数え、この黒画素
数が閾値T1以下であるか否かを判定する(S10)。
黒画素数が閾値T1以下であれば、この領域を「ゴミ」
領域と判定する(S11)。ここでいう「ゴミ」とは、
実際の文書に付着した汚れや、文書画像入力時にスキャ
ナ面に付着していた汚れによる影等の、文書内容ではな
い黒画素塊である。このような黒画素塊が存在すると、
誤判定を引き起こすおそれがあるので、この「ゴミ」領
域を判別しておく。
【0018】ステップS10において、黒画素数が閾値
T1よりも大きければ、ステップS12において、領域
外接矩形の縦横比を求め、この縦横比が閾値T2よりも
大きいか否か、さらに該領域外接矩形の厚さ(即ち、領
域の高さと幅の内の小さい方をいう)が閾値T3以下で
あるか否かを判定する。縦横比が閾値T2以上で、かつ
厚さが閾値T3以下であれば、この領域をフィールドセ
パレータ領域と判定する(S13)。
【0019】ステップS12において判定結果がノーの
場合、領域の厚さが閾値T4以下であるか否かを判定
し、閾値T4以下であれば、文字領域(文字列)と判定
する(S15)。ステップS14でノーの場合、領域の
矩形度を次式より求め、その矩形度が閾値T5以上か否
か、さらに該領域の厚さが閾値T6以上か否かを判定す
る(S16)。
【0020】矩形度=領域内の黒画素数/領域の外接矩
形の面積(縦画素数×横画素数) ステップS16において、領域の矩形度が閾値T5以上
で、かつ厚さが閾値T6以上であれば、この領域を写真
領域と判定し(S17)、ノーの時にはステップS18
へ進む。
【0021】ステップS18の傾き補正処理では、行方
向最長黒ランの長さと列方向最長黒ランの長さを求め、
得られた行方向最長黒ランの長さと外接矩形の幅との比
が閾値T7以上か否かを判定する(S19)。閾値T7
以上の時には、列方向最長黒ランの長さと外接矩形の高
さとの比が閾値T8以上であるか否かを判定し(S2
0)、閾値T8以上であれば、この領域を表領域と判定
する(S21)。ステップS19及びS20でノーの場
合、ステップS22に進む。
【0022】ステップS22では、領域内での黒白反転
回数(縦方向及び横方向の黒白反転回数の和)の外接矩
形面積に対する比を求め、その面積比が閾値T9よりも
小さいか否かを判定し、閾値T9未満であれば図形領域
と判定する(S23)。また、ステップS22がノーの
場合、ステップS24に進む。
【0023】ステップS24における接触領域再分割及
び属性判別処理の詳細なフローチャートを図2に示す。
図2において、まず縮小画像領域の外接矩形に該当する
原画像の矩形領域を求める(S30)。ステップS31
で原画像の矩形領域の縦方向の両端の値をそれぞれy
s,yeとし、該原画像の矩形領域について横分割処理
を行う。次にステップS32においてステップS31で
分割された領域の中で最大の高さを求めて閾値T11以
上であれば、この領域を文字領域(文字列)と判定する
(S33)。閾値T11未満の時は、続いて閾値T12
と比較し(S34)、閾値T12以上であれば、この領
域を図形領域と判定する(S35)。閾値T12未満の
ときは、原画像の矩形領域の横方向の両端の値をそれぞ
れxs,xeとし、ステップS36で、該原画像の矩形
領域について縦分割処理を行う。ステップS37で、分
割された領域の中で最大の幅を求めて閾値T12未満で
あれば、この領域を文字領域(文字列)と判定する(S
38)。閾値T12以上の時は、この領域を図形領域と
判定する(S39)。
【0024】図3は横分割処理を詳細に示すフローチャ
ートである。まずステップS50で分割数を0に初期化
し、原画像を外接矩形内部について横方向に走査する。
走査ラインはy値のysからyeまで行う(S51)。
ステップS53で走査中のラインに黒画素が1つも存在
しなければ、1つ前のラインに黒画素が存在するか否か
を判定し(S54)、存在すれば走査中のラインを新し
くyeと設定して分割数を1つ増やす(S55,S5
6)。次に、ステップS53で走査中のラインに黒画素
が1つでも存在する場合は、1つ前のラインに黒画素が
存在するか否かを判定し(S57)、黒画素が1つも存
在しなければ走査中のラインを新しくysと設定する
(S58)。以上の走査を外接矩形の最終ラインまで行
う。なお、縦分割の処理も横分割の処理と同様であり、
ye,ysをそれぞれxe,xsに、横方向の走査を縦
方向の走査に変更すれば同様の処理となる。
【0025】図1及び図2の属性判別処理における閾値
T1〜T9,T11,T12は、次のようにして設定さ
れる。例えば、400dpiの原文書画像の8×8画素
の論理和演算の結果を1画素に縮小した50dpiの文
書画像を領域分割して得られた各領域について、属性を
判別する際の閾値T1〜T13としては、「ゴミ」の大
きさを4画素以下(T1=4)、フィールドセパレータ
の縦横比を40以上(T2=40)、厚さ4mm以下
(T3=4)と定義する。さらに、文字列の厚さは、一
般的な文書の本文で用いられている文字の大きさを考え
て5mm以下(T4=5)とするのが適当である。
【0026】また、その他の閾値を求めるため、実際の
前記縮小文書画像において独立文字、図形、写真、及び
表の領域における矩形度、縦横最長黒ランの外接矩形の
高さ、幅に対する比、及び黒白反転密度の分布を調査し
た結果を図6〜図8に示す。
【0027】図6は、領域の矩形度の分布を各属性毎に
表した図であるが、写真はほとんど矩形度0.6以上で
あるため、T5=0.6とするのが適当である。また、
T6は1cm程度とするのが適当である。
【0028】図7は、各領域において、後述する傾き補
正処理によって得られたx方向(横方向)、及びy方向
(縦方向)に最も長い黒ランの長さの、その領域の外接
矩形の大きさに対する比の分布を各属性毎に表した図で
ある。X座標は行方向最長黒ランの長さの外接矩形の幅
に対する比、Y座標は列方向最長黒ランの長さの外接矩
形の高さに対する比である。図中、tは表領域、cは文
字領域、fは図形領域である。この図7より、表領域に
おいては行方向及び列方向共に大きな値になっており、
閾値T7=0.95、T8=0.95とするのが適当で
ある。
【0029】図8は、独立文字領域と図形領域における
矩形度と黒白反転密度の値の分布図である。X座標は領
域の矩形度、Y座標は黒白反転密度である。図中、fは
図形領域、cは文字領域である。この図8より、閾値T
9=0.2とするのが適当である。
【0030】図2における黒ランの長さの閾値及び最長
黒ランの長さの閾値T11,T12については、文字の
大きさを考慮し、それぞれ16画素,32画素程度とす
るのが適当である。
【0031】図9の(a)、(b)は、図1における傾
き補正処理(S18)の概念を説明する図である。水平
な状態で読込んだ文書画像では、文書中の水平線を表す
黒画素数は同一行上に並ぶが、傾いた状態で読込んだ文
書画像では、傾き具合に応じて水平線の黒画素数が隣接
する行へ移行してゆく。そこで、傾き補正処理では、こ
のように移行している黒画素数を同一行上に並べるた
め、画像の領域内部分における幾つかの連続する行を、
列毎に論理和を取ることにより得られる1行に置き換え
る縮小操作を行う。この処理では1行に置き換えられる
行数は、補正を行う傾き角と領域の大きさによって異な
るが、例えば傾き許容角を1度程度とすると、次式で算
出されるものとするのが適当である。 1行に置き換える行数=(領域外接矩形の幅)×sin
1° この処理によって得られる画像において、最も長い行方
向の黒ランの長さを、この領域における行方向の最長黒
ランの長さとする。
【0032】列方向にも同様の処理を行う。この時の1
列に置き換えられる列数は、前記同様、次式で算出され
るものとするのが適当である。 1列に置き換える行数=(領域外接矩形の高さ)×si
n1° この処理によって得られる画像において、最も長い列方
向の黒ランの長さを、この領域における列方向の最長黒
ランの長さとする。これらの行方向及び列方向の縮小操
作は、同時に行うこともできる。
【0033】
【発明の効果】以上詳細に説明したように、本発明によ
れば、文書画像の縮小時に生じる文字と文字が接触した
領域について、原画像に戻して領域の再分割、属性判別
を行うため容易にしかも精度よく判別することができ
る。
【図面の簡単な説明】
【図1】本発明の実施例の属性判別方法を示す属性判別
処理の内容図である。
【図2】図1中のステップS24の処理内容を示す図で
ある。
【図3】図2中のステップS31の処理内容を示す図で
ある。
【図4】縮小画像の一例を示す図である。
【図5】本発明の実施例を示す画像処理の全体の処理内
容図である。
【図6】矩形度分布図である。
【図7】外接矩形比分布図である。
【図8】矩形度、黒白反転密度分布図である。
【図9】図1中の傾き補正処理の説明図である。
【符号の説明】
1 単純2値化処理 2 原画像メモリ 3 画像縮小処理 4 縮小画像メモリ 5 領域分割処理 6 領域分割データ 7 属性判別処理 8 属性情報
───────────────────────────────────────────────────── フロントページの続き (72)発明者 塚本 明利 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文書画像を単純2値化して2値化画像
    (原画像)を作成し、さらに該2値化画像全体を縮小し
    た後、該縮小画像を構成要素に領域分割し、該分割され
    た領域に対して、 該縮小画像領域内の黒画素数、領域外接矩形の縦横比、
    領域の厚さ、及び領域の矩形度をそれぞれ求めてそれら
    に対する閾値と比較する第1の処理と、 傾き補正処理により、前記縮小画像領域の外接矩形の大
    きさに対する前記縮小画像領域内での最長黒ランの長さ
    の比率を求め、それに対応する閾値と比較する第2の処
    理と、 前記縮小画像領域内の黒白反転密度を求め、それに対応
    する閾値と比較する第3の処理とを、 実行して前記縮小画像領域を文字(列)、図形、写真、
    表、及びフィールドセパレータの各領域に判別する文書
    画像の属性判別方法において、 前記縮小画像領域に該当する原画像の領域を求め、該原
    画像の領域内における黒画素が存在しないライン及び黒
    画素が少なくとも1つ存在するラインを求めることによ
    り原画像の領域を分割する第4の処理と、 該第4の処理で求めた原画像の分割領域の中で最大の高
    さ及び最大の幅をそれぞれ求めてそれらに対する閾値と
    比較する第5の処理とを、 実行して前記縮小画像領域を文字(列)及び図形領域の
    各領域に判別することを特徴とする文書画像の属性判別
    方法。
JP4074051A 1992-03-30 1992-03-30 文章画像の属性判別方法 Expired - Lifetime JP2881066B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4074051A JP2881066B2 (ja) 1992-03-30 1992-03-30 文章画像の属性判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4074051A JP2881066B2 (ja) 1992-03-30 1992-03-30 文章画像の属性判別方法

Publications (2)

Publication Number Publication Date
JPH05282489A true JPH05282489A (ja) 1993-10-29
JP2881066B2 JP2881066B2 (ja) 1999-04-12

Family

ID=13536006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4074051A Expired - Lifetime JP2881066B2 (ja) 1992-03-30 1992-03-30 文章画像の属性判別方法

Country Status (1)

Country Link
JP (1) JP2881066B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020087320A (ja) * 2018-11-30 2020-06-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CN113610090A (zh) * 2021-07-29 2021-11-05 广州广电运通金融电子股份有限公司 印章图像识别分类方法、装置、计算机设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020087320A (ja) * 2018-11-30 2020-06-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CN113610090A (zh) * 2021-07-29 2021-11-05 广州广电运通金融电子股份有限公司 印章图像识别分类方法、装置、计算机设备和存储介质
CN113610090B (zh) * 2021-07-29 2023-12-26 深圳广电银通金融电子科技有限公司 印章图像识别分类方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
JP2881066B2 (ja) 1999-04-12

Similar Documents

Publication Publication Date Title
JP3686439B2 (ja) デジタル・イメージのフォト領域検出システム、及び方法
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US5778092A (en) Method and apparatus for compressing color or gray scale documents
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
US7411699B2 (en) Method and apparatus to enhance digital image quality
JPH07220091A (ja) 画像処理装置及び方法
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JPH0652354A (ja) スキュー補正方法並びにスキュー角検出方法並びにドキュメントセグメンテーションシステムおよびスキュー角検出装置
US7145694B2 (en) Image processing apparatus and method
JP2786355B2 (ja) 文章画像の属性判別方法
US5446802A (en) Image processing apparatus comprising judgement means for judging dot photograph image, photograph image and character image
JP3073837B2 (ja) 画像領域分離装置及び画像領域分離方法
JP2003115031A (ja) 画像処理装置および方法
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
JP2881066B2 (ja) 文章画像の属性判別方法
JPH03126181A (ja) 文書画像の領域分割方法
JP2877548B2 (ja) 文書画像の属性判別方法
JP3187895B2 (ja) 文字領域抽出方法
JP3754721B2 (ja) 画像処理装置及びその方法
JP2900343B2 (ja) 画像処理装置
JP2853141B2 (ja) 画像領域識別装置
JPH0535914A (ja) 画像傾き検出方法
JP2800205B2 (ja) 画像処理装置
JPH10336441A (ja) 画像領域属性判別方法
KR100484170B1 (ko) 디지털 화질 개선방법 및 장치

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990112