JP2877548B2 - 文書画像の属性判別方法 - Google Patents

文書画像の属性判別方法

Info

Publication number
JP2877548B2
JP2877548B2 JP3082704A JP8270491A JP2877548B2 JP 2877548 B2 JP2877548 B2 JP 2877548B2 JP 3082704 A JP3082704 A JP 3082704A JP 8270491 A JP8270491 A JP 8270491A JP 2877548 B2 JP2877548 B2 JP 2877548B2
Authority
JP
Japan
Prior art keywords
area
attribute
determined
black
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3082704A
Other languages
English (en)
Other versions
JPH04316178A (ja
Inventor
明利 塚本
節正 広垣
直弘 天本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=13781791&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2877548(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3082704A priority Critical patent/JP2877548B2/ja
Publication of JPH04316178A publication Critical patent/JPH04316178A/ja
Application granted granted Critical
Publication of JP2877548B2 publication Critical patent/JP2877548B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ファクシミリ等の通信
機器や文書画像データベース入力装置、光学的文字読取
り装置(OCR)等において、文書画像中の文字領域、
図形領域、写真領域及び表領域等といった構成要素の属
性を判別する文書画像の属性判別方法に関するものであ
る。
【0002】
【従来の技術】従来、この種の属性判別方法としては、
例えば特開昭62−71379号公報に記載されるもの
があった。この文書画像の属性判別方法では、文書画像
データを入力し、主走査方向(例えば、横方向)に黒画
素を計数(カウント)して閾値を超えるラインを検出
し、該カウント値が閾値以下の白ラインが所定個数連続
する状態を判定して第1の領域切り出しを行う。この第
1の領域切り出し内で、副走査方向(例えば、縦方向)
に黒画素をカウントしてカウント値が閾値を超える列を
検出し、カウント値が閾値以下の白列が所定個数連続す
る状態を判定して第2の領域切り出しを行う。さらに、
第2の領域切り出し内で、第1の領域切り出しと同様な
処理により、第3の領域切り出しを行い、この第3の領
域切り出し内で、第2の領域切り出しと同様な処理によ
り、第4の領域切り出しを行う。そこで、この第4の領
域切り出しで検出された領域について、その領域のラン
レングス情報、及び黒画素率情報により、文字領域、写
真領域、図表領域等の属性を判別している。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
属性判別方法では、次のような課題があった。 (a)従来の属性判別方法では、領域切り出し処理にお
いて、対象に応じて様々な閾値を任意に設定する必要が
ある。例えば、個々の論文誌に対して領域切り出しを行
う場合、それらの閾値を各論文誌に応じた適切な値に設
定し直さなければならず、その値の選定に手間がかか
る。そのため、領域切り出し処理後に行う属性の判別処
理の効率が低いという問題があった。 (b)前記(a)の問題を解決するため、本願出願人
は、先に特願平1−264649号明細書において属性
判別方法を提案した。この提案では、イメージセンサに
より、入力文書画像を走査して多値画像データを読取
る。読取られた多値画像データは、最適2値化処理によ
り、該多値画像データをその特徴及び性質を損なうこと
なく2値画像データに変換される。即ち、この最適2値
化処理では、多値画像データを入力し、文字・フィール
ドセパレータ領域は領域分離、図表・写真領域はディザ
処理(網点処理)を施し、それら両者の画像を合成す
る。この最適2値化処理により2値化された画像は、領
域分割によって複数のブロックに分割された後、属性判
別処理が行われる。属性判別処理では、領域分割によっ
て得られた各ブロックに対し、その特徴量として縦横
比、面積、及び黒白反転密度(ブロック中での黒白反転
回数/面積)を算出し、これに基づいて領域をフィール
ドセパレータ、写真、図形、及びその他の文字の各領域
に分類する。
【0004】ところが、この属性判別方法では、最適2
値化処理画像を属性判別の処理対象としているため、前
処理として複雑な最適2値化処理を行うことが必要であ
る。しかも、図と表の判別を行っていないため、文書画
像中の図と表を分離することができなかった。本発明
は、前記従来技術が持っていた課題として、前処理を複
雑化することなく、しかもレイアウトの複雑さにかかわ
らず、文字(列)、図形、写真、表、及びフィールドセ
パレータという5種類の領域に判別することが困難な点
について解決した文書画像の属性判別方法を提供するも
のである。
【0005】
【課題を解決するための手段】前記課題を解決するため
に、本発明は、文書画像を単純2値化して2値画像(原
画像)を作成し、該2値画像を構成要素に領域分割し、
該分割された領域に対して属性の判別を行う文書画像の
属性判別方法において、下記のような第1、第2、第3
及び第4の属性判別処理を実行することで、前記領域分
割により分割された各領域の属性を、文字(列)、図
形、写真、表、及びフィールドセパレータの各領域に判
別するようにしている。 まず、第1の属性判別処理で
は、前記領域分割により分割された各領域に対し、各領
域内の黒画素数、領域外接矩形の縦横比、領域の厚さ、
及び領域の矩形度を前記2値画像において求め、それら
に対する閾値と比較し、該領域の属性をフィールドセパ
レータ、文字列、写真と判別する。第2の属性判別処理
では、前記第1の属性判別処理において属性が判別され
なかった領域に対し、各領域内の行方向及び列方向の最
長黒ランの長さを前記2値画像において各々求め、領域
の幅 と行方向の最長黒ランの長さ及び領域の高さと列方
向の最長黒ランの長さとの比率を閾値と比較し、該領域
の属性を表と判別する。第3の属性判別処理では、前記
第2の属性判別処理において属性が判別されなかった領
域に対し、各領域内の黒白反転密度を前記2値画像にお
いて求め、それに対する閾値と比較し、該領域の属性を
図形と判別する。そして、第4の属性判別処理では、前
記第3の属性判別処理において属性が判別されなかった
領域に対し、再度、前記矩形度とそれに対する閾値とを
比較し、該領域の属性を図形あるいは文字と判別する。
【0006】
【作用】本発明によれば、以上のように文書画像の属性
判別方法を構成したので、単純2値化された2値画像
(原画像)は領域分割された後、その分割された領域が
第1の属性判別処理へ送られる。第1の属性判別処理で
は、領域内の黒画素数、領域外接矩形の縦横比等をそれ
ぞれ求め、さらに対応する閾値と比較してその領域の属
性をフィールドセパレータ、文字列、写真と判別する。
第2の属性判別処理では、傾き補正処理を行い、領域外
接矩形の大きさに対する領域内での最長黒ランの長さの
比率を求め、それに対応する閾値と比較してその領域の
属性を表と判別する。3の属性判別処理では、領域内
の黒白反転密度を求めてそれに対応する閾値と比較する
ことにより、その領域の属性を図形と判別する。そし
て、第4の属性判別処理では、再度、矩形度とそれに対
する閾値とを比較し、領域の属性を図形あるいは文字と
判別する。これにより、前処理の簡単化と、レイアウト
の複雑さにかかわらず、構成要素の的確な分類が行え
る。したがって、前記課題を解決できるのである。
【0007】
【実施例】図2は、本発明の実施例を示すもので、画像
処理の全体の処理内容を示す図である。まず、前処理と
して、単純2値化処理1では、イメージセンサ等によっ
て入力文書画像が走査され、それが適当な閾値で単純2
値化されて2値画像(原画像)が領域分割処理2へ送ら
れる。領域分割処理2では、2値画像を入力し、それを
文字(列)、図、表、写真、及びフィールドセパレータ
等の構成要素に分割して分割領域3を生成する。この構
成要素に領域分割された分割領域3のデータは、本実施
例の特徴である属性判別処理4へ送られる。前処理の領
域分割処理2では、本願出願人が先に提案した前記分割
方法(文献1)や、或いは電子情報通信学会技術研究報
告PRL85−17(1985−6)辻・浅井著「スプ
リット検出法に基づく頁画像の構造解析」P.63−7
0(文献2)等に記載された種々の分割方法を用いるこ
とができる。
【0008】例えば、文献1の分割方法では、文書画像
データを入力して横方向及び縦方向の操作を2回繰り返
して行い、黒画素の存在しない行及び列で画像を分割
し、文字領域のものに対してはそれらを統合することに
よって構成要素の分割領域3を得るようにしている。ま
た、前記文献2に記載された方法では、文書画像の垂直
/水平投影分布を用い、該文書画像を縦方向及び横方向
へブロック分割することを繰り返すことにより、領域分
割を行っている。このような分割処理が終わると、属性
判別処理4が行われる。この属性判別処理4では、前処
理で得られた分割領域3に対し、属性の判別を行い、各
領域の属性情報5を出力する。この属性判別処理4の処
理内容を図1に示す。
【0009】図1は、本発明の実施例の属性判別方法を
用いた属性判別処理のフローチャートである。なお、図
中のS10〜S25は、各処理ステップを示す。この属
性判別処理では、分割領域3のデ―タを入力すると、領
域内の黒画素数を数え、この黒画素数が閾値T1以下で
あるか否かを判定する(S10)。黒画素数が閾値T1
以下であれば、この領域を「ごみ」領域と判定する(S
11)。ここでいう「ごみ」とは、実際の文書に付着し
た汚れや、文書画像入力時にスキャナ面に付着していた
汚れによる影等の、文書内容ではない黒画素塊である。
このような黒画素塊が存在すると、誤判定を引き起こす
おそれがあるので、この「ごみ」領域を判別しておく。
ステップS10において、黒画素数が閾値T1よりも大
きければ、ステップS12において、領域外接矩形の縦
横比を求め、この縦横比が閾値T2よりも大きいか否
か、さらに該領域外接矩形の厚さ(即ち、領域の高さと
幅の内の小さい方をいう)が閾値T3以下であるか否か
を判定する。縦横比が閾値T2以上で、かつ厚さが閾値
T3以下であれば、この領域をフィールドセパレータ領
域と判定する(S13)。
【0010】ステップS12において判定結果がノーの
場合、領域の厚さが閾値T4以下であるか否かを判定
し、閾値T4以下であれば、文字領域(文字列)と判定
する(S15)。ステップS14でノーの場合、領域の
矩形度を次式より求め、その矩形度が閾値T5以上か否
か、さらに該領域の厚さが閾値T6以上か否かを判定す
る(S16)。 矩形度=領域内の黒画素数/領域の外接矩形の面 但し、領域の外接矩形の面積=縦画素数×横画素数
【0011】ステップS16において、領域の矩形度が
閾値T5以上で、かつ厚さが閾値T6以上であれば、こ
の領域を写真領域と判定し(S17)、ノーの時にはス
テップS18へ進む。このような第1の属性判別処理が
終わると、第2の属性判別処理であるステップS18の
傾き補正処理が行われる。この傾き補正処理では、行方
向最長黒ランの長さと列方向最長黒ランの長さを求め、
得られた行方向最長黒ランの長さと外接矩形の幅との比
が閾値T7以上か否かを判定する(S19)。閾値T7
以上の時には、列方向最長黒ランの長さと外接矩形の高
さとの比が閾値T8以上であるか否かを判定し(S2
0)、閾値T8以上であれば、この領域を表領域と判定
する(S21)。ステップS19及びS20でノーの場
合、第3の属性判別処理であるステップS22へ進む。
ステップS22では、領域内での黒白反転回数(縦方向
及び横方向の黒白反転回数の和)の外接矩形面積に対す
る比を求め、その面積比が閾値T9よりも小さいか否か
を判定し、閾値T9未満であれば図形領域と判定する
(S23)。また、ステップS22がノーの場合、第4
の属性判別処理であるステップS24において、領域の
矩形度が閾値T10未満か否かを判定し、閾値T10未
満であれば、図形領域と判定し(S23)、閾値T10
以上であれば、ステップS25において、その他の領域
の文字領域(独立文字)と判定する。
【0012】図1の属性判別処理における閾値T1〜T
10は、次のようにして設定される。例えば、400d
piの原文書画像の8×8画素の論理和(OR)演算の
結果を1画素に縮小した50dpiの文書画像を領域分
割して得られた各領域について、属性を判別する際の閾
値T1〜T10としては、「ごみ」の大きさを4画素以
下(T1=4)、フィールドセパレータの縦横比を40
以上(T2=40)、厚さ4mm以下(T3=4)と定
義する。さらに、文字列の厚さは、一般的な文書の本文
で用いられている文字の大きさを考えて5mm以下(T
4=5)とするのが適当である。また、その他の閾値の
値を求めるため、実際の前記縮小文書画像において独立
文字、図形、写真、及び表の領域における矩形度、縦横
最長黒ランの外接矩形の高さ、幅に対する比、及び黒白
反転密度の分布を調査した結果を図3〜図5に示す。
【0013】図3は、領域の矩形度の分布を各属性毎に
表した図であるが、写真はほとんど矩形度0.6以上で
あるため、T5=0.6とするのが適当である。図4
は、各領域において、後述する傾き補正処理によって得
られたx方向(横方向)、及びy方向(縦方向)に最も
長い黒ランの長さの、その領域の外接矩形の大きさに対
する比の分布を各属性毎に表した図である。X座標は行
方向最長黒ランの長さの外接矩形の幅に対する比、Y座
標は列方向最長黒ランの長さの外接矩形の高さに対する
比である。図中、tは表領域、cは文字領域、fは図形
領域である。この図4より、表領域においては行方向及
び列方向共に大きな値になっており、閾値T7=0.9
5、T8=0.95とするのが適当である。図5は、独
立文字領域と図形領域における矩形度と黒白反転密度の
値の分布図である。X座標は領域の矩形度、Y座標は黒
白反転密度である。図中、fは図形領域、cは文字領域
である。この図5より、閾値T9=0.2、T10=
0.3とするのが適当である。
【0014】図6の(a),(b)は、図1における傾
き補正処理(S18)の概念を説明する図である。水平
な状態で読込んだ文書画像では、文書中の水平線を表す
黒画素数は同一行上に並ぶが、傾いた状態で読込んだ文
書画像では、傾き具合に応じて水平線の黒画素数が隣接
する行へ移行してゆく。そこで、傾き補正処理では、こ
のように移行している黒画素数を同一行上に並べるた
め、画像の領域内部分における幾つかの連続する行を、
列毎にORを取ることにより得られる1行に置き換える
縮小操作を行う。この処理で1行に置き換えられる行数
は、補正を行う傾き角と領域の大きさによって異なる
が、例えば傾き許容角を1度程度とすると、次式で算出
されるものとするのが適当である。
【0015】 1行に置き換える行数=(領域外接矩形の幅)×sin1° この処理によって得られる画像において、最も長い行方
向及び列方向の黒ランの長さを、この領域における行方
向の最長黒ランの長さとする。列方向にも同様の処理を
行う。この時の1列に置き換えられる列数は、前記同
様、次式で算出されるとするのが適当である。 1列に置き換える列数=(領域外接矩形の高さ)×sin1° この処理によって得られる画像において、最も長い列方
向の黒ランの長さを、の領域における列方向の最長黒
ランの長さとする。これらの行方向及び列方向の縮小操
作は、同時に行うこともできる。
【0016】このように、本実施例の属性判別方法で
は、単純2値化した文書画像の構成要素を、傾き補正処
理を併用して黒画素数等の特徴量から属性判別を行って
いるので、該属性判別の前処理が簡単になるばかりか、
レイアウトの複雑さにかかわらず、該構成要素を5種類
(文字(列)、図形、写真、表、フィールドセパレー
タ)に精度よく分類することができる。なお、本発明は
上記実施例に限定されず、例えば図1の属性判別処理に
おいて、ステップS10,S11を省略したり、或いは
傾き補正処理S18を他の位置で実行する等、種々の変
形が可能である。
【0017】
【発明の効果】以上詳細に説明したように、本発明によ
れば、単純2値化した2値画像(原画像)の構成要素を
用いて属性判別を行っているので、属性判別処理の前処
理が簡単になる。しかも、2値画像中の各構成要素を、
傾き補正処理を併用し、領域内黒画素数、領域内黒白反
転密度、領域外接矩形の縦横比、厚さ、領域の矩形度、
及び領域外接矩形の大きさに対する領域内での最長黒ラ
ンの長さの比率を用いて文字(列)、図形、写真、表、
及びフィールドセパレータの各領域に判別している。そ
のため、レイアウトの複雑さにかかわらず、2値画像の
構成要素を5種類(文字(列)、図形、写真、表、フィ
ールドセパレータ)に簡単かつ精度よく分類することが
できる。
【図面の簡単な説明】
【図1】本発明の実施例の属性判別方法を示す属性判別
処理の内容図である。
【図2】本発明の実施例を示す画像処理の全体の処理内
容図である。
【図3】矩形度分布図である。
【図4】外接矩形比分布図である。
【図5】矩形度、黒白反転密度分布図である。
【図6】図1中の傾き補正処理の説明図である。
【符号の説明】
1 単純2値化処理 2 領域分割処理 3 分割領域 4 属性判別処理 5 各領域の属性情報
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−14392(JP,A) 特開 平3−222075(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/20 G06T 7/00 H04N 1/04

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書画像を単純2値化して2値画像を作
    成し、該2値画像を構成要素に領域分割し、該分割され
    た領域に対して属性の判別を行う文書画像の属性判別方
    法において、 前記領域分割により分割された各領域に対し、各領域内
    の黒画素数、領域外接矩形の縦横比、領域の厚さ、及び
    領域の矩形度を前記2値画像において求め、それらに対
    する閾値と比較し、該領域の属性をフィールドセパレー
    タ、文字列、写真と判別する第1の属性判別処理と、 前記第1の属性判別処理において属性が判別されなかっ
    た領域に対し、各領域内の行方向及び列方向の最長黒ラ
    ンの長さを前記2値画像において各々求め、領域の幅と
    行方向の最長黒ランの長さ及び領域の高さと列方向の最
    長黒ランの長さとの比率を閾値と比較し、該領域の属性
    を表と判別する第2の属性判別処理と、 前記第2の属性
    判別処理において属性が判別されなかった領域に対し、
    各領域内の黒白反転密度を前記2値画像において求め、
    それに対する閾値と比較し、該領域の属性を図形と判別
    する第3の属性判別処理と、 前記第3の属性判別処理において属性が判別されなかっ
    た領域に対し、再度、前記矩形度とそれに対する閾値と
    を比較し、該領域の属性を図形あるいは文字と判別する
    第4の属性判別処理とを実行することで、前記領域分割
    により分割された各領域の属性を、文字(列)、図形、
    写真、表、及びフィールドセパレータの各領域に判別す
    ることを特徴とする文書画像の属性判別方法。
JP3082704A 1991-04-15 1991-04-15 文書画像の属性判別方法 Expired - Lifetime JP2877548B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3082704A JP2877548B2 (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3082704A JP2877548B2 (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Publications (2)

Publication Number Publication Date
JPH04316178A JPH04316178A (ja) 1992-11-06
JP2877548B2 true JP2877548B2 (ja) 1999-03-31

Family

ID=13781791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3082704A Expired - Lifetime JP2877548B2 (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Country Status (1)

Country Link
JP (1) JP2877548B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005149455A (ja) 2003-10-21 2005-06-09 Sharp Corp 画像照合装置、画像照合方法、画像照合プログラムおよび画像照合プログラムを記録したコンピュータ読取り可能な記録媒体

Also Published As

Publication number Publication date
JPH04316178A (ja) 1992-11-06

Similar Documents

Publication Publication Date Title
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US7321688B2 (en) Image processor for character recognition
US6269186B1 (en) Image processing apparatus and method
JP4392907B2 (ja) 文字切出し方法
US7151859B2 (en) Method and system for correcting direction or orientation of document image
JP4132766B2 (ja) 画像処理装置および方法
AU4207400A (en) Intelligent detection of text on a page
JP2877548B2 (ja) 文書画像の属性判別方法
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
JP3073837B2 (ja) 画像領域分離装置及び画像領域分離方法
JP2786355B2 (ja) 文章画像の属性判別方法
JPH03126181A (ja) 文書画像の領域分割方法
JP2881066B2 (ja) 文章画像の属性判別方法
JPS6325391B2 (ja)
JP3187895B2 (ja) 文字領域抽出方法
JPH10108012A (ja) 像域分離装置
KR100537827B1 (ko) 경계선 분포를 이용한 스캔 영상의 상역 분리 방법
JP3326309B2 (ja) 画像処理装置
JP3020293B2 (ja) 属性判別方法
JPH0540849A (ja) 文書画像の領域抽出方法
JP2005208979A (ja) 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置
JP2900343B2 (ja) 画像処理装置
JPH06103399A (ja) 画像処理装置
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPH0535914A (ja) 画像傾き検出方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990112