JPH04316178A - 文書画像の属性判別方法 - Google Patents

文書画像の属性判別方法

Info

Publication number
JPH04316178A
JPH04316178A JP3082704A JP8270491A JPH04316178A JP H04316178 A JPH04316178 A JP H04316178A JP 3082704 A JP3082704 A JP 3082704A JP 8270491 A JP8270491 A JP 8270491A JP H04316178 A JPH04316178 A JP H04316178A
Authority
JP
Japan
Prior art keywords
area
black
document image
region
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3082704A
Other languages
English (en)
Other versions
JP2877548B2 (ja
Inventor
Akitoshi Tsukamoto
明利 塚本
Sadamasa Hirogaki
広垣 節正
Naohiro Amamoto
直弘 天本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=13781791&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPH04316178(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3082704A priority Critical patent/JP2877548B2/ja
Publication of JPH04316178A publication Critical patent/JPH04316178A/ja
Application granted granted Critical
Publication of JP2877548B2 publication Critical patent/JP2877548B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ファクシミリ等の通信
機器や文書画像データベース入力装置、光学的文字読取
り装置(OCR)等において、文書画像中の文字領域、
図形領域、写真領域及び表領域等といった構成要素の属
性を判別する文書画像の属性判別方法に関するものであ
る。
【0002】
【従来の技術】従来、この種の属性判別方法としては、
例えば特開昭62−71379号公報に記載されるもの
があった。
【0003】この文書画像の属性判別方法では、文書画
像データを入力し、主走査方向(例えば、横方向)に黒
画素を計数(カウント)して閾値を超えるラインを検出
し、該カウント値が閾値以下の白ラインが所定個数連続
する状態を判定して第1の領域切り出しを行う。この第
1の領域切り出し内で、副走査方向(例えば、縦方向)
に黒画素をカウントしてカウント値が閾値を超える列を
検出し、カウント値が閾値以下の白列が所定個数連続す
る状態を判定して第2の領域切り出しを行う。
【0004】さらに、第2の領域切り出し内で、第1の
領域切り出しと同様な処理により、第3の領域切り出し
を行い、この第3の領域切り出し内で、第2の領域切り
出しと同様な処理により、第4の領域切り出しを行う。 そこで、この第4の領域切り出しで検出された領域につ
いて、その領域のランレングス情報、及び黒画素率情報
により、文字領域、写真領域、図表領域等の属性を判別
している。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
属性判別方法では、次のような課題があった。
【0006】(a)従来の属性判別方法では、領域切り
出し処理において、対象に応じて様々な閾値を任意に設
定する必要がある。例えば、個々の論文誌に対して領域
切り出しを行う場合、それらの閾値を各論文誌に応じた
適切な値に設定し直さなければならず、その値の選定に
手間がかかる。そのため、領域切り出し処理後に行う属
性の判別処理の効率が低いという問題があった。
【0007】(b)前記(a)の問題を解決するため、
本願出願人は、先に特願平1−264649号明細書に
おいて属性判別方法を提案した。この提案では、イメー
ジセンサにより、入力文書画像を走査して多値画像デー
タを読取る。読取られた多値画像データは、最適2値化
処理により、該多値画像データをその特徴及び性質を損
なうことなく2値画像データに変換される。即ち、この
最適2値化処理では、多値画像データを入力し、文字・
フィールドセパレータ領域は領域分離、図表・写真領域
はディザ処理(網点処理)を施し、それら両者の画像を
合成する。
【0008】この最適2値化処理により2値化された画
像は、領域分割によって複数のブロックに分割された後
、属性判別処理が行われる。属性判別処理では、領域分
割によって得られた各ブロックに対し、その特徴量とし
て縦横比、面積、及び黒白反転密度(ブロック中での黒
白反転回数/面積)を算出し、これに基づいて領域をフ
ィールドセパレータ、写真、図形、及びその他の文字の
各領域に分類する。
【0009】ところが、この属性判別方法では、最適2
値化処理画像を属性判別の処理対象としているため、前
処理として複雑な最適2値化処理を行うことが必要であ
る。しかも、図と表の判別を行っていないため、文書画
像中の図と表を分離することができなかった。
【0010】本発明は、前記従来技術が持っていた課題
として、前処理を複雑化することなく、しかもレイアウ
トの複雑さにかかわらず、文字(列)、図形、写真、表
、及びフィールドセパレータという5種類の領域に判別
することが困難な点について解決した文書画像の属性判
別方法を提供するものである。
【0011】
【課題を解決するための手段】本発明は前期課題を解決
するために、所定の閾値で単純2値化した文書画像をそ
の構成要素に領域分割した後、該分割された領域に対し
て属性の判別を行う文書画像の属性判別方法において、
第1,第2,第3の処理を実行して前記領域を文字(列
)、図形、写真、表、及びフィールドセパレータの各領
域に判別するようにしている。
【0012】ここで、第1の処理では、前記領域内の黒
画素数、領域外接矩形の縦横比、領域の厚さ、及び領域
の矩形度をそれぞれ求めてそれらに対する閾値と比較す
る。第2の処理では、傾き補正処理により、前記領域外
接矩形の大きさに対する前記領域内での最長黒ランの長
さの比率を求め、それに対応する閾値と比較する。そし
て、第3の処理において、前記領域内の黒白反転密度を
求め、それに対応する閾値と比較する。
【0013】
【作用】本発明によれば、以上のように文書画像の属性
判別方法を構成したので、単純2値化された文書画像は
領域分割された後、その分割された領域が第1の処理へ
送られる。第1の処理では、領域内の黒画素数、領域外
接矩形の縦横比等をそれぞれ求め、さらに対応する閾値
と比較してフィールドセパレータ領域、文字領域(文字
列)、及び写真領域を判別する。第2の処理では、傾き
補正処理を行い、領域外接矩形の大きさに対する領域内
での最長黒ランの長さの比率を求め、それに対応する閾
値と比較して表領域を判別する。
【0014】そして、第3の処理では、領域内の黒白反
転密度を求めてそれに対応する閾値と比較することによ
り、図形領域等を判別する。これにより、前処理の簡単
化と、レイアウトの複雑さにかかわらず、構成要素の的
確な分類が行える。したがって、前記課題を解決できる
のである。
【0015】
【実施例】図2は、本発明の実施例を示すもので、画像
処理の全体の処理内容を示す図である。
【0016】まず、前処理として、単純2値化処理1で
は、イメージセンサ等によって入力文書画像が走査され
、それが適当な閾値で単純2値化されて2値画像が領域
分割処理2へ送られる。領域分割処理2では、2値画像
を入力し、それを文字(列)、図、表、写真、及びフィ
ールドセパレータ等の構成要素に分割して分割領域3を
生成する。この構成要素に領域分割された分割領域3の
データは、本実施例の特徴である属性判別処理4へ送ら
れる。
【0017】前処理の領域分割処理2では、本願出願人
が先に提案した前記分割方法(文献1)や、或いは電子
情報通信学会技術研究報告PRL85−17(1985
−6)辻・浅井著「スプリット検出法に基づく頁画像の
構造解析」P.63−70(文献2)等に記載された種
々の分割方法を用いることができる。
【0018】例えば、文献1の分割方法では、文書画像
データを入力して横方向及び縦方向の操作を2回繰り返
して行い、黒画素の存在しない行及び列で画像を分割し
、文字領域のものに対してはそれらを統合することによ
って構成要素の分割領域3を得るようにしている。
【0019】また、前記文献2に記載された方法では、
文書画像の垂直/水平投影分布を用い、該文書画像を縦
方向及び横方向へブロック分割することを繰り返すこと
により、領域分割を行っている。
【0020】このような分割処理が終わると、属性判別
処理4が行われる。この属性判別処理4では、前処理で
得られた分割領域3に対し、属性の判別を行い、各領域
の属性情報5を出力する。この属性判別処理4の処理内
容を図1に示す。
【0021】図1は、本発明の実施例の属性判別方法を
用いた属性判別処理のフローチャートである。なお、図
中のS10〜S25は、各処理ステップを示す。
【0022】この属性判別処理では、分割領域3のデ―
タを入力すると、領域内の黒画素数を数え、この黒画素
数が閾値T1以下であるか否かを判定する(S10)。 黒画素数が閾値T1以下であれば、この領域を「ゴミ」
領域と判定する(S11)。ここでいう「ゴミ」とは、
実際の文書に付着した汚れや、文書画像入力時にスキャ
ナ面に付着していた汚れによる影等の、文書内容ではな
い黒画素塊である。このような黒画素塊が存在すると、
誤判定を引き起こすおそれがあるので、この「ゴミ」領
域を判別しておく。
【0023】ステップS10において、黒画素数が閾値
T1よりも大きければ、ステップS12において、領域
外接矩形の縦横比を求め、この縦横比が閾値T2よりも
大きいか否か、さらに該領域外接矩形の厚さ(即ち、領
域の高さと幅の内の小さい方をいう)が閾値T3以下で
あるか否かを判定する。縦横比が閾値T2以上で、かつ
厚さが閾値T3以下であれば、この領域をフィールドセ
パレータ領域と判定する(S13)。
【0024】ステップS12において判定結果がノーの
場合、領域の厚さが閾値T4以下であるか否かを判定し
、閾値T4以下であれば、文字領域(文字列)と判定す
る(S15)。ステップS14でノーの場合、領域の矩
形度を次式より求め、その矩形度が閾値T5以上か否か
、さらに該領域の厚さが閾値T6以上か否かを判定する
(S16)。
【0025】矩形度=領域内の黒画素数/領域の外接矩
形の面積(縦画素数×横画素数) ステップS16において、領域の矩形度が閾値T5以上
で、かつ厚さが閾値T6以上であれば、この領域を写真
領域と判定し(S17)、ノーの時にはステップS18
へ進む。
【0026】このような第1の処理が終わると、第2の
処理であるステップS18の傾き補正処理が行われる。 この傾き補正処理では、行方向最長黒ランの長さと列方
向最長黒ランの長さを求め、得られた行方向最長黒ラン
の長さと外接矩形の幅との比が閾値T7以上か否かを判
定する(S19)。閾値T7以上の時には、列方向最長
黒ランの長さと外接矩形の高さとの比が閾値T8以上で
あるか否かを判定し(S20)、閾値T8以上であれば
、この領域を表領域と判定する(S21)。ステップS
19及びS20でノーの場合、第3の処理であるステッ
プS22へ進む。
【0027】ステップS22では、領域内での黒白反転
回数(縦方向及び横方向の黒白反転回数の和)の外接矩
形面積に対する比を求め、その面積比が閾値T9よりも
小さいか否かを判定し、閾値T9未満であれば図形領域
と判定する(S23)。また、ステップS22がノーの
場合、ステップS24において、領域の矩形度が閾値T
10未満か否かを判定し、閾値T10未満であれば、図
形領域と判定し(S23)、閾値T10以上であれば、
ステップS25において、その他の領域の文字領域(独
立文字)と判定する。
【0028】図1の属性判別処理における閾値T1〜T
10は、次のようにして設定される。
【0029】例えば、400dpiの原文書画像の8×
8画素の論理和(OR)演算の結果を1画素に縮小した
50dpiの文書画像を領域分割して得られた各領域に
ついて、属性を判別する際の閾値T1〜T10としては
、「ゴミ」の大きさを4画素以下(T1=4)、フィー
ルドセパレータの縦横比を40以上(T2=40)、厚
さ4mm以下(T3=4)と定義する。さらに、文字列
の厚さは、一般的な文書の本文で用いられている文字の
大きさを考えて5mm以下(T4=5)とするのが適当
である。
【0030】また、その他の閾値の値を求めるため、実
際の前記縮小文書画像において独立文字、図形、写真、
及び表の領域における矩形度、縦横最長黒ランの外接矩
形の高さ、幅に対する比、及び黒白反転密度の分布を調
査した結果を図3〜図5に示す。
【0031】図3は、領域の矩形度の分布を各属性毎に
表した図であるが、写真はほとんど矩形度0.6以上で
あるため、T5=0.6とするのが適当である。
【0032】図4は、各領域において、後述する傾き補
正処理によって得られたx方向(横方向)、及びy方向
(縦方向)に最も長い黒ランの長さの、その領域の外接
矩形の大きさに対する比の分布を各属性毎に表した図で
ある。X座標は行方向最長黒ランの長さの外接矩形の幅
に対する比、Y座標は列方向最長黒ランの長さの外接矩
形の高さに対する比である。図中、tは表領域、cは文
字領域、fは図形領域である。この図4より、表領域に
おいては行方向及び列方向共に大きな値になっており、
閾値T7=0.95、T8=0.95とするのが適当で
ある。
【0033】図5は、独立文字領域と図形領域における
矩形度と黒白反転密度の値の分布図である。X座標は領
域の矩形度、Y座標は黒白反転密度である。図中、fは
図形領域、cは文字領域である。この図5より、閾値T
9=0.2、T10=0.3とするのが適当である。
【0034】図6の(a),(b)は、図1における傾
き補正処理(S18)の概念を説明する図である。
【0035】水平な状態で読込んだ文書画像では、文書
中の水平線を表す黒画素数は同一行上に並ぶが、傾いた
状態で読込んだ文書画像では、傾き具合に応じて水平線
の黒画素数が隣接する行へ移行してゆく。そこで、傾き
補正処理では、このように移行している黒画素数を同一
行上に並べるため、画像の領域内部分における幾つかの
連続する行を、列毎にORを取ることにより得られる1
行に置き換える縮小操作を行う。この処理で1行に置き
換えられる行数は、補正を行う傾き角と領域の大きさに
よって異なるが、例えば傾き許容角を1度程度とすると
、次式で算出されるものとするのが適当である。
【0036】1行に置き換える行数=(領域外接矩形の
幅)×sin1° この処理によって得られる画像において、最も長い行方
向及び列方向の黒ランの長さを、この領域における行方
向の最長黒ランの長さとする。
【0037】列方向にも同様の処理を行う。この時の1
列に置き換えられる列数は、前記同様、次式で算出され
るとするのが適当である。
【0038】1列に置き換える列数=(領域外接矩形の
高さ)×sin1° この処理によって得られる画像において、最も長い列方
向の黒ランの長さを、個の領域における列方向の最長黒
ランの長さとする。
【0039】これらの行方向及び列方向の縮小操作は、
同時に行うこともできる。
【0040】このように、本実施例の属性判別方法では
、単純2値化した文書画像の構成要素を、傾き補正処理
を併用して黒画素数等の特徴量から属性判別を行ってい
るので、該属性判別の前処理が簡単になるばかりか、レ
イアウトの複雑さにかかわらず、該構成要素を5種類(
文字(列)、図形、写真、表、フィールドセパレータ)
に精度よく分類することができる。
【0041】なお、本発明は上記実施例に限定されず、
例えば図1の属性判別処理において、ステップS10,
S11を省略したり、或いは傾き補正処理S18を他の
位置で実行する等、種々の変形が可能である。
【0042】
【発明の効果】以上詳細に説明したように、本発明によ
れば、単純2値化した文書画像の構成要素を用いて属性
判別を行っているので、属性判別処理の前処理が簡単に
なる。しかも、文書画像中の各構成要素を、傾き補正処
理を併用し、領域内黒画素数、領域内黒白反転密度、領
域外接矩形の縦横比、厚さ、領域の矩形度、及び領域外
接矩形の大きさに対する領域内での最長黒ランの長さの
比率を用いて文字(列)、図形、写真、表、及びフィー
ルドセパレータの各領域に判別している。そのため、レ
イアウトの複雑さにかかわらず、文書画像の構成要素を
5種類(文字(列)、図形、写真、表、フィールドセパ
レータ)に簡単かつ精度よく分類することができる。
【図面の簡単な説明】
【図1】本発明の実施例の属性判別方法を示す属性判別
処理の内容図である。
【図2】本発明の実施例を示す画像処理の全体の処理内
容図である。
【図3】矩形度分布図である。
【図4】外接矩形比分布図である。
【図5】矩形度、黒白反転密度分布図である。
【図6】図1中の傾き補正処理の説明図である。
【符号の説明】
1  単純2値化処理 2  領域分割処理 3  分割領域 4  属性判別処理 5  各領域の属性情報

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】所定の閾値で単純2値化した文書画像をそ
    の構成要素に領域分割した後、該分割された領域に対し
    て属性の判別を行う文書画像の属性判別方法において、
    前記領域内の黒画素数、領域外接矩形の縦横比、領域の
    厚さ、及び領域の矩形度をそれぞれ求めてそれらに対す
    る閾値と比較する第1の処理と、傾き補正処理により、
    前記領域外接矩形の大きさに対する前記領域内での最長
    黒ランの長さの比率を求め、それに対応する閾値と比較
    する第2の処理と、前記領域内の黒白反転密度を求め、
    それに対応する閾値と比較する第3の処理とを、実行し
    て前記領域を文字(列)、図形、写真、表、及びフィー
    ルドセパレータの各領域に判別することを特徴とする文
    書画像の属性判別方法。
JP3082704A 1991-04-15 1991-04-15 文書画像の属性判別方法 Expired - Lifetime JP2877548B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3082704A JP2877548B2 (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3082704A JP2877548B2 (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Publications (2)

Publication Number Publication Date
JPH04316178A true JPH04316178A (ja) 1992-11-06
JP2877548B2 JP2877548B2 (ja) 1999-03-31

Family

ID=13781791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3082704A Expired - Lifetime JP2877548B2 (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Country Status (1)

Country Link
JP (1) JP2877548B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7512275B2 (en) 2003-10-21 2009-03-31 Sharp Kabushiki Kaisha Image collating apparatus, image collating method, image collating program and computer readable recording medium recording image collating program
CN118379753A (zh) * 2024-06-25 2024-07-23 万村联网数字科技有限公司 利用ocr技术提取不良资产合同关键信息的方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7512275B2 (en) 2003-10-21 2009-03-31 Sharp Kabushiki Kaisha Image collating apparatus, image collating method, image collating program and computer readable recording medium recording image collating program
CN118379753A (zh) * 2024-06-25 2024-07-23 万村联网数字科技有限公司 利用ocr技术提取不良资产合同关键信息的方法及系统

Also Published As

Publication number Publication date
JP2877548B2 (ja) 1999-03-31

Similar Documents

Publication Publication Date Title
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
US5613016A (en) Area discrimination system for text image
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP4339925B2 (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
EP1081648B1 (en) Method for processing a digital image
JP4392907B2 (ja) 文字切出し方法
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
JP2786355B2 (ja) 文章画像の属性判別方法
JP2003115031A (ja) 画像処理装置および方法
JP2877548B2 (ja) 文書画像の属性判別方法
JPH03126181A (ja) 文書画像の領域分割方法
JP2881066B2 (ja) 文章画像の属性判別方法
JPH0654180A (ja) 画像領域分離装置及び画像領域分離方法
JPS6325391B2 (ja)
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JP3187895B2 (ja) 文字領域抽出方法
JP4261922B2 (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
JPH0540849A (ja) 文書画像の領域抽出方法
JPH03126180A (ja) 画像処理装置
JP3020293B2 (ja) 属性判別方法
JPH0535914A (ja) 画像傾き検出方法
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH10507014A (ja) 2進イメージにおけるランドスケープ・スキャンの自動決定
JPH06103399A (ja) 画像処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990112