JPH04316180A - 文書画像の属性判別方法 - Google Patents

文書画像の属性判別方法

Info

Publication number
JPH04316180A
JPH04316180A JP3082706A JP8270691A JPH04316180A JP H04316180 A JPH04316180 A JP H04316180A JP 3082706 A JP3082706 A JP 3082706A JP 8270691 A JP8270691 A JP 8270691A JP H04316180 A JPH04316180 A JP H04316180A
Authority
JP
Japan
Prior art keywords
image
area
attribute
reduced
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3082706A
Other languages
English (en)
Inventor
Naohiro Amamoto
直弘 天本
Sadamasa Hirogaki
広垣 節正
Akitoshi Tsukamoto
明利 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3082706A priority Critical patent/JPH04316180A/ja
Publication of JPH04316180A publication Critical patent/JPH04316180A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ファクシミリ等の通信
機器や文書画像データベース入力装置、光学的文字読取
り装置(OCR)等において、文書画像中の写真領域及
び図表領域といった属性を判別する文書画像の属性判別
方法に関するものである。
【0002】
【従来の技術】従来、この種の属性判別方法としては、
例えば特開昭62−71379号公報に記載されるもの
があった。
【0003】この文書画像の属性判別方法では、文書画
像データを入力し、主走査方向(例えば、横方向)に黒
画素を計数(カウント)して閾値を超えるラインを検出
し、該カウント値が閾値以下の白ラインが所定個数連続
する状態を判定して第1の領域切り出しを行う。この第
1の領域切り出し内で、副走査方向(例えば、縦方向)
に黒画素をカウントしてカウント値が閾値を超える列を
検出し、カウント値が閾値以下の白列が所定個数連続す
る状態を判定して第2の領域切り出しを行う。さらに、
第2の領域切り出し内で、第1の領域切り出しと同様な
処理により、第3の領域切り出しを行い、この第3の領
域切り出し内で、第2の領域切り出しと同様な処理によ
り、第4の領域切り出しを行う。そこで、この第4の領
域切り出しで検出された領域について、その領域のラン
レングス情報、及び黒画素率情報により、文字領域、写
真領域、図表領域等の属性を判別している。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
属性判別方法では、次のような課題があった。
【0005】(a)従来の属性判別方法では、領域切り
出し処理において、対象に応じて様々な閾値を任意に設
定する必要がある。例えば、個々の論文誌に対して領域
切り出しを行う場合、それらの閾値を各論文誌に応じた
適切な値に設定し直さなければならず、その値の選定に
手間がかかる。そのため、領域切り出し処理後に行う属
性の判別処理の効率が低いという問題があった。
【0006】(b)前記(a)の問題を解決するため、
本願出願人は、先に特願平1−264649号明細書に
おいて属性判別方法を提案した。この提案では、最適2
値化処理によって2値化された2値画像データについて
、入力時の解像度の文書画像に対して領域抽出を行い、
その抽出された領域の属性を判別することにより、前記
(a)の問題を解決している。ところが、この方法では
、領域抽出処理を入力時の解像度の文書画像について行
うため、処理時間が膨大になるという問題があり、短い
処理時間で、比較的簡単に、領域の属性を判別すること
が困難であった。
【0007】本発明は、前記従来技術が持っていた課題
として、短い処理時間で、比較的簡単に、領域の属性を
判別することが困難な点について解決した文書画像の属
性判別方法を提供するものである。
【0008】
【課題を解決するための手段】前記課題を解決するため
に、第1の発明は、文書画像の属性判別方法において、
文書画像を多値画像データの形で読み取り、該多値画像
データをその特徴及び性質を失うことなく最適2値化し
て2値画像を作成し、2値画像縮小処理によって前記2
値画像を縮小して縮小画像を作成した後、その縮小画像
から領域抽出処理で特定領域を抽出し、該特定領域の属
性を属性判別処理で判別するようにしている。
【0009】第2の発明は、第1の発明の2値画像縮小
処理を、間引き処理によって前記2値画像を縮小するよ
うにしている。
【0010】第3の発明は、第1の発明の2値画像縮小
処理を、画素間の論理和(OR)処理によって前記2値
画像を縮小するようにしている。
【0011】第4の発明は、第2の発明の属性判別処理
を、白黒反転回数によって写真領域の属性判別を行うよ
うにしている。
【0012】第5の発明は、第3の発明の2値画像縮小
処理において、演算のビット単位数に応じた縮小率で前
記2値画像を縮小するようにしている。
【0013】第6の発明は、第5の発明の属性判別処理
を、前記特定領域内に占める黒画素の割合によって写真
領域の属性判別を行うようにしている。
【0014】
【作用】第1の発明によれば、以上のように文書画像の
属性判別方法を構成したので、入力文書画像が多値画像
データの形で読み取られると、その多値画像データが最
適2値化されて2値画像が作成され、その2値画像が2
値画像縮小処理へ送られる。2値画像縮小処理では、2
値画像を縮小して縮小画像を作成する。領域抽出及び属
性判別では、縮小画像を用いて特定領域の抽出及びその
抽出された領域のフィールドセパレータ領域、写真領域
、図表領域、文字領域等といった属性の判別を行う。 これにより、領域抽出及び属性判別処理量の削減化が図
れる。
【0015】第2の発明では、最適2値化された2値画
像が2値画像縮小処理へ送られると、該2値画像縮小処
理では、例えば、縮小の割合に応じたマスクを用い、そ
の中のある注目画素の情報を縮小画像の情報として取り
出すことにより、縮小画像を作成する。これにより、縮
小率に左右されない縮小処理が行える。
【0016】第3の発明によれば、2値画像縮小処理に
おいて、例えばマスクを用いてその中に黒画素が1つで
も存在すれば縮小画像の対応する画素を黒にし、1つで
も存在しなければ白とすることにより、縮小画像を作成
する。これにより罫線等の細い線の的確な縮小処理が行
える。
【0017】第4の発明によれば、間引き処理によって
作成された縮小画像が属性判別処理へ送られると、該属
性判別処理では、白黒反転回数により写真領域の判定を
行い、その判定処理の簡単化を図る。
【0018】第5の発明によれば、2値画像縮小処理に
おいて、演算のビット単位数に応じた縮小率で2値画像
を縮小する。この縮小率を装置のビット単位数に対応さ
せることにより、ビット演算の省略化を図る。
【0019】第6の発明によれば、OR処理によって作
成された縮小画像が属性判別処理へ送られると、該属性
判別処理では、特定領域内に占める黒画素の割合によっ
て写真領域の属性判別を行い、その判別処理の簡単化を
図る。
【0020】
【実施例】例えば、森健一監修、電子情報通信学会編「
パターン認識」P.64にも記載されているように、文
字認識を行うには16本/mmの解像度が必要であるが
、文書画像を領域抽出するには行間がつぶれていない程
度の画像でよいため、それほどの解像度を必要としない
。従って、入力時の画像を縮小したものに領域抽出処理
を施しても、十分な結果が得られることになる。このよ
うな原理に基づき、本実施例では、次のようにして属性
判別方法を構成している。
【0021】図1は、本発明の実施例の属性判別方法に
おける処理内容を示す図である。
【0022】文書画像の属性判別を行うには、まず、読
取り処理1において、CCD(Charge  Cou
pled  Device)等のイメージセンサにより
、入力文書画像を走査して多値画像データを読み取り、
それを多値画像メモリ2へ格納する。
【0023】最適2値化処理3では、多値画像メモリ2
に格納された多値画像データに対してその特徴及び性質
を損なうことなく最適2値化して2値画像データを作成
し、その2値画像データを2値画像メモリ4へ格納する
。この最適2値化処理では、多値画像データを入力し、
文字・フィールドセパレータ領域は領域分離、図表・写
真領域はディザ処理(網点処理)を施し、それら両者の
画像を合成する処理を行う。つまり、最適2値化処理3
では、入力多値画像データにおいて、注目画素を中心と
した局所領域での濃度差分値の絶対値の大きさから、非
中間調画像部分と中間調画像部分とに分類する。 そして、非中間調画像部分と判別された場合、注目画素
を固定閾値によって2値化し、一方、中間調画像部分と
判定された場合、注目画素をディザマトリクス閾値によ
って2値化する。
【0024】このような最適2値化処理3が行われると
、文字領域及び図表領域といった非中間調画像部分は、
白と黒の境のエッジ部分のくっきりとした画像となり、
写真領域等の中間調画像部分は、新聞等で見られるディ
ザ画像となり、これらの合成2値画像として得られる。 この合成2値画像のデータは、2値画像メモリ4に格納
される。
【0025】次に、2値画像縮小処理5では、2値画像
メモリ4に格納された2値画像データをOR等の処理に
よって縮小し、その縮小画像を2値縮小画像メモリ6に
格納し、この縮小画像について領域抽出処理7及び属性
判別処理8が行われる。
【0026】領域抽出処理7では、2値縮小画像メモリ
6に格納された縮小画像を用い、その縮小画像の情報領
域(例えば、黒画素領域)を外接矩形化して特定領域を
抽出する。この抽出処理は、例えば次のようにして実行
される。
【0027】2値画像メモリ4に格納された2値画像デ
ータを、例えば主走査方向(横方向)X及び副走査方向
(縦方向)Yに走査する。そして、2値画像データの全
領域において、横方向Xに黒画素が1つでも存在する黒
ラインを検出し、次に黒画素が1つも存在しない白ライ
ンが閾値th以上連続するまでの領域を切り出す(ステ
ップST1)。今度は、その切り出された領域において
、縦方向Yに黒画素が1つでも存在する黒カラムを検出
し、黒画素が1つも存在しない白カラムが閾値th以上
連続するまでの領域を切り出す(ステップST2)。
【0028】さらに、その切り出された領域において、
前記と同様に、ステップST1とステップST2を繰り
返し実行し、これ以上の切り出しが行えないという所ま
で、繰り返し処理を続ける。そして、最終的に切り出さ
れた領域を外接矩形として検出し、その位置を示す始点
座標及び終点座標を属性判別処理8へ送る。
【0029】属性判別処理8では、領域抽出処理7で抽
出された外接矩形、及び2値縮小画像メモリ6に格納さ
れた縮小画像の外接矩形特徴とその矩形内の特徴から、
外接矩形をフィールドセパレータ領域、写真領域、図表
領域、及びその他の文字領域に分離する。
【0030】図1における2値画素縮小処理5には、次
の2通りの方法が考えられ、その方法を図2〜図4を参
照しつつ説明する。
【0031】図2は、図1中の2値画像縮小処理5にお
いて、間引きによる2値画像の縮小方法の一例を示す図
である。図3は、図2の問題点を示す図であり、間引き
による縮小のために細い線が消えてしまう例である。
【0032】図2に示すように、間引き処理により、2
値画像10の画像縮小を行う場合、その縮小の割合に応
じたマスク(1/2縮小の時は2×2,1/3縮小の時
は3×3)を用意する。そしてそのマスク内のある注目
画素の情報を縮小画像10aの情報として取り出すよう
にしている。
【0033】但し、この縮小方法では、図3に示すよう
に、罫線等の細い線が消える可能性があるが、これらの
無い文書であれば、問題はない。また、この縮小方法で
は、処理内容が縮小率に左右されないため、どのような
縮小率にも対応できるという利点がある。
【0034】この間引き処理方法によって縮小された縮
小画像10aを用いて領域抽出を行い、その領域抽出結
果について例えば写真領域の属性判別を行う場合は、外
接矩形内部を走査し、白画素から黒画素、黒画素から白
画素への反転回数により写真領域の判別を行うようにす
れば、簡単に写真領域の判別ができる。
【0035】図4は、図1中の他の2値画像縮小処理5
の内容を示すもので、画素間のORによる2値画像の縮
小の一例を示す図である。
【0036】OR処理により、2値画像10の画像縮小
を行う場合、まず、間引きの場合と同様にマスクを用意
する。そして、このマスクの中に黒画素が1つでも存在
すれば、縮小画像10bの対応する画素を黒にし、1つ
でも存在しなければ白とする。このOR処理による縮小
方法は、罫線等の細い線が消えることがなく、これらが
多数存在するような文書には適している。このOR処理
による画像縮小をソフトウェアとして実現する際には、
例えば、2値画像10を1/8に縮小すると、ビット演
算が不要となり、高速に縮小処理が行える。また、4ビ
ット単位で演算を行う装置では1/4縮小、16ビット
単位で演算を行う装置では1/16縮小した方が、ビッ
ト演算が不要になって高速に縮小処理ができる。
【0037】このようなOR処理で縮小した縮小画像1
0bを用い、例えば写真領域の属性判別を行う場合、外
接矩形内部に占める黒画素の割合で判別を行うと、簡単
に写真領域を判別できる。この属性判別処理の一例を図
5に示す。
【0038】図5は、図1においてOR処理による縮小
画像を用いた場合の属性判別処理8の処理内容を示すフ
ローチャートである。
【0039】この属性判別処理では、ステップS20に
おいて、図1中の2値画像メモリ4に格納された2値画
像データを入力する。次に、ステップS21において、
2値画像メモリ4に格納された属性判別すべき領域の外
接矩形の始点座標(XSi,YSi)及び終点座標(X
Ei,YEi)を入力する。ここで、Xは主走査方向(
横方向)、Yは副走査方向(縦方向)であり、座標番号
iはi=1,2,…,nである。  ステップS22に
おいて、入力した外接矩形の縦HI(=YEi−YSi
+1)と横WD(=XEi−XSi+1)との縦横比W
D/HIが、ある固定閾値th1より大きいか否かを比
較する。外接矩形の縦横比WD/HIが固定閾値th1
よりも大きければ、その外接矩形をステップS23でフ
ィールドセパレータ領域と判定する。
【0040】外接矩形の縦横比WD/HIが固定閾値t
h1よりも小さければ、文字・写真・図表候補領域とす
る。この文字・写真・図表候補領域については、ステッ
プS24で、その外接矩形領域の面積WD×HIを求め
、該面積WD×HIがある固定閾値th2よりも大きい
か否かを比較する。大きければ、写真・図表候補領域と
判定し、ステップS25へ進む。小さければ、ステップ
S31で文字領域と判定する。
【0041】ステップS24で写真・図表候補領域と判
定された場合には、ステップS25において、外接矩形
の始点座標(XSi,YSi)及び終点座標(XEi,
YEi)における内部の2値画像を1/n縮小する。次
に、ステップS26で、縮小画像に該当する外接矩形の
始点座標(XSi/n,YSi/n)及び終点座標(X
Ei/n,YEi/n)を算出した後、ステップS27
で、該外接矩形内について縮小画像を横方向X及び縦方
向Yに走査し、該外接矩形内部に占める全黒画素数TO
をカウントする。そして、ステップS28で、全黒画素
数TOが外接矩形の面積に占める割合を計算し、その割
合がある固定閾値th3よりも大きいか否かを比較する
【0042】割合が固定閾値th3よりも大きければ、
ステップS29で、外接矩形領域を写真領域と判定する
。割合が固定閾値th3よりも小さければ、ステップS
30で、外接矩形領域を図表領域と判定する。これによ
り、属性判別処理を終了する。
【0043】この属性判別処理では、ステップS25で
縮小画像を作成し、ステップS26,S27で、その縮
小画像を走査する等の処理により、写真領域と図表領域
とを判別するようにしている。そのため、走査を行う処
理も縮小画像に対して行い、全面走査する回数も1回で
よいため、写真領域と図表領域との判別が簡単になり、
その上、縮小処理量が少なくなって高速な属性判別処理
が可能となる。
【0044】なお、本発明は上記実施例に限定されず、
例えば、図1中の領域抽出処理7は外接矩形抽出処理以
外の処理方法を用いて領域の抽出を行ったり、それに応
じて属性判別処理8を他の処理方法で構成する等、種々
の変形が可能である。
【0045】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、最適2値化した2値画像を2値画像縮小処理
で縮小し、その縮小画像を用いて領域抽出及び属性判別
を行うようにしているので、領域抽出処理量及び属性判
別処理量が削減され、それによって短い処理時間で、し
かも簡単かつ適確に、領域の属性を判別することができ
る。
【0046】第2の発明によれば、間引き処理によって
画像を縮小するようにしているので、処理内容が縮小率
に左右されず、どのような縮小率にも対応できる。
【0047】第3の発明によれば、OR処理によって画
像を縮小しているので、罫線等の細い線が消えることが
なく、これらが多数存在するような文書画像の縮小を的
確に行うことができる。
【0048】第4の発明によれば、間引き処理によって
縮小された画像を用い、白黒反転回数により写真領域の
属性判別を行うようにしているので、簡単かつ的確に写
真領域の判別を行うことができる。
【0049】第5の発明によれば、第3の発明において
、演算のビット単位数に応じた縮小率で2値画像を縮小
するので、装置のビット単位数と縮小率とを対応させる
ことにより、装置のビット演算が不要となり、高速に縮
小処理ができる。
【0050】第6の発明によれば、OR処理によって縮
小された画像を用い、特定領域内に占める黒画素の割合
によって写真領域の属性判別を行うようにしているので
、簡単かつ的確に写真領域を判別できる。
【図面の簡単な説明】
【図1】本発明の実施例の属性判別方法における処理内
容を示す図である。
【図2】図1中の2値画像縮小処理を説明する図である
【図3】図2の問題点を説明する図である。
【図4】図1中の他の2値画像縮小処理を説明する図で
ある。
【図5】図1中の属性判別処理の内容を示すフローチャ
ートである。
【符号の説明】
1    読取り処理 3    最適2値化処理 5    2値画像縮小処理 7    領域抽出処理 8    属性判別処理

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】  文書画像を多値画像データの形で読み
    取り、該多値画像データをその特徴及び性質を失うこと
    なく最適2値化して2値画像を作成し、2値画像縮小処
    理によって前記2値画像を縮小して縮小画像を作成した
    後、その縮小画像から領域抽出処理で特定領域を抽出し
    、該特定領域の属性を属性判別処理で判別することを特
    徴とする文書画像の属性判別方法。
  2. 【請求項2】  請求項1記載の文書画像の属性判別方
    法において、前記2値画像縮小処理は、間引き処理によ
    って前記2値画像を縮小する文書画像の属性判別方法。
  3. 【請求項3】  請求項1記載の文書画像の属性判別方
    法において、前記2値画像縮小処理は、画素間の論理和
    処理によって前記2値画像を縮小する文書画像の属性判
    別方法。
  4. 【請求項4】  請求項2記載の文書画像の属性判別方
    法において、前記属性判別処理は、白黒反転回数によっ
    て写真領域の属性判別を行う文書画像の属性判別方法。
  5. 【請求項5】  請求項3記載の文書画像の属性判別方
    法において、前記2値画像縮小処理では、演算のビット
    単位数に応じた縮小率で前記2値画像を縮小する文書画
    像の属性判別方法。
  6. 【請求項6】  請求項5記載の文書画像の属性判別方
    法において、前記属性判別処理は、前記特定領域内に占
    める黒画素の割合によって写真領域の属性判別を行う文
    書画像の属性判別方法。
JP3082706A 1991-04-15 1991-04-15 文書画像の属性判別方法 Pending JPH04316180A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3082706A JPH04316180A (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3082706A JPH04316180A (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Publications (1)

Publication Number Publication Date
JPH04316180A true JPH04316180A (ja) 1992-11-06

Family

ID=13781850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3082706A Pending JPH04316180A (ja) 1991-04-15 1991-04-15 文書画像の属性判別方法

Country Status (1)

Country Link
JP (1) JPH04316180A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216944A (ja) * 2002-01-23 2003-07-31 Fujitsu Ltd 画像結合装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216944A (ja) * 2002-01-23 2003-07-31 Fujitsu Ltd 画像結合装置

Similar Documents

Publication Publication Date Title
US8155445B2 (en) Image processing apparatus, method, and processing program for image inversion with tree structure
US5179599A (en) Dynamic thresholding system for documents using structural information of the documents
US6393150B1 (en) Region-based image binarization system
US8208744B2 (en) Image processing apparatus capable of accurately and quickly determining character part included in image
Bhattacharjya et al. Data embedding in text for a copier system
JP2009032299A (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
US5467410A (en) Identification of a blank page in an image processing system
JP4132766B2 (ja) 画像処理装置および方法
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
AU4207400A (en) Intelligent detection of text on a page
JPH04316180A (ja) 文書画像の属性判別方法
JP3020293B2 (ja) 属性判別方法
JPH03126181A (ja) 文書画像の領域分割方法
EP1229497B1 (en) Run length based connected components and contour following for enhancing the performance of circled region extraction algorithm
JPH08237404A (ja) 光学文字認識モードの選択方法
JP2877548B2 (ja) 文書画像の属性判別方法
JPS6331825B2 (ja)
JPH06150059A (ja) 像域分離装置
JPH0540849A (ja) 文書画像の領域抽出方法
JPH05128306A (ja) 文章画像の属性判別方法
JP2853140B2 (ja) 画像領域識別装置
JPH0660220A (ja) 文書画像の領域抽出方法
JPH05282489A (ja) 文章画像の属性判別方法
JPH0530349A (ja) 文書画像の2値画像生成方法
KR100214337B1 (ko) 혼재문서의 이치화방법

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000215