JPH03126180A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH03126180A
JPH03126180A JP1264648A JP26464889A JPH03126180A JP H03126180 A JPH03126180 A JP H03126180A JP 1264648 A JP1264648 A JP 1264648A JP 26464889 A JP26464889 A JP 26464889A JP H03126180 A JPH03126180 A JP H03126180A
Authority
JP
Japan
Prior art keywords
circumscribed rectangle
image processing
area
rectangle
photograph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1264648A
Other languages
English (en)
Inventor
Kazuhiro Ishikawa
和弘 石川
Sadamasa Hirogaki
広垣 節正
Yutaka Mazaki
裕 真崎
Shuichi Fujikura
秀一 藤倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1264648A priority Critical patent/JPH03126180A/ja
Publication of JPH03126180A publication Critical patent/JPH03126180A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ファクシミリやテレックス等の通信機器、画
像データベース入力装置等に用いられるもので、画像デ
ータ中に混在する文字、写真、図表等の情報領域を抽出
し、その領域の属性を判別する画像処理装置に関するも
のである。
(従来の技術) 従来、このような分野の技術としては、■特開昭62−
71379号公報、■特開昭61−103372等に記
載されるものがあった。以下、その構成を図を用いて説
明する。
第2図は、前記文献■に記載された従来の画像処理装置
の一構成例を示す構成ブロック図である。
この画像処理装置は、複数ラインからなるラインメモリ
1、レジスタと加算回路からなる累加算回路2a、 2
b、2C1予め定められた閾値と比較する判定回路3a
、3b、3c、3d、3e。
3f、複数段のシフトレジスタ4、ゲート回路5、レジ
スタ回路と加算回路からなる微分回路6a。
6b、ランレングス・カウンタ回路7、ランレングスメ
モリ回路8、及び白ランレングス発生数カウント回路9
で構成されている。
この種の装置では、画像データgが入力されると、その
画像データgがラインメモリ1に記憶される。その後、
累加算回路2aにより主走査方向に黒画素が計数される
。その累加算回路2aの出力が、判定回路3a、微分回
路(5a、及び判定回路3bを順次経る過程で、計数閾
値を越えろラインが検出され、上記計数値が閾値以下の
白ラインが、所定の個数連続する状態を判定して第1.
0頚城切り出しが行われる。
次に、第1の領域切り出し内において、判定回路3bの
出力がゲート回路5、シフトレジスタ4、累加算回路2
b、判定図F1113c、微分回路6b、及び判定回路
3dを順次経るに従い、副走査方向に黒画素が計数され
、その計数値が閾値を越える列が検出され、上記計数値
が閾値以下の自利が、所定の個数連続する状態を判定し
て第2の領域切り出しが行われる。
さらに、第2の領域切り出しと同様の処理により第3の
領域切り出しを行い、続いて第3の領域切り出しと同様
の処理により第4の領域切り出しを行う。そこで、第4
の領域切り出しで検出された領域について、その領域の
ランレングス情報および黒画素率情報により、文字、写
真、図表の領域の属性を判別するものであった。
(発明が解決しようとする課題) しかしながら、上記構成の液晶表示装置では、次のよう
な課題があった。
画像データは、情報襲が多く、すべて多値画像として処
理すると、処理速度が遅くなったり、膨大なメモリが必
要となったりする等の問題が生ずる。
また、単に2値化するだけでは、写真の性買が損なわれ
るので、画像データの特徴、性臂を損なうことなく、2
値画像に変換することが行われる。
その方法は、選定した2値化方式を多値画像における画
像データの特徴から判定して選択的に用いるものである
。従来、この様な処理による最適2値化された画像を入
力画像として領域を分離、抽出、判別する処理を示す内
容は報告されていない。
その上、この最適2値化された画像に対して、上記文献
■、■を含む従来の技術では、領域を分離、抽出したり
、その領域が図表、写真、文字のいずれの属性であるか
を判別する判別基準が不安定であり、しかも、属性判別
精度も満足できるものではなかった。
本発明は、前記従来技術が持っていた課題として、最適
2値化された画像に対して属性の判定基準が不安定であ
る点、十分な属性判別精度が得られない点について解決
しな’fi17t=処理装置を提供するものである。
(課題を解決するための手段) 本発明によれば、前記課題を解決するために、入力され
た画像データ中に存在する情報領域を切り出し、その情
報領域の属性判別処理を行う画1憤処理装置において、
前記画像データに対して最適2値化されな2値画像デー
タに基づきその2値画保データ中の前記情報領域を外接
矩形化して外接矩形の特徴とその外接矩形内の2値画像
の特徴とを検出する外接矩形検出手段と、前記外接矩形
の特徴及びその外接矩形内の21直画像の特徴から前記
情報領域の属性を判別する属性判別手段とを備えたもの
である。
そして、前記外接矩形検出手段は、前記+Fj報領域に
おける複数の白画素及び黒画素の内、黒画素が全く存在
しない所定の閾値以上の白ラインと白カラムとに囲まれ
る前記情報領域を、最小切り出し範囲まで切り出し処理
を繰り返し実行して検出するように構成される。
また、前記外接矩形の特徴を、例えば前記外接矩形の縦
方向の長さ、横方向の長さ、及び面積とし、前記外接矩
形内の2値画像の特徴を、前記白画素から黒画素への反
転回数、黒画素から白画素への反転回数、または白画素
から黒画素及び黒画素から白画素への反転回数としても
よい。
さらに、前記情報領域の属性をフィールドセパレータ、
写真・図表候補、及び文字部とし、前記属性判別手段は
、前記フィールドセパレータの抽出を行うフィールドセ
パレータ抽出手段と、前記写真・図表候補及び文字部の
抽出を行う写真・図表候補文字抽出手段と、前記写真・
図表候補が写真、図表のいずれであるかの判定を行う写
真・図表判定手段とで構成される。
前記外接矩形検出手段の閾値THは、1≦TH≦4(但
し、1.4は画素数)の範囲で設定される。その上、前
記フィールドセパレータ抽出手段は、前記外接矩形にお
ける横及び縦方向の長さの内、長い方と前記閾値γ(γ
;任意の定数)との大小を比較する比較手段と、前記比
較手段の比較結果により横方向LXあるいは縦方向t、
yの長い方が前記閾値γより大きいと判定された前記外
接矩形につき、(LxまたはLy)Xα十β(但し、α
、β:任意の固定値)の値が前記外接矩形の横方向Qx
あるいは縦方向Qyの短い方より大きいときに該外接矩
形を前記フィールドセパレータとして抽出する抽出手段
とで構成される。
前記写真・図表候補文字抽出手段は、前記外接矩形の面
積と前記閾値とを比較し、該面積の方が大きいときに前
記外接矩形を前記写真・図表候補とし、小さいときに文
字部として抽出するように構成され、前記写真・図表判
定手段は、主査方向及び副主査方向の前記白画殿及び黒
画素の反転回数が、S×a+b (但し、S;外接矩形
の面積、a、b;任意の固定値)より大きいときに前記
外接矩形を前記写真として判定し、小さいときに前記図
表として判定して抽出するように構成される。
(作用) 本発明は、以上のように画像処理装置を構成しなので、
外接矩形検出手段は、最適2値化された画像に夕・1し
、例えば閾値TH(1≦TH≦4〉以上の黒画素が全く
存在しない白ライン、白カラムに囲まれる情報領域を、
これ以上切り出しは行えないという所まで処理を繰り3
ヌし行い、その領域を外接矩形化して抽出する。属性判
定手段は、外接足形検出手段で抽出された外接矩形特徴
とその矩形内の特徴から、外接矩形を図表、写真、フィ
ールドセパレータ、文字部に分類する。
したがって、前記課題を解決できるのである。
(実施例) 第1図は、本発明の実施例を示す画像処理装置の構成ブ
ロック図である。
この画像処理装置は、多値画像を最適2値化して2値画
像を得る最適2値化処理手段20と、前記2値画像を入
力して領域の抽出、属性の判別を行う領域抽出・判別処
理手段30とを備え、ディジタル・プロセッサ等で14
代されている。
最適2値化処理手段20は、CCD(Charge  
Coupled  Device)等のイメージセンサ
を有し、そのイメージセンサにより情報媒体を走査して
多値画像を得る読取り部21を備えている。この読取り
部21の出力側には読み収った多値画像を格納するRA
M等の多値画像メモリ22と、その多値画像メモリ22
内のG値画像を最適2値化してその特徴、性質を失うこ
となく、ある程度の画質を持った2値画像に変換する最
適2値化手段23とが、接続されている。さらに最適2
値化手段23の出力側には、その最適2値化手段23で
変換された2値画像を格納二jるRAM等の2値画像メ
モリ24が接続されている。
2値画像メモリ24に格納された2値画イ亀を走査する
領域抽出・判別処理手段30は、最適2値化して得られ
た2値画像を入力!−1その2値画像の情報領域(例え
ば、黒画素領域)を外接矩形化して抽出する外接矩形検
出手段31を備えている。
外接矩形検出手段31の出力側には、その外接矩形検出
手段31で検出された外接矩形の位置を保存するRAM
等の外接矩形位置メモリ32と、前記2値画像の特徴と
その矩形内の特徴から、外接矩形を図表、写真、フィー
ルドセパレータ、文字部(文字を含み、図表、写真、フ
ィールドセパレータ以外の情報領域)に分類する属性判
別手段33とが接続されている。属性判別手段33の出
力側には、図表、写真、フィールドセパレータ、および
文字の属性判定側に外接矩形の位置をそれぞれ保存する
図表位置メモリ34、写真位置メモリ35、フィールド
セパレータ36、および文字位置メモリ37が順次接続
されている。
以上のように構成される画像処理装置の動作(1)〜(
[I)を、第3図〜第7図を参照しつつ説明する。
(I>  最適2値化処理手段20の動作読取り部21
は、情報媒体を走査して多値画像を出力画、それを多値
画像メモリ22に格納する。
この読取り部21での読取り解像度は、細かい程よく、
8本/mm以上の解像度が適当である。最適2値化手段
23は、多6α画舷メモリ22内の多値画像データを読
み込み、その多値画像データにおいて局所領域での濃度
差分値の絶対値の大きさから、中間調画像部分と非中間
調画像部分とに分類する。この最適2値化手段23ては
、非中間調画像部分と判別した場合は、単純に固定量値
て2値化(単純2値化)を行い、一方、中間調画像部分
と判別した場合は、デイザ法で2値化を行1・、2値画
像を生成する。これらの最適2値化処理は、例えば、前
記文献■に記載された方法等で実行すればよい。
以上の最適2値化処理により、文字、図表といった非中
間調画像部分は、白と黒の堺のエツジ部分のくっきりと
した画像となり、一方、写真等の中間調画像部分は、新
聞等で見られるデイザ法となり、これらが合成されであ
る程度の画質の2値画像が得られる。この2値画像は、
2値画像メモリ24に格納される。
(II>  外接矩形検出手段31の動(?最適2値化
手段23によって得られた2値画像メモリ24中の2値
画像データの主査方向をX軸方向とし、副走査方向をY
軸方向とする。
以下、第3図および第4図を参考し、外接矩形検出手段
31の動作を説明する。
第3図は第1図中の外接矩形検出手段31の動作例を示
すフローチャート、および第4図は、外接矩形検出手段
31を説明する図である。なお第3図中の850〜S6
7は処理ステップを示し、第3図および第4図中のiは
階層、mはX方向に切り出された領域番号、nはY方向
に切り出された領域ばんごうである。また、第4図中の
40は背景パターン、41は情報領域(黒画素領域)で
ある。
先ず、第3図の350〜S52において、i。
n、mをそれぞれ初期値1に初期化する。
そして、領域の始点座標(XS (i−1,m>。
YS (i−1,n> ) 、終点座標(Xe (i−
1゜m)、Ye (i−1,n))に対して、Y軸方向
の領域をn個の領域に切り出す処置を行う(S53)。
この切り出し処理について、第5図F)Y方向の切り出
し処理を説明する図を用いて説明する。
始点座標(XS (i−1,m>、YS (i−Ln)
)、終点座標(Xe (i−1,m)、Ye(i−1,
rr))で示される背景パターン40上の情報領域41
に対して、X方向に黒画素が1つでも存在する黒ライン
を検出する。その黒ラインのY座標値を始点Y座標とし
て抽出し、次いでX方向に黒画素が1つも存在しない白
ラインか連続して閾値THを越える白ラインを検出する
。その日ラインの(TH+1>前の黒ラインのYa’、
a値を終点Y座標値どして抽出する。ここで、中間λH
1濃度情報が、例えば1画素当たり4ビツト(10階調
)に量子化されているす4合、解像度の点から、閾(a
Tr(の値は1〜4画像の範囲で設定することが適当て
°ある。
以上の操作を領域!X5(i  1.m)、YS(i−
1,n))、(Xe (i−1,m)、Ye(i−1,
n))の全ての)°座標について行い、n個の領域(X
S (i−1,rn) 、 YS (i−1゜n))、
(Xe (i−1,m)、Ye (i−1゜n)) (
但し、n:正の整数)を切り出す。このとき、領域(X
S (0,m>、YS (0,n))、(Xe (0,
m)、Ye (0,n))は、初期値として予めセット
しておくが、その値は2値画像データの全領域を示す。
検出された連続する白ラインの数が閾値THを越えない
間に黒ラインを検出した場合は、上下の領域は同領域と
判断し、処理の継続を連続する白ラインが閾値を越える
まで繰り返し行う。また、黒ラインのY座標値がYe(
i−1,n)と等しくなる場合は、Ye(i−1,n>
を終点Y座標値として抽出し、Y座標値がYe (i−
1,n>となったら処理を終了する。
このようにして、領域(XS (i−1,m)。
YS (i−1,n))、(Xe (i−1,、m) 
Ye (i−1,n>)に対して、Y方向に切り出され
た上記のn個の領域について、そのn個の始点、終点Y
座標を外接矩形位置メモリ32に保存する(S54)。
第4図に示すi=1の時のnの値が1.2.3で示され
る)′方向に切り出された領域がその処理結果例を示す
次に、第3図の853でY方向に切り出されたn個の領
域について以下の処理を行う。先ず、初期値でnの値を
1として初期化する(S55)。
そして領域始点座標(XS (i−1,m)、YS(i
、n>)、終点座標(Xe (i−1,m>。
Ye (i、n>)に対し〔、X軸方向について領域を
複数個(m個)の領域に切り出す処理を行う(S56)
。この切り出し処置について、第6図のX軸方向の切り
出し処置を説明する図を用いて説明する。
始点座標及び終点座標で示される背景パターン40上の
情報領域41に対して、Y方向にW画素が1つでも存在
する黒カラノ、を検出し、その黒カラムのX座韻値を始
点X座標として抽出する。次いで、Y方向に黒画素が1
つでも存在しない自刃ラムが連続して閾値THt!−越
える白カラムを検出し、その白カラムの(TH−i−1
>前の黒カラムのX座標値を終点X座標値として抽出す
る。ここで、閾値THの値は1〜4画素の範囲で設定す
る。
以上の操作を領域(XS (i−1,m>、YS(i、
n>1、(Xe (i−1,m)、Ye (i。
n))の全てのX座標について行い、m個の領域(XS
 (i、m)、YS (i、n)I、(Xe(i、m)
、Ye (i、n))(但し、m:正の整数)を切り出
す(S56)。この時、検出された連続する白カラムの
数が閾値THを越えない間に黒カラムを検出した場合は
、左右の領域は同領域と判断し、処理の継続を連続する
白カラムが閾値THを越えるまで繰り返し行う。また、
黒カラムのX座標値がXe(i−L、n)と等しくなる
場合は、Xe(i−1,n)を終点X座標値として抽出
し、X座標値がYe(i−1,n)となったら処理を終
了する。
このようにして、領域(XS (i−1,m>。
YS (i、n))、(Xe (i−1,m)、Ye(
i、n))に対して、X方向に切り出された上記のm個
の領域について、そのm個の始点、終点X座標を外接矩
形位置メモリ32に保存する(S32)。第4図に示す
i=l、n=1の時のmの値が1.2で示されるX方向
に切り出された領域がその処理結果例を示す。
以上の手順で処理を行い、階層iにおけるmの値とnの
値がそれぞれ1.1のみであっt:場合(858)、領
域始点座標(XS (i、m)、YS(i、n))、終
点座標!Xe (i、m)、Ye(i、n))を外接矩
形領域として抽出しく559)、その始点、終点座捏を
外接矩形位置メモリ32に保存する(860)。次いで
、この階層の値を減分しくS61 ) 、Ward i
番目のすl、てのnについて行ったか否かを判定する(
S62)。
もし全てのnについて行っていれば、次に階層i番目の
全てのmについて行ったか否かを判定しく863)、も
し全てのmについて行っていれば、この第3図の全ての
処理を終了する(864)、一方、S58でノーの場合
、階層iの値を増分しく567) 、続いてS52の処
理に戻る。まな、S62でノーの場合、nの値を増分し
く S (15>、S56の処理に戻り、同様に363
でノーの場合、mの値を減分しく566) 、853に
戻る。
以上が外接矩形検出手段の一連の処理であり、第4図に
示すような階層的手段を用いて処理を行う。要するに、
閾値TH以上の白ライン、白カラムに囲まれる領域を、
これ以上の切り出しはないという段階まで処理を繰り返
しを行い、最終的に切り出された領域(2値画像データ
の全領域)を外接矩形として検出し、その全ての外接矩
形の位置を示す始点座標、終点座標を外接矩形位置メモ
リ32に保管するものである。
(III)  属性判別手段33の動作属性判別手段3
3は、外接矩形位置メモリ32の内容を読み出し、検出
された外接矩形の全てについて、その外接矩形特徴とそ
の矩形内の特徴とからフィールドセパレータ、写真、図
表、及び文字部の4つの領域に分類する処理を行う。
この処理の一例を第7図に示す。第7図は、第1図の属
性判別手段33の動作フローチャー1・である。なお、
全ての外接矩形を(XSj、YSj )(Xej、Ye
j)(但し、j;正の整数)で表す。
まず、jの値をそれぞれの初期値を1として初期化する
(S70)。次いで、外接矩形(XSj。
YSJ)、(Xej、Yej)について、フィードセパ
レータを抽出する処理を行う(S71)。
その外接矩形がフィードセパレータとして判断されない
場合は、写真及び図表候補の抽出を行う(872)。そ
こで、その外接矩形が写真及び図表候補と判定された場
合は、写真及び図表の判定を行う処理に入る(373)
。その結果、入力した外接矩形が写真であると判別され
た場合、その外接矩形の始点・終点座標を写真位置メモ
リ3ヲに保存する(S74)。−ノj、図表であると判
別された外接矩形については、図表位置メモリ34に保
存する(S75)。さらに、すべての外接矩形(XSj
、YSj)、(Xej、Yej)について行ったか否か
を判定しく576)、全ての外接矩形について行ったと
判定された時、この処理は終了する(S77)。876
でノーの場合は、jの値を増分しく578) 、次に8
71の処理に戻る。S71の処f里て′、フィールドセ
パレータとして判定されたら、その外接矩形の始点、終
点座標をフィールドセパレータ位置メモリ36に保存し
く579) 、S76の処理を行う。また、ステップ7
2の処理で写真、図表候補と判定されない場合、その外
接矩形の始点、終点座標を文字部位置メモリ37に保存
しく580) 、次に876の処理を行う。
以上が属性判別手段33の一連の動作であるが、第8図
〜第15図を参照しつつ、S71、S72、S73につ
いて詳細に説明する。
第8図は、S71のフィールドセパレータの抽出の動作
の一例を示すフローチャート、第9図は、外接矩形のX
軸長さに対するY軸長さの関係図である。
第9図に示すように、フィールドセパレータはX軸の長
さがγ以上で、Y=αχ+β(但し、α。
β;ある固定値、X;X軸の長さ)で表される境界線よ
りY軸の長さが小さいという条件で抽出が可能であるこ
とが分かる。
以上の条件に従い、第8図に示される手順でフィールド
セパレータの抽出を行う。
まず、外接矩形(XSj、YSj )、(Xe J I
Yej)を入力して(S90)、X軸の長さxien、
Y軸の長さYlenを求める(S91>。
X軸の長さX1enは、Xej−XSj+1により、Y
軸の長さY l e rrは)’ej−YSj+1によ
り求める。そして、得られたY 1 e nとX1en
とを比較して(S92) 、X1enの方力法きい場合
、X1enが閾値γより大きいか判定する(893)。
大きいと制定された場合、次にX1en×a+βの値を
求め、’r’ l e nの長さがその求めた値よりも
小さいと判定された場合(S 94 >、この外接矩形
をフィールドセパレータと判定しく595) 、処理を
終了する(S96>。S92のノーの場合、893と同
様にYlenが閾(直γより大きいか判定する(S97
)。S97のイエス場合、次に894と同様にYl e
n×a+βの値を求め、X1enの長さがその求めた値
よりも小さいと判定された場合(S98) 、次にステ
ップS95の処理を行う。
S93、S94、S97.898が、それぞれノーの場
合、処理を終了する(S96>。
第10図は、第7図の372の動作の一例を示す写真・
図表の判定のフローチャートであり、第11図は、解像
度8本/mのときの外接矩形面積に対するその矩形内の
縦方向、横方向の白から黒への反転回数を示す関係図で
ある。
第11図の横軸が示すように、文字部と図表・写真とを
外接矩形の面積の大小で判別可能である。
そこで、この特徴を基に第10図に示される手段で図表
・写真候補の抽出を行う。
第7図の871でフィールドセパレータとして抽出され
なかった外接矩形(XSj、’r’Sj)、(Xej、
Yej)を入力して(S100)、続いて第8図の89
1で求めたX軸の長さX1enとY軸の長さYlenと
の積により外接矩形の面積Sを求める(Slot)。得
られた面積Sが閾値Cよりも小さい場合(S102>、
この外接矩形を文字部と判定しく3103)、処理を終
了する(S104>。5102で面積Sが閾値Cよりも
大きい場合、この外接矩形は図表・写真候補と判定され
(S105)、処理を終了する(S104)。
第12図は、第7図の373の写真・図表の判定の動作
の一例を示すフローチャートである。
S72の処理で図表・写真候補と判定され、かつ抽出さ
れた外接矩形について、これを写真あるいは図表のいず
れでるかを判定する処理を什う。
第11図に示すように、面積Sが閾値Cより大きい外接
矩形に関して(面積Sが閾値Cより小さい外接矩形に関
しては372により除かれている)、Y=aX+b (
但し、a、l):ある固定値、X;面積S)で表される
境界線より白から黒の反転回数が大きいか、あるいは小
さいかにより、写真あるいは図表の判定ができる。
第13図は、外接矩形面積に対するその矩形内の黒画素
数の関係図である。
従来の文字、図表、写真の属性の判別手段として、面積
とその矩形内の黒画素数に基に、黒画素率を求めその大
小で属性判別を行っている方法が多かった。しかし、本
実施例で用いた最適2値化された画像に対して処理した
場合、第13図に示すような結果が得られ、写真と図表
とを判別する判別基準の設定が困難にである。したがっ
て、第11図の特徴を利用して第12図に示す動作手順
によって写真と図表との判別を行う。
第7図の872で写真・図表候補と判定された外接矩形
(XSj、YSj)、(Xej、Yej)を入力して(
S110)、先ず、カウントを0にしてカウントを初期
化する(Sill)。そして、2値画像データ中のYS
jからYejに走査しつつ順次XSjからXejに走査
する過程において、白から黒へ反転したらカウントを増
分する(S112)。これは、第14図の説明図から明
らかなように、各YについてX方向に矢印の方向に走査
し、白から黒(パターンAからヘパターンB)へ反転し
たらカウントを増分するものである。さらに、同2値画
像データ中のXSjからXejに走査しつつ、順次YS
jからYejに走査する過程において、白から黒へ反転
したらカウントを増分する(8113)。これは、第1
5図の説明図から明らかなように、各XについてY方向
に矢印の方向に走査し、白から黒(パターンAからヘパ
ターンB)へ反転したらカウントを増分するものである
続いて、第10図の8101で求めた外接矩形の面積S
から、S X a + bの値を求め、5112゜51
13て゛得られたカウントのイie;がその求めた1直
よりも大きいと判定された場合(Sl 14) 、この
外接矩形は写真であると判定され(S115>、処理を
終了する(S116)。5114でカウント値が小さい
と判定されたら、この外接矩形は図表であると判定され
(SL、17)、処理を終了する(S116)。
本実施例は次のような利点がある。
(イ) 第11図に示す境界線Y=aX+bは、b=o
のとき、面積Sに対する反転回数の比が、ある閾値より
も大きいか、あるいは小さいかにより図表と写真との判
別する。面積Sと反転回数との関係は第11図に示す通
りになり、a、bにある固定数を持たせた境界線Y=a
X十すを境界線(閾値)とすることにより、−層、判別
精度を高めることができる。
(ロ) 外接矩形j*出出段段1により、最適2値1ヒ
された画像に対し、例えば閾値TH(1≦TH≦4)以
上の黒画素が全く存在しない白ライン、白カラムに囲ま
れる情報領域を、これ以上切り出しは行えないという所
まで処理を繰り返し行い、その領域を外接矩形化して抽
出し、属性判定手段33により、外接矩形検出手段31
で抽出された外接矩形特徴とその矩形内の特徴から、外
接矩形を図表、写真、フィールドセパレータ、文字部に
分類するようにしたので、入力画像が最適21直化され
た2値画像に対して適用することができ、属性判別精度
の向上が期待できる他、さらに高速処理が可能で、構成
が簡単化する。
(ハ) 従来、フィールドセパレータを判別するには、
X軸の長さとY軸の長さとの比がある関係よりも大きい
か、それとも小さいかで判別することが行われていた。
これは、Y=αχ十βに示すβが0で示される場合と同
様となる。ところが、外接矩形のX軸の長さとY軸の長
さとの関係は、第9図の示す通りになり、α、βにある
固定値を持たせたY=αχ十βを境界線(閾値)とする
ことにより、さらに判別制度を高めることができる。
なお、本発明は、図示の実施例に限定され9゛、種々の
変形が可能である。その変形例としては、例えば、次の
ようなものがある6 (a)  本実施例では、横長のフィールドセパレータ
についてのみについて記述しているが、縦長のフィール
ドセパレータの場合も考えられる6(b)  本実施例
では、第10図に示す8103を設けたが、省略しても
よい。なぜなら外接矩形の情報は外接矩形位置メモリ3
2に保存されており、その中からフィールドセパレータ
、写真、及び図表と判別される外接矩形が抽出されれば
、残りの情報が文字部の外接矩形と判断できるからであ
る。
(C)  本実施例では、第12図の3112,311
3において、白画素から黒画素へ反転したらカウントを
増分するとしたが、黒画素から白画素または白画素から
黒画素及び黒画素から白画素へ反転したら増分するとし
てもよい。
(発明の効果) 以上詳細に説明したように、本発明によれば、外接矩形
検出手段により、最3i1f2値化された画像に対し、
例えば閾値TH(1≦TH≦4)以上の黒画素が全く存
在しない白ライン、白カラムに囲まれる情報領域を、最
小切り出し範囲まで処理を繰り返し行い、その領域を外
接矩形化して抽出し、さらに属性判定手段により、外接
矩形検出手段で抽出された外接矩形特徴とその矩形内の
特徴から、外接矩形を図表、写真、フィールドセパレー
タ、文字部に分類するようにしたので、入力画像が最適
2値化された2値画像に対して適用することができ、属
性判別精度の向上が期待できる他、さらに高速処理が可
能で、構成が簡単化する。
【図面の簡単な説明】
第1図は本発明の実施例を示す画像処理装置の機能ブロ
ック図、第2図は従来の画像処理装置の機能ブロック図
、第3図は第1図の外接矩形検出手段のフローチャート
、第4図は第1図の外接矩形検出手段を説明する図、第
5図は第3図のY方向切り出し処理を説明する図、第6
図は第3図のX方向切り出し処理を説明する図、第7図
は第1図の属性判別手段のフローチャート、第8図は第
7図のフィールドセパレータの抽出のフローチャート、
第9図は外接矩形のX軸長さに対するY軸長さの関係図
、第10図は第7図の写真・図表候補の抽出のフローチ
ャー1・、第11図は外接矩形面積に対する反転回数の
関係図、第12図は第7図の写真・図表の判定のフロー
チャート、第13図は外接車形面積に対する黒画素数の
関係図、第14図は第12図の8112を説明する図、
第15図は、第12図の8113を説明する図である。 31・・・・・・外接矩形検出手段、33・・・・・・
属性判別手段、34・・・・・・図表位置メモリ、35
・・・・・・写真位置メモリ、36・・・・・・フィー
ルドセパレータ位置メモリ、37・・・・・・文字部位
置メモリ。

Claims (1)

  1. 【特許請求の範囲】 1、入力された画像データ中に存在する情報領域を切り
    出し、その情報領域の属性判別処理を行う画像処理装置
    において、 前記画像データに対して最適2値化された2値画像デー
    タに基づきその2値画像データ中の前記情報領域を外接
    矩形化して外接矩形の特徴とその外接矩形内の2値画像
    の特徴とを検出する外接矩形検出手段と、 前記外接矩形の特徴及びその外接矩形内の2値画像の特
    徴から前記情報領域の属性を判別する属性判別手段と、 を備えたことを特徴とする画像処理装置。 2、請求項1記載の画像処理装置において、前記外接矩
    形検出手段は、 前記情報領域における複数の白画素及び黒画素の内、黒
    画素が全く存在しない所定の閾値以上の白ラインと白カ
    ラムとに囲まれる前記情報領域を、最小切り出し範囲ま
    で切り出し処理を繰り返し実行して検出する構成にした
    両像処理装置。 3、請求項1記載の画像処理装置において、前記外接矩
    形の特徴を、 前記外接矩形の縦方向の長さ、横方向の長さ、及び面積
    とし、 前記外接矩形内の2値画像の特徴を、 前記白画素から黒画素への反転回数、黒画素から白画素
    への反転回数、または白画素から黒画素及び黒画素から
    白画素への反転回数とした画像処理装置。 4、請求項1記載の画像処理装置において、前記情報領
    域の属性をフィールドセパレータ、写真・図表候補、及
    び文字部とし、 前記属性判別手段は、 前記フィールドセパレータの抽出を行うフィールドセパ
    レータ抽出手段と、前記写真・図表候補及び文字部の抽
    出を行う写真・図表候補文字抽出手段と、前記写真・図
    表候補が写真、図表のいずれであるかの判定を行う写真
    ・図表判定手段とで構成した画像処理装置。5、請求項
    2記載の画像処理装置において、前記外接矩形検出手段
    の閾値THを、 1≦TH≦4(但し、1、4は画素数)に設定したこと
    を特徴とする画像処理装置。 6、請求項4記載の画像処理装置において、前記フィー
    ルドセパレータ抽出手段は、 前記外接矩形における横及び縦方向の長さの内、長い方
    と前記閾値γ(γ;任意の定数)との大小を比較する比
    較手段と、 前記比較手段の比較結果により横方向Lxあるいは縦方
    向Lyの長い方が前記閾値γより大きいと判定された前
    記外接矩形につき、(LxまたはLy)×α+β(但し
    、α、β:任意の固定値)の値が前記外接矩形の横方向
    Qxあるいは縦方向Qyの短い方より大きいときに該外
    接矩形を前記フィールドセパレータとして抽出する抽出
    手段とで構成した画像処理装置。 7、請求項4記載の画像処理装置において、前記写真・
    図表候補文字抽出手段は、 前記外接矩形の面積と前記閾値とを比較し、該面積の方
    が大きいときに前記外接矩形を前記写真・図表候補とし
    、小さいときに文字部として抽出する構成にした画像処
    理装置。 8、請求項4記載の画像処理装置において、前記写真・
    図表判定手段は、 主査方向及び副主査方向の前記白画素及び黒画素の反転
    回数が、S×a+b(但し、S;外接矩形の面積、a、
    b;任意の固定値)より大きいときに前記外接矩形を前
    記写真として判定し、小さいときに前記図表として判定
    して抽出する構成にした画像処理装置。
JP1264648A 1989-10-11 1989-10-11 画像処理装置 Pending JPH03126180A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1264648A JPH03126180A (ja) 1989-10-11 1989-10-11 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1264648A JPH03126180A (ja) 1989-10-11 1989-10-11 画像処理装置

Publications (1)

Publication Number Publication Date
JPH03126180A true JPH03126180A (ja) 1991-05-29

Family

ID=17406274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1264648A Pending JPH03126180A (ja) 1989-10-11 1989-10-11 画像処理装置

Country Status (1)

Country Link
JP (1) JPH03126180A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1051025A1 (en) * 1998-01-23 2000-11-08 Sharp Kabushiki Kaisha Image processing device and image processing method
US6268935B1 (en) 1994-04-15 2001-07-31 Minolta Co., Ltd. Image processor
US6437881B1 (en) 1997-10-15 2002-08-20 Fuji Xerox Co., Ltd. Image processing apparatus and image processing method
JP2007079587A (ja) * 2006-10-05 2007-03-29 Sharp Corp 画像処理装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6268935B1 (en) 1994-04-15 2001-07-31 Minolta Co., Ltd. Image processor
US6437881B1 (en) 1997-10-15 2002-08-20 Fuji Xerox Co., Ltd. Image processing apparatus and image processing method
EP1051025A1 (en) * 1998-01-23 2000-11-08 Sharp Kabushiki Kaisha Image processing device and image processing method
EP1051025A4 (en) * 1998-01-23 2006-09-27 Sharp Kk IMAGE PROCESSING DEVICE AND METHOD
US7283683B1 (en) 1998-01-23 2007-10-16 Sharp Kabushiki Kaisha Image processing device and image processing method
EP1887781A1 (en) * 1998-01-23 2008-02-13 Sharp Kabushiki Kaisha Image processing device and method for adaptive edge enhancement
JP2007079587A (ja) * 2006-10-05 2007-03-29 Sharp Corp 画像処理装置

Similar Documents

Publication Publication Date Title
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP2001060247A (ja) 画像処理装置および画像処理方法
JPH05227425A (ja) 自動画像セグメンテーションの改良
JPH03126180A (ja) 画像処理装置
JP4132766B2 (ja) 画像処理装置および方法
JPH03126181A (ja) 文書画像の領域分割方法
JP4322041B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体
JPH03233786A (ja) 画像分割処理装置
JPH08221512A (ja) 画像処理装置及びその方法
JP2786355B2 (ja) 文章画像の属性判別方法
JPH0540849A (ja) 文書画像の領域抽出方法
JP2877548B2 (ja) 文書画像の属性判別方法
JP3850488B2 (ja) 文字抽出装置
JP2881066B2 (ja) 文章画像の属性判別方法
JPH02253383A (ja) 画像処理装置
JPH0535914A (ja) 画像傾き検出方法
JPH03125569A (ja) 画像2値化装置
JPH09238253A (ja) 画像処理装置及びその方法
JPH08221515A (ja) 画像処理装置
JPH03153167A (ja) 文字領域分離方式
JPH0432984A (ja) 画像2値化装置
JPH02195774A (ja) 多値画像の2値化方式
JPH0540848A (ja) 文書画像の領域抽出方法
JPH0646253A (ja) 文書画像の領域抽出方法
JP3210224B2 (ja) 文字認識装置