JPH03233786A - 画像分割処理装置 - Google Patents

画像分割処理装置

Info

Publication number
JPH03233786A
JPH03233786A JP2030832A JP3083290A JPH03233786A JP H03233786 A JPH03233786 A JP H03233786A JP 2030832 A JP2030832 A JP 2030832A JP 3083290 A JP3083290 A JP 3083290A JP H03233786 A JPH03233786 A JP H03233786A
Authority
JP
Japan
Prior art keywords
circumscribed rectangle
image
area
character part
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2030832A
Other languages
English (en)
Inventor
Kazuhiro Ishikawa
和弘 石川
Setsumasa Hirogaki
広垣 節正
Yutaka Mazaki
裕 真崎
Shuichi Fujikura
秀一 藤倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2030832A priority Critical patent/JPH03233786A/ja
Publication of JPH03233786A publication Critical patent/JPH03233786A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ファクシミリやテレックス等の通信機器、画
像データベース入力装置または光学式文字読取装置等に
用いられるもので、画像データ中に混在する文字、写真
、図表等の情報領域を抽出し、その領域の属性を判別す
る画像分割処理装置に関するものである。
(従来の技術) 従来、この様な分野の技術としては、文献1:吹抜著r
FAX、OAのための画像信号処理」初版(昭57−1
O−20)日刊工業新聞社、P。
5−25、及び文献2:特開昭62−71379号公報
等に記載されるものがあった。以下、その構成を図を用
いて説明する。
第2図は、前記文献2に記載された従来の画像分割処理
装置の一構成例を示す構成ブロック図である。
この画像処理装置は、複数ラインからなるラインメモリ
1、レジスタと加算回路からなる累加0四M32a、2
b、2c、予め定められた閾値と比較する判定回路3a
、3b、3c、3d、3e。
3f、複数段のシフトレジスタ4、ゲート回路5、レジ
スタ回路と加算回路からなる微分回路6a。
6b、ランレングス・カウンタ回路7、ランレングスメ
モリ回路8、及び白ランレングス発生数カウント回路9
で構成されている。
この種の方法では、画像データgが入力されると、その
画像データgがラインメモリ1に記憶される。その後、
累加算回路2aにより主走査方向に黒画素が計数される
。その累加算回路2aの出力が、判定回路3a、微分回
路6a、及び判定回路3bを順次経る過程で、計数闇値
を越えるラインが検出され、上記計数値が閾値以下の白
ラインが、所定の個数連続する状態を判定して第1の領
域切り出しが行われる。
次に、第1の領域切り出し内において、判定回路3bの
出力がゲート回路5、シフトレジスタ4累加算回路2b
、判定回路3C1微分回n6b、及び判定回路3’dを
順次経るに従い、副走査方向に黒画素が計数され、その
計数値が閾値を越える列が検出され、上記計数値が閾値
以下の0列が、所定の個数連続する状態を判定して第2
の領域切り出しが行われる。
さらに、第2の領域切り出しと同様の処理により第3の
領域切り出しを行い、続いて第3の領域切り出しと同様
の処理により第4の領域切り出しを行う。そこで、第4
の領域切り出しで検出された領域について、その領域の
ランレングス情報および黒画素率情報により、文字部、
写真部、図表部の領域の属性を判別していた。
(発明が解決しようとする課題〉 しかしながら、上記構成の画像分割処理装置では、次の
ような課題があった。
(1)通常、文字データは情報量が多く、全て多値画像
データで処理すると処理速度が遅くなったり、膨大なメ
モリを要したりする (2)単に2値化された画像に対して、分離・抽出され
た領域が図表、写真、文字等のいずれの属性であるかを
判定する判定基準が不安定であるため、十分満足のいく
精度が得られない。この問題は、上記構成の従来技術だ
けではなく、他の従来技術についても生ずる。
(3〉領域を分割する際に、対象に応じて様々な閾値を
任意に設定する必要がある。例えば、個々の論文誌に対
して領域分割処理を施す場合、それらの閾値を各論文誌
に応じた適当な値に設定し直さなければならなず、その
値の選定に手間を要する。
本発明は、前記従来技術が持っていた課題として、処理
速度が低減したり膨大なメモリを要する点、満足な属性
判別精度が得られない点、閾値の選定に手間を要する点
について解決した文書画像の領域分割方法を提供するも
のである。
(課題を解決するための手段) 本発明は前記課題を解決するために、文字部を含む属性
(例えば、文字部、フィールドセパレータ、写真、図表
〉を有する多値画像の情報領域(例えば、黒画素領域)
を切り出し、該属性の判別処理を行う画像分割処理装置
において、前記多値画像を入力して擬似中間調画像及び
単純2値化画像を生成する2値化手段と、前記擬似中間
調画像及び単純2値化画像から前記情報領域を外接矩形
として検出する外接矩形検出手段と、前記外接矩形検出
手段により検出された外接矩形の前記属性を判別する属
性判別手段と、前記属性判別手段属性により前記文字部
と判別された外接矩形から演算によって所定の闇値を設
定し、その設定された閾値に従って該外接矩形の統合を
行って文字部領域を生成、抽出する文字部統合手段とを
備えたものである、 さらに、前記属性判別手段は、例えば前記外接矩形の特
徴とその外接矩形内の擬似中間調画像の特徴とを用いて
前記属性を判別する構成にしたものである。
また、前記文字部統合手段は、前記文字部と判別された
外接矩形から外接矩形ヒストグラムを作成し、その作成
結果からカラム方向に該外接矩形が全く存在しないカラ
ム方向無存在領域と少なくとも1つでも存在するカラム
方向存在領域とを抽出すると共に、ライン方向に対して
前記外接矩形が全く存在しないライン方向無存在領域と
少なくとも1つでも存在するライン方向存在領域とを抽
出する領域抽出手段と、前記領域抽出手段の抽出結果か
ら前記文字部の横書きまたは縦書きの判定を行う判定手
段と、前記判定手段の判定結果に従ってライン方向及び
カラム方向の統合閾値を算出し、その算出結果に従い、
文字部と判別された外接矩形を統合して文字部領域を生
成、抽出する領域生成手段とで構成したものである。
(作用〉 本発明によれば、以上のように画像分割処理装置を構成
したので、2値化手段は、中間調濃度を画素を含む多値
画像を入力して擬似中間調2値化処理により擬似中間調
画像を、単純2値化処理により単純2値化画像をそれぞ
れ生成する。外接矩形検出手段は、前記擬似中間調画像
及び単純2値化画像から、例えば所定の閾値以上の白ラ
イン、白カラムに囲まれる情報領域をこれ以上切り出し
は行えないというところまで処理を繰り返し、最終的に
切り出された領域を外接矩形として検出する。属性判別
手段は、外接矩形手段で検出された外接矩形を情報領域
の属性であるフィールドセパレータ、写真、図表、及び
文字部(文字の他に図表、写真、フィールドセパレータ
以外のものを含む)に判別する。文字部統合手段は、属
性判別手段により文字部と判別された外接矩形から演算
によって自動的に所定の閾値を設定し、その設定された
闇値に従って該外接矩形をこれ以上統合するものはない
というところまで繰り返し統合し、文字部領域を生成、
抽出する。
したがって、前記課題を解決できるのである。
(実施例) 第1図は、本発明の実施例を示す画像分割処理装置の機
能ブロック図である。
この画像分割処理装置は、CCD (Charge  
Coupled  Device)等イメージセンサに
より情報媒体を走査して多値画像を得る読取部10を備
えている。この読取部10の出力側には読み取った多値
画像を格納するRAM (ランダム・アクセス・メモリ
〉等の多値画像メモリ20と、その多値画像を2値化し
て領域分割を施す領域分割処理部30とで、構成されて
いる。
領域分割処理部30はディジタル・シグナル・プロセッ
サ等で構成され、多値画像メモリ20内多値画像を入力
してデイザ画像(擬似中間調画像)及び単純2値画像の
2つの画像を生成する2値化手段31と、その生成され
た2つの2値画像から情報領域(黒画素領域)を外接矩
形化して抽出する外接矩形検出手段32と、抽出された
外接矩形特徴とその矩形内のデイザ画像の特徴から外接
矩形を図表、写真、フィールドセパレータ、文字部(文
字の他に図表、写真、フィールドセパレータ以外のもの
を含む)に分類する属性判別手段33と、分類された結
果、文字部と判別された外接矩形から自動的に適当な閾
値を設定し、その設定された閾値に従って文字部と判別
された外接矩形を統合することによって文字部領域を生
威し抽出する文学部統合手段34とを備えている。文学
部統合手段34は、カラム方向無存在領域、カラム方向
存在領域、ライン方向無存在領域、及びライン方向存在
領域を抽出する領域抽出手段34−1と、文字部の横書
きまたは縦書きの判定を行う判定手段34−2と、文字
部領域を生成、抽出する領域生成手段34−3とで構成
されている。
さらに、領域分割処理部30には、2値化手段31で生
成されたデイザ画像、単純2値化画像をそれぞれ保存す
るデイザ画像メモリ31a及び単純2値化画像メモリ3
1bと、外接矩形検出手段32で検出された外接矩形の
位置情報を保存する外接矩形位置メモリ32aと、属性
判別手段33で属性別に外接矩形の位置情報を保存する
図表領域位置メモリ33a、写真領域位置メモリ33b
、及びフィールドセパレータ位置メモリ33cと、文学
部統合手段34で文字部と判別された外接矩形を統合す
ることによって文字部領域を生威し抽出した結果の位置
情報を保存する文字部領域位置メモリ34aとを備え、
これら位置メモリがRAM等で構成されている。
次に、以上のように構成される画像分割処理装置の動作
を第3図〜第19図を参照しつつ説明する。
(I>読取部10から2値化手段31までの動作読取部
〕0は、情報媒体を走査して多値画像を出力し、それを
多値画像メモリ20に格納する。
この読取部10での読取り解像度は、綱がい程よく、8
本/ITIm以上の解像度が適当である。2値化手段3
1は、多値画像メモリ20内の多値画像データを読み込
み、擬似的に中間調を表現するためのデイザ法2値化処
理(擬似中間調2値化処理)と、非中間調を表現するた
めの単純2値化処理とを行い、その結果得られた2値化
画像をそれぞれデイザ画像メモリ31a及び単純2値化
画像メモリに保存する。
(II)外接矩形検出手段32の動作 2値化手段31によって得られたデイザ画像メモリ31
a及び単純2値化画像メモリ中の2つの2値画像の主査
方向をX軸方向とし、副走査方向をy軸方向とする。以
下、第3図〜第5図を参考し、外接矩形検出手段32の
動作を説明する。
第3図は、第1図中の外接矩形検出手段32の動作例を
示すフローチャート及び第4図は外接矩形手段を説明す
る図である。なお、第3図中の850〜S67は処理ス
テップを示し、第3図及び第4図中のiは階層、mはX
方向に切り出された領域番号、nはX方向に切り出され
た領域番号である。また、この外接矩形検出手段32に
おいては、第5図のOR画像を説明する図に示すように
、デイザ画像メモリ31a中のデイザ画像と単純2値画
像メモリ31b中の単純2値画像の黒画素パターン(記
号;1)のOR画像を走査することにより行う。
先ず、第3図の850〜S52において、i。
n、mをそれぞれ初期値1に初期化する。そして、領域
の始点座標(xs (i−1,m> 、 ys (i丁
、nil終点座標(xe (i−1,m>。
ye (i−1,n))に対して、第4図のステップ1
の示すように、y軸方向の領域をn個の領域に切り出す
処置を行う(853)。この切り出し処理について、第
6図のX方向の切り出し処理を説明する図を用いて説明
する。始点座標(xs(i−1,m>、ys (i−1
,n> )、終点座標(xe (i−1,m) 、 y
e (i−1,n) )で示される背景パターン40上
の情報領域41に対して、第5図に示すOR画像中にX
方向に黒画素が1つでも存在する黒ラインを検出する。
その黒ラインのy座標値を始点y座標として抽出し、次
いでX方向に黒画素が1つも存在しない白ラインが連続
して閾値THを越える白ラインを検出する。その注目す
る白ラインの(TH+1>ライン前の黒ラインのy座標
値を終点y座標値として抽出する。以上の操作を領域(
xs (i−1,m)。
ys (i−1,n>)、(xe (i−1,m)。
ye (i−1,n>)の全てのy座標について行い、
n個の領域(xs (i−1,m)、ys (i。
n))、(xe (i−1,m)、ye (i、n>)
(但し、n;正の整数)を切り出す。このとき、領域(
xs (0,1>、ys (0,1>)、(Xe (0
,1>、ye (0,1>)の領域は、初期値として予
めセットしておき、これはOR画像の全領域を示す。さ
らに、検出された連続する白ラインの数が閾値THを越
えない間に黒ラインを検出した場合は、上下の領域は同
領域と判断して処理の継続を行い、連続する白ラインが
閾値THを越えるまで繰り返し行う。また、黒ラインの
X座標値がye(i−1,n)と等しくなる場合は、y
e(i−1,n>を終点X座標値として抽出し、X座標
値がye(i−1,n>となったら処理を終了する。こ
のようにして、領域(xs (i−1゜m>、ys (
i−1,n))、(xe (i−1゜m>、ye (i
−1,n))に対して、X方向に切り出されたn個の領
域(xs (i−1,m)。
ys (i、n))、(xe (i−1,m>、ye(
i、n))(但し、nは正の整数〉は、そのn個の始点
、終点y座標の情報を外接矩形位置メモリ32aに保存
する(S54)。第4図のステップ1に示すi=1の時
のnの値が1.2.3で示される領域がその処理結果例
を示す。
次に、第3図の853でX方向に切り出されたn個の領
域(xs (i−1,m)、ys (i、n))、(x
e (i−1,m>、ye (i、n>)(但し、nは
正の整数)について以下の処理を行う。先ず、nの値を
初期化する(nの初期値=1(S55))。そして領域
始点座標(xs(i−1、m)、ys (i、n>)、
終点座標(xe(i−1,m>、ye (i、n))に
対して、第4図に示すステップ2のように、X軸方向に
ついて領域を複数個(m個)の領域に切り出す処理を行
う(S56)。この切り出し処置について、第7図のX
軸方向の切り出し処置を説明する図を用いて説明する。
上記始点座標及び終点座標で示される領域に対して、第
5図のOR画像中にX方向に黒画素が1つでも存在する
環カラムを検出し、その環カラムのX座標値を始点X座
標として抽出する。次いで、X方向に黒画素が1つでも
存在しない白カラムが連続して閾値THを越える白カラ
ムを検出し、その注目する白カラムの(TH+1’)カ
ラム前の環カラムのX座標値を終点X座標値として抽出
する。
以上の操作を領域(xs (i−1,m)、ys(i、
n))、(xe (i−1,m)、ye (i。
n>)の全てのX座標について行い、m個の領域(xs
 (i、m)、ys (i、n))、(xe(i、m)
、ye (i、n))(但し、m;正の整数)を切り出
す(S56)。
さらに、検出された連続する白カラムの数が閾値THを
越えない間に環カラムを検出した場合は、左右の領域は
同領域と判断して処理の継続を行い、連続する白カラム
が閾値THを越えるまで繰り返し行う。また、環カラム
のX座標値がxe(i−1、m〉と等しくなる場合は、
xe(i−1,m)を終点X座標値として抽出し、X座
標値がxe(i−1,m)となったら処理を終了する。
このようにして、領域(xs (i−1,m)。
ys (i、n)l、(xe (i−1,m) 、 y
e(j、n>)に対して、X方向に切り出されたm個の
領域(xs (i、m)、ys t’i、n>)、(x
e (i、m>、ye (i、n))は、そのm個の始
点、終点X座標値の情報を外接矩形位置メモリ32aに
保存する(S57)。第4図のステップ2に示すi=l
の時のmの値が1.2.3で示される領域がその処理結
果例を示す。なお、閾値THの値は1〜4画素の範囲で
設定することが妥当である。
以上の切り出し方法で処理を行い、第4図のステップ3
,4のように、階層iにおけるmの値とnの値がそれぞ
れ1.1のみとなるように処理を繰り返し行う。そこで
、階層iにおけるmの値とnの値がそれぞれ1、■のみ
であった場合(S58〉、領域始点座標(xs (i、
1)、ys (i。
1))、終点座標(xe ci、1)、ye (i。
1))を外接矩形領域として抽出しく559)、その始
点、終点座標を外接矩形位置メモリ32aに保存する(
S60)。次いで、この階層の値を減分しく561)、
階層i番目のすべてのnについて行ったか否かを判定す
る(S62)。もし全てのnについて行ったと判定され
たら、次に階層i番目の全てのmについて行ったか否か
を判定しく363)、もし全てのmについて行っていれ
ば処理を終了する(S64)。一方、358てソーの場
合、階層iの値を増分しく567) 、S52の処理に
戻る。また、S62でノーの場合、nの値を増分しく5
65)、S56の処理に戻り、同様に363てソーの場
合、mの値を減分しく566)、353に戻る。以上が
外接矩形検出手段32の一連の処理であり、第4図に示
す要領で順次処理を繰り返す。要するに、閾値TH以上
の白ライン、白カラムに囲まれる情報領域を、これ以上
の切り出しはないという段階まで処理を繰り返しを行い
一1最終的に切り出された領域を外接矩形として検出し
、外接矩形位置メモリ32aに保管するものである。
(III)属性判別手段33の動作 外接矩形検出手段32で画像の全領域について外接矩形
の検出を行い、すべての外接矩形の位置を示す始点座標
、終点座標を外接矩形位置メモリ32 aに保存される
と、次に、属性判別手段33によって、検出さhf、−
外接矩形の全てについて、その外接矩形特徴とその矩形
内のデイザ画像の特徴とから、フィールドセパレータ、
写真、図表、及び文字部の4つの属性に分類する処理が
行われる。この処理の一例を第8図に示す。第8図は、
第1図の属性判別手段33の動作フローチャートである
。なお、全ての外接矩形を(xsi、ysi)、(xe
i、yei)(但し、i;正の整数)で表す。
まず、iの値を初期化する(iの初期値−1)(S70
)、次いで、外接矩形(xsi、ysi)(xei、y
ei)について、フィールドセパレータを抽出する処理
を行う(S71)。その外接矩形がフィールドセパレー
タとして判定されない場合は、写真・図表候補の抽出を
行う(S72)。そこで、その外接矩形が写真・図表候
補と判定さhた場合は、その抽出した外接矩形が実際に
写真であるか、あるいは図表であるかを矩形内のデイザ
画像の特徴から判定し、抽出する処理を行う(373)
。その結果、入力した外接矩形が写真であると判別され
た場合、その外接矩形の始点・終点座標を写真領域位置
メモリ33bに保存する(S74)。一方、図表である
と判別された場合は、その外接矩形の始点・終点座標を
図表領域位置メモリ33aに保存する(S75)。さら
に、すべての外接矩形(xsi、ysi)、(xe i
 。
yei)について行ったか否かを判定しく576)、全
ての外接矩形について行ったと判定された時、この処理
は終了する(S77)。S76でノーの場合は、iの値
を1、増分しく878) 、次にS71の処理に戻る。
S71の処理で、フィールドセパレータとして判定され
たら、その外接矩形の始点、終点座標をフィールドセパ
レータ位置メモリ33cに保存しく579)、S76の
処理を行う。また、S72の処理で写真、図表候補と判
定されず、文字部と判定されたら、376の処理を行う
以上が属性判別手段33の一連の動作であるが、さらに
、第9図〜第15図を参照しつつ、S71゜S72、S
73について詳細に説明する。
第9図は、S71のフィールドセパレータの抽出の動作
の一例を示すフローチャート、第10図は、外接矩形の
X軸長さに対するX軸長さの関係図である。なお、第1
0図における○印は図表、Δ印は写真、目印は文字部、
及びX印はフィールドセパレータを表している。
第10図で明らかなように、外接矩形のX軸及びy軸の
長さの大小及びそれらの比でフィルドセパレータを抽出
することができる。つまり、X軸の長さが7以上で、y
=αX+β(但し、α、β;ある固定値、X:X軸の長
さ)で表される境界線よりy軸の長さが小さいという条
件でフィルドセパレータの抽出が可能となる。
ここで、境界線y=αχ+βについて説明する。
従来、この種の判別方法は、X軸の長さとy軸の長さと
の比がある閾値よりも大きいとき、ティーるどせばれ−
たとして抽出するという方法であった。この方法は、y
−αX+βで示すβの値に0を代入した場合と同様にな
る。ところが、外接矩形のX軸の長さとy軸の長さとの
関係は、第10図で示す通りであり、αとβにある固定
値を持たせたy=αX+βを境界線(閾値〉とすること
により、より抽出精度を高めることができる。また、第
10図に示すフィールドセパレータは横長のみの例であ
るが、縦長のものも考えられる。以上の特徴を基に、第
9図に示される手順でフィールドセパレータの抽出を行
う。
先ず、外接矩形(xsi、ysi>、(xeiyei)
を入力して(S90>、X軸の長さX1enとy軸の長
さylenを求める(S91)。
X軸の長さxlenは、(xe i −xs i+1 
>により、y軸の長さylenは、(yei−ysi+
1〉により求める。そして、得られたxlenとyle
nとを比較して(392> 、xlenの値が大きい場
合、xlenが閾値γより大きいか判定する(393)
。大きいと判定された場合、次にxlenXα+βの値
を求め、ylenの値がその求めた値よりも小さいと判
定された場合(S94) 、この外接矩形(xsi、y
si)、(xei、yei)をフィールドセパレータと
判定しく595)、処理を終了する(S96>。S92
のノーの場合、ylenが閾値γより大きいか判定する
(S97)。S97のイエス場合、次にylenXα+
βの値を求め、xlenの値がその求めた値よりも小さ
いと判定された場合(S98)、次にステップS95の
処理を行う。
S93、S94、S97、S98が、それぞれノーの場
合、この外接矩形(xsi、ysi)、(xei、ye
i)を文字部と判定しく599)、処理を終了する(S
96>。
第■1図は、第8図の372の動作の一例を示す写真・
図表候補の抽出の動作フローチャートであり、第12図
は外接矩形面積に対するその矩形内のデイザ画像におけ
る縦方向、横方向の白から黒への反転回数を示す関係図
である。
第12図の横軸が示すように、外接矩形の面積の大小で
写真・図表候補として、ある程度、判別可能である。そ
こで、この特徴を基に第11図に示される方法で図表・
写真候補の抽出を行う。
第8図の371で文字部と判定された外接矩形(xsi
、ysi)、(xei、yei)を入力して(S100
)、続いて第9図の891で求めたX軸の長さxlen
とy軸の長さylenとの積により、この外接矩形の面
積Sを求める(Stol)。得られた面積Sが閾値Cよ
りも大きい場合(S102)、この外接矩形を図表・写
真候補と判定しく3103)、処理を終了する(SiO
2〉。5102で面積Sが閾値Cよりも小さい場合、こ
の外接矩形を文字部と判定しく5105)。
処理を終了する(S104)。
第13図は、第8図の373の写真・図表の判定の動作
の一例を示す動作フローチャートである。
S72の処理で図表・写真候補と判定され、抽出された
外接矩形に対して、その抽出した外接矩形が実際に写真
なのか、または図表なのかを外接矩形内に位置するデイ
ザ画像メモリ31a中のデイザ画像を走査し、その得ら
れた特徴から判別する処理を行う。これは、上述した第
12図の説明で明白であるように、外接矩形の面積Sが
閾値Cより大きいと判定された写真・図表候補の外接矩
形に関して、y=ax+b (a、b ;任意の固定値
、X;面積S)で表される境界線より白から黒への反転
回数が大きいか否かで、写真であるのか、または図表で
あるのかが判定できる。そこで、第13図に従って、そ
の判定を行う。
第8図の372で写真・図表候補と判定、抽出された外
接矩形(xsi、ysi)、(xe i 。
yei)を入力して(SLio>、先ず、カウントを初
期化する(カウントの初期値−〇)<Si20)。そし
て、デイザ画像メモリ31a中のデイザ画像のysiか
らyeiに走査しつつ、順次、xsiからxeiに走査
する過程において、白から黒へ反転したらカウントをl
、増分する(S112〉。これは、第14図から明らか
なように、各yについてX方向へ矢印の方向に走査し、
白から黒(パターンAからヘパターンB〉へ反転したら
カウントを1、増分するものである。さらに、同デイザ
画像のxsiからxeiに走査しつつ、順次ysiから
yeiに走査する過程において、白から黒へ反転したら
カウントを1、増分する(3113)。これは、第15
図から明らがなように、同様に、各Xについてy方向に
矢印の方向に走査し、白から黒(パターンAがらヘパタ
ーンB)へ反転したらカウントを1、増分するものであ
る。
続いて、第11図の8101で求めた外接矩形の面積S
から、SXa+b (a、b ;ある固定値の値を求め
、5112,5113で得られたカウントの値がその求
めた値よりも大きいと判定された場合(S114)、こ
の外接矩形を写真と判定しく81.15>、処理を終了
する(S116)。
5114でカウント値が小さいと判定されたら、この外
接矩形を図表と判定しく5117)、処理を終了する(
S116)。
(IV)文字部総合手段の動作 文字部総合手段は、属性判別手段33で文字部と判別さ
れた外接矩形から、自動的に適当な閾値を設定し、その
設定された閾値に従って文字部と判別された外接矩形を
統合することによって文字部領域を生成し抽出する処理
を行う。
第16図は、第↑図の文学部統合手段34の動作フロー
チャートである。
先ず、領域抽出手段34−1を用いて、属性判別手段3
3において文字部と判別された外接矩形から、各ライン
に対するカラム方向に、あるいは各カラムに対するライ
ン方向に外接矩形が1つでも存在する場合と、外接矩形
が全く存在しない場合とを示す外接矩形ヒストグラムを
作成する(S120)。その外接矩形ヒストグラムから
、カラム方向に外接矩形が全く存在しないラインが連続
するカラム方向無存在領域と、その逆のカラム方向に外
接矩形が少なくとも1つでも存在するラインが連続する
カラム方向存在領域とを抽出する。
また、ライン方向に対しても同様に、ライン方向存在領
域、及びライン方向無存在領域を抽出する(S121)
次に、判定手段34−2を用いて、その抽出されたカラ
ム方向無存在領域の数とライン方向無存在領域の数との
大小で、この文書は縦書きであるのか、横書きであるの
かを判定する(5122)。
さらに、領域生成手段34−3を用いて、判定手段34
−2において横書きと判定された場合は、カラム方向無
存在領域の幅とカラム方向存在領域の幅とのそれぞれの
ヒストグラムからライン方向(y方向)及びカラム方向
(X方向)の統合閾値を求め(3123> 、その求め
た統合閾値から属性判別手段33で文字部と判別された
外接矩形を統合して、文字部領域を生成する(S124
)。
5122において、縦書きと判定された場合は、ライン
方向無存在領域の幅とライン方向存在領域の幅とのそれ
ぞれのヒストグラムからライン方向及びカラム方向の統
合閾値を求め(S125)、次に8124の処理を行う
以上が、文学部統合手段34の一連の処理であるが、以
下、各処理について詳細に説明する。
第17図は、外接矩形ヒストグラムの作成結果例を示す
図である。この図は、5120及び5121を説明する
ための図であり、属性判別手段で文字部と判別、抽出さ
れた外接矩形の一例と、その抽出された外接矩形から各
ラインに対するカラム方向に、あるいは各カラムに対す
るライン方向に外接矩形が存在する場合と全く存在しな
い場合とを示す外接矩形ヒストグラムの作成結果の一例
を表すものである。
第17図に示すように、この外接矩形ヒストグラムから
カラム方向無存在領域及びカラム方向存在領域を抽出し
、また、ライン方向存在領域、及びライン方向無存在領
域を抽出する。第17図は、ライン方向無存在領域が無
い場合である。
次に、5122を説明する。5121で抽出されたカラ
ム方向無存在領域の数と、ライン方向無存在領域の数と
から、(カラム方向無存在領域の数〉ライン方向無存在
領域の数)と判定されたら、この文書は横書きと判定す
る。また、その逆の場合は縦書きと判定する。
5123について、第18図を用いて説明する。
第18図は、第16図中の]23における統合閾値の決
定を説明する図である。
この図は、第16図中の8121で抽出されたカラム方
向無存在領域の幅のヒストグラムを示したもので、横方
向にカラム方向無存在領域の幅(ライン数)を、縦方向
に各カラム方向無存在領域幅に対する個数をそれぞれ表
している。
そこで、最も個数の多いカラム方向無存在領域幅から(
カラム方向無存在領域幅が16の箇所〉、幅の大きくな
る方向に走査して、初めて個数がOとなるカラム方向無
存在領域幅が検出されたら、その幅■つ前のカラム方向
無存在領域幅を値TWとして抽出する。この図の場合は
19となる。
また、同様に、カラム方向存在領域の幅のヒストグラム
から値′rBを抽出する。
その結果、得られた値TWと値TBとから横方向、縦方
向の統合閾値を決定する。
その関係を、 横方向の総合閾値THx=TW+TB 縦方向の総合閾値THy=TW十Er (但し、Er;
傾き誤差分のライン数)に設定する。
また、第16図の8125の処理のように、5122で
縦書きと判定された場合については、ライン方向無存在
領域の幅のヒストグラムとライン方向存在領域の幅のヒ
ストグラムとから、同様に、それぞれにTW、TBを抽
出し、横方向及び縦方向の総合閾値を、 横方向の総合閾値THx=TW+Er 縦方向の総合閾値THy=TW+TB と設定する。
第19図は、第■6図中の8124における文字部の外
接矩形の統合を説明するための図であり、5123また
は5125で算出された縦方向の統合閾値TH,yと横
方向の総合閾値THxとから属性判別手段で文字部と判
別された外接矩形を統合して文字部領域を生成する方法
を示したものである。
先ず、原点(0,O)を画像の最左上にとり、Xの正方
向を右方向とし、yの正方向を下方向とする。そして、
同図のパターンA、Bに示す2つの外接矩形(xsl、
ysl)、(xel、’1e1)と(xs2.ys2>
、(xe2.ye2)について、5123で算出した縦
方向及び横方向の統合閾値THy、THxから、(1)
xs2−xel≦THx、(2)ys2−ye1≦TH
,y、(3)xsl−xe2≦THx (4) ys 
1−ye2≦THyの各条件をすべて満足する場合、同
図のパターンA、Bの点線で囲まれた外接矩形を新たに
生威し、その外接矩形の始点座標、終点座標を新たに保
存する。この時、上述の統合条件の各左辺部の値がマイ
ナスとなった場合に関しては条件を満たしているものと
する。
以上の様な文字部の統合の動作で、外接矩形(新たに保
存した外接矩形を含む)を次々と統合し、もうこれ以上
の統合をするものはないという状態まで繰り返し行う。
また、保存方法として2つの外接矩形の位置情報が保存
されているメモリ位置のうち、一方の外接矩形の情報が
保存されているメモリ位置に統合された結果の新たな矩
形領域の情報を保存し、もう一方の外接矩形の位置情報
が保存されいるメモリ位置の内容を削除(または開放〉
しながら処理を繰り返す方法がある。
第20図は、ある論文誌の原稿を、8本/mの解像度で
よみ収った画像に対して処理を行った領域分割の結果を
示す図である。50はフィールドセパレータ、51は写
真、52は文字部、および53は図表である。
なお、本発明は図示の実施例に限定されず、種々の変形
が可能である。その変形例としては、例えば次のような
ものがある。
(イ)文字部領域位置メモリ34aは備えなくともよい
。それは、すべての外接矩形の位置情報はは、外接矩形
位置メモリ32aに保存されており、その中で、図表、
写真、フィールドセパレータと判別された外接矩形の位
置情報は、領域位置メモリ33a、33b、33cに保
存されているので、残り位置情報すべてが文字部と判別
された外接矩形として保存可能であり、その外接矩形位
置メモリ32aが文字部領域位置メモリ34aの代りを
果たすことができる。これにより、メモリの省力化を図
ることができる。
(口〉上記実施例では、擬似中間調画像及び単純2値化
画像の各主走査方向をX軸方向とし、副走査方向をy軸
方向としたが、その逆の主走査方向をy軸方向とし、副
走査方向をX軸方向としてもよい。
(ハ)上記実施例では、デイザ画像と単純2値化画像と
のOR画像を走査し、黒ラインまたは黒カラムを検出す
るようにしたが、デイザ画像と単純2値化画像とをそれ
ぞれ直接に走査し、デイザ画像中の座標が(x、y)な
る部分が黒(記号:l)、または単純2値化画像中の座
標が(x、y)なる部分が黒となったら黒ラインまたは
黒カラムを検出するようにしてもよい。
(ニ)第11図の8105は省略してもよい。それは、
外接矩形の情報はすべて外接矩形位置メモリ32aに保
存されており、その中からフィールドセパレータ、写真
、または図表と判別される外接矩形が抽出されれば、残
りのものが文字部の外接矩形情報であると判別できるか
らである。
(ホ)第13図の5112,5113において、白から
黒に反転したときにカウントの値を1、増分するとした
が、これを黒から白へ反転したらカウントの値を1、増
分するとしてもよいし、白から黒及び黒から白へ反転し
たらカウントの値をl、増分するとしてもよい。
(へ)第14図及び第15図では、走査方向を左から右
、上から下とそれぞれ設定しているが、これを右から左
、下から上と設定してもよい。
(ト)2値化手段3■において、デイザ法2値化処理に
よりデイザ画像を生成するとしたが、デイザ画像に代え
、擬似中間調を表現するための2値化処理、例えば、誤
差拡散法等で生成された画像を用いてもよい。
(チ)外接矩形検出手段32では、各情報領域の間隔が
閾値以内の部分は同領域であるとして、連絡領域抽出処
理(ラベリング処理)による矩形領域を抽出する処理や
、境界追跡処理による矩形領域を抽出する処理等を用い
ても、上記実施例と同様な効果が期待できる。
(発明の効果) 以上詳細に説明したように、本発明によれば、2値化手
段、外接矩形検出手段、属性判別手段、及び文字部統合
手段を備えたので、■高速処理が可能となる、■膨大な
メモリを要せずに単純な構成で領域分割処理を行うこと
ができる、■フィールドセパレータ、図表、写真、文字
部のいずれの属性であるかを判別する属性判別精度が向
上する、■文字部領域を生成する際に、演算によって自
動的に閾値が設定されるので、文字部領域を高精度に抽
出できる、■種々の対象とする画像に対して柔軟な対応
が可能となる等の効果が期待できる。
【図面の簡単な説明】
第1図は本発明の実施例を示す画像分割処理装置の機能
ブロック図、第2図は従来の画像分割処理装置の構成ブ
ロック図、第3図は第1図の外接矩形検出手段の動作フ
ローチャート、第4図は第1図の外接矩形検出手段を説
明する図、第5図はOR画像を説明する図、第6図はy
方向切り出し処理を説明する図、第7図はX方向切り出
し処理を説明する図、第8図は第1図の属性判別手段の
動作フローチャート、第9図はフィールドセパレータの
抽出の動作フローチャート第10図は外接矩形のX軸長
さに対するy軸長さの関係図、第11図は写真・図表候
補の抽出の動作フローチャート、第■2図は外接矩形面
積に対する反転回数の関係図、第13図は写真・図表の
判定の動作フローチャート、第14図は第13図の81
12を説明する図、第15図は、第13図の5113を
説明する図、第16図は第■図の文字部統合手段の動作
フローチャート、第■7図は外接矩形ヒストグラムの作
成結果例を示す図、第■8図は統合閾値の決定を説明す
る図、第19図は文字部の外接矩形の統合を説明する図
、第20図は領域分割結果を示す図である。 31・・・・・・2値化手段、32・・・・・・外接矩
形検出手段、33・・・・・・属性判別手段、34・・
・・・・文字部統合手段、34−1・・・・・・領域抽
出手段、34−2・・・・・・判定手段、34−3・・
・・・・領域生成手段。 30二領域゛分割交埋部 殆1図 第1図のブト接矩形杖出手段のフローチャート貴23 
図 外接矩形検出手段を説明1ろ図 OR画像を説明する図 J方向切O出し処理を説明7ろ図 第6図 x、’fj向切0出し是埋を説明する間第7図 凰社判ZU手段の動作フO−チャート 皐8図 フぐ几ドセノでし−9の抽出の動作フロー′:Fサート
写真、QB笑イ侯ネ帛′の抽出の釦ガYフローチャート
写真、0表の抽出9憂耐乍アロ一チセ十尭13図 第13■のS〃2@説明す3図 算14図 %fM!Jの51135tlF3j’JtB Q第15
図 文学部統合手段の勤イ乍フローチャート弗16 図 統合閾値の決定を説明す3図 尭18図 文字部の夕F#矢巨形の統合を説明する図第19図 第20図 手続補正書(方式〉

Claims (1)

  1. 【特許請求の範囲】 1、文字部を含む属性を有する多値画像の情報領域を切
    り出し、該属性の判別処理を行う画像分割処理装置にお
    いて、 前記多値画像を入力して擬似中間調画像及び単純2値化
    画像を生成する2値化手段と、 前記擬似中間調画像及び単純2値化画像から前記情報領
    域を外接矩形として検出する外接矩形検出手段と、 前記外接矩形検出手段により検出された外接矩形の前記
    属性を判別する属性判別手段と、前記属性判別手段によ
    り前記文字部と判別された外接矩形から演算によって所
    定の閾値を設定し、その設定された閾値に従って該外接
    矩形の統合を行つて文字部領域を生成、抽出する文字部
    統合手段とを、 備えたことを特徴とする画像分割処理装置。 2、請求項1記載の画像分割処理装置において、前記属
    性判別手段は、 前記外接矩形の特徴とその外接矩形内の擬似中間調画像
    の特徴とを用いて前記属性を判別する構成にした画像分
    割処理装置。 3、請求項1記載の画像分割処理装置において、前記文
    字部統合手段は、 前記文字部と判別された外接矩形から外接矩形ヒストグ
    ラムを作成し、その作成結果からカラム方向に該外接矩
    形が全く存在しないカラム方向無存在領域と外接矩形が
    1つ以上存在するカラム方向存在領域とを抽出すると共
    に、ライン方向に対して前記外接矩形が全く存在しない
    ライン方向無存在領域と少なくとも1つでも存在するラ
    イン方向存在領域とを抽出する領域抽出手段と、 前記領域抽出手段の抽出結果から前記文字部の横書きま
    たは縦書きの判定を行う判定手段と、前記判定手段の判
    定結果に従ってライン方向及びカラム方向の統合閾値を
    算出し、その算出結果に従い、文字部と判別された外接
    矩形を統合して文字部領域を生成、抽出する領域生成手
    段とで、構成した画像分割処理装置。 4、請求項1記載の画像分割処理装置において、前記横
    書きまたは縦書きの判定を、カラム方向無存在領域の数
    とライン方向無存在領域の数との大小に基づき行う構成
    にした画像分割処理装置。
JP2030832A 1990-02-09 1990-02-09 画像分割処理装置 Pending JPH03233786A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2030832A JPH03233786A (ja) 1990-02-09 1990-02-09 画像分割処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2030832A JPH03233786A (ja) 1990-02-09 1990-02-09 画像分割処理装置

Publications (1)

Publication Number Publication Date
JPH03233786A true JPH03233786A (ja) 1991-10-17

Family

ID=12314676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2030832A Pending JPH03233786A (ja) 1990-02-09 1990-02-09 画像分割処理装置

Country Status (1)

Country Link
JP (1) JPH03233786A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991450A (ja) * 1995-07-17 1997-04-04 Toshiba Corp 文書処理装置および文書処理方法
US8787676B2 (en) 2010-08-03 2014-07-22 Fuji Xerox, Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991450A (ja) * 1995-07-17 1997-04-04 Toshiba Corp 文書処理装置および文書処理方法
US8787676B2 (en) 2010-08-03 2014-07-22 Fuji Xerox, Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method

Similar Documents

Publication Publication Date Title
US5778092A (en) Method and apparatus for compressing color or gray scale documents
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
US6233353B1 (en) System for segmenting line drawings from text within a binary digital image
JPH05227425A (ja) 自動画像セグメンテーションの改良
JP2001060247A (ja) 画像処理装置および画像処理方法
US5467410A (en) Identification of a blank page in an image processing system
JPH03126181A (ja) 文書画像の領域分割方法
JPH03233786A (ja) 画像分割処理装置
JPH03126180A (ja) 画像処理装置
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JPH0654180A (ja) 画像領域分離装置及び画像領域分離方法
JP2001109887A (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2786355B2 (ja) 文章画像の属性判別方法
JP2861860B2 (ja) 宛名行抽出装置
JP2877548B2 (ja) 文書画像の属性判別方法
JP2881066B2 (ja) 文章画像の属性判別方法
JP3187894B2 (ja) 文書画像傾き検出方法
EP0767941B1 (en) Automatic determination of landscape scan in binary images
JP3020293B2 (ja) 属性判別方法
JPH0432984A (ja) 画像2値化装置
JPH03125569A (ja) 画像2値化装置
JPH08305794A (ja) 宛名行抽出装置
JPH02253383A (ja) 画像処理装置
JPH0540849A (ja) 文書画像の領域抽出方法
JP2824991B2 (ja) 画像識別方法