JPH0540849A - 文書画像の領域抽出方法 - Google Patents

文書画像の領域抽出方法

Info

Publication number
JPH0540849A
JPH0540849A JP3195438A JP19543891A JPH0540849A JP H0540849 A JPH0540849 A JP H0540849A JP 3195438 A JP3195438 A JP 3195438A JP 19543891 A JP19543891 A JP 19543891A JP H0540849 A JPH0540849 A JP H0540849A
Authority
JP
Japan
Prior art keywords
area
processing
threshold value
white run
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3195438A
Other languages
English (en)
Inventor
Naohiro Amamoto
直弘 天本
Sadamasa Hirogaki
節正 広垣
Akitoshi Tsukamoto
明利 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3195438A priority Critical patent/JPH0540849A/ja
Publication of JPH0540849A publication Critical patent/JPH0540849A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 【目的】 文書画像の領域抽出処理において、領域抽出
の切り出し回数を減らすと共に、統合処理を省くことに
より、領域抽出処理の高速化を図る。 【構成】 最適2値化処理30で最適2値化された2値
画像データが統合閾値設定処理50へ送られる。統合閾
値設定処理50では、2値画像データを横方向及び縦方
向に走査し、最長白ラン幅のヒストグラムを作成し、統
合閾値を設定し、それを領域抽出処理60へ送る。領域
抽出処理60では、横方向もしくは縦方向の領域分割が
1回終了した時点で、統合閾値設定処理50で設定され
た統合閾値により統合を行い、前回切り出された領域数
と今回切り出された領域数とが等しければ領域抽出を終
了し、等しくなければ処理を続ける。この領域抽出処理
60が終了すれば、属性判別処理70により、フイール
ドセパレータ領域、写真領域、図表領域、及びその他の
文字領域の3つの属性に分類される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ファクシミリ等の通信
機器や文書画像データベース入力装置、光学的文字読取
り装置(OCR)等において、文書画像中における写真
領域や図表領域等といった領域を抽出する文書画像の領
域抽出方法に関するものである。
【0002】
【従来の技術】従来、この種の文書画像の領域抽出方法
としては、例えば特開昭62−71379号公報に記載
されるものがあった。
【0003】この文書画像の領域抽出方法では、文書画
像データを入力し、主走査方向(例えば、横方向)に黒
画素を計数(カウント)して閾値を超えるラインを検出
し、該カウント値が閾値以下の白ラインが所定個数連続
する状態を判定して第1の領域切り出しを行う。この第
1の領域切り出し内で、副走査方向(例えば、縦方向)
に黒画素をカウントしてカウント値が閾値を超える列を
検出し、カウント値が閾値以下の白列が所定個数連続す
る状態を判定して第2の領域切り出しを行う。さらに、
第2の領域切り出し内で、第1の領域切り出しと同様な
処理により、第3の領域切り出しを行い、この第3の領
域切り出し内で、第2の領域切り出しと同様な処理によ
り、第4の領域切り出しを行う。このような第1〜第4
の領域切り出しを行って文書画像の領域を抽出した後、
該抽出された領域について、その領域のランレングス情
報、及び黒画素率情報により、文字領域、写真領域、図
表領域等の属性を判別している。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
文書画像の領域抽出方法では、次のような課題があっ
た。
【0005】(a)従来の領域抽出方法では、領域切り
出し処理において、対象に応じて様々な閾値を任意に設
定する必要がある。例えば、個々の論文誌に対して領域
切り出しを行う場合、それらの閾値を各論文誌に応じた
適切な値に設定し直さなければならず、その値の選定に
手間がかかる。そのため、領域抽出後に行う属性の判別
処理の効率が低いという問題があった。
【0006】(b)前記(a)の問題を解決するため、
本願出願人は、先に特願平1−264649号明細書に
おいて、領域抽出方法を提案した。この提案では、文書
画像データを入力し、最適2値化処理によって2値画像
を作成する。この2値化された2値画像データの全領域
において、横方向に黒画素が1つでも存在する黒ライン
を検出し、次に黒画素が1つも存在しない白ラインが閾
値以上連続するまでの領域を切り出し、今度はその切り
出された領域において縦方向に同様な走査を行う。以
降、これらの走査を、これ以上切り出しは行えないとい
うところまで繰り返し処理を続ける。このような領域抽
出処理を行った後に、前記切り出れた矩形領域について
属性判別を行い、文字領域と判定された外接矩形領域に
ついてのみ統合処理を行う。
【0007】ところが、この領域抽出方法では、領域抽
出をこれ以上切り出しが行えないというところまで行
い、さらに切り出された領域について統合処理を行うた
め、切り出し回数の増大及び統合処理の必要性により、
領域抽出処理に時間がかかり、処理の高速化を図ること
が難しく、技術的に充分満足のゆく領域抽出方法を得る
ことが困難であった。
【0008】本発明は、前記従来技術が持っていた課題
として、短い処理時間で比較的簡単に、領域抽出を行う
ことが困難な点について解決した文書画像の領域抽出方
法を提供するものである。
【0009】
【課題を解決するための手段】本発明は前記課題を解決
するために、文書画像を多値画像データの形で読み取
り、前記多値画像データをその特徴及び性質を失うこと
なく最適2値化して2値画像を作成し、前記2値画像に
基づき、属性判別処理を行うための領域抽出を行う文書
画像の領域抽出方法において、統合閾値設定処理と領域
抽出処理とを実行した後に、前記属性判別処理を行うよ
うにしている。
【0010】ここで、統合閾値設定処理では、前記2値
画像を横方向及び縦方向に全面走査して最長白ランを抽
出し、その最長白ランの変化から白ラン幅のヒストグラ
ムを作成し、該ヒストグラムにおいて最大頻度を与える
白ラン幅を検出し、該白ラン幅を統合閾値として決定す
る。
【0011】次に、領域抽出処理では、前記2値画像に
おける外接矩形の内部を横方向に走査して黒画素が1つ
も存在しない白ラインで挾まれた第1の黒ブロックを抽
出する横分割処理と、該外接矩形の内部を縦方向に走査
して黒画素が1つも存在しない白ラインで挾まれた第2
の黒ブロックを抽出する縦分割処理とを、複数回行う。
そして、第1及び第2の黒ブロックのそれぞれの間隔と
前記統合閾値とを比較してそれらの間隔が前記統合閾値
よりも狭ければ統合し、該第1と第2の黒ブロックの数
が等しくなった時点で抽出処理を終了する。
【0012】
【作用】本発明によれば、以上のように文書画像の領域
抽出方法を構成したので、最適2値化された2値画像の
データが統合閾値設定処理へ送られると、該統合閾値設
定処理では、2値画像を横方向及び縦方向に走査し、最
長白ラン幅のヒストグラムを作成し、統合閾値を設定し
て領域抽出処理へ送る。
【0013】領域抽出処理では、横方向もしくは縦方向
の領域分割が例えば1回終了した時点で、統合閾値設定
処理で設定された統合閾値により統合を行い、前回切り
出された領域数と今回切り出された領域数が等しけれ
ば、領域抽出を終了し、等しくなければ処理を続ける。
これにより、領域抽出の切り出し回数の減少と、統合処
理の省略化が図れる。従って、前記課題を解決できるの
である。
【0014】
【実施例】図1は、本発明の実施例の領域抽出方法を示
す処理内容の図である。
【0015】文書画像の領域抽出処理を行う場合、ま
ず、読取り処理10において、CCD(Charge
Coupled Device)等のイメージセンサに
より、入力文書画像を走査して多値画像データを読み取
り、その多値画像データを多値画像メモリ20へ格納す
る。
【0016】最適2値化処理30では、多値画像メモリ
20に格納された多値画像データをその特徴及び性質を
損なうことなく最適2値化して2値画像データに変換
し、その2値画像データを2値画像メモリ40へ格納す
る。
【0017】この最適2値化処理30では、文字・フィ
ールドセパレータ領域は像域分離、図表・写真領域はデ
ィザ処理を施し、それら両者の画像を合成する処理が行
われる。即ち、入力多値画像データにおいて、注目画素
を中心とした局所領域での濃度差分値の絶対値の大きさ
から、非中間調画像部分と中間調画像部分とに分類す
る。そして、非中間調画像部分と判別された場合、注目
画素を固定閾値によって2値化し、一方、中間調画像部
分と判定された場合、注目画素をディザマトリクス閾値
によって2値化する。
【0018】このような最適2値化処理30が行われる
と、文字領域及び図表領域といった非中間調画像部分
は、白と黒の境のエッジ部分のくっきりとした画像とな
り、写真領域等の中間調画像部分は、新聞等で見られる
ディザ画像となり、これらの合成2値画像として得られ
る。この合成2値画像のデータは、2値画像メモリ40
に格納される。
【0019】次に、統合閾値設定処理50では、2値画
像メモリ40内に格納された2値画像データを走査し、
統合閾値を設定し、領域抽出処理60へ送る。領域抽出
処理60では、統合閾値を使用して領域抽出を行い、そ
の抽出した領域結果を属性判別処理70へ送る。
【0020】属性判別処理70では、抽出された領域か
ら、文書画像を例えばフィールドセパレータ領域、写真
領域、図形領域、及びその他の文字領域の属性に分類
し、全ての処理を終了する。
【0021】図2は図1中の統合閾値設定処理50の処
理内容を示す図、及び図3は図2中の最長白ラン抽出例
を示す図である。
【0022】統合閾値設定処理50を行う場合、図2に
おいて、まず、最適2値化処理30により2値化された
2値画像51のデータを横方向に走査し、最長白ラン分
布抽出処理52により、横方向の白ラン分布を抽出す
る。縦方向も同様な操作を行う。これにより、例えば図
3に示すような最長白ランの抽出結果が得られる。
【0023】次に、白ラン幅ヒストグラム作成処理53
により、白ラン分布から横及び縦方向の白ラン幅のヒス
トグラムを作成する。そして、白ラン幅検出処理54に
より、このヒストグラムの最大値を与える連続する白ラ
ン幅を検出し、統合閾値決定処理55により、横及び縦
方向の統合閾値thly,thlxを求める。
【0024】図4は、図2中の白ラン幅ヒストグラム作
成処理53による横方向の白ラン幅ヒストグラム作成処
理のフローチャートである。なお、図中のS53−1〜
S53−12は、各処理のステップを示す。
【0025】図4において、最長白ラン分布抽出処理5
2により得られた結果を入力とし、S53−1,S53
−2で、白ラン幅を与える変数widy及び白ラン幅
ヒストグラムhisty(i)を全て0に初期化す
る。そして、S53−3の最長白ラン抽出結果を、S5
3−4においてまず最初の1ラインを走査し、S53−
5で、最長白ランの画素数maxを求める。
【0026】次に、S53−6で次の行へ進み、2ライ
ン目を走査し、S53−7で最長白ランの画素数max
1を求めた後、S53−8で、前ラインの白画素数と現
ラインの白画素数の変化量(|max−max1|)を
調べ、その変化量がある閾値thl1よりも大きけれ
ばhisty(widy)を1インクリメント(+
1増分)し、小さければwidyを1インクリメント
する。
【0027】これらの操作をS53−9,S53−10
を介して画像の最終行まで繰り返し、S53−11でw
idy≠0を条件に、S53−12でhist
(widy)を1インクリメントして処理を終了す
る。
【0028】縦方向の白ラン幅のヒストグラム作成の処
理のアルゴリズムは、横方向のものと同様である。な
お、第3図の谷間の部分の幅は、白ラン幅のヒストグラ
ムにはカウントしない。
【0029】図5は、白ラン幅ヒストグラム作成処理5
3で求めたヒストグラムにおいて最大頻度を与える横方
向の連続する白ラン幅を求める、図2中の白ラン幅検出
処理54の処理内容を示すフローチャートである。な
お、図中のS54−1〜S54−9は、各処理ステップ
を示す。
【0030】図5のS54−1において、横方向の白ラ
ン幅のヒストグラムhisty(i)を入力し、白ラ
ン幅を与える変数widy及びヒストグラムにおいて
最大頻度を与える変数max2を、S54−2,S54
−3で各々0に初期化する。次に、S54−4で、白ラ
ン幅widyの出現頻度とある固定閾値thl3を
比較し、出現頻度の方が大きければ、その白ラン幅の出
現頻度histy(widy)とmax2の値とを
S54−5で比較する。histy(widy)>
max2であれば、S54−6でmax2=hist
y(widy)とし、さらにS54−7でthl
=widyとした後、S54−8で、widyを1
インクリメントする。S54−4,S54−5でノーの
時には、直接、S54−8へ進む。
【0031】これらの操作をS54−9を介してデータ
が終了するまで繰り返し、最終的なthlyの値を統
合閾値とする。
【0032】縦方向の統合閾値も同様に求めることがで
きる。図6は、図1中の領域抽出処理60の処理内容を
示すフローチャートである。領域抽出を行う場合、ま
ず、横分割処理61によって1回目の横分割を行い、以
降は縦分割処理62と横分割処理64を交互に行う。そ
して、判定処理63,65により、横分割によって得ら
れた第1の黒ブロック数と縦分割によって得られた第2
の黒ブロック数が等しいか否かを判定し、それら両者の
ブロック数が等しくなった時点で、図1中の領域抽出処
理60を終了する。
【0033】図7は、図6中の横分割処理61,64の
内容を示す図である。横分割処理を行う場合、まず、図
2の2値画像51における外接矩形(XSi,YSi,
XEi,YEi)の内部を横方向に走査し、黒画素が1
つも存在しない白ラインで挟まれた黒ブロックを抽出す
る。そして、これらの処理によって抽出された黒ブロッ
クの間隔を調べ、その間隔が統合閾値設定処理50によ
って得られた統合閾値thlyよりも狭ければ統合す
る。
【0034】図6中の縦分割処理62も、図7と同様な
手順で行う。このような領域抽出処理60が終わると、
図1中の属性判別処理70が行われる。
【0035】以上のように、本実施例では、最適2値化
された2値画像データを用いて統合閾値設定処理50を
行い、その処理結果を用いて領域抽出処理60を行うよ
うにしているので、該領域抽出処理60では、予め統合
閾値が分っており、横方向及び縦方向の各分割処理の中
に統合処理を組み込む。そのため、本願出願人の先の提
案のように、分割できなくなるまで領域抽出の切り出し
処理を続ける必要がなく、縦分割で得られたブロック数
と横分割で得られたブロック数とが等しくなった時点
で、分割処理を終了することができる。従って、領域抽
出の切り出し回数を減少できると共に、統合処理を省く
ことができ、それによって領域抽出処理の高速化が図れ
る。
【0036】なお、本発明は上記実施例に限定されず、
例えば、図6において、縦分割処理62を行った後に横
分割処理61を行う等、各処理手順を図示以外の形に変
更できる。
【0037】
【発明の効果】以上詳細に説明したように、本発明によ
れば、最適2値化された2値画像に基づき統合閾値設定
処理で統合閾値を求めた後、領域抽出処理を行うように
している。そのため、領域抽出処理では、予め統合閾値
が分かっており、横方向及び縦方向の各分割処理の中に
統合処理を組み込むことにより、分割できなくなるまで
領域抽出の切り出しを続ける必要がなく、横分割で得ら
れたブロック数と縦分割で得られたブロック数とが等し
くなった時点で分割処理を終了することができる。従っ
て、領域抽出の切り出し回数が減少すると共に、統合処
理を省くことができ、それによって領域抽出処理を高速
に行うことができる。
【図面の簡単な説明】
【図1】本発明の実施例の領域抽出方法を説明するため
の処理内容の図である。
【図2】図1中の統合閾値設定処理50の処理内容を示
す図である。
【図3】図2中の最長白ラン抽出例を示す図である。
【図4】図2中の横方向の白ラン幅ヒストグラム作成処
理53のフローチャートである。
【図5】図2中の白ラン幅検出処理54のフローチャー
トである。
【図6】図1中の領域抽出処理60の処理内容を示す図
である。
【図7】図6中の横分割処理61,64の内容を示す図
である。
【符号の説明】 10 読取り処理 30 最適2値化処理 50 統合閾値設定処理 60 領域抽出処理 70 属性判別処理

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文書画像を多値画像データの形で読み取
    り、前記多値画像データをその特徴及び性質を失うこと
    なく最適2値化して2値画像を作成し、前記2値画像に
    基づき、属性判別処理を行うための領域抽出を行う文書
    画像の領域抽出方法において、 前記2値画像を横方向及び縦方向に全面走査して最長白
    ランを抽出し、その最長白ランの変化から白ラン幅のヒ
    ストグラムを作成し、該ヒストグラムにおいて最大頻度
    を与える白ラン幅を検出し、該白ラン幅を統合閾値とし
    て決定する統合閾値設定処理と、 前記2値画像における外接矩形の内部を横方向に走査し
    て黒画素が1つも存在しない白ラインで挾まれた第1の
    黒ブロックを抽出する横分割処理と、該外接矩形の内部
    を縦方向に走査して黒画素が1つも存在しない白ライン
    で挾まれた第2の黒ブロックを抽出する縦分割処理と
    を、複数回行い、該第1及び第2の黒ブロックのそれぞ
    れの間隔と前記統合閾値とを比較してそれらの間隔が前
    記統合閾値よりも狭ければ統合し、該第1と第2の黒ブ
    ロックの数が等しくなった時点で抽出処理を終了する領
    域抽出処理とを、 実行した後に前記属性判別処理を行うことを特徴とする
    文書画像の領域抽出方法。
JP3195438A 1991-08-05 1991-08-05 文書画像の領域抽出方法 Withdrawn JPH0540849A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3195438A JPH0540849A (ja) 1991-08-05 1991-08-05 文書画像の領域抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3195438A JPH0540849A (ja) 1991-08-05 1991-08-05 文書画像の領域抽出方法

Publications (1)

Publication Number Publication Date
JPH0540849A true JPH0540849A (ja) 1993-02-19

Family

ID=16341065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3195438A Withdrawn JPH0540849A (ja) 1991-08-05 1991-08-05 文書画像の領域抽出方法

Country Status (1)

Country Link
JP (1) JPH0540849A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001037543A1 (fr) * 1999-11-12 2001-05-25 Effort Corporation Appareil permettant de diviser un ensemble de donnees d'images d'un support d'enregistrement optique, procede associe audit appareil et support d'enregistrement correspondant
US8650473B2 (en) 2008-07-11 2014-02-11 Canon Kabushiki Kaisha Document managing apparatus, document managing method, and storage medium
US10572759B2 (en) 2015-07-10 2020-02-25 Rakuten, Inc. Image processing device, image processing method, and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001037543A1 (fr) * 1999-11-12 2001-05-25 Effort Corporation Appareil permettant de diviser un ensemble de donnees d'images d'un support d'enregistrement optique, procede associe audit appareil et support d'enregistrement correspondant
US8650473B2 (en) 2008-07-11 2014-02-11 Canon Kabushiki Kaisha Document managing apparatus, document managing method, and storage medium
US10572759B2 (en) 2015-07-10 2020-02-25 Rakuten, Inc. Image processing device, image processing method, and program

Similar Documents

Publication Publication Date Title
US20020085243A1 (en) Document processing apparatus and method
JP3088010B2 (ja) 線画分離方法および装置
US6269186B1 (en) Image processing apparatus and method
JP4132766B2 (ja) 画像処理装置および方法
JPH0879517A (ja) 画像の型を識別する方法
JPH0540849A (ja) 文書画像の領域抽出方法
JP3100383B2 (ja) 文字領域分離方法および装置
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
JPH03126181A (ja) 文書画像の領域分割方法
JP3020293B2 (ja) 属性判別方法
JPH0540848A (ja) 文書画像の領域抽出方法
JPH08221512A (ja) 画像処理装置及びその方法
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP3966448B2 (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JP2877548B2 (ja) 文書画像の属性判別方法
JPH03126180A (ja) 画像処理装置
JPH04316181A (ja) 文書画像の領域抽出方法
JP3605773B2 (ja) 画像領域判別装置
JP2881066B2 (ja) 文章画像の属性判別方法
JP3177508B2 (ja) 画像処理装置
JPH05128306A (ja) 文章画像の属性判別方法
JP2853140B2 (ja) 画像領域識別装置
JPS6331825B2 (ja)
JPH04288689A (ja) 文書画像の縦書き・横書き判定方法
JP2900343B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19981112