JPH0540848A - 文書画像の領域抽出方法 - Google Patents

文書画像の領域抽出方法

Info

Publication number
JPH0540848A
JPH0540848A JP3195437A JP19543791A JPH0540848A JP H0540848 A JPH0540848 A JP H0540848A JP 3195437 A JP3195437 A JP 3195437A JP 19543791 A JP19543791 A JP 19543791A JP H0540848 A JPH0540848 A JP H0540848A
Authority
JP
Japan
Prior art keywords
image
area
character
black
white
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3195437A
Other languages
English (en)
Inventor
Naohiro Amamoto
直弘 天本
Sadamasa Hirogaki
節正 広垣
Akitoshi Tsukamoto
明利 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3195437A priority Critical patent/JPH0540848A/ja
Publication of JPH0540848A publication Critical patent/JPH0540848A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】 文字領域を大きな領域として表現することに
より、文書の構成や、文章のつながり等を容易に知るこ
とができ、効率よく文字認識が行える。 【構成】 領域画像作成処理1により領域画像を作成
し、その領域画像を用いてラベル画像作成処理2によっ
てラベル画像を作成する。文字画像作成処理3では、ラ
ベル画像において文字領域以外の領域を白にし、文字の
みの文字画像を作成する。そして、統合閾値設定処理4
では、文字画像を走査して最長白ラン幅のヒストグラム
を作成し、統合閾値を設定する。領域抽出処理5では、
横もしくは縦方向の領域分割が1回終了した時点で設定
された前記統合閾値により統合を行い、前回切り出され
た領域数と今回切り出された領域数が等しければ領域抽
出を終了し、等しくなければ処理を続ける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ファクシミリ等の通信
機器や文書画像デ―タベ―ス入力装置、光学的文字読取
り装置(OCR)等において、文書画像をその構成要素
の領域に抽出する文書画像の領域抽出方法に関するもの
である。
【0002】
【従来の技術】従来、この種の文書画像の領域抽出方法
には、例えば、特開昭62−71379号公報に記載さ
れるものがあった。
【0003】この文献に記載された文書画像の領域抽出
方法では、文書画像デ―タを入力し、走査方向(例え
ば、横方向)に黒画素を計数して閾値を超えるラインを
検出し、該計数値が閾値以下の白ラインが所定個数連続
する状態を判定して第1の領域切り出しを行う。この第
1の領域切り出し内で、副走査方向(例えば、縦方向)
に黒画素を計数して該計数値が閾値を超える列を検出
し、該計数値が閾値以下の白列が所定個数連続する状態
を判定して第2の領域切り出しを行う。
【0004】さらに、第2の領域切り出し内で、第1の
領域切り出しと同様な処理により、第3の領域切り出し
を行い、この第3の領域切り出し内で、第2の領域切り
出しと同様な処理により、第4の領域切り出しを行う。
そこで、この第4の領域切り出しで検出された領域につ
いて、その領域のランレングス情報、及び黒画素率情報
により、文字部、写真部、及び図表部の領域の属性を判
別している。
【0005】
【発明が解決しようとする課題】しかしながら、上記構
成の文書画像の領域抽出方法では、次のような課題があ
った。
【0006】(a)従来の方法では、領域を分割して抽
出する際に、その分割対象に応じて様々な閾値を任意に
設定する必要があった。例えば、個々の論文誌に対して
領域分割処理を施す場合、それらの閾値を各論文誌に応
じた適切な値に設定し直さなければならず、その値の選
定に手間がかかるという問題があった。
【0007】(b)前記(a)の問題を解決するため、
本願出願人は、先に特願平3−52846号明細書にお
いて、領域抽出方法の提案を行った。
【0008】図2は、本願出願人の先の提案における文
字領域例を示す図である。
【0009】本願出願人が先に行った提案では、先ず、
入力された白黒2値画像デ―タと同サイズの全面黒の多
値の領域画像を作成する。次に、原画像を横及び縦方向
に走査し、各々の方向で閾値T1,T2以上の白ランが
存在すれば領域画像においてその白ランに対応する部分
を白にして、文書画像の構成要素を黒画素連結領域とし
て表現する。この領域画像の黒の部分に対してラベル付
けを行い、領域画像の各黒連結領域に一意に番号を与え
てラベル画像を作成し、このラベル画像を用いて領域分
割を行うというものであった。
【0010】ところが、この方法では、図2に示すよう
に、文字領域Aが行単位もしくは文字単位といった小さ
な領域でしか表現することができず、文字認識を行う際
に文書の構成や、文章のつながり等を知ることが困難で
あり、技術的に未だ充分満足のゆく領域抽出方法が得ら
れなかった。
【0011】本発明は、前記従来技術が持っていた課題
として、文字領域を小さな領域でしか表現できず、それ
によって文字認識の効率が低下するという点について解
決した文書画像の領域抽出方法を提供するものである。
【0012】
【課題を解決するための手段】本発明は、前記課題を解
決するために、全面黒の領域画像と原画像から文書画像
の構成要素を黒画素連結領域として表現した領域画像を
作成する領域画像作成処理と、前記領域画像の構成要素
に一意に番号を与えたラベル画像を作成するラベル画像
作成処理とを施し、前記ラベル画像を用いて前記文書画
像の領域抽出を行う文書画像の領域抽出方法において、
前記ラベル画像から文字領域以外の領域を全て白にした
文字画像を作成する文字画像作成処理と、統合閾値設定
処理と、領域抽出処理とを、実行して文書画像の領域抽
出を行う。
【0013】ここで、統合閾値設定処理は、前記文字画
像を横及び縦方向に全面走査して最長白ランを抽出し、
該最長白ランの変化から白ラン幅のヒストグラムを作成
し、該ヒストグラムにおいて最大頻度を与える白ラン幅
を検出した後、該白ラン幅を統合閾値として決定する。
次に、領域抽出処理において、前記文字画像内における
外接矩形の内部を横方向に走査して黒画素が1つも存在
しない白ラインで挟まれた第1の黒ブロックを抽出する
横分割処理と、該外接矩形の内部を縦方向に走査して黒
画素が1つも存在しない白ラインで挟まれた第2の黒ブ
ロックを抽出する縦分割処理とを複数回行う。さらに、
この領域抽出処理において、抽出された第1及び第2の
黒ブロックの間隔と前記統合閾値とを比較して該第1,
第2の黒ブロックの間隔が前記統合閾値よりも狭ければ
統合処理を行い、該第1と第2の黒ブロックの数が等し
くなった時点で抽出処理を終了する。
【0014】
【作用】本発明によれば、以上のように文書画像の領域
抽出方法を構成したので、領域画像作成処理によって文
書画像の領域画像を作成し、その作成された領域画像か
らラベル画像を作成する。次に、文字画像作成処理で
は、前処理で作成されたラベル画像において文字領域以
外の領域を白にし、文字のみの領域画像を作成し、その
領域画像を統合閾値設定処理へ送る。統合閾値設定処理
では、入力された領域画像を横及び縦方向に走査し、最
長白ラン幅のヒストグラムを作成し、統合閾値を設定す
る。
【0015】すると、領域抽出処理では、横もしくは縦
方向の領域分割が1回終了した時点で設定された前記統
合閾値により統合を行い、前回切り出された領域数と今
回切り出された領域数とが等しければ領域抽出を終了
し、等しくなければ該領域抽出処理を続ける。これによ
り、文字領域を大きな領域として表現でき、文書の構成
や、文章のつながり等を容易に知ることが可能となり、
効率のよい文字認識が行える。従って、前記課題を解決
できるのである。
【0016】
【実施例】本実施例の実施例を示す領域抽出方法の処理
全体説明(I)と、その各処理内容(II)とを、図1,
図3,図4〜図9を参照しつつ、以下説明する。
【0017】(I) 領域抽出方法の処理全体説明(図
1) 図1は領域抽出方法の全体の処理内容図、及び図3は図
1中の文字画像の最長白ラン抽出例を示す図である。
【0018】図1に示すように、本実施例の領域抽出方
法では、まず、領域画像作成処理1により、全面黒の領
域画像と原画像から文書画像の構成要素を黒画素連結領
域として表現した領域画像を作成し、ラベル画像作成処
理2により、該領域画像の構成要素に一意に番号を与え
たラベル画像を作成する。
【0019】次に、このラベル画像から文字画像作成処
理3で、文字領域以外の領域を全て白にした文字画像を
作成し、この文字画像を走査して統合閾値設定処理4に
より、統合閾値を設定する。この統合閾値を使用して領
域抽出処理5により、領域抽出を行う。これにより、図
3に示すように、文字領域Bを大きな領域として表現で
きる。そのため、文書の構成や、文章のつながり等を容
易に知ることができ、効率よく文字認識が行える。
【0020】(II) 前記(I)の各処理内容 (II)(1) 統合閾値設定処理4(図4) 図4は図1中の統合閾値設定処理4の処理内容図、及び
図5は図4中の文字画像の最長白ラン抽出例を示す図で
ある。
【0021】図4において、まず、図1中の文字画像作
成処理3により作成された文字画像デ―タ41を横方向
に走査し、最長白ラン分布抽出処理42により、横方向
の白ラン分布を抽出する。縦方向も同様な操作を行う。
抽出された最長白ランの作成例が図5に示されている。
【0022】次に、白ラン幅ヒストグラム作成処理43
により、白ラン分布から横及び縦方向の白ラン幅のヒス
トグラムを作成する。そして、白ラン幅検出処理44に
より、このヒストグラムの最大値を与える連続する白ラ
ン幅を求めた後、統合閾値決定処理45により、横及び
縦方向の統合閾値thly,thlxを求める。 (II)(1)(a) 図4中の白ラン幅ヒストグラム作成処
理43(図6) 図6は、図4中の白ラン幅ヒストグラム作成処理43に
よる横方向の白ラン幅ヒストグラム作成処理のフロ―チ
ャ―トである。図中のS43−1〜S43−12は、各
処理ステップを表す。
【0023】図6において、図4中の最長白ラン分布抽
出処理42により得られた結果を入力とし、S43−
1,S43−2で、白ラン幅を与える変数widy及
び白ラン幅ヒストグラムhisty(i)を全て0に
初期化する。そして、S43−3の最長白ラン抽出結果
に対し、S43−4で、まず最初の1ラインを走査し、
S43−5で、最長白ランの画素数maxを求める。
【0024】次に、S43−6で次の行へ進み、S43
−6で、2ライン目を走査し、最長白ランの画素数ma
x1を求め、S43−8で、前ラインの白画素数と現ラ
インの白画素数の変化量(|max−max1|)を調
べ、それがある閾値thl1よりも大きければhis
y(widy)を1インクリメント(+1増分)
し、小さければwidyを1インクリメントする。
【0025】これらの操作を、S43−9,S43−1
0を介して画像の最終行まで繰り返し、S43−11で
widy≠0であれば、S43−12で、hist
y(widy)を1インクリメントして処理を終了す
る。
【0026】縦方向の白ラン幅のヒストグラム作成の処
理のアルゴリズムは、横方向のものと同様である。
【0027】なお、第5図の谷間の部分の幅は、白ラン
幅のヒストグラムにはカウントしない。
【0028】(II)(1)(b) 図4中の白ラン幅検出処
理(図7) 図7は、上記処理で求めたヒストグラムにおいて最大頻
度を与える横方向の連続する白ラン幅の検出処理のフロ
―チャ―トである。図中のS44−1〜S44−9は、
処理ステップを表す。
【0029】図7のS44−1で、横方向の白ラン幅の
ヒストグラムhisty(i)を入力し、S44−
2,S44−3で、白ラン幅を与える変数widy及
びヒストグラムにおいて最大頻度を与える変数max2
を、各々0に初期化する。
【0030】次に、S44−4で、白ラン幅wid
の出現頻度とある固定閾値thl3を比較し、出現頻
度の方が大きければ、S44−5で、その白ラン幅の出
現頻度histy(widy)とmax2の値とを
比較する。histy(widy)>max2であ
れば、S44−6でmax2=histy(wid
y)とし、さらにS44−7でthly=wid
として、S44−8でwidyを1インクリメントす
る。S44−4,S44−5でノ―のときには、直接、
S44−8へ進む。
【0031】これらの操作をS44−9を介してデ―タ
が終了するまで繰り返し、最終的なthlyの値を統
合閾値とする。なお、縦方向の統合閾値も同様に求める
ことができる。
【0032】(II)(2) 領域抽出処理5(図8) 図8は、図1中の領域抽出処理の内容を示す図である。
【0033】まず、横分割処理11で1回目の横分割を
行い、以降は縦分割処理52と横分割処理54を交互に
行う。判定処理53,55で、横分割によって得られた
第1のブロック数と、縦分割によって得られた第2のブ
ロック数との一致/不一致の判定を行い、縦分割のブロ
ック数と横分割のブロック数が等しくなった時点で、領
域抽出処理を終了する。
【0034】(II)(2)(a) 図8中の横分割処理5
1,54(図9) 図9は、図8中の横分割処理51,54の内容を示す図
である。
【0035】横分割処理では、まず、文字画像における
外接矩形(XSi,YSi,XEi,YEi)の内部を
横方向に走査し、黒画素が1つも存在しない白ラインで
挟まれた黒ブロックを抽出する。次に、抽出された黒ブ
ロックの間隔を調べて、その間隔が統合閾値設定処理4
によって得られた統合閾値thlyよりも狭ければ統
合する。なお、縦分割処理52も同様な手順で行う。
【0036】以上のように、本実施例によれば、領域画
像作成処理1によって領域画像を作成し、その領域画像
からラベル画像作成処理2によってラベル画像を作成し
た後、文書画像作成処理3によって文書画像を作成し、
その文書画像に基づき統合閾値設定処理4で統合閾値を
設定し、該統合閾値を用いて領域抽出処理5で領域抽出
を実行するようにしている。このように、統合閾値設定
処理4で統合閾値を求めることにより、これまで文字領
域を小さな領域でしか表現できなかったものを、図3に
示すように大きな文字領域Bとして表現できる。そのた
め、文字認識における際の文書の構成や、文章のつなが
り等を容易に知ることができ、文字認識の効率のよい処
理が行える。
【0037】なお、本発明は上記実施例に限定されず、
種々の変形が可能である。例えば、図8の領域検出処理
5において、縦分割処理52を行った後に横分割処理5
1を行い、以後、その処理を交互に繰り返すようにした
り、或いは図4中の白ラン幅ヒストグラム作成処理43
及び白ラン幅検出処理44を図6及び図7以外の処理ス
テップに変形してもよい。また、図1の各処理1〜5
は、集積回路等の個別回路で構成した装置で実行した
り、或いはコンピュ―タを用いたプログラム制御等によ
り実行するようにしてもよい。
【0038】
【発明の効果】以上詳細に説明したように、本発明によ
れば、領域画像作成処理及びラベル画像作成処理の後、
文字画像作成処理で文字画像を作成し、その文字画像を
用いて統合閾値設定処理で統合閾値を設定し、該統合閾
値を用いて領域抽出処理で領域の抽出を行うようにして
いる。このように統合閾値を求め、その統合閾値を用い
て領域の抽出を行うので、これまで文字領域を小さな領
域でしか表現できなかったものを、大きな領域として表
現できる。従って、文字認識における際の文書の構成
や、文章のつながり等を容易に知ることができ、それに
よって文字認識効率を著しく向上させることができる。
【図面の簡単な説明】
【図1】本発明の実施例を示す文書画像の領域抽出方法
の処理内容図である。
【図2】先の提案の文字領域例を示す図である。
【図3】図1中の文字領域例を示す図である。
【図4】図1中の統合閾値設定処理4の処理内容を示す
図である。
【図5】図4中の文字画像の最長白ランの抽出例を示す
図である。
【図6】図4中の横方向の白ラン幅ヒストグラム作成処
理43の内容を示すフロ―チャ―トである。
【図7】図4中の白ラン幅検出処理44の内容を示すフ
ロ―チャ―トである。
【図8】図1中の領域抽出処理5の処理内容を示す図で
ある。
【図9】図8中の横分割処理51,54の内容を示す図
である。
【符号の説明】
1 領域画像作成処理 2 ラベル画像作成処理 3 文字画像作成処理 4 統合閾値設定処理 5 領域抽出処理 41 文字画像 42 最長白ラン分布抽出処理 43 白ラン幅ヒストグラム作成処理 44 白ラン幅検出処理 45 統合閾値決定処理 51,54 横分割処理 52 縦分割処理 53,55 判定処理

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 全面黒の領域画像と原画像から文書画像
    の構成要素を黒画素連結領域として表現した領域画像を
    作成する領域画像作成処理と、前記領域画像の構成要素
    に一意に番号を与えたラベル画像を作成するラベル画像
    作成処理とを施し、前記ラベル画像を用いて前記文書画
    像の領域抽出を行う文書画像の領域抽出方法において、 前記ラベル画像から文字領域以外の領域を全て白にした
    文字画像を作成する文字画像作成処理と、 前記文字画像を横及び縦方向に全面走査して最長白ラン
    を抽出し、該最長白ランの変化から白ラン幅のヒストグ
    ラムを作成し、該ヒストグラムにおいて最大頻度を与え
    る白ラン幅を検出した後、該白ラン幅を統合閾値として
    決定する統合閾値設定処理と、 前記文字画像内における外接矩形の内部を横方向に走査
    して黒画素が1つも存在しない白ラインで挟まれた第1
    の黒ブロックを抽出する横分割処理と、該外接矩形の内
    部を縦方向に走査して黒画素が1つも存在しない白ライ
    ンで挟まれた第2の黒ブロックを抽出する縦分割処理と
    を複数回行い、抽出された第1及び第2の黒ブロックの
    間隔と前記統合閾値とを比較して該第1,第2の黒ブロ
    ックの間隔が前記統合閾値よりも狭ければ統合処理を行
    い、該第1と第2の黒ブロックの数が等しくなった時点
    で抽出処理を終了する領域抽出処理とを、 実行して前記文書画像の領域抽出を行うことを特徴とす
    る文書画像の領域抽出方法。
JP3195437A 1991-08-05 1991-08-05 文書画像の領域抽出方法 Pending JPH0540848A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3195437A JPH0540848A (ja) 1991-08-05 1991-08-05 文書画像の領域抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3195437A JPH0540848A (ja) 1991-08-05 1991-08-05 文書画像の領域抽出方法

Publications (1)

Publication Number Publication Date
JPH0540848A true JPH0540848A (ja) 1993-02-19

Family

ID=16341049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3195437A Pending JPH0540848A (ja) 1991-08-05 1991-08-05 文書画像の領域抽出方法

Country Status (1)

Country Link
JP (1) JPH0540848A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327384B1 (en) 1996-11-13 2001-12-04 Nec Corporation Character recognition apparatus and method for recognizing characters
JP2009132155A (ja) * 2009-01-23 2009-06-18 Seiko Epson Corp 画像処理装置、複写装置、画像処理方法及びそのプログラム
US8274668B2 (en) 2007-02-07 2012-09-25 Seiko Epson Corporation Image processing apparatus, copier, and image processing method and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327384B1 (en) 1996-11-13 2001-12-04 Nec Corporation Character recognition apparatus and method for recognizing characters
US8274668B2 (en) 2007-02-07 2012-09-25 Seiko Epson Corporation Image processing apparatus, copier, and image processing method and program
JP2009132155A (ja) * 2009-01-23 2009-06-18 Seiko Epson Corp 画像処理装置、複写装置、画像処理方法及びそのプログラム

Similar Documents

Publication Publication Date Title
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JP2802036B2 (ja) 文書処理のためのイメージ・セグメント化およびイメージ要素分類の方法
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JPH0540848A (ja) 文書画像の領域抽出方法
JP2003115031A (ja) 画像処理装置および方法
KR940020246A (ko) 문서인식장치의 영역분할 방법
JP4116377B2 (ja) 画像処理方法および画像処理装置
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
JPH0540849A (ja) 文書画像の領域抽出方法
JP3030126B2 (ja) 画像処理方法
JP3966448B2 (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JP2899356B2 (ja) 文字認識装置
JP3020293B2 (ja) 属性判別方法
JP2771045B2 (ja) 文書画像の領域分割方法
JP2001043312A (ja) 文書画像処理装置
JP2789647B2 (ja) 線画像認識方法
JP2000040122A (ja) 文字切り出し方法
JPH0660220A (ja) 文書画像の領域抽出方法
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JP2000148908A (ja) 文書画像処理方法、装置および記録媒体
JPH0535914A (ja) 画像傾き検出方法
JP4129320B2 (ja) 画像処理装置及び記録媒体
JPS6331825B2 (ja)
JPH022189B2 (ja)
JPH02166583A (ja) 文字認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990518