JP2001014468A - 画像処理方法、画像処理装置、地肌除去方法および記録媒体 - Google Patents

画像処理方法、画像処理装置、地肌除去方法および記録媒体

Info

Publication number
JP2001014468A
JP2001014468A JP2000030025A JP2000030025A JP2001014468A JP 2001014468 A JP2001014468 A JP 2001014468A JP 2000030025 A JP2000030025 A JP 2000030025A JP 2000030025 A JP2000030025 A JP 2000030025A JP 2001014468 A JP2001014468 A JP 2001014468A
Authority
JP
Japan
Prior art keywords
area
solid
image
image processing
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000030025A
Other languages
English (en)
Inventor
Goro Bessho
吾朗 別所
Michiyoshi Tachikawa
道義 立川
Toshifumi Yamaai
敏文 山合
Fumihiro Hasegawa
史裕 長谷川
Takayuki Nishimura
隆之 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000030025A priority Critical patent/JP2001014468A/ja
Publication of JP2001014468A publication Critical patent/JP2001014468A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 帳票や図面などの画像中から地肌色のべた塗
り領域の境界線を抽出する。 【解決手段】 帳票画像から区切線を認識し(2)、塗
りつぶしパターンのサイズを変えながらべた塗り領域を
検索する(3)。矩形が連続しているものを統合し
(4)、小面積の領域を除いた、べた塗り領域を抽出し
(5)、輪郭線にフィルタ処理を行って小さな凸凹を除
き(6)、べた塗り領域に重なっている区切線を除去す
る(7)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票や図面などの
画像中から、べた塗り領域を抽出し、その境界線(輪
郭)を認識する画像処理方法、装置およびべた塗り領域
抽出処理プログラムを記録した記録媒体、さらに地肌を
除去する地肌除去方法に関する。
【0002】
【従来の技術】帳票などに記入された手書き文字または
活字文字、記号などを認識し、これをパソコンなどに自
動的に入力することにより、伝票などの入力作業を省力
化することが行われている。また、帳票などの表を読み
取り、認識する際に、罫線と文字、記号とを分離して認
識することが重要である。なお、本出願人は先に、図面
の輪郭(例えば建設図面の壁など)や表の区切線(例え
ば帳票の罫線など)を精度よく認識する画像認識方法を
提案した(特開平8−221571号公報を参照)。
【0003】
【発明が解決しようとする課題】ところで、同一フォー
マットの定型帳票を複数読み取って、文字、記号などが
記入されている欄の位置合せを行う場合に、位置合わせ
の精度が悪いと認識率が低下してしまう問題がある。
【0004】本発明は上記した問題点を解決するために
なされたもので、本発明の目的は、帳票や図面などの画
像中から地肌色のべた塗り領域の境界線を抽出し、べた
塗り領域を位置合わせに利用する画像処理方法、装置お
よび記録媒体を提供することにある。
【0005】本発明の他の目的は、地肌色や網掛けなど
をノイズとして除去し、文字や罫線のみが認識しやすい
ように2値化する地肌除去方法を提供することにある。
【0006】本発明のさらに他の目的は、地肌領域また
は網掛け領域をべた塗り状態の領域に変換した後、べた
塗り状態の領域を抽出する画像処理方法を提供すること
にある。
【0007】
【課題を解決するための手段】本発明では、帳票などの
入力画像から区切線を認識し、入力画像から正方形のパ
ターンサイズを変えながら矩形領域を検索し、連続して
いる矩形を統合すると共に小面積の矩形領域を除くこと
により、べた塗り領域を抽出し、べた塗り領域の輪郭線
にフィルタ処理を行って小さな凸凹を除き、また、べた
塗り領域に重なっている区切線を除去する。
【0008】また、本発明では、帳票などの多値画像の
領域全体に対して判別分析法を適用して、しきい値を決
定し、多値画像を2値画像に変換し、変換した2値画像
からべた塗り領域を抽出する。べた塗り領域と、全領域
からべた塗り領域を除いた領域に対して、それぞれ判別
分析法を適用して、それぞれしきい値を決定し、それぞ
れの多値画像をそれぞれのしきい値で2値化し、地肌を
除去した2値画像に変換する。
【0009】さらに、本発明では、帳票などを2値画像
データとして読み取り、画像データ中の所定濃度以上の
地肌領域または網掛け領域が、べた塗り状態になるまで
膨張処理を繰り返し、べた塗り状態の領域を抽出する。
【0010】
【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。(実施例1)図1は、本発明
の実施例1の構成を示す。図において、1はスキャナな
どの画像入力部、2は区切り線認識部、3はべた塗りパ
ターン検索部、4は領域統合部、5はべた塗り領域抽出
部、6はフィルタ処理部、7は区切り線除去部である。
また、図2、3は、本発明の処理フローチャートであ
る。
【0011】以下、図2、3を参照して本発明の処理動
作を説明する。まず、ステップ101において、画像入
力部1では、帳票または図面を2値画像データとして読
み取る。図4は、帳票画像の一例を示す。なお、帳票な
どの画像は、図示しないネットワークなどを介して受信
するようにしてもよい。
【0012】ステップ102において、区切り線認識部
2は帳票などの2値画像データから罫線、枠線などを認
識する。罫線、枠線などを認識する方法としては、例え
ば前掲した公報に記載された方法など公知の方法を用い
る。
【0013】ステップ103からステップ110までの
処理が、べた塗りパターン検索部3と領域統合部4で実
行されるべた塗り領域の検索処理の流れである。ステッ
プ103では、所定濃度の地肌色のべた塗り領域を検索
するための前処理として、べた塗りパターン検索部3で
は、検索するべた塗り正方形パターンサイズの初期値
(2のべき乗指数:n)を設定する。検索する正方形パ
ターンのサイズは、2のn乗からnを1ずつ減らし、小
さいサイズに移行していく。2のn乗が最大サイズのべ
た塗り領域に内接する最大正方形の1辺の長さに相当す
るように、nの値を決定する。例えば、帳票を400d
piで読み込んだ場合、n=8で実行した結果が、図5
に示す最大サイズの正方形である。
【0014】ステップ104では、べた塗り領域を検索
する一連の処理の終了判定を行う。nがn(min)よ
り小さくなれば、べた塗り領域検索処理を終了する。こ
こで、n(min)は、最低ドットサイズである。すな
わち、文字やノイズなどと、べた塗り領域の一部とを識
別するためのサイズのしきい値であり、例えばn(mi
n)=3(8ドット)である。
【0015】また、nがn(min)より小さくなけれ
ば、ステップ105に移る。ステップ105では、処理
効率を考慮して、べた塗り領域を検索する正方形のサイ
ズを判定している。nがnsより大きければ、ステップ
106に移行する。また、nがnsより大きくなけれ
ば、ステップ107移行する。ここで、nsは、べた塗
り領域を検索する正方形サイズの大小を分けるしきい値
であり、例えばns=3(8ドット)である。
【0016】ステップ106では、画像の全領域を1辺
が2のn乗サイズの正方形の桝目に分割して、左上から
右下までの全ての領域をべた塗りパターンで検索する。
その後、ステップ108に移行する。
【0017】ステップ107では、画像の全領域を1辺
が2のn乗サイズの正方形の桝目に分割して左上から右
下までの全てをべた塗りパターンで検索するのではな
く、ステップ106の方法で既に検索済みのより大きい
正方形に隣接する周辺の画像領域に対し、2のn乗サイ
ズの正方形のべた塗りパターンで検索する。その後、ス
テップ108に移行する。
【0018】ステップ106とステップ107の両方の
処理で検索した結果を、図5に示す。図5において、最
小の正方形がステップ107で検索されたべた塗り領域
であり、それより大きい正方形が、ステップ106で検
索されたべた塗り領域である。なお、図5は、n(mi
n)=ns=3で実行したものである。
【0019】ステップ108において、領域統合部4で
は、処理効率を上げるために、上記ステップ106とス
テップ107で検索したべた塗り領域の管理情報(正方
形の群)を統合するための判定を行う。すなわち、上下
または左右に同じ大きさの矩形が連続して検索されてい
るか否かを判定し、YESであれば、統合する処理であ
るステップ109に移行する。NOであれば、統合する
ことなくステップ110に移行する。
【0020】ステップ109は、単一の矩形情報に統合
する処理である。すなわち、上下または左右に矩形が複
数連続していても単一矩形として処理できるものを見つ
け出して、これらを統合することにより情報量を削減
し、ステップ110に移行する。
【0021】ステップ108とステップ109の処理に
よって、矩形情報を統合した例を、図6に示す。図5
は、統合する前の矩形情報である。
【0022】ステップ110の処理は、次の大きさの正
方形パターンの検索を行う準備のために、その1辺のサ
イズを1/2にする処理である。その後、ステップ10
4に戻って、次の大きさの正方形の検索を行う。
【0023】ステップ111以降の処理は、検索された
べた塗り領域を使用して、帳票処理に必要な処理、つま
りべた塗り領域の輪郭抽出と、誤認織した区切線の除去
を行う。ステップ111において、べた塗り領域抽出部
5は、以下の処理の準備として、上記検索済みのべた塗
り認識矩形の全てに対し、接続するもの同士によるグル
ープ(群)分けを行う。具体的には、全てのべた塗り認
識矩形に対して所属するグループNOを付ける。グルー
プ数はM個とし、グループNOは、O〜(M−1)で表
す。グループ分けの方法としては、どのような方法を用
いてもよい。
【0024】続いて、ステップ112では、ステップ1
11でグループ分けされたべた塗り矩形領域をグループ
別に処理するための識別カウンタmを0に初期設定し、
ステップ113(図3)処理に進む。
【0025】ステップ113では、グループ識別カウン
タmの終了判定を行う。すなわち、m<Mであれば、グ
ループ別処理が継続中であるので、ステップ114に移
行する。また、m<MがNOであれば、グループ別処理
が終了したので、全ての処理を終了する。
【0026】ステップ114では、m番目にグループ分
けされた接続するべた塗り領域群が、ノイズなどではな
く、帳票上のべた塗り領域であるか否かを、面積の大き
さが許容値以上であるか否かを基に判定する。面積の許
容値に相当するしきい値として、例えば、400dpi
で読み取った帳票の場合、64×64dotを使用す
る。面積がしきい値より小さい場合はステップ115に
移行し、小さくない場合は、ステップ116に移行す
る。
【0027】ステップ115では、m番目に接続するべ
た塗り領域群はノイズと判定し、そのグループに属する
べた塗り認識矩形情報を全て削除して、ステップ120
に移行する。ステップ114およびステップ115で処
理した結果の例を図7に示す。処理前の図6と比較し
て、小面積の矩形からなる領域群(例えば、文字
「動」、「車」中の領域群)が除かれている。
【0028】ステップ116では、べた塗り領域群の面
積が許容条件を満たしていると判定し、帳票処理に必要
な処理(べた塗り領域の輪郭抽出と、誤抽出した区切線
の除去)のために、まず、m番目の接続するべた塗り領
域群の最外郭線(輪郭)を取得し、ステップ117に移
行する。
【0029】ステップ117において、フィルタ処理部
6は、取得した最外郭線に対し、水平および垂直方向線
にのみローパスフィルタリングを行い、小さい凸凹を除
いた直線にする。ステップ117で処理した結果の例を
図8に示す。その後、帳票処理に必要な処理である、誤
抽出した区切線などの除去のためにステップ118に移
行する。
【0030】ステップ118において、区切線除去部7
は、先のステップ102における図面認識処理で認識・
抽出された区切線などが、m番目の接続するべた塗り領
域群に重なっているか否かを判定する。YESであれ
ば、区切線などが誤認識されたものとみなして、ステッ
プ119に移行する。NOであれば、区切線などが正し
く認識されたものとみなし、その情報を保存し、ステッ
プ120に移行する。
【0031】ステップ119では、ステップ118の判
定を基に、誤認識されたとみなされる区切線などが、m
番目の接続するべた塗り領域群に重なっている箇所を除
去し、ステップ120に移行する。ステップ120で
は、次の接続するべた塗り領域群の処理の準備のため
に、識別カウンタを+1して、ステップ113に戻る。
【0032】なお、上記した実施例では帳票画像を例に
説明したが、本発明はこれに限定されず、建設図面(家
屋図面)の画像などにも適用することができる。家屋図
面に適用する場合には、図面認識時に、壁などの骨格線
が認識される。
【0033】また、本発明は上記した実施例に限定され
ず、ソフトウェアによっても実現することができる。本
発明をソフトウェアによって実現する場合には、図9に
示すように、CPU、メモリ、表示装置、ハードディス
ク、キーボード、CD−ROMドライブ、スキャナなど
からなるコンピュータシステムを用意し、CD−ROM
などのコンピュータ読み取り可能な記録媒体には、本発
明に係るべた塗り領域を抽出する機能を実現するプログ
ラムが記録されていて、このプログラムをシステムにイ
ンストールする。また、スキャナなどの画像入力手段か
ら入力された帳票などの画像は一時的にハードディスク
などに格納される。そして、該プログラムが起動される
と、一時保存された画像データが読み込まれて、べた塗
り領域を抽出する処理を実行し、その抽出結果をディス
プレイなどに出力する。
【0034】(実施例2)本実施例は、帳票や図面など
をスキャナで読み取った多値画像から、地肌色や網掛け
などをノイズとして除去し、文字や罫線のみが認識しや
すいように2値化する実施例である。
【0035】図10は、本発明の実施例2の構成を示
す。また、図11は、本発明の実施例2に係る処理フロ
ーチャートである。
【0036】ステップ201において、多値画像入力部
11では、帳票または図面を多値画像データとして読み
取り、メモリ12に記憶する。図12は、帳票の多値
(256階調)画像データの例を示す。なお、帳票など
の画像データ(多値画像データあるいはそのランレング
スを符号化した画像データ)は、図示しないネットワー
クなどを介して受信するようにしてもよい。
【0037】ステップ202において、2値画像変換部
13は、高濃度の領域を抽出するために、判別分析法に
よって画像の全領域の2値化しきい値を求め、画像を多
値から2値に変換し、変換部内のメモリに格納する。図
13は、多値画像を2値画像に変換した例を示す。
【0038】ステップ203において、べた塗り領域抽
出部14は、上記変換部13内に格納された2値画像か
ら、実施例1で説明したように、べた塗り領域を抽出
し、その位置情報とべた塗り領域の個数Nを抽出部内の
メモリに格納する。図14は、2値画像から、べた塗り
領域を抽出した例を示す。
【0039】ステップ204では、Nが0より大きけれ
ばステップ205に進み、Nが0より大きくなければ、
ステップ207に進む。ステップ204以下の処理は、
領域別多値/2値変換部15で実行される。
【0040】ステップ205では、ステップ201の処
理でメモリ12上に格納した多値画像データに対して、
N番目のべた塗り領域に対応する箇所に判別分析法を適
用して、白黒判別の境界しきい値を求め、多値画像を2
値画像に変換し、ステップ206に進む。ステップ20
6では、Nを−1し、ステップ204に戻り、次のべた
塗り領域に対応する箇所の多値画像を2値画像に変換す
る。
【0041】ステップ207では、べた塗り領域以外の
領域に対応する箇所に判別分析法を適用して、白黒判別
の境界しきい値を求め、多値画像を2値画像に変換し、
ステップ208に進む。図15は、領域別に多値/2値
変換を行った結果を示す。ステップ208では、図示し
ない認識部で、2値画像データから帳票の罫線などを公
知の認識方法によって認識する。
【0042】なお、本実施例においても、実施例1で説
明したと同様にしてソフトウェアによって実現できる。
【0043】(実施例3)帳票や図面などにおいて、強
調したい領域を色分けしたりあるいは網掛けしている
が、帳票の罫線あるいは図面の区切り線、骨格線を認識
する際に、上記した領域を識別する必要がある。
【0044】本実施例は、地肌濃度の高い領域あるいは
網掛け領域を抽出する実施例である。なお、本発明は、
家屋図面を認識する場合に、木造板張りと表現された
「床上げ表現」領域を抽出する例にも適用することがで
きる。
【0045】図16は、本発明の実施例3の構成を示
し、また、図17は、本発明の実施例3に係る処理フロ
ーチャートである。
【0046】ステップ301において、画像入力部21
では、帳票または図面を2値画像データとして読み取
る。図18は、2値の帳票画像データの例を示す。な
お、帳票などの画像データ(2値画像データあるいはそ
のランレングスを符号化した画像データ)は、図示しな
いネットワークなどを介して受信するようにしてもよ
い。
【0047】ステップ302において、区切線認識部2
2では、帳票または図面の2値画像データから、区切り
線、骨格線を公知の方法によって認識する。
【0048】ステップ303以下の処理で、地肌濃度の
高い領域あるいは網掛け領域を、べた塗り領域に変換す
る。まず、ステップ303では、画像膨張機能を用いて
地肌濃度の高い領域あるいは網掛け領域を、べた塗り領
域に変換するときの膨張サイズを決定するための前処理
として、画素塊計数部23は、現在の画像の黒ドットか
らなる領域数(以下、黒ドット領域数)BeforIC
ntと、白ドットからなる領域数(以下、白ドット領域
数)BeforLCntを計測する。その結果を、前回
情報の格納エリアにそれぞれ格納する。ここで、領域数
とは、それぞれ黒ドットが接続している固まりの数、白
ドットが接続している固まりの数を表す。なお、上記し
た各領域の識別方法およびその計測方法は公知の方法を
用いる。
【0049】ステップ304において、膨張処理部24
では、画像の全黒画素に対して、1ドット幅(8近傍)
の画像膨張処理を行う。この画像膨張処理は、公知の手
法を用いる。なお、この膨張処理には収縮処理も含まれ
る。
【0050】ステップ305では、ステップ304の処
理で画像膨張した後の画像について、黒ドット領域数N
owICntと白ドット領域数NowLCntを計測す
る。そして、その結果を、現在領域情報の格納エリアに
それぞれ格納する。図19は、画像の膨張、収縮処理に
よって黒ドット領域数と白ドット領域数が変化する例を
示す。
【0051】ステップ306では、前回の黒ドット領域
数と現在の黒ドット領域数、前回の白ドット領域数と現
在の白ドット領域数をそれぞれ比較し、顕著な変化が続
いているか否かの判定を行い、その変化が顕著である間
は、画像膨張処理を継続する。例えば、(現在の黒ドッ
ト領域数)/(前回の黒ドット領域数)が、所定の閾値
ThIより小さく、かつ(現在の白ドット領域数)/
(前回の白ドット領域数)が、所定の閾値ThLより小
さいとき、画像膨張によるカスレ処理に効果があると判
断し、画像膨張処理を継続するために、ステップ307
に進む。ステップ306でNOであれば、画像膨張処理
のループから抜けて、ステップ309に進む。
【0052】ステップ307では、前回の黒ドット領域
数を現在の黒ドット領域数で置き換え、次の画像膨張処
理と、その結果の判定処理の準備を行う。
【0053】ステップ308では、前回の白ドット領域
数を現在の白ドット領域数で置き換え、次の画像膨張処
理と、その結果の判定処理の準備を行い、ステップ30
4に戻り、画像膨張処理を行う。
【0054】ステップ309では、地肌濃度の高い領域
あるいは網掛け領域を、べた塗り領域に変換した結果を
用いて、実施例1で説明した、べた塗り領域の抽出処理
を抽出部25で行う。図20は、地肌濃度の高い領域あ
るいは網掛け領域が、べた塗り領域に変換された例を示
す。また、以下の処理の準備として、上記抽出済みのべ
た塗り認識矩形の全てに対し、接続するもの同士による
グループ(群)分けを行う。具体的には、全てのべた塗
り認識矩形に対して所属するグループNOを付ける。グ
ループ数はM個とし、グループNOは、O〜(M−1)
で表す。なお、グループ分けの方法としては公知の方法
を用いればよい。
【0055】ステップ310では、ステップ309でグ
ループ分けされた、べた塗り矩形領域をグループ別に処
理するための識別カウンタmを0に初期設定する。ステ
ップ311では、グループ識別カウンタmの終了判定を
行い、m<MがYESであれば、グループ別処理が継続
中と判定し、ステップ312に進む。また、NOであれ
ば、グループ別処理が終了したと判定し、全ての処理が
終了する。図21は、抽出されたべた塗り領域(黒のべ
た塗り領域)を示す。
【0056】ステップ312では、ステップ302で認
識処理された区切り線や骨格線が、接続するべた塗り領
域群mに重なっているか否かを判定する。YESであれ
ば、区切り線や骨格線が誤認識されたと判定し、ステッ
プ313に進み、NOであれば、認識された区切り線や
骨格線を保存し、ステップ314に進む。
【0057】ステップ313では、誤認識された区切り
線や骨格線が、m番目の接続するべた塗り領域群に重な
る箇所を、区切線除去部26で除去し、ステップ314
に進む。ステップ314では、識別カウンタを+1して
ステップ311に戻る。
【0058】なお、本実施例においても、実施例1と同
様にソフトウェアによって実現できる。
【0059】
【発明の効果】以上、説明したように、本発明によれ
ば、スキャナで読み取った帳票画像や図面画像中から、
濃いあるいは薄い地肌色のべた塗り領域の境界線を高速
かつ精度よく抽出することができる。また、帳票内の枠
線などの区切線や家屋図面の骨格線を認識する機能と組
み合わせているので、抽出された帳票内の区切線や図面
の骨格線がべた塗り領域に重なっている場合は、それを
べた塗り領域から除くことができる。
【0060】また、スキャナの読取り濃度が合わない
(べた塗りになった)領域を読み取り条件を変えて読み
込む場合に、べた塗り箇所を高速に検索して特定するこ
とが可能になる。
【0061】さらに、同一フォーマットの定型帳票を複
数読み取って欄の位置合せを行う場合に、べた塗り領域
を使用することにより高速に位置合せをすることができ
る。
【0062】また、本発明によれば、地肌色や網掛けな
どをノイズとして除去し、文字や罫線のみが鮮鋭化され
るように2値化することができる。従って、地肌の濃度
が高い領域に記入された文字でもOCR処理することが
できる。また、着色した地肌または濃淡のある帳票を印
刷あるいは記録する場合にも、2値画像で処理できるの
で、メモリの容量を削減できる。さらに、帳票画像全体
を多値/2値変換することにより得られる2値画像と、
領域別に多値/2値変換することにより得られる2値画
像とを、それぞれ例えば機密性の帳票画像と公開性の帳
票画像とに分けて使用することもできる。
【0063】さらに、本発明によれば、地肌濃度の高い
領域あるいは網掛け領域をべた塗り領域に変換している
ので、高速かつ精度よく地肌濃度の高い領域あるいは網
掛け領域を抽出することができ、また、べた塗り領域に
重なっている区切り線を正確に除去することが可能とな
る。
【図面の簡単な説明】
【図1】本発明の実施例1の構成を示す。
【図2】本発明の実施例1の処理フローチャートを示
す。
【図3】図2の続きの処理フローチャートである。
【図4】帳票画像の一例を示す。
【図5】べた塗りの正方形を抽出した画像の例を示す。
【図6】べた塗り矩形を統合した画像の例を示す。
【図7】接続するべた塗り領域群から小面積を除いた画
像の例を示す。
【図8】接続するべた塗り領域群の輪郭線に対してフィ
ルタ処理した画像を示す。
【図9】本発明をソフトウェアによって実現する場合の
構成例を示す。
【図10】本発明の実施例2の構成を示す。
【図11】本発明の実施例2に係る処理フローチャート
である。
【図12】帳票の多値(256階調)画像データの例を
示す。
【図13】多値画像を2値画像に変換した例を示す。
【図14】2値画像から、べた塗り領域を抽出した例を
示す。
【図15】領域別に多値/2値変換を行った結果を示
す。
【図16】本発明の実施例3の構成を示す。
【図17】本発明の実施例3に係る処理フローチャート
である。
【図18】2値の帳票画像データの例を示す。
【図19】画像の膨張、収縮処理によって黒ドット領域
数と白ドット領域数が変化する例を示す。
【図20】地肌濃度の高い領域あるいは網掛け領域が、
べた塗り領域に変換された例を示す。
【図21】抽出されたべた塗り領域を示す。
【符号の説明】
1 画像入力部 2 区切線認識部 3 べた塗りパターン検索部 4 領域統合部 5 べた塗り領域抽出部 6 フィルタ処理部 7 区切線除去部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山合 敏文 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 長谷川 史裕 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 西村 隆之 鳥取県鳥取市千代水一丁目百番地 アイシ ン千代ビル リコー鳥取技術開発株式会社 内 Fターム(参考) 5B029 BB02 CC27 CC28 DD05 5B050 BA16 EA02 EA06 EA14 5B080 GA25 5L096 BA17 EA02 EA37 EA43 FA03 FA06 FA59 GA55

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 画像中から所定形状のパターンを順次大
    きさを変えながら検索することにより、べた塗り領域を
    抽出することを特徴とする画像処理方法。
  2. 【請求項2】 前記所定形状の第1の大きさのパターン
    を検索した後、前記第1のパターンに隣接する周辺の領
    域から前記第1の大きさより小さい第2の大きさのパタ
    ーンを検索することを特徴とする請求項1記載の画像処
    理方法。
  3. 【請求項3】 前記検索されたパターンの大きさが同一
    で、かつ連続しているとき、それらを一つの領域に統合
    することを特徴とする請求項1または2記載の画像処理
    方法。
  4. 【請求項4】 前記パターンは、1辺が2のn乗で、n
    を大きい値から順次小さい値に連続して変えることによ
    り生成される、異なる大きさの正方形のパターンである
    ことを特徴とする請求項1、2または3記載の画像処理
    方法。
  5. 【請求項5】 前記統合後の領域が相互に接続している
    領域群について、該領域群の面積が所定のしきい値を超
    えるとき、べた塗り領域として抽出することを特徴とす
    る請求項3記載の画像処理方法。
  6. 【請求項6】 前記抽出されたべた塗り領域の輪郭に対
    してフィルタリングを実行することを特徴とする請求項
    1または5記載の画像処理方法。
  7. 【請求項7】 前記べた塗り領域に、区切線を含む線分
    が重なっているとき、該線分を除去することを特徴とす
    る請求項1記載の画像処理方法。
  8. 【請求項8】 画像中から所定形状のパターンを順次大
    きさを変えながら検索する手段と、前記検索された同一
    パターンを一つの領域に統合する手段と、相互に接続す
    る領域の群の内、所定の面積を超える領域群をべた塗り
    領域として抽出する手段と、前記べた塗り領域の輪郭に
    対してフィルタ処理する手段と、前記べた塗り領域から
    所定の線分を除去する手段とを備えたことを特徴とする
    画像処理装置。
  9. 【請求項9】 画像中から所定形状のパターンを順次大
    きさを変えながら検索する機能と、前記検索されたパタ
    ーンを基にべた塗り領域を抽出する機能をコンピュータ
    に実現させるためのプログラムを記録したコンピュータ
    読み取り可能な記録媒体。
  10. 【請求項10】 多値画像から地肌を除去する地肌除去
    方法であって、前記多値画像の全領域に対して判別分析
    法を適用してしきい値を決定し、前記多値画像を前記し
    きい値で2値化することにより2値画像に変換した後、
    前記2値画像からべた塗り領域を抽出し、該べた塗り領
    域(以下、第1の領域)の多値画像と、全領域から前記
    第1の領域を除いた領域(以下、第2の領域)の多値画
    像に対してそれぞれ判別分析法を適用して、それぞれし
    きい値を決定し、前記第1、第2の多値画像をそれぞれ
    のしきい値で2値化することにより地肌を除去すること
    を特徴とする地肌除去方法。
  11. 【請求項11】 2値画像に対して膨張処理を繰り返し
    実行することにより、前記画像中の所定領域をべた塗り
    状態の領域に変換し、該べた塗り領域を抽出することを
    特徴とする画像処理方法。
  12. 【請求項12】 前記所定領域における、膨張処理の前
    後の黒画素および白画素の塊の数の変化量が所定値を超
    えている間、前記膨張処理を実行することを特徴とする
    請求項11記載の画像処理方法。
  13. 【請求項13】 前記所定領域は、地肌濃度の高い領域
    または網掛け領域であることを特徴とする請求項11記
    載の画像処理方法。
  14. 【請求項14】 前記べた塗り領域に、予め認識された
    区切線を含む線分が重なっているとき、該線分を除去す
    ることを特徴とする請求項14記載の画像処理方法。
JP2000030025A 1999-04-27 2000-02-08 画像処理方法、画像処理装置、地肌除去方法および記録媒体 Pending JP2001014468A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000030025A JP2001014468A (ja) 1999-04-27 2000-02-08 画像処理方法、画像処理装置、地肌除去方法および記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11970999 1999-04-27
JP11-119709 1999-04-27
JP2000030025A JP2001014468A (ja) 1999-04-27 2000-02-08 画像処理方法、画像処理装置、地肌除去方法および記録媒体

Publications (1)

Publication Number Publication Date
JP2001014468A true JP2001014468A (ja) 2001-01-19

Family

ID=26457399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000030025A Pending JP2001014468A (ja) 1999-04-27 2000-02-08 画像処理方法、画像処理装置、地肌除去方法および記録媒体

Country Status (1)

Country Link
JP (1) JP2001014468A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020009103A (ja) * 2018-07-06 2020-01-16 日立オムロンターミナルソリューションズ株式会社 帳票認識装置、帳票認識方法、及び帳票認識プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020009103A (ja) * 2018-07-06 2020-01-16 日立オムロンターミナルソリューションズ株式会社 帳票認識装置、帳票認識方法、及び帳票認識プログラム
JP7013341B2 (ja) 2018-07-06 2022-01-31 日立チャネルソリューションズ株式会社 帳票認識装置、帳票認識方法、及び帳票認識プログラム

Similar Documents

Publication Publication Date Title
Shi et al. Line separation for complex document images using fuzzy runlength
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4771804B2 (ja) レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
LeBourgeois Robust multifont OCR system from gray level images
EP1310912A2 (en) Image processing method, apparatus and system
CN107766854A (zh) 一种基于模板匹配实现快速页码识别的方法
JP4391704B2 (ja) 多値画像から二値画像を生成する画像処理装置および方法
Chanda et al. English, Devanagari and Urdu text identification
Yin Skew detection and block classification of printed documents
JP3411472B2 (ja) パターン抽出装置
WO2000062243A1 (fr) Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
JP2011248702A (ja) 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体
JP4049560B2 (ja) 網点除去方法及びシステム
Normand et al. A background based adaptive page segmentation algorithm
Mostafa An adaptive algorithm for the automatic segmentation of printed Arabic text
JP3090342B2 (ja) 文字列方向判別装置
JP2001014468A (ja) 画像処理方法、画像処理装置、地肌除去方法および記録媒体
Aparna et al. A complete OCR system development of Tamil magazine documents
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
Balasubramanian et al. Information extraction from tabular drawings
JPS6254380A (ja) 文字認識装置
JPS63157287A (ja) 文字パタ−ン抽出方法
Yoo et al. Information extraction from a skewed form document in the presence of crossing characters
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법