JPH0268676A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPH0268676A
JPH0268676A JP63219641A JP21964188A JPH0268676A JP H0268676 A JPH0268676 A JP H0268676A JP 63219641 A JP63219641 A JP 63219641A JP 21964188 A JP21964188 A JP 21964188A JP H0268676 A JPH0268676 A JP H0268676A
Authority
JP
Japan
Prior art keywords
noise
document
pixel group
document image
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63219641A
Other languages
English (en)
Inventor
Tsutomu Kuramochi
倉持 勉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP63219641A priority Critical patent/JPH0268676A/ja
Publication of JPH0268676A publication Critical patent/JPH0268676A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文書画像処理装置に関し、更に詳しくは、文
書画像中に設定した領域中のノイズを除去する文書画像
処理装置に関する。
(従来技術) 文書画像中の必要な情報とノイズを区別する方式には、
黒画素の連結成分の外接矩形を利用するものとして、矩
形の高さと幅を利用する方法がある。
例えば、特開昭E12−185284号公報では、最大
頻度となる矩形の高さと幅を代表値として、文書の構成
要素ごとに分類するための閾値を設定し、文書画像中の
ノイズ、文字、図等を分類する、すなわち、矩形の大き
さが中程度であれば文字とし、大きければ図とし、小さ
ければノイズとする手法が開示されている。
しかし、上記の方法では、必要な情報(上記の例におい
ては文字等)に比べ小さいとは限らないパンチ穴による
ノイズやその他の一定の位置と形状を持ったノイズ等を
ノイズとして抽出することは困難である。
(発明が解決しようとする課題) 本発明は、前記した従来技術の欠点に鑑み、文書画像中
に設定した領域中のノイズを容易に検出し、除去する文
書画像処理装置を提供することを目的とするものである
(課題を解決するための手段) 本発明は、第1図に示すように、文書をデジタル化した
画像として入力する画像入力手段1と、入力した文書画
像を記憶する文書画像記憶手段2と、前記文書画像にお
けるノイズ判定、除去の対象となる一定の位置および形
状を有する前記文書画像中の部分領域を設定する領域設
定手段3と、設定さ゛れた部分領域中の黒画素数をカウ
ントし、そのカウント結果に基づいてその部分領域の画
素群がノイズであるか否かを判定するノイズ判定手段4
と、ノイズ判定手段4によりノイズと判定されたとき、
そのノイズを除去するノイズ除去手段5とを備えている
(作 用) 本発明の基本的な動作フローを第2図に示す。
同図の■ないし■は主要な処理ステップを表している。
以下、簡単に説明する。
■ 予め領域設定手段3により指定される画像記憶手段
2に格納された文書画像中のノイズ判定、除去の対象と
なる部分領域の画素群(以後、着目画素群と記す)にお
ける黒画素の数を求める。
■ 処理ステップ■で求めた黒画素数と予め設定した。
閾値nとを比較し、該黒画素数の方が大きい場合には、
パンチ穴等によるノイズが存在するとみなし処理ステッ
プ■に移り、他の場合には、パンチ穴によるノイズは存
在しないとみなし処理を終了する。
■ 着目画素群をすべて白画素とすることにより、パン
チ穴等によるノイズを除去する。
本発明は、文字の大きさとあまり変わりない大きさを持
ち従来の方法では除去することのできなかったパンチ穴
のようなノイズを除去するため、そのノイズの特性、即
ちそのノイズが一定の位置とパターンを持っていること
に着目することにより、ノイズを確実かつ容易に除去す
ることができたものである。
(実施例) 以下、本発明の一実施例を図面を参照して説明する。
第3図は本発明を適用する文書画像処理装置の構成を示
すブロック図であり、この装置は、文書をディジタル化
した画像として入力する画像入力部11と、入力した文
書画像を記憶する画像データ記憶部12と、装置全体の
制御を行なう制御部13と、ノイズの除去処理を行なう
画像処理部17と、コマンド等の入力装置18と、入力
装置18から入力されるコマンド等および画像データ記
憶部12に記憶される画像データを表示するデイスプレ
ィ19と、該画像データを保有するファイル装置20と
、該画像データをプリントする画像出力部21とを備え
ている。
画像処理部17は、任意に設定した画像中の着目画素群
の位置を記憶する画素群位置記憶部14と、着目画素群
中の黒画素のを数える黒画素数カウント部15と、予め
定めた閾値以上の黒画素があればノイズとみなし、着目
画素群を全て白画素にする白画素充填部1θとからなっ
ている。
パンチ穴によるノイズの例を第4図(a)および(b)
に示す。同図(a)はパンチ穴の輪郭だけがノイズ24
となった様子を示し、同図(b)はパンチ穴全体がノイ
ズ25となった様子を示す。
どちらの状態になるかは、画像入力部、または、入力す
る状態に依有する。本実施例では、同図(a)に示した
文書画像22からパンチ穴によるノイズ24を除去する
場合について説明する。同図(b)においても、同様に
処理できる。
画素群位置記憶部14に登録する画素群の一例を第5図
(a)および(b)に示す。本実施例では、同図(a)
に示した4つ大検出用画素群28の位置情報(以後、第
1番目の位置情報と記す)と、同図(b)に示した2つ
大検出用画素群29の位置情報(以後、第2番目の位置
情報と記す)を画素位置記憶部14に登録する。位置情
報の形式としては、例えば、画素群中の全ての画素の座
標を1つの集合として扱い、該集合を1つの位置情報と
して画素位置記憶部4に登録する。登録する画素群は、
入力文書の位置ずれを考慮し、パンチ穴によるノイズよ
り多少大きめに設定する。パンチ穴によるノイズ24は
環状の形をしているので、登録する着目画素群もその環
状の画素群をカバーするそれよりやや大きい環状となる
次に、第6図に示す本発明の処理フローの一例を説明す
る。同図の■ないし■は主要な処理ステップを表してい
る。
■ 変数iに1を設定する。変数1は画素位置記憶部1
4に登録された位置情報(m個)に付けた番号を示す。
該番号は1から昇順に付ける。本実施例ではm=2であ
る。
■ 変数iがmより大きい場合には処理を終了し、他の
場合には処理ステップ■に移る。すなわち、画素位置記
憶部14に登録したm個の位置情報における処理が未了
であれば処理ステップ■に移り、他であれば処理を完了
する。
■ 画素位置記憶部14に登録した第、1番目の位置情
報により指定される画像データ記憶部12に格納された
文書画像中の着目画素群において、黒画素の数を求める
■ 処理ステップ■で求めた黒画素数と予め設定したし
きい値nとを比較し、該黒画素数の方が大きい場合には
、パンチ穴等によるノイズが存在するとみなし処理ステ
ップ■に移り、他の場合には、パンチ穴によるノイズは
存在しないとみなし処理を終了する。
第5図(a)に示した4つ穴パンチのノイズを有する文
書画像のノイズを除去する場合においては、変数が1で
あるとき、処理ステップ■で求めた黒画素数は閾値n以
下となり、変数iが2であるとき、画素数は閾値より大
きくなる。
■ 処理ステップ■における着目画素群を全て白画素と
する。該文書画像において、この処理は、変数lが2で
ある時に実行した結果を第7図に示す。
■ 変数lに1を加え、処理ステップ■に移る。
すなわち、画素位置記憶部14に登録した次の位置情報
について処理ステップ■ないし■を実行する。
以上のような処理手順により、パンチ穴によるノイズの
除去を完了する。
以上に説明した実施例では、第4図(a)に示すような
パンチ穴の縁部が印写されたノイズを除去するために、
着目画素群の領域の形状は環状形としたが、第4図(b
)に示すようなパンチ穴の全体が黒画素となったノイズ
を除去する場合には、着目画素群の領域の形状は円形に
設定すればよい。
また、以上に説明した実施例では、除去の対象とするノ
イズの種類は第4図(a)のような環状形のノイズのみ
としたが、第4図(a)、(b)の両方の種類のノイズ
を除去するように構成することもできる。その際は、画
素群位置記憶部14に登録する着目画素群の領域の形状
を環状と円形の2皿類を用意すればよい。一般的には、
この2種類に限定されるものではない。登録する画素群
の種類を増やすことにより、より多植類のパンチ穴によ
るノイズを除去することが可能となる。
前記の実施例では、パンチ穴を開ける文書の端まで文字
等の必要な情報が存在する場合、該必要な情報をパンチ
穴によるノイズとみなし除去する可能性がある。このよ
うな文書も処理の対象となることが予想される場合は、
第8図に示すように1つの文書画像中に、内側の画素群
31(第5図の画素群29に相当)および外側の画素群
32の2種類の着目画素群を設定する。画素群31中の
黒画素数が閾値pより小さい場合にのみ、パンチ穴によ
るノイズが画素群31中に存在するものとみなし、画素
群31をすべて白画素にする。第9図(a)に、第5図
(b)に示した画素群29中に文字33が存在する場合
を示す。この場合、該画素群29中の黒画素数がしきい
値nより大きくなると考えられ、文字23はパンチ穴に
よるノイズとみなされ除去される。
一方、第9図(b)には、第8図に示した画素群中31
中に文字33が存在する場合を示す。この場合゛、該画
素群21中の黒画素数がしきい値より大きくなるため、
文字23は除去されない。以上により、上記の問題点を
解決することができる。
第8図は一応用例であり、着目する画素群の位置および
一文書中の着目する画素群の種類数は任意に設定できる
(発明の効果) 以上のように本発明によれば、文字等の必要な情報に比
べ小さいとは限らないパンチ穴によるノイズやその他の
一定の位置と形状を持ったノイズを容易に検出し、該必
要な情報を除去することなく、そのノイズだけを除去す
ることができる。
【図面の簡単な説明】
第1図は本発明の構成を示すブロック図、第2図は本発
明の基本的なフローチャート、第3図は本発明の一実施
例のブロック構成図、第4図(a)および・(b)はパ
ンチ穴によるノイズを示す図、第5図(a)および(b
)は着目する画素群の位置の例を示す図、第6図は本発
明のフローチャートの一例を示す図、第7図は処理した
結果を示す図、第8図は着目する画素群の位置の例を示
す図、第9図、(a)および(b)は文字と着目する画
素群の位置関係を示す図である。 1・・・画像入力手段、2文書画像記憶手段、3・・・
領域指定手段、4・・・ノイズ判定手段、5・・・ノイ
ズ除去手段、11・・・画像入力部、12・・・画像デ
ータ記憶部、13・・・制御部、14・・・画素群位置
記憶部、15・・・黒画素カウント部、16・・・白画
素充填部、18・・・入力装置、19・・・デイスプレ
ィ、20・・・ファイル装置、21・・・画像出力部、
22.25・・・文書画像、23.33・・・文字等、
24.26.27・・・パンチ穴によるノイズ、28・
・・4つ大検出用画素群、31.32・・・2つ大検出
用画素群。 第1図 第2図 第 図 第 図 (a) (b) 第 図 第 図

Claims (1)

  1. 【特許請求の範囲】 文書をデジタル化した画像として入力する画像入力手段
    と、 画像入力手段により入力した文書画像を記憶する文書画
    像記憶手段と、 前記文書画像におけるノイズ判定、除去の対象となる一
    定の位置および形状を有する前記文書画像中の部分領域
    を設定する領域設定手段と、設定された部分領域中の黒
    画素数をカウントし、そのカウント結果に基づいてその
    部分領域の画素群がノイズであるか否かを判定するノイ
    ズ判定手段と、 ノイズ判定手段によりノイズと判定されたとき、そのノ
    イズを除去するノイズ除去手段と を有することを特徴とする文書画像処理装置。
JP63219641A 1988-09-03 1988-09-03 文書画像処理装置 Pending JPH0268676A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63219641A JPH0268676A (ja) 1988-09-03 1988-09-03 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63219641A JPH0268676A (ja) 1988-09-03 1988-09-03 文書画像処理装置

Publications (1)

Publication Number Publication Date
JPH0268676A true JPH0268676A (ja) 1990-03-08

Family

ID=16738712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63219641A Pending JPH0268676A (ja) 1988-09-03 1988-09-03 文書画像処理装置

Country Status (1)

Country Link
JP (1) JPH0268676A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003046731A (ja) * 2001-08-02 2003-02-14 Canon Inc 画像読取方法、装置、プログラム及びプログラムを記憶した媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003046731A (ja) * 2001-08-02 2003-02-14 Canon Inc 画像読取方法、装置、プログラム及びプログラムを記憶した媒体

Similar Documents

Publication Publication Date Title
EP1587295B1 (en) Boundary extracting method, program and device using the same
US8059868B2 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
US11151402B2 (en) Method of character recognition in written document
CN106599818B (zh) 一种基于图片生成笔迹格式的文件的方法及装置
US10885326B2 (en) Character recognition method
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
EP2735997B1 (en) Image processing apparatus
JPH0268676A (ja) 文書画像処理装置
US7577275B2 (en) Image processing system
CN111414877A (zh) 去除颜色边框的表格裁切方法、图像处理设备和存储介质
WO2018091100A1 (en) Method for comparing a first drawing with a second drawing by comparing their drawing elements
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JPH06103371A (ja) カラー画像処理方法およびその装置
JPH0944594A (ja) 文書画像の領域分割方法および段組種類判別方法
JP4300553B2 (ja) 画像処理装置及び画像処理方法
JPH07129713A (ja) 文字認識装置
JP6613625B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
CN114972381A (zh) 图像数据的处理方法、设备以及计算机可读存储介质
JPH06301775A (ja) 画像処理方法、画像識別方法および画像処理装置
CN114694147B (zh) 分割椭圆形图案中环绕文字的方法和装置
US20160098617A1 (en) Image evaluation device and image evaluation system
JP2882273B2 (ja) 黒色パタン抽出方法
JP2006023983A (ja) 文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体
JP2001216473A (ja) 画像処理方法、画像処理装置及び記録媒体
CN111125413A (zh) 文本图片的过滤方法、装置及电子设备