JPH0644374A - 入力イメージが空白であるかどうかを決定する方法 - Google Patents
入力イメージが空白であるかどうかを決定する方法Info
- Publication number
- JPH0644374A JPH0644374A JP5051147A JP5114793A JPH0644374A JP H0644374 A JPH0644374 A JP H0644374A JP 5051147 A JP5051147 A JP 5051147A JP 5114793 A JP5114793 A JP 5114793A JP H0644374 A JPH0644374 A JP H0644374A
- Authority
- JP
- Japan
- Prior art keywords
- image
- input image
- pixels
- size
- regions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 49
- 230000009467 reduction Effects 0.000 claims abstract description 29
- 235000002566 Capsicum Nutrition 0.000 claims description 12
- 239000006002 Pepper Substances 0.000 claims description 12
- 235000016761 Piper aduncum Nutrition 0.000 claims description 12
- 235000017804 Piper guineense Nutrition 0.000 claims description 12
- 235000008184 Piper nigrum Nutrition 0.000 claims description 12
- 239000007787 solid Substances 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 230000000873 masking effect Effects 0.000 claims description 2
- 244000203593 Piper nigrum Species 0.000 claims 1
- 238000011045 prefiltration Methods 0.000 claims 1
- 241000722363 Piper Species 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 8
- 230000000877 morphologic effect Effects 0.000 description 8
- 230000003111 delayed effect Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 230000003628 erosive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Signal Processing (AREA)
- Facsimiles In General (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
かを決定する方法。 【構成】 本方法は入力イメージ内にいろいろなイメー
ジやスキャナノイズが存在する中で確実な検出を行う。
本方法は入力イメージを低いしきい値で縮小し、連結構
成要素(8−連結または4−連結)を分類し(サイズ
で)、しきい値分析を実行する。しきい値分析には、一
般に、予想される種類のノイズの特徴的寸法を考慮した
サイズおよび数字のしきい値が必要である。縮小は、イ
メージをタイルに分割し、各タイル内の1行の画素を検
査し、テクスキャー縮小として実行してON画素が存在
するかどうかを調べる。本方法は、予想されるノイズ源
(ペッパーノイズや細い水平線)を除去するため形態論
的演算を実行する。
Description
タ化画像処理、より詳細にはイメージが実質上空白であ
るかどうかを決定する方法に関するものである。
特有の課題を与える状況の1つは、何度かファックスさ
れた用紙である。ユーザーが計算機に命令して、用紙上
のいろいろなマークセンス欄内のマーク(一般に手書き
された)に基づいてジョブを実行させるシナリオを想定
する。計算機システムは遠隔で使用され、ユーザーは用
紙をファックスで計算機内のファックスモデムへ送信す
ることが意図されている。ユーザーが用紙を持っていな
い場合には、適当なプロトコルが空白ページ(または、
大きな斜線またはXを有するページ)をユーザーのため
に計算機へファックス送信する。計算機は、これを別の
用紙を要求するため使用できるスタータ用紙として解釈
するであろう。
メージとはある程度違っていそうである。すなわち、電
話回線のノイズのために、イメージは、送信するファッ
クスによってページの上部を横切って書かれたテキス
ト、ペッパーノイズ(白い領域内の孤立した黒い画素、
またはその逆)、あるいは白い領域内の黒い画素の細い
水平線を含むことがある。イメージは、さらにスキャナ
ノイズにもさらされる。スキャナノイズは、ファックス
装置の走査プラテン上の不透明物質に起因する垂直な黒
い筋として現れることがある。空白ページをそのように
解釈するため、計算機は用紙上の意図された情報からノ
イズを区別することができなければならない。それに加
えて、計算機はこれを迅速に行わなければならない。そ
の理由は、計算機は、あらゆる単一ページ入力イメージ
にこのスクリーニングを実施しなければならないので、
計算機はこれを迅速に実行しなければならないからであ
る。さらに、計算機はこれを手際よく行わなければなら
ない。その理由は、適法な内容をもつ用紙の入力に応じ
て、スタータ用紙を送り出すことは望ましくないからで
ある。
された2進入力イメージが空白ページであるかどうかを
迅速に決定する強力な方法を提供することである。本方
法は、入力イメージ内にいろいろなイメージやスキャナ
ノイズが存在している中で、確実な読取りを可能にす
る。
を低いしきい値で縮小し、連結構成要素(8−連結また
は4−連結)を区別し(サイズによって)、しきい値分
析を実行することを意図している。しきい値分析は、一
般に、サイズおよび数字によるしきい値が必要であり、
また予想される種類のノイズの特有の寸法を考慮に入れ
ている。
ャー縮小(textured reduction) として実行する。この
テクスチャー縮小においては、イメージをタイルに分割
し、各タイル内の一行の画素のみを検査して、そこにO
N画素が存在するかどうかを調べる。もしON画素が存
在すれば、縮小したイメージ内の対応する画素はONで
ある。さもなければ、OFFである。次に、任意選択で
ある形態論的演算を実行し、予想されるノイズ源(たと
えば、ペッパーノイズや、細い水平線)を除去する。本
発明は、さらに、ファックス送信したページが垂直な黒
い筋(原文書の部分でない)を含むことを認める。従っ
て、しきい値分析は、一般に、そのページが空白でない
と結論せずに、ある程度の数の垂直筋が存在することを
許す。
読まれれば、本発明の本質および利点をより詳しく理解
することができるであろう。
れに関連して、用語「イメージ」とは、画素で構成され
た二次元データ構造の表現をいう。2進イメージは与え
られた画素が″ON″または″OFF″のどちらかであ
るイメージである。2進イメージは、1個またはそれ以
上の原始イメージを目標イメージの上に写像する多くの
演算に従って処理される。それらの処理の結果は、一般
にイメージと呼ばれる。処理する出発点であるイメージ
は、原イメージと呼ばれることもある。
OFFであると定義する。黒にONをあて、白にOFF
をあてるのは、問題のほとんどの文書が黒の前景と白の
背景を持つ事実を反映していることに留意されたい。本
発明の方法は、陰画のイメージにも同様に適用できる
が、以下、背景が白で、前景が黒の場合について説明す
る。
が2次元に広がっており、内部の実質上すべての画素が
ONである領域をいう。
較的粒の細かいパターンを含む領域をいう。テクスチャ
ー領域の例は、中間調または点描の領域である。
その他の記号(非アルファベット言語の文字を含む)を
含む文書またはイメージの部分をいう。
かなりのランレングスを有する水平線、垂直線および斜
線で構成された、テキストを除く、グラフ、図、または
線画で構成された文書またはイメージの部分をいう。線
図形は、たとえば組織図の水平線や垂直線から、機械製
図のもっと複雑な水平線、垂直線および斜線までにわた
ることがある。
域に対応するON画素の実質上べた領域を含む、原イメ
ージから正規に得られるイメージをいう。マスクは、問
題の領域に対応しないON画素の領域を含んでいてもよ
い。
つ2つのイメージの間で実行される論理演算である。
いて実行される論理演算である。
化演算である。この演算により、原始イメージ内の各画
素は画素のN×N正方配列になり、すべての画素は元の
画素と同じ値を有する。
特徴づけられる基準化演算である。倍率=Nの縮小は、
原始イメージを画素のN×N正方配列に分割し、原始イ
メージ内の各N×N正方配列を目標イメージ内の単一画
素へ写像する必要がある。目標イメージ内の画素の値
は、しきい値レベルT(1とN2 の間の数)によって決
まる。もし正方配列内のON画素の数がTに等しいかそ
れより大きければ、目標画素はONであり、さもなけれ
ばOFFである。
より小さい(一般に正方形)要素に細分し、原始イメー
ジ内の各細分した要素を目標イメージ内の単一画素へ写
像する演算である。目標画素値は原始イメージの要素内
の選択した画素によって定義される。その選択はあらか
じめ決定してもよいし(たとえば、左上の画素)、無作
為であってもよい。
成要素」)は、一組のON画素であって、組内の任意の
2画素は前記2画素を含み、かつ組内の画素のみを含む
通路によって結合することができ、そして通路上の各画
素は通路上の少なくとも1個の他の画素と横方向または
縦方向に隣接しているものである。隣接する4−連結構
成要素を持たない孤立したON画素は、定義上、4−連
結領域とみなすことができる。
成要素」)は、1組のON画素であって、組内の任意の
2画素は前記2画素を含み、かつ組内の画素のみを含む
通路によって結合することができ、そして通路上の各画
素は通路上の少なくとも1個の他の画素と横方向、縦方
向または対角線方向に隣接しているものである。隣接す
る8連結構成要素を持たないON画素は、定義上、8−
連結領域とみなすことができる。
ation)は、構造要素(structuringelement : SEと略
す)と呼ばれる画素パターンによって定義される罫線に
従って、原始イメージを等しいサイズの目標イメージの
上に写像する。SEは、中心位置と多数の画素位置によ
って定義され、それぞれ定義された値(ONまたはOF
F)を有する。「ドントケア(don't care) 」と呼ばれ
る他の画素位置は無視される。SEを形成する画素は互
いに隣接していなくてもよい。中心位置は、パターンの
幾何学的中心にある必要がなく、それどころか画素パタ
ーンの内側にすらある必要がない。
べての画素がONであるSEをいう。たとえば、2×2
べたSEはON画素の2×2正方配列である。べたSE
は長方形配列である必要がない。
少なくとも1個のON画素と少なくとも1個のOFF画
素を指定するSEをいう。
心を原始イメージ内の対応する画素位置に重ね合わせた
結果、SE内のすべてのON画素およびOFF画素と、
原始イメージ内の下に置かれた画素とが一致したときに
限り(IF-AND-ONLY IF) 、目標イメージ内の決められた
画素をONにする形態論的演算である。
イメージ内の決められた画素がONであれば、SEの中
心を目標イメージ内の対応する場所に置いて、SEを目
標イメージに書き込ませる形態論的演算である。ディレ
イションに用いるSEは、一般に、OFF画素を持たな
い。
ョンと、その次にくるディレイションより成る形態論的
演算である。その結果は、原始イメージにおける各一致
ごとに目標イメージ内にSEを複製することである。
g)」は、エロージョン(SEにヒットとミスを使用す
る)と、その次にくるディレイション(SEにヒットの
みを使用する)より成る形態論的演算である。
ションと、その次にくるエロージョンより成る形態論的
演算である。
クロージングの場合、各演算は同じSEを用いた連続す
る相補演算(complementary operation)を含んでいるの
で、結果はSEの中心位置によって影響されない。
形、形容詞形、および動詞形で呼ぶことがある。たとえ
ば、ディレイション(名詞形)のもつ内容は、イメージ
をディレイトする、あるいはディレイトされるイメージ
(動詞形)、あるいはディレイション演算を受けるイメ
ージ(形容詞形)などのように表現することがあるが、
意味に差はないものとする。
中に具体化することができる計算機システム10のブロ
ック図である。この高水準の実例で示した計算機システ
ムの構成は標準型であるので、図1には従来システムと
表示してある。しかし、システム10のような計算機シ
ステムは、本発明を具体化するように適切にプログラム
されてはいない。計算機システムは、慣例に従って、バ
スサブシステム15を通じて多数の周辺装置と通信する
処理装置12を備えている。周辺装置としては、一般
に、メモリ17、キーボードまたは他の入力装置20、
ディスプレイ22、1個またはそれ以上のハードディス
クドライブやフロッピィディスクドライブのようなファ
イル記憶装置25、プリンタ27、光学式スキャナ3
0、およびファックスモデム32がある。ファックスモ
デム32は、一般に遠隔場所にあると考えられるファッ
クス装置35と電話回線(想像線で示す)を通じて間欠
的に通信するように図示してある。計算機システム10
はファックス装置のすべての要素を含んでおり、ファッ
クス装置というときは、一般に、独立したファックス装
置ばかりでなく、上記のような計算機システムを含んで
いるものとする。
ある。本発明に従って、適切にプログラムされた処理装
置12は、2進入力イメージの一定の特徴を抽出し、分
析するように動作する。典型的なケースでは、入力イメ
ージは、スキャナ30で走査された文書40から、ある
いはファックス装置35で走査され、電話回線37を通
じてファックスモデム32へ送信された文書40から生
成される。ファックス装置35がファックスモデムを備
えた計算機であれば、その計算機で入力イメージを生成
して、ファックスモデム32へ送信することができるで
あろう。
ス装置へのコード化ファイルの転送、および出力ビット
マップへの復号は、標準ファクシミリプロトコル、たと
えばCCITTグループ3またはグループ4コード化フ
ォーマットに従って行われる。本発明の場合、出力ビッ
トマップとして上記に当てはまるものは、2進入力イメ
ージとみなす。文書40は、ユーザーが必要項目を記入
すべき空白用紙としてファックス装置35においてうま
く受信されたものとする。
典型的な一連の操作を示すフローチャートである。本発
明は、1個以上の大きな手書きマークが許される、また
は要求される可能性を前提として、ページが空白である
かどうかを決定しようとするものである。入力イメージ
は一般にファックス送信の結果であるから、本方法はフ
ァックス送信の特有のノイズの種類と人工物を考慮に入
れている。
能にする大きさだけ、走査したイメージを縮小する(ス
テップ50)。8Xから32Xまでの縮小倍率が一般的
であり、現在は16Xが好ましい。実物大で上位160
本(および、随意に下位160本)の走査線(16X縮
小で10本の走査線)のON画素を、内容に関係なく、
マスクする(ステップ52)すなわち除去する。これに
より、大部分のファックス装置によってファックス送信
されたページの上部(または、ことによると下部)に置
かれたテキストが消去される。得られたイメージをテス
トし、残っているON画素が存在するかどうかを調べる
ことができる(任意選択ステップ55)。もし存在しな
ければ、「空白ページ」の定義は大きな手書きマークの
存在を要求しないと仮定して、ページは空白と見なされ
る。
テップ55が実行されなかったと仮定して、連結構成要
素の数およびサイズに関する情報を収集する(ステップ
57)。連結構成要素情報を分析し、いろいろな属性を
1つまたはそれ以上のしきい値と比較する(ステップ6
0)。関係のある連結構成要素の属性のどれもがしきい
値を越えなければ、ページは空白とみなされる。次に述
べるように、関係のある情報およびしきい値は、「空白
ページ」の定義が大きなマークの存在を許すかまたは要
求するかどうかによって決まる。もし関係のある連結構
成要素の属性のどれかがしきい値を越えていれば、イメ
ージは空白ページでないとみなされ、一般に、イメージ
から情報を抽出するためさらに処理される。
速に実施するには、初期段階での縮小が必要である。適
当な縮小を実施する方法は多数あるが、目下のところ好
ましい方法は、米国特許出願(Docket No. 13188-46 ,
発明の名称″USE OF FAST TEXTURED REDUCTION FOR DIS
CRIMINATON OF DOCUMENT IMAGE COMPONENTS ″に記載さ
れている方法である。簡単に説明すると、好ましい縮小
方法は、イメージをタイル(このケースでは、16×1
6画素)に細分し、タイル内の画素の所定の部分集合が
しきい値条件を満たすかどうかに基づいて、縮小したイ
メージ内の対応する単一画素の値を設定する。特に効率
の良い実施は、タイル内の画素の最初の行をとることで
ある。もし行内の少なくとも1個の画素がONであれ
ば、縮小したイメージ内の画素はONである。もし画素
がONでなければ、縮小したイメージ内の画素はOFF
である。これは、しきい値=1による水平プリフィルタ
テクスチャー縮小(horizontally prefiltered texture
d reduction ) と呼ばれる。
2Xしきい値縮小を使用してイメージを縮小することも
できる。上記の縮小を実施する具体的な方法は、米国特
許出願第449,627 号(1989 年12月8日出願、発明の名
称″IMAGE REDUCTION/ENLARGEMENT TECHNIQUE ″) に記
載されている。2×2縮小ケースのための最適化として
は、行と列の間で論理演算を使用すること、参照用テー
ブルを使用して列演算を実行すること、および専用ハー
ドウェアを使用することがある。また、標準サブサンプ
リングを使用することにより、すなわち各タイル内の特
定の画素を選択し、その画素の値を縮小したイメージ内
の対応する画素の値として使用することにより、縮小を
実行することができる。
分析が8−連結構成要素に関する場合のステップ57を
実行する代替手法を示すフローチャートである。図5お
よび図6は、分析が8−連結構成要素でなく4−連結構
成要素に関する場合の図3および図4に対応するフロー
チャートである。16X縮小では、2×2画素より小さ
いどんな連結構成要素もペッパーノイズとみなされる。
すべての場合において、ペッパーノイズは除去されるか
または無視され、その存在は最終決定の要素にならな
い。
構成要素にラベルを付ける(ステップ70)。これに
は、各8−連結構成要素ごとに最小包囲長方形(限界
枠)の位置と大きさを決定する必要がある。次に、ペッ
パーノイズより大きなサイズをもつ8−連結構成要素の
数を決定する(ステップ72)。このしきい値は2×2
にすることができる。図4の方法は、最初に、マスクし
たイメージを2×2べたSE77でオープンする(ステ
ップ75)。このステップ75は、ペッパーノイズおよ
び1画素太さの水平線(電話回線のノイズによって生じ
ることがある)を除去する効果を有する。次に、すべて
の8−連結構成要素にラベルを付け(ステップ80)、
カウントする(ステップ82)。
ジを、2×1垂直SE87、1×2水平SE90、また
は2×2SE92のどれかでディレイトする(ステップ
85)。このディレイションにより、すべての8−連結
構成要素は4−連結構成要素へ変換される。次に、すべ
ての4−連結構成要素にラベルを付け(ステップ9
5)、カウントする(ステップ97)。イメージはSE
87,90,および92のうちの1つでディレイトされ
たものと仮定すると、ペッパーノイズのサイズしきい値
(上に2×2であると仮定した)は、ディレイションの
ためどのサイズのSEを使用したかに従って、3×2、
2×3、または3×3になるであろう。図6の方法は、
最初に、イメージを2×1垂直SE102、1×2水平
SE105、または2×2SE107でディレイトする
(ステップ100)。次に、ディレイトしたイメージ
を、ディレイションにどのSEが使用されたかに従っ
て、3×2SE112、2×3SE115、または3×
3SE117でオープンする(ステップ110)。次に
4−連結構成要素にラベルを付け(ステップ120)、
カウントする(ステップ122)。
得られるが、4−連結構成要素にラベルを付けるソフト
ウェアは、一般に8−連結構成要素にラベルを付けるソ
フトウェアより簡単である。従って、実施の点からは、
図5および図6の方法のほうが好ましい。
成要素に関する座標情報を抽出する方法を示すフローチ
ャートである。左上でスタートし、左から右へ、上から
下へ進み、ON画ソフトウェアが見つかるまで縮小した
イメージのコピーを計算機で走査する(すなわち、各画
素を評価する)(ステップ160)。その画素の座標を
保存する。その座標は、初めにその画素が属する連結構
成要素の限界枠の隅に関する現在の最良の情報を表して
いる(限界枠は、その左上隅および右下隅によって完全
に特定される)。見つけた画素および隣接するすべての
4−連結構成要素をOFFにする(ステップ162)。
各画素をOFFにしたとき、その座標と現在の隅座標と
を比較する。もしどちらかの座標が現在の限界枠の範囲
外にあれば、適当な隅座標を更新して、今現在の限界枠
を拡張する。隣接する4連結構成要素を見つけてOFF
にする方法は、Paul S.Feckbert,″A Seed Fill Algori
thm ″, pages 275-277 and 721-722 of ″Graphics G
ems ″(Acadmic Press, Inc. 1990 ) に記載されてい
る。
の座標を保存したあと(ステップ165)、今消去した
構成要素の最初の画素が見つかった位置の直後からスタ
ートし、走査を再開する。もし別のON画素が見つかれ
ば(ステップ168)、手続きをを繰り返す。再開した
走査がON画素を見つけなければ、手続きは終了し、関
係のある限界枠情報を抽出することができる。
イメージを縮小し、そして縮小したイメージ内の連結構
成要素のサイズおよび位置に関する情報を得るため、多
くの演算を受けさせる。もし形態論的演算を使用してペ
ッパーノイズや細い水平線を除去する図4および図6の
方法を適用すれば、それらのノイズ源は連結構成要素情
報の一部で無くなる。いずれにせよ、関係のあるのは、
連結構成要素に関する情報であり、連結構成要素の限界
枠は、ノイズの特性的寸法より大きな2つの寸法を有す
る。
は、走査プラテン上のほこりから生じる垂直な筋であ
る。筋の幅は、一般に約0.2インチ以下である(20
0 dpiの全解像度で約40画素、すなわち16X縮小で
約3画素に相当する)。比較的少数(たとえば、5本程
度)の筋が存在しても、一般に、それがなかったとした
ら空白のページが空白と見なされる資格を失わないであ
ろう。しかし、それは設計上の選択の問題であり、もし
所望ならば、その基準を厳しく、または緩くすることが
できる。
トは、どの連結構成要素も予想される筋の幅より広くな
く、あるいは電話回線のノイズによる水平線の予想高さ
より高くない限り、ペッパーノイズより大きい(どちら
かの寸法)連結構成要素は一定の数以上存在しないこと
である。このテストは、3画素(もしイメージが1×2
または2×2SEでディレイトされたならば、4画素)
より広く、かつ1画素(もしイメージが1×2または2
×2SEでディレイトされたならば、2画素)以上の高
さの連結構成要素は存在しないことを単に検査するだけ
で簡単に実行できる。
付ける前に1×4または1×5SEでイメージをオープ
ンして垂直筋を除去し、電話回線ノイズによる予想高さ
より高い連結構成要素が存在しないことを調べることに
より、テストを実行することができる。もし細い水平線
を除去するためイメージが以前にオープンされなかった
ならば、垂直筋を除去するために、オープニングを実行
することは好ましい。この理由は、もしイメージが交差
する細い水平線と垂直筋を含んでいれば、連結構成要素
にラベルを付ける前にその一方または他方を除去しない
限り、両者は大きな連結構成要素として現れるからであ
る。
Xを付けることを許す、または要求することが要望され
たならば、上記のテストの変更を考えることができる。
その場合には、テストは、連結構成要素が特定の非ゼロ
数より少ないか、または正確に前記特定の非ゼロ数であ
ることを要求するであろう。
実施例を実施する一連の特定の操作を示すフローチャー
トである。この実施例は大きなマークを許さない。最初
に、走査したイメージを、水平プリフィルタテクスチャ
ー縮小(horizontal prefiltered textured reduction
) を使用して16Xの倍率で縮小する(ステップ17
0)。次に、上位および下位10本の走査線をマスクし
(ステップ172)、得られたイメージをテストして残
っているON画素があるかどうかを調べる(ステップ1
75)。もしなければ、ページは空白とみなされる。さ
もなければ、処理を続ける。
レイトし(ステップ177)、すべての4−連結構成要
素にラベルを付ける(ステップ182)。次に、4画素
(垂直筋のためのサイズしきい値)より広い限界枠を有
する構成要素の数(N1)をカウントし(ステップ18
5)、この数とゼロとを比較する(ステップ187)。
もしN1がゼロより大きければ、ページは空白でないと
みなされる。この実施例は、垂直筋を有するイメージを
空白として受け入れるが、1つまたはそれ以上の細い
(1画素高さ)水平線を有するイメージは拒絶する(空
白とみなさない)であろう。もしN1がゼロより大きく
なければ、2画素より広く、かつ2画素より高い限界枠
を有する連結構成要素の数(N2)をカウントする(ス
テップ190)。1画素ペッパーノイズ線はここでは問
題にならないが、大部分の垂直筋はたぶん問題とされ
る。次に、N2と数字のしきい値(このケースでは、
5)とを比較する(ステップ192)。もしN2がしき
い値以上であれば、ページは空白とみなされない。もし
連結構成要素が5つまたはそれ以下であれば、ページは
空白とみなされる。
例を実施する特定の一連の操作を示すフローチャートで
ある。手続きは、前に述べた実施例の場合と同様に、縮
小ステップ200、マスキングステップ202、および
テスト205を含む。次に、イメージを2×1垂直SE
210でオープンする(ステップ207)。このステッ
プは、1×1ペッパーノイズと1画素高さの水平線を除
去する効果を有する。次に、4−連結構成要素にラベル
を付け(ステップ212)、4画素より広い限界枠を有
する連結構成要素の数(N1)を決定する。もしN1が
ゼロ以上であれば、ページは空白でないとみなされる
(ステップ217)。さもなければ、連結構成要素の総
数(N2)を決定し(ステップ220)、しきい値(こ
のケースでは、5)と比較する。もしN1が5以上であ
れば、ページは空白でないとみなされる。さもなけれ
ば、空白とみなされる。
は、パソコン上でソフトウェアによって実施される。い
ろいろな種類の形態論的演算をサンワークステーション
(Sun Workstation)で実施するためのC言語のソースコ
ードが、米国特許第5,065,437 号 (発明の名称″Identi
fication and Segmentation of Finely Texured and So
lid Regions of BinaryImages″) に開示されている。
されたイメージは空白ページとして発信したかどうかを
決定する強力な方法が提供されたことがわかる。本方法
は、さまざまな形式のスキャナ、およびファックスされ
た文書に存在すると思われる送信ノイズを考慮に入れて
いる。
が、いろいろな修正物および均等物を使用することがで
きる。従って、上記の説明および図面は、特許請求の範
囲に記載された発明の範囲を制限するものと解釈すべき
でない。
システムのブロック図である。
どうかを決定する本発明の方法を示すフローチャートで
ある。
ローチャートである。
ローチャートである。
ローチャートである。
ローチャートである。
ートである。
一連の操作を示すフローチャートである。
めの特定の一連の操作を示すフローチャートである。
Claims (15)
- 【請求項1】 ディジタル処理装置において実行され、
2進入力イメージが実質上空白であるかどうかを決定す
る方法であって、 入力イメージに縮小演算を実施し、得られた結果を提供
すること、 少なくとも定められたレベル連結性によって特徴付けら
れるすべての領域にラベルを付けること、および上記ス
テップによってラベルが付けられた、所定の数以上の領
域がサイズしきい値を越えているかどうかを決定するこ
と、 の諸ステップより成ることを特徴とする方法。 - 【請求項2】 さらに、前記縮小演算ステップの前に実
行され、イメージの上部および下部にある水平ストリッ
プ内のどのON画素も前記決定ステップに影響を及ぼさ
ないように、前記水平ストリップをマスクするステップ
を含んでいることを特徴とする請求項1に記載の方法。 - 【請求項3】 前記定められたレベルの連結性は、4−
連結であることを特徴とする請求項1に記載の方法。 - 【請求項4】 前記定められたレベルの連結性は、8−
連結であることを特徴とする請求項1に記載の方法。 - 【請求項5】 前記ラベルを付けるステップは、 得られたイメージをべた構造要素(SE)でディレイト
し、すべての8−連結領域を後に得られたイメージ内の
4−連結領域へ変換すること、および後に得られたイメ
ージ内のすべての4−連結領域にラベルを付けること、 のサブステップより成ることを特徴とする請求項4に記
載の方法。 - 【請求項6】 前記縮小演算は、水平プリフィルタテク
スチャー縮小演算(horizontally prefiltered texture
d reduction operation ) であることを特徴とする請求
項1に記載の方法。 - 【請求項7】 さらに、前記ラベルを付けるステップの
前に実行され、 入力イメージに高速垂直プリフィルタテクスチャー縮小
演算(fast textured vertically prefiltered reducti
on operation )を実施し、第2のイメージを提供するこ
と、および最初に得られたイメージと2番目に得られた
イメージを論理的にOR演算すること、 の諸ステップを含むことを特徴とする請求項6に記載の
方法。 - 【請求項8】 前記ラベルを付けるステップは、 少なくとも定められたレベルの連結性を有する各領域に
ついて、連結領域を取り囲む最小長方形の寸法を決定す
るサブステップを含むことを特徴とする請求項1に記載
の方法。 - 【請求項9】 ディジタル処理装置において実行され、
2進入力イメージが空白ページであるかどうかを決定
し、その決定に基づいて第1および第2のどちらか一方
の行動をとる方法であって、 入力イメージに高速水平プリフィルタサブサンプリング
演算(fast horizontally prefiltered subsampling op
eration )を実施し、縮小イメージを提供すること、 前記縮小イメージをべた構造要素(SE)でディレイト
し、ON画素のすべての拡張した領域を4−連結領域に
すること、 すべての4−連結領域のサイズを決定すること、 第1の所定の数より多くの4−連結領域が第1サイズし
きい値を越えているかどうかを決定し、もし越えていれ
ば、第2の行動をとること、およびもし第2の行動を取
らなかったならば、第2の所定の数より多くの4−連結
領域が第1サイズしきい値より小さい第2のサイズしき
い値を越えているかを決定し、もし越えてなければ、第
1の行動をとること、 の諸ステップより成ることを特徴とする方法。 - 【請求項10】 前記第1の所定の数は、ゼロであるこ
とを特徴とする請求項9に記載の方法。 - 【請求項11】 さらに、前記ディレイトするステップ
の前に実行され、イメージの上部および下部にある水平
ストリップ内のどのON画素も前記決定ステップの結果
に影響を及ぼさないように、前記水平ストリップをマス
クするステップを含むことを特徴とする請求項9に記載
の方法。 - 【請求項12】 ディジタル処理装置において実行さ
れ、2進入力イメージが空白ページであるかどうかを決
定する方法であって、 入力イメージに、テクスチャー水平プリフィルタサブサ
ンプリング演算(textured horizontally prefiltered
subsampling operation ) を実施し、縮小イメージを提
供すること、 得られたイメージをべた構造要素(SE)でオープンし
て、べた構造要素より小さいペッパーノイズのないイメ
ージを提供すること、 少なくとも定められたレベルの連続性によって特徴付け
られるすべての領域にラベルを付けること、および定め
られたサイズより大きい領域の数が、所定の数より大き
いかどうかを決定すること、 の諸ステップより成ることを特徴とする方法。 - 【請求項13】 さらに、前記オープニングステップの
前に実行され、イメージの上部および下部にある水平ス
トリップ内のどのON画素も前記決定ステップの結果に
影響を及ぼさないように、前記水平ストリップをマスク
するステップを含むことを特徴とする請求項12に記載
の方法。 - 【請求項14】 さらに、前記決定ステップの結果が否
定的であるときに限り実行され、決められた第2のサイ
ズより大きい領域の数が、第2の所定の数以上であるか
どうかを決定するステップを含んでいることを特徴とす
る請求項12に記載の方法。 - 【請求項15】 前記第2の所定の数は、1であること
を特徴とする請求項12に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/855,375 US5467410A (en) | 1992-03-20 | 1992-03-20 | Identification of a blank page in an image processing system |
US07/855375 | 1992-03-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0644374A true JPH0644374A (ja) | 1994-02-18 |
JP3296874B2 JP3296874B2 (ja) | 2002-07-02 |
Family
ID=25321089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05114793A Expired - Lifetime JP3296874B2 (ja) | 1992-03-20 | 1993-03-12 | 入力イメージが空白であるかどうかを決定する方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5467410A (ja) |
JP (1) | JP3296874B2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5689575A (en) * | 1993-11-22 | 1997-11-18 | Hitachi, Ltd. | Method and apparatus for processing images of facial expressions |
EP0720114B1 (en) * | 1994-12-28 | 2001-01-24 | Siemens Corporate Research, Inc. | Method and apparatus for detecting and interpreting textual captions in digital video signals |
JP3427554B2 (ja) * | 1995-03-01 | 2003-07-22 | オムロン株式会社 | 画像処理装置及び方法 |
US5781667A (en) * | 1995-07-31 | 1998-07-14 | Neopath, Inc. | Apparatus for high speed morphological processing |
US6181835B1 (en) * | 1997-12-26 | 2001-01-30 | International Business Machines Corporation | Non-integer scaling of raster images with image quality enhancement using an anamorphically scaled intermediate bitmap |
US6226420B1 (en) * | 1997-12-26 | 2001-05-01 | International Business Machines Corporation | Non-integer scaling of raster images |
US6195473B1 (en) * | 1997-12-26 | 2001-02-27 | International Business Machines Corporation | Non-integer scaling of raster images with image quality enhancement |
US6522431B1 (en) | 1999-04-26 | 2003-02-18 | Xerox Corporation | System for minimizing image defects in a hard-copy input scanner |
US6393161B1 (en) | 1999-04-26 | 2002-05-21 | Xerox Corporation | Software system for minimizing image defects in a hard-copy input scanner |
JP2003298799A (ja) * | 2002-04-01 | 2003-10-17 | Pfu Ltd | 画像処理装置 |
DE10329339B4 (de) * | 2003-06-30 | 2007-04-26 | OCé PRINTING SYSTEMS GMBH | Verfahren und Vorrichtung zum Aufbereiten einer Bildpunktdatei |
US20050063568A1 (en) * | 2003-09-24 | 2005-03-24 | Shih-Ching Sun | Robust face detection algorithm for real-time video sequence |
US20050160194A1 (en) * | 2004-01-16 | 2005-07-21 | Bango Joseph J. | Method of limiting amount of waste paper generated from printed documents |
US8237951B2 (en) * | 2005-05-11 | 2012-08-07 | Sharp Laboratories Of America, Inc. | Intermediate stage emulation of firmware on connected host |
JP5760703B2 (ja) * | 2011-05-30 | 2015-08-12 | 株式会社リコー | 画像処理装置、画像処理プログラムおよび記録媒体 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3113555A1 (de) * | 1981-04-03 | 1982-10-21 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen |
US4541116A (en) * | 1984-02-27 | 1985-09-10 | Environmental Research Institute Of Mi | Neighborhood image processing stage for implementing filtering operations |
JPS62272751A (ja) * | 1986-05-21 | 1987-11-26 | Matsushita Graphic Commun Syst Inc | フアクシミリ蓄積同報装置 |
JPS6395578A (ja) * | 1986-10-13 | 1988-04-26 | Canon Inc | 画像情報処理装置 |
JPS63155386A (ja) * | 1986-12-19 | 1988-06-28 | Ricoh Co Ltd | 帳票デ−タ読取装置 |
US5144682A (en) * | 1987-03-05 | 1992-09-01 | Ricoh Company, Ltd. | Method and an apparatus for isolating an area corresponding to a character or word |
JP2752062B2 (ja) * | 1987-03-30 | 1998-05-18 | 三洋電機株式会社 | 情報フアイル装置 |
US5038381A (en) * | 1988-07-11 | 1991-08-06 | New Dest Corporation | Image/text filtering system and method |
US4975972A (en) * | 1988-10-18 | 1990-12-04 | At&T Bell Laboratories | Method and apparatus for surface inspection |
US5282050A (en) * | 1988-10-31 | 1994-01-25 | Canon Kabushiki Kaisha | Dual-side recording apparatus |
US5224179A (en) * | 1988-12-20 | 1993-06-29 | At&T Bell Laboratories | Image skeletonization method |
US4893333A (en) * | 1989-03-14 | 1990-01-09 | Paul Baran | Interactive facsimile system and method of information retrieval |
US5291592A (en) * | 1989-05-15 | 1994-03-01 | Sharp Kabushiki Kaisha | System having document scanner for optically scanning information whereby a first information contains control information indicating a number of sheets to be scanned |
JPH03150672A (ja) * | 1989-11-08 | 1991-06-27 | Toshiba Corp | ナンバプレート検出装置 |
US5129014A (en) * | 1989-12-08 | 1992-07-07 | Xerox Corporation | Image registration |
US5048109A (en) * | 1989-12-08 | 1991-09-10 | Xerox Corporation | Detection of highlighted regions |
US5065437A (en) * | 1989-12-08 | 1991-11-12 | Xerox Corporation | Identification and segmentation of finely textured and solid regions of binary images |
US5131049A (en) * | 1989-12-08 | 1992-07-14 | Xerox Corporation | Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask |
JP2523222B2 (ja) * | 1989-12-08 | 1996-08-07 | ゼロックス コーポレーション | 画像縮小/拡大方法及び装置 |
JPH04275772A (ja) * | 1991-03-04 | 1992-10-01 | Eastman Kodak Japan Kk | 画像読み取り装置 |
US5212742A (en) * | 1991-05-24 | 1993-05-18 | Apple Computer, Inc. | Method and apparatus for encoding/decoding image data |
-
1992
- 1992-03-20 US US07/855,375 patent/US5467410A/en not_active Expired - Lifetime
-
1993
- 1993-03-12 JP JP05114793A patent/JP3296874B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US5467410A (en) | 1995-11-14 |
JP3296874B2 (ja) | 2002-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3372282B2 (ja) | 2進入力イメージを縮小する方法 | |
JP2880572B2 (ja) | 中間調領域用分離マスクの構成方法 | |
JP3051182B2 (ja) | ハイライト領域検出方法 | |
US5065437A (en) | Identification and segmentation of finely textured and solid regions of binary images | |
US5272764A (en) | Detection of highlighted regions | |
EP0713329B1 (en) | Method and apparatus for automatic image segmentation using template matching filters | |
EP0490687B1 (en) | Method and apparatus for image processing | |
JP3305772B2 (ja) | 形態学的技術を用いて手書き指示イメージを検出する方法 | |
JP3086702B2 (ja) | テキスト又は線図形を識別する方法及びデジタル処理システム | |
US5568571A (en) | Image enhancement system | |
JP4261005B2 (ja) | 領域ベースのイメージ2値化システム | |
JP3296874B2 (ja) | 入力イメージが空白であるかどうかを決定する方法 | |
JPH06124358A (ja) | 用紙上のマークを検出する方法 | |
JPH07131641A (ja) | 画像処理装置 | |
JPH0879536A (ja) | 画像処理方法 | |
JP4164489B2 (ja) | 文書画像強調方法、装置及びそのための記憶媒体 | |
Ozawa et al. | A character image enhancement method from characters with various background images | |
AU4207400A (en) | Intelligent detection of text on a page | |
EP0870276B1 (en) | A method for transforming a gray-level image into a black-and-white image | |
KR100537827B1 (ko) | 경계선 분포를 이용한 스캔 영상의 상역 분리 방법 | |
US7567725B2 (en) | Edge smoothing filter for character recognition | |
EP0974931A1 (en) | Method and apparatus for identifying a plurality of sub-images in an input image | |
JP2004048130A (ja) | 画像処理方法、画像処理装置、および画像処理プログラム | |
JPH0766976A (ja) | 画像処理装置 | |
Cinque et al. | Handling Artifacts in digitally reproduced documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020304 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090412 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090412 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100412 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110412 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120412 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120412 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130412 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term |