JPH0644374A - 入力イメージが空白であるかどうかを決定する方法 - Google Patents

入力イメージが空白であるかどうかを決定する方法

Info

Publication number
JPH0644374A
JPH0644374A JP5051147A JP5114793A JPH0644374A JP H0644374 A JPH0644374 A JP H0644374A JP 5051147 A JP5051147 A JP 5051147A JP 5114793 A JP5114793 A JP 5114793A JP H0644374 A JPH0644374 A JP H0644374A
Authority
JP
Japan
Prior art keywords
image
input image
pixels
size
regions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5051147A
Other languages
English (en)
Other versions
JP3296874B2 (ja
Inventor
Dan S Bloomberg
エス ブルームバーグ ダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH0644374A publication Critical patent/JPH0644374A/ja
Application granted granted Critical
Publication of JP3296874B2 publication Critical patent/JP3296874B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Facsimiles In General (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 2進入力イメージが空白ページであるかどう
かを決定する方法。 【構成】 本方法は入力イメージ内にいろいろなイメー
ジやスキャナノイズが存在する中で確実な検出を行う。
本方法は入力イメージを低いしきい値で縮小し、連結構
成要素(8−連結または4−連結)を分類し(サイズ
で)、しきい値分析を実行する。しきい値分析には、一
般に、予想される種類のノイズの特徴的寸法を考慮した
サイズおよび数字のしきい値が必要である。縮小は、イ
メージをタイルに分割し、各タイル内の1行の画素を検
査し、テクスキャー縮小として実行してON画素が存在
するかどうかを調べる。本方法は、予想されるノイズ源
(ペッパーノイズや細い水平線)を除去するため形態論
的演算を実行する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、一般には、コンピュー
タ化画像処理、より詳細にはイメージが実質上空白であ
るかどうかを決定する方法に関するものである。
【0002】
【従来の技術】コンピュータ化画像処理に対し幾つかの
特有の課題を与える状況の1つは、何度かファックスさ
れた用紙である。ユーザーが計算機に命令して、用紙上
のいろいろなマークセンス欄内のマーク(一般に手書き
された)に基づいてジョブを実行させるシナリオを想定
する。計算機システムは遠隔で使用され、ユーザーは用
紙をファックスで計算機内のファックスモデムへ送信す
ることが意図されている。ユーザーが用紙を持っていな
い場合には、適当なプロトコルが空白ページ(または、
大きな斜線またはXを有するページ)をユーザーのため
に計算機へファックス送信する。計算機は、これを別の
用紙を要求するため使用できるスタータ用紙として解釈
するであろう。
【0003】しかし、計算機が受け取るものは、空白イ
メージとはある程度違っていそうである。すなわち、電
話回線のノイズのために、イメージは、送信するファッ
クスによってページの上部を横切って書かれたテキス
ト、ペッパーノイズ(白い領域内の孤立した黒い画素、
またはその逆)、あるいは白い領域内の黒い画素の細い
水平線を含むことがある。イメージは、さらにスキャナ
ノイズにもさらされる。スキャナノイズは、ファックス
装置の走査プラテン上の不透明物質に起因する垂直な黒
い筋として現れることがある。空白ページをそのように
解釈するため、計算機は用紙上の意図された情報からノ
イズを区別することができなければならない。それに加
えて、計算機はこれを迅速に行わなければならない。そ
の理由は、計算機は、あらゆる単一ページ入力イメージ
にこのスクリーニングを実施しなければならないので、
計算機はこれを迅速に実行しなければならないからであ
る。さらに、計算機はこれを手際よく行わなければなら
ない。その理由は、適法な内容をもつ用紙の入力に応じ
て、スタータ用紙を送り出すことは望ましくないからで
ある。
【0004】
【発明が解決しようとする課題】本発明の目的は、発信
された2進入力イメージが空白ページであるかどうかを
迅速に決定する強力な方法を提供することである。本方
法は、入力イメージ内にいろいろなイメージやスキャナ
ノイズが存在している中で、確実な読取りを可能にす
る。
【0005】
【課題を解決するための手段】本発明は、入力イメージ
を低いしきい値で縮小し、連結構成要素(8−連結また
は4−連結)を区別し(サイズによって)、しきい値分
析を実行することを意図している。しきい値分析は、一
般に、サイズおよび数字によるしきい値が必要であり、
また予想される種類のノイズの特有の寸法を考慮に入れ
ている。
【0006】特定の実施例においては、縮小をテクスチ
ャー縮小(textured reduction) として実行する。この
テクスチャー縮小においては、イメージをタイルに分割
し、各タイル内の一行の画素のみを検査して、そこにO
N画素が存在するかどうかを調べる。もしON画素が存
在すれば、縮小したイメージ内の対応する画素はONで
ある。さもなければ、OFFである。次に、任意選択で
ある形態論的演算を実行し、予想されるノイズ源(たと
えば、ペッパーノイズや、細い水平線)を除去する。本
発明は、さらに、ファックス送信したページが垂直な黒
い筋(原文書の部分でない)を含むことを認める。従っ
て、しきい値分析は、一般に、そのページが空白でない
と結論せずに、ある程度の数の垂直筋が存在することを
許す。
【0007】添付図面を参照して明細書の残りの部分を
読まれれば、本発明の本質および利点をより詳しく理解
することができるであろう。
【0008】
【実施例】
(定義と用語)ここでは、2進イメージを取り扱う。こ
れに関連して、用語「イメージ」とは、画素で構成され
た二次元データ構造の表現をいう。2進イメージは与え
られた画素が″ON″または″OFF″のどちらかであ
るイメージである。2進イメージは、1個またはそれ以
上の原始イメージを目標イメージの上に写像する多くの
演算に従って処理される。それらの処理の結果は、一般
にイメージと呼ばれる。処理する出発点であるイメージ
は、原イメージと呼ばれることもある。
【0009】「画素」は、黒であればON、白であれば
OFFであると定義する。黒にONをあて、白にOFF
をあてるのは、問題のほとんどの文書が黒の前景と白の
背景を持つ事実を反映していることに留意されたい。本
発明の方法は、陰画のイメージにも同様に適用できる
が、以下、背景が白で、前景が黒の場合について説明す
る。
【0010】イメージの「べた領域」とは、多くの画素
が2次元に広がっており、内部の実質上すべての画素が
ONである領域をいう。
【0011】イメージの「テクスチャー領域」とは、比
較的粒の細かいパターンを含む領域をいう。テクスチャ
ー領域の例は、中間調または点描の領域である。
【0012】「テキスト」とは、文字、数字、あるいは
その他の記号(非アルファベット言語の文字を含む)を
含む文書またはイメージの部分をいう。
【0013】「線図形」とは、一般にテキストに比べて
かなりのランレングスを有する水平線、垂直線および斜
線で構成された、テキストを除く、グラフ、図、または
線画で構成された文書またはイメージの部分をいう。線
図形は、たとえば組織図の水平線や垂直線から、機械製
図のもっと複雑な水平線、垂直線および斜線までにわた
ることがある。
【0014】「マスク」とは、原イメージ内の問題の領
域に対応するON画素の実質上べた領域を含む、原イメ
ージから正規に得られるイメージをいう。マスクは、問
題の領域に対応しないON画素の領域を含んでいてもよ
い。
【0015】AND、OR、およびXORは、1画素づ
つ2つのイメージの間で実行される論理演算である。
【0016】NOTは、1画素づつ、単一イメージにつ
いて実行される論理演算である。
【0017】「拡大」は、倍率Nで特徴づけられる基準
化演算である。この演算により、原始イメージ内の各画
素は画素のN×N正方配列になり、すべての画素は元の
画素と同じ値を有する。
【0018】「縮小」は、倍率Nとしきい値レベルTで
特徴づけられる基準化演算である。倍率=Nの縮小は、
原始イメージを画素のN×N正方配列に分割し、原始イ
メージ内の各N×N正方配列を目標イメージ内の単一画
素へ写像する必要がある。目標イメージ内の画素の値
は、しきい値レベルT(1とN2 の間の数)によって決
まる。もし正方配列内のON画素の数がTに等しいかそ
れより大きければ、目標画素はONであり、さもなけれ
ばOFFである。
【0019】「サブサンプリング」は、原始イメージを
より小さい(一般に正方形)要素に細分し、原始イメー
ジ内の各細分した要素を目標イメージ内の単一画素へ写
像する演算である。目標画素値は原始イメージの要素内
の選択した画素によって定義される。その選択はあらか
じめ決定してもよいし(たとえば、左上の画素)、無作
為であってもよい。
【0020】「4−連結領域」(すなわち「4−連結構
成要素」)は、一組のON画素であって、組内の任意の
2画素は前記2画素を含み、かつ組内の画素のみを含む
通路によって結合することができ、そして通路上の各画
素は通路上の少なくとも1個の他の画素と横方向または
縦方向に隣接しているものである。隣接する4−連結構
成要素を持たない孤立したON画素は、定義上、4−連
結領域とみなすことができる。
【0021】「8−連結領域」(すなわち「8−連結構
成要素」)は、1組のON画素であって、組内の任意の
2画素は前記2画素を含み、かつ組内の画素のみを含む
通路によって結合することができ、そして通路上の各画
素は通路上の少なくとも1個の他の画素と横方向、縦方
向または対角線方向に隣接しているものである。隣接す
る8連結構成要素を持たないON画素は、定義上、8−
連結領域とみなすことができる。
【0022】多数の形態論的演算(morphological oper
ation)は、構造要素(structuringelement : SEと略
す)と呼ばれる画素パターンによって定義される罫線に
従って、原始イメージを等しいサイズの目標イメージの
上に写像する。SEは、中心位置と多数の画素位置によ
って定義され、それぞれ定義された値(ONまたはOF
F)を有する。「ドントケア(don't care) 」と呼ばれ
る他の画素位置は無視される。SEを形成する画素は互
いに隣接していなくてもよい。中心位置は、パターンの
幾何学的中心にある必要がなく、それどころか画素パタ
ーンの内側にすらある必要がない。
【0023】「べた(solid)」SEとは、外周の中のす
べての画素がONであるSEをいう。たとえば、2×2
べたSEはON画素の2×2正方配列である。べたSE
は長方形配列である必要がない。
【0024】「ヒット−ミス(hit-miss) 」SEとは、
少なくとも1個のON画素と少なくとも1個のOFF画
素を指定するSEをいう。
【0025】「エロージョン(Erosion) 」は、SEの中
心を原始イメージ内の対応する画素位置に重ね合わせた
結果、SE内のすべてのON画素およびOFF画素と、
原始イメージ内の下に置かれた画素とが一致したときに
限り(IF-AND-ONLY IF) 、目標イメージ内の決められた
画素をONにする形態論的演算である。
【0026】「ディレイション(Dilation」)は、原始
イメージ内の決められた画素がONであれば、SEの中
心を目標イメージ内の対応する場所に置いて、SEを目
標イメージに書き込ませる形態論的演算である。ディレ
イションに用いるSEは、一般に、OFF画素を持たな
い。
【0027】「オープニング(Opening)」は、エロージ
ョンと、その次にくるディレイションより成る形態論的
演算である。その結果は、原始イメージにおける各一致
ごとに目標イメージ内にSEを複製することである。
【0028】「汎用オープニング(Generalized Openin
g)」は、エロージョン(SEにヒットとミスを使用す
る)と、その次にくるディレイション(SEにヒットの
みを使用する)より成る形態論的演算である。
【0029】「クロージング(Closing)」は、ディレイ
ションと、その次にくるエロージョンより成る形態論的
演算である。
【0030】オープニング、汎用オープニング、および
クロージングの場合、各演算は同じSEを用いた連続す
る相補演算(complementary operation)を含んでいるの
で、結果はSEの中心位置によって影響されない。
【0031】上に定義した各種の演算は、時には名詞
形、形容詞形、および動詞形で呼ぶことがある。たとえ
ば、ディレイション(名詞形)のもつ内容は、イメージ
をディレイトする、あるいはディレイトされるイメージ
(動詞形)、あるいはディレイション演算を受けるイメ
ージ(形容詞形)などのように表現することがあるが、
意味に差はないものとする。
【0032】(システムの概要)図1は、本発明をその
中に具体化することができる計算機システム10のブロ
ック図である。この高水準の実例で示した計算機システ
ムの構成は標準型であるので、図1には従来システムと
表示してある。しかし、システム10のような計算機シ
ステムは、本発明を具体化するように適切にプログラム
されてはいない。計算機システムは、慣例に従って、バ
スサブシステム15を通じて多数の周辺装置と通信する
処理装置12を備えている。周辺装置としては、一般
に、メモリ17、キーボードまたは他の入力装置20、
ディスプレイ22、1個またはそれ以上のハードディス
クドライブやフロッピィディスクドライブのようなファ
イル記憶装置25、プリンタ27、光学式スキャナ3
0、およびファックスモデム32がある。ファックスモ
デム32は、一般に遠隔場所にあると考えられるファッ
クス装置35と電話回線(想像線で示す)を通じて間欠
的に通信するように図示してある。計算機システム10
はファックス装置のすべての要素を含んでおり、ファッ
クス装置というときは、一般に、独立したファックス装
置ばかりでなく、上記のような計算機システムを含んで
いるものとする。
【0033】本発明は、イメージの分析に関するもので
ある。本発明に従って、適切にプログラムされた処理装
置12は、2進入力イメージの一定の特徴を抽出し、分
析するように動作する。典型的なケースでは、入力イメ
ージは、スキャナ30で走査された文書40から、ある
いはファックス装置35で走査され、電話回線37を通
じてファックスモデム32へ送信された文書40から生
成される。ファックス装置35がファックスモデムを備
えた計算機であれば、その計算機で入力イメージを生成
して、ファックスモデム32へ送信することができるで
あろう。
【0034】入力ビットマップのコード化、別のファク
ス装置へのコード化ファイルの転送、および出力ビット
マップへの復号は、標準ファクシミリプロトコル、たと
えばCCITTグループ3またはグループ4コード化フ
ォーマットに従って行われる。本発明の場合、出力ビッ
トマップとして上記に当てはまるものは、2進入力イメ
ージとみなす。文書40は、ユーザーが必要項目を記入
すべき空白用紙としてファックス装置35においてうま
く受信されたものとする。
【0035】(発明の概要)図2は、本発明を実施する
典型的な一連の操作を示すフローチャートである。本発
明は、1個以上の大きな手書きマークが許される、また
は要求される可能性を前提として、ページが空白である
かどうかを決定しようとするものである。入力イメージ
は一般にファックス送信の結果であるから、本方法はフ
ァックス送信の特有のノイズの種類と人工物を考慮に入
れている。
【0036】最初に、残りの段階において高速処理を可
能にする大きさだけ、走査したイメージを縮小する(ス
テップ50)。8Xから32Xまでの縮小倍率が一般的
であり、現在は16Xが好ましい。実物大で上位160
本(および、随意に下位160本)の走査線(16X縮
小で10本の走査線)のON画素を、内容に関係なく、
マスクする(ステップ52)すなわち除去する。これに
より、大部分のファックス装置によってファックス送信
されたページの上部(または、ことによると下部)に置
かれたテキストが消去される。得られたイメージをテス
トし、残っているON画素が存在するかどうかを調べる
ことができる(任意選択ステップ55)。もし存在しな
ければ、「空白ページ」の定義は大きな手書きマークの
存在を要求しないと仮定して、ページは空白と見なされ
る。
【0037】ON画素が存在すると仮定して、またはス
テップ55が実行されなかったと仮定して、連結構成要
素の数およびサイズに関する情報を収集する(ステップ
57)。連結構成要素情報を分析し、いろいろな属性を
1つまたはそれ以上のしきい値と比較する(ステップ6
0)。関係のある連結構成要素の属性のどれもがしきい
値を越えなければ、ページは空白とみなされる。次に述
べるように、関係のある情報およびしきい値は、「空白
ページ」の定義が大きなマークの存在を許すかまたは要
求するかどうかによって決まる。もし関係のある連結構
成要素の属性のどれかがしきい値を越えていれば、イメ
ージは空白ページでないとみなされ、一般に、イメージ
から情報を抽出するためさらに処理される。
【0038】(イメージの縮小)上に述べたように、迅
速に実施するには、初期段階での縮小が必要である。適
当な縮小を実施する方法は多数あるが、目下のところ好
ましい方法は、米国特許出願(Docket No. 13188-46 ,
発明の名称″USE OF FAST TEXTURED REDUCTION FOR DIS
CRIMINATON OF DOCUMENT IMAGE COMPONENTS ″に記載さ
れている方法である。簡単に説明すると、好ましい縮小
方法は、イメージをタイル(このケースでは、16×1
6画素)に細分し、タイル内の画素の所定の部分集合が
しきい値条件を満たすかどうかに基づいて、縮小したイ
メージ内の対応する単一画素の値を設定する。特に効率
の良い実施は、タイル内の画素の最初の行をとることで
ある。もし行内の少なくとも1個の画素がONであれ
ば、縮小したイメージ内の画素はONである。もし画素
がONでなければ、縮小したイメージ内の画素はOFF
である。これは、しきい値=1による水平プリフィルタ
テクスチャー縮小(horizontally prefiltered texture
d reduction ) と呼ばれる。
【0039】また、別のの可能な方法、たとえば一連の
2Xしきい値縮小を使用してイメージを縮小することも
できる。上記の縮小を実施する具体的な方法は、米国特
許出願第449,627 号(1989 年12月8日出願、発明の名
称″IMAGE REDUCTION/ENLARGEMENT TECHNIQUE ″) に記
載されている。2×2縮小ケースのための最適化として
は、行と列の間で論理演算を使用すること、参照用テー
ブルを使用して列演算を実行すること、および専用ハー
ドウェアを使用することがある。また、標準サブサンプ
リングを使用することにより、すなわち各タイル内の特
定の画素を選択し、その画素の値を縮小したイメージ内
の対応する画素の値として使用することにより、縮小を
実行することができる。
【0040】(連結構成要素分析)図3および図4は、
分析が8−連結構成要素に関する場合のステップ57を
実行する代替手法を示すフローチャートである。図5お
よび図6は、分析が8−連結構成要素でなく4−連結構
成要素に関する場合の図3および図4に対応するフロー
チャートである。16X縮小では、2×2画素より小さ
いどんな連結構成要素もペッパーノイズとみなされる。
すべての場合において、ペッパーノイズは除去されるか
または無視され、その存在は最終決定の要素にならな
い。
【0041】図3の方法は、最初に、すべての8−連結
構成要素にラベルを付ける(ステップ70)。これに
は、各8−連結構成要素ごとに最小包囲長方形(限界
枠)の位置と大きさを決定する必要がある。次に、ペッ
パーノイズより大きなサイズをもつ8−連結構成要素の
数を決定する(ステップ72)。このしきい値は2×2
にすることができる。図4の方法は、最初に、マスクし
たイメージを2×2べたSE77でオープンする(ステ
ップ75)。このステップ75は、ペッパーノイズおよ
び1画素太さの水平線(電話回線のノイズによって生じ
ることがある)を除去する効果を有する。次に、すべて
の8−連結構成要素にラベルを付け(ステップ80)、
カウントする(ステップ82)。
【0042】図5の方法は、最初に、マスクしたイメー
ジを、2×1垂直SE87、1×2水平SE90、また
は2×2SE92のどれかでディレイトする(ステップ
85)。このディレイションにより、すべての8−連結
構成要素は4−連結構成要素へ変換される。次に、すべ
ての4−連結構成要素にラベルを付け(ステップ9
5)、カウントする(ステップ97)。イメージはSE
87,90,および92のうちの1つでディレイトされ
たものと仮定すると、ペッパーノイズのサイズしきい値
(上に2×2であると仮定した)は、ディレイションの
ためどのサイズのSEを使用したかに従って、3×2、
2×3、または3×3になるであろう。図6の方法は、
最初に、イメージを2×1垂直SE102、1×2水平
SE105、または2×2SE107でディレイトする
(ステップ100)。次に、ディレイトしたイメージ
を、ディレイションにどのSEが使用されたかに従っ
て、3×2SE112、2×3SE115、または3×
3SE117でオープンする(ステップ110)。次に
4−連結構成要素にラベルを付け(ステップ120)、
カウントする(ステップ122)。
【0043】本発明は2つのケースについてよい結果が
得られるが、4−連結構成要素にラベルを付けるソフト
ウェアは、一般に8−連結構成要素にラベルを付けるソ
フトウェアより簡単である。従って、実施の点からは、
図5および図6の方法のほうが好ましい。
【0044】図7は、縮小したイメージ内の4−連結構
成要素に関する座標情報を抽出する方法を示すフローチ
ャートである。左上でスタートし、左から右へ、上から
下へ進み、ON画ソフトウェアが見つかるまで縮小した
イメージのコピーを計算機で走査する(すなわち、各画
素を評価する)(ステップ160)。その画素の座標を
保存する。その座標は、初めにその画素が属する連結構
成要素の限界枠の隅に関する現在の最良の情報を表して
いる(限界枠は、その左上隅および右下隅によって完全
に特定される)。見つけた画素および隣接するすべての
4−連結構成要素をOFFにする(ステップ162)。
各画素をOFFにしたとき、その座標と現在の隅座標と
を比較する。もしどちらかの座標が現在の限界枠の範囲
外にあれば、適当な隅座標を更新して、今現在の限界枠
を拡張する。隣接する4連結構成要素を見つけてOFF
にする方法は、Paul S.Feckbert,″A Seed Fill Algori
thm ″, pages 275-277 and 721-722 of ″Graphics G
ems ″(Acadmic Press, Inc. 1990 ) に記載されてい
る。
【0045】連結構成要素を消去し、そしてその限界枠
の座標を保存したあと(ステップ165)、今消去した
構成要素の最初の画素が見つかった位置の直後からスタ
ートし、走査を再開する。もし別のON画素が見つかれ
ば(ステップ168)、手続きをを繰り返す。再開した
走査がON画素を見つけなければ、手続きは終了し、関
係のある限界枠情報を抽出することができる。
【0046】(しきい値分析)上に述べたように、入力
イメージを縮小し、そして縮小したイメージ内の連結構
成要素のサイズおよび位置に関する情報を得るため、多
くの演算を受けさせる。もし形態論的演算を使用してペ
ッパーノイズや細い水平線を除去する図4および図6の
方法を適用すれば、それらのノイズ源は連結構成要素情
報の一部で無くなる。いずれにせよ、関係のあるのは、
連結構成要素に関する情報であり、連結構成要素の限界
枠は、ノイズの特性的寸法より大きな2つの寸法を有す
る。
【0047】しきい値分析に関係がある追加ノイズ源
は、走査プラテン上のほこりから生じる垂直な筋であ
る。筋の幅は、一般に約0.2インチ以下である(20
0 dpiの全解像度で約40画素、すなわち16X縮小で
約3画素に相当する)。比較的少数(たとえば、5本程
度)の筋が存在しても、一般に、それがなかったとした
ら空白のページが空白と見なされる資格を失わないであ
ろう。しかし、それは設計上の選択の問題であり、もし
所望ならば、その基準を厳しく、または緩くすることが
できる。
【0048】従って、空白ページに関する典型的なテス
トは、どの連結構成要素も予想される筋の幅より広くな
く、あるいは電話回線のノイズによる水平線の予想高さ
より高くない限り、ペッパーノイズより大きい(どちら
かの寸法)連結構成要素は一定の数以上存在しないこと
である。このテストは、3画素(もしイメージが1×2
または2×2SEでディレイトされたならば、4画素)
より広く、かつ1画素(もしイメージが1×2または2
×2SEでディレイトされたならば、2画素)以上の高
さの連結構成要素は存在しないことを単に検査するだけ
で簡単に実行できる。
【0049】上記の代わりに、連結構成要素にラベルを
付ける前に1×4または1×5SEでイメージをオープ
ンして垂直筋を除去し、電話回線ノイズによる予想高さ
より高い連結構成要素が存在しないことを調べることに
より、テストを実行することができる。もし細い水平線
を除去するためイメージが以前にオープンされなかった
ならば、垂直筋を除去するために、オープニングを実行
することは好ましい。この理由は、もしイメージが交差
する細い水平線と垂直筋を含んでいれば、連結構成要素
にラベルを付ける前にその一方または他方を除去しない
限り、両者は大きな連結構成要素として現れるからであ
る。
【0050】もしユーザーがページに大きな斜線または
Xを付けることを許す、または要求することが要望され
たならば、上記のテストの変更を考えることができる。
その場合には、テストは、連結構成要素が特定の非ゼロ
数より少ないか、または正確に前記特定の非ゼロ数であ
ることを要求するであろう。
【0051】(特定の実施例)図8は、本発明の現在の
実施例を実施する一連の特定の操作を示すフローチャー
トである。この実施例は大きなマークを許さない。最初
に、走査したイメージを、水平プリフィルタテクスチャ
ー縮小(horizontal prefiltered textured reduction
) を使用して16Xの倍率で縮小する(ステップ17
0)。次に、上位および下位10本の走査線をマスクし
(ステップ172)、得られたイメージをテストして残
っているON画素があるかどうかを調べる(ステップ1
75)。もしなければ、ページは空白とみなされる。さ
もなければ、処理を続ける。
【0052】次に、イメージを2×2SE180でディ
レイトし(ステップ177)、すべての4−連結構成要
素にラベルを付ける(ステップ182)。次に、4画素
(垂直筋のためのサイズしきい値)より広い限界枠を有
する構成要素の数(N1)をカウントし(ステップ18
5)、この数とゼロとを比較する(ステップ187)。
もしN1がゼロより大きければ、ページは空白でないと
みなされる。この実施例は、垂直筋を有するイメージを
空白として受け入れるが、1つまたはそれ以上の細い
(1画素高さ)水平線を有するイメージは拒絶する(空
白とみなさない)であろう。もしN1がゼロより大きく
なければ、2画素より広く、かつ2画素より高い限界枠
を有する連結構成要素の数(N2)をカウントする(ス
テップ190)。1画素ペッパーノイズ線はここでは問
題にならないが、大部分の垂直筋はたぶん問題とされ
る。次に、N2と数字のしきい値(このケースでは、
5)とを比較する(ステップ192)。もしN2がしき
い値以上であれば、ページは空白とみなされない。もし
連結構成要素が5つまたはそれ以下であれば、ページは
空白とみなされる。
【0053】図9は、本発明の好ましいと思われる実施
例を実施する特定の一連の操作を示すフローチャートで
ある。手続きは、前に述べた実施例の場合と同様に、縮
小ステップ200、マスキングステップ202、および
テスト205を含む。次に、イメージを2×1垂直SE
210でオープンする(ステップ207)。このステッ
プは、1×1ペッパーノイズと1画素高さの水平線を除
去する効果を有する。次に、4−連結構成要素にラベル
を付け(ステップ212)、4画素より広い限界枠を有
する連結構成要素の数(N1)を決定する。もしN1が
ゼロ以上であれば、ページは空白でないとみなされる
(ステップ217)。さもなければ、連結構成要素の総
数(N2)を決定し(ステップ220)、しきい値(こ
のケースでは、5)と比較する。もしN1が5以上であ
れば、ページは空白でないとみなされる。さもなけれ
ば、空白とみなされる。
【0054】(ソフトウェアの説明)本発明の実施例
は、パソコン上でソフトウェアによって実施される。い
ろいろな種類の形態論的演算をサンワークステーション
(Sun Workstation)で実施するためのC言語のソースコ
ードが、米国特許第5,065,437 号 (発明の名称″Identi
fication and Segmentation of Finely Texured and So
lid Regions of BinaryImages″) に開示されている。
【0055】
【発明の効果】以上の説明から、本発明によって、走査
されたイメージは空白ページとして発信したかどうかを
決定する強力な方法が提供されたことがわかる。本方法
は、さまざまな形式のスキャナ、およびファックスされ
た文書に存在すると思われる送信ノイズを考慮に入れて
いる。
【0056】本発明の好ましい実施例について説明した
が、いろいろな修正物および均等物を使用することがで
きる。従って、上記の説明および図面は、特許請求の範
囲に記載された発明の範囲を制限するものと解釈すべき
でない。
【図面の簡単な説明】
【図1】本発明を内部に具体化することができる計算機
システムのブロック図である。
【図2】入力イメージが空白ページとして発信されたか
どうかを決定する本発明の方法を示すフローチャートで
ある。
【図3】8−連結構成要素情報を収集する方法を示すフ
ローチャートである。
【図4】8−連結構成要素情報を収集する方法を示すフ
ローチャートである。
【図5】4−連結構成要素情報を収集する方法を示すフ
ローチャートである。
【図6】4−連結構成要素情報を収集する方法を示すフ
ローチャートである。
【図7】限界枠の位置を決定する方法を示すフローチャ
ートである。
【図8】本発明の現在の実施例を実施するための特定の
一連の操作を示すフローチャートである。
【図9】本発明の好ましいと思われる実施例実施するた
めの特定の一連の操作を示すフローチャートである。
【符号の説明】
10 計算機システム 12 処理装置 15 バスサブシステム 17 メモリ 20 キーボードまたは他の入力装置 22 ディスプレイ 25 ファイル記憶装置 27 プリンタ 30 光学式スキャナ 32 ファックスモデム 35 ファックス装置 37 電話回線 40 文書 77 2×2べたSE 87 2×1垂直SE 90 2×1水平SE 92 2×2SE 102 2×1垂直SE 105 2×1水平SE 107 2×2SE 112 3×2垂直SE 115 2×3水平SE 117 3×3SE 180 2×2SE 210 2×1垂直SE

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 ディジタル処理装置において実行され、
    2進入力イメージが実質上空白であるかどうかを決定す
    る方法であって、 入力イメージに縮小演算を実施し、得られた結果を提供
    すること、 少なくとも定められたレベル連結性によって特徴付けら
    れるすべての領域にラベルを付けること、および上記ス
    テップによってラベルが付けられた、所定の数以上の領
    域がサイズしきい値を越えているかどうかを決定するこ
    と、 の諸ステップより成ることを特徴とする方法。
  2. 【請求項2】 さらに、前記縮小演算ステップの前に実
    行され、イメージの上部および下部にある水平ストリッ
    プ内のどのON画素も前記決定ステップに影響を及ぼさ
    ないように、前記水平ストリップをマスクするステップ
    を含んでいることを特徴とする請求項1に記載の方法。
  3. 【請求項3】 前記定められたレベルの連結性は、4−
    連結であることを特徴とする請求項1に記載の方法。
  4. 【請求項4】 前記定められたレベルの連結性は、8−
    連結であることを特徴とする請求項1に記載の方法。
  5. 【請求項5】 前記ラベルを付けるステップは、 得られたイメージをべた構造要素(SE)でディレイト
    し、すべての8−連結領域を後に得られたイメージ内の
    4−連結領域へ変換すること、および後に得られたイメ
    ージ内のすべての4−連結領域にラベルを付けること、 のサブステップより成ることを特徴とする請求項4に記
    載の方法。
  6. 【請求項6】 前記縮小演算は、水平プリフィルタテク
    スチャー縮小演算(horizontally prefiltered texture
    d reduction operation ) であることを特徴とする請求
    項1に記載の方法。
  7. 【請求項7】 さらに、前記ラベルを付けるステップの
    前に実行され、 入力イメージに高速垂直プリフィルタテクスチャー縮小
    演算(fast textured vertically prefiltered reducti
    on operation )を実施し、第2のイメージを提供するこ
    と、および最初に得られたイメージと2番目に得られた
    イメージを論理的にOR演算すること、 の諸ステップを含むことを特徴とする請求項6に記載の
    方法。
  8. 【請求項8】 前記ラベルを付けるステップは、 少なくとも定められたレベルの連結性を有する各領域に
    ついて、連結領域を取り囲む最小長方形の寸法を決定す
    るサブステップを含むことを特徴とする請求項1に記載
    の方法。
  9. 【請求項9】 ディジタル処理装置において実行され、
    2進入力イメージが空白ページであるかどうかを決定
    し、その決定に基づいて第1および第2のどちらか一方
    の行動をとる方法であって、 入力イメージに高速水平プリフィルタサブサンプリング
    演算(fast horizontally prefiltered subsampling op
    eration )を実施し、縮小イメージを提供すること、 前記縮小イメージをべた構造要素(SE)でディレイト
    し、ON画素のすべての拡張した領域を4−連結領域に
    すること、 すべての4−連結領域のサイズを決定すること、 第1の所定の数より多くの4−連結領域が第1サイズし
    きい値を越えているかどうかを決定し、もし越えていれ
    ば、第2の行動をとること、およびもし第2の行動を取
    らなかったならば、第2の所定の数より多くの4−連結
    領域が第1サイズしきい値より小さい第2のサイズしき
    い値を越えているかを決定し、もし越えてなければ、第
    1の行動をとること、 の諸ステップより成ることを特徴とする方法。
  10. 【請求項10】 前記第1の所定の数は、ゼロであるこ
    とを特徴とする請求項9に記載の方法。
  11. 【請求項11】 さらに、前記ディレイトするステップ
    の前に実行され、イメージの上部および下部にある水平
    ストリップ内のどのON画素も前記決定ステップの結果
    に影響を及ぼさないように、前記水平ストリップをマス
    クするステップを含むことを特徴とする請求項9に記載
    の方法。
  12. 【請求項12】 ディジタル処理装置において実行さ
    れ、2進入力イメージが空白ページであるかどうかを決
    定する方法であって、 入力イメージに、テクスチャー水平プリフィルタサブサ
    ンプリング演算(textured horizontally prefiltered
    subsampling operation ) を実施し、縮小イメージを提
    供すること、 得られたイメージをべた構造要素(SE)でオープンし
    て、べた構造要素より小さいペッパーノイズのないイメ
    ージを提供すること、 少なくとも定められたレベルの連続性によって特徴付け
    られるすべての領域にラベルを付けること、および定め
    られたサイズより大きい領域の数が、所定の数より大き
    いかどうかを決定すること、 の諸ステップより成ることを特徴とする方法。
  13. 【請求項13】 さらに、前記オープニングステップの
    前に実行され、イメージの上部および下部にある水平ス
    トリップ内のどのON画素も前記決定ステップの結果に
    影響を及ぼさないように、前記水平ストリップをマスク
    するステップを含むことを特徴とする請求項12に記載
    の方法。
  14. 【請求項14】 さらに、前記決定ステップの結果が否
    定的であるときに限り実行され、決められた第2のサイ
    ズより大きい領域の数が、第2の所定の数以上であるか
    どうかを決定するステップを含んでいることを特徴とす
    る請求項12に記載の方法。
  15. 【請求項15】 前記第2の所定の数は、1であること
    を特徴とする請求項12に記載の方法。
JP05114793A 1992-03-20 1993-03-12 入力イメージが空白であるかどうかを決定する方法 Expired - Lifetime JP3296874B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/855,375 US5467410A (en) 1992-03-20 1992-03-20 Identification of a blank page in an image processing system
US07/855375 1992-03-20

Publications (2)

Publication Number Publication Date
JPH0644374A true JPH0644374A (ja) 1994-02-18
JP3296874B2 JP3296874B2 (ja) 2002-07-02

Family

ID=25321089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05114793A Expired - Lifetime JP3296874B2 (ja) 1992-03-20 1993-03-12 入力イメージが空白であるかどうかを決定する方法

Country Status (2)

Country Link
US (1) US5467410A (ja)
JP (1) JP3296874B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5689575A (en) * 1993-11-22 1997-11-18 Hitachi, Ltd. Method and apparatus for processing images of facial expressions
EP0720114B1 (en) * 1994-12-28 2001-01-24 Siemens Corporate Research, Inc. Method and apparatus for detecting and interpreting textual captions in digital video signals
JP3427554B2 (ja) * 1995-03-01 2003-07-22 オムロン株式会社 画像処理装置及び方法
US5781667A (en) * 1995-07-31 1998-07-14 Neopath, Inc. Apparatus for high speed morphological processing
US6181835B1 (en) * 1997-12-26 2001-01-30 International Business Machines Corporation Non-integer scaling of raster images with image quality enhancement using an anamorphically scaled intermediate bitmap
US6226420B1 (en) * 1997-12-26 2001-05-01 International Business Machines Corporation Non-integer scaling of raster images
US6195473B1 (en) * 1997-12-26 2001-02-27 International Business Machines Corporation Non-integer scaling of raster images with image quality enhancement
US6522431B1 (en) 1999-04-26 2003-02-18 Xerox Corporation System for minimizing image defects in a hard-copy input scanner
US6393161B1 (en) 1999-04-26 2002-05-21 Xerox Corporation Software system for minimizing image defects in a hard-copy input scanner
JP2003298799A (ja) * 2002-04-01 2003-10-17 Pfu Ltd 画像処理装置
DE10329339B4 (de) * 2003-06-30 2007-04-26 OCé PRINTING SYSTEMS GMBH Verfahren und Vorrichtung zum Aufbereiten einer Bildpunktdatei
US20050063568A1 (en) * 2003-09-24 2005-03-24 Shih-Ching Sun Robust face detection algorithm for real-time video sequence
US20050160194A1 (en) * 2004-01-16 2005-07-21 Bango Joseph J. Method of limiting amount of waste paper generated from printed documents
US8237951B2 (en) * 2005-05-11 2012-08-07 Sharp Laboratories Of America, Inc. Intermediate stage emulation of firmware on connected host
JP5760703B2 (ja) * 2011-05-30 2015-08-12 株式会社リコー 画像処理装置、画像処理プログラムおよび記録媒体

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
US4541116A (en) * 1984-02-27 1985-09-10 Environmental Research Institute Of Mi Neighborhood image processing stage for implementing filtering operations
JPS62272751A (ja) * 1986-05-21 1987-11-26 Matsushita Graphic Commun Syst Inc フアクシミリ蓄積同報装置
JPS6395578A (ja) * 1986-10-13 1988-04-26 Canon Inc 画像情報処理装置
JPS63155386A (ja) * 1986-12-19 1988-06-28 Ricoh Co Ltd 帳票デ−タ読取装置
US5144682A (en) * 1987-03-05 1992-09-01 Ricoh Company, Ltd. Method and an apparatus for isolating an area corresponding to a character or word
JP2752062B2 (ja) * 1987-03-30 1998-05-18 三洋電機株式会社 情報フアイル装置
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
US4975972A (en) * 1988-10-18 1990-12-04 At&T Bell Laboratories Method and apparatus for surface inspection
US5282050A (en) * 1988-10-31 1994-01-25 Canon Kabushiki Kaisha Dual-side recording apparatus
US5224179A (en) * 1988-12-20 1993-06-29 At&T Bell Laboratories Image skeletonization method
US4893333A (en) * 1989-03-14 1990-01-09 Paul Baran Interactive facsimile system and method of information retrieval
US5291592A (en) * 1989-05-15 1994-03-01 Sharp Kabushiki Kaisha System having document scanner for optically scanning information whereby a first information contains control information indicating a number of sheets to be scanned
JPH03150672A (ja) * 1989-11-08 1991-06-27 Toshiba Corp ナンバプレート検出装置
US5129014A (en) * 1989-12-08 1992-07-07 Xerox Corporation Image registration
US5048109A (en) * 1989-12-08 1991-09-10 Xerox Corporation Detection of highlighted regions
US5065437A (en) * 1989-12-08 1991-11-12 Xerox Corporation Identification and segmentation of finely textured and solid regions of binary images
US5131049A (en) * 1989-12-08 1992-07-14 Xerox Corporation Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask
JP2523222B2 (ja) * 1989-12-08 1996-08-07 ゼロックス コーポレーション 画像縮小/拡大方法及び装置
JPH04275772A (ja) * 1991-03-04 1992-10-01 Eastman Kodak Japan Kk 画像読み取り装置
US5212742A (en) * 1991-05-24 1993-05-18 Apple Computer, Inc. Method and apparatus for encoding/decoding image data

Also Published As

Publication number Publication date
US5467410A (en) 1995-11-14
JP3296874B2 (ja) 2002-07-02

Similar Documents

Publication Publication Date Title
JP3372282B2 (ja) 2進入力イメージを縮小する方法
JP2880572B2 (ja) 中間調領域用分離マスクの構成方法
JP3051182B2 (ja) ハイライト領域検出方法
US5065437A (en) Identification and segmentation of finely textured and solid regions of binary images
US5272764A (en) Detection of highlighted regions
EP0713329B1 (en) Method and apparatus for automatic image segmentation using template matching filters
EP0490687B1 (en) Method and apparatus for image processing
JP3305772B2 (ja) 形態学的技術を用いて手書き指示イメージを検出する方法
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US5568571A (en) Image enhancement system
JP4261005B2 (ja) 領域ベースのイメージ2値化システム
JP3296874B2 (ja) 入力イメージが空白であるかどうかを決定する方法
JPH06124358A (ja) 用紙上のマークを検出する方法
JPH07131641A (ja) 画像処理装置
JPH0879536A (ja) 画像処理方法
JP4164489B2 (ja) 文書画像強調方法、装置及びそのための記憶媒体
Ozawa et al. A character image enhancement method from characters with various background images
AU4207400A (en) Intelligent detection of text on a page
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
KR100537827B1 (ko) 경계선 분포를 이용한 스캔 영상의 상역 분리 방법
US7567725B2 (en) Edge smoothing filter for character recognition
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JP2004048130A (ja) 画像処理方法、画像処理装置、および画像処理プログラム
JPH0766976A (ja) 画像処理装置
Cinque et al. Handling Artifacts in digitally reproduced documents

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020304

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100412

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110412

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

EXPY Cancellation because of completion of term