JPH10513284A - 二進イメージに対する空白ページ及び文字枠の自動決定 - Google Patents

二進イメージに対する空白ページ及び文字枠の自動決定

Info

Publication number
JPH10513284A
JPH10513284A JP8503102A JP50310296A JPH10513284A JP H10513284 A JPH10513284 A JP H10513284A JP 8503102 A JP8503102 A JP 8503102A JP 50310296 A JP50310296 A JP 50310296A JP H10513284 A JPH10513284 A JP H10513284A
Authority
JP
Japan
Prior art keywords
image
pixels
array
image data
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8503102A
Other languages
English (en)
Inventor
ノウルトン,ケネス・シー
Original Assignee
コダック・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コダック・リミテッド filed Critical コダック・リミテッド
Publication of JPH10513284A publication Critical patent/JPH10513284A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Abstract

(57)【要約】 ページ(14)を表すデジタル化されたイメージ・データを処理する方法及び該方法を実行する装置(10)を開示する。本方法は、(a)イメージ・データをイメージ・ピクセルのN×Mアレイ(14a)の複数の行及びカラムに区分するために走査線ベースで該イメージ・データを処理するステップを含む。区分するステップは、イメージ・ピクセルのN×Mアレイの各行に対して、(b)もしある場合には、前景値を有するイメージ・ピクセルの任意の走査線に沿った発生を検出するステップと、イメージ・ピクセルの1つのN×Mアレイ内の検出された発生の非零の数に対して、(c)対応するアレイ行カウント及び対応するアレイ・カラム・カウントを増分するステップと、(d)少なくとも1つの検出された発生に対して、文字枠の境界を調整し、前記の少なくとも1つの検出された発生及び実質的にすべての以前に検出された発生を含むようにするステップを含む。本方法は、文字枠の境界を検査するステップと、もし境界が初期の認識不可能状態にセットされた場合に、ページが空白であることを宣言するステップと、さもなければもし境界が初期状態にセットされていない場合に、そのページの二進イメージは文字枠の境界内に情報を含むことを宣言するステップとのターミナルのステップを含む。デジタル化イメージ・データのアイコン的イメージを導出するための方法もまた説明される。

Description

【発明の詳細な説明】 二進イメージに対する空白ページ及び文字枠の自動決定 発明の分野 本発明は一般にドキュメント処理システムに関連し、特に、ドキュメントのペ ージ上に現れる情報を表すデータを入力するための光学スキャナを含むドキュメ ント処理システムに関連する。 発明の背景 ドキュメントの1ページ又はそれ以上のページをドキュメント処理システムに 入力するための周知の技術は、ページの表面に発生する光学的コントラストの差 を検知する光学スキャナを用いる。光学的コントラストの差は、例えばインチ当 たり200ドット(dpi)の、所定の又は選択された解像度で二進情報(ピク セル)に変換され、走査線フォーマットで出力される。走査されたイメージの情 報内容を識別するために続いて出力データが処理される。光学的文字認識(OC R)はイメージ・ピクセルを認識された英数文字に変換するのに用いられる1つ の周知の処理技術である。 ドキュメント及び他のタイプのページをデジタル化するシステムにおいて発生 する1つの問題は、空白のページ及び部分的に空白のページの識別にある。例え ば、複数の両面のドキュメントのページがドキュメント・スキャナを通じて自動 的に送られるときに、幾つかのページは空白(一側にのみテキストがある)又は 部分的に空白であり得る。ページ・イメージ・データは典型的には圧縮されるか 又は記憶の前に処理されるという点で、完全に又は部分的に空白のページがデー タ圧縮アルゴリズムに入力されるときに非効率的なことが発生することが理解さ れ得る。即ち、ページが空白であることを迅速に識別し、ページ・イメージが更 に処理されることなく捨てられるようにすることが望ましい。同様に、ページが テキスト又はグラフフィックによって部分的にのみ埋められている場合に、情報 を含むページ・イメージのその部分のみを後続の処理に入力し、又は表示し、該 ページ・イメージの残りの部分を無視することが望ましい。 本発明の概要 従って、本発明の目的は、ページの二進イメージが情報内容を持たないことを 迅速に判定し、該二進イメージの更なる処理のためにシステム資源を消費するこ とを避けるようにすることである。 本発明の別の目的は、ページの二進イメージのどの部分が情報内容を持たない かを迅速に判定し、その識別された部分の更なる処理のためにシステム資源を消 費することを避け、空白範囲の表示を最小化するようにすることである。 本発明の更なる目的は、もしある場合には入力イメージのどの範囲が情報内容 を有するかを判定するオペレーションと入力イメージの縮小されたアイコン的イ メージ又はスタンプの生成とのマージを可能にすることである。 ページを表すデジタル化イメージ・データを処理する方法及び該方法を行う装 置によって、前記及び他の問題が解決され且つ本発明の目的が実現される。本方 法は、(a)走査線上のイメージ・データを走査線ベースで処理し、イメージ・ データをイメージ・ピクセルのN×Mアレイ又はサブアレイの複数の行及びカラ ムに区分するステップを含む。区分するステップは、イメージ・ピクセルのN× Mアレイの各行に対して、(b)もしある場合には、前景値を有するイメージ・ ピクセルの任意の走査線に沿った発生を検出するステップと、イメージ・ピクセ ルの1つのN×Mアレイ内の検出された発生の非零の数に対して、(c)対応す るアレイ行カウント及び対応するアレイ・カラム・カウントを増分するステップ と、(d)少なくとも1つの検出された発生に対して、アレイの行及びカラムの カウントに従って文字枠(bounding box)の境界を調整し、前記の少なくとも1 つの検出された発生及び実質的にすべての以前に検出された発生を含むようにす るステップを含む。 本方法は、文字枠の境界を検査するステップと、もし境界が初期の認識不可能 状態にセットされた場合に、ページが空白であることを宣言するステップと、さ もなければもし境界がその初期の状態にセットされていない場合に、そのページ の二進イメージは文字枠の境界内に情報を含むことを宣言するステップとのター ミナル・ステップ(terminal step)を含む。 本方法はまたデジタル化イメージ・データのアイコン的イメージを導出するた めに説明され、本方法はN×Mアレイのピクセル内容を基にしている。 図面の簡単な説明 本発明の上述及び他の特徴は、後述の本発明の詳細な説明を添付の図面を参照 して読むことにより、より明瞭になる。 図1は本発明に従って構成され且つオペレーションされるドキュメント処理シ ステムの簡略化されたブロック図である。 図2は例示的な16×16ピクセル・タイルのアレイ示す。 図3は現在において好適な本発明の方法の論理フローチャートである。 図4a−4cは本発明の方法の終了で得られる例示的な文字枠を示す。 図5は、本発明の特徴に従うドキュメント・ページのアイコン的イメージの個 々のピクセルとドキュメント・イメージ・ピクセルのN×Mアレイの個々のもの との関係を示す。 本発明の詳細な説明 図1は本発明に従って構成され且つオペレーションを行うドキュメント処理シ ステム10を示す。走査されたドキュメント・ページ14の表面に現れる印刷さ れたテキスト及びグラフィック・イメージからの結果的な光学的コントラストを 検出するために従来のドキュメント・スキャナ12が用いられる。ここで用いら れるように、「ページ」は、その上に書かれた、配置された又は印を付けられた 記号、テキスト、グラフィックのようなしるし(indicia、インディシア)を有 することが可能な任意の土台を含むことを意図する。スキャナ12とページ14 との間の相対的運動によって、スキャナ12が信号ライン(単数又は複数)12 a上に、該スキャナによって検知された光学的コントラストを示す一連の二進1 及び0を出力するようにされる。例えば、二進1はページ14の暗い範囲(キャ ラクタ又はグラフィック・イメージ)の存在を示し、二進0は暗い範囲のないこ と(背景又は「白スペース」)を示す。ここで用いられるように、二進1及び0 はそれぞれピクセルと呼ばれる。二進情報は走査線フォーマットで出力され、走 査線は走査方向(矢印Aで示す)に直角に向いている。従って、1つの走査線は 典型的にキャラクタの一部のみからのピクセルを含む。例えば、且つスキャナ1 2の解像度が200dpiであり且つページ14が8.5インチ(約21.6セ ンチ)幅であると仮定すると、走査線は1700までの個別のピクセル(8.5 ×200)を含み得る。典型的なスキャナの解像度は、(走査線に沿って)イン チ当たり100ドット(又はピクセル)から400dpiの範囲にある。 信号ライン(単数又は複数)12aには、従って、スキャナ12の出力には、 スキャナ・インターフェース16が結合される。本発明の本実施例において、ス キャナ・インターフェース16は、以下に詳細に説明する本発明の方法を実行す るように構成され且つオペレーションされる。 スキャナ・インターフェース16の出力はバス16aを経由でドキュメント記 憶モジュール18に結合される。記憶モジュール18は、半導体メモリ、磁気又 は光学ディスク・メモリ、磁気又は光学テープ、又はデジタル化されたドキュメ ント・ページのデータを記憶するのに適当な任意の形態のものの内部に実現され 得る。示されるように、記憶モジュール18はページ・データ・ブロック18a として表される3つの記憶されたドキュメント・ページを有する。ブロック18 aの各々は、好適には、記憶の前に既知のデータ圧縮技術を用いて圧縮される。 従って、及び図1に示されるように、各ブロックは記憶モジュール18内の異な る量の記憶スペースを占有し得る。 ドキュメント記憶18のアクセスとページの表示はドキュメント・プロセッサ 20によって制御される。このプロセッサはバス20aを経由でドキュメント記 憶モジュール18と双方向に結合され、且つ表示スクリーン22aを有するCR Tディスプレイ22及びキーボード24のような従来のユーザ・インターフェー ス・デバイスに結合される。走査されたドキュメント・ページがテキストに加え てグラフィック情報を含み得るという点において、ディスプレイ22は好適には グラフィック能力を含む。ドキュメント・プロセッサ20はワード処理及び編集 能力を有し得るが、ドキュメント・アーカイブ・アプリケーションに対してこれ らの能力は要求されるものでも望まれるものでもない。 コンポーネント16−24はすべて、パーソナル・コンピュータのような1つ のデータ・プロセッサ26内に含まれ得ることを認識すべきである。この場合、 スキャナ・インターフェース16は、従来の様式でデータ・プロセッサ26のパ ラレル又はシリアル・ポートに結合され得るスキャナ12の出力を処理するため に呼び出されるソフトウエア・モジュールであり得る。また、この場合には、バ ス16a及び20aは同じシステム・バスであり得、それによってスキャナ・イ ンターフェース・ソフトウエア及びドキュメント・プロセッサ・ソフトウエアが 、データ・プロセッサ26のメイン・メモリ及び大容量記憶コンポーネントにイ ンターフェースされる。本発明の別の実施例において、スキャナ12はデータ・ プロセッサ26の一体のコンポーネントに作られ得る。 従って、図1のドキュメント処理システム10の実施例は、本発明の1つの例 示的実施として見られることを意図されおり、本発明の実施の際の制限として見 られることを意図していないことが理解されるべきである。 本発明に従うと、且つ図2を参照すると、ページ14を表す二進イメージ・デ ータがスキャナ12から受信され、本発明の方法の実行の間にスキャナ・インタ ーフェース16によって複数のタイル(tile)14aに論理的に分割される。各 タイルはN×Mアレイのピクセルから構成される。本発明の現在好適な実施例に おいてN及びMは両方とも16に等しいが、この値は本発明を実行する際の制限 を表すものではない。ドキュメント・ページ14が走査される時の該ページの端 部(エッジ)に起因して生成され得る何れのノイズも除去するように、所定のサ イズの上部マージン、左マージン、及び右マージン(示さず)が確立される。各 ピクセル・タイル14aは、前景の値(例えば、二進1)を有する0から16× 16=256のピクセルを含む。 図3を参照すると、ピクセル・タイル14aの各に対して、ピクセル・タイル が少なくとも1つの前景ピクセルを含むか否かに関する判定が行われる。デジタ ル・ページ・イメージにわたる1つのパスの間に多種の統計が保持される。統計 は、ピクセル・タイルの各行及び各カラムに対して、少なくとも1つの前景ピク セルで住みついた(populated)或る数のピクセル・タイル14aを含む。結果 的なベクトルは、どのページが空白であるか、即ち、どのページが情報内容を有 していないかの、そして、空白ページに対しては、情報内容を含む実質的にすべ てのイメージを包含する文字枠のエクステントの迅速な判定を可能にする。 空白ページは、例えば圧縮のような、更なる処理をする必要がなく且つ記憶す ることを要求されていない点において、空白ページの正確且つ迅速な判定は処理 速度及び記憶効率を達成するために重要である。しかしながら、圧縮される空白 ページは典型的には小さいサイズであるので、空白ページは非空白ページととも に圧縮され得る。非空白ページに対して、ページの情報内容についての文字枠の 座標の判定は圧縮オペレーションの速度を高めることができ、且つイメージの意 味のある部分をディスプレイ22のスクリーンのウインドウに適合させるときの 補助をすることができる。 より特定的には、本方法の実行中に、ページ14の二進イメージは走査線毎の ベースで16×16ピクセルのタイルの行及びカラムに分割され、そして各タイ ルに対して、タイルに少なくとも1つの前景ピクセルが住みついているかが判定 される。タイルの完全な行が処理された後には、その行における住み着かれたタ イルの数が保持され、そしてタイルの各カラムに対しては、即ち、住み着かれた タイルの更新された数が保持される。16ピクセルの細分性に対して、両方の方 向(垂直及び水平)における0.1及び99.9の百分位数の点として、文字枠 のエッジはこれらのベクトルから判定される。即ち、判定は約100%の前景ピ クセルを含むイメージ範囲の境界で判定がなされ、前景ピクセルの位置はページ の表面に記録された情報内容(テキスト、グラフィック、又は、テキスト及びグ ラフィック)の位置に対応すると推定される。現在は文字枠は最後の完全な16 走査線のグループ(タイルの最後の列)までの及びそれを含む部分的イメージに 対して維持される。図4aに示され且つ以下に説明されるように、文字枠の境界 は最初の前景ピクセルが検出される前には意味がない。 エッジにはアーティファクト(artifact、人工物)があり得るため、イメージ の上エッジ、左エッジ、及び右エッジに沿った境界又はマージンは空であると考 慮される。本発明の現在好適な実施例において、マージンはそれぞれ約0.16 インチ(約4mm)の幅を有する。マージン幅の測定(ピクセルで)は、スキャ ナ12の解像度(1インチ当たりのドット数)を指定するユーザが供給するパラ メータから得られる。 以下の擬似コードは本発明の方法の現在好適な実施例を示す。擬似コードのリ ストは、図3の論理フローチャートと関連して読まれることを意図している。「 |」に続くテキストは前のラインからの続きである。 初期設定(ブロックA) このステップは以下のことをするようにオペレーションする。 パラメータの妥当性をチェックする、 イメージの仕様を記録する、 無視するマージンの範囲を計算し(ピクセル単位で)且つ記録する、 そして アレイ及び他の値を零にする。 走査線処理(ブロックB−J) スキャナ16によって生成された各走査線は以下のように処理される。 もしスキップする上部マージンの境界内にあるなら、戻る(ブロックB及 びC)、 もし16ラインのセットを開始するなら、走査線にまたがる占有フラグ( occupancy flag)を零にする、 1ワードが2つの隣接するピクセルのバイトからなる各ワードに対して( ブロックD)、 もしワードが前景ピクセルを有するならば(ブロックE)、 ピクセル・タイルのこのカラムに対してフラグをセットする(ブ ロックF)、 累積されたピクセルの走査線を増分し、もしピクセルの累積された線が1 6と等しくなければ戻る(ブロックG)、 累積されたピクセルの走査線の数を零にリセットする(ブロックH)、 ピクセル・タイルのこの行に対する住み着かれたピクセル・タイルのカウ ントを零にする、 各フラグに対して、もしフラグがセットされたならば、 ピクセル・タイルのこのカラムに対する住み着かれたピクセル・タイ ルのカウントを増分する、 ピクセル・タイルのこの行に対する住み着かれたピクセル・タイルの カウントを増分する、 ピクセル・タイルのこの行に対する住み着かれたピクセル・タイルのカウ ントを記憶する、 もしカウントが零であるなら戻る、 ピクセル・タイルの行及びカラムのアレイにおける0.1及び99.9の 百分位数の点を見つける、 完了するまで走査線の処理を続ける(ブロックI及びJ)。 実質的にすべてのピクセルを含む0.1及び99.9の百分位数の境界を見つ けるために、以下のC言語のルーチンを用いることができる。 図4aを参照すると、文字枠が最初に設定され、左エッジ(LE)がイメージ ・ページの右をはずれて配置され、右エッジ(RE)がイメージ・ページの左を はずれて配置され、上エッジ(TE)がイメージ・ページの底部をはずれて配置 され、下エッジ(BE)がイメージ・ページの最上部をはずれて配置される。本 方法の終了のときに文字枠がまだこの「反転された」構成を有しているならば、 このページ・イメージは前景ピクセルを含んでおらず、従って空白であると推測 され得る。即ち、本方法の実行の間に前景ピクセルが検出されなかったというこ とであり、従って、文字枠のエッジは更新されなかったということである。この ページ・イメージは情報内容を持っていないと推定され、更なる処理又は記憶が 必要ではない。 図4bはかなりの量のテキスト及びグラフィックを含むページ・イメージに対 する例示的な最終的な文字枠を示す。そこに示されるように、本方法の実行の間 の文字枠の更新によって4つのエッジが再配置され、ページ・イメージの殆どを 包含するようにされる。 図4cは、一部にのみテキストを含み、残りの部分は空白であるページ・イメ ージに対する例示的な最終的な文字枠を示す。この場合、結果的な文字枠は、ペ ージの約40%のみが圧縮及び記憶されることが必要であることを明確に示すの で、これらの更なる処理ステップの効率が向上する。 本発明の第1の面を上に説明したので、ここで本発明の教示の1つの延長範囲 を説明する。 使用できる情報(又は空白ページ)の境界を判定するためのイメージの吟味は 、特に200dpiイメージを16の線形因数(linear factor of 16)によっ て縮小するときなどの、ページに対してアイコン的イメージ(一般的に「スタン プ」又は「サムネイル(thumbnail)」と呼ばれる)を生成することと幾つかの 点で似ている。この場合、文字枠の判定に対して「タイル」又はN×Mピクセル ・アレイとして以前考慮された範囲は、アイコン的イメージを生成するために1 つのピクセルに「圧縮される」範囲と等しい。 両方の計算とも全く同じ様式における入力集中(intensive、インテンシブ) のものである。従って、ユーザがそのようなスタンプの生成を望むならば及び望 むときには、2つのプロセスをマージすることによって、I/O及び計算時間の 大きな節約が得られる。幾つかの場合が考慮され、ここで、図1〜4cを参照し た前記の開示の変更及び/又は増加分として以下にそれらを列挙し説明する。 ここで図5を参照すると、元のドキュメント・イメージのN×Mピクセル・タ イルの個々のものが、例えば、ドキュメント・ページのアイコン的な(簡略化さ れた)表示可能なイメージの1ピクセルと等しく、又、1ピクセルに縮小されて いる。以下に説明するように、アイコン的イメージのピクセルの所与のものがオ ンであるかオフであるかは、対応する1つのN×Mピクセル・タイルのピクセル 内容の関数である。本発明の幾つかの実施例において、アイコン的イメージの各 ピクセルのグレイ・スケール値又はカラー値がN×Mピクセル・タイルのピクセ ル内容の関数であり得るという点において、ピクセルが「オンかオフか」という のはかなり単純化したものであることを認識するべきである。一般に、アイコン 的イメージの各ピクセルの視覚的特徴は、N×Mピクセル・タイルの対応する1 つのもの又は複数のもののピクセル内容の関数である。 アイコン的イメージの生成が望まれない場合には、スタンプ作成が文字枠又は 空白ページの判定にマージされない。この状態に対しては、イメージをタイルに 分割する必要はなく、そのかわりに、上及び下の境界がピクセル精度に容易に判 定され、左及び右の境界はワードサイズ又はバイトサイズの細分性(即ち、「タ イル」がワード又はバイト幅及びピクセル高さになる)に判定される。 すべての場合において、スタンプ・イメージの後続の処理に計算が要求される 場合にその計算の量は、入力イメージ全体の走査に関係する計算の量よりも大幅 に少ないことに留意されたい。これは、スタンプ・イメージは典型的に入力イメ ージの範囲の1パーセントの半分よりも少ないものを含むという事実に基づくも のである。 ケース1:スタンプの各1ビットが、入力イメージのN×Mのサブパート(副 部分)における少なくとも1つの前景ピクセルの存在を表すか、又はそのような ピクセルがないことを表す。内部ループの内容 は同じままでいるが、例えば、16線の完了の際にフラグ・ビットはアイコンの ピクセルのライン内にパックされる(詰め込まれる)。また、以前のように、フ ラグは意味のあるイメージの境界範囲を判定するために用いられる。 イメージ全体の処理の終わりに、アイコン的イメージは任意の又はすべてのサ イド(実際のイメージとできる限り比例するようにするという必要はない)がク リップ(clipped)され得、且つ拡大され得る。 ケース2:アイコン的イメージの各1ビットが、或るスレッショルド以上であ るN×Mアレイにおけるピクセルの数を表す。以前にはN×Mサブエリアあたり の前景ピクセルの存在を記録するためにコード化された上記の内部ループは、そ のような各サブエリアの前景ピクセルをカウントするように書き換えられる。従 って、内部ループは、例えばテーブルのルックアップによって、各非零ワードに おける1ビットの数をカウントに付加するように構成される。 互換的には、イメージをバイト毎にピック・アップすることができる。 スタンプに対して、及び各セット、例えば16線のセット、におけるビットを 合計した後に、各16×16(又はN×M)範囲に対する合計が、対応するピク セルとして1を使用するか0を使用するかを判定するためにスレッショルドと比 較される。 上述の文字枠又は空白ページの判定に対しては、タイルの各行及びカラムにお いて、住み着かれたタイルの合計よりはむしろピクセルの合計が維持され得る。 文字枠及び空白ページの判定は、さもなければ、実質的に上述したもののようで ある。 ケース3:この場合、スタンプの各ピクセルは、N×Mイメージにおけるピク セルのカウントの或るローカルな関係に依存する。タイルあたりのピクセルのカ ウントはケース2のように集められる。しかしながら、タイルの少なくとも最後 の3つのそのような行のカウントが保持されるので、中間行のタイルを表すスタ ンプ・ピクセルは8つの隣接するタイルのピクセル・カウントに基づくことがで きる。例えば、図5において、行3、カラム3(3、3)の16×16ピクセル ・タイルに対応するピクセルは、(2、2)、(2、3)、(2、4)、(3、 4)、(4、4)、(4、3)、(4、2)、(3、2)のタイルのピクセル内 容の少なくとも一部の関数である視覚的特徴を有する。 この場合におけるスタンプ作成方法は、例えば、本特許出願のこの事項の発明 者に1992年11月3日に発行された譲渡されたアメリカ合衆国特許第516 1213号における記述の教示に従う。従って、ここにアメリカ合衆国特許第5 161213号の開示を完全に参照によって援用する。 文字枠及び空白ページの判定はケース2のように行われる。 ケース4:この場合、スタンプは要求されない。従って、イメージの処理じゅ う定められていたタイル化は要求されない。その代わり、カウントがピクセルの 行あたり及びバイト幅あたり又はワード幅カラムあたり1ビット保持される。ピ クセルのカウントの処理は、図1〜4cに関して上述した住み着かれたタイルの カウントの処理の様式で進行する。結果は、文字枠の上及び下の境界に対してピ クセル・サイズ精度であり、左及び右の境界に対してバイト・サイズ(又はワー ド・サイズ)の精度である。 ケース5:この場合、スタンプは要求されず、文字枠はピクセル精度に判定さ れた最上部、最下部、最左部、及び最右部の1ビットの位置によって規定される 。この場合にはピクセル・カウントを維持する(ケース4のように)必要はない が、その代わりに、上からモニタ・ラインを簡略化するために且つ、或る最左部 のピクセルが発見される各ラインに対しても、その最右部のピクセルの位置を見 つけるために右から走査する。次に、位置付けされた最左部ピクセル及び最右部 ピクセルの一方又は両方が横の端部(ここまで判定されたものとして)にあるか を判定するためにテストが行われる。 横のピクセル精度は望ましくないかもしれないことに留意されたい。なぜなら 、これはバイト/ワード境界を再び整合するためにイメージ全体にシフト・オペ レーションが後に行われることを示唆するからである。そのようなシフト・オペ レーションは、大きな背景マージンを単に除去することと比較して時間を消費す るものである。上から下のピクセル精度を維持するための処理のオーバーヘッド はたとえあるとしても少なく、結果として、これらの範囲に対してピクセル精度 が維持され得る。 ケース6:この最後の場合には、スタンプは要求されない。文字枠は、最上部 、最下部、最右部、及び最左部の位置、例えば0.1の百分位数及び99.9の 百分位数のピクセルの行及びカラム、によって規定される。これはケース5の方 法の延長であるが、これまでに検出された最も遠いもの(エクストリーム、extr eme)の近隣のものにおいての行及びカラムのカウントが保持されるという点で 、より複雑である。これは幾つかの実施において好適ではないこともある。なぜ なら、付加される計算時間と比較すると、他の後続の処理の表示における向上が 僅かであるからである。 本発明の方法は、一度に1走査線ずつスキャナ14の出力をリアル・タイムで 前処理するようにスキャナ・インターフェース16内で実行され得る。本発明の 方法はまた、圧縮、光学的文字認識及び/又は表示の前に既に記憶された二進イ メージ・データを前処理するために用いられ得る。アイコン的イメージを形成す る方法は、スキャナ16で又はドキュメント・プロセッサ20で行われ得る。 上記では特定の寸法、前景及び背景ピクセルに対する値、走査線の解像度、そ の他が説明されたが、本発明の教示の範囲を逸脱することなくこれらのパラメー タの多数の変更がなされ得ることを認識するべきである。更に、図3の論理フロ ーチャートの個々のブロックが、例えば、上述された機能を実行するように動作 するプログラムされたプロセッサ及び専用の回路などの回路によって全体的に又 は部分的に実現され得ることが認識され得る。 このように、本発明を好適な実施例に関連して特定的に示し且つ説明したが、 当業者には本発明の範囲及び精神から離れることなく形態及び詳細の変更がなさ れ得ることが理解される。
【手続補正書】特許法第184条の8 【提出日】1996年6月4日 【補正内容】 (日本文明細書第1ページ第23行〜第2ページ第15行「ページ・イメージが・ ・・・区分するステップは、」に対応) 『ページ・イメージが更に処理されることなく捨てられるようにすることが望 ましい。同様に、ページがテキスト又はグラフフィックによって部分的にのみ埋 められている場合に、情報を含むページ・イメージのその部分のみを後続の処理 に入力し、又は表示し、該ページ・イメージの残りの部分を無視することが望ま しい。 U.S.−A−4 763 200 は、検出されたデータが白レベルから黒 レベルへ変化するイメージ・センサ・エレメントの位置からドキュメント・イメ ージ範囲を決定するイメージ走査装置を説明している。 本発明の概要 従って、本発明の目的は、ページの二進イメージが情報内容を持たないことを 迅速に判定し、該二進イメージの更なる処理のためにシステム資源を消費するこ とを避けるようにすることである。 本発明の別の目的は、ページの二進イメージのどの部分が情報内容を持たない かを迅速に判定し、その識別された部分の更なる処理のためにシステム資源を消 費することを避け、空白範囲の表示を最小化するようにすることである。 本発明の更なる目的は、もしある場合には入力イメージのどの範囲が情報内容 を有するかを判定するオペレーションと入力イメージの縮小されたアイコン的イ メージ又はスタンプの生成とのマージを可能にすることである。 ページを表すデジタル化イメージ・データを処理する方法及び該方法を行う装 置によって、前記及び他の問題が解決され且つ本発明の目的が実現される。本方 法は、(a)走査線上のイメージ・データを走査線ベースで処理し、イメージ・ データをイメージ・ピクセルのN×Mアレイ又はサブアレイの複数の行及びカラ ムに区分するステップを含む。区分するステップは、』 請求の範囲 『 1. ページを表すデジタル化されたイメージ・データを処理する方法に おいて、 前記デジタル化されたイメージ・データをイメージ・ピクセルのN×Mアレイ の行及びカラムに区分するステップと、 前記デジタル化されたイメージ・データを包含するように文字枠の境界の仕様 を初期状態にセットするステップと、 前記デジタル化されたイメージ・データを走査線ベースで処理するステップと 、 イメージ・ピクセルのN×Mアレイにおける各ピクセルの行に対して、 前景値を有するイメージ・ピクセルの各走査線に沿っての発生を、もし有る場 合には、検出するステップと、 走査線に沿っての検出されたイメージの前景ピクセルに対して、前景ピクセル がその内部に配置されているN×Mアレイが少なくとも1つの前景ピクセルで占 有されていること示すステップと、 イメージ・ピクセルの前景で占有されたN×Mアレイに対して、対応するN× Mアレイの行のカウント及び対応するN×Mアレイのカラムのカウントを増分す るステップと、 走査線に沿ったイメージの前景ピクセルの少なくとも1つの検出された発生に 対して、前記少なくとも1つの検出された発生及び以前に検出された発生を文字 枠内に包含するように、N×Mアレイの行及びカラムのカウントに従って文字枠 の境界の仕様を調節するステップと を含む、 方法。 2. 請求項1に記載の方法において、 前記文字枠の境界の仕様を検査し、もし前記境界の仕様が初期状態に設定され ているならば、そのページは空白であることを宣言するターミナル・ステップを 含む、 方法。 3. 請求項1に記載の方法において、 前記文字枠の境界の仕様を検査し、もし前記境界の仕様が初期状態に設定され ていないならば、そのページの二進イメージは前記文字枠の境界内に情報含むこ とを宣言するターミナル・ステップを含む、 方法。 4. 請求項1に記載の方法において、 前記区分するステップは、所定の幅を有する少なくとも1つのページの境界に 対応するイメージ・ピクセルを無視するステップを含む、 方法。 5. 請求項1に記載の方法において、 前記イメージ・データの表示可能なイメージを生成する更なるステップであっ て、前記表示可能なイメージは、個々のものが前記イメージ・データの複数のイ メージ・ピクセルを表す複数のピクセルを有する、ステップ を含む方法。 6. 請求項1に記載の方法において、 前記イメージ・データの表示可能なイメージを生成する更なるステップであっ て、前記表示可能なイメージは、個々のものがN×Mアレイのうちの1つに対応 する複数のピクセルを有する、ステップ を含む方法。 7. 請求項1に記載の方法において、 前記イメージ・データの表示可能なイメージを生成する更なるステップであっ て、前記表示可能なイメージは、個々のものが少なくとも1つのN×Mアレイの 多数の前景ピクセルの関数である視覚的特徴を有する複数のピクセルを有する、 ステップ を含む方法。 8. 請求項1に記載の方法において、 前記イメージ・データの表示可能なイメージを生成する更なるステップであっ て、前記表示可能なイメージは、個々のものがN×Mアレイのうちの1つのもの の及び前記N×Mアレイの複数の近隣のものの前景ピクセルの数の関数である視 覚的特徴を有する複数のピクセルを有する、ステップ を含む方法。 9. ページを表すデジタル化されたイメージ・データを処理する装置におい て、 前記デジタル化されたイメージ・データを走査線ベースで処理する処理手段で あって、前記デジタル化されたイメージ・データをイメージ・ピクセルのN×M アレイの行及びカラムに区分する手段及び前記デジタル化されたイメージ・デー タを包含するように文字枠の境界の仕様を初期状態にセットする手段を備える処 理手段と、 各走査線に沿って前景値を有するイメージ・ピクセルの発生を、もし有る場合 には、検出する手段と、 走査線に沿ってのイメージの前景ピクセルの検出された発生に応答して、前景 ピクセルがその内部に配置されているN×Mアレイが少なくとも1つの前景ピク セルで占有されていること示し、且つ対応するN×Mアレイの行のカウント及び 対応するN×Mアレイのカラムのカウントを増分する手段と、 走査線に沿ってのイメージの前景ピクセルの検出された発生に応答して、前記 少なくとも1つの検出された発生及び以前に検出された発生を文字枠内に包含す るように、N×Mアレイの行及びカラムのカウントに従って文字枠の境界の仕様 を調節する手段と を備える装置。 10. 請求項9に記載の装置において、 処理される最後の走査線に応答して前記文字枠の境界を検査し、もし前記境界 が初期状態に設定されているならば、そのページは空白であることを宣言する手 段 を更に含む装置。 11. 請求項9に記載のそにおいて、 処理される最後の走査線に応答して前記文字枠の境界を検査し、もし前記境界 が初期状態に設定されていないならば、そのページの二進イメージは前記文字枠 の境界内に情報含むことを宣言する手段 を更に含む装置。 12. 請求項9に記載の装置において、 前記区分する手段は、所定の幅を有する少なくとも1つのページの境界に対応 するイメージ・ピクセルを無視するように動作する、 装置。 13. 請求項9に記載の装置において、 前記イメージ・データの表示可能なイメージを生成する手段であって、前記表 示可能なイメージは、個々のものが前記イメージ・データの複数のイメージ・ピ クセルを表す複数のピクセルを有する、手段 を更に備える装置。 14. 請求項9に記載の装置において、 前記イメージ・データの表示可能なイメージを生成する手段であって、前記表 示可能なイメージは、個々のものがN×Mアレイのうちの1つに対応する複数の ピクセルを有する、手段 を更に備える装置。 15. 請求項9に記載の装置において、 前記イメージ・データの表示可能なイメージを生成する手段であって、前記表 示可能なイメージは、個々のものが少なくとも1つのN×Mアレイの多数の前景 ピクセルの関数である視覚的特徴を有する複数のピクセルを有する、手段 を更に備える装置。 16. 請求項9に記載の装置において、 前記イメージ・データの表示可能なイメージを生成する手段であって、前記表 示可能なイメージは、個々のものがN×Mアレイのうちの1つのものの及び前記 N×Mアレイの近隣のものの前景ピクセルの数の関数である視覚的特徴を有する 複数のピクセルを有する、手段 を更に備える装置。』
───────────────────────────────────────────────────── 【要約の続き】 境界が初期状態にセットされていない場合に、そのペー ジの二進イメージは文字枠の境界内に情報を含むことを 宣言するステップとのターミナルのステップを含む。デ ジタル化イメージ・データのアイコン的イメージを導出 するための方法もまた説明される。

Claims (1)

  1. 【特許請求の範囲】 1. ページを表すデジタル化されたイメージ・データを処理する方法におい て、 イメージ・データを走査線毎ベースで処理して該イメージ・データを、それぞ れがイメージ・ピクセルの少なくとも1つのN×Mアレイからなる複数の行及び カラムに区分するステップを備え、 前記の区分するステップが、イメージ・ピクセルのN×Mアレイにおける各ピ クセルの行に対して、 前景値を有するイメージ・ピクセルの各走査線に沿っての発生を、もし有る場 合には、検出するステップと、 走査線に沿っての検出されたイメージの前景ピクセルに対して、前景ピクセル がその内部に配置されているN×Mアレイが少なくとも1つの前景ピクセルで占 有されていること示すステップと、 イメージ・ピクセルの前景で占有されたN×Mアレイに対して、対応するアレ イの行のカウント及び対応するアレイのカラムのカウントを増分するステップと 、 少なくとも1つの検出された発生に対して、前記少なくとも1つの検出された 発生及び実質的にすべての以前に検出された発生を包含するように、アレイの行 及びカラムのカウントに従って文字枠の境界を調節するステップと を含む、 方法。 2. 請求項1に記載の方法において、 前記文字枠の境界の仕様を検査し、もし前記境界の仕様が初期状態に設定され ているならば、そのページは空白であることを宣言するターミナル・ステップを 含む、 方法。 3. 請求項1に記載の方法において、 前記文字枠の境界の仕様を検査し、もし前記境界の仕様が初期状態に設定され ていないならば、そのページの二進イメージは前記文字枠の境界内に情報含むこ とを宣言するターミナル・ステップを含む、 方法。 4. 請求項1に記載の方法において、 前記区分するステップは、所定の幅を有する少なくとも1つのページの境界に 対応するイメージ・ピクセルを無視するステップを含む、 方法。 5. 請求項1に記載の方法において、 前記イメージ・データの表示可能なイメージを生成する更なるステップであっ て、前記表示可能なイメージは、個々のものが前記イメージ・データの複数のイ メージ・ピクセルを表す複数のピクセルを有する、ステップ を含む方法。 6. 請求項1に記載の方法において、 前記イメージ・データの表示可能なイメージを生成する更なるステップであっ て、前記表示可能なイメージは、個々のものがN×Mアレイのうちの1つに対応 する複数のピクセルを有する、ステップ を含む方法。 7. 請求項1に記載の方法において、 前記イメージ・データの表示可能なイメージを生成する更なるステップであっ て、前記表示可能なイメージは、個々のものが少なくとも1つのN×Mアレイの 多数の前景ピクセルの関数である視覚的特徴を有する複数のピクセルを有する、 ステップ を含む方法。 8. 請求項1に記載の方法において、 前記イメージ・データの表示可能なイメージを生成する更なるステップであっ て、前記表示可能なイメージは、個々のものがN×Mアレイのうちの1つのもの の及び前記N×Mアレイの複数の近隣のものの前景ピクセルの数の関数である視 覚的特徴を有する複数のピクセルを有する、ステップ を含む方法。 9. ページを表すデジタル化されたイメージ・データを処理する装置におい て、 イメージ・データを走査線毎ベースで処理して該イメージ・データを、それぞ れがイメージ・ピクセルの少なくとも1つのN×Mアレイからなる複数の行及び カラムに区分する手段を備え、 前記の区分する手段が、イメージ・ピクセルのN×Mアレイにおける各ピクセ ルの行を処理する手段を含み、 かつ、前景値を有するイメージ・ピクセルの各走査線に沿っての発生を、もし 有る場合には、検出する手段と、 イメージ・ピクセルの1つのN×Mアレイ内の少なくとも1つの検出された発 生に応答し、対応するアレイの行のカウント及び対応するアレイのカラムのカウ ントを増分する手段と、 少なくとも1つの検出された発生に応答し、前記少なくとも1つの検出された 発生及び実質的にすべての以前に検出された発生を包含するように、アレイの行 及びカラムのカウントに従って文字枠の境界を調節する手段と、 を含む装置。 10. 請求項9に記載の装置において、 処理される最後の走査線に応答して前記文字枠の境界を検査し、もし前記境界 が初期状態に設定されているならば、そのページは空白であることを宣言する手 段 を更に含む装置。 11. 請求項9に記載のそにおいて、 処理される最後の走査線に応答して前記文字枠の境界を検査し、もし前記境界 が初期状態に設定されていないならば、そのページの二進イメージは前記文字枠 の境界内に情報含むことを宣言する手段 を更に含む装置。 12. 請求項9に記載の装置において、 前記区分する手段は、所定の幅を有する少なくとも1つのページの境界に対応 するイメージ・ピクセルを無視するように動作する、 装置。 13. 請求項9に記載の装置において、 前記イメージ・データの表示可能なイメージを生成する手段であって、前記表 示可能なイメージは、個々のものが前記イメージ・データの複数のイメージ・ピ クセルを表す複数のピクセルを有する、手段 を更に備える装置。 14. 請求項9に記載の装置において、 前記イメージ・データの表示可能なイメージを生成する手段であって、前記表 示可能なイメージは、個々のものがN×Mアレイのうちの1つに対応する複数の ピクセルを有する、手段 を更に備える装置。 15. 請求項9に記載の装置において、 前記イメージ・データの表示可能なイメージを生成する手段であって、前記表 示可能なイメージは、個々のものが少なくとも1つのN×Mアレイの多数の前景 ピクセルの関数である視覚的特徴を有する複数のピクセルを有する、手段 を更に備える装置。 16. 請求項9に記載の装置において、 前記イメージ・データの表示可能なイメージを生成する手段であって、前記表 示可能なイメージは、個々のものがN×Mアレイのうちの1つのものの及び前記 N×Mアレイの複数の近隣のものの前景ピクセルの数の関数である視覚的特徴を 有する複数のピクセルを有する、手段 を更に備える装置。
JP8503102A 1994-06-29 1995-01-11 二進イメージに対する空白ページ及び文字枠の自動決定 Pending JPH10513284A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/268,219 US5548664A (en) 1994-06-29 1994-06-29 Automatic determination of blank pages and binary images' bounding boxes
US08/268,219 1994-06-29
PCT/US1995/000402 WO1996001019A1 (en) 1994-06-29 1995-01-11 Automatic determination of blank pages and bounding boxes for binary images

Publications (1)

Publication Number Publication Date
JPH10513284A true JPH10513284A (ja) 1998-12-15

Family

ID=23021994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8503102A Pending JPH10513284A (ja) 1994-06-29 1995-01-11 二進イメージに対する空白ページ及び文字枠の自動決定

Country Status (7)

Country Link
US (1) US5548664A (ja)
EP (1) EP0768000B1 (ja)
JP (1) JPH10513284A (ja)
AU (1) AU688453B2 (ja)
CA (1) CA2189434A1 (ja)
DE (1) DE69508941T2 (ja)
WO (1) WO1996001019A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0965119A (ja) * 1995-06-14 1997-03-07 Minolta Co Ltd 画像処理装置
US5995661A (en) * 1997-10-08 1999-11-30 Hewlett-Packard Company Image boundary detection for a scanned image
JP2004289496A (ja) * 2003-03-20 2004-10-14 Ricoh Co Ltd 画像再生装置、画像再生方法およびこの方法をコンピュータに実行させるためのプログラム
US20050226503A1 (en) * 2004-04-07 2005-10-13 Bailey James R Scanned image content analysis
US20060239555A1 (en) * 2005-04-25 2006-10-26 Destiny Technology Corporation System and method for differentiating pictures and texts
JP5116409B2 (ja) * 2007-09-07 2013-01-09 キヤノン株式会社 画像形成装置、画像形成方法、及び、画像形成プログラム
US9436685B2 (en) 2010-12-23 2016-09-06 Microsoft Technology Licensing, Llc Techniques for electronic aggregation of information
US20120166953A1 (en) * 2010-12-23 2012-06-28 Microsoft Corporation Techniques for electronic aggregation of information
US9679404B2 (en) 2010-12-23 2017-06-13 Microsoft Technology Licensing, Llc Techniques for dynamic layout of presentation tiles on a grid
US9715485B2 (en) 2011-03-28 2017-07-25 Microsoft Technology Licensing, Llc Techniques for electronic aggregation of information
US9244935B2 (en) * 2013-06-14 2016-01-26 International Business Machines Corporation Data encoding and processing columnar data
JP6064084B2 (ja) * 2014-07-30 2017-01-18 オリンパス株式会社 画像処理装置
US10168969B2 (en) 2017-03-13 2019-01-01 Kyocera Document Solutions Inc. Information processing apparatus, non-transitory computer readable recording medium that records printer driver program, and blank page handling method

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
US4763200A (en) * 1985-04-11 1988-08-09 Minolta Camera Kabushiki Kaisha Image output apparatus
US5138674A (en) * 1987-11-07 1992-08-11 Minolta Camera Kabushiki Kaisha Image reader capable of detecting blank documents
US5161213A (en) * 1988-05-27 1992-11-03 Wang Laboratories, Inc. Method for black and white image reduction based upon averaging black/white pixel counts of neighboring blocks
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
EP0461817A3 (en) * 1990-06-15 1993-11-18 American Telephone & Telegraph Image segmenting apparatus and methods
EP0484888A3 (en) * 1990-11-06 1992-11-25 Omron Corporation Image scanner
JP3029136B2 (ja) * 1991-04-25 2000-04-04 キヤノン株式会社 出力方法及び装置

Also Published As

Publication number Publication date
EP0768000B1 (en) 1999-04-07
AU688453B2 (en) 1998-03-12
EP0768000A1 (en) 1997-04-16
WO1996001019A1 (en) 1996-01-11
US5548664A (en) 1996-08-20
DE69508941T2 (de) 1999-12-09
AU1526895A (en) 1996-01-25
DE69508941D1 (de) 1999-05-12
CA2189434A1 (en) 1996-01-11

Similar Documents

Publication Publication Date Title
US5784487A (en) System for document layout analysis
US6839466B2 (en) Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
JP3048330B2 (ja) 書類から記事を抽出する装置および方法
JP3338537B2 (ja) 画像傾き検出装置
US5854854A (en) Skew detection and correction of a document image representation
JP3847856B2 (ja) イメージ処理方法及び装置
US6738154B1 (en) Locating the position and orientation of multiple objects with a smart platen
EP1081648B1 (en) Method for processing a digital image
JP3773642B2 (ja) 画像処理装置および画像形成装置
US5892854A (en) Automatic image registration using binary moments
EP0629078A1 (en) Apparatus for processing and reproducing image information
JPH0865502A (ja) 欠陥検出方法
JP3594228B2 (ja) 枠消し装置、枠消し方法、およびオーサリング装置
EP1017011A2 (en) Block selection of table features
JPH10513284A (ja) 二進イメージに対する空白ページ及び文字枠の自動決定
US5517586A (en) Method and apparatus for automatically specifying a portion of text from a bitmap image of the text
US5592574A (en) Method and apparatus for expansion of white space in document images on a digital scanning device
US5467410A (en) Identification of a blank page in an image processing system
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
EP0767941B1 (en) Automatic determination of landscape scan in binary images
EP1018694B1 (en) System and method for automatic graph parsing
JPH0830725A (ja) 画像処理装置及び方法
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JP2001143076A (ja) 画像処理装置
JP2957050B2 (ja) 画像データ拡大装置