JPH10507014A - 2進イメージにおけるランドスケープ・スキャンの自動決定 - Google Patents

2進イメージにおけるランドスケープ・スキャンの自動決定

Info

Publication number
JPH10507014A
JPH10507014A JP8503103A JP50310396A JPH10507014A JP H10507014 A JPH10507014 A JP H10507014A JP 8503103 A JP8503103 A JP 8503103A JP 50310396 A JP50310396 A JP 50310396A JP H10507014 A JPH10507014 A JP H10507014A
Authority
JP
Japan
Prior art keywords
image
scan line
span
pixels
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8503103A
Other languages
English (en)
Inventor
ノウルトン,ケネス・シー
Original Assignee
コダック・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コダック・リミテッド filed Critical コダック・リミテッド
Publication of JPH10507014A publication Critical patent/JPH10507014A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 デジタル化されたページが第1のポートレート方向で見られることを意図されているか又は第1の方向から回転された第2のランドスケープ方向で見られることを意図されているかを判定する方法及びシステムを提供する。本方法は、イメージ走査線上のデジタル化されたページをイメージ走査線ベースで検査し、所定の制限内の高さ、幅、及びアスペクト比を有するグラフィック・エレメントの発生を検出する第1のステップを含む。「キャラクタ・サイズ」のグラフィック・オブジェクトの予期される寸法に対応するように、範囲を規定するスレッショルドが決定される。検出された各発生に対して、本方法は近接して位置する他のオブジェクトに対する検出された発生の間隔的関係を判定する。本方法は更に、複数の判定された間隔的関係に従って、デジタル化されたページが第1のフォーマット及び第2のフォーマットのうちの1つを有することを宣言する。判定するステップは、検出された発生と同一走査線上の隣接するオブジェクトとの間の、及び後続する走査線上の隣接するオブジェクトへの間隔的分離の量を確かめるようにオペレーションする。検査するステップは、各走査線に対して、各々が所定の値を有するイメージ・ピクセルのスパンのリストを形成するステップを含み、間隔的関係を判定するステップは、リストの各スパンに対して、同一走査線上の次のスパンへの距離を判定し、イメージ・オブジェクトの最後のスパンに対して、後続する走査線上の最初の開いたスパンへの距離を判定する。各イメージ・オブジェクトは関連する文字枠及び文字枠の幅の関数である幅を有するクリアの脚柱を有する。後続する走査線上の最初のスパンへの距離は脚柱の高さを定める。

Description

【発明の詳細な説明】 2進イメージにおけるランドスケープ・スキャンの自動決定 発明の分野 本発明はドキュメント処理システムに一般に関連し、特に、ドキュメントのペ ージに現れる情報を表すデータを入力する光学スキャナを含むドキュメント処理 システムに関連する。 発明の背景 ドキュメントの1又はそれ以上のページをドキュメント処理システムに入力す る1つの周知の方法は、ページの表面に発生する光学的コントラストの差を感知 する光学スキャナを用いる。光学的コントラストの差はインチ当たり200ドッ ト(dpi)のような所定の又は選択された解像度で2進情報(ピクセル)に変 換され、走査線フォーマットで出力される。続いて、出力データは圧縮されるか 、又は、そうでない場合には、スキャンされたイメージの情報内容を識別するた めに処理される。光学的文字認識(OCR)は1つの周知の処理技術であり、イ メージ・ピクセルを認識された英数文字に対するコードに変換するために用いら れる。 多重ページのドキュメントの個々のページは、ポートレート(肖像画書式)・ モードで表示され且つ見られることが意図されている(ページの上部を横切る第 1のスキャン・ライン(走査線)が通常見られる)。しかしながら、ドキュメン トは、ランドスケープ(風景画書式)・モード(即ち、ポートレート・モードか ら90度回転したもの)で表示され且つ見られることが意図されているスプレッ ドシート、表、及びグラフのような情報を含む1又はそれ以上のページも含み得 る。そのようなページを印刷することにおいて、ページがその元の向きで印刷さ れることに関して問題は呈示されない。しかしながら、スクリーンに表示するた め及び、例えば、カット・アンド・ペースト(切りばり)編集オペレーションの ためには、イメージが既に適切な向きに回転されていることが望ましい。或るペ ージが、ランドスケープ・フォーマットで見られることを意図されているがポー トレート・フォーマットで表示される場合には、ユーザは、相違に気づくこと、 表示されたページが回転されることを要求すること、そして次に、表示されたペ ージの方向が変えられ(回転させられ)且つ再び表示されるまで待つことを要求 される。このことはユーザにとって煩わしく且つ時間を浪費する。 従って、本発明の目的はスキャナからのデータ入力を、ページのスキャニング の間に又は直後に、ポートレート・フォーマット又はランドスケープ・フォーマ ットの何れかに自動的に分類する方法を提供することである。 本発明の別の目的は、スキャニングされたページがランドスケープ・フォーマ ットを有することを検出し、スキャニングされたイメージを表示する第1の要求 の前に補助的な又は置換の90度回転したイメージを提供する方法を提供するこ とである。 本発明の概要 スキャニングされたイメージに対して、そのイメージはポートレート・モード で見られることを意図されたドキュメントのページを表すか又はランドスケープ ・モード(90度回転され、典型的に見られることを意図される高さより幅が広 い)で見られることを意図されたドキュメントのページを表すかを決定する高速 の且つ効率的な本発明によって、上述の及び他の問題は解決され且つ本発明の目 的が実現される。 本発明の方法は本質的に文字や単語を認識するためのOCR機能を必要としな い。その代わりに、本方法は、表やグラフのような基本的にグラフィックの題材 にさえも存在すると推定されるテキストのラインのグラフィック的特徴を検出し 且つ認識する。本方法は、スキャンされたイメージ・データにおける「キャラク タ−サイズド(character-sized、キャラクタ・サイズ)」のグラフィック・オ ブジェクト(対象物)の位置を見つけるようにオペレーションを行い、次の水平 方向の隣接するグラフィック・オブジェクトとの間隔及び次の垂直方向の隣接す るグラフィック・オブジェクトとの間隔を判定する。2つの隣接するオブジェク トのうちの近いほうのオブジェクトがキャラクタ幅の所定の分数(割合)内にあ る場合、該近いほうのオブジェクトへの方向が、テキストのラインに沿った隣接 するキャラクタの適当な方向を示す。複数の上記の判定からの垂直又は水平の優 勢な方向は、「水平からの読み取り傾斜(reading slope from horizontal)」 の方向として取られ、従って、スキャンされたページがポートレート方向かラン ドスケープ方向かを示す。 一般的に書かれる日本語や中国語のような言語を含むようにするために、本発 明は、「紙の横からの読み取り傾斜(reading slope from paper crosswise)」 のピクチャ面の方位角(アジマス)を検出するようにオペレーションする(英語 、ヘブライ語、及び殆どのれいこう体(boustrophedonic)の筆写に対してこの 傾斜は0であり、日本語及び中国語に対しては90度である)。すべての既知の 場合において、キャラクタは、連続するラインのキャラクタよりも読み取りライ ンに沿って互いにより近接して典型的に配置される。一般に、読み取り傾斜方向 を決定した後に、システムは、ローカルの文化の言語及びページ・フォーマッテ ィング規定に従って、自動的にイメージを回転させるか又はさせない。 本発明はイメージを適正に見るために90度回転させる必要があるか否かを検 出するが、本発明はどの方向の回転を行うかを検出しない。規定によって、例外 (例えば、ランドスケープ)は特定の観念で回転されており、この規定が破られ たとき(そして結果的に呈示が上下逆になったとき)には、ユーザが指令した1 80度の回転が90度回転よりも計算上ずっと速い。180度の回転は、ライン の順序の反転、ラインに沿ったバイトの順序の反転、及びテーブルのルックアッ プによるバイトの右左のフリッピング(flipping)を典型的に含む。 本発明の方法はグラフィック・オブジェクトを検出する。検出されたグラフィ ック・オブジェクトの幾つかのものに対して、他のグラフィック・オブジェクト (右側及び下側)への距離が判定される。最も近接するオブジェクトが右側にあ ることを示すカウントが増分されるか、最も近接するオブジェクトが下側にある ことを示すカウントが増分されるか、又は何れも増分されない。 オブジェクトからの距離が記録された該オブジェクトは、或る要求に見合うこ とが期待されている。その文字枠(bounding box)の幅(最小寸法)が第1のス レッショルドよりも少なくないこと、その文字枠の長さ(より大きな寸法)が第 2のスレッショルドよりも大きくないこと、及び文字枠の縦横比(長さ:幅)が 第3のスレッショルドよりも大きくないことである。 オブジェクトへの距離が測定された該オブジェクトは、別の第1の種類のオブ ジェクトの出現である必要はない。本方法はオブジェクトの右側の「ウインドウ 」の幅及び下側のクリアスペースの「脚柱」の高さを測定する。それらの距離の 少ない方の何れかが、もし何れかの場合には、どのカウントを増分するかを決定 する。 ここで用いられるように、ウインドウ幅は、オブジェクトとその右側のオブジ ェクト(殆ど任意の性質のもの)との間の任意の走査線に沿っての最も近い近接 であり、かつ、脚柱高は、オブジェクトの下側の任意のオブジェクト(任意の種 類のもの)に対する文字枠の一部の最も近い近接である。 ページ・イメージは一度に1走査線のみ使用可能であることが必要である。各 走査線は一度だけ使用可能であることを更に要求される。本発明の方法は処理速 度において効率的である。処理速度は、縮小されたイメージを用いることによっ て、また、二重連係リストとしてオブジェクトに対するデータ・ブロックを管理 することによって向上される。 より特定的には、本発明は、デジタル化されたページが第1に、ポートレート 方向で見られることを意図されているか、又は第2に、第1の方向から回転され たランドスケープ方向で見られることを意図されているかを決定する方法及び装 置を教示する。 本発明は、イメージ走査線のデジタル化ページのイメージを、イメージ走査線 ベースで検査し、長さスレッショルドよりも大きくない長さ及び幅スレッショル ドよりも少なくない幅を有するグラフィック・エレメントの発生を検出する第1 ステップを含む。スレッショルドは、「キャラクタ・サイズ」のグラフィック・ オブジェクトの予期される寸法に対応するように予め定められる。検出された発 生の各々に対して、本発明は、検出された発生の、他の隣接して配置されたオブ ジェクトに対しての間隔的関係を決定する。本方法は、複数の決定された間隔的 関係に従って、デジタル化ページが第1方向と第2方向のうちの1つをもつよう に宣言するように更にオペーレーションする。 間隔的関係を決定するステップは、検出された発生と同一走査線上の近接する オブジェクトとの間の及び後続する走査線上の近接するオブジェクトへの間隔的 分離の量を決定する。検査するステップは、各走査線に対して、各々が所定の値 を有する近接したイメージ・ピクセルのスパンのリストを形成するステップを含 み、間隔的関係を決定するステップは、リストの各スパンに対して、同一走査線 上の次のスパンへの距離を決定し且つ、イメージ・オブジェクトの最後のスパン に対して、後続する走査線上の第1のスパンへの距離を決定する。各イメージ・ オブジェクトは、関連する文字枠と、文字枠の幅の関数である幅を有するクリア の脚柱とを有する。後続する走査線上の第1のスパンへの距離は脚柱の高さを規 定する。本方法の更なるステップは、第1カウンタと第2カウンタのうちの1つ を、水平の分離(即ち、ウインドウ幅)が垂直の分離(即ち、脚柱高)より多い か又は少ないかの関数として選択的に増分し、宣言するステップは、第1カウン タの値と第2カウンタの値の比率を決定するステップを含む。 図面の簡単な説明 本発明の上述の及び他の特徴は、以下の本発明の詳細な説明を添付の図面を参 照して読むことによって、より明瞭になる。 図1は本発明に従って構築され且つオペレーションされるドキュメント処理シ ステムの簡略化されたブロック図である。 図2は2つの例示的なキャラクタ・サイズのオブジェクト及び第3のものの一 部を示し、本発明の用語を理解するのに有用である。 図3は本発明の現在の好適な方法における走査線の処理のための論理のフロー チャートである。 図4は背景スパン・ヒストグラムを強調するための「塗りつけ及び塗りつぶし (smearing and filling)」技術の説明において有用である。 図5A−5Gは本発明に従ったピクセルのスパンの処理の説明において有用で ある。 本発明の詳細な説明 図1は本発明に従って構築され且つオペレーションされるドキュメント処理シ ステム10を示す。スキャンされるドキュメント・ページ14aの表面に現れる 印刷されたテキスト及びグラフィック・イメージからの光学的コントラストを検 出するために、従来のドキュメント・スキャナ12が用いられる。或るタイプの スキャナでは、スキャナ12とページ14aとの間の相対的運動によって、スキ ャナ12が、該スキャナによって感知された光学的コントラストを示す二進1及 び0のシーケンスを信号ライン12a(単数又は複数)上に出力する。例えばC CDカメラのような別のタイプのスキャナでは、ページとスキャナとの間の相対 的運動は必要ではない。例えば、二進1はページ14上の濃い範囲(キャラクタ 又はグラフィック・イメージの部分)の存在を示し、二進0は濃い範囲のないこ と(背景又は「白スペース」)を示す。ここで用いられるように、二進1及び0 はそれぞれピクセルと呼ばれる。二進情報は走査線フォーマットで出力され、走 査線はスキャン方向(矢印Aで示す)と垂直の向きにある。従って、1つの走査 線はキャラクタの部分からのピクセルを典型的に含む。一例として、且つスキャ ナ12の解像度が200dpiであり且つページ14aの幅が8.5インチ(約 21.6cm)であると仮定すると、走査線は1700までの個別のピクセル( 200×8.5)からなる。典型的なスキャナの解像度は、インチ当たり100 ドット(又はピクセル)(走査線に沿って)から400dpiの範囲にある。 参照目的のために、ポートレート方向位置であり且つ英数キャラクタ情報15 のみを含むドキュメント・ページ14bが示されている。それに対して、ドキュ メント・ページ14cはランドスケープ方向位置にあり且つキャラクタ情報15 とグラフィック(非キャラクタ)情報17の両方を含む。スキャンされるとき、 ページ14b及び14cの両方とも同じ様式でスキャンされる。即ち、スキャナ 12は第1の端部E1から開始し、ページの長い寸法の方を垂直に進み、反対側 の第2の端部E2で終了する。これによって、ページ14bのキャラクタ15が 上から下に(方向Aに沿って)スキャンされ、ページ14cのキャラクタ15が 左から右へスキャンされることが理解され得る。 スキャナ・インターフェース16が信号線12aに、従って、スキャナ12の 出力に結合される。本発明のこの実施例において、スキャナ・インターフェース 16は、以下に詳細に説明する本発明の方法を実行するように構築され且つオペ レーションされる。 スキャナ・インターフェース16の出力はバス16aを経てドキュメント記憶 モジュール18に結合される。記憶モジュール18は、半導体メモリ、磁気又は 光学ディスク・メモリ、磁気又は光学テープ、又はデジタル化されたドキュメン ト・ページのデータを記憶するのに適切な任意のものの内に実現される。示され るように、記憶モジュール18は、ページ・データ・ブロック18aとして表さ れた3つの記憶されたドキュメント・ページを有する。 本発明の一実施例においては、各ページ・データ・ブロック18aはフィール ド18bを有し、検索されたときに、関連するページ・データがポートレート方 向で表示されるか又はランドスケープ方向で表示されるかに関する指示(indica tion、インジケーション)が、スキャナ・インターフェース16によって記憶さ れる。フィールド18bがランドスケープ方向を示す場合、該関連するページ・ データを表示する前に回転オペレーションが行われる。 本発明の別の実施例においては、フィールド18bが除かれ、記憶モジュール 18に記憶する前にページ・データ・ブロック18aがスキャナ・インターフェ ース16によって正しくフォーマット(回転)される。この後者の実施例は、ペ ージを表示する直前に回転を行うことが要求される場合に起こり得る性能の低下 をとり除く。 ドキュメント記憶18のアクセス及びページの表示はドキュメント・プロセッ サ20によって制御される。このプロセッサはバス20a経由でドキュメント記 憶モジュール18と双方向的に結合され、また、CRTディスプレイ22やキー ボード24のような従来のユーザ・インターフェース・デバイスと結合される。 CRTディスプレイ22は、好適には、スキャナによって与えられるようなピク セルの2次元アレイの表示を可能にするグラフィック能力を有する。ドキュメン ト・プロセッサ20は、アーカイブ・アプリケーションのために要求される能力 ではなく又望まれる能力でもないが、ワード・プロセッシング能力及び編集能力 を有し得る。 コンポーネント16−24はすべて、パーソナル・コンピュータのような1つ のデータ・プロセッサ26内に含まれることを認識すべきである。この場合、ス キャナ・インターフェース16はスキャナ12の出力を処理するために呼び出さ れるソフトウエア・モジュールであり、データ・プロセッサ26のパラレル又は シリアル・ポートに従来の様式で結合される。また、この場合には、バス16a 及び20aは同じシステム・バスであり得、それによって、スキャナ・インター フェース・ソフトウエア及びドキュメント・プロセッサ・ソフトウエアがデータ ・プロセッサ26の主メモリ及び大容量記憶コンポーネントにインターフェース される。本発明の別の実施例においては、スキャナ12はデータ・プロセッサ2 6の一体コンポーネントに作られる。 従って、図1のドキュメント処理システム10の実施例は本発明の例示的な態 様を示すことを意図しており、本発明を実現する際の制限を意図していないこと を理解すべきである。 ここに開示される方法は、ドキュメント・ページ・イメージの或る特定の特徴 を仮定している。第1に仮定される特徴は、方向に関係なく、各イメージがテキ ストの1ないし幾つかのラインを含み、それらの殆どが、見られることを意図さ れたページの文化的に決定された方向に向かっていることである。例えば、英語 の場合は水平方向である。どの方向にテキストのラインが向いているかを決定す るために、ここで図2を参照すると、本方法は、キャラクタ・サイズのグラフィ ック・オブジェクト(01、02、03)が近隣のオブジェクトに水平方向によ り近接しているか又は垂直方向ににより近接しているかを判定する。そのための 第2の仮定は、キャラクタのラインに沿ったキャラクタからキャラクタへの間隔 は典型的にキャラクタのライン間の間隔よりも少ないというものである。この後 者の仮定は、第3の仮定、即ち、2つのタリー又はカウンタのみが要求されると いうことへ論理的に導く。第1カウンタは、許容可能オブジェクトであって最も 近い近隣オブジェクトが右側にある該許容可能オブジェクトをカウントし、第2 カウンタは許容可能オブジェクトであって最も近い近隣オブジェクトが下側にあ る該許容可能オブジェクトをカウントする。 キャラクタ・サイズのグラフィック・オブジェクトを処理するための好適な技 術は、各オブジェクトについての文字枠を決定することである。従って、本発明 によって用いられる特定の処理方法は、文字枠から決定されたキャラクタ・サイ ズのグラフィック・オブジェクトのサイズ及び縦横(アスペクト)比の及び近隣 オブジェクトに対する間隔的関係の関数である。 発明者は、キャラクタ・サイズのグラフィック・オブジェクトの識別に関する 幾つかの明らかに「直感的」な仮定によって誤った決定がなされることを考慮し たことを第1に留意されたい。 そのような仮定の第1のものは、見られることを意図された「キャラクタ」の 文字枠は殆どいつも幅よりも高さが高い、というものである。しかしながら、こ の仮定は信頼できないことが見つけられている。なぜなら、この仮定は、(i) 小文字mやwなどの場合に一般に犯されおり、(ii)連続するキャラクタ、特に セリフを有する大文字はしばしば接触し、また、キャラクタ自身が接触していな いときでも飾りひげ付けによって文字枠がしばしば接触するからである。 ヒストグラムが両方の方向において背景スパン(すべてが背景の値、例えば0 、を有するピクセルのシーケンス(一連のピクセル))で構成される場合、テキ ストのラインに沿った方向において前景ピクセル(例えば、値1を有するピクセ ル)間で背景ピクセルの短いストレッチの優勢であることが仮定され得る。しか しながら、そのような分析の結果は決定的なものではない。なぜなら、多くのキ ャラクタ内部のスパンが、垂直的(例えば、acestzEFZ・・・)及び水 平的(例えば、hmnuvwAH・・・)の両方に、存在するからである。 更なる誤った仮定は、上述のヒストグラム技術は「塗りつけ」及び「塗りつぶ し」オペレーションを含むように変更できるというものである。即ち、また図4 に示すように、黒の残余イメージ(前景)のスパンが各連続するライン上にOR 演算され、下方向の「縞(streak)」が作られるとする。しかしながら、残余を OR演算する前に、その前景スパンの各々は各端部上のピクセルだけ減少される 。意図されていることは、囲まれた背景スペース(例えば、bdeopqAB) 及び下方を向いた凹形を、完全に(mnhの場合のように)又は部分的に(cs )、満たすことである。上方を向いた凹形(例えば、uvwy)はこの技術に影 響されない。最終の結果として、各キャラクタの下に下方に向いた「陰」が形成 され、その陰はキャラクタの下のキャラクタ幅の約1/2の点で終了する。これ は簡単なヒストグラム技術よりも実際に進歩したものであるが、しかし、テキス トから構成されない構築されたイメージ・マテリアルからの背景スパンのヒスト グラムに対する寄与のため、結果的な背景スパンのヒストグラムはまだ十分に区 別されるものではない、ということが考慮されている。 以下に説明する方法は、スキャンされたドキュメント・ページ内のキャラクタ の識別を考慮する1つ又はそれ以上のそれら多種のアプローチを導入することに よって起こるであろう問題を解決する。 本発明において、キャラクタ・サイズのオブジェクトは、第1の所定の制限内 の長さ(文字枠の高さ又は幅の最大値)と、第2の所定の制限内の幅(例えば、 0.02インチ(約0.51mm)から0.30インチ(約7.62mm))と、第 3の所定の許容最大制限を越えない長さ対幅の縦横比(例えば4)とを有するも のとして規定される。 本発明において、「次の近隣の」オブジェクトは、第1のキャラクタ・サイズ のグラフィック・オブジェクトから、該第1のキャラクタ・サイズのグラフィッ ク・オブジェクトの最小寸法の或る分数部(割合)(例えば2/3)を越えない 量の間隔だけ離れているものとして規定される。 本発明の方法は、例えば図1のモジュール16内のこの処理のために割り当て られる記憶範囲が制限されているものと仮定する。従って、本方法は好適には、 一度に1走査線だけを上から下への順番で受け入れ且つ処理し、3つの完全な走 査線のみ、即ち、詳細に処理される「現在の」走査線、前の走査線、及び次の( 先を見越した)走査線を手元に保持する。 本方法はまた、本方法がスキャナ・ドライバ又はインターフェース自身内(図 1に示す)に又はスキャナ・インターフェースに近接した下流に含まれることが 適当であるので、計算時間が重要であると推定する。好適には、本方法の実行は 進行中の作業を大きく遅らせるべきではないが、それを完全に別個のプロセスに することも望ましくない。なぜなら、大量の更なるI/Oが必要となるからであ る。本発明において、高速のオペレーションが主に(1)減縮したイメージ(例 えば、100dpi)を処理することによって、及び(2)「処理中のオブジェ クト」に対するデータを二重連係リストに維持することによって達成される。 多数のイメージ・フォーマット、例えば、1の上の0又は0の上の1、高又は 低のビットのイメージの最左端の連続するバイト対がスワップされるか否か、が あるため、及び多数の可能な入力解像度、例えば、最も一般的なものとしては1 00、200、300、400dpi、があるため、本方法はスキャナからの入 力を更に以下のように標準化する。 オーダーのバイト(8ピクセル=1バイト)、 高オーダーのイメージ・ビット(MSB)は最左端、 0(背景)の上に1(前景)、及び 100dpi(1ピクセルを形成するために前景ピクセルのN×N領 域をOR演算することによる) 図や表で一般的に用いられる水平及び/又は垂直のラインの存在は、簡単な判 断実行手順を多種の方面で混乱させ得る。例えば、ライン又はそれらの一部は、 テキストが水平のラインの僅か上に現れるとき、キャラクタとして又はキャラク タの次の近隣のものとして誤って理解され得る。本発明に従うと、イメージ・デ ータ内の水平の及び垂直のラインから起こる問題は対称的に対処されない。なぜ なら、イメージ処理は事実上方向性があるからである。即ち、イメージ処理はイ メージの上部から下部へ一度に1走査線ずつ進む。 水平ラインは受信した走査線を前処理することによって本質的に除かれる。即 ち、第1の前処理ステップにおいて、入来する走査線は、キャラクタ・サイズの 許容される範囲よりも長い前景ピクセルの連続するスパンから除かれる。そのよ うなラインの突出した端部は、すぐ上又はすぐ下に近隣の前景ピクセルを有さな いすべての前景ピクセルを除去する第2の前処理によって更に除かれる。 垂直ライン(又はそのセグメント)は、それらに十分な太さがない場合又はオ ブジェクトのそれら部分の高さ対幅の縦横比がここまでは上限(例えば4:1) を越えて見られる場合には、キャラクタ又はキャラクタの近隣のものとして考慮 から不適確とされる。 キャラクタ・オブジェクト間の間隔の判定は、一般に、文字枠間の間隔の判定 よりも複雑である。これは、飾りひげ付けやセリフ又は他の突出部によって、文 字枠(通常に認知されたいるキャラクタのもの)がオーバーラップ又はマージさ れるようになるからである。従って、本方法は、キャラクタに対する現在の走査 線の前景スパンによって示される該キャラクタの現在の左から右のエクステント と、ここまでに遭遇したキャラクタの最も左と最も右のエクステントと、の間を 好適に区別する。 そのために、走査線方向における次のオブジェクト02への水平距離(図2に 示すクリア・スペースの「ウインドウ」の幅)が、走査線方向におけるキャラク タの現在のエクステントから次のオブジェクトのエクステントまでの今までの最 小距離としてトラッキングされる。 次のオブジェクトへの垂直距離は、オブジェクト01の文字枠の下のクリアの 「脚柱」範囲の最も高いものとして取られる。脚柱は、オブジェクト01が終わ るレベルで開始し、文字枠の幅の特定の分数部(割合)、例えば1/2、の幅を 有し、03と関連する前景ピクセルの或るスパンに遭遇するまで下方に続くもの として規定される。この下方のエクステント(延び)は脚柱高を規定する。 図2は2つの完全に水平に近接したキャラクタ様のグラフック・オブジェクト (01及び02)及び第3の垂直に近接するグラフック・オブジェクト03につ いてのこれらの関係のすべてを示す。図2はまた、01の元は個別のオブジェク トの上部がマージされた場合を示す。 処理速度を向上させるために、すべてのオブジェクトが左から右へのオーダー で2つの二重連係リスト構造に保存される。一方のリスト構造は作業中のオブジ ェクトに対するものであり、他方のリスト構造は、最も下のエクステントに達し ているがそのクリア・スペースの脚柱が現在垂直軸に沿って下方にトラッキング されているオブジェクトに対するものである。 上述の及び示したすべての寸法は、走査線に沿った前景ピクセルの隣接するス パンのリストから或る方法で創作する。図2において、オブジェクト01は、各 々が前景ピクセルの1つ又は2つのスパンを有する18走査線の部分からなり、 オブジェクト02は、各々が前景ピクセルの1つのスパンを有す10走査線の部 分からなる。これらのスパンは、(i)新しいオブジェクトを産むため、(ii) オブジェクトの文字枠を左、右、及び/又は下に延ばすため、(iii)2つの近 接して配置されたオブジェクトを1つにマージするために、選択的に用いられる 。それらはまた、オブジェクトの下のフリースペースの「脚柱」の下方の突出部 を終了させ、それによって脚柱の高さを確立するように働く。 前記の観点から、本発明の重要な特徴は、イメージ・データ内の前景ピクセル のスパンの検出及び処理であることが理解され得る。図3に示すように、本発明 の方法のこの特徴は、各走査線(減縮された100dpiのイメージの走査線) に対して行われる6つの主なステップ(A−Fで示す)を含む。簡単に言うと、 第1ステップ(A)は前景スパンのリストを生成し、次に、5つのパス(B−F )が、このリスト及び/又は関連のオブジェクト及び/又は脚柱のリストを通し て行われる。 簡単に説明すると、図3のステップは以下のようである。 (A)実際のデータのすぐ右側に作為的に挿入された1又は0の何れかに来る まで、次の1−ビット、その次に0−ビットなどを交互に見つけることによって 、スパンをリストする。 (B)連続する毎脚柱が前景スパンとどのように関連するかを判定することに よって脚柱をトラッキングし、従って脚柱を連続するか又は終了する。 (C)対角的に隣接する前景ピクセルが「接触する」と考えて、現在の水平の エクステントが同じスパンに接触するシーケンシャルに隣接するオブジェクトの 毎対をインタラクティブにマージすることによって、隣接するオブジェクトをマ ージする。 (D)オブジェクトに接触する毎スパンに対して、スパン全体を含むようにオ ブジェクトの左及び右の境界を延ばすことによって、スパンに従って作成中のオ ブジェクトを処理する。オブジェクトに接触する各スパンは「使用される」とマ ークされ、即ち、或る作成中のオブジェクトの一部として説明される。何れのス パンを経由しても継続していない毎オブジェクトに対して、オブジェクトを終了 し、それを拒絶するか又はトラッキングされる必要がある脚柱として再びリスト する。 (E)使用されていない毎スパン(連続するオブジェクトの一部ではない)に 対して、このスパンがピクセルの最上部層である新しいオブジェクトを作るステ ップによって、新しいオブジェクトを産む。新しいオブジェクトは「受け入れ不 可能なほど広い」ウインドウ幅で開始する。 (F)各作成中のオブジェクトに対して、右側の次のスパンへの現在の走査線 上のクリアの距離を決定するステップによって、ウインドウ幅をトラッキングす る。クリアの距離が現在定められているウインドウ幅よりも少ない場合には、従 ってウインドウ幅を減少させる。 図5A〜5Gは前景ピクセルのスパンの存在又は欠如の影響を示す。図5Aは 、(Aで、)長いスパンが先のラインにおいて除かれることを示し、次に、上に も下にも隣接のものがない現在のラインの(Bでの)前景ピクセルが除かれるこ とを示す。図5Bは現在のラインのスパンが脚柱にオーバーラップするときに脚 柱が終わることを示す。図5Cは、現在のラインのスパンが2つ又はそれ以上の 作成中のオブジェクトのスパンに接触するとき、オブジェクトはマージして結果 的オブジェクトは連続することを示す。図5Dは、現在のラインのスパンが作成 中オブジェクトの前のラインの水平のエクステントに全く接触しないとき、その オブジェクトは終了し且つその脚柱が開始することを示す。図5Eは、1つ又は それ以上のスパンが作成中オブジェクトの現在の水平のエクステントに接触する とき、そのオブジェクトの横の境界がスパン(1又は複数)を含むように延ばさ れることを示す。図5Fは、スパンが残るとき、即ち、スパンが連続するオブジ ェクトの一部ではない場合、新しいオブジェクトが産まれることを示す。そして 、図5Gは、今の走査線の作成中オブジェクトの最も右のスパンの右側のクリア ・スペースが判定された場合、オブジェクトのウインドウが、最大、その距離に クリップされることを示す。 上記に設定されたステップA〜Fは更に、以下の疑似コードに仕上げられ、a に後続するテキストは先行するラインからのテキストの継続である。 広がる組み合わせ的に豊富なやり方とオブジェクトのシーケンスが或る走査線 に沿って整合され得ることとにより、かなりの複雑性に費用を費やすことで、5 つのパスはマージされ得ることにまず留意されたい。従って、明瞭性及び維持可 能性のために、ステップB−Fをスパンのリストを通じて個々のパスとして維持 することが好ましい。 ステップA このステップは、走査線から水平のスパンを選び、イメージの走査線のすべて の残りの黒のスパン(前景ピクセルのスパン)を検出及びリストするために行わ れる。 より詳細には以下のようである。 前方のラインにおけるN又はそれより多くの全前景バイトの連続する ストリングの各々に対して ストリングを零にする ストリングを結合するバイトにおける隣接する前景ビットを零 にする 上又は下の1のビットを除く現在のラインのすべての1のビットを零 にする イメージ・ラインの終わりで1のビット及び0のビットで更なるバイ トを置く 左端上でスキャンを開始する 右端を外れてないときに 次の1のビットを見つける イメージを外れた場合、「ときに(while)」ループから出る 次の0のビットを見つける 次のスパンが見つけられると次の1から次の0を記録する、ス パンカウントを増分する イメージの遠い右側の更なる人工的スパンをリストに付加する ステップB 以下のステップにより脚柱をトラックする。 各黒スパン(イメージの遠い右側の人工的スパンを含む)に対しての 脚柱リストの左端に脚柱ポインタをセットする このスパンの完全に前の各更なる脚柱に対して 脚柱が既にウインドウ幅よりもずっと高い又は高い場合 ウインドウが十分狭い場合、 ポートレートに対して1つをタリー(tally)す る 脚柱をすてる [さもなければ脚柱を垂直にのばす] このスパンに重なるする各脚柱に対して[脚柱の終わり] ウインドウの幅<高さである場合、ウインドウ幅はOK 、アスペクト比はOK ポートレートに対して1つをタリーする さもなければ高さ<幅の場合、高さはOK、アスペクト 比はOK ランドスケープに対して1つをタリーする 脚柱をすてる ステップC 次のステップは以下のステップにより隣接するオブジェクトをマージする。 オブジェクト・リストの左端での左及び右のオブジェクト・ポインタ で開始する 各スパンに対して スパンの左でないまで左のオブジェクト・ポインタを進める スパンの適切な右である場合、次のスパンで「対して(for) 」ループを再開する [さもなければ重なる] そこに右のオブジェクトのポインタをセットする 右のポインタがスパンの適切な右になるまで右のポインタを進 める ポインタが同じオブジェクトを指すまで1ずつ右のポインタを 戻す 左のオブジェクトを右のオブジェクトにマージする 左のオブジェクトの左の境界を用いる より高いオブジェクトの頂部を用いる 左のオブジェクトを切り且つ捨て、左のポインタを進め る 新しいオブジェクトが広すぎる場合、それを捨てる ステップD 次のステップはスパン(対角的ピクセルが「接触」)に従ってオブジェクトを 処理する。 リストの左端に脚柱挿入点をセット 最も左のスパンにスパン・ポインタをセット 最も左のオブジェクトにオブジェクト・ポインタをセット オブジェクト・ポインタがオブジェクト・リストの右端から外れてい ないとき セット:オブジェクトが連続する=偽 オブジェクトの完全に左のスパンをスキップ 左リミット=遠い右にセット 右リミット=遠い左にセット スパン・リストの端部を外れていないときに スパンが完全にオブジェクトの右の場合、「ときに(while) 」ループを出る スパンを含むように左リミット、右リミットを条件に基づいて 延ばす セット:オブジェクトが連続する=真 スパンを無効にする(それを「使用済み」とマーク) オブジェクトの現在のエクステントを左リミット、右リミットにセッ トする 左リミット、右リミットを含むようにオブジェクトの左、右の先端部 を延ばす ここでオブジェクトが広すぎる場合 オブジェクトを捨てる(オブジェクト・リストから除き、フリ ー・リストに入れる) 外の「ときに(while)」ループを続ける オブジェクトが連続するが真の場合には、外の「ときに」ループを続 ける [さもなければオブジェクトの寸法は最終的なものである] オブジェクトの最大及び最小の寸法を決定する 最大が大きすぎ又は最小が小さすぎ又はアスペクト比が大きすぎの場 合 オブジェクトをオブジェクト・リストから除く ブロックをフリー・リストに入れる さもなければ オブジェクトをオブジェクト・リストから除く 新しい脚柱位置を見つけるために脚柱挿入点をスキャンする ブロックを脚柱リストに入れる 現在の走査線に対して脚柱の頂部をセットする 脚柱の左、右をオブジェクトの左、右の境界の1/2にセット する ステップE 次のステップは、使用されていないスパンに対して、以下のステップによって 新しいオブジェクトを産む。 オブジェクト・ポインタを、オブジェクト・リストの左端にセットす る 各スパンに対して スパンが「使用」されている場合、次のスパンで「対して(fo r)」ループを続ける 新しいオブジェクトを挿入するための点を見つけるためにオブ ジェクト・リストを右にサーチする 使用するためのフリー・ブロックがない場合、「対して」ルー プを出る 新しいブロックを得、オブジェクト・パラメータをオブジェク ト・リストに挿入する 左端=現在の左=スパンの左 右端=現在の右=スパンの右 ウインドウの右=イメージから遠い右 オブジェクトの頂部=現在の走査線 ステップF 最後のステップは、右側の次のオブジェクトがここでより近接している場合に 、以下のステップによってウインドウ幅を減少させる。 各オブジェクトに対して このオブジェクトの現在のXエクステントの右端を決定する 右側の次のスパンの左端を決定する これが右側のオブジェクトへの距離についての新しい低いもの である場合 このオブジェクトのウインドウをこの距離に切る 本発明の方法は、テキスト及び/又は英数字のイメージ全体を処理し、20: 1の典型的な比率で右方向にカウントを生じることが可能であることが見いださ れている。これは、ページ上の方向(ポートレート又はランドスケープ)に関す る信頼性のある判定が、イメージ全体が処理されるずっと前にしばしばなされる ことを示唆する。グラフ、表、広告、リストなどを含む変化するサンプルに対し て、右方向における比率は2:1から50:1の範囲であることが発見されてい る。 本発明を用いるための直接的且つ単純な技術は、例えば5つずつの人工的なポ ートレート及びランドスケープのタリーから開始する。次に、本方法は上述のよ うにそれらのタリーを増分する。イメージがランドスケープ・フォーマットにあ るという信頼性のある宣言は、ランドスケープ・タリーのパーセンテージ、即ち [(100×ランドスケープ・タリー)/(ランドスケープ・タリー+ポートレ ート・タリー)]が約75より大きいときになされる。イメージがポートレート ・フォーマットにあるという信頼性のある宣言は、このパーセンテージが約25 より小さいときになされる。 一例として、従来の386ベースのパーソナル・コンピュータを用い且つ走査 線が高速RAM主メモリを通過すると仮定すると、本方法によって消費されるコ ンピュータ処理時間は、8.5インチ×11インチの300dpiのイメージの 全体の処理に対して6秒のオーダーであることが見いだされている。更に、イメ ージがランドスケープ・フォーマットであるかポートレート・フォーマットであ るかに関する信頼性のある決定がなされるまでに典型的に1秒のみが必要である ことが判定されている。 ここで説明された方法は、高速であり、最小のメモリを必要とし且つ実施する ために特別のハードウエアを必要とせず、一度にイメージの1つの走査線のみに (順に)アクセスし、蓄積されるタリーが任意の時にコーラ(caller)に使用可 能であり、本方法はローバスト(robust)であり、何れかの標準のフォント又は フォーマットの使用に依存していない、ということが理解され得る。 即ち、本方法は、英数キャラクタを表しているであろうキャラクタ・サイズの グラフィック・オブジェクトのストリング、数学的演算子のような特別な符号、 及び多数の異なる言語からのキャラクタを表すグラフィック・イメージの発生及 び間隔的方向を検出する。 好適な実施例の前記の説明に従うと、本発明は推定されたテキスト(presumed text、テキストと推定されたもの)の方向を自動的に判定するプロセス及びシ ステムを提供する。テキストの準備された(prepared)イメージにおいて、以下 に定めるように、カウントは、確証されたオブジェクト(validated object)で あって最も近くにある近隣オブジェクトが第1の方向に相対的に配置され且つそ れが該確証されたオブジェクトに許容可能に近接している該確証されたオブジェ クトに集計される(tabulated)。カウントはまた、確証されたオブジェクトで あって最も近くにある近隣のものが第2の方向に相対的に配置され且つそれが該 確証されたオブジェクトに許容可能に近接している該確証されたオブジェクトに 集計される。このプロセスは行われる必要があるが、だいたい、走査線毎のベー スでイメージを上から下へ進む1つのパスの間に高速且つ簡単な計算を用いる。 カウントを基にする判定プロセスが推定されたテキストの方向を決定したときに このプロセスは終了し、イメージにおける推定されたテキストのラインはそれに 基いて第1の方向にあるか又は第2の方向にあるかを宣言される。第1の方向及 び第2の方向は、例えば、それぞれ右及び下である。 イメージの準備(preparation)は、固定の解像度及びフォーマットで縮小及 び/又は標準化したイメージを形成することを含み得、準備されたイメージはプ ロセスの残りの部分に対するベースを形成する。 固定の解像度は、例えば、インチ当たり100ドット(ピクセル)又はその他 の従来のスキャニングの解像度の共通の約数である。標準化されたフォーマット は、例えば、イメージ上部からイメージ下部への順の走査線、又は左から右への 順の走査線バイトである。順になった各走査線バイトのビットはイメージの最も 左に最上位ビット(MSB)有し得、1のビットが前景ピクセルを表し、0のビ ットが背景ピクセルを表す。 また、イメージの準備は隣接する前景ピクセルの特別長いスパンの除去を含む ことができ、隣接する前景ピクセルの特別長いスパンの除去の後、イメージの準 備は、すぐ上又は下に位置する隣接する前景ピクセルのない任意の残りの前景ピ クセルの除去を更に含み得る。 オブジェクトは、イメージの前景スパンの区分からの結果であるスパンの互い に素な集合(disjoint sets of spans)であると考えられ、各セットは過渡的に (transitively)接続される。区分は通常の数学的な意味を有し、ここでは、各 スパンが或るオブジェクトのメンバであることを意味する。ワードの互いに素な こともまた通常の数学的に意味を有し、ここでは、1つよりも多いオブジェクト のメンバであるスパンはないことを意味する。ここでは、スパンは、走査線に沿 った前景ピクセルの最も隣接するセットとして考えられ、左端及び右端の背景ピ クセルによって境界がなされる。接続されたスパンの対は、各スパンから1つの 少なくとも一対の隣接するピクセルを含む隣接する走査線のスパンである。1つ のピクセルに対して、それに隣接するピクセルは、8つの隣接するもの、即ち、 4つの直交方向及び4つの対角方向のもののうちの任意のものである。互換的に は、1つのピクセルから、隣接するピクセルは4つの直交方向、即ち、左、右、 上、下の近隣するもののうちの任意のものである。 ここで用いられるように、過渡的に接続される(transitively connected)は 、スパンAがスパンBに接続され且つスパンBがスパンCに接続されるとすると 、スパンAが(過渡的に)スパンCに接続され、以下同様に繰り返し続けられ、 オブジェクトを規定するセットとして含まれるようにすることを意味し、従って 、すべてのスパンは直接的に又は間接的に互いに接続される。 ここで用いられるように、確証されたオブジェクトは、文字枠の短い方の寸法 が最小の許容可能な幅よりも少なくなく、文字枠の長い方の寸法が最大の許容可 能な長さよりも大きくなく、幅と長さの文字枠のアスペクト比が最大の許容可能 なアスペクト比よりも大きくなく、右又は下の最も近い近隣オブジェクトへの距 離が許容可能なスレッショルド距離内にあるオブジェクトである。 オブジェクトの文字枠の位置及び寸法はオブジェクトを構成するスパンを構成 するピクセルの最も左、最も右、最も上、及び最も下の座標として取られる。 本発明のアプリケーションのコンテキストにおいて用いられるように、文字枠 の最大及び最小寸法及び最大アスペクト比はローカルの言語のキャラクタの文字 枠のものとほぼ等しく予め定められる。 右側の最も近接する近隣オブジェクトへの距離は、許容可能な長さの何れのス パンもオブジェクトに属していないオブジェクトの任意のスパンの、任意の走査 線に沿った、ピクセルの最も近い接近として定められる。下の最も近接する近隣 オブジェクトへの距離は、オブジェクトの文字枠の底部から直下の最初に遭遇す る前景ピクセルのスパンまでの走査線の垂直距離である。文字枠の底部の使用さ れた部分は、ボックスの底部の或る割合、例えば1/2であり、文字枠の底部の 使用された部分は文字枠の底部に沿って中心に置かれる。許容可能な低い距離は 、オブジェクトの文字枠幅(最小寸法)の或る割合、例えば、幅の2/3である である。 判定手順は垂直近接度カウントと水平近接度カウントの関係を基にする。幾つ かの場合には、これは、推定されたテキストの方向の判定がイメージ処理の間の 中間点でなされる結果に導く。そうでない場合には、判定がイメージ全体の処理 の終わりに行われる。 従って、垂直に対する水平(horizontal-to-vertical)の比率又は超過度が常 に予めセットされたスレッショルドを越えるとき、イメージ処理の間に判断が行 われ、その宣言は水平テキスト・ラインに対するものとなり、逆の比率(水平に 対する垂直(vertical-to-horizontal))又は超過度が常にスレッショルドを越 える場合には逆に垂直に対するものとなる。 比率が用いられる場合、各カウントは初期には或る人為的な非0の数、例えば 5、にセットされ得、判定する比率は例えば3:1であり得る。 判定のために比率よりも超過度が用いられる場合、判定する超過度は或る所定 の数であり、例えば、垂直タリーよりも垂直タリーが50多いこと、又はその逆 である。 イメージの処理が完了する終わりにおいてなされる場合、判定はカウントの1 つの比較に依存し、より大きいカウントがその関連する方向をテキストの推定さ れたラインに沿った推定されたキャラクタの方向として示す。 互換的に、イメージ処理の間又は後になされる判定は、2つのカウントの相対 的大きさの或る他の単調関数に従うものであり得る。 上記では、特定の寸法及びサイズの関係、前景及び背景ピクセルに対する値、 走査線の解像度、その他の関係を説明したが、それらパラメータについての多数 の変更が本発明の教示の範囲から逸脱することなく成され得ることが認識される べきである。更に、図3のロジックのフローチャートの個々のブロックが全体的 に又は部分的に、例えば上述の機能を行うように動作するプログラムされたプロ セッサのようなシリアルに接続される回路によって実現され得ることが認識され 得る。 従って、本発明はその好適な実施例に関して特定的に示され且つ説明されたが 、当業者には、本発明の範囲及び精神から離れることなく形式及び詳細の変更が 成され得ることが理解されるであろう。
【手続補正書】特許法第184条の8 【提出日】1996年6月4日 【補正内容】 請求の範囲 1. デジタル化されたページが第1の方向で見られることを意図されている か又は前記第1の向きに対して回転された第2の方向で見られることを意図され ているかを判定する方法において、 必要である場合に、デジタル化されたページのイメージを所定のフォーマット にするために前記イメージを前処理するステップであって、前記イメージはテキ ストの少なくとも1ラインを含む、ステップと、 イメージ走査線上の前記デジタル化された前処理されたページのイメージをイ メージ走査線ベースで検査し、最大長スレッショルドよりも大きくない長い方の 寸法と最小幅スレッショルドよりも少なくない短い方の寸法とを有するグラフィ ック・オブジェクトの発生を検出する検査ステップと、 検出された発生のそれぞれに対して、他の隣接して配置されたグラフィック・ オブジェクトに対しての前記検出された発生の間隔的関係を決定する決定ステッ プであって、前記間隔的関係は前記走査線に平行の軸及び前記走査線に垂直の軸 に沿って決定される、決定ステップと、 複数の決定された前記間隔的関係に従って、前記デジタル化されたページが前 記第1の方向と前記第2の方向のうちの1つを有することを宣言する宣言ステッ プ、及びそれに従っての記憶したページ・イメージの回転のインジケータのセッ ト又は記憶する前のページ・イメージの回転のうちの一方を行うステップと を備える方法。 2. 請求項1に記載の方法において、 前記第1の方向はポートレート方向であり、前記第2の方向はランドスケープ 方向である、 方法。 3. 請求項1に記載の方法において、 長さの範囲及び幅の範囲はそれぞれ、テキスト・キャラクタの長さ及び幅の予 期される範囲とほぼ等しく予め定められる、 方法。 4. 請求項1に記載の方法において、 前記検査ステップは、各走査線に対して、各々が所定の値を有する隣接するイ メージ・ピクセルのスパンのリストを形成する形成ステップを含む、 方法。 5. 請求項4に記載の方法において、 間隔的関係を決定する前記決定ステップは、1つのスパンと同一走査線上の後 続のスパンとの間の及び後続する走査線上の後続するスパンに対する間隔的分離 の量を決定する、 方法。 6. 請求項4に記載の方法において、 間隔的関係を決定する前記決定ステップは、前記リストの各スパンに対して、 同一走査線上の次のスパンへのピクセルでの距離と、イメージ・オブジェクトの 最後のスパンに対して、後続する走査線上の最初のスパンへの走査線での距離と を決定する、 方法。 7. 請求項6に記載の方法において、 各イメージ・オブジェクトは関連する文字枠を有し、後続の走査線上の最初の スパンへの距離は前記イメージ・オブジェクトの下の脚柱の高さを定め、前記脚 柱は前記文字枠の幅及び位置の関数である幅及び横の位置を有し、更に、第1カ ウンタ及び第2カウンタのうちの1つを、脚柱の高さに対する同一走査線上の次 のスパンに対するウインドウ幅の比率の関数として選択的に増分するステップを 含む、 方法。 8. 請求項7に記載の方法において、 前記宣言ステップは、前記第2カウンタの値に対する前記第1カウンタの値の 比率を決定するステップを含む、 方法。 9. 請求項1に記載の方法において、 前記宣言ステップは、前記検査ステップが前記イメージの全走査線を検査する 前に行われる、 方法。 10. 請求項6に記載の方法において、 前記決定ステップは、隣接して配置されたスパンを有するイメージ・オブジェ クトをマージするステップを含む、 方法。 11. 請求項5に記載の方法において、 前記検査ステップは、幅スレッショルドを越える走査線に沿った長さを有する スパンを検出し且つ除去するステップを含む、 方法。 12. 請求項5に記載の方法において、 前記形成ステップは、隣接する先行の走査線上又は隣接する後続の走査線上に 隣接するイメージ・ピクセルを有さないイメージ・ピクセルを検出し且つ除去す るステップを含む、 方法。 13. 請求項1に記載の方法において、 各イメージ走査線は単位長さあたりに第1の数のイメージ・ピクセルを有する ように生成され、かつ、前記前処理するステップは、要求された場合に、単位長 さあたりに所定の数のイメージ・ピクセルを得るようにイメージ・ピクセルをマ ージするステップを含む、 方法。 14. 請求項1に記載の方法において、 前記寸法は直交的に配置された文字枠の個々の寸法である、 方法。 15. ページ・スキャナからデジタル化されたページを受信する入力ポート と、前記入力ポートに結合されたインターフェースとを備えるドキュメント処理 システムにおいて、前記インターフェースは、前記デジタル化されたページが第 1の方向で見られることを意図されているか又は前記第1の向きに対して回転さ れた第2の方向で見られることを意図されているかを決定する手段を備え、前記 決定する手段は、必要である場合にはテキストの少なくとも1ラインを含むデジ タル化されたページのイメージを所定のフォーマットにするために該イメージを 前処理する手段及びイメージ走査線上の前記デジタル化されたページの前処理さ れたイメージをイメージ走査線ベースで検査して最大長スレッショルドよりも少 ない長い方の長さ寸法と最小幅スレッショルドよりも大きい短い方の幅寸法とを 有するグラフィック・オブジェクトの発生を検出する検査手段を備え、検出され た発生のそれぞれに応答して、他の隣接して配置されたグラフィック・オブジェ クトに対しての前記検出された発生の間隔的関係を決定する手段と、前記間隔的 関係は前記走査線に平行な軸及び前記走査線に垂直な軸に沿って決定されること と、複数の決定された前記間隔的関係に従って、前記デジタル化されたページが 前記第1の方向と前記第2の方向のうちの1つを有することを宣言する手段であ って、記憶したページ・イメージの回転のインジケータのセット又は記憶する前 のページ・イメージの回転のうちの一方を行う宣言する手段とを備えるシステム 。 16. 請求項15に記載のシステムにおいて、 前記第1の方向はポートレート方向であり、前記第2の方向はランドスケープ 方向である、 システム。 17. 請求項15に記載のシステムにおいて、 長さの範囲及び幅の範囲はそれぞれ、テキスト・キャラクタの長さ及び幅の予 期される範囲とほぼ等しく予め定められる、 システム。 18. 請求項15に記載のシステムにおいて、 間隔的関係を決定する前記決定する手段は、1つのスパンと同一走査線上の後 続のスパンとの間の、及び後続する走査線上の後続するスパンに対する間隔的分 離の量を決定する手段を含む、 システム。 19. 請求項15に記載のシステムにおいて、 前記検査する手段は、イメージ・オブジェクトの二重連係リストに前記の検出 された発生の指示を記憶する手段を含む、 システム。 20. テキストの準備されたイメージにおける推定されたテキストの方向を 自動的に決定するプロセスにおいて、 必要である場合に、前記テキストの前記イメージを所定のフォーマットにする ために該イメージを前処理するステップであって、前記イメージはテキストの少 なくとも1つのラインを含む、ステップと、 走査線ベースで走査線上のイメージにわたってパスを行うステップと、前記パ スを行う間に、 確証されたオブジェクトの個々のものの第1のカウントを集計するステップで あって、最も近い近隣オブジェクトが前記確証されたオブジェクトに相対的な第 1の方向に配置され且つ該近隣オブジェクトが前記確証されたオブジェクトの第 1の所定の距離内にある該確証されたオブジェクトの第1のカウントを集計する ステップと、 確証されたオブジェクトの個々のものの第2のカウントを集計するステップで あって、最も近い近隣オブジェクトが前記確証されたオブジェクトに相対的な第 2の方向に配置され且つ該近隣オブジェクトが前記確証されたオブジェクトの第 2の所定の距離内にある該確証されたオブジェクトの第2のカウントを集計する ステップと、 前記第1の方向と前記第2の方向のうちの一方が前記走査線に平行であり、他 方の方向が走査線に直交であることと、 前記第1のカウント及び第2のカウントを基にする判断プロセスが推定された テキストの方向を決定したときにパスを終了するステップと、 前記イメージにおける推定されたテキストのラインが前記第1の方向に沿うか 又は前記第2の方向に沿うかを宣言するステップ及びそれに従っての記憶したイ メージの回転のインジケータのセット又は記憶する前のイメージの回転のうちの 一方を行うステップと、 を備え、 確証されたオブジェクトは文字枠を有するオブジェクトであり、該文字枠の短 い方の幅寸法は最小許容可能幅よりも少なくなく、長い方の長さ寸法は最大許容 可能長さよりも長くなく、長さと幅のアスペクト比は最大許容可能アスペクト比 よりも大きくなく、前記第1の方向又は前記第2の方向の最も近い近隣オブジェ クトへの距離は所定のスレッショルド距離内にある、 プロセス。 21. 請求項20に記載のプロセスにおいて、 前記第1の方向と前記第2の方向とは互いに直交軸に対応する、 プロセス。 22. 請求項20に記載のプロセスにおいて、 前記第1の方向と前記第2の方向とは、それぞれ、右と下とである。 プロセス。 23. 請求項20に記載のプロセスにおいて、 前記前処理するステップは、固定の解像度及びフォーマットで縮小及び/又は 標準化したイメージを形成することによってイメージを準備するステップを含む 、 プロセス。 24. 請求項23に記載のプロセスにおいて、 前記の標準化されたフォーマットは、イメージの上からイメージの下へオーダ ーになった走査線及び左から右へオーダーになった走査線バイト、のうちの1つ が選択される、 プロセス。 25. 請求項24に記載のプロセスにおいて、 オーダーになった各走査線バイトのビットはイメージの最も左に最上位ビット (MSB)を有し、1のビットは前景ピクセルを表し、0のビットは背景ピクセ ルを表す、 プロセス。 26. 請求項23に記載のプロセスにおいて、 前記のイメージを前処理するステップは、連続する前景ピクセルの特別に長い スパンを除去するステップを含み、ここにおけるスパンは走査線に沿った前景ピ クセルの最大限の連続するセットであり、左端及び右端の背景ピクセルによって 境界を定められる、 プロセス。 27. 請求項26に記載のプロセスにおいて、 連続するピクセルの特別に長いスパンを除去した後に、更に、すぐ上又は下に 位置する隣接する前景ピクセルを有さない残りの前景ピクセルを除去するステッ プを含む、 プロセス。 28. 請求項20に記載のプロセスにおいて、 オブジェクトはイメージの前景スパンの区分の結果として得られたスパンの互 いに素な集合であると考えられ、各集合は過渡的に接続され、スパンは走査線に 沿った前景ピクセルの最大限の連続するセットであり、左端及び右端の背景ピク セルによって境界を定められる、 プロセス。 29. 請求項20に記載のプロセスにおいて、 オブジェクトの文字枠の位置及び寸法は、オブジェクトを構成するスパンを構 成するピクセルの最も左、最も右、最も上、及び最も下の座標として取られ、ス パンは走査線に沿った前景ピクセルの最大限の連続するセットであり、左端及び 右端の背景ピクセルによって境界を定められる、 プロセス。 30. 請求項20に記載のプロセスにおいて、 文字枠の最大及び最小寸法及び最大アスペクト比は、一般に用いられるローカ ルの言語のキャラクタの文字枠のものとほぼ等しくなるよう予め定められる、 プロセス。 31. 請求項20に記載のプロセスにおいて、 前記第1の方向における最も近い近隣オブジェクトへの距離は、任意の走査線 に沿ってのオブジェクトの任意のスパンのピクセルにおいての最も近接した接近 であると定められ且つこのオブジェクトには他の許容可能な長さのスパンが属し ていないものであり、 前記第2の方向における最も近い近隣オブジェクトへの 距離は、オブジェクトの文字枠の底の部分から直下の最初に遭遇する前景ピクセ ルのスパンまでの走査線においての垂直距離であり、スパンは走査線に沿った前 景ピクセルの最大限の連続するセットであり、左端及び右端の背景ピクセルによ って境界を定められる、 プロセス。 32. 請求項20に記載のプロセスにおいて、 許容可能なオブジェクトからの許容可能なスレッショルド距離は、そのオブジ ェクトの文字枠の寸法の関数である、 プロセス。 33. 請求項32に記載のプロセスにおいて、 最大の許容可能距離は、そのオブジェクトの文字枠の幅の予め定められた分数 部である、 プロセス。
───────────────────────────────────────────────────── 【要約の続き】 ョンする。検査するステップは、各走査線に対して、各 々が所定の値を有するイメージ・ピクセルのスパンのリ ストを形成するステップを含み、間隔的関係を判定する ステップは、リストの各スパンに対して、同一走査線上 の次のスパンへの距離を判定し、イメージ・オブジェク トの最後のスパンに対して、後続する走査線上の最初の 開いたスパンへの距離を判定する。各イメージ・オブジ ェクトは関連する文字枠及び文字枠の幅の関数である幅 を有するクリアの脚柱を有する。後続する走査線上の最 初のスパンへの距離は脚柱の高さを定める。

Claims (1)

  1. 【特許請求の範囲】 1. デジタル化されたページが第1の方向で見られることを意図されている か又は前記第1の向きに対して回転された第2の方向で見られることを意図され ているかを判定する方法において、 イメージ走査線の前記デジタル化されたページのイメージをイメージ走査線ベ ースで検査し、最大長スレッショルドよりも大きくない大きい方の寸法と最小幅 スレッショルドよりも少なくない小さい方の寸法とを有するグラフィック・オブ ジェクトの発生を検出する検査ステップと、 検出された発生のそれぞれに対して、他の隣接して配置されたグラフィック・ オブジェクトに対しての前記検出された発生の間隔的関係を決定する決定ステッ プと、 複数の決定された前記間隔的関係に従って、前記デジタル化されたページが前 記第1の方向と前記第2の方向のうちの1つを有することを宣言する宣言ステッ プと を備える方法。 2. 請求項1に記載の方法において、 前記第1の方向はポートレート方向であり、前記第2の方向はランドスケープ 方向である、 方法。 3. 請求項1に記載の方法において、 長さの範囲及び幅の範囲はそれぞれ、テキスト・キャラクタの長さ及び幅の予 期される範囲とほぼ等しく予め定められる、 方法。 4. 請求項1に記載の方法において、 前記検査ステップは、各走査線に対して、各々が所定の値を有する隣接するイ メージ・ピクセルのスパンのリストを形成する形成ステップを含む、 方法。 5. 請求項4に記載の方法において、 間隔的関係を決定する前記決定ステップは、1つのスパンと同一走査線上の後 続のスパンとの間の及び後続する走査線上の後続するスパンに対する間隔的分離 の量を決定する、 方法。 6. 請求項4に記載の方法において、 間隔的関係を決定する前記決定ステップは、前記リストの各スパンに対して、 同一走査線上の次のスパンへのピクセルでの距離と、イメージ・オブジェクトの 最後のスパンに対して、後続する走査線の最初のスパンへの走査線での距離とを 決定する、 方法。 7. 請求項6に記載の方法において、 各イメージ・オブジェクトは関連する文字枠を有し、後続の走査線上の最初の スパンへの距離は前記イメージ・オブジェクトの下の脚柱の高さを定め、前記脚 柱は前記文字枠の幅及び位置の関数である幅及び横の位置を有し、更に、第1カ ウンタ及び第2カウンタのうちの1つを、脚柱の高さに対する同一走査線上の次 のスパンに対するウインドウ幅の比率の関数として選択的に増分するステップを 含む、 方法。 8. 請求項7に記載の方法において、 前記宣言ステップは、前記第2カウンタの値に対する前記第1カウンタの値の 比率を決定するステップを含む、 方法。 9. 請求項1に記載の方法において、 前記宣言ステップは、前記検査ステップが前記イメージの全走査線を検査する 前に行われる、 方法。 10. 請求項6に記載の方法において、 前記決定ステップは、隣接して配置されたスパンを有するイメージ・オブジェ クトをマージするステップを含む、 方法。 11. 請求項5に記載の方法において、 前記検査ステップは、幅スレッショルドを越える走査線に沿った長さを有する スパンを検出し且つ除去するステップを含む、 方法。 12. 請求項5に記載の方法において、 前記形成ステップは、隣接する先行の走査線上又は隣接する後続の走査線上に 隣接するイメージ・ピクセルを有さないイメージ・ピクセルを検出し且つ除去す るステップを含む、 方法。 13. 請求項1に記載の方法において、 各イメージ走査線は単位長さあたりに第1の数のイメージ・ピクセルを有する ように生成され、かつ、要求された場合に、単位長さあたりに所定の数のイメー ジ・ピクセルを得るようにイメージ・ピクセルをマージする初期ステップを含む 、 方法。 14. 請求項1に記載の方法において、 前記寸法は直交的に配置された文字枠の個々の寸法である、 方法。 15. ページ・スキャナからデジタル化されたページを受信する入力ポート と、前記入力ポートに結合されたインターフェースとを備えるドキュメント処理 システムにおいて、前記インターフェースは、前記デジタル化されたページが第 1の方向で見られることを意図されているか又は前記第1の向きに対して回転さ れた第2の方向で見られることを意図されているかを決定する手段を備え、前記 決定する手段はイメージ走査線の前記デジタル化されたページのイメージをイメ ージ走査線ベースで検査して最大長スレッショルドよりも少ない大きい方の寸法 と最小幅スレッショルドよりも大きい小さい方の寸法とを有するグラフィック・ オブジェクトの発生を検出する検査手段を備え、検出された発生のそれぞれに応 答して、他の隣接して配置されたグラフィック・オブジェクトに対しての前記検 出された発生の間隔的関係を決定する手段と、複数の決定された前記間隔的関係 に従って、前記デジタル化されたページが前記第1の方向と前記第2の方向のう ちの1つを有することを宣言する手段とを備えるシステム。 16. 請求項15に記載のシステムにおいて、 前記第1の方向はポートレート方向であり、前記第2の方向はランドスケープ 方向である、 システム。 17. 請求項15に記載のシステムにおいて、 長さの範囲及び幅の範囲はそれぞれ、テキスト・キャラクタの長さ及び幅の予 期される範囲とほぼ等しく予め定められる、 システム。 18. 請求項15に記載のシステムにおいて、 間隔的関係を決定する前記決定する手段は、1つのスパンと同一走査線上の後 続のスパンとの間の、及び後続する走査線上の後続するスパンに対する間隔的分 離の量を決定する手段を含む、 システム。 19. 請求項15に記載のシステムにおいて、 前記検査する手段は、イメージ・オブジェクトの二重連係リストに前記の検出 された発生の指示を記憶する手段を含む、 システム。 20. テキストの準備されたイメージにおける推定されたテキストの方向を 自動的に決定するプロセスにおいて、 走査線ベースで走査線上のイメージにわたってパスを行うステップと、前記パ スを行う間に、 確証されたオブジェクトの第1のカウントを集計するステップであって、最も 近い近隣オブジェクトが第1の方向に相対的に配置され且つ該近隣オブジェクト が前記確証されたオブジェクトに許容可能に近接している該確証されたオブジェ クトの第1のカウントを集計するステップと、 確証されたオブジェクトの第2のカウントを集計するステップであって、最も 近い近隣オブジェクトが第2の方向に相対的に配置され且つ該近隣オブジェクト が前記確証されたオブジェクトに許容可能に近接している該確証されたオブジェ クトの第2のカウントを集計するステップと、 前記第1のカウント及び第2のカウントを基にする判断プロセスが推定された テキストの方向を決定したときにパスを終了するステップと、 前記イメージにおける推定されたテキストのラインが前記第1の方向に沿うか 又は前記第2の方向に沿うかを宣言するステップと を備え、 確証されたオブジェクトは文字枠を有するオブジェクトであり、該文字枠の短 い方の寸法は最小許容可能幅よりも少なくなく、長い方の寸法は最大許容可能長 さよりも長くなく、長さと幅のアスペクト比は最大許容可能アスペクト比よりも 大きくなく、前記第1の方向又は前記第2の方向の最も近い近隣オブジェクトへ の距離は許容可能スレッショルド距離内にある、 プロセス。 21. 請求項20に記載のプロセスにおいて、 前記第1の方向と前記第2の方向とは互いに直交する、 プロセス。 22. 請求項20に記載のプロセスにおいて、 前記第1の方向と前記第2の方向とは、それぞれ、右と下とである。 プロセス。 23. 請求項20に記載のプロセスにおいて、 固定の解像度及びフォーマットで縮小及び/又は標準化したイメージを形成す ることによってイメージを準備する初期ステップを含む、 プロセス。 24. 請求項23に記載のプロセスにおいて、 前記の標準化されたフォーマットは、イメージの上からイメージの下へオーダ ーになった走査線及び左から右へオーダーになった走査線バイトのうちの1つが 選択される、 プロセス。 25. 請求項24に記載のプロセスにおいて、 オーダーになった各走査線バイトのビットはイメージの最も左に最上位ビット (MSB)を有し、1のビットは前景ピクセルを表し、0のビットは背景ピクセ ルを表す、 プロセス。 26. 請求項23に記載のプロセスにおいて、 前記イメージを準備する前記初期ステップは連続する前景ピクセルの特別に長 いスパンを除去するステップを含み、ここにおけるスパンは走査線に沿った前景 ピクセルの最大限の連続するセットであり、左端及び右端の背景ピクセルによっ て境界を定められる、 プロセス。 27. 請求項26に記載のプロセスにおいて、 連続するピクセルの特別に長いスパンを除去した後に、更に、すぐ上又は下に 位置する隣接する前景ピクセルを有さない残りの前景ピクセルを除去するステッ プを含む、 プロセス。 28. 請求項20に記載のプロセスにおいて、 オブジェクトはイメージの前景スパンの区分の結果として得られたスパンの互 いに素な集合であると考えられ、各集合は過渡的に接続され、スパンは走査線に 沿った前景ピクセルの最大限の連続するセットであり、左端及び右端の背景ピク セルによって境界を定められる、 プロセス。 29. 請求項20に記載のプロセスにおいて、 オブジェクトの文字枠の位置及び寸法は、オブジェクトを構成するスパンを構 成するピクセルの最も左、最も右、最も上、及び最も下の座標として取られ、ス パンは走査線に沿った前景ピクセルの最大限の連続するセットであり、左端及び 右端の背景ピクセルによって境界を定められる、 プロセス。 30. 請求項20に記載のプロセスにおいて、 文字枠の最大及び最小寸法及び最大アスペクト比は、一般に用いられるローカ ルの言語のキャラクタの文字枠のものとほぼ等しくなるよう予め定められる、 プロセス。 31. 請求項20に記載のプロセスにおいて、 前記第1の方向における最も近い近隣オブジェクトへの距離は、任意の走査線 に沿ってのオブジェクトの任意のスパンのピクセルにおいての最も近接した接近 であると定められ且つこのオブジェクトには他の許容可能な長さのスパンが属し ていないものであり、 前記第2の方向における最も近い近隣オブジェクトへの 距離は、オブジェクトの文字枠の底の部分から直下の最初に遭遇する前景ピクセ ルのスパンまでの走査線においての垂直距離であり、スパンは走査線に沿った前 景ピクセルの最大限の連続するセットであり、左端及び右端の背景ピクセルによ って境界を定められる、 プロセス。 32. 請求項20に記載のプロセスにおいて、 許容可能なオブジェクトからの許容可能なスレッショルド距離は、そのオブジ ェクトの文字枠の寸法の関数である、 プロセス。 33. 請求項32に記載のプロセスにおいて、 最大の許容可能距離は、そのオブジェクトの文字枠の幅の予め定められた分数 部である、 プロセス。
JP8503103A 1994-06-29 1995-01-11 2進イメージにおけるランドスケープ・スキャンの自動決定 Pending JPH10507014A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US26821694A 1994-06-29 1994-06-29
US08/268,216 1994-06-29
PCT/US1995/000407 WO1996000952A1 (en) 1994-06-29 1995-01-11 Automatic determination of landscape scan in binary images

Publications (1)

Publication Number Publication Date
JPH10507014A true JPH10507014A (ja) 1998-07-07

Family

ID=23021978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8503103A Pending JPH10507014A (ja) 1994-06-29 1995-01-11 2進イメージにおけるランドスケープ・スキャンの自動決定

Country Status (6)

Country Link
EP (1) EP0767941B1 (ja)
JP (1) JPH10507014A (ja)
AU (1) AU688456B2 (ja)
CA (1) CA2186611A1 (ja)
DE (1) DE69505386T2 (ja)
WO (1) WO1996000952A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5973734A (en) 1997-07-09 1999-10-26 Flashpoint Technology, Inc. Method and apparatus for correcting aspect ratio in a camera graphical user interface
US6317141B1 (en) 1998-12-31 2001-11-13 Flashpoint Technology, Inc. Method and apparatus for editing heterogeneous media objects in a digital imaging device
US9224145B1 (en) 2006-08-30 2015-12-29 Qurio Holdings, Inc. Venue based digital rights using capture device with digital watermarking capability

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235651A (en) * 1991-08-06 1993-08-10 Caere Corporation Rotation of images for optical character recognition

Also Published As

Publication number Publication date
DE69505386T2 (de) 1999-06-10
DE69505386D1 (de) 1998-11-19
AU688456B2 (en) 1998-03-12
AU1564595A (en) 1996-01-25
EP0767941A1 (en) 1997-04-16
CA2186611A1 (en) 1996-01-11
EP0767941B1 (en) 1998-10-14
WO1996000952A1 (en) 1996-01-11

Similar Documents

Publication Publication Date Title
US5784487A (en) System for document layout analysis
US6377704B1 (en) Method for inset detection in document layout analysis
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US5854854A (en) Skew detection and correction of a document image representation
US5465304A (en) Segmentation of text, picture and lines of a document image
US5854853A (en) Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US6173073B1 (en) System for analyzing table images
US5033104A (en) Method for detecting character strings
US6771842B1 (en) Document image skew detection method
JP3285686B2 (ja) 領域分割方法
JPH10507014A (ja) 2進イメージにおけるランドスケープ・スキャンの自動決定
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP3187895B2 (ja) 文字領域抽出方法
JPS6325391B2 (ja)
JPH0916713A (ja) 画像領域分割方法
JP3190794B2 (ja) 文字切り出し装置
JP3024234B2 (ja) 文書画像の罫線抽出装置
JPH0573718A (ja) 領域属性識別方式
JPH0728934A (ja) 文書画像処理装置
JPH06259597A (ja) ドキュメントイメージ処理方法並びに文字認識システムおよびドキュメントイメージ処理装置
JP2001155113A (ja) 文字認識装置及び文字枠線の検出方法
JPH04316178A (ja) 文書画像の属性判別方法
JPH0573714A (ja) 文字認識装置
JPH0324681A (ja) 画像処理方法及び装置