JPH10508127A - テキストのビットマップ・イメージからテキストの部分を自動的に指定する方法及び装置 - Google Patents

テキストのビットマップ・イメージからテキストの部分を自動的に指定する方法及び装置

Info

Publication number
JPH10508127A
JPH10508127A JP8507295A JP50729596A JPH10508127A JP H10508127 A JPH10508127 A JP H10508127A JP 8507295 A JP8507295 A JP 8507295A JP 50729596 A JP50729596 A JP 50729596A JP H10508127 A JPH10508127 A JP H10508127A
Authority
JP
Japan
Prior art keywords
text
image
bitmap data
line
slope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8507295A
Other languages
English (en)
Inventor
ノウルトン,ケネス・シー
Original Assignee
コダック・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コダック・リミテッド filed Critical コダック・リミテッド
Publication of JPH10508127A publication Critical patent/JPH10508127A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 ドキュメント処理システム(10)は、ユーザ・インターフェース(22、24、25)と、テキストを含むドキュメント(14)を表すビットマップ・データ(18a)を記憶するメモリ(18)とを含む。ユーザ・インターフェースは、ビットマップ・データのイメージを視覚化するディスプレイ(22、22a)と、記憶されたビットマップ・データ内の位置に対応する表示されたイメージ内の位置を指定するマウス(25)のような入力装置とを含む。ドキュメント処理システムは、テキストを含むイメージの範囲の開始を指定する第1の指定された位置に応答し且つテキストを含むイメージの範囲の終了を指定する第2の指定された位置に応答して該範囲に対応するビットマップ・データを処理するビットマップ・データ・プロセッサを更に含む。ビットマップ・データ・プロセッサは、該範囲内のテキストのラインの横のエクステントを決定し、該範囲内のテキストのラインの傾斜がある場合にはその傾斜の量を決定し、該範囲内のテキストのラインの中心から中心の間隔を決定し、テキストの上部ラインの位置を決定するようにオペレーションする。即ち、ビットマップ・データ・プロセッサは、最初に指定された範囲に対応するビットマップ・データ内に現れるすべてのテキストの幾何学的仕様を提供するように、入力装置によって指定された範囲の境界をリファインするようにオペレーションする。ビットマップ・データ・プロセッサは、好適には、ビットマップ・データにオペレーションを行う前に該ビットマップ・データを横に圧縮する。

Description

【発明の詳細な説明】 テキストのビットマップ・イメージからテキストの部分を自動的に指定する方法 及び装置 発明の分野 本発明は一般にドキュメント処理システムに関連し、特に、ドキュメントのペ ージ上に現れる情報を表すデータを入力するための光学スキャナを含むドキュメ ント処理システムに関連する。 発明の背景 ドキュメントの1ページ又はそれ以上のページをドキュメント処理システムに 入力するための周知の技術は、ページの表面に発生する光学的濃度の差を検知す る光学スキャナのようなドキュメント・イメージ化システムを用いる。光学濃度 の差は、例えばインチ当たり200ドット(dpi)の所定の又は選択された解 像度で二進情報(ピクセル)に変換され、走査線フォーマットで出力される。ド キュメント・イメージ・データはシステムのユーザに表示され得る。イメージ・ データは続いて圧縮され得、また、イメージ・データは走査されたイメージの情 報内容を識別するために更に処理され得る。光学的文字認識(OCR)はイメー ジ・ピクセルのグループを英数文字に対応するコードに変換するのに用いられる 1つの周知の処理技術である。 ドキュメント・イメージ化システムのユーザは、テキストのスキャン(走査) された二進ビットマップ・イメージからテキストの部分を選択することが望まし いことをしばしば発見する。次に、選択された部分は、例えば、OCR、デ−ス キューイング(de-skewing)、カット・アンド・ペースト、編集(redaction) を行うために処理される。ユーザから見た最も便利なインタラクションは、所望 される処理オペレーションを識別し、次に、例えば、キーボードの矢印キー、マ ウス、又はトラックボールで、ビットマップ・イメージの表示における選択され たテキスト部分の開始点及び終了点を単に指すことである。 また、ユーザの入力に応答して、ユーザのビットマップの意図された部分の概 算的幾何学的仕様を純化する(リファインする、refine)ことが望ましく、従っ て、意図された部分の左側及び右側のエクステント(延長部)、及びビットマッ プ・イメージの傾斜(水平からの偏差)に加えて、意図された部分内のテキスト のラインの期間及び位相を決定するプログラムを呼び出すことが望ましい。即ち 、プログラムのタスクは、インタラクティブに受け入れ可能な時間期間内で、こ れら5つのパラメータの可能な値の組み合わせを通じて5次元のサーチを行い、 ビットマップ・イメージの選択された部分の純化された幾何学的仕様を生じるこ とであろう。純化された幾何学的仕様は、次に、カット・アンド・ペースト・ル ーチンのような別のルーチンに渡され、それが、所望されるオペレーションを行 うためにビットマップ・イメージにおけるテキストの所望の部分を正確に位置付 けする。 これまで、インタラクティブに受け入れ可能な速度でこのような5次元のサー チを行うための自動化されたオペレーションのシーケンスを実行することができ 、且つ純化された幾何学的仕様を出力するドキュメント処理システムは存在しな かった。 本発明の目的 従って、本発明の目的はビットマップ・テキスト・イメージの指定された部分 の概算的幾何学的仕様を純化するための自動化されたオペレーション・シーケン スを行う方法を提供することである。 本発明の別の目的は、ユーザ・インターフェースと、大きいビットマップ・テ キスト・イメージ内のビットマップ・テキスト・イメージの一部分のユーザが指 示した幾何学的仕様を純化するための自動化されたオペレーション・シーケンス を行うことが可能な1つ又はそれ以上のプロセッサであって、ユーザがビットマ ップ・テキスト・イメージのその部分の開始及び終了を示すことに応答してオペ レーションを行うプロセッサとを含むドキュメント処理システムを提供すること である。 本発明の概要 本発明の教示に従ったドキュメント処理システムによって及び該ドキュメント 処理システムをオペレーションする方法によって、上述の及び他の問題は解決さ れ且つ本発明の目的は実現される。 ドキュメント処理システムはユーザ・インターフェースと、テキストを含むド キュメントを表すビットマップ・データを記憶するメモリとを含む。ユーザ・イ ンターフェースはビットマップ・データのイメージを視覚化するディスプレイと 、記憶されたビットマップ・データ内の位置に対応する表示されたイメージ内の 位置を指定するマウスのような入力デバイスとを含む。 本発明に従うと、ドキュメント処理システムは、テキストを含むイメージの範 囲の開始を指定する第1の指定された位置とテキストを含むイメージの該範囲の 終了を指定する第2の指定された位置に応答し、その範囲に対応するビットマッ プ・データを処理するためのビットマップ・データ・プロセッサを更に含む。ビ ットマップ・プロセッサは、その範囲内のテキストのラインの横のエクステント を判定するため、その範囲内のテキストのラインの傾斜が有る場合にはその量を 判定するため、その範囲内のテキストのラインの周期性を判定するため、及びそ のテキストの最上部ラインの位置を判定するためにオペレーションする。即ち、 ビットマップ・プロセッサは、元に指定された範囲に対応するビットマップ・デ ータ内に現れるすべてのテキストの幾何学的仕様を提供するために、入力デバイ スによって指定された範囲の境界をリファインするようにオペレーションする。 リファインされた幾何学的仕様は次に、例えば、テキスト・イメージのOCRや カット・アンド・ペーストや編集を行うユーティリティに渡され得る。 ビットマップ・プロセッサは好適には、横のエクステント、傾斜、周期性、及 びテキストの最上部ラインの位置を判定する前にビットマップ・データを最初に 横に圧縮するようにオペレーションする。 図面の簡単な説明 本発明の上述及び他の特徴は、後述の本発明の詳細な説明を添付の図面を参照 して読むことにより、より明瞭になる。 図1は本発明の実現に用いるのに好適であるドキュメント・イメージ化システ ムと結合されるドキュメント処理システムのブロック図である。 図2A−2Cは本発明の方法及び装置のオペレーションの説明に好適な例示的 な二進ビットマップ・イメージを示す(図2Cは図2Aのイメージの横に圧縮さ れたバージョンである)。 図3A−3Cは図2A−2Cに示された二進ビットマップ・イメージに対応す るヒストグラムであり、図3A及び3Bのヒストグラムは、本発明の方法の特徴 である傾斜判定手順の間に用いられ、図3Cのヒストグラムは周期(期間)及び 位相判定手順の間に用いられる。 図4は本発明によって用いられる多種のドキュメント・イメージ規定を示す図 である。 図5は空白バイトを表す長方形の例示的配置を示し、この図はビットマップ・ イメージの横のエクステントの判定の間に長方形の左又は右のエッジを固定する 方法を説明するのに好適である。 図6は所定のパターン・テンプレートを表すバイト・サンプルの例示的配置を 示し、この図は傾斜判定の方法を説明するのに好適である。 図7は編集オペレーションの一部を示すのに好適な図である。 図8はビットマップ・イメージの選択された部分の位相及び周期の判定の方法 の説明に用いられる図である。 図9は本発明の方法によって実行されるステップを示す論理フローチャートで ある。 本発明の詳細な説明 図1は本発明に従って構成され且つオペレーションされるドキュメント処理シ ステム10を示す。走査されるドキュメント・ページ14の表面に現れる印刷さ れたテキスト及びグラフィック・イメージからの光学的コントラストを検出する ために従来のドキュメント・スキャナ12が用いられる。或るタイプのスキャナ では、スキャナ12とページ14との間の相対的運動によって、スキャナ12が 信号ライン(単数又は複数)12a上に、該スキャナによって検知された光学的 コントラストを示す一連の二進1及び0のシーケンスを出力するようにされる。 CCDカメラのような他のタイプのスキャナでは、ページとスキャナの間の相対 的運動は必要ない。 例えば、二進1はページ14の暗い範囲(キャラクタ又はグラフィック・イメ ージの一部)の存在を示し、二進0は暗い範囲のないこと(背景又は「白スペー ス」)を示す。ここで用いられるように、二進1及び0はそれぞれピクセルと呼 ばれる。二進情報は走査線フォーマット(scanline format)で出力され、走査 線は走査方向(矢印Aで示す)に直角に向いている。従って、1つの走査線は典 型的にキャラクタの部分からのピクセルを含む。例えば、且つスキャナ12の解 像度が200dpiであり且つページ14が8.5インチ(約21.6センチ) 幅であると仮定すると、走査線は1700までの個別のピクセル(8.5×20 0)を含み得る。典型的なスキャナの解像度は、(走査線に沿って)インチ当た り100ドット(又はピクセル)から400dpiの範囲にある。 信号ライン(単数又は複数)12aには、従って、スキャナ12の出力には、 スキャナ・インターフェース16が結合される。スキャナ・インターフェース1 6の出力はバス16aを経由でドキュメント記憶モジュール18に結合される。 記憶モジュール18は、半導体メモリ、磁気又は光学ディスク・メモリ、磁気又 は光学テープ、又はデジタル化されたドキュメント・ページのデータを記憶する のに適当な任意の形態のものの内部に実現され得る。示されるように、記憶モジ ュール18はビットマップ・ページ・データ・ブロック18aとして表される3 つの記憶されたドキュメント・ページ・イメージを有する。 ドキュメント記憶18のアクセスとページの表示はドキュメント・プロセッサ 20によって制御される。このプロセッサはバス20aを経由でドキュメント記 憶モジュール18と双方向に結合され、且つCRTディスプレイ22、キーボー ド24、及びマウス25のようなオプションのポインティング・デバイスのよう な従来のユーザ・インターフェース・デバイスに結合される。CRTディスプレ イ22は、スキャナ12によって出力されるピクセルの2次元アレイ(ビットマ ップ・ドキュメント・ページ・イメージ)の表示を可能にするグラフィック能力 を有する表示スクリーン22aを有する。ドキュメント・プロセッサ20はワー ド処理及び編集能力を有し得るが、ドキュメント・アーカイブ・アプリケーショ ンに対してこれらの能力は要求されるものでも望まれるものでもない。 コンポーネント16−24はすべて、パーソナル・コンピュータのような1つ のデータ・プロセッサ26内に含まれ得ることを認識すべきである。この場合、 スキャナ・インターフェース16は、従来の様式でデータ・プロセッサ26のパ ラレル又はシリアル・ポートに結合され得るスキャナ12の出力を処理するため に呼び出されるソフトウエア・モジュールであり得る。また、この場合には、バ ス16a及び20aは同じシステム・バスであり得、それによってスキャナ・イ ンターフェース・ソフトウエア及びドキュメント・プロセッサ・ソフトウエアが 、データ・プロセッサ26のメイン・メモリ及び大容量記憶コンポーネントにイ ンターフェースされる。本発明の別の実施例において、スキャナ12はデータ・ プロセッサ26の一体のコンポーネントに作られ得る。 従って、図1のドキュメント処理システム10の実施例は、本発明の1つの例 示的実施として見られることを意図されおり、本発明の実施の際の制限として見 られることを意図していないことが理解されるべきである。 ここで図2A−2Cを参照する。ドキュメント・ページのスキャンされた二進 ビットマップ・イメージは、典型的に、ビットマップ・イメージ内に含まれるテ キストについての論理的又は幾何学的な情報なしに発生する。一般に、もし編集 (redaction)のような正確なオペレーションが二進ビットマップ・イメージに 行われるならばテキスト・ラインの傾斜(多分水平であると意図される)さえも 仮定されていないであろう。 図2A及び2Bに示されるように、本発明は図2Aの例示的二進ビットマップ ・イメージ30の開始点s及び終了点tを指し且つクリックする(マウス25を 使用すると仮定)ための機構をユーザに提供する。二進ビットマップ・イメージ 30の部分のこの初期的な幾何学的仕様に応答し、ドキュメント・プロセッサ2 0はビットマップ・イメージを検査し、図2Bの幾何学的「回答」g、即ち、s とtの間にあるテキスト・イメージを完全に且つそれのみを覆う平行四辺形のセ ットを輪郭描写(delineate)する。このように、初期的な幾何学的仕様は洗練 (純化)され、ビットマップ・イメージの指定された部分にオペレーションを行 うことができる1以上のプログラム又はユーティリティに使用可能にされる。 ドキュメント・プロセッサ20によって実行されねばならないタスクの1つの 定義は、以下の5つのパラメータに対する値の最良のセットを生じるサーチの定 義である。 1)テキスト・イメージの左方向のエクステント(extent)(アイル又はペー ジ・マージンへの。図2AにおいてアイルはAlと示す。) 2)テキスト・イメージの右方向のエクステント(アイル又はページ・マージ ンへの) 3)テキスト・イメージの傾斜(即ち、示されたエクステントを横切っての水 平からのピクセルにおける偏差) 4)テキスト・イメージの周期(period)(即ち、テキストラインの中央から 中央の間隔(center-to-center spacing)) 5)テキスト・イメージの位相(phase)(即ち、最上部テキストラインの最 上部の位置) これら5つの値の組み合わせのすべてを完全にテストするのは計算的に高価で あり且つ時間を消費する。その代わりに、本発明の方法は、周期及び位相が同時 に判定されるのを除いて、本質的にリストされたオーダーでこれら5つのパラメ ータに対する値を確立する。 最初に、5つのパラメータに対して多種の精度が要求されることに留意された い。パラメータ1及び2に関しては、テキスト・イメージの左及び右のエクステ ントが空白スペース(ページ・マージン又はカラム間のアイルの何れか)によっ て規定されるのでピクセル精度は必要ではなく、実際には、最も近いバイト(8 ピクセル)に対しての値で十分である。パラメータ3及び5に関しては、後続の オペレーションは典型的に完全なピクセルを用いて最も微細な解像度でオペレー ションを行うので、傾斜及び位相は最も近いピクセル全体に対してのみ指定され る必要がある。パラメータ4に関しては、ラインからラインの周期は、テキスト の後続するラインが輪郭描写されるにつれてまるめによるエラーが積み重ならな いように、好適にはより正確に判定される。従って、本発明の方法はラインから ラインの周期の最良の概算を生成し、結果はピクセルの第10(tenths of pixe ls)で表される。 これらの多種の解像度は本発明の現在好適な実施例に対しての到着したものを 反映するものであり、本発明の実現を制限するために構成したものではないこと を認識されたい。 図2A−2Bのテキスト・ビットマップ・イメージの多種の部分を参照して、 以下の判定、即ち、横のエクステント、傾斜、及び周期/位相が詳細に説明され る。これらの判定はページ・イメージの下に横たわるビットマップを基にする。 このビットマップは図1のスクリーン122a上でユーザに表示されるビットマ ップと同じ解像度を有する必要はない。しかしながら、水平からの傾斜は典型的 に小さいので、且つ横のエクステントは高い精度(1バイト又は8ピクセル内に 対して)で判定される必要がないので、バイトあたりビット(ビット・パー・バ イト、bit-per-byte)のマップが十分であることが発見されている。図2Aのビ ットマップ・イメージの8倍(8:1)横に圧縮されたバージョンが図2Cに示 されている。図2Cは拡大して示されており、垂直寸法及び、従って、ピクセル のラインの数は図2Aのものと等しいことが認識される。図2Cの横に圧縮され たイメージ32において、表示された各ピクセルは、例えば、2つ又はそれ以上 の前景ピクセルを含む元のビットマップ・イメージのバイト(即ち、少なくとも 2つの論理1ビットを含むバイト)を表す。このようなビット・パー・バイトの 横に圧縮されたイメージを用いてオペレーションを行うことは、大きな高解像度 のイメージに対しての法外な高速記憶の要求を大きく減少させることが発見され ている。 図4を参照すると、本発明の方法のオペレーションが以下のように説明され得 る。 ユーザが供給した座標(x開始,y開始)及び(x終了,y終了)を与え る (上部左x,上部左y)、(上部右x,上部右y)及び第10ピクセルを 判定する オプションで、本方法は元のイメージ内の輪郭描写した範囲を1から7の符号 付されたもののような長方形(互換的には平行四辺形)へ分解することを提供す る。図4に示した実施例において、「傾斜(スロープ、slope)」はテキストの エクステントを横切って−2ピクセルである。即ち、(上部右x、上部右y)と 示された点は(上部左x、上部左y)と示された点よりも2ピクセル又は2走査 線「低い」。傾斜が正である場合には、その逆になり、即ち、(上部右のx、上 部右のy)と示された点は(上部左x、上部左y)と示された点よりも2ピクセ ル又は2走査線「高い」。零の傾斜に対しては、(上部右x、上部右y)と示さ れた点と(上部左x、上部左y)と示された点は同一の走査線上にある。 より大きな正又は負の傾斜に対して、対応してより多くの結果的な長方形があ る。1ピクセルのステップで僅かに傾斜するラインは周知のブレゼンハム・ライ ン(Bresenham line)、即ち、所与の終了点間の直線を概算(近似)するための 二進ビットマップ上の最良のライン、と等価である。 本発明の方法の多種のステップの詳細な説明を図9のフローチャートと関連し てここで示す。 ブロックAで、ユーザが表示されたビットマップ・イメージにおける開始点及 び終了点(図2Aにおいてs及びtで示される点)を指定することに応答して本 方法が呼び出される。これが、スクリーン22aでユーザに表示されているビッ トマップ・イメージ内の対象となる範囲の初期の概算的幾何学的仕様である。 ブロックBで、圧縮されたイメージ(図2C)が作成される。インタラクティ ブ・セッションの開始で(又はそれより前に)、圧縮されたイメージは一度作成 されるのみでよく、そして、それは高速メモリに適合し得る限り、それはテキス ト仕様に対するすべての後の要求に対して働く。そうでない場合には、圧縮され たイメージは、もしその或る必要な部分が既に高速メモリにないならば又はない ときに必要なだけまでのみ更新される。この場合、圧縮されていないイメージの 更に必要とされる部分を読み取ることによって所望される部分が再び計算される か、又は既に圧縮されたイメージの適当な部分が読み出される(たぶんハード・ ディスクから)かの何れかである。一般に使用されるコンピュータは、伝統的な 200又は300dpiの解像度で二進走査(binary-scan)された8.5”× 11”(約21.6cm×27.9cm)のページの完全な8×の圧縮されたイ メージを保持するための十分な高速のメモリ(RAM)を有する。ブロックCは この圧縮イメージ更新プロシージャを示シ、これは本方法の実行の或る場合に対 して要求されることもされないこともある。 ブロックDで、ユーザが指定した点s及びtが圧縮されたビットマップ・イメ ージ内にあることを確実にするための判定が行われる。 ブロックEで、ビットマップ・イメージ内のテキストの示された範囲の左−右 (横)のエクステントの判定が行われる。この点に関して、ユーザの示した点s 及びt(図2A)は対象となる領域の垂直エクステントを概算的に示すのみであ り、即ち、何れかが高すぎ又は低すぎでありそれが近接するテキスト・ラインに 現れるのときのみその結果は完全に誤りである。 ブロックEの実行の間に、規定された点s及びt及び上及び下の所定数のイメ ージ・ラインを含むように最初の長方形rが規定される。この長方形は「空白バ イト」の十分に広い垂直の区画(スワス、swath)がその右及び左のエッジに発 見されるまで水平に延ばされ、空白バイトは、2つよりも少ない前景ピクセルを 有する元のバイトを表す圧縮されたピクセル・パー・バイトのマップにおける零 ビットである。 もしテキスト・イメージが過度に傾斜すると、テキストのカラム間のアイルも 傾く。従って、表現「十分に広い空白区画」は、それぞれが3つの連続する空白 バイトの水平ストリングの一部であるクリアの空白バイトの1カラムとして規定 される。この定義は特に200dpiのイメージに適用される。他の解像度に対 しては、それに従ってこれらの値がスケール化される。 200dpiの場合に対して、図5に示す3つの空白バイト34の繰り返しパ ターンは初期の長方形の左又は右のエッジを定めるのに十分である。 ユーザが指定したテキストの範囲の横のエクステントがこのように決定される と、本方法は傾斜を判定するためのブロックFに続く。この点に関して、及びテ キストの傾斜が事前に知られていた場合には、同じ傾斜でサンプリング・ライン に沿って間隔をとられたイメージのサンプルは、サンプリング・ラインがテキス トのラインを通じて通過しているか又はテキストの2つの近接するライン間のス ペースを通じて通過しているかに依存して、空白であるか又は大きく占有されて いるかの傾向があることが予期される。また、もし2つの平行なサンプリング・ ラインが固定距離離れた圧縮されたテキスト・イメージをサンプリングするため に用いられるならば、及びもしこの2つの平行なサンプリング・ラインがテキス トの実際の傾向に向いているならば、頻繁に、一方のサンプリング・ラインはサ ンプル空白ピクセルとして発見され、他方はサンプルが占有したピクセルとして 発見されることが予期されるべきである。 上述の仮定を基にして、ブロックFは、すべての傾斜に対して、初期の長方形 38内で特定のパターンが発見された回数からカウント又はタリーを作成する技 術に従ってオペレーションする。これらのパターン又はテンプレートは図6に示 されており、a、b、c、dと示されたサンプル36は或る傾斜のラインに沿っ ての初期長方形38の幅の4分の1の水平に間隔をとられたものであり、e、f 、g、hと示されたサンプル36はa、b、c、dのそれぞれの下の固定数(例 えば、8)のピクセルである。サンプル36のパターンは繰り返して配置され、 パターンの中心40は長方形38の中心に配置されたクオータ(quarter)38 aにおけるすべての位置で連続的に位置される。各傾斜に対して、これがテキス トの実際の傾斜であることを提案する以下の規準を満足するサンプルの各セット に対してタリーが増分される。 規準: a、b、c、dがすべて空白であり、e、f、gの2つ又は3つが占有さ れている、又は e、f、g、hがすべて空白であり、a、b、cの2つ又は3つが占有さ れている 上記で表したように、圧縮化イメージのサンプリングによって受け入れ不可能 な多くの入れ子にされた繰り返しが発生する。従って、最初に傾斜のサンプリン グを行い、そのサンプルから真のテキストの傾斜を判断(概算)することによっ て、ブロックFを実行するのが好適である。概算の位置において、より完全且つ 慎重なサーチが、図9のブロックFに示された本方法のステップの以下のサブス テップに従って行われる。 サブステップA:第20の可能な傾斜値ごとに、及び前述の規準において含ま れるサンプリング位置の2分の1に対して、本サブステップは、選択された傾斜 値の概算であるテキストの傾斜の見込みを示すヒストグラムを生成する。図3A は図2Aの例示的ケースに対するそのヒストグラムを示す。 サブステップB:ヒストグラムの結果的タリーから、本方法は最大値を有する タリーとそれの2つの隣接するものとを選択し、これらの点を通る平滑な曲線の 最大の位置の概算が行われる。これを行う1つの比較的簡単な方法は、3つのう ちの最小のものを越える2つの高いタリーのそれらの部分の重心を用いることで ある。もし2つの隣接するものが等しい場合にはこの技術は中心値を与え、等し い近接する最大がある場合には中ほどの値を与える、などなどである。図3Aに おいて、Aと示された垂直のバーは最大値のタリーであり、B及びCと示された バーは2つの最も近接するバーである。推定される平滑な曲線の最大を概算する ために、A及びCのBのレベルより下の部分が無視され、A及びCの残りの部分 (影を付けて示される)の重心が計算され、この例において概算された傾斜の− 33を生じる。 サブステップC:概算された傾斜に基づいて、イメージの関与する範囲が僅か に調節される。即ち、図2Aに示した平行四辺形pによってその範囲がより良く 概算される。以前の長方形の中心に中心が置かれるのではなく、平行四辺形pは その上部及び下部が、点s及びtを指定する元のx−yイメージ座標から等しい 距離となるように配置される。即ち、平行四辺形pの垂直位置を規定するときに 、概算された傾斜に従って、規定する点s及びtの水平位置に対して補償が行わ れる。 図2aの例において、概算された傾斜は約−33であり、負であることが発見 され、規定する点s及びtは両方とも中心の左である。従って、平行四辺形pは 以前の初期長方形38よりも僅かに下に中心が置かれる。 サブステップD:図3Aの概算された傾斜の近辺において、最適の傾斜に対し てのより完全且つ正確なサーチがここで行われ、概算された傾斜から開始して上 方(より正の傾斜の方へ)及び下方(より負の傾斜の方へ)の両方に進み、そし て、より高いタリーを有する検査された範囲のその終わりに近接する測定されて いない傾斜を常に次に選択する。ここで図3Bを参照すると、各測定において、 間隔的反復は1つおきの位置ではなくすべての位置を用いる。タリーされた傾斜 の範囲は、(a)少なくとも特定の数、例えば13、の値が測定されるまで、及 び(b)検査される範囲の各終わりのタリーが最初に検査された傾斜に対する値 より低いときまで増加する。そのようなタリーのヒストグラムが図3Bに示され ている。テキスト・イメージの最終的な決定された傾斜(即ち、テキストの水平 スパンを横切るピクセルの上昇)は、すべてのタリー値が値のセットの最小値に よって減少された後のこの値のセットの重心として取られる。この最終的なリフ ァインされた傾斜値が図3BにおいてFSとして示されている。 ユーザの指定したテキスト・イメージ範囲の傾斜がこのようにして決定される と、本方法は図9のブロックG及びHへ進み、それぞれ、周期及び位相を判定す る。本発明の現在好適な実施例において、ブロックG及びHは二重にネストされ た反復として並列に実行される。従って、これら2つのブロックはまた図9にお いて単一ブロックG−Hとして示される。 これらのステップはブロックFで決定された傾斜の使用を要求する。テキスト ・イメージの期間(周期)がテキスト・ラインの中心から中心の間隔として規定 され、且つテキスト・イメージの位相が平行四辺形pの上部から上部テキスト・ ラインの上部の距離として規定されたことを思い出すのが好適である。 決定された傾斜の特性は類推によって最適に説明される直感的な意味を有する 。もし1つのものがテキストを左から右へ見たイメージの面に配置されるとする と、且つ背景が透明で半透明であると仮定すると、決定された傾斜は、テキスト のラインを通じての長さ方向に見ることを試みた場合に見られ得る影のパッチ( shadowed patch)からのテキストのラインの間に見られる光を区別するであろう 最適の見る角度(ビューイング・アングル、viewing angle)に対応するであろ う。 この類推を留意し、ここで図2Aの長方形rが今決定されたテキストの傾斜を より正確に反映する平行四辺形pとして再調節されると、ブロックG−Hは毎レ ベルでの平行四辺形pの範囲を検査するようにオペレーションする。各レベルに 対して、本方法は、現在レベルによって及び決定された傾斜によって規定された ブレゼンハム・ラインの非空白バイトの数を表にする。即ち、決定さたれ傾斜で 非空白バイト集団(ポピュレーション、population)のプロジェクション(proj ection)の決定が行われる。その結果は図3Cに示されるような別のヒストグラ ムであり、前景ピクセルが住み着いた5つの範囲を明確に示す。これらの5つの 住み着かれた範囲は、図2Aの平行四辺形p内で発生するテキストの上から下へ の5つのライン(TL1−TL5)を示す。残っているのは、これら5つのテキ スト・ラインの長方形の配置を幾何学的に規定することである。 テキスト・ラインの周期及び位相は図3Cのヒストグラムに適合する最適の方 形波(図8を参照せよ)から取られる。適合する最適の方形波を達成するために 、図3Cのヒストグラムのすべての値が最大値の8分の1、しかし0よりも少な くない、によって好適には減少される。次に、「オン」値(オンスパン)の平均 と「オフ」値(オフスパン)の平均との差を最大化する方形波の周期及びデュー ティ・サイクル(パーセンテージ「オン」)が選択される。最後に、1つのテキ スト・ラインの範囲と次のものとの間の正確な分割ライン(DV)が、サイクル の「オフスパン」部分の丁度中央で取られる。 最適の周期(即ち、テキスト・ラインあたりの垂直に近接するピクセルの数) の決定は一般には不十分である。なぜなら、まるめのみによって、周期の値は2 分の1ピクセルまでのエラーとなり得る。このテキストのラインあたり2分の1 ピクセル・エラーは、もしテキストの多数のラインがこのように輪郭描写される ならば、累積する傾向がある。従って、最適の周期の近隣の2つの近接する値を 用いることによって及び傾斜の中間の最適の値が3つの測定値から決定されたの と同じ様式で概算中間値を決定するように補間することによって、より正確な結 果が得られる。結果的な周期の値はテキスト・ラインあたりピクセルの10分の 1(tenths of pixels)で表される解像度で報告される。 このようにして周期及び相(phase)が決定されると、本方法は図9のブロッ クIに進み、圧縮されたビットマップ・イメージの決定されたテキスト部分を満 たすか又は輪郭描写する。決定された値(左側エクステント、右側エクステント 、傾斜、周期、及び位相)は、ユーザの元のx−yピクセル座標系に対して参照 される。次に、これらの値は、テキスト・イメージにオペレーションを行うよう に意図された別のルーチン又はユーティリティに対して使用可能となる。例えば 、OCRルーチンは、図2Bの範囲g内のピクセル値に対応するキャラクタ・コ ードを識別するためにオペレーションを行う。OCRルーチンは元の(圧縮され ていない)ビットマップ・イメージにオペレーションを行う。 別のユーティリティ、編集(redaction)、のオペレーションの例をここに示 す。 編集ユーティリティは、テキスト・イメージの指定された部分を空白にするか 又は視覚的に見えなくするために用いられる。例えば、図2Bの輪郭描写された 範囲gは、少なくともイメージのエクスポートされたバージョンにおいて、白ラ インで分離されていようといまいと編集されたテキストのラインとともに、消失 した形で現れる。別のユーティリティは、編集された範囲が、例えば、反転映像 で示される「リード・スルー(read through)」表示を提供する。「リード・ス ルー」表示ユーティリティの使用は、特定のユーザのみが編集された範囲のテキ ストを見ることを可能とするように制御される。 図7を参照すると、もし呼び出すプログラムが編集されるべき範囲を含む長方 形(67のそのような長方形が図2Bの範囲gに含まれ、傾斜するラインにおけ る多数の1ピクセル・ステップに対応する)の列挙を要求したならば、後述の多 種の手続きが長方形毎に適用され得る。図7において、Aは範囲が白又は黒に塗 られ得ることを示し(1ピクセルの高さ)、Bは範囲が黒に塗られ得ること又は 反転映像で表示され得ることを示し、Cは範囲が白又は黒に塗られ得ることを示 す(1ピクセルの高さ)。 その代わりに、もし呼び出すプログラムがそれ自身の幾何学的計算を行うなら ば、もちろん、元の規定の点の横の位置に従って、図2Bに示されたように左の 上部の平行四辺形と右の下部の平行四辺形とを切り捨てねばならない。 本発明の方法は、特定の環境又はアプリケーションの要求に適合させるために 幾つかの変更が可能である。例えば、且つ上述のように、200dpi以外の解 像度に対して、幾何学的な距離を表す多種の定数が適切に再スケールされる。再 スケール化は、テキスト・サイズの変化が予測される状況に対してもなされる。 また、例えば、グレイスケール・イメージに対して、圧縮されたビット・パー・ バイトのマップを生成するために用いられる二進値を確立するために所定のスレ ッショルド・グレイスケール値が用いられ得る。更に、例えば、カラー・イメー ジに対して、所定の輝度スレッショルドとの比較によって、イメージ圧縮のため に用いられる二進値となるピクセルの3つの色コンポーネントから輝度値が導出 され得る。 また、図9の論理フローチャートは、複数のシリアルに接続された機能ブロッ ク、例えば、図2Cの圧縮されたテキスト・イメージ・データ32に指示された 機能を実行する個々の専用のプロセッサ、を有するイメージ処理システムのブロ ッ ク図として見られ得ることを認識すべきである。この場合、少なくともブロック CからG−Hは、ビット・パー・バイトの圧縮されたイメージを記憶するメモリ (例えば、半導体、ディスク、又はテープ)に接続され得る。 更に、本発明の方法はドキュメント・イメージを従来のドキュメント・スキャ ナなどから受信するシステムとの使用に制限されるものではなく、任意のビット マップ・テキスト・イメージを処理するために用いられ得ることを認識すべきで ある。その例としては、ファクシミリ装置から受信したビットマップ・テキスト ・イメージ、及びファクシミリ装置への送信のためにデータ・プロセッサによっ て生成されたビットマップ・テキスト・イメージを含むが、これらに制限される ものではない。 このように、本発明をその好適な実施例に関して特定的に示し且つ説明したが 、当業者には形式及び詳細の変更が本発明の範囲及び精神から逸脱することなし に行われ得ることが理解されるであろう。
【手続補正書】特許法第184条の8 【提出日】1996年7月29日 【補正内容】 『即ち、プログラムのタスクは、インタラクティブに受け入れ可能な時間期間内 で、これら5つのパラメータの可能な値の組み合わせを通じて5次元のサーチを 行い、ビットマップ・イメージの選択された部分の純化された幾何学的仕様を生 じることであろう。純化された幾何学的仕様は、次に、カット・アンド・ペース ト・ルーチンのような別のルーチンに渡され、それが、所望されるオペレーショ ンを行うためにビットマップ・イメージにおけるテキストの所望の部分を正確に 位置付けする。 これまで、インタラクティブに受け入れ可能な速度でこのような5次元のサー チを行うための自動化されたオペレーションのシーケンスを実行することができ 、且つ純化された幾何学的仕様を出力するドキュメント処理システムは存在しな かった。 FR−A−2513780は、テキストの位置をマーク付けするための機械的 スタイラスがカメラ又はOCR読み取り機とともに用いられ得るシステムを記載 している。IBMシステムズ・ジャーナル(IBM Systems Journal)のVol. 29、No.3、1.1.90の第435〜450ページのR.ケーシーその他 による「インテリジェント・フォームズ・プロセッシング(Intelligent Forms Processing)」は、OCRに対しての予めプリントされたブロックからテキスト を抽出する前に、スキャンされたフォームをマスタ・フォームのモデルと整合す る方法を記載している。 本発明の目的 従って、本発明の目的はビットマップ・テキスト・イメージの指定された部分 の概算的幾何学的仕様を純化するための自動化されたオペレーション・シーケン スを行う方法を提供することである。 本発明の別の目的は、ユーザ・インターフェースと、大きいビットマップ・テ キスト・イメージ内のビットマップ・テキスト・イメージの一部分のユーザが指 示した幾何学的仕様を純化するための自動化されたオペレーション・シーケンス を行うことが可能な1つ又はそれ以上のプロセッサであって、ユーザがビットマ ップ・テキスト・イメージのその部分の開始及び終了を示すことに応答してオペ レーションを行うプロセッサとを含むドキュメント処理システムを提供すること である。 本発明の概要 本発明の教示に従ったドキュメント処理システムによって及び該ドキュメント 処理システムをオペレーションする方法によって、上述の及び他の問題は解決さ れ且つ本発明の目的は実現される。 ドキュメント処理システムはユーザ・インターフェースと、テキストを含むド キュメントを表すビットマップ・データを記憶するメモリとを含む。』 1. テキストのラインを含むドキュメント(14)を表すビットマップ・デ ータ(18a)を記憶するメモリ手段(18)と、前記ビットマップ・データの イメージを表示する手段(22、22a)及びユーザからの入力に応答し、記憶 された前記ビットマップ・データ内の位置に対応する表示された前記イメージ内 の位置を指定する手段(25)を含むユーザ・インターフェース手段(22、2 4、25)とを有するドキュメント処理システム(10)であって、 テキストのラインを含むイメージの範囲の開始を指定する第1の指定された位 置に応答し、且つテキストのラインを含むイメージの範囲の終了を指定する第2 の指定された位置に応答し、該範囲に対応するビットマップ・データのサブセッ トを処理して、前記ビットマップ・データの前記サブセットから該範囲内のテキ ストのラインの横のエクステントを決定し、前記ビットマップ・データの前記サ ブセットから該範囲内のテキストのラインの傾斜がある場合にはその傾斜の量を 決定し、前記ビットマップ・データの前記サブセットから該範囲内のテキストの ラインの中心から中心の間隔を決定し、前記ビットマップ・データの前記サブセ ットからテキストの上部ラインの位置を決定する処理手段(20) を特徴とするシステム。 2. 請求項1に記載のシステムにおいて、 前記処理手段(20)は、該処理手段が前記ビットマップ・データの前記サブ セットから前記横のエクステント、前記傾斜、前記間隔、及び前記位置を決定す る前に前記ビットマップ・データを横に圧縮する手段を含む、 システム。 3. テキストのラインを含むドキュメント(14)を表すピクセル・データ のラインからなるビットマップ・データ(18a)を処理するためのドキュメン ト処理システム(10)による実行のための方法であって、テキストのラインを 含むテキスト・イメージの部分内の領域の開始点及び終了点の仕様に応答する方 法において、 前記ビットマップ・データのワーキング・コピーにアクセスし、前記領域内の テキストのラインの横のエクステントを決定するステップと、 前記ビットマップ・データのワーキング・コピーにアクセスし、前記領域内の テキストのラインの傾斜がある場合にはその傾斜の量を決定するステップと、 前記ビットマップ・データのワーキング・コピーにアクセスし、決定された前 記傾斜の量に従って、前記領域内のテキストのラインの中心から中心の期間を決 定するステップと、 前記ビットマップ・データのワーキング・コピーにアクセスし、決定された前 記傾斜の量に従って、前記領域内のテキストのラインのテキストの上部ラインの 上部の位置を決定するステップと を実行する方法。 4. 請求項3に記載の方法において、 前記の前記ビットマップ・データのワーキング・コピーにアクセスし、横のエ クステントを決定するステップは、前記ビットマップ・データを一様に横に圧縮 するステップを行うことによって前記ビットマップ・データの前記ワーキング・ コピーを生成する初期ステップを含む、 方法。 5. 請求項4に記載の方法において、 前記の圧縮するステップは、前記ビットマップ・データを8:1のピクセルの 圧縮比で圧縮する、 方法。 6. 請求項3に記載の方法において、 前記の前記ビットマップ・データのワーキング・コピーにアクセスし、横のエ クステントを決定するステップは、前記の指定された開始点及び終了点及び前記 の指定された開始点及び終了点の上及び下の両方の所定数のピクセルのラインを 含む長方形を規定する前置きのステップを含む、 方法。 7. 請求項6に記載の方法において、 前記の前記ビットマップ・データのワーキング・コピーにアクセスし、傾斜の 量を決定するステップは、 規定された前記長方形内の複数の位置において複数のパターン・テンプ レートを適用して前記長方形内のピクセル値を選択的にサンプリングするステッ プと、 前記のサンプリングされたピクセル値を基にして傾斜の値を概算するス テップと、 前記の概算された傾斜の値の近隣における複数の傾斜の値を反復的にサン プリングすることによって少なくとも1つのヒストグラムを構築するステップと 、 前記の構築された少なくとも1つのヒストグラムを基にして前記の概算さ れた傾斜の値をリファインするステップと を含む、 方法。 8. 請求項7に記載の方法において、 規定された前記長方形を、リファインされた概算された前記傾斜の値を基に決 定された内部角度を有する平行四辺形と置換するステップ を更に含む方法。 9. 請求項8に記載の方法において、 前記の前記ビットマップ・データのワーキング・コピーにアクセスし、間隔を 決定するステップ及び前記の前記ビットマップ・データのワーキング・コピーに アクセスし、位置を決定するステップの両方とも、リファインされた概算された 前記傾斜の値で、前記平行四辺形における非空白ピクセルのプロジェクションに 方形波関数を適合させることによって達成され、前記間隔は方形波関数の期間の 関数であり、前記位置は方形波関数の位相の関数である、 方法。 10. 請求項9に記載の方法において、 リファインされた概算された前記傾斜の値に沿ってピクセルのラインを検査し 、検査された前記ライン内の非空白ピクセルの発生をカウントすることによって ヒストグラムを生成するステップによってプロジェクションを構築するステップ を含む方法。 11. 請求項8に記載の方法において、 呼び出しルーチンに平行四辺形の座標を出力するステップ を含む方法。 12. 請求項9に記載の方法において、 前記ヒストグラムに最も適合する方形波は、オンの位相のヒストグラムの値の 平均とオフの位相のヒストグラムの値の平均との間の差を最大化する方形波であ る、 方法。』
───────────────────────────────────────────────────── 【要約の続き】 ンする。即ち、ビットマップ・データ・プロセッサは、 最初に指定された範囲に対応するビットマップ・データ 内に現れるすべてのテキストの幾何学的仕様を提供する ように、入力装置によって指定された範囲の境界をリフ ァインするようにオペレーションする。ビットマップ・ データ・プロセッサは、好適には、ビットマップ・デー タにオペレーションを行う前に該ビットマップ・データ を横に圧縮する。

Claims (1)

  1. 【特許請求の範囲】 1. ドキュメント処理システムであって、 テキストを含むドキュメントを表すビットマップ・データを記憶するメモリ手 段と、 前記ビットマップ・データのイメージを表示する手段と、ユーザからの入力に 応答し、記憶されたビットマップ・データ内の位置に対応する表示されたイメー ジ内の位置を指定する手段とを含むユーザ・インターフェース手段と、 テキストを含むイメージの範囲の開始を指定する第1の指定された位置に応答 し、且つテキストを含むイメージの範囲の終了を指定する第2の指定された位置 に応答し、該範囲に対応するビットマップ・データを処理して、該範囲内のテキ ストのラインの横のエクステントを決定し、該範囲内のテキストのラインの傾斜 がある場合にはその傾斜の量を決定し、該範囲内のテキストのラインの中心から 中心の間隔を決定し、テキストの上部ラインの位置を決定する処理手段と を備えるシステム。 2. 請求項1に記載のシステムにおいて、 前記処理手段は、該処理手段が前記横のエクステント、前記傾斜、前記間隔、 及び前記位置を決定する前に前記ビットマップ・データを横に圧縮する手段を含 む、 システム。 3. テキストを含むドキュメントを表すイメージ・ビットマップ・データを 処理するためのデータ・プロセッサによる実行のための方法であって、 テキストを含むイメージ・ビットマップ・データの部分の開始点及び終了点の 仕様に応答し、 前記イメージ・ビットマップ・データのワーキング・コピーから、前記開始点 から前記終了点に延びるテキストのすべてのラインの横のエクステントを決定す るステップと、 前記イメージ・ビットマップ・データのワーキング・コピーから、前記開始点 から前記終了点に延びるテキストのラインの傾斜がある場合にはその傾斜の量を 決定するステップと、 前記イメージ・ビットマップ・データのワーキング・コピーから、前記開始点 から前記終了点に延びるテキストのラインの中心から中心の期間を決定するステ ップと、 前記イメージ・ビットマップ・データのワーキング・コピーから、前記開始点 から前記終了点に延びるテキストのラインのテキストの上部ラインの上部の位置 を決定するステップと を備える方法。 4. 請求項3に記載の方法において、 前記の横のエクステントを決定するステップは、前記イメージ・ビットマップ ・データを一様に横に圧縮するステップを行うことによって前記イメージ・ビッ トマップ・データのワーキング・コピーを生成する初期ステップを含む、 方法。 5. 請求項4に記載の方法において、 前記の横に圧縮するステップは、前記イメージ・ビットマップ・データを8: 1のピクセルの圧縮比で圧縮する、 方法。 6. 請求項3に記載の方法において、 前記の横のエクステントを決定するステップは、前記の指定された開始点及び 終了点及び前記の指定された開始点及び終了点の上及び下の所定数のピクセル・ ラインを含む長方形を規定する前置きのステップを含む、 方法。 7. 請求項6に記載の方法において、 前記の傾斜の量を決定するステップは、 規定された前記長方形内の複数の位置において複数のパターン・テンプレー トを適用して前記長方形内のピクセル値を選択的にサンプリングするステップと 、 前記のサンプリングされたピクセル値を基にして傾斜の値を概算するステッ プと、 前記の概算された傾斜の値の近隣における連続的な傾斜を反復的にサンプリ ングすることによって少なくとも1つのヒストグラムを構築するステップと、 前記の構築された少なくとも1つのヒストグラムを基にして前記の概算され た傾斜の値をリファインするステップと を含む、 方法。 8. 請求項7に記載の方法において、 規定された前記長方形を、概算された前記傾斜を基に決定された内部角度を有 する平行四辺形と置換するステップ を更に含む方法。 9. 請求項8に記載の方法において、 前記の間隔を決定するステップ及び位置を決定するステップは、決定された前 記傾斜で、前記平行四辺形における占有されたピクセルのプロジェクションに方 形波関数を適合させることによって達成され、前記間隔は方形波関数の期間の関 数であり、前記位置は方形波関数の位相の関数である、 方法。 10. 請求項9に記載の方法において、 決定された前記傾斜に沿ってピクセルのラインを検査し、検査された前記ライ ン内の占有されたピクセルの発生をカウントすることによってヒストグラムを生 成するステップによってプロジェクションを構築するステップ を更に含む方法。 11. 請求項8に記載の方法において、 呼び出しプログラムに平行四辺形又は長方形の座標を渡すステップ を更に含む方法。 12. 請求項9に記載の方法において、 前記ヒストグラムに最も適合する方形波は、オンの位相のヒストグラムの値の 平均とオフの位相のヒストグラムの値の平均との間の差を最大化する方形波であ る、 方法。
JP8507295A 1994-08-16 1995-06-07 テキストのビットマップ・イメージからテキストの部分を自動的に指定する方法及び装置 Pending JPH10508127A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/291,262 US5517586A (en) 1994-08-16 1994-08-16 Method and apparatus for automatically specifying a portion of text from a bitmap image of the text
US08/291,262 1994-08-16
PCT/US1995/007926 WO1996005570A1 (en) 1994-08-16 1995-06-07 Method and apparatus for automatically specifying a portion of text from a bitmap image of the text

Publications (1)

Publication Number Publication Date
JPH10508127A true JPH10508127A (ja) 1998-08-04

Family

ID=23119592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8507295A Pending JPH10508127A (ja) 1994-08-16 1995-06-07 テキストのビットマップ・イメージからテキストの部分を自動的に指定する方法及び装置

Country Status (7)

Country Link
US (1) US5517586A (ja)
EP (1) EP0776512B1 (ja)
JP (1) JPH10508127A (ja)
AU (1) AU690298B2 (ja)
CA (1) CA2197687A1 (ja)
DE (1) DE69512074T2 (ja)
WO (1) WO1996005570A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6456739B1 (en) * 1995-06-19 2002-09-24 Canon Kabushiki Kaisha Apparatus for recognizing characters and a method therefor
US6137487A (en) * 1997-02-24 2000-10-24 International Business Machines Corporation Method and apparatus for manipulating graphical objects in a data processing system
GB9711022D0 (en) * 1997-05-28 1997-07-23 Rank Xerox Ltd Text/image selection from document images
US6112208A (en) * 1997-08-25 2000-08-29 Fujitsu Limited Data compressing method and apparatus to generate bit maps in accordance with extracted data symbols
US7882426B1 (en) * 1999-08-09 2011-02-01 Cognex Corporation Conditional cell execution in electronic spreadsheets
US6640010B2 (en) 1999-11-12 2003-10-28 Xerox Corporation Word-to-word selection on images
FR2810765B1 (fr) * 2000-06-27 2002-08-23 Mannesmann Dematic Postal Automation Sa Segmentation d'une image numerique d'un objet postal par la transformation de hough
US6904170B2 (en) * 2002-05-17 2005-06-07 Hewlett-Packard Development Company, L.P. Method and system for document segmentation
EP1553517B1 (en) * 2002-08-07 2009-12-09 Panasonic Corporation Character recognition processing device, character recognition processing method, and mobile terminal device
US7856441B1 (en) 2005-01-10 2010-12-21 Yahoo! Inc. Search systems and methods using enhanced contextual queries
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
EP1910949A4 (en) * 2005-07-29 2012-05-30 Cataphora Inc IMPROVED METHOD AND APPARATUS FOR ANALYZING SOCIOLOGICAL DATA
US9805010B2 (en) * 2006-06-28 2017-10-31 Adobe Systems Incorporated Methods and apparatus for redacting related content in a document
US20090323087A1 (en) * 2008-06-30 2009-12-31 Konica Minolta Systems Laboratory, Inc. Systems and Methods for Document Redaction
US8675220B2 (en) 2008-10-22 2014-03-18 J2 Global Communications, Inc. Internet fax message searching and fax content delivery using keyword detection
US8922582B2 (en) * 2009-11-16 2014-12-30 Martin J. Murrett Text rendering and display using composite bitmap images
US9779168B2 (en) 2010-10-04 2017-10-03 Excalibur Ip, Llc Contextual quick-picks

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3138757A1 (de) * 1981-09-29 1983-05-05 Siemens AG, 1000 Berlin und 8000 München Verfahren zur erfassung von textausschnitten aus einer vorlage und vorrichtung zur durchfuehrung des verfahrens
US5161213A (en) * 1988-05-27 1992-11-03 Wang Laboratories, Inc. Method for black and white image reduction based upon averaging black/white pixel counts of neighboring blocks
US5048099A (en) * 1990-05-21 1991-09-10 Eastman Kodak Company Polygon-based method for automatic extraction of selected text in a digitized document
US5325447A (en) * 1991-10-02 1994-06-28 Environmental Research Institute Of Michigan Handwritten digit normalization method
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image

Also Published As

Publication number Publication date
EP0776512B1 (en) 1999-09-08
AU2870595A (en) 1996-03-07
DE69512074D1 (de) 1999-10-14
AU690298B2 (en) 1998-04-23
DE69512074T2 (de) 2000-04-06
CA2197687A1 (en) 1996-02-22
US5517586A (en) 1996-05-14
EP0776512A1 (en) 1997-06-04
WO1996005570A1 (en) 1996-02-22

Similar Documents

Publication Publication Date Title
JP4101290B2 (ja) 書式処理時の自動ページ登録及び自動領域検出のためのシステム及び方法
US5335290A (en) Segmentation of text, picture and lines of a document image
US6738154B1 (en) Locating the position and orientation of multiple objects with a smart platen
US5517586A (en) Method and apparatus for automatically specifying a portion of text from a bitmap image of the text
US6366695B1 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
US6385350B1 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
US6903751B2 (en) System and method for editing electronic images
US5854854A (en) Skew detection and correction of a document image representation
US6173073B1 (en) System for analyzing table images
US8000529B2 (en) System and method for creating an editable template from a document image
US5592572A (en) Automated portrait/landscape mode detection on a binary image
US7805022B2 (en) Image processing apparatus, image processing method and computer program
US20030152272A1 (en) Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
JPH08235349A (ja) ページ解析システム
JP2001175807A (ja) テキスト領域選択方法
AU688453B2 (en) Automatic determination of blank pages and bounding boxes for binary images
US6175664B1 (en) Optical character reader with tangent detection for detecting tilt of image data
EP0975146B1 (en) Locating the position and orientation of multiple objects with a smart platen
EP0767941B1 (en) Automatic determination of landscape scan in binary images
EP1018694B1 (en) System and method for automatic graph parsing
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JPH0573718A (ja) 領域属性識別方式
JPH0535914A (ja) 画像傾き検出方法
JPH07281657A (ja) 画像縮小方法及び画像縮小装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050920