JPH09171557A - イメージ処理方法及び装置 - Google Patents

イメージ処理方法及び装置

Info

Publication number
JPH09171557A
JPH09171557A JP8221835A JP22183596A JPH09171557A JP H09171557 A JPH09171557 A JP H09171557A JP 8221835 A JP8221835 A JP 8221835A JP 22183596 A JP22183596 A JP 22183596A JP H09171557 A JPH09171557 A JP H09171557A
Authority
JP
Japan
Prior art keywords
text
block
contour
overlapping
rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8221835A
Other languages
English (en)
Other versions
JP3950498B2 (ja
Inventor
Yan Wan Shin
ヤン ワン シン
Toshiaki Yagasaki
敏明 矢ヶ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH09171557A publication Critical patent/JPH09171557A/ja
Application granted granted Critical
Publication of JP3950498B2 publication Critical patent/JP3950498B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 本発明は、特徴抽出またはブロック選択技術
により定められるブロック矩形領域における重複の問題
を克服できるブロック選択装置を提供することを目的と
する。 【解決手段】 テキスト領域と非テキスト領域の両方を
含むイメージデータを処理するイメージ処理方法が提供
される。ブロック選択を行って、前記イメージデータ中
のテキストタイプ領域の各ブロックの周囲及び前記イメ
ージデータ内の非テキストタイプ領域の各ブロックの周
囲の外接矩形を得る。各テキスト及び非テキストブロッ
クについて輪郭ペアを得る。前記外接矩形が重複するか
どうかを判別する。前記輪郭ペアに基づいて重複する矩
形を分解する。非重複矩形について外接矩形に基づき、
重複矩形については分解矩形に基づいて、イメージデー
タを抽出する。該抽出されたイメージデータを処理す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書頁のテキスト
領域と非テキスト領域を区別するために該文書頁のイメ
ージを分析するブロック選択(または特徴抽出)装置で
あって、テキスト領域の各グループの周囲と非テキスト
領域の各グループの周囲とに外接する矩形を定め、その
後で重複する矩形を同定し、それらの矩形の重複する部
分を分解することによって該重複する部分の除去を可能
にする装置に関する。
【0002】
【従来の技術】従来の特徴抽出装置においては、文書頁
の異なるタイプのイメージデータは、まず、該イメージ
データがテキストタイプであるかまたは非テキストタイ
プであるかに応じて同定され、次にイメージデータの領
域が、種類に応じて一緒にグループ化(または「ブロッ
ク化」)される。イメージデータの各ブロックが、その
後で、更なる処理のために抽出される。即ち、従来の特
徴抽出装置は、ブロック選択ルーチンを実行して、前記
イメージデータ内の連結成分を同定し、非テキストタイ
プの連結された成分からテキストタイプの連結成分を分
離し、別々に該テキスト及び非テキスト連結成分を好ま
しくは矩形のブロック内にグループ化し、そして非テキ
スト連結成分を更なる分析に付して、表データ、グラフ
データ、線画イメージ、ハーフトーンイメージ、フレー
ム等の非テキスト連結成分の特定の種類を同定する。
【0003】一度イメージデータの特徴が抽出されると
階層木を、該木の各ノードがブロック選択中に定められ
たイメージデータの各ブロック矩形グループに1対1対
応するように設けて、設定することができる。階層木の
各ノードには、属性情報がイメージデータの各ブロック
矩形片毎に記憶される。即ち、該属性情報は、イメージ
情報のブロックがテキストタイプであるか非テキストタ
イプであるかについての情報を含み、テキストタイプ情
報は、さらに題名領域、見出し領域、テキスト領域、な
どに分類され、非テキストタイプ情報は、さらに、表情
報、線画情報、グラフ情報、ハーフトーンイメージ情報
などに分類されていることが可能である。なお、階層木
中のノードの位置は、文書頁内のイメージ情報の対応す
るブロック矩形の位置を暗に記憶している。文書のイメ
ージ情報内の矩形ブロックの場所との組合せで、階層木
により、光学式文字認識(OCR)、データ及び/また
はイメージ圧縮、データルーチング、データ抽出、保
存、検索などのようなその後の適切な処理のための情報
の各ブロックの抽出が可能になる。例えば、テキストデ
ータとして指定されたイメージデータのブロックは、適
切なOCR処理に付しうるが、ピクチャデータと指定さ
れたイメージデータのブロックは、データ圧縮に付し得
るであろう。その結果、多様な異なる文書頁のいずれの
イメージデータであれ、任意に入力し、オペレータの介
入なしに自動的に処理可能となる。
【0004】イメージデータの各ブロックの秩序だった
処理のために、多くの従来の特徴抽出装置は、ブロック
が重複していないという仮定に依存していた。そのよう
な仮定は、図2に示した文書などの、非常に多くの文書
において正しい。該図から分かるように、代表的な文書
頁1は、2コラムフォーマットで配列され、題名領域
2、水平な線3、各々テキストデータの行を含むテキス
ト領域4、5及び6、ハーフトーンピクチャ領域7、フ
レーム領域8、ならびに表9を含む。米国特許出願第0
7/873、012号「文字識別の方法及び装置」なら
びに米国特許出願第08/338、781号「頁分析装
置」に記載されたブロック選択技術、によると、文書頁
1の各領域が、その中に位置するイメージデータのタイ
プに従って同定及び指定され、次いでイメージデータが
その各々のタイプに基づいて区分される。ブロック選択
処理の結果、各イメージ領域の矩形ブロックが図3に示
すように作成され、対応する階層木が形成される。即
ち、図3に示すように、文書1に対応するイメージデー
タ11の場合は、ブロック選択により、題名ブロック1
2、テキストブロック14、15及び16などの多様な
テキストタイプ領域ならびに線ブロック13、ハーフト
ーンイメージブロック17、フレーム領域18及び表領
域19等の多様な非テキストブロックが定められる。
【0005】図3に示すように、非テキストブロックの
あるものはその中にテキストブロックを含みうるが、矩
形ブロックのいずれも他のブロックに重複していない。
例えば、フレーム領域18は、非テキスト線画領域18
a及びテキスト領域18bを含み、表領域19は、総じ
て19aで指定されるテキストタイプ表記載事項を含
む。
【0006】
【発明が解決しようとする課題】上に述べたように、イ
メージデータ11内のイメージ領域のブロック矩形指定
に基づき、各情報領域のイメージデータをその後の適切
な処理のために抽出することができる。さらに、そして
同じく前述したように、矩形ブロックのいずれも他と重
複していないので、抽出は直接的である。
【0007】ブロック矩形領域が互いに他と重複すると
きは困難が生じる。そのような重複は、例えば、文書の
全体の外見に深く影響する編集書式の単純な変更ととも
に生じ得る。かくして、図4に示すように、フレーム領
域8を文書の2つのコラムにまたがる8aで示される位
置に移動する編集書式の単純な変更が行われている。従
来のブロック選択及び特徴抽出技術では、図5に示すよ
うに、ブロック18aがブロック14及びブロック15
に重なるブロック矩形フォーマットが得られる結果とな
る。そのように定められた矩形ブロックに基づいてイメ
ージデータを抽出するときになると、これらのブロック
の重複は困難を引き起こす。即ち、領域4のテキストイ
メージデータにのみ対応すると想定されているブロック
14についてイメージデータを抽出する時になると、非
テキストフレーム領域18aの不要な部分も抽出される
ことが分かる。同様に、テキストタイプイメージデータ
のみを含むと推定されている領域15のイメージデータ
を抽出するときになると、非テキストフレーム領域18
aの不要なもう一つの部分が抽出されることが分かる。
かくして、特徴抽出またはブロック選択技術により設定
されるブロック矩形領域における重複は、現在までのと
ころ困難を生じている。
【0008】本発明は、上述の問題点に鑑み、特徴抽出
またはブロック選択技術により設定されるブロック矩形
領域における重複の問題を克服できるブロック選択装置
を提供することを目的とする。
【0009】
【問題を解決するための手段】本発明は、上述の困難に
対してブロック選択及び特徴抽出処理の結果得られる重
複矩形を同定し、該重複矩形をより小さい非重複矩形に
分解することにより対処する。好ましくは、重複する矩
形が全て分解されるのではなく、むしろ該重複矩形がま
ず分解が必要かどうかを判別するために分析されて、第
1の矩形についてイメージデータを抽出するときに第2
の矩形中の不要なイメージデータを抽出するのを回避す
る。
【0010】好ましい形態においては、重複矩形の分解
は、各矩形内のイメージデータの輪郭ペアに基づく。即
ち、多くの水平の行にわたるイメージデータの場合、隙
間のない輪郭が定められ、そこから各イメージ行につい
て輪郭ペアを得ることが可能であるが、該輪郭ペアはそ
の線についてイメージデータの最左端及び最右端を定め
る。輪郭ペアは外接矩形内のイメージデータの3つの互
いに排他的な異なる種類のイメージデータの各々につい
て別様に得られる。即ち、輪郭ペアは、(1)テキスト
データ、(2)内部対象物を全く含まない非テキストデ
ータ及び(3)内部対象物を含む非テキストデータにつ
いて、別様に得られる。
【0011】イメージデータの重複する矩形ブロック
は、その重複がしかるべきイメージ抽出に干渉するかど
うかを判別するために分析される。もし重複がしかるべ
きイメージ抽出に干渉しない場合には、分解は行われ
ず、輪郭ペアは用いられない。他方、矩形ブロックにお
ける重複がしかるべきイメージ抽出に干渉すると判別さ
れた場合は、輪郭ペアを用いて重複矩形を分解する。即
ち、分解は、関係のある重複矩形の種類に応じて別様に
行われる。即ち、分解は、(1)他のタイプ(即ちテキ
ストまたは非テキスト)ブロックに重複するテキストブ
ロック、(2)内部コンテンツを含まず、他の種類のブ
ロックに重複する非テキストブロック、及び(3)内部
コンテンツを含み他の種類のブロックに重複する非テキ
ストブロックについて、別様に行われる。
【0012】かくして、本発明の1つの形態において
は、テキスト領域と非テキスト領域の両方を含むイメー
ジデータを処理する処理方法が提供される。本方法は、
ブロック選択を行って、イメージデータ内のテキストタ
イプ領域の各ブロックの周囲及びイメージデータ内の非
テキスト領域の各ブロックの周囲に外接する矩形を得、
各テキスト及び非テキストブロックについて輪郭ペアを
得るステップを含む。その次に、外接する矩形が重複す
るかどうが判別される。輪郭ペアに基づいて重複矩形を
分解し、非重複矩形の場合、外接矩形に基づいて、重複
矩形の場合、分解された矩形に基づいて、イメージデー
タが抽出される。次に抽出されたイメージデータが処理
される。
【0013】この簡単な概要は、本発明の本質が速やか
に理解されるように提供したものである。本発明のより
完全な理解は、添付の図面に基づく好ましい形態の下記
の説明を参照することにより得ることができる。
【0014】
【発明の実施の形態】図6は、本発明に係る重複矩形分
析及び分解を含む本発明の代表的な実施の形態の外観を
示す図である。図6には、プログラム化された汎用コン
ピュータが示されているが、本発明は、他のイメージ処
理装置に組み込み可能な、専用、ROMベースまたは据
えつけ型の装置などの他の装置において具体化可能であ
ることは理解されねばならない。
【0015】図6には、マイクロソフトWindows
OS等のウインドウ型オペレーションシステムを有す
るIBM PCまたはPC互換機等のコンピュータ機器
410が示してある。コンピュータ機器410には、モ
ノクロまたはカラーディスプレイモニタ412が設けら
れ、ユーザに対しイメージを表示する。コンピュータ機
器410には更に、文書イメージファイル等のデータフ
ァイルならびにブロック選択及び重複矩形分析分解プロ
グラム等のアプリケーションプログラムファイルを記憶
する固定ディスクドライブ411が設けられている。さ
らにコンピュータ機器410には、テキストデータを入
力し、ディスプレイ412の表示画面に表示される対象
の操作を可能にするキーボード413と、ディスプレイ
412に表示される対象を指示したり操作したりするた
めの、マウス等のポインティング・デバイス414とが
設けられる。
【0016】複数頁を有する文書はスキャナ416によ
って入力される。スキャナ416は文書の各頁または他
のイメージをスキャンして、これらの頁のビットマップ
イメージデータをコンピュータ機器410に供給する。
該イメージデータは、圧縮または非圧縮フォーマットで
ディスク411に記憶される。
【0017】コンピュータ機器410が処理した文書を
出力するために従来のカラープリンタ418が設けられ
る。
【0018】更に、ローカル・エリア・ネットワークと
インターフェースするためのネットワーク・インターフ
ェース424、及びファクシミリ/データモデムを介し
てファクシミリ・メッセージ及び他のデータファイルを
送受信するためのファクシミリ/モデム・インターフェ
ース426が設けられる。そのようなインターフェース
は、ドキュメントイメージデータを入力するためのスキ
ャナ416に加えて、またはその代わりに用いることが
できる。
【0019】オペレータの指示に従って且つウインドウ
型オペレーションシステムの制御のもとで、デスクトッ
プ・パブリッシング・プログラム、ドローイング・アプ
リケーション・プログラム、ブロック選択アプリケーシ
ョン等の記憶されたアプリケーション・プログラムが選
択的に起動され、データを処理したり操作したりする。
また、オペレータの指示に従って且つこれらの記憶され
たアプリケーション・プログラムに基づいて、イメージ
をモニタ412に表示したり、モニタ412に表示され
ているイメージをプリンタ418で印刷するようにコマ
ンドが発せられる。
【0020】最も典型的には、本発明を具体化するブロ
ック選択プログラムや重複矩形分析・分解プログラムを
含むコンピュータディスク411に記憶されたアプリケ
ーション・プログラムは、フロッピィディスク、CD−
ROM、またはコンピュータ掲示板などのコンピュータ
読み出し可能媒体から各アプリケーションをダウンロー
ドしてディスク411に記憶したものである。
【0021】図7は、コンピュータ機器410の内部構
成を示す詳細ブロック図である。図7に示すように、コ
ンピュータ機器410は、コンピュータバス521に接
続された、プログラム式マイクロプロセッサ等から成る
中央演算処理装置(CPU)520を有する。また、ス
キャナ・インターフェース522、プリンタ・インター
フェース523、ネットワーク・インターフェース52
4、ファクシミリ・モデム・インターフェース526、
ディスプレイ・インターフェース527、キーボード・
インターフェース528、及びマウス・インターフェー
ス529が、コンピュータバス521に接続されてい
る。
【0022】CPU520がアクセスできるように、ラ
ンダム・アクセス・メモリ(RAM)等の主メモリ53
0がコンピュータバス521に接続されている。特に、
ディスク411に記憶されたアプリケーション・プログ
ラムに関連する命令等、記憶されたアプリケーション・
プログラムの命令列を実行するときに、CPU520
は、これらの命令列を、ディスク411(またはネット
ワーク・インターフェース524を介してまたはフロッ
ピィ・ディスク・ドライブ(図示せず)を介してアクセ
スされる媒体等の他のコンピュータ読み出し可能な媒
体)から主メモリ530にロードして、主メモリ530
からこれらの記憶されたアプリケーション・プログラム
の命令列を読み出して実行する。
【0023】図1は、コンピュータで実現される方法を
示すフローチャートであって、文書頁を表す入力イメー
ジが入力され、該入力イメージに対してブロック選択が
実行されて文書イメージ内のテキスト及び非テキストブ
ロックの周囲の外接矩形を定め、輪郭ペアを各ブロック
について得、外接矩形を分析してそれらが重複している
か否かを判別し、重複していた場合は、該重複がイメー
ジ抽出に影響するかどうかを判別し、次に、それらがイ
メージ抽出に影響すると判別された場合は、重複矩形を
分解する。即ち、図1に示すように、分解は、重複矩形
が、テキストブロック、内部コンテンツを含まない非テ
キストブロック、または内部コンテンツを含む非テキス
トブロックに外接するかどうかに応じて別様に行われ
る。図1に示された処理ステップは、上述のようにコン
ピュータ読み出し可能な媒体に記憶され、それらの処理
ステップを主メモリ530にロードしてそこから実行す
るCPU520によって実行される。
【0024】即ち、ステップS501で、文書頁を表す
イメージデータが入力される。前述したように、イメー
ジデータはスキャナ416を介して入力してよく、また
はディスク411上や、ネットワーク・インターフェー
ス424もしくはファクシミリ/モデム・インターフェ
ース426を介して記憶されたイメージデータファイル
から得てもよい。
【0025】ステップ502において、入力イメージに
対してブロック選択が実行されて、テキスト及び非テキ
ストブロックの周囲の外接矩形を得、また各ブロックに
ついて属性情報と位置情報を記憶する階層木を得る。好
適なブロック選択技術は、前述の米国出願第07/87
3,012号及び第08/388,781号に記載され
ており、その内容は、完全に記述したのと同じようにこ
こに引用により加入する。
【0026】ステップS503においては、ステップS
502のブロック選択中に既に輪郭ペアが算出されてい
ない程度だけ、輪郭ペアが、ステップS502でブロッ
ク選択により定められた各ブロック矩形領域について得
られる。即ち、各ブロックは、通常多数の水平の線にわ
たる。ブロックの中に入るそのような行の各々につい
て、該ブロック中の最左端及び最右端の領域を定める輪
郭ペアがステップS503で得られる。輪郭ペアは、矩
形ブロック内のデータの種類に応じて別様に得られる。
即ち、輪郭ペアは、該ブロックが(1)テキストブロッ
ク、(2)内部コンテンツを含まない非テキストブロッ
クまたは(3)内部コンテンツを含む非テキストブロッ
クであるかどうかに応じて、別様に定められる。ステッ
プS503にしたがって輪郭ペアを得る方法について
は、図8及び図9を参照して下記において詳述する。
【0027】ステップS504では、ステップS502
で得た外接矩形が重複するかどうかを判別する。外接矩
形が重複するかどうかの判別は、図13を参照して、下
記に詳述する。もし重複する外接矩形がなければ、本発
明によりさらに処理を行う必要はなく、フローは、ステ
ップS509までスキップする。
【0028】他方、ステップS504で外接矩形が重複
すると判別されたときは、ステップS505で、重複が
イメージ抽出に影響するかどうかを判別する。一般的
に、ほとんどの重複は、イメージ抽出に影響するが、中
にはイメージ抽出に影響しないものも存在しうる。例え
ば、重複するけれども、第1の外接矩形が第2の外接矩
形のイメージデータを全く含まないかまたはその逆であ
るという点で、互いに排他的である2つの外接矩形がブ
ロック選択により定められることはあり得る。そのよう
な外接矩形は、重複しているが、イメージ抽出には影響
を与えない。重複がイメージ抽出に影響するかどうかを
判別する方法についての詳細は、図14(A)〜(C)
を参照して詳述する。
【0029】ステップS505で重複がイメージ抽出に
影響を与えないと判別された場合は、本発明によりさら
に処理を行う必要はなく、フローは、ステップS509
までスキップして進む。他方、重複がイメージ抽出に影
響する場合は、フローは、ステップS506、S507
及びS508に進み、各ステップで重複ブロックをそれ
ぞれ分解してイメージ抽出に影響しないようにする。
【0030】ステップS506、S507及びS508
では、重複するブロックの種類に応じて重複ブロックが
別様に分解される。かくして、ステップS506では、
他の種類のブロック、即ちテキストまたは非テキストブ
ロックに重複するテキストブロックが分解される。ステ
ップS507では、内部コンテンツを含まない重複非テ
キストブロックが分解される。そしてステップS508
では、内部コンテンツを含む非テキストブロックが分解
される。階層木は、ステップS506、S507または
S508においてどのような分解が行われたかに基づい
て更新される。
【0031】重複テキストブロック及び非テキストブロ
ックをステップS506またはS507またはS508
で分解した後で、フローはステップS509に進み、イ
メージデータがイメージデータの境界を定める外接矩形
に応じて抽出される。かくして、例えば、重複矩形が存
在しない状況では、イメージデータは、ステップS50
2でブロック選択により定められた外接矩形に応じて抽
出される。他方、重複矩形が存在し、ステップS50
6、S507またはS508で分解された場合は、各ブ
ロックのイメージ抽出がそれらのステップで決定された
分解ブロックに応じて実行される。
【0032】フローは、次に抽出イメージデータが適切
に処理されるステップS510に進む。例えば、上述の
ように、テキストタイプイメージデータを抽出する時
は、適切な処理は、テキストデータ内の文字イメージの
同一性を判別するための光学式文字認識であってよい。
同様に、非テキスト表領域用の適切な処理には、該表内
に含まれるテキスト用のOCR処理が含まれてよい。さ
らに別の例として、非テキストハーフトーンイメージデ
ータの適切な処理には、より小さな記憶領域にハーフト
ーンピクチャを保存することを可能にする簡単なイメー
ジ圧縮が含まれてよい。
【0033】図1の処理は、必要に応じて、ブロック選
択及びイメージ抽出が望まれる各文書頁のイメージデー
タについて繰り返し行われる。
【0034】図8は、図1の上記ステップS503で簡
単に説明したように、イメージ情報の各矩形ブロックに
ついて輪郭ペアを得る方法を示すフローチャートであ
り、図9は、「輪郭ペア」が何を意味するかを説明する
図である。
【0035】簡単に図9を参照すると、ブロック選択ス
テップS502で定められたイメージデータの任意のブ
ロック40は、垂直方向に多数の走査線を含み、該走査
線の各々はブロックを水平に横切って延びている。任意
に形作られた連結成分41は、例えば、文字のイメージ
またはその他のイメージであってよいが、やはり多数の
走査線を横切って垂直方向に延びている。「輪郭ペア」
は、対象物41を含む各走査線について定められる。走
査線上の各輪郭ペア(対象物が違う位置で走査線を横切
る場合は各走査線には2個以上の輪郭ペアが存在しう
る)は、正確に2つのポイント:対象物が走査線上で始
まる第1(または左側)の点と対象物が走査線上で終わ
る第2(または右側)の点とを含む。かくして、例え
ば、図9を参照すると、走査線iには2つの輪郭ペアが
含まれ、第1のものは(a,b)からなり、第2のもの
は(c,d)からなる。輪郭ペア(a,b)には、対象
物41が走査線i上で始まる第1(左側)の点aと対象
物41が輪郭線i上で終了する第2(右側)の点bが含
まれる。同様に、輪郭ペア(c,d)には、対象物41
が走査線i上で始まる第1(左側)の点cと対象物が輪
郭線i上で終了する第2(右側)の点dが含まれる。走
査線「j]の場合は、3つの輪郭ペア、即ち、(e,
f)、(g,h)及び(k,l)があり、走査線「k」
の場合は、ただ1つの輪郭ペア(m,n)がある。輪郭
ペアの内側にあり輪郭ペアを含むイメージは、対象物4
1の連結成分に属するイメージである。したがって、対
象物のイメージは、各走査線に沿う輪郭ペアにのみもと
づいて抽出することができる。
【0036】図9からよく理解されるように、イメージ
中の各対象物が輪郭ペアで表わされれば、イメージのど
の部分が次のイメージ処理のために抽出されなければな
らないかについてもはや混乱はないであろう。他方、か
なりのメモリスペースがイメージ内の各輪郭ペアを記憶
するのに必要とされ、特にイメージが何千もの輪郭ペア
が必要とされるであろうテキストから構成されている時
にはそうである。さらに、輪郭ペアの使用は、ブロック
矩形フォーマットでより自然に提示されるイメージの非
直覚的な表現になるために、ユーザにとっては不便であ
る。勿論、ブロック矩形フォーマットは、各矩形に対し
て単に左上の角と右下の角のみが設定に必要であるの
で、ずっと少ないメモリ記憶装置条件しか要求しない。
重複矩形が発生するときに生じる上述の欠点は、下記に
おいてより詳細に説明されるように、部分的には、輪郭
ペアのしかるべき使用法により対処される。
【0037】図8を参照すると、3つの異なる種類のブ
ロック:テキストブロック、内部成分を含まない非テキ
ストブロック及び内部成分を含むテキストブロックの各
々について、輪郭ペアを導出するフローチャートが示さ
れている。よく理解されるように、イメージ内で出会う
いかなるブロックもこれらの互いに排他的な3つのカテ
ゴリの一つに属する。図8からさらによく理解されるよ
うに、各異なる種類のブロックの輪郭ペアは、それぞれ
が他の種類のブロックについてから導出される方法と
は、別様に導出される。
【0038】かくして、ステップS601では、ステッ
プS502(図1)で導出された矩形ブロックがテキス
トブロックであるかどうか判別するために調べられる。
テキストブロックである場合は、次に輪郭ペアがステッ
プS602、S603及びS604により得られるが、
これらのステップにおいては、該ブロックの連結成分の
頂部、底部、左側及び右側の縁がまず得られ、それらの
4つの縁が組み合わされて、ブロック内の全ての連結成
分の隙間のない輪郭にされ、輪郭ペアがその隙間のない
輪郭から作成される。この処理は、図10(A)〜
(F)に示されている。図10(A)を参照すると、テ
キスト連結成分を含む矩形ブロックが描かれている。1
2のテキスト連結成分が示されているが、この数字は、
通常生じるよりもずっと少ないものであり、簡潔さのた
めにのみ示してある。図10(B)〜(E)では、図8
のステップS602により、全ての連結成分の頂部の
縁、底部の縁、左側の縁及び右側の縁がそれぞれ得られ
る。次に、ステップS603により図10(F)に示さ
れるように、頂部、底部、左側及び右側の縁が組み合わ
されて全ての連結成分が隙間のない輪郭にされる。4つ
の縁を組み合わせることにより、隙間のない輪郭が、テ
キストブロック内のテキストの全てを隙間なく囲む閉じ
たループに形成されることはよく理解されるであろう。
最後に、輪郭ペアが図10(F)の隙間のない輪郭の輪
郭ペアを得ることにより、得られる(ステップS60
4)。
【0039】ステップS602ないしS604において
は、テキストブロックを囲む隙間のない輪郭を形成する
ため連結成分の矩形境界を用いると、各連結成分基づい
て隙間のない輪郭を算出する場合に多すぎる時間を費や
すことなく良好な結果が得られるであろうと感じられ
る。しかし、この人為的に作られた輪郭は、他の対象物
の輪郭と重複する結果となった場合に、該重複に関わる
連結成分の各々の輪郭ペアを用いて重複する部分を修正
することができる。
【0040】図8に戻って、ステップS601で矩形ブ
ロックがテキストブロックでないと判別された場合は、
フローは、ステップS605に進み、矩形ブロックが内
部成分を含まない非テキストブロックであるかどうか判
別される。矩形ブロックが内部成分を含まない非テキス
トブロックである場合は、フローはステップS606及
びS607に切り替わり、そこで、輪郭ペアがブロック
内の各連結成分について得られ、そのようにして得られ
た輪郭ペアが連結される。この処理は、図11に示され
るが、該図においては、3つの任意な連結成分46、4
7及び48が示されている。輪郭ペアは、該連結成分の
各々について導出され、輪郭ペアを結び組み合わせて、
全体に49で示されるように、全非テキストブロック囲
む単一の輪郭を形成すべきかどうか考慮される。もし4
9で示されるような連結が望まれる場合は、連結のため
の空の道筋、即ち、重複を引き起こさない道筋が見出さ
れねばならない。その後で、連結された輪郭線が輪郭ペ
アとして出力される。他方、連結が望まれていない場合
は、各分離した連結成分の輪郭ペアが出力される。
【0041】図8に戻り、ステップS605で、矩形ブ
ロックが内部成分を含まない非テキストブロックである
と判別されなかった場合は、カテゴリは互いに排他的で
あるので、該矩形ブロックは必然的に内部成分を有する
非テキストブロックでなければならない。したがって、
フローは、ステップS609及びS610(ステップS
608は単に完全さのために示してあり、実際には実行
を要しない)に進む。ステップS609とS610にお
いては、非テキスト対象物の外側の輪郭の輪郭ペアのみ
ならず内側白輪郭の輪郭ペアも得られ、ブロックの内部
成分を抽出するのを補助する。
【0042】即ち、図12(A)を参照して、フレーム
対象物、表対象物または線画対象物等の内部成分を有す
る非テキスト成分は、対象物の最も外側の輪郭の内側に
含まれる白輪郭を有していてよい。内側白輪郭は、内部
対象物を抽出する補助のために用いられる。かくして、
図12(A)に示されるように、そしてステップS60
9で説明されたように、テキスト成分などの内部成分5
2を含む任意の非テキストブロック50について、まず
輪郭ペアが、該非テキスト対象物の最も外側の輪郭を定
める連結成分について得られる。したがって、図12
(A)に示してある状況では、輪郭ペアが連結成分51
について得られる。その後、ステップS610にしたが
って最も外側の輪郭の内側白輪郭について輪郭ペアが得
られる。そのような内側白輪郭が53で示されている。
(内側白輪郭を得る方法についての詳細な説明は米国特
許出願第07/873,012号でなされており、その
内容は上述のように引用によりここに加入される。)最
も外側の輪郭を定める連結成分と内側白輪郭の両方につ
いての輪郭ペアが、次に、必要な輪郭ペア情報として出
力される。
【0043】米国特許出願第07/873,012号
は、図12(C)に示す4方向パターンでの内側白輪郭
の導出を記述しているが、図12(D)に示される8方
向パターンで内側白輪郭を導出することも可能である。
8方向導出は、非テキストの最も外側の輪郭が単に垂直
に配された縁だけではなく斜めの縁も有するような図1
2(B)に示されるような状況の場合に有利である。勿
論、該8方向パターンは、図12(A)に示されるよう
な状況パターンでも使用可能である。8方向導出は、5
3aで示されるように斜めの縁が存在する場合でも、内
側白輪郭を良好に定めることを可能にする。しかし、8
方向検索パターンが用いられると、各ステップにおいて
白輪郭が外側の黒い境界で完全に包まれているかどうか
を判別するために白輪郭トレースを検査しなければなら
ない。
【0044】要約すると、図8及び図9は、ステップS
503で簡単に触れた処理の詳細な処理を示すが、それ
によりブロック選択により同定された各矩形ブロックに
ついて輪郭ペアが得られ、またそれにより、輪郭ペア
は、該ブロックがテキストブロックであるか、内部成分
を含まない非テキストブロックであるか、内部成分を含
む非テキストブロックであるかに応じて別様に得られ
る。
【0045】図13及び図14(A)〜(C)は、重複
する外接矩形があるかどうかを判別し、重複矩形が存在
する場合は、重複がイメージ抽出に影響するかどうかを
判別する図1の処理ステップS504及びS505を説
明する図である。
【0046】即ち、ステップS505では、ブロック選
択により同定されたブロックに重複するものがあるかど
うかが判別される。そのような重複は、各ブロックを定
める2つの座標(即ち、左上の角と右下の角)を他のブ
ロックの対応する座標と比較することにより判別可能で
ある。かくして、図13は、4つのブロック、即ちテキ
ストブロック54、テキストブロック55、テキストブ
ロック56、及び非テキストブロック57を含む任意の
文書のイメージ53を示す。各ブロックについての左上
の角及び右下の角と他のブロックについての対応する座
標との比較により、文書53には重複するブロックがな
いことが示される。したがって、イメージ53中のブロ
ックについては分解は必要でなく、文書53の処理は、
直接イメージデータの抽出(ステップS509)に進む
ことが可能である。
【0047】図14(A)〜(C)は、矩形ブロックに
おける重複がイメージ抽出に影響するかどうかを説明す
る図である。かくして、図14(A)においては、任意
の文書のイメージ60は3つのブロック、即ち、ピクチ
ャブロック61、ピクチャブロック62、及びテキスト
ブロック63を含む。テキストブロック63の左上の角
及び右下の角の座標(即ち、座標(X1,Y1)及び
(X2,Y2))の比較により、テキストブロック63
が非テキストブロック61及び非テキストブロック62
に重複していると判別される。しかし、図14(A)の
状況下では、テキストブロック63がブロック61及び
62に重複しているといっても、テキストブロックがそ
れらに重複している領域には、ブロック61及び62の
イメージデータは存在しない。かくして、重複にも関わ
らず、ブロック63のイメージ抽出は影響を受けず、テ
キストブロック63の分解は必要とされない。他方、非
テキストブロック61及び62のイメージ抽出は、両方
とも、重複により影響される。即ち、ブロック61の矩
形座標に基づいてイメージデータを抽出する場合は、必
要なピクチャデータが抽出されるのみならずブロック6
3から不要なテキストデータ部分も抽出されるであろ
う。したがって、非テキストブロック61及び62の両
方について、ブロック分解がステップS506、S50
7またはS508にしたがって適切な処理として、必要
となる。(ここで、非テキストブロック61及び62は
内部成分を含まないと仮定すると、その場合は、分解処
理はステップS507にしたがって行われるであろ
う)。
【0048】図14(B)は、テキストブロック65及
び非テキストブロック66を含む任意の文書64につい
て、重複がブロック65と66間に存在する状況を示
す。この状況では、図14(A)の状況とは違って、重
複のために、ブロック65または66のいずれについて
もイメージ情報を抽出するのは、同じく他のブロックに
ついての不要なイメージデータを得ることなしには不可
能である。したがって、ブロック65及び66の両方が
ステップS506ないしS508にしたがって分解に付
される。
【0049】図14(A)及び(B)に示される重複
は、編集スタイルによるものであり、グラフィックが単
一のページ上でテキストと混合され、インデントされ位
置決めされたために生じたものである。しかし、重複は
他の原因によるものであり得、したがって、編集スタイ
ルによる重複に厳格に限定されるべきものではない。例
えば、重複は、イメージデータ内のスキュー(斜行)に
よっても発生可能であり、スキューは、意図的なもの
(やはり編集スタイルによる)またはある角度で文書を
走査したことによる非意図的なもののいずれかであり得
る。この状況は、任意の文書67が第1のテキストブロ
ック68及び第2のテキストブロック69を含む図11
Cに示されている。両方のテキストブロックが斜めにな
っており、そのスキューのため、ブロック68と69の
間に重複が形成される。その重複のために、他のブロッ
クからの不要な情報も抽出することなしには一つのブロ
ックからのイメージ情報を抽出できない。したがって、
ブロック68及び69の両方の分解が必要である。
【0050】[重複するテキストブロックの分解]他の
テキストブロックまたは他のイメージタイプのブロック
に重複するテキストをしかるべく抽出するために、抽出
されるべきテキストを含むテキストブロックがより小さ
い非重複の矩形に分解される。ステップS506につい
て上で論じた重複するテキストブロックを分解する工程
は、図15(A)〜(I)、16(A)及び(B)、図
17〜図19、ならびに図20(A)及び(B)を参照
してより詳細に下記で論じる。
【0051】一度重複テキストブロック領域が存在する
と判別され、該重複テキストブロック領域がイメージ抽
出に影響すると判別された場合は、重複状態がどのよう
に存在しているかが、どの領域が直ぐに分解されるべき
か(非重複領域)そしてどの領域がさらに分解を要する
か(重複領域)を判別するために吟味される。図15
(A)〜(I)に示されるように、2つのブロックに重
複が発生する仕方には9通りの例がある。(これらの9
つの例の鏡像及び回転が存在してもよい)。例えば、2
つの矩形が何らかの重複を有する場合、図15(D)に
示す重複状態等のように、その水平及び垂直の縁が完全
にまたは一部重複しているかも知れず、一つの矩形のい
ずれかの縁が、他の矩形の縁内に完全に入っているかも
知れない。
【0052】重複領域に関わる領域は、図15(A)〜
(C)及び15(E)〜(I)の各重複状態に示される
ように、少なくとも2つのそして多くとも4つの矩形に
直ぐに分解可能である。勿論、図15(D)に示すよう
に、2つのブロックが完全に互いに重複する場合があ
る。分解の第1のステップは、重複していない領域を分
解して1以上の非重複矩形に分解することにより刈り込
んで取り去ることである。図15(A)〜(C)及び1
5(E)〜(I)に示すように、非重複領域は非ボール
ド体の輪郭で示されている。例えば、図15(A)に示
されるように、テキストブロック120は、重複しない
第1及び第2の領域に分解可能であり、テキスト領域1
21は、テキストブロック120と重複しない第1及び
第2の領域に分解可能である。その結果、直ぐに分解可
能な4つの非重複領域が得られる。しかし、重複領域1
22の場合は、更なる分解が必要となる。この工程は下
記においてより詳細に論じられるであろう。
【0053】まず、明瞭さのために、分解されるべきテ
キストブロックを「テキストブロック」と呼び、対象物
または該テキストブロックの矩形領域が重複する非テキ
スト領域を「重複対象物」と呼ぶ。この場合に重複対象
物は、テキストブロック、非テキストブロック、または
既に分解された矩形でありうる。重複対象物が分解され
た矩形である場合は、最初の分解処理が、テキストブロ
ックを分解するのに十分であるべきである。重複ブロッ
クがテキストまたは非テキストブロックであれば、分解
の第2のステップが、テキストまたは非テキストブロッ
クの「輪郭ペア」を用いて必要となるであろう。
【0054】さて、図16(A)を参照すると、非テキ
ストブロック131に重複するテキストブロック130
の例が示されている。図15(A)で注意した重複状態
のように、イメージ抽出されるべきテキストが重複領域
132内に存在し、一度非重複ブロックが分解されると
その結果図16(B)に示す重複領域132が得られ
る。重複領域132が次に、より小さい非重複矩形を作
るために更なる分解に付され、テキストブロックが重複
領域からすぐに抽出することが可能となる。
【0055】かくして、重複領域132をさらに分解す
る工程を図17〜図19に示すフローチャートを参照し
て論じる。ステップS1400においては、領域132
内のテキストブロックの全ての連結成分が集められる。
一度、それらが集められてしまうと、各成分が図20
(A)に示すような重複領域に入るように刈り込まれ
る。例えば、図20(A)に示すように、ブロック15
1が刈り込まれ、重複領域内のブロックの部分のみが残
る。即ち、ブロック151について図20(A)に示さ
れたものは、ブロック全体の一部にすぎない。同じこと
が、ブロック152及び非テキストイメージ153の残
余の部分についても当てはまる。
【0056】ステップS1401では、重複領域132
内にある重複非テキスト対象物の全ての輪郭ペアが集め
られ、上述したようにして非重複部分が重複部分から刈
り込まれる。ステップS1402では、連結成分が重複
非テキストイメージ内に入らない矩形の組にグループ化
される。この点については、ステップS1402での連
結成分を非重複矩形の組にグループ化する処理は二つの
異なる方法、即ち方法A及び方法Bによって行うことが
可能である。方法Aにおいては、領域132内のテキス
トブロックの刈り込まれた連結成分がステップS140
4で用いられ、方法Bにおいては、重複テキストブロッ
クの刈り込まれた連結成分から導出される輪郭ペアが用
いられる。方法Aまたは方法Bのいずれかより、テキス
トブロックが非テキストイメージに重複しない矩形にさ
らに分解される。
【0057】かくして、方法Aの分解を用いて、ステッ
プS1405において、テキストブロックが水平なテキ
ストブロックであるかどうか判別される。ステップS1
405において、水平なテキストブロックであると判別
されたときは、フローは、ステップS1407に進み、
そこで、水平方向に沿う全ての連結成分が一緒にグルー
プ化される。一度水平方向の全ての連結成分がグループ
化されると、フローは、ステップS1408に進み、そ
こで、垂直方向に沿う全ての連結成分がグループ化され
る。
【0058】ステップS1409において、重複非テキ
スト対象物の輪郭ペアのいずれとも重複しない重複領域
内の連結成分が残存しているかどうかが判別される。も
し輪郭ペアと重複しない更なる連結成分が存在しないな
らば、ステップS1412において、グループ化処理が
終了する。グループ化された水平方向連結成分及びグル
ープ化された垂直方向連結成分が次いで、組み合われて
4つの非重複矩形154、155、156及び157を
形成する。これらの矩形の座標は、非重複領域内のテキ
ストと同様にして重複領域からテキストを抽出するのに
利用される。しかし、もっと多くの連結成分が存在する
場合は、フローはステップS1407に戻る。
【0059】ステップS1405で、テキストブロック
が水平方向のテキストブロックではない場合は、フロー
は、ステップS1414に進み、そこで連結成分がまず
垂直方向に沿って連結される。一度、それらが垂直方向
に沿って連結されると、フローは、ステップS1415
に進み、その時点で、全ての連結成分が水平方向に沿っ
て一緒にグループ化される。ステップS1409におけ
ると同様に、ステップS1416において、重複非テキ
ストイメージの輪郭ペアのいずれとも重複しない連結成
分が残存しているかどうか判別される。もし重複対象物
の輪郭ペアのいずれとも重複しない成分が残存していな
いと判別された場合は、グループ化処理がステップS1
412で終了する。グループ化された水平方向連結成分
及びグループ化された垂直方向連結成分は、次に、組み
合わされて非重複矩形を形成する。これらの矩形の座標
は、記憶され、非重複領域のテキストと同様に重複領域
からテキストを抽出するのに使用される。重複しない連
結成分が存在する場合は、フローはステップS1414
に戻る。
【0060】図18の連結成分のグループ化の結果、今
や更なる処理のために抽出可能となったブロック化され
た領域が得られる。更なる分解により今度は重複領域内
のテキストデータが直ぐにしかるべき後処理のために抽
出可能となる。
【0061】一方、方法Bが用いられた(ステップS1
406)場合は、ステップS1420で、輪郭ペアが集
めれらた連結成分から導出されるか、即ちテキストブロ
ックの輪郭ペアが図20(B)に示すように重複領域に
入るように刈り込まれる。なお、該グループ化は、テキ
ストブロックの連結成分ではなくて、輪郭ペアにより生
じるため、図20(A)に示されているのとは少し異な
っている。一度輪郭ペアが刈り込まれた連結成分から導
出されると、フローは、ステップS1421に進む。ス
テップS1421では、全ての垂直方向の連結された輪
郭ペアが一緒にグループ化される。ステップS1422
では、一度連結された垂直方向の輪郭ペアの全てが垂直
方向に沿ってグループ化されると、次に水平方向の輪郭
ペアが一緒にグループ化される。ステップS1423で
は、垂直方向及び水平方向グループ輪郭ペアから作られ
た矩形が重複対象物の輪郭ペアのいずれとも重複しない
ような垂直方向又は水平方向の連結輪郭ペアが残存する
かが判別される。もし、ステップS1423において、
残存する連結輪郭ペアが存在しないと判別されると、グ
ループ化処理はステップS1424で終了する。垂直方
向及び水平方向両方のグループ化された連結輪郭ペアは
重複対象物の輪郭ペアのいずれともまた前に分解された
矩形の非グループ化輪郭ペアのいずれとも重複しない矩
形に分解される。
【0062】上述の処理の結果として、重複テキストブ
ロック内のテキストは、さらにテキストブロックの重複
領域をより小さな非重複矩形に分解することにより抽出
することができる。
【0063】[内部コンテンツを含まない非テキストブ
ロックの分解]上記ステップS507で論じた内部コン
テンツを含まない重複非テキストブロックを分解する処
理を図21(A)〜(C)及び図22を参照してさらに
詳細に論じる。
【0064】非テキストブロックの矩形領域がもう一つ
の非テキストブロックと重複する場合は、非テキストブ
ロックの一方をより小さな非重複矩形に分解することが
可能である。より小さな非重複矩形の組によって提供さ
れる情報に基づいて該ブロック内の重複非テキストイメ
ージを直ぐに抽出することが可能である。
【0065】明瞭さのために、分解されるべき非テキス
トブロックを「非テキストブロック」と呼び、該非テキ
ストブロックにより重複されている領域を「重複対象
物」と呼ぶ。
【0066】さて、図21(A)を参照すると、非テキ
ストイメージブロック160及び161が領域162で
重複している。上記において重複テキストブロックにつ
いて論じたように、非重複領域は直ぐに最大4つの非重
複矩形に分解される。非テキストブロック160及び1
61の「輪郭ペア」に基づいて、図22のフローチャー
トに示される処理を用いて、重複領域162、非テキス
トブロック160及び161内のより小さな非重複矩形
の組を作ることが可能である。
【0067】かくして、ステップS1700において、
非テキストブロック160及び重複対象物161の輪郭
ペアを用いて、非重複領域を刈り込んで領域162内に
入るイメージのみが残存するようにする。即ち、図15
(A)を参照して前述したように、矩形120及び12
1が重複領域122から刈り込まれる。同様に、ブロッ
ク123及び124が刈り込まれ、重複領域のみが残さ
れる。
【0068】図21(C)に示されるように、重複非テ
キストブロックが刈り込まれ、分解される。ステップS
1701においては、重複領域162において輪郭ペア
情報が存在するか否かが判別される。輪郭ペア情報が重
複領域に存在しないとステップS1702で判別される
と、さらに分解を行う必要はなく、処理が終了する。し
かし、重複領域162に輪郭ペア情報が存在するとフロ
ーはステップS1703に進む。
【0069】ステップS1703においては、矩形重複
領域(重複領域の境界領域)に接触する全ての輪郭ペア
が非テキストブロック及び重複対象物の両方について集
められる。それらの集められた輪郭ペアは図21(B)
に示す重複領域内に入るように刈り込まれる。
【0070】次に、ステップS1704においては、非
テキストブロック160の刈り込まれた輪郭ペアが集め
られる。ステップS1705では、非テキストブロック
160及び重複ブロック161の重複領域162が、連
結された垂直方向の輪郭ペアをグループ化し、次いで、
垂直方向に沿うグループ化が終了した後で水平方向の輪
郭ペアがグループ化されることにより、分解される。一
度垂直方向の輪郭ペアがグループ化され、水平方向の輪
郭ペアがグループ化されると、重複対象物161の輪郭
ペアのいずれとも重複しないように矩形が形成される。
非テキストブロック160の重複領域162を分解した
結果を図21(C)に示す。
【0071】図21(C)に示すように、非テキストブ
ロック160の重複領域162は2つのより小さい非重
複矩形163及び164に分解されている。
【0072】[内部コンテンツを含む非テキストブロッ
クの分解]ステップS508で説明したように、テキス
トなどの内部コンテンツを含む非テキストブロックを分
解する処理について図23(A)〜(D)及び図24な
らびに図25(A)及び(B)を参照してより詳細に論
じる。
【0073】初めは、フレーム、表、ピクチャ等のブロ
ックには、その矩形領域が、該フレーム、表またはピク
チャ内の白輪郭によって包まれる異なる種類のイメージ
データを包んでいるものがあってもよい。例えば、フロ
ーチャートの場合は、その中にテキスト(アクション)
を含む非テキストイメージ(工程ボックス)があり、し
たがって、イメージは、イメージまたはテキストが、他
を抽出しないでしかるべく抽出され得るように、テキス
トとは別に定められねばならない。
【0074】コンテンツを有するまたは有しない非テキ
ストイメージをしかるべく抽出するために、コンテンツ
を有する非テキストブロックがコンテンツと重複しない
最小数のより小さな外接矩形に分解されねばならない。
それらのより小さな外接矩形から、内容イメージという
よりむしろブロック化されたイメージがしかるべく抽出
可能になる。
【0075】さて図23(A)を参照すると、テキスト
コンテンツを含む非テキストイメージの例が示されてい
る。図23(A)は、非テキストイメージ180〜18
2を含むフローチャートの例である。非テキスト領域1
80、181及び182の各々の内側に、それぞれ3つ
の白輪郭領域186、187及び188があり、各白輪
郭内に、テキストブロック183、184及び185が
ある。
【0076】図23(B)に示される非テキストイメー
ジのみを得るために、非テキストイメージ180、18
1及び182をより小さな外接矩形によって分解できる
ように、非テキストイメージ、白輪郭及びテキストブロ
ックの輪郭ペアが集められる。
【0077】かくして、図23(B)に示すイメージを
しかるべく得るために、下記のステップが図24のフロ
ーチャートに示されたように実行される。
【0078】図23(B)に示されるイメージの分解を
開始するために、非テキストイメージの各行の輪郭ペア
が、該輪郭ペアの一つを白輪郭の輪郭ペアで置き換える
ことにより修正される。例えば、図23(C)に示すよ
うに、行iの輪郭ペアは、白輪郭の対応する行で各行の
輪郭ペアを置き換えることにより修正される。即ち、該
修正に先立って、非テキストイメージ180及び181
の輪郭ペアは、それぞれ(a,b)及び(c,d)であ
り、白輪郭186及び187の輪郭ペアはそれぞれ
(e,f)及び(g,h)である。一度輪郭ペアが、各
行の輪郭ペアを対応する白輪郭の行に置き換えることに
より修正されると、非テキストイメージの輪郭ペアは、
(a,e)、(f,b)、(c,g)及び(h,d)と
なる。
【0079】各行の輪郭ペアを修正した後で、ステップ
S1901において、修正が非テキスト対象物の各輪郭
ペアについて繰り返される。一度輪郭ペアの全ての行の
修正が完了すると、ステップS1903において、修正
された輪郭ペアは、ピクチャそのものがしかるべく抽出
可能となるより小さな外接矩形の組にグループ化され
る。即ち、ステップS1903では、グループ化処理
が、まず垂直方向に連結された輪郭ペアのグループ化が
行われ、次に、垂直方向に沿うグループ化が終了した後
で、水平方向に連結された輪郭ペアの全てのグループ化
が行われる。全体の外接矩形が、テキストブロック18
3、184及び185、他のグループ化されない輪郭ペ
アまたは他の前に形成された矩形等の内部ブロック内容
物の輪郭ペアのいずれとも重複しないように、さらに修
正された輪郭ペアを選択することが不可能になると、グ
ループ化処理は終了する。一度垂直方向に連結された輪
郭ペア及び水平方向に連結された輪郭ペアが全て連結さ
れてしまうと、より小さな外接矩形が、非テキストイメ
ージ180、181及び182の周囲に作られる。得ら
れた分解イメージは図23(D)に示される。その後、
矩形の座標が更なる処理のために記憶され、分解が終了
する。
【0080】図23(D)に示すように、図23(A)
のイメージは、最小11個の外接矩形に分解されてい
る。記憶されたこれらの11個の外接矩形の座標を利用
して、該11個の矩形、180、181及び182の非
テキストイメージがその中のコンテンツを抽出すること
なくしかるべく抽出可能になる。
【0081】図25(A)は、テキストやピクチャデー
タ等の、内部に含まれるブロックからイメージデータを
抽出するためにどのようにフレームイメージが分解でき
るかを示す1例である。図25(B)は、上記の方法を
用いて、テーブルイメージを、テーブルの内容物を抽出
することなく抽出できるようにするために、テーブルを
分解することができる方法を示す1例である。
【0082】図26(A)は、不規則な形状の輪郭19
2内に含まれるテキストブロック191を示す。そのよ
うな状況では、テキストブロックは、非テキスト輪郭用
のブロックに重複しがちである。上述の分解により、テ
キストブロック191を非重複領域191a,191b
及び191cに分解可能であり、その全てが図26
(B)に示されるような輪郭192の白輪郭内にある。
そのような分解により、テキストブロックのイメージデ
ータを抽出するときに、輪郭の不要なイメージデータも
間違って抽出されることが、確実になくなる。
【0083】以上、本発明を特定の態様に関して説明し
たが、本発明は上記記載に限定されることはなく、抽出
されるべき全てのタイプのイメージデータに適用される
ことができるものと理解されるべきものである。更に、
発明の精神及び範囲から逸脱することなく、当業者によ
って種々の変更や修正が可能である。
【図面の簡単な説明】
【図1】重複矩形を分析し分解する方法を示すフローチ
ャートである。
【図2】文書頁の代表的な図である。
【図3】図2にブロック選択処理を行って得られた矩形
ブロックの図である。
【図4】文書頁の代表的な図である。
【図5】図4にブロック選択処理を行って得られた矩形
ブロックの図である。
【図6】本発明を具体化する装置の概観を示す斜視図で
ある。
【図7】図6の装置のブロック図である。
【図8】イメージデータ内の輪郭ペアを得る方法を説明
するフローチャートである。
【図9】輪郭ペアを説明する図である。
【図10】テキストタイプイメージデータの場合に、輪
郭ペアを得る方法を説明する図である。
【図11】内部成分を含まない非テキストイメージデー
タの輪郭ペアを得る方法を説明する図であり(A)は元
のピクチャを示し、(B)は輪郭を結合した後のピクチ
ャを示す。
【図12】(A)及び(B)は、内部成分を含む非テキ
ストイメージデータの場合に輪郭ペアを得る方法を説明
する図であり、(C)及び(D)は、それぞれ4方向及
び8方向輪郭トレース間の相違を説明する図である。
【図13】重複しない外接矩形を示す図である。
【図14】重複輪郭がイメージ抽出に影響を与えるかど
うかを判別するための分析を説明する図である。
【図15】2つのブロックがどのようにして重複可能で
あるかを説明する図である。
【図16】(A)は、非テキストブロックに重複するテ
キストブロックの例を示し、(B)は、(A)に示す重
複領域の刈り込まれたものを示す図である。
【図17】重複テキストブロックをより小さな矩形に分
解する方法を示すフローチャートである。
【図18】図17のフローチャートの続きである。
【図19】図17のフローチャートの続きである。
【図20】それぞれ重複するテキストブロック領域を分
解する二つの方法を示す図である。
【図21】二つの重複非テキストブロックを説明する図
である。
【図22】重複非テキストイメージを分解する方法を示
すフローチャートである。
【図23】内部コンテンツを含む非テキストブロックを
分解する方法を説明する図である。
【図24】内部コンテンツを含む非テキストブロックを
より小さな外接矩形に分解する方法を示すフローチャー
トである。
【図25】(A)分解されたフレーム及び(B)分解さ
れた表の例をそれぞれ示す図である。
【図26】(A)不規則な形状の輪郭に含まれるテキス
トブロック及び(B)その分解後を説明する図である。
【符号の説明】
410 コンピュータ機器 411 ディスク 520 CPU 522 スキャナ・インターフェース

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 テキスト領域と非テキスト領域の両方を
    含むイメージデータを処理するイメージ処理方法であっ
    て、 ブロック選択を行って、前記イメージデータ内のテキス
    トタイプ領域の各ブロックの周囲及び前記イメージデー
    タ内の非テキストタイプ領域の各ブロックの周囲の外接
    矩形を得る工程と、 各テキスト及び非テキストブロックについて輪郭ペアを
    得る工程と、 前記外接矩形が重複するかどうかを判別する工程と、 前記輪郭ペアに基づいて重複矩形を分解する工程と、 非重複矩形については前記外接矩形に基づき、重複矩形
    については分解矩形に基づいて、イメージデータを抽出
    する工程と、 該抽出されたイメージデータを処理する工程とを備えて
    成るイメージ処理方法。
  2. 【請求項2】 前記ブロック選択を行って外接矩形を得
    る工程は、各矩形の左上と右下の角の座標を定める工程
    を含み、前記外接矩形が重複するかどうかを判別する工
    程は、一つの矩形の座標を他の各矩形の座標と比較する
    工程を含むことを特徴とする請求項1記載のイメージ処
    理方法。
  3. 【請求項3】 重複矩形がイメージ抽出に影響するかど
    うかを判別する工程をさらに含み、前記重複矩形を分解
    する工程は、重複がイメージ抽出に影響すると判別され
    た時にのみ行われることを特徴とする請求項1記載のイ
    メージ処理方法。
  4. 【請求項4】 各ブロックにつき輪郭ペアを得る前記工
    程は、複数の互いに排他的なカテゴリのいずれに各ブロ
    ックが属するかを判別する工程と、互いに異なる輪郭ペ
    ア技術のうちから選択された技術であって前記互いに排
    他的なカテゴリのいずれに前記ブロックが属するかに応
    じて決定される技術に基づいて輪郭ペアを得る工程とを
    含んで成ることを特徴とする請求項1記載のイメージ処
    理方法。
  5. 【請求項5】 前記互いに排他的なカテゴリは、テキス
    トカテゴリと、内部成分非含有非テキストカテゴリと、
    内部成分含有非テキストカテゴリとから成ることを特徴
    とする請求項4記載のイメージ処理方法。
  6. 【請求項6】 あるブロックの前記カテゴリがテキスト
    タイプカテゴリである場合は、輪郭ペアは、該ブロック
    のテキスト連結成分の頂部、底部、左側及び右側の縁を
    トレースし、該頂部、底部、左側及び右側の縁を、隙間
    のない輪郭に組み合わせ、該隙間のない輪郭から輪郭ペ
    アを得ることにより得られることを特徴とする請求項4
    記載のイメージ処理方法。
  7. 【請求項7】 あるブロックの前記カテゴリが内部成分
    を含まない非テキストブロックである場合は、輪郭ペア
    は、該ブロック内の各連結成分の輪郭ペアを連結するこ
    とにより得られることを特徴とする請求項4記載のイメ
    ージ処理方法。
  8. 【請求項8】 あるブロックの前記カテゴリが内部成分
    を含む非テキストブロックである場合は、輪郭ペアは、
    内側白輪郭の輪郭ペアを含むことを特徴とする請求項4
    記載のイメージ処理方法。
  9. 【請求項9】 重複する矩形を分解する前記工程は、複
    数の互いに排他的に異なるカテゴリのいずれに前記重複
    する矩形が属するかを判別する工程と、複数の互いに異
    なる分解技術のうちから選択された技術であって、前記
    矩形がいずれのカテゴリに属するかに基づいて選択され
    る技術に基づいて前記重複する矩形を分解する工程とを
    含んで成ることを特徴とする請求項1記載のイメージ処
    理方法。
  10. 【請求項10】 テキスト領域と非テキスト領域の両方
    を含むイメージデータを処理するイメージ処理装置であ
    って、 ブロック選択を行って、前記イメージデータ内のテキス
    トタイプ領域の各ブロックの周囲及び前記イメージデー
    タ内の非テキストタイプ領域の各ブロックの周囲の外接
    矩形を得るブロック選択手段と、 各テキスト及び非テキストブロックについて輪郭ペアを
    得る輪郭ペア作成手段と、 前記外接矩形が重複するかどうかを判別する重複判別手
    段と、 前記輪郭ペアに基づいて重複矩形を分解する分解手段
    と、 非重複矩形については前記外接矩形に基づき、重複矩形
    については分解矩形に基づいて、イメージデータを抽出
    する抽出手段と、 該抽出されたイメージデータを処理するイメージデータ
    処理手段とを備えて成るイメージ処理装置。
JP22183596A 1995-08-11 1996-08-06 イメージ処理方法及び装置 Expired - Fee Related JP3950498B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/514,250 US5774579A (en) 1995-08-11 1995-08-11 Block selection system in which overlapping blocks are decomposed
US08/514,250 1995-08-11

Publications (2)

Publication Number Publication Date
JPH09171557A true JPH09171557A (ja) 1997-06-30
JP3950498B2 JP3950498B2 (ja) 2007-08-01

Family

ID=24046407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22183596A Expired - Fee Related JP3950498B2 (ja) 1995-08-11 1996-08-06 イメージ処理方法及び装置

Country Status (4)

Country Link
US (1) US5774579A (ja)
EP (1) EP0758774B1 (ja)
JP (1) JP3950498B2 (ja)
DE (1) DE69610882T2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006244061A (ja) * 2005-03-02 2006-09-14 Casio Comput Co Ltd データ処理装置、データ処理方法、およびデータ処理プログラム
CN100379239C (zh) * 2003-11-20 2008-04-02 佳能株式会社 用于将图像转换为预定格式的图像处理设备及方法
JP2010224678A (ja) * 2009-03-19 2010-10-07 Fuji Xerox Co Ltd 画像処理装置、情報処理装置、画像読取装置およびプログラム

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100228618B1 (ko) * 1994-05-31 1999-11-01 아끼구사 나오유끼 연결영역의 추출장치 및 방법
JPH10198539A (ja) * 1997-01-08 1998-07-31 Fuji Xerox Co Ltd 画像形成装置および画像形成方法
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images
US6687404B1 (en) * 1997-06-20 2004-02-03 Xerox Corporation Automatic training of layout parameters in a 2D image model
US6298173B1 (en) 1997-10-03 2001-10-02 Matsushita Electric Corporation Of America Storage management system for document image database
JP4100746B2 (ja) * 1998-01-09 2008-06-11 キヤノン株式会社 画像処理装置及び方法
US6014614A (en) * 1998-05-29 2000-01-11 Oracle Corporation Method and mechanism for performing spatial joins
US6327388B1 (en) 1998-08-14 2001-12-04 Matsushita Electric Industrial Co., Ltd. Identification of logos from document images
US7145696B2 (en) * 1998-11-09 2006-12-05 Silverbrook Research Pty Ltd Print data compression method and printer driver
US6711292B2 (en) 1998-12-30 2004-03-23 Canon Kabushiki Kaisha Block selection of table features
US6608930B1 (en) * 1999-08-09 2003-08-19 Koninklijke Philips Electronics N.V. Method and system for analyzing video content using detected text in video frames
US6614930B1 (en) * 1999-01-28 2003-09-02 Koninklijke Philips Electronics N.V. Video stream classifiable symbol isolation method and system
US6496198B1 (en) 1999-05-04 2002-12-17 Canon Kabushiki Kaisha Color editing system
JP4401560B2 (ja) 1999-12-10 2010-01-20 キヤノン株式会社 画像処理装置、画像処理方法、及び記憶媒体
US6718059B1 (en) 1999-12-10 2004-04-06 Canon Kabushiki Kaisha Block selection-based image processing
JP3729017B2 (ja) * 2000-03-27 2005-12-21 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
JP5033277B2 (ja) * 2000-09-12 2012-09-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
US20020178183A1 (en) * 2001-04-10 2002-11-28 Uwe Meding Data extraction method and apparatus
JP2004046632A (ja) * 2002-07-12 2004-02-12 Minolta Co Ltd 画像処理装置
JP4462819B2 (ja) * 2002-09-26 2010-05-12 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US20040240735A1 (en) * 2003-04-29 2004-12-02 Mitchell Medina Intelligent text selection tool and method of operation
US7171618B2 (en) * 2003-07-30 2007-01-30 Xerox Corporation Multi-versioned documents and method for creation and use thereof
US7092552B2 (en) * 2003-07-30 2006-08-15 Xerox Corporation System and method for measuring and quantizing document quality
JP4443443B2 (ja) * 2005-03-04 2010-03-31 富士通株式会社 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法
JP4574503B2 (ja) * 2005-09-09 2010-11-04 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
EP1785847B1 (en) * 2005-10-27 2015-11-18 Accenture Global Services Limited Display apparatus for automatically visualizing an application landscape
US7561722B2 (en) * 2005-12-14 2009-07-14 Xerox Corporation System and method for interactive document layout
US7729546B2 (en) * 2005-12-23 2010-06-01 Lexmark International, Inc. Document segmentation for mixed raster content representation
JP4289420B2 (ja) * 2007-05-10 2009-07-01 セイコーエプソン株式会社 画像処理装置および画像処理方法
US8045800B2 (en) * 2007-06-11 2011-10-25 Microsoft Corporation Active segmentation for groups of images
US8731297B1 (en) * 2007-09-28 2014-05-20 Amazon Technologies, Inc. Processing a digital image of content to remove border artifacts
US8838489B2 (en) 2007-12-27 2014-09-16 Amazon Technologies, Inc. On-demand generating E-book content with advertising
JP4891273B2 (ja) * 2008-01-30 2012-03-07 キヤノン株式会社 画像形成装置及びその制御方法
CN102375988B (zh) * 2010-08-17 2013-12-25 富士通株式会社 文件图像处理方法和设备
AU2010257298B2 (en) * 2010-12-17 2014-01-23 Canon Kabushiki Kaisha Finding text regions from coloured image independent of colours
US9275467B2 (en) * 2012-03-29 2016-03-01 Analog Devices, Inc. Incremental contour-extraction scheme for binary image segments
EP3058512B1 (en) * 2013-10-16 2022-06-01 3M Innovative Properties Company Organizing digital notes on a user interface
US9424668B1 (en) * 2014-08-28 2016-08-23 Google Inc. Session-based character recognition for document reconstruction
US10824788B2 (en) * 2019-02-08 2020-11-03 International Business Machines Corporation Collecting training data from TeX files

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4183013A (en) * 1976-11-29 1980-01-08 Coulter Electronics, Inc. System for extracting shape features from an image
US5235653A (en) * 1984-08-31 1993-08-10 Hitachi, Ltd. Document analysis system
JPS62203280A (ja) * 1986-03-03 1987-09-07 Matsushita Graphic Commun Syst Inc 画像デ−タ処理装置
JPS62204380A (ja) * 1986-03-04 1987-09-09 Matsushita Graphic Commun Syst Inc 画像デ−タ処理装置
JPS63245556A (ja) * 1987-03-31 1988-10-12 Toshiba Corp 図表データ割付け方法
JP2667435B2 (ja) * 1987-05-01 1997-10-27 株式会社リコー 領域抽出方法
JP2695844B2 (ja) * 1988-06-16 1998-01-14 株式会社東芝 文書整形装置
US5287275A (en) * 1988-08-20 1994-02-15 Fujitsu Limited Image recognition apparatus and method for recognizing a pattern within an image
JP2828645B2 (ja) * 1989-01-27 1998-11-25 株式会社リコー マーク領域判定装置
US5228097A (en) * 1989-02-07 1993-07-13 Ezel, Inc. Method for registering image data
US5073962A (en) * 1989-08-18 1991-12-17 International Business Machines Corporation Generalized neighborhoods parameter transform for image features extraction
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
JP2502175B2 (ja) * 1990-08-18 1996-05-29 富士通株式会社 原画像パタ―ンデ―タ再生方法及び装置
JPH04328956A (ja) * 1991-04-26 1992-11-17 Dainippon Screen Mfg Co Ltd 画像デ−タの読出し方法
JP3038051B2 (ja) * 1991-06-28 2000-05-08 日本放送協会 動画像領域抽出装置
JPH0562011A (ja) * 1991-09-03 1993-03-12 Konica Corp 画像処理装置
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
JP2579397B2 (ja) * 1991-12-18 1997-02-05 インターナショナル・ビジネス・マシーンズ・コーポレイション 文書画像のレイアウトモデルを作成する方法及び装置
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
KR100206258B1 (ko) * 1992-04-28 1999-07-01 윤종용 화상추출장치
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US5555556A (en) * 1994-09-30 1996-09-10 Xerox Corporation Method and apparatus for document segmentation by background analysis

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100379239C (zh) * 2003-11-20 2008-04-02 佳能株式会社 用于将图像转换为预定格式的图像处理设备及方法
JP2006244061A (ja) * 2005-03-02 2006-09-14 Casio Comput Co Ltd データ処理装置、データ処理方法、およびデータ処理プログラム
JP4600089B2 (ja) * 2005-03-02 2010-12-15 カシオ計算機株式会社 データ処理装置、およびデータ処理プログラム
JP2010224678A (ja) * 2009-03-19 2010-10-07 Fuji Xerox Co Ltd 画像処理装置、情報処理装置、画像読取装置およびプログラム

Also Published As

Publication number Publication date
EP0758774A2 (en) 1997-02-19
EP0758774A3 (en) 1997-10-01
DE69610882D1 (de) 2000-12-14
JP3950498B2 (ja) 2007-08-01
EP0758774B1 (en) 2000-11-08
US5774579A (en) 1998-06-30
DE69610882T2 (de) 2001-04-05

Similar Documents

Publication Publication Date Title
JP3950498B2 (ja) イメージ処理方法及び装置
JP2536966B2 (ja) テキスト編集システム
US5893127A (en) Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
US6512848B2 (en) Page analysis system
CN102117269B (zh) 对文档进行数字化的装置及方法
US6903751B2 (en) System and method for editing electronic images
US5848186A (en) Feature extraction system for identifying text within a table image
US6173073B1 (en) System for analyzing table images
EP0753833B1 (en) Apparatus and method for extracting articles from a document
EP0690415B1 (en) Editing scanned document images using simple interpretations
JPH0668300A (ja) 文書画像のレイアウトモデルを作成する方法及び装置
US6711292B2 (en) Block selection of table features
US5509092A (en) Method and apparatus for generating information on recognized characters
KR100311083B1 (ko) 문서처리장치
JP4077904B2 (ja) 情報処理装置およびその方法
JP2010123002A (ja) 文書画像レイアウト装置
JP3943614B2 (ja) 文書ページを解析するアプリケーションプログラム生成方法及び装置
US6496198B1 (en) Color editing system
US8533590B2 (en) Information processing apparatus and layout processing method
JPH0612540B2 (ja) 文書作成支援装置
JP4548062B2 (ja) 画像処理装置
Chao Graphics extraction in a PDF document
JP2005165985A (ja) 領域指定機能およびデータ切り出し機能を備えたdtp編集装置
JPH05324628A (ja) 文字読取装置
JP2006093905A (ja) 画像処理装置

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070313

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070410

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070423

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110427

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140427

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees