JPH11259655A - 画像処理方法及び装置 - Google Patents
画像処理方法及び装置Info
- Publication number
- JPH11259655A JPH11259655A JP11000239A JP23999A JPH11259655A JP H11259655 A JPH11259655 A JP H11259655A JP 11000239 A JP11000239 A JP 11000239A JP 23999 A JP23999 A JP 23999A JP H11259655 A JPH11259655 A JP H11259655A
- Authority
- JP
- Japan
- Prior art keywords
- image
- row
- line
- supercell
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
ージの内部特徴を正確に識別し表すためのシステムを提
供する。 【解決手段】 目に見える格子線及び目に見えない格子
線によって定義された行及び列を含み、表セルを含む表
イメージに対するブロック選択方法において、1つ又は
複数の表セルを含むスーパーセルを識別するステップで
あって、表セルの周囲にあり、目に見える格子線によっ
て境界されたトレースされた白色領域に基づいてスーパ
ーセルが識別されるステップ、それぞれの表セルを境界
する垂直及び水平格子線が目に見える格子線であるの
か、又は目に見えない格子線であるのかを判定するステ
ップ、及びそれぞれのスーパーセルを境界する垂直及び
水平格子線が目に見える格子線であるのか、又は目に見
えない格子線であるのかを判定する。
Description
徴を識別して定義する画像処理方法及び装置に関するも
のである。
ージに適用して、その文書イメージの特定の領域に含ま
れるデータの種類を識別するためのものである。この情
報を使用して、特定の領域中のデータを抽出し、この抽
出データに実施する処理の種類を決定する。
ージの中に位置するテキスト領域、又は表セルを、光学
式文字認識(OCR)処理を使用してASCII文字に
変換し、これらを、この表セルの位置に対応する情報と
ともにASCIIファイルに記憶することができる。し
かし従来のシステムは、表セルに対応する行及び列アド
レスを正確に決定することができない。従って、認識し
たASCII文字を、行及び列アドレス・データに基づ
くスプレッドシートに確実に入力することができない。
データが不十分で、ビットマップ表イメージの内部特徴
を適切に再作成することができないことがよくある。例
えばこのようなデータは、解析した表イメージの垂直及
び水平格子線を反映しない。本明細書の定義によれば、
垂直及び水平格子線は表内のそれぞれの行及び列を定義
するものであり、目に見えるものであっても、又は目に
見えないものであってもよい。従って、従来のシステム
を使用してASCIIバージョンのビットマップ表を作
成することはできるが、このASCIIバージョンは、
表格子線を表すデータを含まない。従って、記憶したデ
ータを使用して、表の中の格子線のビットマップ・バー
ジョンを正確に再作成することはできない。更に、表セ
ルの中のテキストを編集したい場合、編集したテキスト
が格子線と交差し、これによって行/列境界を侵害する
かどうかを、従来のシステムが供給する情報に基づいて
判定することは難しい。
子線などのビットマップ表イメージの内部の特徴を正確
に識別し表すためのシステムが求められている。
で、表イメージを含む画像データから、その表を定義す
る行、列、表格子線などの特徴を正確に取り出すことが
できる画像処理方法及び装置を提供することを目的とす
る。
ータを正確に抽出し、スプレッドシート・アプリケーシ
ョンに出力することができる画像処理方法及び装置を提
供することにある。
に基づいて表にセルを簡単に追加することができる画像
処理方法及び装置を提供することにある。
表イメージ中のスーパーセルを識別することで前述の課
題に対処する。スーパーセルは、目に見える表格子線に
よって境界された表イメージの領域であり、1つ又は複
数の表セルを含む。有利には識別したスーパーセルの位
置及び大きさを使用して、表イメージの目に見える格子
線のビットマップ・イメージを復元することができる。
更に、表セルを取り囲むスーパーセルの大きさに参照す
ることによって、表セルのテキストを編集したときに編
集されたテキストが格子線を横切るかどうかを判定する
ことができる。
線及び目に見えない格子線によって定義された行及び列
に配置された表セルから成る表のビットマップ・イメー
ジにブロック選択処理を実行するシステムである。この
システムは、1つ又は複数の表セルを含むスーパーセル
を識別し、スーパーセルは、表セルの周囲にあって目に
見える格子線によって境界されたトレースされた白色領
域に基づいて識別され、それぞれの表セルを境界する垂
直及び水平格子線が目に見える格子線であるのか、又は
目に見えない格子線であるのかを判定し、それぞれのス
ーパーセルを境界する垂直及び水平格子線が目に見える
格子線であるのか、又は目に見えない格子線であるのか
を判定する。
内部特徴を実質的に復元するのに使用できる情報を求め
る。表イメージ全体を正確に表現するため、求めた情報
を更に、ASCIIファイルの中に、又はASCIIフ
ァイルとともに記憶することができる。
テキスト領域を検出し、2)表イメージの中の接続構成
要素を反映するが、検出した前記領域の中の接続構成要
素は反映しない水平ヒストグラムを計算し、3)この水
平ヒストグラムに基づいて表イメージ中の行を定義し、
4)定義した行について、トレースされた白色領域及び
部分格子線の位置に基づいて行を再定義することによっ
て表イメージ中の行を識別する。
これらをスプレッドシートの適当な行に入力することが
できる。
テキスト領域を検出し、2)表イメージの中の接続構成
要素を反映するが、検出した前記領域の中の接続構成要
素は反映しない垂直ヒストグラムを計算し、3)この垂
直ヒストグラムに基づいて表イメージ中の列を定義し、
4)定義した列について、トレースされた白色領域及び
部分格子線の位置に基づいて行を再定義することによっ
て表イメージ中の列を識別する。
ータを正確に抽出し、スプレッドシート・アプリケーシ
ョンに出力することができる。更に、既存の行及び列に
基づいて表にセルを簡単に追加することができる。
理解できるように示したものである。本発明の好ましい
実施形態の以下の詳細な説明を添付図面ととともに参照
すれば、本発明の理解を更に完全なものとすることがで
きよう。
選択ベースの表解析システムを実施する代表的なコンピ
ュータ装置の外観を示す図である。
いる。コンピュータ装置1は、モノクロ又はカラーの表
示モニタ2を備え、これを使用してコンピュータ装置1
はユーザに対してイメージを表示する。コンピュータ装
置1は更に、データ・ファイル及びアプリケーション・
プログラム・ファイルを記憶するための固定ディスク・
ドライブ3、テキスト・データを入力したり表示画面2
上のオブジェクトを操作したりするためのキーボード
5、及び表示画面2上のオブジェクトを指したり操作し
たりするためのマウスなどのポインティング・デバイス
6を備える。
ピー・ディスクに読取り及び書込みを行なうためのフロ
ッピー・ディスク・ドライブ4を含む。表イメージを含
む文書イメージ・ファイル及びコンピュータで実行可能
な本発明の実施の形態を具現化する処理ステップ等は、
固定ディスク3に記憶してもよいし、又はフロッピー・
ディスク・ドライブ4に挿入されたフロッピー・ディス
クに記憶してもよい。或は、文書イメージ・ファイル及
び/又はコンピュータで実行可能な処理ステップをCD
−ROMドライブ(図示せず)を介してアクセスしたC
D−ROMから獲得してもよい。
リア・ネットワークとインタフェースするためのネット
ワーク・インタフェース10、及びファクシミリ・メッ
セージ及びその他のデータ・ファイルを送受するための
ファクシミリ/モデム・インタフェース11を備える。
文書イメージ・ファイル及びコンピュータで実行可能な
本発明を具現化する処理ステップには、ネットワーク・
インタフェース10を介してネットワーク上でアクセス
されてもよい。更に、ファクシミリ/モデム・インタフ
ェース11を使用して、イメージ及び/又はコンピュー
タで実行可能な処理ステップをワールド・ワイド・ウェ
ブ(以後WWWと称する)から取り出すこともできる。
態に基づくブロック選択アプリケーションを含むアプリ
ケーションは、フロッピー・ディスク、CD−ROM、
ネットワーク・ドライブ、WWWなどのコンピュータ可
読媒体からダウンロードしてディスク3に記憶するのが
最も一般的である。
イメージ・データをコンピュータ装置1に供給するスキ
ャナ7から文書イメージを入力してもよい。ビットマッ
プ表イメージ・データを含むビットマップ・イメージ・
データを固定ディスク3に記憶するときには圧縮フォー
マットで記憶してもよいし非圧縮フォーマットで記憶し
てもよい。
書イメージを出力するためにプリンタ9が提供される。
・システムの制御下で、本発明の実施の形態に基づくブ
ロック選択アプリケーションなどが記憶されたアプリケ
ーション・プログラムは選択的に起動され、記憶データ
を処理及び操作する。オペレータの命令及び記憶された
アプリケーション・プログラムに基づいて、スクリーン
2にイメージを表示するためのコマンド、及びプリンタ
9を使用して表示されたイメージを印刷するためのコマ
ンドが発行される。
示す詳細ブロック図である。図2に示すように、コンピ
ュータ装置1は、プログラムされたマイクロプロセッサ
などの、コンピュータ・バス21にインタフェースされ
た中央処理装置(CPU)20を含む。コンピュータ・
バス21には更に、スキャナ・インタフェース22、プ
リンタ・インタフェース23、ネットワーク・インタフ
ェース24、ファックス/モデム・インタフェース2
6、ディスプレイ・インタフェース27、キーボード・
インタフェース28、及びマウス・インタフェース29
がインタフェースされる。
うに、ランダム・アクセス・メモリ(RAM)などのメ
イン・メモリ30が、コンピュータ・バス21にインタ
フェースされる。具体的には、ディスク3に記憶されて
いるようなコンピュータで実行可能な処理ステップを実
行するときに、CPU20はそれらのステップを、ディ
スク3又はその他の記憶媒体からメイン・メモリ30に
ロードし、メイン・メモリ30から、これらの処理ステ
ップを実行する。
は、ブートアップの際に使用する処理ステップなどのコ
ンピュータが実行可能な処理ステップ、又は例えばキー
ボード5の動作用の基本入出力システム(BIOS)シ
ーケンスを記憶するのに使用される。
ック選択処理の方法を説明するフローチャートである。
図3に示した処理ステップは、ディスク3などのコンピ
ュータ可読媒体に記憶されたブロック選択アプリケーシ
ョンに基づいてCPU20によって実行されることが好
ましい。
イメージを入力し、その文書イメージの中の接続した構
成要素を検出し、テキスト接続構成要素と非テキスト接
続構成要素とを分離し、非テキスト接続構成要素を分類
し、非テキスト構成要素の縁に沿った白色領域を識別
し、テキスト・ブロック及びテキスト行を作成し、入力
イメージのスキューを検出し、入力イメージを後処理す
るのに使用される。
テキスト領域、即ち、周囲を黒色画素で取り囲まれた白
色画素によってテキストが構成されるテキスト領域を識
別し、付属するテキスト接続構成要素を識別し、表セル
のアドレス、ならびに表中の目に見える垂直及び/又は
水平格子線によって境界された表領域の中にあって、少
なくとも1つの表セルを含む領域であるスーパーセルの
アドレスを作成、計算し、目に見えるセル境界の存在を
調べ、本実施の形態に基づいて、表格子線の位置を決定
するのにも使用されることに留意されたい。この点に関
し、表中の格子線は、その表の中で識別されたそれぞれ
の行及び列を定義するものであり、目に見える格子線又
は目に見えない格子線である。
301では、文書イメージのビットマップ画素データを
コンピュータ・システム1に入力し、これをディスク3
に記憶する。この画素データが2値画素データ、即ち、
白黒のイメージ・データであることが好ましい。しか
し、イメージ・データが、いくつかのグレースケール・
レベルのうちの1つで画素が表されるハーフトーン・イ
メージ・データである場合、又は画素データが、画素の
カラー・データを符号化したマルチビット・ワードによ
ってそれぞれの画素が表されるカラー・イメージ・デー
タである場合には、非2値画素データを2値画素データ
に2値化するために閾値処理を実行しなければならな
い。
実施してもよいことに留意されたい。このようなイメー
ジの縮小は後続の処理の速度を向上させるが、光学式文
字認識などの特徴を集中的な処理に悪影響を及ぼすこと
もある。
タを解析し、文書イメージの中の接続構成要素を検出す
る。接続構成要素とは、白色画素に完全に囲まれた一群
の黒色画素である。検出した接続構成要素には、それぞ
れの接続構成要素についてその接続構成要素を境界する
最も小さな長方形を定義する長方形化、即ち、「ブロッ
ク化」を実施する。
テキスト接続構成要素と非テキスト接続構成要素に大ま
かに分類する。この分類は、接続構成要素を境界する長
方形のサイズに基づき、更に非テキスト接続構成要素が
テキスト接続構成要素よりも通常は大きいことに基づい
て実施される。
で非テキスト接続構成要素として分類された接続構成要
素を更に解析して、それらが、ライン、ジョイント・ラ
イン、ピクチャ、ライン・アート、フレーム、表、不明
(即ち前記以外)のいずれであるかを判定する。
キスト接続構成要素を解析する方法を説明する流れ図で
ある。
分類は、全般的に基準閾値(しきい値)に基づく。基準
閾値は数式化されており、解析する接続構成要素の大き
さ、幅などに基づいて動的に計算される。ステップS4
01では非テキスト接続構成要素を解析して、それがハ
ーフトーン(連続階調)ピクチャであるかどうかを判定
する。そうである場合にはステップS402に進み、
「ハーフトーン(連続階調)ピクチャ」副属性をその非
テキスト接続構成要素に割り当てる。
要素がハーフトーン・ピクチャでないと判定された場合
にはステップS404に進み、その非テキスト接続構成
要素がフレームであるかどうかを判定する。そうである
場合にはステップS405に進み、「フレーム」副属性
をその非テキスト接続構成要素に割り当てる。ステップ
S404でそうではないと判定された場合にはステップ
S406に進み、非テキスト接続構成要素が水平線又は
垂直線であるかどうかを判定する。接続構成要素が水平
線又は垂直線であると判定された場合にはステップS4
07に進む。ステップS407では、「水平線」又は
「垂直線」副属性をこの非テキスト接続構成要素に割り
当てる。
で、非テキスト接続構成要素が水平線でも垂直線でもな
いと判定された場合に実行される。ステップS409で
は、非テキスト接続構成要素が表であるかどうかを判定
する。簡単に言うと、非テキスト接続構成要素が表であ
るかどうかを判定するためには、接続構成要素の内部白
色領域を4方向にトレースする。内部白色領域とは、黒
色画素に完全に囲まれた白色画素の領域である。4つの
内部白色領域が見つかり、かつこれらの白色領域が水平
線及び垂直線によって閉じられているなど、これらの白
色領域の配置が表に類似の格子形である場合には、ステ
ップS410で、この非テキスト接続構成要素を表とし
て指定する。
スト接続構成要素を識別し分類するために、ステップS
410では更に、識別した表の内部をステップS302
及びS304に基づいて再解析する。
素が表ではないと判定された場合にはステップS412
に進み、非テキスト接続構成要素が斜線であるかどうか
を判定する。そうである場合にはステップS414で
「斜線」副属性を非テキスト接続構成要素に割り当て
る。
れた場合にはステップS415に進み、非テキスト接続
構成要素が、ライン・アート(line-art)・ピクチャ、
又はジョイント・ラインであるかどうかを判定する。非
テキスト接続構成要素がライン・アート・ピクチャでも
ジョイント・ラインでもない場合にはステップS416
に進み、「不明」属性を、この接続構成要素に割り当て
る。ライン・アート・ピクチャ又はジョイント・ライン
である場合にはステップS417に進み、非テキスト接
続構成要素がジョイント・ラインであるかどうかを判定
する。
インでない場合にはステップS419で、この非テキス
ト接続構成要素をライン・アート・ピクチャに指定す
る。ステップS417で、非テキスト接続構成要素がジ
ョイント・ライン・ピクチャであると判定された場合に
はステップS420に進み、「ジョイント・ライン」副
属性をこの構成要素に割り当てる。次いでステップS4
21に進む。
S410、S414、S416、S419からもステッ
プS421に進むことに留意されたい。このステップで
は、分類すべき非テキスト接続構成要素が残っているか
どうかを判定する。そうである場合にはステップS40
1に戻る。そうでなければ図3のステップS306に進
む。
成要素の縁に沿った目に見えない線を識別する。ステッ
プS306では例えば、目に見えない垂直線、即ち垂直
の白色画素の領域は2つのハーフトーン・ピクチャ接続
構成要素間に位置することがある。この目に見えない線
をステップS308で使用して、これらのピクチャ接続
構成要素の下に位置する複数のテキスト接続構成要素を
一緒にすべきか、又は別個の列ブロックに入れるべきか
を判定することができる。
進み、表領域の中の反転領域を識別する。反転領域は、
周囲を黒色画素に囲まれた白色画素から構成されたテキ
ストを含む領域である。本実施の形態に基づく後続の処
理では、その他の表の特徴の識別を妨害しないように表
領域の中の反転領域を無視する。反転領域の識別の詳細
については図6及び7に関して後で説明する。
水平及び垂直格子線に付属する接続構成要素を識別す
る。付属する接続構成要素の識別及び抽出については概
要を図8に関して後に説明する。こうして識別された付
属構成要素は、本発明の実施の形態に基づく表中のその
他の特徴の識別に使用される。
S304で分類したテキスト接続構成要素からテキスト
・ブロックを形成する。この点に関し、それぞれのテキ
スト接続構成要素の水平方向及び垂直方向に隣接したテ
キスト接続構成要素を、隣接したテキスト単位間の水平
及び垂直間隔の統計解析に基づいてテキスト・ブロック
にまとめる。次に、形成したテキスト・ブロックを解析
してテキスト行を形成する。
定された非テキスト接続構成要素を解析するための本発
明の実施の形態に基づく処理ステップを実行する。より
詳細には、表の中の行及び列を識別し、行及び列アドレ
スを表中のそれぞれの表セルに割り当てる。行及び列ア
ドレスの識別及び割当てについては図9ないし図14に
関して後に詳細に説明する。
水平格子線の位置を計算する。これらの格子線は、識別
された行及び列を定義するものであり、目に見える格子
線及び目に見えない格子線がある。格子線計算について
は図15及び16に関して後に説明する。
子線(即ち、連続する目に見える画素により構成される
線)によって境界され、少なくとも1つの表セルを含む
表領域に基づいてスーパーセルを定義する。行及び列ア
ドレスをスーパーセルに割り当て、それぞれのスーパー
セルを取り囲む目に見える格子線の境界を識別する。ス
ーパーセルの作成及び目に見える境界の識別については
図17及び18に関して後に説明する。
ジのスキューを検出し、スキューの角度が予め定めた最
大角度を超えた場合にはエラー・コードを出力して、文
書ページのスキューが大きすぎてブロック選択処理を遂
行することができないことをユーザに知らせる。
ップS311に進み、後処理を実行する。この後処理
は、文書イメージのブロック表現をよりコンパクトで
「クリーン」なものにするためのものであり、文字認
識、データ圧縮などの後段の特定の処理に適合するよう
に変更することができる。一般に後処理は、テキスト・
ブロックをその他のテキスト又は非テキスト・ブロック
と関連させることを含む。
めたページ・スキューによって決定すると有利である。
例えば、ページのスキューがわずかである場合にはテキ
スト・ブロック間のギャップははっきりしている。従っ
てブロックは積極的に結合される。一方、スキューが大
きいページでは境界する長方形がいくつかのテキスト領
域にかかりやすく、そのために長方形は消極的に結合さ
れる。後処理が終わるとブロック選択は終了となる。
メージ中のデータの位置及び種類の詳細表現が得られ
る。その結果、図3の処理ステップを光学式文字認識シ
ステムとともに使用して、表の中のビットマップ・イメ
ージ・データで表された文字を認識し、これらの文字を
ASCII形式に変換し、表の決定された行及び列アド
レスに基づいて、これらのASCII文字を表計算プロ
グラムに入力することができる。更に図3の処理によっ
て、表格子線などの表の内部特徴を実質的に再現するの
に必要な情報を得ることができる。
徴の解析に特に注意を払ってより詳細に説明した流れ図
である。この点に関し、ステップS501及びS502
は、図3のステップS301、S302、S304、S
305に対応する。具体的にはステップS501で文書
イメージを入力し、ステップS502で、文書イメージ
の中の接続構成要素を検出しブロック化する。
及びS305に関して先に述べたとおり、表及び表の中
のテキスト・ブロックを識別する。次にステップS50
4で、後段のテキスト・ブロック形成に使用する表の縁
に沿った目に見えない線を識別する。
S505で識別される。周囲を黒色画素に囲まれた白色
画素から構成されたテキストを含む領域である反転領域
は前述のとおり、本実施の形態に基づく後続の表処理中
には無視される領域である。図6(a)に、表40の中
にある反転領域42を示す。領域42の内部の斜線は黒
色画素の領域を表し、領域42の中に語「TITLE」
が形成されるように配置されている。図6(a)には更
に、先のステップS409に関して説明した表40の識
別の際に利用される白色領域が破線で示されている。
ステップS701から始まり、このステップでは、表中
のそれぞれの画素行の中の白色境界対がまたぐ距離の合
計を表す水平ヒストグラムを計算する。この点に関し、
境界対とは、白色領域境界(図6(a)の破線)と特定
の画素行との交点によって決定される座標位置である。
図6(b)に、ステップS701から得られた表40に
対応するヒストグラム44を示す。
S702では、表40の大きさ及びヒストグラム44に
反映されたデータを使用して表40の最上部から始めて
それぞれの画素行を解析し、表中の画素行の中の白色境
界対間の距離の合計がその画素行がまたぐ合計距離の1
/2よりも小さいかどうかを判定する。Nを閾値とし
て、連続的に解析したN行の画素行について前述の条件
が満たされた場合にはステップS704に進む。
も大きく、従ってフローはステップS704に進む。こ
のような行が連続するN行がない場合には図5のステッ
プS506に進む。
で識別したN行の行の中のトレースされた白色領域を識
別する。これらの領域は、領域42の中に形成されたそ
れぞれの文字の内部に対応する。次にステップS706
で、識別されたそれぞれの白色領域のサイズを閾値サイ
ズと比較する。この閾値サイズは、テキスト文字又は小
さなイメージ・ノイズが、より大きな特徴から区別され
るように定義されることが好ましい。識別した白色領域
のサイズが閾値サイズよりも小さい場合にはステップS
707で、後続の表処理の際に、その白色領域を無視す
べきであると判定される。その結果この白色領域は、対
象表の中の白色領域を利用する後続の処理では考慮され
ない。次いでステップS709に進む。
サイズが閾値サイズに等しいか、又はこれより大きい場
合には、その白色領域は反転テキストに対応するもので
はないと判定され、フローはステップS709に進む。
で識別した全ての白色領域を閾値サイズと比較したかど
うかを判定する。そうでない場合にはステップS706
に戻り、前述のとおりのステップをたどる。そうである
場合にはステップS710に進む。
行を解析したかどうかを判定する。そうでない場合には
ステップS702に戻る。表40の全ての行を解析した
場合にはステップS506に進む。
付着した接続構成要素を識別して抽出する。
える表格子線で囲まれた表50を示す。この表領域50
の中には、目に見えるその他の表格子線があり、黒色画
素に完全に囲まれたそれぞれの白色領域が破線で示され
ている。図8に示す通り、いくつかの目に見える格子線
はギャップを含む。このようなギャップは、不完全な印
刷、不完全な走査などに起因してしばしば生じる。これ
らのギャップは、付属した接続構成要素とも呼ぶ部分格
子線51、52及び53を定義する。トレースされた白
色領域54の点56と58が接近しているため接続構成
要素52が抽出される。即ち、接続構成要素52は、表
領域50の垂直及び水平格子線とは別個の接続構成要素
として識別される。接続構成要素51及び53も同様に
抽出される。抽出された付属する接続構成要素の使用に
ついては後に詳細に説明する。
プS308に関して説明したのと同様に、入力文書イメ
ージの中のそれぞれの表の外部に位置する接続構成要素
に基づいて、テキスト・ブロック及びテキスト行を形成
する。同様に、ステップS509では、それぞれの表の
内部に位置するテキスト接続構成要素に基づいてテキス
ト・ブロック及びテキスト行を形成する。ステップS5
07では、テキスト・ブロックを調べてテキスト・ブロ
ックの向きが垂直なのか、又は水平なのかを判定し、こ
の判定に基づいてテキスト行を形成するのが好ましい。
一方、ステップS509では水平テキスト行のみを形成
することが好ましい。
以後、表セルと称する。この点に関しては前述のとお
り、表ブロックの中のその他のテキスト接続構成要素と
結合していないテキスト接続構成要素も本明細書では表
セルと呼ぶ。次にステップS510では、表の列を計算
し列アドレスを表セルに割り当てる。
プロセスを説明するための詳細フローチャートである。
図9A及び図9Bのフローチャートでは、表列を識別す
るのに表の垂直ヒストグラムを利用し、適正な列識別を
混乱させる可能性がある表題の領域を都合よく無視す
る。
表が5行以上のテキスト行を含むかどうかを判定する。
そうである場合には最上位のテキスト行を表題行である
とみなし、列識別時にはこれを無視する。
テップS901で5行以上のテキスト行を含むと判定さ
れる。これに従ってステップS902に進む。ステップ
S902では、図10(b)の垂直ヒストグラム70の
ような垂直ヒストグラムを計算する。垂直ヒストグラム
70を計算するときには前述のとおり、表題とみなす最
上位のテキスト行61は無視する。ステップS901で
そうではないと判定された場合には直接にステップS9
04に進み、対象表のテキスト行を一切無視せずに垂直
ヒストグラムを計算する。
は、表60のそれぞれの画素列について、ステップS3
02及びS502に関して説明した表60の中のそれぞ
れの接続構成要素を境界する長方形(図示せず)がまた
ぐ垂直距離の合計を反映することに留意されたい。例え
ば、格子線64及び66などの水平及び垂直格子線は境
界する長方形によってブロック化されず、従って垂直ヒ
ストグラム70に反映されるデータには寄与しない。し
かし、ステップS506で識別され抽出された接続構成
要素は「ブロック化」され、従ってステップS904又
はステップS902に基づいて計算されるヒストグラム
に反映されることに留意されたい。例えば、付属する接
続構成要素68はヒストグラム70の部分71に反映さ
れる。
ラムの黒色画素が少ないことを反映した部分の距離P_
gap、P_gapの直後の、ヒストグラムの画素が比
較的多いことを反映した部分W、及びWの直後の、ヒス
トグラムの画素が少ないことを反映した部分N_gap
を、ヒストグラム70の左端の点を始点として計算す
る。例えば、P_gap、W及びN_gapは当初、ヒ
ストグラム70の領域72、74及び75にそれぞれ対
応する。次いで、それぞれのP_gap、W及びN_g
apの位置及び大きさに基づいて列を割り当てる。
に示す)に従って表を左から右に解析する。この点に関
し、ステップS906ないしS916では、現在のWに
対応する表領域を現在の列に含めるべきか、又は現在の
Wを含む新規の列を定義すべきか、又は現在のWを無視
して新規の列を定義すべきかを判定する。
りも大きいかどうかを判定する。閾値は、小さなサイズ
のテキスト文字を反映したものであることが好ましい。
Wが閾値よりも大きい場合にはステップS907に進
み、P_gapが幅狭いかどうかを判定する。P_ga
pが幅広い場合にはステップS917に進み、Wを含む
新規の列を定義する。このWとP_gapの構成を図1
1(a)に示す。
判定された場合にはステップS909に進み、現在の列
の定義を延長してWを含める。この状況を図11(b)
に示す。次いでステップS905に戻る。
又はこれより小さいと判定された場合にはステップS9
10に進み、P_gapが幅広いかどうかを判定する。
そうである場合にはステップS911に進み、Wが、表
50の接続構成要素52のような切断された接続構成要
素を反映したものであるかどうかを判定する。Wが、切
断接続構成要素を反映したものではない場合にはステッ
プS917に進み、Wを含む新規の列を定義する。図1
1(c)はこの状況を反映したものである。
に示すような切断接続構成要素を反映したものであると
判定された場合には、現在の列の右端の境界を、P_g
apの左端のところで定義し、ステップS905に戻っ
て、新規のP_gap、W及びN_gapを定義する。
従って、ヒストグラムに反映されたこの切断接続構成要
素は定義されたどの列にも含まれない。
狭いと判定された場合にはステップS912に進む。ス
テップS912ではN_gapが幅広いかどうかを判定
する。そうでない場合にはステップS914に進み、現
在の列が対象表の最初の列であるかどうかを判定する。
そうである場合には先に説明したステップS917に進
む。このような状況が図11(e)に反映されている。
この状況では、現在の列がN_gapの始点で終わるよ
うに定義される。
最初の列ではないと判定された場合にはステップS91
5に進み、現在の列を延長してWを含める。このような
状況を図11(f)に示す。フローはステップS905
に戻る。
と判定された場合にはステップS916に進み、Wが、
切断接続構成要素を反映したものであるかどうかを判定
する。そうでない場合にはステップS915に進み、図
11(g)に示すWを現在の列に含める。ステップS9
16でそうであると判定された場合には、現在の列の右
端境界をP_gapの左端のところで定義し、ステップ
S905に戻って切断接続構成要素を無視する。この状
況を図11(h)に示す。
ステップS918に進む。この時点で、対象表を反映す
るヒストグラムの右端の部分に到達した場合にはステッ
プS920に進む。そうでない場合にはステップS90
5に戻る。
表の中にいくつかの列が定義されている。これらの列に
左から右に順番にアドレスを指定し、これらを、左右の
X座標境界に基づいて定義する。この点に関し図12
(a)及び図12(b)に、表76ならびに対応する列
の定義A及びBを示す。図12(b)に示すように、表
セル79があるために列Aは、2つの別個の列に分割し
なければならない状況にある。ステップS920及びS
921は、この状況に対処するためのものである。
域の左右の境界及び切断垂直格子線を調べて、定義され
た列境界の近くにこれらの特徴があるかどうかを判定す
る。そうである場合にはステップS922に進む。検出
された白色境界又は切断格子線が列境界の近くにない場
合にはステップS921に進み、白色境界又は切断格子
線を囲む新規の列を定義する。これに応じて全ての列ア
ドレスを更新する。
した後の表76の列定義を示す。白色領域78の右境界
は定義された列の境界とは離れているので、領域78の
右境界に隣接して新規の列Bを定義する。これに応じて
以前の列Bのアドレスは列Cに更新される。
列位置に対応する列アドレスをそれぞれの表セルに割り
当てる。場合によっては、割り当てられた列アドレスが
列アドレス範囲を含むことがある。例えば表セル77に
は列アドレスAが割り当てられるが、表セル79には列
アドレスA〜Bが割り当てられる。次いでステップS9
22からステップS511に進み、表の行を計算して、
表セルに行アドレスを割り当てる。
セルに割り当てるためにステップS511で実行する処
理ステップを説明する詳細フローチャートである。フロ
ーはステップS1301から始まり、このステップで、
対象表の水平ヒストグラムを作成する。図14(a)
(b)に、対象表80及びステップS1301に基づい
て作成した水平ヒストグラム86を示す。水平ヒストグ
ラム86は、表80のそれぞれの画素行について、表8
0の中のそれぞれの接続構成要素を境界する長方形(図
示せず)がまたぐ水平距離を反映する。
幅pw1は表セル81及び82を、ピーク幅pw2は表
セル83を、ピーク幅pw3は表セル84をそれぞれ反
映する。谷幅vw1は、ピーク幅pw1とピーク幅pw
2の間の領域を指し、谷幅vw2は、ピーク幅pw2と
ピーク幅pw3の間の領域を指す。
6の最上位のピークを最初に調べる。具体的には、現在
行の最初のピーク幅pwが第1の閾値よりも大きいかど
うか、及び次の谷幅vwが第2の閾値よりも大きいかど
うかを判定する。第1の閾値は最小文字サイズを示すこ
とが好ましく、第2の閾値は最小行間隔を示すことが好
ましい。両方の条件を満たしている場合にはステップS
1304に進み、次に遭遇するピークに対応する新規の
行を定義する。ステップS1302で条件の1つを満た
していない場合にはステップS1305に進み、現在行
を延長して次に遭遇するピークを含める。いずれの場合
にもフローはステップS1304及びステップS130
5からステップS1306に進む。
ムのピークが他に存在するかどうかを判定する。そうで
ある場合にはステップS1302に戻る。そうでなけれ
ばステップS1307に進む。
平な白色領域境界及び付属する水平格子線を識別する。
先に説明したステップS920ないしステップS922
と同様に、識別した白色境界又は格子線の近くに行境界
がない場合には新規の行を定義し、これに応じて行アド
レスを更新する。次いでステップS512に進む。
平格子線の位置を計算する。図15は、ステップS51
2の処理ステップを詳細に説明するフローチャートであ
る。このフローはステップS1501から始まり、この
ステップS1501で、現在列及び隣接する列がそれぞ
れ、対応するトレースした白色領域に囲まれているかど
うかを判定する。そうである場合にはステップS150
2に進む。ステップS1502では、対応する白色領域
間の距離を求める。次にステップS1504で、ステッ
プS1502で求めた距離が閾値距離に等しいか又はこ
れよりも大きいと判定された場合にはステップS150
5に進み、垂直格子線の座標を計算する。ステップS1
504で、前記距離が閾値距離よりも小さいと判定され
た場合にはステップS1506に進み、垂直格子線の座
標を計算する。このときには、ステップS1505で使
用する式とは異なる式に基づいて計算することが望まし
い。
する白色領域が存在しないと判定された場合にはステッ
プS1510に進み、ステップS1505及びステップ
S1506で使用する式とは異なる式を使用して垂直格
子線の座標を計算する。次いでステップS1511に進
み、列が他に存在するかどうかを判定する。そうである
場合にはステップS1501に戻る。そうでなければス
テップS1512に進む。
線を、ステップS1501ないしS1511で説明した
のと実質的に同じステップを使用して計算する。ただし
これらは90゜回転されている。
説明するための2つの対象表を示す図である。
座標C1L及びC1Rを境界とする列C1、及びX座標
C2L及びC2Rを境界とする列C2を含む。トレース
された白色領域91は列C1に対応し、境界b1を含
み、トレースされた白色領域92は列C2に対応し、境
界b2を含む。
接する列C1及びC2に対応する白色領域がそれぞれ存
在するかどうかを判定する。ステップS1502では、
b1とb2の間の距離を求める。領域91及び92が、
共通のX座標を共有する領域を含む場合、例えば傾斜し
た垂直線が領域91と領域92を分離している場合に
は、境界b1を、領域91の右端のX座標として定義
し、境界b2を、領域92の左端のX座標として定義す
る。
距離が大きいと判定された場合にはステップS1505
に進む。好ましい本実施の形態では、ステップS150
5で、列C1と列C2の間の垂直格子線の座標位置を、
式min(max(T,C1R),C2L)で求める。
ただし、この式でT=max(b1,b2)−1であ
る。
距離が小さいと判定された場合にはステップS1506
に進み、min〔max((b1+b2)/2,C1
R),C2L〕に存在する垂直格子線の座標を計算す
る。
びC3Rによって境界され、列C4が、座標C4L及び
C4Rによって境界された表95を示す。列C3は一方
の側しか目に見える格子線で境界されていないので、列
C3に対応する白色領域は存在しないことを理解された
い。従って、図15で説明した処理ステップを使用し
て、列C3及び列C4を隣接する列として調べると、ス
テップS1501の判定はノー(NO)となり、フローはス
テップS1510に進む。ステップS1510では、列
C3及び列C4に対応する垂直格子線の位置を、式mi
n(T,C4L)で求める。この式でT=max(C3
R,b4)−1である。
実行した後ステップS514に進み、スーパーセルを識
別する。図17は、ステップS514に基づくスーパー
セルの識別を説明するための詳細フローチャートであ
る。この点に関してはステップS1701で、対象表の
中の黒色画素によって境界されたそれぞれの白色領域に
対応したスーパーセルを識別する。トレースされた白色
領域に囲まれていない表セルが存在する場合には、ステ
ップS1701で、その表セルと同じ位置及び大きさを
有する「模造(artificial)」スーパーセルも形成す
る。次にステップS1702で、それぞれの模造スーパ
ーセルを再フォーマットして、周囲の目に見える表格子
線又は目に見えない表格子線の大きさに近づける。次い
でステップS1704に進む。
パーセルの上下左右の境界を調べ、目に見える格子線が
これらの境界に隣接しているかどうかを判定する。ステ
ップS1705に進み、ステップS510及びS511
で計算した行及び列に基づいてスーパーセルに行アドレ
ス及び列アドレスを割り当てる。ステップS1705か
らステップS515に進む。
説明するための対象表を示す図である。この点に関し
て、表100は、表セル101、102、104及び1
05を含む。表セル101は白色領域に囲まれていな
い。これは表セル101が、黒色画素に完全に囲まれた
領域の中に入っていないためである。しかし、表セル1
02、104及び105は白色領域106、107及び
109に囲まれている。
1701で、表100の中のそれぞれの白色領域に対応
するスーパーセルを最初に定義する。これに応じて、白
色領域106、107及び109に対応するスーパーセ
ルを定義する。これらのスーパーセル115、111及
び112を図18(b)に示す。前述のとおり表セル1
01にはこれを取り囲む白色領域がないので、表セル1
01と同一の座標を有する模造スーパーセルを定義す
る。
ルを以下のアルゴリズムに従って再フォーマットし、模
造スーパーセルを取り囲んでいる目に見える表格子線又
は目に見えない表格子線に近づける。
p),テキスト・セル上端(text_cell_top)) 下境界=max(下格子線(grid_line_bottom),テキス
ト・セル下端(text_cell_bottom)); 左境界=min(左格子線(grid_line_left),テキスト
・セル左端(text_cell_left)) 右境界=max(右格子線(grid_line_right),テキス
ト・セル右端(text_cell_right)) この結果生じるスーパーセル114を図18(b)に示
す。
ーパーセルを調べ、スーパーセルの境界である目に見え
る格子線を識別する。例えば、スーパーセル114の右
及び下、スーパーセル115の上、右、左及び下、スー
パーセル112の上、右、左及び下、ならびに、スーパ
ーセル111の上、右、左及び下の目に見える格子線を
識別する。
ーセルの特定の側面の境界となっている場合には、ステ
ップS1704で、その部分格子線が、「完全」境界の
長さに対応する閾値長さよりも長いかどうかを判定する
ことに留意されたい。そうである場合にはステップS1
704で、その部分格子線が、特定のスーパーセルの特
定の側面を完全に境界していると判定される。
5に進み、行アドレス及び列アドレスを図18(b)の
それぞれのスーパーセルに割り当てる。図18(b)の
スーパーセルは、それらのそれぞれの表セルと同じ列位
置及び行位置を有する。従ってスーパーセル111、1
12、114及び115はそれぞれ、表セル104、1
05、101及び102の行アドレス及び列アドレスを
共有する。1つのスーパーセルがいくつかの行又は列に
またがる場合、そのスーパーセルのアドレスは、(1,
2−4)などというように行及び/又は列アドレス範囲
を含むことに留意されたい。次いでステップS515に
進む。
及び/又は列アドレス範囲を有する表セルを分割する。
この点に関して、以上の処理ステップによって、複数の
表セルとして更に分類するほうが適当ないくつかの行又
は列にまたがる表セルが生じることがある。例として、
図19(a)、図19(b)及び図19(c)を含む図
19に、列アドレス範囲を有するいくつかの表セルを示
す。同様に図20に、行アドレス範囲を有する表セルを
示す。この点に関して図21A及び図21Bに、列アド
レス範囲及び行アドレス範囲を有する表セルを分割する
ステップをそれぞれ記載する。
フローはステップS2101から始まる。ステップS2
101では、列アドレス範囲を有する表セルを識別す
る。次にステップS2102で、識別した表セルの垂直
ヒストグラムを計算する。この垂直ヒストグラムは、識
別した表セルの中のそれぞれの画素列について、その表
セルの中のそれぞれの接続構成要素を境界する長方形
(図示せず)がまたぐ垂直距離の合計を反映する。ステ
ップS2104に進み、その表セルの隣接する列と列の
間の空間に対応するヒストグラムの領域が黒色画素を反
映しているかどうかを判定する。黒色画素を反映してい
る場合にはステップS2105に進む。
領域のヒストグラムが、閾値距離よりも大きな連続距離
の間、非ゼロであるかどうかを判定する。そうである場
合にはステップS2114に進み、対象表セルのアドレ
ス範囲内に他に列が存在するかどうかを判定する。この
ような状況を図19(a)に示す。図中のlは、ヒスト
グラムの列rと列(r+1)の間の連続する非ゼロ部分
を指す。他に列が存在する場合にはステップS2104
に戻る。
場合には、ステップS2115で、対象表が、列アドレ
ス範囲を有する表セルを他に含むかどうかを判定する。
そうである場合にはステップS2102に戻る。そうで
ない場合には図21BのステップS2116に進む。
105で連続する非ゼロ部分mが閾値よりも小さいと判
定される状況を示す。これに従ってステップS2106
に進み、別個の非ゼロ部分が、図19(b)の列sと
(s+1)の間にあるかどうかを判定する。そうでない
場合には、表セル116を、どちらも部分mを含まない
2つの新規の表セル、即ち列アドレスsを有する表セル
及び列アドレス(s+1)を有する表セルとして再定義
する。
が列sと列(s+1)の間にある場合にはステップS2
114に進み、前述の処理を続ける。
の列の間の領域が黒色画素を含まない場合にはステップ
S2110に進む。ステップS2110では、2つの列
の間の領域を、それぞれの列の中の黒色画素に遭遇する
までこれらの2つの列の内部に延長する。図19(c)
に示すように、表セル117の列tと列(t+1)の間
の領域nは黒色画素を含まない。従ってステップS21
10では、領域nを、表セル117の中の黒色画素に遭
遇するまで水平方向に両側に延長する。その結果生じる
領域をn’に示す。
領域の長さが閾値よりも大きいかどうかを判定する。そ
うである場合には、ステップS2112で表セル117
を2つの表セルに分割し、ステップS2114に進む。
そうでない場合には直ちにステップS2114に進み、
最終的には図21BのステップS2116に進む。
囲を有する表セルを本実施の形態に基づいて分割するの
に使用する。ステップS2116では、行アドレス範囲
を有する対象表セルを取り出す。次にステップS211
7で、行アドレス範囲の中の2つの行を調べ、これらの
行と行との間の距離、及びこれらの行の中間点を求め
る。これらの2つの量は、図20のrow_dist及
びmid_rowで表される。
囲の中に行R1及び行R2を含む。行R1の上限は座標
R1Uによって定義され、下限は座標R1Lによって定
義される。同様に行R2の上限は座標R2Uによって定
義され、下限は座標R2Lによって定義される。図20
に示す通り、量mid_rowはR1LとR2Uの中間
点を指す。また、量row_distはR1LとR2U
の間の距離を指す。
セルが、mid_rowの両側に連続したテキスト行を
含むかどうか、及びrow_distが閾値行サイズよ
りも大きいかどうかを判定する。そうである場合にはス
テップS2120に進み、対象表セルをmid_row
座標のところで2つのセルに切り離す。これらの2つの
セルのうちの一方は、その行アドレスに行R1を含み、
もう一方はその行アドレスに行R2を含む。次いでステ
ップS2121に進む。
された場合もステップS2121に進み、対象表セルが
他に行を含むかどうかを判定する。そうである場合には
ステップS2117に戻る。そうでない場合にはステッ
プS2122に進み、対象表の中に、行アドレス範囲を
有する表セルが他にあるかどうかを判定する。そうであ
る場合にはステップS2116に戻る。そうでなければ
ステップS516に進み、ステップS510からステッ
プS515までの間に生じた偽の行及び列を削除する。
の処理ステップを説明するための図である。例えば符号
130は、図22(a)に示すように、列C5の右側の
境界を指す。右境界130は垂直格子線132と隣接し
ている。右列境界130と垂直格子線132の間に位置
する列C6の中には接続構成要素が存在しないので、境
界130を排除することによって列C6を削除する。こ
れに従って格子線132が、列C5の右端境界として新
しく定義される。
置が更新される第2の状況を示す。図22(b)に示す
ように、斜線134によって、左境界135と右境界1
36の間に列C9が定義されている。これに応じて境界
135及び136を、列C8及び列C10を新たに拡張
することによって生じるこれらの列の間の1本の境界
(図示せず)で置き換えることによって列C9を削除す
る。ステップS516からステップS517に進む。
起因する誤ったアドレス割当てを減らすために、スーパ
ーセルの行及び列アドレスを調整する。例として図23
に、傾斜した表格子線によって誤った行及び列アドレス
の割当てが生じた状況を示す。具体的には、傾斜した垂
直格子線140が、目に見えない格子線141によって
それぞれ右境界及び左境界のところで定義された列u及
び列(u+1)を横切っている。斜線140があるため
に、スーパーセル143ないし145は列アドレス範囲
(u−u+1)を有する。これは、セル143ないし1
45の中に含まれる黒色画素が全て列(u+1)の中に
存在するとしても同じである。
の列を除外すべきかどうかを判定するために、ステップ
S517ではいくつかの基準を評価する。最初に、列
(u+1)の中にある対象スーパーセルの左境界が列u
の中に位置するかどうかを判定する。2番目に、左境界
と格子線141の間の距離が閾値よりも短いかどうかを
判定する。3番目に、このスーパーセルの中の接続構成
要素が全て格子線141の右側にあるかどうかを判定す
る。4番目に、対象スーパーセルの行アドレスのところ
の列uの中に別のスーパーセルがあるかどうかを判定す
る。これらの4つの基準を満たす場合には、対象スーパ
ーセルの定義から列uを削除し、対象スーパーセルの大
きさを再定義する。
145は前記基準を満たす。その結果生じるスーパーセ
ル143ないし145の再定義を図24に示す。図24
には、スーパーセルの列アドレス範囲から右端列を削除
すべきかどうかを判定するのに使用する前記基準の修正
バージョンに基づいてスーパーセル148及び149を
再定義した結果も反映されている。
にある対象スーパーセルの右境界が列(u+1)の中に
位置するかどうかを判定する。2番目には、右境界と格
子線141の間の距離が閾値よりも短いかどうかを判定
する。3番目には、このスーパーセルの中の接続構成要
素が全て、格子線141の左側にあるかどうかを判定す
る。4番目には、対象スーパーセルの行アドレスのとこ
ろの列(u+1)の中に別のスーパーセルがあるかどう
かを判定する。これらの4つの基準を満たす場合には、
対象スーパーセルの定義から列(u+1)を削除し、対
象スーパーセルの大きさを再定義する。
した格子線140に対してだけではなく、前方に傾斜し
た格子線に対しても同様に適合させることができること
を理解されたい。この点に関し、前記基準と同様の基準
をステップS517で更に使用して、傾斜した水平線に
起因するスーパーセルの行アドレスも調整する。
・ホール(super-cell hole)」が存在する場合にダミ
ーのスーパーセルを作成するか、又はスーパーセルを拡
張するためのステップS519を実行する。図26
(a)(b)は、「スーパーセル・ホール」が生じてい
る状況を示す例である。図26(a)に示すように、表
セル160の左側には目に見える格子線が存在しない。
従って図17の方法に関して先に説明したとおり、その
左及び下側が目に見えない格子線によって境界されたス
ーパーセルが作成される。白色領域163は黒色画素に
囲まれており、従って白色領域163に対応するスーパ
ーセル164がステップS1701で割り当てられてい
る。対照的に領域165は、黒色画素に完全に囲まれた
接続構成要素も白色領域も含まないので、領域165に
スーパーセルは割り当てられていない。
パーセル162の下部境界と水平格子線161の間、及
び領域165に存在する。
した状況に対処するためのものである。具体的には、フ
ローはステップS2501から始まり、このステップ
で、スーパーセルのそれぞれの境界を対応する目に見え
る格子線まで延長する。次いでステップS2504で、
スーパーセルのサイズ及び境界の情報を更新する。ステ
ップS2505では、対象表の左、右、上部及び下部の
縁を解析して領域165のような領域が存在するかどう
かを判定する。そうである場合にはステップS2506
で、このような領域を取り囲むダミーのスーパーセルを
作成する。次いでステップS520に進む。領域165
のような領域が存在しない場合にはステップS2505
から直接にステップS520に進む。
セル162は図26(b)に示すように延長されてい
る。図26(b)には、領域165に対応するダミーの
スーパーセル167も示されている。
20は、「セル・ホール(cell hole)」が存在する場
合にダミー・セルを作成するためのステップを含む。図
27にセル・ホールを含む表を示す。具体的には、表1
70はスーパーセル172を含む。スーパーセル172
の中には表セル174、175及び176がある。表セ
ル174ないし176の行及び列アドレスならびにスー
パーセル172の大きさに基づくと、破線に示す位置1
77に表セルが欠落していることが判る。この位置をセ
ル・ホールと称する。これに応じてステップS520で
位置177にセルを定義する。
ながら接続構成要素を含まない。しかしこのようなセル
は、表の特徴を定義し迅速に再現するのに有用である。
更に、このようなセルがあることによって、表170を
表すファイルの位置177にデータを簡単に追加するこ
とができるようになる。これはこのファイルが、位置1
77のところに予め定義されたセルを含むためである。
に基づく目に見える表セル境界を有する表の例である。
具体的には図28(a)に、表セル181ないし186
を含む表180が示されている。更に、表セル181及
び182を含むスーパーセル187、及び表セル183
ないし186を含むスーパーセル188も示されてい
る。
調べ、その上、下、左、又は右が目に見える格子線によ
って境界されているかどうかを判定する。この点に関
し、表セル181はその上及び右側、表セル182はそ
の右及び下側、表セル183はその上及び左側、表セル
184はその左及び下側、表セル185はその下及び右
側、表セル186はその上及び右側がそれぞれ境界され
ている。判定した情報を、表セルの種類、表セルの行及
び列アドレス、ならびに表セルの位置及びサイズの定義
とともに記憶することができる。
える境界に関するデータの記憶を説明するための例であ
る。具体的には図28(b)に、表180のそれぞれの
表セルを表すマトリックスが示されている。図28
(a)に対応するこのマトリックスに示すように、図2
8(b)の円は、目に見えない表セル境界を示し、ダッ
シュ“−”、“|”は目に見える表セル境界を示す。図
28(b)に示したようなマトリックスに参照すること
によって、本実施の形態に基づいて解析した表の内部格
子線を迅速に再現することができる。
3のステップS310及びS311に関して先に説明し
たスキュー検出及び後処理を実行する。
は、対象表を表す階層木構造中に記憶されることが好ま
しいことに留意されたい。好ましい実施の形態では、ス
ーパーセルの行及び列アドレス、スーパーセルの座標、
スーパーセルに含まれる表セル、及びスーパーセルの目
に見える境界の存在についての情報を含むスーパーセル
に関するデータを、図29(a)のノード200など
の、その表ブロックを表すノードに記憶する。ノード2
00には、表座標、列及び行範囲、目に見える垂直及び
水平格子線の位置、ならびに目に見えない垂直及び水平
格子線の位置も記憶される。
02ないし204がある。これらの表セル・ノードは、
表セル座標、表セルの行及び列アドレス、目に見える表
セル境界の存在を表すデータを含み、周囲のスーパーセ
ルは、対象表セルを表すノードに記憶される。
代替表現を示す。図29(b)の階層木では、スーパー
セル・ノード205及び206が表ノード200から別
個に定義されており、これらの下には、対応するスーパ
ーセルに含まれる表セルを表すノードがある。図29
(b)の木構造では、スーパーセルの行及び列アドレ
ス、スーパーセルの座標、スーパーセルに含まれる表セ
ル、及びスーパーセルの目に見える境界の存在について
の情報を含む、スーパーセル・フレームに関するデータ
を含むのはノード200ではなくスーパーセル・ノード
205及び206であることに留意されたい。
実施形態であると考えられるものに関して説明してきた
が、本発明は、以上に記載したものに限定されるもので
ないことを理解されたい。本発明は、添付の請求の範囲
の趣旨及び範囲に含まれるさまざまな修正及び等価の構
成をカバーするものである。
イメージを含む画像データから、その表を定義する行、
列、表格子線などの特徴を正確に取り出すことができ
る。
ータを正確に抽出し、スプレッドシート・アプリケーシ
ョンに出力することができる。
に基づいて表にセルを簡単に追加することができるとい
う効果がある。
示す外観図である。
示すブロック図である。
るフローチャートである。
分類を説明するフローチャートである。
たフローチャートである。
す図である。
るフローチャートである。
分を示す図である。
ーチャートである。
ーチャートである。
トグラムを説明する図である。
るヒストグラム構成を示す図である。
ある。
ーチャートである。
ある。
の位置決めをする方法を説明するフローチャートであ
る。
る図である。
明するフローチャートである。
明する図である。
垂直ヒストグラム構成を説明する図である。
分を説明する図である。
するフローチャートである。
するフローチャートである。
る。
る表の部分を示す図である。
アドレス調整を実施したものを示す図である。
作成を説明するフローチャートである。
償を説明する図である。
ある。
の関係を示す図である。
造を示す図である。
Claims (27)
- 【請求項1】 目に見える格子線及び目に見えない格子
線によって定義された行及び列を含み、表セルを含む表
イメージにブロック選択処理を実行する画像処理方法で
あって、 表セルの周囲にあり、目に見える格子線によって境界さ
れたトレースされた白色領域に基づいて、1つ又は複数
の表セルを含むスーパーセルを識別する識別ステップ
と、 それぞれの表セルを境界する垂直及び水平格子線が目に
見える格子線であるのか、又は目に見えない格子線であ
るのかを判定するステップと、 それぞれのスーパーセルを境界する垂直及び水平格子線
が目に見える格子線であるのか、又は目に見えない格子
線であるのかを判定するステップと、を有することを特
徴とする画像処理方法。 - 【請求項2】 前記表イメージの中の反転テキスト領域
を検出するステップと、 前記表イメージの中の接続構成要素を反映し、前記反転
テキスト領域の中の接続構成要素を反映しない垂直ヒス
トグラムを計算するステップと、 前記垂直ヒストグラムに基づいて前記表イメージの中の
列を定義するステップと、 定義した列について、トレースされた白色領域及び部分
格子線の位置に基づいて列を再定義するステップと、を
更に有することを特徴とする請求項1に記載の画像処理
方法。 - 【請求項3】 前記反転テキスト領域を検出するステッ
プは、 前記表イメージの中の白色画素を反映した前記イメージ
の水平ヒストグラムを計算するステップと、 それぞれの行の境界画素間の距離の合計がその行の全長
の1/2よりも小さい前記イメージ中の連続行を識別す
るステップと、 前記連続行の中のトレースされた白色領域を検出するス
テップと、 検出したトレースされた白色領域が反転テキストに対応
するかどうかをトレースされた白色領域の大きさに基づ
いて判定するステップと、 を有することを特徴とする請求項2に記載の画像処理方
法。 - 【請求項4】 前記表イメージの中の反転テキスト領域
を検出するステップと、 前記表イメージの中の接続構成要素を反映し、前記反転
テキスト領域の中の接続構成要素を反映しない水平ヒス
トグラムを計算するステップと、 前記水平ヒストグラムに基づいて前記表イメージの中の
行を定義するステップ と、定義した行について、トレースされた白色領域及び
部分格子線の位置に基づいて行を再定義するステップ
と、を更に有することを特徴とする請求項1に記載の画
像処理方法。 - 【請求項5】 前記反転テキスト領域を検出するステッ
プは、 前記表イメージの中の白色画素を反映した前記イメージ
の水平ヒストグラムを計算するステップと、 それぞれの行の境界画素間の距離の合計がその行の全長
の1/2よりも小さい前記イメージ中の連続行を識別す
るステップと、 前記連続行の中のトレースされた白色領域を検出するス
テップと、 検出したトレースされた白色領域が反転テキストに対応
するかどうかをトレースされた白色領域の大きさに基づ
いて判定するステップと、を有することを特徴とする請
求項4に記載の画像処理方法。 - 【請求項6】 前記識別ステップでは、第1の表セルが
白色領域に囲まれていない場合に、前記第1の表セルの
位置及び大きさに基づいて第1のスーパーセルを識別す
ることを特徴とする請求項1に記載の画像処理方法。 - 【請求項7】 第2のスーパーセルの行及び列アドレス
に表セルを含まない場合に、前記第2のスーパーセルの
行及び列アドレスにダミーの表セルを識別するステップ
を更に含むことを特徴とする請求項6に記載の画像処理
方法。 - 【請求項8】 識別したスーパーセルに関するデータ
を、前記表イメージの物理レイアウトを反映した階層木
構造中に記憶するステップを更に含むことを特徴とする
請求項7に記載の画像処理方法。 - 【請求項9】 隣接する列に対応するトレースされた白
色領域間の距離を測定するステップと、 測定した距離に基づいて、前記隣接する列に対応する垂
直格子線の位置を計算するステップと、を更に含むこと
を特徴とする請求項1に記載の画像処理方法。 - 【請求項10】 前記表イメージが5行以上のテキスト
行を含む場合に前記表イメージの最上位のテキスト行が
無視されることを特徴とする、請求項9に記載の方法。 - 【請求項11】 目に見える格子線及び目に見えない格
子線によって定義された行及び列を含み、表セルを含む
表イメージにブロック選択処理を実行するコンピュータ
で実行可能な処理ステップを記憶したコンピュータ可読
媒体であって、 表セルの周囲にあり、目に見える格子線によって境界さ
れたトレースされた白色領域に基づいて、1つ又は複数
の表セルを含むスーパーセルを識別する識別ステップモ
ジュールと、 それぞれの表セルを境界する垂直及び水平格子線が目に
見える格子線であるのか、又は目に見えない格子線であ
るのかを判定する判定ステップモジュールと、それぞれ
のスーパーセルを境界する垂直及び水平格子線が目に見
える格子線であるのか、又は目に見えない格子線である
のかを判定する判定ステップモジュールと、を有するこ
とを特徴とするコンピュータ可読媒体。 - 【請求項12】 前記表イメージの中の反転テキスト領
域を検出する検出ステップモジュールと、 前記表イメージの中の接続構成要素を反映し、検出した
前記反転テキスト領域の中の接続構成要素を反映しない
垂直ヒストグラムを計算する計算ステップモジュール
と、 前記垂直ヒストグラムに基づいて前記表イメージの中の
列を定義する定義ステップモジュールと、 定義した列について、トレースされた白色領域及び部分
格子線の位置に基づいて列を再定義する再定義ステップ
モジュールと、を更に有することを特徴とする請求項1
1に記載のコンピュータ可読媒体。 - 【請求項13】 検出ステップモジュールは、 前記表イメージの中の白色画素を反映した前記イメージ
の水平ヒストグラムを計算する計算ステップモジュール
と、 それぞれの行の境界画素間の距離の合計がその行の全長
の1/2よりも小さい前記イメージ中の連続行を識別す
る識別ステップモジュールと、 前記連続行の中のトレースされた白色領域を検出する検
出ステップモジュールと、 検出したトレースされた白色領域が反転テキストに対応
するかどうかを、トレースされた白色領域の大きさに基
づいて判定する判定ステップモジュールと、を有するこ
とを特徴とする請求項12に記載のコンピュータ可読媒
体。 - 【請求項14】 前記表イメージの中の反転テキスト領
域を検出する検出ステップモジュールと、 前記表イメージの中の接続構成要素を反映し、前記反転
テキスト領域の中の接続構成要素を反映しない水平ヒス
トグラムを計算する計算ステップモジュールと、 前記水平ヒストグラムに基づいて前記表イメージの中の
行を定義する定義ステップモジュールと、 定義した行について、トレースされた白色領域及び部分
格子線の位置に基づいて行を再定義する再定義ステップ
モジュールと、を更に有することを特徴とする請求項1
1に記載のコンピュータ可読媒体。 - 【請求項15】 前記反転テキスト領域を検出する前記
検出ステップモジュールは、 前記表イメージの中の白色画素を反映した前記イメージ
の水平ヒストグラムを計算する計算ステップモジュール
と、 それぞれの行の境界画素間の距離の合計がその行の全長
の1/2よりも小さい前記イメージ中の連続行を識別す
る識別ステップモジュールと、 前記連続行の中のトレースされた白色領域を検出する検
出ステップモジュールと、 検出したトレースされた白色領域が反転テキストに対応
するかどうかをトレースされた白色領域の大きさに基づ
いて判定する判定ステップモジュールと、を有すること
を特徴とする請求項11に記載のコンピュータ可読媒
体。 - 【請求項16】 前記識別ステップモジュールでは、第
1の表セルが白色領域に囲まれていない場合に、第1の
表セルの位置及び大きさに基づいて第1のスーパーセル
を識別することを特徴とする請求項11に記載のコンピ
ュータ可読媒体。 - 【請求項17】 更に、第2のスーパーセルの中の行及
び列アドレスに表セルを含まない場合に、前記第2のス
ーパーセルの行及び列アドレスにダミーの表セルを識別
するステップモジュールを更に有することを特徴とする
請求項16に記載のコンピュータ可読媒体。 - 【請求項18】 識別したスーパーセルに関するデータ
を、前記表イメージの物理レイアウトを反映した階層木
構造中に記憶する記憶ステップモジュールを更に含むこ
とを特徴とする請求項17に記載のコンピュータ可読媒
体。 - 【請求項19】 隣接する列に対応するトレースされた
白色領域間の距離を測定する測定ステップモジュール
と、 前記測定した距離に基づいて、前記隣接する列に対応す
る垂直格子線の位置を計算する計算ステップモジュール
と、を更に有することを特徴とする請求項11に記載の
コンピュータ可読媒体。 - 【請求項20】 前記表イメージが5行以上のテキスト
行を含む場合に前記表イメージの最上位のテキスト行が
無視されることを特徴とする請求項19に記載のコンピ
ュータ可読媒体。 - 【請求項21】 文書イメージを入力するステップと、 前記文書イメージの中の接続構成要素を検出するステッ
プと、 表ブロックを、検出した接続構成要素及びその表ブロッ
ク・イメージ中の白色領域に基づいて識別するステップ
と、 前記表ブロック中の反転テキスト領域を識別するステッ
プと、 前記表の中の付属する接続構成要素を識別するステップ
と、 前記表ブロックの中にテキスト・ブロック及びテキスト
行を形成するステップと、 前記表イメージ中の表行及び表列を計算するステップ
と、 前記表ブロック中の表セルに行及び列アドレスを割り当
てるステップと、 表の垂直及び水平格子線の位置を計算するステップと、 前記白色領域に基づいて、1つ又は複数の前記表セルを
含むスーパーセルを定義するステップと、 それぞれのスーパーセルを境界する垂直及び水平格子線
が目に見える格子線であるのか、又は目に見えない格子
線であるのかを判定するステップと、 行又は列アドレス範囲を有する表セルを分割するステッ
プと、 前記表ブロックの中に傾斜した目に見える格子線が存在
する場合に行及び列アドレスを再定義するステップと、 前記表ブロック中のスーパーセル・ホールに基づいてス
ーパーセルを定義するステップと、 前記表ブロック中のセル・ホールに基づいてダミーの表
セルを定義するステップと、 それぞれの表セルを境界する垂直及び水平格子線が目に
見える格子線であるのか、又は目に見えない格子線であ
るのかを判定するステップと、を有することを特徴とす
る文書イメージの解析方法。 - 【請求項22】 文書イメージを解析する、コンピュー
タで実行可能な処理ステップを記憶したコンピュータ可
読媒体であって、 文書イメージを入力する入力ステップモジュールと、 前記文書イメージの中の接続構成要素を検出する検出ス
テップモジュールと、 表ブロックを、検出した接続構成要素及びその表ブロッ
ク・イメージ中の白色領域に基づいて識別する識別ステ
ップモジュールと、 前記表ブロック中の反転テキスト領域を識別する識別ス
テップモジュールと、 前記表の中の付着された接続構成要素を識別する識別ス
テップモジュールと、 前記表ブロックの中に、テキスト・ブロック及びテキス
ト行を形成する形成ステップモジュールと、 前記表イメージ中の表行及び表列を計算する計算ステッ
プモジュールと、 前記表ブロック中の表セルに行及び列アドレスを割り当
てる割当てステップモジュールと、 表の垂直及び水平格子線の位置を計算する計算ステップ
モジュールと、 前記白色領域に基づいて、1つ又は複数の前記表セルを
含むスーパーセルを定義するステップモジュールと、 それぞれのスーパーセルを境界する垂直及び水平格子線
が目に見える格子線であるのか、又は目に見えない格子
線であるのかを判定する判定ステップモジュールと、 行又は列アドレス範囲を有する表セルを分割する分割ス
テップモジュールと、 前記表ブロックの中に傾斜した目に見える格子線が存在
する場合に、行及び列アドレスを再定義する再定義ステ
ップモジュールと、 前記表ブロック中のスーパーセル・ホールに基づいてス
ーパーセルを定義する定義ステップモジュールと、 前記表ブロック中のセル・ホールに基づいてダミーの表
セルを定義する定義ステップモジュールと、 それぞれの表セルを境界する垂直及び水平格子線が目に
見える格子線であるのか、又は目に見えない格子線であ
るのかを判定する判定ステップモジュールと、を有する
ことを特徴とするコンピュータ可読媒体。 - 【請求項23】 目に見える格子線及び目に見えない格
子線によって定義された行及び列を含み、表セルを含む
表イメージにブロック選択処理を実行する画像処理装置
であって、 表セルの周囲にあり、目に見える格子線によって境界さ
れたトレースされた白色領域に基づいて、1つ又は複数
の表セルを含むスーパーセルを識別する識別手段と、 それぞれの表セルを境界する垂直及び水平格子線が目に
見える格子線であるのか、又は目に見えない格子線であ
るのかを判定する第1判定手段と、 それぞれのスーパーセルを境界する垂直及び水平格子線
が目に見える格子線であるのか、又は目に見えない格子
線であるのかを判定する第2判定手段と、を有すること
を特徴とする画像処理装置。 - 【請求項24】 前記表イメージの中の反転テキスト領
域を検出する検出手段と、 前記表イメージの中の接続構成要素を反映し、前記反転
テキスト領域の中の接続構成要素を反映しない垂直ヒス
トグラムを計算する計算手段と、 前記垂直ヒストグラムに基づいて前記表イメージの中の
列を定義する列定義手段と、 定義した列について、トレースされた白色領域及び部分
格子線の位置に基づいて列を再定義する列再定義手段
と、を更に有することを特徴とする請求項23に記載の
画像処理装置。 - 【請求項25】 前記検出手段は、 前記表イメージの中の白色画素を反映した前記イメージ
の水平ヒストグラムを計算するヒストグラム計算手段
と、 それぞれの行の境界画素間の距離の合計がその行の全長
の1/2よりも小さい前記イメージ中の連続行を識別す
る手段と、 前記連続行の中のトレースされた白色領域を検出する手
段と、 検出したトレースされた白色領域が反転テキストに対応
するかどうかをトレースされた白色領域の大きさに基づ
いて判定する手段と、を有することを特徴とする請求項
24に記載の画像処理装置。 - 【請求項26】 前記表イメージの中の反転テキスト領
域を検出する検出手段と、 前記表イメージの中の接続構成要素を反映し、前記反転
テキスト領域の中の接続構成要素を反映しない水平ヒス
トグラムを計算する計算手段と、 前記水平ヒストグラムに基づいて前記表イメージの中の
行を定義する行定義手段と、 定義した行について、トレースされた白色領域及び部分
格子線の位置に基づいて行を再定義する行再定義手段
と、 を更に有することを特徴とする請求項23に記載の画像
処理装置。 - 【請求項27】 文書イメージの中の接続構成要素を検
出する接続構成要素検出手段と、 表ブロックを、検出した接続構成要素及びその表ブロッ
ク・イメージ中の白色領域に基づいて識別する表識別手
段と、 前記表識別手段により識別された表ブロック中の反転テ
キスト領域を識別する反転テキスト領域識別手段と、 前記表ブロックの中の付属する接続構成要素を識別する
識別手段と、 前記表ブロックの中にテキスト・ブロック及びテキスト
行を形成するテキスト形成手段と、 前記表ブロック中の表行及び表列を計算する行列計算手
段と、 前記表ブロック中の表セルに行及び列アドレスを割り当
てる行列割当て手段と、 表の垂直及び水平格子線の位置を計算する格子線位置計
算手段と、 前記表識別手段により識別された前記白色領域に基づい
て、1つ又は複数の前記表セルを含むスーパーセルを定
義するスーパーセル定義手段と、 それぞれのスーパーセルを境界する垂直及び水平格子線
が目に見える格子線であるのか、又は目に見えない格子
線であるのかを判定する判定手段と、 行又は列アドレス範囲を有する表セルを分割する分割手
段と、 前記表ブロックの中に傾斜した目に見える格子線が存在
する場合に行及び列アドレスを再定義する再定義手段
と、 前記表ブロック中のスーパーセル・ホールに基づいてス
ーパーセルを定義する定義手段と、 前記表ブロック中のセル・ホールに基づいてダミーの表
セルを定義する表セル定義手段と、 それぞれの表セルを境界する垂直及び水平格子線が目に
見える格子線であるのか、又は目に見えない格子線であ
るのかを判定する手段と、を有することを特徴とする画
像処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/002,684 US6173073B1 (en) | 1998-01-05 | 1998-01-05 | System for analyzing table images |
US09/002684 | 1998-01-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11259655A true JPH11259655A (ja) | 1999-09-24 |
JP4251586B2 JP4251586B2 (ja) | 2009-04-08 |
Family
ID=21701969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00023999A Expired - Fee Related JP4251586B2 (ja) | 1998-01-05 | 1999-01-04 | 画像処理方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6173073B1 (ja) |
EP (1) | EP0927950B1 (ja) |
JP (1) | JP4251586B2 (ja) |
CN (1) | CN1143239C (ja) |
DE (1) | DE69825856D1 (ja) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7099507B2 (en) * | 1998-11-05 | 2006-08-29 | Ricoh Company, Ltd | Method and system for extracting title from document image |
US6865720B1 (en) * | 1999-03-23 | 2005-03-08 | Canon Kabushiki Kaisha | Apparatus and method for dividing document including table |
US6757870B1 (en) * | 2000-03-22 | 2004-06-29 | Hewlett-Packard Development Company, L.P. | Automatic table detection method and system |
JP2002032770A (ja) * | 2000-06-23 | 2002-01-31 | Internatl Business Mach Corp <Ibm> | 文書処理方法、文書処理システムおよび媒体 |
US6778700B2 (en) * | 2001-03-14 | 2004-08-17 | Electronics For Imaging, Inc. | Method and apparatus for text detection |
CA2391692C (en) | 2002-07-15 | 2006-07-04 | Allan Williams | Computer database with adaptive storage space architecture |
US20040066538A1 (en) * | 2002-10-04 | 2004-04-08 | Rozzi William A. | Conversion of halftone bitmaps to continuous tone representations |
US8095871B2 (en) * | 2004-05-06 | 2012-01-10 | Siemens Corporation | System and method for GUI supported specifications for automating form field extraction with database mapping |
US7668404B2 (en) * | 2004-06-30 | 2010-02-23 | Lexmark International, Inc. | Method and system of deskewing an image using monochrome conversion to separate foreground from background |
US7707488B2 (en) * | 2006-02-09 | 2010-04-27 | Microsoft Corporation | Analyzing lines to detect tables in documents |
JP4135752B2 (ja) * | 2006-06-12 | 2008-08-20 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
JP4665933B2 (ja) * | 2006-07-04 | 2011-04-06 | セイコーエプソン株式会社 | 文書編集支援装置、プログラムおよび記憶媒体 |
US7801358B2 (en) * | 2006-11-03 | 2010-09-21 | Google Inc. | Methods and systems for analyzing data in media material having layout |
WO2009001462A1 (ja) * | 2007-06-28 | 2008-12-31 | Fujitsu Limited | スプレッドシート生成プログラム、該プログラムを記録した記録媒体、スプレッドシート生成装置、およびスプレッドシート生成方法 |
US8155442B2 (en) * | 2008-02-04 | 2012-04-10 | The Neat Company, Inc. | Method and apparatus for modifying the histogram of an image |
CN101551859B (zh) * | 2008-03-31 | 2012-01-04 | 夏普株式会社 | 图像辨别装置及图像检索装置 |
US8144986B2 (en) * | 2008-09-05 | 2012-03-27 | The Neat Company, Inc. | Method and apparatus for binarization threshold calculation |
US8719701B2 (en) * | 2009-01-02 | 2014-05-06 | Apple Inc. | Identification of guides and gutters of a document |
US8214733B2 (en) * | 2010-04-28 | 2012-07-03 | Lexmark International, Inc. | Automatic forms processing systems and methods |
US8261180B2 (en) * | 2009-04-28 | 2012-09-04 | Lexmark International, Inc. | Automatic forms processing systems and methods |
EP2460118B1 (en) * | 2009-07-30 | 2013-05-29 | OCE-Technologies B.V. | Automatic table location in documents |
US20110032266A1 (en) * | 2009-08-07 | 2011-02-10 | Delphi Technologies, Inc. | Glare detection and mitigation method for a photo-sensitive display device |
CN101866335B (zh) * | 2010-06-14 | 2012-12-12 | 深圳市万兴软件有限公司 | 一种文档转换中的表格处理方法及装置 |
CN101984426B (zh) * | 2010-10-21 | 2013-04-10 | 优视科技有限公司 | 用于对网页图片进行字符切分的方法及装置 |
US8380753B2 (en) | 2011-01-18 | 2013-02-19 | Apple Inc. | Reconstruction of lists in a document |
US8543911B2 (en) | 2011-01-18 | 2013-09-24 | Apple Inc. | Ordering document content based on reading flow |
US8731296B2 (en) * | 2011-04-21 | 2014-05-20 | Seiko Epson Corporation | Contact text detection in scanned images |
JP5952428B2 (ja) | 2012-01-23 | 2016-07-13 | マイクロソフト コーポレーション | ボーダレステーブル検出エンジン |
EP2807604A1 (en) | 2012-01-23 | 2014-12-03 | Microsoft Corporation | Vector graphics classification engine |
CN103377177B (zh) * | 2012-04-27 | 2016-03-30 | 北大方正集团有限公司 | 一种数字版式文件中识别表格的方法及装置 |
US9953008B2 (en) | 2013-01-18 | 2018-04-24 | Microsoft Technology Licensing, Llc | Grouping fixed format document elements to preserve graphical data semantics after reflow by manipulating a bounding box vertically and horizontally |
US9047528B1 (en) * | 2013-02-19 | 2015-06-02 | Amazon Technologies, Inc. | Identifying characters in grid-based text |
US10076751B2 (en) | 2013-12-30 | 2018-09-18 | General Electric Company | Systems and methods for reagent storage |
US9399216B2 (en) | 2013-12-30 | 2016-07-26 | General Electric Company | Fluid transport in microfluidic applications with sensors for detecting fluid presence and pressure |
JP6435636B2 (ja) * | 2014-05-15 | 2018-12-12 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN104050487B (zh) * | 2014-06-06 | 2017-06-16 | 华东师范大学 | 一种基于布局信息分析的邮件图像方向辨别方法 |
US9235757B1 (en) * | 2014-07-24 | 2016-01-12 | Amazon Technologies, Inc. | Fast text detection |
CN105426834B (zh) * | 2015-11-17 | 2019-02-22 | 中国传媒大学 | 一种基于投影特征与结构特征进行表格图像检测的方法 |
CN106446881B (zh) * | 2016-07-29 | 2019-05-21 | 北京交通大学 | 从医疗化验单图像中提取化验结果信息的方法 |
CN106156761B (zh) * | 2016-08-10 | 2020-01-10 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
US10242257B2 (en) * | 2017-05-18 | 2019-03-26 | Wipro Limited | Methods and devices for extracting text from documents |
US10410386B2 (en) * | 2017-09-15 | 2019-09-10 | Konica Minolta Laboratory U.S.A., Inc. | Table cell validation |
US11650970B2 (en) | 2018-03-09 | 2023-05-16 | International Business Machines Corporation | Extracting structure and semantics from tabular data |
CN108470021B (zh) * | 2018-03-26 | 2022-06-03 | 阿博茨德(北京)科技有限公司 | Pdf文档中表格的定位方法及装置 |
US11200413B2 (en) | 2018-07-31 | 2021-12-14 | International Business Machines Corporation | Table recognition in portable document format documents |
US12100233B2 (en) * | 2019-05-08 | 2024-09-24 | Vrije Universiteit Brussel | Computer implemented method for segmenting a binarized document |
US11062133B2 (en) * | 2019-06-24 | 2021-07-13 | International Business Machines Corporation | Data structure generation for tabular information in scanned images |
CN114357958A (zh) * | 2020-09-30 | 2022-04-15 | 中移(苏州)软件技术有限公司 | 一种表格提取方法、装置、设备及存储介质 |
US20220335240A1 (en) * | 2021-04-15 | 2022-10-20 | Microsoft Technology Licensing, Llc | Inferring Structure Information from Table Images |
US11829701B1 (en) * | 2022-06-30 | 2023-11-28 | Accenture Global Solutions Limited | Heuristics-based processing of electronic document contents |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5185813A (en) | 1988-01-19 | 1993-02-09 | Kabushiki Kaisha Toshiba | Document image processing apparatus |
US5131053A (en) | 1988-08-10 | 1992-07-14 | Caere Corporation | Optical character recognition method and apparatus |
US5101448A (en) | 1988-08-24 | 1992-03-31 | Hitachi, Ltd. | Method and apparatus for processing a document by utilizing an image |
US5129012A (en) | 1989-03-25 | 1992-07-07 | Sony Corporation | Detecting line segments and predetermined patterns in an optically scanned document |
JP2812982B2 (ja) * | 1989-04-05 | 1998-10-22 | 株式会社リコー | 表認識方法 |
JP2940936B2 (ja) | 1989-06-06 | 1999-08-25 | 株式会社リコー | 表領域識別方法 |
US5448692A (en) * | 1991-03-27 | 1995-09-05 | Ricoh Company, Ltd. | Digital image processing device involving processing of areas of image, based on respective contour line traces |
JPH05250357A (ja) | 1992-03-05 | 1993-09-28 | Ricoh Co Ltd | 画像読取修正装置および修正画像形成装置 |
US5335290A (en) | 1992-04-06 | 1994-08-02 | Ricoh Corporation | Segmentation of text, picture and lines of a document image |
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
US5594817A (en) * | 1992-10-19 | 1997-01-14 | Fast; Bruce B. | OCR image pre-processor for detecting and reducing skew of the image of textual matter of a scanned document |
JP2789971B2 (ja) * | 1992-10-27 | 1998-08-27 | 富士ゼロックス株式会社 | 表認識装置 |
US5485566A (en) | 1993-10-29 | 1996-01-16 | Xerox Corporation | Method of finding columns in tabular documents |
US5588072A (en) | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
US5689342A (en) | 1994-11-17 | 1997-11-18 | Canon Kabushiki Kaisha | Image processing method and apparatus which orders text areas which have been extracted from an image |
US5661818A (en) | 1995-01-27 | 1997-08-26 | Eastman Kodak Company | Method and system for detecting grids in a digital image |
US5848186A (en) * | 1995-08-11 | 1998-12-08 | Canon Kabushiki Kaisha | Feature extraction system for identifying text within a table image |
-
1998
- 1998-01-05 US US09/002,684 patent/US6173073B1/en not_active Expired - Lifetime
- 1998-12-22 EP EP98310566A patent/EP0927950B1/en not_active Expired - Lifetime
- 1998-12-22 DE DE69825856T patent/DE69825856D1/de not_active Expired - Lifetime
-
1999
- 1999-01-04 JP JP00023999A patent/JP4251586B2/ja not_active Expired - Fee Related
- 1999-01-05 CN CNB991010043A patent/CN1143239C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP4251586B2 (ja) | 2009-04-08 |
CN1143239C (zh) | 2004-03-24 |
CN1237745A (zh) | 1999-12-08 |
US6173073B1 (en) | 2001-01-09 |
EP0927950B1 (en) | 2004-08-25 |
EP0927950A3 (en) | 2001-10-17 |
DE69825856D1 (de) | 2004-09-30 |
EP0927950A2 (en) | 1999-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH11259655A (ja) | 画像処理方法及び装置 | |
JP3359095B2 (ja) | 画像処理方法及び装置 | |
KR102403964B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 저장 매체 | |
US6512848B2 (en) | Page analysis system | |
JP4577421B2 (ja) | 画像処理装置及び画像処理プログラム | |
US7783108B2 (en) | Document management method and apparatus | |
JPH08235349A (ja) | ページ解析システム | |
JP2010020468A (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
JP4655335B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
US20090274369A1 (en) | Image processing device, image processing method, program, and storage medium | |
JP2011065621A (ja) | 情報処理装置及び情報処理プログラム | |
US11908215B2 (en) | Information processing apparatus, information processing method, and storage medium | |
JP5412903B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
US6360006B1 (en) | Color block selection | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
JP5159588B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP5673277B2 (ja) | 画像処理装置およびプログラム | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
JP2005071014A (ja) | 文書画像処理装置、方法、プログラムおよび記憶媒体 | |
JP2002049890A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP7520605B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2009303149A (ja) | 画像処理装置、画像処理方法及びコンピュータ制御プログラム | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JP4587167B2 (ja) | 画像処理装置及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051228 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051228 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20051228 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051228 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080723 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080807 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081014 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090116 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090119 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120130 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130130 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140130 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |