JP2002279434A - ドキュメントにおける自動的テーブル位置決め - Google Patents

ドキュメントにおける自動的テーブル位置決め

Info

Publication number
JP2002279434A
JP2002279434A JP2002045833A JP2002045833A JP2002279434A JP 2002279434 A JP2002279434 A JP 2002279434A JP 2002045833 A JP2002045833 A JP 2002045833A JP 2002045833 A JP2002045833 A JP 2002045833A JP 2002279434 A JP2002279434 A JP 2002279434A
Authority
JP
Japan
Prior art keywords
document
crop
lines
group
crops
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002045833A
Other languages
English (en)
Other versions
JP4145530B2 (ja
Inventor
Laurent Alain Najman
アレン ナーマン ローラン
Mickael Bernard Louis Berbey
ベルナール ルイ バルベイ ミカエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oce Print Logic Technologies SA
Original Assignee
Oce Print Logic Technologies SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oce Print Logic Technologies SA filed Critical Oce Print Logic Technologies SA
Publication of JP2002279434A publication Critical patent/JP2002279434A/ja
Application granted granted Critical
Publication of JP4145530B2 publication Critical patent/JP4145530B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 技術的図面等のドキュメント上に存在するテ
ーブルを信頼性を持って且つ迅速に位置決めする方法及
ぶ装置を提供する。 【解決手段】 本発明によれば、ドキュメント内のテー
ブル状の構造をそのサブ領域(即ち、クロップ)を解析
することによって位置決め即ち探し出す。この場合の解
析は、あるスレッシュホールドより大きな長さを有する
ラインの位置を決定し且つこれらのラインに対してグル
ープを割当てることを行う。1組の隣接するラインの間
の分離即ち間隔がスレッシュホールド値未満の場合に
は、その組の隣接するラインは共通のグループに割当て
る。テーブル状構造の位置として選択されるクロップ
は、最大多数のラインを有するグループを持つものであ
る。本発明を技術的な図面におけるタイトルブロック
(表題欄)の位置決めに適用する場合には、そのドキュ
メントの角部又は端部に対応するクロップを解析するこ
とが望ましい。そのドキュメントのイメージを減少させ
た分解能で解析することが有益的である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ドキュメント内に
存在するテーブル状の構造の自動的位置決めに関するも
のである。このようなテーブル状の構造は、例えば、フ
ォーム上に存在するテーブルの全体又は一部である場合
がある(尚、ここでは「テーブル」とはセルの二次元的
集合である)。然しながら、本発明は技術的な図面にお
けるタイトルブロック即ち表題欄(又は「説明」)の自
動的位置決めに関して特に興味のあるものである。本明
細書においては、「テーブル」という用語は、前述した
例の全て及び一般的にテーブル状構造を指し示すために
使用する。
【0002】
【従来の技術】本発明技術は、これのみという訳ではな
いが、通常、ドキュメントのスキャンしたイメージ等の
ドキュメントの表現、ドキュメント上に存在するイメー
ジのベクトル表現等に対して適用される。
【0003】ドキュメント内に存在するテーブルの位置
を自動的に検知することが可能であることが有益的であ
るような多くの分野が存在している。1つの例はフォー
ム処理であり、セル内のデータを読むことによってデー
タベースエントリを自動的に発生させることが可能であ
るようにフォーム上のテーブル内のセルを自動的に位置
決めすることが可能であることが望ましい。この分野に
おいては種々の提案が既になされている。然しながら、
現在使用可能なフォーム認識コンピュータプログラムの
大多数は、フォーム自身からなり且つ殆ど他のものを包
含することのないイメージ内の不自然な姿勢にあるフォ
ームの認識に依存している。
【0004】自動的テーブル位置決めは技術的図面(例
えば機械工学的図面又は建築図面)を処理する分野にお
いて特に興味がある。後者の分野においては、図面のタ
イトルブロックを自動的に位置決めすることが可能であ
る場合には、以下の処理を実施することが可能である。
即ち、 ※タイトルブロックが見えたままであるような図面の自
動的折り曲げ、 ※正しい配向状態での図面のポジショニング(何故なら
ば、タイトルブロックは、通常、例えば右下等のイメー
ジに関して特定した角部に位置されているからであ
る)、 ※例えばパソコンを使用しての図面のスキャンしたイメ
ージの処理において、タイトルブロックは手作業での索
引付けを助けるためにタイトルブロックを拡大表示させ
ることが可能であり、 ※図面の自動的索引付けにおいて第一ステップがとら
れ、タイトルブロックが位置決めされると、その中に包
含されている情報を抽出することの問題に過ぎなくな
る。
【0005】技術的図面においてタイトルブロック(説
明)の内容を支配し且つポジショニングを行う国家レベ
ル及び国際レベルにおいての種々のスタンダードが定義
されている。これらのスタンダードとしては、ISO5
457及びISO7200及びフランス国家スタンダー
ドNFE04−503等がある。
【0006】より詳細には、スタンダードISO720
0によれば、説明は、頁内に位置されている種々の矩形
状のセル、即ち「フィールド」からなるテーブル状のフ
ォームである。該セルは情報を包含しており且つ以下の
3つのフィールドは強制的である。
【0007】※図面に対しての識別番号即ちコードを与
える識別ゾーン、 ※タイトルゾーン、 ※図面の所有者の名前を包含するゾーン。
【0008】スタンダードISO5457によれば、タ
イトルブロックの識別部分は「通常の観察方向から見た
場合にタイトルブロックの右下角部に位置し、且つ17
0mmの最大長を有すべきである」。フランス国家スタ
ンダードNFE04−503によれば、タイトルブロッ
クの寸法は幅が190mmで高さが277mmを超える
ものであってはならない。
【0009】ISO5457は、更に、「水平方向に位
置された用紙即ちタイプX(図1a参照)又は垂直方向
に位置された用紙即ちタイプY(図1b参照)の両方に
対して、図面の識別(登録番号、タイトル、出展等)を
包含するタイトルブロックの部分が図面空間の右下角部
に位置されるようにタイトルブロックの位置が図面空間
内に存在すべきである。タイトルブロックの観察方向
は、一般的に、その図面のものに対応すべきである。然
しながら、印刷前の図面の用紙を節約するために、タイ
プXの用紙を垂直位置(図1c参照)で使用し且つタイ
プYの用紙を水平位置(図1d参照)において使用する
ことが可能である。これらの場合においては、タイトル
ブロックの識別部分は図面空間の右上角部にあるべきで
あり、且つタイトルブロックが右側から見た場合に読む
ことが可能であるような配向状態とすべきである。」で
あることを特定している。
【0010】これらのスタンダード(基準)は技術的な
図面においてタイトルブロックのポジショニングを行う
場合にある程度の余裕を与えるものであることが理解さ
れる。更に、これらのスタンダードは常に変化しており
且つ技術的な図面はこれらのスタンダードにおいて定義
されている規則に常に準拠するものではない。特に古い
図面が関与する場合には変化している可能性が存在して
いる。従って、フォーム認識ソフトウエアによって使用
されるテーブル又はセルの位置決め用の技術はタイトル
ブロック位置決めに対しては適切なものではない。
【0011】通常、技術的な図面は、境界、穿孔用の充
填用余白、図面空間を制限するためのフレーム、ポジシ
ョニング及び配向状態を示すための中心位置決め及び配
向マークを有している。然しながら、それらは常に存在
するものではないのでこれらの特徴を信頼することは不
可能である。更に、タイトルブロックの位置決めは、通
常、技術的図面のスキャンしたイメージに基づいて行わ
れ、且つ上述した特徴はスキャニング期間中の図面の不
良なポジショニングに起因してスキャンしたイメージか
ら存在していない場合がある。従って、タイトルブロッ
クの位置決めはその他のファクタに基づくべきである。
【0012】D. Lopresti及びG. Nhg
y著「自動化テーブル処理:(独断的)調査(Auto
mated Table Processing: A
n(Opinionated) Survey)」、G
REC’99のプロシーディングズ、109−134頁
の文献は、テーブル内のセルの位置が関与する場合に
は、一般的に、セルの境界を画定するラインを見分ける
ことによってドキュメントのイメージからテーブルの構
造を抽出することが必要であることを示している。この
ような方法は技術的な図面におけるタイトルブロックの
位置に対して直接的に適用可能なものではない。
【0013】「パターン認識(Pattern rec
ognition)」、Vol.3、No.9、135
3−1368(1998)におけるJ−L Chen及
びH. J. Lee著「ストリップ投影を使用したフ
ォーム構造抽出用の効率的なアルゴリズム(An ef
ficient algorithm for for
m structure extraction us
ing stripprojection)」は、イメ
ージからのテーブルの構造を抽出する方法を提案してい
る.然しながら、この技術は、例えば技術的図面上の説
明等の特定の構造の位置に対して適応されているもので
はない。
【0014】T. Syeda−Mahmood著「工
学図面におけるイメージ構造から検索用キーワードの抽
出(Extracting Indexing Key
words from Image Structur
es in Engineering Drawing
s)」、ICDAR’99のプロシーディングズ、47
1−474(1999)は、特に、技術的図面における
タイトルブロックの位置決め及びその後のタイトルブロ
ックからの情報の抽出の問題を取扱っている。特定の二
次元構造を見つけ出すために「ロケーションハッシング
(location hashing)」方法が使用さ
れている。この技術は複雑であり、且つ位置決めすべき
各構造に対するモデルを確立するための学習フェーズを
必要とするという欠点を有している。従って、この方法
は、技術的図面における本来的な変化する可能性に鑑み
て適切なものではない。
【0015】2000年3月22日付で出願した本発明
者の先のフランス特許出願第0003639号において
は、タイトルブロック位置決めの問題はテーブル状フォ
ーム処理用の新たな方法に基づいて解決している。然し
ながら、この場合にも、この方法は位置決めされるべき
各異なるタイプのタイトルブロックに対するモデルを必
要とする欠点を有している。
【0016】タイトルブロック位置決め方法は、G−
F. Arias、A. Chhabra及びV. M
isra著「グラフィックス認識の実際的適用:電話会
社図面からの情報の抽出の手助け(A Practic
al Applicationof Graphics
Recognition: Helping wit
h the Extraction of Infor
mation form Telephonic Co
mpany Drawings)」、GREC’97の
プロシーディングズ、273−279頁(1997)に
おいて提案されている。この方法は、R. Kastu
ri及びK. Tombre「グラフィックス認識−方
法及び適用(Graphics Recognitio
n−Methods and Application
s)」、コンピュータサイエンスにおけるレクチャノー
ト、Vol.1072、35−48頁、スプリンゲル−
フェアラーク、ベルリン、ドイツ、1996における
A. CHHABRA、V.Misra及びJ−F.
Arias著「雑音のあるランレンス符号化画像におけ
る水平ラインの検知:高速方法(Detection
of horizontal lienes in n
oisy run length encoded i
mages: The FAST method)」に
記載されているFAST方法に基づいており、それは図
面のクロップ(即ち、収穫物)から直線を抽出すること
を可能とする。これらの直線が抽出された後に、空でな
いセルが検知される。ある幅対高さ比の条件を満足する
最も大きな面積を有するセルを検知することによってタ
イトルブロックが位置決めされる。この全体的な技術
は、セルが特定の寸法を有しているドキュメントに対し
て特定的なものであり、従って技術的な図面におけるタ
イトルブロックにおけるようにセル寸法が変化する蓋然
性がある場合には有用なものではない。
【0017】
【発明が解決しようとする課題】本発明はテーブル位置
決めの従来方法において固有の問題及び欠点を解消せん
とするものである。より詳細には、本発明の好適実施例
は、ドキュメント状に存在する特定のテーブルを信頼性
を持って且つ迅速に位置決めすることが可能であるロー
バスト即ち確固としたテーブル位置決め方法及び装置を
提供する。本発明技術では、ドキュメントのサブ領域の
解析が関与し、これらのサブ領域はドキュメントの「ク
ロップ」(即ち、収穫物)と呼ばれる。
【0018】
【課題を解決するための手段】本発明は、ドキュメント
内のテーブルを自動的に位置決めする方法を提供してお
り、本方法は、ドキュメントの複数個のクロップを画定
し、該ドキュメントの各クロップに対して、その長さが
所定のスレッシュホールド値以上であるラインの位置を
決定し、前記ラインの密度を表わすパラメータを評価
し、前記評価したパラメータに基づいて前記複数個のク
ロップのうちのどの1つが前記テーブルの位置を有して
いるかを決定する、上記各ステップを有している。
【0019】検知したイメージラインは、そのイメージ
が表示される媒体の背景カラーのピクセルではなくその
イメージを構成するラインに対応する。検知されたライ
ンの長さは任意の便宜的な対応で決定することが可能で
ある。例えば、処理したドキュメントがスキャンされ且
つ解析されるものがスキャンされたイメージである場合
には、異なるスキャンライン上に存在するイメージピク
セルの数をカウントすることが便利な場合がある。別の
例として、ドキュメントのイメージがHPGL(ヒュー
レットパッカードグラフィックスランゲージ)表現の下
で解析される場合には、そのデータはベクトル形式であ
り且つそのベクトル情報はそのイメージを構成している
ラインの長さに関するデータを有している。明らかに、
検知されたラインの長さは、例えば、そのラインを構成
しているイメージピクセルの数によって、従来の測定単
位(センチメートル、ミリメートル)によって、等の任
意の便利な態様で表わすことが可能である。
【0020】検知したラインの密度を表わす評価された
パラメータは各クロップに対して定義されたグループ内
の検知されたラインの数とすることが可能であり、これ
らのラインの隣接する対の間の分離が基準値未満である
場合には、ラインは共通のグループに割当てられる。決
定処理は、又、異なるクロップにおける検知されたライ
ンの太さを考慮する場合がある。
【0021】本発明の自動的テーブル位置決め方法が技
術的な図面におけるタイトルブロックの位置決めに適用
される場合には、複数個のクロップがドキュメントの夫
々の角部又は端部に対応するものであることが有益的で
ある。
【0022】本処理が減少させた解像度でドキュメント
のイメージに対して適用される場合には、本発明に基づ
くテーブル位置決め方法の速度が改善することが判明し
ている。更に、このことは、又、本方法をよりローバス
ト即ち確固としたものとさせる。
【0023】本発明に基づく方法はドキュメント全体か
らの信号測定に基づいている。更に、それは比較的少な
い数のパラメータの評価が関与しており、そのパラメー
タの各々は物理的な意味を有している。従って、それは
ローバスト即ち確固としたものであり且つ信頼性のある
ものである。更に、それは自動的ドキュメント処理装置
に統合するのに充分に高速である。
【0024】A4フォーマットにおける技術的な図面に
おける自動的タイトルブロック位置決めに対して適用さ
れる本発明に基づく方法の好適な実施例は98%の認識
率を与えており、その場合に説明位置の不正確な表示は
存在せず、且つA0−A3フォーマットにおける図面に
対しては82%の認識率であり、説明位置の不正確な表
示は2%であるに過ぎない。
【0025】本発明は、更に、上述した方法を適用する
ことによってドキュメントにおけるテーブルを自動的に
位置決めする装置を提供している。
【0026】
【発明の実施の形態】本発明の以下の好適実施例の説明
は技術的な図面におけるタイトルブロックの位置決めに
関連している。然しながら、理解すべきことであるが、
本発明の技術は、一般的に、ドキュメントにおけるテー
ブルの位置決めに対して適用可能なものである。
【0027】本発明の第一の好適な実施例に基づく方法
の主要な解析的ステップの特性について図2乃至8を参
照して説明する。
【0028】本発明者等は、技術的な図面におけるタイ
トルブロックが、通常、以下の特性を所有するものであ
ることを見出した。
【0029】※それはテーブルのようなものであり(セ
ルの集合)、集合全体は10cmより大きな幅と4cm
及び28cmの間からなる高さとを有しており、 ※構成セルの高さは、通常、約0.5cm及び3cmの
間から構成されており、且つ ※それは図面の角部のうちの1つ、通常タイトルブロッ
クの内容を読取るための通常の方向に見た場合の右下角
部に位置している。
【0030】これらの観察に基づいて、本発明者等は、
図面の角部又は端部に対応する夫々のサブ領域の解析に
基づくタイトルブロック位置決め技術を採用することと
なった。上述したように、このような各サブ領域は図面
のイメージの「クロップ」(即ち、収穫物)と呼ぶこと
が可能である。例えば、図2に示した技術的な図面の場
合には、図面の角部に対応する解析用のクロップは図3
に例示したように識別することが可能である。より詳細
に説明すると、図2に示した技術的な図面はA0ドキュ
メントであり、且つ図3に示した各クロップに対するク
ロップ幅は18cmであり、クロップ高さは13cmで
ある。
【0031】本発明の第一の好適実施例においては、図
面の角部に対応するクロップは各水平ライン上に存在す
る黒色のピクセルの数を評価することによって解析され
る。この解析は、通常、例えばTIFF(Tagged
Image File Format)において図面
のスキャンしたイメージに基づいてパソコンによって実
施される。黒色ピクセルの評価した数がこの数の黒色ピ
クセルを並べて配置させることによって形成されるライ
ンの長さによって表わされる場合に便利である。対応す
る水平ラインの垂直位置に関して評価したライン長さの
プロットは「投影プロファイル」と呼ばれる。図4は図
2に示した図面に基づいて図3において識別された4個
のクロップに対して計算した投影プロファイルを示して
いる。タイトルブロックを包含する角部は図2の図の右
下角部である。図4dに示したこの角部の投影プロファ
イルは実質的に規則的な態様で離隔している多数のピー
クを包含していることが理解される。このことは規則的
な態様で離隔されている多数の比較的長いラインに対応
している。
【0032】本発明の第一の好適な実施例によれば、異
なるクロップに対して決定される投影プロファイルにお
けるピークに基づいて、該図面のどのクロップがその図
面のタイトルブロックに対応するか又はそれを包含する
ものであるかの選択が行われる。このことは各クロップ
のイメージにおける長いラインの検知となる。この実施
例に基づく選択処理のステップは図8a及び8bのフロ
ーチャートに要約しており、その場合に、図8aは、長
いラインを識別し且つ各クロップにおける長いラインの
密度を表わすパラメータを評価することに関与するステ
ップを示しており、且つ図8bは評価されたパラメータ
に基づいてどのクロップがタイトルブロックを包含して
いるかを選択する好適なアルゴリズムを示している。
【0033】最初に、あるクロップを考慮から除外する
ことが助けとなる場合がある。例えば、A0乃至A3フ
ォーマットにおける技術的な図面におけるタイトルブロ
ックの位置決めの場合において、タイトルブロックは殆
どいつも図面の左上角部か右下角部に位置している。従
って、他の角部を考慮から除外することによって決定ア
ルゴリズムを高速化させることが可能である。このこと
は、例えば、解析すべきクロップの総数を表わすパラメ
ータNの値をクロップの総数未満に設定し、且つ可能性
のある候補者(即ち、左上及び右下)であるクロップの
みを解析するためにクロップのインデックスnの値を割
当てるか、又は始めに蓋然性のない角部に対するクロッ
プを単に定義しないことによって行うことが可能であ
る。
【0034】解析すべきクロップのうちの最初のもの
(n=1)に対して、投影プロファイルを検査し且つ所
定のスレッシュホールド値(ここでは、「Thresh
old」として指定される)に関してピークを識別する
(図8aのステップS1−S3を参照)。種々のクロッ
プを画定するために使用されるクロップ幅が18cmで
ある技術的な図面におけるタイトルブロックの位置決め
においては、適切なThreshold値は10cmで
ある。そのようにして識別されたピークはイメージ内に
存在する「長い」ラインに対応する。
【0035】次に、各ピークに対して、プロファイルが
スレッシュホールド値を交差する2つの位置が決定さ
れ、且つこれらはそのプロファイルにおける「高い領
域」の始め(pi1)及び終わり(pi2)に対応する
(図5参照)。これらの始めの位置及び終わりの位置の
リストを作成する。次いで、投影プロファイルSを、こ
の始めの位置と終わりの位置とのリスト、即ちS=
[(pi1,pi2)]iによって表わすことが可能で
ある。パラメータHiRegThickも評価され(図
8aのステップS4)且つ図面のこのクロップ内に存在
する長いラインのグローバル即ち全体的な太さを表して
いる。特定のクロップに対するHiRegThick
は、そのクロップに対する投影プロファイルにおけるス
レッシュホールドを超える区域の幅の和に等しい。換言
すると、HiRegThick=(pi2−pi1)で
ある。
【0036】時々、スレッシュホールドを超える区域の
始めの点及び終わり点のリストによる投影プロファイル
の表示は、投影プロファイル内に短いディップ即ち窪み
が存在するある場合をマスクする場合があり、このよう
な場合を図6における丸印領域によって示してある。丸
印を付けたピークの対を別々の高い領域として考えるの
は適切ではなく、それらは、実際には、共通の領域の一
部である。換言すると、一対の高い領域は、実際には、
2つの隣り合った薄いラインではなく、単一の厚いライ
ンに対応している。従って、本発明の好適実施例におい
ては、このようなピークは単一の高い領域に合体される
(図8aのステップS5)。
【0037】どの対のピークを合体すべきかを決定する
手段として、「MergeThreshold」という
基準値を使用することが可能である。高い領域の開始位
置及び終了位置のリストを処理して、Ti=p(i+
1)1−pi2,i 1(図7参照)のようにして隣接
する高い領域の間の分離Tを決定する。与えられた対の
隣接するピークの間の分離がMergeThresho
ldよりも小さい場合には、問題のピークが合体され
る。例えば、(p21,p22)及び(p31,p3
2)によって表わされる一対のピークが合体される場合
には、リスト中のエントリ(p21,p22)及び(p
31,p32)が(p21,p32)の値を有する単一
のエントリによって置換される。技術的な図面に関する
限り、適切なMergeThesholdの値は、例え
ば、0.2cmである。
【0038】本発明の第一の好適な実施例に基づく投影
プロファイルの上述した解析は、図面の種々のクロップ
内の比較的長いイメージラインを検知する処理を構成し
ている。長いラインが検知されると、本発明によれば、
ラインのグループを定義すること(図8aのステップS
6)、及びこれらのグループのうちの1つ又はそれ以上
のパラメータを参照することによってどのクロップが位
置決めされるべきテーブルを有しているかを決定するこ
とが有益的なものであることが判明した。
【0039】どの検知されたライン(投影プロファイル
における高い領域)が与えられたグループに対して割当
てられるべきかを決定する場合に、隣接するピークの間
の分離Tが再度考慮される。この時は、それらの間の分
離が「PeakGroup」という基準値よりも小さい
場合には、同一のグループに属するものと考えられる。
与えられた組のピークに対して、各対の隣接するピーク
の間の分離がPeakGroupより小さい場合には、
隣接するピークは対のようなものであると考えられ、従
ってピークの組全体が同一のグループに属する。例え
ば、T1,T2,T3の各々がPeakGroupより
小さい場合には、図7に示したピークの全てが単一のグ
ループに属することとなる。実際には、T1及びT2<
PeakGroupであるがT3>PeakGroup
であり、従って図7の左側の3個のピークのみが共通の
グループに属する。技術的な図面のタイトルブロックに
おけるセルの典型的な高さ(0.5−3cm)に関して
の発明者等の知見に基づいて、PeakGroupを3
cmに設定することが望ましい。このグループ化処理の
結果は各クロップ内に存在している高い領域のグループ
のリストである。
【0040】上述したように、各高い領域は比較的長い
ラインに対応している。従って、各グループは互いに3
cmの分離内の対のようなものである1組の長いライン
に対応している。そのクロップが技術的な図面のタイト
ルブロックに対応する場合には、長いラインの1つの識
別されたグループのみが存在すべきである。然しなが
ら、あるタイプのイメージを包含するクロップに対して
は長いラインの複数個のグループが識別される場合があ
る。
【0041】次に、各夫々のクロップを代表するものと
して1つのグループを選択することが便利である。好適
には、その代表的なグループは最大多数の高い領域(長
いライン)を包含しているものであり、グループ当たり
のライン数は、ここでは、NbRegとして指定し且つ
図8aのステップS7において評価される。然しなが
ら、NbRedの2番目に高い値(即ち、2番目に最大
多数の高い領域)を包含するグループを選択することが
望ましい場合がある。特に、第一選択グループ(及び、
必要な場合には、第二選択グループ)はそのグループと
イメージ境界との間の距離に関して妥当性が評価され
る。選択されたグループがイメージ境界に対する最も近
いグループである場合には、その距離がDistBor
der1と呼ばれる基準値と比較される(図8aのステ
ップS9−S10)。選択されたグループがイメージ境
界に対して2番目に近いグループである場合には、この
グループと境界に最も近いグループとの間の距離が基準
値DistBorder2と比較される(図8aのステ
ップS11)。その比較された距離が夫々の基準値より
も大きい場合には、その選択されたグループは図面のタ
イトルブロックに対応することは不可能である。発明者
等の知見に基づいて、DistBorder1を3cm
に設定し且つDistBorder2を2.5cmに設
定することが望ましい。
【0042】本発明の好適実施例においては、各クロッ
プを表わすべく選択されたグループの妥当性評価を行う
ための更なるテストを実施する。より詳細に説明する
と、夫々のグループ内の高い領域の間の平均距離は所定
の範囲の値内のものとすべきである(図8aのステップ
S14においてチェック)。この平均距離はタイトルブ
ロック内の1個のセルの平均高さと比較することが可能
である。従って、この点に関しての発明者等の知見に基
づいて、代表的なグループが技術的な図面のタイトルブ
ロックに対応する場合には、この平均距離は0.5−3
cm(上限及び下限を含む)の範囲内とすべきである。
【0043】最大多数の高い領域を包含している2つの
グループが無効なものである場合には、理論的には、こ
のクロップを表わす次の最大多数の高い領域を有するグ
ループが有効なものである(上述したDistBord
er2及び平均距離テストに関して)場合には、そのグ
ループを選択することが可能である。然しながら、その
代わりに、タイトルブロックの位置として問題のクロッ
プを考慮から除外すべく決定される場合にはより良い結
果が達成されることが判明した(図8b上の点Cへの分
岐である図8aのステップS12参照)。最大多数(又
は2番目に最大多数)の高い領域を有するグループが有
効なものである場合には、そのグループが問題のクロッ
プを表わすグループとして選択される(ステップS1
5)。
【0044】好適には、どのクロップがその図面のタイ
トルブロックを有するか否かの決定は、各クロップに対
して選択された代表的なグループの特性に基づいて行わ
れる。図8bはこの決定を行うための好適なアルゴリズ
ムを表わしたフローチャートを示している。
【0045】最初に、他の全てのクロップよりも大きな
NbRegを有する単一のクロップが存在するか否かを
ステップS18乃至S20において決定する。その結果
が「肯定」である場合には、ステップS21においてこ
の単一のクロップがテーブル位置として選択され、且つ
その決定処理は終了する。然しながら、NbRegが全
てのクロップに対してゼロである場合には(ステップS
18において決定)、テーブル位置に関する決定はパラ
メータHiRedThickに基づいて行われる。Hi
RegThickの最大値を有するクロップがステップ
S22において決定される。このクロップはテーブル位
置として選択され(ステップS25において)且つ、H
iRegThickのこの値が2つのテストをパスした
場合には、この決定処理は終了する。最初のテスト(ス
テップS23)は、HiRegThickが「MinD
etect」と呼ばれる基準値よりも大きいことを検証
する。MinDetectはタイトルブロック内のセル
を区画する長いラインの集合によって示される蓋然性の
ある最小の太さの大きさを表わしている。発明者等の知
見に基づいて、MinDetectを0.3cmに設定
することが望ましい。2番目のテスト(ステップS2
4)は、選択したクロップに対するHiRegThic
kの値とHiRegThickの次に最も高い値との間
の差が「Tolerance」と呼ばれる値を超えるこ
とを検証する。発明者等の知見に基づいて、Toler
anceをテスト中のHiRegThickの値の50
%に設定することが望ましい。
【0046】HiRegThickの最も高い値が上述
した2つのテストのいずれかに不合格である場合には、
本方法は、タイトルブロックの位置に関して決定を行う
ことが出来なかったことの表示を返す(ステップS2
6)。タイトルブロックの位置を「手作業」によって決
定することはユーザの随意である。これは「拒否」と呼
ばれる。
【0047】ステップS20において、NbRegの最
も高い値が2個又はそれ以上のクロップによって共有さ
れていることが決定される場合には、再度、タイトルブ
ロックの位置に関して決定を行うことが不可能であるこ
との信号を発生することが望ましい(ステップS2
6)。
【0048】上述した説明は、本発明の好適実施例にお
いて実施される解析の主要なステップの概略である。古
い図面及びタイトルブロックが部分的に消去されている
図面の場合であっても技術的な図面においてタイトルブ
ロックを位置決め即ち探し出す上述した方法は成功裡に
適用されている。本方法の信頼性を測定するテストにつ
いて以下に詳細に説明する。然しながら、テスト結果を
提示する前に、タイトルブロック位置決め処理の信頼性
及び/又は速度を更に改善するために上述した方法ステ
ップに関連することが可能な幾つかの前処理段階につい
て検討することが適切である。これらの前処理段階とし
ては、好適には、以下のものを包含している。
【0049】※フォーマット(用紙寸法に関して)及び
分解能(dpiに関して)の検証、 ※解析すべきイメージの分解能の減少、 ※解析すべきイメージのデスキューイング(矯正)、 ※イメージを取囲むフレーム又は境界の検知(このよう
な境界又はフレームは、通常、技術的な図面において存
在している)。
【0050】多数の理由により解析すべきドキュメント
のフォーマット及び分解能を検証することが有益的であ
る。最初に、幾つかの場合においては、その図面に関す
る情報が非常に悪いものであって、有意義な解析を行う
ことが不可能な場合がある。第二に、A0乃至A3フォ
ーマットにおける図面と比較してA4フォーマットにお
ける図面に対する異なるクロップを定義することが好適
である(後述)。図面の分解能(dpi即ち1インチ当
たりのドット数において)、即ち図の高さ及び幅がチェ
ックされ且つ標準値と比較される。測定された表面値が
基準値の25%内である場合には、その図面は解析を行
うために受付けられる。そうでない場合には、本方法は
図面の拒否へリターンする。
【0051】実験によれば、本発明に基づく検知方法の
速度及び信頼性は、分解能を減少させた図面のイメージ
に関して解析を行う場合に両方とも改善させることが判
明した。信頼性における改善は、ラインを強調させ且つ
ちぎれたラインを回復させる傾向がある減少処理自身か
ら発生するものと考えられる。発明者等の知見に基づい
て、50dpiの分解能で図面のイメージを発生させ、
次いでこの分解能を減少させたイメージから投影プロフ
ァイル等を計算することが望ましい。
【0052】本発明の第一の好適な実施例が図面のスキ
ャンしたイメージの解析が関与するので、スキャニング
処理期間中に不整合エラー(スキュー)が発生する場合
がある。これは上に説明した方法の性能を減少させる。
従って、本発明の解析ステップを適用する前に、スキュ
ーを検知し且つそれを補正することが有益的である。市
場においてはスキューを検知し且つ補正する種々のアル
ゴリズムが入手可能である(例えば、Y. K. Ch
en及びJ. F. Wang著「遷移カウントの変化
の最大化に基づいたスキュー回復(Skew reco
nstruction based on maxim
ization of variance of tr
ansition−counts)」、パターン認識3
3(2000)、195−208頁参照)。
【0053】前処理段階期間中、通常主要な図面の周り
に描かれるフレームを検知することが望ましい。上述し
たように、このフレームのポジショニングに関する情報
は、好適には、クロップに対する代表的なグループの選
択の妥当性評価(DistBorder1及びDist
Border2の値により)を行うために使用される。
フレームを検知するための好適な方法は、ドキュメント
のエッジ即ち端部に対する水平及び垂直な投影プロファ
イルを発生し、且つ4つのドキュメント端部近くにおけ
る最も長いラインを見つけ出すためにこれらの投影プロ
ファイルを解析するものである。これらのラインが交差
する場合には、それらは図のフレーム即ち画枠を表わす
ものと考えられる。図のフレームを見つけ出すための別
の方法は、ドキュメント上に存在する最大のボックスを
検知することである。
【0054】図面の周りに位置されているフレームを検
知することが不可能であることが判明した場合には、フ
レームに関してではなくドキュメントの端部に関して与
えられたクロップに対して選択された代表的なグループ
の選択の妥当性評価を行うことが可能である。然しなが
ら、一般的には、フレームを位置決め即ち探し出すこと
が不可能である場合には、タイトルブロックに対しての
位置を特定することが不可能であることを表わす「拒
否」を発行することが望ましいものと考えられる。
【0055】本発明の好適実施例に基づく方法の上の説
明においては、種々のクロップを定義するために使用さ
れる角部のクロップはクロップ幅18cm及びクロップ
高さ13cmを有していた。A0乃至A3フォーマット
のドキュメントにおけるタイトルブロックを位置決めす
る場合にはこれらの寸法を有する角部クロップを使用す
ることが有益的であることが判明している。然しなが
ら、A4ドキュメントにおけるタイトルブロックを位置
決め即ち探し出す場合には、21cmのクロップ幅(用
紙の幅に等しい)及び13cmのクロップ高さを与える
ドキュメントの上部及び底部端部に対応する端部クロッ
プを使用することが望ましい。図9は主要な用紙フォー
マットの全てに関しての好適なクロップ寸法を示してい
る。
【0056】上述した本発明の第一の好適な実施例にお
いては、ドキュメントのスキャンしたイメージのライン
上に存在するイメージピクセルの数を評価することによ
ってドキュメントの種々のクロップにおいてラインを検
知している(投影プロファイルを発生)。解析すべきド
キュメントがベクトルフォーマットにおけるデータ(例
えばHPGL)によって表わされる本発明の第二の好適
な実施例においては、対応する投影プロファイルはベク
トルデータから直接的に発生され、それはイメージ内の
ラインの長さ及び位置及び夫々のラインの太さを表わ
す。本発明の3番目の好適実施例においては、解析すべ
きドキュメント上のラインは上述したChhaebr,
Misra及びAriasの「FAST」方法によって
見つけ出される。ラインデータは、どのようにして派生
されようとも、上述したThreshold値を超える
長さを有するラインの位置を決定し、且つPeakGr
oup基準値に関して1個又はそれ以上のグループに対
して種々のラインを割り当てるために処理される。パラ
メータHiRegThickの値は与えられたクロップ
内のラインの太さを加算することによって決定される。
上述した前処理段階が必要とされないということを除い
て、残りの処理は本発明の第一の好適実施例についての
ものと実質的に同じである。
【0057】本発明に基づく方法の有効性を評価するた
めに、788個の技術的な図面のスキャンしたイメージ
のデータベースに関してテストを実施した。これらのス
キャンした図面はTIFFフォーマットであり且つA0
乃至A3フォーマットに対しては500TIFF画像に
対応しており且つA4フォーマットに対しては288T
IFF画像に対応していた。図面の出展に依存して、分
解能は異なっており(200乃至400dpi)且つス
キャンの品質においても差異が存在していた。説明が部
分的に消去された図面があり、スキャン問題に起因して
主要なフレームが不完全なものも且つ黒色の境界を有し
ているものも存在していた。説明のタイプも異なってい
た。
【0058】上記テストでは以下のものを測定した。
【0059】※正しく位置決めされたタイトルブロック
の百分率(「認識率」と呼ぶ)、 ※該方法が説明の位置を決定するものでなかった図面の
百分率(「拒否率」と呼ぶ)、 ※該方法がタイトルブロックに対する不正確な位置を発
生した図面の百分率(「混乱率」と呼ぶ)。
【0060】該テストは、タイトルブロック位置決めに
おける本発明に基づく方法の有効性を照明し、且つ矯正
及び分解能前処理段階が該方法の信頼性に関してどのよ
うな効果を有しているかを評価せんとするものであっ
た。本発明の第一の好適実施例の方法を使用してテスト
結果を得且つ表1に要約してある。
【0061】
【表1】
【0062】本発明に基づく方法は技術的な図面におけ
るタイトルブロックの位置の信頼性のある表示を与える
ものであることを上記テスト結果は示している。特に、
混乱率は非常に低く、不正確な説明位置決めは50にお
いて1又は2,3の場合であることが示されている。更
に、これらのテストが示すところによれば、解析するス
キャンしたイメージに対して矯正及び分解能の減少を適
用することによって認識率における改善を得ることが可
能である。分解能を50dpiへ減少させることはA0
ドキュメントに対する処理時間を約5秒から1秒未満へ
減少させることが該テストによって判明した。
【0063】矯正を行うが分解能を減少させない場合に
得られたテスト結果を詳細に検討した結果、A4フォー
マットにおける図面の場合には、タイトルブロック位置
決めの表示を該方法が与えることに失敗した場合の多く
がスキャンしたイメージにおける黒色の境界が存在する
ことに起因するものであることが判明した。黒色の境界
は、又、A0−A3フォーマットにおける図面に対して
混乱の場合の幾つかを発生させた。A0−A3フォーマ
ットにおける図面の場合には、不可思議なタイトルブロ
ックを有する古い図面の場合において拒否が主に発生し
ていた。これらの図面の場合には、その他の混乱の原因
としては、図面の左上又は右下角部内において、タイト
ルブロック内に存在するよりもより多くのガイドライン
を有するテーブルが存在していたこと、図面におけるス
キャンの不完全性(曲がった又はちぎれたラインとな
る)、且つ図面が部分的に消去された説明を有している
こと(このような場合の大多数においては、これは混乱
というよりも拒否となるものであるが)等であった。
【0064】デスキューイング即ち矯正及び分解能の減
少の両方が適用される場合には、全てのフォーマットに
おける図面に対して認識率の改善が見られる。混乱は、
殆ど、説明と反対側の角部内に表われるテーブルに起因
するものである。
【0065】分解能の減少が50dpiではなく100
dpiである更なるテストを行った。このことは認識率
において僅かな改善を発生したが、その効果は顕著なも
のではなかった。
【0066】パラメータHiRedThickの許容可
能な値に関する条件と共に又はそれなしで、どのクロッ
プがタイトルブロックを包含するものであるかの決定を
このパラメータのみに基づいて行うことが可能であるか
否かを決定するための更なるテストを行った。これらの
テストによれば、認識率が減少したか及び/又は混乱率
が許容不可能に増加したかのいずれかであった。
【0067】上述したテストの全ては、C++でのイメ
ージライブラリィに加えてスクリプト言語で書かれたコ
ンピュータプログラムによる本発明に基づく方法の実現
を包含するものであった。プログラムを完全にC++で
書き直すことによって処理速度を更に改善することが可
能であるものと思われる。更なる前処理段階として黒色
の境界を除去するアルゴリズムを付加することによって
付加的な改善が得られる。
【0068】本発明を特定の好適実施例について説明し
たが、本発明から逸脱することなしに種々の変形及び修
正を行うことが可能であることを理解すべきである。
【0069】例えば、本発明の好適実施例においては、
スキャンしたドキュメントの角部又は端部に対応するク
ロップを解析している。タイトルブロックは、通常、1
つの角部に位置されているので、処理を高速化するとい
う根拠によれば技術的な図面におけるタイトルブロック
の位置決めの場合にはドキュメントの角部又は端部のみ
を解析して決定を行うことが有益的である。然しなが
ら、ドキュメントの他の部分に対応するクロップを解析
することが望ましい場合もあり、ドキュメント全体をカ
バーするようなクロップの組に広がる場合もある。
【0070】更に、第一の好適な実施例におけるように
解析されたクロップのラインに沿って存在する黒色ピク
セルの数を評価することが必ずしも適切でない場合があ
る。イメージがネガティブなものとされる場合には、白
色のピクセルをカウントすることがより適切な場合があ
る。カラーのドキュメントの場合には、黒色以外の何等
かのカラーのピクセルの数を評価することが望ましい場
合がある。一般的に、図が描かれている媒体の背景のカ
ラーのピクセルではなくイメージを構成しているピクセ
ルであるイメージピクセルをカウントすることが望まし
い。
【0071】更に、本発明の好適実施例の上述した説明
では特定の方法ステップとパラメータ値との組合わせを
示している。理解すべきことであるが、本発明はこのよ
うな特定の組合わせに制限されるべきものではない。よ
り詳細には、これらの特徴は分離可能なものであり且つ
異なる部分結合で結合させることが可能である。
【0072】以上、本発明の具体的実施の態様について
詳細に説明したが、本発明は、これら具体例にのみ制限
されるべきものではなく、本発明の技術的範囲を逸脱す
ることなしに種々の変形が可能であることは勿論であ
る。
【図面の簡単な説明】
【図1】 国際基準ISO5457において特定されて
いる技術的図面におけるタイトルブロックのポジショニ
ングを示すものであって、(a)は通常の水平配向状態
におけるタイプXドキュメントを示しており、(b)は
通常の垂直配向状態におけるタイプYドキュメントを示
しており、(c)は垂直の配向状態とされたタイプXド
キュメントを示しており、(d)は水平の配向状態とさ
れたタイプYドキュメントを示している。
【図2】 技術的な図面の1例を示した概略図。
【図3】 図2に示した技術的な図面の夫々の角部に対
応するクロップを示した概略図。
【図4】 図2に示した技術的な図面の夫々の角部にお
ける投影プロファイル(ライン当たりの黒色ピクセルの
数に対応)を示しており、(a)は図2の図面の左上角
部に対応する投影プロファイルを示しており、(b)は
図2の図面の右上角部に対応する投影プロファイルを示
しており、(c)は図2の図面の左下角部に対応する投
影プロファイルを示しており、(d)は図2の図面の右
下角部に対応する投影プロファイルを示している。
【図5】 本発明の第一の好適な実施例に基づく投影プ
ロファイルにおけるピークに対してどのようにしてスレ
ッシュホールド処理が適用されるかを示した概略図。
【図6】 本発明の第二の好適な実施例に基づく投影プ
ロファイルにおけるピークに対してどのようにして合体
処理が適用されるかを示した概略図。
【図7】 本発明の第一の好適な実施例に基づいて投影
プロファイルにおけるピークがどのようにしてグループ
化されるかを示した概略図。
【図8A】 解析したクロップにおけるラインの密度を
表わすパラメータを発生する1つのアルゴリズムを例示
したフローチャート。
【図8B】 複数個の解析したクロップのいずれが技術
的図面のタイトルブロックを包含しているかを決定する
1つの好適なアルゴリズムを示したフローチャート。
【図9】 本発明の好適実施例に基づいて異なる寸法の
図面内のクロップをどのようにして解析を行うために識
別するかを示した概略図。
【符号の説明】
T:隣接するピーク間の分離(間隔)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ミカエル ベルナール ルイ バルベイ フランス国, 92400 クールブボワ, リュ アーマン シルヴェストル 22 Fターム(参考) 5L096 BA12 FA03 FA16 JA11

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 ドキュメントにおいて自動的にテーブル
    を位置決めする方法において、 ドキュメントの複数個のクロップを画定し、 前記ドキュメントの各クロップに対して、その長さが所
    定のスレッシュホールド値以上であるラインの位置を決
    定し、 前記ラインの密度を表わす少なくとも1個のパラメータ
    を評価し、 前記少なくとも1個の評価したパラメータに基づいて前
    記複数個のクロップのうちのどの1つが前記テーブルの
    位置を有しているかを決定する、上記各ステップを有し
    ていることを特徴とする方法。
  2. 【請求項2】 請求項1において、技術図面におけるタ
    イトルブロックの位置に対して適用されることを特徴と
    する方法。
  3. 【請求項3】 請求項2において、前記複数個のクロッ
    プが前記ドキュメントの夫々の角部に対応していること
    を特徴とする方法。
  4. 【請求項4】 請求項1乃至3のうちのいずれか1項に
    おいて、 前記評価ステップが、前記ラインのグループを画定する
    ことを包含しており、2本又はそれ以上のラインの隣接
    するものの間の分離が基準値未満である場合には前記2
    個又はそれ以上の隣接するラインを共通のグループに割
    当て、 前記決定ステップが、異なるクロップに対して画定され
    るラインのグループの少なくとも1個のパラメータを評
    価するステップを有している、ことを特徴とする方法。
  5. 【請求項5】 請求項4において、前記決定処理が、 各クロップに対して、各グループにおける前記ラインの
    数を評価し、且つ最大数のラインを有しており且つ妥当
    性テストにパスしたグループをそのクロップを代表する
    ものとして指定し、 その代表的なグループが最大数のラインを有しているク
    ロップをそのテーブルの位置を有するクロップとして選
    択する、上記各ステップを有していることを特徴とする
    方法。
  6. 【請求項6】 請求項5において、前記妥当性テスト
    が、前記ドキュメント上の境界から前記グループの距離
    を評価するステップを有していることを特徴とする方
    法。
  7. 【請求項7】 請求項5又は6において、前記妥当性テ
    ストが、前記グループ内の隣接するラインの間の分離を
    評価するステップを有していることを特徴とする方法。
  8. 【請求項8】 請求項5乃至7のうちのいずれか1項に
    おいて、各クロップに対する前記ラインの太さの和を評
    価するステップを有しており、最大数のラインを有する
    代表的なグループを有するクロップが存在しない場合に
    は、前記決定ステップが、他のクロップに対する対応す
    る評価した太さよりも著しく大きな評価した太さの和を
    有するクロップが存在しているか否かを決定し、且つ存
    在している場合には、そのクロップをテーブルの位置と
    して指定し、且つ存在しない場合には、テーブルの位置
    を選択することに失敗したことを表わす信号を発生する
    ことを特徴とする方法。
  9. 【請求項9】 請求項1乃至8のうちのいずれか1項に
    おいて、解析すべきドキュメントのフォーマットを検証
    する予備的なステップを有していることを特徴とする方
    法。
  10. 【請求項10】 請求項1乃至9のうちのいずれか1項
    において、ドキュメント上に存在するフレームの位置を
    決定し且つ境界を画定するステップを有していることを
    特徴とする方法。
  11. 【請求項11】 請求項1乃至10のうちのいずれか1
    項において、減少した分解能においてドキュメントのイ
    メージに対して適用することを特徴とする方法。
  12. 【請求項12】 請求項1乃至11のうちのいずれか1
    項において、ドキュメントのスキャンしたイメージに対
    して適用し、且つ本方法を適用する前にスキャンしたイ
    メージを矯正するステップを有していることを特徴とす
    る方法。
  13. 【請求項13】 請求項1乃至12のうちのいずれか1
    項に基づく方法を適用することによってドキュメント内
    のテーブルを自動的に位置決めすることを特徴とする装
    置。
JP2002045833A 2001-02-22 2002-02-22 ドキュメントにおける自動的テーブル位置決め Expired - Fee Related JP4145530B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01400470.9 2001-02-22
EP01400470 2001-02-22

Publications (2)

Publication Number Publication Date
JP2002279434A true JP2002279434A (ja) 2002-09-27
JP4145530B2 JP4145530B2 (ja) 2008-09-03

Family

ID=8182631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002045833A Expired - Fee Related JP4145530B2 (ja) 2001-02-22 2002-02-22 ドキュメントにおける自動的テーブル位置決め

Country Status (3)

Country Link
US (1) US7251349B2 (ja)
JP (1) JP4145530B2 (ja)
DE (1) DE60204066T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013500527A (ja) * 2009-07-30 2013-01-07 オセ−テクノロジーズ・ベー・ヴエー 文書内の表の自動的な位置特定
JP2019062415A (ja) * 2017-09-27 2019-04-18 富士ゼロックス株式会社 画像処理装置及びプログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7218684B2 (en) * 2001-11-02 2007-05-15 Interdigital Technology Corporation Method and system for code reuse and capacity enhancement using null steering
US9329827B2 (en) * 2004-12-29 2016-05-03 Funmobility, Inc. Cropping of images for display on variably sized display devices
JP4572248B2 (ja) 2008-06-23 2010-11-04 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、制御プログラム、記録媒体
JP4625861B2 (ja) * 2008-11-17 2011-02-02 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、制御プログラム、および記録媒体
JP4927122B2 (ja) * 2009-06-15 2012-05-09 シャープ株式会社 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体
US10296665B2 (en) * 2013-03-15 2019-05-21 On Center Software, Inc. Image management in construction project software programs
US10846525B2 (en) 2019-02-15 2020-11-24 Wipro Limited Method and system for identifying cell region of table comprising cell borders from image document
US11688193B2 (en) 2020-11-13 2023-06-27 International Business Machines Corporation Interactive structure annotation with artificial intelligence
EP4145403A1 (en) * 2021-09-03 2023-03-08 Tata Consultancy Services Limited Systems and methods for extracting, digitizing, and using engineering drawing data

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63158669A (ja) * 1986-12-23 1988-07-01 Matsushita Electric Ind Co Ltd 図面認識装置
JPH01321575A (ja) * 1988-06-23 1989-12-27 Matsushita Electric Ind Co Ltd 境界検出装置
JPH02204881A (ja) * 1989-02-02 1990-08-14 Canon Inc 図形文字分離方法
JPH03110685A (ja) * 1989-09-25 1991-05-10 Toshiba Corp 画像相関器
JPH0721309A (ja) * 1993-06-30 1995-01-24 Matsushita Electric Ind Co Ltd 文書認識装置
JPH0737036A (ja) * 1993-06-25 1995-02-07 Ricoh Co Ltd 矩形分類方法
JPH08305778A (ja) * 1995-04-21 1996-11-22 Xerox Corp ユーザの作成したマークの存在を調査するための方法
JPH09138837A (ja) * 1995-11-16 1997-05-27 Matsushita Electric Ind Co Ltd 帳票認識装置
JP2000182064A (ja) * 1998-12-18 2000-06-30 Xerox Corp ドキュメント処理システム及びインデックス情報獲得方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5129012A (en) * 1989-03-25 1992-07-07 Sony Corporation Detecting line segments and predetermined patterns in an optically scanned document
US5181255A (en) * 1990-12-13 1993-01-19 Xerox Corporation Segmentation of handwriting and machine printed text
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH06203165A (ja) * 1993-01-07 1994-07-22 Canon Inc 画像情報処理方法及び装置
JPH0721310A (ja) * 1993-06-30 1995-01-24 Matsushita Electric Ind Co Ltd 文書認識装置
DE69518467T2 (de) * 1994-06-03 2001-01-04 Riso Kagaku Corp Bildverarbeitungsgerät
US6137905A (en) * 1995-08-31 2000-10-24 Canon Kabushiki Kaisha System for discriminating document orientation
US5784487A (en) * 1996-05-23 1998-07-21 Xerox Corporation System for document layout analysis
GB2322498B (en) * 1997-02-14 1999-04-28 Ricoh Kk Book image reading apparatus and book image forming apparatus
US6757870B1 (en) * 2000-03-22 2004-06-29 Hewlett-Packard Development Company, L.P. Automatic table detection method and system
US6816630B1 (en) * 2000-05-22 2004-11-09 Electro-Sensors, Inc. System and method for creating and processing data forms

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63158669A (ja) * 1986-12-23 1988-07-01 Matsushita Electric Ind Co Ltd 図面認識装置
JPH01321575A (ja) * 1988-06-23 1989-12-27 Matsushita Electric Ind Co Ltd 境界検出装置
JPH02204881A (ja) * 1989-02-02 1990-08-14 Canon Inc 図形文字分離方法
JPH03110685A (ja) * 1989-09-25 1991-05-10 Toshiba Corp 画像相関器
JPH0737036A (ja) * 1993-06-25 1995-02-07 Ricoh Co Ltd 矩形分類方法
JPH0721309A (ja) * 1993-06-30 1995-01-24 Matsushita Electric Ind Co Ltd 文書認識装置
JPH08305778A (ja) * 1995-04-21 1996-11-22 Xerox Corp ユーザの作成したマークの存在を調査するための方法
JPH09138837A (ja) * 1995-11-16 1997-05-27 Matsushita Electric Ind Co Ltd 帳票認識装置
JP2000182064A (ja) * 1998-12-18 2000-06-30 Xerox Corp ドキュメント処理システム及びインデックス情報獲得方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013500527A (ja) * 2009-07-30 2013-01-07 オセ−テクノロジーズ・ベー・ヴエー 文書内の表の自動的な位置特定
JP2019062415A (ja) * 2017-09-27 2019-04-18 富士ゼロックス株式会社 画像処理装置及びプログラム
US11233911B2 (en) 2017-09-27 2022-01-25 Fujifilm Business Innovation Corp. Image processing apparatus and non-transitory computer readable medium for image processing

Also Published As

Publication number Publication date
DE60204066T2 (de) 2006-02-02
US20020154818A1 (en) 2002-10-24
US7251349B2 (en) 2007-07-31
JP4145530B2 (ja) 2008-09-03
DE60204066D1 (de) 2005-06-16

Similar Documents

Publication Publication Date Title
CN110766014B (zh) 票据信息定位方法、系统及计算机可读存储介质
CN110147774B (zh) 表格式图片版面分析方法和计算机存储介质
US6778703B1 (en) Form recognition using reference areas
JP4170441B2 (ja) 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
US7336813B2 (en) System and method of determining image skew using connected components
US8565474B2 (en) Paragraph recognition in an optical character recognition (OCR) process
US20120274991A1 (en) System and method for document orientation detection
US8027539B2 (en) Method and apparatus for determining an orientation of a document including Korean characters
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
CN114299528A (zh) 一种针对扫描文档的信息提取和结构化方法
US20220108555A1 (en) Text line image splitting with different font sizes
JP2002279434A (ja) ドキュメントにおける自動的テーブル位置決め
CN102737240B (zh) 分析数字文档图像的方法
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
Weliwitage et al. Handwritten document offline text line segmentation
US8249364B2 (en) Method for resolving contradicting output data from an optical character recognition (OCR) system, wherein the output data comprises more than one recognition alternative for an image of a character
Shweka et al. Automatic extraction of catalog data from digital images of historical manuscripts
US8320677B2 (en) Method for processing optical character recognition (OCR) output data, wherein the output data comprises double printed character images
CN115050025A (zh) 基于公式识别的知识点抽取方法及装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
EP1237115B1 (en) Automatic table location in documents
US8270725B2 (en) System and method for optical mark recognition
Biller et al. Evolution maps and applications
CN111046758A (zh) 一种打印暗记追踪比对方法及系统
Najman et al. Automatic title block location in technical drawings

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070403

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070702

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070705

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070802

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070807

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070903

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070906

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080130

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080204

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080227

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080303

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080319

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080325

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080618

R150 Certificate of patent or registration of utility model

Ref document number: 4145530

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110627

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120627

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130627

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees