JP2006106972A - 画像処理方法及び画像処理装置 - Google Patents

画像処理方法及び画像処理装置 Download PDF

Info

Publication number
JP2006106972A
JP2006106972A JP2004290386A JP2004290386A JP2006106972A JP 2006106972 A JP2006106972 A JP 2006106972A JP 2004290386 A JP2004290386 A JP 2004290386A JP 2004290386 A JP2004290386 A JP 2004290386A JP 2006106972 A JP2006106972 A JP 2006106972A
Authority
JP
Japan
Prior art keywords
cell
table frame
area
document
character information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004290386A
Other languages
English (en)
Other versions
JP2006106972A5 (ja
JP4587167B2 (ja
Inventor
Mitsuru Uzawa
充 鵜沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004290386A priority Critical patent/JP4587167B2/ja
Publication of JP2006106972A publication Critical patent/JP2006106972A/ja
Publication of JP2006106972A5 publication Critical patent/JP2006106972A5/ja
Application granted granted Critical
Publication of JP4587167B2 publication Critical patent/JP4587167B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】 本来文字情報が埋め込まれているセルが2値化処理により塗りつぶされることを防止し、表中の全ての文字情報を抽出する。
【解決手段】 原稿上の表領域における表枠の2値データを抽出し、表枠の2値データに基づいて表枠の表構成を認識し、その表枠の中より文字情報を抽出し、表枠を再処理する際に、表枠の表構成の認識結果に応じて文字情報を抽出する領域を選択し、該選択位置における文字情報を再抽出し、その表枠を再処理する。
【選択図】 図7

Description

本発明は、スキャナなどの入力装置より読み込まれた紙文書を編集可能な電子データへ変換する技術に関し、特に紙文書中の表枠オブジェクトを解析し、罫線に置き換える技術に関する
近年、情報の電子化が進み、文書を紙ではなく電子化して保存、あるいは送信するシステムが急速に普及している。特に、フルカラーの文書を保存、送信に適した電子データとしては、紙原稿を文字、表、図等のオブジェクトへ像域分離し、各オブジェクトに適した形態でデータ化したベクトルデータが適しており、データ量を削減し、更にオブジェクトを再利用することが可能となる。
ここで、文書中の表オブジェクトについては、像域分離処理により表中のテキスト情報を抽出する一方、表枠を2値画像データとして抽出することが可能である。この2値画像データとして抽出された表枠は、表枠の解析処理により、罫線などで表現されるベクトルデータに変換される(例えば、特許文献1参照)。そして、ベクトルデータに変換された表枠はベクトルデータとしてデータサイズが小さくなるだけでなく、表枠としての再利用性も高い。
特開平5−12489号公報
表枠及び表中のテキストを含めて、文書中のオブジェクトを2値化して抽出する際に、画像領域で2値化、もしくはオブジェクト毎に2値化するために、それぞれ2値化の閾値は画像領域、もしくはオブジェクト領域により設定される。
例えば、表領域について2値化を行った場合、図25に示す(a)のように、色の濃いセルがあると、図25に示す(b)のように、色の濃いセルは塗りつぶされた画像として生成されるという問題が生じる。また、2値化した際に、セル内にノイズが多く発生するという問題が生じる。
尚、このようなセルについては、正常に文字情報を抽出することができない。元原稿がカラー原稿である場合は、各セル色の相関関係によって2値化によりセルの塗りつぶしが発生する場合が多く、表枠の正確な抽出は困難であり、非常に深刻な問題となっている。
本発明は、上述の課題を解決するためになされたもので、本来文字情報が埋め込まれているセルが2値化処理により塗りつぶされることを防止し、表中の全ての文字情報を抽出することを目的とする。
本発明の画像処理方法は、原稿上の表領域における表枠の2値データを抽出する工程と、前記表枠の2値データに基づいて表枠の表構成を認識する工程と、前記表枠の中より文字情報を抽出し、表枠を再処理する工程とを有し、前記表枠の表構成の認識結果に応じて文字情報を抽出する領域を選択し、該選択位置における文字情報を再抽出し、前記表枠を再処理することを特徴とする。
また、本発明の画像処理装置は、原稿上の表領域における表枠の2値データを抽出する抽出手段と、前記表枠の2値データに基づいて表枠の表構成を認識する認識手段と、前記表枠の中より文字情報を抽出し、表枠を再処理する再処理手段とを有し、前記表枠の表構成の認識結果に応じて文字情報を抽出する領域を選択し、該選択位置における文字情報を再抽出し、前記表枠を再処理することを特徴とする。
本発明によれば、カラー原稿より表枠中のノイズを除去し、表枠を正確に抽出し、セル内のノイズ、塗りつぶしにより文字情報が抽出されないことを防止できる。また、正確な表枠ベクトル情報を抽出できる。
以下、図面を参照しながら発明を実施するための最良の形態について詳細に説明する。
図1は、実施例1における文書処理装置の外観を示す図である。図1において、101はコンピュータ装置であり、後述するフローチャートを参照して説明する処理を実現するためのプログラムを含む、文書の電子化処理プログラムを実行する。また、コンピュータ装置101は、ユーザに状況や画像を表示するためのディスプレイ装置102と、ユーザの操作を受け付けるキーボードやマウス等のポインティングデバイスを含んで構成される入力装置103とを付随する。このディスプレイ装置102としては、CRTやLCD等が用いられる。104はスキャナ装置であり、文書画像を光学的に読み取って電子化し、得られた画像データをコンピュータ装置101に送る。尚、スキャナ装置104としては、カラースキャナを用いるものとする。
図2は、実施例1における文書処理装置の構成の一例を示すブロック図である。図2において、201はCPUであり、後述するROM又はRAMに格納された制御プログラムを実行することにより、後述する電子化処理を含む各種機能を実現する。202はROMであり、CPU201によって実行される各種制御プログラムや制御データが格納されている。203はRAMであり、CPU201によって実行される各種制御プログラムを格納したり、CPU201が各種処理を実行するのに必要な作業領域が定義されている。
204は外部記憶装置であり、詳細は後述する実施例1における処理をCPU101によって実現するための制御プログラムや、スキャナ装置104で読み取って得られた文書画像データ等を格納する。そして、205はコンピュータバスであり、上述した各構成を接続するものである。
図3は、文書処理装置における文書の電子化処理の概要を示す図である。ここで、電子化処理の流れは、まず入力部301において、電子化の対象であるカラー文書をスキャナ装置104によって読み込み、画像データとして外部記憶装置204に格納する。次に、2値化処理302において、後段の像域分離処理、アウトライン生成処理のために、外部記憶装置204に格納された文書の画像データに対して2値化処理を施す。そして、像域分離処理303では、2値化処理302で得られた2値画像から、文字、図、表、枠、線などの要素を抽出し、各領域に分割する。
次に、ベクトル化処理304において、領域分割された画像データに対して、文字部は文字認識部305で文字認識を行い、アウトライン作成部306でアウトラインベクトルデータへ変換する。また、表、枠の要素については表処理部308でアウトライン化し、アウトラインを罫線化する。尚、アウトライン作成部306で変換された画像データは、各オブジェクトの輪郭線が滑らかな曲線により表現される高画質で、解像度に依存しない、かつ編集容易なベクトルデータへ変換される。
一方、その他の図、写真画、背景については、例えば背景については、圧縮部309でJPEG圧縮など各々に適した形態で保持、圧縮する。
次に、電子文書作成処理310は、分割された要素毎の属性に基づいて文字認識データや表構造データを用い、それぞれ変換された画像データに基づき電子化文書を作成する。そして、出力部311は生成された電子化文書を外部記憶装置204に格納する。
尚、出力部311の出力形態は外部記憶装置204への格納に限られるものではなく、ディスプレイ装置102へ表示したり、不図示のネットワークインターフェースを介してネットワーク上の他の装置へ出力したり、不図示のプリンタへ送出したりすることも可能である。
ここで、図1及び図2に示す文書処理装置において実行される文書の電子化処理(図3参照)における各処理の詳細について、以下順に説明する。
[2値化処理]
2値化処理302では、入力された文書画像データより輝度情報を抽出し、その輝度値のヒストグラムを作成する。ヒストグラム上より複数の閾値を設定し、各々の閾値で2値化された2値画像上の黒画素の連結等を解析することで最適な閾値を導出し、その閾値による2値画像を得る。
[像域分離処理]
像域分離処理303とは、図4に示す左側の読み取られた1ページのイメージデータをオブジェクト毎の塊(ブロック)として認識し、各々の塊を文字/図画/写真/線/表等の属性に判定し、図4に示す右側のように、異なる属性(TEXT/PICTURE/PHOTE/LINE/TABLE)を持つ領域に分割する処理である。
像域分離処理303では、2値化処理302で得られた2値画像より、黒画素の輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。また、面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行い、白画素の塊を抽出し、更に一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つ領域へ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、更に近接する文字が整列良くグループ化可能な部分を文字領域、扁平な画素塊を線領域、一定の大きさ以上で、かつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域、などとする。
図5は、像域分離処理303で分離された各ブロックに対するブロック情報と入力ファイル情報を示す図である。図5に示すように、ブロック情報は、各ブロックの属性、座標(X,Y)、幅(W)、高さ(H)、OCR情報を含み、属性1は文字、属性2は図画、属性3は表、属性4は線、属性5は写真である。そして、入力ファイル情報は、ブロック総数N(図5に示す例では、ブロック1〜ブロック6までの6である)を有する。
尚、各ブロックに対して、より鮮明な2値画像を得ようとした場合は、ここでブロック毎に上述した2値化処理を行っても良い。
[文字認識部]
文字認識部305では、文字単位で切り出された画像に対して、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、予め字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とする処理である。この特徴ベクトルの抽出には種々の公知手法があり、例えば文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
像域分離処理303で抽出された文字領域に対して文字認識を行う場合、まず該当領域に対して横書き、縦書きの判定を行い、それぞれ対応する方向に行を切り出し、その後、文字を切り出して文字画像を得る。この横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合には横書き領域と判定し、垂直射影の分散が大きい場合には縦書き領域と判定すれば良い。また、文字列及び文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、更に切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。縦書きの文字領域に対しては、水平と垂直を逆にすれば良い。尚、この時、文字のサイズが検出できる。
[アウトライン生成部]
アウトライン作成部306では、像域分離処理303で図画或いは線、表領域とされた領域を対象に、抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線或いは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図6に示すように、任意点Piに対して左右k個の離れた点Pi−k,Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。更に、点Pi−k,Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法など、曲線は3次スプライン関数などを用いてベクトル化することができる。
また、対象が内輪郭を持つ場合、像域分離処理で抽出した白画素輪郭の点列を用いて、同様に部分的直線或いは曲線で近似する。
[表処理部]
表処理部308では、表中のセル及びその構成を認識し、表枠を罫線により表現する等、セル毎に編集可能な電子データへ変換する。尚、表部は、像域分離処理303により、表枠として表枠中の文字部と分離して抽出されている。
図7は、表処理部308における表処理を示すフローチャートである。まず、像域分離処理303で分離された表部を2値化し、表枠の2値データを得る(ステップS701)。ここでは、像域分離処理303より入力された表枠の2値データをそのまま出力しても良い。また、像域分離処理303で得られた表領域に対して、再度2値化処理、表枠抽出処理を行い、正確に表枠を抽出しても良い。
次に、ステップS701で得られた表枠について表構成を認識する(ステップS702)。図8は、表枠を認識する処理を示すフローチャートである。まず、表枠について上述したアウトライン処理によりアウトライン化し、滑らかな直線及び曲線で表枠を表現する(ステップS801)。次に、表枠のアウトラインよりセルを表現しているセルアウトラインを抽出する(ステップS802)。ここで、元々アウトラインは、外輪郭と内輪郭に分類されているが、まず外輪郭のうち、表全体の外枠を構成しているアウトラインを抽出する。尚、表の内部に表が存在するような場合もあるので、外枠は複数抽出される場合もある。
次に、外枠の内側に存在するセルを構成しているアウトラインを抽出する。尚、ここでの処理はアウトラインよりそのアウトラインがセルを構成するサイズであるか否かを判定し、更にアウトラインを図形認識処理によりアウトラインが矩形図形、もしくは三角図形を構成しているか否かを判定する。尚、矩形図形、三角図形、もしくは矩形図形の集合と判定されたアウトラインをセルアウトラインとする。図9に示す(a),(b),(c)は、矩形図形、三角図形、矩形図形の集合と判定されたアウトラインの一例である。
次に、ステップS702で外枠、もしくはセルを構成していると判定されたセルアウトラインについてセル図形へ変換する(ステップS803)。具体的には、まず、ステップS802で外枠を構成するアウトラインと内部セルを構成するアウトラインが抽出されているが、外枠を構成するアウトラインの角度が全て90°で表現される図形であると判定された場合、90°角の間を直線で表現した図形へ変換する。次に、外枠の内側のセルを構成すると判定されたセルについて、セル図形へ変換する。ここで、セル図形とは矩形図形である。
例えば、図9に示すセルアウトラインをセル図形へ変換した例を図10に示す。図9に示すセルアウトライン(a),(b),(c)はそれぞれ図10に示す(a),(b),(c)のように変換される。ここで、図9に示す(a)のセルアウトラインは矩形図形の当てはめ処理によりそのまま図10に示す(a)となる。図9に示す(b)のような三角図形のセルアウトラインも同様に、矩形図形の当てはめ処理を行う。この三角図形に対する矩形図形の当てはめ処理では、三角を構成するセルアウトラインを囲むようにセル矩形を当てはめる。
尚、当てはめられた矩形図形は最終的にその位置関係よりセル図形同士統合され一つのセル図形として抽出する。例えば、図10に示す(b)のセル図形は、図11に示すセル図形に統合され、一つのセル図形として表現される。統合されないセル図形も当然あり、それらの図形についてはそのまま三角アウトラインに当てはめられたセル図形をセル図形とする。
また、図9に示す(c)のような矩形図形の集合として抽出されるセルアウトラインは、図10に示す(c)のように各矩形図形へ分離する。この矩形図形への分離処理では、アウトラインの中の直角をなすであろう角を見つけ出し、その角点の構成から矩形図形へ分解する。尚、更に抽出されたセル全てを用いて表の水平方向及び垂直方向を求め、セル図形全てを求められた水平方向及び垂直方向の成分からなるセル図形へ変換する。このように外枠図形とセル図形は抽出されるが、各セル図形はその構成されるセルアウトラインにより属性情報がつけられる。図12は、セル図形と、それを構成するセルアウトライン及び各属性情報の一例を示す図である。
次に、ステップS803で変換したセル図形をマッピングするためのマッピング領域を作成する(ステップS804)。ここで、マッピング領域とはセル図形をマッピングするための領域であり、外枠内部の領域がそのままマッピング領域となる。また、外枠の交点を抽出しておく。交点とは、表の罫線と罫線が交差する点のことであり、外枠においては、外枠の角点がそのまま交点となる。図13にマッピング領域と交点の一例を示す。
次に、セル図形マッピング領域にセル図形をマッピングし(ステップS805)、セル図形の構成を認識する。具体的には、ステップS804で作成されたマッピング領域内にセル図形をマッピングしていき、マッピングされるセル図形より表の罫線と罫線が交差する交点を抽出していくことで、表構成を認識する。即ち、交点の隣接関係を調べていくことで、表構成を認識する。
ここで、ステップS805におけるセル図形をマッピングするセル図形マッピング処理の詳細について説明する。
図14は、セル図形マッピング処理を示すフローチャートである。まず、上述した外枠の交点より注目点を抽出する(ステップS1401)。ここで、注目点とは、右側と下側に隣接して繋がっている交点を持つ交点で、それら3点を含む矩形領域がマッピング領域であり、かつ該矩形領域に対し、まだ何もマッピングされていない交点である。図15にマッピング領域と交点とマッピングセルと注目点の関係を示した例を示す。
次に、抽出した注目点に対し、該注目点を左上の交点とするセル図形が存在するか否かを判定する(ステップS1402)。具体的には、未だマッピングされていない全てのセル図形の左上の角点と注目点との距離を調べ、セル図形の左上の角点と注目点との距離が一定値以内であり、最も注目点に近いセル図形を注目点と左上の角点が一致するセル図形と判定する。ここで、注目点と左上の角点が一致するセル図形が存在すれば、該セル図形をマッピング領域上にマッピングする(ステップS1403)。
また、セル図形全ての左上の角点と注目点との距離が一定値以内にあるセル図形が存在しなければ、色塗りセルを作成し、マッピングする(ステップS1404)。色塗りセルは、矩形図形である。まず、注目点とその隣接する右側と下側の交点より少し広げた矩形領域(以後矩形領域Aと呼ぶ)内に、まだマッピングされていないセル図形の角点がないか判定し、角点が存在すれば、その角点を通る水平方向及び垂直方向の直線によって領域を区切る。この区切り作業を矩形領域A内に存在する角点全てに対して行い、水平線及び垂直線によって区切られた領域の最も左上にある区切られた矩形図形を色塗りセルとし、マッピングする。
図16は、矩形領域A内に色塗りセルを作成する例を示す図である。図16に示す例では、矩形領域A内に2つのセル図形の角点が存在するので、それらの角点を通る水平方向及び垂直方向の直線によって矩形領域Aを区切り、区切られた領域の最も左上にある区切られた矩形図形を塗りつぶしセルとしてマッピングする。
次に、ステップS1403、S1404でマッピングされたセル図形よりセル図形上の交点を作成する(ステップS1405)。交点はこのマッピング図形の角点がそのまま交点となるが、もしマッピング図形の角点が、既に存在する交点との距離がある閾値以内であれば、その角点により作成される交点は既に存在すると判断できるため、その角点より新たな交点は作成しない。ここで、マッピング図形の左上の交点は注目点と一致と判断されているため、左上の角点より新たな交点は作成されない。また、マッピング図形の右上の角点より作成される交点は注目点より水平線上にあるとして作成し、左下の角点は注目点より垂直線上にあるとして作成する。
次に、現在抽出されている交点の中で注目点が存在するか否かを判定する(ステップS1406)。注目点とは、上述したように、右側と下側に隣接し繋がっている交点を持つ交点で、そられ3点を含む矩形領域がマッピング領域であり、かつ該矩形領域に対しまだ何もマッピングされていない交点である。交点が囲む領域内にセル図形及び塗りつぶしセルがマッピングされていない領域が存在すれば注目点は存在する。尚、注目点が存在しない場合には表構成認識処理を終了とする。また、まだ注目点が存在する場合は、ステップS1401に戻り、再度注目点を抽出して一連の処理を繰り返す。
以上の繰り返し処理により、交点の隣接関係が作成され、罫線を表現することが可能となる。図17に作成された交点の隣接関係と、マッピングされたセル図形及び色塗りセル、またセル図形の場合はその属性情報を記述した例を示す。尚、図17に示す属性情報により得られる表罫線は図18に示すようになる。
ここで、図14に示したセル図形マッピング処理が終了すると、図8に示すステップS806へ進み、罫線の太さ及び位置関係を調節し、交点の正確な位置を抽出する。罫線の太さは、ステップS805でマッピングされたセル図形のうち、隣接するセル図形の距離から求められる。また、罫線の位置は隣接するセル図形の中間となるように調節する。
尚、交点の位置はステップS806で得られる罫線同士の交わる交点として正確な位置を求める。
[色塗りセル再処理]
図7に示すステップS703では、表構成認識処理(ステップS702)で抽出された色塗りセルについて再処理を行う。
図19は、色塗りセル再処理を示すフローチャートである。まず、セルの判別を行う(ステップS1901)。セル判別では、ステップS702で作成した色塗りセルの区切りについて原稿上でもセルの区切りが存在するか否かを判別し、場合によっては色塗りセルを統合する。具体的には、原画像について、隣り合う色塗りセルの区切り線に対応する近隣画素のエッジ成分を調べ、原画像において区切り線上の罫線があるか否かを判別する。もし、原画像上で罫線が無いと判別された場合は、2つのセルを統合し一つのセルとする。以上の統合処理を隣接する色塗りセル全てに対して行い、セルを抽出する。
次に、ステップS1901で抽出されたセルについて、一つのセルを一枚の画像とみなし、セル毎に2値化処理を行う(ステップS1902)。セル毎に2値化処理を行うことで、塗りつぶされていた色塗りセルより、セル内のテキスト、模様等の2値オブジェクトを抽出することが可能である。そして、セル毎に像域分離処理を行う(ステップS1903)。
尚、像域分離処理は、特にテキストデータを抽出するものである。抽出されたテキストデータが抽出された場合はOCRをかけてテキストコードを抽出し、更にアウトライン化してフォント化し、文字部のデータへ追加する。
[表データ生成処理]
図7に示すステップS704では、ステップS702、S703で作成されたベクトル情報を使用し、表データを作成する。例えば、図18に示す表は図24に示すようになる。図24において、2401〜2403の部位からは、テキスト情報が抽出されている。また、もしテキスト情報がないセルについては、そのまま色塗りセルのままで良いとする。
以上の処理により、表枠は塗りつぶされるようなセルが作成されることを回避し、表中よりテキスト情報を正確に抽出し、表データが作成される。
尚、上述の処理では、色塗りセルについて、セル判別を行い、得られる各セルについて2値化、像域分離処理を行ったが、より単純に抽出された複数の色塗りセル全ての領域を一枚の原稿と見立て、それに対して2値化、像域分離処理を行ってもよく、色塗りセルの領域より文字、線等の情報を得ることが可能である。
[アプリデータへの変換処理]
以上の通り、1頁分のイメージデータを像域分離処理303し、ベクトル化処理304した結果は図20に示すような中間データ形式のファイルとして変換される。このようなデータ形式は、ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
図20は、DAOFのデータ構造を示す図である。図20において、2001はHeaderであり、処理対象の文書画像データに関する情報が保持される。2002はレイアウト記述データ部であり、文書画像データ中の文字(TEXT)、タイトル(TITLE)、キャプション(CAPTION)、線画(LINEART)、自然画(PICTURE)、枠(FRAME)、表(TABLE)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。2003は文字認識記述データ部であり、TEXT、TITLE、CAPTION等のTEXTブロックを文字認識して得られる文字認識結果を保持する。2004は表記述データ部であり、TABLEブロックの構造の詳細を格納する。2005は画像記述データ部であり、PICTUREやLINEART等のブロックのイメージデータを文書画像データから切り出して保持する。
このようなDAOFは中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクトを再利用することはできない。
そこで、このDAOFからアプリケーションデータに変換する電子文書作成処理309について説明する。
図21は、電子文書作成処理の全体の概略を示すフローチャートである。まずステップS2101において、DAOFデータの入力を行う。次に、ステップS2102において、アプリデータの元となる文書構造ツリー生成を行う。そして、ステップS2103で、文書構造ツリーに基づいてDAOF内の実データを流し込み、実際のアプリデータを生成する。
図22は、文書構造ツリー生成処理の詳細を示すフローチャートである。また、図23は文書構造ツリーを説明するための図である。尚、全体制御の基本ルールとして、処理の流れはミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行する。尚、以下の説明で、「ブロック」はミクロブロック及びマクロブロック全体を指すものとする。
まず、ステップS2201では、ブロック単位に縦方向の関連性に基づいて再グループ化する。スタート直後はミクロブロック単位での判定となる。ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどで定義することができる。また、距離、幅、高さなどの情報はDAOFを参照し、抽出する。
図23は、ページの構成とその文書構造のツリーを示す図である。図23に示す(a)は実際のページ構成、図23に示す(b)はその文書構造ツリーである。
ステップS2201での結果、図23に示すT3、T4、T5が1つのグループV1として生成され、T6、T7が1つのグループV2として生成され、図23に示す(b)のように、グループV1とグループV2が同じ階層のグループとして生成される。そして、ステップS2202において、縦方向のセパレータの有無をチェックする。セパレータは、例えば物理的にはDAOF中でライン属性を持つオブジェクトである。また、論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。
次に、ステップS2203において、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、縦方向のグループ長がページ高さとなっている場合、文書構造ツリー生成を終了する。また、図23に示す例の場合、セパレータもなく、グループ高さはページ高さではないのでステップS2204へ進み、ブロック単位で横方向の関連性に基づいて再グループ化する。ここもスタート直後の第一回目はミクロブロック単位で判定を行うことになる。尚、関連性、及びその判定情報の定義は、縦方向の場合と同じである。
図23に示す例の場合、T1、T2でH1が、V1、V2でH2がV1、V2の1つ上の同じ階層のグループとして生成される。そして、ステップS2205において、横方向セパレータの有無をチェックする。図23に示す例では、S1があるので、これをツリーに登録し、H1、S1、H2という階層を生成する。
次に、ステップS2206において、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、横方向のグループ長がページ幅となっている場合、文書構造ツリー生成を終了する。また、そうでない場合はステップS2201に戻り、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。図23に示す例の場合、分割幅がページ幅になっているので、ここで終了し、最後にページ全体を表す最上位階層のV0が文書構造ツリーに付加される。
文書構造ツリーが完成した後、その情報に基づいてアプリデータを生成する(ステップS2103)。図23に示す例の場合、具体的には、以下のようになる。
即ち、H1は横方向に2つのブロックT1及びT2があるので、2カラムとし、T1の内部情報(DAOFを参照、文字認識結果の文章、画像など)を出力後、カラムを変え、T2の内部情報出力、その後S1を出力する。次に、H2は横方向に2つのブロックV1及びV2があるので、2カラムとして出力、V1はT3、T4、T5の順にその内部情報を出力、その後カラムを変え、V2のT6、T7の内部情報を出力する。
以上の処理によりアプリデータへの変換処理を行うことができる。
尚、本発明は複数の機器(例えば、ホストコンピュータ,インターフェース機器,リーダ,プリンタなど)から構成されるシステムに適用しても、1つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用しても良い。具体的には、複合機や、複写機や、ファクシミリ装置で、高品位に変倍するために、スキャンした画像データを入力し(公衆回線やネットワークから画像データを入力しても良い)、画像データから輪郭ベクトルを抽出し、抽出した輪郭ベクトルを変倍し、変倍された輪郭ベクトルから画像データを生成し、生成した画像データをプリントする際の輪郭ベクトル抽出時に適用できる。
また、本発明の目的は前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(CPU若しくはMPU)が記録媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記録媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記録媒体は本発明を構成することになる。
このプログラムコードを供給するための記録媒体としては、例えばフロッピー(登録商標)ディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
更に、記録媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
実施例1における文書処理装置の外観を示す図である。 実施例1における文書処理装置の構成の一例を示すブロック図である。 文書処理装置における文書の電子化処理の概要を示す図である。 実施例1における像域分離処理を説明するための図である。 像域分離処理303で分離された各ブロックに対するブロック情報と入力ファイル情報を示す図である。 アウトラインベクトルデータへの変換を説明するための図である。 表処理部308における表処理を示すフローチャートである。 表枠を認識する処理を示すフローチャートである。 矩形図形、三角図形、矩形図形の集合と判定されるアウトラインの一例を示す図である。 図9に示すセルアウトラインをセル図形へ変換した例を示す図である。 隣接するセル図形の統合例を示す図である。 セル図形を構成するセルアウトラインと各属性情報についての一例を示す図である。 マッピング領域と交点の一例を示す図である。 セル図形マッピング処理を示すフローチャートである。 マッピング領域と交点とマッピングセルと注目点の関係を示す図である。 矩形領域A内に色塗りセルを作成する例を示す図である。 作成された交点の隣接関係と、マッピングされたセル図形及び色塗りセル、またセル図形の場合はその属性情報を記述した例を示す図である。 図17に示す交点の隣接関係から得られた処理結果を示す図である。 色塗りセル再処理を示すフローチャートである。 ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)のデータ構造を示す図である。 電子文書作成処理の全体の概略を示すフローチャートである。 文書構造ツリー生成処理の詳細を示すフローチャートである。 ページの構成とその文書構造のツリーを示す図である。 本実施例において作成される表枠を示す図である。 従来の表処理における問題を説明するための図である。

Claims (8)

  1. 原稿上の表領域における表枠の2値データを抽出する工程と、
    前記表枠の2値データに基づいて表枠の表構成を認識する工程と、
    前記表枠の中より文字情報を抽出し、表枠を再処理する工程とを有し、
    前記表枠の表構成の認識結果に応じて文字情報を抽出する領域を選択し、該選択位置における文字情報を再抽出し、前記表枠を再処理することを特徴とする画像処理方法。
  2. 前記表構成の認識結果は、矩形図形の集合として表を表現し、前記文字情報を抽出する領域は該矩形図形単位で選択されることを特徴とする請求項1記載の画像処理方法。
  3. 前記再処理は、少なくとも2値化処理か像域分離処理の何れかであることを特徴とする請求項1記載の画像処理方法。
  4. 前記再処理された表枠を表現するベクトルデータを生成する工程を有することを特徴とする請求項1記載の画像処理方法。
  5. 原稿上の表領域における表枠の2値データを抽出する抽出手段と、
    前記表枠の2値データに基づいて表枠の表構成を認識する認識手段と、
    前記表枠の中より文字情報を抽出し、表枠を再処理する再処理手段とを有し、
    前記表枠の表構成の認識結果に応じて文字情報を抽出する領域を選択し、該選択位置における文字情報を再抽出し、前記表枠を再処理することを特徴とする画像処理装置。
  6. 前記再処理手段は、前記表枠でないと想定される領域について、テキスト情報が入っていないと判定した場合は再処理しないことを特徴とする請求項5記載の画像処理装置。
  7. 請求項1記載の画像処理方法をコンピュータに実行させるためのプログラム。
  8. 請求項7記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004290386A 2004-10-01 2004-10-01 画像処理装置及び画像処理方法 Expired - Fee Related JP4587167B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004290386A JP4587167B2 (ja) 2004-10-01 2004-10-01 画像処理装置及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004290386A JP4587167B2 (ja) 2004-10-01 2004-10-01 画像処理装置及び画像処理方法

Publications (3)

Publication Number Publication Date
JP2006106972A true JP2006106972A (ja) 2006-04-20
JP2006106972A5 JP2006106972A5 (ja) 2007-11-15
JP4587167B2 JP4587167B2 (ja) 2010-11-24

Family

ID=36376667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004290386A Expired - Fee Related JP4587167B2 (ja) 2004-10-01 2004-10-01 画像処理装置及び画像処理方法

Country Status (1)

Country Link
JP (1) JP4587167B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007305034A (ja) * 2006-05-15 2007-11-22 Canon Inc 画像処理装置、その制御方法、コンピュータプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001297303A (ja) * 2000-02-09 2001-10-26 Ricoh Co Ltd 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP2004127203A (ja) * 2002-07-30 2004-04-22 Ricoh Co Ltd 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001297303A (ja) * 2000-02-09 2001-10-26 Ricoh Co Ltd 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP2004127203A (ja) * 2002-07-30 2004-04-22 Ricoh Co Ltd 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007305034A (ja) * 2006-05-15 2007-11-22 Canon Inc 画像処理装置、その制御方法、コンピュータプログラム
US8300946B2 (en) 2006-05-15 2012-10-30 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program

Also Published As

Publication number Publication date
JP4587167B2 (ja) 2010-11-24

Similar Documents

Publication Publication Date Title
US7386789B2 (en) Method for determining logical components of a document
JP5361574B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP5302768B2 (ja) 画像処理装置及び画像処理方法
JP4366011B2 (ja) 文書処理装置及び方法
US6532302B2 (en) Multiple size reductions for image segmentation
CN105528614B (zh) 一种漫画图像版面的识别方法和自动识别系统
US20070230810A1 (en) Image-processing apparatus, image-processing method, and computer program used therewith
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
US8965125B2 (en) Image processing device, method and storage medium for storing and displaying an electronic document
US20120250048A1 (en) Image processing apparatus and image processing method
US20090274369A1 (en) Image processing device, image processing method, program, and storage medium
EP1017011A2 (en) Block selection of table features
CN100568263C (zh) 布局分析设备和布局分析方法
JP4371911B2 (ja) 関数化処理方法及び関数化処理装置
JP2008176521A (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP2000132689A (ja) カラ―画像の特徴を識別するための方法
US8181108B2 (en) Device for editing metadata of divided object
JP5824309B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2006253892A (ja) 画像処理方法及び画像処理装置
JP4587167B2 (ja) 画像処理装置及び画像処理方法
US20090290797A1 (en) Image processing for storing objects separated from an image in a storage device
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP5767549B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2003046746A (ja) 画像処理方法及び画像処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071001

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071001

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100827

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100906

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100831

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees