JP5574272B2 - 画像読取装置、画像処理装置およびプログラム - Google Patents

画像読取装置、画像処理装置およびプログラム Download PDF

Info

Publication number
JP5574272B2
JP5574272B2 JP2010030809A JP2010030809A JP5574272B2 JP 5574272 B2 JP5574272 B2 JP 5574272B2 JP 2010030809 A JP2010030809 A JP 2010030809A JP 2010030809 A JP2010030809 A JP 2010030809A JP 5574272 B2 JP5574272 B2 JP 5574272B2
Authority
JP
Japan
Prior art keywords
basic cell
identifier
ruled line
cell
changed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010030809A
Other languages
English (en)
Other versions
JP2011170397A (ja
Inventor
邦和 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010030809A priority Critical patent/JP5574272B2/ja
Publication of JP2011170397A publication Critical patent/JP2011170397A/ja
Application granted granted Critical
Publication of JP5574272B2 publication Critical patent/JP5574272B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明は、画像読取装置、画像処理装置およびプログラムに関する。
特許文献1には、各セルの位置関係を値として各セルごとに持っておき、この各セル毎の位置関係の情報をフォーム認識の特徴量の一つとする文書処理装置が開示されている。
特許文献2には、各セルの左上、右下座標値、横線長をしきい値処理することで梁線(横)か柱線(縦)の区別を行うことによって各セル枠の位置関係を知るようにした画像処理装置が開示されている。
特許文献3には、予め表に記述された言語を代表言語に置き換えることが可能な辞書を用意しておき、自然言語処理的に入力された表の各セルごとの意味関係をマッチング処理することにより表の構造解析を行う方法が開示されている。
特許文献4には、入力された表画像のセル座標やセル長さといった変動に影響を受けやすい特徴量を用いることなく、表の構造マッチングを行うって、各縦罫線に接続された横罫線の本数、および各横罫線に接続された縦罫線の本数をその表の特徴量とする画像処理装置が開示されている。
特許文献5には、予めXML(Extensible Markup Language)への変換ルール(決められた文字列に対する処理辞書)を用意しておき、これにそってXML構造化文書を作成する文書変換装置が開示されている。
特許文献6には、複雑な表をXML化しやすいような形に変形し、セルが分割された箇所、セルが結合された箇所を罫線の共有関係で5つに分類し、これをもとに論理構造は保存したまま表構造をXML構造化文書に変換しやすい形へと変換する文書処理装置が開示されている。
特許文献7には、表部分のセル白部分に着目し、その座標値からセル構造を把握するようにした画像処理装置が開示されている。
特公平7−107694号公報 特開平8−115421号公報 特開2001−325284号公報 特開2005−78306号公報 特開2006−53612号公報 特開2006−99480号公報 特開2006−185336号公報
本発明の目的は、読み取られた画像データに含まれる表画像が四角形状以外のセルを含むような構造の場合でも、その表画像の構造を解析して構造化文書により現すことが可能な画像読取装置、画像処理装置およびプログラムを提供することである。
[画像処理装置]
請求項1に係る本発明は、四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する抽出手段と、
前記抽出手段により抽出された罫線情報に基づいて、前記表画像の格子構造を解析する解析手段と、
前記解析手段により解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定する設定手段と、
前記設定手段により設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定手段と、
前記判定手段により変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成する構造化文書生成手段と、
を備えた画像処理装置である。
[画像読取装置]
請求項に係る本発明は、設定された用紙上の画像を画像データとして読み取る読取手段と、
前記読取手段により読み取られた四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する抽出手段と、
前記抽出手段により抽出された罫線情報に基づいて、前記表画像の格子構造を解析する解析手段と、
前記解析手段により解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定する設定手段と、
前記設定手段により設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定手段と、
前記判定手段により変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成する構造化文書生成手段と、
を備えた画像読取装置である。
[プログラム]
請求項に係る本発明は、四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出するステップと、
抽出された罫線情報に基づいて、前記表画像の格子構造を解析するステップと、
解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定するステップと、
設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定ステップと、
前記判定ステップにおいて変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成するステップとをコンピュータに実行させるためのプログラムである。
請求項1に係る本発明によれば、読み取られた画像データに含まれる表画像が四角形状以外のセルを含むような構造の場合でも、その表画像の構造を解析して構造化文書により現すことができる画像処理装置を提供することができる。
請求項に係る本発明によれば、読み取られた画像データに含まれる表画像が四角形状以外のセルを含むような構造の場合でも、その表画像の構造を解析して構造化文書により現すことができる画像読取装置を提供することができる。
請求項に係る本発明によれば、読み取られた画像データに含まれる表画像が四角形状以外のセルを含むような構造の場合でも、その表画像の構造を解析して構造化文書により現すことができるプログラムを提供することができる。
本発明の一実施形態の画像読取システムのシステム構成を示す図である。 本発明の一実施形態における画像読取装置10のハードウェア構成を示すブロック図である。 本発明の一実施形態における画像読取装置10の機能構成を示すブロック図である。 本発明の一実施形態の画像読取装置10における表画像処理部34の動作を示すフローチャートである。 表画像が含まれた画像データの一例を示す図である。 抽出された縦罫線の情報を示す図(図6(A))、および抽出された横罫線の情報を示す図(図6(B))である。 図6のフローチャートにおけるグリッド構造解析処理(ステップS102)の詳細を示すフローチャートである。 グリッド構造解析処理により解析されたグリッド軸の座標例を示す図である。 縦グリッド軸と横グリッド軸により囲まれた領域を基本セルとして設定した様子を示す図である。 図9において設定された16個の基本セルに対して、仮セルIDを設定した様子を示す図である。 図6のフローチャートにおけるセル結合状況判定処理(ステップS104)の詳細を示すフローチャートである。 図10に示したような構造の表画像について各基本セルのセルIDが変更されていく過程を説明するための図である。 図10に示したような構造の表画像について各基本セルのセルIDが変更されていく過程を説明するための図である。 図13(C)のように設定された基本セルのセルIDを再度割り振りし直した場合の様子を示す図である。
次に、本発明の実施の形態について図面を参照して詳細に説明する。
図1は本発明の一実施形態の画像読取システムの構成を示すブロック図である。
本発明の一実施形態の画像形成システムは、図1に示されるように、ネットワーク30により相互に接続された画像読取装置10、および端末装置20により構成される。画像読取装置10は、セットされた原稿から画像を読み取るスキャン機能を有する。端末装置20は、画像読取装置10により読み取られた画像データ等をネットワーク30経由にて取得する。
なお、本実施形態では、画像読取装置に本願発明を適用した場合について説明しているが、印刷(プリント)機能、スキャン機能、複写(コピー)機能、ファクシミリ機能等の複数の機能を有するいわゆる複合機と呼ばれる画像形成装置に対して本願発明を適用することも可能である。
次に、本実施形態の画像読取システムにおける画像読取装置10のハードウェア構成を図2に示す。
画像読取装置10は、図2に示されるように、CPU11、メモリ12、ハードディスクドライブ(HDD)等の記憶装置13、ネットワーク30を介して外部の装置等との間でデータの送信及び受信を行う通信インタフェース(IF)14、タッチパネル又は液晶ディスプレイ並びにキーボードを含むユーザインタフェース(UI)装置15、スキャナ16を有する。これらの構成要素は、制御バス18を介して互いに接続されている。
CPU11は、メモリ12または記憶装置13に格納された制御プログラムに基づいて所定の処理を実行して、画像読取装置10の動作を制御する。
なお、本実施形態では、CPU11は、メモリ12または記憶装置13内に格納された制御プログラムを読み出して実行するものとして説明したが、当該プログラムをCD−ROM等の記憶媒体に格納してCPU11に提供することも可能である。
図3は、上記の制御プログラムが実行されることにより実現される画像読取装置10の機能構成を示すブロック図である。
本実施形態の画像読取装置10は、図3に示されるように、スキャナ16と画像処理装置40を備えている。スキャナ16は、設定された用紙上の画像を画像データとして読み取る。そして、本実施形態の画像読取装置10は、スキャナ16により読み取られた画像データを、画像処理装置40により処理する構成となっている。
そして、画像処理装置40は、オブジェクト分離部31と、文字画像処理部32と、写真画像処理部33と、表画像処理部34と、処理結果統合部35と、構造化文書出力部36とから構成されている。
オブジェクト分離部31は、スキャナ16により読み取られた画像データが文字画像なのか、写真画像なのかあるいは表画像なのかを判定し、画像データを各画像の種類毎に分離する。
文字画像処理部32は、オブジェクト分離部31により分離された文字画像に対する処理を行う。写真画像処理部33は、オブジェクト分離部31により分離された写真画像に対する処理を行う。
表画像処理部34は、オブジェクト分離部31により分離された表画像に対する処理を行う。なお、この表画像処理部34における処理の詳細については後述する。
処理結果統合部35は、文字画像処理部32、写真画像処理部33および表画像処理部34による処理結果を統合して、1つのXML(Extensible Markup Language)文書等の構造化文書にまとめる処理を行う。そして、処理結果統合部35によりまとめられた構造化文書は、構造化文書出力部36により指定された宛先に対して出力される。
本実施形態における表画像処理部34は、表画像が含まれた画像データから、その表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する。罫線情報には、少なくとも各罫線の位置と長さが分かる情報が含まれていればよく、罫線情報の抽出方法としては、特開2000−222577号公報、特開2000−259826号公報に開示されている公知の手法を用いることができる。
そして、表画像処理部34は、抽出された罫線情報に基づいて、表画像のグリッド構造(格子構造)を解析する。グリッド構造の解析は、位置は異なるが同軸上に存在する複数の罫線を1つのグリッド軸(格子軸)として捉え、縦横それぞれのグリッド軸の座標を設定することにより行われる。そして、表画像処理部34は、解析された格子構造において縦グリッド軸および横グリッド軸により分割された四角形領域をそれぞれ基本セル(ます目)として設定し、設定された各基本セルにおける少なくとも2箇所以上の辺における罫線の有無に応じて、各基本セルと隣接する他の基本セルとの間の結合関係を判定する。
具体的には、少なくとも2箇所以上の辺を、各基本セルの左側の辺および上側の辺とした場合、表画像処理部34は、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルは左側の基本セルと結合関係にあると判定する。そして、表画像処理部34は、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルは上側の基本セルと結合関係にあると判定する。また、表画像処理部34は、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルは左側の基本セルおよび上側の基本セルと結合関係にあると判定する。
なお、本実施形態では、表画像処理部34では、基本セルに対してそれぞれID番号(識別子)を設定し、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルのID番号を左側の基本セルのID番号に変更する。そして、表画像処理部34は、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルのID番号を上側の基本セルのID番号に変更する。また、表画像処理部34は、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルのID番号を、左側の基本セルのID番号および上側の基本セルのID番号のうち小さい方のID番号に変更するとともに、大きい方のID番号の基本セルのID番号を小さい方のID番号に変更する。
最後に、表画像処理部34は、上記で説明した結合関係の判定結果に基づいて、セルIDが同一の基本セルを結合関係にあるもとして1つのセルと認識し、各セル毎にOCR(Optical Character Reader)を用いた文字認識処理等を行って、表画像の構造を現したXML文書等の構造化文書を生成する。
次に、本実施形態の画像読取装置10における表画像処理部34の動作を図面を参照して詳細に説明する。
図4は、本実施形態の画像読取装置10における表画像処理部34の動作を示すフローチャートである。以下の説明では、図5に示すような構造の表画像が含まれた画像データに対する処理を行う場合を用いて説明する。
先ず、表画像処理部34は、スキャナ16により読み取られ表画像が含まれた画像データから、その表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する(ステップS101)。例えば、表画像処理部34は、ランレングスを用いた罫線抽出方法等の既存の方法により罫線情報の抽出処理を行う。
図5に示した表画像の罫線情報を抽出した結果を図6に示す。図6(A)は抽出された縦罫線の情報を示す図であり、図6(B)は抽出された横罫線の情報を示す図である。この図6では、各罫線情報は、開始点の座標と罫線の長さ(画素数)情報から構成されている。例えば、図6(A)の左端の縦罫線は、(0、0、486)のように、開始点の座標(0、0)および罫線長(486)により表現される。
次に、表画像処理部34は、抽出された罫線情報に基づいて、表画像のグリッド構造(格子構造)を解析する(ステップS102)。グリッド構造の解析処理は、ステップS101において抽出された罫線情報に基づいて、位置は異なるが同軸上に存在する複数の罫線を1つのグリッド軸の座標を設定することにより行う。ここで、縦グリッド軸の座標とは、Y座標の情報をもたない、X座標のみの情報であり、横グリッド軸の座標とは、X座標の情報をもたない、Y座標のみの情報である。表画像のグリッド構造解析処理の詳細を図7のフローチャートに示す。
なお、縦方向のグリッド構造の解析と横方向のグリッド構造の解析を同時に行うことも可能であるが、ここでは説明を簡単にするために縦方向のグリッド構造の解析処理と横方向のグリッド構造の解析処理とをそれぞれ別に行うものとして、縦方向のグリッド構造の解析処理について詳細に説明する。
先ず、表画像処理部34は、罫線情報を順次選択し、最初の罫線情報の開始点のX座標位置を参照する(ステップS201)。そして、表画像処理部34は、新たに参照したX座標が既に決定した縦グリッド軸の座標と一致するか否かを判定する(ステップS202)。新たに参照したX座標が既に決定した縦グリッド軸の座標と一致する場合、表画像処理部34は、その罫線の処理を終了し、次の罫線情報を参照して(ステップS205)、ステップS201からの処理を繰り返す(ステップS202においてYes)。
ステップS202において、新たに参照したX座標が既に決定した縦グリッド軸の座標と一致しないと判定された場合、表画像処理部34は、その罫線の開始点のX座標を縦グリッド軸の座標として設定する(ステップS203)。
そして、表画像処理部34は、全ての罫線情報が処理済みでない場合(ステップS204においてNo)、次の罫線情報を参照して(ステップS205)、ステップS201からの処理を繰り返す。
このような処理が行われることにより、図6(A)に示すような罫線情報から縦グリッド軸の座標は、(0、203、410、617、827)に設定される。同様に、図6(B)に示すような罫線情報から横グリッド軸の座標は、(0、73、308、382、486)に設定される。このようなグリッド構造解析処理により解析されたグリッド軸の座標例を図8に示す。
次に、表画像処理部34は、解析された格子構造において縦グリッド軸および横グリッド軸により分割された四角形領域をそれぞれ基本セルとして設定する(ステップS103)。具体的には、表画像処理部34は、図8に示した縦グリッド軸と横グリッド軸に囲まれた長方形の領域を、図9に示すように基本セルとして設定する。図9に示した例では、縦方向4つの基本セルが設定され、横方向4つの基本セルが設定されているため、合計16個の基本セルが設定されている。
そして、表画像処理部34では、図9において設定された16個の基本セルに対して、図10に示すように仮セルID(ID番号)を設定する。図10に示した例では、基本セル81〜96に対して、仮セルID番号(1)〜(16)がそれぞれ割り当てられている。
そして、表画像処理部34は、このようにして設定された各基本セルの左側の辺および上側の辺における罫線の有無をステップS101で抽出した罫線情報と、ステップS102の解析により解析された縦グリッド軸の座標および横グリッド軸の座標とから判定し、その結果に応じて、その基本セルと隣接する他の基本セルとの間の結合関係を判定する(ステップS104)。最後に、表画像処理部34では、基本セルどうしの結合関係の判定結果に基づいて、表画像に対する処理を実行し、XML文書等の構造化文書を作成する(ステップS105)。
次に、ステップS104のセル結合状況判定処理の詳細を図11のフローチャートを参照して説明する。
表画像処理部34は、各基本セルの上辺(上側の辺)および左辺(左側の辺)における罫線の有無に応じて異なる処理を行う。具体的には、上辺におよび左辺の両方に罫線が存在する場合(ステップS301においてYes、ステップS302においてYes)、表画像処理部34は、仮セルIDをそのままその基本セルに付与する(ステップS303)。
そして、左辺のみに罫線が存在しない場合(ステップS301においてYes、ステップS302においてNo)、表画像処理部34は、左側に位置する基本セルのセルIDと同じセルIDを、その基本セルのセルIDとして付与する(ステップS304)。
そして、上辺のみに罫線が存在しない場合(ステップS301においてNo、ステップS305においてYes)、表画像処理部34は、上側に位置する基本セルのセルIDと同じセルIDを、その基本セルのセルIDとして付与する(ステップS306)。
なお、上辺および左辺の両方に罫線が存在しない場合(ステップS301においてNo、ステップS305においてNo)、表画像処理部34は、左側に位置する基本セルのセルIDと上側に位置する基本セルのセルIDとが一致するか否かを判定する(ステップS307)。
ステップS307において比較したセルIDが一致した場合、表画像処理部34は、その一致した左側セルのセルID(または上側セルのセルID)を、その基本セルのセルIDとして付与する(ステップS308)。
そして、ステップS307において比較したセルIDが一致しなかった場合、表画像処理部34は、左側セルのセルIDまたは上側セルのセルIDのうち小さい方のセルIDを、その基本セルのセルIDとして付与する(ステップS309)とともに、大きい方のセルIDを有する基本セルのセルIDを小さい方のセルIDに変更する(ステップS310)。
そして、上記の処理を行った後にセル間の結合状況を管理するためル結合状況情報を更新し(ステップS311)、全基本セルの処理が終了していなければ(ステップS312においてNo)、次の基本セルを選択してステップS301からの処理を繰り返す(ステップS313)。
そして、全基本セルの処理が終了すれば(ステップS312においてYes)、基本セルに付与したセルIDを振りなおして処理を終了する(ステップS314)。
例えば、図10に示したような構造の表画像について各基本セルのセルIDが変更されていく様子を図12〜図14を参照して説明する。
先ず、基本セル81〜83については、左側および上側の辺に罫線が存在するため仮セルIDがそのまま付与される。そして、基本セル84については、左側の辺のみに罫線が存在しないため、図12(A)に示すように、この基本セル84のセルIDには、左側の基本セル83のセルID(3)が付与される。
そして、基本セル85〜88については、左側および上側の辺に罫線が存在するため仮セルIDがそのまま付与される。そして、基本セル89については、上側の辺のみに罫線が存在しないため、図12(B)に示すように、この基本セル89のセルIDには、上側の基本セル85のセルID(5)が付与される。
また、基本セル90については、上側の辺のみに罫線が存在しないため、図12(C)に示すように、この基本セル90のセルIDには、上側の基本セル86のセルID(6)が付与される。
そして、基本セル91〜93については、左側および上側の辺に罫線が存在するため仮セルIDがそのまま付与される。そして、基本セル94については、上側の辺のみに罫線が存在しないため、図13(A)に示すように、この基本セル94のセルIDには、上側の基本セル90のセルID(6)が付与される。これらのID付与処理は逐次更新しながら別途記録したステップS311のセル結合状況を参照しながら実施する。
そして、基本セル95については、左側の辺のみに罫線が存在しないため、図13(B)に示すように、この基本セル95のセルIDには、左側の基本セル94のセルID(6)が付与される。これらのセルIDは、構造化文書の表記において用いられる。
最後に、基本セル96については、左側および上側の辺の両方に罫線が存在しないため、左側の基本セル95のセルID(6)と上側の基本セル92のセルID(12)とが比較され、図13(C)に示すように、小さい方のセルID(6)が基本セル96に付与される。さらに、図13(C)に示すように、大きい方のセルID(12)の基本セル92にも、この小さい方のセルID(6)が付与される。
そして、図13(C)のように設定された基本セルのセルIDを再度割り振りし直すことにより、基本セル81〜96には、図14に示すようなセルIDがそれぞれ設定されることとなる。
[変形例]
上記実施形態では、基本セルの上側の辺および左側の辺における罫線の有無に基づいて基本セル間の結合状況を判定する場合を用いて説明したが、本発明はこれに限定されるものではなく、少なくとも2辺における罫線の有無に基づいて基本セル間の結合状況を判定する場合でも同様に本発明を適用することができるものである。例えば、基本セルの処理を行う順序を反対にすれば、基本セルの下側の辺および右側の辺における罫線の有無に基づいて基本セル間の結合状況を判定することが可能となる。また、上側の辺および右側の辺における罫線の有無や、下側の辺および左側の辺における罫線の有無に基づいて基本セル間の結合状況を判定することも可能である。さらに、場合分けを行う処理が複雑になるが、上側、下側、左側および右側の全ての辺における罫線の有無に基づいて、基本セル間の結合状況を判定するようなことも可能である。
10 画像読取装置
11 CPU
12 メモリ
13 記憶装置
14 通信インタフェース(IF)
15 ユーザインタフェース(UI)装置
16 スキャナ
18 制御バス
20 端末装置
30 ネットワーク
31 オブジェクト分離部
32 文字画像処理部
33 写真画像処理部
34 表画像処理部
35 処理結果統合部
36 構造化文書出力部
40 画像処理装置
81〜96 基本セル
S101〜S105 ステップ
S201〜S205 ステップ
S301〜S314 ステップ

Claims (3)

  1. 四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する抽出手段と、
    前記抽出手段により抽出された罫線情報に基づいて、前記表画像の格子構造を解析する解析手段と、
    前記解析手段により解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定する設定手段と、
    前記設定手段により設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定手段と、
    前記判定手段により変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成する構造化文書生成手段と、
    を備えた画像処理装置。
  2. 設定された用紙上の画像を画像データとして読み取る読取手段と、
    前記読取手段により読み取られた四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する抽出手段と、
    前記抽出手段により抽出された罫線情報に基づいて、前記表画像の格子構造を解析する解析手段と、
    前記解析手段により解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定する設定手段と、
    前記設定手段により設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定手段と、
    前記判定手段により変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成する構造化文書生成手段と、
    を備えた画像読取装置。
  3. 四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出するステップと、
    抽出された罫線情報に基づいて、前記表画像の格子構造を解析するステップと、
    解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定するステップと、
    設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定ステップと、
    前記判定ステップにおいて変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成するステップとをコンピュータに実行させるためのプログラム。
JP2010030809A 2010-02-16 2010-02-16 画像読取装置、画像処理装置およびプログラム Expired - Fee Related JP5574272B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010030809A JP5574272B2 (ja) 2010-02-16 2010-02-16 画像読取装置、画像処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010030809A JP5574272B2 (ja) 2010-02-16 2010-02-16 画像読取装置、画像処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2011170397A JP2011170397A (ja) 2011-09-01
JP5574272B2 true JP5574272B2 (ja) 2014-08-20

Family

ID=44684495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010030809A Expired - Fee Related JP5574272B2 (ja) 2010-02-16 2010-02-16 画像読取装置、画像処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5574272B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6091093B2 (ja) * 2012-06-14 2017-03-08 株式会社エヌ・ティ・ティ・データ 文書変換装置、文書変換方法および文書変換プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2575480B2 (ja) * 1988-11-30 1997-01-22 富士電機株式会社 表構造化方式
JPH0883306A (ja) * 1994-09-12 1996-03-26 Ricoh Co Ltd 表項目及び表の識別方法並びにその装置
JP2006099480A (ja) * 2004-09-29 2006-04-13 Toshiba Corp 文書処理装置

Also Published As

Publication number Publication date
JP2011170397A (ja) 2011-09-01

Similar Documents

Publication Publication Date Title
CN101127081B (zh) 表格数据处理方法和装置
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
US8675260B2 (en) Image processing method and apparatus, and document management server, performing character recognition on a difference image
CN110110313A (zh) 文档表格解析方法及装置
JP2010009509A (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
US20120237131A1 (en) Information processing apparatus to acquire character information
JP2012203783A (ja) 画像処理装置およびプログラム
JP4921335B2 (ja) ドキュメント処理装置及び検索方法
JP2012203491A (ja) 文書処理装置及び文書処理プログラム
JP5769131B2 (ja) 画像処理装置およびプログラム
JP5574272B2 (ja) 画像読取装置、画像処理装置およびプログラム
JP2006262442A (ja) 画像編集装置と画像編集方法
JP6680052B2 (ja) 表データ変換方法、プログラム、画像読取装置
JP2022092119A (ja) 画像処理装置、画像処理方法およびプログラム
JP2012015896A (ja) 画像処理装置
JP2009031937A (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH08320914A (ja) 表認識方法および装置
JP2007087238A (ja) データ変換プログラム、方法及び装置
CN101901341A (zh) 从可移植电子文档中提取光栅图像的方法和设备
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JP4712629B2 (ja) 設備仕様入力装置
JP2000293671A (ja) 画像処理方法、装置及び記憶媒体
JP2000293624A (ja) 画像処理方法、装置及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140609

R150 Certificate of patent or registration of utility model

Ref document number: 5574272

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140622

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees