JP2012203783A - 画像処理装置およびプログラム - Google Patents
画像処理装置およびプログラム Download PDFInfo
- Publication number
- JP2012203783A JP2012203783A JP2011069573A JP2011069573A JP2012203783A JP 2012203783 A JP2012203783 A JP 2012203783A JP 2011069573 A JP2011069573 A JP 2011069573A JP 2011069573 A JP2011069573 A JP 2011069573A JP 2012203783 A JP2012203783 A JP 2012203783A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- information
- processing apparatus
- connection
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】本発明に係る画像処理装置は、予め定められた順に並べられた複数の画像データそれぞれに含まれ、行および列で構成される表から、表の行および列またはこれらのうちのいずれかに設定された表の項目を示す見出しを取得する見出し取得手段と、前記取得した見出しが一致するか否かを判定し、前記見出しが一致すると判定され、前記予め定められた順において隣接する表を、接続される表の集合と判定する表接続判定手段と、前記判定された表の集合のうち、前記予め定められた順において最初の画像データに含まれる第1の表以外の第2の表それぞれから見出しを削除し、前記第1の表と、前記見出しが削除された第2の表とを、前記予め定められた順に接続する表接続手段とを有する。
【選択図】図12
Description
例えば、引用文献2は、入力した文書画像を各属性に従った領域(文章・写真・図形)ごとに、本来の属性を与えるようにファイリングする文書画像ファイリング装置を開示する。
例えば、引用文献3は、電子化文書から、「テキスト」、「ピクチャ」、「表」等のコンテンツ(部品)を取り出し、統合的に扱ったり、再利用したりする文書処理装置を開示する。
例えば、引用文献5は、デジタル複写機において、種類毎の領域に分離した原稿を、再利用可能にするデジタル複写機を開示する。
例えば、引用文献6は、既存文書の優れたデザイン、内容などを再利用して新規の文書を生成する文書編集システムを開示する。
以下、本実施形態の説明に先立ち、その理解を助けるために、本実施形態がなされるに至った経緯を説明する。
図1(A)は、文字、表(例えば、行および列で構成される)、CG(Computer Graphics)および写真などから構成される電子文書を例示する図であり、図1(B)は、図1(A)に示した電子文書を印刷して出力された紙文書を例示する図である。
印刷装置は、例えば、図1(A)に示すような電子文書の印刷が1枚の用紙に収まらない場合、図1(B)に示すように、電子文書を印刷用紙の大きさに応じて分割し、分割された電子文書を複数の紙文書に印刷して出力する。
画像処理装置は、画像処理装置に接続された画像読取装置などにより読み取られた紙文書の画像データから、電子文書を再生成する。
上述のような印刷装置および画像処理装置を使用する場合には、図2(A)に示すような電子文書内の表部分が分割され、図2(B)に示すように複数の紙文書に印刷されると、画像処理装置は、これまで、図2(C)に示すように、複数の紙文書に印刷された表それぞれを独立した別の表として、電子文書を再生成してきた。
そのため、再生成された電子文書(図2(C))は、元の電子文書(図2(A))と異なるので、ユーザは、何らかの方法により、再生成された電子文書を、元の電子文書と同じになるよう再構成しなければならなかった。
以下に説明する本発明に係る画像処理装置1は、以上の経緯によりなされたものであり、電子文書内の表部分(図3(A))が分割され、複数の紙文書(図3(B))に印刷された場合に、これらの複数の紙文書から、元の電子文書と同じ構造の表になるよう電子文書を再生成(図3(C))する。
以下、本発明の第1の実施形態を説明する。
図4は、画像処理装置1のハードウェア構成を例示する図である。
図4に示すように、画像処理装置1は、CPU102およびメモリ104を含む制御装置100、紙文書を読み取って画像データを生成する画像読取装置106、キーボード、タッチパネルおよび表示装置などを含む入出力装置108、電子文書を印刷出力する印刷装置110、他の装置とデータ通信を行う通信装置112、および、CD装置およびHDD装置など、記憶媒体116に対するデータの記録および再生を行う記録装置114などから構成される。
以下、各図において、実質的に同じ構成部分・処理には、同じ符号が付される。
画像処理装置1は、画像読取装置106および記憶媒体116などを介して、電子文書を印刷した紙文書の画像データ受け入れて、受け入れた画像データを処理して電子文書を再生成し(図5,図6などを参照して後述)、印刷装置110および通信装置112に対して出力する。
図5は、画像処理装置1(図4)上で実行される第1の電子文書生成プログラム20の構成を例示する図である。
図5に示すように、電子文書生成プログラム20は、JPEG(Joint Photographic Experts Group)復号部200、前処理部202、オブジェクト分離部204、CG描画処理部206、写真描画処理部208、文字描画処理部210、OCR(Optical Character Recognition)部212、罫線補正処理部214、第1の表描画処理部30、描画データ結合部218、および、電子文書生成部220から構成される。
電子文書生成プログラム20は、画像読取装置106および記憶媒体116(図4)を介して受け入れた、電子文書を印刷した紙文書の画像データから、画像データを構成する各構成要素の属性(文字、表、CG、写真など)を有する電子文書を再生成する。
前処理部202は、オブジェクト分離部204が処理を行う前に、JPEG復号部200から入力された画像データに対して前処理を行い、オブジェクト分離部204に対して出力する。
具体的には、前処理部202は、入力された画像データに対するノイズの除去、および、画像データを文字、表、CGおよび写真などの構成要素(オブジェクト)ごとに分離しやすくするためのフィルタリング処理などを行う。
なお、以下、画像データの各構成要素を、「文字オブジェクト」、「表オブジェクト」、「CGオブジェクト」および「写真オブジェクト」などと記述する。
CG描画処理部206は、オブジェクト分離部204から入力されたCGオブジェクトから、電子文書を生成するCGの描画データ(例えば、ベクトル描画データ)を生成し、描画データ統合部218に対して出力する。
写真描画処理部208は、オブジェクト分離部204から入力された写真オブジェクトから、電子文書を生成する写真の描画データ(例えば、画像データ)を生成し、描画データ統合部218に対して出力する。
OCR部212は、文字描画処理部210から入力された描画データに対するOCR処理により、文字およびその文字の画像データにおける位置を特定する。
また、OCR部212は、特定した文字および位置を、文字データとして第1の表描画処理部30および電子文書生成部220に対して出力する。
罫線補正処理部214は、オブジェクト分離部204から入力された表オブジェクトの罫線のかすれおよび傾きなどに対する補正処理を行い、第1の表描画処理部30に対して出力する。
また、第1の表描画処理部30は、描画データ統合部218、印刷装置110および通信装置112(図4)、または、これらのうちのいずれか1つ以上に対して、生成した表の描画データを出力する。
描画データ結合部218は、CG描画処理部206、写真描画処理部208、文字描画処理部210、および、第1の表描画処理部30から入力された描画データを結合し、電子文書生成部220に対して出力する。
電子文書生成部220は、描画データ結合部218から入力された描画データの結合データに対して、画像読取装置106(図4)で読み取られた画像データと同じ位置に、OCR部212から入力された文字データ埋め込んで電子文書を生成し、印刷装置110および通信装置112(図4)などに対して出力する。
図6は、図5に示した第1の電子文書生成プログラム20の第1の表描画処理プログラム30の構成を例示する図である。
図6に示すように、表描画処理プログラム30は、第1の表情報記憶部300、第1の制御部302、第1の文字データ記憶部304、第1の表走査部306、表構造取得部308、第1の表接続判定部310、第1の表接続部312、および、表描画部314から構成される。
表描画処理プログラム30は、電子文書内の表部分が分割されて印刷された複数の紙文書の画像データから、元の電子文書と同じ構造の表になるよう表描画データを生成する。
表情報記憶部300は、制御部302を介して、図6に示した各構成部分により更新・参照される第1の表情報テーブルを記憶する。
第1の表情報テーブルは、電子文書内の分割された表オブジェクトそれぞれの表情報のリストを示す。
表構造情報は、例えば、表オブジェクトの列数・行数、各列の幅(列幅)・各行の高さ(行高)、各セルの網掛パターン、各セルの色、各セルの罫線情報(色、種類、太さなど)を含む。
例えば、図7に示すように、表IDが“1”の表オブジェクトは、アドレス“p1”に格納され、表の列数が4であり、列幅は、左の列から順に8.5,7.5,6,10(cm)であり、各セルの網掛パターンは、すべての行について左から順にパターン2,0,0,0であり、縦接続IDは“1”であり、横接続IDは“1”である。
文字データ記憶部304は、OCR部212(図5)から入力された文字データを受け入れ、表描画部314が参照可能に記憶する。
表走査部306は、罫線補正処理部214(図5)から入力された表オブジェクトを走査して、表オブジェクトの格納位置を取得し、表オブジェクトそれぞれに対して表IDを付与する(なお、以下、表走査部306は、表オブジェクトを含む画像データが読み取られた順に、それぞれの画像データに含まれる表オブジェクトに対して、若い値の表IDを付与する場合を具体例とする)。
また、表走査部306は、付与した表IDと、取得した格納位置とを、制御部302を介して、表情報記憶部300に記憶された第1の表情報テーブルに追加する。
また、表構造取得部308は、取得した表構造情報を、制御部302を介して、表情報記憶部300に記憶された第1の表情報テーブルに追加する。
また、表接続判定部310は、判定結果に基づいて、表それぞれの縦接続IDおよび横接続IDを、制御部302を介して、表情報記憶部300に記憶された第1の表情報テーブルに追加する(図8,図9を参照して後述)。
具体的には、例えば、まず、表接続部312は、第1の表情報テーブルの縦接続IDが同じ値の表オブジェクトを、格納位置(図7)へアクセスして取得し、表IDが若い順に縦方向(一つ前の表オブジェクトの後ろ)に接続する。
次に、例えば、表接続部312は、縦方向に接続されなかった表オブジェクトのうち、横接続IDが同じ値のものを、格納位置へアクセスして取得し、表IDが若い順に横方向(一つ前の表オブジェクトの右端)に接続する。
また、表接続部312は、接続した表オブジェクトを、表描画部314に対して出力する。
また、縦横どちらの接続方向を優先するかは、ユーザによる指定、および、予め定められた設定などに基づいて、適宜、変更されうる。
また、表接続判定部310は、縦方向および横方向のいずれかのみの表接続を判定するようにしてもよい。
また、表描画部314は、生成した表描画データを、描画データ結合部218(図5)、印刷装置110および通信装置112(図4)、または、これらのうちのいずれか1つ以上に対して出力する。
例えば、表描画データが印刷装置110および通信装置112に対して出力される場合、図1に示したような他のオブジェクト(文字、CG、写真など)が含まれる画像データから、表オブジェクトのみの描画データが出力されることになる。
なお、表描画データをいずれに出力するかは、入出力装置108(図4)を介したユーザからの指定、および、予め定められた設定などに基づいて決定される。
図8は、表接続判定部310(図6)が、表オブジェクトを縦方向に接続するか否かを判定する表接続判定処理を例示するフローチャートである。
以下、表接続判定部312が、表オブジェクトを縦方向に接続するか否かを判定する表接続判定処理を、さらに説明する。
ステップ320(S320)において、表接続判定部310は、第1の表情報テーブルの1つ目の表情報(例えば、図7の第1の表情報テーブルの表IDが“1”の表情報)を、第1の表情報として取得する。
表接続判定部310は、次の表情報が存在すると判定した場合、S324の処理に進み、それ以外の場合、処理を終了する。
ステップ324(S324)において、表接続判定部310は、次の表情報を、第2の表情報として取得する。
表接続判定部310は、列数および各列幅が一致すると判定した場合、S328の処理に進み、それ以外の場合、S332の処理に進む。
なお、表接続判定部310は、列幅が完全に一致する場合以外に、列幅の差が予め定められた範囲内であれば、一致すると判定してもよい。
具体的には、例えば、表接続判定部310は、第1の表情報および第2の表情報の同じ列のセルの平均色の色差が、予め定められた範囲内であるか否かを判定する。
また、例えば、表接続判定部310は、第1の表情報および第2の表情報の同じ列のセルの網掛パターンが一致するか否かを判定する。
また、表接続判定部310は、網掛ドットの主走査・副走査方向の中央ドット(濃度のピーク)の位置関係と、中央ドットの平均濃度差とが、予め定められた範囲内である場合は、網掛パターンが一致すると判定してもよい。
また、例えば、表接続判定部310は、第1の表情報および第2の表情報の同じ列の縦方向の罫線の色差、太さなどの差が予め定められた範囲内であるか否か、および、罫線の種類が同じであるか否かを判定する。
表接続判定部310は、他の列情報が一致すると判定した場合、S330の処理に進み、それ以外の場合、S332の処理に進む。
ステップ332(S332)において、表接続判定部310は、S324で取得した第2の表情報を、新たな第1の表情報とし、新たな縦接続ID(例えば、現在の縦接続IDに1を加算した値)を付与し、S322に進む。
表接続判定部310は、まだ処理が行われていない表情報が存在すると判定した場合、S324の処理に進み、それ以外の場合、処理を終了する。
なお、図8に示したフローチャートにおいては、S326において、列数および各列幅が一致すると判定し、さらに、S328において、他の列情報が一致すると判定した場合に、第1の表情報と第2の表情報を接続すると判定しているが、S328の判定は必須ではない。
この場合、表接続判定部310は、S326において列数および各列幅が一致すると判定したときは、S330の処理に進み、それ以外のときは、S332の処理に進む。
図9は、表接続判定部310(図7)が、表オブジェクトを横方向に接続するか否かを判定する表接続判定処理を例示するフローチャートである。
以下、表接続判定部310が、表オブジェクトを横方向に接続するか否かを判定する表接続判定処理を、さらに説明する。
ステップ320(S320)〜ステップ324(S324)において、表接続判定部310は、図8に示したS320〜S324と同様な処理を行う。
表接続判定部310は、行数および各行高が一致すると判定した場合、S342の処理に進み、それ以外の場合、S346の処理に進む。
なお、表接続判定部310は、行高が完全に一致する場合以外に、行高の差が予め定められた範囲内であれば、一致すると判定してもよい。
具体的には、例えば、S328(図8)と同様に、表接続判定部310は、第1の表情報および第2の表情報の同じ行のセルの平均色の色差が、予め定められた範囲内であるか否かを判定する。
また、例えば、S328(図8)と同様に、表接続判定部310は、第1の表情報および第2の表情報の同じ行のすべての列の網掛パターンが一致するか否かを判定する。
また、例えば、S328(図8)と同様に、表接続判定部310は、第1の表情報および第2の表情報の同じ行の横方向の罫線の色差、太さの差が予め定められた範囲内であるか否か、および、罫線の種類が同じであるか否かを判定する。
表接続判定部310は、他の行情報が一致すると判定した場合、S344の処理に進み、それ以外の場合、S346の処理に進む。
ステップ346(S346)において、表接続判定部310は、S324で取得した第2の表情報を、新たな第1の表情報とし、新たな横接続ID(例えば、現在の横接続IDに1を加算した値)を付与し、S322に進む。
なお、図9に示したフローチャートにおいては、S340において、行数および各行高が一致すると判定し、さらに、S342において、他の行情報が一致すると判定した場合に、第1の表情報と第2の表情報を接続すると判定しているが、S342の判定は必須ではない。
この場合、表接続判定部310は、縦方向の表接続の場合と同様に、S340において行数および各行高が一致すると判定したときは、S344の処理に進み、それ以外のときは、S346の処理に進む。
以下、画像処理装置1(図4)の第1の動作例を説明する。
本動作例においては、画像処理装置1が、電子文書内の表部分(図3(A))が印刷された複数の紙文書(図3(B))から、図3(C)に示すように電子文書を再生成する処理を説明する。
画像処理装置1は、画像読取装置106を介して読み取られた複数の紙文書の画像データから分離した表オブジェクトを走査し、第1の表情報テーブルに、表IDおよび格納位置を追加する(表走査部306(図6))。
つまり、本動作例において、画像処理装置1は、図7に示すように、5つの表IDおよび格納位置を追加する。
画像処理装置1は、第1の表情報テーブルに基づいて、縦または横に接続される表の集合を判定し、第1の表情報テーブルに、縦接続IDおよび横接続IDを追加する(表接続判定部310(図6,図8,図9))。
つまり、本動作例において、画像処理装置1は、列数、各列幅および同じ列の網掛パターンが一致する表IDが“1”〜“3”に対応する表オブジェクトの縦接続IDを“1”とし、表IDが“4”,“5”に対応する表オブジェクトの縦接続IDを“2”とする(図7)。
また、本動作例において、画像処理装置1は、表オブジェクトそれぞれの各行におけるセルの網掛パターンが異なるので、横接続IDをそれぞれ異なる値とする(図7)。
つまり、本動作例において、画像処理装置1は、縦接続IDが“1”である表IDが“1”〜“3”の表オブジェクトを縦方向に接続し、縦接続IDが“2”である表IDが“4”,“5”の表オブジェクトを縦方向に接続する(図3(C))。
画像処理装置1は、接続した表オブジェクトに文字データを埋め込んで、表描画データを生成し、描画データ結合部218(図5)、印刷装置110および通信装置112(図4)、または、これらのうちのいずれか1つ以上に対して出力する(表描画部314(図6))。
以下、本発明の第2の実施形態を説明する。
図10(A)は、電子文書内の行または列の各項目の意味を示す見出し付き表部分を例示する図であり、図10(B)は、図10(A)に示した表部分を見出し付きで印刷して出力された複数の紙文書を例示する図であり、図10(C)は、図10(B)に示した複数の紙文書から、これまでの画像処理装置により再生成された電子文書を例示する図である。
図10(A)に示すような電子文書内の見出し付きの表部分が分割され、図10(B)に示すように、複数の紙文書に見出し付きで印刷されると、画像処理装置は、これまで、図10(C)に示すように、複数の紙文書に印刷された表それぞれに見出しが付いた別の表として電子文書が再生成してきた。
以下に説明する本発明に係る画像処理装置1は、以上の経緯によりなされたものであり、本発明の第2の実施形態においては、元の電子文書と同じ構造の見出し付きの表(図11(A))になるよう、図11(C)に示すように電子文書を再生成する場合が具体例とされる。
図12は、本発明の第1の実施形態において図5で示した第1の電子文書生成プログラム20の第1の表描画処理プログラム30と置換された第2の電子文書生成プログラム24の第2の表描画処理プログラム40の構成を例示する図である。
図12に示すように、表描画処理プログラム40は、第2の表情報記憶部400、第2の制御部402、第2の文字データ記憶部404、第2の表走査部406、見出し取得部408、第2の表接続判定部410、第2の表接続部412、および、表描画部314から構成される。
表描画処理プログラム40は、見出し付きの表部分が分割されて印刷された複数の紙文書の画像データから、元の電子文書と同じ構造の見出し付きの表になるよう表描画データを生成する。
なお、以下、本実施形態においては、表の1行目が見出しを示し、分割された表を縦方向に接続する場合を具体例として説明する。
表情報記憶部400は、制御部402を介して、図12に示した各構成部分により更新・参照される第2の表情報テーブルを記憶する。
図13に示すように、第2の表情報テーブルの表情報それぞれは、例えば、図7に示した第1の表情報テーブルと同様な表IDおよび表オブジェクトの格納位置と、見出し行の各セルの内容を示す見出し行情報と、接続される表オブジェクトの集合を識別する接続IDとから構成される。
例えば、図13に示すように、表IDが“1”の表オブジェクトは、アドレス“p1”に格納され、見出し行の各セルの内容は、左のセルから順に“No.”,“AAA”,“BBB”,“CCC”,“DDD”であり、接続IDは“1”である。
文字データ記憶部404は、図6に示した文字データ記憶部304と同様に、OCR部212(図5)から入力された文字データを受け入れ、見出し取得部408および表描画部314が参照可能に記憶する。
表走査部406は、図6に示した表走査部306と同様に、罫線補正処理部214(図5)から入力された表オブジェクトを走査して、表オブジェクトの格納位置を取得し、表オブジェクトそれぞれに対して表IDを付与する。
また、表走査部406は、付与した表IDと、取得した格納位置とを、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに追加する。
また、見出し取得部408は、文字データ記憶部404が記憶する文字データを参照して、取得した表オブジェクトそれぞれの1行目の各セルに対応する位置の文字を取得する。
また、見出し取得部408は、取得した文字を、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに追加する。
また、表接続判定部410は、判定結果に基づいて、表それぞれの接続IDを、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに追加する(図14を参照して後述)。
表接続部412は、制御部402の制御により、表情報記憶部400に記憶された第2の表情報テーブルの接続ID(図13)参照して、表オブジェクトそれぞれを接続し、表描画部314に対して出力する(図15を参照して後述)。
図14は、表接続判定部410(図12)が、表オブジェクトを接続するか否かを判定する表接続判定処理を例示するフローチャートである。
以下、表接続判定部410が、表オブジェクトを接続するか否かを判定する表接続判定処理を、さらに説明する。
ステップ420(S420)において、表接続判定部410は、第2の表情報テーブルの1つ目の表情報(例えば、図13の第2の表情報テーブルの表IDが“1”の表情報)を、第1の表情報として取得する。
表接続判定部410は、次の表情報が存在すると判定した場合、S424の処理に進み、それ以外の場合、処理を終了する。
ステップ424(S424)において、表接続判定部410は、次の表情報を、第2の表情報として取得する。
表接続判定部410は、見出し行情報が一致すると判定した場合、S428の処理に進み、それ以外の場合、S430の処理に進む。
なお、表接続判定部410は、第1の表情報および第2の表情報の見出し行情報のうち、同じ列の見出しの少なくとも1つが同じであれば、見出し行情報が一致すると判定してもよい。
また、表接続判定部410は、同じ列の見出しの少なくとも1つが同じであり、さらに、第1の表情報および第2の表情報の列数、または、列数および列それぞれの幅が一致すれば、見出し行情報が一致すると判定してもよい。
ステップ430(S430)において、表接続判定部410は、S424で取得した第2の表情報を、新たな第1の表情報とし、新たな接続ID(例えば、現在の接続IDに1を加算した値)を付与し、S422に進む。
第2の表接続判定部410は、まだ処理が行われていない表情報が存在すると判定した場合、S424の処理に進み、それ以外の場合、処理を終了する。
図15は、表接続部412(図12)が、表オブジェクトを接続する表接続処理を例示するフローチャートである。
以下、表接続部412が、表オブジェクトを接続する表接続処理を、さらに説明する。
ステップ420(S420)〜ステップ424(S424)において、表接続部412は、図14に示したS420〜S424と同様な処理を行う。
表接続部412は、接続IDが一致すると判定した場合、S442の処理に進み、それ以外の場合、S444の処理に進む。
ステップ442(S442)において、表接続部412は、S424において取得した第2の表情報の格納位置へアクセスして、表オブジェクト(第2の表オブジェクト)を取得し、取得した第2の表オブジェクトの見出し行に対応する1行目を削除する。
ステップ446(S446)において、表接続部412は、S420において取得した第1の表情報の格納位置へアクセスして、表オブジェクト(第1の表オブジェクト)を取得し、取得した第1の表オブジェクトの後に、見出し行が削除された第2の表オブジェクトを縦方向に接続する。
表接続部412は、まだ処理が行われていない表オブジェクトが存在すると判定した場合、S424の処理に進み、それ以外の場合、処理を終了する。
以下、画像処理装置1(図4)の第2の動作例を説明する。
本動作例においては、画像処理装置1が、電子文書内の見出し付き表部分が印刷された複数の紙文書(図11(A))から、図11(C)に示すように電子文書を再生成する処理を説明する。
画像処理装置1は、画像読取装置106を介して読み取られた複数の紙文書の画像データから分離した表オブジェクトを走査し、第2の表情報テーブルに、表IDおよび格納位置を追加する(表走査部406(図12))。
つまり、本動作例において、画像処理装置1は、図13に示すように、5つの表IDおよび格納位置を追加する。
画像処理装置1は、第2の表情報テーブルに基づいて、接続される表の集合を判定し、第2の表情報テーブルに、接続IDを追加する(表接続判定部410(図12,図14))。
つまり、本動作例において、画像処理装置1は、見出し行情報が一致する表IDが“1”〜“3”に対応する表オブジェクトの接続IDを“1”とし、表IDが“4”,“5”に対応する表オブジェクトの接続IDを“2”とする(図13)。
つまり、本動作例において、画像処理装置1は、接続IDが“1”である表IDが“1”〜“3”の表オブジェクトのうち、表IDが“2”,“3”の表オブジェクトから見出し行を削除した後、表IDが“1”の表オブジェクトの後に(図11(B))、表IDが“2”,“3”の表オブジェクトを順に、縦方向に接続する(図11(C))。
また、画像処理装置1は、接続IDが“2”である表IDが“4”,“5”の表オブジェクトのうち、表IDが“5”の表オブジェクトから見出し行を削除した後に(図11(B))、表IDが“4”の表オブジェクトの後に、表IDが“5”の表オブジェクトを縦方向に接続する(図11(C))。
画像処理装置1は、接続した表オブジェクトに文字データを埋め込んで、表描画データを生成し、描画データ結合部218(図5)、印刷装置110および通信装置112(図4)、または、これらのうちのいずれか1つ以上に対して出力する(表描画部314(図12))。
本実施形態の説明においては、表の1行目が見出しを示し、分割された表を縦方向に接続する場合を具体例としたが、これに限定されるものではなく、本実施形態は、表の1列目が見出しを示し、分割された表を横方向に接続するようにしてもよい。
この場合、見出し取得部408は、文字データ記憶部404が記憶する文字データを参照して、表オブジェクトそれぞれの1列目の各セルに対応する位置の文字を取得する。
また、見出し取得部408は、取得した文字を、見出し列情報として、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに追加する。
表接続部412は、図15に示した表接続処理と同様に、接続IDに基づいて、表オブジェクトそれぞれを横方向に接続する。
また、表の見出し位置を抽出し、見出しの位置が表の1行目である場合は、縦方向の表接続処理を行い、見出しの位置が表の1列目である場合は、横方向の表接続処理を行うように、両実施形態を組み合わせてもよい。
また、表の最終行または表の最終列が見出しを示す場合であってもよい。
以下、本発明の第3の実施形態を説明する。
本発明の第3の実施形態においては、電子文書内の表部分の見出しの有無に応じて、第1の実施形態および第2の実施形態のいずれかを選択して、複数の紙文書の画像データから、元の電子文書と同じ構造の表になるよう表描画データを生成する場合が具体例とされる。
図16は、本発明の第1の実施形態において図5で示した第1の電子文書生成プログラム20の第1の表描画処理プログラム30と置換された第3の電子文書生成プログラム26の第3の表描画処理部50の構成を例示する図である。
図16に示すように、第3の表描画処理プログラム50は、第3の表情報記憶部500、第3の制御部502、第3の表走査部504、選択部506、表構造取得部308、第1の表接続判定部310、第1の表接続部312、表描画部314、第2の文字データ記憶部404、見出し取得部408、第2の表接続判定部410、および、第2の表接続部412から構成される。
表描画処理プログラム50は、電子文書内の表部分の見出しの有無に応じて、第1の実施形態および第2の実施形態のいずれかを選択して、表描画データを生成する。
第3の表情報テーブルの表情報それぞれは、例えば、図7に示した第1の表情報テーブルと同様な表IDおよび表オブジェクトの格納位置と、表オブジェクトそれぞれの見出しの有無を示す見出し有無情報とから構成される。
また、表情報記憶部500は、選択部506による第1の実施形態および第2の実施形態の選択に応じて、図7に示した第1の表情報テーブル、および、図13に示した第2の表情報テーブルを記憶する。
表走査部504は、図6に示した表走査部306と同様に、罫線補正処理部214(図5)から入力された表オブジェクトを走査して、表オブジェクトの格納位置を取得し、表オブジェクトそれぞれに対して表IDを付与する。
また、表走査部504は、表オブジェクトの格納位置へアクセスして表オブジェクトを取得し、例えば、表オブジェクトの1行目または1列目が、他の行または列とは異なる書式が設定されている場合は見出し有と判断し、それ以外の場合は見出し無と判断して、見出し有無情報を生成する。
表走査部504は、付与した表IDと、取得した格納位置と、生成した見出し有無情報とを、制御部502を介して、表情報記憶部500に記憶された第3の表情報テーブルに追加する。
具体的には、例えば、選択部506は、第3の表情報テーブルの表情報のうち、見出し有無情報が見出し有を示し、表IDの値が連続している表オブジェクトの表情報を、一つの第2の表情報テーブルとして、制御部502を介して、表情報記憶部500に対して出力する。
また、例えば、選択部506は、第3の表情報テーブルの表情報のうち、見出し有無情報が見出し無を示し、表IDの値が連続している表オブジェクトの表情報を、一つの第1の表情報テーブルとして、制御部502を介して、表情報記憶部500に対して出力する。
本発明の第1〜第3の実施形態において、第1〜第3の表描画処理プログラム30,40,50は、処理対象となるすべての表オブジェクトに対して表接続のための処理を行った後に、表オブジェクトを接続して、表描画データを生成するが、表オブジェクトごとに、逐次、表接続の処理を行ってもよい。
本発明の第1〜第3の実施形態では、表オブジェクトを含む画像データが読み取られた順に、表オブジェクトの表接続判定および表接続処理を行うが、例えば、図3(B),図11(A)に示すように、複数の紙文書それぞれにページ番号が印字されている場合、読み取った画像データからページ番号を認識し、ページ番号順に、表オブジェクトに対する各処理を行ってもよい。
本発明の第1〜第3の実施形態では、第1,第2の表接続判定部310,410により表情報テーブルに追加された接続IDに基づいて、第1,第2の表接続部308,408により表オブジェクトの表接続処理(図8,図9,図14)を行うが、表接続処理を行う前に、例えば、ユーザに対して表接続判定処理の結果を表示し、ユーザからの表接続指示を受け入れて、表接続処理を行ってもよい。
本発明の第1〜第3の実施形態では、第1,第2の表接続判定部310,410は、オブジェクト分離部204(図5)により分離された表オブジェクトに対して、表接続判定処理を行っているが、表オブジェクトだけでなく、オブジェクト分離前の画像データも参照して、表接続判定処理を行ってもよい。
具体的には、例えば、第1,第2の表接続判定部310,410は、第1の表オブジェクトと第2の表オブジェクトとの間に、他のオブジェクト(文字、CG、写真など)が含まれていると判定した場合、第1,第2の表オブジェクトの表構造および見出し情報などが一致する場合でも、両表オブジェクトを接続しないと判定する。
100・・・制御装置,
102・・・CPU,
104・・・メモリ,
106・・・画像読取装置,
108・・・入出力装置,
110・・・印刷装置,
112・・・通信装置,
114・・・記録装置,
116・・・記録媒体,
20,24,26・・・電子文書生成プログラム,
200・・・JPEG復号部,
202・・・前処理部,
204・・・オブジェクト分離部,
206・・・CG描画処理部,
208・・・写真描画処理部,
210・・・文字描画処理部,
212・・・OCR部,
214・・・罫線補正処理部,
218・・・描画データ結合部,
220・・・電子文書生成部,
30,40,50・・・表描画処理部,
300,400,500・・・表情報記憶部,
302,402,502・・・制御部,
304,404・・・文字データ記憶部,
306,406,504・・・表走査部,
308・・・表構造取得部,
310,410・・・表接続判定部,
312,412・・・表接続部,
314・・・表描画部,
408・・・見出し取得部,
506・・・選択部
Claims (10)
- 予め定められた順に並べられた複数の画像データそれぞれに含まれ、行および列で構成される表から、前記表の行および列またはこれらのうちのいずれかに設定された前記表の項目を示す見出しを取得する見出し取得手段と、
前記複数の画像データそれぞれに含まれる表の前記取得した見出しが一致するか否かを判定し、前記見出しが一致すると判定され、前記予め定められた順において隣接する表を、接続される表の集合と判定する表接続判定手段と、
前記判定された表の集合のうち、前記予め定められた順において最初の画像データに含まれる第1の表以外の第2の表それぞれから見出しを削除し、前記第1の表と、前記見出しが削除された第2の表とを、前記予め定められた順に接続する表接続手段と
を有する画像処理装置。 - 前記見出しは、前記複数の画像データに含まれる表それぞれの行の端に構成され、
前記表接続手段は、前記第1の表と、それぞれ前記見出しを構成する行の端が削除された前記第2の表とを、前記予め定められた順に、表の下方向に接続する
請求項1に記載の画像処理装置。 - 前記行の端は、前記表の最初の行である
請求項2に記載の画像処理装置。 - 前記見出しは、前記複数の画像データに含まれる表それぞれの列の端に構成され、
前記表接続手段は、前記第1の表と、それぞれ前記見出しを構成する列の端が削除された前記第2の表とを、前記予め定められた順に、表の右方向に接続する
請求項1に記載の画像処理装置。 - 前記列の端は、前記表の左端の列である
請求項4に記載の画像処理装置。 - 前記表接続判定手段は、前記隣接する表を含む複数の画像データそれぞれに含まれる表以外の構成部分が、前記隣接する表の間に構成されている場合、前記隣接する表を接続しないと判定する
請求項1〜5のいずれかに記載の画像処理装置。 - 前記複数の画像データは、紙文書からの画像読み取りにより生成される
請求項1〜6のいずれかに記載の画像処理装置。 - 前記予め定められた順は、前記紙文書が読み取られた順序を示す
請求項7に記載の画像処理装置。 - 前記複数の画像データは、並び順を特定する順序情報を含み、
前記予め定められた順は、前記順序情報により特定される順序を示す
請求項1〜7のいずれかに記載の画像処理装置。 - 予め定められた順に並べられた複数の画像データそれぞれに含まれ、行および列で構成される表から、前記表の行および列またはこれらのうちのいずれかに設定された前記表の項目を示す見出しを取得する見出し取得ステップと、
前記複数の画像データそれぞれに含まれる表の前記取得した見出しが一致するか否かを判定し、前記見出しが一致すると判定され、前記予め定められた順において隣接する表を、接続される表の集合と判定する表接続判定ステップと、
前記判定された表の集合のうち、前記予め定められた順において最初の画像データに含まれる第1の表以外の第2の表それぞれから見出しを削除し、前記第1の表と、前記見出しが削除された第2の表とを、前記予め定められた順に接続する表接続ステップと
をコンピュータに実行させるプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011069573A JP2012203783A (ja) | 2011-03-28 | 2011-03-28 | 画像処理装置およびプログラム |
US13/230,384 US8587817B2 (en) | 2011-03-28 | 2011-09-12 | Image processing apparatus, image processing method, and computer readable medium storing program |
AU2011250825A AU2011250825B2 (en) | 2011-03-28 | 2011-11-16 | Image processing apparatus, image processing method, and program |
CN2011104096156A CN102708580A (zh) | 2011-03-28 | 2011-12-09 | 图像处理设备和图像处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011069573A JP2012203783A (ja) | 2011-03-28 | 2011-03-28 | 画像処理装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012203783A true JP2012203783A (ja) | 2012-10-22 |
Family
ID=46901297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011069573A Pending JP2012203783A (ja) | 2011-03-28 | 2011-03-28 | 画像処理装置およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8587817B2 (ja) |
JP (1) | JP2012203783A (ja) |
CN (1) | CN102708580A (ja) |
AU (1) | AU2011250825B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5769131B2 (ja) * | 2011-07-12 | 2015-08-26 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
US8832158B2 (en) | 2012-03-29 | 2014-09-09 | International Business Machines Corporation | Fast predicate table scans using single instruction, multiple data architecture |
CN103778128B (zh) * | 2012-10-18 | 2018-05-04 | 腾讯科技(深圳)有限公司 | 一种列表信息的绘制方法和装置 |
JP2015144428A (ja) * | 2013-12-27 | 2015-08-06 | 株式会社リコー | 画像形成装置及び画像形成装置におけるセキュリティ印刷方法 |
JP6131923B2 (ja) * | 2014-09-17 | 2017-05-24 | カシオ計算機株式会社 | 表示制御装置、表示装置、表生成装置、表示制御方法及びプログラム |
JP2016212563A (ja) * | 2015-05-01 | 2016-12-15 | キヤノン株式会社 | 文書解析システムおよび文書解析方法 |
CN110728240A (zh) * | 2019-10-14 | 2020-01-24 | 北京华宇信息技术有限公司 | 一种对电子卷宗的标题自动识别的方法及装置 |
CN113536751B (zh) * | 2021-06-30 | 2023-09-22 | 北京百度网讯科技有限公司 | 表格数据的处理方法、装置、电子设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH096765A (ja) * | 1995-06-22 | 1997-01-10 | Hitachi Ltd | 情報処理装置 |
JP2010097262A (ja) * | 2008-10-14 | 2010-04-30 | Keyence Corp | データベース生成装置、データベース生成方法及びコンピュータプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05342408A (ja) | 1991-04-04 | 1993-12-24 | Fuji Xerox Co Ltd | 文書画像ファイリング装置 |
US5588072A (en) * | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
JPH0844827A (ja) | 1994-07-27 | 1996-02-16 | Ricoh Co Ltd | デジタル複写機 |
JP3642615B2 (ja) | 1995-10-30 | 2005-04-27 | 富士通株式会社 | パターン領域切り出し方式及びパターン抽出装置 |
US5729666A (en) * | 1996-08-05 | 1998-03-17 | Hewlett-Packard Company | Efficient method and apparatus for downloading of fonts from a processor to a printer |
JP2002073598A (ja) | 2000-08-24 | 2002-03-12 | Canon Inc | 文書処理装置および方法 |
JP3862605B2 (ja) * | 2001-07-19 | 2006-12-27 | キヤノン株式会社 | 画像処理装置 |
JP2003288334A (ja) | 2002-03-28 | 2003-10-10 | Toshiba Corp | 文書処理装置及び文書処理方法 |
US7426059B2 (en) * | 2002-09-16 | 2008-09-16 | Oracle International Corporation | Data presentation methods and apparatus to facilitate printing and reviewing |
US8310713B2 (en) * | 2002-12-24 | 2012-11-13 | Konica Minolta Business Technologies, Inc. | Image forming device, image forming program, computer readable recording medium on which the program is recorded, and image forming method |
JP2005128925A (ja) | 2003-10-27 | 2005-05-19 | Seiko Epson Corp | 文書編集システム、文書編集プログラム及び文書編集方法 |
US7385729B2 (en) * | 2004-03-26 | 2008-06-10 | Lexmark International, Inc. | Optimization techniques during processing of print jobs |
JP4095617B2 (ja) * | 2005-02-28 | 2008-06-04 | キヤノン株式会社 | 文書処理装置及び文書処理方法及びコンピュータプログラム |
US8259193B2 (en) * | 2007-11-21 | 2012-09-04 | Panasonic Corporation | Image file reproduction apparatus and image data reproduction apparatus |
-
2011
- 2011-03-28 JP JP2011069573A patent/JP2012203783A/ja active Pending
- 2011-09-12 US US13/230,384 patent/US8587817B2/en not_active Expired - Fee Related
- 2011-11-16 AU AU2011250825A patent/AU2011250825B2/en active Active
- 2011-12-09 CN CN2011104096156A patent/CN102708580A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH096765A (ja) * | 1995-06-22 | 1997-01-10 | Hitachi Ltd | 情報処理装置 |
JP2010097262A (ja) * | 2008-10-14 | 2010-04-30 | Keyence Corp | データベース生成装置、データベース生成方法及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
AU2011250825B2 (en) | 2013-02-14 |
AU2011250825A1 (en) | 2012-10-18 |
CN102708580A (zh) | 2012-10-03 |
US20120250107A1 (en) | 2012-10-04 |
US8587817B2 (en) | 2013-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012203783A (ja) | 画像処理装置およびプログラム | |
JP2005004724A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP6119992B2 (ja) | 画像処理装置およびコンピュータプログラム | |
US7965293B2 (en) | Image processing device, image processing method, and image processing program for reconstructing data | |
JP2006259045A (ja) | 画像形成装置及び方法 | |
JP2005044279A (ja) | 帳票処理方法、帳票処理プログラム、帳票処理装置 | |
US8780404B2 (en) | Information processing apparatus, method for controlling same, and storage medium on which computer program has been recorded | |
JP2011040971A (ja) | 画像処理装置、画像処理方法、および、画像処理プログラム | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP5769131B2 (ja) | 画像処理装置およびプログラム | |
JP6579331B2 (ja) | 画像形成装置、文書電子化プログラムおよび文書電子化方法 | |
JP2012203784A (ja) | 画像処理装置およびプログラム | |
JP5612882B2 (ja) | 印刷制御装置、印刷プログラムおよび画像形成装置 | |
JP2006222572A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP2012039236A (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
JP2009294870A (ja) | 画像処理装置及び方法 | |
JP2009223363A (ja) | 文書処理装置および文書処理プログラム | |
JP2006333248A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP2012022413A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
CN102710882B (zh) | 图像处理设备和图像处理方法 | |
JP5574272B2 (ja) | 画像読取装置、画像処理装置およびプログラム | |
JP4239829B2 (ja) | 電子アルバム作成装置、電子アルバム作成方法、およびプログラム | |
JP2004280691A (ja) | 文書ファイリング装置 | |
JP5455395B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2011151703A (ja) | 画像処理装置、文字拡大処理方法および文字拡大プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140827 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141009 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20141031 |