JP2012203783A - 画像処理装置およびプログラム - Google Patents

画像処理装置およびプログラム Download PDF

Info

Publication number
JP2012203783A
JP2012203783A JP2011069573A JP2011069573A JP2012203783A JP 2012203783 A JP2012203783 A JP 2012203783A JP 2011069573 A JP2011069573 A JP 2011069573A JP 2011069573 A JP2011069573 A JP 2011069573A JP 2012203783 A JP2012203783 A JP 2012203783A
Authority
JP
Japan
Prior art keywords
unit
information
processing apparatus
connection
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011069573A
Other languages
English (en)
Inventor
Tetsuya Wakiyama
徹也 脇山
Toshiyuki Yamada
俊之 山田
Kiyotaka Tsuchibuchi
清隆 土渕
Junichi Shimizu
淳一 清水
Hiroshi Niina
博 新名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2011069573A priority Critical patent/JP2012203783A/ja
Priority to US13/230,384 priority patent/US8587817B2/en
Priority to AU2011250825A priority patent/AU2011250825B2/en
Priority to CN2011104096156A priority patent/CN102708580A/zh
Publication of JP2012203783A publication Critical patent/JP2012203783A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】電子文書内の表部分が分割され、複数の紙文書に印刷された場合に、これらの複数の紙文書から、元の電子文書と同じ表になるよう電子文書を再生成する。
【解決手段】本発明に係る画像処理装置は、予め定められた順に並べられた複数の画像データそれぞれに含まれ、行および列で構成される表から、表の行および列またはこれらのうちのいずれかに設定された表の項目を示す見出しを取得する見出し取得手段と、前記取得した見出しが一致するか否かを判定し、前記見出しが一致すると判定され、前記予め定められた順において隣接する表を、接続される表の集合と判定する表接続判定手段と、前記判定された表の集合のうち、前記予め定められた順において最初の画像データに含まれる第1の表以外の第2の表それぞれから見出しを削除し、前記第1の表と、前記見出しが削除された第2の表とを、前記予め定められた順に接続する表接続手段とを有する。
【選択図】図12

Description

本発明は、画像処理装置およびプログラムに関する。
例えば、引用文献1は、複数ページからなる印刷文書に含まれる図、表などの浮遊要素を適切な位置に設定してXML文書やHTML文書などの構造化文書を生成する表読取装置を開示する。
例えば、引用文献2は、入力した文書画像を各属性に従った領域(文章・写真・図形)ごとに、本来の属性を与えるようにファイリングする文書画像ファイリング装置を開示する。
例えば、引用文献3は、電子化文書から、「テキスト」、「ピクチャ」、「表」等のコンテンツ(部品)を取り出し、統合的に扱ったり、再利用したりする文書処理装置を開示する。
例えば、引用文献4は、文字、図形、記号などのパターンの範囲を示す枠を構成する線がかすれている場合においても、パターンの範囲を抽出するパターン抽出装置を開示する。
例えば、引用文献5は、デジタル複写機において、種類毎の領域に分離した原稿を、再利用可能にするデジタル複写機を開示する。
例えば、引用文献6は、既存文書の優れたデザイン、内容などを再利用して新規の文書を生成する文書編集システムを開示する。
特開平04−023185号公報 特開平05−342408号公報 特開2002−073598号公報 特開平09−128480号公報 特開平08−044827号公報 特開2005−128925号公報
本発明は、電子文書内の表部分が分割され、複数の紙文書に印刷された場合に、これらの複数の紙文書から、元の電子文書と同じ構造の表になるよう電子文書を再生成する画像処理装置およびプログラムを提供することを目的とする。
請求項1に係る本発明は、予め定められた順に並べられた複数の画像データそれぞれに含まれ、行および列で構成される表から、前記表の行および列またはこれらのうちのいずれかに設定された前記表の項目を示す見出しを取得する見出し取得手段と、前記複数の画像データそれぞれに含まれる表の前記取得した見出しが一致するか否かを判定し、前記見出しが一致すると判定され、前記予め定められた順において隣接する表を、接続される表の集合と判定する表接続判定手段と、前記判定された表の集合のうち、前記予め定められた順において最初の画像データに含まれる第1の表以外の第2の表それぞれから見出しを削除し、前記第1の表と、前記見出しが削除された第2の表とを、前記予め定められた順に接続する表接続手段とを有する画像処理装置である。
請求項2に係る本発明は、前記見出しは、前記複数の画像データに含まれる表それぞれの行の端に構成され、前記表接続手段は、前記第1の表と、それぞれ前記見出しを構成する行の端が削除された前記第2の表とを、前記予め定められた順に、表の下方向に接続する請求項1に記載の画像処理装置である。
請求項3に係る本発明は、前記行の端は、前記表の最初の行である請求項2に記載の画像処理装置である。
請求項4に係る本発明は、前記見出しは、前記複数の画像データに含まれる表それぞれの列の端に構成され、前記表接続手段は、前記第1の表と、それぞれ前記見出しを構成する列の端が削除された前記第2の表とを、前記予め定められた順に、表の右方向に接続する請求項1に記載の画像処理装置である。
請求項5に係る発明は、前記列の端は、前記表の左端の列である請求項4に記載の画像処理装置である。
請求項6に係る本発明は、前記表接続判定手段は、前記隣接する表を含む複数の画像データそれぞれに含まれる表以外の構成部分が、前記隣接する表の間に構成されている場合、前記隣接する表を接続しないと判定する請求項1〜5のいずれかに記載の画像処理装置である。
請求項7に係る本発明は、前記複数の画像データは、紙文書からの画像読み取りにより生成される請求項1〜6のいずれかに記載の画像処理装置である。
請求項8に係る本発明は、前記予め定められた順は、前記紙文書が読み取られた順序を示す請求項7に記載の画像処理装置である。
請求項9に係る本発明は、前記複数の画像データは、並び順を特定する順序情報を含み、前記予め定められた順は、前記順序情報により特定される順序を示す請求項1〜7のいずれかに記載の画像処理装置である。
請求項10に係る本発明は、予め定められた順に並べられた複数の画像データそれぞれに含まれ、行および列で構成される表から、前記表の行および列またはこれらのうちのいずれかに設定された前記表の項目を示す見出しを取得する見出し取得ステップと、前記複数の画像データそれぞれに含まれる表の前記取得した見出しが一致するか否かを判定し、前記見出しが一致すると判定され、前記予め定められた順において隣接する表を、接続される表の集合と判定する表接続判定ステップと、前記判定された表の集合のうち、前記予め定められた順において最初の画像データに含まれる第1の表以外の第2の表それぞれから見出しを削除し、前記第1の表と、前記見出しが削除された第2の表とを、前記予め定められた順に接続する表接続ステップとをコンピュータに実行させるプログラムである。
請求項1に係る本発明によれば、電子文書内の見出し付きの表部分が分割された複数の画像データから、元の電子文書と同じ構造の表になるよう電子文書を再生成する画像処理装置を提供することができる。
請求項2に係る本発明によれば、請求項1に係る発明の効果に加えて、ユーザが指定することなく、複数の画像データそれぞれに含まれる表の見出し行に基づいて、縦方向に接続すべき表部分を特定する画像処理装置を提供することができる。
請求項3に係る本発明によれば、請求項2に係る発明の効果に加えて、ユーザが指定することなく、複数の画像データそれぞれに含まれる表の見出し行に基づいて、縦方向に接続すべき表部分を特定する画像処理装置を提供することができる。
請求項4に係る本発明によれば、請求項1に係る発明の効果に加えて、ユーザが指定することなく、複数の画像データそれぞれに含まれる表の見出し列に基づいて、横方向に接続すべき表部分を特定する画像処理装置を提供することができる。
請求項5に係る本発明によれば、請求項4に係る発明の効果に加えて、ユーザが指定することなく、複数の画像データそれぞれに含まれる表の見出し列に基づいて、横方向に接続すべき表部分を特定する画像処理装置を提供することができる。
請求項6に係る本発明によれば、請求項1〜5のいずれかに係る発明の効果に加えて、複数の画像データそれぞれに含まれる表以外の構成部分を考慮して、より正確に接続すべき表を特定する画像処理装置を提供することができる。
請求項7に係る本発明によれば、請求項1〜6のいずれかに係る発明の効果に加えて、電子文書に含まれる表部分を印刷して出力された紙文書から、元の電子文書と同じ構造の表になるよう電子文書を再生成する画像処理装置を提供することができる。
請求項8に係る本発明によれば、請求項7に係る発明の効果に加えて、電子文書内の表部分の分割された順序を把握しやすくし、より正確に電子文書を再生成する画像処理装置を提供することができる。
請求項9に係る本発明によれば、請求項1〜7のいずれかに係る発明の効果に加えて、電子文書内の表部分の分割された順序を把握しやすくし、より正確に電子文書を再生成する画像処理装置を提供することができる。
請求項10に係る本発明によれば、電子文書内の見出し付きの表部分が分割された複数の画像データから、元の電子文書と同じ構造の表になるよう電子文書を再生成するプログラムを提供することができる。
(A)は、文字、表、CG(Computer Graphics)および写真などから構成される電子文書を例示する図であり、(B)は、(A)に示した電子文書を印刷して出力された紙文書を例示する図である。 (A)は、図1(A)に示すような電子文書内の表部分を例示する図であり、(B)は、(A)に示した表部分を印刷して出力された複数の紙文書を例示する図であり、(C)は、(B)に示した複数の紙文書から、これまでの画像処理装置により再生成されていた電子文書を例示する図である。 (A)は、電子文書内の表部分を例示する図であり、(B)は、図3(A)に示した表部分を印刷して出力された複数の紙文書を例示する図であり、(C)は、(B)に示した複数の紙文書から、本発明の第1の実施形態の画像処理装置により再生成された電子文書を例示する図である。 本実施形態における画像処理装置のハードウェア構成を例示する図である。 図4に示した画像処理装置上で実行される第1の電子文書生成プログラムの構成を例示する図である。 図5に示した第1の電子文書生成プログラムの第1の表描画処理プログラムの構成を例示する図である。 図6に示した第1の表情報記憶部が記憶する第1の表情報テーブルを例示する図である。 図6に示した第1の表接続判定部が、表オブジェクトを縦方向に接続するか否かを判定する表接続判定処理を例示するフローチャートである。 図6に示した第1の表接続判定部が、表オブジェクトを横方向に接続するか否かを判定する表接続判定処理を例示するフローチャートである。 (A)は、電子文書内の見出し付き表部分を例示する図であり、(B)は、(A)に示した表部分を見出し付きで印刷して出力された複数の紙文書を例示する図であり、(C)は、(B)に示した複数の紙文書から、これまでの画像処理装置により再生成されていた電子文書を例示する図である。 (A)は、電子文書内の表部分を見出し付きで印刷して出力された複数の紙文書を例示する図であり、(B)は、電子文書の再生成前に見出し行が削除された表を例示する図であり、(C)は、本発明の第2の実施形態の画像処理装置により再生成された電子文書を例示する図である。 図5で示した第1の電子文書生成プログラムの第1の表描画処理プログラムと置換された第2の電子文書生成プログラムの第2の表描画処理プログラムの構成を例示する図である。 図12に示した第2の表情報記憶部が記憶する第2の表情報テーブルを例示する図である。 図12に示した第2の表接続判定部が、表オブジェクトを接続するか否かを判定する表接続判定処理を例示するフローチャートである。 図12に示した第2の表接続部が、表オブジェクトを接続する表接続処理を例示するフローチャートである。 図5で示した第1の電子文書生成プログラムの第1の表描画処理プログラムと置換された第3の電子文書生成プログラムの第3の表描画処理部の構成を例示する図である。
[本実施形態がなされるに至った経緯]
以下、本実施形態の説明に先立ち、その理解を助けるために、本実施形態がなされるに至った経緯を説明する。
図1(A)は、文字、表(例えば、行および列で構成される)、CG(Computer Graphics)および写真などから構成される電子文書を例示する図であり、図1(B)は、図1(A)に示した電子文書を印刷して出力された紙文書を例示する図である。
印刷装置は、例えば、図1(A)に示すような電子文書の印刷が1枚の用紙に収まらない場合、図1(B)に示すように、電子文書を印刷用紙の大きさに応じて分割し、分割された電子文書を複数の紙文書に印刷して出力する。
画像処理装置は、画像処理装置に接続された画像読取装置などにより読み取られた紙文書の画像データから、電子文書を再生成する。
図2(A)は、図1(A)に示すような電子文書内の表部分を例示する図であり、図2(B)は、図2(A)に示した表部分を印刷して出力された複数の紙文書を例示する図であり、図2(C)は、図2(B)に示した複数の紙文書から、画像処理装置により再生成された電子文書を例示する図である。
上述のような印刷装置および画像処理装置を使用する場合には、図2(A)に示すような電子文書内の表部分が分割され、図2(B)に示すように複数の紙文書に印刷されると、画像処理装置は、これまで、図2(C)に示すように、複数の紙文書に印刷された表それぞれを独立した別の表として、電子文書を再生成してきた。
そのため、再生成された電子文書(図2(C))は、元の電子文書(図2(A))と異なるので、ユーザは、何らかの方法により、再生成された電子文書を、元の電子文書と同じになるよう再構成しなければならなかった。
図3(A)は、電子文書内の表部分を例示する図であり、図3(B)は、図3(A)に示した表部分を印刷して出力された複数の紙文書を例示する図であり、図3(C)は、図3(B)に示した複数の紙文書から、以下に説明する本発明に係る画像処理装置1により再生成された電子文書を例示する図である。
以下に説明する本発明に係る画像処理装置1は、以上の経緯によりなされたものであり、電子文書内の表部分(図3(A))が分割され、複数の紙文書(図3(B))に印刷された場合に、これらの複数の紙文書から、元の電子文書と同じ構造の表になるよう電子文書を再生成(図3(C))する。
[第1の実施形態]
以下、本発明の第1の実施形態を説明する。
[画像処理装置1]
図4は、画像処理装置1のハードウェア構成を例示する図である。
図4に示すように、画像処理装置1は、CPU102およびメモリ104を含む制御装置100、紙文書を読み取って画像データを生成する画像読取装置106、キーボード、タッチパネルおよび表示装置などを含む入出力装置108、電子文書を印刷出力する印刷装置110、他の装置とデータ通信を行う通信装置112、および、CD装置およびHDD装置など、記憶媒体116に対するデータの記録および再生を行う記録装置114などから構成される。
以下、各図において、実質的に同じ構成部分・処理には、同じ符号が付される。
画像処理装置1は、画像読取装置106および記憶媒体116などを介して、電子文書を印刷した紙文書の画像データ受け入れて、受け入れた画像データを処理して電子文書を再生成し(図5,図6などを参照して後述)、印刷装置110および通信装置112に対して出力する。
[電子文書生成プログラム20]
図5は、画像処理装置1(図4)上で実行される第1の電子文書生成プログラム20の構成を例示する図である。
図5に示すように、電子文書生成プログラム20は、JPEG(Joint Photographic Experts Group)復号部200、前処理部202、オブジェクト分離部204、CG描画処理部206、写真描画処理部208、文字描画処理部210、OCR(Optical Character Recognition)部212、罫線補正処理部214、第1の表描画処理部30、描画データ結合部218、および、電子文書生成部220から構成される。
電子文書生成プログラム20は、例えば、記憶媒体116(図4)を介して画像処理装置1のメモリ104にロードされ、画像処理装置1で動作するOS(図示せず)上で、画像処理装置1のハードウェア資源を具体的に利用して実行される。
電子文書生成プログラム20は、画像読取装置106および記憶媒体116(図4)を介して受け入れた、電子文書を印刷した紙文書の画像データから、画像データを構成する各構成要素の属性(文字、表、CG、写真など)を有する電子文書を再生成する。
JPEG復号部200は、画像読取装置106および記録媒体116(図4)などを介して受け入れた圧縮された画像データを、非圧縮画像データに復号し、前処理部202に対して出力する。
前処理部202は、オブジェクト分離部204が処理を行う前に、JPEG復号部200から入力された画像データに対して前処理を行い、オブジェクト分離部204に対して出力する。
具体的には、前処理部202は、入力された画像データに対するノイズの除去、および、画像データを文字、表、CGおよび写真などの構成要素(オブジェクト)ごとに分離しやすくするためのフィルタリング処理などを行う。
なお、以下、画像データの各構成要素を、「文字オブジェクト」、「表オブジェクト」、「CGオブジェクト」および「写真オブジェクト」などと記述する。
オブジェクト分離部204は、前処理部202から入力された画像データから、各オブジェクトを分離し、分離されたCGオブジェクトをCG描画処理部206に対して、写真オブジェクトを写真描画処理部208に対して、文字オブジェクトを文字描画処理部210に対して、表オブジェクトを罫線補正処理部214に対して出力する。
CG描画処理部206は、オブジェクト分離部204から入力されたCGオブジェクトから、電子文書を生成するCGの描画データ(例えば、ベクトル描画データ)を生成し、描画データ統合部218に対して出力する。
写真描画処理部208は、オブジェクト分離部204から入力された写真オブジェクトから、電子文書を生成する写真の描画データ(例えば、画像データ)を生成し、描画データ統合部218に対して出力する。
文字描画処理部210は、オブジェクト分離部204から入力された文字オブジェクトから、電子文書を生成する文字の描画データ(例えば、テキストデータおよびそのフォントデータ)を生成し、描画データ統合部218およびOCR部212に対して出力する。
OCR部212は、文字描画処理部210から入力された描画データに対するOCR処理により、文字およびその文字の画像データにおける位置を特定する。
また、OCR部212は、特定した文字および位置を、文字データとして第1の表描画処理部30および電子文書生成部220に対して出力する。
罫線補正処理部214は、オブジェクト分離部204から入力された表オブジェクトの罫線のかすれおよび傾きなどに対する補正処理を行い、第1の表描画処理部30に対して出力する。
第1の表描画処理部30は、OCR部212から入力された文字データ、および、罫線補正処理部214から入力された罫線が補正された表オブジェクトに基づいて、電子文書を生成する表の描画データ(例えば、表形式のデータ)を生成する(図6などを参照して詳述)。
また、第1の表描画処理部30は、描画データ統合部218、印刷装置110および通信装置112(図4)、または、これらのうちのいずれか1つ以上に対して、生成した表の描画データを出力する。
描画データ結合部218は、CG描画処理部206、写真描画処理部208、文字描画処理部210、および、第1の表描画処理部30から入力された描画データを結合し、電子文書生成部220に対して出力する。
電子文書生成部220は、描画データ結合部218から入力された描画データの結合データに対して、画像読取装置106(図4)で読み取られた画像データと同じ位置に、OCR部212から入力された文字データ埋め込んで電子文書を生成し、印刷装置110および通信装置112(図4)などに対して出力する。
[第1の表描画処理プログラム30]
図6は、図5に示した第1の電子文書生成プログラム20の第1の表描画処理プログラム30の構成を例示する図である。
図6に示すように、表描画処理プログラム30は、第1の表情報記憶部300、第1の制御部302、第1の文字データ記憶部304、第1の表走査部306、表構造取得部308、第1の表接続判定部310、第1の表接続部312、および、表描画部314から構成される。
表描画処理プログラム30は、電子文書内の表部分が分割されて印刷された複数の紙文書の画像データから、元の電子文書と同じ構造の表になるよう表描画データを生成する。
図7は、表情報記憶部300が記憶する第1の表情報テーブルを例示する図である。
表情報記憶部300は、制御部302を介して、図6に示した各構成部分により更新・参照される第1の表情報テーブルを記憶する。
第1の表情報テーブルは、電子文書内の分割された表オブジェクトそれぞれの表情報のリストを示す。
図7に示すように、表情報は、例えば、表オブジェクトを一意に識別する表ID、表オブジェクトの格納位置(例えば、メモリ上のデータ格納領域のアドレス)、表オブジェクト構造を示す表構造情報、縦方向に接続される表オブジェクトの集合を識別する縦接続ID、および、横方向に接続される表オブジェクトの集合を識別する横接続IDから構成される。
表構造情報は、例えば、表オブジェクトの列数・行数、各列の幅(列幅)・各行の高さ(行高)、各セルの網掛パターン、各セルの色、各セルの罫線情報(色、種類、太さなど)を含む。
例えば、図7に示すように、表IDが“1”の表オブジェクトは、アドレス“p1”に格納され、表の列数が4であり、列幅は、左の列から順に8.5,7.5,6,10(cm)であり、各セルの網掛パターンは、すべての行について左から順にパターン2,0,0,0であり、縦接続IDは“1”であり、横接続IDは“1”である。
制御部302(図6)は、各構成部分を制御する。
文字データ記憶部304は、OCR部212(図5)から入力された文字データを受け入れ、表描画部314が参照可能に記憶する。
表走査部306は、罫線補正処理部214(図5)から入力された表オブジェクトを走査して、表オブジェクトの格納位置を取得し、表オブジェクトそれぞれに対して表IDを付与する(なお、以下、表走査部306は、表オブジェクトを含む画像データが読み取られた順に、それぞれの画像データに含まれる表オブジェクトに対して、若い値の表IDを付与する場合を具体例とする)。
また、表走査部306は、付与した表IDと、取得した格納位置とを、制御部302を介して、表情報記憶部300に記憶された第1の表情報テーブルに追加する。
表構造取得部308は、制御部302の制御により、表情報記憶部300に記憶された第1の表情報テーブルを参照して、表オブジェクトの格納位置(図7)へアクセスして、表オブジェクトそれぞれの表構造情報を取得する。
また、表構造取得部308は、取得した表構造情報を、制御部302を介して、表情報記憶部300に記憶された第1の表情報テーブルに追加する。
表接続判定部310は、制御部302の制御により、表情報記憶部300に記憶された第1の表情報テーブルの表IDが若い順に参照して、表IDそれぞれに対応する表構造情報(図7)に基づいて、接続される表の集合を判定する(図8,図9を参照して後述)。
また、表接続判定部310は、判定結果に基づいて、表それぞれの縦接続IDおよび横接続IDを、制御部302を介して、表情報記憶部300に記憶された第1の表情報テーブルに追加する(図8,図9を参照して後述)。
表接続部312は、制御部302の制御により、表情報記憶部300に記憶された第1の表情報テーブルを参照して、表オブジェクトそれぞれを縦方向または横方向に接続する。
具体的には、例えば、まず、表接続部312は、第1の表情報テーブルの縦接続IDが同じ値の表オブジェクトを、格納位置(図7)へアクセスして取得し、表IDが若い順に縦方向(一つ前の表オブジェクトの後ろ)に接続する。
次に、例えば、表接続部312は、縦方向に接続されなかった表オブジェクトのうち、横接続IDが同じ値のものを、格納位置へアクセスして取得し、表IDが若い順に横方向(一つ前の表オブジェクトの右端)に接続する。
また、表接続部312は、接続した表オブジェクトを、表描画部314に対して出力する。
なお、本実施形態では、縦方向の接続を優先しているが、これに限定されるものではなく、横方向の接続を優先してもよい。
また、縦横どちらの接続方向を優先するかは、ユーザによる指定、および、予め定められた設定などに基づいて、適宜、変更されうる。
また、表接続判定部310は、縦方向および横方向のいずれかのみの表接続を判定するようにしてもよい。
表描画部314は、文字データ記憶部304が記憶する文字データを参照して、表接続部312から入力された表オブジェクトに文字データを埋め込んで、表描画データを生成する。
また、表描画部314は、生成した表描画データを、描画データ結合部218(図5)、印刷装置110および通信装置112(図4)、または、これらのうちのいずれか1つ以上に対して出力する。
例えば、表描画データが印刷装置110および通信装置112に対して出力される場合、図1に示したような他のオブジェクト(文字、CG、写真など)が含まれる画像データから、表オブジェクトのみの描画データが出力されることになる。
なお、表描画データをいずれに出力するかは、入出力装置108(図4)を介したユーザからの指定、および、予め定められた設定などに基づいて決定される。
[表接続判定部310の処理(縦方向接続)]
図8は、表接続判定部310(図6)が、表オブジェクトを縦方向に接続するか否かを判定する表接続判定処理を例示するフローチャートである。
以下、表接続判定部312が、表オブジェクトを縦方向に接続するか否かを判定する表接続判定処理を、さらに説明する。
ステップ320(S320)において、表接続判定部310は、第1の表情報テーブルの1つ目の表情報(例えば、図7の第1の表情報テーブルの表IDが“1”の表情報)を、第1の表情報として取得する。
ステップ322(S322)において、表接続判定部310は、第1の表情報テーブルに、次の表情報(例えば、図7の第1の表情報テーブルの表IDが“2”の表情報)が存在するか否かを判定する。
表接続判定部310は、次の表情報が存在すると判定した場合、S324の処理に進み、それ以外の場合、処理を終了する。
ステップ324(S324)において、表接続判定部310は、次の表情報を、第2の表情報として取得する。
ステップ326(S326)において、表接続判定部310は、S320において取得した第1の表情報の列数および各列幅と、S324において取得した第2の表情報の列数および各列幅とが一致するか否かを判定する。
表接続判定部310は、列数および各列幅が一致すると判定した場合、S328の処理に進み、それ以外の場合、S332の処理に進む。
なお、表接続判定部310は、列幅が完全に一致する場合以外に、列幅の差が予め定められた範囲内であれば、一致すると判定してもよい。
ステップ328(S328)において、表接続判定部310は、S320において取得した第1の表情報の列数および各列幅以外の表構造情報(以下、「他の列情報」と記述する)と、S324において取得した第2の表情報の他の列情報とが一致するか否かを判定する。
具体的には、例えば、表接続判定部310は、第1の表情報および第2の表情報の同じ列のセルの平均色の色差が、予め定められた範囲内であるか否かを判定する。
また、例えば、表接続判定部310は、第1の表情報および第2の表情報の同じ列のセルの網掛パターンが一致するか否かを判定する。
例えば、図3に示した紙文書の1〜3ページ目について、1列目のすべてのセルにドットパターンの網掛がなされ、それ以外の列のセルには網掛がなされていないので、表接続判定部310は、網掛パターンが一致すると判定する。
また、表接続判定部310は、網掛ドットの主走査・副走査方向の中央ドット(濃度のピーク)の位置関係と、中央ドットの平均濃度差とが、予め定められた範囲内である場合は、網掛パターンが一致すると判定してもよい。
また、例えば、表接続判定部310は、第1の表情報および第2の表情報の同じ列の縦方向の罫線の色差、太さなどの差が予め定められた範囲内であるか否か、および、罫線の種類が同じであるか否かを判定する。
表接続判定部310は、他の列情報が一致すると判定した場合、S330の処理に進み、それ以外の場合、S332の処理に進む。
ステップ330(S330)において、表接続判定部310は、第1の表情報および第2の表情報に、同じ縦接続IDを付与する。
ステップ332(S332)において、表接続判定部310は、S324で取得した第2の表情報を、新たな第1の表情報とし、新たな縦接続ID(例えば、現在の縦接続IDに1を加算した値)を付与し、S322に進む。
ステップ334(S334)において、表接続判定部310は、第1の表情報テーブルに、まだ表接続判定処理が行われていない表情報が存在するか否かを判定する。
表接続判定部310は、まだ処理が行われていない表情報が存在すると判定した場合、S324の処理に進み、それ以外の場合、処理を終了する。
なお、図8に示したフローチャートにおいては、S326において、列数および各列幅が一致すると判定し、さらに、S328において、他の列情報が一致すると判定した場合に、第1の表情報と第2の表情報を接続すると判定しているが、S328の判定は必須ではない。
この場合、表接続判定部310は、S326において列数および各列幅が一致すると判定したときは、S330の処理に進み、それ以外のときは、S332の処理に進む。
[表接続判定部310の処理(横方向接続)]
図9は、表接続判定部310(図7)が、表オブジェクトを横方向に接続するか否かを判定する表接続判定処理を例示するフローチャートである。
以下、表接続判定部310が、表オブジェクトを横方向に接続するか否かを判定する表接続判定処理を、さらに説明する。
ステップ320(S320)〜ステップ324(S324)において、表接続判定部310は、図8に示したS320〜S324と同様な処理を行う。
ステップ340(S340)において、表接続判定部310は、S320において取得した第1の表情報の行数および各行高と、S324において取得した第2の表情報の行数および各行高とが一致するか否かを判定する。
表接続判定部310は、行数および各行高が一致すると判定した場合、S342の処理に進み、それ以外の場合、S346の処理に進む。
なお、表接続判定部310は、行高が完全に一致する場合以外に、行高の差が予め定められた範囲内であれば、一致すると判定してもよい。
ステップ342(S342)において、表接続判定部310は、S320において取得した第1の表情報の行数および各行高以外の表構造情報(以下、「他の行情報」と記述する)と、S324において取得した第2の表情報の他の行情報とが一致するか否かを判定する。
具体的には、例えば、S328(図8)と同様に、表接続判定部310は、第1の表情報および第2の表情報の同じ行のセルの平均色の色差が、予め定められた範囲内であるか否かを判定する。
また、例えば、S328(図8)と同様に、表接続判定部310は、第1の表情報および第2の表情報の同じ行のすべての列の網掛パターンが一致するか否かを判定する。
例えば、図3に示した紙文書において、各ページの各行において、1列目のセルにドットパターンの網掛がなされ、それ以外の列のセルには網掛がされていないので、表接続判定部310は、網掛パターンが一致しないと判定する。
また、例えば、S328(図8)と同様に、表接続判定部310は、第1の表情報および第2の表情報の同じ行の横方向の罫線の色差、太さの差が予め定められた範囲内であるか否か、および、罫線の種類が同じであるか否かを判定する。
表接続判定部310は、他の行情報が一致すると判定した場合、S344の処理に進み、それ以外の場合、S346の処理に進む。
ステップ344(S344)において、表接続判定部310は、第1の表情報および第2の表情報に、同じ横接続IDを付与する。
ステップ346(S346)において、表接続判定部310は、S324で取得した第2の表情報を、新たな第1の表情報とし、新たな横接続ID(例えば、現在の横接続IDに1を加算した値)を付与し、S322に進む。
ステップ332(S332)において、表接続判定部310は、図8に示したS332と同様な処理を行う。
なお、図9に示したフローチャートにおいては、S340において、行数および各行高が一致すると判定し、さらに、S342において、他の行情報が一致すると判定した場合に、第1の表情報と第2の表情報を接続すると判定しているが、S342の判定は必須ではない。
この場合、表接続判定部310は、縦方向の表接続の場合と同様に、S340において行数および各行高が一致すると判定したときは、S344の処理に進み、それ以外のときは、S346の処理に進む。
[画像処理装置1の第1の動作例]
以下、画像処理装置1(図4)の第1の動作例を説明する。
本動作例においては、画像処理装置1が、電子文書内の表部分(図3(A))が印刷された複数の紙文書(図3(B))から、図3(C)に示すように電子文書を再生成する処理を説明する。
画像処理装置1は、画像読取装置106を介して読み取られた複数の紙文書の画像データから分離した表オブジェクトを走査し、第1の表情報テーブルに、表IDおよび格納位置を追加する(表走査部306(図6))。
つまり、本動作例において、画像処理装置1は、図7に示すように、5つの表IDおよび格納位置を追加する。
画像処理装置1は、5つの表IDに対応する表オブジェクトそれぞれの構造情報を取得し、第1の表情報テーブル(図7)に追加する(表構造取得部308(図6))。
画像処理装置1は、第1の表情報テーブルに基づいて、縦または横に接続される表の集合を判定し、第1の表情報テーブルに、縦接続IDおよび横接続IDを追加する(表接続判定部310(図6,図8,図9))。
つまり、本動作例において、画像処理装置1は、列数、各列幅および同じ列の網掛パターンが一致する表IDが“1”〜“3”に対応する表オブジェクトの縦接続IDを“1”とし、表IDが“4”,“5”に対応する表オブジェクトの縦接続IDを“2”とする(図7)。
また、本動作例において、画像処理装置1は、表オブジェクトそれぞれの各行におけるセルの網掛パターンが異なるので、横接続IDをそれぞれ異なる値とする(図7)。
画像処理装置1は、第1の表情報テーブルの縦接続IDおよび横接続IDに基づいて、表オブジェクトを接続する(表接続部312(図6))。
つまり、本動作例において、画像処理装置1は、縦接続IDが“1”である表IDが“1”〜“3”の表オブジェクトを縦方向に接続し、縦接続IDが“2”である表IDが“4”,“5”の表オブジェクトを縦方向に接続する(図3(C))。
画像処理装置1は、接続した表オブジェクトに文字データを埋め込んで、表描画データを生成し、描画データ結合部218(図5)、印刷装置110および通信装置112(図4)、または、これらのうちのいずれか1つ以上に対して出力する(表描画部314(図6))。
[第2の実施形態]
以下、本発明の第2の実施形態を説明する。
図10(A)は、電子文書内の行または列の各項目の意味を示す見出し付き表部分を例示する図であり、図10(B)は、図10(A)に示した表部分を見出し付きで印刷して出力された複数の紙文書を例示する図であり、図10(C)は、図10(B)に示した複数の紙文書から、これまでの画像処理装置により再生成された電子文書を例示する図である。
図10(A)に示すような電子文書内の見出し付きの表部分が分割され、図10(B)に示すように、複数の紙文書に見出し付きで印刷されると、画像処理装置は、これまで、図10(C)に示すように、複数の紙文書に印刷された表それぞれに見出しが付いた別の表として電子文書が再生成してきた。
図11(A)は、電子文書内の表部分を見出し付きで印刷して出力された複数の紙文書を例示する図であり、図11(B)は、電子文書の再生成前に見出し行が削除された表を例示する図であり、図11(C)は、以下に説明する本発明に係る画像処理装置1により再生成された電子文書を例示する図である。
以下に説明する本発明に係る画像処理装置1は、以上の経緯によりなされたものであり、本発明の第2の実施形態においては、元の電子文書と同じ構造の見出し付きの表(図11(A))になるよう、図11(C)に示すように電子文書を再生成する場合が具体例とされる。
[第2の表描画処理プログラム40]
図12は、本発明の第1の実施形態において図5で示した第1の電子文書生成プログラム20の第1の表描画処理プログラム30と置換された第2の電子文書生成プログラム24の第2の表描画処理プログラム40の構成を例示する図である。
図12に示すように、表描画処理プログラム40は、第2の表情報記憶部400、第2の制御部402、第2の文字データ記憶部404、第2の表走査部406、見出し取得部408、第2の表接続判定部410、第2の表接続部412、および、表描画部314から構成される。
表描画処理プログラム40は、見出し付きの表部分が分割されて印刷された複数の紙文書の画像データから、元の電子文書と同じ構造の見出し付きの表になるよう表描画データを生成する。
なお、以下、本実施形態においては、表の1行目が見出しを示し、分割された表を縦方向に接続する場合を具体例として説明する。
図13は、表情報記憶部400が記憶する第2の表情報テーブルを例示する図である。
表情報記憶部400は、制御部402を介して、図12に示した各構成部分により更新・参照される第2の表情報テーブルを記憶する。
図13に示すように、第2の表情報テーブルの表情報それぞれは、例えば、図7に示した第1の表情報テーブルと同様な表IDおよび表オブジェクトの格納位置と、見出し行の各セルの内容を示す見出し行情報と、接続される表オブジェクトの集合を識別する接続IDとから構成される。
例えば、図13に示すように、表IDが“1”の表オブジェクトは、アドレス“p1”に格納され、見出し行の各セルの内容は、左のセルから順に“No.”,“AAA”,“BBB”,“CCC”,“DDD”であり、接続IDは“1”である。
制御部402(図12)は、各構成部分を制御する。
文字データ記憶部404は、図6に示した文字データ記憶部304と同様に、OCR部212(図5)から入力された文字データを受け入れ、見出し取得部408および表描画部314が参照可能に記憶する。
表走査部406は、図6に示した表走査部306と同様に、罫線補正処理部214(図5)から入力された表オブジェクトを走査して、表オブジェクトの格納位置を取得し、表オブジェクトそれぞれに対して表IDを付与する。
また、表走査部406は、付与した表IDと、取得した格納位置とを、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに追加する。
見出し取得部408は、制御部402の制御により、表情報記憶部400に記憶された第2の表情報テーブルを参照して、表オブジェクトの格納位置(図13)へアクセスして、表オブジェクトを取得する。
また、見出し取得部408は、文字データ記憶部404が記憶する文字データを参照して、取得した表オブジェクトそれぞれの1行目の各セルに対応する位置の文字を取得する。
また、見出し取得部408は、取得した文字を、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに追加する。
表接続判定部410は、制御部402の制御により、表情報記憶部400に記憶された第2の表情報テーブルの表IDが若い順に参照して、表IDそれぞれに対応する表の見出し行情報に基づいて、接続される表の集合を判定する(図14を参照して後述)。
また、表接続判定部410は、判定結果に基づいて、表それぞれの接続IDを、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに追加する(図14を参照して後述)。
表接続部412は、制御部402の制御により、表情報記憶部400に記憶された第2の表情報テーブルの接続ID(図13)参照して、表オブジェクトそれぞれを接続し、表描画部314に対して出力する(図15を参照して後述)。
[表接続判定部410の処理]
図14は、表接続判定部410(図12)が、表オブジェクトを接続するか否かを判定する表接続判定処理を例示するフローチャートである。
以下、表接続判定部410が、表オブジェクトを接続するか否かを判定する表接続判定処理を、さらに説明する。
ステップ420(S420)において、表接続判定部410は、第2の表情報テーブルの1つ目の表情報(例えば、図13の第2の表情報テーブルの表IDが“1”の表情報)を、第1の表情報として取得する。
ステップ422(S422)において、表接続判定部410は、第2の表情報テーブルに、次の表情報(例えば、図13の第2の表情報テーブルの表IDが“2”の表情報)が存在するか否かを判定する。
表接続判定部410は、次の表情報が存在すると判定した場合、S424の処理に進み、それ以外の場合、処理を終了する。
ステップ424(S424)において、表接続判定部410は、次の表情報を、第2の表情報として取得する。
ステップ426(S426)において、表接続判定部410は、S420において取得した第1の表情報の見出し行情報と、S424において取得した第2の表情報の見出し行情報とが一致するか否かを判定する。
表接続判定部410は、見出し行情報が一致すると判定した場合、S428の処理に進み、それ以外の場合、S430の処理に進む。
なお、表接続判定部410は、第1の表情報および第2の表情報の見出し行情報のうち、同じ列の見出しの少なくとも1つが同じであれば、見出し行情報が一致すると判定してもよい。
また、表接続判定部410は、同じ列の見出しの少なくとも1つが同じであり、さらに、第1の表情報および第2の表情報の列数、または、列数および列それぞれの幅が一致すれば、見出し行情報が一致すると判定してもよい。
ステップ428(S428)において、表接続判定部410は、第1の表情報および第2の表情報に、同じ接続IDを付与する。
ステップ430(S430)において、表接続判定部410は、S424で取得した第2の表情報を、新たな第1の表情報とし、新たな接続ID(例えば、現在の接続IDに1を加算した値)を付与し、S422に進む。
ステップ432(S432)において、表接続判定部410は、第2の表情報テーブルに、まだ表接続判定処理が行われていない表情報が存在するか否かを判定する。
第2の表接続判定部410は、まだ処理が行われていない表情報が存在すると判定した場合、S424の処理に進み、それ以外の場合、処理を終了する。
[表接続部412の処理]
図15は、表接続部412(図12)が、表オブジェクトを接続する表接続処理を例示するフローチャートである。
以下、表接続部412が、表オブジェクトを接続する表接続処理を、さらに説明する。
ステップ420(S420)〜ステップ424(S424)において、表接続部412は、図14に示したS420〜S424と同様な処理を行う。
ステップ440(S440)において、表接続部412は、S420において取得した第1の表情報の接続IDと、S424において取得した第2の表情報の接続IDとが一致するか否かを判定する。
表接続部412は、接続IDが一致すると判定した場合、S442の処理に進み、それ以外の場合、S444の処理に進む。
ステップ442(S442)において、表接続部412は、S424において取得した第2の表情報の格納位置へアクセスして、表オブジェクト(第2の表オブジェクト)を取得し、取得した第2の表オブジェクトの見出し行に対応する1行目を削除する。
ステップ444(S444)において、表接続部412は、第2の表情報を第1の表情報とし、S422の処理に進む。
ステップ446(S446)において、表接続部412は、S420において取得した第1の表情報の格納位置へアクセスして、表オブジェクト(第1の表オブジェクト)を取得し、取得した第1の表オブジェクトの後に、見出し行が削除された第2の表オブジェクトを縦方向に接続する。
ステップ448(S448)において、表接続部412は、第2の表情報テーブルに、まだ表接続処理が行われていない表オブジェクトが存在するか否かを判定する。
表接続部412は、まだ処理が行われていない表オブジェクトが存在すると判定した場合、S424の処理に進み、それ以外の場合、処理を終了する。
[画像処理装置1の第2の動作例]
以下、画像処理装置1(図4)の第2の動作例を説明する。
本動作例においては、画像処理装置1が、電子文書内の見出し付き表部分が印刷された複数の紙文書(図11(A))から、図11(C)に示すように電子文書を再生成する処理を説明する。
画像処理装置1は、画像読取装置106を介して読み取られた複数の紙文書の画像データから分離した表オブジェクトを走査し、第2の表情報テーブルに、表IDおよび格納位置を追加する(表走査部406(図12))。
つまり、本動作例において、画像処理装置1は、図13に示すように、5つの表IDおよび格納位置を追加する。
画像処理装置1は、5つの表IDに対応する表オブジェクトそれぞれの見出し行情報を取得し、第2の表情報テーブル(図13)に追加する(見出し取得部408(図12))。
画像処理装置1は、第2の表情報テーブルに基づいて、接続される表の集合を判定し、第2の表情報テーブルに、接続IDを追加する(表接続判定部410(図12,図14))。
つまり、本動作例において、画像処理装置1は、見出し行情報が一致する表IDが“1”〜“3”に対応する表オブジェクトの接続IDを“1”とし、表IDが“4”,“5”に対応する表オブジェクトの接続IDを“2”とする(図13)。
画像処理装置1は、第2の表情報テーブルの接続IDに基づいて、表オブジェクトを接続する(表接続部412(図12,図15))。
つまり、本動作例において、画像処理装置1は、接続IDが“1”である表IDが“1”〜“3”の表オブジェクトのうち、表IDが“2”,“3”の表オブジェクトから見出し行を削除した後、表IDが“1”の表オブジェクトの後に(図11(B))、表IDが“2”,“3”の表オブジェクトを順に、縦方向に接続する(図11(C))。
また、画像処理装置1は、接続IDが“2”である表IDが“4”,“5”の表オブジェクトのうち、表IDが“5”の表オブジェクトから見出し行を削除した後に(図11(B))、表IDが“4”の表オブジェクトの後に、表IDが“5”の表オブジェクトを縦方向に接続する(図11(C))。
画像処理装置1は、接続した表オブジェクトに文字データを埋め込んで、表描画データを生成し、描画データ結合部218(図5)、印刷装置110および通信装置112(図4)、または、これらのうちのいずれか1つ以上に対して出力する(表描画部314(図12))。
[第2の実施形態の変形例]
本実施形態の説明においては、表の1行目が見出しを示し、分割された表を縦方向に接続する場合を具体例としたが、これに限定されるものではなく、本実施形態は、表の1列目が見出しを示し、分割された表を横方向に接続するようにしてもよい。
この場合、見出し取得部408は、文字データ記憶部404が記憶する文字データを参照して、表オブジェクトそれぞれの1列目の各セルに対応する位置の文字を取得する。
また、見出し取得部408は、取得した文字を、見出し列情報として、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに追加する。
また、表接続判定部410は、図14に示した表接続判定処理と同様に、見出し列情報に基づいて、接続する表の集合を判定し、制御部402を介して、表情報記憶部400に記憶された第2の表情報テーブルに、接続IDを追加する。
表接続部412は、図15に示した表接続処理と同様に、接続IDに基づいて、表オブジェクトそれぞれを横方向に接続する。
また、表の見出し位置を抽出し、見出しの位置が表の1行目である場合は、縦方向の表接続処理を行い、見出しの位置が表の1列目である場合は、横方向の表接続処理を行うように、両実施形態を組み合わせてもよい。
また、表の最終行または表の最終列が見出しを示す場合であってもよい。
[第3の実施形態]
以下、本発明の第3の実施形態を説明する。
本発明の第3の実施形態においては、電子文書内の表部分の見出しの有無に応じて、第1の実施形態および第2の実施形態のいずれかを選択して、複数の紙文書の画像データから、元の電子文書と同じ構造の表になるよう表描画データを生成する場合が具体例とされる。
[第3の表描画処理プログラム50]
図16は、本発明の第1の実施形態において図5で示した第1の電子文書生成プログラム20の第1の表描画処理プログラム30と置換された第3の電子文書生成プログラム26の第3の表描画処理部50の構成を例示する図である。
図16に示すように、第3の表描画処理プログラム50は、第3の表情報記憶部500、第3の制御部502、第3の表走査部504、選択部506、表構造取得部308、第1の表接続判定部310、第1の表接続部312、表描画部314、第2の文字データ記憶部404、見出し取得部408、第2の表接続判定部410、および、第2の表接続部412から構成される。
表描画処理プログラム50は、電子文書内の表部分の見出しの有無に応じて、第1の実施形態および第2の実施形態のいずれかを選択して、表描画データを生成する。
表情報記憶部500は、制御部502を介して、図16に示した各構成部分により更新・参照される第3の表情報テーブルを記憶する。
第3の表情報テーブルの表情報それぞれは、例えば、図7に示した第1の表情報テーブルと同様な表IDおよび表オブジェクトの格納位置と、表オブジェクトそれぞれの見出しの有無を示す見出し有無情報とから構成される。
また、表情報記憶部500は、選択部506による第1の実施形態および第2の実施形態の選択に応じて、図7に示した第1の表情報テーブル、および、図13に示した第2の表情報テーブルを記憶する。
制御部502は、各構成部分を制御する。
表走査部504は、図6に示した表走査部306と同様に、罫線補正処理部214(図5)から入力された表オブジェクトを走査して、表オブジェクトの格納位置を取得し、表オブジェクトそれぞれに対して表IDを付与する。
また、表走査部504は、表オブジェクトの格納位置へアクセスして表オブジェクトを取得し、例えば、表オブジェクトの1行目または1列目が、他の行または列とは異なる書式が設定されている場合は見出し有と判断し、それ以外の場合は見出し無と判断して、見出し有無情報を生成する。
表走査部504は、付与した表IDと、取得した格納位置と、生成した見出し有無情報とを、制御部502を介して、表情報記憶部500に記憶された第3の表情報テーブルに追加する。
選択部506は、制御部502の制御により、表情報記憶部500に記憶された第3の表情報テーブルの見出し有無情報に応じて、表接続方法を選択する。
具体的には、例えば、選択部506は、第3の表情報テーブルの表情報のうち、見出し有無情報が見出し有を示し、表IDの値が連続している表オブジェクトの表情報を、一つの第2の表情報テーブルとして、制御部502を介して、表情報記憶部500に対して出力する。
また、例えば、選択部506は、第3の表情報テーブルの表情報のうち、見出し有無情報が見出し無を示し、表IDの値が連続している表オブジェクトの表情報を、一つの第1の表情報テーブルとして、制御部502を介して、表情報記憶部500に対して出力する。
[変形例1]
本発明の第1〜第3の実施形態において、第1〜第3の表描画処理プログラム30,40,50は、処理対象となるすべての表オブジェクトに対して表接続のための処理を行った後に、表オブジェクトを接続して、表描画データを生成するが、表オブジェクトごとに、逐次、表接続の処理を行ってもよい。
[変形例2]
本発明の第1〜第3の実施形態では、表オブジェクトを含む画像データが読み取られた順に、表オブジェクトの表接続判定および表接続処理を行うが、例えば、図3(B),図11(A)に示すように、複数の紙文書それぞれにページ番号が印字されている場合、読み取った画像データからページ番号を認識し、ページ番号順に、表オブジェクトに対する各処理を行ってもよい。
[変形例3]
本発明の第1〜第3の実施形態では、第1,第2の表接続判定部310,410により表情報テーブルに追加された接続IDに基づいて、第1,第2の表接続部308,408により表オブジェクトの表接続処理(図8,図9,図14)を行うが、表接続処理を行う前に、例えば、ユーザに対して表接続判定処理の結果を表示し、ユーザからの表接続指示を受け入れて、表接続処理を行ってもよい。
[変形例4]
本発明の第1〜第3の実施形態では、第1,第2の表接続判定部310,410は、オブジェクト分離部204(図5)により分離された表オブジェクトに対して、表接続判定処理を行っているが、表オブジェクトだけでなく、オブジェクト分離前の画像データも参照して、表接続判定処理を行ってもよい。
具体的には、例えば、第1,第2の表接続判定部310,410は、第1の表オブジェクトと第2の表オブジェクトとの間に、他のオブジェクト(文字、CG、写真など)が含まれていると判定した場合、第1,第2の表オブジェクトの表構造および見出し情報などが一致する場合でも、両表オブジェクトを接続しないと判定する。
1・・・画像処理装置,
100・・・制御装置,
102・・・CPU,
104・・・メモリ,
106・・・画像読取装置,
108・・・入出力装置,
110・・・印刷装置,
112・・・通信装置,
114・・・記録装置,
116・・・記録媒体,
20,24,26・・・電子文書生成プログラム,
200・・・JPEG復号部,
202・・・前処理部,
204・・・オブジェクト分離部,
206・・・CG描画処理部,
208・・・写真描画処理部,
210・・・文字描画処理部,
212・・・OCR部,
214・・・罫線補正処理部,
218・・・描画データ結合部,
220・・・電子文書生成部,
30,40,50・・・表描画処理部,
300,400,500・・・表情報記憶部,
302,402,502・・・制御部,
304,404・・・文字データ記憶部,
306,406,504・・・表走査部,
308・・・表構造取得部,
310,410・・・表接続判定部,
312,412・・・表接続部,
314・・・表描画部,
408・・・見出し取得部,
506・・・選択部

Claims (10)

  1. 予め定められた順に並べられた複数の画像データそれぞれに含まれ、行および列で構成される表から、前記表の行および列またはこれらのうちのいずれかに設定された前記表の項目を示す見出しを取得する見出し取得手段と、
    前記複数の画像データそれぞれに含まれる表の前記取得した見出しが一致するか否かを判定し、前記見出しが一致すると判定され、前記予め定められた順において隣接する表を、接続される表の集合と判定する表接続判定手段と、
    前記判定された表の集合のうち、前記予め定められた順において最初の画像データに含まれる第1の表以外の第2の表それぞれから見出しを削除し、前記第1の表と、前記見出しが削除された第2の表とを、前記予め定められた順に接続する表接続手段と
    を有する画像処理装置。
  2. 前記見出しは、前記複数の画像データに含まれる表それぞれの行の端に構成され、
    前記表接続手段は、前記第1の表と、それぞれ前記見出しを構成する行の端が削除された前記第2の表とを、前記予め定められた順に、表の下方向に接続する
    請求項1に記載の画像処理装置。
  3. 前記行の端は、前記表の最初の行である
    請求項2に記載の画像処理装置。
  4. 前記見出しは、前記複数の画像データに含まれる表それぞれの列の端に構成され、
    前記表接続手段は、前記第1の表と、それぞれ前記見出しを構成する列の端が削除された前記第2の表とを、前記予め定められた順に、表の右方向に接続する
    請求項1に記載の画像処理装置。
  5. 前記列の端は、前記表の左端の列である
    請求項4に記載の画像処理装置。
  6. 前記表接続判定手段は、前記隣接する表を含む複数の画像データそれぞれに含まれる表以外の構成部分が、前記隣接する表の間に構成されている場合、前記隣接する表を接続しないと判定する
    請求項1〜5のいずれかに記載の画像処理装置。
  7. 前記複数の画像データは、紙文書からの画像読み取りにより生成される
    請求項1〜6のいずれかに記載の画像処理装置。
  8. 前記予め定められた順は、前記紙文書が読み取られた順序を示す
    請求項7に記載の画像処理装置。
  9. 前記複数の画像データは、並び順を特定する順序情報を含み、
    前記予め定められた順は、前記順序情報により特定される順序を示す
    請求項1〜7のいずれかに記載の画像処理装置。
  10. 予め定められた順に並べられた複数の画像データそれぞれに含まれ、行および列で構成される表から、前記表の行および列またはこれらのうちのいずれかに設定された前記表の項目を示す見出しを取得する見出し取得ステップと、
    前記複数の画像データそれぞれに含まれる表の前記取得した見出しが一致するか否かを判定し、前記見出しが一致すると判定され、前記予め定められた順において隣接する表を、接続される表の集合と判定する表接続判定ステップと、
    前記判定された表の集合のうち、前記予め定められた順において最初の画像データに含まれる第1の表以外の第2の表それぞれから見出しを削除し、前記第1の表と、前記見出しが削除された第2の表とを、前記予め定められた順に接続する表接続ステップと
    をコンピュータに実行させるプログラム。
JP2011069573A 2011-03-28 2011-03-28 画像処理装置およびプログラム Pending JP2012203783A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2011069573A JP2012203783A (ja) 2011-03-28 2011-03-28 画像処理装置およびプログラム
US13/230,384 US8587817B2 (en) 2011-03-28 2011-09-12 Image processing apparatus, image processing method, and computer readable medium storing program
AU2011250825A AU2011250825B2 (en) 2011-03-28 2011-11-16 Image processing apparatus, image processing method, and program
CN2011104096156A CN102708580A (zh) 2011-03-28 2011-12-09 图像处理设备和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011069573A JP2012203783A (ja) 2011-03-28 2011-03-28 画像処理装置およびプログラム

Publications (1)

Publication Number Publication Date
JP2012203783A true JP2012203783A (ja) 2012-10-22

Family

ID=46901297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011069573A Pending JP2012203783A (ja) 2011-03-28 2011-03-28 画像処理装置およびプログラム

Country Status (4)

Country Link
US (1) US8587817B2 (ja)
JP (1) JP2012203783A (ja)
CN (1) CN102708580A (ja)
AU (1) AU2011250825B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5769131B2 (ja) * 2011-07-12 2015-08-26 富士ゼロックス株式会社 画像処理装置およびプログラム
US8832158B2 (en) 2012-03-29 2014-09-09 International Business Machines Corporation Fast predicate table scans using single instruction, multiple data architecture
CN103778128B (zh) * 2012-10-18 2018-05-04 腾讯科技(深圳)有限公司 一种列表信息的绘制方法和装置
JP2015144428A (ja) * 2013-12-27 2015-08-06 株式会社リコー 画像形成装置及び画像形成装置におけるセキュリティ印刷方法
JP6131923B2 (ja) * 2014-09-17 2017-05-24 カシオ計算機株式会社 表示制御装置、表示装置、表生成装置、表示制御方法及びプログラム
JP2016212563A (ja) * 2015-05-01 2016-12-15 キヤノン株式会社 文書解析システムおよび文書解析方法
CN110728240A (zh) * 2019-10-14 2020-01-24 北京华宇信息技术有限公司 一种对电子卷宗的标题自动识别的方法及装置
CN113536751B (zh) * 2021-06-30 2023-09-22 北京百度网讯科技有限公司 表格数据的处理方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096765A (ja) * 1995-06-22 1997-01-10 Hitachi Ltd 情報処理装置
JP2010097262A (ja) * 2008-10-14 2010-04-30 Keyence Corp データベース生成装置、データベース生成方法及びコンピュータプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342408A (ja) 1991-04-04 1993-12-24 Fuji Xerox Co Ltd 文書画像ファイリング装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JPH0844827A (ja) 1994-07-27 1996-02-16 Ricoh Co Ltd デジタル複写機
JP3642615B2 (ja) 1995-10-30 2005-04-27 富士通株式会社 パターン領域切り出し方式及びパターン抽出装置
US5729666A (en) * 1996-08-05 1998-03-17 Hewlett-Packard Company Efficient method and apparatus for downloading of fonts from a processor to a printer
JP2002073598A (ja) 2000-08-24 2002-03-12 Canon Inc 文書処理装置および方法
JP3862605B2 (ja) * 2001-07-19 2006-12-27 キヤノン株式会社 画像処理装置
JP2003288334A (ja) 2002-03-28 2003-10-10 Toshiba Corp 文書処理装置及び文書処理方法
US7426059B2 (en) * 2002-09-16 2008-09-16 Oracle International Corporation Data presentation methods and apparatus to facilitate printing and reviewing
US8310713B2 (en) * 2002-12-24 2012-11-13 Konica Minolta Business Technologies, Inc. Image forming device, image forming program, computer readable recording medium on which the program is recorded, and image forming method
JP2005128925A (ja) 2003-10-27 2005-05-19 Seiko Epson Corp 文書編集システム、文書編集プログラム及び文書編集方法
US7385729B2 (en) * 2004-03-26 2008-06-10 Lexmark International, Inc. Optimization techniques during processing of print jobs
JP4095617B2 (ja) * 2005-02-28 2008-06-04 キヤノン株式会社 文書処理装置及び文書処理方法及びコンピュータプログラム
US8259193B2 (en) * 2007-11-21 2012-09-04 Panasonic Corporation Image file reproduction apparatus and image data reproduction apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096765A (ja) * 1995-06-22 1997-01-10 Hitachi Ltd 情報処理装置
JP2010097262A (ja) * 2008-10-14 2010-04-30 Keyence Corp データベース生成装置、データベース生成方法及びコンピュータプログラム

Also Published As

Publication number Publication date
AU2011250825B2 (en) 2013-02-14
AU2011250825A1 (en) 2012-10-18
CN102708580A (zh) 2012-10-03
US20120250107A1 (en) 2012-10-04
US8587817B2 (en) 2013-11-19

Similar Documents

Publication Publication Date Title
JP2012203783A (ja) 画像処理装置およびプログラム
JP2005004724A (ja) 画像処理装置及びその制御方法、プログラム
JP6119992B2 (ja) 画像処理装置およびコンピュータプログラム
US7965293B2 (en) Image processing device, image processing method, and image processing program for reconstructing data
JP2006259045A (ja) 画像形成装置及び方法
JP2005044279A (ja) 帳票処理方法、帳票処理プログラム、帳票処理装置
US8780404B2 (en) Information processing apparatus, method for controlling same, and storage medium on which computer program has been recorded
JP2011040971A (ja) 画像処理装置、画像処理方法、および、画像処理プログラム
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5769131B2 (ja) 画像処理装置およびプログラム
JP6579331B2 (ja) 画像形成装置、文書電子化プログラムおよび文書電子化方法
JP2012203784A (ja) 画像処理装置およびプログラム
JP5612882B2 (ja) 印刷制御装置、印刷プログラムおよび画像形成装置
JP2006222572A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2012039236A (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2009294870A (ja) 画像処理装置及び方法
JP2009223363A (ja) 文書処理装置および文書処理プログラム
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2012022413A (ja) 画像処理装置、画像処理方法、およびプログラム
CN102710882B (zh) 图像处理设备和图像处理方法
JP5574272B2 (ja) 画像読取装置、画像処理装置およびプログラム
JP4239829B2 (ja) 電子アルバム作成装置、電子アルバム作成方法、およびプログラム
JP2004280691A (ja) 文書ファイリング装置
JP5455395B2 (ja) 画像処理装置及び画像処理方法
JP2011151703A (ja) 画像処理装置、文字拡大処理方法および文字拡大プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140827

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141009

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141031