JP5465015B2 - 文書を電子化する装置及び方法 - Google Patents

文書を電子化する装置及び方法 Download PDF

Info

Publication number
JP5465015B2
JP5465015B2 JP2010001426A JP2010001426A JP5465015B2 JP 5465015 B2 JP5465015 B2 JP 5465015B2 JP 2010001426 A JP2010001426 A JP 2010001426A JP 2010001426 A JP2010001426 A JP 2010001426A JP 5465015 B2 JP5465015 B2 JP 5465015B2
Authority
JP
Japan
Prior art keywords
sheet
editing
cell
document
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010001426A
Other languages
English (en)
Other versions
JP2011141677A5 (ja
JP2011141677A (ja
Inventor
誠 榎本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010001426A priority Critical patent/JP5465015B2/ja
Priority to US12/980,678 priority patent/US8718364B2/en
Priority to EP11150261.3A priority patent/EP2343670B1/en
Priority to KR1020110001492A priority patent/KR101334483B1/ko
Priority to CN201110008963.2A priority patent/CN102117269B/zh
Publication of JP2011141677A publication Critical patent/JP2011141677A/ja
Publication of JP2011141677A5 publication Critical patent/JP2011141677A5/ja
Application granted granted Critical
Publication of JP5465015B2 publication Critical patent/JP5465015B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F3/00Labels, tag tickets, or similar identification or indication means; Seals; Postage or like stamps
    • G09F3/02Forms or constructions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B32LAYERED PRODUCTS
    • B32BLAYERED PRODUCTS, i.e. PRODUCTS BUILT-UP OF STRATA OF FLAT OR NON-FLAT, e.g. CELLULAR OR HONEYCOMB, FORM
    • B32B7/00Layered products characterised by the relation between layers; Layered products characterised by the relative orientation of features between layers, or by the relative values of a measurable parameter between layers, i.e. products comprising layers having different physical, chemical or physicochemical properties; Layered products characterised by the interconnection of layers
    • B32B7/04Interconnection of layers
    • B32B7/12Interconnection of layers using interposed adhesives or interposed materials with bonding properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F3/00Labels, tag tickets, or similar identification or indication means; Seals; Postage or like stamps
    • G09F3/08Fastening or securing by means not forming part of the material of the label itself
    • G09F3/10Fastening or securing by means not forming part of the material of the label itself by an adhesive layer
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F3/00Labels, tag tickets, or similar identification or indication means; Seals; Postage or like stamps
    • G09F3/02Forms or constructions
    • G09F2003/0222Features for removal or adhesion, e.g. tabs
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F3/00Labels, tag tickets, or similar identification or indication means; Seals; Postage or like stamps
    • G09F3/02Forms or constructions
    • G09F2003/0264Shapes or borders
    • G09F2003/0267Shapes or borders die cut

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は紙文書を電子化するための装置及び方法に関する。
近年、インターネットに代表されるようなネットワークの広がりにより、文書が電子的に配布される機会も増えたが、文書が未だに紙に印刷された状態で配布されることも多い。そこで、紙文書しか手元に存在しない場合でも、文書の内容を再利用可能なデータとして得られるようにするための技術が従来から考えられている。
たとえば、紙文書をスキャナ等で読み取り、得られた画像データを端末からサーバに送信し、サーバ上で認識、再利用可能なフォーマットに変換して端末に戻す技術がある(特許文献1参照)。
また、文書の画像データを種類別の領域に分け、領域毎に個別に出力できるようにする技術がある(特許文献2参照)。
特開平11−167532号公報 特開2005−346137号公報
紙文書をスキャンすることにより生成された文書画像(画像データ)を電子文書化する時、ユーザが利用したいデータの形式は目的や用途によって異なる。いずれにせよ、多くのユーザにとって利用しやすい状態で電子文書化されることが望まれる。
たとえば、文書中に表が含まれる場合において、列や行の挿入、削除といった編集操作を表に対して行いたいユーザにとっては、表オブジェクトとして編集可能な状態で電子文書化されることが望ましい。一方、そのまま再度印刷して紙文書として使いたいユーザにとっては、表の罫線のレイアウト等のビジュアル情報をできる限り忠実に再現した状態で電子文書化されることが望ましい。
しかし、電子文書のフォーマットの仕様によっては、文書画像中の表を表オブジェクトに変換する際、表構造や罫線レイアウトをそのまま再現できない場合がある。
また、表のビジュアル情報を再現する為に、表をベクトルオブジェクトとして描画する方法の場合には、列や行の挿入・削除といった編集操作をすることができなくなってしまう。
また、表の構造を参照しながら表のセル内の数値を用いて計算等を行う場合は、表計算アプリケーションで扱うフォーマット(セルの行列構造により表構造を表現するフォーマット)で再現するのが望ましい。しかし、セルの行列構造により表構造を表現するフォーマットにおいて、同一ページ(シート)内に複数の表がある場合には、一方の表に対する編集操作が他方へ意図しない影響を与えてしまうこともある。
図13の(A)は、表1311と表1312の計2つの表が同一シート上に存在する様子を示している。表計算アプリケーションなどではセルの境界が罫線位置になるので、セルの結合などをおこなって2つの表を再現している。このとき、シート編集ウィンドウ1310に対して、セル1313の右横に新しい列を追加する操作を行った結果を示すのが図13の(B)である。表1311のセル1313の右横に新たな列1321が挿入されているが、表1312にも同時に意図しない列1322までもが挿入されたことがわかる。この他、列の削除やセル幅の変更などの操作の場合も、一方の表に対して編集操作を行えば、他方の表に対しても意図しない影響が出てしまう。
これまでは、上述したような問題を生じさせることなく、ユーザの様々な要求を同時に満たすことが可能な紙文書の電子化は困難であった。
本発明に係る装置は、表を含む文書の画像データから、各オブジェクトの位置の情報を含む領域データを抽出する領域抽出手段と、前記抽出された領域データのうち表オブジェクトに関する領域データを解析し、表オブジェクトそれぞれの構造を示す表構造情報を抽出する表構造解析手段と、前記表オブジェクトに対して文字認識処理を実行することにより、前記表オブジェクト内の各セルについての文字認識結果を得る文字認識手段と、前記オブジェクトの領域データと前記表構造情報と前記文字認識結果とを用いて、前記文書におけるオブジェクトのレイアウトを再現するための表示用シートと、表の編集をするための表毎の編集用シートを生成するシート生成手段と、前記表示用シートと前記編集用シートとを関連付けた電子文書を生成する電子文書生成手段と、を備え、前記シート生成手段で生成される前記編集用シートは、前記表構造情報に基づいて前記表オブジェクトそれぞれの構造を前記編集用シートにおける表のセルの構造を用いて記述し且つ前記文字認識結果を前記編集用シートにおける表のセルに記述したシートであり、前記シート生成手段で生成される前記表示用シートは、前記編集用シートにおける表をレンダリングすることにより生成される描画オブジェクトを取得して、当該取得した描画オブジェクトを、前記表オブジェクトの位置に対応する前記表示用シートにおける位置に配置する命令が記述されたシートであり、前記表示用シート上に配置される描画オブジェクトは、前記編集用シートにおける表が編集された場合、当該編集後の前記編集用シートにおける表をレンダリングして生成される描画オブジェクトによって更新される、ことを特徴とする。
本発明に係る電子文書(ワークブックドキュメント)は、編集用シートと印刷表示シートとで構成される。これにより、表を含む文書について、文書のレイアウトを忠実に再現しつつ、表編集の利便性も確保することが可能となる。
実施形態1に係るシステム構成の一例を示す図である。 実施形態1の動作を説明する機能ブロック図である。 表オブジェクトに関する情報を、ツリー構造で表した図である。 シート生成部における処理の流れを説明するフローチャートである。 スキャナで読み取られた文書画像の一例である。 表領域情報と表構造情報の一例を示す図である。 文字認識処理を行った結果の一例を示した図である。 表示用シートの一例を示す図である。 編集用シートの一例を示す図である。 ワークブックドキュメントの一例を示す図である。 表示・編集用プログラムによって表示用シートを表示した場合の一例を示した図である。 表示・編集用プログラムによって編集用シートを表示した場合の一例を示した図である。 従来技術を説明するための図である。 文書画像の一例である。 編集用シートと表示用シートが、表示・編集プログラムによって表示された様子を示した図である。 実施形態2に係るシート生成部における処理の流れを説明するフローチャートである。 判断テーブルの一例を示す図である。 文書画像の一例を示す図である。
<実施形態1>
図1は、本実施形態に係るシステム構成の一例を示す図である。
100は、画像処理装置である。
101は、紙文書を読み取って文書画像(画像データ)を得るための、読取手段としてのスキャナである。
102は、CPUであり、得られた画像データに本発明の各種処理を施すための電子化処理プログラムを実行する。
103は、メモリであり、CPU102が電子化処理プログラムを実行する際のワークメモリやデータの一時保存などに利用される。
104は、電子化処理プログラムやデータを格納するハードディスクである。
105は、外部装置とデータの入出力を行うためのネットワークI/Fである。
110は、ネットワーク(LAN)である。
120は、パーソナルコンピュータ(PC)である。画像処理装置100とはLAN110を介して接続される。
121は、画像処理装置100で生成された電子文書を、PC120のディスプレイ上に表示し、ユーザによって編集することを可能にする表示・編集プロラグムである。
図2は本実施形態の動作を説明する機能ブロック図である。
図2に示されている各部は、CPU102が電子化処理プログラムを実行することによって実現されるものとするが、その一部又は全部を電気回路で構成するようにしても構わない。
200は、紙文書をスキャナ101で読み取ることにより得られた画像データである。
210は、この入力された画像データ200に電子化処理を行う電子化処理部である。
220は、電子化処理部210によって生成されたワークブックドキュメントである。なお、本明細書において「ワークブックドキュメント」とは、PC120内の表示・編集プログラム121によって表示・編集が可能な電子文書であり、複数のシートによって構成される。本明細書における表示・編集プログラム121は表計算アプリケーションである。シートは、セルと呼ばれる行列の最小単位で構成される表構造と、その他の自由に配置可能なオブジェクト(フローティングオブジェクト)とによって表レイアウトを表現可能な電子データである。なお、本実施形態において説明するワークブックドキュメントは、XML(Extensible Markup Language)フォーマットで記述される。もちろん、XMLフォーマットは一例であり、アプリケーション固有のバイナリ形式のフォーマットでも良い。
211〜215の各ブロックは、電子化処理部210で実行される各機能を模式的に独立の構成要素として示したものである。
211は、入力された文書画像(画像データ)を解析して、表、文字、自然画像などのオブジェクトの種類別に領域を分け、オブジェクト毎に領域データを抽出する領域抽出部である。領域データには、オブジェクトの種類情報の他、当該オブジェクトの位置、サイズ及び傾きなどの情報が含まれる。なお、説明の便宜上、表オブジェクトの領域データについては「表領域データ」、文字オブジェクトの領域データについては「文字領域データ」といったように略して呼ぶこととする。
212は、領域抽出部211で抽出された表領域データについて表構造の解析を行い、表構造情報を抽出・生成する表構造解析部である。
213は、文字領域データについて文字認識を行い、文字コードデータを含む文字認識情報を生成する文字認識部である。
図3は、上述の領域抽出処理、表構造解析処理及び文字認識処理によって得られる表オブジェクトに関する情報を、ツリー構造で表した図である。表に関する情報は、まず、表領域情報と表構造情報の2つに大別される。
表領域情報は、領域抽出処理により得られる。表領域情報はさらに、表の外枠を形成する矩形についての、座標情報、サイズ情報及び傾き情報に分けられる。座標情報は、文書画像の左上を原点(0,0)とした場合の、表の外枠を形成する矩形の左上位置を座標で示したものである。横軸方向位置xと縦軸方向位置yからなる座標(x,y)で表される。サイズ情報は、表の外枠を形成する矩形の大きさを示すものであり、幅wと高さhで表された情報(w,h)からなる。傾き情報は、文書の縦方向に対して表の縦方向の線分がどれだけ傾いているかを示す情報であり、度(°)で表される。
表構造情報は、表構造解析処理により得られる。表構造情報は、行と列によって切り分けられた、表の最小単位であるセルに関する情報(セル情報)の集合である。セル情報は、さらに、文字コードデータ、行列座標情報、矩形情報、背景情報、及び罫線情報などに分けられる。行列座標情報は、列c(column)と行r(row)によってセルの位置を示す情報(c,r)からなる。矩形情報は、表の外枠を形成する矩形の左上を原点(0,0)とした場合のセルの左上位置を示す情報(横軸方向位置x、縦軸方向位置y)とセルのサイズを示す情報(幅w、高さh)の組合せ(x,y−w,h)からなる。背景情報は、セルの背景の色や模様などに関する情報である。罫線情報は、セルの線分の色や線種(たとえば、実線、点線、太線、細線、二重線)などを示す情報である。
上述した表領域情報に相当する領域情報が他のオブジェクトについても存在し(例えば、文字領域情報など)、同様のツリー構造により管理・格納される。なお、ツリー構造は表に関する情報を管理するための一手法であり、同様の情報が別の手法によって管理・格納されても良い。
214は、オブジェクト別に得られた領域データに基づき、表示用シート221及び編集用シート222を生成するシート生成部である。
215は、シート生成部214で生成されたシートから電子文書としてのワークブックドキュメント220を生成するワークブックドキュメント生成部である。ワークブックドキュメント220は、ワークブックドキュメント内のページ単位である表示用シート221及び編集用シート222によって構成される。PC120内の表示・編集プログラム121によって、ワークブックドキュメント220の表示や編集を行うことができる。
表示用シート221は、文書画像を、PC120のディスプレイ上に表示したり、不図示のプリンタで印刷したりする際に用いられる電子データである。文書画像内のオブジェクトのレイアウトを重視し、そのままの状態で表示等するために用いるシートであるから‘‘表示用シート’’と呼ぶ。
編集用シート222は、文書画像に含まれる表に対して、列を追加したり行を削除したりといった編集操作をする際に用いるための電子データである。文書画像内の表を編集するために用いるシートであるから‘‘編集用シート’’と呼ぶ。
以下、電子文書生成部210の各機能(各処理部)の具体的な処理内容等について、詳細に説明する。
<領域抽出部>
スキャナ101を介して得られた画像データは、まず、領域抽出部211において、オブジェクト別の領域に分けられ、オブジェクト毎の領域データが抽出される。抽出は、例えばUSP5680478号公報記載のような公知の方法が適用可能である。この公報記載の方法の場合、画像データから黒画素及び白画素の集合を抽出し、その形状、大きさ、集合状態等から、文字、絵や図、表、自然画像、枠、線といった種類に分類されたオブジェクト別の領域が抽出される。なお、画像データから表を抽出する方法としては、例えば入力画像データに対しハフ変換等を行って線分情報を抽出する方法も存在し、この場合には文書に対して傾きのある表の検出も可能である。
領域の抽出の際には、当該オブジェクトの位置(レイアウト)、サイズ及び傾きなどの情報も併せて抽出される。表オブジェクトの例で言えば、上述した表領域情報、つまり、表の外枠を形成する矩形の座標情報やサイズ情報に加え、文書に対して表がどの程度傾いているかを示す傾き情報が、併せて抽出される。すなわち、領域データには、オブジェクトの種類と、その位置、サイズ、傾きなどの情報が含まれる。
図5の500は、スキャナ101で読み取られた文書画像の一例であり、501は文字領域として抽出された領域、502及び503は表領域として抽出された領域をそれぞれ示している。
そして、図6の601は、表領域502及び503について併せて抽出された表領域情報を示している。表領域502に関しては、表の外枠を形成する矩形の左上位置の座標情報(90,550)、当該矩形の幅と高さで表されるサイズ情報(2200,570)が示されている。さらに、表領域502の縦方向の線分は文書画像500の縦方向と平行であるので、傾き情報として「0°」が示されている。表領域503に関しては、表の外枠を形成する矩形の左上位置の座標情報(420,1630)、当該矩形の幅と高さで表されるサイズ情報(1350,540)が示されている。同じく傾き情報についても「0°」が示されている。
<表構造解析部>
オブジェクト別の領域データの抽出が完了すると、次に、表構造解析部212において、表領域データの解析が行われ、表の行/列構造、セルの座標、罫線の色や種類などの表構造情報が抽出される。表領域データを解析し、表構造情報を抽出する方法に関しては、例えば特開2004−086436号公報に記載の方法等が存在する。この方法の場合、まず、表領域内部の白画素塊の境界近傍において2方向のエッジを求め、求められた2方向のエッジそれぞれから求めたエッジヒストグラムに基づいて部分罫線情報を取得する。そして、取得した部分罫線情報に基づいて、表領域の罫線情報を取得することで表構造の解析を行う。
図6の602は、表領域502及び503について抽出された表構造情報を示している。表領域502については、当該表領域の外枠を形成する矩形の左上を原点(0,0)とした場合の、1行1列目に配されたセルの矩形の左上位置の座標(0,0)とサイズ(580,190)が示されている。さらに、背景情報として(なし)及び罫線情報として(黒、実線)が示されている。そして、同様の情報が、3行3列目のセルの分まで(計9セル分)示されている。表領域503に関しても、1行1列目に配されたセルの矩形の左上位置の座標(0,0)とサイズ(600,180)が示されており、背景情報として(なし)及び罫線情報として(黒、実線)が示されている。そして、同様の情報が、3行2列目のセルの分まで(計6セル分)示されている。
<文字認識部>
表構造の解析を終えると、文字認識部213において、文字領域データ及び表領域データ内のセル範囲に対し文字認識処理が実行される。文字認識処理には公知の文字認識技術を用いることができる。以下、文字領域データに対する文字認識の場合を例に説明する。
まず、文字領域データについて、縦書きか横書きかの判断、すなわち、行方向の判断を行う。この判断手法としては、画像データを二値化し、縦横の射影をとって射影分散の低い方を行方向と判定する方法等がある。
次に、文字領域データを文字1つ1つの画像データへと分割する。具体的には、二値画像の行方向への射影を用いて切断すべき行間を発見することでまず行毎の画像データ(行画像データ)に分割する。そして、行と垂直方向への射影を用いて切断すべき文字間を発見することで、行画像データを文字1つ1つの画像データ(文字画像データ)へと分割する。
続いて、分割された文字画像データ1つ1つから特徴を取り出し、予め全文字種分の特徴を保存した辞書を用いて一番特徴の近いものを検索する。そうして検索された最も特徴の近い文字種の文字コードが、当該文字画像データの文字認識結果となる。
さらに、1つ1つの文字画像データにおいて文字を認識する際に当該文字の大きさ情報も同時に取得し、文字領域データ内に存在するすべての文字の大きさの平均値を算出する。これにより、文字領域データ毎の文字サイズ情報を算出する。このようにして得られた文字コードデータと文字サイズ情報とを合わせて文字領域データについての文字認識情報を生成する。
また、同様の処理が表領域データ内のセル範囲に対して、表を構成するセル毎に実行される。もっとも、領域抽出部211にて、抽出された表領域データからさらに表中の文字について文字領域データを取得していた場合には、当該取得された文字領域データについて文字認識処理を行えばよい。
図7は、図5に示す3つの領域501〜503の画像データに対して文字認識処理を行った結果を示したものである。
文字領域501については、認識結果として文字列‘‘Members List’’と、文字領域501の外枠を形成する矩形の位置及びサイズ情報(170,120−1050)及び文字サイズ情報(180)が示されている。
また、表領域502については、1列1行目のセルについて文字列‘‘Name’’と、文字サイズ情報45Pixelが示されている。同様に2列1行目のセルについて文字列‘‘Email’’、3列1行目のセルについて文字列‘‘Group’’、1列2行目のセルについて文字列‘‘Maruko Taro’’、2列2行目のセルについて文字列‘‘marukot@xxx.co.jp’’が示されている。また、3列2行目のセルについて文字列‘‘A’’、1列3行目のセルについて文字列‘‘Kosugi Ichiro’’、2列3行目のセルについて文字列‘‘kosugii@xxx.co.jp’’、3列3行目のセルについて文字列‘‘B’’が示されている。さらに、表領域503の1列1行目のセルについて文字列‘‘Group’’、2列1行目のセルについて文字列‘‘Leader’’、1列2行目のセルについて文字列‘‘A’’、2列2行目のセルについて文字列‘‘Maruko Taro’’が示されている。また、3列1行目のセルについて文字列‘‘B’’、3列2行目のセルについて文字列‘‘Kosugi Ichiro’’が示されている。そして、表領域502及び503の各セルから抽出された上記文字列の文字サイズ情報として45(pixel)が示されている。
<シート生成部>
文字認識処理が終了すると、シート生成部214において、表示用シート221及び編集用シート222の生成処理が行われる。
シート生成部214における処理の流れを説明する前に、シートに記述される各要素について詳しく説明する。必要に応じて、図8及び図9を参照されたい。
シートフォーマットのルート要素であるSheet要素は、セルの情報を格納するTable要素と、シート上に自由配置可能なフローティングオブジェクトの情報を格納するShapes要素から構成される。Sheet要素のName属性はシート名を表す。
Shapes子要素のText要素は、文字列情報を扱う要素である。シートの左上を原点(0,0)とした場合の描画左上位置を示すx属性とy属性、文字の大きさを指定するfontSize属性、及び表示される文字を特定する文字情報からなる。Shapes子要素のImage要素は、イメージオブジェクトを扱う要素で、シートの左上を原点(0,0)とした場合の描画左上位置を示すx属性とy属性、及びイメージオブジェクトの内容としての画像データが格納される。
Table要素は、列の情報を格納するColumn要素、行の情報を格納するRow要素から構成される。Column要素は、列番号を表すc属性と、列幅を表すwidth属性からなる。Row要素は、行番号を表すr属性と、高さを表すheight属性と、子要素Cellから構成される。
Cell要素は、シート上の1セルに対応する。Cell要素は、どの列(Column要素)に対応するセルかを表すc属性、値の属性を表すtype属性、フォントサイズを表すfontSize属性、セルの値を表すvalue属性及び罫線色を表すborderColor属性から構成される。
続いて、図4のフローチャートを用いてシート生成部214における処理の流れを詳細に説明する。
まず、ステップ401において、シート生成部214は、表以外のオブジェクトを記述した表示用シートを生成する。具体的には、文字や自然画像などのオブジェクトを、セルレイヤーとは別のレイヤーに自由配置可能なフローティングオブジェクトとして表現することで文書におけるオブジェクトのレイアウトを再現したシートを生成する。
図8の(A)は、図5に示す文書画像500中の文字領域501の文字オブジェクトが記述された表示用シートの例である。シート名として‘‘ViewSheet’’、文字領域の矩形の位置及びサイズ情報として、x=‘‘170’’、y=‘‘120’’、fontSize=‘‘180’’、内容として‘‘Member List’’、で特定される文字列のtext要素を持つことが分かる。
なお、文書画像500の場合には、表以外のオブジェクトは文字オブジェクトしか存在しないが、他にイメージや、図形、自然画像などのオブジェクトが存在する場合には、同様に表示用シートへ記述される。
次に、ステップ402において、シート生成部214は、表オブジェクトについて編集用シートを生成する。すなわち、表構造情報を記述したシートを表毎(表オブジェクト単位)に生成する。この場合において、処理対象となる表オブジェクトが複数存在する場合には、編集用シートを、任意の順番で順次生成してもよいし、すべての表オブジェクトについて並列処理により生成しても良い。
図9は、編集用シートの例であり、(A)は表領域502の表オブジェクト、(B)は表領域503の表オブジェクトについての編集用シートである。例えば、図9の(A)の場合、シート名が‘‘TableEditSheet1’’で、表領域502を構成する3行3列のセルについて、サイズや罫線などの情報をセル書式で、文字認識結果をセル値として表現していることが分かる。図9の(B)についても同様に、シート名が‘‘TableEditSheet2’’で、表領域503を構成する3行2列のセルについて、サイズや罫線などの情報をセル書式で、文字認識結果をセル値として表現している。
そして、ステップ403において、すべての表オブジェクトに対して編集用シートが生成されたかどうかが判定され、すべての表オブジェクトについて編集用シートの生成が完了すればS404へ進む。
ステップ404において、シート生成部214は、ステップ402で生成された各編集用シート上の表を参照した描画オブジェクトを生成し、これをステップ401で生成された表示用シート上に参照情報として追記する。ここで、描画オブジェクトは、編集用シート上の指定した範囲をレンダリングすることによって得られる。レンダリング元である編集用シート上の表が編集された場合には、参照先である表示用シート上の画像オブジェクトの内容も、当該編集後の内容に併せて更新されることになる。
図8の(B)は、文字領域501の表示用シート(図8の(A))に対して、表領域502及び503の編集用シート(図9の(A)及び(B)を参照した描画オブジェクト801が追記された表示用シートの例である。ここでは画像データを示すImage要素の内容はScript要素となっており、本実施形態での説明のために作られた仮想的なScript言語が記述されている。
「ThisWorkbook.Sheet(‘‘TableName’’).getRenderImage()」は、同一Workbookドキュメント内のTableNameシートの描画イメージを取得する命令である。これにより、2個の編集用シート(TableEditSheet1、TableEditShee2)の描画イメージを表示用シート上に配置している。
<ワークブックドキュメント生成部>
シート生成部214におけるシートの生成処理が終了すると、ワークブックドキュメント生成部215において、生成されたシートに基づきワークブックドキュメントが生成される。すなわち、表示用シートと編集用シートとが関連付けられた、Workbook要素、Sheets要素及びSheet要素からなる1の電子文書を生成する。
ここで、各要素について説明する。ルート要素であるWorkbook要素は、自身を構成するシートの情報を記述したSheets要素から構成される。そして、Sheets要素は、Sheet要素から構成され、Sheet要素はref属性を用いて表示用シート又は編集用シートを参照している。
図10は、ワークブックドキュメントの一例である。このワークブックドキュメントは、ref属性値にファイル名‘‘ViewSheet.xml’’、‘‘TableEditSheet1.xml’’及び‘‘TableEditSheet2.xml’’がそれぞれ格納されている。このことから、図10のワークブックドキュメントが、追記処理が施された表示用シート(図8の(B))と2つの編集用シート(図9の(A)及び(B))とによって構成されていることが理解される。
以上のようにして、スキャナ101における読み取り対象であった紙文書について、電子文書としてのワークブックドキュメントが生成される。
図11は、追記処理が施された表示用シート(図8の(B)が、表示・編集プログラム121によってPC120のディスプレイ上に表示された様子を示している。1101は表示ウィンドウであり、1102はシート編集ウィンドウである。
シート編集ウィンドウ1102内の自由位置に配置されている表画像1103及び1104は、それぞれ図9の(A)及び(B)の編集用シートに対応する描画イメージであり、表の位置や罫線の位置がセルとは無関係に表示されている。
図12は、編集用シート(図9の(A)及び(B))が、表示・編集プログラム121によってPC120のディスプレイ上に表示された様子を示している。図12の(A)では、「Table.1」のタブ1201がアクティブになっており、表領域502に対応する編集用シート(図9の(A))がシート編集ウィンドウ1102に表示されている。同様に、図12の(B)では、「Table.2」のタブ1202がアクティブになっており、表領域503に対応する編集用シート(図9の(B))がシート編集ウィンドウ1102に表示されている。表示用シートの場合とは異なり、表の位置や罫線の位置がセルの矩形と整合した状態で表示されている。
この画面において、表示された表に対して行や列の挿入、削除、またセル内のテキスト編集などを行えば、当該編集された内容が図11に示される表示用シートにも即座に反映される。
上述のとおり、本発明によって生成される電子文書としてのワークブックドキュメントでは、表の実データが、表単位の編集用シート上に表現される。そのため、同一ページ内に表が複数存在する場合でも、他の表に影響を与えることなく(すなわち、図13の(B)に示されたような事態を生じさせることなく)表の編集が可能となる。
さらに、図14に示す文書画像1400が入力された場合の処理について説明する。
文書画像1400上の表領域1401は、文書の縦方向に対して時計回り方向に約15度傾いている。このように表が傾いている場合、従来技術では、表を、行列構造を持った表オブジェクトとしてではなく、行列構造を持たない図形オブジェクトなどとして表現するしかなかった。
しかし、本発明では、このような場合にも表オブジェクトして表現することが可能である。
文書画像1400に対して本発明を適用して得られた編集用シートと追記処理が施された表示用シートが、表示・編集プログラムによって表示された様子をそれぞれ図15の(A)及び(B)に示す。
図15の(B)から明らかなように、表示用シート上では、表は約15度傾いたままであり、文書画像1400の概観をそのまま保っている。一方、図15の(A)の編集用シートでは表の実データが行列構造により表現され、表に対する編集操作が可能となっている。さらに、表示用シート上の表は、描画オブジェクトとして編集用シートから参照されているため、表を回転させるなどの操作も可能となる。
以上説明したように、本実施形態に係る画像処理装置によれば、文書に含まれた表に対する編集性と文書全体のレイアウトの正確な再現とを両立させながら、紙文書を電子文書化することができる。
<実施形態2>
実施形態1では、スキャナ101を介して入力された文書画像中に表領域が存在した場合、全ての表について編集用シートを生成していた。しかし、表の編集を企図して電子文書化する場合であっても、文書画像内の一部の表については編集不要という場合もあり得る。そこで、編集用シートを必要な場合にのみ生成する実施態様について、実施形態2として説明する。
図16は、本実施形態に係るシート生成部214における処理の流れを示したフローチャートである。以下、このフローチャートに沿って詳細に説明するが、実施形態1に係る図4のフローチャートと共通する部分については簡略化ないしは省略し、ここでは差異点を中心に説明する。
まず、ステップ1601において、シート生成部214は、表以外のオブジェクトを記述した表示用シートを生成する。これは、ステップ401と同様である。
次に、ステップ1602において、シート生成部214は、表オブジェクトについて、編集用シートを生成するかどうかを判断する。具体的には、編集用シートの所定の生成条件が記された判断テーブルを用いて、表オブジェクトが当該生成条件を満たすかどうかが判断される。生成条件を満たすと判断されればステップ1604に進み、生成条件を満たさないと判断されればステップ1603に進む。
図17は、判断テーブルの一例を示した図である。図17に示す判断テーブルの場合、ワークブックドキュメントの仕様、他のオブジェクトとの位置関係、及び他の表との位置関係、の大きく3つの観点から、編集用シートを生成するかどうかが判断されることになる。
ワークブックドキュメントの仕様に関する条件では、さらに、傾きとセル背景の要素に分けられる。「傾き」は、文書に対する表の傾きが0度,90度,180度,270度以外の時に編集用シートを生成するという条件である。すなわち、文書に対して表が直角以外の角度(例えば、30度)で傾いている場合に、編集用シートが生成されることになる。「セル背景」は、セルの背景が、単色以外の時に編集用シートを生成するという条件である。つまり、セルの背景色が複数の色で構成されている場合に、編集用シートが生成されることになる。
他のオブジェクトとの位置関係に関する条件は、表オブジェクトの領域の全部又は一部と表以外のオブジェクトとが重なる場合には、編集用シートを生成するという条件である。
他の表との位置関係に関する条件は、複数の表が存在するときに、表同士の位置関係が、行方向又は列方向のいずれかにおいて重なりが生じる場合に編集用シートを生成するという条件である。すなわち、一方の表に対する行や列の挿入・削除等の操作が他方の表に影響を及ぼし得るような位置関係に表がレイアウトされている場合に編集用シートが生成されることになる。
なお、上述した判断テーブルの生成条件は一例であり、他にも様々な条件を設定し得る。例えば、上下に配置された表の縦方向罫線のX座標が一致しない場合や、左右に配置された表の横方向罫線のY座標が一致しない場合には、編集用シートを生成するといった条件が考えられる。さらに、2つ以上の表が存在する場合には必ず編集用シートを生成するという条件にしてもよい。判断テーブルにおける生成条件は、電子化された文書の使用目的や用途に合せユーザが任意に設定すればよい。
ステップ1603において、シート生成部214は、S1601で生成した表示用シート上に、表をフローティングオブジェクトとして追記する。追記が終わると、ステップ1605に進む。
一方、ステップ1604において、シート生成部214は、表オブジェクトについて編集用シートを生成する。具体的な内容は、ステップ402と同様である。編集用シートの生成が終了するとステップ1605に進む。
そして、ステップ1605において、すべての表オブジェクトについて表示用シートへの追記又は編集用シートの生成が完了したかどうかが判定され、完了と判定されればステップ1606へと進む。
ステップ1606において、シート生成部214は、ステップ1605で生成された編集用シート上の表を参照した描画オブジェクトを生成し、これをステップ1603で生成された表示用シート上に追記する。このステップもステップ404と同様である。
以下、図17の判断テーブルを用いて本実施形態の処理を適用した具体例を説明する。
まず、図18に示した文書画像1800の場合を例に説明する。図18の文書画像1800には、上下左右にずれて配置された2つの表(1801と1802)が存在している。
まず、実施形態1の場合と同様、領域抽出部211において、表領域1801及び1802について、表オブジェクトとしての領域データが抽出される。そして、表領域1801については、位置情報として(110,600)、サイズ情報として(1100, 500)、傾き0度の各情報が抽出されている。同様に表領域1802については、位置情報として(1350,1400)、サイズ情報として(1000,550)、傾き0度が抽出されている。
続いて、表構造解析部212において、それぞれの表領域データに対して解析が行われる。ここでは、セルの背景色の情報として「RGB#FFF(白)」が、すべてのセルについて抽出されている。
そして、図17の判断テーブルを用いて、編集用シートの生成の有無が判断される。まず、表領域1801、1802は共に傾きは存在せず、セル背景はいずれも単色であるため、ワークブックドキュメントの仕様に関する編集用シートの生成条件は満たさない。また、表以外のオブジェクトも存在しないため、他のオブジェクトとの位置関係に関する生成条件も満たさない。さらに、2つの表の位置関係は、X軸とY軸の双方の方向において重なりは生じていないので、他の表との位置関係に関する生成条件も満たさない。
よって、編集用シートの生成は行われず、2つの表の追記が表示用シートに対して行われた後、シート生成部214の処理を終了する。
その結果、表示用シートのみで構成されたワークブックドキュメントが生成されることになる。
次に、図14に示した文書画像1400の場合を例に説明する。
まず、領域抽出部211において、表領域1401について、表オブジェクトとしての領域データが抽出され、同時に傾き15度の傾き情報が抽出される。
表構造解析部212における解析が行われた後、図17の判断テーブルを用いて、編集用シートの生成の有無が判断される。ここで、表領域1401は、15度の傾きが存在するため、ワークブックドキュメントの仕様に関する編集用シートの生成条件を満たすことになる。
よって、編集用シートの生成が行われ、その後、生成された編集用シート上の表を参照した描画オブジェクトが表示用シート上に追記されて、シート生成部214の処理は終了する。
その結果、表示用シートと編集用シートとで構成されたワークブックドキュメントが生成されることになる。
以上説明したように、本実施形態によれば、編集用シートの生成の有無を予め定めた条件によって判断することで、無用な編集用シートの生成を抑制することができる。これにより、ユーザのニーズにきめ細かに対応し得る紙文書の電子文書化が可能となる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
100 画像処理装置
110 LAN
210 電子文書生成部

Claims (8)

  1. 表を含む文書の画像データから、各オブジェクトの位置の情報を含む領域データを抽出する領域抽出手段と、
    前記抽出された領域データのうち表オブジェクトに関する領域データを解析し、表オブジェクトそれぞれの構造を示す表構造情報を抽出する表構造解析手段と、
    前記表オブジェクトに対して文字認識処理を実行することにより、前記表オブジェクト内の各セルについての文字認識結果を得る文字認識手段と、
    前記オブジェクトの領域データと前記表構造情報と前記文字認識結果とを用いて、前記文書におけるオブジェクトのレイアウトを再現するための表示用シートと、表の編集をするための表毎の編集用シートを生成するシート生成手段と
    前記表示用シートと前記編集用シートとを関連付けた電子文書を生成する電子文書生成手段と、
    を備え、
    前記シート生成手段で生成される前記編集用シートは、前記表構造情報に基づいて前記表オブジェクトそれぞれの構造を前記編集用シートにおける表のセルの構造を用いて記述し且つ前記文字認識結果を前記編集用シートにおける表のセルに記述したシートであり、
    前記シート生成手段で生成される前記表示用シートは、前記編集用シートにおける表をレンダリングすることにより生成される描画オブジェクトを取得して、当該取得した描画オブジェクトを、前記表オブジェクトの位置に対応する前記表示用シートにおける位置に配置する命令が記述されたシートであり、
    前記表示用シート上に配置される描画オブジェクトは、前記編集用シートにおける表が編集された場合、当該編集後の前記編集用シートにおける表をレンダリングして生成される描画オブジェクトによって更新される、
    ことを特徴とする装置。
  2. 前記シート生成手段は、所定の生成条件を満たすかどうかによって前記編集用シートを生成するかどうかを判断する判断手段をさらに有することを特徴とする請求項1に記載の装置。
  3. 前記所定の生成条件は、前記文書に対する表の傾き、セルの背景の色、表と他のオブジェクトとの位置関係及び表同士の位置関係のいずれかに関する条件であることを特徴とする請求項2に記載の装置。
  4. 前記領域データには、前記オブジェクトの位置の情報に加えて、更に、前記各オブジェクトのサイズ及び傾きのうち少なくとも1つの情報が含まれ、
    前記表構造情報には、行/列構造、セルの座標、罫線の色、及び罫線の種類のうち少なくとも1つの情報が含まれる
    ことを特徴とする請求項1乃至3のいずれか1項に記載の装置。
  5. 前記電子文書は、XMLフォーマットであることを特徴とする請求項1乃至4のいずれか1項に記載の装置。
  6. 前記編集用シートにおける表に対して実行可能な編集は、表に対する行または列の挿入と、表に対する行または列の削除と、表のセル内のテキストの編集とを含み、
    前記表示用シート上に配置される描画オブジェクトは、前記編集用シートにおける表が編集された場合、当該編集後の前記編集用シートにおける表をレンダリングして生成される描画オブジェクトによって更新されることを特徴とする請求項1乃至5のいずれか1項に記載の装置。
  7. 領域抽出手段が、表を含む文書の画像データから、各オブジェクトの位置の情報を含む領域データを抽出するステップと、
    表構造解析手段が、前記抽出された領域データのうち表オブジェクトに関する領域データを解析し、表オブジェクトそれぞれの構造を示す表構造情報を抽出するステップと、
    文字認識手段が、前記表オブジェクトに対して文字認識処理を実行することにより、前記表オブジェクト内の各セルについての文字認識結果を得るステップと、
    シート生成手段が、前記オブジェクトの領域データと前記表構造情報と前記文字認識結果とを用いて、前記文書におけるオブジェクトのレイアウトを再現するための表示用シートと、表の編集をするための表毎の編集用シートを生成するステップと、
    電子文書生成手段が、前記表示用シートと前記編集用シートとを関連付けた電子文書を生成するステップと、
    を含み、
    前記シート生成ステップで生成される前記編集用シートは、前記表構造情報に基づいて前記表オブジェクトそれぞれの構造を前記編集用シートにおける表のセルの構造を用いて記述し且つ前記文字認識結果を前記編集用シートにおける表のセルに記述したシートであり、
    前記シート生成ステップで生成される前記表示用シートは、前記編集用シートにおける表をレンダリングすることにより生成される描画オブジェクトを取得して、当該取得した描画オブジェクトを、前記表オブジェクトの位置に対応する前記表示用シートにおける位置に配置する命令が記述されたシートであり、
    前記表示用シート上に配置される描画オブジェクトは、前記編集用シートにおける表が編集された場合、当該編集後の前記編集用シートにおける表をレンダリングして生成される描画オブジェクトによって更新される、
    ことを特徴とする文書を電子化する方法。
  8. コンピュータを、
    表を含む文書の画像データから、各オブジェクトの位置の情報を含む領域データを抽出する領域抽出手段と、
    前記抽出された領域データのうち表オブジェクトに関する領域データを解析し、表オブジェクトそれぞれの構造を示す表構造情報を抽出する表構造解析手段と、
    前記表オブジェクトに対して文字認識処理を実行することにより、前記表オブジェクト内の各セルについての文字認識結果を得る文字認識手段と、
    前記オブジェクトの領域データと前記表構造情報と前記文字認識結果とを用いて、前記文書におけるオブジェクトのレイアウトを再現するための表示用シートと、表の編集をするための表毎の編集用シートを生成するシート生成手段と
    前記表示用シートと前記編集用シートとを関連付けた電子文書を生成する電子文書生成手段
    として機能させるためのコンピュータプログラムであって、
    前記シート生成手段で生成される前記編集用シートは、前記表構造情報に基づいて前記表オブジェクトそれぞれの構造を前記編集用シートにおける表のセルの構造を用いて記述し且つ前記文字認識結果を前記編集用シートにおける表のセルに記述したシートであり、
    前記シート生成手段で生成される前記表示用シートは、前記編集用シートにおける表をレンダリングすることにより生成される描画オブジェクトを取得して、当該取得した描画オブジェクトを、前記表オブジェクトの位置に対応する前記表示用シートにおける位置に配置する命令が記述されたシートであり、
    前記表示用シート上に配置される描画オブジェクトは、前記編集用シートにおける表が編集された場合、当該編集後の前記編集用シートにおける表をレンダリングして生成される描画オブジェクトによって更新される、
    ことを特徴とするコンピュータプログラム。
JP2010001426A 2010-01-06 2010-01-06 文書を電子化する装置及び方法 Expired - Fee Related JP5465015B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2010001426A JP5465015B2 (ja) 2010-01-06 2010-01-06 文書を電子化する装置及び方法
US12/980,678 US8718364B2 (en) 2010-01-06 2010-12-29 Apparatus and method for digitizing documents with extracted region data
EP11150261.3A EP2343670B1 (en) 2010-01-06 2011-01-05 Apparatus and method for digitizing documents
KR1020110001492A KR101334483B1 (ko) 2010-01-06 2011-01-06 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체
CN201110008963.2A CN102117269B (zh) 2010-01-06 2011-01-06 对文档进行数字化的装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010001426A JP5465015B2 (ja) 2010-01-06 2010-01-06 文書を電子化する装置及び方法

Publications (3)

Publication Number Publication Date
JP2011141677A JP2011141677A (ja) 2011-07-21
JP2011141677A5 JP2011141677A5 (ja) 2013-02-14
JP5465015B2 true JP5465015B2 (ja) 2014-04-09

Family

ID=43828378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010001426A Expired - Fee Related JP5465015B2 (ja) 2010-01-06 2010-01-06 文書を電子化する装置及び方法

Country Status (5)

Country Link
US (1) US8718364B2 (ja)
EP (1) EP2343670B1 (ja)
JP (1) JP5465015B2 (ja)
KR (1) KR101334483B1 (ja)
CN (1) CN102117269B (ja)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9042653B2 (en) * 2011-01-24 2015-05-26 Microsoft Technology Licensing, Llc Associating captured image data with a spreadsheet
JP5541202B2 (ja) * 2011-03-16 2014-07-09 コニカミノルタ株式会社 スプレッドシートデータ生成装置およびプログラム
US8984404B2 (en) * 2011-05-27 2015-03-17 Hewlett-Packard Development Company, L.P. Guiding an image-based task execution
US8657195B2 (en) * 2011-09-27 2014-02-25 Symbol Technologies, Inc. Document capture with imaging-based bar code readers
US8990675B2 (en) 2011-10-04 2015-03-24 Microsoft Technology Licensing, Llc Automatic relationship detection for spreadsheet data items
US9069748B2 (en) * 2011-10-04 2015-06-30 Microsoft Technology Licensing, Llc Selective generation and display of data items associated with a spreadsheet
CN104094282B (zh) 2012-01-23 2017-11-21 微软技术许可有限责任公司 无边框表格检测引擎
CN104067293B (zh) 2012-01-23 2017-07-25 微软技术许可有限责任公司 矢量图分类引擎
CN102819564A (zh) * 2012-07-05 2012-12-12 无锡中科泛在信息技术研发中心有限公司 一种有限表元组合的报表生成方法
US9626067B2 (en) 2012-12-12 2017-04-18 Apple Inc. Modifying positions of on-canvas objects
CN103020031A (zh) * 2012-12-19 2013-04-03 珠海金山办公软件有限公司 一种智能更新数据透视表的方法及装置
US9953008B2 (en) 2013-01-18 2018-04-24 Microsoft Technology Licensing, Llc Grouping fixed format document elements to preserve graphical data semantics after reflow by manipulating a bounding box vertically and horizontally
CN103295008B (zh) * 2013-05-22 2017-04-05 华为终端有限公司 一种文字识别方法及用户终端
CN104700176B (zh) * 2013-12-09 2018-08-21 中国商用飞机有限责任公司 一种技术出版物内容交付系统及方法
CN104731813A (zh) * 2013-12-23 2015-06-24 珠海金山办公软件有限公司 表格文件显示方法及系统
KR101447555B1 (ko) * 2014-03-06 2014-10-08 주식회사 한글과컴퓨터 표 입력 제어 기반의 전자 문서 편집 장치 및 방법
US9513671B2 (en) 2014-08-01 2016-12-06 Microsoft Technology Licensing, Llc Peripheral retention device
US10191986B2 (en) 2014-08-11 2019-01-29 Microsoft Technology Licensing, Llc Web resource compatibility with web applications
US9705637B2 (en) 2014-08-19 2017-07-11 Microsoft Technology Licensing, Llc Guard band utilization for wireless data communication
US9805483B2 (en) 2014-08-21 2017-10-31 Microsoft Technology Licensing, Llc Enhanced recognition of charted data
US9524429B2 (en) * 2014-08-21 2016-12-20 Microsoft Technology Licensing, Llc Enhanced interpretation of character arrangements
US9397723B2 (en) 2014-08-26 2016-07-19 Microsoft Technology Licensing, Llc Spread spectrum wireless over non-contiguous channels
US9424048B2 (en) 2014-09-15 2016-08-23 Microsoft Technology Licensing, Llc Inductive peripheral retention device
CN105069293B (zh) * 2015-08-07 2017-11-10 宋声台 一种信息录入终端的方法和智能笔记本
CN105373791B (zh) * 2015-11-12 2018-12-14 中国建设银行股份有限公司 信息处理方法及信息处理装置
US20170220858A1 (en) * 2016-02-01 2017-08-03 Microsoft Technology Licensing, Llc Optical recognition of tables
CN106650664A (zh) * 2016-12-22 2017-05-10 深圳爱拼信息科技有限公司 一种高招大本数据采集系统及方法
KR101991087B1 (ko) 2017-05-12 2019-06-19 이세희 검증 및 보정 효율성이 개선된 비 전자 기록물의 디지털화 시스템 및 방법
KR102016998B1 (ko) 2017-05-12 2019-09-03 이세희 개인정보를 포함하는 비공개 처리 기록물의 효율적 관리를 위한 비전자 기록물의 디지털화 시스템 및 방법
KR101868468B1 (ko) 2017-05-12 2018-06-19 이세희 무선통신수단을 이용하여 기록물철의 관리 및 검색 효율성을 개선시킨 비 전자 기록물의 디지털화 시스템
US11003796B2 (en) 2017-06-30 2021-05-11 Accenture Global Solutions Limited Artificial intelligence based document processor
US10489502B2 (en) 2017-06-30 2019-11-26 Accenture Global Solutions Limited Document processing
US11562143B2 (en) 2017-06-30 2023-01-24 Accenture Global Solutions Limited Artificial intelligence (AI) based document processor
KR101991088B1 (ko) 2017-08-02 2019-06-19 이세희 비 전자 기록물의 넘버링을 자동화 한 기록물의 자동 디지털화 장치 및 방법
KR101907029B1 (ko) * 2017-08-24 2018-10-12 (주) 더존비즈온 서식 자동화를 위한 테이블 생성 장치 및 방법
CN109992759B (zh) * 2017-12-29 2023-12-01 珠海金山办公软件有限公司 表格对象编辑方法、装置、电子设备及存储介质
US11650970B2 (en) 2018-03-09 2023-05-16 International Business Machines Corporation Extracting structure and semantics from tabular data
KR102107449B1 (ko) * 2018-07-30 2020-06-02 주식회사 한글과컴퓨터 스프레드시트 문서 내 병합된 셀의 콘텐트를 표시하는 전자 장치 및 그의 동작 방법
US11200413B2 (en) * 2018-07-31 2021-12-14 International Business Machines Corporation Table recognition in portable document format documents
CN109447019B (zh) * 2018-11-08 2021-05-28 公安部沈阳消防研究所 基于图像识别与数据库存储的纸质扫描文档电子化方法
CN109829814B (zh) * 2018-12-29 2024-04-02 平安科技(深圳)有限公司 历史还款信息的生成方法、装置、设备及存储介质
CN110956087B (zh) * 2019-10-25 2024-04-19 北京懿医云科技有限公司 一种图片中表格的识别方法、装置、可读介质和电子设备
KR102300475B1 (ko) * 2019-12-13 2021-09-09 주식회사 한글과컴퓨터 표가 삽입된 이미지를 전자 문서로 변환할 수 있는 전자 장치 및 그 동작 방법
US11501549B2 (en) 2020-05-13 2022-11-15 Accenture Global Solutions Limited Document processing using hybrid rule-based artificial intelligence (AI) mechanisms
CN111898402A (zh) * 2020-06-01 2020-11-06 王昌龙 一种智能排版系统
US11403455B2 (en) * 2020-07-07 2022-08-02 Kudzu Software Llc Electronic form generation from electronic documents
US11341318B2 (en) 2020-07-07 2022-05-24 Kudzu Software Llc Interactive tool for modifying an automatically generated electronic form
KR102211516B1 (ko) * 2020-08-21 2021-02-04 주식회사 애자일소다 가상 셀을 이용한 ocr 기반 문서 분석 시스템 및 방법
CN112149506A (zh) * 2020-08-25 2020-12-29 北京来也网络科技有限公司 结合rpa和ai的图像中的表格生成方法、设备及存储介质
KR102614760B1 (ko) * 2020-11-16 2023-12-19 주식회사 솔트룩스 표 이미지로부터 구조화된 출력 데이터를 생성하기 위한 표 정보 생성 시스템 및 방법
WO2022102823A1 (ko) * 2020-11-16 2022-05-19 주식회사 솔트룩스 표 이미지로부터 구조화된 출력 데이터를 생성하기 위한 표 정보 생성 시스템 및 방법
KR102525024B1 (ko) * 2021-08-19 2023-04-24 (주)복부인 부동산 계약서 자동 분석 및 관리 장치
US11837004B1 (en) * 2023-02-24 2023-12-05 Oracle Financial Services Software Limited Searchable table extraction

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3838729C2 (de) * 1987-11-16 1994-05-05 Canon Kk Dokumentverarbeitungsgerät
JPH05250357A (ja) * 1992-03-05 1993-09-28 Ricoh Co Ltd 画像読取修正装置および修正画像形成装置
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH11167532A (ja) 1997-12-02 1999-06-22 Canon Inc データ加工システムおよび装置、データ加工方法、記録媒体
JPH11312231A (ja) * 1998-04-28 1999-11-09 Omron Corp データ処理プログラムを記録した記録媒体、データ処理装置およびデータ処理方法
US6337924B1 (en) * 1999-02-26 2002-01-08 Hewlett-Packard Company System and method for accurately recognizing text font in a document processing system
US6816630B1 (en) * 2000-05-22 2004-11-09 Electro-Sensors, Inc. System and method for creating and processing data forms
US7155667B1 (en) * 2000-06-21 2006-12-26 Microsoft Corporation User interface for integrated spreadsheets and word processing tables
JP2002007953A (ja) 2000-06-22 2002-01-11 Hitachi Ltd 電子帳票処理装置
JP2002185763A (ja) * 2000-12-11 2002-06-28 Minolta Co Ltd デジタル複写機
JP4208520B2 (ja) * 2002-08-26 2009-01-14 キヤノン株式会社 画像処理装置および画像処理方法、プログラムおよび記憶媒体
US7882427B2 (en) * 2003-07-24 2011-02-01 Balenz Software, Inc. System and method for managing a spreadsheet
JP4041442B2 (ja) 2003-09-08 2008-01-30 シャープ株式会社 無線通信装置及び無線通信システム
JP3796500B2 (ja) * 2003-11-21 2006-07-12 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4371911B2 (ja) 2004-05-31 2009-11-25 キヤノン株式会社 関数化処理方法及び関数化処理装置
US7873218B2 (en) 2004-04-26 2011-01-18 Canon Kabushiki Kaisha Function approximation processing method and image processing method
DE102005048600B4 (de) * 2005-10-06 2008-09-25 Klaus Rehm Verfahren zum Erfassen von Daten
JP2007249754A (ja) * 2006-03-17 2007-09-27 Internatl Business Mach Corp <Ibm> 情報処理装置、情報処理方法およびプログラム
AU2006252019B2 (en) * 2006-12-13 2012-06-28 Canon Kabushiki Kaisha Method and Apparatus for Dynamic Connector Analysis
AU2006252025B2 (en) * 2006-12-13 2012-10-04 Canon Kabushiki Kaisha Recognition of parameterised shapes from document images
US8595615B2 (en) * 2007-02-07 2013-11-26 International Business Machines Corporation System and method for automatic stylesheet inference
WO2009001462A1 (ja) * 2007-06-28 2008-12-31 Fujitsu Limited スプレッドシート生成プログラム、該プログラムを記録した記録媒体、スプレッドシート生成装置、およびスプレッドシート生成方法
US8000529B2 (en) * 2007-07-11 2011-08-16 Hewlett-Packard Development Company, L.P. System and method for creating an editable template from a document image
US8260049B2 (en) * 2007-09-28 2012-09-04 Abbyy Software Ltd. Model-based method of document logical structure recognition in OCR systems

Also Published As

Publication number Publication date
US20110164813A1 (en) 2011-07-07
KR20110081099A (ko) 2011-07-13
CN102117269B (zh) 2014-06-04
CN102117269A (zh) 2011-07-06
EP2343670A3 (en) 2014-11-26
JP2011141677A (ja) 2011-07-21
EP2343670B1 (en) 2019-03-13
KR101334483B1 (ko) 2013-11-29
EP2343670A2 (en) 2011-07-13
US8718364B2 (en) 2014-05-06

Similar Documents

Publication Publication Date Title
JP5465015B2 (ja) 文書を電子化する装置及び方法
JP5361574B2 (ja) 画像処理装置、画像処理方法、及びプログラム
DK2106594T3 (en) PROCEDURE FOR REMOVING DIFFERENCES IN GRAPHIC APPEARANCE BETWEEN AN ORIGINAL DOCUMENT AND AN AMENDED DOCUMENT WITH REMARKS
US7844896B2 (en) Layout-rule generation system, layout system, layout-rule generation program, layout program, storage medium, method of generating layout rule, and method of layout
JP5974115B2 (ja) 式検出エンジン
US20130100161A1 (en) Digital comic editor, method and non-transitory computer-readable medium
JP2013089196A (ja) 電子コミック編集装置、方法及びプログラム
JP2010009509A (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
JPH0612540B2 (ja) 文書作成支援装置
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP5528410B2 (ja) ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム
Anderson et al. Adobe Photoshop CS2 on Demand

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131008

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140121

R151 Written notification of patent or utility model registration

Ref document number: 5465015

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees