JP5574272B2 - 画像読取装置、画像処理装置およびプログラム - Google Patents
画像読取装置、画像処理装置およびプログラム Download PDFInfo
- Publication number
- JP5574272B2 JP5574272B2 JP2010030809A JP2010030809A JP5574272B2 JP 5574272 B2 JP5574272 B2 JP 5574272B2 JP 2010030809 A JP2010030809 A JP 2010030809A JP 2010030809 A JP2010030809 A JP 2010030809A JP 5574272 B2 JP5574272 B2 JP 5574272B2
- Authority
- JP
- Japan
- Prior art keywords
- basic cell
- identifier
- ruled line
- cell
- changed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 10
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 230000010354 integration Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000032823 cell division Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
請求項1に係る本発明は、四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する抽出手段と、
前記抽出手段により抽出された罫線情報に基づいて、前記表画像の格子構造を解析する解析手段と、
前記解析手段により解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定する設定手段と、
前記設定手段により設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定手段と、
前記判定手段により変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成する構造化文書生成手段と、
を備えた画像処理装置である。
請求項2に係る本発明は、設定された用紙上の画像を画像データとして読み取る読取手段と、
前記読取手段により読み取られた四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する抽出手段と、
前記抽出手段により抽出された罫線情報に基づいて、前記表画像の格子構造を解析する解析手段と、
前記解析手段により解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定する設定手段と、
前記設定手段により設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定手段と、
前記判定手段により変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成する構造化文書生成手段と、
を備えた画像読取装置である。
請求項3に係る本発明は、四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出するステップと、
抽出された罫線情報に基づいて、前記表画像の格子構造を解析するステップと、
解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定するステップと、
設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定ステップと、
前記判定ステップにおいて変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成するステップとをコンピュータに実行させるためのプログラムである。
図1は本発明の一実施形態の画像読取システムの構成を示すブロック図である。
上記実施形態では、基本セルの上側の辺および左側の辺における罫線の有無に基づいて基本セル間の結合状況を判定する場合を用いて説明したが、本発明はこれに限定されるものではなく、少なくとも2辺における罫線の有無に基づいて基本セル間の結合状況を判定する場合でも同様に本発明を適用することができるものである。例えば、基本セルの処理を行う順序を反対にすれば、基本セルの下側の辺および右側の辺における罫線の有無に基づいて基本セル間の結合状況を判定することが可能となる。また、上側の辺および右側の辺における罫線の有無や、下側の辺および左側の辺における罫線の有無に基づいて基本セル間の結合状況を判定することも可能である。さらに、場合分けを行う処理が複雑になるが、上側、下側、左側および右側の全ての辺における罫線の有無に基づいて、基本セル間の結合状況を判定するようなことも可能である。
11 CPU
12 メモリ
13 記憶装置
14 通信インタフェース(IF)
15 ユーザインタフェース(UI)装置
16 スキャナ
18 制御バス
20 端末装置
30 ネットワーク
31 オブジェクト分離部
32 文字画像処理部
33 写真画像処理部
34 表画像処理部
35 処理結果統合部
36 構造化文書出力部
40 画像処理装置
81〜96 基本セル
S101〜S105 ステップ
S201〜S205 ステップ
S301〜S314 ステップ
Claims (3)
- 四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する抽出手段と、
前記抽出手段により抽出された罫線情報に基づいて、前記表画像の格子構造を解析する解析手段と、
前記解析手段により解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定する設定手段と、
前記設定手段により設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定手段と、
前記判定手段により変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成する構造化文書生成手段と、
を備えた画像処理装置。 - 設定された用紙上の画像を画像データとして読み取る読取手段と、
前記読取手段により読み取られた四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出する抽出手段と、
前記抽出手段により抽出された罫線情報に基づいて、前記表画像の格子構造を解析する解析手段と、
前記解析手段により解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定する設定手段と、
前記設定手段により設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定手段と、
前記判定手段により変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成する構造化文書生成手段と、
を備えた画像読取装置。 - 四角形状以外のセルを含む表画像が含まれた画像データから、当該表画像を構成する縦罫線および横罫線の情報である罫線情報を抽出するステップと、
抽出された罫線情報に基づいて、前記表画像の格子構造を解析するステップと、
解析された格子構造において縦格子軸および横格子軸により分割された四角形領域をそれぞれ基本セルとして識別子を設定するステップと、
設定された前記各基本セルのうち、ある基本セルの左側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を左側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの上側の辺のみにおいて罫線が存在しない場合、その基本セルの識別子を上側の基本セルの識別子に変更して結合関係にあると判定し、ある基本セルの左側の辺および上側の辺において罫線が存在しない場合、その基本セルの識別子を、左側の基本セルの識別子および上側の基本セルの識別子のうち小さい方の識別子に変更するとともに、大きい方の識別子の基本セルの識別子を小さい方の識別子に変更して結合関係にあると判定する判定ステップと、
前記判定ステップにおいて変更された前記識別子を用いて、前記表画像の構造を現した構造化文書を生成するステップとをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010030809A JP5574272B2 (ja) | 2010-02-16 | 2010-02-16 | 画像読取装置、画像処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010030809A JP5574272B2 (ja) | 2010-02-16 | 2010-02-16 | 画像読取装置、画像処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011170397A JP2011170397A (ja) | 2011-09-01 |
JP5574272B2 true JP5574272B2 (ja) | 2014-08-20 |
Family
ID=44684495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010030809A Expired - Fee Related JP5574272B2 (ja) | 2010-02-16 | 2010-02-16 | 画像読取装置、画像処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5574272B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6091093B2 (ja) * | 2012-06-14 | 2017-03-08 | 株式会社エヌ・ティ・ティ・データ | 文書変換装置、文書変換方法および文書変換プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2575480B2 (ja) * | 1988-11-30 | 1997-01-22 | 富士電機株式会社 | 表構造化方式 |
JPH0883306A (ja) * | 1994-09-12 | 1996-03-26 | Ricoh Co Ltd | 表項目及び表の識別方法並びにその装置 |
JP2006099480A (ja) * | 2004-09-29 | 2006-04-13 | Toshiba Corp | 文書処理装置 |
-
2010
- 2010-02-16 JP JP2010030809A patent/JP5574272B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011170397A (ja) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101127081B (zh) | 表格数据处理方法和装置 | |
JP5111268B2 (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
EP2264995B1 (en) | Image processing apparatus, image processing method, and computer program | |
US8675260B2 (en) | Image processing method and apparatus, and document management server, performing character recognition on a difference image | |
CN110110313A (zh) | 文档表格解析方法及装置 | |
JP2010009509A (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
US20120237131A1 (en) | Information processing apparatus to acquire character information | |
JP2012203783A (ja) | 画像処理装置およびプログラム | |
JP4921335B2 (ja) | ドキュメント処理装置及び検索方法 | |
JP2012203491A (ja) | 文書処理装置及び文書処理プログラム | |
JP5769131B2 (ja) | 画像処理装置およびプログラム | |
JP5574272B2 (ja) | 画像読取装置、画像処理装置およびプログラム | |
JP2006262442A (ja) | 画像編集装置と画像編集方法 | |
JP6680052B2 (ja) | 表データ変換方法、プログラム、画像読取装置 | |
JP2022092119A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2012015896A (ja) | 画像処理装置 | |
JP2009031937A (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP2007087238A (ja) | データ変換プログラム、方法及び装置 | |
CN101901341A (zh) | 从可移植电子文档中提取光栅图像的方法和设备 | |
JP7383882B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP4712629B2 (ja) | 設備仕様入力装置 | |
JP2000293671A (ja) | 画像処理方法、装置及び記憶媒体 | |
JP2000293624A (ja) | 画像処理方法、装置及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140609 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5574272 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140622 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |