JP2000090195A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2000090195A5 JP2000090195A5 JP1998258681A JP25868198A JP2000090195A5 JP 2000090195 A5 JP2000090195 A5 JP 2000090195A5 JP 1998258681 A JP1998258681 A JP 1998258681A JP 25868198 A JP25868198 A JP 25868198A JP 2000090195 A5 JP2000090195 A5 JP 2000090195A5
- Authority
- JP
- Japan
- Prior art keywords
- table structure
- term
- area
- analysis
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 description 18
- 238000000605 extraction Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 9
- 238000006011 modification reaction Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 1
Description
【特許請求の範囲】
【請求項1】 表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段とを備えることを特徴とする表認識装置。
【請求項2】 前記修正手段によって得られた修正後の表構造を表示する修正表示手段を更に備えることを特徴とする請求項1に記載の表認識装置。
【請求項3】 前記解析手段は、
前記表の画像に含まれる罫線を抽出する罫線抽出手段と、
前記表の画像に含まれる文字を囲む矩形領域を検出し、所定値以下の距離にある矩形領域を統合して項の矩形領域を抽出する項領域抽出手段とを備え、
前記罫線抽出手段と前記項領域抽出手段によって抽出された罫線及び項の矩形領域に基づいて表構造を得ることを特徴とする請求項1に記載の表認識装置。
【請求項4】 前記解析手段は、前記罫線抽出手段で抽出された罫線と、前記項領域抽出手段で抽出された項の矩形領域間の空白部とに基づいて、当該表の列及び行の境界を決定することを特徴とする請求項3に記載の表認識装置。
【請求項5】 前記表構造表示手段は、前記表の画像に重ねて、前記解析手段で得られた項の矩形領域および前記境界を表す境界線を表示することを特徴とする請求項4に記載の表認識装置。
【請求項6】 前記表構造表示手段は、前記表の画像の文字列の矩形、項領域の矩形および項の境界線を表示することを特徴とする請求項4に記載の表認識装置。
【請求項7】 情報処理装置による表認識方法であって、
解析手段が、表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析工程と、
表構造表示手段が、前記解析工程によって得られた表構造を表示する表構造表示工程と、
指示手段が、前記表示表構造工程によって表示された表構造に対する、項の領域の修正指示を受け付ける指示工程と、
前記指示工程で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正工程と、
生成手段が、前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成工程とを備えることを特徴とする表認識方法。
【請求項8】 修正表示手段が、前記修正工程によって得られた修正後の表構造を表示する修正表示工程を更に備えることを特徴とする請求項7に記載の表認識方法。
【請求項9】 前記解析工程は、
前記表の画像に含まれる罫線を抽出する罫線抽出工程と、
前記表の画像に含まれる文字を囲む矩形領域を検出し、所定値以下の距離にある矩形領域を統合して項の矩形領域を抽出する項領域抽出工程とを備え、
前記罫線抽出工程と前記項領域抽出工程によって抽出された罫線及び項の矩形領域に基づいて表構造を得ることを特徴とする請求項7に記載の表認識方法。
【請求項10】 前記解析工程は、前記罫線抽出工程で抽出された罫線と、前記項領域抽出工程で抽出された項の矩形領域間の空白部とに基づいて、当該表の列及び行の境界を決定することを特徴とする請求項9に記載の表認識方法。
【請求項11】 前記表構造表示工程は、前記表の画像に重ねて、前記解析工程で得られた項の矩形領域および前記境界を表す境界線を表示することを特徴とする請求項10に記載の表認識方法。
【請求項12】 前記表構造表示工程は、前記表の画像の文字列の矩形、項領域の矩形および項の境界線を表示することを特徴とする請求項10に記載の表認識方法。
【請求項13】 コンピュータに、表の画像情報に基づいて表形式のデータを生成させるための制御プログラムを格納した記憶媒体であって、前記コンピュータを、
表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段による修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段として機能させるための制御プログラムを記憶したことを特徴とするコンピュータ可読記憶媒体。
【請求項1】 表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段とを備えることを特徴とする表認識装置。
【請求項2】 前記修正手段によって得られた修正後の表構造を表示する修正表示手段を更に備えることを特徴とする請求項1に記載の表認識装置。
【請求項3】 前記解析手段は、
前記表の画像に含まれる罫線を抽出する罫線抽出手段と、
前記表の画像に含まれる文字を囲む矩形領域を検出し、所定値以下の距離にある矩形領域を統合して項の矩形領域を抽出する項領域抽出手段とを備え、
前記罫線抽出手段と前記項領域抽出手段によって抽出された罫線及び項の矩形領域に基づいて表構造を得ることを特徴とする請求項1に記載の表認識装置。
【請求項4】 前記解析手段は、前記罫線抽出手段で抽出された罫線と、前記項領域抽出手段で抽出された項の矩形領域間の空白部とに基づいて、当該表の列及び行の境界を決定することを特徴とする請求項3に記載の表認識装置。
【請求項5】 前記表構造表示手段は、前記表の画像に重ねて、前記解析手段で得られた項の矩形領域および前記境界を表す境界線を表示することを特徴とする請求項4に記載の表認識装置。
【請求項6】 前記表構造表示手段は、前記表の画像の文字列の矩形、項領域の矩形および項の境界線を表示することを特徴とする請求項4に記載の表認識装置。
【請求項7】 情報処理装置による表認識方法であって、
解析手段が、表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析工程と、
表構造表示手段が、前記解析工程によって得られた表構造を表示する表構造表示工程と、
指示手段が、前記表示表構造工程によって表示された表構造に対する、項の領域の修正指示を受け付ける指示工程と、
前記指示工程で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正工程と、
生成手段が、前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成工程とを備えることを特徴とする表認識方法。
【請求項8】 修正表示手段が、前記修正工程によって得られた修正後の表構造を表示する修正表示工程を更に備えることを特徴とする請求項7に記載の表認識方法。
【請求項9】 前記解析工程は、
前記表の画像に含まれる罫線を抽出する罫線抽出工程と、
前記表の画像に含まれる文字を囲む矩形領域を検出し、所定値以下の距離にある矩形領域を統合して項の矩形領域を抽出する項領域抽出工程とを備え、
前記罫線抽出工程と前記項領域抽出工程によって抽出された罫線及び項の矩形領域に基づいて表構造を得ることを特徴とする請求項7に記載の表認識方法。
【請求項10】 前記解析工程は、前記罫線抽出工程で抽出された罫線と、前記項領域抽出工程で抽出された項の矩形領域間の空白部とに基づいて、当該表の列及び行の境界を決定することを特徴とする請求項9に記載の表認識方法。
【請求項11】 前記表構造表示工程は、前記表の画像に重ねて、前記解析工程で得られた項の矩形領域および前記境界を表す境界線を表示することを特徴とする請求項10に記載の表認識方法。
【請求項12】 前記表構造表示工程は、前記表の画像の文字列の矩形、項領域の矩形および項の境界線を表示することを特徴とする請求項10に記載の表認識方法。
【請求項13】 コンピュータに、表の画像情報に基づいて表形式のデータを生成させるための制御プログラムを格納した記憶媒体であって、前記コンピュータを、
表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段による修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段として機能させるための制御プログラムを記憶したことを特徴とするコンピュータ可読記憶媒体。
【0009】
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様による表認識装置は例えば以下の構成を備える。すなわち、
表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段とを備える。
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様による表認識装置は例えば以下の構成を備える。すなわち、
表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段とを備える。
また、上記の目的を達成するための本発明の他の態様による表認識方法は例えば以下の工程を備える。すなわち、
情報処理装置による表認識方法であって、
解析手段が、表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析工程と、
表構造表示手段が、前記解析工程によって得られた表構造を表示する表構造表示工程と、
指示手段が、前記表示表構造工程によって表示された表構造に対する、項の領域の修正指示を受け付ける指示工程と、
前記指示工程で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正工程と、
生成手段が、前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成工程とを備える。
情報処理装置による表認識方法であって、
解析手段が、表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析工程と、
表構造表示手段が、前記解析工程によって得られた表構造を表示する表構造表示工程と、
指示手段が、前記表示表構造工程によって表示された表構造に対する、項の領域の修正指示を受け付ける指示工程と、
前記指示工程で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正工程と、
生成手段が、前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成工程とを備える。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25868198A JP4235286B2 (ja) | 1998-09-11 | 1998-09-11 | 表認識方法及び装置 |
US09/390,208 US6628832B2 (en) | 1998-09-11 | 1999-09-08 | Table recognition method and apparatus, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25868198A JP4235286B2 (ja) | 1998-09-11 | 1998-09-11 | 表認識方法及び装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000090195A JP2000090195A (ja) | 2000-03-31 |
JP2000090195A5 true JP2000090195A5 (ja) | 2007-03-15 |
JP4235286B2 JP4235286B2 (ja) | 2009-03-11 |
Family
ID=17323632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25868198A Expired - Fee Related JP4235286B2 (ja) | 1998-09-11 | 1998-09-11 | 表認識方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6628832B2 (ja) |
JP (1) | JP4235286B2 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3842006B2 (ja) * | 2000-03-30 | 2006-11-08 | グローリー工業株式会社 | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7499602B2 (en) * | 2001-07-12 | 2009-03-03 | International Business Machines Corporation | Efficiency and speed in verification of recognition results |
JP4977368B2 (ja) * | 2005-12-28 | 2012-07-18 | 富士通株式会社 | 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体 |
JP4329764B2 (ja) * | 2006-01-17 | 2009-09-09 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置および罫線抽出プログラム |
JP4424309B2 (ja) * | 2006-01-23 | 2010-03-03 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、文字判定プログラム、および文字判定方法 |
JP4973063B2 (ja) * | 2006-08-14 | 2012-07-11 | 富士通株式会社 | 表データ処理方法及び装置 |
AU2006252019B2 (en) * | 2006-12-13 | 2012-06-28 | Canon Kabushiki Kaisha | Method and Apparatus for Dynamic Connector Analysis |
TWI339362B (en) * | 2007-06-01 | 2011-03-21 | Primax Electronics Ltd | Method of image analysis |
JP4590433B2 (ja) * | 2007-06-29 | 2010-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP4402138B2 (ja) | 2007-06-29 | 2010-01-20 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP5376795B2 (ja) * | 2007-12-12 | 2013-12-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 |
US8438472B2 (en) | 2009-01-02 | 2013-05-07 | Apple Inc. | Efficient data structures for parsing and analyzing a document |
US8335981B2 (en) | 2009-08-03 | 2012-12-18 | Business Objects Software Ltd. | Metadata creation |
JP2011159179A (ja) * | 2010-02-02 | 2011-08-18 | Canon Inc | 画像処理装置及びその処理方法 |
US8433714B2 (en) * | 2010-05-27 | 2013-04-30 | Business Objects Software Ltd. | Data cell cluster identification and table transformation |
JP5676942B2 (ja) | 2010-07-06 | 2015-02-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
JP5249387B2 (ja) | 2010-07-06 | 2013-07-31 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
US8549399B2 (en) | 2011-01-18 | 2013-10-01 | Apple Inc. | Identifying a selection of content in a structured document |
US9898523B2 (en) * | 2013-04-22 | 2018-02-20 | Abb Research Ltd. | Tabular data parsing in document(s) |
JP6202997B2 (ja) * | 2013-11-07 | 2017-09-27 | 株式会社東芝 | 電子機器、方法及びプログラム |
JP6452329B2 (ja) * | 2014-07-07 | 2019-01-16 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP6399872B2 (ja) * | 2014-07-07 | 2018-10-03 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP6489768B2 (ja) * | 2014-07-07 | 2019-03-27 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
US10607381B2 (en) | 2014-07-07 | 2020-03-31 | Canon Kabushiki Kaisha | Information processing apparatus |
JP6430197B2 (ja) * | 2014-09-30 | 2018-11-28 | 株式会社東芝 | 電子機器および方法 |
JP6614914B2 (ja) * | 2015-10-27 | 2019-12-04 | 株式会社東芝 | 画像処理装置、画像処理方法及び画像処理プログラム |
JP6430919B2 (ja) * | 2015-11-27 | 2018-11-28 | 日本電信電話株式会社 | 罫線枠補正方法、罫線枠補正装置および罫線枠補正プログラム |
JP6856321B2 (ja) | 2016-03-29 | 2021-04-07 | 株式会社東芝 | 画像処理システム、画像処理装置、および画像処理プログラム |
JP6680052B2 (ja) * | 2016-04-06 | 2020-04-15 | コニカミノルタ株式会社 | 表データ変換方法、プログラム、画像読取装置 |
CN111079756B (zh) * | 2018-10-19 | 2023-09-19 | 杭州萤石软件有限公司 | 一种单据图像中的表格提取与重建方法和设备 |
CN110956087B (zh) * | 2019-10-25 | 2024-04-19 | 北京懿医云科技有限公司 | 一种图片中表格的识别方法、装置、可读介质和电子设备 |
JP2021114211A (ja) | 2020-01-21 | 2021-08-05 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
CN111325110B (zh) * | 2020-01-22 | 2024-04-05 | 平安科技(深圳)有限公司 | 基于ocr的表格版式恢复方法、装置及存储介质 |
CN112712014B (zh) * | 2020-12-29 | 2024-04-30 | 平安健康保险股份有限公司 | 表格图片结构解析方法、系统、设备和可读存储介质 |
CN114359938B (zh) * | 2022-01-07 | 2023-09-29 | 北京有竹居网络技术有限公司 | 一种表格识别方法及装置 |
WO2023188362A1 (ja) * | 2022-03-31 | 2023-10-05 | 三菱電機株式会社 | 表画像認識装置、プログラム及び表画像認識方法 |
CN114724154B (zh) * | 2022-04-18 | 2024-03-29 | 中国科学技术大学 | 表格识别方法及装置、存储介质及电子设备 |
CN116071771A (zh) * | 2023-03-24 | 2023-05-05 | 南京燧坤智能科技有限公司 | 表格重构方法、装置、非易失性存储介质及电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5191612A (en) * | 1990-03-13 | 1993-03-02 | Fujitsu Limited | Character recognition system |
JP2789971B2 (ja) * | 1992-10-27 | 1998-08-27 | 富士ゼロックス株式会社 | 表認識装置 |
-
1998
- 1998-09-11 JP JP25868198A patent/JP4235286B2/ja not_active Expired - Fee Related
-
1999
- 1999-09-08 US US09/390,208 patent/US6628832B2/en not_active Expired - Lifetime
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000090195A5 (ja) | ||
JP4235286B2 (ja) | 表認識方法及び装置 | |
CA2429507A1 (en) | Writing guide for a free-form document editor | |
JPH11102414A (ja) | ヒートマップを用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを発見するための一連の命令を記録したコンピュータ読み取り可能な記録媒体 | |
JP4423076B2 (ja) | 認識対象切出し装置および方法 | |
US8341546B2 (en) | Method for visualizing a change caused by scrolling in a scrolling direction of a section of a text and/or graphic displayed on an optical display means | |
CN113191309A (zh) | 一种手写汉字的识别、评分、纠错方法及系统 | |
JP2009294848A (ja) | 情報表示装置及びプログラム | |
JP5483467B2 (ja) | 帳票読取装置、角印検出方法、および、角印検出プログラム | |
JP6080586B2 (ja) | 文字認識システム、文字認識プログラム及び文字認識方法 | |
US6975333B2 (en) | Information processing method and apparatus and medium | |
JP6390858B2 (ja) | グラフィックエレメントおよびテキストエレメントを含む2つのデータの比較装置および比較方法 | |
JP2006171851A (ja) | 文書ファイル解析システム、文書ファイル解析方法及びプログラム | |
JPS62159291A (ja) | 文章入力装置 | |
JP4087911B2 (ja) | 罫線作成装置および罫線作成方法 | |
JP2007058819A (ja) | 索引情報生成装置 | |
JP2006040263A5 (ja) | ||
CN113112573B (zh) | 基于标记语言的图片生成方法、装置和电子设备 | |
JPS61169877A (ja) | 漢字学習装置 | |
JP2000231556A5 (ja) | ||
JPH06236372A (ja) | 文字表示装置 | |
JP4548062B2 (ja) | 画像処理装置 | |
JP2504471B2 (ja) | 文章編集装置 | |
JPS61261767A (ja) | 漢字学習装置 | |
JP3100825B2 (ja) | 線認識方法 |