JP2000090195A5 - - Google Patents

Download PDF

Info

Publication number
JP2000090195A5
JP2000090195A5 JP1998258681A JP25868198A JP2000090195A5 JP 2000090195 A5 JP2000090195 A5 JP 2000090195A5 JP 1998258681 A JP1998258681 A JP 1998258681A JP 25868198 A JP25868198 A JP 25868198A JP 2000090195 A5 JP2000090195 A5 JP 2000090195A5
Authority
JP
Japan
Prior art keywords
table structure
term
area
analysis
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1998258681A
Other languages
English (en)
Other versions
JP2000090195A (ja
JP4235286B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP25868198A priority Critical patent/JP4235286B2/ja
Priority claimed from JP25868198A external-priority patent/JP4235286B2/ja
Priority to US09/390,208 priority patent/US6628832B2/en
Publication of JP2000090195A publication Critical patent/JP2000090195A/ja
Publication of JP2000090195A5 publication Critical patent/JP2000090195A5/ja
Application granted granted Critical
Publication of JP4235286B2 publication Critical patent/JP4235286B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【特許請求の範囲】
【請求項1】 表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段とを備えることを特徴とする表認識装置。
【請求項2】 前記修正手段によって得られた修正後の表構造を表示する修正表示手段を更に備えることを特徴とする請求項1に記載の表認識装置。
【請求項3】 前記解析手段は、
前記表の画像に含まれる罫線を抽出する罫線抽出手段と、
前記表の画像に含まれる文字を囲む矩形領域を検出し、所定値以下の距離にある矩形領域を統合して項の矩形領域を抽出する項領域抽出手段とを備え、
前記罫線抽出手段と前記項領域抽出手段によって抽出された罫線及び項の矩形領域に基づいて表構造を得ることを特徴とする請求項1に記載の表認識装置。
【請求項4】 前記解析手段は、前記罫線抽出手段で抽出された罫線と、前記項領域抽出手段で抽出された項の矩形領域間の空白部とに基づいて、当該表の列及び行の境界を決定することを特徴とする請求項3に記載の表認識装置。
【請求項5】 前記表構造表示手段は、前記表の画像に重ねて、前記解析手段で得られた項の矩形領域および前記境界を表す境界線を表示することを特徴とする請求項4に記載の表認識装置。
【請求項6】 前記表構造表示手段は、前記表の画像の文字列の矩形、項領域の矩形および項の境界線を表示することを特徴とする請求項4に記載の表認識装置。
【請求項7】 情報処理装置による表認識方法であって、
解析手段が、表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析工程と、
表構造表示手段が、前記解析工程によって得られた表構造を表示する表構造表示工程と、
指示手段が、前記表示表構造工程によって表示された表構造に対する、項の領域の修正指示を受け付ける指示工程と、
前記指示工程で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正工程と、
生成手段が、前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成工程とを備えることを特徴とする表認識方法。
【請求項8】 修正表示手段が、前記修正工程によって得られた修正後の表構造を表示する修正表示工程を更に備えることを特徴とする請求項7に記載の表認識方法。
【請求項9】 前記解析工程は、
前記表の画像に含まれる罫線を抽出する罫線抽出工程と、
前記表の画像に含まれる文字を囲む矩形領域を検出し、所定値以下の距離にある矩形領域を統合して項の矩形領域を抽出する項領域抽出工程とを備え、
前記罫線抽出工程と前記項領域抽出工程によって抽出された罫線及び項の矩形領域に基づいて表構造を得ることを特徴とする請求項7に記載の表認識方法。
【請求項10】 前記解析工程は、前記罫線抽出工程で抽出された罫線と、前記項領域抽出工程で抽出された項の矩形領域間の空白部とに基づいて、当該表の列及び行の境界を決定することを特徴とする請求項9に記載の表認識方法。
【請求項11】 前記表構造表示工程は、前記表の画像に重ねて、前記解析工程で得られた項の矩形領域および前記境界を表す境界線を表示することを特徴とする請求項10に記載の表認識方法。
【請求項12】 前記表構造表示工程は、前記表の画像の文字列の矩形、項領域の矩形および項の境界線を表示することを特徴とする請求項10に記載の表認識方法。
【請求項13】 コンピュータに、表の画像情報に基づいて表形式のデータを生成させるための制御プログラムを格納した記憶媒体であって、前記コンピュータを、
表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段による修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段として機能させるための制御プログラムを記憶したことを特徴とするコンピュータ可読記憶媒体。
【0009】
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様による表認識装置は例えば以下の構成を備える。すなわち、
表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析手段と、
前記解析手段によって得られた表構造を表示する表構造表示手段と、
前記表構造表示手段によって表示された表構造に対する、項の領域の修正指示を受け付ける指示手段と、
前記指示手段で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正手段と、
前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成手段とを備える。
また、上記の目的を達成するための本発明の他の態様による表認識方法は例えば以下の工程を備える。すなわち、
情報処理装置による表認識方法であって、
解析手段が、表の画像に含まれる罫線と文字列の配置状態に基づいて、該表における各項の領域とその位置を解析して表構造を得る解析工程と、
表構造表示手段が、前記解析工程によって得られた表構造を表示する表構造表示工程と、
指示手段が、前記表示表構造工程によって表示された表構造に対する、項の領域の修正指示を受け付ける指示工程と、
前記指示工程で受け付けた修正指示に基づいて、項の領域と位置を修正して修正後の表構造を得る修正工程と、
生成手段が、前記修正後の表構造における各項について文字認識を行い、その認識結果と該表構造に基づいて表形式データを生成する生成工程とを備える。
JP25868198A 1998-09-11 1998-09-11 表認識方法及び装置 Expired - Fee Related JP4235286B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP25868198A JP4235286B2 (ja) 1998-09-11 1998-09-11 表認識方法及び装置
US09/390,208 US6628832B2 (en) 1998-09-11 1999-09-08 Table recognition method and apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25868198A JP4235286B2 (ja) 1998-09-11 1998-09-11 表認識方法及び装置

Publications (3)

Publication Number Publication Date
JP2000090195A JP2000090195A (ja) 2000-03-31
JP2000090195A5 true JP2000090195A5 (ja) 2007-03-15
JP4235286B2 JP4235286B2 (ja) 2009-03-11

Family

ID=17323632

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25868198A Expired - Fee Related JP4235286B2 (ja) 1998-09-11 1998-09-11 表認識方法及び装置

Country Status (2)

Country Link
US (1) US6628832B2 (ja)
JP (1) JP4235286B2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3842006B2 (ja) * 2000-03-30 2006-11-08 グローリー工業株式会社 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7499602B2 (en) * 2001-07-12 2009-03-03 International Business Machines Corporation Efficiency and speed in verification of recognition results
JP4977368B2 (ja) * 2005-12-28 2012-07-18 富士通株式会社 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
JP4329764B2 (ja) * 2006-01-17 2009-09-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および罫線抽出プログラム
JP4424309B2 (ja) * 2006-01-23 2010-03-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字判定プログラム、および文字判定方法
JP4973063B2 (ja) * 2006-08-14 2012-07-11 富士通株式会社 表データ処理方法及び装置
AU2006252019B2 (en) * 2006-12-13 2012-06-28 Canon Kabushiki Kaisha Method and Apparatus for Dynamic Connector Analysis
TWI339362B (en) * 2007-06-01 2011-03-21 Primax Electronics Ltd Method of image analysis
JP4590433B2 (ja) * 2007-06-29 2010-12-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP4402138B2 (ja) 2007-06-29 2010-01-20 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5376795B2 (ja) * 2007-12-12 2013-12-25 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
US8438472B2 (en) 2009-01-02 2013-05-07 Apple Inc. Efficient data structures for parsing and analyzing a document
US8335981B2 (en) 2009-08-03 2012-12-18 Business Objects Software Ltd. Metadata creation
JP2011159179A (ja) * 2010-02-02 2011-08-18 Canon Inc 画像処理装置及びその処理方法
US8433714B2 (en) * 2010-05-27 2013-04-30 Business Objects Software Ltd. Data cell cluster identification and table transformation
JP5676942B2 (ja) 2010-07-06 2015-02-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP5249387B2 (ja) 2010-07-06 2013-07-31 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US8549399B2 (en) 2011-01-18 2013-10-01 Apple Inc. Identifying a selection of content in a structured document
US9898523B2 (en) * 2013-04-22 2018-02-20 Abb Research Ltd. Tabular data parsing in document(s)
JP6202997B2 (ja) * 2013-11-07 2017-09-27 株式会社東芝 電子機器、方法及びプログラム
JP6452329B2 (ja) * 2014-07-07 2019-01-16 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP6399872B2 (ja) * 2014-07-07 2018-10-03 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP6489768B2 (ja) * 2014-07-07 2019-03-27 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
US10607381B2 (en) 2014-07-07 2020-03-31 Canon Kabushiki Kaisha Information processing apparatus
JP6430197B2 (ja) * 2014-09-30 2018-11-28 株式会社東芝 電子機器および方法
JP6614914B2 (ja) * 2015-10-27 2019-12-04 株式会社東芝 画像処理装置、画像処理方法及び画像処理プログラム
JP6430919B2 (ja) * 2015-11-27 2018-11-28 日本電信電話株式会社 罫線枠補正方法、罫線枠補正装置および罫線枠補正プログラム
JP6856321B2 (ja) 2016-03-29 2021-04-07 株式会社東芝 画像処理システム、画像処理装置、および画像処理プログラム
JP6680052B2 (ja) * 2016-04-06 2020-04-15 コニカミノルタ株式会社 表データ変換方法、プログラム、画像読取装置
CN111079756B (zh) * 2018-10-19 2023-09-19 杭州萤石软件有限公司 一种单据图像中的表格提取与重建方法和设备
CN110956087B (zh) * 2019-10-25 2024-04-19 北京懿医云科技有限公司 一种图片中表格的识别方法、装置、可读介质和电子设备
JP2021114211A (ja) 2020-01-21 2021-08-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN111325110B (zh) * 2020-01-22 2024-04-05 平安科技(深圳)有限公司 基于ocr的表格版式恢复方法、装置及存储介质
CN112712014B (zh) * 2020-12-29 2024-04-30 平安健康保险股份有限公司 表格图片结构解析方法、系统、设备和可读存储介质
CN114359938B (zh) * 2022-01-07 2023-09-29 北京有竹居网络技术有限公司 一种表格识别方法及装置
WO2023188362A1 (ja) * 2022-03-31 2023-10-05 三菱電機株式会社 表画像認識装置、プログラム及び表画像認識方法
CN114724154B (zh) * 2022-04-18 2024-03-29 中国科学技术大学 表格识别方法及装置、存储介质及电子设备
CN116071771A (zh) * 2023-03-24 2023-05-05 南京燧坤智能科技有限公司 表格重构方法、装置、非易失性存储介质及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5191612A (en) * 1990-03-13 1993-03-02 Fujitsu Limited Character recognition system
JP2789971B2 (ja) * 1992-10-27 1998-08-27 富士ゼロックス株式会社 表認識装置

Similar Documents

Publication Publication Date Title
JP2000090195A5 (ja)
JP4235286B2 (ja) 表認識方法及び装置
CA2429507A1 (en) Writing guide for a free-form document editor
JPH11102414A (ja) ヒートマップを用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを発見するための一連の命令を記録したコンピュータ読み取り可能な記録媒体
JP4423076B2 (ja) 認識対象切出し装置および方法
US8341546B2 (en) Method for visualizing a change caused by scrolling in a scrolling direction of a section of a text and/or graphic displayed on an optical display means
CN113191309A (zh) 一种手写汉字的识别、评分、纠错方法及系统
JP2009294848A (ja) 情報表示装置及びプログラム
JP5483467B2 (ja) 帳票読取装置、角印検出方法、および、角印検出プログラム
JP6080586B2 (ja) 文字認識システム、文字認識プログラム及び文字認識方法
US6975333B2 (en) Information processing method and apparatus and medium
JP6390858B2 (ja) グラフィックエレメントおよびテキストエレメントを含む2つのデータの比較装置および比較方法
JP2006171851A (ja) 文書ファイル解析システム、文書ファイル解析方法及びプログラム
JPS62159291A (ja) 文章入力装置
JP4087911B2 (ja) 罫線作成装置および罫線作成方法
JP2007058819A (ja) 索引情報生成装置
JP2006040263A5 (ja)
CN113112573B (zh) 基于标记语言的图片生成方法、装置和电子设备
JPS61169877A (ja) 漢字学習装置
JP2000231556A5 (ja)
JPH06236372A (ja) 文字表示装置
JP4548062B2 (ja) 画像処理装置
JP2504471B2 (ja) 文章編集装置
JPS61261767A (ja) 漢字学習装置
JP3100825B2 (ja) 線認識方法