JP5051174B2 - 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム - Google Patents
帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム Download PDFInfo
- Publication number
- JP5051174B2 JP5051174B2 JP2009114581A JP2009114581A JP5051174B2 JP 5051174 B2 JP5051174 B2 JP 5051174B2 JP 2009114581 A JP2009114581 A JP 2009114581A JP 2009114581 A JP2009114581 A JP 2009114581A JP 5051174 B2 JP5051174 B2 JP 5051174B2
- Authority
- JP
- Japan
- Prior art keywords
- common
- cell
- information
- image
- ruled line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Description
なお、式(1)によって重なり度を算出する場合、重なり度の最大値は1.0である。重なり度が閾値を超える場合、比較対象の罫線はマスク画像の罫線と重なっていると判定される。重なり度に対する閾値は、実験等に基づいて適切な値を選択すればよい。
(付記1)
同一種類として指定された複数の帳票の雛形画像のそれぞれより帳票の特徴を示す特徴情報を抽出する特徴抽出手段と、
前記雛形画像ごとに抽出された前記特徴情報に基づいて、複数の前記雛形画像に共通の罫線によって形成される共通セルの特徴を示す共通情報を生成する共通情報生成手段と、
前記各共通セルについて、前記共通セル情報とそれぞれの各雛形画像の特徴情報とに基づいて、前記各雛形画像において当該共通セルと対応するセルの中で当該共通セルとは異なる特徴を有するセルが存在する場合に当該共通セルの領域を帳票の識別における無視領域と判定する無視領域判定手段と、
前記共通情報と前記無視領域を示す情報とを含むデータを帳票を識別するための辞書データとして生成する辞書生成手段とを有する帳票辞書生成装置。
(付記2)
複数の前記雛形画像を表示手段に表示させ、同一種類とする雛形画像の選択を受け付ける同一種類指定受付手段を有する付記1記載の帳票辞書生成装置。
(付記3)
前記無視領域判定手段は、前記共通セルと対応するセルが該共通セルとは異なる罫線又は文字列を含むか否かによって当該対応するセルが当該共通セルとは異なる特徴を有するか否かを判定する付記1又は2記載の帳票辞書生成装置。
(付記4)
帳票の種類の識別対象とする帳票画像の入力を受け付ける帳票画像入力手段と、
前記帳票画像より帳票の特徴を示す特徴情報を抽出する特徴抽出手段と、
付記1乃至3いずれか一項記載の帳票辞書生成装置によって生成された前記辞書データに含まれる前記無視領域を示す情報に基づいて該無視領域を無視して該辞書データに含まれる前記共通情報と前記帳票画像の前記特徴情報とを照合する帳票識別手段とを有する帳票識別装置。
(付記5)
コンピュータが実行する帳票辞書生成方法であって、
同一種類として指定された複数の帳票の雛形画像のそれぞれより帳票の特徴を示す特徴情報を抽出する特徴抽出手順と、
前記雛形画像ごとに抽出された前記特徴情報に基づいて、複数の前記雛形画像に共通の罫線によって形成される共通セルの特徴を示す共通情報を生成する共通情報生成手順と、
前記各共通セルについて、前記共通セル情報とそれぞれの各雛形画像の特徴情報とに基づいて、前記各雛形画像において当該共通セルと対応するセルの中で当該共通セルとは異なる特徴を有するセルが存在する場合に当該共通セルの領域を帳票の識別における無視領域と判定する無視領域判定手順と、
前記共通情報と前記無視領域を示す情報とを含むデータを帳票を識別するための辞書データとして生成する辞書生成手順とを有する帳票辞書生成方法。
(付記6)
複数の前記雛形画像を表示手段に表示させ、同一種類とする雛形画像の選択を受け付ける同一種類指定受付手順を有する付記5記載の帳票辞書生成方法。
(付記7)
前記無視領域判定手順は、前記共通セルと対応するセルが該共通セルとは異なる罫線又は文字列を含むか否かによって当該対応するセルが当該共通セルとは異なる特徴を有するか否かを判定する付記5又は6記載の帳票辞書生成方法。
(付記8)
コンピュータが実行する帳票識別方法であって、
帳票の種類の識別対象とする帳票画像の入力を受け付ける帳票画像入力手順と、
前記帳票画像より帳票の特徴を示す特徴情報を抽出する特徴抽出手順と、
付記5乃至7いずれか一項記載の帳票辞書生成方法によって生成された前記辞書データに含まれる前記無視領域を示す情報に基づいて該無視領域を無視して該辞書データに含まれる前記共通情報と前記帳票画像の前記特徴情報とを照合する帳票識別手順とを有する帳票識別方法。
(付記9)
コンピュータに、
同一種類として指定された複数の帳票の雛形画像のそれぞれより帳票の特徴を示す特徴情報を抽出する特徴抽出手順と、
前記雛形画像ごとに抽出された前記特徴情報に基づいて、複数の前記雛形画像に共通の罫線によって形成される共通セルの特徴を示す共通情報を生成する共通情報生成手順と、
前記各共通セルについて、前記共通セル情報とそれぞれの各雛形画像の特徴情報とに基づいて、前記各雛形画像において当該共通セルと対応するセルの中で当該共通セルとは異なる特徴を有するセルが存在する場合に当該共通セルの領域を帳票の識別における無視領域と判定する無視領域判定手順と、
前記共通情報と前記無視領域を示す情報とを含むデータを帳票を識別するための辞書データとして生成する辞書生成手順とを実行させるためのプログラム。
(付記10)
複数の前記雛形画像を表示手段に表示させ、同一種類とする雛形画像の選択を受け付ける同一種類指定受付手順を有する付記9記載のプログラム。
(付記11)
前記無視領域判定手順は、前記共通セルと対応するセルが該共通セルとは異なる罫線又は文字列を含むか否かによって当該対応するセルが当該共通セルとは異なる特徴を有するか否かを判定する付記9又は10記載のプログラム。
(付記12)
コンピュータに、
帳票の種類の識別対象とする帳票画像の入力を受け付ける帳票画像入力手順と、
前記帳票画像より帳票の特徴を示す特徴情報を抽出する特徴抽出手順と、
付記9乃至11いずれか一項記載のプログラムによって生成された前記辞書データに含まれる前記無視領域を示す情報に基づいて該無視領域を無視して該辞書データに含まれる前記共通情報と前記帳票画像の前記特徴情報とを照合する帳票識別手順とを実行させるためのプログラム。
11 帳票入力部
12 グループ指定受付部
13 特徴抽出部
14 辞書生成部
20 帳票識別装置
21 帳票入力部
22 特徴抽出部
23 帳票識別部
50 辞書データ
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 表示装置
106 入力装置
107 スキャナ
131 罫線抽出部
132 セル情報抽出部
133 セル内文字認識部
141 共通情報生成部
142 無視領判定部
143 共通画像生成部
144 辞書出力部
221 罫線抽出部
222 セル情報抽出部
223 セル内文字認識部
B バス
Claims (6)
- 同一種類として指定された複数の帳票の雛形画像のそれぞれより帳票の特徴を示す特徴情報を抽出する特徴抽出手段と、
前記雛形画像ごとに抽出された前記特徴情報に基づいて、複数の前記雛形画像に共通の罫線によって形成される共通セルの特徴を示す共通情報を生成する共通情報生成手段と、
前記各共通セルについて、前記共通セル情報とそれぞれの各雛形画像の特徴情報とに基づいて、前記各雛形画像において当該共通セルと対応するセルの中で当該共通セルとは異なる特徴を有するセルが存在する場合に当該共通セルの領域を帳票の識別における無視領域と判定する無視領域判定手段と、
前記共通情報と前記無視領域を示す情報とを含むデータを帳票を識別するための辞書データとして生成する辞書生成手段とを有する帳票辞書生成装置。 - 複数の前記雛形画像を表示手段に表示させ、同一種類とする雛形画像の選択を受け付ける同一種類指定受付手段を有する請求項1記載の帳票辞書生成装置。
- 前記無視領域判定手段は、前記共通セルと対応するセルが該共通セルとは異なる罫線又は文字列を含むか否かによって当該対応するセルが当該共通セルとは異なる特徴を有するか否かを判定する請求項1又は2記載の帳票辞書生成装置。
- 帳票の種類の識別対象とする帳票画像の入力を受け付ける帳票画像入力手段と、
前記帳票画像より帳票の特徴を示す特徴情報を抽出する特徴抽出手段と、
請求項1乃至3いずれか一項記載の帳票辞書生成装置によって生成された前記辞書データに含まれる前記無視領域を示す情報に基づいて該無視領域を無視して該辞書データに含まれる前記共通情報と前記帳票画像の前記特徴情報とを照合する帳票識別手段とを有する帳票識別装置。 - コンピュータが実行する帳票辞書生成方法であって、
同一種類として指定された複数の帳票の雛形画像のそれぞれより帳票の特徴を示す特徴情報を抽出する特徴抽出手順と、
前記雛形画像ごとに抽出された前記特徴情報に基づいて、複数の前記雛形画像に共通の罫線によって形成される共通セルの特徴を示す共通情報を生成する共通情報生成手順と、
前記各共通セルについて、前記共通セル情報とそれぞれの各雛形画像の特徴情報とに基づいて、前記各雛形画像において当該共通セルと対応するセルの中で当該共通セルとは異なる特徴を有するセルが存在する場合に当該共通セルの領域を帳票の識別における無視領域と判定する無視領域判定手順と、
前記共通情報と前記無視領域を示す情報とを含むデータを帳票を識別するための辞書データとして生成する辞書生成手順とを有する帳票辞書生成方法。 - コンピュータに、
同一種類として指定された複数の帳票の雛形画像のそれぞれより帳票の特徴を示す特徴情報を抽出する特徴抽出手順と、
前記雛形画像ごとに抽出された前記特徴情報に基づいて、複数の前記雛形画像に共通の罫線によって形成される共通セルの特徴を示す共通情報を生成する共通情報生成手順と、
前記各共通セルについて、前記共通セル情報とそれぞれの各雛形画像の特徴情報とに基づいて、前記各雛形画像において当該共通セルと対応するセルの中で当該共通セルとは異なる特徴を有するセルが存在する場合に当該共通セルの領域を帳票の識別における無視領域と判定する無視領域判定手順と、
前記共通情報と前記無視領域を示す情報とを含むデータを帳票を識別するための辞書データとして生成する辞書生成手順とを実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009114581A JP5051174B2 (ja) | 2009-05-11 | 2009-05-11 | 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009114581A JP5051174B2 (ja) | 2009-05-11 | 2009-05-11 | 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010262578A JP2010262578A (ja) | 2010-11-18 |
JP5051174B2 true JP5051174B2 (ja) | 2012-10-17 |
Family
ID=43360571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009114581A Expired - Fee Related JP5051174B2 (ja) | 2009-05-11 | 2009-05-11 | 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5051174B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6814178B2 (ja) * | 2018-06-11 | 2021-01-13 | 日本電信電話株式会社 | 物体検出装置、方法、及びプログラム |
US11853844B2 (en) | 2020-04-28 | 2023-12-26 | Pfu Limited | Information processing apparatus, image orientation determination method, and medium |
-
2009
- 2009-05-11 JP JP2009114581A patent/JP5051174B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010262578A (ja) | 2010-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5139716B2 (ja) | 画像検索装置及び画像検索方法 | |
US9613267B2 (en) | Method and system of extracting label:value data from a document | |
EP1971957B1 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
WO2000052645A1 (fr) | Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document | |
US20070168382A1 (en) | Document analysis system for integration of paper records into a searchable electronic database | |
JP2749020B2 (ja) | ダイアグラム認識システム | |
JP3602596B2 (ja) | ドキュメントファイリング装置および方法 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
JP6831951B2 (ja) | 画像認識システム | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
CN111340020A (zh) | 一种公式识别方法、装置、设备及存储介质 | |
US20080037904A1 (en) | Apparatus, method and program storage medium for image interpretation | |
CN115828874A (zh) | 基于图像识别技术的行业表格数字化处理方法 | |
CN113806472A (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
JP5094682B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
CN114529933A (zh) | 一种合同数据差异性的比对方法、装置、设备和介质 | |
WO2014068770A1 (ja) | データ抽出方法、データ抽出装置及びそのプログラム | |
JP5051174B2 (ja) | 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム | |
JP5147640B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP4935459B2 (ja) | 文字認識方法、文字認識プログラムおよび文字認識装置 | |
Shtok et al. | CHARTER: heatmap-based multi-type chart data extraction | |
JP3898645B2 (ja) | 帳票書式編集装置および帳票書式編集プログラム | |
JP2021140831A (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム | |
JP2001034763A (ja) | 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120614 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120709 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150803 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |