JP7026386B2 - 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム - Google Patents
帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム Download PDFInfo
- Publication number
- JP7026386B2 JP7026386B2 JP2018157003A JP2018157003A JP7026386B2 JP 7026386 B2 JP7026386 B2 JP 7026386B2 JP 2018157003 A JP2018157003 A JP 2018157003A JP 2018157003 A JP2018157003 A JP 2018157003A JP 7026386 B2 JP7026386 B2 JP 7026386B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- form image
- query
- character recognition
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
そのクエリ条件は、クエリタイプとして、検索用部分画像に対応する所定個数の部分画像を帳票画像において検出させる第1クエリタイプおよび検索用部分画像に対応するすべての部分画像を帳票画像において検出させる第2クエリタイプのいずれかを有し、部分画像検索部は、(a)帳票画像において、部分画像と同一サイズの注目領域を1画素ずつ移動させていき、各位置での帳票画像の注目領域と検索用部分画像との類似度を計算し、(b1)クエリ条件のクエリタイプが第1クエリタイプである場合には、類似度が最も大きいほうから所定個数の部分画像を検出し、(b2)クエリ条件のクエリタイプが第2クエリタイプである場合には、類似度が所定閾値を超えている部分画像をすべて検出する。
そのクエリ条件は、クエリタイプとして、検索用部分画像に対応する所定個数の部分画像を帳票画像において検出させる第1クエリタイプおよび検索用部分画像に対応するすべての部分画像を帳票画像において検出させる第2クエリタイプのいずれかを有し、部分画像検索ステップでは、コンピューターによって、(a)帳票画像において、部分画像と同一サイズの注目領域を1画素ずつ移動させていき、各位置での帳票画像の注目領域と検索用部分画像との類似度を計算し、(b1)クエリ条件のクエリタイプが第1クエリタイプである場合には、類似度が最も大きいほうから所定個数の部分画像を検出し、(b2)クエリ条件のクエリタイプが第2クエリタイプである場合には、類似度が所定閾値を超えている部分画像をすべて検出する。
11 帳票画像処理プログラム
21 テンプレートデータ生成部
42 対象帳票画像取得部
43 部分画像検索部
44 文字認識処理部
45 表データ生成部
Claims (6)
- 処理対象となる帳票画像を取得する対象帳票画像取得部と、
1または複数のクエリ条件を含むテンプレートデータに基づいて、前記クエリ条件により指定された検索用部分画像を前記帳票画像内で検索し、前記検索用部分画像に対応する部分画像を前記帳票画像において検出する部分画像検索部と、
前記テンプレートデータに基づいて、前記帳票画像内で検出された前記部分画像における、前記クエリ条件により指定された文字認識領域に対して文字認識処理を実行する文字認識処理部と、
を備え、
前記クエリ条件は、クエリタイプとして、前記検索用部分画像に対応する所定個数の部分画像を前記帳票画像において検出させる第1クエリタイプおよび前記検索用部分画像に対応するすべての部分画像を前記帳票画像において検出させる第2クエリタイプのいずれかを有し、
前記部分画像検索部は、(a)前記帳票画像において、前記部分画像と同一サイズの注目領域を1画素ずつ移動させていき、各位置での前記帳票画像の前記注目領域と前記検索用部分画像との類似度を計算し、(b1)前記クエリ条件のクエリタイプが前記第1クエリタイプである場合には、前記類似度が最も大きいほうから前記所定個数の前記部分画像を検出し、(b2)前記クエリ条件のクエリタイプが前記第2クエリタイプである場合には、前記類似度が所定閾値を超えている前記部分画像をすべて検出すること、
を特徴とする帳票画像処理システム。 - 前記テンプレートデータを生成するテンプレートデータ生成部をさらに備え、
前記テンプレートデータ生成部は、(a)サンプル帳票画像において、ユーザー操作で指定されたクエリ領域および前記クエリ領域内の前記文字認識領域を特定し、(b)前記サンプル帳票画像における前記クエリ領域の画像を前記検索用部分画像として抽出し、(c)前記検索用部分画像および前記文字認識領域を示す前記クエリ条件を生成すること、
を特徴とする請求項1記載の帳票画像処理システム。 - 前記文字認識処理で得られたテキストデータを有する表データを生成する表データ生成部をさらに備え、
前記テンプレートデータは、前記文字認識領域に関連付けてカラム属性を有し、
前記表データ生成部は、(a)1つの文字認識領域に対応して前記文字認識処理で得られたテキストデータを1つのカラムとし、(b)前記1つの文字認識領域に関連付けられている前記カラム属性に基づいて前記1つのカラムの見出しを設定し、(c)複数の前記クエリ条件の前記文字認識領域に対応して同一の見出しの複数のカラムがある場合には、前記複数のカラムを1つのカラムに統合すること、
を特徴とする請求項1記載の帳票画像処理システム。 - 前記テンプレートデータ生成部は、(a)前記サンプル帳票画像の解像度を所定の解像度に低下させ、(b)前記所定の解像度に低下させた前記サンプル帳票画像における前記クエリ領域の画像を前記検索用部分画像として抽出し、
前記部分画像検索部は、(c)前記帳票画像をデフォルト解像度から前記所定の解像度に低下させ、(d)前記所定の解像度に低下させた前記帳票画像内で前記検索用部分画像を検索し、前記検索用部分画像に対応する部分画像を、前記所定の解像度に低下させた前記帳票画像において検出し、
前記文字認識処理部は、前記テンプレートデータに基づいて、前記部分画像における前記文字認識領域を特定し、前記デフォルト解像度での前記文字認識領域に対して文字認識処理を実行すること、
を特徴とする請求項2記載の帳票画像処理システム。 - コンピューターによって、処理対象となる帳票画像を取得するステップと、
前記コンピューターによって、1または複数のクエリ条件を含むテンプレートデータに基づいて、前記クエリ条件により指定された検索用部分画像を前記帳票画像内で検索し、前記検索用部分画像に対応する部分画像を前記帳票画像において検出する部分画像検索ステップと、
前記コンピューターによって、前記テンプレートデータに基づいて、前記帳票画像内で検出された前記部分画像における、前記クエリ条件により指定された文字認識領域に対して文字認識処理を実行するステップと、
を備え、
前記クエリ条件は、クエリタイプとして、前記検索用部分画像に対応する所定個数の部分画像を前記帳票画像において検出させる第1クエリタイプおよび前記検索用部分画像に対応するすべての部分画像を前記帳票画像において検出させる第2クエリタイプのいずれかを有し、
前記部分画像検索ステップでは、前記コンピューターによって、(a)前記帳票画像において、前記部分画像と同一サイズの注目領域を1画素ずつ移動させていき、各位置での前記帳票画像の前記注目領域と前記検索用部分画像との類似度を計算し、(b1)前記クエリ条件のクエリタイプが前記第1クエリタイプである場合には、前記類似度が最も大きいほうから前記所定個数の前記部分画像を検出し、(b2)前記クエリ条件のクエリタイプが前記第2クエリタイプである場合には、前記類似度が所定閾値を超えている前記部分画像をすべて検出すること、
を特徴とする帳票画像処理方法。 - コンピューターを、
処理対象となる帳票画像を取得する対象帳票画像取得部、
1または複数のクエリ条件を含むテンプレートデータに基づいて、前記クエリ条件により指定された検索用部分画像を前記帳票画像内で検索し、前記検索用部分画像に対応する部分画像を前記帳票画像において検出する部分画像検索部、および
前記テンプレートデータに基づいて、前記帳票画像内で検出された前記部分画像における、前記クエリ条件により指定された文字認識領域に対して文字認識処理を実行する文字認識処理部
として機能させ、
前記クエリ条件は、クエリタイプとして、前記検索用部分画像に対応する所定個数の部分画像を前記帳票画像において検出させる第1クエリタイプおよび前記検索用部分画像に対応するすべての部分画像を前記帳票画像において検出させる第2クエリタイプのいずれかを有し、
前記部分画像検索部は、(a)前記帳票画像において、前記部分画像と同一サイズの注目領域を1画素ずつ移動させていき、各位置での前記帳票画像の前記注目領域と前記検索用部分画像との類似度を計算し、(b1)前記クエリ条件のクエリタイプが前記第1クエリタイプである場合には、前記類似度が最も大きいほうから前記所定個数の前記部分画像を検出し、(b2)前記クエリ条件のクエリタイプが前記第2クエリタイプである場合には、前記類似度が所定閾値を超えている前記部分画像をすべて検出すること、
を特徴とする帳票画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018157003A JP7026386B2 (ja) | 2018-08-24 | 2018-08-24 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
JP2021100886A JP2021140831A (ja) | 2018-08-24 | 2021-06-17 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018157003A JP7026386B2 (ja) | 2018-08-24 | 2018-08-24 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021100886A Division JP2021140831A (ja) | 2018-08-24 | 2021-06-17 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020030722A JP2020030722A (ja) | 2020-02-27 |
JP7026386B2 true JP7026386B2 (ja) | 2022-02-28 |
Family
ID=69622614
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018157003A Active JP7026386B2 (ja) | 2018-08-24 | 2018-08-24 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
JP2021100886A Pending JP2021140831A (ja) | 2018-08-24 | 2021-06-17 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021100886A Pending JP2021140831A (ja) | 2018-08-24 | 2021-06-17 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7026386B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733518A (zh) * | 2021-01-14 | 2021-04-30 | 卫宁健康科技集团股份有限公司 | 表格模板生成方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000172779A (ja) | 1998-12-03 | 2000-06-23 | Toshiba Corp | Ocrシステム及び同システムに適用する読取制御情報の作成方法 |
JP2004178107A (ja) | 2002-11-25 | 2004-06-24 | Canon Inc | 帳票処理装置 |
JP2008117126A (ja) | 2006-11-02 | 2008-05-22 | Denso Corp | 文字認識装置及び文字認識方法 |
JP2009087378A (ja) | 2009-01-16 | 2009-04-23 | Hitachi Omron Terminal Solutions Corp | 帳票処理装置 |
JP2011123825A (ja) | 2009-12-14 | 2011-06-23 | Fujitsu Frontech Ltd | 文字認識方法、文字認識装置および文字認識プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008108114A (ja) * | 2006-10-26 | 2008-05-08 | Just Syst Corp | 文書処理装置および文書処理方法 |
-
2018
- 2018-08-24 JP JP2018157003A patent/JP7026386B2/ja active Active
-
2021
- 2021-06-17 JP JP2021100886A patent/JP2021140831A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000172779A (ja) | 1998-12-03 | 2000-06-23 | Toshiba Corp | Ocrシステム及び同システムに適用する読取制御情報の作成方法 |
JP2004178107A (ja) | 2002-11-25 | 2004-06-24 | Canon Inc | 帳票処理装置 |
JP2008117126A (ja) | 2006-11-02 | 2008-05-22 | Denso Corp | 文字認識装置及び文字認識方法 |
JP2009087378A (ja) | 2009-01-16 | 2009-04-23 | Hitachi Omron Terminal Solutions Corp | 帳票処理装置 |
JP2011123825A (ja) | 2009-12-14 | 2011-06-23 | Fujitsu Frontech Ltd | 文字認識方法、文字認識装置および文字認識プログラム |
Non-Patent Citations (1)
Title |
---|
新庄 広,外2名,DPマッチングを用いた帳票枠構造照合方式,電子情報通信学会技術研究報告 Vol.102 No.707,日本,社団法人電子情報通信学会,2003年,第102巻 |
Also Published As
Publication number | Publication date |
---|---|
JP2020030722A (ja) | 2020-02-27 |
JP2021140831A (ja) | 2021-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4918776B2 (ja) | 電子文書比較プログラム、電子文書比較装置および電子文書比較方法 | |
US9613267B2 (en) | Method and system of extracting label:value data from a document | |
RU2679209C2 (ru) | Обработка электронных документов для распознавания инвойсов | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP5665125B2 (ja) | 画像処理方法、及び、画像処理システム | |
US20110157215A1 (en) | Image output device, image output system and image output method | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
JP6826293B2 (ja) | 情報処理システムと、その処理方法及びプログラム | |
US11303769B2 (en) | Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium | |
RU2605078C2 (ru) | Сегментация изображения для верификации данных | |
JP7026386B2 (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム | |
WO2021117128A1 (ja) | 帳票画像処理システム | |
CN113806472B (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP5657401B2 (ja) | 文書処理装置、及び文書処理プログラム | |
JP5051174B2 (ja) | 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム | |
JP4501731B2 (ja) | 画像処理装置 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11995908B2 (en) | Information processing device and non-transitory computer readable medium | |
US11145064B2 (en) | Technologies for detecting crop marks in electronic documents | |
JP7358838B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP7417116B2 (ja) | 情報処理システム、情報処理方法、プログラム | |
JPH11187231A (ja) | 画像検索装置及び画像検索方法 | |
JP4548062B2 (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210119 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210415 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20210419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210617 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7026386 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |