JP2016081380A - 帳票処理プログラム及び帳票処理装置 - Google Patents
帳票処理プログラム及び帳票処理装置 Download PDFInfo
- Publication number
- JP2016081380A JP2016081380A JP2014213755A JP2014213755A JP2016081380A JP 2016081380 A JP2016081380 A JP 2016081380A JP 2014213755 A JP2014213755 A JP 2014213755A JP 2014213755 A JP2014213755 A JP 2014213755A JP 2016081380 A JP2016081380 A JP 2016081380A
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- layout
- character recognition
- item
- definition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 91
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000012937 correction Methods 0.000 claims description 45
- 238000000605 extraction Methods 0.000 claims description 11
- 238000000034 method Methods 0.000 abstract description 76
- 238000010586 diagram Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 13
- 238000012015 optical character recognition Methods 0.000 description 10
- 238000012795 verification Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
Description
例えば、帳票を複数の部分領域に分割し、部分領域ごとに予め登録された部分書式情報と比較し、部分領域ごとに最適な部分書式情報を選択する。そして、選択した部分書式情報を合成して帳票全体の書式情報を生成し、生成した書式情報に基づいて文字認識を行う技術が開示されている(例えば、特許文献1参照。)。
すなわち、本発明の一態様によれば、本発明の帳票処理プログラムは、帳票処理装置のコンピュータを、画像読取装置で読み込んだ帳票画像から罫線レイアウトを抽出する罫線抽出手段、前記罫線抽出手段によって抽出された罫線レイアウトに基づいて、複数の帳票レイアウトが格納された帳票定義体データベースを参照し、所定範囲内で前記罫線レイアウトと一致する帳票レイアウトを照合する罫線レイアウト照合手段、前記罫線レイアウト照合手段によって照合された罫線レイアウトと帳票レイアウトについて、対応する文字認識項目を照合する文字認識項目照合手段、前記文字認識項目照合手段によって照合された前記帳票レイアウトの文字認識項目を前記罫線レイアウトの文字認識項目と一致するように補正する文字認識項目補正手段として機能させるための帳票処理プログラムである。
図1は、本実施の形態における帳票処理装置を備えるシステム構成図である。
図2において、帳票処理装置20は、罫線抽出部21、罫線レイアウト照合部22、文字認識項目照合部23、文字認識項目補正部24及び文字認識部25を備え、定義帳票情報データベース(DB)30とアクセス可能に接続する。
図3において、帳票処理装置20は、CPU(Central Processing Unit)201、入力装置202、出力装置203、ROM(Read Only Memory)204、RAM(Random Access Memory)205、インターフェース(I/F)206がバス207に接続されて構成されている。入力装置202は、例えば、キーボード、ジョイスティック、ライトペン、マウス、タッチパッド、タッチパネル、トラックボール等、各種のデータや信号等を入力する。出力装置203は、例えば、LCD(Liquid Crystal Display)等の各種ディスプレイ、プリンタ等、画像やその他の情報を出力する。ROM204は、帳票処理装置20において実行する帳票処理を実行するプログラムの他、帳票処理装置20の各機能を制御し実行するための制御プログラム及びテーブルデータなどを収納する。RAM205は、出力装置203用のフレームバッファや一部のアプリケーションプログラム等を格納する。インターフェース206は、USB(Universal Serial Bus)等のシリアルインターフェースやイーサネット(登録商標)等のパラレルインターフェース等、外部機器と接続するためのユニットである。CPU201は、これらの各部を制御している。
図4及び図9は、本実施の形態において実行される帳票処理の流れを示すフローチャートである。図5は、帳票イメージの例を示す図である。図6は、帳票イメージから抽出した罫線レイアウトの例を示す図である。図7は、罫線レイアウトから抽出した横罫線情報の例を示す図である。図8は、罫線レイアウトから抽出した縦罫線情報の例を示す図である。図10は、定義体に登録されている帳票イメージの例を示す図である。図11は、定義体に登録されている罫線レイアウトの例を示す図である。図12は、定義体に登録されている横罫線情報の例を示す図である。図13は、定義体に登録されている縦罫線情報の例を示す図である。図14及び図16は、サブルーチン「罫線レイアウト照合処理」の流れを示すフローチャートである。図15は、横罫線情報の照合の例を示す図である。図17は、サブルーチン「文字認識項目照合/補正処理」の流れを示すフローチャートである。図18は、サブルーチン「文字項目罫線照合処理」の流れを示すフローチャートである。図19は、定義体に登録されている項目定義情報の例を示す図である。図20は、帳票と定義体の認識項目の比較を示す図である。図21は、項目情報の横罫線の比較を示す図である。図22は、項目情報の縦罫線の比較を示す図である。図23及び図26は、サブルーチン「文字項目定義補正処理」の流れを示すフローチャートである。図24は、項目情報の横罫線の補正を示す図である。図25は、定義体の補正を示す図である。
ステップS2306において、「項目の縦罫線」の縦方向の座標値に、ステップS2305で算出した補正値を加算する。
ステップS2606において、「項目の横罫線」の横方向の座標値に、ステップS2605で算出した補正値を加算する。
10 画像読取装置
20 帳票処理装置
21 罫線抽出部
22 罫線レイアウト照合部
23 文字認識項目照合部
24 文字認識項目補正部
25 文字認識部
30 定義帳票情報データベース(DB)
201 CPU(Central Processing Unit)
202 入力装置
203 出力装置
204 ROM(Read Only Memory)
205 RAM(Random Access Memory)
206 インターフェース(I/F)
207 バス
701、702、703、704、705、706、707、708、709 横罫線
801、802、803、804 縦罫線
1201、1202、1203、1204、1205、1206、1207、1208、1209 横罫線
1301、1302、1303、1304 縦罫線
2201、2202、2209、2211、2212、2219 縦罫線
2503 横罫線
Claims (3)
- 帳票処理装置のコンピュータを、
画像読取装置で読み込んだ帳票画像から罫線レイアウトを抽出する罫線抽出手段、
前記罫線抽出手段によって抽出された罫線レイアウトに基づいて、複数の帳票レイアウトが格納された帳票定義体データベースを参照し、所定範囲内で前記罫線レイアウトと一致する帳票レイアウトを照合する罫線レイアウト照合手段、
前記罫線レイアウト照合手段によって照合された罫線レイアウトと帳票レイアウトについて、対応する文字認識項目を照合する文字認識項目照合手段、
前記文字認識項目照合手段によって照合された前記帳票レイアウトの文字認識項目を前記罫線レイアウトの文字認識項目と一致するように補正する文字認識項目補正手段、
として機能させるための帳票処理プログラム。 - 更に、前記文字認識項目補正手段によって補正された帳票レイアウトに従って、前記罫線レイアウト内の文字を認識する文字認識手段、
として機能させるための請求項1に記載の帳票処理プログラム。 - 帳票処理装置において、
画像読取装置で読み込んだ帳票画像から罫線レイアウトを抽出する罫線抽出部と、
前記罫線抽出部によって抽出された罫線レイアウトに基づいて、複数の帳票レイアウトが格納された帳票定義体データベースを参照し、所定範囲内で前記罫線レイアウトと一致する帳票レイアウトを照合する罫線レイアウト照合部と、
前記照合部によって照合された罫線レイアウトと帳票レイアウトについて、対応する文字認識項目を照合する文字認識項目照合部と、
前記文字認識項目照合部によって照合された前記帳票レイアウトの文字認識項目を前記罫線レイアウトの文字認識項目と一致するように補正する文字認識項目補正部と、
を備えることを特徴とする帳票処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014213755A JP6342292B2 (ja) | 2014-10-20 | 2014-10-20 | 帳票処理プログラム及び帳票処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014213755A JP6342292B2 (ja) | 2014-10-20 | 2014-10-20 | 帳票処理プログラム及び帳票処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016081380A true JP2016081380A (ja) | 2016-05-16 |
JP6342292B2 JP6342292B2 (ja) | 2018-06-13 |
Family
ID=55956270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014213755A Expired - Fee Related JP6342292B2 (ja) | 2014-10-20 | 2014-10-20 | 帳票処理プログラム及び帳票処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6342292B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018112957A (ja) * | 2017-01-13 | 2018-07-19 | グローリー株式会社 | 帳票処理システム、帳票処理装置及び帳票処理方法 |
JP2021012486A (ja) * | 2019-07-04 | 2021-02-04 | 富士通フロンテック株式会社 | 帳票処理プログラム、帳票処理方法、及び帳票処理装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1027208A (ja) * | 1996-07-10 | 1998-01-27 | N T T Data Tsushin Kk | 帳票照合方法及び装置 |
JPH11102416A (ja) * | 1997-09-26 | 1999-04-13 | Fujitsu Ltd | 帳票読取方向判定装置および帳票読取方向判定方法 |
JP2003109007A (ja) * | 2001-09-28 | 2003-04-11 | Fuji Xerox Co Ltd | 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 |
-
2014
- 2014-10-20 JP JP2014213755A patent/JP6342292B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1027208A (ja) * | 1996-07-10 | 1998-01-27 | N T T Data Tsushin Kk | 帳票照合方法及び装置 |
JPH11102416A (ja) * | 1997-09-26 | 1999-04-13 | Fujitsu Ltd | 帳票読取方向判定装置および帳票読取方向判定方法 |
JP2003109007A (ja) * | 2001-09-28 | 2003-04-11 | Fuji Xerox Co Ltd | 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018112957A (ja) * | 2017-01-13 | 2018-07-19 | グローリー株式会社 | 帳票処理システム、帳票処理装置及び帳票処理方法 |
JP2021012486A (ja) * | 2019-07-04 | 2021-02-04 | 富士通フロンテック株式会社 | 帳票処理プログラム、帳票処理方法、及び帳票処理装置 |
JP7201545B2 (ja) | 2019-07-04 | 2023-01-10 | 富士通フロンテック株式会社 | 帳票処理プログラム、帳票処理方法、及び帳票処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6342292B2 (ja) | 2018-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Grüning et al. | Read-bad: A new dataset and evaluation scheme for baseline detection in archival documents | |
CN108960223B (zh) | 基于票据智能识别自动生成凭证的方法 | |
CN102289667B (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
US11182544B2 (en) | User interface for contextual document recognition | |
CN111325110A (zh) | 基于ocr的表格版式恢复方法、装置及存储介质 | |
US8718367B1 (en) | Displaying automatically recognized text in proximity to a source image to assist comparibility | |
CN101430761B (zh) | 表格数据提取装置和方法 | |
WO2015009297A1 (en) | Systems and methods for extracting table information from documents | |
WO2018003153A1 (ja) | 認識装置及び認識方法 | |
US11816923B2 (en) | Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium | |
US20210073535A1 (en) | Information processing apparatus and information processing method for extracting information from document image | |
CN110427853B (zh) | 一种智能票据信息提取处理的方法 | |
US20190065840A1 (en) | System and method for semantic textual information recognition | |
US9519404B2 (en) | Image segmentation for data verification | |
CN104021219A (zh) | 一种数据模板的生成方法及装置 | |
JP2012230676A (ja) | 埋め込み型メディアマーカ識別のための装置およびプログラム | |
JP2013164740A (ja) | 会計情報読取りシステム、会計情報読取り方法、及びプログラム | |
JP6342292B2 (ja) | 帳票処理プログラム及び帳票処理装置 | |
CN114036909A (zh) | Pdf文档跨页表格合并方法、装置及相关设备 | |
Machanavajjhala et al. | Collective extraction from heterogeneous web lists | |
CN109726369A (zh) | 一种基于标准文献的智能模板化题录技术实现方法 | |
CN114529933A (zh) | 一种合同数据差异性的比对方法、装置、设备和介质 | |
CN102156855A (zh) | 基于影像切割的银行凭证数据采集方法 | |
JP2011237905A (ja) | データエントリシステムおよびデータエントリ方法 | |
KR20230013849A (ko) | 테이블에 포함된 정보를 인식하는 문자 인식 에러에 강인한 글자 인식 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180515 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180516 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6342292 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |