JP2005100079A - 帳票データ入力装置およびプログラム - Google Patents
帳票データ入力装置およびプログラム Download PDFInfo
- Publication number
- JP2005100079A JP2005100079A JP2003332733A JP2003332733A JP2005100079A JP 2005100079 A JP2005100079 A JP 2005100079A JP 2003332733 A JP2003332733 A JP 2003332733A JP 2003332733 A JP2003332733 A JP 2003332733A JP 2005100079 A JP2005100079 A JP 2005100079A
- Authority
- JP
- Japan
- Prior art keywords
- record
- item
- data
- definition information
- detail
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003860 storage Methods 0.000 claims abstract description 23
- 238000013500 data storage Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 69
- 230000008569 process Effects 0.000 abstract description 69
- 238000012015 optical character recognition Methods 0.000 description 39
- 238000013523 data management Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
【解決手段】 OCR制御部22は、記憶部28に記憶するイメージ入力部27からの帳票イメージデータを認識辞書29を参照してOCR認識処理を行ない、その認識結果をファイル30に格納する。そして定義情報ファイル26内の該帳票定義に明細領域があれば、該帳票定義の明細行数に相当するデータレコードを展開ファイル31に形成する。形成された各データレコードに該帳票定義の項目定義に基づいて項目を形成する。次に、レコードのヘッダ部に属する項目には同一の認識結果を、明細部の項目には明細行に対応する認識結果を認識結果ファイル30から入力設定を行なう。この処理を明細行数分繰り返す。
【選択図】 図2
Description
OCRによって入力された帳票項目データを業務アプリケーション・ソフトウェアが利用するには、定義されたOCR帳票定義体に格納されている項目名称の指定をデータ項目単位に順次繰り返して、一時的に格納されているOCRからの認識データのうち対応するデータの獲得を行なった後、それら認識データを帳票の共通な項目データ(以下、ヘッダ部データと称する)と、取引の明細を繰り返し記述する項目データ(以下、明細部データと称する)とを組み合わせたデータベース形式に適合するようにレコード処理が行なわれているものもある(例えば、特許文献1参照。)。
また、複数葉の枚数に亘る伝票の項目データを獲得する際は、2枚目以降の伝票の項目に共通項目のヘッダ部および/または集計部が存在しないため、2枚目以降の明細繰り返し部にヘッダ部および/または集計部を付加する処理を伝票間で行なわなければならず、プログラミングの記述内容が複雑になって、さらにプログラマの作業負担を増大させていた。
こうすることによって、OCRによって認識された帳票データをその帳票定義情報に従って、データベースにて利用可能な形式のデータレコードが形成されるので、業務アプリケーションソフトにて容易に認識データを利用することが可能となる。
こうすることにより、データベースにおけるレコード形式と同一なレコード形式を形成することができるので、あたかもデータベースからデータを検索するが如く、容易にアプリケーションソフトにおいてOCRによって入力された帳票データを利用することが可能となる。
こうすることにより、あたかもデータベースからデータを検索するが如く、容易にアプリケーションソフトにおいてOCRによって入力された帳票データを利用することが可能となる。
こうすることにより、帳票フォーム定義情報に明細繰り返し行を定義するだけで、OCRより得られたデータをデータレコードとして作成することができるので、あたかもデータベースからデータを検索するが如く、容易にOCRによって読み取られた帳票データを扱うことが可能となる効果を奏する。
図1は、本発明に係わるOCRとコンピュータシステムとからなるOCR帳票データ入力システム構成を示すブロック図である。
本システムは、図1に示すように、CPU1、メインメモリ2、イメージ入力部3、入力部4、マウス6を含む表示部5、プリンタ7、および記憶媒体81を含む記憶装置8とを有する。
プリンタ7は、CPU1の印刷処理によって制御される例えばページプリンタである。
以下、本実施の形態の動作を説明する。
なお、本実施形態の帳票データ入力システムは、帳票データ入力システムの起動がなされ、表示部24の画面に表示される業務項目メニュー選択ウインドウ上で業務処理対象の業務項目の選択がマスス6操作などにより行われると、該選択された業務項目に対応する業務アプリーション・プログラムを記憶媒体81からRAM2内の所定領域であるアプリケーション・プログラム記憶部23内に読み込まれるものとする。
以下の説明においては、処理対象の業務としてOCR売上伝票入力業務が選択されて対応する業務アプリケーション・プログラムがプログラム記憶部23内に読み込みているものとする。
S111では、上述したS109とS110の処理によって認識結果がレコード形式で展開ファイル31に登録された後、アプリケーションからの帳票データ取得要求が制御部21から出されたか否かがOCR制御部22内の認識データ管理部222によって判別される。その結果がYesであればS112の処理に進み、NoであればYesになるまでS111の判別処理を繰り返す。
次に、図6に示した帳票データ入力処理におけるS108の処理において行なわれる伝票レコード生成処理の詳細について説明する。この処理は、OCR帳票フォームに繰り返し項目からなる明細領域が存在する場合には、予め作成された該帳票の帳票定義情報上の明細行数に応じて確保したレコードそれぞれに、ヘッダ部/明細部/集計部それぞれに含まれる項目に対する項目定義情報を基に項目フィールドの割り当てを行なうものである。
図9は伝票レコード生成処理の処理内容を示すフローチャートである。
S202では、認識データ管理部222において変数Rに初期値である「1」が代人される。
S209とS210では、上述したS208の項目割当て処理を明細部、集計部に含まれる項目を同じレコードに割当てを行なう。
次に、図6に示した帳票データ入力処理におけるS109の処理において行なわれるデータ登録処理の詳細について説明する。この処理は、図10(b)に示されるような構造を持つ展開ファイル31に配列されたデータレコードに認識結果ファイル30のデータの登録を行なう処理である。
図11はデータ登録処理の処理内容を示すフローチャートである。
以上までに説明した図6、図9、および図11の処理を行なうことによりOCRによって読み取られた読み取り対象の項目の値をデータレコード形式に配列することが実現できる。
2 RAM
3 イメージ読取装置
4 入力装置
5 表示装置
6 マウス
7 プリンタ
8 記憶装置
81 記憶媒体
21 制御部
211 帳票定義情報管理部
212 画面処理部
22 OCR制御部
221 イメージ入力処理部
222 認識データ処理部
23 アプリケーション・プログラム記憶部
24 表示部
25 入力部
26 定義情報ファイル
27 イメージ入力部
28 イメージデータ記憶部
29 認識辞書
30 認識結果ファイル
31 展開ファイル
32 データファイル
Claims (4)
- 少なくともヘッダ部と明細部を有する帳票を光学的に読み取って帳票イメージを生成するイメージ読取手段と、
該帳票のヘッダ部、明細部に含まれる項目それぞれの定義情報を記憶している帳票定義情報記憶手段と、
前記イメージ読取手段によって生成された帳票イメージから、前記定義情報記憶手段に記憶されている項目定義情報に基づいて、読み取り対象のフィールド領域内のイメージを文字認識する文字認識手段と、
前記文字認識手段による認識結果をデータベースにて利用可能のデータレコード形式のレコードに項目データとして形成するレコード形成手段と、
を備えることを特徴とする帳票データ入力装置。 - 前記レコード形成手段は、
前記帳票定義記憶手段に記憶された明細部項目の定義情報として示される明細行数に相当する数分のデータレコード領域を確保するレコード領域確保手段と、
前記レコード領域確保手段によって確保された各データレコード領域に、前記帳票定義記憶手段に記憶された各項目定義に基づいた項目を夫々に割り当てるレコード項目割当手段と、
前記レコード項目割当手段によってヘッダ部項目として割り当てられた各レコード項目には帳票共通の認識結果を入力し、明細部として割り当てられた各レコード項目には明細行の夫々に対応する認識結果を入力させるデータ入力手段と、
を備えることを特徴とする請求項1に記載の帳票データ入力装置。 - 前記レコード形成手段によって形成されたレコードをデータベース構築機能を有するアプリケーションソフトからの要求に応じて該アプリケーションソフトにおけるデータ格納空間に送出する送出手段を、さらに備える請求項1に記載の帳票データ入力装置。
- コンピュータに、
少なくともヘッダ部と明細部を有する帳票を光学的に読み取って帳票イメージを生成する機能と、
該帳票のヘッダ部、明細部に含まれる項目それぞれの定義情報を記憶する機能と、
前記生成された帳票イメージから、前記記憶されている項目定義情報に基づいて、読み取り対象のフィールド領域内のイメージを文字認識する機能と、
前記文字認識の認識結果をデータベースにて利用可能のデータレコード形式のレコードに項目データとして形成する機能と、
を実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003332733A JP4396205B2 (ja) | 2003-09-25 | 2003-09-25 | 帳票データ入力装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003332733A JP4396205B2 (ja) | 2003-09-25 | 2003-09-25 | 帳票データ入力装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005100079A true JP2005100079A (ja) | 2005-04-14 |
JP4396205B2 JP4396205B2 (ja) | 2010-01-13 |
Family
ID=34460950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003332733A Expired - Fee Related JP4396205B2 (ja) | 2003-09-25 | 2003-09-25 | 帳票データ入力装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4396205B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006309611A (ja) * | 2005-04-28 | 2006-11-09 | Canon Marketing Japan Inc | 解析装置、プログラム及び記録媒体 |
KR100707943B1 (ko) * | 2005-04-27 | 2007-04-18 | 최철규 | 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템 |
JP2008027094A (ja) * | 2006-07-20 | 2008-02-07 | Mitsubishi Electric Corp | 設備仕様入力装置 |
JP2009282745A (ja) * | 2008-05-22 | 2009-12-03 | Internatl Business Mach Corp <Ibm> | ウェブページの入力項目への入力を支援する方法、コンピュータ・プログラム及び端末 |
JP2012226402A (ja) * | 2011-04-15 | 2012-11-15 | Fujitsu Marketing Ltd | レシートデータ認識装置およびそのプログラム |
US20140369602A1 (en) * | 2013-06-14 | 2014-12-18 | Lexmark International Technology S.A. | Methods for Automatic Structured Extraction of Data in OCR Documents Having Tabular Data |
JP2021086479A (ja) * | 2019-11-29 | 2021-06-03 | 株式会社リコー | 情報処理システム、情報処理方法及びプログラム |
-
2003
- 2003-09-25 JP JP2003332733A patent/JP4396205B2/ja not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100707943B1 (ko) * | 2005-04-27 | 2007-04-18 | 최철규 | 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템 |
JP4646300B2 (ja) * | 2005-04-28 | 2011-03-09 | キヤノンマーケティングジャパン株式会社 | 繰り返し行決定装置、繰り返し行決定方法、プログラム及び記録媒体 |
JP2006309611A (ja) * | 2005-04-28 | 2006-11-09 | Canon Marketing Japan Inc | 解析装置、プログラム及び記録媒体 |
JP2008027094A (ja) * | 2006-07-20 | 2008-02-07 | Mitsubishi Electric Corp | 設備仕様入力装置 |
US10095675B2 (en) | 2008-05-22 | 2018-10-09 | International Business Machines Corporation | Inputting data to a web page |
JP2009282745A (ja) * | 2008-05-22 | 2009-12-03 | Internatl Business Mach Corp <Ibm> | ウェブページの入力項目への入力を支援する方法、コンピュータ・プログラム及び端末 |
US11222169B2 (en) | 2008-05-22 | 2022-01-11 | International Business Machines Corporation | Inputting data to a web page |
JP2012226402A (ja) * | 2011-04-15 | 2012-11-15 | Fujitsu Marketing Ltd | レシートデータ認識装置およびそのプログラム |
US20140369602A1 (en) * | 2013-06-14 | 2014-12-18 | Lexmark International Technology S.A. | Methods for Automatic Structured Extraction of Data in OCR Documents Having Tabular Data |
US9251413B2 (en) * | 2013-06-14 | 2016-02-02 | Lexmark International Technology, SA | Methods for automatic structured extraction of data in OCR documents having tabular data |
US9785830B2 (en) * | 2013-06-14 | 2017-10-10 | Kofax International Switzerland Sarl | Methods for automatic structured extraction of data in OCR documents having tabular data |
JP2021086479A (ja) * | 2019-11-29 | 2021-06-03 | 株式会社リコー | 情報処理システム、情報処理方法及びプログラム |
JP7456131B2 (ja) | 2019-11-29 | 2024-03-27 | 株式会社リコー | 情報処理システム、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4396205B2 (ja) | 2010-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8547561B2 (en) | Information processing apparatus, printing processing method, and program therefor | |
US8386923B2 (en) | Document generation apparatus, method, and storage medium | |
JP4796830B2 (ja) | 情報処理方法及び情報処理装置 | |
CN101739224A (zh) | 略图创建方法以及图像形成装置 | |
CN102129357B (zh) | 信息处理装置及信息处理装置控制方法 | |
CN101135957A (zh) | 计算机可读介质、指示装置、图像处理方法和图像处理系统 | |
US5887088A (en) | Inputting device and inputting method for information processing system | |
US6600498B1 (en) | Method, means, and device for acquiring user input by a computer | |
JP4396205B2 (ja) | 帳票データ入力装置およびプログラム | |
US7580149B2 (en) | Method and system for identification of repeat print jobs using object level hash tables | |
JP2012123672A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2019023793A (ja) | 仕訳情報処理装置、仕訳情報処理方法、およびプログラム | |
JP7375325B2 (ja) | 管理装置、端末装置、及び印刷システム | |
JP2007331312A (ja) | 印刷装置、印刷制御方法、プログラム、記憶媒体 | |
JP6190549B1 (ja) | 文書処理システム | |
JP2001256256A (ja) | 電子文書検索装置および電子文書検索方法 | |
JP2002236677A (ja) | データ提示方法、情報処理システム、コンピュータ読み取り可能な記録媒体、及びプログラム | |
JPH07114610A (ja) | 情報処理システムの入力装置及び情報処理システムの入力方法 | |
JP2007128325A (ja) | 印刷制御装置およびその手段 | |
JP7323138B2 (ja) | 技術マップ出力装置、技術マップ出力方法、およびプログラム | |
JP2008118489A (ja) | ファクシミリ配信システム及びファクシミリ装置 | |
JP2024084452A (ja) | 情報処理装置とその制御方法、及びプログラム | |
JP2010009130A (ja) | ネットワークocrシステムおよびクライアント装置 | |
JPH08138007A (ja) | 情報の記録・読み取り方法及び文書情報処理装置 | |
CN114970483A (zh) | 信息生成系统、工作流系统以及记录介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090929 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091012 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121030 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121030 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131030 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |