JP4418823B2 - 帳票識別装置及びその識別方法 - Google Patents
帳票識別装置及びその識別方法 Download PDFInfo
- Publication number
- JP4418823B2 JP4418823B2 JP2007010329A JP2007010329A JP4418823B2 JP 4418823 B2 JP4418823 B2 JP 4418823B2 JP 2007010329 A JP2007010329 A JP 2007010329A JP 2007010329 A JP2007010329 A JP 2007010329A JP 4418823 B2 JP4418823 B2 JP 4418823B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- information
- color
- color component
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000000926 separation method Methods 0.000 claims description 42
- 238000009826 distribution Methods 0.000 claims description 24
- 239000003086 colorant Substances 0.000 claims description 14
- 238000005520 cutting process Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 description 41
- 238000012545 processing Methods 0.000 description 33
- 238000013500 data storage Methods 0.000 description 22
- 238000003860 storage Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 230000005611 electricity Effects 0.000 description 11
- 238000012795 verification Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000013075 data extraction Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010013647 Drowning Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Description
特に、上述のような帳票処理を行なうような業務の効率化を図るためには、同一種類の帳票の多量処理を行なうだけでなく、多種多様なフオーマットを有する帳票を自動的に処理することが要求されている。
イメージデータ読取認識装置を用いて、例えば、「電気料金払込通知書」上に記載された文字データを認識する際には、まず、オペレータによるキーボードの操作により帳票種別(この場合は電気料金払込通知書(帳票B)とする)に対応する定義体情報Bを指示する。
これにより、イメージデータ読取認識装置では、電子計算機からの制御情報としての定義体情報Bに基づいて、イメージデータの読み取りと文字認識処理を行なうことができる。
例えば、金融機関における各支店(営業店)のそれぞれに設置されたクライアントと地区センタに設置されたサーバとを、専用回線や交換回線等を介して接続することにより、クライアント−サーバシステムを構成して、サーバにより帳票処理を一括して行なうことにより、業務の効率化を図ることが提案されている。
図2は、上記の帳票識別装置を示すブロック図であり、この図2に示す帳票識別装置についても、前述の図1におけるものと同様、イメージデータ読取装置101、電子計算機102(この電子計算機102は後述のごとく入力部105、ディスプレイ104及び制御部201を備えている)及びハードディスク103により構成される。
ところで、制御部201は、図2に示すように、機能ブロックとして、イメージデータ格納メモリ202、イメージデータ切り出し部203、帳票識別辞書部204、データ比較部205、閾値設定部206、帳票判定部207、定義体格納部208、定義体格納テーブル211、文字認識部209及び文字認識結果格納部210を備えている。
具体的には、図3に示すように、例えば、ID番号‘0101’が付された帳票種別Aの帳票識別情報は領域204aに格納され、ID番号‘0102’が付された帳票種別Bの帳票識別情報は領域204bに絡納されるようになっている。以下、ID番号に応じて順次格納される。
さらに、文字認識結果格納部211は、文字認識部210にて認識された文字情報を格納するものである。
〔登録ステップ時の処理〕
先ず、図4に示す登録ステップ動作時に着目した制御ブロック図、図5に示す登録ステップ動作時の動作を説明するためのフローチャート及び図3を用いて、帳票識別装置の登録ステップ時の動作を以下に説明する。
ここで、イメージデータ格納メモリ202及びハードディスク103に絡納されたイメージデータが、初めて読み取られた帳票に関するイメージデータである場合は、以下に示すように帳票識別情報を帳票登録辞書部204に格納する。
なお、この帳票識別装置においては、イメージデータ切り出し部203で切り出されたイメージデータは、帳票の識別のためにのみ用いられている。
次に、図6に示す帳票判別用ステップ動作時に着目した制御ブロック図と、図7に示す帳票判別ステップ時の動作を説明するためのフローチャートとを用いて、本実施形態にかかる帳票識別装置の帳票判別ステップ時の動作を以下に説明する。
しかし、最近使われている私製伝票等には、カラー化されたものが多い。帳票種別を識別するのに好都合な特徴、例えば、ロゴマーク等はカラー化されているものが多い。また、中には、同じフォーマットでも色を違えて異なる帳票として使い分ける場合もある。
一般に、色は成分に分離すると、3原色からなることはよく知られたことである。本発明においても、3原色の考え方を採用するものである。しかし、説明を簡単にする都合上、図8では、便宜的に2成分のみを示している。
本実施形態の帳票識別装置における制御部の基本的構成は、図2に示したブロック構成と同様であるが、制御部は上記色抽出原理を具体化するための色成分抽出部及び色成分分離部を更に有し、帳票識別辞書部の各帳票識別情報に色分離パラメータとデータ情報とを追加して格納する点で、図2のブロック構成と異なっている。
色成分抽出用に入力手段105′を設けているが、入力手段105を兼用してもよい。
〔登録ステップ時の処理〕
図9は、図4に示した制御ブロック図と同様に、本発明の帳票識別装置において特に登録ステップ動作時に着目した制御ブロック図の構成を示している。
ここで、イメージデータ格納メモリ202及びハードディスク103に絡納されたイメージデータが、初めて読み取られた帳票に関するイメージデータである場合は、以下に示すように帳票識別情報を帳票登録辞書部204に格納する。
なお、複数の抽出対象を指定する場合には、上記のステップS1004からステップS1009をその抽出対象毎に繰り返して識別情報を取得する。複数の抽出対象に対応して帳票識別辞書部204における当該帳票の帳票識別情報毎に登録する。
なお、この帳票識別装置においては、イメージデータ切り出し部203で切り出されたイメージデータは、帳票の識別のためにのみ用いられる。
図11は、図6に示したと同様に、帳票判別用ステップ動作時に着目した制御ブロック図を示している。
上述したように、検証ステップ時においては、ハードディスク103に格納されている全帳票のイメージについて、帳票識別辞書部204にて登録された帳票識別情報を用いて特定できるかを検証しているが、検証が完了すると、実際の帳票判別時においては、任意の帳票のイメージデータについて、以下に示すような帳票種別を特定する判別ステップとしての動作が行なわれる。
次に、イメージデータ切り出し部203は、帳票識別辞書部204から格納されている帳票種別順に、その帳票毎に帳票識別情報を順次選択して読み出す(ステップS1202)。
一方、ステップS1209で帳票種別の記録がない、つまり特定帳票種別が1つもない場合(N)には、イメージ読み取り装置101で読み取った帳票が帳票種別を特定できなかったことを通知または表示する。
102 電子計算機
103 ハードディスク
104 ディスプレイ
105 入力手段
106 帳票
201 制御部
202 イメージデータ格納メモリ
203 イメージデータ切り出し部
204 帳票識別辞書部
205 データ比較部
206 閾値設定部
207 帳票判定部
208 定義体格納部
209 文字認識部
210 文字認識結果格納部
211 定義体格納部テーブル
213 色成分抽出部
214 色成分分離部
Claims (4)
- 任意のフォーマットで作成された帳票から読み取ったイメージデータに基づいて前記帳票を識別する帳票識別装置であって、
前記帳票から読み取ったイメージデータを格納するメモリと、
前記メモリから読み出された前記イメージデータから前記帳票の指定された特定部分に対応する特定イメージデータを切り出すデータ切出し手段と、
前記切り出された前記特定イメージデータの色成分を分析して、該色成分の濃度分布を作成し、該色成分の濃度分布を画面に表示させる色成分抽出手段と、
前記色成分の濃度分布に基づいて、オペレータにより指定された前記特定イメージデータに係る特定の色成分に対する色空間上の濃度分布範囲を色分離パラメータとして設定する色分離パラメータ設定手段と、
前記設定された前記色分離パラメータと、当該色分離パラメータに従って前記イメージデータから抽出されたデータ情報と、前記特定部分に係る位置情報及び大きさ情報とを含めた帳票識別情報を作成し、該帳票識別情報を前記メモリの帳票識別辞書部に格納する識別情報作成手段と、
識別すべき帳票より読み取って得られたイメージデータから前記帳票識別辞書部に格納された前記位置情報及び大きさ情報に従って切り出された特定イメージデータに対して前記色分離パラメータを適用し、前記特定の色成分の濃度分布を抽出してデータ情報を作成し、該データ情報と前記帳票識別辞書部に格納された前記帳票識別情報の前記データ情報とを比較判定する判定手段と、を備え、
前記各データ情報の一致度に応じて、前記帳票を識別することを特徴とする帳票識別装置。 - 前記色成分を色の3原色により分析し、前記3原色のうちの1つを前記特定の色成分として選択し、前記3原色の濃度分布に基づいて前記色分離パラメータを決定することを特徴とする請求項1に記載の帳票識別装置。
- 任意のフォーマットで作成された帳票から読み取ったイメージデータに基づいて前記帳票を識別する帳票識別方法であって、
前記帳票から読み取ったイメージデータをメモリに格納し、
前記メモリから前記イメージデータを読み出し、該イメージデータから前記帳票の指定された特定部分に対応する特定イメージデータを切り出し、
前記切り出された前記特定イメージデータの色成分を分析して、該色成分の濃度分布を作成し、該色成分の濃度分布を画面に表示し、
表示された前記色成分の濃度分布に基づいて、オペレータにより指定された前記特定イメージデータに係る特定の色成分に対する色空間上の濃度分布範囲を色分離パラメータとして設定し、
前記設定された前記色分離パラメータと、当該色分離パラメータに従って前記イメージデータから抽出されたデータ情報と、前記特定部分に係る位置情報及び大きさ情報とを含めた帳票識別情報を作成し、該帳票識別情報を前記帳票識別辞書部に格納し、
識別すべき帳票より読み取って得られたイメージデータから前記帳票識別辞書部に格納された前記位置情報及び大きさ情報に従って切り出された特定イメージデータに対して前記色分離パラメータを適用し、前記特定の色成分の濃度分布を抽出してデータ情報を作成し、該データ情報と前記帳票識別辞書部に格納された前記帳票識別情報の前記データ情報とを比較判定し、前記各データ情報の一致度に応じて前記帳票を識別することを特徴とする帳票識別方法。 - 前記色成分を色の3原色により分析し、前記3原色のうちの1つを前記特定の色成分として選択し、前記3原色の濃度分布に基づいて前記色分離パラメータを決定することを特徴とする請求項3に記載の帳票識別方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007010329A JP4418823B2 (ja) | 2007-01-19 | 2007-01-19 | 帳票識別装置及びその識別方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007010329A JP4418823B2 (ja) | 2007-01-19 | 2007-01-19 | 帳票識別装置及びその識別方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001528910A Division JP3946043B2 (ja) | 1999-09-30 | 1999-09-30 | 帳票識別装置及び識別方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007115280A JP2007115280A (ja) | 2007-05-10 |
JP4418823B2 true JP4418823B2 (ja) | 2010-02-24 |
Family
ID=38097333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007010329A Expired - Lifetime JP4418823B2 (ja) | 2007-01-19 | 2007-01-19 | 帳票識別装置及びその識別方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4418823B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5670787B2 (ja) * | 2011-03-18 | 2015-02-18 | 株式会社Pfu | 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム |
-
2007
- 2007-01-19 JP JP2007010329A patent/JP4418823B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2007115280A (ja) | 2007-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5500480B2 (ja) | 帳票認識装置及び帳票認識方法 | |
JP3088019B2 (ja) | 媒体処理装置及び媒体処理方法 | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP4078009B2 (ja) | 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置 | |
US6320983B1 (en) | Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein | |
JP2016048444A (ja) | 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法 | |
US11144752B1 (en) | Physical document verification in uncontrolled environments | |
US20160379186A1 (en) | Element level confidence scoring of elements of a payment instrument for exceptions processing | |
KR100707943B1 (ko) | 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템 | |
US10049350B2 (en) | Element level presentation of elements of a payment instrument for exceptions processing | |
JP2008312139A (ja) | 印刷装置及び印刷方法 | |
JP3946043B2 (ja) | 帳票識別装置及び識別方法 | |
JP7379987B2 (ja) | 情報処理装置及びプログラム | |
JP4418823B2 (ja) | 帳票識別装置及びその識別方法 | |
JP2008282094A (ja) | 文字認識処理装置 | |
TWM626292U (zh) | 業務導向要項鍵值辨識系統 | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP4566510B2 (ja) | 帳票認識装置および帳票認識方法 | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP3463008B2 (ja) | 媒体処理方法及び媒体処理装置 | |
JP7435118B2 (ja) | 情報処理装置及びプログラム | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
EP3779856B1 (en) | Image processing device, image processing method, and storage medium for storing program | |
JP2000113100A (ja) | 媒体処理方法及び媒体処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070213 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4418823 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121204 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121204 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131204 Year of fee payment: 4 |
|
EXPY | Cancellation because of completion of term |