JP2002007960A - 帳票読み取り方法および帳票読み取りシステム - Google Patents
帳票読み取り方法および帳票読み取りシステムInfo
- Publication number
- JP2002007960A JP2002007960A JP2000182735A JP2000182735A JP2002007960A JP 2002007960 A JP2002007960 A JP 2002007960A JP 2000182735 A JP2000182735 A JP 2000182735A JP 2000182735 A JP2000182735 A JP 2000182735A JP 2002007960 A JP2002007960 A JP 2002007960A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- identification
- characteristic information
- storage memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
帳票読み取り方法において、用紙方向が混在した状態で
処理対象となる場合があり、そのような場合、予め、帳
票を方向別に仕分けし、同じ方向の用紙のみを画像入力
装置にセットしてオペレータやアプリケーションに用紙
方向を指定させ、画像取得後に指定された方向に画像を
回転してから帳票識別、文字認識等の処理を行うことに
なる。 【構成】 読み取り対象の複数種類の帳票の画像データ
を読み取り、各帳票を識別するための特徴情報を予め帳
票フォーマット格納メモリに登録しておき、個々に入力
される帳票の画像データの特徴情報と上記の予め登録さ
れている帳票識別用特徴情報とを照合して帳票識別し、
その識別結果に基づいて画像を処理するこを特徴とす
る。
Description
が混在入力される画像ベースの帳票処理システムにおい
て、帳票のフォーマットを識別し、文字認識等の処理対
象領域の位置を決定する帳票読み取り方法および帳票読
み取りシステムに関する。
文字認識対象領域の文字を認識したり、画像をファイリ
ングしたりするいわゆる基幹業務系の帳票画像処理シス
テムにおいては、まず、入力された帳票の画像データを
業務に合わせて分類する必要がある。
ージスキャナやFAX等の画像入力装置から入力する際
に、(1)帳票を紙の段階で、予め種類毎に分類・仕分
けし、画像入力する際にオペレータが帳票の種類を指定
する方法(帳票フォーマット指定)、(2)帳票の種類
を判別するための帳票(バッチ票等)を該当帳票の束の
先頭に付加して画像入力する方法(バッチ票指定)、
(3)帳票にユニークなID(文字別)をつけてその文
字認識結果で帳票の種類を識別する方法(シートID識
別)等の方法がとられてきた。
ム専用に作成された帳票だけではなく、既存の帳票や不
特定多数の外部者が作成した帳票も処理対象とする必要
がでてきた。そのため、新たな分類方法として、(4)
分類対象となる帳票の画像データの罫線特徴を抽出し、
その特徴をその画像のファーマットとして予め登録・分
類しておき、個々の画像データが入力したときにその画
像データの罫線の特徴と登録されている複数のフォーマ
ットの罫線の特徴を照らし合わせて帳票の種類を識別す
る方法(罫線特徴識別)、(5)分類対象となる帳票の
ユニークなパターンをもつ領域(帳票タイトル等)を帳
票特徴領域としてパターン登録しておき、入力された個
々の画像データのパターンと照らし合わせて帳票の種類
を識別する方法(領域特徴識別)もとられている。
処理システムでは、不特定多数の外部者が作成した帳票
も処理対象とする必要があり、その場合、上記の如く、
罫線特徴や領域特徴で帳票識別を行われることが多い。
ところが、システムによっては、(イ)A4縦サイズ帳
票とA4横サイズ帳票のように用紙サイズは同じである
が用紙方向が異なるものが混在入力処理対象となる場
合、(ロ)B4横サイズ帳票のように横方向では画像入
力装置(スキャナ・FAX等)で画像を取得することが
できないものが混在入力処理対象となる場合がある。
ュー防止や画像取得処理時間の短縮、オペレーションの
簡易化のため、A4横方向またはA4縦方向のいずれか
に揃えて画像を取得することが多い。また、(ロ)の場
合は、B4横帳票をB4縦方向に入力することになる。
このような場合、予め、帳票を方向別に仕分けし、同じ
方向の用紙のみを画像入力装置にセットしてオペレータ
やアプリケーションに用紙方向を指定させ、画像取得後
に指定された方向に画像を回転してから帳票識別、文字
認識等の処理を行うことになる。
が必要であり、本来の混在入力とはいえない。そこで、
用紙方向が混在した帳票を混在した状態で画像入力し、
帳票識別、文字認識を行えることが望まれている。
り対象の複数種類の帳票の画像データを読み取り、各帳
票を識別するための帳票識別用特徴情報を予め帳票フォ
ーマット格納メモリに登録しておき、個々に入力される
帳票の画像データの特徴情報と上記の予め登録されてい
る帳票識別用特徴情報とを照合して帳票識別し、その識
別結果に基づいて画像を処理するこを特徴とするもので
ある。
の画像データを入力し、その画像データを画像メモリに
格納する画像入力手段と、取り扱うすべての帳票の画像
データからそれぞれ抽出した帳票識別用特徴情報を予め
登録した帳票フォーマット格納メモリと、入力画像の特
徴情報を抽出する特徴情報抽出処理部と、抽出した特徴
情報と上記の予め登録されている帳票識別用特徴情報と
を照合して帳票を識別する帳票識別手段と、入力画像を
回転する画像回転処理部とからなり、帳票識別後、その
帳票識別結果の画像回転要の情報に基づいて予め指定し
た方向に画像を回転することを特徴とする。
ト処理するカラードロップアウト処理部を設け、帳票識
別後、その帳票識別結果のカラードロップアウト処理要
の情報に基づいて予め指定した色をドロップアウト処理
をすることを特徴とする。
いて、1は画像入力処理部であり、入力対象である帳票
の画像を画像データとして入力し、画像データ格納メモ
リ2に格納する機能を有する。一般にスキャナ装置、F
AX等がこれにあたる。画像データ格納メモリ2は画像
入力処理部1で入力した画像データを格納するメモリで
ある。
タ格納メモリ2に格納されている画像データから帳票識
別のインプットとなる特徴情報を抽出する機能をもつ。
一般に罫線特徴(帳票を構成する罫線の形状、長さ、本
数、構成等からなる情報)や領域特徴(帳票上のタイト
ル等ユニークな特徴をもつ領域の位置情報、パターン情
報からなる情報)が特徴情報にあたる。
抽出処理部3で抽出した特徴情報を格納するメモリであ
る。5は帳票フォーマット格納メモリであり、本システ
ムで分類対象としているすべての帳票識別用特徴情報
と、その帳票の文字認識等の処理の対象となる領域の位
置や属性に関する情報を予め設定した帳票フォーマット
情報を格納するメモリである。本帳票フォーマット格納
メモリ5には、分類対象として予め登録したすべてまた
は分類対象の一部の帳票フォーマット情報が格納されて
いる。なお、帳票識別用特徴情報のみを格納してもよい
もので、この場合、文字認識対象領域の位置や属性に関
する帳票フォーマット情報はディスク等の外部記憶装置
においておくことができる。
ット格納メモリ5に格納されている帳票識別用特徴情報
と特徴情報格納メモリ4に格納された個々の入力画像の
特徴情報を照合することによって、該当帳票を特定また
は絞り込む機能をもつ。帳票識別が成功した場合は、識
別結果の帳票を示すデータ(帳票名やID等)を、帳票
識別結果格納メモリ7に格納する。
格納メモリ7に格納されている帳票識別結果から帳票識
別用特徴情報を有する帳票フォーマット格納メモリ5を
参照し、画像回転方向の情報を得て、画像データ格納メ
モリ2に格納されている画像データを指定された方向に
回転する。9は回転後画像データ格納メモリであり、方
向回転後の画像データを格納するメモリである。
マット格納メモリ5に格納されている該当帳票のフォー
マットを参照しながら回転後画像データ格納メモリ9に
格納されている画像データ上に処理対象となる領域を設
定する機能をもつ。処理対象帳票例を図2に示す。帳票
13は、例えばA4横サイズ(A4サイズ用紙を横長に
おいた方向を正方向とするもの)の帳票である。
を縦長においた方向を正方向とするもの)の帳票であ
る。上記の帳票13、14をひとつのスキャナで混在読
み取りされるものとする。読み取り処理時間を短縮する
目的で、また、横方向サイズの混在によるスキューやジ
ャム等の障害を防いでスキャナ走行を円滑化する目的
で、帳票14をA4横方向にスキャナにセットし、右ま
たは左、図示では右90度回転の画像を取得する(帳票
14ーB)。
のままで特徴情報(罫線特徴等)を抽出して登録する。
帳票14は、画像取得時と同じ方向の右(左)に90度
回転した画像(帳票14ーB)として帳票識別用特徴情
報を取得する。処理対象となる領域の位置情報は、正方
向の画像(帳票14ーA)で取得する。
入力し、画像データ格納メモリ2に格納する。(画像入
力) S2、特徴情報抽出処理部3が、画像データ格納メモリ
2に格納された処理対象帳票の画像データから識別用の
特徴情報を抽出し、特徴情報格納メモリ4に格納する。
特徴情報には、罫線特徴のように、画像データのみから
抽出できるものと、領域情報のように、帳票フォーマッ
トに登録されている情報をもとに抽出するものがある。
後者の場合は、帳票フォーマット格納メモリ5も合わせ
て参照する。(特徴情報抽出) S3、帳票識別処理部6が、帳票フォーマット格納メモ
リ5から予め登録されている処理対象帳票の帳票識別用
特徴情報を順に取り出し、画像データ格納メモリ2に格
納されている画像データの特徴情報と照合することによ
り、画像データがどの帳票であるかを識別する。その識
別結果を帳票識別結果格納メモリ7に格納する。該当す
る帳票があった場合は、その帳票を特定する情報(帳票
名やID等)を格納する。該当する帳票がない場合に
は、エラーコード等の該当なしがわかる情報を格納す
る。(帳票識別) S4、該当する帳票があった場合は、帳票フォーマット
格納メモリ5に格納されているこの帳票の帳票フォーマ
ットから領域設定処理の前に、画像回転が必要か否かを
示す情報を読み出す。つまり、処理対象帳票が図2に示
す帳票13である場合には「NO:画像回転なし」、帳
票14である場合には、「YES:左90度回転」とい
うことになる。
部8が、画像を帳票フォーマットで指定された方向に回
転する。つまり、図2の帳票14の場合には、帳票14
ーBの方向の画像が取得されているために、左90度回
転して帳票14ーAの方向に戻す。回転後の画像データ
を回転後画像データ格納メモリ9に格納する。 S6、領域設定処理部10が、特定された帳票の文字認
識対象領域の位置や属性に関する情報を帳票フォーマッ
ト格納メモリ5から取り出し、領域を設定する。
処理を行う。 以上の説明による実施の形態によると、入力帳票の用紙
方向が混在する帳票画像処理システムにおいて、用紙の
方向をそろえて画像入力し、そのままの方向で帳票識別
を行った後、画像回転が必要な帳票である場合には、画
像を回転させ、それ以降の領域設定、文字認識等の処理
を行うことができるために、スキュー等の発生が少なく
画像の取得精度が向上すると共に画像取得時間の短縮を
はかることができる。
縦帳票と用紙方向の異なる帳票と混在させて読み取るこ
とが可能となる。 第2実施の形態例 装置のブロック図を図4に示す。その構造は上記第1実
施の形態例とほぼ同様であるために説明は省略する。
系の色で印刷されている帳票であり、帳票16ーAは、
罫線が赤系の色で印刷されている帳票である。これらの
青系や赤系の色で印刷されている罫線の色をドロップア
ウトして罫線が見えない状態の画像にすることで認識性
能の向上をはかることがきる。ところが、罫線をドロッ
プアウトしてしまうと、帳票15ーBと帳票16ーBの
ように帳票を識別する特徴がなくなってしまう。そこ
で、フォーマット登録時に、帳票識別用の特徴情報を抽
出する際に、帳票15、16ともカラードロップアウト
処理を行う前の画像15ーA、16ーAを使用する。
入力し、画像データ格納メモリ2に格納する。この時点
では、カラードロップアウト処理が実行されていないた
めに帳票15ーA、16ーAの画像が入力される。(画
像入力) S2、特徴情報抽出処理部3が、画像データ格納メモリ
2に格納された処理対象帳票の画像データから帳票識別
用の特徴情報を抽出し、特徴情報格納メモリ4に格納す
る。特徴情報には、罫線特徴のように、画像データのみ
から抽出できるものと、領域情報のように、帳票フォー
マットに登録されている情報をもとに抽出するものがあ
る。後者の場合は、帳票フォーマット格納メモリ5も合
わせて参照する。(特徴情報抽出) S3、帳票識別処理部6が、帳票フォーマット格納メモ
リ5から予め登録されている処理対象帳票の帳票識別用
特徴情報を順に取り出し、画像データ格納メモリ2に格
納されている画像データの特徴情報と照合することによ
り、画像データがどの帳票であるかを識別する。その識
別結果を帳票識別結果格納メモリ7に格納する。該当す
る帳票があった場合は、その帳票を特定する情報(帳票
名やID等)を格納する。該当する帳票がない場合に
は、エラーコード等の該当なしがわかる情報を格納す
る。(帳票識別) S4、該当する帳票があった場合は、帳票フォーマット
格納メモリ5に格納されているこの帳票の帳票フォーマ
ットから領域設定、文字認識等の前にカラードロップア
ウトが必要か否かを示す情報を読み出す。つまり、処理
対象帳票が図5に示す帳票15である場合には「YE
S:青系ドロップアウト」、帳票16である場合には、
「YES:赤系ドロップアウト」ということになる。
は、カラードロップアウト処理部11が、帳票フォーマ
ットで指定された色で画像のカラークラスタリング処理
を行う。帳票15の場合には、青系ドロップアウト処理
を行い、画像15ーBのような画像がカラードロップア
ウト後画像データ格納メモリ12に格納される。帳票1
6の場合には、赤系ドロップアウト処理を行い、画像1
6ーBのような画像がカラードロップアウト後画像デー
タ格納メモリ12に格納される。
帳票の文字認識対象領域の位置や属性に関する情報を帳
票フォーマット格納メモリ5から取り出し、領域を設定
する。 S7、設定された領域に対し、カラードロップアウト後
の画像データを使用して文字認識処理を行う。
力帳票にドロップアウトカラーが混在する帳票画像処理
システムにおいて、カラードロップアウト処理前の画像
を入力し、その画像で帳票識別を行った後、識別結果に
応じたカラードロップアウト処理を行い、その処理後、
領域設定、文字認識等の処理を行うことによって処理対
象帳票の種類を広げると共に文字認識の精度の向上をは
かることができる。
み取り対象の複数種類のすべての帳票の画像データを読
み取り、各帳票を識別するための帳票識別用特徴情報と
して予め帳票フォーマット格納メモリに登録しておき、
個々に入力される帳票の画像データの特徴情報と上記の
予め登録されている帳票識別用特徴情報とを照合するこ
とによりその個々に入力される帳票を識別することがで
きるようにしたことにより、表示方向が縦横混在してい
る帳票の場合、その個々に入力される画像を識別して正
方向に回転が必要な画像データは回転させて方向を直し
て文字認識対象領域を設定することができる効果を有す
る。
その個々に入力される帳票をカラードロップアウトして
処理することができ、処理対象帳票の種類を広げると共
に文字認識の精度を向上させることができる効果を有す
る。
Claims (3)
- 【請求項1】 読み取り対象の複数種類の帳票の画像デ
ータを読み取り、各帳票を識別するための帳票識別用特
徴情報を予め帳票フォーマット格納メモリに登録してお
き、個々に入力される帳票の画像データの特徴情報と上
記の予め登録されている帳票識別用特徴情報とを照合し
て帳票識別し、その識別結果に基づいて画像を処理して
文字認識等の処理対象領域の位置を決定することを特徴
とする帳票読み取り方法。 - 【請求項2】 読み取り対象の帳票の画像データを入力
し、その画像データを画像メモリに格納する画像入力手
段と、 取り扱うすべての帳票の画像データからそれぞれ抽出し
た帳票識別用特徴情報を予め登録した帳票フォーマット
格納メモリと、 入力画像の特徴情報を抽出する特徴情報抽出処理部と、 抽出した特徴情報と上記の予め登録されている帳票識別
用特徴情報とを照合して帳票を識別する帳票識別手段
と、 入力画像を回転する画像回転処理部とからなり、帳票識
別後、その帳票識別結果の画像回転要の情報に基づいて
帳票フォーマットで予め指定した方向に画像を回転させ
て文字認識等の処理対象領域の位置を決定することを特
徴とする帳票読み取りシステム。 - 【請求項3】 読み取り対象の帳票の画像データを入力
し、その画像データを画像メモリに格納する画像入力手
段と、 取り扱うすべての帳票の画像データからそれぞれ抽出し
た帳票識別用特徴情報を予め登録した帳票フォーマット
格納メモリと、 入力画像の特徴情報を抽出する特徴情報抽出処理部と、 抽出した特徴情報と上記の予め登録されている帳票識別
用特徴情報とを照合して帳票を識別する帳票識別手段
と、 入力画像をカラードロップアウト処理するカラードロッ
プアウト処理部とからなり、帳票識別後、その帳票識別
結果のカラードロップアウト処理要の情報に基づいて帳
票フォーマットで予め指定した色をドロップアウト処理
をして文字認識等の処理対象領域の位置を決定すること
を特徴とする帳票読み取りシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000182735A JP4544703B2 (ja) | 2000-06-19 | 2000-06-19 | 帳票読み取り方法および帳票読み取りシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000182735A JP4544703B2 (ja) | 2000-06-19 | 2000-06-19 | 帳票読み取り方法および帳票読み取りシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002007960A true JP2002007960A (ja) | 2002-01-11 |
JP4544703B2 JP4544703B2 (ja) | 2010-09-15 |
Family
ID=18683437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000182735A Expired - Fee Related JP4544703B2 (ja) | 2000-06-19 | 2000-06-19 | 帳票読み取り方法および帳票読み取りシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4544703B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009146305A (ja) * | 2007-12-17 | 2009-07-02 | Oki Electric Ind Co Ltd | 帳票データ処理サーバ、システム及び方法 |
JP2011070461A (ja) * | 2009-09-26 | 2011-04-07 | Oki Electric Industry Co Ltd | 帳票順序自動修正システム |
CN104281847A (zh) * | 2013-07-12 | 2015-01-14 | 步步高教育电子有限公司 | 一种点读方法、装置及设备 |
-
2000
- 2000-06-19 JP JP2000182735A patent/JP4544703B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009146305A (ja) * | 2007-12-17 | 2009-07-02 | Oki Electric Ind Co Ltd | 帳票データ処理サーバ、システム及び方法 |
JP2011070461A (ja) * | 2009-09-26 | 2011-04-07 | Oki Electric Industry Co Ltd | 帳票順序自動修正システム |
CN104281847A (zh) * | 2013-07-12 | 2015-01-14 | 步步高教育电子有限公司 | 一种点读方法、装置及设备 |
CN104281847B (zh) * | 2013-07-12 | 2017-10-03 | 步步高教育电子有限公司 | 一种点读方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP4544703B2 (ja) | 2010-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2192436C (en) | System and method for automatic page registration and automatic zone detection during forms processing | |
US20020145746A1 (en) | Document processing using color marking | |
US6959121B2 (en) | Document image processing device, document image processing method, and memory medium | |
US20030190094A1 (en) | Document identification device, document definition method and document identification method | |
US20110280480A1 (en) | System and method for enhancing security printing | |
US20230273952A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2000285190A (ja) | 帳票識別方法および帳票識別装置および記憶媒体 | |
US20020054706A1 (en) | Image retrieval apparatus and method, and computer-readable memory therefor | |
CN109583463B (zh) | 训练用于确定文档类别的分类器的系统和方法 | |
JP4544703B2 (ja) | 帳票読み取り方法および帳票読み取りシステム | |
CN101930546B (zh) | 图像处理装置和图像处理方法 | |
JP2003087562A (ja) | 画像処理装置および画像処理方法 | |
JP3648050B2 (ja) | 帳票画像分類方法、帳票画像登録方法および帳票画像分類装置 | |
US6678427B1 (en) | Document identification registration system | |
JP3090070B2 (ja) | 帳票識別方法及び装置 | |
US7110600B1 (en) | Document identifying device and method | |
JP2001222717A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP2002358521A (ja) | 帳票フォーマット登録・識別装置、方法及びプログラム | |
JPH07152856A (ja) | 光学的文字読取装置 | |
JP2908548B2 (ja) | 認識方式 | |
JP2003115029A (ja) | 帳票読取装置 | |
JP2002109468A (ja) | 文字認識装置及び文字認識方法 | |
JPH10269311A (ja) | 帳票処理単位指定方法 | |
JP2002352238A (ja) | 画像処理装置、画像処理方法、プログラム、及び記録媒体 | |
JP2004145385A (ja) | 帳票処理システムおよび帳票処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080911 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081127 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090115 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20090227 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100629 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4544703 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |