JP5862396B2 - 帳票判別装置及びプログラム - Google Patents
帳票判別装置及びプログラム Download PDFInfo
- Publication number
- JP5862396B2 JP5862396B2 JP2012065774A JP2012065774A JP5862396B2 JP 5862396 B2 JP5862396 B2 JP 5862396B2 JP 2012065774 A JP2012065774 A JP 2012065774A JP 2012065774 A JP2012065774 A JP 2012065774A JP 5862396 B2 JP5862396 B2 JP 5862396B2
- Authority
- JP
- Japan
- Prior art keywords
- binarized data
- data
- logical operation
- area
- entry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
[2]前記判別手段は、前記第1及び第3の2値化データ間で論理演算を行い、前記既知の帳票の定型部分の一致性を示す第1の指数を求め、前記第2及び第3の2値化データ間で論理演算を行い、前記既知の帳票の定型部分以外の領域の一致性を示す第2の指数を求め、前記第1及び第2の指数に基づいて前記帳票の判別を行う前記[1]に記載の帳票判別装置。
[3]前記判別手段は、前記第1、第2、及び第3の2値化データ間で論理演算を行い、前記記入欄に記入された前記領域の数に対応する第1の度数を求め、前記第1及び第2の2値化データ間で論理演算を行い、前記記入欄の前記領域の数に対応する第2の度数を求め、前記第1の度数と前記第2の度数との関係、及び前記第1及び第2の指数に基づいて前記帳票の判別を行う前記[2]に記載の帳票判別装置。
[4]既知の複数種の帳票について前記生成手段によって生成された複数種の前記第1及び第2の2値化データを記憶する記憶手段をさらに備え、前記判別手段は、前記複数種の第1及び第2の2値化データから選択した前記第1及び第2の2値化データ、及び前記第3の2値化データ間で論理演算を行い、前記論理演算の結果に基づいて前記判別対象に対して帳票の判別を行う前記[1]乃至[3]のいずれかに記載の帳票判別装置。
[5]前記生成手段は、前記第1、第2及び第3の画像をそれぞれ第1のサイズと前記第1のサイズよりも小さい第2のサイズの複数の領域に分割して2つの前記第1、第2及び第3の2値化データを生成し、前記判別手段は、前記第1のサイズの領域に分割されて生成された前記第1、第2及び第3の2値化データ間の前記論理演算を行い、前記帳票の判別を行えなかったとき、前記第2のサイズの領域に分割されて生成された前記第1、第2及び第3の2値化データ間の前記論理演算を行い、前記帳票の判別を行う前記[1]乃至[4]のいずれかに記載の帳票判別装置。
請求項2に係る発明によれば、定型部分の一致性と、定型部分以外の領域(空白領域)の一致性の両方を用いることで、いずれか一方の一致性のみを用いる場合よりも高い精度で帳票の判別が可能になる。
請求項3に係る発明によれば、さらに記入欄に記入された領域の数に対応する第1の度数と記入欄の領域の数に対応する第2の度数との関係を用いることで、本構成を採用しない場合と比べて、定型部分が類似している帳票の誤判定を少なくすることができる。
請求項4に係る発明によれば、複数種の第1及び第2の2値化データを予め処理をして登録しておくことで、その都度2値化データを生成する場合と比べて、帳票の判別の高速化が図れる。
請求項5に係る発明によれば、比較する帳票データが数多く存在するときに、本構成を採用しない場合と比べて、比較する帳票データを絞り込みながら、計算量を少なくして帳票の判別を行うことができる。
図1は、本発明の実施の形態に係る帳票判別装置の概略の構成例を示す図である。この帳票判別装置1は、各種のプログラムやデータが記憶される記憶部2と、帳票の解析を行う帳票解析部3と、帳票のフォームを判定する帳票フォーム判定部5と、帳票の記入領域を判定する帳票記入領域判定部6と、帳票の種類を判別する帳票判別部7と、本装置1の各部を制御する制御部4とを有して概略構成されている。
次に、帳票判別装置1の動作の一例を、図2〜図6を参照して説明する。
図3は、帳票解析部3の動作の一例を示すフローチャートである。帳票解析部3の動作は、後述する(2)制御部の帳票テンプレート作成部としての動作、(3)帳票フォーム判定部の動作、(4)帳票記入領域判定部の動作において、サブルーチンとして実施されるものである。帳票解析部3は、制御部4から未記入帳票データ100A、記入済み帳票データ100B又はスキャン画像100Cが入力されると(S11)、領域分割部30は、入力された未記入帳票データ100A、記入済み帳票データ100B又はスキャン画像100Cをメッシュ状に複数の分割領域110に分割する(S12)。
図4は、制御部4の帳票テンプレート作成部としての動作の一例を示すフローチャートである。制御部4は、記憶部2から未記入帳票データ100Aを取得し(S21)、帳票解析部3に帳票解析を行わせる(S22)。帳票解析部3は、図3のフローチャートに示すように、未記入帳票データ100Aについて帳票解析を行い、図2(a)の下段に示すような0/1からなる未記入2値化データ200Aを生成する(S23)。制御部4は、帳票解析部3が生成した未記入2値化データ200Aを帳票テンプレート21として記憶部2に記憶する。
図5は、帳票フォーム判定部5の動作の一例を示すフローチャートである。制御部4の帳票テンプレート作成部としての動作により記憶部2には、帳票テンプレート21として未記入2値化データ200A及び記入済み2値化データ200Bが記憶されている。
図6は、帳票記入領域判定部6の動作の一例を示すフローチャートである。帳票記入領域判定部6は、判別対象2値化データ200Cを取得する(S51)。帳票記入領域判定部6は、記入領域一致度数カウンタ62を「0」に初期化し(S52)、記入領域度数カウンタ63を「0」に初期化する(S53)。
本実施の形態によれば、以下の効果を奏する。
(ア)枠や罫線を有していない帳票でも予め付与された識別情報に依らずに帳票の判別が可能になる。
(イ)帳票のフォームの一致性を示す帳票不一致指数と、フォーム以外の領域(空白領域)の一致性を示す帳票不一致指数の両方を用いることで、いずれか一方の帳票不一致指数のみを用いる場合よりも高い精度で帳票の判別が可能になる。
(ウ)上記帳票不一致指数に加えて、記入欄130に記入された分割領域110の数に対応する記入領域一致度数と記入欄130の分割領域110の数に対応する記入領域一致度数との関係を用いることで、本構成を採用しない場合と比べて、定型部分が類似している帳票の誤判定を少なくすることができる。
(エ)また、本実施の形態では、画像を矩形に分割しているため、原稿が横書きでも縦書きでも、特に支障なく同じロジックで帳票を判別することが可能である。
第2の実施の形態では、帳票解析部3は、未記入帳票データ100A、記入済み帳票データ100B及びスキャン画像100Cをそれぞれ第1のサイズと第1のサイズよりも小さい第2のサイズの複数の領域に分割して2種類の未記入2値化データ200A、記入済み2値化データ200B及び判別対象2値化データ200Cを生成し、帳票フォーム判定部5及び帳票記入領域判定部6は、第1のサイズの領域に分割されて生成された未記入2値化データ200A、記入済み2値化データ200B及び判別対象2値化データ200C間の論理演算を行い、帳票判別部7の判別結果として一致性が高い複数の帳票テンプレートが存在するなど、帳票テンプレートが絞り込めない、あるいは一意に定まらないとき、第2のサイズの領域に分割されて生成された未記入2値化データ200A、記入済み2値化データ200B及び判別対象2値化データ200C間の論理演算を行い、帳票判別部7が帳票の判別を行うようにしてもよい。なお、必ずしも帳票テンプレートが一意に定まらなくとも、例えば複合機のタッチパネルに一致性が高い順に判別結果を表示させ、利用者に選択させてもよい。
本実施の形態によれば、最初は分割数の小さいメッシュ(=少ないデータ量)で計算量を少なくして判定を実行し、絞り込んだ帳票テンプレート21に対してのみ分割数の大きいメッシュ(=多いデータ量)で詳細に判定をすることで、記憶部2に大量に帳票データが保存されているときでも、比較する帳票データを絞り込みながら、計算量を少なくして帳票の判別を行うことが可能になる。
本実施の形態は、既知の複数種の帳票について複数種の未記入2値化データ200A及び記入済み2値化データ200Bを帳票テンプレート21として記憶部2に予め処理して登録しておき、帳票フォーム判定部5、帳票記入領域判定部6及び帳票判別部7は、記憶部2が記憶する複数種の未記入2値化データ200A及び記入済み2値化データ200Bから選択した未記入2値化データ200A及び記入済み2値化データ200B、及び判別対象2値化データ200C間で論理演算を行い、帳票の判別を行ってよい。
本実施の形態によれば、複数種の未記入2値化データ200A及び記入済み2値化データ200Bを予め処理して登録しておくことで、その都度2値化データを生成する場合と比べて、帳票の判別の高速化が図れる。
本実施の形態は、「記入欄」を「記入しなければいけない領域」と「記入してもよい領域」に分けて判定してもよい。これにより、「記入しなければいけない領域」の「記入領域一致指数」はより高くならなければいけないと判断できるので、帳票の一致性をより精度良く判定できる。さらに、「記入しなければいけない領域」が未記入であることを、操作パネル部で警告することも可能になる。
スキャンで読み込んだ画像は、上下左右に画像がずれることがある。この場合、登録された帳票データとの比較のとき、スキャン画像の上下左右を数ブロックずらして、位置補正をすることで認識精度を向上することも可能になる。
本発明は、上記実施の形態の論理演算に限らない。例えば、上記実施の形態では、帳票不一致指数が小さい程、帳票の一致性が高くなるように論理演算を行ったが、帳票一致指数が大きい程、帳票の一致性が高くなるように論理演算を行ってもよい。
Claims (6)
- 既知の帳票の記入欄が未記入の第1の画像、前記既知の帳票の前記記入欄に既知のパターンが記入された第2の画像、及び判別対象の第3の画像をそれぞれ複数の領域に分割し、前記領域毎に2値化して第1、第2及び第3の2値化データを生成する生成手段と、
前記第1、第2及び第3の2値化データ間で論理演算を行い、前記論理演算の結果に基づいて前記判別対象に対して帳票の判別を行う判別手段と、
を備えた帳票判別装置。 - 前記判別手段は、前記第1及び第3の2値化データ間で論理演算を行い、前記既知の帳票の定型部分の一致性を示す第1の指数を求め、前記第2及び第3の2値化データ間で論理演算を行い、前記既知の帳票の定型部分以外の領域の一致性を示す第2の指数を求め、前記第1及び第2の指数に基づいて前記帳票の判別を行う請求項1に記載の帳票判別装置。
- 前記判別手段は、前記第1、第2、及び第3の2値化データ間で論理演算を行い、前記記入欄に記入された前記領域の数に対応する第1の度数を求め、前記第1及び第2の2値化データ間で論理演算を行い、前記記入欄の前記領域の数に対応する第2の度数を求め、前記第1の度数と前記第2の度数との関係、及び前記第1及び第2の指数に基づいて前記帳票の判別を行う請求項2に記載の帳票判別装置。
- 既知の複数種の帳票について前記生成手段によって生成された複数種の前記第1及び第2の2値化データを記憶する記憶手段をさらに備え、
前記判別手段は、前記複数種の第1及び第2の2値化データから選択した前記第1及び第2の2値化データ、及び前記第3の2値化データ間で論理演算を行い、前記論理演算の結果に基づいて前記判別対象に対して帳票の判別を行う請求項1乃至3のいずれか1項に記載の帳票判別装置。 - 前記生成手段は、前記第1、第2及び第3の画像をそれぞれ第1のサイズと前記第1のサイズよりも小さい第2のサイズの複数の領域に分割して2つの前記第1、第2及び第3の2値化データを生成し、
前記判別手段は、前記第1のサイズの領域に分割されて生成された前記第1、第2及び第3の2値化データ間の前記論理演算を行い、前記帳票の判別を行えなかったとき、前記第2のサイズの領域に分割されて生成された前記第1、第2及び第3の2値化データ間の前記論理演算を行い、前記帳票の判別を行う請求項1乃至4のいずれか1項に記載の帳票判別装置。 - 既知の帳票の記入欄が未記入の第1の画像、前記既知の帳票の前記記入欄に既知のパターンが記入された第2の画像、及び判別対象の第3の画像をそれぞれ複数の領域に分割し、前記領域毎に2値化して第1、第2及び第3の2値化データを生成する生成手段と、
前記第1、第2及び第3の2値化データ間で論理演算を行い、前記論理演算の結果に基づいて前記判別対象に対して帳票の判別を行う判別手段としてコンピュータを実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012065774A JP5862396B2 (ja) | 2012-03-22 | 2012-03-22 | 帳票判別装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012065774A JP5862396B2 (ja) | 2012-03-22 | 2012-03-22 | 帳票判別装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013196611A JP2013196611A (ja) | 2013-09-30 |
JP5862396B2 true JP5862396B2 (ja) | 2016-02-16 |
Family
ID=49395413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012065774A Expired - Fee Related JP5862396B2 (ja) | 2012-03-22 | 2012-03-22 | 帳票判別装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5862396B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7181445B2 (ja) | 2017-11-30 | 2022-12-01 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法とプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62177686A (ja) * | 1986-01-31 | 1987-08-04 | Toshiba Corp | 光学的文字読取装置 |
JPH07117985B2 (ja) * | 1991-06-28 | 1995-12-18 | 日本アビオニクス株式会社 | パターン認識方法および装置 |
JPH09130521A (ja) * | 1995-10-31 | 1997-05-16 | Toshiba Corp | テキストデータ出力ホワイトボード及びそのデータ出力方法 |
JP3090070B2 (ja) * | 1996-11-26 | 2000-09-18 | 日本電気株式会社 | 帳票識別方法及び装置 |
JP3842006B2 (ja) * | 2000-03-30 | 2006-11-08 | グローリー工業株式会社 | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
2012
- 2012-03-22 JP JP2012065774A patent/JP5862396B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7181445B2 (ja) | 2017-11-30 | 2022-12-01 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法とプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2013196611A (ja) | 2013-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6928876B2 (ja) | フォーム種別学習システムおよび画像処理装置 | |
US10984233B2 (en) | Image processing apparatus, control method, and non-transitory storage medium that obtain text data for an image | |
JP2014092899A (ja) | 画像処理装置及び画像処理プログラム | |
JP6642970B2 (ja) | 注目領域検出装置、注目領域検出方法及びプログラム | |
US20090180690A1 (en) | Image searching apparatus and image searching method | |
US11710329B2 (en) | Image processing apparatus with automated registration of previously encountered business forms, image processing method and storage medium therefor | |
JP6607122B2 (ja) | 画像解析装置 | |
JP5862396B2 (ja) | 帳票判別装置及びプログラム | |
US8600099B2 (en) | Method of detecting embedded data from image data having a plurality of types of data embedded therein | |
US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
JP5365440B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20230027065A1 (en) | Image processing apparatus, image processing method, and non-transitory recording medium | |
JP6247103B2 (ja) | 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム | |
JP3186246B2 (ja) | 文書読取装置 | |
JP5720182B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20210019554A1 (en) | Information processing device and information processing method | |
JP2014120832A (ja) | 画像処理装置及び画像処理プログラム | |
JP6070302B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP2019153230A (ja) | 情報処理装置及び情報処理プログラム | |
JP2020047138A (ja) | 情報処理装置 | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
US20240236245A1 (en) | Image processing apparatus, control method for image processing apparatus, and non-transitory storage medium | |
JP3186712B2 (ja) | 文書読取装置 | |
JP2016053797A (ja) | 画像処理装置及び画像処理プログラム | |
KR101574409B1 (ko) | 출판물의 핑거프린트 생성 방법과 이를 이용한 출판물 식별 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5862396 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |