JP3932201B2 - 帳票種識別装置および記録媒体 - Google Patents

帳票種識別装置および記録媒体 Download PDF

Info

Publication number
JP3932201B2
JP3932201B2 JP2005238614A JP2005238614A JP3932201B2 JP 3932201 B2 JP3932201 B2 JP 3932201B2 JP 2005238614 A JP2005238614 A JP 2005238614A JP 2005238614 A JP2005238614 A JP 2005238614A JP 3932201 B2 JP3932201 B2 JP 3932201B2
Authority
JP
Japan
Prior art keywords
type
input
identifying
coefficient
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2005238614A
Other languages
English (en)
Other versions
JP2005346736A (ja
Inventor
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005238614A priority Critical patent/JP3932201B2/ja
Publication of JP2005346736A publication Critical patent/JP2005346736A/ja
Application granted granted Critical
Publication of JP3932201B2 publication Critical patent/JP3932201B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

本発明は、定型帳票の文字認識装置において、定型帳票の種類を自動識別する帳票種識別装置および記録媒体に関する。
従来、定型帳票の文字認識装置においては、予め認識すべき帳票上の位置と、記入される文字種を登録しておき、その情報を基に文字領域を決定し、認識を行っていた。そして、複数種の帳票を処理対象にする場合、上記した情報を複数登録しておき、処理対象の帳票が登録されている帳票のどの種類に属するかを判断し、適切な帳票情報を選択する必要がある。
上記した作業を人手で行うことは作業効率を低下させることから、自動で行うことが望ましい。そのために、例えば帳票毎に帳票の種類を示すマークや記号を印刷する方法が考えられるが、専用の帳票が必要となり、コストアップとなってしまう。
そこで、専用の帳票を必要としない方法として、帳票中の罫線の情報を使用することにより、帳票の書式を識別する方法がある(例えば、特許文献1を参照)。
特開平8−315068号公報
しかし、上記した方法では罫線の存在しない帳票は識別ができないため、使用できる帳票の書式が限定されるという問題があった。
本発明の目的は、専用の帳票を作成することなく、罫線の存在しない帳票に対しても識別することができる帳票種識別装置および記録媒体を提供することにある。
請求項1記載の発明では、定型帳票と入力した入力帳票とを比較することにより、該入力帳票の種類を識別する帳票種識別装置において、前記定型帳票と前記入力帳票との対応する点を検出する対応点検出手段と、前記対応する点を座標変換する係数を算出する係数算出手段と、前記係数をもとに、前記定型帳票と前記入力帳票との回転を考慮した相違度を算出する相違度算出手段と、前記相違度をもとに前記入力帳票の種類を識別する識別手段と、を備えることを特徴としている。
請求項2記載の発明では、定型帳票と入力した入力帳票とを比較することにより、該入力帳票の種類を識別する帳票種識別装置において、前記定型帳票と前記入力帳票との対応する点を検出する対応点検出手段と、前記対応する点をアフィン変換するアフィン変換の係数を算出する係数算出手段と、前記アフィン変換の係数をもとに、前記定型帳票と前記入力帳票との相違度を算出する相違度算出手段と、前記相違度をもとに前記入力帳票の種類を識別する識別手段と、を備えたことを特徴としている。
請求項3記載の発明では、前記対応点検出手段が対応する点を検出できないとき、前記識別手段は、前記入力帳票は前記定型帳票に該当しないと判断することを特徴としている。
請求項4記載の発明では、前記係数算出手段が所定の閾値以上の係数を得たとき、前記識別手段は、前記入力帳票は前記定型帳票に該当しないと判断することを特徴としている。
請求項記載の発明では、前記相違度算出手段が所定の閾値以下の相違度を得たとき、前記識別手段は、他の定型帳票との相違度を求めることなく、前記閾値以下の相違度をもつ定型帳票を、前記入力帳票に該当する帳票種であると識別することを特徴としている。
請求項記載の発明では、請求項1乃至5のいずれか1項に記載の各手段をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴としている。
本発明によれば、帳票にマークや記号を印刷することなく、処理対象帳票が登録されている帳票の何れに該当するかを自動的に識別することができる。また、相違度が所定の閾値以下のとき、処理を打ち切っているので、照合に要する時間が大幅に短縮される。さらに、登録されていない種類の帳票画像が入力されても、該当する帳票がない旨を出力することができる。
また、処理対象画像が誤ってさかさま、あるいは横倒しの状態で入力された場合でも、その種類を自動的に識別することができる。さらに、処理対象の画像を回転する際に、対応点として必要な画像部分のみを回転させているので、高速処理が可能となる。
以下、発明の実施の形態について図面により詳細に説明する。
実施例1:
図1は、本発明の実施例1の構成を示す。図において、1はスキャナなどの画像入力手段、2は処理対象となる入力画像(定型帳票)のイメージデータを格納する画像格納手段、3は登録対象となる定型帳票画像のイメージデータを格納する登録画像格納手段、4は処理対象画像と登録画像間との対応点を検出する対応点検出手段、5は対応点検出結果から変換係数を求める変換係数算出手段、6は変換係数から画像間の相違度を求める画像間相違度算出手段、7は相違度を基の帳票種を判定する帳票種判定手段である。
図2は、実施例1の処理フローチャートを示す。以下、図2のフローチャートを参照しながら本発明の処理動作を説明する。
スキャナなどの画像入力手段1によって登録対象となる複数の定型帳票などの原稿を読み取り(ステップ101)、原稿のイメージデータを登録画像格納手段3に格納する(ステップ102)。これらの原稿は、予め帳票のどの部分に認識すべき文字があるのかを登録するものである。
続いて、処理対象の定型帳票を画像入力手段1によって入力し、画像格納手段2に格納する(ステップ103、104)。ここで、処理対象の定型帳票には、認識対象となる文字が記入されていて、認識処理の前処理として、以下の処理ステップが実行される。
次に、対応点検出手段4は、登録画像格納手段3から1枚の登録帳票画像を読み出し、登録帳票画像と画像格納手段2内の処理対象画像との対応する点を検出する(ステップ105)。対応点の検出方法としては、例えば、罫線の位置、帳票固有の文字の印刷位置などの座標値を比較することにより対応する点を座標値として求めればよい。ここで比較する帳票の種類が異なる場合は、互いの帳票が持つべき印刷文字などが発見できないか、誤って発見されることになる。
次いで、変換係数算出手段5は、変換係数の算出を行う(ステップ106)。ここで変換係数とは、一方の画像上の座標値を変換係数を用いて変換すると、他方の画像の座標値として求められる、変換式を構成する係数のことであり、例えばアフィン変換の係数などが挙げられる。
算出方法としては、アフィン変換を例にすれば、一方の画像上の点を(x,y)、他方の画像上で対応する点を(X,Y)とおけば、アフィン変換の係数a〜fを用いて、
Figure 0003932201
と書ける。ここで、対応する点の組(x,y)と(X,Y)の組を6組求めれば、6元1次連立方程式となり、変換係数a〜fを求めることができる。
次いで、画像間相違度算出手段6は、画像間の相違度を算出する(ステップ107)。
相違度は変換係数から求めるが、ここではアフィン変換の係数から求める例を示す。
画像間の相違度は、互いのずれ、伸縮、回転を定量化し、これらの和として求めることができる。それぞれの特徴量を、
ずれ:e2+f2
伸縮:|ad−bc|
回転:b2+c2
と定義し、これらに適当な重みを付けて和をとり、相違度とする。
上記した処理を登録されている帳票種のすべてについて行い、相違度を求める(ステップ108)。相違度を求めたら、帳票種判定手段7は、それらを比較し(ステップ109)、最も相違度の小さいものを該当する帳票と判断し、結果を出力する(ステップ110)。
なお、上記した処理において、処理対象の帳票画像と、照合先の帳票種が一致しない場合は、前述したように、対応する点(印刷文字など)が発見できないか、誤って発見される。誤って発見された場合は、変換係数が通常から大きく離れた値を示す性質があり、そこから求まる相違度が大きくなる傾向があるので、該当帳票種としては判断されない。また、発見されない場合は、相違度の算出が不可能であるので、処理対象の画像が照合先の帳票種に該当しないと判断できるので、相違度として仮に非常に大きな値を与えておけば、相違度比較の段階でその帳票種に該当するものとは判断されない。
さらに、発見されない場合は相違度の算出が不可能なので、不可能と分かった段階で、該当しないと判断するようにしてもよい。また、誤って発見された場合は、変換係数が通常と大きく離れた値を示す性質があるので、変換係数が極端に離れていることが分かった段階で、該当しないと判断するようにしてもよい。
実施例2:
図3は、本発明の実施例2の構成を示す。本実施例では、帳票判定手段7を、処理打ち切り手段8と、該当帳票種不存在判定手段9で構成したもので、他の構成は実施例1と同様である。
図4は、実施例2の処理フローチャートを示す。ステップ201〜207までの処理は実施例1と同様であるので説明を省略する。帳票種判定手段7内の処理打ち切り手段8は、ステップ207で求めた画像間の相違度を、所定の閾値(打ち切り閾値と呼ぶ)と比較する(ステップ208)。打ち切り閾値は、相違度が打ち切り閾値以下であれば、それ以上の登録帳票画像との相違度算出を行わずに、その閾値以下の相違度を与えた帳票種を、処理対象の帳票画像であると判断するための値であり、これにより全ての登録画像との照合を行わないので、処理時間が短縮される。
相違度が打ち切り閾値以下であれば、その相違度を与えた帳票種を出力する(ステップ213)。閾値以上であれば、照合すべき帳票種がまだ残っているか否かを調べ(ステップ209)、残っていればステップ203に進み上記した処理を繰返し、残っていなければステップ210に進む。
該当帳票種不存在判定手段9では、相違度を比較する(ステップ210)。すなわち、各帳票毎に求めた相違度の内、最も小さい値(最小閾値)を選択する。次に、最小閾値と拒絶閾値を比較する(ステップ211)。ここで拒絶閾値とは、相違度が拒絶閾値以上であれば、処理対象の帳票画像に該当する帳票種が存在しない(登録されていない)と判断するための値である。これにより、未登録の帳票が入力された場合に、誤って登録されている帳票種であると識別することを防止することができる。
拒絶閾値以下であれば、最小閾値を与えた帳票種を出力し(ステップ213)、拒絶閾値以上であれば、該当する帳票種なしと出力する(ステップ212)。
実施例3:
上記した実施例の定型帳票種識別方法を用いた場合に、原稿を誤ってさかさまに入力したり、あるいは横倒しに入力したりすることが予想される。このような誤った入力が行われると、入力画像と登録されている画像との対応する点を検出することが困難になり、このために定型帳票種を識別できなくなる可能性がある。
そこで、本実施例では、原稿の向きを誤って入力した場合でも、正しく帳票種を識別できるようにしたものである。
図5は、実施例3の構成を示す。実施例1の構成にさらに、入力画像を回転した画像を生成する回転画像生成手段10を付加したもので、他の構成要素は実施例1と同様である。
図6は、実施例3の処理フローチャートを示す。ステップ308までの処理は、実施例1と同様である。
全ての登録画像との照合が終了すると、回転画像生成手段10は、画像格納手段2内の処理対象の入力画像を回転した画像を作成し、対応点検出手段4に与える(ステップ310)。ステップ105に進み、以下、実施例1で説明したと同様に処理する。
ここで、画像の回転は、図7に示すように画像全体を普通に回転させてもよいし、対応点を求める画像部分のみを回転させてもよい。対応点は印刷された文字などを手がかりに、同一画像(文字)を見つけ、それを手がかりに見つけるが、無地(白地)の画像にその文字だけを回転して「貼付ける」ようにすれば、画像全体を回転させるよりも処理が少なく済み、高速処理が可能となる。もちろん、文字であるか否かを精度よく判定する必要はなく、黒画素の連結成分の大きさを調べ、それが極端に大きいものや小さいものを除外して残りを文字と判定すればよく、それでも十分に高速に処理することができる。
回転角として例えば90度単位で回転させたとき、3種類の画像が作成されるが、回転させないときの相違度と、全ての回転角における相違度を算出すると(ステップ309)、帳票種判定手段7はそれらを比較し(ステップ311)、最も相違度の小さいものを該当する帳票種と判断し、結果を出力する(ステップ312)。
なお、上記した処理において、処理対象の帳票画像と、照合先の帳票種が一致しない場合は、前述したように、対応する点(印刷文字など)が発見できないか、誤って発見される。誤って発見された場合は、変換係数が通常から大きく離れた値を示す性質があり、そこから求まる相違度が大きくなる傾向があるので、該当帳票種としては判断されない。また、対応する点が発見されない場合は、相違度の算出が不可能であるので、不可能と分かった時点で該当しないと判定してもよい。
実施例4:
図8は、本発明の実施例4の構成を示し、ソフトウェアによって実現する実施例である。本発明をソフトウェアによって実現する場合には、図8に示すように、CPU21、メモリ22、ハードディスク23、入力装置24、CD−ROMドライブ25、ディスプレイ26、マウスなどからなる汎用の処理装置を用意する。CD−ROMなどのコンピュータ読み取り可能な記録媒体27には、本発明の帳票種識別の処理機能や処理手順を実現するプログラムが記録されている。また、処理対象の帳票や登録帳票の原稿画像は、例えばハードディスク23などに格納されている。そして、CPU21は、記録媒体27から上記した処理機能、処理手順を実現するプログラムを読み出し、帳票種の識別処理を実行し、その識別結果をディスプレイ26などに出力する。
本発明の実施例1の構成を示す。 本発明の実施例1の処理フローチャートを示す。 本発明の実施例2の構成を示す。 本発明の実施例2の処理フローチャートを示す。 本発明の実施例3の構成を示す。 本発明の実施例3の処理フローチャートを示す。 処理対象画像の回転例を説明する図である。 本発明の実施例4の構成を示す。
符号の説明
1 画像入力手段
2 画像格納手段
3 登録画像格納手段
4 対応点検出手段
5 変換係数算出手段
6 画像間相違度算出手段
7 帳票種判定手段
8 処理打ち切り手段
9 該当帳票種不存在判定手段
10 回転画像生成手段

Claims (6)

  1. 定型帳票と入力した入力帳票とを比較することにより、該入力帳票の種類を識別する帳票種識別装置において、
    前記定型帳票と前記入力帳票との対応する点を検出する対応点検出手段と、
    前記対応する点を座標変換する係数を算出する係数算出手段と、
    前記係数をもとに、前記定型帳票と前記入力帳票との回転を考慮した相違度を算出する相違度算出手段と、
    前記相違度をもとに前記入力帳票の種類を識別する識別手段と、
    を備えることを特徴とする帳票種識別装置。
  2. 定型帳票と入力した入力帳票とを比較することにより、該入力帳票の種類を識別する帳票種識別装置において、
    前記定型帳票と前記入力帳票との対応する点を検出する対応点検出手段と、
    前記対応する点をアフィン変換するアフィン変換の係数を算出する係数算出手段と、
    前記アフィン変換の係数をもとに、前記定型帳票と前記入力帳票との相違度を算出する相違度算出手段と、
    前記相違度をもとに前記入力帳票の種類を識別する識別手段と、
    を備えたことを特徴とする帳票種識別装置。
  3. 前記対応点検出手段が対応する点を検出できないとき、前記識別手段は、前記入力帳票は前記定型帳票に該当しないと判断することを特徴とする請求項1または2に記載の帳票種識別装置。
  4. 前記係数算出手段が所定の閾値以上の係数を得たとき、前記識別手段は、前記入力帳票は前記定型帳票に該当しないと判断することを特徴とする請求項1または2に記載の帳票種識別装置。
  5. 前記相違度算出手段が所定の閾値以下の相違度を得たとき、前記識別手段は、他の定型帳票との相違度を求めることなく、前記閾値以下の相違度をもつ定型帳票を、前記入力帳票に該当する帳票種であると識別することを特徴とする請求項1または2に記載の帳票種識別装置。
  6. 請求項1乃至5のいずれか1項に記載の各手段をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005238614A 1997-05-09 2005-08-19 帳票種識別装置および記録媒体 Expired - Lifetime JP3932201B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005238614A JP3932201B2 (ja) 1997-05-09 2005-08-19 帳票種識別装置および記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP11932997 1997-05-09
JP2005238614A JP3932201B2 (ja) 1997-05-09 2005-08-19 帳票種識別装置および記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP9290755A Division JPH1125215A (ja) 1997-05-09 1997-10-23 帳票種識別方法、装置および記録媒体

Publications (2)

Publication Number Publication Date
JP2005346736A JP2005346736A (ja) 2005-12-15
JP3932201B2 true JP3932201B2 (ja) 2007-06-20

Family

ID=35498991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005238614A Expired - Lifetime JP3932201B2 (ja) 1997-05-09 2005-08-19 帳票種識別装置および記録媒体

Country Status (1)

Country Link
JP (1) JP3932201B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6520279B2 (ja) * 2015-03-24 2019-05-29 富士ゼロックス株式会社 処理装置、画像処理システム、およびプログラム

Also Published As

Publication number Publication date
JP2005346736A (ja) 2005-12-15

Similar Documents

Publication Publication Date Title
JP5393428B2 (ja) コード検出及び復号化システム
EP0738987A2 (en) Processing machine readable forms
KR101235226B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
CN110569845A (zh) 一种试卷图像的校正方法及相关装置
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
JPH1125215A (ja) 帳票種識別方法、装置および記録媒体
JP3372111B2 (ja) ワットアワーメータ文字認識装置
JP6413542B2 (ja) 画像処理装置及び画像処理プログラム
JP3733310B2 (ja) 文書書式識別装置および識別方法
JP3932201B2 (ja) 帳票種識別装置および記録媒体
JPH10307889A (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
JPWO2006080568A1 (ja) 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム
JP3558493B2 (ja) 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体
TWM626684U (zh) 文件校對裝置
JP2006235786A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP3640488B2 (ja) 画像処理方法
JP2010152457A (ja) 画像処理装置及び画像処理プログラム
JPH11161738A (ja) 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体
TWI810623B (zh) 文件校對方法及裝置、電腦可讀取的記錄媒體
JP3712825B2 (ja) 画像処理方法、装置および記録媒体
JP4785158B2 (ja) イメージデータ傾き補正方法及びイメージ入力装置
JP4050677B2 (ja) 画像処理装置、画像処理方法及びプログラム並びに記録媒体
JP2009093360A (ja) 画像処理装置、画像処理方法およびプログラム
JPH11250179A (ja) 文字認識装置および文字認識方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070309

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110323

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120323

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120323

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130323

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140323

Year of fee payment: 7

EXPY Cancellation because of completion of term