JP4549355B2 - 帳票識別方法及び記録媒体 - Google Patents

帳票識別方法及び記録媒体 Download PDF

Info

Publication number
JP4549355B2
JP4549355B2 JP2007029458A JP2007029458A JP4549355B2 JP 4549355 B2 JP4549355 B2 JP 4549355B2 JP 2007029458 A JP2007029458 A JP 2007029458A JP 2007029458 A JP2007029458 A JP 2007029458A JP 4549355 B2 JP4549355 B2 JP 4549355B2
Authority
JP
Japan
Prior art keywords
master
input
image data
type
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2007029458A
Other languages
English (en)
Other versions
JP2007133907A (ja
Inventor
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007029458A priority Critical patent/JP4549355B2/ja
Publication of JP2007133907A publication Critical patent/JP2007133907A/ja
Application granted granted Critical
Publication of JP4549355B2 publication Critical patent/JP4549355B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、帳票処理システムにおいて行われる、登録されている複数種類のマスター帳票情報に基づいて処理対象の定型帳票の帳票種類を識別する帳票識別技術に係わり、特に、マスター帳票の画像データ入力時と処理対象の定型帳票の画像データ入力時とで入力条件などが異なっても処理対象の定型帳票の帳票識別を正しく行うことができる帳票識別方法およびこの方法をコンピュータにより実施するためのプログラムを記録した記録媒体に関する。
紙に書かれた帳票を自動的に処理する帳票処理においては、処理対象の定型帳票が、登録されている複数種類の帳票の何れかに該当しているか否かを識別し、いずれかに該当していれば、該当の登録帳票のフォーマットに従って所定の位置の文字認識を行ったりする。そのため、前記のような帳票識別が必要となり、その帳票識別の方法について、今までに多くの方法が提案されている。そのような方法のなかで最も一般的な方法は、帳票中の一部に帳票識別符号(ID)を印刷しておき、その帳票IDを照合して、どの帳票かを識別する方法である。しかし、この方法では、必ず、帳票に帳票IDを印刷しておかねばならず、既に流通している既存の帳票のように帳票IDが付いていない帳票では識別することができない。そのため、最近では、この帳票IDを利用しないで帳票を識別する方法も提案されている。この方法では、予め識別させたい帳票の画像情報をマスター帳票情報として登録しておき、帳票中の画像的特徴を用いて、パターンマッチングなどで、帳票を識別する方法であり、例えば、特開平11-25215号公報に示された帳票種識別方法などがある。この従来技術では、例えば罫線の位置など認識しやすい点を用いてマスター帳票の画像データと入力された処理対象の帳票の画像データとの対応点を複数求め、その複数の対応点を用いて二つの帳票のすべての点の対応付けを可能にする図16に示すような座標変換式を求め、対応付けられた各点のパターンを比較する処理を複数のマスター帳票との間で行い、最も類似度の高いマスター帳票をその帳票種類とする。また、特開平10-91783号公報に記載された従来技術では、前記のような帳票種識別方法において、識別対象の帳票の入力画像データと登録されているマスター画像データとの位置ずれを検出して補正する。二つの画像データのそれぞれから罫線などの所定の交点(+字部)の座標を検出して位置ずれ量を求めるのである。
特開平11−25215号公報 特開平10−91783号公報
しかしながら、前記の従来技術においてはいずれも、マスター画像登録時の入力条件と処理対象となる入力画像の入力条件が大きく異なる場合、例えば、入力時の濃度設定値や解像度が異なる場合、帳票種類を正しく識別することができないという問題があった。本発明の課題は、このような従来技術の問題を解決し、マスター帳票の画像登録時の入力条件と処理対象となる帳票の画像入力時の入力条件が大きく異なっていても、定型帳票の帳票種類を正しく識別することができる帳票識別方法などを提供することにある。
上記の目的を達成するために、本発明の帳票識別方法は、コンピュータの記憶部に登録されている複数種類のマスター帳票情報に基づいて入力された定型帳票の帳票種類を識別する帳票識別方法において、前記コンピュータが、マスター帳票1種類について異なる複数のマスター帳票情報を前記記憶部に登録するステップと、前記コンピュータが、入力された定型帳票の帳票種類を、前記登録された前記複数のマスター帳票情報と比較することにより識別するステップとを有し、前記異なる複数のマスター帳票情報は、入力されたマスター帳票の全ての画像データ又は該画像データ中の特徴的な部分を含むように構成することができる。前記のような手段にしたので、マスター帳票1種類について異なる複数のマスター帳票情報が登録され、入力された定型帳票の帳票種類を識別する際、前記複数のマスター帳票情報を用いて帳票種類が識別される。
また、上記の目的を達成するために、本発明の帳票識別方法は、さらに、前記コンピュータが、マスター帳票1種類について前記マスター帳票情報を入力する際の入力条件の異なる複数のマスター帳票情報を前記記憶部に登録するステップと、前記コンピュータが、前記入力された定型帳票の帳票種類を、前記登録された前記複数のマスター帳票情報と比較することにより識別するステップとを有するように構成することができる。前記のような手段にしたので、マスター帳票1種類について前記マスター帳票画像を入力する際の入力条件の異なる複数のマスター帳票情報が登録され、入力された定型帳票の帳票種類を識別する際、前記複数のマスター帳票情報を用いて帳票種類が識別される。
また、上記の目的を達成するために、本発明の帳票識別方法は、さらに、前記コンピュータが、マスター帳票1種類について解像度の異なる複数のマスター帳票情報を前記記憶部に登録するステップと、前記コンピュータが、前記入力された定型帳票の帳票種類を、前記登録された前記複数のマスター帳票情報と比較することにより識別するステップとを有するように構成することができる。前記のような手段にしたので、入力された定型帳票の帳票種類を識別する際、入力された定型帳票の画像データの他にその画像データの解像度を変換した画像データも用いて帳票種類が識別される。
また、上記の目的を達成するために、本発明の記録媒体は、前記の帳票識別方法をコンピュータにより実施するためのプログラムを記録するように構成することができる。これにより、前記の帳票識別方法を実施できるようにプログラミングしたプログラムをFD、CD−ROM、MOなどの着脱可能な記録媒体などに記憶することができる。
以上説明したように、本発明によれば、マスター帳票1種類について異なる複数のマスター帳票情報が登録され、入力された定型帳票の帳票種類を識別する際、前記複数のマスター帳票情報を用いて帳票種類が識別されるので、例えば複数のマスター帳票情報を複数の入力条件に対応付けて登録することにより、マスター帳票の画像登録時の入力条件と処理対象となる定型帳票の画像入力時の入力条件が大きく異なっていても、定型帳票の帳票種類を正しく識別することができる。
以下、図面により本発明の実施の形態を詳細に説明する。図1は本発明の第1の実施の形態を示す帳票処理装置要部の構成ブロック図である。図示するように、この実施の形態の帳票処理装置は、帳票辞書登録時におけるマスター帳票や通常処理時における処理対象の定型帳票を画像データとして読み取る画像入力部1、各帳票種類について入力条件の異なる複数の帳票辞書情報(マスター帳票情報)を作成し登録する帳票辞書作成部2、前記帳票辞書情報を記憶しておく帳票辞書記憶手段である帳票辞書記憶部3、入力された定型帳票の帳票種類を前記帳票辞書記憶部3に記憶された複数の帳票辞書情報(マスター帳票情報)を用いて識別する帳票識別手段である帳票識別部4などを備えている。以下、前記各部についてさらに説明する。まず、画像入力部1であるが、これには例えばスキャナなど画像入力装置を用いる。ただし、
帳票辞書登録時には、マスター帳票1種類に対して、1種類のマスター画像データではなく、入力条件の異なる複数のマスター画像データを入力する(読み取る)。複数の画像入力装置を用いて入力したり、同じ画像入力装置で濃度設定を変えて入力したりするのである。帳票辞書作成部2は、帳票辞書登録時に画像入力部1により入力された画像データに対して、その画像の画像的特徴情報を作成するものであり、画像データ中の特徴的な部分だけを取り出して作成してもよいし、画像データ全部を帳票辞書として作成してもよい。なお、ここで作成される帳票辞書情報は帳票識別部4で用いられるので、そこで用いることができるフォーマットで辞書を作成する。また、1種類のマスター帳票に対して、入力条件の異なる複数の画像データが入力されるので、帳票辞書もその数だけ作成し登録(記憶)する。帳票辞書作成は、帳票登録時に用いられるだけであるので、帳票辞書作成部2を別システムとして分けて構築してもよい。また、帳票辞書記憶部3は例えばハードディスク装置などで構成する。帳票識別部4は、処理対象の定型帳票が入力される帳票処理時(通常処理時)に画像入力部1により入力された画像データと帳票辞書記憶部3に記憶されている帳票辞書情報を比較して帳票種類を識別する。特開平11-25215号公報に示された帳票種識別方法のように、例えば罫線の位置など認識しやすい(見つけやすい)点を用いてマスター帳票の画像データと入力された処理対象の帳票の画像データとの対応点を複数求め、その複数の対応点を用いて二つの帳票のすべての点の対応付けを可能にする座標変換式を求め、対応付けられた各点のパターンを比較する処理を複数のマスター帳票との間で行い、最も類似度の高いマスター帳票をその帳票種類とするのである。なお、座標変換式としては例えば図16に示すようなアフィン変換を用いる。図16の例では、対応する点の組として、(x,y)と(X,Y)の組を6組求めて前記座標変換式に代入し、その6元1次連立方程式を解いて前記座標変換式の係数a〜fを求める。これにより、二つの帳票の画像データが読み取り時にずれたりしても二つの帳票の各点は正確に対応する。
図2に、第1の実施の形態の動作フローを示す。以下、図2などに従って、この実施の形態の動作を説明する。図2に示すように、この実施の形態では、画像入力部1により帳票上から画像が読み取られ、画像データが入力されると(S1)、帳票辞書情報(マスター帳票情報)の登録か、それとも通常の帳票処理かを判定する(S2)。例えば利用者にいずれであるかを指示させるのである。そして、登録であると判定されたならば、帳票辞書作成部2が、例えば読み込まれた画像データのままの、つまり例えば帳票1枚分の白黒2値の画素データを帳票辞書情報として登録する(S3)。続いて、入力すべき次の帳票画像があるか否かを判定する(S4)。例えば帳票辞書情報の登録の場合、濃度など入力条件を変えて複数の帳票辞書情報を登録するので、予定のすべての入力条件について画像入力が終了したか否かを判定するのである。そして、入力すべき次の帳票画像があるならば(S4で「あり」)、濃度など入力条件を変えてステップS1からくり返す。こうして、例えば3つの入力条件があり、5つの帳票種類があるならば15種の帳票辞書情報が登録(記憶)される。また、ステップS2において通常の帳票処理であると判定されたならば、帳票識別部4が帳票種類の識別を行う(S5)。例えば罫線部を識別し、罫線の端点または罫線と罫線の交点の座標値(例えば、ライン番号とそのラインにおける画素位置を示す画素番号)を複数検出し、その複数の座標値に近い(差が所定値以内である)同様の端点座標値または交点座標値を有するマスター帳票を登録されているすべての帳票辞書情報を解析することにより抽出する。つまり、この実施の形態では、差が所定値を超えている場合、差の原因がずれによるものではなく帳票種別の異なることによるものとみなしているわけである。そして、このような帳票が一つしかなければそのマスター帳票の帳票種別を求める帳票種別とする。また、複数のマスター帳票が抽出された場合には、前記のようにして座標変換式を求め、その座標変換式を用いて対応する位置のパターン比較を行い,そのとき入力された処理対象の定型帳票に最も類似度の高いマスター帳票を決定し、そのマスター帳票の帳票種別を求める帳票種別とする(S5)。上記のように、第1の実施の形態によれば、例えば濃度など入力条件によって処理対象の定型帳票の黒画素量が多かったり少なかったりしても、一つの帳票種類について複数のマスター帳票情報が登録されているなかにそれに近いものがあるので、入力された定型帳票の帳票種類を正しく識別することができる。
図3は本発明の第2の実施の形態を示す帳票処理装置要部の構成ブロック図である。図示するように、この実施の形態の帳票処理装置は、第1の実施の形態の構成(図1参照)に加えて画像太さ処理部5を備えている。この画像太さ処理部5は帳票辞書登録時に画像入力部1により入力された画像データ中の黒画素部分つまり文字や罫線などを太らせたりやせさせたりした画像データを作成する。例えば、太らせる場合であれば、入力されたマスター帳票の画像データの全ドット(画素)について、上下左右方向1ドットの位置の画素、つまり隣接した画素が黒画素であれば、そのドットも黒画素にするという処理を行って、黒画素部分を太らせるのである。帳票辞書作成部2aは、帳票辞書登録時に画像入力部1により入力された画像データおよび太らせられたりやせらせられたりした画像データ中の特徴的な部分または画像データ全部を帳票辞書として作成する。なお、ここで作成される帳票辞書情報は帳票識別部4で用いられるので、そこで用いることができるフォーマットで辞書を作成する。そして、作成した複数の帳票辞書情報を登録(記憶)する。帳票識別部4は、処理対象の定型帳票が入力される通常処理時に画像入力部1により入力された画像データと帳票辞書記憶部3に記憶されている一つの帳票種類について複数の帳票辞書情報を比較して帳票種類を識別する(第1の実施の形態参照)。
図4に、第2の実施の形態の動作フローを示す。以下、図4などに従って、この実施の形態の動作を説明する。図4に示すように、この実施の形態では、画像入力部1により帳票上から画像が読み取られ、画像データが入力されると(S11)、帳票辞書情報(マスター帳票情報)の登録か、それとも通常の帳票処理かを判定する(S12)。例えば利用者にいずれであるかを指示させるのである。そして、登録であると判定されたならば、画像太さ処理部5が前記のようにして入力されたマスター帳票の画像データの文字や罫線の太さを太くした画像データやそれらを細くした画像データを作成する(S13)。続いて、帳票辞書作成部2が、読み込まれたままの例えば帳票1枚分の白黒2値の画素データ、文字や罫線の太さを太くした画像データ、それらを細くした画像データなどを帳票辞書情報として登録する(S14)。また、ステップS12において通常の帳票処理であると判定されたならば、帳票識別部4が帳票種類の識別を行う(S15)。例えば罫線部を識別し、罫線の端点または罫線と罫線の交点の座標値を複数検出し、その複数の座標値に近い(差が所定値以内である)同様の端点座標値または交点座標値を有するマスター帳票を登録されているすべての帳票辞書情報を解析することにより抽出する。そして、このような帳票が一つしかなければそのマスター帳票の帳票種別を求める帳票種別とする。また、複数のマスター帳票が抽出された場合には、前記のようにして座標変換式を求め、その座標変換式を用いて画像データのパターン比較を行い、そのとき入力された処理対象の定型帳票に最も類似度の高いマスター帳票を決定し、そのマスター帳票の帳票種別を求める帳票種別とする。上記のように、第2の実施の形態によれば、例えば濃度など入力条件によって処理対象の定型帳票の文字や罫線が太っていたりやせていたりしても、一つの帳票種類について複数のマスター帳票情報が登録されているなかにそれに近いものがあるので、入力された定型帳票の帳票種類を正しく識別することができる。
図5は本発明の第3の実施の形態を示す帳票処理装置要部の構成ブロック図である。図示したように、この実施の形態の帳票処理装置は、第1の実施の形態の構成(図1参照)に加えて解像度変換部6を備えている。この解像度変換部5は帳票辞書登録時に画像入力部1により入力された画像データの解像度を高くしたり低くしたりした画像データを作成する。例えば、解像度400dpiで入力された画像データに対して、解像度200dpi相当の画像を作成する場合、400dpiの画像データに対して縦横共にドット数が半分になるようにドットを間引く。また、800dpi相当の画像を作成する場合には、400dpiの画像データに対して縦横共にドット数が2倍になるように上下左右のドットの値を用いてドットを補間する。帳票辞書作成部2aは、帳票辞書登録時に画像入力部1により入力された画像データ、解像度を高くした画像データおよび解像度を低くした画像データの中の特徴的な部分または画像データ全部を帳票辞書として作成する。なお、ここで作成される帳票辞書情報は帳票識別部4で用いられるので、そこで用いることができるフォーマットで辞書を作成する。そして、作成した複数の帳票辞書情報を登録(記憶)する。帳票識別部4は、処理対象の定型帳票が入力される通常処理時に画像入力部1により入力された画像データと帳票辞書記憶部3に記憶されている一つの帳票種類について複数の帳票辞書情報を比較して帳票種類を識別する(第1の実施の形態参照)。
図6に、第3の実施の形態の動作フローを示す。以下、図6などに従って、この実施の形態の動作を説明する。図6に示すように、この実施の形態では、画像入力部1により帳票上から画像が読み取られ、画像データが入力されると(S21)、帳票辞書情報(マスター帳票情報)の登録か、それとも通常の帳票処理かを判定する(S22)。例えば利用者にいずれであるかを指示させるのである。そして、登録であると判定されたならば、解像度変換部6が入力されたマスター帳票の画像データを用い、前記のようにして解像度の高い画像データや解像度の低い画像データを作成する(S23)。続いて、帳票辞書作成部2が、読み込まれたままの例えば帳票1枚分の白黒2値の画素データ、その画像データから作成したより高い解像度の画像データ、より低い解像度の画像データなどを帳票辞書情報として登録する(S24)。また、ステップS22において通常の帳票処理であると判定されたならば、帳票識別部4が帳票種類の識別を行う(S25)。例えば罫線部を識別し、罫線の端点または罫線と罫線の交点の座標値を複数検出し、その複数の座標値に近い(差が所定値以内である)同様の端点座標値または交点座標値を有するマスター帳票を登録されているすべての帳票辞書情報を解析することにより抽出する。そして、このような帳票が一つしかなければそのマスター帳票の帳票種別を求める帳票種別とする。また、複数のマスター帳票が抽出された場合には、前記のようにして座標変換式を求め、その座標変換式を用いて画像データのパターン比較を行い、そのとき入力された処理対象の定型帳票に最も類似度の高いマスター帳票を決定し、そのマスター帳票の帳票種別を求める帳票種別とする。このように第3の実施の形態によれば、標準のマスター帳票の解像度とは異なった解像度の処理対象定型帳票が入力されても、一つの帳票種類について複数のマスター帳票情報が登録されているなかにそれと同じか近い解像度のものがあるので、入力された定型帳票の帳票種類を正しく識別することができる。
図7は本発明の第4の実施の形態を示す帳票処理装置要部の構成ブロック図である。図示するように、この実施の形態の帳票処理装置は、第1の実施の形態の構成(図1参照)に加えて画像太さ処理部5bを備えている。このような構成で、帳票辞書作成部2bは、帳票辞書登録時に画像入力部1により入力された例えば帳票1枚の白黒2値の画像データ中の特徴的な部分または画像データ全部を帳票辞書として作成する。なお、ここで作成される帳票辞書情報は帳票識別部4で用いられるので、そこで用いることができるフォーマットで辞書を作成する。そして、作成した帳票1種類当たり一つの帳票辞書情報を登録(記憶)する。また、画像太さ処理部5bは定型帳票の帳票処理時に画像入力部1により入力された画像データ中の黒画素部分つまり文字や罫線などを太らせたりやせさせたりした画像データを作成する。例えば、太らせる場合であれば、入力された処理対象の定型帳票の画像データの全ドット(画素)について、上下左右方向1ドットの位置の画素、つまり隣接した画素が黒画素であれば、そのドットも黒画素にするという処理を行って、黒画素部分を太らせるのである。なお、請求項5記載の画像太さ処理手段はこの画像太さ処理部5bにより実現される。帳票識別部4bは、処理対象の定型帳票が入力される通常処理時に画像入力部1により入力された画像データおよびその画像データ中の黒画素を太らせたりやせさせたりした画像データと帳票辞書記憶部3に記憶されている一つの帳票種類について一つの帳票辞書情報とを比較して帳票識別を行う(第1の実施の形態参照)。
図8に第4の実施の形態の動作フローを示す。以下、図8などに従って、この実施の形態の動作を説明する。図8に示したように、この実施の形態では、画像入力部1により帳票上から画像が読み取られ、画像データが入力されると(S31)、帳票辞書情報(マスター帳票情報)の登録か、それとも通常の帳票処理かを判定する(S32)。例えば利用者にいずれであるかを指示させるのである。そして、登録であると判定されたならば、帳票辞書作成部2が、読み込まれたままの例えば帳票1枚分の白黒2値の画素データを帳票の種類分だけ帳票辞書情報として登録する(S33)。また、ステップ32において通常の帳票処理であると判定されたならば、画像太さ処理部5bが前記のようにして入力された処理対象の定型帳票の画像データの文字や罫線の太さを太くした画像データやそれらを細くした画像データを作成する(S34)。続いて、帳票識別部4bが帳票種類の識別を行う(S35)。例えば罫線部を識別し、罫線の端点または罫線と罫線の交点の座標値を複数検出し、その複数の座標値に近い(差が所定値以内である)同様の端点座標値または交点座標値を有するマスター帳票を登録されているすべての帳票辞書情報を解析することにより抽出する。このような処理を入力されたままの処理対象の画像データおよびその画像データの黒画素部分を太らせたりやせさせたりしたすべての画像データについて行うのである。そして、このようなマスター帳票が一つしかなければそのマスター帳票の帳票種別を求める帳票種別とする。また、複数のマスター帳票が抽出された場合には、前記のようにして座標変換式を求め、その座標変換式を用いて画像データのパターン比較を行い、そのとき入力された処理対象の定型帳票またはその画像データを太らせたりやせさせたりした画像データに最も類似度の高いマスター帳票を決定し、そのマスター帳票の帳票種別を求める帳票種別とする。上記のように第4の実施の形態によれば、例えば濃度など入力条件によって処理対象の定型帳票の文字や罫線が太っていたりやせていたりしても、そうでない画像データも用いてマスター帳票情報と比較するので、入力された定型帳票の帳票種類を正しく識別することができる。
図9は本発明の第5の実施の形態を示す帳票処理装置要部の構成ブロック図である。図示したように、この実施の形態の帳票処理装置は、第1の実施の形態の構成(図1参照)に加えて解像度変換部6bを備えている。このような構成で、帳票辞書作成部2bは、帳票辞書登録時に画像入力部1により入力された例えば帳票1枚の白黒2値の画像データ中の特徴的な部分または画像データ全部を帳票辞書として作成する。なお、ここで作成される帳票辞書情報は帳票識別部4で用いられるので、そこで用いることができるフォーマットで辞書を作成する。そして、作成した帳票1種類当たり一つの帳票辞書情報を登録(記憶)する。また、解像度変換部6bは定型帳票の処理時に画像入力部1により入力された画像データの解像度を高くしたり低くしたりした画像データを作成する。例えば、解像度400dpiで入力された画像データに対して、解像度200dpi相当の画像を作成する場合、400dpiの画像データに対して縦横共にドット数が半分になるようにドットを間引く。また、800dpi相当の画像を作成する場合には、400dpiの画像データに対して縦横共にドット数が2倍になるように上下左右のドットの値を用いてドットを補間する。なお、請求項6記載の解像度変換手段はこのような解像度変換部6bにより実現される。帳票識別部4bは、処理対象の定型帳票が入力される通常処理時に画像入力部1により入力された画像データおよびその画像データの解像度を他の解像度に変えた画像データと帳票辞書記憶部3に記憶されている一つの帳票種類について一つの帳票辞書情報とを比較して帳票識別を行う(第1の実施の形態参照)。
図10に第5の実施の形態の動作フローを示す。以下、図10などに従って、この実施の形態の動作を説明する。図10に示すように、この実施の形態では、画像入力部1により帳票上から画像が読み取られ、画像データが入力されると(S41)、帳票辞書情報(マスター帳票情報)の登録か、それとも通常の帳票処理かを判定する(S42)。例えば利用者にいずれであるかを指示させるのである。そして、登録であると判定されたならば、帳票辞書作成部2が、読み込まれたままの例えば帳票1枚分の白黒2値の画素データを帳票の種類分だけ帳票辞書情報として登録する(S43)。また、ステップS42において通常の帳票処理であると判定されたならば、解像度変換部6bが入力された処理対象の定型帳票の画像データの解像度を前記のように変換する(S44)。続いて、帳票識別部4bが帳票種類の識別を行う(S45)。例えば罫線部を識別し、罫線の端点または罫線と罫線の交点の座標値を複数検出し、その複数の座標値に近い(差が所定値以内である)同様の端点座標値または交点座標値を有するマスター帳票を登録されているすべての帳票辞書情報を解析することにより抽出する。このような処理を入力されたままの処理対象の画像データおよびその画像データの解像度を変換した画像データについて行うのである。そして、このようなマスター帳票が一つしかなければそのマスター帳票の帳票種別を求める帳票種別とする。また、複数のマスター帳票が抽出された場合には、前記のようにして座標変換式を求め、その座標変換式を用いて画像データのパターンを比較し、そのとき入力された処理対象の定型帳票の画像データまたはその画像データの解像度を変化した画像データに最も類似度の高いマスター帳票を決定し、そのマスター帳票の帳票種別を求める帳票種別とする。こうして、第5の実施の形態によれば、入力された処理対象の定型帳票の解像度がマスター帳票の画像データの解像度と異なっていても、マスター帳票の画像データの解像度に合わせられるので、入力された定型帳票の帳票種類を正しく識別することができる。
図11は本発明の第6の実施の形態を示す帳票処理装置要部の構成ブロック図である。図示するように、この実施の形態の帳票処理装置は、第1の実施の形態の構成(図1参照)に加えて画像種類変換部7を備えている。このような構成で、画像入力部1aは処理対象の定型帳票を単に白黒2値画像データとしてだけでなく、白黒多値画像データやカラー画像データとして読み取ることができる。あるいは、交換可能に構成されている画像入力装置を交換して用いることにより、前記のような各種画像種類(画像データ種類)の画像データを入力することができる。利用者は各定型帳票について所望の画像種類の画像データを入力させ、その画像データを図示していない画像データ記憶部に保管しておき、必要に応じて記録紙や表示装置に出力させることができる。しかし、各種画像種類の画像データが入力されるにもかかわらず、この実施の形態では、帳票辞書情報(マスター帳票情報)は1種類の帳票について一つだけ用意すればよい。つまり、帳票辞書作成部2bは、帳票辞書登録時に画像入力部1bにより入力された例えば帳票1枚の白黒2値の画像データ中の特徴的な部分または画像データ全部を帳票辞書として作成する。そして、作成した帳票1種類当たり一つの帳票辞書情報を登録(記憶)する。また、画像種類変換部7は、通常の帳票処理時に画像入力部1bにより入力された各画像種類の画像データについて画像種類を変換する。例えば、白黒2値画像データで帳票辞書情報(マスター帳票情報)を作成していた場合には、白黒多値画像データで入力された場合、白黒2値画像データに変換するのである。なお、白黒2値画像データに変換するには、公知の技術、例えば256階調の多値画像データの場合、各ドット(画素)の階調値を予め決めておいた所定の閾値と比較し、その大小を判定して2値化する方法などを用いる。また、カラー画像データの場合は、例えば各ドット(画素)について各色の濃度の和を求め、その和を閾値と比較して2値化する。なお、請求項7記載の画像種類変換手段はこのような画像種類変換部7により実現される。帳票識別部4bは、処理対象の定型帳票が入力される通常処理時に画像入力部1aにより入力された画像データまたはその画像データを帳票辞書情報の画像種類の画像データに変換した画像データと帳票辞書記憶部3に記憶されている一つの帳票種類について一つの帳票辞書情報とを比較して帳票識別を行う(第1の実施の形態参照)。
図12に第6の実施の形態の動作フローを示す。以下、図12などに従って、この実施の形態の動作を説明する。図12に示すように、この実施の形態では、画像入力部1により帳票上から画像が読み取られ、画像データが入力されると(S51)、帳票辞書情報(マスター帳票情報)の登録か、それとも通常の帳票処理かを判定する(S52)。例えば利用者にいずれであるかを指示させるのである。そして、登録であると判定されたならば、帳票辞書作成部2bが、読み込まれたままの例えば帳票1枚分の白黒2値の画素データを帳票の種類分だけ帳票辞書情報として登録する(S53)。また、ステップS52において通常の帳票処理であると判定されたならば、入力された処理対象の定型帳票の画像データの画像種類が帳票辞書情報の画像種類と一致しない場合、画像種類変換部7が処理対象の定型帳票の画像データの画像種類を帳票辞書情報の画像種類と一致するように前記のようにして変換する(S54)。続いて、帳票識別部4bが帳票種類の識別を行う(S55)。例えば罫線部を識別し、罫線の端点または罫線と罫線の交点の座標値を複数検出し、その複数の座標値に近い(差が所定値以内である)同様の端点座標値または交点座標値を有するマスター帳票を登録されているすべての帳票辞書情報を解析することにより抽出する。このような処理を入力されたままの処理対象の画像データまたはその画像データの画像種類を変換した画像データについて行うのである。そして、このようなマスター帳票が一つしかなければそのマスター帳票の帳票種別を求める帳票種別とする。また、複数のマスター帳票が抽出された場合には、前記のようにして座標変換式を求め、その座標変換式を用いて画像データのパターンを比較し、そのとき入力された処理対象の定型帳票の画像データまたはその画像データの画像種類を変換した画像データに最も類似度の高いマスター帳票を決定し、そのマスター帳票の帳票種別を求める帳票種別とする。このように第6の実施の形態によれば、入力された処理対象の定型帳票の画像種類がマスター帳票の画像データの画像種類と異なっていても、マスター帳票の画像データの画像種類に合わせられるので、入力された定型帳票の帳票種類を正しく識別することができる。
図13は本発明の第7の実施の形態を示す帳票処理装置要部の構成ブロック図である。図示するように、この実施の形態の帳票処理装置は、前記各実施の形態の構成に加えて画像位置合わせ部8を備え(図13は第1の実施の形態に画像位置合わせ部8を加えた構成で示している)、比較する二つの画像データの位置ずれを帳票識別の前に補正する。なお、請求項8記載の画像位置合わせ手段はこの画像位置合わせ部8により実現される。
図14に第1の実施の形態に画像位置合わせ部8を備えた場合について、第7の実施の形態の動作フローを示す。以下、図14などに従って、この実施の形態の動作を説明する。図14に示すように、この実施の形態では、画像入力部1により帳票上から画像が読み取られ、画像データが入力されると(S61)、帳票辞書情報(マスター帳票情報)の登録か、それとも通常の帳票処理かを判定する(S62)。例えば利用者にいずれであるかを指示させるのである。そして、登録であると判定されたならば、帳票辞書作成部2が、例えば読み込まれた画像データのままの、つまり例えば帳票1枚分の白黒2値の画素データを帳票辞書情報として登録する(S63)。続いて、入力すべき次の帳票画像があるか否かを判定する(S64)。例えば帳票辞書情報の登録の場合、濃度など入力条件を変えて複数の帳票辞書情報を登録するので、予定のすべての入力条件について画像入力が終了したか否かを判定するのである。そして、次の帳票画像があるならば(S64で「あり」)、濃度など入力条件を変えてステップS61からくり返す。こうして、例えば3つの入力条件があり、5つの帳票種類があるならば15種の帳票辞書情報が登録(記憶)される。また、ステップS62において通常の帳票処理であると判定されたならば、画像位置合わせ部8が画像位置合わせを行う(S65)。例えば、特開平10-91783号公報に示されているように、処理対象の定型帳票の入力画像データと登録されている各帳票辞書情報の画像データとの位置ずれを二つの画像データのそれぞれから罫線などの所定の交点の座標を検出し、座標値の差が所定値以内の画像データ間について位置ずれ量を求めて処理対象の定型帳票の位置ずれを補正するのである。次に、位置ずれの補正された処理対象の定型帳票を用いて帳票種類の識別を行う(S66)。登録されているすべての帳票辞書情報とのパターン比較を行い、最も類似度の高いマスター帳票を求めるのである。なお、この実施の形態では既に位置ずれの補正が行われているので、前記各実施の形態のように座標変換式を求め、その座標変換式に従って座標を変換する位置ずれ補正は行わなくてもよい。こうして、この実施の形態の場合においても比較する二つの帳票の位置ずれが補正され、精度の高い帳票種類識別を実現することができる。
図15は前記各実施の形態の構成を実現するためのハードウェア資源の構成ブロック図である。図示するように、プログラムに従って動作するCPU11、基本的なプログラムなどを記憶しておくROM12、各種データやプログラムを一時的に記憶するRAM13、帳票処理の結果などを表示する表示装置14、帳票辞書情報など各種データやプログラムなどを保存(記憶)しておくハードディスク装置15、キーボード16、本発明の帳票識別方法に従ってプログラミングしたプログラムを記憶したCD−ROMを駆動してそのプログラムなどを読み取るCD−ROM駆動装置17、画像入力部1を構成するスキャナ18などを備えている。このような構成で、例えばCPU11やRAM13などは図1などに示した各実施の形態の帳票辞書部3を除くすべての部分に係わるのである。
以上説明したように、本発明によれば、マスター帳票1種類について異なる複数のマスター帳票情報が登録され、入力された定型帳票の帳票種類を識別する際、前記複数のマスター帳票情報を用いて帳票種類が識別されるので、例えば複数のマスター帳票情報を複数の入力条件に対応付けて登録することにより、マスター帳票の画像登録時の入力条件と処理対象となる定型帳票の画像入力時の入力条件が大きく異なっていても、定型帳票の帳票種類を正しく識別することができる。また、マスター帳票1種類について前記マスター帳票画像を入力する際の入力条件の異なる複数のマスター帳票情報が登録され、入力された定型帳票の帳票種類を識別する際、前記複数のマスター帳票情報を用いて帳票種類が識別されるので、マスター帳票の画像登録時の入力条件と処理対象となる定型帳票の画像入力時の入力条件が大きく異なっていても、定型帳票の帳票種類を正しく識別することができる。また、マスター帳票1種類について標準のマスター帳票情報の他に黒画素部分を太らせたマスター帳票または黒画素部分をやせさせたマスター帳票情報が登録され、入力された定型帳票の帳票種類を識別する際、前記複数のマスター帳票情報を用いて帳票種類が識別されるので、例えば濃度など入力条件によって処理対象の定型帳票の文字や罫線が太っていたりやせていたりしても、一つの帳票種類について複数のマスター帳票情報が登録されているなかにそれに近いものがあり、したがって、入力された定型帳票の帳票種類を正しく識別することができる。
また、マスター帳票1種類について解像度の異なる複数のマスター帳票情報が登録され、入力された定型帳票の帳票種類を識別する際、前記複数のマスター帳票情報を用いて帳票種類が識別されるので、標準のマスター帳票の解像度とは異なった解像度の処理対象定型帳票が入力されても、一つの帳票種類について複数のマスター帳票情報が登録されているなかにそれと同じか近い解像度のものがあり、したがって、入力された定型帳票の帳票種類を正しく識別することができる。また、入力された定型帳票の帳票種類を識別する際、入力された定型帳票の画像データの他にその画像データ中の黒画素部分を太らせた画像データまたは黒画素部分をやせさせた画像データも用いて帳票種類が識別されるので、例えば濃度など入力条件によって処理対象の定型帳票の文字や罫線が太っていたりやせていたりしても、そうでない画像データも用いてマスター帳票情報と比較され、したがって、入力された定型帳票の帳票種類を正しく識別することができる。また、入力された定型帳票の帳票種類を識別する際、入力された定型帳票の画像データの他にその画像データの解像度を変換した画像データも用いて帳票種類が識別されるので、入力された処理対象の定型帳票の解像度がマスター帳票の画像データの解像度と異なっていても、マスター帳票の画像データの解像度に合わせることができ、したがって、入力された定型帳票の帳票種類を正しく識別することができる。
また、入力された定型帳票の帳票種類を識別する際、マスター帳票情報とは異なった画像種類の定型帳票の画像データが入力されると、その画像データが前記マスター帳票情報の画像種類の画像データに変換され、変換された画像データを用いて帳票種類が識別されるので、入力された処理対象の定型帳票の画像種類がマスター帳票の画像データの画像種類と異なっていても、マスター帳票の画像データの画像種類に合わせることができ、したがって、入力された定型帳票の帳票種類を正しく識別することができる。また、入力された定型帳票の画像データと登録されているマスター帳票情報の画像データとの位置ずれ量が検出され、検出された位置ずれ量に従って前記定型帳票の画像データが補正され、補正された画像データを用いて帳票種類が識別されるので、真に対応するパターン同士が比較されることになり、したがって、精度の高い帳票種類識別を実現することができる。また、前記の帳票識別方法を実施できるようにプログラミングしたプログラムが例えば着脱可能な記憶媒体に記憶されるので、その記憶媒体をそれまで前記の帳票識別を行えなかったパーソナルコンピュータなど情報処理装置に装填することにより、その情報処理装置においても前記の効果を得ることができる。
本発明の第1の実施の形態を示す帳票処理装置要部の構成ブロック図である。 本発明の第1の実施の形態を示す帳票識別方法の動作フロー図である。 本発明の第2の実施の形態を示す帳票処理装置要部の構成ブロック図である。 本発明の第2の実施の形態を示す帳票識別方法の動作フロー図である。 本発明の第3の実施の形態を示す帳票処理装置要部の構成ブロック図である。 本発明の第3の実施の形態を示す帳票識別方法の動作フロー図である。 本発明の第4の実施の形態を示す帳票処理装置要部の構成ブロック図である。 本発明の第4の実施の形態を示す帳票識別方法の動作フロー図である。 本発明の第5の実施の形態を示す帳票処理装置要部の構成ブロック図である。 本発明の第5の実施の形態を示す帳票識別方法の動作フロー図である。 本発明の第6の実施の形態を示す帳票処理装置要部の構成ブロック図である。 本発明の第6の実施の形態を示す帳票識別方法の動作フロー図である。 本発明の第7の実施の形態を示す帳票処理装置要部の構成ブロック図である。 本発明の第7の実施の形態を示す帳票識別方法の動作フロー図である。 本発明の各実施の形態の帳票処理装置のハードウェア構成図である。 本発明および従来技術の帳票識別方法に係わる計算式を示す図である。
符号の説明
1 画像入力部
2 帳票辞書作成部
3 帳票辞書記憶部
4 帳票識別部
5 画像太さ処理部
6 解像度変換部
7 画像種類変換部
8 画像位置合わせ部

Claims (4)

  1. コンピュータの記憶部に登録されている複数種類のマスター帳票情報に基づいて入力された定型帳票の帳票種類を識別する帳票識別方法において、前記コンピュータが、マスター帳票1種類について異なる複数のマスター帳票情報を前記記憶部に登録するステップと、前記コンピュータが、入力された定型帳票の帳票種類を、前記登録された前記複数のマスター帳票情報と比較することにより識別するステップとを有し、
    前記異なる複数のマスター帳票情報は、入力されたマスター帳票の全ての画像データ又は該画像データ中の特徴的な部分を含むことを特徴とする帳票識別方法。
  2. 請求項1記載の帳票識別方法において、前記コンピュータが、マスター帳票1種類について前記マスター帳票情報を入力する際の入力条件の異なる複数のマスター帳票情報を前記記憶部に登録するステップと、前記コンピュータが、前記入力された定型帳票の帳票種類を、前記登録された前記複数のマスター帳票情報と比較することにより識別するステップとを有することを特徴とする帳票識別方法。
  3. 請求項1記載の帳票識別方法において、前記コンピュータが、マスター帳票1種類について解像度の異なる複数のマスター帳票情報を前記記憶部に登録するステップと、前記コンピュータが、前記入力された定型帳票の帳票種類を、前記登録された前記複数のマスター帳票情報と比較することにより識別するステップとを有することを特徴とする帳票識別方法。
  4. 請求項1乃至3のいずれか一項に記載の帳票識別方法をコンピュータにより実施するためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2007029458A 2007-02-08 2007-02-08 帳票識別方法及び記録媒体 Expired - Lifetime JP4549355B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007029458A JP4549355B2 (ja) 2007-02-08 2007-02-08 帳票識別方法及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007029458A JP4549355B2 (ja) 2007-02-08 2007-02-08 帳票識別方法及び記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP30607999A Division JP3961730B2 (ja) 1999-10-27 1999-10-27 帳票処理装置、帳票識別方法及び記録媒体

Publications (2)

Publication Number Publication Date
JP2007133907A JP2007133907A (ja) 2007-05-31
JP4549355B2 true JP4549355B2 (ja) 2010-09-22

Family

ID=38155453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007029458A Expired - Lifetime JP4549355B2 (ja) 2007-02-08 2007-02-08 帳票識別方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP4549355B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6657561B2 (ja) * 2015-01-07 2020-03-04 コニカミノルタ株式会社 帳票識別装置及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1091783A (ja) * 1996-09-11 1998-04-10 Ricoh Co Ltd 画像位置合わせ方法、ファクス文字認識装置及びコンピュータ記憶媒体
JPH11252215A (ja) * 1998-03-05 1999-09-17 Matsushita Electric Ind Co Ltd 電話端末
JP3961730B2 (ja) * 1999-10-27 2007-08-22 株式会社リコー 帳票処理装置、帳票識別方法及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1091783A (ja) * 1996-09-11 1998-04-10 Ricoh Co Ltd 画像位置合わせ方法、ファクス文字認識装置及びコンピュータ記憶媒体
JPH11252215A (ja) * 1998-03-05 1999-09-17 Matsushita Electric Ind Co Ltd 電話端末
JP3961730B2 (ja) * 1999-10-27 2007-08-22 株式会社リコー 帳票処理装置、帳票識別方法及び記録媒体

Also Published As

Publication number Publication date
JP2007133907A (ja) 2007-05-31

Similar Documents

Publication Publication Date Title
JP4035717B2 (ja) 画像処理装置及び画像処理方法
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
CN101958989B (zh) 图像处理装置、图像处理系统及图像处理方法
JP4857173B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2010062911A (ja) 画像処理装置、画像処理方法およびプログラム
JP2007221794A (ja) 低解像度のグリフ・イメージから高忠実度のグリフ・プロトタイプを作成するための方法および装置
JP2007241356A (ja) 画像処理装置および画像処理プログラム
US6813367B1 (en) Method and apparatus for site selection for data embedding
JP2017161969A (ja) 文字認識装置、方法およびプログラム
JP4140519B2 (ja) 画像処理装置、プログラムおよび記録媒体
US8254693B2 (en) Image processing apparatus, image processing method and program
JP4549355B2 (ja) 帳票識別方法及び記録媒体
JP4933404B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、並びに、プログラム記録媒体
JP2007041832A (ja) 差分画像抽出装置
JP4873554B2 (ja) 画像配信装置および画像配信方法
JP3961730B2 (ja) 帳票処理装置、帳票識別方法及び記録媒体
JP2017174031A (ja) 画像処理装置及び画像処理プログラム
JP4910635B2 (ja) 画像処理装置及び画像処理プログラム
JP4803001B2 (ja) 画像処理装置及び画像処理プログラム
JP2008206037A (ja) 画像処理装置及び画像処理プログラム
JP4687558B2 (ja) 画像照合装置、画像照合方法及びプログラム
JP5434273B2 (ja) 画像処理装置及び画像処理プログラム
JP2871570B2 (ja) 文字認識装置およびその方法
JPWO2004084539A1 (ja) 記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法、記入用文書
JP2001351068A (ja) 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20091208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100622

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100706

R150 Certificate of patent or registration of utility model

Ref document number: 4549355

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

EXPY Cancellation because of completion of term