JP2005157939A - 帳票認識装置および帳票認識方法 - Google Patents

帳票認識装置および帳票認識方法 Download PDF

Info

Publication number
JP2005157939A
JP2005157939A JP2003398426A JP2003398426A JP2005157939A JP 2005157939 A JP2005157939 A JP 2005157939A JP 2003398426 A JP2003398426 A JP 2003398426A JP 2003398426 A JP2003398426 A JP 2003398426A JP 2005157939 A JP2005157939 A JP 2005157939A
Authority
JP
Japan
Prior art keywords
similarity
color information
color
search
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003398426A
Other languages
English (en)
Other versions
JP4136913B2 (ja
Inventor
Keiko Nakanishi
恵子 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003398426A priority Critical patent/JP4136913B2/ja
Priority to US10/997,537 priority patent/US7508986B2/en
Publication of JP2005157939A publication Critical patent/JP2005157939A/ja
Application granted granted Critical
Publication of JP4136913B2 publication Critical patent/JP4136913B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 色情報誤判定に起因した誤認識を防ぎ、識別率を高める。
【解決手段】 帳票識別手段は、色情報抽出手段で抽出された色情報を、登録帳票の書式データにおける色情報と比較し、この際、登録帳票の色情報が特定色か否かによって処理内容を変更する。
【選択図】 図1

Description

本発明は帳票認識装置および帳票認識方法に関する。
従来の帳票認識装置では、帳票画像から抽出したある特徴量を用いて候補を絞り込んだ後、更に他の特徴量を用いて候補を絞り込んでいくもの(例えば特許文献1)などがあった。
特開2000−285190号公報
すなわち、従来の帳票認識装置では、当初使用した特徴で帳票を判別できなかった場合、当該特徴で絞り込んだ帳票の候補の中から更に新たな特徴を用いて絞り込んでいくものである。したがって、特徴量を順番に使用するため、評価に用いる特徴量の順番に応じて認識結果が大きく左右されてしまうという問題がある。
そこで、本発明では、表領域や文字領域などに関わる各領域の位置・形状などに関する書式データと、色情報とを統合的に用いて認識する。しかしながら、色情報を用いて判断する際、例えば、無彩色低輝度色(黒など)では、色の各要素値が高輝度有彩色よりもはるかに低いので、印刷時やスキャン時における誤差が、高輝度有彩色よりも大きくなりやすい。このため、色を分類する際、無彩色低輝度色は、他の色の許容範囲と同じ許容範囲を利用すると同一色と判断されないことがあった。
本発明は、このような問題点を解消すべく創案されたもので、カラー帳票を高い認識率で統合的に処理可能とし、且つ、帳票認識装置において色情報を用いてカラー帳票を認識する場合、色情報誤判定に起因した誤認識を防ぎ、識別率を高めることを目的とする。
本発明によれば、帳票認識装置において色情報を用いてカラー帳票を認識する場合、色情報誤判定に起因した誤認識を防ぎ、識別率を高め得る。
本発明は、認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識装置であって、前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出手段と、前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出手段と、前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出手段と、前記登録帳票における各構成要素の色情報が特定色か否かを判断する特定色判別手段と、前記判別手段で特定色でないと判別された構成要素に基づいて、前記検索帳票の色情報と前記登録帳票の色情報とを比較して、色の類似度を算出する色情報類似度算出手段と、前記特徴量類似度算出手段による類似度と、前記色情報類似度算出手段による色の類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別手段と、を有する。
これによって、色情報誤判定に起因した誤認識を防ぎ、識別率を高め得る。
本発明は、認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識装置であって、前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出手段と、前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出手段と、前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出手段と、前記登録帳票における各構成要素の色情報が特定色か否かを判断する特定色判別手段と、前記登録帳票における各構成要素の色情報が特定色か否かに応じて同一色判断の許容範囲を設定する許容範囲設定手段と、前記検索帳票の色情報と前記登録帳票の色情報とを、特定色か否かに応じて許容範囲設定手段によって設定された許容範囲を用いて比較して、類似度を算出する色情報類似度算出手段と、前記特徴量類似度算出手段で算出された類似度と、前記色情報類似度算出手段によって算出された類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別手段と、を有する。
これによって、色情報誤判定に起因した誤認識を防ぎ、識別率を高め得る。
本発明は、認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識装置であって、前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出手段と、前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出手段と、前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出手段と、前記登録帳票の構成要素の色情報における各要素値に基づいて色の許容範囲を求める許容範囲算出手段と、前記検索帳票の色情報と前記登録帳票の書式データの色情報とを、前記許容範囲算出手段によって求められた許容範囲に基づいて比較して、類似度を算出する色情報類似度算出手段と、前記特徴量類似度算出手段で算出された類似度と、前記色情報類似度算出手段によって算出された類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別手段と、を有する。
これによって、色情報誤判定に起因した誤認識を防ぎ、識別率を高め得る。
本発明は、認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識方法であって、前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出ステップと、前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出ステップと、前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出ステップと、前記登録帳票における各構成要素の色情報が特定色か否かを判断する特定色判別ステップと、前記判別ステップで特定色でないと判別された構成要素に基づいて、前記検索帳票の色情報と前記登録帳票の色情報とを比較して、色の類似度を算出する色情報類似度算出ステップと、前記特徴量類似度算出ステップによる類似度と、前記色情報類似度算出ステップによる色の類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別ステップと、を有する。
これによって、色情報誤判定に起因した誤認識を防ぎ、識別率を高め得る。
本発明は、認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識方法であって、前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出ステップと、前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出ステップと、前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出ステップと、前記登録帳票における各構成要素の色情報が特定色か否かを判断する特定色判別ステップと、前記登録帳票における各構成要素の色情報が特定色か否かに応じて同一色判断の許容範囲を設定する許容範囲設定ステップと、前記検索帳票の色情報と前記登録帳票の色情報とを、特定色か否かに応じて許容範囲設定手段によって設定された許容範囲を用いて比較して、類似度を算出する色情報類似度算出ステップと、前記特徴量類似度算出手段で算出された類似度と、前記色情報類似度算出手段によって算出された類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別ステップと、を有する。
これによって、色情報誤判定に起因した誤認識を防ぎ、識別率を高め得る。
本発明は、認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識方法であって、前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出ステップと、前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出ステップと、前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出ステップと、前記登録帳票の構成要素の色情報における各要素値に基づいて色の許容範囲を求める許容範囲算出ステップと、前記検索帳票の色情報と前記登録帳票の書式データの色情報とを、前記許容範囲算出手段によって求められた許容範囲に基づいて比較して、類似度を算出する色情報類似度算出ステップと、前記特徴量類似度算出ステップで算出された類似度と、前記色情報類似度算出ステップで算出された類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別ステップと、
を有する。
これによって、色情報誤判定に起因した誤認識を防ぎ、識別率を高め得る。
次に本発明に係る帳票認識装置の実施例1を図面に基づいて説明する。
図1は、本発明に係る帳票認識装置の実施例1を示すブロック図である。
図1において、帳票認識装置は、スキャナ、カメラ、あるいはファイル読み込み装置などの画像入力手段11を有し、この画像入力手段11から認識対象の帳票(検索帳票)を画像データとして入力する。
画像入力手段11はバス17に接続され、バス17を介して帳票認識の処理を実行するプロセッサ12に接続されている。
バス17にはさらにキーボード13、ディスク14、メモリ15、出力手段16が接続されている。
メモリ15は、プロセッサ12において処理制御情報を作成する際の一時データ記憶、あるいは画像入力手段11で読み込んだ帳票画像を蓄積する。また登録帳票の書式データ等が、ディスク14等から読み込まれて、保持される。また、後述するフローチャートに対応するような処理をコンピュータに実行させるための制御プログラム15cが格納される。なお、本発明の制御プログラムは、ネットワークを介して読み込んでコンピュータが実行する形式としても構わない。
プロセッサ12は、メモリ15に格納された制御プログラム15cを実行することにより、画像特徴量抽出手段12a、色情報抽出手段12b、書式データ生成手段12c、色情報類似度算出手段12d、帳票識別手段12eとして機能する。
帳票識別手段12eは検索帳票を登録帳票と比較し、最も類似度の高い登録帳票を認識結果として抽出する。
キーボード13は、帳票の登録や検索などの指示操作を行い、ディスク14は、補助記憶装置として機能する。
出力手段16は、ディスプレイ、プリンタ等であり、認識結果等の各種情報を出力する。
画像入力手段11で読み取った検索帳票の画像は、帳票画像15bとしてメモリ15に格納される。帳票画像15bはプロセッサ12に設けられた画像処理手段(図示せず。)等により2値化処理されて、画像特徴量抽出手段12aに送られる。画像特徴量抽出手段12aは、黒ドットのヒストグラムを取るなどして帳票画像に含まれる領域を識別し、帳票画像15bに含まれる領域をテーブル、テキスト、ピクチャ等に属性分類し、さらに解像度、各領域の位置情報、大きさ情報等を抽出する。そして、色情報抽出手段12bは、分類された各領域に対応する色情報を抽出し、書式データ生成手段12cで書式データを生成し、メモリ11およびディスク14に保存する。
帳票識別手段12eは、色情報抽出手段12bで抽出された色情報を、登録帳票の書式データにおける色情報と比較し、この際、登録帳票の色情報が特定色か否かによって処理内容を変更する。なお、本実施例において特定色とは、同一色と判断されにくい色のことであり、例えば、無彩色低輝度色(黒など)である。この無彩色低輝度色では、印刷時やスキャン時における色ずれの誤差が、高輝度有彩色よりも大きくなりやすい。このため、同一色であるか否かの判断に用いる各要素値の許容範囲に関して、無彩色低輝度色は、他の色の許容範囲と同じ値を利用すると同一色と判断されない可能性がある。そこで、本実施例1では、特定色と判断された部分については色情報を帳票識別に用いないようにする。
図2は、本発明に係る帳票認識装置の処理対象である帳票201およびその書式データ202の例を示す図である。
書式データ202において、3個のブロック(テーブル、テキスト、ピクチャなど)B1、B2、B3が帳票の構成要素として抽出されている。
書式データ202には、帳票ページ幅、帳票ページの高さ、解像度等のページ書式と、ブロック毎の各種情報(ブロック情報)が含まれる。
ブロックの情報には、ブロック属性(テーブル、テキスト、ピクチャなど)とともに、ブロック左端位置およびブロック上端位置等の位置情報、ブロック幅およびブロック高さなどの大きさ情報が含まれる。さらにブロックの情報には、RGBやYCbCr等の情報よりなる色情報が含まれる。
[帳票認識方法]
次に図1の帳票認識装置によって実施される帳票認識方法の実施例1を図面に基づいて説明する。
図3は、帳票認識方法における帳票登録処理を示すフローチャート、図4は、帳票認識方法における帳票識別処理を示すフローチャート、図5は、図1の帳票認識装置で実施される帳票認識方法における色情報類似度算出処理を示すフローチャートである。
図3において、新たな帳票画像を登録帳票として登録する帳票登録処理は以下の各ステップによって実行される。
ステップS31:帳票を画像入力手段11から読み込み、帳票画像としてメモリ15に転送する。
ステップS32:ステップS31に続いて、帳票画像を2値化し、各ブロック(テーブル、テキスト、ピクチャなどの属性毎の領域に分割)の座標値等の特徴量を抽出する。
ステップS33:ステップS32に続いて、各ブロックの座標値等の特徴量と帳票画像とから、各ブロックの色情報を抽出する。
ステップS34:ステップS33に続いて、帳票の特徴量と色情報から書式データを作成する。
ステップS35:ステップS34に続いて、作成された書式データを識別コードとともに登録帳票として登録する。
ステップS36:ステップS35に続いて、登録すべき帳票画像を全て登録したか否か判断する。登録すべき帳票画像が残っているときは、ステップS31に戻り、全ての帳票画像の登録処理が終了したときは、そのまま処理を終了する。
図4において、検索帳票の識別処理は以下の各ステップによって実行される。
ステップS41:帳票を画像入力手段11から読み込み、検索帳票の帳票画像としてメモリに転送する。
ステップS42:ステップS41に続いて、帳票画像を2値化し、各ブロック(テーブル、テキスト、ピクチャ)の座標値等の特徴量を抽出する。
ステップS43:ステップS42に続いて、各ブロックの座標値等の特徴量と帳票画像とから、各ブロックの色情報を抽出する。
ステップS44:ステップS43に続いて、帳票の特徴量と色情報から書式データを作成する。
ステップS45:ステップS44に続いて、登録帳票の1枚の書式データを読み出す。
ステップS46:ステップS45に続いて、検索帳票の書式データの特徴量と、読み出された登録帳票の書式データの特徴量とを比較し、その結果から類似度を計算する。
ステップS47:ステップS46に続いて、検索帳票の書式データにおける色情報と、登録帳票の書式データの色情報とを比較し、所定の許容範囲内で色情報が類似する場合は色情報が一致すると判断して、所定の値をステップS46で計算した類似度に加算する。但し登録帳票の書式データが特定色であった場合、その特定色については色情報を比較せず、従って色情報の類似度は加算されない。
すなわち、色情報の比較において、上記のとおり、全ての色を同じ方法(許容範囲)を採用して同一色か否かを判断するのではなく、本実施例では、特定色について色情報を比較しない。
ステップS48:ステップS47に続いて、特徴量の類似度、あるいは特徴量の類似度に色情報の類似度を加算した類似度を、比較対象の登録帳票の識別コードとともにメモリ15に一次保存する。
ステップS49:ステップS48に続いて、登録帳票の全ての書式データとの比較が終了したか否かを判断する。書式データがまだ残っているときは、ステップS45に戻り、全ての書式データが終了したときは、ステップS50に進む。
ステップS50:類似度の高い書式データを、認識結果の候補とし、その識別コードおよび類似度を出力する。
図5において、上記ステップS47の色情報類似度算出処理は以下の各ステップによって実行される。
ステップS51:登録帳票の特徴量に対応する色情報が特定色かどうかを判断する。特定色のときはそのまま処理を終了し、特定色でないときは、ステップS52に進む。
例えば、1個または複数の特定色が色情報(例えばRGBで)が(Xs1,Ys1,Zs1)、(Xs2,Ys2,Zs2)、….、(Xsn,Ysn,Zsn)で指定されていたとき、比較対象すべき登録帳票の書式データにおける色情報が(Xa,Ya,Za)のとき、(Xa,Ya,Za)と各(Xsi,Ysi,Zsi)(i=1〜n)と比較し、(Xa,Ya,Za)がいずれかの(Xsi,Ysi,Zsi)と一致したときに、特定色と判定する。
ステップS52:登録帳票の書式データにおける色情報の許容範囲内に、検索帳票の色情報の値が含まれるか否かを判断し、許容範囲内にあれば同一色と判断し、許容範囲外であれば同一色でないと判断する。同時に色情報の類似度を算出する(例えば、特定色でないと判断されたブロックのうち、色情報が一致すると判断されたブロックの割合に基づいて、色情報の類似度を求める。また色情報の類似度は、S46で算出された類似度の所定の割合(例えば20%)以内の値となるように算出してもよい)。
同一色の場合、ステップS53へ進み、同一色でない場合、ステップS54へ進む。
例えば、登録帳票の書式データにおける色情報を(Xa,Ya,Za)、許容範囲をKaとし、検索帳票の色情報を(Xb,Yb,Zb)とすると、(Xa−Ka,Ya−Ka,Za−Ka)<=(Xb,Yb,Zb)<=(Xa+Ka,Ya+Ka,Za+Ka)であれば、同一色と判定される。
ステップS53:色情報の類似度を特徴量の類似度に加算し、処理を終了する。
ステップS54:色情報の類似度を特徴量の類似度から減算し、処理を終了する。
[帳票認識方法]
次に図1の帳票認識装置によって実施される帳票認識方法の実施例2を図面に基づいて説明する。
図6は、実施例2における色情報類似度算出処理を示すフローチャートである。
実施例2では、登録帳票の色情報が特定色のときは他の色とは異なる許容範囲で色情報を比較する。
図6において、色情報類似度算出処理は以下の各ステップによって実行される。
ステップS61:登録帳票の特徴量に対応する色情報が特定色かどうかを判断する。特定色のときはステップS62に進み、特定色でないときは、ステップS65に進む。特定色の判断方法は実施例1と同様である。
ステップS62:登録帳票の書式データにおける色情報の許容範囲内に、検索帳票の色情報の値が含まれるか否かを判断し、許容範囲内にあれば同一色と判断し、許容範囲外であれば同一色でないと判断する。同時に色情報の類似度を算出する。
同一色の場合、ステップS63へ進み、同一色でない場合、ステップS64へ進む。
例えば、検索帳票の色情報(Xb,Yb,Zb)が特定色の色情報を(Xs,Ys,Zs)と等しく、この特定色の許容範囲が(Ksx,Ksy,Ksz)のとき、登録帳票の色情報を(Xa,Ya,Za)とすると、((Xa−Ksx,Ya−Ksy,Za−Ksz)<=(Xb,Yb,Zb)<=(Xa+Ksx,Ya+Ksy,Za+Ksz)であれば、同一色と判定される。
ステップS63:色情報の類似度を特徴量の類似度に加算し、そのまま処理を終了する。
ステップS64:色情報の類似度を特徴量の類似度から減算し、そのまま処理を終了する。
ステップS65:登録帳票の書式データにおける色情報の許容範囲内に、検索帳票の色情報の値が含まれるか否かを判断し、許容範囲内にあれば同一色と判断し、許容範囲外であれば同一色でないと判断する。同時に色情報の類似度を算出する。
同一色の場合、ステップS66へ進み、同一色でない場合、ステップS67へ進む。同一色か否かの判断は実施例1と同様である。
例えば、登録帳票の書式データにおける色情報を(Xa,Ya,Za)、許容範囲をKaとし、検索帳票の色情報を(Xb,Yb,Zb)とすると、(Xa−Ka,Ya−Ka,Za−Ka)<=(Xb,Yb,Zb)<=(Xa+Ka,Ya+Ka,Za+Ka)であれば、同一色と判定される。
ステップS66:色情報の類似度を特徴量の類似度に加算し、そのまま処理を終了する。
ステップS67:色情報の類似度を特徴量の類似度から減算し、そのまま処理を終了する。
次に図1の帳票認識装置によって実施される帳票認識方法の実施例3を図面に基づいて説明する。
図7は、実施例3における色情報類似度算出処理を示すフローチャートである。
実施例3では、色情報の要素値ごとに独立の許容範囲を設定する。
図7において、色情報類似度算出処理は以下の各ステップによって実行される。
ステップS71:登録帳票の色情報について、各要素値に基づく許容値を設定する。例えば、各要素値X、Y、Zについて許容値Kx(X)、Ky(Y)、Kz(Z)をあらかじめ設定しておき、登録帳票の色情報が(Xa,Ya,Za)であるとき、要素値Xa,Ya,Zaの許容値をKx=Kx(Xa)、Ky=Ky(Ya)、Kz=Kz(Za)として求める。
ステップS72:登録帳票の書式データにおける色情報の許容範囲内に、検索帳票の色情報の値が含まれるか否かを判断し、許容範囲内にあれば同一色と判断し、許容範囲外であれば同一色でないと判断する。同時に色情報の類似度を算出する。
同一色の場合、ステップS73へ進み、同一色でない場合、ステップS74へ進む。同一色か否かの判断は実施例1と同様である。
すなわち、検索帳票の色情報(Xb,Yb,Zb)が、(Xa−Kx,Ya−Ky,Za−Kz)<=(Xb,Yb,Zb)<=(Xa+Kx,Ya+Ky,Za+Kz)であれば、同一色とを判定する。
ステップS73:類似度を加算して、終了する。
ステップS74:類似度を減算して、終了する。
以上の実施例に示したように、色情報を比較するとき、色によって処理を変えたり、許容値を変えたりして、同一色かどうかを判断することにより、同一色の判断の誤認識を防ぐことができる。
以上の実施例では、登録色が特定色か否かによって、判断方法を変更したが、検索画像の色情報が特定色か否かによって、判断方法を変更してもよい。
本発明に係る帳票認識装置の実施例1を示すブロック図である。(実施例1) 本発明に係る帳票認識装置における書式データの一例を示す図である。(実施例1) 図1の帳票認識装置で実施される帳票認識方法における帳票登録処理を示すフローチャートである。(実施例1) 図1の帳票認識装置で実施される帳票認識方法における帳票識別処理を示すフローチャートである。(実施例1) 図1の帳票認識装置で実施される帳票認識方法における色情報類似度算出処理を示すフローチャートである。(実施例1) 図1の帳票認識装置で実施される帳票認識方法の実施例2における色情報類似度算出処理を示すフローチャートである。(実施例2) 図1の帳票認識装置で実施される帳票認識方法の実施例3における色情報類似度算出処理を示すフローチャートである。(実施例3)
符号の説明
11 スキャナ、カメラ等の画像入力手段
12 プロセッサ
12a 画像特徴量抽出手段
12b 色情報抽出手段
12c 書式データ生成手段
12d 色情報類似度算出手段
12e 帳票識別手段
13 キーボード
14 ディスク
15 メモリ
16 ディスプレイ、プリンタ等の出力手段

Claims (8)

  1. 認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識装置であって、
    前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出手段と、
    前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出手段と、
    前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出手段と、
    前記登録帳票における各構成要素の色情報が特定色か否かを判断する特定色判別手段と、
    前記判別手段で特定色でないと判別された構成要素に基づいて、前記検索帳票の色情報と前記登録帳票の色情報とを比較して、色の類似度を算出する色情報類似度算出手段と、
    前記特徴量類似度算出手段による類似度と、前記色情報類似度算出手段による色の類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別手段と、
    を有することを特徴とする帳票認識装置。
  2. 認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識装置であって、
    前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出手段と、
    前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出手段と、
    前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出手段と、
    前記登録帳票における各構成要素の色情報が特定色か否かを判断する特定色判別手段と、
    前記登録帳票における各構成要素の色情報が特定色か否かに応じて同一色判断の許容範囲を設定する許容範囲設定手段と、
    前記検索帳票の色情報と前記登録帳票の色情報とを、特定色か否かに応じて許容範囲設定手段によって設定された許容範囲を用いて比較して、類似度を算出する色情報類似度算出手段と、
    前記特徴量類似度算出手段で算出された類似度と、前記色情報類似度算出手段によって算出された類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別手段と、
    を有することを特徴とする帳票認識装置。
  3. 認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識装置であって、
    前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出手段と、
    前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出手段と、
    前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出手段と、
    前記登録帳票の構成要素の色情報における各要素値に基づいて色の許容範囲を求める許容範囲算出手段と、
    前記検索帳票の色情報と前記登録帳票の書式データの色情報とを、前記許容範囲算出手段によって求められた許容範囲に基づいて比較して、類似度を算出する色情報類似度算出手段と、
    前記特徴量類似度算出手段で算出された類似度と、前記色情報類似度算出手段によって算出された類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別手段と、
    を有することを特徴とする帳票認識装置。
  4. 認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識方法であって、
    前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出ステップと、
    前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出ステップと、
    前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出ステップと、
    前記登録帳票における各構成要素の色情報が特定色か否かを判断する特定色判別ステップと、
    前記判別ステップで特定色でないと判別された構成要素に基づいて、前記検索帳票の色情報と前記登録帳票の色情報とを比較して、色の類似度を算出する色情報類似度算出ステップと、
    前記特徴量類似度算出ステップによる類似度と、前記色情報類似度算出ステップによる色の類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別ステップと、
    を有することを特徴とする帳票認識方法。
  5. 認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識方法であって、
    前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出ステップと、
    前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出ステップと、
    前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出ステップと、
    前記登録帳票における各構成要素の色情報が特定色か否かを判断する特定色判別ステップと、
    前記登録帳票における各構成要素の色情報が特定色か否かに応じて同一色判断の許容範囲を設定する許容範囲設定ステップと、
    前記検索帳票の色情報と前記登録帳票の色情報とを、特定色か否かに応じて許容範囲設定手段によって設定された許容範囲を用いて比較して、類似度を算出する色情報類似度算出ステップと、
    前記特徴量類似度算出手段で算出された類似度と、前記色情報類似度算出手段によって算出された類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別ステップと、
    を有することを特徴とする帳票認識方法。
  6. 認識対象の帳票(以下検索帳票という。)の帳票画像と、あらかじめ登録された登録帳票の情報とを比較して、前記検索帳票に類似する登録帳票を認識する帳票認識方法であって、
    前記検索帳票から、構成要素の所定の特徴量を抽出する画像特徴量抽出ステップと、
    前記検索帳票から前記構成要素に対応する色情報を抽出する色情報抽出ステップと、
    前記検索帳票の所定の特徴量と、前記登録帳票の所定の特徴量とを比較して類似度を算出する特徴量類似度算出ステップと、
    前記登録帳票の構成要素の色情報における各要素値に基づいて色の許容範囲を求める許容範囲算出ステップと、
    前記検索帳票の色情報と前記登録帳票の書式データの色情報とを、前記許容範囲算出手段によって求められた許容範囲に基づいて比較して、類似度を算出する色情報類似度算出ステップと、
    前記特徴量類似度算出ステップで算出された類似度と、前記色情報類似度算出ステップで算出された類似度とに基づいて、類似度を決定することにより、前記検索帳票に類似する登録帳票を識別する帳票識別ステップと、
    を有することを特徴とする帳票認識方法。
  7. 請求項4乃至6のいずれかに記載の帳票認識方法をコンピュータによって実現させるためのコンピュータ実行可能プログラム。
  8. 請求項4乃至6のいずれかに記載の帳票認識方法をコンピュータによって実現させるためのコンピュータ読取可能なプログラムを格納する記憶媒体。
JP2003398426A 2003-11-28 2003-11-28 帳票認識装置および帳票認識方法 Expired - Fee Related JP4136913B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003398426A JP4136913B2 (ja) 2003-11-28 2003-11-28 帳票認識装置および帳票認識方法
US10/997,537 US7508986B2 (en) 2003-11-28 2004-11-23 Document recognition device, document recognition method and program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003398426A JP4136913B2 (ja) 2003-11-28 2003-11-28 帳票認識装置および帳票認識方法

Publications (2)

Publication Number Publication Date
JP2005157939A true JP2005157939A (ja) 2005-06-16
JP4136913B2 JP4136913B2 (ja) 2008-08-20

Family

ID=34723273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003398426A Expired - Fee Related JP4136913B2 (ja) 2003-11-28 2003-11-28 帳票認識装置および帳票認識方法

Country Status (1)

Country Link
JP (1) JP4136913B2 (ja)

Also Published As

Publication number Publication date
JP4136913B2 (ja) 2008-08-20

Similar Documents

Publication Publication Date Title
JP3809404B2 (ja) 画像処理方法、装置およびシステム
US6563949B1 (en) Character string extraction apparatus and pattern extraction apparatus
US7324692B2 (en) Character recognition method
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
CN104298982A (zh) 一种文字识别方法及装置
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
US11983910B2 (en) Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network
US8538154B2 (en) Image processing method and image processing apparatus for extracting heading region from image of document
KR20210081267A (ko) 화상 처리 장치, 저장 매체, 및 화상 처리 방법
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
JP4275973B2 (ja) 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
US6968501B2 (en) Document format identification apparatus and method
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US7508986B2 (en) Document recognition device, document recognition method and program, and storage medium
CN115410191B (zh) 文本图像识别方法、装置、设备和存储介质
JP4136913B2 (ja) 帳票認識装置および帳票認識方法
JP2020047138A (ja) 情報処理装置
JP5169648B2 (ja) 原画像探索装置及び原画像探索プログラム
US6678427B1 (en) Document identification registration system
US11948342B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium for determining extraction target pixel
US20220343666A1 (en) Image processing apparatus, image processing method, and storage medium
JP2009272714A (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体
KR100226804B1 (ko) 문서형식 판별방법
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP2022019257A (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050613

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080603

R150 Certificate of patent or registration of utility model

Ref document number: 4136913

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees