JP4154308B2 - 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 - Google Patents

帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP4154308B2
JP4154308B2 JP2003347688A JP2003347688A JP4154308B2 JP 4154308 B2 JP4154308 B2 JP 4154308B2 JP 2003347688 A JP2003347688 A JP 2003347688A JP 2003347688 A JP2003347688 A JP 2003347688A JP 4154308 B2 JP4154308 B2 JP 4154308B2
Authority
JP
Japan
Prior art keywords
page
registered
similarity
registration
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003347688A
Other languages
English (en)
Other versions
JP2005115573A (ja
Inventor
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003347688A priority Critical patent/JP4154308B2/ja
Priority to US10/950,212 priority patent/US7450262B2/en
Publication of JP2005115573A publication Critical patent/JP2005115573A/ja
Application granted granted Critical
Publication of JP4154308B2 publication Critical patent/JP4154308B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

本発明は、帳票の自動認識を行う帳票認識装置、方法、プログラムおよび記憶媒体に関する。
帳票を、あらかじめ登録されたフォーマットごとに自動分類する帳票認識は、大量の帳票の入力・分類処理を行う上で大変有効な方法である。
入力・分類処理に際しては、スキャナ等から読み取った帳票画像のデータから特徴量を抽出して、帳票書式データを生成し、入力帳票と登録帳票の書式データの類似度を求め、類似度の最も高い登録帳票を、認識結果とする。
書式データの類似度の判定方法として、帳票に記載されたテーブルに着目し、1頁の帳票面積と、その頁に含まれるテーブルの面積の合計との比に基づいて類似度を算出するものがある(例えば、特許文献1)。
特許文献1の帳票認識処理では処理対象が1頁の帳票に限定され、不都合である。
一方、複数の帳票を連続して読み取り処理する方法がある(例えば、特許文献2)。特許文献2では、一括りとして処理すべき処理単位の間に仕切り帳票を予め挿入しておき、その帳票群を読み込んだときには、仕切り帳票を読み取る度にそれ以降の読み取り結果の出力先を変更するようにし、また仕切り帳票直後の帳票のみを用いてフォーマットの種類を識別している。
特開2000−285187号公報 特開平10−269311号公報
しかしながら特許文献2の認識処理では、仕切り帳票を生成し、処理単位の間に予め挿入する処理が不可欠であり、処理が煩雑であった。また仕切り帳票直後の帳票のみを用いてフォーマットを識別しているので、誤認識する可能性も高くなってしまっていた。
本発明はこのような従来の問題点を解決するために創案されたもので、複数頁で構成された帳票を、容易にかつ精度よく認識処理することを目的とする。
本発明に係る帳票認識装置は、複数ページで構成される帳票画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識装置であって、前記登録帳票について、各ページの特徴量と重み情報とを登録する登録手段と、入力された帳票画像の各ページの特徴量と、前記登録手段で登録された登録帳票の対応するページの特徴量とを比較することによって、各登録帳票についてページ毎の類似度を算出するページ類似度算出手段と、前記ページ類似度算出手段で算出したページ毎の類似度に対して、前記登録手段で登録された各ページの重み情報を用いて重み付けをおこなうことにより、前記帳票画像に対する各登録帳票の類似度を算出する帳票類似度算出手段と、前記帳票類似度算出手段で算出した登録帳票ごとの類似度に基づいて、前記帳票画像に対応する登録帳票を決定する決定手段と、を有する。
本発明に係る帳票認識方法は、複数ページで構成される帳票画像が、予め登録されている複数の登録帳票いずれに対応するか認識する帳票認識方法であって、前記登録帳票について、各ページの特徴量と重み情報とを登録する登録ステップと、入力された帳票画像の各ページの特徴量と、前記登録ステップで登録された登録帳票の対応するページの特徴量とを比較することによって、各登録帳票についてページごとの類似度を算出するページ類似度算出ステップと、前記ページ類似度算出ステップで算出したページ毎の類似度に対して、前記登録ステップで登録された各ページの重み情報を用いて重み付けをおこなうことにより、前記帳票画像に対する各登録帳票の類似度を算出する帳票類似度算出ステップと、前記帳票類似度算出ステップで算出した登録帳票ごとの類似度に基づいて、前記帳票画像に対応する登録帳票を決定する決定ステップと、を有する。
また、本発明に係るコンピュータ実行可能なプログラムは、複数ページで構成される帳票画像が、予め登録されている複数の登録帳票のいずれに対応するか、コンピュータに認識させるためのプログラムであって、前記登録帳票について、各ページの特徴量と重み情報とを登録する登録ステップと、入力された帳票画像の各ページの特徴量と、前記登録ステップで登録された登録帳票の対応するページの特徴量とを比較することによって、各登録帳票についてページごとの類似度を算出するページ類似度算出ステップと、前記ページ類似度算出ステップで算出したページ毎の類似度に対して、前記登録ステップで登録された各ページの重み情報を用いて重み付けをおこなうことにより、前記帳票画像に対する各登録帳票の類似度を算出する帳票類似度算出ステップと、前記帳票類似度算出ステップで算出した登録帳票ごとの類似度に基づいて、前記帳票画像に対応する登録帳票を決定する決定ステップと、コンピュータに実行させるためのプログラムコードを含む。
本発明によれば、複数頁で構成された帳票を、容易にかつ精度よく認識処理し得る。
次に、本発明に係る帳票認識装置の実施例1を図面に基づいて説明する。
図1は、本発明に係る帳票認識装置の実施例1を示すブロック図、図2は、図1の帳票認識装置における登録処理を説明するフローチャート、図3は、図1の帳票認識装置における認識処理を説明するフローチャート、図4は、図1の帳票認識装置における重み修正処理を説明するフローチャート、図5は、図1の帳票認識装置における表の数と重みとの関係を示すグラフ、図6は、図1の帳票認識装置における類似度と重みとの関係を示すグラフ、図7は、図1の帳票認識装置における類似度評価方法の例を示す表、図8は、図1の帳票認識装置で読みだし可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
[帳票認識装置]
図1において、帳票認識装置は、磁気ディスク等の外部記憶装置104およびイメージスキャナ108を備え、帳票の画像データを外部記憶装置104から読み込み、あるいは帳票をイメージスキャナ108で読み取る。
帳票認識装置は全体制御のためのCPU101を備え、CPU101の制御プログラムはROM102に格納されている。イメージスキャナ108から入力された帳票画像はRAM103に保持され、ROM102内の制御プログラムにより、帳票認識のための処理を実行する。
帳票認識のための特徴量等は制御プログラムとともにROM102に格納され、あるいは外部記憶装置104からRAM103に読み込まれる。
なお必要に応じ、帳票認識に先立ってノイズ除去等の前処理を実行する。
図1において、105はディスプレイ、106はキーボード、107はマウス等のポインティングデバイスである。また、109はネットワークインターフェースであり、図示しない遠隔地に存在する装置と通信し、プログラム、認識辞書、データ等を送受信し得る。
本発明は汎用的なコンピュータでも実施可能であり、その場合、媒体等で提供される制御プログラムを外部記憶装置104に記憶し、オペレータの指示等によりCPU101で実行するように構成してもよい。
また、帳票認識装置は、イメージスキャナ108やディスプレイ105などがインターフェイスを介して接続された構成であってもよい。
図1に示す帳票認識装置において実行される帳票認識方法を図2、および図3のフローチャートを用いて説明する。
[帳票登録処理]
図2は帳票認識装置に帳票を登録する処理を示す。
図2において、まず、ステップS201でイメージスキャナ108等から登録対象の複数ページで構成される帳票画像を順に入力していく。ステップS202で当該入力されたページの帳票画像から特徴量を抽出する。特徴量として取り出すのは、例えば帳票内にある表枠の大きさ、位置、数、あるいは、表枠内のセルの数などである。
次にステップS203に移行し、ステップS202で抽出された特徴量を用いて重み係数を決定し、記憶する。
特徴量による重み係数の決定方法は、例えば、帳票画像の1頁内にある表の数が多いほど識別する能力が高くなるとして、図5に示すように、1頁内の表の数が6個以上ならば「1」、4個または5個ならば「0.9」、3個以下なら「0.7」とする。
次に、ステップS204で、外部記憶装置104に既に登録されている全ての帳票(登録帳票)の同一頁との類似度を、特徴量を使用して計算する。
同一頁について、入力帳票との類似度が高い登録帳票が存在するときには、以後の認識処理において、複数の類似登録帳票が存在し、分別が困難になるため、誤認識の原因となる。そこで、その頁については、入力帳票の類似度を低下させるように重みを更に小さく設定する。
すなわち、ステップS205において、全ての登録帳票の中において、類似度が最大の登録帳票を探し、類似度が閾値以上か否か判断する。
ステップS205で、類似度が閾値未満であったときは、ステップS209に進む。
ステップS205類似度が閾値以上だったときは、ステップS206に進む。ステップS206では、類似帳票による重み係数を決定する。例えば、図6に示すように、類似度の最大値を100とした場合、類似度90以上の登録帳票が存在すれば重み係数0.5倍、類似度70以上の登録帳票が存在すれば重み係数0.7倍とする。類似度が70未満のときは、重み係数1.0倍である。
ステップS206からステップS207に進み、類似する既に登録済みの登録帳票の対応頁についても、類似度を低下するように重みを修正する。これによって、以後新たな類似帳票が入力されたとき、今回新たに登録される帳票ばかりでなく、既に登録済みの登録帳票の対象ページについても、類似帳票による重み係数を用いて、重みを修正する処理を施すことによって、誤認識を防止する。
ステップS207からステップS208に進み、登録対象の入力帳票の入力頁についてステップS206で得られた類似帳票による重み係数を外部記憶装置104に記憶する。
次にステップS209において、全てのページを処理したか否か判断し、まだ終了していない場合はS201に再び戻る。一方、S209で全てのページを処理したと判断した場合、S203及びS208で記憶した「特徴量による重み係数」と「類似帳票による重み係数」を使用して、各ページの重み付けをS210で計算することで登録が終了する。
[重み修正処理]
ステップS207で実行した、既に登録されている類似帳票の重み修正処理は図4の各ステップによって実行される。
まずステップS401で、入力帳票の処理対象頁に類似する登録帳票頁の重みが適正であるか否か判断する。例えば、登録帳票の対応頁と、入力帳票の処理対象頁との類似度が70のとき、登録帳票対応頁の「類似帳票による重み係数」を0.7にすべきであるが、既に「類似帳票による重み係数」が0.7となっていれば、修正の必要はない。
登録帳票対応頁の重み修正が必要であれば、ステップS402で新たな「類似帳票による重み係数」を記憶し、S403で入力帳票と登録帳票との全頁についての重み付けを計算し直し、類似度を更新する。
ステップS210およびステップS403における重み計算は以下のように実行される。本実施例では、各ページの重みは、{(類似帳票による重み係数)×(特徴量による重み係数)}/(全ページの重み係数の合計)を用いて計算することにする。
例えば、3頁より構成される入力帳票を登録する際、入力帳票の1頁目は類似帳票がなく表が7個存在し(ページ重み係数は1×1)、2頁目は類似帳票の最大類似度が93で表が4個存在し(ページ重み係数は0.5×0.9=0.45)、3頁目は類似帳票がなく表が2個存在する(重みは1×0.7=0.7)場合、全3頁の重み係数の合計は1×1+0.5×0.9+1×0.7=2.15である。そして、1頁目の重みは1/2.15=0.47、2頁目の重みは0.45/2.15=0.21、3頁目は0.7/2.15=0.33となる。
なお重み付けを決定するパラメータとして、以上の処理では表の個数および既存登録帳票との類似度を使用したが、その他のパラメータ、例えば、表内のセルの個数、タイトル部の文字認識類似度等を用いてもよい。
[帳票認識処理]
次に図3のフローチャートを用いて帳票認識処理を説明する。
まずステップS301でイメージスキャナ108等から認識すべき帳票画像を入力し、ステップS302で入力帳票の1つの頁画像(対象頁)の特徴量を抽出する。
次にステップS303に進み、入力帳票対象頁の特徴量と、登録帳票の対応頁の特徴量との類似度を算出し、ステップS304において、ステップS303で算出された類似度が閾値以上であるか否かを判断する。
ステップS304で類似度が閾値より小さい登録帳票については、ステップS305において、他の頁を評価することなく、該登録帳票を類似度評価対象から除外する。
ステップS304で類似度が閾値以上の登録帳票については、ステップS306において、全ての頁の類似度評価が完了したか否か判断し、全ての頁の評価が完了していなければステップS301に戻る。また全ての頁の類似度評価が終了したときには、ステップS307に進み、各登録帳票の全ての頁の類似度の重み付き加算を行う。
最後に、ステップS308において、評価対象となった登録帳票の、類似度の重み付き加算結果をソーティングし、最も類似度が高い登録帳票を認識結果とする。
例えば、図7に示すように、類似度評価対象として登録帳票ID1、ID2が抽出され、登録帳票ID1の重みが1頁目0.3、2頁目0.5、3頁目0.2であり、登録帳票ID2の重みが、1頁目0.1、2頁目0.1、3頁目0.8であり、認識対象の入力帳票との類似度が、1頁目についてID1が98、ID2が85、2頁目についてID1が82、ID2が82、3頁目について、ID1が80、ID2が96だったとする。
この場合、登録帳票ID1の類似度は98×0.3+82×0.5+80×0.2=86.4であり、登録帳票ID2の類似度は85×0.1+82×0.1+96×0.8=93.5となる。その結果、ID2の類似度がID1を上回り、ID2の登録帳票が認識結果となる。
以上説明したように、実施例1は、他の帳票との類似度を用いて重みを決定するため、類似した頁が複数の登録帳票に存在しても、判別能力の高い頁に重みを置いて認識処理するので、精度よく認識できるという効果がある。
さらに、類似度が閾値より低い頁を含む登録帳票については、類似度計算を途中で打ち切るので、処理時間を短縮する効果がある。
さらに、実施例1では、登録帳票の重みを、新たに登録された帳票との類似度に応じて自動的に修正でき、以後の誤認識を防止し得る効果がある。
図8は、本発明に係る帳票認識装置で実行可能な各種データ処理プログラムを格納する記憶媒体のメモリマップ説明する図である。記憶媒体の第1の領域には、ディレクトリ情報が格納され、第2の領域には、第1のデータ処理プログラムとして、図2のフローチャートのステップに対応するプログラムコード群が格納され、第3の領域には、第2のデータ処理プログラムとして、図3のフローチャートのステップに対応するプログラムコード群が格納され、第4の領域には、第3のデータ処理プログラムとして図4のフローチャートのステップに対応するプログラムコード群が格納されている。
なお、特に図示しないが、各種プログラムに従属するデータ、例えば認識辞書なども上記ディレクトリに管理されている。また、各種プログラムをコンピュータにインストールするためのプログラム等が記憶される場合もある。
図1に示す帳票認識装置が実行する実施例2を図9に基づいて説明する。図9は、本発明に係る帳票認識装置の実施例2における認識処理を示すフローチャートである。
実施例2では、構成頁数が一様でない複数帳票を一括認識処理し得る。
実施例2は、認識処理の前提となる登録処理は、実施例1と同様である。
図9において、ステップS501において、入力済みのページ画像(ステップS509で超過したページの画像)があるか判断する。入力済みページ画像がなければ、ステップS502において次のページの帳票画像を入力する。一方、入力済みのページ画像(ステップS509で超過したページの画像)がある場合は、既に特徴量を抽出済みであるのでステップS503は経由せずに、その入力済みのページ画像を入力画像としてステップS504に進むようにしている。
ステップS503では、入力帳票画像の特徴量が抽出される。
ステップS504では、類似度の計算対象となっている入力帳票のページ画像に対応する、各登録帳票の該当ページの特徴情報を抽出し、ステップS505で、入力帳票の当該処理対象のページの特徴量と各登録帳票の該当ページの特徴情報それぞれとを比較して類似度を計算する。
次にステップS506に進み、ステップS505で算出された類似度が閾値より小さい登録帳票を判断し、類似度が閾値より小さい登録帳票についてはステップS507でその登録帳票を認識対象から除外し、以降の頁画像について類似度計算を行わない。
ステップS505で算出された類似度が閾値以上であるときは、ステップS508に進み、類似度の計算を行った入力帳票のページ数が、認識対象の全ての登録帳票の最大構成ページ数に達したか否かを判断する。
ステップS508で最大構成ページ数に達したと判断したときはステップS509に進み、最大構成ページ数に達していないと判断したときはステップS501に戻り、次のページ画像の処理を続行する。
ステップS509では、ステップS501〜508で算出された各登録帳票の各頁の類似度と、各頁の重みとを用いて、各登録帳票についての類似度の重み付き加算を行う。次に、ステップS510において、類似度の重み付き加算結果をソーティングし、認識結果を決定する。
ステップS511では、S501〜508で入力された入力帳票画像のページ数と、S510で決定した認識結果の登録帳票のページ数とを比較し、入力済み帳票頁画像の方が多ければステップS512に進み、多くなければステップS513に進む。ステップS512では入力済み帳票頁画像のうちの超過分の最初の頁を1ページ目としてステップS513を経由してステップS501に進む。
ステップS511では、全ての入力帳票の認識処理が終了したかどうか判断し、認識処理が終了していれば処理を終了する。認識処理未了の頁画像が存在するときはステップS501に戻る。
以上のとおり、実施例2により、構成頁数が一様でない複数の帳票画像が混在するときにも、認識処理が可能である。また、実施例2により、複数の帳票画像を連続して処理できる効果がある。
前述した実施例では、帳票認識装置で実現するものとしたが、一般的なパーソナルコンピュータやワークステーションなどの情報処理装置においても、コンピュータ実行可能な帳票認識プログラムを実行させることにより、前述した実施例を実現させるようにしてもよいし、また、コピーやFAXなどの多様な処理を行える複合機で実現するようにしてもよい。
また、サーバにおいて、クライアント装置からネットワークを介して入力されてきた帳票画像の登録/認識処理を行い、その結果をクライアント装置に返答するような構成であってもよい。
本発明に係る帳票認識装置の実施例1を示すブロック図である。(実施例1) 図1の帳票認識装置における登録処理を説明するフローチャートである。(実施例1) 図1の帳票認識装置における認識処理を説明するフローチャートである。(実施例1) 図1の帳票認識装置における重み修正処理を説明するフローチャートである。(実施例1) 図1の帳票認識装置における表の数と重みとの関係を示すグラフである。(実施例1) 図1の帳票認識装置における類似度と重みとの関係を示すグラフである。(実施例1) 図1の帳票認識装置における類似度評価方法の例を示す表である。(実施例1) 図1の帳票認識装置で読みだし可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。(実施例1) 本発明に係る帳票認識装置の実施例2における認識処理を示すフローチャートである。(実施例2)
符号の説明
101・・・CPU
102・・・ROM
103・・・RAM
104・・・外部記憶装置
105・・・ディスプレイ
106・・・キーボード
107・・・ポインティングデバイス
108・・・スキャナ部
109・・・ネットワークインターフェース

Claims (16)

  1. 複数ページで構成される帳票画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識装置であって、
    前記登録帳票について、各ページの特徴量と重み情報とを登録する登録手段と、
    入力された帳票画像の各ページの特徴量と、前記登録手段で登録された登録帳票の対応するページの特徴量とを比較することによって、各登録帳票についてページ毎の類似度を算出するページ類似度算出手段と、
    前記ページ類似度算出手段で算出したページ毎の類似度に対して、前記登録手段で登録された各ページの重み情報を用いて重み付けをおこなうことにより、前記帳票画像に対する各登録帳票の類似度を算出する帳票類似度算出手段と、
    前記帳票類似度算出手段で算出した登録帳票ごとの類似度に基づいて、前記帳票画像に対応する登録帳票を決定する決定手段と、
    を有することを特徴とする帳票認識装置。
  2. 前記登録手段は、
    新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量に基づいて前記重み情報を算出することを特徴とする請求項1に記載の帳票認識装置。
  3. 前記登録手段は、
    新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて前記重み情報を算出することを特徴とする、請求項1に記載の帳票認識装置。
  4. 前記登録手段は、新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量に基づいて第1の重み係数情報を決定し、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて第2の重み係数情報を決定し、前記決定された第1の重み係数と第2の重み係数とに基づいて前記重み情報を算出することを特徴とする請求項1に記載の帳票認識装置。
  5. 前記登録手段は、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて、前記既に登録されている登録帳票の重み情報の更新も行うことを特徴とする請求項3又は4に記載の帳票認識装置。
  6. 前記ページ類似度算出手段で算出されたページの類似度が、所定値よりも低いと判断された登録帳票に関しては、前記帳票画像との比較対象から外すことを特徴とする請求項1に記載の帳票認識装置。
  7. 前記決定手段で決定された前記帳票画像に対応する登録帳票のページ数より、前記帳票画像のページ数が多い場合、当該超過した帳票画像のページを次の認識処理対象の帳票画像の少なくとも一部として扱うことを特徴とする請求項1に記載の帳票認識装置。
  8. 複数ページで構成される帳票画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識方法であって、
    前記登録帳票について、各ページの特徴量と重み情報とを登録する登録ステップと、
    入力された帳票画像の各ページの特徴量と、前記登録ステップで登録された登録帳票の対応するページの特徴量とを比較することによって、各登録帳票についてページごとの類似度を算出するページ類似度算出ステップと、
    前記ページ類似度算出ステップで算出したページ毎の類似度に対して、前記登録ステップで登録された各ページの重み情報を用いて重み付けをおこなうことにより、前記帳票画像に対する各登録帳票の類似度を算出する帳票類似度算出ステップと、
    前記帳票類似度算出ステップで算出した登録帳票ごとの類似度に基づいて、前記帳票画像に対応する登録帳票を決定する決定ステップと、
    を有することを特徴とする帳票認識方法。
  9. 前記登録ステップは、新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量に基づいて前記重み情報を算出することを特徴とする請求項8に記載の帳票認識方法。
  10. 前記登録ステップは、新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて前記重み情報を算出することを特徴とする請求項8に記載の帳票認識方法。
  11. 前記登録ステップは、新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量に基づいて第1の重み係数情報を決定し、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて第2の重み係数情報を決定し、前記決定された第1の重み係数と第2の重み係数とに基づいて前記重み情報を算出することを特徴とする請求項8に記載の帳票認識方法。
  12. 前記登録ステップは、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて、前記既に登録されている登録帳票の重み情報の更新も行うことを特徴とする請求項10又は11に記載の帳票認識方法。
  13. 前記ページ類似度算出ステップで算出されたページの類似度が、所定値よりも低いと判断された登録帳票に関しては、前記帳票画像との比較対象から外すことを特徴とする請求項8に記載の帳票認識方法。
  14. 前記決定ステップで決定された前記帳票画像に対応する登録帳票のページ数より、前記帳票画像のページ数が多い場合、当該超過した帳票画像のページを次の認識処理対象の帳票画像の少なくとも一部として扱うことを特徴とする請求項8に記載の帳票認識方法。
  15. 請求項8乃至14のいずれかに記載の帳票認識方法の各ステップをコンピュータによって実現させるためのプログラムコードを含むコンピュータ実行可能なプログラム。
  16. 請求項15に記載のコンピュータ実行可能なプログラムのプログラムコードが格納されたコンピュータ読取可能な記憶媒体。
JP2003347688A 2003-10-06 2003-10-06 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 Expired - Fee Related JP4154308B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003347688A JP4154308B2 (ja) 2003-10-06 2003-10-06 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体
US10/950,212 US7450262B2 (en) 2003-10-06 2004-09-23 Form recognizing apparatus, form recognizing method, program and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003347688A JP4154308B2 (ja) 2003-10-06 2003-10-06 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体

Publications (2)

Publication Number Publication Date
JP2005115573A JP2005115573A (ja) 2005-04-28
JP4154308B2 true JP4154308B2 (ja) 2008-09-24

Family

ID=34386411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003347688A Expired - Fee Related JP4154308B2 (ja) 2003-10-06 2003-10-06 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体

Country Status (2)

Country Link
US (1) US7450262B2 (ja)
JP (1) JP4154308B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007257308A (ja) * 2006-03-23 2007-10-04 Canon Inc 文書管理装置、文書管理システム、及びその制御方法、プログラム、記憶媒体
JP2011008446A (ja) 2009-06-24 2011-01-13 Fuji Xerox Co Ltd 画像処理装置
CN102945342B (zh) * 2012-09-29 2015-08-05 北京奇虎科技有限公司 进程识别方法、装置和终端设备
JP6481957B2 (ja) * 2014-08-20 2019-03-13 富士ゼロックス株式会社 画像処理装置およびプログラム
JP6768537B2 (ja) * 2017-01-19 2020-10-14 キヤノン株式会社 画像処理装置、画像処理方法、プログラム
CN108090433B (zh) * 2017-12-12 2021-02-19 厦门集微科技有限公司 人脸识别方法及装置、存储介质、处理器
JP6988464B2 (ja) * 2017-12-26 2022-01-05 ブラザー工業株式会社 プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5784485A (en) * 1994-08-25 1998-07-21 Xu; Youguang Method and apparatus for automated pattern recognition
JPH10269311A (ja) 1997-03-25 1998-10-09 Oki Electric Ind Co Ltd 帳票処理単位指定方法
JP4074366B2 (ja) * 1998-02-24 2008-04-09 コニカミノルタビジネステクノロジーズ株式会社 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体
US6606402B2 (en) * 1998-12-18 2003-08-12 Cognex Corporation System and method for in-line inspection of stencil aperture blockage
JP4416202B2 (ja) 1999-03-31 2010-02-17 キヤノン株式会社 帳票認識装置、情報システム、及び記憶媒体
JP4006239B2 (ja) * 2002-02-21 2007-11-14 株式会社日立製作所 文書の検索方法および検索システム
US7319791B1 (en) * 2003-09-22 2008-01-15 Matrox Electronic Systems, Ltd. Subtractive primitives used in pattern matching

Also Published As

Publication number Publication date
US20050073721A1 (en) 2005-04-07
JP2005115573A (ja) 2005-04-28
US7450262B2 (en) 2008-11-11

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
JP7013182B2 (ja) 情報処理装置、情報処理方法およびプログラム
EP1555600B1 (en) Information processing apparatus and control method therefor
CN110136156B (zh) 一种多边形区域检测方法及装置
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2006338313A (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
KR102114367B1 (ko) 객체 영역 추출을 수행하는 인공 신경망을 위한 학습 데이터를 생성하는 방법 및 장치
KR20220093187A (ko) 포지셔닝 방법 및 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체
JP4154308B2 (ja) 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体
CN110689026B (zh) 一种图像中对象的标注方法、装置及电子设备
JP6589639B2 (ja) 検索システム、検索方法およびプログラム
JP4678712B2 (ja) 言語識別装置、プログラム及び記録媒体
CN112560857B (zh) 文字区域边界检测方法、设备、存储介质及装置
JP6700705B2 (ja) 振り分けシステム、情報処理方法、及びプログラム
CN111814535B (zh) 掌纹图像的识别方法、装置、设备及计算机可读存储介质
US7623714B2 (en) Form recognition system, method, program, and storage medium
CN115311649A (zh) 一种卡证类别识别方法、装置、电子设备及存储介质
JP2012226429A (ja) 画像検索および認識システム
JPH07200735A (ja) 図形認識装置
CN115687673B (zh) 图片归档的方法、装置、电子设备及可读存储介质
JP2020047138A (ja) 情報処理装置
JP2832928B2 (ja) 文字認識方法
JP2004206521A (ja) 文書検索装置および文書検索プログラム
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体
WO2024012138A1 (zh) 目标检测模型训练方法、目标检测方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050613

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080701

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080707

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110711

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120711

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120711

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130711

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees