JP4420443B2 - 帳票認識装置及びその制御方法、プログラム - Google Patents

帳票認識装置及びその制御方法、プログラム Download PDF

Info

Publication number
JP4420443B2
JP4420443B2 JP2004080984A JP2004080984A JP4420443B2 JP 4420443 B2 JP4420443 B2 JP 4420443B2 JP 2004080984 A JP2004080984 A JP 2004080984A JP 2004080984 A JP2004080984 A JP 2004080984A JP 4420443 B2 JP4420443 B2 JP 4420443B2
Authority
JP
Japan
Prior art keywords
similarity
color information
registered
form image
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004080984A
Other languages
English (en)
Other versions
JP2005267408A (ja
JP2005267408A5 (ja
Inventor
妙子 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004080984A priority Critical patent/JP4420443B2/ja
Priority to US10/997,537 priority patent/US7508986B2/en
Publication of JP2005267408A publication Critical patent/JP2005267408A/ja
Publication of JP2005267408A5 publication Critical patent/JP2005267408A5/ja
Application granted granted Critical
Publication of JP4420443B2 publication Critical patent/JP4420443B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、複数の罫線で構成される帳票画像に対応する画像を登録帳票画像の中から認識する帳票認識装置及びその制御方法、プログラムに関するものである。
帳票を、あらかじめ登録されたフォーマットごとに自動分類する帳票認識は、大量の帳票の入力処理を行う上で大変有効な方法である。
この方法では、スキャナ等の読取部から読み取った帳票画像データから特徴量を抽出し、帳票書式データを生成する。そして、検索帳票(処理対象帳票)と登録帳票の書式データの類似度を算出し、類似度の最も高い登録帳票を、認識結果とするように構成されている。
また、現在は、カラー帳票も多く流通しているので、カラー帳票の高精度認識および処理時間短縮が求められている。
例えば、特許文献1では、多色帳票画像を、指定した色毎に範囲を指定して、その範囲位置と色とをフィールド毎にまとめた標準帳票を作成し、入力された帳票と比較、種類を判別している。
また、特許文献2では、罫線の形状の他に、文字列及び帳票の種別を特定するための色を用い、それら複数の特徴のある一つの特徴から帳票が特定できなかった場合、別の特徴を用いて帳票を認識するように構成されている。
特開平9−16714号公報 特開2000−285190号公報
しかしながら、上記特許文献1では、帳票を登録する際に事前に色範囲を指定しなくてはならないので、帳票認識の判別材料となる色情報の種類は限られる。
また、上記特許文献2では、形状が類似した帳票は色を使用することが可能であるものの、当初使用した特徴で判別できない帳票を、新たな特徴で判別するため、一つの類似度で判別できない。また、どの特徴から使用すべきかは判定できていない。
本発明は上記の課題に鑑みてなされたものであり、より高精度でかつ高速に帳票画像を認識することができる帳票認識装置及びその制御方法、プログラムを提供することを目的とする。
上記の目的を達成するための本発明による帳票認識装置は以下の構成を備える。即ち、
記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置であって、
認識対象の帳票画像を入力する入力手段と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出手段と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出手段と、
前記色情報抽出手段で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合手段と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出手段で抽出した前記形状特徴量に基づく第1類似度と前記統合手段による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出手段と、
前記算出手段で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定手段と
を備える。
また、好ましくは、前記算出手段は、前記第1類似度を算出した後、前記第1類似度が閾値以上であるか否かを判定
前記第1類似度が前記閾値以上であると判定した場合は、前記第2類似度を算出して前記加算後の類似度を算出する一方、
前記第1類似度が前記閾値以上でないと判定した場合は前記第2類似度および前記加算後の類似度の算出は行わない
また、好ましくは、前記統合手段は、前記罫線を挟んで隣接するセル領域それぞれの色情報の差が一定範囲内にある場合、当該セル領域が同一の色情報を有していると判定する。
上記の目的を達成するための本発明による帳票認識装置の制御方法は以下の構成を備える。即ち、
記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置の制御方法であって、
認識対象の帳票画像を入力する入力工程と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出工程と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出工程と、
前記色情報抽出工程で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合工程と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出工程で抽出した前記形状特徴量に基づく第1類似度と前記統合工程による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出工程と、
前記算出工程で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定工程と
を備える。
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置の制御をコンピュータに実行させるためのプログラムであって、
認識対象の帳票画像を入力する入力工程と、
前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出工程と、
前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出工程と、
前記色情報抽出工程で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合工程と、
前記複数の登録帳票画像それぞれに対して、前記特徴量抽出工程で抽出した前記形状特徴量に基づく第1類似度と前記統合工程による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出工程と、
前記算出工程で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定工程と
を備える。
本発明によれば、より高精度でかつ高速に帳票画像を認識することができる帳票認識装置及びその制御方法、プログラムを提供できる。
以下、本発明の実施の形態について図面を用いて詳細に説明する。
[実施形態1]
図1は本発明を実施形態1の帳票認識装置の構成を示すブロック図である。
尚、ここで帳票とは、複数の罫線によって囲まれる領域が、複数個配置されて構成される画像を示すものである。
101はCPUであり、ROM102に格納されている制御プログラムに従って本装置全体の制御を行う。102はROMであり、CPU101が実行する後述するフローチャートに示す処理等の制御プログラムを含む各種プログラムや各種パラメータデータを格納する。
103はRAMであり、帳票画像等の画像や各種情報を記憶する。また、RAM103は、データの作業領域や一時待避領域として機能する。104は外部記憶装置であり、登録画像(帳票画像)を管理するデータベースを含む各種データを記憶する。また、外部記憶装置104は、例えば、ハードディスクやCD−ROM等で構成される。105はディスプレイであり、例えば、LCDやCRTで構成される。
106はキーボードである。107はポインティングデバイスであり、例えば、マウスやペンタブレット等で構成される。108はカラー画像を入力することが可能なスキャナであり、画像(例えば、帳票)を光学的に読み取り、その画像データを取得する。また、スキャナ108には、必要に応じてADF(オードドキュメントフィーダ:自動原稿給紙部)が構成されていても良い。
尚、本発明は汎用的なコンピュータでも実施可能であり、その場合、記憶媒体に記憶される制御プログラムを外部記憶装置104に記憶し、オペレータの指示等によりCPU101で実行するように構成されてもよい。
109はネットワークインターフェース(I/F)であり、ネットワーク上に接続されている外部装置(例えば、サーバ、外部記憶装置等)と通信し、プログラムやデータを読み込んだり、書き込んだりする。
尚、ネットワークは、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、またはこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
また、スキャナ108やディスプレイ105は、ネットワークインターフェース109を介して接続されて構成されていても良い。
次に、図1の帳票認識装置における帳票登録処理について、図2を用いて説明する。
図2は本発明の実施形態1の帳票認識装置における帳票登録処理を示すフローチャートである。
まず、ステップS201で、スキャナ108から登録対象の画像(例えば、帳票画像)を入力する。ステップS202で、入力画像の形状に関する形状特徴量抽出を行う。ここで、形状特徴量としては、例えば、帳票画像内にある表枠の大きさ、位置、数、あるいは、表枠内のセル領域の数等の帳票画像を構成する構成要素に関する情報である。
次に、ステップS203で、抽出した形状特徴量によって特定される入力画像の形状(構成要素)を形状データとして、その入力画像と対応づけて外部記憶装置104に登録する。
ステップS204で、入力画像がカラー画像であるか否かを判定する。入力画像がカラー画像でない場合(ステップS204でNO)、処理を終了する。一方、入力画像がカラー画像である場合(ステップS204でYES)、ステップS205に進む。
ステップS205で、入力画像であるカラー画像と、ステップS203で登録した形状データに基づいて、入力画像の各構成要素と色情報を抽出する。
尚、色情報としては、例えば、RGB値で表現される色とするが、それ以外にも輝度情報や濃度情報を色情報として抽出しても良い。
ステップS206で、入力画像の各構成要素において、位置が隣接していて、なおかつ同一の色情報を持つ構成要素を統合し、一つの統合構成要素を生成する。
ステップS207で、統合構成要素あるいは各構成要素毎の色情報を色情報データとして、その入力画像と対応づけて外部記憶装置104に登録する。
以上の処理によって、外部記憶装置104には、入力画像と対応する形状データとが少なくとも対応づけて登録され、加えて、入力画像がカラー画像である場合には、更に、その色情報データが対応づけて登録される。
次に、ステップS205の色情報抽出処理の具体例について、図3〜図6を用いて説明する。
図3は本発明の実施形態1の入力画像の一例を示す図である。
図3において、301は表枠の枠線(罫線)であり、破線で示す矩形302が表要素(罫線部分で囲まれる)を構成するセル領域である。この例では、9個のセル領域302が存在している。また、各セル領域302には文字画像で構成される文字領域が存在することがあり、図3では、矩形303が文字領域を示している。この例では、7個の文字領域303が存在している。
次に、この図3の入力画像を用いて、ステップS205の色情報抽出処理の詳細について、図4〜図6を用いて説明する。
特に、実施形態1では、ステップS205の色情報抽出処理として、帳票画像を構成する表中のセル領域の色情報を抽出するセル領域色情報抽出処理(図4)、セル領域内の文字領域の色情報を抽出する文字領域色情報抽出処理(図5)、表を構成する罫線の色情報を抽出する罫線色情報抽出処理を実行する。
まず、セル領域色情報抽出処理について、図4を用いて説明する。
図4は本発明の実施形態1のセル領域色情報抽出処理を示すフローチャートである。
ステップS401で、入力画像(カラー画像)内の表枠内に存在するセル領域中に存在する文字領域を削除する。例えば、図3の右端のセル領域302では、その内部にある文字領域303(「2003」)を削除する。
ステップS402で、文字領域が削除されたセル領域を構成するセル領域画像の各画素の色情報の平均値(第1平均値)を算出する。そして、この第1平均値を、そのセル領域画像の色情報(セル色)とする。
以上の処理を、入力画像中に存在する各セル領域に対して実行する。
次に、文字領域色情報抽出処理について、図5を用いて説明する。
図5は本発明の実施形態1の文字領域色情報抽出処理を示すフローチャートである。
ステップS501で、入力画像であるカラー画像と、文字領域を1とし、残りの背景部を0とした場合の二値画像の文字領域と論理積を取る。ステップS502で、論理積によって得られる画像、つまり、文字領域中の文字領域画像に対応するカラー画像の色情報の平均値(第2平均値)を算出する。そして、この第2平均値を、その文字領域画像の色情報(文字色)とする。
以上の処理を、入力画像中に存在する各文字領域に対して実行する。
次に、罫線色情報抽出処理について、図6を用いて説明する。
図6は本発明の実施形態1の罫線色情報抽出処理を示すフローチャートである。
ステップS601で、入力画像中の表からセル領域(文字領域を含む)を削除する。ステップS602で、得られる表画像(罫線部分画像)の画素の色情報の平均値(第3平均値)を算出する。そして、この第3平均値を、その罫線部分画像の色情報(罫線色)とする。
尚、この処理は、入力画像中のすべての罫線部分全体に実行しても良いし、セル領域を構成する罫線部分領域毎に実行しても良い。
次に、ステップS206の処理の詳細について、図7を用いて説明する。
図7は本発明の実施形態1のステップS206の処理の詳細を示すフローチャートである。
ステップS701で、処理対象の構成要素を選択し、それに隣接する構成要素の色情報が同一であるか否かを判定する。色情報が同一でない場合(ステップS701でNO)、ステップS703に進む。一方、色情報が同一である場合(ステップS703でYES)、ステップS702に進む。
ステップS702で、処理対象の構成要素と判定対象の構成要素(つまり、処理対象の構成要素に隣接する構成要素)同士を統合する。ここで、構成要素とは、表枠内のセル領域、文字領域、罫線枠部分のいずれかであり、ステップS701では、これらのいずれかの構成要素毎にその色情報を比較することになる。
尚、色情報が全く同一である可能性は低いので、この色情報の比較には、オフセット値(許容範囲値)を設定しておき、色情報の差がそのオフセット値に含まれる場合には、同一であると判定する。
ステップS703で、画像中のすべての構成要素に対して、ステップS701の処理が完了したか否かを判定する。完了していない場合(ステップS703でNO)、ステップS701に戻り、未処理の構成要素を選択して、すべての構成要素に対して処理が完了するまで、ステップS701〜ステップS703の処理を繰り返す。一方、完了している場合(ステップS703でYES)、処理を終了する。
ここで、図7の処理の具体例について、図8を用いて説明する。
図8は本発明の実施形態1のステップS206の処理の具体例を説明するための図である。
図8(a)は、ステップS206の処理前の画像の一例であり、ここでは、801〜809のセル領域が存在している。また、セル領域801〜803は同一色、セル領域804及び805は同一色、セル領域806〜809は同一色であるとする。
この図8(a)の画像にステップS206の処理を適用すると、図8(b)のようになる。
図8(b)に示されるように、セル領域801〜803、セル領域804及び805、セル領域806〜809はそれぞれ同一色であるので、それぞれ統合されてセル領域901、902、903が生成されることがわかる。
次に、検索対象の画像に対応する画像を登録画像(帳票)群の中からを検索する検索処理(帳票認識処理)について、図9を用いて説明する。
図9は本発明の実施形態1の帳票認識装置における検索処理を示すフローチャートである。
ステップ901で、スキャナ108から検索対象の画像(例えば、帳票画像)を入力する。ステップS902で、入力画像の形状に関する形状特徴量抽出を行う。尚、ここでの形状特徴量抽出は、図3のステップS202と同様である。但し、ここでは、抽出した形状特徴量は、入力画像の形状データとして一時的にRAM103に記憶する。
ステップS903で、入力画像がカラー画像であるか否かを判定する。カラー画像でない場合(ステップS903でNO)、ステップS906に進む。一方、カラー画像である場合(ステップS903でYES)、ステップS904に進む。
ステップS904で、入力画像であるカラー画像と、RAM103に一時記憶した形状データに基づいて、入力画像の各構成要素と色情報を抽出する。ステップS905で、入力画像の各構成要素において、位置が隣接していて、なおかつ同一の色情報を持つ構成要素を統合し、一つの統合構成要素を生成する。
ステップS906で、入力画像と、複数の登録画像中の比較対象の登録画像との間で、形状データに基づく類似度(第1類似度)を算出する。ステップS907で、入力画像と比較対象の登録画像がともに色情報を有しているか否かを判定する。色情報を有していない場合(ステップS907でNO)、ステップS909に進む。一方、色情報を有している場合(ステップS907でYES)、ステップS908に進む。
尚、ステップS907の判定では、入力画像と登録画像のどちらかが二値画像あるいは、どちらも二値画像である場合には、ステップS909に進むことになる。
ステップS908で、入力画像と比較対象の登録画像との構成要素同士の間で、色情報に基づく類似度(第2類似度)を算出する。特に、ここでは、算出した第2類似度を、ステップS906で算出した第1類似度に加算する。
尚、ステップS908での第2類似度の算出は、色情報が同一である場合にのみ実行するようにしても良い。
また、入力画像の印刷状態やスキャナの読取条件により、入力画像と比較対象の登録画像間で色情報が全く同一になる可能性は低いため、ある程度の誤差範囲(オフセット値)を持たせて、この誤差範囲内で、同一であるか否かの判定を行うようにしても良い。
また、第2類似度は、実験的に最適値が算出されるものであるが、例えば、形状による第1類似度の最大値に対し、その最大値が0.2となるようにしておき、処理対象の構成要素の内、一致した色の割合を乗じた値を第1類似度に加算する第2類似度(加算値)とする。また、この加算値は、構成要素であるセル領域、文字領域や罫線部分の種類に応じて、算出する類似度の重み付けを行うようにしても良い。
ステップS909で、すべての登録画像と類似度算出のための比較が終了したか否かを判定する。終了していない場合(ステップS909でNO)、ステップS906に戻る。一方、終了している場合(ステップS909でYES)、ステップS910に進む。
ステップS910で、各登録画像に対して算出した類似度をソートして、最大類似度の登録画像を入力画像に対応する認識結果として決定する。
尚、最大類似度があらかじめ定められた閾値に達しない場合は、入力画像に対応する登録画像がないとして、その旨を通知するようにしても良い。あるいは、最大類似度から上位3個までの登録画像を、入力画像に対応する認識結果候補として出力し、最終的にオペレータに選択させるようにしても良い。
以上説明したように、実施形態1によれば、登録処理では、処理対象となる入力画像の構成要素毎に色情報を抽出して、その抽出した色情報が隣接する構成要素同士で同一であると判定される場合には、それらの構成要素を統合して登録する。これにより、登録画像に関する情報の情報量を削減することができる。
一方、入力画像に対応する画像を登録画像群から検索する検索処理(認識処理)においては、その入力画像の形状特徴量に加えて、色情報に関する登録画像との類似度を算出することで、より高精度に画像検索(画像認識)を行うことが可能である。
また、類似度算出時には、色情報が同一である判定される構成要素についてはその構成要素を統合した上で、類似度算出を実行する。これにより、類似度算出に係る比較演算回数が低減することができる。
[実施形態2]
実施形態1では、検索処理において、登録画像中のすべての登録画像に対して、入力画像との色情報に関する類似度算出処理を実行する構成としているが、比較対象の登録画像の形状が、入力画像の形状と類似していない場合は、その色情報も類似していなかったり、共通する構成要素がない可能性が高い。そのため、このような登録画像に対して、入力画像との色情報に関する類似度算出処理を実行しても、その登録画像との類似度は低く、最終的な入力画像に対応する登録画像となることは低いので、この色情報に関する類似度算出処理そのものが冗長となる。
そこで、実施形態2では、比較対象の登録画像に対し、入力画像との形状データに基づく類似度が閾値以上でない場合には、その登録画像との色情報に関する類似度算出処理を禁止(省略)して、処理の冗長性を軽減し、かつ処理速度及び精度を向上させる構成について説明する。
以下、実施形態2の帳票認識装置における検索処理について、図10を用いて説明する。
図10は本発明の実施形態2の帳票認識装置における検索処理を示すフローチャートである。
尚、図10において、ステップS1001、ステップS1002及びステップS1008〜ステップS1010は、図9のステップS901、ステップS902及びステップS908〜ステップS910に対応するので、その説明は省略する。
ステップS1001及びステップS1002の処理後、ステップS1003で、入力画像と、複数の登録画像中の比較対象の登録画像との間で、形状データに基づく類似度(第1類似度)を算出する。
ステップS1004で、第1類似度が閾値以上であるか否かを判定する。所定値(閾値)未満である場合(ステップS1004でNO)、次の比較対象の登録画像を選択するために、ステップS1009に進む。一方、第1類似度が閾値以上である場合(ステップS1004でYES)、ステップS1005に進む。
ステップS1005で、入力画像と比較対象の登録画像がともに色情報を有しているか否かを判定する。色情報を有していない場合(ステップS1005でNO)、ステップS1009に進む。一方、色情報を有している場合(ステップS1005でYES)、ステップS1006に進む。
ステップS1006で、入力画像であるカラー画像と、RAMに一時記憶した形状データに基づいて、入力画像の各構成要素と色情報を抽出する。ステップS1007で、入力画像の各構成要素において、位置が隣接していて、なおかつ同一の色情報を持つ構成要素を統合し、一つの統合構成要素を生成する。
その後、ステップS1008〜ステップS1010の処理を実行する。但し、実施形態2のステップS1010では、第2類似度を算出した登録画像のみに対して処理を実行することになる。これにより、より入力画像に候補となる登録画像の検索精度を向上することができる。
以上説明したように、実施形態2によれば、実施形態1で説明した効果に加えて、入力画像に候補となる可能性の低い登録画像に対しては、色情報に基づく類似度算出処理を禁止するように処理を実行するので、装置の処理負荷を軽減するとともに、処理速度を向上させることができる。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明を実施形態1の帳票認識装置の構成を示すブロック図である。 本発明の実施形態1の帳票認識装置における帳票登録処理を示すフローチャートである。 本発明の実施形態1の入力画像の一例を示す図である。 本発明の実施形態1のセル領域色情報抽出処理を示すフローチャートである。 本発明の実施形態1の文字領域色情報抽出処理を示すフローチャートである。 本発明の実施形態1の罫線色情報抽出処理を示すフローチャートである。 本発明の実施形態1のステップS206の処理の詳細を示すフローチャートである。 本発明の実施形態1のステップS206の処理の具体例を説明するための図である。 本発明の実施形態1の帳票認識装置における検索処理を示すフローチャートである。 本発明の実施形態2の帳票認識装置における検索処理を示すフローチャートである。
符号の説明
101 CPU
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 キーボード
107 ポインティングデバイス
108 スキャナ部
109 ネットワークインターフェース

Claims (5)

  1. 記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置であって、
    認識対象の帳票画像を入力する入力手段と、
    前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出手段と、
    前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出手段と、
    前記色情報抽出手段で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合手段と、
    前記複数の登録帳票画像それぞれに対して、前記特徴量抽出手段で抽出した前記形状特徴量に基づく第1類似度と前記統合手段による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出手段と、
    前記算出手段で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定手段と
    を備えることを特徴とする帳票認識装置。
  2. 前記算出手段は、前記第1類似度を算出した後、前記第1類似度が閾値以上であるか否かを判定
    前記第1類似度が前記閾値以上であると判定した場合は、前記第2類似度を算出して前記加算後の類似度を算出する一方、
    前記第1類似度が前記閾値以上でないと判定した場合は前記第2類似度および前記加算後の類似度の算出は行わない
    ことを特徴とする請求項1に記載の帳票認識装置。
  3. 前記統合手段は、前記罫線を挟んで隣接するセル領域それぞれの色情報の差が一定範囲内にある場合、当該セル領域が同一の色情報を有していると判定する
    ことを特徴とする請求項1に記載の帳票認識装置。
  4. 記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置の制御方法であって、
    認識対象の帳票画像を入力する入力工程と、
    前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出工程と、
    前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出工程と、
    前記色情報抽出工程で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合工程と、
    前記複数の登録帳票画像それぞれに対して、前記特徴量抽出工程で抽出した前記形状特徴量に基づく第1類似度と前記統合工程による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出工程と、
    前記算出工程で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定工程と
    を備えることを特徴とする帳票認識装置の制御方法。
  5. 記憶装置に記憶されている複数の登録帳票画像の中から、複数の罫線で構成される帳票画像に対応する登録帳票画像を認識する帳票認識装置の制御をコンピュータに実行させるためのプログラムであって、
    認識対象の帳票画像を入力する入力工程と、
    前記認識対象の帳票画像内にある表枠の大きさと位置と数ならびに表枠内のセル領域の数を、形状特徴量として抽出する特徴量抽出工程と、
    前記認識対象の帳票画像内にある表枠内のセル領域それぞれの色情報を抽出する色情報抽出工程と、
    前記色情報抽出工程で抽出した前記表枠内のセル領域それぞれの色情報に基づいて、罫線を挟んで隣接し且つ同一の色情報を有していると判定される複数のセル領域を1つのセル領域として生成することにより、セル領域を統合する統合工程と、
    前記複数の登録帳票画像それぞれに対して、前記特徴量抽出工程で抽出した前記形状特徴量に基づく第1類似度と前記統合工程による統合処理後のセル領域の色情報に基づく第2類似度とを算出し、当該算出した前記第1類似度と第2類似度とを加算することによって加算後の類似度を算出する算出工程と、
    前記算出工程で算出した加算後の類似度に基づいて、前記記憶装置に記憶されている複数の登録帳票画像の中から、前記認識対象の帳票画像に対応する登録帳票画像を決定する決定工程と
    をコンピュータに実行させることを特徴とするプログラム。
JP2004080984A 2003-11-28 2004-03-19 帳票認識装置及びその制御方法、プログラム Expired - Fee Related JP4420443B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004080984A JP4420443B2 (ja) 2004-03-19 2004-03-19 帳票認識装置及びその制御方法、プログラム
US10/997,537 US7508986B2 (en) 2003-11-28 2004-11-23 Document recognition device, document recognition method and program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004080984A JP4420443B2 (ja) 2004-03-19 2004-03-19 帳票認識装置及びその制御方法、プログラム

Publications (3)

Publication Number Publication Date
JP2005267408A JP2005267408A (ja) 2005-09-29
JP2005267408A5 JP2005267408A5 (ja) 2007-02-08
JP4420443B2 true JP4420443B2 (ja) 2010-02-24

Family

ID=35091877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004080984A Expired - Fee Related JP4420443B2 (ja) 2003-11-28 2004-03-19 帳票認識装置及びその制御方法、プログラム

Country Status (1)

Country Link
JP (1) JP4420443B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331764A (ja) * 2000-03-13 2001-11-30 Fujitsu Ltd 文字認識方法
JP3842006B2 (ja) * 2000-03-30 2006-11-08 グローリー工業株式会社 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4558232B2 (ja) * 2001-03-26 2010-10-06 株式会社リコー 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2005267408A (ja) 2005-09-29

Similar Documents

Publication Publication Date Title
JP3796500B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4266784B2 (ja) 画像処理システム及び画像処理方法
US7391917B2 (en) Image processing method
CN100448257C (zh) 图像处理装置及其方法
US7640269B2 (en) Image processing system and image processing method
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US8244035B2 (en) Image processing apparatus and control method thereof
JP2007042092A (ja) 電子ドキュメント処理装置、方法およびプログラム
CN102171708A (zh) 商业文档处理器
JP2005167937A (ja) 画像処理システム及び画像処理方法
JP4968293B2 (ja) 文書処理装置、文書処理方法およびプログラム
US7453594B2 (en) Document filing apparatus for storing information added to a document file
JP4338189B2 (ja) 画像処理システム及び画像処理方法
CN101625752A (zh) 图像处理设备和图像处理方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
US20200396351A1 (en) Character recognition device, method of generating document file, and storage medium
US8339622B2 (en) Image processing apparatus and integrated document generating method
CN101123663B (zh) 图像处理设备和方法
JP4420443B2 (ja) 帳票認識装置及びその制御方法、プログラム
JP2007221340A (ja) 画像ファイル生成方法及び画像ファイル生成装置
CN100588218C (zh) 图像形成装置和电子邮件传送服务器
CN101206708A (zh) 图像处理装置及图像处理方法
JP4804433B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP5673277B2 (ja) 画像処理装置およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061207

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091127

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091130

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4420443

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees