JP5110793B2 - 帳票識別装置 - Google Patents

帳票識別装置 Download PDF

Info

Publication number
JP5110793B2
JP5110793B2 JP2005376971A JP2005376971A JP5110793B2 JP 5110793 B2 JP5110793 B2 JP 5110793B2 JP 2005376971 A JP2005376971 A JP 2005376971A JP 2005376971 A JP2005376971 A JP 2005376971A JP 5110793 B2 JP5110793 B2 JP 5110793B2
Authority
JP
Japan
Prior art keywords
feature
unit
identification
input
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005376971A
Other languages
English (en)
Other versions
JP2007179307A (ja
Inventor
正規 及川
健 永崎
勝美 丸川
和樹 中島
茂 〆木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Computer Peripherals Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Peripherals Co Ltd filed Critical Hitachi Computer Peripherals Co Ltd
Priority to JP2005376971A priority Critical patent/JP5110793B2/ja
Publication of JP2007179307A publication Critical patent/JP2007179307A/ja
Application granted granted Critical
Publication of JP5110793B2 publication Critical patent/JP5110793B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

本発明は、罫線の有無や印字ずれの有無や類似帳票の有無が混在するような複数種類の帳票の識別手法及び帳票識別装置に関する。
従来の帳票識別手法として、帳票の種類を識別するために帳票内の特徴量を用いる方式がある(例えば、特許文献1)。この技術は、罫線から得られる黒画素の位置などの帳票の特徴点を帳票毎に辞書として登録しておき、識別対象となる帳票画像より罫線2値画像を作成し、予め登録しておいた辞書とでマッチングを実施する方法である。
特開平10−222587号公報
特許文献1に代表される従来の帳票識別手法では、入力点または辞書点として、罫線の端点や交点、並びに上下左右を罫線で囲まれる最小の領域(セル)の中心座標などを特徴点として用いるとしている。従って、罫線で構成された表が存在しない一般帳票の識別への対応が難しい。また、罫線抽出及びセル抽出といった高度な処理を実施してしまうことで、識別処理の速度低下が予想される。さらに、帳票識別のためには未知入力帳票から得られた特徴点群と、辞書に登録された特徴点群の間の対応関係を計算しなければならないが、伸縮や位置ずれによる差異を吸収するために特徴点間の対応関係の計算処理に時間が掛かるため、大量の帳票を短時間に識別するには難しい。
そこで、本発明では、上記課題を解決し、複数種類の帳票を取り扱う場合、なかでも罫線で構成された表が存在しない帳票や、伸縮や位置ずれがみられる帳票や、安易に識別可能な定型帳票が混在するような場合でも、帳票識別処理を高速かつ効率的に安定して判別することができる帳票類の自動判別方法及び装置を提供することを目的とする。
上記課題を解決するために、本願で開示する代表的な発明は以下の通りである。複数種類の登録帳票の特徴量を格納する記録部と、入力された帳票から特徴量を抽出し上記登録帳票との照合を行う一次照合部と、上記一次照合で認識できなかった帳票について上記特徴量を用いて上記登録帳票との照合を行う二次照合部とを有する帳票識別装置であって、上記二次照合部において上記一次照合で照合の候補として挙がった登録帳票間の上記特徴量差分が大きい領域について、上記特徴量を用いた照合を行う。
又は、上記二次照合部において、該入力された帳票の印字領域を抽出して該印字領域の位置ずれや伸縮を推定して、辞書に登録された照合対象の絞込みを行ってから、上記照合を行うことを特徴とする帳票識別装置。
(1)本発明により、照合処理を二段階に分割することで、識別する帳票の内容に応じて照合処理を切り替えることができ、識別処理の効率化が見込める。加えて、上記二段階の照合処理に共通の辞書を使用することで、識別処理の速度向上も期待できる。
(2)また本発明により、帳票内に伸縮や位置ずれがみられるような場合にも、二段目の帳票内の記載領域を基準とした照合処理を実施することで識別可能となる。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。本発明では、識別に有効な帳票上の部分領域を学習によって自動的に選択し、当該選択領域に対して部分画像フィルタを適用することで入力帳票画像を複数の特徴量の組み合わせである特徴ベクトルへと変換し、当該特徴ベクトルと辞書に登録されたベクトル間の距離を2段階の処理によって計算することで、様々な帳票の識別を高速かつ効率的に行うことを特徴とする。
本発明の実施の形態において、図1の帳票識別装置の機能ブロック図は、帳票識別装置(101)内を画像入力部(102)、学習/辞書作成部(103)、識別/評価部(104)から構成されており、さらに識別/評価部(104)内は、紙領域基準抽出部(108)とサイズ判定部(109)と一次照合部(110)からなる一次照合(105)、記載領域基準抽出部(111)と二次照合部(112)からなる二次照合(107)、そして閾値判定部(106)の三部より構成されている。画像入力部(102)は、帳票画像の入力を行う為のもので、辞書作成に伴う帳票のサンプル画像の入力と、判別対象となる帳票画像の入力はいずれもこちらより行う。学習/辞書作成部(103)は、上記画像入力部(102)より入力された帳票のサンプル画像より、判別の際に必要となる辞書を作成する為のものである。識別/評価部(104)は、上記画像入力(102)より入力された判別対象となる帳票画像を、上記学習/辞書作成部(103)にて帳票のサンプル画像から作成された辞書を用いて判別する為のものである。識別/評価部(104)は、上記判別対象となる入力画像とサンプル画像より作成された辞書とを比較照合する一次照合(105)、一次照合(105)での照合結果の可否判定を行う閾値判定部(106)、閾値判定部(106)にて照合結果が不可だった場合に行う二次照合(107)から構成されており、一次照合(105)内は、帳票用紙の四隅を検出する紙領域基準抽出部(108)、帳票のサイズを判定するサイズ判定部(109)、上記検出した領域を基準に帳票画像より特徴量を抽出し、上記学習/辞書作成部(103)で作成した辞書との照合を行う一次照合部(110)から構成される。また二次照合(107)内は、帳票用紙内に記載されている領域を検出する記載領域基準抽出部(111)、上記検出した領域を基準に帳票画像より特徴量を抽出し、上記学習/辞書作成部(103)で作成した辞書との照合を行う二次照合部(112)から構成されている。
次に、本発明の実施の形態における帳票識別装置における帳票識別の処理手順について、図2の帳票識別装置における学習/辞書作成部内での帳票サンプルより辞書を作成する過程を示すフロー図、および図3の帳票識別装置にける識別/評価部内での帳票の識別過程を示すフロー図を用いて説明する。図2は、図1の識別/評価部(104)内における帳票の学習と辞書作成過程を示すフロー図であり、サンプルとなる帳票は当該過程を経て学習、辞書作成が行われる。先ず、サンプルとなる帳票の画像を図1の画像入力部(102)より取得し、これをサンプル画像とする(ステップ201)。上記サンプル画像より辞書作成のための特徴量抽出を行うため、帳票用紙の基準と傾きを検出する(ステップ202)。例えば、基準としては、方形帳票の紙面領域を表す四隅の座標や、帳票上に記載されたエッジマークなどがある。上記算出した基準と傾きより用紙サイズの算出を行い、帳票サンプルの用紙サイズを決定する(ステップ203)。紙四隅の座標を、左上の点から時計回りでC1、C2,C3,C4とすると、帳票の横サイズは|C2−C1|または|C4−C3|によって、帳票の縦サイズは|C4−C1|または|C3−C2|によって計算できる。帳票の傾きθは、ベクトル(C2−C1)などの傾きから計算できる。ここで、ベクトルVに対して|V|とは、ユークリッド距離を表す記号である。上記サンプル画像より上記過程で決定した用紙サイズ内よりサンプル画像の特徴量を抽出する(ステップ204)。通常は、1つのサンプル画像から特徴量が複数抽出されてベクトルを構成するので、これを特徴ベクトルとも称する。特徴量の具体的な抽出方法については後で述べる。また、特徴量に付属する情報として、帳票内の記載領域の四隅座標も求める。上記抽出したサンプル画像の特徴量について学習を行う(ステップ205)。判別対象となる帳票の特徴量との距離計算の判定に使用するため、上記学習を行ったサンプル画像の特徴量より閾値を算出する(ステップ206)。閾値の算出方法としては、ある帳票種を代表する特徴ベクトルと、当該帳票種に最もユークリッド距離の近い他の帳票種の特徴ベクトルの距離をDminとした時に、当該帳票種の閾値をDmin/2とする方法がある。上記算出したデータ群を辞書としてまとめ、処理を終了する(ステップ207)。辞書には帳票種と、該帳票種に対応する特徴ベクトルと、該帳票種に関わる閾値、及び、特徴ベクトルを計算するための特徴領域情報(下記で述べる小矩形のサイズと座標)と、類似帳票や位置ずれ帳票に対処するための識別付属情報(下記で述べる類似帳票種の関係や、各帳票の記載領域)が最低限登録される。
ステップ204から205にかけての特徴抽出と学習の処理について詳述する。本発明の特徴抽出では、識別に有効な部分の画像に対して単純なフィルタ演算を適用することで特徴量を得る、部分フィルタ方式を用いる。部分フィルタ特徴の一例として、画像上のある小矩形内における平均画素値を用いる、平均濃度特徴がある。他にも、部分領域においてエッジフィルタや、平滑化フィルタを適用して得られる特徴などがある。平均濃度特徴などの部分フィルタ特徴は、画像の全面走査が必要な罫線抽出と比べて簡便に計算できる利点があるため、従来の帳票識別方式に比べて処理速度を速くすることができる。また、識別に有効な部分を選択する手法として、学習によって有効部分を自動的に抽出する、差分マップ方式を用いる。差分マップとは、帳票サンプルから抽出したサンプル画像群において、画像の輝度の差が顕著に表れる箇所を、二次元平面上の濃淡信号で表したものである。また、差分マップ方式により帳票識別に有効な箇所を自動的に選択するため、帳票のタイトルを読み取って帳票識別を行う方式などと比べて、辞書設定が容易に行える利点がある。処理の詳細は以下のようになる。
学習用の帳票画像は全てステップ202から203における処理により補正され、この補正画像を元に差分マップが作られる。差分マップとは、帳票を識別するために特徴的な領域がどこにあるかを示す画像である。以後の説明では、補正後の画像をI(x,y)で表すとする。差分マップの作成では、初めに帳票種毎に帳票種平均画像を作成する。帳票種平均画像I´は、帳票種iのk番目の画像をIik(i=1〜Ki)とした場合、次の数式1から求められる。
次に、この帳票種平均画像I´(x,y)を元に、差分マップ画像Imap(x,y)を数式2により計算する。
数式2の処理は、全ての異なる帳票種の組合せに対し、2つの帳票種平均画像間の差の絶対値を重ね合わせて、平均値を取るという処理に該当する。つまり、差分マップの画素値が大きい箇所とは、登録されている全帳票において各帳票間の差異が大きい、つまり特徴的な箇所である。
画像ベクトルの特徴抽出領域として差分マップが大きな値を持つ箇所を選択すれば、識別がより行い易くなる。そこで、特徴点(x,y)の優先度Prio(x,y)を、差分マップの部分平均値と定義し、数式3に従って計算する。
数式3中のRx、Ryは部分平均化のサイズを表す。
次に、特徴点優先度の高い方から順に、指定されたN個の箇所を特徴領域(特徴点)として選択する。特徴領域を選択する範囲は、差分マップの全面から自動的に選ぶことも、また、人間が指定することも可能である。後述する図6は、学習の結果得られた差分マップの例であり、白抜きの小矩形が特徴領域として選ばれた部分である。この例では、識別の対象とする帳票が特殊なため、真ん中のエリアから特徴領域を選ぶよう人間が選択したものとなっている。
特 徴領域の選択で類似帳票への対応を行うことも可能である。これは、学習した帳票画像の中から類似した帳票を自動的に選び出し、類似した帳票の間で限定的に差分マップを作成し、これを用いて類似帳票の識別に有効な小矩形を追加することで行われる。類似帳票の学習・識別については図4の説明にて述べる。
差分マップ適用の結果として得られた小矩形群について、各小矩形内で特徴量を計算し、これらの特徴量をまとめて、入力された帳票画像に対応する特徴ベクトルを得る。基本的には、各帳票種を代表する帳票画像から得られた特徴ベクトルが、該帳票種の代表ベクトルとして辞書に登録される。同一帳票種に対して複数の帳票画像があり、結果として同一帳票種に対して複数の特徴ベクトルを得た場合は、特徴ベクトルの重心が該帳票種の代表ベクトルとなる。また、位置ずれに対処するために、帳票画像の位置を縦横方向にずらして擬似的に作成した複数の特徴ベクトルを登録することがある。また、高精度な識別を行う場合には、帳票を代表するベクトルについて、相互の誤識別率を最小化するように代表ベクトルを移動するという処理が行われる。代表ベクトルの移動アルゴリズムとしては、学習ベクトル量子化アルゴリズムなどが用いられる。同アルゴリズムは汎用的算法なので、ここでは詳述を省く。
以上の処理により、辞書に帳票識別のための十分な情報、すなわち帳票種と、該帳票種に対応する特徴ベクトルと、該帳票種に対応する閾値と、及び、特徴ベクトルを構成するために必要な小矩形のサイズと座標(特徴領域情報)が登録される。また、類似帳票や位置ずれ帳票に対処するための識別付属情報も登録する。識別付属情報とは、例えば、登録した帳票種がA,B,C,D,E,・・・とあり、自動計算の結果としてAとBとDが類似のグループであると判定された場合は、類似帳票に対応するために、類似帳票の存在とその集合{A,B,D}を辞書に登録する。また、位置ずれに対応するために、各帳票の記載領域の四隅座標を計算し、これも辞書に登録する(識別付属情報)。また、差分マップを辞書に保存しても良い。
図3は、図1の識別/評価部(104)内における帳票の識別過程を示すフロー図であり、判別対象となる帳票は当該過程を経て識別が行われる。先ず、判別対象となる帳票の画像を図1の画像入力部(102)より取得し、これを入力画像とする(ステップ301)。
上記入力画像より特徴量の抽出範囲を設定するために帳票用紙の四隅を検出する(ステップ302)。上記検出した帳票用紙の四隅の座標より用紙サイズの算出を行い、判別対象となる帳票の用紙サイズを決定する(ステップ303)。上記入力画像より上記過程で決定した用紙サイズ内より入力画像の特徴量を抽出し、図1の学習/辞書作成部より提供される帳票のサンプル画像より作成した辞書を用いて特徴量の照合を行う(ステップ304)。
ここでの特徴量とは、判別対象となる帳票から抽出した入力画像において、上記辞書作成で得られた画像の輝度が顕著に表れる箇所のことを指し、入力画像を小矩形に分割して数点を抽出し使用するが、この小矩形のサイズや抽出する小矩形の数は帳票識別装置(101)のユーザが任意に設定できる。
上記入力画像より抽出した特徴量と、上記サンプル画像より作成した辞書とを比較し、 両者の特徴量の距離計算値がある距離基準値内である場合、入力画像とサンプル画像とが一致すると判定し、処理を終了する(ステップ305)。距離の計算方法については、後に数式4から数式8を述べる箇所で説明する。
上記特徴量と、辞書との距離計算値が上記距離基準値を上まわっている場合、上記入力画像より帳票用紙内に記載されている領域を検出する(ステップ306)。上記検出した記載領域の範囲内より入力画像の特徴量を新たに抽出し、図1の学習/辞書作成部より提供される帳票のサンプル画像より作成した辞書を用いて特徴量の照合を行い、入力画像とサンプル画像とが一致するか判定する(ステップ307)。
一次照合の過程を詳しく述べる。本発明では、平均濃度特徴などの部分フィルタ特徴を認識のための特徴量として用い、ベクトル演算によって帳票識別を行うことに特色がある。特徴量は、上記学習過程で得られた差分マップ上の優先度に従い決定された小矩形群から、当該小矩形群内の部分画像に対してフィルタ演算を適用することで計算される。部分フィルタ特徴は、罫線抽出と比べて、画像の部分的な走査を行うだけで簡便に計算できるため、従来の帳票識別方式に比べて処理速度を速くすることができる。また、帳票識別をベクトル演算で行うため、統計的手法を適用した次元圧縮により、距離計算時の計算量の削減が可能となる。これにより、数百から数千種の帳票種を識別対象とした場合においても処理時間を抑えることができる。次元圧縮の手段としては、一般的に、主成分分析法、正準判別分析法、クラスタリング法などがある。
入力された未知の帳票から得られたベクトルをx、帳票種Cの代表的なサンプルから得られたベクトルをmcで表すとする。ベクトルはD次元の要素を持つ。これを数式4のように表す。
未知入力帳票Xの帳票種は、様々な帳票種Cとの間の距離を計算し、距離が最も小さかった帳票種に、当該未知入力帳票Xが属する帳票種であると識別する。一般に未知入力帳票Xと、帳票Cの距離は、数式5のようなベクトル間のユークリッド距離を用いて計算する。
但し、このままでは帳票の記入欄への書き込みが距離計算に悪影響を与えて、帳票種の識別を間違える可能性が残る。書き込みの悪影響を避ける手段としては、帳票の記入領域と該記入領域外の他の領域(帳票のタイトル・説明文・枠線近傍など印刷文字のある領域)における距離計算の方法を、帳票種毎に適応的に変更するという方法がある。これは、登録する帳票から帳票の記入領域と考えられる部分を推定し、記入領域に記された手書きまたは印字を無視する方法である。登録する帳票種毎に記入領域は異なるので、これを適応的距離計算と称する。記入領域の影響を低減する適応的な距離計算方法を、以下の数式6から数式8に示す。数式6では、ベクトルの各要素間の距離を、適応型の距離計算関数dadaptによって測るとしている。関数dadaptの定義は、数式7に示すように、条件判定関数fcondとベクトル要素間のユークリッド距離の積で表される。条件判定関数fcondの一例が、数式8である。例えば、ベクトルの要素が帳票上のある位置にある小矩形内の平均画素値であるとする。平均画素値は0から1の間の連続値を取るとして、0が真っ黒い小矩形、1が真っ白い小矩形を表すとする。罫線や帳票の説明文がある領域は印刷文字があるため黒っぽく、人間が記入する領域は白い紙のエリアなので白っぽい。つまり、帳票Cの記入領域の判定は、当該小矩形に対応するベクトル要素の値が1に近いか、0に近いかで判定できる。小矩形の白さを判定する閾値がtCdである。条件判定関数fcondは、帳票種Cを表すベクトルのd番目の要素mCdが白判定閾値tCd以上になる場合に関数の値が0となり、未満の場合に関数の値が1となる。このことは、d番目のベクトル要素に対応する小矩形内が白っぽい場合に、その場所のユークリッド距離が無視されることを意味する。これが適応型距離の計算方法である。
二次照合部では、一次照合で判別しきれなかった類似した帳票の再識別や、コピーによって生じする帳票の印刷領域の全体的なずれによって生じた識別棄却の課題に対応する。類似帳票の識別は距離計算の変更によって、印刷領域のずれに対しては記載領域の再計算によって対応する。このように帳票識別の処理を2段階で構成する理由は、さまざまな帳票種の識別に対応することと、識別速度の低下を防ぐこととの両立を図るためである。帳票には様々な種類が存在し、各々で識別における問題の難しさが異なる。定型のフォーマットが存在する帳票(定型帳票)の識別の課題は、記入の影響である。この問題は一次照合における特徴量の選び方や、距離計算の工夫により対策できる。オリジナルの紙の帳票をコピーして記入した帳票(コピー帳票)の識別課題は、コピー時に生じる位置ずれやサイズの伸縮である。また、帳票の発行者毎に微妙なフォーマットの違いがある帳票(準定型帳票)の識別課題は、類似帳票の識別である。コピー帳票や準定型帳票の識別に関しては、一次照合で識別できなかったものを、二次照合において識別するというのが本発明の方針である。これにより、定型帳票、コピー帳票、準定型帳票が混在する環境下においても、定型帳票の識別速度を保ったまま処理が可能となる。更に、一次照合部と二次照合部で、計算量が少ない共通の部分フィルタ特徴を用いることで、二次照合における処理速度の低下を防ぐことができる。
二次照合部で行う、類似帳票を識別する手段について図4、および数式9から数式10により詳しく述べる。図4の401と402は共に、辞書に登録された帳票画像のうちの類似帳票の例である。両者は帳票の形状がほぼ同じで、タイトルのみが異なっている。この2つを重ねたものが403である。
類似帳票の取扱いは、学習/辞書作成部と識別/評価部の双方に関わりがある。学習/辞書作成部においては、類似帳票が学習帳票群の中に含まれていると判定された場合、該類似帳票を識別するための小矩形を辞書に登録するよう処理する。すなわち、類似帳票は、辞書に登録する際に用いられる帳票画像間について、302から304の処理によって距離計算を行い、ある帳票について所定閾値よりも近い距離にある帳票を選び出すことで、類似帳票の候補が得られる。閾値は、学習サンプルより特徴軸毎に平均的な距離変動量を求め、例えば特徴軸の内90%以上での値が一致し、10%以内で平均的に変動すると定めれば、類似か否かを決定することができる。このようにして得られた類似帳票間について、限定的に差分マップ法を適用すると、両者の差の大きい箇所がわかる。この場合は404が差異のある箇所と判明する。また、識別/評価部における類似帳票の扱いは、一次照合において、入力帳票と辞書に登録された各帳票種の距離を計算し、距離の小さい順に帳票種の候補を整列した場合に、上位候補に類似帳票がある場合において、その類似帳票を識別するのに有効な小矩形を用いて、部分的に適応型ユークリッド距離を計算することで行う。この計算方法を表したのが数式9から数式10である。数式9中にあるfmaskの定義は数式10にある。関数fmaskは、識別対象とする帳票について、他の類似帳票との差異が最も顕著である領域において値1を取り、それ以外の領域においては値0を取る。一次照合では帳票全体の概形を見て識別を行うため、類似帳票間の距離が近くなりやすい傾向が有る。しかし、部分的な領域内にある小矩形を見ることで、類似した帳票間においても距離の差が出やすいため、識別精度が向上する。
二次照合部で行う、印刷ずれのある帳票を識別する手段について説明する。位置ずれや伸縮に対応する手段としては、辞書のマルチテンプレート化と記載領域の基準抽出を組み合わせる方法がある。マルチテンプレートとは、帳票種を代表するベクトルとして、正しい位置の帳票画像から得られたベクトルだけでなく、コピーでよく使われる伸縮(A4をB4にコピー等)や位置ずれの影響を受けたベクトルを複数登録しておき、これらと照合する手法である。複数登録した全てのベクトルと照合すると計算時間が掛かるため、記載領域基準抽出部(111)を用いて帳票の印刷領域がある部分を検出し、ずれ量および伸縮率の推定を行った上で、当該ずれ量または伸縮率に対応するベクトルとの距離を計算する。すなわち、一次照合部では紙四隅を基準として入力帳票の特徴ベクトルが計算される。二次照合部では、記載領域の四隅を基準として、辞書に登録されたどの特徴ベクトルと照合を行うべきかを計算する。
記載領域の抽出手法としては、黒画素の位置を縦軸、横軸のそれぞれに投影を行い、投影された領域で黒画素の存在する範囲を印刷領域とする投影法がある。印刷部分に傾きがある場合も、想定される範囲の傾きを何段階かに分けて、それぞれの傾き毎に投影を行い、印刷領域の推定を行う。推定された印刷領域の中で、どれを選択するかは、傾きの推定値としてどれが尤もらしいかに応じて決める。尤もらしい傾きの推定は、得られた投影分布の分散や尖度などを用いて決めることができる。つまり、傾きの推定が正しい場合は、個々の行を投影すると分布がコンパクトにまとまるため、分散が小さくなる傾向がある。したがって、幾つかの傾きを仮定して投影分布を取り、そのなかで最も分散が小さくなるものを信頼できる投影分布として、これに基づいて記載領域の範囲を推定することができる。辞書には、マルチテンプレートとして登録された各帳票ベクトルに対して、識別付属情報として帳票記載領域が記録されている。従って、入力帳票から得られた特徴ベクトルと、辞書に登録された特徴ベクトル群との間で距離計算をする場合は、辞書に登録された特徴ベクトルの中から、入力帳票から得られた記載領域に合致するものを選んで距離計算することで、計算量の削減を図ることができる。
図5は、以上述べた帳票識別装置の識別過程を示した概念図である。図上段の左側から順に処理が進む。まず、識別対象とする未知の帳票の画像が入力され、紙の四隅が検出され、特徴抽出範囲と用紙サイズが定まる。また、図下段にある辞書には特徴抽出を行う領域である小矩形群が定義されており、これら各小矩形群から特徴量を計算して当該帳票に対応する特徴ベクトルを構成し、辞書と入力の距離を計算して帳票種の判定を行う。
図6は、本発明の実施の形態における、帳票学習の結果として得られた差分マップと、差分マップから計算された優先度に従って得られた特徴領域の集まりを表したものである。グレーの階調画像が差分マップの画像であり、白抜きの小矩形が特徴領域を表す。
本発明は、上記実施の形態に限定されるものではなく、その趣旨を逸脱しない範囲で種々変更可能である。
本発明の一実施形態に係わる帳票識別を実行する帳票識別装置のシステム構成図の一例を示すブロック図。 図1の帳票識別装置における学習/辞書作成部内での帳票サンプルより辞書を作成する過程を示すフロー図。 図1の帳票識別装置にける識別/評価部内での帳票の識別過程を示すフロー図。 類似帳票間で差異部分を検出することの概念図。 帳票識別装置における識別過程を示す概念図。 差分マップより得られた帳票識別に有効な小矩形群。
符号の説明
101:帳票識別装置
102:画像入力部
103:学習/辞書作成部
104:識別/評価部
105:一次照合
106:閾値判定部
107:二次照合部
108:紙領域基準抽出部
109:サイズ判定部
110:一次照合部
111:記載領域基準抽出部
112:二次照合部。

Claims (5)

  1. 複数種類の登録帳票の特徴量を格納する記録部と、
    入力された入力帳票から特徴量を抽出し、該抽出した特徴量と前記記録部に格納された特徴量との間の距離を計算することで帳票種別を判定する一次照合部と、
    前記一次照合部において抽出した前記入力帳票の特徴量と前記記録部に格納された特徴量との間の距離が所定の閾値よりも近い複数の類似登録帳票間の組み合わせにおいて、特徴量の差異の大きい箇所を該組み合わせにおける差分マップとする差分マップを作成する辞書作成部と、
    前記差分マップを元に前記入力帳票から特徴量を抽出する領域を選択し、該選択された領域から入力帳票の特徴量を抽出し、該抽出した特徴量と前記類似登録帳票の特徴量との間の距離を計算することで帳票種別を判定する二次照合部と、を有し、
    上記二次照合部において、該入力された帳票の印字領域を抽出して該印字領域の位置ずれや伸縮を推定して、辞書に登録された照合対象の絞込みを行ってから上記帳票種別の判定を行うことを特徴とする帳票識別装置。
  2. 上記特徴量として、上記入力された帳票の部分領域内に対して平均フィルタを用いて得られる平均画素値を特徴とする平均濃度特徴を用いることを特徴とする請求項1に記載の帳票認識装置。
  3. 照合対象の帳票毎に、該帳票の記入領域と該記入領域外の他の領域との距離計算の方法を変更して上記帳票種別の判定を行うことを特徴とする請求項1乃至2の何れかに記載の帳票認識装置。
  4. 上記一次照合部は、入力された帳票画像から用紙領域の四隅を検出して用紙領域のサイズを判定し、該用紙領域の隅を基準として上記帳票種別の判定を行い、上記二次照合部においては、上記入力された帳票内の記載領域の四隅を基準として上記帳票種別の判定を行うことを特徴とする請求項1乃至3の何れかに記載の帳票識別装置。
  5. 前記辞書作成部は、帳票種毎に平均画像を作成し、該平均画像に基づいて、登録される複数の帳票間の組み合わせにおいて特徴量の差異の大きい箇所を該組み合わせにおける差分マップとする差分マップを作成することを特徴とする請求項1乃至の何れかに記載の帳票識別装置。
JP2005376971A 2005-12-28 2005-12-28 帳票識別装置 Active JP5110793B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005376971A JP5110793B2 (ja) 2005-12-28 2005-12-28 帳票識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005376971A JP5110793B2 (ja) 2005-12-28 2005-12-28 帳票識別装置

Publications (2)

Publication Number Publication Date
JP2007179307A JP2007179307A (ja) 2007-07-12
JP5110793B2 true JP5110793B2 (ja) 2012-12-26

Family

ID=38304429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005376971A Active JP5110793B2 (ja) 2005-12-28 2005-12-28 帳票識別装置

Country Status (1)

Country Link
JP (1) JP5110793B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11470212B2 (en) 2020-12-25 2022-10-11 Fujifilm Business Innovation Corp. Information processing apparatus and image forming system

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置
JP4894747B2 (ja) * 2007-12-19 2012-03-14 株式会社豊田中央研究所 部分領域検出装置、対象物識別装置、及びプログラム
JP5207870B2 (ja) * 2008-08-05 2013-06-12 日立コンピュータ機器株式会社 次元削減方法、パターン認識用辞書生成装置、及びパターン認識装置
JP4661921B2 (ja) 2008-08-26 2011-03-30 富士ゼロックス株式会社 文書処理装置およびプログラム
JP5146289B2 (ja) * 2008-12-02 2013-02-20 株式会社リコー 情報処理装置、情報処理方法及び情報処理プログラム
JP2011123598A (ja) * 2009-12-09 2011-06-23 Canon Inc 原稿判別装置、原稿判別方法及びプログラム
JP7400543B2 (ja) 2020-02-28 2023-12-19 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0371379A (ja) * 1989-08-11 1991-03-27 Sanyo Electric Co Ltd 文字認識方式
JP3090070B2 (ja) * 1996-11-26 2000-09-18 日本電気株式会社 帳票識別方法及び装置
JPH10222587A (ja) * 1997-02-07 1998-08-21 Glory Ltd 帳票類の自動判別方法及び装置
JPH11282956A (ja) * 1998-03-26 1999-10-15 Ricoh Co Ltd 帳票識別方法、装置および記録媒体
JP3733310B2 (ja) * 2000-10-31 2006-01-11 キヤノン株式会社 文書書式識別装置および識別方法
JP3819236B2 (ja) * 2000-12-13 2006-09-06 株式会社東芝 パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2002183713A (ja) * 2000-12-14 2002-06-28 Matsushita Electric Works Ltd 画像処理方法およびその装置
JP4412525B2 (ja) * 2001-11-30 2010-02-10 富士通株式会社 帳票認識装置および帳票認識方法
JP3762382B2 (ja) * 2003-04-04 2006-04-05 キヤノン株式会社 画像処理方法及び装置
JP2004328183A (ja) * 2003-04-23 2004-11-18 Oki Electric Ind Co Ltd スキャナシステムおよびその対象範囲検出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11470212B2 (en) 2020-12-25 2022-10-11 Fujifilm Business Innovation Corp. Information processing apparatus and image forming system

Also Published As

Publication number Publication date
JP2007179307A (ja) 2007-07-12

Similar Documents

Publication Publication Date Title
JP5110793B2 (ja) 帳票識別装置
CN109740469B (zh) 车道线检测方法、装置、计算机设备和存储介质
JP6354589B2 (ja) 物体識別装置、方法及びプログラム
US9158986B2 (en) Character segmentation device and character segmentation method
JP5500480B2 (ja) 帳票認識装置及び帳票認識方法
JP6143111B2 (ja) 物体識別装置、物体識別方法、及びプログラム
JP6278276B2 (ja) 物体識別装置、物体識別方法、及びプログラム
US11715018B2 (en) Image processing apparatus and non-transitory computer readable medium
US10715683B2 (en) Print quality diagnosis
US7680329B2 (en) Character recognition apparatus and character recognition method
CN112419260A (zh) 一种pcb文字区域缺陷检测方法
JP4919171B2 (ja) 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム
JP2003109007A (ja) 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
JP2011257896A (ja) 文字認識方法及び文字認識装置
JP3092576B2 (ja) 文字認識装置
JPH1125215A (ja) 帳票種識別方法、装置および記録媒体
JP5041775B2 (ja) 文字切出方法及び文字認識装置
JP2003091730A (ja) 画像照合装置、画像照合方法および画像照合プログラム
JP2009223612A (ja) 画像認識装置及びプログラム
US11501515B2 (en) Apparatus, storage medium, and control method for removing a noise from a divided line image obtained by a character image
JP4936250B2 (ja) 書込み抽出方法、書込み抽出装置および書込み抽出プログラム
JP3640488B2 (ja) 画像処理方法
JP4084090B2 (ja) 切手検出装置、及び切手検出方法
JP3932201B2 (ja) 帳票種識別装置および記録媒体
JP3412441B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121009

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5110793

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250