JP3851742B2 - 帳票処理方法及び装置 - Google Patents

帳票処理方法及び装置 Download PDF

Info

Publication number
JP3851742B2
JP3851742B2 JP09376299A JP9376299A JP3851742B2 JP 3851742 B2 JP3851742 B2 JP 3851742B2 JP 09376299 A JP09376299 A JP 09376299A JP 9376299 A JP9376299 A JP 9376299A JP 3851742 B2 JP3851742 B2 JP 3851742B2
Authority
JP
Japan
Prior art keywords
color
black
type
image
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09376299A
Other languages
English (en)
Other versions
JP2000285190A (ja
Inventor
三恵子 松田
浩明 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP09376299A priority Critical patent/JP3851742B2/ja
Publication of JP2000285190A publication Critical patent/JP2000285190A/ja
Application granted granted Critical
Publication of JP3851742B2 publication Critical patent/JP3851742B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、帳票を種別を効率よく識別、分類するための帳票識別方法に関する。
【0002】
【従来の技術】
従来、画像を識別するために、例えば、特開昭61−75477号には、格納すべき対象文書の見本文書(複数個)の画像あるいはその特徴パターンをあらかじめ記憶しておき,格納すべき対象文書の画像から特徴パターンを抽出して、上記見本文書の特徴パターンと比較し同一であると判定した見本文書の分類コードを入力文書に付与することによって、自動的に分類コードの決定を行う方法が提案されている。
【0003】
しかし、例えば特開昭61−75477号では、画像の水平・垂直線分の積分値(水平・垂直方向への長い線分の画素数の加算)を用いていることから、異なる文書が同一の直線部を有している場合には区別ができない他、画像が傾いていたり、位置づれがある場合には、画像レベルでの位置合わせや傾き補正が難しいという問題があった。
【0004】
この問題を解決するために、例えば、特開平08−255236号では、帳票画像から抽出した罫線枠の情報をハッシュテーブルを利用し、帳票間で照合することで識別を行う処理を提案している。これは、登録帳票に対して帳票画像から抽出した罫線枠の連結性を検査し、その連結罫線枠の外接長方形により正規化し、各罫線枠の中心座標をハッシュテーブルに登録する。一方、識別対象の帳票に対しても同様に、帳票画像から罫線枠を抽出し、連結罫線枠より正規化する。最後に、各罫線枠の中心座標で登録しておいたハッシュテーブルを検索し、最もヒットした登録帳票の種別を該当する帳票とするという手法である。
【0005】
【発明が解決しようとする課題】
大量・多品種の帳票を扱うにつれ、罫線枠の物理的な構造にのみに基づいている手法では、同じ構造をもっていても異なる種類の帳票として分類したい場合、例えば、枠情報が一致していてもプレ印字文字のみが違うもの、色情報のみが違うものなどでは、認識性能に限界がでてきた。
【0006】
そこで、本発明は、罫線枠等の物理的な構造のみに限定することなく、色情報、キーワード認識結果など、複数の特徴を用いて性能のよい帳票識別を可能にする帳票識別方法およびそれを用いた帳票識別装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明の帳票識別方法は、入力された識別対象の帳票の画像から複数の特徴量を抽出し、そのうちの1つと登録帳票の特徴量とを比較して該識別対象の帳票の種別が識別できなかったとき、前記複数の特徴量のうちの他の特徴量と前記登録帳票の特徴量とを比較して該識別対象の帳票の種別を識別することにより、罫線枠等の物理的な構造のみに限定することなく、色情報、キーワード認識結果など、複数の特徴を用いて性能のよい帳票識別を可能にする。
【0008】
本発明の帳票識別方法は、入力された帳票の画像から帳票の種別を特定するための色および罫線および文字列のうちの少なくとも1つを特徴量として抽出し、複数の登録帳票をこれらに共通する前記特徴量で予め分類しておき、入力された識別対象の帳票の画像から抽出された前記特徴量のうち、該識別対象の帳票の種別を識別する際に用いる特徴量を選択し、この選択された特徴量で分類された登録帳票の特徴量に基づき該識別対象の帳票の種別を識別することにより、検索範囲を絞りながら、大量・多品種の帳票の識別を可能にし、性能のよい帳票識別結果を得ることができる。
【0009】
好ましくは、入力された識別対象の帳票の画像の種別に応じて、該帳票の画像から抽出する特徴量を選択する。
【0010】
好ましくは、前記識別対象の帳票の画像から抽出された特徴量に一致する帳票が登録されていないとき、該特徴量に最も類似する登録帳票の特徴量を用いて該帳票を登録する。
【0011】
好ましくは、帳票の特徴量として色を抽出する際、各画素の色を周辺画素の色を基に判定する。
【0012】
本発明の帳票識別装置は、入力された識別対象の帳票の画像から複数の特徴量を抽出する抽出手段と、この抽出手段で抽出された複数の特徴量のうちの1つと登録帳票の特徴量とを比較して該識別対象の帳票の種別を識別する第1の識別手段と、この第1の識別手段で前記識別対象の帳票の種別が識別できなかったとき、前記複数の特徴量のうちの他の特徴量と前記登録帳票の特徴量とを比較して該識別対象の帳票の種別を識別する第2の識別手段とを具備したことにより、罫線枠等の物理的な構造のみに限定することなく、色情報、キーワード認識結果など、複数の特徴を用いて性能のよい帳票識別を可能にする。
【0013】
本発明の帳票識別装置は、入力された帳票の画像から帳票の種別を特定するための色および罫線および文字列のうちの少なくとも1つを特徴量として抽出する抽出手段と、複数の登録帳票をこれらに共通する前記特徴量で分類する分類手段と、入力された識別対象の帳票の画像から抽出された前記特徴量のうち、該識別対象の帳票の種別を識別する際に用いる特徴量を選択し、この選択された特徴量で分類された登録帳票の特徴量に基づき該識別対象の帳票の種別を識別する識別手段とを具備したことにより、検索範囲を絞りながら、大量・多品種の帳票の識別を可能にし、性能のよい帳票識別結果を得ることができる。
【0014】
好ましくは、入力された識別対象の帳票の画像の種別に応じて、該帳票の画像から抽出する特徴量を選択する。
【0015】
好ましくは、前記識別対象の帳票の画像から抽出された特徴量に一致する帳票が登録されていないとき、該特徴量に最も類似する登録帳票の特徴量を用いて該帳票を登録する。
【0016】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照して説明する。
【0017】
図1は、本実施形態にかかる帳票画像を識別するための帳票識別装置の構成例を示したもので、画像入力部1とディスプレイ装置6と入力デバイス7と各種記憶手段(入力データメモリ3、保存部8、フォーマット情報記憶部4)をバスに接続して構成されている。
【0018】
図1には、帳票登録部2と帳票識別部4をハードウエア資源として示しているが、画像入力部1とディスプレイ装置6と入力デバイス7と各種記憶手段(入力データメモリ3、保存部8、フォーマット情報記憶部4)とCPUとを有したコンピュータに実行させることのできるプログラムとしてフロッピーディスク、CD−ROM等の記憶媒体に記録して頒布することもできる。
【0019】
図1に示す帳票識別装置は、帳票登録モードと帳票識別モードの2種類のモードを有し、帳票登録モードにおいては、以下のように動作する。すなわち、画像入力部1は登録する帳票(登録帳票)をスキャンして、得られた画像を帳票登録部2に与える。入力データメモリ3は入力された画像を記憶しておくものである。帳票登録部2は入力された画像にカラー分離、線分抽出、文字枠抽出、文字認識、枠抽出などの認識処理を施し、認識結果をディスプレイ装置6に表示してユーザに提示し、ユーザとの対話的な処理によって、登録帳票の各種構成要素を抽出して、フォーマット情報を生成してフォーマット情報記憶部4に登録する。
【0020】
一方、帳票識別モード時に以下のように動作する。すなわち、画像入力部1はファイリングすべき各々の帳票をスキャンして、得られた画像を帳票識別部5に与える。帳票識別部5はフォーマット情報記憶部4に登録された複数のフォーマット情報をもとにして、ファイリングすべき帳票が、登録された帳票のうちのどれと一致しているかを基に識別する。そしてその結果をディスプレイ装置6に表示することによって、得られた識別結果をユーザに提示し、ユーザとの対話的な処理によって確認を行ったのち、例えばマウス、キーボード、電子ペン等の入力装置から構成される指示デバイス7を用いてユーザにより処理が指示される。最後に、帳票登録部2で登録された登録帳票のフォーマット情報と帳票識別部5で得られた帳票のフォーマット情報とに基づき、入力画像を保存部8にファイリングする。ただし、この対話処理を省略し、自動保存を行い、複数枚を保存した後に確認作業を行うことも可能である。
【0021】
次に、上記した各動作モードで行われる処理を、より詳細に説明する。まず、帳票登録モードについて説明する。
【0022】
図2は、帳票登録モードにおける処理動作を説明するためのフローチャートである。まず、スキャナによって入力された登録帳票の画像がディスプレイ装置6上に表示される(ステップS1)。そして、この入力画像に対し、帳票登録部2では、カラー分離処理を行って、背景画像、罫線およびプレ印字部抽出を行う(ステップS2)。次に罫線・プレ印字部として得られたデータに対しては、色解析処理(ステップS3)、2値化処理(ステップS4)が実行される。さらに、要素抽出処理(ステップS5)が施され、罫線、文字枠、文字コードなどの帳票の種別を識別する際に用いる特徴的な要素(特徴量)の抽出を行う。最後に、追加・修正処理(ステップS6)によって、ユーザからの指示に従って、データを編集し、最終的にフォーマット情報を作成して、フォーマット情報記録部4に登録する(ステップS7)。
【0023】
次に、ステップS2のカラー分離処理における背景画像検出およびその除去処理について説明する。
【0024】
入力画像に対して、画素ごとにRGBの値をHSV(色相、彩度、明度)に変換する。この値から、ヒストグラムをとって、もっとも値の多い値を背景色値とする。背景色が決定されたら、背景部分を全体画像から除去する。もちろん、背景色の検出は他の方法を用いてもよい。
【0025】
入力画像は、背景部分、罫線部分、文字部分が存在すると考えることができるので、背景画像が除去された時点で残された画像は、罫線・プレ印字文字部と考えられる。したがって、これらの画像について2値化した後(ステップS4)、また、色解析を行い、色特徴の抽出を行った後(ステップS3)、画像から図形特徴や文字コード等の各種要素を抽出する(ステップS4)。
【0026】
ステップS4の2値化処理では、たとえば、ステップS2のカラー分離処理によって背景部分が削除されているので、残った画像は、罫線、プレ印字文字、手書き文字などの要素になると考えてよいので、背景以外のデータが黒になるように2値化できればよい。
【0027】
ステップS3の色解析はたとえば以下の方法で行う。すでに、入力画像の中から、背景部分が削除されているので、色部分についてのみ処理を行う。色部分についてのみ、RGB空間もしくはH(色相)−S(彩度)空間に投票し、クラスタリングにより帳票に存在する色を判定する。たとえば、図3に示したように、あらかじめ、帳票に使われるような罫線の色成分に相当する投票箱をH−Sの色空間に配置しておいて、抽出された画素に対して色成分を計算して、投票箱に投票していく方法をとる。たとえば、赤に相当する投票箱(領域)R1、青に相当する投票箱(領域)R5を設けて、各画素の色成分で投票を行い、最終的に投票数や投票画素全体に対して占める割合を算出して、当選か落選かを決定する。この方法によって対象帳票の代表色を記録する。色種だけではなく、帳票内で用いられている色の割合も保存しておいてもよい。色の特徴を解析する方法は、従来より提唱されているほかの手法をもちいてもかまわない。
【0028】
ステップS5の要素抽出では、罫線枠(罫線、文字枠)、文字コードなどを抽出する。罫線の抽出はたとえば以下の方法で行う。すなわち、ここでは、罫線は4点から構成される枠情報であると考え、抽出を行う。まず、入力データをラスタスキャンしてその追跡開始点を検出した後、その追跡開始点から時計周りあるいは反時計周りに図形境界がつくる閉曲線を追跡することによって輪郭線抽出が行なわれる。このような閉曲線追跡により抽出された輪郭の情報は座標点列、あるいは方向コードの列であるチェインコードとして保存される。この輪郭抽出処理については、従来より種々提唱されている他の輪郭抽出の手法を用いても良いことは言うまでもない。
【0029】
次に、輪郭線データをもとに、画像の交差部や角点という特徴点を抽出する。これは、例えば輪郭点列から凸点列を検出し、それに対応付く凹点列を抽出する。この特徴点抽出は例えば曲率算出処理によって求められた曲率kを所定の閾値K0、K1と比較し、k≦K0 なる点列を凹点列、k≧K1 となる点を凸点列とすることにより実現される。
【0030】
尚、この特徴点抽出処理を、図形の細線化処理や芯線化処理によって実現してもよい。例えば、細線化データでは線分の端点には凸部が存在し、細線の交差点には凹点が存在することから、特徴抽出が可能となる。
【0031】
次に、これらの点列の組合せから枠を抽出する。枠の抽出は、例えば注目点近郊にある4点の座標の組合せから、図形が長方形または平行四辺形をなすかどうかを判断することにより容易に枠領域が抽出可能である。このとき、枠抽出は他の手法を用いてもよいことはいうまでもない。
【0032】
文字枠抽出はたとえば以下の方法で行なう。画像を連結領域ごとにラベル付けし、外接図形を求める。次に隣接する外接図形がある閾値内の距離にある場合には併合してみる。併合を行なった場合に再度外接図形を計算し、下線の方向(傾き)の変動がある閾値以内の場合には同一文字列であるとする。なお、文字枠抽出方法は従来より種々提唱されている手法など他の方法を用いてもよい。
【0033】
文字抽出はたとえば以下の方法で行なう。画像を連結領域ごとにラベル付けし、外接図形を求める。外接図形の大きさがある閾値内である場合には文字候補として文字認識を行なう。なお、文字抽出方法は従来より種々提唱されている手法など他の方法を用いてもよい。
【0034】
以上のように抽出された要素に対しては、ステップS6において、追加・修正が行われる。
【0035】
ディスプレイ装置6に表示された入力画像から抽出された各種要素は、例えば、ステップS1で入力された登録帳票の画像の上に重畳表示されて、ユーザによりデータ修正が行なわれるようになっている。修正方法は、従来利用している図形作成ツールなどと同様に行うことが可能である。
【0036】
最後にユーザによる修正により最終的に作成されたフォーマット情報がフォーマット情報記憶部4に登録される(ステップS7)。その際、フォーマット情報にはキーワードまたはファイル名を付与し、保存する。
【0037】
ここで、図4を参照して、カラー帳票の特徴を説明する。帳票には、その構成要素として、罫線枠、罫線色、予め印字されている文字列(プレ印字文字列)領域R1、R2があげられる。
【0038】
図5は登録された登録帳票のフォーマット情報(ここでは、そのイメージを示している)の4つの例であり、各登録帳票からは、色情報の違いも含めて特徴量となる構成要素(罫線枠、文字列(プレ印字文字))が抽出されている。
【0039】
これらの帳票は、色情報のみ共通のもの、プレ印字の一部が共通のもの、罫線枠の一部が共通のもの等が存在する。
【0040】
例えば、後述する帳票識別モードにおいては、登録帳票と識別対象の帳票とで最初に照合すべきもの(第1の特徴量)を色情報とする。すなわち、図6に示すように、第1の特徴量として罫線色とすると、登録帳票AとB、CとDは、同じフォーマット群として分類される。また、帳票の先頭にあるプレ印字#1を第2の特徴量として、これを基に分類すると、帳票見本CとDとが同じフォーマット郡として分類される。さらに、帳票の右下にあるプレ印字#2を第3の特徴量として、これを基に分類すると帳票見本A〜Cが同じフォーマットとして分類される。
【0041】
図6に示した分類方法に限らず、複数の登録帳票のフォーマット情報には、罫線枠の構造のみが一致していて、プレ印字のある場所やその文字列(文字コード)、罫線色のみが違うものなど、多種存在することから、できるだけ登録帳票を分離しやすい観点から分類することが望ましい。
【0042】
次に、帳票識別モードについて詳細に説明する。
【0043】
図7は帳票識別モードにおける処理動作を説明するためのフローチャートである。まず、スキャナによって入力された識別対象の帳票の画像がディスプレイ装置6上に表示される(ステップS11)。そして、この入力画像に対し、帳票識別部5は画像分離処理を施し(ステップS12)、背景画像、黒領域(文字列部分)、罫線およびプレ印字部を抽出する。
【0044】
罫線・プレ印字部として得られたデータに対しては、色解析処理(ステップS13)、2値化処理(ステップS14)が施される。さらに、要素抽出処理(ステップS15)が施され、罫線、文字枠、文字コードなどの要素抽出を行う。
【0045】
ここでの背景画像検出処理、色解析処理、罫線、文字枠、文字コードなどの要素抽出処理、2値化処理については、帳票登録時と同様であるので説明を省く。なお、ここでは、必ずしも文字認識処理を行う必要はない。文字認識処理は、必要に応じて、後述するステップS19にて行うようにしてもよい。
【0046】
ステップS12における黒領域抽出処理は、たとえば以下の方法で行う。黒領域は、画素ごとにRGBの値をHSV(色相、彩度、明度)に変換した場合、明度Vや彩度Sが小さくなる。したがって、しきい値処理によって黒画素部分を抽出することが可能になる。もちろん、黒画素領域の抽出は他の方法を用いてもよい。もちろん、帳票の罫線やプレ印字文字に黒が用いられている場合は、黒領域も罫線・プレ印字部と同様に取り扱ってもよい。
【0047】
次に、ステップS15の要素抽出処理で得られたデータから、登録帳票と識別対象の帳票とで最初に照合すべきもの(第1の特徴量)を選択する(ステップS16)。そして、帳票識別を行う(ステップS17)。
【0048】
ここで、帳票識別処理の一例として、ハッシュテーブルを用いて帳票識別を行う場合について説明する。なお、この手法について特開平08−255236号に開示されており、登録帳票から抽出された特徴量からハッシュテーブルを作成する前処理と、入力画像から特徴を抽出し、投票を行い認識する認識処理とに分けることができる。
【0049】
また、ここでハッシュテーブルを作成する際には、複数の登録帳票を分類した結果を1つの登録帳票として扱っていてもよい。この場合も以下の説明がそのまま当てはまる。
【0050】
まず、図8を参照してハッシュテーブルの作成処理について説明する。図2を参照して説明したように、帳票を登録する際には、その帳票の画像の入力(ステップS31)、帳票の各構成要素の抽出(ステップS32)を行う。そこで、ハッシュテーブルを作成するために、既にフォーマット情報記憶部4に記憶されているフォーマット情報を基に、罫線枠の中心座標、文字列枠の中心座標、連結枠情報などの特徴量を抽出し、これらの値を規格化する。例えば、最大値を「1」とした場合の相対的な値を算出する(ステップS33)。
【0051】
この規格化された値を用いて、例えば、罫線枠の中心座標、文字列枠の中心座標といった各特徴量毎にハッシュテーブルテーブルを作成する。
【0052】
図9に、特徴量として、罫線枠の中心座標を用いた場合のハッシュテーブルの一例を示す。全ての登録帳票(A〜F)の罫線枠の中心座標をハッシュテーブル上に埋め込んだ場合を示している。傾きに関しては直線データをもとに傾き補正してあることを前提としているので、罫線枠は水平・垂直線分のみから構成されていると考えてよい。ここでは、ハッシュテーブルを作成するときの基底(規格化する特徴量のパラメータ)のとり方は、水平・垂直線分上に位置する点で表現する。特に、帳票の場合には連結する長方形枠が多く存在することから、基底には、連結長方形枠の外接図形の幅と高さ情報を用いる。規定には、帳票そのものののサイズを用いてもよいし、基準になるものが統一されていればよい。
【0053】
次に、図10に示すフローチャートを参照して、ハッシュテーブルを用いた帳票識別処理動作について説明する。図7を参照して説明したように、帳票の識別を行う際には、識別対象の帳票の画像の入力(ステップS41)、罫線、文字枠などの特徴量の抽出を行う(ステップS42)。
【0054】
抽出された特徴量からさらに、罫線枠の中心座標、文字列枠の中心座標、連結枠情報などの特徴量を抽出し、これらの値を規格化する(ステップS43)。
【0055】
そして、この規格化されてた特徴量を用いてハッシュテーブル上の当該特徴量に該当する特徴点のエリアを検索する(ステップS44)。このエリアは予め定められた範囲の検索エリアで、そのエリア内に登録帳票の特徴点があれば、その登録帳票に投票する(ステップS45)。具体的には、登録された登録帳票名(フォーマット番号)ごとにヒストグラムを作成しておいて、検索したエリア内の登録帳票名(フォーマット番号)ごとに投票を行う。これらの処理を識別対象の帳票の有する特徴点の数だけ繰り返し(ステップS46)、ヒストグラムの最も大きい登録帳票との類似度を計算し、識別結果として出力する(ステップS47、ステップS48)。
【0056】
例えば、図11に示すような罫線枠の中心座標にるハッシュテーブルにおいて、登録帳票が6枚あるとして、識別対象の帳票として、フォーマット番号「A」の帳票(サンプル帳票)を識別する場合について説明する。当該サンプル帳票には特徴点が9点あり、図11のハッシュテーブル上のハッチング部分は各特徴点に対応する予め定めれた範囲の検索エリアである。この場合、図12に示すように、サンプル帳票の特徴点に対応する各検索エリアに存在する登録帳票の特徴点を基に各登録帳票に投票した結果、フォーマット番号「A」の登録帳票の投票数は「8」と最も大きく、次に、フォーマット番号「D」の登録帳票の投票数「2」、フォーマット番号「E」の登録帳票の投票数「1」、フォーマット番号「F」の登録帳票の投票数「1」と続いている。
【0057】
そこで、上記4つの登録帳票との類似度を求めることにする。類似度は、例えば次式(1)で定義されるものであるとする。すなわち、各登録帳票tの投票数をNt、識別対象の帳票の長方形枠数をk、登録帳票tの長方形枠数をRtとすると、類似度Sは、
S = (Nt×2×100)/(k+Rt) …(1)
と表すことができる。
【0058】
式(1)を用いて類似度を算出した結果を図12に示す。
【0059】
よって、サンプル帳票にもっとも類似しているのは、類似度が最も高いフォーマット番号「A」の登録帳票であることが分かる。
【0060】
以上、ハッシュテーブルを用いた帳票の識別方法について説明したが、この場合に限らず、他の識別方法を用いてもよい。
【0061】
次に、識別対象の帳票(サンプル帳票)について第2の特徴量を用いた詳細調査を行うことを考える。この時点で、フォーマット番号「A」の登録帳票が1つの登録帳票のみであれば、それを識別結果として出力すればよく(ステップS26)、第2の特徴量を用いた詳細調査は省略できる。
【0062】
例えば、図13に示すように、フォーマット番号「A」という登録帳票には、(a)図、(b)図に示すような2種類の登録帳票が含まれているとする。これらの2つの登録帳票は、罫線枠、罫線枠の色がともに同一であり、異なる部分は、プレ印字されている文字列である。したがって、この2つの登録帳票のフォーマット情報には、識別に必要な文字枠(文字領域)と文字列とが含まれている。
【0063】
例えば、図14に示すように、図13(a)、(b)に示した各登録帳票のフォーマット情報は、文字識別すべき2カ所のプレ印字領域R1、R2が登録されている。詳細調査が必要な場合は、識別対象の帳票(サンプル帳票)に対し、この2カ所に記載されている文字列を順次抽出し、文字認識を行う(ステップS18〜ステップS19)。1カ所の文字認識で1つの登録帳票に確定できなかったときは、確定できるまで文字認識を繰り返す(ステップS18〜ステップS19)。
【0064】
文字列抽出、文字認識については、既存の方法を用いればよい。ここで認識された文字列が図13(a)、(b)のどちらか一方の帳票に一致するか、または、一致度が高いかによって、詳細識別結果とする。
【0065】
文字認識を繰り返し、識別対象の帳票に詳細調査が必要なくなれば、識別対象の帳票がある1つの登録帳票に一致したことになり(ステップS18)、その識別結果を出力または保存する(ステップS26)。
【0066】
図13の例では、プレ印字領域R1のみ文字認識すれば、どちらの帳票であるか確定できるが、ここで確定できない場合は、さらに、プレ印字領域R2を文字認識する、他の特徴量を用いて、さらに詳細調査を繰り返す。ここでは、帳票が確定できるまで特徴量をかえて識別を行うか、またはもっとも類似しているものを提示してもよい。該当帳票がない場合には新しく登録追加することも可能である。
【0067】
(第2の実施形態)
次に、帳票登録における登録帳票の分類について、より詳細に説明する。
【0068】
図15は、登録された登録帳票(A〜E)のフォーマット情報をイメージ的に示してものである。図15において、登録帳票AとBとC、DとEは、それぞれ罫線構造としては共通のものを持ち登録帳票AとBとE、CとDは、用いられる色としては共通である。このように、各特徴(色、罫線、プレ印字#1、プレ印字#2)による分類を行うと、図16のように、それぞれの特徴について2つのグループに分類できる。
【0069】
ここで、帳票識別モードにおいて、図7のステップS16で選定される第1の特徴量が色情報であるとすると、この段階で絞り込まれた登録帳票に対し、さらに第2の特徴量として罫線を用いて、前述したように、ハッシュテーブルを用いて帳票の識別を行う。この様に、帳票登録時に識別に用いられる特徴量を想定し、登録帳票を分類しておくことによって、識別作業の効率化および識別誤りの削減ができる。
【0070】
(第3の実施形態)
次に、識別対象の帳票の画像のタイプによって識別に用いる特徴量を選択する場合について、図17に示すフローチャートを参照して説明する。
【0071】
まず、スキャナによって入力された識別対象の帳票の画像がディスプレイ装置6上に表示される(ステップS51)。そして、この入力画像がどの画像タイプ(2値画像、濃淡画像、カラー画像)に属するかを判断する(ステップS52)。画像タイプの判断には、ユーザがいずれの画像タイプであるかを指示することにより判断するようにしてもよい。
【0072】
画像タイプにより帳票の識別に用いる特徴量が異なる。すなわち、例えば、2値画像の場合は、罫線枠、プレ印字文字(ステップS54)、濃淡画像の場合は、濃淡の濃度分布、罫線枠、プレ印字文字(ステップS55)、カラー画像の場合は、罫線色、罫線枠、プレ印字文字(ステップS56)が特徴量としてあげられる。最後に各特徴量のうちで、第1の特徴量を選定する(ステップS57)。
【0073】
例えば、2値画像の場合には、第1の特徴量として罫線枠を選定する。同様に、濃淡画像の場合には濃度分布、カラー画像の場合には罫線色を第1の特徴量として選定する。その後は、各画像タイプに対応した特徴量の抽出処理のみを行って、前述したようなハッシュテーブルを用いた帳票識別、プレ印字文字の照合等を行えばよい。
【0074】
この場合、画像タイプに応じて予め抽出すべき特徴量が限定されるので、帳票識別結果を得るまでの時間が短縮できる。
【0075】
なお、識別に用いる特徴量は、上記特徴量に限らず、他の特徴量を用いてもよい。同様に、画像タイプによって、識別に用いる特徴量は、第1の特徴量に限らず、第2、第3の特徴量を併用してもよい。
【0076】
(第4の実施形態)
次に、帳票識別の結果、該当する帳票が得られなかった場合、すなわち、未登録の帳票の識別を行ってしまった場合の処理動作について、図18に示すフローチャートを参照して説明する。
【0077】
図7に示す処理を行った結果(ステップS61、ステップS62)、識別対象の帳票と同一の登録帳票が存在したときは、それを帳票識別結果として出力する(ステップS63、ステップS64)。以上の詳細な処理は、図7に示したフローチャートと同様である。一方、識別対象の帳票と同一の登録帳票が存在しなかったとき(ステップS63)、類似帳票があるかどうかを判断する(ステップS65)。類似帳票であるかどうかは、検索時に用いた類似度など帳票の類似性を評価できるものを用いて、評価する。そして、類似度が所定の閾値以上のものを提示してもよいし、もっとも類似度が高いものを提示してもよい。ここで類似する帳票が存在しない場合は、現在識別しようとしている入力された帳票を図2に示したように新規登録する(ステップS66)。
【0078】
もし、類似帳票があれば、その類似帳票のフォーマット情報を流用して、現在識別しようとしている帳票の追加登録を行う(ステップS67)。
【0079】
例えば、図19(a)に示すようなフォーマット情報の登録帳票が既に登録されていて、現在識別しようとしている入力された帳票が図19(b)であるとする。そして、この入力帳票に最も類似するものが図19(a)に示した登録帳票であるとする。
【0080】
図19(a)に示す帳票と図19(b)に示す帳票とは、プレ印字文字のみしか違わないので、改めて登録するには、登録の手間がかかる他、フォーマット情報記憶部4における登録帳票のフォーマット情報の容量も必要になるので、ここでは、図19(a)に示す登録帳票の変形として、図19(b)に示す帳票中の異なる部分、すなわち、プレ印字文字のみを追加登録して、新たな登録帳票の登録を行うものである。
【0081】
このような他の登録帳票のフォーマット情報を流用した登録帳票の登録方法としては、例えば、図20に示したように、罫線タイプと色、プレ印字文字を別々に部品登録し、各登録帳票は、そのフォーマット番号に対応させて、例えば、図21に示すように、図20に示した部品の組み合わせで表現する。
【0082】
このように、登録帳票の要素を部品化して、それらを組み合わせて1つの登録帳票のフォーマット情報を作成することにより、部分的に一致する複数の登録帳票を登録する場合、登録の手間を最小限にし、また、登録データ容量も減らすことが可能になる。
【0083】
また、この場合、帳票識別を行う際も前述同様に行える。
【0084】
(第5の実施形態)
帳票登録モード、帳票識別モードに共通して言えることだが、例えば、図2のステップS3における色解析処理、図7のステップS13における色解析処理において、入力された帳票画像の各画素に対して、その画素の持つ色の情報が抽出すべき色であるかどうかを判断する過程における処理について説明する。すなわち、抽出すべき色とそれ以外の取り除くべき色または背景色が存在する状態から、抽出すべき色を抽出するか、または、不要なものを取り除く操作を行う時に、抽出すべきものと、それ以外の両者の中間的な状態である中間色であると判断された画素の周囲の画素の色の判定状態を調べ、これによって、その画素が抽出すべき色を持つかどうかを判断する。
【0085】
図22に示すフローチャートを参照して、以上述べたような色判断処理動作について説明する。
【0086】
まず、黒領域に抽出処理について説明する。図23(a)は、原画像である。ここで、領域x1は黒線、領域x2、x3は色付きの線である。図23(a)に示した原図ををスキャンした直後の画像データを図23(b)に示す。図23(b)において、領域x5は、黒と判断される部分、領域x4、x6は、色付きと判断される部分である。スキャナでは、このように、黒の領域における色付きの領域との境界上が色付きとなることがある。 そこで、まず、図23(b)に示したようなデータから黒の領域x5のみを抽出する(ステップS71)。次に、図23(c)に示すように、この黒の領域x5の周辺領域はx4、x6であるが、この領域x4、x6の色を調べる(ステップS72)。領域x4、x6の色が白でない、すなわち、中間色であるときは、この領域を黒と判定する(ステップS73、ステップS74)。そして、このとき黒と判定された領域x4、x6と、もともと黒と判定されている領域x5とを合わせて図23(d)に示すように、黒領域と定める。
【0087】
一方、色付き領域の抽出処理の場合は、この逆を行う。まず、色付きと判断される領域x4、x6を抽出し、これと接しているとともに、黒領域と判断される領域x5に接していない領域、すなわち領域x2、x3に相当する部分を抽出し、これを色付き領域と判定する。
【0088】
しかしながら、図24に示すように、黒領域x13の左側境界部分x12が色付きになっていない場合には、上記の方法では、領域x12が色付きとは見なされずに抽出からもれてしまう。そこで、次のような処理を行う。
【0089】
まず、色付きと判断され、かつ、黒領域と判断される領域x13に接していない領域、すなわち、領域x11を抽出し、それとは別の黒領域x13と接している色付きの領域x12、x14を抽出する。領域x12、x14のうち、色付きと判断された領域、すなわち、領域x11に接している部分を色付きと判断する。こうすることによって、領域x11、x12を色付きとして抽出される。
【0090】
以上の説明は、白、黒、色付きという分類で説明しているが、色については何を対象にしてもよい。一般に抽出すべき色(複数の色でもよく、以下同様に「色」といった場合に必ずしも単色を意味するものではない。また、色には、白や黒、灰色なども含めて考える)に対して、それ以外の色または背景色が存在する状態から、抽出すべき色を抽出するか、または不要なものを取り除く操作を行うときに、両者の中間色の考え方を導入し、この中間色であると判断された画素の周囲の画素の状態、すなわち、抽出すべき色かそうでないか、また、中間色であるなどの状態によって、最終的にその画素を抽出すべきか否かを判断する。
【0091】
なお、中間色は、例えば、抽出すべき色と背景になる色の平均として定義される色と定義してもよい。
【0092】
(効果)
以上説明したように、上記実施形態によれば、色情報または罫線情報またはプレ印字文字の認識結果など、複数の特徴を有する登録帳票を共通の特徴で予め分類しておくことにより、検索範囲を絞りながら、大量・多品種の帳票の識別を可能にし、性能のよい帳票識別結果を得ることができる。
【0093】
また、共通要素をもつ帳票を、その共通要素の組み合わせとして管理することによって、効率よい帳票登録が可能になる。
【0094】
【発明の効果】
以上説明したように、本発明によれば、複数の特徴を有する大量・多品種の帳票の識別を可能にし、性能のよい帳票識別結果を得ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態にかかる帳票識別装置の構成例を示した図。
【図2】投票登録処理動作について説明するためのフローチャート。
【図3】色判定のための投票空間の一例を示した図。
【図4】帳票の特徴を説明するための図。
【図5】登録帳票のフォーマット情報の具体例を示した図。
【図6】登録帳票の分類例を示した図。
【図7】投票識別処理動作について説明するためのフローチャート。
【図8】ハッシュテーブル作成処理動作を説明するためのフローチャート。
【図9】罫線枠の中心座標によるハッシュテーブルの一具体例を示した図。
【図10】ハッシュテーブルを用いた帳票識別処理動作を説明するためのフローチャート。
【図11】ハッシュテーブル上の検索エリアを具体的に示した図。
【図12】ハッシュテーブルを用いた登録帳票の検索結果の一例を示した図。
【図13】特徴の一部分が異なる類似する帳票の一例を示した図。
【図14】帳票中の文字認識すべき領域を示した図。
【図15】登録帳票のフォーマット情報をイメージ的に示した図。
【図16】登録帳票を色、罫線、プレ印字文字で分類した結果の一例を示した図。
【図17】識別対象の帳票の画像のタイプによって識別に用いる特徴量を選択する場合の処理動作を説明するためのフローチャート。
【図18】未登録帳票の登録処理動作の一例を示したフローチャート。
【図19】未登録帳票と、それに類似する登録帳票の一例を示した図。
【図20】帳票の特徴的な要素を部品化した場合の、部品の登録例を示した図。
【図21】図20に示した部品を用いて帳票の特徴量を表現した場合の帳票の登録例を示した図。
【図22】色判断処理動作を説明するためのフローチャート。
【図23】色判断処理を説明するための図。
【図24】色判断処理を説明するための図。
【符号の説明】
1…画像入力部
2…帳票登録部
3…入力データメモリ
4…フォーマット情報記憶部
5…帳票識別部
6…ディスプレイ装置
7…指示デバイス
8…保存部

Claims (9)

  1. 入力された帳票を登録する帳票登録手段と、
    入力された帳票の種別を識別する帳票識別手段と、
    を備えた帳票処理装置における帳票処理方法であって、
    前記帳票登録手段が、入力された帳票の画像から、帳票の種別を特定するための罫線タイプ、文字列及び色を含む複数の特徴量を抽出する第1の抽出ステップと、
    前記帳票登録手段が、入力された帳票の種別毎に、前記特徴量として抽出された、罫線タイプ、文字列及び色を含む複数の要素を組合せて当該種別の帳票のフォーマットを表したフォーマット情報を記憶手段に記憶するステップと、
    前記帳票識別手段が、入力された識別対象の帳票の画像のタイプに基づき、罫線、文字列及び色を含む複数の特徴量のなかから、当該識別対象の帳票の画像から抽出する1または複数の特徴量を選択する選択ステップと、
    前記帳票識別手段が、前記識別対象の帳票の画像から、前記選択ステップで選択された特徴量を抽出する第2の抽出ステップと、
    前記帳票識別手段が、前記第2の抽出ステップで抽出された前記識別対象の帳票の特徴量と前記記憶手段に記憶されたフォーマット情報との間の類似度に基づき、前記記憶手段に登録されている種別のなかから、前記識別対象の帳票に対応する種別を決定するステップと、
    前記識別対象の帳票に対応する種別が前記記憶手段に登録されていないとき、前記帳票登録手段が、当該識別対象の帳票の特徴量に最も類似するフォーマット情報を修正することにより当該識別対象の帳票のフォーマット情報を生成し、前記記憶手段に記憶するステップと、
    を含むことを特徴とする帳票処理方法。
  2. 前記第 1 及び第2の抽出ステップで帳票の特徴量として罫線及び文字列の色を抽出する際、黒領域及び当該黒領域に接している中間色の領域は「黒」と判定し、黒以外の色付き領域のうち前記中間色の領域に接しているが黒領域に接していない領域は「色付き」と判定することを特徴とする請求項1記載の帳票処理方法。
  3. 前記第 1 及び第2の抽出ステップで帳票の特徴量として罫線及び文字列の色を抽出する際、黒領域に接している黒以外の色付き領域のうち、当該黒領域に接していない色付き領域に接している領域は「色付き」と判定することを特徴とする請求項1記載の帳票処理方法。
  4. 入力された帳票の画像から、帳票の種別を特定するための罫線タイプ、文字列及び色を含む複数の特徴量を抽出する第1の抽出手段と、
    入力された帳票の種別毎に、前記特徴量として抽出された、罫線タイプ、文字列及び色を含む複数の要素を組合せて当該種別の帳票のフォーマットを表したフォーマット情報を記憶する記憶手段と、
    入力された識別対象の帳票の画像のタイプに基づき、罫線、文字列及び色を含む複数の特徴量のなかから、当該識別対象の帳票の画像から抽出する1または複数の特徴量を選択する選択手段と、
    前記識別対象の帳票の画像から、前記選択手段で選択された特徴量を抽出する第2の抽出手段と、
    前記第2の抽出手段で抽出された前記識別対象の帳票の特徴量と前記記憶手段に記憶されたフォーマット情報との間の類似度に基づき、前記記憶手段に登録されている種別のなかから、前記識別対象の帳票に対応する種別を決定する手段と、
    前記識別対象の帳票に対応する種別が前記記憶手段に登録されていないとき、当該識別対象の帳票の特徴量に最も類似するフォーマット情報を修正することにより当該識別対象 の帳票のフォーマット情報を生成し、前記記憶手段に記憶する手段と、
    を含むことを特徴とする帳票処理装置。
  5. 前記第 1 及び第2の抽出手段で帳票の特徴量として罫線及び文字列の色を抽出する際、黒領域及び当該黒領域に接している中間色の領域は「黒」と判定し、黒以外の色付き領域のうち前記中間色の領域に接しているが黒領域に接していない領域は「色付き」と判定することを特徴とする請求項4記載の帳票処理装置。
  6. 前記第 1 及び第2の抽出手段で帳票の特徴量として罫線及び文字列の色を抽出する際、黒領域に接している黒以外の色付き領域のうち、当該黒領域に接していない色付き領域に接している領域は「色付き」と判定することを特徴とする請求項4記載の帳票処理装置。
  7. コンピュータを、
    入力された帳票の画像から、帳票の種別を特定するための罫線タイプ、文字列及び色を含む複数の特徴量を抽出する第1の抽出手段、
    入力された帳票の種別毎に、前記特徴量として抽出された、罫線タイプ、文字列及び色を含む複数の要素を組合せて当該種別の帳票のフォーマットを表したフォーマット情報を記憶する記憶手段、
    入力された識別対象の帳票の画像のタイプに基づき、罫線、文字列及び色を含む複数の特徴量のなかから、当該識別対象の帳票の画像から抽出する1または複数の特徴量を選択する選択手段、
    前記識別対象の帳票の画像から、前記選択手段で選択された特徴量を抽出する第2の抽出手段、
    前記第2の抽出手段で抽出された前記識別対象の帳票の特徴量と前記記憶手段に記憶されたフォーマット情報との間の類似度に基づき、前記記憶手段に登録されている種別のなかから、前記識別対象の帳票に対応する種別を決定する手段、
    前記識別対象の帳票に対応する種別が前記記憶手段に登録されていないとき、当該識別対象の帳票の特徴量に最も類似するフォーマット情報を修正することにより当該識別対象の帳票のフォーマット情報を生成し、前記記憶手段に記憶する手段、
    として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  8. 前記第 1 及び第2の抽出手段で帳票の特徴量として罫線及び文字列の色を抽出する際、黒領域及び当該黒領域に接している中間色の領域は「黒」と判定し、黒以外の色付き領域のうち前記中間色の領域に接しているが黒領域に接していない領域は「色付き」と判定することを特徴とする請求項7記載の記録媒体。
  9. 前記第 1 及び第2の抽出手段で帳票の特徴量として罫線及び文字列の色を抽出する際、黒領域に接している黒以外の色付き領域のうち、当該黒領域に接していない色付き領域に接している領域は「色付き」と判定することを特徴とする請求項7記載の記録媒体。
JP09376299A 1999-03-31 1999-03-31 帳票処理方法及び装置 Expired - Fee Related JP3851742B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09376299A JP3851742B2 (ja) 1999-03-31 1999-03-31 帳票処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09376299A JP3851742B2 (ja) 1999-03-31 1999-03-31 帳票処理方法及び装置

Publications (2)

Publication Number Publication Date
JP2000285190A JP2000285190A (ja) 2000-10-13
JP3851742B2 true JP3851742B2 (ja) 2006-11-29

Family

ID=14091455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09376299A Expired - Fee Related JP3851742B2 (ja) 1999-03-31 1999-03-31 帳票処理方法及び装置

Country Status (1)

Country Link
JP (1) JP3851742B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7508986B2 (en) 2003-11-28 2009-03-24 Canon Kabushiki Kaisha Document recognition device, document recognition method and program, and storage medium
CN101536035B (zh) * 2006-08-31 2012-09-26 公立大学法人大阪府立大学 图像识别方法、以及图像识别装置
WO2008107997A1 (ja) * 2007-03-08 2008-09-12 Fujitsu Limited 帳票種識別プログラム、帳票種識別方法および帳票種識別装置
JP4804433B2 (ja) 2007-08-21 2011-11-02 キヤノン株式会社 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2009069991A (ja) * 2007-09-11 2009-04-02 Ricoh Co Ltd 情報処理装置,プログラム,および記録媒体
JP4998220B2 (ja) 2007-11-09 2012-08-15 富士通株式会社 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法
JP2011123598A (ja) * 2009-12-09 2011-06-23 Canon Inc 原稿判別装置、原稿判別方法及びプログラム
JP5617249B2 (ja) 2010-01-20 2014-11-05 富士ゼロックス株式会社 帳票識別装置、帳票識別プログラム及び帳票処理システム
US9194601B2 (en) 2010-09-13 2015-11-24 Mitsubishi Electric Corporation Air conditioning control device, air conditioning control method and program
JP5670787B2 (ja) * 2011-03-18 2015-02-18 株式会社Pfu 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
JP2017175524A (ja) * 2016-03-25 2017-09-28 株式会社日立ドキュメントソリューションズ 文書管理システムおよびイメージデータ管理方法
JP6690089B2 (ja) * 2016-04-25 2020-04-28 富士通株式会社 帳票認識方法、帳票認識装置、及び帳票認識プログラム
JP2019169025A (ja) * 2018-03-26 2019-10-03 株式会社Pfu 情報処理装置、文字認識エンジン選択方法及びプログラム
JP7312646B2 (ja) 2019-08-27 2023-07-21 株式会社日立製作所 情報処理装置、文書識別方法、及び情報処理システム
JP2021131659A (ja) * 2020-02-19 2021-09-09 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、及びプログラム
JP7400543B2 (ja) 2020-02-28 2023-12-19 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN111782808A (zh) * 2020-06-29 2020-10-16 北京市商汤科技开发有限公司 文档处理方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
JP2000285190A (ja) 2000-10-13

Similar Documents

Publication Publication Date Title
JP3851742B2 (ja) 帳票処理方法及び装置
US7120318B2 (en) Automatic document reading system for technical drawings
US7519226B2 (en) Form search apparatus and method
US8059896B2 (en) Character recognition processing system and computer readable medium storing program for character recognition processing
US6335986B1 (en) Pattern recognizing apparatus and method
JP2951814B2 (ja) 画像抽出方式
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
JP4208918B2 (ja) 文書画像からテキストを抽出する方法及び装置並びにコンピュータプログラム及びその記憶媒体
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US20070122037A1 (en) Image processing apparatus and image processing method
CN101122953A (zh) 一种图片文字分割的方法
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
US20050223313A1 (en) Model of documents and method for automatically classifying a document
WO2000062243A1 (fr) Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
Brisinello et al. Optical Character Recognition on images with colorful background
JP4275866B2 (ja) カラー画像から文字列パターンを抽出する装置および方法
KR101937398B1 (ko) 고문서의 이미지 데이터에서의 문자 추출 시스템 및 이를 이용한 문자 추출 방법
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
Van Phan et al. Collecting handwritten nom character patterns from historical document pages
JP4176175B2 (ja) パターン認識装置
JPH08190690A (ja) ナンバープレート決定方法
JP4228592B2 (ja) 文字認識装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2005250786A (ja) 画像認識方法
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060904

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130908

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees