JP2004030340A - 帳票識別装置及びその識別方法 - Google Patents

帳票識別装置及びその識別方法 Download PDF

Info

Publication number
JP2004030340A
JP2004030340A JP2002186956A JP2002186956A JP2004030340A JP 2004030340 A JP2004030340 A JP 2004030340A JP 2002186956 A JP2002186956 A JP 2002186956A JP 2002186956 A JP2002186956 A JP 2002186956A JP 2004030340 A JP2004030340 A JP 2004030340A
Authority
JP
Japan
Prior art keywords
character string
keyword
graphic
image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002186956A
Other languages
English (en)
Other versions
JP4221960B2 (ja
Inventor
Masaaki Yamada
山田 雅昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002186956A priority Critical patent/JP4221960B2/ja
Publication of JP2004030340A publication Critical patent/JP2004030340A/ja
Application granted granted Critical
Publication of JP4221960B2 publication Critical patent/JP4221960B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】専用の識別コードを持たない帳票の識別において、連票の分離や印刷ずれがあっても帳票に記載された文字列を照合し、正確に帳票を識別する。
【解決手段】画像入力装置1は、帳票の画像を取り込む。データ処理装置2は、画像からキーワードの候補となる文字列の検出を行うキーワード候補検出部21と、検出されたキーワード候補と辞書を照合して帳票を識別するキーワード照合部22とを有している。記憶装置3は、帳票のディジタル画像を記憶する画像記憶部31と、ラベル付けされた図形成分の情報を記憶するラベル情報記憶部32と、文字列の座標、サイズ、文字列に含まれる全ての図形成分を記憶する文字列記憶部33と、キーワード候補の位置およびサイズを記憶するキーワード候補記憶部34と、予め識別させたい帳票の登録番号、キーワードとなる文字列の位置、サイズ、照合のための特徴情報を記憶する辞書記憶部35とを有している。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は帳票識別装置及びその識別方法に関し、特に専用の識別コードを持たない帳票の文字列照合を利用して識別する帳票識別装置及びその識別方法に関する。
【0002】
【従来の技術】
最近の情報処理化により、伝票や各種帳票の記載事項および帳票の画像を読み取るため、文字読取装置やイメージスキャナが使用されている。これら読み取られた画像中の文字列をコード情報に変換しデータベースに取り込むためには、情報処理システムとして帳票の構造を知ることが必要である。
【0003】
一般には、帳票の文字を光学的に読み取りイメージ信号として入力し、それらの中に含まれる文字を切り出し、パターンマッチングによる方法により認識される。
【0004】
従来の帳票識別装置及びその識別方法は、例えば光学的文字読取装置において、複数種類の帳票を識別するために、それぞれの帳票の固定された位置に専用の識別コードを印刷し、その識別コードを読み取ることによって帳票を識別しているのが一般的である。この場合、帳票を専用に設計しなければならないので、既存の帳票や帳票の発行元が異なるために統一された識別コードが印刷されていない帳票については、これらの帳票を識別することはできない。
【0005】
このような技術の一例として、特開2001−312696号公報記載の「文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法」が知られている。
【0006】
この公報では、帳票に印刷されている帳票固有のタイトル等、帳票識別に使用する文字列(以下、キーワードと呼ぶ)の位置とサイズと画像特徴を、辞書として予め記憶する。帳票を識別する際には、辞書に記憶している文字列位置に対して文字列内の各文字の幅と高さの半分だけ拡張したエリアを識別対象の帳票画像上に設定し、そのエリア内で該帳票画像の画素値を横方向、縦方向に投影を行う。
【0007】
その投影結果から文字列の位置を補正した上で、帳票画像内の文字列を切出して文字列画像の照合を行い、帳票を識別する技術が記載されている。
【0008】
【発明が解決しようとする課題】
上述した従来の帳票識別装置及びその識別方法は、連票形式の帳票を切り離すことにより識別したい帳票のキーワードの位置が辞書に記憶している位置と大きく異なる場合、比較的大きな印刷ずれがある場合、同一フォーマットの帳票であっても発行元が異なるためにキーワード位置の変動が大きい場合に、識別対象の帳票画像上のキーワードと辞書に記憶しているキーワードとの文字幅や高さが半分以上ずれて、正しく帳票を識別することができないという欠点を有している。
【0009】
また、キーワードと異なる高さの文字列がキーワードと同一行に隣接して存在した場合、キーワードを切出すために文字幅や高さが半分拡張したエリア内にこれらの文字列が進入するため、投影によってこれらの文字列をキーワードと分離できず、正しく照合して帳票を識別することができないという欠点を有している。
【0010】
さらにまた、帳票識別の辞書に登録してあるキーワード全てについて、そのキーワードが識別したい帳票上に存在するかどうかを調べるために、キーワードの切出しと照合を行う必要があるが、帳票識別を行うために辞書にキーワードが登録してある帳票数が増加すると、登録する帳票数に比例して帳票識別にかかる時間が増加するという欠点を有している。
【0011】
本発明の目的は、キーワードの位置が変動しても正しいキーワードの位置を見つけ出し帳票が高精度に識別でき、またキーワードと異なる高さの文字列がキーワードと同一行に隣接して存在しても、正しいキーワード位置を見つけ出し帳票を高精度に識別でき、さらにまた帳票識別を行うために辞書にキーワードが登録してある帳票数が増加しても、帳票の高精度性を損なうことなく高速に識別できる帳票識別装置及びその識別方法を提供することにある。
【0012】
【課題を解決するための手段】
本発明の第1の帳票識別装置は、
帳票の画像を取り込む画像入力装置と;
この画像入力装置によって取り込まれた帳票の画像を記憶し、ラベル付けされた図形成分の情報を記憶し、文字列の座標、サイズ、この文字列に含まれる全ての図形成分を記憶し、キーワード候補の位置及びサイズを記憶し、予め識別させたい帳票の登録番号、キーワードとなる文字列の位置、サイズ、照合のための特徴情報を記憶する記憶装置と;
前記画像からキーワードの候補となる文字列の検出を行い、検出されたキーワード候補と辞書とを照合して帳票を識別し、記憶されている帳票の画像に対しラベリングを行い、ラベリングの結果得られた図形成分を結合し、この図形成分を前記文字列の候補から除外し、ラベリング結果から検出した文字列を分割してキーワード候補を見つけ、記憶している文字列サイズと文字サイズ情報が一致する文字列を選択し、この文字列の画像と前記辞書とを照合することで類似度を計算するデータ処理装置と;
照合結果により前記辞書に記憶されている識別情報を出力する出力装置と;
を備えたことを特徴としている。
【0013】
本発明の第2の帳票識別装置は、前記第1の帳票識別装置において、
前記データ処理装置は、
前記画像からキーワードの候補となる文字列の検出を行うキーワード候補検出部と、検出されたキーワード候補と辞書を照合して帳票を識別するキーワード照合部とを有し、
前記キーワード候補検出部は、
記憶されている帳票の画像に対しラベリングを行うラベリング処理部と、ラベリングの結果得られた図形成分を結合する図形成分結合部と、前記図形成分を文字列候補から除外する図形成分分類部と、ラベリング結果から文字列を検出する文字列検出部と、検出した文字列を分割してキーワード候補を見つける文字列分離部とを備え、
前記キーワード照合部は、
記憶している文字列サイズと文字サイズ情報が一致する文字列を選択するキーワード選択部と、文字列の画像と辞書を照合することで類似度を計算するキーワード類似度照合部とを備えたことを特徴としている。
【0014】
本発明の第3の帳票識別装置は、前記第1または第2の帳票識別装置において、
前記記憶装置は、
前記画像入力装置によって取り込まれた帳票の画像を記憶する画像記憶部と、前記ラベル付けされた図形成分の情報を記憶するラベル情報記憶部と、前記文字列の座標、サイズ、この文字列に含まれる全ての図形成分を記憶する文字列記憶部と、前記キーワード候補の位置及びサイズを記憶するキーワード候補記憶部と、前記予め識別させたい帳票の登録番号、キーワードとなる文字列の位置、サイズ、照合のための特徴情報を記憶する辞書記憶部とを有していることを特徴としている。
【0015】
本発明の第4の帳票識別装置は、前記第3の帳票識別装置において、
前記ラベル情報記憶部は、
前記キーワード候補検出部が有する前記ラベリング処理部及び前記図形成分結合部によって得られたラベル画像を記憶するラベル画像記憶域と、前記ラベリング処理部及び前記図形成分結合部によってラベル付けされた図形成分の情報を記憶する図形成分情報記憶域とを有していることを特徴としている。
【0016】
本発明の第5の帳票識別装置は、前記第3または第4の帳票識別装置において、
前記辞書記憶部は、
帳票に記載されている文字列の外接矩形座標、サイズ及び位置許容範囲が記憶される位置・サイズ記憶域と、前記帳票に記載されている前記文字列の照合用画像特徴が記憶される照合用特徴記憶域とを有していることを特徴としている。
【0017】
本発明の第6の帳票識別装置は、前記第2の帳票識別装置において、
前記図形成分結合部は、
前記記憶装置の前記ラベル画像記憶域の各図形成分について、図形成分を1画素広げる膨張処理と図形成分を1画素縮める収縮処理を行い、前記膨張処理をn(nは以上の整数)回実行した後で、前記収縮処理をn回実行し近隣の図形成分を結合することを特徴としている。
【0018】
本発明の第7の帳票識別装置は、前記第2の帳票識別装置において、
前記図形成分分類部は、
前記図形成分情報記憶域に記憶されている各図形成分のサイズ情報を順番に読み込み、各図形成分の縦幅とキーワードよりも高さが大きな図形成分を分類するための閾値とを比較し、前記図形成分の縦幅が前記閾値より大きいとき、前記図形成分は文字列ではない成分であるとして、前記ラベル画像記憶域と前記図形成分情報記憶域の該当する図形成分に除外を示すフラグを付加し、それ以外の図形成分と区別することを特徴としている。
【0019】
本発明の第8の帳票識別装置は、前記第3の帳票識別装置において、
前記文字列記憶部は、文字列の座標とサイズ及びこの文字列に含まれる全ての図形成分を記憶することを特徴としている。
【0020】
本発明の第9の帳票識別装置は、前記第3の帳票識別装置において、
前記キーワード候補記憶部は、キーワード候補の位置とサイズを記憶することを特徴としている。
【0021】
本発明の第10の帳票識別装置は、
帳票から取り込んだ画像データを記憶する画像記憶手段と、
この画像記憶手段に記憶されている画像データに対してラベリングを行うラベリング処理手段と、
ラベリング処理の結果得られたラベル画像上の図形成分のうち、近接したものを結合する図形成分結合手段と、
前記図形成分を文字列候補から除外する図形成分分類手段と、
前記ラベル画像と前記図形成分をもとに同じ縦位置及び同じ高さの図形成分を抜き出し、この図形成分を全て含む隣接最小矩形を文字列候補とする文字列検出手段と、
文字列情報を検索し、文字列内に文字列を分離するのに十分な空白部分や罫線情報をもとに文字列を分離する文字列分離手段と、
前記文字列情報と辞書上の文字列サイズを比較し、前記辞書上の文字列サイズと一致する文字列情報を選択するキーワード選択手段と、
選択された文字列の位置・サイズ情報をもとに前記画像記憶手段によって記憶された画像データから文字列の特徴を抽出し、該当する辞書内の特徴量と照合するキーワード照合手段と、
ラベリングした結果のラベル画像およびラベル付けされた図形成分を記憶するラベル情報記憶手段と、
文字列候補として検出された位置・サイズ・図形成分の文字列情報を記憶する文字列情報記憶手段と、
前記キーワード候補の位置及びサイズを記憶するキーワード候補記憶手段と、
前記帳票に記載された文字列が取るべきサイズ、前記文字列が持つべき特徴情報及び前記文字列を含む帳票が、識別されるために必要な識別情報を記憶する辞書記憶手段と、
前記キーワード照合手段による照合結果に従い、前記辞書に記憶されている識別情報を出力する出力手段と、
を備えたことを特徴としている。
【0022】
本発明の第11の帳票識別方法は、
帳票に記載された文字列が取るべきサイズと、前記文字列が持つべき特徴情報と、前記文字列を含む帳票が識別されるために必要な識別情報を記憶する辞書を有するコンピュータシステムであって、
画像入力装置から帳票の画像を取り込み画像データをメモリに記憶させる画像記憶ステップと;
前記メモリに記憶された画像データに対してラベリング処理を行うラベリングステップと;
前記ラベリング処理の結果得られたラベル画像上の図形成分のうち、近接した図形を結合する図形成分結合ステップと;
図形成分結合処理の結果得られた図形成分のサイズをもとに、文字列に含まれるには不適切な図形成分と文字列に含まれるかもしれない図形成分とを分類する図形成分分類ステップと;
前記図形成分の縦方向位置と高さの情報をもとに文字列の候補を検出する文字列検出ステップと;
前記文字列候補内の空白部分や罫線の図形成分をもとに文字列を分離する文字列分離ステップと;
前記文字列情報と前記辞書上の文字列サイズを比較し、辞書上の文字列サイズと一致する文字列情報を選択する選択ステップと;
選択された文字列の位置・サイズ情報をもとに記憶された画像データから文字列の特徴を抽出し、該当する辞書内の特徴量と照合する照合ステップと;
前記照合ステップによる照合結果に従い、前記辞書に記憶されている識別情報を出力する情報出力ステップと;
を備えたことを特徴としている。
【0023】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
【0024】
図1は本発明の帳票識別装置の一つの実施の形態を示すブロック図である。
【0025】
図1に示す本実施の形態は、画像入力装置1と、データ処理装置2と、記憶装置3と、出力装置4とから構成されている。
【0026】
画像入力装置1は、イメージスキャナ等によって構成され、帳票の画像を多階調の2次元ディジタル画像として取り込む。
【0027】
データ処理装置2は、画像からキーワードの候補となる文字列の検出を行うキーワード候補検出部21と、検出されたキーワード候補と辞書を照合して帳票を識別するキーワード照合部22とを有している。
【0028】
なお、キーワード候補検出部21は、記憶されている帳票の画像に対しラベリングを行うラベリング処理部211と、ラベリングの結果得られた図形成分を結合する図形成分結合部212と、罫線等の図形成分を文字列候補から除外する図形成分分類部213と、ラベリング結果から文字列を検出する文字列検出部214と、検出した文字列を分割してキーワード候補を見つける文字列分離部215とを備える。
【0029】
また、キーワード照合部22は、記憶している文字列サイズと文字サイズ情報が一致する文字列を選択するキーワード選択部221と、文字列の画像と辞書を照合することで類似度を計算するキーワード類似度照合部222とを備える。
【0030】
記憶装置3は、半導体メモリ或いは磁気ディスクなどによって構成され、画像入力装置1によって取り込まれた帳票のディジタル画像を記憶する画像記憶部31と、ラベル付けされた図形成分の情報を記憶するラベル情報記憶部32と、文字列の座標、サイズ、文字列に含まれる全ての図形成分を記憶する文字列記憶部33と、キーワード候補の位置およびサイズを記憶するキーワード候補記憶部34と、予め識別させたい帳票の登録番号、キーワードとなる文字列の位置、サイズ、照合のための特徴情報を記憶する辞書記憶部35とを有している。
【0031】
なお、ラベル情報記憶部32は、ラベリング処理部211および図形成分結合部212によって得られたラベル画像を記憶するラベル画像記憶域321と、ラベリング処理部211および図形成分結合部212によってラベル付けされた図形成分の情報を記憶する図形成分情報記憶域322を備える。
【0032】
また、辞書記憶部35は、帳票に記載されている文字列「払込票」の外接矩形座標、サイズおよび位置許容範囲が記憶される位置・サイズ記憶域351と、帳票に記載されている文字列「払込票」の照合用画像特徴が記憶される照合用特徴記憶域352とを備えている。
【0033】
出力装置4は、表示装置などによって構成され、キーワード照合部22によって得られた識別コードを出力する。
【0034】
次に、図1を参照して本実施の形態の動作をより詳細に説明する。
【0035】
画像入力装置1により取り込まれた帳票画像は、記憶装置3の画像記憶部31に記憶される。
【0036】
データ処理装置2のキーワード候補検出部21が有するラベリング処理部211は、画像記憶部31に記憶されている帳票の画像に対してラベリングを行う。ここでラベリングとは、画像上の連結成分毎に異なったラベル番号を割り当てる処理である。
【0037】
ラベリングはよく知られた画像処理方法で、例えば長尾 真著『画像認識論』(コロナ社)のpp85〜86にもその方法が記載されている。
【0038】
ラベリング処理部211は、ラベリングの結果得られたラベル付けされた画像をラベル画像記憶域321に記憶する。
【0039】
また、ラベリング処理部211は、ラベル付けされた図形成分毎の外接矩形の位置とサイズの情報を図形成分情報記憶域322に記憶する。
【0040】
図形成分結合部212は、記憶装置3のラベル画像記憶域321上の各図形成分について膨張処理と収縮処理を行う。膨張処理と収縮処理は近隣の図形成分を結合するために使用されるよく知られた画像処理方法で、膨張処理は図形成分を1画素広げる処理であり、収縮処理は図形成分を1画素縮める処理である。膨張処理を数回行った後で、収縮処理を同一回数実行することで近隣の図形成分を結合できる。膨張処理と収縮処理は、一般の帳票では例えば2〜4回程度繰り返される。
【0041】
膨張処理と収縮処理の後、図形成分結合部212はラベル画像記憶域321上をラスタスキャンし、各図形成分が接触しているかどうかを確認する。接触していればそれぞれの図形成分に同一のラベル番号を振り直し、その結果のラベル画像をラベル画像記憶域321に、また図形成分毎の外接矩形の位置とサイズの情報を図形成分情報記憶域322に記憶する。この処理を行うことで、分離文字が結合されラベル付けされた図形成分が文字単位になる。
【0042】
図形成分分類部213は、図形成分情報記憶域322に記憶されている各図形成分のサイズ情報を順番に読み込み、各図形成分の縦幅と定数HLmaxを比較する。
【0043】
ここで定数HLmaxとは、キーワード、罫線のような明らかにキーワードよりも高さが大きな図形成分を分類するための閾値を示す。一般的な帳票のキーワードサイズ統計から、本例では例えば、HLmax=80に設定する。
【0044】
図形成分分類部213は、図形成分の縦幅がHLmaxより大きいとき、その図形成分は罫線など文字列ではない成分であるとして、ラベル画像記憶域321と図形成分情報記憶域322の該当する図形成分に、除外を示すフラグ(以下、フラグR)を付加しそれ以外の図形成分と区別する。
【0045】
文字列検出部214は、図形成分情報記憶域322に記憶されている各図形成分Liを順番に読み込みながら、フラグRと後述のフラグTのいずれもが付加されていない図形成分Liに対し、図形成分の幅をWLi、図形成分の高さをHLiとして、WLiとHLiが以下の2条件を満たすかどうかを調べる。
【0046】
【数1】
Figure 2004030340
【0047】
ここで、WLmin、WLmax、HLmin、HLmaxは、文字としての適切なサイズの上限、下限を示す定数であり、一般的な帳票に記述されたキーワードの文字サイズの統計から、例えば、WLmin=8、WLmax=50、HLmin=16、HLmax=50とする。
【0048】
図形成分Liを読み込む途中で、上記条件を満たす図形成分Liが見つかった時点で、文字列検出部214は図形成分情報記憶域322に記憶されている各図形成分Ljの図形成分を順番に全て読み込み、フラグRと後述のフラグTのいずれもが付加されていない図形成分Ljに対し、図形成分Liの縦方向位置をYLi、図形成分Liの高さをHLiとする。
【0049】
図形成分Ljの縦方向位置をYLj、図形成分Ljの高さをHLjとしたとき、YLjとHLjが以下の2条件を満たすかどうかを調べる。
【0050】
【数2】
Figure 2004030340
【0051】
ここで、ΔYおよびΔHは、ラベル画像上の別の図形成分がLiと同じ位置あるいは高さと見なせる許容範囲を示す定数であり、一般的な帳票に記述されたキーワードの文字サイズの統計から、例えば、ΔY=5、ΔH=3とする。
【0052】
全てのLjについてこれらの条件の確認が終わると、文字列検出部214は、これらの条件を満たした全ての図形成分Ljを画像上の横方向位置で昇順ソートする。
【0053】
ここで、条件を満たす図形成分LjがLi自身だけのときは文字列候補と見なさず、文字列検出部214は次のLiの読み込み動作に戻る。
【0054】
文字列検出部214は、条件を満たす図形成分LjがLi以外に複数あるときは、図形成分Lj全てを含む最小の矩形領域の位置、サイズ、条件を満たすこれらの図形成分Ljを、全て文字列記憶部33に文字列Mpとして記憶する。
【0055】
このとき、文字列検出部214は条件を満たすこれらの図形成分Ljを、それぞれ、Lp(1)、Lp(2)、…、Lp(n)という図形成分の配列に保存することになる。
【0056】
また、文字列検出部214は、条件を満たすこれらの図形成分Lj全てに対して、ラベル画像記憶域321と図形成分情報記憶域322の該当する図形成分に、文字列として記憶済みを示すフラグ(以下、フラグT)を付加する。その後、文字列検出部214は次のLiの読み込みに戻る。
【0057】
文字列分離部215は、文字列記憶部33に記憶されている文字列Mpを順番に読み出す。文字列分離部215は、読み出した各文字列Mpに含まれる図形成分Lp(k)をk=1から文字列Mpに含まれる図形成分数nまで順に読み出す。
【0058】
文字列分離部215は、図形成分Lp(k)とLp(k+1)に対して、それらの図形成分間隔が以下の条件を満たすかどうかを、k=1からk=n−1まで順に調べる。
【0059】
【数3】
Figure 2004030340
【0060】
ここで、LNは文字列と見なせる文字間の最大間隔を示す定数であり、一般的な帳票に記述されたキーワードの文字間隔の統計から、例えば、LN=50とする。
【0061】
条件を満たしたとき、文字列分離部215は、ラベル画像記憶域321上のLp(k)とLp(k+1)の図形成分間エリアに、フラグRが付加された図形成分が存在するかどうかを調べる。具体的には、文字列分離部215は、ラベル画像記憶域321にあるラベル画像上で、図形成分Lp(K)の右上の座標と図形成分Lp(k+1)の左上の座標で構成される矩形領域の上端1ラインを走査して、フラグRが付加された図形成分を探すことになる。
【0062】
文字列分離部215は、同様にラベル画像記憶域321にあるラベル画像上で、図形成分Lp(K)の右下の座標と図形成分Lp(k+1)の左下の座標とで構成される矩形領域の下端1ラインを走査して、フラグRが付加された図形成分を探す。
【0063】
これらの処理でフラグRが見つかると、図形成分Lp(k)とLp(k+1)の図形成分間エリアに、フラグRが付加された図形成分が存在することになる。
【0064】
条件を満たさないとき、またはフラグRが存在するとき、文字列分離部215は、文字列MpをLp(1)〜Lp(k)とLp(k+1)〜Lp(n)の図形成分で分割する。
【0065】
このとき、k>1、つまりLp(1)〜Lp(k)の図形成分が2つ以上ある場合は、文字列分離部215はLp(1)〜Lp(k)を含む最小の矩形領域の位置とサイズをキーワード候補Uqとしてキーワード候補記憶部34に記憶する。
【0066】
また、残りの図形成分Lp(k+1)〜Lp(n)については、文字列分離部215は、これらの図形成分を含む最小の矩形領域の位置、サイズ、図形成分Lp(k+1)〜Lp(n)を文字列Mpに再度記憶し、この文字列Mpについて以上の処理を繰り返す。
【0067】
なお分割しない場合、文字列分離部215は残った文字列Mpに図形成分がいくつ含まれるかを調べ、図形成分数n>2のときは、Lp(1)〜Lp(k)を含む最小の矩形領域の位置とサイズを、キーワード候補Uqとしてキーワード候補記憶部34に記憶する。
【0068】
キーワード照合部22は、辞書記憶部35の位置・サイズ記憶域351に記憶している文字列サイズと、文字列記憶部33のサイズ情報が一致する文字列を選択するキーワード選択部221と、文字列の画像と辞書を照合することで類似度を計算するキーワード類似度照合部222を有している。
【0069】
キーワード選択部221は、キーワード候補記憶部34からキーワード候補Uqを順番に読み出す。
【0070】
読み出したUqそれぞれに対して、キーワード選択部221は、辞書記憶部35の位置・サイズ記憶域351から、キーワードZrの位置・サイズおよび位置の許容範囲を読み出す。
【0071】
Uq左上部位置のX座標をXUq、左上部位置のY座標をYUq、幅をWUq、高さをHUq、Zr左上部位置のX座標をXZr、左上部位置のY座標をYZr、幅をWZr、高さをHZr、Zrの左方向位置許容範囲をdXLZr、Zrの右方向位置許容範囲をdXRZr、Zrの左方向位置許容範囲をdYTZr、Zrの左方向位置許容範囲をdYBZrとすると、キーワード選択部221は、キーワード候補Uqと辞書のキーワードZrが以下の4条件を満たすかどうかを調べる。
【0072】
【数4】
Figure 2004030340
【0073】
ここで、dW、dHはキーワード照合時のキーワードサイズ誤差の許容範囲で、一般的な帳票に記述されたキーワードの文字間隔の統計から、例えば、dW=dH=5とする。
【0074】
キーワードの位置許容範囲dXLZr、dXRZr、dYTZr、dYBZrは、辞書にキーワードを登録するときに、キーワード位置として許容できる範囲が予め記憶されている。
【0075】
例えば、連票となりうる帳票を辞書記憶部35に記憶する際に、帳票の各片が連結して分離したときにキーワード位置が変化しうる範囲を予め記憶しておく。
【0076】
図2は辞書に登録する帳票の一例を示す図である。
【0077】
図3は帳票識別に使用する帳票の一例を示す図である。
【0078】
今、図2に示す帳票が照合用に辞書記憶部35に登録されている帳票とする場合、図3に示す帳票が画像入力装置1に入力され帳票識別の対象となる。図2の帳票に記載されている文字列「払込票」のdXRZrを除く位置許容範囲は、一般的な帳票にある印刷ずれや切断誤差からdXLZr=10、dYTZr=10、dYBZr=10とする。
【0079】
dXRZrについては、図3に示す帳票「受領証」片の横幅だけ「払込票」のキーワード位置が右にずれることがあることを考慮して、dXRZr=640とする。
【0080】
キーワード選択部221は、この条件を満たすUqとZrの組み合わせをリストアップする。キーワード類似度照合部222は、キーワード選択部221によってリストアップされたUqとZrの全ての組み合わせについて、キーワード選択部221で選択した文字列の画像から特徴を抽出する。この選択した文字列の画像から抽出した特徴と、対応する辞書記憶部35の照合用特徴記憶域352に記憶している特徴とを照合して類似度を計算する。
【0081】
キーワード類似度照合部222は、最も類似度が高いと判定された特徴を持つ辞書と関連付けられた帳票識別コードを出力装置4に出力する。
【0082】
また、予め記憶されている帳票でないと判断されるときは、その旨を出力装置4に出力する。
【0083】
なお、記憶装置3のラベル情報記憶部32は、データ処理装置2のラベリング処理部211および図形成分結合部212によって得られたラベル画像を記憶するラベル画像記憶域321と、ラベリング処理部211および図形成分結合部212によってラベル付けされた図形成分の情報を記憶する図形成分情報記憶域322とを有している。
【0084】
文字列記憶部33は、文字列の座標とサイズおよびその文字列に含まれる全ての図形成分を記憶する。キーワード候補記憶部34は、キーワード候補の位置とサイズを記憶する。辞書記憶部35は、予め識別させたい帳票の登録番号、キーワードとなる文字列の位置、サイズ、照合のための特徴情報を記憶する。
【0085】
図4は本発明の帳票識別装置の動作を示すフローチャートである。
【0086】
次に、図1、図2、図3および図4を参照して本実施の形態の動作をより詳細に説明する。
【0087】
ここでは、図2に示す帳票が照合用に辞書記憶部35に登録されている帳票、図3に示す帳票が画像入力装置1に入力される帳票識別の対象となる帳票とする。
【0088】
図2の帳票に記載されている文字列「払込票」の外接矩形座標とサイズ及び位置許容範囲が、位置・サイズ記憶域351にZ1として記憶されているものとする。
【0089】
また、図2の帳票に記載されている文字列「払込票」の照合用画像特徴が、照合用特徴記憶域352に記憶されているものとする。
【0090】
まず、図4のフローチャートの処理では、画像入力装置1は図3に示す帳票のイメージを画像記憶部31に取り込む。画像記憶部31には、帳票の画像が多階調を有する2次元のディジタル画像として記憶される(ステップS1)。
【0091】
画像の入力が完了すると、次にラベリング処理部211は、画像記憶部31に記憶されている画像を読み出しラベリング処理を行う。ラベル画像はラベル画像記憶域321に記憶される。また、個々の図形成分の位置やサイズについては、図形成分情報記憶域322に記憶される(ステップS2)。
【0092】
次のステップS3で、図形成分結合部212は図形成分の結合を行う。図形成分結合部212は、ラベル画像記憶域321上の各図形成分について膨張処理と収縮処理を行う。
【0093】
数回(ここでは3回)の膨張処理と同一回数の収縮処理の後、図形成分結合部212は、ラベル画像記憶域321上をラスタスキャンし、各図形成分が接触しているかどうかを確認する。接触していれば、それぞれの図形成分に同一のラベル番号を振り直し、その結果をラベル画像記憶域321のラベル画像と図形成分情報記憶域322に反映させる。
【0094】
図5はラベリング後のラベル画像を示す図である。
【0095】
図5がラベリングの結果得られたラベル画像で、ラベル画像記憶域321に記憶される。図形成分の一部を図5のL1〜L11に示している。
【0096】
また、個々の図形成分領域の位置やサイズについては、図形成分情報記憶域322に記憶される(ステップS3)。
【0097】
次に、図形成分分類部213は、図形成分の分類処理を行う(ステップS4)。
【0098】
図6は図4の図形成分分類処理の動作を示すフローチャートである。
【0099】
図6を参照すると、図形成分分類部213は図形成分情報記憶域322から最初の図形成分L1を選択して読み出す(ステップS41)。
【0100】
次に、図形成分分類部213はL1の縦幅と定数HLmaxを比較判定する(ステップS42)。
【0101】
定数HLmaxは、キーワードと罫線のような明らかにキーワードよりも高さが大きな図形成分とを分類するための閾値で、一般的な帳票のキーワードサイズ統計から、例えば、HLmax=80に設定する。
【0102】
L1の縦幅はHLmaxより大きく、図形成分分類部213はこの図形成分L1が罫線など文字列ではない成分であると判断し、L1にフラグRを付加して、ラベル画像記憶域321のL1部分及び図形成分情報記憶域322のL1部分にそれぞれ記憶する(ステップS43)。
【0103】
次に、図形成分分類部213は、全ての図形成分についてステップS42の処理を終了したかどうかを確認する(ステップS44)。
【0104】
まだ終了していない場合、図形成分情報記憶域322から次の図形成分L2を選択して読み出し、ステップ42に戻る(ステップS45)。
【0105】
同様にステップS42の比較判定にて、図形成分分類部213が図形成分L3を読み出したときのことを考える。L3の縦幅がHLmaxより小さいと、図形成分分類部213は、この図形成分はL3が文字列の一部である可能性があると判断し、ステップS43を実行せずにスキップし、ステップS44に進む。
【0106】
全ての図形成分についてステップS44の比較が終了した時点で、L1とL2にフラグRが付加される。該当する図形成分にフラグRが付加され、ラベル画像記憶域321に記憶される。
【0107】
図7はフラグRを付加したラベル画像を示す図である。
【0108】
図8はフラグRを付加した図形成分情報記憶域を示す図である。
【0109】
図7のR1は、フラグRが付加された図形成分を示している。また、このとき図形成分情報記憶域322に記憶されている図形成分Liを図8に示す。
【0110】
次に、図4のフローチャートに戻って、文字列候補の検出を行う(ステップS5)。
【0111】
図9は図4の文字列候補検出処理の動作を示すフローチャートである。
【0112】
文字列検出部214は、最初i=1として、図形成分Liの最初の図形成分L1を図形成分情報記憶域322から読み出す(ステップS501)。ステップS502で、文字列検出部214は、図形成分L1にフラグRまたはフラグTが付加されているかどうかを確認する。図7を参照すると、図形成分L1はフラグRが付加されているので、i←i+1とする(ステップS513)。
【0113】
図形成分LiにフラグRまたはフラグTがいずれも付加されていない場合は、図形成分Liの図形成分の幅をWLi、図形成分の高さをHLiとすると、WLiとHLiが以下の2条件を満たすかどうかを調べる(ステップS503)。
【0114】
【数5】
Figure 2004030340
【0115】
ここで、WLmin、WLmax、HLmin、HLmaxは、文字としての適切なサイズの上限、下限を示す定数である。一般的な帳票に記述されたキーワードの文字サイズの統計から、例えば、WLmin=8、WLmax=50、HLmin=16、HLmax=50とする。i=3のとき、図形成分L3は除外または登録を示すフラグが付加されていないのでこれらの条件を満たすものとする。
【0116】
次に、i=3のとき、文字列検出部214は、j=1として図形成分Ljの図形成分を図形成分情報記憶域322から読み出す(ステップS504)。
【0117】
文字列検出部214は、図形成分Liの縦方向位置をYLi、図形成分Liの高さをHLiとし、図形成分Ljの縦方向位置をYLj、図形成分Ljの高さをHLjとしたとき、図形成分LjにフラグRまたはフラグTが付加していないかどうかを調べる(ステップS505)。
【0118】
フラグRまたはフラグTがあればj←j+1とする(ステップS508)。文字列検出部214は、フラグRおよびフラグTのいずれも付加されていない残り全ての図形成分Ljに対し、YLjとHLjが以下の2条件を満たすかどうかを調べる(ステップS506)。
【0119】
【数6】
Figure 2004030340
【0120】
ここで、ΔYおよびΔHは、ラベル画像上の別の図形成分がLiと同じ位置あるいは高さと見なせる許容範囲を示す定数であり、一般的な帳票に記述されたキーワードの文字サイズの統計から、例えば、ΔY=5、ΔH=3とする。
【0121】
全ての図形成分Ljについてこの条件を確認した後(ステップS507)、文字列検出部214は条件を満たした図形成分Ljを全て抜き出す。条件を満たす図形成分LjがLiだけだったときは(ステップS509)、文字列検出部214は、i←i+1として処理を続行する(ステップS513)。
【0122】
条件を満たす図形成分Ljが2つ以上あるときは、文字列検出部214は、画像上の横方向位置で昇順ソートする(ステップS510)。
【0123】
図5において、i=3のときは、昇順ソート後、LjとしてL3〜L9が条件を満たす。L10とL11は、HL10やHL11が、HL3−ΔH<HL11、または、HL3−ΔH<HL12 の条件を満たさない。
【0124】
その後、文字列検出部214は、これらの図形成分Lj全てを含む最小の矩形領域の位置、サイズおよびこれらの条件を満たす図形成分Lj全てを文字列M1として文字列記憶部に記憶する(ステップS511)。
【0125】
文字列検出部214は、i=3の場合は図形成分L3〜L9を含む最小の矩形領域の位置・サイズおよび昇順ソートされた図形成分L3〜L9をソート順に、Lp(1)、Lp(2)、…、Lp(7)として文字列記憶部33に保存する。
【0126】
全ての図形成分LiについてステップS502以降の処理が終了したかどうかを確認し(ステップS512)、まだ終了していない場合、i←i+1として処理を続ける(ステップS513)。
【0127】
図10は文字列を検出した後の文字列記憶部を示す図である。
【0128】
再び図4のフローに戻ると、次に文字列分離部215は文字列候補の分割を行う(ステップS6)。
【0129】
図11は図4の文字列分割処理の動作を示すフローチャートである。
【0130】
文字列分離部215は、文字列記憶部33から最初の文字列情報として「M1」を読み出す(ステップS601)。
【0131】
次に、文字列分離部215は、k=1として文字列情報に含まれる最初の図形成分L1(k=1)を読み出す(ステップS602)。
【0132】
文字列分離部215は、図形成分L1(k=1)とL1(k=2)の間隔について、以下の条件を満たすかどうかを調べる(ステップS603)。
【0133】
【数7】
Figure 2004030340
【0134】
ここで、LNは文字列と見なせる文字間の最大間隔を示す定数であり、一般的な帳票に記述されたキーワードの文字間の間隔の統計から、例えば、LN=50とする。これは、L1(1)とL2(2)の図形成分の間隔<LNを満たすものとして以降考える。
【0135】
同様に文字列Mpについて、文字列分離部215は、図形成分Lp(k)とLp(k+1)の間隔について、以下の条件を満たすかどうかを調べる(ステップS603)。
【0136】
【数8】
Figure 2004030340
【0137】
この条件を満たす場合は、文字列分離部215は、ラベル画像のLp(k)とLp(k+1)間エリアにフラグRが存在するかどうかを確認する(ステップS604)。
【0138】
具体的には、文字列分離部215は、ラベル画像記憶域321にあるラベル画像上で、図形成分Lp(K)の右上の座標と図形成分Lp(k+1)の左上の座標で構成される矩形領域の上端1ラインを走査して、フラグRが付加された図形成分を探す。
【0139】
文字列分離部215は、同様にラベル画像記憶域321にあるラベル画像上で、図形成分Lp(K)の右下の座標と図形成分Lp(k+1)の左下の座標で構成される矩形領域の下端1ラインを走査して、フラグRが付加された図形成分を探す。
【0140】
これらの処理でフラグRが見つかれば、図形成分Lp(k)とLp(k+1)の図形成分間エリアにフラグRが付加された図形成分が存在する。存在しない場合は、文字列分離部215は、現在の文字列候補内の全ての図形成分について調べたかどうかを確認する(ステップS607)。
【0141】
確認済みでなければk←k+1としてステップS603に戻り以降の処理を続行する(ステップS608)。確認済みであればその文字列候補の分割処理を終了し、ステップS609に進む。
【0142】
ステップS603の条件を満たさない場合、またはステップS604にて条件を満たすフラグが存在する場合は、文字列分離部215は、文字列MpをLp(k)とLp(k+1)の図形成分で分割し、Lp(1)〜Lp(k)については、k=1でなければキーワード候補としてキーワード候補記憶部34に記憶する(ステップS605)。
【0143】
残った図形成分Lp(k+1)〜Lp(n)については、文字列分離部215は、図形成分Lp(k+1)〜Lp(n)とこれらを含む最小矩形領域の位置・サイズを再度文字列として、Mpに登録しこの文字列Mpについての処理を続行する(ステップS606)。
【0144】
図5の文字列M1では、k=3のとき、L1(k=3)=L5、L1(k+1=4)=L6であり、図形成分L5とL6の間にフラグRが存在する。このため、文字列分離部215は、L5とL6で文字列候補を分割して、L1(1)〜L1(3)をキーワード候補として、その最小矩形領域の位置とサイズをキーワード候補記憶部34に記憶する。
【0145】
残りの図形成分L1(4)〜L1(9)については、文字列分離部215は、これらの図形成分とこれらを含む最小矩形領域の位置とサイズを再び文字列M1として文字列記憶域に記憶し、M1について分割処理を続行する(ステップS605)。
【0146】
また、k=6のとき、L1(k=6)=L8、L1(k+1=7)=L9であり、ステップS603の条件を満たさないため、文字列分離部215は、図形成分L8とL9で文字列候補を分割して、図形成分L1(4)〜L1(6)、つまり図形成分L6、L7、L8をキーワード候補としてキーワード候補記憶部34に記憶する。
【0147】
これ以上文字列を分割できない場合も、残った文字列をキーワード候補としてその位置とサイズをキーワード候補記憶部34に記憶する(ステップS606)。
【0148】
ここでは、残りの図形成分L1(7)、つまり図形成分L9については図形成分がL9の一つしか存在しないため、文字列分離部215はこれをキーワード候補として記憶しない。
【0149】
文字列分離部215は、文字列記憶部33に含まれる全ての文字列について調べたかどうかを確認する(ステップS609)。確認済みでなければ次の文字列情報を読み出して処理を続行し(ステップS610)、確認済みであれば文字列分割処理を終了する。
【0150】
再び図4のフローチャートに戻り、次にキーワード選択部はキーワードの選択を行う(ステップS7)。
【0151】
図12は図4のキーワード選択処理の動作を示すフローチャートである。
【0152】
キーワード選択部221は、最初q=1として(ステップ701)、キーワード候補記憶部34からキーワード候補U1を読み出す(ステップ702)。
【0153】
次に、キーワード選択部221は、r=1として(ステップS703)、辞書の位置・サイズ記憶域351からキーワードZ1を選択する(ステップS704)。
【0154】
キーワード選択部221は、キーワード候補Uqと辞書のキーワードZrに対し、Uq左上部位置のX座標をXUq、左上部位置のY座標をYUq、幅をWUq、高さをHUq、Zr左上部位置のX座標をXZr、左上部位置のY座標をYZr、幅をWZr、高さをHZr、Zrの左方向位置許容範囲をdXLZr、Zrの右方向位置許容範囲をdXRZr、Zrの左方向位置許容範囲をdYTZr、Zrの左方向位置許容範囲をdYBZrとすると、キーワード選択部221は、キーワード候補Uqと辞書のキーワードZrが以下の4条件を満たすかどうかを調べる(ステップS705)。
【0155】
【数9】
Figure 2004030340
【0156】
ここで、dW、dHはキーワード照合時のキーワードサイズ誤差の許容範囲で、一般的な帳票に記述されたキーワードの文字間の間隔の統計から、例えば、dW=dH=5とする。
【0157】
キーワードの位置許容範囲dXLZr、dXRZr、dYTZr、dYBZrは、辞書にキーワードを登録するときに、キーワード位置として許容できる範囲を予め記憶してある。
【0158】
これらの条件を満たすとき、キーワード選択部221は、照合用にUqとZrの組合せをリストアップする(ステップS706)。
【0159】
キーワード選択部221は、キーワード候補U1について、辞書の位置・サイズ記憶域351から全てのキーワードZrを選択したかどうかを確認し(ステップS707)、まだであればr=r+1として次の辞書キーワードZrを読み出して処理を続行する(ステップS708)。
【0160】
キーワード候補U1について、全てのZrについてステップ705の条件比較を終了したとき、キーワード選択部221は、全てのUqを選択したかどうかを確認し(ステップS709)、まだであればq=q+1として次のキーワード候補Uqをキーワード候補記憶部34から読み出して処理を続行し(ステップS710)、全て確認済みであればキーワード選択処理を終了する。
【0161】
図13は最終的に得られたキーワード候補記憶部の内容を示す図である。
【0162】
再び図4のフローチャートに戻ると、キーワード選択部221は、辞書記憶部35の位置・サイズ記憶域351に記憶されたサイズと文字列記憶部33の文字列サイズとを比較照合し、同一サイズの文字列領域を見つける(ステップS8)。見つからなければ、照合結果として、出力装置4に該当なしとの結果を出力する(ステップS9)。
【0163】
ここでは、図2の「払込票」が登録してあるので、文字列記憶部33の図13の示す文字列番号3のサイズ(MW2,MH2)に一致する文字列情報と辞書を選択する。
【0164】
キーワード類似度照合部222は、キーワード選択部221で選択した文字列の画像から特徴を抽出し、キーワード選択部221で選択した文字列の画像から抽出した特徴と、対応する辞書記憶部35の照合用特徴記憶域352に記憶している特徴を照合して、類似度を計算する。類似度は単純類似度等の方法で算出してもよい。
【0165】
キーワード類似度照合部222は、最も類似度が高いと判定された特徴を持つ辞書と関連付けられた帳票識別コードを出力装置4に出力する。また、予め記憶されている帳票でないと判断されるときは、その旨を出力装置4に出力する。出力装置4はステップS7によって得られた識別コードを出力する。予め記憶されている帳票でないと判断されるときは、その旨を出力する(ステップS9)。
【0166】
以上で、帳票識別が終了し、図4のフローチャートの処理を終了する。
【0167】
上述の通り本発明は、文字列を横方向に文字が並んだものとの前提で説明したが、縦と横、高さと幅を読み替えることにより、縦書きの文字列にも適用することができる。
【0168】
また、データ処理装置2は、プログラムを記録するメモリと、プログラムの制御をおこなうCPU(Central Prosseing Unit)で構成され、記憶装置3はデータを記憶するメモリとで構成されるコンピュータシステムである。データ処理装置2のキーワード候補検出部21やキーワード照合部22はCPUがプログラムを実行することによって実現されていてもよい。
【0169】
【発明の効果】
以上説明したように、本発明の帳票識別装置及びその識別方法は、辞書によらずに予め文字列を切出してから文字列の照合を行うので、キーワードの位置が変動しても正しいキーワードの位置を見つけ出し、帳票を高精度に識別することができるという効果を有している。
【0170】
また、キーワードと異なる高さの文字列がキーワードと同一行に隣接して存在しても、正しいキーワード位置を見つけ出し帳票を高精度に識別できるという効果を有している。
【0171】
さらにまた、帳票識別を行うために辞書にキーワードが登録してある帳票数が増加しても、帳票の高精度性を損なうことなく高速に識別することができるという効果を有している。
【図面の簡単な説明】
【図1】本発明の帳票識別装置の一つの実施の形態を示すブロック図である。
【図2】辞書に登録する帳票の一例を示す図である。
【図3】帳票識別に使用する帳票の一例を示す図である。
【図4】本発明の帳票識別装置の動作を示すフローチャートである。
【図5】ラベリング後のラベル画像を示す図である。
【図6】図4の図形成分分類処理の動作を示すフローチャートである。
【図7】フラグRを付加したラベル画像を示す図である。
【図8】フラグRを付加した図形成分情報記憶域を示す図である。
【図9】図4の文字列候補検出処理の動作を示すフローチャートである。
【図10】文字列を検出した後の文字列記憶部を示す図である。
【図11】図4の文字列分割処理の動作を示すフローチャートである。
【図12】図4のキーワード選択処理の動作を示すフローチャートである。
【図13】最終的に得られたキーワード候補記憶部の内容を示す図である。
【符号の説明】
1  画像入力装置
2  データ処理装置
3  記憶装置
4  出力装置
21  キーワード候補検出部
22  キーワード照合部
31  画像記憶部
32  ラベル情報記憶部
33  文字列記憶部
34  キーワード候補記憶部
35  辞書記憶部
211  ラベリング処理部
212  図形成分結合部
213  図形成分分類部
214  文字列検出部
215  文字列分離部
221  キーワード選択部
222  キーワード類似度照合部
321  ラベル画像記憶域
322  図形成分情報記憶域
351  位置・サイズ記憶域
352  照合用特徴記憶域

Claims (11)

  1. 帳票の画像を取り込む画像入力装置と;
    この画像入力装置によって取り込まれた帳票の画像を記憶し、ラベル付けされた図形成分の情報を記憶し、文字列の座標、サイズ、この文字列に含まれる全ての図形成分を記憶し、キーワード候補の位置及びサイズを記憶し、予め識別させたい帳票の登録番号、キーワードとなる文字列の位置、サイズ、照合のための特徴情報を記憶する記憶装置と;
    前記画像からキーワードの候補となる文字列の検出を行い、検出されたキーワード候補と辞書とを照合して帳票を識別し、記憶されている帳票の画像に対しラベリングを行い、ラベリングの結果得られた図形成分を結合し、この図形成分を前記文字列の候補から除外し、ラベリング結果から検出した文字列を分割してキーワード候補を見つけ、記憶している文字列サイズと文字サイズ情報が一致する文字列を選択し、この文字列の画像と前記辞書とを照合することで類似度を計算するデータ処理装置と;
    照合結果により前記辞書に記憶されている識別情報を出力する出力装置と;
    を備えたことを特徴とする帳票識別装置。
  2. 前記データ処理装置は、
    前記画像からキーワードの候補となる文字列の検出を行うキーワード候補検出部と、検出されたキーワード候補と辞書を照合して帳票を識別するキーワード照合部とを有し、
    前記キーワード候補検出部は、
    記憶されている帳票の画像に対しラベリングを行うラベリング処理部と、ラベリングの結果得られた図形成分を結合する図形成分結合部と、前記図形成分を文字列候補から除外する図形成分分類部と、ラベリング結果から文字列を検出する文字列検出部と、検出した文字列を分割してキーワード候補を見つける文字列分離部とを備え、
    前記キーワード照合部は、
    記憶している文字列サイズと文字サイズ情報が一致する文字列を選択するキーワード選択部と、文字列の画像と辞書を照合することで類似度を計算するキーワード類似度照合部とを備えたことを特徴とする請求項1記載の帳票識別装置。
  3. 前記記憶装置は、
    前記画像入力装置によって取り込まれた帳票の画像を記憶する画像記憶部と、前記ラベル付けされた図形成分の情報を記憶するラベル情報記憶部と、前記文字列の座標、サイズ、この文字列に含まれる全ての図形成分を記憶する文字列記憶部と、前記キーワード候補の位置及びサイズを記憶するキーワード候補記憶部と、前記予め識別させたい帳票の登録番号、キーワードとなる文字列の位置、サイズ、照合のための特徴情報を記憶する辞書記憶部とを有していることを特徴とする請求項1又は請求項2記載の帳票識別装置。
  4. 前記ラベル情報記憶部は、
    前記キーワード候補検出部が有する前記ラベリング処理部及び前記図形成分結合部によって得られたラベル画像を記憶するラベル画像記憶域と、前記ラベリング処理部及び前記図形成分結合部によってラベル付けされた図形成分の情報を記憶する図形成分情報記憶域とを有していることを特徴とする請求項3記載の帳票識別装置。
  5. 前記辞書記憶部は、
    帳票に記載されている文字列の外接矩形座標、サイズ及び位置許容範囲が記憶される位置・サイズ記憶域と、前記帳票に記載されている前記文字列の照合用画像特徴が記憶される照合用特徴記憶域とを有していることを特徴とする請求項3又は請求項4記載の帳票識別装置。
  6. 前記図形成分結合部は、
    前記記憶装置の前記ラベル画像記憶域の各図形成分について、図形成分を1画素広げる膨張処理と図形成分を1画素縮める収縮処理を行い、前記膨張処理をn(nは以上の整数)回実行した後で、前記収縮処理をn回実行し近隣の図形成分を結合することを特徴とする請求項2記載の帳票識別装置。
  7. 前記図形成分分類部は、
    前記図形成分情報記憶域に記憶されている各図形成分のサイズ情報を順番に読み込み、各図形成分の縦幅とキーワードよりも高さが大きな図形成分を分類するための閾値とを比較し、前記図形成分の縦幅が前記閾値より大きいとき、前記図形成分は文字列ではない成分であるとして、前記ラベル画像記憶域と前記図形成分情報記憶域の該当する図形成分に除外を示すフラグを付加し、それ以外の図形成分と区別することを特徴とする請求項2記載の帳票識別装置。
  8. 前記文字列記憶部は、文字列の座標とサイズ及びこの文字列に含まれる全ての図形成分を記憶することを特徴とする請求項3記載の帳票識別装置。
  9. 前記キーワード候補記憶部は、キーワード候補の位置とサイズを記憶することを特徴とする請求項3記載の帳票識別装置。
  10. 帳票から取り込んだ画像データを記憶する画像記憶手段と、
    この画像記憶手段に記憶されている画像データに対してラベリングを行うラベリング処理手段と、
    ラベリング処理の結果得られたラベル画像上の図形成分のうち、近接したものを結合する図形成分結合手段と、
    前記図形成分を文字列候補から除外する図形成分分類手段と、
    前記ラベル画像と前記図形成分をもとに同じ縦位置及び同じ高さの図形成分を抜き出し、この図形成分を全て含む隣接最小矩形を文字列候補とする文字列検出手段と、
    文字列情報を検索し、文字列内に文字列を分離するのに十分な空白部分や罫線情報をもとに文字列を分離する文字列分離手段と、
    前記文字列情報と辞書上の文字列サイズを比較し、前記辞書上の文字列サイズと一致する文字列情報を選択するキーワード選択手段と、
    選択された文字列の位置・サイズ情報をもとに前記画像記憶手段によって記憶された画像データから文字列の特徴を抽出し、該当する辞書内の特徴量と照合するキーワード照合手段と、
    ラベリングした結果のラベル画像およびラベル付けされた図形成分を記憶するラベル情報記憶手段と、
    文字列候補として検出された位置・サイズ・図形成分の文字列情報を記憶する文字列情報記憶手段と、
    前記キーワード候補の位置及びサイズを記憶するキーワード候補記憶手段と、
    前記帳票に記載された文字列が取るべきサイズ、前記文字列が持つべき特徴情報及び前記文字列を含む帳票が、識別されるために必要な識別情報を記憶する辞書記憶手段と、
    前記キーワード照合手段による照合結果に従い、前記辞書に記憶されている識別情報を出力する出力手段と、
    を備えたことを特徴とする帳票識別装置。
  11. 帳票に記載された文字列が取るべきサイズと、前記文字列が持つべき特徴情報と、前記文字列を含む帳票が識別されるために必要な識別情報を記憶する辞書を有するコンピュータシステムであって、
    画像入力装置から帳票の画像を取り込み画像データをメモリに記憶させる画像記憶ステップと;
    前記メモリに記憶された画像データに対してラベリング処理を行うラベリングステップと;
    前記ラベリング処理の結果得られたラベル画像上の図形成分のうち、近接した図形を結合する図形成分結合ステップと;
    図形成分結合処理の結果得られた図形成分のサイズをもとに、文字列に含まれるには不適切な図形成分と文字列に含まれるかもしれない図形成分とを分類する図形成分分類ステップと;
    前記図形成分の縦方向位置と高さの情報をもとに文字列の候補を検出する文字列検出ステップと;
    前記文字列候補内の空白部分や罫線の図形成分をもとに文字列を分離する文字列分離ステップと;
    前記文字列情報と前記辞書上の文字列サイズを比較し、辞書上の文字列サイズと一致する文字列情報を選択する選択ステップと;
    選択された文字列の位置・サイズ情報をもとに記憶された画像データから文字列の特徴を抽出し、該当する辞書内の特徴量と照合する照合ステップと;
    前記照合ステップによる照合結果に従い、前記辞書に記憶されている識別情報を出力する情報出力ステップと;
    を備えたことを特徴とする帳票識別方法。
JP2002186956A 2002-06-26 2002-06-26 帳票識別装置及びその識別方法 Expired - Fee Related JP4221960B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002186956A JP4221960B2 (ja) 2002-06-26 2002-06-26 帳票識別装置及びその識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002186956A JP4221960B2 (ja) 2002-06-26 2002-06-26 帳票識別装置及びその識別方法

Publications (2)

Publication Number Publication Date
JP2004030340A true JP2004030340A (ja) 2004-01-29
JP4221960B2 JP4221960B2 (ja) 2009-02-12

Family

ID=31182134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002186956A Expired - Fee Related JP4221960B2 (ja) 2002-06-26 2002-06-26 帳票識別装置及びその識別方法

Country Status (1)

Country Link
JP (1) JP4221960B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014238773A (ja) * 2013-06-10 2014-12-18 富士通フロンテック株式会社 文字認識装置、文字認識方法、および文字認識プログラム
CN111353419A (zh) * 2020-02-26 2020-06-30 北京百度网讯科技有限公司 图像比对方法、装置、电子设备及存储介质
CN114328831A (zh) * 2021-12-24 2022-04-12 江苏银承网络科技股份有限公司 票据信息识别与纠错方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014238773A (ja) * 2013-06-10 2014-12-18 富士通フロンテック株式会社 文字認識装置、文字認識方法、および文字認識プログラム
CN111353419A (zh) * 2020-02-26 2020-06-30 北京百度网讯科技有限公司 图像比对方法、装置、电子设备及存储介质
CN111353419B (zh) * 2020-02-26 2023-08-11 北京百度网讯科技有限公司 图像比对方法、装置、电子设备及存储介质
CN114328831A (zh) * 2021-12-24 2022-04-12 江苏银承网络科技股份有限公司 票据信息识别与纠错方法及装置

Also Published As

Publication number Publication date
JP4221960B2 (ja) 2009-02-12

Similar Documents

Publication Publication Date Title
CN109543501B (zh) 图像处理装置、图像处理方法和存储介质
JP6143111B2 (ja) 物体識別装置、物体識別方法、及びプログラム
KR100390264B1 (ko) 폼처리중자동페이지등록및자동영역검출을위한시스템및방법
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH07200745A (ja) 少なくとも二つのイメージセクションの比較方法
JP6278276B2 (ja) 物体識別装置、物体識別方法、及びプログラム
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JPH08171614A (ja) 文字列読み取り装置
JP2010055142A (ja) 文書処理装置およびプログラム
US7680329B2 (en) Character recognition apparatus and character recognition method
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JP4140221B2 (ja) 画像照合装置および画像照合プログラム
CN112287763A (zh) 图像处理方法、装置、设备及介质
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP3957471B2 (ja) 分離文字列統合装置
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP2009087378A (ja) 帳票処理装置
JP2002170079A (ja) 文書書式識別装置および識別方法
JP4521377B2 (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2008186399A (ja) 文字認識装置
JPH07319880A (ja) キーワード抽出・検索装置
JP3620299B2 (ja) 文書ファイリング装置及び文書ファイリング方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050307

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050518

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070119

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081028

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081110

R150 Certificate of patent or registration of utility model

Ref document number: 4221960

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121128

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121128

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131128

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees