JPH10222587A - 帳票類の自動判別方法及び装置 - Google Patents

帳票類の自動判別方法及び装置

Info

Publication number
JPH10222587A
JPH10222587A JP9025133A JP2513397A JPH10222587A JP H10222587 A JPH10222587 A JP H10222587A JP 9025133 A JP9025133 A JP 9025133A JP 2513397 A JP2513397 A JP 2513397A JP H10222587 A JPH10222587 A JP H10222587A
Authority
JP
Japan
Prior art keywords
image
ruled line
reference image
forms
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9025133A
Other languages
English (en)
Inventor
Hirotaka Tsubota
浩貴 坪田
Shoji Miki
章司 三木
Takeshi Nozaki
剛 野崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP9025133A priority Critical patent/JPH10222587A/ja
Publication of JPH10222587A publication Critical patent/JPH10222587A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】帳票類へ新たな情報を付加することなく、該帳
票類の種別を高速かつ効率的に安定して判別することが
できる帳票類の自動判別方法及び装置を提供すること。 【解決手段】基準帳票の特徴データを基準帳票ごとに辞
書17に登録しておき、画像入力部11が判別対象帳票
を読み取ったならば、罫線情報抽出部12が該判別対象
帳票の特徴領域内の罫線データに基づいて作成した罫線
2値画像と、あらかじめ辞書17に登録した各基準帳票
の特徴データとを用いて、類似度算定部14が各基準帳
票との類似度を算定し、この類似度に基づいて判別処理
部15が判別対象帳票の種別を判別する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、少なくとも罫線の
一部が異なる複数の帳票類の基準画像をあらかじめ保持
し、判別対象となる帳票類の入力画像が前記複数の帳票
類のいずれの基準画像と符合するかを自動判別する帳票
類の自動判別方法及び装置に関し、特に、帳票類へ新た
な情報を付加することなく、該帳票類の種別を高速かつ
効率的に判別することができる帳票類の自動判別方法及
び装置に関する。
【0002】
【従来の技術】従来、各種商品等の判別対象物の種別を
判別する際に、該判別対象物にバーコード情報や識別可
能なマークを施し、このバーコード情報等を読み取って
その種別を判別することが多い。
【0003】ところが、かかる判別技術では、判別対象
物の種別に対応するバーコード情報等が該判別対象物に
施されていることが前提となり、バーコード情報等が付
されていない物を判別対象物とはできない。
【0004】したがって、例えば銀行口座申込書のよう
に登録済みが多数存在する帳票に対して上記判別技術を
適用するには、登録済みの帳票全てにバーコード情報等
を付与するか、又は、各利用者がバーコード情報等を有
する帳票を用いて再度申込みを行わねばならないことか
ら、いずれにしても膨大な人的労力を要することにな
る。
【0005】このように、上記バーコード情報等を用い
る判別技術は、新旧が混在する帳票類へ適用することが
困難なため、最近では、各帳票に付された枠の形状等を
用いてかかる帳票類を自動判別する技術が登場してい
る。
【0006】例えば、特開平4−268685号公報に
は、入力された帳票画像データから文字読取り枠を構成
している表の水平、垂直の線分を抽出して複数エリアに
分割し、エリア毎に抽出された線分の方向、長さ、位置
を用いてベクトルパターン化して標準パターンの特徴ベ
クトルと比較照合する帳票類の種類判別方法が開示され
ている。
【0007】
【発明が解決しようとする課題】しかしながら、上記従
来技術は、各エリアに内在する線分をベクトルパターン
化する処理を全エリアに対して繰り返し行わねばならな
いため、判別指標たる特徴ベクトルを算出するまでに時
間を要する結果となる。
【0008】特に、膨大な数の帳票を取り扱うシステム
では、1帳票に要する時間が順次積み重なって結果的に
膨大な損失につながるため、いかに帳票を効率良く判別
するかが重要な課題となっている。
【0009】そこで、本発明では、上記課題を解決し、
帳票類へ新たな情報を付加することなく、該帳票類の種
別を高速かつ効率的に安定して判別することができる帳
票類の自動判別方法及び装置を提供することを目的とす
る。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、第1の発明は、少なくとも罫線の一部が異なる複数
の帳票類の基準画像をあらかじめ保持し、判別対象とな
る帳票類の入力画像が前記複数の帳票類のいずれの基準
画像と符合するかを自動判別する帳票類の自動判別方法
において、前記基準画像の所定の特徴領域に内在する罫
線データを示す罫線2値画像から該基準画像に対応する
特徴データを作成して辞書に記憶し、前記入力画像の所
定の特徴領域に内在する罫線データと、前記辞書に記憶
した特徴データとに基づいて前記入力画像と各基準画像
との類似度をそれぞれ算定して、算定した類似度の最も
大きな基準画像を前記入力画像に対応する基準画像とし
て判別することを特徴とする。
【0011】また、第2の発明は、前記特徴データは、
各基準画像に対応する罫線2値画像から、所定の行間隔
及び列間隔に位置し、かつ、罫線データのエッジをなす
黒画素の座標値及び黒画素数であることを特徴とする。
【0012】また、第3の発明は、少なくとも罫線の一
部が異なる複数の帳票類の基準画像をあらかじめ保持
し、判別対象となる帳票類の入力画像が前記複数の帳票
類のいずれの基準画像と符合するかを自動判別する帳票
類の自動判別方法において、前記基準画像を複数の小領
域に分割した各分割領域に内在する罫線データを示す罫
線2値画像から該基準画像にそれぞれ対応する特徴デー
タを作成して辞書に記憶し、該辞書に記憶した分割領域
ごとの特徴データに基づいて、一又は複数の特徴領域を
自動選択し、前記入力画像の特徴領域に内在する罫線デ
ータと、前記辞書に記憶した特徴データとに基づいて前
記入力画像と各基準画像との類似度をそれぞれ算定し
て、算定した類似度の最も大きな基準画像を前記入力画
像に対応する基準画像として判別することを特徴とす
る。
【0013】また、第4の発明は、少なくとも罫線の一
部が異なる複数の帳票類の基準画像をあらかじめ保持
し、判別対象となる帳票類の入力画像が前記複数の帳票
類のいずれの基準画像と符合するかを自動判別する帳票
類の自動判別装置において、前記基準画像又は入力画像
の所定の特徴領域に所在する罫線データに基づいて該基
準画像又は入力画像に対応する罫線2値画像を作成する
罫線2値画像作成手段と、前記罫線2値画像作成手段が
作成した基準画像の罫線2値画像に基づいて、該基準画
像に対応する特徴データを生成する特徴データ生成手段
と、前記特徴データ生成手段が生成した特徴データを基
準画像と対応づけて記憶する辞書と、前記罫線2値画像
作成手段が作成した入力画像に対応する罫線2値画像
と、前記辞書内に基準画像ごとに記憶した特徴データと
に基づいて、前記入力画像と各基準画像との類似度をそ
れぞれ算定し、算定した類似度の最も大きな基準画像を
前記入力画像に対応する基準画像として判別する判別手
段とを具備することを特徴とする。
【0014】また、第5の発明は、前記特徴データ生成
手段は、前記罫線2値画像作成手段が作成した基準画像
に対応する罫線2値画像から、所定の行間隔及び列間隔
に位置し、かつ、罫線データのエッジをなす黒画素の座
標値と黒画素数を有する特徴データを生成することを特
徴とする。
【0015】また、第6の発明は、少なくとも罫線の一
部が異なる複数の帳票類の基準画像をあらかじめ保持
し、判別対象となる帳票類の入力画像が前記複数の帳票
類のいずれの基準画像と符合するかを自動判別する帳票
類の自動判別装置において、前記基準画像を複数の小領
域に分割した分割領域又は前記入力画像の特徴領域に所
在する罫線データに基づいて該基準画像又は入力画像に
対応する罫線2値画像を作成する罫線2値画像作成手段
と、前記罫線2値画像作成手段が作成した基準画像の各
分割領域に対応する罫線2値画像に基づいて、該基準画
像の各分割領域にそれぞれ対応する特徴データを生成す
る特徴データ生成手段と、前記特徴データ生成手段が生
成した特徴データを基準画像と対応づけて記憶する辞書
と、前記辞書に記憶した分割領域ごとの特徴データに基
づいて、一又は複数の特徴領域を自動選択する特徴領域
選択手段と、前記罫線2値画像作成手段が作成した入力
画像に対応する罫線2値画像と、前記辞書内に基準画像
ごとに記憶した前記特徴領域に対応する特徴データとに
基づいて、前記入力画像と各基準画像との類似度をそれ
ぞれ算定し、算定した類似度の最も大きな基準画像を前
記入力画像に対応する基準画像として判別する判別手段
とを具備することを特徴とする。
【0016】
【発明の実施の形態】以下、第1の実施の形態について
図面を参照して説明する。
【0017】図1は、本実施の形態で用いる帳票判別装
置10の構成を示す機能ブロック図である。
【0018】図1に示す帳票判別装置10は、帳票判別
時に比較の対象として利用される帳票(以下「基準帳
票」と言う。)の特徴データを基準帳票ごとに辞書に登
録しておき、判別対象となる帳票(以下「判別対象帳
票」と言う。)を受け付けたならば、該判別対象帳票の
所定の小領域(以下「特徴領域」と言う。)内の罫線デ
ータに基づいて作成した罫線2値画像と、あらかじめ辞
書に登録した基準帳票の特徴データとを用いて、判別対
象帳票の種別を判別する。
【0019】すなわち、この帳票判別装置10には、基
準帳票の特徴データを辞書17に登録する辞書登録モー
ドと、判別対象帳票の種別を判別する判別モードという
2種類の動作モードからなり、これらのモード切替は、
図示しないスイッチ又はメニュー選択を用いて行われ
る。
【0020】具体的には、この辞書登録モードでは、基
準帳票を光学的に取り込んだ画像(以下「基準画像」と
言う。)の特徴領域を2値化して2値画像を作成した
後、この2値画像から縦方向又は横方向に所定画素数以
上のランレングスを持つ画素を取り出して罫線2値画像
を作成する。その後、この罫線2値画像を碁盤の目のよ
うに一定間隔で仕切り、仕切られた線上に位置するとと
もに、罫線のエッジをなす画素のみを取り出す間引き処
理を行った後に、この間引き画像に対応する特徴データ
を辞書17に登録する。
【0021】これに対して、判別モードでは、判別対象
帳票を光学的に取り込んだ画像(以下「判別対象画像」
と言う。)の特徴領域について、同様の手順で罫線2値
画像を作成し、作成した罫線2値画像と辞書17内の各
特徴データとの相互関係から類似度を算定し、算定した
類似度に基づいて判別対象帳票の種別を判別する。
【0022】次に、この帳票判別装置10の構成につい
て説明する。
【0023】図1に示すように、この帳票判別装置10
は、画像入力部11と、罫線情報抽出部12と、動作モ
ード切替部13と、類似度算定部14と、判別処理部1
5と、間引き処理部16と、辞書17とからなる。
【0024】なお、特許請求の範囲に記載した「罫線2
値画像作成手段」は罫線情報抽出部12に対応し、「特
徴データ生成手段」は間引き処理部16に対応し、「辞
書」は辞書17に対応し、「判別手段」は類似度算定部
14及び判別処理部15に対応する。
【0025】画像入力部11は、基準帳票又は判別対象
帳票を光学的に読み取り、読み取った基準画像又は判別
対象画像を罫線情報抽出部12に出力する入力デバイス
であり、例えばイメージリーダ等が該当する。
【0026】なお、基準帳票又は判別対象帳票は、別途
図示しない集積部から繰出しローラ等により1枚ずつ繰
り出され、ベルト、ローラ等の搬送手段によりこの画像
入力部上を搬送されるようになっている。
【0027】罫線情報抽出部12は、画像入力部11か
ら受け取った基準画像又は判別対象画像の特徴領域を2
値化した後、この2値画像から罫線縦方向又は横方向に
所定画素数以上のランレングスを持つ黒画素を抽出して
罫線2値画像を作成する。
【0028】このように、かかる画像入力部11及び罫
線情報抽出部12は、動作モードの如何を問わず動作す
る。
【0029】動作モード切替部13は、図示しないスイ
ッチ又はメニュー選択による動作モードの選択に応答し
て、罫線情報抽出部12から受け取った罫線2値画像を
類似度算定部14又は間引き処理部16のいずれか一方
に出力する切替部である。
【0030】具体的には、選択された動作モードが辞書
登録モードであるならば、該罫線2値画像を間引き処理
部16に出力し、また、動作モードが判別モードである
ならば、該罫線2値画像を類似度算定部14に出力す
る。
【0031】類似度算定部14は、判別対象帳票と各基
準帳票との類似度をそれぞれ算定する処理部であり、具
体的には、判別対象画像の罫線2値画像と各基準画像に
対応する特徴データすなわち間引き画像との間で後述す
るマッチングをとり、そのマッチング度合いを類似度と
して算定する。
【0032】判別処理部15は、類似度算定部14が算
定した類似度に基づいて判別対象画像の種類がいずれの
基準画像に合致するかを判別する。
【0033】間引き処理部16は、動作モード切替部1
3から受け取った罫線2値画像を碁盤の目のように一定
間隔で仕切り、仕切られた線上に存在する黒画素のみを
取り出した後に、この黒画素のうち罫線のエッジ部分に
相当する黒画素の座標値及び黒画素数を特徴データとし
て辞書17に登録する処理部である。
【0034】このため、この辞書17には、実質的に各
基準画像にそれぞれ対応する間引き画像が基準帳票に対
応づけて記憶されることになる。
【0035】このように、この帳票識別装置10では、
登録モードを選択して、各基準帳票に対応する間引き画
像すなわち特徴データをあらかじめ辞書17に登録して
おき、判別対象画像の判別を行う際には、該判別対象画
像の罫線2値画像と各間引き画像のマッチング度合いに
基づいて帳票の種別を判別する。
【0036】なお、かかる間引き画像及び罫線2値画像
は、帳票の画像データ全体について作成されるのではな
く、画像データの特徴領域についてのみ作成されるの
で、高速かつ効率良く判別を行うことができる。
【0037】次に、本実施の形態で用いる基準帳票につ
いて説明する。
【0038】図2は、本実施の形態で用いる3種類の基
準帳票を示す図であり、同図(a)は、A銀行で使用す
る預金口座振替依頼書(以下「基準帳票a」と言う。)
を示し、同図(b)は、A銀行の融資申込書(以下「基
準帳票b」と言う。)を示し、同図(c)は、A銀行の
総合口座申込書(以下「基準帳票c」と言う。)を示し
ている。
【0039】なお、各基準帳票a〜cには、実際には罫
線のみならず各種文字が印刷されることとなるが、本実
施の形態では罫線のみに着目する処理を行っているた
め、説明の便宜上、印刷文字の表示を省略している。
【0040】このように、基準帳票a〜cに印刷される
罫線は、極めて多種多様であり、同じ銀行であっても帳
票の種類によって印刷される罫線が異なり、また、同種
帳票であっても銀行が違えば印刷される罫線が異なる。
【0041】このため、本実施の形態では、基準帳票a
〜cの特徴領域に印刷された罫線の違いに着目して判別
を行っている。なお、本実施の形態では、この特徴領域
を各基準帳票a〜cの右下に斜線で示した小領域として
いる。
【0042】次に、図1に示す帳票判別装置10の辞書
登録モード時の処理手順について説明する。
【0043】図3は、図1に示す帳票判別装置10の辞
書登録モード時の処理手順を示すフローチャートであ
る。なお、ここでは図2(a)に示す基準帳票aを辞書
登録するものとする。
【0044】図3に示すように、辞書登録モード時に
は、まず最初に画像入力部11から基準帳票aの画像入
力を行い(ステップ301)、当該基準画像の基本原点
を抽出する(ステップ302)。
【0045】ここで、この基本原点とは、基準画像の4
隅の原点から定めた代表1点をいい、具体的には、基準
画像の濃淡レベルを用いて基準画像の縦横2対のエッジ
を検出し、それぞれ直線近似された2直線の交点を基本
原点として求める。
【0046】すなわち、かかる基本原点が決まらない
と、基準画像中の特徴領域を特定することができないた
め、まず最初に基本原点を求めている。
【0047】そして、この基本原点からの相対量に基づ
いて特徴領域を特定して、該特徴領域を2値化し(ステ
ップ303)、この2値画像から縦方向又は横方向に所
定のランレングスを持つ画素列を罫線情報として抽出し
て罫線2値画像を作成する(ステップ304)。
【0048】その後、間引き処理部16が、この罫線2
値画像から後述する間引き処理を行って間引き画像を作
成し(ステップ305)、該間引き画像に対応する特徴
データを基準画像に対応づけて辞書17に登録する(ス
テップ306)。
【0049】すなわち、本実施の形態では、この間引き
画像そのものを辞書17に登録するのではなく、該間引
き画像の黒画素の座標値と黒画素数を辞書登録すること
により、辞書17のメモリ効率を向上させている。
【0050】次に、図1に示す罫線情報抽出部12が行
う罫線情報抽出処理について具体的に説明する。
【0051】図4は、図1に示す罫線情報抽出部12
が、図2に示す基準帳票a〜cの罫線2値画像をそれぞ
れ作成する概念を示す図である。
【0052】図4(a)は、基準帳票aの特徴領域の2
値画像から罫線2値画像を作成する要領を示しており、
具体的には、黒画素が縦方向に所定画素数連続する画素
列を、基準帳票aの特徴領域を2値化した2値画像から
抽出する。
【0053】すなわち、所定のランレングスに達しない
直線をノイズとして除去しつつ、該特徴領域に含まれる
縦方向の罫線を抽出する。なお、ある直線の終点と他の
直線の始点との距離が短い場合には、これらを統合す
る。
【0054】そして、横罫線を同様の手順で基準帳票a
の特徴領域から抽出し、得られた縦罫線の2値画像及び
横罫線の2値画像を重ね合わせることにより、該基準帳
票aに対応する罫線2値画像を作成する。
【0055】図4(b)は、基準帳票bの特徴領域の2
値画像から罫線2値画像を作成する要領を示しており、
また、同図(c)は、基準帳票cの特徴領域の2値画像
から罫線2値画像を作成する要領を示している。
【0056】すなわち、これらの罫線2値画像を作成す
る場合にも、上記基準帳票aの場合と同様のものとな
る。
【0057】次に、図1に示す間引き処理部16が行う
間引き処理について具体的に説明する。
【0058】図5は、図1に示す間引き処理部16が行
う間引き処理の概念を示す図である。
【0059】図5(a)は、図2に示す基準帳票aの特
徴領域に対応する罫線2値画像から間引き画像を作成す
る過程を示しており、同図に示すように、まず罫線2値
画像を碁盤の目のように区切り線で一定間隔に区切り、
この区切り線上に位置する画素のうち、罫線のエッジを
なす黒画素のみを用いて間引き画像を作成する。
【0060】具体的には、求められた罫線2値画像を碁
盤の目のように一定間隔に区切り、その各線上の点にお
いて1(黒画素)から0(白画素)に変化する点、また
は、0(白画素)から1(黒画素)に変化する点の座標
値(x,y)とその個数を間引き画像とする。
【0061】また、図5(b)及び(c)は、図2に示
す基準帳票b及びcから間引き画像を作成する過程を示
しており、上記基準帳票aの場合と同様にして、間引き
画像を作成する。
【0062】このように、各基準帳票の罫線2値画像自
体を辞書登録の対象とするのではなく、かかる間引き画
像を辞書登録の対象とした理由は、判別対象帳票とのマ
ッチングを行う際の処理回数を低減し、処理の高速化及
び効率化を図るためである。
【0063】なお、辞書17には、メモリの有効利用を
図るために、間引き画像そのものではなく、該間引き画
像の黒画素の座標値と黒画素数が登録される。
【0064】以上、図1に示す帳票判別装置10の登録
モードの処理と、該登録モードで動作する機能部につい
て説明した。
【0065】次に、図1に示す帳票判別装置10の判別
モード時の処理手順等について説明する。
【0066】図6は、図1に示す帳票判別装置10の判
別モード時の処理手順を示すフローチャートである。
【0067】図6に示すように、登録モード時と同様
に、まず最初に画像入力部11から判別対象帳票の画像
入力を行い(ステップ601)、当該判別対象画像の基
本原点を抽出する(ステップ602)。
【0068】そして、この基本原点からの相対量に基づ
いて特徴領域を特定して、該特徴領域を2値化し(ステ
ップ603)、この2値画像から縦方向又は横方向に所
定のランレングスを持つ画素列を罫線情報として抽出し
て罫線2値画像を作成する(ステップ604)。
【0069】その後、この罫線2値画像とあらかじめ辞
書17に登録した後述する間引き画像とのマッチングを
行って、判別対象帳票と各基準帳票との類似度を算定し
(ステップ605)、算定した類似度に基づいて判別対
象帳票の種別を判別する(ステップ606)。
【0070】次に、図1に示す類似度算定部14の類似
度算定処理について具体的に説明する。なお、辞書17
内には、上記手順で作成した基準帳票a〜cの間引き画
像に対応する特徴データが格納済みであるものとする。
【0071】図7は、図1に示す類似度算定部14の類
似度算定処理の概念を示す図であり、ここでは、基準帳
票aに所定事項を記入した帳票を判別対象帳票とし、こ
の判別対象帳票と基準帳票aとの類似度を算定する場合
を示している。
【0072】同図に示すように、この判別対象帳票の罫
線2値画像70と、間引き画像71との類似度を算定す
るにあたっては、まず最初に間引き画像71のある黒画
素の座標に対応する罫線2値画像70の画素を特定し、
該画素を中心とした3×3の近傍画素(以下「8近傍」
と言う。)の画素値を調べる。
【0073】そして、この8近傍の画素の少なくとも1
つが黒画素であれば、少なくともこの黒画素に関しては
両画像がマッチしているとみなす。このように、8近傍
を調べることとした理由は、画像が少し傾いて入力され
た場合や印刷ずれが生じた場合などに対応できるように
するためである。
【0074】かかる比較及び得点加算処理を、間引き画
像の全黒画素について繰り返すと、判別対象帳票70と
間引き画像71との間の得点が算定できる。ただし、間
引き画像の黒画素数は基準帳票の種別ごとに異なるた
め、間引き画像の全黒画素数で除算することにより正規
化する。
【0075】上記処理を数式で表すと、 類似度 S=CNT/CNTS*100 CNT :加算総得点数 CNTS:間引き画像の黒画素数 となる。
【0076】すなわち、間引き画像71の黒画素に対応
する罫線2値画像70上の画素の8近傍に黒画素があれ
ば、その黒画素に対して得点を与え、同様に間引き画像
の各黒画素について調べる。
【0077】そして、この総得点がCNT(加算総得点
数)となるため、該CNTを間引き画像の黒画素数CN
TSで除算して正規化することにより、罫線2値画像7
0と間引き画像71との類似度が算出される。なお、こ
の類似度が大きいほど、類似する蓋然性が高いことにな
る。
【0078】次に、図1に示す判別処理部15の判別処
理について具体的に説明する。ただし、ここでは、判別
対象帳票と基準帳票aとの類似度がS1とし、判別対象
帳票と基準帳票bとの類似度がS2(S1>S2)と
し、判別対象帳票と基準帳票cとの類似度がS3(S
1,S2>S3)とする。
【0079】この判別処理部15では、受け取った3つ
の類似度のうち、最も大きな類似度(S1)と2番目に
大きな類似度(S2)を選び、このS1が所定のしきい
値TH1を越えているかを調べる。
【0080】S1 > TH1 またS1とS2の差が、所定のしきい値TH2を越えて
いるか否かを調べる。
【0081】S1−S2> TH2 そして、いずれの条件をも満たしている場合には、判別
対象帳票がこのS1の類似度を持つ基準帳票aであると
判別し、それ以外の場合には、「該当なし」としてリジ
ェクトする。
【0082】上述してきたように、第1の実施の形態で
は、基準帳票の特徴データを基準帳票ごとに辞書に登録
しておき、判別対象帳票を受け付けたならば、該判別対
象帳票の特徴領域内の罫線データに基づいて作成した罫
線2値画像と、あらかじめ辞書に登録した基準帳票の特
徴データとを用いて、判別対象帳票の種別を判別するよ
う構成したので、下記に示す効果が得られる。
【0083】1)帳票に対してバーコード等の新たな情
報を付加しなくとも、帳票の種別を判別することができ
る。
【0084】2)帳票の種別を高速かつ効率的に判別す
ることができる。
【0085】3)ノイズの影響を除去しつつ、安定した
判別を行うことができる。
【0086】以上、第1の実施の形態について説明し
た。
【0087】ところで、上記第1の実施の形態では、各
帳票の右下の小領域を特徴領域として選択する場合を示
したが、かかる右下の小領域の罫線が互いに類似する基
準帳票が存在する場合には、他の小領域を特徴領域とし
て選択する必要がある。
【0088】この際、この特徴領域を人手を介して設定
していたのでは、特徴領域の選定に要する人的負担が極
めて大きく、また、新たな基準帳票が追加登録される都
度、この選定作業のやり直しが必要となる。
【0089】加えて、かかる特徴領域の選択を誤ると、
帳票の判別精度を低下する原因となるため、最適な特徴
領域をいかにして自動選択するかが重要となる。
【0090】そこで、以下では、最適な特徴領域を自動
選択する第2の実施の形態について説明する。
【0091】図8は、第2の実施の形態で用いる帳票判
別装置80の構成を示すブロック図である。
【0092】図8に示す帳票判別装置80は、図1に示
す帳票判別装置10と同様の構成に、特徴領域を自動選
択する特徴領域選択部81を付加した構成となるが、上
記帳票判別装置10と辞書登録モードの処理が異なる。
【0093】このため、まず最初に、本帳票判別装置8
0の辞書登録モードについて説明すると、この帳票判別
装置80では、図1に示す帳票判別装置10のように基
準画像のある小領域に関する処理を行うだけでなく、図
9に示すM種類の基準画像をN個に分割した各分割領域
に関する特徴データの登録処理を行う。
【0094】すなわち、辞書85内には、M種類の無記
入の基準帳票をそれぞれN個の小領域に分割した分割領
域ごとに特徴データを格納しておき、特徴領域選択部8
1がかかる辞書85を用いて特徴領域を自動選択するこ
とになる。なお、各分割領域の特徴データ作成手順につ
いては帳票判別装置10と同様のものとなる。
【0095】特徴領域選択部81は、判別対象となる特
徴領域を辞書85の内容に基づいて自動選択し、選択し
た特徴領域を罫線情報抽出部82、類似度算定部83及
び判別処理部84に出力する処理部である。
【0096】すなわち、この辞書85には、M種類の基
準帳票についてNパターンの特徴データが格納されてい
るため、特徴領域選択部81では、かかるNパターンの
特徴データを用いて基準帳票相互間の類似度を各パター
ンごとに求め、全ての基準帳票を区別可能な分割領域が
存在すれば、該分割領域を特徴領域として選択する。な
お、この類似度の算定に際しては、類似度算定部83を
使用するものとする。
【0097】また、全ての基準帳票を1つの分割領域で
区別できない場合には、できるだけ多くの基準帳票を区
別できる分割領域を最も優先度の高い(以下「ランク
1」と言う。)特徴領域として選択するとともに、この
ランク1の特徴領域で区別できない基準帳票をさらに区
別するために、2番目の優先度(以下「ランク2」と言
う。)の特徴領域を選択する。同様に、各基準帳票を全
て区別できるまで、ランク3〜ランクrまでの特徴領域
を選択する。
【0098】そして、この特徴領域選択部81が選択し
たランク1〜ランクrの各特徴領域に対応する分割領域
の識別子は、罫線情報抽出部82、類似度算定部83及
び判別処理部84に出力される。判別モードにおける罫
線2値画像の作成、類似度判定及び判別処理に必要とな
るからである。
【0099】次に、図8に示す特徴領域選択部81の処
理手順について説明する。
【0100】図10は、図8に示す特徴領域選択部81
の処理手順を示すフローチャートである。ただし、M種
類の基準画像をN個に分割した分割領域ごとの特徴デー
タは、すでに辞書85に登録済みであるとする。
【0101】図10に示すように、まず最初に、特徴領
域のランクを示す変数iに’1’を代入した後(ステッ
プ1001)、各分割領域が区別できる基準帳票数をそ
れぞれ算出する(ステップ1002)。
【0102】具体的には、各分割領域について作成され
た特徴データを用いて、基準帳票相互間の類似度を求め
た後に、自分自身との類似度を除いた他の基準帳票との
類似度が基準値TH3(TH3はTH1より十分小さい
値)以下であれば区別可能とし、基準値TH3を越える
場合には区別不能とする。
【0103】次に、求めた分割領域ごとの区分可能な基
準帳票数が最大となる分割領域を求める(ステップ10
03)。
【0104】なお、ある分割領域と他の分割領域の判別
可能枚数が同じ時には、次式に示す複雑度Cが最大とな
るものを特徴領域として選択する。ただし、CNTS
は、辞書における座標個数を意味するものとする。
【0105】 上式から明らかなように、この複雑度Cは、基準帳票の
分割領域内に縦横罫線が多いほど大きくなる値である。
【0106】そして、求めた分割領域をランクiの特徴
領域として選択し(ステップ1004)、このランクi
の特徴領域を用いた場合としても区別できない基準帳票
が存在するか否かを確認し(ステップ1005)、区別
できない基準帳票が存在する場合には、変数iをインク
リメントした後に(ステップ1006)、区別できない
基準帳票をセットして(ステップ1007)、ステップ
1002に移行し、全ての基準帳票を区別できるまで同
様の処理を繰り返す。
【0107】上記一連の処理を行うことにより、特徴領
域の自動選定を行うことが可能となり、また、この特徴
領域を罫線情報抽出部82等に通知することにより、罫
線情報抽出部82等の処理対象が特定されることにな
る。
【0108】次に、図8に示す判別処理部84の判別処
理について説明する。
【0109】図11は、図8に示す判別処理部84の判
別処理の概念を示す図であり、同図に示すように、ここ
ではランク1の特徴領域Jとランク2の特徴領域Sとを
用いて、判別対象帳票の種別を判別する場合を示してい
る。
【0110】まず最初に、図8に示す類似度算定部83
では、判別対象帳票と基準帳票1〜基準帳票kとの類似
度を算定する際には特徴領域Jを使用し、また判別対象
帳票と基準帳票t〜基準帳票Mとの類似度を算定する際
には特徴領域Jを使用する。
【0111】このため、判別処理部84は、判別対象帳
票と基準帳票1〜基準帳票kとの特徴領域Jに係わる類
似度と、判別対象帳票と基準帳票t〜基準帳票Mとの特
徴領域Sに係わる類似度とを入手できることになる。
【0112】ここで、上記特徴領域Jは、すでに説明し
たように、できるだけ多くの基準帳票を区別できるよう
に選択された分割領域であるため、この特徴領域Jを使
用する基準帳票1〜基準帳票kの中に、判別条件を満た
す基準帳票が存在するか否かを確認する。
【0113】そして、判別条件を満たす基準帳票が存在
しない場合には、さらに特徴領域Sを使用する基準帳票
t〜基準帳票Mの中に、判別条件を満たす基準帳票が存
在するか否かを確認する。
【0114】このように、特徴領域のランクが高い特徴
領域から順次判別処理を行うことにより、判別条件を満
たす基準帳票に迅速に到達することができる。
【0115】なお、かかる判別条件とは、第1の実施の
形態で説明したものと同様のものであり、具体的には、
最も大きな類似度がしきい値TH1を越えており、か
つ、2番目の類似度との差がしきい値TH2を越えてい
ることが条件となる。
【0116】上述してきたように、第2の実施の形態で
は、あらかじめ辞書登録モードにおいて各基準帳票の分
割領域ごとの特徴データを辞書85に登録するととも
に、特徴領域81が辞書85の特徴データを用いて特徴
領域を自動選択するよう構成したので、下記に示す効果
が得られる。
【0117】1)特徴領域の選定を高速に行うことがで
きる。
【0118】2)特徴領域の選定に係わる人的労力の負
担をなくすことができる。
【0119】3)新たな基準帳票の登録に容易に対応す
ることができる。
【0120】なお、上記第1及び第2の実施の形態で
は、各基準帳票の大きさが全て同一の場合を示したが、
大きさの異なる帳票を判別する場合は、予め帳票の大き
さ毎に辞書を構築しておき、判別時には、大きさを第1
のフィルターとして使用し、該当する大きさを持つ基準
帳票のみを比較対象とすることにより、さらに高速な判
別処理を行うことが可能となる。
【0121】また、本実施の形態では、銀行で使用され
る預金口座振替依頼書、融資申込書及び総合口座申込書
という帳票を判別する場合を示したが、本発明はこれに
限定されるものではなく、契約書、各種申込書、小切
手、商品券等種々の帳票類の判別に適用することができ
る。
【0122】
【発明の効果】以上詳細に説明したように、本発明は、
基準画像の所定の特徴領域に内在する罫線データを示す
罫線2値画像から該基準画像に対応する特徴データを作
成して辞書に記憶し、入力画像の所定の特徴領域に内在
する罫線データと、前記辞書に記憶した特徴データとに
基づいて入力画像と各基準画像との類似度をそれぞれ算
定して、算定した類似度の最も大きな基準画像を前記入
力画像に対応する基準画像として判別するよう構成した
ので、下記に示す効果が得られる。
【0123】1)帳票に対してバーコード等の新たな情
報を付加しなくとも、帳票の種別を判別することが可能
となる。
【0124】2)帳票の種別を高速かつ効率的に判別す
ることが可能となる。
【0125】3)ノイズの影響を除去しつつ、安定した
判別を行うことが可能となる。
【0126】4)帳票に記載されている印鑑部、署名欄
等の切出し対象領域のイメージのみを切り出してデータ
ベース化し、デジタルイメージを容易に編集することが
可能となる。
【0127】また、本発明は、特徴データは、各基準画
像に対応する罫線2値画像から、所定の行間隔及び列間
隔に位置し、かつ、罫線データのエッジをなす黒画素の
みの座標値及び黒画素数とするよう構成したので、さら
に下記に示す効果が得られる。
【0128】1)辞書に記憶べきデータ量を低減するこ
とが可能となる。
【0129】2)類似度を高速に算定することが可能と
なる。
【0130】また、本発明は、基準画像を複数の小領域
に分割した各分割領域に内在する罫線データを示す罫線
2値画像から該基準画像にそれぞれ対応する特徴データ
を作成して辞書に記憶し、該辞書に記憶した分割領域ご
との特徴データに基づいて、一又は複数の特徴領域を自
動選択し、入力画像の特徴領域に内在する罫線データ
と、辞書に記憶した特徴データとに基づいて入力画像と
各基準画像との類似度をそれぞれ算定して、算定した類
似度の最も大きな基準画像を入力画像に対応する基準画
像として判別するよう構成したので、さらに下記に示す
効果が得られる。
【0131】1)特徴領域の選定を高速に行うことがで
きる。
【0132】2)特徴領域の選定に係わる人的労力の負
担をなくすことができる。
【0133】3)新たな基準帳票の登録に容易に対応す
ることができる。
【図面の簡単な説明】
【図1】第1の実施の形態で用いる帳票判別装置の構成
を示す機能ブロック図。
【図2】第1の実施の形態で用いる3種類の基準帳票を
示す図。
【図3】図1に示す帳票判別装置の辞書登録モード時の
処理手順を示すフローチャート。
【図4】図1に示す罫線情報抽出部が、図2に示す基準
帳票a〜cの罫線2値画像をそれぞれ作成する概念図。
【図5】図1に示す間引き処理部が行う間引き処理の概
念図。
【図6】図1に示す帳票判別装置の判別モード時の処理
手順を示すフローチャート。
【図7】図1に示す類似度算定部の類似度算定処理の概
念図。
【図8】第2の実施の形態で用いる帳票判別装置の構成
を示すブロック図。
【図9】第2の実施の形態で用いる基準帳票の種類と分
割領域を示す図。
【図10】図8に示す特徴領域選択部の処理手順を示す
フローチャート。
【図11】図8に示す判別処理部84の判別処理の概念
を示す図。
【符号の説明】
10…帳票判別装置、 11…画像入力部、 12…罫
線情報抽出部、13…動作モード切替部、 14…類似
度算定部、15…判別処理部、 16…間引き処理部、
17…辞書、80…帳票判別装置、 81…特徴領域
選択部、 82…罫線情報抽出部、83…類似度算定
部、 84…判別処理部、 85…辞書

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも罫線の一部が異なる複数の帳
    票類の基準画像をあらかじめ保持し、判別対象となる帳
    票類の入力画像が前記複数の帳票類のいずれの基準画像
    と符合するかを自動判別する帳票類の自動判別方法にお
    いて、 前記基準画像の所定の特徴領域に内在する罫線データを
    示す罫線2値画像から該基準画像に対応する特徴データ
    を作成して辞書に記憶し、 前記入力画像の所定の特徴領域に内在する罫線データ
    と、前記辞書に記憶した特徴データとに基づいて前記入
    力画像と各基準画像との類似度をそれぞれ算定して、算
    定した類似度の最も大きな基準画像を前記入力画像に対
    応する基準画像として判別することを特徴とする帳票類
    の自動判別方法。
  2. 【請求項2】 前記特徴データは、 各基準画像に対応する罫線2値画像から、所定の行間隔
    及び列間隔に位置し、かつ、罫線データのエッジをなす
    黒画素の座標値及び黒画素数であることを特徴とする請
    求項1記載の帳票類の自動判別方法。
  3. 【請求項3】 少なくとも罫線の一部が異なる複数の帳
    票類の基準画像をあらかじめ保持し、判別対象となる帳
    票類の入力画像が前記複数の帳票類のいずれの基準画像
    と符合するかを自動判別する帳票類の自動判別方法にお
    いて、 前記基準画像を複数の小領域に分割した各分割領域に内
    在する罫線データを示す罫線2値画像から該基準画像に
    それぞれ対応する特徴データを作成して辞書に記憶し、 該辞書に記憶した分割領域ごとの特徴データに基づい
    て、一又は複数の特徴領域を自動選択し、 前記入力画像の特徴領域に内在する罫線データと、前記
    辞書に記憶した特徴データとに基づいて前記入力画像と
    各基準画像との類似度をそれぞれ算定して、算定した類
    似度の最も大きな基準画像を前記入力画像に対応する基
    準画像として判別することを特徴とする帳票類の自動判
    別方法。
  4. 【請求項4】 少なくとも罫線の一部が異なる複数の帳
    票類の基準画像をあらかじめ保持し、判別対象となる帳
    票類の入力画像が前記複数の帳票類のいずれの基準画像
    と符合するかを自動判別する帳票類の自動判別装置にお
    いて、 前記基準画像又は入力画像の所定の特徴領域に所在する
    罫線データに基づいて該基準画像又は入力画像に対応す
    る罫線2値画像を作成する罫線2値画像作成手段と、 前記罫線2値画像作成手段が作成した基準画像の罫線2
    値画像に基づいて、該基準画像に対応する特徴データを
    生成する特徴データ生成手段と、 前記特徴データ生成手段が生成した特徴データを基準画
    像と対応づけて記憶する辞書と、 前記罫線2値画像作成手段が作成した入力画像に対応す
    る罫線2値画像と、前記辞書内に基準画像ごとに記憶し
    た特徴データとに基づいて、前記入力画像と各基準画像
    との類似度をそれぞれ算定し、算定した類似度の最も大
    きな基準画像を前記入力画像に対応する基準画像として
    判別する判別手段とを具備することを特徴とする帳票類
    の自動判別装置。
  5. 【請求項5】 前記特徴データ生成手段は、 前記罫線2値画像作成手段が作成した基準画像に対応す
    る罫線2値画像から、所定の行間隔及び列間隔に位置
    し、かつ、罫線データのエッジをなす黒画素の座標値と
    黒画素数を有する特徴データを生成することを特徴とす
    る請求項4記載の帳票類の自動判別装置。
  6. 【請求項6】 少なくとも罫線の一部が異なる複数の帳
    票類の基準画像をあらかじめ保持し、判別対象となる帳
    票類の入力画像が前記複数の帳票類のいずれの基準画像
    と符合するかを自動判別する帳票類の自動判別装置にお
    いて、 前記基準画像を複数の小領域に分割した分割領域又は前
    記入力画像の特徴領域に所在する罫線データに基づいて
    該基準画像又は入力画像に対応する罫線2値画像を作成
    する罫線2値画像作成手段と、 前記罫線2値画像作成手段が作成した基準画像の各分割
    領域に対応する罫線2値画像に基づいて、該基準画像の
    各分割領域にそれぞれ対応する特徴データを生成する特
    徴データ生成手段と、 前記特徴データ生成手段が生成した特徴データを基準画
    像と対応づけて記憶する辞書と、 前記辞書に記憶した分割領域ごとの特徴データに基づい
    て、一又は複数の特徴領域を自動選択する特徴領域選択
    手段と、 前記罫線2値画像作成手段が作成した入力画像に対応す
    る罫線2値画像と、前記辞書内に基準画像ごとに記憶し
    た前記特徴領域に対応する特徴データとに基づいて、前
    記入力画像と各基準画像との類似度をそれぞれ算定し、
    算定した類似度の最も大きな基準画像を前記入力画像に
    対応する基準画像として判別する判別手段とを具備する
    ことを特徴とする帳票類の自動判別装置。
JP9025133A 1997-02-07 1997-02-07 帳票類の自動判別方法及び装置 Pending JPH10222587A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9025133A JPH10222587A (ja) 1997-02-07 1997-02-07 帳票類の自動判別方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9025133A JPH10222587A (ja) 1997-02-07 1997-02-07 帳票類の自動判別方法及び装置

Publications (1)

Publication Number Publication Date
JPH10222587A true JPH10222587A (ja) 1998-08-21

Family

ID=12157477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9025133A Pending JPH10222587A (ja) 1997-02-07 1997-02-07 帳票類の自動判別方法及び装置

Country Status (1)

Country Link
JP (1) JPH10222587A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139484A (ja) * 2002-10-21 2004-05-13 Hitachi Ltd 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2007179307A (ja) * 2005-12-28 2007-07-12 Hitachi Computer Peripherals Co Ltd 帳票識別装置
JP2010165296A (ja) * 2009-01-19 2010-07-29 Ricoh Co Ltd 画像処理装置、類似度算出方法、類似度算出プログラムおよび記録媒体
JP2012208729A (ja) * 2011-03-30 2012-10-25 Fujitsu Ltd 帳票管理システム、帳票画像管理方法、及びプログラム
JP2014016921A (ja) * 2012-07-11 2014-01-30 Glory Ltd 帳票種類判別装置および帳票種類判別方法
WO2020044537A1 (ja) * 2018-08-31 2020-03-05 株式会社Pfu 画像照合装置、画像照合方法、及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139484A (ja) * 2002-10-21 2004-05-13 Hitachi Ltd 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2007179307A (ja) * 2005-12-28 2007-07-12 Hitachi Computer Peripherals Co Ltd 帳票識別装置
JP2010165296A (ja) * 2009-01-19 2010-07-29 Ricoh Co Ltd 画像処理装置、類似度算出方法、類似度算出プログラムおよび記録媒体
JP2012208729A (ja) * 2011-03-30 2012-10-25 Fujitsu Ltd 帳票管理システム、帳票画像管理方法、及びプログラム
JP2014016921A (ja) * 2012-07-11 2014-01-30 Glory Ltd 帳票種類判別装置および帳票種類判別方法
WO2020044537A1 (ja) * 2018-08-31 2020-03-05 株式会社Pfu 画像照合装置、画像照合方法、及びプログラム

Similar Documents

Publication Publication Date Title
US7440618B2 (en) Apparatus for extracting rules line from multiple-valued image
da Silva et al. Automatic discrimination between printed and handwritten text in documents
CN112507782A (zh) 文本图像的识别方法及装置
JP6628336B2 (ja) 情報処理システム
JP5011508B2 (ja) 文字列認識方法及び文字列認識装置
JP6144892B2 (ja) 画像処理装置、画像処理方法及びプログラム
JPH10222587A (ja) 帳票類の自動判別方法及び装置
JP2023156991A (ja) 情報処理システム
JP4543675B2 (ja) 文字・図形の認識方法
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP3923474B2 (ja) 文字読み取り装置
JP6890849B2 (ja) 情報処理システム
JP4116597B2 (ja) バーコード認識装置、バーコード認識方法およびバーコード認識プログラム。
Hobby Using shape and layout information to find signatures, text, and graphics
JP4864574B2 (ja) 帳票処理装置
JP3022459B2 (ja) 帳票識別登録装置
CN114202761B (zh) 一种基于图片信息聚类的信息批量提取方法
JP4231476B2 (ja) 容器の印刷物又は貼付ラベルを入力した入力画像と予め登録してあるマスタ画像を照合する画像処理方法
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP2004280530A (ja) 帳票処理システム及び帳票処理方法
JP2023130540A (ja) 情報処理システム
JP2007156764A (ja) 図形検出処理プログラム及び紙葉処理装置
JPH0573718A (ja) 領域属性識別方式
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP2975067B2 (ja) 文字の認識方法