JP3096481B2 - 帳票類の種類判別方法 - Google Patents

帳票類の種類判別方法

Info

Publication number
JP3096481B2
JP3096481B2 JP03050497A JP5049791A JP3096481B2 JP 3096481 B2 JP3096481 B2 JP 3096481B2 JP 03050497 A JP03050497 A JP 03050497A JP 5049791 A JP5049791 A JP 5049791A JP 3096481 B2 JP3096481 B2 JP 3096481B2
Authority
JP
Japan
Prior art keywords
pattern
ruled line
extracted
area
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03050497A
Other languages
English (en)
Other versions
JPH04268685A (ja
Inventor
泰生 藤田
Original Assignee
グローリー工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グローリー工業株式会社 filed Critical グローリー工業株式会社
Priority to JP03050497A priority Critical patent/JP3096481B2/ja
Publication of JPH04268685A publication Critical patent/JPH04268685A/ja
Application granted granted Critical
Publication of JP3096481B2 publication Critical patent/JP3096481B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、表形式の複数の帳票類
を読取る場合において、帳票の種類判別を行なう帳票類
の種類判別方法に関する。
【0002】
【従来の技術】従来、表を含む帳票類を対象とする光学
式文字読取装置において文字読取りを行なう場合、上記
帳票類には文字記入位置を示す読取り枠が縦、横の罫線
等で印刷されている。光学式文字読取装置は、帳票を光
学的に走査して得られる帳票画像から読取り枠位置にお
いて文字パターンの検出、切出しを行ない、切出した文
字パターンについて文字認識処理を行ない、帳票に記入
された文字を読取るように構成されている。このとき、
読取り枠の位置情報はそれぞれの帳票について予め光学
式読取装置内に設定される。そして、読取り枠位置が異
なる複数種類の帳票が読取りの対象となる場合、帳票を
同定するためのバーコード又は番号(帳票識別マーク)
領域を帳票に設け、この領域内のバーコード又は番号を
読取って帳票の種類を判別し、帳票の種類に応じた読取
り枠位置情報を用いて文字読取処理を行なっている。
【0003】
【発明が解決しようとする課題】しかしながら従来の方
法では、文字読取り枠の構造が異なる複数種類の帳票を
混在させて文字読取処理を行なう場合には、各帳票に帳
票の種類を判別するためのバーコード又は番号領域を帳
票に設ける必要があった。そして、複数種類の帳票を混
在させて読取処理を行なう場合は、この領域が設けてあ
る帳票のみが対象であり、この領域の位置が帳票毎に異
なっている場合や、バーコード又は番号領域を設けてい
ない帳票を読取り対象にする場合には種類判別の処理が
困難であった。
【0004】本発明はこのような点に着目して成された
ものであり、このような領域の異なる帳票が混在してい
る場合やこのような領域の設けられていない帳票であっ
ても、安定して帳票の種類判別を行ない得るように帳票
類の表を形成する罫線情報を基に帳票類の種類を判別す
る方法を提供することを目的としている。
【0005】
【課題を解決するための手段】本発明は帳票類の種類判
別方法に関するもので、本発明の上記目的は、被認識帳
票類の画像情報を入力し、この入力された画像データか
ら水平、垂直方向の線分を抽出し、抽出された各線分の
位置、長さ、方向の情報を検出し、前記入力された画像
を複数エリアに区分し、この区分されたエリア毎に存在
する前記抽出された線分の方向毎の長さ毎の重みである
特徴量を被認識対象のパターン特徴量として求め、認識
すべきパターンの基準となる標準パターンの特徴量を予
め記憶しておき、前記抽出された被認識パターンの特徴
量と前記記憶されている標準パターンの特徴量とを比較
照合し、その比較結果に基づいて前記被認識パターンが
どの標準パターンであるかを判断して帳票の種類を判別
することによって達成される。
【0006】また、被認識帳票類の画像情報を入力し、
この入力された画像データから水平、垂直方向の線分を
抽出し、抽出された各線分の位置、長さ、方向の情報を
検出し、前記入力された画像を複数エリアに区分し、こ
の区分されたエリア毎に存在する前記抽出された線分の
方向毎の長さ毎の重みである特徴量を被認識対象のパタ
ーン特徴量として求め、認識すべきパターンの基準とな
る標準パターンの特徴量を予め記憶しておき、前記抽出
された被認識パターンの特徴量と前記記憶されている標
準パターンの特徴量とを比較照合し、所定値以上類似す
るものを類似する順に候補として抽出し、候補として抽
出された標準パターンの予め定められた特定領域に対応
する入力画像情報を検出して、前記標準パターンのもの
と一致するかを前記候補順に確認することによって帳票
の種類を判別することによって達成される。
【0007】
【作用】本発明は、バーコード又は番号(帳票識別マー
ク)領域の設けられていない帳票や、各々異なる位置に
設けられている帳票等の複数種類の帳票を混在させて文
字読取処理を行なう場合の、帳票の種類判別を行なうた
めの表形式パターン認識方法に関するもので、入力され
た帳票画像データから文字読取り枠を構成している表の
構成要素である水平、垂直の線分(罫線)を抽出して複
数エリアに区分し、区分されたエリア毎に抽出された線
分の方向、長さ、位置を用いてベクトルパターン化して
標準パターンの特徴ベクトルと比較照合するようにして
いる。また、請求項2の発明では、区分されたエリア毎
に抽出された線分の方向、長さ、位置を用いて、ベクト
ルパターン化したパターンベクトルと標準パターンの特
徴ベクトルとを比較照合して一旦候補を抽出し、候補順
に詳細確認を行なうようにしている。
【0008】
【実施例】図1は本発明の認識の対象である帳票の一例
を示しており、図2は本発明の認識アルゴリズムのフロ
ーチャートであり、このフローチャートを参照して認識
動作を説明する。
【0009】先ずイメージセンサ等の画像入力手段で帳
票の画像入力を行ない(ステップS1)、帳票のサイズ
を検出する(ステップS2)。帳票のサイズ検出は、入
力画像の濃淡レベルを用いて帳票のエッジを検出するこ
とによって行なう。次に画像データの前処理を行なう
が、この前処理は2値化及びスムージングを行なうこと
によって実行する(ステップS3)。2値画像のスムー
ジング処理は図3に示すように、注目画素2に対する8
近傍領域3での穴埋め処理又は孤立点除去処理を行なう
ことによって実行する。すなわち、黒画素を“1”、白
画素を“0”としたとき、穴埋め処理は、注目画素2が
“0”でかつ8近傍画素3の全てが“1”のとき、注目
画素2の値を“0”→“1”に変更する。また、孤立点
除去処理は、注目画素2が“1”でかつ8近傍画素3の
全てが“0”のとき、注目画素2の値を“1”→“0”
に変更する。
【0010】次に、前処理(2値化、スムージング)さ
れた画像に対して、黒画素が水平又は垂直方向に連続す
る数をカウントし、各画素にこの水平、垂直に黒画素が
連続する値(以下、ランレングスという)を求め、この
ランレングスを用いた罫線の抽出を行なうが(ステップ
S4)、この動作フローは図4に示すようになってお
り、図4を参照してその動作を説明する。
【0011】先ず横方向の罫線についての抽出について
説明すると、前処理された画像データから水平方向に連
続する直線を抽出して横ランレングスを検出する(ステ
ップS30)。そして、抽出された横ランレングスのう
ち極端に短いもの、例えば5mm未満のランレングスを
持つ画素はノイズとして無効データとし削除し、5mm
以上のランレングスを持つ画素は有効として取扱う横ラ
ンレングス画像の2値化を行なう(ステップS31)。
この画像データの様子を示すのが図5の(A)である。
次にこの画像データに基づいてつなぎ処理を行なう。つ
なぎ処理を具体的に説明すると、図5の(A)の画像デ
ータの横方向のヒストグラムである横方向周辺分布特徴
を図5の(B)のように求め(ステップS32)、周辺
分布特徴の高さがしきい値TH1を超える部分を罫線候
補位置とする(ステップS33)。図5の(A)、
(B)においては、罫線候補位置X、Y、Zの3つの候
補が抽出されている。そして、各々の罫線候補位置毎に
その候補領域内の縦方向のヒストグラムである縦方向周
辺分布を求める(ステップS34)。図5の(A)の罫
線候補位置Yについて縦方向周辺分布を求めた様子を示
すのが図5の(C)である。図5の(D)に示すよう
に、この縦方向周辺分布をしきい値TH2(例えばTH
2=1画素)で比較し、しきい値TH2を超える部分を
有効とする。この有効線分の間隔が所定値TH3(例え
ばTH3=5画素)以下の場合はつなぎ処理を施し、つ
ながった一つの直線として取扱って画像入力データの罫
線の補正を行なう。図1の帳票について、この処理を行
なった様子を示すのが図6の(A)である。なお、ここ
で図5の(D)に示すような各横罫線区間での縦周辺分
布特徴の値の平均値を、その罫線の幅としておく。線幅
は文字読取領域を画像より切出すときに、線で囲まれた
領域の内側のみを切出す時の情報として用いる。縦方向
の罫線についても同様な処理により縦罫線を求めること
ができる。図4のステップS20〜S25が縦罫線の抽
出を示している。図1の帳票について縦罫線を抽出した
様子を示すのが図6の(B)であり、罫線の抽出を終了
したときの様子を示すのが図6の(C)である。
【0012】上述のようなランレングスを用いた罫線の
抽出後、画像より抽出された罫線の各々について縦横罫
線情報(位置(始終点座標)、長さ、方向(縦、横))
を求める(ステップS40)。以上の段階で画像入力デ
ータに修正が加えられ、罫線の抽出及び抽出された各罫
線についての情報が確実に検出されたことになる。以
下、この縦横罫線情報を基に処理を実行する。
【0013】次に上記縦横罫線情報に基づいて帳票のパ
ターンベクトルを求める(図2のステップS5)。パタ
ーンベクトルについては後に詳述するが、ここでその概
略を述べておくと、パターンベクトルは図7に示されて
いるようなもので、P[m][n][t][w](但し、mは縦
方向のエリア番号(1〜M)、nは横方向のエリア番号
(1〜N)、wは罫線の長さのレベル(1〜W)、tは
罫線の方向でt=1が横方向、t=2が縦方向)で表わさ
れ、M×N×W×2次元ベクトルである。つまり、M×
Nの各エリアについて、縦、横それぞれの罫線が、罫線
の長さのレベル(短いものから長いものまでをW段階で
量子化し表現している)毎に含まれている度合い(以
下、重みという)、すなわち、長さ毎の重みを表現して
いる。図8がこのパターンベクトルPを求める動作を示
すフローチャートであり、先ず初期化されたパターンベ
クトルに、各罫線ki(但し、iは罫線番号)毎に、罫
線の始点(Xsi,Ysi)、終点(Xei,Ye
i)、長さLiに基づいて、罫線kiが含まれているそ
れぞれのエリアの罫線kiの長さのレベルにおいて、罫
線kiによる重みを求め、順次加算することによりパタ
ーンベクトルPを求める。
【0014】以下、パターンベクトルを求める動作を図
8に従って具体的に説明する。
【0015】先ず図9のように入力帳票4をM×Nのエ
リアに区分する(ステップS50)。次にパターンベク
トルを初期化し(ステップS51)、全ての罫線が処理
済か否かを判定する(ステップS52)。処理済でない
ときは未処理の罫線kiについて、その罫線kiの長さ
量子化レベルを求める(ステップS53)。長さ量子化
レベルとは、罫線の長さの程度をW段階で量子化して表
現するものである。量子化レベル数はレベル1〜WのW
段階で表わし、帳票の両端を結ぶ罫線のレベルがWにな
るように、横罫線は帳票幅のLで、縦罫線は帳票高さ
で規格化を行なっている。そして、罫線kiの長さ
をLiとすると、その罫線kiの長さ量子化レベルWi
は、次式により求まる
【0016】
【数1】 但し、横罫線のときa=L、縦罫線のときa=h
である。ceil[X]はXを下まわらない最小の整
数を示す。ここで、a/Wは長さ量子化レベルの1レ
ベル分に相当する長さとなる。
【0017】次に、罫線kiの存在するエリアを検出す
るために罫線の始点エリア、終点エリアを判定する(ス
テップS54、S55)。始点エリア、終点エリアの判
定は罫線情報として既に求められている始点(Xsi,
Ysi)、終点(Xei,Yei)の座標を用いて行な
う。先ず罫線の始点エリアの縦方向位置は、次式により
求まる。
【数2】 但し、横罫線のときy=(Ysi+Yei)/2、縦罫
線のときy=Ysi、hは帳票の高さ、Mは帳票の縦
方向のエリア区分数である。
【0018】ここで、h/Mは1エリアの高さに相当
する。また、横方向位置は次式により求まる。
【0019】
【数3】 但し、横罫線のときx=Xsi、縦罫線のときx=(X
si+Xei)/2、Lは帳票の幅、Nは帳票の横方
向のエリア区分数である。
【0020】ここで、L/Nは1エリアの幅に相当す
る。図10に示す罫線k1,k2の例では、罫線k1で
は始点エリアは(Ms1,Ns1)=(1,2)とし
て、罫線k2では、始点エリアは(Ms2,Ns2)=
(2,1)として求まる。
【0021】次に、罫線kiの終点エリアの縦方向位置
は次式により求まる。
【0022】
【数4】 但し、横罫線のときy=(Ysi+Yei)/2、縦罫
線のときy=Yeiまた、横方向位置は次式により求ま
る。
【0023】
【数5】 但し、横罫線のときx=Xei、縦罫線のときx=(X
si+Xei)/2図10に示す罫線k1,k2の例で
は、罫線k1では終点エリアは(Me1,Ne1)=
(1,2)として、罫線k2では終点エリアは(Me
2,Ne2)=(2,4)として求まる。
【0024】この段階で、罫線kiによりパターンベク
トルPが更新される要素の範囲が求まったことになる。
すなわち、罫線kiによりパターンベクトルPが更新さ
れる範囲はエリア(Msi,Nsi)から(Mei,N
ei)までの区間のエリアの、罫線kiの方向(横罫線
か縦罫線の種類)の、罫線kiの長さレベルWiに対応
する要素となる。例えば図10の罫線k1では、始点と
終点が同じエリア(1,2)で横方向罫線であるので、
パターンベクトルPの更新される要素は、P[Ms1]
[Ns1][1][W1](=P[1][2][1]
[W1])の1個である。図10の罫線k2の例では、
始点エリアと終点エリアが異なり複数のエリアにまたが
っており横罫線であるので、パターンベクトルPの更新
される要素は、P[Ms2][Ns2][1][W2]
からP[Me2][Ne2][1][W2]までの要
素、すなわちP[2][1][1][W2],P[2]
[2][1][W2],P[2][3][1][W
2],P[2][4][1][W2]の4個となる。な
お、パターンベクトルPが更新される重みについては後
述する。
【0025】次に罫線kiによりパターンベクトルPが
更新される重みを計算し、パターンベクトルPを更新す
る。罫線が1つのエリア内に入るとき(図10の罫線k
1の場合)と、複数のエリアにまたがるとき(図10の
罫線k2の場合)では、重みの更新の方法が異なるの
で、先ず罫線kiについて求めた始点エリアと終点エリ
アが一致するかを判定する(ステップS56)。同じエ
リアであるときは、罫線kiは1つのエリア内に入ると
判定して重み加算処理1(ステップS57)を行ない、
一致しないときは、罫線kiは複数のエリアにまたがる
と判定して重み加算処理2(ステップS58)を行なう
ことにより、パターンベクトルPの更新を行なう。重み
加算処理1及び重み加算処理2については後述する。こ
のようにして罫線kiによりパターンベクトルPを更新
し、順次全ての罫線により(ステップS59,S52)
パターンベクトルPを更新することにより、入力帳票の
持つ罫線情報をパターンベクトル化することができる。
【0026】次に重み加算処理1(図8のステップS5
7)の動作を説明する。この処理は図10の罫線k1の
例のように、1つのエリア内に存在している罫線による
パターンベクトルPの更新の処理を行うものである。1
本の罫線によりパターンベクトルPが更新される重みの
総和は常に“1”として規格化する。このことにより、
重み加算処理1で更新されるパターンベクトルの要素は
1個のみであるので、このときの重み更新量はa=1
となる。従って、罫線kiの始点エリア(Msi,Ns
i)と終点エリア(Mei,Nei)が等しく、罫線k
iが1つのエリア内に存在していると判定されたときの
パターンベクトルPの更新は、次の数6で行なわれる。
【0027】
【数6】P[Msi][Nsi][t][Wi] =P[Msi][Nsi][t][Wi]+a0 但し、横罫線のときt=1、縦罫線のときt=2、a0
=1 次に重み加算処理2の動作を説明する。この処理は、図
10の罫線k2の例のように複数のエリアにまたがって
存在している罫線によるパターンベクトルPの更新の処
理を行なうものである。重み加算処理1でも述べたよう
に、1本の罫線によりパターンベクトルPが更新される
重みの総和を常に“1”として規格化する。このことよ
り、重み加算処理2では、複数のエリアにまたがる罫線
のそれぞれのエリアに含まれている長さの罫線全体に対
する比率を、それぞれのエリアの重みの更新量とする。
これにより、パターンベクトルPが1本の罫線により更
新される重みの総和を全て“1”とすることができる。
図11がこの重み加算処理2の動作を示すフローチャー
トであり、以下、図11に従って具体的に説明する。
【0028】この重み加算処理2で扱う罫線は、図10
の罫線k2のように複数のエリアにまたがるものであ
る。先ず、始点エリアについて重みaを求める(ステ
ップS60)。罫線kiの始点エリアに含まれている部
分の長さの、罫線ki全体の長さに対する比率を重みと
して求める。具体的には罫線kiが横罫線の場合は数7
で、罫線kiが縦罫線の場合は数8で求まる。
【0029】
【数7】
【0030】
【数8】 数7及び数8共に分子第1項は始点から終点をみたとき
の始点エリアの境界座標であり、従って分子は罫線ki
の始点エリアに含まれている部分の長さであり、分母の
罫線kiの長さLiで規格化することにより、始点エリ
アに含まれている部分の長さの全体に対する比率が求め
られる。数7及び数8により求められた始点重みasi
を用いて、パターンベクトルの始点エリア部分を数9に
より更新する(ステップS61)。
【0031】
【数9】 P[Msi][Nsi][t][wi]=P[Msi][Nsi][t][w i]+asi 但し、横罫線のとき t=1 縦罫線のとき t=2 次に終点エリアについて重みaeiを求める(ステップ
S62)。始点エリア重みasiと同様に、罫線kiの
終点エリアに含まれている部分の長さの、罫線ki全体
の長さに対する比率を重みとして求める。具体的には罫
線kiが横罫線の場合は数10で、罫線kiが縦罫線の
場合は数11で求まる。
【0032】
【数10】
【0033】
【数11】 数10及び数11共に分子第2項は終点から始点をみた
ときの終点エリアの境界座標であり、従って分子は罫線
kiの終点エリアに含まれている部分の長さであり、分
母の罫線kiの長さLiで規格化することにより、終点
エリアに含まれている部分の長さの全体に対する比率が
求められる。数10及び数11により求められた終点重
みaeiを用いて、パターンベクトルの終点エリア部分
を数12により更新する(ステップ63)。
【0034】
【数12】 P[Mei][Nei][t][wi]=P[Mei][Nei][t][w i]+aei 但し、横罫線のとき t=1 縦罫線のとき t=2 次に、始点エリアと終点エリアに挟まれた部分のエリア
(以下、中間エリアという)についての重み更新を行な
う。先ず始点エリアと終点エリアが隣り合わせのエリア
かどうかを判定する(ステップS64)。始点エリアと
終点エリアが隣り合わせのエリアかどうかの判定は、横
罫線の場合は(Nsi+1)とNeiが等しいかどう
か、縦罫線の場合は(Msi+1)とMeiが等しいか
どうかで判定される。この判定の結果、始点エリアと終
点エリアが隣り合ったエリアと判定された場合は、中間
エリアはないとして罫線kiについての重み加算処理2
を終了する。また、隣り合っていないと判定された場合
は、中間エリアについて重みamiを求める(ステップ
S65)。始点エリア重みasi,終点エリア重みa
eiと同様に、罫線kiの中間エリア1つに含まれてい
る部分の長さの、罫線ki全体の長さに対する比率を重
みとして求める。具体的には罫線kiが横罫線の場合は
数13で罫線kiが横罫線の場合は数14で求まる。こ
こで中間エリア1つに含まれる罫線kiの長さは、その
エリアの大きさと等しくなるので、これで置きかえる
と、
【0035】
【数13】
【0036】
【数14】 である。数13及び数14共に分子は中間エリア1つを
横切るときの長さで、それは横罫線のときはエリアの幅
と等しく、縦罫線のときはエリアの高さと等しくなる。
これを罫線kiの長さLiで規格化することにより、中
間エリア1つに含まれている部分の長さの全体に対する
比率が求められる。数13及び数14により求められた
中間エリア重みamiを用いて、パターンベクトルの全
ての中間エリアの部分を横罫線の場合は数15により、
また縦罫線の場合は数16により更新する(ステップS
66)。横罫線の場合
【0037】
【数15】 P[Msi][n][1][wi]=P[Msi][n][1][wi]+a mi 但し、nは(Nsi+1)〜(Nei−1)の区間全て 縦罫線の場合
【0038】
【数16】 P[m][Nsi][2][wi]=P[m][Nsi][2][wi]+a mi 但し、mは(Msi+1)〜(Mei−1)の区間全て このようにして罫線kiによりパターンベクトルPの更
新が行なわれる。例えば図10に示す罫線k1によるパ
ターンベクトルPの更新は1要素のみで、P[1]
[2][1][w1]=P[1][2][1][w1]
+1となる。また罫線k2によるパターンベクトルPの
更新は4要素で
【0039】
【数17】 P[2][1][1][w2]=P[2][1][1][w2]+as2 P[2][2][1][w2]=P[2][2][1][w2]+am2 P[2][3][1][w2]=P[2][3][1][w2]+am2 P[2][4][1][w2]=P[2][4][1][w2]+ae2 となる。以上の処理動作(ステップS52〜59)を全
ての横罫線について行ない、その後全ての縦罫線につい
て行なうことにより入力帳票の罫線情報をパターンベク
トル化し、パターンベクトルPが求められる。
【0040】次に上述のようにして求めた認識対象帳票
のパターンベクトルPに基ずいて、その帳票の種類の識
別に移る。帳票の種類の識別は、先ず帳票のパターンベ
クトルPと、判別すべき複数種類の基本帳票の予め定め
られた標準パターンベクトルSx(但し、xは標準パタ
ーン番号)とを比較して距離計算をし、候補を決定する
(ステップS6)。距離計算は、パターンベクトルPと
標準パターンSとの間でシティブロック距離を用いた距
離計算を行なう。その距離dxは次式で求まる。
【0041】
【数18】 そして、距離dxが予め設定したしきい値以下になるも
のを全て帳票の候補とする。このとき距離の小さいもの
から順に並べておいて、詳細確認での優先順位とする。
詳細確認においては、距離判定で候補として選択された
帳票についてそれぞれ特定領域の解析と検定を行なう
(ステップS7)。このとき、距離判定での優先順位に
従った順番に解析、検定を行ない、満足する結果が得ら
れた時点で入力された帳票の種類を決定し、未処理のま
ま残された候補は破棄することにより、処理の効率化を
計る。
【0042】詳細確認ができれば最終候補を決定し(ス
テップS9)、帳票の種類が決定したことになる。詳細
確認ができなければ次の候補が有るか否かを判定し(ス
テップS10)、次の候補が有ればステップS7にリタ
ーンし、無ければリジェクトとなる。
【0043】ここで詳細確認を説明すると、詳細確認
は、標準帳票毎に特徴のある特定領域を予め定めてお
き、候補として挙がった標準帳票のその特定領域に相当
する領域を入力帳票画像から切出し、その領域域内の文
字や番号を読取って確認したり、又、切り出された領域
について濃淡パターンを読取って一致するかどうかを確
認する処理である。例えば図1に示す帳票の場合では詳
細確認用特定領域1内の文字を読取り、「振替伝票」と
書かれてあるか否かで詳細確認を行なう。そして、最終
的に帳票の種類が決定されると、その帳票の記載形式に
従ったその帳票の情報記入欄を切出し、その欄の内容を
読取り(ステップS11)、帳票の種類の判別及び読取
処理を終了する。
【0044】なお、上記実施例では入力画像の罫線の情
報により類似する帳票の候補を抽出して、その候補とし
て挙がった標準帳票の特定領域で詳細確認を行なってい
るが、この詳細確認を省略して候補の一番目のものと決
定してもよい。特に、特定領域として設けていない帳票
については詳細確認は不要である。
【0045】
【発明の効果】以上のように本願発明によれば帳票を形
成する罫線の情報を基にベクトルパターン化したパター
ンベクトルを求めて標準帳票のものと比較照合するよう
にしているので、帳票に種類番号やバーコードを付加し
ていないものであっても帳票の種類の判別を可能とする
ことができる。
【0046】又、一旦パターンベクトルと標準帳票のも
のと比較照合して候補を抽出し、候補順に候補として挙
がった帳票の一部を確認するようにしたので、確実に帳
票の種類を判別できる。しかも、このようにしたことに
より帳票毎に特徴領域や番号、バーコードの付されてい
る位置が異なっても、最終的に詳細確認の段階で行なう
のみで良く、通常最後に一回特定の場所を見るのみで良
く、種類判定可能とする帳票の特定領域の全てについて
確認する必要がなく、判別処理の高速化を実現できる。
【図面の簡単な説明】
【図1】本発明が対象とする帳票の一例を示す図であ
る。
【図2】本発明の動作例を示すフローチャートである。
【図3】スムージング処理を説明するための図である。
【図4】罫線抽出の動作例を示すフローチャートであ
る。
【図5】罫線抽出の動作を説明するための図である。
【図6】図1に示す帳票の処理結果を示す図である。
【図7】パターンベクトルを説明するための図である。
【図8】パターンベクトルを求める動作例を示すフロー
チャートである。
【図9】入力帳票をM×Nのエリアに区分する様子を示
す図である。
【図10】帳票上の罫線の例を示す図である。
【図11】重み加算処理の動作例を示すフローチャート
である。
【符号の説明】
1 特定領域 2 注目画素 3 8近傍画素 4 入力帳票 5 始点エリア 6 終点エリア

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 被認識帳票類の画像情報を入力し、この
    入力された画像データから水平、垂直方向の線分を抽出
    し、抽出された各線分の位置、長さ、方向の情報を検出
    し、前記入力された画像を複数エリアに区分し、この区
    分されたエリア毎に存在する前記抽出された線分の方向
    毎の長さ毎の重みである特徴量を被認識対象のパターン
    特徴量として求め、認識すべきパターンの基準となる標
    準パターンの特徴量を予め記憶しておき、前記抽出され
    た被認識パターンの特徴量と前記記憶されている標準パ
    ターンの特徴量とを比較照合し、その比較結果に基づい
    て前記被認識パターンがどの標準パターンであるかを判
    断して帳票の種類を判別することを特徴とする帳票類の
    種類判別方法。
  2. 【請求項2】 被認識帳票類の画像情報を入力し、この
    入力された画像データから水平、垂直方向の線分を抽出
    し、抽出された各線分の位置、長さ、方向の情報を検出
    し、前記入力された画像を複数エリアに区分し、この区
    分されたエリア毎に存在する前記抽出された線分の方向
    毎の長さ毎の重みである特徴量を被認識対象のパターン
    特徴量として求め、認識すべきパターンの基準となる標
    準パターンの特徴量を予め記憶しておき、前記抽出され
    た被認識パターンの特徴量と前記記憶されている標準パ
    ターンの特徴量とを比較照合し、所定値以上類似するも
    のを類似する順に候補として抽出し、候補として抽出さ
    れた標準パターンの予め定められた特定領域に対応する
    入力画像情報を検出して、前記標準パターンのものと一
    致するかを前記候補順に確認することによって帳票類の
    種類を判別することを特徴とする帳票類の種類判別方
    法。
JP03050497A 1991-02-22 1991-02-22 帳票類の種類判別方法 Expired - Fee Related JP3096481B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03050497A JP3096481B2 (ja) 1991-02-22 1991-02-22 帳票類の種類判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03050497A JP3096481B2 (ja) 1991-02-22 1991-02-22 帳票類の種類判別方法

Publications (2)

Publication Number Publication Date
JPH04268685A JPH04268685A (ja) 1992-09-24
JP3096481B2 true JP3096481B2 (ja) 2000-10-10

Family

ID=12860579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03050497A Expired - Fee Related JP3096481B2 (ja) 1991-02-22 1991-02-22 帳票類の種類判別方法

Country Status (1)

Country Link
JP (1) JP3096481B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3483919B2 (ja) * 1993-10-20 2004-01-06 株式会社日立製作所 伝票文書情報システム
JP3842006B2 (ja) 2000-03-30 2006-11-08 グローリー工業株式会社 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003030583A (ja) * 2001-07-11 2003-01-31 Oki Electric Ind Co Ltd 表種別識別方法および表種別識別装置、フォーマット種別識別方法およびフォーマット種別識別装置
CN103577817B (zh) * 2012-07-24 2017-03-01 阿里巴巴集团控股有限公司 表单识别方法与装置
JP6690089B2 (ja) * 2016-04-25 2020-04-28 富士通株式会社 帳票認識方法、帳票認識装置、及び帳票認識プログラム
US10452952B2 (en) * 2017-06-30 2019-10-22 Konica Minolta Laboratory U.S.A., Inc. Typesetness score for a table

Also Published As

Publication number Publication date
JPH04268685A (ja) 1992-09-24

Similar Documents

Publication Publication Date Title
EP0138445B1 (en) Method and apparatus for segmenting character images
CN110210477B (zh) 一种数字式仪表读数识别方法
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP7062722B2 (ja) 光学コードのモジュールサイズの特定
CN103198468A (zh) 图像处理装置、图像处理方法和图像处理系统
US20030127518A1 (en) System and method for identifying object information
CN114004858A (zh) 基于机器视觉识别航空线缆表面编码的方法及装置
JP3096481B2 (ja) 帳票類の種類判別方法
JP6144892B2 (ja) 画像処理装置、画像処理方法及びプログラム
JPH08305795A (ja) 文字認識方法
JP2898562B2 (ja) ナンバープレート決定方法
EP0651337A1 (en) Object recognizing method, its apparatus, and image processing method and its apparatus
CN102682308B (zh) 图像处理方法和图像处理设备
CN115376131A (zh) 一种点状编码标志的设计与识别方法
JP2985893B2 (ja) パターン認識装置
JPH02293989A (ja) 文字認識装置
JPH03232100A (ja) ナンバープレート読み取り装置
JP2872768B2 (ja) 文字切出し装置
US4607387A (en) Pattern check device
JP2946095B2 (ja) 線分抽出装置
JP2899383B2 (ja) 文字切出し装置
JPH10222602A (ja) 光学式文字読取装置
JPH02126105A (ja) 位置認識方法
JP3622347B2 (ja) 帳票認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees