JP2000123174A - 帳票書式識別装置 - Google Patents

帳票書式識別装置

Info

Publication number
JP2000123174A
JP2000123174A JP10294745A JP29474598A JP2000123174A JP 2000123174 A JP2000123174 A JP 2000123174A JP 10294745 A JP10294745 A JP 10294745A JP 29474598 A JP29474598 A JP 29474598A JP 2000123174 A JP2000123174 A JP 2000123174A
Authority
JP
Japan
Prior art keywords
ruled line
ruled
interval
unit
structure information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10294745A
Other languages
English (en)
Inventor
Toshio Niwa
寿男 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10294745A priority Critical patent/JP2000123174A/ja
Publication of JP2000123174A publication Critical patent/JP2000123174A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 多種類の登録帳票に対して、効率良く帳票書
式を識別すること。 【解決手段】 予め登録された帳票の罫線構造情報を帳
票罫線構造情報データベース5に格納しておく。帳票画
像入力部1から帳票画像Vが入力されると、罫線抽出部
2は帳票画像Vから罫線を抽出する。次に罫線長さ分布
演算部3は、罫線の長さ分布を演算し、その特徴を罫線
長さ分布照合部4に与える。罫線長さ分布照合部4は帳
票罫線構造情報データベース5に保持された罫線長さ分
布との照合を行い、評価の高い候補帳票を抽出して候補
帳票の数を絞り込む。罫線構造照合部6は、一定領域内
に含まれる罫線の罫線間隔を照合し、その照合結果から
帳票画像の伸縮率を推定する。そして伸縮率に合せて罫
線間隔を正規化して照合を行い、帳票書式を識別する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票の書式を識別
する帳票書式識別装置に関するものである。
【0002】
【従来の技術】帳票の書式には多種類のものがある。多
種類の帳票を同時に扱う場合、帳票画像がどの帳票の書
式であるかを識別してから帳票認識をする。図4は従来
の帳票書式識別装置の全体構成図である。帳票画像入力
部51は、スキャナやファクシミリなどであり、認識対
象となる帳票を光学読取素子で走査し、帳票画像Vに変
換する。罫線抽出部52は、帳票画像Vから罫線を抽出
する。帳票罫線構造情報データベース54は予め登録さ
れた帳票書式の罫線構造をデータベースとして保持して
いる。罫線構造照合部53は、罫線抽出部52で抽出さ
れた罫線構造と、帳票罫線構造情報データベース54に
登録されている罫線構造とを照合して、帳票画像Vが、
予め登録された帳票の中のどの帳票書式であるかを識別
する。ここでの識別結果は識別結果出力部55を介して
出力される。以上のようにして、帳票画像Vがどの帳票
書式であるかが識別される。
【0003】
【発明が解決しようとする課題】しかしながら、登録帳
票の種類が多くなると、罫線構造の照合の処理時間も長
くなってしまうという問題点があった。また入力された
帳票画像が、縦方向又は横方向に伸縮していた場合、帳
票書式を正しく識別できないという問題点もあった。
【0004】本発明は、このような従来の問題点に鑑み
てなされたものであって、登録帳票の種類が多くても、
短い処理時間で帳票が識別できる帳票書式識別装置を実
現することを目的とする。また、帳票画像が伸縮してい
ても、帳票書式を正しく識別できる帳票書式識別装置を
実現することを目的とする。
【0005】
【課題を解決するための手段】本発明は上記目的を達成
するために、本願の請求項1の発明は、帳票画像を入力
して、帳票中の罫線を抽出する罫線抽出部と、前記罫線
抽出部で抽出された罫線に対し、罫線長さ分布を求める
罫線長さ分布演算部と、予め登録された帳票書式に対
し、罫線長さ分布、罫線間隔、罫線位置を含む罫線構造
情報を格納する帳票罫線構造情報データベースと、前記
帳票罫線構造情報データベースに格納された登録帳票の
罫線長さ分布と前記罫線長さ分布演算部で求められた罫
線長さ分布とを照合し、照合結果に基づいて候補帳票を
選択する罫線長さ分布照合部と、前記帳票罫線構造情報
データベースに格納された登録帳票の罫線構造と前記罫
線抽出部で抽出された罫線とを照合し、入力帳票画像が
登録された帳票書式中のどの書式であるかを識別する罫
線構造照合部と、を具備することを特徴とするものであ
る。
【0006】本願の請求項2の発明は、請求項1の帳票
書式識別装置において、前記罫線構造照合部は、入力帳
票画像において罫線の間隔及び罫線の位置を求める罫線
間隔演算部と、前記帳票罫線構造情報データベースに格
納された罫線間隔及び罫線位置と前記罫線間隔演算部で
求められた罫線間隔及び罫線位置とを照合し、入力帳票
画像が登録された帳票書式中のどの書式であるかを識別
する罫線間隔照合部と、を有することを特徴とするもの
である。
【0007】本願の請求項3の発明は、請求項1の帳票
書式識別装置において、前記罫線構造照合部は、入力帳
票画像において罫線の間隔及び罫線の位置を求める罫線
間隔演算部と、前記帳票罫線構造情報データベースに格
納された罫線間隔と前記罫線間隔演算部で求められた一
定領域内の罫線間隔とを照合する領域内罫線間隔照合部
と、前記領域内罫線間隔照合部の照合結果から、入力帳
票画像の伸縮率を推定して、罫線間隔及び罫線位置を正
規化する罫線間隔正規化部と、前記帳票罫線構造情報デ
ータベースに格納された罫線間隔及び罫線位置と前記罫
線間隔正規化部で求められた罫線間隔及び罫線位置とを
照合し、入力帳票画像が登録された帳票書式中のどの書
式であるかを識別する罫線間隔照合部と、を有すること
を特徴とするものである。
【0008】本願の請求項4の発明は、帳票画像を入力
して、帳票中の罫線を抽出する罫線抽出部と、前記罫線
抽出部で抽出された罫線に対し、罫線間隔を求める罫線
間隔演算部と、予め登録された帳票書式に対し、罫線間
隔及び罫線位置を含む罫線構造情報を格納する帳票罫線
構造情報データベースと、前記帳票罫線構造情報データ
ベースに格納された登録帳票の罫線間隔と前記罫線間隔
演算部で求められた一定領域内の罫線間隔とを照合する
領域内罫線間隔照合部と、前記領域内罫線間隔照合部の
照合結果から帳票画像の伸縮率を推定して、罫線間隔及
び罫線位置を正規化する罫線間隔正規化部と、前記帳票
罫線構造情報データベースに格納された登録帳票の罫線
間隔及び罫線位置と前記罫線間隔正規化部で求められた
罫線間隔及び罫線位置とを照合する罫線間隔照合部と、
を具備することを特徴とするものである。
【0009】請求項1〜3記載の構成によれば、まず罫
線抽出部は、帳票画像を入力して、帳票中の罫線を抽出
する。罫線長さ分布演算部は、罫線抽出部で抽出された
罫線に対し、罫線長さ分布を求める。罫線構造照合部
は、帳票罫線構造情報データベースに格納された登録帳
票の罫線構造と、罫線抽出部で抽出された罫線とを照合
し、入力帳票画像が登録された帳票書式中のどの書式で
あるかを識別する。このとき罫線構造照合部は、一定領
域内の罫線の罫線間隔を照合し、帳票画像の伸縮率を推
定し、罫線間隔を正規化する。そして正規化された罫線
間隔を用いて照合することにより、画像の伸縮の影響を
無くす。こうして候補帳票を絞り込んでから罫線構造の
照合を行うことにより、帳票書式識別の処理時間を短縮
するようにしている。
【0010】また請求項4記載の発明によれば、罫線抽
出部で抽出された罫線に対し、罫線間隔演算部が罫線間
隔を求める。次に領域内罫線間隔照合部は、帳票罫線構
造情報データベースに格納された登録帳票の罫線間隔
と、罫線間隔演算部で求められた一定領域内の罫線間隔
とを照合する。罫線間隔正規化部は、領域内罫線間隔照
合部の照合結果から帳票画像の伸縮率を推定して、罫線
間隔及び罫線位置を正規化する。そして罫線間隔照合部
は、帳票罫線構造情報データベースに格納された登録帳
票の罫線間隔及び罫線位置と、罫線間隔正規化部で求め
られた罫線間隔及び罫線位置とを照合する。こうして罫
線の長さ分布を用いないで帳票の認識を行うようにして
いる。
【0011】
【発明の実施の形態】本発明の実施の形態における帳票
書式識別装置について、図面を参照しながら説明する。
図1は本実施の形態の帳票書式識別装置の全体構成を示
すブロック図である。帳票画像入力部1は、認識対象と
なる帳票を光学読取素子で走査し、帳票画像Vに変換す
るものである。罫線抽出部2は、帳票に含まれる罫線を
帳票画像Vから抽出するものである。罫線長さ分布演算
部3は、罫線抽出部2で抽出された罫線の長さの分布を
計算するものである。帳票罫線構造情報データベース5
は、予め登録された帳票の罫線構造情報をデータベース
として格納する。罫線構造情報として、各帳票の罫線長
さ分布、罫線間隔、罫線位置を扱う。
【0012】罫線長さ分布照合部4は、帳票罫線構造情
報データベース5に格納された各帳票の罫線長さ分布
と、罫線長さ分布演算部3で求められた罫線長さ分布と
を照合し、候補帳票を絞り込むものである。罫線構造照
合部6は、帳票罫線構造情報データベース5に格納され
ている候補帳票の罫線間隔及び罫線位置と、罫線抽出部
2で抽出された罫線の罫線間隔及び罫線位置を照合し、
帳票画像Vが登録されている帳票書式のどの書式である
かを識別するものである。ここでの識別結果は識別結果
出力部7から出力される。
【0013】罫線構造照合部6の内部構成について、図
2のブロック図を用いて説明する。罫線間隔演算部11
は、罫線抽出部2で抽出された罫線の間隔を計算するも
のである。領域内罫線間隔照合部12は、帳票画像Vの
中で一定領域内にある罫線を対象とし、帳票罫線構造情
報データベース5に格納されている候補帳票の罫線間隔
と照合するものである。罫線間隔正規化部13は、領域
内罫線間隔照合部12の照合結果から、帳票画像Vの伸
縮率を推定し、罫線間隔及び罫線位置を正規化するもの
である。罫線間隔照合部14は、罫線間隔正規化部13
により正規化された罫線間隔及び罫線位置と、帳票罫線
構造情報データベース5に格納されている候補帳票の罫
線間隔及び罫線位置とを照合し、帳票画像Vが登録され
た帳票書式中のどの書式であるかを識別するものであ
る。
【0014】このような構成の帳票書式識別装置の動作
について説明する。図3は罫線長さ分布照合の説明図で
ある。帳票罫線構造情報データベース5には、予め識別
したい全ての帳票書式の罫線構造情報を登録しておく。
罫線構造情報としては、前述したように罫線の長さ分
布、罫線間隔、罫線位置を対象とする。
【0015】まず、帳票画像入力部1であるスキャナや
ファクシミリなどによって取り込まれた帳票画像Vに対
して、罫線抽出部2は、帳票画像Vに含まれている罫線
を抽出する。罫線抽出部2で抽出された罫線に対して、
罫線長さ分布演算部3は、各罫線の長さを求め、罫線の
長さと出現頻度の分布を計算する。罫線長さ分布照合部
4は、帳票罫線構造情報データベース5に登録されてい
る各帳票の罫線長さ分布と、罫線長さ分布演算部3で求
められた罫線長さ分布とを、図3に示すように各長さ別
に対応関係を照合し、罫線長さ分布の一致度を調べる。
この一致度を評価値として定量化し、その評価値が高い
幾つかの帳票書式を、識別の候補帳票として選択する。
【0016】罫線構造照合部6内の罫線間隔演算部11
は、罫線抽出部2で抽出された罫線の間隔を計算する。
次に、領域内罫線間隔照合部12は、帳票画像Vの一定
範囲の領域内にある罫線だけを抽出し、抽出された罫線
の罫線間隔と、帳票罫線構造情報データベース5に格納
され、且つ罫線長さ分布照合部4で選択された候補帳票
の罫線間隔とを照合する。ここで用いた帳票画像の一定
の範囲は、画像の伸縮による罫線の間隔の誤差が一定の
範囲に収まるように設定される。罫線間隔正規化部13
は、領域内罫線間隔照合部12で照合できた罫線に対し
て、帳票罫線構造情報データベース5に格納された罫線
間隔と比べたときの誤差から、各候補帳票に対する画像
の伸縮率を推定する。さらに罫線間隔正規化部13は推
定された伸縮率から、罫線間隔及び罫線位置を正規化
し、各候補帳票に対して画像の伸縮がない場合の罫線間
隔及び罫線位置を計算する。
【0017】最後に、罫線間隔照合部14は、帳票罫線
構造情報データベース5に格納された各候補帳票の罫線
間隔及び罫線位置と、その候補帳票に対する画像の伸縮
率で正規化された罫線間隔及び罫線位置とを照合し、罫
線間隔及び罫線位置の一致度を評価値として求め、その
評価値が最も高い候補帳票を識別結果として出力する。
【0018】以上の実施の形態は、罫線長さの分布を用
いて候補帳票を絞り込んでから罫線構造の照合を行うよ
うにした帳票書式識別装置である。しかし罫線長さの分
布を用いないで、特定領域内の罫線間隔を照合するだけ
で、帳票を識別することもできる。このような方式の帳
票書式識別装置は、図1に示す帳票画像入力部1及び帳
票罫線構造情報データベース5と、図2に示す罫線構造
照合部6とを用いて構成することができる。この場合、
罫線抽出部2は、帳票画像を入力して帳票中の罫線を抽
出する。次に罫線構造照合部6内の罫線間隔演算部11
は、罫線抽出部2で抽出された罫線に対し、罫線間隔を
求める。帳票罫線構造情報データベース5は、予め登録
された帳票書式に対し、罫線間隔及び罫線位置を含む罫
線構造情報を格納しておく。領域内罫線間隔照合部12
は、帳票罫線構造情報データベース5に格納された登録
帳票の罫線間隔と、罫線間隔演算部11で求められた一
定領域内の罫線間隔とを照合する。次に罫線間隔正規化
部13は、領域内罫線間隔照合部12の照合結果から、
帳票画像の伸縮率を推定して、罫線間隔及び罫線位置を
正規化する。罫線間隔照合部14は、帳票罫線構造情報
データベース5に格納された登録帳票の罫線間隔及び罫
線位置と、罫線間隔正規化部13で求められた罫線間隔
及び罫線位置とを照合することにより、入力された帳票
を識別することができる。
【0019】
【発明の効果】請求項1〜3記載の発明によれば、初め
に罫線の長さ分布を用いて照合し、候補帳票の数を絞り
込む。更に一定領域内の罫線の罫線間隔を照合すること
により、帳票画像の伸縮率を推定し、罫線間隔を正規化
する。そして正規化された罫線間隔を用いて照合するこ
とにより、画像の伸縮の影響をなくすことができる。ま
た候補帳票を絞り込んでから罫線構造の照合を行うの
で、帳票書式識別の処理時間を短くすることができる。
【0020】また請求項4記載の発明によれば、一定領
域内の罫線の罫線間隔を照合することにより、帳票画像
の伸縮率を推定し、罫線間隔を正規化する。そして正規
化された罫線間隔を用いて照合することにより、画像の
伸縮の影響をなくして帳票の認識を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における帳票書式識別装置
の全体構成図である。
【図2】本実施の形態の帳票書式識別装置において、罫
線構造照合部の構成を示すブロック図である。
【図3】本実施の形態における罫線長さ分布照合の説明
図である。
【図4】従来例における帳票書式識別装置の全体構成図
である。
【符号の説明】 1 帳票画像入力部 2 罫線抽出部 3 罫線長さ分布演算部 4 罫線長さ分布照合部 5 帳票罫線構造情報データベース 6 罫線構造照合部 7 識別結果出力部 11 罫線間隔演算部 12 領域内罫線間隔照合部 13 罫線間隔正規化部 14 罫線間隔照合部 51 帳票画像入力部 52 罫線抽出部 53 罫線構造照合部 54 帳票罫線構造情報データベース 55 識別結果出力部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 帳票画像を入力して、帳票中の罫線を抽
    出する罫線抽出部と、 前記罫線抽出部で抽出された罫線に対し、罫線長さ分布
    を求める罫線長さ分布演算部と、 予め登録された帳票書式に対し、罫線長さ分布、罫線間
    隔、罫線位置を含む罫線構造情報を格納する帳票罫線構
    造情報データベースと、 前記帳票罫線構造情報データベースに格納された登録帳
    票の罫線長さ分布と前記罫線長さ分布演算部で求められ
    た罫線長さ分布とを照合し、照合結果に基づいて候補帳
    票を選択する罫線長さ分布照合部と、 前記帳票罫線構造情報データベースに格納された登録帳
    票の罫線構造と前記罫線抽出部で抽出された罫線とを照
    合し、入力帳票画像が登録された帳票書式中のどの書式
    であるかを識別する罫線構造照合部と、を具備すること
    を特徴とする帳票書式識別装置。
  2. 【請求項2】 前記罫線構造照合部は、 入力帳票画像において罫線の間隔及び罫線の位置を求め
    る罫線間隔演算部と、 前記帳票罫線構造情報データベースに格納された罫線間
    隔及び罫線位置と前記罫線間隔演算部で求められた罫線
    間隔及び罫線位置とを照合し、入力帳票画像が登録され
    た帳票書式中のどの書式であるかを識別する罫線間隔照
    合部と、を有することを特徴とする請求項1記載の帳票
    書式識別装置。
  3. 【請求項3】 前記罫線構造照合部は、 入力帳票画像において罫線の間隔及び罫線の位置を求め
    る罫線間隔演算部と、 前記帳票罫線構造情報データベースに格納された罫線間
    隔と前記罫線間隔演算部で求められた一定領域内の罫線
    間隔とを照合する領域内罫線間隔照合部と、 前記領域内罫線間隔照合部の照合結果から、入力帳票画
    像の伸縮率を推定して、罫線間隔及び罫線位置を正規化
    する罫線間隔正規化部と、 前記帳票罫線構造情報データベースに格納された罫線間
    隔及び罫線位置と前記罫線間隔正規化部で求められた罫
    線間隔及び罫線位置とを照合し、入力帳票画像が登録さ
    れた帳票書式中のどの書式であるかを識別する罫線間隔
    照合部と、を有することを特徴とする請求項1記載の帳
    票書式識別装置。
  4. 【請求項4】 帳票画像を入力して、帳票中の罫線を抽
    出する罫線抽出部と、 前記罫線抽出部で抽出された罫線に対し、罫線間隔を求
    める罫線間隔演算部と、 予め登録された帳票書式に対し、罫線間隔及び罫線位置
    を含む罫線構造情報を格納する帳票罫線構造情報データ
    ベースと、 前記帳票罫線構造情報データベースに格納された登録帳
    票の罫線間隔と前記罫線間隔演算部で求められた一定領
    域内の罫線間隔とを照合する領域内罫線間隔照合部と、 前記領域内罫線間隔照合部の照合結果から帳票画像の伸
    縮率を推定して、罫線間隔及び罫線位置を正規化する罫
    線間隔正規化部と、 前記帳票罫線構造情報データベースに格納された登録帳
    票の罫線間隔及び罫線位置と前記罫線間隔正規化部で求
    められた罫線間隔及び罫線位置とを照合する罫線間隔照
    合部と、を具備することを特徴とする帳票書式識別装
    置。
JP10294745A 1998-10-16 1998-10-16 帳票書式識別装置 Pending JP2000123174A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10294745A JP2000123174A (ja) 1998-10-16 1998-10-16 帳票書式識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10294745A JP2000123174A (ja) 1998-10-16 1998-10-16 帳票書式識別装置

Publications (1)

Publication Number Publication Date
JP2000123174A true JP2000123174A (ja) 2000-04-28

Family

ID=17811766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10294745A Pending JP2000123174A (ja) 1998-10-16 1998-10-16 帳票書式識別装置

Country Status (1)

Country Link
JP (1) JP2000123174A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7106904B2 (en) 2001-04-25 2006-09-12 Hitachi, Ltd. Form identification method
JP2014016921A (ja) * 2012-07-11 2014-01-30 Glory Ltd 帳票種類判別装置および帳票種類判別方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7106904B2 (en) 2001-04-25 2006-09-12 Hitachi, Ltd. Form identification method
JP2014016921A (ja) * 2012-07-11 2014-01-30 Glory Ltd 帳票種類判別装置および帳票種類判別方法

Similar Documents

Publication Publication Date Title
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2821348B2 (ja) 指紋照合装置
US7151846B1 (en) Apparatus and method for matching fingerprint
EP0335696A2 (en) Pattern recognition apparatus
JPH10105655A (ja) 光学文字認識のための検証および訂正の方法およびシステム
US20090132477A1 (en) Methods of object search and recognition.
JP3602596B2 (ja) ドキュメントファイリング装置および方法
JP6831951B2 (ja) 画像認識システム
US20020114515A1 (en) Character string recognition apparatus, character string recognizing method, and storage medium therefor
US20070172130A1 (en) Structural description of a document, a method of describing the structure of graphical objects and methods of object recognition.
JP2003109007A (ja) 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
JP2898562B2 (ja) ナンバープレート決定方法
US6556701B1 (en) Method of and apparatus for extracting dotted line, and storage medium thereof
JP2000123174A (ja) 帳票書式識別装置
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP3956625B2 (ja) 領域切り出しプログラムおよび装置
JP2833313B2 (ja) 指紋特徴点の真偽判定装置
US20120011434A1 (en) Method for Object Recognition and Describing Structure of Graphical objects
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP4529418B2 (ja) 画像認識装置
JPH05108806A (ja) 画像特徴抽出方法及びその装置
JP2019164687A (ja) 情報処理装置
JP2600680B2 (ja) 個人照合装置
JPH07319880A (ja) キーワード抽出・検索装置
KR102079123B1 (ko) 화물 차량 번호 인식 방법

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040309