JP2003109007A - 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 - Google Patents

帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置

Info

Publication number
JP2003109007A
JP2003109007A JP2001302004A JP2001302004A JP2003109007A JP 2003109007 A JP2003109007 A JP 2003109007A JP 2001302004 A JP2001302004 A JP 2001302004A JP 2001302004 A JP2001302004 A JP 2001302004A JP 2003109007 A JP2003109007 A JP 2003109007A
Authority
JP
Japan
Prior art keywords
ruled line
image
target
waveform
form style
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001302004A
Other languages
English (en)
Inventor
Kagenori Nagao
景則 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2001302004A priority Critical patent/JP2003109007A/ja
Publication of JP2003109007A publication Critical patent/JP2003109007A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 帳票への記載事項や押印、書き込み、入力帳
票画像の拡大率の違いや位置ずれを許容し、帳票上の罫
線の間隔や本数などに特定の制約のない、帳票様式分類
装置を提供することである。 【解決手段】 被分類帳票101から抽出された罫線特
徴リストと、帳票様式データベース106内の基準帳票
102の罫線特徴リストとを対応付け、罫線位置の補正
量が補正量検出手段109により算出され、罫線特徴補
正手段108で基準帳票102の罫線位置の補正がされ
る。罫線特徴照合手段107で、被分類帳票101の罫
線特徴リストと補正後の基準帳票102の罫線特徴リス
トとを照合し、その類似度を求める。被分類帳票101
は、最大の類似度を持つ基準帳票と同一の様式として分
類される。前記補正量は、被分類帳票の複数の罫線位置
と、比較対照される一つの基準帳票の複数の罫線位置と
の間の、全ての組合せの対応関係から求められる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、対象帳票を定型の
帳票様式に分類する帳票様式分類装置、帳票様式分類方
法、帳票様式分類プログラムに関し、さらに対象画像を
基準画像と照合する画像照合装置に関する。
【0002】
【従来の技術】定型様式を持った帳票をスキャナ等で読
み込み、計算機で処理を行うシステムでは、扱う帳票様
式に関する情報を予めシステムに登録しておくことによ
り、帳票処理の自動化を図ることができる。一例として
金融機関で扱う帳票を処理するシステムを考えた場合、
日付、口座番号、担当者、金額等の記載が帳票上のどこ
に位置するかを帳票様式ごとに予め登録しておくことに
より、システムは必要な情報が記載されている個所の文
字を光学的文字読み取りにより認識し、その後の事務処
理を自動化することができる。一般には帳票上に記載さ
れている情報や、その帳票上での位置は帳票の様式毎に
異なる。従って、このようなシステムを用いて複数の様
式が混在する帳票を処理する際に必要となるのが、読み
込まれた帳票を様式別に自動分類する技術である。
【0003】また、帳票様式の自動分類技術は帳票画像
の電子ファイリング装置などでも重要となる。このよう
な装置では帳票の種類を表す分類コードをオペレータが
手作業で付与するのが一般的であるが、帳票様式の自動
分類技術を用いればオペレータの負担を大幅に軽減し、
かつオペレータの疲労による分類ミスなどを防ぐことも
できる。
【0004】このような帳票様式の自動分類において、
従来は識別番号や記号、バーコード等、帳票様式の識別
情報を帳票上の決められた位置に印刷しておき、これを
認識して帳票の様式判定をするのが一般的であった。し
かしこの方法では、識別情報を持つ専用の帳票しか扱う
ことができないという問題があるため、識別情報を持た
ないより一般的な帳票の様式分類を行うための手法が提
案されている。
【0005】例えば特開平10−111899号公報で
は、読み取られた帳票のイメージデータと、雛形帳票記
憶部に記憶されている雛形の帳票のイメージデータを比
較することにより、様式判別を行う技術を開示してい
る。
【0006】また別の例として、特許第3096481
号公報では、入力された帳票画像上の罫線特徴に着目し
た帳票分類技術が提案されている。この方法では、まず
帳票画像データから水平、垂直方向の線分を抽出し、抽
出された各線分の位置、長さ、方向の情報を検出する。
続いて、前記帳票画像を複数エリアに区分し、この区分
されたエリア毎に存在する前記抽出された線分の、方向
毎の長さ毎の重みである特徴量を被認識対象のパターン
特徴量として求める。認識すべきパターンの基準となる
標準パターンの特徴量も予め同様にして求めて記憶して
おき、前記抽出された被認識パターンの特徴量と前記記
憶されている標準パターンの特徴量とを比較照合し、そ
の比較結果に基づいて前記被認識パターンがどの標準パ
ターンであるかを判断して帳票の種類を判別する。
【0007】さらに別の例として、特開平8−3150
68号公報では、帳票上に存在する罫線の間隔を基準に
して帳票の分類を行う方法を開示している。この方法で
は、予め登録する複数書式の各帳票イメージデータの基
準となる第一の基準罫線間隔を求め、帳票イメージデー
タの該各罫線間隔を第一の基準罫線間隔との比率で置き
換えて正規化した結果を、登録書式情報として装置上に
用意する。入力イメージデータに対しても登録書式情報
作成と同様に、該入力イメージデータの基準となる第二
の基準罫線間隔を求め、入力イメージデータの各罫線間
隔を第二の基準罫線間隔との比率で置き換えて正規化し
た結果を入力書式情報として生成する。そして登録書式
情報と入力書式情報とを照合し、入力イメージデータが
登録書式情報中のどの書式であるかを識別する。なお該
公報では、上記基準罫線間隔は最も分布の多い罫線間隔
としている。
【0008】
【発明が解決しようとする課題】しかしながら帳票のイ
メージデータを照合対象とする特開平10−11189
9号公報記載の方法では、帳票への記載事項が多くなる
につれて雛形の帳票イメージとの類似度が低下するとい
う問題がある。さらにイメージデータそのものを雛形帳
票記憶部に記憶するため、取り扱う様式の種類が多くな
ると雛形帳票記憶部で必要となる記憶容量も膨大とな
る。また、処理すべき帳票原稿は原本ではなく、その複
写である場合も考えられ、複写の際に拡大・縮小処理が
為されている帳票は、該公報に記載されている方法では
扱うことができない。ファクシミリ機器により送信され
た帳票の場合も、機器の精度により倍率の誤差を生じる
場合があるため同様の問題が生じる。さらにイメージデ
ータの照合の際にはイメージの位置合わせを行う必要が
あるが、帳票上には承認印や書き込みが欄外に為される
ことも多く、黒画素が存在する領域を囲む外接矩形など
を基準にした単純な位置合わせでは位置ずれを生じる。
上述したような場合には照合するイメージ同士の拡大率
や位置が異なるため、単純なイメージデータの比較では
正当な類似度が得られず、分類処理に支障を来すと考え
られる。
【0009】これに対し、特許第3096481号公報
記載の方法では、入力された帳票画像データから水平、
垂直方向の線分情報を抽出して、この情報から生成した
特徴量を元に分類処理を行うため、帳票への記載事項や
押印、書き込み等が類似度測定に及ぼす影響は大幅に軽
減されると考えられる。また、帳票様式の基準データと
して記憶されるデータ形式もイメージではなく、抽出さ
れた線分情報から生成された特徴量であるため、その容
量は元のイメージデータに比べてはるかに小さいと考え
られる。さらに、照合対象となる特徴量は帳票画像を複
数エリアに区分し、この区分されたエリア毎に求められ
るため、照合すべき帳票画像間に微妙な拡大率の違いや
位置ずれがあっても、その影響を軽減することもでき
る。しかし、吸収できる変動はエリアの大きさ程度に限
られ、それを越えるような大きな拡大率や位置の違いに
は対応することができない。さらに、帳票画像を複数エ
リアに分割する際、帳票画像の存在領域をまず特定し、
その領域を分割することになるが、帳票欄外に書き込み
や押印などがある場合には誤った帳票領域が特定され、
結果として分割したエリアも誤ったものになって照合に
失敗する可能性が高い。
【0010】一方、特開平8−315068号公報記載
の方法では、照合対象となるのは帳票画像から検出され
た罫線間隔であり、さらにその罫線間隔も基準罫線間隔
により正規化されるため、上述したような拡大率の違い
や位置ずれに起因する問題は発生しない。帳票画像上の
罫線を検出して処理を行うため、記載事項や押印、書き
込み等の影響を受けにくく、照合の対象となるのも罫線
の絶対位置ではなく、その間隔という相対量であるため
位置ずれの影響も受けない。また、罫線間隔も所定の値
で正規化した後に照合を行うため、拡大率の違いによる
問題も発生しない。しかし、罫線間隔の正規化を行う
際、最も出現頻度の高い罫線間隔により正規化を行うた
め、等間隔の罫線が多数存在する帳票を前提としている
点が問題となる。
【0011】このように、特開平8−315068号公
報記載の従来技術では、多様な罫線間隔を持つ罫線から
構成される帳票や、罫線数の少ない帳票に効果的に対応
することができない。例えば罫線数が少ないとき、最も
出現頻度が高い罫線間隔を基準として正規化すると、罫
線の誤検出や検出漏れが罫線間隔の出現頻度に大きな影
響を与え、本来は基準罫線間隔となるべき罫線間隔の出
現頻度が最大とはならなくなる危険性が高く、分類が安
定して正確に行われなくなる。このような罫線の誤検出
や検出漏れは、帳票への記載事項や押印、書き込み等が
原因となって発生する場合が多い。
【0012】以上の従来技術の問題点に鑑み、本発明は
様式識別のための識別番号や記号、バーコード等を帳票
上に持つことを不要とし、帳票への記載事項や押印、書
き込み等があっても安定した分類結果を得ることがで
き、入力帳票画像の拡大率の違いや位置ずれを許容し、
かつ帳票上の罫線の間隔や本数などに特定の制約を設け
ず、多様な帳票様式に対応することのできる帳票様式分
類装置、帳票様式分類方法、帳票様式分類プログラムお
よび画像照合装置を提供することを目的とする。
【0013】
【課題を解決するための手段】上記目的を達成するた
め、本発明にかかる帳票様式分類装置は、対象帳票の画
像と、複数の帳票様式の画像とを対照し、対象帳票を分
類する帳票様式分類装置において、対象帳票の画像か
ら、罫線位置を含む罫線特徴を抽出する罫線特徴抽出手
段と、前記複数の帳票様式の各々の帳票様式における、
罫線位置を含む罫線特徴を記憶する帳票様式データベー
スと、対象帳票の前記各罫線位置と、帳票様式の前記各
罫線位置との対応関係から、罫線位置につき補正処理を
行う補正処理手段と、前記補正処理後の、前記対象帳票
画像の罫線特徴と前記複数の帳票様式の罫線特徴との照
合をそれぞれ行う罫線特徴照合手段と、を備え、前記補
正処理手段は、対象帳票の複数の罫線位置と、帳票様式
の複数の罫線位置との間の全ての組合せの対応関係に基
いて、対象帳票と帳票様式との間で前記補正処理を行う
ことを特徴とし、類似度の高い帳票様式に対象帳票を分
類して、所定の処理に供する。
【0014】また本発明に係る帳票様式分類装置におい
て、前記罫線特徴抽出手段は、対象帳票画像の垂直また
は水平方向の各座標について、前記方向と直角方向のラ
インに沿った画像の濃度値を累積し、対象帳票画像の垂
直または水平方向の累積濃度値である投影波形を形成す
る、投影波形形成手段と、前記投影波形に対して所定の
しきい値を超える波形部分のみを抽出するしきい値処理
手段と、前記しきい値処理手段により、連続して抽出さ
れた波形部分毎に、一つの罫線特徴を算出する罫線特徴
算出手段と、を有することが好ましい。
【0015】また、本発明に係る帳票様式分類装置にお
いて、前記補正処理手段は、前記対象帳票の複数の罫線
位置の全体と、前記帳票様式の複数の罫線位置の全体と
が、およそ一致する補正量を推定する補正量推定手段
と、前記推定された補正量に基き、前記対象帳票の複数
の罫線位置の全体または前記帳票様式の複数の罫線位置
の全体のうち少なくとも一方に対し、補正した罫線位置
を算出する補正罫線算出手段と、を有することが好まし
い。
【0016】また、本発明に係る帳票様式分類装置にお
いて、前記罫線特徴照合手段は、前記対象帳票の罫線特
徴またはその補正処理後の罫線特徴に対応する投影波形
を再合成する第一の投影波形再合成手段と、前記帳票様
式の罫線特徴またはその補正処理後の罫線特徴に対応す
る投影波形を再合成する第二の投影波形再合成手段と、
前記第一および第二の投影波形再合成手段により得られ
た投影波形間の類似度を算出する類似度算出手段と、を
有することが好ましい。
【0017】また、本発明に係る帳票様式分類装置にお
いて、前記罫線特徴抽出手段はさらに、対象帳票画像の
傾き補正を行う傾き補正手段を備え、傾き補正した対象
帳票画像について罫線特徴を抽出することが好ましい。
【0018】また、本発明に係る帳票様式分類装置にお
いて、前記しきい値処理手段は、前記投影波形の最大値
に対し所定の係数を乗じた値を、所定のしきい値として
用いることが好ましい。
【0019】また、本発明に係る帳票様式分類装置にお
いて、前記しきい値処理手段は、前記投影波形の平均値
に対し所定の係数を乗じた値を、所定のしきい値として
用いることが好ましい。
【0020】また、本発明に係る帳票様式分類装置にお
いて、前記しきい値処理手段は、前記投影波形のそれぞ
れの位置について、該位置近傍の予め定められた範囲の
平均値を移動平均値として求め、その移動平均値に対し
所定の係数を乗じた値を、所定のしきい値として用いる
ことが好ましい。
【0021】また、本発明に係る帳票様式分類装置にお
いて、前記しきい値処理手段は、前記投影波形の低域濾
波波形に所定の係数を乗じて得られた波形をしきい値と
して用いることが好ましい。
【0022】また、本発明に係る帳票様式分類装置にお
いて、前記罫線特徴算出手段は、前記しきい値処理手段
により連続して抽出された波形部分毎に、その抽出され
た波形部分の重心位置を算出し、その重心位置を罫線位
置とすることが好ましい。
【0023】また、本発明に係る帳票様式分類装置にお
いて、前記罫線特徴算出手段は、前記しきい値処理手段
により連続して抽出された波形部分毎に、その抽出され
た波形部分の中心位置を算出し、その中心位置を罫線位
置とすることが好ましい。
【0024】また、本発明に係る帳票様式分類装置にお
いて、前記罫線特徴算出手段は、前記しきい値処理手段
により連続して抽出された波形部分毎に、抽出された波
形部分の最大値を算出し、その値を罫線強度とすること
が好ましい。
【0025】また、本発明に係る帳票様式分類装置にお
いて、前記罫線特徴算出手段は、前記しきい値処理手段
により連続して抽出された波形部分毎に、抽出された波
形部分の平均値を算出し、その値を罫線強度とすること
が好ましい。
【0026】また、本発明に係る帳票様式分類装置にお
いて、補正量推定手段は、一方の罫線位置にスケーリン
グ補正量を乗じて平行移動量を加えたものを、他方の罫
線位置に等しいとしたときに、スケーリング補正量と平
行移動量との関係が直線関係となる対応関係に基づい
て、対象帳票の各罫線位置と、前記帳票様式の各罫線位
置との対応付けを、全ての罫線位置の組合せについて行
う全組合せ対応付け手段と、前記スケーリング補正量を
一方の座標軸、前記平行移動量をそれに直交する他の座
標軸にとった、(スケーリング補正量)−(平行移動
量)平面において、前記対応付けられた直線の各々につ
き投票値を定め投票処理を行う投票手段と、該投票処理
によって前記(スケーリング補正量)−(平行移動量)
平面上に形成された累積投票値を算出する累積投票値算
出手段と、前記累積投票値が最大値となるピーク座標を
特定する投票ピーク特定手段と、を有し、前記ピーク座
標をもってスケーリング補正量および平行移動量とを推
定することが好ましい。
【0027】また、本発明に係る帳票様式分類装置にお
いて、前記投票手段は、前記対応付けられた二つの罫線
位置の間における相対的な罫線強度比に基いた投票値に
より投票処理がされることが好ましい。
【0028】また、本発明に係る帳票様式分類装置にお
いて、前記投票ピーク特定手段は、前記(スケーリング
補正量)−(平行移動量)平面を複数のセル領域に分割
し、各セル領域を通過する前記対応付けられた直線の数
が最大となるピークセルを特定し、前記ピークセルを通
過する前記各直線から最小距離に位置する点の座標をも
って前記累積投票値が最大値となるピーク座標として特
定することが好ましい。
【0029】また、本発明に係る帳票様式分類装置にお
いて、前記投票ピーク特定手段は、さらに、前記各直線
の投票値により、各直線からの距離の重み付け処理を行
うことが好ましい。
【0030】また、本発明に係る帳票様式分類装置にお
いて、前記第一または第二の投影波形再合成手段は、前
記対象帳票画像の垂直または水平方向のライン上におけ
る各罫線位置に、孤立方形波形を形成し、その孤立方形
波形群を低域濾波して、投影波形を再合成することが好
ましい。
【0031】また、本発明に係る帳票様式分類装置にお
いて、前記類似度算出手段は、前記再合成された第一の
投影波形と第一の投影波形との間の類似度、ならびに前
記スケーリング補正量と平行移動量とに基づいて類似度
を算出することが好ましい。
【0032】また、本発明に係る帳票様式分類装置にお
いて、前記補正処理手段は、前記帳票様式の罫線位置の
全体と、前記対象帳票の罫線位置の全体との間で、補正
処理を複数通り行い、前記罫線特徴照合手段は、前記第
一の投影波形再合成手段または前記第二の投影波形再合
成手段のうち少なくとも一方は、前記複数通りの投影波
形を再合成し、前記第一および第二の投影波形再合成手
段により得られた投影波形間の、複数通りの類似度を算
出する類似度算出手段と、を備え、前記対象帳票画像の
罫線特徴と前記前記複数の帳票様式についてそれぞれ照
合を行い、全照合の中で最大の類似度の帳票様式に対象
帳票を分類することが好ましい。
【0033】また、本発明に係る帳票様式分類装置にお
いて、さらに、対象帳票画像を入力する画像入力手段
と、を備えることが好ましい。
【0034】また、本発明に係る帳票様式分類装置にお
いて、さらに、前記帳票様式分類の罫線位置を含む罫線
特徴を前記帳票様式データベースに登録する帳票様式登
録手段、を有することが好ましい。
【0035】本発明に係る画像照合装置は、対象画像
と、基準画像とを対照し、対象画像と基準画像の類似照
合を行う画像照合装置において、前記基準画像の垂直ま
たは水平方向の各座標について、前記方向と直角方向に
沿った画像の濃度値を累積した投影波形を形成し、前記
投影波形が所定のしきい値を超える連続した部分を画像
特徴部分とし、それぞれの画像特徴部分についてその画
像特徴部分位置を含む画像特徴部分情報を抽出する基準
画像特徴部分情報抽出手段と、前記対象画像の垂直また
は水平方向の各座標について、前記方向と直角方向に沿
った画像の濃度値を累積した投影波形を形成し、前記投
影波形が所定のしきい値を超える連続した部分を画像特
徴部分とし、それぞれの画像特徴部分についてその画像
特徴部分位置を含む画像特徴部分情報を抽出する対象画
像特徴部分情報抽出手段と、対象画像の前記各画像特徴
部分位置と、比較対照される基準画像の各画像特徴部分
位置との対応関係から、これらの位置関係につき、スケ
ーリングの補正と平行移動の補正を行う補正処理手段
と、前記補正処理後の、前記対象画像の特徴部分情報と
前記基準画像の画像特徴部分情報とを比較し、類似度を
算出する画像特徴照合手段と、を備え、前記補正処理手
段は、対象画像の複数の画像特徴部分位置と、基準画像
の複数の画像特徴部分位置との間の対応関係に基いて前
記補正処理を行うことを特徴とし、得られた類似度によ
り、対象画像を所定の処理に供する。
【0036】また、本発明に係る帳票様式分類方法は、
対象帳票と、複数の帳票様式とを対照し、対象帳票を分
類する帳票様式分類方法において、対象帳票の画像か
ら、罫線位置を含む罫線特徴を複数抽出する罫線特徴抽
出工程と、前記複数の帳票様式の各々の帳票様式におけ
る、罫線位置を含む罫線特徴を記憶する帳票様式データ
ベースから、帳票様式の罫線特徴を読み出す帳票様式罫
線特徴読み出し工程と、対象帳票の前記各罫線位置と、
前記帳票様式の各罫線位置との対応関係から、罫線位置
につき補正処理を行う補正処理工程と、前記補正処理後
の、前記対象帳票画像の罫線特徴と前記複数の帳票様式
の罫線特徴との照合をそれぞれ行う罫線特徴照合工程
と、を備え、前記補正処理工程は、対象帳票の複数の罫
線位置と、前記帳票様式の複数の罫線位置との間の全て
の組合せの対応関係に基いて、対象帳票と帳票様式との
間で前記補正処理を行うことを特徴とし、類似度の高い
帳票様式に対象帳票を分類して、所定の処理に供する。
【0037】また、本発明に係る帳票様式分類プログラ
ムは、対象帳票と、複数の帳票様式とを対照し、対象帳
票を分類する帳票様式分類プログラムにおいて、前記複
数の帳票様式の各々の帳票様式における、罫線位置を含
む罫線特徴を記憶する帳票様式データベースに接続され
たコンピュータに、対象帳票の画像から、罫線位置を含
む罫線特徴を複数抽出する罫線特徴抽出処理手順と、前
記帳票様式データベースから、帳票様式の罫線特徴を読
み出す帳票様式罫線特徴読み出し処理手順と、対象帳票
の前記各罫線位置と、前記帳票様式の各罫線位置との対
応関係から、罫線位置につき補正処理を行う補正処理手
順と、前記補正処理後の、前記対象帳票画像の罫線特徴
と前記複数の帳票様式の罫線特徴との照合をそれぞれ行
う罫線特徴照合処理手順と、を実行させ、前記補正処理
手順は、対象帳票の複数の罫線位置と、前記帳票様式の
複数の罫線位置との間の全ての組合せの対応関係に基い
て、対象帳票と帳票様式との間で前記補正処理を行うこ
とを特徴とし、類似度の高い帳票様式に対象帳票を分類
して、所定の処理に供する。
【0038】本発明の帳票様式分類装置では、読み込ん
だ帳票画像に対して水平・垂直方向への投影波形を形成
し、これら投影波形に対して所定のしきい値を越える波
形部分のみを抽出し、連続して抽出された波形部分毎に
一つの罫線特徴を付与する罫線特徴抽出手段を備える。
入力された帳票画像の罫線特徴リストと帳票様式データ
ベース内の罫線特徴リストとを照合する際には、一旦罫
線特徴リストに相当する投影波形を再合成し、この再合
成した投影波形同士について相関係数などによる類似度
を測定する。帳票上に記載事項や押印、書き込み等があ
ると、帳票画像から得られる投影波形にもそれらに起因
するノイズ成分が発生するため、投影波形同士の照合で
はノイズにより類似度が低下する。しかしながら、一般
に罫線は水平または垂直方向に大きな成分を持つのに対
して、記載事項や押印、書き込み等の水平・垂直成分は
罫線に比べると小さいため、投影波形からしきい値処理
によって罫線特徴を抽出すると、大部分のノイズ成分を
取り除くことができる。さらにしきい値処理によっても
取り除くことのできないノイズ成分の存在により少数の
罫線の誤検出や検出漏れがあっても、照合処理は罫線特
徴リストを元にして再合成された投影波形の実波形間の
相関係数測定という形式で行なわれるため、ノイズ成分
が類似度に与える影響は限定的となる。
【0039】また入力された帳票画像の罫線特徴リスト
と帳票様式データベース内の罫線特徴リストとの照合に
先立って、両者の罫線位置が最も良く一致するように、
スケーリング補正、および平行移動処理を行うため、入
力帳票画像の拡大率の違いや位置ずれを許容することが
できる。この際に適用されるスケーリング補正量と平行
移動量は、前記帳票画像の罫線特徴リストにおける各罫
線位置と、照合対象となる基準帳票の罫線特徴リストに
おける各罫線位置との対応付けを全ての罫線位置の組合
せについて行う。そして、前記対応付けにおいて対応付
けられた2つの罫線位置を一致させるために必要なスケ
ーリング補正量と平行移動量が直線関係を為すことに基
いて、(スケーリング補正量)−(平行移動量)平面に
おいて、例えば、最も多くの直線が交わる交点の座標を
求める。すなわち、いわば該直線上への「投票」処理を
行い、それによって該平面上に形成された累積投票値が
最大値となるピーク座標を求め、その座標をスケーリン
グ補正量および平行移動量とする。つまり、スケーリン
グ補正量と平行移動量は投票処理、換言すれば多数決原
理に基づいて求められるため、少数の罫線の誤検出や検
出漏れがあっても補正量を正しく求めることができ、ま
た、帳票上の罫線の間隔や本数などに特定の制約を設け
ることなく補正量の推定を行うことができる。
【0040】以上のように本発明によれば、帳票上に様
式識別のための識別番号や記号、バーコード等を帳票上
に持つことを不要とし、帳票への記載事項や押印、書き
込み等があっても安定した分類結果を得ることができ、
入力帳票画像の拡大率の違いや位置ずれを許容し、かつ
帳票上の罫線の間隔や本数などに特定の制約を設けず、
多様な帳票様式に対応することのできる帳票様式分類装
置を提供することが可能となる。
【0041】
【発明の実施の形態】図1は本発明の一実施例による帳
票様式分類装置のブロック図である。
【0042】分類の対象となる対象帳票である被分類帳
票101は、スキャナ等の画像入力手段104によって
読み取られ、ラスタ画像データに変換される。このラス
タ画像データからは、罫線特徴抽出手段105により、
画像上の罫線成分に関する罫線特徴が抽出され、罫線特
徴リストが生成される。特徴としては、罫線の位置、
幅、長さ等に関連する情報が抽出される。
【0043】照合の対象となる複数の帳票様式である基
準帳票の特徴量は、上記の手順と同様の処理により求め
られる。即ち、基準帳票は、画像入力手段104によっ
て読み込まれてラスタ画像データに変換され、このラス
タ画像データから罫線特徴抽出手段105により基準帳
票画像上の罫線特徴が抽出され、罫線特徴リストが生成
される。この基準帳票画像の罫線特徴リストは予め生成
され、帳票様式データベース106に登録されているも
のとする。基準帳票の罫線特徴リストは、帳票上の罫線
を実測して罫線特徴リスト103を求め、オペレータが
直接数値データとしてデータベース106に登録しても
良い。
【0044】帳票の分類は帳票画像同士の照合ではな
く、上述した罫線特徴リスト間の類似度を測定すること
により実施される。但し、罫線特徴リスト間の類似度測
定に先立って、罫線特徴リスト内の罫線位置に関する補
正を施す。ここで、図1では帳票様式データベース10
6内に記憶された基準帳票の罫線特徴リストに対して補
正が為される例が示されているが、被分類帳票側の罫線
特徴リストに補正を施しても良い。
【0045】前記補正は、被分類帳票101の各罫線の
罫線位置と、比較対照される一つの基準帳票102の各
罫線の罫線位置との対応関係から、罫線位置につき補正
処理を行うことで行われる。そして特徴的なことは、被
分類帳票101の複数の罫線位置と、比較対照される一
つの基準帳票102の複数の罫線位置との間の、対応関
係を確かめるに当り、全ての罫線位置の組合せについて
対応関係を見て、前記補正処理を行うところにある。
【0046】罫線位置の補正量は、補正量推定手段であ
る補正量検出手段109で検出される。補正量検出手段
109では、被分類帳票101から抽出された罫線特徴
リストと、帳票様式データベース106内に記憶された
基準帳票102から生成された罫線特徴リストとを対応
付けることにより、補正量を求める。対応付けの仕方は
後に詳述するが、一方の罫線特徴リストに対して様々な
スケーリング補正と、平行移動処理が適用されることを
想定してなされ、2つの罫線特徴リストが全体として最
も良く対応する罫線位置の補正量を、多数決原理に基づ
いて求めるものである。尚、この補正量は、帳票様式デ
ータベース106内に記憶されたそれぞれの基準帳票1
02の罫線特徴リストについて別個に検出される。
【0047】補正量検出手段109により検出された罫
線位置の補正量は、補正罫線算出手段である罫線特徴補
正手段108で用いられ、帳票様式データベース106
内に記憶された基準帳票102の罫線特徴リストに対し
て罫線位置の補正が為される。
【0048】罫線特徴照合手段107では、被分類帳票
101の罫線特徴リストと、罫線特徴補正手段108に
よって補正を受けた基準帳票102の罫線特徴リストと
を照合し、その類似度を求める。そして被分類帳票10
1は、帳票様式データベース106内に記憶された基準
帳票102の中で、最大の類似度を持つ基準帳票102
と同一の様式を持つ帳票として分類される。
【0049】以下では、上述した帳票様式分類装置の各
処理についてより詳細に記す。
【0050】図2は、図1における罫線特徴抽出手段1
05での処理の詳細を示す図である。被分類帳票101
または基準帳票102は、画像入力手段104で読み取
られて帳票画像データ201に変換され、罫線特徴抽出
手段105では、この画像上の罫線成分に関する特徴が
抽出される。
【0051】帳票画像データ201からは、水平方向投
影形成手段202、および垂直方向投影形成手段205
により、それぞれの方向への投影波形が形成される。以
下では画像の水平方向をX軸方向、垂直方向をY軸方向
として説明する。帳票画像データ201が2値画像であ
る場合、垂直方向投影形成手段205では、垂直方向の
Y軸上の各Y座標毎に、Y軸に直交するライン(水平方
向のライン)上の黒画素の総数を計数し、その総数を該
Y座標における投影値とする。帳票画像データ201
が、例えば白を0、黒を255とする多値画像である場
合は、各ライン上の画素値の累積値がそのY座標におけ
る投影値となる。また、帳票画像データ201がカラー
画像の場合は、その濃度成分を分離して、該濃度画像を
上記多値画像と見なして投影値を計算すれば良い。罫線
部は通常、水平、または垂直成分を多く含むので、水平
・垂直方向への投影波形を形成することにより帳票画像
上の罫線成分を抽出することができる。水平方向投影形
成手段202では同様の処理を垂直方向に行って投影波
形を得る。
【0052】このようにして求められた投影波形は、続
くしきい値処理手段203,206により、所定のしき
い値以下の成分が切り捨てられる。この際に用いられる
しきい値は、予め定められた固定値を用いる他に、以下
のようなしきい値設定法も考えられる。
【0053】例えば、図3で示すような投影波形が得ら
れたとすれば、その投影波形全体を見て、投影波形の最
大値を基準とし、その最大値にある一定の係数を乗じ
て、それをしきい値とできる。また、投影波形全体につ
いて、投影波形の平均値を求め、その投影波形全体の平
均値にある一定の係数を乗じた値をしきい値としてもよ
い。投影波形の全体は、画像の大きさや帳票画像の読み
込み濃度等に依存して変化するため、しきい値処理に先
立って正規化処理等を行わない限り、固定のしきい値を
用いて種々の帳票様式に対応するのは難しい。これに対
して、その波形の最大値、または波形の平均値等の値を
基準としてしきい値を定めれば、画像の大きさや帳票画
像の読み込み濃度等に依存しない、安定したしきい値処
理が可能となる。
【0054】上記の方法以外にも、図3のような移動平
均値にある一定の係数を乗じた値をしきい値として用い
る方法も考えられる。図3での位置Xaにおける移動平
均値ma(Xa)は、平均値の算出範囲を表す定数αを用
いて式1のように求めることができる。
【0055】
【数1】 但し、式1においてf(x)は投影波形を表す。
【0056】読み込んだ帳票画像に濃度むら等がある場
合は、移動平均値を基準にしきい値を定めることで、局
所的な濃度変化にも対応した適正なしきい値処理を行う
ことができる。
【0057】また、前記投影波形に低域濾波処理を行
い、この低域濾波波形に対してある係数を乗じて得た波
形をしきい値として用いることも出来る。
【0058】図2において、しきい値処理手段203,
206に続くのは、罫線特徴算出手段204,207で
ある。罫線特徴算出手段204,207では、連続して
しきい値を上回る投影値を有する波形部分毎に、1本の
罫線が検出されたとみなし、一つの罫線特徴を付与す
る。
【0059】罫線特徴としては、例えば罫線の位置、
幅、強度を要素に持つ3次元特徴ベクトルとすることが
できる。この場合、罫線の位置としては上記連続してし
きい値を上回る投影値を有する、各波形部分の領域の中
央位置や重心位置、罫線の幅として左記領域の幅、罫線
強度として左記領域内における投影波形の最大値や平均
値を採用することができる。これ以外にも、罫線の幅の
要素を省いた、罫線の位置、強度から成る2次元特徴ベ
クトルを罫線特徴として定めることもできる。
【0060】図4は図2のしきい値処理手段203,2
06、および罫線特徴算出手段204,207における
投影波形の処理過程を示したものである。図4では固定
しきい値処理を行い、罫線の位置、強度から成る2次元
特徴ベクトルを生成する場合について説明する。図4
(a)は水平方向投影形成手段202によって生成され
た水平方向の投影波形である。この投影波形は、しきい
値処理手段203によってしきい値を上回る投影のみが
抽出され、図4(b)の波形となる。罫線は水平・垂直
成分を多く含むため、水平、垂直方向に取った投影波形
には罫線位置に大きなピークを形成するが、それ以外に
も帳票上への記載事項や書き込み、押印などによる投影
成分が発生し、小さな波形を作る。しきい値処理はこれ
ら罫線以外の画像に起因する投影を除去することを目的
としたものであり、適切なしきい値を定めれば罫線以外
の画像成分をほとんど取り除くことができる。
【0061】しきい値処理により残った投影は罫線成分
であると見なして、図4(b)の波形から罫線特徴を抽
出する。図4(c)では連続してしきい値を上回る投影
値を有する領域の中央位置を罫線位置とし、左記領域内
における最大投影値を罫線強度として、2次元罫線特徴
を生成する例を示した。
【0062】投影を用いた罫線検出は、罫線部には通
常、水平、または垂直成分を多く含むことを前提として
いるため、帳票画像データ201に傾きがある場合は罫
線の検出が正常に行なわれない場合がある。取り込まれ
る帳票画像に大きな傾きが発生する可能性がある場合
は、水平方向投影形成手段202および垂直方向投影形
成手段205の前段に、傾き補正手段による傾き補正処
理を加えても良い。
【0063】また、帳票の分類において、帳票上の主要
な罫線のみを検出し、細い罫線は検出する必要が無い場
合などは、元の投影波形の低域濾波波形を水平方向投影
形成手段202、または垂直方向投影形成手段205か
ら出力される投影波形とし、これにしきい値処理を行う
ことで細い罫線による投影を除去することができる。
【0064】以上のようにして水平・垂直方向の罫線特
徴が抽出される。しかし、ここまで説明した罫線特徴抽
出手段105の処理を行っても、帳票上の記載事項や書
き込みの一部は例外的に大きな投影波形を形成し、誤っ
て罫線として抽出されてしまうことがある。また、本来
抽出されるべき罫線の一部が検出されない場合もあり得
る。しかし、このような場合でも、本発明による補正量
検出手段109や罫線特徴照合手段107は正常に動作
することは後述するとおりである。
【0065】被分類帳票101は、その特徴量と照合対
象となる複数の基準帳票102の特徴量とが照合され、
最も類似度の高い基準帳票102と同一の様式を持つも
のとして分類される。処理を高速化するためには、基準
帳票102の特徴量を予め抽出し、データベースに登録
しておくことが望ましい。そこで本実施例による帳票様
式分類装置では、基準帳票102の特徴量をそれぞれの
基準帳票様式と対応付けて記憶しておくための帳票様式
データベース106を備えている。
【0066】基準帳票102の罫線特徴リストは、被分
類帳票101から画像入力手段104および罫線特徴抽
出手段105を介して罫線特徴リストを生成したときと
同様にして、求めることができる。このようにして対象
となる基準帳票様式のそれぞれについて罫線特徴リスト
を求め、帳票様式と対応付けて帳票様式データベース1
06に記憶する。罫線特徴リストは、業務等により参照
すべき様式が限定されている場合は業務別に分類して記
憶しておくと良いが、明確な分類を設けず、全ての様式
の罫線特徴リストを一括して記憶させておくこともでき
る。
【0067】また、基準帳票102を実際に読み込んで
罫線特徴リストを生成する方法以外に、罫線特徴データ
を直接帳票様式データベース106に記憶させる方法も
考えられる。この方法では、基準帳票102上の罫線の
位置、幅、長さ等を実測し、これら実測値から該基準帳
票102の罫線特徴を計算して、オペレータが罫線特徴
リストを帳票様式と対応付けて帳票様式データベース1
06に直接登録する。
【0068】分類処理すべき帳票原稿が原本ではなく、
その複写である場合、複写の際に拡大・縮小処理が為さ
れていることも考えられる。また、ファクシミリ機器に
より送信された帳票の場合も、機器の精度により倍率の
誤差を生じる場合がある。このような場合は、罫線特徴
にスケーリングの補正を施してから照合を行う必要があ
る。また、マージンの異なる帳票や欄外に承認印や書き
込みのある帳票では、帳票画像領域同士を照合できるよ
うに位置合わせを行う必要がある。この様な場合を想定
して、本発明では罫線特徴補正手段108によって罫線
特徴リスト内の罫線位置について、スケーリングと平行
移動の補正を行う。ここで適用される罫線位置の補正量
を求めるのが補正量検出手段109である。以下では図
1に従って、帳票様式データベース106に記憶されて
いる罫線特徴リストに補正を加える場合について説明す
るが、補正は被分類帳票101の罫線特徴リストに適用
しても良い。
【0069】補正量検出手段109では、まず、被分類
帳票101の罫線特徴リストと、帳票様式データベース
106に記憶されている罫線特徴リストとを突き合わ
せ、その罫線位置の対応付けを行う。次に対応付けられ
た2つの罫線位置を一致させるために必要な、スケーリ
ング補正量と平行移動量とが、直線関係を為すことに基
いて、(スケーリング補正量)−(平行移動量)平面に
おいて、該直線上への「投票処理」を行う。「投票処理」の
内容にについては、具体的な例について後述するが、こ
のような投票処理を全ての罫線位置の組合せについて行
うと、(スケーリング補正量)−(平行移動量)平面上
には投票値の累積値の分布が形成される。(スケーリン
グ補正量)−(平行移動量)平面上において、この累積
投票値が大きくなる点は、2つの罫線特徴リストが良く
一致することを示しているため、その点の座標(スケー
リング補正量,平行移動量)が、補正量検出手段109
で検出すべき補正量となる。尚、上記の処理は水平・垂
直の両方向に対してそれぞれ行なわれる。以下に具体的
な例を示しながらさらに詳細な説明を行う。
【0070】図5には帳票様式データベース106に記
憶されている、ある基準帳票102の水平方向(X軸方
向)の罫線特徴リスト(A1〜A3)と、被分類帳票1
01から抽出された水平方向(X軸方向)の罫線特徴リ
スト(B1〜B4)の例を示した。罫線特徴は(罫線位
置,罫線強度)の形式を持つ2次元特徴ベクトルとす
る。
【0071】補正量検出手段109ではまず、上記2つ
の罫線特徴リストについて罫線位置の対応付けを行う。
例えば罫線特徴A1とB1が同一の罫線であるとして対
応付けを行う場合、両者の罫線位置が一致するために必
要なスケーリング補正量をk、平行移動量をsとする
と、式2の関係が成立する。
【0072】
【数2】 式2はkとsに関して一次式なので、k−s平面、即ち
(スケーリング補正量)−(平行移動量)平面における
一本の直線を表す。
【0073】図5の、A1〜A3、B1〜B4の全てに
ついて対応付けをすると、上記k−s平面上に十二本の
直線が描ける。これらの直線は互いに交差するので、そ
の交点に注目すると、二本の直線が交わる交点、三本の
直線が交わる交点等がある。この交点における交わる直
線の数の大小を計算する。すなわち、この交わる直線の
数の大小を比較することは、これを例えば「投票」にな
ぞらえれば、投票結果である累積投票値を、交点におけ
る直線の数であるとして、一つの直線毎に投票値として
一票を投じることと考え、上記k−s平面上に分布する
累積投票値の大小を比較すればよい。今の場合全直線数
は十二であるので投票数は十二票となり、投票の結果、
累積投票値が二である交点と、累積投票値が三である交
点があることになる。
【0074】一般に、帳票様式データベース内の罫線特
徴リストにおけるi番目の罫線特徴の位置をAix、被
分類帳票の罫線特徴リストにおけるj番目の罫線特徴の
位置をBjxとすると、両者の罫線位置が一致するため
に必要なスケーリング補正量k、および平行移動量sの
関係は式3のようになる。
【0075】
【数3】 尚、直線一本についての投票値は、上の例のように、直
線一本に常に一票を投じる他にも、罫線強度情報を反映
した投票値を用いることもできる。罫線特徴について
は、その罫線強度の大きなもの同士、あるいは小さなも
の同士を対応付けるのが自然であるから、投票値も罫線
強度に応じて変化させると良い。帳票様式データベース
内の罫線特徴リストにおけるi番目の罫線特徴の強度を
Ais、被分類帳票の罫線特徴リストにおけるj番目の
罫線特徴の強度をBjsとして、例えば投票値Vを式4
のように定めても良い。
【0076】
【数4】 式4において、min(A,B)、max(A,B)はそれぞ
れAとBの最小値と最大値を表す。また、式4の投票値
を適用するためには、罫線強度の最大値が所定の値にな
るようにするなどの正規化処理を前もって行っておく必
要がある。
【0077】このようにして(スケーリング補正量)−
(平行移動量)平面上に形成された累積投票値の分布
は、2つの罫線特徴リストの一致度の分布を反映してい
る。そこで、被分類帳票101の罫線特徴リストに含ま
れる罫線位置の全体と、基準帳票102の罫線特徴リス
トに含まれる罫線位置の全体とが、およそ一致する補正
量である(スケーリング補正量,平行移動量)を一つ推
定するとすれば、同平面上に形成された累積投票値が最
大値となるピーク点を探索して、その点の座標である
(スケーリング補正量,平行移動量)を、補正量として
用いればよい。すなわち、この補正量を用いて一方の罫
線特徴リストに補正を加えることにより、2つの罫線特
徴リストは最も良く一致することになる。図5の例で実
際に算出してみると、(スケーリング補正量,平行移動
量)=(0.9,10)において(累積投票値)=3の
最大累積投票値を持つ。このことから、今の場合、基準
帳票102の罫線特徴の位置を0.9倍し、さらに10
だけ平行移動することにより、2つの罫線特徴リストは
最も良く一致することがわかる。
【0078】また、上記の補正量を適用すると、被分類
帳票101の罫線特徴B3のみが基準帳票102側に対
応する罫線特徴を持たないことがわかる。このことか
ら、罫線特徴B3が帳票上の記載事項や書き込み等によ
り誤って検出された罫線成分であることが推測される。
本発明の補正量検出手段109では、このような罫線の
誤検出、あるいは罫線の検出漏れがあっても、投票処理
という多数決原理に基づいて補正量の検出を行うため、
検出される補正量の精度が低下することはない。
【0079】以上の説明では、(スケーリング補正量)
−(平行移動量)平面上に形成された累積投票値が最大
値となるピーク点を探索することにより補正量の検出を
行った。しかし、実際には罫線特徴検出時の誤差や、元
々の帳票の印刷精度などにより、投票を行う直線群が厳
密に一点で交わることは希であり、同平面上のピークを
探索しても補正量を検出できないことも多い。そこで、
補正量検出手段109の他の実施例として、(スケーリ
ング補正量)−(平行移動量)平面を、図6のようにス
ケーリング補正量方向にn分割、平行移動量方向にm分
割したセル領域に分割して、各セル領域への投票値の累
計を計算し、該累計が最大となるピークセルを求める方
法も考えられる。そして左記ピークセルの中心座標(k
c,sc)を以って罫線特徴の補正量とする。
【0080】さらに高精度の補正量を求めるためには、
図7に示したように、投票値の累計が最大となるピーク
セルを求めた後、投票を行う直線群の中からピークセル
領域を通過する直線群のみを選び、それら直線群から最
小距離に位置する点の座標を求めると良い。このような
点の座標は以下の手順により求めることができる。
【0081】投票値の累計が最大となるピークセルを通
過する直線群がh本あるとして、それらが式5で表され
るとする。
【0082】
【数5】 ただしi=0,1,…,h−1とする。これらの直線の
一つと(スケーリング補正量)−(平行移動量)平面上
の一点(k,s)との距離diの間には式6の関係があ
る。
【数6】 次に、点(k,s)から各直線までの距離の2乗和をD
とすると式7となる。
【数7】 従って、投票値の累計が最大となるピークセルを通過す
る直線群から最小距離に位置する点の座標(kl,s
l)は、式8および式9を連立して解くことによって求
めることができる。
【数8】
【数9】 ここで、Dは、式7で求めたものである。
【0083】さらに、直線群から最小距離に位置する点
の座標を求める際に、各直線からの距離を式4に定めた
投票値Vで重み付けしても良い。投票値Vによる重み付
けを行うことにより、罫線の対応付けが正しく行われて
いる可能性が高い直線を重視した補正量検出が行なわれ
る。この場合、式7は式10のように変更される。
【0084】
【数10】 式10においてViはi番目の直線上への投票値であ
る。
【0085】補正罫線算出手段である罫線特徴補正手段
108では、補正量検出手段109で検出された補正量
に基いて、基準帳票102の罫線特徴リストの補正を行
う。補正量検出手段109で検出されたスケーリング補
正量をk、平行移動量をsとし、基準帳票102の罫線
特徴リストにおけるi番目の罫線特徴の補正前の位置を
Aiとすると、補正後の位置A’iは、式11のように
して求められる。
【0086】
【数11】 なお、水平・垂直方向ともに同じ式で求められる。
【0087】罫線特徴照合手段107では、罫線特徴補
正手段108で補正を受けた基準帳票の罫線特徴リスト
と、被分類帳票101から生成された罫線特徴リストと
の照合が行なわれ、両者の類似度が測定される。上記2
つの罫線特徴リストが同一様式のものであっても、画像
入力手段104の読み取り精度や、被分類帳票101上
への記載事項や書き込み、補正量検出手段109の補正
量検出誤差など、様々な理由により両罫線特徴リスト内
のそれぞれの罫線位置や罫線強度などが厳密に一致する
ことは少ない。また、罫線特徴抽出手段105におい
て、罫線の誤検出や検出漏れが発生している場合もあ
る。従って罫線特徴照合手段107では、罫線特徴の誤
差や罫線の誤検出・検出漏れに対しても、堅牢な方法で
類似度の測定を行う必要がある。
【0088】罫線特徴照合手段107の一実施例として
は、罫線特徴補正手段108で補正を受けた基準帳票1
02の罫線特徴リストと、被分類帳票101から生成さ
れた罫線特徴リストから、両罫線特徴リストの元となる
投影波形をそれぞれ再合成し、それら再合成された投影
波形間の相関係数を求めることにより、罫線特徴リスト
間の類似度を測定することもできる。以下ではこの方法
についてさらに詳しく説明する。
【0089】被分類帳票101から生成された罫線特徴
リストが図5に示したものであるとき、水平方向(X軸
方向)のライン上における各罫線位置に、対応する罫線
強度を持つ孤立方形波群から成る波形を、図8(A)の
ように生成する。図5の罫線特徴は、罫線の位置、強度
から成る2次元特徴ベクトルであり、罫線の幅に関する
情報は持たないので、方形波の幅は適当な固定値を用い
ている。罫線特徴リストに罫線の幅に関する情報も含ま
れている場合は、この情報を方形波の幅に反映させて方
形波毎に幅を変えても良い。
【0090】この波形を低域濾波した波形を図8(b)
に示す。この波形は、適切なしきい値処理手段203と
罫線特徴算出手段204を用いて罫線特徴抽出を行え
ば、元の罫線特徴リストを生成することができるので、
罫線特徴リストから再合成された投影波形ととらえるこ
とができる。同様にして、罫線特徴補正手段108で補
正を受けた基準帳票102の罫線特徴リストからも投影
波形を再合成することができる。
【0091】このようにして、罫線特徴補正手段108
で補正を受けた基準帳票102の罫線特徴リストと、被
分類帳票101から生成された罫線特徴リストから、そ
れぞれ投影波形の再合成を行い、両投影波形の相関係数
を求めることにより、罫線特徴リスト間の類似度を測定
する。上記の再合成された投影波形のように、各罫線特
徴の位置周辺に広く分布する波形を相関係数の計測に用
いることにより、元の罫線特徴の位置や強度に若干の誤
差が含まれていても求められる相関係数には大きな影響
はない。
【0092】罫線特徴補正手段108で補正を受けた基
準帳票102の罫線特徴リストから再合成した投影波形
をR(x)、被分類帳票101の罫線特徴リストから再
合成した投影波形をs(x)とすると、両者の相関係数
Rは式12のように求められる。
【0093】
【数12】 式12においてLは波形の長さを表す。
【0094】以上の様にして水平・垂直方向に関する相
関係数がそれぞれ求められる。罫線特徴照合手段107
から出力される帳票の類似度は、これら2つの測定結果
を加味したものとする必要がある。
【0095】一例としては、水平・垂直方向について求
められた相関係数の和を、罫線特徴照合手段107が出
力する類似度としても良い。また別の例として、2方向
の相関係数の荷重和を類似度とする方法もある。これ場
合、水平方向の相関係数とその重みをそれぞれRh、w
h、垂直方向の相関係数をRVとしたとき、罫線特徴照
合手段107が出力する類似度Scoreは、式13の
ように表される。
【0096】
【数13】 どちらかの方向相関係数が帳票の違いをより強く反映し
ている場合には、式13によってその方向により大きな
重み付けをして類似度の計算を行うことにより、帳票分
類の精度を向上させることができる。
【0097】さらに、補正量検出手段109で検出され
た補正量を類似度に反映させることもできる。これは、
帳票上のマージン幅やスケールが大きく異なる帳票は別
様式として扱いたい場合などに適する。この場合、水平
・垂直方向の相関係数や、スケーリング補正量、平行移
動量などの荷重和により定義される、合成変量Zを作
り、大量の帳票サンプルを用いた判別分析により各重み
を調整することで、各帳票様式を分類する判別関数を求
めることができる。判別分析については多くの文献に解
説されているため、詳細は割愛する。
【0098】このようにして被分類帳票101は、帳票
様式データベース106に記憶されたそれぞれの帳票様
式との類似度が測定され、最も高い類似度を有する基準
帳票102と同一の帳票様式に属するものとして分類さ
れる。
【0099】類似度の測定は原則として、帳票様式デー
タベース106に記憶された全ての帳票様式に対応する
罫線特徴リストに対して為されるが、業務によってはあ
る特定の帳票様式のみを扱う場合もある。そのような場
合には必要な帳票様式に対応する罫線特徴リストとのみ
照合を行うことにより、帳票分類処理を高速化すること
も可能である。
【0100】これまでの実施例では、補正量検出手段1
09において、(スケーリング補正量)−(平行移動
量)平面上に形成された累積投票値が最大値を取るピー
ク点を探索し、そのピーク点の座標を(スケーリング補
正量,平行移動量)とする唯一の補正量として用いてき
た。しかし、上記平面上では大きな累積投票値を持つ点
が複数点形成されることも希ではなく、罫線特徴抽出の
過程で多少の誤りが含まれている場合は、累積投票値に
おいて2位以下のピーク点に対応する補正量が正しい補
正量となる場合もある。このような場合を想定して、上
記平面に形成された累積投票値の中で、例えば累積投票
値の上位のほうから所定数の点の座標を求め、それぞれ
の点の座標に対応する複数通りの補正量で罫線特徴リス
トの補正を行う方法も考えられる。そして、上記複数通
りの補正量を用いて補正した罫線特徴リストを用いて複
数通りの投影波形を再合成し、これらと基準帳票側の再
合成された投影波形との類似度を順次算出して照合し、
全照合の中で最大の類似度を最終的な類似度とすること
で、より確実な帳票分類処理を行うことが可能となる。
投影波形の再合成は、対象帳票側の投影波形が複数通り
で基準帳票側の投影波形が一通りの場合の他、対象帳票
側の投影波形が一通りで基準帳票側の投影波形が複数通
りの場合、対象帳票側の投影波形が複数通りで基準帳票
側の投影波形が複数通りの場合についても行うことがで
きる。
【0101】また、(スケーリング補正量)−(平行移
動量)平面上に形成された累積投票値が、2つの罫線特
徴リストの一致度を反映していると言う点に着目すれ
ば、この投票値自体を2つの罫線特徴リストの類似度と
見なすことができる場合もある。もしも罫線の誤検出、
あるいは罫線の検出漏れが無いことが保証できる場合
は、上記投票値自体を類似度として使用し、罫線特徴補
正手段108や罫線特徴照合手段107を省くことがで
きる。しかし、多くの場合は上記の仮定は成立しないた
めに罫線特徴リストの補正と、相関係数などによる類似
度測定が必要となる。
【0102】以上、対象帳票101を複数の帳票様式分
類に自動分類する場合を説明した。帳票は画像の一種で
あるので、対象画像を所定の処理に供するため、基準画
像と類似照合を行う場合にも、同様に本発明が実施でき
る。
【0103】例えば、カラー画像を濃度成分と色成分に
分離し、濃度画像について、垂直・水平方向のラインに
沿ってその投影波形を求め、所定のしきい値を超える連
続した部分を画像特徴部分とすることができる。そこで
対象画像と基準画像につき画像特徴部分をそれぞれ求
め、それらの位置について対応付けを行い、対象画像の
画像特徴部分全体と、基準画像の画像特徴部分全体との
間で補正を行うことができる。そして、補正後の対象画
像の画像特徴部分と、基準画像の画像特徴部分との間の
類似度を算出することで、対象画像と基準画像の類似照
合を行う。
【0104】このように、帳票様式分類装置等について
詳細に説明した内容が、画像の照合に適用できる。
【0105】
【発明の効果】本発明の帳票様式分類装置によれば、様
式識別のための識別番号や記号、バーコード等を帳票上
に持つことが不要となり、帳票への記載事項や押印、書
き込み等があっても安定した分類結果を得ることがで
き、入力帳票画像の倍率の違いや位置ずれを許容し、か
つ帳票上の罫線の間隔や本数などに特定の制約を設け
ず、多様な帳票様式に対応することができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係る帳票様式分類装置
のブロック図である。
【図2】 本発明の実施の形態に係る帳票様式分類装置
の、罫線特徴抽出手段のブロック図である。
【図3】 本発明の実施の形態に係る帳票様式分類装置
における、投影波形の移動平均値を用いるしきい値設定
法を示す図である。
【図4】 本発明の実施の形態に係る帳票様式分類装置
における、罫線特徴抽出の処理過程を示す図である。
【図5】 本発明の実施の形態に係る帳票様式分類装置
における、罫線特徴リストの例である。
【図6】 本発明の実施の形態に係る帳票様式分類装置
における、補正量検出法の一例を示す図である。
【図7】 本発明の実施の形態に係る帳票様式分類装置
における、補正量検出法の他の一例を示す図である。
【図8】 本発明の実施の形態に係る帳票様式分類装置
における、投影波形の再合成方法を説明する図である。
【符号の説明】
101 被分類帳票(対象帳票)、102 基準帳票
(帳票様式)、103 罫線特徴リスト、104 画像入
力手段、105 罫線特徴抽出手段、106 帳票様式
データベース、107 罫線特徴照合手段、108 罫
線特徴補正手段(補正罫線算出手段)、109 補正量
検出手段(補正量推定手段)、201 帳票画像デー
タ、202 水平方向投影形成手段、203,206
しきい値処理手段、204,207 罫線特徴算出手
段、205 垂直方向投影形成手段。

Claims (25)

    【特許請求の範囲】
  1. 【請求項1】 対象帳票の画像と、複数の帳票様式の画
    像とを対照し、対象帳票を分類する帳票様式分類装置に
    おいて、 対象帳票の画像から、罫線位置を含む罫線特徴を抽出す
    る罫線特徴抽出手段と、 前記複数の帳票様式の各々の帳票様式における、罫線位
    置を含む罫線特徴を記憶する帳票様式データベースと、 対象帳票の前記各罫線位置と、帳票様式の前記各罫線位
    置との対応関係から、罫線位置につき補正処理を行う補
    正処理手段と、 前記補正処理後の、前記対象帳票画像の罫線特徴と前記
    複数の帳票様式の罫線特徴との照合をそれぞれ行う罫線
    特徴照合手段と、を備え、 前記補正処理手段は、 対象帳票の複数の罫線位置と、帳票様式の複数の罫線位
    置との間の全ての組合せの対応関係に基いて、対象帳票
    と帳票様式との間で前記補正処理を行うことを特徴と
    し、類似度の高い帳票様式に対象帳票を分類して、所定
    の処理に供する帳票様式分類装置。
  2. 【請求項2】 請求項1に記載の帳票様式分類装置にお
    いて、 前記罫線特徴抽出手段は、 対象帳票画像の垂直または水平方向の各座標について、
    前記方向と直角方向のラインに沿った画像の濃度値を累
    積し、対象帳票画像の垂直または水平方向の累積濃度値
    である投影波形を形成する、投影波形形成手段と、 前記投影波形に対して所定のしきい値を超える波形部分
    のみを抽出するしきい値処理手段と、 前記しきい値処理手段により、連続して抽出された波形
    部分毎に、一つの罫線特徴を算出する罫線特徴算出手段
    と、を有することを特徴とする帳票様式分類装置。
  3. 【請求項3】 請求項1に記載の帳票様式分類装置にお
    いて、 前記補正処理手段は、 前記対象帳票の複数の罫線位置の全体と、前記帳票様式
    の複数の罫線位置の全体とが、およそ一致する補正量を
    推定する補正量推定手段と、 前記推定された補正量に基き、前記対象帳票の複数の罫
    線位置の全体または前記帳票様式の複数の罫線位置の全
    体のうち少なくとも一方に対し、補正した罫線位置を算
    出する補正罫線算出手段と、を有することを特徴とする
    帳票様式分類装置。
  4. 【請求項4】 請求項2に記載の帳票様式分類装置にお
    いて、 前記罫線特徴照合手段は、 前記対象帳票の罫線特徴またはその補正処理後の罫線特
    徴に対応する投影波形を再合成する第一の投影波形再合
    成手段と、 前記帳票様式の罫線特徴またはその補正処理後の罫線特
    徴に対応する投影波形を再合成する第二の投影波形再合
    成手段と、 前記第一および第二の投影波形再合成手段により得られ
    た投影波形間の類似度を算出する類似度算出手段と、を
    有することを特徴とする帳票様式分類装置。
  5. 【請求項5】 請求項1または請求項2に記載の帳票様
    式分類装置において、 前記罫線特徴抽出手段はさらに、 対象帳票画像の傾き補正を行う傾き補正手段を、備え、
    傾き補正した対象帳票画像について罫線特徴を抽出する
    ことを特徴とする帳票様式分類装置。
  6. 【請求項6】 請求項2または請求項5に記載の帳票様
    式分類装置において、 前記しきい値処理手段は、 前記投影波形の最大値に対し所定の係数を乗じた値を、
    所定のしきい値として用いることを特徴とする帳票様式
    分類装置。
  7. 【請求項7】 請求項2または請求項5に記載の帳票様
    式分類装置において、 前記しきい値処理手段は、 前記投影波形の平均値に対し所定の係数を乗じた値を、
    所定のしきい値として用いることを特徴とする帳票様式
    分類装置。
  8. 【請求項8】 請求項2または請求項5に記載の帳票様
    式分類装置において、 前記しきい値処理手段は、 前記投影波形のそれぞれの位置について、該位置近傍の
    予め定められた範囲の平均値を移動平均値として求め、
    その移動平均値に対し所定の係数を乗じた値を、所定の
    しきい値として用いることを特徴とする帳票様式分類装
    置。
  9. 【請求項9】 請求項2または請求項5のいずれか一つ
    に記載の帳票様式分類装置において、 前記しきい値処理手段は、 前記投影波形の低域濾波波形に所定の係数を乗じて得ら
    れた波形をしきい値として用いることを特徴とする帳票
    様式分類装置。
  10. 【請求項10】 請求項2または請求項5に記載の帳票
    様式分類装置において、 前記罫線特徴算出手段は、 前記しきい値処理手段により連続して抽出された波形部
    分毎に、その抽出された波形部分の重心位置を算出し、
    その重心位置を罫線位置とすることを特徴とする帳票様
    式分類装置。
  11. 【請求項11】 請求項2または請求項5に記載の帳票
    様式分類装置において、 前記罫線特徴算出手段は、 前記しきい値処理手段により連続して抽出された波形部
    分毎に、その抽出された波形部分の中心位置を算出し、
    その中心位置を罫線位置とすることを特徴とする帳票様
    式分類装置。
  12. 【請求項12】 請求項2または請求項5に記載の帳票
    様式分類装置において、 前記罫線特徴算出手段は、 前記しきい値処理手段により連続して抽出された波形部
    分毎に、抽出された波形部分の最大値を算出し、その値
    を罫線強度とすることを特徴とする帳票様式分類装置。
  13. 【請求項13】 請求項2または請求項5または請求項
    6のいずれか一つに記載の帳票様式分類装置において、 前記罫線特徴算出手段は、 前記しきい値処理手段により連続して抽出された波形部
    分毎に、抽出された波形部分の平均値を算出し、その値
    を罫線強度とすることを特徴とする帳票様式分類装置。
  14. 【請求項14】 請求項3に記載の帳票様式分類装置に
    おいて、 補正量推定手段は、 一方の罫線位置にスケーリング補正量を乗じて平行移動
    量を加えたものを、他方の罫線位置に等しいとしたとき
    に、スケーリング補正量と平行移動量との関係が直線関
    係となる対応関係に基づいて、対象帳票の各罫線位置
    と、前記帳票様式の各罫線位置との対応付けを、全ての
    罫線位置の組合せについて行う全組合せ対応付け手段
    と、 前記スケーリング補正量を一方の座標軸、前記平行移動
    量をそれに直交する他の座標軸にとった、(スケーリン
    グ補正量)−(平行移動量)平面において、前記対応付
    けられた直線の各々につき投票値を定め投票処理を行う
    投票手段と、 該投票処理によって前記(スケーリング補正量)−(平
    行移動量)平面上に形成された累積投票値を算出する累
    積投票値算出手段と、 前記累積投票値が最大値となるピーク座標を特定する投
    票ピーク特定手段と、を有し、前記ピーク座標をもって
    スケーリング補正量および平行移動量とを推定すること
    を特徴とする帳票様式分類装置。
  15. 【請求項15】 請求項14に記載の帳票様式分類装置
    において、 前記投票手段は、 前記対応付けられた二つの罫線位置における相対的な罫
    線強度比に基いた投票値により投票処理がされることを
    特徴とする帳票様式分類装置。
  16. 【請求項16】 請求項14に記載の帳票様式分類装置
    において、 前記投票ピーク特定手段は、 前記(スケーリング補正量)−(平行移動量)平面を複
    数のセル領域に分割し、各セル領域を通過する前記対応
    付けられた直線の数が最大となるピークセルを特定し、 前記ピークセルを通過する前記各直線から最小距離に位
    置する点の座標をもって前記累積投票値が最大値となる
    ピーク座標として特定することを特徴とする帳票様式分
    類装置。
  17. 【請求項17】 請求項16に記載の帳票様式分類装置
    において、 前記投票ピーク特定手段は、さらに、 前記各直線の投票値により、各直線からの距離の重み付
    け処理を行うことを特徴とする帳票様式分類装置。
  18. 【請求項18】 請求項4に記載の帳票様式分類装置に
    おいて、 前記第一または第二の投影波形再合成手段は、 前記対象帳票画像の垂直または水平方向のライン上にお
    ける各罫線位置に、孤立方形波形を形成し、その孤立方
    形波形群を低域濾波して、投影波形を再合成することを
    特徴とする帳票様式分類装置。
  19. 【請求項19】 請求項4に記載の帳票様式分類装置に
    おいて、 前記類似度算出手段は、 前記再合成された第一の投影波形と第一の投影波形との
    間の類似度、ならびに前記スケーリング補正量と平行移
    動量とに基づいて類似度を算出することを特徴とする帳
    票様式分類装置。
  20. 【請求項20】 請求項4に記載の帳票様式分類装置に
    おいて、 前記補正処理手段は、 前記帳票様式の罫線位置の全体と、前記対象帳票の罫線
    位置の全体との間で、補正処理を複数通り行い、 前記罫線特徴照合手段は、 前記第一の投影波形再合成手段または前記第二の投影波
    形再合成手段のうち少なくとも一方は、前記複数通りの
    投影波形を再合成し、 前記第一および第二の投影波形再合成手段により得られ
    た投影波形間の、複数通りの類似度を算出する類似度算
    出手段と、を備え、 前記対象帳票画像の罫線特徴と前記帳票様式の罫線特徴
    についてそれぞれ照合を行い、全照合の中で最大の類似
    度の帳票様式に対象帳票を分類して、所定の処理に供す
    る帳票様式分類装置。
  21. 【請求項21】 請求項1に記載の帳票様式分類装置に
    おいて、 さらに、 対象帳票画像を入力する画像入力手段と、を備えること
    を特徴とする帳票様式分類装置。
  22. 【請求項22】 請求項21に記載の帳票様式分類装置
    において、 さらに、 前記帳票様式分類の罫線位置を含む罫線特徴を前記帳票
    様式データベースに登録する帳票様式登録手段、を有す
    ることを特徴とする帳票様式分類装置。
  23. 【請求項23】 対象画像と、基準画像とを対照し、対
    象画像と基準画像の類似照合を行う画像照合装置におい
    て、 前記基準画像の垂直または水平方向の各座標について、
    前記方向と直角方向に沿った画像の濃度値を累積した投
    影波形を形成し、前記投影波形が所定のしきい値を超え
    る連続した部分を画像特徴部分とし、それぞれの画像特
    徴部分についてその画像特徴部分位置を含む画像特徴部
    分情報を抽出する基準画像特徴部分情報抽出手段と、 前記対象画像の垂直または水平方向の各座標について、
    前記方向と直角方向に沿った画像の濃度値を累積した投
    影波形を形成し、前記投影波形が所定のしきい値を超え
    る連続した部分を画像特徴部分とし、それぞれの画像特
    徴部分についてその画像特徴部分位置を含む画像特徴部
    分情報を抽出する対象画像特徴部分情報抽出手段と、 対象画像の前記各画像特徴部分位置と、比較対照される
    基準画像の各画像特徴部分位置との対応関係から、これ
    らの位置関係につき、スケーリングの補正と平行移動の
    補正を行う補正処理手段と、 前記補正処理後の、前記対象画像の特徴部分情報と前記
    基準画像の画像特徴部分情報とを比較し、類似度を算出
    する画像特徴照合手段と、を備え、 前記補正処理手段は、 対象画像の複数の画像特徴部分位置と、基準画像の複数
    の画像特徴部分位置との間の対応関係に基いて前記補正
    処理を行うことを特徴とし、得られた類似度により、対
    象画像を所定の処理に供する画像照合装置。
  24. 【請求項24】 対象帳票と、複数の帳票様式とを対照
    し、対象帳票を分類する帳票様式分類方法において、 対象帳票の画像から、罫線位置を含む罫線特徴を複数抽
    出する罫線特徴抽出工程と、 前記複数の帳票様式の各々の帳票様式における、罫線位
    置を含む罫線特徴を記憶する帳票様式データベースか
    ら、帳票様式の罫線特徴を読み出す帳票様式罫線特徴読
    み出し工程と、 対象帳票の前記各罫線位置と、前記帳票様式の各罫線位
    置との対応関係から、罫線位置につき補正処理を行う補
    正処理工程と、 前記補正処理後の、前記対象帳票画像の罫線特徴と前記
    複数の帳票様式の罫線特徴との照合をそれぞれ行う罫線
    特徴照合工程と、を備え、 前記補正処理工程は、 対象帳票の複数の罫線位置と、前記帳票様式の複数の罫
    線位置との間の全ての組合せの対応関係に基いて、対象
    帳票と帳票様式との間で前記補正処理を行うことを特徴
    とし、類似度の高い帳票様式に対象帳票を分類して、所
    定の処理に供する帳票様式分類方法。
  25. 【請求項25】 対象帳票と、複数の帳票様式とを対照
    し、対象帳票を分類する帳票様式分類プログラムにおい
    て、 前記複数の帳票様式の各々の帳票様式における、罫線位
    置を含む罫線特徴を記憶する帳票様式データベースに接
    続されたコンピュータに、 対象帳票の画像から、罫線位置を含む罫線特徴を複数抽
    出する罫線特徴抽出処理手順と、 前記帳票様式データベースから、帳票様式の罫線特徴を
    読み出す帳票様式罫線特徴読み出し処理手順と、 対象帳票の前記各罫線位置と、前記帳票様式の各罫線位
    置との対応関係から、罫線位置につき補正処理を行う補
    正処理手順と、 前記補正処理後の、前記対象帳票画像の罫線特徴と前記
    複数の帳票様式の罫線特徴との照合をそれぞれ行う罫線
    特徴照合処理手順と、を実行させ、 前記補正処理手順は、 対象帳票の複数の罫線位置と、前記帳票様式の複数の罫
    線位置との間の全ての組合せの対応関係に基いて、対象
    帳票と帳票様式との間で前記補正処理を行うことを特徴
    とし、類似度の高い帳票様式に対象帳票を分類して、所
    定の処理に供する帳票様式分類プログラム。
JP2001302004A 2001-09-28 2001-09-28 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 Pending JP2003109007A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001302004A JP2003109007A (ja) 2001-09-28 2001-09-28 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001302004A JP2003109007A (ja) 2001-09-28 2001-09-28 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置

Publications (1)

Publication Number Publication Date
JP2003109007A true JP2003109007A (ja) 2003-04-11

Family

ID=19122325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001302004A Pending JP2003109007A (ja) 2001-09-28 2001-09-28 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置

Country Status (1)

Country Link
JP (1) JP2003109007A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049212A (ja) * 2003-07-28 2005-02-24 Fuji Xerox Co Ltd 印刷品質検査装置及び方法
JP2006287915A (ja) * 2005-03-10 2006-10-19 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、画像処理方法及びプログラム
JP2007304893A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP2007304892A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP2007304894A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP2010231431A (ja) * 2009-03-26 2010-10-14 Dainippon Printing Co Ltd 記事関連情報提供方法、装置、プログラム、記録媒体
CN102467739A (zh) * 2010-10-29 2012-05-23 夏普株式会社 图像判断装置、图像提取装置以及图像判断方法
JP2016081380A (ja) * 2014-10-20 2016-05-16 富士通フロンテック株式会社 帳票処理プログラム及び帳票処理装置
EP3151159A1 (en) 2015-09-30 2017-04-05 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method and program
WO2017208367A1 (ja) * 2016-05-31 2017-12-07 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
US10049269B2 (en) 2015-09-30 2018-08-14 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049212A (ja) * 2003-07-28 2005-02-24 Fuji Xerox Co Ltd 印刷品質検査装置及び方法
JP4661034B2 (ja) * 2003-07-28 2011-03-30 富士ゼロックス株式会社 印刷品質検査装置及び方法
US7856146B2 (en) 2005-03-10 2010-12-21 Fuji Xerox Co., Ltd. Image processing device, image forming device, image processing method and program
JP2006287915A (ja) * 2005-03-10 2006-10-19 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、画像処理方法及びプログラム
JP4720529B2 (ja) * 2005-03-10 2011-07-13 富士ゼロックス株式会社 画像処理装置、画像形成装置、画像処理方法及びプログラム
JP4687558B2 (ja) * 2006-05-11 2011-05-25 富士ゼロックス株式会社 画像照合装置、画像照合方法及びプログラム
JP2007304894A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP2007304892A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP4687557B2 (ja) * 2006-05-11 2011-05-25 富士ゼロックス株式会社 画像照合装置及びプログラム
JP4692377B2 (ja) * 2006-05-11 2011-06-01 富士ゼロックス株式会社 画像照合装置、画像照合方法及びプログラム
JP2007304893A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像照合装置、画像照合方法及びプログラム
JP2010231431A (ja) * 2009-03-26 2010-10-14 Dainippon Printing Co Ltd 記事関連情報提供方法、装置、プログラム、記録媒体
CN102467739A (zh) * 2010-10-29 2012-05-23 夏普株式会社 图像判断装置、图像提取装置以及图像判断方法
JP2016081380A (ja) * 2014-10-20 2016-05-16 富士通フロンテック株式会社 帳票処理プログラム及び帳票処理装置
EP3151159A1 (en) 2015-09-30 2017-04-05 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method and program
US9818028B2 (en) 2015-09-30 2017-11-14 Fuji Xerox Co., Ltd. Information processing apparatus for obtaining a degree of similarity between elements
US10049269B2 (en) 2015-09-30 2018-08-14 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium
WO2017208367A1 (ja) * 2016-05-31 2017-12-07 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
US10810743B2 (en) 2016-05-31 2020-10-20 Pfu Limited Image processing device, image processing method, and computer program product

Similar Documents

Publication Publication Date Title
CN109658584B (zh) 一种票据信息识别方法及装置
US11151369B2 (en) Systems and methods for classifying payment documents during mobile image processing
US6424728B1 (en) Method and apparatus for verification of signatures
KR101515256B1 (ko) 동적 문서 식별 프레임워크를 사용한 문서 검증
CN110766014A (zh) 票据信息定位方法、系统及计算机可读存储介质
KR101446376B1 (ko) 고유 이미지 프로세스에 따른 미지 문서의 식별 및 검증
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
Van Beusekom et al. Text-line examination for document forgery detection
JP4932177B2 (ja) 硬貨分類装置および硬貨分類方法
US20140003717A1 (en) System and method for forms classification by line-art alignment
JP4796169B2 (ja) デジタル画像の向きの判定方法
JP2003109007A (ja) 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
JP5110793B2 (ja) 帳票識別装置
CN114359553A (zh) 一种基于物联网的签章定位方法、系统及存储介质
JP4661034B2 (ja) 印刷品質検査装置及び方法
CN104899551B (zh) 一种表单图像分类方法
CN114694161A (zh) 一种特定版式证件的文本识别方法、设备及存储介质
US7251349B2 (en) Automatic table locating technique for documents
KR101486495B1 (ko) 사후 광학 문자 인식 처리에서의 형상 클러스터링 기법
JP4140221B2 (ja) 画像照合装置および画像照合プログラム
CA2036274A1 (en) Document processor including method and apparatus for identifying and correcting errors
CN115497114A (zh) 一种卷烟物流收货票据的结构化信息提取方法
JPWO2010113217A1 (ja) 文字認識装置及び文字認識方法
Van Beusekom et al. Document signature using intrinsic features for counterfeit detection
CN108932788A (zh) 一种纸币厚度异常等级的检测方法、装置及设备