JP2014016921A - Form type discrimination apparatus and form type discrimination method - Google Patents

Form type discrimination apparatus and form type discrimination method Download PDF

Info

Publication number
JP2014016921A
JP2014016921A JP2012155238A JP2012155238A JP2014016921A JP 2014016921 A JP2014016921 A JP 2014016921A JP 2012155238 A JP2012155238 A JP 2012155238A JP 2012155238 A JP2012155238 A JP 2012155238A JP 2014016921 A JP2014016921 A JP 2014016921A
Authority
JP
Japan
Prior art keywords
differential image
image
compressed
histogram
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012155238A
Other languages
Japanese (ja)
Other versions
JP6039944B2 (en
Inventor
Mayumi Ueda
真弓 植田
Masanori Yokota
政憲 横田
Shigeko Fumino
滋子 文野
Takeshi Nozaki
剛 野崎
Masafumi Maeda
雅史 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP2012155238A priority Critical patent/JP6039944B2/en
Publication of JP2014016921A publication Critical patent/JP2014016921A/en
Application granted granted Critical
Publication of JP6039944B2 publication Critical patent/JP6039944B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To precisely discriminate the type of forms bearing characters and graphics, a seal of approval, a barcode label, etc.SOLUTION: The form type determination method includes the steps of: extracting an edge by searching an image of a form in a y-direction to create a first edge image which is binarized based on the presence/absence of the edge (S3); creating a first compressed image by compressing the first edge image in an x-direction (S4); creating a first histogram in which black pixels present in the x-direction in the first compressed image are plotted at corresponding positions in the y-direction (S5); calculating a first matching degree by comparing the black pixels present in the x-direction in pre-registered various forms and a first standardized histogram plotted at corresponding positions in the y-direction (S6); and outputting a type discrimination result of the form on the basis of the first matching degree.

Description

本発明は、背景と罫線の濃度差が小さい帳票、文字・図形が記入された帳票、出納印が押された帳票またはバーコードラベルが貼付された帳票等の帳票種類を判別することができる帳票種類判別装置および帳票種類判別方法に関する。   The present invention is capable of discriminating a form type such as a form having a small density difference between a background and a ruled line, a form on which characters / graphics are entered, a form on which a cashier stamp is pressed, or a form on which a barcode label is attached. The present invention relates to a type discrimination device and a form type discrimination method.

従来、撮像装置で帳票を撮像した帳票画像から得られる帳票長さ分布パターンを予め登録した帳票長さ分布パターンと比較して帳票の種別の候補を求める帳票書式識別装置が知られている(特許文献1参照)。   2. Description of the Related Art Conventionally, there is known a form format identifying device that compares a form length distribution pattern obtained from a form image obtained by capturing an image with an image pickup apparatus with a pre-registered form length distribution pattern to obtain a candidate for a form type (patent) Reference 1).

この特許文献1では、帳票画像から罫線を抽出して罫線長さ分布パターンと罫線間隔を求め、求めた罫線長さ分布パターンを予め登録された各種帳票の罫線長さ標準分布パターンとを比較して、いくつかの一致度が高い種類を候補とする。そして、各候補の罫線間隔と予め登録された各候補の標準罫線間隔とを複数の区画領域に分けて比較して各候補の帳票画像の伸縮率を求め、その伸縮率に基づいて各候補の罫線間隔および罫線位置を正規化し、伸縮が無い場合の罫線間隔および罫線位置を計算し、各候補の罫線間隔および罫線位置と予め登録しておいた各候補の標準罫線間隔および標準罫線位置とを比較し、最も一致度が高い種類を判別結果として出力する点が開示されている。   In this Patent Document 1, ruled lines are extracted from a form image to obtain a ruled line length distribution pattern and a ruled line interval, and the obtained ruled line length distribution pattern is compared with a standard ruled line length distribution pattern of various forms registered in advance. Thus, several types having a high degree of coincidence are candidates. Then, the ruled line interval of each candidate and the standard ruled line interval of each candidate registered in advance are divided into a plurality of divided areas and compared to obtain the expansion rate of each candidate form image. Based on the expansion rate, Normalize the ruled line spacing and ruled line position, calculate the ruled line spacing and ruled line position when there is no expansion and contraction, and calculate the candidate ruled line spacing and ruled line position and the standard ruled line spacing and standard ruled line position of each candidate registered in advance. It is disclosed that the type having the highest degree of coincidence is output as a discrimination result.

また、この特許文献1には、帳票画像から罫線を抽出して罫線間隔を求め、求めた罫線間隔と予め登録された各種帳票の標準罫線間隔とを複数の区画領域に分けて比較して各候補の帳票画像の伸縮率を求め、その伸縮率に基づいて各候補の罫線間隔および罫線位置を正規化し、伸縮が無い場合の罫線間隔および罫線位置を推定し、各候補の罫線間隔および罫線位置と予め登録された各候補の標準罫線間隔および標準罫線位置とを比較し、最も一致度が高い種類を判別結果として出力する点が開示されている。   Further, in Patent Document 1, ruled lines are extracted from a form image to obtain ruled line intervals, and the obtained ruled line intervals and standard ruled line intervals of various registered forms are divided into a plurality of divided areas and compared. Obtain the stretch rate of the candidate form image, normalize the ruled line spacing and ruled line position of each candidate based on the stretch rate, estimate the ruled line spacing and ruled line position when there is no stretch, and each candidate ruled line spacing and ruled line position And the standard ruled line interval and standard ruled line position of each candidate registered in advance, and the type with the highest degree of matching is output as a discrimination result.

特開2000−123174号公報JP 2000-123174 A

しかしながら、上記従来の帳票書式識別装置では、背景と罫線の濃度差が小さい帳票に対しては、罫線を抽出する画像上で罫線がかすれてしまい、罫線をうまく抽出することができず、帳票の種類を精度良く判別することができない問題点があった。   However, in the above-described conventional form format identification device, for a form having a small density difference between the background and the ruled line, the ruled line is blurred on the image from which the ruled line is extracted, and the ruled line cannot be extracted well. There was a problem that the type could not be accurately identified.

また、文字・図形が記入された帳票、出納印が押された帳票、バーコードラベルが貼付された帳票等の画像に対しては、文字、出納印及びバーコードラベル等がノイズになってしまい、罫線をうまく抽出することができず、帳票種類の判別精度が低下するという問題点があった。   In addition, for images such as forms with letters / graphics, forms with stamps on and off, forms with barcode labels attached, etc., the characters, banknotes and barcode labels will be noisy. However, there is a problem that the ruled line cannot be extracted well and the discrimination accuracy of the form type is lowered.

本発明は、上記従来技術の課題を解決するためになされたものであって、背景と罫線の濃度差が小さい帳票、文字・図形が記入された帳票、出納印が押された帳票またはバーコードラベルが貼付された帳票等の帳票種類を精度良く判別することができる帳票種類判別装置および帳票種類判別方法を提供することを目的とする。   The present invention has been made to solve the above-described problems of the prior art, and is a form having a small density difference between the background and the ruled line, a form on which characters / graphics are entered, a form on which a cashier is pressed, or a barcode. It is an object of the present invention to provide a form type discriminating apparatus and a form type discriminating method capable of accurately discriminating a form type such as a form with a label attached thereto.

上記の課題を解決するため、本発明は、帳票の帳票画像を縦方向または横方向に微分して2値化した微分画像を生成する微分画像生成手段と、前記微分画像生成手段により生成された微分画像を横方向または縦方向に圧縮した圧縮微分画像を生成する圧縮微分画像生成手段と、前記圧縮微分画像生成手段により生成された圧縮微分画像に関する所定の特徴量を生成する特徴量生成手段と、予め登録された各帳票に関する圧縮微分画像の特徴量と前記特徴量生成手段により生成された特徴量とを用いて合致度を算出する合致度算出手段と、前記合致度算出手段により算出された合致度に基づいて帳票の種類判別結果を出力する出力手段とを備えたことを特徴とする。   In order to solve the above problems, the present invention is generated by a differential image generation unit that generates a differential image obtained by binarizing a form image of a form in the vertical direction or the horizontal direction, and the differential image generation unit. A compressed differential image generating unit that generates a compressed differential image obtained by compressing the differential image in the horizontal direction or the vertical direction, and a feature amount generating unit that generates a predetermined feature amount related to the compressed differential image generated by the compressed differential image generating unit; , A degree-of-match calculation unit that calculates a degree of match using a feature amount of a compressed differential image related to each form registered in advance and a feature amount generated by the feature amount generation unit, and the degree-of-match calculation unit Output means for outputting a result of discriminating the form type based on the degree of match.

また、本発明は、上記の発明において、前記圧縮微分画像生成手段は、前記帳票における第1の所定の長さの画素を前記微分画像生成手段により生成された微分画像における1画素とし、且つ、前記第1の所定の長さの画素のうち第2の所定数の画素が連続してエッジ部分を形成する画素であった場合にのみ該画素の画素値をエッジ部分に割り当てた画素値とする最小値圧縮を横方向または縦方向におこなって圧縮微分画像を生成することを特徴とする。   In the invention described above, the compressed differential image generation unit may set the pixel of the first predetermined length in the form as one pixel in the differential image generated by the differential image generation unit, and Only when the second predetermined number of pixels among the pixels having the first predetermined length are pixels that continuously form the edge portion, the pixel value of the pixel is set to the pixel value assigned to the edge portion. A minimum differential compression is performed in the horizontal direction or the vertical direction to generate a compressed differential image.

また、本発明は、上記の発明において、前記特徴量生成手段は、前記圧縮微分画像に含まれるエッジ部分を形成する画素の画素数を横方向または縦方向に累積加算したヒストグラムを前記特徴量として生成し、前記合致度算出手段は、予め登録された各帳票に関する圧縮微分画像の標準ヒストグラムと前記特徴量生成手段により生成された特徴量とを用いて合致度を算出することを特徴とする。   Further, in the present invention according to the above invention, the feature amount generation unit may use, as the feature amount, a histogram obtained by cumulatively adding the number of pixels forming the edge portion included in the compressed differential image in the horizontal direction or the vertical direction. The degree-of-match calculation unit generates the degree of match using a standard histogram of a compressed differential image relating to each form registered in advance and the feature amount generated by the feature amount generation unit.

また、本発明は、上記の発明において、前記特徴量生成手段は、前記圧縮微分画像に含まれるエッジ部分を形成する画素の画素数を横方向または縦方向に累積加算したヒストグラムを前記標準ヒストグラムに合わせた大きさに正規化する正規化手段をさらに備えたことを特徴とする。   Further, in the present invention according to the above invention, the feature amount generation unit may add a histogram obtained by cumulatively adding the number of pixels forming the edge portion included in the compressed differential image in the horizontal direction or the vertical direction to the standard histogram. It further comprises normalizing means for normalizing to the combined size.

また、本発明は、上記の発明において、前記合致度算出手段は、各種帳票の標準ヒストグラムに設定された各区画領域毎に前記標準ヒストグラム中のピーク位置と前記ヒストグラム中のピーク位置が合致する位置を求め、求めた位置に合致するように前記ヒストグラムを補正し、補正したヒストグラムと標準ヒストグラムとを比較して合致度を算出することを特徴とする。   Further, according to the present invention, in the above invention, the matching degree calculation unit is a position where the peak position in the standard histogram matches the peak position in the histogram for each partition area set in the standard histogram of various forms. The histogram is corrected so as to match the calculated position, and the degree of match is calculated by comparing the corrected histogram with a standard histogram.

また、本発明は、上記の発明において、前記出力手段は、前記合致度の高い帳票種類に関連して設定された印字領域に対応する前記帳票画像上の対応領域を前記位置ずれ量に基づいて求め、前記対応領域中の文字を抽出し、該抽出した文字が前記合致度の高い帳票種類に関連して設定された印字文字と認識できた帳票の種類を出力することを特徴とする。   Further, in the present invention according to the above invention, the output unit may determine a corresponding area on the form image corresponding to a print area set in relation to the form type having a high degree of matching based on the positional deviation amount. Then, a character in the corresponding area is extracted, and a form type that can be recognized as a print character set in relation to the form type having a high degree of coincidence is output.

また、本発明は、帳票の帳票画像を縦方向に微分して2値化した第一微分画像および帳票の帳票画像を横方向に微分して2値化した第二微分画像を生成する微分画像生成手段と、前記微分画像生成手段により生成された第一微分画像を横方向に圧縮した第一圧縮微分画像および前記微分画像生成手段により生成された第二微分画像を縦方向に圧縮した第二圧縮微分画像を生成する圧縮微分画像生成手段と、前記圧縮微分画像生成手段により生成された第一圧縮微分画像に関する第一特徴量および前記圧縮微分画像生成手段により生成された第二圧縮微分画像に関する第二特徴量を生成する特徴量生成手段と、予め登録された各帳票に関する第一特徴量および第二特徴量と前記特徴量生成手段により生成された第一特徴量および第二特徴量とを用いて合致度を算出する合致度算出手段と、前記合致度算出手段により算出された合致度に基づいて帳票の種類判別結果を出力する出力手段とを備えたことを特徴とする。   The present invention also provides a differential image that generates a first differential image obtained by differentiating a form image of a form in the vertical direction and binarized, and a second differential image obtained by differentiating the form form image in the horizontal direction and binarized. A first compressed differential image in which the first differential image generated by the differential image generation unit is compressed in the horizontal direction and a second compressed image in which the second differential image generated by the differential image generation unit is compressed in the vertical direction. A compressed differential image generating unit configured to generate a compressed differential image; a first feature amount relating to the first compressed differential image generated by the compressed differential image generating unit; and a second compressed differential image generated by the compressed differential image generating unit. A feature amount generating means for generating a second feature amount; a first feature amount and a second feature amount relating to each form registered in advance; and a first feature amount and a second feature amount generated by the feature amount generating means. And matching degree calculation means for calculating a degree of match you are, characterized in that an output means for outputting the type determination result of the form based on the matching degree calculated by the matching degree calculating unit.

また、本発明は、帳票の帳票画像を縦方向または横方向に微分して2値化した微分画像を生成する微分画像生成工程と、前記微分画像生成工程により生成された微分画像を横方向または縦方向に圧縮した圧縮微分画像を生成する圧縮微分画像生成工程と、前記圧縮微分画像生成工程により生成された圧縮微分画像に関する所定の特徴量を生成する特徴量生成工程と、予め登録された各帳票に関する圧縮微分画像の特徴量と前記特徴量生成工程により生成された特徴量とを用いて合致度を算出する合致度算出工程と、前記合致度算出工程により算出された合致度に基づいて帳票の種類判別結果を出力する出力工程とを含んだことを特徴とする。   The present invention also provides a differential image generation step for generating a differential image obtained by differentiating a form image of a form in the vertical direction or the horizontal direction and binarizing the differential image generated by the differential image generation step in the horizontal direction or A compressed differential image generating step for generating a compressed differential image compressed in the vertical direction, a feature amount generating step for generating a predetermined feature amount related to the compressed differential image generated by the compressed differential image generating step, and each of the pre-registered A matching degree calculation step of calculating a matching degree using the feature amount of the compressed differential image relating to the form and the feature amount generated by the feature amount generation step; and a form based on the matching degree calculated by the matching degree calculation step And an output process for outputting the type discrimination result.

本発明に係る帳票種類判別装置および帳票種類判別方法によれば、背景と罫線の濃度差が小さい帳票、文字・図形が記入された帳票、出納印が押された帳票またはバーコードラベルが貼付された帳票から、精度良く罫線を抽出することができる。   According to the form type discriminating apparatus and form type discriminating method according to the present invention, a form having a small density difference between the background and the ruled line, a form on which characters / graphics are entered, a form on which a cashier stamp is pressed, or a bar code label is attached. A ruled line can be extracted with high accuracy from a form.

図1は、本実施例に係る帳票種類判別装置の構成を示すブロック図である。FIG. 1 is a block diagram illustrating a configuration of a form type discriminating apparatus according to the present embodiment. 図2は、本実施例に係る帳票種類判別装置の処理を示すフロー図(1)である。FIG. 2 is a flowchart (1) showing the processing of the form type discriminating apparatus according to the present embodiment. 図3は、本実施例に係る帳票種類判別装置の処理を示すフロー図(2)である。FIG. 3 is a flowchart (2) showing the processing of the form type discriminating apparatus according to the present embodiment. 図4は、傾き補正後の帳票画像Gを示す例示図である。FIG. 4 is an exemplary diagram showing a form image G after tilt correction. 図5は、第一エッジ画像E1を示す例示図である。FIG. 5 is an exemplary diagram showing the first edge image E1. 図6は、第一圧縮画像F1を示す例示図である。FIG. 6 is an exemplary diagram showing the first compressed image F1. 図7は、第一ヒストグラムH1を示す例示図である。FIG. 7 is an exemplary diagram showing the first histogram H1. 図8は、各種帳票Ca〜Cdとそれらについての第一標準ヒストグラムHa〜Hdを示す例示図である。FIG. 8 is an exemplary diagram showing various forms Ca to Cd and first standard histograms Ha to Hd about them. 図9は、第一標準ヒストグラムHaに関連して予め登録された区画領域A1〜A7を示す説明図である。FIG. 9 is an explanatory diagram showing the partitioned areas A1 to A7 registered in advance in relation to the first standard histogram Ha. 図10は、第一ヒストグラムH1の大きなピークと第一標準ヒストグラムHaの大きなピークの位置ずれ量y1〜y7を示す説明図である。FIG. 10 is an explanatory diagram showing positional deviation amounts y1 to y7 between the large peak of the first histogram H1 and the large peak of the first standard histogram Ha. 図11は、第二エッジ画像E2を示す例示図である。FIG. 11 is an exemplary diagram showing the second edge image E2. 図12は、第二圧縮画像F2を示す例示図である。FIG. 12 is an exemplary diagram showing the second compressed image F2. 図13は、第二ヒストグラムH2を示す例示図である。FIG. 13 is an exemplary diagram showing the second histogram H2. 図14は、各種帳票Ca〜Cdとそれらについての第二標準ヒストグラムJa〜Jdを示す例示図である。FIG. 14 is an exemplary diagram showing various forms Ca to Cd and second standard histograms Ja to Jd about them. 図15は、第二標準ヒストグラムJaに関連して予め登録された区画領域B1〜B4を示す説明図である。FIG. 15 is an explanatory diagram showing partitioned areas B1 to B4 registered in advance in relation to the second standard histogram Ja. 図16は、第二ヒストグラムH2の大きなピークと第二標準ヒストグラムJaの大きなピークの位置ずれ量x1〜x4を示す説明図である。FIG. 16 is an explanatory diagram showing positional deviation amounts x1 to x4 between the large peak of the second histogram H2 and the large peak of the second standard histogram Ja. 図17は、帳票Caの横印字領域15aおよび縦印字領域25aを示す説明図である。FIG. 17 is an explanatory diagram showing the horizontal printing area 15a and the vertical printing area 25a of the form Ca. 図18は、位置ずれ量y1だけ逆方向に移動した横印字領域15a'および位置ずれ量x1だけ逆方向に移動した縦印字領域25a'を示す説明図である。FIG. 18 is an explanatory diagram showing a horizontal print area 15a ′ moved in the reverse direction by the positional deviation amount y1 and a vertical print area 25a ′ moved in the reverse direction by the positional deviation quantity x1. 図19は、移動した横印字領域15a'および縦印字領域25a'を帳票画像Gに当てはめた領域を示す説明図である。FIG. 19 is an explanatory diagram showing a region in which the moved horizontal print region 15a ′ and vertical print region 25a ′ are applied to the form image G.

以下、添付図面を参照して、本発明に係る帳票種類判別装置および帳票種類判別方法の実施例を説明する。なお、これにより本発明が限定されるものではない。   Embodiments of a form type discriminating apparatus and form type discriminating method according to the present invention will be described below with reference to the accompanying drawings. Note that the present invention is not limited thereby.

まず、本実施例に係る帳票種類判別装置100の構成について説明する。図1は、帳票種類判別装置100の構成を示すブロック図である。同図に示すように、この帳票種類判別装置100は、帳票画像入力部1と、帳票画像傾き補正部2と、第一エッジ画像作成部11と、第一特徴検出部12と、第一特徴照合部13と、第二エッジ画像作成部21と、第二特徴検出部22と、第二特徴照合部23と、印字文字情報31と、文字認識を行う文字認識部32aを有する出力部32とを備える。なお、文字認識部32aでは、周知の文字認識処理を行う。   First, the configuration of the form type discriminating apparatus 100 according to the present embodiment will be described. FIG. 1 is a block diagram showing the configuration of the form type discriminating apparatus 100. As shown in the figure, the form type discrimination device 100 includes a form image input unit 1, a form image inclination correction unit 2, a first edge image creation unit 11, a first feature detection unit 12, and a first feature. A collation unit 13, a second edge image creation unit 21, a second feature detection unit 22, a second feature collation unit 23, print character information 31, and an output unit 32 having a character recognition unit 32a for character recognition; Is provided. The character recognition unit 32a performs a well-known character recognition process.

帳票画像入力部1は、カメラやスキャナや通信回線を介して帳票画像を取り込む処理部である。帳票画像傾き補正部2は、あらかじめ設定された基準となる横方向(以下、「x方向」と言う)と帳票の横罫線が平行になり、且つ、あらかじめ設定された基準となる縦方向(以下、「y方向」と言う)と帳票の縦罫線が並行になるように帳票画像の傾きを補正する処理部である。   The form image input unit 1 is a processing unit that captures a form image via a camera, a scanner, or a communication line. The form image inclination correction unit 2 has a preset horizontal direction (hereinafter referred to as “x direction”) parallel to a horizontal ruled line of the form, and a predetermined reference vertical direction (hereinafter referred to as “x direction”). , “Y direction”) and a processing unit that corrects the inclination of the form image so that the vertical ruled lines of the form become parallel.

第一エッジ画像作成部11は、帳票画像中の横罫線を対象として抽出する第一エッジ画像作成処理部であり、例えば、横線のエッジ(以下、「横エッジ」と言う)を検出する微分オペレータ(例えば、SOBELオペレータ等)を帳票画像に適用することで横エッジを抽出する。具体的には、横罫線とその上部との間に濃度差があるため横罫線の上端に横エッジが存在し、また横罫線とその下部との間に濃度差があるため横罫線の下端に横エッジが存在する。このため、この第一エッジ画像作成部11により、一つの横罫線に対して一対をなす2つの横エッジが抽出されることになる。   The first edge image creation unit 11 is a first edge image creation processing unit that extracts a horizontal ruled line in a form image as an object. For example, a differential operator that detects an edge of a horizontal line (hereinafter referred to as “horizontal edge”). The horizontal edge is extracted by applying (for example, SOBEL operator) to the form image. Specifically, because there is a density difference between the horizontal ruled line and its upper part, there is a horizontal edge at the upper end of the horizontal ruled line, and there is a density difference between the horizontal ruled line and its lower part, so There are horizontal edges. Therefore, the first edge image creation unit 11 extracts two horizontal edges that form a pair with respect to one horizontal ruled line.

なお、この第一エッジ画像作成部11は、横エッジを含む帳票画像の微分画像の各画素を2値化して2値画像からなる第一エッジ画像を作成する。かかる2値化処理に際しては、大津の判別分析法等を用いて自動的に設定されたしきい値又はあらかじめ設定された所定のしきい値を用いて2値化処理を行うことができる。ここでは、画素値「0」となる黒画素がエッジを形成する画素を示し、画素値「1」となる白画素がエッジを形成しない画素を示すものとする。ただし、黒画素がエッジを形成しない画素を示し、白画素がエッジを形成する画素を示すようにして処理を行うこともできる。   The first edge image creation unit 11 binarizes each pixel of the differential image of the form image including the horizontal edge to create a first edge image composed of a binary image. In the binarization process, the binarization process can be performed using a threshold value set automatically using Otsu's discriminant analysis method or the like, or a predetermined threshold value set in advance. Here, a black pixel having a pixel value “0” indicates a pixel that forms an edge, and a white pixel that has a pixel value “1” indicates a pixel that does not form an edge. However, the processing can be performed so that the black pixel indicates a pixel that does not form an edge and the white pixel indicates a pixel that forms an edge.

第一特徴検出部12は、帳票画像中の横罫線の特徴量である分布パターンを取得する処理部であり、具体的には、第一エッジ画像作成部11により作成されたエッジ画像に含まれる横罫線のエッジの画素数をy方向にプロットしたヒストグラムを横罫線の分布パターンとして取得する。このようにして取得された横罫線の分布パターンは、その全体を50ドット/インチ換算に圧縮することによって正規化処理される。   The first feature detection unit 12 is a processing unit that acquires a distribution pattern that is a feature amount of a horizontal ruled line in a form image. Specifically, the first feature detection unit 12 is included in the edge image created by the first edge image creation unit 11. A histogram in which the number of pixels at the edge of the horizontal ruled line is plotted in the y direction is acquired as a distribution pattern of the horizontal ruled line. The horizontal ruled line distribution pattern obtained in this way is normalized by compressing the entire distribution pattern to 50 dots / inch conversion.

第一特徴照合部13は、帳票画像中の横罫線の特徴量である分布パターンと予め登録してある各種帳票の横罫線の分布パターンである第一標準ヒストグラム14とを照合して第一合致度を算出する処理部である。   The first feature matching unit 13 compares the distribution pattern, which is the feature amount of the horizontal ruled line in the form image, with the first standard histogram 14 which is the distribution pattern of the horizontal ruled line of various forms registered in advance. It is a processing unit for calculating the degree.

第二エッジ画像作成部21は、帳票画像中の縦罫線を対象として抽出する第二エッジ画像作成処理部であり、例えば、縦線のエッジ(以下、「縦エッジ」と言う)を検出するSOBELオペレータ等を帳票画像に適用することで縦エッジを抽出する。なお、この第二エッジ画像作成部21は、帳票画像の微分画像の各画素を2値化して2値画像からなる第二エッジ画像を作成する。   The second edge image creation unit 21 is a second edge image creation processing unit that extracts a vertical ruled line in a form image as an object. For example, a SOBEL that detects a vertical line edge (hereinafter referred to as “vertical edge”). A vertical edge is extracted by applying an operator or the like to the form image. The second edge image creation unit 21 binarizes each pixel of the differential image of the form image and creates a second edge image composed of a binary image.

第二特徴検出部22は、帳票画像中の縦罫線の分布パターンを取得する処理部であり、具体的には、縦罫線のエッジ画素数をy方向にプロットしたヒストグラムを縦罫線の分布パターンとして取得する。第二特徴照合部23は、帳票画像中の縦罫線の分布パターンと予め登録してある各種帳票の縦罫線の分布パターンである第二標準ヒストグラム24とを照合して第二合致度を算出する処理部である。   The second feature detection unit 22 is a processing unit that acquires a distribution pattern of vertical ruled lines in the form image. Specifically, a histogram in which the number of edge pixels of the vertical ruled lines is plotted in the y direction is used as the distribution pattern of the vertical ruled lines. get. The second feature matching unit 23 compares the distribution pattern of the vertical ruled lines in the form image with the second standard histogram 24, which is the distribution pattern of the vertical ruled lines of various forms registered in advance, and calculates the second matching degree. It is a processing unit.

印字文字情報31は、あらかじめ登録された各種帳票に印字された印字文字に関する情報であり、具体的には、各帳票に印字された印字文字の座標情報及び印字文字が含まれる。   The print character information 31 is information about print characters printed on various forms registered in advance, and specifically includes coordinate information and print characters of the print characters printed on each form.

出力部32は、第一合致度及び第二合致度を用いて予め登録された各種帳票から複数の有力候補帳票を選択し、選択された各有力候補帳票の所定の位置に存在する印字文字と帳票画像の所定の位置から読み取って文字認識部32aにより文字認識された結果とを比較して、文字認識スコアが最も高くなる帳票種類を出力する処理部である。   The output unit 32 selects a plurality of leading candidate forms from various forms registered in advance using the first matching degree and the second matching degree, and print characters present at predetermined positions of the selected leading candidate forms This is a processing unit that outputs a form type having the highest character recognition score by comparing the result of reading from a predetermined position of the form image and comparing the result of character recognition by the character recognition unit 32a.

具体的には、出力部32では、第一合致度及び第二合致度の合計値が高い順に複数の有力候補帳票を選択し、印字文字情報31から該有力候補帳票に印字文字が印字される領域を抽出する。ここで、有力候補帳票と帳票画像の間に位置ずれが存在する場合には、この位置ずれを考慮して印字文字が印字される領域を補正し、該当する箇所から読み出したデータを文字認識する。そして、文字認識された文字が、印字文字情報31に含まれる有力候補帳票に本来含まれるはずの印字文字と比較することになる。   Specifically, the output unit 32 selects a plurality of leading candidate forms in descending order of the total value of the first matching degree and the second matching degree, and prints the print characters on the leading candidate form from the print character information 31. Extract regions. Here, if there is a misalignment between the leading candidate form and the form image, the area where the print character is printed is corrected in consideration of this misalignment, and the data read from the corresponding part is recognized. . Then, the character recognized character is compared with the print character that should be originally included in the leading candidate form included in the print character information 31.

なお、本実施例では、説明の便宜上、帳票の最上部に印字された見出しとなる印字文字を処理対象とする場合について説明するが、本発明はこれに限定されるものではなく、帳票の様々な位置に所在する印字文字を処理対象とすることもできる。この場合には、登録された帳票ごとに複数の印字文字に関する情報を印字文字情報31に含ませれば良い。処理対象とする印字文字を多くすればするほど、出力部32から出力される出力結果の信頼性を向上させることができる。   In this embodiment, for the sake of convenience of explanation, a case will be described in which a print character serving as a headline printed on the top of a form is a processing target, but the present invention is not limited to this, and various forms It is also possible to process print characters located at various positions. In this case, information regarding a plurality of print characters may be included in the print character information 31 for each registered form. As the number of print characters to be processed increases, the reliability of the output result output from the output unit 32 can be improved.

次に、図1に示した帳票種類判別装置100の処理手順について説明する。図2は、図1に示した帳票種類判別装置100の処理を示すフロー図である。同図に示したステップS1では、帳票画像入力部1は、帳票の画像を取り込む。ステップS2では、帳票画像傾き補正部2は、公知方法により、帳票画像中の横方向の線分がx方向に合致するように、又は、帳票画像中の縦方向の線分がy方向に合致するように、帳票画像の傾きの角度を回転補正する。例えば、帳票画像中の横エッジのエッジ方向とx方向の傾き角度を求め、この角度分を回転補正するようアフィン変換すれば良い。これにより、帳票画像中の横罫線をx方向に合致させ、縦罫線をy方向に合致させることができる。   Next, the processing procedure of the form type discriminating apparatus 100 shown in FIG. 1 will be described. FIG. 2 is a flowchart showing processing of the form type discriminating apparatus 100 shown in FIG. In step S1 shown in the figure, the form image input unit 1 captures an image of the form. In step S2, the form image tilt correction unit 2 uses a known method so that the horizontal line segment in the form image matches the x direction, or the vertical line segment in the form image matches the y direction. As described above, the inclination angle of the form image is rotationally corrected. For example, the edge direction of the horizontal edge in the form image and the inclination angle in the x direction may be obtained, and affine transformation may be performed so as to rotationally correct this angle. Thereby, the horizontal ruled line in the form image can be matched with the x direction, and the vertical ruled line can be matched with the y direction.

図4に、傾き補正後の帳票画像Gを例示する。この帳票画像Gにおいて、図中に示す太線が罫線であり、斜体でない文字は帳票に予め印刷された印字文字であり、斜体の文字は帳票に対して記入された文字である。   FIG. 4 illustrates a form image G after the inclination correction. In this form image G, the bold lines shown in the figure are ruled lines, the characters that are not italic are print characters that are printed in advance on the form, and the italic characters are characters that are entered on the form.

図2に戻り、ステップS3では、第一エッジ画像作成部11は、帳票画像に対して横線を形成するエッジを検出する微分オペレータ(例えば、SOBELオペレータ)を適用して横エッジを抽出し、各横エッジの画素値を所定の画素値と比較して2値化して、図5に示すような2値画像である第一エッジ画像を作成する。ここで、この第一エッジ画像の黒画素は横エッジを形成する画素を示し、白画素は横エッジを形成しない画素を示すことになる。   Returning to FIG. 2, in step S <b> 3, the first edge image creation unit 11 applies a differential operator (e.g., SOBEL operator) that detects an edge forming a horizontal line to the form image to extract the horizontal edge, The pixel value of the horizontal edge is compared with a predetermined pixel value and binarized to create a first edge image that is a binary image as shown in FIG. Here, the black pixel of the first edge image indicates a pixel that forms a horizontal edge, and the white pixel indicates a pixel that does not form a horizontal edge.

図5に、第一エッジ画像E1を例示する。図中に示すように、所定の幅が存在する罫線(横線)に対して横エッジ検出用の微分オペレータを適用すると、罫線の上部及び下部と背景との間に濃度差があるため、2本の平行線が検出される。また、横エッジ検出用の微分オペレータを適用しているので、この時点では縦エッジは検出されない。なお、帳票画像内の印刷文字又は記入文字については、その一部に横エッジが存在するため、同図に示すように文字の一部をなす横エッジが検出されることになるが、罫線ほどには連続した状態で検出されない。   FIG. 5 illustrates the first edge image E1. As shown in the figure, when a differential operator for detecting a horizontal edge is applied to a ruled line (horizontal line) having a predetermined width, there are density differences between the upper and lower parts of the ruled line and the background. Parallel lines are detected. Further, since the differential operator for detecting the horizontal edge is applied, the vertical edge is not detected at this time. In addition, since there is a horizontal edge in a part of the printed character or entry character in the form image, the horizontal edge forming a part of the character is detected as shown in the figure. Are not detected in a continuous state.

図2に戻り、ステップS4では、第一特徴検出部12は、第一エッジ画像をx方向に3mmが1画素になるように圧縮し、このとき黒画素が所定の画素数連続していれば圧縮後の画素を黒画素とし、そうでない場合は圧縮後の画素を白画素とする最小値圧縮をして第一圧縮画像を作成する。図5は第一エッジ画像を示しており、文字は微分されることで横エッジのみとなり、さらに、最小値圧縮されることによって文字の横エッジが消える。   Returning to FIG. 2, in step S <b> 4, the first feature detection unit 12 compresses the first edge image so that 3 mm becomes one pixel in the x direction, and at this time, if a predetermined number of black pixels continue. If the pixel after compression is a black pixel, otherwise, the first compressed image is created by performing minimum value compression using the pixel after compression as a white pixel. FIG. 5 shows a first edge image. When the character is differentiated, only the horizontal edge is obtained, and further, the horizontal edge of the character disappears by the minimum value compression.

図6に、第一圧縮画像F1を例示する。帳票画像Gの横幅が210mmであり、1mmにつき1画素が形成されている場合には、第一圧縮画像F1の横方向の画素数は210/3=70になる。なお、第一圧縮画像を作成すると図6に示す様に横方向に最小値圧縮をしているので、第一エッジ画像E1に見られた文字の横エッジは消失する。   FIG. 6 illustrates the first compressed image F1. When the width of the form image G is 210 mm and 1 pixel is formed per 1 mm, the number of pixels in the horizontal direction of the first compressed image F1 is 210/3 = 70. Note that when the first compressed image is created, the minimum value compression is performed in the horizontal direction as shown in FIG. 6, so the horizontal edge of the character seen in the first edge image E1 disappears.

図2に戻り、ステップS5では、第一特徴検出部12は、第一圧縮画像の横エッジの画素数をy座標にプロットしたヒストグラムを作成し、これまでは横方向に圧縮したが、次に縦方向に全体を50ドット/インチ換算に圧縮する正規化処理を行い、その結果wpを第一ヒストグラムとする。図7に、第一ヒストグラムH1を例示するとともに、図8(a)〜(d)に、各種帳票Ca〜Cdとそれらについての第一標準ヒストグラムHa〜Hdを例示する。   Returning to FIG. 2, in step S <b> 5, the first feature detection unit 12 creates a histogram in which the number of pixels of the horizontal edge of the first compressed image is plotted on the y coordinate, and so far compressed in the horizontal direction. A normalization process for compressing the whole in the vertical direction in terms of 50 dots / inch is performed, and the result wp is defined as the first histogram. FIG. 7 illustrates the first histogram H1, and FIGS. 8A to 8D illustrate various forms Ca to Cd and first standard histograms Ha to Hd thereof.

図2に戻り、ステップS6では、第一特徴照合部12は、予め登録された各種帳票の横エッジの分布を示す第一標準ヒストグラムと第一ヒストグラムH1とを照合する。具体的には、第一ヒストグラムH1を所定画素数(例えば20画素数)からなる複数の区画領域に分割し、第一ヒストグラムH1の各区画領域が第一標準ヒストグラムHaのどの位置に合致するかを求め、求めた位置に領域の開始位置が一致するように各区画領域を補正した補正後の第一ヒストグラムHyと第一標準ヒストグラムHaとを照合して第一合致度を求める。   Returning to FIG. 2, in step S <b> 6, the first feature matching unit 12 collates the first standard histogram and the first histogram H <b> 1 indicating the distribution of the horizontal edges of various forms registered in advance. Specifically, the first histogram H1 is divided into a plurality of divided areas having a predetermined number of pixels (for example, 20 pixels), and the position of each divided area of the first histogram H1 matches the first standard histogram Ha. And the first histogram Hy after correction and the first standard histogram Ha obtained by correcting each divided region so that the start position of the region coincides with the obtained position, and the first matching degree is obtained.

この点をさらに詳細に説明すると、図9に示すように、第一ヒストグラムH1は、複数の区画領域A1〜A7に分割される。ここで、区画領域A1に関しては、区画領域A1におけるヒストグラムの2つのピークの間隔とピーク値を持つ第一標準ヒストグラムHa上の位置を求める。例えば、区画領域A1におけるヒストグラムを第一標準ヒスグラムHa上で移動させつつ順次相関値を求め、最も相関値が高くなる位置を第一ヒストグラムH1の区画領域A1の対応位置と判定することができる。   This point will be described in more detail. As shown in FIG. 9, the first histogram H1 is divided into a plurality of partitioned areas A1 to A7. Here, for the partitioned area A1, a position on the first standard histogram Ha having an interval and a peak value between two peaks of the histogram in the partitioned area A1 is obtained. For example, the correlation value is sequentially obtained while moving the histogram in the partition area A1 on the first standard histogram H1, and the position where the correlation value is highest can be determined as the corresponding position of the partition area A1 in the first histogram H1.

同様に、区画領域A2〜A7に関しても、区画領域A2〜A7におけるヒストグラムを第一標準ヒスグラムHa上で移動させつつ順次相関値を求め、最も相関値が高くなる位置を第一ヒストグラムH1の区画領域A2〜A7の対応位置と判定することができる。   Similarly, regarding the partitioned areas A2 to A7, the correlation values are sequentially obtained while the histograms in the partitioned areas A2 to A7 are moved on the first standard histogram Ha, and the position where the correlation value is the highest is the partitioned area of the first histogram H1. It can be determined that the positions correspond to A2 to A7.

このようにして、図10に示す区画領域A1〜A7の対応位置から位置ずれ量y1〜y7を求めたならば、求めた位置に領域の開始位置を合わせるように第一ヒストグラムH1を区画領域A1〜A7毎に補正する。その後、補正された第一ヒストグラムHyと第一標準ヒストグラムHaとの相関値を求め、帳票画像Gと帳票Caの第一合致度Paを算定することになる。   In this way, when the positional deviation amounts y1 to y7 are obtained from the corresponding positions of the divided areas A1 to A7 shown in FIG. 10, the first histogram H1 is set to match the start position of the area with the obtained position. Correct for each A7. Thereafter, the correlation value between the corrected first histogram Hy and the first standard histogram Ha is obtained, and the first matching degree Pa between the form image G and the form Ca is calculated.

図2に戻り、ステップS7において、第二エッジ画像作成部21は、帳票画像に対して縦線を形成するエッジを検出する微分オペレータ(例えば、SOBELオペレータ)を適用して縦エッジを抽出し、各縦エッジの画素値を所定の画素値と比較して2値化して、2値画像である第二エッジ画像を作成する。   Returning to FIG. 2, in step S <b> 7, the second edge image creation unit 21 extracts a vertical edge by applying a differential operator (e.g., SOBEL operator) that detects an edge forming a vertical line to the form image, The pixel value of each vertical edge is compared with a predetermined pixel value and binarized to create a second edge image that is a binary image.

図11に、第二エッジ画像E2を例示する。この第二エッジ画像E2についても、図5に示した第一エッジ画像E1と同様に、所定の幅が存在する罫線(縦線)に対して縦エッジ検出用の微分オペレータを適用すると、罫線の左部及ぶ右部と背景との間に濃度差があるため、2本の平行線が検出される。また、縦エッジ検出用の微分オペレータを適用しているので、横エッジは検出されない。なお、帳票画像内の印刷文字又は記入文字については、その一部に縦エッジが存在するため、図11に示すように同図に示すように文字の一部をなす縦エッジが検出されることになるが、罫線ほどには連続した状態で検出されない。   FIG. 11 illustrates the second edge image E2. Similarly to the first edge image E1 shown in FIG. 5, with respect to the second edge image E2, if a differential operator for detecting a vertical edge is applied to a ruled line (vertical line) having a predetermined width, Since there is a density difference between the left and right part and the background, two parallel lines are detected. Further, since the differential operator for detecting the vertical edge is applied, the horizontal edge is not detected. In addition, since a vertical edge exists in a part of the printed character or the written character in the form image, the vertical edge forming a part of the character is detected as shown in FIG. However, it is not detected as continuously as ruled lines.

図2に戻り、ステップS8では、第二特徴検出部22は、第二エッジ画像をy方向に3mmが1画素になるように圧縮し、このとき黒画素が所定の画素数連続していれば圧縮後の画素を黒画素とし、そうでない場合は圧縮後の画素を白画素とする最小値圧縮をして第二圧縮画像を作成する。図12に、第二圧縮画像F2を例示する。帳票画像Gの縦幅が300mmであり、1mmにつき1画素が形成されている場合には、第二圧縮画像F2の縦方向の画素数は300/3=100になる。なお、縦方向に最小値圧縮をしているので、帳票エッジ画像E2上の文字は消失している。   Returning to FIG. 2, in step S <b> 8, the second feature detection unit 22 compresses the second edge image so that 3 mm becomes one pixel in the y direction, and at this time, if the black pixels continue for a predetermined number of pixels. If the pixel after compression is a black pixel, otherwise, the second compressed image is created by performing minimum value compression with the pixel after compression being a white pixel. FIG. 12 illustrates the second compressed image F2. When the vertical width of the form image G is 300 mm and 1 pixel is formed per 1 mm, the number of pixels in the vertical direction of the second compressed image F2 is 300/3 = 100. Since the minimum value is compressed in the vertical direction, the characters on the form edge image E2 are lost.

図2に戻り、ステップS9では、第二特徴検出部22は、第二圧縮画像のx座標毎のy方向黒画素数のヒストグラムを作成し、これまでは縦方向に圧縮したが、次に横方向に全体を50ドット/インチ換算に圧縮し、それを第二ヒストグラムとする。図13に、第二ヒストグラムH2を例示するとともに、図14(a)〜(d)に、各種帳票Ca〜Cdとそれらについての第二標準ヒストグラムJa〜Jdを例示する。   Returning to FIG. 2, in step S <b> 9, the second feature detection unit 22 creates a histogram of the number of black pixels in the y direction for each x coordinate of the second compressed image, and so far compressed in the vertical direction. The entire image is compressed in the direction of 50 dots / inch and used as the second histogram. FIG. 13 illustrates the second histogram H2, and FIGS. 14A to 14D illustrate various forms Ca to Cd and second standard histograms Ja to Jd for them.

図2に戻り、ステップS10では、予め登録された各種帳票の縦エッジの分布を示す第二標準ヒストグラムと第二ヒストグラムH2とを照合する。具体的には、第二ヒストグラムH2を所定画素数(例えば20画素数)からなる複数の区画領域に分割し、第二ヒストグラムH2の各区画領域が第二標準ヒストグラムJaのどの位置に合致するかを求め、求めた位置に合致するように各区画領域を補正した補正後の第二ヒストグラムHxと第二標準ヒストグラムJaとを照合して第二合致度を求める。   Returning to FIG. 2, in step S <b> 10, the second standard histogram indicating the distribution of the vertical edges of various forms registered in advance is compared with the second histogram H <b> 2. Specifically, the second histogram H2 is divided into a plurality of divided areas having a predetermined number of pixels (for example, 20 pixels), and the position of each divided area of the second histogram H2 matches the second standard histogram Ja. The corrected second histogram Hx obtained by correcting each partition region so as to match the obtained position is compared with the second standard histogram Ja to obtain the second matching degree.

この点をさらに詳細に説明すると、図15に示すように、第二ヒストグラムH2は、複数の区画領域B1〜A4に分割される。ここで、区画領域B1に関しては、区画領域B1におけるヒストグラムの2つのピークの間隔とピーク値を持つ第二標準ヒストグラムJa上の位置を求める。例えば、区画領域B1におけるヒストグラムを第二標準ヒスグラムJa上で移動させつつ順次相関値を求め、最も相関値が高くなる位置を第二ヒストグラムH2の区画領域B1の対応位置と判定することができる。   This point will be described in more detail. As shown in FIG. 15, the second histogram H2 is divided into a plurality of partitioned areas B1 to A4. Here, for the partitioned area B1, a position on the second standard histogram Ja having an interval and a peak value of two peaks of the histogram in the partitioned area B1 is obtained. For example, the correlation value is sequentially obtained while moving the histogram in the partitioned area B1 on the second standard histogram Ja, and the position where the correlation value is highest can be determined as the corresponding position of the partitioned area B1 in the second histogram H2.

同様に、区画領域B2〜B4に関しても、区画領域B2〜B4におけるヒストグラムを第二標準ヒスグラムJa上で移動させつつ順次相関値を求め、最も相関値が高くなる位置を第二ヒストグラムH2の区画領域B2〜B4の対応位置と判定することができる。   Similarly, regarding the partitioned areas B2 to B4, correlation values are sequentially obtained while moving the histograms in the partitioned areas B2 to B4 on the second standard histogram Ja, and the position where the correlation value is the highest is the partitioned area of the second histogram H2. It can be determined that the position corresponds to B2 to B4.

このようにして、図16に示す区画領域B1〜B4の対応位置から位置ずれ量x1〜x4を求めたならば、求めた位置に合わせるように第二ヒストグラムH2を区画領域B1〜B4毎に領域開始位置座標値を移動させる補正を行う。その後、補正された第二ヒストグラムHxと第二標準ヒストグラムJaとの相関値を求め、帳票画像Gと帳票Caの第二合致度Qaを算定することになる。   In this way, when the positional shift amounts x1 to x4 are obtained from the corresponding positions of the divided areas B1 to B4 shown in FIG. 16, the second histogram H2 is divided into areas for the divided areas B1 to B4 so as to match the obtained positions. Correction for moving the start position coordinate value is performed. Thereafter, the correlation value between the corrected second histogram Hx and the second standard histogram Ja is obtained, and the second matching degree Qa between the form image G and the form Ca is calculated.

図3のステップS11に進み、出力部32は、第一合致度と第二合致度の合計値が大きい順を類似度が高い順とする。   Proceeding to step S11 in FIG. 3, the output unit 32 sets the order in which the total value of the first match degree and the second match degree is large in descending order of similarity.

ステップS12では、類似度が高い順に例えば2つを選び、有力候補帳票とする。ステップS13では、有力候補帳票の中から一つの有力候補帳票を選択し、後述する印字文字を用いた照合処理を行うことになる。かかる有力候補帳票の選択に際しては、第一合致度と第二合致度の合計値が高いものから順次選択することになる。   In step S12, for example, two are selected in descending order of similarity and are set as leading candidate forms. In step S13, one leading candidate form is selected from the leading candidate forms, and collation processing using print characters to be described later is performed. When selecting such a candidate candidate form, the first matching degree and the second matching degree are selected in descending order.

ステップS14では、予め登録された各種帳票の印字文字に関する情報(以下、「印字文字情報31」と言う)から選択された当該有力候補帳票の印字文字の座標情報(縦座標及び横座標)を読み出す。具体的には、図17において、帳票Caの印字文字の縦領域15a(始点及び終点)と印字文字の横領域25a(始点及び終点)を読み出すことになる。   In step S14, the coordinate information (vertical coordinate and abscissa) of the print character of the leading candidate form selected from information related to print characters of various forms registered in advance (hereinafter referred to as “print character information 31”) is read. . Specifically, in FIG. 17, the vertical area 15a (start point and end point) of the print character and the horizontal area 25a (start point and end point) of the print character are read out.

ステップS15では、読み出した印字文字の縦領域15aの始点に最も近い横エッジのピークの位置ずれ量だけ印字文字の縦領域15aを逆方向に移動するとともに、印字文字の横領域25aの始点に最も近い縦エッジのピークの位置ずれ量だけ印字文字の横領域25aの座標値を逆方向に移動する。図18に、位置ずれ量y1だけ逆方向に移動した印字文字の縦領域25a'及び位置ずれ量x1だけ逆方向に移動した印字文字の横領域25a'を示す。   In step S15, the vertical area 15a of the print character is moved in the reverse direction by the amount of positional deviation of the peak of the horizontal edge closest to the start point of the vertical area 15a of the read print character, and is the highest at the start point of the horizontal area 25a of the print character. The coordinate value of the horizontal area 25a of the print character is moved in the reverse direction by the amount of positional deviation of the peak of the near vertical edge. FIG. 18 shows a vertical region 25a ′ of the printed character moved in the reverse direction by the positional displacement amount y1 and a horizontal region 25a ′ of the printed character moved in the reverse direction by the positional displacement amount x1.

ステップS16では、移動した印字文字の縦領域15a'および印字文字の横領域25a'を帳票画像に当てはめた領域中の文字を文字認識処理により読み取る。図19に、移動した領域印字文字の縦領域15a'及び印字文字の横領域25a'を帳票画像Gに当てはめた領域を示す。この領域から「入金伝票」の文字が読み取れる。   In step S16, the characters in the area where the vertical area 15a 'of the moved print character and the horizontal area 25a' of the print character are applied to the form image are read by the character recognition process. FIG. 19 shows a region in which the vertical region 15a ′ of the moved region print character and the horizontal region 25a ′ of the print character are applied to the form image G. The character “payment slip” can be read from this area.

ステップS17では、予め登録してある各種帳票の印字文字情報31から当該有力候補帳票についての第一印字文字を読み出す。図17に示すように、帳票Caの第一印字文字は「入金伝票」である。   In step S17, the first print character for the leading candidate form is read from the print character information 31 of various forms registered in advance. As shown in FIG. 17, the first print character of the form Ca is “payment slip”.

ステップS18では、帳票画像Gから印字文字の縦座標、印字文字の横座標の領域を抽出し、この領域内の文字が第一印字文字と認識できるかどうかを判定する。具体的には、帳票画像Gから印字文字の縦座標、印字文字の横座標の領域を抽出し、この領域内の文字が第一印字文字と認識できる場合、または、帳票画像Gから抽出した前記領域内に認識できた文字が無く、且つ、空白なら、予め登録している印字文字情報に合致していると判定する。その結果、合致した場合には(ステップS18;Yes)、当該有力候補帳票の種類を出力して(ステップS19)、処理を終了する。   In step S18, the area of the ordinate of the print character and the abscissa of the print character is extracted from the form image G, and it is determined whether or not the character in this area can be recognized as the first print character. Specifically, the area of the ordinate of the print character and the abscissa of the print character is extracted from the form image G, and when the character in this area can be recognized as the first print character, or the above-mentioned extracted from the form image G If there is no recognized character in the area and it is blank, it is determined that it matches the pre-registered print character information. As a result, if they match (step S18; Yes), the type of the strong candidate form is output (step S19), and the process ends.

一方、予め登録している印字文字情報に合致しない場合には(ステップS18;No)、ステップS20において未処理の有力候補帳票が存在するか否かを判定し、未処理の有力候補帳票が存在する場合には(ステップS20;Yes)、ステップS13に移行して同様の処理を繰り返す。そして、全ての有力候補帳票に対する処理を終えたならば(ステップS20;No)、上記一連の処理を終了する。   On the other hand, if it does not match the pre-registered print character information (step S18; No), it is determined in step S20 whether an unprocessed powerful candidate form exists, and an unprocessed powerful candidate form exists. If yes (step S20; Yes), the process proceeds to step S13 and the same process is repeated. And if the process with respect to all the promising candidate forms is complete | finished (step S20; No), a series of said process will be complete | finished.

本実施例の帳票種類判別装置100によれば次の効果が得られる。
(A)カラー画像やモノクロ画像の帳票画像Gをy方向に調べて出現するエッジを抽出し、エッジの有無に2値化した第一エッジ画像E1を作成する。この第一エッジ画像E1上では、背景と罫線の濃度差が小さい帳票でも、横罫線の罫線幅だけ離れた横方向の平行線として横罫線が現れるから、横罫線をうまく抽出することが出来る。
According to the form type discriminating apparatus 100 of the present embodiment, the following effects can be obtained.
(A) A color image or monochrome image form image G is examined in the y direction to extract an appearing edge, and a first edge image E1 binarized by the presence or absence of an edge is created. On the first edge image E1, the horizontal ruled line appears as a horizontal parallel line separated by the ruled line width of the horizontal ruled line even if the density difference between the background and the ruled line is small, so that the horizontal ruled line can be extracted well.

(B)第一エッジ画像E1をx方向に圧縮してx方向の画素数を減らした第一圧縮画像F1を作成する。記入された文字・図形や、押された出納印や、貼り付けられたバーコードラベルなどのx方向に連続する黒画素数は、第一エッジ画像E1上において、元々多くない。その元々多くないx方向に連続する黒画素数がx方向の圧縮により減らされるため、第一圧縮画像F1上での存在は非常に希薄になる。他方、横罫線のx方向に連続する黒画素数は、第一エッジ画像E1上において、元々少なくない。その元々少なくないx方向に連続する黒画素数が減らされても、第一圧縮画像F1上での存在は希薄にならない。従って、文字・図形が記入されたり、出納印が押されたり、バーコードラベルが貼付されたりした帳票でも、横罫線をうまく抽出することが出来る。 (B) The first edge image E1 is compressed in the x direction to create a first compressed image F1 in which the number of pixels in the x direction is reduced. The number of black pixels continuous in the x-direction, such as written characters / graphics, pressed receipt / payment stamps, and pasted barcode labels, is not originally large on the first edge image E1. Since the number of black pixels continuous in the x direction, which is not originally large, is reduced by compression in the x direction, the presence on the first compressed image F1 becomes very sparse. On the other hand, the number of black pixels continuous in the x direction of the horizontal ruled line is not small on the first edge image E1. Even if the number of black pixels continuous in the x direction, which is not small, is reduced, the presence on the first compressed image F1 does not become dilute. Accordingly, the horizontal ruled line can be well extracted even in a form in which characters / graphics are entered, a cash stamp is pressed, or a barcode label is attached.

(C)第一エッジ画像E1をx方向に3mmを1画素に圧縮してx方向の画素数を減らすとともに、所定の画素数分連続する場合にのみ黒画素として第一圧縮画像F1を作成する。記入された文字について黒画素がx方向に連続する長さはほとんどが10mm未満であるため、第一圧縮画像F1ではほとんどが0画素〜3画素になってしまう。これにより、文字の存在を希薄化できる。他方、横罫線について黒画素がx方向に連続する長さはほとんどが10mm以上であるため、第一圧縮画像F1ではほとんどが3画素以上になり、横罫線の存在は希薄にならない。従って、文字・図形が記入されたり,出納印が押されたり、バーコードラベルが貼付されたりした帳票でも、横罫線をうまく抽出することが出来る。 (C) The first edge image E1 is compressed to 3 pixels in the x direction to reduce the number of pixels in the x direction to reduce the number of pixels in the x direction, and the first compressed image F1 is created as a black pixel only when the predetermined number of pixels are continued. . Since most of the lengths of black characters that continue in the x direction for written characters are less than 10 mm, the first compressed image F1 has almost 0 to 3 pixels. Thereby, the presence of characters can be diluted. On the other hand, since most of the horizontal ruled lines in which the black pixels continue in the x direction are 10 mm or more, the first compressed image F1 has almost three pixels or more, and the presence of the horizontal ruled lines does not become dilute. Accordingly, the horizontal ruled line can be well extracted even in a form in which characters / graphics are entered, a cashier stamp is pressed, or a bar code label is attached.

(D)カラー画像やモノクロ画像の帳票画像をx方向に調べて出現するエッジを抽出し、エッジの有無に2値化した第二エッジ画像E2を作成する。この第二エッジ画像E2上では、背景と罫線の濃度差が小さい帳票でも、縦罫線の罫線幅だけ離れた縦方向の平行線として縦罫線が現れるから、縦罫線をうまく抽出することが出来る。 (D) A color image or a monochrome form image is examined in the x direction to extract appearing edges, and a second edge image E2 binarized according to the presence or absence of edges is created. On the second edge image E2, vertical ruled lines can be successfully extracted because vertical ruled lines appear as vertical parallel lines that are separated by the ruled line width of the vertical ruled lines even if the form has a small density difference between the background and the ruled lines.

(E)第二エッジ画像E2をy方向に圧縮してy方向の画素数を減らした第二圧縮画像F2を作成する。記入された文字・図形や、押された出納印や、貼り付けられたバーコードラベルなどのy方向に連続する黒画素数は、第二エッジ画像E2上において、元々多くない。その元々多くないy方向に連続する黒画素数がy方向の圧縮により減らされるため、第二圧縮画像F2上での存在は非常に希薄になる。他方、縦罫線のy方向に連続する黒画素数は、第二エッジ画像E2上において、元々少なくない。その元々少なくないy方向に連続する黒画素数が減らされても、第二圧縮画像F2上での存在は希薄にならない。従って、文字・図形が記入されたり、出納印が押されたり、バーコードラベルが貼付されたりした帳票でも、縦罫線をうまく抽出することが出来る。 (E) The second compressed image F2 is generated by compressing the second edge image E2 in the y direction and reducing the number of pixels in the y direction. The number of black pixels that continue in the y direction, such as written characters / graphics, pressed receipt / payment stamps, and pasted barcode labels, is not originally large on the second edge image E2. Since the number of black pixels continuous in the y direction, which is not originally large, is reduced by compression in the y direction, the presence on the second compressed image F2 becomes very sparse. On the other hand, the number of black pixels continuous in the y direction of the vertical ruled line is not small originally on the second edge image E2. Even if the number of black pixels continuous in the y direction, which is not small, is reduced, the presence on the second compressed image F2 does not become dilute. Therefore, the vertical ruled line can be extracted well even in a form in which characters / graphics are entered, a cashier stamp is pressed, or a barcode label is attached.

(F)第二エッジ画像をy方向に3mmを1画素に圧縮してy方向の画素数を減らした第二圧縮画像F2を作成する。記入された文字について黒画素がy方向に連続する長さはほとんどが10mm未満であるため、第二圧縮画像F2ではほとんどが0画素〜3画素になってしまう。これにより、文字の存在を希薄化できる。他方、縦罫線について黒画素がy方向に連続する長さはほとんどが10mm以上であるため、第二圧縮画像ではほとんどが3画素以上になり、縦罫線の存在は希薄にならない。従って、文字・図形が記入されたり、出納印が押されたり、バーコードラベルが貼付されたりした帳票でも、縦罫線をうまく抽出することが出来る。 (F) The second compressed image F2 is generated by compressing the second edge image by 3 mm in the y direction to 1 pixel to reduce the number of pixels in the y direction. Since the length of the black pixels continuing in the y direction for the written characters is almost less than 10 mm, the second compressed image F2 is almost 0 to 3 pixels. Thereby, the presence of characters can be diluted. On the other hand, the length of the vertical ruled lines in which the black pixels continue in the y direction is almost 10 mm or more, so that the second compressed image is almost 3 pixels or more, and the presence of the vertical ruled lines is not dilute. Therefore, the vertical ruled line can be extracted well even in a form in which characters / graphics are entered, a cashier stamp is pressed, or a barcode label is attached.

(G)文字・図形が記入されたり、出納印が押されたり、バーコードラベルが貼付されたりした帳票でも、従来よりも高精度に横罫線・縦罫線を抽出できるので、従来よりも高精度に帳票の種類を判別できる。 (G) Higher accuracy than before because it is possible to extract horizontal and vertical ruled lines with higher accuracy than before, even in forms with characters / figures filled in, stamps entered, and barcode labels attached. The type of form can be determined.

(H)第一ヒストグラムH1を第一標準ヒストグラムHa〜Hdに合わせたサイズに正規化するため、両者を比較し易くなる。
(I)第二ヒストグラムH2を第二標準ヒストグラムJa〜Jdに合わせたサイズに正規化するため、両者を比較し易くなる。
(H) Since the first histogram H1 is normalized to a size matching the first standard histograms Ha to Hd, it is easy to compare the two.
(I) Since the second histogram H2 is normalized to a size matching the second standard histograms Ja to Jd, it is easy to compare the two.

(J)第一標準ヒストグラムHa〜Hdや第一ヒストグラムH1中のピークは当該ピーク位置に横罫線が存在することを表しているが、帳票用紙の伸縮や裁断のずれなどに起因して帳票用紙に対する横罫線の位置がずれることがあり、第一標準ヒストグラムHa〜Hdと同じ種類の帳票に係る第一ヒストグラムH1でもピーク位置がずれることがある。しかし、複数の横罫線の位置ずれ量は各横罫線に対して同じになるため、各区画領域毎の位置ずれを第一ヒストグラムH1に対して領域開始位置が一致するように補正した補正後第一ヒストグラムHyと第一標準ヒストグラムHa〜Hdと比較することによって、横罫線位置のずれによる合致度の低下を防ぐことができる。 (J) Peaks in the first standard histograms Ha to Hd and the first histogram H1 indicate that there is a horizontal ruled line at the peak position. However, the form paper is caused by expansion / contraction of the form paper or deviation of cutting. The position of the horizontal ruled line may shift, and the peak position may shift even in the first histogram H1 related to the same type of form as the first standard histograms Ha to Hd. However, since the positional deviation amount of the plurality of horizontal ruled lines is the same for each horizontal ruled line, the corrected first deviation after correcting the positional deviation for each divided area so that the area start position matches the first histogram H1. By comparing the one histogram Hy with the first standard histograms Ha to Hd, it is possible to prevent the degree of matching from being lowered due to the shift of the horizontal ruled line position.

(K)第二標準ヒストグラムJa〜Jdや第二ヒストグラムH2中のピークは当該ピーク位置に縦罫線が存在することを表しているが、帳票用紙の伸縮や裁断のずれなどに起因して帳票用紙に対する縦罫線の位置がずれることがあり、第二標準ヒストグラムJa〜Jdと同じ種類の帳票に係る第二ヒストグラムH2でもピーク位置がずれることがある。しかし、複数の縦罫線の位置ずれ量は各縦罫線に対して同じになるため、各区画領域毎の位置ずれ量を第二ヒストグラムH2に対して領域開始位置が一致するように補正した補正後第二ヒストグラムHxと第二標準ヒストグラムJa〜Jdと比較することによって、縦罫線位置のずれによる合致度の低下を防ぐことができる。 (K) The peaks in the second standard histograms Ja to Jd and the second histogram H2 indicate that there is a vertical ruled line at the peak position. However, the form paper is caused by expansion / contraction of the form paper or a shift in cutting. The position of the vertical ruled line may shift, and the peak position may shift even in the second histogram H2 related to the same type of form as the second standard histograms Ja to Jd. However, since the amount of positional deviation of the plurality of vertical ruled lines is the same for each vertical ruled line, the amount of positional deviation for each divided area is corrected so that the area start position matches the second histogram H2. By comparing the second histogram Hx and the second standard histograms Ja to Jd, it is possible to prevent the degree of matching from being lowered due to the shift of the vertical ruled line position.

(L)第一標準ヒストグラムHa〜Hdと第一ヒストグラムH1中のピーク位置の比較で求めたy方向の位置ずれ量を基にして印字領域のy方向位置を正確に割り出すことが出来る。そして、その印字領域に印字された文字を読み取って帳票の種類を判別するため、高精度に帳票の種類を判別できる。 (L) The y-direction position of the print area can be accurately determined based on the displacement amount in the y-direction obtained by comparing the peak positions in the first standard histograms Ha to Hd and the first histogram H1. Since the character printed in the print area is read to determine the type of form, the type of form can be determined with high accuracy.

(M)第二標準ヒストグラムJa〜Jdと第二ヒストグラムH2中のピーク位置の比較で求めたx方向の位置ずれ量を基にして印字領域のx方向位置を正確に割り出すことができる。そして、その印字領域に印字された文字を読み取って帳票の種類を判別するため、高精度に帳票の種類を判別できる。 (M) The position in the x direction of the print area can be accurately determined based on the amount of positional deviation in the x direction obtained by comparing the peak positions in the second standard histograms Ja to Jd and the second histogram H2. Since the character printed in the print area is read to determine the type of form, the type of form can be determined with high accuracy.

本発明の帳票種類判別装置および帳票種類判別方法は、帳票の自動仕分け装置に利用することが出来る。   The form type discriminating apparatus and form type discriminating method of the present invention can be used for an automatic form sorting apparatus.

1 帳票画像入力部
2 帳票画像傾き補正部
11 第一エッジ画像作成部
12 第一特徴検出部
13 第一特徴照合部
14 各種帳票の第一標準ヒストグラム
15 各種帳票の第一文字領域、第一文字
21 第二エッジ画像作成部
22 第二特徴検出部
23 第二特徴照合部
24 各種帳票の第二標準ヒストグラム
31 印字文字情報
32 出力部
32a 文字認識部
100 帳票種類判別装置
G 帳票画像
A1〜A7 区画領域
B1〜B4 区画領域
E1 第一エッジ画像
E2 第二エッジ画像
F1 第一圧縮画像
F2 第二圧縮画像
H1 第一ヒストグラム
H2 第二ヒストグラム
Ha〜Hd 各種帳票の第一標準ヒストグラム
Ja〜Jd 各種帳票の第二標準ヒストグラム
DESCRIPTION OF SYMBOLS 1 Form image input part 2 Form image inclination correction part 11 1st edge image creation part 12 1st feature detection part 13 1st feature collation part 14 1st standard histogram of various forms 15 1st character area of various forms, 1st character 21 1st Two-edge image creation unit 22 Second feature detection unit 23 Second feature matching unit 24 Second standard histogram of various forms 31 Printed character information 32 Output unit 32a Character recognition unit 100 Form type discrimination device G Form image A1 to A7 Partition area B1 -B4 Partition area E1 First edge image E2 Second edge image F1 First compressed image F2 Second compressed image H1 First histogram H2 Second histogram Ha-Hd First standard histogram of various forms Ja-Jd Second of various forms Standard histogram

Claims (8)

帳票の帳票画像を縦方向または横方向に微分して2値化した微分画像を生成する微分画像生成手段と、
前記微分画像生成手段により生成された微分画像を横方向または縦方向に圧縮した圧縮微分画像を生成する圧縮微分画像生成手段と、
前記圧縮微分画像生成手段により生成された圧縮微分画像に関する所定の特徴量を生成する特徴量生成手段と、
予め登録された各帳票に関する圧縮微分画像の特徴量と前記特徴量生成手段により生成された特徴量とを用いて合致度を算出する合致度算出手段と、
前記合致度算出手段により算出された合致度に基づいて帳票の種類判別結果を出力する出力手段と
を備えたことを特徴とする帳票種類判別装置。
Differential image generation means for generating a differential image obtained by differentiating the form image of the form in the vertical direction or the horizontal direction and binarizing;
A compressed differential image generating means for generating a compressed differential image obtained by compressing the differential image generated by the differential image generating means in the horizontal direction or the vertical direction;
Feature quantity generating means for generating a predetermined feature quantity related to the compressed differential image generated by the compressed differential image generating means;
A degree-of-match calculation means for calculating a degree of match using a feature amount of a compressed differential image relating to each form registered in advance and a feature amount generated by the feature amount generation means;
A form type discriminating apparatus comprising: output means for outputting a form type discrimination result based on the degree of match calculated by the match degree calculating means.
前記圧縮微分画像生成手段は、前記帳票における第1の所定の長さの画素を前記微分画像生成手段により生成された微分画像における1画素とし、且つ、前記第1の所定の長さの画素のうち第2の所定数の画素が連続してエッジ部分を形成する画素であった場合にのみ該画素の画素値をエッジ部分に割り当てた画素値とする最小値圧縮を横方向または縦方向におこなって圧縮微分画像を生成することを特徴とする請求項1に記載の帳票種類判別装置。   The compressed differential image generation means sets a pixel having a first predetermined length in the form as one pixel in the differential image generated by the differential image generation means, and the pixel having the first predetermined length. Of these, only when the second predetermined number of pixels are pixels that continuously form an edge portion, the minimum value compression is performed in the horizontal or vertical direction with the pixel value of the pixel assigned to the edge portion as the pixel value. The form type discriminating apparatus according to claim 1, wherein the compressed differential image is generated. 前記特徴量生成手段は、
前記圧縮微分画像に含まれるエッジ部分を形成する画素の画素数を横方向または縦方向に累積加算したヒストグラムを前記特徴量として生成し、
前記合致度算出手段は、予め登録された各帳票に関する圧縮微分画像の標準ヒストグラムと前記特徴量生成手段により生成された特徴量とを用いて合致度を算出する
ことを特徴とする請求項1または2に記載の帳票種類判別装置。
The feature quantity generation means includes:
A histogram obtained by cumulatively adding the number of pixels forming the edge portion included in the compressed differential image in the horizontal direction or the vertical direction is generated as the feature amount.
The degree of coincidence calculation means calculates the degree of coincidence using a standard histogram of a compressed differential image relating to each form registered in advance and the feature amount generated by the feature amount generation means. 2. The form type discriminating apparatus described in 2.
前記特徴量生成手段は、前記圧縮微分画像に含まれるエッジ部分を形成する画素の画素数を横方向または縦方向に累積加算したヒストグラムを前記標準ヒストグラムに合わせた大きさに正規化する正規化手段をさらに備えたことを特徴とする請求項3に記載の帳票種類判別装置。   The feature amount generation means normalizes a histogram obtained by accumulating the number of pixels forming the edge portion included in the compressed differential image in a horizontal direction or a vertical direction to a size matching the standard histogram. The form type identification device according to claim 3, further comprising: 前記合致度算出手段は、各種帳票の標準ヒストグラムに設定された各区画領域毎に前記標準ヒストグラム中のピーク位置と前記ヒストグラム中のピーク位置が合致する位置を求め、求めた位置に合致するように前記ヒストグラムを補正し、補正したヒストグラムと標準ヒストグラムとを比較して合致度を算出することを特徴とする請求項3または4に記載の帳票種類判別装置。   The degree-of-match calculation means obtains a position where the peak position in the standard histogram matches the peak position in the histogram for each divided area set in the standard histogram of various forms, and matches the obtained position. 5. The form type discriminating apparatus according to claim 3, wherein the histogram is corrected, and the degree of coincidence is calculated by comparing the corrected histogram with a standard histogram. 前記出力手段は、前記合致度の高い帳票種類に関連して設定された印字領域に対応する前記帳票画像上の対応領域を前記位置ずれ量に基づいて求め、前記対応領域中の文字を抽出し、該抽出した文字が前記合致度の高い帳票種類に関連して設定された印字文字と認識できた帳票の種類を出力することを特徴とする請求項5に記載の帳票種類判別装置。   The output means obtains a corresponding area on the form image corresponding to a print area set in association with the form type having a high degree of matching based on the amount of positional deviation, and extracts characters in the corresponding area. 6. The form type discriminating apparatus according to claim 5, wherein the form type that can be recognized as the print character set in association with the form type having a high degree of coincidence is output. 帳票の帳票画像を縦方向に微分して2値化した第一微分画像および帳票の帳票画像を横方向に微分して2値化した第二微分画像を生成する微分画像生成手段と、
前記微分画像生成手段により生成された第一微分画像を横方向に圧縮した第一圧縮微分画像および前記微分画像生成手段により生成された第二微分画像を縦方向に圧縮した第二圧縮微分画像を生成する圧縮微分画像生成手段と、
前記圧縮微分画像生成手段により生成された第一圧縮微分画像に関する第一特徴量および前記圧縮微分画像生成手段により生成された第二圧縮微分画像に関する第二特徴量を生成する特徴量生成手段と、
予め登録された各帳票に関する第一特徴量および第二特徴量と前記特徴量生成手段により生成された第一特徴量および第二特徴量とを用いて合致度を算出する合致度算出手段と、
前記合致度算出手段により算出された合致度に基づいて帳票の種類判別結果を出力する出力手段と
を備えたことを特徴とする帳票種類判別装置。
Differential image generation means for generating a first differential image obtained by differentiating the form image of the form in the vertical direction and binarizing and a second differential image obtained by differentiating the form image of the form in the horizontal direction and binarized;
A first compressed differential image obtained by compressing the first differential image generated by the differential image generating means in the horizontal direction and a second compressed differential image obtained by compressing the second differential image generated by the differential image generating means in the vertical direction. A compressed differential image generating means for generating;
Feature amount generating means for generating a first feature amount relating to the first compressed differential image generated by the compressed differential image generating means and a second feature amount relating to the second compressed differential image generated by the compressed differential image generating means;
A degree-of-match calculation means for calculating a degree of match using the first feature quantity and the second feature quantity relating to each form registered in advance and the first feature quantity and the second feature quantity generated by the feature quantity generation means;
A form type discriminating apparatus comprising: output means for outputting a form type discrimination result based on the degree of match calculated by the match degree calculating means.
帳票の帳票画像を縦方向または横方向に微分して2値化した微分画像を生成する微分画像生成工程と、
前記微分画像生成工程により生成された微分画像を横方向または縦方向に圧縮した圧縮微分画像を生成する圧縮微分画像生成工程と、
前記圧縮微分画像生成工程により生成された圧縮微分画像に関する所定の特徴量を生成する特徴量生成工程と、
予め登録された各帳票に関する圧縮微分画像の特徴量と前記特徴量生成工程により生成された特徴量とを用いて合致度を算出する合致度算出工程と、
前記合致度算出工程により算出された合致度に基づいて帳票の種類判別結果を出力する出力工程と
を含んだことを特徴とする帳票種類判別方法。
A differential image generating step of generating a differential image obtained by differentiating the form image of the form in the vertical direction or the horizontal direction to binarize;
A compressed differential image generating step for generating a compressed differential image obtained by compressing the differential image generated by the differential image generating step in the horizontal direction or the vertical direction;
A feature amount generating step for generating a predetermined feature amount related to the compressed differential image generated by the compressed differential image generating step;
A degree-of-match calculation step of calculating a degree of match using the feature amount of the compressed differential image for each form registered in advance and the feature amount generated by the feature amount generation step;
A form type discrimination method comprising: an output step of outputting a form type discrimination result based on the degree of match calculated in the match level calculation step.
JP2012155238A 2012-07-11 2012-07-11 Form type discriminating apparatus and form type discriminating method Active JP6039944B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012155238A JP6039944B2 (en) 2012-07-11 2012-07-11 Form type discriminating apparatus and form type discriminating method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012155238A JP6039944B2 (en) 2012-07-11 2012-07-11 Form type discriminating apparatus and form type discriminating method

Publications (2)

Publication Number Publication Date
JP2014016921A true JP2014016921A (en) 2014-01-30
JP6039944B2 JP6039944B2 (en) 2016-12-07

Family

ID=50111517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012155238A Active JP6039944B2 (en) 2012-07-11 2012-07-11 Form type discriminating apparatus and form type discriminating method

Country Status (1)

Country Link
JP (1) JP6039944B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10884737B2 (en) 2018-04-27 2021-01-05 Brother Kogyo Kabushiki Kaisha Image processing device and image processing method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222587A (en) * 1997-02-07 1998-08-21 Glory Ltd Method and device for automatically discriminating slip or the like
JP2000123174A (en) * 1998-10-16 2000-04-28 Matsushita Electric Ind Co Ltd Document format discriminating device
JP2003178071A (en) * 2001-12-10 2003-06-27 Ricoh Co Ltd Document management system
JP2009211296A (en) * 2008-03-03 2009-09-17 Sharp Corp Image processing device, image reading apparatus, image data output processing apparatus, and image processing method
WO2010113217A1 (en) * 2009-03-31 2010-10-07 富士通フロンテック株式会社 Character recognition device and character recognition method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222587A (en) * 1997-02-07 1998-08-21 Glory Ltd Method and device for automatically discriminating slip or the like
JP2000123174A (en) * 1998-10-16 2000-04-28 Matsushita Electric Ind Co Ltd Document format discriminating device
JP2003178071A (en) * 2001-12-10 2003-06-27 Ricoh Co Ltd Document management system
JP2009211296A (en) * 2008-03-03 2009-09-17 Sharp Corp Image processing device, image reading apparatus, image data output processing apparatus, and image processing method
WO2010113217A1 (en) * 2009-03-31 2010-10-07 富士通フロンテック株式会社 Character recognition device and character recognition method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10884737B2 (en) 2018-04-27 2021-01-05 Brother Kogyo Kabushiki Kaisha Image processing device and image processing method

Also Published As

Publication number Publication date
JP6039944B2 (en) 2016-12-07

Similar Documents

Publication Publication Date Title
JP5500480B2 (en) Form recognition device and form recognition method
JP6139658B2 (en) Character recognition method and character recognition system
US7999657B2 (en) Image registration method for image comparison and document authentication
JP6366024B2 (en) Method and apparatus for extracting text from an imaged document
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
Van Beusekom et al. Text-line examination for document forgery detection
CN109902710B (en) Quick matching method and device for text images
WO2014005456A1 (en) Paper character recognition method and related device
US9349237B2 (en) Method of authenticating a printed document
US8842916B2 (en) Method and system for model-based signature profile extraction
US8744189B2 (en) Character region extracting apparatus and method using character stroke width calculation
CN114694161A (en) Text recognition method and equipment for specific format certificate and storage medium
JP5630689B2 (en) Character recognition method and character recognition device
Choi et al. Localizing slab identification numbers in factory scene images
US8200016B2 (en) Method and apparatus for character string recognition
JP6039944B2 (en) Form type discriminating apparatus and form type discriminating method
KR102094234B1 (en) Serial number recognition Apparatus and method for paper money
JP5041775B2 (en) Character cutting method and character recognition device
JP3223878B2 (en) Character string collating device, method and recording medium
Ali et al. Detection and extraction of pantograph region from bank cheque images
US9047530B2 (en) Recording media processing device, control method of a recording media processing device, and computer-readable recording medium storing a program
JP2002245461A (en) Security seal impression matching method
JP2008015702A (en) Business form processor
JP3606218B2 (en) Document classification device, character reading device, authenticity determination device, and methods thereof
CN113903040A (en) Text recognition method, equipment, system and computer readable medium for shopping receipt

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160607

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161107

R150 Certificate of patent or registration of utility model

Ref document number: 6039944

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150