JP6138038B2 - Form identification device and form identification method - Google Patents
Form identification device and form identification method Download PDFInfo
- Publication number
- JP6138038B2 JP6138038B2 JP2013258863A JP2013258863A JP6138038B2 JP 6138038 B2 JP6138038 B2 JP 6138038B2 JP 2013258863 A JP2013258863 A JP 2013258863A JP 2013258863 A JP2013258863 A JP 2013258863A JP 6138038 B2 JP6138038 B2 JP 6138038B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- character
- identifier
- marker
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 25
- 239000003550 marker Substances 0.000 claims description 65
- 238000000605 extraction Methods 0.000 claims description 42
- 238000001514 detection method Methods 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 19
- 238000010586 diagram Methods 0.000 description 18
- 238000003702 image correction Methods 0.000 description 18
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Description
この発明は、帳票の画像データを解析し、帳票を識別する技術に関するものである。 The present invention relates to a technique for analyzing form image data and identifying a form.
従来より、帳票内の特徴点を用いて帳票を識別する技術が開示されている。図14は、従来の帳票認識装置の処理例を示す図である。図14(a)は帳票認識装置に入力される入力画像90を示し、図14(b)はあらかじめ設けられたサンプル画像91を示している。
まず、帳票識別装置は二値化処理した入力画像90に対して余白の検出を行い、検出した余白からマーカ領域90aを抽出する。抽出したマーカ領域90aを入力画像90の特徴点とし、図14(b)に示したサンプル画像91のマーカ領域91aとの対応点を探索する。探索した結果を元に、入力画像90とサンプル画像91とのずれを計算し、サンプル画像のID領域91bから入力画像90のID領域90bを計算し、入力画像90が示す帳票IDを特定する。
Conventionally, a technique for identifying a form by using a feature point in the form has been disclosed. FIG. 14 is a diagram illustrating a processing example of a conventional form recognition apparatus. FIG. 14A shows an
First, the form identifying device detects a margin for the
入力画像90から抽出したマーカ領域90aに基づいて、サンプル画像91から対応するマーカ領域91aを探索する方法として、例えば特許文献1にはサンプル画像上のマーカ領域と、入力画像から抽出したマーカ領域の全ての座標を比較し、サンプル画像と入力画像間でより近似するマーカ領域を探索結果とする方法が開示されている。
As a method for searching for a
しかしながら、上述した特許文献1に開示された技術では、入力画像から抽出したマーカ領域の位置と、サンプル画像のマーカ領域の位置が一致している必要があり、マーカ領域が帳票ごとにずれている場合、あるいはノイズなどの影響でマーカ領域の抽出が困難である場合に、帳票識別子を読み取ることができずに解析精度が低下するという課題があった。さらに、帳票上にマーカ領域を複数配置する必要があり、帳票構成の自由度が制限されるという課題があった。
However, in the technique disclosed in
この発明は、上記のような課題を解決するためになされたもので、マーカ領域が帳票ごとにずれている場合や、画像データからマーカ領域の抽出が困難である場合であっても、帳票の構成を制限することなく帳票識別子を認識して帳票を識別することを目的とする。 The present invention has been made to solve the above-described problem. Even when the marker area is shifted for each form or when it is difficult to extract the marker area from the image data, An object is to recognize a form identifier and identify a form without restricting the configuration.
この発明に係る帳票識別装置は、あらかじめ記憶したサンプル画像内に設定された領域と、帳票の画像データの画像サイズに基づいて、帳票の画像データに黒画素の発生頻度を示すヒストグラムを生成する領域を設定し、当該設定した領域内で帳票の画像データからヒストグラムを生成し、生成したヒストグラムに基づいて文字領域を抽出する文字領域抽出部と、文字領域抽出部が抽出した文字領域に含まれる文字列を認識する文字認識部と、あらかじめ文字列と帳票の識別子とを対応付けて記憶した帳票認識情報を参照し、文字認識部が認識した文字列に対応する帳票の識別子を取得し、帳票を識別する識別子認識部とを備えるものである。 The form identification device according to the present invention is an area for generating a histogram indicating the frequency of occurrence of black pixels in form image data based on an area set in a sample image stored in advance and an image size of the form image data. A character area extraction unit that generates a histogram from image data of a form within the set area and extracts a character area based on the generated histogram, and a character included in the character area extracted by the character area extraction unit The character recognition unit for recognizing the column, the form recognition information stored in association with the character string and the form identifier in advance, the form identifier corresponding to the character string recognized by the character recognition unit is obtained, and the form is An identifier recognizing unit for identifying.
この発明によれば、マーカ領域が帳票ごとにずれている場合、あるいは画像データからマーカ領域の抽出が困難である場合にも、帳票識別子を認識して帳票を識別することができる。また、マーカ領域によって帳票の構成が制限されることを抑制することができる。 According to the present invention, even when the marker area is shifted for each form or when it is difficult to extract the marker area from the image data, the form identifier can be recognized to identify the form. Moreover, it can suppress that the structure of a form is restrict | limited by a marker area | region.
実施の形態1.
この実施の形態1では、入力された画像データに含まれる文字領域を、帳票を識別するための領域(以下、帳票識別子領域と称する)として抽出し、抽出した帳票識別子領域を用いて帳票の識別を行う処理について説明する。
図1は、実施の形態1による帳票識別装置の構成を示すブロック図である。
帳票識別装置10は、二値化処理部1、画像補正部2、文字領域抽出部3、文字認識部4、ID認識情報記憶部5およびID認識部(識別子認識部)6で構成されている。
二値化処理部1は、入力された画像データに対して二値化処理を行う。画像補正部2は、二値化処理が行われた画像から罫線情報を抽出し、抽出した罫線の傾きを算出する。算出した罫線の傾きを元に、アファイン変換により画像の傾き補正を行う。
In the first embodiment, a character area included in input image data is extracted as an area for identifying a form (hereinafter referred to as a form identifier area), and the form is identified using the extracted form identifier area. The process of performing will be described.
FIG. 1 is a block diagram illustrating a configuration of a form identification apparatus according to the first embodiment.
The
The
図2は、実施の形態1による帳票識別装置の画像補正部によるアフィン変換を示す図である。図2(a)は傾き補正前の二値化画像を示し、図2(b)は傾き補正後の二値化画像を示す。
画像補正部2は、図2(a)で示した二値化画像に対して罫線11a,11b,11c,11d,11e,11f,11g,11hを抽出し、抽出した各罫線の傾きを検出する。検出した各罫線の傾きに基づいて、二値化画像を矢印A方向に補正するアフィン変換を行い、図2(b)で示した傾き補正後の二値化画像を得る。なお、傾きの検出および傾きに基づく補正の詳細については後述する。
FIG. 2 is a diagram illustrating affine transformation performed by the image correction unit of the form identification device according to the first embodiment. FIG. 2A shows a binarized image before tilt correction, and FIG. 2B shows a binarized image after tilt correction.
The
文字領域抽出部3は、画像補正部2が補正した補正画像から黒画素の発生頻度を示すヒストグラムを生成し、生成したヒストグラムの分布に基づいて文字領域を抽出する。文字領域の抽出処理を帳票の全ての画像データに対して行うと帳票内の罫線やノイズの影響を受け易い。そのため、あらかじめ文字領域の抽出処理を行う対象領域を設定し、設定した対象領域内においてヒストグラムを生成することにより、解析精度の向上および計算量削減の効果を得ることができる。対象領域の設定方法としては、例えば比較対象とするサンプル画像上であらかじめ対象領域を設定しておき、入力された帳票の画像サイズに基づいて拡大あるいは縮小する方法が適用可能である。
The character
図3は、実施の形態1による帳票識別装置の文字領域抽出部によるヒストグラム生成を示す図である。
図3に示した補正画像12内に対象領域12aを設定し、当該対象領域12aのX方向およびY方向の黒画素数に基づいてヒストグラム12bを生成する。生成したヒストグラム12bを補正画像12の画像サイズで正規化する。
FIG. 3 is a diagram illustrating histogram generation by the character region extraction unit of the form identification device according to the first embodiment.
A
文字認識部4は、文字領域抽出部3が抽出した文字領域内に含まれる文字列を認識する。ID認識情報記憶部5は、文字列と帳票のIDとを紐付けたID認識情報を記憶する記憶領域である。図4は、実施の形態1による帳票識別装置のID認識情報記憶部に記憶されたID認識情報の一例を示す図である。ID認識部6は、ID認識情報記憶部5に記憶されたID認識情報(識別子認識情報)を参照し、文字認識部4が認識した文字列から帳票のID(識別子)を取得し、入力された帳票を識別する。
The
次に、帳票識別装置10の動作について説明する。
図5は、実施の形態1の帳票識別装置の動作を示すフローチャートである。
二値化処理部1は、画像データの二値化処理を行う(ステップST1)。画像補正部2は、ステップST1において二値化処理が行われた二値画像データから画像補正に必要となる罫線の抽出を行う(ステップST2)。罫線の抽出方法としては、例えば以下に示す参考文献1の手法を適用することができる。
・参考文献1
平野敬、岡田康裕、依田文夫、「文書画像からの罫線抽出方式」、電子情報通信学会総合大会、Mar.1998
Next, the operation of the
FIG. 5 is a flowchart showing the operation of the form identification apparatus according to the first embodiment.
The
・
Takashi Hirano, Yasuhiro Okada, Fumio Yoda, "Rule Extraction Method from Document Images", IEICE General Conference, Mar.1998
次に、画像補正部2はステップST2で抽出した罫線の傾きを算出する(ステップST3)。ステップST3の処理を、図6を参照しながらより詳細に説明する。
図6は、実施の形態1による帳票識別装置の画像補正部の罫線の傾き角度の算出を示す図である。図6(a)は抽出した罫線の一例を示し、図6(b)はX方向の罫線の傾き角度の算出を示す説明図であり、図6(c)はY方向の罫線の傾き角度の算出を示す説明図である。
図6(a)の罫線の抽出では、画像13における線分13aおよび線分13bがX方向の罫線であり、線分13cおよび線分13dがY方向の罫線となる。図6(b)に示すように、線分13aおよび線分13bと画像13のX方向に平行な線分13xとのなす角θtを罫線13a,13bの傾き角度θtとして算出する。また図6(c)に示すように、線分13cおよび線分13dと画像13のY方向に平行な線分13yとのなす角θtを罫線の傾き角度θtとして算出する。当該罫線の傾き算出処理をステップST2で抽出した全ての罫線に対して行う。
Next, the
FIG. 6 is a diagram illustrating calculation of the inclination angle of the ruled line of the image correction unit of the form identification device according to the first embodiment. 6A shows an example of the extracted ruled line, FIG. 6B is an explanatory diagram showing calculation of the tilt angle of the ruled line in the X direction, and FIG. 6C shows the tilt angle of the ruled line in the Y direction. It is explanatory drawing which shows calculation.
6A, the
次に画像補正部2は、ステップST3で算出した全ての罫線の傾き角度θtを用いて、以下の式(1)で表すcosθおよびsinθを算出する(ステップST4)。
すなわち、全ての罫線の傾きの平均値を入力された画像の傾きとする。
Next, the
That is, the average value of the inclinations of all ruled lines is set as the inclination of the input image.
さらに、画像補正部2はステップST4で算出したcosθおよびsinθを用いて、以下の式(2)で示したアフィン変換を行い、画像補正を行う(ステップST5)。
式(2)において、(x´,y´)は補正後の画像位置を、(x,y)は補正前の画像位置を示す。
Further, the
In Expression (2), (x ′, y ′) represents the image position after correction, and (x, y) represents the image position before correction.
次に、文字領域抽出部3はステップST5で補正された補正画像について、ヒストグラムを生成する画像位置を設定する(ステップST6)。ステップST6の処理を、図7を参照しながらより詳細に説明する。
図7は、実施の形態1による帳票識別装置の文字領域抽出部のヒストグラム生成位置設定を示す図である。図7(a)は画像補正部2から入力される補正画像14を示し、図7(b)はヒストグラムを生成する画像位置があらかじめ設定されたサンプル画像15を示している。
図7(b)において、サンプル画像15内に設定されるヒストグラム生成領域16の基点Oを(x,y)、横方向の長さをw、縦方向の長さをhとした場合に、ヒストグラムの画像位置は(hx,hy)で表わされ、ヒストグラムの横方向の長さはhw、ヒストグラムの縦方向の長さはhhで表わされる。また、サンプル画像15の横方向の長さはfw、サンプル画像15の縦方向のfhで表わされる。また、図7(a)に示すように補正画像14の横方向の長さはiw、補正画像14の縦方向の長さはihで表わされる。
Next, the character
FIG. 7 is a diagram showing a histogram generation position setting of the character region extraction unit of the form identification device according to the first embodiment. FIG. 7A shows a corrected
In FIG. 7B, the histogram is defined when the base point O of the
上述したヒストグラム生成領域16の基点O、サンプル画像15の横方向および縦方向の長さ、および補正画像14の横方向および縦方向の長さを用いて、ヒストグラムの画像位置(hx,hy)、ヒストグラムの横方向の長さhwおよびヒストグラムの縦方向の長さhhが以下の式(3)で表される。
Using the base point O of the
次に、文字領域抽出部3はステップST6の処理で設定したヒストグラム生成領域において、黒画素の発生頻度を示すヒストグラムを生成する(ステップST7)。ヒストグラムの生成は、以下の式(4)に従って行う。
式(4)において、h(x)はヒストグラムの横方向の黒画素数を示し、h(y)はヒストグラムの縦方向の黒画素数を示す。
Next, the character
In Expression (4), h (x) indicates the number of black pixels in the horizontal direction of the histogram, and h (y) indicates the number of black pixels in the vertical direction of the histogram.
さらに、文字領域抽出部3はステップST7で生成したヒストグラムから文字領域を抽出する(ステップST8)。ステップST8の抽出処理において、文字位置とノイズあるいは線分との判別は、図8に示すようにヒストグラムの分布がある一定の幅を有しているか否か基づいて行われる。そこで、以下の式(5)で示す条件を有するヒストグラムを文字領域として検出する。
式(5)では、ヒストグラムの縦方向の黒画素数h(y)が閾値THhistより大きく、ヒストグラムの横方向の幅Wが閾値THWより大きいことを条件としている。
Further, the character
In Expression (5), the number of black pixels h (y) in the vertical direction of the histogram is larger than the threshold value TH hist and the width W in the horizontal direction of the histogram is larger than the threshold value THW.
図8の例では、ノイズあるいは線分17aのヒストグラムが領域17bで示され、文字領域17cのヒストグラムが領域17dで示されている。領域17bは、分布の幅Waが閾値THW以下であるため、ノイズあるいは線分であると判断される。一方、領域17dは、分布の幅Wbが閾値THWより大きく一定の幅を有していることから文字領域であると検出される。
なお、上述した式(5)の条件に限られることなく、ヒストグラムの横方向の黒画素数h(x)が閾値より大きく、ヒストグラムの縦方向の幅が閾値より大きいことを条件としてもよい。
In the example of FIG. 8, a histogram of noise or
Note that the condition is not limited to the condition of the above-described formula (5), but the condition may be that the number of black pixels h (x) in the horizontal direction of the histogram is larger than the threshold value and the vertical width of the histogram is larger than the threshold value.
文字認識部4は、ステップST8で抽出された文字領域に含まれる文字列を認識し、認識結果をID認識部6に出力する(ステップST9)。文字認識の方法としては、例えば以下の参考文献2に開示された手法を適用することができる。
・参考文献2
森稔、澤木美奈子、萩田紀博、村瀬洋、武川直樹、「ランレングス補正を用いた画質劣化にロバストな特徴抽出」、電子情報通信学会論文誌D Vol J86-D2 No.7,pp.1049-1057,July.2003.
The
・
Satoshi Mori, Minako Sawaki, Norihiro Suda, Hiroshi Murase, Naoki Takegawa, “Robust Feature Extraction for Image Degradation Using Run-Length Correction”, IEICE Transactions D Vol J86-D2 No.7, pp.1049- 1057, July. 2003.
ID認識部6は、ID認識情報記憶部5に記憶されたID認識情報を参照し、ステップST9で認識した文字列に対応するIDを取得し、帳票識別装置10に入力された帳票を識別し(ステップST10)、処理を終了する。
The
以上のように、この実施の形態1によれば、入力された画像データから文字領域を抽出する文字領域抽出部3と、抽出された文字領域に含まれる文字列を認識する文字認識部4と、ID認識情報を参照して認識した文字列に対応するIDを取得し、装置に入力された帳票を識別するID認識部6とを備えるように構成したので、入力された画像データに含まれる文字領域を、帳票を認識するための帳票識別子領域として用いて帳票を識別することができる。これにより、マーカ領域の抽出が困難である場合にも帳票を識別することができる。また、帳票内に複数のマーカ領域を配置する必要がなく、帳票の構成の自由度を高めることができる。
As described above, according to the first embodiment, the character
また、この実施の形態1によれば、あらかじめ文字領域の抽出処理を行う対象領域を設定し、文字領域抽出部3が設定された対象領域内においてヒストグラムを生成するように構成したので、文字領域の抽出処理において帳票内の罫線やノイズにより受ける影響を抑制することができ、帳票識別装置の解析精度の向上および計算量削減を実現することができる。
In addition, according to the first embodiment, since the target region for performing the character region extraction process is set in advance, and the histogram is generated in the target region in which the character
実施の形態2.
この実施の形態2では、実施の形態1で示した文字領域の抽出に加えて、帳票を認識するためにあらかじめ帳票内に設けられたマーカを抽出し、抽出した文字領域あるいはマーカを用いて帳票識別子領域を検出し、帳票を識別する構成を示す。
図9は、実施の形態2の帳票識別装置の構成を示すブロック図である。
実施の形態2の帳票識別装置20は、図1で示した実施の形態1の帳票識別装置10にマーカ抽出部7を追加して設け、文字認識部4に替えてID領域検出部(識別子領域検出部)8を設けている。なお以下では、実施の形態1による帳票識別装置10の構成要素と同一または相当する部分には、図1で使用した符号と同一の符号を付して説明を省略または簡略化する。
In the second embodiment, in addition to the extraction of the character area shown in the first embodiment, a marker provided in the form in advance for recognizing the form is extracted, and the extracted character area or marker is used for the form. The structure which detects an identifier area | region and identifies a form is shown.
FIG. 9 is a block diagram illustrating a configuration of the form identification apparatus according to the second embodiment.
The
マーカ抽出部7は、画像補正部2が補正した補正画像からあらかじめ帳票内に設けられたマーカを抽出すると共に、当該マーカの位置を抽出する。ID領域検出部8は、文字領域抽出部3が生成したヒストグラムと、あらかじめ記憶されたサンプル画像中のヒストグラムとを比較し、類似度αを算出する。同様に、マーカ抽出部7が抽出したマーカの位置と、サンプル画像中のマーカ位置とを比較し、類似度βを算出する。類似度として、例えば対応する点同士の距離の和を用いるなどが考えられる。
The
次に、図10を参照しながらID領域検出部8によるヒストグラムの比較方法について説明する。図10は、実施の形態2による帳票識別装置のID領域検出部によるヒストグラムの比較を示す図である。図10(a)は文字領域抽出部3が生成したヒストグラムを示し、図10(b)はID領域検出部8がヒストグラムに基づいて生成した線分を示している。
図10(a)で示した各ヒストグラム21a,21b,21cについて、ID領域検出部8はピーク位置およびヒストグラムの大きさを算出する。算出したピーク位置およびヒストグラムの大きさが図12(b)に示すように線分21d,21e,21fで表わされる。当該線分21d,21e,21fとサンプル画像中のヒストグラムの線分とを比較することにより、ヒストグラムの類似度αを算出する。
Next, a histogram comparison method by the ID
For each of the
一般的に、スキャナあるいはFAXで受信した画像においては、抽出した文字領域やマーカなどが全く異なる位置に存在することは少ない。そのため、ID領域検出部8は帳票の補正画像とあらかじめ記憶したサンプル画像間で文字領域やマーカなどの配置位置の差分に基づいて、ヒストグラムの類似度αおよびマーカ位置の類似度βを算出し、算出した類似度αと類似度βとを比較し、類似度がより高い(より近似する位置情報を有する)文字領域あるいはマーカを入力画像に対してより精度よく検出できたと判定し、ID領域(識別子領域)の検出に用いる。
In general, in an image received by a scanner or FAX, extracted character areas, markers, and the like are rarely present at completely different positions. Therefore, the ID
ID認識部(識別子認識部)6´は、ID領域検出部8が検出したID領域に記述されたID(識別子)を取得し、入力された帳票を識別する。
図11は、実施の形態2による帳票識別装置のID認識部が読み取るIDの一例を示す図である。図11(a)はIDが数字で示されている場合を示し、図11(b)はIDが棒の本数で示されている場合を示している。
The ID recognizing unit (identifier recognizing unit) 6 ′ acquires the ID (identifier) described in the ID area detected by the ID
FIG. 11 is a diagram illustrating an example of an ID read by the ID recognition unit of the form identification device according to the second embodiment. FIG. 11A shows a case where the ID is indicated by a number, and FIG. 11B shows a case where the ID is indicated by the number of bars.
次に、帳票識別装置20の動作について説明する。
図12は、実施の形態2の帳票識別装置の動作を示すフローチャートである。なお、以下では実施の形態1に係る帳票識別装置10と同一のステップには図5で使用した符号と同一の符号を付し、説明を省略または簡略化する。
ステップST5において画像補正部2が画像補正を行うと、文字領域抽出部3は補正画像に対してステップST6からステップST8の処理を行い、ヒストグラム生成および文字領域の抽出を行う。また、ステップST6からステップST8の処理と並列して、マーカ抽出部7は補正画像に対してマーカおよびマーカ位置の抽出を行う(ステップST21)。
Next, the operation of the
FIG. 12 is a flowchart illustrating the operation of the form identification apparatus according to the second embodiment. In the following description, the same steps as those in the
When the
ID領域検出部8は、ステップST6からステップST8において文字領域抽出部3が生成したヒストグラムと、あらかじめ記憶したサンプル画像のヒストグラムとの類似度αを算出する(ステップST22)と共に、ステップST21においてマーカ抽出部7が抽出したマーカとサンプル画像のマーカとの類似度βを算出する(ステップST23)。さらに、ID領域検出部8はステップST22およびステップST23で算出した類似度αと類似度βを比較し、類似度がより高いヒストグラムあるいはマーカを用いて入力画像の文字位置(ctx,cty)を決定する(ステップST24)。
The ID
ステップST23の比較処理を具体的に説明すると、類似度αが高い場合(類似度α>類似度β)にはヒストグラムにおいて正確に位置合わせができたものとして、ヒストグラムの文字領域を用いて入力画像の文字位置(ctx,cty)を決定する。
一方、類似度βが高い場合(類似度α<類似度β)にはマーカにおいて正確に位置合わせができたものとして、マーカ位置を用いて入力画像の文字位置(ctx,cty)を決定する。
The comparison process in step ST23 will be described in detail. When the similarity α is high (similarity α> similarity β), it is assumed that the registration has been correctly performed in the histogram, and the input image using the character area of the histogram is used. Character position (ctx, cty) is determined.
On the other hand, when the similarity β is high (similarity α <similarity β), the character position (ctx, cty) of the input image is determined using the marker position on the assumption that the marker has been accurately aligned.
ステップST23で決定した入力画像の文字位置(ctx,cty)を用いて、以下の式(6)により入力画像とサンプル画像との位置ずれ(cdx,cdy)を検出する(ステップST25)。
式(6)において、(fx,fy)はサンプル画像上で位置合わせに用いる特徴点の位置を示し、(ctx,cty)は入力画像の文字位置を示す。
Using the character position (ctx, cty) of the input image determined in step ST23, the positional deviation (cdx, cdy) between the input image and the sample image is detected by the following equation (6) (step ST25).
In Expression (6), (fx, fy) indicates the position of the feature point used for alignment on the sample image, and (ctx, cty) indicates the character position of the input image.
図13は、実施の形態2の帳票識別装置のID領域検出部において文字領域を用いて位置ずれを検出する一例を示す図である。図13(a)は入力画像22を示し、図13(b)はサンプル画像23を示している。図13(a)は入力画像22の文字領域22aおよびID領域22bを示し、文字領域22aの文字位置が(ctx,cty)であることを示している。図13(b)はサンプル画像23の文字領域23aおよびID領域23bを示し、文字領域23aの位置が(fx,fy)であることを示している。
FIG. 13 is a diagram illustrating an example in which a positional deviation is detected using a character area in the ID area detection unit of the form identification apparatus according to the second embodiment. FIG. 13A shows the
なお、入力画像において文字領域が複数存在する場合は、複数の文字領域の文字位置の平均値を入力画像とサンプル画像との位置ずれとする。その場合、以下の式(7)に基づいて文字位置の平均値を算出する。
When there are a plurality of character areas in the input image, the average value of the character positions of the plurality of character areas is defined as a positional deviation between the input image and the sample image. In that case, the average value of the character positions is calculated based on the following equation (7).
ID領域検出部8は、ステップST25で検出した入力画像とサンプル画像とのずれを用いて以下の式(8)に基づいて、入力画像中のID領域の左上の座標(sx,sy)を決定する(ステップST26)。
The ID
さらに、入力画像中のID領域の大きさを以下の式(9)に基づいて決定する(ステップST27)。
式(9)において、sw,shはサンプル画像中のID領域の縦横の長さを示し、IDw,IDhは入力画像中のID領域の縦横の長さを示す。
Further, the size of the ID area in the input image is determined based on the following equation (9) (step ST27).
In Expression (9), sw and sh indicate the vertical and horizontal lengths of the ID area in the sample image, and IDw and IDh indicate the vertical and horizontal lengths of the ID area in the input image.
ID認識部6は、ステップST27で大きさが決定された入力画像中のID領域からIDを取得し、帳票識別装置20に入力された帳票を識別し(ステップST28)、処理を終了する。
なお、ID領域のIDが数字などの文字で構成されている場合、例えば上述した参考文献2の手法を適用してIDを認識することができる。
The
In addition, when ID of ID area | region is comprised with characters, such as a number, ID can be recognized by applying the method of the
なお、上述したステップST26からステップST28では、図13に基づいて文字領域を用いてID領域を決定する構成を示したが、マーカにおいて正確に位置合わせができた場合には当該マーカを用いてID領域を決定する。 In the above-described steps ST26 to ST28, the configuration in which the ID area is determined using the character area based on FIG. 13 is shown. However, when the marker can be accurately aligned, the ID is determined using the marker. Determine the area.
以上のように、この実施の形態2によれば、補正画像に対してヒストグラムを生成して文字領域の抽出を行う文字領域抽出部3と、補正画像に対してマーカの抽出を行うマーカ抽出部7と、抽出したヒストグラムとサンプル画像のヒストグラムの類似度と、抽出したマーカとサンプル画像のマーカの類似度を比較してより類似度が高い特徴点を用いてID領域を検出するID領域検出部8と、検出したID領域からIDを取得して帳票を識別するID認識部6´とを備えるように構成したので、ID領域の検出精度を向上させることができる。
As described above, according to the second embodiment, the character
なお、上述した実施の形態2では、ID領域検出部8によるID領域の検出に文字位置とマーカ位置とを用いる構成を示したが、文字位置とマーカ位置に限定されることなく、マーカ位置と罫線位置など各帳票において位置が変化しない要素を特徴点として用いるように構成してもよい。
In the second embodiment described above, the configuration in which the character position and the marker position are used for detection of the ID area by the ID
なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。 In the present invention, within the scope of the invention, any combination of the embodiments, or any modification of any component in each embodiment, or omission of any component in each embodiment is possible. .
1 二値化処理部、2 画像補正部、3 文字領域抽出部、4 文字認識部、5 ID認識情報記憶部、6,6´ ID認識部、7 マーカ抽出部、8 ID領域検出部、10,20 帳票識別装置。
DESCRIPTION OF
Claims (6)
あらかじめ記憶したサンプル画像内に設定された領域と、前記帳票の画像データの画像サイズに基づいて、前記帳票の画像データに黒画素の発生頻度を示すヒストグラムを生成する領域を設定し、当該設定した領域内で前記帳票の画像データから前記ヒストグラムを生成し、生成したヒストグラムに基づいて文字領域を抽出する文字領域抽出部と、
前記文字領域抽出部が抽出した文字領域に含まれる文字列を認識する文字認識部と、
あらかじめ文字列と帳票の識別子とを対応付けて記憶した帳票認識情報を参照し、前記文字認識部が認識した文字列に対応する前記帳票の識別子を取得し、前記帳票を識別する識別子認識部とを備えたことを特徴とする帳票識別装置。 In the form identification device for identifying the form from the image data of the form,
Based on the area set in the sample image stored in advance and the image size of the image data of the form, an area for generating a histogram indicating the occurrence frequency of black pixels is set in the image data of the form, and the set A character area extraction unit that generates the histogram from the image data of the form within the area, and extracts a character area based on the generated histogram ;
A character recognition unit for recognizing a character string included in the character region extracted by the character region extraction unit;
An identifier recognition unit for referring to the form recognition information stored in association with the character string and the form identifier in advance, acquiring the form identifier corresponding to the character string recognized by the character recognition unit, and identifying the form; A form identification device characterized by comprising:
前記帳票の画像データから特徴点および当該特徴点の位置情報を抽出する特徴点抽出部と、
前記帳票の画像データからマーカおよび当該マーカの位置情報を抽出するマーカ抽出部と、
前記特徴点抽出部が抽出した前記特徴点の位置情報とあらかじめ記憶したサンプル画像中の特徴点の位置情報とを比較すると共に、前記マーカ抽出部が抽出した前記マーカの位置情報と前記サンプル画像中のマーカの位置情報とを比較し、より近似する位置情報を有する前記特徴点あるいは前記マーカを用いて前記帳票の画像データから前記帳票の識別子を含む識別子領域を検出する識別子領域検出部と、
前記識別子領域検出部が検出した前記識別子領域から前記帳票の識別子を取得し、前記帳票を識別する識別子認識部とを備えたことを特徴とする帳票識別装置。 In the form identification device for identifying the form from the image data of the form,
A feature point extracting unit that extracts feature points and position information of the feature points from the image data of the form;
A marker extracting unit that extracts marker and position information of the marker from the image data of the form;
The position information of the feature point extracted by the feature point extraction unit is compared with the position information of the feature point in the sample image stored in advance, and the position information of the marker extracted by the marker extraction unit and in the sample image An identifier area detection unit that detects an identifier area that includes the identifier of the form from the image data of the form using the feature point or the marker that has more approximate position information,
A form identification apparatus comprising: an identifier recognition unit that acquires an identifier of the form from the identifier area detected by the identifier area detection unit and identifies the form.
文字領域抽出手段が、あらかじめ記憶したサンプル画像内に設定された領域と、前記帳票の画像データの画像サイズに基づいて、前記帳票の画像データに黒画素の発生頻度を示すヒストグラムを生成する領域を設定し、当該設定した領域内で前記帳票の画像データから前記ヒストグラムを生成し、生成したヒストグラムに基づいて文字領域を抽出するステップと、
文字認識手段が、前記抽出した文字領域に含まれる文字列を認識するステップと、
識別子認識部が、あらかじめ文字列と帳票の識別子とを対応付けて記憶した帳票認識情報を参照し、前記認識した文字列に対応する前記帳票の識別子を取得し、前記帳票を識別するステップとを備えたことを特徴とする帳票識別方法。 In the form identification method for identifying the form from the image data of the form,
The character area extracting means generates a histogram indicating the occurrence frequency of black pixels in the image data of the form based on the area set in the sample image stored in advance and the image size of the image data of the form. Setting, generating the histogram from the image data of the form within the set area, and extracting a character area based on the generated histogram ;
A step of recognizing a character string included in the extracted character region;
The identifier recognition unit refers to the form recognition information stored in association with the character string and the form identifier in advance, acquires the form identifier corresponding to the recognized character string, and identifies the form; and A form identification method characterized by comprising.
特徴点抽出手段が、前記帳票の画像データから特徴点および当該特徴点の位置情報を抽出するステップと、
マーカ抽出手段が、前記帳票の画像データからマーカおよび当該マーカの位置情報を抽出するステップと、
識別子領域検出手段が、前記特徴点の位置情報とあらかじめ記憶したサンプル画像中の特徴点の位置情報とを比較すると共に、前記マーカの位置情報と前記サンプル画像中のマーカの位置情報とを比較し、より近似する位置情報を有する前記特徴点あるいは前記マーカを用いて前記帳票の画像データから前記帳票の識別子を含む識別子領域を検出するステップと、
識別子認識手段が、前記識別子領域から前記帳票の識別子を取得し、前記帳票を識別するステップとを備えたことを特徴とする帳票識別方法。 In the form identification method for identifying the form from the image data of the form,
A feature point extracting means for extracting a feature point and position information of the feature point from the image data of the form;
Marker extracting means for extracting a marker and position information of the marker from the image data of the form;
The identifier area detecting means compares the position information of the feature point with the position information of the feature point in the sample image stored in advance, and compares the position information of the marker with the position information of the marker in the sample image. Detecting an identifier area including the identifier of the form from the image data of the form using the feature point or the marker having more approximate position information;
A form identifying method comprising: an identifier recognizing unit that obtains an identifier of the form from the identifier area and identifies the form.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013258863A JP6138038B2 (en) | 2013-12-16 | 2013-12-16 | Form identification device and form identification method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013258863A JP6138038B2 (en) | 2013-12-16 | 2013-12-16 | Form identification device and form identification method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015115025A JP2015115025A (en) | 2015-06-22 |
JP6138038B2 true JP6138038B2 (en) | 2017-05-31 |
Family
ID=53528714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013258863A Active JP6138038B2 (en) | 2013-12-16 | 2013-12-16 | Form identification device and form identification method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6138038B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447522A (en) * | 2015-11-25 | 2016-03-30 | 成都数联铭品科技有限公司 | Complex image character identification system |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3469345B2 (en) * | 1995-03-16 | 2003-11-25 | 株式会社東芝 | Image filing apparatus and filing method |
JP4416890B2 (en) * | 1999-12-20 | 2010-02-17 | 富士通株式会社 | Form identification device |
US6778703B1 (en) * | 2000-04-19 | 2004-08-17 | International Business Machines Corporation | Form recognition using reference areas |
JP2009025856A (en) * | 2007-07-17 | 2009-02-05 | Hitachi Computer Peripherals Co Ltd | Document discrimination program and document discrimination device |
JP2010009168A (en) * | 2008-06-25 | 2010-01-14 | Ricoh Co Ltd | Image processing apparatus, image processing method, and image processing program |
JP5187057B2 (en) * | 2008-08-07 | 2013-04-24 | 株式会社リコー | Layout printing system, layout document browsing method, and program |
-
2013
- 2013-12-16 JP JP2013258863A patent/JP6138038B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015115025A (en) | 2015-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020119301A1 (en) | Two-dimensional code identification method, apparatus, and device | |
US8548201B2 (en) | Apparatus and method for recognizing identifier of vehicle | |
US8170368B2 (en) | Correcting device and method for perspective transformed document images | |
US9269155B2 (en) | Region growing method for depth map/color image | |
JP5934762B2 (en) | Document modification detection method by character comparison using character shape characteristics, computer program, recording medium, and information processing apparatus | |
US9858477B2 (en) | Character segmenting apparatus, character recognition apparatus, and character segmenting method | |
JP4626886B2 (en) | Method and apparatus for locating and extracting captions in digital images | |
US20120087590A1 (en) | Feature point location determination method and apparatus | |
US9613299B2 (en) | Method of identifying pattern training need during verification of recognized text | |
US20120106784A1 (en) | Apparatus and method for tracking object in image processing system | |
US9251430B2 (en) | Apparatus, method, and program for character recognition using minimum intensity curve of image data | |
CN113011426A (en) | Method and device for identifying certificate | |
JP2009129237A (en) | Image processing apparatus and its method | |
US20210042536A1 (en) | Image processing device and image processing method | |
JP2008251029A (en) | Character recognition device and license plate recognition system | |
US20130050765A1 (en) | Method and apparatus for document authentication using image comparison on a block-by-block basis | |
JP2006323779A (en) | Image processing method and device | |
EP3522115A1 (en) | Medium recognition device and medium recognition method | |
JP6138038B2 (en) | Form identification device and form identification method | |
JP6434718B2 (en) | Face image recognition apparatus and face image recognition program | |
JP2018109824A (en) | Electronic control device, electronic control system, and electronic control method | |
KR20150099116A (en) | Method for recognizing a color character using optical character recognition and apparatus thereof | |
KR101954812B1 (en) | Device and method for handwriting recognition | |
JP5761353B2 (en) | Ridge direction extraction device, ridge direction extraction method, ridge direction extraction program | |
KR101437286B1 (en) | Method and apparatus for identifying digital contents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6138038 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |