JP2006229685A - Distortion determination device for business form - Google Patents

Distortion determination device for business form Download PDF

Info

Publication number
JP2006229685A
JP2006229685A JP2005042129A JP2005042129A JP2006229685A JP 2006229685 A JP2006229685 A JP 2006229685A JP 2005042129 A JP2005042129 A JP 2005042129A JP 2005042129 A JP2005042129 A JP 2005042129A JP 2006229685 A JP2006229685 A JP 2006229685A
Authority
JP
Japan
Prior art keywords
distortion
unit
image
feature
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005042129A
Other languages
Japanese (ja)
Inventor
Tomoya Igi
智也 井木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2005042129A priority Critical patent/JP2006229685A/en
Publication of JP2006229685A publication Critical patent/JP2006229685A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To detect the distortion of a business form by measuring the distortion characteristics from the outline information on the business form of the acquired picture to compair with the registered characteristics. <P>SOLUTION: The distortion determination device for a business form which determines the distortion of the outline of a business form on the acquired picture is provided with a side divider for obtaining a side dividing point, where the side of the business form is divided; a distortion characteristic extractor for extracting an angle of the line segments in an intersection of each line segment as a distortion characteristic, by connecting the side dividing points of each opposing side with predetermined corresponding conditions; a distortion characteristic storage for storing the distortion characteristic in a standard condition beforehand as a reference distortion characteristic; and a distortion determination part for determining the distortion of the business form by comparing the reference distortion characteristic with the extracted distortion characteristic of the business form. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、帳票をマットにセットし、上部からセンサ部でイメージを読み取る非接触スキャナ装置を用いた帳票画像の歪みを判別する帳票歪み判別装置に関するものである。   The present invention relates to a form distortion determination apparatus that sets a form on a mat and determines the distortion of a form image using a non-contact scanner device that reads an image from above with a sensor unit.

現在、金融営業店の窓口業務等にて、顧客が持ち込んだ帳票や本人確認書類等の種々の用紙の画像を取得するための、非接触型スキャナが用いられている。非接触型スキャナは、帳票を置くマット部の上方に設置されたカメラによって、帳票の画像を取得する形式のスキャナである。金融営業店の窓口業務においては、非接触型スキャナは、金融営業店窓口の窓口端末に接続され、画像取得の制御が行われる。非接触型スキャナは、フラットベッド型スキャナやシートフィード型スキャナに比べ、画像取得のための操作が簡便で所要時間が短い等の特徴を持っている。(例えば非特許文献1)
窓口にて取得された帳票の画像に対しては、光学的文字認識装置によって所定の文字認識処理が行われ、記入内容がデータ化され、金融取引に利用される。
以下に本発明の従来技術について説明する。
Currently, non-contact scanners for acquiring images of various papers such as forms and identification documents brought in by customers are used in the counter business of financial sales offices. The non-contact type scanner is a type of scanner that acquires an image of a form by a camera installed above a mat portion on which the form is placed. In the counter business of a financial sales office, the non-contact type scanner is connected to the counter terminal of the financial sales office counter, and image acquisition control is performed. The non-contact type scanner has features such as a simpler operation for image acquisition and a shorter time required than a flat bed type scanner or a sheet feed type scanner. (For example, Non-Patent Document 1)
The form image acquired at the window is subjected to predetermined character recognition processing by an optical character recognition device, and the contents of entry are converted into data and used for financial transactions.
The prior art of the present invention will be described below.

<従来のシステム構成>
従来のシステムの概観を図6に示す。
従来のシステムは、非接触スキャナ装置101、光学式文字認識装置102、WS103から構成され、WS103はキーボード等の入力手段とCRT等の表示手段を備える。
図6において、非接触スキャナ装置101は上から見た図を示している。非接触スキャナ装置101、光学式文字認識装置102、については後述する。
WS103はシステム全体を制御するための端末であり、図示しないメモリやCRT等の表示部やキーボードマウス等の操作部を備えた、一般的なPC等が使用される。
なお、ここでは光学式文字認識装置102はハードウェアによって実現するものとして説明するが、WS103内に設けたソフトウェアであってもよい。
<Conventional system configuration>
An overview of a conventional system is shown in FIG.
The conventional system includes a non-contact scanner device 101, an optical character recognition device 102, and a WS 103. The WS 103 includes input means such as a keyboard and display means such as a CRT.
In FIG. 6, the non-contact scanner device 101 is viewed from above. The non-contact scanner device 101 and the optical character recognition device 102 will be described later.
The WS 103 is a terminal for controlling the entire system, and a general PC or the like having a display unit such as a memory and a CRT (not shown) and an operation unit such as a keyboard mouse is used.
Here, the optical character recognition apparatus 102 is described as being realized by hardware, but may be software provided in the WS 103.

<非接触スキャナ装置の構成>
非接触スキャナ装置101の構成は、図7に示すように、制御部101c、マット部101a、画像取得部101bから構成される。
制御部101cは、非接触スキャナ装置101全体の制御手段、光学式文字認識装置102との通信手段を有する。
マット部101aは、画像を取得する帳票を設置するための置き台である。マット部101aは図6においては網掛けで表現しているが、黒色等、画像上で帳票と容易に区別ができる色の材質が用いられる。これにより、取得した帳票画像はマット部が背景となるため、黒い背景色に対し、帳票が浮き上がって見えるような状態となる。このため、容易に帳票の辺を検出することが可能となる。
画像取得部101bは、マット部101a上の帳票を撮影し画像データに変換する機能を有する、CCDやC−MOS等を利用したカメラである。
<Configuration of non-contact scanner device>
As shown in FIG. 7, the non-contact scanner device 101 includes a control unit 101c, a mat unit 101a, and an image acquisition unit 101b.
The control unit 101 c includes a control unit for the entire non-contact scanner device 101 and a communication unit with the optical character recognition device 102.
The mat unit 101a is a table for installing a form for acquiring an image. The mat portion 101a is represented by shading in FIG. 6, but a material of a color such as black that can be easily distinguished from the form on the image is used. As a result, the acquired form image has a mat portion as a background, so that the form appears to rise against the black background color. For this reason, it is possible to easily detect the sides of the form.
The image acquisition unit 101b is a camera using a CCD, a C-MOS, or the like that has a function of photographing a form on the mat unit 101a and converting it into image data.

<光学式文字認識装置の構成>
光学式文字認識装置は、取得した帳票の画像から、帳票の種類を特定し、さらに当該帳票の文字認識すべき領域を特定し、文字認識を行う。
光学式文字認識装置102の構成は、図8に示すように、制御部102a、画像メモリ102b、帳票角検出部102c、フォーマット作成部102d、フォーマット読取部102e、文字領域補正部102f、文字認識部102gから構成される。また非接触スキャナ装置101およびWS103との図示しない通信手段を有する。
<Configuration of optical character recognition device>
The optical character recognition device identifies the type of form from the acquired form image, further identifies the area of the form to be recognized, and performs character recognition.
As shown in FIG. 8, the configuration of the optical character recognition device 102 includes a control unit 102a, an image memory 102b, a form angle detection unit 102c, a format creation unit 102d, a format reading unit 102e, a character area correction unit 102f, and a character recognition unit. 102g. In addition, communication means (not shown) with the non-contact scanner device 101 and the WS 103 is included.

光学式文字認識装置102の制御部102aは、光学文字認識装置102全体の制御を行う。
画像メモリ102bは、帳票画像データを保持する手段を有する。各処理部は、適宜画像メモリ102bを参照することにより、帳票画像を参照することができる。
帳票角検出部102cは、画像から帳票角を検出する手段を有する。帳票の角の検出は、例えば画像を走査して、画素の濃度の違いにより背景と帳票部分との境目すなわち帳票辺を検出する。得られた帳票辺となる画素を追跡して、XまたはY座標の変化量の正負が反転するか、変化が開始される場所を角と判断することができる。または、各帳票辺から任意に複数の点を選択し、ハフ変換等既知の技術を用いることにより各帳票辺ごとに直線または曲線に近似し、それらの交点を角として選択することもできる。
フォーマット作成部102dは、文字領域座標等の文字認識に必要なフォーマットを作成する手段を有する。フォーマット作成部102dについては後述する。
フォーマット読取部102eは、他の処理部に対してフォーマットの内容を読取る機能を提供する。
文字領域補正部102fは、フォーマットから文字領域座標を補正する手段を有する。文字領域補正部102fについては後述する。
文字認識部102gは、図示しない文字認識辞書とのパターンマッチングにより、文字を認識する機能を提供する。
The control unit 102 a of the optical character recognition device 102 controls the entire optical character recognition device 102.
The image memory 102b has means for holding the form image data. Each processing unit can refer to the form image by appropriately referring to the image memory 102b.
The form angle detection unit 102c has means for detecting a form angle from the image. The corner of the form is detected by, for example, scanning an image and detecting the boundary between the background and the form part, that is, the form side based on the difference in pixel density. By tracking the obtained pixels as the sides of the form, it is possible to determine whether the change of the X or Y coordinate is reversed or the place where the change starts is a corner. Alternatively, a plurality of points can be arbitrarily selected from each form side, and a known technique such as Hough transform can be used to approximate each form side to a straight line or a curve, and the intersection point can be selected as a corner.
The format creation unit 102d has means for creating a format necessary for character recognition such as character region coordinates. The format creation unit 102d will be described later.
The format reading unit 102e provides a function for reading the contents of the format to other processing units.
The character area correction unit 102f has means for correcting the character area coordinates from the format. The character area correction unit 102f will be described later.
The character recognition unit 102g provides a function of recognizing characters by pattern matching with a character recognition dictionary (not shown).

<フォーマット作成部>
フォーマット作成部102dの構成は、図9に示すように、制御部102d1、フォーマット保存部102d2、文字領域座標設定部102d3で構成される。また、他の処理部との図示しない通信処理部を有する。
<Format creation section>
As shown in FIG. 9, the format creation unit 102d includes a control unit 102d1, a format storage unit 102d2, and a character area coordinate setting unit 102d3. Moreover, it has a communication processing unit (not shown) with other processing units.

フォーマット作成部の制御部102d1は、フォーマット作成部102d全体の制御を行う。
フォーマット保存部102d2は、文字領域座標等の文字認識に必要なフォーマットを図示しないフォーマット記憶部に保存する機能を提供する。なお、以下フォーマットの取得は、フォーマット記憶部から行うものとする。
前記フォーマットには、各帳票の識別情報とともに、各文字領域ごとに帳票の基準となる角(例えば左上)からの相対座標が格納されている。文字認識部は、この情報を元に、帳票画像上の文字領域を特定し、記入されている文字を認識する。
文字領域座標設定部102d3は、フォーマット作成するオペレータの入力操作を受けて、上記の座標の他、文字認識に使用する辞書の種類等、必要な情報をフォーマットとして登録する。ここでは、オペレータはWS103を介してフォーマット作成部にデータを入力するものとする。
The control unit 102d1 of the format creation unit controls the entire format creation unit 102d.
The format storage unit 102d2 provides a function of storing a format necessary for character recognition such as character region coordinates in a format storage unit (not shown). Hereinafter, the format is acquired from the format storage unit.
The format stores relative coordinates from the corner (for example, upper left), which is the basis of the form, for each character area, along with the identification information of each form. Based on this information, the character recognition unit identifies the character area on the form image and recognizes the entered character.
The character area coordinate setting unit 102d3 receives the input operation of the operator who creates the format, and registers necessary information such as the type of dictionary used for character recognition in addition to the above coordinates as the format. Here, it is assumed that the operator inputs data to the format creation unit via the WS 103.

<文字領域補正部>
文字領域補正部102fの構成は、図10に示すように、制御部102f1、文字領域位置補正部102f2で構成される。また、他の処理部との図示しない通信処理部を有する。
文字領域補正部102fの制御部102f1は、文字領域補正部102f全体の制御を行う。
<Character area correction unit>
As shown in FIG. 10, the configuration of the character region correction unit 102f includes a control unit 102f1 and a character region position correction unit 102f2. Moreover, it has a communication processing unit (not shown) with other processing units.
The control unit 102f1 of the character area correction unit 102f controls the entire character area correction unit 102f.

文字領域位置補正部102f2は、左上の角の座標から文字領域を補正する。なお、ここでは左上としたが、前記相対座標の基準となる角を左上としているためであり、例えば右上等、他のすべての角を基準とすることが可能である。   The character region position correction unit 102f2 corrects the character region from the coordinates of the upper left corner. Note that although the upper left corner is used here, the reference angle of the relative coordinate is the upper left corner. For example, all other corners such as the upper right corner can be used as a reference.

<動作>
(a)フォーマット登録時
図11(a)は、非接触スキャナを用いた光学式文字認識システムにおける登録時のフローチャートである。まず、画像取得部101bにて、マット部101a上に置かれた登録帳票の読取りを行い、取得画像を画像メモリ102bに取り込む(S101)。続いて、帳票角検出部102cにて、画像メモリ102bを参照して、画像上の帳票角を4点検出する(S102)。続いて、文字領域座標設定部102d3にて、画像メモリ102bを参照して、WS103のCRTに画像を表示し、オペレータは、文字領域を設定する(S103)。続いて、フォーマット保存部102d2にて、別途指定したシートID等の各帳票の識別情報とともに帳票角座標と文字領域座標をフォーマットに保存する(S104)。
<Operation>
(A) Format Registration FIG. 11A is a flowchart at the time of registration in an optical character recognition system using a non-contact scanner. First, the image acquisition unit 101b reads a registered form placed on the mat unit 101a, and captures the acquired image into the image memory 102b (S101). Subsequently, the form angle detection unit 102c refers to the image memory 102b to detect four form angles on the image (S102). Subsequently, the character area coordinate setting unit 102d3 refers to the image memory 102b to display an image on the CRT of the WS 103, and the operator sets the character area (S103). Subsequently, the format storage unit 102d2 stores the form corner coordinates and the character area coordinates in the format together with the identification information of each form such as a sheet ID specified separately (S104).

(b)読取時
図11(b)は、非接触スキャナを用いた光学式文字認識システムにおける読取時のフローチャートである。まず、画像取得部101bにて、マット部101a上に置かれた読取帳票の読取りを行い、取得画像を画像メモリ102bに取り込む(S201)。続いて、帳票角検出部102cにて、画像メモリ102bを参照して、画像上の帳票角を4点検出する(S202)。続いて、フォーマット読込部102eにて、当該帳票の種別に対応するフォーマット(登録画像の帳票角座標と文字領域座標)を読取り(S203)。続いて、文字領域補正部102fの文字領域位置補正部102f2にて、登録画像の帳票角座標・文字領域座標、読取画像の帳票角座標から、帳票角座標の左上端座標により、文字領域を補正する(S204)。続いて、文字認識部102gにて、文字を認識し(S205)、WS103のCRTに文字認識結果を表示する(S206)。なお、文字認識結果とともに、当該文字領域を切り出したイメージを確認イメージとして表示し、文字認識結果の確認に用いることが良く行われている。
(B) Reading time FIG. 11B is a flowchart at the time of reading in the optical character recognition system using the non-contact scanner. First, the image acquisition unit 101b reads a read form placed on the mat unit 101a, and captures the acquired image into the image memory 102b (S201). Subsequently, the form angle detection unit 102c refers to the image memory 102b to detect four form angles on the image (S202). Subsequently, the format reading unit 102e reads the format corresponding to the type of the form (form corner coordinates and character area coordinates of the registered image) (S203). Subsequently, the character area correction unit 102f2 of the character area correction unit 102f corrects the character area from the form angle coordinates / character area coordinates of the registered image and the form angle coordinates of the read image by the upper left corner coordinates of the form angle coordinates. (S204). Subsequently, the character recognition unit 102g recognizes the character (S205), and displays the character recognition result on the CRT of the WS 103 (S206). An image obtained by cutting out the character area is displayed as a confirmation image together with the character recognition result, and is often used for confirmation of the character recognition result.

なお、当該帳票の種別の特定は、当該帳票画像から抽出した識別情報と前記フォーマットに登録されている識別情報とを比較し、一致するフォーマットを選択することによって行う。識別情報としては、シートIDや罫線特徴情報等が用いられる。
沖テクニカルレビュー2002年1月/第189号Vol.69 No.1「カラーダイレクトスキャナ」
The type of the form is specified by comparing the identification information extracted from the form image with the identification information registered in the format and selecting a matching format. As the identification information, a sheet ID, ruled line feature information, or the like is used.
Oki Technical Review January 2002 / No. 189 Vol.69 No.1 “Color Direct Scanner”

非接触型スキャナは前記のとおり、マット部に置かれた帳票を上方からカメラによって撮影することにより画像取得する構造である為、マットから帳票が浮き上がった状態で画像取得した場合に、帳票自体は歪んでいなくとも、画像上で帳票の歪みが生じる。   As described above, the non-contact scanner has a structure in which an image is acquired by photographing a form placed on the mat portion with a camera from above, so when the image is acquired with the form raised from the mat, the form itself is Even if it is not distorted, the form is distorted on the image.

図12(b)は、帳票の左上角が浮き上がった状態で画像取得した場合の帳票の歪みを、強調して表現したものである。このような場合、帳票の文字領域の基準となる角の部分が左上方に伸びたようにずれてしまっているために、文字認識を行った際、文字領域を図のように左上方に誤って補正してしまう。帳票上のすべての文字領域位置はひとつの帳票の角を基準点として位置が定まるため、他の文字領域についても一様にずれてしまう。このため、文字認識結果が誤読になったり、空白になったり、文字領域から実際の記入文字が外れることにより桁落ちしたりする等の影響が帳票全体で生じることになる。そのような場合、文字領域の確認イメージもまたずれて切り出されるので、修正がしづらいばかりでなく、桁落ちにも気づきづらいことになる。例えば、図12(b)の右下部分の文字領域は、基準となる角がずれたために、実際の記入位置から完全に外れてしまっている。このような場合には、実際には記入があるにもかかわらず空白とみなされてしまうことが生じる。このような場合、金融取引上の事故が発生する可能性がある。   FIG. 12B expresses the form distortion when the image is acquired with the upper left corner of the form raised. In such a case, since the corner of the character area of the form is shifted so that it extends to the upper left, when character recognition is performed, the character area is erroneously moved to the upper left as shown in the figure. Will correct. Since all character area positions on the form are determined with reference to the corner of one form, the other character areas are also shifted uniformly. For this reason, the entire form has an influence such as misreading of the character recognition result, blanking, or dropping of digits due to an actual entry character being out of the character area. In such a case, the confirmation image of the character area is also cut out in a shifted manner, so that it is not only difficult to correct, but also difficult to notice digit loss. For example, the character area in the lower right part of FIG. 12B is completely deviated from the actual entry position because the reference corner is shifted. In such a case, it may be regarded as blank even though there is actually an entry. In such cases, financial transaction accidents may occur.

従って、このような状態の帳票画像が取得された場合には、画像を無効とし、帳票の浮き上がり等を修正させたうえで、オペレータに再度帳票画像を取得させる必要がある。   Therefore, when a form image in such a state is acquired, it is necessary to invalidate the image, correct the floating of the form, and cause the operator to acquire the form image again.

このような課題を解決するために、本発明の帳票歪み判定装置は以下の構成を備える。
<構成1>
帳票の画像を取得して、当該画像上の帳票部分の外形の歪みを判定する帳票歪み判定装置であって、
前記帳票部分の辺を分割した辺分割点を求める辺分割部と、
各対向する辺の辺分割点を所定の対応条件によって結び、各線分の交点における線分同士の角度とを歪み特徴として抽出する歪み特徴抽出部と、
標準状態における前記歪み特徴を基準歪み特徴として予め記憶しておく歪み特徴記憶部と、
前記基準歪み特徴と、前記抽出した帳票部分の歪み特徴とを比較することにより前記帳票部分の歪みを判定する歪み判定部とを備えた。
<構成2>
前記帳票部分の角を検出する角検出部を備え、
前記辺分割部は、前記検出した角を結ぶ線をそれぞれ分割した点を求め、求めた点を前記帳票部分の辺に対応させることによって辺を分割する。
<構成3>
前記辺分割部は、前記分割を所定数で等分に分割する。
<構成4>
前記辺分割部は、角に近い部分の前記分割の間隔を短くする。
<構成5>
前記歪み特徴にさらに前記辺分割点を結んだ各線分の長さを加え、
前記歪み特徴記憶部には帳票の種別ごとの前記歪み特徴を帳票の種別ごとの識別情報に関連付けて予め記憶し、
前記判定部は、前記画像上の帳票の識別情報を元に歪み特徴記憶部から歪み特徴を取得し、前記抽出した歪み特徴と比較することによって歪み判定をおこなう。
<構成6>
上記の帳票歪み判定装置歪み判定装置を備えた、帳票画像取得装置。
<構成7>
上記の帳票歪み判定装置歪み判定装置を備えた、金融営業店端末。
In order to solve such a problem, the form distortion determination apparatus of the present invention has the following configuration.
<Configuration 1>
A form distortion determination apparatus that acquires an image of a form and determines the distortion of the outer shape of the form portion on the image,
An edge dividing unit for obtaining an edge dividing point obtained by dividing an edge of the form part;
A distortion feature extraction unit that connects the side dividing points of the opposing sides according to a predetermined correspondence condition, and extracts the angle between the line segments at the intersection of each line segment as a distortion feature;
A distortion feature storage unit that previously stores the distortion feature in the standard state as a reference distortion feature;
A distortion determination unit that determines distortion of the form part by comparing the reference distortion characteristic with the extracted distortion characteristic of the form part;
<Configuration 2>
A corner detection unit for detecting a corner of the form part;
The side dividing unit obtains points obtained by dividing the lines connecting the detected corners, and divides the sides by associating the obtained points with the sides of the form part.
<Configuration 3>
The side dividing unit divides the division equally into a predetermined number.
<Configuration 4>
The side dividing portion shortens the interval of the division in a portion close to a corner.
<Configuration 5>
Add the length of each line segment connecting the side division points to the distortion feature,
The distortion feature storage unit stores in advance the distortion feature for each type of form in association with identification information for each type of form,
The determination unit obtains a distortion feature from a distortion feature storage unit based on the identification information of the form on the image, and performs distortion determination by comparing with the extracted distortion feature.
<Configuration 6>
A form image acquisition apparatus comprising the form distortion determination apparatus described above.
<Configuration 7>
A financial sales office terminal comprising the above-described form distortion determination apparatus distortion determination apparatus.

取得した画像上の帳票の外形情報から帳票歪み特徴を測定し、登録されている特徴と比較することにより、帳票の歪みを検出することができる。   The distortion of the form can be detected by measuring the form distortion feature from the outline information of the form on the acquired image and comparing it with the registered feature.

本発明の実施例について、以下のとおり説明する。   Examples of the present invention will be described as follows.

<実施例1の構成>
本システムの概観を図2に示す。
本システムは、非接触スキャナ装置201、光学式文字認識装置202、WS203から構成され、WS203はキーボード等の入力手段とCRT等の表示手段を備える。 以下、従来のシステムと同じ部分については、説明を省略する。
<Configuration of Example 1>
An overview of this system is shown in FIG.
This system includes a non-contact scanner device 201, an optical character recognition device 202, and a WS 203. The WS 203 includes an input unit such as a keyboard and a display unit such as a CRT. Hereinafter, description of the same parts as those of the conventional system will be omitted.

<非接触スキャナ装置の構成>
非接触スキャナ装置201の構成は、従来のシステムと同様である。
<Configuration of non-contact scanner device>
The configuration of the non-contact scanner device 201 is the same as that of the conventional system.

<光学式文字認識装置の構成>
光学式文字認識装置202の内部構成は、図1に示すように、制御部202a、画像メモリ202b、帳票角検出部202c、フォーマット作成部202d、フォーマット読取部202e、文字領域補正部202f、文字認識部202g、辺分割部202h、帳票歪み特徴抽出部202i、帳票歪み判定部202j、から構成される。
<Configuration of optical character recognition device>
As shown in FIG. 1, the internal configuration of the optical character recognition device 202 includes a control unit 202a, an image memory 202b, a form angle detection unit 202c, a format creation unit 202d, a format reading unit 202e, a character area correction unit 202f, a character recognition. A section 202g, a side division section 202h, a form distortion feature extraction section 202i, and a form distortion determination section 202j.

制御部202a、画像メモリ202b、帳票角検出部202c、文字領域補正部202f、文字認識部202g、は従来と同じものであるので説明を省略する。   Since the control unit 202a, the image memory 202b, the form angle detection unit 202c, the character area correction unit 202f, and the character recognition unit 202g are the same as those in the related art, description thereof is omitted.

フォーマット作成部202dは、従来のシステムの構成に対して、さらに歪み判定の基準となる基準歪み特徴情報を登録するための歪み特徴登録部202d4を備えている。フォーマット作成部202dについては、後述する。   The format creation unit 202d further includes a distortion feature registration unit 202d4 for registering reference distortion feature information serving as a criterion for distortion determination with respect to the configuration of the conventional system. The format creation unit 202d will be described later.

フォーマット読取部202eは、従来のシステムと同様にフォーマット記憶部の内容を読取る機能を提供する処理部であるが、本実施例に置いては、さらにフォーマット記憶部に登録されている規準歪み特徴を読み取り、出力する機能を持つ。   The format reading unit 202e is a processing unit that provides a function of reading the contents of the format storage unit as in the conventional system. In this embodiment, the standard distortion feature registered in the format storage unit is further added. Has the function to read and output.

帳票歪み判定部202jは、フォーマット読取部202eを用いてフォーマット記憶部から基準歪み特徴情報を取得し、帳票歪み特徴抽出部202iによって抽出される歪み特徴情報と比較することにより、帳票の歪みを判定する機能を提供する。   The form distortion determination unit 202j uses the format reading unit 202e to acquire the reference distortion feature information from the format storage unit, and compares the distortion characteristic information extracted by the form distortion feature extraction unit 202i to determine the distortion of the form. Provide the function to do.

辺分割部202hは、帳票部分の各辺を所定の条件で分割し歪み特徴を抽出する基準となる辺分割点を求める機能を提供する。辺分割部202hについては、後述する。   The side dividing unit 202h provides a function for obtaining a side dividing point that is a reference for extracting each distortion feature by dividing each side of the form part under a predetermined condition. The side dividing unit 202h will be described later.

帳票歪み特徴抽出部202iは、画像から帳票の歪み特徴を抽出する機能を提供する。帳票歪み特徴抽出部202iについては、後述する。   The form distortion feature extraction unit 202i provides a function of extracting a form distortion feature from an image. The form distortion feature extraction unit 202i will be described later.

<歪み特徴情報>
ここで、本実施例における歪み特徴情報について説明する。
図5(a)は、歪み情報の基準となる帳票画像の帳票部分について歪み特徴を抽出した様子である。なお、図12(a)(b)と比べ網点の濃度が異なっているが、文字を見やすくためであり、濃度の違いに特に意味はない。
<Distortion feature information>
Here, the distortion feature information in the present embodiment will be described.
FIG. 5A shows a state in which distortion features are extracted from a form portion of a form image that is a basis for distortion information. Note that the density of the halftone dots is different from that in FIGS. 12 (a) and 12 (b), but this is for easy viewing of the characters, and the difference in density has no particular meaning.

図5(a)において、各記号は以下の意味を持つ。
Te:帳票部分の上辺の横幅
Be:帳票部分の下辺の横幅
Le:帳票部分の左辺の縦幅
Re:帳票部分の右辺の縦幅
n:上辺および下辺の分割数
m:左辺および右辺の分割数
Vex (x=1,2…n):上辺および下辺の対向する辺分割点を結んだ線分
Hey (y=1,2…m):左辺および右辺の対向する辺分割点を結んだ線分
θeyx(y=1,2…m)(x=1,2…n):VexおよびHeyの交点の角度
なお、それぞれの抽出方法は、後述する。
In FIG. 5A, each symbol has the following meaning.
Te: Width of the upper side of the form part Be: Width of the lower side of the form part Le: Vertical width of the left side of the form part Re: Vertical width of the right side of the form part n: Number of divisions of the upper side and lower side m: Number of divisions of the left side and right side Vex (x = 1, 2,... N): Line segment connecting the upper side and lower side opposing side division points Hey (y = 1, 2,... M): Line segment connecting the left side and right side opposing side division points θeyx (y = 1, 2,... m) (x = 1, 2,... n): Angle of intersection of Vex and Hey Each extraction method will be described later.

本実施例では、1枚の基準帳票を用いて、θeyxを歪み特徴情報として抽出し、共通の基準歪み特徴情報としてフォーマット記憶部に記憶する。   In the present embodiment, θeyx is extracted as distortion feature information using one reference form, and is stored in the format storage unit as common reference distortion feature information.

図5(b)は、判定対象となるとなる帳票画像の帳票部分について図5(a)と同じ処理で歪み特徴を抽出した様子である。
図5(b)は、帳票の左角が浮き上がった状態で画像取得した場合の帳票の歪みを、強調して記載したものである。記号の意味は、eがrに変化しただけで、図5(a)と同じである。
FIG. 5B shows a state in which distortion features are extracted from the form portion of the form image to be determined by the same process as in FIG.
FIG. 5B emphasizes and describes the distortion of the form when an image is acquired with the left corner of the form raised. The meaning of the symbol is the same as that in FIG. 5A, only that e is changed to r.

<フォーマット作成部>
フォーマット作成部202eの内部構成は、図3に示すように、制御部202d1、フォーマット保存部202d2、文字領域座標設定部202d3、歪み特徴登録部202d4で構成される。また、他の処理部との図示しない通信処理部を有する。
<Format creation section>
As shown in FIG. 3, the internal configuration of the format creation unit 202e includes a control unit 202d1, a format storage unit 202d2, a character area coordinate setting unit 202d3, and a distortion feature registration unit 202d4. Moreover, it has a communication processing unit (not shown) with other processing units.

ここでは、従来システムに対して追加された、歪み特徴登録部202d4について説明する。   Here, the distortion feature registration unit 202d4 added to the conventional system will be described.

歪み特徴登録部202d4は、基準とする帳票の帳票画像の帳票部分について抽出された歪み特徴情報を、フォーマット記憶部に登録する機能を提供する。例えば、オペレータがWS103を介してフォーマット作成部に開始指示を行うことにより、歪み特徴情報の抽出からフォーマット記憶部への登録までの一連の処理が行われる。   The distortion feature registration unit 202d4 provides a function of registering, in the format storage unit, distortion feature information extracted for the form portion of the form image of the reference form. For example, when an operator gives a start instruction to the format creation unit via the WS 103, a series of processing from extraction of distortion feature information to registration in the format storage unit is performed.

なお、前記フォーマットは事前に登録されていれば良く、運用時には、事前にフォーマット記憶部に登録されたフォーマットが参照可能であれば足りる。従って、運用時にはフォーマット作成部202dは省略することが可能である。   The format only needs to be registered in advance, and it is sufficient that the format registered in the format storage unit in advance can be referred to during operation. Therefore, the format creation unit 202d can be omitted during operation.

<辺分割部>
辺分割部202hは、帳票部分の辺の分割を行う機能を提供する。
以下に、辺分割部202hにより、辺を分割する際の処理を説明する。
<Side division part>
The side dividing unit 202h provides a function of dividing the sides of the form part.
Hereinafter, processing when the side is divided by the side dividing unit 202h will be described.

まず、角検出部202cにより、従来システムと同様にして前記帳票部分の角が検出される。
辺分割部202hは、検出した角を結ぶ線分を求める。続いて、求めた線分をそれぞれ所定の数で等間隔に分割する。なお、この所定の数とは、図5(a)(b)におけるn、mであり、分割点の数は入力される帳票のサイズによらず一定になる。続いて、前記分割点より、例えば上辺および下辺であればY軸方向に(左辺および右辺であればx軸方向に)画素を走査して、背景色と帳票部分の濃度が変化する点を抽出することにより、前記線分の分割点に対応する各帳票辺の辺分割点を抽出することができる。
First, the corner of the form portion is detected by the corner detection unit 202c as in the conventional system.
The side dividing unit 202h obtains a line segment connecting the detected corners. Subsequently, each of the obtained line segments is divided into equal intervals by a predetermined number. The predetermined numbers are n and m in FIGS. 5A and 5B, and the number of division points is constant regardless of the size of the input form. Subsequently, for example, if the upper side and the lower side are scanned, the pixel is scanned in the Y-axis direction (if the left side and the right side are the x-axis direction), and the points where the background color and the density of the form portion change are extracted. By doing so, it is possible to extract the edge dividing points of the respective document edges corresponding to the dividing points of the line segments.

<帳票歪み特徴抽出部>
帳票歪み特徴抽出部202iは、辺分割部202hによって得られた辺分割点について、図のように対向するもの同士を結んだ線分を求める。これらの線分は、図5(a)(b)におけるVex、Hey、Vrx、Hryのようになる。続いて、各交点の角度θeyxを求め、特徴として出力する。
<Form distortion feature extraction unit>
The form distortion feature extraction unit 202i obtains a line segment that connects the opposing points as shown in the drawing with respect to the side division points obtained by the side division unit 202h. These line segments are like Vex, Hey, Vrx, and Hry in FIGS. Subsequently, the angle θeyx of each intersection is obtained and output as a feature.

<実施例1の動作>
(a)登録時
図4(a)は、非接触スキャナを用いた光学式文字認識システムにおける前記基準歪み特徴情報の登録時のフローチャートである。まず、画像取得部201bにて、マット部201a上に置かれた基準となる登録帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S301)。ここで、基準帳票の画像は、歪みの無い状態で取得する必要があるため、浮き上がりや折れ曲がりが無い状態で置く必要がある。これを標準状態または基準状態と呼ぶ。
<Operation of Example 1>
(A) At Registration FIG. 4A is a flowchart at the time of registration of the reference distortion feature information in the optical character recognition system using a non-contact scanner. First, the image acquisition unit 201b reads a reference registered form placed on the mat unit 201a, and takes the acquired image into the image memory 202b (S301). Here, since it is necessary to acquire the image of the reference form in a state without distortion, it is necessary to place the image in a state in which there is no lifting or bending. This is called a standard state or a reference state.

続いて、帳票角検出部202cにて、帳票画像上の帳票角を4点検出する(S302)。   Subsequently, the form angle detecting unit 202c detects four form angles on the form image (S302).

続いて、辺分割部202hにより、帳票部分の辺を分割し、辺分割点を求める(S303)。   Subsequently, the side dividing unit 202h divides the sides of the form portion to obtain side dividing points (S303).

続いて、帳票特徴抽出部202iにて、基準帳票画像の歪み特徴情報を抽出する(S304)。   Subsequently, the form feature extraction unit 202i extracts distortion feature information of the reference form image (S304).

続いて、歪み特徴登録部202d4にて、抽出した歪み特徴情報を基準歪み特徴情報としてフォーマット記憶部に登録する。(S305)。   Subsequently, the distortion feature registration unit 202d4 registers the extracted distortion feature information in the format storage unit as reference distortion feature information. (S305).

なお、標準状態で取得した基準歪み特徴情報に含まれる角度は、すべてほぼ90度となると考えられるので、上記のように標準状態での歪み特徴を取得せずにすべての角度を90度とする歪み特徴情報を生成して登録することも可能である。ただし、上記のように標準状態での歪み特徴を取得して実際に歪み特徴情報を抽出すれば、カメラのレンズ等の特性により標準状態でも歪みが発生する場合の影響を排除することができるので、精度を向上させることができる。   Note that all the angles included in the reference distortion feature information acquired in the standard state are considered to be approximately 90 degrees, so that all the angles are set to 90 degrees without acquiring the distortion characteristics in the standard state as described above. It is also possible to generate and register distortion feature information. However, if the distortion feature information in the standard state is acquired and the distortion feature information is actually extracted as described above, it is possible to eliminate the effects of distortion occurring in the standard state due to the characteristics of the camera lens and the like. , Accuracy can be improved.

(b)読取時
図4(b)は、非接触スキャナを用いた光学式文字認識システムにおける読取時のフローチャートである。まず、画像取得部201bにて、マット部201a上に置かれた読取帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S401)。
(B) Reading time FIG. 4B is a flowchart at the time of reading in the optical character recognition system using a non-contact scanner. First, the image acquisition unit 201b reads a read form placed on the mat unit 201a, and takes the acquired image into the image memory 202b (S401).

続いて、帳票角検出部202cにて、画像メモリ202bを参照して、画像上の帳票角を4点検出する(S402)。   Subsequently, the form angle detection unit 202c refers to the image memory 202b and detects four form angles on the image (S402).

続いて、辺分割部202hにより、帳票部分の辺を分割し、辺分割点を求める(S403)。   Subsequently, the side dividing unit 202h divides the sides of the form portion and obtains side dividing points (S403).

続いて、帳票歪み特徴抽出部202iにて、画像の帳票部分の帳票歪み特徴を抽出する(S404)。   Subsequently, the form distortion feature extraction unit 202i extracts the form distortion feature of the form part of the image (S404).

続いて、フォーマット読み取り部202eは、フォーマット記憶部から基準歪み特徴情報を取得する(S405)。   Subsequently, the format reading unit 202e acquires reference distortion feature information from the format storage unit (S405).

続いて、帳票歪み判定部202jにて、下記に示す帳票歪み評価値を計算し、あらかじめ設定されているそれぞれの閾値(θTHr)と比較して(S406)、1つでも閾値を超えるものがあれば、帳票が歪んでいると判断し(S407)、WS203のCRTに帳票リジェクトと表示する(S408)。   Subsequently, the form distortion evaluation unit 202j calculates the form distortion evaluation value shown below, and compares it with each preset threshold value (θTHr) (S406). For example, it is determined that the form is distorted (S407), and a form reject is displayed on the CRT of the WS 203 (S408).

[帳票歪み評価値]
θyx = | θeyx - θryx | (y=1,2…m)(x=1,2…n)
[帳票歪み評価値の閾値]
θyxの閾値: θTHr
帳票リジェクトした場合には、当該取引はいったん取り消された後、オペレータは帳票の浮き上がりを確認し、必要に応じて帳票の反りを修正する等して再度マット部201aに帳票を置き、前述の処理を再度行う。
[Form distortion evaluation value]
θyx = | θeyx−θryx | (y = 1, 2,... m) (x = 1, 2,... n)
[Threshold of form distortion evaluation value]
The threshold value of θyx: θTHr
When the form is rejected, the transaction is once canceled, the operator confirms the lift of the form, corrects the warp of the form if necessary, and puts the form on the mat part 201a again, and the above processing Again.

閾値を超えるものが1つも無ければ、帳票が歪んでいないと判断し(S407)、文字領域補正部202fの文字領域位置補正部202f2にて、登録画像の帳票角座標・文字領域座標、読取画像の帳票角座標から、帳票角座標の左上端座標により、文字領域を補正する(S409)。   If there is no object exceeding the threshold, it is determined that the form is not distorted (S407), and the character area position correcting unit 202f2 of the character area correcting unit 202f determines the form angle coordinates / character area coordinates of the registered image, and the read image. The character area is corrected from the form corner coordinates by the upper left corner coordinates of the form corner coordinates (S409).

続いて、文字認識部202gにて、文字を認識し(S410)、WS203のCRTに文字認識結果を表示する(S411)。   Subsequently, the character recognition unit 202g recognizes the character (S410), and displays the character recognition result on the CRT of the WS 203 (S411).

このように、基準帳票画像の各辺を所定の値で分割して辺分割点を求め、それぞれを結ぶ線分の交点の角度を基準歪み特徴とし、歪判定の際には、判定対象となる帳票画像の各辺を基準帳票と同様に分割し、同じくそれぞれを結ぶ線分の交点の角度を歪み特徴とし、前記基準歪み特徴と比較することによって、帳票の画像上の歪みが判定できるので、オペレータに対して警告ができ、文字領域のずれによる金融取引の事故の発生を防止し、オペレータにとっても確認の負荷が減少するという、効果を得ることができる。   In this way, each side of the reference form image is divided by a predetermined value to obtain a side division point, and the angle of the intersection of the line segments connecting the respective sides is set as a reference distortion feature, which is a determination target when determining distortion. Since each side of the form image is divided in the same way as the reference form, and the angle of the intersection of the line segments connecting the same is also used as the distortion feature, by comparing with the reference distortion feature, distortion on the form image can be determined. The operator can be warned, the occurrence of a financial transaction accident due to the deviation of the character area can be prevented, and the confirmation load for the operator can be reduced.

また、帳票が浮き上がっておかれた場合等に画像の歪みを検出して警告し帳票の置きなおしを行わせるので、オペレータは帳票のマット部201aへの設置の仕方に問題があった場合、即座に知ることができ、学習により以後設置の仕方が改善されるという効果を見込むことができる。   In addition, when the form is lifted up, the image distortion is detected and a warning is issued and the form is repositioned, so that the operator can immediately detect if there is a problem with the way the form is placed on the mat part 201a. It can be expected that the installation will be improved after learning.

また、前記辺分割点同士を結んだ線分の交点の角度のみを特徴とすることにより、非判定帳票が基準帳票と異なるサイズであっても同じ数の交点を得ることができるので、基準歪特徴データは共通のものを使用できるので、登録は1回のみでよく、新規な帳票を含めて画像の歪みの判定を行うことができる。   In addition, since only the angle of the intersection of the line segments connecting the side division points is characterized, the same number of intersections can be obtained even if the non-decision form is different in size from the reference form. Since common feature data can be used, registration is required only once, and image distortion including new forms can be determined.

実施例1においては、対応する辺分割点同士を結んだ線分の交点の角度のみを歪み特徴とするとしたが、本実施例においては、前記線分の長さについても歪み特徴情報として用いる。このため、基準歪み特徴は帳票の種別毎に異なるものとなるので、基準歪み特徴情報は各帳票のフォーマット毎に登録されることになる。   In the first embodiment, only the angle of the intersection of the line segments connecting the corresponding edge division points is used as the distortion feature. However, in this embodiment, the length of the line segment is also used as the distortion feature information. For this reason, since the reference distortion feature differs for each form type, the reference distortion feature information is registered for each format of each form.

<実施例2の構成>
本実施零におけるシステムの構成は、実施例1と同じく図2で示される。以下、実施例1と異なる部分についてのみ説明する。
<Configuration of Example 2>
The system configuration in the present embodiment zero is shown in FIG. Only the parts different from the first embodiment will be described below.

<光学式文字認識装置の構成>
光学式文字認識装置202の内部構成は、実施例1と同じく図1に示される。
制御部202a、画像メモリ202b、帳票角検出部202c、文字領域補正部202f、文字認識部202g、は従来と同じものであるので説明を省略する。
<Configuration of optical character recognition device>
The internal configuration of the optical character recognition device 202 is shown in FIG.
Since the control unit 202a, the image memory 202b, the form angle detection unit 202c, the character area correction unit 202f, and the character recognition unit 202g are the same as those in the related art, description thereof will be omitted.

フォーマット読取部202eは、本実施例においては、基準歪み特徴を、フォーマット毎に取得する機能を有する。   In the present embodiment, the format reading unit 202e has a function of acquiring the reference distortion feature for each format.

帳票歪み特徴抽出部202iは、画像から帳票の歪み特徴を抽出する機能を提供するのは実施例1と同様であるが、各辺分割点を結ぶ線分の交点の角度に加えて、前記線分の長さについても、特徴情報として抽出する。帳票歪み特徴抽出部202iについては、後述する。   The form distortion feature extraction unit 202i provides a function of extracting a form distortion characteristic from an image in the same manner as in the first embodiment, but in addition to the angle of the intersection of the line segments connecting the side division points, The length of the minutes is also extracted as feature information. The form distortion feature extraction unit 202i will be described later.

<歪み特徴情報>
ここで、本実施例における歪み特徴情報について説明する。
図5(a)は、歪み情報の基準となる帳票画像の帳票部分について歪み特徴を抽出した様子である。各記号の意味は実施例1と同様である。
<Distortion feature information>
Here, the distortion feature information in the present embodiment will be described.
FIG. 5A shows a state in which distortion features are extracted from a form portion of a form image that is a basis for distortion information. The meaning of each symbol is the same as in the first embodiment.

本実施例では、1枚の基準帳票を用いて、Vex、Hey、θeyxを歪み特徴情報として抽出し、共通の基準歪み特徴情報としてフォーマットに記憶する。ここで基準歪み特徴は、実施例1と異なり、基準帳票は、フォーマットに登録されている帳票の種別毎に登録する必要がある。
図5(b)は、実施例1と同様であるので、説明を省略する。
In this embodiment, using a single reference form, Vex, Hey, and θeyx are extracted as distortion feature information and stored in the format as common reference distortion feature information. Here, unlike the first embodiment, the reference distortion feature needs to be registered for each type of form registered in the format.
Since FIG. 5B is the same as that of the first embodiment, description thereof is omitted.

<フォーマット作成部>
フォーマット作成部202eの内部構成は、実施例1と同じく図3に示される。
歪み特徴登録部202d4は、基準歪み特徴を各帳票のフォーマットに関連づけてフォーマット記憶部に格納する。このため、基準歪み特徴情報は、各帳票ごとの文字情報の登録とともに行うと効率が良い。
<Format creation section>
The internal configuration of the format creation unit 202e is shown in FIG.
The distortion feature registration unit 202d4 stores the reference distortion feature in the format storage unit in association with the format of each form. For this reason, it is efficient to perform the reference distortion feature information together with the registration of the character information for each form.

<帳票歪み特徴抽出部>
帳票歪み特徴抽出部202iは、辺分割部202hによって得られた辺分割点について、対向するもの同士を結んだ線分を求める。これらの線分は、図5(a)(b)におけるVex、Hey、Vrx、Hryのようになる。続いて、各交点の角度θeyxを求め、前記各線分の長さとともに、特徴として出力する。
<Form distortion feature extraction unit>
The form distortion feature extraction unit 202i obtains a line segment that connects opposite sides of the side division points obtained by the side division unit 202h. These line segments are like Vex, Hey, Vrx, and Hry in FIGS. Subsequently, an angle θeyx of each intersection is obtained and output as a feature together with the length of each line segment.

<実施例2の動作>
(a)登録時
本実施例における動作は、実施例1と同じく図4(a)にて説明される。S301〜S304については、実施例1と同様なので説明を省略する。
<Operation of Example 2>
(A) At the time of registration The operation in this embodiment is described with reference to FIG. About S301-S304, since it is the same as that of Example 1, description is abbreviate | omitted.

S305では、歪み特徴登録部202d4にて、抽出した歪み特徴情報を基準歪み特徴情報として当該帳票のフォーマットに関連付けて登録する。   In S305, the distortion feature registration unit 202d4 registers the extracted distortion feature information as reference distortion feature information in association with the format of the form.

(b)読取時
本実施例における動作は、実施例1と同じく図4(b)にて説明される。S405、S406以外については、実施例1と同様なので説明を省略する。
(B) Reading The operation in the present embodiment is described with reference to FIG. Since steps other than S405 and S406 are the same as those in the first embodiment, description thereof is omitted.

S405では、フォーマット読み取り部202eは、フォーマット記憶部から帳票画像の帳票の種別に対応する基準歪み特徴情報を取得する(405)。帳票の種別の特定には、既存の方法が適用されるが、例えば当該帳票のシートIDや罫線特徴等の特徴情報をフォーマットとともに登録しておき、特徴が一致するフォーマットを選択するようにしてもよい。または、WSのオペレータに対して帳票の種別の指定手段を提供し、指定された情報により帳票の種別を特定することにしても良い。   In step S405, the format reading unit 202e acquires reference distortion feature information corresponding to the form type of the form image from the format storage unit (405). An existing method is applied to specify the type of form. For example, feature information such as sheet ID and ruled line feature of the form is registered together with the format, and a format that matches the feature is selected. Good. Alternatively, a form type designation means may be provided to the WS operator, and the form type may be specified based on the designated information.

S406では、帳票歪み判定部202jは下記に示す式にて帳票歪み評価値を計算する。
[帳票歪み評価値]
Vx = |Vex − Vrx| (x=1,2…n)
Hy = |Hey − Hry| (y=1,2 …m)
θyx = | θeyx - θryx | (y=1,2 …m)(x=1,2 …n)
[帳票歪み評価値の閾値]
Hxの閾値: VTHr
Hyの閾値: HTHr
θyxの閾値: θTHr
あらかじめ設定されているそれぞれの閾値(VTHr、HTHr、θTHr)と比較して(S406)、1つでも閾値を超えるものがあれば実施例1と同様に、帳票が歪んでいると判断し(S407)、WS203のCRTに帳票リジェクトと表示する(S408)
In S406, the form distortion determination unit 202j calculates a form distortion evaluation value using the following formula.
[Form distortion evaluation value]
Vx = | Vex−Vrx | (x = 1, 2,... N)
Hy = | Hey−Hry | (y = 1, 2... M)
θyx = | θeyx−θryx | (y = 1, 2... m) (x = 1, 2... n)
[Threshold of form distortion evaluation value]
Hx threshold: VTHr
Hy threshold: HTHr
The threshold value of θyx: θTHr
Compared to the preset threshold values (VTHr, HTHr, θTHr) (S406), if any one exceeds the threshold value, it is determined that the form is distorted as in the first embodiment (S407). ), Form reject is displayed on the CRT of the WS 203 (S408)

このように、基準帳票画像の各辺を所定の値で分割して辺分割点を求め、それぞれを結ぶ線分の交点の角度と各線分の長さとを基準歪み特徴として各帳票毎に登録し、歪み判定の際には、判定対象となる帳票画像の各辺を基準帳票と同様に分割し、同じくそれぞれを結ぶ線分の交点の角度と線分の長さを歪み特徴とし、前記基準歪み特徴と比較することによって、帳票の画像上の歪みが判定できるので、実施例1に対してさらに精度よく歪みの判定を行うことができる。   In this way, each side of the reference form image is divided by a predetermined value to obtain a side division point, and the angle of the intersection of the line segment connecting the respective sides and the length of each line segment are registered for each form as a reference distortion feature. When determining distortion, each side of the form image to be determined is divided in the same manner as the reference form, and the angle of the intersection of the line segments connecting the respective lines and the length of the line segment are also distortion characteristics. Since the distortion on the image of the form can be determined by comparing with the feature, the distortion can be determined with higher accuracy than the first embodiment.

なお、上述の実施例に置いて、角を結ぶ線分を等分するとしたが、帳票の浮き上がり等による歪みは帳票の角に近い部分ほど大きくなることから、帳票の角に近い部分の分割間隔を短くし、中央すなわち角から遠い部分の分割間隔を長くすることにより、辺分割点の密度を挙げるとさらに精度良く帳票部分の歪みを検出することができる。例えば、図5(a)(b)におけるn、mに対応する分割間隔を三角関数を用いて変換することにより、角に近い部分の分割間隔を短くすることが可能である。例えば、辺の中央を起点=0とし辺の角部を終点=π/2[rad]とすれば、辺を等分した点を正弦関数によって角に近くなるほど短い間隔となるように写像できる。例えば、中央から角までを3分割する場合、中央から1/3の地点は、sin((π/2)x(1/3))=sin(π/6)=0.5により、中央から角までの半分の地点に写像される。中央から2/3の地点は、sin((π/2)x(2/3))=sin(π/3)=約0.87により、中央から角までの約0.87倍の地点に写像される。   In the above-described embodiment, the line connecting the corners is equally divided. However, since the distortion due to the lift of the form is closer to the corner of the form, the division interval of the part near the corner of the form is larger. By shortening and increasing the division interval of the center, that is, the part far from the corner, the distortion of the form part can be detected with higher accuracy when the density of the side division points is given. For example, by dividing the division intervals corresponding to n and m in FIGS. 5A and 5B using a trigonometric function, it is possible to shorten the division interval near the corner. For example, if the center of the side is set as the starting point = 0 and the corner of the side is set as the end point = π / 2 [rad], the points obtained by equally dividing the side can be mapped with a sine function so that the intervals become shorter as the angle becomes closer. For example, when the center to the corner is divided into three, the point 1/3 from the center is sin ((π / 2) × (1/3)) = sin (π / 6) = 0.5, so Maps to half the point to the corner. The point 2/3 from the center is approximately 0.87 times from the center to the corner by sin ((π / 2) x (2/3)) = sin (π / 3) = about 0.87. Mapped.

なお、実施例1において、基準歪み特徴情報は共通なものを1回登録すればよい、としたが、実施例2のような方法によって帳票ごとに基準歪み特徴情報を登録しても構わない。例えば、カメラのレンズ等の特性により帳票のサイズによって歪み方に差異が生じるような場合には、帳票ごとに基準歪み特徴情報を登録すれば、さらに精度を上げることができる。   In the first embodiment, the common reference distortion feature information may be registered once. However, the reference distortion feature information may be registered for each form by the method as in the second embodiment. For example, when there is a difference in distortion depending on the size of the form due to the characteristics of the camera lens or the like, the accuracy can be further improved by registering the reference distortion feature information for each form.

なお、上記の実施例において、文字認識装置にて上記の歪み判別を行うものとして説明したが、本発明の目的は帳票の歪みの検出であるため、文字認識自体は別途行うものであってもよい。従って、光学式文字認識装置202の構成のうち文字領域補正部202f、文字認識部202gの機能は、例えばWS203に持たせる等して機能を分割することができる。この場合、光学式文字認識装置202は帳票画像の歪み検出装置として機能する。   In the above embodiment, the character recognition device has been described as performing the above distortion determination. However, since the object of the present invention is to detect the distortion of the form, the character recognition itself may be performed separately. Good. Accordingly, the functions of the character area correction unit 202f and the character recognition unit 202g in the configuration of the optical character recognition device 202 can be divided by, for example, providing the WS 203 with the functions. In this case, the optical character recognition device 202 functions as a form image distortion detection device.

また、そのような歪み検出装置とスキャナ装置201を組み合わせることにより、帳票画像の歪み検出機能を備えた画像取得装置として機能させることもできる。
また、そのような歪み検出装置とWS203を組み合わせることにより、帳票画像の歪み検出機能を備えた端末装置として機能させることもできる。特に、WS203が金融営業店窓口端末である場合には、帳票画像の歪み検出機能を備えた金融営業店窓口端末として機能させることができる。
Further, by combining such a distortion detection apparatus and the scanner apparatus 201, it is possible to function as an image acquisition apparatus having a form image distortion detection function.
Further, by combining such a distortion detection device and WS 203, it is possible to function as a terminal device having a form image distortion detection function. In particular, when WS 203 is a financial sales office window terminal, it can function as a financial sales office window terminal having a form image distortion detection function.

本発明の光学式文字認識装置の機能ブロックFunctional block of optical character recognition device of the present invention 本発明のシステム構成System configuration of the present invention 本発明のフォーマット作成部の機能ブロックFunctional block of format creation unit of the present invention 本発明のフローチャートFlow chart of the present invention 帳票の歪み特徴の説明Explanation of distortion characteristics of forms 従来のシステム構成Conventional system configuration 従来のスキャナの機能ブロックFunctional block of conventional scanner 従来の光学式文字認識装置の機能ブロックFunctional block of conventional optical character recognition device 従来のフォーマット作成部の機能ブロックFunctional block of conventional format creation unit 従来の文字領域補正部の機能ブロックFunctional block of conventional character area correction unit 従来のフローチャートConventional flowchart 帳票歪み時の取得画像と領域補正結果Acquired image and area correction result at the time of form distortion

符号の説明Explanation of symbols

201 スキャナ装置
201a マット部
201b 画像取得部
202 光学式文字認識装置
203 WS
202a 制御部
202b 画像メモリ
202c 帳票角検出部
202d フォーマット作成部
202e フォーマット読取部
202f 文字領域補正部
202g 文字認識部
202h 辺分割部
202i 帳票歪み特徴抽出部
202j 帳票歪み判定部
201 Scanner Device 201a Matte Unit 201b Image Acquisition Unit 202 Optical Character Recognition Device 203 WS
202a Control section 202b Image memory 202c Form angle detection section 202d Format creation section 202e Format reading section 202f Character area correction section 202g Character recognition section 202h Side division section 202i Form distortion feature extraction section 202j Form distortion determination section

Claims (8)

帳票の画像を取得して、当該画像上の帳票部分の外形の歪みを判定する帳票歪み判定装置であって、
前記帳票部分の辺を分割した辺分割点を求める辺分割部と、
各対向する辺の辺分割点を所定の対応条件によって結び、各線分の交点における線分同士の角度を歪み特徴として抽出する歪み特徴抽出部と、
標準状態における前記歪み特徴を基準歪み特徴として予め記憶しておく歪み特徴記憶部と、
前記基準歪み特徴と、前記抽出した帳票部分の歪み特徴とを比較することにより前記帳票部分の歪みを判定する歪み判定部とを備えた、
帳票歪み判定装置。
A form distortion determination apparatus that acquires an image of a form and determines the distortion of the outer shape of the form portion on the image,
An edge dividing unit for obtaining an edge dividing point obtained by dividing an edge of the form part;
A distortion feature extraction unit that connects the side division points of the opposing sides according to a predetermined correspondence condition, and extracts the angle between the line segments at the intersection of each line segment as a distortion feature;
A distortion feature storage unit that previously stores the distortion feature in the standard state as a reference distortion feature;
A distortion determination unit that determines distortion of the form part by comparing the reference distortion characteristic and the distortion characteristic of the extracted form part;
Form distortion judgment device.
前記帳票部分の角を検出する角検出部を備え、
前記辺分割部は、前記検出した角を結ぶ線をそれぞれ分割した点を求め、求めた点を前記帳票部分の辺に対応させることによって辺を分割する、請求項1に記載の帳票歪み判定装置。
A corner detection unit for detecting a corner of the form part;
The form distortion determination device according to claim 1, wherein the side dividing unit obtains points obtained by dividing the lines connecting the detected corners, and divides the sides by associating the obtained points with the sides of the form part. .
前記辺分割部は、前記分割を所定数で等分に分割する、請求項2に記載の帳票歪み判定装置。   The form distortion determination apparatus according to claim 2, wherein the side dividing unit divides the division into a predetermined number of equal parts. 前記辺分割部は、角に近い部分の前記分割の間隔を短くする、請求項2に記載の帳票歪み判定装置。   The form distortion determination device according to claim 2, wherein the side dividing unit shortens an interval of the division in a portion near a corner. 前記分割の間隔は、等分割した場合の分割点の位置を三角関数によって写像して決定する、請求項4に記載の帳票歪み判定装置。   The form distortion determination apparatus according to claim 4, wherein the division interval is determined by mapping a position of a division point when equally divided by a trigonometric function. 前記歪み特徴にさらに前記辺分割点を結んだ各線分の長さを加え、
前記歪み特徴記憶部には帳票の種別ごとの前記歪み特徴を帳票の種別ごとの識別情報に関連付けて予め記憶し、
前記判定部は、前記画像上の帳票の識別情報を元に歪み特徴記憶部から歪み特徴を取得し、前記抽出した歪み特徴と比較することによって歪み判定をおこなう、請求項1から5のいずれかに記載の帳票歪み判定装置。
Add the length of each line segment connecting the side division points to the distortion feature,
The distortion feature storage unit stores in advance the distortion feature for each type of form in association with identification information for each type of form,
6. The determination unit according to claim 1, wherein the determination unit acquires a distortion feature from a distortion feature storage unit based on identification information of the form on the image, and performs distortion determination by comparing with the extracted distortion feature. The form distortion determination device described in 1.
請求項1から6のいずれかに記載の帳票歪み判定装置歪み判定装置を備えた、帳票画像取得装置。   A form image determination apparatus comprising the form distortion determination apparatus according to claim 1. 請求項1から6のいずれかに記載の帳票歪み判定装置歪み判定装置を備えた、金融営業店端末。   A financial sales office terminal comprising the form distortion determination apparatus distortion determination apparatus according to claim 1.
JP2005042129A 2005-02-18 2005-02-18 Distortion determination device for business form Pending JP2006229685A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005042129A JP2006229685A (en) 2005-02-18 2005-02-18 Distortion determination device for business form

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005042129A JP2006229685A (en) 2005-02-18 2005-02-18 Distortion determination device for business form

Publications (1)

Publication Number Publication Date
JP2006229685A true JP2006229685A (en) 2006-08-31

Family

ID=36990617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005042129A Pending JP2006229685A (en) 2005-02-18 2005-02-18 Distortion determination device for business form

Country Status (1)

Country Link
JP (1) JP2006229685A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010134559A (en) * 2008-12-02 2010-06-17 Pfu Ltd Image processing apparatus and image processing method
JP2016091114A (en) * 2014-10-30 2016-05-23 富士通フロンテック株式会社 Document read program, document read method, and information processing apparatus
WO2018101000A1 (en) * 2016-11-30 2018-06-07 富士通株式会社 Reader , read program and read method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010134559A (en) * 2008-12-02 2010-06-17 Pfu Ltd Image processing apparatus and image processing method
US8554012B2 (en) 2008-12-02 2013-10-08 Pfu Limited Image processing apparatus and image processing method for correcting distortion in photographed image
JP2016091114A (en) * 2014-10-30 2016-05-23 富士通フロンテック株式会社 Document read program, document read method, and information processing apparatus
WO2018101000A1 (en) * 2016-11-30 2018-06-07 富士通株式会社 Reader , read program and read method

Similar Documents

Publication Publication Date Title
KR101292925B1 (en) Object of image capturing, computer readable media for storing image processing program and image processing method
US10068150B2 (en) Method and apparatus for OCR detection of valuable documents by means of a matrix camera
JP5387193B2 (en) Image processing system, image processing apparatus, and program
US11004194B2 (en) Inspection device, image forming apparatus, and inspection method
JP4574503B2 (en) Image processing apparatus, image processing method, and program
CN104143094A (en) Test paper automatic test paper marking processing method and system without answer sheet
US20120243785A1 (en) Method of detection document alteration by comparing characters using shape features of characters
CN102360419A (en) Method and system for computer scanning reading management
JP6426815B2 (en) Image processing apparatus and image processing method
JP4419269B2 (en) Two-dimensional code extraction method
US11881043B2 (en) Image processing system, image processing method, and program
US7612918B2 (en) Image processing apparatus
TWI725465B (en) Image processing system, image processing method and program product
JP2006229685A (en) Distortion determination device for business form
US11436733B2 (en) Image processing apparatus, image processing method and storage medium
US10645256B2 (en) Image forming apparatus and non-transitory computer-readable storage medium suitable for extracting areas in images specified by handwritten marker by line marker such as highlighter pen or the like, and electronic marker by digital pen
US11055551B2 (en) Correction support device and correction support program for optical character recognition result
JP3582988B2 (en) Non-contact image reader
JP4167680B2 (en) Document reading apparatus and document reading method
US20230061533A1 (en) Inspection apparatus capable of reducing inspection workload, method of controlling inspection apparatus, and storage medium
JP6540597B2 (en) INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM
JP2007079966A (en) Character recognition device
JP5844698B2 (en) Character recognition device
CN102682308A (en) Imaging processing method and device
JP2007140703A (en) Method for reading insurance policy, system thereof, and insurance policy recognition system

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060923

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061013