JP2007079966A - Character recognition device - Google Patents

Character recognition device Download PDF

Info

Publication number
JP2007079966A
JP2007079966A JP2005267273A JP2005267273A JP2007079966A JP 2007079966 A JP2007079966 A JP 2007079966A JP 2005267273 A JP2005267273 A JP 2005267273A JP 2005267273 A JP2005267273 A JP 2005267273A JP 2007079966 A JP2007079966 A JP 2007079966A
Authority
JP
Japan
Prior art keywords
distortion
character recognition
unit
image
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005267273A
Other languages
Japanese (ja)
Inventor
Tomoya Igi
智也 井木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2005267273A priority Critical patent/JP2007079966A/en
Publication of JP2007079966A publication Critical patent/JP2007079966A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To perform character recognition about a portion having small distortion of a business form when acquiring an image in a state that the business form floats from a mat. <P>SOLUTION: This character recognition device acquiring the image of the business form, and performing the character recognition according to the distortion of an outer shape of a business form portion on the image has: a distortion characteristic extraction part extracting a distortion characteristic of the outer shape of the business form portion; a business form distortion characteristic DB wherein a distortion pattern is classified according to largeness of the distortion in each the portion of the business form; a distortion identification part selecting the corresponding distortion pattern on the basis of the distortion characteristic of the extracted business form portion; and a character recognition part performing the character recognition according to the selected distortion pattern. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、帳票をマットにセットし、上部からセンサ部でイメージを読み取る非接触スキャナ装置を用いた帳票画像の歪みを判別して文字認識を行う文字認識装置に関するものである。   The present invention relates to a character recognition apparatus that performs character recognition by determining distortion of a form image using a non-contact scanner device that sets a form on a mat and reads an image from the top with a sensor unit.

現在、金融営業店の窓口業務等にて、顧客が持ち込んだ帳票や本人確認書類等の種々の用紙の画像を取得するための、非接触型スキャナが用いられている。非接触型スキャナは、帳票を置くマット部の上方に設置されたカメラによって、帳票の画像を取得する形式のスキャナである。金融営業店の窓口業務においては、非接触型スキャナは、金融営業店窓口の窓口端末に接続され、画像取得の制御が行われる。非接触型スキャナは、フラットベッド型スキャナやシートフィード型スキャナに比べ、画像取得のための操作が簡便で所要時間が短い等の特徴を持っている。(例えば非特許文献1)
窓口にて取得された帳票の画像に対しては、光学的文字認識装置によって所定の文字認識処理が行われ、記入内容がデータ化され、金融取引に利用される。
以下に本発明の従来技術について説明する。
Currently, non-contact scanners for acquiring images of various papers such as forms and identification documents brought in by customers are used in the counter business of financial sales offices. The non-contact type scanner is a type of scanner that acquires an image of a form by a camera installed above a mat portion on which the form is placed. In the counter business of a financial sales office, the non-contact type scanner is connected to the counter terminal of the financial sales office counter, and image acquisition control is performed. The non-contact type scanner has features such as a simpler operation for image acquisition and a shorter time required than a flat bed type scanner or a sheet feed type scanner. (For example, Non-Patent Document 1)
The form image acquired at the window is subjected to predetermined character recognition processing by an optical character recognition device, and the contents of entry are converted into data and used for financial transactions.
The prior art of the present invention will be described below.

<従来のシステム構成>
従来のシステムの概観を図6に示す。
従来のシステムは、非接触スキャナ装置101、光学式文字認識装置102、WS103から構成され、WS103はキーボード等の入力手段とCRT等の表示手段を備える。
図6において、非接触スキャナ装置101は上から見た図を示している。非接触スキャナ装置101、光学式文字認識装置102、については後述する。
WS103はシステム全体を制御するための端末であり、図示しないメモリやCRT等の表示部やキーボードマウス等の操作部を備えた、一般的なPC等が使用される。
なお、ここでは光学式文字認識装置102はハードウェアによって実現するものとして説明するが、WS103内に設けたソフトウェアであってもよい。
<Conventional system configuration>
An overview of a conventional system is shown in FIG.
The conventional system includes a non-contact scanner device 101, an optical character recognition device 102, and a WS 103. The WS 103 includes input means such as a keyboard and display means such as a CRT.
In FIG. 6, the non-contact scanner device 101 is viewed from above. The non-contact scanner device 101 and the optical character recognition device 102 will be described later.
The WS 103 is a terminal for controlling the entire system, and a general PC or the like having a display unit such as a memory and a CRT (not shown) and an operation unit such as a keyboard mouse is used.
Here, the optical character recognition apparatus 102 is described as being realized by hardware, but may be software provided in the WS 103.

<非接触スキャナ装置の構成>
非接触スキャナ装置101の構成は、図7に示すように、制御部101c、マット部101a、画像取得部101bから構成される。
制御部101cは、非接触スキャナ装置101全体の制御手段、光学式文字認識装置102との通信手段を有する。
マット部101aは、画像を取得する帳票を設置するための置き台である。マット部101aは図6においては網掛けで表現しているが、黒色等、画像上で帳票と容易に区別ができる色の材質が用いられる。これにより、取得した帳票画像はマット部が背景となるため、黒い背景色に対し、帳票が浮き上がって見えるような状態となる。このため、容易に帳票の辺を検出することが可能となる。
画像取得部101bは、マット部101a上の帳票を撮影し画像データに変換する機能を有する、CCDやC−MOS等を利用したカメラである。
<Configuration of non-contact scanner device>
As shown in FIG. 7, the non-contact scanner device 101 includes a control unit 101c, a mat unit 101a, and an image acquisition unit 101b.
The control unit 101 c includes a control unit for the entire non-contact scanner device 101 and a communication unit with the optical character recognition device 102.
The mat unit 101a is a table for installing a form for acquiring an image. The mat portion 101a is represented by shading in FIG. 6, but a material of a color such as black that can be easily distinguished from the form on the image is used. As a result, the acquired form image has a mat portion as a background, so that the form appears to rise against the black background color. For this reason, it is possible to easily detect the sides of the form.
The image acquisition unit 101b is a camera using a CCD, a C-MOS, or the like that has a function of photographing a form on the mat unit 101a and converting it into image data.

<光学式文字認識装置の構成>
光学式文字認識装置は、取得した帳票の画像から、帳票の種類を特定し、さらに当該帳票の文字認識すべき領域を特定し、文字認識を行う。
光学式文字認識装置102の構成は、図8に示すように、制御部102a、画像メモリ102b、帳票角検出部102c、フォーマット作成部102d、フォーマット読取部102e、文字領域補正部102f、文字認識部102gから構成される。また非接触スキャナ装置101およびWS103との図示しない通信手段を有する。
<Configuration of optical character recognition device>
The optical character recognition device identifies the type of form from the acquired form image, further identifies the area of the form to be recognized, and performs character recognition.
As shown in FIG. 8, the configuration of the optical character recognition device 102 includes a control unit 102a, an image memory 102b, a form angle detection unit 102c, a format creation unit 102d, a format reading unit 102e, a character area correction unit 102f, and a character recognition unit. 102g. In addition, communication means (not shown) with the non-contact scanner device 101 and the WS 103 is included.

光学式文字認識装置102の制御部102aは、光学文字認識装置102全体の制御を行う。
画像メモリ102bは、帳票画像データを保持する手段を有する。各処理部は、適宜画像メモリ102bを参照することにより、帳票画像を参照することができる。
帳票角検出部102cは、画像から帳票角を検出する手段を有する。帳票の角の検出は、例えば画像を走査して、画素の濃度の違いにより背景と帳票部分との境目すなわち帳票辺を検出する。得られた帳票辺となる画素を追跡して、XまたはY座標の変化量の正負が反転するか、変化が開始される場所を角と判断することができる。または、各帳票辺から任意に複数の点を選択し、ハフ変換等既知の技術を用いることにより各帳票辺ごとに直線または曲線に近似し、それらの交点を角として選択することもできる。
フォーマット作成部102dは、文字領域座標等の文字認識に必要なフォーマットを作成する手段を有する。フォーマット作成部102dについては後述する。
フォーマット読取部102eは、他の処理部に対してフォーマットの内容を読取る機能を提供する。
文字領域補正部102fは、フォーマットから文字領域座標を補正する手段を有する。文字領域補正部102fについては後述する。
文字認識部102gは、図示しない文字認識辞書とのパターンマッチングにより、文字を認識する機能を提供する。
The control unit 102 a of the optical character recognition device 102 controls the entire optical character recognition device 102.
The image memory 102b has means for holding the form image data. Each processing unit can refer to the form image by appropriately referring to the image memory 102b.
The form angle detection unit 102c has means for detecting a form angle from the image. The corner of the form is detected by, for example, scanning an image and detecting the boundary between the background and the form part, that is, the form side based on the difference in pixel density. By tracking the obtained pixels as the sides of the form, it is possible to determine whether the change of the X or Y coordinate is reversed or the place where the change starts is a corner. Alternatively, a plurality of points can be arbitrarily selected from each form side, and a known technique such as Hough transform can be used to approximate each form side to a straight line or a curve, and the intersection point can be selected as a corner.
The format creation unit 102d has means for creating a format necessary for character recognition such as character region coordinates. The format creation unit 102d will be described later.
The format reading unit 102e provides a function for reading the contents of the format to other processing units.
The character area correction unit 102f has means for correcting the character area coordinates from the format. The character area correction unit 102f will be described later.
The character recognition unit 102g provides a function of recognizing characters by pattern matching with a character recognition dictionary (not shown).

<フォーマット作成部>
フォーマット作成部102dの構成は、図9に示すように、制御部102d1、フォーマット保存部102d2、文字領域座標設定部102d3で構成される。また、他の処理部との図示しない通信処理部を有する。
<Format creation section>
As shown in FIG. 9, the format creation unit 102d includes a control unit 102d1, a format storage unit 102d2, and a character area coordinate setting unit 102d3. Moreover, it has a communication processing unit (not shown) with other processing units.

フォーマット作成部の制御部102d1は、フォーマット作成部102d全体の制御を行う。
フォーマット保存部102d2は、文字領域座標等の文字認識に必要なフォーマットを図示しないフォーマット記憶部に保存する機能を提供する。なお、以下フォーマットの取得は、フォーマット記憶部から行うものとする。
前記フォーマットには、各帳票の識別情報とともに、各文字領域ごとに帳票の基準となる角(例えば左上)からの相対座標が格納されている。文字認識部は、この情報を元に、帳票画像上の文字領域を特定し、記入されている文字を認識する。
文字領域座標設定部102d3は、フォーマット作成するオペレータの入力操作を受けて、上記の座標の他、文字認識に使用する辞書の種類等、必要な情報をフォーマットとして登録する。ここでは、オペレータはWS103を介してフォーマット作成部にデータを入力するものとする。
The control unit 102d1 of the format creation unit controls the entire format creation unit 102d.
The format storage unit 102d2 provides a function of storing a format necessary for character recognition such as character region coordinates in a format storage unit (not shown). Hereinafter, the format is acquired from the format storage unit.
The format stores relative coordinates from the corner (for example, upper left), which is the basis of the form, for each character area, along with the identification information of each form. Based on this information, the character recognition unit identifies the character area on the form image and recognizes the entered character.
The character area coordinate setting unit 102d3 receives the input operation of the operator who creates the format, and registers necessary information such as the type of dictionary used for character recognition in addition to the above coordinates as the format. Here, it is assumed that the operator inputs data to the format creation unit via the WS 103.

<文字領域補正部>
文字領域補正部102fの構成は、図10に示すように、制御部102f1、文字領域位置補正部102f2で構成される。また、他の処理部との図示しない通信処理部を有する。
文字領域補正部102fの制御部102f1は、文字領域補正部102f全体の制御を行う。
<Character area correction unit>
As shown in FIG. 10, the configuration of the character region correction unit 102f includes a control unit 102f1 and a character region position correction unit 102f2. Moreover, it has a communication processing unit (not shown) with other processing units.
The control unit 102f1 of the character area correction unit 102f controls the entire character area correction unit 102f.

文字領域位置補正部102f2は、左上の角の座標から文字領域を補正する。なお、ここでは左上としたが、前記相対座標の基準となる角を左上としているためであり、例えば右上等、他のすべての角を基準とすることが可能である。   The character region position correction unit 102f2 corrects the character region from the coordinates of the upper left corner. Note that although the upper left corner is used here, the reference angle of the relative coordinate is the upper left corner. For example, all other corners such as the upper right corner can be used as a reference.

<動作>
(a)フォーマット登録時
図11(a)は、非接触スキャナを用いた光学式文字認識システムにおける登録時のフローチャートである。まず、画像取得部101bにて、マット部101a上に置かれた登録帳票の読取りを行い、取得画像を画像メモリ102bに取り込む(S101)。続いて、帳票角検出部102cにて、画像メモリ102bを参照して、画像上の帳票角を4点検出する(S102)。続いて、文字領域座標設定部102d3にて、画像メモリ102bを参照して、WS103のCRTに画像を表示し、オペレータは、文字領域を設定する(S103)。続いて、フォーマット保存部102d2にて、別途指定したシートID等の各帳票の識別情報とともに帳票角座標と文字領域座標をフォーマットに保存する(S104)。
<Operation>
(A) Format Registration FIG. 11A is a flowchart at the time of registration in an optical character recognition system using a non-contact scanner. First, the image acquisition unit 101b reads a registered form placed on the mat unit 101a, and captures the acquired image into the image memory 102b (S101). Subsequently, the form angle detection unit 102c refers to the image memory 102b to detect four form angles on the image (S102). Subsequently, the character area coordinate setting unit 102d3 refers to the image memory 102b to display an image on the CRT of the WS 103, and the operator sets the character area (S103). Subsequently, the format storage unit 102d2 stores the form corner coordinates and the character area coordinates in the format together with the identification information of each form such as a sheet ID specified separately (S104).

(b)読取時
図11(b)は、非接触スキャナを用いた光学式文字認識システムにおける読取時のフローチャートである。まず、画像取得部101bにて、マット部101a上に置かれた読取帳票の読取りを行い、取得画像を画像メモリ102bに取り込む(S201)。続いて、帳票角検出部102cにて、画像メモリ102bを参照して、画像上の帳票角を4点検出する(S202)。続いて、フォーマット読込部102eにて、当該帳票の種別に対応するフォーマット(登録画像の帳票角座標と文字領域座標)を読取り(S203)。続いて、文字領域補正部102fの文字領域位置補正部102f2にて、登録画像の帳票角座標・文字領域座標、読取画像の帳票角座標から、帳票角座標の左上端座標により、文字領域を補正する(S204)。続いて、文字認識部102gにて、文字を認識し(S205)、WS103のCRTに文字認識結果を表示する(S206)。なお、文字認識結果とともに、当該文字領域を切り出したイメージを確認イメージとして表示し、文字認識結果の確認に用いることが良く行われている。
(B) Reading time FIG. 11B is a flowchart at the time of reading in the optical character recognition system using the non-contact scanner. First, the image acquisition unit 101b reads a read form placed on the mat unit 101a, and captures the acquired image into the image memory 102b (S201). Subsequently, the form angle detecting unit 102c refers to the image memory 102b to detect four form angles on the image (S202). Subsequently, the format reading unit 102e reads the format corresponding to the type of the form (form corner coordinates and character area coordinates of the registered image) (S203). Subsequently, the character area correction unit 102f2 of the character area correction unit 102f corrects the character area from the form angle coordinates / character area coordinates of the registered image and the form angle coordinates of the read image by the upper left corner coordinates of the form angle coordinates. (S204). Subsequently, the character recognition unit 102g recognizes the character (S205), and displays the character recognition result on the CRT of the WS 103 (S206). An image obtained by cutting out the character area is displayed as a confirmation image together with the character recognition result, and is often used for confirmation of the character recognition result.

なお、当該帳票の種別の特定は、当該帳票画像から抽出した識別情報と前記フォーマットに登録されている識別情報とを比較し、一致するフォーマットを選択することによって行う。識別情報としては、シートIDや罫線特徴情報等が用いられる。
沖テクニカルレビュー2002年1月/第189号Vol.69 No.1「カラーダイレクトスキャナ」
The type of the form is specified by comparing the identification information extracted from the form image with the identification information registered in the format and selecting a matching format. As the identification information, a sheet ID, ruled line feature information, or the like is used.
Oki Technical Review January 2002 / No. 189 Vol. 69 No. 1 “Color Direct Scanner”

非接触型スキャナは前記のとおり、マット部に置かれた帳票を上方からカメラによって撮影することにより画像取得する構造である為、マットから帳票が浮き上がった状態で画像取得した場合に、帳票自体は歪んでいなくとも、画像上で帳票の歪みが生じる。   As described above, the non-contact scanner has a structure in which an image is acquired by photographing a form placed on the mat portion with a camera from above, so when the image is acquired with the form raised from the mat, the form itself is Even if it is not distorted, the form is distorted on the image.

図12(b)は、帳票の左上角が浮き上がった状態で画像取得した場合の帳票の歪みを、強調して表現したものである。このような場合、帳票の文字領域の基準となる角の部分が左上方に伸びたようにずれてしまっているために、文字認識を行った際、文字領域を図のように左上方に誤って補正してしまう。帳票上のすべての文字領域位置はひとつの帳票の角を基準点として位置が定まるため、他の文字領域についても一様にずれてしまう。このため、文字認識結果が誤読になったり、空白になったり、文字領域から実際の記入文字が外れることにより桁落ちしたりする等の影響が帳票全体で生じることになる。そのような場合、文字領域の確認イメージもまたずれて切り出されるので、修正がしづらいばかりでなく、桁落ちにも気づきづらいことになる。例えば、図12(b)の右下部分の文字領域は、基準となる角がずれたために、実際の記入位置から完全に外れてしまっている。このような場合には、実際には記入があるにもかかわらず空白とみなされてしまうことが生じる。このような場合、金融取引上の事故が発生する可能性がある。
このため、単純にはそのような歪みを検出した場合には当該帳票をリジェクトして歪みの原因を取り除かせて、再度同様な操作を行わせるようにすれば安全である。
FIG. 12B expresses the form distortion when the image is acquired with the upper left corner of the form raised. In such a case, since the corner of the character area of the form is shifted so that it extends to the upper left, when character recognition is performed, the character area is erroneously moved to the upper left as shown in the figure. Will correct. Since all character area positions on the form are determined with reference to the corner of one form, the other character areas are also shifted uniformly. For this reason, the entire form has an influence such as misreading of the character recognition result, blanking, or dropping of digits due to an actual entry character being out of the character area. In such a case, the confirmation image of the character area is also cut out in a shifted manner, so that it is not only difficult to correct, but also difficult to notice digit loss. For example, the character area in the lower right part of FIG. 12B is completely deviated from the actual entry position because the reference corner is shifted. In such a case, it may be regarded as blank even though there is actually an entry. In such cases, financial transaction accidents may occur.
For this reason, when such distortion is detected, it is safe to reject the cause of the form to remove the cause of the distortion and perform the same operation again.

ところで、図12(b)の右下部分は実際にはほとんど歪んでおらず、左上部分の歪みによって文字領域がずれてしまうものである。このような場合は、左上以外の部分については、文字認識を行うようにすれば効率的である。たとえば、左上部分には記入者への説明書きが印刷等されており、それ以外の部分に文字認識の領域があるような場合は、左上部分は文字認識を行わない部分なのであるから、左上部分のゆがみによって再度同じ操作を要求されるのでは、作業の効率が悪い。
従って、このような状態の帳票画像が取得された場合には、帳票の歪みの少ない部分については、文字認識を行うようにするのが効率的である。
By the way, the lower right portion of FIG. 12B is actually hardly distorted, and the character region is shifted due to the distortion of the upper left portion. In such a case, it is efficient to perform character recognition for the portions other than the upper left. For example, if an explanatory note to the writer is printed in the upper left part and there is a character recognition area in other parts, the upper left part is a part that does not perform character recognition. If the same operation is requested again due to distortion, the work efficiency is poor.
Therefore, when a form image in such a state is acquired, it is efficient to perform character recognition on a part with less distortion of the form.

このような課題を解決するために、本発明の文字認識装置は以下の構成を備える。
<構成1>
帳票の画像を取得して、当該画像上の帳票部分の外形の歪みに応じて文字認識を行う文字認識装置であって、前記帳票部分の外形の歪み特徴を抽出する歪み特徴抽出部と、歪みパターンを帳票の部分ごとの歪みの大小に応じて分類した帳票歪み特徴DBと、前記抽出した帳票部分の歪み特徴を元に該当する歪みパターンを選択する歪み識別部と、選択された歪みパターンに応じて文字認識を行う文字認識部を備えた。
<構成2>
前記文字認識部は選択された歪みパターンにより歪みの小さな部分について文字認識を行う。
<構成3>
前記文字認識部は歪みのパターンにより文字領域座標補正方法を選択す。
<構成4>
前記帳票部分の辺を分割した辺分割点を求める辺分割部を備え、前記歪み特徴抽出部は、各対向する辺の辺分割点を所定の対応条件によって結び、各線分の交点における線分同士の角度を歪み特徴として抽出する。
<構成5>
前記帳票部分の角を検出する角検出部を備え、前記辺分割部は、前記検出した角を結ぶ線をそれぞれ分割した点を求め、求めた点を前記帳票部分の辺に対応させることによって辺を分割する。
<構成6>
前記辺分割部は、前記分割を所定数で等分に分割する。
<構成7>
前記辺分割部は、角に近い部分の前記分割の間隔を短くする。
<構成8>
前記分割の間隔は、等分割した場合の分割点の位置を三角関数によって写像して決定する。
<構成9>
前記帳票歪み特徴DBには帳票の種別ごとの歪みパターンを帳票の種別ごとの識別情報に関連付けて予め記憶し、前記歪み識別部は、前記抽出した歪み特徴を前記識別情報を元に帳票歪み特徴DBの歪みパターンと比較することによって前記歪みパターンを選択する。
<構成10>
上記の文字認識装置を備えた、金融営業店端末。
In order to solve such a problem, the character recognition device of the present invention has the following configuration.
<Configuration 1>
A character recognition device that acquires an image of a form and performs character recognition in accordance with the distortion of the outline of the form part on the image, a distortion feature extraction unit that extracts the distortion characteristic of the outline of the form part, and a distortion A form distortion feature DB that classifies patterns according to the size of distortion for each part of the form, a distortion identification unit that selects a corresponding distortion pattern based on the distortion characteristics of the extracted form part, and a selected distortion pattern A character recognition unit that performs character recognition accordingly is provided.
<Configuration 2>
The character recognition unit performs character recognition on a portion with a small distortion according to the selected distortion pattern.
<Configuration 3>
The character recognition unit selects a character region coordinate correction method according to a distortion pattern.
<Configuration 4>
An edge dividing unit that obtains an edge dividing point obtained by dividing an edge of the form part, and the distortion feature extracting unit connects the edge dividing points of the opposing sides according to a predetermined correspondence condition, and the line segments at the intersection of each line segment Are extracted as distortion features.
<Configuration 5>
A corner detection unit that detects a corner of the form part, wherein the side division unit obtains points obtained by dividing the lines connecting the detected corners, and associates the obtained points with the sides of the form part to obtain sides; Split.
<Configuration 6>
The side dividing unit divides the division equally into a predetermined number.
<Configuration 7>
The side dividing portion shortens the interval of the division in a portion close to a corner.
<Configuration 8>
The interval of the division is determined by mapping the position of the division point when equally divided by a trigonometric function.
<Configuration 9>
In the form distortion feature DB, a distortion pattern for each form type is stored in advance in association with identification information for each form type, and the distortion identifying unit stores the extracted distortion feature on the basis of the identification information. The distortion pattern is selected by comparing with the DB distortion pattern.
<Configuration 10>
A financial branch terminal equipped with the above character recognition device.

取得した画像上の帳票の外形情報から帳票歪み特徴を測定して、登録されているひずみパターンと比較することにより帳票の歪みのパターンを識別し、歪みの少ない部分について文字認識を行うことができる。   By measuring the form distortion characteristics from the outline information of the form on the acquired image and comparing it with the registered distortion pattern, you can identify the distortion pattern of the form and perform character recognition on the part with less distortion .

本発明の実施例について、以下のとおり説明する。   Examples of the present invention will be described as follows.

<実施例1の構成>
本システムの概観を図2に示す。
本システムは、非接触スキャナ装置201、光学式文字認識装置202、WS203から構成され、WS203はキーボード等の入力手段とCRT等の表示手段を備える。以下、従来のシステムと同じ部分については、説明を省略する。
<Configuration of Example 1>
An overview of this system is shown in FIG.
This system includes a non-contact scanner device 201, an optical character recognition device 202, and a WS 203. The WS 203 includes an input unit such as a keyboard and a display unit such as a CRT. Hereinafter, description of the same parts as those of the conventional system will be omitted.

<非接触スキャナ装置の構成>
非接触スキャナ装置201の構成は、従来のシステムと同様である。
<Configuration of non-contact scanner device>
The configuration of the non-contact scanner device 201 is the same as that of the conventional system.

<光学式文字認識装置の構成>
光学式文字認識装置202の内部構成は、図1に示すように、制御部202a、画像メモリ202b、帳票角検出部202c、フォーマット作成部202d、フォーマット読取部202e、文字領域補正部202f、文字認識部202g、辺分割部202h、帳票歪み特徴抽出部202i、帳票歪み識別部202j、帳票歪み特徴DB作成部202k、帳票歪み特徴DB読取部202l、帳票歪み特徴DB202m、許容帳票歪み特徴DB202n、から構成される。
<Configuration of optical character recognition device>
As shown in FIG. 1, the internal configuration of the optical character recognition device 202 includes a control unit 202a, an image memory 202b, a form angle detection unit 202c, a format creation unit 202d, a format reading unit 202e, a character area correction unit 202f, a character recognition. 202g, side division unit 202h, form distortion feature extraction part 202i, form distortion identification part 202j, form distortion feature DB creation part 202k, form distortion feature DB reading part 202l, form distortion feature DB 202m, and allowable form distortion feature DB 202n. Is done.

制御部202a、画像メモリ202b、帳票角検出部202c、文字認識部202g、は従来と同じものであるので説明を省略する。   Since the control unit 202a, the image memory 202b, the form angle detection unit 202c, and the character recognition unit 202g are the same as those in the related art, description thereof will be omitted.

フォーマット作成部202dは、従来のシステムの構成に対して、さらに歪み判定の基準となる基準歪み特徴情報を登録するための歪み特徴登録部202d4を備えている。フォーマット作成部202dについては、後述する。   The format creation unit 202d further includes a distortion feature registration unit 202d4 for registering reference distortion feature information serving as a criterion for distortion determination with respect to the configuration of the conventional system. The format creation unit 202d will be described later.

フォーマット読取部202eは、従来のシステムと同様にフォーマット記憶部の内容を読取る機能を提供する処理部であるが、本実施例に置いては、さらにフォーマット記憶部に登録されている基準歪み特徴を読み取り、出力する機能を持つ。   The format reading unit 202e is a processing unit that provides a function of reading the contents of the format storage unit as in the conventional system, but in this embodiment, the reference distortion feature registered in the format storage unit is further added. Has the function to read and output.

文字領域補正部202fは、従来のシステムと異なる点は、帳票を左上、右上、右下、左下の4つの部分に分割し、それぞれの部分に含まれる文字領域を補正するための、左上端補正部、右上端補正部、右下端補正部、左下端補正部で構成される点である。
すなわち、左上端補正部は、左上の帳票端座標から文字領域を補正する手段を有する。右上端補正部は、右上の帳票端座標から文字領域を補正する手段を有する。右下端補正部は、右下の帳票端座標から文字領域を補正する手段を有する。左下端補正部は、左下の帳票端座標から文字領域を補正する手段を有する。
The character area correction unit 202f is different from the conventional system in that the form is divided into four parts, upper left, upper right, lower right, and lower left, and upper left corner correction for correcting the character area included in each part. , An upper right end correction unit, a right lower end correction unit, and a left lower end correction unit.
That is, the upper left end correction unit has means for correcting the character region from the upper left form end coordinate. The upper right edge correction unit includes means for correcting the character area from the upper right form edge coordinates. The lower right end correction unit has means for correcting the character area from the lower right form edge coordinates. The lower left end correction unit has means for correcting the character area from the lower left form edge coordinates.

帳票歪み識別部202jは、フォーマット読取部202eを用いてフォーマット記憶部から基準歪み特徴情報を取得し、帳票歪み特徴抽出部202iによって抽出される歪み特徴情報と比較することにより、帳票の歪みを判定し、後述の帳票歪み特徴DB202mを参照して想定する歪みパターンから該当するものを選択するとともに、後述の許容帳票歪み特徴DB202nを参照して、当該帳票において許容される歪みパターンかどうかを判定する機能を提供する。   The form distortion identification unit 202j uses the format reading unit 202e to acquire reference distortion feature information from the format storage unit, and compares the distortion characteristic information extracted by the form distortion feature extraction unit 202i to determine distortion of the form. Then, a corresponding distortion pattern is selected with reference to a later-described form distortion feature DB 202m, and whether or not the distortion pattern is allowable in the form is determined with reference to an allowable form distortion feature DB 202n described later. Provide functionality.

辺分割部202hは、帳票部分の各辺を所定の条件で分割し歪み特徴を抽出する基準となる辺分割点を求める機能を提供する。辺分割部202hについては、後述する。   The side dividing unit 202h provides a function for obtaining a side dividing point that is a reference for extracting each distortion feature by dividing each side of the form part under a predetermined condition. The side dividing unit 202h will be described later.

帳票歪み特徴抽出部202iは、画像から帳票の歪み特徴を抽出する機能を提供する。帳票歪み特徴抽出部202iについては、後述する。   The form distortion feature extraction unit 202i provides a function of extracting a form distortion feature from an image. The form distortion feature extraction unit 202i will be described later.

<歪み特徴情報>
ここで、本実施例における歪み特徴情報について説明する。
図5(a)は、歪み情報の基準となる帳票画像の帳票部分について歪み特徴を抽出した様子である。なお、図12(a)(b)と比べ網点の濃度が異なっているが、文字を見やすくためであり、濃度の違いに特に意味はない。
<Distortion feature information>
Here, the distortion feature information in the present embodiment will be described.
FIG. 5A shows a state in which distortion features are extracted from a form portion of a form image that is a basis for distortion information. Note that the density of the halftone dots is different from that in FIGS. 12 (a) and 12 (b), but this is for easy viewing of the characters, and the difference in density has no particular meaning.

図5(a)において、各記号は以下の意味を持つ。
Te:帳票部分の上辺の横幅
Be:帳票部分の下辺の横幅
Le:帳票部分の左辺の縦幅
Re:帳票部分の右辺の縦幅
n:上辺および下辺の分割数
m:左辺および右辺の分割数
Vex (x=1,2…n):上辺および下辺の対向する辺分割点を結んだ線分
Hey (y=1,2…m):左辺および右辺の対向する辺分割点を結んだ線分
θeyx(y=1,2…m)(x=1,2…n):VexおよびHeyの交点の角度
なお、それぞれの抽出方法は、後述する。
In FIG. 5A, each symbol has the following meaning.
Te: Width of the upper side of the form part Be: Width of the lower side of the form part Le: Vertical width of the left side of the form part Re: Vertical width of the right side of the form part n: Number of divisions of the upper side and lower side m: Number of divisions of the left side and right side Vex (x = 1, 2,... N): Line segment connecting the upper side and lower side opposing side division points Hey (y = 1, 2,... M): Line segment connecting the left side and right side opposing side division points θeyx (y = 1, 2,... m) (x = 1, 2,... n): Angle of intersection of Vex and Hey Each extraction method will be described later.

本実施例では、1枚の基準帳票を用いて、θeyxを歪み特徴情報として抽出し、共通の基準歪み特徴情報としてフォーマット記憶部に記憶する。   In the present embodiment, θeyx is extracted as distortion feature information using one reference form, and is stored in the format storage unit as common reference distortion feature information.

図5(b)は、判定対象となるとなる帳票画像の帳票部分について図5(a)と同じ処理で歪み特徴を抽出した様子である。
図5(b)は、帳票の左角が浮き上がった状態で画像取得した場合の帳票の歪みを、強調して記載したものである。記号の意味は、eがrに変化しただけで、図5(a)と同じである。
FIG. 5B shows a state in which distortion features are extracted from the form portion of the form image to be determined by the same process as in FIG.
FIG. 5B emphasizes and describes the distortion of the form when an image is acquired with the left corner of the form raised. The meaning of the symbol is the same as that in FIG. 5A, only that e is changed to r.

<フォーマット作成部>
フォーマット作成部202eの内部構成は、図3に示すように、制御部202d1、フォーマット保存部202d2、文字領域座標設定部202d3、歪み特徴登録部202d4で構成される。また、他の処理部との図示しない通信処理部を有する。
<Format creation section>
As shown in FIG. 3, the internal configuration of the format creation unit 202e includes a control unit 202d1, a format storage unit 202d2, a character area coordinate setting unit 202d3, and a distortion feature registration unit 202d4. Moreover, it has a communication processing unit (not shown) with other processing units.

ここでは、従来システムに対して追加された、歪み特徴登録部202d4について説明する。   Here, the distortion feature registration unit 202d4 added to the conventional system will be described.

歪み特徴登録部202d4は、基準とする帳票の帳票画像の帳票部分について抽出された歪み特徴情報を、フォーマット記憶部に登録する機能を提供する。例えば、オペレータがWS103を介してフォーマット作成部に開始指示を行うことにより、歪み特徴情報の抽出からフォーマット記憶部への登録までの一連の処理が行われる。   The distortion feature registration unit 202d4 provides a function of registering, in the format storage unit, distortion feature information extracted for the form portion of the form image of the reference form. For example, when an operator gives a start instruction to the format creation unit via the WS 103, a series of processing from extraction of distortion feature information to registration in the format storage unit is performed.

なお、前記フォーマットは事前に登録されていれば良く、運用時には、事前にフォーマット記憶部に登録されたフォーマットが参照可能であれば足りる。従って、運用時にはフォーマット作成部202dは省略することが可能である。   The format only needs to be registered in advance, and it is sufficient that the format registered in the format storage unit can be referred to during operation. Therefore, the format creation unit 202d can be omitted during operation.

また、文字認識領域が左上、右上、左下、右下のどこにあるかの情報に従って、許容しうる歪みの発生領域を登録する。これは、文字認識領域の存在する位置によって自動的に行ってもよいし、オペレータに指定させてもよい。この情報は、図4のように許容帳票歪み特徴DB202nに登録される。   Also, an allowable distortion generation area is registered according to information on where the character recognition area is located in the upper left, upper right, lower left, and lower right. This may be performed automatically depending on the position where the character recognition area exists, or may be specified by an operator. This information is registered in the allowable form distortion feature DB 202n as shown in FIG.

<辺分割部>
辺分割部202hは、帳票部分の辺の分割を行う機能を提供する。
以下に、辺分割部202hにより、辺を分割する際の処理を説明する。
<Side division part>
The side dividing unit 202h provides a function of dividing the sides of the form part.
Hereinafter, processing when the side is divided by the side dividing unit 202h will be described.

まず、角検出部202cにより、従来システムと同様にして前記帳票部分の角が検出される。
辺分割部202hは、検出した角を結ぶ線分を求める。続いて、求めた線分をそれぞれ所定の数で等間隔に分割する。なお、この所定の数とは、図5(a)(b)におけるn、mであり、分割点の数は入力される帳票のサイズによらず一定になる。続いて、前記分割点より、例えば上辺および下辺であればY軸方向に(左辺および右辺であればx軸方向に)画素を走査して、背景色と帳票部分の濃度が変化する点を抽出することにより、前記線分の分割点に対応する各帳票辺の辺分割点を抽出することができる。
First, the corner of the form portion is detected by the corner detection unit 202c as in the conventional system.
The side dividing unit 202h obtains a line segment connecting the detected corners. Subsequently, each of the obtained line segments is divided into equal intervals by a predetermined number. The predetermined numbers are n and m in FIGS. 5A and 5B, and the number of division points is constant regardless of the size of the input form. Subsequently, for example, if the upper side and the lower side are scanned, the pixel is scanned in the Y-axis direction (if the left side and the right side are the x-axis direction), and the points where the background color and the density of the form portion change are extracted. By doing so, it is possible to extract the edge dividing points of the respective document edges corresponding to the dividing points of the line segments.

<帳票歪み特徴抽出部>
帳票歪み特徴抽出部202iは、辺分割部202hによって得られた辺分割点について、図のように対向するもの同士を結んだ線分を求める。これらの線分は、図5(a)(b)におけるVex、Hey、Vrx、Hryのようになる。続いて、各交点の角度θeyxを求め、特徴として出力する。
<Form distortion feature extraction unit>
The form distortion feature extraction unit 202i obtains a line segment that connects the opposing points as shown in the drawing with respect to the side division points obtained by the side division unit 202h. These line segments are like Vex, Hey, Vrx, and Hry in FIGS. Subsequently, the angle θeyx of each intersection is obtained and output as a feature.

なお、帳票歪みの有無の評価は、以下のようにして行う。例えば角度を評価する場合の式は以下のとおりである。
[帳票歪み評価値]
θyx = | θeyx _ θryx | (y=1,2…m)(x=1,2…n)
[帳票歪み評価値の閾値]
θyxの閾値: θTHr
Note that the presence / absence of form distortion is evaluated as follows. For example, the equation for evaluating the angle is as follows.
[Form distortion evaluation value]
θyx = | θeyx_θryx | (y = 1, 2... m) (x = 1, 2... n)
[Threshold of form distortion evaluation value]
The threshold value of θyx: θTHr

<帳票歪み特徴DB>
想定する歪みパターンの例を、図14に示す。網掛け部が歪みが発生している部分、すなわち所定の閾値を超過している部分であり、歪みが大きい部分である。網掛けがない部分が、歪みが発生していないか発生していても歪みが小さい部分、すなわち所定の閾値以下の部分である。
<Form distortion feature DB>
An example of the assumed distortion pattern is shown in FIG. The shaded portion is a portion where distortion occurs, that is, a portion where a predetermined threshold is exceeded, and a portion where distortion is large. A portion without shading is a portion where distortion is small or not generated, that is, a portion having a predetermined threshold value or less.

帳票歪み特徴DB202mは、図14に示した想定する歪みパターンに応じた帳票歪み特徴として、図13に示すように、各歪みパターンの名称、コード、歪みパターン条件を格納したものである。歪みパターン条件は、例えば、「左上角浮き上がり」の場合、前述のθeyxのうち、左上部分のみが閾値超過している場合が該当する。例えば、すべてのθeyxのうち、θe11〜θe33の9つの点についてのみ閾値超過している場合に、左上角浮き上がり(歪みパターンコード=A)であると判定できる。
また例えば、「左辺&右辺浮き上がり」の場合、前述のVexのうち、両端部分のみが他より長く、その割合が所定の閾値を超過している場合が該当する。例えば、すべてのVexの長さの平均と比べ、Ve1、Venの2本のみ閾値超過して長い場合に、「左辺&右辺浮き上がり」(歪みパターンコード=U)であると判定できる。
歪みパターン条件は、このように浮き上がり方と前述のVex、Hey、θeyxとの関係が記載されている。なお、実際には表中の文が論理式にて表現され記録されている。
The form distortion feature DB 202m stores, as shown in FIG. 13, the name, code, and distortion pattern condition of each distortion pattern as the form distortion feature corresponding to the assumed distortion pattern shown in FIG. For example, in the case of “lifting the upper left corner”, the distortion pattern condition corresponds to a case where only the upper left portion of the above-described θeyx exceeds the threshold. For example, when the threshold value is exceeded only for nine points θe11 to θe33 among all θeyx, it can be determined that the upper left corner is lifted (distortion pattern code = A).
Further, for example, in the case of “left side & right side floating”, only the both end portions of Vex described above are longer than the other, and the ratio exceeds a predetermined threshold value. For example, when only two of Ve1 and Ven exceed the average of the lengths of Vex and are longer than the threshold, it is possible to determine that “left side & right side floating” (distortion pattern code = U).
The distortion pattern condition describes the relationship between how to float and the above-described Vex, Hey, and θeyx. Actually, the sentences in the table are expressed and recorded as logical expressions.

また、左上端補正部、右上端補正部、右下端補正部、左下端補正部のいずれの補正部が使用可能か情報が含まれている。例えば、図13の場合は、「左上角浮き上がり」の場合は左上端補正部のみ使用不可であり、それ以外は使用可能となっている。また、「左辺&右辺浮き上がり」の場合は、すべての角において歪みが発生すると考えられるので、すべての補正部が使用不可となっている。
帳票ゆがみ特徴DBは、後述のようにして帳票歪み特徴DB作成部202kにより登録される。
In addition, information on which one of the upper left correction unit, the upper right correction unit, the lower right correction unit, and the lower left correction unit can be used is included. For example, in the case of FIG. 13, in the case of “lifting the upper left corner”, only the upper left end correction unit is unusable, and the rest is usable. Further, in the case of “left side & right side floating”, it is considered that distortion occurs at all corners, so that all the correction units cannot be used.
The form distortion feature DB is registered by the form distortion feature DB creation unit 202k as described later.

<許容帳票歪み特徴DB>
許容帳票歪み特徴DB202nは、処理対象としてフォーマットを登録している各帳票に対して、それぞれ許容する歪みパターンの歪みパターンコードを登録したテーブルである。図4の例では、帳票001(帳票ID=001)が許容する帳票歪みパターンがA(左上角浮き上がり)であることが分かる。例えば、左上部分には記入者への説明書きが印刷等されており、それ以外の部分に文字認識の領域があるような帳票の場合が相当する。
<Allowable form distortion feature DB>
The allowable form distortion feature DB 202n is a table in which distortion pattern codes of allowable distortion patterns are registered for each form whose format is registered as a processing target. In the example of FIG. 4, it can be seen that the form distortion pattern allowed by the form 001 (form ID = 001) is A (upper left corner). For example, a case in which an explanatory note for the writer is printed in the upper left part and a character recognition area exists in the other part corresponds to the case.

<帳票歪み特徴DB作成部>
帳票歪み特徴DB作成部202kは、前記帳票歪み特徴DBを202nを登録するための処理部である。具体的には、図14のような想定する帳票歪みパターンに相当する画像を故意に作成して読み込ませ、帳票歪みパターンごとの帳票歪み特徴を生成し、登録する。また、それぞれの帳票歪みパターンにおいて、歪みの発生度合いに応じて、左上端補正部、右上端補正部、右下端補正部、左下端補正部のいずれの補正部が使用可能かの情報が設定される。例えば、左上の領域について歪みが所定の閾値未満であれば、左上端補正部を使用可とする。それ以外の領域についても同様である。なお、すべての領域についてゆがみが所定の閾値以上であれば、すべての補正部が使用不可となる場合もありうる。
<Form distortion feature DB creation section>
The form distortion feature DB creation unit 202k is a processing unit for registering the form distortion feature DB 202n. Specifically, an image corresponding to an assumed form distortion pattern as shown in FIG. 14 is intentionally created and read, and a form distortion feature for each form distortion pattern is generated and registered. Also, in each form distortion pattern, information indicating which of the correction units of the upper left end correction unit, the upper right end correction unit, the lower right end correction unit, and the lower left end correction unit can be used is set according to the degree of occurrence of distortion. The For example, if the distortion in the upper left region is less than a predetermined threshold, the upper left correction unit can be used. The same applies to other regions. Note that if the distortion is greater than or equal to a predetermined threshold value for all regions, all the correction units may not be usable.

<実施例1の動作>
(a)フォーマット作成時
図15(a)は、非接触スキャナを用いた光学式文字認識システムにおける前記基準歪み特徴情報の登録時のフローチャートである。まず、画像取得部201bにて、マット部201a上に置かれた基準となる登録帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S301)。ここで、基準帳票の画像は、歪みの無い状態で取得する必要があるため、浮き上がりや折れ曲がりが無い状態で置く必要がある。これを標準状態または基準状態と呼ぶ。
<Operation of Example 1>
(A) Format Creation FIG. 15A is a flowchart at the time of registration of the reference distortion feature information in the optical character recognition system using a non-contact scanner. First, the image acquisition unit 201b reads a reference registered form placed on the mat unit 201a, and takes the acquired image into the image memory 202b (S301). Here, since it is necessary to acquire the image of the reference form in a state without distortion, it is necessary to place the image in a state in which there is no lifting or bending. This is called a standard state or a reference state.

続いて、帳票角検出部202cにて、帳票画像上の帳票角を4点検出する(S302)。   Subsequently, the form angle detecting unit 202c detects four form angles on the form image (S302).

続いて、辺分割部202hにより、帳票部分の辺を分割し、辺分割点を求める(S303)。   Subsequently, the side dividing unit 202h divides the sides of the form portion to obtain side dividing points (S303).

続いて、帳票特徴抽出部202iにて、基準帳票画像の歪み特徴情報を抽出する(S304)。   Subsequently, the form feature extraction unit 202i extracts distortion feature information of the reference form image (S304).

続いて、歪み特徴登録部202d4にて、抽出した歪み特徴情報を基準歪み特徴情報としてフォーマット記憶部に登録する。(S305)。   Subsequently, the distortion feature registration unit 202d4 registers the extracted distortion feature information in the format storage unit as reference distortion feature information. (S305).

なお、標準状態で取得した基準歪み特徴情報に含まれる角度は、すべてほぼ90度となると考えられるので、上記のように標準状態での歪み特徴を取得せずにすべての角度を90度とする歪み特徴情報を生成して登録することも可能である。ただし、上記のように標準状態での歪み特徴を取得して実際に歪み特徴情報を抽出すれば、カメラのレンズ等の特性により標準状態でも歪みが発生する場合の影響を排除することができるので、精度を向上させることができる。   Note that all the angles included in the reference distortion feature information acquired in the standard state are considered to be approximately 90 degrees, so that all the angles are set to 90 degrees without acquiring the distortion characteristics in the standard state as described above. It is also possible to generate and register distortion feature information. However, if the distortion feature information in the standard state is acquired and the distortion feature information is actually extracted as described above, it is possible to eliminate the effects of distortion occurring in the standard state due to the characteristics of the camera lens and the like. , Accuracy can be improved.

さらに、オペレータは取得した基準帳票画像を元に帳票毎の文字認識領域を指定し、フォーマットに登録する。指定した文字認識領域の情報は、基準となる角の座標情報とともに、基準角からの相対座標および領域サイズの情報が座標情報として従来どおりに登録される。しかる後に、フォーマットが保存される。(S306)   Further, the operator designates a character recognition area for each form based on the acquired reference form image and registers it in the format. As for the information of the designated character recognition area, information on the relative coordinates from the reference angle and information on the area size are registered as coordinate information as well as the coordinate information of the reference corner. After that, the format is saved. (S306)

(b) 帳票歪み特徴DB作成時
図15(b)は、非接触スキャナを用いた光学式文字認識システムにおける前記帳票歪み特徴DB作成時のフローチャートである。本実施例において、帳票歪み特徴DBはすべてのフォーマットについて共通であることを想定する。このため、帳票歪み特徴DB作成は、前記図15(a)の、フォーマット作成の前に、前記基準歪み特徴情報の登録に用いた帳票をによって行うことが望ましい。
(B) When creating a form distortion feature DB FIG. 15B is a flowchart when creating the form distortion feature DB in the optical character recognition system using a non-contact scanner. In this embodiment, it is assumed that the form distortion feature DB is common to all formats. For this reason, it is desirable to create the form distortion feature DB by using the form used for registering the reference distortion feature information before the format creation shown in FIG.

まず、マット部201a上に浮き上がりの有る状態で、帳票を置く。画像取得部201bにて、マット部201a上に置かれた登録帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S307)。   First, a form is placed on the mat part 201a in a state where it floats. The image acquisition unit 201b reads the registration form placed on the mat unit 201a, and takes the acquired image into the image memory 202b (S307).

続いて、帳票角検出部202cにて、帳票画像上の帳票角を4点検出する(S308)。   Subsequently, the form angle detection unit 202c detects four form angles on the form image (S308).

続いて、帳票特徴抽出部202iにて、帳票画像の歪み特徴情報を抽出する(1309)。   Subsequently, the form feature extraction unit 202i extracts the distortion feature information of the form image (1309).

続いて、帳票歪み特徴DB作成部202kにて、帳票歪み特徴を学習し、帳票歪み特徴DBを作成する(S310)。   Subsequently, the form distortion feature DB creation unit 202k learns the form distortion feature and creates the form distortion feature DB (S310).

S307〜S310の作業を、想定する帳票歪みパターン(例を図14に示す)全てについて行う。(S311)   The operations of S307 to S310 are performed for all assumed form distortion patterns (examples are shown in FIG. 14). (S311)

(c)読取時
図16は、非接触スキャナを用いた光学式文字認識システムにおける読取時のフローチャートである。まず、画像取得部201bにて、マット部201a上に置かれた読取帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S401)。
(C) Reading time FIG. 16 is a flowchart at the time of reading in the optical character recognition system using the non-contact scanner. First, the image acquisition unit 201b reads a read form placed on the mat unit 201a, and takes the acquired image into the image memory 202b (S401).

続いて、帳票角検出部202cにて、画像メモリ202bを参照して、画像上の帳票角を4点検出する(S402)。   Subsequently, the form angle detection unit 202c refers to the image memory 202b and detects four form angles on the image (S402).

続いて、辺分割部202hにより、帳票部分の辺を分割し、辺分割点を求める(S403)。   Subsequently, the side dividing unit 202h divides the sides of the form portion and obtains side dividing points (S403).

続いて、帳票歪み特徴抽出部202iにて、画像の帳票部分の帳票歪み特徴を抽出する(S404)。   Subsequently, the form distortion feature extraction unit 202i extracts the form distortion feature of the form part of the image (S404).

続いて、フォーマット読取部202eは、フォーマット記憶部から基準歪み特徴情報を取得する。(S405)   Subsequently, the format reading unit 202e acquires reference distortion feature information from the format storage unit. (S405)

続いて、帳票歪み識別部202jにて、下記に示す帳票歪み評価値を計算し、あらかじめ設定されているそれぞれの閾値(θTHr)と比較することにより帳票歪み特徴を検出する。このとき、また、帳票歪み特徴DB読取部202lにより、帳票歪み特徴DB202mを参照して、該当する帳票歪みパターンが存在すれば、識別結果として帳票歪みパターンコードを出力する。該当する帳票歪みパターンが見つからなければ、識別失敗の旨を出力する。(S406)   Subsequently, the form distortion identification unit 202j calculates a form distortion evaluation value shown below, and compares it with each preset threshold (θTHr) to detect a form distortion feature. At this time, the form distortion feature DB reading unit 202l refers to the form distortion feature DB 202m and outputs a form distortion pattern code as an identification result if the corresponding form distortion pattern exists. If no corresponding form distortion pattern is found, the fact that identification has failed is output. (S406)

帳票歪み特長の識別に失敗した場合は(S407)、WS203のCRTに“歪み検出失敗”と表示し(S408)、さらにWS203のCRTに“帳票リジェクト”と表示する(S409)   If identification of the form distortion feature has failed (S407), “distortion detection failure” is displayed on the CRT of the WS 203 (S408), and “form reject” is further displayed on the CRT of the WS 203 (S409).

識別が成功の場合において、識別結果が歪み無しの場合は(S410)、フォーマット読取部202eにて、当該帳票の基準角の座標情報と文字認識領域の座標情報が読み取られる。(S411)。
続いて、従来同様に、基準となる角の座標(たとえば左上端座標)により、文字領域を補正する(S412)。続いて、文字認識部202gにて、文字を認識し(S413)、WS203のCRTに文字認識結果を表示する(S414)。
When the identification is successful and the identification result is not distorted (S410), the format reading unit 202e reads the coordinate information of the reference angle of the form and the coordinate information of the character recognition area. (S411).
Subsequently, as in the prior art, the character area is corrected using the reference corner coordinates (for example, the upper left corner coordinates) (S412). Subsequently, the character recognition unit 202g recognizes the character (S413), and displays the character recognition result on the CRT of the WS 203 (S414).

識別結果が補正可能歪み特徴パタンの場合は、フォーマット読込部1006にて、フォーマット読取部202eにて、当該帳票の基準角の座標情報と文字認識領域の座標情報が読み取られる。(S415)。続いて、識別結果に応じて、文字領域補正部202fの左上端補正部、右上端補正部、右下端補正部、左下端補正部を適宜使用して、登録画像の帳票角座標・文字領域座標、読取画像の帳票角座標から、文字領域を補正する(S416)。   When the identification result is a correctable distortion feature pattern, the format reading unit 1006 reads the coordinate information of the reference angle of the form and the coordinate information of the character recognition area by the format reading unit 202e. (S415). Subsequently, according to the identification result, the form corner coordinates / character region coordinates of the registered image are appropriately used by using the upper left end correction unit, upper right end correction unit, lower right end correction unit, and lower left end correction unit of the character region correction unit 202f. The character area is corrected from the form corner coordinates of the read image (S416).

例えば、識別結果が左上角浮き上がりの場合の補正の場合の例を図17に示す。
図に示すとおり、左上角近辺の文字領域は、補正不可能の為、左上近辺の文字領域をリジェクトとする。すなわち、文字認識結果を不読とする。左上角から遠い文字領域は、左上角以外の角座標から文字領域を補正する。すなわち、帳票を左上、右上、右下、左下の4つの部分に分割し、それぞれ前述の左上端補正部、右上端補正部、右下端補正部、左下端補正部にて補正する。
続いて、リジェクトではない文字領域において、文字認識部202gにて文字を認識し(S417)、WS203のCRTに文字認識結果を表示する(S418)。続いて、WS203のCRTに帳票歪み識別結果を表示する(S419)。識別結果が補正不可能歪み特徴パタンの場合は(S410)、WS203のCRTに帳票歪み識別結果を表示し(S420)、WS203のCRTに“帳票リジェクト”と表示する(S409)。
For example, FIG. 17 shows an example of correction in the case where the identification result is a lift in the upper left corner.
As shown in the figure, since the character area near the upper left corner cannot be corrected, the character area near the upper left corner is rejected. That is, the character recognition result is unread. For a character region far from the upper left corner, the character region is corrected from angular coordinates other than the upper left corner. That is, the form is divided into four parts, upper left, upper right, lower right, and lower left, and corrected by the above-described upper left end correction unit, upper right end correction unit, right lower end correction unit, and left lower end correction unit, respectively.
Subsequently, in the character area that is not rejected, the character recognition unit 202g recognizes the character (S417), and the character recognition result is displayed on the CRT of the WS 203 (S418). Subsequently, the form distortion identification result is displayed on the CRT of the WS 203 (S419). If the identification result is an uncorrectable distortion feature pattern (S410), the form distortion identification result is displayed on the CRT of the WS 203 (S420), and “form reject” is displayed on the CRT of the WS 203 (S409).

このように、基準帳票画像の各辺を所定の値で分割して辺分割点を求め、それぞれを結ぶ線分の交点の角度を基準歪み特徴とし、歪判定の際には、判定対象となる帳票画像の各辺を基準帳票と同様に分割し、同じくそれぞれを結ぶ線分の交点の角度を歪み特徴とし、前記基準歪み特徴と比較することによって、帳票の画像上の歪みを識別し、文字認識可能な領域については文字認識を行うとともに帳票歪みの識別結果を表示するので、オペレータに対して警告ができ、文字領域のずれによる金融取引の事故の発生を防止し、オペレータにとっても確認の負荷が減少するという、効果を得ることができる。   In this way, each side of the reference form image is divided by a predetermined value to obtain a side division point, and the angle of the intersection of the line segments connecting the respective sides is set as a reference distortion feature, which is a determination target when determining distortion. Each side of the form image is divided in the same way as the standard form, and the angle of the intersection of the line segments that connect the same is used as the distortion feature. By comparing with the standard distortion feature, the distortion on the form image is identified, and the character Character recognition is performed on the recognizable area and the result of identification of the form distortion is displayed, so that the operator can be warned, the occurrence of financial transaction accidents due to misalignment of the character area can be prevented, and the burden of confirmation also for the operator It is possible to obtain an effect that decreases.

また、想定する帳票の歪みについて、実際に当該歪みを発生させた画像を読み取って自動的に帳票歪みDBを作成するので、オペレータの登録作業の不可を軽減できる。   Further, regarding the assumed form distortion, the form distortion DB is automatically created by reading the image in which the distortion is actually generated, so that it is possible to reduce the impossibility of the operator's registration work.

また、前記辺分割点同士を結んだ線分の交点の角度のみを特徴とすることにより、非判定帳票が基準帳票と異なるサイズであっても同じ数の交点を得ることができるので、基準歪特徴データは共通のものを使用できるので、登録は1回のみでよく、新規な帳票を含めて画像の歪みの判定を行うことができる。   In addition, since only the angle of the intersection of the line segments connecting the side division points is characterized, the same number of intersections can be obtained even if the non-decision form is different in size from the reference form. Since common feature data can be used, registration is required only once, and image distortion including new forms can be determined.

実施例1においては、対応する辺分割点同士を結んだ線分の交点の角度のみを歪み特徴とするとしたが、本実施例においては、前記線分の長さについても歪み特徴情報として用いる。このため、基準歪み特徴は帳票の種別毎に異なるものとなるので、基準歪み特徴情報はおよび各帳票のフォーマット毎に登録されることになる。また、帳票歪み特徴DBについても、帳票毎の情報として登録されることになる。   In the first embodiment, only the angle of the intersection of the line segments connecting the corresponding edge division points is used as the distortion feature. However, in this embodiment, the length of the line segment is also used as the distortion feature information. For this reason, since the reference distortion feature differs for each type of form, the reference distortion feature information is registered for each format of each form. The form distortion feature DB is also registered as information for each form.

<実施例2の構成>
本実施零におけるシステムの構成は、実施例1と同じく図2で示される。以下、実施例1と異なる部分についてのみ説明する。
<Configuration of Example 2>
The system configuration in the present embodiment zero is shown in FIG. Only the parts different from the first embodiment will be described below.

<光学式文字認識装置の構成>
光学式文字認識装置202の内部構成は、実施例1と同じく図1に示される。
制御部202a、画像メモリ202b、帳票角検出部202c、文字領域補正部202f、文字認識部202g、は従来と同じものであるので説明を省略する。
<Configuration of optical character recognition device>
The internal configuration of the optical character recognition device 202 is shown in FIG.
Since the control unit 202a, the image memory 202b, the form angle detection unit 202c, the character area correction unit 202f, and the character recognition unit 202g are the same as those in the related art, description thereof will be omitted.

フォーマット読取部202eは、本実施例においては、基準歪み特徴を、フォーマット毎に取得する機能を有する。   In the present embodiment, the format reading unit 202e has a function of acquiring the reference distortion feature for each format.

帳票歪み特徴抽出部202iは、画像から帳票の歪み特徴を抽出する機能を提供するのは実施例1と同様であるが、各辺分割点を結ぶ線分の交点の角度に加えて、前記線分の長さについても、特徴情報として抽出する。帳票歪み特徴抽出部202iについては、後述する。   The form distortion feature extraction unit 202i provides a function of extracting a form distortion characteristic from an image in the same manner as in the first embodiment, but in addition to the angle of the intersection of the line segments connecting the side division points, The length of the minutes is also extracted as feature information. The form distortion feature extraction unit 202i will be described later.

<歪み特徴情報>
ここで、本実施例における歪み特徴情報について説明する。
図5(a)は、歪み情報の基準となる帳票画像の帳票部分について歪み特徴を抽出した様子である。各記号の意味は実施例1と同様である。
<Distortion feature information>
Here, the distortion feature information in the present embodiment will be described.
FIG. 5A shows a state in which distortion features are extracted from a form portion of a form image that is a basis for distortion information. The meaning of each symbol is the same as in the first embodiment.

本実施例では、1枚の基準帳票を用いて、Vex、Hey、θeyxを歪み特徴情報として抽出し、共通の基準歪み特徴情報としてフォーマットに記憶する。ここで基準歪み特徴は、実施例1と異なり、基準帳票は、フォーマットに登録されている帳票の種別毎に登録する必要がある。
図5(b)は、実施例1と同様であるので、説明を省略する。
In this embodiment, using a single reference form, Vex, Hey, and θeyx are extracted as distortion feature information and stored in the format as common reference distortion feature information. Here, unlike the first embodiment, the reference distortion feature needs to be registered for each type of form registered in the format.
Since FIG. 5B is the same as that of the first embodiment, description thereof is omitted.

<フォーマット作成部>
フォーマット作成部202eの内部構成は、実施例1と同じく図3に示される。
歪み特徴登録部202d4は、基準歪み特徴を各帳票のフォーマットに関連づけてフォーマット記憶部に格納する。このため、基準歪み特徴情報は、各帳票ごとの文字情報の登録とともに行うと効率が良い。
<Format creation section>
The internal configuration of the format creation unit 202e is shown in FIG.
The distortion feature registration unit 202d4 stores the reference distortion feature in the format storage unit in association with the format of each form. For this reason, it is efficient to perform the reference distortion feature information together with the registration of the character information for each form.

<帳票歪み特徴抽出部>
帳票歪み特徴抽出部202iは、辺分割部202hによって得られた辺分割点について、対向するもの同士を結んだ線分を求める。これらの線分は、図5(a)(b)におけるVex、Hey、Vrx、Hryのようになる。続いて、各交点の角度θeyxを求め、前記各線分の長さとともに、特徴として出力する。
<Form distortion feature extraction unit>
The form distortion feature extraction unit 202i obtains a line segment that connects opposite sides of the side division points obtained by the side division unit 202h. These line segments are like Vex, Hey, Vrx, and Hry in FIGS. Subsequently, an angle θeyx of each intersection is obtained and output as a feature together with the length of each line segment.

<帳票歪み特徴DB作成部>
帳票歪み特徴DB作成部202kは、帳票歪み特徴DB202mを、共通ではなく各帳票の帳票ID毎に登録する。このため、基準歪み特徴情報は、各帳票ごとの文字情報の登録とともに、当該帳票を用いて行う。
<Form distortion feature DB creation section>
The form distortion feature DB creation unit 202k registers the form distortion feature DB 202m for each form ID of each form, not in common. For this reason, the reference distortion feature information is performed using the form together with the registration of the character information for each form.

<実施例2の動作>
(a)フォーマット作成時
本実施例における動作は、実施例1と同じく図15(a)にて説明される。S301〜S304については、実施例1と同様なので説明を省略する。
<Operation of Example 2>
(A) At the time of format creation The operation in this embodiment will be described with reference to FIG. About S301-S304, since it is the same as that of Example 1, description is abbreviate | omitted.

S305では、歪み特徴登録部202d4にて、抽出した歪み特徴情報を基準歪み特徴情報として当該帳票のフォーマットに関連付けて登録する。   In S305, the distortion feature registration unit 202d4 registers the extracted distortion feature information as reference distortion feature information in association with the format of the form.

(b) 帳票歪み特徴DB作成時
本実施例における動作は、実施例1と同じく図15(a)にて説明される。なお、本実施例においては、帳票歪み特徴DB作成は、各帳票ごとに行われる。すなわち、図13のような表が帳票ID毎に個別に登録される。それ以外は、実施例1と同様なので説明を省略する。
(B) At the time of creating the form distortion feature DB The operation in the present embodiment will be described with reference to FIG. In the present embodiment, the form distortion feature DB is created for each form. That is, a table as shown in FIG. 13 is individually registered for each form ID. Since other than that is the same as that of Example 1, description is abbreviate | omitted.

(c)読取時
本実施例における動作は、実施例1と同じく図16にて説明される。S405、S406以外については、実施例1と同様なので説明を省略する。
(C) Reading The operation in the present embodiment will be described with reference to FIG. Since steps other than S405 and S406 are the same as those in the first embodiment, description thereof is omitted.

S405では、フォーマット読み取り部202eは、フォーマット記憶部から帳票画像の帳票の種別に対応する基準歪み特徴情報を取得する(405)。帳票の種別の特定には、既存の方法が適用されるが、例えば当該帳票のシートIDや罫線特徴等の特徴情報をフォーマットとともに登録しておき、特徴が一致するフォーマットを選択するようにしてもよい。または、WSのオペレータに対して帳票の種別の指定手段を提供し、指定された情報により帳票の種別を特定することにしても良い。   In step S405, the format reading unit 202e acquires reference distortion feature information corresponding to the form type of the form image from the format storage unit (405). An existing method is applied to specify the type of form. For example, feature information such as sheet ID and ruled line feature of the form is registered together with the format, and a format that matches the feature is selected. Good. Alternatively, a form type designation means may be provided to the WS operator, and the form type may be specified based on the designated information.

S406では、帳票歪み識別部202jは下記に示す式にて帳票歪み評価値を計算する。
[帳票歪み評価値]
Vx = |Vex − Vrx| (x=1,2…n)
Hy = |Hey − Hry| (y=1,2 …m)
θyx = | θeyx − θryx | (y=1,2 …m)(x=1,2 …n)
[帳票歪み評価値の閾値]
Hxの閾値: VTHr
Hyの閾値: HTHr
θyxの閾値: θTHr
あらかじめ設定されているそれぞれの閾値(VTHr、HTHr、θTHr)と比較して帳票歪み特徴を検出する。そして、帳票歪み特徴DB読取部202lにより、当該帳票の帳票歪み特徴DB202mを参照して、該当する帳票歪みパターンが存在すれば、識別結果として帳票歪みパターンコードを出力する。該当する帳票歪みパターンが見つからなければ、識別失敗の旨を出力する。(S406)
In S406, the form distortion identification unit 202j calculates a form distortion evaluation value using the following formula.
[Form distortion evaluation value]
Vx = | Vex−Vrx | (x = 1, 2,... N)
Hy = | Hey−Hry | (y = 1, 2,... M)
θyx = | θeyx−θryx | (y = 1, 2,... m) (x = 1, 2,... n)
[Threshold of form distortion evaluation value]
Hx threshold: VTHr
Hy threshold: HTHr
The threshold value of θyx: θTHr
The form distortion feature is detected by comparing with respective threshold values (VTHr, HTHr, θTHr) set in advance. Then, the form distortion feature DB reading unit 202l refers to the form distortion feature DB 202m of the form and outputs a form distortion pattern code as an identification result if the corresponding form distortion pattern exists. If no corresponding form distortion pattern is found, the fact that identification has failed is output. (S406)

このように、基準帳票画像の各辺を所定の値で分割して辺分割点を求め、それぞれを結ぶ線分の交点の角度と各線分の長さとを基準歪み特徴として各帳票毎に登録し、歪み判定の際には、判定対象となる帳票画像の各辺を基準帳票と同様に分割し、同じくそれぞれを結ぶ線分の交点の角度と線分の長さを歪み特徴とし、前記基準歪み特徴と比較することによって、帳票の画像上の歪みが判定できるので、実施例1に対してさらに精度よく歪みの判定を行うことができる。   In this way, each side of the reference form image is divided by a predetermined value to obtain a side division point, and the angle of the intersection of the line segment connecting the respective sides and the length of each line segment are registered for each form as a reference distortion feature. When determining distortion, each side of the form image to be determined is divided in the same manner as the reference form, and the angle of the intersection of the line segments connecting the respective lines and the length of the line segment are also distortion characteristics. Since the distortion on the image of the form can be determined by comparing with the feature, the distortion can be determined with higher accuracy than the first embodiment.

なお、上述の実施例に置いて、角を結ぶ線分を等分するとしたが、帳票の浮き上がり等による歪みは帳票の角に近い部分ほど大きくなることから、帳票の角に近い部分の分割間隔を短くし、中央すなわち角から遠い部分の分割間隔を長くすることにより、辺分割点の密度を挙げるとさらに精度良く帳票部分の歪みを検出することができる。例えば、図5(a)(b)におけるn、mに対応する分割間隔を三角関数を用いて変換することにより、角に近い部分の分割間隔を短くすることが可能である。例えば、辺の中央を起点=0とし辺の角部を終点=π/2[rad]とすれば、辺を等分した点を正弦関数によって角に近くなるほど短い間隔となるように写像できる。例えば、中央から角までを3分割する場合、中央から1/3の地点は、sin((π/2)x(1/3))=sin(π/6)=0.5により、中央から角までの半分の地点に写像される。中央から2/3の地点は、sin((π/2)x(2/3))=sin(π/3)=約0.87により、中央から角までの約0.87倍の地点に写像される。
なお、実施例1において、基準歪み特徴情報は共通なものを1回登録すればよい、としたが、実施例2のような方法によって帳票ごとに基準歪み特徴情報を登録しても構わない。例えば、カメラのレンズ等の特性により帳票のサイズによって歪み方に差異が生じるような場合には、帳票ごとに基準歪み特徴情報を登録すれば、さらに精度を上げることができる。
In the above-described embodiment, the line connecting the corners is equally divided. However, since the distortion due to the lift of the form is closer to the corner of the form, the division interval of the part near the corner of the form is larger. By shortening and increasing the division interval of the center, that is, the part far from the corner, the distortion of the form part can be detected with higher accuracy when the density of the side division points is given. For example, by dividing the division intervals corresponding to n and m in FIGS. 5A and 5B using a trigonometric function, it is possible to shorten the division interval near the corner. For example, if the center of the side is set as the starting point = 0 and the corner of the side is set as the end point = π / 2 [rad], the points obtained by equally dividing the side can be mapped with a sine function so that the intervals become shorter as the angle becomes closer. For example, when the center to the corner is divided into three, the point 1/3 from the center is sin ((π / 2) × (1/3)) = sin (π / 6) = 0.5, so Maps to half the point to the corner. The point 2/3 from the center is approximately 0.87 times from the center to the corner by sin ((π / 2) x (2/3)) = sin (π / 3) = about 0.87. Mapped.
In the first embodiment, the common reference distortion feature information may be registered once. However, the reference distortion feature information may be registered for each form by the method as in the second embodiment. For example, when there is a difference in distortion depending on the size of the form due to the characteristics of the camera lens or the like, the accuracy can be further improved by registering the reference distortion feature information for each form.

なお、上述の実施例において、光学式文字認識装置102とスキャナ装置201とを別の構成として説明したが、スキャナと光学式文字認識装置とは1体型で構成されていてもかまわない。
また、上述したそのような光学式文字認識装置102とWS203を組み合わせることにより、帳票画像の文字認識機能を備えた端末装置として機能させることもできる。特に、WS203が金融営業店窓口端末である場合には、帳票画像の文字認識機能を備えた金融営業店窓口端末として機能させることができる。
In the above-described embodiment, the optical character recognition device 102 and the scanner device 201 have been described as different configurations. However, the scanner and the optical character recognition device may be configured as a single body.
Further, by combining such optical character recognition device 102 and WS 203 as described above, it is possible to function as a terminal device having a character recognition function for a form image. In particular, when WS 203 is a financial sales office window terminal, it can function as a financial sales office window terminal having a function for recognizing a form image.

本発明の光学式文字認識装置の機能ブロックFunctional block of optical character recognition device of the present invention 本発明のシステム構成System configuration of the present invention 本発明のフォーマット作成部の機能ブロックFunctional block of format creation unit of the present invention 帳票ごとの許容帳票歪み特徴DBPermissible form distortion feature DB for each form 帳票の歪み特徴の説明Explanation of distortion characteristics of forms 従来のシステム構成Conventional system configuration 従来のスキャナの機能ブロックFunctional block of conventional scanner 従来の光学式文字認識装置の機能ブロックFunctional block of conventional optical character recognition device 従来のフォーマット作成部の機能ブロックFunctional block of conventional format creation unit 従来の文字領域補正部の機能ブロックFunctional block of conventional character area correction unit 従来のフローチャートConventional flowchart 帳票歪み時の取得画像と領域補正結果Acquired image and area correction result at the time of form distortion 帳票歪み特徴DBReport distortion feature DB 歪みパターン例Example of distortion pattern 本発明のフローチャートFlow chart of the present invention 本発明のフローチャートFlow chart of the present invention 帳票歪み時の取得画像と領域補正結果Acquired image and area correction result at the time of form distortion

符号の説明Explanation of symbols

201 スキャナ装置
201a マット部
201b 画像取得部
202 光学式文字認識装置
203 WS
202a 制御部
202b 画像メモリ
202c 帳票角検出部
202d フォーマット作成部
202e フォーマット読取部
202f 文字領域補正部
202g 文字認識部
202h 辺分割部
202i 帳票歪み特徴抽出部
202j 帳票歪み識別部
202k 帳票歪み特徴DB作成部
202l 帳票歪み特徴DB読取部
202m 帳票歪み特徴DB
202n 許容帳票歪み特徴DB
201 Scanner Device 201a Matte Unit 201b Image Acquisition Unit 202 Optical Character Recognition Device 203 WS
202a Control section 202b Image memory 202c Form angle detection section 202d Format creation section 202e Format reading section 202f Character area correction section 202g Character recognition section 202h Side division section 202i Form distortion feature extraction section 202j Form distortion identification section 202k Form distortion feature DB creation section 202l Form distortion feature DB reading unit 202m Form distortion feature DB
202n Allowable form distortion feature DB

Claims (10)

帳票の画像を取得して、当該画像上の帳票部分の外形の歪みに応じて文字認識を行う文字認識装置であって、
前記帳票部分の外形の歪み特徴を抽出する歪み特徴抽出部と、
歪みパターンを帳票の部分ごとの歪みの大小に応じて分類した帳票歪み特徴DBと、
前記抽出した帳票部分の歪み特徴を元に該当する歪みパターンを選択する歪み識別部と、
選択された歪みパターンに応じて文字認識を行う文字認識部を備えた、
文字認識装置。
A character recognition device that acquires an image of a form and performs character recognition in accordance with distortion of the outer shape of the form part on the image,
A distortion feature extraction unit for extracting distortion characteristics of the outer shape of the form part;
A form distortion feature DB that classifies the distortion patterns according to the degree of distortion for each part of the form;
A distortion identifying unit for selecting a corresponding distortion pattern based on the extracted distortion characteristics of the form part;
A character recognition unit that performs character recognition according to the selected distortion pattern,
Character recognition device.
前記文字認識部は選択された歪みパターンにより歪みの小さな部分について文字認識を行う、請求項1に記載の文字認識装置。   The character recognition device according to claim 1, wherein the character recognition unit performs character recognition on a portion with a small distortion based on the selected distortion pattern. 前記文字認識部は歪みのパターンにより文字領域座標補正方法を選択する、
請求項1に記載の文字認識装置。
The character recognition unit selects a character region coordinate correction method according to a distortion pattern;
The character recognition device according to claim 1.
前記帳票部分の辺を分割した辺分割点を求める辺分割部を備え、
前記歪み特徴抽出部は、各対向する辺の辺分割点を所定の対応条件によって結び、各線分の交点における線分同士の角度を歪み特徴として抽出する、
請求項1に記載の文字認識装置。
An edge dividing unit for obtaining an edge dividing point obtained by dividing an edge of the form part,
The distortion feature extraction unit connects side division points of the opposing sides according to a predetermined correspondence condition, and extracts an angle between line segments at the intersection of each line segment as a distortion feature.
The character recognition device according to claim 1.
前記帳票部分の角を検出する角検出部を備え、
前記辺分割部は、前記検出した角を結ぶ線をそれぞれ分割した点を求め、求めた点を前記帳票部分の辺に対応させることによって辺を分割する、請求項4に記載の文字認識装置。
A corner detection unit for detecting a corner of the form part;
The character recognition device according to claim 4, wherein the side dividing unit obtains points obtained by dividing the lines connecting the detected corners, and divides the sides by associating the obtained points with the sides of the form part.
前記辺分割部は、前記分割を所定数で等分に分割する、請求項5に記載の文字認識装置。   The character recognition device according to claim 5, wherein the side dividing unit divides the division into a predetermined number of equal parts. 前記辺分割部は、角に近い部分の前記分割の間隔を短くする、請求項5に記載の文字認識装置。   The character recognition device according to claim 5, wherein the side dividing unit shortens an interval of the division in a portion close to a corner. 前記分割の間隔は、等分割した場合の分割点の位置を三角関数によって写像して決定する、請求項7に記載の文字認識装置。   The character recognition device according to claim 7, wherein the division interval is determined by mapping a position of a division point when equally divided by a trigonometric function. 前記帳票歪み特徴DBには帳票の種別ごとの歪みパターンを帳票の種別ごとの識別情報に関連付けて予め記憶し、
前記歪み識別部は、前記抽出した歪み特徴を前記識別情報を元に帳票歪み特徴DBの歪みパターンと比較することによって前記歪みパターンを選択する、請求項1から8のいずれかに記載の文字認識装置。
In the form distortion feature DB, a distortion pattern for each form type is stored in advance in association with identification information for each form type,
The character recognition according to claim 1, wherein the distortion identification unit selects the distortion pattern by comparing the extracted distortion feature with a distortion pattern of a form distortion feature DB based on the identification information. apparatus.
請求項1から9のいずれかに記載の文字認識装置を備えた、金融営業店端末。   A financial store terminal comprising the character recognition device according to claim 1.
JP2005267273A 2005-09-14 2005-09-14 Character recognition device Pending JP2007079966A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005267273A JP2007079966A (en) 2005-09-14 2005-09-14 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005267273A JP2007079966A (en) 2005-09-14 2005-09-14 Character recognition device

Publications (1)

Publication Number Publication Date
JP2007079966A true JP2007079966A (en) 2007-03-29

Family

ID=37940205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005267273A Pending JP2007079966A (en) 2005-09-14 2005-09-14 Character recognition device

Country Status (1)

Country Link
JP (1) JP2007079966A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017142635A (en) * 2016-02-10 2017-08-17 日立オムロンターミナルソリューションズ株式会社 Image reading device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017142635A (en) * 2016-02-10 2017-08-17 日立オムロンターミナルソリューションズ株式会社 Image reading device

Similar Documents

Publication Publication Date Title
US7999657B2 (en) Image registration method for image comparison and document authentication
KR101292916B1 (en) Computer-readable recording medium having image processing program recorded thereon, portable terminal, and image processing method
US10068150B2 (en) Method and apparatus for OCR detection of valuable documents by means of a matrix camera
US20160171325A1 (en) System for determining alignment of a user-marked document and method thereof
JP7444495B2 (en) OCR-based document analysis system and method
JP4419269B2 (en) Two-dimensional code extraction method
US20150254869A1 (en) Image processing apparatus, image processing method, and storage medium
JP4594952B2 (en) Character recognition device and character recognition method
CN115619656A (en) Digital file deviation rectifying method and system
US7227997B2 (en) Image recognition apparatus, image recognition method, and image recognition program
US20180225541A1 (en) Image processing apparatuses and non-transitory computer readable medium
JP4574503B2 (en) Image processing apparatus, image processing method, and program
JP3582988B2 (en) Non-contact image reader
US10645256B2 (en) Image forming apparatus and non-transitory computer-readable storage medium suitable for extracting areas in images specified by handwritten marker by line marker such as highlighter pen or the like, and electronic marker by digital pen
JP2007079966A (en) Character recognition device
JP2006229685A (en) Distortion determination device for business form
JP4167680B2 (en) Document reading apparatus and document reading method
US7865130B2 (en) Material processing apparatus, material processing method, and material processing program product
JP4894195B2 (en) Teaching material processing apparatus, teaching material processing method, and teaching material processing program
JP4009314B2 (en) Form layout identification method and form layout identification system
JP2007140703A (en) Method for reading insurance policy, system thereof, and insurance policy recognition system
JPH11250179A (en) Character reocognition device and its method
JP4701918B2 (en) Teaching material processing apparatus, teaching material processing method, and teaching material processing program
JP6743401B2 (en) Form design/read setting support device, form design/read setting support method, and optical character recognition system
JP2013152523A (en) Document character difference detection device