JP2007079966A - Character recognition device - Google Patents
Character recognition device Download PDFInfo
- Publication number
- JP2007079966A JP2007079966A JP2005267273A JP2005267273A JP2007079966A JP 2007079966 A JP2007079966 A JP 2007079966A JP 2005267273 A JP2005267273 A JP 2005267273A JP 2005267273 A JP2005267273 A JP 2005267273A JP 2007079966 A JP2007079966 A JP 2007079966A
- Authority
- JP
- Japan
- Prior art keywords
- distortion
- character recognition
- unit
- image
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
Description
本発明は、帳票をマットにセットし、上部からセンサ部でイメージを読み取る非接触スキャナ装置を用いた帳票画像の歪みを判別して文字認識を行う文字認識装置に関するものである。 The present invention relates to a character recognition apparatus that performs character recognition by determining distortion of a form image using a non-contact scanner device that sets a form on a mat and reads an image from the top with a sensor unit.
現在、金融営業店の窓口業務等にて、顧客が持ち込んだ帳票や本人確認書類等の種々の用紙の画像を取得するための、非接触型スキャナが用いられている。非接触型スキャナは、帳票を置くマット部の上方に設置されたカメラによって、帳票の画像を取得する形式のスキャナである。金融営業店の窓口業務においては、非接触型スキャナは、金融営業店窓口の窓口端末に接続され、画像取得の制御が行われる。非接触型スキャナは、フラットベッド型スキャナやシートフィード型スキャナに比べ、画像取得のための操作が簡便で所要時間が短い等の特徴を持っている。(例えば非特許文献1)
窓口にて取得された帳票の画像に対しては、光学的文字認識装置によって所定の文字認識処理が行われ、記入内容がデータ化され、金融取引に利用される。
以下に本発明の従来技術について説明する。
Currently, non-contact scanners for acquiring images of various papers such as forms and identification documents brought in by customers are used in the counter business of financial sales offices. The non-contact type scanner is a type of scanner that acquires an image of a form by a camera installed above a mat portion on which the form is placed. In the counter business of a financial sales office, the non-contact type scanner is connected to the counter terminal of the financial sales office counter, and image acquisition control is performed. The non-contact type scanner has features such as a simpler operation for image acquisition and a shorter time required than a flat bed type scanner or a sheet feed type scanner. (For example, Non-Patent Document 1)
The form image acquired at the window is subjected to predetermined character recognition processing by an optical character recognition device, and the contents of entry are converted into data and used for financial transactions.
The prior art of the present invention will be described below.
<従来のシステム構成>
従来のシステムの概観を図6に示す。
従来のシステムは、非接触スキャナ装置101、光学式文字認識装置102、WS103から構成され、WS103はキーボード等の入力手段とCRT等の表示手段を備える。
図6において、非接触スキャナ装置101は上から見た図を示している。非接触スキャナ装置101、光学式文字認識装置102、については後述する。
WS103はシステム全体を制御するための端末であり、図示しないメモリやCRT等の表示部やキーボードマウス等の操作部を備えた、一般的なPC等が使用される。
なお、ここでは光学式文字認識装置102はハードウェアによって実現するものとして説明するが、WS103内に設けたソフトウェアであってもよい。
<Conventional system configuration>
An overview of a conventional system is shown in FIG.
The conventional system includes a
In FIG. 6, the
The WS 103 is a terminal for controlling the entire system, and a general PC or the like having a display unit such as a memory and a CRT (not shown) and an operation unit such as a keyboard mouse is used.
Here, the optical
<非接触スキャナ装置の構成>
非接触スキャナ装置101の構成は、図7に示すように、制御部101c、マット部101a、画像取得部101bから構成される。
制御部101cは、非接触スキャナ装置101全体の制御手段、光学式文字認識装置102との通信手段を有する。
マット部101aは、画像を取得する帳票を設置するための置き台である。マット部101aは図6においては網掛けで表現しているが、黒色等、画像上で帳票と容易に区別ができる色の材質が用いられる。これにより、取得した帳票画像はマット部が背景となるため、黒い背景色に対し、帳票が浮き上がって見えるような状態となる。このため、容易に帳票の辺を検出することが可能となる。
画像取得部101bは、マット部101a上の帳票を撮影し画像データに変換する機能を有する、CCDやC−MOS等を利用したカメラである。
<Configuration of non-contact scanner device>
As shown in FIG. 7, the
The
The
The
<光学式文字認識装置の構成>
光学式文字認識装置は、取得した帳票の画像から、帳票の種類を特定し、さらに当該帳票の文字認識すべき領域を特定し、文字認識を行う。
光学式文字認識装置102の構成は、図8に示すように、制御部102a、画像メモリ102b、帳票角検出部102c、フォーマット作成部102d、フォーマット読取部102e、文字領域補正部102f、文字認識部102gから構成される。また非接触スキャナ装置101およびWS103との図示しない通信手段を有する。
<Configuration of optical character recognition device>
The optical character recognition device identifies the type of form from the acquired form image, further identifies the area of the form to be recognized, and performs character recognition.
As shown in FIG. 8, the configuration of the optical
光学式文字認識装置102の制御部102aは、光学文字認識装置102全体の制御を行う。
画像メモリ102bは、帳票画像データを保持する手段を有する。各処理部は、適宜画像メモリ102bを参照することにより、帳票画像を参照することができる。
帳票角検出部102cは、画像から帳票角を検出する手段を有する。帳票の角の検出は、例えば画像を走査して、画素の濃度の違いにより背景と帳票部分との境目すなわち帳票辺を検出する。得られた帳票辺となる画素を追跡して、XまたはY座標の変化量の正負が反転するか、変化が開始される場所を角と判断することができる。または、各帳票辺から任意に複数の点を選択し、ハフ変換等既知の技術を用いることにより各帳票辺ごとに直線または曲線に近似し、それらの交点を角として選択することもできる。
フォーマット作成部102dは、文字領域座標等の文字認識に必要なフォーマットを作成する手段を有する。フォーマット作成部102dについては後述する。
フォーマット読取部102eは、他の処理部に対してフォーマットの内容を読取る機能を提供する。
文字領域補正部102fは、フォーマットから文字領域座標を補正する手段を有する。文字領域補正部102fについては後述する。
文字認識部102gは、図示しない文字認識辞書とのパターンマッチングにより、文字を認識する機能を提供する。
The
The
The form
The
The
The character
The
<フォーマット作成部>
フォーマット作成部102dの構成は、図9に示すように、制御部102d1、フォーマット保存部102d2、文字領域座標設定部102d3で構成される。また、他の処理部との図示しない通信処理部を有する。
<Format creation section>
As shown in FIG. 9, the
フォーマット作成部の制御部102d1は、フォーマット作成部102d全体の制御を行う。
フォーマット保存部102d2は、文字領域座標等の文字認識に必要なフォーマットを図示しないフォーマット記憶部に保存する機能を提供する。なお、以下フォーマットの取得は、フォーマット記憶部から行うものとする。
前記フォーマットには、各帳票の識別情報とともに、各文字領域ごとに帳票の基準となる角(例えば左上)からの相対座標が格納されている。文字認識部は、この情報を元に、帳票画像上の文字領域を特定し、記入されている文字を認識する。
文字領域座標設定部102d3は、フォーマット作成するオペレータの入力操作を受けて、上記の座標の他、文字認識に使用する辞書の種類等、必要な情報をフォーマットとして登録する。ここでは、オペレータはWS103を介してフォーマット作成部にデータを入力するものとする。
The control unit 102d1 of the format creation unit controls the entire
The format storage unit 102d2 provides a function of storing a format necessary for character recognition such as character region coordinates in a format storage unit (not shown). Hereinafter, the format is acquired from the format storage unit.
The format stores relative coordinates from the corner (for example, upper left), which is the basis of the form, for each character area, along with the identification information of each form. Based on this information, the character recognition unit identifies the character area on the form image and recognizes the entered character.
The character area coordinate setting unit 102d3 receives the input operation of the operator who creates the format, and registers necessary information such as the type of dictionary used for character recognition in addition to the above coordinates as the format. Here, it is assumed that the operator inputs data to the format creation unit via the WS 103.
<文字領域補正部>
文字領域補正部102fの構成は、図10に示すように、制御部102f1、文字領域位置補正部102f2で構成される。また、他の処理部との図示しない通信処理部を有する。
文字領域補正部102fの制御部102f1は、文字領域補正部102f全体の制御を行う。
<Character area correction unit>
As shown in FIG. 10, the configuration of the character
The control unit 102f1 of the character
文字領域位置補正部102f2は、左上の角の座標から文字領域を補正する。なお、ここでは左上としたが、前記相対座標の基準となる角を左上としているためであり、例えば右上等、他のすべての角を基準とすることが可能である。 The character region position correction unit 102f2 corrects the character region from the coordinates of the upper left corner. Note that although the upper left corner is used here, the reference angle of the relative coordinate is the upper left corner. For example, all other corners such as the upper right corner can be used as a reference.
<動作>
(a)フォーマット登録時
図11(a)は、非接触スキャナを用いた光学式文字認識システムにおける登録時のフローチャートである。まず、画像取得部101bにて、マット部101a上に置かれた登録帳票の読取りを行い、取得画像を画像メモリ102bに取り込む(S101)。続いて、帳票角検出部102cにて、画像メモリ102bを参照して、画像上の帳票角を4点検出する(S102)。続いて、文字領域座標設定部102d3にて、画像メモリ102bを参照して、WS103のCRTに画像を表示し、オペレータは、文字領域を設定する(S103)。続いて、フォーマット保存部102d2にて、別途指定したシートID等の各帳票の識別情報とともに帳票角座標と文字領域座標をフォーマットに保存する(S104)。
<Operation>
(A) Format Registration FIG. 11A is a flowchart at the time of registration in an optical character recognition system using a non-contact scanner. First, the
(b)読取時
図11(b)は、非接触スキャナを用いた光学式文字認識システムにおける読取時のフローチャートである。まず、画像取得部101bにて、マット部101a上に置かれた読取帳票の読取りを行い、取得画像を画像メモリ102bに取り込む(S201)。続いて、帳票角検出部102cにて、画像メモリ102bを参照して、画像上の帳票角を4点検出する(S202)。続いて、フォーマット読込部102eにて、当該帳票の種別に対応するフォーマット(登録画像の帳票角座標と文字領域座標)を読取り(S203)。続いて、文字領域補正部102fの文字領域位置補正部102f2にて、登録画像の帳票角座標・文字領域座標、読取画像の帳票角座標から、帳票角座標の左上端座標により、文字領域を補正する(S204)。続いて、文字認識部102gにて、文字を認識し(S205)、WS103のCRTに文字認識結果を表示する(S206)。なお、文字認識結果とともに、当該文字領域を切り出したイメージを確認イメージとして表示し、文字認識結果の確認に用いることが良く行われている。
(B) Reading time FIG. 11B is a flowchart at the time of reading in the optical character recognition system using the non-contact scanner. First, the
なお、当該帳票の種別の特定は、当該帳票画像から抽出した識別情報と前記フォーマットに登録されている識別情報とを比較し、一致するフォーマットを選択することによって行う。識別情報としては、シートIDや罫線特徴情報等が用いられる。
非接触型スキャナは前記のとおり、マット部に置かれた帳票を上方からカメラによって撮影することにより画像取得する構造である為、マットから帳票が浮き上がった状態で画像取得した場合に、帳票自体は歪んでいなくとも、画像上で帳票の歪みが生じる。 As described above, the non-contact scanner has a structure in which an image is acquired by photographing a form placed on the mat portion with a camera from above, so when the image is acquired with the form raised from the mat, the form itself is Even if it is not distorted, the form is distorted on the image.
図12(b)は、帳票の左上角が浮き上がった状態で画像取得した場合の帳票の歪みを、強調して表現したものである。このような場合、帳票の文字領域の基準となる角の部分が左上方に伸びたようにずれてしまっているために、文字認識を行った際、文字領域を図のように左上方に誤って補正してしまう。帳票上のすべての文字領域位置はひとつの帳票の角を基準点として位置が定まるため、他の文字領域についても一様にずれてしまう。このため、文字認識結果が誤読になったり、空白になったり、文字領域から実際の記入文字が外れることにより桁落ちしたりする等の影響が帳票全体で生じることになる。そのような場合、文字領域の確認イメージもまたずれて切り出されるので、修正がしづらいばかりでなく、桁落ちにも気づきづらいことになる。例えば、図12(b)の右下部分の文字領域は、基準となる角がずれたために、実際の記入位置から完全に外れてしまっている。このような場合には、実際には記入があるにもかかわらず空白とみなされてしまうことが生じる。このような場合、金融取引上の事故が発生する可能性がある。
このため、単純にはそのような歪みを検出した場合には当該帳票をリジェクトして歪みの原因を取り除かせて、再度同様な操作を行わせるようにすれば安全である。
FIG. 12B expresses the form distortion when the image is acquired with the upper left corner of the form raised. In such a case, since the corner of the character area of the form is shifted so that it extends to the upper left, when character recognition is performed, the character area is erroneously moved to the upper left as shown in the figure. Will correct. Since all character area positions on the form are determined with reference to the corner of one form, the other character areas are also shifted uniformly. For this reason, the entire form has an influence such as misreading of the character recognition result, blanking, or dropping of digits due to an actual entry character being out of the character area. In such a case, the confirmation image of the character area is also cut out in a shifted manner, so that it is not only difficult to correct, but also difficult to notice digit loss. For example, the character area in the lower right part of FIG. 12B is completely deviated from the actual entry position because the reference corner is shifted. In such a case, it may be regarded as blank even though there is actually an entry. In such cases, financial transaction accidents may occur.
For this reason, when such distortion is detected, it is safe to reject the cause of the form to remove the cause of the distortion and perform the same operation again.
ところで、図12(b)の右下部分は実際にはほとんど歪んでおらず、左上部分の歪みによって文字領域がずれてしまうものである。このような場合は、左上以外の部分については、文字認識を行うようにすれば効率的である。たとえば、左上部分には記入者への説明書きが印刷等されており、それ以外の部分に文字認識の領域があるような場合は、左上部分は文字認識を行わない部分なのであるから、左上部分のゆがみによって再度同じ操作を要求されるのでは、作業の効率が悪い。
従って、このような状態の帳票画像が取得された場合には、帳票の歪みの少ない部分については、文字認識を行うようにするのが効率的である。
By the way, the lower right portion of FIG. 12B is actually hardly distorted, and the character region is shifted due to the distortion of the upper left portion. In such a case, it is efficient to perform character recognition for the portions other than the upper left. For example, if an explanatory note to the writer is printed in the upper left part and there is a character recognition area in other parts, the upper left part is a part that does not perform character recognition. If the same operation is requested again due to distortion, the work efficiency is poor.
Therefore, when a form image in such a state is acquired, it is efficient to perform character recognition on a part with less distortion of the form.
このような課題を解決するために、本発明の文字認識装置は以下の構成を備える。
<構成1>
帳票の画像を取得して、当該画像上の帳票部分の外形の歪みに応じて文字認識を行う文字認識装置であって、前記帳票部分の外形の歪み特徴を抽出する歪み特徴抽出部と、歪みパターンを帳票の部分ごとの歪みの大小に応じて分類した帳票歪み特徴DBと、前記抽出した帳票部分の歪み特徴を元に該当する歪みパターンを選択する歪み識別部と、選択された歪みパターンに応じて文字認識を行う文字認識部を備えた。
<構成2>
前記文字認識部は選択された歪みパターンにより歪みの小さな部分について文字認識を行う。
<構成3>
前記文字認識部は歪みのパターンにより文字領域座標補正方法を選択す。
<構成4>
前記帳票部分の辺を分割した辺分割点を求める辺分割部を備え、前記歪み特徴抽出部は、各対向する辺の辺分割点を所定の対応条件によって結び、各線分の交点における線分同士の角度を歪み特徴として抽出する。
<構成5>
前記帳票部分の角を検出する角検出部を備え、前記辺分割部は、前記検出した角を結ぶ線をそれぞれ分割した点を求め、求めた点を前記帳票部分の辺に対応させることによって辺を分割する。
<構成6>
前記辺分割部は、前記分割を所定数で等分に分割する。
<構成7>
前記辺分割部は、角に近い部分の前記分割の間隔を短くする。
<構成8>
前記分割の間隔は、等分割した場合の分割点の位置を三角関数によって写像して決定する。
<構成9>
前記帳票歪み特徴DBには帳票の種別ごとの歪みパターンを帳票の種別ごとの識別情報に関連付けて予め記憶し、前記歪み識別部は、前記抽出した歪み特徴を前記識別情報を元に帳票歪み特徴DBの歪みパターンと比較することによって前記歪みパターンを選択する。
<構成10>
上記の文字認識装置を備えた、金融営業店端末。
In order to solve such a problem, the character recognition device of the present invention has the following configuration.
<
A character recognition device that acquires an image of a form and performs character recognition in accordance with the distortion of the outline of the form part on the image, a distortion feature extraction unit that extracts the distortion characteristic of the outline of the form part, and a distortion A form distortion feature DB that classifies patterns according to the size of distortion for each part of the form, a distortion identification unit that selects a corresponding distortion pattern based on the distortion characteristics of the extracted form part, and a selected distortion pattern A character recognition unit that performs character recognition accordingly is provided.
<
The character recognition unit performs character recognition on a portion with a small distortion according to the selected distortion pattern.
<
The character recognition unit selects a character region coordinate correction method according to a distortion pattern.
<
An edge dividing unit that obtains an edge dividing point obtained by dividing an edge of the form part, and the distortion feature extracting unit connects the edge dividing points of the opposing sides according to a predetermined correspondence condition, and the line segments at the intersection of each line segment Are extracted as distortion features.
<
A corner detection unit that detects a corner of the form part, wherein the side division unit obtains points obtained by dividing the lines connecting the detected corners, and associates the obtained points with the sides of the form part to obtain sides; Split.
<
The side dividing unit divides the division equally into a predetermined number.
<
The side dividing portion shortens the interval of the division in a portion close to a corner.
<
The interval of the division is determined by mapping the position of the division point when equally divided by a trigonometric function.
<Configuration 9>
In the form distortion feature DB, a distortion pattern for each form type is stored in advance in association with identification information for each form type, and the distortion identifying unit stores the extracted distortion feature on the basis of the identification information. The distortion pattern is selected by comparing with the DB distortion pattern.
<
A financial branch terminal equipped with the above character recognition device.
取得した画像上の帳票の外形情報から帳票歪み特徴を測定して、登録されているひずみパターンと比較することにより帳票の歪みのパターンを識別し、歪みの少ない部分について文字認識を行うことができる。 By measuring the form distortion characteristics from the outline information of the form on the acquired image and comparing it with the registered distortion pattern, you can identify the distortion pattern of the form and perform character recognition on the part with less distortion .
本発明の実施例について、以下のとおり説明する。 Examples of the present invention will be described as follows.
<実施例1の構成>
本システムの概観を図2に示す。
本システムは、非接触スキャナ装置201、光学式文字認識装置202、WS203から構成され、WS203はキーボード等の入力手段とCRT等の表示手段を備える。以下、従来のシステムと同じ部分については、説明を省略する。
<Configuration of Example 1>
An overview of this system is shown in FIG.
This system includes a
<非接触スキャナ装置の構成>
非接触スキャナ装置201の構成は、従来のシステムと同様である。
<Configuration of non-contact scanner device>
The configuration of the
<光学式文字認識装置の構成>
光学式文字認識装置202の内部構成は、図1に示すように、制御部202a、画像メモリ202b、帳票角検出部202c、フォーマット作成部202d、フォーマット読取部202e、文字領域補正部202f、文字認識部202g、辺分割部202h、帳票歪み特徴抽出部202i、帳票歪み識別部202j、帳票歪み特徴DB作成部202k、帳票歪み特徴DB読取部202l、帳票歪み特徴DB202m、許容帳票歪み特徴DB202n、から構成される。
<Configuration of optical character recognition device>
As shown in FIG. 1, the internal configuration of the optical
制御部202a、画像メモリ202b、帳票角検出部202c、文字認識部202g、は従来と同じものであるので説明を省略する。
Since the
フォーマット作成部202dは、従来のシステムの構成に対して、さらに歪み判定の基準となる基準歪み特徴情報を登録するための歪み特徴登録部202d4を備えている。フォーマット作成部202dについては、後述する。
The
フォーマット読取部202eは、従来のシステムと同様にフォーマット記憶部の内容を読取る機能を提供する処理部であるが、本実施例に置いては、さらにフォーマット記憶部に登録されている基準歪み特徴を読み取り、出力する機能を持つ。
The
文字領域補正部202fは、従来のシステムと異なる点は、帳票を左上、右上、右下、左下の4つの部分に分割し、それぞれの部分に含まれる文字領域を補正するための、左上端補正部、右上端補正部、右下端補正部、左下端補正部で構成される点である。
すなわち、左上端補正部は、左上の帳票端座標から文字領域を補正する手段を有する。右上端補正部は、右上の帳票端座標から文字領域を補正する手段を有する。右下端補正部は、右下の帳票端座標から文字領域を補正する手段を有する。左下端補正部は、左下の帳票端座標から文字領域を補正する手段を有する。
The character
That is, the upper left end correction unit has means for correcting the character region from the upper left form end coordinate. The upper right edge correction unit includes means for correcting the character area from the upper right form edge coordinates. The lower right end correction unit has means for correcting the character area from the lower right form edge coordinates. The lower left end correction unit has means for correcting the character area from the lower left form edge coordinates.
帳票歪み識別部202jは、フォーマット読取部202eを用いてフォーマット記憶部から基準歪み特徴情報を取得し、帳票歪み特徴抽出部202iによって抽出される歪み特徴情報と比較することにより、帳票の歪みを判定し、後述の帳票歪み特徴DB202mを参照して想定する歪みパターンから該当するものを選択するとともに、後述の許容帳票歪み特徴DB202nを参照して、当該帳票において許容される歪みパターンかどうかを判定する機能を提供する。
The form distortion identification unit 202j uses the
辺分割部202hは、帳票部分の各辺を所定の条件で分割し歪み特徴を抽出する基準となる辺分割点を求める機能を提供する。辺分割部202hについては、後述する。
The
帳票歪み特徴抽出部202iは、画像から帳票の歪み特徴を抽出する機能を提供する。帳票歪み特徴抽出部202iについては、後述する。 The form distortion feature extraction unit 202i provides a function of extracting a form distortion feature from an image. The form distortion feature extraction unit 202i will be described later.
<歪み特徴情報>
ここで、本実施例における歪み特徴情報について説明する。
図5(a)は、歪み情報の基準となる帳票画像の帳票部分について歪み特徴を抽出した様子である。なお、図12(a)(b)と比べ網点の濃度が異なっているが、文字を見やすくためであり、濃度の違いに特に意味はない。
<Distortion feature information>
Here, the distortion feature information in the present embodiment will be described.
FIG. 5A shows a state in which distortion features are extracted from a form portion of a form image that is a basis for distortion information. Note that the density of the halftone dots is different from that in FIGS. 12 (a) and 12 (b), but this is for easy viewing of the characters, and the difference in density has no particular meaning.
図5(a)において、各記号は以下の意味を持つ。
Te:帳票部分の上辺の横幅
Be:帳票部分の下辺の横幅
Le:帳票部分の左辺の縦幅
Re:帳票部分の右辺の縦幅
n:上辺および下辺の分割数
m:左辺および右辺の分割数
Vex (x=1,2…n):上辺および下辺の対向する辺分割点を結んだ線分
Hey (y=1,2…m):左辺および右辺の対向する辺分割点を結んだ線分
θeyx(y=1,2…m)(x=1,2…n):VexおよびHeyの交点の角度
なお、それぞれの抽出方法は、後述する。
In FIG. 5A, each symbol has the following meaning.
Te: Width of the upper side of the form part Be: Width of the lower side of the form part Le: Vertical width of the left side of the form part Re: Vertical width of the right side of the form part n: Number of divisions of the upper side and lower side m: Number of divisions of the left side and right side Vex (x = 1, 2,... N): Line segment connecting the upper side and lower side opposing side division points Hey (y = 1, 2,... M): Line segment connecting the left side and right side opposing side division points θeyx (y = 1, 2,... m) (x = 1, 2,... n): Angle of intersection of Vex and Hey Each extraction method will be described later.
本実施例では、1枚の基準帳票を用いて、θeyxを歪み特徴情報として抽出し、共通の基準歪み特徴情報としてフォーマット記憶部に記憶する。 In the present embodiment, θeyx is extracted as distortion feature information using one reference form, and is stored in the format storage unit as common reference distortion feature information.
図5(b)は、判定対象となるとなる帳票画像の帳票部分について図5(a)と同じ処理で歪み特徴を抽出した様子である。
図5(b)は、帳票の左角が浮き上がった状態で画像取得した場合の帳票の歪みを、強調して記載したものである。記号の意味は、eがrに変化しただけで、図5(a)と同じである。
FIG. 5B shows a state in which distortion features are extracted from the form portion of the form image to be determined by the same process as in FIG.
FIG. 5B emphasizes and describes the distortion of the form when an image is acquired with the left corner of the form raised. The meaning of the symbol is the same as that in FIG. 5A, only that e is changed to r.
<フォーマット作成部>
フォーマット作成部202eの内部構成は、図3に示すように、制御部202d1、フォーマット保存部202d2、文字領域座標設定部202d3、歪み特徴登録部202d4で構成される。また、他の処理部との図示しない通信処理部を有する。
<Format creation section>
As shown in FIG. 3, the internal configuration of the
ここでは、従来システムに対して追加された、歪み特徴登録部202d4について説明する。 Here, the distortion feature registration unit 202d4 added to the conventional system will be described.
歪み特徴登録部202d4は、基準とする帳票の帳票画像の帳票部分について抽出された歪み特徴情報を、フォーマット記憶部に登録する機能を提供する。例えば、オペレータがWS103を介してフォーマット作成部に開始指示を行うことにより、歪み特徴情報の抽出からフォーマット記憶部への登録までの一連の処理が行われる。
The distortion feature registration unit 202d4 provides a function of registering, in the format storage unit, distortion feature information extracted for the form portion of the form image of the reference form. For example, when an operator gives a start instruction to the format creation unit via the
なお、前記フォーマットは事前に登録されていれば良く、運用時には、事前にフォーマット記憶部に登録されたフォーマットが参照可能であれば足りる。従って、運用時にはフォーマット作成部202dは省略することが可能である。
The format only needs to be registered in advance, and it is sufficient that the format registered in the format storage unit can be referred to during operation. Therefore, the
また、文字認識領域が左上、右上、左下、右下のどこにあるかの情報に従って、許容しうる歪みの発生領域を登録する。これは、文字認識領域の存在する位置によって自動的に行ってもよいし、オペレータに指定させてもよい。この情報は、図4のように許容帳票歪み特徴DB202nに登録される。
Also, an allowable distortion generation area is registered according to information on where the character recognition area is located in the upper left, upper right, lower left, and lower right. This may be performed automatically depending on the position where the character recognition area exists, or may be specified by an operator. This information is registered in the allowable form
<辺分割部>
辺分割部202hは、帳票部分の辺の分割を行う機能を提供する。
以下に、辺分割部202hにより、辺を分割する際の処理を説明する。
<Side division part>
The
Hereinafter, processing when the side is divided by the
まず、角検出部202cにより、従来システムと同様にして前記帳票部分の角が検出される。
辺分割部202hは、検出した角を結ぶ線分を求める。続いて、求めた線分をそれぞれ所定の数で等間隔に分割する。なお、この所定の数とは、図5(a)(b)におけるn、mであり、分割点の数は入力される帳票のサイズによらず一定になる。続いて、前記分割点より、例えば上辺および下辺であればY軸方向に(左辺および右辺であればx軸方向に)画素を走査して、背景色と帳票部分の濃度が変化する点を抽出することにより、前記線分の分割点に対応する各帳票辺の辺分割点を抽出することができる。
First, the corner of the form portion is detected by the
The
<帳票歪み特徴抽出部>
帳票歪み特徴抽出部202iは、辺分割部202hによって得られた辺分割点について、図のように対向するもの同士を結んだ線分を求める。これらの線分は、図5(a)(b)におけるVex、Hey、Vrx、Hryのようになる。続いて、各交点の角度θeyxを求め、特徴として出力する。
<Form distortion feature extraction unit>
The form distortion feature extraction unit 202i obtains a line segment that connects the opposing points as shown in the drawing with respect to the side division points obtained by the
なお、帳票歪みの有無の評価は、以下のようにして行う。例えば角度を評価する場合の式は以下のとおりである。
[帳票歪み評価値]
θyx = | θeyx _ θryx | (y=1,2…m)(x=1,2…n)
[帳票歪み評価値の閾値]
θyxの閾値: θTHr
Note that the presence / absence of form distortion is evaluated as follows. For example, the equation for evaluating the angle is as follows.
[Form distortion evaluation value]
θyx = | θeyx_θryx | (y = 1, 2... m) (x = 1, 2... n)
[Threshold of form distortion evaluation value]
The threshold value of θyx: θTHr
<帳票歪み特徴DB>
想定する歪みパターンの例を、図14に示す。網掛け部が歪みが発生している部分、すなわち所定の閾値を超過している部分であり、歪みが大きい部分である。網掛けがない部分が、歪みが発生していないか発生していても歪みが小さい部分、すなわち所定の閾値以下の部分である。
<Form distortion feature DB>
An example of the assumed distortion pattern is shown in FIG. The shaded portion is a portion where distortion occurs, that is, a portion where a predetermined threshold is exceeded, and a portion where distortion is large. A portion without shading is a portion where distortion is small or not generated, that is, a portion having a predetermined threshold value or less.
帳票歪み特徴DB202mは、図14に示した想定する歪みパターンに応じた帳票歪み特徴として、図13に示すように、各歪みパターンの名称、コード、歪みパターン条件を格納したものである。歪みパターン条件は、例えば、「左上角浮き上がり」の場合、前述のθeyxのうち、左上部分のみが閾値超過している場合が該当する。例えば、すべてのθeyxのうち、θe11〜θe33の9つの点についてのみ閾値超過している場合に、左上角浮き上がり(歪みパターンコード=A)であると判定できる。
また例えば、「左辺&右辺浮き上がり」の場合、前述のVexのうち、両端部分のみが他より長く、その割合が所定の閾値を超過している場合が該当する。例えば、すべてのVexの長さの平均と比べ、Ve1、Venの2本のみ閾値超過して長い場合に、「左辺&右辺浮き上がり」(歪みパターンコード=U)であると判定できる。
歪みパターン条件は、このように浮き上がり方と前述のVex、Hey、θeyxとの関係が記載されている。なお、実際には表中の文が論理式にて表現され記録されている。
The form
Further, for example, in the case of “left side & right side floating”, only the both end portions of Vex described above are longer than the other, and the ratio exceeds a predetermined threshold value. For example, when only two of Ve1 and Ven exceed the average of the lengths of Vex and are longer than the threshold, it is possible to determine that “left side & right side floating” (distortion pattern code = U).
The distortion pattern condition describes the relationship between how to float and the above-described Vex, Hey, and θeyx. Actually, the sentences in the table are expressed and recorded as logical expressions.
また、左上端補正部、右上端補正部、右下端補正部、左下端補正部のいずれの補正部が使用可能か情報が含まれている。例えば、図13の場合は、「左上角浮き上がり」の場合は左上端補正部のみ使用不可であり、それ以外は使用可能となっている。また、「左辺&右辺浮き上がり」の場合は、すべての角において歪みが発生すると考えられるので、すべての補正部が使用不可となっている。
帳票ゆがみ特徴DBは、後述のようにして帳票歪み特徴DB作成部202kにより登録される。
In addition, information on which one of the upper left correction unit, the upper right correction unit, the lower right correction unit, and the lower left correction unit can be used is included. For example, in the case of FIG. 13, in the case of “lifting the upper left corner”, only the upper left end correction unit is unusable, and the rest is usable. Further, in the case of “left side & right side floating”, it is considered that distortion occurs at all corners, so that all the correction units cannot be used.
The form distortion feature DB is registered by the form distortion feature
<許容帳票歪み特徴DB>
許容帳票歪み特徴DB202nは、処理対象としてフォーマットを登録している各帳票に対して、それぞれ許容する歪みパターンの歪みパターンコードを登録したテーブルである。図4の例では、帳票001(帳票ID=001)が許容する帳票歪みパターンがA(左上角浮き上がり)であることが分かる。例えば、左上部分には記入者への説明書きが印刷等されており、それ以外の部分に文字認識の領域があるような帳票の場合が相当する。
<Allowable form distortion feature DB>
The allowable form
<帳票歪み特徴DB作成部>
帳票歪み特徴DB作成部202kは、前記帳票歪み特徴DBを202nを登録するための処理部である。具体的には、図14のような想定する帳票歪みパターンに相当する画像を故意に作成して読み込ませ、帳票歪みパターンごとの帳票歪み特徴を生成し、登録する。また、それぞれの帳票歪みパターンにおいて、歪みの発生度合いに応じて、左上端補正部、右上端補正部、右下端補正部、左下端補正部のいずれの補正部が使用可能かの情報が設定される。例えば、左上の領域について歪みが所定の閾値未満であれば、左上端補正部を使用可とする。それ以外の領域についても同様である。なお、すべての領域についてゆがみが所定の閾値以上であれば、すべての補正部が使用不可となる場合もありうる。
<Form distortion feature DB creation section>
The form distortion feature
<実施例1の動作>
(a)フォーマット作成時
図15(a)は、非接触スキャナを用いた光学式文字認識システムにおける前記基準歪み特徴情報の登録時のフローチャートである。まず、画像取得部201bにて、マット部201a上に置かれた基準となる登録帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S301)。ここで、基準帳票の画像は、歪みの無い状態で取得する必要があるため、浮き上がりや折れ曲がりが無い状態で置く必要がある。これを標準状態または基準状態と呼ぶ。
<Operation of Example 1>
(A) Format Creation FIG. 15A is a flowchart at the time of registration of the reference distortion feature information in the optical character recognition system using a non-contact scanner. First, the
続いて、帳票角検出部202cにて、帳票画像上の帳票角を4点検出する(S302)。
Subsequently, the form
続いて、辺分割部202hにより、帳票部分の辺を分割し、辺分割点を求める(S303)。
Subsequently, the
続いて、帳票特徴抽出部202iにて、基準帳票画像の歪み特徴情報を抽出する(S304)。 Subsequently, the form feature extraction unit 202i extracts distortion feature information of the reference form image (S304).
続いて、歪み特徴登録部202d4にて、抽出した歪み特徴情報を基準歪み特徴情報としてフォーマット記憶部に登録する。(S305)。 Subsequently, the distortion feature registration unit 202d4 registers the extracted distortion feature information in the format storage unit as reference distortion feature information. (S305).
なお、標準状態で取得した基準歪み特徴情報に含まれる角度は、すべてほぼ90度となると考えられるので、上記のように標準状態での歪み特徴を取得せずにすべての角度を90度とする歪み特徴情報を生成して登録することも可能である。ただし、上記のように標準状態での歪み特徴を取得して実際に歪み特徴情報を抽出すれば、カメラのレンズ等の特性により標準状態でも歪みが発生する場合の影響を排除することができるので、精度を向上させることができる。 Note that all the angles included in the reference distortion feature information acquired in the standard state are considered to be approximately 90 degrees, so that all the angles are set to 90 degrees without acquiring the distortion characteristics in the standard state as described above. It is also possible to generate and register distortion feature information. However, if the distortion feature information in the standard state is acquired and the distortion feature information is actually extracted as described above, it is possible to eliminate the effects of distortion occurring in the standard state due to the characteristics of the camera lens and the like. , Accuracy can be improved.
さらに、オペレータは取得した基準帳票画像を元に帳票毎の文字認識領域を指定し、フォーマットに登録する。指定した文字認識領域の情報は、基準となる角の座標情報とともに、基準角からの相対座標および領域サイズの情報が座標情報として従来どおりに登録される。しかる後に、フォーマットが保存される。(S306) Further, the operator designates a character recognition area for each form based on the acquired reference form image and registers it in the format. As for the information of the designated character recognition area, information on the relative coordinates from the reference angle and information on the area size are registered as coordinate information as well as the coordinate information of the reference corner. After that, the format is saved. (S306)
(b) 帳票歪み特徴DB作成時
図15(b)は、非接触スキャナを用いた光学式文字認識システムにおける前記帳票歪み特徴DB作成時のフローチャートである。本実施例において、帳票歪み特徴DBはすべてのフォーマットについて共通であることを想定する。このため、帳票歪み特徴DB作成は、前記図15(a)の、フォーマット作成の前に、前記基準歪み特徴情報の登録に用いた帳票をによって行うことが望ましい。
(B) When creating a form distortion feature DB FIG. 15B is a flowchart when creating the form distortion feature DB in the optical character recognition system using a non-contact scanner. In this embodiment, it is assumed that the form distortion feature DB is common to all formats. For this reason, it is desirable to create the form distortion feature DB by using the form used for registering the reference distortion feature information before the format creation shown in FIG.
まず、マット部201a上に浮き上がりの有る状態で、帳票を置く。画像取得部201bにて、マット部201a上に置かれた登録帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S307)。
First, a form is placed on the
続いて、帳票角検出部202cにて、帳票画像上の帳票角を4点検出する(S308)。
Subsequently, the form
続いて、帳票特徴抽出部202iにて、帳票画像の歪み特徴情報を抽出する(1309)。 Subsequently, the form feature extraction unit 202i extracts the distortion feature information of the form image (1309).
続いて、帳票歪み特徴DB作成部202kにて、帳票歪み特徴を学習し、帳票歪み特徴DBを作成する(S310)。
Subsequently, the form distortion feature
S307〜S310の作業を、想定する帳票歪みパターン(例を図14に示す)全てについて行う。(S311) The operations of S307 to S310 are performed for all assumed form distortion patterns (examples are shown in FIG. 14). (S311)
(c)読取時
図16は、非接触スキャナを用いた光学式文字認識システムにおける読取時のフローチャートである。まず、画像取得部201bにて、マット部201a上に置かれた読取帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S401)。
(C) Reading time FIG. 16 is a flowchart at the time of reading in the optical character recognition system using the non-contact scanner. First, the
続いて、帳票角検出部202cにて、画像メモリ202bを参照して、画像上の帳票角を4点検出する(S402)。
Subsequently, the form
続いて、辺分割部202hにより、帳票部分の辺を分割し、辺分割点を求める(S403)。
Subsequently, the
続いて、帳票歪み特徴抽出部202iにて、画像の帳票部分の帳票歪み特徴を抽出する(S404)。 Subsequently, the form distortion feature extraction unit 202i extracts the form distortion feature of the form part of the image (S404).
続いて、フォーマット読取部202eは、フォーマット記憶部から基準歪み特徴情報を取得する。(S405)
Subsequently, the
続いて、帳票歪み識別部202jにて、下記に示す帳票歪み評価値を計算し、あらかじめ設定されているそれぞれの閾値(θTHr)と比較することにより帳票歪み特徴を検出する。このとき、また、帳票歪み特徴DB読取部202lにより、帳票歪み特徴DB202mを参照して、該当する帳票歪みパターンが存在すれば、識別結果として帳票歪みパターンコードを出力する。該当する帳票歪みパターンが見つからなければ、識別失敗の旨を出力する。(S406)
Subsequently, the form distortion identification unit 202j calculates a form distortion evaluation value shown below, and compares it with each preset threshold (θTHr) to detect a form distortion feature. At this time, the form distortion feature DB reading unit 202l refers to the form
帳票歪み特長の識別に失敗した場合は(S407)、WS203のCRTに“歪み検出失敗”と表示し(S408)、さらにWS203のCRTに“帳票リジェクト”と表示する(S409) If identification of the form distortion feature has failed (S407), “distortion detection failure” is displayed on the CRT of the WS 203 (S408), and “form reject” is further displayed on the CRT of the WS 203 (S409).
識別が成功の場合において、識別結果が歪み無しの場合は(S410)、フォーマット読取部202eにて、当該帳票の基準角の座標情報と文字認識領域の座標情報が読み取られる。(S411)。
続いて、従来同様に、基準となる角の座標(たとえば左上端座標)により、文字領域を補正する(S412)。続いて、文字認識部202gにて、文字を認識し(S413)、WS203のCRTに文字認識結果を表示する(S414)。
When the identification is successful and the identification result is not distorted (S410), the
Subsequently, as in the prior art, the character area is corrected using the reference corner coordinates (for example, the upper left corner coordinates) (S412). Subsequently, the
識別結果が補正可能歪み特徴パタンの場合は、フォーマット読込部1006にて、フォーマット読取部202eにて、当該帳票の基準角の座標情報と文字認識領域の座標情報が読み取られる。(S415)。続いて、識別結果に応じて、文字領域補正部202fの左上端補正部、右上端補正部、右下端補正部、左下端補正部を適宜使用して、登録画像の帳票角座標・文字領域座標、読取画像の帳票角座標から、文字領域を補正する(S416)。
When the identification result is a correctable distortion feature pattern, the format reading unit 1006 reads the coordinate information of the reference angle of the form and the coordinate information of the character recognition area by the
例えば、識別結果が左上角浮き上がりの場合の補正の場合の例を図17に示す。
図に示すとおり、左上角近辺の文字領域は、補正不可能の為、左上近辺の文字領域をリジェクトとする。すなわち、文字認識結果を不読とする。左上角から遠い文字領域は、左上角以外の角座標から文字領域を補正する。すなわち、帳票を左上、右上、右下、左下の4つの部分に分割し、それぞれ前述の左上端補正部、右上端補正部、右下端補正部、左下端補正部にて補正する。
続いて、リジェクトではない文字領域において、文字認識部202gにて文字を認識し(S417)、WS203のCRTに文字認識結果を表示する(S418)。続いて、WS203のCRTに帳票歪み識別結果を表示する(S419)。識別結果が補正不可能歪み特徴パタンの場合は(S410)、WS203のCRTに帳票歪み識別結果を表示し(S420)、WS203のCRTに“帳票リジェクト”と表示する(S409)。
For example, FIG. 17 shows an example of correction in the case where the identification result is a lift in the upper left corner.
As shown in the figure, since the character area near the upper left corner cannot be corrected, the character area near the upper left corner is rejected. That is, the character recognition result is unread. For a character region far from the upper left corner, the character region is corrected from angular coordinates other than the upper left corner. That is, the form is divided into four parts, upper left, upper right, lower right, and lower left, and corrected by the above-described upper left end correction unit, upper right end correction unit, right lower end correction unit, and left lower end correction unit, respectively.
Subsequently, in the character area that is not rejected, the
このように、基準帳票画像の各辺を所定の値で分割して辺分割点を求め、それぞれを結ぶ線分の交点の角度を基準歪み特徴とし、歪判定の際には、判定対象となる帳票画像の各辺を基準帳票と同様に分割し、同じくそれぞれを結ぶ線分の交点の角度を歪み特徴とし、前記基準歪み特徴と比較することによって、帳票の画像上の歪みを識別し、文字認識可能な領域については文字認識を行うとともに帳票歪みの識別結果を表示するので、オペレータに対して警告ができ、文字領域のずれによる金融取引の事故の発生を防止し、オペレータにとっても確認の負荷が減少するという、効果を得ることができる。 In this way, each side of the reference form image is divided by a predetermined value to obtain a side division point, and the angle of the intersection of the line segments connecting the respective sides is set as a reference distortion feature, which is a determination target when determining distortion. Each side of the form image is divided in the same way as the standard form, and the angle of the intersection of the line segments that connect the same is used as the distortion feature. By comparing with the standard distortion feature, the distortion on the form image is identified, and the character Character recognition is performed on the recognizable area and the result of identification of the form distortion is displayed, so that the operator can be warned, the occurrence of financial transaction accidents due to misalignment of the character area can be prevented, and the burden of confirmation also for the operator It is possible to obtain an effect that decreases.
また、想定する帳票の歪みについて、実際に当該歪みを発生させた画像を読み取って自動的に帳票歪みDBを作成するので、オペレータの登録作業の不可を軽減できる。 Further, regarding the assumed form distortion, the form distortion DB is automatically created by reading the image in which the distortion is actually generated, so that it is possible to reduce the impossibility of the operator's registration work.
また、前記辺分割点同士を結んだ線分の交点の角度のみを特徴とすることにより、非判定帳票が基準帳票と異なるサイズであっても同じ数の交点を得ることができるので、基準歪特徴データは共通のものを使用できるので、登録は1回のみでよく、新規な帳票を含めて画像の歪みの判定を行うことができる。 In addition, since only the angle of the intersection of the line segments connecting the side division points is characterized, the same number of intersections can be obtained even if the non-decision form is different in size from the reference form. Since common feature data can be used, registration is required only once, and image distortion including new forms can be determined.
実施例1においては、対応する辺分割点同士を結んだ線分の交点の角度のみを歪み特徴とするとしたが、本実施例においては、前記線分の長さについても歪み特徴情報として用いる。このため、基準歪み特徴は帳票の種別毎に異なるものとなるので、基準歪み特徴情報はおよび各帳票のフォーマット毎に登録されることになる。また、帳票歪み特徴DBについても、帳票毎の情報として登録されることになる。 In the first embodiment, only the angle of the intersection of the line segments connecting the corresponding edge division points is used as the distortion feature. However, in this embodiment, the length of the line segment is also used as the distortion feature information. For this reason, since the reference distortion feature differs for each type of form, the reference distortion feature information is registered for each format of each form. The form distortion feature DB is also registered as information for each form.
<実施例2の構成>
本実施零におけるシステムの構成は、実施例1と同じく図2で示される。以下、実施例1と異なる部分についてのみ説明する。
<Configuration of Example 2>
The system configuration in the present embodiment zero is shown in FIG. Only the parts different from the first embodiment will be described below.
<光学式文字認識装置の構成>
光学式文字認識装置202の内部構成は、実施例1と同じく図1に示される。
制御部202a、画像メモリ202b、帳票角検出部202c、文字領域補正部202f、文字認識部202g、は従来と同じものであるので説明を省略する。
<Configuration of optical character recognition device>
The internal configuration of the optical
Since the
フォーマット読取部202eは、本実施例においては、基準歪み特徴を、フォーマット毎に取得する機能を有する。
In the present embodiment, the
帳票歪み特徴抽出部202iは、画像から帳票の歪み特徴を抽出する機能を提供するのは実施例1と同様であるが、各辺分割点を結ぶ線分の交点の角度に加えて、前記線分の長さについても、特徴情報として抽出する。帳票歪み特徴抽出部202iについては、後述する。 The form distortion feature extraction unit 202i provides a function of extracting a form distortion characteristic from an image in the same manner as in the first embodiment, but in addition to the angle of the intersection of the line segments connecting the side division points, The length of the minutes is also extracted as feature information. The form distortion feature extraction unit 202i will be described later.
<歪み特徴情報>
ここで、本実施例における歪み特徴情報について説明する。
図5(a)は、歪み情報の基準となる帳票画像の帳票部分について歪み特徴を抽出した様子である。各記号の意味は実施例1と同様である。
<Distortion feature information>
Here, the distortion feature information in the present embodiment will be described.
FIG. 5A shows a state in which distortion features are extracted from a form portion of a form image that is a basis for distortion information. The meaning of each symbol is the same as in the first embodiment.
本実施例では、1枚の基準帳票を用いて、Vex、Hey、θeyxを歪み特徴情報として抽出し、共通の基準歪み特徴情報としてフォーマットに記憶する。ここで基準歪み特徴は、実施例1と異なり、基準帳票は、フォーマットに登録されている帳票の種別毎に登録する必要がある。
図5(b)は、実施例1と同様であるので、説明を省略する。
In this embodiment, using a single reference form, Vex, Hey, and θeyx are extracted as distortion feature information and stored in the format as common reference distortion feature information. Here, unlike the first embodiment, the reference distortion feature needs to be registered for each type of form registered in the format.
Since FIG. 5B is the same as that of the first embodiment, description thereof is omitted.
<フォーマット作成部>
フォーマット作成部202eの内部構成は、実施例1と同じく図3に示される。
歪み特徴登録部202d4は、基準歪み特徴を各帳票のフォーマットに関連づけてフォーマット記憶部に格納する。このため、基準歪み特徴情報は、各帳票ごとの文字情報の登録とともに行うと効率が良い。
<Format creation section>
The internal configuration of the
The distortion feature registration unit 202d4 stores the reference distortion feature in the format storage unit in association with the format of each form. For this reason, it is efficient to perform the reference distortion feature information together with the registration of the character information for each form.
<帳票歪み特徴抽出部>
帳票歪み特徴抽出部202iは、辺分割部202hによって得られた辺分割点について、対向するもの同士を結んだ線分を求める。これらの線分は、図5(a)(b)におけるVex、Hey、Vrx、Hryのようになる。続いて、各交点の角度θeyxを求め、前記各線分の長さとともに、特徴として出力する。
<Form distortion feature extraction unit>
The form distortion feature extraction unit 202i obtains a line segment that connects opposite sides of the side division points obtained by the
<帳票歪み特徴DB作成部>
帳票歪み特徴DB作成部202kは、帳票歪み特徴DB202mを、共通ではなく各帳票の帳票ID毎に登録する。このため、基準歪み特徴情報は、各帳票ごとの文字情報の登録とともに、当該帳票を用いて行う。
<Form distortion feature DB creation section>
The form distortion feature
<実施例2の動作>
(a)フォーマット作成時
本実施例における動作は、実施例1と同じく図15(a)にて説明される。S301〜S304については、実施例1と同様なので説明を省略する。
<Operation of Example 2>
(A) At the time of format creation The operation in this embodiment will be described with reference to FIG. About S301-S304, since it is the same as that of Example 1, description is abbreviate | omitted.
S305では、歪み特徴登録部202d4にて、抽出した歪み特徴情報を基準歪み特徴情報として当該帳票のフォーマットに関連付けて登録する。 In S305, the distortion feature registration unit 202d4 registers the extracted distortion feature information as reference distortion feature information in association with the format of the form.
(b) 帳票歪み特徴DB作成時
本実施例における動作は、実施例1と同じく図15(a)にて説明される。なお、本実施例においては、帳票歪み特徴DB作成は、各帳票ごとに行われる。すなわち、図13のような表が帳票ID毎に個別に登録される。それ以外は、実施例1と同様なので説明を省略する。
(B) At the time of creating the form distortion feature DB The operation in the present embodiment will be described with reference to FIG. In the present embodiment, the form distortion feature DB is created for each form. That is, a table as shown in FIG. 13 is individually registered for each form ID. Since other than that is the same as that of Example 1, description is abbreviate | omitted.
(c)読取時
本実施例における動作は、実施例1と同じく図16にて説明される。S405、S406以外については、実施例1と同様なので説明を省略する。
(C) Reading The operation in the present embodiment will be described with reference to FIG. Since steps other than S405 and S406 are the same as those in the first embodiment, description thereof is omitted.
S405では、フォーマット読み取り部202eは、フォーマット記憶部から帳票画像の帳票の種別に対応する基準歪み特徴情報を取得する(405)。帳票の種別の特定には、既存の方法が適用されるが、例えば当該帳票のシートIDや罫線特徴等の特徴情報をフォーマットとともに登録しておき、特徴が一致するフォーマットを選択するようにしてもよい。または、WSのオペレータに対して帳票の種別の指定手段を提供し、指定された情報により帳票の種別を特定することにしても良い。
In step S405, the
S406では、帳票歪み識別部202jは下記に示す式にて帳票歪み評価値を計算する。
[帳票歪み評価値]
Vx = |Vex − Vrx| (x=1,2…n)
Hy = |Hey − Hry| (y=1,2 …m)
θyx = | θeyx − θryx | (y=1,2 …m)(x=1,2 …n)
[帳票歪み評価値の閾値]
Hxの閾値: VTHr
Hyの閾値: HTHr
θyxの閾値: θTHr
あらかじめ設定されているそれぞれの閾値(VTHr、HTHr、θTHr)と比較して帳票歪み特徴を検出する。そして、帳票歪み特徴DB読取部202lにより、当該帳票の帳票歪み特徴DB202mを参照して、該当する帳票歪みパターンが存在すれば、識別結果として帳票歪みパターンコードを出力する。該当する帳票歪みパターンが見つからなければ、識別失敗の旨を出力する。(S406)
In S406, the form distortion identification unit 202j calculates a form distortion evaluation value using the following formula.
[Form distortion evaluation value]
Vx = | Vex−Vrx | (x = 1, 2,... N)
Hy = | Hey−Hry | (y = 1, 2,... M)
θyx = | θeyx−θryx | (y = 1, 2,... m) (x = 1, 2,... n)
[Threshold of form distortion evaluation value]
Hx threshold: VTHr
Hy threshold: HTHr
The threshold value of θyx: θTHr
The form distortion feature is detected by comparing with respective threshold values (VTHr, HTHr, θTHr) set in advance. Then, the form distortion feature DB reading unit 202l refers to the form
このように、基準帳票画像の各辺を所定の値で分割して辺分割点を求め、それぞれを結ぶ線分の交点の角度と各線分の長さとを基準歪み特徴として各帳票毎に登録し、歪み判定の際には、判定対象となる帳票画像の各辺を基準帳票と同様に分割し、同じくそれぞれを結ぶ線分の交点の角度と線分の長さを歪み特徴とし、前記基準歪み特徴と比較することによって、帳票の画像上の歪みが判定できるので、実施例1に対してさらに精度よく歪みの判定を行うことができる。 In this way, each side of the reference form image is divided by a predetermined value to obtain a side division point, and the angle of the intersection of the line segment connecting the respective sides and the length of each line segment are registered for each form as a reference distortion feature. When determining distortion, each side of the form image to be determined is divided in the same manner as the reference form, and the angle of the intersection of the line segments connecting the respective lines and the length of the line segment are also distortion characteristics. Since the distortion on the image of the form can be determined by comparing with the feature, the distortion can be determined with higher accuracy than the first embodiment.
なお、上述の実施例に置いて、角を結ぶ線分を等分するとしたが、帳票の浮き上がり等による歪みは帳票の角に近い部分ほど大きくなることから、帳票の角に近い部分の分割間隔を短くし、中央すなわち角から遠い部分の分割間隔を長くすることにより、辺分割点の密度を挙げるとさらに精度良く帳票部分の歪みを検出することができる。例えば、図5(a)(b)におけるn、mに対応する分割間隔を三角関数を用いて変換することにより、角に近い部分の分割間隔を短くすることが可能である。例えば、辺の中央を起点=0とし辺の角部を終点=π/2[rad]とすれば、辺を等分した点を正弦関数によって角に近くなるほど短い間隔となるように写像できる。例えば、中央から角までを3分割する場合、中央から1/3の地点は、sin((π/2)x(1/3))=sin(π/6)=0.5により、中央から角までの半分の地点に写像される。中央から2/3の地点は、sin((π/2)x(2/3))=sin(π/3)=約0.87により、中央から角までの約0.87倍の地点に写像される。
なお、実施例1において、基準歪み特徴情報は共通なものを1回登録すればよい、としたが、実施例2のような方法によって帳票ごとに基準歪み特徴情報を登録しても構わない。例えば、カメラのレンズ等の特性により帳票のサイズによって歪み方に差異が生じるような場合には、帳票ごとに基準歪み特徴情報を登録すれば、さらに精度を上げることができる。
In the above-described embodiment, the line connecting the corners is equally divided. However, since the distortion due to the lift of the form is closer to the corner of the form, the division interval of the part near the corner of the form is larger. By shortening and increasing the division interval of the center, that is, the part far from the corner, the distortion of the form part can be detected with higher accuracy when the density of the side division points is given. For example, by dividing the division intervals corresponding to n and m in FIGS. 5A and 5B using a trigonometric function, it is possible to shorten the division interval near the corner. For example, if the center of the side is set as the starting point = 0 and the corner of the side is set as the end point = π / 2 [rad], the points obtained by equally dividing the side can be mapped with a sine function so that the intervals become shorter as the angle becomes closer. For example, when the center to the corner is divided into three, the
In the first embodiment, the common reference distortion feature information may be registered once. However, the reference distortion feature information may be registered for each form by the method as in the second embodiment. For example, when there is a difference in distortion depending on the size of the form due to the characteristics of the camera lens or the like, the accuracy can be further improved by registering the reference distortion feature information for each form.
なお、上述の実施例において、光学式文字認識装置102とスキャナ装置201とを別の構成として説明したが、スキャナと光学式文字認識装置とは1体型で構成されていてもかまわない。
また、上述したそのような光学式文字認識装置102とWS203を組み合わせることにより、帳票画像の文字認識機能を備えた端末装置として機能させることもできる。特に、WS203が金融営業店窓口端末である場合には、帳票画像の文字認識機能を備えた金融営業店窓口端末として機能させることができる。
In the above-described embodiment, the optical
Further, by combining such optical
201 スキャナ装置
201a マット部
201b 画像取得部
202 光学式文字認識装置
203 WS
202a 制御部
202b 画像メモリ
202c 帳票角検出部
202d フォーマット作成部
202e フォーマット読取部
202f 文字領域補正部
202g 文字認識部
202h 辺分割部
202i 帳票歪み特徴抽出部
202j 帳票歪み識別部
202k 帳票歪み特徴DB作成部
202l 帳票歪み特徴DB読取部
202m 帳票歪み特徴DB
202n 許容帳票歪み特徴DB
201
202n Allowable form distortion feature DB
Claims (10)
前記帳票部分の外形の歪み特徴を抽出する歪み特徴抽出部と、
歪みパターンを帳票の部分ごとの歪みの大小に応じて分類した帳票歪み特徴DBと、
前記抽出した帳票部分の歪み特徴を元に該当する歪みパターンを選択する歪み識別部と、
選択された歪みパターンに応じて文字認識を行う文字認識部を備えた、
文字認識装置。 A character recognition device that acquires an image of a form and performs character recognition in accordance with distortion of the outer shape of the form part on the image,
A distortion feature extraction unit for extracting distortion characteristics of the outer shape of the form part;
A form distortion feature DB that classifies the distortion patterns according to the degree of distortion for each part of the form;
A distortion identifying unit for selecting a corresponding distortion pattern based on the extracted distortion characteristics of the form part;
A character recognition unit that performs character recognition according to the selected distortion pattern,
Character recognition device.
請求項1に記載の文字認識装置。 The character recognition unit selects a character region coordinate correction method according to a distortion pattern;
The character recognition device according to claim 1.
前記歪み特徴抽出部は、各対向する辺の辺分割点を所定の対応条件によって結び、各線分の交点における線分同士の角度を歪み特徴として抽出する、
請求項1に記載の文字認識装置。 An edge dividing unit for obtaining an edge dividing point obtained by dividing an edge of the form part,
The distortion feature extraction unit connects side division points of the opposing sides according to a predetermined correspondence condition, and extracts an angle between line segments at the intersection of each line segment as a distortion feature.
The character recognition device according to claim 1.
前記辺分割部は、前記検出した角を結ぶ線をそれぞれ分割した点を求め、求めた点を前記帳票部分の辺に対応させることによって辺を分割する、請求項4に記載の文字認識装置。 A corner detection unit for detecting a corner of the form part;
The character recognition device according to claim 4, wherein the side dividing unit obtains points obtained by dividing the lines connecting the detected corners, and divides the sides by associating the obtained points with the sides of the form part.
前記歪み識別部は、前記抽出した歪み特徴を前記識別情報を元に帳票歪み特徴DBの歪みパターンと比較することによって前記歪みパターンを選択する、請求項1から8のいずれかに記載の文字認識装置。 In the form distortion feature DB, a distortion pattern for each form type is stored in advance in association with identification information for each form type,
The character recognition according to claim 1, wherein the distortion identification unit selects the distortion pattern by comparing the extracted distortion feature with a distortion pattern of a form distortion feature DB based on the identification information. apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005267273A JP2007079966A (en) | 2005-09-14 | 2005-09-14 | Character recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005267273A JP2007079966A (en) | 2005-09-14 | 2005-09-14 | Character recognition device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007079966A true JP2007079966A (en) | 2007-03-29 |
Family
ID=37940205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005267273A Pending JP2007079966A (en) | 2005-09-14 | 2005-09-14 | Character recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007079966A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017142635A (en) * | 2016-02-10 | 2017-08-17 | 日立オムロンターミナルソリューションズ株式会社 | Image reading device |
-
2005
- 2005-09-14 JP JP2005267273A patent/JP2007079966A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017142635A (en) * | 2016-02-10 | 2017-08-17 | 日立オムロンターミナルソリューションズ株式会社 | Image reading device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7999657B2 (en) | Image registration method for image comparison and document authentication | |
KR101292916B1 (en) | Computer-readable recording medium having image processing program recorded thereon, portable terminal, and image processing method | |
US10068150B2 (en) | Method and apparatus for OCR detection of valuable documents by means of a matrix camera | |
US20160171325A1 (en) | System for determining alignment of a user-marked document and method thereof | |
JP7444495B2 (en) | OCR-based document analysis system and method | |
JP4419269B2 (en) | Two-dimensional code extraction method | |
US20150254869A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP4594952B2 (en) | Character recognition device and character recognition method | |
CN115619656A (en) | Digital file deviation rectifying method and system | |
US7227997B2 (en) | Image recognition apparatus, image recognition method, and image recognition program | |
US20180225541A1 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP4574503B2 (en) | Image processing apparatus, image processing method, and program | |
JP3582988B2 (en) | Non-contact image reader | |
US10645256B2 (en) | Image forming apparatus and non-transitory computer-readable storage medium suitable for extracting areas in images specified by handwritten marker by line marker such as highlighter pen or the like, and electronic marker by digital pen | |
JP2007079966A (en) | Character recognition device | |
JP2006229685A (en) | Distortion determination device for business form | |
JP4167680B2 (en) | Document reading apparatus and document reading method | |
US7865130B2 (en) | Material processing apparatus, material processing method, and material processing program product | |
JP4894195B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP4009314B2 (en) | Form layout identification method and form layout identification system | |
JP2007140703A (en) | Method for reading insurance policy, system thereof, and insurance policy recognition system | |
JPH11250179A (en) | Character reocognition device and its method | |
JP4701918B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP6743401B2 (en) | Form design/read setting support device, form design/read setting support method, and optical character recognition system | |
JP2013152523A (en) | Document character difference detection device |