JP5844698B2 - Character recognition device - Google Patents

Character recognition device Download PDF

Info

Publication number
JP5844698B2
JP5844698B2 JP2012168370A JP2012168370A JP5844698B2 JP 5844698 B2 JP5844698 B2 JP 5844698B2 JP 2012168370 A JP2012168370 A JP 2012168370A JP 2012168370 A JP2012168370 A JP 2012168370A JP 5844698 B2 JP5844698 B2 JP 5844698B2
Authority
JP
Japan
Prior art keywords
image
ruled line
item
character recognition
definition information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012168370A
Other languages
Japanese (ja)
Other versions
JP2014026592A (en
Inventor
浩一 金元
浩一 金元
正典 中林
正典 中林
中村 一夫
一夫 中村
将平 長谷川
将平 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2012168370A priority Critical patent/JP5844698B2/en
Publication of JP2014026592A publication Critical patent/JP2014026592A/en
Application granted granted Critical
Publication of JP5844698B2 publication Critical patent/JP5844698B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)

Description

本発明は、文字認識装置に関し、特に項目の読出し方式に関する。   The present invention relates to a character recognition device, and more particularly to an item reading method.

スキャナによる帳票の読取りは、帳票用紙の外形、例えば端部や端面を基準にして、イメージ(画像)上で各項目の読出し位置が算出されて、各項目の文字認識が行われる。しかし、帳票の外形を基準にする方式では、外形精度が十分に高いことが要求される。そのため、以下に説明するように例えばカメラタイプのスキャナでは、帳票の角部に浮きが発生したりすると、基準位置がずれて、正しく文字認識ができなく場合がある。   When the form is read by the scanner, the reading position of each item is calculated on the image (image) on the basis of the outer shape of the form paper, for example, the edge or end face, and the character recognition of each item is performed. However, the method based on the outline of the form is required to have a sufficiently high outline accuracy. Therefore, as will be described below, for example, in a camera type scanner, if a float occurs at the corner of a form, the reference position may be shifted and character recognition may not be performed correctly.

図17は、浮きの発生により項目座標の検出にエラーを生じる例を、説明する図である。図17(A)は、浮きのない状態、つまり正常な状態で撮影された帳票80のイメージ(画像)の一部を示すものである。帳票80のイメージは、端部の検出が容易なように、帳票80の周囲が黒背景90になるように処理される。このイメージから帳票80の左上端の端部80aが基準位置として検出される。そして、項目Aを読みだす場合には、項目Aに対応する項目82まで端部80aから予め登録されている距離dに従って、読み出し位置を決めてデータの読み出しが行われる。   FIG. 17 is a diagram illustrating an example in which an error occurs in the detection of item coordinates due to the occurrence of floating. FIG. 17A shows a part of an image (image) of the form 80 photographed in a state without floating, that is, in a normal state. The image of the form 80 is processed so that the periphery of the form 80 becomes a black background 90 so that the edges can be easily detected. From this image, the upper left end 80a of the form 80 is detected as a reference position. When the item A is read, the data is read by determining the reading position according to the distance d registered in advance from the end 80a up to the item 82 corresponding to the item A.

図17(C)は、端部が浮いた状態でスキャナの台座54に置かれた帳票80を側面から示すものである。基準となる端部80aがこのように浮いた状態であると、端部80aだけがスキャナのカメラに接近することで、端部80aが他の部分に比べて拡大されて撮影される。図17(B)は、端部80aが浮いた状態で撮影された帳票80のイメージ画像である。端部80a近傍が拡大された結果、基準となる端部80aが、イメージ上で本来の位置より外側に移動してしまうために、イメージ上では端部80aと項目位置82の間隔が、dよりさらにΔdだけ伸びてしまう。項目Aに対して誤った位置で読み出しが行われるために、正しい文字認識ができなくなる。   FIG. 17C shows the form 80 placed on the scanner pedestal 54 in a state where the end portion is lifted from the side. When the reference end portion 80a is in such a floating state, only the end portion 80a approaches the camera of the scanner, so that the end portion 80a is enlarged and photographed compared to other portions. FIG. 17B is an image of the form 80 taken with the end 80a floating. As a result of enlarging the vicinity of the end portion 80a, the reference end portion 80a moves outside the original position on the image, so that the interval between the end portion 80a and the item position 82 on the image is greater than d. Furthermore, it extends by Δd. Since the item A is read at an incorrect position, correct character recognition cannot be performed.

このような帳票の浮きへの対策の1つとして、撮影される帳票画像の歪の有無を検出して、警告等を行う歪み検出方法が提案されている(特許文献1)。   As one of countermeasures against such floating of a form, there has been proposed a distortion detection method for detecting the presence or absence of distortion of a taken form image and giving a warning or the like (Patent Document 1).

2007−272572号公報2007-272572

帳票の項目読出しの基準に帳票の外形を利用する方式では、用紙の裁断精度あるいは用紙に対する印刷の位置精度あるいは帳票の浮き等の影響を大きく受けてしまう。このような影響を受けないようにするために、帳票の外形を基準位置に使用しない読出し方式が求められる。   In the method of using the outline of a form as a reference for reading out the form items, it is greatly affected by the cutting accuracy of the paper, the positional accuracy of printing with respect to the paper, or the floating of the form. In order to avoid such an influence, a reading method that does not use the outline of the form as a reference position is required.

本願発明は、上記課題に鑑み、帳票の外形に影響を受けることなく、項目の読出しを行うことができる文字認識装置を提供することを目的とする。   In view of the above problems, an object of the present invention is to provide a character recognition device capable of reading items without being affected by the outer shape of a form.

上記目的を達成するために、撮影された帳票のイメージに基づき文字認識を行う文字認識装置において、前記帳票の種類を特定する帳票ID及び当該帳票IDの位置を前記イメージから抽出する帳票ID抽出部と、前記抽出した帳票IDに基づき当該帳票に対応する定義情報を、帳票の定義情報が記憶された記憶部から獲得する定義情報獲得部と、前記獲得された定義情報に含まれる罫線情報に基づき、前記イメージから当該帳票の基準罫線を探索する罫線探索部と、前記獲得された定義情報に含まれ前記帳票の外形を基準とする項目座標を帳票IDの位置を基準とする座標に変換するとともに、前記イメージ上での前記基準罫線の位置を用いて前記項目座標を前記イメージに対応して補正する項目座標補正部と、前記項目座標補正部により補正された前記項目座標に基づき、文字認識を行う文字認識部を備え、前記帳票ID抽出部は、前記イメージの帳票IDの位置を、前記帳票IDの文字の中で当該帳票の中央寄りの文字を基準に抽出する。 In order to achieve the above object, in a character recognition device that performs character recognition based on a photographed form image, a form ID that identifies the type of form and a form ID extraction unit that extracts the position of the form ID from the image A definition information acquisition unit that acquires definition information corresponding to the form based on the extracted form ID from a storage unit in which the definition information of the form is stored, and a ruled line information included in the acquired definition information A ruled line search unit that searches for a reference ruled line of the form from the image, and converts item coordinates included in the acquired definition information based on the outline of the form into coordinates based on the position of the form ID. An item coordinate correction unit that corrects the item coordinates corresponding to the image using the position of the reference ruled line on the image, and the item coordinate correction unit. Based on the item coordinates Tadashisa includes a character recognition unit for performing character recognition, the form ID extracting unit, a position of the form ID of the image, close to the center of the character of the document in the character of the form ID Extract based on

本発明によれば、帳票の外形に影響を受けることなく、項目の読出しを行うことができる文字認識装置を提供することができる。   ADVANTAGE OF THE INVENTION According to this invention, the character recognition apparatus which can read an item can be provided, without being influenced by the external shape of a form.

本発明を適用した文字認識装置100とそのシステムを説明するための図である。It is a figure for demonstrating the character recognition apparatus 100 and its system to which this invention is applied. 具体的な帳票80の1例を示す図である。It is a figure which shows an example of the specific form 80. FIG. 文字認識装置100の具体的な構成を示す、機能ブロック図である。3 is a functional block diagram showing a specific configuration of the character recognition device 100. FIG. 帳票ID84と項目82の関係を示す図である。It is a figure which shows the relationship between form ID84 and the item 82. FIG. 帳票ID84と基準罫線86の関係を示す図である。It is a figure which shows the relationship between form ID84 and the reference ruled line 86. FIG. 斜行情報算出を説明するための図である。It is a figure for demonstrating skew feeding information calculation. 水平方向と垂直方向のそれぞれの拡縮率の算出を説明する図である。It is a figure explaining calculation of each expansion / contraction rate of a horizontal direction and a perpendicular direction. 項目座標補正において、拡縮補正を説明するための図である。It is a figure for demonstrating expansion / contraction correction | amendment in item coordinate correction | amendment. 項目座標補正において、斜行補正を説明するための図である。It is a figure for demonstrating skew correction in item coordinate correction. 文字認識処理のメインのフローチャートである。It is a main flowchart of a character recognition process. 帳票ID抽出処理のサブルーチンである。It is a subroutine of form ID extraction processing. 定義情報獲得処理のサブルーチンである。This is a subroutine for definition information acquisition processing. 罫線探索処理のサブルーチンである。It is a subroutine for ruled line search processing. 項目座標補正処理のサブルーチンである。This is a subroutine for item coordinate correction processing. 基準罫線86を使用しないで補正する例を説明する図である。It is a figure explaining the example corrected without using the standard ruled line. 項目の読出し基準に対する帳票80の裁断の影響を説明するイメージの図である。It is an image figure explaining the influence of the cutting of the form 80 with respect to the reading reference | standard of an item. 浮きの発生により項目座標の検出にエラーを生じる例を、説明する図である。It is a figure explaining the example which produces an error in the detection of an item coordinate by generation | occurrence | production of floating.

以下、図面に従って本発明の実施形態を説明する。図1は、本発明を適用した文字認識装置100を搭載した端末装置1とその概略システムを説明するための図である。このシステムは、例えば、金融機関の窓口に設置され、顧客が記入した所定の入金や出金の各伝票を読取るためのシステムである。端末装置1には、スキャナ50、操作部60、モニタ70が接続される。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram for explaining a terminal device 1 equipped with a character recognition device 100 to which the present invention is applied and a schematic system thereof. This system is, for example, a system that is installed at a window of a financial institution and reads a predetermined deposit or withdrawal slip entered by a customer. A scanner 50, an operation unit 60, and a monitor 70 are connected to the terminal device 1.

端末装置1は、CPU10、DRAM12、HDD14、IF部18、画像処理部20を有する。端末装置1としては、一般的なパーソナルコンピュータを使用することができる。CPU10は、端末装置1、スキャナ50、操作部60、モニタ70を統括的に制御する制御部である。CPU10は、所定のプログラムを読込んで、操作部60からの指示に基づき、演算や外部制御等および文字認識の各処理を実行する。また、CPU10は、文字認識装置100を有する。スキャナ50による帳票80の読取処理時に、CPU10は、HDD14から文字認識用のプログラムを読込み、文字認識装置100として機能するので、CPU10は文字認識装置100という機能部を有していると便宜的に表現する。   The terminal device 1 includes a CPU 10, a DRAM 12, an HDD 14, an IF unit 18, and an image processing unit 20. As the terminal device 1, a general personal computer can be used. The CPU 10 is a control unit that comprehensively controls the terminal device 1, the scanner 50, the operation unit 60, and the monitor 70. The CPU 10 reads a predetermined program and executes each process of calculation, external control, and character recognition based on an instruction from the operation unit 60. Further, the CPU 10 has a character recognition device 100. When the document 50 is read by the scanner 50, the CPU 10 reads a character recognition program from the HDD 14 and functions as the character recognition device 100. Therefore, it is convenient for the CPU 10 to have a function unit called the character recognition device 100. Express.

DRAM12は、一時記憶メモリで、スキャナ50で読取ったイメージデータを記憶したり、イメージデータに画像処理を施すためのワーキンングエリアとして用いられる。
HDD14は、保存用メモリで、HDD14には、文字認識用のプログラムを含む各種制御用のプログラムや必要なデータが記憶される。HDD14には、データとして、帳票を読み出すために必要な帳票の定義情報16が記憶される。
The DRAM 12 is a temporary storage memory, and is used as a working area for storing image data read by the scanner 50 and performing image processing on the image data.
The HDD 14 is a storage memory, and the HDD 14 stores various control programs including a character recognition program and necessary data. The HDD 14 stores form definition information 16 necessary for reading a form as data.

定義情報16とは、帳票上の各項目の位置(座標)情報や各項目の文字認識をする上で必要な情報を言い、定義体とも呼ばれる。従って、定義情報16は帳票80の種類ごとに異なっている。定義情報16には、帳票IDに関する定義情報や基準罫線に関する情報が含まれる。帳票IDとは、帳票の種類を示す情報で、帳票80の種類に関わらず、帳票80の一定位置に印刷される。帳票IDの定義情報とは、帳票IDの帳票上の座標(位置)、桁数、など帳票IDを認識するための情報である。基準罫線とは、帳票80撮影時の傾きや拡縮の影響を補正するために用いる基準となる罫線を言い、詳細は、後述する。   The definition information 16 refers to the position (coordinate) information of each item on the form and information necessary for character recognition of each item, and is also called a definition body. Therefore, the definition information 16 is different for each type of form 80. The definition information 16 includes definition information related to the form ID and information related to the reference ruled line. The form ID is information indicating the type of form, and is printed at a fixed position on the form 80 regardless of the type of form 80. The form ID definition information is information for recognizing the form ID such as the coordinates (position) of the form ID on the form and the number of digits. The reference ruled line is a ruled line used as a reference for correcting the influence of inclination and enlargement / reduction at the time of photographing the form 80, and details will be described later.

図2は、具体的な帳票80の1例である。図2に示す帳票80は、横長タイプの帳票で、銀行で使用される預入れ処理用の帳票である。左上に印刷された「2000」が、帳票ID84である。枠で囲まれ欄が、顧客によって数字や文字が記入される各項目の領域である。顧客によって枠で囲まれ各項目に数字や文字が記入された帳票80がスキャナ50でイメージとして取込まれ、このイメージから、顧客により記入された数字や文字が文字認識される。なお、通常、各枠はドロップアウトカラーである赤または青の色で印刷され、帳票ID84は黒で印刷される。   FIG. 2 is an example of a specific form 80. A form 80 shown in FIG. 2 is a horizontally long form and is a deposit process form used in a bank. “2000” printed on the upper left is the form ID 84. A box surrounded by a frame is an area of each item in which numbers and characters are entered by the customer. A form 80 enclosed by a customer in a frame and filled with numbers and characters in each item is captured as an image by the scanner 50, and the numbers and characters entered by the customer are recognized as characters from this image. Normally, each frame is printed in a red or blue color that is a dropout color, and the form ID 84 is printed in black.

IF部18は、外部に接続される周辺装置(ここでは、スキャナ50や操作部60)とCPU10とのデータの送受信を行うインターフェース部である。画像処理部20は、CPU10からの指示に基づき、例えば、スキャナ50による帳票80の読取り操作時に表示させる各種操作用の画面を作成し、作成した画面を接続されるモニタ70に表示させるものである。   The IF unit 18 is an interface unit that transmits and receives data between a peripheral device (here, the scanner 50 and the operation unit 60) connected to the outside and the CPU 10. For example, the image processing unit 20 creates a screen for various operations to be displayed when the form 50 is read by the scanner 50 based on an instruction from the CPU 10, and displays the created screen on the connected monitor 70. .

スキャナ50は、帳票80を撮影するカメラ部52と、撮影される帳票80が載置される台座54を有する。カメラ部52は、スキャナ50の上部に配置され、台座54に載置された帳票80を上から非接触で撮影するよう取付けられる。カメラ部52は、撮影レンズ、撮像素子及び撮像部等を有し、帳票80のデジタル化されたカラーのイメージデータをIF部18に出力する。なお、スキャナ50は、上述のような2次元センサが搭載されたカメラタイプでなく、帳票80を移動させながら読み出すラインセンサのタイプであってもよい。また、スキャナ50は、上述のような帳票80を一枚づつ置いて読取るタイプではなく、帳票を自動送りする自動フィーダーを備えたタイプであってもよい。   The scanner 50 includes a camera unit 52 that captures the form 80 and a base 54 on which the captured form 80 is placed. The camera unit 52 is disposed on the upper portion of the scanner 50 and is attached so as to photograph the form 80 placed on the pedestal 54 in a non-contact manner from above. The camera unit 52 includes a photographic lens, an imaging device, an imaging unit, and the like, and outputs digitized color image data of the form 80 to the IF unit 18. The scanner 50 may be a line sensor type that reads out the form 80 while moving, instead of the camera type on which the two-dimensional sensor as described above is mounted. In addition, the scanner 50 may be of a type provided with an automatic feeder that automatically feeds a form, instead of a type that reads and puts the forms 80 one by one.

操作部60は、例えばマウスやキーボードで、操作者から帳票読取り処理に対する指示が入力され、IF部18を介してCPU10にその指示内容を通知するものである。モニタ70は、例えばLCDパネルで、モニタ70には、帳票80の読取り処理時に、画像処理部20で作成された各種操作用の画面が表示される。また、モニタ70には、スキャナ50で読取られた帳票80の画像あるいは読取った文字が表示されるようにしてもよい。   The operation unit 60 is, for example, a mouse or keyboard that receives an instruction for a form reading process from an operator and notifies the CPU 10 of the content of the instruction via the IF unit 18. The monitor 70 is, for example, an LCD panel, and displays various operation screens created by the image processing unit 20 when the form 80 is read. The monitor 70 may display an image of the form 80 read by the scanner 50 or a read character.

図3は、文字認識装置100の具体的な構成を示す、機能ブロック図である。図3(A)は、文字認識装置100の全体構成を示す図である。文字認識装置100は、帳票ID抽出部110、定義情報獲得部120、罫線探索部130、項目座標補正部140及び文字認識部150を有する。文字認識装置100の各部は、定義情報16を参照しながら処理を行う。また、図4は帳票ID84と項目82の関係を示す図で、図5は帳票ID84と基準罫線86の関係を示す図である。図4及び図5を参照しながら説明する。   FIG. 3 is a functional block diagram showing a specific configuration of the character recognition device 100. FIG. 3A is a diagram illustrating an overall configuration of the character recognition device 100. The character recognition device 100 includes a form ID extraction unit 110, a definition information acquisition unit 120, a ruled line search unit 130, an item coordinate correction unit 140, and a character recognition unit 150. Each unit of the character recognition device 100 performs processing while referring to the definition information 16. 4 is a diagram showing the relationship between the form ID 84 and the item 82, and FIG. 5 is a diagram showing the relationship between the form ID 84 and the reference ruled line 86. This will be described with reference to FIGS.

帳票ID抽出部110は、撮影された帳票80のイメージから、帳票ID84を探索し、探索した帳票ID84に対して文字認識を行うものである。上述したように、帳票80の左上端の端部80aを基準とした帳票ID84の位置は、帳票の種類に関わらず一定となっている。図4(A)に示すように、定義情報16に基づく帳票80の端部80aを基準として所定量離れた位置で、帳票ID84(9999)を抽出する。帳票ID84の探索に限り、帳票80の端部80aを利用する。   The form ID extraction unit 110 searches the form ID 84 from the image of the photographed form 80, and performs character recognition on the searched form ID 84. As described above, the position of the form ID 84 based on the upper left end 80a of the form 80 is constant regardless of the type of form. As shown in FIG. 4A, a form ID 84 (9999) is extracted at a position that is a predetermined amount away from the end 80a of the form 80 based on the definition information 16. Only the search for the form ID 84 uses the end 80a of the form 80.

探索された帳票ID84を基準として以下で各項目を読み出すとともに、帳票IDの具体的な基準位置となるID基準85を帳票ID84から検出する。ID基準85は、帳票ID84の中で、最も中央寄りの数字の外接矩形のセンタとする(図4(B))。帳票ID84「9999」の一番右の四角で囲まれた「9」の中心座標を、ID基準85とする。(図4(A))。帳票ID84の最も中央寄りの数字を基準に用いるのは、中央寄りの数字ほど帳票80の端部の影響を受けづらいからである。図4(C)は、ID基準85を基準として、所定量離れた位置から項目82を読出す様子を示すものである。項目82の基準とする位置は、例えば項目の左上端である。   Each item is read below based on the searched form ID 84, and an ID reference 85 that is a specific reference position of the form ID is detected from the form ID 84. The ID standard 85 is a circumscribed rectangular center of the number closest to the center in the form ID 84 (FIG. 4B). The center coordinate of “9” surrounded by the rightmost square of the form ID 84 “9999” is set as the ID reference 85. (FIG. 4 (A)). The reason why the number closest to the center of the form ID 84 is used as a reference is that the number closer to the center is less affected by the edge of the form 80. FIG. 4C shows a state in which the item 82 is read from a position separated by a predetermined amount with the ID reference 85 as a reference. The reference position of the item 82 is, for example, the upper left corner of the item.

定義情報獲得部120は、帳票IDの文字認識結果から求められた帳票IDに対応する定義情報を、HDD14に予め帳票ID毎に用意され記憶された定義情報の中から読み出すものである。例えば、帳票80の種類が図2で示した預入れ用帳票であった場合には、預入れ用帳票の定義情報16をHDD14から読み出す。   The definition information acquisition unit 120 reads definition information corresponding to the form ID obtained from the character recognition result of the form ID from the definition information prepared and stored in advance for each form ID in the HDD 14. For example, when the type of the form 80 is the deposit form shown in FIG. 2, the deposit form definition information 16 is read from the HDD 14.

罫線探索部130は、読み出した定義情報16から、基準罫線に関する情報である罫線情報を抽出し、イメージから基準罫線を探索して、基準罫線に基づき帳票80撮影時の傾きや拡縮率を算出する。図5を参照する。図5(A)は、定義情報16上での、帳票ID84と基準罫線86の位置関係を示すもので、図5(B)は、イメージ上での帳票ID84と基準罫線86を示すものである。   The ruled line search unit 130 extracts ruled line information that is information related to the reference ruled line from the read definition information 16, searches for the reference ruled line from the image, and calculates the inclination and enlargement / reduction ratio at the time of capturing the form 80 based on the reference ruled line. . Please refer to FIG. FIG. 5A shows the positional relationship between the form ID 84 and the reference ruled line 86 on the definition information 16, and FIG. 5B shows the form ID 84 and the reference ruled line 86 on the image. .

罫線情報は、基準罫線の属性情報で、基準罫線の位置、方向や長さに関する情報である。補正の基準となる基準罫線は、帳票80の中で、補正に利用するに適した罫線が、帳票80の種類ごとに予め選択されて、定義情報16に登録されている。基準罫線としては、一定以上の長さで、線幅が一定以上太く、かつ図5(A)に示すように、帳票ID84から一定以上離れている直線であることが望ましい。また、基準罫線は、複数本、例えば水平方向と垂直方向の2本であってもよい。   The ruled line information is attribute information of the reference ruled line and is information regarding the position, direction, and length of the reference ruled line. As the reference ruled lines for correction, the ruled lines suitable for use in the form 80 are selected in advance for each type of form 80 and registered in the definition information 16. The reference ruled line is preferably a straight line having a certain length or more, a line width larger than a certain value, and a certain distance from the form ID 84 as shown in FIG. Further, the reference ruled line may be plural, for example, two in the horizontal direction and the vertical direction.

図3(B)は、罫線探索部130の具体的な構成を示す図である。罫線探索部130は、罫線検出部132、斜行情報算出部134、拡縮情報算出部136を有する。罫線検出部132は、帳票ID84(具体的はID基準85)を基準にした基準罫線86の位置を算出する。基準罫線86の位置が、定義情報16で、帳票80の端部80aを基準にしている場合には、帳票ID84を基準にした位置に変換する(図5(A))。そして、帳票ID84を基準として算出した基準罫線86の位置に基づきで、図5(B)に示すように、イメージ上で、基準罫線86を検出する。   FIG. 3B is a diagram illustrating a specific configuration of the ruled line search unit 130. The ruled line search unit 130 includes a ruled line detection unit 132, a skew feed information calculation unit 134, and an enlargement / reduction information calculation unit 136. The ruled line detection unit 132 calculates the position of the reference ruled line 86 based on the form ID 84 (specifically, the ID reference 85). When the position of the reference ruled line 86 is the definition information 16 and is based on the end 80a of the form 80, it is converted into a position based on the form ID 84 (FIG. 5A). Then, based on the position of the reference ruled line 86 calculated based on the form ID 84, the reference ruled line 86 is detected on the image as shown in FIG.

斜行情報算出部134は、検出した基準罫線86に基づき、イメージ上での帳票80の斜行情報である斜度θを算出する。ここでは、イメージ上の水平垂直軸を基準として、台座54に載置された帳票80の斜度θを算出する。図6は、斜行情報算出を説明するための図で、1点鎖線で示すイメージ上の水平軸92を基準に、基準罫線86の斜度θを算出する。なお、図6では、水平な基準罫線86を例にしたが、基準罫線86が垂直な場合でも、垂直軸に対する傾きを算出することで、斜度θを算出することができる。   Based on the detected reference ruled line 86, the skew information calculation unit 134 calculates a skewness θ that is skew information of the form 80 on the image. Here, the inclination θ of the form 80 placed on the pedestal 54 is calculated on the basis of the horizontal and vertical axes on the image. FIG. 6 is a diagram for explaining the skew information calculation, and calculates the inclination θ of the reference ruled line 86 with reference to the horizontal axis 92 on the image indicated by the one-dot chain line. In FIG. 6, the horizontal reference ruled line 86 is taken as an example, but even when the reference ruled line 86 is vertical, the inclination θ can be calculated by calculating the inclination with respect to the vertical axis.

拡縮情報算出部136は、定義情報での帳票ID84から基準罫線86までの距離(図5(A))と、イメージ上の帳票ID84から基準罫線86までの距離(図5(B))を対比することにより、イメージの拡縮情報である拡縮率を求める。   The enlargement / reduction information calculation unit 136 compares the distance from the form ID 84 to the reference ruled line 86 in the definition information (FIG. 5A) and the distance from the form ID 84 on the image to the reference ruled line 86 (FIG. 5B). By doing so, the enlargement / reduction ratio which is the enlargement / reduction information of the image is obtained.

また、図7は、水平方向と垂直方向のそれぞれの拡縮率の算出を説明する図である。拡縮情報算出部136は、基準罫線を水平方向と垂直方向の両方に設定し、水平方向の基準罫線86と垂直方向の基準罫線86aまでのそれぞれの距離を対比することで、水平方向と垂直方向の拡縮率をそれぞれ求めるようにしてもよい。本実施形態のような画像取込み部がカメラの場合には、水平方向と垂直方向の両方でそれぞれ拡縮を生じる可能性があるので、両方向の拡縮情報をそれぞれ算出するのが望ましい。また、画像取込み部がラインセンサのような場合には、ライン方向への拡縮は十分に少ないので、ラインに直交する方向のみ拡縮情報を算出すればよい。   FIG. 7 is a diagram for explaining the calculation of the enlargement / reduction ratios in the horizontal direction and the vertical direction. The enlargement / reduction information calculation unit 136 sets the reference ruled line in both the horizontal direction and the vertical direction, and compares the distance between the horizontal reference ruled line 86 and the vertical reference ruled line 86a, thereby making the horizontal and vertical directions You may make it obtain | require each expansion / contraction rate. When the image capturing unit as in the present embodiment is a camera, there is a possibility that enlargement / reduction may occur in both the horizontal direction and the vertical direction, so it is desirable to calculate enlargement / reduction information in both directions. Further, when the image capturing unit is a line sensor, the expansion / contraction in the line direction is sufficiently small. Therefore, the expansion / contraction information may be calculated only in the direction orthogonal to the line.

項目座標補正部140は、定義情報上で「文字認識項目」の位置を示す座標(以下、項目座標と呼ぶ)を、帳票ID84の位置を基準にした座標(以下、ID座標と呼ぶ)に変換する。図3(C)は、項目座標補正部140の具体的な構成を示す図である。項目座標補正部140は、イメージ座標変換部142、拡縮補正部144、斜行補正部146を有する。図8は、項目座標補正を説明するための図で、図8(A)は、定義情報16上での帳票ID84と項目82の関係を示し、図8(B)はイメージ上での帳票ID84と項目82の関係を示す。イメージ座標変換部142は、定義情報では、帳票80の端部80aが基準となっている項目82の座標を、帳票ID84を基準にしたイメージ座標に変換する。   The item coordinate correction unit 140 converts coordinates indicating the position of the “character recognition item” (hereinafter referred to as item coordinates) on the definition information into coordinates based on the position of the form ID 84 (hereinafter referred to as ID coordinates). To do. FIG. 3C is a diagram illustrating a specific configuration of the item coordinate correction unit 140. The item coordinate correction unit 140 includes an image coordinate conversion unit 142, an enlargement / reduction correction unit 144, and a skew correction unit 146. FIG. 8 is a diagram for explaining the item coordinate correction. FIG. 8A shows the relationship between the form ID 84 on the definition information 16 and the item 82, and FIG. 8B shows the form ID 84 on the image. And the item 82 are shown. In the definition information, the image coordinate conversion unit 142 converts the coordinates of the item 82 which is based on the end 80a of the form 80 into image coordinates based on the form ID 84.

拡縮補正部144は、拡縮情報算出部136で算出した拡縮率を利用して、項目82の座標の拡縮補正を行う。これにより、図8(B)で示すように、定義情報による項目82の位置を項目82aとし、拡縮補正部144により、例えば水平方向にΔx、垂直方向にΔyそれぞれ移動されて、項目82aから項目82bの位置に補正される。   The enlargement / reduction correction unit 144 performs the enlargement / reduction correction of the coordinates of the item 82 by using the enlargement / reduction ratio calculated by the enlargement / reduction information calculation unit 136. As a result, as shown in FIG. 8B, the position of the item 82 based on the definition information is set to the item 82a, and the enlargement / reduction correction unit 144 moves, for example, Δx in the horizontal direction and Δy in the vertical direction. It is corrected to the position 82b.

図9は、項目座標補正の斜行補正について説明するための図である。図9(A)は、イメージ上で帳票80が傾いている場合の例である。上述したように、イメージ上の水平軸92を基準に、基準罫線86の斜度θを算出する。   FIG. 9 is a diagram for explaining the skew correction of the item coordinate correction. FIG. 9A shows an example in which the form 80 is inclined on the image. As described above, the inclination θ of the reference ruled line 86 is calculated based on the horizontal axis 92 on the image.

図9(B)は、定義情報16上での帳票ID84と項目82の関係を示すものである。なお、斜行補正においては、ID基準85が、帳票80の上辺から距離と左辺からの距離が等距離fになる位置に設定されるのが、望ましい。   FIG. 9B shows the relationship between the form ID 84 and the item 82 on the definition information 16. In the skew correction, it is desirable that the ID reference 85 is set at a position where the distance from the upper side of the form 80 and the distance from the left side are equal distance f.

図9(C)は、イメージ上での補正する様子を示す。斜行補正部146は、斜行情報算出部134で算出した斜度θを利用して、項目82の座標の斜行補正を行う。斜行補正部146により、帳票ID84のID基準85を中心に、項目82がθ度回転されて補正が行われる。   FIG. 9C shows how correction is performed on the image. The skew correction unit 146 performs skew correction of the coordinates of the item 82 using the skewness θ calculated by the skew information calculation unit 134. The skew correction unit 146 performs correction by rotating the item 82 by θ degrees around the ID reference 85 of the form ID 84.

文字認識部150は、項目座標補正部140で補正された各項目のイメージ上の座標で、イメージの一部を切り出して、各項目に対応する文字認識を行うものである。文字認識に必要な手書き/活字・字種(数字、カナ、漢字等)などについては、定義情報16を参照する。   The character recognition unit 150 cuts out a part of the image at the coordinates on the image of each item corrected by the item coordinate correction unit 140 and performs character recognition corresponding to each item. Refer to the definition information 16 for handwritten / printed characters / character types (numerals, kana, kanji, etc.) necessary for character recognition.

図10〜図14は、これまで説明した帳票の文字認識処理の手順をフローチャートで示すものである。かかる文字認識処理は、CPU10、特に文字認識装置100によって実行される。図10は、文字認識処理のメインのフローチャートである。撮影された帳票80イメージから、帳票ID抽出処理(ステップS10)、定義情報獲得処理(ステップS12)、罫線探索処理(ステップS14)、項目座標補正処理(ステップS16)、文字認識処理(ステップS18)を順番に行う。帳票ID抽出処理、定義情報獲得処理、罫線探索処理、項目座標補正処理の各処理ついて、図11〜図14の各サブルーチンで説明する。ただし、帳票ID抽出処理、定義情報獲得処理、罫線探索処理、項目座標補正処理の各処理は、前述した帳票ID抽出部110、定義情報獲得部120、罫線探索部130及び項目座標補正部140によって実行される機能と同等な内容であるので、重複する部分は省略する。   FIG. 10 to FIG. 14 are flowcharts showing the procedure of the form character recognition processing described so far. Such character recognition processing is executed by the CPU 10, particularly the character recognition device 100. FIG. 10 is a main flowchart of the character recognition process. From the captured form 80 image, form ID extraction process (step S10), definition information acquisition process (step S12), ruled line search process (step S14), item coordinate correction process (step S16), character recognition process (step S18) In order. Each process of form ID extraction processing, definition information acquisition processing, ruled line search processing, and item coordinate correction processing will be described with reference to the subroutines of FIGS. However, the form ID extraction processing, definition information acquisition processing, ruled line search processing, and item coordinate correction processing are performed by the above-described form ID extraction unit 110, definition information acquisition unit 120, ruled line search unit 130, and item coordinate correction unit 140. Since the content is equivalent to the function to be executed, the overlapping part is omitted.

図11は、帳票ID抽出処理のサブルーチンである。撮影された帳票80のイメージから、帳票ID84の文字認識を行う(ステップS20)。帳票80の端部80aから所定量離れた位置で、帳票ID84を抽出する。帳票ID84の位置は、帳票の種類に関わらず、帳票80の端部80aから一定の位置に印刷され、端部80aからの位置は定義情報16に記載されている。そして、抽出した帳票ID84のイメージに文字認識を行い、帳票ID84の番号を検出し、帳票ID84を特定する。さらに、イメージ上での帳票IDの位置を検出する(ステップS22)。前述のように、帳票ID84の位置として、帳票ID84の最も中央寄りの数字の中心座標をID基準85とする。数字の中心座標は、数字の外接矩形の中心として求められる。   FIG. 11 is a subroutine of form ID extraction processing. Character recognition of the form ID 84 is performed from the captured image of the form 80 (step S20). The form ID 84 is extracted at a position away from the end 80a of the form 80 by a predetermined amount. The position of the form ID 84 is printed at a fixed position from the end 80a of the form 80 regardless of the type of the form, and the position from the end 80a is described in the definition information 16. Then, character recognition is performed on the extracted image of the form ID 84, the number of the form ID 84 is detected, and the form ID 84 is specified. Further, the position of the form ID on the image is detected (step S22). As described above, as the position of the form ID 84, the center coordinate of the number closest to the center of the form ID 84 is set as the ID reference 85. The center coordinate of the number is obtained as the center of the circumscribed rectangle of the number.

図12は、定義情報獲得処理のサブルーチンである。帳票IDに対応する各定義情報の読出しを行う(ステップS30)。帳票ID毎に予め用意されてHDD14に記憶された定義情報の中から、ステップS20で特定された帳票ID84に対応する定義情報を読み出す。   FIG. 12 is a subroutine of definition information acquisition processing. Each definition information corresponding to the form ID is read (step S30). The definition information corresponding to the form ID 84 specified in step S20 is read from the definition information prepared for each form ID and stored in the HDD 14 in advance.

図13は、罫線探索処理のサブルーチンである。ステップS30で獲得した定義情報16に基づき、イメージから基準罫線を検出する(ステップS40)。基準罫線86の傾きからイメージ上の斜度θを算出する(ステップS42)。イメージ上の水平軸あるいは垂直軸に対する基準罫線86の傾きを計算して、斜度θを算出する。次に、イメージ上の帳票ID84と基準罫線86の距離を算出する(ステップS44)。さらに、定義情報16における帳票ID84と基準罫線86の距離を比較する(ステップS46)。イメージ上の距離と定義情報16における距離を対比して、拡縮率を算出する(ステップS48)。拡縮率の算出に当たっては、図7で示したように、水平と垂直の2本の基準罫線86を利用して、水平および垂直のそれぞれの拡縮率を算出してもよい。なお、ステップS40は罫線検出部132の機能に対応し、ステップS42は斜行情報算出部134の機能に対応し、ステップS44とステップS46とステップS46は、拡縮情報算出部136の機能に対応する。   FIG. 13 is a subroutine for ruled line search processing. Based on the definition information 16 acquired in step S30, a reference ruled line is detected from the image (step S40). The inclination θ on the image is calculated from the inclination of the reference ruled line 86 (step S42). The inclination θ of the reference ruled line 86 with respect to the horizontal axis or vertical axis on the image is calculated to calculate the inclination θ. Next, the distance between the form ID 84 on the image and the reference ruled line 86 is calculated (step S44). Further, the distance between the form ID 84 and the reference ruled line 86 in the definition information 16 is compared (step S46). The scaling ratio is calculated by comparing the distance on the image with the distance in the definition information 16 (step S48). In calculating the enlargement / reduction ratio, as shown in FIG. 7, the horizontal and vertical enlargement / reduction ratios may be calculated using two horizontal and vertical reference ruled lines 86. Note that step S40 corresponds to the function of the ruled line detection unit 132, step S42 corresponds to the function of the skew feeding information calculation unit 134, and step S44, step S46, and step S46 correspond to the function of the enlargement / reduction information calculation unit 136. .

図14は、項目座標補正処理のサブルーチンである。項目座標を、帳票80の端部80aを基準にした定義情報での座標から、帳票ID84の位置を基準にしたID座標に変換する(ステップS50)。次に、項目のID座標を拡縮補正する(ステップS52)。ステップS48で算出した拡縮率を用いて項目のID座標を拡縮補正する。   FIG. 14 is a subroutine of item coordinate correction processing. The item coordinates are converted from the coordinates in the definition information based on the end portion 80a of the form 80 to the ID coordinates based on the position of the form ID 84 (step S50). Next, the ID coordinate of the item is enlarged / reduced (step S52). Using the enlargement / reduction ratio calculated in step S48, the ID coordinate of the item is enlarged / reduced.

さらに、項目のID座標を斜行補正する(ステップS54)。ステップS42で算出した斜度θを用いて項目のID座標を補正する。
そして、変換され補正されたイメージ上での帳票80の各項目82のID座標に基づき、各項目に対応するイメージ部分が抽出され、抽出された画像から文字が認識される(ステップS18)。
Furthermore, the ID coordinate of the item is skewed (step S54). The ID coordinate of the item is corrected using the slope θ calculated in step S42.
Then, based on the ID coordinates of each item 82 of the form 80 on the converted and corrected image, an image portion corresponding to each item is extracted, and characters are recognized from the extracted image (step S18).

図15は、基準罫線86を使用しないで補正する例を説明する図である。これまでの説明では、帳票80のイメージの斜行や拡縮率について、基準罫線86を用いて算出補正する例を示したが、基準罫線86ではなく、印刷された文字を利用しても算出することもできる。   FIG. 15 is a diagram for explaining an example of correction without using the reference ruled line 86. In the description so far, the example in which the skew and enlargement / reduction ratio of the image of the form 80 is calculated and corrected using the reference ruled line 86 has been described, but it is also calculated using printed characters instead of the reference ruled line 86. You can also.

図15(A)は、撮影された帳票80のイメージの1例である。定義情報16には、帳票80の種類に応じて、帳票80に予め印刷された文字の中で、基準となる文字である基準文字88a(ABCD)と基準文字88b(XYZ)が、基準罫線86と共にあるいは基準罫線86に代り設定されている。基準文字88aと基準文字88bの座標情報も定義情報16に含まれる。   FIG. 15A is an example of an image of the form 80 that has been photographed. In the definition information 16, reference characters 88 a (ABCD) and reference characters 88 b (XYZ), which are reference characters among characters printed in advance on the form 80, according to the type of the form 80, include a reference ruled line 86. Or instead of the reference ruled line 86. The definition information 16 also includes coordinate information of the reference character 88a and the reference character 88b.

基準文字88aは、拡縮率の算出用である。基準文字88aと基準文字88bは、組み合わせて斜度の算出に用いられる。基準文字88aとしては、帳票ID84からある程度離れた位置にある文字が選ばれる。また、基準文字88bは、基準文字88aから水平方向にある程度離れた位置にある文字が選ばれる。   The reference character 88a is for calculating the enlargement / reduction ratio. The reference character 88a and the reference character 88b are used in combination to calculate the inclination. As the reference character 88a, a character located at a certain distance from the form ID 84 is selected. In addition, as the reference character 88b, a character located at a certain distance in the horizontal direction from the reference character 88a is selected.

帳票ID84のID基準85と同様に、基準文字88aの位置として基準文字88aのセンタ座標を、イメージ上で算出する。基準文字88aが複数文字の場合には、その中で予め選択された文字がセンタ座標に用いられる。基準文字88bについても同様である。   Similar to the ID reference 85 of the form ID 84, the center coordinates of the reference character 88a are calculated on the image as the position of the reference character 88a. When the reference character 88a is a plurality of characters, a character selected in advance is used as the center coordinates. The same applies to the reference character 88b.

そして、帳票ID84と基準文字88aの定義情報16の距離と、帳票ID84と基準文字88aのイメージ上の距離を比較して、拡縮率を算出する。図15(A)では、基準文字88aが帳票ID84の下方向に離れた位置にあるので、帳票80の垂直方向の拡縮率を算出することができる。そして、図15(B)に示すように、基準文字88aと基準文字88bを結ぶ線と1点鎖線で示すイメージ上の水平軸92との傾きを算出することで、斜度θを算出することができる。   Then, the scaling ratio is calculated by comparing the distance between the definition information 16 of the form ID 84 and the reference character 88a and the distance between the form ID 84 and the reference character 88a on the image. In FIG. 15A, since the reference character 88a is located in the downward direction of the form ID 84, the enlargement / reduction ratio in the vertical direction of the form 80 can be calculated. Then, as shown in FIG. 15B, the inclination θ is calculated by calculating the inclination between the line connecting the reference character 88a and the reference character 88b and the horizontal axis 92 on the image indicated by the one-dot chain line. Can do.

図16は、項目の読出し基準に対する帳票80の裁断の影響を説明するイメージの図である。項目の読出し基準を、端部80aから帳票ID84に変換することで、裁断の影響を受けなくなることを説明するものである。裁断位置が内側にずれた帳票80bを、破線で示す。図16(A)は、これまでのように帳票80の端部80aを基準として、項目82を決定する場合である。裁断位置が帳票80bのようにずれると、その分だけ項目位置82に対する読出し位置がずれてしまうことは、明らかである。   FIG. 16 is an image diagram for explaining the influence of the cutting of the form 80 on the item reading reference. This is to explain that the item reading reference is converted from the edge 80a to the form ID 84 so that it is not affected by cutting. A form 80b whose cutting position is shifted inward is indicated by a broken line. FIG. 16A shows a case where the item 82 is determined based on the end portion 80a of the form 80 as described above. If the cutting position is shifted as in the form 80b, it is clear that the reading position with respect to the item position 82 is shifted by that amount.

図16(B)は、本実施形態で説明したように帳票ID84を基準として、項目82を決定する場合である。帳票ID84の抽出でのみ裁断精度の影響を受けるが、具体的な各項目82に対する読出しでは、帳票80の裁断精度の影響を受けないので、項目82の読出し位置がずれてしまうおそれはない。帳票ID84の抽出に関しては、帳票ID84の抽出範囲を広く設定しておくことで対応できる。このように、各項目と同時に印刷される帳票IDを基準に利用することにより、裁断位置のズレ、あるいは用紙に対する印刷位置のズレの影響も受けないようにすることができる。   FIG. 16B shows a case where the item 82 is determined based on the form ID 84 as described in the present embodiment. Although only the extraction of the form ID 84 is affected by the cutting accuracy, the reading of specific items 82 is not affected by the cutting accuracy of the form 80, so there is no possibility that the reading position of the item 82 is shifted. The extraction of the form ID 84 can be handled by setting the extraction range of the form ID 84 wide. Thus, by using the form ID printed at the same time as each item as a reference, it is possible to avoid the influence of the deviation of the cutting position or the deviation of the printing position with respect to the paper.

以上のように、項目82の位置(座標)を帳票ID84の位置を基準にして算出して決定するので、帳票80の外形精度や浮きに影響されずに、正しく項目82の位置を決定することができる。これにより、文字認識の精度が向上する。   As described above, since the position (coordinates) of the item 82 is calculated and determined based on the position of the form ID 84, the position of the item 82 can be correctly determined without being affected by the outline accuracy and floating of the form 80. Can do. This improves the accuracy of character recognition.

以上説明した実施形態により、少なくとも以下の効果が奏せられる。
1)本実施形態では、帳票IDを原点とすることにより、撮影時に帳票の浮きがあってもその影響を受けにくくなり、浮きのないように注意を払わなくても済むので、現場での使い勝手が向上する。
2)帳票端を原点(基準)とする方式では、帳票端から項目までの位置が重要となり、印刷及び裁断において、高い精度が要求されるが、本実施形態では、帳票の裁断精度を緩和することができ、帳票の作成コストの低減につながる。
3)帳票の種類によらず一定の位置に印刷される帳票IDを基準として用いることで、基準位置の検出が容易にできる。
4)帳票の斜行や拡縮補正のための罫線や文字を、帳票の種類に応じて予め選択して定義情報16に登録して、イメージの斜行や拡縮を補正するので、帳票の外形によらずに、イメージの斜行や拡縮を補正することができる。帳票の浮き、あるいは外形が曲がったり歪んでいても、影響を受けづらい。
5)補正のための基準罫線や文字が予め定義情報に登録されているので、補正に適した罫線や文字を、スキャンごと毎回検出する必要がなくなり、補正処理が短時間でできる。
6)本実施形態の方式では、従来の帳票をそのまま使用できるので、投資費用が少なくて済む。
7)帳票用紙に対する相対的な印刷精度も緩和されるので、パソコン用の一般的なプリンタにより作成された帳票でも、使用可能になる。
8)帳票端検出の重要性も低くなくなるので、黒背景の必要もなくなり、黒背景を作成するための台や画像処理が不要になる。
According to the embodiment described above, at least the following effects can be obtained.
1) In the present embodiment, since the form ID is set as the origin, even if the form is lifted at the time of shooting, it is not easily affected, and it is not necessary to pay attention to prevent the form from being lifted. Will improve.
2) In the method where the edge of the form is the origin (reference), the position from the edge of the form to the item is important, and high accuracy is required for printing and cutting. In this embodiment, the cutting accuracy of the form is reduced. This can reduce the cost of creating a form.
3) By using the form ID printed at a certain position as a reference regardless of the form type, the reference position can be easily detected.
4) Ruled lines and characters for correcting skew and enlargement / reduction of the form are selected in advance according to the type of the form and registered in the definition information 16 to correct the skew and enlargement / reduction of the image. Regardless, it is possible to correct skew and enlargement / reduction of the image. Even if the form floats or the outer shape is bent or distorted, it is difficult to be affected.
5) Since the reference ruled lines and characters for correction are registered in the definition information in advance, it is not necessary to detect the ruled lines and characters suitable for correction every scan, and correction processing can be performed in a short time.
6) In the method of the present embodiment, since the conventional form can be used as it is, the investment cost can be reduced.
7) Since the relative printing accuracy with respect to the form paper is relaxed, even a form created by a general printer for a personal computer can be used.
8) Since the importance of form edge detection is not reduced, the need for a black background is eliminated, and a stand and image processing for creating a black background are not required.

なお、本発明は上述した実施形態そのままに限定されるものではく、実施段階でのその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素を適宜組み合わせても良い。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。このような、発明の趣旨を逸脱しない範囲内において種々の変形や応用が可能であることはもちろんである。   Note that the present invention is not limited to the above-described embodiments as they are, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Moreover, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, all the constituent elements shown in the embodiments may be appropriately combined. Furthermore, constituent elements over different embodiments may be appropriately combined. Of course, various modifications and applications are possible without departing from the spirit of the invention.

1 端末装置
10 CPU
12 DRAM
14 HDD
16 定義情報
18 IF部
20 画像処理部
50 スキャナ
52 カメラ部
54 台座
60 操作部
70 モニタ
80 帳票
80a 端部
82 項目
84 帳票ID
85 ID基準
86 基準罫線
88 基準文字
90 黒背景
100 文字認識装置
110 帳票ID抽出部
120 定義情報獲得部
130 罫線探索部
132 罫線検出部
134 斜行情報算出部
136 拡縮情報算出部
140 項目座標補正部
142 イメージ座標変換部
144 拡縮補正部
146 斜行補正部
150 文字認識部
1 Terminal device 10 CPU
12 DRAM
14 HDD
16 Definition Information 18 IF Unit 20 Image Processing Unit 50 Scanner 52 Camera Unit 54 Base 60 Operation Unit 70 Monitor 80 Form 80a Edge 82 Item 84 Form ID
85 ID reference 86 Reference ruled line 88 Reference character 90 Black background 100 Character recognition device 110 Form ID extraction unit 120 Definition information acquisition unit 130 Ruled line search unit 132 Ruled line detection unit 134 Skew information calculation unit 136 Enlargement / reduction information calculation unit 140 Item coordinate correction unit 142 Image coordinate conversion unit 144 Enlargement / reduction correction unit 146 Skew correction unit 150 Character recognition unit

Claims (6)

撮影された帳票のイメージに基づき文字認識を行う文字認識装置において、
前記帳票の種類を特定する帳票ID及び当該帳票IDの位置を前記イメージから抽出する帳票ID抽出部と、
前記抽出した帳票IDに基づき当該帳票に対応する定義情報を、帳票の定義情報が記憶された記憶部から獲得する定義情報獲得部と、
前記獲得された定義情報に含まれる罫線情報に基づき、前記イメージから当該帳票の基準罫線を探索する罫線探索部と、
前記獲得された定義情報に含まれ前記帳票の外形を基準とする項目座標を帳票IDの位置を基準とする座標に変換するとともに、前記イメージ上での前記基準罫線の位置を用いて前記項目座標を前記イメージに対応して補正する項目座標補正部と、
前記項目座標補正部により補正された前記項目座標に基づき、文字認識を行う文字認識部を備え、
前記帳票ID抽出部は、前記イメージの帳票IDの位置を、前記帳票IDの文字の中で当該帳票の中央寄りの文字を基準に抽出する
ことを特徴とする文字認識装置。
In a character recognition device that performs character recognition based on the image of a photographed form,
A form ID that identifies the type of form, and a form ID extraction unit that extracts the position of the form ID from the image;
A definition information acquisition unit for acquiring definition information corresponding to the form based on the extracted form ID from a storage unit in which the definition information of the form is stored;
A ruled line search unit that searches for a reference ruled line of the form from the image based on the ruled line information included in the acquired definition information;
The item coordinates included in the acquired definition information are converted into coordinates based on the form ID, and the item coordinates are determined using the position of the reference ruled line on the image. An item coordinate correction unit for correcting the image corresponding to the image,
A character recognition unit that performs character recognition based on the item coordinates corrected by the item coordinate correction unit ,
The character recognition device, wherein the form ID extraction unit extracts the position of the form ID of the image based on a character closer to the center of the form among the characters of the form ID .
前記項目座標補正部は、
前記定義情報における帳票IDと前記基準罫線との距離と、前記イメージにおける帳票IDと前記基準罫線との距離を比較して、前記イメージの拡縮情報を算出する拡縮情報算出部と、
前記算出された拡縮情報に基づき、前記項目座標に対して拡縮補正を行う拡縮補正部を有する
ことを特徴とする請求項1に記載の文字認識装置。
The item coordinate correction unit includes:
An enlargement / reduction information calculation unit that calculates the enlargement / reduction information of the image by comparing the distance between the form ID in the definition information and the reference ruled line and the distance between the form ID in the image and the reference ruled line;
The character recognition apparatus according to claim 1, further comprising an enlargement / reduction correction unit that performs enlargement / reduction correction on the item coordinates based on the calculated enlargement / reduction information.
前記項目座標補正部は、
前記イメージ上での前記基準罫線の傾き情報を算出する斜行情報算出部と
前記算出された斜行情報に基づき、前記項目座標に対して斜行補正を行う斜行補正部を有する
ことを特徴とする請求項1に記載の文字認識装置。
The item coordinate correction unit includes:
A skew information calculation unit that calculates inclination information of the reference ruled line on the image, and a skew correction unit that performs skew correction on the item coordinates based on the calculated skew information. The character recognition device according to claim 1.
前記罫線探索部は、前記イメージの帳票IDの位置から、前記イメージ上で前記基準罫線を探索する
ことを特徴とする請求項1に記載の文字認識装置。
The character recognition device according to claim 1, wherein the ruled line search unit searches the reference ruled line on the image from the position of the form ID of the image.
撮影された帳票のイメージに基づき文字認識を行う文字認識方法において、
前記帳票の種類を特定する帳票ID及び当該帳票IDの位置を前記イメージから抽出する工程と、
前記抽出した帳票IDに基づき当該帳票に対応する定義情報を、帳票の定義情報が記憶された記憶部から獲得する工程と、
前記獲得された定義情報に含まれる罫線情報に基づき、前記イメージから当該帳票の基準罫線を探索する工程と、
前記獲得された定義情報に含まれ前記帳票の外形を基準とする項目座標を帳票IDの位置を基準とする座標に変換する工程と、
前記イメージ上での前記基準罫線の位置を用いて、前記項目座標を前記イメージに対応して補正する工程と、
前記補正された項目座標に基づき、文字認識を行う工程を含み、
前記イメージから抽出する工程は、前記イメージの帳票IDの位置を、前記帳票IDの文字の中で当該帳票の中央寄りの文字を基準に抽出する
ことを特徴とする文字認識方法
In a character recognition method that performs character recognition based on the image of a taken form,
Extracting the form ID identifying the form type and the position of the form ID from the image;
Obtaining definition information corresponding to the form based on the extracted form ID from a storage unit storing the form definition information;
Searching for a reference ruled line of the form from the image based on the ruled line information included in the acquired definition information;
Converting item coordinates included in the acquired definition information with reference to the outline of the form into coordinates based on the position of the form ID;
Correcting the item coordinates corresponding to the image using the position of the reference ruled line on the image;
Including character recognition based on the corrected item coordinates;
In the step of extracting from the image, the position of the form ID of the image is extracted with reference to a character closer to the center of the form in the form ID.
A character recognition method characterized by the above .
撮影された帳票のイメージに基づき文字認識を行う文字認識方法をコンピュータに実行させるプログラムにおいて、In a program that causes a computer to execute a character recognition method that performs character recognition based on a captured form image,
前記帳票の種類を特定する帳票ID及び当該帳票IDの位置を前記イメージから抽出するステップと、Extracting from the image a form ID specifying the form type and the position of the form ID;
前記抽出した帳票IDに基づき当該帳票に対応する定義情報を、帳票の定義情報が記憶された記憶部から獲得するステップと、Obtaining definition information corresponding to the form based on the extracted form ID from a storage unit storing the form definition information;
前記獲得された定義情報に含まれる罫線情報に基づき、前記イメージから当該帳票の基準罫線を探索するステップと、Searching for a reference ruled line of the form from the image based on the ruled line information included in the acquired definition information;
前記獲得された定義情報に含まれ前記帳票の外形を基準とする項目座標を帳票IDの位置を基準とする座標に変換するステップと、Converting item coordinates included in the acquired definition information based on the outline of the form into coordinates based on the position of the form ID;
前記イメージ上での前記基準罫線の位置を用いて、前記項目座標を前記イメージに対応して補正するステップと、Correcting the item coordinates corresponding to the image using the position of the reference ruled line on the image;
前記補正された項目座標に基づき、文字認識を行うステップを含み、Performing character recognition based on the corrected item coordinates;
前記イメージから抽出するステップは、前記イメージの帳票IDの位置を、前記帳票IDの文字の中で当該帳票の中央寄りの文字を基準に抽出するIn the step of extracting from the image, the position of the form ID of the image is extracted based on a character closer to the center of the form among the characters of the form ID.
ことを特徴とするプログラム。A program characterized by that.
JP2012168370A 2012-07-30 2012-07-30 Character recognition device Active JP5844698B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012168370A JP5844698B2 (en) 2012-07-30 2012-07-30 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012168370A JP5844698B2 (en) 2012-07-30 2012-07-30 Character recognition device

Publications (2)

Publication Number Publication Date
JP2014026592A JP2014026592A (en) 2014-02-06
JP5844698B2 true JP5844698B2 (en) 2016-01-20

Family

ID=50200143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012168370A Active JP5844698B2 (en) 2012-07-30 2012-07-30 Character recognition device

Country Status (1)

Country Link
JP (1) JP5844698B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6582499B2 (en) * 2015-03-31 2019-10-02 大日本印刷株式会社 Drug authentication system, drug authentication method, and program
JP6564136B2 (en) 2016-05-31 2019-08-21 株式会社Pfu Image processing apparatus, image processing method, and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0221385A (en) * 1988-07-11 1990-01-24 Hitachi Ltd Printer
JPH0488488A (en) * 1990-07-25 1992-03-23 Nec Corp Optical character reader
JP3031579B2 (en) * 1991-12-05 2000-04-10 株式会社日立製作所 How to specify the character recognition area of a form
JPH11143986A (en) * 1997-10-17 1999-05-28 Internatl Business Mach Corp <Ibm> Processing method and processor of bit map image and storage medium storing image processing program to process bit map image
JP4594638B2 (en) * 2004-03-30 2010-12-08 富士通株式会社 Medium processing apparatus, medium processing method, medium image processing apparatus, medium image processing program, and form

Also Published As

Publication number Publication date
JP2014026592A (en) 2014-02-06

Similar Documents

Publication Publication Date Title
US7999657B2 (en) Image registration method for image comparison and document authentication
US8155425B1 (en) Automated check detection and image cropping
JP5934762B2 (en) Document modification detection method by character comparison using character shape characteristics, computer program, recording medium, and information processing apparatus
JP5387193B2 (en) Image processing system, image processing apparatus, and program
US20200372248A1 (en) Certificate recognition method and apparatus, electronic device, and computer-readable storage medium
RU2631765C1 (en) Method and system of correcting perspective distortions in images occupying double-page spread
JP2012243307A (en) Method for detecting strain in input image, device for detecting strain in input image and computer readable medium
JPH11219407A (en) Document image recognizing device and storage medium for document image recognizing program
CN112183038A (en) Form identification and typing method, computer equipment and computer readable storage medium
US10970845B2 (en) Image processing apparatus, image processing method, and storage medium
JP4395188B2 (en) Document image recognition apparatus and storage medium for document image recognition program
JP6665595B2 (en) Character recognition device, method and program
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
US7079265B2 (en) Distortion correction device for correcting imaged object to produce plane image without distortion
JP5844698B2 (en) Character recognition device
JP4013060B2 (en) Image correction method and image correction apparatus
JP5940615B2 (en) Skew logic character recognition method, program, and portable terminal device for portable terminal device
JP3006466B2 (en) Character input device
JP2017199288A (en) Image processing device, image processing method and program
JP2006229685A (en) Distortion determination device for business form
CN113658039A (en) Method for determining splicing sequence of label images of medicine bottles
JP3223878B2 (en) Character string collating device, method and recording medium
JP4696239B2 (en) Method and apparatus for correcting inclination of character string
WO2022024835A1 (en) Image processing system, image processing method, image processing program, image processing server, and learning model
JP6878739B1 (en) Serial number etc. character string extraction server, method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151119

R150 Certificate of patent or registration of utility model

Ref document number: 5844698

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150