JP2008186399A - Character recognition device - Google Patents

Character recognition device Download PDF

Info

Publication number
JP2008186399A
JP2008186399A JP2007021656A JP2007021656A JP2008186399A JP 2008186399 A JP2008186399 A JP 2008186399A JP 2007021656 A JP2007021656 A JP 2007021656A JP 2007021656 A JP2007021656 A JP 2007021656A JP 2008186399 A JP2008186399 A JP 2008186399A
Authority
JP
Japan
Prior art keywords
barcode
type
size
distance
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007021656A
Other languages
Japanese (ja)
Other versions
JP4853313B2 (en
Inventor
Mitsuru Takiguchi
充 瀧口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2007021656A priority Critical patent/JP4853313B2/en
Publication of JP2008186399A publication Critical patent/JP2008186399A/en
Application granted granted Critical
Publication of JP4853313B2 publication Critical patent/JP4853313B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

<P>PROBLEM TO BE SOLVED: To reduce a processing time required from reading a form until specifying an area for reading characters. <P>SOLUTION: The kind of the form common to the size and position of a barcode in the form is sorted into the same form group. The information indicating the size of the barcode and the position of the barcode in the form and the form sorting information consisting of the form kind indicating the kind of the form (layout group table 60) are prestored in a storage unit 3 for every form group. The form sorting information is retrieved on the basis of the size of the barcode calculated from the image information of the form read by a form reading unit 2 and the position in the form, and the form kind is extracted. The kind of the form is specified from among the form kind, thereby detecting an area where the characters are present. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、公共料金や各種税金の払込用紙等の複数の書式が混在する帳票の文字を認識する文字認識装置に関する。   The present invention relates to a character recognition apparatus for recognizing characters of a form in which a plurality of formats such as utility fees and various tax payment forms are mixed.

従来の文字認識装置は、複数の書式が混在する帳票を処理する場合、予め人手で帳票を種類毎に分類する時間と労力を削減するため、帳票を画像入力手段で読取り、読取った画像から水平および垂直方向の罫線やその罫線の交点等を抽出し、さらに抽出した罫線やその罫線の交点等から枠構造の特徴を抽出し、予め各帳票の枠構造の特徴を登録した枠構造参照テーブルを参照して帳票を識別し、文字の読取り領域を検出するようにしている(例えば、特許文献1参照)。
特開平9−138837号公報(段落「0012」〜段落「0013」、図1)
In the case of processing a form in which a plurality of formats are mixed, the conventional character recognition device reads the form with an image input means in order to reduce the time and labor for manually classifying the form for each type in advance, and horizontally from the read image. A frame structure reference table in which the features of the frame structure are extracted from the extracted ruled lines and the intersections of the ruled lines, and the frame structure features of each form are registered in advance. The form is identified with reference to detect the character reading area (see, for example, Patent Document 1).
JP-A-9-138837 (paragraph “0012” to paragraph “0013”, FIG. 1)

しかしながら、近年、電気料金、ガス料金、電話料金等の公共料金や各種税金等を支払うための払込用紙等のように多数の書式の帳票が存在するようになってきている状況下において、上述した従来の技術では、抽出した帳票の枠構造の特徴と予め各帳票の枠構造の特徴を登録した枠構造参照テーブルとを照合して帳票を識別する処理を行い、文字の読取り領域を検出するようにしているため、その枠構造参照テーブルには多数の書式の帳票の枠構造の特徴が登録され、登録された多数の枠構造の特徴と照合する必要があり、帳票を読取ってから文字の読取り領域を検出するまでに必要な処理の時間が長くなってしまうという問題がある。   In recent years, however, there have been many forms of forms such as electricity bills, gas bills, telephone bills and other public charges and payment forms for paying various taxes. In the conventional technique, a process for identifying a form is performed by comparing the extracted frame structure characteristics of the form with a frame structure reference table in which the frame structure characteristics of each form are registered in advance, so that the character reading area is detected. Therefore, the frame structure characteristics of a lot of forms must be registered in the frame structure reference table, and it must be checked against the characteristics of many registered frame structures. There is a problem that the processing time required to detect the region becomes long.

本発明は、このような問題を解決することを課題とする。   An object of the present invention is to solve such a problem.

そのため、本発明は、帳票読取部で読取った帳票の画像情報から抽出した特徴に基づいて帳票の種類を特定し、その帳票の種類に応じて決定される領域の文字を認識する文字認識装置において、帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一の帳票群になるように分類し、その帳票群毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなる帳票分類情報を予め記憶する記憶部と、読み取った帳票の画像情報からバーコードの大きさおよび帳票における位置を算出するバーコード検出手段と、前記バーコード検出手段が算出したバーコードの大きさおよび帳票における位置に基づいて前記記憶部に記憶された帳票分類情報を検索して帳票種別を抽出する帳票識別手段と、読み取った帳票の画像情報から抽出した特徴を前記帳票識別手段が抽出した帳票種別毎の特徴と照合し、帳票の種類を特定して文字が存在する領域を検出する認識領域抽出手段とを設け、帳票のバーコードの大きさおよび帳票における位置に基づいて抽出した帳票種別の中から帳票の種類を特定して文字が存在する領域を検出するようにしたことを特徴とする。   Therefore, the present invention provides a character recognition apparatus that identifies a type of a form based on features extracted from image information of a form read by a form reading unit and recognizes characters in an area determined according to the type of form. Classify forms that share the same barcode size and barcode position in the form into the same form group. For each form group, the barcode size and barcode position in the form A storage unit that preliminarily stores form classification information that includes information indicating the form and a form type indicating the form type, a barcode detection unit that calculates the size of the barcode and the position in the form from the image information of the read form, Based on the barcode size calculated by the barcode detection means and the position in the form, the form classification information stored in the storage unit is searched for the form. A form identification means for extracting another, and a feature extracted from the image information of the read form is compared with a feature for each form type extracted by the form identification means, and the area where the character exists is detected by specifying the type of the form A recognition area extracting means for detecting the area where the character exists by identifying the form type from the form types extracted based on the size of the form barcode and the position in the form. Features.

このようにした本発明は、帳票の枠構造の特徴に基づいて検索する対象となる帳票種別を少なくすることができ、帳票を読取ってから文字の読取り領域を特定するまでに必要な処理の時間を短縮することができるという効果が得られる。   The present invention thus configured can reduce the types of forms to be searched based on the characteristics of the form frame structure, and the processing time required from when the form is read until the character reading area is specified. Can be shortened.

以下、図面を参照して本発明による文字認識装置の実施例を説明する。   Embodiments of a character recognition apparatus according to the present invention will be described below with reference to the drawings.

まず、第1の実施例について説明する。
図1は実施例における文字認識装置の構成を示すブロック図である。
図1において、1は文字認識装置であり、公共料金や各種税金の払込用紙等のバーコードが印刷された帳票の画像を読取り、その帳票に印刷された文字を認識するOCR(Optical Character Reader)装置等である。
First, the first embodiment will be described.
FIG. 1 is a block diagram showing the configuration of the character recognition apparatus in the embodiment.
In FIG. 1, reference numeral 1 denotes a character recognition device, which reads an image of a form on which a barcode such as a utility bill or various tax payment forms is printed, and recognizes the character printed on the form, OCR (Optical Character Reader). Device.

2は帳票読取部であり、CCD(Charge Coupled Device)カメラ等で構成され、一次元に配置されたイメージセンサである。この帳票読取部2は、所定の線密度で帳票に印刷された個々のバーコードに直交する方向(帳票の横方向)に走査し、帳票に印刷されたバーコードや文字を「1」、背景を「0」に2値化された画像情報を出力するものである。   Reference numeral 2 denotes a form reading unit, which is an image sensor that is configured by a CCD (Charge Coupled Device) camera or the like and is arranged one-dimensionally. The form reading unit 2 scans in a direction (horizontal direction of the form) orthogonal to each barcode printed on the form with a predetermined linear density, and displays the barcode and characters printed on the form as “1”, background The image information binarized to “0” is output.

したがって出力された画像情報は、帳票の縦方向および横方向が所定の画素数で構成されている。
3は記憶部であり、メモリ素子や磁気ディスク等で構成され、情報を記憶し、また記憶した情報を読み出すことができるものである。
31は帳票イメージメモリであり、帳票読取部2で読み取った帳票の画像情報を記憶するためのものである。
Therefore, the output image information is composed of a predetermined number of pixels in the vertical and horizontal directions of the form.
Reference numeral 3 denotes a storage unit which is composed of a memory element, a magnetic disk, or the like, and stores information and can read the stored information.
A form image memory 31 stores image information of the form read by the form reading unit 2.

32は帳票辞書であり、帳票の種類を識別するための情報を記憶するものである。この帳票辞書32は、帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一のグループ(帳票群)になるように分類し、そのグループ(帳票群)毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなり、帳票のバーコードの位置や大きさからその帳票が属するグループを抽出するためのレイアウトグループテーブル(帳票分類情報)、および帳票の枠構造から帳票の種類を識別するための枠構造参照テーブル等を予め記憶する。   A form dictionary 32 stores information for identifying the type of form. This form dictionary 32 classifies the types of forms having the same barcode size and the same barcode position in the form so as to be in the same group (form group), and sets a bar for each group (form group). A layout group table (form) for extracting the group to which the form belongs from the position and size of the bar code of the form, consisting of information indicating the size of the code and the position of the barcode in the form and the form type indicating the type of form. Classification information), a frame structure reference table for identifying the type of form from the form frame structure, and the like are stored in advance.

ここで、レイアウトグループテーブルを図6の実施例におけるレイアウトグループテーブルの説明図に基づいて説明する。
図6(a)は帳票例の説明図であり、51は帳票A、52は帳票B、53は帳票Cを表し、いずれの帳票もバーコード501が印刷等されているものとする。なお、バーコードとは、2次元コードを含む概念である。
Here, the layout group table will be described based on the explanatory diagram of the layout group table in the embodiment of FIG.
FIG. 6A is an explanatory diagram of a form example, in which 51 represents a form A, 52 represents a form B, 53 represents a form C, and a barcode 501 is printed on each form. The bar code is a concept including a two-dimensional code.

図6(a)において、帳票A51および帳票C53のバーコード501の幅xw_1および高さyw_1、帳票A51および帳票C53の左端からバーコード501の左端までの距離xl_1、帳票A51および帳票C53の右端からバーコード501の右端までの距離xr_1、帳票A51および帳票C53の下端からバーコード501の下端までの距離yb_1、および帳票A51および帳票C53の上端からバーコード501の上端までの距離yt_1であることを示している。   In FIG. 6A, the width xw_1 and height yw_1 of the barcode 501 of the form A51 and the form C53, the distance xl_1 from the left end of the form A51 and the form C53 to the left end of the barcode 501, and the right end of the form A51 and the form C53. A distance xr_1 to the right end of the barcode 501; a distance yb_1 from the lower ends of the forms A51 and C53 to the lower end of the barcode 501; and a distance yt_1 from the upper ends of the forms A51 and C53 to the upper end of the barcode 501. Show.

また、帳票B52のバーコード501の幅xw_2および高さyw_2、帳票B52の左端からバーコード501の左端までの距離xl_2、帳票B52の右端からバーコード501の右端までの距離xr_2、帳票B52の下端からバーコード501の下端までの距離yb_2、および帳票B52の上端からバーコード501の上端までの距離yt_2であることを示している。   Also, the width xw_2 and height yw_2 of the barcode 501 of the form B52, the distance xl_2 from the left end of the form B52 to the left end of the barcode 501, the distance xr_2 from the right end of the form B52 to the right end of the barcode 501, and the lower end of the form B52 The distance yb_2 from the lower end of the barcode 501 to the lower end of the barcode 501 and the distance yt_2 from the upper end of the form B52 to the upper end of the barcode 501 are shown.

ここで、バーコード501の大きさと位置が共通する帳票を同一のグループとなるように分類するものとし、本実施例では、帳票A51および帳票C53をレイアウトグループ1、帳票B52をレイアウトグループ2とする。
図6(b)はレイアウトグループテーブルの構成を示す説明図であり、レイアウトグループテーブル60はレイアウトグループ61、バーコード501の幅XW62、バーコード501の高さYW63、帳票50の左端からバーコード501の左端までの距離XL64、帳票50の右端からバーコード501の右端までの距離XR65、帳票50の上端からバーコード501の上端までの距離YT66、帳票50の下端からバーコード501の下端までの距離YB67、および帳票種別68で構成されている。
Here, it is assumed that the forms having the same size and position of the barcode 501 are classified into the same group, and in this embodiment, the form A51 and the form C53 are the layout group 1 and the form B52 is the layout group 2. .
FIG. 6B is an explanatory diagram showing the configuration of the layout group table. The layout group table 60 includes a layout group 61, a width XW62 of the barcode 501, a height YW63 of the barcode 501, and a barcode 501 from the left end of the form 50. The distance XL64 from the left end of the form 50, the distance XR65 from the right end of the form 50 to the right end of the barcode 501, the distance YT66 from the upper end of the form 50 to the upper end of the barcode 501, and the distance from the lower end of the form 50 to the lower end of the barcode 501 It consists of YB67 and form type 68.

本実施例では、レイアウトグループ61の「1」に、バーコード501の幅XW62がxw_1、高さYW63がyw_1、帳票50の左端からバーコード501の左端までの距離XL64がxl_1、帳票50の右端からバーコード501の右端までの距離XR65がxr_1、帳票50の上端からバーコード501の上端までの距離YT66がyt_1、帳票50の下端からバーコード501の下端までの距離YB67がyb_1、帳票種別68が「帳票A」、「帳票C」となるように対応付けられ、またレイアウトグループ61の「2」に、バーコード501の幅XW62がxw_2、高さYW63がyw_2、帳票50の左端からバーコード501の左端までの距離XL64がxl_2、帳票50の右端からバーコード501の右端までの距離XR65がxr_2、帳票50の上端からバーコード501の上端までの距離YT66がyt_2、帳票50の下端からバーコード501の下端までの距離YB67がyb_2、帳票種別68が「帳票B」となるように対応付けられているものとする。   In this embodiment, the width XW62 of the barcode 501 is xw_1, the height YW63 is yw_1, the distance XL64 from the left end of the form 50 to the left end of the barcode 501 is xl_1, and the right end of the form 50 is “1” in the layout group 61. XR65 from the top edge of the barcode 501 to xr_1, the distance YT66 from the top edge of the form 50 to the top edge of the barcode 501 is yt_1, the distance YB67 from the bottom edge of the form 50 to the bottom edge of the barcode 501 is yb_1, the form type 68 Are associated with “form A” and “form C”, and the width XW62 of the barcode 501 is xw_2, the height YW63 is yw_2, and the barcode from the left end of the form 50 is associated with “2” of the layout group 61. The distance XL64 to the left end of 501 is xl_2, from the right end of the form 50 to the right end of the barcode 501 The distance XR65 is xr_2, the distance YT66 from the upper end of the form 50 to the upper end of the barcode 501 is yt_2, the distance YB67 from the lower end of the form 50 to the lower end of the barcode 501 is yb_2, and the form type 68 is “form B”. Assume that they are associated with each other.

このようにレイアウトグループテーブル60は、多数ある帳票の種類をバーコード501の大きさと位置が共通する帳票を同一のグループとなるように分類して記憶するものであり、このレイアウトグループテーブル60を参照し、帳票のバーコードの位置や大きさからその帳票が属するグループを抽出することができる。
また、枠構造参照テーブルは、予め各帳票の枠構造の特徴を示す枠構造特徴情報(例えば、表を構成する罫線の始点や終点、交点の座標情報)を登録したものであり、帳票読取部2で読取った帳票の画像情報から画像から水平および垂直方向の罫線やその罫線の交点等を抽出し、さらに抽出した罫線やその罫線の交点等から枠構造の特徴情報を抽出し、その枠構造の特徴情報と枠構造参照テーブルの枠構造特徴情報とを照合して帳票の種類を識別することができるものである。
As described above, the layout group table 60 classifies and stores a large number of form types so that forms having the same size and position of the barcode 501 are grouped together, and the layout group table 60 is referred to. The group to which the form belongs can be extracted from the position and size of the barcode of the form.
In addition, the frame structure reference table is a table in which frame structure feature information (for example, coordinate information of the start point, end point, and intersection point of the ruled lines constituting the table) indicating the characteristics of the frame structure of each form is registered. The horizontal and vertical ruled lines and intersections of the ruled lines are extracted from the image information of the form read in step 2, and the frame structure feature information is extracted from the extracted ruled lines and the intersections of the ruled lines. The type of form can be identified by comparing the feature information of the frame and the frame structure feature information of the frame structure reference table.

図1に戻り、33は認識領域データメモリであり、文字認識の処理が必要な帳票の領域の画像情報を記憶するためのものである。
このように記憶部3は、帳票イメージメモリ31、帳票辞書32、および認識領域データメモリ33等で構成されている。
なお、記憶部3は帳票イメージメモリ31、帳票辞書32、および認識領域データメモリ33の他、文字認識装置1を制御するために必要な制御プログラム(ソフトウェア)や各種情報を記憶するものとする。
Returning to FIG. 1, reference numeral 33 denotes a recognition area data memory for storing image information of a form area that requires character recognition processing.
As described above, the storage unit 3 includes the form image memory 31, the form dictionary 32, the recognition area data memory 33, and the like.
The storage unit 3 stores a control program (software) and various information necessary for controlling the character recognition device 1 in addition to the form image memory 31, the form dictionary 32, and the recognition area data memory 33.

4は制御部であり、CPU(Central Processing Unit)等の演算および制御手段等で構成され、帳票読取部2、記憶部3を含めて文字認識装置1全体の動作を記憶部3に格納された制御プログラム(ソフトウェア)に基づいて制御する。
また、制御部4は帳票イメージメモリ31に記憶された帳票の画像情報からバーコードを検出し、さらにそのバーコードの大きさや帳票における位置を検出するバーコード検出手段41、検出したバーコードの大きさや位置の情報に基づいて帳票辞書32のレイアウトグループテーブル60を検索して帳票種別を抽出する帳票識別手段42、帳票の画像情報から枠構造の特徴を抽出し、その枠構造の特徴と帳票識別手段42が抽出した帳票種別毎の枠構造の特徴(枠構造参照テーブルに記憶された枠構造の特徴)とを照合し、帳票の種類を特定して文字が存在する領域を検出する認識領域抽出手段43、抽出した文字が存在する領域の文字を認識する文字認識手段44等で構成されている。
Reference numeral 4 denotes a control unit, which is configured by calculation and control means such as a CPU (Central Processing Unit), and the operation of the entire character recognition device 1 including the form reading unit 2 and the storage unit 3 is stored in the storage unit 3. Control based on a control program (software).
In addition, the control unit 4 detects a barcode from the image information of the form stored in the form image memory 31, and further detects the size of the barcode and the position in the form, and the size of the detected barcode. Based on the information on the sheath position, the form identification means 42 for searching the layout group table 60 of the form dictionary 32 and extracting the form type, the feature of the frame structure is extracted from the image information of the form, and the feature of the frame structure and the form identification Recognizing region extraction that collates with the characteristics of the frame structure for each form type extracted by the means 42 (characteristics of the frame structure stored in the frame structure reference table), identifies the form type, and detects the area where the character exists Means 43, character recognition means 44 for recognizing characters in the area where the extracted characters exist, and the like.

このように構成された文字認識装置1は、帳票読取部2で帳票を読み取り、その帳票の画像情報から文字認識が必要な領域を抽出し、その領域の画像情報に基づいて文字認識を行う。

上述した構成の作用について説明する。
The character recognition device 1 configured as described above reads a form by the form reading unit 2, extracts an area that requires character recognition from the image information of the form, and performs character recognition based on the image information of the area.

The operation of the above configuration will be described.

図2は実施例における文字認識装置の処理の流れを示すフローチャートであり、図中Sで表すステップにしたがって説明する。
なお、以下に説明する各部の動作は、図示しないメモリや磁気ディスク等の記憶手段に格納されたプログラム(ソフトウェア)に基づいて図示しない中央処理装置等の制御手段により制御される。
FIG. 2 is a flowchart showing the flow of processing of the character recognition apparatus in the embodiment, which will be described in accordance with steps represented by S in the figure.
The operation of each unit described below is controlled by a control unit such as a central processing unit (not shown) based on a program (software) stored in a storage unit such as a memory or a magnetic disk (not shown).

S1:文字認識装置1の制御部4の指示により帳票読取部2は帳票を読み取り、読み取った帳票の画像情報を帳票イメージメモリ31に記憶させる。
S2:読み取った帳票の画像情報を帳票イメージメモリ31に記憶させるとバーコード検出手段41は帳票に印刷されたバーコードを検出する処理を行う。
ここで、バーコードを検出する処理を説明する。
S1: In response to an instruction from the control unit 4 of the character recognition device 1, the form reading unit 2 reads the form, and stores the image information of the read form in the form image memory 31.
S2: When the image information of the read form is stored in the form image memory 31, the barcode detecting means 41 performs a process of detecting the barcode printed on the form.
Here, a process for detecting a barcode will be described.

まず、バーコード検出手段41は、図3に示すように帳票50を図中の矢印が示す方向、すなわち帳票50に印刷された個々のバーコードに直交する方向(帳票の横方向)に走査して読み取った帳票50の画像情報を帳票イメージメモリ31から読み出し、その画像情報から数値「1」で表される黒いバーおよび数値「0」で表される白いバーが交互に出現する部分をバーコード501として検出する。   First, as shown in FIG. 3, the bar code detecting means 41 scans the form 50 in the direction indicated by the arrow in the figure, that is, in the direction orthogonal to the individual barcode printed on the form 50 (the horizontal direction of the form). The image information of the form 50 read in this way is read from the form image memory 31, and a bar where a black bar represented by a numerical value “1” and a white bar represented by a numerical value “0” appear alternately from the image information is barcoded. Detected as 501.

このように帳票50に印刷された個々のバーコードに直交する方向(帳票の横方向)に走査して読み取るようにすることでバーコード501を検出する処理の期間を短くすることができる。
なお、バーコード501以外の文字が印刷された部分も解析の対象となるがその部分は公知の解析処理によりバーコードでないと判定されるものとする。
By scanning and reading in the direction orthogonal to the individual barcodes printed on the form 50 (the horizontal direction of the form) in this way, the processing period for detecting the barcode 501 can be shortened.
Note that a portion on which characters other than the barcode 501 are printed is also an object of analysis, but it is determined that the portion is not a barcode by a known analysis process.

また、上記以外のバーコード501を検出する方法として、読み取った帳票の画像情報を帳票イメージメモリ31に記憶させる際に、低解像度の画像(1次画像)を取得し、バーコード検出手段41は1次画像に対してバーコード候補の検出を行う。
検出したバーコード候補の領域を、帳票イメージメモリ31において高解像度の画像(2次画像)に変換し、バーコード検出手段41がバーコード候補の領域内からバーコードを検出する方法としてもよい。
Further, as a method for detecting the barcode 501 other than the above, when the image information of the read form is stored in the form image memory 31, a low resolution image (primary image) is acquired, and the barcode detecting means 41 Barcode candidates are detected for the primary image.
The detected barcode candidate area may be converted into a high-resolution image (secondary image) in the form image memory 31, and the barcode detection means 41 may detect the barcode from the barcode candidate area.

このように、低解像度(1次画像)で大まかにバーコード候補領域を特定してから、通常の解像度(2次画像)でバーコードを検出するため、処理時間を短縮することが出来る。
バーコード501として検出するとバーコード検出手段41は、帳票の画像情報の画素数から図4に示すようにバーコード501の幅XWおよび高さYWを算出する。すなわち、バーコード501の大きさを算出する。
As described above, since a barcode candidate area is roughly specified with a low resolution (primary image) and then a barcode is detected with a normal resolution (secondary image), the processing time can be shortened.
When detected as a barcode 501, the barcode detection means 41 calculates the width XW and height YW of the barcode 501 from the number of pixels of the image information of the form as shown in FIG. That is, the size of the barcode 501 is calculated.

次に、バーコード検出手段41は、帳票の画像情報の画素数から図5に示すように帳票50の左端からバーコード501の左端までの距離XL、帳票50の右端からバーコード501の右端までの距離XR、帳票50の下端からバーコード501の下端までの距離YB、および帳票50の上端からバーコード501の上端までの距離YTを算出する。すなわち、帳票50におけるバーコード501の位置を算出する。   Next, the barcode detection unit 41 determines the distance XL from the left end of the form 50 to the left end of the barcode 501 from the number of pixels of the image information of the form, from the right end of the form 50 to the right end of the barcode 501 as shown in FIG. Distance XR, a distance YB from the lower end of the form 50 to the lower end of the barcode 501, and a distance YT from the upper end of the form 50 to the upper end of the barcode 501 are calculated. That is, the position of the barcode 501 in the form 50 is calculated.

S3:バーコード501の大きさ、位置を算出すると帳票識別手段42は算出したバーコード501の幅XWおよび高さYW、帳票50の左端からバーコード501の左端までの距離XL、帳票50の右端からバーコード501の右端までの距離XR、帳票50の下端からバーコード501の下端までの距離YB、および帳票50の上端からバーコード501の上端までの距離YTに基づいて帳票辞書32に記憶されたレイアウトグループテーブル60のバーコード501の幅XW62、高さYW63、帳票50の左端からバーコード501の左端までの距離XL64、帳票50の右端からバーコード501の右端までの距離XR65、帳票50の上端からバーコード501の上端までの距離YT66、帳票50の下端からバーコード501の下端までの距離YB67を検索して帳票種別68を抽出する。   S3: When the size and position of the bar code 501 are calculated, the form identifying means 42 calculates the width XW and height YW of the bar code 501, the distance XL from the left end of the form 50 to the left end of the bar code 501, the right end of the form 50 To the right end of the barcode 501, the distance YB from the lower end of the form 50 to the lower end of the barcode 501, and the distance YT from the upper end of the form 50 to the upper end of the barcode 501 are stored in the form dictionary 32. The width XW62 and height YW63 of the bar code 501 of the layout group table 60, the distance XL64 from the left end of the form 50 to the left end of the bar code 501, the distance XR65 from the right end of the form 50 to the right end of the bar code 501, and the The distance YT66 from the upper end to the upper end of the barcode 501 and the barcode 501 from the lower end of the form 50 Searching for distance YB67 to bottom to extract the form type 68.

すなわち、読取ったバーコード501の大きさ、位置から帳票種別68を抽出する。
なお、算出したバーコード501の大きさおよび位置を示す各数値は、レイアウトグループテーブル60に記憶されている各数値と完全に一致する必要はなく、所定の範囲内にあればよいものとする。
例えば、読取ったバーコード501の幅XW62がxw_1、高さYW63がyw_1、帳票50の左端からバーコード501の左端までの距離XL64がxl_1、帳票50の右端からバーコード501の右端までの距離XR65がxr_1、帳票50の上端からバーコード501の上端までの距離YT66がyt_1、帳票50の下端からバーコード501の下端までの距離YB67がyb_1であった場合、帳票種別68は「帳票A」および「帳票C」が抽出される。
That is, the form type 68 is extracted from the size and position of the read barcode 501.
It should be noted that the numerical values indicating the size and position of the calculated barcode 501 do not have to completely match the numerical values stored in the layout group table 60, and may be within a predetermined range.
For example, the width XW62 of the read barcode 501 is xw_1, the height YW63 is yw_1, the distance XL64 from the left end of the form 50 to the left end of the barcode 501 is xl_1, and the distance XR65 from the right end of the form 50 to the right end of the barcode 501 Is xr_1, the distance YT66 from the upper end of the form 50 to the upper end of the barcode 501 is yt_1, and the distance YB67 from the lower end of the form 50 to the lower end of the barcode 501 is yb_1, the form type 68 is “form A” and “Form C” is extracted.

S4:認識領域抽出手段43は、帳票の画像情報から水平および垂直方向の罫線やその罫線の交点等を抽出し、さらに抽出した罫線やその罫線の交点等から枠構造の特徴を抽出し、予め各帳票の枠構造の特徴を記憶部3に記憶された枠構造参照テーブルを参照して帳票の種類を識別する。
本実施例では、抽出した枠構造の特徴と枠構造参照テーブルの「帳票A」または「帳票C」の枠構造の特徴とを照合し、「帳票A」または「帳票C」のいずれかであることを識別する。
S4: The recognition area extracting unit 43 extracts horizontal and vertical ruled lines and intersections of the ruled lines from the image information of the form, and further extracts features of the frame structure from the extracted ruled lines and the intersections of the ruled lines. The type of form is identified by referring to the frame structure reference table stored in the storage unit 3 for the characteristics of the frame structure of each form.
In this embodiment, the feature of the extracted frame structure is collated with the feature of the frame structure of “form A” or “form C” in the frame structure reference table, and it is either “form A” or “form C”. Identify that.

本実施例では、図6(a)に示すように罫線の枠が1段である場合、「帳票A」と判定し、2段である場合、「帳票C」と判定するものとする。
帳票の種類を識別すると認識領域抽出手段43は、予め記憶部3に記憶された文字の読取り領域を抽出し、その領域の画像情報を帳票イメージメモリ31から読み出して認識領域データメモリ33に記憶させる。
In this embodiment, as shown in FIG. 6A, when the ruled line frame has one stage, it is determined as “form A”, and when it has two stages, it is determined as “form C”.
When the type of form is identified, the recognition area extracting unit 43 extracts a character reading area stored in advance in the storage unit 3, reads the image information of the area from the form image memory 31, and stores it in the recognition area data memory 33. .

S5:文字認識手段44は認識領域データメモリ33に記憶された画像情報から文字を認識する処理を行う。
このようにして文字認識装置1は、バーコード501の大きさと位置が共通する帳票を同一のグループとなるように分類したレイアウトグループテーブル60を記憶部3に予め記憶しておき、帳票読取部2で読取った帳票の画像情報からバーコード検出手段41が帳票50のバーコード501の大きさ、位置を算出し、帳票識別手段42がそのバーコード501の大きさ、位置に基づいてレイアウトグループテーブル60を検索してグループ化された帳票種別68を抽出し、その帳票種別から帳票の枠構造の特徴に基づいて帳票の種類を識別してその帳票の文字を認識する処理を行う。
S5: The character recognition means 44 performs processing for recognizing characters from the image information stored in the recognition area data memory 33.
In this way, the character recognition device 1 stores in advance in the storage unit 3 the layout group table 60 in which the forms having the same size and position of the barcode 501 are classified into the same group, and the form reading unit 2 The bar code detection unit 41 calculates the size and position of the bar code 501 of the form 50 from the image information of the form read in step S4, and the form identification unit 42 determines the layout group table 60 based on the size and position of the bar code 501. The grouped form type 68 is extracted and the form type is identified from the form type based on the characteristics of the form frame structure to recognize the characters of the form.

以上説明したように、本実施例では、バーコードの大きさと位置が共通する帳票を同一のグループとなるように分類したレイアウトグループテーブルを記憶部に記憶し、読取った帳票の画像情報から算出したバーコードの大きさ、位置に基づいてそのレイアウトグループテーブルを検索してグループ化された帳票種別を抽出するようにしたことにより、帳票の枠構造の特徴に基づいて検索する対象となる帳票種別を少なくすることができ、帳票を読取ってから文字の読取り領域を特定するまでに必要な処理の時間を短縮することができるという効果が得られる。   As described above, in this embodiment, the layout group table in which forms having the same barcode size and position are classified into the same group is stored in the storage unit, and calculated from the image information of the read form. By searching the layout group table based on the size and position of the barcode and extracting the grouped form type, the form type to be searched based on the characteristics of the form frame structure It is possible to reduce the processing time, and the effect of shortening the processing time required from the time when the form is read until the character reading area is specified can be obtained.

実施例における文字認識装置の構成を示すブロック図The block diagram which shows the structure of the character recognition apparatus in an Example. 実施例における文字認識装置の処理の流れを示すフローチャートThe flowchart which shows the flow of a process of the character recognition apparatus in an Example. 実施例におけるバーコード検出方法の説明図Explanatory drawing of the barcode detection method in an Example 実施例におけるバーコードの大きさを算出する方法の説明図Explanatory drawing of the method of calculating the size of the barcode in the embodiment 実施例におけるバーコードの位置を算出する方法の説明図Explanatory drawing of the method of calculating the position of the barcode in the embodiment 実施例におけるレイアウトグループテーブルの説明図Explanatory drawing of the layout group table in an Example

符号の説明Explanation of symbols

1 文字認識装置
2 帳票読取部
3 記憶部
31 帳票イメージメモリ
32 帳票辞書
33 認識領域データメモリ
4 制御部
41 バーコード検出手段
42 帳票識別手段
43 認識領域抽出手段
44 文字認識手段
50、51、52、53 帳票
501 バーコード
DESCRIPTION OF SYMBOLS 1 Character recognition apparatus 2 Form reading part 3 Memory | storage part 31 Form image memory 32 Form dictionary 33 Recognition area data memory 4 Control part 41 Barcode detection means 42 Form identification means 43 Recognition area extraction means 44 Character recognition means 50, 51, 52, 53 Form 501 Barcode

Claims (2)

帳票読取部で読取った帳票の画像情報から抽出した特徴に基づいて帳票の種類を特定し、その帳票の種類に応じて決定される領域の文字を認識する文字認識装置において、
帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一の帳票群になるように分類し、その帳票群毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなる帳票分類情報を予め記憶する記憶部と、
読み取った帳票の画像情報からバーコードの大きさおよび帳票における位置を算出するバーコード検出手段と、
前記バーコード検出手段が算出したバーコードの大きさおよび帳票における位置に基づいて前記記憶部に記憶された帳票分類情報を検索して帳票種別を抽出する帳票識別手段と、
読み取った帳票の画像情報から抽出した特徴を前記帳票識別手段が抽出した帳票種別毎の特徴と照合し、帳票の種類を特定して文字が存在する領域を検出する認識領域抽出手段とを設け、
帳票のバーコードの大きさおよび帳票における位置に基づいて抽出した帳票種別の中から帳票の種類を特定して文字が存在する領域を検出するようにしたことを特徴とする文字認識装置。
In the character recognition device that identifies the type of form based on the features extracted from the image information of the form read by the form reading unit, and recognizes the characters in the area determined according to the type of the form,
The types of forms that have the same barcode size and the same barcode position in the form are classified into the same form group, and the barcode size and barcode position in the form are determined for each form group. A storage unit for preliminarily storing form classification information including information to be displayed and a form type indicating the type of form;
Barcode detecting means for calculating the size of the barcode and the position in the form from the image information of the read form;
A form identifying means for retrieving form classification information stored in the storage unit based on the barcode size calculated by the barcode detecting means and the position in the form, and extracting the form type;
Recognizing the feature extracted from the image information of the read form with the feature for each form type extracted by the form identifying means, providing a recognition area extracting means for identifying the form type and detecting the area where the character exists,
A character recognition apparatus characterized by detecting a region in which a character exists by specifying a form type from among the form types extracted based on the size of a form barcode and the position in the form.
請求項1の文字認識装置において、
前記バーコードの大きさは、バーコードの幅および高さ、
前記バーコードの帳票における位置は、帳票の左端からバーコードの左端までの距離、帳票の右端からバーコードの右端までの距離、帳票の下端からバーコードの下端までの距離、および帳票の上端からバーコードの上端までの距離としたことを特徴とする文字認識装置。
The character recognition device according to claim 1.
The size of the barcode is the width and height of the barcode,
The position of the barcode in the form is the distance from the left edge of the form to the left edge of the barcode, the distance from the right edge of the form to the right edge of the barcode, the distance from the bottom edge of the form to the bottom edge of the barcode, and the top edge of the form A character recognition device characterized in that the distance to the upper end of a bar code is used.
JP2007021656A 2007-01-31 2007-01-31 Character recognition device Active JP4853313B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007021656A JP4853313B2 (en) 2007-01-31 2007-01-31 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007021656A JP4853313B2 (en) 2007-01-31 2007-01-31 Character recognition device

Publications (2)

Publication Number Publication Date
JP2008186399A true JP2008186399A (en) 2008-08-14
JP4853313B2 JP4853313B2 (en) 2012-01-11

Family

ID=39729369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007021656A Active JP4853313B2 (en) 2007-01-31 2007-01-31 Character recognition device

Country Status (1)

Country Link
JP (1) JP4853313B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012240693A (en) * 2011-05-18 2012-12-10 Techno Medica Co Ltd Labeling device for automatic test tube preparation device
JP2014507037A (en) * 2011-02-28 2014-03-20 データロジック・アイピー・テック・エス・エール・エル Optical identification method for moving objects
US9654661B1 (en) 2015-12-22 2017-05-16 Fuji Xerox Co., Ltd. Image scanning device and method, image reading apparatus, and non-transitory computer readable medium that set a scanning area based on a detected location of a code image

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09160997A (en) * 1995-12-08 1997-06-20 Toshiba Corp Method and device for detecting bar code
JP2002024743A (en) * 2000-07-06 2002-01-25 Oki Electric Ind Co Ltd Image reading system and image reading method
JP2003168073A (en) * 2001-11-29 2003-06-13 Toshiba Corp Device and method for identifying slip and method for defining slip

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09160997A (en) * 1995-12-08 1997-06-20 Toshiba Corp Method and device for detecting bar code
JP2002024743A (en) * 2000-07-06 2002-01-25 Oki Electric Ind Co Ltd Image reading system and image reading method
JP2003168073A (en) * 2001-11-29 2003-06-13 Toshiba Corp Device and method for identifying slip and method for defining slip

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014507037A (en) * 2011-02-28 2014-03-20 データロジック・アイピー・テック・エス・エール・エル Optical identification method for moving objects
JP2012240693A (en) * 2011-05-18 2012-12-10 Techno Medica Co Ltd Labeling device for automatic test tube preparation device
US9654661B1 (en) 2015-12-22 2017-05-16 Fuji Xerox Co., Ltd. Image scanning device and method, image reading apparatus, and non-transitory computer readable medium that set a scanning area based on a detected location of a code image

Also Published As

Publication number Publication date
JP4853313B2 (en) 2012-01-11

Similar Documents

Publication Publication Date Title
US10824801B2 (en) Interactively predicting fields in a form
US11494573B2 (en) Self-checkout device to which hybrid product recognition technology is applied
US7120318B2 (en) Automatic document reading system for technical drawings
US20020061135A1 (en) Pattern recognizing apparatus and method
US20070168382A1 (en) Document analysis system for integration of paper records into a searchable electronic database
JP6527410B2 (en) Character recognition device, character recognition method, and program
JP6831951B2 (en) Image recognition system
JP6458239B1 (en) Image recognition system
JP7437837B2 (en) OCR-based document analysis system and method using virtual cells
JP5140820B2 (en) Symbol information reading apparatus and symbol information reading method
US20210073535A1 (en) Information processing apparatus and information processing method for extracting information from document image
JP3913985B2 (en) Character string extraction apparatus and method based on basic components in document image
CN106778717A (en) A kind of test and appraisal table recognition methods based on image recognition and k nearest neighbor
JP3078318B2 (en) Character recognition method and apparatus including locating and extracting predetermined data from a document
JP2000285190A (en) Method and device for identifying slip and storage medium
JP4853313B2 (en) Character recognition device
US10740638B1 (en) Data element profiles and overrides for dynamic optical character recognition based data extraction
JP5134383B2 (en) OCR device, trail management device and trail management system
JP3435374B2 (en) Character reading device and character recognition method
JP4046941B2 (en) Document format identification device and identification method
JP4221960B2 (en) Form identification device and identification method thereof
JP6941331B2 (en) Image recognition system
JPH0528310A (en) Form type document identification device
JP2010061449A (en) Device and program for searching original image
JPH11184965A (en) Slip identification register device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111010

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4853313

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150