JP2002366893A - Document recognizing method - Google Patents

Document recognizing method

Info

Publication number
JP2002366893A
JP2002366893A JP2001173631A JP2001173631A JP2002366893A JP 2002366893 A JP2002366893 A JP 2002366893A JP 2001173631 A JP2001173631 A JP 2001173631A JP 2001173631 A JP2001173631 A JP 2001173631A JP 2002366893 A JP2002366893 A JP 2002366893A
Authority
JP
Japan
Prior art keywords
character
recognition
item name
area
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001173631A
Other languages
Japanese (ja)
Inventor
Tatsumi Tsutsui
達巳 筒井
Shigeru Watanabe
成 渡辺
Eisuke Asano
英輔 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001173631A priority Critical patent/JP2002366893A/en
Publication of JP2002366893A publication Critical patent/JP2002366893A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a document recognizing method which can improve the recognition precision. SOLUTION: The document recognizing method which limits a document kind for an inputted document image (104), recognizes characters of the document image with the limited document kind (104), and outputs the recognition result to a host device (108) is characterized in that when the character recognition of a recognition request area in the document image is performed, a character string equivalent to a character string entered into the recognition request area which is detected in an area other than the recognition request area and the recognition result are merged and outputted to the host device.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票認識方法に係
わり、特に連紙帳票等の等価の内容が複数記載されてい
る帳票を認識する帳票認識方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form recognition method, and more particularly to a form recognition method for recognizing a form having a plurality of equivalent contents, such as a continuous form.

【0002】[0002]

【従来の技術】従来の帳票認識方法では、特開2000
−251012号公報に記載されているように、画像入
力手段から入力された帳票イメージに対して、帳票種類
を1種類に限定し、限定された帳票種の文字認識要求領
域のみに対して文字認識を実行し、認識結果を上位装置
に出力している。また、文字認識実行時に字種を限定す
る場合、予め帳票種類毎に使用する字種を登録する必要
がある。
2. Description of the Related Art A conventional form recognition method is disclosed in
As described in Japanese Patent Laid-Open No. 25012/1992, the form type is limited to one for the form image input from the image input means, and the character recognition is performed only in the character recognition request area of the limited form type. And outputs the recognition result to the host device. When character types are limited during character recognition, it is necessary to register character types to be used for each form type in advance.

【0003】[0003]

【発明が解決しようとする課題】現在使用されている殆
どの帳票は、“項目名”(例“住所”)が記載されてお
り“項目名”に対する記入文字(例“愛知県尾張旭
市”)を項目名付近の右の位置、若しくは下の位置に記
入している。
Most of the forms currently used include an "item name" (eg, "address") and a character for the "item name" (eg, "Owariasahi-shi, Aichi"). Is written in the right position near the item name or in the lower position.

【0004】従来の帳票認識方法では、例えば住所や金
額などの“項目名”に対する記入文字を取得したい場
合、取得したい情報を帳票中の全領域から検索すると処
理時間が増大し、また罫線と文字等の接触により行が正
しく抽出されず、十分な認識精度が得られないため、帳
票毎のレイアウト上の特徴より帳票種を限定して、限定
された帳票で取得したい“項目名”に対する記入文字の
記載領域が予め登録されている帳票フォーマット定義フ
ァイルを参照して特定領域に対してのみ、文字認識処理
を行っている。
In the conventional form recognition method, when it is desired to obtain characters to be entered for an "item name" such as an address or an amount of money, the processing time increases if information to be obtained is searched from all areas in the form, and a ruled line and a character Lines are not correctly extracted due to contact such as, and sufficient recognition accuracy cannot be obtained. Therefore, the form type is limited based on the layout characteristics of each form, and the characters to be entered for the "item name" that you want to obtain with the limited form The character recognition process is performed only for a specific area with reference to a form format definition file in which the description area is registered in advance.

【0005】ここで、帳票中に取得したい“項目名”に
対する記入文字が異なる領域に複数記載されている場
合、従来の帳票フォーマット定義ファイルでは、その中
で最も認識することが容易と思われる1つの領域を登録
していた。しかし、この方法では、実際の帳票で帳票フ
ォーマット定義ファイルに登録した領域にノイズやかす
れがあり、同じ内容が記載されている別の領域にはノイ
ズやかすれがない場合に文字を認識できないというケー
スが発生する。また、帳票フォーマット定義ファイルの
文字認識要求領域を認識する際、認識精度を向上させる
一手段として、“項目名”に対する記入文字の字種を限
定して認識する方法が提案されている。しかし、この方
法では、帳票フォーマット定義ファイル作成時に“項目
名”に対する記入文字の字種を作業者が帳票毎に登録す
る必要があり、負荷を増大させている。
[0005] Here, when a plurality of characters for "item name" to be obtained in a form are described in different areas, the conventional form format definition file seems to be the easiest to recognize among them. Had registered one area. However, in this method, there is a case where noise or blur is present in the area registered in the form format definition file in the actual form and characters cannot be recognized if there is no noise or blur in another area where the same contents are described. Occurs. As a means for improving the recognition accuracy when recognizing the character recognition request area of the form format definition file, a method has been proposed in which the character type of the character entered for the "item name" is limited. However, in this method, when creating a form format definition file, the operator needs to register the character type of the character to be entered for the "item name" for each form, which increases the load.

【0006】本発明の目的は、認識精度を向上すること
が可能な帳票認識方法を提供することにある。
An object of the present invention is to provide a form recognition method capable of improving recognition accuracy.

【0007】本発明の他の目的は、作業者の作業を軽減
することが可能な帳票認識方法を提供することにある。
Another object of the present invention is to provide a form recognition method capable of reducing the work of an operator.

【0008】[0008]

【課題を解決するための手段】本発明は、入力された帳
票イメージに対して帳票種を限定し、限定した帳票種で
前記帳票イメージに対して文字認識を行い、認識結果を
上位装置に出力する帳票認識方法において、前記限定し
た帳票種において、前記帳票イメージ内の認識要求領域
に対して文字認識を行う際、前記認識要求領域に記載さ
れている文字列と等価の文字列を前記認識要求領域以外
の領域から検出し認識結果を統合して前記上位装置に出
力することを特徴とする帳票認識方法である。
According to the present invention, a form type is limited for an input form image, character recognition is performed on the form image with the limited form type, and a recognition result is output to a host device. In the form recognition method, when performing character recognition on a recognition request area in the form image in the limited form type, a character string equivalent to a character string described in the recognition request area is requested by the recognition request. A form recognition method characterized by detecting from an area other than an area, integrating recognition results, and outputting the result to the host device.

【0009】本発明は、前記限定した帳票種において、
前記帳票イメージ内の認識要求領域に対して文字認識を
行う際、文字認識で使用する字種を限定して認識を行う
ことを特徴とする帳票認識方法である。
[0009] The present invention provides the above-mentioned limited form type,
A form recognition method characterized in that when performing character recognition on a recognition request area in the form image, character types used in character recognition are limited and recognition is performed.

【0010】[0010]

【発明の実施の形態】図1は本発明の帳票認識方法を適
用した帳票認識装置の実施の形態を示す構成図である。
図1において、101は帳票を認識する帳票認識部、1
02はイメージスキャナ、108は上位アップリケーシ
ョンである。帳票認識部101は帳票識別部103と文
字認識部104と文字認識結果解析部105と認識結果
統合部106と認識結果出力部107とを有する。
FIG. 1 is a block diagram showing an embodiment of a form recognition apparatus to which a form recognition method of the present invention is applied.
In FIG. 1, reference numeral 101 denotes a form recognition unit for recognizing a form;
02 is an image scanner, and 108 is a higher application. The form recognition unit 101 includes a form identification unit 103, a character recognition unit 104, a character recognition result analysis unit 105, a recognition result integration unit 106, and a recognition result output unit 107.

【0011】帳票識別部103は、イメージスキャナ1
02から入力された帳票の帳票イメージに対して、帳票
毎のレイアウト上の特徴が登録されている帳票レイアウ
ト定義ファイル109を参照して帳票種を決定する。文
字認識部104では、入力された文字認識要求領域に対
して帳票フォーマット定義ファイル110と字種別文字
辞書111を使用して文字認識を行い、文字認識結果解
析部105で、認識結果に応じて、認識結果補完のため
の文字認識を行うか否かを判断し、補完のための文字認
識を行う場合は、共通知識データベース112と項目名
単語照合辞書113を参照して文字認識を行うための前
処理を行う。認識結果統合部106では、帳票フォーマ
ット定義ファイル110に登録してある文字認識要求領
域の文字認識結果と、認識結果補完のために行われた文
字認識結果を統合し、認識結果出力部107で、文字認
識結果を上位アプリケーション108に出力する。上位
アプリケーション108は、例えば入力された文字認識
結果をディスプレイに表示させるといった機能を持つ装
置を示す。
The form identification unit 103 includes the image scanner 1
With respect to the form image of the form input from 02, the form type is determined with reference to the form layout definition file 109 in which the layout characteristics of each form are registered. The character recognition unit 104 performs character recognition on the input character recognition request area using the form format definition file 110 and the character type character dictionary 111, and the character recognition result analysis unit 105 It is determined whether or not to perform character recognition for complementing the recognition result. When performing character recognition for complementation, the character recognition for completion is performed by referring to the common knowledge database 112 and the item name / word collation dictionary 113. Perform processing. The recognition result integrating unit 106 integrates the character recognition result of the character recognition request area registered in the form format definition file 110 with the character recognition result performed for complementing the recognition result, and the recognition result output unit 107 The character recognition result is output to the host application 108. The upper application 108 indicates an apparatus having a function of displaying the input character recognition result on a display, for example.

【0012】図2は帳票201の例およびその帳票の取
得したい情報の位置が登録されている図1の帳票フォー
マット定義ファイル110の例と、項目名毎の関連と項
目名に対する記入文字の字種が登録されていて全ての帳
票で共通に参照する図1の共通知識データベース112
の例と、字種毎の辞書を示す字種別文字辞書111の例
を示す。
FIG. 2 shows an example of a form 201 and an example of the form format definition file 110 of FIG. 1 in which the position of information to be acquired of the form is registered. Is registered and is commonly referred to in all the forms.
And an example of a character type character dictionary 111 indicating a dictionary for each character type.

【0013】帳票201は、予め印刷されている項目名
205,206,207,208と、個々の帳票毎に手
書き若しくは活字で記入される209,210,21
1,212からなる。帳票フォーマット定義ファイル1
10には、当該帳票の項目名205,206と項目名に
対する記入文字209,210を含む領域をそれぞれ
“文字認識要求矩形左上位置 − 文字認識要求矩形右下
位置”で登録する。共通知識データベース112は、任
意の帳票で使用される項目名毎の関係と項目名に対する
記入文字の字種を“項目名1 = 項目名2 = 項目名3
: 字種A”で登録する。この時、“=”で結ばれる項
目名は等価を示すとし、項目名が等価であれば項目名に
対する記入文字も等価であると考えられる。字種別文字
辞書111は各項目名に対する記入文字で使用する文字
種を、異なる辞書の金額字種辞書,番号字種辞書,住所
字種辞書に分けて登録する。
A form 201 includes preprinted item names 205, 206, 207, and 208, and 209, 210, and 21 written in handwritten or printed for each form.
1,212. Form format definition file 1
In an area 10, the area including the item names 205 and 206 of the form and the characters 209 and 210 corresponding to the item names is registered as “character recognition request rectangle upper left position−character recognition request rectangle lower right position”. The common knowledge database 112 sets the relationship between each item name used in an arbitrary form and the character type of the entry character for the item name as “item name 1 = item name 2 = item name 3”.
: Registered with character type A. At this time, it is assumed that the item names connected by "=" indicate equivalence, and if the item names are equivalent, it is considered that the entered characters for the item names are also equivalent. A character type 111 is used to register the character type used as the character to be entered for each item name, separately for a money amount character type dictionary, a number character type dictionary, and an address character type dictionary.

【0014】図3は図1の帳票認識装置全体の処理の流
れを示すフローチャートである。帳票認識要求が発生す
ると、イメージスキャナ102にて帳票イメージが入力
される(ステップ301)。入力された帳票イメージ
は、帳票識別部103にて、帳票毎のレイアウト上の特
徴を示す帳票レイアウト定義ファイル109を参照して
当該帳票の帳票種を決定する(ステップ302)。決定
された帳票種に対応する帳票フォーマット定義ファイル
110に登録されている文字認識要求領域に対して、字
種別文字列辞書111により、全字種辞書(字種限定
無)を使用して、文字認識部104で文字認識を行い
“項目名”と“項目名”に対する記入文字を取得する
(ステップ303)。文字認識部104で算出された
“項目名”に対する記入文字の認識確信度を算出する
(ステップ304)。
FIG. 3 is a flowchart showing the flow of the processing of the entire form recognition apparatus of FIG. When a form recognition request is generated, a form image is input by the image scanner 102 (step 301). Based on the input form image, the form identification unit 103 determines the form type of the form with reference to the form layout definition file 109 indicating the layout characteristics of each form (step 302). For the character recognition request area registered in the form format definition file 110 corresponding to the determined form type, the character type string dictionary 111 The recognizing unit 104 performs character recognition to obtain “item name” and characters to be entered for “item name” (step 303). The recognition reliability of the entered character for the "item name" calculated by the character recognition unit 104 is calculated (step 304).

【0015】記入文字認識確信度の算出方法の例として
パターンマッチング方法を以下に示す。文字認識するた
めには文字毎のパターン(形状)が登録されている文字辞
書を使用する。文字認識では、行抽出処理で文字行を切
出し、切出された文字行をさらに文字単位で切出す。切
出された文字切出し領域の文字を構成する黒画素のパタ
ーンと辞書に登録されている文字を構成する黒画素のパ
ターンを重ねあわせる。重ねあわせた時、重なり合う部
分が一定以上であるとその切出された領域は辞書のパタ
ーンに対応する文字と認識される。その際、重なり合う
部分の量により文字確信度を算出する。切出された領域
の黒画素パターンと辞書のパターンとが多く重なり有っ
ていると確信度は高く、重なり合う部分が少ない場合は
確信度は低くなる。
A pattern matching method will be described below as an example of a method of calculating the input character recognition certainty factor. To recognize characters, a character dictionary in which patterns (shapes) for each character are registered is used. In character recognition, a character line is extracted by a line extraction process, and the extracted character line is further extracted in character units. The pattern of the black pixels forming the characters in the cut-out character extraction region and the pattern of the black pixels forming the characters registered in the dictionary are superimposed. At the time of superimposition, if the overlapping portion is equal to or more than a predetermined value, the cut-out region is recognized as a character corresponding to the dictionary pattern. At this time, the character certainty factor is calculated based on the amount of the overlapping portion. The certainty is high when the black pixel pattern of the cut-out area and the dictionary pattern are largely overlapped, and the certainty is low when the overlapping portion is small.

【0016】ステップ304において、認識確信度が高
いならば、認識結果統合(ステップ316)を行い、認
識確信度が低いならば、項目名単語照合辞書113を使
用して文字認識結果解析部105にて“項目名”の単語
照合を行い(ステップ305)、“項目名”が取得でき
たか否か判定する(ステップ306)。
In step 304, if the recognition certainty is high, the recognition result integration (step 316) is performed. If the recognition certainty is low, the character recognition result analyzing unit 105 uses the item name / word collation dictionary 113. Then, word matching of "item name" is performed (step 305), and it is determined whether or not "item name" has been obtained (step 306).

【0017】“項目名”が取得できたならば、“項目
名”に対する記入文字の認識結果を補完するための処理
を文字認識結果解析部105で行う。まず、共通知識デ
ータベース112を参照して“項目名”を検索して“項
目名”に対する記入文字の字種が登録されているか判断
する(ステップ307)。“項目名に対する記入”の字
種が登録されているならば、文字認識部104で再度
“項目名”に対する記入文字に対して字種別文字辞書1
11より当該字種対応する字種辞書を選択して記入文字
の認識を行う(ステップ308)。
When the "item name" is obtained, the character recognition result analysis unit 105 performs a process for complementing the recognition result of the entered character for the "item name". First, the "item name" is searched with reference to the common knowledge database 112, and it is determined whether or not the character type of the character entered for the "item name" is registered (step 307). If the character type of “entry for the item name” is registered, the character recognizing unit 104 re-enters the character type dictionary 1 for the character to be entered for the “item name”.
Then, a character type dictionary corresponding to the character type is selected from 11 and characters to be entered are recognized (step 308).

【0018】そして、“項目名”に対する記入文字の認
識確信度を算出し(ステップ309)、認識確信度が高
いならば認識結果統合(ステップ316)を行い、認識
確信度が低いならば、帳票内より帳票フォーマット定義
ファイル110に登録されている文字認識要求領域以外
の領域から、帳票フォーマット定義ファイル110に登
録されている文字認識要求領域より取得した“項目名”
を検出するために、文字認識部104で帳票内全領域に
対して、字種別文字列辞書111より、全字種辞書(字
種限定無)を使用して文字認識が実行される(ステップ
310)。
Then, the recognition certainty of the entered character for the "item name" is calculated (step 309). If the recognition certainty is high, the recognition result is integrated (step 316). From the area other than the character recognition request area registered in the form format definition file 110, the “item name” obtained from the character recognition request area registered in the form format definition file 110
In order to detect a character, the character recognition unit 104 performs character recognition using the entire character type dictionary (no character type limitation) from the character type character string dictionary 111 for all regions in the form (step 310). ).

【0019】本来、帳票内の全領域に対しての文字認識
処理は、処理時間もかかり、また帳票内に記載されてい
る枠や行と行の接触などにより行抽出が正しく行われな
いため、また十分な認識精度が得られないため行わない
が、この処理はあくまで帳票フォーマット定義ファイル
110の文字認識要求領域の認識結果補完のためのリト
ライ処理であるため帳票内全領域の任意の領域が不読で
あっても問題でない。
Originally, the character recognition processing for the entire area in a form takes a long processing time, and line extraction is not performed correctly due to contact between a frame or a line described in the form. This process is not performed because sufficient recognition accuracy cannot be obtained. However, since this process is merely a retry process for complementing the recognition result of the character recognition request area of the form format definition file 110, any area of the entire area in the form is invalid. Reading is not a problem.

【0020】またここでは帳票フォーマット定義ファイ
ルに登録されている文字認識要求領域より取得した“項
目名”と等価である“項目名”を、帳票フォーマット定
義ファイル110に登録されている文字認識要求領域以
外から検出するために行うものであり、“項目名”は帳
票に予め活字にて記載されており、罫線や文字毎の接触
も少ないため“項目名”に対する記入文字に比べ認識が
容易であり、任意の“項目名”が登録されている単語辞
書を使用して“項目名”の単語照合(ステップ311)
を行うことにより、帳票内全領域に対して認識を行った
場合でも“項目名”は十分認識可能であると考えること
ができる。
In this case, the “item name” equivalent to the “item name” obtained from the character recognition request area registered in the form format definition file is replaced by the character recognition request area registered in the form format definition file 110. The "item name" is written in the form in advance, and there is little contact between the ruled lines and each character. Therefore, it is easier to recognize than "entry name". Word matching of “item name” using a word dictionary in which an arbitrary “item name” is registered (step 311)
Is performed, it can be considered that the "item name" can be sufficiently recognized even when the recognition is performed for all the areas in the form.

【0021】ステップ311で検出された単語照合結果
を、文字認識結果解析部105にて帳票フォーマット定
義ファイル110の文字認識要求領域から取得した項目
名と等価であるか共通知識データベース112を参照し
て検定する(ステップ312)。帳票フォーマット定義
ファイル110の文字認識要求領域から取得した項目名
と等価の項目名が、帳票内全領域認識結果に対して単語
照合を行った結果から検出できたなら、検出した“項目
名”の右領域、若しくは下領域より、“項目名”に対す
る記入文字を検出して、“項目名”に対する記入文字の
認識確信度を算出する(ステップ313)。
The word matching result detected in step 311 is referred to by the character recognition result analysis unit 105 as to whether it is equivalent to the item name acquired from the character recognition request area of the form format definition file 110 or by referring to the common knowledge database 112. A test is performed (step 312). If an item name equivalent to the item name acquired from the character recognition request area of the form format definition file 110 can be detected from the result of performing word matching on the recognition result of all areas in the form, the detected “item name” From the right area or the lower area, a character to be entered for "item name" is detected, and the recognition certainty of the character to be entered for "item name" is calculated (step 313).

【0022】ここで、認識確信度が高いならば、認識結
果補完候補として登録する。認識確信度が低いならば、
文字認識結果解析部105にて、“当該項目名”に対す
る“項目名”に対する記入文字の字種が共通知識データ
ベース112に登録されているか検索して(ステップ3
14)、登録されているならば文字認識部104で再度
“項目名”に対する記入文字に対して字種別文字辞書1
11より当該字種に対応する字種辞書を選択して認識を
行う(ステップ315)。
Here, if the recognition certainty is high, it is registered as a candidate for complementing the recognition result. If the recognition confidence is low,
The character recognition result analysis unit 105 searches whether or not the character type of the character entered for “item name” for “the item name” is registered in the common knowledge database 112 (step 3).
14) If registered, the character recognizing unit 104 again inputs the character for the "item name" to the character type character dictionary 1
11, a character type dictionary corresponding to the character type is selected and recognized (step 315).

【0023】ステップ311で検出された単語照合結果
に、帳票フォーマット定義ファイル110の文字認識要
求領域で検出した項目名と等価である認識結果文字列が
無くなったら、帳票フォーマット定義ファイル110の
文字認識要求領域の記入文字の認識結果と、帳票フォー
マット定義ファイル110の文字認識要求領域以外の領
域より検出した記入文字の認識結果を統合し(ステップ
316)、認識結果出力部106にて、上位アプリケー
ション107に出力する(ステップ317)。
When the word matching result detected in step 311 has no recognition result character string equivalent to the item name detected in the character recognition request area of the form format definition file 110, the character recognition request of the form format definition file 110 is deleted. The recognition result of the input characters in the area and the recognition result of the input characters detected from the area other than the character recognition request area of the form format definition file 110 are integrated (step 316). Output (Step 317).

【0024】図4は図3のステップ302の帳票種決定
を説明するための図である。帳票401は帳票認識を行
う帳票の例であり、図1の帳票レイアウト定義ファイル
109には、各帳票の特徴を示す文字列と文字列の記載
されている文字認識要求領域が定義して109A,10
9B,109Cとしてファイルしてある。帳票種を判別
するためには、全ての帳票レイアウト定義ファイル10
9A,109B,109Cに対して、定義してある文字
認識要求領域を文字認識し、認識結果が帳票レイアウト
定義ファイル109A,109B,109Cに定義して
ある文字列と等しいか判定をして帳票種を決定する。
FIG. 4 is a diagram for explaining the form type determination in step 302 of FIG. A form 401 is an example of a form for performing form recognition. The form layout definition file 109 in FIG. 1 defines character strings indicating the characteristics of each form and a character recognition request area in which the character strings are described. 10
9B and 109C. In order to determine the form type, all form layout definition files 10
For 9A, 109B, and 109C, the character recognition request area defined is subjected to character recognition, and it is determined whether the recognition result is equal to the character string defined in the form layout definition files 109A, 109B, and 109C. To determine.

【0025】図5は図3のステップ305の項目名の単
語照合処理の詳細を示す図である。帳票501の項目名
“納入金額”の文字認識結果502に対して、任意の項
目名が登録されている項目名単語照合辞書113を用い
て照合処理を行い、項目名を取得する。
FIG. 5 is a diagram showing details of the item name word collation processing in step 305 in FIG. A collation process is performed on the character recognition result 502 of the item name “delivery amount” in the form 501 using the item name word collation dictionary 113 in which an arbitrary item name is registered, and the item name is acquired.

【0026】図6は帳票601の例であり、図7は図6
の帳票601の例における、図3のステップ303,ス
テップ308の帳票フォーマット定義ファイルに登録さ
れている文字認識要求領域の字種限定処理の詳細を示
す。帳票601に対する帳票フォーマット定義ファイル
が図7の110である時、帳票フォーマット定義ファイ
ル110に登録されている左上座標が(X1,Y1),
右下座標が(X2,Y2)である領域に対して字種別文
字辞書111の中の全字種辞書1114を使用して、文
字認識701を行う。図7の文字認識の例では“項目
名”が“納人全額”と認識され、“項目名”に対する記
入文字が“Yl0.008”と認識された。
FIG. 6 shows an example of the form 601 and FIG.
3 shows details of the character type limitation processing of the character recognition request area registered in the form format definition file in steps 303 and 308 in FIG. 3 in the example of the form 601. When the form format definition file for the form 601 is 110 in FIG. 7, the upper left coordinates registered in the form format definition file 110 are (X1, Y1),
Character recognition 701 is performed on the area whose lower right coordinates are (X2, Y2) using the all-character-type dictionary 1114 in the character-type character dictionary 111. In the example of character recognition in FIG. 7, the “item name” is recognized as “full amount of the caretaker”, and the character entered for “item name” is recognized as “Y10.008”.

【0027】この時、記入文字の認識確信度を算出す
る。この場合、認識確信度が低いため、“項目名”に対
する記入文字の認識を字種限定有りで再度実行する必要
がある。“項目名”に対する記入文字を字種限定有りで
再度実行するための前処理として使用する字種を決定す
る。そのためには、認識した項目名“納人全額”を、図
5で示すように、項目名単語照合辞書113を使用して
単語照合処理を行い、項目名“納入金額”を取得する。
項目名単語照合処理で得られた項目名“納入金額”を、
共通知識データベース112より検索し、“納入金額”
に対する記入文字の字種“金額字種”を決定する。
At this time, the recognition certainty of the entered character is calculated. In this case, since the recognition certainty is low, it is necessary to re-perform the recognition of the input characters for the “item name” with the character type limited. A character type to be used as preprocessing for re-executing a character to be entered for "item name" with character type limitation is determined. For this purpose, a word matching process is performed on the recognized item name “full payer” using the item name word matching dictionary 113 as shown in FIG. 5 to obtain the item name “delivery amount”.
Item name “delivery amount” obtained by item name word matching process,
Searched from the common knowledge database 112, "Delivery amount"
The character type "money character type" of the character to be entered is determined.

【0028】字種が決定されると、字種別文字辞書11
1より“金額字種”に対応する金額字種辞書1113が
選択され、この金額字種辞書1113を使用して“項目
名”に対する記入文字の記載領域である左上座標(X
3,Y3),右下座標(X2,Y2)である領域に対し
て、“項目名”に対する記入文字を検出するために文字
認識702が行われ、認識結果“¥10,000”が出
力される。
When the character type is determined, the character type character dictionary 11
1, the money amount character type dictionary 1113 corresponding to “money amount character type” is selected, and using this money amount character type dictionary 1113, the upper left coordinate (X
(3, Y3), character recognition 702 is performed on the area of the lower right coordinates (X2, Y2) to detect a character entered for “item name”, and a recognition result “$ 10,000” is output. You.

【0029】図8は帳票801の例であり、図9は図8
の帳票801の例における、図3のステップ310の帳
票内全領域文字認識処理の詳細を示す。帳票801の帳
票内の全領域の文字認識を行うためには、まず最初に行
抽出901を行い、行抽出結果904毎に文字切出し9
02を行う。文字切出結果905に対して文字識別90
3を行い文字識別結果906を取得する。
FIG. 8 shows an example of the form 801 and FIG.
3 shows details of the character recognition processing of all areas in the form in step 310 in FIG. 3 in the example of the form 801. In order to perform character recognition of the entire area of the form 801 in the form, first, line extraction 901 is performed, and character extraction 9 is performed for each line extraction result 904.
02 is performed. Character identification 90 for character extraction result 905
3 to obtain a character identification result 906.

【0030】図10は帳票1001の例であり、図11
は図10の帳票1001の例における、図3のステップ
311の単語照合結果と帳票内全領域文字認識結果から
帳票フォーマット定義ファイルの文字認識要求領域より
取得した“項目名”と等価である文字列と領域を検出
し、“項目名”に対する記入文字の確信度を取得する処
理の詳細を示す。
FIG. 10 shows an example of a form 1001, and FIG.
Is a character string equivalent to the "item name" obtained from the character recognition request area of the form format definition file from the result of word matching in step 311 in FIG. 3 and the result of character recognition in the entire area in the form in the example of the form 1001 in FIG. This shows the details of the process of detecting the area and the area and acquiring the certainty factor of the character entered for “item name”.

【0031】帳票フォーマット定義ファイル110は帳
票1001に対応する定義ファイルである。帳票内全領
域文字認識結果1102は、図3のステップ310にて
帳票1101に対して帳票内全領域文字認識を行った結
果である。前にも述べたように、本来、帳票内の全領域
に対しての文字認識処理は、処理時間がかかり、また帳
票内に記載されている枠や行と行の接触などにより行抽
出が正しく行われないため、十分な認識精度が得られな
いため行わないが、この処理はあくまで帳票フォーマッ
ト定義ファイル802の文字認識要求領域の認識結果補
完のためのリトライ処理であるため帳票内全領域の任意
の領域が不読であっても問題でない。
The form format definition file 110 is a definition file corresponding to the form 1001. The all-area character recognition 1102 in the form is a result of performing all-area character recognition in the form 1101 in step 310 of FIG. As mentioned earlier, originally, character recognition processing for all areas in a form takes a long processing time, and line extraction is incorrect due to contact between frames and lines described in the form. This processing is not performed because sufficient recognition accuracy cannot be obtained, but this processing is merely a retry processing for complementing the recognition result of the character recognition request area of the form format definition file 802. It does not matter if the area is unread.

【0032】帳票フォーマット定義ファイル110に登
録されている文字認識要求領域は図10の帳票1001
の領域1003に相当する。最初に帳票フォーマット定
義ファイル110の文字認識要求領域の認識結果110
1に対して項目名単語照合処理を行い、項目名照合結果
502を取得する。項目名照合結果502の項目名“住
所”と等価の意味を持つ項目名を取得するため、共通知
識データベース112に登録されている項目名に対して
“住所”があるか検索し、項目名“住所”があった場合
は、“住所”と等価である項目名“住所”、“おとこ
ろ”、“ADDRESS”を検出する。
The character recognition request area registered in the form format definition file 110 is the form 1001 in FIG.
Area 1003. First, the recognition result 110 of the character recognition request area of the form format definition file 110
1 is subjected to an item name word matching process, and an item name matching result 502 is obtained. In order to obtain an item name having a meaning equivalent to the item name “address” of the item name collation result 502, a search is made as to whether the item name registered in the common knowledge database 112 has “address”, and the item name “ If there is an address, the item names “address”, “place”, and “ADDRESS” that are equivalent to “address” are detected.

【0033】次に、共通知識データベース112より取
得した項目名“住所”、“おところ”、“ADDRESS”
を、帳票内全領域文字認識結果1102に対して項目名
単語照合処理を行った項目名単語照合結果1103から
検索する。図11の例では“住所”“おところ”が検出
されるが、項目名“住所”に対しては検出領域が帳票フ
ォーマット定義ファイル110に登録してある文字認識
要求領域と同じ領域であるため採用しない。項目名“お
ところ”の検出領域は帳票フォーマット定義ファイル1
10の文字認識要求領域とは異なるため、帳票内全領域
文字認識結果1102より、“項目名”検出領域の右領
域又は下領域の“項目名”に対する記入文字の認識結果
の確信度を取得する。
Next, the item names “address”, “place”, “ADDRESS” acquired from the common knowledge database 112
Is searched from the item name / word matching result 1103 obtained by performing the item name / word matching process on the entire area character recognition result 1102 in the form. In the example of FIG. 11, "address" and "place" are detected. However, since the detection area for the item name "address" is the same area as the character recognition request area registered in the form format definition file 110. Do not adopt. The detection area of the item name "Oko" is the form format definition file 1
Since it is different from the character recognition request area of No. 10, the degree of certainty of the recognition result of the entered character for the “item name” in the right area or the lower area of the “item name” detection area is obtained from the entire area character recognition result 1102 in the form. .

【0034】図12は図3のステップ316の認識結果
統合処理の詳細を示す。同じ意味の記入文字が異なる領
域に複数記載されている帳票1201の例において、帳
票フォーマット定義ファイル110に登録されている文
字認識要求領域の記入文字認識結果1202と帳票フォ
ーマット定義ファイル文字認識要求領域から“項目名”
を認識し、“その項目名”と“等価の項目名”を帳票内
の任意の領域より検出して“項目名”に対する記入文字
を認識した結果1203を統合する場合、それぞれの文
字毎に認識確信度を比較し、認識確信度の高い方を結果
として統合し記入文字統合結果1204とする。
FIG. 12 shows details of the recognition result integration processing in step 316 of FIG. In an example of a form 1201 in which a plurality of entry characters having the same meaning are described in different areas, from the entry character recognition result 1202 of the character recognition request area registered in the form format definition file 110 and the form format definition file character recognition request area "item name"
When the result 1203 of recognizing the input character corresponding to "item name" by detecting "the item name" and "equivalent item name" from an arbitrary area in the form and recognizing the characters to be entered is recognized for each character. The certainty factors are compared, and the one with the higher recognition certainty factor is integrated as a result to obtain an entry character integrated result 1204.

【0035】以上、記述したように、従来の技術では図
3のステップ304で“項目名”に対する記入文字の確
信度が低いならば、認識不可もしくは誤読となっていた
が、本発明の帳票認識方法を用いることにより、“項目
名”に対する記入文字の確信度が低い(図3のステップ
304)場合でも、“項目名”を認識して、その結果よ
り他の領域から等価の記入文字を自動検出して、認識結
果を統合することでより高い認識精度を得ることができ
る。また、“項目名”を認識して“項目名”に対する記
入文字の字種を共通知識データベース112より選択す
ることにより、帳票フォーマット定義ファイル110毎
に“項目名”に対する記入文字の字種を登録する必要が
なく帳票フォーマット定義ファイルを作成する作業者の
負荷を軽減することができる。
As described above, in the prior art, if the confidence of the entered character for the "item name" is low in step 304 in FIG. 3, the recognition is impossible or misread. By using the method, even if the degree of certainty of the input character for “item name” is low (step 304 in FIG. 3), the “item name” is recognized, and the equivalent input character is automatically extracted from another area based on the result. By detecting and integrating the recognition results, higher recognition accuracy can be obtained. Also, by recognizing the "item name" and selecting the character type of the entry character for the "item name" from the common knowledge database 112, the character type of the entry character for the "item name" is registered for each form format definition file 110. Therefore, it is possible to reduce the load on the operator who creates the form format definition file.

【0036】[0036]

【発明の効果】本発明によれば、認識精度を向上するこ
とが可能な帳票認識方法を得ることができる。また本発
明によれば、作業者の作業を軽減することが可能な帳票
認識方法を得ることができる。
According to the present invention, a form recognition method capable of improving recognition accuracy can be obtained. Further, according to the present invention, it is possible to obtain a form recognition method capable of reducing the work of an operator.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の帳票認識方法を適用した帳票認識装置
の実施の形態を示す構成図である。
FIG. 1 is a configuration diagram showing an embodiment of a form recognition apparatus to which a form recognition method of the present invention is applied.

【図2】帳票の例およびそれに対する帳票フォーマット
定義ファイルの例と共通知識データベースの例と字種別
文字辞書の例を示す図である。
FIG. 2 is a diagram illustrating an example of a form, an example of a form format definition file corresponding thereto, an example of a common knowledge database, and an example of a character type character dictionary.

【図3】図1の帳票認識装置全体の処理の流れを示すフ
ローチャートである。
FIG. 3 is a flowchart showing a flow of processing of the entire form recognition apparatus of FIG. 1;

【図4】図3のステップ302の帳票種決定を説明する
ための図である。
FIG. 4 is a diagram for explaining form type determination in step 302 in FIG. 3;

【図5】図3のステップ305の項目名の単語照合処理
の詳細を示す図である。
5 is a diagram showing details of an item name word matching process in step 305 of FIG. 3;

【図6】帳票の例を示す図である。FIG. 6 is a diagram illustrating an example of a form.

【図7】図6の帳票601の例における、図3のステッ
プ303,ステップ308の帳票フォーマット定義ファ
イルに登録されている文字認識要求領域の字種限定処理
の詳細を示す図である。
7 is a diagram showing details of a character type restriction process of a character recognition request area registered in a form format definition file in steps 303 and 308 in FIG. 3 in the example of the form 601 in FIG.

【図8】帳票の例を示す図である。FIG. 8 is a diagram illustrating an example of a form.

【図9】図8の帳票の例における、図3のステップ31
0の帳票内全領域文字認識処理の詳細を示す図である。
9 shows an example of the form shown in FIG. 8;
FIG. 11 is a diagram showing details of a character recognition process for all areas in a form of 0.

【図10】帳票の例を示す図である。FIG. 10 is a diagram illustrating an example of a form.

【図11】図10の帳票の例における、図3のステップ
311の単語照合結果と帳票内全領域文字認識結果から
帳票フォーマット定義ファイルの文字認識要求領域より
取得した“項目名”と等価である文字列と領域を検出
し、“項目名”に対する記入文字の確信度を取得する処
理の詳細を示す図である。
11 is equivalent to “item name” obtained from the character recognition request area of the form format definition file from the word collation result of step 311 in FIG. 3 and the character recognition result of all areas in the form in the example of the form in FIG. FIG. 14 is a diagram illustrating details of processing for detecting a character string and an area and acquiring the certainty factor of a character entered for “item name”.

【図12】図3のステップ316の認識結果統合処理の
詳細を示す図である。
FIG. 12 is a diagram illustrating details of a recognition result integration process in step 316 of FIG. 3;

【符号の説明】[Explanation of symbols]

101:帳票認識部、102:イメージスキャナ、10
3:帳票識別部、104:文字認識部、105:文字認
識結果解析部、106:認識結果統合部、107:認識
結果出力部、108:上位アプリケーション、109:
帳票レイアウト定義ファイル、110:帳票フォーマッ
ト定義ファイル、111:字種別文字辞書、112:共
通知識データベース、113:項目名単語照合辞書、2
01,401,501,601,801,1001,1
201:帳票。
101: form recognition unit, 102: image scanner, 10
3: Form identification unit, 104: character recognition unit, 105: character recognition result analysis unit, 106: recognition result integration unit, 107: recognition result output unit, 108: host application, 109:
Form layout definition file, 110: Form format definition file, 111: Character dictionary, 112: Common knowledge database, 113: Item name word collation dictionary, 2
01,401,501,601,801,1001,1
201: Report.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 浅野 英輔 愛知県尾張旭市晴丘町池上1番地 株式会 社日立製作所情報機器事業部内 Fターム(参考) 5B029 AA01 BB02 CC18 CC22 CC25 CC26 5B064 AA01 AB02 AB03 BA01 DA04 DA34 EA17 EA19 EA27  ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Eisuke Asano 1 Ikegami, Haruoka-cho, Owariasahi-shi, Aichi F-term in the Information Equipment Division, Hitachi, Ltd. DA34 EA17 EA19 EA27

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】入力された帳票イメージに対して帳票種を
限定し、限定した帳票種で前記帳票イメージに対して文
字認識を行い、認識結果を上位装置に出力する帳票認識
手段において、前記限定した帳票種において、前記帳票
イメージ内の認識要求領域に対して文字認識を行う際、
前記認識要求領域に記載されている文字列と等価の文字
列を前記認識要求領域以外の領域から検出し認識結果を
統合して前記上位装置に出力することを特徴とする帳票
認識方法。
1. A form recognition means for limiting a form type to an input form image, performing character recognition on the form image with the limited form type, and outputting a recognition result to a host device. When performing character recognition on the recognition request area in the form image,
A form recognition method, comprising detecting a character string equivalent to a character string described in the recognition request area from an area other than the recognition request area, integrating recognition results, and outputting the result to the host device.
【請求項2】請求項1記載の帳票認識方法において、前
記限定した帳票種において、前記帳票イメージ内の認識
要求領域に対して文字認識を行う際、文字認識で使用す
る字種を限定して認識を行うことを特徴とする帳票認識
方法。
2. The form recognition method according to claim 1, wherein, in the limited form type, when performing character recognition on a recognition request area in the form image, a character type used in character recognition is limited. A form recognition method characterized by performing recognition.
JP2001173631A 2001-06-08 2001-06-08 Document recognizing method Pending JP2002366893A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001173631A JP2002366893A (en) 2001-06-08 2001-06-08 Document recognizing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001173631A JP2002366893A (en) 2001-06-08 2001-06-08 Document recognizing method

Publications (1)

Publication Number Publication Date
JP2002366893A true JP2002366893A (en) 2002-12-20

Family

ID=19015058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001173631A Pending JP2002366893A (en) 2001-06-08 2001-06-08 Document recognizing method

Country Status (1)

Country Link
JP (1) JP2002366893A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021068A (en) * 2006-07-12 2008-01-31 Hitachi Computer Peripherals Co Ltd Business form recognition apparatus and business form recognition program
JP2010073174A (en) * 2008-09-22 2010-04-02 Fuji Xerox Co Ltd Document processing apparatus and program
JP2012064195A (en) * 2010-08-16 2012-03-29 Canon Software Inc Information processing apparatus, information processing method, program, and recording medium
JP2014078203A (en) * 2012-10-12 2014-05-01 Fuji Xerox Co Ltd Image processing device and image processing program
JP6057112B1 (en) * 2016-04-19 2017-01-11 AI inside株式会社 Character recognition apparatus, method and program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021068A (en) * 2006-07-12 2008-01-31 Hitachi Computer Peripherals Co Ltd Business form recognition apparatus and business form recognition program
JP4733577B2 (en) * 2006-07-12 2011-07-27 日立コンピュータ機器株式会社 Form recognition device and form recognition program
JP2010073174A (en) * 2008-09-22 2010-04-02 Fuji Xerox Co Ltd Document processing apparatus and program
JP2012064195A (en) * 2010-08-16 2012-03-29 Canon Software Inc Information processing apparatus, information processing method, program, and recording medium
JP2014078203A (en) * 2012-10-12 2014-05-01 Fuji Xerox Co Ltd Image processing device and image processing program
JP6057112B1 (en) * 2016-04-19 2017-01-11 AI inside株式会社 Character recognition apparatus, method and program

Similar Documents

Publication Publication Date Title
US8155425B1 (en) Automated check detection and image cropping
CN105260733A (en) Method and device for processing image information
JP4733577B2 (en) Form recognition device and form recognition program
JP2008204226A (en) Form recognition device and its program
KR20040078046A (en) Form definition data creation method and form handling machines
JP3525997B2 (en) Character recognition method
JPH09231291A (en) Slip reading method and device
JP2002366893A (en) Document recognizing method
JP4160206B2 (en) Database registration method using character recognition device
JP5134383B2 (en) OCR device, trail management device and trail management system
JP2003223610A (en) Character recognizing device and character recognizing method
JPH08329187A (en) Document reader
JP3484446B2 (en) Optical character recognition device
JP2002170077A (en) Device and method of recognizing character
JPH09305701A (en) Slip recognition method
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JPH0728935A (en) Document image processor
JPH0981689A (en) Character recognition method and device therefor
JP3419418B2 (en) Character reading method and device
JP2000000524A (en) Method for identifying picture post card and picture postcard identification device
JP3335494B2 (en) Character recognition processor
JP2002366900A (en) Optical character reader
JPH07141462A (en) Document system
JP3648270B2 (en) Form reading device and accounting form reading device
JP3919390B2 (en) Character recognition device