JPH0554178A - Character recognizing device and slip for correction - Google Patents

Character recognizing device and slip for correction

Info

Publication number
JPH0554178A
JPH0554178A JP3217209A JP21720991A JPH0554178A JP H0554178 A JPH0554178 A JP H0554178A JP 3217209 A JP3217209 A JP 3217209A JP 21720991 A JP21720991 A JP 21720991A JP H0554178 A JPH0554178 A JP H0554178A
Authority
JP
Japan
Prior art keywords
character
correction
slip
unit
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3217209A
Other languages
Japanese (ja)
Inventor
Hiroshi Yoshida
浩史 吉田
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3217209A priority Critical patent/JPH0554178A/en
Publication of JPH0554178A publication Critical patent/JPH0554178A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To provide the character recognizing device, which can easily execute correction on a slip even without providing any terminal facility for correction equipped with a display device, and the slip for correction which can efficiently execute the correction. CONSTITUTION:A slip identification part 102 judges whether slip image data inputted from an image input part 101 are image data of a slip for character recognition or image data of the slip for correction, when the input slip is the slip for character recognition, the character recognition is executed by a character recognizing part 103, and the result is stored in a result storage part 104. A slip output part 105 for correction prepares the slip for correction based on the recognized result stored in the result storage part 104. Concerning the slip for correction described confirmation marks or the like and inputted from the image input part 101, correcting contents are read by a correcting slip reading part 106 and the slip is corrected by a correction part 107.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、効率よく修正の行え
る文字認識装置及び修正用帳票に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device and a correction form that can be corrected efficiently.

【0002】[0002]

【従来の技術】従来文字認識装置において認識した入力
文字の確認、修正(以下、修正と言う)を行う方法とし
ては、例えば文献:実願昭63−049134「文字認
識装置」に開示されるものがあり、認識対象入力文字の
文字パタン、候補文字、或いは類似度等の情報を、デイ
スプレイ等の表示装置に表示し、該情報をオペレータが
目視し、さらにキーボード等の入力装置を操作して、正
しい文字の入力、或いは表示されている候補文字からの
正しい文字の選択等の修正作業を行いという方法が広く
用いられていた。
2. Description of the Related Art As a method for confirming and correcting an input character recognized by a conventional character recognition device (hereinafter referred to as correction), for example, a method disclosed in Japanese Patent Application No. 63-049134 "Character Recognition Device" is disclosed. There is a character pattern of the input character to be recognized, a candidate character, or information such as the degree of similarity is displayed on a display device such as a display, the operator visually checks the information, and further operates an input device such as a keyboard. A method of performing corrective work such as inputting correct characters or selecting correct characters from displayed candidate characters has been widely used.

【0003】[0003]

【発明が解決しようとする課題】しかし前記従来の装置
では、表示された情報の内容や修正手順を理解しなけれ
ばならないため修正作業にオペレータの熟練を要すると
いう問題や、回線で結ばれた端末装置の周辺以外では修
正作業を行えないという問題点があった。
However, in the above-mentioned conventional apparatus, since the contents of the displayed information and the correction procedure must be understood, the correction work requires the skill of an operator, and a terminal connected by a line. There was a problem that the correction work could not be performed except around the device.

【0004】特に大量の帳票をバッチ処理等で認識処理
させた場合には大量の修正作業を行う必要があるが、前
記従来の装置では修正作業には表示装置と入力装置を備
えた端末設備が必要であるため、端末設備の増設をしな
ければ複数の人員で修正作業ができないという問題があ
り、また端末設備を増設した場合には、システムが高価
かつ大規模になってしまう上に文字認識装置の処理速度
が低下してしまうという問題点があり、結局大量のデー
タを迅速に認識、修正し、入力することは実用上不可能
であった。
Particularly when a large amount of forms are recognized by batch processing or the like, it is necessary to perform a large amount of correction work. In the conventional device, however, terminal equipment equipped with a display device and an input device is used for the correction work. Since it is necessary, there is a problem that correction work can not be done by multiple people unless the terminal equipment is expanded.When the terminal equipment is expanded, the system becomes expensive and large-scale, and character recognition is also required. There is a problem that the processing speed of the device is reduced, and it is practically impossible to quickly recognize, correct and input a large amount of data.

【0005】この発明は以上述べた修正作業にオペレー
タの熟練を要するという問題と、端末装置の周辺以外で
は修正作業を行えないという問題と、同時に大量の修正
作業を行えないため効率よく大量のデータを入力できな
いという問題を除去するため、表示装置を備えた修正用
の端末設備がなくとも、帳票上で修正が可能であるよう
にし、誰でも容易に修正作業ができ、同時に何人でも修
正作業が可能となるような、迅速で効率よく大量のデー
タの入力が可能な文字認識装置及び効率よく修正が可能
なような修正用帳票を提供することを目的とする。
The present invention requires the operator to be skilled in the correction work described above, the correction work cannot be performed except in the vicinity of the terminal device, and the large amount of data can be efficiently stored because a large amount of correction work cannot be performed at the same time. In order to eliminate the problem of not being able to enter, it is possible to make corrections on the form without any terminal equipment for correction equipped with a display device, so that anyone can easily make corrections, and at the same time, any person can make corrections. An object of the present invention is to provide a character recognition device capable of quickly and efficiently inputting a large amount of data, and a correction form that enables efficient correction.

【0006】[0006]

【課題を解決するための手段】第1発明の文字認識装置
は、上記目的を達成する為に、帳票画像データを得る画
像入力部と、前記帳票画像データが文字認識用帳票の画
像データか修正用帳票の画像データかを識別する帳票識
別部と、文字認識用帳票の画像データ上の文字パタンの
認識を行う文字認識部と、前記文字認識部における文字
認識結果に基づいて修正用帳票を印字出力する修正用帳
票出力部と、修正用帳票の画像データより該帳票上の修
正内容を読取る修正帳票読取り部と、前記修正内容に基
づき修正を行う修正部とを備えたことを特徴とする。
In order to achieve the above object, a character recognition apparatus according to a first aspect of the present invention includes an image input section for obtaining form image data, and correction of whether the form image data is image data for character recognition form. A form identification section for identifying whether it is image data of a form, a character recognition section for recognizing character patterns on the image data of the character recognition form, and a correction form printed based on the result of character recognition by the character recognition section. The present invention is characterized by comprising a correction form output unit for outputting, a correction form reading unit for reading correction contents on the form from image data of the correction form, and a correction unit for making corrections based on the correction contents.

【0007】また、第2発明の修正用帳票は、第1発明
の文字認識装置における文字認識の結果、単一の候補文
字が得られた文字については当該文字パタンを表示する
と共にその近傍に確認のマークを記入するためのマーク
記入枠を設け、2以上の候補文字が得られた文字につい
ては当該候補文字パタンを表示すると共に各候補文字パ
タンの近傍に1文字を選択する為のマークを記入するマ
ーク記入枠を設け、候補文字がなくリジェクトされた文
字については当該文字を再記入するための文字記入枠を
当該文字がリジェクトされたことを示す表示記号の近傍
に設けたことを特徴とする。
Further, the correction form of the second invention displays the character pattern for a character for which a single candidate character is obtained as a result of character recognition by the character recognition device of the first invention, and confirms it in the vicinity thereof. A mark entry frame for entering the mark is provided, and for characters for which two or more candidate characters have been obtained, the candidate character pattern is displayed and a mark for selecting one character is entered near each candidate character pattern. It is characterized in that a mark entry frame is provided, and for a rejected character without a candidate character, a character entry frame for re-entering the character is provided near the display symbol indicating that the character is rejected. ..

【0008】[0008]

【作用】第1発明の文字認識装置によれば、帳票識別部
を設け、入力帳票が文字認識用帳票の場合には文字認識
部による文字認識を行い、修正用帳票出力部が文字認識
の結果に基づいて修正用帳票を作成する。この修正用帳
票を入力することにより帳票識別部が修正用帳票と判別
しこの修正内容が修正帳票読取り部で読み取られ、修正
部で修正が行われる。従って、表示装置を備えた修正用
の端末設備が無くとも帳票上に出力された認識結果を見
ながら修正用帳票にマーク等を記入することにより簡単
に修正を行うことができる。
According to the character recognition device of the first aspect of the invention, the form identification unit is provided, and when the input form is the form for character recognition, the character recognition unit performs character recognition, and the correction form output unit performs the result of character recognition. Create a correction form based on. By inputting this correction form, the form identification unit discriminates it as a correction form, and the correction contents are read by the correction form reading unit and corrected by the correction unit. Therefore, even if there is no correction terminal equipment including a display device, it is possible to easily make a correction by writing a mark or the like on the correction form while looking at the recognition result output on the form.

【0009】第2発明の修正用帳票によれば、文字認識
の結果に基づいて候補文字パタンと共にその近傍に当該
候補文字の可否判定、あるいは候補文字選択の為のマー
ク記入枠が設けられ、またリジェクト文字については再
入力の為の文字記入枠が設けられていることにより、表
示装置を備えた修正用の端末設備が無くとも修正用帳票
上に出力された認識結果を見ながら簡単に効率良く修正
が出来る。
According to the correction form of the second aspect of the invention, a mark entry frame is provided in the vicinity of the candidate character pattern based on the result of the character recognition, in order to determine whether the candidate character is acceptable or not, or to select the candidate character. As for the rejected characters, a character entry frame for re-inputting is provided, so even if there is no terminal device for correction equipped with a display device, you can easily and efficiently see the recognition result output on the correction form. Can be modified.

【0010】[0010]

【実施例】以下図1〜図5を参照してこの発明の文字認
識装置の実施例につき説明する。図1は本発明の文字認
識装置の一実施例を示す構成図である。文字認識装置1
00は、画像入力部101、帳票識別部102、文字認
識部103、結果記憶部104、修正用帳票出力部10
5、修正帳票読取り部106、修正部107、制御部1
08、及び出力端子109とを具えて成る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the character recognition device of the present invention will be described below with reference to FIGS. FIG. 1 is a block diagram showing an embodiment of the character recognition device of the present invention. Character recognition device 1
00 is an image input unit 101, a form identification unit 102, a character recognition unit 103, a result storage unit 104, and a correction form output unit 10
5, correction form reading unit 106, correction unit 107, control unit 1
08 and an output terminal 109.

【0011】図2は、本実施例の文字認識部103を説
明する図である。文字認識部103は、行切り出し部2
01、文字切り出し部202、サブパタン抽出部20
3、特徴抽出部204、照合部205とから構成され
る。
FIG. 2 is a diagram for explaining the character recognition unit 103 of this embodiment. The character recognition unit 103 uses the line cutout unit 2
01, character cutout unit 202, sub-pattern extraction unit 20
3, a feature extraction unit 204, and a matching unit 205.

【0012】図3は本実施例で用いる文字認識用帳票の
例を示す図であり300は文字認識用帳票、301は文
字記入枠、302は帳票識別用マークである。尚、帳票
識別用マーク302は、文字認識用帳票識別マーク30
3、及び結果修正用帳票識別マーク304より成り、各
マークを黒く塗ることにより、該帳票が文字認識用帳
票、或いは結果修正用帳票であることを示すものであ
る。図3に示した帳票は文字認識用帳票識別マーク30
3が黒く塗られており、文字認識用帳票であることを示
している。
FIG. 3 is a diagram showing an example of a character recognition form used in this embodiment. Reference numeral 300 is a character recognition form, 301 is a character entry frame, and 302 is a form identification mark. The form identification mark 302 is the character identification form identification mark 30.
3 and the result correction form identification mark 304, each mark is painted black to indicate that the form is a character recognition form or a result correction form. The form shown in FIG. 3 is a form identification mark 30 for character recognition.
3 is painted in black, indicating that it is a character recognition form.

【0013】図4は文字認識結果を説明する図である。
図4(A)は図3に示した帳票を認識したときの結果候
補文字列であり、401は候補文字、402は第1位候
補文字、403は第2位候補文字、404は第3位候補
文字である。また図4(B)は図4(A)に示した結果
候補文字列を結果記憶部104に記憶する時のデータ形
式を説明する図であり、405が結果候補文字列データ
であり、候補数、各候補文字が図のように表形式で格納
されているものである。
FIG. 4 is a diagram for explaining the character recognition result.
FIG. 4A is a result candidate character string when the form shown in FIG. 3 is recognized. 401 is a candidate character, 402 is a first-ranked candidate character, 403 is a second-ranked candidate character, and 404 is a third-ranked character. It is a candidate character. 4B is a diagram for explaining the data format when the result candidate character string shown in FIG. 4A is stored in the result storage unit 104, 405 is the result candidate character string data, and the number of candidates is , Each candidate character is stored in a table format as shown in the figure.

【0014】図5は結果修正用の帳票の例を示す図であ
り、500は結果修正用帳票、501は結果ファイル識
別番号、502は帳票識別用マーク、505は認識結果
文字、506は認識結果候補文字、507は候補文字選
択用マーク記入枠、508は認識結果確認用マーク記入
枠、509はリジェクト文字再入力用文字記入枠であ
る。尚、帳票識別用マーク502は、文字認識用帳票識
別マーク503、及び結果修正用帳票識別マーク504
より成り、各マークを黒く塗ることにより、該帳票が文
字認識用帳票、或いは結果修正用帳票であることを示す
ものである。図5に示した帳票は結果修正用帳票識別マ
ーク504が黒く塗られており、結果修正用帳票である
ことを示している。
FIG. 5 is a diagram showing an example of a result correction form. 500 is a result correction form, 501 is a result file identification number, 502 is a form identification mark, 505 is a recognition result character, and 506 is a recognition result. A candidate character, 507 is a candidate character selection mark entry frame, 508 is a recognition result confirmation mark entry frame, and 509 is a reject character re-input character entry frame. The form identification mark 502 includes a character recognition form identification mark 503 and a result correction form identification mark 504.
Each mark is painted black to indicate that the form is a character recognition form or a result correction form. In the form shown in FIG. 5, the result correction form identification mark 504 is painted in black, which indicates that the form is a result correction form.

【0015】以下、この実施例の文字認識装置の動作を
図1〜図5を用いて詳細に説明する。画像入力部101
は、文字、図形、記号等(以下、文字と言う)が記載さ
れた帳票からの光信号Sを光電変換し、例えば文字線部
を黒画素、背景部を白画素で表現した白黒2値に量子化
された電気信号(以下、帳票画像データと言う)を生成
し、帳票識別部102に出力する。
The operation of the character recognition apparatus of this embodiment will be described in detail below with reference to FIGS. Image input unit 101
Photoelectrically converts an optical signal S from a form in which characters, figures, symbols, etc. (hereinafter, referred to as characters) are described, and for example, a black and white binary value in which a character line part is represented by black pixels and a background part is represented by white pixels. A quantized electric signal (hereinafter referred to as “form image data”) is generated and output to the form identification unit 102.

【0016】帳票識別部102は、画像入力部101よ
り入力された帳票画像データより、帳票の種類を判定
し、該判定結果に基づき帳票画像データを文字認識部1
03、または修正帳票読取り部106に出力する。
The form identification unit 102 determines the type of form from the form image data input from the image input unit 101, and based on the result of the determination, the form image data is recognized by the character recognition unit 1.
03 or to the corrected form reading unit 106.

【0017】前記帳票の種類の判定は、本実施例では、
帳票に予め記載されている帳票識別マーク(302,5
02)を用いて、以下のように行う。即ち、帳票画像デ
ータより、文字認識用帳票識別マーク(303,50
3)及び結果修正用帳票識別マーク(304,504)
の各領域を走査し、各領域内の黒画素数を計数し、文字
認識用帳票識別マーク領域内の黒画素数(Bm)が、結
果修正用帳票識別マーク領域内の黒画素数(Bs)以上
である場合(Bm≧Bs)には、該帳票は文字認識用帳
票であると判定し、文字認識帳票識別マーク領域内の黒
画素数(Bm)が、結果修正用帳票識別マーク領域内の
黒画素数(Bs)より少ない場合(Bm<Bs)には該
帳票は結果修正用帳票であると判定する。
In the present embodiment, the type of the form is judged as follows.
Form identification mark (302, 5
02) is carried out as follows. That is, from the form image data, the form identification mark for character recognition (303, 50
3) and the form identification mark for correcting results (304, 504)
The number of black pixels in each area is counted and the number of black pixels in the character recognition form identification mark area (Bm) is calculated as the number of black pixels in the result correction form identification mark area (Bs). If it is above (Bm ≧ Bs), it is determined that the form is a character recognition form, and the number of black pixels (Bm) in the character recognition form identification mark area is within the result correction form identification mark area. When the number is smaller than the number of black pixels (Bs) (Bm <Bs), it is determined that the form is a result correction form.

【0018】また、当該帳票を文字認識用帳票と判定し
た場合には、帳票画像データを文字認識部103に出力
し、当該帳票を修正用帳票と判定した場合には、帳票画
像データを修正帳票読取り部106に出力する。
If the form is determined to be a character recognition form, the form image data is output to the character recognition unit 103, and if the form is determined to be a correction form, the form image data is modified form. It is output to the reading unit 106.

【0019】文字認識部103は、帳票識別部102よ
り入力された文字認識用帳票画像データより、1文字づ
つの文字パタンデータを切り出し、該切り出された文字
パタンデータに対して認識処理を行い、各文字につき1
以上の候補文字名を得、該候補文字名を結果記憶部10
4に出力するものであり、従来公知の任意好適な種々の
方法で行うことができるが、本実施例では、図2に示す
ような構成の文字認識部において、以下のように行うも
のとする。
The character recognition section 103 cuts out character pattern data for each character from the character recognition form image data input from the form identification section 102, and performs recognition processing on the cut out character pattern data. 1 for each character
The above candidate character names are obtained, and the candidate character names are stored in the result storage unit 10.
4 and can be performed by any of various conventionally well-known methods. In the present embodiment, the character recognition unit configured as shown in FIG. 2 performs as follows. ..

【0020】すなわちまず、行切り出し部201におい
て帳票識別部102より入力された文字認識用帳票画像
データより文字行データを抽出し、文字切り出し部20
2に順次出力する。
That is, first, in the line cutout unit 201, character line data is extracted from the character recognition form image data input from the form identification unit 102, and the character cutout unit 20 is extracted.
2 is output sequentially.

【0021】文字切り出し部202においては、行切り
出し部201から入力された文字行データより、1文字
づつの文字パタンを抽出し、該文字パタンを図示せぬパ
タンレジスタに格納する。
The character slicing unit 202 extracts character patterns for each character from the character line data input from the line slicing unit 201 and stores the character patterns in a pattern register (not shown).

【0022】サブパタン抽出部203においては、前記
パタンレジスタ内の文字パタンを複数の方向に走査し、
各走査線上で予め定めた特定の値h(本実施例ではh=
5)以上連続している黒画素列を検出し、該連続した黒
画素列をサブパタンの黒画素成分として抽出することに
より、文字パタンより各走査方向別のサブパタンを抽出
し、該サブパタンを順次特徴抽出部204に出力する。
The sub-pattern extraction unit 203 scans the character patterns in the pattern register in a plurality of directions,
A predetermined specific value h on each scanning line (in the present embodiment, h =
5) The continuous black pixel row is detected, and the continuous black pixel row is extracted as the black pixel component of the sub-pattern, thereby extracting the sub-pattern for each scanning direction from the character pattern and sequentially characterizing the sub-pattern. It is output to the extraction unit 204.

【0023】前記走査方向は、本実施例では、文字行方
向(以下、X軸方向)に垂直な方向(垂直方向)、及び
平行な方向(水平方向)、X軸から反時計方向45°の
方向(左斜め方向)及び時計方向45°の方向(左斜め
方向)とし、これら各方向毎に文字パタンを走査して各
方向別に4個のサブパタンを抽出する。
In the present embodiment, the scanning direction is a direction (vertical direction) perpendicular to the character line direction (hereinafter, X-axis direction), a parallel direction (horizontal direction), and 45 ° counterclockwise from the X-axis. The direction (the left diagonal direction) and the direction of 45 ° clockwise (the left diagonal direction) are set, and character patterns are scanned in each of these directions to extract four sub patterns for each direction.

【0024】例えば垂直方向のサブパタンの抽出では垂
直方向を主走査方向とし、パタンレジスタの垂直方向の
走査線上で連続する黒画素(黒ラン)を検出し、1≧h
となる長さ1の黒ランを垂直方向のサブパタンの黒画素
部分として抽出することにより、垂直方向サブパタンを
抽出する。垂直方向のサブパタン抽出と同様にして、残
りの他の方向を主走査方向としたときのサブパタンの抽
出も行う。抽出した各サブパタンは順次特徴抽出部20
4に出力される。
For example, in the extraction of a sub pattern in the vertical direction, the vertical direction is the main scanning direction, continuous black pixels (black runs) are detected on the vertical scanning line of the pattern register, and 1 ≧ h
The vertical sub-pattern is extracted by extracting a black run having a length of 1 as the black pixel portion of the vertical sub-pattern. Similar to the vertical sub-pattern extraction, the sub-pattern extraction is performed when the remaining other direction is the main scanning direction. The extracted sub patterns are sequentially extracted by the feature extraction unit 20.
4 is output.

【0025】特徴抽出部204においては、前記抽出さ
れた各方向のサブパタン上に、文字パタンの文字外接枠
に対応する方形領域を設定し、該方形領域をN×M個
(N,Mは任意好適な自然数)の小領域に分割し、各小
領域に含まれる各サブパタンの文字線の長さを表す特徴
量を抽出し、該特徴量を文字外接枠の大きさで正規化
し、正規化された特徴量fi からなる特徴マトリクスF
を作成し、該特徴マトリクスFを照合部205に出力す
るものである。
In the feature extraction unit 204, a rectangular region corresponding to the character circumscribing frame of the character pattern is set on the extracted sub-patterns in each direction, and N × M rectangular regions (N and M are arbitrary). It is divided into small regions of a suitable natural number), the feature amount representing the length of the character line of each sub-pattern included in each small region is extracted, and the feature amount is normalized by the size of the character circumscribing frame and normalized. Feature matrix F consisting of the feature quantities f i
Is generated and the feature matrix F is output to the matching unit 205.

【0026】尚、本実施例では、前記分割数N,M=8
とし、また前記特徴量の文字外接枠の大きさでの正規化
は(dX+dY)/2なる値で正規化するものとする。
但し、dXは文字外接枠の水平方向の長さ及びdYは文
字外接枠の垂直方向の長さである。また特徴量fi は、
各小領域に1〜N×Mまでの番号i(i=1,2,…,
N×M)を順次に付して小領域を表したときに、番号i
の小領域の特徴量を表し、特徴マトリクスFの要素値で
ある。
In this embodiment, the number of divisions N and M = 8.
Further, the normalization of the feature amount with the size of the character circumscribing frame is performed with a value of (dX + dY) / 2.
However, dX is the horizontal length of the character circumscribing frame, and dY is the vertical length of the character circumscribing frame. The feature quantity f i is
The number i (i = 1, 2, ..., 1) from 1 to N × M is assigned to each small area.
(N × M) are sequentially added to represent small areas, the number i
Represents the feature amount of the small area and is an element value of the feature matrix F.

【0027】照合部205は特徴マトリクスFを、図示
せぬ予め用意された標準パタンの特徴辞書マトリクスG
と照合し、次式(1)で表される類似度Rを求め、類似
度Rが予め定めた値P以上である辞書マトリクスの文字
名を候補文字名とし、さらに類似度の高い順に第1位候
補文字、第2位候補文字と順位付けを行い、該候補文字
列を認識結果文字列として出力する。
The collating unit 205 uses the feature matrix F as a feature dictionary matrix G of a standard pattern prepared in advance (not shown).
The similarity R represented by the following equation (1) is obtained, the character names of the dictionary matrix whose similarity R is equal to or more than a predetermined value P are used as candidate character names, and the first similarity is calculated in descending order. The rank candidate character and the second rank candidate character are ranked, and the candidate character string is output as a recognition result character string.

【0028】[0028]

【数1】 [Equation 1]

【0029】但し、gi は辞書マトリクスの要素を表
す。図3に示すような文字認識用帳票に対して前述した
ような認識処理を行うと、図4(A)に示すような候補
文字列が得られる。
However, g i represents an element of the dictionary matrix. When the recognition process as described above is performed on the character recognition form as shown in FIG. 3, a candidate character string as shown in FIG. 4A is obtained.

【0030】結果記憶部104は、文字認識部103か
ら入力された結果候補文字列を記憶しておく手段であ
り、ICメモリ、フロッピーデイスク、ハードデイスク
等種々の記録媒体で容易に実現できる。図4(A)に示
すような結果候補文字列は、図4(B)のように、表形
式で格納される。また結果記憶部に格納される情報は図
4(B)の例に限られるものではなく、類似度等の情報
を付加してもなんら差し支えない。また、結果記憶部1
04は記憶する認識結果と後に修正部より入力される可
能性のある修正情報との整合をとる為に各々の認識結果
に識別番号を付与し、当該識別番号と共に認識結果を記
憶するものである。
The result storage unit 104 is a means for storing the result candidate character string input from the character recognition unit 103, and can be easily realized by various recording media such as an IC memory, a floppy disk and a hard disk. The result candidate character string as shown in FIG. 4 (A) is stored in a table format as shown in FIG. 4 (B). The information stored in the result storage unit is not limited to the example shown in FIG. 4B, and information such as similarity may be added. In addition, the result storage unit 1
An identification number 04 is given to each recognition result in order to match the stored recognition result with the correction information that may be input from the correction unit later, and the recognition result is stored together with the identification number. ..

【0031】修正用帳票出力部105は、結果記憶部1
04に記憶されている認識結果候補文字列を修正用帳票
に上に印字出力すると共に該印字出力した修正用帳票の
フォーマットを後述する修正帳票読取り部106内の図
示せぬフォーマット記憶部に出力する。前記認識結果の
出力フォーマットは、任意好適なフォーマットとして良
いが、例えば文字認識用の帳票と類似したフォーマット
で出力するものとし、認識の結果一つの候補文字に決定
できた文字については当該文字パタンを表示すると共に
その近傍に確認のマークを記入するようにし、2以上の
候補文字が存在する文字については当該候補文字パタン
を表示すると共に各候補文字の近傍に1文字を選択する
ためのマークを記入できるようにし、また、候補文字が
無くリジェクトされた文字については当該文字がリジェ
クトされたことを示す表示記号の近傍に再度文字を記入
するように構成すると好適である。従って、本実施例で
は図3に示すような文字認識用帳票を入力し図4に示す
ような認識結果を得た場合には、例えば図5に示すよう
なフォーマットで修正用帳票が出力される。
The correction form output unit 105 includes a result storage unit 1
The recognition result candidate character string stored in 04 is printed out on the correction form, and the format of the printed correction form is output to a format storage unit (not shown) in the correction form reading unit 106 described later. .. The output format of the recognition result may be any suitable format, but for example, it is assumed that the output is performed in a format similar to a form for character recognition, and the character pattern is selected for a character that can be determined as one candidate character as a result of recognition. Display and put a confirmation mark in the vicinity of the candidate character. If there are two or more candidate characters, display the candidate character pattern and put a mark for selecting one character in the vicinity of each candidate character. It is preferable that the characters are rejected because there is no candidate character, and the characters are re-entered in the vicinity of the display symbol indicating that the character is rejected. Therefore, in this embodiment, when the character recognition form as shown in FIG. 3 is input and the recognition result as shown in FIG. 4 is obtained, the correction form is output in the format as shown in FIG. 5, for example. ..

【0032】図5において、501は結果記憶部104
に記憶されている当該帳票の認識結果の識別番号であ
り、502、503、504は前述のように当該帳票が
結果修正用帳票であることを示す識別マークである。5
05は認識結果の文字であり「八」、「子」、「高」、
「尾」等は候補文字が一つであるので該候補文字をその
まま印字している。506は「王」、「玉」、「土」の
3候補文字が存在するので当該候補文字と選択用のマー
ク記入枠507を印字し、マークを記入することにより
正しい文字を選択できるようにしたものである。また、
508は当該フィールド中の全ての文字が第1候補の文
字のみで認識されているので、此等が最終的に正しいか
否かを確認する為のマーク記入枠である。さらに、50
9は「●」で示した「八」の文字の候補文字が無く認識
不可能としてリジェクトされたので、再度認識する為の
文字記入枠である。
In FIG. 5, reference numeral 501 denotes the result storage unit 104.
Is an identification number of the recognition result of the form stored in the table, and 502, 503, and 504 are identification marks indicating that the form is a result correction form as described above. 5
05 is the character of the recognition result, "8", "child", "high",
Since "tail" and the like have only one candidate character, the candidate character is printed as it is. 506 has three candidate characters of "king", "ball", and "sat", so the candidate character and the mark entry frame 507 for selection are printed, and the correct character can be selected by entering the mark. It is a thing. Also,
Since all the characters in the field are recognized only by the first candidate character, reference numeral 508 is a mark entry frame for confirming whether or not these are finally correct. Furthermore, 50
Reference numeral 9 is a character entry frame for recognizing again because it is rejected as unrecognizable because there is no candidate character for the character "8" indicated by "●".

【0033】以上、修正用帳票として図5に示すような
帳票を作成するものとしたが、前述の様々の修正方法を
全て用いる必要はなく、例えば確認用マーク記入枠のみ
を用いて認識結果の確認を行う帳票や、候補選択だけを
行う帳票、リジェクト文字の再入力だけを目的とした帳
票、あるいはそれらを組合せた帳票等であっても何ら差
し支えない。
As described above, the form as shown in FIG. 5 is prepared as the correction form, but it is not necessary to use all the various correction methods described above, and for example, only the confirmation mark entry frame is used to confirm the recognition result. There is no problem even if it is a form for confirmation, a form for only selecting candidates, a form only for re-inputting reject characters, or a form combining them.

【0034】修正帳票読取り部106においては、帳票
識別部102から入力された修正用帳票画像データよ
り、図示せぬ修正帳票読取り部106内のフォーマット
記憶部に記憶されている修正用帳票のフォーマットを参
照して、結果記憶部104に記憶されている認識結果に
対する修正内容を読取り、該読取り結果を修正部107
に出力する。この場合、修正用帳票出力部105におい
て印刷される認識結果番号(図5の例では501)を用
いて、入力された修正用帳票と当該帳票のフォーマット
情報及び認識結果との対応付けが行われる。また、リジ
ェクト文字に対して文字パタンが再入力された場合に
は、本実施例では図示せぬ修正帳票読取り部106内の
文字認識部にいて認識処理を行った後、該認識結果の文
字名を修正内容として修正部107に出力する。なお、
前記修正帳票読取り部106におけるマーク検出の方法
及び文字認識方法は各々前述の帳票識別部102におけ
るマーク検出方法及び文字認識部103における文字認
識方法と同一の方法で実現できる。
In the correction form reading unit 106, the format of the correction form stored in the format storage unit in the correction form reading unit 106 (not shown) is determined from the correction form image data input from the form identification unit 102. With reference to this, the correction content for the recognition result stored in the result storage unit 104 is read, and the read result is corrected by the correction unit 107.
Output to. In this case, using the recognition result number (501 in the example of FIG. 5) printed by the correction form output unit 105, the input correction form is associated with the format information and the recognition result of the form. .. Further, when the character pattern is re-input for the rejected character, the character name of the recognition result is obtained after performing the recognition processing in the character recognition unit in the correction form reading unit 106 (not shown) in this embodiment. Is output to the correction unit 107 as the correction content. In addition,
The mark detecting method and the character recognizing method in the modified form reading unit 106 can be realized by the same methods as the mark detecting method in the form identifying unit 102 and the character recognizing method in the character recognizing unit 103, respectively.

【0035】図5に示すような結果修正用帳票からは候
補選択用マーク507、認識結果確認用マーク508、
再入力文字509が抽出され、再入力文字パタンについ
ては認識処理を行い認識結果の文字名を得、前記抽出し
たマーク及び認識結果文字名を修正用帳票フォーマット
情報と照合することにより当該マーク及び文字パタンと
認識結果記憶部の認識結果との対応付けを行い修正内容
を修正部107に出力する。
From the result correction form as shown in FIG. 5, a candidate selection mark 507, a recognition result confirmation mark 508,
The re-input character 509 is extracted, the re-input character pattern is subjected to recognition processing to obtain the character name of the recognition result, and the extracted mark and recognition result character name are collated with the correction form format information, thereby the mark and character. The pattern is associated with the recognition result in the recognition result storage unit, and the correction content is output to the correction unit 107.

【0036】修正部107は、修正帳票読取り部106
より入力された修正内容に基づいて、結果記憶部104
に記憶されている結果の修正を行う。例えば図4(B)
に示される認識結果においては、2文字目の「王」、
「玉」、「土」の候補文字の中から図5の修正用帳票の
候補文字選択マーク507に基づき「王」が選択され、
また、リジェクトされた「八」の文字については図5の
文字記入枠509に記入され新たに入力された文字パタ
ンの認識結果が記憶される。また、認識結果確認用マー
クが付与されなかった認識結果が存在した場合には、当
該認識結果に対して修正用帳票出力部105が再び修正
用の帳票を作成し新たな文字パタンの入力を促すように
認識結果記憶部の候補数を0とするという処理を行う。
The correction unit 107 is a correction form reading unit 106.
The result storage unit 104 is based on the correction content input from
Make corrections to the results stored in. For example, FIG. 4 (B)
In the recognition result shown in, the second character "king",
“Oh” is selected from the candidate characters “ball” and “Sat” based on the candidate character selection mark 507 of the correction form in FIG. 5,
As for the rejected “8” character, the recognition result of the newly input character pattern entered in the character entry box 509 of FIG. 5 is stored. Further, when there is a recognition result to which the recognition result confirmation mark is not added, the correction form output unit 105 creates a correction form again for the recognition result and prompts the input of a new character pattern. In this way, the process of setting the number of candidates in the recognition result storage unit to 0 is performed.

【0037】制御部108は、図示せぬ制御信号線を通
して、文字認識装置100を構成する各部の制御、各部
の動作やデータの同期の制御、外部とのインターフェー
ス等のコントロールを行うものである。
The control section 108 controls each section of the character recognition device 100, controls the operation of each section and data synchronization, and controls the interface with the outside through a control signal line (not shown).

【0038】出力端子109は、認識結果を外部に出力
するためのデータ出力端子であり、その他のシステム
や、認識結果を記録する媒体、通信網、その他の情報処
理システム等を接続するものである。
The output terminal 109 is a data output terminal for outputting the recognition result to the outside, and is connected to another system, a medium for recording the recognition result, a communication network, another information processing system or the like. ..

【0039】尚、本発明は上述した実施例にのみ限定さ
れるものではなく、各構成成分の動作、処理の仕方、入
出力信号の流れ、配設個数、位置、形状及び個数その他
の条件を任意好適に変更できる。
The present invention is not limited to the above-mentioned embodiment, and the operation of each component, the processing method, the flow of input / output signals, the number of arranged, the position, the shape, the number and other conditions are set. It can be changed arbitrarily.

【0040】[0040]

【発明の効果】以上、詳細に説明したように、第1発明
の文字認識装置によれば、文字認識の結果に基づいて修
正用帳票が作成され、この修正用帳票にマーク等を記入
することにより修正内容が読み取られ、修正が行われ
る。従って、表示装置を備えた修正用の端末設備が無く
とも修正用帳票上で簡単に修正を行うことができ、同時
に多数の人の修正作業が可能となり、大量のデータの入
力が可能な文字認識装置が実現できる。
As described above in detail, according to the character recognition device of the first invention, a correction form is created based on the result of character recognition, and a mark or the like is written on the correction form. The correction contents are read by and the correction is performed. Therefore, even if there is no terminal device for correction equipped with a display device, it is possible to easily make corrections on the correction form, and at the same time, it is possible for a large number of people to make corrections and a large amount of data can be input. The device can be realized.

【0041】第2発明の修正用帳票によれば、文字認識
の結果に基づいて候補文字パタンと共にその近傍に当該
候補文字の可否判定、あるいは候補文字選択の為のマー
ク記入枠が設けられ、またリジェクト文字については再
入力の為の文字記入枠が設けられていることにより、表
示装置を備えた修正用の端末設備が無くとも帳票上に出
力された認識結果を見ながらマーク記入等の簡単な作業
により誰にでも容易に効率の良い修正が可能となる。
According to the correction form of the second aspect of the invention, a mark entry frame is provided in the vicinity of the candidate character pattern based on the result of the character recognition, and a mark entry frame for determining whether the candidate character is acceptable or not, or for selecting the candidate character. With regard to rejected characters, a character entry frame for re-inputting is provided, so even if there is no correction terminal equipment equipped with a display device, it is easy to enter marks while watching the recognition result output on the form. The work allows anyone to easily and efficiently make corrections.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の文字認識装置の一実施例の構成を示す
ブロック図である。
FIG. 1 is a block diagram showing a configuration of an embodiment of a character recognition device of the present invention.

【図2】本発明の文字認識部の構成を示すブロック図で
ある。
FIG. 2 is a block diagram showing a configuration of a character recognition unit of the present invention.

【図3】文字認識用帳票の例を示す図である。FIG. 3 is a diagram showing an example of a character recognition form.

【図4】文字認識結果の説明図である。FIG. 4 is an explanatory diagram of a character recognition result.

【図5】修正用帳票の例を示す図である。FIG. 5 is a diagram showing an example of a correction form.

【符号の説明】[Explanation of symbols]

101 画像入力部 102 帳票識別部 103 文字認識部 104 結果記憶部 105 修正用帳票出力部 106 修正帳票読取り部 107 修正部 108 制御部 109 出力端子 101 image input unit 102 form identification unit 103 character recognition unit 104 result storage unit 105 correction form output unit 106 correction form reading unit 107 correction unit 108 control unit 109 output terminal

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 帳票画像データを得る画像入力部と、 前記帳票画像データが文字認識用帳票の画像データか修
正用帳票の画像データかを識別する帳票識別部と、 文字認識用帳票の画像データ上の文字パタンの認識を行
う文字認識部と、 前記文字認識部における文字認識結果に基づいて修正用
帳票を印字出力する修正用帳票出力部と、 修正用帳票の画像データより該帳票上の修正内容を読取
る修正帳票読取り部と、 前記修正内容に基づき修正を行う修正部とを備えたこと
を特徴とする文字認識装置。
1. An image input unit for obtaining form image data, a form identifying unit for identifying whether the form image data is image data for character recognition form or image data for correction form, and image data for character recognition form. A character recognition unit for recognizing the above character pattern, a correction form output unit for printing and outputting a correction form based on the character recognition result in the character recognition unit, and correction on the form from the image data of the correction form. A character recognition device comprising: a correction form reading unit for reading the contents, and a correction unit for making a correction based on the correction contents.
【請求項2】 請求項1記載の文字認識装置における文
字認識の結果、単一の候補文字が得られた文字について
は当該文字パタンを表示すると共にその近傍に確認のマ
ークを記入するためのマーク記入枠を設け、2以上の候
補文字が得られた文字については当該候補文字パタンを
表示すると共に各候補文字パタンの近傍に1文字を選択
する為のマークを記入するマーク記入枠を設け、候補文
字がなくリジェクトされた文字については当該文字を再
記入するための文字記入枠を当該文字がリジェクトされ
たことを示す表示記号の近傍に設けたことを特徴とする
修正用帳票。
2. A mark for displaying a character pattern for a character for which a single candidate character is obtained as a result of character recognition by the character recognition device according to claim 1 and for writing a confirmation mark in the vicinity thereof. A mark box is provided for characters for which two or more candidate characters have been obtained, and a mark entry frame is provided in the vicinity of each candidate character pattern to mark a character for selecting one character. For a rejected character without a character, a correction form is provided in which a character entry frame for re-entering the character is provided near a display symbol indicating that the character has been rejected.
JP3217209A 1991-08-28 1991-08-28 Character recognizing device and slip for correction Pending JPH0554178A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3217209A JPH0554178A (en) 1991-08-28 1991-08-28 Character recognizing device and slip for correction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3217209A JPH0554178A (en) 1991-08-28 1991-08-28 Character recognizing device and slip for correction

Publications (1)

Publication Number Publication Date
JPH0554178A true JPH0554178A (en) 1993-03-05

Family

ID=16700580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3217209A Pending JPH0554178A (en) 1991-08-28 1991-08-28 Character recognizing device and slip for correction

Country Status (1)

Country Link
JP (1) JPH0554178A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07306911A (en) * 1994-05-10 1995-11-21 Nec Corp Ocr reading result correcting device
JP2016021109A (en) * 2014-07-14 2016-02-04 沖電気工業株式会社 Business form processing system, business form processing device and business form processing device program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07306911A (en) * 1994-05-10 1995-11-21 Nec Corp Ocr reading result correcting device
JP2016021109A (en) * 2014-07-14 2016-02-04 沖電気工業株式会社 Business form processing system, business form processing device and business form processing device program

Similar Documents

Publication Publication Date Title
EP0063454B1 (en) Method for recognizing machine encoded characters
US4914709A (en) Method for identifying unrecognizable characters in optical character recognition machines
EP0738987B1 (en) Processing machine readable forms
US7227997B2 (en) Image recognition apparatus, image recognition method, and image recognition program
JPH0554178A (en) Character recognizing device and slip for correction
JPH0689365A (en) Document image processor
JP2001126010A (en) Document processor, document definition generation method and area extraction method and storage medium
JPH08329187A (en) Document reader
JP3930466B2 (en) Character recognition device, character recognition program
JPH0991371A (en) Character display device
JPH0728935A (en) Document image processor
CN115131806B (en) Method and system for identifying OCR (optical character recognition) image information of various certificates based on deep learning
JP2001236467A (en) Method and device for pattern recognition, and recording medium with pattern recognition program recorded thereon
JPH0991385A (en) Character recognition dictionary adding method and terminal ocr device using same
JPH10154191A (en) Business form identification method and device, and medium recording business form identification program
JP3056950B2 (en) Character recognition apparatus and method
JPH08212303A (en) Character discrimination device
JP2993533B2 (en) Information processing device and character recognition device
JPH07117967B2 (en) Drawing processing system
JPH0567233A (en) Character recognition device
JPS58125183A (en) Method for displaying unrecognizable character in optical character reader
JP2570571B2 (en) Optical character reader
JP2977244B2 (en) Character recognition method and character recognition device
KR20050045291A (en) Data processing of text by selective scanning and color comparison
JPH04500422A (en) Method and apparatus for identifying unrecognizable characters in an optical character recognition device