JPH04319790A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH04319790A
JPH04319790A JP3112304A JP11230491A JPH04319790A JP H04319790 A JPH04319790 A JP H04319790A JP 3112304 A JP3112304 A JP 3112304A JP 11230491 A JP11230491 A JP 11230491A JP H04319790 A JPH04319790 A JP H04319790A
Authority
JP
Japan
Prior art keywords
dictionary
character
slip
reading
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3112304A
Other languages
Japanese (ja)
Inventor
Tsuyoshi Kawakami
川上 毅之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP3112304A priority Critical patent/JPH04319790A/en
Publication of JPH04319790A publication Critical patent/JPH04319790A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To prevent the reading inability and the erroneous reading by being equipped with a means to preparing a slip classification dictionary in accordance with the result to correct the reading inability character and an erroneous reading character and a means to select and control the slip classification dictionary in correspondence to the reading slip. CONSTITUTION:A standard dictionary 8 reads a common character pattern between slips. A slip classification memory 6 reads a character pattern different by the kind of the slip. In the slip classification memory 6, the information whether or not the dictionary corresponding to the slip during reading presently is prepared in a slip classification dictionary 9, that is, the information whether or not the slip classification dictionary 9 is collated and decision is performed is stored. A registering control part 7 refers to the slip classification code of data 301, stores the corrected result of the inability character and the erroneous reading character and the character pattern for each slip type, prepares the dictionary for each slip and registers the dictionary prepared to the slip classification dictionary 9. By selecting and controlling the slip classification dictionary 9 in correspondence to the reading slip, the dictionary can be automatically prepared for each type of the slip.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、光学文字読取装置に関
し、特に、記入者の異なる帳票に対応して辞書を作成す
る辞書登録装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reading device, and more particularly to a dictionary registration device for creating dictionaries corresponding to forms written by different persons.

【0002】0002

【従来の技術】従来、光学文字読取装置は、帳票上に記
された文字を読み取る場合、あらかじめ作成された標準
辞書と読み取り対象の文字パターンとを比較照合するこ
とによって、読み取り結果を得ている。
[Background Art] Conventionally, when reading characters written on a form, an optical character reading device obtains the reading result by comparing and comparing the character pattern to be read with a standard dictionary created in advance. .

【0003】0003

【発明が解決しようとする課題】上述した従来の光学文
字読取装置は、あらかじめ作成された標準辞書を照合し
、読み取り動作を行っている。このため、類似した文字
パターンでも記入者によって意味が異なる場合に誤読を
まねくといった欠点があり、誤読を減らすためには類似
した文字パターンをすべて読み取り不能としている。
SUMMARY OF THE INVENTION The conventional optical character reading device described above performs a reading operation by checking a standard dictionary prepared in advance. This has the disadvantage that similar character patterns may have different meanings depending on the person writing them, leading to misreading.To reduce misreading, all similar character patterns are made unreadable.

【0004】これについて、図2を用いて詳しく説明す
る。
[0004] This will be explained in detail using FIG. 2.

【0005】図2に示されるように、帳票21の文字2
3および帳票22の文字28は、異なる文字を記入した
例であるが、文字パターンは極めて類似しているため、
帳票21の文字23を“4”と読むようにすると、帳票
22の文字28も“4”と誤読する可能性がある。この
ように類似した文字パターンは、一般に両者とも読み取
り不能としている。
As shown in FIG. 2, character 2 of the form 21
3 and the character 28 of the form 22 are examples of writing different characters, but the character patterns are extremely similar, so
If the character 23 on the form 21 is read as "4", the character 28 on the form 22 may also be read incorrectly as "4". Character patterns that are similar in this way are generally both unreadable.

【0006】また、読み取り不能や誤読をオペレータに
より修正した結果をもとに、自動的に標準辞書の精度を
向上するという自動学習機能についても、帳票間で共通
に標準辞書が作成されるので、不特定記入者による文字
の読み取りでは、前述のように類似した文字パターンを
もつ、異なる文字を誤読するという問題点がある。
[0006] Furthermore, regarding the automatic learning function that automatically improves the accuracy of the standard dictionary based on the results of unreadable or misreading corrections made by the operator, a standard dictionary is created in common between forms. When characters are read by an unspecified person, there is a problem, as described above, in that different characters with similar character patterns are misread.

【0007】一般に、不特定多数の記入者を対象とする
光学文字読取装置においては、帳票の種類によって記入
される文字の字形が異なる場合が多い。すなわち、図2
に示すように、帳票21の文字23と帳票22の文字2
7は同じ“4”を記入しているが、記入者および帳票の
種類が異なるために、その文字パターン25,29は異
なっている。同様に帳票21の文字24と帳票22の文
字28は文字パターン26,30が異なっている。
[0007] Generally, in optical character reading devices intended for an unspecified number of users, the shape of the characters entered often differs depending on the type of form. That is, Figure 2
As shown, character 23 of form 21 and character 2 of form 22
7 has the same "4" written in, but the character patterns 25 and 29 are different because the person filling it in and the type of form are different. Similarly, the character patterns 26 and 30 of the character 24 of the form 21 and the character 28 of the form 22 are different.

【0008】また、帳票21の文字23と帳票22の文
字28のように、異なる文字を記入しても、その文字パ
ターン25,30が極めて類似するのは、帳票の種類お
よび記入者が異なる場合であり、同一帳票内では希であ
る。つまり、同一帳票内においては、帳票21の文字2
3と24、帳票22の文字27と28のように“4”と
“9”の字形は区別して記入される場合が多い。
[0008] Furthermore, even if different characters are entered, such as the character 23 on the form 21 and the character 28 on the form 22, the character patterns 25 and 30 are extremely similar when the type of form and the person filling in the form are different. , and it is rare within the same document. In other words, within the same document, character 2 of document 21
The characters "4" and "9" are often written separately, such as characters 3 and 24 and characters 27 and 28 on the form 22.

【0009】このように、複数の異種帳票間では同一文
字でも字形が異なる場合や、異なる文字の字形が帳票間
で類似する場合がある。同一帳票内においては、異なる
文字の字形は明確に区別できるように記入される。しか
し、従来の文字読み取り装置は、異種帳票間で共通な標
準辞書によって読み取りを実行しているため、帳票の種
類によって読み取る字形の範囲を変更することができな
いので、読み取り不能や誤読を減少することができない
という欠点がある。
[0009] As described above, the same character may have different fonts among a plurality of different types of forms, or the fonts of different characters may be similar between forms. Within the same form, different character shapes are entered so that they can be clearly distinguished. However, since conventional character reading devices perform reading using a standard dictionary that is common to different types of forms, it is not possible to change the range of glyphs to be read depending on the type of form, so it is difficult to reduce unreadability and misreading. The disadvantage is that it cannot be done.

【0010】本発明の目的は、このような欠点を除去し
、読み取り不能や誤読を防止する光学文字読取装置を提
供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide an optical character reading device that eliminates such drawbacks and prevents unreadable characters and erroneous readings.

【0011】[0011]

【課題を解決するための手段】本発明の光学文字読取装
置は、帳票間で共通な文字パターンを読み取る標準辞書
を格納する標準辞書手段と、帳票の種類によって異なる
文字パターンを読み取る帳票別辞書を格納する帳票別辞
書手段と、標準辞書手段の標準辞書および帳票別辞書手
段の帳票別辞書の照合により判別される読み取り不能文
字や誤読文字を修正した結果に従い、帳票種別辞書を帳
票別辞書手段に作成する作成手段と、読み取る帳票に対
応して帳票種別辞書を選択制御する制御手段とを有して
いる。
[Means for Solving the Problems] The optical character reading device of the present invention has a standard dictionary means for storing a standard dictionary for reading character patterns common between forms, and a form-specific dictionary for reading character patterns that differ depending on the type of form. According to the results of correcting unreadable characters and misread characters determined by comparing the stored form-specific dictionary means with the standard dictionary of the standard dictionary means and the form-specific dictionary of the form-specific dictionary means, the form-specific dictionary is changed to the form-specific dictionary means. It has a creation means for creating, and a control means for selecting and controlling a form type dictionary corresponding to the form to be read.

【0012】前述した本発明において、標準辞書手段は
、1文字毎の文字パターンを切り出して読み出すのが好
適である。
[0012] In the present invention described above, it is preferable that the standard dictionary means extracts and reads out a character pattern for each character.

【0013】また、前述した本発明において、作成手段
は、帳票別辞書手段の帳票別辞書による照合結果を優先
するのが好適である。
Further, in the present invention described above, it is preferable that the creation means gives priority to the collation results by the form-specific dictionary of the form-specific dictionary means.

【0014】[0014]

【実施例】次に、本発明の実施例について、図面を参照
して説明する。
Embodiments Next, embodiments of the present invention will be described with reference to the drawings.

【0015】図1は、本発明の一実施例を示すブロック
図である。図1の光学文字読取装置は、認識部1と、二
次判定制御部2と、修正部3と、メモリ4,6と、出力
部5と、登録制御部7と、標準辞書8と、帳票種別辞書
9とを備えている。
FIG. 1 is a block diagram showing one embodiment of the present invention. The optical character reading device shown in FIG. A type dictionary 9 is also provided.

【0016】認識部1は、帳票上の読み取り領域に記載
された文字の光学的走査を行い、1文字毎の文字パター
ンを切り出し、抽出された特徴と標準辞書8を照合する
ことによって一次判定結果と文字パターンとをデータ1
01として出力する。
The recognition unit 1 optically scans the characters written in the reading area on the form, cuts out the character pattern of each character, and compares the extracted features with the standard dictionary 8 to obtain the primary judgment result. and the character pattern as data 1
Output as 01.

【0017】二次判定制御部2は、メモリ6を参照し、
現在読み取り中の帳票に対応する辞書が作成されていれ
ば、データ101の文字パターンと帳票種別辞書9を照
合して得られた判定結果と、データ101の一次判定結
果とを比較照合し、二次判定結果と文字パターンおよび
帳票種別コードをデータ201として出力する。
The secondary determination control unit 2 refers to the memory 6 and
If a dictionary corresponding to the form currently being read has been created, the judgment result obtained by comparing the character pattern of the data 101 with the form type dictionary 9 is compared with the primary judgment result of the data 101, and the second judgment result is compared. The next determination result, character pattern, and form type code are output as data 201.

【0018】修正部3は、メモリ4を参照しデータ20
1の修正動作を制御する。
The correction unit 3 refers to the memory 4 and edits the data 20.
Controls the corrective action of 1.

【0019】メモリ4は、二次判定による読み取りデー
タの修正の実行・不実行を決定する情報が格納されてい
る。
The memory 4 stores information for determining execution/non-execution of correction of read data through secondary determination.

【0020】メモリ6は、現在読み取り中の帳票に対応
する辞書が帳票種別辞書9に作成済みか否かの情報、す
なわち帳票種別辞書9を照合して判定を実行するか否か
の情報を格納する。
The memory 6 stores information as to whether or not a dictionary corresponding to the form currently being read has been created in the form type dictionary 9, that is, information as to whether or not to check the form type dictionary 9 to make a determination. do.

【0021】登録制御部7は、データ301の帳票種別
コードを参照し、帳票種類毎に修正結果と文字パターン
を格納し、帳票毎の辞書を作成し、帳票種別辞書9へ作
成した辞書を登録する。
The registration control unit 7 refers to the form type code in the data 301, stores the correction results and character patterns for each form type, creates a dictionary for each form, and registers the created dictionary in the form type dictionary 9. do.

【0022】標準辞書8は、帳票間で共通な文字パター
ンを読み取る辞書を格納する。
The standard dictionary 8 stores a dictionary for reading common character patterns among forms.

【0023】帳票種別辞書9は、帳票の種類によって異
なる文字パターンを読み取る辞書を作成する。
The form type dictionary 9 creates a dictionary that reads different character patterns depending on the type of form.

【0024】次に、本実施例の動作について説明する。Next, the operation of this embodiment will be explained.

【0025】標準辞書8には、帳票間で共通な文字パタ
ーンを読み取る辞書が格納されている。認識部1は、帳
票上の読み取り領域に記載された文字の光学的走査を行
い、1文字毎の文字パターンを切り出し、抽出された特
徴と標準辞書8とを照合することによって、一次判定結
果と文字パターンとをデータ101として出力する。メ
モリ6には、現在、読み取り中の帳票に対応する辞書が
帳票種別辞書9に作成済みか否かの情報、すなわち、帳
票種別辞書9を照合して判定を実行するか否かの情報が
格納されている。
The standard dictionary 8 stores a dictionary for reading common character patterns among forms. The recognition unit 1 optically scans the characters written in the reading area on the form, cuts out the character pattern for each character, and compares the extracted features with the standard dictionary 8 to obtain the primary judgment result. The character pattern is output as data 101. The memory 6 stores information as to whether or not a dictionary corresponding to the form currently being read has been created in the form type dictionary 9, that is, information as to whether or not to perform a determination by comparing the form type dictionary 9. has been done.

【0026】二次判定制御部2は、メモリ6を参照し、
現在、読み取り中の帳票に対応する辞書が作成されてい
れば、データ101の文字パターンと帳票種別辞書9と
を照合して得られた判定結果と、データ101の一次判
定結果とを比較照合し、二次判定結果と文字パターンお
よび帳票種別コードをデータ201として出力する。ま
た、二次判定制御部2はメモリ6を参照し、現在読み取
り中の帳票に対応する辞書が作成されていなければ、デ
ータ101に帳票種別コードを加え、データ201とし
て出力する。
The secondary determination control unit 2 refers to the memory 6 and
If a dictionary corresponding to the form currently being read has been created, the judgment result obtained by comparing the character pattern of the data 101 with the form type dictionary 9 is compared with the primary judgment result of the data 101. , the secondary determination result, character pattern, and form type code are output as data 201. Further, the secondary determination control unit 2 refers to the memory 6, and if a dictionary corresponding to the form currently being read has not been created, it adds a form type code to the data 101 and outputs it as data 201.

【0027】二次判定制御部2において、一次判定結果
と、帳票種別辞書9による判定結果と、二次判定結果と
の関係を表1に示す。
Table 1 shows the relationship between the primary determination result, the determination result based on the form type dictionary 9, and the secondary determination result in the secondary determination control section 2.

【表1】[Table 1]

【0028】[0028]

【0029】この表1に示されるように、一次判定結果
または帳票種別辞書9による判定結果のどちらかが読み
取り不能であった場合は、読み取れた方を二次判定結果
とする。さらに、一次判定結果と帳票種別辞書9による
判定結果が異なる場合には、帳票種別辞書9による判定
結果を二次判定結果とする。一次判定結果および帳票種
別辞書9による判定結果の両方が読み取り不能の場合、
二次判定結果を読み取り不能とする。
As shown in Table 1, if either the primary determination result or the determination result from the form type dictionary 9 is unreadable, the one that can be read is taken as the secondary determination result. Further, if the primary determination result and the determination result by the form type dictionary 9 are different, the determination result by the form type dictionary 9 is determined as the secondary determination result. If both the primary judgment result and the judgment result by the form type dictionary 9 are unreadable,
Make the secondary judgment result unreadable.

【0030】メモリ4は、二次判定による読み取りデー
タの修正の実行・不実行を決定する情報が格納されてい
る。修正部3は、メモリ4を参照し、データ201の修
正動作を制御する。すなわち、修正を実行しない場合は
、データ201をそのまま出力部5へ出力する。修正を
実行する場合は、データ201の二次判定結果と文字パ
ターンの表示を行い、オペレータによる誤読文字や読み
取り不能文字の修正を実行し、修正結果と文字パターン
を出力部5へ出力すると共に、修正結果と文字パターン
および帳票種別コードをデータ301として登録制御部
7へ出力する。登録制御部7は、データ301の帳票種
別コードを参照し、帳票種類毎に修正結果と文字パター
ンを格納し、帳票毎の辞書を作成し、帳票種別辞書9へ
作成した辞書を登録する。
The memory 4 stores information for determining execution/non-execution of correction of read data by secondary determination. The modification unit 3 refers to the memory 4 and controls the modification operation of the data 201. That is, if no modification is to be performed, the data 201 is output as is to the output unit 5. When performing correction, the secondary judgment result and character pattern of the data 201 are displayed, the operator corrects misread characters and unreadable characters, outputs the correction result and character pattern to the output unit 5, The correction result, character pattern, and form type code are output to the registration control unit 7 as data 301. The registration control unit 7 refers to the form type code in the data 301, stores the correction results and character patterns for each form type, creates a dictionary for each form, and registers the created dictionary in the form type dictionary 9.

【0031】このようにして、帳票種別辞書9には、帳
票の種類によって異なる文字パターンを読み取る辞書を
作成することができる。
In this manner, it is possible to create a dictionary in the form type dictionary 9 that reads different character patterns depending on the type of form.

【0032】[0032]

【発明の効果】以上説明したように、本発明は、帳票間
で共通な文字パターンを読み取る標準辞書と、帳票の種
類によって異なる文字パターンを読み取る帳票別辞書と
、読み取り不能文字や誤読文字を修正した結果に従い帳
票種別辞書を作成する手段と、読み取る帳票に対応して
帳票種別辞書を選択制御する手段とを備えることにより
、帳票の種類別に辞書を自動的に作成することができ、
帳票の種類に対応して読み取る字形の範囲を任意に変更
することができるので、記入される文字の字形が異なる
場合でも、類似字形の誤読を防止し、読み取り不能を減
少することができるという効果を有する。
[Effects of the Invention] As explained above, the present invention provides a standard dictionary that reads common character patterns between forms, a form-specific dictionary that reads character patterns that differ depending on the type of form, and corrects unreadable characters and misread characters. By providing means for creating a form type dictionary according to the results of the reading, and means for selecting and controlling the form type dictionary in accordance with the read form, it is possible to automatically create a dictionary for each type of form.
Since the range of glyph shapes to be read can be arbitrarily changed according to the type of form, even if the glyph shapes of the characters entered are different, it is possible to prevent misreading of similar glyphs and reduce illegibility. has.

【0033】さらに、業種や業務によって異なる記入字
形に容易に対応できるので、適用業務に即応した光学文
字読取装置を提供できる。
Furthermore, since it is possible to easily deal with writing shapes that differ depending on the type of industry or business, it is possible to provide an optical character reading device that is immediately compatible with the application business.

【図面の簡単な説明】[Brief explanation of drawings]

【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.

【図2】帳票の種類と記入文字の関係を示す図である。FIG. 2 is a diagram showing the relationship between types of forms and written characters.

【符号の説明】[Explanation of symbols]

1  認識部 2  二次判定制御部 3  修正部 4  メモリ 5  出力部 6  メモリ 7  登録制御部 8  標準辞書 9  帳票種別辞書 1 Recognition part 2 Secondary judgment control section 3 Modification section 4 Memory 5 Output section 6 Memory 7 Registration control unit 8 Standard dictionary 9. Form type dictionary

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】帳票間で共通な文字パターンを読み取る標
準辞書を格納する標準辞書手段と、帳票の種類によって
異なる文字パターンを読み取る帳票別辞書を格納する帳
票別辞書手段と、標準辞書手段の標準辞書および帳票別
辞書手段の帳票別辞書の照合により判別される読み取り
不能文字や誤読文字を修正した結果に従い、帳票種別辞
書を帳票別辞書手段に作成する作成手段と、読み取る帳
票に対応して帳票種別辞書を選択制御する制御手段とを
有する光学文字読取装置。
Claims 1: Standard dictionary means for storing a standard dictionary for reading character patterns common between forms; form-specific dictionary means for storing form-specific dictionaries for reading character patterns that differ depending on the type of form; and standards for the standard dictionary means. A creation means for creating a form type dictionary in the form-specific dictionary means according to the result of correcting unreadable characters and misread characters determined by checking the dictionary and the form-specific dictionary of the form-specific dictionary means, and a form-based dictionary corresponding to the form to be read. An optical character reading device having a control means for selecting and controlling a type dictionary.
【請求項2】標準辞書手段は、1文字毎の文字パターン
を切り出して読み出す請求項1記載の光学文字読取装置
2. The optical character reading device according to claim 1, wherein the standard dictionary means cuts out and reads out a character pattern for each character.
【請求項3】作成手段は、帳票別辞書手段の帳票別辞書
による照合結果を優先する請求項1または2記載の光学
文字読取装置。
3. The optical character reading device according to claim 1, wherein the creation means gives priority to the result of collation by the form-specific dictionary of the form-specific dictionary means.
JP3112304A 1991-04-18 1991-04-18 Optical character reader Pending JPH04319790A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3112304A JPH04319790A (en) 1991-04-18 1991-04-18 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3112304A JPH04319790A (en) 1991-04-18 1991-04-18 Optical character reader

Publications (1)

Publication Number Publication Date
JPH04319790A true JPH04319790A (en) 1992-11-10

Family

ID=14583329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3112304A Pending JPH04319790A (en) 1991-04-18 1991-04-18 Optical character reader

Country Status (1)

Country Link
JP (1) JPH04319790A (en)

Similar Documents

Publication Publication Date Title
US5544045A (en) Unified scanner computer printer
US8270721B2 (en) Method and system for acquiring data from machine-readable documents
CA2417663C (en) Orthogonal technology for multi-line character recognition
USRE36581E (en) Character reader and recognizer with a specialized editing function
US5717794A (en) Document recognition method and system
US4933979A (en) Data reading apparatus for reading data from form sheet
US6600482B1 (en) Method and system for form recognition and digitized image processing
KR20040078046A (en) Form definition data creation method and form handling machines
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH04319790A (en) Optical character reader
JP2733837B2 (en) Character reader
JP2990942B2 (en) Optical character reader
JP2784004B2 (en) Character recognition device
JP2924356B2 (en) Optical character reader
JPH0749924A (en) Handwritten character recognizing device
JPH0696272A (en) Business form format definition body generating device
JPS62298885A (en) Optical character read system
JPH04242874A (en) Optical character reader
JPH06223221A (en) Character recognizing device
JP2003099709A (en) Misread character correction method and optical character recognition device
Sutcliffe et al. Data Entry Interfaces
JPH04293185A (en) Filing device
JPH09190482A (en) System for reading slip and its method
JPS63220383A (en) Character input device
JPS62290984A (en) Pattern information inputting paper and method of recognizing pattern information using said paper