JPS59200380A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPS59200380A
JPS59200380A JP58074730A JP7473083A JPS59200380A JP S59200380 A JPS59200380 A JP S59200380A JP 58074730 A JP58074730 A JP 58074730A JP 7473083 A JP7473083 A JP 7473083A JP S59200380 A JPS59200380 A JP S59200380A
Authority
JP
Japan
Prior art keywords
pattern
character
correct answer
level
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58074730A
Other languages
Japanese (ja)
Inventor
Yoshihisa Tanabe
田辺 吉久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58074730A priority Critical patent/JPS59200380A/en
Publication of JPS59200380A publication Critical patent/JPS59200380A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To relax a character writing condition by displaying a rejected character pattern and correcting properly and automatically the sensitivity level of a character pattern which is quantized by a correct answer fed by an operator. CONSTITUTION:An operator observes the displayed rejection patterns (b) and (c) and a form and feeds the correct answer through an answer input device 5. A correct answer pattern is sent to a level correcting circuit 6 as well as an answer editing circuit 7. The circuit 6 compares the correct answer pattern of the rejection pattern with the result of discrimination obtained from a character recognizing part 3 and decides whether the sensitivity level of a quantization pattern is proper or not. The result of this decision is fed back to a multi-value memory 2 through a signal line l3 to correct the sensitivity to a proper level. At the same time, the pattern having a sensitivity level corrected by the identification of the next character is sent to a character recognizing part 3.

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、光4字読取装置(以下、0CR)に関するも
のである。
DETAILED DESCRIPTION OF THE INVENTION [Technical Field of the Invention] The present invention relates to an optical four-character reader (hereinafter referred to as OCR).

〔発明の技術的背景とその問題点〕[Technical background of the invention and its problems]

一般に、OCRの適用範囲が拡大するにつれて入力する
データ(帳票上のデータ)の品質が低下するという現象
がみもれる。これは、OCRのオペレータとして操作の
不慣れな人が増加することに起因するものと考えられる
。一方、OCRのコスト上昇を抑制するためには入力デ
ータに種々の条件を設定せざるを得ないという事情があ
る。とい5のは、帳票へ記入される文字の一度が記入す
る人やプリンタの状態によって千差万別であり、相当な
範囲に分布するので、これを自動的に補正するには複雑
な装置構成となり、その結果コストが上昇してしまうか
らである。したがって、装置構成をできるだけ簡単なも
のにするためには、記入段階でPO2の値を規制する等
の条件を付することか必要となるのである。PO2とは
印字濃度のことをいい、帳票の背景濃度をB、印字(又
は記入文字)の濃度をPとすると、(B−P )/Bで
評価される値である。
Generally, as the scope of application of OCR expands, the quality of input data (data on forms) deteriorates. This is considered to be due to the increase in the number of OCR operators who are inexperienced with the operation. On the other hand, in order to suppress the increase in OCR costs, it is necessary to set various conditions for input data. Point 5 is that the number of characters entered on a form varies greatly depending on the person writing it and the state of the printer, and is distributed over a considerable range, so automatically correcting this requires a complicated device configuration. This is because the cost increases as a result. Therefore, in order to make the device configuration as simple as possible, it is necessary to impose conditions such as regulating the PO2 value at the entry stage. PO2 refers to print density, and is a value evaluated by (B-P)/B, where B is the background density of the form and P is the density of the print (or written characters).

かくして、かかる記入条件が設定されたOCRを各種窓
口業務に用いた場合には、帳票への記入は一般の人によ
り行われることが多いため記入条件が満たされる保証が
なく、したがって読取精度が問題となる。
Therefore, when OCR with such entry conditions set is used for various counter operations, there is no guarantee that the entry conditions will be met because the entries on forms are often made by ordinary people, and therefore reading accuracy becomes a problem. becomes.

〔発明の目的〕[Purpose of the invention]

そこで、本発明は読取精度を低下させることなく文字記
入条件を緩和しつるOCRを提供することを目的とする
Therefore, an object of the present invention is to provide an OCR that relaxes character entry conditions without reducing reading accuracy.

〔発明の概要〕[Summary of the invention]

上記目的を達成するために、本発明によるOCRは、リ
ジェクトされた文字パターンを表示装置に表示し、その
表示内容に基づいてオペレータが正しい答を入力し、入
力された正しい答により量子化された文字パターンの感
度レベルを適正に自動補正するように構成したことを特
徴とするものである。
In order to achieve the above object, the OCR according to the present invention displays a rejected character pattern on a display device, an operator inputs a correct answer based on the displayed content, and the quantized character pattern is quantized by the input correct answer. The present invention is characterized in that it is configured to appropriately automatically correct the sensitivity level of the character pattern.

〔発明の実施例〕[Embodiments of the invention]

第1図に本発明によるOCRの一実施例を示す。 FIG. 1 shows an embodiment of OCR according to the present invention.

読取データDは光電変換部1により多値レベルの量子化
パターンに変換され、次いで多値メモリ2に記憶される
。記憶されたパターンは順次切出されて文字認識部3へ
信号線!1 を介して送られる。
The read data D is converted into a multilevel quantization pattern by the photoelectric conversion section 1 and then stored in the multilevel memory 2. The stored patterns are sequentially cut out and sent to the character recognition unit 3 via a signal line! Sent via 1.

文字認識部3では切出されたパターンを内部辞書との比
較により判別を行う。このとぎ、最初の細文字かはりジ
エクトレベルを高くしておぎ、不確実なものはすべてリ
ジェクトするよ’5に−fる。
The character recognition unit 3 performs discrimination by comparing the extracted pattern with an internal dictionary. From now on, set the first small letter to a high level, and reject anything you are unsure about.

後述する感度レベルの補正を行うためである、リジェク
トされたパターンは信号縁j2を通じて多値メモリ2に
知らせ、パターン表示袋g(CRT表示装置等)4上に
表示させる。
The rejected pattern, which is used to correct the sensitivity level to be described later, is notified to the multi-level memory 2 through the signal edge j2 and displayed on the pattern display bag g (CRT display device or the like) 4.

パターン表示装置4では、第2図に示すようにリジェク
トパターンを表示する。すなわち、第2図(a)は帳表
上に記入された原稿文字を示しており、数字「8」 に
ついてかすれ部分A、汚れ部分B。
The pattern display device 4 displays a reject pattern as shown in FIG. That is, FIG. 2(a) shows manuscript characters written on a book cover, with the number "8" having a faded part A and a smeared part B.

Cが存在するものとする。この原稿文字を第1の感度レ
ベルで量子化したノくターンが第2図(b)、第2の感
度レベルで量子化したノくターンカー第2図fc)に示
されている。第1の感度レベルは第2の感度レベルより
濃いレベルとする。以上のfa)(b)図の2種の感度
レベルで量子化したノくターンがノくターン表示装置4
に表示されることになる。このように、濃淡2つの感度
レベルのノくターンを表示することとしたのは、オペレ
ータの目視により判断を容易かつ正確にするためである
Assume that C exists. A nokuturn obtained by quantizing the original characters at the first sensitivity level is shown in FIG. 2(b), and a nokuturn obtained by quantizing the original characters at the second sensitivity level is shown in FIG. 2fc). The first sensitivity level is darker than the second sensitivity level. The above fa) (b) Nokuturn display device 4 quantized at two sensitivity levels shown in the figure.
will be displayed. The reason why the turn is displayed in two sensitivity levels, dark and dark, is to make it easier and more accurate for the operator to make a visual judgment.

オペレータは表示されたりジエクトノ(ターン(第2図
(b) 、 (c) )および帳票をみて正い・答を答
入力装置5により入力する。答入力装置5としてはキー
ボードあるいは音声入力装置等を用X、)ることかでき
る。正しい答、すなわち正解ノくターン(まレベル補正
回路6および答編集回路7に送られる。
The operator inputs the correct answer using the answer input device 5 by looking at the displayed turn (Fig. 2 (b), (c)) and the form.The answer input device 5 may be a keyboard, voice input device, etc. (X, ) can be done. The correct answer, that is, the correct answer, is sent to the level correction circuit 6 and the answer editing circuit 7.

レベル補正回路6は当該リジエクトノくターンについて
の正解パターンと文字認識部3での判別結果とを比較し
、量子化パターンの感度レベルが適正であったかどうか
を判断オろ。その判断結果は信号線!3を通じて多値メ
モリ2ヘフイードノくツクされ、フィードバックされた
判断結果により感度レベルが適正に修正される。次の文
字の識別から補正された感度レベルのパターンか文字認
識部3に送られてくる。このように、補正した感度レベ
ルで後続する文字のパターンを画一的に識別することと
した理由は、一般に、同一人の記入文字の濃度レベルは
同−帳票内において一定であり7また、プリンタの出力
(印字)についても同様だからである。仮にリジェクト
されたとしても、上述同様の補正が自動的に行われるの
で問題はない。
The level correction circuit 6 compares the correct pattern for the relevant redirection turn with the discrimination result of the character recognition section 3, and determines whether the sensitivity level of the quantization pattern is appropriate. The result of that judgment is the signal line! 3 to the multi-value memory 2, and the sensitivity level is appropriately corrected based on the feedback judgment result. After the next character is identified, the corrected sensitivity level pattern is sent to the character recognition unit 3. The reason for uniformly identifying subsequent character patterns using the corrected sensitivity level is that the density level of characters written by the same person is generally constant within the same document7. This is because the same applies to the output (printing) of . Even if the application is rejected, there is no problem because the same correction as described above is automatically performed.

答編集回路7は答入力装置5かもの正解ノくターンと、
文字識別部3かもの識別ノくターンとに基づき答を最終
的に編集して出力同−石。
The answer editing circuit 7 selects the correct answer from the answer input device 5, and
Character identification section 3 Finally edits the answer based on the identification number turn and outputs the same stone.

〔発明の効果〕〔Effect of the invention〕

以上の通り、本発明によれば、リジエクトノくターンに
基づいてオペレータの認識能力を加味した上で感度レベ
ルを補正するため、高精度な識別が可能となる。その結
果、帳票記入時の条件を特に厳しくする等の制約をしな
くても正確に認識することができろ。
As described above, according to the present invention, since the sensitivity level is corrected based on the redirect turn and taking into account the recognition ability of the operator, highly accurate identification is possible. As a result, accurate recognition can be achieved without any restrictions such as particularly strict conditions when filling out forms.

また、かくして自動補正されるため、高価な回路を付加
することなく、広範囲な濃度のパターンを認識すること
ができる。
Further, since automatic correction is performed in this manner, patterns with a wide range of density can be recognized without adding expensive circuits.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明によるOCRの要部を示すブロック図、 第2図はりジエクトパターンの説明図で、(a)は原稿
文字パターン、(b)は第1感度レベルの表示パターン
、(C)は第2感度レベルの表示パターンをそれぞれ示
す図である。 1・・・光電変換部 2・・・多値メモリ 3・・・文字認識部 4・・・パターン表示装置 5・・・答入力装置 7・・・答編集回路 出願人代理人  猪  股    清
FIG. 1 is a block diagram showing the main part of the OCR according to the present invention, and FIG. 2 is an explanatory diagram of the beam target pattern, in which (a) is a document character pattern, (b) is a display pattern of the first sensitivity level, and (C ) are diagrams showing display patterns of the second sensitivity level, respectively. 1...Photoelectric conversion unit 2...Multi-level memory 3...Character recognition unit 4...Pattern display device 5...Answer input device 7...Answer editing circuit Applicant's agent Kiyoshi Inomata

Claims (1)

【特許請求の範囲】 読取データを光電変換して多値レベルのパターンに量子
化する光電変換部と、 前記量子化パターンを記憶する多値メモリと、前記多値
メモリから格納文字パターンを切出して認識する文字認
識部と、 前記文字認識部においてリジェクトされたノくターンを
少なくとも2種の濃度レベルでそれぞれ表示する表示装
置と、 オペレータの判断により前記リジエクトノくターンにつ
いての正しい答を入力するための再入力装置と、 前記リジェクトパターンについての正しい答と前記文字
認識部における認識結果とを比較し、前記多値メモリに
格納されている量子化ノくターンの感度レベルの適否ケ
判定し、その判定結果により感度レベルを補正するレベ
ル補正−回路と、リジェクトパターンについての正しい
答と認識
[Claims] A photoelectric conversion unit that photoelectrically converts read data and quantizes it into a multilevel pattern; a multilevel memory that stores the quantized pattern; and a photoelectric conversion unit that cuts out a stored character pattern from the multilevel memory. a display device for displaying the rejected noku turns in at least two density levels, and a display device for inputting a correct answer for the rejected noku turns according to an operator's judgment; A re-input device compares the correct answer for the reject pattern with the recognition result in the character recognition unit, determines whether the sensitivity level of the quantization number stored in the multi-level memory is appropriate, and makes the determination. Level correction that corrects the sensitivity level based on the result - Correct answer and recognition of the circuit and reject pattern
JP58074730A 1983-04-27 1983-04-27 Optical character reader Pending JPS59200380A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58074730A JPS59200380A (en) 1983-04-27 1983-04-27 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58074730A JPS59200380A (en) 1983-04-27 1983-04-27 Optical character reader

Publications (1)

Publication Number Publication Date
JPS59200380A true JPS59200380A (en) 1984-11-13

Family

ID=13555629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58074730A Pending JPS59200380A (en) 1983-04-27 1983-04-27 Optical character reader

Country Status (1)

Country Link
JP (1) JPS59200380A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5259531A (en) * 1975-11-12 1977-05-17 Hitachi Ltd Slice level switching system
JPS5567872A (en) * 1978-11-15 1980-05-22 Mitsubishi Electric Corp Optical character reader

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5259531A (en) * 1975-11-12 1977-05-17 Hitachi Ltd Slice level switching system
JPS5567872A (en) * 1978-11-15 1980-05-22 Mitsubishi Electric Corp Optical character reader

Similar Documents

Publication Publication Date Title
KR930010845B1 (en) Graphic and character auto-separating method of video signal
US5659638A (en) Method and system for converting bitmap data into page definition language commands
US20040161149A1 (en) Image processing method, device and storage medium therefor
JPS59200380A (en) Optical character reader
JPH06131495A (en) Image information extraction system
JPS6336389A (en) Character reader
JPH08272902A (en) Method for recognizing character of different quality and different font
JPS59158482A (en) Character recognizing device
JPS6120180A (en) Optical character recognizing device
JPH05210763A (en) Automatic learning type character recognizing device
JPH08315077A (en) Method for recognizing word
JPS6139175A (en) Optical character reading device
JPH06290308A (en) Character recognizing device
JPH06350851A (en) Background density detection device
JPS6061875A (en) Generation system of standard pattern
JPS60110089A (en) Character recognizer
JPS62288989A (en) Character recognizing system
JPH1145310A (en) Character recognizing device
JP2000306042A (en) Device and method for recognizing character
JPS6327992A (en) Generating method for dictionary for individual
JPH06243285A (en) Character recognition method
JPH03149648A (en) Document processor
JPS5931749B2 (en) Graphic preprocessing device
JPH07319996A (en) Optical character reader
JPS63150787A (en) Optical character recognition device