JPS63316189A - Optical character recognition device - Google Patents

Optical character recognition device

Info

Publication number
JPS63316189A
JPS63316189A JP62151926A JP15192687A JPS63316189A JP S63316189 A JPS63316189 A JP S63316189A JP 62151926 A JP62151926 A JP 62151926A JP 15192687 A JP15192687 A JP 15192687A JP S63316189 A JPS63316189 A JP S63316189A
Authority
JP
Japan
Prior art keywords
character
image
pattern
recognized
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62151926A
Other languages
Japanese (ja)
Inventor
Kazuho Uematsu
上松 一歩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Priority to JP62151926A priority Critical patent/JPS63316189A/en
Publication of JPS63316189A publication Critical patent/JPS63316189A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To attain efficient and accurate correction by displaying a character pattern indicated by a character code converted by a character recognition section together with an image pattern extracted from a character picture not recognized so as to allow manual correction. CONSTITUTION:A picture of an OCR original 1 to be read is inputted to a picture input section 2 and stored once in an input picture storage section 3. A character recognition section 4 converts the stored picture into a character code recognized normally and a reject code not recognized and stores the result to a code data storage section 5. A character pattern generating section 6 generates a character pattern indicated by the character code being the result of conversion by the normal recognition and a character picture extracting means 12 extracts a character picture not recognized by the recognition section 4 to generate the image pattern. The character pattern recognized normally and the image pattern not recognized are displayed on a display section 8. Thus, the operator uses an input device 11 to operate a correction processing means 10 to attain efficient and accuracy correction.

Description

【発明の詳細な説明】 産業上の利用分野 この発明は、所定の記入欄((記入された手書文字を認
識して文字コードに変換するOCR装置(光学式文字認
識装置)に関する。
DETAILED DESCRIPTION OF THE INVENTION Field of the Invention The present invention relates to an OCR device (optical character recognition device) that recognizes handwritten characters written in a predetermined entry field and converts them into character codes.

従来の技術 従来のこの種のOCR装置では、ファクシミリなどの画
像読取装置によって入力された画像の所定箇所にある手
書文字画像を1字ずつ認識処理して文字コードに変換す
る。このとき、一部の手書文字画像が崩し字や癖字であ
ったりして認謝されなかった場合、その認識されなかっ
た文字画像はりジエクト・コードに仮変換されて出力さ
れる。
BACKGROUND OF THE INVENTION Conventional OCR devices of this type recognize handwritten character images located at predetermined locations in an image input by an image reading device such as a facsimile, character by character, and convert them into character codes. At this time, if some of the handwritten character images are not recognized because they are broken or quirky, the unrecognized character images are temporarily converted to a jijikuto code and output.

このリジェクト・コードからは、ブランクあるいは認識
不能であったことを示す適当な記号パターンが生成され
て、正規の文字コードから生成された文字パターンと一
緒に出力表示される。認識されなかった文字画像は、人
手による修正作業によって正規の文字コードに変換され
る。
From this reject code, an appropriate symbol pattern indicating that it is blank or unrecognizable is generated and output and displayed together with the character pattern generated from the regular character code. Character images that are not recognized are converted into regular character codes through manual correction work.

発明が解決しようとする問題点 しかし、かかる構成によれば、認識されなかった文字画
像を人手によって正規の文字コードに変換する修正作業
は、1字修正するごとに入力画像と出力表示画面の両方
を交互に参照しなければならないので、作業能率が悪く
、見間違いによる修正ミスも起きやすい、といった問題
点があった。
Problems to be Solved by the Invention However, with this configuration, the correction work of manually converting unrecognized character images into regular character codes requires both the input image and the output display screen to be corrected each time one character is corrected. Since the user has to refer to the information alternately, there are problems in that work efficiency is poor and correction errors are likely to occur due to misunderstandings.

上述の問題は以下の理由で生ずる。すなわち、文字画像
が正規に認識されたか否かは出力表示画面を見なければ
判明せず、認識されなかった文字画像の文字内容を検討
するためには入力画像を見なければならないからである
The above problem arises for the following reasons. That is, it cannot be determined whether or not a character image has been properly recognized without looking at the output display screen, and it is necessary to look at the input image in order to examine the character content of a character image that has not been recognized.

この発明は、上述の問題点を鑑みてなされたもので、作
業者が1字修正するごとに入力画像と出力表示画面の両
方を交互に参照しなければならない面倒を行わずとも、
出力表示された画面だけを見ながら、認識されなかった
文字画像を手動で正規の文字コードに変換する修正作業
を効率良く、しかも間違いなく行える光学式文字認識装
置を提供することを目的とする。
This invention was made in view of the above-mentioned problems, and it is possible to eliminate the trouble of having to alternately refer to both the input image and the output display screen each time the operator corrects a single character.
To provide an optical character recognition device capable of efficiently and accurately performing correction work of manually converting unrecognized character images into regular character codes while viewing only an output displayed screen.

問題点を解決するための手段 この発明は、上述の問題点を解決するため、ファクシミ
リなどの画像読取装置から入力された画像の所定箇所に
ある文字画像を認識処理して文字コードに変換する文字
認識部と、この文字認識部で変換された文字コードが指
示する文字のパターンを生成する文字パターン発生部と
、上記文字認識部で認識されなかった文字画像を入力画
像から抽出して上記文字パターンに代わるイメージ・パ
ターンを生成する文字画像抽出手段と、上記文字パター
ン発生部にて生成された文字パターンを上記文字画像抽
出手段にて生成されたイメージ・パターンとともに表示
する表示部と、上記イメージ・パターンの部分を手動の
入力操作に基づいて正規の文字コードに変換する修正処
理手段とを備えたものである。
Means for Solving the Problems In order to solve the above-mentioned problems, the present invention provides a character image recognition process for character images at predetermined locations in an image input from an image reading device such as a facsimile machine and converting them into character codes. a recognition unit; a character pattern generation unit that generates a character pattern specified by the character code converted by the character recognition unit; and a character pattern generation unit that extracts character images not recognized by the character recognition unit from the input image and generates the character pattern. a display section for displaying the character pattern generated by the character pattern generation section together with the image pattern generated by the character image extraction means; and a correction processing means for converting the pattern part into a regular character code based on a manual input operation.

作用 この発明は上述の構成によって、認識された文字画像に
基づいて生成された正規の文字パターンとともに、認識
されなかった文字画像に基づいて生成されたイメージ・
パターンも一緒に出力表示されるので、その出力表示さ
れた画面だけから、認識されなかった文字画像の文字内
容を直接的に目視して検討することができる。これによ
り、作業者が1字修正するごとに入力画像と出力表示画
面の両方を交互に参照する面倒を行わずとも、出力表示
された画面だけを見ながら、認識されなかった文字を手
動で正規の文字コードに変換する修正作業を効率良く、
しかも間違いなく行えるようになる。
Effect of the Invention With the above-described configuration, the present invention uses regular character patterns generated based on recognized character images as well as images and images generated based on unrecognized character images.
Since the pattern is also output and displayed, the character content of the unrecognized character image can be directly viewed and examined from only the output and displayed screen. This allows the operator to manually correct unrecognized characters while looking only at the output display screen, without having to go through the trouble of alternately referring to both the input image and the output display screen each time a worker corrects a character. Efficiently perform correction work to convert to character code.
And you can definitely do it.

実施例 第1図はこの発明の一実施例によるOCR装置の概略構
成を示す。
Embodiment FIG. 1 shows a schematic configuration of an OCR apparatus according to an embodiment of the present invention.

同図に示すOCR装置は、先ず、画像入力部2、入力画
像記憶部3、文字認識部(OCR)4、コード・データ
記憶部5、文字パターン発生部6、表示画像記憶部7、
表示部(ディスプレイ)8、プリンタ9、修正処理手段
10、キーボード等の入力装置11、および文字画像抽
出手段12を有する。
The OCR device shown in the figure first includes an image input section 2, an input image storage section 3, a character recognition section (OCR) 4, a code/data storage section 5, a character pattern generation section 6, a display image storage section 7,
It has a display section (display) 8, a printer 9, a correction processing means 10, an input device 11 such as a keyboard, and a character image extraction means 12.

画像入力部2は、ファクシミリなどによって読み取られ
たOCR原稿1の画像を入力する。
The image input unit 2 inputs an image of the OCR original 1 read by a facsimile or the like.

OCR原稿1は、第2図にその書式の一例を示すように
、OCR原稿であることを表わすヘッダーマークIA、
行を示すタイミングマークIB。
The OCR manuscript 1 has a header mark IA indicating that it is an OCR manuscript, as shown in FIG. 2 as an example of its format.
Timing mark IB indicating the line.

および1字ずつの文字記入欄ICなどが設けられている
and a character entry field IC for each character.

画像入力部2から入力された画像2は、入力画像記憶部
3に一旦記憶される。
The image 2 input from the image input section 2 is temporarily stored in the input image storage section 3.

文字認識部4は、入力画像記憶部3に記憶された入力画
像の所定箇所にある手書文字画像を1字分ずつ抜き出し
て認識処理にかける。認識された文字は1字分ずつ文字
コードに変換される。このとき、元の手書文字が崩し字
や癖字であったりして、文字として認識できなかった場
合には、その認識できなかった文字画像だけを一種のダ
ミーであるリジェクト書コードに仮変換する。このリジ
ェクト・コードは、正規に認識された文字コードととも
に、変換順に出力されてコード・データ記憶部5に格納
される。
The character recognition section 4 extracts handwritten character images one by one from predetermined locations of the input image stored in the input image storage section 3 and subjects them to recognition processing. Recognized characters are converted into character codes one by one. At this time, if the original handwritten characters are broken or quirky and cannot be recognized as characters, only the unrecognized character images are temporarily converted into a kind of dummy reject handwriting code. do. This reject code is outputted and stored in the code data storage unit 5 in the order of conversion together with the normally recognized character code.

文字パターン発生部6は、コード・データ記憶部5に格
納されたコードのうち、正規に認識されて変換された文
字コードが指示する文字パターンを生成する。この文字
パターンの生成は、図示を省略するが、あらかじめ用意
された文字フォントセットから引用することにより行わ
れる。生成された文字パターンは、表示画像記憶部7に
ビットマツプ・イメージの形で記憶される。
The character pattern generating section 6 generates a character pattern indicated by a character code that is properly recognized and converted from among the codes stored in the code/data storage section 5. Although not shown, this character pattern is generated by quoting from a character font set prepared in advance. The generated character pattern is stored in the display image storage section 7 in the form of a bitmap image.

表示部8はCRT表示装置などを用いて構成され、表示
画像記憶部7に記憶されたイメージ・データをビットマ
ツプ方式で表示する。このとき、上記文字パターン発生
部5が生成した文字パターンは、元の手書文字の記入欄
に対応する位置に表示される。
The display section 8 is constructed using a CRT display device or the like, and displays the image data stored in the display image storage section 7 in a bitmap format. At this time, the character pattern generated by the character pattern generating section 5 is displayed at a position corresponding to the entry field for the original handwritten character.

プリンタ9は、上記コード・データ記憶部5に格納され
た文字コード列あるいは表示記憶部7に記憶されたイメ
ージのハード拳コピーを印刷出力する。
The printer 9 prints out a hard fist copy of the character code string stored in the code/data storage section 5 or the image stored in the display storage section 7.

修正処理手段10は、キーボード等の入力装置11から
の操作入力に基づいて、上記コード・データ記憶部5の
記憶内容を修正処理する一種の編集機能を備えている。
The modification processing means 10 has a kind of editing function for modifying the contents stored in the code/data storage section 5 based on an operation input from an input device 11 such as a keyboard.

この修正処理手段10によって修正処理されたコード・
データ記憶部5の記憶内容は、OCR装置の出力データ
として外部へも出力されるようになっている。
The code corrected by this correction processing means 10
The stored contents of the data storage section 5 are also output to the outside as output data of the OCR device.

そして、文字画像抽出手段12は1.上記文字認識部5
で認識されなかった文字画像を入力画像から抽出し、こ
の抽出文字画像から上記文字パターンに代わるイメージ
・パターンを生成する。この文字画像抽出手段 2は、
文字認識部4がリジェクト・コードを仮変換したときに
動作して、そのリジェクト・コードの原因となった手書
文字画像を抽出する。抽出された文字画像は、縮小ある
いは拡大等の処理によって、正規の文字パターンと同じ
ドツト構成(たとえば24X24ドツト)をもつイメー
ジ・パターンに変換される。
Then, the character image extraction means 12 performs 1. The above character recognition section 5
The character images that are not recognized in the above are extracted from the input image, and an image pattern that replaces the character pattern is generated from the extracted character images. This character image extraction means 2 is
The character recognition unit 4 operates when the reject code is temporarily converted, and extracts the handwritten character image that caused the reject code. The extracted character image is converted into an image pattern having the same dot configuration as the regular character pattern (for example, 24×24 dots) through processing such as reduction or enlargement.

このようにして生成されたイメージ・パターンは、上記
文字パターン発生部6で生成された正規の文字パターン
と同じように、表示画像記憶部7にビットマツプ・イメ
ージの形で記憶される。
The image pattern thus generated is stored in the display image storage section 7 in the form of a bitmap image, in the same way as the regular character pattern generated by the character pattern generation section 6.

これによシ、上記表示部8には、第3図に示すように、
正規に生成された文字のパターン13に混じって認識さ
れなかった手書文字の像をそのまま表わすイメージ・パ
ターン14が、それぞれに元の記入欄に対応する位置で
表示される。この場合、好ましくは、イメージ・パター
ン14だけが、色分けや黒白反転あるいは枠囲いなどに
よって、正規の文字パターンと異なる態様で表示される
ようにする。
Accordingly, the display section 8 displays the following information as shown in FIG.
Image patterns 14 that directly represent images of unrecognized handwritten characters mixed with the normally generated character patterns 13 are displayed at positions corresponding to the original entry fields. In this case, preferably only the image pattern 14 is displayed in a manner different from the regular character pattern by color coding, inversion of black and white, or by enclosing a frame.

以上のように、表示部8には、認識されなかった文字画
像のイメージ・パターンが、正規に認識された文字画像
に基づく文字パターンと一緒に出力表示される。これに
より、その表示部8に出力表示された画面だけから、認
識されなかった文字画像の文字内容を直接的に目視して
検討することができる。これにより、作業者が1字修正
するごとに入力画像と出力表示画面の両方を交互に参照
する面倒を行わずとも、出力表示された画面だけを見な
がら、認識されなかった文字を手動で正規の文字コード
に変換する修正作業を効率良く、しかも間違いなく行う
ことができる。
As described above, the image pattern of the unrecognized character image is output and displayed on the display unit 8 together with the character pattern based on the normally recognized character image. Thereby, it is possible to directly view and examine the character content of the unrecognized character image only from the screen output and displayed on the display unit 8. This allows the operator to manually correct unrecognized characters while looking only at the output display screen, without having to go through the trouble of alternately referring to both the input image and the output display screen each time a worker corrects a character. The correction work of converting to the character code can be performed efficiently and without error.

発明の効果 以上の説明から明らかなように、この発明は、認識され
なかった文字画像からイメージ・パターンを生成して、
認識された文字画像に基づいて生成された正規の文字パ
ターンと一緒に、出力表示させることにより、作業者が
1字修正するごとに入力画像と出力表示画面の両方を交
互に参照する面倒を行わずとも、出力表示された画面だ
けを見ながら、認識されなかった文字を手動で正規の文
字コードに変換する修正作業を効率良く、シかも間違い
なく行うことができる、という効果がある。
Effects of the Invention As is clear from the above explanation, the present invention generates an image pattern from an unrecognized character image,
By outputting and displaying the regular character pattern generated based on the recognized character image, the operator does not have to alternately refer to both the input image and the output display screen each time he/she corrects a single character. This has the effect of allowing you to manually convert unrecognized characters into regular character codes efficiently and without error while only looking at the output screen.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の一実施例によるOCR装置(光学式
文字認識装置)の概略構成を示すブロック図、第2図は
第1図に示しだ装置によって認識される文字が記入され
るOCR原稿の一部を部分的に示す平面図、第3図は第
1図に示した装置における出力表示画面の例を示す図で
ある。 1・・・OCR原稿、IC・・・文字記入欄、2・・・
画像入力部、3・・・入力画像記憶部、4・・・文字認
識部、5・・・コード・データ記憶部、6・・・文字パ
ターン発生部、7・・・表示画像記憶部、8・・・表示
部、9・・・プリンタ、10・・・修正処理手段、11
・・・キーボード等の入力装置、12・・・文字画像抽
出手段。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図
FIG. 1 is a block diagram showing a schematic configuration of an OCR device (optical character recognition device) according to an embodiment of the present invention, and FIG. 2 is an OCR document in which characters to be recognized by the device shown in FIG. 1 are written. FIG. 3 is a plan view showing a part of the apparatus shown in FIG. 1, and FIG. 3 is a diagram showing an example of an output display screen in the apparatus shown in FIG. 1...OCR manuscript, IC...character entry field, 2...
Image input section, 3... Input image storage section, 4... Character recognition section, 5... Code/data storage section, 6... Character pattern generation section, 7... Display image storage section, 8 . . . Display unit, 9 . . . Printer, 10 . . . Correction processing means, 11
. . . Input device such as a keyboard, 12 . . . Character image extraction means. Name of agent: Patent attorney Toshio Nakao and 1 other person No. 1
Figure 2 Figure 3

Claims (1)

【特許請求の範囲】[Claims] 入力画像の所定箇所にある文字画像を認識処理して文字
コードに変換する文字認識部と、この文字認識部で変換
された文字コードが指示する文字のパターンを生成する
文字パターン発生部と、上記文字認識部で認識されなか
つた文字画像を入力画像から抽出して上記文字パターン
に代わるイメージ・パターンを生成する文字画像抽出手
段と、上記文字パターン発生部にて生成された文字パタ
ーンを上記文字画像抽出手段にて生成されたイメージ・
パターンとともに表示する表示部と、上記イメージ・パ
ターンの部分を手動の入力操作に基づいて正規の文字コ
ードに変換する修正処理手段とを備えた光学式文字認識
装置。
a character recognition unit that recognizes and processes a character image at a predetermined location of an input image and converts it into a character code; a character pattern generation unit that generates a character pattern indicated by the character code converted by the character recognition unit; a character image extraction means for extracting a character image not recognized by the character recognition unit from the input image and generating an image pattern to replace the character pattern; The image generated by the extraction means
An optical character recognition device comprising: a display section that displays the image pattern together with the pattern; and a correction processing means that converts the image pattern portion into a regular character code based on a manual input operation.
JP62151926A 1987-06-18 1987-06-18 Optical character recognition device Pending JPS63316189A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62151926A JPS63316189A (en) 1987-06-18 1987-06-18 Optical character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62151926A JPS63316189A (en) 1987-06-18 1987-06-18 Optical character recognition device

Publications (1)

Publication Number Publication Date
JPS63316189A true JPS63316189A (en) 1988-12-23

Family

ID=15529219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62151926A Pending JPS63316189A (en) 1987-06-18 1987-06-18 Optical character recognition device

Country Status (1)

Country Link
JP (1) JPS63316189A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01302481A (en) * 1988-05-31 1989-12-06 Oki Electric Ind Co Ltd Optical character reader
JPH04500422A (en) * 1989-06-02 1992-01-23 イーストマン・コダック・カンパニー Method and apparatus for identifying unrecognizable characters in an optical character recognition device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60160483A (en) * 1984-02-01 1985-08-22 Hitachi Ltd Recognizing device of character
JPS60245088A (en) * 1984-05-18 1985-12-04 Ricoh Co Ltd Character recognition and correction system
JPS61115181A (en) * 1984-11-09 1986-06-02 Toshiba Corp Handwriting character recognizing device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60160483A (en) * 1984-02-01 1985-08-22 Hitachi Ltd Recognizing device of character
JPS60245088A (en) * 1984-05-18 1985-12-04 Ricoh Co Ltd Character recognition and correction system
JPS61115181A (en) * 1984-11-09 1986-06-02 Toshiba Corp Handwriting character recognizing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01302481A (en) * 1988-05-31 1989-12-06 Oki Electric Ind Co Ltd Optical character reader
JPH04500422A (en) * 1989-06-02 1992-01-23 イーストマン・コダック・カンパニー Method and apparatus for identifying unrecognizable characters in an optical character recognition device

Similar Documents

Publication Publication Date Title
JPS63316189A (en) Optical character recognition device
JPH0384681A (en) Input processing method for business card information
JPH0581266A (en) Information processor
JPS6292080A (en) Pattern recognizing device
JPH06164781A (en) Picture communication equipment
JPS594358Y2 (en) Character control device in character correction
JPS6320584A (en) Document preparing device
JP2001126025A (en) For ocr format parameter generation method
JPH0696272A (en) Business form format definition body generating device
JPH10214307A (en) Character recognition device and machinereadable recording medium where program making computer function as character recognition device is recorded
JPH04242873A (en) Optical character reader
JPH07306911A (en) Ocr reading result correcting device
JP3221969B2 (en) Character recognition device
JP2000050055A (en) Facsimile equipment and transmission method
JP2596328B2 (en) Display board system
JPS6049433A (en) Registration system of external character pattern
EP0428713A1 (en) Method and apparatus for identifying unrecognizable characters in optical character recognition machines
JPH01239586A (en) Image synthesizing and outputting device
JPH0554178A (en) Character recognizing device and slip for correction
JP2003085477A (en) Character recognizing device and correcting method of character recognition result
JPH096863A (en) Method and system for document image generation
JPH10326313A (en) Document format generating device
JPH04293185A (en) Filing device
JPH04294474A (en) Optical character reader
JPS6289180A (en) Handwritten character graphic processor