JPS63293690A - Character recognizing system - Google Patents

Character recognizing system

Info

Publication number
JPS63293690A
JPS63293690A JP62127885A JP12788587A JPS63293690A JP S63293690 A JPS63293690 A JP S63293690A JP 62127885 A JP62127885 A JP 62127885A JP 12788587 A JP12788587 A JP 12788587A JP S63293690 A JPS63293690 A JP S63293690A
Authority
JP
Japan
Prior art keywords
recognition
information
character
image information
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62127885A
Other languages
Japanese (ja)
Inventor
Isamu Nose
能勢 勇
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP62127885A priority Critical patent/JPS63293690A/en
Publication of JPS63293690A publication Critical patent/JPS63293690A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To improve the operability and the generality by displaying a character pattern of the image information concerned on a display device from character frame information of a rejected character. CONSTITUTION:In a process that a recognizing operation is executed with respect to a series of each image file, and a recognizing information file is generated, a controller 21 stores whether a reject exists or not. After a series of operations is ended, the controller 21 searches for the one in which the top recognizing code of the recognizing information file generated the reject is a reject code determined in advance, calculates a character pattern information area in the corresponding image information file information from its character frame information, and displays it on a monitor 24a. By looking at the displayed character pattern in such a way, an operator executes a correction from a keyboard 24b. Said operation is repeated until the reject is all corrected.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字認識システムに関し、特に読取不可(認識
不可)処理に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a character recognition system, and particularly to unreadable (unrecognizable) processing.

(従来の技術) 従来、この種の読取装置としては、例えば[電子計算機
人力のための文字・図形の自動認識](昭45−1−1
5)電気学会、P47.54〜55.160、に開示さ
れるものがある。その基本構成は帳票等の読取り対象の
画像情報を電気信号の形式で得るための走査部と、さら
に電気信号に変換された画像情報の中から文字を認識す
る認識部と、認識した文字コードを計算機等の上位制御
部に直接転送したリ、あるいは−担FDD等のファイル
メモリに蓄積するためのインターフェース部とから成る
。読取動作が正常に行われている場合には、次々と認識
結果の文字コードが転送、あるいは蓄積されていく。そ
して読取拒否(リジェクト)が発生した場合、次の3種
類の手法のうち、いずれかのりジェット処理がとられて
いる。第1の手法では、リジェクトの発生した文字の読
取結果を特殊コードに置換え、読取動作は続行するが、
リジェクトの発生した行に印を付け、第2の手法ではり
ジェツトの発生した帳票を読取動作終了後に正常読取り
帳票とは別のスタッカに排出する。第3の手法は、リジ
ェクトの発生した時点であるいはりジェツトの発生した
行の読取動作終了後にリジェクトした文字を含む文字パ
ターンや認識結果をモニターに表示して一担認識動作を
停止し、オペレータにより正しい文字をキーインするも
のである。
(Prior Art) Conventionally, as this type of reading device, for example, [Automatic Recognition of Characters and Graphics for Computer Manually] (January 1, 1972)
5) There is something disclosed in the Institute of Electrical Engineers of Japan, P47.54-55.160. Its basic configuration consists of a scanning unit that obtains image information from the object to be read, such as a form, in the form of an electrical signal, a recognition unit that recognizes characters from the image information converted to electrical signals, and a recognition unit that recognizes the recognized character code. It consists of an interface section for directly transferring data to a higher-level control section such as a computer, or storing it in a file memory such as a FDD. If the reading operation is performed normally, character codes resulting from recognition are transferred or stored one after another. When a reading rejection occurs, one of the following three methods is used for glue jet processing. In the first method, the reading result of the rejected character is replaced with a special code and the reading operation continues.
The line in which the rejection occurred is marked, and in the second method, the form in which the rejection occurred is discharged to a stacker separate from normally read forms after the reading operation is completed. The third method is to display the character pattern including the rejected character and the recognition result on the monitor at the time when a rejection occurs or after the reading operation of the line where the rejection occurred and to stop the recognition operation, and then the operator This is to key in the correct character.

なお、通常、す゛ジェツトは一回の認識動作の試行では
なく、数回の試行を行った結果で判断する。これは認識
に用いる信号が、走査部で光電変換されたアナログ信号
を最終的にある閾値で2値化した“1”、“0”の信号
であり、閾値を変更することによって、2値化された文
字パターンが変化し、読み取れる場合も多いためである
。従・つて、装置構成においては、読み取れない文字が
発生した場合、再度走査部を通してその文字のデータ人
力を行い、閾値を変更して2値化文字パターンを得るも
のと、あらかじめ多値データパターン格納用のメモリを
内蔵させ、走査で得られたアナログ信号をA/D変換し
てメモリに格納しておくことにより、再試行の信号をメ
モリから得るものがある。後者の構成は、通常メモリ量
が多く必要とされるが(1行分あるいは帳票1枚分等)
、メモリ内を電子的に走査して信号を得ることができる
ので、機械的な走査に対し高速読取りができる利点を持
っている。
Note that the target is usually determined based on the results of several trials rather than one trial of the recognition operation. The signal used for recognition is a "1" and "0" signal that is finally binarized by a certain threshold value from an analog signal that has been photoelectrically converted in a scanning unit. This is because the character pattern that has been written changes and is often readable. Therefore, in the device configuration, when a character that cannot be read is generated, the data of that character is manually scanned through the scanning section again and the threshold value is changed to obtain a binary character pattern, and the other is that the multi-value data pattern is stored in advance. Some devices have a built-in memory for scanning, A/D convert the analog signal obtained by scanning, and store it in the memory, thereby obtaining a retry signal from the memory. The latter configuration usually requires a large amount of memory (for one line or one form, etc.)
Since signals can be obtained by electronically scanning the memory, it has the advantage of being able to read at high speed compared to mechanical scanning.

(発明が解決しようとする問題点) しかしながら、前記3種類の手法のうち、いずれかを用
いた読取装置では次のような問題点がある。
(Problems to be Solved by the Invention) However, reading devices using any one of the three methods described above have the following problems.

(1)リジェクト行に何らかの印をつける第1の手法は
、後でオペレータが印のついた帳票の該当行をみて読取
結果を修正することになるが、この作業負担は非常に大
きい。
(1) In the first method, in which a reject line is marked in some way, the operator later looks at the marked line in the form and corrects the reading result, but this requires a very heavy workload.

(2)リジェクトされた文字を含む帳票を正常に読取ら
れた帳票と別のスタッカに排出する第2の手法は、読取
動什中にオペレータはついている必要がないので、この
方法は多く採用されている。
(2) The second method, in which forms containing rejected characters are ejected into a separate stacker from normally read forms, is often adopted because an operator does not need to be present during the reading operation. ing.

しかし、リジェクトされた帳票を読取装置に再度かけ、
第1の手法と同じ作業を行うために読取装置を専有する
必要がある。さらに大きな問題点としては、読取対象は
帳票のように1枚毎に分離できる形態に限られる。
However, when the rejected form is run through the reader again,
It is necessary to dedicate a reading device to perform the same work as in the first method. An even bigger problem is that the objects to be read are limited to forms that can be separated into individual sheets, such as forms.

(3)リジェクト発生時にオペレータがモニタに表示さ
れた文字パターンから文字コードをキーインする第3の
手法は読取動作中、リジェクトの発生は予測できないた
め、オペレータがついている必要がある。
(3) The third method, in which an operator keys in a character code from a character pattern displayed on a monitor when a reject occurs, requires an operator to be present during the reading operation because the occurrence of a reject cannot be predicted.

本発明は、以上述べたりジェット処理におけるオペレー
タの負担を祷減すると共に、読取対象である記載用紙に
対する制限を除去し、操作性、汎用性に優れた文字認識
システムを提供することを目的とする。
SUMMARY OF THE INVENTION The present invention aims to provide a character recognition system that reduces the burden on the operator in jet processing as described above, removes restrictions on the written paper that is to be read, and has excellent operability and versatility. .

(問題点を解決するための手段) 本発明の文字認識システムは前記問題点を解決するため
に、読取対象を走査して画像情報を得る走査手段と、前
記画像情報を格納するメモリ装置と、1前記メモリ装置
から読出された画像情報に基づいて読取対象上の文字を
認識して前記メモリ装置に格納すべき認識結果の認識情
報を得る読取装置と、前記走査手段及びメモリ装置を制
御すると共に、前記認識情報に基づいて読取不可の有無
の判定を行って読取不可の文字に対応する画像情報を出
力する制御装置とを具備するものである。
(Means for Solving the Problems) In order to solve the above-mentioned problems, the character recognition system of the present invention includes: a scanning means for scanning an object to be read to obtain image information; a memory device for storing the image information; 1. A reading device that recognizes characters on a reading target based on image information read from the memory device and obtains recognition information of a recognition result to be stored in the memory device, and controls the scanning means and the memory device; , and a control device that determines whether the characters are unreadable based on the recognition information and outputs image information corresponding to the unreadable characters.

(作用) 本発明の技術的手段は次のように作用する。制御装置は
走査手段(スキャナ)によって、帳票、用紙等の読取対
象を走査して得られた画像情報をメモリ装置に順次格納
する。所定量、例えば、用紙1枚分の画像情報の格納が
終了すると、認識装置はこれらの画像情報に基づいて文
字の認識を行う。用紙1枚分の認識結果の認識情報は制
御装置によって、メモリ装置に格納されると共に、その
認識情報に基づいて読取不可(リジェクト)の有無の判
定が行われる。例えば、認識情報には認識結果の文字コ
ードと共に類似度及び文字枠情報(少なくとも位置を示
す)が含まれており、類似度が所定の閾値以下のものを
リジェクトの有と判定する。従って、このようにして判
定され、リジェクトされた文字の文字枠情報から該当す
る画像情報の文字パターンを表示装置に表示することに
より、オペレータはリジェクトされた文字の修正を一括
して行うことが可能となるので、オペレータの負担を軽
減することができる。また画像情報をメモリ装置に格納
した後、格納した画像情報に基づく認識結果によってリ
ジェクト処理を行っているので、読取対象の形態に制限
されることもない。
(Operation) The technical means of the present invention operates as follows. The control device sequentially stores image information obtained by scanning an object to be read, such as a form or paper, in a memory device using a scanning device (scanner). When a predetermined amount of image information, for example, one sheet of image information, has been stored, the recognition device recognizes characters based on this image information. The recognition information of the recognition result for one sheet of paper is stored in the memory device by the control device, and based on the recognition information, it is determined whether or not the paper is unreadable (rejected). For example, the recognition information includes the character code of the recognition result as well as the degree of similarity and character frame information (indicating at least the position), and those whose degree of similarity is equal to or less than a predetermined threshold are determined to be rejected. Therefore, by displaying the character pattern of the image information that corresponds to the character frame information of the rejected characters determined in this way on the display device, the operator can modify the rejected characters all at once. Therefore, the burden on the operator can be reduced. Further, since the image information is stored in the memory device and then the rejection process is performed based on the recognition result based on the stored image information, there is no restriction on the form of the object to be read.

(実施例) 以下添付図面を参照して本発明の詳細な説明する。(Example) The present invention will be described in detail below with reference to the accompanying drawings.

第1図は本発明の第1の実施例を示す文字認識システム
の構成図である。本実施例のシステムは、認識装置10
とワークステーション20から構成される。ワークステ
ーション20は制御装置21と、これに接続されるスキ
ャナ22、ファイルメモリ装置24及び人力装置24と
から成る。人力装置24は表示部であるモニタ24aと
操作部であるキーボード24bから構成される。
FIG. 1 is a block diagram of a character recognition system showing a first embodiment of the present invention. The system of this embodiment includes a recognition device 10
and a workstation 20. The workstation 20 consists of a control device 21, a scanner 22, a file memory device 24, and a human power device 24 connected thereto. The human power device 24 includes a monitor 24a as a display section and a keyboard 24b as an operation section.

次に動作を説明する。Next, the operation will be explained.

まず、スキャナ30で帳票等の読取対象を走査して画像
情報を得る前に、入力装置24のキーボード24bを用
い、識別コードを入力する。識別コードとは読取対象で
ある画像情報内の認識を行うエリアを特定するものをい
う。この識別コードは通常、帳票の先頭の特定エリアに
識別番号が記載されていて識別番号毎に認識を行うエリ
アがあらかじめ認識装置10で定義しである。従って、
認識装gtoは識別番号を認識することにより、認識対
象エリアを知ることができ、余分なエリアまで認識しな
いため、認識速度が向上すると共に、帳票設計において
、認識対象エリア以外の場所に自由に文字、図形を記載
できるので設計の自由度を高めることができる。
First, before scanning an object to be read such as a form with the scanner 30 to obtain image information, an identification code is input using the keyboard 24b of the input device 24. The identification code specifies the area in the image information to be read that is to be recognized. This identification code usually has an identification number written in a specific area at the beginning of the form, and an area for recognition for each identification number is defined in advance by the recognition device 10. Therefore,
By recognizing the identification number, the recognition device GTO can determine the recognition target area, and because it does not recognize unnecessary areas, recognition speed is improved, and when designing forms, characters can be freely placed in areas other than the recognition target area. , the degree of freedom in design can be increased because figures can be described.

本実施例では、この識別番号が記載されている帳票のみ
を対象としているのではなく、本等の印刷物まで含めて
いるので、認識対象エリアを用紙1枚あるいは1頁毎に
規定し、上記エリアが変更される場合にはキーボード2
4bから3桁のコードで人力する(キーインする)よう
にしである。但し、識別番号が付されている各種用紙が
混在している場合に、その都度識別コードをキーインす
るのは大変であるので、この場合は例えば000という
番号をキーインし、この000がキーインされた場合は
用紙に記載されている識別番号で認識エリアが定義され
、その他はキーインしたコードで認識エリアが定義され
る方法を採用している。
In this embodiment, the target is not only the form on which this identification number is written, but also includes printed matter such as books, so the recognition target area is defined for each sheet of paper or page, and the area mentioned above is is changed, keyboard 2
4b, you can enter it manually (key in) using a 3-digit code. However, if there are various papers with identification numbers attached, it is difficult to key in the identification code each time, so in this case, for example, key in the number 000, and if this 000 is keyed in. In some cases, the recognition area is defined by the identification number written on the paper, and in other cases, the recognition area is defined by the keyed-in code.

このように、まず、識別コードが、キーボード24bで
入力され、次にスキャナ22で読取対象である用紙を走
査し、出力される画像情報はスキャナ22に内蔵された
A/D変換器により8ビット/画素の分解能となってい
る。これらの画像情報は用紙1枚毎に、首記識別コード
を付してファイルメモリ装置23に格納される。こうし
て順次、一連の画像情報がファイルメモリ装置23への
格納が終了した後、制御装置21と認識装置lOは電気
的に接続される。この結果、認識装置lOに対し、制御
装置21を介してファイルメモリ装置23より一連の画
像情報が転送される。本実施例では、用紙1枚分の画像
情報を格納する一時記憶メモリ(図示せず)が認識装置
IOに内蔵されているので、用紙1枚の画像情報が転送
単位となる。従って、この一時記憶メモリに転送が終了
した時点で認識装置IOは認識動作を実行し、一時記憶
メモリ内の画像情報に対し、認識動作が終了した時点で
全ての認識結果の情報を制御装置21に転送する。制御
装置21では認識結果の情報(認識情報)をファイルメ
モリ装置23に格納し、次の画像情報の転送を再びファ
イルメモリ装置23から読み出し、認識装置10に転送
し、同様の動作を繰返す。ここで、前記、認識結果の情
報とは、用紙上に記載された認識対象文字、記号等を認
識した結果で、リジェクト個数、文字コード、文字枠情
報をいう。リジェクト個数はりジェツトが発生した個数
、文字コードは認識結果第1位候補(リジェクトコード
を含む)の龍笛2位から第1O位までの候補のコードで
ある。文字枠情報の説明図を第2図に示す。文字枠情報
は認識の過程で検出される情報であって、同図に示すよ
うに、各文字、記号の外接四角形(外接枠)において、
左上の頂点Pに相当する一時記憶メモリ上のアドレス(
X、Y、、)と、辺の長さに相当する一時記憶メモリ上
のアドレス長(△X、△Y)である。
In this way, first, an identification code is input using the keyboard 24b, then the paper to be read is scanned by the scanner 22, and the output image information is converted into 8-bit image information by the A/D converter built into the scanner 22. / pixel resolution. This image information is stored in the file memory device 23 with a header identification code added to each sheet of paper. After a series of image information is sequentially stored in the file memory device 23 in this way, the control device 21 and the recognition device 10 are electrically connected. As a result, a series of image information is transferred from the file memory device 23 to the recognition device IO via the control device 21. In this embodiment, since the recognition device IO has a built-in temporary storage memory (not shown) that stores image information for one sheet of paper, the image information of one sheet of paper is the unit of transfer. Therefore, when the transfer to the temporary memory is completed, the recognition device IO executes the recognition operation, and when the recognition operation is completed, all the recognition result information is sent to the control device 2 with respect to the image information in the temporary memory. Transfer to. The control device 21 stores recognition result information (recognition information) in the file memory device 23, reads out the next image information transfer from the file memory device 23 again, transfers it to the recognition device 10, and repeats the same operation. Here, the above-mentioned recognition result information is the result of recognizing the recognition target characters, symbols, etc. written on the paper, and refers to the number of rejects, character code, and character frame information. The number of rejected items, the number of rejected items, and the character code are the codes of the candidates from 2nd place to 10th place among the first place candidates (including the reject code) in the recognition results. An explanatory diagram of character frame information is shown in FIG. 2. Character frame information is information detected during the recognition process, and as shown in the figure, in the circumscribed rectangle (circumscribed frame) of each character or symbol,
The address on the temporary memory corresponding to the top left vertex P (
) and the address length (ΔX, ΔY) on the temporary storage memory corresponding to the length of the side.

第3図(() 、 (0)にファイルメモリ装置40に
おける格納フォーマットに関し、用紙1枚あるいは1頁
毎の基本構成を示す。同図(イ)は画像情報ファイルの
フォーマットである。ここで、通番はファイル毎に設け
た通し番号であり、画像情報を順次ファイルメモリ装置
4υから読出す場合に確認用として設けている。識別コ
ードは前記説明したキーインの3桁コードであり、その
後に8ビツトで濃度表現した画像情報が続く。同図(0
)は同図(イ)の画像情報ファイルに対応する認識情報
ファイルのフォーマットで、通番は(イ) と同じもの
が入り、識別コードは通常(イ)と同じであるが000
が(イ)で指定された場合に、用紙側に記載されている
識別番号を認識した結果のコードが入り、さらに同ファ
イル中のりジェツト個数が入る。その後に第1位から第
1O位までの認識結果の文字コードと文字枠情報が入っ
ており、以下順次認識結果が記載されている。なお、本
実施例ではファイル長としては処理が簡単なため固定長
の形式を採っており、従って最大用紙サイズに相当する
ファイル長を用意しであるので、有効データは識別コー
ドから判断している。
FIG. 3 ((), (0) shows the basic configuration of each sheet or page regarding the storage format in the file memory device 40. FIG. 3(A) shows the format of the image information file. Here, The serial number is a serial number set for each file, and is provided for confirmation when reading image information sequentially from the file memory device 4υ.The identification code is the 3-digit key-in code described above, followed by an 8-bit code. Image information expressed in density follows.The same figure (0
) is the format of the recognition information file corresponding to the image information file in (a) of the same figure, the serial number is the same as (a), and the identification code is usually the same as (a), but is 000.
When specified in (a), the code that is the result of recognizing the identification number written on the paper side is entered, and the number of glue jets in the same file is also entered. After that, the character codes and character frame information of the recognition results from 1st place to 10th place are included, and the recognition results are listed in order below. In addition, in this embodiment, a fixed length format is used for the file length because it is easy to process.Therefore, since the file length corresponding to the maximum paper size is prepared, valid data is determined from the identification code. .

一連の各画像ファイルに対し認識動作が実行され、認識
情報ファイルが作成する過程で、制御部21はリジェク
トの有無およびリジェクトのある場合は、そのファイル
名を記憶しているが、このリジェクト管理は、最後に全
ての認識情報ファイルが作成された後に、再度同ファイ
ルを読み出し調べる方法でも良い。以上の一連の動作が
終了後、リジェクトが発生している場合には、従来例で
述べた第3の手法と同様の手順で、オペレータが修正を
行う。すなわち、制御装置21は、リジェクトの発生し
た認識情報ファイルの第1位認識コードがあらかじめ決
められているリジェクトコードであるものを捜し、その
文字枠情報から対応する画像情報ファイル情報内の文字
パターン情報エリアを計算し、モニタ24おに表示する
。表示の際は通常のモニタは2値データしか扱えないも
のが多いので、その場合は、適当な閾値で8ビツトデー
タを2値化して表示すれば良い。こうして表示した文字
パターンを見て、オペレータは修正をキーボード24b
から行う。以上の動作をリジェクトが全て修正されるま
で繰返す。
In the process of performing a recognition operation on each series of image files and creating a recognition information file, the control unit 21 stores the presence or absence of a reject and, if there is a reject, the file name. , Finally, after all the recognition information files have been created, the same file may be read and examined again. After the series of operations described above is completed, if a reject has occurred, the operator corrects it using the same procedure as the third method described in the conventional example. That is, the control device 21 searches for a recognition information file in which a rejection has occurred whose first recognition code is a predetermined reject code, and extracts character pattern information in the corresponding image information file information from the character frame information. The area is calculated and displayed on the monitor 24. When displaying, most normal monitors can only handle binary data, so in that case, 8-bit data can be binarized using an appropriate threshold value and displayed. Looking at the character pattern thus displayed, the operator makes corrections on the keyboard 24b.
Start from Repeat the above operations until all rejects are corrected.

第4図は認識情報ファイルの別のフォーマット例である
。第3図(0)のものとの相異点は、各第1位から第1
0位の認識°結果の類似度(特徴距離という場合もある
)を付加しである。また、この場合は認識装置10では
、リジェクトを発、生してもしなくても良い。従って、
リジェクト個数は認識装置lOから特に転送はしない。
FIG. 4 shows another format example of the recognition information file. The difference from the one in Figure 3 (0) is that each
The degree of similarity (sometimes referred to as feature distance) of the 0th recognition result is added. Further, in this case, the recognition device 10 may or may not generate a reject. Therefore,
The number of rejects is not particularly transferred from the recognition device IO.

リジェクトの有無の判定はオペレータからの類似度に対
する閾値のキーインあるいは制御装置21であらかじめ
定めた閾値で行う。$制御装置21では、順次認識情報
ファイルの各文字の類似度を調べ閾値以下の類似度の文
字はりジェツトとして前述の場合と同様に表示部24a
に表示し、オペレータが修正を行うことは同じである。
The presence or absence of rejection is determined by keying in a threshold value for the degree of similarity from the operator or by using a threshold value predetermined by the control device 21. The $ control device 21 sequentially checks the similarity of each character in the recognition information file and displays the characters on the display 24a as in the case described above as characters with a similarity below the threshold value.
It is the same for the operator to make corrections.

このような構成の認識情報ファイルを用いる長所は、多
少判定を甘くしても文字のコード情報変換を優先する場
合や厳しくしてエラーを防ぎリジェクト処理で修正する
場合等、その時々に応じて使いわけることができること
である。
The advantage of using a recognition information file with this type of structure is that it can be used depending on the situation, such as when giving priority to character code information conversion even if the judgment is a little lenient, or when making it stricter to prevent errors and correct them by reject processing. It is something that can be separated.

なお、第3図([11)及び第4図のいずれの認識情報
ファイルの構成でも、第2位の判定文字以下の順位の文
字認識結果はなくても良いが、記述しておくことにより
、文字認識装置と自動翻訳装置を結合する場合等によく
実行される文章処理(而後の文字の関係、あるいは単語
の概念等から文字を判定する)において用いる場合が多
いためである。その他、リジェクト処理時にモニタ24
a上に表示した文字パターンの文字コードキーインにお
いてもモニタ24a上に認識候補結果を表示し、各候補
に番号を付加しておき、その番号をキーインすれば修正
できるようにすることにより、オペレータの操作は非常
に簡単化できること等による。
Note that in the structure of either the recognition information file shown in FIG. 3 ([11) or FIG. This is because it is often used in text processing (determining characters based on subsequent character relationships, word concepts, etc.), which is often performed when a character recognition device and an automatic translation device are combined. In addition, monitor 24 during reject processing
The recognition candidate results are also displayed on the monitor 24a when character code key-in is performed for the character pattern displayed on screen a, a number is added to each candidate, and correction can be made by keying in the number, thereby making it easier for the operator. This is because the operation can be extremely simplified.

第5図は本発明の第2の実施例を示す文字認識システム
の構成図である。第1図に示す第1の実施例のファイル
メモリ装置23は、例えばディスクが固定の磁気ディス
ク装置を想定しているが、第2の実施例では光デイスク
装置のようなディスクの着脱可能な大容量記憶装置をワ
ークステーション20のファイルメモリ装置23として
用いると共に、認識装置IOに同様のファイルメモリ装
置11を設けている。この結果、ワークステーション2
0のル制御装置21と認識装置lOとが切り離されてい
ても、ディスクに情報を書き込んだ後に相手側にセット
することに、よりデータの授受が可能となる。
FIG. 5 is a block diagram of a character recognition system showing a second embodiment of the present invention. The file memory device 23 of the first embodiment shown in FIG. 1 is assumed to be, for example, a magnetic disk device with a fixed disk, but in the second embodiment, a large disk with a removable disk such as an optical disk device is assumed. A capacitive storage device is used as the file memory device 23 of the workstation 20, and the recognition device IO is provided with a similar file memory device 11. As a result, workstation 2
Even if the control device 21 and the recognition device 10 are separated, data can be exchanged by writing information on the disk and then setting it on the other side.

また、光デイスク装置は直径5%インチディスクで片面
約:100 M Byte、 12インチで約1.2 
G Byteのユーザーエリアを持つので、B5の用紙
の場合で5%インチディスクでは約100枚、12イン
チでは400枚の画像情報が格納できる。
Also, for optical disk devices, a 5% inch diameter disk has a capacity of approximately 100 MB per side, and a 12 inch disk has a capacity of approximately 1.2
Since it has a G Byte user area, it can store image information for approximately 100 sheets of B5 paper on a 5% inch disk, and 400 sheets on a 12 inch disk.

以上のように、本実施例によれば、リジェクトされた文
字の修正を一括して行え、オペレータは修正時のみ対応
すれば良くその処理時間もリジェクトされた文字のみ対
象となるので短時間で実行でき、オペレータの負担が大
きく軽減される。また、リジェクト時の修正はオペレー
タの操作が中心となるので、従来のものでは認識装置を
専有する時間が多くなるが、本実施例ではその間認識装
置を開放できるので、認識装置は認識動作のみに専念で
きる。従って、ワークステーションシステムを認識装置
に複数台接続し、認識装置を効率的に運用することもで
きる。
As described above, according to this embodiment, rejected characters can be corrected all at once, and the operator only needs to respond when making corrections, and the processing time can be shortened since only the rejected characters are affected. This greatly reduces the burden on the operator. In addition, since the correction at the time of rejection is mainly performed by the operator, in the conventional system, the recognition device is occupied for a long time, but in this embodiment, the recognition device can be opened during that time, so the recognition device is used only for the recognition operation. I can concentrate on it. Therefore, it is also possible to connect a plurality of workstation systems to the recognition device and operate the recognition device efficiently.

なお、ファイルメモリ装置は本実施例では同一のディス
クに画像情報と認識結果の情報を格納する記述にしたが
、異なるディスクでも2つのディスクの画像情報と認識
結果の情報の対応をつけることは簡単にでき2つのディ
スクを読み出させる構成であれば同様の動作ができるこ
とは明白である。
Note that although the file memory device in this embodiment is described as storing image information and recognition result information on the same disk, it is easy to make correspondence between image information and recognition result information on two disks even if the disks are different. It is clear that similar operations can be performed if the configuration is such that it can read data from two disks.

(発明の効果) 以上詳細に説明したように本発明によれば、リジェクト
処理におけるオペレータの負担を軽減することができる
と共に、読取対象の形態に制限されることなく効率的に
認識処理を行うことができる。
(Effects of the Invention) As described above in detail, according to the present invention, it is possible to reduce the burden on the operator in reject processing, and to perform recognition processing efficiently without being limited by the format of the object to be read. Can be done.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の第1の実施例の構成図、第2図は文字
枠情報の説明図、第3図<4> 、 (0)はそれぞれ
画像情報ファイル、認識情報ファイルのフォーマット例
を示す図、第4図は別の認識情報ファイルのフォーマッ
ト例を示す図、第5図は本発明の第2の実施例の構成図
である。 10−・・認識装置、ll、’2:l−ファイル、メモ
リ装置、21−・・制御装置、22・・−スキャナ、2
4−・・人力装置、 24 a−・・モニタ、24b・
・・キーボード。
Fig. 1 is a configuration diagram of the first embodiment of the present invention, Fig. 2 is an explanatory diagram of character frame information, and Fig. 3 <4> and (0) are example formats of an image information file and a recognition information file, respectively. FIG. 4 is a diagram showing another format example of a recognition information file, and FIG. 5 is a configuration diagram of a second embodiment of the present invention. 10--Recognition device, ll, '2:l-File, memory device, 21--Control device, 22--Scanner, 2
4--Human power device, 24 a--Monitor, 24b-
··keyboard.

Claims (4)

【特許請求の範囲】[Claims] (1)読取対象を走査して画像情報を得る走査手段と、 前記画像情報を格納するメモリ装置と、 前記メモリ装置から読出された画像情報に基づいて読取
対象上の文字を認識して前記メモリ装置に格納すべき認
識結果の認識情報を得る読取装置と、 前記走査手段及びメモリ装置を制御すると共に、前記認
識情報に基づいて読取不可の有無の判定を行って読取不
可の文字に対応する画像情報を出力する制御装置とを具
備することを特徴とする文字認識システム。
(1) A scanning device that scans an object to be read to obtain image information, a memory device that stores the image information, and a memory that recognizes characters on the object to be read based on the image information read from the memory device. a reading device that obtains recognition information of recognition results to be stored in the device; and a reading device that controls the scanning means and the memory device, and determines whether or not it is unreadable based on the recognition information to generate an image corresponding to an unreadable character. A character recognition system comprising: a control device that outputs information.
(2)前記画像情報には読取対象上の領域を示す識別コ
ードを含み、前記認識情報には、認識結果の文字の外接
枠である文字枠の情報を含む特許請求の範囲第1項記載
の文字認識システム。
(2) The image information includes an identification code indicating an area on the reading target, and the recognition information includes information on a character frame that is a circumscribing frame of a character resulting from recognition. Character recognition system.
(3)前記メモリ装置は前記認識装置及び制御装置にそ
れぞれ設けられ、ディスクが着脱可能なディスク装置で
ある特許請求の範囲第1項又は第2項に記載の文字認識
システム。
(3) The character recognition system according to claim 1 or 2, wherein the memory device is provided in the recognition device and the control device, respectively, and is a disk device with a removable disk.
(4)前記読取情報には、更に認識結果の候補文字コー
ドに対応した類似度を含む特許請求の範囲第2項又は第
3項記載の文字認識システム。
(4) The character recognition system according to claim 2 or 3, wherein the reading information further includes a degree of similarity corresponding to the candidate character code of the recognition result.
JP62127885A 1987-05-27 1987-05-27 Character recognizing system Pending JPS63293690A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62127885A JPS63293690A (en) 1987-05-27 1987-05-27 Character recognizing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62127885A JPS63293690A (en) 1987-05-27 1987-05-27 Character recognizing system

Publications (1)

Publication Number Publication Date
JPS63293690A true JPS63293690A (en) 1988-11-30

Family

ID=14971059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62127885A Pending JPS63293690A (en) 1987-05-27 1987-05-27 Character recognizing system

Country Status (1)

Country Link
JP (1) JPS63293690A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009124541A (en) * 2007-11-16 2009-06-04 Fuji Xerox Co Ltd Image reader, and program
JP2015049653A (en) * 2013-08-30 2015-03-16 富士通株式会社 Display method, display program, and display device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009124541A (en) * 2007-11-16 2009-06-04 Fuji Xerox Co Ltd Image reader, and program
JP2015049653A (en) * 2013-08-30 2015-03-16 富士通株式会社 Display method, display program, and display device

Similar Documents

Publication Publication Date Title
US5280544A (en) Optical character reading apparatus and method
US4566039A (en) Facsimile system
JPS61227483A (en) Apparatus for reading, processing and compressing document
US5081688A (en) Apparatus for recording regenerating record information comprising title and image information
JP2000322417A (en) Device and method for filing image and storage medium
JPS63293690A (en) Character recognizing system
JPS61150081A (en) Character recognizing device
JP2666931B2 (en) Optical character reader
JPH0473192B2 (en)
JP2823350B2 (en) Multimedia input device
JPS6326789A (en) Character recognizing device
JPH0459669B2 (en)
JPS6292080A (en) Pattern recognizing device
JP2931485B2 (en) Character extraction device and method
JP2570571B2 (en) Optical character reader
JPS62123581A (en) Document picture input device
JPS61198378A (en) Optical character reader
JPS62251884A (en) Recorder
JPH04255088A (en) Optical character reader
JPH0612403A (en) Input device
JPH03134784A (en) Optical reader
JPH01199285A (en) Optical character reader
JPH0473193B2 (en)
JPH04251395A (en) Optical character/graphic reader
JPS6277684A (en) Optical reader