JPH041882A - Character recognition and device for the same - Google Patents

Character recognition and device for the same

Info

Publication number
JPH041882A
JPH041882A JP2103804A JP10380490A JPH041882A JP H041882 A JPH041882 A JP H041882A JP 2103804 A JP2103804 A JP 2103804A JP 10380490 A JP10380490 A JP 10380490A JP H041882 A JPH041882 A JP H041882A
Authority
JP
Japan
Prior art keywords
character
font
circuit
memory
items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2103804A
Other languages
Japanese (ja)
Inventor
Yoshiro Miyahara
宮原 吉郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2103804A priority Critical patent/JPH041882A/en
Publication of JPH041882A publication Critical patent/JPH041882A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

PURPOSE:To improve character recognition speed by retrieving a dictionary memory based on a character identification number registered in a character registering memory through a character decision circuit, selecting the character satisfying decision items and specifying the type of character. CONSTITUTION:A character decision circuit 10 judging whether or not the contents of a buffer memory 8 satisfies the decision items of a dictionary memory 9 and outputs the recognition number of a character satisfying all the decision items. In the recognition of an ordinary recognition area 13 of a mark sheet 1, character identification numbers are sequentially picked out of a character registering memory 12, inputted to the character decision circuit 10 and the decision items of the dictionary memory 9 corresponding to the character are read. When the character satisfies the decision items or such a character is not found, a character in which the cumulative deviation of the decision items is minimum is selected to decide the character. Thus, time required for retrieving the dictionary can be decreased without increasing the capacity of the dictionary memory, so that recognition speed can be improved.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字認識方法およびその装置に関し、特にマー
クシートに手書きで記入された文字を認識する文字認識
方法およびその装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a character recognition method and apparatus, and more particularly to a character recognition method and apparatus for recognizing characters handwritten on a mark sheet.

〔従来の技術〕[Conventional technology]

従来、この種の文字認識装置では、マークシート画面情
報から1文字パタン部分を切り出す切り出し回路と、1
文字パタンから文字判定に必要な部分特徴を抽出する特
徴抽出回路と、各部分特徴についてその度合を数値化す
る特徴計数回路と、各種標本字体の判定項目を字体識別
番号順に列挙してその字体の属する文字種と各判定項目
として注目する部分特徴番号とその基準値と許容偏差値
を格納する辞書メモリとを有し、文字判定回路では辞書
メモリに書かれているすべての字体の判定項目を検索し
、特徴計数回路から出力された部分特徴の計数値と基準
値とを比較して許容偏差値以内かどうかで判定項目を満
足するかを判定し、全判定項目を満足する字体を選出し
てその字体が属する文字種を認識結果として出力してい
る。
Conventionally, this type of character recognition device has an extraction circuit that extracts a single character pattern from mark sheet screen information, and a
There is a feature extraction circuit that extracts partial features necessary for character recognition from character patterns, a feature counting circuit that digitizes the degree of each partial feature, and a feature counting circuit that digitizes the degree of each partial feature. It has a dictionary memory that stores the character type to which it belongs, the partial feature number to be focused on as each judgment item, its reference value, and tolerance value, and the character judgment circuit searches the judgment items of all the fonts written in the dictionary memory. , compare the counted value of the partial feature output from the feature counting circuit with the reference value, determine whether the judgment item is satisfied based on whether it is within the tolerance value, select the font that satisfies all the judgment items, and select the font that satisfies all the judgment items. The character type to which the font belongs is output as a recognition result.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上述した従来の文字認識装置における判定論理では、標
本字体と記入された字体との特徴の偏差が大きいと判定
誤りが生じ易くなるため、正答率を上げるためには偏差
を最小とすべく標本字体を増やす必要があるが、そのた
めに辞書メモリの容量が大きくなり処理時間がかかると
いう欠点があった。
In the judgment logic of the conventional character recognition device described above, if there is a large deviation between the characteristics of the sample font and the written font, judgment errors are likely to occur, so in order to increase the correct answer rate, the sample font is However, this increases the capacity of the dictionary memory and takes processing time.

〔課題を解決するための手段〕[Means to solve the problem]

本発明の文字認識方法は、マークシート中にトレーニン
グエリアを設け、切り出し回路においてトレーニングエ
リアであることを認識し、そのトレーニングエリア内で
は記入枠位置によって記入する文字種を決めておき、前
記トレーニングエリア内に記入された文字について認識
処理を行う場合は文字判定回路において辞書メモリに記
述された判定項目をすべて満足する字体識別番号を選出
して字体登録用メモリに格納し、トレーニング後のマー
クシートの通常エリアの認識においては、前記文字判定
回路が前記字体登録用メモリに登録されている前記字体
識別番号をもとに前記辞書メモリを検索することにより
判定項目を満足する字体を選出して文字種を特定するこ
とを特徴とする。
In the character recognition method of the present invention, a training area is provided in a mark sheet, the cutting circuit recognizes the training area, the character type to be written in the training area is determined based on the position of the writing frame, and When performing recognition processing on the written characters, the character judgment circuit selects a font identification number that satisfies all the judgment items written in the dictionary memory, stores it in the font registration memory, and stores it in the normal area of the mark sheet after training. In recognition, the character determination circuit selects a font that satisfies determination items by searching the dictionary memory based on the font identification number registered in the font registration memory and identifies the character type. It is characterized by

また、本発明の文字認識装置は、マークシート画面情報
から1文字分のパタン情報を切り出す切り出し回路と、
1文字パタンから文字判定に必要な部分特徴を抽出する
特徴抽出回路と、前記各部分特徴についてその度合を数
値化する特徴計数回路と、標本字体の判定項目を字体識
別番号順に列挙してその字体の属する文字種と各判定項
目として注目する部分特徴番号とその基準値と許容偏差
値とを格納する辞書メモリと、この辞書メモリの前記判
定項目に従い前記特徴計数回路の出力を照合して全判定
項目について満足する字体を選出する文字判定回路とを
有する文字認識装置おいて、前記マークシート中に設け
た記入枠位置によって記入する文字種が固定なトレーニ
ングエリアを検出するトレーニングエリア検圧手段と、
字体登録用メモリとを備え、前記トレーニングエリア内
に記入された文字についての前記文字判定回路の処理は
、前記辞書メモリに記述された該当する文字種の字体す
べてについて検索し、その判定項目を満足する字体識別
番号を選出して前記字体登録用メモリに格納して行い、
前記トレーニング処理後のマークシートの通常エリアに
ついての前記文字判定回路の処理は、前記文字判定回路
が前記字体登録用メモリに登録されている字体識別番号
をもとに前記辞書メモリを検索することにより前記判定
項目を満足する字体を選出し文字種を特定して行うこと
を特徴とする特 〔実施例〕 次に、本発明について図面を参照して説明する。
The character recognition device of the present invention also includes an extraction circuit that extracts pattern information for one character from mark sheet screen information;
a feature extraction circuit that extracts partial features necessary for character determination from a single character pattern; a feature counting circuit that digitizes the degree of each of the partial features; and a feature counting circuit that digitizes the degree of each of the partial features; A dictionary memory that stores the character type to which it belongs, the partial feature number to be focused on as each judgment item, its reference value, and allowable deviation value, and the output of the feature counting circuit is collated according to the judgment items of this dictionary memory to determine all judgment items. a character recognition circuit that selects a font that satisfies the above, and a training area pressure detection means that detects a training area in which a character type to be written is fixed based on a writing frame position provided in the mark sheet;
and a font registration memory, and the processing of the character judgment circuit for the characters written in the training area searches for all the fonts of the corresponding character type described in the dictionary memory, and satisfies the judgment items. selecting a font identification number and storing it in the font registration memory;
The character determination circuit processes the normal area of the mark sheet after the training process by searching the dictionary memory based on the font identification number registered in the font registration memory. A special feature characterized by selecting a font that satisfies the determination items and specifying the character type [Embodiment] Next, the present invention will be described with reference to the drawings.

第1図は本発明の一実施例を示すブロック図、第2図は
本実施例に使用するマークシートの一例を示す平面図、
第3図は本実施例におけるトレーニングモードでの判定
論理の一例を説明するフローチャート、第4図は本実施
例における通常認識モードでの判定論理の一例を説明す
るフローチャートである。
FIG. 1 is a block diagram showing an embodiment of the present invention, FIG. 2 is a plan view showing an example of a mark sheet used in this embodiment,
FIG. 3 is a flowchart illustrating an example of the determination logic in the training mode in this embodiment, and FIG. 4 is a flowchart illustrating an example of determination logic in the normal recognition mode in this embodiment.

マークシート1を光学読取部2を使って電気信号に変換
し、2次元パタン情報として入力画データバッファメモ
リ3に書き込み、切り出し回路4はマークシート1に印
刷された切り出し位置マーク5を検出して1文字ずつ文
字パタンを切り出して特徴抽出回路6へ転送する。
The mark sheet 1 is converted into an electrical signal using the optical reading section 2, and written into the input image data buffer memory 3 as two-dimensional pattern information, and the cutting circuit 4 detects the cutting position mark 5 printed on the mark sheet 1 and reads one character. Character patterns are cut out one by one and transferred to the feature extraction circuit 6.

特徴抽出回路6は文字パタンから文字判定に必要な部分
特徴を検出し、その情報を特徴計数回路7に送る。
The feature extraction circuit 6 detects partial features necessary for character determination from the character pattern, and sends the information to the feature counting circuit 7.

特徴計数回路7では各部分特徴についてその度合を数値
化し、1文字分をバッファメモリ8に格納する。
The feature counting circuit 7 converts the degree of each partial feature into a numerical value, and stores the value for one character in the buffer memory 8.

一方、辞書メモリ9には各標本字体に対する判定項目と
しての部分特徴番号とその基準値と許容偏差値を予め格
納しておく。
On the other hand, the dictionary memory 9 stores in advance partial feature numbers, their reference values, and allowable deviation values as judgment items for each sample font.

文字判定回路10ではバッファメモリ8の内容について
、辞書メモリ9の判定項目に照らして満足しているかを
判断し、すべての判定項目を満足する字体の認識番号を
出力する。
The character determination circuit 10 determines whether the content of the buffer memory 8 satisfies the determination items in the dictionary memory 9, and outputs the recognition number of the font that satisfies all the determination items.

ここまでの動作は従来例と変わりないが、本実施例では
マークシート1中のトレーニングエリア指定マーク11
を切り出し回路4で検出し、トレーニングモードである
ことを文字判定回路10に通知する。
The operation up to this point is the same as the conventional example, but in this example, the training area designation mark 11 on the mark sheet 1
is detected by the extraction circuit 4, and the character determination circuit 10 is notified that it is the training mode.

トレーニングモード中は文字判定回路10から出力され
る字体の識別番号を字体登録用メモリ12に各文字種に
分類して格納する。
During the training mode, the font identification numbers output from the character determination circuit 10 are classified into each character type and stored in the font registration memory 12.

マークシート1の通常認識エリア13の認識においては
、字体登録用メモリ12がら順次字体識別番号を取り出
して文字判定回路10に入力し、その字体に対応する辞
書メモリ9の判定項目を読み出し、判定項目を満足する
か、またはそのような字体が見つからない場合は各判定
項目の累M偏差が最小となる字体を選出し文字判定を行
う。
In the recognition of the normal recognition area 13 of the mark sheet 1, the font identification numbers are sequentially retrieved from the font registration memory 12 and input to the character judgment circuit 10, and the judgment items in the dictionary memory 9 corresponding to the fonts are read out and the judgment items are read out. If the result is satisfied, or if such a font is not found, a font with the minimum cumulative M deviation for each determination item is selected and character determination is performed.

まず、トレーニングモード中の字体判定は第3図に示す
フローで処理される。すなわち、文字判定回路10から
出力される文字種gから字体識別番号pを得(ステップ
31)、辞書目次テーブルから字体pの判定項目の先頭
アドレスnを得(ステップ32)、次に辞書メモリ9の
アドレスnから部分特徴番号a、特徴基準値す、許容偏
差値Cを読み出しくステップ33)、バッファメモリ8
から部分特徴番号aに対応する計数値dを読み出す(ス
テップ34)。そして特徴基準値すと計数値dの差が許
容偏差値Cより小さいときはアドレスnを更新する(ス
テップ35.36)。次に字体pの判定項目の終わりか
を判定しくステップ37)、終わりであれば字体pを字
体登録用メモリ12へ書き込む(ステップ38)が、ス
テップ37で終わりでなければステップ33〜37をア
ドレスnを更新しながら繰り返す。ステップ38での書
込み終了後、文字種gの字体の終わりであれば文字判定
は終了となり、字体の終わりでなければ文字識別番号p
を更新してステップ32からのフローを繰り返す(ステ
ップ39)。
First, font determination during training mode is processed according to the flow shown in FIG. That is, the font identification number p is obtained from the character type g output from the character judgment circuit 10 (step 31), the start address n of the judgment item for the font p is obtained from the dictionary table of contents (step 32), and then the font identification number p is obtained from the dictionary table of contents (step 32). Step 33) Read partial feature number a, feature reference value, and allowable deviation value C from address n, buffer memory 8
The count value d corresponding to the partial feature number a is read from (step 34). Then, when the difference between the characteristic reference value and the count value d is smaller than the allowable deviation value C, the address n is updated (steps 35 and 36). Next, it is determined whether it is the end of the judgment item for font p (step 37), and if it is the end, font p is written into the font registration memory 12 (step 38), but if it is not the end in step 37, steps 33 to 37 are stored as addresses. Repeat while updating n. After the writing is completed in step 38, if it is the end of the font of character type g, the character determination ends, and if it is not the end of the font, the character identification number p
is updated and the flow from step 32 is repeated (step 39).

次に、通常認識モードでの文字判定は第4図に示すフロ
ーで処理される。すなわち、文字判定回路10は文字登
録用メモリ12のアドレスkから字体識別番号pを読み
出しくステップ41)、辞書目次テーブルがら字体pの
特徴記述の先頭アドレスnを得る(ステップ42)。次
いで上述のステップ33.〜36と同様の処理を行い(
ステップ43.〜46)、字体pの特徴記述の終わりが
否かを判定しくステップ47)、終わりであれば字体p
を結果出力しくステップ48)て終了となる。ここで終
わりでなければステップ43がらの処理を繰り返す。
Next, character determination in the normal recognition mode is processed according to the flow shown in FIG. That is, the character determination circuit 10 reads the font identification number p from the address k of the character registration memory 12 (step 41), and obtains the start address n of the characteristic description of the font p from the dictionary table of contents (step 42). Then step 33 as described above. ~ Perform the same processing as in 36 (
Step 43. ~46), it is determined whether or not the end of the feature description of the font p is reached (Step 47), and if it is the end, the font p
The result is output in step 48) and the process ends. If the process does not end here, the process from step 43 is repeated.

このように、本実施例では記入された字体についてその
傾向を反映した文字判定を行う。
In this way, in this embodiment, character determination is performed for the written fonts, reflecting the tendency of the fonts.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、マークシート記入者の直
筆によるトレーニングモードを設けることにより、文字
判定における正答率を向上させ、辞書メモリの容量を大
きくせずに辞書検索に要する時間を節約できるので、認
識速度を向上させる効果がある。
As explained above, the present invention improves the correct answer rate in character identification by providing a training mode in which the person filling out the mark sheet writes in their own handwriting, and the time required for dictionary searches can be saved without increasing the capacity of the dictionary memory. It has the effect of improving recognition speed.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示すブロック図、第2図は
本実施例に使用するマークシートの一例を示す平面図、
第3図は本実施例におけるトレーニングモードでの判定
論理の一例を説明するフローチャート、第4図は本実施
例における通常認識モードでの判定論理の一例を説明す
るフローチャートである。 1・・・マークシート、2・・・光学読取部、3・・・
入力画データバッファメモリ、4・・・切り出し回路、
5・・・切り出し位置マーク、6・・・特徴抽出回路、
7・・・特徴計数回路、8・・・バッファメモリ、9・
・・辞書メモリ、10・・・文字判定回路、11・・・
トレーニングエリア指定マーク、12・・・字体登録用
メモリ、13・・・通常認識エリア、14・・・トレー
ニングエリア。
FIG. 1 is a block diagram showing an embodiment of the present invention, FIG. 2 is a plan view showing an example of a mark sheet used in this embodiment,
FIG. 3 is a flowchart illustrating an example of the determination logic in the training mode in this embodiment, and FIG. 4 is a flowchart illustrating an example of determination logic in the normal recognition mode in this embodiment. 1... Mark sheet, 2... Optical reading section, 3...
Input image data buffer memory, 4... cutout circuit,
5... Cutting position mark, 6... Feature extraction circuit,
7... Feature counting circuit, 8... Buffer memory, 9...
...Dictionary memory, 10...Character judgment circuit, 11...
Training area designation mark, 12... Memory for font registration, 13... Normal recognition area, 14... Training area.

Claims (1)

【特許請求の範囲】 1、マークシート中にトレーニングエリアを設け、切り
出し回路においてトレーニングエリアであることを認識
し、そのトレーニングエリア内では記入枠位置によって
記入する文字種を決めておき、前記トレーニングエリア
内に記入された文字について認識処理を行う場合は文字
判定回路において辞書メモリに記述された判定項目をす
べて満足する字体識別番号を選出して字体登録用メモリ
に格納し、トレーニング後のマークシートの通常エリア
の認識においては、前記文字判定回路が前記字体登録用
メモリに登録されている前記字体識別番号をもとに前記
辞書メモリを検索することにより判定項目を満足する字
体を選出して文字種を特定することを特徴とする文字認
識方法。 2、マークシート画面情報から1文字分のパタン情報を
切り出す切り出し回路と、1文字パタンから文字判定に
必要な部分特徴を抽出する特徴抽出回路と、前記各部分
特徴についてその度合を数値化する特徴計数回路と、標
本字体の判定項目を字体識別番号順に列挙してその字体
の属する文字種と各判定項目として注目する部分特徴番
号とその基準値と許容偏差値とを格納する辞書メモリと
、この辞書メモリの前記判定項目に従い前記特徴計数回
路の出力を、照合して全判定項目について満足する字体
を選出する文字判定回路とを有する文字認識装置おいて
、前記マークシート中に設けた記入枠位置によって記入
する文字種が固定なトレーニングエリアを検出するトレ
ーニングエリア検出手段と、字体登録用メモリとを備え
、前記トレーニングエリア内に記入された文字について
の前記文字判定回路の処理は、前記辞書メモリに記述さ
れた該当する文字種の字体すべてについて検索し、その
判定項目を満足する字体識別番号を選出して前記字体登
録用メモリに格納して行い、前記トレーニング処理後の
マークシートの通常エリアについての前記文字判定回路
の処理は、前記文字判定回路が前記字体登録用メモリに
登録されている字体識別番号をもとに前記辞書メモリを
検索することにより前記判定項目を満足する字体を選出
し文字種を特定して行うことを特徴とする文字認識装置
[Claims] 1. A training area is provided in the mark sheet, the cutting circuit recognizes that it is a training area, and within the training area, the type of character to be written is determined depending on the position of the entry frame, and the When performing recognition processing on the written characters, the character judgment circuit selects a font identification number that satisfies all the judgment items written in the dictionary memory, stores it in the font registration memory, and stores it in the normal area of the mark sheet after training. In recognition, the character determination circuit selects a font that satisfies determination items by searching the dictionary memory based on the font identification number registered in the font registration memory and identifies the character type. A character recognition method featuring: 2. An extraction circuit that extracts pattern information for one character from mark sheet screen information, a feature extraction circuit that extracts partial features necessary for character determination from one character pattern, and a feature counter that digitizes the degree of each of the partial features. a circuit, a dictionary memory that stores the judgment items of a sample font in order of font identification number, the character type to which the font belongs, the partial feature number to be focused on as each judgment item, its reference value, and allowable deviation value; and this dictionary memory. In a character recognition device having a character judgment circuit that collates the output of the feature counting circuit according to the judgment items and selects a font that satisfies all the judgment items, the mark sheet is filled in according to the entry frame position provided in the mark sheet. The character determination circuit includes a training area detection means for detecting a training area in which a character type is fixed, and a font registration memory, and the processing of the character determination circuit for characters written in the training area is performed based on the corresponding character written in the dictionary memory. A search is made for all fonts of the character type, and a font identification number that satisfies the determination items is selected and stored in the font registration memory, and the character determination circuit processes the normal area of the mark sheet after the training process. The character determination circuit selects a font that satisfies the determination item by searching the dictionary memory based on the font identification number registered in the font registration memory and specifies the character type. Characteristic character recognition device.
JP2103804A 1990-04-19 1990-04-19 Character recognition and device for the same Pending JPH041882A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2103804A JPH041882A (en) 1990-04-19 1990-04-19 Character recognition and device for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2103804A JPH041882A (en) 1990-04-19 1990-04-19 Character recognition and device for the same

Publications (1)

Publication Number Publication Date
JPH041882A true JPH041882A (en) 1992-01-07

Family

ID=14363592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2103804A Pending JPH041882A (en) 1990-04-19 1990-04-19 Character recognition and device for the same

Country Status (1)

Country Link
JP (1) JPH041882A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6344086B1 (en) 1998-01-19 2002-02-05 Sumitomo Electric Industries, Ltd. Extrusion coating apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6344086B1 (en) 1998-01-19 2002-02-05 Sumitomo Electric Industries, Ltd. Extrusion coating apparatus

Similar Documents

Publication Publication Date Title
CN111753120A (en) Method and device for searching questions, electronic equipment and storage medium
JPH0772906B2 (en) Document recognition device
JP2004171316A (en) Ocr device, document retrieval system and document retrieval program
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JPH041882A (en) Character recognition and device for the same
JPH06124366A (en) Address reader
JPH06215184A (en) Labeling device for extracted area
JPS592191A (en) Recognizing and processing system of handwritten japanese sentence
JPS6142083A (en) Character recognition device
JP3985926B2 (en) Character recognition method, character recognition apparatus, document image processing system, and recording medium
JPS6146573A (en) Character recognizing device
JPH053631B2 (en)
JP3720405B2 (en) Region identification apparatus and method
JP3310063B2 (en) Document processing device
JP2851865B2 (en) Character recognition device
JP2784004B2 (en) Character recognition device
JPS60138689A (en) Character recognizing method
JPH07111729B2 (en) Reader
JPH0527914B2 (en)
JP2003099709A (en) Misread character correction method and optical character recognition device
JP2953162B2 (en) Character recognition device
JP2972443B2 (en) Character recognition device
JPS6133584A (en) Collation device
JPH0318987A (en) Dictionary registering method
JPH0520490A (en) Optical character read and correction system