JPS60118985A - Character recognizing system - Google Patents

Character recognizing system

Info

Publication number
JPS60118985A
JPS60118985A JP58226083A JP22608383A JPS60118985A JP S60118985 A JPS60118985 A JP S60118985A JP 58226083 A JP58226083 A JP 58226083A JP 22608383 A JP22608383 A JP 22608383A JP S60118985 A JPS60118985 A JP S60118985A
Authority
JP
Japan
Prior art keywords
character
characters
slope
line width
manuscript
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58226083A
Other languages
Japanese (ja)
Inventor
Kiyohiko Kobayashi
清彦 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58226083A priority Critical patent/JPS60118985A/en
Publication of JPS60118985A publication Critical patent/JPS60118985A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To switch automatically processing system of character recognition by comparing a slope of a character in 10-100 character groups read at the beginning of an original with a slope of a reference print character so as to discriminate it as manuscript on the original when the former slope is larger. CONSTITUTION:A character recognition switching control section 4 switching the processing system in a character recognition section 3 and an extracting section 5 extracting the line width (slope) of each character in a prescribed character group reat at the beginning in the original are provided. Then a line width signal (slope signal) transmitted sequentially from the extracting section 5 and a preset reference signal Sr are compared by a system controller and the number of characters when the relation of S>Sr exists is counted by a count means 7, the number is compared and discriminated with the reference character number so as to discriminate whether the character in the original is a print character or a manuscript.

Description

【発明の詳細な説明】 韮豊分互 本発明は、OCRにおけるパターン認識の対象となる文
字(記号などのパターンを含む)が活字によるものか手
書によるものかを識別する文字種識別方式に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character type identification method for identifying whether characters (including patterns such as symbols) targeted for pattern recognition in OCR are printed or handwritten.

皿米肢■ 一般に、手書文字は活字文字に比べて変形が大きいため
に、OCRにおける文字認識時における処理が複雑なも
のになってしまっている。しかして、OCRにおいて活
字文字と手書文字との両者をそれぞれ認識することがで
きるようにするためにはOCRの処理時間が手書文字を
認識する処理時間によって決まってしまい、処理速度が
遅くなってしまうという問題がある。
In general, handwritten characters are more deformed than printed characters, making the processing during character recognition in OCR more complicated. However, in order for OCR to be able to recognize both printed characters and handwritten characters, the processing time of OCR is determined by the processing time for recognizing handwritten characters, which slows down the processing speed. There is a problem with this.

そのため従来では活字による文字認識の処理時間の短縮
を図るべく、OCRにおける文字認識処理のために2系
統を設けて活字文字と手書文字とをそれぞれ別系統に分
けて処理することができるようにしたうえで、認識対象
となる入力文字が活字によるものか手書によるものかを
予めオペレータのスイッチ選択によってOCRのコント
ローラに指示させ、それによりコントローラが文字認識
の処理系統を適宜切り換えて入力文字の認識を行なわせ
るようにしている。しかしこのようなスイッチ選択手段
をとるのでは、その操作が煩雑なものになってしまって
いる。
Therefore, in order to reduce the processing time for character recognition using printed characters, conventionally, two systems were provided for character recognition processing in OCR so that printed characters and handwritten characters could be processed separately. Then, the operator selects a switch in advance to instruct the OCR controller whether the input characters to be recognized are printed or handwritten, and the controller switches the character recognition processing system as appropriate to recognize the input characters. I'm trying to get them to recognize it. However, using such a switch selection means makes the operation complicated.

IJケ 本発明は以上の点を考慮してなされたもので、OCRに
おいて入力文字が活字によるものか手書によるものかの
判別を自動的になして、その判別された文字種の種類に
応じて文字認識の処理系統を自動的に切り換えさせるこ
とができるようにした文字種識別方式を提供するもので
ある。
IJke The present invention was made in consideration of the above points, and the OCR automatically determines whether the input characters are printed or handwritten, and then automatically determines whether the input characters are printed or handwritten. The present invention provides a character type identification method that allows automatic switching of character recognition processing systems.

l處 以下、本発明の一実施例について詳述する。room An embodiment of the present invention will be described in detail below.

本発明による文字種識別方式にあっては、一般的に手書
による文字にあっては活字によるものよりも線幅が大き
いという点に着目したうえで、原稿中の最初に読み取ら
れた10ないし100程度の文字群における各文字の線
幅をそれぞれめ。
The character type identification method according to the present invention takes into consideration the fact that handwritten characters generally have a larger line width than printed characters, and uses the first 10 to 100 Measure the line width of each character in the character group.

そのめられた各文字の線幅を基準となる活字文字の平均
または最大の線幅と比較し請求められた線幅が基準とな
る線幅より大きい文字が所定の割合以上あったときにそ
の原稿は手書文字によるものであると判定し、またそう
でないときには活字文字によるものであると判定する手
段をとるようにしたものである。
Compare the line width of each requested character with the average or maximum line width of standard printed characters, and if there are more than a predetermined percentage of characters whose requested line width is larger than the standard line width, The document is determined to be handwritten, and if not, it is determined to be printed.

また本発明による文字種識別方式にあっては。Further, in the character type identification method according to the present invention.

一般的に手書による文字にあっては活字によるものより
も傾斜が大きいという点に着目したうえで、原稿中の最
初に読み取られた10ないし100程度の文字群におけ
る各文字の傾斜をそれぞ九求め、そのめられた各文字の
傾斜を基準となる活字文字の平均または最大の傾斜と比
較し請求めら九た傾斜が基準となる傾斜より大きい文字
が所定の割合以上あったときにその原稿は手書文字によ
るものであると判定し、またそうでないときには活字文
字によるものであると判定する手段をとるようにしたも
のである。
Focusing on the fact that handwritten characters generally have a larger slope than printed characters, we calculated the slope of each character in the first 10 to 100 characters read in the manuscript. The slope of each character is compared with the average or maximum slope of the standard printed characters, and if the number of characters whose slope is greater than the standard slope is more than a predetermined percentage, The document is determined to be handwritten, and if not, it is determined to be printed.

第1図は本発明による文字種識別方式をOCRにおいて
具体的に実施したときの一構成例を示すもので、マイク
ロコンピュータなどからなるシステムコントローラの制
御下において、スキャナ1により原稿面を光走査して画
素単位で画情報の読取りを行なわせ、その読み取られた
画情報に応じて文字切出部2により各文字の切出しを行
なわせ、文字認識部3により活字文字と手書文字との2
系統に分けて切り出された各文字の特徴を抽出して文字
認識をそれぞれなすようにしたOCRにあって、特に文
字認識部3における各処理系統の切換えを行なわせる文
字認識切換制御部4と、文字認識部3内に各切り出され
た文字の特徴抽出の1つとして原稿中の最初に読み取ら
れた所定の文字群における各文字の線幅(または傾斜)
を抽出する線幅抽出部(または傾斜抽出部)5とを設け
、システムコントローラ側においてその線幅抽出部5か
ら順次送られてくる線幅信号(または傾斜信号)Sと予
め設定された基準線幅信号(または基準傾斜信号)Sr
との比較をなして両者の大小関係を判定する比較手段6
と、その比較結果に応じてS>Srになった文字数を計
数して記憶するカウント手段7と、そのカウントされた
文字数と予め設定された基準文字数との比較判断をなし
て原稿中の文字が活字によるものか手書によるものかの
判定をなして文字認識切換制御部4に切換指令を与える
文字種判定手段8とをとるようにしている。
FIG. 1 shows an example of a configuration in which the character type identification method according to the present invention is specifically implemented in OCR, in which a scanner 1 optically scans a document surface under the control of a system controller consisting of a microcomputer or the like. The image information is read pixel by pixel, the character cutting section 2 cuts out each character according to the read image information, and the character recognition section 3 separates printed characters and handwritten characters.
In an OCR that performs character recognition by extracting the characteristics of each character cut out into systems, the character recognition switching control section 4 specifically switches between each processing system in the character recognition section 3; The line width (or slope) of each character in a predetermined group of characters first read in the manuscript is one of the features extracted from each character in the character recognition unit 3.
A line width extraction unit (or slope extraction unit) 5 is provided to extract the line width extraction unit (or slope extraction unit) 5, and on the system controller side, the line width signal (or slope signal) S sequentially sent from the line width extraction unit 5 and a preset reference line are Width signal (or reference slope signal) Sr
Comparison means 6 for determining the magnitude relationship between the two
and a counting means 7 which counts and stores the number of characters for which S>Sr according to the comparison result, and compares and judges the counted number of characters with a preset standard number of characters and determines whether the characters in the manuscript are correct. A character type determining means 8 determines whether the character is printed or handwritten and gives a switching command to the character recognition switching control section 4.

しかしてこのように構成されたものにあっては、スキャ
ナ1によって読み取られ1文字切出部2により切り出さ
れた原稿中の最初のlO文字分の各画情報が線幅抽出部
5に順次送られてそこで各文字の線幅の抽出が行なわれ
る。具体的には。
However, in the device configured in this way, each stroke information for the first 10 characters in the document read by the scanner 1 and cut out by the single character cutting unit 2 is sequentially sent to the line width extraction unit 5. Then, the line width of each character is extracted. in particular.

例えば線幅=総黒画素/周囲長としてめられる。For example, line width = total black pixels/perimeter length.

次いで、比較手段6により各床められた線幅Sと基準線
幅Srとの比較が逐次なされ、’S>Srとなったとき
のハイレベル出力の信号数がカウント手段7により計数
される。次いで、その総カウント値からして文字種判定
手段8により線幅Sが基準線幅Sr以上である文字数が
例えば5文字以上あるか否かの判定を行なわせ、5文字
以上ある場合には原稿中の文字が手書によるものである
として、またそうでない場合には活字によるものである
として文字認識切換制御部4にその旨の各切換指令を与
えて文字認識部3のモード切換を適宜行なわせる。それ
により文字認識部3は、活字文字か手書文字かに応じて
最適な文字認識の処理を行なわせることができるように
なる。したがって特に活字による文字の認識を行なわせ
る際には、文字認識部3における辞書検索が活字のみの
範囲となってその処理時間が有効に短縮されることにな
る。なお、原稿中の最初の10文字分の文字認識につい
ては活字および手書文字による両者のモードによる処理
が行なわれることになる。また、第2図に各部動作の手
順を示している。
Next, the comparing means 6 successively compares each set line width S with the reference line width Sr, and the counting means 7 counts the number of high-level output signals when 'S>Sr. Next, based on the total count value, the character type determining means 8 determines whether there are, for example, five or more characters whose line width S is equal to or greater than the reference line width Sr, and if there are five or more characters, the number of characters in the manuscript is It is assumed that the characters are handwritten, and if not, they are printed, and the character recognition switching control unit 4 is given switching commands to that effect to cause the character recognition unit 3 to switch modes as appropriate. . This allows the character recognition unit 3 to perform optimal character recognition processing depending on whether the characters are printed or handwritten. Therefore, especially when recognizing printed characters, the dictionary search in the character recognition section 3 is limited to printed characters only, and the processing time is effectively shortened. It should be noted that character recognition for the first 10 characters in the manuscript will be processed in both print and handwritten character modes. Further, FIG. 2 shows the procedure of operation of each part.

墓米 以上、本発明による文字種識別方式にあっては、OCR
において入力文字が活字によるものか手書によるものか
の判別を自動的になして、その判別された文字種の種類
に応じて文字認識の処理系統を自動的に切り換えさせる
ことができるようにしたもので、何ら複雑な操作を必要
とすることなく文字種に応じた最適な文字認識の処理を
迅速になすことができるという優れた利点を有している
In the character type identification method according to the present invention, OCR
Automatically determines whether input characters are printed or handwritten, and automatically switches the character recognition processing system according to the determined type of character. This method has the excellent advantage of being able to quickly perform optimal character recognition processing according to the character type without requiring any complicated operations.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明による文字種識別方式を具体的に実施す
るための構成例を示すブロック図、第2図は同構成例に
おける各部動作のフローチャートである。 ■・・・スキャナ 2・・・文字切出部 3・・・文字
認識部4・・・文字認識切換制御部 5・・・線幅抽出
部 6・・・比較手段 7・・・カウント手段 8・・
・文字種判定手段 出願人代理人 鳥井 清 第1 図 7 8 第2図
FIG. 1 is a block diagram showing a configuration example for concretely implementing the character type identification method according to the present invention, and FIG. 2 is a flow chart of the operation of each part in the same configuration example. ■...Scanner 2...Character cutting section 3...Character recognition section 4...Character recognition switching control section 5...Line width extraction section 6...Comparison means 7...Counting means 8・・・
・Character type determination method applicant's representative Kiyoshi Torii 1 Figure 7 8 Figure 2

Claims (1)

【特許請求の範囲】 1、 原稿から抽出された文字群における各文字の線幅
をそれぞれめる手段と、そのめられた各文字の線幅を活
字文字に応じて予め設定された基準線幅と比較する手段
と、その比較結果からめられた線幅が基準線幅より大き
い文字が所定の割合以上あったときにその原稿は手書文
字によるものであると判定し、またそうでないときには
活字文字によるものであると判定する手段とからなる文
字種識別方式。 2、 原稿から抽出された文字群における各文字の傾斜
をそれぞれめる手段と、そのめられた各文字の傾斜を活
字文字に応じて予め設定された基準となる傾斜と比較す
る手段と、その比較結果からめられた傾斜が基準となる
傾斜より大きい文字が所定の割合以上あったときにその
原稿は手書文字によるものであると判定し、またそうで
ないときには活字文字によるものであると判定する手段
とからなる文字種識別方式。
[Claims] 1. Means for determining the line width of each character in a group of characters extracted from a manuscript, and a reference line width that is set in advance according to the type of printed character to determine the line width of each character. If there is a predetermined percentage of characters whose line width is larger than the standard line width based on the comparison result, it is determined that the manuscript is handwritten, and if not, it is determined that the manuscript is written as printed characters. A character type identification method comprising means for determining that the character type is 2. A means for determining the slope of each character in a group of characters extracted from a manuscript, a means for comparing the determined slope of each character with a reference slope preset according to the type of printed characters, and When there are more than a predetermined percentage of characters whose slope determined from the comparison result is larger than the standard slope, the manuscript is determined to be handwritten, and if not, it is determined to be printed. A character type identification method consisting of means.
JP58226083A 1983-11-30 1983-11-30 Character recognizing system Pending JPS60118985A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58226083A JPS60118985A (en) 1983-11-30 1983-11-30 Character recognizing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58226083A JPS60118985A (en) 1983-11-30 1983-11-30 Character recognizing system

Publications (1)

Publication Number Publication Date
JPS60118985A true JPS60118985A (en) 1985-06-26

Family

ID=16839552

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58226083A Pending JPS60118985A (en) 1983-11-30 1983-11-30 Character recognizing system

Country Status (1)

Country Link
JP (1) JPS60118985A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643401B1 (en) 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643401B1 (en) 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character

Similar Documents

Publication Publication Date Title
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US5812695A (en) Automatic typing of raster images using density slicing
JPS60118985A (en) Character recognizing system
JP3215163B2 (en) Ruled line identification method and area identification method
JPS60123973A (en) Kind of character recognizing system
JPH0291789A (en) Character recognizing system
JPS61193277A (en) Document reader
JPS59158482A (en) Character recognizing device
JP2606816B2 (en) Character reader
JPH05189604A (en) Optical character reader
JPH10171924A (en) Character recognizing device
JPH0576674B2 (en)
JPH05182025A (en) Character recognition device
JPH08190606A (en) Optical character reader
JPH04274582A (en) Character recognizing device and character recognizing method using the same
JPH06131498A (en) Total decision system for recognition result of optical type character recognizing device
JP2832035B2 (en) Character recognition device
JP2001143020A (en) Character recognition device, method and recording medium thereof
JPS59211175A (en) Character recognizer
JPH09223189A (en) Method and processor for table processing
JPS63257081A (en) Document input system
JPH05290208A (en) Character recognition processing system
JPH05135204A (en) Character recognition device
JPH06176193A (en) Optical character reader
JPH05210759A (en) Character recognizing device