JPS6084683A - Character recognizing system - Google Patents

Character recognizing system

Info

Publication number
JPS6084683A
JPS6084683A JP58193134A JP19313483A JPS6084683A JP S6084683 A JPS6084683 A JP S6084683A JP 58193134 A JP58193134 A JP 58193134A JP 19313483 A JP19313483 A JP 19313483A JP S6084683 A JPS6084683 A JP S6084683A
Authority
JP
Japan
Prior art keywords
stroke
information
basic
recognition mode
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58193134A
Other languages
Japanese (ja)
Inventor
Mitsumasa Sugiyama
杉山 光正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP58193134A priority Critical patent/JPS6084683A/en
Publication of JPS6084683A publication Critical patent/JPS6084683A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To suppress a classifying error rate of a basic stroke to a low level by a small processing quantity, and to obtain a high recognition rate by limiting a basic stroke group which is an object to be collated, by a recognition mode of ''Kana'' (Japanese syllabary), a Chinese character, an alphabet, etc. CONSTITUTION:Recognition mode setting information is sent to a recognition mode setting part 5, and set to a recognition mode. In a preprocessing part 4, a processing such as elimination of a noise, smoothing, etc. is executed for inputted character information, and thereafter, a stroke is cut by on-and-off information of a pen touch of an input pen 2, and stroke information of every stroke is sent to a stroke recognizing part 6. In the stroke recognizing part 6, the stroke information obtained from the preprocessing part 4 is collated to a basic stroke pattern registered in a basic stroke dictionary part 7 in accordance with the recognition mode set by the recognition mode setting part 5. In this way, the input stroke is classified to one of the basic strokes.

Description

【発明の詳細な説明】 (技術分野) 本発明は文字を構成するストロークにし1する情報によ
って文字認識を行う文字認識方式に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (Technical Field) The present invention relates to a character recognition method that performs character recognition based on information on strokes that constitute a character.

(従来波?111) 従来、文字を構成するストロークに関する情報によって
、入力ストロークを予め準(iillさtした基本スト
ロークに分類し、基本ストロークの集合力)ら文字を認
識する方式をとってし)る。し力1しな力(ら日本語に
おいては漢字、ひら力くな、カタカナ、英字、数字等、
多くの文字が使用されており、そのストν−りを分類す
るための基本ストロークも多い。しかし、ひらがなを構
成するストロークには、漢字、カタカナ、英字、数字等
には使われないものも多くある。誉存マ漢牛乎壜キ1文
工准市工2di寡を才式ツツ;また、英字、数字を構成
するストロークにも他の文字には使われないものがある
。この様に認識させるべき文字の種類が多いと必然的に
備えるべきストロークも多くなるので入力ストロークを
基本ストロークに分類する際に生じる基本ストローク分
類誤りが認識率の低下を招いていた。
(Conventional wave? 111) Conventionally, input strokes are classified into basic strokes based on information about the strokes that make up the character, and characters are recognized based on the collective force of the basic strokes. Ru. Shiriki 1 Shina Power (Ra In Japanese, kanji, hirari kuna, katakana, alphabetic characters, numbers, etc.)
Many characters are used, and there are many basic strokes for classifying the characters. However, many of the strokes that make up hiragana are not used for kanji, katakana, alphabetic characters, numbers, etc. There are also strokes that make up letters and numbers that are not used for other letters. If there are many types of characters to be recognized in this way, the number of strokes that must be prepared will also inevitably increase, so basic stroke classification errors that occur when classifying input strokes into basic strokes have caused a reduction in the recognition rate.

(目 的) 本発明はかな、漢字、英字等の認識モードにより照合対
象とする基本ストローク群を限定し、少い処理量で基本
ストロークの分類誤り率を低く抑え、高い認識率を得る
ことができる文字認識方式を提供することを目的とする
(Purpose) The present invention is capable of limiting basic stroke groups to be matched by recognition modes such as kana, kanji, and alphabets, keeping the classification error rate of basic strokes low with a small amount of processing, and achieving a high recognition rate. The purpose is to provide a character recognition method that can.

(実施例) 以下、図面に従って本発明の一実施例を詳#11に説明
する。
(Example) Hereinafter, an example of the present invention will be described in detail #11 with reference to the drawings.

第1図は本発明の一実施例である文字認識装置の構成を
示すブロック図である。図において6は認識させるべき
文字情報を入力するための文字情報入力装置でタブレッ
ト1と入力ペン2より構成されており、入力ペン2を用
いてタブレット1上に認識させるべき文字情報を描くこ
とにより入力が行れる。4は文字情報入力装置6より入
力された文字情報にノイズ除去、正規化等を施す前処理
部、5は認識させるべき入力文字がひらがなモード、カ
タカナモード、英字モード、数字モード等のいずれのモ
ードであるかを設定するための認識モード設定部、6は
ストローク情報から入カスト四−りを認識するストロー
ク認識部、7はストローク認識のために使用される基本
ストロークの代表ストロークパターンが登録しである基
本ストローク辞書部、8は各入力ストロークの長さ、位
置関係等を処理する文字情報処理部、9は6のストロー
ク8織部から得た結果と文字情報処理部から得た文字情
報により、入り文字を認識する文字間tA?m、10は
複数種の文字パターンが格納されている文字辞書部、1
1は文字認識部9で認識された結果を出力する出力部で
ある。
FIG. 1 is a block diagram showing the configuration of a character recognition device that is an embodiment of the present invention. In the figure, 6 is a character information input device for inputting character information to be recognized, which is composed of a tablet 1 and an input pen 2. By drawing character information to be recognized on the tablet 1 using the input pen 2, You can input. 4 is a preprocessing unit that performs noise removal, normalization, etc. on the character information input from the character information input device 6; 5 is a preprocessing unit that performs noise removal, normalization, etc. on the character information input from the character information input device 6; and 5, whether the input characters to be recognized are in hiragana mode, katakana mode, alphabet mode, numeric mode, etc. 6 is a stroke recognition unit that recognizes an input cast four-way from stroke information; 7 is a recognition mode setting unit for setting whether the stroke is a typical stroke pattern used for stroke recognition; A basic stroke dictionary part, 8 is a character information processing part that processes the length of each input stroke, positional relationship, etc., 9 is a character information processing part that processes the length of each input stroke, positional relationship, etc. Character spacing tA to recognize characters? m, 10 is a character dictionary section in which multiple types of character patterns are stored, 1
Reference numeral 1 denotes an output unit that outputs the result recognized by the character recognition unit 9.

第2図は基本ストロークの1例であり、ストロークtd
、ナンバー、代表ストローク、各モードに該当する文字
を構成するストロークと成り得るがどうかを表示してい
る。代表ストロークの矢印はペンの移動の方向を表して
いる。各モード列にrOJのある基本ストロークは、そ
のモードに該当する文字を構成するストロークと成り得
ることを表している。
Figure 2 is an example of a basic stroke, and the stroke td
, number, representative stroke, and whether or not the strokes can constitute a character corresponding to each mode are displayed. The arrow of the representative stroke indicates the direction of pen movement. A basic stroke with rOJ in each mode string indicates that it can be a stroke that constitutes a character corresponding to that mode.

次に第1図、第2図を参照しつつ、本実施例を説明する
Next, the present embodiment will be described with reference to FIGS. 1 and 2.

オペレータが1のタブレット上で2の入力ペンを用いて
文字を書くと、ある一定時1fJI毎にタブレット1上
における入力ベン2のペン先の座標情報と入力ペン2の
ペン先がタブレットに触れているかいないかの情報が前
処理部4に送られる。また認識モードの設定は文字情報
入力装置6上に設けたキー(不図示)を押下するが、又
は入力ペン2でタブレット1上の所定の区域に触れる等
で行い認識モード設定情報は認識モード設定部5に送ら
れ、認識モードが設定される。前処理部4では入力され
た文字情報に対し、ノイズ除去、平滑化等の処理を行っ
た後、入力ペン2のペンタッチのオン。
When an operator writes characters on tablet No. 1 using input pen No. 2, the coordinate information of the pen tip of input pen No. 2 on tablet No. 1 and the pen tip of input pen No. 2 touch the tablet every 1fJI at a certain time. Information on whether or not there is a fish is sent to the preprocessing section 4. The recognition mode setting information can be set by pressing a key (not shown) provided on the character information input device 6 or by touching a predetermined area on the tablet 1 with the input pen 2. 5, and a recognition mode is set. The preprocessing unit 4 performs processing such as noise removal and smoothing on the input character information, and then turns on the pen touch of the input pen 2.

オフ情報よりス)ローフの切り出しを行い、ストローク
毎のストp−り情報を6のストローク認識部へ送る。ま
た各ストロークの長さ、ストロークの始点、終点、入力
ペン2のペン移動方向変化点の座標、各ストロークの交
差の有無等を文字情報処理部8へ送る。ス)o−り認識
部6では前処理部4から得たストローク情報に対して認
識モード設定部5で設定された認識モードに従い基本ス
トローク辞書部7に登録されている基本ストロークパタ
ーンと照合して入カスト四−りを基本ストロークのいづ
れかに分類する。
A loaf is cut out from the off information, and the stroke information for each stroke is sent to the stroke recognition section 6. Further, the length of each stroke, the start point and end point of the stroke, the coordinates of the point of change in the pen movement direction of the input pen 2, the presence or absence of intersection of each stroke, etc. are sent to the character information processing section 8. S) The o-ri recognition unit 6 compares the stroke information obtained from the preprocessing unit 4 with the basic stroke pattern registered in the basic stroke dictionary unit 7 according to the recognition mode set in the recognition mode setting unit 5. Classify the incoming cast four strokes as one of the basic strokes.

いま、認識モード設定部に設定された認識モードがひら
がなであるとすると、入カス)o−りは第2図のスト四
−りictナンバー1.2.4.6.7.8.9゜10
、11.12.13.14.15.16.17.1B、
 19.20.21.22.23゜26、27.2B、
 29.30に属する基本ストロークパターンと照合し
て分類し、認識モードが数字の場合は、入力ストローク
はストロークtdナンバー1.2.5.8゜12、13
.14.19.20.21.22.27.29.31.
65.54に属する基本ス)Iff−クパターンと照合
して分類する。他の認識モードの場合も同様である。以
上のように1文字のすべてのストp−りの処理がストロ
ーク認識部6で終ると、文字認識部9ではストローク、
d Wh部6から各入力ストロークのietナンバー、
文字処理情報部8からストローク位置情報、ストローク
交差情報、ストローク長情報等の文字情報、認識モード
設定部5から認識モードを得、文字辞書部10に登録し
である文字パターンと照合して開織結果を出力部11よ
り出力する。前実施例ではひらがなモード、漢字モード
、カタカナモード、数字モード、英字モード、等のそれ
ぞれの認識モードについて説明したが、使用者が認識モ
ードを設定する場合には、モード数が少い方が使用者の
負担は小さい。そのためいくつかの認識モードを一つに
し、ひらがな漢字モード、カタカナ争英数字モード等を
設定するようにしてもよい。この場合には、認識モード
だけでなく、入力文字の画数が7以上ならば照合対象と
する基本ストローク群を漢字を構成するストν−りに成
りうる基本ストロークに限定する等、入力文字の画数、
および入力ストロークの画数により照合対象とする基本
ストロークを限定してもよい。
Now, assuming that the recognition mode set in the recognition mode setting section is Hiragana, the input error is the ICT number 1.2.4.6.7.8.9° in Figure 2. 10
, 11.12.13.14.15.16.17.1B,
19.20.21.22.23゜26, 27.2B,
29.30, and if the recognition mode is numeric, the input stroke is the stroke td number 1.2.5.8°12, 13.
.. 14.19.20.21.22.27.29.31.
65.65.65.65.65.65.65.65.54). The same applies to other recognition modes. As described above, when all the strokes of one character are processed by the stroke recognition unit 6, the character recognition unit 9 processes the strokes,
d IET number of each input stroke from Wh section 6,
Character information such as stroke position information, stroke intersection information, and stroke length information is obtained from the character processing information section 8, a recognition mode is obtained from the recognition mode setting section 5, and the text is opened by comparing it with a character pattern registered in the character dictionary section 10. The results are output from the output unit 11. In the previous embodiment, each recognition mode such as hiragana mode, kanji mode, katakana mode, number mode, alphabet mode, etc. was explained, but when the user sets the recognition mode, the one with fewer modes is used. The burden on people is small. Therefore, several recognition modes may be combined into one, such as a hiragana/kanji mode, a katakana alphanumeric mode, etc. In this case, in addition to the recognition mode, if the number of strokes of the input character is 7 or more, the number of strokes of the input character is ,
The basic strokes to be compared may be limited based on the number of input strokes.

(効 果) 以上の説明から明らかなように、本発明によれば、認識
モードにより照合対象となる基本ストローク群が限定さ
れ、少い処理量で高いストローク認識率が得られ、文字
認識率を高めることができる。
(Effects) As is clear from the above explanation, according to the present invention, the basic stroke group to be matched is limited by the recognition mode, a high stroke recognition rate can be obtained with a small amount of processing, and the character recognition rate can be improved. can be increased.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例である文字&LiJl装置の
構成を示すブロック図、第2図は第1図に示した基本ス
トローク辞書部に格納されている基本ストロークを示す
図であり、6は文字情報入力装置、5は認識モード設定
部、6はストローク開織部、7は基本ス)o−り辞書部
、9は文字認識部、10は文字辞書部である。 出願人 キャノン株式会社
FIG. 1 is a block diagram showing the configuration of a character & LiJl device which is an embodiment of the present invention, and FIG. 2 is a diagram showing basic strokes stored in the basic stroke dictionary section shown in FIG. 5 is a character information input device, 5 is a recognition mode setting section, 6 is a stroke opening section, 7 is a basic script dictionary section, 9 is a character recognition section, and 10 is a character dictionary section. Applicant Canon Co., Ltd.

Claims (1)

【特許請求の範囲】[Claims] 文字を構成するストp−りに罠する情報によって文字認
識を行う文字認識装置におI/)で、かな、漢字、英字
等の認識モードにより照合対
A character recognition device that performs character recognition using information that traps characters in the strings that make up the characters.
JP58193134A 1983-10-14 1983-10-14 Character recognizing system Pending JPS6084683A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58193134A JPS6084683A (en) 1983-10-14 1983-10-14 Character recognizing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58193134A JPS6084683A (en) 1983-10-14 1983-10-14 Character recognizing system

Publications (1)

Publication Number Publication Date
JPS6084683A true JPS6084683A (en) 1985-05-14

Family

ID=16302836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58193134A Pending JPS6084683A (en) 1983-10-14 1983-10-14 Character recognizing system

Country Status (1)

Country Link
JP (1) JPS6084683A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0431843A2 (en) * 1989-12-04 1991-06-12 Sony Corporation Character recognition apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0431843A2 (en) * 1989-12-04 1991-06-12 Sony Corporation Character recognition apparatus

Similar Documents

Publication Publication Date Title
EP0670554A2 (en) Stylus-based keyboard key arrangement
KR19990022352A (en) Character recognition method and handwriting input
JPS6084683A (en) Character recognizing system
KR100258934B1 (en) Apparatus and method for recognizing english word on line by selecting alphabet from the alphabet groups
JPS6224382A (en) Method for recognizing handwritten character
JPS6084684A (en) Character recognizing system
JPS6111891A (en) Recognizing device of hand-written character/picture
JPS63316284A (en) Hand written character recognizing device
JPS59188787A (en) Input device of on-line manuscript character
JP2680845B2 (en) Character input coding method
JP2865286B2 (en) Online handwritten character recognition device
JP3153704B2 (en) Character recognition device
JPH0756666B2 (en) Information recognition method
JPS6081688A (en) Recognizing method of information
JP2922900B2 (en) Handwritten character recognition device
Pao et al. An approximate string matching algorithm for on-line Chinese character recognition
JPH0634259B2 (en) Character recognition device
JPS61114388A (en) Character input device
JPS5929246Y2 (en) Online recognition processing device for handwritten characters
JPH06337957A (en) Handwritten character input device and correction code recognizing method
JP3022790B2 (en) Handwritten character input device
JP2905334B2 (en) Online handwritten character recognition dictionary creation method and online handwritten character recognition dictionary creation device
JPS61139828A (en) Language input device
JPH0120797B2 (en)
JPH03502841A (en) character recognition device