JPH09251517A - Method and device for recognizing character - Google Patents

Method and device for recognizing character

Info

Publication number
JPH09251517A
JPH09251517A JP8061262A JP6126296A JPH09251517A JP H09251517 A JPH09251517 A JP H09251517A JP 8061262 A JP8061262 A JP 8061262A JP 6126296 A JP6126296 A JP 6126296A JP H09251517 A JPH09251517 A JP H09251517A
Authority
JP
Japan
Prior art keywords
character
dictionary
recognition
distance
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8061262A
Other languages
Japanese (ja)
Inventor
Hideaki Tanaka
秀明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP8061262A priority Critical patent/JPH09251517A/en
Publication of JPH09251517A publication Critical patent/JPH09251517A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To preferably use a learning dictionary while suppressing an influence of erroneous recognition to a basic dictionary. SOLUTION: A teacher code (S1) is given, a character to be learned is recognition-processed only by the basic dictionary (S2) and a category different from the character to be learned is scanned (S3). Then, establishment distance (S4) is obtained by distance from a nearest and different-kind category and the learning dictionary is generated (S5). Establishment distance corresponding to the learning dictionary is stored (S6) and the basic dictionary for recognizing a character is preferably used based on establishment distance.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、ユーザーが作成し
た認識用学習辞書を優先的に使用して認識を行うための
認識方法及び認識装置に関し、特に、文字認識方法及び
文字認識装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a recognition method and a recognition apparatus for preferentially using a recognition learning dictionary created by a user for recognition, and more particularly to a character recognition method and a character recognition apparatus.

【0002】[0002]

【従来の技術】従来の文字認識では、高認識率追求のた
めの研究開発が行われ、例えば活字OCRでは、既に、
シングルフォントからマルチフォントまでの装置は実現
され、今後はオムニフォントへの発展が期待されてい
る。また、オンライン文字認識装置では、楷書から続け
字レベルの装置が開発され、今後は崩し字への発展が期
待されている。
2. Description of the Related Art In conventional character recognition, research and development has been conducted to pursue a high recognition rate.
Devices from single fonts to multi-fonts have been realized, and future development of omni fonts is expected. In addition, as for the online character recognition device, a character level device has been continuously developed from regular writing, and it is expected that the characters will be broken into characters in the future.

【0003】しかし、認識性能が向上してきたにもかか
わらず、基本辞書のみではユーザーの固有パターン(手
書き文字でのくせ字や略字)を高精度に認識することは
困難であり、この問題を解決するため、従来から固有パ
ターン(学習パターン)を学習させてユーザー固有の学
習辞書を用いた文字認識が用いられてきている。
However, even though the recognition performance has been improved, it is difficult to accurately recognize the user's unique pattern (handwritten characters or abbreviations) with only the basic dictionary, and this problem is solved. For this reason, conventionally, character recognition using a learning dictionary unique to a user by learning a unique pattern (learning pattern) has been used.

【0004】ところが、学習という行為を文字認識装置
に対して行なったのであるから、以降は必ずそれが(正
確にはそれに近いパターンが)正しく認識されるものと
ユーザーは期待するため、学習以前よりも認識し易くな
る程度では、実用的な方式とは言い難い。すなわち、会
話的な認識システムの場合は、ユーザーが学習パターン
に対しては100%の正解を期待するからである。従っ
て、学習辞書に対しては何らかの優先度を持たせる必要
があり、例えば、特開平1−145789号公報は、学
習辞書に登録してあるユーザーの固有パターンを優先的
に出力する技術が開示されている(従来技術1)。
However, since the act of learning is performed on the character recognition device, the user expects that it will be correctly recognized (correctly, a pattern close to it) after that. However, it is hard to say that it is a practical method if it can be easily recognized. That is, in the case of a conversational recognition system, the user expects a 100% correct answer for the learning pattern. Therefore, it is necessary to give some priority to the learning dictionary. For example, Japanese Patent Laid-Open No. 145789/1989 discloses a technique of preferentially outputting a unique pattern of a user registered in the learning dictionary. (Prior art 1).

【0005】しかしながら、学習辞書に学習パターンを
追加登録していくと同じような学習辞書パターンが次々
と作成され、かえって文字認識率を低下させるという問
題があり、これを解決するために、例えば、特開平1−
44586号公報は、登録する文字パターンが、既登録
のパターンと比較してどの程度安定に認識できるかの安
定度指標を算出、表示出力し、ユーザーの判断により登
録の有無を判断する技術が開示されている(従来技術
2)。
However, when learning patterns are additionally registered in the learning dictionary, learning dictionary patterns similar to one another are created one after another, which rather lowers the character recognition rate. To solve this problem, for example, JP-A-1-
Japanese Patent No. 44586 discloses a technique of calculating and displaying a stability index of how stable a character pattern to be registered can be recognized compared with a registered pattern, and displaying and outputting the stability index. (Prior art 2).

【0006】[0006]

【発明が解決しようとする課題】しかしながら、従来技
術1のように単に学習辞書の優先度を上げるだけでは、
誤認識弊害が発生する。
However, if the priority of the learning dictionary is simply raised as in the case of the conventional technique 1,
Misrecognition occurs.

【0007】以下、具体的に、「王」と「玉」の文字を
例にして誤認識弊害について説明する。前提として、基
本辞書の「王」の標準パターンと「玉」の標準パターン
とは文字単位のカテゴリで類似パターン(特徴点の距離
が近い)であるとします。まず、ユーザーが「王」とい
う手書き文字を入力したけれども、基本辞書では認識し
にくいので、学習辞書に学習パターンとして登録したと
する。つまり、「王」という手書き文字は、基本辞書の
「王」の標準パターンから離れているパターンです。ま
た、「王」という手書き文字は、基本辞書の「玉」の標
準パターンからも離れています。
Hereinafter, the adverse effects of misrecognition will be specifically described by taking the characters "king" and "ball" as an example. As a premise, it is assumed that the standard pattern for "king" and the standard pattern for "balls" in the basic dictionary are similar patterns (characteristic points are close in distance) in character-based categories. First, the user inputs a handwritten character "O", but it is difficult to recognize in the basic dictionary, so it is assumed that the user registered it as a learning pattern in the learning dictionary. In other words, the handwritten character "king" is a pattern that is far from the standard pattern of "king" in the basic dictionary. In addition, the handwritten character "O" is far from the standard pattern of "tama" in the basic dictionary.

【0008】従って、手書き文字「王」は学習させてい
るので、認識し易くなるのですが、手書き文字「王」に
類似する「玉」を手書き入力すると、基本辞書の「玉」
からは離れており、かつ学習辞書で類似の「王」が存在
するため、手書き文字「玉」を「王」と誤認識してしま
うという誤認識弊害が発生します。つまり、学習した文
字が基本辞書から離れていて、学習した文字の近辺で類
似文字が入力されると、誤認識弊害が発生し学習辞書に
何らかの優先順位が施してあると、より顕著になりま
す。
[0008] Therefore, since the handwritten character "king" is learned, it is easy to recognize it. However, if a "ball" similar to the handwritten character "king" is input by handwriting, "ball" in the basic dictionary is input.
It is distant from, and because there is a similar "king" in the learning dictionary, the misrecognition harmful effect that the handwritten character "ball" is mistakenly recognized as "king" occurs. In other words, if the learned character is far from the basic dictionary and a similar character is input near the learned character, misrecognition will occur and it will become more prominent if the learning dictionary has some priority. .

【0009】一方、誤認識弊害は、従来技術2では学習
すべきかどうかの判断をユーザーが行うため、ある程度
解消できるが、画一的に認識率を向上させることができ
ず、オペレーションが複雑になるという問題点がある。
On the other hand, the misrecognition adverse effect can be solved to some extent because the user determines whether or not to learn in the prior art 2, but the recognition rate cannot be uniformly improved and the operation becomes complicated. There is a problem.

【0010】本発明の目的は、ユーザーに学習の有無を
判断させることなく、認識時の誤認識弊害を最小にしつ
つ、学習辞書を優先的に使用して認識できる文字認識方
法及び文字認識装置を提供することにある。
An object of the present invention is to provide a character recognizing method and a character recognizing device capable of recognizing by preferentially using a learning dictionary while minimizing adverse effects of erroneous recognition at the time of recognition, without requiring the user to judge the presence or absence of learning. To provide.

【0011】[0011]

【課題を解決するための手段】請求項1に記載の文字認
識方法は、基本辞書及び学習辞書を用いて入力文字をカ
テゴリ単位で文字認識を行う文字認識方法において、学
習すべき文字の学習カテゴリに最も近い異種カテゴリと
の距離より短い距離を、学習すべき文字の学習辞書の確
定距離として予め設定し、文字認識時に、基本辞書及び
学習辞書を参照して入力文字からマッチング処理により
認識候補の距離を求め、該距離が上記確定距離より小さ
い時に、上記認識候補の距離を短くなるように再設定
し、再設定された距離に基づいて認識候補の順序を変更
して文字認識を行うことを特徴とする。
A character recognition method according to claim 1 is a character recognition method for recognizing an input character in units of categories using a basic dictionary and a learning dictionary. A distance shorter than the distance to the closest heterogeneous category is set in advance as the fixed distance of the learning dictionary of the character to be learned, and at the time of character recognition, the basic character dictionary and the learning dictionary are referred to and the input character is used as a candidate for recognition by matching processing. The distance is calculated, and when the distance is smaller than the fixed distance, the distance of the recognition candidate is reset so as to be shorter, and the order of the recognition candidates is changed based on the reset distance to perform character recognition. Characterize.

【0012】請求項2に記載の文字認識装置は、請求項
1に記載の文字認識方法を用いたことを特徴とする。
A character recognition device according to a second aspect is characterized by using the character recognition method according to the first aspect.

【0013】[0013]

【発明の実施の形態】図1に、基本辞書または学習辞書
に格納されたパターンと手書き入力文字の入力パターン
とのマッチング処理で、入力文字単位で文字認識を行う
手書き文字認識装置を示す。ここで、1は既存の認識シ
ステム、2はタブレット等の入力デバイス、3は標準パ
ターンが1文字単位で格納されている基本辞書、4はユ
ーザーが登録を行う学習パターンが1文字単位で格納さ
れている学習辞書、5は本発明の特徴である確定距離を
格納する確定距離バッファ、6は認識候補を格納する認
識候補バッファ、7は、入力文字の特徴抽出、文字認
識、及び確定距離計算や学習辞書の優先処理を後述の処
理で行うCPU等で構成される制御部、8は学習辞書を
優先する後述の処理に使用する汎用レジスタである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 shows a handwritten character recognition device for performing character recognition on an input character basis in a matching process between a pattern stored in a basic dictionary or a learning dictionary and an input pattern of a handwritten input character. Here, 1 is an existing recognition system, 2 is an input device such as a tablet, 3 is a basic dictionary in which standard patterns are stored in character units, and 4 is a learning pattern registered by the user in character units. Learning dictionary, 5 is a fixed distance buffer that stores a fixed distance that is a feature of the present invention, 6 is a recognition candidate buffer that stores recognition candidates, 7 is a feature extraction of an input character, character recognition, and fixed distance calculation, A control unit composed of a CPU or the like for performing the priority processing of the learning dictionary in the processing described later, and 8 is a general-purpose register used in the processing described later to prioritize the learning dictionary.

【0014】既存の認識システム1は、辞書のパターン
と入力パターンとをパターンマッチング等のマッチング
処理を行って入力文字単位で文字認識を行うための認識
処理装置や処理プログラムである。
The existing recognition system 1 is a recognition processing device or processing program for performing character matching processing such as pattern matching between a dictionary pattern and an input pattern to perform character recognition in input character units.

【0015】入力デバイス2のタブレットにペンで手書
き入力を行うと、ペン先端が接している座標から一定時
間間隔でサンプリングされ、その座標値から入力パター
ンを生成し、制御部7の働きにより、1文字単位で特徴
データが抽出される。ここで、入力デバイス2は表示一
体型のタブレットを用いることができる。
When handwriting is input to the tablet of the input device 2 with a pen, the coordinates of the tip of the pen are sampled at fixed time intervals, an input pattern is generated from the coordinate values, and the controller 7 operates to Characteristic data is extracted character by character. Here, the input device 2 may be a display-integrated tablet.

【0016】基本辞書3は標準パターンに対応した特徴
データ、学習辞書4は学習パターンに対応した特徴デー
タが格納されており、認識方式に依存するものの、例え
ば、ストローク単位に固定長分割したセグメントの方向
と長さ、部首単位の可変長分割した特徴点の座標と方
向、あるいは、翻訳OCRでは、文字の外接枠を縦横8
分割し64分割した各メッシュ内の黒画素濃度値を特徴
データとして有している。なお、基本辞書3、学習辞書
4は、それぞれパターンに対応した特徴データとその文
字コードとが組で格納されている。
The basic dictionary 3 stores the characteristic data corresponding to the standard pattern, and the learning dictionary 4 stores the characteristic data corresponding to the learning pattern. Although it depends on the recognition method, for example, a segment of fixed length is divided into stroke units. Direction and length, coordinates and directions of variable points divided by variable length in radical units, or in translation OCR, the circumscribing frame of the character is set to 8
It has the black pixel density value in each mesh which is divided into 64 as characteristic data. It should be noted that the basic dictionary 3 and the learning dictionary 4 each store a pair of characteristic data corresponding to the pattern and its character code.

【0017】入力デバイス2からの手書き入力文字の入
力パターンの特徴データは、基本辞書3または学習辞書
4に格納してある特徴データとのパターンマッチングに
より、文字認識を行い、正解コードに対応した文字を出
力する。
Characteristic data of the input pattern of the handwritten input character from the input device 2 is character-recognized by pattern matching with the characteristic data stored in the basic dictionary 3 or the learning dictionary 4, and the character corresponding to the correct code is recognized. Is output.

【0018】また、上記文字認識装置では文字単位で認
識するので、カテゴリは文字となるが、カテゴリは認識
方法の認識単位によるので、他のカテゴリでもよく、オ
ンライン文字認識では、文字をストロークや部首に分割
して認識してもよく、その場合は、カテゴリはストロー
クまたは部首となる。さらに、欧文認識では単語単位で
認識してもよく、その場合は、カテゴリは単語となりま
す。いずれにしても、認識対象の辞書と距離計算する単
位がカテゴリとなります。
Further, since the character recognition device recognizes characters in character units, the category is a character. However, since categories depend on the recognition unit of the recognition method, other categories may be used. In the online character recognition, characters are stroked or copied. It may be divided into necks for recognition, in which case the category is stroke or radical. In addition, in European language recognition, words may be recognized word by word, in which case the category will be a word. In any case, the category is the dictionary and the unit for calculating the distance.

【0019】次に、学習辞書4の確定距離計算方法につ
いて、図2乃至図4を用いて説明する。図2は確定距離
計算のフローチャートであり、図3は確定距離を求める
様子を示す模式図である。学習辞書4の確定距離は、ユ
ーザーが入力デバイス2から学習データが与えられた時
に求められ、学習辞書4に格納する学習データは、文字
認識装置に学習させたい学習パターンに対応した特徴デ
ータとその正解コード(正しく認識してもらいたい文字
コード)である。
Next, a method for calculating the defined distance of the learning dictionary 4 will be described with reference to FIGS. 2 to 4. FIG. 2 is a flowchart of the fixed distance calculation, and FIG. 3 is a schematic diagram showing how to determine the fixed distance. The fixed distance of the learning dictionary 4 is obtained when the user receives the learning data from the input device 2, and the learning data to be stored in the learning dictionary 4 includes the characteristic data corresponding to the learning pattern to be learned by the character recognition device and its characteristic data. It is the correct code (character code that you want to recognize correctly).

【0020】まず、学習データが与えられると、教師コ
ードが与えられる(ステップS1)。教師コードの入力
は、ユーザーが会話的に正解コードを入力する場合は、
これが教師コードとなり、自動学習システムのような場
合は、システムが自動的に教師コードを生成する。
First, when learning data is given, a teacher code is given (step S1). If the user interactively inputs the correct code, enter the teacher code.
This becomes a teacher code, and in the case of an automatic learning system, the system automatically generates a teacher code.

【0021】次に、学習データの特徴データに対して、
既存の認識システム1により、基本辞書4のみを用いて
マッチング処理をして認識を行い、認識候補を得る(ス
テップS2)。
Next, for the characteristic data of the learning data,
The existing recognition system 1 performs matching processing using only the basic dictionary 4 for recognition and obtains recognition candidates (step S2).

【0022】次に、ステップS2で得られた認識候補を
マッチング処理により得られた距離に基づいて走査し、
教師コードと異なるカテゴリで最小距離のもの(最近傍
異種カテゴリ)を探し出し(ステップS3)、その距離
の1/n(n>1)を確定距離とする(ステップS
4)。ここで、nは任意に設定しうる値で、本実施の形
態ではn=2とした。その様子を模式的に図3に示す。
Next, the recognition candidates obtained in step S2 are scanned based on the distance obtained by the matching process,
A category different from the teacher code and having the smallest distance (nearest neighbor heterogeneous category) is searched (step S3), and 1 / n (n> 1) of the distance is set as the definite distance (step S).
4). Here, n is a value that can be set arbitrarily, and n = 2 in the present embodiment. This is schematically shown in FIG.

【0023】次に、学習辞書作成(ステップS5)のた
めに、学習辞書4のバッファに学習パターンの特徴デー
タとその正解コードを格納すると共に、この学習パター
ンに対する確定距離を確定距離バッファ5に格納する
(ステップS6)。確定距離バッファ5は学習辞書数分
ある距離値バッファで、その数と容量は文字認識装置に
よる。本実施の形態では、学習辞書数が128、1学習
辞書当たり1バイトであるから128バイトのバッファ
である。以上で、学習データを与えた時に作成される学
習辞書の確定距離の計算を終了する。
Next, in order to create a learning dictionary (step S5), the characteristic data of the learning pattern and its correct answer code are stored in the buffer of the learning dictionary 4, and the fixed distance for this learning pattern is stored in the fixed distance buffer 5. Yes (step S6). The fixed-distance buffer 5 is a distance value buffer for the number of learning dictionaries, and the number and capacity thereof depend on the character recognition device. In the present embodiment, the number of learning dictionaries is 128, and since one learning dictionary is 1 byte, it is a buffer of 128 bytes. This is the end of the calculation of the definite distance of the learning dictionary created when the learning data is given.

【0024】図4は、基本辞書を白丸、学習辞書を黒丸
として、カテゴリごとに2次元に模式的にプロットした
様子を示す。本発明の確定距離は、基本辞書が密集して
いる領域では小さく、基本辞書が遠くにある領域では大
きくなる。また、個々の学習辞書の確定距離は、それぞ
れの最近傍異種カテゴリとの距離を下回る値であるた
め、この確定距離内には異種カテゴリ辞書の混入がな
く、基本辞書への弊害が発生しない領域が学習辞書毎に
設定される。
FIG. 4 shows a state in which the basic dictionary is a white circle and the learning dictionary is a black circle, and two-dimensionally plotted for each category. The defined distance of the present invention is small in an area where the basic dictionaries are dense and large in an area where the basic dictionaries are distant. Further, since the fixed distance of each learning dictionary is a value less than the distance between each of the nearest heterogeneous categories, there is no mixture of heterogeneous category dictionaries within this fixed distance, and there is no adverse effect on the basic dictionary. Is set for each learning dictionary.

【0025】次に、誤認識弊害を防止するために、確定
距離が設定された学習辞書4の優先使用方法について図
5及び図6を用いて説明する。図5に、学習辞書の優先
使用方法のフローチャートを示す。
Next, a method of prioritizing the use of the learning dictionary 4 in which the fixed distance is set in order to prevent the adverse effect of erroneous recognition will be described with reference to FIGS. 5 and 6. FIG. 5 shows a flowchart of a method of preferentially using the learning dictionary.

【0026】まず、未知の入力文字に対して、基本辞書
3及び学習辞書4を用いて認識処理を行い、認識候補バ
ッファ6に認識候補を得る(ステップS11)。図6に
示すように、認識候補ごとに、各候補の文字コード、辞
書番号、未知の入力文字と基本辞書3または学習辞書4
とのマッチング計算の結果求めた距離、基本辞書3か学
習辞書4かの辞書の区別フラグの情報を含み、距離が短
い順に、認識候補が並べられる。認識候補バッファ6
は、通常、基本辞書3と学習辞書4が混在した構成であ
る。
First, a recognition process is performed on an unknown input character using the basic dictionary 3 and the learning dictionary 4, and a recognition candidate is obtained in the recognition candidate buffer 6 (step S11). As shown in FIG. 6, for each recognition candidate, the character code of each candidate, the dictionary number, the unknown input character and the basic dictionary 3 or the learning dictionary 4
The recognition candidates are arranged in ascending order of distance, including the distance obtained as a result of the matching calculation with and the information of the discrimination flag of the dictionary of the basic dictionary 3 or the learning dictionary 4. Recognition candidate buffer 6
Usually has a configuration in which the basic dictionary 3 and the learning dictionary 4 are mixed.

【0027】次に、得られた認識候補を走査して、区別
フラグにより学習辞書にヒットした候補かどうか判定
(基本辞書か学習辞書かの区別)する(ステップS1
2)。基本辞書の場合、区別フラグにより、次の認識候
補にスキップする。学習辞書の場合、認識候補バッファ
6の距離が対応する学習辞書の確定距離未満か否か判定
する(ステップS13)。
Next, the obtained recognition candidates are scanned, and it is determined whether they are candidates that hit the learning dictionary by the discrimination flag (discrimination between basic dictionary and learning dictionary) (step S1).
2). In the case of the basic dictionary, the discrimination flag is used to skip to the next recognition candidate. In the case of a learning dictionary, it is determined whether the distance of the recognition candidate buffer 6 is less than the fixed distance of the corresponding learning dictionary (step S13).

【0028】次に、認識候補バッファ6の距離が確定距
離以上の場合は、次の認識候補へスキップする。認識候
補バッファ6の距離が確定距離未満の場合は、その距離
にある重み(w)を乗じた値(ステップS14)を新距
離として認識候補バッファ6に格納して次の認識候補へ
移る。この重み(w)は学習辞書を優先するための重み
で、任意に設定しうる値であり、本実施の形態ではw=
0.5である。
Next, when the distance of the recognition candidate buffer 6 is equal to or larger than the fixed distance, the process skips to the next recognition candidate. If the distance in the recognition candidate buffer 6 is less than the fixed distance, the value obtained by multiplying the distance by the weight (w) (step S14) is stored in the recognition candidate buffer 6 as a new distance, and the process moves to the next recognition candidate. This weight (w) is a weight for giving priority to the learning dictionary, and is a value that can be set arbitrarily, and in this embodiment, w =
It is 0.5.

【0029】全ての認識候補に対して同様の処理を行っ
た後、再度、認識候補バッファ6の距離により、基本辞
書及び学習辞書を含めて認識候補のソーティングを行な
い(ステップ15)、距離の短い順に並びかえられる。
After performing the same processing on all recognition candidates, the recognition candidates including the basic dictionary and the learning dictionary are sorted again by the distance of the recognition candidate buffer 6 (step 15), and the distance is short. Can be rearranged in order.

【0030】以上の処理により、学習辞書に対応した認
識候補を優先的に得ることができる。
By the above processing, the recognition candidates corresponding to the learning dictionary can be preferentially obtained.

【0031】なお、以上の説明では認識尺度として距離
を用いたが、距離の他にも類似度を用いる認識手法を用
いることもできる。また、OCR、オンライン、音声な
どを入力として用いることができ、これらの入力に対し
て学習機能を有する認識装置であれば、本発明を適用で
きる。
Although the distance is used as the recognition scale in the above description, a recognition method using the similarity in addition to the distance may be used. Further, the present invention can be applied to any recognition device that can use OCR, online, voice, etc. as inputs and has a learning function for these inputs.

【0032】[0032]

【発明の効果】以上説明したように、本発明によれば、
ユーザーが個別に判断するのでなく、自動的に基本辞書
への弊害を最小にしつつ、学習辞書を優先的に文字認識
に使用できる。
As described above, according to the present invention,
The learning dictionary can be preferentially used for character recognition while automatically minimizing the adverse effect on the basic dictionary instead of making individual judgments by the user.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係る文字認識装置を示す図である。FIG. 1 is a diagram showing a character recognition device according to the present invention.

【図2】本発明に係る確定距離計算のフローチャートで
ある。
FIG. 2 is a flowchart of a fixed distance calculation according to the present invention.

【図3】学習辞書の確定距離計算の様子を説明するため
の図である。
FIG. 3 is a diagram for explaining how to determine a fixed distance in a learning dictionary.

【図4】学習辞書の確定距離の概念を説明するための図
である。
FIG. 4 is a diagram for explaining the concept of a fixed distance in a learning dictionary.

【図5】学習辞書を優先的に認識候補とするためのフロ
ーチャートである。
FIG. 5 is a flowchart for prioritizing a learning dictionary as a recognition candidate.

【図6】認識候補バッファの構造を示す図である。FIG. 6 is a diagram showing a structure of a recognition candidate buffer.

【符号の説明】[Explanation of symbols]

1 既存の認識システム 2 入力デバイス 3 基本辞書 4 学習辞書 5 確定距離バッファ 6 認識候補バッファ 7 制御部 8 汎用レジスタ 1 Existing recognition system 2 Input device 3 Basic dictionary 4 Learning dictionary 5 Definite distance buffer 6 Recognition candidate buffer 7 Control unit 8 General-purpose register

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 基本辞書及び学習辞書を用いて入力文字
を所定のカテゴリ単位で文字認識を行う文字認識方法に
おいて、 学習すべき文字の学習カテゴリに最も近い異種カテゴリ
との距離より短い距離を、学習すべき文字の学習辞書の
確定距離として予め設定し、 文字認識時に、基本辞書及び学習辞書を参照して入力文
字からマッチング処理により認識候補の距離を求め、該
距離が上記確定距離より小さい時に、上記認識候補の距
離を短くなるように再設定し、再設定された距離に基づ
いて認識候補の順序を変更して文字認識を行うことを特
徴とする文字認識方法。
1. A character recognition method for recognizing an input character in a predetermined category unit using a basic dictionary and a learning dictionary, wherein a distance shorter than a distance between a learning category of a character to be learned and a different category is It is set in advance as the fixed distance of the learning dictionary of the character to be learned, and at the time of character recognition, the distance of the recognition candidate is found by the matching process from the input characters by referring to the basic dictionary and the learning dictionary. When the distance is smaller than the fixed distance A character recognition method characterized in that the distance of the recognition candidates is reset so as to be short, and the order of the recognition candidates is changed based on the reset distance for character recognition.
【請求項2】 請求項1に記載の文字認識方法を用いた
ことを特徴とする文字認識装置。
2. A character recognition device using the character recognition method according to claim 1.
JP8061262A 1996-03-18 1996-03-18 Method and device for recognizing character Pending JPH09251517A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8061262A JPH09251517A (en) 1996-03-18 1996-03-18 Method and device for recognizing character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8061262A JPH09251517A (en) 1996-03-18 1996-03-18 Method and device for recognizing character

Publications (1)

Publication Number Publication Date
JPH09251517A true JPH09251517A (en) 1997-09-22

Family

ID=13166152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8061262A Pending JPH09251517A (en) 1996-03-18 1996-03-18 Method and device for recognizing character

Country Status (1)

Country Link
JP (1) JPH09251517A (en)

Similar Documents

Publication Publication Date Title
CN109614944B (en) Mathematical formula identification method, device, equipment and readable storage medium
KR100297482B1 (en) Method and apparatus for character recognition of hand-written input
JP3155577B2 (en) Character recognition method and device
TWI435276B (en) A method and apparatus for recognition of handwritten symbols
US5751851A (en) Method of splitting handwritten input
JPH07105316A (en) Handwritten-symbol recognition apparatus
WO2021208617A1 (en) Method and apparatus for recognizing station entering and exiting, terminal, and storage medium
JPH05135207A (en) Character recognition method and device
JP3155616B2 (en) Character recognition method and device
US5940532A (en) Apparatus for and method of recognizing hand-written characters
Husain et al. Online Urdu Character Recognition System.
CN113673432A (en) Handwriting recognition method, touch display device, computer device and storage medium
CN114612911B (en) Stroke-level handwritten character sequence recognition method, device, terminal and storage medium
US6208756B1 (en) Hand-written character recognition device with noise removal
JPH09251517A (en) Method and device for recognizing character
KR19980058361A (en) Korean Character Recognition Method and System
JP2956094B2 (en) Handwritten character recognition device
JP2953162B2 (en) Character recognition device
JPH11126236A (en) Device and method for on-line handwritten character recognition, and recording medium where the same method is recorded
JP2972443B2 (en) Character recognition device
JPH03126188A (en) Character recognizing device
JPH04337890A (en) Device for recognizing on-line handwritten character
CN114708581A (en) Image processing method and device, electronic equipment and storage medium
JP2851865B2 (en) Character recognition device
JPH04337892A (en) System for reading pattern

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060804

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060905