JP2002222388A - Device and method for character recognition - Google Patents

Device and method for character recognition

Info

Publication number
JP2002222388A
JP2002222388A JP2001018896A JP2001018896A JP2002222388A JP 2002222388 A JP2002222388 A JP 2002222388A JP 2001018896 A JP2001018896 A JP 2001018896A JP 2001018896 A JP2001018896 A JP 2001018896A JP 2002222388 A JP2002222388 A JP 2002222388A
Authority
JP
Japan
Prior art keywords
recognition
pattern
character
registered
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001018896A
Other languages
Japanese (ja)
Inventor
Katsuhiko Akiyama
勝彦 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001018896A priority Critical patent/JP2002222388A/en
Publication of JP2002222388A publication Critical patent/JP2002222388A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a device and method for character recognition which enable update of the contents of a recognition dictionary according to the recognition result of an inputted handwritten character pattern. SOLUTION: The handwritten character pattern is inputted and the recognition dictionary with standard patterns registered therein in the order of using frequency is referred to about the handwritten character pattern to recognize the pattern as a character. The result of recognition is outputted to judge whether the recognition is correct or not based on the result of recognition. In the case of judging the recognition to be correct, the result of recognition is defined to be a recognized character. In the case of judging the recognition to be wrong, re-input is quickened. In the case of judging the recognition to be correct, the recognition dictionary is updated so as to turn the corresponding standard pattern registered in the recognition dictionary to be a standard pattern which is the highest concerning the using frequency order.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、手書き文字パター
ンを文字として認識するための文字認識装置及びその方
法に関する。特に、入力者個人に適応した辞書を自動的
に生成する手書き文字パターンを認識するための文字認
識装置及びその方法に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a character recognition apparatus and method for recognizing a handwritten character pattern as a character. In particular, the present invention relates to a character recognition device and a method for recognizing a handwritten character pattern that automatically generates a dictionary adapted to an input person.

【0002】[0002]

【従来の技術】昨今のコンピュータ技術の急速な発展に
伴い、コンピュータシステムへ文字列を入力する方法と
して、キーボードから文字を入力する方法等の一般的な
入力方法に加えて、手書き文字入力が一般的になりつつ
ある。
2. Description of the Related Art With the rapid development of computer technology in recent years, as a method of inputting a character string to a computer system, in addition to a general input method such as a method of inputting characters from a keyboard, a handwritten character input method is generally used. It is becoming more and more.

【0003】従来の手書き文字入力においては、手書き
文字パターンを認識するための認識辞書を照合して、手
書き文字パターンが認識辞書に登録されている文字パタ
ーンと一致するか、あるいは類似する場合に当該文字と
して認識している。そして、入力者の癖等によっては誤
認識が発生する手書き文字パターンも相違することか
ら、入力者個々に適応した認識辞書として認識精度を向
上させるべく、誤認識した手書き文字パターンについて
も認識辞書に登録するようにしている。
In conventional handwritten character input, a recognition dictionary for recognizing a handwritten character pattern is collated, and if the handwritten character pattern matches or is similar to a character pattern registered in the recognition dictionary. Recognized as characters. Since handwritten character patterns in which erroneous recognition occurs vary depending on the habits of the input user, etc., in order to improve recognition accuracy as a recognition dictionary adapted to each input user, erroneously recognized handwritten character patterns are also stored in the recognition dictionary. I try to register.

【0004】しかし、このような方法においては、認識
辞書に登録されている文字パターンが必要であるか否か
について判断される機会が無く、一度認識辞書に文字パ
ターンとして登録されてしまうと、後日他の手書き文字
パターンの認識に全く役に立たない文字パターンについ
ても残存してしまう結果となる。これは記憶容量に制限
があるというハードウェア的制限の観点からも、真に認
識辞書の認識精度の向上に役立つ文字パターンの記憶容
量を圧迫し、認識辞書の認識精度の限界を低めてしまう
のみならず、却って誤認識を発生させてしまう原因とも
なりうる。
However, in such a method, there is no opportunity to determine whether or not a character pattern registered in the recognition dictionary is necessary. As a result, a character pattern completely useless for recognition of another handwritten character pattern remains. From the viewpoint of hardware limitations that the storage capacity is limited, this only puts pressure on the storage capacity of character patterns that really helps to improve the recognition accuracy of the recognition dictionary, and lowers the limit of recognition accuracy of the recognition dictionary. Instead, it can be a cause of erroneous recognition.

【0005】かかる問題に対処するべく、種々の方策が
考えられている。例えば特開平7−49951号公報に
おいては、正しく文字を認識することに寄与した文字パ
ターンについては有効度を上げ、誤認識された文字パタ
ーンについては有効度を下げる方法が開示されている。
そして、有効度がある水準以下となった場合には当該文
字パターンを認識辞書から削除等することによって、認
識辞書の容量制限に関する問題をも解消しようとするも
のである。
[0005] To cope with such a problem, various measures have been considered. For example, Japanese Patent Application Laid-Open No. 7-49951 discloses a method of increasing the validity of a character pattern that has contributed to character recognition correctly, and decreasing the validity of a character pattern that is erroneously recognized.
Then, when the validity falls below a certain level, the character pattern is deleted from the recognition dictionary and the like, so as to solve the problem relating to the capacity limitation of the recognition dictionary.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、特開平
7−49951号公報に開示されている方法では、認識
辞書への登録数の上限に対して何ら考慮されておらず、
有効度が高いと判断される文字パターン数が膨大な数と
なってしまうと、認識辞書のサイズが大きくなり、計算
機リソースを大量に消費することになるので、PDA
(Personal DigitalAssistant)等の小型の端末におけ
るオンラインペン入力による手書き文字の認識等には物
理的に対応できないという問題点や処理速度の低下の原
因にもなりうるという問題点があった。
However, in the method disclosed in Japanese Patent Laid-Open No. 7-49951, no consideration is given to the upper limit of the number of registrations in the recognition dictionary.
If the number of character patterns determined to have high validity becomes enormous, the size of the recognition dictionary increases, which consumes a large amount of computer resources.
(Personal Digital Assistant) and the like, there is a problem that it is not possible to physically cope with recognition of handwritten characters by online pen input in a small terminal, and there is a problem that it may cause a reduction in processing speed.

【0007】また、有効度が各文字パターンについてユ
ニークであれば有効度の低い順に認識辞書から削除する
という方法も有効と考えられるが、実際には有効度が等
しい値を有する文字パターンが複数個発生することが多
い現状を鑑みれば、どの文字パターンを削除するべきか
適正に判断できない場合も予想され、現実的な解決方法
とはなり得ない。
If the validity is unique for each character pattern, it is considered effective to delete the characters from the recognition dictionary in ascending order of validity. In practice, however, a plurality of character patterns having the same value are effective. In view of the current situation that often occurs, it is expected that it may not be possible to properly determine which character pattern should be deleted, and this cannot be a practical solution.

【0008】さらに、認識の正誤によって増減する有効
度に基づく辞書管理を行う場合、一般には入力者の経年
変化を考慮することがない。すなわち、入力者の書く文
字の字体については経年変化を生じる可能性もあり、入
力する際に急いでいるとか、手を負傷しているために上
手く書けない等の状況の相違によっても字体は変化する
ものと考えられる。かかる字体の変化を考慮することな
く手書き文字パターンの認識を行うと、本来有効である
はずの文字パターンであっても誤認識が生じた文字パタ
ーンであると判断されたり、一度有効度が高い文字パタ
ーンであると判断された一時的に字体の変化した文字パ
ターンが削除されにくく、その後あまり用いられる機会
のない文字パターンが認識辞書に登録されてしまうこと
から、かかる文字パターンの存在によって認識辞書の容
量が圧迫される等の問題点があった。
Furthermore, when dictionary management is performed based on the degree of effectiveness that increases or decreases depending on whether the recognition is correct or not, generally, the aging of the input person is not considered. In other words, the font of the character written by the input person may change over time, and the font may also change due to differences in circumstances such as rushing when inputting or writing poorly due to injury to the hand. It is thought to be. If the handwritten character pattern is recognized without considering such a change in the font, even if the character pattern is supposed to be valid, it is determined to be a character pattern in which misrecognition has occurred, or if the character pattern has once high validity. It is difficult to delete the temporarily changed character pattern that is determined to be a pattern, and character patterns that are rarely used later are registered in the recognition dictionary. There were problems such as the capacity being compressed.

【0009】本発明は、上記問題点を解消すべく、入力
される手書き文字パターンに応じて認識辞書の内容を更
新することで、常に入力者に適応して手書き文字を認識
することができる文字認識装置及びその方法を提供する
ことを目的とする。
In order to solve the above-mentioned problems, the present invention updates the contents of the recognition dictionary according to the input handwritten character pattern, so that the character which can always recognize the handwritten character adaptively to the input user. An object of the present invention is to provide a recognition device and a method thereof.

【0010】[0010]

【課題を解決するための手段】上記目的を達成するため
に本発明にかかる文字認識装置は、手書き文字パターン
を入力する手書き文字パターン入力部と、手書き文字パ
ターンについて、使用頻度順に標準パターンを登録して
いる認識辞書を照会することで文字として認識する文字
認識部と、認識した結果を出力する認識結果出力部と、
認識結果出力部における認識結果に基づいて正しい認識
が行われたか否かを判定する認識正誤判定部と、認識正
誤判定部において、正しい認識が行われたと判定された
場合、認識結果を認識文字として確定する認識確定部
と、認識正誤判定部において、誤った認識が行われたと
判定された場合、再入力を促す再入力促進部とを含み、
認識正誤判定部において正しい認識が行われたと判定さ
れた場合には、認識辞書に登録されている対応する標準
パターンを使用頻度順位が最も高い標準パターンとする
ように認識辞書を更新することを特徴とする。
In order to achieve the above object, a character recognition apparatus according to the present invention registers a handwritten character pattern input section for inputting a handwritten character pattern, and registers a standard pattern for the handwritten character pattern in use frequency order. A character recognition unit that recognizes as a character by referring to a recognition dictionary that is performing, a recognition result output unit that outputs a recognition result,
A recognition correctness / error judgment unit that determines whether or not correct recognition has been performed based on the recognition result in the recognition result output unit; and a recognition correctness / error determination unit that determines that the correct recognition has been performed. In the recognition determination unit to be determined, in the recognition correctness determination unit, if it is determined that erroneous recognition has been performed, including a re-input promotion unit to prompt re-input,
When the recognition correct / incorrect judgment unit determines that correct recognition has been performed, the recognition dictionary is updated so that the corresponding standard pattern registered in the recognition dictionary is used as the standard pattern having the highest use frequency order. And

【0011】かかる構成により、入力される手書き文字
パターンに対応した正しい標準パターンについて、認識
辞書の内部で使用頻度の高い順に登録することができる
ことから、使用者にとって効率の良い文字認識を行うこ
とが可能となる。
[0011] With this configuration, the correct standard pattern corresponding to the input handwritten character pattern can be registered in the recognition dictionary in the order of frequency of use, so that efficient character recognition can be performed for the user. It becomes possible.

【0012】また、本発明にかかる文字認識装置は、再
入力促進部において、認識結果として出力された認識辞
書に登録されている標準パターンの誤認頻度度数を累積
加算し、誤認頻度度数が所定のしきい値を超えた場合に
は、認識結果として出力された標準パターンを認識辞書
から削除する標準パターン削除部をさらに含むことが好
ましい。文字認識に効果がないと考えられる標準パター
ンを認識辞書から削除できることから、認識辞書の容量
を際限なく増大させることなく、適当な容量の認識辞書
において最大の認識効果を挙げることができるからであ
る。
Further, in the character recognition device according to the present invention, the re-input facilitating section accumulatively adds the misrecognition frequency of the standard pattern registered in the recognition dictionary output as a recognition result, and the re-recognition frequency is set to a predetermined value. It is preferable to further include a standard pattern deletion unit that deletes the standard pattern output as a recognition result from the recognition dictionary when the threshold value is exceeded. This is because a standard pattern that is considered to have no effect on character recognition can be deleted from the recognition dictionary, so that the maximum recognition effect can be obtained in a recognition dictionary having an appropriate capacity without increasing the capacity of the recognition dictionary endlessly. .

【0013】また、本発明にかかる文字認識装置は、認
識辞書に登録されている文字パターンと入力された手書
き文字パターンに基づいて変形パターンを生成して、新
たに認識辞書に登録する変形パターン生成・登録部と、
変形パターンを生成することが妥当であるか否かについ
て判定する変形妥当性判定部とをさらに含み、認識正誤
判定部において誤った認識が行われたと判定された場合
には、変形妥当性判定部において変形パターンを生成す
ることが妥当でないと判定した場合には変形パターンの
生成を許可せず、変形パターンを生成することが妥当で
あると判定した場合には、変形パターン生成・登録部に
おいて変形パターンを生成するとともに、認識辞書に使
用頻度順位が最も高い標準パターンとして登録すること
が好ましい。
A character recognition apparatus according to the present invention generates a deformation pattern based on a character pattern registered in a recognition dictionary and an input handwritten character pattern, and newly registers the deformation pattern in the recognition dictionary.・ Registration department,
A modification validity determination unit that determines whether it is appropriate to generate the deformation pattern; and a modification validity determination unit when the recognition correctness determination unit determines that erroneous recognition has been performed. If it is determined that the generation of the deformation pattern is not appropriate, the generation of the deformation pattern is not permitted, and if it is determined that the generation of the deformation pattern is appropriate, the generation of the deformation pattern is performed by the deformation pattern generation / registration unit. It is preferable to generate a pattern and register it as a standard pattern having the highest use frequency order in the recognition dictionary.

【0014】かかる構成により、入力される手書き文字
パターンに応じて、随時誤認識を生じないよう変形パタ
ーンが生成・登録されていくことから、手書き文字パタ
ーンを入力すればするほど誤認識が生ずるおそれの少な
い認識辞書に更新されることになり、入力者が入力する
手書き文字パターンに最適な文字認識を行うことが可能
となる。
With this configuration, since a deformed pattern is generated and registered in accordance with an input handwritten character pattern so as not to cause erroneous recognition at any time, the more the handwritten character pattern is input, the more erroneous recognition may occur. Thus, the recognition dictionary is updated to the one with less number of characters, so that it is possible to perform optimal character recognition for the handwritten character pattern input by the input person.

【0015】また、本発明にかかる文字認識装置は、変
形パターン生成・入力部において、入力された手書き文
字パターンとは異なる手書き文字パターンと変形パター
ンとの間の類似度が、異なる手書き文字パターンと認識
辞書に登録されている異なる手書き文字パターンに対応
する文字パターンとの間の類似度よりも低くなるように
変形パターンを生成することが好ましい。このような変
形パターンを生成・登録しなければ、手書き文字パター
ンの誤認識を解消することができないからである。
Further, in the character recognition device according to the present invention, the similarity between the handwritten character pattern different from the input handwritten character pattern and the deformed pattern may be different in the deformed pattern generation / input unit. It is preferable to generate a deformed pattern so as to have a lower similarity than a character pattern corresponding to a different handwritten character pattern registered in the recognition dictionary. This is because erroneous recognition of a handwritten character pattern cannot be eliminated unless such a deformation pattern is generated and registered.

【0016】また、本発明にかかる文字認識装置は、変
形パターン生成・登録部において、変形パターン登録時
に認識辞書の標準パターンの登録可能最大数を超える場
合には、認識辞書における最後尾の標準パターンを削除
することが好ましい。一定数以上の標準パターンを認識
辞書に登録しないように制限できることから、認識辞書
の容量を増大させることなく、適当な容量の認識辞書に
おいて最大の認識効果を挙げることができるからであ
る。
Further, in the character recognition device according to the present invention, if the number of standard patterns that can be registered in the recognition dictionary exceeds the maximum number of standard patterns that can be registered at the time of registration of the deformation pattern, the last standard pattern in the recognition dictionary is used. Is preferably deleted. This is because it is possible to restrict a certain number or more of standard patterns from being registered in the recognition dictionary, so that the maximum recognition effect can be obtained in a recognition dictionary having an appropriate capacity without increasing the capacity of the recognition dictionary.

【0017】また、本発明は、上記のような文字列入力
装置の機能をコンピュータの処理ステップとして実行す
るソフトウェアを特徴とするものであり、具体的には、
手書き文字パターンを入力する工程と、手書き文字パタ
ーンについて、使用頻度順に標準パターンを登録してい
る認識辞書を照会することで文字として認識する工程
と、認識した結果を出力する工程と、認識した結果に基
づいて正しい認識が行われたか否かを判定する工程と、
正しい認識が行われたと判定された場合、認識結果を認
識文字として確定する工程と、誤った認識が行われたと
判定された場合、再入力を促す工程とを含み、正しい認
識が行われたか否かを判定する工程において、正しい認
識が行われたと判定された場合には、認識辞書に登録さ
れている対応する標準パターンを使用頻度順位が最も高
い標準パターンとするように認識辞書を更新する文字認
識方法並びにそのような工程を具現化したプログラム、
あるいはそのような工程をプログラムとして記録したコ
ンピュータ読み取り可能な記録媒体であることを特徴と
する。
The present invention is also characterized by software that executes the functions of the character string input device as described above as processing steps of a computer.
A step of inputting a handwritten character pattern; a step of recognizing the handwritten character pattern as a character by referring to a recognition dictionary in which standard patterns are registered in order of use frequency; a step of outputting a recognized result; Determining whether correct recognition has been performed based on
If it is determined that correct recognition has been performed, a step of determining the recognition result as a recognition character, and if it is determined that incorrect recognition has been performed, a step of prompting re-input is performed. If it is determined in the step of determining whether or not correct recognition has been performed, a character for updating the recognition dictionary so that the corresponding standard pattern registered in the recognition dictionary is used as the standard pattern having the highest frequency of use. A recognition method and a program embodying such a process,
Alternatively, the present invention is characterized in that it is a computer-readable recording medium in which such a process is recorded as a program.

【0018】かかる構成により、コンピュータ上へ当該
プログラムをロードさせ実行することで、入力される手
書き文字パターンに対応した正しい標準パターンについ
て、認識辞書の内部で使用頻度の高い順に登録すること
ができることから、使用者にとって効率の良い文字認識
を行うことができる文字認識装置を実現することが可能
となる。
With this configuration, by loading and executing the program on the computer, the correct standard pattern corresponding to the input handwritten character pattern can be registered in the recognition dictionary in descending order of use frequency. Thus, it is possible to realize a character recognition device capable of performing efficient character recognition for a user.

【0019】[0019]

【発明の実施の形態】以下、本発明の実施の形態にかか
る文字認識装置について、図面を参照しながら説明す
る。図1は、本発明の実施の形態にかかる文字認識装置
の構成図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a character recognition device according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a configuration diagram of a character recognition device according to an embodiment of the present invention.

【0020】図1において、1は手書き文字パターン入
力部を、2は文字認識部を、3は認識正誤判定部を、4
は認識確定部を、5は再入力促進部を、6は変形パター
ン生成・登録部を、7は変形妥当性判定・制御部を、8
は認識文字を出力する認識文字出力部を、それぞれ示
す。また、11は標準の手書き文字パターンを登録する
認識辞書である。
In FIG. 1, 1 is a handwritten character pattern input unit, 2 is a character recognition unit, 3 is a recognition correct / wrong judgment unit,
Is a recognition determination unit, 5 is a re-input promotion unit, 6 is a deformation pattern generation / registration unit, 7 is a deformation validity determination / control unit, 8
Indicates a recognized character output unit for outputting a recognized character. Reference numeral 11 denotes a recognition dictionary for registering standard handwritten character patterns.

【0021】図1において、まず手書き文字パターン入
力部1から、入力者による手書き文字のイメージデータ
が文字パターンとして入力される。手書き文字パターン
入力部1としては、例えばペン型タブレットやマウス等
のような入力媒体が一般的であるが、特にこれに限定さ
れるものではなく、スキャナ等を通じてラスタ/ベクト
ル変換を行ったデータとして入力されるものであっても
良い。
In FIG. 1, first, image data of a handwritten character by an input user is input from a handwritten character pattern input unit 1 as a character pattern. As the handwritten character pattern input unit 1, for example, an input medium such as a pen tablet or a mouse is generally used. However, the input medium is not particularly limited thereto. It may be input.

【0022】次に、手書き文字パターン入力部1から入
力された手書き文字パターンに基づいて、文字認識部2
において、標準の手書き文字パターン(以下「標準パタ
ーン」という。)を事前に登録してある認識辞書11を
照会する。入力された文字パターンと標準パターンとの
照合は、両パターン間の類似度を算出することによって
行われる。
Next, based on the handwritten character pattern input from the handwritten character pattern input unit 1, a character recognition unit 2
, A reference is made to a recognition dictionary 11 in which a standard handwritten character pattern (hereinafter, referred to as a “standard pattern”) is registered in advance. The comparison between the input character pattern and the standard pattern is performed by calculating the similarity between the two patterns.

【0023】ここで、類似度とは、2つのパターン間の
対応する各点についてのユークリッド距離等に基づいて
定められる両パターンの類似の度合を示す指標であり、
類似度が高い標準パターンほど入力された手書き文字パ
ターンに類似しているものと判断される。
Here, the similarity is an index indicating the degree of similarity between the two patterns, which is determined based on the Euclidean distance or the like at each corresponding point between the two patterns.
It is determined that the standard pattern having a higher similarity is more similar to the input handwritten character pattern.

【0024】そして、類似度が所定のしきい値より高い
標準パターンについて、類似度の高い順に分類して、最
も類似度の高い標準パターンに該当する文字を認識文字
として認識文字出力部8から出力することになる。
Then, the standard patterns having a similarity higher than a predetermined threshold value are classified in the descending order of the similarity, and a character corresponding to the standard pattern having the highest similarity is output from the recognized character output unit 8 as a recognized character. Will do.

【0025】次に、認識正誤判定部3において、認識文
字出力部8において出力された認識結果について正しく
認識されているか否かについて判定する。具体的には表
示出力されている認識結果を利用者が確認して、正しい
認識結果であればその旨を、また誤った認識結果であれ
ば再入力を促すメッセージ等を出力することになる。
Next, the recognition correct / wrong determining unit 3 determines whether or not the recognition result output from the recognized character output unit 8 is correctly recognized. Specifically, the user checks the displayed recognition result and outputs a message indicating that the recognition result is correct if the recognition result is correct, and a message prompting re-input if the recognition result is incorrect.

【0026】そして認識結果が正しいと判定された場合
には、認識確定部4において、認識された文字に対応す
る標準パターンを認識辞書の標準パターン群において抽
出順序の先頭に移動、すなわち類似の文字パターンとし
て最優先に抽出される文字パターンとして更新するとと
もに、認識文字として確定する。
If it is determined that the recognition result is correct, the recognition determining unit 4 moves the standard pattern corresponding to the recognized character to the head of the extraction order in the standard pattern group of the recognition dictionary, that is, the similar character. The character pattern is extracted as a pattern extracted with the highest priority and is determined as a recognized character.

【0027】標準パターンの並べ替えは、以下の手順に
よって行われる。まず、認識辞書11に登録されている
標準パターンは、図2に示すように使用頻度の最も高い
パターンから順に並べられる。ここで使用頻度とは、長
期間における統計的数値より求めるものを考えるのでは
なく、最近における所定の限定された期間内におけるも
のを意味している。したがって、以前に良く用いられて
いた標準パターンであっても、最近用いられなくなって
いれば使用頻度は低いものと判断されることになる。こ
うすることによって、利用形態の経年変化に柔軟に対応
することが可能となる。
The rearrangement of the standard patterns is performed according to the following procedure. First, the standard patterns registered in the recognition dictionary 11 are arranged in order from the pattern with the highest frequency of use, as shown in FIG. Here, the use frequency does not mean a value obtained from a statistical value over a long period of time, but means a value within a predetermined limited period in recent years. Therefore, even if the standard pattern has been frequently used before, if the standard pattern has not been used recently, it is determined that the frequency of use is low. By doing so, it is possible to flexibly cope with the secular change of the use form.

【0028】そして、認識正誤判定部3において認識結
果が正しいと判定された場合には、図3に示すように、
以前に登録されていて認識辞書11に残っている標準パ
ターンの中に正しく認識することに寄与する標準パター
ンAが存在していれば、当該標準パターンAを認識辞書
11の先頭に移動する。すなわち、最も使用頻度が高い
標準パターンとして標準パターンAを位置付けることに
なる。
If the recognition correct / wrong determining unit 3 determines that the recognition result is correct, as shown in FIG.
If there is a standard pattern A that has been registered before and contributes to correct recognition among the standard patterns remaining in the recognition dictionary 11, the standard pattern A is moved to the head of the recognition dictionary 11. That is, the standard pattern A is positioned as the most frequently used standard pattern.

【0029】その結果、認識辞書11に登録されている
他の標準パターンについては、当該標準パターンよりも
使用頻度が高い標準パターン、すなわち図3における領
域Bに含まれる標準パターンについては使用頻度順位が
1つ下がり、使用頻度が低かった標準パターン、すなわ
ち図3における領域Cに含まれる標準パターンについて
は何ら変更されないことになる。したがって、最近使用
された標準パターンから順に認識辞書11が並べ替えら
れることになる。
As a result, with respect to the other standard patterns registered in the recognition dictionary 11, the standard patterns used more frequently than the standard patterns, that is, the standard patterns included in the area B in FIG. The standard pattern that has been used one less frequently, ie, the standard pattern included in the area C in FIG. 3, is not changed at all. Therefore, the recognition dictionaries 11 are rearranged in order from the recently used standard pattern.

【0030】一方、認識正誤判定部3において認識結果
が誤りであると判定された場合には、図4に示すよう
に、最終的には入力された文字パターンに基づいて生成
される後述する変形パターンDが認識辞書11の先頭に
登録される。そして、既に登録されている標準パター
ン、すなわち領域Fに含まれる標準パターンについては
使用頻度順位が1つ下がることになる。
On the other hand, if the recognition correct / wrong judging section 3 judges that the recognition result is wrong, as shown in FIG. 4, a later-described modified pattern generated based on the input character pattern is used. The pattern D is registered at the head of the recognition dictionary 11. Then, for the standard patterns that have already been registered, that is, the standard patterns included in the area F, the use frequency rank is lowered by one.

【0031】なお、認識辞書11内に登録されている標
準パターン数が、事前に設定されている登録可能最大数
を超えた場合には、標準パターン削除部9(図示せず)
を設けて、認識辞書11内において最後尾に登録されて
いる標準パターンEを削除することも考えられる。こう
することで、標準パターンの登録数が一定範囲内に抑制
されることから、不用意に計算機資源を消費することを
未然に回避することが可能となる。また、最後尾に登録
されている標準パターンEは、最近において最も使用頻
度の低い標準パターンであるものと考えられることか
ら、削除したとしてもその影響は小さいものと考えられ
る。
If the number of standard patterns registered in the recognition dictionary 11 exceeds the preset maximum number of registrable patterns, the standard pattern deletion unit 9 (not shown)
Is provided, and the standard pattern E registered at the end in the recognition dictionary 11 may be deleted. By doing so, the number of registered standard patterns is suppressed within a certain range, so that careless consumption of computer resources can be avoided. Further, since the standard pattern E registered at the end is considered to be the least frequently used standard pattern in recent years, even if it is deleted, its influence is considered to be small.

【0032】そして、認識正誤判定部3において、認識
結果が誤りであると判定された場合には、再入力促進部
5において、再度手書き文字パターンを入力するメッセ
ージ等を表示出力する。表示出力の方法としては、GU
Iによる画面表示であっても良いし、音声等による警告
音であっても良いし、特に限定されるものではない。な
お、表示出力のみならず、例えば表示された認識候補か
ら選択することで内容を直接的に訂正できるものであっ
ても良い。
If the recognition correct / wrong determining unit 3 determines that the recognition result is wrong, the re-input promoting unit 5 displays a message for inputting the handwritten character pattern again and the like. The display output method is GU
I may be displayed on the screen, or may be a warning sound such as a voice, and is not particularly limited. In addition to the display output, for example, the content may be directly corrected by selecting from the displayed recognition candidates.

【0033】また、認識結果が誤りであると判定された
場合、入力された手書き文字パターンそのものを認識辞
書に登録することによって、確実に当該パターンに対す
る誤認識を解消することが可能である。しかし、入力形
態が手書き入力である以上、全く同一の手書き入力文字
パターンが再入力される可能性は非常に低い。したがっ
て、入力された手書き文字パターンと誤認識を生じた標
準パターンに基づいて、変形パターン生成・登録部6に
おいて新たな変形パターンを生成して登録しておく方
が、より認識精度が高まることが多いものと考えられ
る。
When it is determined that the recognition result is incorrect, by registering the input handwritten character pattern itself in the recognition dictionary, erroneous recognition of the pattern can be surely eliminated. However, as long as the input mode is handwriting input, the possibility of re-inputting exactly the same handwritten input character pattern is very low. Therefore, the recognition accuracy can be further improved by generating and registering a new deformation pattern in the deformation pattern generation / registration unit 6 based on the input handwritten character pattern and the standard pattern in which the recognition error has occurred. It is thought that there are many.

【0034】そこで、まず図5において、誤認識が生ず
る場合の各パターン間の関係を例示してみる。入力され
た手書き文字パターンとのパターン間の類似度を距離で
表すものとすると、誤認識が生じるということは、手書
き文字の入力パターン1と誤認識された標準パターンB
との距離LBが、手書き文字の入力パターン1と本来認
識されるべき標準パターンAとの距離LAよりも短くな
っていることを意味している。
First, in FIG. 5, the relationship between the patterns in the case where erroneous recognition occurs will be exemplified. If the similarity between the input handwritten character pattern and the pattern is represented by a distance, the occurrence of erroneous recognition means that the standard pattern B erroneously recognized as the input pattern 1 of the handwritten character.
Distance between L B has means that is shorter than the distance L A between the standard pattern A to be recognized original and the input pattern 1 of handwriting.

【0035】そして、当該文字パターン1をそのまま標
準パターンと同一のカテゴリに属する登録パターンとし
て認識辞書11に追加登録すると、図6に示すように標
準パターンBと同一カテゴリに属する手書き文字の入力
パターン2が入力された場合に、当該追加登録された登
録パターン、すなわち入力パターン1との距離LPが最
も短くなってしまうために、本来登録パターンBのカテ
ゴリとして認識されるべき入力パターン2が登録パター
ンAのカテゴリとして誤認識されてしまうことになる。
When the character pattern 1 is additionally registered as it is in the recognition dictionary 11 as a registered pattern belonging to the same category as the standard pattern, the input pattern 2 of the handwritten character belonging to the same category as the standard pattern B as shown in FIG. Is input, the distance L P from the additionally registered pattern, that is, the input pattern 1 becomes the shortest. Therefore, the input pattern 2 that should be recognized as a category of the registered pattern B is the registered pattern. The category A is erroneously recognized.

【0036】そこで、変形パターン生成・登録部6にお
いては、図7に示すように、標準パターンAを手書き文
字の入力パターン1の形に近づけるように変形した新た
な変形パターンCを認識辞書11に登録する。この場
合、かかる変形が手書き文字の入力パターン1と標準パ
ターンBとの距離よりも手書き文字の入力パターン1と
変形パターンCとの距離の方が短くなるように行われて
いる限りにおいては、手書き文字の入力パターン1に対
しては登録パターンAのカテゴリとして認識される。一
方、手書き文字の入力パターン2に対しても、手書き文
字の入力パターン2と標準パターンBとの距離LBの方
が手書き文字の入力パターン2と変形パターンCとの距
離LCよりも短くなることから、手書き文字の入力パタ
ーン2は登録パターンBのカテゴリとして認識されるよ
うになり、正しい認識結果を得ることができるようにな
る。
Therefore, the modified pattern generation / registration unit 6 stores, in the recognition dictionary 11, a new modified pattern C obtained by modifying the standard pattern A so as to approximate the shape of the input pattern 1 of the handwritten character, as shown in FIG. register. In this case, as long as the deformation is performed such that the distance between the input pattern 1 of the handwritten character and the deformation pattern C is shorter than the distance between the input pattern 1 of the handwritten character and the standard pattern B, The character input pattern 1 is recognized as a category of the registered pattern A. On the other hand, for the input pattern 2 handwriting, shorter than the distance L C between the distance L deformation pattern C is the input pattern 2 handwriting towards B between the input pattern and the standard pattern B handwritten Therefore, the input pattern 2 of the handwritten character is recognized as the category of the registered pattern B, and a correct recognition result can be obtained.

【0037】なお、変形パターンの登録によって、認識
辞書11により高い認識精度を付与することができる
が、文字の画数が相違する場合等、文字パターン間の距
離について必ずしも線形性が保持されない場合も考えら
れることから、変形パターンを生成して登録することが
有効であるか否かは事前に判定する必要が生じる。
It is to be noted that, although higher recognition accuracy can be imparted to the recognition dictionary 11 by registering the deformed pattern, there may be cases where the linearity of the distance between the character patterns is not necessarily maintained, such as when the number of strokes of the character is different. Therefore, it is necessary to determine in advance whether it is effective to generate and register a deformation pattern.

【0038】そこで、変形妥当性判定・制御部7におい
ては、例えば文字を認識する手段が2つの文字パターン
の画数が等しい場合にしか類似度(距離)が定まらない
手段である場合には、画数が等しい場合にのみ変形パタ
ーンの生成・登録を認める等の制御を行う。本発明にお
いては、文字を認識する手段について特に限定されるも
のではないので、採用される文字認識手段に応じて制御
する内容も変動することは言うまでもない。
Therefore, in the modification validity determination / control section 7, if the means for recognizing characters is means for which the similarity (distance) is determined only when the number of strokes of two character patterns is equal, the number of strokes Only when the values are equal to each other, control such as allowing the generation and registration of the deformation pattern is performed. In the present invention, since the means for recognizing characters is not particularly limited, it goes without saying that the contents to be controlled also vary according to the adopted character recognition means.

【0039】また、変形パターンを新たに登録する際
に、認識確定部4において、認識辞書11へ登録できる
標準パターン数の最大値を設定しておき、変形パターン
登録時に当該設定値を超える場合においては、標準パタ
ーン削除部9において認識辞書11に登録されている最
後尾の標準パターンについて削除する。こうすること
で、使用履歴の最も古い標準パターンを認識辞書11か
ら削除することになり、使用する機会のほとんどない文
字パターンについて認識辞書11から削除することがで
きるので、計算機資源を最大限有効に用いることが可能
となる。この場合、カテゴリ別に登録できる標準パター
ンの最大数を定めておくことも考えられる。認識辞書1
1へ登録しておくべき標準パターンについて、よりきめ
細かい制御を行うことができるからである。
When newly registering a deformed pattern, the recognition determining unit 4 sets a maximum value of the number of standard patterns that can be registered in the recognition dictionary 11, and when the deformed pattern is registered, the maximum value is exceeded. Deletes the last standard pattern registered in the recognition dictionary 11 in the standard pattern deletion unit 9. By doing so, the standard pattern with the oldest use history is deleted from the recognition dictionary 11, and character patterns that have little chance of being used can be deleted from the recognition dictionary 11, so that computer resources can be used as efficiently as possible. It can be used. In this case, it is conceivable to determine the maximum number of standard patterns that can be registered for each category. Recognition dictionary 1
This is because more fine-grained control can be performed on the standard pattern to be registered in No. 1.

【0040】また、認識正誤判定部3において、認識結
果が誤りであると判定された場合には、選出された標準
パターン、すなわち認識辞書11に登録されている標準
パターンのうちで最も類似度が高い文字パターンについ
て、誤認識が生じた回数の履歴を示す誤認識因子頻度カ
ウンタに‘1’を累積加算していくことで、誤認識因子
頻度カウンタの累積値、すなわち誤認頻度度数が一定の
回数を超えた場合には当該標準パターンを認識辞書11
から削除することによって、認識辞書11の認識精度を
向上させることが可能となる。
If the recognition correct / wrong judging unit 3 judges that the recognition result is wrong, the similarity is the highest among the selected standard patterns, that is, the standard patterns registered in the recognition dictionary 11. By cumulatively adding “1” to a misrecognition factor frequency counter indicating a history of the number of times that a misrecognition has occurred for a high character pattern, the cumulative value of the misrecognition factor frequency counter, that is, the number of times the misrecognition frequency is constant is increased. Exceeds the standard pattern, the recognition pattern
, The recognition accuracy of the recognition dictionary 11 can be improved.

【0041】この場合にも、認識辞書11の認識精度が
向上すると同時に、文字認識において不要となる文字パ
ターンを認識辞書11から削除することができることか
ら、計算機資源を最大限有効に用いることが可能とな
る。
In this case as well, the recognition accuracy of the recognition dictionary 11 is improved, and at the same time, character patterns that are unnecessary in character recognition can be deleted from the recognition dictionary 11, so that computer resources can be used as efficiently as possible. Becomes

【0042】以上のように本実施の形態によれば、認識
辞書11を入力者の手書き文字パターンの認識状況に応
じて、認識辞書11に対する変形パターンの追加、ある
いは文字認識に不要な標準パターンの削除等により使用
頻度の高い標準パターンから順に標準パターンが登録さ
れるように認識辞書11を更新することよって、入力者
にとってより認識精度が高い文字認識を行うことが可能
となる。
As described above, according to the present embodiment, the recognition dictionary 11 is added to the recognition dictionary 11 in accordance with the recognition state of the handwritten character pattern of the input person, or a modified pattern is added to the recognition dictionary 11 or a standard pattern unnecessary for character recognition is used. By updating the recognition dictionary 11 so that the standard patterns are registered in order from the most frequently used standard pattern due to deletion or the like, it becomes possible to perform character recognition with higher recognition accuracy for the input user.

【0043】また、本実施の形態によれば、認識辞書1
1への登録可能最大標準パターン数を設けることができ
ることから、変形パターン追加による計算機資源への制
約が発生することがなく、PDA等の小型の端末におけ
るオンラインペン入力による手書き文字の認識等にも用
いることが可能となる。
According to the present embodiment, the recognition dictionary 1
Since the maximum number of standard patterns that can be registered in 1 can be provided, there is no restriction on computer resources due to the addition of deformed patterns, and it is also possible to recognize handwritten characters by online pen input in a small terminal such as a PDA. It can be used.

【0044】次に、本発明の実施の形態にかかる文字認
識装置を実現するプログラムの処理の流れについて説明
する。図8に本発明の実施の形態にかかる文字認識装置
を実現するプログラムの処理の流れ図を示す。
Next, the flow of processing of a program for realizing the character recognition device according to the embodiment of the present invention will be described. FIG. 8 shows a flowchart of the processing of a program for realizing the character recognition device according to the embodiment of the present invention.

【0045】図8において、入力者によって手書き文字
パターン入力がされると(ステップS81)、入力され
た手書き文字パターンについて認識辞書11を照会する
ことで(ステップS82)、入力された手書き文字パタ
ーンと最も類似度が高い認識文字を出力表示する(ステ
ップS83)。
In FIG. 8, when a handwritten character pattern is inputted by an input person (step S81), the recognition dictionary 11 is queried for the inputted handwritten character pattern (step S82), and the inputted handwritten character pattern and The recognized character having the highest similarity is output and displayed (step S83).

【0046】次に、表示出力された認識文字が正しく認
識された結果であるか否かについて判定し(ステップS
84)、正しく認識されていると判定された場合には
(ステップS84:Yes)、出力された認識結果を認
識文字として確定する(ステップS85)とともに、認
識文字に該当する標準パターンを使用頻度順位が最も高
い標準パターンとなるように認識辞書11を更新する
(ステップS86)。
Next, it is determined whether or not the recognition character displayed and output is a result of correct recognition (step S).
84) When it is determined that the character is correctly recognized (step S84: Yes), the output recognition result is determined as a recognition character (step S85), and the standard pattern corresponding to the recognition character is ranked in use frequency order. Is updated so that the standard pattern becomes the highest standard pattern (step S86).

【0047】一方、正しく認識されていないと判定され
た場合には(ステップS84:No)、手書き文字パタ
ーンの再入力を促すメッセージ等を出力するとともに
(ステップS87)、入力された手書き文字パターンと
本来認識されるべき文字パターンとに基づいて変形パタ
ーンを生成することの妥当性について判定し、(ステッ
プS88)、変形パターンを生成することが妥当である
と判定された場合には(ステップS88:Yes)、入
力された手書き文字パターンと本来認識されるべき文字
パターンとに基づいて変形パターンを生成して認識辞書
11に登録することになる。(ステップS89)。再入
力以降は、新たに変形パターンが追加された認識辞書1
1に基づいて文字認識を行うことになる。
On the other hand, if it is determined that the handwritten character pattern has not been correctly recognized (step S84: No), a message prompting re-input of the handwritten character pattern is output (step S87), and the input handwritten character pattern and The validity of generating the deformation pattern is determined based on the character pattern to be originally recognized (step S88). If it is determined that generating the deformation pattern is valid (step S88: Yes), a deformation pattern is generated based on the input handwritten character pattern and the character pattern to be originally recognized, and registered in the recognition dictionary 11. (Step S89). After re-input, the recognition dictionary 1 in which a new deformation pattern is added
1, character recognition is performed.

【0048】なお、本発明の実施の形態にかかる文字認
識装置を実現するプログラムを記憶した記録媒体は、図
9に示す記録媒体の例に示すように、CD−ROM92
−1やフロッピー(登録商標)ディスク92−2等の可
搬型記録媒体92だけでなく、通信回線の先に備えられ
た他の記憶装置91や、コンピュータ93のハードディ
スクやRAM等の記録媒体94のいずれでも良く、プロ
グラム実行時には、プログラムはローディングされ、主
メモリ上で実行される。
The recording medium storing the program for realizing the character recognition device according to the embodiment of the present invention is a CD-ROM 92 as shown in the example of the recording medium shown in FIG.
-1 and a floppy (registered trademark) disk 92-2, as well as other storage devices 91 provided at the end of a communication line, and a recording medium 94 such as a hard disk or a RAM of a computer 93. In any case, when the program is executed, the program is loaded and executed on the main memory.

【0049】また、本発明の実施の形態にかかる文字認
識装置により生成された個人別認識辞書等を記録した記
録媒体も、図9に示す記録媒体の例に示すように、CD
−ROM92−1やフロッピーディスク92−2等の可
搬型記録媒体92だけでなく、通信回線の先に備えられ
た他の記憶装置91や、コンピュータ93のハードディ
スクやRAM等の記録媒体94のいずれでも良く、例え
ば本発明にかかる文字認識装置を利用する際にコンピュ
ータ93により読み取られる。
Further, a recording medium on which an individual recognition dictionary or the like generated by the character recognition device according to the embodiment of the present invention is recorded is also a CD as shown in the example of the recording medium shown in FIG.
-Not only the portable recording medium 92 such as the ROM 92-1 and the floppy disk 92-2, but also the other storage device 91 provided at the end of the communication line, and the recording medium 94 such as the hard disk and RAM of the computer 93. For example, it is read by the computer 93 when using the character recognition device according to the present invention.

【0050】[0050]

【発明の効果】以上のように本発明にかかる文字認識装
置によれば、認識辞書を入力者の手書き文字の認識状況
に応じて、認識辞書11に対する変形パターンの追加、
あるいは不要な標準パターンの削除によって、入力者に
とってより認識精度が高い文字認識を行うことが可能と
なる。
As described above, according to the character recognition apparatus of the present invention, the recognition dictionary can be added to the recognition dictionary 11 in accordance with the recognition state of the handwritten character by the input user.
Alternatively, by deleting unnecessary standard patterns, character recognition with higher recognition accuracy for the input user can be performed.

【0051】また、本発明によれば、認識辞書への登録
文字パターン数の上限を設けることができることから、
変形パターン追加による計算機資源への制約が発生する
ことがなく、PDA等の小型の端末におけるオンライン
ペン入力による手書き文字の認識等にも用いることが可
能となる。
According to the present invention, the upper limit of the number of character patterns registered in the recognition dictionary can be set.
There is no restriction on computer resources due to the addition of the deformation pattern, and it can be used for recognition of handwritten characters by online pen input in a small terminal such as a PDA.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の実施の形態にかかる文字認識装置の
構成図
FIG. 1 is a configuration diagram of a character recognition device according to an embodiment of the present invention.

【図2】 本発明の実施の形態にかかる文字認識装置に
おける認識辞書の説明図
FIG. 2 is an explanatory diagram of a recognition dictionary in the character recognition device according to the embodiment of the present invention.

【図3】 本発明の実施の形態にかかる文字認識装置に
おける認識辞書の説明図
FIG. 3 is an explanatory diagram of a recognition dictionary in the character recognition device according to the embodiment of the present invention;

【図4】 本発明の実施の形態にかかる文字認識装置に
おける認識辞書の説明図
FIG. 4 is an explanatory diagram of a recognition dictionary in the character recognition device according to the embodiment of the present invention;

【図5】 本発明の実施の形態にかかる文字認識装置に
おける類似度判断の説明図
FIG. 5 is an explanatory diagram of similarity determination in the character recognition device according to the embodiment of the present invention;

【図6】 本発明の実施の形態にかかる文字認識装置に
おける文字パターン登録の説明図
FIG. 6 is an explanatory diagram of character pattern registration in the character recognition device according to the embodiment of the present invention.

【図7】 本発明の実施の形態にかかる文字認識装置に
おける変形パターン登録の説明図
FIG. 7 is an explanatory diagram of deformation pattern registration in the character recognition device according to the embodiment of the present invention;

【図8】 本発明の実施の形態にかかる文字認識装置に
おける処理の流れ図
FIG. 8 is a flowchart of a process in the character recognition device according to the embodiment of the present invention;

【図9】 記録媒体の例示図FIG. 9 is an exemplary diagram of a recording medium.

【符号の説明】[Explanation of symbols]

1 手書き文字パターン入力部 2 文字認識部 3 認識正誤判定部 4 認識確定部 5 再入力促進部 6 変形パターン生成・登録部 7 変形妥当性判定部 8 認識結果出力部 9 標準パターン削除部 11 認識辞書 91 回線先の記憶装置 92 CD−ROMやフロッピーディスク等の可搬型記
録媒体 92−1 CD−ROM 92−2 フロッピーディスク 93 コンピュータ 94 コンピュータ上のRAM/ハードディスク等の記
録媒体
DESCRIPTION OF SYMBOLS 1 Handwritten character pattern input part 2 Character recognition part 3 Recognition correctness judgment part 4 Recognition determination part 5 Re-input promotion part 6 Deformation pattern generation / registration part 7 Deformation validity judgment part 8 Recognition result output part 9 Standard pattern deletion part 11 Recognition dictionary Reference numeral 91: a storage device at a line destination 92: a portable recording medium such as a CD-ROM or a floppy disk 92-1 CD-ROM 92-2 a floppy disk 93 a computer 94 a recording medium such as a RAM / hard disk on a computer

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 手書き文字パターンを入力する手書き文
字パターン入力部と、 前記手書き文字パターンについて、使用頻度順に標準パ
ターンを登録している認識辞書を照会することで文字と
して認識する文字認識部と、 認識した結果を出力する認識結果出力部と、 前記認識結果出力部における認識結果に基づいて正しい
認識が行われたか否かを判定する認識正誤判定部と、 前記認識正誤判定部において、正しい認識が行われたと
判定された場合、前記認識結果を認識文字として確定す
る認識確定部と、 前記認識正誤判定部において、誤った認識が行われたと
判定された場合、再入力を促す再入力促進部とを含み、 前記認識正誤判定部において正しい認識が行われたと判
定された場合には、前記認識辞書に登録されている対応
する前記標準パターンを使用頻度順位が最も高い標準パ
ターンとするように前記認識辞書を更新することを特徴
とする文字認識装置。
A handwritten character pattern input unit for inputting a handwritten character pattern; a character recognition unit for recognizing the handwritten character pattern as a character by referring to a recognition dictionary in which standard patterns are registered in order of use frequency; A recognition result output unit that outputs a recognition result, a recognition correctness determination unit that determines whether correct recognition has been performed based on the recognition result in the recognition result output unit, and a correctness determination unit that performs correct recognition. When it is determined that the recognition has been performed, a recognition determination unit that determines the recognition result as a recognition character, and in the recognition correctness determination unit, when it is determined that erroneous recognition has been performed, a re-input promotion unit that prompts a re-input. If the recognition correct / wrong determining unit determines that the correct recognition has been performed, the corresponding standard pattern registered in the recognition dictionary is included. A character recognition apparatus, wherein the recognition dictionary is updated so that a turn is a standard pattern having the highest use frequency order.
【請求項2】 前記再入力促進部において、認識結果と
して出力された前記認識辞書に登録されている標準パタ
ーンの誤認頻度度数を累積加算し、 前記誤認頻度度数が所定のしきい値を超えた場合には、
認識結果として出力された標準パターンを前記認識辞書
から削除する標準パターン削除部をさらに含む請求項1
記載の文字認識装置。
2. The re-input facilitating unit accumulatively adds the frequency of misrecognition of a standard pattern registered in the recognition dictionary output as a recognition result, and the frequency of misrecognition exceeds a predetermined threshold. in case of,
2. A standard pattern deleting unit for deleting a standard pattern output as a recognition result from the recognition dictionary.
Character recognition device according to the description.
【請求項3】 前記認識辞書に登録されている文字パタ
ーンと入力された手書き文字パターンに基づいて変形パ
ターンを生成して、新たに前記認識辞書に登録する変形
パターン生成・登録部と、 前記変形パターンを生成することが妥当であるか否かに
ついて判定する変形妥当性判定部とをさらに含み、 前記認識正誤判定部において誤った認識が行われたと判
定された場合には、前記変形妥当性判定部において前記
変形パターンを生成することが妥当でないと判定した場
合には前記変形パターンの生成を許可せず、前記変形パ
ターンを生成することが妥当であると判定した場合に
は、前記変形パターン生成・登録部において前記変形パ
ターンを生成するとともに、前記認識辞書に使用頻度順
位が最も高い標準パターンとして登録する請求項1又は
2に記載の文字認識装置。
3. A deformation pattern generation / registration unit that generates a deformation pattern based on a character pattern registered in the recognition dictionary and an input handwritten character pattern, and newly registers the deformation pattern in the recognition dictionary. A modification validity determination unit that determines whether it is appropriate to generate the pattern; and when the recognition correctness determination unit determines that erroneous recognition has been performed, the modification validity determination The unit does not permit generation of the deformation pattern when it is determined that generating the deformation pattern is not appropriate, and generates the deformation pattern when it is determined that generation of the deformation pattern is appropriate. A registration unit that generates the deformation pattern and registers the deformation pattern in the recognition dictionary as a standard pattern having the highest use frequency order; Character recognition apparatus according to 2.
【請求項4】 前記変形パターン生成・登録部におい
て、前記入力された手書き文字パターンとは異なる手書
き文字パターンと前記変形パターンとの間の類似度が、
前記異なる手書き文字パターンと前記認識辞書に登録さ
れている前記異なる手書き文字パターンに対応する標準
パターンとの間の類似度よりも低くなるように前記変形
パターンを生成する請求項3記載の文字認識装置。
4. The modified pattern generation / registration unit, wherein a similarity between a handwritten character pattern different from the input handwritten character pattern and the modified pattern is
4. The character recognition apparatus according to claim 3, wherein the deformed pattern is generated such that the similarity between the different handwritten character pattern and a standard pattern corresponding to the different handwritten character pattern registered in the recognition dictionary is lower than the similarity. .
【請求項5】 前記変形パターン生成・登録部におい
て、前記変形パターン登録時に前記認識辞書の前記標準
パターンの登録可能最大数を超える場合には、前記認識
辞書における最後尾の前記標準パターンを削除する請求
項4又は5に記載の文字認識装置。
5. The modified pattern generation / registration unit deletes the last standard pattern in the recognition dictionary when the number of registered standard patterns in the recognition dictionary exceeds the maximum number that can be registered when the modified pattern is registered. The character recognition device according to claim 4.
【請求項6】 手書き文字パターンを入力する工程と、 前記手書き文字パターンについて、使用頻度順に標準パ
ターンを登録している認識辞書を照会することで文字と
して認識する工程と、 認識した結果を出力する工程と、 前記認識した結果に基づいて正しい認識が行われたか否
かを判定する工程と、 正しい認識が行われたと判定された場合、前記認識結果
を認識文字として確定する工程と、 誤った認識が行われたと判定された場合、再入力を促す
工程とを含み、 前記正しい認識が行われたか否かを判定する工程におい
て、正しい認識が行われたと判定された場合には、前記
認識辞書に登録されている対応する前記標準パターンを
使用頻度順位が最も高い標準パターンとするように前記
認識辞書を更新することを特徴とした文字認識方法。
6. A step of inputting a handwritten character pattern, a step of recognizing the handwritten character pattern as a character by referring to a recognition dictionary in which standard patterns are registered in order of use frequency, and outputting a recognized result. Determining whether correct recognition has been performed based on the recognized result; and determining the recognition result as a recognized character if it is determined that correct recognition has been performed. If it is determined that correct recognition has been performed, the method includes a step of prompting re-input.In the step of determining whether or not the correct recognition has been performed, if it is determined that correct recognition has been performed, A character recognition method, characterized in that the recognition dictionary is updated so that the registered corresponding standard pattern is a standard pattern having the highest use frequency order.
【請求項7】 手書き文字パターンを入力するステップ
と、 前記手書き文字パターンについて、使用頻度順に標準パ
ターンを登録している認識辞書を照会することで文字と
して認識するステップと、 認識した結果を出力するステップと、 前記認識した結果に基づいて正しい認識が行われたか否
かを判定するステップと、 正しい認識が行われたと判定された場合、前記認識結果
を認識文字として確定するステップと、 誤った認識が行われたと判定された場合、再入力を促す
ステップとを含み、 前記正しい認識が行われたか否かを判定するステップに
おいて、正しい認識が行われたと判定された場合には、
前記認識辞書に登録されている対応する前記標準パター
ンを使用頻度順位が最も高い標準パターンとするように
前記認識辞書を更新することを特徴とする文字認識方法
を実現するコンピュータに実行させるプログラムを記録
したコンピュータ読み取り可能な記録媒体。
7. A step of inputting a handwritten character pattern, a step of recognizing the handwritten character pattern as a character by referring to a recognition dictionary in which standard patterns are registered in order of use frequency, and outputting a recognized result. Determining whether correct recognition has been performed based on the result of the recognition; determining the recognition result as a recognized character if it is determined that the correct recognition has been performed; If it is determined that has been performed, including a step of prompting re-input, in the step of determining whether the correct recognition was performed, if it is determined that correct recognition was performed,
A program for causing a computer to execute a character recognition method characterized by updating the recognition dictionary so that the corresponding standard pattern registered in the recognition dictionary is a standard pattern having the highest use frequency rank is recorded. Computer readable recording medium.
【請求項8】 手書き文字パターンを入力するステップ
と、 前記手書き文字パターンについて、使用頻度順に標準パ
ターンを登録している認識辞書を照会することで文字と
して認識するステップと、 認識した結果を出力するステップと、 前記認識した結果に基づいて正しい認識が行われたか否
かを判定するステップと、 正しい認識が行われたと判定された場合、前記認識結果
を認識文字として確定するステップと、 誤った認識が行われたと判定された場合、再入力を促す
ステップとを含み、 前記正しい認識が行われたか否かを判定するステップに
おいて、正しい認識が行われたと判定された場合には、
前記認識辞書に登録されている対応する前記標準パター
ンを使用頻度順位が最も高い標準パターンとするように
前記認識辞書を更新することを特徴とする文字認識方法
を実現するコンピュータに実行させるプログラム。
8. A step of inputting a handwritten character pattern, a step of recognizing the handwritten character pattern as a character by referring to a recognition dictionary in which standard patterns are registered in order of use frequency, and outputting a recognized result. Determining whether correct recognition has been performed based on the result of the recognition; determining the recognition result as a recognized character if it is determined that the correct recognition has been performed; If it is determined that has been performed, including a step of prompting re-input, in the step of determining whether the correct recognition was performed, if it is determined that correct recognition was performed,
A program executed by a computer for realizing a character recognition method, wherein the recognition dictionary is updated so that the corresponding standard pattern registered in the recognition dictionary is a standard pattern having the highest use frequency order.
JP2001018896A 2001-01-26 2001-01-26 Device and method for character recognition Withdrawn JP2002222388A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001018896A JP2002222388A (en) 2001-01-26 2001-01-26 Device and method for character recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001018896A JP2002222388A (en) 2001-01-26 2001-01-26 Device and method for character recognition

Publications (1)

Publication Number Publication Date
JP2002222388A true JP2002222388A (en) 2002-08-09

Family

ID=18884854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001018896A Withdrawn JP2002222388A (en) 2001-01-26 2001-01-26 Device and method for character recognition

Country Status (1)

Country Link
JP (1) JP2002222388A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008123181A (en) * 2006-11-10 2008-05-29 Kawai Musical Instr Mfg Co Ltd Musical score recognition device and program
JP2008276311A (en) * 2007-04-25 2008-11-13 Denso Corp Character recognition device, appearance inspection device, and character recognition method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008123181A (en) * 2006-11-10 2008-05-29 Kawai Musical Instr Mfg Co Ltd Musical score recognition device and program
JP2008276311A (en) * 2007-04-25 2008-11-13 Denso Corp Character recognition device, appearance inspection device, and character recognition method

Similar Documents

Publication Publication Date Title
US10809914B2 (en) System and method for inputting text into electronic devices
JP3141015B2 (en) Handwritten kanji recognition method and apparatus
US9798393B2 (en) Text correction processing
US8401314B2 (en) Systems and methods for character correction in communication devices
US8892996B2 (en) Spell-check for a keyboard system with automatic correction
KR100582968B1 (en) Device and method for entering a character string
US9411800B2 (en) Adaptive generation of out-of-dictionary personalized long words
CN103299550B (en) For having the spell check of the keyboard system of automatic calibration
KR101279676B1 (en) Method and apparatus for creating a language model and kana-kanji conversion
TW200842613A (en) Spell-check for a keyboard system with automatic correction
US10963717B1 (en) Auto-correction of pattern defined strings
CN1550069A (en) Component-based, adaptive stroke-order system
TW201544976A (en) Natural language processing system, natural language processing method, and natural language processing program
US8219905B2 (en) Automatically detecting keyboard layout in order to improve the quality of spelling suggestions
JP2002222388A (en) Device and method for character recognition
US20230096728A1 (en) System and method for text line and text block extraction
US20070271087A1 (en) Language-independent language model using character classes
JPH11143992A (en) Information processor
KR20050026732A (en) Method for providing optimized spelling correction word according to user
JP4047895B2 (en) Document proofing apparatus and program storage medium
CN104834392A (en) Chinese character input method for dynamic Chinese character combination of strokes
JP4401224B2 (en) Character recognition device, character recognition method and program
KR102119743B1 (en) Electronic terminal device for performing a correction process for a homophonic vowel based on speech recognition and operating method thereof
JP2002099555A (en) Apparatus and method for document classification
JP2001022891A (en) Recognizing device and storage medium for recognition

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080401