JPH1091727A - Method and device for recognizing handwritten character and its recording medium - Google Patents

Method and device for recognizing handwritten character and its recording medium

Info

Publication number
JPH1091727A
JPH1091727A JP9194026A JP19402697A JPH1091727A JP H1091727 A JPH1091727 A JP H1091727A JP 9194026 A JP9194026 A JP 9194026A JP 19402697 A JP19402697 A JP 19402697A JP H1091727 A JPH1091727 A JP H1091727A
Authority
JP
Japan
Prior art keywords
recognition
character recognition
handwritten character
stroke
ink data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9194026A
Other languages
Japanese (ja)
Inventor
Yoshifumi Sakai
良文 坂井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP9194026A priority Critical patent/JPH1091727A/en
Publication of JPH1091727A publication Critical patent/JPH1091727A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To shorten time required for recognition without dropping a recognition ratio in on-line handwritten character recognition. SOLUTION: A specific stroke pattern is extracted from ink data for one inputted character (step 102), what number is the extracted stroke pattern appearing in the total number of input pictures (the total number of strokes), i.e., the appearance position of the stroke pattern, is discriminated and a retrieving range in a recognition dictionary is converged in accordance with the appearance position (step 103). Then the recognition dictionary is retrieved within the converged range based on the featured value of ink data and a candidate character for the recognition of a handwritten character is outputted (step 104).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、手書き文字認識に
関し、特に、認識辞書での検索範囲を絞り込むことによ
って認識速度を向上させた手書き文字認識方法、装置及
びその記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to handwritten character recognition, and more particularly, to a handwritten character recognition method and apparatus for improving recognition speed by narrowing a search range in a recognition dictionary, and a recording medium therefor.

【0002】[0002]

【従来の技術】手書き文字認識では、予め認識辞書を用
意し、利用者が入力した1文字分の手書き文字データに
基づいて認識辞書を検索することによって候補文字を選
択し、この候補文字を認識結果とする。認識辞書の検索
の過程では、一般に、手書き文字パターンの特徴を表わ
すベクトル量である特徴量が利用されている。すなわ
ち、文字ごとにその文字の代表となる特徴量を認識辞書
に格納しておくとともに、入力された手書き文字データ
から特徴量を算出し、入力された文字の特徴量に最も近
いもの(例えばユークリッド・ノルムが最小となるも
の)を認識辞書に格納された特徴量の中から検索し、検
索された特徴量に対応する文字をもって候補文字として
いる。特徴量としては、例えば、離散コサイン変換や離
散フーリエ変換などの直交関数展開を施して各次の係数
を求め、算出された各係数を順に並べてベクトルとした
ものなどがある。
2. Description of the Related Art In handwritten character recognition, a recognition dictionary is prepared in advance, a candidate character is selected by searching a recognition dictionary based on one character of handwritten character data input by a user, and the candidate character is recognized. Result. In the process of retrieving the recognition dictionary, generally, a feature amount which is a vector amount representing a feature of a handwritten character pattern is used. That is, for each character, a characteristic amount representative of the character is stored in the recognition dictionary, a characteristic amount is calculated from the input handwritten character data, and the characteristic amount closest to the characteristic amount of the input character (for example, Euclid (The one with the smallest norm) is searched from the feature amounts stored in the recognition dictionary, and the character corresponding to the searched feature amount is set as a candidate character. As the feature amount, for example, there is a value obtained by performing orthogonal function expansion such as a discrete cosine transform or a discrete Fourier transform to obtain each coefficient, and arranging the calculated coefficients in order to form a vector.

【0003】以下の説明において、「インクデータ」と
は利用者がペンなどの入力デバイスによって入力した軌
跡データを指し、「ストローク」とは一筆分(一画分)
の軌跡データを指す。
In the following description, "ink data" refers to locus data input by a user using an input device such as a pen, and "stroke" refers to one stroke (one stroke).
Locus data.

【0004】[0004]

【発明が解決しようとする課題】しかしながら上述した
従来の手書き文字認識方法の場合、利用者が入力した手
書き文字から特徴量を算出した後、入力された文字の特
徴量に最も近いものを見出すために、認識辞書中の特徴
量をほぼ総当たりで検索することになり、認識対象文字
の数が多い場合や認識率の向上を目指して多数の特徴量
を認識辞書に格納する場合、さらには特徴量である特徴
ベクトルの次元数が大きい場合などに、認識時間が長く
なるという問題点がある。
However, in the case of the above-described conventional handwritten character recognition method, after calculating the characteristic amount from the handwritten character input by the user, it is necessary to find the one closest to the characteristic amount of the input character. In addition, the feature amount in the recognition dictionary is searched almost in brute force, and when the number of characters to be recognized is large or when a large number of feature amounts are stored in the recognition dictionary with the aim of improving the recognition rate, the feature There is a problem that the recognition time becomes longer when the number of dimensions of the feature vector, which is a quantity, is large.

【0005】本発明の目的は、認識率を低下させること
なく認識時間を短縮することができる手書き文字認識方
法、手書き文字認識装置及びその記録媒体を提供するこ
とにある。
An object of the present invention is to provide a handwritten character recognition method, a handwritten character recognition device, and a recording medium that can shorten the recognition time without lowering the recognition rate.

【0006】[0006]

【課題を解決するための手段】本発明の手書き文字認識
方法は、利用者が入力した1文字分のインクデータに対
し認識辞書を用いて手書き文字認識を行う手書き文字認
識方法において、インクデータから特定のストロークパ
ターンを抽出し、抽出されたストロークパターンが入力
総画数のうちどのストロークで出現したかの出現位置に
応じて認識辞書における検索範囲を絞り込み、手書き文
字認識を実行し候補文字を得る。
SUMMARY OF THE INVENTION A handwritten character recognition method according to the present invention is a handwritten character recognition method for recognizing handwritten characters for one character input by a user using a recognition dictionary. A specific stroke pattern is extracted, the search range in the recognition dictionary is narrowed according to the appearance position of the stroke in which the extracted stroke pattern appears in the total number of strokes, and handwritten character recognition is executed to obtain candidate characters.

【0007】また、このように認識辞書での検索範囲を
絞り込んだ結果、適切な候補文字が見つからないことが
あるが、そのような場合には、特定のストロークパター
ンの出現位置が変化したものとして検索範囲の絞り込み
を行い、手書き文字認識を再度実行するようにすればよ
い。出現位置を変えることによって絞り込みの範囲を広
げれば、その分、認識率は向上するものの認識所要時間
が長くなる。そこで、このようなトレードオフの関係を
利用者が制御できるようにするために、予め利用者から
の入力によって検索の深さを表わすレベル値が設定さ
れ、適切な候補文字が検索されなかった場合に、適切な
候補文字が検索されるかレベル値の表わす繰返し回数の
範囲内で、出現位置を変えつつ検索範囲の絞り込みと手
書き文字認識とを繰返すようにすることが好ましい。た
だし、出現位置の変更を過度に行っても認識率は頭打ち
となり認識所要時間が増えるばかりであるから、出現位
置の変更による絞り込みと手書き文字認識との繰返しは
ある時点で打ち切り、その後は、利用者がインクデータ
を再入力するか、候補文字として認識されるように認識
辞書を学習させる方が、全体としての効率が向上する。
As a result of narrowing the search range in the recognition dictionary, an appropriate candidate character may not be found. In such a case, it is assumed that the appearance position of a specific stroke pattern has changed. The search range may be narrowed down and handwritten character recognition may be executed again. If the range of the narrowing-down is widened by changing the appearance position, the recognition rate is correspondingly improved, but the time required for recognition becomes long. Therefore, in order to allow the user to control such a trade-off relationship, a level value indicating the depth of search is set in advance by an input from the user, and an appropriate candidate character is not searched. In addition, it is preferable that the narrowing of the search range and the handwritten character recognition are repeated while changing the appearance position within the range of the number of repetitions indicated by an appropriate candidate character or the level value. However, even if the appearance position is changed excessively, the recognition rate will reach a plateau and the required time for recognition will only increase, so the repetition of narrowing down by changing the appearance position and handwritten character recognition will be discontinued at a certain point in time, and then use If the user re-enters the ink data or trains the recognition dictionary so that it is recognized as a candidate character, the overall efficiency is improved.

【0008】本発明の手書き文字認識装置は、利用者が
入力した1文字分のインクデータに対し手書き文字認識
を行う手書き文字認識装置において、インクデータを入
力する入力手段と、インクデータから抽出される特徴量
を用いて文字認識を行うために使用される認識辞書と、
インクデータから特定のストロークパターンを抽出し、
抽出されたストロークパターンが入力総画数のうちどの
ストロークで出現したかの出現位置に応じて認識辞書に
おける検索範囲を絞り込み、絞り込まれた検索範囲内で
認識辞書を参照することにより手書き文字認識を実行す
る認識手段と、を有する。
A handwritten character recognition device according to the present invention is a handwritten character recognition device for recognizing handwritten characters with respect to one character of ink data input by a user. A recognition dictionary used to perform character recognition using feature amounts,
Extract a specific stroke pattern from the ink data,
Performs handwritten character recognition by narrowing the search range in the recognition dictionary according to the appearance position of the extracted stroke pattern in which stroke of the total input strokes, and referring to the recognition dictionary within the narrowed search range Recognizing means.

【0009】本発明の手書き文字認識装置においても、
適切な候補文字が検索されなかった場合には、出現位置
を変化させて検索範囲の絞り込みを再度行うことが有効
であり、また、利用者が入力したレベル値の表わす繰返
し回数の範囲内で、出現位置を逐次変化させ、検索範囲
の絞り込みと手書き文字認識とを繰返し実行することが
有効である。
In the handwritten character recognition device of the present invention,
If an appropriate candidate character is not found, it is effective to change the appearance position and narrow the search range again, and within the range of the number of repetitions represented by the level value input by the user, It is effective to sequentially change the appearance position and repeatedly execute the narrowing of the search range and the handwritten character recognition.

【0010】本発明の記録媒体は、インクデータを入力
するための入力部を備えたコンピュータが読み取り可能
な記録媒体であって、利用者が入力した1文字分のイン
クデータに対し文字認識を行うための認識辞書と、イン
クデータから特定のストロークパターンを抽出し、抽出
されたストロークパターンが入力総画数のうちどのスト
ロークで出現したかの出現位置に応じて認識辞書におけ
る検索範囲を絞り込み、認識辞書を参照して手書き文字
認識を実行し候補文字を得る工程をコンピュータに実行
させるプログラムと、を格納する。
A recording medium according to the present invention is a computer-readable recording medium having an input unit for inputting ink data, and performs character recognition on one character of ink data input by a user. A specific stroke pattern from the recognition dictionary and the ink data, and narrow down a search range in the recognition dictionary according to the appearance position of the extracted stroke pattern in which stroke of the total input strokes. And a program for causing a computer to execute a step of executing handwritten character recognition and obtaining candidate characters with reference to the above.

【0011】(作用)本発明は、認識辞書による文字認
識を実行する前に、認識辞書での検索範囲を絞り込むこ
とによって、検索時間を短縮しようとするものである。
その際、認識率を低下させてはならないことはもちろん
として、検索範囲を絞り込むための演算量も小さいもの
でなくてはならない。そこで、本発明者は鋭意検討を重
ねた結果、インクデータから特定のストロークパターン
を抽出し、入力総画数(総ストローク数)の中でその抽
出されたストロークパターンが何番目のストロークで出
現しているか、すなわちそのストロークパターンの出現
位置を識別し、出現位置に応じて認識辞書での検索範囲
を絞り込み、絞り込まれた検索範囲内で認識辞書を参照
することが有効であること、特に高画数文字のオンライ
ン手書き文字認識に有効であることを見出した。
(Operation) The present invention seeks to shorten the search time by narrowing the search range in the recognition dictionary before executing character recognition using the recognition dictionary.
At this time, the amount of calculation for narrowing down the search range must be small, not to mention lowering the recognition rate. Therefore, the present inventor has conducted intensive studies, and as a result, extracted a specific stroke pattern from the ink data, and in the total number of strokes (the total number of strokes), the extracted stroke pattern appeared in what number of strokes. That is, it is necessary to identify the appearance position of the stroke pattern, narrow the search range in the recognition dictionary according to the appearance position, and refer to the recognition dictionary within the narrowed search range. Is effective for online handwriting recognition.

【0012】本発明において、特定のストロークパター
ンとしては、具体的には以下のようなものが例示され
る。すなわち、垂直方向あるいは水平方向いずれか一
方向に延びる直線状の(曲がっていない)ストロークで
あって、ストローク長が最大のもの、2番目のもの、3
番目のもの、…など、カギ型に曲がるストロークなど
が挙げられる。さらに、漢字について考えると、漢字の
インクデータは画数分のストロークで構成されるとこ
ろ、大局的には、筆順で左上から右下へストロークが配
置している。ところが、部首間の切れ目にあたる部分で
は、引き続く2ストローク間での運筆が、下から上へあ
るいは右から左へ大きく変化する。そこで、このように
ストローク間での移動方向が下から上へあるいは右から
左へであって移動距離が所定のしきい値を越える場合
も、特定のストロークパターンとすることができる。
In the present invention, specific stroke patterns include the following. That is, a linear (non-curved) stroke extending in one of the vertical direction and the horizontal direction and having the largest stroke length, the second stroke, and the third stroke.
The second one,..., Is a key-shaped stroke. Further, when considering kanji, the ink data of the kanji is composed of strokes for the number of strokes, but strokes are generally arranged from the upper left to the lower right in the stroke order. However, in a portion corresponding to a break between radicals, the stroke between two successive strokes changes greatly from bottom to top or from right to left. Therefore, even when the moving direction between strokes is from bottom to top or from right to left and the moving distance exceeds a predetermined threshold, a specific stroke pattern can be obtained.

【0013】このような特定のストロークパターンをイ
ンクデータから抽出した後、ストロークパターンの出現
位置と認識辞書での検索範囲へのポインタとを含むテー
ブルを用い、出現位置から検索範囲へのポインタを求
め、そのポインタの範囲内でのみ認識辞書を検索するよ
うにすればよい。なお、検索範囲を絞り込むための出現
位置の数は1個に限定されるわけではなく、出現位置の
組合せに基づいて、認識辞書での検索範囲を絞り込むよ
うにしてもよい。例えば、カギ型に曲がるストロークを
特定のストロークパターンとするのであれば、インクデ
ータにこのストロークパターンが複数個含まれて出現位
置が複数あることがあり得る(例えば「品」の字にはカ
ギ型のストロークが3つある)が、これら複数の出現位
置の組合せに基づいて、検索範囲を絞り込むことも可能
である。また、垂直方向あるいは水平方向いずれか一方
向のの直線状のストロークのうちで、最長のものの出現
位置と2番目の長さのものの出現位置との組合せによ
り、認識辞書での検索範囲を絞り込むようにしてもよ
い。
After extracting such a specific stroke pattern from the ink data, a pointer from the appearance position to the search range is obtained by using a table including the appearance position of the stroke pattern and a pointer to the search range in the recognition dictionary. The recognition dictionary may be searched only within the range of the pointer. The number of appearance positions for narrowing the search range is not limited to one, and the search range in the recognition dictionary may be narrowed based on a combination of the appearance positions. For example, if a key-shaped stroke is a specific stroke pattern, the ink data may include a plurality of stroke patterns and may have a plurality of appearance positions (for example, a character of "art" may have a key-shaped pattern). There are three strokes), but it is also possible to narrow down the search range based on a combination of these plural appearance positions. In addition, a search range in the recognition dictionary may be narrowed by a combination of an appearance position of the longest one and an appearance position of a second one in a linear stroke in either the vertical direction or the horizontal direction. It may be.

【0014】[0014]

【発明の実施の形態】次に、本発明の実施の形態につい
て、図面を参照して説明する。図1は、本発明の実施の
一形態の手書き文字認識装置の構成を示すブロック図で
ある。
Next, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a handwritten character recognition device according to one embodiment of the present invention.

【0015】この手書き文字認識装置は、オンライン手
書き文字認識を実行するものであって、利用者によるイ
ンクデータが入力するとともに認識結果などを表示する
ための入力・表示パネル11と、入力・表示パネル11
に対して入力されたインクデータを受け付ける入力処理
部13と、手書き文字のインクデータを格納するインク
データ格納部14と、文字ごとの代表的な特徴量を格納
し文字認識に使用される認識辞書21と、認識辞書21
での検索対象範囲を絞り込むために使用される絞り込み
テーブルを格納した絞り込みテーブル格納部22と、絞
り込みテーブルによって検索対象範囲を絞り込みつつ認
識辞書21を参照しインクデータ格納部14内のインク
データに対して文字認識を行う文字認識エンジン部15
と、文字認識エンジン部15による文字認識結果を格納
する認識結果格納部16と、文字認識結果に応じて入力
・表示パネル11に対して表示を行う出力処理部17
と、によって構成されている。
This handwritten character recognition device executes online handwritten character recognition, and includes an input / display panel 11 for inputting ink data by a user and displaying a recognition result and the like, and an input / display panel. 11
An input processing unit 13 for receiving ink data input to the printer, an ink data storage unit 14 for storing ink data of handwritten characters, and a recognition dictionary for storing representative characteristic amounts for each character and used for character recognition 21 and a recognition dictionary 21
The narrowing-down table storage unit 22 storing a narrowing-down table used for narrowing down the search target range in the search, and the ink dictionary in the ink data storage unit 14 by referring to the recognition dictionary 21 while narrowing down the search target range by the narrowing-down table. Character recognition engine unit 15 that performs character recognition by using
And a recognition result storage unit 16 for storing a character recognition result by the character recognition engine unit 15 and an output processing unit 17 for displaying on the input / display panel 11 according to the character recognition result.
And is constituted by.

【0016】入力・表示パネル11は、表示部とインク
データ20の入力部とが一体になったいわゆる表示一体
型入力パネルであり、例えば、液晶フラットディスプレ
イ上に透明型タブレットを積層した構成のものを使用で
きる。利用者は、ペン12でこの入力・表示パネル11
の入力・表示画面をなぞることによって、所望のインク
データ20を入力できる。
The input / display panel 11 is a so-called display-integrated input panel in which a display section and an input section for ink data 20 are integrated. For example, the input / display panel 11 has a configuration in which a transparent tablet is laminated on a liquid crystal flat display. Can be used. The user operates the input / display panel 11 with the pen 12.
The desired ink data 20 can be input by tracing the input / display screen.

【0017】また、文字認識エンジン部15は、インク
データの特徴量に基づいて認識辞書21を検索し、候補
文字を見つけ出すものであるが、特に、以下に述べる処
理を実行する。すなわち、文字認識エンジン部15は、
入力されたインクデータから特定のストロークパターン
を抽出してそのストロークパターンの出現位置を求め、
これら出現位置(あるいは出現位置の組合せ)から絞り
込みテーブルを参照して認識辞書21での検索範囲を求
める。そして、文字認識エンジン部15は、インクデー
タの特徴量に基づき、求めた検索範囲で認識辞書21を
検索して候補文字を見つけ出す。図2は、1文字分のイ
ンクデータ(「植」)20からの特定のストロークパタ
ーンの抽出を説明する図である。ここでは、垂直方向に
延びる直線状のストロークであって最長のものから3番
目の長さまでの3本のストロークを抽出している。図に
おいて、〜の数字は、最長のストローク(2画
目)、2番目の長さのストローク(7画目)、3番目の
長さのストローク(6画目)を示している。
The character recognition engine unit 15 searches the recognition dictionary 21 based on the feature amount of the ink data to find candidate characters. In particular, the character recognition engine unit 15 executes the following processing. That is, the character recognition engine unit 15
Extract a specific stroke pattern from the input ink data and find the appearance position of the stroke pattern,
A search range in the recognition dictionary 21 is obtained by referring to the narrowing-down table from these appearance positions (or combinations of appearance positions). Then, the character recognition engine unit 15 searches the recognition dictionary 21 in the obtained search range based on the feature amount of the ink data to find a candidate character. FIG. 2 is a diagram illustrating extraction of a specific stroke pattern from ink data (“plant”) 20 for one character. Here, three straight strokes extending in the vertical direction and extending from the longest stroke to the third stroke are extracted. In the figure, the numbers indicate the longest stroke (second stroke), the second length stroke (seventh stroke), and the third length stroke (sixth stroke).

【0018】以下、本実施の形態の手書き文字認識装置
における手書き文字認識について、図3のフローチャー
トを用いて説明する。ここでは、1文字分のインクデー
タから、上述の図2に示すように、垂直方向の延びる直
線状のストロークであって最長のものとその次の長さの
ものを特定のストロークパターンとして抽出し、最長の
ものの出現位置と2番目のものの出現位置との組合せに
よって認識辞書での検索範囲を絞り込むものとする。
Hereinafter, handwritten character recognition in the handwritten character recognition apparatus of the present embodiment will be described with reference to the flowchart of FIG. Here, from the ink data for one character, as shown in FIG. 2 described above, the longest linear stroke extending in the vertical direction and the next linear stroke are extracted as specific stroke patterns. The search range in the recognition dictionary is narrowed by the combination of the appearance position of the longest object and the appearance position of the second object.

【0019】まず、利用者が入力・表示パネル11に対
してペン12を用いてインクデータ20を入力すること
により、1文字分のインクデータが取得される(ステッ
プ101)。すると、文字認識エンジン部15は、イン
クデータの大きさの正規化を行い、さらに、図2に示す
ようなストロークパターンを抽出する(ステップ10
2)。文字認識エンジン部15は、抽出された特定のス
トロークパターンの出現位置(あるいは出現位置の組合
せ)に応じて絞り込みテーブル格納部22内の絞り込み
テーブルを参照し、辞書検索範囲の絞り込みを行う(ス
テップ103)。
First, when a user inputs ink data 20 to the input / display panel 11 using the pen 12, ink data for one character is obtained (step 101). Then, the character recognition engine unit 15 normalizes the size of the ink data, and further extracts a stroke pattern as shown in FIG. 2 (step 10).
2). The character recognition engine unit 15 narrows down the dictionary search range by referring to the narrowing-down table in the narrowing-down table storage unit 22 in accordance with the appearance position (or combination of appearance positions) of the extracted specific stroke pattern (step 103). ).

【0020】図4は、垂直方向に延びる直線状のストロ
ークのうち最長のものと2番目のものとを特定のストロ
ークパターンとしたときに用いる絞り込みテーブル30
の一例を示している。この絞り込みテーブル30では、
垂直方向に延びる直線状のストロークの中で最長のスト
ロークの出現位置(筆順)と2番目に長いストロークの
出現位置(筆順)がそれぞれ何画目であるかによって分
類されており、例えば、最長のストロークが入力順で2
画目、2番目の長さのストロークが7画目であれば、辞
書検索範囲として、「植」、「森」、「敬」、「握」な
どに絞り込めばよいことが記載されている。ここでは説
明のため、辞書検索範囲として「植」、「森」、
「敬」、「握」などが記載されているが、実際には、認
識辞書21へのこれら「植」、「森」、「敬」、「握」
に対応するポインタが格納されている。
FIG. 4 shows a narrowing-down table 30 used when the longest and second linear strokes extending in the vertical direction have a specific stroke pattern.
An example is shown. In this narrowing-down table 30,
Among the linear strokes extending in the vertical direction, the stroke position is classified according to the stroke position (stroke order) of the longest stroke and the stroke position (stroke order) of the second longest stroke. Stroke is 2 in input order
If the stroke of the second stroke is the seventh stroke, it is described that the dictionary search range can be narrowed down to “plant”, “forest”, “respect”, “grip”, etc. . For the sake of explanation, the dictionary search ranges are "plant", "forest",
Although "Kei" and "Kikari" are described, these "plants", "forests", "Kei", and "Kikari" are actually stored in the recognition dictionary 21.
Is stored.

【0021】このようにして辞書検索範囲の絞り込みを
行った後、文字認識エンジン部15は、インクデータの
特徴量に基づき、絞り込まれた範囲内で認識辞書21を
検索して、候補文字を出力する(ステップ104)。こ
の候補文字は入力・表示パネル11に表示され、利用者
が入力を意図した文字であるかどうか、すなわち、ヒッ
トしたかどうかが判断される(ステップ105)。ヒッ
トかどうかは、利用者がこの候補文字を確定させるかあ
るいは再認識を指示するかによって分かるが、ヒットの
場合にはそのまま文字を確定させて処理を終了し、そう
でなければ、辞書検索範囲の絞り込み及び文字認識を制
限回数以上繰り返したかを判断する(ステップ10
6)。制限回数以上繰り返している場合には処理を終了
させ、そうでない場合には、特定のストロークパターン
の出現位置が変化したものとして、再度、絞り込みテー
ブル31による辞書検索範囲の絞り込みを実行し(ステ
ップ107)、ステップ104に戻る。
After narrowing down the dictionary search range in this way, the character recognition engine unit 15 searches the recognition dictionary 21 within the narrowed down range based on the characteristic amount of the ink data and outputs candidate characters. (Step 104). These candidate characters are displayed on the input / display panel 11, and it is determined whether or not the user intends to input, that is, whether or not a hit has been made (step 105). Whether a hit is determined by the user confirming the candidate character or instructing re-recognition. In the case of a hit, the character is decided as it is and the process is terminated. It is determined whether the narrowing down and the character recognition have been repeated a limited number of times or more (step 10).
6). If the number of repetitions is equal to or greater than the limit number, the process is terminated; otherwise, the dictionary search range is narrowed down by the narrowing-down table 31 again assuming that the appearance position of the specific stroke pattern has changed (step 107). ), And return to step 104.

【0022】ここで、出現位置を変化させる処理につい
て説明する。例えば図2に示す例の場合、垂直方向に延
びる直線状のストロークは、長い方から順に、2画目、
7画目、6画目である。書き癖等によって、長さの関係
が本来とは逆転しているストロークがあるかも知れない
ので、例えば、2番目に長いものと3番目に長いものと
が逆転しているとして、出現位置での2画目と6画目と
の組合せにより、辞書検索範囲の絞り込みと手書き文字
認識とを再度実行する。これでヒットしなければ、次
は、1番長いものと2番目に長いものとを入れ替えて7
画目と2画目との組合せ(ここではストローク長さの順
を考えているので、組合せでの出現順にも意味がある)
で検索範囲の絞り込みと手書き文字認識を実行する。こ
のようにして、出現位置を変化させての辞書認識範囲の
絞り込みと手書き文字認識とをステップ106で制限回
数に達するまで繰り返す。もちろん、制限回数以内であ
ってもヒットすればそこで繰返しは終了する。
Here, the process of changing the appearance position will be described. For example, in the case of the example shown in FIG. 2, the linear strokes extending in the vertical direction are the second stroke,
The seventh and sixth strokes. Due to writing habits, etc., there may be a stroke in which the relationship of length is reversed from the original. For example, it is assumed that the second longest and the third longest are reversed, Based on the combination of the second and sixth strokes, the narrowing of the dictionary search range and the handwritten character recognition are executed again. If it doesn't hit, replace the longest one with the second one
Combination of the stroke and the second stroke (Since the stroke length is considered here, the order of appearance in the combination is also significant)
To narrow down the search range and execute handwritten character recognition. In this way, the narrowing of the dictionary recognition range by changing the appearance position and the handwritten character recognition are repeated at step 106 until the number of times reaches the limit. Of course, if a hit is made even within the limited number of times, the repetition ends there.

【0023】次に、制限回数の設定方法について説明す
る。制限回数を大きくすれば、その分、認識率が向上す
る傾向にあるものの認識時間が増加し、また、制限回数
をむやみに大きくしても、認識率は頭打ちとなる。ま
た、1回の認識辞書21への検索で選択される候補文字
数を変化させ、候補文字数を多くすれば、その中に意図
していた文字が入っている可能性は高くなるものの確定
作業が面倒になり、候補文字数を小さくすれば、意図し
ていた文字が候補文字として出力されないことが多くな
る。本実施の形態の手書き文字認識装置では、こううた
トレードオフの関係の中で利用者が所望のパラメータを
設定できるようにするため、図5に示すように、入力・
表示パネル11に設定ウィンドウ40を表示させ、利用
者がこの設定ウィンドウ40に対してペン12で入力す
ることにより、制限回数や候補文字数を設定できるよう
になっている。図5において、「認識の深さ」は制限回
数を設定するためのものであって、「浅い」にすれば制
限回数が小さく、「深い」にすれば制限回数を大きくで
きる。具体的には、図示されるようなバーグラフ表示の
先端部分をペン12でドラッギングすることにより、利
用者はパラメータ値を所望の値に変更することができる
ようになっている。
Next, a method for setting the limit number of times will be described. Increasing the number of restrictions increases the recognition rate, but increases the recognition time. Even if the number of restrictions is increased unnecessarily, the recognition rate reaches a plateau. Further, if the number of candidate characters selected in one search to the recognition dictionary 21 is changed and the number of candidate characters is increased, the possibility that the intended character is contained therein increases, but the determination operation is troublesome. Thus, if the number of candidate characters is reduced, the intended character is often not output as a candidate character. In the handwritten character recognition device of the present embodiment, in order to allow the user to set desired parameters in the relationship of the song trade-off, as shown in FIG.
A setting window 40 is displayed on the display panel 11, and the user can set the limit number of times and the number of candidate characters by inputting the setting window 40 with the pen 12. In FIG. 5, “recognition depth” is used to set a limit number. The limit number can be set small when “shallow”, and large when “deep”. Specifically, the user can change the parameter value to a desired value by dragging the tip of the bar graph display as shown in FIG.

【0024】なお、このようなユーザの書き癖等は、ユ
ーザごとにほぼ毎回再現されるので、例えば、文字認識
エンジン部15に学習機能を持たせ、出現位置を変化さ
せる処理が頻繁に発生する場合には、ユーザの書き癖等
を優先的に考慮した筆順の組み合わせで絞り込みをかけ
るようにしてもよい。
Since the user's writing habits and the like are reproduced almost every time for each user, for example, the character recognition engine unit 15 is provided with a learning function to frequently change the appearance position. In this case, the narrowing-down may be performed by a combination of the stroke order in which the writing habits of the user and the like are considered with priority.

【0025】以上、本発明の実施の形態について説明し
たが、インクデータから抽出される特定のストロークパ
ターンとしては、上述したものに限定されるわけではな
い。図6(a)に示したものは、ストローク間での大局的
な運筆方向の変化に応じてストロークパターンを抽出す
る例を示している。漢字では、ストローク間の運筆方向
は、大局的には、上から下、左から右であるが、部首間
などでは、これと異なる運筆方向となる。図示した例で
は、部首(偏と旁)内では矢印,に示すように上か
ら下への移動となっているが、部首間では矢印に示す
ように、左下から右上へと大きく移動している。ここで
は、矢印のような動きを検出してストロークパターン
としている。
Although the embodiment of the present invention has been described above, the specific stroke pattern extracted from the ink data is not limited to the above-described one. FIG. 6A shows an example in which a stroke pattern is extracted according to a general change in the stroke direction between strokes. In the case of kanji, the stroke direction between strokes is generally from top to bottom and left to right. However, the stroke direction between radicals is different. In the example shown in the figure, the movement is from top to bottom as indicated by the arrow inside the radical (unbalanced), but it moves greatly from the lower left to the upper right as indicated by the arrow between the radicals. ing. Here, a stroke pattern is detected by detecting a movement like an arrow.

【0026】また、図6(b)に示すものは、ストローク
のうち、カギ状に変化するもの(カギ部35)を検出し
て特定のストロークパターンとしている。「植」の字の
場合、図示されるように、2つのカギ部35があってこ
れら2つのストロークがそれぞれストロークパターンと
して検出されることになる。
In the case shown in FIG. 6B, a specific stroke pattern is detected by detecting a key-shaped change (key portion 35) among the strokes. In the case of the character "", as shown, there are two key portions 35, and these two strokes are respectively detected as stroke patterns.

【0027】上述した説明から明らかなように、本実施
の形態の手書き文字認識装置は、携帯型情報通信機器と
して構成されるものであって、コンピュータである携帯
型情報通信機器に、記録媒体に格納されているソフトウ
ェアプログラム及び認識辞書類を読み込ませることによ
って実現できるものである。図7はこのような携帯型情
報通信機器の構成を示すブロック図である。
As is apparent from the above description, the handwritten character recognition device of the present embodiment is configured as a portable information communication device, and is connected to a portable information communication device as a computer and to a recording medium. This can be realized by reading stored software programs and recognition dictionaries. FIG. 7 is a block diagram showing a configuration of such a portable information communication device.

【0028】入力・表示パネル11にCPU1が接続す
るとともに、CPU1には、メモリ2及びディスクドラ
イブ3が接続されている。そして、認識辞書21のデー
タを含むとともに上述した各処理を実行するためのソフ
トウエアプログラムを格納した記録媒体4を用意してこ
の記録媒体4をディスクドライブ3に装着してデータ及
びプログラムをメモリ2にロードすることによって、携
帯型情報処理機器を本実施の形態の手書き文字認識装置
とすることができる。
The CPU 1 is connected to the input / display panel 11, and the memory 2 and the disk drive 3 are connected to the CPU 1. Then, a recording medium 4 containing the data of the recognition dictionary 21 and storing a software program for executing the above-described processing is prepared. The recording medium 4 is mounted on the disk drive 3 and the data and the program are stored in the memory 2. , The portable information processing device can be used as the handwritten character recognition device of the present embodiment.

【0029】[0029]

【発明の効果】以上説明したように本発明は、インクデ
ータから特定のストロークパターンを抽出し、入力総画
数の中でのその抽出されたストロークパターンの出現位
置を識別し、出現位置に応じて認識辞書での検索範囲を
絞り込み、絞り込まれた検索範囲内で認識辞書を参照す
ることにより、認識率を低下させることなく、認識所要
時間を大幅に短縮することができるという効果がある。
As described above, the present invention extracts a specific stroke pattern from ink data, identifies the appearance position of the extracted stroke pattern in the total number of input strokes, and responds to the appearance position. By narrowing down the search range in the recognition dictionary and referring to the recognition dictionary within the narrowed search range, there is an effect that the time required for recognition can be significantly reduced without lowering the recognition rate.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の一形態の手書き文字認識装置の
構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a handwritten character recognition device according to an embodiment of the present invention.

【図2】インクデータからのストロークパターンの抽出
を説明する図である。
FIG. 2 is a diagram illustrating extraction of a stroke pattern from ink data.

【図3】手書き文字認識の手順を示すフローチャートで
ある。
FIG. 3 is a flowchart illustrating a procedure of handwritten character recognition.

【図4】絞り込みテーブルの一例を示す図である。FIG. 4 is a diagram illustrating an example of a narrowing-down table.

【図5】認識の深さの設定方法を説明する図である。FIG. 5 is a diagram illustrating a method of setting a recognition depth.

【図6】(a),(b)はそれぞれストロークパターンの別の
例を示す図である。
FIGS. 6A and 6B are diagrams each showing another example of a stroke pattern.

【図7】図1の手書き文字認識装置が構成されることと
なる携帯型情報通信機器の構成を示すブロック図であ
る。
7 is a block diagram showing a configuration of a portable information communication device in which the handwritten character recognition device of FIG. 1 is configured.

【符号の説明】[Explanation of symbols]

1 CPU 2 メモリ 3 ディスクドライブ 4 記録媒体 11 入力・表示パネル 12 ペン 13 入力処理部 14 インクデータ格納部 15 文字認識エンジン部 16 認識結果格納部 17 出力処理部 20 インクデータ 21 認識辞書 22 絞り込みテーブル格納部 30 絞り込みテーブル 35 カギ部 40 設定ウィンドウ 101〜107 ステップ DESCRIPTION OF SYMBOLS 1 CPU 2 Memory 3 Disk drive 4 Recording medium 11 Input / display panel 12 Pen 13 Input processing unit 14 Ink data storage unit 15 Character recognition engine unit 16 Recognition result storage unit 17 Output processing unit 20 Ink data 21 Recognition dictionary 22 Refinement table storage Unit 30 narrowing-down table 35 key unit 40 setting window 101 to 107 steps

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 利用者が入力した1文字分のインクデー
タに対し認識辞書を用いて手書き文字認識を行う手書き
文字認識方法において、 前記インクデータから特定のストロークパターンを抽出
し、 前記抽出されたストロークパターンが入力総画数のうち
どのストロークで出現したかの出現位置に応じて前記認
識辞書における検索範囲を絞り込み、手書き文字認識を
実行し候補文字を得ることを特徴とする手書き文字認識
方法。
1. A handwritten character recognition method for performing handwritten character recognition on a single character of ink data input by a user using a recognition dictionary, comprising: extracting a specific stroke pattern from the ink data; A handwritten character recognition method characterized by narrowing a search range in the recognition dictionary according to an appearance position of a stroke in a total number of strokes of a stroke pattern and executing handwritten character recognition to obtain candidate characters.
【請求項2】 適切な候補文字が得られなかった場合
に、前記出現位置を変更して前記検索範囲の絞り込みを
行い、再度、手書き文字認識を行う請求項1に記載の手
書き文字認識方法。
2. The handwritten character recognition method according to claim 1, wherein when an appropriate candidate character cannot be obtained, the search position is narrowed down by changing the appearance position, and handwritten character recognition is performed again.
【請求項3】 予め利用者からの入力によって検索の深
さを表わすレベル値が設定され、適切な候補文字が検索
されなかった場合に、適切な候補文字が検索されるか前
記レベル値の表わす繰返し回数の範囲内で、前記出現位
置を逐次変更して検索範囲を絞り込み、絞り込まれた検
索範囲での手書き文字認識を繰り返す、請求項1に記載
の手書き文字認識方法。
3. A level value indicating the depth of search is set in advance by an input from a user, and if an appropriate candidate character is not searched, an appropriate candidate character is searched or the level value is displayed. 2. The handwritten character recognition method according to claim 1, wherein the appearance position is sequentially changed within the range of the number of repetitions to narrow the search range, and the handwritten character recognition in the narrowed search range is repeated.
【請求項4】 利用者が入力した1文字分のインクデー
タに対し手書き文字認識を行う手書き文字認識装置にお
いて、 インクデータを入力する入力手段と、 前記インクデータから抽出される特徴量を用いて文字認
識を行うために使用される認識辞書と、 前記インクデータから特定のストロークパターンを抽出
し、前記抽出されたストロークパターンが入力総画数の
うちどのストロークで出現したかの出現位置に応じて前
記認識辞書における検索範囲を絞り込み、絞り込まれた
検索範囲内で前記認識辞書を参照することにより手書き
文字認識を実行する認識手段と、を有することを特徴と
する手書き文字認識装置。
4. A handwritten character recognition apparatus for performing handwritten character recognition on one character of ink data input by a user, comprising: input means for inputting ink data; and a feature value extracted from the ink data. A recognition dictionary used for performing character recognition, and a specific stroke pattern is extracted from the ink data, and the extracted stroke pattern is determined according to an appearance position of which stroke in the total number of input strokes. A handwriting character recognition device, comprising: a recognition unit that narrows a search range in a recognition dictionary and executes handwritten character recognition by referring to the recognition dictionary within the narrowed search range.
【請求項5】 適切な候補文字が得られなかった場合
に、前記出現位置を変更して前記検索範囲の絞り込みを
行い、手書き文字認識を再度実行する請求項4に記載の
手書き文字認識装置。
5. The handwritten character recognition device according to claim 4, wherein when an appropriate candidate character is not obtained, the appearance position is changed to narrow the search range, and handwritten character recognition is executed again.
【請求項6】 予め利用者からの入力によって検索の深
さを表わすレベル値が設定され、かつ適切な候補文字が
検索されなかった場合には、適切な候補文字が検索され
るか前記レベル値の表わす繰返し回数の範囲内で、前記
出現位置を逐次変更して検索範囲の絞り込みと手書き文
字認識とを繰り返し実行する、請求項4に記載の手書き
文字認識装置。
6. A level value indicating a search depth is set in advance by an input from a user, and if an appropriate candidate character is not searched, an appropriate candidate character is searched or said level value is set. 5. The handwritten character recognition device according to claim 4, wherein the appearance position is sequentially changed within the range of the number of repetitions represented by the expression, and the narrowing of the search range and the handwritten character recognition are repeatedly executed.
【請求項7】 インクデータを入力するための入力部を
備えたコンピュータが読み取り可能な記録媒体であっ
て、 利用者が入力した1文字分のインクデータに対し文字認
識を行うための認識辞書と、 前記インクデータから特定のストロークパターンを抽出
し、前記抽出されたストロークパターンが入力総画数の
うちどのストロークで出現したかの出現位置に応じて前
記認識辞書における検索範囲を絞り込み、前記認識辞書
を参照して手書き文字認識を実行し候補文字を得る工程
をコンピュータに実行させるプログラムと、を格納した
記録媒体。
7. A computer-readable recording medium having an input section for inputting ink data, comprising: a recognition dictionary for performing character recognition on one character of ink data input by a user; Extracting a specific stroke pattern from the ink data, narrowing a search range in the recognition dictionary in accordance with an appearance position of the stroke in which the extracted stroke pattern appears in the total number of strokes, and A program for causing a computer to execute a step of executing handwritten character recognition with reference to obtain candidate characters, and a recording medium storing the program.
JP9194026A 1996-07-24 1997-07-18 Method and device for recognizing handwritten character and its recording medium Withdrawn JPH1091727A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9194026A JPH1091727A (en) 1996-07-24 1997-07-18 Method and device for recognizing handwritten character and its recording medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-194757 1996-07-24
JP19475796 1996-07-24
JP9194026A JPH1091727A (en) 1996-07-24 1997-07-18 Method and device for recognizing handwritten character and its recording medium

Publications (1)

Publication Number Publication Date
JPH1091727A true JPH1091727A (en) 1998-04-10

Family

ID=26508252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9194026A Withdrawn JPH1091727A (en) 1996-07-24 1997-07-18 Method and device for recognizing handwritten character and its recording medium

Country Status (1)

Country Link
JP (1) JPH1091727A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9171218B2 (en) 2011-11-24 2015-10-27 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
CN108648758A (en) * 2018-03-12 2018-10-12 北京云知声信息技术有限公司 The method and system of invalid voice are detached in medical scene

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9171218B2 (en) 2011-11-24 2015-10-27 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
CN108648758A (en) * 2018-03-12 2018-10-12 北京云知声信息技术有限公司 The method and system of invalid voice are detached in medical scene
CN108648758B (en) * 2018-03-12 2020-09-01 北京云知声信息技术有限公司 Method and system for separating invalid voice in medical scene

Similar Documents

Publication Publication Date Title
US10156981B2 (en) User-centric soft keyboard predictive technologies
KR101003879B1 (en) Virtual keyboard system with automatic correction
CN105893338B (en) Method and device for inputting formula and electronic equipment
Sriraghavendra et al. Fréchet distance based approach for searching online handwritten documents
US5579408A (en) Character recognition method and apparatus
JPH1153402A (en) Information retrieval device
CN107273032A (en) Information typesetting method, device and equipment and computer storage medium
WO1998055957A1 (en) Partial results in full context handwriting recognition
CN102750552B (en) Handwriting recognition method and system as well as handwriting recognition terminal
US8009915B2 (en) Recognition of mathematical expressions
KR20050081555A (en) Apparatus and method for searching for digital ink query
US6731803B1 (en) Points based handwriting recognition system
Zanibbi et al. Math search for the masses: Multimodal search interfaces and appearance-based retrieval
US9384304B2 (en) Document search apparatus, document search method, and program product
TWI503740B (en) A method of improving handwriting input efficiency
CN104898855A (en) System and method for inputting texts on basis of devices with rockers
JPH1091727A (en) Method and device for recognizing handwritten character and its recording medium
JPH1097594A (en) Method and device for handwritten character recognition, and their recording medium
CN109758763A (en) Character input method and device based on game pad
KR100204618B1 (en) Method and system for recognition of character or graphic
JPH07117993B2 (en) A User-Specific Prototype Set Generation Method for Handwritten Character Recognition
JP5911981B2 (en) Document search apparatus, method and program
JPH0793483A (en) Method and device for recognizing handwritten character
JP2000076239A (en) Character input device
CN117917621A (en) Chinese character input method and system and keyboard

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041005