JP3138665B2 - Handwritten character recognition method and recording medium - Google Patents

Handwritten character recognition method and recording medium

Info

Publication number
JP3138665B2
JP3138665B2 JP09204893A JP20489397A JP3138665B2 JP 3138665 B2 JP3138665 B2 JP 3138665B2 JP 09204893 A JP09204893 A JP 09204893A JP 20489397 A JP20489397 A JP 20489397A JP 3138665 B2 JP3138665 B2 JP 3138665B2
Authority
JP
Japan
Prior art keywords
stroke
character
recognition
handwriting
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09204893A
Other languages
Japanese (ja)
Other versions
JPH1153470A (en
Inventor
厚行 呉屋
Original Assignee
沖縄日本電気ソフトウェア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 沖縄日本電気ソフトウェア株式会社 filed Critical 沖縄日本電気ソフトウェア株式会社
Priority to JP09204893A priority Critical patent/JP3138665B2/en
Publication of JPH1153470A publication Critical patent/JPH1153470A/en
Application granted granted Critical
Publication of JP3138665B2 publication Critical patent/JP3138665B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は手書き文字認識方式
および記録媒体に関し、特にペン入力装置により手書き
入力された文字を認識する手書き文字認識方式と、この
手書き文字認識方式をコンピュータにより実現するため
のプログラム及び辞書データが格納されている記録媒体
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a handwritten character recognition system and a recording medium, and more particularly, to a handwritten character recognition system for recognizing characters handwritten by a pen input device, and a computer-implemented handwritten character recognition system. The present invention relates to a recording medium storing a program and dictionary data.

【0002】[0002]

【従来の技術】文字認識における一般的な手法は、入力
された文字パターンを文字認識用辞書(参照パターンデ
ータベース)に登録されているすべての文字の基準パタ
ーンと比較し、パターンが最も類似する数個の文字を候
補文字として抽出し、その文字コードを類似度(類似の
度合いを示す評価数値)の順にメモリに保存しておき、
その中の最も類似度の高い文字を認識結果として画面に
表示するもので、文字全体のパターン比較を基本としビ
ットマップ方式と呼ばれている。
2. Description of the Related Art A general method of character recognition is to compare an input character pattern with a reference pattern of all characters registered in a character recognition dictionary (reference pattern database), and to determine the number of patterns most similar to each other. Characters are extracted as candidate characters, and their character codes are stored in memory in the order of similarity (an evaluation value indicating the degree of similarity),
A character having the highest similarity among the characters is displayed on the screen as a recognition result, and is called a bitmap method based on pattern comparison of the entire character.

【0003】手書き文字の認識には、あらかじめ原稿用
紙等に書かれた文字をスキャナ等で取り込んで処理する
オフライン文字認識と、タブレット上にペンで書き込む
文字をリアルタイムで処理するオンライン文字認識とが
ある。前者の場合には、取り込んだ文字を点の集合とし
て扱い基準パターンと比較するビットマップ方式に限ら
れるが、後者の場合には、書き込まれる筆跡から文字パ
ターンの情報に加えて書き順や画数などの他の情報も得
られ、これらの情報を利用した方法も提案されている。
しかしながら、これらの情報にも個人差や不確定な要素
が多く、文字全体の筆跡パターンをビットマップ化して
文字認識を行うビットマップ方式が基本となっている。
There are two types of handwritten character recognition: off-line character recognition in which characters written in advance on original paper or the like are read and processed by a scanner or the like, and online character recognition in which characters written on a tablet with a pen are processed in real time. . In the former case, the captured characters are treated as a set of points and are compared with the reference pattern.The latter is limited to the bitmap method. Other information can be obtained, and a method using such information has been proposed.
However, there are many individual differences and uncertain factors in these pieces of information, and a bitmap system for performing character recognition by converting a handwriting pattern of the entire character into a bitmap is fundamental.

【0004】ビットマップ方式による手書き文字認識の
認識精度を向上する一方策として、特開平7―2822
01号公報には、ビットマップの各画素の画素値を濃淡
を表す多値情報とし、ストロークの長さ等による重み付
けを行って画素値を決定する方法が提案されているが、
一般には、ビットマップの各画素値には白黒を表す2値
情報が用いられる。
As one measure for improving the recognition accuracy of handwritten character recognition by the bitmap method, Japanese Patent Laid-Open Publication No.
No. 01 discloses a method in which the pixel value of each pixel of a bitmap is set as multi-valued information representing shading, and a pixel value is determined by performing weighting based on a stroke length or the like.
In general, binary information representing black and white is used for each pixel value of a bitmap.

【0005】図9は、ビットマップによる従来の手書き
文字認識方式の基本構成を示したブロック図である。従
来の手書き文字認識方式は、図9に示すように、ペン入
力装置1と、プログラム制御により動作するデータ処理
装置2bと、各種情報を記憶する記憶装置3bと、認識
処理に使用する文字認識用辞書部41bが格納されてい
る辞書記憶装置4bと、表示装置5とで構成されてお
り、データ処理装置2bが、ペン入力装置1に書き込ま
れた文字の筆跡パターンを辞書記憶装置4bと照合し、
最も確からしい文字を認識結果として表示装置5に表示
する。
FIG. 9 is a block diagram showing a basic configuration of a conventional handwritten character recognition system using a bit map. As shown in FIG. 9, a conventional handwritten character recognition method includes a pen input device 1, a data processing device 2b operated under program control, a storage device 3b for storing various information, and a character recognition device used for recognition processing. The data processing device 2b includes a dictionary storage device 4b in which the dictionary unit 41b is stored, and a display device 5. The data processing device 2b checks a handwriting pattern of a character written in the pen input device 1 with the dictionary storage device 4b. ,
The most probable character is displayed on the display device 5 as a recognition result.

【0006】このため、辞書記憶装置4bの文字認識用
辞書部41bには、図10に示すように、文字コードと
その文字の標準的形状(基準パターン)を表すビットマ
ップ情報とが対応付けて格納されており、データ処理装
置2bには、筆跡データ取得処理部21,文字認識処理
部22b及び認識結果表示部26が、記憶装置3bに
は、処理中の各種情報を一時保存するための筆跡データ
保存部31と文字認識結果保存部32bとが設けられて
いる。
For this reason, as shown in FIG. 10, the character recognition dictionary unit 41b of the dictionary storage device 4b associates a character code with bitmap information representing a standard shape (reference pattern) of the character. The data processing device 2b includes a handwriting data acquisition processing unit 21, a character recognition processing unit 22b, and a recognition result display unit 26. The storage device 3b includes handwriting for temporarily storing various information being processed. A data storage unit 31 and a character recognition result storage unit 32b are provided.

【0007】筆跡データ取得処理部21は、ペン入力装
置1に書き込まれた筆跡の位置座標データを順次取得
し、文字の大きさを基準化する等の正規化処理を行って
1文字分の筆跡をビットマップ化し、筆跡パターンを表
すビットマップ情報を筆跡データ保存部31に保存す
る。文字認識処理部22bは、筆跡データ保存部31に
保存された筆跡パターンを文字認識用辞書部41bに格
納されているビットマップ情報と順次照合して類似の度
合いを数値化した類似度を算出し、類似度の高い順に複
数の候補文字を選択(認識)して文字コードを文字認識
結果保存部32bに保存する。認識結果表示部26は、
文字認識結果保存部32bに保存した候補文字の中から
最も類似度の高い文字の文字コードを認識結果として表
示装置5へ送り表示させる。
The handwriting data acquisition processing unit 21 sequentially acquires handwriting position coordinate data written in the pen input device 1, performs normalization processing such as standardizing the size of characters, and performs handwriting for one character. Is converted into a bitmap, and the bitmap information representing the handwriting pattern is stored in the handwriting data storage unit 31. The character recognition processing unit 22b sequentially compares the handwriting pattern stored in the handwriting data storage unit 31 with the bitmap information stored in the character recognition dictionary unit 41b, and calculates the similarity by quantifying the similarity. Then, a plurality of candidate characters are selected (recognized) in descending order of similarity, and the character codes are stored in the character recognition result storage unit 32b. The recognition result display unit 26
The character code of the character having the highest similarity among the candidate characters stored in the character recognition result storage unit 32b is sent to the display device 5 as the recognition result and displayed.

【0008】図11は、図9の従来の手書き文字認識方
式の処理手順を示したフローチャートである。以下、図
11に従って従来の文字認識の動作について説明する。
FIG. 11 is a flowchart showing a processing procedure of the conventional handwritten character recognition system of FIG. Hereinafter, a conventional character recognition operation will be described with reference to FIG.

【0009】ペン入力装置1に入力された筆跡は、筆跡
データ取得処理部21によって取得され(ステップS2
1)、ビットマップ化され筆跡パターンが筆跡データ保
存部31へ保存される(ステップS22)。文字認識処
理部22bは、1文字分の筆跡パターンを文字認識用辞
書部41bのビットマップ情報と比較して類似度の高い
順に複数の候補文字を個抽出し(ステップS23)、候
補文字の文字コードを類似度順に文字認識結果保存部3
2bに保存する(ステップS24)。候補文字の抽出が
終了すると、認識結果表示部26が一番類似度の高い先
頭の候補文字の文字コードを表示装置5に送出し、画面
上に認識結果として表示させる(ステップS25)。な
お、表示した認識結果が正しくないときは、次候補の表
示が行われ、正しければ確認処理により該当文字の情報
は記憶装置3から消去される。
The handwriting input to the pen input device 1 is acquired by the handwriting data acquisition processing unit 21 (step S2).
1) The bit-mapped handwriting pattern is stored in the handwriting data storage unit 31 (step S22). The character recognition processing unit 22b compares the handwriting pattern for one character with the bitmap information of the character recognition dictionary unit 41b and extracts a plurality of candidate characters in descending order of similarity (step S23). Character recognition result storage 3 for codes in order of similarity
2b (step S24). When the extraction of the candidate characters is completed, the recognition result display unit 26 sends the character code of the first candidate character having the highest similarity to the display device 5 and displays it as a recognition result on the screen (step S25). If the displayed recognition result is incorrect, the next candidate is displayed, and if correct, the information of the corresponding character is deleted from the storage device 3 by the confirmation process.

【0010】[0010]

【発明が解決しようとする課題】上述した従来のビット
マップ方式による文字認識の第1の問題点は、文字全体
をビットマップ化して認識処理を行うため、文字の書き
順に影響されない反面、似た形の文字に誤認識されやす
いことである。文字認識用辞書のビットマップ情報は、
平均的な基準パターンで作成されているため、癖文字等
の個人特有の差が大きい手書き文字の場合には誤認識の
確率も大きくなる。これを改善するためには、個人別の
専用辞書を作成するなどの対策も考えられるが、入力装
置に書き込まれた文字をリアルタイムで処理するオンラ
イン文字認識においては、文字全体の筆跡パターン以外
の取得可能な情報を有効に利用することが考えられる。
The first problem of the character recognition by the conventional bitmap method described above is that the entire character is converted into a bitmap and the recognition process is performed. It is easy to be misrecognized by a shape character. The bitmap information of the character recognition dictionary is
Since it is created with an average reference pattern, the probability of erroneous recognition increases in the case of handwritten characters such as habit characters having a large individual difference. To improve this, measures such as creating a personalized dictionary for each individual are conceivable.However, in online character recognition, which processes characters written to an input device in real time, it is necessary to obtain a pattern other than the handwriting pattern of the entire character. It is conceivable to use available information effectively.

【0011】第2の問題点は、文字認識用辞書に登録さ
れている文字のすべてに対して入力筆跡パターンとの比
較を行い候補文字を選択するため、文字認識処理に時間
がかかることである。
A second problem is that it takes a long time to perform the character recognition process because all of the characters registered in the character recognition dictionary are compared with the input handwriting pattern and candidate characters are selected. .

【0012】本発明の目的は、手書き文字の入力におい
て最も重要と思われる一画目に着目し、従来の文字全体
のパターンによる認識処理に加え一画目の情報を加味し
た認識処理を行うことにより、より高い精度の認識率を
確保でき、更に処理時間を短縮することができる手書き
文字の認識処理方式を提供することである。
An object of the present invention is to focus on the first stroke considered to be most important in inputting handwritten characters, and to perform a recognition process in which information of the first stroke is added in addition to the conventional recognition process based on the pattern of the entire character. Accordingly, it is an object of the present invention to provide a handwritten character recognition processing method capable of securing a higher accuracy recognition rate and further reducing the processing time.

【0013】[0013]

【課題を解決するための手段】請求項1の手書き文字認
識方式は、ペン入力装置に手書き入力された文字の筆跡
パターンを文字認識用辞書に格納されている基準パター
ンと比較して文字認識を行う手書き文字認識方式におい
て、手書きの最初のストロークに使用される一画目の基
準パターンを識別情報と対応させて格納した一画目専用
辞書と、入力された1文字分の筆跡パターンから一画目
の筆跡パターンを抽出する一画目情報抽出手段と、この
一画目情報抽出手段で抽出した一画目の筆跡パターンを
前記一画目専用辞書と比較して対応する識別情報を求め
る一画目認識手段と、前記一画目専用辞書に格納されて
いる識別情報が文字群を分類する分類番号であり、前記
文字認識用辞書には文字の基準パターンに対応して文字
コードに加えて前記分類番号が格納され、前記文字認識
用辞書による文字認識で得られた候補文字の分類番号が
前記一画目認識手段により得られた分類番号と一致した
ときに当該候補文字の評価順位の修正を行う候補順位修
正手段とを備え、前記文字認識用辞書による文字認識と
前記一画目認識手段による認識とを併用することを特徴
とする。
According to a first aspect of the present invention, there is provided a handwritten character recognition system for comparing a handwriting pattern of a character input by handwriting with a pen input device with a reference pattern stored in a character recognition dictionary. In the handwritten character recognition method to be performed, a dictionary dedicated to the first stroke in which the reference pattern of the first stroke used for the first stroke of the handwriting is stored in association with the identification information, and one stroke from the input handwriting pattern for one character A first stroke information extracting unit for extracting a handwriting pattern of an eye, and a first stroke for obtaining corresponding identification information by comparing the first stroke handwriting pattern extracted by the first stroke information extracting unit with the first stroke dedicated dictionary; Eye recognition means , stored in the first stroke dedicated dictionary
Identification information is a classification number for classifying a character group,
Character recognition dictionaries contain characters corresponding to the reference pattern of characters.
The classification number is stored in addition to the code, and the character recognition is performed.
The classification number of the candidate character obtained by character recognition
Matched with the classification number obtained by the first stroke recognition means
Candidate ranking correction that sometimes corrects the evaluation rank of the candidate character
And a character recognition unit, wherein character recognition by the character recognition dictionary and recognition by the first stroke recognition unit are used in combination.

【0014】請求項2の手書き文字認識方式は、ペン入
力装置に手書き入力された文字の筆跡パターンを文字認
識用辞書に格納されている基準パターンと比較して文字
認識を行う手書き文字認識方式において、手書きの最初
のストロークに使用される一画目の基準パターンを識別
情報と対応させて格納した一画目専用辞書と、入力され
た1文字分の筆跡パターンから一画目の筆跡パターンを
抽出する一画目情報抽出手段と、この一画目情報抽出手
段で抽出した一画目の筆跡パターンを前記一画目専用辞
書と比較して対応する識別情報を求める一画目認識手段
とを備え、前記文字認識用辞書による文字認識と前記一
画目認識手段による認識とを併用し、かつ前記一画目専
用辞書に格納されている識別情報が、該当する一画目を
使用する複数の文字の文字コード群であることを特徴と
する。
According to a second aspect of the present invention , there is provided a handwritten character recognizing method.
Character recognition of handwriting patterns of characters input by handwriting
Characters compared with the reference pattern stored in the dictionary
In the handwriting recognition system that recognizes
Identify the first reference pattern used for each stroke
A dictionary dedicated to the first stroke stored in association with the information
From the handwriting pattern for one character
First stroke information extracting means for extracting the first stroke information extracting means;
The handwriting pattern of the first stroke extracted in the step
First stroke recognizing means for finding the corresponding identification information by comparing with the text
Character recognition by the character recognition dictionary and
In addition to the recognition by the stroke recognition means,
The identification information stored in the dictionary for
Character code group of multiple characters to use
I do.

【0015】[0015]

【0016】[0016]

【0017】請求項の記録媒体は、請求項1または2
に記載した各手段の処理をコンピュータにより実現する
ためのプログラム及び文字認識用辞書、一画目専用辞書
の辞書データが格納されていることを特徴としている。
According to a third aspect of the present invention, there is provided the recording medium according to the first or second aspect.
A program for realizing the processing of each means described in (1) by a computer, a dictionary for character recognition, and dictionary data of a dictionary dedicated to the first stroke are stored.

【0018】[0018]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
Next, embodiments of the present invention will be described with reference to the drawings.

【0019】図1は、本発明の第1の実施の形態の構成
を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of the first embodiment of the present invention.

【0020】本発明の第1の実施の形態は、図1に示す
ように、ペン入力装置1と、プログラム制御によって動
作するデータ処理装置2と、各種情報を記憶する記憶装
置3と、認識処理に使用する辞書を格納している辞書記
憶装置4と、認識結果を表示する表示装置5とで構成さ
れている。
In the first embodiment of the present invention, as shown in FIG. 1, a pen input device 1, a data processing device 2 operated by program control, a storage device 3 for storing various information, a recognition process And a display device 5 for displaying the recognition result.

【0021】この第1の実施の形態は、1文字分のパタ
ーンの比較により認識を行う従来のビットマップ方式の
文字認識に加え、各文字の一画目(書き出しの第1番目
のストローク)だけを対象としたパターン認識を行い、
その一画目の認識結果を加味して精度の高い認識結果を
得ようとするものである。このため、辞書記憶装置4に
は、通常の文字全体のパターン認識用の文字認識用辞書
部41に加え、一画目のパターン認識用に使用する一画
目専用辞書部42を備え、データ処理装置2には、通常
の文字全体のパターン認識に使用する筆跡データ取得処
理部21,文字認識処理部22,認識結果表示部26の
ほかに、一画目のパターン認識を行うための一画目情報
抽出処理部23,一画目認識処理部24と、一画目の認
識結果を文字認識結果に反映させるための一画目判定処
理部25とを備えている。なお、記憶装置3には、筆跡
データ取得処理部21がペン入力装置1から取得した筆
跡パターンを保存する筆跡データ保存部31と、文字認
識処理部22が抽出した候補文字を保存する文字認識結
果保存部32と、一画目情報抽出処理部23が抽出した
一画目の情報を保存する一画目情報保存部33と、一画
目認識処理部24が認識した一画目の分類番号を保存す
る一画目認識結果保存部34とが設けられている。
In the first embodiment, in addition to the conventional bitmap type character recognition in which recognition is performed by comparing patterns of one character, only the first stroke (first stroke of writing) of each character is performed. Perform pattern recognition for
It is intended to obtain a highly accurate recognition result in consideration of the recognition result of the first stroke. For this reason, the dictionary storage device 4 includes a first stroke dedicated dictionary unit 42 used for pattern recognition of the first stroke in addition to a character recognition dictionary unit 41 for pattern recognition of normal whole characters. The apparatus 2 includes a handwriting data acquisition processing unit 21, a character recognition processing unit 22, and a recognition result display unit 26 that are used for normal whole pattern recognition of a character, and a first image for performing pattern recognition of a first image. It includes an information extraction processing unit 23, a first stroke recognition processing unit 24, and a first stroke determination processing unit 25 for reflecting the recognition result of the first stroke on the character recognition result. The storage device 3 includes a handwriting data storage unit 31 that stores the handwriting pattern obtained by the handwriting data acquisition processing unit 21 from the pen input device 1 and a character recognition result that stores the candidate characters extracted by the character recognition processing unit 22. A storage unit 32, a first-screen information storage unit 33 for storing information of the first screen extracted by the first-screen information extraction processing unit 23, and a classification number of the first screen recognized by the first-screen recognition processing unit 24. A first stroke recognition result storage unit 34 to be stored is provided.

【0022】最初に、辞書記憶装置4に備えられる各辞
書の構成について説明する。一画目専用辞書部42は、
一画目のパターン認識用に使用される基準パターンを登
録した辞書であり、図2(a)に示すように、一画目の
形状および書き出し位置により分類した分類番号と、一
画目の形状を認識するための基準パターンを表すビット
マップ情報と、一画目の書き出し位置の座標を示す位置
情報との3種類の情報が格納されている。分類番号は、
図の右側に「対応する文字グループ」として示したよう
に、一画目の形状が同じで書き出し位置も同様な文字を
同じ一画目の文字グループとして分類し、文字グループ
ごとに付けた番号であり、一画目の形状と書き出し位置
に対応している。
First, the configuration of each dictionary provided in the dictionary storage device 4 will be described. The first stroke dedicated dictionary unit 42
FIG. 2A is a dictionary in which reference patterns used for pattern recognition of the first stroke are registered. As shown in FIG. 2A, a classification number classified according to the shape and writing position of the first stroke, and the shape of the first stroke , And three types of information, that is, bitmap information representing a reference pattern for recognizing the first stroke and position information indicating the coordinates of the writing start position of the first stroke. The classification number is
As shown as "corresponding character group" on the right side of the figure, characters with the same shape of the first stroke and the same writing position are classified as the same first stroke character group, and the number assigned to each character group is Yes, corresponding to the shape and writing position of the first stroke.

【0023】位置情報(x,y)は、一画目の書き出し
位置の座標値であり、文字全体の大きさに対する相対位
置を表すものである。図2(b)を参照して具体的に説
明する。(イ)のような「石」という文字を考える。ま
ず、(ロ)のように「石」の文字に外接する矩形を抽出
する。次に、(ハ)のように抽出した矩形の縦横をそれ
ぞれ規定数に等分割し、一画目の「一」の書き出し位置
座標として図2(a)の位置情報(3,0)が得られ
る。
The position information (x, y) is a coordinate value of the writing start position of the first stroke, and indicates a relative position with respect to the size of the entire character. This will be specifically described with reference to FIG. Consider the letter "stone" as in (a). First, a rectangle circumscribing the character "stone" as shown in (b) is extracted. Next, as shown in (c), the height and width of the extracted rectangle are equally divided into a specified number, respectively, and the position information (3, 0) in FIG. Can be

【0024】位置情報は、同じような形状の一画目の認
識を行うときの判定基準に使用される。例えば、「木」
「本」等の文字グループと「石」「厚」等の文字グルー
プとを分ける場合、一画目の形状は共に「一」であるの
で、ビットマップ情報で形状のみを規定して照合の自由
度を大きくすると、ビットマップ情報だけではどちらの
文字グループか判定できない。そこで位置情報を付加す
ることにより、書き出し位置も比較してより近い方の文
字グループを特定できるように構成した。
The position information is used as a criterion for recognizing the first stroke of a similar shape. For example, "tree"
When character groups such as "books" and character groups such as "stone" and "thickness" are separated, the shape of the first stroke is both "1". If the degree is increased, it cannot be determined which character group is based on the bitmap information alone. Therefore, by adding the position information, the writing position is also compared so that a character group closer to the writing position can be specified.

【0025】文字認識用辞書部41には、図3に示すよ
うに、文字コードと、その文字を認識するためのビット
マップ情報と、文字が属する一画目の分類を示す分類番
号との3種類の情報が格納されている。文字コードとビ
ットマップ情報とは、従来の文字認識用辞書と同じであ
るが、分類番号の情報が新たに追加されている。
As shown in FIG. 3, the character recognition dictionary unit 41 stores a character code, bitmap information for recognizing the character, and a classification number indicating the classification of the first stroke to which the character belongs. Type information is stored. The character code and the bitmap information are the same as those of the conventional character recognition dictionary, but the information of the classification number is newly added.

【0026】次に、上述した辞書記憶装置4の各辞書お
よび記憶装置3を使用して認識処理を行うデータ処理装
置2の各部の動作について説明する。なお、前述した図
9の従来方式と同一参照番号を用いた筆跡データ取得処
理部21及び認識結果表示部26は、図9の場合と同一
の処理を行う。
Next, the operation of each section of the data processing apparatus 2 that performs recognition processing using the dictionaries of the dictionary storage device 4 and the storage device 3 will be described. Note that the handwriting data acquisition processing unit 21 and the recognition result display unit 26 using the same reference numerals as those in the conventional method of FIG. 9 perform the same processing as in FIG.

【0027】筆跡データ取得処理部21は、ペン入力装
置1に書き込まれた筆跡の位置座標データを順次取得
し、文字の大きさを基準化する等の正規化処理を行って
1文字分の筆跡をビットマップ化し、筆跡パターンを表
すビットマップ情報を筆跡データ保存部31に保存す
る。
The handwriting data acquisition processing unit 21 sequentially acquires handwriting position coordinate data written in the pen input device 1, performs normalization processing such as standardizing the character size, and performs handwriting for one character. Is converted into a bitmap, and the bitmap information representing the handwriting pattern is stored in the handwriting data storage unit 31.

【0028】文字認識処理部22は、筆跡データ保存部
31に保存された1文字分の筆跡パターンを読み出し、
文字認識用辞書部41に格納されているビットマップ情
報と順次比較し、パターンの類似の度合いを数値化した
類似度を算出し、類似度の高い順にあらかじめ定められ
た個数の複数の候補文字を抽出し、その文字コード,分
類番号および順番を評価するために数値化した値である
信頼度を認識結果保存部32に保存する。この際、信頼
度としては第1順位のものに最大の数値を割り当て、順
位が下がるほど小さい数値とする。
The character recognition processing unit 22 reads out the handwriting pattern for one character stored in the handwriting data storage unit 31,
It sequentially compares the bitmap information with the bitmap information stored in the character recognition dictionary unit 41, calculates the similarity by quantifying the degree of similarity of the pattern, and calculates a predetermined number of candidate characters in descending order of similarity. The extracted character codes, the classification numbers, and the reliability, which is a numerical value for evaluating the order, are stored in the recognition result storage unit 32. At this time, the largest numerical value is assigned to the first rank as the reliability, and the lower the rank, the smaller the numerical value.

【0029】一画目情報抽出処理部23は、筆跡データ
保存部31に保存される1文字分の筆跡パターンの中か
ら、一画目の筆跡パターンのみを抽出し、書き出し位置
の情報と共に一画目情報保存部33に保存する。
The first stroke information extraction processing unit 23 extracts only the first stroke handwriting pattern from the stroke patterns of one character stored in the handwriting data storage unit 31, and extracts the first stroke handwriting pattern together with the writing start position information. It is stored in the eye information storage unit 33.

【0030】一画目認識処理部24は、一画目情報保存
部33に保存されている一画目の筆跡パターンと位置情
報とを読み出し、一画目専用辞書部41のビットマップ
情報および位置情報と比較し、最も類似度の高い一画目
の分類番号を取得し一画目認識結果保存部34に保存す
る。一画目認識処理部24は、文字認識処理部22と同
様にビットマップ方式によるパターン認識処理を行う
が、文字認識処理部22が文字全体のビットマップ情報
を比較して複数の候補文字(文字コード)を抽出するの
に対して、一画目認識処理部24は一画目だけのビット
マップ情報と書き出し位置情報とを比較し、最も類似度
の高い分類番号を一つだけ抽出する。
The first stroke recognition processing unit 24 reads the handwriting pattern and the position information of the first stroke stored in the first stroke information storage unit 33, and stores the bitmap information and the position of the first stroke dedicated dictionary unit 41. Compared with the information, the classification number of the first stroke having the highest similarity is acquired and stored in the first stroke recognition result storage unit 34. The first stroke recognition processing unit 24 performs a pattern recognition process based on a bitmap method in the same manner as the character recognition processing unit 22. However, the character recognition processing unit 22 compares the bitmap information of the entire character with a plurality of candidate characters (characters). On the other hand, the first stroke recognition processing unit 24 compares the bitmap information of only the first stroke with the writing position information, and extracts only one classification number having the highest similarity.

【0031】一画目判定処理部25は、文字認識結果保
存部32に保存されている候補文字の中に一画目認識結
果保存部34に保存されている分類番号と同じ分類番号
の文字があるかを判定し、ある場合にはその文字の信頼
度にあらかじめ定めた数値を加算して信頼度を修正し、
信頼度の修正に伴って候補文字の並びを新たな信頼度順
に並べ替えを行う。
The first-stroke determination processing unit 25 determines that a character having the same classification number as the classification number stored in the first-stroke recognition result storage unit 34 among the candidate characters stored in the character recognition result storage unit 32. Judge whether there is, and if so, add a predetermined numerical value to the reliability of the character and correct the reliability,
With the modification of the reliability, the arrangement of the candidate characters is rearranged in the order of the new reliability.

【0032】認識結果表示部26は、並べ替え後の最も
信頼度の高い候補文字の文字コードを認識結果として表
示装置5に送り表示させる。表示結果に対して確認指示
が出されると、当該文字コードが文章データ中に確定情
報として組み込まれ、記憶装置3の対象文字に関する保
存情報はクリアされるが、次候補指示が出された場合に
は、文字認識結果保存部32に保存されている候補文字
の中から次に信頼度の高い候補文字の文字コードが表示
装置5に送られる。
The recognition result display section 26 sends the character code of the candidate character having the highest reliability after rearrangement to the display device 5 as a recognition result and displays it. When a confirmation instruction is issued for the display result, the character code is incorporated as final information in the sentence data, and the storage information on the target character in the storage device 3 is cleared, but when the next candidate instruction is issued, The character code of the candidate character having the next highest reliability among the candidate characters stored in the character recognition result storage unit 32 is sent to the display device 5.

【0033】図4は、図1に示した本発明の第1の実施
の形態の動作を示すフローチャートである。以下、図1
を参照しながら図4に従って第1の実施の形態の処理に
ついて説明する。
FIG. 4 is a flowchart showing the operation of the first embodiment of the present invention shown in FIG. Hereinafter, FIG.
The processing of the first embodiment will be described with reference to FIG.

【0034】ペン入力装置1から入力された1文字分の
筆跡は、筆跡データ取得処理部21で読み取られて正規
化され(ステップS1)、筆跡パターンを筆跡データ保
存部31へ保存される(ステップS2)。文字認識処理
部22は、1文字分の筆跡パターンを文字認識用辞書部
41のビットマップ情報と順次比較し、類似度の高い順
に複数個の候補文字を抽出し(ステップS3)、抽出し
た候補文字の文字コード及び分類番号を順位を定量化し
た信頼度と共に文字認識結果保存部32に保存する(ス
テップS4)。
The handwriting for one character input from the pen input device 1 is read and normalized by the handwriting data acquisition processing unit 21 (step S1), and the handwriting pattern is stored in the handwriting data storage unit 31 (step S1). S2). The character recognition processing unit 22 sequentially compares the handwriting pattern for one character with the bitmap information of the character recognition dictionary unit 41, extracts a plurality of candidate characters in descending order of similarity (step S3), and extracts the extracted candidate characters. The character code and the classification number of the character are stored in the character recognition result storage unit 32 together with the reliability in which the order is quantified (step S4).

【0035】一画目情報抽出処理部23は、筆跡データ
保存部31に保存された1文字分の筆跡パターンからそ
の文字の一画目の筆跡パターンだけを抽出し、書き出し
位置情報と共に一画目情報保存部33に保存する(ステ
ップS5)。続いて、一画目認識処理部24は、一画目
情報保存部33に保存された一画目の筆跡パターンと位
置情報とを読み出し、一画目専用辞書部42のビットマ
ップ情報および位置情報と比較して最も類似度の高い情
報を抽出し、その一画目の分類番号を取得し一画目認識
結果保存部34に保存する(ステップS6)。
The first stroke information extraction processing unit 23 extracts only the first stroke pattern of the character from the stroke pattern of one character stored in the stroke data storage unit 31 and extracts the first stroke pattern together with the writing start position information. The information is stored in the information storage unit 33 (step S5). Subsequently, the first stroke recognition processing unit 24 reads the handwriting pattern and the position information of the first stroke stored in the first stroke information storage unit 33, and stores the bitmap information and the position information of the first stroke dedicated dictionary unit 42. Then, information having the highest similarity is extracted, the classification number of the first stroke is obtained, and stored in the first stroke recognition result storage unit 34 (step S6).

【0036】次に、一画目判定処理部25において、一
画目認識結果保存部34に保存されている分類番号と文
字認識結果保存部32に保存されている候補文字の分類
番号をそれぞれ比較していき、同じ分類番号の候補文字
なら信頼度にいくらかの定数を加算して信頼度を上げる
(ステップS7)。全部の候補文字との比較が終了した
ら、信頼度の高い順に候補文字を並べ替える(ステップ
S8)。この処理により、文字全体の認識結果と一画目
の認識結果の2種類の観点からの認識結果が得られたこ
とになるので認識率の向上が図れる。最後に、認識結果
表示部26で一番信頼度の高い候補文字を認識結果とし
て表示する(ステップS9)。
Next, the first stroke determination processing unit 25 compares the classification number stored in the first stroke recognition result storage unit 34 with the classification number of the candidate character stored in the character recognition result storage unit 32. Then, if the candidate character has the same classification number, the reliability is increased by adding some constant to the reliability (step S7). When the comparison with all the candidate characters is completed, the candidate characters are rearranged in descending order of reliability (step S8). By this processing, the recognition result is obtained from two viewpoints, that is, the recognition result of the entire character and the recognition result of the first stroke, so that the recognition rate can be improved. Finally, the candidate character having the highest reliability is displayed as a recognition result on the recognition result display section 26 (step S9).

【0037】次に、図5を参照して、ペン入力装置1に
「海」という文字を手書き入力した場合の具体的な処理
例について説明する。入力された座標データは筆跡デー
タ取得処理部21でビットマップ化され筆跡パターンと
して文字認識処理部22に渡される。文字認識処理部2
2は受け取った筆跡パターンを図3に示した文字認識用
辞書部41のビットマップ情報と順次比較して文字認識
を行う。その結果、類似度の高い順に「悔,侮,海,
…,撫」の10個の候補文字を抽出した場合を考える。
抽出された10個の候補文字の文字コードと分類番号と
は、類似度の高い順番に100,99,98,…91と
定数化した信頼度と共に、信頼度の高い順に文字認識結
果保存部32に(A)の状態で保存される。この時、
「海」の文字コード(8A43)は、3番目に確からし
い候補文字として信頼度「98」,分類番号「3」と共
に記憶されている。
Next, with reference to FIG. 5, a description will be given of a specific processing example in a case where the character "sea" is input by handwriting on the pen input device 1. FIG. The input coordinate data is bit-mapped by the handwriting data acquisition processing unit 21 and passed to the character recognition processing unit 22 as a handwriting pattern. Character recognition processing unit 2
2 performs character recognition by sequentially comparing the received handwriting pattern with the bitmap information of the character recognition dictionary unit 41 shown in FIG. As a result, in order of similarity, “regret, contempt, sea,
Consider the case where ten candidate characters of “.
The extracted character codes and classification numbers of the ten candidate characters are stored in the character recognition result storage unit 32 in ascending order of the degree of similarity, along with the reliability that has been converted into constants of 100, 99, 98,. (A). At this time,
The character code “8A43” of “sea” is stored with the reliability “98” and the classification number “3” as the third most likely candidate character.

【0038】次に、一画目情報抽出処理部23が入力さ
れた「海」の一画目を抽出し、抽出した一画目の筆跡パ
ターンと書き出しの位置座標を一画目情報保存部33に
保存する。続いて、一画目認識処理部24が、一画目情
報保存部33に保存しておいた筆跡パターンと位置情報
とを読み出し、図2(a)に示した一画目専用辞書部4
2のビットマップ情報および位置情報と比較し分類番号
を抽出する。「海」の場合には分類番号「3」が抽出さ
れる。抽出した分類番号は一画目認識結果保存部34に
保存する。
Next, the first stroke information extraction processing unit 23 extracts the first stroke of the input “sea”, and stores the handwriting pattern and the writing position coordinates of the extracted first stroke in the first stroke information storage unit 33. To save. Subsequently, the first stroke recognition processing unit 24 reads the handwriting pattern and the position information stored in the first stroke information storage unit 33, and reads the first stroke dedicated dictionary unit 4 shown in FIG.
2 is compared with the bitmap information and the position information of No. 2 to extract the classification number. In the case of "sea", the classification number "3" is extracted. The extracted classification number is stored in the first stroke recognition result storage unit 34.

【0039】最後に、一画目判定処理部25において、
文字認識結果保存部32に保存されている候補文字の分
類番号を、一画目認識結果保存部34に保存されている
一画目の分類番号とを比較し、同じ分類番号の候補文字
に対する信頼度を上げる。ここでは信頼度に「5」を加
えることとする。信頼度の再計算の後、修正された新た
な信頼度の順に候補文字の並べ替えを行う。並べ替えを
行った結果が文字認識結果保存部32の(B)のように
なる。この結果、それまで信頼度が3番目だった「海」
の文字が一番高い信頼度になる。
Finally, in the first stroke determination processing section 25,
The classification number of the candidate character stored in the character recognition result storage unit 32 is compared with the classification number of the first stroke stored in the first stroke recognition result storage unit 34. Increase the degree. Here, “5” is added to the reliability. After recalculation of the reliability, the candidate characters are rearranged in the order of the corrected new reliability. The result of the rearrangement is as shown in (B) of the character recognition result storage unit 32. As a result, the sea was the third most reliable
Is the most reliable.

【0040】従来の文字認識ならば、「悔」の文字が認
識結果として表示されるところを、一画目の情報を考慮
することにより、「海」の文字が正しく認識結果として
表示されるようになる。このように、形の似た異なる文
字に誤認識されることを回避できるので、認識率の向上
が期待できる。
In the conventional character recognition, where the character "regret" is displayed as the recognition result, the character "sea" is correctly displayed as the recognition result by considering the information of the first stroke. become. As described above, it is possible to avoid erroneous recognition of characters having different shapes, and thus an improvement in recognition rate can be expected.

【0041】以上詳細に説明したように、文字全体の筆
跡パターンを文字認識用辞書(文字認識用辞書部41)
と比較して認識を行う従来の文字認識手段(筆跡データ
取得処理部21,筆跡データ保存部31,文字認識処理
部22,文字認識結果保存部32,認識結果表示部2
6)に加え、一画目専用辞書(一画目専用辞書部42)
と、手書き入力のストローク情報から一画目の筆跡パタ
ーンを抽出する一画目情報抽出手段(一画目情報抽出処
理部23,一画目情報保存部33)と、一画目の筆跡パ
ターンを一画目専用辞書部と比較し分類番号を求める一
画目認識手段(一画目認識処理部24,一画目認識結果
保存部34)とを備え、候補順位修正手段(一画目判定
処理部25)により文字認識手段で抽出した候補文字の
順位を入れ替えることにより、認識率を向上させてい
る。
As described in detail above, the handwriting pattern of the entire character is stored in the character recognition dictionary (character recognition dictionary unit 41).
Character recognition means (handwriting data acquisition processing unit 21, handwriting data storage unit 31, character recognition processing unit 22, character recognition result storage unit 32, recognition result display unit 2)
6) In addition to the first stroke dictionary (first stroke dictionary 42)
A first stroke information extraction unit (first stroke information extraction processing unit 23, first stroke information storage unit 33) for extracting a first stroke handwriting pattern from stroke information of handwriting input; A first-order recognition unit (first-order recognition processing unit 24, first-order recognition result storage unit 34) for comparing with the first-only dictionary unit to obtain a classification number; The recognition rate is improved by replacing the order of the candidate characters extracted by the character recognition means by the unit 25).

【0042】上述した第1の実施の形態では、文字認識
処理部22が文字全体のパターン比較により抽出した候
補文字を認識結果保存部32に保存する際、順位を示す
情報として高い順位で大きく順位が下がると小さくなる
数値(信頼度)を格納し、一画目判定処理部25は、一
画目認識処理部24が一画目の筆跡パターンの比較で取
得した分類番号により、この信頼度の数値を修正して候
補文字の順位の入れ替えを行っている。この方法は、文
字認識処理部22における類似度の算出方法と無関係に
処理できる利点があるが、文字認識処理部22で使用す
る類似度の数値をそのまま使用して、分類番号が一致す
る候補文字の類似度に一定の数値を加算して順位の入れ
替えを行うようにしてもよい。
In the first embodiment described above, when the character recognition processing unit 22 stores the candidate characters extracted by pattern comparison of the entire character in the recognition result storage unit 32, the character recognition processing unit 22 ranks information in a higher rank as information indicating the rank. The first stroke determination processing unit 25 stores a numerical value (reliability) that becomes smaller as the first stroke is reduced, based on the classification number acquired by the first stroke recognition processing unit 24 by comparing the handwriting patterns of the first stroke. The order of candidate characters is changed by correcting the numerical value. This method has an advantage that it can be processed independently of the method of calculating the similarity in the character recognition processing unit 22. However, using the numerical value of the similarity used in the character recognition processing unit 22 as it is, a candidate character whose classification number matches The order may be switched by adding a certain numerical value to the similarity degree of.

【0043】図6は、本発明の第2の実施の形態の構成
を示すブロック図である。第2の実施の形態と上述した
第1の実施の形態との違いは、第1の実施の形態では、
文字全体のパターン比較による文字認識の結果に対し
て、一画目だけによる認識結果で補正を行うことにより
認識精度の向上を図っているが、第2の実施の形態は、
一画目だけによる認識処理を文字認識の前に行うことに
より、文字認識の際に参照する文字認識用辞書の範囲を
限定し、文字認識処理時間の短縮を可能としていること
である。
FIG. 6 is a block diagram showing the configuration of the second embodiment of the present invention. The difference between the second embodiment and the above-described first embodiment is that in the first embodiment,
The accuracy of recognition is improved by correcting the result of character recognition by pattern comparison of the entire character with the recognition result of only the first stroke.
By performing the recognition processing using only the first stroke before character recognition, the range of the character recognition dictionary to be referred to at the time of character recognition is limited, and the character recognition processing time can be reduced.

【0044】本発明の第2の実施の形態は、図6を参照
すると、図1に示した第1の実施の形態と同様に、ペン
入力装置1と、データ処理装置2aと、記憶装置3a
と、辞書記憶装置4aと、表示装置5とで構成されてい
る。
Referring to FIG. 6, a second embodiment of the present invention, like the first embodiment shown in FIG. 1, has a pen input device 1, a data processing device 2a, and a storage device 3a.
, A dictionary storage device 4a, and a display device 5.

【0045】データ処理装置2aは、第1の実施の形態
の場合と同じ処理を行う筆跡データ取得処理部21,一
画目情報抽出処理部23,一画目認識処理部24及び認
識結果表示部26と、一画目認識結果保存部34に保存
されている分類番号から文字認識処理部22aが検索す
る文字認識用辞書部41aの検索範囲を同じ分類番号の
部分だけ行うように限定する辞書検索範囲限定処理部2
7と、筆跡データ保存部31に保存されている筆跡パタ
ーンを文字認識用辞書部41aに格納されている文字中
の辞書検索範囲限定処理部27で限定された部分の文字
のみと比較し、類似度の高い順に文字認識結果保存部3
2aに候補文字を保存する文字認識処理部22aとで構
成されている。
The data processing apparatus 2a includes a handwriting data acquisition processing unit 21, a first stroke information extraction processing unit 23, a first stroke recognition processing unit 24, and a recognition result display unit that perform the same processing as in the first embodiment. 26, and a dictionary search that limits the search range of the character recognition dictionary unit 41a to be searched by the character recognition processing unit 22a from the classification numbers stored in the first stroke recognition result storage unit 34 so that only the part with the same classification number is performed. Range limit processing unit 2
7 and the handwriting pattern stored in the handwriting data storage unit 31 is compared with only the characters of the character stored in the character recognition dictionary unit 41a which are limited by the dictionary search range limitation processing unit 27. Character recognition result storage unit 3 in descending order of degree
2a for storing candidate characters.

【0046】記憶装置3aは、第1の実施の形態の場合
と同じデータを保存する筆跡データ保存部31,一画目
情報保存部33及び一画目認識結果保存部34と、文字
認識処理部22aで選択した候補文字を保存する文字認
識結果保存部32aとで構成され、文字認識結果保存部
32aの保存データの形式には、第1の実施の形態の文
字認識結果保存部32と若干の相違がある。
The storage device 3a includes a handwriting data storage unit 31, a first stroke information storage unit 33, a first stroke recognition result storage unit 34 for storing the same data as in the first embodiment, a character recognition processing unit. The character recognition result storage unit 32a stores the candidate character selected in step 22a. The format of the data stored in the character recognition result storage unit 32a is different from the character recognition result storage unit 32 of the first embodiment. There are differences.

【0047】辞書記憶装置4aは、文字認識用辞書部4
1aと一画目専用辞書部42とで構成されており、一画
目専用辞書部42は第1の実施の形態と同じフォーマッ
トで同じ配列であるのに対し、文字認識用辞書部41a
は同じフォーマットであるが配列が分類番号順になって
いる。
The dictionary storage device 4a includes a character recognition dictionary unit 4
1a and a first stroke dedicated dictionary unit 42. While the first stroke dedicated dictionary unit 42 has the same format and the same arrangement as the first embodiment, the character recognition dictionary unit 41a
Has the same format, but the sequences are ordered by classification number.

【0048】図7は、図6の第2の実施の形態の動作を
示すフローチャートである。
FIG. 7 is a flowchart showing the operation of the second embodiment of FIG.

【0049】ペン入力装置1に入力された筆跡は、筆跡
データ取得処理部21により取得され(ステップS1
1)、筆跡パターンが筆跡データ保存部31に保存され
る(ステップS12)。一画目情報抽出処理部23は、
筆跡データ保存部31に保存された筆跡パターンから一
画目の筆跡パターンと位置情報とを抽出し、一画目情報
保存部33に保存する(ステップS13)。一画目認識
処理部24は、一画目情報保存部33に保存された一画
目の筆跡パターンと位置情報とを一画目専用辞書部42
と比較して分類番号を取得し、取得した分類番号を一画
目認識結果保存部34に保存する(ステップS14)。
The handwriting input to the pen input device 1 is acquired by the handwriting data acquisition processing unit 21 (step S1).
1) The handwriting pattern is stored in the handwriting data storage unit 31 (step S12). The first stroke information extraction processing unit 23
The first handwriting pattern and position information are extracted from the handwriting pattern stored in the handwriting data storage unit 31 and stored in the first stroke information storage unit 33 (step S13). The first stroke recognition processing unit 24 stores the first stroke handwriting pattern and the position information stored in the first stroke information storage unit 33 into a first stroke dedicated dictionary unit 42.
Then, the classification number is acquired by comparing with the first stroke number, and the acquired classification number is stored in the first stroke recognition result storage unit 34 (step S14).

【0050】次に、辞書検索範囲限定処理部27におい
て、文字認識用辞書部41aと一画目認識結果保存部3
4に保存されている分類番号と比較する。文字認識用辞
書部41aのデータは、分類番号順に並んでいるので一
画目認識結果保存部34に保存されている一画目の分類
番号と同じ分類番号のデータの開始アドレスと終了アド
レスとを取得すれば、検索する範囲を限定できる(ステ
ップS15)。文字認識処理部22aは、筆跡データ保
存部31へ保存された1文字分の筆跡パターンを文字認
識用辞書部41aと比較して類似度の高い順に候補文字
を複数個抽出するが、このときの比較範囲は、辞書検索
範囲限定処理部27で取得した開始アドレスから終了ア
ドレスまでの範囲でよい(ステップS16)。このため
比較する文字の数は従来よりも少なくなり認識処理が速
くなる。抽出した候補文字の文字コードのみを文字認識
結果保存部32aに保存される(ステップS17)。最
後に、認識結果表示部26は一番類似度の高い先頭の候
補文字を認識結果として表示する(ステップS18)。
Next, in the dictionary search range limitation processing section 27, the character recognition dictionary section 41a and the first stroke recognition result storage section 3
Compare with the classification number stored in 4. Since the data of the character recognition dictionary unit 41a are arranged in the order of the classification numbers, the start address and the end address of the data having the same classification number as the classification number of the first stroke stored in the first stroke recognition result storage unit 34 are set. Once acquired, the search range can be limited (step S15). The character recognition processing unit 22a compares the handwriting pattern for one character stored in the handwriting data storage unit 31 with the character recognition dictionary unit 41a and extracts a plurality of candidate characters in descending order of similarity. The comparison range may be a range from the start address to the end address acquired by the dictionary search range limitation processing unit 27 (Step S16). For this reason, the number of characters to be compared is smaller than in the past, and the recognition process is faster. Only the character codes of the extracted candidate characters are stored in the character recognition result storage unit 32a (step S17). Finally, the recognition result display unit 26 displays the first candidate character having the highest similarity as the recognition result (step S18).

【0051】以上説明したように、本実施の形態では、
一画目認識処理部24による一画目の認識を先に行い、
その結果により辞書検索範囲限定処理部27が文字認識
用辞書部41aの検索範囲を限定するため、文字認識処
理部22aによる認識処理が高速化されると共に、一画
目の異なる類似文字は検索範囲に含まれないため、誤認
識も減り認識率も向上する。
As described above, in the present embodiment,
First stroke recognition by the first stroke recognition processing unit 24 is performed,
Since the dictionary search range limitation processing unit 27 limits the search range of the character recognition dictionary unit 41a based on the result, the speed of the recognition process by the character recognition processing unit 22a is increased, and the different similar characters in the first stroke are set in the search range. , The erroneous recognition is reduced and the recognition rate is improved.

【0052】上述した第1及び第2の実施の形態の説明
においては、一画目専用辞書部に一画目パターンを識別
する情報として分類番号を格納し、文字認識用辞書部に
は文字コードと共に分類番号を併記するものとした。こ
の分類番号を使用することにより、一画目専用辞書部の
構成が簡単となり、一画目の認識結果による候補文字の
順位の修正や検索範囲の限定が容易に行える反面、分類
番号を追加するため従来の文字認識用辞書部を変更する
ことが必要となる。これに対して、分類番号を使用せず
に、一画目パターンを識別する情報として一画目専用辞
書部に該当する文字コードを列挙すると、順位修正や範
囲限定の処理がやや複雑となるが、従来の文字認識用辞
書を変更せずに使用することができる。
In the description of the first and second embodiments, the classification number is stored as the information for identifying the first stroke pattern in the first stroke dedicated dictionary unit, and the character code is stored in the character recognition dictionary unit. Together with the classification number. By using this classification number, the configuration of the dictionary for the first stroke is simplified, and the order of candidate characters can be easily corrected and the search range can be limited based on the recognition result of the first stroke, but the classification number is added. Therefore, it is necessary to change the conventional character recognition dictionary unit. On the other hand, if the character codes corresponding to the first-stroke dedicated dictionary unit are enumerated as information for identifying the first-stroke pattern without using the classification number, the process of correcting the rank and limiting the range becomes slightly complicated. The conventional dictionary for character recognition can be used without being changed.

【0053】又、文字認識用辞書部には、文字コードと
対応して分類番号を一つだけ格納するものとして説明し
たが、一画目の書き順が一定でなく人により分かれる文
字については、複数の分類番号を登録するようにすると
よい。
The character recognition dictionary unit has been described as storing only one classification number in correspondence with the character code. However, for characters in which the stroke order of the first stroke is not fixed and is divided by a person, It is preferable to register a plurality of classification numbers.

【0054】更に、一画目専用辞書部には、一画目パタ
ーンの形状を表すビットマップ情報と共に書き出し位置
を示す位置情報を格納するものとしたが、ビットマップ
情報を形状のみでなく文字枠中の相対位置を含む情報と
し、書き出し位置を示す位置情報は削除してもよい。
Further, the dictionary for exclusive use of the first stroke stores bitmap information indicating the shape of the first stroke pattern and position information indicating the writing start position. The position information indicating the writing start position may be deleted as the information including the relative position in the middle.

【0055】なお、ペン入力装置に書き込まれた筆跡を
ビットマップ化して筆跡パターンとする処理は筆跡デー
タ取得処理部が行い、文字認識処理部は筆跡パターンを
文字認識用辞書部のビットマップ情報と照合するよう説
明したが、筆跡データ取得処理部と文字認識処理部とを
分離せずに一括して処理してもよい。
The handwriting written into the pen input device is converted into a bitmap to form a handwriting pattern by the handwriting data acquisition processing unit. The character recognition processing unit converts the handwriting pattern into bitmap information of the character recognition dictionary unit. Although the collation has been described, the handwriting data acquisition processing unit and the character recognition processing unit may be collectively processed without being separated.

【0056】図8は、本発明の第3の実施の形態の構成
を示すブロック図である。第3の実施の形態は、ペン入
力装置1と、表示装置5と、データ処理部および記憶部
を含むコンピュータ6と、記録媒体7とで構成されてい
る。記録媒体7には、前述した第1又は第2の実施の形
態におけるデータ処理装置2又は2aが行う処理をコン
ピュータ6に実施させるために必要なプログラムと、文
字認識用辞書部41又41a,一画目専用辞書部42に
記憶させる辞書データとが格納されており、これらをコ
ンピュータ6の記憶部に読み込ませることにより、第1
及び第2の実施の形態で説明したと同様な処理を行うこ
とができる。
FIG. 8 is a block diagram showing the configuration of the third embodiment of the present invention. The third embodiment includes a pen input device 1, a display device 5, a computer 6 including a data processing unit and a storage unit, and a recording medium 7. The recording medium 7 includes a program necessary for causing the computer 6 to execute the processing performed by the data processing device 2 or 2a in the first or second embodiment, and a character recognition dictionary 41 or 41a. The dictionary data to be stored in the image-specific dictionary section 42 is stored. By reading these into the storage section of the computer 6, the first
The same processing as that described in the second embodiment can be performed.

【0057】[0057]

【発明の効果】以上詳細に説明したように、本発明の手
書き文字認識方式は、ビットマップ方式による従来と同
じ文字認識手段に加え、一画目専用辞書と、手書き入力
から一画目の筆跡パターンを抽出する一画目情報抽出手
段と、一画目専用辞書を参照し一画目の認識を行う一画
目認識手段とを備え、通常の文字全体のパターン比較に
よる文字認識と一画目による認識とを併用するため、似
た形状の異なる文字に誤認識される確率が減少し、文字
認識率が向上するという効果が得られる。
As described above in detail, the handwritten character recognition method of the present invention includes the same character recognition means as the conventional one by the bitmap method, a dictionary dedicated to the first stroke, and handwriting of the first stroke from the handwriting input. A first stroke information extracting unit for extracting a pattern, and a first stroke recognition unit for recognizing the first stroke by referring to a dictionary dedicated to the first stroke; In addition, the probability of erroneously recognizing a different character having a similar shape is reduced and the character recognition rate is improved.

【0058】更に、請求項3の手書き文字認識方式によ
れば、一画目の認識を文字認識の先に行い、文字認識の
際に比較する文字の範囲を限定するため、文字認識率が
向上するほかに、文字認識の所要時間が短縮されるとい
う効果がある。
Further, according to the handwritten character recognition method of the third aspect, the recognition of the first stroke is performed before the character recognition and the range of characters to be compared at the time of character recognition is limited, so that the character recognition rate is improved. In addition, there is an effect that the time required for character recognition is reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態の構成を示すブロッ
ク図である。
FIG. 1 is a block diagram showing a configuration of a first exemplary embodiment of the present invention.

【図2】図1の文字認識用辞書部のフォーマットを示す
説明図である。
FIG. 2 is an explanatory diagram showing a format of a character recognition dictionary unit in FIG. 1;

【図3】図1の一画目専用辞書部のフォーマットを示す
説明図である。
FIG. 3 is an explanatory diagram showing a format of a first-image dedicated dictionary unit in FIG. 1;

【図4】図1の第1の実施の形態の動作を説明するため
のフローチャートである。
FIG. 4 is a flowchart for explaining the operation of the first embodiment of FIG. 1;

【図5】図1明第1の実施の形態の処理の具体例を説明
するための説明図である。
FIG. 5 is an explanatory diagram for explaining a specific example of processing according to the first embodiment;

【図6】本発明の第2の実施の形態の構成を示すブロッ
ク図である。
FIG. 6 is a block diagram showing a configuration of a second exemplary embodiment of the present invention.

【図7】図6の第2の実施の形態の動作を説明するため
のフローチャートである。
FIG. 7 is a flowchart for explaining the operation of the second embodiment in FIG. 6;

【図8】本発明の第3の実施の形態の構成を示すブロッ
ク図である。
FIG. 8 is a block diagram showing a configuration of a third exemplary embodiment of the present invention.

【図9】従来の手書き文字認識方式の基本構成を示すブ
ロック図である。
FIG. 9 is a block diagram showing a basic configuration of a conventional handwritten character recognition method.

【図10】従来の文字認識用辞書のフォーマットを示す
説明図である。
FIG. 10 is an explanatory diagram showing a format of a conventional character recognition dictionary.

【図11】従来の手書き文字認識方式の動作を説明する
ためのフローチャートである。
FIG. 11 is a flowchart for explaining the operation of the conventional handwritten character recognition method.

【符号の説明】[Explanation of symbols]

1 ペン入力装置 2,2a,2b データ処理装置 3,3a,3b 記憶装置 4,4a,4b 辞書記憶装置 5 表示装置 6 コンピュータ 7 記録媒体 21 筆跡データ取得処理部 22,22a,22b 文字認識処理部 23 一画目情報抽出処理部 24 一画目認識処理部 25 一画目判定処理部 26 認識結果表示部 27 辞書検索範囲限定処理部 31 筆跡データ保存部 32,32a,32b 文字認識結果保存部 33 一画目情報保存部 34 一画目認識結果保存部 41,41a,41b 文字認識用辞書部 42 一画目専用辞書部 Reference Signs List 1 pen input device 2, 2a, 2b data processing device 3, 3a, 3b storage device 4, 4a, 4b dictionary storage device 5 display device 6 computer 7 recording medium 21 handwriting data acquisition processing unit 22, 22a, 22b character recognition processing unit 23 First stroke information extraction processing unit 24 First stroke recognition processing unit 25 First stroke determination processing unit 26 Recognition result display unit 27 Dictionary search range limitation processing unit 31 Handwriting data storage unit 32, 32a, 32b Character recognition result storage unit 33 First stroke information storage unit 34 First stroke recognition result storage unit 41, 41a, 41b Character recognition dictionary unit 42 First stroke dedicated dictionary unit

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 ペン入力装置に手書き入力された文字の
筆跡パターンを文字認識用辞書に格納されている基準パ
ターンと比較して文字認識を行う手書き文字認識方式に
おいて、手書きの最初のストロークに使用される一画目
の基準パターンを識別情報と対応させて格納した一画目
専用辞書と、入力された1文字分の筆跡パターンから一
画目の筆跡パターンを抽出する一画目情報抽出手段と、
この一画目情報抽出手段で抽出した一画目の筆跡パター
ンを前記一画目専用辞書と比較して対応する識別情報を
求める一画目認識手段と、前記一画目専用辞書に格納さ
れている識別情報が文字群を分類する分類番号であり、
前記文字認識用辞書には文字の基準パターンに対応して
文字コードに加えて前記分類番号が格納され、前記文字
認識用辞書による文字認識で得られた候補文字の分類番
号が前記一画目認識手段により得られた分類番号と一致
したときに当該候補文字の評価順位の修正を行う候補順
位修正手段とを備え、前記文字認識用辞書による文字認
識と前記一画目認識手段による認識とを併用することを
特徴とする手書き文字認識方式。
1. A character input by handwriting input to a pen input device.
The handwriting pattern is stored in the reference pattern stored in the character recognition dictionary.
Handwritten character recognition system that performs character recognition in comparison with turns
The first stroke used for the first stroke of the handwriting
The first stroke that stores the reference pattern of
A special dictionary and a handwriting pattern for one input character
First stroke information extracting means for extracting a handwriting pattern of the stroke,
The handwriting putter of the first stroke extracted by this first stroke information extraction means
And the corresponding identification information by comparing the
The first stroke recognition means to be sought, and the first stroke
Identification information is a classification number for classifying the character group,
The character recognition dictionary corresponds to the character reference pattern.
The classification number is stored in addition to the character code.
Classification number of candidate characters obtained by character recognition using recognition dictionary
Number matches the classification number obtained by the first stroke recognition means
Candidate order to correct the evaluation order of the candidate character when
Character correction means, and character recognition by the character recognition dictionary.
And recognition by the first stroke recognition means in combination.
Characteristic handwriting recognition method.
【請求項2】 ペン入力装置に手書き入力された文字の
筆跡パターンを文字認識用辞書に格納されている基準パ
ターンと比較して文字認識を行う手書き文字認識方式に
おいて、手書きの最初のストロークに使用される一画目
の基準パターンを識別情報と対応させて格納した一画目
専用辞書と、入力された1文字分の筆跡パターンから一
画目の筆跡パターンを抽出する一画目情報抽出手段と、
この一画目情報抽出手段で抽出した一画目の筆跡パター
ンを前記一画目専用辞書と比較して対応する識別情報を
求める一画目認識手段とを備え、前記文字認識用辞書に
よる文字認識と前記一画目認識手段による認識とを併用
し、かつ前記一画目専用辞書に格納されている識別情報
が、該当する一画目を使用する複数の文字の文字コード
群であることを特徴とする手書き文字認識方式。
2. A character input by handwriting input to a pen input device.
The handwriting pattern is stored in the reference pattern stored in the character recognition dictionary.
Handwritten character recognition system that performs character recognition in comparison with turns
The first stroke used for the first stroke of the handwriting
The first stroke that stores the reference pattern of
A special dictionary and a handwriting pattern for one input character
First stroke information extracting means for extracting a handwriting pattern of the stroke,
The handwriting putter of the first stroke extracted by this first stroke information extraction means
And the corresponding identification information by comparing the
The first stroke recognition means to be sought, and the character recognition dictionary
Character recognition and recognition by the first stroke recognition means
And identification information stored in the first stroke dedicated dictionary
Is the character code of multiple characters that use the first stroke
A handwritten character recognition method characterized by being a group .
【請求項3】 請求項1または請求項2に記載した各手
段の処理をコンピュータにより実現するためのプログラ
ム及び文字認識用辞書、一画目専用辞書の辞書データが
格納されていることを特徴とする記録媒体。
3. Each hand according to claim 1 or 2.
A program for realizing the processing of steps by computer
Dictionary data for character and character recognition, and dictionary data for the first stroke
A recording medium characterized by being stored .
JP09204893A 1997-07-30 1997-07-30 Handwritten character recognition method and recording medium Expired - Fee Related JP3138665B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09204893A JP3138665B2 (en) 1997-07-30 1997-07-30 Handwritten character recognition method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09204893A JP3138665B2 (en) 1997-07-30 1997-07-30 Handwritten character recognition method and recording medium

Publications (2)

Publication Number Publication Date
JPH1153470A JPH1153470A (en) 1999-02-26
JP3138665B2 true JP3138665B2 (en) 2001-02-26

Family

ID=16498151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09204893A Expired - Fee Related JP3138665B2 (en) 1997-07-30 1997-07-30 Handwritten character recognition method and recording medium

Country Status (1)

Country Link
JP (1) JP3138665B2 (en)

Also Published As

Publication number Publication date
JPH1153470A (en) 1999-02-26

Similar Documents

Publication Publication Date Title
JP3445394B2 (en) How to compare at least two image sections
JP4787275B2 (en) Segmentation-based recognition
KR100412317B1 (en) Character recognizing/correcting system
JPH07200732A (en) Word-object extraction method and noise removable method in raster image
JP3294995B2 (en) Form reader
KR19980018029A (en) Character recognition device
US5905811A (en) System for indexing document images
US11593591B2 (en) Optical character recognition systems and methods
US11756321B2 (en) Information processing apparatus and non-transitory computer readable medium
JP3138665B2 (en) Handwritten character recognition method and recording medium
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP4810853B2 (en) Character image cutting device, character image cutting method and program
JPS592191A (en) Recognizing and processing system of handwritten japanese sentence
JPH06223121A (en) Information retrieving device
JPH0991385A (en) Character recognition dictionary adding method and terminal ocr device using same
JP7404625B2 (en) Information processing device and program
JP2677271B2 (en) Character recognition device
JP2002207960A (en) Method and program for recognized character correction
JP3033554B2 (en) Character recognition device
JP2000132635A (en) Recognizing data confirming method
JP2977244B2 (en) Character recognition method and character recognition device
JPH11120294A (en) Character recognition device and medium
JP2003099709A (en) Misread character correction method and optical character recognition device
JPH0877293A (en) Character recognition device and generating method for dictionary for character recognition
JP4633271B2 (en) Dictionary learning method and dictionary learning program

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001114

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081208

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121208

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees