JPH1027218A - Method for evaluating on-line handwritten character pattern data base - Google Patents

Method for evaluating on-line handwritten character pattern data base

Info

Publication number
JPH1027218A
JPH1027218A JP8178256A JP17825696A JPH1027218A JP H1027218 A JPH1027218 A JP H1027218A JP 8178256 A JP8178256 A JP 8178256A JP 17825696 A JP17825696 A JP 17825696A JP H1027218 A JPH1027218 A JP H1027218A
Authority
JP
Japan
Prior art keywords
quality
handwritten character
handwriting
information
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8178256A
Other languages
Japanese (ja)
Inventor
Gakuhei Riyuu
学平 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP8178256A priority Critical patent/JPH1027218A/en
Publication of JPH1027218A publication Critical patent/JPH1027218A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To quantitatively evaluate an on-line handwritten character pattern data base by defining information for quality evaluation based on the quantitative information of the handwritten pattern data of a data base. SOLUTION: A quality information definition part 203 receives the quantitative primary information of the data of a handwriting pattern from the data base 201 and defines the information for the quality evaluation of the data base 201 based on it. The information of quality defined in the quality information definition part 203 is stored in the data base 201 or stored in a different file as indicated by a broken line and is referred to at any time on the side of an on-line handwritten character recognition development system 200. Thus, a clear objective reference for evaluating the result of the research and development of a handwritten character recognition technique utilizing the on-line handwritten character pattern data base is provided and substantial contribution is made to the research and development of the handwritten character recognition technique.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する分野】本発明は、オンライン手書き文字
認識の分野に係り、さらに詳しくは、オンライン手書き
文字パターンデータベースの品質評価に関する。
The present invention relates to the field of online handwritten character recognition, and more particularly, to the quality evaluation of an online handwritten character pattern database.

【0002】[0002]

【従来の技術】オンライン手書き文字認識の研究開発の
一般的な流れは図1のように示すことができる。まず、
例えばタブレットと電子ペン等のオンライン手書き文字
入力手段を使って手書き文字の筆跡データ(x−y座標
値の時系列)を入力し、データファイル101に保存す
る(ステップ100)。このデータファイル101に保
存された手書き文字筆跡の筆跡データを整理整頓し、オ
ンライン手書き文字パターンデータベース103を構築
する(ステップ102)。そして、このオンライン手書
き文字パターンデータベース103を利用し、オンライ
ン手書き文字認識の研究開発を行い(ステップ10
4)、その結果105の評価を行う(ステップ10
6)。ステップ104とステップ106は繰り返しにな
る。
2. Description of the Related Art A general flow of research and development of online handwritten character recognition can be shown in FIG. First,
For example, handwriting data (time series of xy coordinate values) of handwritten characters is input using an online handwritten character input unit such as a tablet and an electronic pen, and stored in the data file 101 (step 100). The handwriting data of the handwritten character handwriting stored in the data file 101 is organized and an online handwritten character pattern database 103 is constructed (step 102). Using this online handwritten character pattern database 103, research and development of online handwritten character recognition is performed (step 10).
4), the result 105 is evaluated (step 10)
6). Steps 104 and 106 are repeated.

【0003】オンライン手書き文字パターンデータベー
スの構築に関しては、オンライン手書き文字認識の高度
化を図るには、現実的な字体変形が加わった筆跡パター
ンを1人1人につき相当量収集しておく必要があること
を念頭において、文章形式、字体の制限のないオンライ
ン手書き文字パターンデータベースを作成する方法が提
案されている(中川正樹ほか,「文章形式字体制限なし
オンライン手書き文字パターンの収集と利用」,信学技
報,PRU95−110,pp.43−48(199
5))。
[0003] Regarding the construction of an online handwritten character pattern database, it is necessary to collect a considerable amount of handwriting patterns to which realistic font deformation is added in order to enhance the recognition of online handwritten characters. With this in mind, there has been proposed a method for creating an online handwritten character pattern database with no restrictions on text format and fonts (Masaki Nakagawa et al., "Collection and Use of Online Handwritten Character Patterns without Text Format Fonts", IEICE. Technical Report, PRU95-110, pp. 43-48 (199
5)).

【0004】[0004]

【発明が解決しようとする課題】オンライン手書き文字
認識の手法は様々なものが提案され、その優劣が論じら
れている。しかし、オンライン手書き文字認識手法の開
発に、どのようなオンライン手書き文字パターンデータ
ベースを利用したかが不明確なままでは、その手法の客
観的な評価は不可能である。
Various methods for online handwritten character recognition have been proposed, and their advantages and disadvantages are discussed. However, if it is unclear what kind of online handwritten character pattern database was used to develop the online handwritten character recognition method, it is impossible to objectively evaluate the method.

【0005】上に述べたような従来のオンライン手書き
文字パターンデータベースの構築方法では、手書き文字
筆跡パターンのデータの数量的な一次情報(例えば、筆
記者の人数、字種の数、手書きパターンの数など)は与
えられる。しかし、品質的な情報(例えば、手書き文字
の丁寧さ、字種毎のパターン数のばらつき、など)は与
えられないため、データベースを利用したオンライン手
書き文字認識技術の研究開発の成果を評価するための客
観的な基準が不明確であった。
In the above-described conventional method of constructing an online handwritten character pattern database, the quantitative primary information (for example, the number of writers, the number of character types, the number of handwritten patterns) of the data of handwritten character handwriting patterns is provided. Etc.) are given. However, since it does not provide quality information (eg, politeness of handwritten characters, variations in the number of patterns for each character type, etc.), it is necessary to evaluate the results of research and development of online handwritten character recognition technology using a database. The objective criteria were unclear.

【0006】本発明の目的は、上述の問題点を解決する
ため、オンライン手書き文字パターンデータベースの品
質的な評価をするための方法を提供することである。
It is an object of the present invention to provide a method for evaluating the quality of an online handwritten character pattern database in order to solve the above-mentioned problems.

【0007】[0007]

【課題を解決するための手段】本発明のオンライン手書
き文字パターンデータベースの評価方法の骨子は、デー
タベースの筆跡パターン・データの数量的な一次情報を
加工して二次的な情報を取得し、それに基づいてオンラ
イン手書き文字パターンデータベースの品質評価のため
の情報を定義することである(請求項1)。
The gist of the method for evaluating an online handwritten character pattern database according to the present invention is to process quantitative primary information of handwriting pattern data in the database to obtain secondary information, The information for quality evaluation of the online handwritten character pattern database is defined based on the information (claim 1).

【0008】定義される品質評価のための情報には、具
体的には、各字種の筆跡パターンの出現頻度に関する情
報(請求項2)、ストローク数からみた各字種の筆跡パ
ターンの品質を表す情報(請求項3)、ストローク数か
らみた全字種の筆跡パターンの品質を表す情報(請求項
4)、ストローク数からみた各筆記者の各字種の筆跡パ
ターンの品質を表す情報(請求項5)、ストローク数か
らみた各筆記者の全字種の筆記パターンの品質を表す情
報(請求項6)、ストローク数からみた各筆記者の筆跡
パターンの品質の差違の度合を表す情報(請求項7)、
各筆記者の筆跡パターンのストローク数からみた品質
の、全筆記者の筆跡パターンのストローク数からみた品
質に対する相対的評価を表す情報(請求項8)、及び/
又は、各筆記者グループの筆跡パターンのストローク数
からみた品質の、全筆記者の筆跡パターンのストローク
数からみた品質に対する相対的評価を表す情報(請求項
9)の少なくとも一つが含まれる。これ以外の情報が含
まれてもよいことは、以下の説明から明らかになろう。
The information for quality evaluation to be defined includes, specifically, information on the frequency of appearance of handwriting patterns of each character type (Claim 2) and the quality of handwriting patterns of each character type in terms of the number of strokes. (Claim 3), information indicating the quality of handwriting patterns of all character types based on the number of strokes (Claim 4), and information indicating the quality of handwriting patterns of each character type of each writer based on the number of strokes (Claim 4). Item 5), information indicating the quality of writing patterns of all character types of each writer as viewed from the number of strokes (Claim 6), and information indicating the degree of difference in the quality of handwriting patterns of each writer as viewed from the number of strokes (Claim 6) Item 7),
Information indicating the relative evaluation of the quality of the strokes of the handwriting patterns of each writer in terms of the number of strokes of the handwriting patterns of all the scribes (claim 8), and / or
Alternatively, at least one of information (claim 9) indicating a relative evaluation of the quality of the handwriting pattern of each writer group in terms of the number of strokes of the handwriting pattern with respect to the quality of the handwriting pattern of all the writer in terms of the number of strokes is included. It will be apparent from the following description that other information may be included.

【0009】[0009]

【発明の実施の形態】以下、本発明を具体的に説明す
る。図2は、本発明の実施例を説明するためのブロック
図である。200はオンライン手書き文字認識開発シス
テム、201はオンライン手書き文字認識開発システム
200に利用されるオンライン手書き文字パターンデー
タベース(以下、データベースと略記する)であり、そ
の構築方法は従来と同様でよい。
BEST MODE FOR CARRYING OUT THE INVENTION The present invention will be specifically described below. FIG. 2 is a block diagram for explaining an embodiment of the present invention. Reference numeral 200 denotes an online handwritten character recognition development system, and reference numeral 201 denotes an online handwritten character pattern database (hereinafter, abbreviated as a database) used in the online handwritten character recognition development system 200. The construction method may be the same as the conventional method.

【0010】203はデータベース201より筆跡パタ
ーンのデータの数量的な一次情報を受け取り、それを加
工して二次的な情報を取得し、それに基づいてデータベ
ース201の品質評価のための情報を定義する品質情報
定義部である。品質情報定義部203で定義された品質
の情報は、データベース201に格納されるか、あるい
は破線で示すように別のファイル204に格納され、オ
ンライン手書き文字認識開発システム200側で随時参
照できる。
Numeral 203 receives quantitative primary information of handwriting pattern data from the database 201, processes it to obtain secondary information, and defines information for quality evaluation of the database 201 based on the secondary information. It is a quality information definition part. The quality information defined by the quality information definition unit 203 is stored in the database 201 or in another file 204 as shown by a broken line, and can be referred to at any time on the online handwritten character recognition development system 200 side.

【0011】品質情報定義部203による品質情報定義
の実施例を以下に説明する。ここで、以下の説明を円滑
に行うために必要な概念について説明する。
An embodiment of quality information definition by the quality information definition unit 203 will be described below. Here, a concept necessary for smoothly performing the following description will be described.

【0012】・点,p 電子ペンがデジタイザに接触し、その接触場所がある時
刻に検知されたとき、その時刻の接触点の座標値(x,
y)を点と呼ぶ。この点をp=(x,y)と記す。
Point, p When the electronic pen touches the digitizer and the touched location is detected at a certain time, the coordinate value (x,
y) is called a point. This point is described as p = (x, y).

【0013】・ストローク,s 筆記者が電子ペンを用いてデジタイザ上に文字を記入す
るときに、電子ペンをデジタイザに接触させることをペ
ン・ダウンとし、電子ペンをデジタイザから話すことを
ペン・アップとする。ストロークとは、ペン・ダウンか
らペン・アップまでのペン先の移動軌跡を表す点の時系
列である。ストロークsにn個の点、p_1,p_2,p_
3,,...,p_n(n≧1)があるとき、ストロークsを
s=(p_1,p_2,p_3,...,p_n)と記す。点はス
トロークの特殊ケース(n=1)である。
Stroke, s When a writer writes a character on a digitizer using an electronic pen, contacting the electronic pen with the digitizer is referred to as pen-down, and speaking of the electronic pen from the digitizer is referred to as pen-up. And The stroke is a time series of points representing the movement trajectory of the pen tip from pen down to pen up. N points, p_1, p_2, p_ in stroke s
When there are 3,..., P_n (n ≧ 1), the stroke s is written as s = (p_1, p_2, p_3,..., P_n). Points are the special case of stroke (n = 1).

【0014】・手書き文字筆跡パターン,C 手書き文字筆跡パターンとは、ストロークの時系列のこ
とである。ある文字Cが wストローク(w≧1)で書
かれ、ストロークの書き順がs_1,...,s_wであると
き、C=(s_1,...,s_w)と記す。混乱が生じない
限り、手書き文字筆跡パターンを「文字」と呼んでも差
し支えない。点、又はストローンは文字の特殊ケースで
ある。
Handwritten character handwriting pattern, C The handwritten character handwriting pattern is a time series of strokes. When a certain character C is written with a w stroke (w ≧ 1) and the stroke order is s_1,..., S_w, it is written as C = (s_1,..., S_w). As long as confusion does not occur, the handwritten character handwriting pattern may be called a “character”. A dot, or strone, is a special case of letters.

【0015】[実施例1]本実施例では、品質情報定義
部203は、字種の出現頻度に関する品質情報を定義す
る。
[Embodiment 1] In this embodiment, the quality information definition unit 203 defines quality information relating to the appearance frequency of character types.

【0016】手書き文字パターンデータベースの対象字
種の数をNcatとし、対象字種の集合をSETcat={C
AT_1,CAT_2,...,CAT_Ncat}とする。そし
て、手書き文字パターンデータベースの対象字種の数、
字種の筆跡パターン数の平均、及び、字種の筆跡パター
ン数の標準偏差の組 QcatN=(Ncat,NptnMean,NptnSD) を対象字種の出現頻度に関する品質と定義し、このQca
tNを品質情報として出力する。
The number of target character types in the handwritten character pattern database is Ncat, and the set of target character types is SETcat = {C
AT_1, CAT_2, ..., CAT_Ncat}. Then, the number of target character types in the handwritten character pattern database,
A set QcatN = (Ncat, NptnMean, NptnSD) of the average of the number of handwriting patterns of the character type and the standard deviation of the number of handwriting patterns of the character type is defined as the quality related to the appearance frequency of the target character type.
tN is output as quality information.

【0017】ここで、NcatとNptnMeanの意味は自明
である。NptnSDは、それが大きいほど対象字種の出
現頻度の偏りが激しいことを意味する。NptnSD=0
は対象字種の出現頻度が均一であることを意味する。
Here, the meanings of Ncat and NptnMean are obvious. NptnSD means that the larger the value of NptnSD, the greater the bias in the appearance frequency of the target character type. NptnSD = 0
Means that the appearance frequency of the target character type is uniform.

【0018】[実施例2]本実施例においては、品質情
報定義部203は、データベース201の品質評価情報
として、記入された文字が丁寧に書かれたかどうかとい
う観点より字種の筆跡パターンの品質情報を定義する。
[Embodiment 2] In this embodiment, the quality information definition unit 203 determines the quality of the handwriting pattern of the character type as the quality evaluation information of the database 201 from the viewpoint of whether or not the written characters are written carefully. Define information.

【0019】手書き文字パターンデータベース中のi番
目の字種CAT_i(1≦i≦Ncat)の筆跡パターン数を
Nptn_iとし、全ての字種の筆跡パターンの数の和をNp
tn=Nptn_1+Nptn_2+...+Nptn_Ncatとする。ま
た、字種CAT_iの筆跡パターンの集合をSETptn_i
={Cptn_i_1,Cptn_i_2,...,Cptn_i_Nptn_i}と
する。SETptn_i中のj番目の字種の筆跡パターンCp
tn_i_j(1≦j≦Nptn_i)のストローク数をNstk_i_j
とし、この字種の筆跡パターンのストローク数の平均を
NstkMean_iとする。この字種の筆跡パターンのストロ
ーク数の標準偏差をNstkSD_iとする。
The number of handwriting patterns of the i-th character type CAT_i (1 ≦ i ≦ Ncat) in the handwritten character pattern database is Nptn_i, and the sum of the number of handwriting patterns of all character types is Np.
tn = Nptn_1 + Nptn_2 +... + Nptn_Ncat. Also, a set of handwriting patterns of the character type CAT_i is set as SETptn_i
= {Cptn_i_1, Cptn_i_2, ..., Cptn_i_Nptn_i}. Handwriting pattern Cp of the j-th character type in SETptn_i
Nstk_i_j is the stroke number of tn_i_j (1 ≦ j ≦ Nptn_i)
The average of the number of strokes of the handwriting pattern of this character type is set to NstkMean_i. The standard deviation of the number of strokes of the handwriting pattern of this character type is NstkSD_i.

【0020】そして、この字種の筆跡パターン数、筆跡
パターンのストローク数の平均、筆跡パターンのストロ
ーク数の標準偏差の組 Qptn_i=(Nptn_i,NstkMean_i,NstkSD_i) を字種CAT_iの筆跡パターンの品質として定義する。
ここで、NstkSD_iが大きいほど、i番目の字種の筆
跡パターンの書き方の変化が豊富であることを意味す
る。NstkSD_i=0は、この字種の筆跡パターンが同
じ画数で書かれていたことを意味する。
A set of the number of handwriting patterns of this character type, the average of the number of strokes of the handwriting pattern, and the standard deviation of the number of strokes of the handwriting pattern, Qptn_i = (Nptn_i, NstkMean_i, NstkSD_i), is used as the quality of the handwriting pattern of the character type CAT_i. Define.
Here, the larger the value of NstkSD_i, the greater the change in how to write the handwriting pattern of the i-th character type. NstkSD_i = 0 means that the handwriting pattern of this character type was written with the same number of strokes.

【0021】そして、字種毎の筆跡パターン数で重み付
けした、ストローク数の標準偏差の和 NstkSD=(Nptn_1×NstkSD_1+Nptn_2+Nptn_
2×NstkSD_2+...+Nptn_Ncat×NstkSD_Ncat)
/Nptn とし、対象字種の数、及び、重み付けした筆跡パターン
のストローク数の標準偏差の和の組 Qptn=(Ncat,NstkSD) を、全字種の筆跡パターンの品質と定義する。このQpt
nとQptn_iが品質情報として出力される。
The sum of the standard deviations of the number of strokes weighted by the number of handwriting patterns for each character type NstkSD = (Nptn_1 × NstkSD_1 + Nptn_2 + Nptn_
2 × NstkSD_2 + ... + Nptn_Ncat × NstkSD_Ncat)
/ Nptn, and the combination of the number of target character types and the standard deviation of the number of strokes of the weighted handwriting pattern Qptn = (Ncat, NstkSD) is defined as the quality of the handwriting pattern of all character types. This Qpt
n and Qptn_i are output as quality information.

【0022】[実施例3]本実施例では、品質情報定義
部203は、データベース201の品質を、ある筆跡者
が記入した筆跡パターンの品質をストローク数に基づい
て定義する。
[Embodiment 3] In the present embodiment, the quality information definition unit 203 defines the quality of the database 201 based on the number of strokes of the quality of a handwriting pattern written by a certain handwriting person.

【0023】手書き文字パターンデータベースに筆跡パ
ターンを提供した、ある筆記者の記入した字種の数をN
catwrtr(1≦Ncatwrtr≦Ncat)とする。この筆記者
が記入したi番目の字種CATwrtr_i(1≦i≦Nca
t)の筆跡パターンの数をNptnwrtr_iとし、データベー
ス中のこの筆記者が記入した全ての字種の筆跡パターン
の数の和を Nptnwrtr=Mptnwrtr_1+Nptnwrtr_2+...+Nptnwrt
r_Ncat とする。また、この筆記者が記入したCATwrtr_iの筆
跡パターンの集合を SETptnwrtr_i={Cptnwrtr_i_1,Cptnwrtr_i_
2,...,Cptnwrtr_i_Nptnwrtr_i} とする。
The number of character types written by a writer who provided handwriting patterns to the handwritten character pattern database
catwrtr (1 ≦ Ncatwrtr ≦ Ncat). The i-th character type CATwrtr_i (1 ≦ i ≦ Nca written by this writer)
The number of handwriting patterns in t) is Nptnwrtr_i, and the sum of the number of handwriting patterns of all character types written by this writer in the database is Nptnwrtr = Mptnwrtr_1 + Nptnwrtr_2 + ... + Nptnwrt
r_Ncat. Also, a set of handwriting patterns of CATwrtr_i filled out by the scriber is expressed as SETptnwrtr_i = iCptnwrtr_i_1, Cptnwrtr_i_
2, ..., Cptnwrtr_i_Nptnwrtr_i}.

【0024】SETptnwrtr_i中のj番目の筆跡パター
ンCptnwrtr_i_j(1≦j≦Nptnwtr_i)のストローク
の数をNstkwrtr_i_jとし、この字種の筆跡パターンの
ストローク数の平均をNstkMeanwrtr_iとし、この字種
の筆跡パターンのストローク数の標準偏差をNstkSDw
rtr_iとする。そして、この筆記者が記入したj番目の
字種の筆跡パターンの品質を、字種の筆跡パターン数、
筆跡パターンのストローク数の平均及び標準偏差の組 Qptnwrtr_i=(Nptnwrtr_i,NstkMeanwrtr_i,Nst
kSDwrtr_i) として定義する。ここで、NstkSDwrtr_iが大きいほ
ど、この筆記者のi番目の字種の書き方が不安定である
ことを意味する。NstkSDwrtr_i=0は、こ筆記者の
i番目の字種の書き方が一定であることを意味する。
The number of strokes of the j-th handwriting pattern Cptnwrtr_i_j (1 ≦ j ≦ Nptnwtr_i) in SETptnwrtr_i is Nstkwrtr_i_j, the average number of strokes of the handwriting pattern of this character type is NstkMeanwrtr_i, and the stroke of the handwriting pattern of this character type is Standard deviation of numbers is NstkSDw
rtr_i. Then, the quality of the handwriting pattern of the j-th character type entered by the scribe is determined by the number of handwriting patterns of the character type,
A set of the average and standard deviation of the number of strokes of the handwriting pattern Qptnwrtr_i = (Nptnwrtr_i, Nstk Meanwrtr_i, Nst
kSDwrtr_i). Here, as NstkSDwrtr_i is larger, it means that the writer's writing style of the i-th character type is more unstable. NstkSDwrtr_i = 0 means that the writer's i-th character type is constant.

【0025】この筆記者が記入した各筆記パターンのス
トローク数の標準偏差をパターン数で重み付けした和 NstkSDwrtr=(Nptnwrtr_1×NstkSDwrtr_1+Np
tnwrtr_2×NstkSDwrtr_2+...+Nptnwrtr_Ncatwrt
r×NstkSDwrtr_Ncatwrtr)/Nptnwrtr を定義する。
The sum NstkSDwrtr = (Nptnwrtr_1 × NstkSDwrtr_1 + Np) obtained by weighting the standard deviation of the number of strokes of each writing pattern written by the writer with the number of patterns.
tnwrtr_2 × NstkSDwrtr_2 + ... + Nptnwrtr_Ncatwrt
r × NstkSDwrtr_Ncatwrtr) / Nptnwrtr.

【0026】そして、この筆記者が記入した対象字種の
数と、各筆跡パターンのストローク数の標準偏差の重み
付けした和の組 Qptnwrtr=(Ncatwrtr,NstkSDwrtr) を、この筆記者が記入した全字種の筆跡パターンの品質
として定義する。このQptnwrtrとQptnwrtr_iが品質情
報として出力される。
Then, the set of the number of target character types written by the writer and the weighted sum of the standard deviation of the number of strokes of each handwriting pattern, Qptnwrtr = (Ncatwrtr, NstkSDwrtr), is written by the writer. Defined as the quality of the handwriting pattern of the species. These Qptnwrtr and Qptnwrtr_i are output as quality information.

【0027】[実施例4]本実施例では、品質情報定義
部203は、筆記者の筆跡パターンの品質によりデータ
ベース201の品質を定義する。
[Embodiment 4] In this embodiment, the quality information definition unit 203 defines the quality of the database 201 based on the quality of the handwriting pattern of the writer.

【0028】手書き文字パターンデータベースに筆跡パ
ターンを提供した筆記者の数をNwrtrとする。また、前
記実施例3において説明したように、K番目の筆記者
(1≦k≦Nwrtr)が記入した対象字種の数をNcatwrt
r_k、この筆記者が記入した各筆跡パターンのストロー
ク数の標準偏差の重み付けした和をNstkSDwrtr_kと
する。そして、k番目の筆記者の筆跡パターンの品質を Qptnwrtr_k=(Ncatwrtr_k,NstkSDwrtr_k) とする。
Let Nwrtr be the number of writers who have provided handwriting patterns to the handwritten character pattern database. Further, as described in the third embodiment, the number of target character types written by the K-th writer (1 ≦ k ≦ Nwrtr) is determined by Ncatwrt.
r_k, and the weighted sum of the standard deviation of the number of strokes of each handwriting pattern written by the writer is NstkSDwrtr_k. Then, the quality of the handwriting pattern of the k-th writer is set as Qptnwrtr_k = (Ncatwrtr_k, NstkSDwrtr_k).

【0029】筆記者達が記入した対象字種の数の平均を
NcatMeanwrtr、その標準偏差をNcatSDwrtrとす
る。また、筆記者達が記入した筆跡パターンのストロー
ク数の標準偏差の和の平均をNstkSDMeanwrtr、その
和の標準偏差をNstkSDSDwrtrとする。そして、デ
ータベースの字種の数、筆記者達が記入した対象字種の
数の平均、筆記者が記入した対象字種の数の標準偏差、
筆記者達が記入した筆跡パターンのストローク数の標準
偏差の和の平均、筆記者達が記入した筆跡パターンのス
トローク数の標準偏差の和の標準偏差、の組 Qwrtr=(Ncat,NcatMeanwrtr,NstkSDMeanwrtr,
NstkSDSDwrtr) を、筆記者の筆跡パターンの品質によるデータベースの
品質として定義する。このQwrtrとQptnwrtr_kが品質
情報として出力される。
The average of the number of target character types written by the scribes is Ncat Meanwrtr, and the standard deviation thereof is NcatSDwrtr. The average of the sum of the standard deviations of the stroke numbers of the handwriting patterns written by the writers is NstkSDeanwrtr, and the standard deviation of the sum is NstkSDSDwrtr. Then, the number of character types in the database, the average number of target character types entered by the scribes, the standard deviation of the number of target character types entered by the scribes,
A set of the standard deviation of the sum of the standard deviations of the stroke numbers of the handwriting patterns written by the scribes and the standard deviation of the sum of the standard deviations of the stroke numbers of the handwriting patterns written by the writer Qwrtr = (Ncat, NcatMeanwrtr, NstkSDMewrtrtr,
NstkSDSDwrtr) is defined as the quality of the database by the quality of the scribe's handwriting pattern. These Qwrtr and Qptnwrtr_k are output as quality information.

【0030】ここで、NcatSDwrtrが大きいほど、筆
記者が記入した対象字種の数の差違の度合が大きいこと
を意味する。NcatSDwrtr=0は、筆記者達が同じ数
の対しよう字種を記入したことを意味する。NstkSD
SDwrtrが大きいほど筆記者が記入した筆跡パターンの
品質の差違の度合が大きいことを意味する。
Here, the larger the value of NcatSDwrtr, the greater the difference in the number of target character types entered by the writer. NcatSDwrtr = 0 means that the scribers have entered the same number of matching character types. NstkSD
The larger the SDwrtr, the greater the difference in the quality of the handwriting pattern written by the scribe.

【0031】[実施例5]本実施例では、品質情報定義
部203は、データベース201における筆記者の筆跡
パターンの品質の位置付けを定義する。
[Embodiment 5] In this embodiment, the quality information definition unit 203 defines the position of the quality of the handwriting pattern of the writer in the database 201.

【0032】データベースに筆跡パターンを提供した筆
記者の数をNwrtrとする。前記実施例3において説明し
たように、k番目の筆記者(1≦k≦Nwrtr)が記入し
た対象字種の数をNcatwrtr_k、重み付きのこの筆記者
が記入した各筆跡パターンのストローク数の標準偏差の
和をNstkSDwrtr_kとする。そして、k番目の筆記者
の筆跡パターンの品質 Qptnwrtr_k=(Ncatwrtr_k,NstkSDwrtr_k) を定義する。
Let Nwrtr be the number of writers who have provided handwriting patterns to the database. As described in the third embodiment, the number of target character types written by the k-th writer (1 ≦ k ≦ Nwrtr) is Ncatwrtr_k, and the standard number of strokes of each handwriting pattern written by this writer is weighted. Let the sum of the deviations be NstkSDwrtr_k. Then, the quality Qptnwrtr_k = (Ncatwrtr_k, NstkSDwrtr_k) of the handwriting pattern of the k-th writer is defined.

【0033】また、前記実施例4におけると同様に、筆
記者の筆跡パターンの品質を用いたデータベースの品質 Qwrtr=(Ncat,NcatMeanwrtr,NcatSDwrtr,Nstk
SDMeanwrtr,NstkSDSDwrtr) を定義する。
As in the case of the fourth embodiment, the quality of the database using the quality of the handwriting pattern of the writer Qwrtr = (Ncat, NcatMeanwrtr, NcatSDwrtr, Nstk)
SDMeanwrtr, NstkSDSDwrtr).

【0034】そして、k番目の筆記者が記入した筆跡パ
ターンの品質の位置付けを Qrankwrtr_k=(Ncatdif_k,NstkSDdif_k) ただし、Ncatdif_k=Ncatwrtr_k−NstkSDMeanwrt
r NstkSDdif_k=NstkSDwrtr_k−NstkSDMeanwrt
rと定義する。このNrankwrtr_kと、Qptnwrtr_k、Qwr
trが品質情報として出力される。
The rank of the quality of the handwriting pattern written by the k-th scribe is given by Qrankwrtr_k = (Ncatdif_k, NstkSDdif_k) where Ncatdif_k = Ncatwrtr_k-NstkSDMewrwrt
r NstkSDdif_k = NstkSDwrtr_k-NstkSDMewrt
Defined as r. This Nrankwrtr_k, Qptnwrtr_k, Qwr
tr is output as quality information.

【0035】ここで、Ncatdif_k>0.0はk番目の筆
記者が平均より多くの対象字種を記入したことを意味す
る。NstkSDdif_k>0.0はk番目の筆記者が記入し
た筆跡パターンの品質(ストロークの数で評価した丁寧
さ)が平均より悪いことを意味する。
Here, Ncatdif_k> 0.0 means that the k-th writer has entered more than the average target character type. NstkSDdif_k> 0.0 means that the quality (attentiveness evaluated by the number of strokes) of the handwriting pattern written by the k-th writer is lower than the average.

【0036】[実施例6]本実施例では、品質情報定義
部203は、データベース201における筆記者グルー
プの筆跡パターンの品質の位置付けを定義する。
[Embodiment 6] In this embodiment, the quality information definition unit 203 defines the position of the quality of the handwriting pattern of the writer group in the database 201.

【0037】データベースに筆跡パターンを提供した筆
記者の数をNwrtrとし、その中のある筆記者のグループ WG={WRTR_1,WRTR_2,...,WRTR_m}
(1≦m≦Nwrtr) があるとする。前記実施例3におけると同様に、k番目
の筆記者(1≦k≦m)の筆跡パターンの品質 Qptnwrtr_k=(Ncatwrtr_k,NstkSDwrtr_k) を定義する。
Nwrtr is the number of writers who have provided the handwriting pattern to the database, and a group of writers WG = {WRTR_1, WRTR_2,..., WRTR_m}
(1 ≦ m ≦ Nwrtr). As in the third embodiment, the quality of the handwriting pattern of the k-th writer (1 ≦ k ≦ m) Qptnwrtr_k = (Ncatwrtr_k, NstkSDwrtr_k) is defined.

【0038】また、前記実施例4におけると同様に、筆
記者の筆跡パターンの品質を用いたデータベースの品質 Qwrtr=(Ncat,NcatMeanwrtr,NcatSDwrtr,Nstk
SDMeanwrtr,NstkSDSDwrtr) を定義する。
As in the fourth embodiment, the quality of the database using the quality of the handwriting pattern of the writer Qwrtr = (Ncat, NcatMeanwrtr, NcatSDwrtr, Nstk)
SDMeanwrtr, NstkSDSDwrtr).

【0039】また、前記実施例5におけとる同様に、K
番目の筆記者が記入した筆跡パターンの品質の位置付け Qwrtr_k=(Ncatdif_k,NstkSDdif_k) を定義する。そして、筆記者グループWGの筆跡パター
ンの品質を QrankgrpWG=(NcatdifWG,NstkSDdifWG) ただし、NcatdigWG=(Ncatdif_1+...+Ncatdif_
m)/m−NcatMeanwrtr NstkSDdifWG=(NstkSDdif_1+...+NstkSD
dif_m)/m−NstkSDMeanwrtr と定義する。このQrnakgrpWGと、Qwrtr、Qrnakwrt
r_kが品質情報として出力される。
As in the case of the fifth embodiment, K
The position of the quality of the handwriting pattern written by the scribe is defined as Qwrtr_k = (Ncatdif_k, NstkSDdif_k). QrankgrpWG = (NcatdifWG, NstkSDdifWG) where NcatdigWG = (Ncatdif_1 + ... + Ncatdif_
m) / m-Ncat Meanwrtr NstkSDdifWG = (NstkSDdif_1 + ... + NstkSD
dif_m) / m-NstkSDMeanwrtr. This QrnakgrpWG, Qwrtr, Qrnakwrt
r_k is output as quality information.

【0040】ここで、NcatdifWG>0.0は筆記者グ
ループWGが平均より多くの対象字種を記入したことを
意味する。NstkSDdifWG>0.0は筆記者グループ
WGが記入した筆跡パターンの品質(ストロークの数で
評価した丁寧さが平均より悪いことを意味する。
Here, NcatdifWG> 0.0 means that the writer group WG has entered more target character types than the average. NstkSDdifWG> 0.0 means that the quality of the handwriting pattern written by the writer group WG (the politeness evaluated by the number of strokes is worse than the average).

【0041】[0041]

【発明の効果】以上の説明から明らかなように、本発明
は、オンライン手書き文字パターンデータベースの品質
評価のための情報を字種の面と筆記者の面から定義する
ことによって、オンライン手書き文字パターンデータベ
ースを利用した手書き文字認識技術の研究開発の成果を
評価するための明白な客観的基準を提供し、手書き文字
認識技術の研究開発に大きく貢献するものである。
As is apparent from the above description, the present invention defines an online handwritten character pattern by defining information for evaluating the quality of an online handwritten character pattern database from a character type aspect and a writer's aspect. It provides a clear objective criterion for evaluating the results of research and development of handwritten character recognition technology using a database, and greatly contributes to research and development of handwritten character recognition technology.

【図面の簡単な説明】[Brief description of the drawings]

【図1】オンライン手書き文字認識の研究開発の一般的
な流れを示す図である。
FIG. 1 is a diagram showing a general flow of research and development of online handwritten character recognition.

【図2】本発明の実施例を説明するためのブロック図で
ある。
FIG. 2 is a block diagram for explaining an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

200 オンライン手書き文字認識研究開発システム 201 オンライン手書き文字パターンデータベース 203 品質情報定義部 204 ファイル 200 Online Handwritten Character Recognition Research and Development System 201 Online Handwritten Character Pattern Database 203 Quality Information Definition Unit 204 File

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 オンライン手書き文字パターンデータベ
ースの筆跡パターン・データの数量的な情報から、オン
ライン手書き文字パターンデータベースの品質評価のた
めの情報を定義することを特徴とするオンライン手書き
文字パターンデータベースの評価方法。
1. An online handwritten character pattern database evaluation method, wherein information for quality evaluation of an online handwritten character pattern database is defined from quantitative information of handwriting pattern data of the online handwritten character pattern database. .
【請求項2】 請求項1記載のオンライン手書き文字パ
ターンデータベースの評価方法において、定義される品
質評価のための情報に、各字種の筆跡パターンの出現頻
度に関する情報が含まれることを特徴とするオンライン
手書き文字パターンデータベースの評価方法。
2. The method for evaluating an online handwritten character pattern database according to claim 1, wherein the information for quality evaluation defined includes information on the frequency of appearance of handwriting patterns of each character type. Evaluation method of online handwritten character pattern database.
【請求項3】 請求項1記載のオンライン手書き文字パ
ターンデータベースの評価方法において、定義される品
質評価のための情報に、ストローク数からみた各字種の
筆跡パターンの品質を表す情報が含まれることを特徴と
するオンライン手書き文字パターンデータベースの評価
方法。
3. The method for evaluating an online handwritten character pattern database according to claim 1, wherein the information for quality evaluation defined includes information representing the quality of the handwriting pattern of each character type in terms of the number of strokes. A method for evaluating an online handwritten character pattern database characterized by:
【請求項4】 請求項1記載のオンライン手書き文字パ
ターンデータベースの評価方法において、定義される品
質評価のための情報に、ストローク数からみた全字種の
筆跡パターンの品質を表す情報が含まれることを特徴と
するオンライン文字パターンデータベースの評価方法。
4. The method for evaluating an online handwritten character pattern database according to claim 1, wherein the information for quality evaluation defined includes information representing the quality of handwriting patterns of all character types as viewed from the number of strokes. An online character pattern database evaluation method characterized by the following.
【請求項5】 請求項1記載のオンライン手書き文字パ
ターンデータベースの評価方法において、定義される品
質評価のための情報に、ストローク数からみた各筆記者
の各字種の筆跡パターンの品質を表す情報が含まれるこ
とを特徴するオンライン手書き文字パターンデータベー
スの評価方法。
5. The method for evaluating an online handwritten character pattern database according to claim 1, wherein the information for quality evaluation defined includes information representing the quality of the handwriting pattern of each character type of each writer as viewed from the number of strokes. A method for evaluating an online handwritten character pattern database, wherein the method includes:
【請求項6】 請求項1記載のオンライン手書き文字パ
ターンデータベースの評価方法において、定義される品
質評価のための情報に、ストローク数からみた各筆記者
の全字種の筆跡パターンの品質を表す情報が含まれるこ
とを特徴するオンライン手書き文字パターンデータベー
スの評価方法。
6. The method for evaluating an online handwritten character pattern database according to claim 1, wherein the information for quality evaluation defined includes information representing the quality of handwriting patterns of all character types of each writer as viewed from the number of strokes. A method for evaluating an online handwritten character pattern database, wherein the method includes:
【請求項7】 請求項1記載のオンライン手書き文字パ
ターンデータベースの評価方法において、定義される品
質評価のための情報に、ストローク数からみた各筆記者
の筆跡パターンの品質の差違の度合を表す情報が含まれ
ることを特徴とするオンライン手書き文字パターンデー
タベースの評価方法。
7. The method for evaluating an online handwritten character pattern database according to claim 1, wherein the information for quality evaluation defined includes information indicating a degree of a difference in quality of a handwriting pattern of each writer as viewed from the number of strokes. A method for evaluating an online handwritten character pattern database, comprising:
【請求項8】 請求項1記載のオンライン手書き文字パ
ターンデータベースの評価方法において、定義される品
質評価のための情報に、各筆記者の筆跡パターンのスト
ローク数からみた品質の、全筆記者の筆跡パターンのス
トローク数からみた品質に対する相対的評価を表す情報
が含まれることを特徴とするオンライン手書き文字パタ
ーンデータベースの評価方法。
8. A method for evaluating an online handwritten character pattern database according to claim 1, wherein the information for quality evaluation defined includes handwriting of all scribes in terms of the number of strokes of the handwriting pattern of each writer. An evaluation method for an online handwritten character pattern database, which includes information indicating a relative evaluation of quality with respect to the number of strokes of a pattern.
【請求項9】 請求項1記載のオンライン手書き文字パ
ターンデータベースの評価方法において、定義される品
質評価のための情報に、各筆記者グループの筆跡パター
ンのストローク数からみた品質の、全筆記者の筆跡パタ
ーンのストローク数からみた品質に対する相対的評価を
表す情報が含まれることを特徴とするオンライン手書き
文字パターンデータベースの評価方法。
9. The method for evaluating an online handwritten character pattern database according to claim 1, wherein the information for quality evaluation defined includes the quality of all scribes in terms of the number of strokes of the handwriting pattern of each writer group. An evaluation method for an online handwritten character pattern database, which includes information indicating a relative evaluation of the quality of a handwriting pattern in terms of the number of strokes.
JP8178256A 1996-07-08 1996-07-08 Method for evaluating on-line handwritten character pattern data base Pending JPH1027218A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8178256A JPH1027218A (en) 1996-07-08 1996-07-08 Method for evaluating on-line handwritten character pattern data base

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8178256A JPH1027218A (en) 1996-07-08 1996-07-08 Method for evaluating on-line handwritten character pattern data base

Publications (1)

Publication Number Publication Date
JPH1027218A true JPH1027218A (en) 1998-01-27

Family

ID=16045321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8178256A Pending JPH1027218A (en) 1996-07-08 1996-07-08 Method for evaluating on-line handwritten character pattern data base

Country Status (1)

Country Link
JP (1) JPH1027218A (en)

Similar Documents

Publication Publication Date Title
JP5071914B2 (en) Recognition graph
CN111753767A (en) Method and device for automatically correcting operation, electronic equipment and storage medium
CN101326518B (en) Method and device for script recognition for ink notes
US5652806A (en) Input device with data targeting to determine an entry field for a block of stroke data
Long Jr Quill: a gesture design tool for pen-based user interfaces
CN103902098A (en) Shaping device and shaping method
CN114730241B (en) Gesture and stroke recognition in touch user interface input
CN112597876A (en) Calligraphy Chinese character judging method based on feature fusion
US9159147B2 (en) Method and apparatus for personalized handwriting avatar
CN114937270A (en) Ancient book word processing method, ancient book word processing device and computer readable storage medium
US6111976A (en) System and method for handwritten character recognition and qualification
CN210038810U (en) Intelligent evaluation equipment and system
CN112163400A (en) Information processing method and device
JPH07146918A (en) Handwritten character recognizing device
JPH1027218A (en) Method for evaluating on-line handwritten character pattern data base
CN115311674A (en) Handwriting processing method and device, electronic equipment and readable storage medium
Balreira et al. Assessing similarity in handwritten texts
CN114511853A (en) Character image writing track recovery effect discrimination method
JPH05225399A (en) Document processor
EP0567836A2 (en) Writer style detection and automatic prototype creation for on-line handwriting recognition
EP4086744A1 (en) Gesture stroke recognition in touch-based user interface input
Räihä Some applications of string algorithms in human-computer interaction
An Correctness Evaluation of Handwritten Chinese Characters Based on Relaxation Matching
CN116959000A (en) Handwriting recognition method, handwriting recognition device, computer equipment and storage medium
JPH06168267A (en) Structural document preparing method and structural document preparation supporting device