CN101976354A - 一种书写汉字规范性评判的方法和装置 - Google Patents

一种书写汉字规范性评判的方法和装置 Download PDF

Info

Publication number
CN101976354A
CN101976354A CN 201010537875 CN201010537875A CN101976354A CN 101976354 A CN101976354 A CN 101976354A CN 201010537875 CN201010537875 CN 201010537875 CN 201010537875 A CN201010537875 A CN 201010537875A CN 101976354 A CN101976354 A CN 101976354A
Authority
CN
China
Prior art keywords
chinese characters
stroke
writing
writing chinese
key point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010537875
Other languages
English (en)
Other versions
CN101976354B (zh
Inventor
朱军民
邓超
Original Assignee
Guangdong Ksense Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ksense Information Technology Co Ltd filed Critical Guangdong Ksense Information Technology Co Ltd
Priority to CN2010105378757A priority Critical patent/CN101976354B/zh
Publication of CN101976354A publication Critical patent/CN101976354A/zh
Application granted granted Critical
Publication of CN101976354B publication Critical patent/CN101976354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及计算机数据处理技术领域,尤其涉及一种书写汉字规范性评判的方法,其包括6部分,分别是采集并记录书写汉字笔画轨迹;将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;采用道格拉斯-普克算法提取书写轨迹关键点;根据获取的关键点,获取所有笔画的特征向量;笔画特征匹配,对于书写汉字的每一笔笔画与汉字标准模板特征库中的对应汉字的对应笔画进行动态规划匹配;采用决策树的方法对书写汉字的规范性做综合评价;本发明可以克服人工评价汉字的主观性以及疲劳性带来的不利影响,能对书写汉字的规范性进行评判。

Description

一种书写汉字规范性评判的方法和装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种书写汉字规范性评判的方法和装置。
背景技术
在汉字应用水平测试和汉字应用教学等领域,如何有效的评判书写汉字的规范性是一个比较新颖的课题。目前所采用的方法主要是由人(教师)来评价,这种方法一方面带有很大的主观性,同样的书写汉字不同的人可能给出差别较大的评判;另一方面,这一枯燥重复性的工作容易使人疲劳,同样的汉字由同样的人在不同的时间段进行评判,都有可能给出不同的评判结果。
中国发明专利“一种手写汉字布局评价方法”(公开号CN101465074A)公开了一种汉字布局的评价方法,该方法通过采用笔画布局、部件布局以及整体字形布局来对手写汉字进行综合评价。然而,由于该专利采用了笔画和部件的重心来对笔画布局和部件布局进行评价,显然,以笔画或者部件重心为中心旋转任意角度,都不会改变笔画或部件的长度和大小,因此,按该专利的方法,旋转任意角度后对笔画和部件的评价将没有影响,而汉字笔画本身是具有方向性的,这显然是不符合汉字书写常识的,因此,仅仅以重心为指标来对汉字笔画和部件来进行评价这是有所欠缺的,需要增加其它约束条件,来对书写汉字进行更有效的评价。
中国发明专利“一种基于自信度的汉字书写质量评价方法”(公开号为CN101630362A)提出了一种基于置信度的汉字书写质量评价方法,该专利采用修正二次判决函数计算候选字的距离,然后根据候选字的距离大小计算置信度并进行汉字书写质量的评价,由于该专利的评价标准依赖于训练样本(即书写汉字)的选取,如果训练样本书写工整,则对书写工整的汉字具有较好的评价;显然,即使对于书写工整的汉字也有好坏之分,这种方法是不能够对这类情况进行评价的。
发明内容
本发明的目的在于针对现有技术的不足而提供一种可以克服人工评价汉字的主观性以及疲劳性带来的不利影响,能对书写汉字的规范性进行评判的书写汉字规范性评判的方法和装置。
本发明的目的通过以下技术措施实现: 一种书写汉字规范性评判的方法,包括:
A1:采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:                                                
Figure 138033DEST_PATH_IMAGE001
,…,
Figure 138943DEST_PATH_IMAGE004
Figure 686730DEST_PATH_IMAGE005
,...,
Figure 954211DEST_PATH_IMAGE007
A2:将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;
A3:采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 590991DEST_PATH_IMAGE008
笔笔画,第
Figure 683581DEST_PATH_IMAGE009
笔笔画的轨迹关键点用
Figure 405812DEST_PATH_IMAGE010
表示,
Figure 242049DEST_PATH_IMAGE011
为关键点数目;
A4:根据获取的关键点,获取所有笔画的特征向量,第
Figure 998915DEST_PATH_IMAGE009
笔笔画的轨迹关键点
Figure 262406DEST_PATH_IMAGE010
,总共有个关键点,取轨迹关键点
Figure 846282DEST_PATH_IMAGE012
和关键点
Figure 457655DEST_PATH_IMAGE013
的后一个关键点
Figure 892047DEST_PATH_IMAGE014
,则有向线段
Figure 323291DEST_PATH_IMAGE015
的方向设定为关键点
Figure 501331DEST_PATH_IMAGE013
的方向,记作
Figure 967210DEST_PATH_IMAGE016
,有向线段
Figure 572503DEST_PATH_IMAGE015
的长度记为关键点
Figure 756622DEST_PATH_IMAGE013
的长度,记作
Figure 472775DEST_PATH_IMAGE017
Figure 58739DEST_PATH_IMAGE016
Figure 834934DEST_PATH_IMAGE017
计算方法为:
Figure 240770DEST_PATH_IMAGE018
对于第
Figure 760613DEST_PATH_IMAGE009
笔笔画有
Figure 201084DEST_PATH_IMAGE011
关键点,可以得到一个
Figure 148180DEST_PATH_IMAGE011
维特征向量,记作
Figure 41312DEST_PATH_IMAGE019
,每一维特征向量包含4个特征值:,最后一个关键点
Figure 120394DEST_PATH_IMAGE021
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 739857DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 618820DEST_PATH_IMAGE022
,该笔画包含
Figure 621411DEST_PATH_IMAGE023
个关键点;
A5:笔画特征匹配,对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第笔笔画,通过上步求得其特征向量为
Figure 685892DEST_PATH_IMAGE024
,模板汉字的第
Figure 52152DEST_PATH_IMAGE025
笔笔画的特征向量为
Figure 347577DEST_PATH_IMAGE024
Figure 72957DEST_PATH_IMAGE026
动态规划匹配的误差矩阵为,大小
动态规划的状态转移函数为:
Figure 489922DEST_PATH_IMAGE029
     其中定义
Figure 386203DEST_PATH_IMAGE030
Figure 962940DEST_PATH_IMAGE024
中的第维与
Figure 948662DEST_PATH_IMAGE026
中的
Figure 15844DEST_PATH_IMAGE032
维向量的误差:
Figure 79877DEST_PATH_IMAGE033
Figure 890707DEST_PATH_IMAGE034
其中
Figure 723796DEST_PATH_IMAGE035
是加权系数;
Figure 587978DEST_PATH_IMAGE036
做标量量化,最终第
Figure 637842DEST_PATH_IMAGE009
笔笔画的匹配度为:
Figure 488249DEST_PATH_IMAGE037
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 566057DEST_PATH_IMAGE038
Figure 709463DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 748088DEST_PATH_IMAGE039
A6:根据步骤A5中所获得的书写汉字与标准汉字的所有笔画的匹配度
Figure 900721DEST_PATH_IMAGE038
和匹配度平均值,采用决策树的方法对书写汉字的规范性做综合评价。
其中,步骤A6中决策树的方法具体是: 
A61:遍历,如果
Figure 649827DEST_PATH_IMAGE040
大于指定阈值
Figure 842036DEST_PATH_IMAGE041
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure 268338DEST_PATH_IMAGE042
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 520590DEST_PATH_IMAGE043
大于指定阈值
Figure 766764DEST_PATH_IMAGE044
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
其中,A2步骤之前还进一步包括,步骤A11笔画数目判别:根据步骤A1采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
其中,步骤A2中将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是:采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围,纵坐标的取值范围
Figure 43472DEST_PATH_IMAGE046
,设手写汉字的轨迹的宽度和高度分别为
Figure 466626DEST_PATH_IMAGE047
Figure 200095DEST_PATH_IMAGE048
,则:
Figure 734107DEST_PATH_IMAGE049
设中心对齐线性归一化后的宽度和高度分别为,归一化后的坐标为
Figure 310341DEST_PATH_IMAGE052
Figure 146579DEST_PATH_IMAGE053
其中
Figure 637865DEST_PATH_IMAGE054
是缩放比例:
Figure 901357DEST_PATH_IMAGE055
Figure 110883DEST_PATH_IMAGE056
中心对齐偏移量:
Figure 750812DEST_PATH_IMAGE057
一种书写汉字规范性评判的装置,包括:
采集并记录书写汉字笔画轨迹装置,用于采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 530997DEST_PATH_IMAGE002
,…,
Figure 405861DEST_PATH_IMAGE004
Figure 871739DEST_PATH_IMAGE005
,...,
Figure 661152DEST_PATH_IMAGE007
书写轨迹归一化装置用于将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;
书写轨迹关键点提取装置,采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 377304DEST_PATH_IMAGE008
笔笔画,第
Figure 697689DEST_PATH_IMAGE009
笔笔画的轨迹关键点用
Figure 739463DEST_PATH_IMAGE010
表示,
Figure 168737DEST_PATH_IMAGE011
为关键点数目;
笔画特征提取装置用于提取书写轨迹关键点的特征向量和模板汉字关键点的特征向量,根据获取的关键点,获取所有笔画的特征向量,第
Figure 688580DEST_PATH_IMAGE009
笔笔画的轨迹关键点
Figure 129051DEST_PATH_IMAGE010
,总共有
Figure 76147DEST_PATH_IMAGE011
个关键点,取轨迹关键点
Figure 969279DEST_PATH_IMAGE012
和关键点的后一个关键点
Figure 587790DEST_PATH_IMAGE014
,则有向线段的方向设定为关键点
Figure 86216DEST_PATH_IMAGE013
的方向,记作
Figure 947861DEST_PATH_IMAGE016
,有向线段
Figure 97345DEST_PATH_IMAGE015
的长度记为关键点
Figure 277922DEST_PATH_IMAGE013
的长度,记作
Figure 644181DEST_PATH_IMAGE017
Figure 313508DEST_PATH_IMAGE017
计算方法为:
对于第
Figure 128329DEST_PATH_IMAGE009
笔笔画有关键点,可以得到一个
Figure 81952DEST_PATH_IMAGE011
维特征向量,记作,每一维特征向量包含4个特征值:
Figure 554969DEST_PATH_IMAGE020
,最后一个关键点
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 540691DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 233972DEST_PATH_IMAGE022
,该笔画包含
Figure 796540DEST_PATH_IMAGE023
个关键点;
笔画特征匹配装置用于对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 843256DEST_PATH_IMAGE009
笔笔画,通过上步求得其特征向量为
Figure 440459DEST_PATH_IMAGE024
,模板汉字的第
Figure 180007DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 229872DEST_PATH_IMAGE026
Figure 56841DEST_PATH_IMAGE024
Figure 242972DEST_PATH_IMAGE026
动态规划匹配的误差矩阵为,大小
动态规划的状态转移函数为:
Figure 344679DEST_PATH_IMAGE029
     其中定义
Figure 466667DEST_PATH_IMAGE024
中的第
Figure 491124DEST_PATH_IMAGE031
维与
Figure 683333DEST_PATH_IMAGE026
中的
Figure 109635DEST_PATH_IMAGE032
维向量的误差:
Figure 96308DEST_PATH_IMAGE033
其中
Figure 603961DEST_PATH_IMAGE035
是加权系数;
Figure 619190DEST_PATH_IMAGE036
做标量量化,最终第
Figure 42343DEST_PATH_IMAGE009
笔笔画的匹配度为:
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 700038DEST_PATH_IMAGE038
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 429408DEST_PATH_IMAGE039
决策树综合评价装置:根据笔画特征匹配装置中所获得的书写汉字与标准汉字的所有笔画的匹配度和匹配度平均值,采用决策树的方法对书写汉字的规范性做综合评价。
其中,决策树综合评价装置中决策树的方法具体为: 
A61:遍历
Figure 479163DEST_PATH_IMAGE038
,如果大于指定阈值,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure 326530DEST_PATH_IMAGE042
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 937902DEST_PATH_IMAGE043
大于指定阈值
Figure 372295DEST_PATH_IMAGE044
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
其中,还进一步包括笔画数目判别装置,根据采集并记录书写汉字笔画轨迹装置采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
其中,书写轨迹归一化装置中,将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是:采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 69117DEST_PATH_IMAGE045
,纵坐标的取值范围
Figure 247158DEST_PATH_IMAGE046
,设手写汉字的轨迹的宽度和高度分别为
Figure 713036DEST_PATH_IMAGE047
Figure 318330DEST_PATH_IMAGE048
,则:
Figure 260307DEST_PATH_IMAGE058
设中心对齐线性归一化后的宽度和高度分别为
Figure 242039DEST_PATH_IMAGE050
Figure 562424DEST_PATH_IMAGE051
,归一化后的坐标为
Figure 964718DEST_PATH_IMAGE052
Figure 134668DEST_PATH_IMAGE059
其中
Figure 155976DEST_PATH_IMAGE054
是缩放比例:
Figure 829402DEST_PATH_IMAGE055
Figure 543543DEST_PATH_IMAGE056
中心对齐偏移量:
本技术方案如下:首先采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 760209DEST_PATH_IMAGE001
Figure 288142DEST_PATH_IMAGE002
,…,
Figure 173184DEST_PATH_IMAGE003
Figure 52147DEST_PATH_IMAGE004
,...,
Figure 63276DEST_PATH_IMAGE006
Figure 119219DEST_PATH_IMAGE007
;然后将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;进一步采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有N笔的笔画,第笔笔画的轨迹关键点用
Figure 386701DEST_PATH_IMAGE010
表示,
Figure 780904DEST_PATH_IMAGE011
为关键点数目,根据获取的关键点,获取所有笔画的特征向量,第
Figure 240704DEST_PATH_IMAGE009
笔笔画的轨迹关键点,总共有
Figure 799173DEST_PATH_IMAGE011
个关键点,取轨迹关键点
Figure 923249DEST_PATH_IMAGE012
关键点的后一个关键点
Figure 396267DEST_PATH_IMAGE014
,则有向线段的方向设定为关键点
Figure 506622DEST_PATH_IMAGE013
的方向,记作,有向线段的长度记为关键点
Figure 661115DEST_PATH_IMAGE013
的长度,记作
Figure 258319DEST_PATH_IMAGE017
Figure 732288DEST_PATH_IMAGE016
Figure 782152DEST_PATH_IMAGE017
计算方法为:
Figure 632559DEST_PATH_IMAGE018
对于第
Figure 84269DEST_PATH_IMAGE009
笔笔画有
Figure 994718DEST_PATH_IMAGE011
关键点,可以得到一个维特征向量,记作
Figure 920397DEST_PATH_IMAGE019
,每一维特征向量包含4个特征值:
Figure 226613DEST_PATH_IMAGE020
,最后一个关键点
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 958520DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 649264DEST_PATH_IMAGE022
,该笔画包含
Figure 311452DEST_PATH_IMAGE023
个关键点;再进一步对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 688337DEST_PATH_IMAGE009
笔笔画,通过上步求得其特征向量为
Figure 200090DEST_PATH_IMAGE024
,模板汉字的第笔笔画的特征向量为
Figure 961952DEST_PATH_IMAGE026
Figure 385105DEST_PATH_IMAGE024
Figure 118575DEST_PATH_IMAGE026
动态规划匹配的误差矩阵为,大小
Figure 679580DEST_PATH_IMAGE028
动态规划的状态转移函数为:
Figure DEST_PATH_IMAGE060A
     其中定义
Figure 149001DEST_PATH_IMAGE030
Figure 369767DEST_PATH_IMAGE024
中的第
Figure 465328DEST_PATH_IMAGE031
维与
Figure 720728DEST_PATH_IMAGE026
中的
Figure 610318DEST_PATH_IMAGE032
维向量的误差:
Figure 819845DEST_PATH_IMAGE033
Figure 194194DEST_PATH_IMAGE034
其中
Figure 805566DEST_PATH_IMAGE035
是加权系数,
Figure 866058DEST_PATH_IMAGE036
做标量量化,最终第
Figure 61415DEST_PATH_IMAGE009
笔笔画的匹配度为:
Figure 740921DEST_PATH_IMAGE037
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 705335DEST_PATH_IMAGE038
Figure 812093DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 229168DEST_PATH_IMAGE039
最后根据书写汉字与标准汉字的所有笔画的匹配度
Figure 712364DEST_PATH_IMAGE038
和匹配度平均值
Figure 531285DEST_PATH_IMAGE039
,采用决策树的方法对书写汉字的规范性做综合评价。本发明可以克服人工评价汉字的主观性以及疲劳性带来的不利影响,能对书写汉字的规范性进行评判。
附图说明
图1为本发明实施例1的原理图;
图2为本发明实施例4的原理图。
具体实施方式
下面结合附图对本发明作进一步的说明,如图1~图2所示。
实施例1
一种书写汉字规范性评判的方法,包括如下步骤:
101:采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 808944DEST_PATH_IMAGE001
Figure 857190DEST_PATH_IMAGE002
,…,
Figure 377033DEST_PATH_IMAGE003
Figure 764601DEST_PATH_IMAGE005
,...,
Figure 408465DEST_PATH_IMAGE006
Figure 193715DEST_PATH_IMAGE007
102:将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中,本实施例中,所述模板汉字均为所述书写汉字对应的汉字,即模板汉字与书写汉字为相同汉字;
103:采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 488692DEST_PATH_IMAGE008
笔的笔画,第笔笔画的轨迹关键点用
Figure 488582DEST_PATH_IMAGE010
表示,
Figure 615807DEST_PATH_IMAGE011
为关键点数目;
104:根据获取的关键点,获取所有笔画的特征向量,第
Figure 765291DEST_PATH_IMAGE009
笔笔画的轨迹关键点
Figure 804922DEST_PATH_IMAGE010
,总共有
Figure 797280DEST_PATH_IMAGE011
个关键点,取轨迹关键点
Figure 964082DEST_PATH_IMAGE012
和关键点
Figure 466607DEST_PATH_IMAGE013
的后一个关键点
Figure 693452DEST_PATH_IMAGE014
,则有向线段
Figure 907526DEST_PATH_IMAGE015
的方向设定为关键点
Figure 376554DEST_PATH_IMAGE013
的方向,记作
Figure 500630DEST_PATH_IMAGE016
,有向线段
Figure 131331DEST_PATH_IMAGE015
的长度记为关键点
Figure 973648DEST_PATH_IMAGE013
的长度,记作
Figure 980787DEST_PATH_IMAGE017
Figure 959369DEST_PATH_IMAGE016
Figure 760972DEST_PATH_IMAGE017
计算方法为:
Figure 825005DEST_PATH_IMAGE018
对于第
Figure 635835DEST_PATH_IMAGE009
笔笔画有关键点,可以得到一个维特征向量,记作
Figure 218908DEST_PATH_IMAGE019
,每一维特征向量包含4个特征值:,最后一个关键点
Figure 521025DEST_PATH_IMAGE021
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 431474DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 703056DEST_PATH_IMAGE022
,该笔画包含
Figure 481787DEST_PATH_IMAGE023
个关键点;
模板汉字的笔画、轨迹关键点和笔画的特征向量可以预先计算出来并保存,在实施本方案时,可以直接读取与书写汉字对应的模板汉字的笔画、轨迹关键点、笔画的特征向量的数据;当然,也可以预先保存模板汉字的笔画以及,轨迹关键点和笔画的特征向量,并放置于 汉字标准模板特征库中,在实施本方案时,按上述原理计算出模板汉字的轨迹关键点、投影特征向量;
105:笔画特征匹配,对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的每一笔笔画与汉字标准模板特征库中的对应汉字的对应笔画进行动态规划匹配,对书写汉字和模板汉字对应笔画的特征进行动态规划匹配,匹配误差越小表明相似度越高,反之,则相似度越低,记录每一笔的匹配度;
对于书写汉字的第
Figure 289468DEST_PATH_IMAGE009
笔笔画,通过上步求得其特征向量为
Figure 869354DEST_PATH_IMAGE024
,模板汉字的第
Figure 395276DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 86020DEST_PATH_IMAGE026
Figure 748208DEST_PATH_IMAGE024
Figure 125094DEST_PATH_IMAGE026
动态规划匹配的误差矩阵为
Figure 371267DEST_PATH_IMAGE027
,大小
Figure 367167DEST_PATH_IMAGE028
动态规划的状态转移函数为:
     其中定义
Figure 71129DEST_PATH_IMAGE030
Figure 804599DEST_PATH_IMAGE024
中的第
Figure 338611DEST_PATH_IMAGE031
维与
Figure 473926DEST_PATH_IMAGE026
中的
Figure 67980DEST_PATH_IMAGE032
维向量的误差:
Figure 288746DEST_PATH_IMAGE033
Figure 751083DEST_PATH_IMAGE034
其中
Figure 507948DEST_PATH_IMAGE035
是加权系数;
Figure 771439DEST_PATH_IMAGE036
做标量量化,最终第
Figure 715387DEST_PATH_IMAGE009
笔笔画的匹配度为:
Figure 355316DEST_PATH_IMAGE037
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 966688DEST_PATH_IMAGE038
Figure 3741DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 933520DEST_PATH_IMAGE039
106:根据步骤A5中所获得的书写汉字与标准汉字的所有笔画的匹配度
Figure 613025DEST_PATH_IMAGE038
和匹配度平均值
Figure 577439DEST_PATH_IMAGE039
,采用决策树的方法对书写汉字的规范性做综合评价,
本实施例的采用决策树的方法对书写汉字的规范性做综合评价
决策树的具体方法是: 
A61:遍历
Figure 684198DEST_PATH_IMAGE038
,如果
Figure 366852DEST_PATH_IMAGE040
大于指定阈值,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure 668968DEST_PATH_IMAGE042
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 946628DEST_PATH_IMAGE043
大于指定阈值
Figure 850999DEST_PATH_IMAGE044
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
本实施例的
Figure 872307DEST_PATH_IMAGE061
 。
本实施例的
Figure 811313DEST_PATH_IMAGE042
=1。
本实施例的
Figure 259874DEST_PATH_IMAGE062
Figure 651541DEST_PATH_IMAGE063
,也就是说如果第
Figure 476540DEST_PATH_IMAGE009
笔笔画的匹配度
Figure 270053DEST_PATH_IMAGE064
大于18,那么第
Figure 889515DEST_PATH_IMAGE009
笔为不符合规范,如果不符合规范的笔画多余1画的时候,则得出该书写汉字笔画不符合规范的结论,返回笔画不符合规范,并返回不符合规范笔画的序号,如果不符合规范的笔画小于或等于1画的时候,则将笔画的匹配度平均值与15比较,如果
Figure 397168DEST_PATH_IMAGE043
大于15则书写汉字不符合规范,如果
Figure 45187DEST_PATH_IMAGE043
小于或者等于15则得出该书写汉字符合规范,根据
Figure 835551DEST_PATH_IMAGE043
得出该书写汉字符合规范程度。
本发明可以根据实际情况调节
Figure 201810DEST_PATH_IMAGE041
Figure 368611DEST_PATH_IMAGE044
的值,比如
Figure 222615DEST_PATH_IMAGE041
=19,
Figure 312056DEST_PATH_IMAGE044
=16, 
Figure 781083DEST_PATH_IMAGE042
=2;
Figure 639580DEST_PATH_IMAGE041
=17,=13, 
Figure 112598DEST_PATH_IMAGE042
=3;本发明也可以根据实际情况合理调节加权系数
Figure 119737DEST_PATH_IMAGE035
的取值,比如令
Figure 2010105378757100002DEST_PATH_IMAGE065
都能实现本发明,也可以根据实际情况调节
Figure 997123DEST_PATH_IMAGE042
值,比如另
Figure 565770DEST_PATH_IMAGE042
=2,也就是说如果遍历
Figure 128339DEST_PATH_IMAGE038
,如果不规范笔画数大于2则返回本实施例笔画不符合规范的结果。
实施例2
本实施例在实施例1基础上102步骤之前还进一步包括步骤107:笔画数目判别:根据步骤101采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
实施例3
实施例1的步骤102中为了保证书写汉字不发生形变,本实施例具体选取了采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 440634DEST_PATH_IMAGE045
,纵坐标的取值范围
Figure 772258DEST_PATH_IMAGE046
,设手写汉字的轨迹的宽度和高度分别为
Figure 511806DEST_PATH_IMAGE047
Figure 187769DEST_PATH_IMAGE048
,则:
Figure 536711DEST_PATH_IMAGE058
设中心对齐线性归一化后的宽度和高度分别为
Figure 489886DEST_PATH_IMAGE050
Figure 259390DEST_PATH_IMAGE051
,归一化后的坐标为
Figure 796550DEST_PATH_IMAGE052
Figure 575281DEST_PATH_IMAGE059
其中
Figure 382963DEST_PATH_IMAGE054
是缩放比例:
Figure 588947DEST_PATH_IMAGE055
Figure 347825DEST_PATH_IMAGE056
中心对齐偏移量:
Figure 664668DEST_PATH_IMAGE057
实施例4
一种书写汉字规范性评判的装置,其特征在于,包括:
采集并记录书写汉字笔画轨迹装置201,用于采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 592435DEST_PATH_IMAGE001
Figure 969320DEST_PATH_IMAGE002
,…,
Figure 215494DEST_PATH_IMAGE003
Figure 492203DEST_PATH_IMAGE005
,...,
Figure 915356DEST_PATH_IMAGE006
Figure 648826DEST_PATH_IMAGE007
笔画数目判别装置207,根据采集并记录书写汉字笔画轨迹装置采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范;
书写轨迹归一化装置202用于将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中,书写轨迹归一化装置202中,将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是,采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 159400DEST_PATH_IMAGE045
,纵坐标的取值范围
Figure 920814DEST_PATH_IMAGE046
,设手写汉字的轨迹的宽度和高度分别为
Figure 13404DEST_PATH_IMAGE047
Figure 735634DEST_PATH_IMAGE048
,则:
设中心对齐线性归一化后的宽度和高度分别为
Figure 63158DEST_PATH_IMAGE050
Figure 326650DEST_PATH_IMAGE051
,归一化后的坐标为
Figure 176105DEST_PATH_IMAGE059
其中
Figure 521898DEST_PATH_IMAGE054
是缩放比例:
Figure 956290DEST_PATH_IMAGE055
Figure 653113DEST_PATH_IMAGE056
中心对齐偏移量:
Figure 831154DEST_PATH_IMAGE057
书写轨迹关键点提取装置203,,采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 297032DEST_PATH_IMAGE008
笔笔画,第
Figure 902326DEST_PATH_IMAGE009
笔笔画的轨迹关键点用
Figure 211079DEST_PATH_IMAGE010
表示,为关键点数目;
笔画特征提取装置204用于提取书写轨迹关键点的特征向量和模板汉字关键点的特征向量,根据获取的关键点,获取所有笔画的特征向量,设第
Figure 247616DEST_PATH_IMAGE009
笔笔画的轨迹关键点,总共有
Figure 695226DEST_PATH_IMAGE011
个关键点,取轨迹关键点
Figure 716534DEST_PATH_IMAGE012
关键点
Figure 655540DEST_PATH_IMAGE013
的后一个关键点
Figure 104101DEST_PATH_IMAGE014
,则有向线段
Figure 495768DEST_PATH_IMAGE015
的方向设定为关键点
Figure 320767DEST_PATH_IMAGE013
的方向,记作
Figure 114279DEST_PATH_IMAGE016
,有向线段
Figure 733742DEST_PATH_IMAGE015
的长度记为关键点
Figure 238804DEST_PATH_IMAGE013
的长度,记作
Figure 100449DEST_PATH_IMAGE017
Figure 273371DEST_PATH_IMAGE016
Figure 827849DEST_PATH_IMAGE017
计算方法为:
Figure 695573DEST_PATH_IMAGE018
对于第
Figure 95330DEST_PATH_IMAGE009
笔笔画有
Figure 364900DEST_PATH_IMAGE011
关键点,可以得到一个
Figure 824700DEST_PATH_IMAGE011
维特征向量,记作,每一维特征向量包含4个特征值:,最后一个关键点
Figure 631878DEST_PATH_IMAGE021
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 29624DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 104896DEST_PATH_IMAGE022
,该笔画包含个关键点;
笔画特征匹配装置205用于用于对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第笔笔画,通过上步求得其特征向量为
Figure 783898DEST_PATH_IMAGE024
,模板汉字的第
Figure 847932DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 393183DEST_PATH_IMAGE026
Figure 491851DEST_PATH_IMAGE024
Figure 729934DEST_PATH_IMAGE026
动态规划匹配的误差矩阵为
Figure 281263DEST_PATH_IMAGE027
,大小
Figure 630205DEST_PATH_IMAGE028
动态规划的状态转移函数为:
Figure 317801DEST_PATH_IMAGE029
     其中定义中的第
Figure 544142DEST_PATH_IMAGE031
维与
Figure 850358DEST_PATH_IMAGE026
中的
Figure 666130DEST_PATH_IMAGE032
维向量的误差:
Figure 690587DEST_PATH_IMAGE033
Figure 7430DEST_PATH_IMAGE034
其中
Figure 911759DEST_PATH_IMAGE035
是加权系数;
Figure 396967DEST_PATH_IMAGE036
做标量量化,最终第
Figure 410185DEST_PATH_IMAGE009
笔笔画的匹配度为:
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 343003DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
决策树综合评价装置206:根据笔画特征匹配装置中所获得的书写汉字与标准汉字的所有笔画的匹配度和匹配度平均值
Figure 512843DEST_PATH_IMAGE039
,采用决策树的方法对书写汉字的规范性做综合评价,决策树综合评价装置206中决策树的方法具体为: 
A61:遍历
Figure 605433DEST_PATH_IMAGE038
,如果
Figure 327664DEST_PATH_IMAGE040
大于指定阈值
Figure 163902DEST_PATH_IMAGE041
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure 655188DEST_PATH_IMAGE042
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果大于指定阈值
Figure 128206DEST_PATH_IMAGE044
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
本实施例的
Figure 502555DEST_PATH_IMAGE061
 。
本实施例的
Figure 113928DEST_PATH_IMAGE042
=1。
本实施例的
Figure 548320DEST_PATH_IMAGE062
,也就是说如果第
Figure 49282DEST_PATH_IMAGE009
笔笔画的匹配度
Figure 13696DEST_PATH_IMAGE064
大于18,那么第
Figure 494356DEST_PATH_IMAGE009
笔为不符合规范,如果不符合规范的笔画多余1画的时候,则得出该书写汉字笔画不符合规范的结论,返回笔画不符合规范,并返回不符合规范笔画的序号,如果不符合规范的笔画小于或等于1画的时候,则将笔画的匹配度平均值
Figure 412895DEST_PATH_IMAGE043
与15比较,如果
Figure 145359DEST_PATH_IMAGE043
大于15则书写汉字不符合规范,如果小于或者等于15则得出该书写汉字符合规范,根据得出该书写汉字符合规范程度。
本发明可以根据实际情况调节
Figure 287256DEST_PATH_IMAGE041
Figure 308563DEST_PATH_IMAGE044
Figure 981990DEST_PATH_IMAGE042
的值,比如
Figure 696131DEST_PATH_IMAGE041
=19,
Figure 87798DEST_PATH_IMAGE044
=16, 
Figure 936234DEST_PATH_IMAGE042
=2;
Figure 464167DEST_PATH_IMAGE041
=17,
Figure 349209DEST_PATH_IMAGE044
=13, 
Figure 228172DEST_PATH_IMAGE042
=3;本发明也可以根据实际情况合理调节加权系数
Figure 591283DEST_PATH_IMAGE035
的取值,比如令
Figure 239302DEST_PATH_IMAGE065
都能实现本发明,也可以根据实际情况调节
Figure 295245DEST_PATH_IMAGE042
值,比如令
Figure 395925DEST_PATH_IMAGE042
=2,也就是说如果遍历
Figure 562726DEST_PATH_IMAGE038
,如果不规范笔画数大于2则返回本实施例笔画不符合规范的结果。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (8)

1.一种书写汉字规范性评判的方法,其特征在于,包括:
A1:采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:                                                
Figure 2010105378757100001DEST_PATH_IMAGE001
Figure 946038DEST_PATH_IMAGE002
,…,
Figure 782275DEST_PATH_IMAGE004
Figure 2010105378757100001DEST_PATH_IMAGE005
,...,
Figure 273562DEST_PATH_IMAGE006
Figure 2010105378757100001DEST_PATH_IMAGE007
A2:将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;
A3:采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有N笔的笔画,第
Figure 537053DEST_PATH_IMAGE008
笔笔画的轨迹关键点用表示,为关键点数目;
A4:根据获取的关键点,获取所有笔画的特征向量,第笔笔画的轨迹关键点
Figure 103273DEST_PATH_IMAGE009
,总共有
Figure 475349DEST_PATH_IMAGE010
个关键点,取轨迹关键点
Figure 2010105378757100001DEST_PATH_IMAGE011
和关键点
Figure 172171DEST_PATH_IMAGE012
的后一个关键点
Figure 2010105378757100001DEST_PATH_IMAGE013
,则有向线段
Figure 350212DEST_PATH_IMAGE014
的方向设定为关键点
Figure 750844DEST_PATH_IMAGE012
的方向,记作
Figure 2010105378757100001DEST_PATH_IMAGE015
,有向线段
Figure 356138DEST_PATH_IMAGE014
的长度记为关键点的长度,记作
Figure 131775DEST_PATH_IMAGE016
Figure 888378DEST_PATH_IMAGE015
Figure 867836DEST_PATH_IMAGE016
计算方法为:
Figure 2010105378757100001DEST_PATH_IMAGE017
对于第
Figure 270742DEST_PATH_IMAGE008
笔笔画有
Figure 790585DEST_PATH_IMAGE010
关键点,可以得到一个
Figure 667274DEST_PATH_IMAGE010
维特征向量,记作,每一维特征向量包含4个特征值:
Figure 2010105378757100001DEST_PATH_IMAGE019
,最后一个关键点
Figure 382868DEST_PATH_IMAGE020
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 706402DEST_PATH_IMAGE008
笔笔画的特征向量为,该笔画包含
Figure 998450DEST_PATH_IMAGE022
个关键点;
A5:笔画特征匹配,对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 54131DEST_PATH_IMAGE008
笔笔画,通过上步求得其特征向量为
Figure 2010105378757100001DEST_PATH_IMAGE023
,对应模板汉字第
Figure 434559DEST_PATH_IMAGE008
笔笔画的特征向量为
Figure 233887DEST_PATH_IMAGE024
Figure 819590DEST_PATH_IMAGE023
动态规划匹配的误差矩阵为
Figure 2010105378757100001DEST_PATH_IMAGE025
,大小
Figure 238862DEST_PATH_IMAGE026
动态规划的状态转移函数为:
Figure 2010105378757100001DEST_PATH_IMAGE027
其中定义
Figure 845872DEST_PATH_IMAGE023
中的第
Figure 2010105378757100001DEST_PATH_IMAGE029
维与
Figure 305672DEST_PATH_IMAGE024
中的
Figure 595446DEST_PATH_IMAGE030
维向量的误差:
Figure 2010105378757100001DEST_PATH_IMAGE031
Figure 798894DEST_PATH_IMAGE032
其中是加权系数;
Figure 922970DEST_PATH_IMAGE034
做标量量化,最终第
Figure 756934DEST_PATH_IMAGE008
笔笔画的匹配度为:
Figure 2010105378757100001DEST_PATH_IMAGE035
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 832206DEST_PATH_IMAGE036
Figure 2010105378757100001DEST_PATH_IMAGE037
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 361318DEST_PATH_IMAGE038
A6:根据步骤A5中所获得的书写汉字与标准汉字的所有笔画的匹配度
Figure 776119DEST_PATH_IMAGE036
和匹配度平均值
Figure 780984DEST_PATH_IMAGE038
,采用决策树的方法对书写汉字的规范性做综合评价。
2.根据权利要求1所述的一种书写汉字规范性评判的方法,其特征在于,步骤A6中决策树的方法具体是: 
A61:遍历
Figure 782700DEST_PATH_IMAGE036
,如果
Figure 2010105378757100001DEST_PATH_IMAGE039
大于指定阈值
Figure 327951DEST_PATH_IMAGE040
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure 2010105378757100001DEST_PATH_IMAGE041
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 423690DEST_PATH_IMAGE042
大于指定阈值
Figure 2010105378757100001DEST_PATH_IMAGE043
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
3.根据权利要求2所述的一种书写汉字规范性评判的方法,其特征在于,A2步骤之前还进一步包括,步骤A11笔画数目判别:根据步骤A1采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
4.根据权利要求3所述的一种书写汉字规范性评判的方法,其特征在于,步骤A2中将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是:采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围,纵坐标的取值范围
Figure 2010105378757100001DEST_PATH_IMAGE045
,设手写汉字的轨迹的宽度和高度分别为
Figure 213102DEST_PATH_IMAGE046
Figure 2010105378757100001DEST_PATH_IMAGE047
,则:
Figure 562044DEST_PATH_IMAGE048
设中心对齐线性归一化后的宽度和高度分别为
Figure 2010105378757100001DEST_PATH_IMAGE049
Figure 246710DEST_PATH_IMAGE050
,归一化后的坐标为
Figure 2010105378757100001DEST_PATH_IMAGE051
Figure 655695DEST_PATH_IMAGE052
其中
Figure 2010105378757100001DEST_PATH_IMAGE053
是缩放比例:
Figure 694320DEST_PATH_IMAGE054
Figure 2010105378757100001DEST_PATH_IMAGE055
中心对齐偏移量:
5.一种书写汉字规范性评判的装置,其特征在于,包括:
采集并记录书写汉字笔画轨迹装置,用于采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 90852DEST_PATH_IMAGE001
Figure 841377DEST_PATH_IMAGE002
,…,
Figure 803517DEST_PATH_IMAGE003
Figure 431944DEST_PATH_IMAGE004
,...,
Figure 720286DEST_PATH_IMAGE006
Figure 169721DEST_PATH_IMAGE007
书写轨迹归一化装置用于将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;
书写轨迹关键点提取装置,采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 601840DEST_PATH_IMAGE037
笔的笔画,笔画的轨迹关键点用
Figure 912659DEST_PATH_IMAGE009
表示,
Figure 583812DEST_PATH_IMAGE010
为关键点数目;
笔画特征提取装置用于提取书写轨迹关键点的特征向量和模板汉字关键点的特征向量,根据获取的关键点,获取所有笔画的特征向量,第
Figure 819621DEST_PATH_IMAGE008
笔笔画的轨迹关键点
Figure 892619DEST_PATH_IMAGE009
,总共有个关键点,取轨迹关键点
Figure 582806DEST_PATH_IMAGE011
和关键点
Figure 356727DEST_PATH_IMAGE012
的后一个关键点
Figure 284232DEST_PATH_IMAGE013
,则有向线段
Figure 983941DEST_PATH_IMAGE014
的方向设定为关键点
Figure 629686DEST_PATH_IMAGE012
的方向,记作
Figure 941719DEST_PATH_IMAGE015
,有向线段
Figure 989309DEST_PATH_IMAGE014
的长度记为关键点
Figure 862849DEST_PATH_IMAGE012
的长度,记作
Figure 995890DEST_PATH_IMAGE016
Figure 111614DEST_PATH_IMAGE015
Figure 13711DEST_PATH_IMAGE016
计算方法为:
Figure 55223DEST_PATH_IMAGE017
对于第
Figure 409981DEST_PATH_IMAGE008
笔笔画有
Figure 329395DEST_PATH_IMAGE010
关键点,可以得到一个
Figure 649780DEST_PATH_IMAGE010
维特征向量,记作,每一维特征向量包含4个特征值:
Figure 471292DEST_PATH_IMAGE019
,最后一个关键点
Figure 928818DEST_PATH_IMAGE020
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 38463DEST_PATH_IMAGE008
笔笔画的特征向量为,该笔画包含
Figure 518172DEST_PATH_IMAGE022
个关键点;
笔画特征匹配装置用于对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 779389DEST_PATH_IMAGE008
笔笔画,通过上步求得其特征向量为
Figure 746470DEST_PATH_IMAGE023
,对应模板汉字的第
Figure 67730DEST_PATH_IMAGE008
笔笔画的特征向量为
Figure 683705DEST_PATH_IMAGE023
Figure 791380DEST_PATH_IMAGE024
动态规划匹配的误差矩阵为
Figure 345858DEST_PATH_IMAGE025
,大小
Figure 384221DEST_PATH_IMAGE026
动态规划的状态转移函数为:
其中定义
Figure 194493DEST_PATH_IMAGE028
Figure 591977DEST_PATH_IMAGE023
中的第
Figure 383215DEST_PATH_IMAGE029
维与中的
Figure 645493DEST_PATH_IMAGE030
维向量的误差:
Figure 777659DEST_PATH_IMAGE031
Figure 56194DEST_PATH_IMAGE032
其中
Figure 63333DEST_PATH_IMAGE033
是加权系数;
Figure 976669DEST_PATH_IMAGE034
做标量量化,最终第
Figure 981534DEST_PATH_IMAGE008
笔笔画的匹配度为:
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 590818DEST_PATH_IMAGE036
Figure 125705DEST_PATH_IMAGE037
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 596744DEST_PATH_IMAGE038
决策树综合评价装置:根据笔画特征匹配装置中所获得的书写汉字与标准汉字所有笔画的匹配度
Figure 584292DEST_PATH_IMAGE036
和匹配度平均值
Figure 870916DEST_PATH_IMAGE038
,采用决策树的方法对书写汉字的规范性做综合评价。
6.根据权利要求5所述的一种书写汉字规范性评判的装置,其特征在于,决策树综合评价装置中决策树的方法具体为: 
A61:遍历
Figure 260309DEST_PATH_IMAGE036
,如果
Figure 170759DEST_PATH_IMAGE039
大于指定阈值
Figure 645603DEST_PATH_IMAGE040
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果大于指定阈值
Figure 792660DEST_PATH_IMAGE043
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
7.根据权利要求6所述的一种书写汉字规范性评判的装置,其特征在于,还进一步包括笔画数目判别装置,根据采集并记录书写汉字笔画轨迹装置采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
8.根据权利要求7所述的一种书写汉字规范性评判的装置,其特征在于,书写轨迹归一化装置中,将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是:采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 754799DEST_PATH_IMAGE044
,纵坐标的取值范围
Figure 884692DEST_PATH_IMAGE045
,设手写汉字的轨迹的宽度和高度分别为
Figure 45415DEST_PATH_IMAGE046
Figure 733885DEST_PATH_IMAGE047
,则:
Figure 744173DEST_PATH_IMAGE048
设中心对齐线性归一化后的宽度和高度分别为
Figure 910712DEST_PATH_IMAGE049
Figure 692985DEST_PATH_IMAGE050
,归一化后的坐标为
Figure 552357DEST_PATH_IMAGE051
其中
Figure 20171DEST_PATH_IMAGE053
是缩放比例:
Figure 93169DEST_PATH_IMAGE054
中心对齐偏移量:
Figure 845673DEST_PATH_IMAGE056
CN2010105378757A 2010-11-10 2010-11-10 一种书写汉字规范性评判的方法和装置 Active CN101976354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105378757A CN101976354B (zh) 2010-11-10 2010-11-10 一种书写汉字规范性评判的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105378757A CN101976354B (zh) 2010-11-10 2010-11-10 一种书写汉字规范性评判的方法和装置

Publications (2)

Publication Number Publication Date
CN101976354A true CN101976354A (zh) 2011-02-16
CN101976354B CN101976354B (zh) 2012-07-25

Family

ID=43576238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105378757A Active CN101976354B (zh) 2010-11-10 2010-11-10 一种书写汉字规范性评判的方法和装置

Country Status (1)

Country Link
CN (1) CN101976354B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542264A (zh) * 2011-12-22 2012-07-04 北京语言大学 基于数字手写设备的汉字书写正误自动评测方法和装置
CN102609735A (zh) * 2012-02-06 2012-07-25 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN102663454A (zh) * 2012-04-18 2012-09-12 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN102768729A (zh) * 2011-06-17 2012-11-07 靳光瑾 一种汉字规范书写的评测方法和装置
CN103390358A (zh) * 2013-07-03 2013-11-13 广东小天才科技有限公司 对电子设备的字符书写操作进行规范性判断的方法及装置
CN104008405A (zh) * 2013-02-26 2014-08-27 佳能株式会社 手写字符识别方法和装置
CN104050453A (zh) * 2014-06-24 2014-09-17 南京师范大学 一种手写汉字笔势评价方法
CN104182732A (zh) * 2014-08-12 2014-12-03 南京师范大学 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法
CN104714223A (zh) * 2013-12-12 2015-06-17 中国科学院声学研究所 一种合成孔径声纳数据中直航段数据的自动提取方法
CN104715256A (zh) * 2015-03-04 2015-06-17 南昌大学 一种基于图像方法的书法练习辅助系统及评价方法
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法
CN105117054A (zh) * 2015-08-12 2015-12-02 珠海优特电力科技股份有限公司 一种手写输入的识别方法及系统
CN105678348A (zh) * 2016-01-07 2016-06-15 陕西师范大学 一种手写汉字规范性评价方法及系统
CN105718965A (zh) * 2014-12-02 2016-06-29 北京汉仪科印信息技术有限公司 一种汉字书写字形识别方法及装置
CN106096524A (zh) * 2016-06-01 2016-11-09 广东小天才科技有限公司 一种汉字美观度的获取方法及装置
CN107480700A (zh) * 2017-07-18 2017-12-15 西安理工大学 一种基于Gabor和SVM纹理提取汉字的方法
CN107507161A (zh) * 2016-06-14 2017-12-22 科大讯飞股份有限公司 一种书写整洁度的评价方法及系统
CN107563456A (zh) * 2017-08-17 2018-01-09 福建天泉教育科技有限公司 语文手写改错方法、可读存储介质
CN108710871A (zh) * 2018-08-04 2018-10-26 安徽翰智文化科技有限公司 一种基于用户书法练习效果检测的书法练习系统
CN109214471A (zh) * 2018-10-10 2019-01-15 北京米蓝科技有限公司 评价练字字帖中的书写字的方法及系统
CN110019632A (zh) * 2018-04-19 2019-07-16 中国测绘科学研究院 一种基于形状树的地理要素形状分析方法
CN111063009A (zh) * 2019-12-18 2020-04-24 山东山科智能科技有限公司 一种汉字书写动画演示方法及装置
CN112699840A (zh) * 2021-01-13 2021-04-23 深圳市锦上科技有限公司 书写过程评价与反馈方法、及其系统、计算机存储介质
CN113496263A (zh) * 2020-03-18 2021-10-12 北京易真学思教育科技有限公司 字符识别方法、设备及字符识别芯片

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251891A (zh) * 2008-02-29 2008-08-27 东莞市正欣科技有限公司 书写汉字结构规范性评价的方法和装置
CN101295371A (zh) * 2008-04-18 2008-10-29 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN101320422A (zh) * 2008-06-06 2008-12-10 东莞市开心信息技术服务有限公司 手写汉字笔画交接离的规范性判定方法和装置
CN101344918A (zh) * 2008-06-06 2009-01-14 东莞市开心信息技术服务有限公司 手写汉字笔画位置规范性的判断方法和装置
CN101393693A (zh) * 2008-09-12 2009-03-25 浙江大学 一种汉字书写计算机教学方法
CN101465074A (zh) * 2008-10-21 2009-06-24 华南理工大学 一种手写汉字布局评价方法
CN101630362A (zh) * 2009-08-25 2010-01-20 华南理工大学 一种基于置信度的汉字书写质量评价方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251891A (zh) * 2008-02-29 2008-08-27 东莞市正欣科技有限公司 书写汉字结构规范性评价的方法和装置
CN101295371A (zh) * 2008-04-18 2008-10-29 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN101320422A (zh) * 2008-06-06 2008-12-10 东莞市开心信息技术服务有限公司 手写汉字笔画交接离的规范性判定方法和装置
CN101344918A (zh) * 2008-06-06 2009-01-14 东莞市开心信息技术服务有限公司 手写汉字笔画位置规范性的判断方法和装置
CN101393693A (zh) * 2008-09-12 2009-03-25 浙江大学 一种汉字书写计算机教学方法
CN101465074A (zh) * 2008-10-21 2009-06-24 华南理工大学 一种手写汉字布局评价方法
CN101630362A (zh) * 2009-08-25 2010-01-20 华南理工大学 一种基于置信度的汉字书写质量评价方法

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768729A (zh) * 2011-06-17 2012-11-07 靳光瑾 一种汉字规范书写的评测方法和装置
CN102542264A (zh) * 2011-12-22 2012-07-04 北京语言大学 基于数字手写设备的汉字书写正误自动评测方法和装置
CN102609735B (zh) * 2012-02-06 2014-03-12 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN102609735A (zh) * 2012-02-06 2012-07-25 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN102663454B (zh) * 2012-04-18 2014-08-20 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN102663454A (zh) * 2012-04-18 2012-09-12 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN104008405A (zh) * 2013-02-26 2014-08-27 佳能株式会社 手写字符识别方法和装置
CN103390358A (zh) * 2013-07-03 2013-11-13 广东小天才科技有限公司 对电子设备的字符书写操作进行规范性判断的方法及装置
CN103390358B (zh) * 2013-07-03 2015-08-19 广东小天才科技有限公司 对电子设备的字符书写操作进行规范性判断的方法及装置
CN104714223A (zh) * 2013-12-12 2015-06-17 中国科学院声学研究所 一种合成孔径声纳数据中直航段数据的自动提取方法
CN104050453A (zh) * 2014-06-24 2014-09-17 南京师范大学 一种手写汉字笔势评价方法
CN104182732A (zh) * 2014-08-12 2014-12-03 南京师范大学 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法
CN104182732B (zh) * 2014-08-12 2017-09-26 南京师范大学 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法
CN105718965A (zh) * 2014-12-02 2016-06-29 北京汉仪科印信息技术有限公司 一种汉字书写字形识别方法及装置
CN104715256A (zh) * 2015-03-04 2015-06-17 南昌大学 一种基于图像方法的书法练习辅助系统及评价方法
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法
CN105117054B (zh) * 2015-08-12 2018-04-17 珠海优特物联科技有限公司 一种手写输入的识别方法及系统
CN105117054A (zh) * 2015-08-12 2015-12-02 珠海优特电力科技股份有限公司 一种手写输入的识别方法及系统
CN105678348A (zh) * 2016-01-07 2016-06-15 陕西师范大学 一种手写汉字规范性评价方法及系统
CN105678348B (zh) * 2016-01-07 2019-01-11 陕西师范大学 一种手写汉字规范性评价方法及系统
CN106096524A (zh) * 2016-06-01 2016-11-09 广东小天才科技有限公司 一种汉字美观度的获取方法及装置
CN107507161B (zh) * 2016-06-14 2020-06-16 科大讯飞股份有限公司 一种书写整洁度的评价方法及系统
CN107507161A (zh) * 2016-06-14 2017-12-22 科大讯飞股份有限公司 一种书写整洁度的评价方法及系统
CN107480700A (zh) * 2017-07-18 2017-12-15 西安理工大学 一种基于Gabor和SVM纹理提取汉字的方法
CN107480700B (zh) * 2017-07-18 2021-02-12 西安理工大学 一种基于Gabor和SVM纹理提取汉字的方法
CN107563456B (zh) * 2017-08-17 2019-12-13 福建天泉教育科技有限公司 语文手写改错方法、可读存储介质
CN107563456A (zh) * 2017-08-17 2018-01-09 福建天泉教育科技有限公司 语文手写改错方法、可读存储介质
CN110019632B (zh) * 2018-04-19 2021-06-08 中国测绘科学研究院 一种基于形状树的地理要素形状分析方法
CN110019632A (zh) * 2018-04-19 2019-07-16 中国测绘科学研究院 一种基于形状树的地理要素形状分析方法
CN108710871A (zh) * 2018-08-04 2018-10-26 安徽翰智文化科技有限公司 一种基于用户书法练习效果检测的书法练习系统
CN109214471A (zh) * 2018-10-10 2019-01-15 北京米蓝科技有限公司 评价练字字帖中的书写字的方法及系统
CN111063009A (zh) * 2019-12-18 2020-04-24 山东山科智能科技有限公司 一种汉字书写动画演示方法及装置
CN113496263A (zh) * 2020-03-18 2021-10-12 北京易真学思教育科技有限公司 字符识别方法、设备及字符识别芯片
CN113496263B (zh) * 2020-03-18 2022-05-17 北京易真学思教育科技有限公司 字符识别方法、设备及字符识别芯片
CN112699840A (zh) * 2021-01-13 2021-04-23 深圳市锦上科技有限公司 书写过程评价与反馈方法、及其系统、计算机存储介质

Also Published As

Publication number Publication date
CN101976354B (zh) 2012-07-25

Similar Documents

Publication Publication Date Title
CN101976354A (zh) 一种书写汉字规范性评判的方法和装置
CN103065134B (zh) 一种具有提示信息的指纹识别装置和方法
Tang et al. Text-independent writer identification via CNN features and joint Bayesian
CN103390358B (zh) 对电子设备的字符书写操作进行规范性判断的方法及装置
Harouni et al. Online Persian/Arabic script classification without contextual information
CN102622610B (zh) 一种基于分类器集成的手写维文字符识别方法
CN101881999B (zh) 甲骨文视频输入系统及实现方法
CN108664975B (zh) 一种维吾尔文手写字母识别方法、系统及电子设备
CN110472652B (zh) 基于语义引导的少量样本分类方法
CN104392229B (zh) 基于笔画片段方向分布特征的笔迹识别方法
CN105787522A (zh) 基于手写笔迹的书写态度评价方法及系统
CN104504412A (zh) 一种手写体笔划特征提取和识别方法及系统
CN110866499A (zh) 手写文本识别方法、系统、设备及介质
CN101630362A (zh) 一种基于置信度的汉字书写质量评价方法
Prasanth et al. Elastic matching of online handwritten Tamil and Telugu scripts using local features
CN104239910B (zh) 一种联机手写汉字笔画续笔的识别方法
CN113361666B (zh) 一种手写字符识别方法、系统及介质
CN101604393B (zh) 一种用于联机手写汉字识别的汉字笔画特征提取方法
CN101604392B (zh) 一种用于联机手写汉字识别的汉字笔画特征并行提取方法
Yu et al. Mental workload classification via online writing features
Kunwar et al. Online handwritten Kannada word recognizer with unrestricted vocabulary
Dahake et al. On segmentation of words from online handwritten Gurmukhi sentences
CN101604378B (zh) 一种用于联机手写汉字识别的汉字笔画特征串行提取方法
CN104504385B (zh) 手写粘连数字串的识别方法
Xu et al. On-line sample generation for in-air written chinese character recognition based on leap motion controller

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 523000 DONGGUAN, GUANGDONG PROVINCE TO: 510663 GUANGZHOU, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20120130

Address after: 510663 Guangdong city of Guangzhou province Tianhe District No. 1023 room first first Pu Lu

Applicant after: Guangdong Ksense Information Technology Co., Ltd.

Address before: 523000, Dongguan City, Guangdong province city center district, the first international phase B, building 8, 809

Applicant before: Guangdong Ksense Information Technology Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: QI HENGNIAN

Free format text: FORMER OWNER: GUANGDONG KSENSE INFORMATION TECHNOLOGY CO., LTD.

Effective date: 20141216

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 510663 GUANGZHOU, GUANGDONG PROVINCE TO: 311300 HANGZHOU, ZHEJIANG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20141216

Address after: Hangzhou City, Zhejiang Province, Ling'an City, 311300 Ring Road, Lin Shui Shan Ju

Patentee after: Qi Hengnian

Address before: 510663 Guangdong city of Guangzhou province Tianhe District No. 1023 room first first Pu Lu

Patentee before: Guangdong Ksense Information Technology Co., Ltd.