CN101976354B - 一种书写汉字规范性评判的方法和装置 - Google Patents

一种书写汉字规范性评判的方法和装置 Download PDF

Info

Publication number
CN101976354B
CN101976354B CN2010105378757A CN201010537875A CN101976354B CN 101976354 B CN101976354 B CN 101976354B CN 2010105378757 A CN2010105378757 A CN 2010105378757A CN 201010537875 A CN201010537875 A CN 201010537875A CN 101976354 B CN101976354 B CN 101976354B
Authority
CN
China
Prior art keywords
chinese characters
stroke
writing
writing chinese
key point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010105378757A
Other languages
English (en)
Other versions
CN101976354A (zh
Inventor
朱军民
邓超
Original Assignee
Guangdong Ksense Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ksense Information Technology Co Ltd filed Critical Guangdong Ksense Information Technology Co Ltd
Priority to CN2010105378757A priority Critical patent/CN101976354B/zh
Publication of CN101976354A publication Critical patent/CN101976354A/zh
Application granted granted Critical
Publication of CN101976354B publication Critical patent/CN101976354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及计算机数据处理技术领域,尤其涉及一种书写汉字规范性评判的方法,其包括6部分,分别是采集并记录书写汉字笔画轨迹;将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;采用道格拉斯-普克算法提取书写轨迹关键点;根据获取的关键点,获取所有笔画的特征向量;笔画特征匹配,对于书写汉字的每一笔笔画与汉字标准模板特征库中的对应汉字的对应笔画进行动态规划匹配;采用决策树的方法对书写汉字的规范性做综合评价;本发明可以克服人工评价汉字的主观性以及疲劳性带来的不利影响,能对书写汉字的规范性进行评判。

Description

一种书写汉字规范性评判的方法和装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种书写汉字规范性评判的方法和装置。
背景技术
在汉字应用水平测试和汉字应用教学等领域,如何有效的评判书写汉字的规范性是一个比较新颖的课题。目前所采用的方法主要是由人(教师)来评价,这种方法一方面带有很大的主观性,同样的书写汉字不同的人可能给出差别较大的评判;另一方面,这一枯燥重复性的工作容易使人疲劳,同样的汉字由同样的人在不同的时间段进行评判,都有可能给出不同的评判结果。
中国发明专利“一种手写汉字布局评价方法”(公开号CN101465074A)公开了一种汉字布局的评价方法,该方法通过采用笔画布局、部件布局以及整体字形布局来对手写汉字进行综合评价。然而,由于该专利采用了笔画和部件的重心来对笔画布局和部件布局进行评价,显然,以笔画或者部件重心为中心旋转任意角度,都不会改变笔画或部件的长度和大小,因此,按该专利的方法,旋转任意角度后对笔画和部件的评价将没有影响,而汉字笔画本身是具有方向性的,这显然是不符合汉字书写常识的,因此,仅仅以重心为指标来对汉字笔画和部件来进行评价这是有所欠缺的,需要增加其它约束条件,来对书写汉字进行更有效的评价。
中国发明专利“一种基于自信度的汉字书写质量评价方法”(公开号为CN101630362A)提出了一种基于置信度的汉字书写质量评价方法,该专利采用修正二次判决函数计算候选字的距离,然后根据候选字的距离大小计算置信度并进行汉字书写质量的评价,由于该专利的评价标准依赖于训练样本(即书写汉字)的选取,如果训练样本书写工整,则对书写工整的汉字具有较好的评价;显然,即使对于书写工整的汉字也有好坏之分,这种方法是不能够对这类情况进行评价的。
发明内容
本发明的目的在于针对现有技术的不足而提供一种可以克服人工评价汉字的主观性以及疲劳性带来的不利影响,能对书写汉字的规范性进行评判的书写汉字规范性评判的方法和装置。
本发明的目的通过以下技术措施实现: 一种书写汉字规范性评判的方法,包括:
A1:采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:                                                
Figure 138033DEST_PATH_IMAGE001
Figure 10305DEST_PATH_IMAGE002
,…,
Figure 858134DEST_PATH_IMAGE003
Figure 138943DEST_PATH_IMAGE004
Figure 686730DEST_PATH_IMAGE005
,...,
Figure 921664DEST_PATH_IMAGE006
Figure 954211DEST_PATH_IMAGE007
A2:将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;
A3:采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 590991DEST_PATH_IMAGE008
笔笔画,第
Figure 683581DEST_PATH_IMAGE009
笔笔画的轨迹关键点用
Figure 405812DEST_PATH_IMAGE010
表示,
Figure 242049DEST_PATH_IMAGE011
为关键点数目;
A4:根据获取的关键点,获取所有笔画的特征向量,第
Figure 998915DEST_PATH_IMAGE009
笔笔画的轨迹关键点
Figure 262406DEST_PATH_IMAGE010
,总共有个关键点,取轨迹关键点
Figure 846282DEST_PATH_IMAGE012
和关键点
Figure 457655DEST_PATH_IMAGE013
的后一个关键点
Figure 892047DEST_PATH_IMAGE014
,则有向线段
Figure 323291DEST_PATH_IMAGE015
的方向设定为关键点
Figure 501331DEST_PATH_IMAGE013
的方向,记作
Figure 967210DEST_PATH_IMAGE016
,有向线段
Figure 572503DEST_PATH_IMAGE015
的长度记为关键点
Figure 756622DEST_PATH_IMAGE013
的长度,记作
Figure 472775DEST_PATH_IMAGE017
Figure 58739DEST_PATH_IMAGE016
Figure 834934DEST_PATH_IMAGE017
计算方法为:
Figure 240770DEST_PATH_IMAGE018
对于第
Figure 760613DEST_PATH_IMAGE009
笔笔画有
Figure 201084DEST_PATH_IMAGE011
关键点,可以得到一个
Figure 148180DEST_PATH_IMAGE011
维特征向量,记作
Figure 41312DEST_PATH_IMAGE019
,每一维特征向量包含4个特征值:
Figure 364846DEST_PATH_IMAGE020
,最后一个关键点
Figure 120394DEST_PATH_IMAGE021
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 739857DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 618820DEST_PATH_IMAGE022
,该笔画包含
Figure 621411DEST_PATH_IMAGE023
个关键点;
A5:笔画特征匹配,对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 895529DEST_PATH_IMAGE009
笔笔画,通过上步求得其特征向量为
Figure 685892DEST_PATH_IMAGE024
,模板汉字的第
Figure 52152DEST_PATH_IMAGE025
笔笔画的特征向量为
Figure 218953DEST_PATH_IMAGE026
Figure 347577DEST_PATH_IMAGE024
Figure 72957DEST_PATH_IMAGE026
动态规划匹配的误差矩阵为,大小
Figure 631425DEST_PATH_IMAGE028
动态规划的状态转移函数为:
Figure 489922DEST_PATH_IMAGE029
     其中定义
Figure 386203DEST_PATH_IMAGE030
Figure 962940DEST_PATH_IMAGE024
中的第
Figure 970079DEST_PATH_IMAGE031
维与
Figure 948662DEST_PATH_IMAGE026
中的
Figure 15844DEST_PATH_IMAGE032
维向量的误差:
Figure 79877DEST_PATH_IMAGE033
Figure 890707DEST_PATH_IMAGE034
其中
Figure 723796DEST_PATH_IMAGE035
是加权系数;
Figure 587978DEST_PATH_IMAGE036
做标量量化,最终第
Figure 637842DEST_PATH_IMAGE009
笔笔画的匹配度为:
Figure 488249DEST_PATH_IMAGE037
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 566057DEST_PATH_IMAGE038
Figure 709463DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 748088DEST_PATH_IMAGE039
A6:根据步骤A5中所获得的书写汉字与标准汉字的所有笔画的匹配度和匹配度平均值
Figure 809598DEST_PATH_IMAGE039
,采用决策树的方法对书写汉字的规范性做综合评价。
其中,步骤A6中决策树的方法具体是: 
A61:遍历
Figure 890949DEST_PATH_IMAGE038
,如果大于指定阈值
Figure 842036DEST_PATH_IMAGE041
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure 268338DEST_PATH_IMAGE042
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 520590DEST_PATH_IMAGE043
大于指定阈值
Figure 766764DEST_PATH_IMAGE044
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
其中,A2步骤之前还进一步包括,步骤A11笔画数目判别:根据步骤A1采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
其中,步骤A2中将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是:采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围,纵坐标的取值范围
Figure 43472DEST_PATH_IMAGE046
,设手写汉字的轨迹的宽度和高度分别为
Figure 466626DEST_PATH_IMAGE047
,则:
Figure 734107DEST_PATH_IMAGE049
设中心对齐线性归一化后的宽度和高度分别为
Figure 869422DEST_PATH_IMAGE050
Figure 588111DEST_PATH_IMAGE051
,归一化后的坐标为
Figure 310341DEST_PATH_IMAGE052
Figure 146579DEST_PATH_IMAGE053
其中
Figure 637865DEST_PATH_IMAGE054
是缩放比例:
Figure 110883DEST_PATH_IMAGE056
中心对齐偏移量:
一种书写汉字规范性评判的装置,包括:
采集并记录书写汉字笔画轨迹装置,用于采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 96605DEST_PATH_IMAGE001
Figure 530997DEST_PATH_IMAGE002
,…,
Figure 405861DEST_PATH_IMAGE004
Figure 871739DEST_PATH_IMAGE005
,...,
Figure 661152DEST_PATH_IMAGE007
书写轨迹归一化装置用于将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;
书写轨迹关键点提取装置,采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 377304DEST_PATH_IMAGE008
笔笔画,第
Figure 697689DEST_PATH_IMAGE009
笔笔画的轨迹关键点用
Figure 739463DEST_PATH_IMAGE010
表示,
Figure 168737DEST_PATH_IMAGE011
为关键点数目;
笔画特征提取装置用于提取书写轨迹关键点的特征向量和模板汉字关键点的特征向量,根据获取的关键点,获取所有笔画的特征向量,第
Figure 688580DEST_PATH_IMAGE009
笔笔画的轨迹关键点
Figure 129051DEST_PATH_IMAGE010
,总共有
Figure 76147DEST_PATH_IMAGE011
个关键点,取轨迹关键点
Figure 969279DEST_PATH_IMAGE012
和关键点的后一个关键点
Figure 587790DEST_PATH_IMAGE014
,则有向线段
Figure 705788DEST_PATH_IMAGE015
的方向设定为关键点
Figure 86216DEST_PATH_IMAGE013
的方向,记作,有向线段
Figure 97345DEST_PATH_IMAGE015
的长度记为关键点
Figure 277922DEST_PATH_IMAGE013
的长度,记作
Figure 644181DEST_PATH_IMAGE017
Figure 545403DEST_PATH_IMAGE016
Figure 313508DEST_PATH_IMAGE017
计算方法为:
Figure 274773DEST_PATH_IMAGE018
对于第
Figure 128329DEST_PATH_IMAGE009
笔笔画有
Figure 833242DEST_PATH_IMAGE011
关键点,可以得到一个维特征向量,记作
Figure 978232DEST_PATH_IMAGE019
,每一维特征向量包含4个特征值:
Figure 554969DEST_PATH_IMAGE020
,最后一个关键点
Figure 562109DEST_PATH_IMAGE021
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 540691DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 233972DEST_PATH_IMAGE022
,该笔画包含
Figure 796540DEST_PATH_IMAGE023
个关键点;
笔画特征匹配装置用于对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 843256DEST_PATH_IMAGE009
笔笔画,通过上步求得其特征向量为
Figure 440459DEST_PATH_IMAGE024
,模板汉字的第
Figure 180007DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 229872DEST_PATH_IMAGE026
Figure 56841DEST_PATH_IMAGE024
Figure 242972DEST_PATH_IMAGE026
动态规划匹配的误差矩阵为
Figure 153421DEST_PATH_IMAGE027
,大小
Figure 690582DEST_PATH_IMAGE028
动态规划的状态转移函数为:
Figure 344679DEST_PATH_IMAGE029
     其中定义
Figure 650896DEST_PATH_IMAGE030
Figure 466667DEST_PATH_IMAGE024
中的第维与中的维向量的误差:
其中
Figure 603961DEST_PATH_IMAGE035
是加权系数;
Figure 619190DEST_PATH_IMAGE036
做标量量化,最终第
Figure 42343DEST_PATH_IMAGE009
笔笔画的匹配度为:
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 700038DEST_PATH_IMAGE038
Figure 336818DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 429408DEST_PATH_IMAGE039
决策树综合评价装置:根据笔画特征匹配装置中所获得的书写汉字与标准汉字的所有笔画的匹配度
Figure 151638DEST_PATH_IMAGE038
和匹配度平均值
Figure 987876DEST_PATH_IMAGE039
,采用决策树的方法对书写汉字的规范性做综合评价。
其中,决策树综合评价装置中决策树的方法具体为: 
A61:遍历,如果
Figure 742654DEST_PATH_IMAGE040
大于指定阈值
Figure 952180DEST_PATH_IMAGE041
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 937902DEST_PATH_IMAGE043
大于指定阈值
Figure 372295DEST_PATH_IMAGE044
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
其中,还进一步包括笔画数目判别装置,根据采集并记录书写汉字笔画轨迹装置采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
其中,书写轨迹归一化装置中,将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是:采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 69117DEST_PATH_IMAGE045
,纵坐标的取值范围,设手写汉字的轨迹的宽度和高度分别为
Figure 713036DEST_PATH_IMAGE047
Figure 318330DEST_PATH_IMAGE048
,则:
设中心对齐线性归一化后的宽度和高度分别为
Figure 242039DEST_PATH_IMAGE050
Figure 562424DEST_PATH_IMAGE051
,归一化后的坐标为
Figure 964718DEST_PATH_IMAGE052
Figure 134668DEST_PATH_IMAGE059
其中
Figure 155976DEST_PATH_IMAGE054
是缩放比例:
Figure 543543DEST_PATH_IMAGE056
中心对齐偏移量:
Figure 935210DEST_PATH_IMAGE057
本技术方案如下:首先采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 760209DEST_PATH_IMAGE001
Figure 288142DEST_PATH_IMAGE002
,…,
Figure 173184DEST_PATH_IMAGE003
Figure 52147DEST_PATH_IMAGE004
Figure 415257DEST_PATH_IMAGE005
,...,
Figure 63276DEST_PATH_IMAGE006
Figure 119219DEST_PATH_IMAGE007
;然后将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;进一步采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有N笔的笔画,第
Figure 219899DEST_PATH_IMAGE009
笔笔画的轨迹关键点用表示,为关键点数目,根据获取的关键点,获取所有笔画的特征向量,第
Figure 240704DEST_PATH_IMAGE009
笔笔画的轨迹关键点,总共有
Figure 799173DEST_PATH_IMAGE011
个关键点,取轨迹关键点
Figure 923249DEST_PATH_IMAGE012
关键点
Figure 553950DEST_PATH_IMAGE013
的后一个关键点
Figure 396267DEST_PATH_IMAGE014
,则有向线段
Figure 403406DEST_PATH_IMAGE015
的方向设定为关键点
Figure 506622DEST_PATH_IMAGE013
的方向,记作
Figure 75269DEST_PATH_IMAGE016
,有向线段
Figure 637837DEST_PATH_IMAGE015
的长度记为关键点的长度,记作
Figure 732288DEST_PATH_IMAGE016
Figure 782152DEST_PATH_IMAGE017
计算方法为:
对于第
Figure 84269DEST_PATH_IMAGE009
笔笔画有
Figure 994718DEST_PATH_IMAGE011
关键点,可以得到一个
Figure 531879DEST_PATH_IMAGE011
维特征向量,记作
Figure 920397DEST_PATH_IMAGE019
,每一维特征向量包含4个特征值:,最后一个关键点
Figure 307964DEST_PATH_IMAGE021
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 958520DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 649264DEST_PATH_IMAGE022
,该笔画包含
Figure 311452DEST_PATH_IMAGE023
个关键点;再进一步对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 688337DEST_PATH_IMAGE009
笔笔画,通过上步求得其特征向量为,模板汉字的第
Figure 55045DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 961952DEST_PATH_IMAGE026
Figure 385105DEST_PATH_IMAGE024
Figure 118575DEST_PATH_IMAGE026
动态规划匹配的误差矩阵为
Figure 918166DEST_PATH_IMAGE027
,大小
Figure 679580DEST_PATH_IMAGE028
动态规划的状态转移函数为:
Figure DEST_PATH_IMAGE060A
     其中定义
Figure 149001DEST_PATH_IMAGE030
Figure 369767DEST_PATH_IMAGE024
中的第
Figure 465328DEST_PATH_IMAGE031
维与
Figure 720728DEST_PATH_IMAGE026
中的
Figure 610318DEST_PATH_IMAGE032
维向量的误差:
Figure 819845DEST_PATH_IMAGE033
Figure 194194DEST_PATH_IMAGE034
其中
Figure 805566DEST_PATH_IMAGE035
是加权系数,
Figure 866058DEST_PATH_IMAGE036
做标量量化,最终第
Figure 61415DEST_PATH_IMAGE009
笔笔画的匹配度为:
Figure 740921DEST_PATH_IMAGE037
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 705335DEST_PATH_IMAGE038
Figure 812093DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
最后根据书写汉字与标准汉字的所有笔画的匹配度
Figure 712364DEST_PATH_IMAGE038
和匹配度平均值
Figure 531285DEST_PATH_IMAGE039
,采用决策树的方法对书写汉字的规范性做综合评价。本发明可以克服人工评价汉字的主观性以及疲劳性带来的不利影响,能对书写汉字的规范性进行评判。
附图说明
图1为本发明实施例1的原理图;
图2为本发明实施例4的原理图。
具体实施方式
下面结合附图对本发明作进一步的说明,如图1~图2所示。
实施例1
一种书写汉字规范性评判的方法,包括如下步骤:
101:采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 808944DEST_PATH_IMAGE001
Figure 857190DEST_PATH_IMAGE002
,…,
Figure 377033DEST_PATH_IMAGE003
Figure 551925DEST_PATH_IMAGE004
Figure 764601DEST_PATH_IMAGE005
,...,
Figure 408465DEST_PATH_IMAGE006
Figure 193715DEST_PATH_IMAGE007
102:将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中,本实施例中,所述模板汉字均为所述书写汉字对应的汉字,即模板汉字与书写汉字为相同汉字;
103:采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 488692DEST_PATH_IMAGE008
笔的笔画,第
Figure 249100DEST_PATH_IMAGE009
笔笔画的轨迹关键点用
Figure 488582DEST_PATH_IMAGE010
表示,为关键点数目;
104:根据获取的关键点,获取所有笔画的特征向量,第
Figure 765291DEST_PATH_IMAGE009
笔笔画的轨迹关键点
Figure 804922DEST_PATH_IMAGE010
,总共有
Figure 797280DEST_PATH_IMAGE011
个关键点,取轨迹关键点
Figure 964082DEST_PATH_IMAGE012
和关键点
Figure 466607DEST_PATH_IMAGE013
的后一个关键点
Figure 693452DEST_PATH_IMAGE014
,则有向线段
Figure 907526DEST_PATH_IMAGE015
的方向设定为关键点
Figure 376554DEST_PATH_IMAGE013
的方向,记作
Figure 500630DEST_PATH_IMAGE016
,有向线段
Figure 131331DEST_PATH_IMAGE015
的长度记为关键点
Figure 973648DEST_PATH_IMAGE013
的长度,记作
Figure 980787DEST_PATH_IMAGE017
Figure 959369DEST_PATH_IMAGE016
Figure 760972DEST_PATH_IMAGE017
计算方法为:
Figure 825005DEST_PATH_IMAGE018
对于第
Figure 635835DEST_PATH_IMAGE009
笔笔画有
Figure 593558DEST_PATH_IMAGE011
关键点,可以得到一个
Figure 169044DEST_PATH_IMAGE011
维特征向量,记作
Figure 218908DEST_PATH_IMAGE019
,每一维特征向量包含4个特征值:
Figure 69315DEST_PATH_IMAGE020
,最后一个关键点
Figure 521025DEST_PATH_IMAGE021
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 431474DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 703056DEST_PATH_IMAGE022
,该笔画包含
Figure 481787DEST_PATH_IMAGE023
个关键点;
模板汉字的笔画、轨迹关键点和笔画的特征向量可以预先计算出来并保存,在实施本方案时,可以直接读取与书写汉字对应的模板汉字的笔画、轨迹关键点、笔画的特征向量的数据;当然,也可以预先保存模板汉字的笔画以及,轨迹关键点和笔画的特征向量,并放置于 汉字标准模板特征库中,在实施本方案时,按上述原理计算出模板汉字的轨迹关键点、投影特征向量;
105:笔画特征匹配,对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的每一笔笔画与汉字标准模板特征库中的对应汉字的对应笔画进行动态规划匹配,对书写汉字和模板汉字对应笔画的特征进行动态规划匹配,匹配误差越小表明相似度越高,反之,则相似度越低,记录每一笔的匹配度;
对于书写汉字的第
Figure 289468DEST_PATH_IMAGE009
笔笔画,通过上步求得其特征向量为
Figure 869354DEST_PATH_IMAGE024
,模板汉字的第
Figure 395276DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 86020DEST_PATH_IMAGE026
Figure 748208DEST_PATH_IMAGE024
动态规划匹配的误差矩阵为
Figure 371267DEST_PATH_IMAGE027
,大小
Figure 367167DEST_PATH_IMAGE028
动态规划的状态转移函数为:
Figure 647976DEST_PATH_IMAGE029
     其中定义
Figure 71129DEST_PATH_IMAGE030
Figure 804599DEST_PATH_IMAGE024
中的第
Figure 338611DEST_PATH_IMAGE031
维与中的维向量的误差:
Figure 288746DEST_PATH_IMAGE033
Figure 751083DEST_PATH_IMAGE034
其中是加权系数;
Figure 771439DEST_PATH_IMAGE036
做标量量化,最终第
Figure 715387DEST_PATH_IMAGE009
笔笔画的匹配度为:
Figure 355316DEST_PATH_IMAGE037
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 3741DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 933520DEST_PATH_IMAGE039
106:根据步骤A5中所获得的书写汉字与标准汉字的所有笔画的匹配度
Figure 613025DEST_PATH_IMAGE038
和匹配度平均值,采用决策树的方法对书写汉字的规范性做综合评价,
本实施例的采用决策树的方法对书写汉字的规范性做综合评价
决策树的具体方法是: 
A61:遍历
Figure 684198DEST_PATH_IMAGE038
,如果
Figure 366852DEST_PATH_IMAGE040
大于指定阈值
Figure 584469DEST_PATH_IMAGE041
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure 668968DEST_PATH_IMAGE042
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 946628DEST_PATH_IMAGE043
大于指定阈值
Figure 850999DEST_PATH_IMAGE044
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
本实施例的
Figure 872307DEST_PATH_IMAGE061
 。
本实施例的
Figure 811313DEST_PATH_IMAGE042
=1。
本实施例的
Figure 259874DEST_PATH_IMAGE062
Figure 651541DEST_PATH_IMAGE063
,也就是说如果第
Figure 476540DEST_PATH_IMAGE009
笔笔画的匹配度
Figure 270053DEST_PATH_IMAGE064
大于18,那么第
Figure 889515DEST_PATH_IMAGE009
笔为不符合规范,如果不符合规范的笔画多余1画的时候,则得出该书写汉字笔画不符合规范的结论,返回笔画不符合规范,并返回不符合规范笔画的序号,如果不符合规范的笔画小于或等于1画的时候,则将笔画的匹配度平均值
Figure 768478DEST_PATH_IMAGE043
与15比较,如果
Figure 397168DEST_PATH_IMAGE043
大于15则书写汉字不符合规范,如果
Figure 45187DEST_PATH_IMAGE043
小于或者等于15则得出该书写汉字符合规范,根据
Figure 835551DEST_PATH_IMAGE043
得出该书写汉字符合规范程度。
本发明可以根据实际情况调节
Figure 201810DEST_PATH_IMAGE041
Figure 368611DEST_PATH_IMAGE044
Figure 497235DEST_PATH_IMAGE042
的值,比如=19,
Figure 312056DEST_PATH_IMAGE044
=16, =2;
Figure 639580DEST_PATH_IMAGE041
=17,
Figure 535861DEST_PATH_IMAGE044
=13, =3;本发明也可以根据实际情况合理调节加权系数
Figure 119737DEST_PATH_IMAGE035
的取值,比如令
Figure DEST_PATH_IMAGE065
都能实现本发明,也可以根据实际情况调节
Figure 997123DEST_PATH_IMAGE042
值,比如另
Figure 565770DEST_PATH_IMAGE042
=2,也就是说如果遍历
Figure 128339DEST_PATH_IMAGE038
,如果不规范笔画数大于2则返回本实施例笔画不符合规范的结果。
实施例2
本实施例在实施例1基础上102步骤之前还进一步包括步骤107:笔画数目判别:根据步骤101采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
实施例3
实施例1的步骤102中为了保证书写汉字不发生形变,本实施例具体选取了采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 440634DEST_PATH_IMAGE045
,纵坐标的取值范围
Figure 772258DEST_PATH_IMAGE046
,设手写汉字的轨迹的宽度和高度分别为
Figure 187769DEST_PATH_IMAGE048
,则:
Figure 536711DEST_PATH_IMAGE058
设中心对齐线性归一化后的宽度和高度分别为
Figure 259390DEST_PATH_IMAGE051
,归一化后的坐标为
Figure 796550DEST_PATH_IMAGE052
Figure 575281DEST_PATH_IMAGE059
其中
Figure 382963DEST_PATH_IMAGE054
是缩放比例:
Figure 588947DEST_PATH_IMAGE055
Figure 347825DEST_PATH_IMAGE056
中心对齐偏移量:
Figure 664668DEST_PATH_IMAGE057
实施例4
一种书写汉字规范性评判的装置,其特征在于,包括:
采集并记录书写汉字笔画轨迹装置201,用于采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 592435DEST_PATH_IMAGE001
,…,
Figure 215494DEST_PATH_IMAGE003
Figure 211394DEST_PATH_IMAGE004
Figure 492203DEST_PATH_IMAGE005
,...,
Figure 915356DEST_PATH_IMAGE006
Figure 648826DEST_PATH_IMAGE007
笔画数目判别装置207,根据采集并记录书写汉字笔画轨迹装置采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范;
书写轨迹归一化装置202用于将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中,书写轨迹归一化装置202中,将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是,采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 159400DEST_PATH_IMAGE045
,纵坐标的取值范围
Figure 920814DEST_PATH_IMAGE046
,设手写汉字的轨迹的宽度和高度分别为
Figure 13404DEST_PATH_IMAGE047
Figure 735634DEST_PATH_IMAGE048
,则:
Figure 571872DEST_PATH_IMAGE058
设中心对齐线性归一化后的宽度和高度分别为
Figure 63158DEST_PATH_IMAGE050
Figure 326650DEST_PATH_IMAGE051
,归一化后的坐标为
Figure 536176DEST_PATH_IMAGE052
其中
Figure 521898DEST_PATH_IMAGE054
是缩放比例:
Figure 956290DEST_PATH_IMAGE055
Figure 653113DEST_PATH_IMAGE056
中心对齐偏移量:
Figure 831154DEST_PATH_IMAGE057
书写轨迹关键点提取装置203,,采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 2010105378757100002297032DEST_PATH_IMAGE008
笔笔画,第
Figure 902326DEST_PATH_IMAGE009
笔笔画的轨迹关键点用
Figure 211079DEST_PATH_IMAGE010
表示,
Figure 428696DEST_PATH_IMAGE011
为关键点数目;
笔画特征提取装置204用于提取书写轨迹关键点的特征向量和模板汉字关键点的特征向量,根据获取的关键点,获取所有笔画的特征向量,设第笔笔画的轨迹关键点
Figure 790855DEST_PATH_IMAGE010
,总共有
Figure 695226DEST_PATH_IMAGE011
个关键点,取轨迹关键点
Figure 716534DEST_PATH_IMAGE012
关键点
Figure 655540DEST_PATH_IMAGE013
的后一个关键点
Figure 104101DEST_PATH_IMAGE014
,则有向线段的方向设定为关键点
Figure 320767DEST_PATH_IMAGE013
的方向,记作
Figure 114279DEST_PATH_IMAGE016
,有向线段
Figure 733742DEST_PATH_IMAGE015
的长度记为关键点
Figure 238804DEST_PATH_IMAGE013
的长度,记作
Figure 100449DEST_PATH_IMAGE017
Figure 827849DEST_PATH_IMAGE017
计算方法为:
Figure 695573DEST_PATH_IMAGE018
对于第
Figure 95330DEST_PATH_IMAGE009
笔笔画有
Figure 364900DEST_PATH_IMAGE011
关键点,可以得到一个
Figure 824700DEST_PATH_IMAGE011
维特征向量,记作
Figure 179720DEST_PATH_IMAGE019
,每一维特征向量包含4个特征值:
Figure 383168DEST_PATH_IMAGE020
,最后一个关键点
Figure 631878DEST_PATH_IMAGE021
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 29624DEST_PATH_IMAGE009
笔笔画的特征向量为,该笔画包含
Figure 613500DEST_PATH_IMAGE023
个关键点;
笔画特征匹配装置205用于用于对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第笔笔画,通过上步求得其特征向量为
Figure 783898DEST_PATH_IMAGE024
,模板汉字的第
Figure 847932DEST_PATH_IMAGE009
笔笔画的特征向量为
Figure 491851DEST_PATH_IMAGE024
动态规划匹配的误差矩阵为
Figure 281263DEST_PATH_IMAGE027
,大小
动态规划的状态转移函数为:
     其中定义
Figure 726785DEST_PATH_IMAGE030
Figure 765411DEST_PATH_IMAGE024
中的第
Figure 544142DEST_PATH_IMAGE031
维与
Figure 850358DEST_PATH_IMAGE026
中的
Figure 666130DEST_PATH_IMAGE032
维向量的误差:
Figure 690587DEST_PATH_IMAGE033
其中
Figure 911759DEST_PATH_IMAGE035
是加权系数;
Figure 396967DEST_PATH_IMAGE036
做标量量化,最终第
Figure 410185DEST_PATH_IMAGE009
笔笔画的匹配度为:
Figure 904620DEST_PATH_IMAGE037
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 421314DEST_PATH_IMAGE038
Figure 343003DEST_PATH_IMAGE008
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 577937DEST_PATH_IMAGE039
决策树综合评价装置206:根据笔画特征匹配装置中所获得的书写汉字与标准汉字的所有笔画的匹配度
Figure 876063DEST_PATH_IMAGE038
和匹配度平均值
Figure 512843DEST_PATH_IMAGE039
,采用决策树的方法对书写汉字的规范性做综合评价,决策树综合评价装置206中决策树的方法具体为: 
A61:遍历
Figure 605433DEST_PATH_IMAGE038
,如果
Figure 327664DEST_PATH_IMAGE040
大于指定阈值
Figure 163902DEST_PATH_IMAGE041
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 918679DEST_PATH_IMAGE043
大于指定阈值
Figure 128206DEST_PATH_IMAGE044
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
本实施例的
Figure 502555DEST_PATH_IMAGE061
 。
本实施例的
Figure 113928DEST_PATH_IMAGE042
=1。
本实施例的
Figure 548320DEST_PATH_IMAGE062
Figure 245143DEST_PATH_IMAGE063
,也就是说如果第笔笔画的匹配度
Figure 13696DEST_PATH_IMAGE064
大于18,那么第
Figure 494356DEST_PATH_IMAGE009
笔为不符合规范,如果不符合规范的笔画多余1画的时候,则得出该书写汉字笔画不符合规范的结论,返回笔画不符合规范,并返回不符合规范笔画的序号,如果不符合规范的笔画小于或等于1画的时候,则将笔画的匹配度平均值
Figure 412895DEST_PATH_IMAGE043
与15比较,如果
Figure 145359DEST_PATH_IMAGE043
大于15则书写汉字不符合规范,如果
Figure 839646DEST_PATH_IMAGE043
小于或者等于15则得出该书写汉字符合规范,根据
Figure 117305DEST_PATH_IMAGE043
得出该书写汉字符合规范程度。
本发明可以根据实际情况调节
Figure 308563DEST_PATH_IMAGE044
Figure 981990DEST_PATH_IMAGE042
的值,比如
Figure 696131DEST_PATH_IMAGE041
=19,
Figure 87798DEST_PATH_IMAGE044
=16, 
Figure 936234DEST_PATH_IMAGE042
=2;
Figure 464167DEST_PATH_IMAGE041
=17,=13, =3;本发明也可以根据实际情况合理调节加权系数
Figure 591283DEST_PATH_IMAGE035
的取值,比如令
Figure 239302DEST_PATH_IMAGE065
都能实现本发明,也可以根据实际情况调节
Figure 295245DEST_PATH_IMAGE042
值,比如令
Figure 395925DEST_PATH_IMAGE042
=2,也就是说如果遍历
Figure 562726DEST_PATH_IMAGE038
,如果不规范笔画数大于2则返回本实施例笔画不符合规范的结果。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (8)

1.一种书写汉字规范性评判的方法,其特征在于,包括:
A1:采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:                                                
Figure 2010105378757100001DEST_PATH_IMAGE001
Figure 79601DEST_PATH_IMAGE002
,…,
Figure 819893DEST_PATH_IMAGE004
Figure 2010105378757100001DEST_PATH_IMAGE005
,...,
Figure 940296DEST_PATH_IMAGE006
Figure 2010105378757100001DEST_PATH_IMAGE007
A2:将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;
A3:采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有N笔的笔画,第
Figure 500459DEST_PATH_IMAGE008
笔笔画的轨迹关键点用表示,
Figure 36614DEST_PATH_IMAGE010
为关键点数目;
A4:根据获取的关键点,获取所有笔画的特征向量,第
Figure 178882DEST_PATH_IMAGE008
笔笔画的轨迹关键点
Figure 115526DEST_PATH_IMAGE009
,总共有
Figure 726767DEST_PATH_IMAGE010
个关键点,取轨迹关键点和关键点
Figure 456826DEST_PATH_IMAGE012
的后一个关键点
Figure 2010105378757100001DEST_PATH_IMAGE013
,则有向线段
Figure 312655DEST_PATH_IMAGE014
的方向设定为关键点
Figure 368336DEST_PATH_IMAGE012
的方向,记作
Figure 2010105378757100001DEST_PATH_IMAGE015
,有向线段
Figure 840774DEST_PATH_IMAGE014
的长度记为关键点
Figure 312207DEST_PATH_IMAGE012
的长度,记作
Figure 163488DEST_PATH_IMAGE016
Figure 639338DEST_PATH_IMAGE015
Figure 349805DEST_PATH_IMAGE016
计算方法为:
Figure 2010105378757100001DEST_PATH_IMAGE017
对于第
Figure 297032DEST_PATH_IMAGE008
笔笔画有
Figure 143766DEST_PATH_IMAGE010
关键点,可以得到一个
Figure 72407DEST_PATH_IMAGE010
维特征向量,记作
Figure 130492DEST_PATH_IMAGE018
,每一维特征向量包含4个特征值:
Figure 2010105378757100001DEST_PATH_IMAGE019
,最后一个关键点
Figure 615831DEST_PATH_IMAGE020
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 51491DEST_PATH_IMAGE008
笔笔画的特征向量为
Figure 2010105378757100001DEST_PATH_IMAGE021
,该笔画包含
Figure 728198DEST_PATH_IMAGE022
个关键点;
A5:笔画特征匹配,对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 6733DEST_PATH_IMAGE008
笔笔画,通过上步求得其特征向量为
Figure DEST_PATH_IMAGE023
,对应模板汉字第
Figure 171129DEST_PATH_IMAGE008
笔笔画的特征向量为
Figure 371221DEST_PATH_IMAGE023
Figure 12418DEST_PATH_IMAGE024
动态规划匹配的误差矩阵为
Figure DEST_PATH_IMAGE025
,大小
Figure 370718DEST_PATH_IMAGE026
动态规划的状态转移函数为:
其中定义
Figure 843287DEST_PATH_IMAGE028
Figure 533901DEST_PATH_IMAGE023
中的第
Figure DEST_PATH_IMAGE029
维与中的
Figure 558805DEST_PATH_IMAGE030
维向量的误差:
Figure DEST_PATH_IMAGE031
Figure 682619DEST_PATH_IMAGE032
其中
Figure DEST_PATH_IMAGE033
是加权系数;
做标量量化,最终第
Figure 103465DEST_PATH_IMAGE008
笔笔画的匹配度为:
Figure DEST_PATH_IMAGE035
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 928202DEST_PATH_IMAGE036
Figure DEST_PATH_IMAGE037
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 890211DEST_PATH_IMAGE038
A6:根据步骤A5中所获得的书写汉字与标准汉字的所有笔画的匹配度
Figure 673359DEST_PATH_IMAGE036
和匹配度平均值
Figure 651810DEST_PATH_IMAGE038
,采用决策树的方法对书写汉字的规范性做综合评价。
2.根据权利要求1所述的一种书写汉字规范性评判的方法,其特征在于,步骤A6中决策树的方法具体是: 
A61:遍历
Figure 686762DEST_PATH_IMAGE036
,如果
Figure DEST_PATH_IMAGE039
大于指定阈值
Figure 893490DEST_PATH_IMAGE040
,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure DEST_PATH_IMAGE041
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 50802DEST_PATH_IMAGE042
大于指定阈值,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
3.根据权利要求2所述的一种书写汉字规范性评判的方法,其特征在于,A2步骤之前还进一步包括,步骤A11笔画数目判别:根据步骤A1采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字的笔画数进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
4.根据权利要求3所述的一种书写汉字规范性评判的方法,其特征在于,步骤A2中将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是:采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 578867DEST_PATH_IMAGE044
,纵坐标的取值范围
Figure DEST_PATH_IMAGE045
,设手写汉字的轨迹的宽度和高度分别为
Figure 994673DEST_PATH_IMAGE046
,则:
Figure 291794DEST_PATH_IMAGE048
设中心对齐线性归一化后的宽度和高度分别为
Figure DEST_PATH_IMAGE049
Figure 885586DEST_PATH_IMAGE050
,归一化后的坐标为
Figure 268989DEST_PATH_IMAGE052
其中
Figure DEST_PATH_IMAGE053
是缩放比例:
Figure DEST_PATH_IMAGE055
中心对齐偏移量:
Figure 125266DEST_PATH_IMAGE056
5.一种书写汉字规范性评判的装置,其特征在于,包括:
采集并记录书写汉字笔画轨迹装置,用于采集并记录书写汉字笔画轨迹,采集得到书写汉字轨迹记为:
Figure 670386DEST_PATH_IMAGE001
Figure 359993DEST_PATH_IMAGE002
,…,
Figure 274860DEST_PATH_IMAGE003
Figure 484255DEST_PATH_IMAGE004
Figure 91954DEST_PATH_IMAGE005
,...,
Figure 3278DEST_PATH_IMAGE006
Figure 361316DEST_PATH_IMAGE007
书写轨迹归一化装置,用于将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中;
书写轨迹关键点提取装置,采用道格拉斯-普克算法提取书写汉字的轨迹关键点,设书写汉字有
Figure 549852DEST_PATH_IMAGE037
笔的笔画,笔画
Figure 187507DEST_PATH_IMAGE008
的轨迹关键点用
Figure 727073DEST_PATH_IMAGE009
表示,
Figure 124687DEST_PATH_IMAGE010
为关键点数目;
笔画特征提取装置,用于提取书写轨迹关键点的特征向量和模板汉字关键点的特征向量,根据获取的关键点,获取所有笔画的特征向量,第
Figure 292363DEST_PATH_IMAGE008
笔笔画的轨迹关键点,总共有
Figure 377049DEST_PATH_IMAGE010
个关键点,取轨迹关键点
Figure 437408DEST_PATH_IMAGE011
和关键点
Figure 725170DEST_PATH_IMAGE012
的后一个关键点
Figure 720939DEST_PATH_IMAGE013
,则有向线段
Figure 969518DEST_PATH_IMAGE014
的方向设定为关键点的方向,记作
Figure 975837DEST_PATH_IMAGE015
,有向线段
Figure 646902DEST_PATH_IMAGE014
的长度记为关键点
Figure 241831DEST_PATH_IMAGE012
的长度,记作
Figure 909573DEST_PATH_IMAGE016
Figure 922660DEST_PATH_IMAGE015
Figure 119286DEST_PATH_IMAGE016
计算方法为:
Figure 467090DEST_PATH_IMAGE017
对于第
Figure 781266DEST_PATH_IMAGE008
笔笔画有
Figure 773493DEST_PATH_IMAGE010
关键点,可以得到一个维特征向量,记作
Figure 241700DEST_PATH_IMAGE018
,每一维特征向量包含4个特征值:
Figure 861032DEST_PATH_IMAGE019
,最后一个关键点
Figure 832399DEST_PATH_IMAGE020
对每一笔重复以上操作,得到书写汉字所有笔画的特征向量;
获取所述书写汉字对应的模板汉字的第
Figure 636407DEST_PATH_IMAGE008
笔笔画的特征向量为
Figure 208071DEST_PATH_IMAGE021
,该笔画包含
Figure 490148DEST_PATH_IMAGE022
个关键点;
笔画特征匹配装置,用于对书写汉字的每一笔笔画与模板汉字的对应笔画进行动态规划匹配;
对于书写汉字的第
Figure 581601DEST_PATH_IMAGE008
笔笔画,通过笔画特征提取装置求得的特征向量为
Figure 822089DEST_PATH_IMAGE023
,对应模板汉字的第
Figure 851356DEST_PATH_IMAGE008
笔笔画的特征向量为
Figure 327337DEST_PATH_IMAGE024
Figure 148662DEST_PATH_IMAGE023
动态规划匹配的误差矩阵为,大小
Figure 323663DEST_PATH_IMAGE026
动态规划的状态转移函数为:
Figure 140441DEST_PATH_IMAGE027
其中定义
Figure 722732DEST_PATH_IMAGE028
Figure 975859DEST_PATH_IMAGE023
中的第维与
Figure 325247DEST_PATH_IMAGE024
中的
Figure 203073DEST_PATH_IMAGE030
维向量的误差:
Figure 84441DEST_PATH_IMAGE031
Figure 191069DEST_PATH_IMAGE032
其中
Figure 841493DEST_PATH_IMAGE033
是加权系数;
Figure 624641DEST_PATH_IMAGE034
做标量量化,最终第
Figure 101628DEST_PATH_IMAGE008
笔笔画的匹配度为:
Figure 136580DEST_PATH_IMAGE035
对书写汉字的所有笔画都做动态规划匹配,可以得到所有笔画的匹配度
Figure 31724DEST_PATH_IMAGE036
Figure 595560DEST_PATH_IMAGE037
为书写笔画数目,
所有笔画的匹配度平均值记为:
Figure 326887DEST_PATH_IMAGE038
决策树综合评价装置,根据笔画特征匹配装置中所获得的书写汉字与标准汉字所有笔画的匹配度和匹配度平均值
Figure 384022DEST_PATH_IMAGE038
,采用决策树的方法对书写汉字的规范性做综合评价。
6.根据权利要求5所述的一种书写汉字规范性评判的装置,其特征在于,决策树综合评价装置中决策树的方法具体为: 
A61:遍历,如果
Figure 835918DEST_PATH_IMAGE039
大于指定阈值,则记为该笔不符合规范,统计所有不符合规范的笔画数目,如果大于阈值
Figure 82408DEST_PATH_IMAGE041
,则判断出该书写汉字不符合规范,否则进入A62;
A62: 如果
Figure 128993DEST_PATH_IMAGE042
大于指定阈值
Figure 818600DEST_PATH_IMAGE043
,判断出该书写汉字不符合规范,否则判断出该书写汉字符合规范。
7.根据权利要求6所述的一种书写汉字规范性评判的装置,其特征在于,还进一步包括笔画数目判别装置,根据采集并记录书写汉字笔画轨迹装置采集的书写汉字轨迹获得书写汉字的笔画数,获取该书写汉字对应的模板汉字的笔画数,将该书写汉字笔画数与模板汉字的笔画数进行对比,如果二者的笔画数目不相等,判断出该书写汉字不符合规范。
8.根据权利要求7所述的一种书写汉字规范性评判的装置,其特征在于,书写轨迹归一化装置中,将书写汉字轨迹映射到与模板汉字相同大小的尺度坐标系中具体方法是:采用中心对齐线性归一化方法,根据书写汉字轨迹点可以得到书写汉字的轨迹的横坐标取值范围
Figure 733466DEST_PATH_IMAGE044
,纵坐标的取值范围
Figure 441397DEST_PATH_IMAGE045
,设手写汉字的轨迹的宽度和高度分别为
Figure 49096DEST_PATH_IMAGE046
Figure 960420DEST_PATH_IMAGE047
,则:
Figure 554344DEST_PATH_IMAGE048
设中心对齐线性归一化后的宽度和高度分别为
Figure 336355DEST_PATH_IMAGE049
Figure 229137DEST_PATH_IMAGE050
,归一化后的坐标为
Figure 768702DEST_PATH_IMAGE051
Figure 228634DEST_PATH_IMAGE052
其中
Figure 537255DEST_PATH_IMAGE053
是缩放比例:
Figure 611390DEST_PATH_IMAGE054
Figure 107094DEST_PATH_IMAGE055
中心对齐偏移量:
Figure 806934DEST_PATH_IMAGE056
CN2010105378757A 2010-11-10 2010-11-10 一种书写汉字规范性评判的方法和装置 Active CN101976354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105378757A CN101976354B (zh) 2010-11-10 2010-11-10 一种书写汉字规范性评判的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105378757A CN101976354B (zh) 2010-11-10 2010-11-10 一种书写汉字规范性评判的方法和装置

Publications (2)

Publication Number Publication Date
CN101976354A CN101976354A (zh) 2011-02-16
CN101976354B true CN101976354B (zh) 2012-07-25

Family

ID=43576238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105378757A Active CN101976354B (zh) 2010-11-10 2010-11-10 一种书写汉字规范性评判的方法和装置

Country Status (1)

Country Link
CN (1) CN101976354B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768729A (zh) * 2011-06-17 2012-11-07 靳光瑾 一种汉字规范书写的评测方法和装置
CN102542264B (zh) * 2011-12-22 2013-11-27 北京语言大学 基于数字手写设备的汉字书写正误自动评测方法和装置
CN102609735B (zh) * 2012-02-06 2014-03-12 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN102663454B (zh) * 2012-04-18 2014-08-20 安徽科大讯飞信息科技股份有限公司 一种字符书写规范度评测的方法和装置
CN104008405A (zh) * 2013-02-26 2014-08-27 佳能株式会社 手写字符识别方法和装置
CN103390358B (zh) * 2013-07-03 2015-08-19 广东小天才科技有限公司 对电子设备的字符书写操作进行规范性判断的方法及装置
CN104714223B (zh) * 2013-12-12 2017-07-28 中国科学院声学研究所 一种合成孔径声纳数据中直航段数据的自动提取方法
CN104050453A (zh) * 2014-06-24 2014-09-17 南京师范大学 一种手写汉字笔势评价方法
CN104182732B (zh) * 2014-08-12 2017-09-26 南京师范大学 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法
CN105718965A (zh) * 2014-12-02 2016-06-29 北京汉仪科印信息技术有限公司 一种汉字书写字形识别方法及装置
CN104715256A (zh) * 2015-03-04 2015-06-17 南昌大学 一种基于图像方法的书法练习辅助系统及评价方法
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法
CN105117054B (zh) * 2015-08-12 2018-04-17 珠海优特物联科技有限公司 一种手写输入的识别方法及系统
CN105678348B (zh) * 2016-01-07 2019-01-11 陕西师范大学 一种手写汉字规范性评价方法及系统
CN106096524A (zh) * 2016-06-01 2016-11-09 广东小天才科技有限公司 一种汉字美观度的获取方法及装置
CN107507161B (zh) * 2016-06-14 2020-06-16 科大讯飞股份有限公司 一种书写整洁度的评价方法及系统
CN107480700B (zh) * 2017-07-18 2021-02-12 西安理工大学 一种基于Gabor和SVM纹理提取汉字的方法
CN107563456B (zh) * 2017-08-17 2019-12-13 福建天泉教育科技有限公司 语文手写改错方法、可读存储介质
CN110019632B (zh) * 2018-04-19 2021-06-08 中国测绘科学研究院 一种基于形状树的地理要素形状分析方法
CN108710871A (zh) * 2018-08-04 2018-10-26 安徽翰智文化科技有限公司 一种基于用户书法练习效果检测的书法练习系统
CN109214471A (zh) * 2018-10-10 2019-01-15 北京米蓝科技有限公司 评价练字字帖中的书写字的方法及系统
CN111063009B (zh) * 2019-12-18 2021-04-06 山东山科智能科技有限公司 一种汉字书写动画演示方法及装置
CN113496263B (zh) * 2020-03-18 2022-05-17 北京易真学思教育科技有限公司 字符识别方法、设备及字符识别芯片

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100570627C (zh) * 2008-02-29 2009-12-16 东莞市正欣科技有限公司 书写汉字结构规范性评价的方法和装置
CN100583135C (zh) * 2008-04-18 2010-01-20 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN101320422B (zh) * 2008-06-06 2010-06-02 广东开心信息技术有限公司 手写汉字笔画交接离的规范性判定方法和装置
CN101344918B (zh) * 2008-06-06 2010-06-16 广东开心信息技术有限公司 手写汉字笔画位置规范性的判断方法和装置
CN101393693B (zh) * 2008-09-12 2010-07-28 浙江大学 一种汉字书写计算机教学方法
CN101465074A (zh) * 2008-10-21 2009-06-24 华南理工大学 一种手写汉字布局评价方法
CN101630362B (zh) * 2009-08-25 2011-09-28 华南理工大学 一种基于置信度的汉字书写质量评价方法

Also Published As

Publication number Publication date
CN101976354A (zh) 2011-02-16

Similar Documents

Publication Publication Date Title
CN101976354B (zh) 一种书写汉字规范性评判的方法和装置
CN103065134B (zh) 一种具有提示信息的指纹识别装置和方法
Cong et al. Speedup 3-D texture-less object recognition against self-occlusion for intelligent manufacturing
CN108664975B (zh) 一种维吾尔文手写字母识别方法、系统及电子设备
US20070133877A1 (en) Script recognition for ink notes
CN110866499B (zh) 手写文本识别方法、系统、设备及介质
CN105787522A (zh) 基于手写笔迹的书写态度评价方法及系统
CN106097381A (zh) 一种基于流形判别非负矩阵分解的目标跟踪方法
Seidl et al. Automated classification of petroglyphs
CN108898623A (zh) 目标跟踪方法及设备
CN100371945C (zh) 一种计算机辅助书法作品真伪鉴别方法
CN107292295B (zh) 手势分割方法及装置
DE102009034939A1 (de) System und Verfahren zur Erkennung von Ein-Strich-Zeichen
CN101604393B (zh) 一种用于联机手写汉字识别的汉字笔画特征提取方法
CN103310217A (zh) 基于图像协方差特征的手写体数字识别方法及装置
CN113361666B (zh) 一种手写字符识别方法、系统及介质
CN105844299A (zh) 一种基于词袋模型的图像分类方法
CN106095811A (zh) 一种基于最优编码的监督离散哈希的图像检索方法
Yang et al. Handwriting posture prediction based on unsupervised model
CN115019396A (zh) 一种学习状态监测方法、装置、设备及介质
An et al. Automatic matching of character strokes for computer-aided Chinese handwriting education
CN110059180B (zh) 文章作者身份识别及评估模型训练方法、装置及存储介质
Zhou et al. Training convolutional neural network for sketch recognition on large-scale dataset.
CN115346225A (zh) 书写测评方法、装置及设备
Renau-Ferrer et al. A method for visuo-spatial classification of freehand shapes freely sketched

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 523000 DONGGUAN, GUANGDONG PROVINCE TO: 510663 GUANGZHOU, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20120130

Address after: 510663 Guangdong city of Guangzhou province Tianhe District No. 1023 room first first Pu Lu

Applicant after: Guangdong Ksense Information Technology Co., Ltd.

Address before: 523000, Dongguan City, Guangdong province city center district, the first international phase B, building 8, 809

Applicant before: Guangdong Ksense Information Technology Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: QI HENGNIAN

Free format text: FORMER OWNER: GUANGDONG KSENSE INFORMATION TECHNOLOGY CO., LTD.

Effective date: 20141216

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 510663 GUANGZHOU, GUANGDONG PROVINCE TO: 311300 HANGZHOU, ZHEJIANG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20141216

Address after: Hangzhou City, Zhejiang Province, Ling'an City, 311300 Ring Road, Lin Shui Shan Ju

Patentee after: Qi Hengnian

Address before: 510663 Guangdong city of Guangzhou province Tianhe District No. 1023 room first first Pu Lu

Patentee before: Guangdong Ksense Information Technology Co., Ltd.