发明内容
本发明提供一种有效的、客观的书写汉字规范性评判的方法和装置,其利用投影特征向量的距离之和与笔画交接的面积之和对书写汉字进行规范性评判,具有良好的评判效果。
一种书写汉字规范性评判的方法,包括以下步骤:
A获取书写汉字的笔画,设共有n笔笔画;采用道格拉斯-普克算法对每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;设第i笔笔画共有p个轨迹关键点,将第i笔笔画的第t个轨迹关键点表示为at,相邻的两个轨迹关键点构成一个笔画段,第i笔笔画共有p-1个笔画段,将第i笔笔画的第d个笔画段表示为vd,其中,i=1,2,...,n,t=1,2,...,p,d=1,2,...,p-1;
B获取投影特征向量的距离之和Dist_total,包括以下步骤:
获取书写汉字的第i笔笔画的投影特征向量(PjctXPi,PjctXNi,PjctYPi,PjctYNi):
xt表示at的X轴坐标,yt表示at的Y轴坐标,PjctXPi表示第i笔笔画在X轴正方向上的投影,PjctXNi表示第i笔笔画在X轴负方向上的投影,PjctYPi表示第i笔笔画在Y轴正方向上的投影,PjctYNi表示第i笔笔画在Y轴负方向上的投影;
获取模板汉字的第i笔笔画的投影特征向量(MPjctXPi,MPjctXNi,MPjctYPi,MPjctYNi);
采用欧氏距离计算书写汉字的第i笔笔画和模板汉字的第i笔笔画的投影特征向量的距离disti,则有:
||disti||2=(PjctXPi-MPjctXPi)2+(PjctXNi-MPjctXNi)2+(PjctYPi-MPjctYPi)2+(PjctYNi-MPjctYNi)2
计算书写汉字与模板汉字的所有笔画的投影特征向量的距离之和Dist_total,则有:
C获取笔画交接的面积之和Area_total,包括以下步骤:
将书写汉字的笔画和模板汉字的笔画映射到同一汉字平面域;
获取模板汉字的笔画的轨迹关键点,设模板汉字的第i笔笔画共有q个轨迹关键点,模板汉字的第i笔笔画的第s个轨迹关键点表示为bs,模板汉字的第i笔笔画的第c个笔画段表示为uc,其中,i=1,2,...,n,s=1,2,...,q,c=1,2,...,q-1;
连接书写汉字的第i笔笔画的第1个轨迹关键点a1和模板汉字的第i笔笔画的第1个轨迹关键点b1,形成接首笔画段;连接书写汉字的第i笔笔画的第p个轨迹关键点ap和模板汉字的第i笔笔画的第q个轨迹关键点bq,形成接尾笔画段;
获取书写汉字的第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc的交点数量m,则由笔画段vd、笔画段uc、接首笔画段和接尾笔画段构成m+1个简单闭合多边形;将第j个简单闭合多边形面积表示为sub_areaj,书写汉字与模板汉字的第i笔笔画的笔画交接的面积areai为m+1个简单闭合多边形面积之和:
j=1,2,...,m+1;
计算书写汉字与模板汉字的所有笔画的笔画交接的面积之和Area_total,则有:
D根据机器学习方法,利用投影特征向量的距离之和Dist_total与笔画交接的面积之和Area_total,对书写汉字进行规范性评判。
其中,在步骤A之后,进一步包括A1:
获取模板汉字的笔画数量;如果书写汉字的笔画数量与模板汉字的笔画数量不相等,判断出该书写汉字为不规范的书写汉字,则该方法结束。
其中,在步骤A1之后,进一步包括A2:
A21设i=1;
A22获取书写汉字的第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc的交点数量m,判断交点数量m是否不大于预置阈值,如果是,继续步骤A23,否则,判断出该书写汉字为不规范的书写汉字,则该方法结束;
A23判断书写汉字的第i笔笔画的两个不相邻的笔画段vd是否有交点,如果是,判断出该书写汉字为不规范的书写汉字,则该方法结束,否则,继续步骤A24;
A24判断步骤A22获取的交点数量m是否小于2个,如果是,继续步骤A25,否则,判断笔画段vd是否按笔画段uc的先后顺序与笔画段uc相交,如果是,继续步骤A25,否则,判断出该书写汉字为不规范的书写汉字,则该方法结束;
A25判断i是否等于n,如果是,步骤A2结束,否则,i=i+1,返回步骤A22。
其中,预置阈值为3、4或5。
其中,机器学习方法为贝叶斯分类器方法、支持向量机方法、直接阈值法或AdaBoost方法。
一种书写汉字规范性评判的装置,包括:
书写汉字轨迹识别装置,用于获取书写汉字的笔画,设共有n笔笔画;采用道格拉斯-普克算法对每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;设第i笔笔画共有p个轨迹关键点,将第i笔笔画的第t个轨迹关键点表示为at,相邻的两个轨迹关键点构成一个笔画段,第i笔笔画共有p-1个笔画段,将第i笔笔画的第d个笔画段表示为vd,其中,i=1,2,...,n,t=1,2,...,p,d=1,2,...,p-1;
笔画投影特征相似性获取装置,用于获取投影特征向量的距离之和Dist_total,所述笔画投影特征相似性获取装置获取投影特征向量的距离之和Dist_total的具体步骤包括:
获取书写汉字的第i笔笔画的投影特征向量(PjctXPi,PjctXNi,PjctYPi,PjctYNi):
xt表示at的X轴坐标,yt表示at的Y轴坐标,PjctXPi表示第i笔笔画在X轴正方向上的投影,PjctXNi表示第i笔笔画在X轴负方向上的投影,PjctYPi表示第i笔笔画在Y轴正方向上的投影,PjctYNi表示第i笔笔画在Y轴负方向上的投影;
获取模板汉字的第i笔笔画的投影特征向量(MPjctXPi,MPjctXNi,MPjctYPi,MPjctYNi);
采用欧氏距离计算书写汉字的第i笔笔画和模板汉字的第i笔笔画的投影特征向量的距离disti,则有:
||disti||2=(PjctXPi-MPjctXPi)2+(PjctXNi-MPjctXNi)2+(PjctYPi-MPjctYPi)2+(PjctYNi-MPjctYNi)2
计算书写汉字与模板汉字的所有笔画的投影特征向量的距离之和Dist_total,则有:
笔画交接面积获取装置,用于获取笔画交接的面积之和Area_total,所述笔画交接面积获取装置获取笔画交接的面积之和Area_total的具体步骤包括:
将书写汉字的笔画和模板汉字的笔画映射到同一汉字平面域;
获取模板汉字的笔画的轨迹关键点,设模板汉字的第i笔笔画共有q个轨迹关键点,模板汉字的第i笔笔画的第s个轨迹关键点表示为bs,模板汉字的第i笔笔画的第c个笔画段表示为uc,其中,i=1,2,...,n,s=1,2,...,q,c=1,2,...,q-1;
连接书写汉字的第i笔笔画的第1个轨迹关键点a1和模板汉字的第i笔笔画的第1个轨迹关键点b1,形成接首笔画段;连接书写汉字的第i笔笔画的第p个轨迹关键点ap和模板汉字的第i笔笔画的第q个轨迹关键点bq,形成接尾笔画段;
获取书写汉字的第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc的交点数量m,则由笔画段vd、笔画段uc、接首笔画段和接尾笔画段构成m+1个简单闭合多边形;将第j个简单闭合多边形面积表示为sub_areaj,书写汉字与模板汉字的第i笔笔画的笔画交接的面积areai为m+1个简单闭合多边形面积之和:
j=1,2,...,m+1;
计算书写汉字与模板汉字的所有笔画的笔画交接的面积之和Area_total,则有:
规范性评判装置,用于根据机器学习方法,利用投影特征向量的距离之和Dist_total与笔画交接的面积之和Area_total,对书写汉字进行规范性评判。
其中,进一步包括笔画数量比较装置,用于获取模板汉字的笔画数量,如果书写汉字的笔画数量与模板汉字的笔画数量不相等,判断出该书写汉字为不规范的书写汉字,则该书写汉字规范性评判装置的评判方法结束。
其中,进一步包括笔画规范性判断装置,用于判断每笔笔画的规范性,所述笔画规范性判断装置判断每笔笔画的规范性的具体步骤包括:
A21设i=1;
A22获取书写汉字的第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc的交点数量m,判断交点数量m是否不大于预置阈值,如果是,继续步骤A23,否则,判断出该书写汉字为不规范的书写汉字,则该书写汉字规范性评判装置的评判方法结束;
A23判断书写汉字的第i笔笔画的两个不相邻的笔画段vd是否有交点,如果是,判断出该书写汉字为不规范的书写汉字,则该书写汉字规范性评判装置的评判方法结束,否则,继续步骤A24;
A24判断步骤A22获取的交点数量m是否小于2个,如果是,继续步骤A25,否则,判断笔画段vd是否按笔画段uc的先后顺序与笔画段uc相交,如果是,继续步骤A25,否则,判断出该书写汉字为不规范的书写汉字,则该书写汉字规范性评判装置的评判方法结束;
A25判断i是否等于n,如果是,步骤A2结束,否则,i=i+1,返回步骤A22。
其中,预置阈值为3、4或5。
其中,机器学习方法为贝叶斯分类器方法、支持向量机方法、直接阈值法或AdaBoost方法。
有益效果:
本技术方案包括获取书写汉字的笔画,用道格拉斯-普克算法对每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;获取投影特征向量的距离之和Dist_total;获取笔画交接的面积之和Area_total;根据机器学习方法,利用投影特征向量的距离之和Dist_total与笔画交接的面积之和Area_total,对书写汉字进行规范性评判;本技术方案能够克服由于人工评判主观因素以及由于疲劳性带来的不利影响,可以有效、客观对书写汉字进行规范性评判,具有良好的评判效果。
具体实施方式
实施例一
参见图1图2,以下结合附图对本发明进行详细的描述。
一种书写汉字规范性评判的方法,包括以下步骤:
步骤101、获取书写汉字的笔画,设共有n笔笔画;采用道格拉斯-普克算法对每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;设第i笔笔画共有p个轨迹关键点,将第i笔笔画的第t个轨迹关键点表示为at,相邻的两个轨迹关键点构成一个笔画段,第i笔笔画共有p-1个笔画段,将第i笔笔画的第d个笔画段表示为vd,其中,i=1,2,...,n,t=1,2,...,p,d=1,2,...,p-1。
笔画的轨迹关键点的编号先后顺序为该笔画的书写先后顺序,笔画的笔画段的编号先后顺序为该笔画的书写先后顺序。
可以通过电子写字板、手写笔或触摸屏等装置获取书写汉字的笔画。这些装置可以识别书写汉字,记录其笔画的坐标位置信息、笔画数信息、单笔笔画结束符的标志信息、书写汉字所有笔画轨迹结束的标志信息等。
步骤102、获取投影特征向量的距离之和Dist_total,包括以下步骤:
获取书写汉字的第i笔笔画的投影特征向量(PjctXPi,PjctXNi,PjctYPi,PjctYNi):
xt表示at的X轴坐标,yt表示at的Y轴坐标,PjctXPi表示第i笔笔画在X轴正方向上的投影,PjctXNi表示第i笔笔画在X轴负方向上的投影,PjctYPi表示第i笔笔画在Y轴正方向上的投影,PjctYNi表示第i笔笔画在Y轴负方向上的投影。
先将PjctXPi、PjctXNi、PjctYPi、PjctYNi的初值全部赋为0;比较(xt,yt)和(xt+1,yt+1)的大小,若xt+1>xt,将xt+1-xt的值累加到PjctXPi上,反之,则将xt-xt+1的值累加到PjctXNi上,比较yt和yt+1的大小,若yt+1>yt,将yt+1-yt的值累加到PjctYPi上,反之,则将yt-yt+1的值累加到PjctYNi上。
获取与书写汉字对应的模板汉字的第i笔笔画的投影特征向量(MPjctXPi,MPjctXNi,MPjctYPi,MPjctYNi)。本实施例中,所述模板汉字均为所述书写汉字对应的汉字,即模板汉字与书写汉字为相同汉字。
模板汉字的笔画、轨迹关键点和投影特征向量可以预先计算出来并保存,在实施本方案时,可以直接读取与书写汉字对应的模板汉字的笔画、轨迹关键点、投影特征向量的数据;当然,也可以预先保存模板汉字的笔画,在实施本方案时,按上述原理计算出模板汉字的轨迹关键点、投影特征向量。
采用欧氏距离计算书写汉字的第i笔笔画和模板汉字的第i笔笔画的投影特征向量的距离disti,则有:
||disti||2=(PjctXPi-MPjctXPi)2+(PjctXNi-MPjctXNi)2+(PjctYPi-MPjctYPi)2+(PjctYNi-MPjctYNi)2
计算书写汉字与模板汉字的所有笔画的投影特征向量的距离之和Dist_total,则有:
通过计算Dist_total的大小,可以知道书写汉字沿X、Y轴正负方向上的投影特征向量与模板汉字沿X、Y轴正负方向上的投影特征向量之间的距离,从而判断二者之间的相似程度,Dist_total越小,说明书写笔画与模板笔画越相似,亦即书写汉字越有可能符合规范,其规范等级就越高;反之,Dist_total越大,说明笔画书写与模板笔画越不相似,相对应的,书写汉字的规范等级就越低。
步骤103、获取笔画交接的面积之和Area_total,包括以下步骤:
将书写汉字的笔画和模板汉字的笔画映射到同一汉字平面域。
获取模板汉字的笔画的轨迹关键点,设模板汉字的第i笔笔画共有q个轨迹关键点,模板汉字的第i笔笔画的第s个轨迹关键点表示为bs,模板汉字的第i笔笔画的第c个笔画段表示为uc,其中,i=1,2,...,n,s=1,2,...,q,c=1,2,...,q-1。
连接书写汉字的第i笔笔画的第1个轨迹关键点a1和模板汉字的第i笔笔画的第1个轨迹关键点b1,形成接首笔画段;连接书写汉字的第i笔笔画的第p个轨迹关键点ap和模板汉字的第i笔笔画的第q个轨迹关键点bq,形成接尾笔画段。
获取书写汉字的第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc的交点数量m,则由笔画段vd、笔画段uc、接首笔画段和接尾笔画段构成m+1个简单闭合多边形;将第j个简单闭合多边形面积表示为sub_areaj,书写汉字与模板汉字的第i笔笔画的笔画交接的面积areai为m+1个简单闭合多边形面积之和:
j=1,2,...,m+1。
如果第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc没有交点,则由笔画段vd、笔画段uc、接首笔画段和接尾笔画段构成一个简单闭合多边形。
图2为书写汉字笔画和其对应的模板汉字笔画映射到同一汉字平面域中的示意图。图2所示仅为汉字的一个“竖弯勾”笔画。其中带*号的实线表示书写汉字笔画,带正方形符号的实线表示模板汉字笔画。这里*号表示书写汉字笔画的轨迹关键点,正方形符号表示模板汉字笔画的轨迹关键点,两个小圆圈符号表示书写汉字笔画的笔画段与模板汉字笔画的笔画段的交点。图2中左边的虚线为书写汉字笔画的第1个轨迹关键点和模板汉字笔画的第1个轨迹关键点的连线,表示接首笔画段。图2中右边的虚线为书写汉字笔画的最后1个轨迹关键点和模板汉字笔画的最后1个轨迹关键点的连线,表示接首笔画段。在该“竖弯勾”笔画中,书写汉字笔画的笔画段与模板汉字笔画的笔画段具有两个交点,则由书写汉字笔画的笔画段、模板汉字笔画的笔画段、接首笔画段和接尾笔画段构成3个简单闭合多边形。该“竖弯勾”笔画的笔画交接的面积为3个简单闭合多边形面积之和。
计算书写汉字与模板汉字的所有笔画的笔画交接的面积之和Area_total,则有:
这样,通过计算Area_total的大小,就可以判断书写汉字与模板汉字的相似程度;Area_total越小,说明书写汉字与模板汉字的越相似,书写汉字就越有可能符合规范,评判等级越高;反之,Area_total越大,说明书写汉字与模板汉字越不相似,书写汉字的规范等级就越低。
步骤104、根据机器学习方法,利用投影特征向量的距离之和Dist_total与笔画交接的面积之和Area_total,对书写汉字进行规范性评判。
本实施例中,机器学习方法为贝叶斯分类器方法、支持向量机方法、直接阈值法或AdaBoost方法,但本发明不限于这几种方法。这些机器学习方法为现有技术,且应用广泛,这里不再赘述其原理。本领域普通技术人员只要采用上述方法获得投影特征向量的距离之和Dist_total和笔画交接的面积之和Area_total,就可以使用现有的机器学习方法,对书写汉字进行规范性评判。
本实施例中,应用机器学习方法,可以对投影特征向量的距离之和Dist_total与笔画交接的面积之和Area_total归一化后,各采用50%的权重,给出的评判结果,可以分为“不合格”、“合格”、“中等”、“良好”、“优秀”,它们分别代表书写汉字中的五种规范等级,这些评判规范等级可以通过显示设备显示出来。当然,上述权重和划分等级的数量,可以根据实际测试要求做出调整,这是本领域普通技术人员不需要创造性劳动就可以想到的。比如,还可以将评判结果分为A+、A、A-、B+、B、B-、C+、C、C-、D这十种规范等级。
需要指出的是,本实施例中先执行步骤102,然后执行步骤103;当然,也可以先执行步骤103,然后执行步骤102,或步骤102和执行步骤103并行执行,只要在步骤104之前获得投影特征向量的距离之和Dist_total与笔画交接的面积之和Area_total即可实现本发明。
本技术方案能够克服由于人工评判主观因素以及由于疲劳性带来的不利影响,可以有效、客观对书写汉字进行规范性评判,具有良好的评判效果。
实施例二
参见图3图4,本实施例与实施例一的不同之处在于,在步骤101之后,进一步包括步骤101A和步骤101B。
步骤101A、获取模板汉字的笔画数量;如果书写汉字的笔画数量与模板汉字的笔画数量不相等,判断出该书写汉字为不规范的书写汉字,则该方法结束。
步骤101B、该步骤用于判断判断书写汉字的每笔笔画的规范性,包括以下步骤:
步骤A21、设i=1。
步骤A22、获取书写汉字的第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc的交点数量m,判断交点数量m是否不大于预置阈值,如果是,继续步骤A23,否则,判断出该书写汉字为不规范的书写汉字,则该方法结束。本实施例中,预置阈值为3、4或5;当然,预置阈值还可以为其它数量。该步骤定义为数目准则判断步骤。
作为一种特殊情况,当书写汉字的笔画段与模板汉字的笔画段重合时,不属于严格相交的范畴,这样的情况将被看成是没有交点。
步骤A23、判断书写汉字的第i笔笔画的两个不相邻的笔画段vd是否有交点,如果是,判断出该书写汉字为不规范的书写汉字,则该方法结束,否则,继续步骤A24。该步骤定义为开放准则判断步骤。
步骤A24、判断步骤A22获取的交点数量m是否小于2个,如果是,继续步骤A25,否则,判断笔画段vd是否按笔画段uc的先后顺序与笔画段uc相交,如果是,继续步骤A25,否则,判断出该书写汉字为不规范的书写汉字,则该方法结束。该步骤定义为笔画顺序准则判断步骤。
笔画段的编号先后顺序为该笔画的书写先后顺序。如果书写汉字的第i笔笔画中的某一笔画段先与模板汉字的第i笔笔画中的后一笔画段ug相交,g=1,2,...,q-1,再与模板汉字的第i笔笔画中的前一笔画段uf相交,f=1,2,...,q-1,其中g>f,则该书写汉字的不满足笔画顺序准则,判断出该书写汉字为不规范的书写汉字,则该方法结束。
步骤A25、判断i是否等于n,如果是,步骤A2结束,否则,i=i+1,返回步骤A22。
通过步骤A22至步骤A25的循环,可以依次对书写汉字的n笔笔画进行判断。
在本实施例中,通过步骤101A和步骤101B直接判断书写汉字是否规范;如果书写汉字不规范,则最终的评判直接显示为该书写汉字为不规范的书写汉字,而不再显示评判规范等级。
需要指出的是,本实施例中先执行步骤101A,然后执行步骤101B;当然,也可以先执行步骤101B,然后执行步骤101A,或步骤101A和执行步骤101B并行执行。如图2所示,如果步骤101A和步骤101B没有判断出该书写汉字为不规范的书写汉字时,在步骤101B之后,继续执行步骤102;如果步骤101A和步骤101B直接判断出该书写汉字为不规范的书写汉字时,继续执行步骤102的意义不大。
实施例三
参见图5,一种书写汉字规范性评判的装置,包括:
书写汉字轨迹识别装置201,用于获取书写汉字的笔画,设共有n笔笔画;采用道格拉斯-普克算法对每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;设第i笔笔画共有p个轨迹关键点,将第i笔笔画的第t个轨迹关键点表示为at,相邻的两个轨迹关键点构成一个笔画段,第i笔笔画共有p-1个笔画段,将第i笔笔画的第d个笔画段表示为vd,其中,i=1,2,...,n,t=1,2,...,p,d=1,2,...,p-1。书写汉字轨迹识别装置201可以为电子写字板、手写笔、触摸屏等。
笔画投影特征相似性获取装置204,用于获取投影特征向量的距离之和Dist_total,所述笔画投影特征相似性获取装置204获取投影特征向量的距离之和Dist_total的具体步骤包括:
获取书写汉字的第i笔笔画的投影特征向量(PjctXPi,PjctXNi,PjctYPi,PjctYNi):
xt表示at的X轴坐标,yt表示at的Y轴坐标,PjctXPi表示第i笔笔画在X轴正方向上的投影,PjctXNi表示第i笔笔画在X轴负方向上的投影,PjctYPi表示第i笔笔画在Y轴正方向上的投影,PjctYNi表示第i笔笔画在Y轴负方向上的投影;
获取模板汉字的第i笔笔画的投影特征向量(MPjctXPi,MPjctXNi,MPjctYPi,MPjctYNi);
采用欧氏距离计算书写汉字的第i笔笔画和模板汉字的第i笔笔画的投影特征向量的距离disti,则有:
||disti||2=(PjctXPi-MPjctXPi)2+(PjctXNi-MPjctXNi)2+(PjctYPi-MPjctYPi)2+(PjctYNi-MPjctYNi)2
计算书写汉字与模板汉字的所有笔画的投影特征向量的距离之和Dist_total,则有:
笔画交接面积获取装置205,用于获取笔画交接的面积之和Area_total,所述笔画交接面积获取装置获取笔画交接的面积之和Area_total的具体步骤包括:
将书写汉字的笔画和模板汉字的笔画映射到同一汉字平面域;
获取模板汉字的笔画的轨迹关键点,设模板汉字的第i笔笔画共有q个轨迹关键点,模板汉字的第i笔笔画的第s个轨迹关键点表示为bs,模板汉字的第i笔笔画的第c个笔画段表示为uc,其中,i=1,2,...,n,s=1,2,...,q,c=1,2,...,q-1;
连接书写汉字的第i笔笔画的第1个轨迹关键点a1和模板汉字的第i笔笔画的第1个轨迹关键点b1,形成接首笔画段;连接书写汉字的第i笔笔画的第p个轨迹关键点ap和模板汉字的第i笔笔画的第q个轨迹关键点bq,形成接尾笔画段;
获取书写汉字的第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc的交点数量m,则由笔画段vd、笔画段uc、接首笔画段和接尾笔画段构成m+1个简单闭合多边形;将第j个简单闭合多边形面积表示为sub_areaj,书写汉字与模板汉字的第i笔笔画的笔画交接的面积areai为m+1个简单闭合多边形面积之和:
j=1,2,...,m+1;
计算书写汉字与模板汉字的所有笔画的笔画交接的面积之和Area_total,则有:
规范性评判装置206,用于根据机器学习方法,利用投影特征向量的距离之和Dist_total与笔画交接的面积之和Area_total,对书写汉字进行规范性评判。本实施例中,机器学习方法为贝叶斯分类器方法、支持向量机方法、直接阈值法或AdaBoost方法,但本发明不限于这几种方法。
作为一个优选实施例,进一步包括笔画数量比较装置202,用于获取模板汉字的笔画数量,如果书写汉字的笔画数量与模板汉字的笔画数量不相等,判断出该书写汉字为不规范的书写汉字,则该书写汉字规范性评判装置的评判方法结束。
作为另一个优选实施例,进一步包括笔画规范性判断装置203,用于判断每笔笔画的规范性,所述笔画规范性判断装置203判断每笔笔画的规范性的具体步骤包括:
A21设i=1;
A22获取书写汉字的第i笔笔画的笔画段vd与模板汉字的第i笔笔画的笔画段uc的交点数量m,判断交点数量m是否不大于预置阈值,如果是,继续步骤A23,否则,判断出该书写汉字为不规范的书写汉字,则该书写汉字规范性评判装置的评判方法结束;本实施例中,预置阈值为3、4或5;
A23判断书写汉字的第i笔笔画的两个不相邻的笔画段vd是否有交点,如果是,判断出该书写汉字为不规范的书写汉字,则该书写汉字规范性评判装置的评判方法结束,否则,继续步骤A24;
A24判断步骤A22获取的交点数量m是否小于2个,如果是,继续步骤A25,否则,判断笔画段vd是否按笔画段uc的先后顺序与笔画段uc相交,如果是,继续步骤A25,否则,判断出该书写汉字为不规范的书写汉字,则该书写汉字规范性评判装置的评判方法结束;
A25判断i是否等于n,如果是,步骤A2结束,否则,i=i+1,返回步骤A22。
以上内容仅为本发明的较佳实施例,对于本领域的普通技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明的限制。