CN103810506B - 一种手写汉字笔画识别方法 - Google Patents

一种手写汉字笔画识别方法 Download PDF

Info

Publication number
CN103810506B
CN103810506B CN201410003668.1A CN201410003668A CN103810506B CN 103810506 B CN103810506 B CN 103810506B CN 201410003668 A CN201410003668 A CN 201410003668A CN 103810506 B CN103810506 B CN 103810506B
Authority
CN
China
Prior art keywords
stroke
chinese character
standard
type
uniqueness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410003668.1A
Other languages
English (en)
Other versions
CN103810506A (zh
Inventor
白晓东
姜杰
黄峰
仇宏斌
李艺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing wenmu Education Technology Co.,Ltd.
Original Assignee
Nanjing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Normal University filed Critical Nanjing Normal University
Priority to CN201410003668.1A priority Critical patent/CN103810506B/zh
Publication of CN103810506A publication Critical patent/CN103810506A/zh
Application granted granted Critical
Publication of CN103810506B publication Critical patent/CN103810506B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开一种手写汉字笔画的识别方法。具体步骤为:建立标准汉字笔画、位置关系、相交关系的特征集;记录手写汉字笔画书写特征,建立手写汉字特征集;分离笔画类型唯一性笔画,与标准汉字进行匹配;建立手写汉字外包矩形,并将矩形等分为若干个子格,确定每个笔画所处的子格,根据绝对位置关系与标准汉字进行匹配;抽取手写汉字中与已确定对应关系笔画具有相交特征的笔画,根据相交关系与标准汉字进行匹配;计算同类笔画的相对位置关系,根据相对位置相似性与标准汉字进行匹配;对剩余笔画进行综合相似性判断,最终完成所有笔画对应关系的建立。本发明的方法,实现了用户手写汉字与标准汉字笔画一一对应关系的建立,具有重要的应用价值。

Description

一种手写汉字笔画识别方法
技术领域
本发明涉及利用计算机对汉字书写进行评价的技术领域,尤其涉及一种手写汉字笔画识别方法。
背景技术
文字是记录、传递语言信息的社会性符号系统,汉字作为中华民族的一种文字更是承载着我们民族的历史、文化与气质,它是五千年中华文明最直接的传承者。而伴随着电脑的普及,人们对电脑打字越来越依赖,手写汉字的机会则越来越少。手写汉字的关注程度和练习强度被大大弱化,如何提升国人汉字书写能力的已成为一个亟待解决的问题。
目前手写汉字书写自动评价方法主要有以下几种:
1、通过记录书写笔迹、笔画数、判断笔画相交关系来进行评价,如中国发明专利“手写汉字笔画相交离的规范性判定方法和装置”(公开号:CN101320422A)公开了一种通过判断手写汉字笔画相交离关系判断手写汉字书写是否规范的方法;
2、通过对人工给定的汉字样本进行机器学习,然后使用图像处理与人工智能的方法对手写汉字进行相似度模糊判断,如中国发明专利“一种汉字书写美观度的计算机评估方法”(公开号:CN101295371A);
3、通过判断手写汉字的横向、纵向比例关系、结构特征以及手写汉字各点在书写空间内的分布关系进行评价,如中国发明专利书写汉字结构规范性评价的方法和装置(公开号“CN101251891A”)。
上述方法虽然能在某些方面对于手写汉字书写质量进行评价,但这些方法都没有实现笔画关系的一一对应,因而无法对每一笔画的正确性进行判断,无法实现笔顺正确性判断、结构合理性判断以及整体书写质量评价。
发明内容
本发明提供一种手写汉字笔画的识别方法,该方法是通过笔画类型判断、位置关系判断、相交关系判断、综合相似性判断等步骤建立手写汉字各笔画与给定的标准汉字各笔画的对应关系,实现对于手写汉字笔画的识别。
本发明采用的技术方案如下:
一种手写汉字笔画识别方法,具体包括如下步骤:
(1)建立作为标准的每个汉字笔画类型、绝对位置和相交关系的特征集;
(2)记录手写汉字笔画书写特征,建立手写汉字特征集;
(3)将标准汉字特征集与手写汉字特征集进行比对处理,建立标准汉字笔画与手写汉字笔画的一一对应关系;比对处理包含:笔画类型唯一性判断、绝对位置唯一性判断、相交特征唯一性判断和相对位置相似性判断;
A、笔画类型唯一性判断为分离手写汉字中的唯一性笔画,与标准汉字笔画特征进行匹配;
B、绝对位置唯一性判断为建立手写汉字外包矩形,并将矩形等分为若干子格,确定每个笔画所处的子格,与标准汉字绝对位置特征进行匹配;
C、相交特征唯一性判断为抽取手写汉字中与已确定对应关系笔画具有相交特征的笔画,根据相交关系与标准汉字相交关系特征进行匹配;
D、相对位置相似性判断为将未完成匹配的笔画按笔画类型进行聚类,若某种笔画类型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致,则计算该类型笔画中各笔画与外包矩形顶点的相对位置,根据相对位置关系与标准汉字进行匹配;
(4)对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断,实现手写汉字中所有笔画与标准汉字对应关系的建立。
所述步骤(1)中,建立标准汉字特征集的方法如下:1)根据汉字笔画规范,将作为标准汉字径迹切分为由若干笔画组成的集合,按笔画类型进行聚类,建立标准汉字笔画特征集;2)遍历上述标准汉字径迹点集,获取其中X坐标最小值xmin及最大值xmax,Y坐标最小值ymin及最大值ymax,,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点构建矩形,该矩形即为此标准汉字的外包矩形,将外包矩形等分为若干子格,确定各笔画在所处的子格,建立绝对位置关系标准特征集;3)遍历标准汉字笔画特征集,判断单个笔画内部是否存在折点,如存在,则将此笔画从折点断开,拆分为若干个走向独立的笔段,如不存在折点,则将此笔画做为一个笔段处理,根据不同笔画间笔段的相交关系判断笔画是否相交,建立标准汉字相交关系特征集。
所述步骤(2)的具体步骤如下:根据用户在平台上手写某个汉字的笔迹移动情况,获取该手写汉字点集,将用户书写过程中从下笔到起笔所形成的点集定义为一个笔画;遍历笔画中的所有点,对原始点集进行降噪处理,并对笔画进行冗余化归类,将相近笔画同归为某一类进行处理。
所述步骤(3)中比对处理的具体方法包含:1)笔画类型唯一性判断:遍历用户手写汉字笔画类型特征集,统计组成该汉字的所有笔画中各类型笔画的数量,获取其中在某种笔画类型中数量等于1的笔画,与标准汉字笔画类型特征集进行比对,确定该类唯一性笔画的对应关系;2)绝对位置唯一性判断:遍历用户手写汉字的特征点集合,获取其中X坐标最小值xmin及最大值xmax,Y坐标最小值ymin及最大值ymax,,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点构建矩形,该矩形即为此标准汉字的外包矩形,,将外包矩形等分为与标准汉字拆分方法一致的若干子格,判断用户手写汉字每个笔画所处的子格,若某笔画在其所属的笔画类型中与子格的位置关系存在唯一性,即某个子格内只存在一个未实现与标准汉字笔画对应关系匹配的某种类型笔画,则分离该笔画与标准汉字笔画绝对位置特征集进行比对,确定该笔画的对应关系;3)相交特征唯一性判断:遍历用户手写汉字笔画特征集,判断各个笔画间是否存在相交关系。提取用户手写汉字中已经完成与标准汉字对应的笔画或笔段,通过判断其相交情况确定未知笔画与标准汉字笔画的对应关系;4)相对位置相似性判断:抽取用户手写汉字中未完成匹配的笔画,并按笔画类型进行聚类,判断手写汉字与标准汉字相同笔画类型集中包含的未完成匹配笔画数量是否一致,若数量一致,则分别计算该类型笔画中用户手写汉字及标准汉字各笔画与外包矩形各顶点的相对位置,根据相对位置相似性建立用户手写汉字笔画与标准汉字笔画的对应关系。
所述步骤(4)中综合相似性判断方法如下:对于通过步骤(1)-(3)仍未完成对应关系建立的用户手写汉字笔画,分别计算其与标准汉字中未完成对应关系建立笔画的笔画类型相似度、绝对位置关系相似度、相对位置关系相似度,并将三种相似度进行综合处理,根据综合相似性建立用户手写汉字笔画与标准汉字笔画的对应关系。
本发明与现有技术相比的有益效果:
(1)本方法通过计算机自动建立手写汉字笔画与标准汉字笔画的对应关系,完成手写汉字笔画的识别,在书写单字完成以后即可完成识别,具有客观、高效、时效性强的优点。
(2)本方法实现了手写汉字与标准汉字笔画一一对应关系的建立,使得解决无监督情况下手写汉字练习过程中笔顺正确性判断、结构合理性判断以及整体书写质量的评价成为可能,具有重要的应用价值。
附图说明
图1是本发明的流程图;
图2是本发明所描述外包矩形等分为四个子格示意图;
图3是通过笔画唯一性确定笔画对应关系的示意图;
图4是通过笔画唯一性、绝对位置关系确定笔画对应关系的示意图;
图5是通过笔画唯一性、绝对位置关系、相交特征确定笔画对应关系的示意图;
图6是通过笔画唯一性、绝对位置关系、相对位置相似性确定笔画对应关系的示意图。
具体实施方式
下面结合附图,对本发明做详细说明。
如图1,一种手写汉字笔画的识别方法,其具体实施步骤如下:
1、建立汉字笔画、位置、相交关系的标准特征集;
(1)根据汉字笔画规范,将标准汉字径迹人工切分为由若干笔画组成的集合,按笔画类型进行聚类,建立笔画标准特征集;
(2)遍历构成标准汉字的特征点集合,获取其中X坐标最小值及最大值xmin、xmax,Y坐标最小值及最大值ymin、ymax,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点构建矩形,该矩形即为此标准汉字的外包矩形,将外包矩形等分为若干子格,确定各笔画在所处的子格,建立绝对位置关系标准特征集,如图2所示,本实施例采用的是将外包矩形等分为四格;
(3)遍历标准汉字笔画特征集,判断单个笔画内部是否存在折点,如存在,则将此笔画从折点断开,拆分为若干个走向独立的笔段,如不存在折点,则将此笔画做为一个笔段处理。判断不同笔画的笔段间是否存在相交的特征,取不同笔画间两个笔段端点的坐标p1(x1,y1),p2(x2,y2),p3(x3,y3),p4(x4,y4),根据笔段1的起点p1,终点p2,计算获得该笔段的直线方程F1,根据笔段2的起点p3,终点p4,计算获得该笔段的直线方程F2,计算两个方程是否存在共同解,若无,则这两个笔段不相交,若有共同解,判断此解是否同时落在笔段1与笔段2上,若同时落在两个笔段上,则这两个笔段相交,否则不相交。若存在相交的笔段,则认为这两个笔画具有相交特征,根据判断结果建立相交关系标准特征集。
将标准汉字笔画径迹点集合、绝对位置关系特征、相交关系特征以XML的方式存储。
2、记录用户笔画书写特征,建立用户手写汉字特征集。
根据用户在平台上手写某个汉字的笔迹移动情况,获取该手写汉字点集,并将点集表示为P={Pk(xk,yk),k=1..n},n为用户书写某个汉字所获得的特征点数量,将用户书写过程中下笔到起笔所形成的点集定义为一个笔画,笔画集表示为O={Oi(p1,p2..pj),i=1..m},其中m为该手写汉字笔画的数量,j表示某一笔画中包含的点集数量。遍历笔画中的所有点,对原始点集进行降噪处理,降噪处理的实现方式为:计算相邻点之间的距离L
L i = ( x i - x i + 1 ) 2 + ( y i - y i + 1 ) 2 - - - ( a )
求L的最大值Lmax,若相邻两点pi,pi+1的距离Li<0.2*Lmax,则去掉点pi+1,同时使Li+1=Li+Li+1o,遍历手写汉字的所有笔画,形成新的笔画集S={Si(p1,p2..pk),i=1..m},其中m为该手写汉字笔画的数量,k表示某一笔画中包含的点集数量。
对笔画进行冗余化归类,用户在书写过程中,由于设备、习惯等原因,可能书写笔画并不能严格对应汉字笔画规范,因此本步操作对笔画进行冗余化归类,将相近笔画同归为某一类进行处理。
3、将标准汉字特征集与用户手写汉字特征集进行比对处理,建立标准汉字笔画与手写汉字各笔画的一一对应关系。
(1)笔画类型唯一性判断:分离用户手写汉字中的唯一性笔画,与标准汉字笔画特征进行匹配;
遍历手写汉字笔画集S,统计组成该汉字的所有笔画中各类型笔画的数量,获取其中在某种笔画类型中数量等于1的笔画,与标准汉字笔画集进行比对,确定该类唯一性笔画的对应关系。
以“大”为例,该字由三个笔画组成,其笔画类型分别为“横”,“撇”,“捺”,且在该汉字中每个笔画类型只包含一个笔画,因此通过分离唯一性笔画与标准汉字笔画集比对,即可确定该汉字每个笔画的对应关系,完成匹配。
再以“王”为例,该字由四个笔画组成,其笔画类型分别为“横”,“竖”,其中有三个笔画为“横”,一个笔画为“竖”,通过分离唯一性笔画与标准汉字笔画集比对,可确定“竖”的对应关系,“横”因为笔画数量不唯一此处无法实现对应,留待后续进一步处理,如图3所示。
(2)绝对位置唯一性判断:建立用户手写汉字外包矩形,并将矩形等分为与标准汉字相同的子格,确定每个笔画所处的子格,与标准汉字绝对位置特征进行匹配;
遍历用户手写汉字点集P={Pk(xk,yk),k=1..n},获取其中X坐标最小值及最大值xmin、xmax,Y坐标最小值及最大值ymin、ymax,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点构建矩形,该矩形即为此标准汉字的外包矩形,并将矩形等分为与标准汉字相同的子格,本实施例将外包矩形等分为四个子格,判断每个笔画所处的子格,方法如下:
A、获取该笔画包含的点集P={Pk(xk,yk),k=1..n},n为该笔画包含的点集数;
B、去除k≤0.15*n或者k≥0.85*n的点,获得新的点集P′={Pk′(xk,yk),k=1..m},m为去除首尾点集后该笔画包含的点集数;
C、遍历P′,确定每个点所处的子格;
D、计算每个子格中包含该笔画点的数量N={N1,N2,N3,...,Ni},若Ni<0.2*m,m为去除首尾点集后该笔画包含的点集数,则认为该笔画不处于格子i中;
E、对于所有未实现与标准汉字笔画建立对应关系的笔画重复A-D的操作,获取每个笔画所处的子格。
遍历所有未实现匹配的笔画,若某笔画在其所属的笔画类型中与所处子格存在唯一性,即某个子格内只存在一个未实现匹配的某种类型笔画,则分离该笔画与标准汉字笔画绝对位置特征集进行比对,确定该笔画的对应关系。
以“你”为例,“竖”、“横折钩”、“竖弯钩”、“捺”可以通过笔画类型唯一性判断实现对应,左下角的“撇”虽然笔画类型不唯一,但因为在其所处的子格内只有一个撇,所以可以通过绝对位置关系唯一性实现对应,左上角的两“撇”在同一子格内笔画类型不唯一,因为无法实现通过笔画类型唯一性以及绝对位置关系特征实现对应,如图4。
(3)相交特征唯一性判断:抽取用户手写汉字中与已确定对应关系笔画具有相交特征的笔画,根据相交关系与标准汉字相交关系特征进行匹配;
A、遍历手写汉字点集S,判断单个笔画内部是否存在折点,如存在,则将此笔画从折点断开,将一个笔画拆分为若干个具有独立走向的笔段,如不存在折点,则将此笔画做为一个笔段处理;
B、判断不同笔画的笔段间是否存在相交的特征,取不同笔画间两个笔段端点的坐标p1(x1,y1),p2(x2,y2),p3(x3,y3),p4(x4,y4),根据笔段1的起点p1,终点p2,计算获得该笔段的直线方程F1,根据笔段2的起点p3,终点p4,计算获得该笔段的直线方程F2,计算两个方程是否存在共同解,若无,则这两个笔段不相交,若有共同解,判断此解是否同时落在笔段1与笔段2上,若同时落在两个笔段上,则这两个笔段相交,否则不相交。若不同笔画存在相交的笔段,则认为这两个不同笔画具有相交特征;
C、提取用户手写汉字中已经完成与标准汉字对应的笔画Si,判断是否有仍未确定对应关系的笔画Sk与其相交,若满足相交且Sk在所有与Si相交的笔画中,其笔画类型具有唯一性,则分离该笔画与标准汉字笔画集进行比对,确定其对应关系。若Sk与Si满足相交,但不满足所有与Si相交的笔画中笔画类型唯一的条件,则判断与Si相交的各同类笔画,其自身与其他类型笔画的相交关系,根据相交关系与标准汉字笔画集进行比对,确定其对应关系。
以“你”为例,“竖”、“横折钩”、“竖弯钩”、“捺”可以通过笔画类型唯一性判断实现对应,左下角的“撇”虽然笔画类型不唯一,但因为在其所处的子格内只有一个撇,所以可以通过绝对位置关系唯一性实现对应,左上角的两“撇”虽然在同一格子内,且笔画类型不唯一,但通过相交唯一性判断,左边一“撇”与“竖”相交,右边一“撇”与“横折钩”相交,因此可通过相交特征唯一性判断实现这两“撇”的对应,如图5。
(4)相对位置相似性判断:将未完成匹配的笔画按笔画类型进行聚类,若某种笔画类型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致,则计算该类型笔画中各笔画与外包矩形顶点的相对位置,根据相对位置关系与标准汉字笔画进行匹配;
A、将未完成匹配的笔画按笔画类型进行聚类操作,获得新的笔画集S,S={{s11,s12,…,s1k},{s21,s22,…,s2k},…,{sn1,sn2,…,snk}},其中n为未完成匹配的笔画类型数量,k为某种笔画类型下未完成匹配的笔画数量;
B、若某种笔画类型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致,则计算该类型笔画中各笔画与外包矩形顶点的相对位置,计算方法为:获得笔画S中心坐标其中 m为笔画S包含点的数量,计算外包矩形顶点(x,y)与P的距离H
H = ( x - x &OverBar; ) 2 + ( y - y &OverBar; ) 2 - - - ( b )
依次计算同类笔画中用户手写汉字笔画及标准汉字笔画与左上角点距离,并按距离值分别对该类型下的用户手写笔画集与标准笔画集进行排序,如在排序过程中某一集合出现相同值的H,则按顺时针方向分别重新计算所有点与右上角点、右下角点、左下角点的距离,直到获得不一样的H值,根据排序后笔画在该类笔画集中所处的位置与标准汉字笔画集中标准笔画所处的位置完成笔画对应关系的建立。
以“汉”为例,左边“三点水”中的“提”、右边“又”中的“横撇”可以通过笔画类型唯一性判断实现对应,右边“又”中的“捺”可以通过绝对位置关系唯一性特征实现对应,而左边“三点水”中的前面两“撇”,因为笔画类型不唯一,且在同一个子格内,且与已知笔画没有相交关系,无法通过笔画类型唯一性、绝对位置关系唯一性以及相交特征唯一性实现判断,但通过本步描述相对位置关系相似性,可计算出两点的中心距离与左上角顶点位置关系存在差异,因此可通过相对位置相似性判断实现对应,如图6。
4、对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断,实现用户手写汉字中所有笔画与标准字笔画对应关系的建立。
A、计算笔画类型相似度方法:笔画Si和笔画S′i笔画类型相似度,即为两个笔画所包含各个笔段相似度的乘积。从Si和S′i的第一个笔段开始比较,根据其对应笔段之间的角度差,计算获得一个0到1之间的相似度得分,然后对所有笔段的相似度进行累乘。如果Si与S′i多笔段数量不一致,则每差异一个笔段,累乘的结果再乘0.5,累乘结果即为笔画Si和笔画S′i的相似度Di,遍历计算用户手写汉字中每个未建立对应关系的笔画与标准笔画中未建立对应关系笔画的相似度,获得笔画类型相似度集合D,并按相似度值的高低对每个子集进行降序排列,D={{d11,d12,…,d1j},{d21,d22,…,d2j},…,{di1,di2,…,dij}},其中i为用户手写汉字未实现匹配笔画的数量,j为标准汉字未实现匹配笔画的数量,对相似度集合D内的每个子集进行归一化处理,d′in=1-n/j,其中n为该相似度din在其子集中排序后所处位置,j为标准汉字未实现匹配笔画的数量,获得新的相似度集合D1
B、计算绝对位置关系相似度方法:提取绝对位置关系唯一性判断计算结果,获得用户手写汉字及标准汉字未实现匹配笔画所处的子格信息,计算每个手写笔画与标准笔画的绝对位置关系相似度,其中m为用户手写笔画与标准笔画所处位置相同的子格数量,n为手写笔画与标准笔画所处位置不同的子格数量,j为手写笔画与标准笔画所处的子格总数,对相似度计算结果进行归一化处理,获得相对位置相似度集合D2
C、计算相对位置相似度方法:分别计算用户手写汉字及标准汉字未完成匹配的笔画与外包矩形顶点的相对位置,计算笔画Si相对位置的方法为:获得笔画Si中心坐标其中 m为笔画Si包含点的数量,根据公式(b)计算外包矩形顶点(x,y)与P的距离H;
依次计算所有未实现匹配的用户手写汉字笔画及标准汉字笔画与左上角点距离,并按距离值分别对该类型下的用户手写笔画集与标准笔画集进行排序,如在排序过程中某一集合出现相同值的H,则按顺时针方向分别重新计算相同值的点与右上角点、右下角点、左下角点的距离,直到获得不一样的H值,对排序后的子集进行归一化处理,其中n为用户手写汉字笔画Si在用户手写汉字未完成匹配笔画相对位置排序集合中所处位置,m为标准汉字笔画S′i在标准汉字未完成匹配笔画相对位置排序集合中所处的位置,j为标准汉字未实现匹配笔画的数量,获得相对位置相似度集合D3
D、计算综合相似性方法:
综合相似度D=D1+D2+D3,其中D1为笔画类型相似度,D3为绝对位置关系相似度,D3为相对位置相似度,对于用户手写汉字未完成匹配的笔画,取相似度值D最大的标准笔画与其进行匹配,进而实现所有用户手写汉字笔画与标准汉字笔画的一一对应的建立。
以上实施方式仅为体现本发明内容的较佳实施例,依据本发明的思想,在具体实施过程中实施流程会有改变之处,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种手写汉字笔画识别方法,其特征在于:包括如下步骤:
(1)建立作为标准的每个汉字笔画类型、绝对位置和相交关系的特征集;
(2)记录手写汉字笔画书写特征,建立手写汉字特征集;具体步骤如下:
根据用户在平台上手写某个汉字的笔迹移动情况,获取该手写汉字点集,将用户书写过程中从下笔到起笔所形成的点集定义为一个笔画;遍历笔画中的所有点,对原始点集进行降噪处理,并对笔画进行冗余化归类,将相近笔画同归为某一类进行处理;
(3)将标准汉字特征集与手写汉字特征集进行比对处理,建立标准汉字笔画与手写汉字笔画的一一对应关系;比对处理包含:笔画类型唯一性判断、绝对位置唯一性判断、相交特征唯一性判断和相对位置相似性判断;比对的顺序为:首先进行笔画类型唯一性判断,当笔画类型无法判断时,采用绝对位置唯一性判断,当绝对位置无法判断时,进而采用相交特征唯一性判断,当相交特性无法判断时,再采用相对位置相似性判断;
A、笔画类型唯一性判断为分离手写汉字中的唯一性笔画,与标准汉字笔画特征进行匹配;
B、绝对位置唯一性判断为建立手写汉字外包矩形,并将矩形等分为若干子格,确定每个笔画所处的子格,与标准汉字绝对位置特征进行匹配;
C、相交特征唯一性判断为抽取手写汉字中与已确定对应关系笔画具有相交特征的笔画,根据相交关系与标准汉字相交关系特征进行匹配;
D、相对位置相似性判断为将未完成匹配的笔画按笔画类型进行聚类,若某种笔画类型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致,则计算该类型笔画中各笔画与外包矩形顶点的相对位置,根据相对位置关系与标准汉字进行匹配;
(4)对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断,实现手写汉字中所有笔画与标准汉字对应关系的建立。
2.根据权利要求1所述的一种手写汉字笔画识别方法,其特征在于,所述步骤(1)中,建立标准汉字特征集的方法如下:
(1)根据汉字笔画规范,将作为标准汉字径迹切分为由若干笔画组成的集合,按笔画类型进行聚类,建立标准汉字笔画特征集;
(2)遍历上述标准汉字径迹点集,获取其中X坐标最小值xmin及最大值xmax,Y坐标最小值ymin及最大值ymax,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点构建矩形,该矩形即为此标准汉字的外包矩形,将外包矩形等分为若干子格,确定各笔画在所处的子格,建立绝对位置关系标准特征集;
(3)遍历标准汉字笔画特征集,判断单个笔画内部是否存在折点,如存在,则将此笔画从折点断开,拆分为若干个走向独立的笔段,如不存在折点,则将此笔画做为一个笔段处理,根据不同笔画间笔段的相交关系判断笔画是否相交,建立标准汉字相交关系特征集。
3.根据权利要求1所述的一种手写汉字笔画识别方法,其特征在于,所述步骤(3)中比对处理的具体方法包含:
(1)笔画类型唯一性判断:遍历用户手写汉字笔画类型特征集,统计组成该汉字的所有笔画中各类型笔画的数量,获取其中在某种笔画类型中数量等于1的笔画,与标准汉字笔画类型特征集进行比对,确定该类唯一性笔画的对应关系;
(2)绝对位置唯一性判断:遍历用户手写汉字的特征点集合,获取其中X坐标最小值xmin及最大值xmax,Y坐标最小值ymin及最大值ymax,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点构建矩形,该矩形即为此标准汉字的外包矩形,将外包矩形等分为与标准汉字拆分方法一致的若干子格,判断用户手写汉字每个笔画所处的子格,若某笔画在其所属的笔画类型中与子格的位置关系存在唯一性,即某个子格内只存在一个未实现与标准汉字笔画对应关系匹配的某种类型笔画,则分离该笔画与标准汉字笔画绝对位置特征集进行比对,确定该笔画的对应关系;
(3)相交特征唯一性判断:遍历用户手写汉字笔画特征集,判断各个笔画间是否存在相交关系;提取用户手写汉字中已经完成与标准汉字对应的笔画或笔段,通过判断其相交情况确定未知笔画与标准汉字笔画的对应关系;
(4)相对位置相似性判断:抽取用户手写汉字中未完成匹配的笔画,并按笔画类型进行聚类,判断手写汉字与标准汉字相同笔画类型集中包含的未完成匹配笔画数量是否一致,若数量一致,则分别计算该类型笔画中用户手写汉字及标准汉字各笔画与外包矩形各顶点的相对位置,根据相对位置相似性建立用户手写汉字笔画与标准汉字笔画的对应关系。
4.根据权利要求1所述的一种手写汉字笔画识别方法,其特征在于,所述步骤(4)中综合相似性判断方法如下:
对于通过步骤(1)-(3)仍未完成对应关系建立的用户手写汉字笔画,分别计算其与标准汉字中未完成对应关系建立笔画的笔画类型相似度、绝对位置关系相似度、相对位置关系相似度,并将三种相似度进行综合处理,根据综合相似性建立用户手写汉字笔画与标准汉字笔画的对应关系。
CN201410003668.1A 2014-01-03 2014-01-03 一种手写汉字笔画识别方法 Active CN103810506B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410003668.1A CN103810506B (zh) 2014-01-03 2014-01-03 一种手写汉字笔画识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410003668.1A CN103810506B (zh) 2014-01-03 2014-01-03 一种手写汉字笔画识别方法

Publications (2)

Publication Number Publication Date
CN103810506A CN103810506A (zh) 2014-05-21
CN103810506B true CN103810506B (zh) 2016-09-14

Family

ID=50707247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410003668.1A Active CN103810506B (zh) 2014-01-03 2014-01-03 一种手写汉字笔画识别方法

Country Status (1)

Country Link
CN (1) CN103810506B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050453A (zh) * 2014-06-24 2014-09-17 南京师范大学 一种手写汉字笔势评价方法
CN104156721B (zh) * 2014-07-31 2017-06-23 南京师范大学 一种基于模板匹配的脱机汉字笔画提取方法
CN104182732B (zh) * 2014-08-12 2017-09-26 南京师范大学 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法
CN104537343B (zh) * 2014-12-22 2018-11-16 中山大学 一种基于网格多级精确度递进式比划识别方法
CN105160338B (zh) * 2015-08-17 2018-11-16 南京师范大学 基于标注关系的手写汉字正确性判别方法
CN106056049B (zh) * 2016-05-20 2019-12-31 广东小天才科技有限公司 一种汉字书写的笔画检测方法及装置
CN106095294B (zh) * 2016-06-08 2019-03-05 福建天泉教育科技有限公司 不同平台之间同步笔画的方法及其系统
CN106203538B (zh) * 2016-06-30 2019-06-14 广东小天才科技有限公司 电子笔迹的单字拆解方法及装置
CN107330399A (zh) * 2017-06-29 2017-11-07 广州视源电子科技股份有限公司 汉字拆分方法、装置、计算机存储介质及电子设备
CN109189314B (zh) * 2018-08-13 2022-01-21 广东小天才科技有限公司 手写设备的书写引导方法、装置、设备及介质
CN111652032B (zh) * 2019-12-04 2023-06-02 湖北工业大学 在线笔迹认证中一种笔迹布局特征的提取及认证方法
CN111310544B (zh) * 2019-12-04 2023-05-30 湖北工业大学 基于特征稳定性和特殊性分析的在线笔迹认证方法
CN111310548B (zh) * 2019-12-04 2023-09-19 武汉汉德瑞庭科技有限公司 一种在线手写笔迹中笔画类型的识别方法
CN111222590B (zh) * 2019-12-31 2024-04-12 咪咕文化科技有限公司 形近字确定方法、电子设备和计算机可读存储介质
CN111242219A (zh) * 2020-01-14 2020-06-05 北大方正集团有限公司 文字相似度确定方法、装置、电子设备及存储介质
CN111695537A (zh) * 2020-06-17 2020-09-22 北京一起教育信息咨询有限责任公司 一种笔画识别的方法、装置及电子设备
CN112712688A (zh) * 2020-12-22 2021-04-27 惠州视维新技术有限公司 遥控器、显示设备、显示遥控系统及其遥控方法
CN113903045A (zh) * 2021-10-22 2022-01-07 华中师范大学 一种手写汉字图像的笔顺识别方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07146918A (ja) * 1993-11-24 1995-06-06 Hitachi Ltd 手書き文字認識装置
CN101295371A (zh) * 2008-04-18 2008-10-29 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN103366151A (zh) * 2012-03-30 2013-10-23 佳能株式会社 手写字符识别方法以及设备
CN103455264A (zh) * 2012-06-01 2013-12-18 鸿富锦精密工业(深圳)有限公司 一种手写汉字输入方法及具有该方法的电子装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07146918A (ja) * 1993-11-24 1995-06-06 Hitachi Ltd 手書き文字認識装置
CN101295371A (zh) * 2008-04-18 2008-10-29 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN103366151A (zh) * 2012-03-30 2013-10-23 佳能株式会社 手写字符识别方法以及设备
CN103455264A (zh) * 2012-06-01 2013-12-18 鸿富锦精密工业(深圳)有限公司 一种手写汉字输入方法及具有该方法的电子装置

Also Published As

Publication number Publication date
CN103810506A (zh) 2014-05-21

Similar Documents

Publication Publication Date Title
CN103810506B (zh) 一种手写汉字笔画识别方法
CN106203395B (zh) 基于多任务深度学习的人脸属性识别方法
WO2018072233A1 (zh) 一种基于选择性搜索算法的车标检测识别方法及系统
CN101290659B (zh) 基于组合分类器的手写识别方法
CN106203356B (zh) 一种基于卷积网络特征提取的人脸识别方法
CN109871851B (zh) 一种基于卷积神经网络算法的汉字书写规范性判定方法
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
CN104966096A (zh) 一种基于重要书写特征标注的手写汉字工整性评价方法
CN106355138A (zh) 基于深度学习和关键点特征提取的人脸识别方法
CN104850825A (zh) 一种基于卷积神经网络的人脸图像颜值计算方法
CN103473545B (zh) 一种基于多特征的文本图像相似度度量方法
CN104978550A (zh) 基于大规模人脸数据库的人脸识别方法及系统
CN104239910B (zh) 一种联机手写汉字笔画续笔的识别方法
CN105574063A (zh) 基于视觉显著性的图像检索方法
US20150347804A1 (en) Method and system for estimating fingerprint pose
CN105426890B (zh) 一种字符扭曲粘连的图形验证码识别方法
CN103984943A (zh) 一种基于贝叶斯概率框架的场景文本识别方法
CN104182732A (zh) 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法
CN103186775A (zh) 基于混合描述子的人体运动识别方法
CN104182766A (zh) 基于模板匹配的手写汉字笔画位置关系正确性判断方法
CN102831408A (zh) 人脸识别方法
CN110796131A (zh) 一种汉字书写评价系统
CN103854016A (zh) 基于方向性共同发生特征的人体行为分类识别方法及系统
CN104299004A (zh) 一种基于多特征融合和指尖检测的手势识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211227

Address after: 210000 15-c, No. 68, Shanxi Road, Gulou District, Nanjing, Jiangsu

Patentee after: Nanjing wenmu Education Technology Co.,Ltd.

Address before: Ya Dong New District Yuen Road 210046 in Jiangsu province Nanjing City No. 1

Patentee before: NANJING NORMAL University

TR01 Transfer of patent right