CN102375994A - 书写汉字笔顺正确性检测及还原的方法和装置 - Google Patents

书写汉字笔顺正确性检测及还原的方法和装置 Download PDF

Info

Publication number
CN102375994A
CN102375994A CN2010102502023A CN201010250202A CN102375994A CN 102375994 A CN102375994 A CN 102375994A CN 2010102502023 A CN2010102502023 A CN 2010102502023A CN 201010250202 A CN201010250202 A CN 201010250202A CN 102375994 A CN102375994 A CN 102375994A
Authority
CN
China
Prior art keywords
stroke
time
space relationship
submatrix
beta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102502023A
Other languages
English (en)
Other versions
CN102375994B (zh
Inventor
祝豪
邓超
朱军民
Original Assignee
Guangdong Ksense Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ksense Information Technology Co Ltd filed Critical Guangdong Ksense Information Technology Co Ltd
Priority to CN 201010250202 priority Critical patent/CN102375994B/zh
Publication of CN102375994A publication Critical patent/CN102375994A/zh
Application granted granted Critical
Publication of CN102375994B publication Critical patent/CN102375994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了书写汉字笔顺正确性检测及还原的方法和装置;本发明的方法包括,获取书写汉字的笔画,生成该书写汉字的笔画时空关系矩阵,获取该书写汉字相对应的模板汉字的笔画时空关系矩阵,比较书写汉字和模板汉字的笔画时空关系矩阵,如果两个矩阵中元素全部相同,则说明该书写汉字的笔顺正确,否则,说明该书写汉字的笔顺不正确,生成书写汉字的书写顺序不正确的笔画时空关系子矩阵,生成模板汉字的笔画时空关系子矩阵,找出正确的笔画书写顺序;本发明可以对书写顺序不正确的笔画进行检测,同时将书写顺序不正确的笔画还原为书写顺序正确的笔画。

Description

书写汉字笔顺正确性检测及还原的方法和装置
技术领域
本发明涉及书写汉字笔顺正确性检测及还原技术领域,尤其涉及一种书写汉字笔顺正确性检测及还原的方法和装置。
背景技术
随着计算机以及信息化技术的发展,越来越多的人开始借助于计算机等工具进行汉字的输入,这样造成了很多人书写(手写)汉字能力的下降,在书写汉字时容易出现提笔忘字的情况,或者不会书写正确规范的汉字,或者不会按正确的笔画顺序(简称为笔顺)书写汉字。在现代汉语通用字中,除了少数的只有一笔笔画的汉字外,对于两笔以及两笔以上的多笔笔画汉字,都存在笔画书写顺序的先后问题。而汉字本身的笔顺是有一定规则的,先写哪一笔,后写哪一笔不能随心所欲。为了促进我国语言文字规范化,消除规范汉字笔顺本身存在的难点,国家语言文字工作委员会和新闻出版署于1997年公布了《现代汉语通用字笔顺规范》,包含了七千多个常用汉字的笔画书写顺序,这对于如何按照正确的笔画顺序书写汉字具有重要的指导意义。
然而,尽管汉字识别技术目前已经取得了很大的进展,但是却没有出现能够检测笔画书写顺序是否正确并能同时将错误笔画还原为正确笔画的相关技术文献资料。中国发明专利“乱笔顺库建立方法及联机手写汉字识别评测系统”(公开号CN 1641686A)公开了一种汉字乱笔顺库的生成方法,但没有进一步研究如何检测错误的笔顺。
现有技术中,中国发明专利“一种基于结构模型的汉字识别方法”(公开号CN 1474351A)提出了一种笔画位置关系矩阵的方法来进行汉字识别,该方法先采用笔段中心点识别方法对待识别的汉字进行粗分类,然后根据笔画位置关系矩阵进行精分类识别。笔画位置关系矩阵能够表现笔画之间相互关系的特征,但是,由于该方法中所获取的笔画位置关系矩阵是基于笔画结构类型的,其目的是针对于文字识别,没有考虑笔画书写的先后顺序信息,因此仅仅使用该方法中的不具有笔顺先后信息的位置关系矩阵是不能对书写顺序不正确的笔画进行检测,更无法将书写顺序不正确的笔画还原为书写顺序正确的笔画。
发明内容
本发明提供一种书写汉字笔顺正确性检测及还原的方法和装置,本技术方案可以对书写顺序不正确的笔画进行检测,可以将书写顺序不正确的笔画还原为书写顺序正确的笔画。
一种书写汉字笔顺正确性检测及还原的方法,包括:
A获取书写汉字的笔画,设共有N笔笔画;
B生成该书写汉字的笔画时空关系矩阵RN×N,笔画时空关系矩阵RN×N表示由元素rij构成的N×N矩阵:
R N × N = r 11 , r 12 , . . . , r 1 i , . . . . . , r 1 j , . . . . , r 1 N r 21 , r 22 , . . . , r 2 i , . . . . . , r 2 j , . . . , r 2 N . . . . . . . . . . . . . . . . . . . . . . . . . r i 1 , r i 2 , . . . , r ii , . . . . . , r ij , . . . . . , r iN . . . . . . . . . . . . . . . . . . . . . . . . . r j 1 , r j 2 , . . . , r ji , . . . . . , r jj , . . . , r jN . . . . . . . . . . . . . . . . . . . . . . . . . r N 1 , r N 2 , . . . , r Ni , . . . , r Nj , . . . , r NN
该笔画时空关系矩阵RN×N的元素rij为元素rij(α,β,γ)的简写,元素rij(α,β,γ)表示第i笔笔画和第j笔笔画的位置关系;rij(α,β,γ)包括rij(α)、rij(β)、rij(γ),其中,rij(α)表示第i笔笔画和第j笔笔画的左右位置关系,rij(β)表示第i笔笔画和第j笔笔画的上下位置关系,rij(γ)表示第i笔笔画和第j笔笔画的正反向交叉位置关系,i=1,2,...,N,j=1,2,...,N;
C获取该书写汉字对应的模板汉字的笔画时空关系矩阵R′N×N,笔画时空关系矩阵R′N×N表示由元素r′ij构成的N×N矩阵;如果元素rij与元素r′ij全部相同,判断出该书写汉字的笔顺正确,否则,判断出该书写汉字的笔顺不正确,继续步骤D;
D从书写汉字的笔画时空关系矩阵RN×N中找出与模板汉字的笔画时空关系矩阵R′N×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画qe,设共有t笔书写顺序不正确的笔画qe,e=1,2,...,t;将书写顺序不正确的笔画qe构成一个序列{q1,q2,..,qt},对该序列{q1,q2,...,qt}进行全排列,共有t!个排列序列,设第k个排列序列对应第k个书写汉字的时空关系子矩阵k=1,2,...,t!:
B t × t k = b 11 k , b 12 k , . . . . . , b 1 u k , . . . , b 1 v k , . . . . , b 1 t k b 21 k , b 22 k , . . . . . , b 2 u k , . . . , b 2 v k , . . . , b 2 t k . . . . . . . . . . . . . . . . . . . . . . . . . b u 1 k , b u 2 k , . . . , b uu k , . . . , b uv k , . . . . , b ut k . . . . . . . . . . . . . . . . . . . . . . . . . b v 1 k , b v 2 k , . . . , b vu k , . . . . , b vv k , . . . , b vt k . . . . . . . . . . . . . . . . . . . . . . . . . b t 1 k , b t 2 k , . . . . . , b tu k , . . . . , b tv k , . . . . b tt k
该时空关系子矩阵
Figure BSA00000224212400033
中的元素
Figure BSA00000224212400034
为元素
Figure BSA00000224212400035
的简写,元素
Figure BSA00000224212400036
表示第u笔笔画和第v笔笔画的位置关系;
Figure BSA00000224212400037
包括
Figure BSA00000224212400039
其中,
Figure BSA000002242124000310
表示第u笔笔画和第v笔笔画的左右位置关系,
Figure BSA000002242124000311
表示第u笔笔画和第v笔笔画的上下位置关系,
Figure BSA000002242124000312
表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
从模板汉字的笔画时空关系矩阵R′N×N中找出与书写汉字的笔画时空关系矩阵RN×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画对应的模板正确笔画qf,f=1,2,...,t,将模板正确笔画qf构成一个序列{q1,q2,...,qt},设序列{q1,q2,...,qt}对应一个模板汉字的时空关系子矩阵Dt×t
D t × t = d 11 , d 12 , . . . , d 1 u , . . . , d 1 v , . . . , d 1 t d 21 , d 22 , . . . , d 2 u , . . . , d 2 v , . . . , d 2 t . . . . . . . . . . . . . . . . . . . . . . . . . d u 1 , d u 2 , . . . , d uu , . . . , d uv , . . . , d ut . . . . . . . . . . . . . . . . . . . . . . . . . d v 1 , d v 2 , . . . , d vu , . . . . , d vv , . . . , d vt . . . . . . . . . . . . . . . . . . . . . . . . . d t 1 , d t 2 , . . . , d tu , . . . . . , d tv , . . . , d tt
该笔画时空关系矩阵Dt×t中的元素duv为元素duv(α,β,γ)的简写,元素duv(α,β,γ)表示第u笔笔画和第v笔笔画的位置关系;duv(α,β,γ)包括duv(α)、duv(β)、duv(γ),其中,duv(α)表示第u笔笔画和第v笔笔画的左右位置关系,duv(β)表示第u笔笔画和第v笔笔画的上下位置关系,duv(γ)表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
遍历t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400041
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400042
最接近的时空关系子矩阵
Figure BSA00000224212400043
对应书写顺序不正确笔画qe构成的序列{q1,q2,...,qt}进行全排列时的第g个排列序列,得出序列{q1,q2,...,qt}进行全排列时的第g个排列序列为正确的笔画书写顺序,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。
其中,步骤A之后进一步包括步骤A1:采用道格拉斯-普克算法对书写汉字的每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;每笔笔画的前后两个相邻的轨迹关键点构成一个向量笔画段;
元素rij(α,β,γ)表示的第i笔笔画和第j笔笔画的位置关系的识别过程如下:
如果第i笔笔画和第j笔笔画交叉,rij(α)赋值rij(0),rij(β)赋值rij(0);获取第i笔笔画的交叉的向量笔画段和第j笔笔画的交叉的向量笔画段,以交点为圆心,顺时针方向旋转第i笔笔画的交叉的向量笔画段;如果第i笔笔画的交叉的向量笔画段旋转到与第j笔笔画的交叉的向量笔画段方向一致时,旋转角度θ不大于180度,识别出第i笔笔画和第j笔笔画为正向交叉位置关系,rij(γ)赋值rij(+z),否则,识别出第i笔笔画和第j笔笔画为反向交叉位置关系,rij(γ)赋值rij(-z);
如果第i笔笔画和第j笔笔画不交叉,rij(γ)赋值rij(0);根据第i笔笔画的轨迹关键点计算第i笔笔画的质心坐标,根据第j笔笔画的轨迹关键点计算第j笔笔画的质心坐标;如果第i笔笔画的质心坐标的横坐标小于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的左边,rij(α)赋值rij(-x),如果第i笔笔画的质心坐标的横坐标大于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的右边,rij(α)赋值rij(+x),如果第i笔笔画的质心坐标的横坐标等于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画与第j笔笔画的不存在左右位置关系,rij(α)赋值rij(0);如果第i笔笔画的质心坐标的纵坐标小于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的下边,rij(β)赋值rij(-y),如果第i笔笔画的质心坐标的纵坐标大于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的上边,rij(β)赋值rij(+y),如果第i笔笔画的质心坐标的纵坐标等于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画与第j笔笔画的不存在上下位置关系,rij(β)赋值rij(0)。
其中,x=1,y=2,z=3。
其中,遍历t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400051
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400052
具体过程包括:
设Lk为Dt×t
Figure BSA00000224212400053
之间的距离:
Figure BSA00000224212400054
k=1,2,...,t!;
其中,当duv(γ)≠0或
Figure BSA00000224212400055
时:
l k ( u , v ) = 2 if d uv ( γ ) ≠ b uv k ( γ ) 0 if d uv ( γ ) = b uv k ( γ )
当duv(γ)=0且
Figure BSA00000224212400057
时:
l k ( u , v ) = 2 if d uv ( α ) ≠ b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 1 if d uv ( α ) ≠ v uv k ( α ) and d uv ( β ) = b uv k ( β ) 1 if d uv ( α ) = b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 0 if d uv ( α ) = b uv k ( α ) and d uv ( β ) = b uv k ( β )
第k个Lk对应第k个书写汉字的时空关系子矩阵
Figure BSA00000224212400062
遍历t!个书写汉字的时空关系子矩阵计算Lk;获得最小值的Lg,最小值的Lg对应时空关系子矩阵
Figure BSA00000224212400064
该时空关系子矩阵
Figure BSA00000224212400065
为与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
一种书写汉字笔顺正确性检测及还原的装置,包括:
预处理装置,用于获取书写汉字的笔画,设共有N笔笔画;
笔画时空关系矩阵生成装置,用于生成该书写汉字的笔画时空关系矩阵RN×N,笔画时空关系矩阵RN×N表示由元素rij构成的N×N矩阵:
R N × N = r 11 , r 12 , . . . , r 1 i , . . . . . , r 1 j , . . . . , r 1 N r 21 , r 22 , . . . , r 2 i , . . . . . , r 2 j , . . . , r 2 N . . . . . . . . . . . . . . . . . . . . . . . . . r i 1 , r i 2 , . . . , r ii , . . . . . , r ij , . . . . . , r iN . . . . . . . . . . . . . . . . . . . . . . . . . r j 1 , r j 2 , . . . , r ji , . . . . . , r jj , . . . , r jN . . . . . . . . . . . . . . . . . . . . . . . . . r N 1 , r N 2 , . . . , r Ni , . . . , r Nj , . . . , r NN
该笔画时空关系矩阵RN×N的元素rij为元素rij(α,β,γ)的简写,元素rij(α,β,γ)表示第i笔笔画和第j笔笔画的位置关系;rij(α,β,γ)包括rij(α)、rij(β)、rij(γ),其中,rij(α)表示第i笔笔画和第j笔笔画的左右位置关系,rij(β)表示第i笔笔画和第j笔笔画的上下位置关系,rij(γ)表示第i笔笔画和第j笔笔画的正反向交叉位置关系,i=1,2,...,N,j=1,2,...,N;
笔顺正确性检测装置,用于获取该书写汉字对应的模板汉字的笔画时空关系矩阵R′N×N,笔画时空关系矩阵R′N×N表示由元素r′ij构成的N×N矩阵;如果元素rij与元素r′ij全部相同,判断出该书写汉字的笔顺正确,否则,判断出该书写汉字的笔顺不正确;
笔顺正确性还原装置,用于从书写汉字的笔画时空关系矩阵RN×N中找出与模板汉字的笔画时空关系矩阵R′N×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画qe,设共有t笔书写顺序不正确的笔画qe,e=1,2,...,t;将书写顺序不正确的笔画qe构成一个序列{q1,q2,..,qt},对该序列{q1,q2,..,qt}进行全排列,共有t!个排列序列,设第k个排列序列对应第k个书写汉字的时空关系子矩阵
Figure BSA00000224212400071
k=1,2,...,t!:
B t × t k = b 11 k , b 12 k , . . . . . , b 1 u k , . . . , b 1 v k , . . . . , b 1 t k b 21 k , b 22 k , . . . . . , b 2 u k , . . . , b 2 v k , . . . , b 2 t k . . . . . . . . . . . . . . . . . . . . . . . . . b u 1 k , b u 2 k , . . . , b uu k , . . . , b uv k , . . . . , b ut k . . . . . . . . . . . . . . . . . . . . . . . . . b v 1 k , b v 2 k , . . . , b vu k , . . . . , b vv k , . . . , b vt k . . . . . . . . . . . . . . . . . . . . . . . . . b t 1 k , b t 2 k , . . . . . , b tu k , . . . . , b tv k , . . . . b tt k
该时空关系子矩阵
Figure BSA00000224212400073
中的元素为元素
Figure BSA00000224212400075
的简写,元素
Figure BSA00000224212400076
表示第u笔笔画和第v笔笔画的位置关系;
Figure BSA00000224212400077
包括
Figure BSA00000224212400078
Figure BSA00000224212400079
其中,
Figure BSA000002242124000710
表示第u笔笔画和第v笔笔画的左右位置关系,
Figure BSA000002242124000711
表示第u笔笔画和第v笔笔画的上下位置关系,
Figure BSA000002242124000712
表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
从模板汉字的笔画时空关系矩阵R′N×N中找出与书写汉字的笔画时空关系矩阵RN×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画对应的模板正确笔画qf,f=1,2,...,t,将模板正确笔画qf构成一个序列{q1,q2,...,qt},设序列{q1,q2,...,qt}对应一个模板汉字的时空关系子矩阵Dt×t
D t × t = d 11 , d 12 , . . . , d 1 u , . . . , d 1 v , . . . , d 1 t d 21 , d 22 , . . . , d 2 u , . . . , d 2 v , . . . , d 2 t . . . . . . . . . . . . . . . . . . . . . . . . . d u 1 , d u 2 , . . . , d uu , . . . , d uv , . . . , d ut . . . . . . . . . . . . . . . . . . . . . . . . . d v 1 , d v 2 , . . . , d vu , . . . . , d vv , . . . , d vt . . . . . . . . . . . . . . . . . . . . . . . . . d t 1 , d t 2 , . . . , d tu , . . . . . , d tv , . . . , d tt
该笔画时空关系矩阵Dt×t中的元素duv为元素duv(α,β,γ)的简写,元素duv(α,β,γ)表示第u笔笔画和第v笔笔画的位置关系;duv(α,β,γ)包括duv(α)、duv(β)、duv(γ),其中,duv(α)表示第u笔笔画和第v笔笔画的左右位置关系,duv(β)表示第u笔笔画和第v笔笔画的上下位置关系,duv(γ)表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
遍历t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400082
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400083
最接近的时空关系子矩阵
Figure BSA00000224212400084
对应书写顺序不正确笔画qe构成的序列{q1,q2,...,qt}进行全排列时的第g个排列序列,得出序列{q1,q2,...,qt}进行全排列时的第g个排列序列为正确的笔画书写顺序,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。
其中,预处理装置进一步用于获取轨迹关键点和向量笔画段;采用道格拉斯-普克算法对书写汉字的每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;每笔笔画的前后两个相邻的轨迹关键点构成一个向量笔画段;
笔画时空关系矩阵生成装置进一步用于识别位置关系;元素rij(α,β,γ)表示的第i笔笔画和第j笔笔画的位置关系的识别过程如下:
如果第i笔笔画和第j笔笔画交叉,rij(α)赋值rij(0),rij(β)赋值rij(0);获取第i笔笔画的交叉的向量笔画段和第j笔笔画的交叉的向量笔画段,以交点为圆心,顺时针方向旋转第i笔笔画的交叉的向量笔画段;如果第i笔笔画的交叉的向量笔画段旋转到与第j笔笔画的交叉的向量笔画段方向一致时,旋转角度θ不大于180度,识别出第i笔笔画和第j笔笔画为正向交叉位置关系,rij(γ)赋值rij(+z),否则,识别出第i笔笔画和第j笔笔画为反向交叉位置关系,rij(γ)赋值rij(-z);
如果第i笔笔画和第j笔笔画不交叉,rij(γ)赋值rij(0);根据第i笔笔画的轨迹关键点计算第i笔笔画的质心坐标,根据第j笔笔画的轨迹关键点计算第j笔笔画的质心坐标;如果第i笔笔画的质心坐标的横坐标小于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的左边,rij(α)赋值rij(-x),如果第i笔笔画的质心坐标的横坐标大于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的右边,rij(α)赋值rij(+x),如果第i笔笔画的质心坐标的横坐标等于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画与第j笔笔画的不存在左右位置关系,rij(α)赋值rij(0);如果第i笔笔画的质心坐标的纵坐标小于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的下边,rij(β)赋值rij(-y),如果第i笔笔画的质心坐标的纵坐标大于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的上边,rij(β)赋值rij(+y),如果第i笔笔画的质心坐标的纵坐标等于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画与第j笔笔画的不存在上下位置关系,rij(β)赋值rij(0)。
其中,x=1,y=2,z=3。
其中,笔顺正确性还原装置进一步用于找出最接近的时空关系子矩阵;遍历t!个书写汉字的时空关系子矩阵找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400092
具体过程包括:
设Lk为Dt×t
Figure BSA00000224212400101
之间的距离:
Figure BSA00000224212400102
其中,当duv(γ)≠0或
Figure BSA00000224212400103
时:
l k ( u , v ) = 2 if d uv ( γ ) ≠ b uv k ( γ ) 0 if d uv ( γ ) = b uv k ( γ )
当duv(γ)=0且
Figure BSA00000224212400105
时:
l k ( u , v ) = 2 if d uv ( α ) ≠ b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 1 if d uv ( α ) ≠ v uv k ( α ) and d uv ( β ) = b uv k ( β ) 1 if d uv ( α ) = b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 0 if d uv ( α ) = b uv k ( α ) and d uv ( β ) = b uv k ( β )
第k个Lk对应第k个书写汉字的时空关系子矩阵
Figure BSA00000224212400107
遍历t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400108
计算Lk;获得最小值的Lg,最小值的Lg对应时空关系子矩阵
Figure BSA00000224212400109
该时空关系子矩阵
Figure BSA000002242124001010
为与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA000002242124001011
本技术方案包括:获取书写汉字的笔画,设共有N笔笔画;生成该书写汉字的笔画时空关系矩阵RN×N,该笔画时空关系矩阵RN×N的元素rij为元素rij(α,β,γ)的简写,元素rij(α,β,γ)表示第i笔笔画和第j笔笔画的位置关系;获取该书写汉字对应的模板汉字的笔画时空关系矩阵R′N×N,笔画时空关系矩阵R′N×N表示由元素r′ij构成的N×N矩阵;如果元素rij与元素r′ij全部相同,判断出该书写汉字的笔顺正确,否则,判断出该书写汉字的笔顺不正确;从书写汉字的笔画时空关系矩阵RN×N中找出与模板汉字的笔画时空关系矩阵R′N×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画qe,设共有t笔书写顺序不正确的笔画qe,e=1,2,...,t;将书写顺序不正确的笔画qe构成一个序列{q1,q2,...,qt},对该序列{q1,q2,..,qt}进行全排列,共有t!个排列序列,设第k个排列序列对应第k个书写汉字的时空关系子矩阵
Figure BSA000002242124001012
从模板汉字的笔画时空关系矩阵R′N×N中找出与书写汉字的笔画时空关系矩阵RN×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画对应的模板正确笔画qf,f=1,2,...,t,将模板正确笔画qf构成一个序列{q1,q2,...,qt},设序列{q1,q2,...,qt}对应一个模板汉字的时空关系子矩阵Dt×t,遍历t!个书写汉字的时空关系子矩阵找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵最接近的时空关系子矩阵
Figure BSA00000224212400113
对应第g个排列序列,得出序列{q1,q2,...,qt}进行全排列时的第g个排列序列为正确的笔画书写顺序,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。本技术方案可以对书写顺序不正确的笔画进行检测,可以将书写顺序不正确的笔画还原为书写顺序正确的笔画。
附图说明
图1为本发明的实施例一的方法流程图。
图2为本发明的实施例一的“北”字的笔画顺序对照示意图。
图3为本发明的实施例一的“边”字的笔画顺序对照示意图。
图4为本发明的实施例二的正向交叉位置关系示意图。
图5为本发明的实施例二的反向交叉位置关系示意图。
图6为本发明的实施例四的装置方框图。
具体实施方式
实施例一
参见图1至3,以下结合附图对本发明进行详细的描述。
一种书写汉字笔顺正确性检测及还原的方法,包括步骤:
步骤101.获取书写汉字的笔画,设共有N笔笔画。这些笔画是有顺序的,分别是第1笔笔画,第2笔笔画,...,第N笔笔画。
可以通过电子写字板、手写笔或触摸屏等装置获取书写汉字的笔画。这些装置可以识别书写汉字,记录其笔画的坐标位置信息、笔画数信息、单笔笔画结束符的标志信息、书写汉字所有笔画轨迹结束的标志信息等。
步骤102.生成该书写汉字的笔画时空关系矩阵RN×N,笔画时空关系矩阵RN×N表示由元素rij构成的N×N矩阵:
R N × N = r 11 , r 12 , . . . , r 1 i , . . . . . , r 1 j , . . . . , r 1 N r 21 , r 22 , . . . , r 2 i , . . . . . , r 2 j , . . . , r 2 N . . . . . . . . . . . . . . . . . . . . . . . . . r i 1 , r i 2 , . . . , r ii , . . . . . , r ij , . . . . . , r iN . . . . . . . . . . . . . . . . . . . . . . . . . r j 1 , r j 2 , . . . , r ji , . . . . . , r jj , . . . , r jN . . . . . . . . . . . . . . . . . . . . . . . . . r N 1 , r N 2 , . . . , r Ni , . . . , r Nj , . . . , r NN
该笔画时空关系矩阵RN×N的元素rij为元素rij(α,β,γ)的简写,利用简写是为了书写公式的便利,而不会影响读者对本技术方案的理解;元素rij(α,β,γ)表示第i笔笔画和第j笔笔画的位置关系;rij(α,β,γ)包括rij(α)、rij(β)、rij(γ),其中,rij(α)表示第i笔笔画和第j笔笔画的左右位置关系,rij(β)表示第i笔笔画和第j笔笔画的上下位置关系,rij(γ)表示第i笔笔画和第j笔笔画的正反向交叉位置关系,i=1,2,...,N,j=1,2,...,N。根据第i笔笔画和第j笔笔画的位置关系,可以对元素rij(α,β,γ)赋予具体的值。
令rij=0,即笔画自身的位置关系的值为0,有rij=-rji,即rij(α)=-rji(α),rij(β)=-rji(β),rij(γ)=-rji(γ),可得:
R N × N = 0 , r 12 , . . . , r 1 i , . . . . . . . . . . . , r 1 j , . . . . , r 1 N - r 12 , 0 , . . . . , r 2 i , . . . . . . . . . . . , r 2 j , . . . . , r 2 N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . - r 1 i , - r 2 i , . . . , 0 , . . . . . . . . . . . . , r ij , . . . . . , r iN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . - r 1 j , - r 2 j , . . . . . , - r ij , . . . . . , 0 , . . . . . . , r jN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . - r 1 N , - r 2 N , . . . , - r iN , . . . , - r jN , . . . , 0
可以看出,笔画时空关系矩阵RN×N的行坐标和列坐标反映了笔画的书写时间先后顺序,而给定行坐标和列坐标上的元素,则反映了笔画间的空间位置关系,故而把该矩阵称为笔画时空关系矩阵。
设存在正反向交叉位置关系时,rij(α)为0,rij(β)为0;而不存在正反向交叉位置关系时,rij(γ)为0,此时,rij(α)和rij(β)不同时为0,即rij(α)和rij(β)中至少一个不为0,这是因为两笔笔画间不存在正反向交叉位置关系时,可能不存在左右位置关系或者上下位置关系,但不可能左右位置关系和上下位置关系均不存在。
步骤103.获取该书写汉字对应的模板汉字的笔画时空关系矩阵R′N×N,笔画时空关系矩阵R′N×N表示由元素r′ij构成的N×N矩阵;如果元素rij与元素r′ij全部相同,判断出该书写汉字的笔顺正确,否则,判断出该书写汉字的笔顺不正确,继续步骤104。即如果元素rij与元素r′ij不是全部相同,判断出该书写汉字的笔顺不正确,继续步骤104。
元素rij与元素r′ij全部相同指的是,当i和j取i=1,2,...,N,j=1,2,...,N范围内的任意数值时,RN×N的元素rij所表示的第i笔笔画和第j笔笔画的位置关系与R′N×N的元素r′ij所表示的第i笔笔画和第j笔笔画的位置关系相同。
本实施例中,模板汉字均为书写汉字对应的汉字,即模板汉字与书写汉字为相同汉字。
模板汉字的笔画和笔画时空关系矩阵R′N×N可以预先计算出来并保存,在实施本方案时,可以直接读取与书写汉字对应的模板汉字的笔画和笔画时空关系矩阵R′N×N;当然,也可以预先保存模板汉字的笔画,R′N×N的元素r′ij表示模板汉字的第i笔笔画和第j笔笔画的位置关系,在实施本方案时,由元素r′ij生产N×N矩阵的R′N×N
书写汉字的笔画时空关系矩阵RN×N元素rij(α,β,γ)表示书写汉字的第i笔笔画和第j笔笔画的位置关系。同理,R′N×N的元素r′ij为r′ij(α,β,γ)的简写,元素r′ij(α,β,γ)表示模板汉字的第i笔笔画和第j笔笔画的位置关系,r′ij(α,β,γ)包括r′ij(α)、r′ij(β)、r′ij(γ),其中,r′ij(α)表示第i笔笔画和第j笔笔画的左右位置关系,r′ij(β)表示第i笔笔画和第j笔笔画的上下位置关系,r′ij(γ)表示第i笔笔画和第j笔笔画的正反向交叉位置关系,i=1,2,...,N,j=1,2,...,N;根据第i笔笔画和第j笔笔画的位置关系,可以对元素r′ij(α,β,γ)赋予具体的值。如果元素rij与元素r′ij全部相同,说明了书写汉字的第i笔笔画和第j笔笔画的位置关系与模板汉字的第i笔笔画和第j笔笔画的位置关系相同,则该书写汉字的笔顺正确,否则为笔顺不正确。
对于任意一个具有给定笔画书写顺序的汉字,其相应的笔画时空关系矩阵是唯一的,即汉字的笔画书写顺序与其笔画时空关系矩阵是一一对应的,以下对这一结论给予证明。
容易证明,对于任意一个汉字,在其给定的笔画顺序下,只有唯一的一个笔画时空关系矩阵与其相对应,这是因为对于这个汉字的任意两笔笔画,只有唯一的一种位置关系,即只有唯一的一个笔画时空关系矩阵,记为
Figure BSA00000224212400141
下面需要证明这个汉字的笔画时空关系矩阵
Figure BSA00000224212400142
也只有唯一的一种笔画书写顺序与其相对应。不妨假设这个汉字,其存在至少两种不同的笔画书写顺序,其笔画时空关系矩阵都为
Figure BSA00000224212400143
即对于这个汉字,至少存在两笔不同的笔画——第i笔笔画S1和第j笔笔画S2,当改变第i笔笔画S1和第j笔笔画S2的书写先后顺序后,其对应的笔画时空关系矩阵仍然为
Figure BSA00000224212400144
将当前第i笔笔画S1和第j笔笔画S2的时空位置关系记为
Figure BSA00000224212400145
改变第i笔笔画S1和第j笔笔画S2的书写顺序后,将第i笔笔画变为S2,第j笔笔画变为S1,这时第i笔笔画和第j笔笔画的位置关系记为
Figure BSA00000224212400146
由于
Figure BSA00000224212400147
具有正反对称的性质,即
Figure BSA00000224212400148
另一方面,由于这两种笔画书写顺序下对应同样的笔画时空关系矩阵,有
Figure BSA00000224212400149
而第i笔笔画和第j笔笔画为不同的笔画,rij(α)、rij(β)和rij(γ)不存在同时为0,显然
Figure BSA000002242124001410
Figure BSA000002242124001411
是相矛盾的,即假设是不成立的,这证明了对于给定汉字的笔画时空关系矩阵,也只有唯一的笔画书写顺序与其相对应。因此,汉字的笔画顺序与其笔画时空关系矩阵是一一对应的。
综上,对于书写汉字的笔画时空关系矩阵RN×N以及与该书写汉字对应的模板汉字的笔画时空关系矩阵R′N×N,当RN×N和R′N×N这两个矩阵中某些位置的元素不一样的时候,说明了该书写汉字若干笔画的书写顺序不正确。
步骤104.从书写汉字的笔画时空关系矩阵RN×N中找出与模板汉字的笔画时空关系矩阵R′N×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画qe,设共有t笔书写顺序不正确的笔画qe,e=1,2,...,t;将书写顺序不正确的笔画qe构成一个序列{q1,q2,...,qt},对该序列{q1,q2,...,qt}进行全排列,共有t!个排列序列,设第k个排列序列对应第k个书写汉字的时空关系子矩阵
Figure BSA00000224212400151
k=1,2,...,t!:
B t × t k = b 11 k , b 12 k , . . . . . , b 1 u k , . . . , b 1 v k , . . . . , b 1 t k b 21 k , b 22 k , . . . . . , b 2 u k , . . . , b 2 v k , . . . , b 2 t k . . . . . . . . . . . . . . . . . . . . . . . . . b u 1 k , b u 2 k , . . . , b uu k , . . . , b uv k , . . . . , b ut k . . . . . . . . . . . . . . . . . . . . . . . . . b v 1 k , b v 2 k , . . . , b vu k , . . . . , b vv k , . . . , b vt k . . . . . . . . . . . . . . . . . . . . . . . . . b t 1 k , b t 2 k , . . . . . , b tu k , . . . . , b tv k , . . . . b tt k
该时空关系子矩阵
Figure BSA00000224212400153
中的元素
Figure BSA00000224212400154
为元素
Figure BSA00000224212400155
的简写,元素
Figure BSA00000224212400156
表示第u笔笔画和第v笔笔画的位置关系;
Figure BSA00000224212400157
包括
Figure BSA00000224212400158
Figure BSA00000224212400159
其中,
Figure BSA000002242124001510
表示第u笔笔画和第v笔笔画的左右位置关系,
Figure BSA000002242124001511
表示第u笔笔画和第v笔笔画的上下位置关系,
Figure BSA000002242124001512
表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t。
因为元素rij表示书写汉字的第i笔笔画和第j笔笔画的位置关系,故从书写汉字的笔画时空关系矩阵RN×N中找出与模板汉字的笔画时空关系矩阵R′N×N不同的元素后,根据不同的元素就可以得到顺序不正确的笔画。比如书写汉字的笔画时空关系矩阵RN×N中的元素r35与模板汉字的笔画时空关系矩阵R′N×N的元素r′35不同,则说明了该书写汉字的第3笔和第5笔的书写顺序不正确。
需要说明的是,将书写顺序不正确的笔画qe构成一个序列{q1,q2,...,qt},q1表示第1笔书写汉字的书写顺序不正确的笔画;第1笔书写顺序不正确的笔画,可能并不是书写汉字的第1笔书写顺序的笔画;比如,书写汉字的第1第2第4笔笔画的书写顺序正确,而第3第5笔笔画的书写顺序不正确,则第3笔笔画为q1,第5笔笔画为q2;将书写顺序不正确的笔画找出来,并按先后顺序进行排序,构成序列{q1,q2,...,qt}。显然,有t≤N。
从模板汉字的笔画时空关系矩阵R′N×N中找出与书写汉字的笔画时空关系矩阵RN×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画对应的模板正确笔画qf,f=1,2,...,t,将模板正确笔画qf构成一个序列{q1,q2,...,qt},设序列{q1,q2,...,qt}对应一个模板汉字的时空关系子矩阵Dt×t
D t × t = d 11 , d 12 , . . . , d 1 u , . . . , d 1 v , . . . , d 1 t d 21 , d 22 , . . . , d 2 u , . . . , d 2 v , . . . , d 2 t . . . . . . . . . . . . . . . . . . . . . . . . . d u 1 , d u 2 , . . . , d uu , . . . , d uv , . . . , d ut . . . . . . . . . . . . . . . . . . . . . . . . . d v 1 , d v 2 , . . . , d vu , . . . . , d vv , . . . , d vt . . . . . . . . . . . . . . . . . . . . . . . . . d t 1 , d t 2 , . . . , d tu , . . . . . , d tv , . . . , d tt
该笔画时空关系矩阵Dt×t中的元素duv为元素duv(α,β,γ)的简写,元素duv(α,β,γ)表示第u笔笔画和第v笔笔画的位置关系;duv(α,β,γ)包括duv(α)、duv(β)、duv(γ),其中,duv(α)表示第u笔笔画和第v笔笔画的左右位置关系,duv(β)表示第u笔笔画和第v笔笔画的上下位置关系,duv(γ)表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t。
仍使用相同例子:将书写顺序不正确的笔画qe构成一个序列{q1,q2,...,qt},q1表示第1笔书写汉字的书写顺序不正确的笔画;第1笔书写顺序不正确的笔画,可能并不是书写汉字的第1笔书写顺序的笔画;比如,书写汉字的第1第2第4笔笔画的书写顺序正确,而第3第5笔笔画的书写顺序不正确,则第3笔笔画为q1,第5笔笔画为q2。将对应书写顺序不正确的笔画的模板正确笔画qf构成一个序列{q1,q2,...,qt},模板正确笔画的q1表示第1笔书写汉字的书写顺序不正确的笔画对应的模板正确笔画,对上面例子来说,对应的是第3笔笔画;模板正确笔画的q2表示第2笔书写汉字的书写顺序不正确的笔画对应的模板正确笔画,对上面例子来说,对应的是第5笔笔画;将书写顺序不正确的笔画对应的模板正确笔画找出来,并按先后顺序进行排序,构成序列{q1,q2,...,qt}。
遍历t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400171
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400172
显然,有g≤t!。
使用统计方法,通过对比元素
Figure BSA00000224212400173
和元素duv,可以找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400174
使用统计方法从若干个矩阵中找出最接近的矩阵是现有技术,这是本领域普通技术人员不需要创造性劳动就可以实现的。
最接近的时空关系子矩阵
Figure BSA00000224212400175
对应书写顺序不正确笔画qe构成的序列{q1,q2,...,qt}进行全排列时的第g个排列序列,得出序列{q1,q2,...,qt}进行全排列时的第g个排列序列为正确的笔画书写顺序,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。
书写汉字的书写顺序不正确的笔画qe构成的序列{q1,q2,...,qt}进行全排列时,产生的排列序列是有顺序的,当确定最接近的时空关系子矩阵时,可以找到对应的第g个排列序列,从而还原出书写顺序正确的笔画。
比如,书写汉字的顺序不正确的笔画qe构成的序列为{第3笔笔画q1,第5笔笔画q2,第6笔笔画q3,第7笔笔画q4},如通过上述方法找到最接近的时空关系子矩阵
Figure BSA00000224212400181
对应的第g个排列序列为{第5笔笔画q2,第3笔笔画q1,第7笔笔画q4,第6笔笔画q3},则表示书写顺序不正确的笔画分别为第3笔笔画、第5笔笔画、第6笔笔画、第7笔笔画,这些书写顺序不正确的笔画与顺序正确的笔画的对应关系分别为:不正确的第5笔笔画对应于正确的第3笔笔画,不正确的第3笔笔画对应于正确的第5笔笔画,不正确的第7笔笔画对应于正确的第6笔笔画,不正确的第6笔笔画对应于正确的第7笔笔画,即实际的正确笔画的顺序为第5笔笔画、第3笔笔画、第7笔笔画、第6笔笔画,从而还原出书写顺序正确的笔画。
利用本发明可以将书写顺序不正确的笔画还原为书写顺序正确的笔画。图2和图3为利用本发明模拟的实验结果。其中,图2为本发明的“北”字的笔画顺序对照示意图,上排为正确的笔画顺序,下排为不正确的笔画顺序;图3为本发明的“边”字的笔画顺序对照示意图,上排为正确的笔画顺序,下排为不正确的笔画顺序。
  模板汉字笔顺   No.1   No.2   No.3   No.4   No.5
  不正确的笔顺   1   2   3   4   5
  正确的笔顺   3   1   2   5   4
表1为“北”字的笔顺正确性检测和还原
  模板汉字笔顺   No.1   No.2   No.3   No.4   No.5
  不正确的笔顺   1   2   3   4   5
  正确的笔顺   4   5   1   2   3
表2为“边”字的笔顺正确性检测和还原
从表1和表2可以看出,本发明对书写顺序不正确的笔画进行检测,可以将书写顺序不正确的笔画还原为书写顺序正确的笔画。这对于纠正不正确的笔顺非常有帮助,对于汉语语言文字的学习也是十分有意义。
需要说明的,本实施例中,先找得到书写顺序不正确的笔画qe,将顺序不正确的笔画qe构成一个序列{q1,q2,...,qt},产生t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400191
进行比较,得到最接近的时空关系子矩阵
Figure BSA00000224212400192
再找到对应的第g个排列序列;这种做法是把书写顺序正确的笔画剔除,从而加快中央处理器的运算速度。如果中央处理器的运算速度足够快的话,也可以不剔除书写顺序正确的笔画,直接将全部书写笔画构成一个序列{q1,q2,...,qN},产生N!个书写汉字的时空关系子矩阵
Figure BSA00000224212400193
进行比较,得到最接近的时空关系子矩阵
Figure BSA00000224212400194
再找到对应的第g个排列序列,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。
实施例二
本实施例与实施例一的不同之处在于,在步骤101之后进一步包括步骤101A:采用道格拉斯-普克算法对书写汉字的每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;每笔笔画的前后两个相邻的轨迹关键点构成一个向量笔画段。每个笔画的书写有先后顺序,笔画的轨迹关键点也有先后顺序,前后两个相邻的轨迹关键点构成的向量笔画段的方向为笔画的书写方向。道格拉斯-普克算法可消除书写汉字笔画轨迹中的噪声点和冗余点,得到书写汉字的笔画的轨迹关键点。设第i笔笔画的轨迹关键点的数目为m,则第i笔笔画的向量笔画段的数目为m-1。
在本实施例中,提出了一种元素rij(α,β,γ)表示的第i笔笔画和第j笔笔画的位置关系的识别过程:
如果第i笔笔画和第j笔笔画交叉,rij(α)赋值rij(0),rij(β)赋值rij(0);获取第i笔笔画的交叉的向量笔画段和第j笔笔画的交叉的向量笔画段,以交点为圆心,顺时针方向旋转第i笔笔画的交叉的向量笔画段;如果第i笔笔画的交叉的向量笔画段旋转到与第j笔笔画的交叉的向量笔画段方向一致时,旋转角度θ不大于180度,识别出第i笔笔画和第j笔笔画为正向交叉位置关系,rij(γ)赋值rij(+z),否则,识别出第i笔笔画和第j笔笔画为反向交叉位置关系,rij(γ)赋值rij(-z)。即如果第i笔笔画的交叉的向量笔画段旋转到与第j笔笔画的交叉的向量笔画段方向一致时,旋转角度θ大于180度,识别出第i笔笔画和第j笔笔画为反向交叉位置关系,rij(γ)赋值rij(-z)。需要提醒的是,如果第i笔笔画和第j笔笔画相接而不是交叉,则不存在正反向交叉位置关系。第i笔笔画具有若干个向量笔画段,第i笔笔画的交叉的向量笔画段指的是与第j笔笔画交叉的那个向量笔画段。
见图4图5,本实施例使用矢量数据旋转方向角度特征法判断正反向交叉位置关系。设第i笔笔画的向量笔画段
Figure BSA00000224212400201
与第j笔笔画的向量笔画段交叉,交点为p0;以P0为圆心,沿顺时针方向旋转向量笔画段
Figure BSA00000224212400203
图4中,向量笔画段旋转到与向量笔画段
Figure BSA00000224212400205
方向一致时,其旋转角度θ不大于180度,识别出第i笔笔画和第j笔笔画为正向交叉位置关系。而图5中,向量笔画段
Figure BSA00000224212400206
旋转到与向量笔画段
Figure BSA00000224212400207
方向一致时,其旋转角度θ大于180度,识别出第i笔笔画和第j笔笔画为反向交叉位置关系。正向交叉位置关系和反向交叉位置关系这两种特征关系反映了两笔画的书写先后顺序。
Figure BSA00000224212400208
表示第i笔笔画的轨迹关键点p1和p2构成的向量笔画段。表示第j笔笔画的轨迹关键点p3和p4构成的向量笔画段。
如果第i笔笔画和第j笔笔画不交叉,rij(γ)赋值rij(0);根据第i笔笔画的轨迹关键点计算第i笔笔画的质心坐标,根据第j笔笔画的轨迹关键点计算第j笔笔画的质心坐标;如果第i笔笔画的质心坐标的横坐标小于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的左边,rij(α)赋值rij(-x),如果第i笔笔画的质心坐标的横坐标大于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的右边,rij(α)赋值rij(+x),如果第i笔笔画的质心坐标的横坐标等于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画与第j笔笔画的不存在左右位置关系,rij(α)赋值rij(0);如果第i笔笔画的质心坐标的纵坐标小于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的下边,rij(β)赋值rij(-y),如果第i笔笔画的质心坐标的纵坐标大于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的上边,rij(β)赋值rij(+y),如果第i笔笔画的质心坐标的纵坐标等于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画与第j笔笔画的不存在上下位置关系,rij(β)赋值rij(0)。根据若干个点(本实施例指轨迹关键点)可以计算质心坐标,这是现有技术,故在这里不作赘述。
对于不存在相互交叉关系的两笔笔画,其质心坐标不会重合,左右位置关系或者上下位置关系至少存在一种。当两笔笔画的左右位置关系或者上下位置发生对调时,左右位置关系或者上下位置的赋值将互换,可见左右位置关系或者上下位置反映了笔画的先后书写顺序,具有正反对称的性质。
本实施例中,x=1,y=2,z=3;即正向交叉位置关系,rij(γ)赋值rij(+3);反向交叉位置关系,rij(γ)赋值rij(-3);第i笔笔画位于第j笔笔画的左边,rij(α)赋值rij(+1);第i笔笔画位于第j笔笔画的右边,rij(α)赋值rij(-1);第i笔笔画位于第j笔笔画的上边,rij(β)赋值rij(+2);第i笔笔画位于第j笔笔画的下边,rij(β)赋值rij(-2)。给rij(α)、rij(β)、rij(γ)赋值是为了元素rij与元素r′ij比较的便利,便于比较它们是否相同,数值的大小不影响本发明的实施;当然x、y、z的值也可以分别等于2、4、6,或者x、y、z的值也可以分别等于10、20、30。
需要说明的是,现有技术中,第i笔笔画和第j笔笔画的位置关系的识别方法很多,这里就不做赘述,本领域普通技术人员除了选择使用本实施例提及的识别方法外,还可以选择使用现有的其它笔画位置关系的识别方法;比如,可以选择使用背景技术提到的公开号CN 1474351A技术文档中的两笔画之间的相互位置关系的识别方法。
实施例三
本实施例在结合实施例一和实施例二的内容的基础上,提出了一种从t!个时空关系子矩阵中,找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400222
的方法。
遍历t!个书写汉字的时空关系子矩阵找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400224
具体过程包括:
设Lk为Dt×t
Figure BSA00000224212400225
之间的距离:
其中,当duv(γ)≠0或
Figure BSA00000224212400227
时:(即duv(γ)和
Figure BSA00000224212400228
这两个元素中至少一个不等于0)
l k ( u , v ) = 2 if d uv ( γ ) ≠ b uv k ( γ ) 0 if d uv ( γ ) = b uv k ( γ )
当duv(γ)=0且时:
l k ( u , v ) = 2 if d uv ( α ) ≠ b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 1 if d uv ( α ) ≠ v uv k ( α ) and d uv ( β ) = b uv k ( β ) 1 if d uv ( α ) = b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 0 if d uv ( α ) = b uv k ( α ) and d uv ( β ) = b uv k ( β )
duv(γ)=0表示duv(γ)赋值duv(0),说明笔画不交叉,而duv(γ)≠0说明笔画交叉;表示
Figure BSA000002242124002213
赋值
Figure BSA000002242124002214
说明笔画不交叉,而说明笔画交叉。
第k个Lk对应第k个书写汉字的时空关系子矩阵遍历t!个书写汉字的时空关系子矩阵
Figure BSA000002242124002217
k=1,2,...,t!,计算Lk;遍历t!个时空关系子矩阵,共有t!个距离,分别为L1,L2,...,Lk,...,Lt!,获得这些距离中的最小值的Lg,最小值的Lg对应时空关系子矩阵
Figure BSA000002242124002218
该时空关系子矩阵
Figure BSA000002242124002219
为与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA000002242124002220
此时
Figure BSA000002242124002221
对应第g个排列序列,序列{q1,q2,...,qt}进行全排列时的第g个排列序列为正确的笔画书写顺序,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。
如果书写汉字很规范,最小值Lg等于0,即Dt×t完全一致;如果书写汉字不够规范,最小值的Lg可能不等于0,按上述方法可找到该最小值的Lg,该Lg对应的就是最接近的时空关系子矩阵
Figure BSA00000224212400232
需要说明的是,除了上述通过计算两矩阵的距离、从若干个矩阵中找出最接近矩阵的方法外,本领域普通技术人员还可以选择其它计算距离的方法找出最接近矩阵,如应用欧式距离找出最接近的矩阵,应用欧式距离从若干矩阵中找出最接近的矩阵是现有技术,本领域普通技术人员不需要创造性劳动就可以实现,这里就不在赘述。
实施例四
见图6,一种书写汉字笔顺正确性检测及还原的装置,包括:
预处理装置201,用于获取书写汉字的笔画,设共有N笔笔画。
笔画时空关系矩阵生成装置202,用于生成该书写汉字的笔画时空关系矩阵RN×N,笔画时空关系矩阵RN×N表示由元素rij构成的N×N矩阵:
R N × N = r 11 , r 12 , . . . , r 1 i , . . . . . , r 1 j , . . . . , r 1 N r 21 , r 22 , . . . , r 2 i , . . . . . , r 2 j , . . . , r 2 N . . . . . . . . . . . . . . . . . . . . . . . . . r i 1 , r i 2 , . . . , r ii , . . . . . , r ij , . . . . . , r iN . . . . . . . . . . . . . . . . . . . . . . . . . r j 1 , r j 2 , . . . , r ji , . . . . . , r jj , . . . , r jN . . . . . . . . . . . . . . . . . . . . . . . . . r N 1 , r N 2 , . . . , r Ni , . . . , r Nj , . . . , r NN
该笔画时空关系矩阵RN×N的元素rij为元素rij(α,β,γ)的简写,元素rij(α,β,γ)表示第i笔笔画和第j笔笔画的位置关系;rij(α,β,γ)包括rij(α)、rij(β)、rij(γ),其中,rij(α)表示第i笔笔画和第j笔笔画的左右位置关系,rij(β)表示第i笔笔画和第j笔笔画的上下位置关系,rij(γ)表示第i笔笔画和第j笔笔画的正反向交叉位置关系,i=1,2,...,N,j=1,2,...,N。
笔顺正确性检测装置203,用于获取该书写汉字对应的模板汉字的笔画时空关系矩阵R′N×N,笔画时空关系矩阵R′N×N表示由元素r′ij构成的N×N矩阵;如果元素rij与元素r′ij全部相同,判断出该书写汉字的笔顺正确,否则,判断出该书写汉字的笔顺不正确。
笔顺正确性还原装置204,用于从书写汉字的笔画时空关系矩阵RN×N中找出与模板汉字的笔画时空关系矩阵R′N×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画qe,设共有t笔书写顺序不正确的笔画qe,e=1,2,...,t;将书写顺序不正确的笔画qe构成一个序列{q1,q2,...,qt},对该序列{q1,q2,...,qt}进行全排列,共有t!个排列序列,设第k个排列序列对应第k个书写汉字的时空关系子矩阵
Figure BSA00000224212400241
k=1,2,...,t!:
B t × t k = b 11 k , b 12 k , . . . . . , b 1 u k , . . . , b 1 v k , . . . . , b 1 t k b 21 k , b 22 k , . . . . . , b 2 u k , . . . , b 2 v k , . . . , b 2 t k . . . . . . . . . . . . . . . . . . . . . . . . . b u 1 k , b u 2 k , . . . , b uu k , . . . , b uv k , . . . . , b ut k . . . . . . . . . . . . . . . . . . . . . . . . . b v 1 k , b v 2 k , . . . , b vu k , . . . . , b vv k , . . . , b vt k . . . . . . . . . . . . . . . . . . . . . . . . . b t 1 k , b t 2 k , . . . . . , b tu k , . . . . , b tv k , . . . . b tt k
该时空关系子矩阵
Figure BSA00000224212400243
中的元素
Figure BSA00000224212400244
为元素的简写,元素
Figure BSA00000224212400246
表示第u笔笔画和第v笔笔画的位置关系;
Figure BSA00000224212400247
包括
Figure BSA00000224212400248
Figure BSA00000224212400249
其中,
Figure BSA000002242124002410
表示第u笔笔画和第v笔笔画的左右位置关系,
Figure BSA000002242124002411
表示第u笔笔画和第v笔笔画的上下位置关系,
Figure BSA000002242124002412
表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
从模板汉字的笔画时空关系矩阵R′N×N中找出与书写汉字的笔画时空关系矩阵RN×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画对应的模板正确笔画qf,f=1,2,...,t,将模板正确笔画qf构成一个序列{q1,q2,...,qt},设序列{q1,q2,...,qt}对应一个模板汉字的时空关系子矩阵Dt×t
D t × t = d 11 , d 12 , . . . , d 1 u , . . . , d 1 v , . . . , d 1 t d 21 , d 22 , . . . , d 2 u , . . . , d 2 v , . . . , d 2 t . . . . . . . . . . . . . . . . . . . . . . . . . d u 1 , d u 2 , . . . , d uu , . . . , d uv , . . . , d ut . . . . . . . . . . . . . . . . . . . . . . . . . d v 1 , d v 2 , . . . , d vu , . . . . , d vv , . . . , d vt . . . . . . . . . . . . . . . . . . . . . . . . . d t 1 , d t 2 , . . . , d tu , . . . . . , d tv , . . . , d tt
该笔画时空关系矩阵Dt×t中的元素duv为元素duv(α,β,γ)的简写,元素duv(α,β,γ)表示第u笔笔画和第v笔笔画的位置关系;duv(α,β,γ)包括duv(α)、duv(β)、duv(γ),其中,duv(α)表示第u笔笔画和第v笔笔画的左右位置关系,duv(β)表示第u笔笔画和第v笔笔画的上下位置关系,duv(γ)表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
遍历t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400252
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400253
最接近的时空关系子矩阵
Figure BSA00000224212400254
对应书写顺序不正确笔画qe构成的序列{q1,q2,...,qt}进行全排列时的第g个排列序列,得出序列{q1,q2,...,qt}进行全排列时的第g个排列序列为正确的笔画书写顺序,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。
其中,预处理装置201进一步用于获取轨迹关键点和向量笔画段;采用道格拉斯-普克算法对书写汉字的每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;每笔笔画的前后两个相邻的轨迹关键点构成一个向量笔画段。
笔画时空关系矩阵生成装置202进一步用于识别位置关系;元素rij(α,β,γ)表示的第i笔笔画和第j笔笔画的位置关系的识别过程如下:
如果第i笔笔画和第j笔笔画交叉,rij(α)赋值rij(0),rij(β)赋值rij(0);获取第i笔笔画的交叉的向量笔画段和第j笔笔画的交叉的向量笔画段,以交点为圆心,顺时针方向旋转第i笔笔画的交叉的向量笔画段;如果第i笔笔画的交叉的向量笔画段旋转到与第j笔笔画的交叉的向量笔画段方向一致时,旋转角度θ不大于180度,识别出第i笔笔画和第j笔笔画为正向交叉位置关系,rij(γ)赋值rij(+z),否则,识别出第i笔笔画和第j笔笔画为反向交叉位置关系,rij(γ)赋值rij(-z);
如果第i笔笔画和第j笔笔画不交叉,rij(γ)赋值rij(0);根据第i笔笔画的轨迹关键点计算第i笔笔画的质心坐标,根据第j笔笔画的轨迹关键点计算第j笔笔画的质心坐标;如果第i笔笔画的质心坐标的横坐标小于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的左边,rij(α)赋值rij(-x),如果第i笔笔画的质心坐标的横坐标大于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的右边,rij(α)赋值rij(+x),如果第i笔笔画的质心坐标的横坐标等于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画与第j笔笔画的不存在左右位置关系,rij(α)赋值rij(0);如果第i笔笔画的质心坐标的纵坐标小于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的下边,rij(β)赋值rij(-y),如果第i笔笔画的质心坐标的纵坐标大于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的上边,rij(β)赋值rij(+y),如果第i笔笔画的质心坐标的纵坐标等于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画与第j笔笔画的不存在上下位置关系,rij(β)赋值rij(0)。
其中,x=1,y=2,z=3。
其中,笔顺正确性还原装置204进一步用于找出最接近的时空关系子矩阵;遍历t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400261
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA00000224212400271
具体过程包括:
设Lk为Dt×t之间的距离:
其中,当duv(γ)≠0或
Figure BSA00000224212400274
时:
l k ( u , v ) = 2 if d uv ( γ ) ≠ b uv k ( γ ) 0 if d uv ( γ ) = b uv k ( γ )
当duv(γ)=0且
Figure BSA00000224212400276
时:
l k ( u , v ) = 2 if d uv ( α ) ≠ b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 1 if d uv ( α ) ≠ v uv k ( α ) and d uv ( β ) = b uv k ( β ) 1 if d uv ( α ) = b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 0 if d uv ( α ) = b uv k ( α ) and d uv ( β ) = b uv k ( β )
第k个Lk对应第k个书写汉字的时空关系子矩阵
Figure BSA00000224212400278
遍历t!个书写汉字的时空关系子矩阵
Figure BSA00000224212400279
计算Lk;获得最小值的Lg,最小值的Lg对应时空关系子矩阵
Figure BSA000002242124002710
该时空关系子矩阵为与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure BSA000002242124002712
此时
Figure BSA000002242124002713
所对应的笔画排列即为正确的笔画书写顺序。
以上内容仅为本发明的较佳实施例,对于本领域的普通技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种书写汉字笔顺正确性检测及还原的方法,其特征在于,包括:
A获取书写汉字的笔画,设共有N笔笔画;
B生成该书写汉字的笔画时空关系矩阵RN×N,笔画时空关系矩阵RN×N表示由元素rij构成的N×N矩阵:
R N × N = r 11 , r 12 , . . . , r 1 i , . . . . . , r 1 j , . . . . , r 1 N r 21 , r 22 , . . . , r 2 i , . . . . . , r 2 j , . . . , r 2 N . . . . . . . . . . . . . . . . . . . . . . . . . r i 1 , r i 2 , . . . , r ii , . . . . . , r ij , . . . . . , r iN . . . . . . . . . . . . . . . . . . . . . . . . . r j 1 , r j 2 , . . . , r ji , . . . . . , r jj , . . . , r jN . . . . . . . . . . . . . . . . . . . . . . . . . r N 1 , r N 2 , . . . , r Ni , . . . , r Nj , . . . , r NN
该笔画时空关系矩阵RN×N的元素rij为元素rij(α,β,γ)的简写,元素rij(α,β,γ)表示第i笔笔画和第j笔笔画的位置关系;rij(α,β,γ)包括rij(α)、rij(β)、rij(γ),其中,rij(α)表示第i笔笔画和第j笔笔画的左右位置关系,rij(β)表示第i笔笔画和第j笔笔画的上下位置关系,rij(γ)表示第i笔笔画和第j笔笔画的正反向交叉位置关系,i=1,2,...,N,j=1,2,...,N;
C获取该书写汉字对应的模板汉字的笔画时空关系矩阵R′N×N,笔画时空关系矩阵R′N×N表示由元素r′ij构成的N×N矩阵;如果元素rij与元素r′ij全部相同,判断出该书写汉字的笔顺正确,否则,判断出该书写汉字的笔顺不正确,继续步骤D;
D从书写汉字的笔画时空关系矩阵RN×N中找出与模板汉字的笔画时空关系矩阵R′N×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画qe,设共有t笔书写顺序不正确的笔画qe,e=1,2,...,t;将书写顺序不正确的笔画qe构成一个序列{q1,q2,..,qt},对该序列{q1,q2,...,qt}进行全排列,共有t!个排列序列,设第k个排列序列对应第k个书写汉字的时空关系子矩阵k=1,2,...,t!:
B t × t k = b 11 k , b 12 k , . . . . . , b 1 u k , . . . , b 1 v k , . . . . , b 1 t k b 21 k , b 22 k , . . . . . , b 2 u k , . . . , b 2 v k , . . . , b 2 t k . . . . . . . . . . . . . . . . . . . . . . . . . b u 1 k , b u 2 k , . . . , b uu k , . . . , b uv k , . . . . , b ut k . . . . . . . . . . . . . . . . . . . . . . . . . b v 1 k , b v 2 k , . . . , b vu k , . . . . , b vv k , . . . , b vt k . . . . . . . . . . . . . . . . . . . . . . . . . b t 1 k , b t 2 k , . . . . . , b tu k , . . . . , b tv k , . . . . b tt k
该时空关系子矩阵
Figure FSA00000224212300022
中的元素
Figure FSA00000224212300023
为元素
Figure FSA00000224212300024
的简写,元素
Figure FSA00000224212300025
表示第u笔笔画和第v笔笔画的位置关系;
Figure FSA00000224212300026
包括
Figure FSA00000224212300027
Figure FSA00000224212300028
其中,
Figure FSA00000224212300029
表示第u笔笔画和第v笔笔画的左右位置关系,
Figure FSA000002242123000210
表示第u笔笔画和第v笔笔画的上下位置关系,
Figure FSA000002242123000211
表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
从模板汉字的笔画时空关系矩阵R′N×N中找出与书写汉字的笔画时空关系矩阵RN×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画对应的模板正确笔画qf,f=1,2,...,t,将模板正确笔画qf构成一个序列{q1,q2,...,qt},设序列{q1,q2,...,qt}对应一个模板汉字的时空关系子矩阵Dt×t
D t × t = d 11 , d 12 , . . . , d 1 u , . . . , d 1 v , . . . , d 1 t d 21 , d 22 , . . . , d 2 u , . . . , d 2 v , . . . , d 2 t . . . . . . . . . . . . . . . . . . . . . . . . . d u 1 , d u 2 , . . . , d uu , . . . , d uv , . . . , d ut . . . . . . . . . . . . . . . . . . . . . . . . . d v 1 , d v 2 , . . . , d vu , . . . . , d vv , . . . , d vt . . . . . . . . . . . . . . . . . . . . . . . . . d t 1 , d t 2 , . . . , d tu , . . . . . , d tv , . . . , d tt
该笔画时空关系矩阵Dt×t中的元素duv为元素duv(α,β,γ)的简写,元素duv(α,β,γ)表示第u笔笔画和第v笔笔画的位置关系;duv(α,β,γ)包括duv(α)、duv(β)、duv(γ),其中,duv(α)表示第u笔笔画和第v笔笔画的左右位置关系,duv(β)表示第u笔笔画和第v笔笔画的上下位置关系,duv(γ)表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
遍历t!个书写汉字的时空关系子矩阵找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
最接近的时空关系子矩阵
Figure FSA00000224212300033
对应书写顺序不正确笔画qe构成的序列{q1,q2,...,qt}进行全排列时的第g个排列序列,得出序列{q1,q2,...,qt}进行全排列时的第g个排列序列为正确的笔画书写顺序,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。
2.根据权利要求1所述的一种书写汉字笔顺正确性检测及还原的方法,其特征在于:
所述步骤A之后进一步包括步骤A1:采用道格拉斯-普克算法对书写汉字的每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;每笔笔画的前后两个相邻的轨迹关键点构成一个向量笔画段;
所述元素rij(α,β,γ)表示的第i笔笔画和第j笔笔画的位置关系的识别过程如下:
如果第i笔笔画和第j笔笔画交叉,rij(α)赋值rij(0),rij(β)赋值rij(0);获取第i笔笔画的交叉的向量笔画段和第j笔笔画的交叉的向量笔画段,以交点为圆心,顺时针方向旋转第i笔笔画的交叉的向量笔画段;如果第i笔笔画的交叉的向量笔画段旋转到与第j笔笔画的交叉的向量笔画段方向一致时,旋转角度θ不大于180度,识别出第i笔笔画和第j笔笔画为正向交叉位置关系,rij(γ)赋值rij(+z),否则,识别出第i笔笔画和第j笔笔画为反向交叉位置关系,rij(γ)赋值rij(-z);
如果第i笔笔画和第j笔笔画不交叉,rij(γ)赋值rij(0);根据第i笔笔画的轨迹关键点计算第i笔笔画的质心坐标,根据第j笔笔画的轨迹关键点计算第j笔笔画的质心坐标;如果第i笔笔画的质心坐标的横坐标小于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的左边,rij(α)赋值rij(-x),如果第i笔笔画的质心坐标的横坐标大于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的右边,rij(α)赋值rij(+x),如果第i笔笔画的质心坐标的横坐标等于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画与第j笔笔画的不存在左右位置关系,rij(α)赋值rij(0);如果第i笔笔画的质心坐标的纵坐标小于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的下边,rij(β)赋值rij(-y),如果第i笔笔画的质心坐标的纵坐标大于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的上边,rij(β)赋值rij(+y),如果第i笔笔画的质心坐标的纵坐标等于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画与第j笔笔画的不存在上下位置关系,rij(β)赋值rij(0)。
3.根据权利要求2所述的一种书写汉字笔顺正确性检测及还原的方法,其特征在于:所述x=1,y=2,z=3。
4.根据权利要求1至3任意一项所述的一种书写汉字笔顺正确性检测及还原的方法,其特征在于:
所述遍历t!个书写汉字的时空关系子矩阵
Figure FSA00000224212300041
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure FSA00000224212300042
具体过程包括:
设Lk为Dt×t
Figure FSA00000224212300043
之间的距离:
Figure FSA00000224212300044
其中,当duv(γ)≠0或
Figure FSA00000224212300045
时:
l k ( u , v ) = 2 if d uv ( γ ) ≠ b uv k ( γ ) 0 if d uv ( γ ) = b uv k ( γ )
当duv(γ)=0且时:
l k ( u , v ) = 2 if d uv ( α ) ≠ b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 1 if d uv ( α ) ≠ v uv k ( α ) and d uv ( β ) = b uv k ( β ) 1 if d uv ( α ) = b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 0 if d uv ( α ) = b uv k ( α ) and d uv ( β ) = b uv k ( β )
第k个Lk对应第k个书写汉字的时空关系子矩阵
Figure FSA00000224212300052
遍历t!个书写汉字的时空关系子矩阵计算Lk;获得最小值的Lg,最小值的Lg对应时空关系子矩阵
Figure FSA00000224212300054
该时空关系子矩阵
Figure FSA00000224212300055
为与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure FSA00000224212300056
5.一种书写汉字笔顺正确性检测及还原的装置,其特征在于,包括:
预处理装置,用于获取书写汉字的笔画,设共有N笔笔画;
笔画时空关系矩阵生成装置,用于生成该书写汉字的笔画时空关系矩阵RN×N,笔画时空关系矩阵RN×N表示由元素rij构成的N×N矩阵:
R N × N = r 11 , r 12 , . . . , r 1 i , . . . . . , r 1 j , . . . . , r 1 N r 21 , r 22 , . . . , r 2 i , . . . . . , r 2 j , . . . , r 2 N . . . . . . . . . . . . . . . . . . . . . . . . . r i 1 , r i 2 , . . . , r ii , . . . . . , r ij , . . . . . , r iN . . . . . . . . . . . . . . . . . . . . . . . . . r j 1 , r j 2 , . . . , r ji , . . . . . , r jj , . . . , r jN . . . . . . . . . . . . . . . . . . . . . . . . . r N 1 , r N 2 , . . . , r Ni , . . . , r Nj , . . . , r NN
该笔画时空关系矩阵RN×N的元素rij为元素rij(α,β,γ)的简写,元素rij(α,β,γ)表示第i笔笔画和第j笔笔画的位置关系;rij(α,β,γ)包括rij(α)、rij(β)、rij(γ),其中,rij(α)表示第i笔笔画和第j笔笔画的左右位置关系,rij(β)表示第i笔笔画和第j笔笔画的上下位置关系,rij(γ)表示第i笔笔画和第j笔笔画的正反向交叉位置关系,i=1,2,...,N,j=1,2,...,N;
笔顺正确性检测装置,用于获取该书写汉字对应的模板汉字的笔画时空关系矩阵R′N×N,笔画时空关系矩阵R′N×N表示由元素r′ij构成的N×N矩阵;如果元素rij与元素r′ij全部相同,判断出该书写汉字的笔顺正确,否则,判断出该书写汉字的笔顺不正确;
笔顺正确性还原装置,用于从书写汉字的笔画时空关系矩阵RN×N中找出与模板汉字的笔画时空关系矩阵R′N×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画qe,设共有t笔书写顺序不正确的笔画qe,e=1,2,...,t;将书写顺序不正确的笔画qe构成一个序列{q1,q2,..,qt},对该序列{q1,q2,...,qt}进行全排列,共有t!个排列序列,设第k个排列序列对应第k个书写汉字的时空关系子矩阵
Figure FSA00000224212300061
k=1,2,...,t!:
B t × t k = b 11 k , b 12 k , . . . . . , b 1 u k , . . . , b 1 v k , . . . . , b 1 t k b 21 k , b 22 k , . . . . . , b 2 u k , . . . , b 2 v k , . . . , b 2 t k . . . . . . . . . . . . . . . . . . . . . . . . . b u 1 k , b u 2 k , . . . , b uu k , . . . , b uv k , . . . . , b ut k . . . . . . . . . . . . . . . . . . . . . . . . . b v 1 k , b v 2 k , . . . , b vu k , . . . . , b vv k , . . . , b vt k . . . . . . . . . . . . . . . . . . . . . . . . . b t 1 k , b t 2 k , . . . . . , b tu k , . . . . , b tv k , . . . . b tt k
该时空关系子矩阵中的元素
Figure FSA00000224212300064
为元素的简写,元素
Figure FSA00000224212300066
表示第u笔笔画和第v笔笔画的位置关系;包括
Figure FSA00000224212300068
Figure FSA00000224212300069
其中,
Figure FSA000002242123000610
表示第u笔笔画和第v笔笔画的左右位置关系,
Figure FSA000002242123000611
表示第u笔笔画和第v笔笔画的上下位置关系,表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
从模板汉字的笔画时空关系矩阵R′N×N中找出与书写汉字的笔画时空关系矩阵RN×N不同的元素,根据这些不同的元素得到书写顺序不正确的笔画对应的模板正确笔画qf,f=1,2,...,t,将模板正确笔画qf构成一个序列{q1,q2,...,qt},设序列{q1,q2,...,qt}对应一个模板汉字的时空关系子矩阵Dt×t
D t × t = d 11 , d 12 , . . . , d 1 u , . . . , d 1 v , . . . , d 1 t d 21 , d 22 , . . . , d 2 u , . . . , d 2 v , . . . , d 2 t . . . . . . . . . . . . . . . . . . . . . . . . . d u 1 , d u 2 , . . . , d uu , . . . , d uv , . . . , d ut . . . . . . . . . . . . . . . . . . . . . . . . . d v 1 , d v 2 , . . . , d vu , . . . . , d vv , . . . , d vt . . . . . . . . . . . . . . . . . . . . . . . . . d t 1 , d t 2 , . . . , d tu , . . . . . , d tv , . . . , d tt
该笔画时空关系矩阵Dt×t中的元素duv为元素duv(α,β,γ)的简写,元素duv(α,β,γ)表示第u笔笔画和第v笔笔画的位置关系;duv(α,β,γ)包括duv(α)、duv(β)、duv(γ),其中,duv(α)表示第u笔笔画和第v笔笔画的左右位置关系,duv(β)表示第u笔笔画和第v笔笔画的上下位置关系,duv(γ)表示第u笔笔画和第v笔笔画的正反向交叉位置关系,u=1,2,...,t,v=1,2...,t;
遍历t!个书写汉字的时空关系子矩阵
Figure FSA00000224212300072
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure FSA00000224212300073
最接近的时空关系子矩阵对应书写顺序不正确笔画qe构成的序列{q1,q2,...,qt}进行全排列时的第g个排列序列,得出序列{q1,q2,...,qt}进行全排列时的第g个排列序列为正确的笔画书写顺序,实现书写顺序不正确的笔画还原为书写顺序正确的笔画。
6.根据权利要求5所述的一种书写汉字笔顺正确性检测及还原的装置,其特征在于:
所述预处理装置进一步用于获取轨迹关键点和向量笔画段;采用道格拉斯-普克算法对书写汉字的每笔笔画进行矢量数据压缩,得到每笔笔画的轨迹关键点;每笔笔画的前后两个相邻的轨迹关键点构成一个向量笔画段;
所述笔画时空关系矩阵生成装置进一步用于识别位置关系;所述元素rij(α,β,γ)表示的第i笔笔画和第j笔笔画的位置关系的识别过程如下:
如果第i笔笔画和第j笔笔画交叉,rij(α)赋值rij(0),rij(β)赋值rij(0);获取第i笔笔画的交叉的向量笔画段和第j笔笔画的交叉的向量笔画段,以交点为圆心,顺时针方向旋转第i笔笔画的交叉的向量笔画段;如果第i笔笔画的交叉的向量笔画段旋转到与第j笔笔画的交叉的向量笔画段方向一致时,旋转角度θ不大于180度,识别出第i笔笔画和第j笔笔画为正向交叉位置关系,rij(γ)赋值rij(+z),否则,识别出第i笔笔画和第j笔笔画为反向交叉位置关系,rij(γ)赋值rij(-z);
如果第i笔笔画和第j笔笔画不交叉,rij(γ)赋值rij(0);根据第i笔笔画的轨迹关键点计算第i笔笔画的质心坐标,根据第j笔笔画的轨迹关键点计算第j笔笔画的质心坐标;如果第i笔笔画的质心坐标的横坐标小于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的左边,rij(α)赋值rij(-x),如果第i笔笔画的质心坐标的横坐标大于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画位于第j笔笔画的右边,rij(α)赋值rij(+x),如果第i笔笔画的质心坐标的横坐标等于第j笔笔画的质心坐标的横坐标,识别出第i笔笔画与第j笔笔画的不存在左右位置关系,rij(α)赋值rij(0);如果第i笔笔画的质心坐标的纵坐标小于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的下边,rij(β)赋值rij(-y),如果第i笔笔画的质心坐标的纵坐标大于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画位于第j笔笔画的上边,rij(β)赋值rij(+y),如果第i笔笔画的质心坐标的纵坐标等于第j笔笔画的质心坐标的纵坐标,识别出第i笔笔画与第j笔笔画的不存在上下位置关系,rij(β)赋值rij(0)。
7.根据权利要求6所述的一种书写汉字笔顺正确性检测及还原的装置,其特征在于:所述x=1,y=2,z=3。
8.根据权利要求5至7任意一项所述的一种书写汉字笔顺正确性检测及还原的装置,其特征在于:
所述笔顺正确性还原装置进一步用于找出最接近的时空关系子矩阵;所述遍历t!个书写汉字的时空关系子矩阵
Figure FSA00000224212300091
找出与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure FSA00000224212300092
具体过程包括:
设Lk为Dt×t
Figure FSA00000224212300093
之间的距离:
Figure FSA00000224212300094
其中,当duv(γ)≠0或
Figure FSA00000224212300095
时:
l k ( u , v ) = 2 if d uv ( γ ) ≠ b uv k ( γ ) 0 if d uv ( γ ) = b uv k ( γ )
当duv(γ)=0且
Figure FSA00000224212300097
时:
l k ( u , v ) = 2 if d uv ( α ) ≠ b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 1 if d uv ( α ) ≠ v uv k ( α ) and d uv ( β ) = b uv k ( β ) 1 if d uv ( α ) = b uv k ( α ) and d uv ( β ) ≠ b uv k ( β ) 0 if d uv ( α ) = b uv k ( α ) and d uv ( β ) = b uv k ( β )
第k个Lk对应第k个书写汉字的时空关系子矩阵
Figure FSA00000224212300099
遍历t!个书写汉字的时空关系子矩阵
Figure FSA000002242123000910
计算Lk;获得最小值的Lg,最小值的Lg对应时空关系子矩阵
Figure FSA000002242123000911
该时空关系子矩阵
Figure FSA000002242123000912
为与模板汉字的时空关系子矩阵Dt×t最接近的时空关系子矩阵
Figure FSA000002242123000913
CN 201010250202 2010-08-10 2010-08-10 书写汉字笔顺正确性检测及还原的方法和装置 Active CN102375994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010250202 CN102375994B (zh) 2010-08-10 2010-08-10 书写汉字笔顺正确性检测及还原的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010250202 CN102375994B (zh) 2010-08-10 2010-08-10 书写汉字笔顺正确性检测及还原的方法和装置

Publications (2)

Publication Number Publication Date
CN102375994A true CN102375994A (zh) 2012-03-14
CN102375994B CN102375994B (zh) 2013-05-29

Family

ID=45794571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010250202 Active CN102375994B (zh) 2010-08-10 2010-08-10 书写汉字笔顺正确性检测及还原的方法和装置

Country Status (1)

Country Link
CN (1) CN102375994B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063723A (zh) * 2014-06-25 2014-09-24 北京语言大学 脱机手写汉字的笔画还原方法及装置
CN104156725A (zh) * 2014-08-14 2014-11-19 电子科技大学 一种新的基于笔画段间角度的汉字笔画组合方法
CN104408397A (zh) * 2014-09-25 2015-03-11 祁亨年 汉字书写笔画间关系规范性描述与评判方法及装置
CN110490157A (zh) * 2019-08-23 2019-11-22 安徽淘云科技有限公司 文字评估方法、文字学习方法、装置、设备及存储介质
CN113627260A (zh) * 2021-07-12 2021-11-09 科大讯飞股份有限公司 识别手写汉字的笔顺的方法、系统和计算设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3360513B2 (ja) * 1996-01-16 2002-12-24 三菱電機株式会社 オンライン文字認識方法およびオンライン文字認識装置
CN1474351A (zh) * 2002-08-06 2004-02-11 北京理工大学 一种基于结构模型的汉字识别方法
CN1641686A (zh) * 2004-01-17 2005-07-20 中国科学院计算技术研究所 乱笔顺库建立方法及联机手写汉字识别评测系统
CN101369382A (zh) * 2007-08-17 2009-02-18 英业达股份有限公司 汉字书写验证系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3360513B2 (ja) * 1996-01-16 2002-12-24 三菱電機株式会社 オンライン文字認識方法およびオンライン文字認識装置
CN1474351A (zh) * 2002-08-06 2004-02-11 北京理工大学 一种基于结构模型的汉字识别方法
CN1641686A (zh) * 2004-01-17 2005-07-20 中国科学院计算技术研究所 乱笔顺库建立方法及联机手写汉字识别评测系统
CN101369382A (zh) * 2007-08-17 2009-02-18 英业达股份有限公司 汉字书写验证系统及方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063723A (zh) * 2014-06-25 2014-09-24 北京语言大学 脱机手写汉字的笔画还原方法及装置
CN104063723B (zh) * 2014-06-25 2017-06-06 北京语言大学 脱机手写汉字的笔画还原方法及装置
CN104156725A (zh) * 2014-08-14 2014-11-19 电子科技大学 一种新的基于笔画段间角度的汉字笔画组合方法
CN104156725B (zh) * 2014-08-14 2017-05-10 电子科技大学 一种新的基于笔画段间角度的汉字笔画组合方法
CN104408397A (zh) * 2014-09-25 2015-03-11 祁亨年 汉字书写笔画间关系规范性描述与评判方法及装置
CN104408397B (zh) * 2014-09-25 2018-05-01 祁亨年 汉字书写笔画间关系规范性描述与评判方法及装置
CN110490157A (zh) * 2019-08-23 2019-11-22 安徽淘云科技有限公司 文字评估方法、文字学习方法、装置、设备及存储介质
CN110490157B (zh) * 2019-08-23 2022-04-29 安徽淘云科技股份有限公司 文字评估方法、文字学习方法、装置、设备及存储介质
CN113627260A (zh) * 2021-07-12 2021-11-09 科大讯飞股份有限公司 识别手写汉字的笔顺的方法、系统和计算设备

Also Published As

Publication number Publication date
CN102375994B (zh) 2013-05-29

Similar Documents

Publication Publication Date Title
CN102542264B (zh) 基于数字手写设备的汉字书写正误自动评测方法和装置
CN103390358B (zh) 对电子设备的字符书写操作进行规范性判断的方法及装置
CN102375994B (zh) 书写汉字笔顺正确性检测及还原的方法和装置
CN110414477B (zh) 图像比例尺检测方法及装置
CN107622271B (zh) 手写文本行提取方法及系统
CN103164701B (zh) 手写体数字识别方法及装置
CN101981583A (zh) 用于识别手绘表格的方法和工具
JP5600696B2 (ja) 筆記漢字判定システム、及び筆記漢字判定プログラム
CN102364426A (zh) 一种具有自学功能的绘画书写方法
JP6877446B2 (ja) 多重オブジェクト構造を認識するためのシステムおよび方法
CN109086336A (zh) 试卷数据存储方法、装置及电子设备
CN105787522A (zh) 基于手写笔迹的书写态度评价方法及系统
CN104063723A (zh) 脱机手写汉字的笔画还原方法及装置
CN102063620A (zh) 一种手写识别方法、系统及手写识别终端
CN108334270A (zh) 触摸屏手写输入呈现为具有型笔特征笔迹的方法
CN102663454A (zh) 一种字符书写规范度评测的方法和装置
CN106155540A (zh) 电子毛笔笔形处理方法和装置
Sanguansat Robust and low-cost Optical Mark Recognition for automated data entry
CN103257810A (zh) 手写数学公式识别方法及装置
Garg et al. The segmentation of half characters in Handwritten Hindi Text
CN116758786A (zh) 书法测评方法、装置、计算机设备及介质
WO2021143058A1 (zh) 基于图像的信息比对方法、装置、电子设备及计算机可读存储介质
CN104951810A (zh) 一种信号处理装置
CN109147469B (zh) 一种书法练习方法
CN103186777A (zh) 基于非负矩阵分解的人体检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: QI HENGNIAN

Free format text: FORMER OWNER: GUANGDONG KSENSE INFORMATION TECHNOLOGY CO., LTD.

Effective date: 20141216

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 510663 GUANGZHOU, GUANGDONG PROVINCE TO: 311300 HANGZHOU, ZHEJIANG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20141216

Address after: Hangzhou City, Zhejiang Province, Ling'an City, 311300 Ring Road, Lin Shui Shan Ju

Patentee after: Qi Hengnian

Address before: 510663 Guangdong city of Guangzhou province Tianhe District No. 1023 room first first Pu Lu

Patentee before: Guangdong Ksense Information Technology Co., Ltd.