CN111652032A - 在线笔迹认证中一种笔迹布局特征的提取及认证方法 - Google Patents

在线笔迹认证中一种笔迹布局特征的提取及认证方法 Download PDF

Info

Publication number
CN111652032A
CN111652032A CN201911224773.7A CN201911224773A CN111652032A CN 111652032 A CN111652032 A CN 111652032A CN 201911224773 A CN201911224773 A CN 201911224773A CN 111652032 A CN111652032 A CN 111652032A
Authority
CN
China
Prior art keywords
stroke
handwriting
strokes
sample
layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911224773.7A
Other languages
English (en)
Other versions
CN111652032B (zh
Inventor
邹杰
王春枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN201911224773.7A priority Critical patent/CN111652032B/zh
Publication of CN111652032A publication Critical patent/CN111652032A/zh
Application granted granted Critical
Publication of CN111652032B publication Critical patent/CN111652032B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明公开了在线笔迹认证中一种笔迹布局特征的提取及认证方法,包括如下步骤:手写笔迹笔画布局特征预学习,收集手写笔迹样本,提取笔画布局特征,估算特征在人群中出现的联合概率密度函数;笔画布局特征注册,统计笔画布局特征在注册手写笔迹样本集合中的最大、最小值并依此找出稳定的布局特征;笔画布局特征认证,提取待认证用户提交的测试手写笔迹笔画布局特征,计算稳定且一致笔画布局特征组合在人群中出现的概率,作为进一步判别的依据。本发明在线笔迹认证中一种笔迹布局特征的提取及认证方法,能有效提取出那些处于局部的细小书写动作和习惯,并估算稳定且一致笔画布局特征在人群中出现的概率。

Description

在线笔迹认证中一种笔迹布局特征的提取及认证方法
技术领域
本发明涉及信息安全领域,具体涉及在线笔迹认证中一种笔迹布局特征的提取及认证方法。
背景技术
在线笔迹认证是指利用专门输入设备在线获取用户的手写笔迹,经比较其中所蕰涵的个性化特征从而实现用户身份鉴别的一项技术。
所谓笔迹布局特征是指笔迹中各个笔画间位置远近和笔画长短的关系,就是书写好的汉字笔迹所呈现出来的样子。笔迹学研究发现,书写习惯一旦成形,笔迹外在的呈现形式即固定下来,且各具特色。由于表现形式的外在直观性,笔迹字形、布局特征是用来判别书写人是否同一的首选依据,因此布局特征的提取在笔迹认证中具有重要意义。
与人类强大感知能力不同,机器在布局特征提取上要困难许多。我们生活在一个三维的物理空间。千百万年的进化使得我们人类拥有完美的空间方位感知能力,我们能快速感知到物体之间位置和形状上的细微变化。在笔迹鉴别方面,这种与生俱来的东西赋予我们绝佳的笔迹布局特征提取能力。摹仿一段笔迹,首先得通过我们这种感知能力这一关。得益于我们的天赋,即使没有经过专门训练的普通人仅凭直觉就能准确地区分哪些是摹仿笔迹。很自然地,在笔迹自动鉴别领域,我们希望赋予给机器同样的能力。
与人脑所处理笔迹信息不同,机器面对的是经过采样得到的一组笔尖运动轨迹有序点集合。让机器感知笔迹布局特征的基础是自动识别出笔迹中各段笔画的类型,然后才能计算和比较同类型笔画之间的远近和长短关系。目前的笔迹布局特征提取主要是基于笔迹匹配算法的,这样做存在两个问题:1)匹配算法仅比较两个笔迹之间的笔画对应关系,而布局特征关注的是所有具有相同笔画类型的笔画之间的关系,如果直接采用匹配算法,那么在大规模数据集上,计算所有两两笔迹在时间上的开销是难以承受的;2)由于书写的随意性,匹配算法的正确性难以保证。
除此之外,不同于指纹,笔迹特征不完全相同,即使自来同一书写者前后两次不同的书写也不完全相同。笔画特征的同一是统计意义上的同一。因此,我们必须采用统计方法来对笔迹的布局特征进行度量并做出同一性判别,统计方法的有效性依赖于同质对象上的数据规模,因此,笔画识别是笔迹布局特征提取绕不开的前提。
发明内容
本发明的目的就是针对上述技术的不足,提供在线笔迹认证中一种笔迹布局特征的提取及认证方法,能够克服笔迹两两匹配的巨额时间开销,有效提取大规模笔迹的笔画布局特征,基于布局特征在人群中的统计特征来提高认证系统的准确性和泛化能力。
为实现上述目的,本发明所设计的在线笔迹认证中一种笔迹布局特征的提取及认证方法,包括如下步骤:
A)手写笔迹笔画布局特征预学习:收集人群关于标准汉字c的大量的手写笔迹样本,基于笔画识别算法识别所有预学习手写笔迹样本中的笔画类型;然后提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征;以所识别的笔画类型为对象,分析各种笔画布局特征在人群中出现的统计特征,对笔画布局的离散型特征,包括笔画类型、两两笔画相交的次数特征,统计这类特征在人群中出现的分布律;对笔画布局的连续型特征,包括交叉点的位置特征、两两笔画间的布局特征,估算这些特征在人群中出现的联合概率密度函数;
所述手写笔迹样本是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述每段笔画的布局特征是指笔迹中某一段笔画的方位角、包含该笔画的面积最小矩形的长度和宽度、笔画在书写平面中的位置特征,所述两两笔画之间的布局特征是指笔迹中任意两段笔画之间的其中一段笔画的起止点、交叉点相对另一段笔画的长度、夹角、重心距离特征;
所述笔画的布局特征包括笔迹中所包含的所有笔画、笔画的起点和终点的位置、笔画之间的交叉点位置、笔迹中所有单笔画的布局特征、笔迹中所有两两笔画之间的布局特征;
所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字 c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
所述识别手写笔迹中的笔画类型是指建立手写笔迹中笔画与标准汉字中笔画的对应关系;
B)笔画布局特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,设若干所述注册手写笔迹样本组成注册手写笔迹样本集合,识别所有注册手写笔迹样本中的笔画类型,按所识别的笔画类型,提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征,统计笔画布局特征中各种离散型特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画布局特征中各种连续型特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画布局特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,识别测试手写笔迹样本中的笔画类型,按所识别的笔画类型,统计测试手写笔迹样本中出现和未出现的笔画类型,统计两两笔画之间出现和未出现的交叉点,提取所有具有相同笔画类型的各种单笔画布局特征以及两两笔画间的布局特征,找出注册手写笔迹样本中稳定且一致的各种笔画布局特征,依据在手写笔迹笔画布局特征预学习阶段计算得到的关于标准汉字c所有各种笔画布局特征在人群中的统计特征,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画布局特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画书写动态特征、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画布局特征包括离散型稳定且一致笔画布局特征和连续型稳定且一致笔画布局特征;
所述离散型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的离散型笔画布局特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画布局特征取值是相同的,所述稳定的离散型笔画布局特征是指具有相同离散型笔画布局特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的连续型笔画布局特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画布局特征取值的最大最小值之间,所述稳定的连续型笔画布局特征是指在注册手写笔迹样本集合上提取的连续型笔画布局特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。
优选地,所述步骤A)中,手写笔迹笔画布局特征预学习包括如下步骤:
A1)特征预学习开始:设S={s1,s2,...,sN}表示海量的足够多书写者手写的关于标准汉字c的笔迹样本集合,每位书写者提供1至3个样本,设T={t1,t2,...,tO}表示标准汉字c包含的所有基本笔画集合,O表示标准汉字c所包含的基本笔画数;所述足够多是指集合S中的手写笔迹样本所包含的笔画布局特征具有广泛的代表性,涵盖了手写汉字c 各种笔画布局特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在预训练样本集S中出现的次数计数变量nj=0,1≤j≤O,置标准汉字c的第j段笔画在预训练样本集S中未出现的次数计数变量
Figure RE-GDA0002471295940000051
1≤j≤O,置同时包含两段特定笔画类型的统计量N1O×O=0O×O,其中矩阵元素n1kj表示预训练样本集S中同时包含两段笔画被分别识别为第k段和第j 段笔画类型的预训练笔迹样本个数,1≤k≤O,1≤j≤O,置笔画相交统计矩阵和未相交统计矩阵RO×O=0O×O
Figure RE-GDA0002471295940000052
其中rij表示在预训练样本集S中具有这种特性的笔迹样本个数,
Figure RE-GDA0002471295940000053
表示预训练样本集S 中不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交,初始化总体被识别为第k段类型的单笔画布局特征集合GF1k为空,k=1,2,...,O,初始化总体两两笔画间的布局特征集合矩阵GF2O×O中每一个元素 GF2kj为空,1≤k≤O,1≤j≤O,其中矩阵的第k行第j列元素GF2kj表示预训练样本集S中被识别为第k段和第j段笔画之间的布局特征集合;
A3)识别第i个预训练样本si的笔画类型,并更新统计量:对预训练样本si按笔画进行分割,得到笔画序列Di={d1,d2,...,dni},识别si中每一段笔画的类型,设
Figure RE-GDA0002471295940000061
表示返回的笔画类型识别结果,其中ok表示预训练样本si中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示si中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在预训练样本si中,则计数变量nk=nk+1,否则,
Figure RE-GDA0002471295940000062
变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成预训练样本si对统计量nk
Figure RE-GDA0002471295940000063
的更新,为了计算交叉点出现频率,更新统计量N1O×O,若预训练样本si中存在两段笔画被分别识别为第k段和第j段笔画类型,则n1kj=n1kj+1,其中n1为矩阵N1O×O第k行第j列元素,按从左到右,从上到下的顺序完成预训练样本si对统计量N1O×O的更新;
A4)预训练样本si中两两笔画交叉点计算:以预训练样本si的笔画序列
Figure RE-GDA0002471295940000064
笔画类型识别结果
Figure RE-GDA0002471295940000065
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到预训练样本 si的两两笔画间交叉点矩阵PO×O,和与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若预训练样本si中被识别为第 k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标, 1≤j≤O,1≤k≤O;
A5)笔画交叉信息的统计量更新:从步骤A4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若预训练样本sk中存在两段笔画被分别识别为第k和第j笔画类型,ptkj=1且pkj=(null,null),那么
Figure RE-GDA0002471295940000071
否则,若pkj≠(null,null),表示相应的两段笔画有相交,rkj=rkj+1,双重循环结束后,完成预训练样本si对统计量矩阵RO×O
Figure RE-GDA0002471295940000072
的更新;
A6)预训练样本si中单个笔画的布局特征计算:以预训练样本si的笔画序列
Figure RE-GDA0002471295940000073
笔画类型识别结果
Figure RE-GDA0002471295940000074
作为输入参数,得到预训练样本si的被识别为第k段笔画类型的笔画布局特征向量F1k,k=1,2,...,O;若预训练样本si中存在笔画被识别为第k段笔画类型,则F1k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F1k=null,1≤k≤O;
A7)单笔画布局特征统计量的更新:将在预训练样本si上得到的各个笔画布局特征向量F1k,k=1,2,...,O添加到相应的总体单笔画布局特征集合中去GF1k,从第一段笔画开始到第O段笔画结束,若 F1k==null,表示预训练样本si中没有笔画被识别为第k段笔画类型,不用更新,否则,GF1k=GF1k∪{F1k},循环结束后,完成对总体单笔画布局特征集合GF1k的更新,k=1,2,...,O;
A8)预训练样本si中两两笔画间的布局特征计算:具体地,以预训练样本si的笔画序列
Figure RE-GDA0002471295940000081
笔画类型识别结果
Figure RE-GDA0002471295940000082
与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,预训练样本si中两两笔画间的交叉点矩阵PO×O作为输入参数,得到预训练样本si的两两笔画间布局特征向量矩阵F2O×O,若预训练样本si中存在两段笔画被识别为第k段和第j段笔画类型,则f2kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f2kj=null,k=1,2,...,O, 1≤j≤O;
A9)两两笔画间布局特征统计量的更新:将在预训练样本si上得到的两两笔画间布局特征向量矩阵F2O×O,添加到相应的总体两两笔画间布局特征集合矩阵中去GF2O×O,从步骤A8)返回的两两笔画间布局特征向量矩阵F2O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F2O×O的第k行第j列元素f2kj,若f2kj≠null,则GF2kj=GF2kj∪{f2kj};否则不用更新该统计量GF2kj;循环结束后,完成对总体两两笔画间布局特征集合GF2kj的更新;
A10)i=i+1,若i≤N,则跳转至步骤A3),否则,则跳转至步骤 A11);
A11)人群中关于标准汉字c的单笔画布局特征联合概率密度函数的估计:以总体单笔画布局特征集合GF1k为训练样本,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段笔画的单笔画布局特征概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;
A12)人群中关于标准汉字c的两两笔画间布局特征联合概率密度函数的估计:对总体两两笔画间布局特征集合矩阵GF2O×O中的每一个元素GF2kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合
Figure RE-GDA0002471295940000091
子集
Figure RE-GDA0002471295940000092
表示集合GF2kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合
Figure RE-GDA0002471295940000093
具有以下特性:1)
Figure RE-GDA0002471295940000094
2)当u≠v时,
Figure RE-GDA0002471295940000095
统计每一个矩阵位置关系类别出现的频率
Figure RE-GDA0002471295940000096
其中
Figure RE-GDA0002471295940000097
表示集合
Figure RE-GDA0002471295940000098
中元素的个数,
Figure RE-GDA0002471295940000099
1≤u≤N1;最后,在每一个特征向量子集
Figure RE-GDA00024712959400000910
上,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段和第j段笔画之间矩阵位置关系类型为u的两两笔画布局特征概率密度函数
Figure RE-GDA00024712959400000911
1≤u≤N1;采用相同的方法,从集合矩阵GF2O×O的第1行第1列元素开始,按从左到右,从上到下的顺序,对矩阵中每一个元素GF2kj做同样的操作, 1≤k≤O,1≤j≤O,得到相应的两两笔画布局特征概率密度函数
Figure RE-GDA0002471295940000101
1≤u≤N1,1≤k≤O,1≤j≤O;
A13)结束:关于标准汉字c的预训练过程结束,返回的数据包括:1)标准汉字c的第k段类型笔画在人群中出现和未出现的频率 nk/N和
Figure RE-GDA0002471295940000102
1≤k≤O;2)人群书写关于标准汉字c的手写笔迹中两两类型笔画相交和未相交笔迹出现的频率ri×j/n1ij
Figure RE-GDA0002471295940000103
1≤i≤O,1≤j≤O; 3)人群书写的标准汉字c的第k段类型笔画的单笔画布局特征联合概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;4)预训练手写笔迹样本集合中具有该特性的样本个数
Figure RE-GDA0002471295940000104
1≤u≤N1,1≤k≤O, 1≤j≤O;5)人群书写的关于标准汉字c的具有该特性的两两笔画类型布局特征联合概率密度函数
Figure RE-GDA0002471295940000105
1≤u≤N1,1≤k≤O,1≤j≤O;所述具有该特性是指预学习手写笔迹样本中存在笔画被识别为第k和第j段笔画类型,且包含该两段类型笔画的面积最小的两矩形位置关系类型为u;
优选地,所述步骤B)中,笔画布局特征注册包括如下步骤:
B1)注册开始:用户提交关于标准汉字c的注册手写笔迹样本集合H={h1,h2,...,hp},p≥3
B2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中出现的次数计数变量Ej=0,1≤j≤O,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中未出现的次数计数变量
Figure RE-GDA0002471295940000106
1≤j≤O,置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵VO×O=0O×O
Figure RE-GDA0002471295940000107
其中vij
Figure RE-GDA0002471295940000108
分别表示在手写笔迹样本集合H中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中有被识别为标准汉字c的第i和第j段的两段笔画且这两段笔画相交;初始化集合H中被识别为第k段类型的单笔画布局特征集合GF3k为空,k=1,2,...,O,初始化集合H中两两笔画间的布局特征集合矩阵GF4O×O中每一个元素GF4kj为空,1≤k≤O, 1≤j≤O,其中矩阵的第k行第j列元素GF4kj表示被识别为第k段和第 j段笔画之间的布局特征集合,O表示汉字c标准书写体所包含的基本笔画数;
B3)识别第i个注册样本hi的笔画类型:对注册样本hi按笔画进行分割,得到笔画序列
Figure RE-GDA0002471295940000111
识别hi中每一段笔画的类型,设
Figure RE-GDA0002471295940000112
表示返回的笔画类型识别结果,其中ok表示注册样本hi中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示hi中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在注册样本hi中,则计数变量Ek=Ek+1,否则,
Figure RE-GDA0002471295940000113
变量k 从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成注册样本hi对统计量Ek
Figure RE-GDA0002471295940000114
的更新;
B4)注册样本hi中两两笔画交叉点计算:以注册样本hi的笔画序列
Figure RE-GDA0002471295940000115
笔画类型识别结果
Figure RE-GDA0002471295940000116
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到注册样本hi的两两笔画间交叉点矩阵PO×O,和与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若注册样本hi中被识别为第k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素 ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标,1≤j≤O, 1≤k≤O;
B5)笔画相交信息的统计量更新:从B4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若注册样本hi中存在笔画被识别为第k和第 j笔画类型,且ptkj==1和pkj=(null,null),那么
Figure RE-GDA0002471295940000121
否则,若 pkj≠(null,null),表示相应的两段笔画有相交,vkj=vkj+1,双重循环结束后,完成注册样本hi对统计量矩阵VO×O
Figure RE-GDA0002471295940000122
的更新;
B6)注册样本hi中单个笔画的布局特征计算:以注册样本hi的笔画序列
Figure RE-GDA0002471295940000123
笔画类型识别结果
Figure RE-GDA0002471295940000124
作为输入参数,得到注册样本hi的被识别为第k段笔画类型的笔画布局特征向量 F3k,k=1,2,...,O;若注册样本hi中存在笔画被识别为第k段笔画类型,则F3k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F3k=null,1≤k≤O;
B7)单笔画布局特征统计量的更新:将在注册样本hi上得到的各个笔画布局特征向量F3k,k=1,2,...,O添加到相应的关于注册笔迹样本集H的单笔画布局特征集合中去GF3k,从第一段笔画开始到第O段笔画结束,若F3k==null,表示注册样本hi中没有笔画被识别为第k段笔画类型,不用更新,否则,GF3k=GF3k∪{F3k},循环结束后,完成关于注册笔迹样本集H的单笔画布局特征集合GF3k的更新,k=1,2,...,O;
B8)注册样本hi中两两笔画间的布局特征计算:以注册样本hi的笔画序列
Figure RE-GDA0002471295940000131
笔画类型识别结果
Figure RE-GDA0002471295940000132
与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,注册样本hi中两两笔画间的交叉点矩阵PO×O为输入参数,得到注册样本hi的两两笔画间布局特征向量矩阵F4O×O;若注册样本hi中存在两段笔画被识别为第k段和第j段笔画类型,则
Figure RE-GDA0002471295940000133
否则,
Figure RE-GDA0002471295940000134
k=1,2,...,O, 1≤j≤O;
B9)两两笔画间布局特征统计量的更新:将在注册样本hi上得到的两两笔画间布局特征向量矩阵F4O×O,添加到相应的关于注册笔迹样本集H的两两笔画间布局特征集合矩阵中去GF4O×O;从步骤B8) 返回的两两笔画间布局特征向量矩阵F4O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F4O×O的第k行第j列元素f4kj,若f4kj≠null,则GF4kj=GF4kj∪{f4kj};否则不用更新该统计量GF4kj;循环结束后,完成关于注册笔迹样本集H的两两笔画间布局特征集合 GF4O×O的更新;
B10)i=i+1,若i≤p,则跳转至步骤B3),否则,则跳转至步骤 B11);
B11)注册笔迹样本集H关于标准汉字c的单笔画布局特征在各个分量上的最大最小值:对于集合GF3k,GF3k表示以注册笔迹样本集H中由所有被识别为第k段类型笔画的单笔画布局特征构成的集合,计算单笔画布局特征的每一个分量在集合GF3k上的最大最小值,1≤k≤O;如果集合GF3k中元素个数小于2,那么最大最小值集合 MF3k=null,否则用
Figure RE-GDA0002471295940000141
表示所求得的每个分量上的最大最小值集合,其中
Figure RE-GDA0002471295940000142
表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量在注册笔迹样本集H 上的最大值,
Figure RE-GDA0002471295940000143
表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量的最小值,1≤u≤N2,1≤k≤O,N2表示单笔画布局特征向量中分量的个数,此步骤结束后,得到注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合
Figure RE-GDA0002471295940000144
1≤k≤O;
B12)注册笔迹样本集H关于标准汉字c的两两笔画间布局特征在各个分量上的最大最小值:对注册笔迹样本集H上两两笔画间布局特征集合矩阵GF4O×O中的每一个元素GF4kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合
Figure RE-GDA0002471295940000145
子集
Figure RE-GDA0002471295940000146
表示集合GF4kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合
Figure RE-GDA0002471295940000147
具有以下特性:1)
Figure RE-GDA0002471295940000148
2)当u≠v时,
Figure RE-GDA0002471295940000149
统计每一个矩阵位置关系类别出现的次数,设
Figure RE-GDA00024712959400001410
表示集合
Figure RE-GDA00024712959400001411
中元素的个数;对于集合
Figure RE-GDA00024712959400001412
Figure RE-GDA00024712959400001413
那么
Figure RE-GDA00024712959400001414
否则,计算两两笔画间布局特征的每一个分量在集合
Figure RE-GDA0002471295940000151
上的最大最小值, 1≤u≤N1,设
Figure RE-GDA0002471295940000152
表示所求得的每个分量上的最大最小值集合,其中
Figure RE-GDA0002471295940000153
表示被识别为第 k和第j段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最大值,
Figure RE-GDA0002471295940000154
表示被识别为第k和第j 段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最小值,1≤u≤N1,1≤v≤N4,1≤k≤O,1≤j≤O, N4表示单笔画布局特征向量中分量的个数;
B13)结束:关于标准汉字c的注册过程结束,返回的数据包括: 1)第k段笔画在注册笔迹样本集H中出现和未出现的次数Ek
Figure RE-GDA0002471295940000155
2) 笔画相交点在注册笔迹样本集H中出现和未出现的次数矩阵vkj
Figure RE-GDA0002471295940000156
1≤k≤O,1≤j≤O;3)注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合
Figure RE-GDA0002471295940000157
1≤k≤O,其中,N2表示单笔画布局特征向量中分量的个数;4)具有特定性质的注册笔迹样本个数
Figure RE-GDA0002471295940000158
1≤u≤N1,1≤k≤O,1≤j≤O,所述具有特定性质的注册样本是指:a)来自于注册笔迹样本集H;b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画;c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为u;5)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值
Figure RE-GDA0002471295940000159
1≤u≤N1,1≤k≤O, 1≤j≤O。
优选地,所述步骤C)中,笔画布局特征认证包括如下步骤:
C1)认证阶段开始:用户输入关于标准汉字c的测试手写笔迹样本W;
C2)初始化:置标准汉字c的第j段笔画在测试手写笔迹样本W中出现的次数计数变量yj=0,1≤j≤O,置标准汉字c的第j段笔画在测试手写笔迹样本W中未出现的次数计数变量
Figure RE-GDA0002471295940000161
1≤j≤O,置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵ZO×O=0O×O
Figure RE-GDA0002471295940000162
其中zij
Figure RE-GDA0002471295940000163
分别表示在测试手写笔迹样本W中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交;
Figure RE-GDA0002471295940000164
1≤j≤O,1≤i≤O;
C3)识别测试手写笔迹样本W的笔画类型,并更新统计量:对测试手写笔迹样本W按笔画进行分割,得到笔画序列
Figure RE-GDA0002471295940000165
识别笔迹W中每一段笔画的类型,设
Figure RE-GDA0002471295940000166
表示返回的笔画类型识别结果,其中ok表示测试手写笔迹样本W中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,nw表示W中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在测试手写笔迹样本W中,则计数变量yk=yk+1,否则,
Figure RE-GDA0002471295940000167
变量k从标准汉字 c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成测试手写笔迹样本W对统计量yk
Figure RE-GDA0002471295940000168
的更新;
C4)测试手写笔迹样本W中两两笔画交叉点计算:以测试手写笔迹样本W的笔画序列
Figure RE-GDA0002471295940000169
笔画类型识别结果
Figure RE-GDA00024712959400001610
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间交叉点矩阵QO×O,和与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk, k=1,2,...,O;若测试手写笔迹样本W中被识别为第k段和第j段笔画不相交,那么交叉点矩阵QO×O中元素qtkj=0,交叉点集合Xk和Xj中交叉点qkj=(null,null)和qjk=(null,null);否则,交叉点矩阵QO×O中元素qtkj=1,交叉点集合Xk和Xj中交叉点qkj和qjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
C5)笔画交叉信息的统计量更新:从步骤C4)返回的两两笔画间交叉点矩阵QO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取QO×O的元素,若qkj=(null,null),表示测试手写笔迹样本W中被识别为第k和第j笔画类型的两段笔画没有相交,那么
Figure RE-GDA0002471295940000171
否则,表示相应的两段笔画有相交,zkj=zkj+1,双重循环结束后,完成测试手写笔迹样本W对统计量矩阵ZO×O
Figure RE-GDA0002471295940000172
的更新;
C6)测试手写笔迹样本W中单个笔画的布局特征计算:以测试手写笔迹样本W的笔画序列
Figure RE-GDA0002471295940000173
笔画类型识别结果
Figure RE-GDA0002471295940000174
作为输入参数,得到测试手写笔迹样本W的被识别为第k段笔画类型的笔画布局特征向量F5k,1≤k≤O;若测试手写笔迹样本W中存在笔画被识别为第k段笔画类型,则 F5k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F5k=null,1≤k≤O;
C7)测试手写笔迹样本W中两两笔画间的布局特征计算:以测试手写笔迹样本W的笔画序列
Figure RE-GDA0002471295940000175
笔画类型识别结果
Figure RE-GDA0002471295940000176
与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk,k=1,2,...,O,测试手写笔迹样本W中两两笔画间的交叉点矩阵QO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间布局特征向量矩阵F6O×O;若测试手写笔迹样本W中中存在两段笔画被识别为第k段和第j段笔画类型,则f6kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f6kj=null,1≤k≤O, 1≤j≤O;
C8)计算观察到测试手写笔迹样本W中各笔画的概率P1:若测试手写笔迹样本W中存在笔画被识别为第k段笔画类型且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段笔画类型,即 yk==1且Ek≥2,那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即p1k=nk/N,否则,若测试手写笔迹样本W中不存在笔画被识别为第k段笔画类型且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中不存在笔画被识别为第k段笔画类型,即
Figure RE-GDA0002471295940000181
Figure RE-GDA0002471295940000182
那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即
Figure RE-GDA0002471295940000183
否则,表明第k段笔画类型在注册笔迹样本和注册笔画迹样本中出现方式不一致,置p1k=1;k=1,2,...,O,最后置
Figure RE-GDA0002471295940000184
C9)计算观察到测试样本笔迹W中交叉点的概率P2:若测试手写笔迹样本W中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画相交,而且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画相交,即zkj==1且vkj≥2,那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即p2kj=rkj/n1kj,否则,若测试手写笔迹样本W中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画不相交,而且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画不相交,即
Figure RE-GDA0002471295940000191
Figure RE-GDA0002471295940000192
那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即
Figure RE-GDA0002471295940000193
否则,表明第k段和第j段笔画类型相交在注册笔迹样本和注册笔画迹样本中出现方式不一致,置p2kj=1,1≤k≤O,1≤j≤O,最后置
Figure RE-GDA0002471295940000194
C10)计算观察到测试样本笔迹W中单个笔画布局特征的概率P3:在注册样本集上,若被识别为第k段笔画类型的单笔画布局特征向量 MF3k==null或者第k段笔画类型在测试样本W中未出现,则置p3k=1, 1≤k≤O,否则,采用下式计算观察到测试手写笔迹中被识别为第k段笔画类型的单笔画布局特征的概率,
Figure RE-GDA0002471295940000195
1≤k≤O,其中f1k(·)表示在预训练阶段学习到的关于标准汉字c被识别为第k 段笔画的单笔画布局特征概率密度函数, F5k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)表示在测试手写笔迹样本W中提取到的被识别为第k段笔画类型的单笔画布局特征向量,积分区域 D=(d1,d2,...,dN2)由如下式所定义,
Figure RE-GDA0002471295940000196
其中vi表示特征向量F5k中第i个分量取值,
Figure RE-GDA0002471295940000197
Figure RE-GDA0002471295940000198
分别表示在注册阶段获取的在注册样本集合中所有被识别为第k段类型笔画的单笔画布局特征向量在第i个分量上的最大最小值,N2表示单笔画布局特征向量中分量的个数,变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,得到观测到所有笔画类型的概率p3k,1≤k≤O,最后,置观察到测试样本笔迹W中所有单个笔画布局特征的概率
Figure RE-GDA0002471295940000201
C11)计算观察到测试样本笔迹W中所有两两笔画间布局特征的概率矩阵PEO×O:以如下4种数据作为输入参数:1)测试手写笔迹样本W中两两笔画间的布局特征矩阵F6O×O,2)注册阶段获取的注册笔迹样本子集个数
Figure RE-GDA0002471295940000202
1≤u≤N1,1≤k≤O,1≤j≤O,3)注册阶段获取的注册笔迹样本集关于笔画间布局特征在每个分量上的最大最小值
Figure RE-GDA0002471295940000203
1≤u≤N1, 1≤k≤O,1≤j≤O,4)预训练阶段获取的标准汉字c关于两两笔画布局特征概率密度函数
Figure RE-GDA0002471295940000204
1≤u≤N1, 1≤k≤O,1≤j≤O,得到观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率, 1≤k≤O,1≤k≤O;
C12)计算观察到测试样本笔迹W中两两笔画间布局特征的概率 P4:以测试笔迹样本W中的笔画作为结点集V,以概率矩阵PEO×O中的元素作为连接结点的无向边的权值E,得到一个无向带权图 G=<V,E>,从图G出发,构造一个关于图G的最小生成树G'=<V,E'>,根据G'得到测试样本笔迹W中两两笔画间布局特征的概率
Figure RE-GDA0002471295940000205
C13)计算观察到测试样本笔迹W的布局特征概率P(W)=P1×P2×P3×P4;
C14)测试笔画与布局特征相关的判别:将布局特征概率P(W),融合笔画的其它特征,包括笔顺、书写用力、书写节奏,综合判断该测试样本笔迹W是否为真实笔迹;
C15)结束:测试笔迹的认证过程结束。
优选地,单个笔画的布局特征计算包括如下步骤:
D1)开始:设输入参数S={(x1,y1),(x2,y2),...,(xn,yn)}表示笔迹中笔画S 的采样点时序数据,(xi,yi)表示笔画S中在第i个采样时刻笔尖的位置数据,
Figure RE-GDA0002471295940000211
表示笔画S与笔迹中其它笔画的交叉点坐标,其中
Figure RE-GDA0002471295940000212
表示交叉点二维的x,y坐标,下标si表示与S相交的笔画在笔迹中的序号,1≤i≤ms,ms表示Pc中交叉点的个数,与S相交的笔画是由人工标注的在标准书写体中本应出现相交的笔画,若手写体非标准笔迹中第si段笔画与S没有交叉点,那么用符号null表示,
Figure RE-GDA0002471295940000215
1≤i≤ms
D2)计算笔画重心点G=(xg,yg):其中
Figure RE-GDA0002471295940000213
D3)寻找包含笔画S的面积最小的矩形V=(p1,p2,p3,p4):其中 p1,p2,p3,p4是矩形的四个顶点,pi=(pxi,pyi),1≤i≤4,U=(U1,U2,U3,U4)表示矩形V的四条有向边,其中
Figure RE-GDA0002471295940000214
D4)计算矩形V的四条有向边长度:设|U1|=|U3|=a,|U2|=|U4|=b;
D5)计算笔画S的方位角:比较矩形V两条边的长度,若a>b,置W={U1,U3},若a<b,置W={U2,U4},若a=b,W={U1,U2,U3,U4},设 Q表示以笔画S中第一个采样点(x1,y1)为开始点,以最后一个采样点(xn,yn)为结束点的向量,计算向量Q与集合W中每个向量之间的夹角QAngle,0≤QAngle≤180°,计算集合W中与向量Q之间夹角最小的向量,设 Ux为集合W中与向量Q之间夹角最小的向量,计算向量Ux与X轴的夹角,设为Angle,以Angle表示笔画S的方位角,-180°≤Angle≤180°;
D6)选取由矩形V定义的坐标系:以步骤D5)介绍的所述矩形V 中有向线段Ux的起点为新坐标系的原点,以所述矩形V中过该原点且相互垂直的两条边为所选坐标系的轴,规定在所述矩形V的两条相互垂直的两条边中,从原点到所述两条边的另一个顶点的方向为正方向,设所选坐标系的两条相互垂直的坐标轴为(Ux,Uy);
D7)计算采样点序列S={(x1,y1),(x2,y2),...,(xn,yn)}在由(Ux,Uy)构成的坐标系下各种极值点:计算序列S中的采样点在新坐标系(Ux,Uy)的x,y 方向上极大值、极小值对应的点,设pxM,pxm分别表示x方向上极大和极小值,设pyM,pym分别表示y方向上极大和极小值,由四个极值点和笔画的第一个和最后一个点,得到关于笔画的基本点集合 P1={pxM,pxm,pyM,pym,p1,pn},其中p1=(x1,y1),pn=(xn,yn);
D8)计算基本点在新坐标系下的位置坐标:以基本点集合P1和 (Ux,Uy)作为输入参数,得到P1在新坐标下的位置坐标集合 P1U={p1xM,p1xm,p1yM,p1ym,p11,p1n};
D9)计算交叉点Pc在新坐标系下的位置坐标:以基本点集合Pc 和(Ux,Uy)作为输入参数,得到Pc在新坐标下的位置坐标集合
Figure RE-GDA0002471295940000232
D10)结束:返回笔画S的重心、方位角、矩形边长等布局特征取值(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)。
优选地,两两笔画间的布局特征计算包括如下步骤:
E1)开始:两两笔画间的布局特征计算包含的输入参数包括:1) T,S分别表示主笔画和从笔画采样点时间序列,2)
Figure RE-GDA0002471295940000233
表示从笔画S与笔迹中除主笔画T以外的其它笔画交叉点坐标,其中
Figure RE-GDA0002471295940000234
表示交叉点二维的x,y坐标,下标si表示与从笔画S相交的笔画在笔画序列中的序号,1≤i≤ms,si不等于主笔画T在笔画序列中的序号,ms表示Pc中交叉点的个数,与S相交的笔画是由人工标注的在标准书写体中本应出现的,若手写体非标准笔迹中第si段笔画与S没有交叉点,那么用符号null表示,
Figure RE-GDA0002471295940000231
1≤i≤ms,3)主笔画T 与从笔画S的交叉点PT={(PTx,PTy)},若在手写笔迹中主笔画T与从笔画S的没有交叉点,PT={(null,null)},4)包含T,S笔画且面积最小的矩形VT=(pt1,pt2,pt3,pt4),VS=(ps1,ps2,ps3,ps4),其中pt1,pt2,pt3,pt4, ps1,ps2,ps3,ps4分别表示矩形VT、VS的四个顶点,5)由矩形VS定义的坐标系(USx,USy),6)由矩形VT定义的坐标系(UTx,UTy),7)笔画S的重心 GS=(xsg,ysg),8)笔画T的重心GT=(xtg,ytg);
E2)计算笔画T重心与笔画S重心之间的距离DisTS
E3)计算笔画T和笔画S的方位角DispTS:定义向量GTS,向量GTS以笔画T的重心GT=(xtg,ytg)作为起点,以笔画S的重心GS=(xsg,ysg)作为终点,计算向量GTS与书写平面X轴之间的夹角DispTS,以夹角DispTS作为笔画S与笔画T的方位角,-180°≤DispTS≤180°;
E4)计算笔画T和笔画S的夹角AngleTS:计算由矩形VT所定义的坐标系(UTx,UTy)和由矩形VS所定义的坐标系(USx,USy)中两个X坐标轴UTx和USx之间的夹角AngleTS,以AngleTS作为笔画S与笔画T的夹角, -180°≤AngleTS≤180°;
E5)计算矩形VT和VS的位置关系类型:以矩形VT和VS的四个顶点为参数,得到VT和VS的位置关系类型TD
E6)计算矩形VT和VS之间重叠区域的面积R;
E7)计算从笔画采样点序列S={(x1,y1),(x2,y2),...,(xn,yn)}在由(USx,USy) 定义的新坐标系下各种极值点:计算从笔画序列S中的采样点在新坐标系(USx,USy)的x,y方向上极大值、极小值对应的点,设pxM,pxm分别表示x方向上极大和极小值,设pyM,pym分别表示y方向上极大和极小值,由四个极值点和从笔画S的第一个和最后一个采样点,得到关于笔画的基本点集合P1={pxM,pxm,pyM,pym,p1,pn},其中p1=(x1,y1), pn=(xn,yn);
E8)计算从笔画S的基本点在主笔画T定义的新坐标系下的位置坐标:以从笔画S的基本点集合P1和主笔画T定义的新坐标系 (UTx,UTy)作为输入参数,得到从笔画S的基本点集合P1在主笔画T定义的新坐标下的位置坐标集合P1U={p1xM,p1xm,p1yM,p1ym,p11,p1n};
E9)计算从笔画S的交叉点Pc在主笔画T定义的新坐标系下的位置坐标:以从笔画S的交叉点集合Pc和(UTx,UTy)作为输入参数,得到 Pc在主笔画T定义的新坐标下的位置坐标集合
Figure RE-GDA0002471295940000251
所述从笔画S的交叉点是指由人工标注的笔迹中除了主笔画T以外其它所有笔画本应与从笔画S的交叉点,所述本应与从笔画S的交叉点是指依据标准汉字c的表现形式,笔画之间应该出现的交叉点;
E10)计算主笔画T与从笔画S的交叉点PT在主笔画T定义的新坐标系下的位置坐标:以交叉点集合PT和(UTx,UTy)作为输入参数,得到交叉点集合PT在主笔画T定义的新坐标下的位置坐标集合 PTU={(PTxU,PTyU)};
E11)结束:返回主笔画T与从笔画S的距离DisTS,主笔画T与从笔画S的方位角DispTS,主笔画T与从笔画S的夹角AngleTS,VT和VS的位置关系类型TD,矩形VT和VS之间重叠区域的面积R,从笔画S的基本点在主笔画T定义的新坐标系(UTx,UTy)下在坐标集合P1U,从笔画S的交叉点在主笔画T定义的新坐标系(UTx,UTy)下在坐标集合PcU,主笔画 T与从笔画S的交叉点PT在主笔画T定义的新坐标系下的位置坐标 PTU
优选地,人工标注标准汉字两两笔画是否交叉,包括如下步骤:
F1)开始:表示人工标注标准汉字中两两笔画是否相交过程的开始,输入参数为欲人工标注的标准汉字c;
F2)人工标注笔迹中应相交和不应相交的笔画:对于标准汉字c,根据所述标准汉字c的标准表现形式,由人工标注标准汉字c中笔画与笔画之间是否相交叉的信息,得到关于标准汉字c的笔画交叉矩阵;例于标准汉字“王”,其中第一、第二、第三段横笔画与竖笔画均有交叉,横笔画之间没有交叉,因此,得到汉字“王”的笔画交叉方阵
Figure RE-GDA0002471295940000261
因为汉字“王”包含有四个笔画,因此是4×4的方阵,方阵的每一行(列)按从小到大的顺序分别代表“王”字的“横”、“横”、“竖”、“横”四个笔画,方阵c中的元素cij表示“王”字的第i段笔画与第j 段笔画是否有交叉,其中“0”表示没有交叉,“1”表示有交叉;
F3)结束:返回关于标准汉字c的笔画交叉矩阵,标注过程被重复调用执行,得到关于所有标准汉字的笔画交叉矩阵。
优选地,两矩形间位置关系类型的计算包括如下步骤:
G1)开始:输入参数包括包含T,S笔画且面积最小的矩形 VT=(pt1,pt2,pt3,pt4),VS=(ps1,ps2,ps3,ps4),其中pt1,pt2,pt3,pt4,ps1,ps2,ps3,ps4分别表示矩形VT、VS的四个顶点;
G2)对两个矩形的四条边分别进行标记:按x、y方向上的极大极小值,对矩形VT中的四个顶点作如下定义:若x、y方向上的极值唯一,标记pt1为与y极大值对应的顶点,标记pt2为与x极大值对应的顶点,标记pt3为与y极小值对应的顶点,标记pt4为与x极小值对应的顶点,若x、y方向上的极值不唯一,标记pt1为与y极大值和x极小值对应的顶点,标记pt1为与y极大值和x极大值对应的顶点,标记pt3为与y极小值和x极大值对应的顶点,标记pt4为与y极小值和x极小值对应的顶点,进一步,标记矩形VT中的四条边为
Figure RE-GDA0002471295940000262
Figure RE-GDA0002471295940000271
按同样的方法,标记矩形VS中的四个顶点 ps1,ps2,ps3,ps4,然后,标记矩形VS中的四条边为
Figure RE-GDA0002471295940000272
Figure RE-GDA0002471295940000273
G3)计算矩形VT和VS的位置关系类型TD:对于矩形VT的四条边 UT={UA,UB,UC,UD}和矩形VS的四条边US={Ua,Ub,Uc,Ud},分别计算UT中的任意一条边与US中的任意一条边是否相交,若相交,则将由相交的两条边组成的二元组添加到相交边集合中,计算矩形边所有两两边之间是否相交后,得到矩形VT和VS之间的边相交集合Dp,最后,依据Dp查询矩阵位置关系类型表得到矩形VT和VS的位置关系类型TD
所述分属两个矩形的两条边相交是指,若两条边之间没有交点,那么两条边不相交,若两条边之间有交点且所述交点位于其中任意一条边的终点,那么两条边不相交,若两条边之间有交点且所述交点没有位于其中任意一条边的终点,那么两条边相交;
所述矩形边的起点和终点定义如步骤G2)所述;
所述矩阵位置关系类型表是指包含两维信息:1)由所有相交边二元组构成的集合;2)分配给该集合的编号;矩阵位置关系类型表的具体计算过程为:首先收集两个矩形之间所有可能的位置关系,然后,按矩形边是否交相为依据对矩形位置关系进行分类,具有相同相交边二元组集合的两矩形属于同一个位置关系类别,最后,对所有的位置关系类别进行编号,得到矩阵位置关系类型表;在计算阶段,对于待识别位置关系的两矩形,计算所述矩形中由所有相交边二元组构成的集合,依据该集合查表得到两矩形的位置关系类型;
所述相交边二元组的第一个元素表示矩形VT的某一条边,第二个元素表示矩形VS的某一条边,相交边二元组表示分属于矩形VT和VS的这两条边相交;
G4)结束:返回矩形VT和VS的位置关系类型TD
优选地,计算观察到测试笔迹中所有两两笔画间布局特征概率矩阵包括如下步骤:
H1)开始:开始;具体地,观察到测试笔迹中所有两两笔画间布局特征概率的计算过程的开始,输入参数包括:1)关于标准汉字 c的测试手写笔迹样本W中两两笔画间的布局特征矩阵F6O×O,其中若 W中存在被识别为第k和第j段类型的两段笔画,则 fkj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,fkj=null,fkj为矩阵F6O×O中第k行第j列元素,1≤k≤O,1≤j≤O;2)关于标准汉字c的注册手写笔迹样本集H中具有特定性质的注册笔迹样本个数
Figure RE-GDA0002471295940000281
1≤u≤N1, 1≤k≤O,1≤j≤O,其中,O表示标准汉字c包含的基本笔画数,N1表示两矩阵位置关系类型的类别数,所述具有特定性质的注册样本是指:a)来自于注册笔迹样本集H;b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画;c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为u;3)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值
Figure RE-GDA0002471295940000282
1≤u≤N1,1≤k≤O,1≤j≤O, N4表示单笔画布局特征向量中分量的个数;4)标准汉字c关于两两笔画布局特征概率密度函数
Figure RE-GDA0002471295940000283
1≤u≤N1,1≤k≤O,1≤j≤O;
H2)初始化:置观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O=1O×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率, pejk=1,1≤j≤O,1≤k≤O,初始化循环量m=1;
H3)初始化循环量n=1;
H4)若m==n,则跳转到步骤H10),否则,跳转到到步骤H5);
H5)取出测试笔迹中被识别为第m和第n段类型的两段笔画间布局特征fmn,若fmn==null,则跳转到步骤H10),否则,跳转到到步骤 H6);
H6)从fmn中取出表示两矩阵位置关系类型的分量TD,1≤TD≤N1,所述两矩阵是指分别包含测试笔迹中被识别为第m和第n段类型笔画且面积最小的矩形;
H7)取出注册笔迹样本集中具有特定属性的注册笔迹样本子集元素个数变量
Figure RE-GDA0002471295940000291
所述注册笔迹样本集中具有特定属性的注册笔迹是指:1)所述注册笔迹样本中包含有被识别为第m和第n段类型两段笔画,2)包含第m和第n段类型两段笔画的矩形之间的位置关系类型与测试笔迹的相同,即u=TD
H8)若
Figure RE-GDA0002471295940000292
则跳转到步骤H10),否则,跳转到到步骤H9);
H9)计算观测到测试样本中被识别为第m和第n段类型的两段笔画间布局特征概率pemn,采用下式计算观察到测试手写笔迹中被识别为第m和第n段类型两段笔画的两笔画布局特征概率,
Figure RE-GDA0002471295940000293
其中
Figure RE-GDA0002471295940000294
N1表示两矩阵位置关系类型的类别数,
Figure RE-GDA0002471295940000295
表示在预训练阶段学习到的关于标准汉字c被识别为第m和第n段类型两段笔画的两笔画布局特征概率密度函数;fmn=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)表示在测试手写笔迹样本W 中提取到的被识别为第m和第n段类型的两段笔画布局特征向量,积分区域D由如下式所定义,
Figure RE-GDA0002471295940000296
其中vx表示特征向量fmn中第x个分量取值,N2表示两笔画布局特征向量中分量的个数,
Figure RE-GDA0002471295940000301
Figure RE-GDA0002471295940000302
分别表示在注册阶段获取在具有特定特性注册手写笔迹样本子集上提取的两笔画间布局特征向量在第x个分量上的最大最小值,所述注册笔迹样本集中具有特定属性的注册笔迹是指:1)所述注册笔迹样本中包含有被识别为第m和第n段类型两段笔画,2)包含第m和第n段类型两段笔画的矩形之间的位置关系类型为u;
H10)n=n+1,若n≤O,则跳转至步骤H4),否则,则跳转至步骤H11);
H11)m=m+1,若m≤O,则跳转至步骤H3),否则,则跳转至步骤H12);
H12)结束:观察到测试笔迹中所有两两笔画间布局特征概率的计算过程执行结束,返回结果为观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率, 1≤k≤O,1≤k≤O。
优选地,计算点在新坐标系下的位置坐标包括如下步骤:
I1)开始:开始计算点在新坐标系下的位置坐标,设输入参数为 P={(x1,y1),(x2,y2),...,(xn,yn)}为待计算的书写平面上点的集合,n表示集合中点的个数,输入参数(Ux,Uy)为书写平面上相互垂直的向量,以两向量的交点作为新坐标系的原点,以向量Ux作为x轴,以向量Ux的方向为x轴的正方向,以向量Uy作为y轴,以向量Uy的方向为y轴的正方向;
I2)置下标变量i=1,置关键点在新坐标系下的坐标集合P1为空;
I3)取集合P中第i个点(xi,yi),计算点(xi,yi)在坐标系(Ux,Uy)中的坐标,设为PUi=(Pxi,Pyi),将PUi增加到P1集合,PU=PU∪{PUi},特别地,若(xi,yi)=(null,null),那么置PUi=(null,null);
I4)坐标归一化:xi=xi/||Ux||,yi=yi/||Uy||,其中||Ux||表示向量Ux的模,||Uy||表示向量Uy的模;
I5)i=i+1,若下标变量i<=n,跳转到步骤I3),否则,跳转到步骤I6);
I6)结束:返回点集P在新坐标系下的位置坐标 PU={PU1,PU2,...,PUn},其中,PUi=(Pxi,Pyi)。
本发明与现有技术相比,具有以下优点:
1、能够克服笔迹两两匹配的巨额时间开销,有效提取大规模笔迹的笔画布局特征,基于布局特征在人群中的统计特征来提高认证系统的准确性和泛化能力;
2、在小样本约束条件下充分挖掘出模板笔迹中有鉴别价值的特征,从而达到提升认证准确性的目的;
3、对已知书写内容的非标准任意手写体笔迹,能有效提取出那些处于局部的笔画布局特征,并估算稳定且一致笔画布局特征在人群中出现的概率,从而达到提升认证准确性的目的。
附图说明
图1为本发明在线笔迹认证中一种笔迹布局特征的提取及认证方法的流程图;
图2为图1中步骤A)的具体流程图;
图3为图1中步骤B)的具体流程图;
图4为图1中步骤C)的具体流程图;
图5为本发明中单个笔画的布局特征计算的具体流程图;
图6为本发明中两两笔画间的布局特征计算的具体流程图;
图7为本发明中人工标注标准汉字两两笔画是否交叉的具体流程图;
图8为本发明中两矩形间位置关系类型的计算的具体流程图;
图9为本发明中计算观察到测试笔迹中所有两两笔画间布局特征概率矩阵的具体流程图;
图10为本发明中计算点在新坐标系下的位置坐标的具体流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
在线笔迹认证中一种笔迹布局特征的提取及认证方法,如图1 所示,包括如下步骤:
A)手写笔迹笔画布局特征预学习:收集人群关于标准汉字c的大量的手写笔迹样本,基于笔画识别算法识别所有预学习手写笔迹样本中的笔画类型;然后提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征;以所识别的笔画类型为对象,分析各种笔画布局特征在人群中出现的统计特征,对笔画布局的离散型特征,包括笔画类型、两两笔画相交的次数特征,统计这类特征在人群中出现的分布律;对笔画布局的连续型特征,包括交叉点的位置特征、两两笔画间的布局特征,估算这些特征在人群中出现的联合概率密度函数;
所述手写笔迹样本是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述每段笔画的布局特征是指笔迹中某一段笔画的方位角、包含该笔画的面积最小矩形的长度和宽度、笔画在书写平面中的位置特征,所述两两笔画之间的布局特征是指笔迹中任意两段笔画之间的其中一段笔画的起止点、交叉点相对另一段笔画的长度、夹角、重心距离特征;
所述笔画的布局特征包括笔迹中所包含的所有笔画、笔画的起点和终点的位置、笔画之间的交叉点位置、笔迹中所有单笔画的布局特征、笔迹中所有两两笔画之间的布局特征;
所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字 c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹中的笔画类型是指建立手写笔迹中笔画与标准汉字中笔画的对应关系;
具体而言,如图2所示,手写笔迹笔画布局特征预学习包括如下步骤:
A1)特征预学习开始:设S={s1,s2,...,sN}表示海量的足够多书写者手写的关于标准汉字c的笔迹样本集合,每位书写者提供1至3个样本,设T={t1,t2,...,tO}表示汉字c包含的所有基本笔画集合,O表示标准汉字c所包含的基本笔画数;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在预训练样本集S中出现的次数计数变量nj=0,1≤j≤O,置标准汉字c的第j段笔画在预训练样本集S中未出现的次数计数变量
Figure RE-GDA0002471295940000331
1≤j≤O,置同时包含两段特定笔画类型的统计量N1O×O=0O×O,其中矩阵元素n1kj表示预训练样本集S中同时包含两段笔画被分别识别为第 k段和第j段笔画类型的预训练笔迹样本个数,1≤k≤O,1≤j≤O,置笔画相交统计矩阵和未相交统计矩阵RO×O=0O×O
Figure RE-GDA0002471295940000332
其中rij表示在预训练样本集S中具有这种特性的笔迹样本个数,
Figure RE-GDA0002471295940000333
表示预训练样本集S中不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交,初始化总体被识别为第k段类型的单笔画布局特征集合GF1k为空,k=1,2,...,O,初始化总体两两笔画间的布局特征集合矩阵GF2O×O中每一个元素GF2kj为空,1≤k≤O,1≤j≤O,其中矩阵的第k行第j列元素 GF2kj表示预训练样本集S中被识别为第k段和第j段笔画之间的布局特征集合;
A3)识别第i个预训练样本si的笔画类型,并更新统计量:对预训练样本si按笔画进行分割,得到笔画序列
Figure RE-GDA0002471295940000341
识别si中每一段笔画的类型,设
Figure RE-GDA0002471295940000342
表示返回的笔画类型识别结果,其中ok表示预训练样本si中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示si中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在预训练样本si中,则计数变量nk=nk+1,否则,
Figure RE-GDA0002471295940000343
变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成预训练样本si对统计量nk
Figure RE-GDA0002471295940000344
的更新,为了计算交叉点出现频率,更新统计量N1O×O,若预训练样本si中存在两段笔画被分别识别为第k段和第j段笔画类型,则n1kj=n1kj+1,其中n1为矩阵N1O×O第k行第j列元素,按从左到右,从上到下的顺序完成预训练样本si对统计量N1O×O的更新;
A4)预训练样本si中两两笔画交叉点计算:以预训练样本si的笔画序列
Figure RE-GDA0002471295940000345
笔画类型识别结果
Figure RE-GDA0002471295940000346
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到预训练样本 si的两两笔画间交叉点矩阵PO×O,和与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若预训练样本si中被识别为第 k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标, 1≤j≤O,1≤k≤O;
A5)笔画交叉信息的统计量更新:从步骤A4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若预训练样本sk中存在两段笔画被分别识别为第k和第j笔画类型,ptkj=1且pkj=(null,null),那么
Figure RE-GDA0002471295940000351
否则,若pkj≠(null,null),表示相应的两段笔画有相交,rkj=rkj+1,双重循环结束后,完成预训练样本si对统计量矩阵RO×O
Figure RE-GDA0002471295940000352
的更新;
A6)预训练样本si中单个笔画的布局特征计算:以预训练样本si的笔画序列
Figure RE-GDA0002471295940000353
笔画类型识别结果
Figure RE-GDA0002471295940000354
作为输入参数,得到预训练样本si的被识别为第k段笔画类型的笔画布局特征向量F1k,k=1,2,...,O;若预训练样本si中存在笔画被识别为第k段笔画类型,则F1k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F1k=null,1≤k≤O;
A7)单笔画布局特征统计量的更新:将在预训练样本si上得到的各个笔画布局特征向量F1k,k=1,2,...,O添加到相应的总体单笔画布局特征集合中去GF1k,从第一段笔画开始到第O段笔画结束,若 F1k==null,表示预训练样本si中没有笔画被识别为第k段笔画类型,不用更新,否则,GF1k=GF1k∪{F1k},循环结束后,完成对总体单笔画布局特征集合GF1k的更新,k=1,2,...,O;
A8)预训练样本si中两两笔画间的布局特征计算:具体地,以预训练样本si的笔画序列
Figure RE-GDA0002471295940000361
笔画类型识别结果
Figure RE-GDA0002471295940000362
与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,预训练样本si中两两笔画间的交叉点矩阵PO×O作为输入参数,得到预训练样本si的两两笔画间布局特征向量矩阵F2O×O,若预训练样本si中存在两段笔画被识别为第k段和第j段笔画类型,则f2kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f2kj=null,k=1,2,...,O, 1≤j≤O;
A9)两两笔画间布局特征统计量的更新:将在预训练样本si上得到的两两笔画间布局特征向量矩阵F2O×O,添加到相应的总体两两笔画间布局特征集合矩阵中去GF2O×O,从步骤A8)返回的两两笔画间布局特征向量矩阵F2O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F2O×O的第k行第j列元素f2kj,若f2kj≠null,则GF2kj=GF2kj∪{f2kj};否则不用更新该统计量GF2kj;循环结束后,完成对总体两两笔画间布局特征集合GF2kj的更新;
A10)i=i+1,若i≤N,则跳转至步骤A3),否则,则跳转至步骤 A11);
A11)人群中关于标准汉字c的单笔画布局特征联合概率密度函数的估计:以总体单笔画布局特征集合GF1k为训练样本,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段笔画的单笔画布局特征概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;
A12)人群中关于标准汉字c的两两笔画间布局特征联合概率密度函数的估计:对总体两两笔画间布局特征集合矩阵GF2O×O中的每一个元素GF2kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合
Figure RE-GDA0002471295940000371
子集
Figure RE-GDA0002471295940000372
表示集合GF2kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合
Figure RE-GDA0002471295940000373
具有以下特性:1)
Figure RE-GDA0002471295940000374
2)当u≠v时,
Figure RE-GDA0002471295940000375
统计每一个矩阵位置关系类别出现的频率
Figure RE-GDA0002471295940000376
其中
Figure RE-GDA0002471295940000377
表示集合
Figure RE-GDA0002471295940000378
中元素的个数,
Figure RE-GDA0002471295940000379
1≤u≤N1;最后,在每一个特征向量子集
Figure RE-GDA0002471295940000381
上,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段和第j段笔画之间矩阵位置关系类型为u的两两笔画布局特征概率密度函数
Figure RE-GDA0002471295940000382
1≤u≤N1;采用相同的方法,从集合矩阵GF2O×O的第1行第1列元素开始,按从左到右,从上到下的顺序,对矩阵中每一个元素GF2kj做同样的操作, 1≤k≤O,1≤j≤O,得到相应的两两笔画布局特征概率密度函数
Figure RE-GDA0002471295940000383
1≤u≤N1,1≤k≤O,1≤j≤O;
A13)结束:关于标准汉字c的预训练过程结束,返回的数据包括:1)标准汉字c的第k段类型笔画在人群中出现和未出现的频率 nk/N和
Figure DEST_PATH_GDA0002614875880000384
2)人群书写关于标准汉字c的手写笔迹中两两类型笔画相交和未相交笔迹出现的频率ri×j/n1ij
Figure DEST_PATH_GDA0002614875880000385
3)人群书写的标准汉字c的第k段类型笔画的单笔画布局特征联合概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;4)预训练手写笔迹样本集合中具有该特性的样本个数
Figure RE-GDA0002471295940000385
1≤u≤N1,1≤k≤O, 1≤j≤O;5)人群书写的关于标准汉字c的具有该特性的两两笔画类型布局特征联合概率密度函数
Figure RE-GDA0002471295940000386
1≤u≤N1,1≤k≤O,1≤j≤O;所述具有该特性是指预学习手写笔迹样本中存在笔画被识别为第k和第j段笔画类型,且包含该两段类型笔画的面积最小的两矩形位置关系类型为u;
B)笔画布局特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,设若干所述注册手写笔迹样本组成注册手写笔迹样本集合,识别所有注册手写笔迹样本中的笔画类型,按所识别的笔画类型,提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征,统计笔画布局特征中各种离散型特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画布局特征中各种连续型特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
具体而言,如图3所示,笔画布局特征注册包括如下步骤:
B1)注册开始:用户提交关于标准汉字c的注册手写笔迹样本集合H={h1,h2,...,hp},p≥3
B2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中出现的次数计数变量Ej=0,1≤j≤O,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中未出现的次数计数变量
Figure RE-GDA0002471295940000391
1≤j≤O,置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵VO×O=0O×O
Figure RE-GDA0002471295940000392
其中vij
Figure RE-GDA0002471295940000393
分别表示在手写笔迹样本集合H中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中有被识别为标准汉字c的第i和第j段的两段笔画且这两段笔画相交;初始化集合H中被识别为第k段类型的单笔画布局特征集合GF3k为空,k=1,2,...,O,初始化集合H中两两笔画间的布局特征集合矩阵GF4O×O中每一个元素GF4kj为空,1≤k≤O, 1≤j≤O,其中矩阵的第k行第j列元素GF4kj表示被识别为第k段和第 j段笔画之间的布局特征集合,O表示汉字c标准书写体所包含的基本笔画数;
B3)识别第i个注册样本hi的笔画类型:对注册样本hi按笔画进行分割,得到笔画序列
Figure RE-GDA0002471295940000394
识别hi中每一段笔画的类型,设
Figure RE-GDA0002471295940000395
表示返回的笔画类型识别结果,其中ok表示注册样本hi中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示hi中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在注册样本hi中,则计数变量Ek=Ek+1,否则,
Figure RE-GDA0002471295940000401
变量k 从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成注册样本hi对统计量Ek
Figure RE-GDA0002471295940000402
的更新;
B4)注册样本hi中两两笔画交叉点计算:以注册样本hi的笔画序列
Figure RE-GDA0002471295940000403
笔画类型识别结果
Figure RE-GDA0002471295940000404
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到注册样本hi的两两笔画间交叉点矩阵PO×O,和与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若注册样本hi中被识别为第k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素 ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标,1≤j≤O, 1≤k≤O;
B5)笔画相交信息的统计量更新:从B4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若注册样本hi中存在笔画被识别为第k和第j笔画类型,且ptkj==1和pkj=(null,null),那么
Figure RE-GDA0002471295940000405
否则,若 pkj≠(null,null),表示相应的两段笔画有相交,vkj=vkj+1,双重循环结束后,完成注册样本hi对统计量矩阵VO×O
Figure RE-GDA0002471295940000411
的更新;
B6)注册样本hi中单个笔画的布局特征计算:以注册样本hi的笔画序列
Figure RE-GDA0002471295940000412
笔画类型识别结果
Figure RE-GDA0002471295940000413
作为输入参数,得到注册样本hi的被识别为第k段笔画类型的笔画布局特征向量 F3k,k=1,2,...,O;若注册样本hi中存在笔画被识别为第k段笔画类型,则F3k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F3k=null,1≤k≤O;
B7)单笔画布局特征统计量的更新:将在注册样本hi上得到的各个笔画布局特征向量F3k,k=1,2,...,O添加到相应的关于注册笔迹样本集H的单笔画布局特征集合中去GF3k,从第一段笔画开始到第O段笔画结束,若F3k==null,表示注册样本hi中没有笔画被识别为第k段笔画类型,不用更新,否则,GF3k=GF3k∪{F3k},循环结束后,完成关于注册笔迹样本集H的单笔画布局特征集合GF3k的更新,k=1,2,...,O;
B8)注册样本hi中两两笔画间的布局特征计算:以注册样本hi的笔画序列
Figure RE-GDA0002471295940000414
笔画类型识别结果
Figure RE-GDA0002471295940000415
与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,注册样本hi中两两笔画间的交叉点矩阵PO×O为输入参数,得到注册样本hi的两两笔画间布局特征向量矩阵F4O×O;若注册样本hi中存在两段笔画被识别为第k段和第j段笔画类型,则
Figure RE-GDA0002471295940000421
否则,
Figure RE-GDA0002471295940000422
k=1,2,...,O, 1≤j≤O;
B9)两两笔画间布局特征统计量的更新:将在注册样本hi上得到的两两笔画间布局特征向量矩阵F4O×O,添加到相应的关于注册笔迹样本集H的两两笔画间布局特征集合矩阵中去GF4O×O,从步骤208返回的两两笔画间布局特征向量矩阵F4O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F4O×O的第k行第j列元素f4kj,若f4kj≠null,则GF4kj=GF4kj∪{f4kj};否则不用更新该统计量GF4kj;循环结束后,完成关于注册笔迹样本集H的两两笔画间布局特征集合 GF4O×O的更新;
B10)i=i+1,若i≤p,则跳转至步骤B3),否则,则跳转至步骤 B11);
B11)注册笔迹样本集H关于标准汉字c的单笔画布局特征在各个分量上的最大最小值:对于集合GF3k,GF3k表示以注册笔迹样本集H中由所有被识别为第k段类型笔画的单笔画布局特征构成的集合,计算单笔画布局特征的每一个分量在集合GF3k上的最大最小值,1≤k≤O;如果集合GF3k中元素个数小于2,那么最大最小值集合 MF3k=null,否则用
Figure RE-GDA0002471295940000423
表示所求得的每个分量上的最大最小值集合,其中
Figure RE-GDA0002471295940000424
表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量在注册笔迹样本集 H上的最大值,
Figure RE-GDA0002471295940000425
表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量的最小值,1≤u≤N2,1≤k≤O,N2表示单笔画布局特征向量中分量的个数,此步骤结束后,得到注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合
Figure RE-GDA0002471295940000431
1≤k≤O;
B12)注册笔迹样本集H关于标准汉字c的两两笔画间布局特征在各个分量上的最大最小值:对注册笔迹样本集H上两两笔画间布局特征集合矩阵GF4O×O中的每一个元素GF4kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合
Figure RE-GDA0002471295940000432
子集
Figure RE-GDA0002471295940000433
表示集合GF4kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合
Figure RE-GDA0002471295940000434
具有以下特性:1)
Figure RE-GDA0002471295940000435
2)当u≠v时,
Figure RE-GDA0002471295940000436
统计每一个矩阵位置关系类别出现的次数,设
Figure RE-GDA0002471295940000437
表示集合
Figure RE-GDA0002471295940000438
中元素的个数;对于集合
Figure RE-GDA0002471295940000439
Figure RE-GDA00024712959400004310
那么
Figure RE-GDA00024712959400004311
否则,计算两两笔画间布局特征的每一个分量在集合
Figure RE-GDA00024712959400004312
上的最大最小值, 1≤u≤N1,设
Figure RE-GDA00024712959400004313
表示所求得的每个分量上的最大最小值集合,其中
Figure RE-GDA00024712959400004314
表示被识别为第 k和第j段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最大值,
Figure RE-GDA00024712959400004315
表示被识别为第k和第j 段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最小值,1≤u≤N1,1≤v≤N4,1≤k≤O,1≤j≤O, N4表示单笔画布局特征向量中分量的个数;
B13)结束:关于标准汉字c的注册过程结束,返回的数据包括: 1)第k段笔画在注册笔迹样本集H中出现和未出现的次数Ek
Figure RE-GDA00024712959400004316
2) 笔画相交点在注册笔迹样本集H中出现和未出现的次数矩阵vkj
Figure RE-GDA0002471295940000441
1≤k≤O,1≤j≤O;3)注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合
Figure RE-GDA0002471295940000442
1≤k≤O,其中,N2表示单笔画布局特征向量中分量的个数;4)具有特定性质的注册笔迹样本个数
Figure RE-GDA0002471295940000443
1≤u≤N1,1≤k≤O,1≤j≤O,所述具有特定性质的注册样本是指:a)来自于注册笔迹样本集H;b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画;c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为u;5)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值
Figure RE-GDA0002471295940000444
1≤u≤N1,1≤k≤O, 1≤j≤O;
C)笔画布局特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,识别测试手写笔迹样本中的笔画类型,按所识别的笔画类型,统计测试手写笔迹样本中出现和未出现的笔画类型,统计两两笔画之间出现和未出现的交叉点,提取所有具有相同笔画类型的各种单笔画布局特征以及两两笔画间的布局特征,找出注册手写笔迹样本中稳定且一致的各种笔画布局特征,依据在手写笔迹笔画布局特征预学习阶段计算得到的汉字c所有各种笔画布局特征在人群中的统计特征,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画布局特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画书写动态特征、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画布局特征包括离散型稳定且一致笔画布局特征和连续型稳定且一致笔画布局特征;
所述离散型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的离散型笔画布局特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画布局特征取值是相同的,所述稳定的离散型笔画布局特征是指具有相同离散型笔画布局特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的连续型笔画布局特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画布局特征取值的最大最小值之间,所述稳定的连续型笔画布局特征是指在注册手写笔迹样本集合上提取的连续型笔画布局特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户;
具体而言,如图4所示,笔画布局特征认证包括如下步骤:
C1)认证阶段开始:用户输入关于标准汉字c的测试手写笔迹样本W;
C2)初始化:置标准汉字c的第j段笔画在测试手写笔迹样本W 中出现的次数计数变量yj=0,1≤j≤O,置标准汉字c的第j段笔画在测试手写笔迹样本W中未出现的次数计数变量
Figure RE-GDA0002471295940000451
1≤j≤O,置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵ZO×O=0O×O
Figure RE-GDA0002471295940000452
其中zij
Figure RE-GDA0002471295940000453
分别表示在测试手写笔迹样本W中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交;
Figure RE-GDA0002471295940000454
1≤j≤O,1≤i≤O;
C3)识别测试手写笔迹样本W的笔画类型,并更新统计量:对测试手写笔迹样本W按笔画进行分割,得到笔画序列
Figure RE-GDA0002471295940000455
识别笔迹W中每一段笔画的类型,设
Figure RE-GDA0002471295940000456
表示返回的笔画类型识别结果,其中ok表示测试手写笔迹样本W中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,nw表示W中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在测试手写笔迹样本W中,则计数变量yk=yk+1,否则,
Figure RE-GDA0002471295940000461
变量k从标准汉字 c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成测试手写笔迹样本W对统计量yk
Figure RE-GDA0002471295940000462
的更新;
C4)测试手写笔迹样本W中两两笔画交叉点计算:以测试手写笔迹样本W的笔画序列
Figure RE-GDA0002471295940000463
笔画类型识别结果
Figure RE-GDA0002471295940000464
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间交叉点矩阵QO×O,和与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk, k=1,2,...,O;若测试手写笔迹样本W中被识别为第k段和第j段笔画不相交,那么交叉点矩阵QO×O中元素qtkj=0,交叉点集合Xk和Xj中交叉点qkj=(null,null)和qjk=(null,null);否则,交叉点矩阵QO×O中元素qtkj=1,交叉点集合Xk和Xj中交叉点qkj和qjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
C5)笔画交叉信息的统计量更新:从步骤C4)返回的两两笔画间交叉点矩阵QO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取QO×O的元素,若qkj=(null,null),表示测试手写笔迹样本W中被识别为第k和第j笔画类型的两段笔画没有相交,那么
Figure RE-GDA0002471295940000465
否则,表示相应的两段笔画有相交,zkj=zkj+1,双重循环结束后,完成测试手写笔迹样本W对统计量矩阵ZO×O
Figure RE-GDA0002471295940000471
的更新;
C6)测试手写笔迹样本W中单个笔画的布局特征计算:以测试手写笔迹样本W的笔画序列
Figure RE-GDA0002471295940000472
笔画类型识别结果
Figure RE-GDA0002471295940000473
作为输入参数,得到测试手写笔迹样本W的被识别为第k段笔画类型的笔画布局特征向量F5k,1≤k≤O;若测试手写笔迹样本W中存在笔画被识别为第k段笔画类型,则 F5k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F5k=null,1≤k≤O;
C7)测试手写笔迹样本W中两两笔画间的布局特征计算:以测试手写笔迹样本W的笔画序列
Figure RE-GDA0002471295940000474
笔画类型识别结果
Figure RE-GDA0002471295940000475
与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk,k=1,2,...,O,测试手写笔迹样本W中两两笔画间的交叉点矩阵QO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间布局特征向量矩阵F6O×O;若测试手写笔迹样本W中中存在两段笔画被识别为第k段和第j段笔画类型,则f6kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f6kj=null,1≤k≤O, 1≤j≤O;
C8)计算观察到测试手写笔迹样本W中各笔画的概率P1:若测试手写笔迹样本W中存在笔画被识别为第k段笔画类型且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段笔画类型,即 yk==1且Ek≥2,那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即p1k=nk/N,否则,若测试手写笔迹样本W中不存在笔画被识别为第k段笔画类型且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中不存在笔画被识别为第k段笔画类型,即
Figure RE-GDA0002471295940000481
Figure RE-GDA0002471295940000482
那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即
Figure RE-GDA0002471295940000483
否则,表明第k段笔画类型在注册笔迹样本和注册笔画迹样本中出现方式不一致,置p1k=1;k=1,2,...,O,最后置
Figure RE-GDA0002471295940000484
C9)计算观察到测试样本笔迹W中交叉点的概率P2:若测试手写笔迹样本W中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画相交,而且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画相交,即zkj==1且 vkj≥2,那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即p2kj=rkj/n1kj,否则,若测试手写笔迹样本W中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画不相交,而且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画不相交,即
Figure RE-GDA0002471295940000485
Figure RE-GDA0002471295940000486
那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即
Figure RE-GDA0002471295940000487
否则,表明第k段和第j段笔画类型相交在注册笔迹样本和注册笔画迹样本中出现方式不一致,置p2kj=1,1≤k≤O,1≤j≤O,最后置
Figure RE-GDA0002471295940000488
C10)计算观察到测试样本笔迹W中单个笔画布局特征的概率P3:在注册样本集上,若被识别为第k段笔画类型的单笔画布局特征向量 MF3k==null或者第k段笔画类型在测试样本W中未出现,则置p3k=1,1≤k≤O,否则,采用下式计算观察到测试手写笔迹中被识别为第k段笔画类型的单笔画布局特征的概率,
Figure RE-GDA0002471295940000491
1≤k≤O,其中f1k(·)表示在预训练阶段学习到的关于标准汉字c被识别为第k 段笔画的单笔画布局特征概率密度函数, F5k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)表示在测试手写笔迹样本W中提取到的被识别为第k段笔画类型的单笔画布局特征向量,积分区域 D=(d1,d2,...,dN2)由如下式所定义,
Figure RE-GDA0002471295940000492
其中vi表示特征向量F5k中第i个分量取值,
Figure RE-GDA0002471295940000493
Figure RE-GDA0002471295940000494
分别表示在注册阶段获取的在注册样本集合中所有被识别为第k段类型笔画的单笔画布局特征向量在第i个分量上的最大最小值,N2表示单笔画布局特征向量中分量的个数,变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,得到观测到所有笔画类型的概率p3k,1≤k≤O,最后,置观察到测试样本笔迹W中所有单个笔画布局特征的概率
Figure RE-GDA0002471295940000495
C11)计算观察到测试样本笔迹W中所有两两笔画间布局特征的概率矩阵PEO×O:以如下4种数据作为输入参数:1)测试手写笔迹样本W中两两笔画间的布局特征矩阵F6O×O,2)注册阶段获取的注册笔迹样本子集个数
Figure RE-GDA0002471295940000496
1≤u≤N1,1≤k≤O,1≤j≤O,3)注册阶段获取的注册笔迹样本集关于笔画间布局特征在每个分量上的最大最小值
Figure RE-GDA0002471295940000497
1≤u≤N1, 1≤k≤O,1≤j≤O,4)预训练阶段获取的标准汉字c关于两两笔画布局特征概率密度函数
Figure RE-GDA0002471295940000498
1≤u≤N1,1≤k≤O,1≤j≤O,得到观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率, 1≤k≤O,1≤k≤O;
C12)计算观察到测试样本笔迹W中两两笔画间布局特征的概率 P4:以测试笔迹样本W中的笔画作为结点集V,以概率矩阵PEO×O中的元素作为连接结点的无向边的权值E,得到一个无向带权图 G=<V,E>,从图G出发,构造一个关于图G的最小生成树G'=<V,E'>,根据G'得到测试样本笔迹W中两两笔画间布局特征的概率
Figure RE-GDA0002471295940000501
C13)计算观察到测试样本笔迹W的布局特征概率 P(W)=P1×P2×P3×P4;
C14)测试笔画与布局特征相关的判别:将布局特征概率P(W),融合笔画的其它特征,包括笔顺、书写用力、书写节奏,综合判断该测试样本笔迹W是否为真实笔迹;
C15)结束:测试笔迹的认证过程结束。
本实施例中,如图5所示,单个笔画的布局特征计算包括如下步骤:
D1)开始:设输入参数S={(x1,y1),(x2,y2),...,(xn,yn)}表示笔迹中笔画 S的采样点时序数据,(xi,yi)表示笔画S中在第i个采样时刻笔尖的位置数据,
Figure RE-GDA0002471295940000502
表示笔画S与笔迹中其它笔画的交叉点坐标,其中
Figure RE-GDA0002471295940000503
表示交叉点二维的x,y坐标,下标si表示与S相交的笔画在笔迹中的序号,1≤i≤ms,ms表示Pc中交叉点的个数,与S相交的笔画是由人工标注的在标准书写体中本应出现相交的笔画,若手写体非标准笔迹中第si段笔画与S没有交叉点,那么用符号null表示,
Figure RE-GDA0002471295940000511
1≤i≤ms
D2)计算笔画重心点G=(xg,yg):其中
Figure RE-GDA0002471295940000512
D3)寻找包含笔画S的面积最小的矩形V=(p1,p2,p3,p4):其中 p1,p2,p3,p4是矩形的四个顶点,pi=(pxi,pyi),1≤i≤4,U=(U1,U2,U3,U4)表示矩形V的四条有向边,其中
Figure RE-GDA0002471295940000513
D4)计算矩形V的四条有向边长度:设|U1|=|U3|=a,|U2|=|U4|=b;
D5)计算笔画S的方位角:比较矩形V两条边的长度,若a>b,置W={U1,U3},若a<b,置W={U2,U4},若a=b,W={U1,U2,U3,U4},设 Q表示以笔画S中第一个采样点(x1,y1)为开始点,以最后一个采样点 (xn,yn)为结束点的向量,计算向量Q与集合W中每个向量之间的夹角QAngle,0≤QAngle≤180°,计算集合W中与向量Q之间夹角最小的向量,设 Ux为集合W中与向量Q之间夹角最小的向量,计算向量Ux与X轴的夹角,设为Angle,以Angle表示笔画S的方位角,-180°≤Angle≤180°;
D6)选取由矩形V定义的坐标系:以步骤D5)介绍的所述矩形V 中有向线段Ux的起点为新坐标系的原点,以所述矩形V中过该原点且相互垂直的两条边为所选坐标系的轴,规定在所述矩形V的两条相互垂直的两条边中,从原点到所述两条边的另一个顶点的方向为正方向,设所选坐标系的两条相互垂直的坐标轴为(Ux,Uy);
D7)计算采样点序列S={(x1,y1),(x2,y2),...,(xn,yn)}在由(Ux,Uy)构成的坐标系下各种极值点:计算序列S中的采样点在新坐标系(Ux,Uy)的x,y 方向上极大值、极小值对应的点,设pxM,pxm分别表示x方向上极大和极小值,设pyM,pym分别表示y方向上极大和极小值,由四个极值点和笔画的第一个和最后一个点,得到关于笔画的基本点集合 P1={pxM,pxm,pyM,pym,p1,pn},其中p1=(x1,y1),pn=(xn,yn);
D8)计算基本点在新坐标系下的位置坐标:以基本点集合P1和 (Ux,Uy)作为输入参数,得到P1在新坐标下的位置坐标集合 P1U={p1xM,p1xm,p1yM,p1ym,p11,p1n};
D9)计算交叉点Pc在新坐标系下的位置坐标:以基本点集合Pc 和(Ux,Uy)作为输入参数,得到Pc在新坐标下的位置坐标集合
Figure RE-GDA0002471295940000521
D10)结束:返回笔画S的重心、方位角、矩形边长等布局特征取值(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)。
本实施例中,如图6所示,两两笔画间的布局特征计算包括如下步骤:
E1)开始:两两笔画间的布局特征计算包含的输入参数包括:1) T,S分别表示主笔画和从笔画采样点时间序列,2)
Figure RE-GDA0002471295940000522
表示从笔画S与笔迹中除主笔画T以外的其它笔画交叉点坐标,其中
Figure RE-GDA0002471295940000523
表示交叉点二维的x,y坐标,下标si表示与从笔画S相交的笔画在笔画序列中的序号,1≤i≤ms,si不等于主笔画T在笔画序列中的序号,ms表示Pc中交叉点的个数,与S相交的笔画是由人工标注的在标准书写体中本应出现的,若手写体非标准笔迹中第si段笔画与S没有交叉点,那么用符号null表示,
Figure RE-GDA0002471295940000531
1≤i≤ms,3)主笔画T与从笔画S的交叉点PT={(PTx,PTy)},若在手写笔迹中主笔画T与从笔画S的没有交叉点,PT={(null,null)},4)包含T,S笔画且面积最小的矩形VT=(pt1,pt2,pt3,pt4),VS=(ps1,ps2,ps3,ps4),其中pt1,pt2,pt3,pt4, ps1,ps2,ps3,ps4分别表示矩形VT、VS的四个顶点,5)由矩形VS定义的坐标系(USx,USy),6)由矩形VT定义的坐标系(UTx,UTy),7)笔画S的重心GS=(xsg,ysg),8)笔画T的重心GT=(xtg,ytg);
E2)计算笔画T重心与笔画S重心之间的距离DisTS
E3)计算笔画T和笔画S的方位角DispTS:定义向量GTS,向量GTS以笔画T的重心GT=(xtg,ytg)作为起点,以笔画S的重心GS=(xsg,ysg)作为终点,计算向量GTS与书写平面X轴之间的夹角DispTS,以夹角DispTS作为笔画S与笔画T的方位角,-180°≤DispTS≤180°;
E4)计算笔画T和笔画S的夹角AngleTS:计算由矩形VT所定义的坐标系(UTx,UTy)和由矩形VS所定义的坐标系(USx,USy)中两个X坐标轴UTx和USx之间的夹角AngleTS,以AngleTS作为笔画S与笔画T的夹角, -180°≤AngleTS≤180°;
E5)计算矩形VT和VS的位置关系类型:以矩形VT和VS的四个顶点为参数,得到VT和VS的位置关系类型TD
E6)计算矩形VT和VS之间重叠区域的面积R;
E7)计算从笔画采样点序列S={(x1,y1),(x2,y2),...,(xn,yn)}在由(USx,USy) 定义的新坐标系下各种极值点:计算从笔画序列S中的采样点在新坐标系(USx,USy)的x,y方向上极大值、极小值对应的点,设pxM,pxm分别表示x方向上极大和极小值,设pyM,pym分别表示y方向上极大和极小值,由四个极值点和从笔画S的第一个和最后一个采样点,得到关于笔画的基本点集合P1={pxM,pxm,pyM,pym,p1,pn},其中p1=(x1,y1), pn=(xn,yn);
E8)计算从笔画S的基本点在主笔画T定义的新坐标系下的位置坐标:以从笔画S的基本点集合P1和主笔画T定义的新坐标系 (UTx,UTy)作为输入参数,得到从笔画S的基本点集合P1在主笔画T定义的新坐标下的位置坐标集合P1U={p1xM,p1xm,p1yM,p1ym,p11,p1n};
E9)计算从笔画S的交叉点Pc在主笔画T定义的新坐标系下的位置坐标:以从笔画S的交叉点集合Pc和(UTx,UTy)作为输入参数,得到 Pc在主笔画T定义的新坐标下的位置坐标集合
Figure RE-GDA0002471295940000541
所述从笔画S的交叉点是指由人工标注的笔迹中除了主笔画T 以外其它所有笔画本应与从笔画S的交叉点,所述本应与从笔画S的交叉点是指依据标准汉字c的表现形式,笔画之间应该出现的交叉点;
E10)计算主笔画T与从笔画S的交叉点PT在主笔画T定义的新坐标系下的位置坐标:以交叉点集合PT和(UTx,UTy)作为输入参数,得到交叉点集合PT在主笔画T定义的新坐标下的位置坐标集合PTU={(PTxU,PTyU)};
E11)结束:返回主笔画T与从笔画S的距离DisTS,主笔画T与从笔画S的方位角DispTS,主笔画T与从笔画S的夹角AngleTS,VT和VS的位置关系类型TD,矩形VT和VS之间重叠区域的面积R,从笔画S的基本点在主笔画T定义的新坐标系(UTx,UTy)下在坐标集合P1U,从笔画S的交叉点在主笔画T定义的新坐标系(UTx,UTy)下在坐标集合PcU,主笔画 T与从笔画S的交叉点PT在主笔画T定义的新坐标系下的位置坐标 PTU
本实施例中,如图7所示,人工标注标准汉字两两笔画是否交叉过程包括如下步骤:
F1)开始:表示人工标注标准汉字中两两笔画是否相交过程的开始,输入参数为欲人工标注的标准汉字c;
F2)人工标注笔迹中应相交和不应相交的笔画:对于标准汉字c,根据所述标准汉字c的标准表现形式,由人工标注标准汉字c中笔画与笔画之间是否相交叉的信息,得到关于标准汉字c的笔画交叉矩阵;例于标准汉字“王”,其中第一、第二、第三段横笔画与竖笔画均有交叉,横笔画之间没有交叉,因此,得到汉字“王”的笔画交叉方阵
Figure RE-GDA0002471295940000551
因为汉字“王”包含有四个笔画,因此是4×4的方阵,方阵的每一行(列)按从小到大的顺序分别代表“王”字的“横”、“横”、“竖”、“横”四个笔画,方阵c中的元素cij表示“王”字的第i段笔画与第j 段笔画是否有交叉,其中“0”表示没有交叉,“1”表示有交叉;
F3)结束:返回关于标准汉字c的笔画交叉矩阵,标注过程被重复调用执行,得到关于所有标准汉字的笔画交叉矩阵。
本实施例中,如图8所示,两矩形间位置关系类型的计算包括如下步骤:
G1)开始:输入参数包括包含T,S笔画且面积最小的矩形 VT=(pt1,pt2,pt3,pt4),VS=(ps1,ps2,ps3,ps4),其中pt1,pt2,pt3,pt4,ps1,ps2,ps3,ps4分别表示矩形VT、VS的四个顶点;
G2)对两个矩形的四条边分别进行标记:按x、y方向上的极大极小值,对矩形VT中的四个顶点作如下定义:若x、y方向上的极值唯一,标记pt1为与y极大值对应的顶点,标记pt2为与x极大值对应的顶点,标记pt3为与y极小值对应的顶点,标记pt4为与x极小值对应的顶点,若x、y方向上的极值不唯一,标记pt1为与y极大值和x极小值对应的顶点,标记pt1为与y极大值和x极大值对应的顶点,标记pt3为与y极小值和x极大值对应的顶点,标记pt4为与y极小值和x极小值对应的顶点,进一步,标记矩形VT中的四条边为
Figure RE-GDA0002471295940000561
Figure RE-GDA0002471295940000562
按同样的方法,标记矩形VS中的四个顶点 ps1,ps2,ps3,ps4,然后,标记矩形VS中的四条边为
Figure RE-GDA0002471295940000563
Figure RE-GDA0002471295940000564
G3)计算矩形VT和VS的位置关系类型TD:对于矩形VT的四条边 UT={UA,UB,UC,UD}和矩形VS的四条边US={Ua,Ub,Uc,Ud},分别计算UT中的任意一条边与US中的任意一条边是否相交,若相交,则将由相交的两条边组成的二元组添加到相交边集合中,计算矩形边所有两两边之间是否相交后,得到矩形VT和VS之间的边相交集合Dp,最后,依据Dp查询矩阵位置关系类型表得到矩形VT和VS的位置关系类型TD
所述分属两个矩形的两条边相交是指,若两条边之间没有交点,那么两条边不相交,若两条边之间有交点且所述交点位于其中任意一条边的终点,那么两条边不相交,若两条边之间有交点且所述交点没有位于其中任意一条边的终点,那么两条边相交;
所述矩形边的起点和终点定义如步骤G2)所述;
所述矩阵位置关系类型表是指包含两维信息:1)由所有相交边二元组构成的集合;2)分配给该集合的编号;矩阵位置关系类型表的具体计算过程为:首先收集两个矩形之间所有可能的位置关系,然后,按矩形边是否交相为依据对矩形位置关系进行分类,具有相同相交边二元组集合的两矩形属于同一个位置关系类别,最后,对所有的位置关系类别进行编号,得到矩阵位置关系类型表;在计算阶段,对于待识别位置关系的两矩形,计算所述矩形中由所有相交边二元组构成的集合,依据该集合查表得到两矩形的位置关系类型;
所述相交边二元组的第一个元素表示矩形VT的某一条边,第二个元素表示矩形VS的某一条边,相交边二元组表示分属于矩形VT和VS的这两条边相交;
G4)结束:返回矩形VT和VS的位置关系类型TD
本实施例中,如图9所示,计算观察到测试笔迹中所有两两笔画间布局特征概率矩阵包括如下步骤:
H1)开始:观察到测试笔迹中所有两两笔画间布局特征概率的计算过程的开始,输入参数包括:1)关于标准汉字c的测试手写笔迹样本W中两两笔画间的布局特征矩阵F6O×O,其中 fkj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU),或者fkj=null,k=1,2,...,O, 1≤j≤O,2)关于标准汉字c的注册手写笔迹样本集H中具有特定性质的注册笔迹样本个数
Figure RE-GDA0002471295940000581
1≤u≤N1,1≤k≤O,1≤j≤O,其中,O表示标准汉字c包含的基本笔画数,N1表示两矩阵位置关系类型的类别数,所述具有特定性质的注册样本是指:a)来自于注册笔迹样本集 H,b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画,c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为 u,3)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值
Figure RE-GDA0002471295940000582
1≤u≤N1,1≤k≤O,1≤j≤O,N4表示单笔画布局特征向量中分量的个数,4)标准汉字c关于两两笔画布局特征概率密度函数
Figure RE-GDA0002471295940000583
1≤u≤N1,1≤k≤O,1≤j≤O;
H2)初始化:置观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O=1O×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率, pejk=1,1≤j≤O,1≤k≤O,初始化循环量m=1;
H3)初始化循环量n=1;
H4)若m==n,则跳转到步骤H10),否则,跳转到到步骤H5);
H5)取出测试笔迹中被识别为第m和第n段类型的两段笔画间布局特征fmn,若fmn==null,则跳转到步骤H10),否则,跳转到到步骤 H6);
H6)从fmn中取出表示两矩阵位置关系类型的分量TD,1≤TD≤N1,所述两矩阵是指分别包含测试笔迹中被识别为第m和第n段类型笔画且面积最小的矩形;
H7)取出注册笔迹样本集中具有特定属性的注册笔迹样本子集元素个数变量
Figure RE-GDA0002471295940000584
所述注册笔迹样本集中具有特定属性的注册笔迹是指:1)所述注册笔迹样本中包含有被识别为第m和第n段类型两段笔画,2)包含第m和第n段类型两段笔画的矩形之间的位置关系类型与测试笔迹的相同,即u=TD
H8)若
Figure RE-GDA0002471295940000591
则跳转到步骤H10),否则,跳转到到步骤H9);
H9)计算观测到测试样本中被识别为第m和第n段类型的两段笔画间布局特征概率pemn,采用下式计算观察到测试手写笔迹中被识别为第m和第n段类型两段笔画的两笔画布局特征概率,
Figure RE-GDA0002471295940000592
其中
Figure RE-GDA0002471295940000593
N1表示两矩阵位置关系类型的类别数,
Figure RE-GDA0002471295940000594
表示在预训练阶段学习到的关于标准汉字c被识别为第m和第n段类型两段笔画的两笔画布局特征概率密度函数;fmn=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)表示在测试手写笔迹样本W 中提取到的被识别为第m和第n段类型的两段笔画布局特征向量,积分区域D由如下式所定义,
Figure RE-GDA0002471295940000595
其中vx表示特征向量fmn中第x个分量取值,N2表示两笔画布局特征向量中分量的个数,
Figure RE-GDA0002471295940000596
Figure RE-GDA0002471295940000597
分别表示在注册阶段获取在具有特定特性注册手写笔迹样本子集上提取的两笔画间布局特征向量在第x个分量上的最大最小值,所述注册笔迹样本集中具有特定属性的注册笔迹是指:1)所述注册笔迹样本中包含有被识别为第m和第n段类型两段笔画,2)包含第m和第n段类型两段笔画的矩形之间的位置关系类型为u;
H10)n=n+1,若n≤O,则跳转至步骤H4),否则,则跳转至步骤H11);
H11)m=m+1,若m≤O,则跳转至步骤H3),否则,则跳转至步骤H12);
H12)结束:观察到测试笔迹中所有两两笔画间布局特征概率的计算过程执行结束,返回结果为观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率, 1≤k≤O,1≤k≤O。
本实施例中,如图10所示,计算点在新坐标系下的位置坐标包括如下步骤:
I1)开始:开始计算点在新坐标系下的位置坐标,设输入参数为 P={(x1,y1),(x2,y2),...,(xn,yn)}为待计算的书写平面上点的集合,n表示集合中点的个数,输入参数(Ux,Uy)为书写平面上相互垂直的向量,以两向量的交点作为新坐标系的原点,以向量Ux作为x轴,以向量Ux的方向为x轴的正方向,以向量Uy作为y轴,以向量Uy的方向为y轴的正方向;
I2)置下标变量i=1,置关键点在新坐标系下的坐标集合P1为空;
I3)取集合P中第i个点(xi,yi),计算点(xi,yi)在坐标系(Ux,Uy)中的坐标,设为PUi=(Pxi,Pyi),将PUi增加到P1集合,PU=PU∪{PUi},特别地,若(xi,yi)=(null,null),那么置PUi=(null,null);
I4)坐标归一化:xi=xi/||Ux||,yi=yi/||Uy||,其中||Ux||表示向量Ux的模,||Uy||表示向量Uy的模;
I5)i=i+1,若下标变量i<=n,跳转到步骤I3),否则,跳转到步骤I6);
I6)结束:返回点集P在新坐标系下的位置坐标 PU={PU1,PU2,...,PUn},其中,PUi=(Pxi,Pyi)。
本发明在线笔迹认证中一种笔迹布局特征的提取及认证方法,能够克服笔迹两两匹配的巨额时间开销,有效提取大规模笔迹的笔画布局特征,基于布局特征在人群中的统计特征来提高认证系统的准确性和泛化能力;在小样本约束条件下充分挖掘出模板笔迹中有鉴别价值的特征,从而达到提升认证准确性的目的;对已知书写内容的非标准任意手写体笔迹,能有效提取出那些处于局部的笔画布局特征,并估算稳定且一致笔画布局特征在人群中出现的概率,从而达到提升认证准确性的目的。
本发明未详细公开的部分属于本领域的公知技术。尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (10)

1.在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:包括如下步骤:
A)手写笔迹笔画布局特征预学习:收集人群关于标准汉字c的大量的手写笔迹样本,基于笔画识别算法识别所有预学习手写笔迹样本中的笔画类型;然后提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征;以所识别的笔画类型为对象,分析各种笔画布局特征在人群中出现的统计特征,对笔画布局的离散型特征,包括笔画类型、两两笔画相交的次数特征,统计这类特征在人群中出现的分布律;对笔画布局的连续型特征,包括交叉点的位置特征、两两笔画间的布局特征,估算这些特征在人群中出现的联合概率密度函数;
所述手写笔迹样本是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述每段笔画的布局特征是指笔迹中某一段笔画的方位角、包含该笔画的面积最小矩形的长度和宽度、笔画在书写平面中的位置特征,所述两两笔画之间的布局特征是指笔迹中任意两段笔画之间的其中一段笔画的起止点、交叉点相对另一段笔画的长度、夹角、重心距离特征;
所述笔画的布局特征包括笔迹中所包含的所有笔画、笔画的起点和终点的位置、笔画之间的交叉点位置、笔迹中所有单笔画的布局特征、笔迹中所有两两笔画之间的布局特征;
所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹中的笔画类型是指建立手写笔迹中笔画与标准汉字中笔画的对应关系;
B)笔画布局特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,设若干所述注册手写笔迹样本组成注册手写笔迹样本集合,识别所有注册手写笔迹样本中的笔画类型,按所识别的笔画类型,提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征,统计笔画布局特征中各种离散型特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画布局特征中各种连续型特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画布局特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,识别测试手写笔迹样本中的笔画类型,按所识别的笔画类型,统计测试手写笔迹样本中出现和未出现的笔画类型,统计两两笔画之间出现和未出现的交叉点,提取所有具有相同笔画类型的各种单笔画布局特征以及两两笔画间的布局特征,找出注册手写笔迹样本中稳定且一致的各种笔画布局特征,依据在手写笔迹笔画布局特征预学习阶段计算得到的汉字c所有各种笔画布局特征在人群中的统计特征,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画布局特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画书写动态特征、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画布局特征包括离散型稳定且一致笔画布局特征和连续型稳定且一致笔画布局特征;
所述离散型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的离散型笔画布局特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画布局特征取值是相同的,所述稳定的离散型笔画布局特征是指具有相同离散型笔画布局特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的连续型笔画布局特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画布局特征取值的最大最小值之间,所述稳定的连续型笔画布局特征是指在注册手写笔迹样本集合上提取的连续型笔画布局特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。
2.根据权利要求1所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤A)中,手写笔迹笔画布局特征预学习包括如下步骤:
A1)特征预学习开始:设S={s1,s2,...,sN}表示海量的足够多书写者手写的关于标准汉字c的笔迹样本集合,每位书写者提供1至3个样本,设T={t1,t2,...,tO}表示汉字c包含的所有基本笔画集合,O表示标准汉字c所包含的基本笔画数;所述标准汉字c是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在预训练样本集S中出现的次数计数变量nj=0,1≤j≤O,置标准汉字c的第j段笔画在预训练样本集S中未出现的次数计数变量
Figure RE-FDA0002471295930000031
1≤j≤O,置同时包含两段特定笔画类型的统计量N1O×O=0O×O,其中矩阵元素n1kj表示预训练样本集S中同时包含两段笔画被分别识别为第k段和第j段笔画类型的预训练笔迹样本个数,1≤k≤O,1≤j≤O,置笔画相交统计矩阵和未相交统计矩阵RO×O=0O×O
Figure RE-FDA0002471295930000041
其中rij表示在预训练样本集S中具有这种特性的笔迹样本个数,
Figure RE-FDA0002471295930000042
表示预训练样本集S中不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交,初始化总体被识别为第k段类型的单笔画布局特征集合GF1k为空,k=1,2,...,O,初始化总体两两笔画间的布局特征集合矩阵GF2O×O中每一个元素GF2kj为空,1≤k≤O,1≤j≤O,其中矩阵的第k行第j列元素GF2kj表示预训练样本集S中被识别为第k段和第j段笔画之间的布局特征集合;
A3)识别第i个预训练样本si的笔画类型,并更新统计量:对预训练样本si按笔画进行分割,得到笔画序列
Figure RE-FDA0002471295930000043
识别si中每一段笔画的类型,设
Figure RE-FDA0002471295930000044
表示返回的笔画类型识别结果,其中ok表示预训练样本si中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示si中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在预训练样本si中,则计数变量nk=nk+1,否则,
Figure RE-FDA0002471295930000045
变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成预训练样本si对统计量nk
Figure RE-FDA0002471295930000046
的更新,为了计算交叉点出现频率,更新统计量N1O×O,若预训练样本si中存在两段笔画被分别识别为第k段和第j段笔画类型,则n1kj=n1kj+1,其中n1为矩阵N1O×O第k行第j列元素,按从左到右,从上到下的顺序完成预训练样本si对统计量N1O×O的更新;
A4)预训练样本si中两两笔画交叉点计算:以预训练样本si的笔画序列
Figure RE-FDA0002471295930000051
笔画类型识别结果
Figure RE-FDA0002471295930000052
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到预训练样本si的两两笔画间交叉点矩阵PO×O,和与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若预训练样本si中被识别为第k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
A5)笔画交叉信息的统计量更新:从步骤A4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若预训练样本sk中存在两段笔画被分别识别为第k和第j笔画类型,ptkj=1且pkj=(null,null),那么
Figure RE-FDA0002471295930000053
否则,若pkj≠(null,null),表示相应的两段笔画有相交,rkj=rkj+1,双重循环结束后,完成预训练样本si对统计量矩阵RO×O
Figure RE-FDA0002471295930000054
的更新;
A6)预训练样本si中单个笔画的布局特征计算:以预训练样本si的笔画序列
Figure RE-FDA0002471295930000061
笔画类型识别结果
Figure RE-FDA0002471295930000062
作为输入参数,得到预训练样本si的被识别为第k段笔画类型的笔画布局特征向量F1k,k=1,2,...,O;若预训练样本si中存在笔画被识别为第k段笔画类型,则F1k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F1k=null,1≤k≤O;
A7)单笔画布局特征统计量的更新:将在预训练样本si上得到的各个笔画布局特征向量F1k,k=1,2,...,O添加到相应的总体单笔画布局特征集合中去GF1k,从第一段笔画开始到第O段笔画结束,若F1k==null,表示预训练样本si中没有笔画被识别为第k段笔画类型,不用更新,否则,GF1k=GF1k∪{F1k},循环结束后,完成对总体单笔画布局特征集合GF1k的更新,k=1,2,...,O;
A8)预训练样本si中两两笔画间的布局特征计算:具体地,以预训练样本si的笔画序列
Figure RE-FDA0002471295930000063
笔画类型识别结果
Figure RE-FDA0002471295930000064
与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,预训练样本si中两两笔画间的交叉点矩阵PO×O作为输入参数,得到预训练样本si的两两笔画间布局特征向量矩阵F2O×O,若预训练样本si中存在两段笔画被识别为第k段和第j段笔画类型,则f2kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f2kj=null,k=1,2,...,O,1≤j≤O;
A9)两两笔画间布局特征统计量的更新:将在预训练样本si上得到的两两笔画间布局特征向量矩阵F2O×O,添加到相应的总体两两笔画间布局特征集合矩阵中去GF2O×O,从步骤A8)返回的两两笔画间布局特征向量矩阵F2O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F2O×O的第k行第j列元素f2kj,若f2kj≠null,则GF2kj=GF2kj∪{f2kj};否则不用更新该统计量GF2kj;循环结束后,完成对总体两两笔画间布局特征集合GF2kj的更新;
A10)i=i+1,若i≤N,则跳转至步骤A3),否则,则跳转至步骤A11);
A11)人群中关于标准汉字c的单笔画布局特征联合概率密度函数的估计:以总体单笔画布局特征集合GF1k为训练样本,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段笔画的单笔画布局特征概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;
A12)人群中关于标准汉字c的两两笔画间布局特征联合概率密度函数的估计:对总体两两笔画间布局特征集合矩阵GF2O×O中的每一个元素GF2kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合
Figure RE-FDA0002471295930000071
子集
Figure RE-FDA0002471295930000072
表示集合GF2kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合
Figure RE-FDA0002471295930000081
具有以下特性:1)
Figure RE-FDA0002471295930000082
2)当u≠v时,
Figure RE-FDA0002471295930000083
统计每一个矩阵位置关系类别出现的频率
Figure RE-FDA0002471295930000084
其中
Figure RE-FDA0002471295930000085
表示集合
Figure RE-FDA0002471295930000086
中元素的个数,
Figure RE-FDA0002471295930000087
最后,在每一个特征向量子集
Figure RE-FDA0002471295930000088
上,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段和第j段笔画之间矩阵位置关系类型为u的两两笔画布局特征概率密度函数
Figure RE-FDA0002471295930000089
采用相同的方法,从集合矩阵GF2O×O的第1行第1列元素开始,按从左到右,从上到下的顺序,对矩阵中每一个元素GF2kj做同样的操作,1≤k≤O,1≤j≤O,得到相应的两两笔画布局特征概率密度函数
Figure RE-FDA00024712959300000810
A13)结束:关于标准汉字c的预训练过程结束,返回的数据包括:1)标准汉字c的第k段类型笔画在人群中出现和未出现的频率nk/N和
Figure RE-FDA00024712959300000811
2)人群书写关于标准汉字c的手写笔迹中两两类型笔画相交和未相交笔迹出现的频率ri×j/n1ij
Figure RE-FDA00024712959300000812
3)人群书写的标准汉字c的第k段类型笔画的单笔画布局特征联合概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;4)预训练手写笔迹样本集合中具有该特性的样本个数
Figure RE-FDA00024712959300000813
Figure RE-FDA00024712959300000814
5)人群书写的关于标准汉字c的具有该特性的两两笔画类型布局特征联合概率密度函数
Figure RE-FDA0002471295930000091
Figure RE-FDA0002471295930000092
所述具有该特性是指预学习手写笔迹样本中存在笔画被识别为第k和第j段笔画类型,且包含该两段类型笔画的面积最小的两矩形位置关系类型为u。
3.根据权利要求2所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤B)中,笔画布局特征注册包括如下步骤:
B1)注册开始:用户提交关于标准汉字c的注册手写笔迹样本集合H={h1,h2,...,hp},p≥3
B2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中出现的次数计数变量Ej=0,1≤j≤O,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中未出现的次数计数变量
Figure RE-FDA0002471295930000093
置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵VO×O=0O×O
Figure RE-FDA0002471295930000094
其中vij
Figure RE-FDA0002471295930000095
分别表示在手写笔迹样本集合H中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中有被识别为标准汉字c的第i和第j段的两段笔画且这两段笔画相交;初始化集合H中被识别为第k段类型的单笔画布局特征集合GF3k为空,k=1,2,...,O,初始化集合H中两两笔画间的布局特征集合矩阵GF4O×O中每一个元素GF4kj为空,1≤k≤O,1≤j≤O,其中矩阵的第k行第j列元素GF4kj表示被识别为第k段和第j段笔画之间的布局特征集合,O表示汉字c标准书写体所包含的基本笔画数;
B3)识别第i个注册样本hi的笔画类型:对注册样本hi按笔画进行分割,得到笔画序列
Figure RE-FDA0002471295930000101
识别hi中每一段笔画的类型,设
Figure RE-FDA0002471295930000102
表示返回的笔画类型识别结果,其中ok表示注册样本hi中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示hi中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在注册样本hi中,则计数变量Ek=Ek+1,否则,
Figure RE-FDA0002471295930000103
变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成注册样本hi对统计量Ek
Figure RE-FDA0002471295930000104
的更新;
B4)注册样本hi中两两笔画交叉点计算:以注册样本hi的笔画序列
Figure RE-FDA0002471295930000105
笔画类型识别结果
Figure RE-FDA0002471295930000106
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到注册样本hi的两两笔画间交叉点矩阵PO×O,和与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若注册样本hi中被识别为第k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
B5)笔画相交信息的统计量更新:从B4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若注册样本hi中存在笔画被识别为第k和第j笔画类型,且ptkj==1和pkj=(null,null),那么
Figure RE-FDA0002471295930000111
否则,若pkj≠(null,null),表示相应的两段笔画有相交,vkj=vkj+1,双重循环结束后,完成注册样本hi对统计量矩阵VO×O
Figure RE-FDA0002471295930000112
的更新;
B6)注册样本hi中单个笔画的布局特征计算:以注册样本hi的笔画序列
Figure RE-FDA0002471295930000113
笔画类型识别结果
Figure RE-FDA0002471295930000114
作为输入参数,得到注册样本hi的被识别为第k段笔画类型的笔画布局特征向量F3k,1≤k≤O;若注册样本hi中存在笔画被识别为第k段笔画类型,则F3k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F3k=null,1≤k≤O;
B7)单笔画布局特征统计量的更新:将在注册样本hi上得到的各个笔画布局特征向量F3k,k=1,2,...,O添加到相应的关于注册笔迹样本集H的单笔画布局特征集合中去GF3k,从第一段笔画开始到第O段笔画结束,若F3k==null,表示注册样本hi中没有笔画被识别为第k段笔画类型,不用更新,否则,GF3k=GF3k∪{F3k},循环结束后,完成关于注册笔迹样本集H的单笔画布局特征集合GF3k的更新,k=1,2,...,O;
B8)注册样本hi中两两笔画间的布局特征计算:以注册样本hi的笔画序列
Figure RE-FDA0002471295930000115
笔画类型识别结果
Figure RE-FDA0002471295930000116
与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,注册样本hi中两两笔画间的交叉点矩阵PO×O为输入参数,得到注册样本hi的两两笔画间布局特征向量矩阵F4O×O;若注册样本hi中存在两段笔画被识别为第k段和第j段笔画类型,则
Figure RE-FDA0002471295930000121
否则,
Figure RE-FDA0002471295930000122
Figure RE-FDA0002471295930000123
B9)两两笔画间布局特征统计量的更新:将在注册样本hi上得到的两两笔画间布局特征向量矩阵F4O×O,添加到相应的关于注册笔迹样本集H的两两笔画间布局特征集合矩阵中去GF4O×O,从步骤208返回的两两笔画间布局特征向量矩阵F4O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F4O×O的第k行第j列元素f4kj,若f4kj≠null,则GF4kj=GF4kj∪{f4kj};否则不用更新该统计量GF4kj;循环结束后,完成关于注册笔迹样本集H的两两笔画间布局特征集合GF4O×O的更新;
B10)i=i+1,若i≤p,则跳转至步骤B3),否则,则跳转至步骤B11);
B11)注册笔迹样本集H关于标准汉字c的单笔画布局特征在各个分量上的最大最小值:对于集合GF3k,GF3k表示以注册笔迹样本集H中由所有被识别为第k段类型笔画的单笔画布局特征构成的集合,计算单笔画布局特征的每一个分量在集合GF3k上的最大最小值,1≤k≤O;如果集合GF3k中元素个数小于2,那么最大最小值集合MF3k=null,否则用
Figure RE-FDA0002471295930000124
表示所求得的每个分量上的最大最小值集合,其中
Figure RE-FDA0002471295930000131
表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量在注册笔迹样本集H上的最大值,
Figure RE-FDA0002471295930000132
表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量的最小值,1≤u≤N2,1≤k≤O,N2表示单笔画布局特征向量中分量的个数,此步骤结束后,得到注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合
Figure RE-FDA0002471295930000133
B12)注册笔迹样本集H关于标准汉字c的两两笔画间布局特征在各个分量上的最大最小值:对注册笔迹样本集H上两两笔画间布局特征集合矩阵GF4O×O中的每一个元素GF4kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合
Figure RE-FDA0002471295930000134
子集
Figure RE-FDA0002471295930000135
表示集合GF4kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合
Figure RE-FDA0002471295930000136
具有以下特性:1)
Figure RE-FDA0002471295930000137
2)当u≠v时,
Figure RE-FDA0002471295930000138
统计每一个矩阵位置关系类别出现的次数,设
Figure RE-FDA0002471295930000139
表示集合
Figure RE-FDA00024712959300001310
中元素的个数;对于集合
Figure RE-FDA00024712959300001311
Figure RE-FDA00024712959300001312
那么
Figure RE-FDA00024712959300001313
否则,计算两两笔画间布局特征的每一个分量在集合
Figure RE-FDA00024712959300001314
上的最大最小值,1≤u≤N1,设
Figure RE-FDA00024712959300001315
表示所求得的每个分量上的最大最小值集合,其中
Figure RE-FDA00024712959300001316
表示被识别为第k和第j段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最大值,
Figure RE-FDA00024712959300001317
表示被识别为第k和第j 段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最小值,1≤u≤N1,1≤v≤N4,1≤k≤O,1≤j≤O,N4表示单笔画布局特征向量中分量的个数;
B13)结束:关于标准汉字c的注册过程结束,返回的数据包括:1)第k段笔画在注册笔迹样本集H中出现和未出现的次数Ek
Figure RE-FDA0002471295930000141
2)笔画相交点在注册笔迹样本集H中出现和未出现的次数矩阵vkj
Figure RE-FDA0002471295930000142
Figure RE-FDA0002471295930000143
3)注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合
Figure RE-FDA0002471295930000144
其中,N2表示单笔画布局特征向量中分量的个数;4)具有特定性质的注册笔迹样本个数
Figure RE-FDA0002471295930000145
所述具有特定性质的注册样本是指:a)来自于注册笔迹样本集H;b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画;c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为u;5)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值
Figure RE-FDA0002471295930000146
4.根据权利要求3所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤C)中,笔画布局特征认证包括如下步骤:
C1)认证阶段开始:用户输入关于标准汉字c的测试手写笔迹样本W;
C2)初始化:置标准汉字c的第j段笔画在测试手写笔迹样本W中出现的次数计数变量yj=0,1≤j≤O,置标准汉字c的第j段笔画在测试手写笔迹样本W中未出现的次数计数变量
Figure RE-FDA0002471295930000147
置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵ZO×O=0O×O
Figure RE-FDA0002471295930000151
其中zij
Figure RE-FDA0002471295930000152
分别表示在测试手写笔迹样本W中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交;
Figure RE-FDA0002471295930000153
C3)识别测试手写笔迹样本W的笔画类型,并更新统计量:对测试手写笔迹样本W按笔画进行分割,得到笔画序列
Figure RE-FDA0002471295930000154
识别笔迹W中每一段笔画的类型,设
Figure RE-FDA0002471295930000155
表示返回的笔画类型识别结果,其中ok表示测试手写笔迹样本W中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,nw表示W中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在测试手写笔迹样本W中,则计数变量yk=yk+1,否则,
Figure RE-FDA0002471295930000156
变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成测试手写笔迹样本W对统计量yk
Figure RE-FDA0002471295930000157
的更新;
C4)测试手写笔迹样本W中两两笔画交叉点计算:以测试手写笔迹样本W的笔画序列
Figure RE-FDA0002471295930000158
笔画类型识别结果
Figure RE-FDA0002471295930000159
人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间交叉点矩阵QO×O,和与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk,k=1,2,...,O;若测试手写笔迹样本W中被识别为第k段和第j段笔画不相交,那么交叉点矩阵QO×O中元素qtkj=0,交叉点集合Xk和Xj中交叉点qkj=(null,null)和qjk=(null,null);否则,交叉点矩阵QO×O中元素qtkj=1,交叉点集合Xk和Xj中交叉点qkj和qjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
C5)笔画交叉信息的统计量更新:从步骤C4)返回的两两笔画间交叉点矩阵QO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取QO×O的元素,若qkj=(null,null),表示测试手写笔迹样本W中被识别为第k和第j笔画类型的两段笔画没有相交,那么
Figure RE-FDA0002471295930000161
否则,表示相应的两段笔画有相交,zkj=zkj+1,双重循环结束后,完成测试手写笔迹样本W对统计量矩阵ZO×O
Figure RE-FDA0002471295930000162
的更新;
C6)测试手写笔迹样本W中单个笔画的布局特征计算:以测试手写笔迹样本W的笔画序列
Figure RE-FDA0002471295930000163
笔画类型识别结果
Figure RE-FDA0002471295930000164
作为输入参数,得到测试手写笔迹样本W的被识别为第k段笔画类型的笔画布局特征向量F5k,1≤k≤O;若测试手写笔迹样本W中存在笔画被识别为第k段笔画类型,则F5k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F5k=null,1≤k≤O;
C7)测试手写笔迹样本W中两两笔画间的布局特征计算:以测试手写笔迹样本W的笔画序列
Figure RE-FDA0002471295930000165
笔画类型识别结果
Figure RE-FDA0002471295930000166
与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk,k=1,2,...,O,测试手写笔迹样本W中两两笔画间的交叉点矩阵QO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间布局特征向量矩阵F6O×O;若测试手写笔迹样本W中中存在两段笔画被识别为第k段和第j段笔画类型,则f6kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f6kj=null,1≤k≤O,1≤j≤O;
C8)计算观察到测试手写笔迹样本W中各笔画的概率P1:若测试手写笔迹样本W中存在笔画被识别为第k段笔画类型且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段笔画类型,即yk==1且Ek≥2,那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即p1k=nk/N,否则,若测试手写笔迹样本W中不存在笔画被识别为第k段笔画类型且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中不存在笔画被识别为第k段笔画类型,即
Figure RE-FDA0002471295930000171
Figure RE-FDA0002471295930000172
那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即
Figure RE-FDA0002471295930000173
否则,表明第k段笔画类型在注册笔迹样本和注册笔画迹样本中出现方式不一致,置p1k=1;k=1,2,...,O,最后置
Figure RE-FDA0002471295930000174
C9)计算观察到测试样本笔迹W中交叉点的概率P2:若测试手写笔迹样本W中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画相交,而且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画相交,即zkj==1且vkj≥2,那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即p2kj=rkj/n1kj,否则,若测试手写笔迹样本W中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画不相交,而且在注册手写笔迹集合中具有这样的样本至少存在2个,所述具有这样的注册笔迹样本是指注册样本中存在笔画被识别为第k段和第j段笔画类型且所述这两段笔画不相交,即
Figure RE-FDA0002471295930000181
Figure RE-FDA0002471295930000182
那么取预学习阶段获取的该笔画出现的频率作为该笔画的出现概率,即
Figure RE-FDA0002471295930000183
否则,表明第k段和第j段笔画类型相交在注册笔迹样本和注册笔画迹样本中出现方式不一致,置p2kj=1,1≤k≤O,1≤j≤O,最后置
Figure RE-FDA0002471295930000184
C10)计算观察到测试样本笔迹W中单个笔画布局特征的概率P3:在注册样本集上,若被识别为第k段笔画类型的单笔画布局特征向量MF3k==null或者第k段笔画类型在测试样本W中未出现,则置p3k=1,1≤k≤O,否则,采用下式计算观察到测试手写笔迹中被识别为第k段笔画类型的单笔画布局特征的概率,
Figure RE-FDA0002471295930000185
其中f1k(·)表示在预训练阶段学习到的关于标准汉字c被识别为第k段笔画的单笔画布局特征概率密度函数,F5k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)表示在测试手写笔迹样本W中提取到的被识别为第k段笔画类型的单笔画布局特征向量,积分区域D=(d1,d2,...,dN2)由如下式所定义,
Figure RE-FDA0002471295930000186
其中vi表示特征向量F5k中第i个分量取值,
Figure RE-FDA0002471295930000187
Figure RE-FDA0002471295930000188
分别表示在注册阶段获取的在注册样本集合中所有被识别为第k段类型笔画的单笔画布局特征向量在第i个分量上的最大最小值,N2表示单笔画布局特征向量中分量的个数,变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,得到观测到所有笔画类型的概率p3k,1≤k≤O,最后,置观察到测试样本笔迹W中所有单个笔画布局特征的概率
Figure RE-FDA0002471295930000189
C11)计算观察到测试样本笔迹W中所有两两笔画间布局特征的概率矩阵PEO×O:以如下4种数据作为输入参数:1)测试手写笔迹样本W中两两笔画间的布局特征矩阵F6O×O,2)注册阶段获取的注册笔迹样本子集个数
Figure RE-FDA0002471295930000191
3)注册阶段获取的注册笔迹样本集关于笔画间布局特征在每个分量上的最大最小值
Figure RE-FDA0002471295930000192
Figure RE-FDA0002471295930000193
4)预训练阶段获取的标准汉字c关于两两笔画布局特征概率密度函数
Figure RE-FDA0002471295930000194
Figure RE-FDA0002471295930000195
得到观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率,1≤k≤O,1≤k≤O;
C12)计算观察到测试样本笔迹W中两两笔画间布局特征的概率P4:以测试笔迹样本W中的笔画作为结点集V,以概率矩阵PEO×O中的元素作为连接结点的无向边的权值E,得到一个无向带权图G=<V,E>,从图G出发,构造一个关于图G的最小生成树G'=<V,E'>,根据G'得到测试样本笔迹W中两两笔画间布局特征的概率
Figure RE-FDA0002471295930000196
C13)计算观察到测试样本笔迹W的布局特征概率P(W)=P1×P2×P3×P4;
C14)测试笔画与布局特征相关的判别:将布局特征概率P(W),融合笔画的其它特征,包括笔顺、书写用力、书写节奏,综合判断该测试样本笔迹W是否为真实笔迹;
C15)结束:测试笔迹的认证过程结束。
5.根据权利要求4所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:单个笔画的布局特征计算包括如下步骤:
D1)开始:设输入参数S={(x1,y1),(x2,y2),...,(xn,yn)}表示笔迹中笔画S的采样点时序数据,(xi,yi)表示笔画S中在第i个采样时刻笔尖的位置数据,
Figure RE-FDA0002471295930000201
表示笔画S与笔迹中其它笔画的交叉点坐标,其中
Figure RE-FDA0002471295930000202
表示交叉点二维的x,y坐标,下标si表示与S相交的笔画在笔迹中的序号,1≤i≤ms,ms表示Pc中交叉点的个数,与S相交的笔画是由人工标注的在标准书写体中本应出现相交的笔画,若手写体非标准笔迹中第si段笔画与S没有交叉点,那么用符号null表示,
Figure RE-FDA0002471295930000203
D2)计算笔画重心点G=(xg,yg):其中
Figure RE-FDA0002471295930000204
D3)寻找包含笔画S的面积最小的矩形V=(p1,p2,p3,p4):其中p1,p2,p3,p4是矩形的四个顶点,pi=(pxi,pyi),1≤i≤4,U=(U1,U2,U3,U4)表示矩形V的四条有向边,其中
Figure RE-FDA0002471295930000205
D4)计算矩形V的四条有向边长度:设|U1|=|U3|=a,|U2|=|U4|=b;
D5)计算笔画S的方位角:比较矩形V两条边的长度,若a>b,置W={U1,U3},若a<b,置W={U2,U4},若a=b,W={U1,U2,U3,U4},设Q表示以笔画S中第一个采样点(x1,y1)为开始点,以最后一个采样点(xn,yn)为结束点的向量,计算向量Q与集合W中每个向量之间的夹角QAngle,0≤QAngle≤180°,计算集合W中与向量Q之间夹角最小的向量,设Ux为集合W中与向量Q之间夹角最小的向量,计算向量Ux与X轴的夹角,设为Angle,以Angle表示笔画S的方位角,-180°≤Angle≤180°;
D6)选取由矩形V定义的坐标系:以步骤D5)介绍的所述矩形V中有向线段Ux的起点为新坐标系的原点,以所述矩形V中过该原点且相互垂直的两条边为所选坐标系的轴,规定在所述矩形V的两条相互垂直的两条边中,从原点到所述两条边的另一个顶点的方向为正方向,设所选坐标系的两条相互垂直的坐标轴为(Ux,Uy);
D7)计算采样点序列S={(x1,y1),(x2,y2),...,(xn,yn)}在由(Ux,Uy)构成的坐标系下各种极值点:计算序列S中的采样点在新坐标系(Ux,Uy)的x,y方向上极大值、极小值对应的点,设pxM,pxm分别表示x方向上极大和极小值,设pyM,pym分别表示y方向上极大和极小值,由四个极值点和笔画的第一个和最后一个点,得到关于笔画的基本点集合P1={pxM,pxm,pyM,pym,p1,pn},其中p1=(x1,y1),pn=(xn,yn);
D8)计算基本点在新坐标系下的位置坐标:以基本点集合P1和(Ux,Uy)作为输入参数,得到P1在新坐标下的位置坐标集合P1U={p1xM,p1xm,p1yM,p1ym,p11,p1n};
D9)计算交叉点Pc在新坐标系下的位置坐标:以基本点集合Pc和(Ux,Uy)作为输入参数,得到Pc在新坐标下的位置坐标集合PcU={PUs1,PUs2,...,PUsms};
D10)结束:返回笔画S的重心、方位角、矩形边长等布局特征取值(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)。
6.根据权利要求5所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:两两笔画间的布局特征计算包括如下步骤:
E1)开始:两两笔画间的布局特征计算包含的输入参数包括:1)T,S分别表示主笔画和从笔画采样点时间序列,2)
Figure RE-FDA0002471295930000221
表示从笔画S与笔迹中除主笔画T以外的其它笔画交叉点坐标,其中
Figure RE-FDA0002471295930000222
表示交叉点二维的x,y坐标,下标si表示与从笔画S相交的笔画在笔画序列中的序号,1≤i≤ms,si不等于主笔画T在笔画序列中的序号,ms表示Pc中交叉点的个数,与S相交的笔画是由人工标注的在标准书写体中本应出现的,若手写体非标准笔迹中第si段笔画与S没有交叉点,那么用符号null表示,
Figure RE-FDA0002471295930000223
3)主笔画T与从笔画S的交叉点PT={(PTx,PTy)},若在手写笔迹中主笔画T与从笔画S的没有交叉点,PT={(null,null)},4)包含T,S笔画且面积最小的矩形VT=(pt1,pt2,pt3,pt4),VS=(ps1,ps2,ps3,ps4),其中pt1,pt2,pt3,pt4,ps1,ps2,ps3,ps4分别表示矩形VT、VS的四个顶点,5)由矩形VS定义的坐标系(USx,USy),6)由矩形VT定义的坐标系(UTx,UTy),7)笔画S的重心GS=(xsg,ysg),8)笔画T的重心GT=(xtg,ytg);
E2)计算笔画T重心与笔画S重心之间的距离DisTS
E3)计算笔画T和笔画S的方位角DispTS:定义向量GTS,向量GTS以笔画T的重心GT=(xtg,ytg)作为起点,以笔画S的重心GS=(xsg,ysg)作为终点,计算向量GTS与书写平面X轴之间的夹角DispTS,以夹角DispTS作为笔画S与笔画T的方位角,-180°≤DispTS≤180°;
E4)计算笔画T和笔画S的夹角AngleTS:计算由矩形VT所定义的坐标系(UTx,UTy)和由矩形VS所定义的坐标系(USx,USy)中两个X坐标轴UTx和USx之间的夹角AngleTS,以AngleTS作为笔画S与笔画T的夹角,-180°≤AngleTS≤180°;
E5)计算矩形VT和VS的位置关系类型:以矩形VT和VS的四个顶点为参数,得到VT和VS的位置关系类型TD
E6)计算矩形VT和VS之间重叠区域的面积R;
E7)计算从笔画采样点序列S={(x1,y1),(x2,y2),...,(xn,yn)}在由(USx,USy)定义的新坐标系下各种极值点:计算从笔画序列S中的采样点在新坐标系(USx,USy)的x,y方向上极大值、极小值对应的点,设pxM,pxm分别表示x方向上极大和极小值,设pyM,pym分别表示y方向上极大和极小值,由四个极值点和从笔画S的第一个和最后一个采样点,得到关于笔画的基本点集合P1={pxM,pxm,pyM,pym,p1,pn},其中p1=(x1,y1),pn=(xn,yn);
E8)计算从笔画S的基本点在主笔画T定义的新坐标系下的位置坐标:以从笔画S的基本点集合P1和主笔画T定义的新坐标系(UTx,UTy)作为输入参数,得到从笔画S的基本点集合P1在主笔画T定义的新坐标下的位置坐标集合P1U={p1xM,p1xm,p1yM,p1ym,p11,p1n};
E9)计算从笔画S的交叉点Pc在主笔画T定义的新坐标系下的位置坐标:以从笔画S的交叉点集合Pc和(UTx,UTy)作为输入参数,得到Pc在主笔画T定义的新坐标下的位置坐标集合
Figure RE-FDA0002471295930000241
所述从笔画S的交叉点是指由人工标注的笔迹中除了主笔画T以外其它所有笔画本应与从笔画S的交叉点,所述本应与从笔画S的交叉点是指依据标准汉字c的表现形式,笔画之间应该出现的交叉点;
E10)计算主笔画T与从笔画S的交叉点PT在主笔画T定义的新坐标系下的位置坐标:以交叉点集合PT和(UTx,UTy)作为输入参数,得到交叉点集合PT在主笔画T定义的新坐标下的位置坐标集合PTU={(PTxU,PTyU)};
E11)结束:返回主笔画T与从笔画S的距离DisTS,主笔画T与从笔画S的方位角DispTS,主笔画T与从笔画S的夹角AngleTS,VT和VS的位置关系类型TD,矩形VT和VS之间重叠区域的面积R,从笔画S的基本点在主笔画T定义的新坐标系(UTx,UTy)下在坐标集合P1U,从笔画S的交叉点在主笔画T定义的新坐标系(UTx,UTy)下在坐标集合PcU,主笔画T与从笔画S的交叉点PT在主笔画T定义的新坐标系下的位置坐标PTU
7.根据权利要求6所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:人工标注标准汉字两两笔画是否交叉过程包括如下步骤:
F1)开始:开始:表示人工标注标准汉字中两两笔画是否相交过程的开始,输入参数为欲人工标注的标准汉字c;
F2)人工标注笔迹中应相交和不应相交的笔画:对于标准汉字c,根据所述标准汉字c的标准表现形式,由人工标注标准汉字c中笔画与笔画之间是否相交叉的信息,得到关于标准汉字c的笔画交叉矩阵;
F3)结束:返回关于标准汉字c的笔画交叉矩阵,标注过程被重复调用执行,得到关于所有标准汉字的笔画交叉矩阵。
8.根据权利要求7所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:两矩形间位置关系类型的计算包括如下步骤:
G1)开始:输入参数包括包含T,S笔画且面积最小的矩形VT=(pt1,pt2,pt3,pt4),VS=(ps1,ps2,ps3,ps4),其中pt1,pt2,pt3,pt4,ps1,ps2,ps3,ps4分别表示矩形VT、VS的四个顶点;
G2)对两个矩形的四条边分别进行标记:按x、y方向上的极大极小值,对矩形VT中的四个顶点作如下定义:若x、y方向上的极值唯一,标记pt1为与y极大值对应的顶点,标记pt2为与x极大值对应的顶点,标记pt3为与y极小值对应的顶点,标记pt4为与x极小值对应的顶点,若x、y方向上的极值不唯一,标记pt1为与y极大值和x极小值对应的顶点,标记pt1为与y极大值和x极大值对应的顶点,标记pt3为与y极小值和x极大值对应的顶点,标记pt4为与y极小值和x极小值对应的顶点,进一步,标记矩形VT中的四条边为
Figure RE-FDA0002471295930000251
Figure RE-FDA0002471295930000252
按同样的方法,标记矩形VS中的四个顶点ps1,ps2,ps3,ps4,然后,标记矩形VS中的四条边为
Figure RE-FDA0002471295930000253
Figure RE-FDA0002471295930000254
G3)计算矩形VT和VS的位置关系类型TD:对于矩形VT的四条边UT={UA,UB,UC,UD}和矩形VS的四条边US={Ua,Ub,Uc,Ud},分别计算UT中的任意一条边与US中的任意一条边是否相交,若相交,则将由相交的两条边组成的二元组添加到相交边集合中,计算矩形边所有两两边之间是否相交后,得到矩形VT和VS之间的边相交集合Dp,最后,依据Dp查询矩阵位置关系类型表得到矩形VT和VS的位置关系类型TD
所述分属两个矩形的两条边相交是指,若两条边之间没有交点,那么两条边不相交,若两条边之间有交点且所述交点位于其中任意一条边的终点,那么两条边不相交,若两条边之间有交点且所述交点没有位于其中任意一条边的终点,那么两条边相交;
所述矩形边的起点和终点定义如步骤G2)所述;
所述矩阵位置关系类型表是指包含两维信息:1)由所有相交边二元组构成的集合;2)分配给该集合的编号;矩阵位置关系类型表的具体计算过程为:首先收集两个矩形之间所有可能的位置关系,然后,按矩形边是否交相为依据对矩形位置关系进行分类,具有相同相交边二元组集合的两矩形属于同一个位置关系类别,最后,对所有的位置关系类别进行编号,得到矩阵位置关系类型表;在计算阶段,对于待识别位置关系的两矩形,计算所述矩形中由所有相交边二元组构成的集合,依据该集合查表得到两矩形的位置关系类型;
所述相交边二元组的第一个元素表示矩形VT的某一条边,第二个元素表示矩形VS的某一条边,相交边二元组表示分属于矩形VT和VS的这两条边相交;
G4)结束:返回矩形VT和VS的位置关系类型TD
9.根据权利要求8所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:计算观察到测试笔迹中所有两两笔画间布局特征概率矩阵包括如下步骤:
H1)开始:观察到测试笔迹中所有两两笔画间布局特征概率的计算过程的开始,输入参数包括:1)关于标准汉字c的测试手写笔迹样本W中两两笔画间的布局特征矩阵F6O×O,其中fkj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU),或者fkj=null,k=1,2,...,O,1≤j≤O,2)关于标准汉字c的注册手写笔迹样本集H中具有特定性质的注册笔迹样本个数
Figure RE-FDA0002471295930000271
其中,O表示标准汉字c包含的基本笔画数,N1表示两矩阵位置关系类型的类别数,所述具有特定性质的注册样本是指:a)来自于注册笔迹样本集H,b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画,c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为u,3)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值
Figure RE-FDA0002471295930000272
N4表示单笔画布局特征向量中分量的个数,4)标准汉字c关于两两笔画布局特征概率密度函数
Figure RE-FDA0002471295930000273
Figure RE-FDA0002471295930000274
H2)初始化:置观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O=1O×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率,pejk=1,1≤j≤O,1≤k≤O,初始化循环量m=1;
H3)初始化循环量n=1;
H4)若m==n,则跳转到步骤H10),否则,跳转到到步骤H5);
H5)取出测试笔迹中被识别为第m和第n段类型的两段笔画间布局特征fmn,若fmn==null,则跳转到步骤H10),否则,跳转到到步骤H6);
H6)从fmn中取出表示两矩阵位置关系类型的分量TD,1≤TD≤N1,所述两矩阵是指分别包含测试笔迹中被识别为第m和第n段类型笔画且面积最小的矩形;
H7)取出注册笔迹样本集中具有特定属性的注册笔迹样本子集元素个数变量
Figure RE-FDA0002471295930000281
所述注册笔迹样本集中具有特定属性的注册笔迹是指:1)所述注册笔迹样本中包含有被识别为第m和第n段类型两段笔画,2)包含第m和第n段类型两段笔画的矩形之间的位置关系类型与测试笔迹的相同,即u=TD
H8)若
Figure RE-FDA0002471295930000282
则跳转到步骤H10),否则,跳转到到步骤H9);
H9)计算观测到测试样本中被识别为第m和第n段类型的两段笔画间布局特征概率pemn,采用下式计算观察到测试手写笔迹中被识别为第m和第n段类型两段笔画的两笔画布局特征概率,
Figure RE-FDA0002471295930000283
其中
Figure RE-FDA0002471295930000284
N1表示两矩阵位置关系类型的类别数,
Figure RE-FDA0002471295930000285
表示在预训练阶段学习到的关于标准汉字c被识别为第m和第n段类型两段笔画的两笔画布局特征概率密度函数;fmn=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU)表示在测试手写笔迹样本W中提取到的被识别为第m和第n段类型的两段笔画布局特征向量,积分区域D由如下式所定义,
Figure RE-FDA0002471295930000286
其中vx表示特征向量fmn中第x个分量取值,N2表示两笔画布局特征向量中分量的个数,
Figure RE-FDA0002471295930000287
Figure RE-FDA0002471295930000288
分别表示在注册阶段获取在具有特定特性注册手写笔迹样本子集上提取的两笔画间布局特征向量在第x个分量上的最大最小值,所述注册笔迹样本集中具有特定属性的注册笔迹是指:1)所述注册笔迹样本中包含有被识别为第m和第n段类型两段笔画,2)包含第m和第n段类型两段笔画的矩形之间的位置关系类型为u;
H10)n=n+1,若n≤O,则跳转至步骤H4),否则,则跳转至步骤H11);
H11)m=m+1,若m≤O,则跳转至步骤H3),否则,则跳转至步骤H12);
H12)结束:观察到测试笔迹中所有两两笔画间布局特征概率的计算过程执行结束,返回结果为观察到测试笔迹中所有两两笔画间布局特征的概率矩阵PEO×O,其中矩阵中第k行第j列元素pejk表示观测到测试笔迹中被识别为第k和第j段类型的两段笔画间布局特征概率,1≤k≤O,1≤k≤O。
10.根据权利要求9所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:计算点在新坐标系下的位置坐标包括如下步骤:
I1)开始:开始计算点在新坐标系下的位置坐标,设输入参数为P={(x1,y1),(x2,y2),...,(xn,yn)}为待计算的书写平面上点的集合,n表示集合中点的个数,输入参数(Ux,Uy)为书写平面上相互垂直的向量,以两向量的交点作为新坐标系的原点,以向量Ux作为x轴,以向量Ux的方向为x轴的正方向,以向量Uy作为y轴,以向量Uy的方向为y轴的正方向;
I2)置下标变量i=1,置关键点在新坐标系下的坐标集合P1为空;
I3)取集合P中第i个点(xi,yi),计算点(xi,yi)在坐标系(Ux,Uy)中的坐标,设为PUi=(Pxi,Pyi),将PUi增加到P1集合,PU=PU∪{PUi},特别地,若(xi,yi)=(null,null),那么置PUi=(null,null);
I4)坐标归一化:xi=xi/||Ux||,yi=yi/||Uy||,其中||Ux||表示向量Ux的模,||Uy||表示向量Uy的模;
I5)i=i+1,若下标变量i<=n,跳转到步骤I3),否则,跳转到步骤I6);
I6)结束:返回点集P在新坐标系下的位置坐标PU={PU1,PU2,...,PUn},其中,PUi=(Pxi,Pyi)。
CN201911224773.7A 2019-12-04 2019-12-04 在线笔迹认证中一种笔迹布局特征的提取及认证方法 Active CN111652032B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911224773.7A CN111652032B (zh) 2019-12-04 2019-12-04 在线笔迹认证中一种笔迹布局特征的提取及认证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911224773.7A CN111652032B (zh) 2019-12-04 2019-12-04 在线笔迹认证中一种笔迹布局特征的提取及认证方法

Publications (2)

Publication Number Publication Date
CN111652032A true CN111652032A (zh) 2020-09-11
CN111652032B CN111652032B (zh) 2023-06-02

Family

ID=72349182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911224773.7A Active CN111652032B (zh) 2019-12-04 2019-12-04 在线笔迹认证中一种笔迹布局特征的提取及认证方法

Country Status (1)

Country Link
CN (1) CN111652032B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648906A (zh) * 2024-01-30 2024-03-05 北京点聚信息技术有限公司 一种版式文件隐写打印方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11312247A (ja) * 1998-04-30 1999-11-09 Nippon System Kaihatsu Kk 手書きによる筆者認証方法と電子ペン認証装置
JP2012048281A (ja) * 2010-08-24 2012-03-08 Nomura Research Institute Ltd 手書き認証システム及び手書き認証プログラム
CN103455741A (zh) * 2013-09-06 2013-12-18 武汉汉德瑞庭科技有限公司 一种基于字符的在线笔迹认证的模板扩充方法
CN103810506A (zh) * 2014-01-03 2014-05-21 南京师范大学 一种手写汉字笔画识别方法
CN103927532A (zh) * 2014-04-08 2014-07-16 武汉汉德瑞庭科技有限公司 基于笔画特征的笔迹配准方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11312247A (ja) * 1998-04-30 1999-11-09 Nippon System Kaihatsu Kk 手書きによる筆者認証方法と電子ペン認証装置
JP2012048281A (ja) * 2010-08-24 2012-03-08 Nomura Research Institute Ltd 手書き認証システム及び手書き認証プログラム
CN103455741A (zh) * 2013-09-06 2013-12-18 武汉汉德瑞庭科技有限公司 一种基于字符的在线笔迹认证的模板扩充方法
CN103810506A (zh) * 2014-01-03 2014-05-21 南京师范大学 一种手写汉字笔画识别方法
CN103927532A (zh) * 2014-04-08 2014-07-16 武汉汉德瑞庭科技有限公司 基于笔画特征的笔迹配准方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648906A (zh) * 2024-01-30 2024-03-05 北京点聚信息技术有限公司 一种版式文件隐写打印方法及系统
CN117648906B (zh) * 2024-01-30 2024-04-05 北京点聚信息技术有限公司 一种版式文件隐写打印方法及系统

Also Published As

Publication number Publication date
CN111652032B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN106971174A (zh) 一种cnn模型、cnn训练方法以及基于cnn的静脉识别方法
Tao et al. Unsupervised detection of built-up areas from multiple high-resolution remote sensing images
CN104573685B (zh) 一种基于线性结构提取的自然场景文本检测方法
CN110619274A (zh) 基于印章和签名的身份验证方法、装置和计算机设备
Sun et al. Monte Carlo convex hull model for classification of traditional Chinese paintings
CN107886062B (zh) 图像处理方法、系统及服务器
CN107169485A (zh) 一种数学公式识别方法和装置
Wang et al. Graph-based multiprototype competitive learning and its applications
CN108509925B (zh) 一种基于视觉词袋模型的行人重识别方法
CN104951788B (zh) 一种书法作品中单字笔画的提取方法
CN105718552A (zh) 基于服装手绘草图的服装图像检索方法
CN105930873A (zh) 一种基于子空间的自步跨模态匹配方法
Seidl et al. Automated classification of petroglyphs
CN107016319A (zh) 一种关键点定位方法和装置
CN103235947A (zh) 一种手写体数字识别方法及装置
Deng et al. Efficient 3D face recognition using local covariance descriptor and Riemannian kernel sparse coding
CN104050460B (zh) 多特征融合的行人检测方法
CN110298392A (zh) 一种标签约束自权重多超图学习的半监督分类方法
Chen et al. Invariant leaf image recognition with histogram of Gaussian convolution vectors
Mori et al. Global feature for online character recognition
Zhong et al. Exploring features and attributes in deep face recognition using visualization techniques
CN103824063A (zh) 基于稀疏表示的动态手势识别方法
CN105718934A (zh) 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法
CN105069403B (zh) 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别
CN111652032B (zh) 在线笔迹认证中一种笔迹布局特征的提取及认证方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant