CN111259726B - 在线笔迹认证中一种笔画动态特征的提取及认证方法 - Google Patents

在线笔迹认证中一种笔画动态特征的提取及认证方法 Download PDF

Info

Publication number
CN111259726B
CN111259726B CN201911224771.8A CN201911224771A CN111259726B CN 111259726 B CN111259726 B CN 111259726B CN 201911224771 A CN201911224771 A CN 201911224771A CN 111259726 B CN111259726 B CN 111259726B
Authority
CN
China
Prior art keywords
writing
stroke
handwriting
strokes
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911224771.8A
Other languages
English (en)
Other versions
CN111259726A (zh
Inventor
邹杰
王春枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN201911224771.8A priority Critical patent/CN111259726B/zh
Publication of CN111259726A publication Critical patent/CN111259726A/zh
Application granted granted Critical
Publication of CN111259726B publication Critical patent/CN111259726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明涉及信息安全领域,公开了在线笔迹认证中一种笔画动态特征的提取及认证方法,包括如下步骤:手写笔迹笔画书写动态特征预学习,提取笔画书写动态特征并估算在人群中出现的联合概率密度函数,手写笔迹笔画书写动态特征注册,统计笔画书写动态特征在注册手写笔迹样本集合中的最大、最小值并依此找出稳定的动态特征,笔画书写动态特征认证,计算稳定且一致笔画动态特征组合在人群中出现的概率,依此概率的大小作为进一步判别的依据。本发明在线笔迹认证中一种笔画动态特征的提取及认证方法,进一步估算所述笔画动态特征鉴别价值的方法,有助于识别出那些存在于局部细小的书写动作和习惯,从而为提升笔迹认证性能打下基础。

Description

在线笔迹认证中一种笔画动态特征的提取及认证方法
技术领域
本发明涉及信息安全领域,具体涉及在线笔迹认证中一种笔画动态特征的提取及认证方法。
背景技术
在线笔迹认证是指利用专门输入设备在线获取用户的手写笔迹,经比较其中所蕰涵的个性化特征从而实现用户身份鉴别的一项技术。计算机和电子技术的发展使得人们能够获取除字形图像这样常见的静态信息,还能获取书写过程中产生的速度、用力等动态信息。对摹仿者而言摹仿上述两种信息达到神形皆备是非常困难的,往往会顾此失彼。因此,在线笔迹认证受到广泛关注。
通常人们以整个笔迹作为特征提取对象来提取各种动态特征,例如采用各种变换计算频域特征,计算各种极值、均值、方差这种时域上统计特征,采用动态规划方法度量各种差异值特征等。以整个笔迹作为对象提取特征面临的最大问题是局部显著的差异被平滑了,即局部笔画间显著的差异,当被置于整体之中时不再显著或完全消失,例如某个局部笔画的差异经全局求和再平均后就消失了,导致笔画中那些细小的具有高度个性化的特征提取不出来。解决该问题的方法是以笔画为对象来提取特征,但这样又面临笔迹分割、笔画匹配、笔画类型识别等一系列难题。
发明内容
本发明的目的就是针对上述技术的不足,提供在线笔迹认证中一种笔画动态特征的提取及认证方法,进一步依据特征的稳定性和特殊性估算所提取笔画动态特征的鉴别价值,选取具有高鉴别价值的笔画动态特征进行认证,新方法有助于识别出那些存在于局部具有高鉴别价值的笔画书写动作和习惯,为提升笔迹认证性能打下基础。
为实现上述目的,本发明所设计的在线笔迹认证中一种笔画动态特征的提取及认证方法,包括如下步骤:
A)手写笔迹笔画书写动态特征预学习:收集人群关于标准汉字c的手写笔迹样本,识别所有手写笔迹样本中的笔画类型,以手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,包括笔画书写用力、书写速度的波形类型,书写用力波形和书写速度波形在波峰、波谷以及在X、Y方向上增量的最大、最小值、均值和方差,笔画书写耗时,书写用力和书写速度的截断频域特征,再对所提取的笔画书写动态特征中的离散型笔画特征,包括笔画类型、书写速度的波形类型,统计离散型笔画特征在人群中的分布律,对所提取的连续型笔画特征,包括波峰、波谷的最大、最小值,估算连续笔画型特征在人群中出现的联合概率密度函数;
书写动态特征是指手写设备采集到的书写过程中产生的动作笔画特征,包括书写用力和书写速度,所述笔画书写动态特征是以笔画为单位提取的书写动态特征;
手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字c是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
B)手写笔迹笔画书写动态特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,组成注册手写笔迹样本集合,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别所有注册手写笔迹样本中的笔画类型,按注册手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,所述笔画书写动态特征与在手写笔迹笔画书写动态特征预学习阶段所提取的笔画书写动态特征种类相同,统计笔画书写动态特征中各种离散型笔画特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画书写动态特征中各种连续型笔画特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画书写动态特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别测试手写笔迹样本中的笔画类型,按测试手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,找出注册手写笔迹样本中稳定且一致的各种笔画书写动态特征,依据在手写笔迹笔画书写动态特征预学习阶段计算得到的标准汉字c所有各种笔画书写动态特征在人群中的统计数据,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画书写动态特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画书写动态特征包括离散型稳定且一致笔画书写动态特征和连续型稳定且一致笔画书写动态特征;各种所述笔画书写动态特征在人群中的统计数据包括离散型笔画特征的分布律和连续型笔画特征的联合概率密度函数;
所述离散型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的离散型笔画书写动态特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画书写动态特征取值是相同的,所述稳定的离散型笔画书写动态特征是指具有相同离散型笔画书写动态特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的连续型笔画书写动态特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画书写动态特征取值的最大最小值之间,所述稳定的连续型笔画书写动态特征是指在注册手写笔迹样本集合上提取的连续型笔画书写动态特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。
优选地,所述步骤A)中,手写笔迹笔画书写动态特征预学习包括如下步骤:
A1)预学习开始:设S={s1,s2,...,sN}表示海量的足够多书写者手写的关于标准汉字c的手写笔迹样本集合,每位书写者提供了1至3个样本,N表示集合S中包含的笔迹个数,设T={t1,t2,...,tO}表示标准汉字c包含的所有笔画集合,O表示标准汉字c包含的笔画数;所述足够多是指集合S中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化:初始化循环变量i=1,初始化人群书写的关于标准汉字c的手写笔迹中被识别为tj笔画类型的计数变量
Figure SMS_1
tj∈T,1≤j≤O,初始化人群书写的关于标准汉字c的手写笔迹中被识别为tj类型的笔画且所述笔画的书写用力和速度波形类型分别为Fa和La的计数变量/>
Figure SMS_2
Fa∈FA,La∈LA,tj∈T,1≤j≤O;O表示标准汉字c包含的所有笔画类型数;FA和LA分别表示书写用力和书写速度波形类型集合;
A3)识别第i个手写笔迹样本si中的笔画类型:识别笔迹
Figure SMS_3
中各段笔画的类型,其中,符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤ni,ni表示手写笔迹si中采样点个数样,所述手写笔迹是由专门的手写笔迹采集设备通过实时采集笔迹书写过程中笔尖运动的轨迹而获得的时间序列,设/>
Figure SMS_4
表示识别手写笔迹si∈S中所有笔画得到的笔画类型集合,xi表示第i个手写笔迹样本si∈S中包含的被识别笔画类型数,/>
Figure SMS_5
1≤oj≤O,1≤j≤xi,O表示标准汉字c包含的所有笔画类型数;
A4)初始化j=1;
A5)笔画特征提取;提取手写笔迹样本si中与第j段被识别笔画类型tj对应的笔画书写速度和用力特征,以笔迹si∈S中被识别为tj的笔画
Figure SMS_6
作为输入参数,提取笔画书写用力和书写速度特征,其中笔画/>
Figure SMS_7
是笔迹si时间序列的一个子段,/>
Figure SMS_8
子段从第aj个采样点开始,共包含ns+1个采样点,ns>1,aj≥1,aj+ns≤ni,ni表示笔迹si中采样点个数,其中符号xk,yk,fk分别表示传感器在第k时刻获取笔尖二维位置信息和笔尖的压力信息,/>
Figure SMS_9
表示第k时刻笔尖的速度信息,/>
Figure SMS_10
表示笔迹si的书写速度信息时间序列,1<k≤ni,l1=0,设特征向量/>
Figure SMS_11
表示特征提取方法返回的与第j段被识别笔画类型tj对应的笔画/>
Figure SMS_12
的书写用力和书写速度特征;
A6)更新笔画类型计数变量:根据手写笔迹样本si中笔画的被识别笔画类型tj∈T,将计数变量
Figure SMS_13
加1,/>
Figure SMS_14
表示集合S中存在笔画被识别为tj类型的笔迹样本个数;/>
A7)更新笔画书写用力和实现书写速度波形类型计数变量:设特征向量
Figure SMS_15
中Fa∈FA,La∈LA分量分别表示从笔迹si的被识别为tj的笔画/>
Figure SMS_16
中提取的书写用力和书写速度的波形类型,将与Fa和La值对应的计数变量/>
Figure SMS_17
加1,/>
Figure SMS_18
表示在所有包含被识别为tj类型笔画的预学习笔迹样本中书写用力和书写速度波形为Fa和La类型的手写笔迹样本个数,计数变量/>
Figure SMS_19
和/>
Figure SMS_20
的初值均为0,Fa∈FA,La∈LA,tj∈T,1≤j≤O;
A8)将笔画书写用力和书写速度波形特征数据放到相应的集合中:对从第i个手写笔迹样本被识别为tj笔画类型的笔画中提取的书写速度和书写用力特征向量
Figure SMS_21
去掉书写用力和书写速度的波形类型Fa和La,得到向量/>
Figure SMS_22
将/>
Figure SMS_23
加入到集合/>
Figure SMS_24
Figure SMS_25
中,其中/>
Figure SMS_26
表示集合/>
Figure SMS_27
中特征向量的个数;
A9)j=j+1,若j≤xi,则跳转至步骤A5),提取下一段笔画书写用力和书写速度特征,并更新相关的统计变量,否则,跳转至步骤A10);
A10)i=i+1,若i≤N,则跳转至步骤A3),识别下一个手写笔迹样本类型,否则,跳转至步骤A11);
A11)统计各种笔画类型在人群中的分布律:计算人群书写的关于标准汉字c的手写笔迹中被识别为tj笔画类型的分布律
Figure SMS_28
1≤j≤O,tj∈T;
A12)统计各种笔画类型的书写用力和书写速度波形类型在人群中的分布律:计算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中,所述笔画的书写用力和书写速度波形类型分别为Fa和La的分布律
Figure SMS_29
Fa∈FA,La∈LA,tj∈T,1≤j≤O;
A13)估算各种笔画类型的书写用力和书写速度特征的概率密度函数:基于每一组特征向量集合
Figure SMS_30
tj∈T,1≤j≤O,估算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中除去波形类型分量后的书写用力和速度特征向量的概率密度函数/>
Figure SMS_31
其中,tj∈T,1≤j≤O;
A14)结束:返回计算得到的人群手写的关于标准汉字c的手写笔迹中存在笔画被识别为tj笔画类型的分布律
Figure SMS_32
1≤j≤O,tj∈T,各种笔画类型的书写用力和书写速度的波形类型组合的分布律/>
Figure SMS_33
Fa∈FA,La∈LA,tj∈T,1≤j≤O,以及各种笔画书写用力和书写速度特征向量概率密度函数/>
Figure SMS_34
tj∈T,1≤j≤O。
优选地,所述步骤B)中,手写笔迹笔画书写动态特征注册包括如下步骤:
B1)注册开始:注册用户提交关于标准汉字c的注册手写笔迹样本集合H={h1,h2,...,hp},p≥3;
B2)统计笔画出现和未出现的次数:计算注册手写笔迹样本集合H中每个笔迹样本的笔画类型,然后统计标准汉字c的每个笔画tj∈T在H中出现和未出现的次数,设
Figure SMS_35
和/>
Figure SMS_36
分别表示笔画tj出现和未出现的次数,/>
Figure SMS_37
从集合H中选取一个笔迹样本hi,计算hi中每一段笔画的笔画类型,设/>
Figure SMS_38
表示hi中出现的笔画类型集合,/>
Figure SMS_39
表示hi中未出现的笔画类型集合,E1∪E2=T,x1+x2=O,T表示标准汉字c包含的所有基本笔画集合,O表示T中包含的笔画类型个数;从集合H中取出一个注册手写笔迹样本,若笔画类型tj出现在所述注册手写笔迹样本中,则置
Figure SMS_40
tj∈E1;否则,置/>
Figure SMS_41
tj∈E2,重复上述过程,完成对集合H中其他笔迹样本中笔画类型出现和未出现次数的统计;
B3)初始化,j=1;
B4)若
Figure SMS_42
跳转至步骤B7),否则,跳转至步骤B5);
B5)提取所有注册手写笔迹样本中被识别tj笔画类型的书写用力和书写速度特征,设
Figure SMS_43
表示包含笔画类型tj的kj个注册手写笔迹样本集合,从所述集合H1定义的每个注册手写笔迹样本的被识别为tj笔画类型的笔画中提取书写用力和书写速度特征向量,设/>
Figure SMS_44
表示从所述集合H1的注册手写笔迹样本中提取的书写用力和书写速度特征向量,特征向量/>
Figure SMS_45
表示从注册手写笔迹样本/>
Figure SMS_46
被识别为tj类型的笔画中提取的书写用力和书写速度特征向量,1≤i≤kj,kj表示集合/>
Figure SMS_47
中特征向量的个数;
所述包含笔画类型tj是指注册手写笔迹样本中存在笔画被识别为tj笔画类型;
B6)统计除书写用力和书写速度波形类型分量的每个分量上的最大最小值;设
Figure SMS_48
表示从特征向量集合ftj中计算得到的除书写用力和书写速度波形类型分量的在其余每个特征分量上的最大最小值,
Figure SMS_49
Figure SMS_50
表示集合/>
Figure SMS_51
的第r个特征向量中除书写用力和书写速度波形类型分量的第i个分量的值,1≤r≤kj,1≤i≤n,kj表示集合/>
Figure SMS_52
中特征向量的个数,n表示特征向量除去书写用力和书写速度波形类型分量后分量的个数;
B7)j=j+1,若j≤O,则跳转至步骤B4),提取被识别为下一段笔画类型的笔画书写用力和书写速度特征;否则,跳转至步骤B8);
B8)结束:返回注册手写笔迹样本集H中包含和未包含被识别为tj类型的笔画的样本个数
Figure SMS_53
和/>
Figure SMS_54
tj∈T,1≤j≤O,在/>
Figure SMS_55
的注册手写笔迹样本集合中书写用力和书写速度波形类型取值为Fa和La的特征向量个数/>
Figure SMS_56
Fa∈FA,La∈LA,tj∈T,1≤j≤O,以及笔画书写用力和书写速度特征向量在各个分量上的最大最小值/>
Figure SMS_57
tj∈T,1≤j≤O。
优选地,所述步骤C)中,笔画书写动态特征认证包括如下步骤:
C1)认证阶段开始:待认证用户输入关于标准汉字c的测试手写笔迹样本W;
C2)识别测试笔迹样本中W每段笔画的类型:采用笔画识别算法识别W中每段笔画的类型,设
Figure SMS_58
表示在测试手写笔迹样本中由所有出现笔画类型构成的集合,/>
Figure SMS_59
表示测试手写笔迹样本中由所有未出现笔画类型构成的集合,所述出现笔画类型是指手写笔迹样本W中存在一段手写笔画被识别为该笔画类型,所谓未出现笔画类型是指手写笔迹样本W中不存在一段手写笔画被识别为该笔画类型;对于EW和/>
Figure SMS_60
有/>
Figure SMS_61
C3)估算稳定且一致的出现和未出现笔画的概率:估算同时观察到测试手写笔迹样本W中稳定且一致出现和未出现笔画的概率,对于出现笔画类型
Figure SMS_63
若所述被识别为
Figure SMS_67
类型的笔画在注册笔迹样本集中的出现次数大于所述被识别为/>
Figure SMS_68
类型的笔画在注册笔迹样本集中的未出现的次数,即/>
Figure SMS_64
那么取预学习阶段获取的所述笔画类型为/>
Figure SMS_69
的预学习手写笔迹样本出现的频率作为该笔画的出现概率,即/>
Figure SMS_70
否则/>
Figure SMS_75
其中,1≤i≤n1,对于未出现笔画/>
Figure SMS_62
若所述被识别为/>
Figure SMS_66
类型的笔画在注册笔迹样本集中的未出现次数大于所述被识别为/>
Figure SMS_71
类型的笔画在注册笔迹样本集中的出现次数,即
Figure SMS_72
那么取预学习阶段获取的该笔画未出现的频率作为该笔画的未出现概率,即
Figure SMS_65
否则/>
Figure SMS_73
1≤j≤n2,将所有出现和未出现笔画的概率相乘
Figure SMS_74
得到观察到测试手写笔迹样本W中稳定且一致的出现和未出现笔画的概率;
所述稳定出现笔画类型是指笔画类型在注册手写笔迹样本集合中出现的次数大于所述该笔画类型在注册手写笔迹样本集合中未出现的次数;
所述稳定未出现笔画类型是指笔画类型在注册手写笔迹样本集合中未出现的次数大于所述该笔画类型在注册手写笔迹样本集合中出现的次数;
所述一致出现笔画类型是指在测试手写笔迹样本中出现的笔画类型在注册手写笔迹样本集合中是稳定出现的笔画类型;
所述一致未出现笔画类型是指在测试手写笔迹样本中未出现的笔画类型在注册手写笔迹样本集合中是稳定未出现的笔画类型;
用符号T1W表示稳定且一致的出现笔画类型,
Figure SMS_76
/>
所述稳定的书写用力和速度波形类型特征是指在注册手写笔迹样本集合的稳定出现笔画类型中,至少在给定阈值的注册手写笔迹样本中,所述笔画的书写用力和速度波形类型是相同的;
所述一致书写用力和速度特征分量是指对测试手写笔迹稳定且一致出现笔画类型,从与所述笔画类型对应的手写笔画中提取的书写用力和速度特征分量处于相应注册手写笔迹特征分量的最大最小值之间;
所述笔画类型为
Figure SMS_77
的笔画出现和未出现的频率数据为在预学习阶段在预学习手写笔迹样本集合中所获取的统计数据;
C4)置循环变量k=1,开始计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率;
C5)取出第k个被识别笔画类型:从集合T1W中取出第k个被识别笔画类型tk,所述集合T1W表示测试手写笔迹样本中稳定且一致的出现笔画类型集合,
Figure SMS_78
C6)提取测试笔迹中相应笔画的动态特征向量:从测试手写笔迹样本中截取被识别为tk类型的笔画
Figure SMS_79
计算测试手写笔迹中被识别为tk类型的笔画书写动态特征,得到特征向量/>
Figure SMS_80
所述笔画书写动态特征为笔画书写时产生的用力特征和书写速度特征;
C7)估算观测到稳定且一致的动态特征波形类型的概率:从特征向量
Figure SMS_83
中读取表示书写用力和书写速度波形类型的分量Fa和La,按tk、Fa、La三个数据查询在注册笔迹样本集合中包含的被识别为tk类型的笔画,且所述笔画的书写用力和书写速度波形类型为Fa、La的注册笔迹样本个数变量/>
Figure SMS_85
若/>
Figure SMS_87
则置/>
Figure SMS_82
否则置/>
Figure SMS_84
其中
Figure SMS_86
表示预学习手写笔迹样本集合中存在笔画被识别为tk类型的手写笔迹样本个数,/>
Figure SMS_88
表示在/>
Figure SMS_81
个包含tk类型笔画的预学习手写笔迹样本中,所述笔画的书写用力和书写速度波形类型为Fa和La的笔迹样本个数;
C8)估算观测到稳定且一致的动态特征值的联合概率:在预学习阶段获得的所有联合概率密度函数数据中查找与笔画类型tk相对应的书写用力和书写速度特征联合概率密度函数
Figure SMS_89
按式/>
Figure SMS_90
计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率,积分区域D=(d1,d2,...,dn)由下式所定义,
Figure SMS_91
其中Mi和mi表示在注册阶段获得的关于tk类型笔画书写用力和书写速度特征向量的各个分量最大最小值,ri表示特征向量/>
Figure SMS_92
中第i个特征分量;
C9)k=k+1,若k大于集合T1W中元素的个数,则跳转至步骤C10),否则,跳转至步骤C5);
C10)估算观测到测试笔迹中所有稳定且一致特征的概率:计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率
Figure SMS_93
C11)结合其它笔画特征进行判别:计算P(W)=P1(W)×P2(W),将笔画书写用力和书写速度特征观测概率P(W),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试样本笔迹W是否为真实笔迹。
优选地,笔画动态特征的提取包括如下步骤:
1)开始:设
Figure SMS_94
为输入数据,表示书写笔画A时传感器采集到的经过平滑去噪后的数据,其中x,y表示笔尖的二维位置信息,f表示笔尖的压力信息,l表示笔尖的速度信息;
所述笔画动态特征是指手写设备采集到的笔画书写过程中产生的动作特征,主要包括书写用力和书写速度两类特征;
2)计算书写用力和书写速度信息的极大极小值:设Mf={Mf1,Mf2,...,Mfn1},mf={mf1,mf2,...,mfn2}分别表示书写用力极大极小值在笔画A中的书写用力序列
Figure SMS_95
中的下标,其中,1<Mfi<Mfi+1<na,1≤i<n1,1<mfj<mfj+1<na,1≤j<n2,设Ml={Ml1,Ml2,...,Mln3},ml={ml1,ml2,...,mln4}分别表示书写用力极大极小值在笔画A中的书写速度序列/>
Figure SMS_96
中的下标,其中,1<Mli<Mli+1<na,1≤i<n3,1<mlj<mlj+1<na,1≤j≤n4,对于书写用力极大和极小值序列,若Mf1<mf1,则Maxf=Mf,Minf=mf∪{1},否则,Maxf=Mf∪{1},Minf=mf,接下来,进一步判断,若Mfn1<mfn2,则Maxf=Maxf∪{na},否则,Minf=Minf∪{na},对于书写速度极大和极小值序列,若Ml1<ml1,则Maxl=Ml,Minl=ml∪{1},否则,Maxl=Ml∪{1},Minl=ml,接下来,进一步判断,若Mln3<mln4,则Maxl=Maxl∪{na};否则,Minl=Minl∪{na};
3)计算书写用力和书写速度波形的类型:设A1={a1,a2,...,an5+n6}=Maxf∪Minf表示合并集合Maxf、Minf后并按从小到大顺序排列的下标集合,其中ai∈Minf或ai∈Maxf,1=a1<ai<ai+1<an5+n6=na,1<i<n5+n6,n5,n6分别表示集合Maxf、Minf中元素的个数,对集合A1中任意两个相邻的元素ai-1、ai,若
Figure SMS_97
则序列Fs中从第ai-1至第ai个元素为波形的上升段,用符号"d"表示,/>
Figure SMS_102
为上升段的谷点,/>
Figure SMS_103
为上升段的峰点,dx=ai-ai-1表示上升段在X轴方向的增量,/>
Figure SMS_98
表示上升段在Y轴方向的增量,若/>
Figure SMS_100
则序列Fs中从第ai-1至第ai个元素为波形的下降段,用符号"P"表示,/>
Figure SMS_101
为上升段的峰点,/>
Figure SMS_104
为上升段的谷点,dx=ai-ai-1表示上升段在X轴方向的增量,/>
Figure SMS_99
表示上升段在Y轴方向的增量,笔画A的书写用力时间序列可以用由符号"d"、"P"构成的符号序列表示,依据所述由符号'd'、'P'构成的符号串表示的书写用力时间序列的波形类型被定义为/>
Figure SMS_105
或者/>
Figure SMS_106
对书写速度时间序列
Figure SMS_107
按所述对书写用力波形类型同样的定义方法,依据所述由符号'd'、'P'构成的符号串表示的书写速度时间序列的波形类型被定义为
Figure SMS_108
或者/>
Figure SMS_109
FA={F0,F1,F2,...,F16}表示所有书写用力波形类型的集合,LA={L0,L1,L2,...,L16}表示所有书写速度波形类型的集合;
4)计算由极大值下标集合Maxf定义的书写用力峰值点向量
Figure SMS_110
n5表示集合Maxf中元素的个数,计算由极小值下标集合Minf定义的书写用力谷值点向量/>
Figure SMS_111
n6表示集合Minf中元素的个数,计算书写用力序列上升段和下降段中在X轴方向上增量向量Dxf=(dx1,dx2,...,dxn7),其中dxi=ai-ai-1,1<i≤n5+n6,ai∈A1,ai-1∈A1,n7=n5+n6-1,计算书写用力序列上升段和下降段中在Y轴方向上增量绝对值向量Dyf=(dy1,dy2,...,dyn7),其中/>
Figure SMS_112
1<i≤n5+n6,
Figure SMS_113
ai∈A1,ai-1∈A1,n7=n5+n6-1,计算书写速度序列峰值点向量Ul,谷点向量Vl,X轴方向上增量向量Dxl,Y轴方向上增量绝对值向量Dyl
5)计算由向量Uf中所有分量构成集合的关于书写用力极大值的最大值、最小值、极大值均值,极大值标准差{MaxMf,MinMf,AvgMf,StdMf},计算由向量Vf中所有分量构成集合的关于书写用力极小值的最大值、最小值、极大值均值,极大值标准差{Maxmf,Minmf,Avgmf,Stdmf},计算由向量Dxf中所有分量构成集合的关于书写用力序列在X轴方向上增量的最大值、最小值、极大值均值,极大值标准差
Figure SMS_114
计算由向量Dyf中所有分量构成集合的关于书写用力序列在Y轴方向上增量绝对值的最大值、最小值、极大值均值,极大值标准差/>
Figure SMS_115
6)计算由向量Ul中所有分量构成集合的关于书写速度极大值的最大值、最小值、极大值均值,极大值标准差{MaxMl,MinMl,AvgMl,StdMl},计算由向量Vl中所有分量构成集合的关于书写速度极小值的最大值、最小值、极大值均值,极大值标准差{Maxml,Minml,Avgml,Stdml},计算由向量Dxl中所有分量构成集合的关于书写速度序列在X轴方向上增量的最大值、最小值、极大值均值,极大值标准差
Figure SMS_116
计算由向量Dyl中所有分量构成集合的关于书写速度序列在Y轴方向上增量绝对值的最大值、最小值、极大值均值,极大值标准差/>
Figure SMS_117
7)取笔画序列A中采样点个数na作为书写耗时特征;
8)提取笔画A的频域特征:将书写用力时间序列
Figure SMS_118
变换到频域空间,以前x项系数作为Fs的书写用力频域特征表示Ef={ef1,ef2,...,efx};将书写速度时间序列/>
Figure SMS_119
变换到频域空间,以前x项系数作为Ls的书写用力频域特征表示E1={e11,e12,...,e1x};
9)结束:返回关于笔画A的动态特征向量,包括书写用力和书写速度波形的类型,书写用力波形在波峰、波谷以及在X、Y方向上增量的最大、最小值以及均值和方差,书写速度波形在波峰、波谷以及在X、Y方向上增量的最大、最小值以及均值和方差,笔画书写耗时,以及书写用力和书写速度的截断频域特征,共五类特征值构成的特征向量。
本发明与现有技术相比,具有以下优点:对已知书写内容的非标准任意手写体笔迹,能有效提取出那些处于局部的笔画书写动态特征,有助于识别出那些存在于局部细小的书写动作和习惯,并估算稳定且一致笔画书写力和书写速度特征在人群中出现的概率,从而达到提升认证准确性的目的。
附图说明
图1为本发明在线笔迹认证中一种笔画动态特征的提取及认证方法的流程图;
图2为图1中步骤A)的具体流程图;
图3为图1中步骤B)的具体流程图;
图4为图1中步骤C)的具体流程图;
图5为本发明在线笔迹认证中一种笔画动态特征的提取及认证方法中笔画动态特征提取的具体流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
在线笔迹认证中一种笔画动态特征的提取及认证方法,如图1所示,包括如下步骤:
A)手写笔迹笔画书写动态特征预学习:收集人群关于标准汉字c的手写笔迹样本,识别所有手写笔迹样本中的笔画类型,以手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,包括笔画书写用力、书写速度的波形类型,书写用力波形和书写速度波形在波峰、波谷以及在X、Y方向上增量的最大、最小值、均值和方差,笔画书写耗时,书写用力和书写速度的截断频域特征,再对所提取的笔画书写动态特征中的离散型笔画特征,包括笔画类型、书写速度的波形类型,统计离散型笔画特征在人群中的分布律,对所提取的连续型笔画特征,包括波峰、波谷的最大、最小值,估算连续型笔画特征在人群中出现的联合概率密度函数;
书写动态特征是指手写设备采集到的书写过程中产生的动作特征,包括书写用力和书写速度,笔画书写动态特征是以笔画为单位提取的书写动态特征;
手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
具体而言,如图2图所示,手写笔迹笔画书写动态特征预学习包括如下步骤:
A1)预学习开始:设S={s1,s2,...,sN}表示海量的足够多书写者手写的关于标准汉字c的手写笔迹样本集合,每位书写者提供了1至3个样本,N表示集合S中包含的笔迹个数,设T={t1,t2,...,tO}表示标准汉字c包含的所有笔画集合,O表示标准汉字c包含的笔画数;所述足够多是指集合S中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;
A2)初始化:初始化循环变量i=1,初始化人群书写的关于标准汉字c的手写笔迹中被识别为tj类型的计数变量
Figure SMS_120
tj∈T,1≤j≤O,初始化人群书写关于标准汉字c的手写笔迹中被识别为tj类型的笔画且笔画的书写用力和速度波形类型分别为Fa和La的计数变量/>
Figure SMS_121
Fa∈FA,La∈LA,tj∈T,1≤j≤O;O表示标准汉字c包含的所有笔画类型数;FA和LA分别表示书写用力和书写速度波形类型集合;
A3)识别第i个手写笔迹样本si中的笔画类型:识别笔迹
Figure SMS_122
中各段笔画的类型,其中,符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤ni,ni表示手写笔迹si中采样点个数样,手写笔迹是由专门的手写笔迹采集设备通过实时采集笔迹书写过程中笔尖运动的轨迹而获得的时间序列,设/>
Figure SMS_123
表示识别手写笔迹si∈S中所有笔画得到的笔画类型集合,xi表示第i个手写笔迹样本si∈S中包含的被识别笔画类型数,
Figure SMS_124
1≤oj≤O,1≤j≤xi,O表示标准汉字c包含的所有笔画类型数;
A4)初始化j=1;
A5)笔画特征提取;提取手写笔迹样本si中与第j段被识别笔画类型tj对应的笔画书写速度和用力特征,以笔迹si∈S中被识别为tj的笔画
Figure SMS_125
作为输入参数,提取笔画书写用力和书写速度特征,其中笔画/>
Figure SMS_126
是笔迹si时间序列的一个子段,/>
Figure SMS_127
子段从第aj个采样点开始,共包含ns+1个采样点,ns>1,aj≥1,aj+ns≤ni,ni表示笔迹si中采样点个数,其中符号xk,yk,fk分别表示传感器在第k时刻获取笔尖二维位置信息和笔尖的压力信息,/>
Figure SMS_128
表示第k时刻笔尖的速度信息,/>
Figure SMS_129
表示笔迹si的书写速度信息时间序列,1<k≤ni,l1=0,设特征向量/>
Figure SMS_130
表示特征提取方法返回的与第j段被识别笔画类型tj对应的笔画/>
Figure SMS_131
的书写用力和书写速度特征;
A6)更新笔画类型计数变量:根据手写笔迹样本si中笔画的被识别笔画类型tj∈T,将计数变量
Figure SMS_132
加1,/>
Figure SMS_133
表示集合S中存在笔画被识别为tj类型的笔迹样本个数;
A7)更新笔画书写用力和实现书写速度波形类型计数变量:设特征向量
Figure SMS_134
中Fa∈FA,La∈LA分量分别表示从笔迹si的被识别为tj的笔画/>
Figure SMS_135
中提取的书写用力和书写速度的波形类型,将与Fa和La值对应的计数变量/>
Figure SMS_136
加1,/>
Figure SMS_137
表示在所有包含被识别为tj类型笔画的预学习笔迹样本中书写用力和书写速度波形为Fa和La类型的手写笔迹样本个数,计数变量/>
Figure SMS_138
和/>
Figure SMS_139
的初值均为0,Fa∈FA,La∈LA,tj∈T,1≤j≤O;
A8)将笔画书写用力和书写速度波形特征数据放到相应的集合中:对从第i个手写笔迹样本被识别为tj笔画类型的笔画中提取的书写速度和书写用力特征向量
Figure SMS_140
去掉书写用力和书写速度的波形类型Fa和La,得到向量/>
Figure SMS_141
将/>
Figure SMS_142
加入到集合/>
Figure SMS_143
Figure SMS_144
中,其中/>
Figure SMS_145
表示集合/>
Figure SMS_146
中特征向量的个数;
A9)j=j+1,若j≤xi,则跳转至步骤A5),提取下一段笔画书写用力和书写速度特征,并更新相关的统计变量,否则,跳转至步骤A10);
A10)i=i+1,若i≤N,则跳转至步骤A3),识别下一个手写笔迹样本类型,否则,跳转至步骤A10);
A11)统计各种笔画类型在人群中的分布律:计算人群书写的关于标准汉字c的手写笔迹中笔画被识别为tj笔画类型的分布律
Figure SMS_147
1≤j≤O,tj∈T;
A12)统计各种笔画类型的书写用力和书写速度波形类型在人群中的分布律:计算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中,笔画的书写用力和书写速度波形类型分别为Fa和La的分布律
Figure SMS_148
Fa∈FA,La∈LA,tj∈T,1≤j≤O;
A13)估算各种笔画类型的书写用力和书写速度特征的概率密度函数:基于每一组特征向量集合
Figure SMS_149
tj∈T,1≤j≤O,估算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中除去波形类型分量后的书写用力和速度特征向量的概率密度函数/>
Figure SMS_150
其中,tj∈T,1≤j≤O;
A14)结束:返回计算得到人群手写的关于标准汉字c的手写笔迹中存在笔画被识别为tj笔画类型的分布律
Figure SMS_151
1≤j≤O,tj∈T,各种笔画类型的书写用力和书写速度的波形类型组合的分布律/>
Figure SMS_152
Fa∈FA,La∈LA,tj∈T,1≤j≤O,以及各种笔画书写用力和书写速度特征向量概率密度函数/>
Figure SMS_153
tj∈T,1≤j≤O;
B)手写笔迹笔画书写动态特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,组成注册手写笔迹样本集合,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别所有注册手写笔迹样本中的笔画类型,按注册手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,笔画书写动态特征与在手写笔迹笔画书写动态特征预学习阶段所提取的笔画书写动态特征种类相同,统计笔画书写动态特征中各种离散型笔画特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画书写动态特征中各种连续型笔画特征在注册手写笔迹样本集合中的最大、最小值;
注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,用户身份已知是指手写笔迹书写者的身份是已知的;
具体而言,如图3所示,手写笔迹笔画书写动态特征注册包括如下步骤:
B1)注册开始:注册用户提交关于标准汉字c的注册手写笔迹样本集合H={h1,h2,...,hp},p≥3;
B2)统计笔画出现和未出现的次数:计算注册手写笔迹样本集合H中每个笔迹样本的笔画类型,然后统计标准汉字c的每个笔画tj∈T在H中出现和未出现的次数,设
Figure SMS_154
和/>
Figure SMS_155
分别表示笔画tj出现和未出现的次数,/>
Figure SMS_156
从集合H中选取一个笔迹样本hi,计算hi中每一段笔画的笔画类型,设/>
Figure SMS_157
表示hi中出现的笔画类型集合,/>
Figure SMS_158
表示hi中未出现的笔画类型集合,E1∪E2=T,x1+x2=O,T表示标准汉字c包含的所有基本笔画集合,O表示T中包含的笔画类型个数;从集合H中取出一个注册手写笔迹样本,若笔画类型tj出现在所述注册手写笔迹样本中,则置
Figure SMS_159
tj∈E1;否则,置/>
Figure SMS_160
tj∈E2,重复上述过程,完成对集合H中其他笔迹样本中笔画类型出现和未出现次数的统计;
B3)初始化,j=1;
B4)若
Figure SMS_161
跳转至步骤B7),否则,跳转至步骤B5);
B5)提取所有注册手写笔迹样本中被识别tj笔画类型的书写用力和书写速度特征,设
Figure SMS_162
表示包含笔画类型tj的kj个注册手写笔迹样本集合,从集合H1定义的每个注册手写笔迹样本的被识别为tj笔画类型的笔画中提取书写用力和书写速度特征向量,设/>
Figure SMS_163
表示从集合H1的注册手写笔迹样本中提取的书写用力和书写速度特征向量,特征向量/>
Figure SMS_164
表示从注册手写笔迹样本/>
Figure SMS_165
被识别为tj类型的笔画中提取的书写用力和书写速度特征向量,1≤i≤kj,kj表示集合/>
Figure SMS_166
中特征向量的个数;
包含笔画类型tj是指注册手写笔迹样本中存在笔画被识别为tj笔画类型;
B6)统计除书写用力和书写速度波形类型分量的每个分量上的最大最小值;设
Figure SMS_167
表示从特征向量集合ftj中计算得到的除书写用力和书写速度波形类型分量的在其余每个特征分量上的最大最小值,
Figure SMS_168
Figure SMS_169
表示集合/>
Figure SMS_170
的第r个特征向量中除书写用力和书写速度波形类型分量的第i个分量的值,1≤r≤kj,1≤i≤n,kj表示集合/>
Figure SMS_171
中特征向量的个数,n表示特征向量除去书写用力和书写速度波形类型分量后分量的个数;
B7)j=j+1,若j≤O,则跳转至步骤B4),提取被识别为下一段笔画类型的笔画书写用力和书写速度特征;否则,跳转至步骤B8);
B8)结束:返回注册手写笔迹样本集H中包含和未包含被识别为tj类型的笔画的样本个数
Figure SMS_172
和/>
Figure SMS_173
tj∈T,1≤j≤O,在/>
Figure SMS_174
的注册手写笔迹样本集合中书写用力和书写速度波形类型取值为Fa和La的特征向量个数/>
Figure SMS_175
Fa∈FA,La∈LA,tj∈T,1≤j≤O,以及笔画书写用力和书写速度特征向量在各个分量上的最大最小值/>
Figure SMS_176
tj∈T,1≤j≤O;
C)笔画书写动态特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别测试手写笔迹样本中的笔画类型,按测试手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,找出注册手写笔迹样本中稳定且一致的各种笔画书写动态特征,依据在手写笔迹笔画书写动态特征预学习阶段计算得到的标准汉字c所有各种笔画书写动态特征在人群中的统计数据,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画书写动态特征的概率,依据计算得到的概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画书写动态特征包括离散型稳定且一致笔画书写动态特征和连续型稳定且一致笔画书写动态特征;所述各种笔画书写动态特征在人群中的统计数据包括离散型笔画特征的分布律和连续型笔画特征的联合概率密度函数;
离散型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的离散型笔画书写动态特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画书写动态特征取值是相同的,稳定的离散型笔画书写动态特征是指具有相同离散型笔画书写动态特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
连续型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的连续型笔画书写动态特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画书写动态特征取值的最大最小值之间,稳定的连续型笔画书写动态特征是指在注册手写笔迹样本集合上提取的连续型笔画书写动态特征取值的最大最小值之间的距离小于一定阈值;
测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
待认证用户是指真实身份未得到确认的用户;
具体而言,如图4所示,笔画书写动态特征认证包括如下步骤:
C1)认证阶段开始:待认证用户输入关于标准汉字c的测试手写笔迹样本W;
C2)识别测试笔迹样本W中每段笔画的类型:采用笔画识别算法识别W中每段笔画的类型,设
Figure SMS_177
表示在测试手写笔迹样本中由所有出现笔画类型构成的集合,/>
Figure SMS_178
表示测试手写笔迹样本中由所有未出现笔画类型构成的集合,所述出现笔画类型是指手写笔迹样本W中存在一段手写笔画被识别为该笔画类型,所述未出现笔画类型是指手写笔迹样本W中不存在一段手写笔画被识别为该笔画类型;对于EW和/>
Figure SMS_179
有/>
Figure SMS_180
C3)估算稳定且一致的出现和未出现笔画的概率:估算同时观察到测试手写笔迹样本W中稳定且一致出现和未出现笔画的概率,对于出现笔画类型
Figure SMS_182
若被识别为/>
Figure SMS_188
类型的笔画在注册笔迹样本集中的出现次数大于被识别为/>
Figure SMS_190
类型的笔画在注册笔迹样本集中的未出现的次数,即/>
Figure SMS_183
那么取预学习阶段获取的笔画类型出现的频率作为该笔画的出现概率,即/>
Figure SMS_186
否则/>
Figure SMS_189
其中,1≤i≤n1,对于未出现笔画/>
Figure SMS_191
若被识别为/>
Figure SMS_181
类型的笔画在注册笔迹样本集中的未出现次数大于被识别为/>
Figure SMS_187
类型的笔画在注册笔迹样本集中的出现次数,即/>
Figure SMS_192
那么取预学习阶段获取的该笔画未出现的频率作为该笔画的未出现概率,即/>
Figure SMS_193
否则/>
Figure SMS_184
1≤j≤n2,将所有出现和未出现笔画的概率相乘/>
Figure SMS_185
得到观察到测试手写笔迹样本W中稳定且一致的出现和未出现笔画的概率;
稳定出现笔画类型是指笔画类型在注册手写笔迹样本集合中出现的次数大于该笔画类型在注册手写笔迹样本集合中未出现的次数;
稳定未出现笔画类型是指笔画类型在注册手写笔迹样本集合中未出现的次数大于该笔画类型在注册手写笔迹样本集合中出现的次数;
一致出现笔画类型是指在测试手写笔迹样本中出现的笔画类型在注册手写笔迹样本集合中是稳定出现的笔画类型;
一致未出现笔画类型是指在测试手写笔迹样本中未出现的笔画类型在注册手写笔迹样本集合中是稳定未出现的笔画类型;
用符号T1W表示稳定且一致的出现笔画类型,
Figure SMS_194
稳定的书写用力和速度波形类型特征是指在注册手写笔迹样本集合的稳定出现笔画类型中,至少在给定阈值的注册手写笔迹样本中,笔画的书写用力和速度波形类型是相同的;
一致书写用力和速度特征分量是指对测试手写笔迹稳定且一致出现笔画类型,从与笔画类型对应的手写笔画中提取的书写用力和速度特征分量处于相应注册手写笔迹特征分量的最大最小值之间;
C4)置循环变量k=1,开始计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率;
C5)取出第k个被识别笔画类型:从集合T1W中取出第k个被识别笔画类型tk,集合T1W表示测试手写笔迹样本中稳定且一致的出现笔画类型集合,
Figure SMS_195
C6)提取测试笔迹中相应笔画的动态特征向量:从测试手写笔迹样本中截取被识别为tk类型的笔画
Figure SMS_196
计算测试手写笔迹中被识别为tk类型的笔画书写动态特征,得到特征向量/>
Figure SMS_197
笔画书写动态特征为笔画书写时产生的用力特征和书写速度特征;
C7)估算观测到稳定且一致的动态特征波形类型的概率:从特征向量
Figure SMS_199
中读取表示书写用力和书写速度波形类型的分量Fa和La,按tk、Fa、La三个数据查询在注册笔迹样本集合中包含的被识别为tk类型的笔画,且笔画的书写用力和书写速度波形类型为Fa、La的注册笔迹样本个数变量/>
Figure SMS_201
若/>
Figure SMS_205
则置/>
Figure SMS_200
否则置/>
Figure SMS_202
其中/>
Figure SMS_203
表示预学习手写笔迹样本集合中存在笔画被识别为tk类型的手写笔迹样本个数,/>
Figure SMS_204
表示在/>
Figure SMS_198
个包含tk类型笔画的手写笔迹样本中,笔画的书写用力和书写速度波形类型为Fa和La的笔迹样本个数;
C8)估算观测到稳定且一致的动态特征值的联合概率:在预学习阶段获得的所有联合概率密度函数数据中查找与笔画类型tk相对应的书写用力和书写速度特征联合概率密度函数
Figure SMS_206
按式/>
Figure SMS_207
计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率,积分区域D=(d1,d2,...,dn)由下式所定义,
Figure SMS_208
其中Mi和mi表示在注册阶段获得的关于tk类型笔画书写用力和书写速度特征向量的各个分量最大最小值,ri表示特征向量/>
Figure SMS_209
中第i个特征分量;
C9)k=k+1,若k大于集合T1W中元素的个数,则跳转至步骤C10),否则,跳转至步骤C5);
C10)估算观测到测试笔迹中所有稳定且一致特征的概率:计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率
Figure SMS_210
C11)结合其它笔画特征进行判别:计算P(W)=P1(W)×P2(W),将笔画书写用力和书写速度特征观测概率P(W),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试样本笔迹W是否为真实笔迹。
本实施例中,笔画动态特征的提取包括如下步骤:
1)开始:设
Figure SMS_211
为输入数据,表示书写笔画A时传感器采集到的经过平滑去噪后的数据,其中x,y表示笔尖的二维位置信息,f表示笔尖的压力信息,l表示笔尖的速度信息;
笔画动态特征是指手写设备采集到的笔画书写过程中产生的动作特征,主要包括书写用力和书写速度两类特征;
2)计算书写用力和书写速度信息的极大极小值:设Mf={Mf1,Mf2,...,Mfn1},mf={mf1,mf2,...,mfn2}分别表示书写用力极大极小值在笔画A中的书写用力序列
Figure SMS_212
中的下标,其中,1<Mfi<Mfi+1<na,1≤i<n1,1<mfj<mfj+1<na,1≤j<n2,设Ml={Ml1,Ml2,...,Mln3},ml={ml1,ml2,...,mln4}分别表示书写用力极大极小值在笔画A中的书写速度序列/>
Figure SMS_213
中的下标,其中,1<Mli<Mli+1<na,1≤i<n3,1<mlj<mlj+1<na,1≤j≤n4,对于书写用力极大和极小值序列,若Mf1<mf1,则Maxf=Mf,Minf=mf∪{1},否则,Maxf=Mf∪{1},Minf=mf,接下来,进一步判断,若Mfn1<mfn2,则Maxf=Maxf∪{na},否则,Minf=Minf∪{na},对于书写速度极大和极小值序列,若Ml1<ml1,则Maxl=Ml,Minl=ml∪{1},否则,Maxl=Ml∪{1},Minl=ml,接下来,进一步判断,若Mln3<mln4,则Maxl=Maxl∪{na};否则,Minl=Minl∪{na};
3)计算书写用力和书写速度波形的类型:设A1={a1,a2,...,an5+n6}=Maxf∪Minf表示合并集合Maxf、Minf后并按从小到大顺序排列的下标集合,其中ai∈Minf或ai∈Maxf,1=a1<ai<ai+1<an5+n6=na,1<i<n5+n6,n5,n6分别表示集合Maxf、Minf中元素的个数,对集合A1中任意两个相邻的元素ai-1、ai,若
Figure SMS_215
则序列Fs中从第ai-1至第ai个元素为波形的上升段,用符号"d"表示,/>
Figure SMS_217
为上升段的谷点,/>
Figure SMS_218
为上升段的峰点,dx=ai-ai-1表示上升段在X轴方向的增量,/>
Figure SMS_216
表示上升段在Y轴方向的增量,若/>
Figure SMS_219
则序列Fs中从第ai-1至第ai个元素为波形的下降段,用符号"P"表示,/>
Figure SMS_220
为上升段的峰点,/>
Figure SMS_221
为上升段的谷点,dx=ai-ai-1表示上升段在X轴方向的增量,/>
Figure SMS_214
表示上升段在Y轴方向的增量,笔画A的书写用力时间序列可以用由符号"d"、"P"构成的符号序列表示,依据由符号'd'、'P'构成的符号串表示的书写用力时间序列的波形类型被定义为/>
Figure SMS_222
或者/>
Figure SMS_223
对书写速度时间序列
Figure SMS_224
按对书写用力波形类型同样的定义方法,依据由符号'd'、'P'构成的符号串表示的书写速度时间序列的波形类型被定义为
Figure SMS_225
或者/>
Figure SMS_226
FA={F0,F1,F2,...,F16}表示所有书写用力波形类型的集合,LA={L0,L1,L2,...,L16}表示所有书写速度波形类型的集合;
4)计算由极大值下标集合Maxf定义的书写用力峰值点向量
Figure SMS_227
n5表示集合Maxf中元素的个数,计算由极小值下标集合Minf定义的书写用力谷值点向量/>
Figure SMS_228
n6表示集合Minf中元素的个数,计算书写用力序列上升段和下降段中在X轴方向上增量向量Dxf=(dx1,dx2,...,dxn7),其中dxi=ai-ai-1,1<i≤n5+n6,ai∈A1,ai-1∈A1,n7=n5+n6-1,计算书写用力序列上升段和下降段中在Y轴方向上增量绝对值向量Dyf=(dy1,dy2,...,dyn7),其中/>
Figure SMS_229
1<i≤n5+n6,
Figure SMS_230
ai∈A1,ai-1∈A1,n7=n5+n6-1,计算书写速度序列峰值点向量Ul,谷点向量Vl,X轴方向上增量向量Dxl,Y轴方向上增量绝对值向量Dyl
5)计算由向量Uf中所有分量构成集合的关于书写用力极大值的最大值、最小值、极大值均值,极大值标准差{MaxMf,MinMf,AvgMf,StdMf},计算由向量Vf中所有分量构成集合的关于书写用力极小值的最大值、最小值、极大值均值,极大值标准差{Maxmf,Minmf,Avgmf,Stdmf},计算由向量Dxf中所有分量构成集合的关于书写用力序列在X轴方向上增量的最大值、最小值、极大值均值,极大值标准差
Figure SMS_231
计算由向量Dyf中所有分量构成集合的关于书写用力序列在Y轴方向上增量绝对值的最大值、最小值、极大值均值,极大值标准差/>
Figure SMS_232
6)计算由向量Ul中所有分量构成集合的关于书写速度极大值的最大值、最小值、极大值均值,极大值标准差{MaxMl,MinMl,AvgMl,StdMl},计算由向量Vl中所有分量构成集合的关于书写速度极小值的最大值、最小值、极大值均值,极大值标准差{Maxml,Minml,Avgml,Stdml},计算由向量Dxl中所有分量构成集合的关于书写速度序列在X轴方向上增量的最大值、最小值、极大值均值,极大值标准差
Figure SMS_233
计算由向量Dyl中所有分量构成集合的关于书写速度序列在Y轴方向上增量绝对值的最大值、最小值、极大值均值,极大值标准差/>
Figure SMS_234
7)取笔画序列A中采样点个数na作为书写耗时特征;
8)提取笔画A的频域特征:将书写用力时间序列
Figure SMS_235
变换到频域空间,以前x项系数作为Fs的书写用力频域特征表示Ef={ef1,ef2,...,efx};将书写速度时间序列/>
Figure SMS_236
变换到频域空间,以前x项系数作为Ls的书写用力频域特征表示E1={e11,e12,...,e1x};
9)结束:返回关于笔画A的动态特征向量,包括书写用力和书写速度波形的类型,书写用力波形在波峰、波谷以及在X、Y方向上增量的最大、最小值以及均值和方差,书写速度波形在波峰、波谷以及在X、Y方向上增量的最大、最小值以及均值和方差,笔画书写耗时,以及书写用力和书写速度的截断频域特征,共五类特征值构成的特征向量。
本发明在线笔迹认证中一种笔画动态特征的提取及认证方法,对已知书写内容的非标准任意手写体笔迹,能有效提取出那些处于局部的笔画书写动态特征,有助于识别出那些存在于局部细小的书写动作和习惯,并估算稳定且一致笔画书写力和书写速度特征在人群中出现的概率,从而达到提升认证准确性的目的。

Claims (4)

1.在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:包括如下步骤:
A)手写笔迹笔画书写动态特征预学习:收集人群关于标准汉字c的手写笔迹样本,识别所有手写笔迹样本中的笔画类型,以手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,包括笔画书写用力、书写速度的波形类型,书写用力波形和书写速度波形在波峰、波谷以及在X、Y方向上增量的最大、最小值、均值和方差,笔画书写耗时,书写用力和书写速度的截断频域特征,再对所提取的笔画书写动态特征中的离散型笔画特征,包括笔画类型、书写速度的波形类型,统计离散型笔画特征在人群中的分布律,对所提取的连续型笔画特征,包括波峰、波谷的最大、最小值,估算连续型笔画特征在人群中出现的联合概率密度函数;
书写动态特征是指手写设备采集到的书写过程中产生的动作特征,包括书写用力和书写速度,所述笔画书写动态特征是以笔画为单位提取的书写动态特征;
手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
B)手写笔迹笔画书写动态特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,组成注册手写笔迹样本集合,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别所有注册手写笔迹样本中的笔画类型,按注册手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,所述笔画书写动态特征与在手写笔迹笔画书写动态特征预学习阶段所提取的笔画书写动态特征种类相同,统计笔画书写动态特征中各种离散型笔画特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画书写动态特征中各种连续型笔画特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画书写动态特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别测试手写笔迹样本中的笔画类型,按测试手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,找出注册手写笔迹样本中稳定且一致的各种笔画书写动态特征,依据在手写笔迹笔画书写动态特征预学习阶段计算得到的标准汉字c所有各种笔画书写动态特征在人群中的统计数据,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画书写动态特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画书写动态特征包括离散型稳定且一致笔画书写动态特征和连续型稳定且一致笔画书写动态特征;所述各种笔画书写动态特征在人群中的统计数据包括离散型笔画特征的分布律和连续型笔画特征的联合概率密度函数;
所述离散型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的离散型笔画书写动态特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画书写动态特征取值是相同的,所述稳定的离散型笔画书写动态特征是指具有相同离散型笔画书写动态特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的连续型笔画书写动态特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画书写动态特征取值的最大最小值之间,所述稳定的连续型笔画书写动态特征是指在注册手写笔迹样本集合上提取的连续型笔画书写动态特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户;
其中,笔画书写动态特征认证包括如下步骤:
C1)认证阶段开始:待认证用户输入关于标准汉字c的测试手写笔迹样本W;
C2)识别测试笔迹样本W中每段笔画的类型:采用笔画识别算法识别W中每段笔画的类型,设
Figure FDA0004117296430000031
表示在测试手写笔迹样本中由所有出现笔画类型构成的集合,
Figure FDA0004117296430000032
表示测试手写笔迹样本中由所有未出现笔画类型构成的集合,所述出现笔画类型是指手写笔迹样本W中存在一段手写笔画被识别为该笔画类型,所谓未出现笔画类型是指手写笔迹样本W中不存在一段手写笔画被识别为该笔画类型;对于EW和/>
Figure FDA0004117296430000033
Figure FDA0004117296430000034
C3)估算稳定且一致的出现和未出现笔画的概率:估算同时观察到测试手写笔迹样本W中稳定且一致出现和未出现笔画的概率,对于出现笔画类型
Figure FDA0004117296430000035
若所述被识别为/>
Figure FDA0004117296430000036
类型的笔画在注册笔迹样本集中的出现次数大于所述被识别为/>
Figure FDA0004117296430000037
类型的笔画在注册笔迹样本集中的未出现的次数,即/>
Figure FDA0004117296430000041
那么取预学习阶段获取的所述笔画类型出现的频率作为该笔画的出现概率,即/>
Figure FDA0004117296430000042
否则/>
Figure FDA0004117296430000043
其中,1≤i≤n1,对于未出现笔画
Figure FDA0004117296430000044
若所述被识别为/>
Figure FDA0004117296430000045
类型的笔画在注册笔迹样本集中的未出现次数大于所述被识别为/>
Figure FDA0004117296430000046
类型的笔画在注册笔迹样本集中的出现次数,即/>
Figure FDA0004117296430000047
那么取预学习阶段获取的该笔画未出现的频率作为该笔画的未出现概率,即/>
Figure FDA0004117296430000048
否则
Figure FDA0004117296430000049
将所有出现和未出现笔画的概率相乘/>
Figure FDA00041172964300000410
得到观察到测试手写笔迹样本W中稳定且一致的出现和未出现笔画的概率;
稳定出现笔画类型是指笔画类型在注册手写笔迹样本集合中出现的次数大于所述该笔画类型在注册手写笔迹样本集合中未出现的次数;
稳定未出现笔画类型是指笔画类型在注册手写笔迹样本集合中未出现的次数大于所述该笔画类型在注册手写笔迹样本集合中出现的次数;
一致出现笔画类型是指在测试手写笔迹样本中出现的笔画类型在注册手写笔迹样本集合中是稳定出现的笔画类型;
一致未出现笔画类型是指在测试手写笔迹样本中未出现的笔画类型在注册手写笔迹样本集合中是稳定未出现的笔画类型;
用符号T1W表示稳定且一致的出现笔画类型,
Figure FDA00041172964300000411
稳定的书写用力和速度波形类型特征是指在注册手写笔迹样本集合的稳定出现笔画类型中,至少在给定阈值的注册手写笔迹样本中,所述笔画的书写用力和速度波形类型是相同的;
一致书写用力和速度特征分量是指对测试手写笔迹稳定且一致出现笔画类型,从与所述笔画类型对应的手写笔画中提取的书写用力和速度特征分量处于相应注册手写笔迹特征分量的最大最小值之间;
C4)置循环变量k=1,开始计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率;
C5)取出第k个被识别笔画类型:从集合T1W中取出第k个被识别笔画类型tk,所述集合T1W表示测试手写笔迹样本中稳定且一致的出现笔画类型集合,
Figure FDA0004117296430000051
C6)提取测试笔迹中相应笔画的动态特征向量:从测试手写笔迹样本中截取被识别为tk类型的笔画
Figure FDA0004117296430000052
计算测试手写笔迹中被识别为tk类型的笔画书写动态特征,得到特征向量/>
Figure FDA0004117296430000053
所述笔画书写动态特征为笔画书写时产生的用力特征和书写速度特征;
C7)估算观测到稳定且一致的动态特征波形类型的概率:从特征向量
Figure FDA0004117296430000054
中读取表示书写用力和书写速度波形类型的分量Fa和La,按tk、Fa、La三个数据查询在注册笔迹样本集合中包含的被识别为tk类型的笔画,且所述笔画的书写用力和书写速度波形类型为Fa、La的注册笔迹样本个数变量/>
Figure FDA0004117296430000055
若/>
Figure FDA0004117296430000056
则置/>
Figure FDA0004117296430000057
否则置/>
Figure FDA0004117296430000058
其中/>
Figure FDA0004117296430000059
表示预学习手写笔迹样本集合中存在笔画被识别为tk类型的手写笔迹样本个数,/>
Figure FDA00041172964300000510
表示在/>
Figure FDA00041172964300000511
个包含tk类型笔画的手写笔迹样本中,所述笔画的书写用力和书写速度波形类型为Fa和La的笔迹样本个数;
C8)估算观测到稳定且一致的动态特征值的联合概率:在预学习阶段获得的所有联合概率密度函数数据中查找与笔画类型tk相对应的书写用力和书写速度特征联合概率密度函数
Figure FDA00041172964300000512
按式/>
Figure FDA0004117296430000061
计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率,积分区域D=(d1,d2,...,dn)由下式所定义,
Figure FDA0004117296430000062
其中Mi和mi表示在注册阶段获得的关于tk类型笔画书写用力和书写速度特征向量的各个分量最大最小值,ri表示特征向量/>
Figure FDA0004117296430000063
中第i个特征分量;
C9)k=k+1,若k大于集合T1W中元素的个数,则跳转至步骤C10),否则,跳转至步骤C5);
C10)估算观测到测试笔迹中所有稳定且一致特征的概率:计算观察到测试样本笔迹W中所有一致书写用力和书写速度特征分量的联合概率
Figure FDA0004117296430000064
C11)结合其它笔画特征进行判别:计算P(W)=P1(W)×P2(W),将笔画书写用力和书写速度特征观测概率P(W),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试样本笔迹W是否为真实笔迹。
2.根据权利要求1所述在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:所述步骤A)中,手写笔迹笔画书写动态特征预学习包括如下步骤:
A1)预学习开始:设S={s1,s2,...,sN}表示海量的足够多书写者手写的关于标准汉字c的手写笔迹样本集合,每位书写者提供了1至3个样本,N表示集合S中包含的笔迹个数,设T={t1,t2,...,tO}表示标准汉字c包含的所有笔画集合,O表示标准汉字c包含的笔画数;所述足够多是指集合S中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化:初始化循环变量i=1,初始化人群书写关于标准汉字c的手写笔迹中被识别为tj类型的计数变量
Figure FDA0004117296430000071
初始化人群书写关于标准汉字c的手写笔迹中被识别为tj类型的笔画且所述笔画的书写用力和速度波形类型分别为Fa和La的计数变量/>
Figure FDA0004117296430000072
FA和LA分别表示书写用力和书写速度波形类型集合;
A3)识别第i个手写笔迹样本si中的笔画类型:识别笔迹
Figure FDA0004117296430000073
中各段笔画的类型,其中,符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤ni,ni表示手写笔迹si中采样点个数样,所述手写笔迹是由专门的手写笔迹采集设备通过实时采集笔迹书写过程中笔尖运动的轨迹而获得的时间序列,设/>
Figure FDA0004117296430000074
表示识别手写笔迹si∈S中所有笔画得到的笔画类型集合,xi表示第i个手写笔迹样本si∈S中包含的被识别笔画类型数,/>
Figure FDA0004117296430000075
O表示标准汉字c包含的所有笔画类型数;
A4)初始化j=1;
A5)笔画特征提取;提取手写笔迹样本si中与第j段被识别笔画类型tj对应的笔画书写速度和用力特征,以笔迹si∈S中被识别为tj的笔画
Figure FDA0004117296430000076
作为输入参数,提取笔画书写用力和书写速度特征,其中笔画/>
Figure FDA0004117296430000077
是笔迹si时间序列的一个子段,/>
Figure FDA0004117296430000078
子段从第aj个采样点开始,共包含ns+1个采样点,ns>1,aj≥1,aj+ns≤ni,ni表示笔迹si中采样点个数,其中符号xk,yk,fk分别表示传感器在第k时刻获取笔尖二维位置信息和笔尖的压力信息,/>
Figure FDA0004117296430000079
表示第k时刻笔尖的速度信息,/>
Figure FDA00041172964300000710
表示笔迹si的书写速度信息时间序列,1<k≤ni,l1=0,设特征向量/>
Figure FDA00041172964300000711
表示特征提取方法返回的与第j段被识别笔画类型tj对应的笔画/>
Figure FDA0004117296430000081
的书写用力和书写速度特征;
A6)更新笔画类型计数变量:根据手写笔迹样本si中笔画的被识别笔画类型tj∈T,将计数变量
Figure FDA0004117296430000082
加1,/>
Figure FDA0004117296430000083
表示集合S中存在笔画被识别为tj类型的笔迹样本个数;
A7)更新笔画书写用力和实现书写速度波形类型计数变量:设特征向量
Figure FDA0004117296430000084
中Fa∈FA,La∈LA分量分别表示从笔迹si的被识别为tj的笔画/>
Figure FDA0004117296430000085
中提取的书写用力和书写速度的波形类型,将与Fa和La值对应的计数变量/>
Figure FDA0004117296430000086
加1,/>
Figure FDA0004117296430000087
表示在所有包含被识别为tj类型笔画的预学习笔迹样本中书写用力和书写速度波形为Fa和La类型的手写笔迹样本个数,计数变量
Figure FDA0004117296430000088
和/>
Figure FDA0004117296430000089
的初值均为0,Fa∈FA,La∈LA,tj∈T,1≤j≤O;
A8)将笔画书写用力和书写速度波形特征数据放到相应的集合中:对从第i个手写笔迹样本被识别为tj笔画类型的笔画中提取的书写速度和书写用力特征向量
Figure FDA00041172964300000810
去掉书写用力和书写速度的波形类型Fa和La,得到向量/>
Figure FDA00041172964300000811
将/>
Figure FDA00041172964300000812
加入到集合/>
Figure FDA00041172964300000813
Figure FDA00041172964300000814
中,其中/>
Figure FDA00041172964300000815
表示集合/>
Figure FDA00041172964300000816
中特征向量的个数;
A9)j=j+1,若j≤xi,则跳转至步骤A5),提取下一段笔画书写用力和书写速度特征,并更新相关的统计变量,否则,跳转至步骤A10);
A10)i=i+1,若i≤N,则跳转至步骤A3),识别下一个手写笔迹样本类型,否则,跳转至步骤A11);
A11)统计各种笔画类型在人群中的分布律:计算人群书写的关于标准汉字c的手写笔迹中被识别为tj笔画类型的概率
Figure FDA00041172964300000817
Figure FDA00041172964300000818
A12)统计各种笔画类型的书写用力和书写速度波形类型在人群中的分布律:计算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中,所述笔画的书写用力和书写速度波形类型分别为Fa和La的分布律
Figure FDA0004117296430000091
A13)估算各种笔画类型的书写用力和书写速度特征的概率密度函数:基于每一组特征向量集合
Figure FDA0004117296430000092
估算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中除去波形类型分量后的书写用力和速度特征向量的概率密度函数/>
Figure FDA0004117296430000093
其中,tj∈T,1≤j≤O;
A14)结束:返回计算得到人群书写的关于标准汉字c的手写笔迹中存在笔画被识别为tj笔画类型的分布律
Figure FDA0004117296430000094
各种笔画类型的书写用力和书写速度的波形类型组合的分布律/>
Figure FDA0004117296430000095
以及各种笔画书写用力和书写速度特征向量概率密度函数/>
Figure FDA0004117296430000096
3.根据权利要求2所述在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:所述步骤B)中,手写笔迹笔画书写动态特征注册包括如下步骤:
B1)注册开始:注册用户提交关于标准汉字c的注册手写笔迹样本集合H=∈{h1,h2,...,hp},p≥3;
B2)统计笔画出现和未出现的次数:计算注册手写笔迹样本集合H中每个笔迹样本的笔画类型,然后统计标准汉字c的每个笔画tj∈T在H中出现和未出现的次数,设
Figure FDA0004117296430000097
和/>
Figure FDA0004117296430000098
分别表示笔画tj出现和未出现的次数,/>
Figure FDA0004117296430000099
从集合H中选取一个笔迹样本hi,计算hi中每一段笔画的笔画类型,设/>
Figure FDA00041172964300000910
表示hi中出现的笔画类型集合,/>
Figure FDA0004117296430000101
表示hi中未出现的笔画类型集合,E1∪E2=T,x1+x2=O,T表示标准汉字c包含的所有基本笔画集合,O表示T中包含的笔画类型个数;从集合H中取出一个注册手写笔迹样本,若笔画类型tj出现在所述注册手写笔迹样本中,则置
Figure FDA0004117296430000102
否则,置/>
Figure FDA0004117296430000103
重复上述过程,完成对集合H中其他笔迹样本中笔画类型出现和未出现次数的统计;
B3)初始化,j=1;
B4)若
Figure FDA0004117296430000104
跳转至步骤B7),否则,跳转至步骤B5);
B5)提取所有注册手写笔迹样本中被识别tj笔画类型的书写用力和书写速度特征,设
Figure FDA0004117296430000105
表示包含笔画类型tj的kj个注册手写笔迹样本集合,从所述集合H1定义的每个注册手写笔迹样本的被识别为tj笔画类型的笔画中提取书写用力和书写速度特征向量,设/>
Figure FDA0004117296430000106
表示从所述集合H1的注册手写笔迹样本中提取的书写用力和书写速度特征向量,特征向量/>
Figure FDA0004117296430000107
表示从注册手写笔迹样本/>
Figure FDA0004117296430000108
被识别为tj类型的笔画中提取的书写用力和书写速度特征向量,1≤i≤kj,kj表示集合/>
Figure FDA00041172964300001011
中特征向量的个数;
所述包含笔画类型tj是指注册手写笔迹样本中存在笔画被识别为tj笔画类型;
B6)统计除书写用力和书写速度波形类型分量的每个分量上的最大最小值;设
Figure FDA0004117296430000109
表示从特征向量集合/>
Figure FDA00041172964300001010
中计算得到的除书写用力和书写速度波形类型分量的在其余每个特征分量上的最大最小值,
Figure FDA0004117296430000111
Figure FDA0004117296430000112
表示集合/>
Figure FDA00041172964300001112
的第r个特征向量中除书写用力和书写速度波形类型分量的第i个分量的值,1≤r≤kj,1≤i≤n,kj表示集合/>
Figure FDA00041172964300001113
中特征向量的个数,n表示特征向量除去书写用力和书写速度波形类型分量后分量的个数;
B7)j=j+1,若j≤O,则跳转至步骤B4),提取被识别为下一段笔画类型的笔画书写用力和书写速度特征;否则,跳转至步骤B8);
B8)结束:返回注册手写笔迹样本集H中包含和未包含被识别为tj类型的笔画的样本个数
Figure FDA0004117296430000113
和/>
Figure FDA0004117296430000114
在/>
Figure FDA0004117296430000115
的注册手写笔迹样本集合中书写用力和书写速度波形类型取值为Fa和La的特征向量个数/>
Figure FDA0004117296430000116
以及笔画书写用力和书写速度特征向量在各个分量上的最大最小值/>
Figure FDA0004117296430000117
Figure FDA0004117296430000118
4.根据权利要求3所述在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:笔画动态特征的提取包括如下步骤:
1)开始:设
Figure FDA0004117296430000119
为输入数据,表示书写笔画A时传感器采集到的经过平滑去噪后的数据,其中x,y表示笔尖的二维位置信息,f表示笔尖的压力信息,l表示笔尖的速度信息;
所述笔画动态特征是指手写设备采集到的笔画书写过程中产生的动作特征,主要包括书写用力和书写速度两类特征;
2)计算书写用力和书写速度信息的极大极小值:设Mf={Mf1,Mf2,...,Mfn1},mf={mf1,mf2,...,mfn2}分别表示书写用力极大极小值在笔画A中的书写用力序列
Figure FDA00041172964300001110
中的下标,其中,1<Mfi<Mfi+1<na,1≤i<n1,1<mfj<mfj+1<na,1≤j<n2,设Ml={Ml1,Ml2,...,Mln3},ml={ml1,ml2,...,mln4}分别表示书写用力极大极小值在笔画A中的书写速度序列/>
Figure FDA00041172964300001111
中的下标,其中,1<Mli<Mli+1<na,1≤i<n3,1<mlj<mlj+1<na,1≤j≤n4,对于书写用力极大和极小值序列,若Mf1<mf1,则Maxf=Mf,Minf=mf∪{1},否则,Maxf=Mf∪{1},Minf=mf,接下来,进一步判断,若Mfn1<mfn2,则Maxf=Maxf∪{na},否则,Minf=Minf∪{na},对于书写速度极大和极小值序列,若Ml1<ml1,则Maxl=Ml,Minl=ml∪{1},否则,Maxl=Ml∪{1},Minl=ml,接下来,进一步判断,若Mln3<mln4,则Maxl=Maxl∪{na};否则,Minl=Minl∪{na};
3)计算书写用力和书写速度波形的类型:设A1={a1,a2,...,an5+n6}=Maxf∪Minf表示合并集合Maxf、Minf后并按从小到大顺序排列的下标集合,其中ai∈Minf或ai∈Maxf,1=a1<ai<ai+1<an5+n6=na,1<i<n5+n6,n5,n6分别表示集合Maxf、Minf中元素的个数,对集合A1中任意两个相邻的元素ai-1、ai,若
Figure FDA0004117296430000121
则序列Fs中从第ai-1至第ai个元素为波形的上升段,用符号"d"表示,/>
Figure FDA0004117296430000122
为上升段的谷点,/>
Figure FDA0004117296430000123
为上升段的峰点,dx=ai-ai-1表示上升段在X轴方向的增量,/>
Figure FDA0004117296430000124
表示上升段在Y轴方向的增量,若/>
Figure FDA0004117296430000125
则序列Fs中从第ai-1至第ai个元素为波形的下降段,用符号"P"表示,/>
Figure FDA0004117296430000126
为上升段的峰点,/>
Figure FDA0004117296430000127
为上升段的谷点,dx=ai-ai-1表示上升段在X轴方向的增量,/>
Figure FDA0004117296430000128
表示上升段在Y轴方向的增量,笔画A的书写用力时间序列可以用由符号"d"、"P"构成的符号序列表示,依据所述由符号'd'、'P'构成的符号串表示的书写用力时间序列的波形类型被定义为
Figure FDA0004117296430000129
或者/>
Figure FDA00041172964300001210
对书写速度时间序列Ls={l1,l2,...,lna},按所述对书写用力波形类型同样的定义方法,依据所述由符号'd'、'P'构成的符号串表示的书写速度时间序列的波形类型被定义为
Figure FDA0004117296430000131
或者/>
Figure FDA0004117296430000132
FA={F0,F1,F2,...,F16}表示所有书写用力波形类型的集合,LA={L0,L1,L2,...,L16}表示所有书写速度波形类型的集合;
4)计算由极大值下标集合Maxf定义的书写用力峰值点向量
Figure FDA0004117296430000133
n5表示集合Maxf中元素的个数,计算由极小值下标集合Minf定义的书写用力谷值点向量
Figure FDA0004117296430000134
n6表示集合Minf中元素的个数,计算书写用力序列上升段和下降段中在X轴方向上增量向量Dxf=(dx1,dx2,...,dxn7),其中dxi=ai-ai-1,1<i≤n5+n6,ai∈A1,ai-1∈A1,n7=n5+n6-1,计算书写用力序列上升段和下降段中在Y轴方向上增量绝对值向量Dyf=(dy1,dy2,...,dyn7),其中/>
Figure FDA0004117296430000135
Figure FDA0004117296430000136
n7=n5+n6-1,计算书写速度序列峰值点向量Ul,谷点向量Vl,X轴方向上增量向量Dxl,Y轴方向上增量绝对值向量Dyl;/>
5)计算由向量Uf中所有分量构成集合的关于书写用力极大值的最大值、最小值、极大值均值,极大值标准差{MaxMf,MinMf,AvgMf,StdMf},计算由向量Vf中所有分量构成集合的关于书写用力极小值的最大值、最小值、极大值均值,极大值标准差{Maxmf,Minmf,Avgmf,Stdmf},计算由向量Dxf中所有分量构成集合的关于书写用力序列在X轴方向上增量的最大值、最小值、极大值均值,极大值标准差
Figure FDA0004117296430000137
计算由向量Dyf中所有分量构成集合的关于书写用力序列在Y轴方向上增量绝对值的最大值、最小值、极大值均值,极大值标准差/>
Figure FDA0004117296430000138
6)计算由向量Ul中所有分量构成集合的关于书写速度极大值的最大值、最小值、极大值均值,极大值标准差{MaxMl,MinMl,AvgMl,StdMl},计算由向量Vl中所有分量构成集合的关于书写速度极小值的最大值、最小值、极大值均值,极大值标准差{Maxml,Minml,Avgml,Stdml},计算由向量Dxl中所有分量构成集合的关于书写速度序列在X轴方向上增量的最大值、最小值、极大值均值,极大值标准差
Figure FDA0004117296430000141
计算由向量Dyl中所有分量构成集合的关于书写速度序列在Y轴方向上增量绝对值的最大值、最小值、极大值均值,极大值标准差/>
Figure FDA0004117296430000142
7)取笔画序列A中采样点个数na作为书写耗时特征;
8)提取笔画A的频域特征:将书写用力时间序列
Figure FDA0004117296430000143
变换到频域空间,以前x项系数作为Fs的书写用力频域特征表示Ef={ef1,ef2,...,efx};将书写速度时间序列
Figure FDA0004117296430000144
变换到频域空间,以前x项系数作为Ls的书写用力频域特征表示E1={e11,e12,...,e1x};
9)结束:返回关于笔画A的动态特征向量,包括书写用力和书写速度波形的类型,书写用力波形在波峰、波谷以及在X、Y方向上增量的最大、最小值以及均值和方差,书写速度波形在波峰、波谷以及在X、Y方向上增量的最大、最小值以及均值和方差,笔画书写耗时,以及书写用力和书写速度的截断频域特征,共五类特征值构成的特征向量。
CN201911224771.8A 2019-12-04 2019-12-04 在线笔迹认证中一种笔画动态特征的提取及认证方法 Active CN111259726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911224771.8A CN111259726B (zh) 2019-12-04 2019-12-04 在线笔迹认证中一种笔画动态特征的提取及认证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911224771.8A CN111259726B (zh) 2019-12-04 2019-12-04 在线笔迹认证中一种笔画动态特征的提取及认证方法

Publications (2)

Publication Number Publication Date
CN111259726A CN111259726A (zh) 2020-06-09
CN111259726B true CN111259726B (zh) 2023-06-02

Family

ID=70948544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911224771.8A Active CN111259726B (zh) 2019-12-04 2019-12-04 在线笔迹认证中一种笔画动态特征的提取及认证方法

Country Status (1)

Country Link
CN (1) CN111259726B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers
WO2004095361A1 (ja) * 2003-04-24 2004-11-04 Fujitsu Limited オンライン手書き文字入力装置及び方法
CN102592152A (zh) * 2012-01-05 2012-07-18 中国科学院合肥物质科学研究院 一种基于计算机系统的在线笔迹认证方法
CN104050453A (zh) * 2014-06-24 2014-09-17 南京师范大学 一种手写汉字笔势评价方法
JP2018147312A (ja) * 2017-03-07 2018-09-20 公立大学法人会津大学 手書き文字によるユーザ認証システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers
WO2004095361A1 (ja) * 2003-04-24 2004-11-04 Fujitsu Limited オンライン手書き文字入力装置及び方法
CN102592152A (zh) * 2012-01-05 2012-07-18 中国科学院合肥物质科学研究院 一种基于计算机系统的在线笔迹认证方法
CN104050453A (zh) * 2014-06-24 2014-09-17 南京师范大学 一种手写汉字笔势评价方法
JP2018147312A (ja) * 2017-03-07 2018-09-20 公立大学法人会津大学 手書き文字によるユーザ認証システム

Also Published As

Publication number Publication date
CN111259726A (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
Kashi et al. A Hidden Markov Model approach to online handwritten signature verification
Bana et al. Fingerprint recognition using image segmentation
Jang et al. DeepPore: Fingerprint pore extraction using deep convolutional neural networks
Pirlo et al. Multidomain verification of dynamic signatures using local stability analysis
Du et al. Wavelet domain local binary pattern features for writer identification
TW200823773A (en) A method and apparatus for recognition of handwritten symbols
Bharadi et al. Off-line signature recognition systems
Niels et al. Automatic allograph matching in forensic writer identification
US11416592B2 (en) Method for online signature verification using wrist-worn devices
CN113361666B (zh) 一种手写字符识别方法、系统及介质
Kamencay et al. Feature extraction for object recognition using PCA-KNN with application to medical image analysis
Nakkach et al. Hybrid approach to features extraction for online Arabic character recognition
CN111259726B (zh) 在线笔迹认证中一种笔画动态特征的提取及认证方法
Thakare et al. A combined feature extraction model using SIFT and LBP for offline signature verification system
Liu et al. Circuit sketch recognition
CN111310546B (zh) 在线笔迹认证中一种书写节奏特征的提取及认证方法
CN108921077A (zh) 一种签名笔迹检验可视化方法
CN111310543B (zh) 在线笔迹认证中笔画提连笔特征的提取及认证方法
CN115240279A (zh) 基于节奏特征的仿写签名检测方法、设备及存储介质
JP7347750B2 (ja) 照合装置、学習装置、方法、及びプログラム
Zaghloul et al. Recognition of Hindi (Arabic) handwritten numerals
CN112861709A (zh) 一种基于简笔画的手绘草图识别方法
Chen et al. An Automatic Stroke Extraction Method using Manifold Learning.
CN111310547B (zh) 在线笔迹认证中一种笔顺特征的提取及认证方法
JPH06162261A (ja) 文字認識装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant