CN111310543B - 在线笔迹认证中笔画提连笔特征的提取及认证方法 - Google Patents
在线笔迹认证中笔画提连笔特征的提取及认证方法 Download PDFInfo
- Publication number
- CN111310543B CN111310543B CN201911224759.7A CN201911224759A CN111310543B CN 111310543 B CN111310543 B CN 111310543B CN 201911224759 A CN201911224759 A CN 201911224759A CN 111310543 B CN111310543 B CN 111310543B
- Authority
- CN
- China
- Prior art keywords
- stroke
- handwriting
- strokes
- pen
- lifting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Multimedia (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Collating Specific Patterns (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及信息安全领域,公开了在线笔迹认证中笔画提连笔特征的提取及认证方法,包括如下步骤:笔画提连笔特征预学习,取得虚提笔和连笔特征在人群中出现的概率,笔画提连笔特征注册,统计注册用户笔画虚提笔和连笔特征的出现频率并依此找出稳定的虚提笔和连笔,笔画提连笔特征认证,计算稳定且一致虚提笔和连笔笔画组合在人群中出现的概率,依此概率的大小作为进一步判别的依据。本发明在线笔迹认证中笔画提连笔特征的提取及认证方法,能有效提取出处于局部笔画的虚提笔或连笔特征,并估算稳定且一致虚提笔和连笔笔画组合在人群中出现的概率,有助于识别出违反书写规范且稳定的书写方式,提升笔迹认证性能。
Description
技术领域
本发明涉及信息安全领域,具体涉及在线笔迹认证中笔画提连笔特征的提取及认证方法。
背景技术
在线笔迹认证是指利用专门输入设备在线获取用户的手写笔迹,经比较其中所蕰涵的个性化特征从而实现用户身份鉴别的一项技术。
文字是思想的载体,而笔迹是文字的表现形式。在文字漫长的演化过程中,为了方便辨识和交流,书写规范逐步形成。所谓书写规范是指人们在文字书写时应遵守的规则,包括汉字的结构构成,笔画的相对位置关系、笔画的书写顺序和书写方式等。从幼儿开始的习字过程就是在不断学习符合书写规范从而书写出可被他人辨识笔迹的练习过程。在书写实践中,人们发现因书写规范制约带来的书写低效与各种书写场景对书写速度要求之间的矛盾日益突出。在书写技能的逐步形成以后,在不影响文字辨识情况下,各种连笔书写方式孕育而生。为了达到快速书写的目的,又或者为了体现与众不同,各种个性化的书写方式开始涌现,例如在提连笔方面,某些该连笔的笔画没有连笔,或者该提笔的笔画没有提笔,或者相反。这些书写方式不是书写规范所规定的,它们是否出现以及出现组合具有多种表现形式,反映书写人的书写特点,具有高度的个性化,以及不易被察觉和摹仿的特性。
但笔画提连笔特征的提取并非易事。一方面,笔画提连笔特征的提取依赖对书写规范的感知,即书写规范规定在哪段笔画是应该或不应该提笔或断笔的。这个能力以笔迹分割、笔画匹配和笔画识别等一系列工作为前提。另一方面,笔画提连笔特征还需通过稳定性和特殊性的衡量才具有同一性认定的鉴定价值。除了依赖提连笔特征的有效提取,稳定性和特殊性还依赖于这些特征在人群中出现的概率分析。
现有技术缺少对书写规范的感知能力,因而难以有效提取笔画提连笔特征,以及进一步分析这些特征的同一性认定价值。
发明内容
本发明的目的就是针对上述技术的不足,提供在线笔迹认证中笔画提连笔特征的提取及认证方法,能有效提取出处于局部笔画的虚提笔或连笔特征,并估算稳定且一致虚提笔和连笔笔画组合在人群中出现的概率,有助于识别出违反书写规范且稳定的书写方式,提升笔迹认证性能。
为实现上述目的,本发明所设计的在线笔迹认证中笔画提连笔特征的提取及认证方法,包括如下步骤:
A)笔画提连笔特征预学习:收集人群关于标准汉字c的手写笔迹样本取得预学习手写笔迹样本集合,识别所述预学习手写笔迹样本集合中的笔画类型,依据书写力分量是否小于一定阈值来判别在书写各段笔画时是否有或没有提笔,根据所识别的笔画类型统计各种笔画的虚提笔和连笔特征在人群中出现的次数,将所述各种笔画的虚提笔和连笔特征在人群中出现的次数与所述预学习手写笔迹样本集合中的样本个数之比作为笔画的虚提笔和连笔特征在人群中出现的概率;
所述笔画提连笔包含提笔和连笔;所述笔画提笔包含虚提笔、断笔、抬笔,所述笔画连笔包含连笔、未断笔和未抬笔;
所述笔画的虚提笔、断笔、抬笔是指,在书写规范规定的汉字书写过程中,在本应连笔而不应有提笔或断笔的地方,由于快速书写造成的意连笔断或虚提笔或抬笔的书写现象,或在书写笔画时由于犹豫造成的提笔停顿后重新继续书写的断笔书写现象;
所述笔画的连笔、未断笔、未抬笔是指,在书写规范规定的一段笔画结束与下一段笔画开始之间本应有提笔或断笔或抬笔的地方,由于快速书写,造成未有提笔或断笔或抬笔而连续书写的现象;
所述手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力;
所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
B)笔画提连笔特征注册:收集注册用户关于标准汉字c的若干个注册手写笔迹样本,组成注册手写笔迹样本集合,识别所述注册手写笔迹样本集合中的笔画类型,并按笔画类型统计注册手写笔迹样本集合中各笔画的虚提笔和连笔特征出现的次数,将所述注册手写笔迹样本中各笔画的虚提笔和连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中的样本个数之比作为评判笔画的虚提笔和连笔特征是否稳定的依据,若某笔画的虚提笔或连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中所有样本个数之比大于预先设定的阈值,则称注册用户书写该笔画的虚提笔或连笔特征为稳定的,所述阈值的设定使每个笔画类型的虚提笔和连笔特征至多只能有一个是稳定的;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画提连笔特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,按笔画类型统计所述测试手写笔迹样本中笔画的虚提笔和连笔特征,找出与所述注册手写笔迹样本集合中虚提笔和连笔特征稳定且一致的笔画,依据在笔画提连笔特征预学习阶段计算得到的标准汉字c所有笔画的虚提笔和连笔特征在人群中出现的概率,计算观测到测试手写笔迹样本与注册手写笔迹样本集合中所有稳定且一致的虚提笔和连笔笔画组合的概率,根据所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致是指测试手写笔迹样本在书写某段笔画类型的笔画时提笔或未提笔状态与所述注册手写笔迹样本集合中的笔迹样本在书写类型相同的笔画时稳定的提笔或连笔特征相同;所述稳定提笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时提笔的样本个数超过未提笔的样本个数;稳定连笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时未提笔的样本个数超过提笔的样本个数;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户;
优选地,所述步骤A)中,笔画提连笔特征预学习包括如下步骤:
A1)设S={s1,s2,...,sN}表示足够多书写者手写的关于标准汉字c的预学习手写笔迹样本集合,每位书写者提供了1至3个样本,设 T={t1,t2,...,tO}表示标准汉字c包含的所有基本笔画集合,O表示标准汉字c包含的所有基本笔画数,N表示集合S中包含的笔迹个数;所述足够多是指集合S中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化预学习手写笔迹样本集合S中笔画的提笔和未提笔次数向量E=(e1,e2,...,eO),E'=(e'1,e'2,...,e'O),设置初始值ei=0,e′i=0,1≤i≤O;
A3)初始化循环变量k=1;
A4)识别第k个手写笔迹的笔画类型,即识别手写笔迹样本中各段笔画的类型,其中符号 xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤nk,nk表示手写笔迹样本sk∈S中包含的采样点个数;设/>表示识别手写笔迹样本sk∈S中每一段笔画得到的笔画类型集合,xk表示手写笔迹样本sk∈S中包含的笔画数,/>1≤oj≤O,1≤j≤xk,1≤k≤N,O表示标准汉字c包含的所有基本笔画数,N表示预学习手写笔迹样本集合S中包含的笔迹个数,T表示标准汉字c包含的所有基本笔画集合;
A5)初始化内循环变量l=1;
A6)读取的第l个笔画类型/>判别手写笔迹样本sk∈S中被识别为/>类型的笔画/>是否有断笔,即判断笔画/>中是否存在力信息分量满足条件/>的采样点,0≤m≤nl,若有断笔,则依/>在集合T中的序号ol,使向量E中的第ol个元素/>表示被识别为/>类型的笔画有提笔,否则,使向量E'中的第ol个元素/>表示被识别为/>类型的笔画没有提笔,其中笔画/>是手写笔迹样本sk时间序列的一个子段,/>子段从第aj个采样点开始,共包含nl+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,aj≥1,nl>1,aj+nl≤nk,nk表示手写笔迹样本sk中采样点个数;
A7)l=l+1,若l≤xk,则跳转至步骤A6),读下一个笔画类型,否则,跳转至步骤A8),识别预学习手写笔迹样本集合S中下一个笔迹;
A8)k=k+1,若k≤N,则跳转至步骤A4),否则,预学习手写笔迹样本集合S中的所有笔迹识别结束,跳转至步骤A9);
A9)统计提笔频率特征,用向量E和E'除以N,得到笔画类型提笔和未提笔频率向量P和P',其中pi=ei/N,p′i=e′i/N,0≤i≤O;
A10)结束,返回笔画类型提笔和未提笔频率向量P和P'。
优选地,所述步骤B)中,笔画提连笔特征注册包括如下步骤:
B1)注册用户提交关于标准汉字c的注册手写笔迹样本集合 H={h1,h2,...,hq},q≥3;
B2)初始化注册手写笔迹样本集合H中笔画提笔和未提笔次数向量A=(a1,a2,...,aO),A'=(a1',a'2,...,a'O),设置初始值ai=0,a′i=0,1≤i≤O;
B3)初始化循环变量k=1;
B4)识别注册手写笔迹样本中各段笔画的类型,设/>表示识别注册手写笔迹样本 hk∈H中每一段笔画得到的笔画类型集合,xk表示注册手写笔迹样本 hk∈H中包含的笔画数,/>1≤oj≤O,1≤j≤xk,1≤k≤q,O表示标准汉字c包含的所有基本笔画数,q表示注册手写笔迹样本集合H中包含的笔迹个数,T表示标准汉字c包含的所有基本笔画集合;
B5)初始化循环变量l=1;
B6)读取笔画类型集合的第l个笔画类型/>判别注册手写笔迹样本hk∈H中被识别为/>类型的笔画/>是否有断笔,即判断笔画/>中是否有力信息分量满足条件/>的采样点,0≤m≤vl,若有断笔,则依在集合T中的序号ol,使向量A中的第ol个元素/>表示被识别为/>类型的笔画有提笔,否则,使向量A‘中的第ol个元素/>表示被识别为/>类型的笔画没有提笔,其中笔画/>是注册手写笔迹样本hk时间序列的一个子段,/>子段从hk的第bj个采样点开始,共包含vl+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,bj≥1,vl>1, bj+vl≤nk,nk表示笔迹hk中采样点个数;
B8)k=k+1,若k≤N,则跳转至步骤B4),否则,表示注册手写笔迹样本集合H中的所有笔迹识别结束,跳转至步骤B9);
B9)结束,返回注册手写笔迹样本集合H中笔画提笔和未提笔次数向量A和A'。
优选地,所述步骤C)中,笔画提连笔特征认证包括如下步骤:
C1)待认证用户输入关于标准汉字c的测试手写笔迹样本W;
C2)识别测试手写笔迹样本W={(x1,y1,f1),(x2,y2,f2),...,(xk,yk,fk)}中各段笔画的类型,设表示识别测试手写笔迹样本W中每一段笔画得到的笔画类型集合,x表示手写测试手写笔迹样本W中包含的笔画数,/>O表示标准汉字c包含的所有基本笔画数;
C3)初始化循环变量l=1;
C4)读取注册手写笔迹样本集合中与测试手写笔迹样本稳定且一致的提连笔特征概率:读取tw的第l笔画状态判别测试手写笔迹样本W中被识别为/>类型的笔画是否有断笔,即判断笔画中是否有力信息分量满足条件/>的采样点,0≤m≤ul,若有断笔,则读取在注册阶段得到的向量A中的第ol个分量/>和向量 A‘中的第ol个分量/>判断是否/>若成立,置/>否则置 p1l=1,若没有断笔,则读取在注册阶段得到的向量A'中的第ol个分量/>和向量A中的第ol个分量/>判断是否/>若成立,置/>否则置p1l=1,其中笔画/>是测试手写笔迹样本W时间序列的一个子段,/>子段从W的第dj个采样点开始,共包含ul+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,dj≥1,ul>1,dj+ul≤k,k表示笔迹W中采样点个数;
C5)l=l+1,若l≤x,则跳转至步骤C4),读下一个笔画状态,否则,跳转至步骤C6);
C7)测试手写笔迹样本W笔画与虚提笔和连笔特征的判别:将所述步骤C6)取得的所有笔画提笔和未提笔状态组合的概率P1(W),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试手写笔迹样本W是否为真实笔迹;
C8)结束,并返回判别结果。
本发明与现有技术相比,具有以下优点:能有效提取出处于局部笔画的虚提笔或连笔特征,并估算稳定且一致虚提笔和连笔笔画组合在人群中出现的概率,有助于识别出违反书写规范且稳定的书写方式,提升笔迹认证性能。
附图说明
图1为本发明在线笔迹认证中笔画提连笔特征的提取及认证方法的流程图;
图2为图1中步骤A)的具体流程图;
图3为图1中步骤B)的具体流程图;
图4为图1中步骤C)的具体流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
在线笔迹认证中笔画提连笔特征的提取及认证方法,如图1所示,包括如下步骤:
A)笔画提连笔特征预学习:收集人群关于标准汉字c的手写笔迹样本取得预学习手写笔迹样本集合,识别所述预学习手写笔迹样本集合中的笔画类型,依据书写力分量是否小于一定阈值来判别在书写各段笔画时是否有提笔,根据所识别的笔画类型统计各种笔画的虚提笔和连笔特征在人群中出现的次数,将所述各种笔画的虚提笔和连笔特征在人群中出现的次数与所述预学习手写笔迹样本集合中的样本个数之比作为笔画的虚提笔和连笔特征在人群中出现的概率;
所述笔画提连笔包含提笔和连笔;所述笔画提笔包含虚提笔、断笔、抬笔,所述笔画连笔包含连笔、未断笔和未抬笔;
所述笔画的虚提笔、断笔、抬笔是指,在书写规范规定的汉字书写过程中,在本应连笔而不应有提笔或断笔的地方,由于快速书写造成的意连笔断或虚提笔或抬笔的书写现象,或在书写笔画时由于犹豫造成的提笔停顿后重新继续书写的断笔书写现象;
所述笔画的连笔、未断笔、未抬笔是指,在书写规范规定的一段笔画结束与下一段笔画开始之间本应有提笔或断笔或抬笔的地方,由于快速书写,造成未有提笔或断笔或抬笔而连续书写的现象;
所述手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力;
所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
具体而言,如图2所示,笔画提连笔特征预学习包括如下步骤:
A1)设S={s1,s2,...,sN}表示足够多书写者手写的关于标准汉字c的预学习手写笔迹样本集合,每位书写者提供了1至3个样本,设 T={t1,t2,...,tO}表示标准汉字c包含的所有基本笔画集合,O表示标准汉字c包含的所有基本笔画数,N表示集合S中包含的笔迹个数;所述足够多是指集合S中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化预学习手写笔迹样本集合S中笔画的提笔和未提笔次数向量E=(e1,e2,...,eO),E'=(e'1,e'2,...,e'O),设置初始值ei=0,e′i=0,1≤i≤O;
A3)初始化循环变量k=1;
A4)识别第k个手写笔迹的笔画类型,即识别手写笔迹样本中各段笔画的类型,其中符号 xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤nk,nk表示笔迹sk中采样点个数;设/>表示识别手写笔迹样本sk∈S中每一段笔画得到的笔画类型集合,nk表示手写笔迹样本sk∈S中包含的采样点个数,xk表示手写笔迹样本sk∈S中包含的笔画数,/>O表示标准汉字c包含的所有基本笔画数,N表示预学习手写笔迹样本集合S中包含的笔迹个数,T表示标准汉字c包含的所有基本笔画集合;
A5)初始化内循环变量l=1;
A6)读取的第l个笔画类型/>判别手写笔迹样本sk∈S中被识别为/>类型的笔画/>是否有断笔,即判断笔画/>中是否存在力信息分量满足条件/>的采样点,0≤m≤nl,若有断笔,则依/>在集合T中的序号ol,使向量E中的第ol个元素/>表示被识别为/>类型的笔画有提笔,否则,使向量E'中的第ol个元素/>表示被识别为/>类型的笔画没有提笔,其中笔画/>是手写笔迹样本sk时间序列的一个子段,/>子段从第aj个采样点开始,共包含nl+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,aj≥1,nl>1,aj+nl≤nk,nk表示手写笔迹样本sk中采样点个数;
A7)l=l+1,若l≤xk,则跳转至步骤A6),读下一个笔画类型,否则,跳转至步骤A8),识别预学习手写笔迹样本集合S中下一个笔迹;
A8)k=k+1,若k≤N,则跳转至步骤A4),否则,预学习手写笔迹样本集合S中的所有笔迹识别结束,跳转至步骤A9);
A9)统计提笔频率特征,用向量E和E'除以N,得到笔画类型提笔和未提笔频率向量P和P',其中pi=ei/N,p′i=e′i/N,0≤i≤O;
A10)结束,返回笔画类型提笔和未提笔频率向量P和P';
B)笔画提连笔特征注册:收集注册用户关于标准汉字c的若干个注册手写笔迹样本,组成注册手写笔迹样本集合,识别所述注册手写笔迹样本集合中的笔画类型,并按笔画类型统计注册手写笔迹样本集合中各笔画的虚提笔和连笔特征出现的次数,将所述注册手写笔迹样本中各笔画的虚提笔和连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中的样本个数之比作为评判笔画的虚提笔和连笔特征是否稳定的依据,若某笔画的虚提笔或连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中所有样本个数之比大于预先设定的阈值,则称注册用户书写该笔画的虚提笔或连笔特征为稳定的,所述阈值的设定使每个笔画类型的虚提笔和连笔特征至多只能有一个是稳定的;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
具体而言,如图3所示,笔画提连笔特征注册包括如下步骤:
B1)注册用户提交关于标准汉字c的注册手写笔迹样本集合 H={h1,h2,...,hq},q≥3;
B2)初始化注册手写笔迹样本集合H中笔画提笔和未提笔次数向量A=(a1,a2,...,aO),A'=(a1',a'2,...,a'O),设置初始值ai=0,a′i=0,1≤i≤O;
B3)初始化循环变量k=1;
B4)识别注册手写笔迹样本中各段笔画的类型,设/>表示识别注册手写笔迹样本 hk∈H中每一段笔画得到的笔画类型集合,xk表示注册手写笔迹样本 hk∈H中包含的笔画数,O表示标准汉字c包含的所有基本笔画数,q表示注册手写笔迹样本集合H中包含的笔迹个数,T表示标准汉字c包含的所有基本笔画集合;
B5)初始化循环变量l=1;
B6)读取笔画类型集合的第l个笔画类型/>判别注册手写笔迹样本hk∈H中被识别为/>类型的笔画/>是否有断笔,即判断笔画/>中是否存在力信息分量满足条件/>的采样点,0≤m≤vl,若有断笔,则依/>在集合T中的序号ol,使向量A中的第ol个元素/>表示被识别为/>类型的笔画有提笔,否则,使向量A‘中的第ol个元素/>表示被识别为/>类型的笔画没有提笔,其中笔画/>是注册手写笔迹样本hk时间序列的一个子段,/>子段从hk的第bj个采样点开始,共包含vl+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,bj≥1,vl>1, bj+vl≤nk,nk表示笔迹hk中采样点个数;
B8)k=k+1,若k≤N,则跳转至步骤B4),否则,表示注册手写笔迹样本集合H中的所有笔迹识别结束,跳转至步骤B9);
B9)结束,返回注册手写笔迹样本集合H中笔画提笔和未提笔次数向量A和A';
C)笔画提连笔特征认证:待认证用户提交一个关于标准汉字c的的测试手写笔迹样本,按笔画类型统计所述测试手写笔迹样本中笔画的虚提笔和连笔特征,找出与所述注册手写笔迹样本集合中虚提笔和连笔特征稳定且一致的笔画,依据在笔画提连笔特征预学习阶段计算得到的标准汉字c所有笔画的虚提笔和连笔特征在人群中出现的概率,计算观测到测试手写笔迹样本与注册手写笔迹样本集合中所有稳定且一致的虚提笔和连笔笔画组合的概率,根据所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹,其中,所述稳定且一致指在测试手写笔迹样本中提取的每段笔画的虚提笔或连笔特征与所述注册手写笔迹样本集合中被识别为相同笔画类型的笔画的虚提笔或连笔特征是相同的,且所述被识别为相同笔画类型的笔画的虚提笔或连笔特征在所述注册手写笔迹样本集合中是稳定的,所述待认证用户指真实认证未得到确认的用户;
所述稳定且一致是指测试手写笔迹样本在书写某段笔画类型的笔画时提笔或未提笔状态与所述注册手写笔迹样本集合中的笔迹样本在书写类型相同的笔画时稳定的提笔或连笔特征相同;所述稳定提笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时提笔的样本个数超过未提笔的样本个数;稳定连笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时未提笔的样本个数超过提笔的样本个数;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户;
具体而言,如图3所示,笔画提连笔特征认证包括如下步骤:
C1)待认证用户输入关于标准汉字c的测试手写笔迹样本W;
C2)识别测试手写笔迹样本W={(x1,y1,f1),(x2,y2,f2),...,(xk,yk,fk)}中各段笔画的类型,设表示识别测试手写笔迹样本W中每一段笔画得到的笔画类型集合,x表示手写测试手写笔迹样本W中包含的笔画数,/>O表示标准汉字c包含的所有基本笔画数,T表示标准汉字c包含的所有基本笔画集合;
C3)初始化循环变量l=1;
C4)读取注册手写笔迹样本集合中与测试手写笔迹样本稳定且一致的提连笔特征概率:读取tw的第l笔画状态判别测试手写笔迹样本W中被识别为/>类型的笔画是否有断笔,即判断笔画中是否有力信息分量满足条件/>的采样点,0≤m≤ul,若有断笔,则读取在注册阶段得到的向量A中的第ol个分量/>和向量 A‘中的第ol个分量/>判断是否/>若成立,置/>否则置 p1l=1,若没有断笔,则读取在注册阶段得到的向量A'中的第ol个分量/>和向量A中的第ol个分量/>判断是否/>若成立,置/>否则置p1l=1,其中笔画/>是测试手写笔迹样本W时间序列的一个子段,/>子段从W的第dj个采样点开始,共包含ul+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,dj≥1,ul>1,dj+ul≤k,k表示笔迹W中采样点个数;
C5)l=l+1,若l≤x,则跳转至步骤C4),读下一个笔画状态,否则,跳转至步骤C6);
C7)测试手写笔迹样本W笔画与虚提笔和连笔特征的判别:将所述步骤C6)取得的所有笔画提笔和未提笔状态组合的概率P1(W),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试手写笔迹样本W是否为真实笔迹;
C8)结束,并返回判别结果。
本发明在线笔迹认证中笔画提连笔特征的提取及认证方法,能有效提取出处于局部笔画的虚提笔或连笔特征,并估算稳定且一致虚提笔和连笔笔画组合在人群中出现的概率,有助于识别出违反书写规范且稳定的书写方式,提升笔迹认证性能。
本发明未详细公开的部分属于本领域的公知技术。尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (3)
1.在线笔迹认证中笔画提连笔特征的提取及认证方法,其特征在于:包括如下步骤:
A)笔画提连笔特征预学习:收集人群关于标准汉字c的手写笔迹样本取得预学习手写笔迹样本集合,识别所述预学习手写笔迹样本集合中的笔画类型,依据书写力分量是否小于一定阈值来判别在书写各段笔画时是否有或没有提笔,根据所识别的笔画类型统计各种笔画的虚提笔和连笔特征在人群中出现的次数,将所述各种笔画的虚提笔和连笔特征在人群中出现的次数与所述预学习手写笔迹样本集合中的样本个数之比作为笔画的虚提笔和连笔特征在人群中出现的概率;
所述笔画提连笔包含提笔和连笔;所述笔画提笔包含虚提笔、断笔、抬笔,所述笔画连笔包含连笔、未断笔和未抬笔;
所述笔画的虚提笔、断笔、抬笔是指,在书写规范规定的汉字书写过程中,在本应连笔而不应有提笔或断笔的地方,由于快速书写造成的意连笔断或虚提笔或抬笔的书写现象,或在书写笔画时由于犹豫造成的提笔停顿后重新继续书写的断笔书写现象;
所述笔画的连笔、未断笔、未抬笔是指,在书写规范规定的一段笔画结束与下一段笔画开始之间本应有提笔或断笔或抬笔的地方,由于快速书写,造成未有提笔或断笔或抬笔而连续书写的现象;
所述手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力;
所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
B)笔画提连笔特征注册:收集注册用户关于标准汉字c的若干个注册手写笔迹样本,组成注册手写笔迹样本集合,识别所述注册手写笔迹样本集合中的笔画类型,并按笔画类型统计注册手写笔迹样本集合中各笔画的虚提笔和连笔特征出现的次数,将所述注册手写笔迹样本中各笔画的虚提笔和连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中的样本个数之比作为评判笔画的虚提笔和连笔特征是否稳定的依据,若某笔画的虚提笔或连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中所有样本个数之比大于预先设定的阈值,则称注册用户书写该笔画的虚提笔或连笔特征为稳定的,所述阈值的设定使每个笔画类型的虚提笔和连笔特征至多只能有一个是稳定的;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画提连笔特征认证:待认证用户提交一个关于标准汉字c的的测试手写笔迹样本,按笔画类型统计所述测试手写笔迹样本中笔画的虚提笔和连笔特征,找出与所述注册手写笔迹样本集合中虚提笔和连笔特征稳定且一致的笔画,依据在笔画提连笔特征预学习阶段计算得到的标准汉字c所有笔画的虚提笔和连笔特征在人群中出现的概率,计算观测到测试手写笔迹样本与注册手写笔迹样本集合中所有稳定且一致的虚提笔和连笔笔画组合的概率,根据所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述步骤C)中,笔画提连笔特征认证包括如下步骤:
C1)待认证用户输入关于标准汉字c的测试手写笔迹样本W;
C2)识别测试手写笔迹样本W={(x1,y1,f1),(x2,y2,f2),...,(xk,yk,fk)},中各段笔画的类型,设表示识别测试手写笔迹样本W中每一段笔画得到的笔画类型集合,x表示手写测试手写笔迹样本W中包含的笔画数,/>1≤oj≤O,1≤j≤x,O表示标准汉字c包含的所有基本笔画数;
C3)初始化循环变量l=1;
C4)读取注册手写笔迹样本集合中与测试手写笔迹样本稳定且一致的提连笔特征概率:读取tw的第l笔画状态判别测试手写笔迹样本W中被识别为/>类型的笔画是否有断笔,即判断笔画中是否有力信息分量满足条件/>的采样点,0≤m≤ul,若有断笔,则读取在注册阶段得到的向量A中的第ol个分量/>和向量A‘中的第ol个分量/>判断是否/>若成立,置/>否则置p1l=1,若没有断笔,则读取在注册阶段得到的向量A'中的第ol个分量和向量A中的第ol个分量/>判断是否/>若成立,置/>否则置p1l=1,其中笔画/>是测试手写笔迹样本W时间序列的一个子段,/>子段从W的第dj个采样点开始,共包含ul+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,dj≥1,ul>1,dj+ul≤k,k表示笔迹W中采样点个数;
C5)l=l+1,若l≤x,则跳转至步骤C4),读下一个笔画状态,否则,跳转至步骤C6);
C7)测试手写笔迹样本W笔画与虚提笔和连笔特征的判别:将所述步骤C6)取得的所有笔画提笔和未提笔状态组合的概率P1(W),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试手写笔迹样本W是否为真实笔迹;
C8)结束,并返回判别结果;
所述稳定且一致是指测试手写笔迹样本在书写某段笔画类型的笔画时提笔或未提笔状态与所述注册手写笔迹样本集合中的笔迹样本在书写类型相同的笔画时稳定的提笔或连笔特征相同;所述稳定提笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时提笔的样本个数超过未提笔的样本个数;稳定连笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时未提笔的样本个数超过提笔的样本个数;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。
2.根据权利要求1所述在线笔迹认证中笔画提连笔特征的提取及认证方法,其特征在于:所述步骤A)中,笔画提连笔特征预学习包括如下步骤:
A1)设S={s1,s2,...,sN}表示足够多书写者手写的关于标准汉字c的预学习手写笔迹样本集合,每位书写者提供了1至3个样本,设T={t1,t2,...,tO}表示标准汉字c包含的所有基本笔画集合,O表示标准汉字c包含的所有基本笔画数,N表示集合S中包含的笔迹个数;所述足够多是指集合S中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化预学习手写笔迹样本集合S中笔画的提笔和未提笔次数向量E=(e1,e2,...,eO),E'=(e'1,e'2,...,e'O),设置初始值ei=0,e′i=0,1≤i≤O;
A3)初始化循环变量k=1;
A4)识别第k个手写笔迹的笔画类型,即识别手写笔迹样本中各段笔画的类型,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤nk,nk表示笔迹sk中采样点个数;设/>表示识别手写笔迹样本sk∈S中每一段笔画得到的笔画类型集合,nk表示手写笔迹样本sk∈S中包含的采样点个数,xk表示手写笔迹样本sk∈S中包含的笔画数,/>1≤oj≤O,1≤j≤xk,1≤k≤N,O表示标准汉字c包含的所有基本笔画数,N表示预学习手写笔迹样本集合S中包含的笔迹个数,T表示标准汉字c包含的所有基本笔画集合;
A5)初始化内循环变量l=1;
A6)读取的第l个笔画类型/>判别手写笔迹样本sk∈S中被识别为/>类型的笔画是否有断笔,即判断笔画/>中是否存在力信息分量满足条件/>的采样点,0≤m≤nl,若有断笔,则依/>在集合T中的序号ol,使向量E中的第ol个元素/>表示被识别为/>类型的笔画有提笔,否则,使向量E'中的第ol个元素/>表示被识别为/>类型的笔画没有提笔,其中笔画/>是手写笔迹样本sk时间序列的一个子段,/>子段从第aj个采样点开始,共包含nl+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,aj≥1,nl>1,aj+nl≤nk,nk表示手写笔迹样本sk中采样点个数;
A7)l=l+1,若l≤xk,则跳转至步骤A6),读下一个笔画类型,否则,跳转至步骤A8),识别预学习手写笔迹样本集合S中下一个笔迹;
A8)k=k+1,若k≤N,则跳转至步骤A4),否则,预学习手写笔迹样本集合S中的所有笔迹识别结束,跳转至步骤A9);
A9)统计提笔频率特征,用向量E和E'除以N,得到笔画类型提笔和未提笔频率向量P和P',其中pi=ei/N,p′i=ei/N,0≤i≤O;
A10)结束,返回笔画类型提笔和未提笔频率向量P和P'。
3.根据权利要求2所述在线笔迹认证中笔画提连笔特征的提取及认证方法,其特征在于:所述步骤B)中,笔画提连笔特征注册包括如下步骤:
B1)注册用户提交关于标准汉字c的注册手写笔迹样本集合H={h1,h2,...,hq},q≥3;
B2)初始化注册手写笔迹样本集合H中笔画提笔和未提笔次数向量A=(a1,a2,...,aO),A'=(a′1,a'2,...,a'O),设置初始值ai=0,a′i=0,1≤i≤O;
B3)初始化循环变量k=1;
B4)识别注册手写笔迹样本中各段笔画的类型,设/>表示识别注册手写笔迹样本hk∈H中每一段笔画得到的笔画类型集合,xk表示注册手写笔迹样本hk∈H中包含的笔画数,/>1≤oj≤O,1≤j≤xk,1≤k≤q,O表示标准汉字c包含的所有基本笔画数,q表示注册手写笔迹样本集合H中包含的笔迹个数,T表示标准汉字c包含的所有基本笔画集合;
B5)初始化循环变量l=1;
B6)读取笔画类型集合的第l个笔画类型/>判别注册手写笔迹样本hk∈H中被识别为/>类型的笔画/>是否有断笔,即判断笔画/>中是否有力信息分量满足条件/>的采样点,0≤m≤vl,若有断笔,则依/>在集合T中的序号ol,使向量A中的第ol个元素/>表示被识别为/>类型的笔画有提笔,否则,使向量A‘中的第ol个元素/>表示被识别为/>类型的笔画没有提笔,其中笔画/>是注册手写笔迹样本hk时间序列的一个子段,/>子段从hk的第bj个采样点开始,共包含vl+1个采样点,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,bj≥1,vl>1,bj+vl≤nk,nk表示笔迹hk中采样点个数;
B8)k=k+1,若k≤N,则跳转至步骤B4),否则,表示注册手写笔迹样本集合H中的所有笔迹识别结束,跳转至步骤B9);
B9)结束,返回注册手写笔迹样本集合H中笔画提笔和未提笔次数向量A和A'。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911224759.7A CN111310543B (zh) | 2019-12-04 | 2019-12-04 | 在线笔迹认证中笔画提连笔特征的提取及认证方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911224759.7A CN111310543B (zh) | 2019-12-04 | 2019-12-04 | 在线笔迹认证中笔画提连笔特征的提取及认证方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111310543A CN111310543A (zh) | 2020-06-19 |
CN111310543B true CN111310543B (zh) | 2023-05-30 |
Family
ID=71156250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911224759.7A Active CN111310543B (zh) | 2019-12-04 | 2019-12-04 | 在线笔迹认证中笔画提连笔特征的提取及认证方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310543B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114296565B (zh) * | 2021-11-17 | 2024-05-14 | 湖北工业大学 | 纸屏同步笔尖位置信息校正方法 |
CN114529910B (zh) * | 2022-01-27 | 2024-09-06 | 北京鼎事兴教育咨询有限公司 | 手写文字识别方法、装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001256438A (ja) * | 2000-03-14 | 2001-09-21 | Ntt Comware Corp | 手書き文字管理装置、手書き文字管理方法、手書き文字照会システムおよび手書き文字照会方法 |
CN1701323A (zh) * | 2001-10-15 | 2005-11-23 | 西尔弗布鲁克研究有限公司 | 使用笔迹特征合成的数字笔迹数据库搜索 |
CN101866417A (zh) * | 2010-06-18 | 2010-10-20 | 西安电子科技大学 | 一种手写体维吾尔字符识别方法 |
CN103258157A (zh) * | 2013-04-18 | 2013-08-21 | 武汉汉德瑞庭科技有限公司 | 一种基于手指信息的在线笔迹认证方法及系统 |
TW201544991A (zh) * | 2014-05-16 | 2015-12-01 | Kuo-Chin Fan | 3d手寫辨識方法及系統 |
-
2019
- 2019-12-04 CN CN201911224759.7A patent/CN111310543B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001256438A (ja) * | 2000-03-14 | 2001-09-21 | Ntt Comware Corp | 手書き文字管理装置、手書き文字管理方法、手書き文字照会システムおよび手書き文字照会方法 |
CN1701323A (zh) * | 2001-10-15 | 2005-11-23 | 西尔弗布鲁克研究有限公司 | 使用笔迹特征合成的数字笔迹数据库搜索 |
CN101866417A (zh) * | 2010-06-18 | 2010-10-20 | 西安电子科技大学 | 一种手写体维吾尔字符识别方法 |
CN103258157A (zh) * | 2013-04-18 | 2013-08-21 | 武汉汉德瑞庭科技有限公司 | 一种基于手指信息的在线笔迹认证方法及系统 |
TW201544991A (zh) * | 2014-05-16 | 2015-12-01 | Kuo-Chin Fan | 3d手寫辨識方法及系統 |
Also Published As
Publication number | Publication date |
---|---|
CN111310543A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tang et al. | Research on deep learning techniques in breaking text-based captchas and designing image-based captcha | |
Du et al. | Wavelet domain local binary pattern features for writer identification | |
CN103258157B (zh) | 一种基于手指信息的在线笔迹认证方法及系统 | |
Bharadi et al. | Off-line signature recognition systems | |
CN111310543B (zh) | 在线笔迹认证中笔画提连笔特征的提取及认证方法 | |
JP2013543158A (ja) | 重なった手書き文字のストロークを一つ又は複数のグループにグループ分けする方法及び装置 | |
US11416592B2 (en) | Method for online signature verification using wrist-worn devices | |
Tolosana et al. | Feature-based dynamic signature verification under forensic scenarios | |
CN110929242B (zh) | 基于无线信号进行姿态无关的连续用户认证方法及系统 | |
CN111857334A (zh) | 人体手势字母的识别方法、装置、计算机设备及存储介质 | |
Pirlo | Algorithms for signature verification | |
CN105893952A (zh) | 基于pca方法的手写签名识别方法 | |
CN102411712B (zh) | 基于笔迹的身份识别的方法及终端 | |
Sanchez-Reillo et al. | Improving presentation attack detection in dynamic handwritten signature biometrics | |
Štruc et al. | Phase congruency features for palm-print verification | |
CN113361666A (zh) | 一种手写字符识别方法、系统及介质 | |
JP2009528615A (ja) | 付加的文字認識方法とその装置 | |
Jain et al. | Modified chain code histogram feature for handwritten character recognition | |
CN113111322B (zh) | 一种基于多模态融合的智能手机辅助认证方法 | |
CN111310546B (zh) | 在线笔迹认证中一种书写节奏特征的提取及认证方法 | |
CN111259726B (zh) | 在线笔迹认证中一种笔画动态特征的提取及认证方法 | |
Jeong et al. | Hand-written digit recognition using Fourier descriptors and contour information | |
Xiao et al. | On-line handwritten Chinese character recognition directed by components with dynamic templates | |
CN111310544B (zh) | 基于特征稳定性和特殊性分析的在线笔迹认证方法 | |
CN111310547A (zh) | 在线笔迹认证中一种笔顺特征的提取及认证方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |