CN115937873A - 一种基于可辨识单字字符的在线笔迹验证系统及方法 - Google Patents

一种基于可辨识单字字符的在线笔迹验证系统及方法 Download PDF

Info

Publication number
CN115937873A
CN115937873A CN202211099688.4A CN202211099688A CN115937873A CN 115937873 A CN115937873 A CN 115937873A CN 202211099688 A CN202211099688 A CN 202211099688A CN 115937873 A CN115937873 A CN 115937873A
Authority
CN
China
Prior art keywords
handwriting
characters
character
verification
online
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211099688.4A
Other languages
English (en)
Inventor
覃勋辉
羊东武
申发海
刘科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Aos Online Information Technology Co ltd
Original Assignee
Chongqing Aos Online Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Aos Online Information Technology Co ltd filed Critical Chongqing Aos Online Information Technology Co ltd
Priority to CN202211099688.4A priority Critical patent/CN115937873A/zh
Publication of CN115937873A publication Critical patent/CN115937873A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Character Discrimination (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开一种基于可辨识单字字符的在线笔迹验证方法,涉及电子签名技术领域,采集预设内容的单个手写字符或可拆分字符,根据字符识别判断签署内容是否为预设字符,获取与预设字符内容相同且带有身份标识的字符训练单字笔迹分类或表征网络模型,使同人同字的样本在向量空间聚合,其它样本拉远;提取字符表征,对比留样字符和验证字符的表征向量相似度,判断是否为同一个人书写的字符;根据各字符比对结果,判断在线手写签名或文本是否为同一人签署。

Description

一种基于可辨识单字字符的在线笔迹验证系统及方法
技术领域
本发明涉及在线手写电子笔迹领域,特别涉及一种基于可辨识单字字符的在线笔迹验证方法、系统和装置。
背景技术
现阶段,无纸化进程的推进以及触摸移动端和电子书写设备的普及,在线手写电子笔迹出现在人们生活的方方面面,基于在线笔迹的验证、识别也受到专业人士的广泛关注。尤其随着人工智能和深度学习技术的发展,通过搭建卷积神经网络对在线笔迹图像建模或者通过循环神经网络对在线时序数据建模,一方面,可以通过表征学习方法学习每个用户特有的个性化笔迹表征,再利用表征相似度进行笔迹验证。另一方面,可以通过构建比对样本对进行对比学习,学习正负样本对的差异进行笔迹验证。但是,上述方案基本上均是将整个笔迹数据作为输入,比如,在进行手写电子签名验证时,将整个手写电子签名作为建模对象。这种情况往往存在签字差异导致字符与字符之间难以对齐的问题,同时,在实际业务应用中,只对笔迹相似度进行了限制,而未对各字符做可辨识的限制,往往存在艺术字体、乱涂乱画等多种情况造成无法辨识的问题,影响签署内容的质量和有效性。本发明针对上述问题提出一种基于可辨识单字字符的在线笔迹验证技术,目的在于规范在线手写汉字的可辨识性,并在此基础上进行单个字符的笔迹验证,最后通过多个字符综合判断得到最终笔迹身份认证结果。
公开号CN201310405207.2,发明名称“一种基于字符的在线笔迹认证的模板扩充方法”,公开了一种在线测试笔迹与注册笔迹比对和模板自动扩充机制,当注册笔迹与测试笔迹比对通过时,将书写的未注册字符进行自动注册,完全依赖于算法比对结果,也没有对书写的未注册字符进行内容校验,存在注册数据混入与内容不匹配的汉字字符,从而导致注册数据被污染的风险。公开号CN202111540184.7,名称“基于通道注意力机制的签名鉴别系统及方法”通过直接将整个签名图片像素反转并拼接为多通道网络输入,利用通道注意力机制模型结合交叉熵损失函数进行二分类。由于签名笔迹图像过于稀疏,背景占据比例非常大,多通道笔迹很难进行对齐,卷积运算难以学到对应笔画的细粒度信息。公开号CN200710096215.8,名称“一种手写字符预测识别的方法和装置”公开了一种在线手写字符识别的方法和装置。用户手写输入字符一定数量的笔迹点;手写字符识别器对所述字符与写入的笔迹点进行识别,得到相应的一组识别结果;利用得到的识别结果信息以及包括在信息预测字符库中的多个预测字符集进行预测识别,得到一组候选字符,并显示所述候选字符。发明只针对手写字符内容进行识别,提供识别出的候选字符集,并未针对签字符笔迹进行书写者身份识别。
发明内容
本发明针对现有技术对在线手写字符验证没有完整校验,不能有效对齐,不能进行笔迹的有效验证,使得对电子签名的识别验证准确性不高等问题,提出一种基于可辨识单字字符的在线笔迹验证方法,包括,单字字符采集,可以有效提取签署过程中的连笔、简写、艺术签等情况,通过引入字符识别模块规范在线手写内容,实现签署字符内容可辨识,基于可辨识字符的在线手写字符笔迹比对。为了实现手写笔迹内容的可辨识性,并对手写笔迹进行比对验证,进而进行身份识别。本发明提供一种基于可辨识单字字符的在线笔迹验证方法,通过对在线签署采集形式的限定,如单屏单字符书写、可拆分区域签署等,以及对签署内容的可识别约束,一方面可以保证签署内容的可辨识性和有效性;另一方面,基于字符笔迹比对,消除了背景干扰和笔迹稀疏的问题,通过综合单字字符笔迹比对结果,可以有效提升整体在线签署的笔迹比对效果。
本发明解决上述技术问题的技术方案是,提出一种基于可辨识单字字符的在线笔迹验证系统,包括:笔迹注册单元、笔迹识别单元、数据校验单元、数据预处理单元、内容校验单元、特征提取单元、相似度计算单元,笔迹注册单元,用于获取在线书写字符及笔迹关联用户进行注册;笔迹识别单元,用于提取待验证字符及笔迹,对注册字符及笔迹、待验证字符及笔迹进行数据校验;数据预处理,用于以不同书写者书写的不同字符划分类别构建数据集,根据类别将在线手写字符数据集划分为训练集、验证集和测试集;内容校验单元,用于根据在线签署文本字符完成内容校验后提取特征;特征提取单元,用于利用训练集和验证集对深度学习神经网络模型训练和验证,训练基于图像的单字笔迹分类或表征网络模型,优化分类损失,更新网络权重,使同人同字的样本在向量空间聚合,其它样本拉远,优化深度学习网络模型构建单字字符笔迹识别模型,单字字符笔迹识别模型根据注册字符及笔迹特征、在线获取待验证字符及笔迹特征提取字符表征;相似度计算单元,用于对比注册留样字符和验证字符的表征向量相似度。
进一步优选,笔迹注册单元根据标准字符提示在线手写签署页面书写各个字符,采集文本字符进行内容校验,识别是否为与数据库中预设字符一致,提交经过校验的文本字符和用户唯一标识到数据库进行笔迹注册,并获取字符在线笔迹信息,其中,在线手写签署页面为可采集单个手写字符或字符可拆分的形式。
进一步优选,深度学习神经网络模型包括:笔迹时序特征提取分支、笔迹空间特征提取分支、特征合并单元,笔迹时序特征提取分支通过LSTM结合注意力机制和dropout层进行时序特征学习,提取具备时间依赖的深层用户笔迹差异或者共性特征;笔迹空间特征提取分支通过包含卷积层、标准化层和激活函数层的卷积模块进行局部空间域特征提取,卷积模块对多维输入特征矩阵进行卷积运算,提取在线手写字符局部信息和在线手写字符笔迹特征之间的相互依赖信息,得到笔迹空间特征,特征合并单元融合笔迹时序特征和笔迹空间特征,对字符数据进行分类,学习在线手写字符笔迹表征信息,度量学习优化字符对的特征向量距离,得到在线手写字符的特征向量矩阵。
进一步优选,采用软动态时间规整soft-DTW损失函数优化分类损失进行网络优化,基于优化网络模型构建单字字符笔迹识别模型,根据公式:
dtwγ(X,Y)=minγ{<A,Δ(x,y)>,A∈Al,m}
计算损失函数dtwγ(X,Y),其中,Al,m表示特征向量矩阵A中从(1,1)到(l,m)的路径,内积<A,Δ(x,y)>为这条路径下的代价和,Δ(x,y)为通过欧氏距离计算特征矩阵A中向量x与y的距离。
进一步优选,利用验证集对单字字符笔迹识别模型进行验证,通过验证集构建样本对,计算样本对之间签名或者文本和的特征相似度P,统计并拟合每个字符不同相似度下对应的准确率,提供不同字符的权重值,根据公式:
Figure BDA0003839613190000041
计算特征相似度P,其中,AUCi表示第i个单字字符对应的AUC评价指标,N表示注册的电子签名或者文本行个数,prob(Ai,Bi)表示第i个字符对(Ai,Bi)的相似度对应拟合的概率值。
进一步优选,通过对验证集取最佳结果对应的阈值获得每个字符对应的阈值threshold,根据公式:
Figure BDA0003839613190000042
计算第i个字符对(Ai,Bi)的相似度对应拟合的概率值,其中,similarity表示字符对(Ai,Bi)的相似度。
本发明还提吃一种基于可辨识单字字符的在线笔迹验证方法,采集预设内容的单个手写字符或可拆分字符,根据字符识别判断签署内容是否为预设字符,关联用户进行注册;提取待验证字符及笔迹,对注册字符及笔迹、待验证字符及笔迹进行数据校验;以不同书写者书写的不同字符划分类别构建数据集,根据类别将在线手写字符数据集划分为训练集、验证集和测试集;根据在线签署文本字符完成内容校验后提取特征;利用训练集和验证集对深度学习神经网络模型训练和验证,利用与预设字符内容相同的字符训练基于图像的单字笔迹分类或表征网络模型,优化分类损失,更新网络权重,使同人同字的样本在向量空间聚合,其它样本拉远,利用训练集和损失函数优化深度学习网络模型构建单字字符笔迹识别模型,单字字符笔迹识别模型根据注册字符及笔迹特征,融合笔迹时序特征和笔迹空间特征,在线获取待验证字符及笔迹特征提取字符表征,对比注册留样字符和验证字符的表征向量相似度,判断该字符是否为同一个人书写。
进一步优选,对签字字符数据进行有效性清洗,对签字字符数据进行预处理并提取用户习惯特征,建立训练集,训练集中同一个人在同一书写设备书写的相同字符互为正样本,其它的字符为负样本,所述清洗异常数据包括:去除轨迹坐标越界、时间戳倒流、点位长度过短、签署时间过短、签署方向异常、重复点位、野点、离群点;所述提取用户习惯特征包括:修复笔触状态和压力值,统一笔迹采样率,获取在线手写字符笔画的x速度、y速度、速度、加速度、角速度、压力、切角、对数曲率、向心加速度,提取用户习惯特征。
进一步优选,通过LSTM结合注意力机制和dropout层进行时序特征学习,提取具备时间依赖的深层用户笔迹差异或者共性特征;通过包含卷积层、标准化层和激活函数层的卷积模块进行局部空间域特征提取,卷积模块对多维输入特征矩阵进行卷积运算,提取在线手写字符局部信息和在线手写字符笔迹特征之间的相互依赖信息,得到笔迹空间特征;融合笔迹时序特征和笔迹空间特征,对字符数据进行分类,学习在线手写字符笔迹表征信息,度量学习优化字符对的特征向量距离,得到在线手写字符的特征向量矩阵。
进一步优选,所述构建单字字符笔迹识别模型具体包括,采用软动态时间规整soft-DTW损失函数优化分类损失进行网络优化,基于优化网络模型构建单字字符笔迹识别模型,根据公式:
dtwγ((X,Y)=minγ{<A,Δ(x,y)>,A∈Al,m}
计算损失函数dtwγ(X,Y),其中,Al,m表示特征向量矩阵A中从(1,1)到
(l,m)的路径,内积<A,Δ(x,y)>为这条路径下的代价和,Δ(x,y)为通过欧氏距离计算特征矩阵A中向量x与y的距离。
本发明通过以采集单个手写字符的形式,并结合字符OCR算法,规范用户输入,保证字符的可辨识性。利用与预设字符内容相同的字符训练基于图像的单字笔迹分类或表征网络模型,使同人同字的样本在向量空间聚合,其它样本拉远,获得每个字符对应的阈值,融合笔迹时序特征和笔迹空间特征,在线获取待验证字符及笔迹特征提取字符表征。在线手写签署页面为可采集单个手写字符或字符可拆分的形式,可分区域签署或切字,并且知晓手写字符内容。解决了整个签名或者多个签字无法进行中心对齐,容易受到字符间间隔背景干扰,负样本难以收集等问题,有效地提升整体签名或签署内容的笔迹比对精度。
附图说明
图1本发明单字笔迹验证方法流程示意图;
图2本发明字符笔迹注册流程示意图;
图3本发明实施例之一的骨干网络结构示意图;
图4分区域字符采集页面示意图;
图5为部分轨迹特征融合示意图。
具体实施方式
为了便于清楚地理解本发明,使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。在下面的描述中,提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本发明的实施例。因此,本领域技术人员应该清楚,可以对这里描述的实施例进行各种改变和修改而不脱离本发明的范围和精神。另外,为了清楚和简洁,省略了对已知功能和构造的描述,应当理解,实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
签署设备在线手写签署页面为可采集单个手写字符或字符可拆分的形式,包括但不限于单屏单字签署、分区域签署或切字算法获得,并且系统知晓手写字符内容。利用字符识别算法对手写输入的字符进行校验,判断签署内容是否为预设字符。训练基于图像的单字笔迹分类或表征网络模型,优化分类损失,更新网络权重,使同人同字的样本在向量空间聚合,其它样本拉远;利用训练网络提取字符表征,对比留样字符和验证字符的表征向量相似度,进行验证,判断是否为同一人书写的字符;综合各字符比对结果,得出手写文本行笔迹验证结果。
如图1所示为本发明单字笔迹验证方法流程示意图,包括,笔迹注册单元、笔迹识别单元、数据校验单元、数据预处理单元、内容校验单元、特征提取单元、相似度计算单元,笔迹注册单元获取在线书写字符及笔迹关联用户进行注册,笔迹识别单元提取待验证字符及笔迹,对注册字符及笔迹、待验证字符及笔迹进行数据校验和数据预处理,内容校验后提取特征;获取在线手写字符数据集划分训练集、验证集和测试集,利用训练集和验证集对深度学习神经网络模型训练和验证构建单字字符笔迹识别模型,单字字符笔迹识别模型根据注册字符及笔迹特征、待验证字符及笔迹特征进行相似度计算,综合判断验证。
签署设备的在线手写签署页面为可采集单个手写字符或字符可拆分的形式,包括但不限于单屏单字签署、分区域签署或切字算法获得,并且知晓手写字符内容。签字数据采集模块采集单个手写字符,并获取字符在线笔迹信息,如轨迹坐标(x,y)、笔触状态s、压力P和时间戳T等;签署设备中电子签名签署页面包括但不限于单屏单字书写、分区单字书写、或完整采集再切分等可采集完整单个字符的签署形式。
如图2所示为字符笔迹注册流程,用户根据预先设定的文本内容,笔迹注册单元根据标准字符提示在签字页面进行各个字符的书写,通过内容校验后,提交文本字符和用户唯一标识到数据库进行笔迹注册;采集文本字符,进行比较识别是否为有效数据,对有效数据进行预处理,对预处理结果进行识别,利用字符识别算法对手写输入的字符进行校验,识别是否为与数据库中预设字符一致?判断签署内容是否为预设字符。如果一致注册成功,则校验通过完成提交;否则,提示书写者重新书写该内容,重新进行字符采集。
实施方式之一,可利用字符识别模型对采集的单个字符进行字符内容识别,以识别概率最大对应的汉字为模型识别结果,或针对内容设置超过指定相似度,比较识别内容是否为预设汉字内容。训练单字笔迹分类或表征网络模型,使同人同字的样本在向量空间聚合,其它样本拉远。
数据预处理单元对采集的字符笔迹数据进行预处理,并以不同书写者书写的不同字符作为不同类别构建数据集,并以类别划分训练集、验证集和测试集。对签字字符数据进行有效性清洗包括,清洗的异常数据包括:轨迹坐标越界、时间戳倒流、点位长度过短、签署时间过短、签署方向异常等;对签字字符数据进行预处理,包括:重复点位去除、修复笔触状态、修复压力值、野点去除、离群点去除以及统一笔迹采样率;清洗后的数据根据轨迹点位信息提取用户习惯特征,如x速度、y速度、速度、加速度、角速度、压力、切角、对数曲率、向心加速度,或其它高阶特征;建立深度学习神经网络,利用训练集数据优化网络模型。同一个人相同汉字互为正样本,其它为负样本。
建立由骨干特征提取网络和损失函数网络构成的深度学习神经网络模型。输入训练集对深度学习神经网络模型进行训练,通过深度学习神经网络模型对字符数据进行分类,学习在线手写字符笔迹表征信息,也可以通过度量学习优化字符对的特征向量距离。目的是在训练过程中拉进正样本距离,增大负样本距离。骨干特征提取网络结构可以为循环神经网络RNN、长短期记忆网络LSTM、门控循环单元GRU、一维卷积神经网络或自定义网络等结构,图3所示为本发明实施例骨干特征提取网络结构示意图。通过输入上述训练样本获取用户习惯特征,示意图中左侧为笔迹时序特征提取,分支通过LSTM结合注意力机制和随机丢弃层dropout层进行时序特征进行学习,提取具备时间依赖的深层用户笔迹差异或者共性特征;右侧为笔迹空间特征提取,通过包含卷积层、批标准化层和激活函数层的卷积模块进行局部空间域特征提取,卷积模块对多维输入特征矩阵进行卷积运算,一方面可以提取单类局部信息,另一方面可以获取特征之间的相互依赖信息,特征合并单元部分融合笔迹时序特征和笔迹空间特征,得到特征向量矩阵A。通过损失函数对网络提取的笔迹特征向量进行分类或者对比学习,优化网络模型权重,提升网络对字符笔迹的表征能力。
基于骨干特征提取网络输出的特征向量,可选择再接多层感机优化,损失函数可以采用如对比损失contrastive loss、交叉熵损失softmax loss、三元组损失tripletloss、附加角裕度ArcFace(Additive Angular Margin)损失等作为损失函数。本实施例根据度量学习,采用soft-DTW(软动态时间规整)损失函数进行网络优化,具体为,根据公式:
dtwγ(X,Y)=minγ{<A,Δ(x,y)>,A∈Al,m}
计算损失函数dtwγ(X,Y)。其中:
Figure BDA0003839613190000101
Figure BDA0003839613190000102
Figure BDA0003839613190000103
其中,Al,m表示特征向量矩阵A中从(1,1)到(l,m)的路径,内积<A,Δ(x,y)>为这条路径下的代价和,Δ(x,y)为通过欧氏距离计算向量x与y的距离,dtw的思想就是要最小化代价和。ai表示第i个元素的值,n表示元素个数,γ表示平滑因子,当γ=0时,soft-DTW就是原始的代价和dtw形式,所以soft-DTW关注γ>0的情况,通过使用连续的软最小化minγ代替离散的最小化min计算方式,使得dtw在网络训练中是可微的损失函数。
通过对深度学习神经网络模型利用损失函数计算的误差训练字符比对模型权重,便可以通过训练后的深度学习神经网络模型得到字符特征向量表示,由于模型的类别以人和字进行设置的,即同一个人写的同一个字符为一个类别,同一人写的不同字符或者不同人写的字符均为其他不同的分类类别,所以字符特征向量具有书写人的习惯信息,可以用欧式、余弦或其他向量度量方式计算相同内容的字符特征向量之间的相似性,通过相似性确定该不同字符由同一人书写还是不同人书写。
利用测试集对深度学习神经网络模型进行测试,可根据损失函数的约束,测试时通过动态时间调整DTW距离计算两个特征向量的距离。如两个相同文字不同次书写字符特征向量X、Y之间的特征距离为:
Figure BDA0003839613190000111
当计算出的特征距离大于阈值,判断为不同签署人书写,如小于阈值判定为同一人书写。
验证阶段,利用已训练好的骨干特征提取网络提取字符特征向量,对比留样字符和验证字符的特征向量相似度,判断是否为同一个人书写的字符。
对验证集进行统计,统计深度学习神经网络模型在各字符上的测试效果如准确率或eer(等错误率),以及各字符在各阈值分段下的准确率、统计指标AUC等。通过验证集构建比对样本对,计算样本对之间的特征相似度,统计并拟合每个字符不同相似度下对应的准确率,用于后续综合比对提供不同字符的权重值。
针对签名或者签署文本行,综合各个字符特征向量比对的相似度,最终得到相同文字对应签名或者文本行字符特征向量的比对结果。集成方式包括但不限于投票法、平均法、加权判别法等。下面以AUC评价指标体系为例进一步描述综合比对判别方法。根据公式
Figure BDA0003839613190000112
计算整体签名或者文本和的比对相似度P,AUCi表示第i个单字字符对应的AUC评价指标,N表示注册的电子签名或者文本行个数,prob(Ai,Bi)表示第i个字符对(Ai,Bi)的相似度对应拟合的概率值。即通过AUC指标为每个字赋予不同的权重,充分考虑了单字字符复杂度对整体签名或者文本行比对的不同影响。
其中,prob(Ai,Bi)可以通过在验证集不同阈值下的精度统计而来,也可以通过sigmoid函数转换而来。通过对验证集取最佳结果对应的阈值获得每个字符对应的阈值,如字符i对应的阈值threshold,根据公式:
Figure BDA0003839613190000121
计算第i个字符对(Ai,Bi)的相似度对应拟合的概率值。其中,similarity表示通过特征向量计算得到的相似度。
如图4所示为区域字符采集页面示意图。为了进行基于上述可辨识字符的笔迹比对,系统在采集手写字符数据时,签署页面须可采集单个手写字符或采集字符可拆分的形式,包括但不限于单屏单字签署、分区域签署或切字算法获得等。图4为其中一种分区域签署的方式,通过米字格限制书写区域,即每个字符只可在米字格区域进行书写,系统便可提取每个米字格内单个字符进行后续内容校验和单个字符笔迹比对。
如图5所示为部分轨迹特征融合示意图,分别为原始轨迹图,采用特征x速度、y速度、对数速度logv、加速度tam的字符轨迹图像。第一二行为同一人书写字符,第三行为不同人书写字符。

Claims (11)

1.一种基于可辨识单字字符的在线笔迹验证系统,其特征在于,包括:笔迹注册单元、笔迹识别单元、数据校验单元、数据预处理单元、内容校验单元、特征提取单元、相似度计算单元,笔迹注册单元,用于获取在线书写字符及笔迹关联用户进行注册;笔迹识别单元,用于提取待验证字符及笔迹,对注册字符及笔迹、待验证字符及笔迹进行数据校验;数据预处理,用于以不同书写者书写的不同字符划分类别构建数据集,根据类别将在线手写字符数据集划分为训练集、验证集和测试集;内容校验单元,用于根据在线签署文本字符完成内容校验后提取特征;特征提取单元,用于利用训练集和验证集对深度学习神经网络模型训练和验证,训练基于图像的单字笔迹分类或表征网络模型,优化分类损失,获得每个字符对应的阈值,更新网络权重,使同人同字的样本在向量空间聚合,其它样本拉远,优化深度学习网络模型构建单字字符笔迹识别模型,单字字符笔迹识别模型根据注册字符及笔迹特征、在线获取待验证字符及笔迹特征提取字符表征;相似度计算单元,用于对比注册留样字符和验证字符的表征向量相似度。
2.根据权利要求1所述的验证系统,其特征在于,笔迹注册单元根据标准字符提示在线手写签署页面书写各个字符,采集文本字符进行内容校验,识别是否为与数据库中预设字符一致,提交经过校验的文本字符和用户唯一标识到数据库进行笔迹注册,并获取字符在线笔迹信息,其中,在线手写签署页面为可采集单个手写字符或字符可拆分的形式。
3.根据权利要求1所述的验证系统,其特征在于,深度学习神经网络模型包括:笔迹时序特征提取分支、笔迹空间特征提取分支、特征合并单元,笔迹时序特征提取分支通过LSTM结合注意力机制和dropout层进行时序特征学习,提取具备时间依赖的深层用户笔迹差异或者共性特征;笔迹空间特征提取分支通过包含卷积层、标准化层和激活函数层的卷积模块进行局部空间域特征提取,卷积模块对多维输入特征矩阵进行卷积运算,提取在线手写字符局部信息和在线手写字符笔迹特征之间的相互依赖信息,得到笔迹空间特征,特征合并单元融合笔迹时序特征和笔迹空间特征,对字符数据进行分类,学习在线手写字符笔迹表征信息,度量学习优化字符对的特征向量距离,得到在线手写字符的特征向量矩阵。
4.根据权利要求1-3其中之一所述的验证系统,其特征在于,采用软动态时间规整soft-DTW损失函数优化分类损失进行网络优化,基于优化网络模型构建单字字符笔迹识别模型,根据公式:
dtwγ(X,Y)=minγ{<A,Δ(x,y)>,A∈Al,m}
计算损失函数dtwγ(X,Y),其中,Al,m表示特征向量矩阵A中从(1,1)到(l,m)的路径,内积<A,Δ(x,y)>为这条路径下的代价和,Δ(x,y)为通过欧氏距离计算特征矩阵A中向量x与y的距离。
5.根据权利要求1-3其中之一所述的验证系统,其特征在于,利用验证集对单字字符笔迹识别模型进行验证,通过验证集构建样本对,计算样本对之间签名或者文本和的特征相似度P,统计并拟合每个字符不同相似度下对应的准确率,通过AUC指标为每个字赋予不同的权重,根据公式:
Figure FDA0003839613180000021
计算特征相似度P,其中,AUCi表示第i个单字字符对应的AUC评价指标,N表示注册的电子签名或者文本行个数,prob(Ai,Bi)表示第i个字符对(Ai,Bi)的相似度对应拟合的概率值。
6.根据权利要求5所述的验证系统,其特征在于,通过对验证集取最佳结果对应的阈值获得每个字符对应的阈值threshold,根据公式:
Figure FDA0003839613180000031
计算第i个字符对(Ai,Bi)的相似度对应拟合的概率值,其中,similarity表示字符对(Ai,Bi)的相似度。
7.一种基于可辨识单字字符的在线笔迹验证方法,其特征在于,采集预设内容的单个手写字符或可拆分字符,根据字符识别判断签署内容是否为预设字符,关联用户进行注册;提取待验证字符及笔迹,对注册字符及笔迹、待验证字符及笔迹进行数据校验;以不同书写者书写的不同字符划分类别构建数据集,根据类别将在线手写字符数据集划分为训练集、验证集和测试集;根据在线签署文本字符完成内容校验后提取特征;利用训练集和验证集对深度学习神经网络模型训练和验证,利用与预设字符内容相同的字符训练基于图像的单字笔迹分类或表征网络模型,优化分类损失,更新网络权重,使同人同字的样本在向量空间聚合,其它样本拉远,利用训练集和损失函数优化深度学习网络模型构建单字字符笔迹识别模型,单字字符笔迹识别模型根据注册字符及笔迹特征,融合笔迹时序特征和笔迹空间特征,在线获取待验证字符及笔迹特征提取字符表征,对比注册留样字符和验证字符的表征向量相似度,判断该字符是否为同一个人书写。
8.根据权利要求7所述的方法,其特征在于,对签字字符数据进行有效性清洗,对签字字符数据进行预处理并提取用户习惯特征,建立训练集,训练集中同一个人在同一书写设备书写的相同字符互为正样本,其它的字符为负样本,所述清洗异常数据包括:去除轨迹坐标越界、时间戳倒流、点位长度过短、签署时间过短、签署方向异常、重复点位、野点、离群点;所述提取用户习惯特征包括:修复笔触状态和压力值,统一笔迹采样率,获取在线手写字符笔画的x速度、y速度、速度、加速度、角速度、压力、切角、对数曲率、向心加速度,提取用户习惯特征。
9.根据权利要求7所述的方法,其特征在于,通过LSTM结合注意力机制和dropout层进行时序特征学习,提取具备时间依赖的深层用户笔迹差异或者共性特征;通过包含卷积层、标准化层和激活函数层的卷积模块进行局部空间域特征提取,卷积模块对多维输入特征矩阵进行卷积运算,提取在线手写字符局部信息和在线手写字符笔迹特征之间的相互依赖信息,得到笔迹空间特征;融合笔迹时序特征和笔迹空间特征,对字符数据进行分类,学习在线手写字符笔迹表征信息,度量学习优化字符对的特征向量距离,得到在线手写字符的特征向量矩阵。
10.根据权利要求7-9其中之一所述的方法,其特征在于,所述构建单字字符笔迹识别模型具体包括,采用软动态时间规整soft-DTW损失函数优化分类损失进行网络优化,基于优化网络模型构建单字字符笔迹识别模型,根据公式:
dtwγ(X,Y)=minγ{(A,Δ(x,y)>,A∈Al,m}
计算损失函数dtwγ(X,Y),其中,Al,m表示特征向量矩阵A中从(1,1)到(l,m)的路径,内积<A,Δ(x,y)>为这条路径下的代价和,Δ(x,y)为通过欧氏距离计算特征矩阵A中向量x与y的距离。
11.根据权利要求7-9其中之一所述的方法,其特征在于,利用验证集对单字字符笔迹识别模型进行验证,通过验证集构建样本对,计算样本对之间签名或者文本和的特征相似度P,统计并拟合每个字符不同相似度下对应的准确率,通过AUC指标为每个字赋予不同的权重,根据公式:
Figure FDA0003839613180000051
计算特征相似度P,其中,AUCi表示第i个单字字符对应的AUC评价指标,N表示注册的电子签名或者文本行个数,其中,prob(Ai,Bi)表示第i个字符对(Ai,Bi)的相似度对应拟合的概率值,通过对验证集取最佳结果对应的阈值获得每个字符对应的阈值threshold,根据公式:
Figure FDA0003839613180000052
计算第i个字符对(Ai,Bi)的相似度对应拟合的概率值,其中,similarity表示字符对(Ai,Bi)的相似度。
CN202211099688.4A 2022-09-09 2022-09-09 一种基于可辨识单字字符的在线笔迹验证系统及方法 Pending CN115937873A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211099688.4A CN115937873A (zh) 2022-09-09 2022-09-09 一种基于可辨识单字字符的在线笔迹验证系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211099688.4A CN115937873A (zh) 2022-09-09 2022-09-09 一种基于可辨识单字字符的在线笔迹验证系统及方法

Publications (1)

Publication Number Publication Date
CN115937873A true CN115937873A (zh) 2023-04-07

Family

ID=86652940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211099688.4A Pending CN115937873A (zh) 2022-09-09 2022-09-09 一种基于可辨识单字字符的在线笔迹验证系统及方法

Country Status (1)

Country Link
CN (1) CN115937873A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434250A (zh) * 2023-06-13 2023-07-14 深圳宏途教育网络科技有限公司 一种手写字符图像相似度确定模型训练方法
CN117523578A (zh) * 2024-01-04 2024-02-06 广东光大信息科技股份有限公司 一种基于人工智能的课堂纸笔互动方法及装置
CN117728960A (zh) * 2024-02-07 2024-03-19 中国标准化研究院 一种基于电子签名的标准数据数字化转换验证方法和系统
CN117853378A (zh) * 2024-03-07 2024-04-09 湖南董因信息技术有限公司 基于度量学习的文字笔迹显示方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434250A (zh) * 2023-06-13 2023-07-14 深圳宏途教育网络科技有限公司 一种手写字符图像相似度确定模型训练方法
CN116434250B (zh) * 2023-06-13 2023-08-25 深圳宏途教育网络科技有限公司 一种手写字符图像相似度确定模型训练方法
CN117523578A (zh) * 2024-01-04 2024-02-06 广东光大信息科技股份有限公司 一种基于人工智能的课堂纸笔互动方法及装置
CN117523578B (zh) * 2024-01-04 2024-04-05 广东光大信息科技股份有限公司 一种基于人工智能的课堂纸笔互动方法及装置
CN117728960A (zh) * 2024-02-07 2024-03-19 中国标准化研究院 一种基于电子签名的标准数据数字化转换验证方法和系统
CN117728960B (zh) * 2024-02-07 2024-05-07 中国标准化研究院 一种基于电子签名的标准数据数字化转换验证方法和系统
CN117853378A (zh) * 2024-03-07 2024-04-09 湖南董因信息技术有限公司 基于度量学习的文字笔迹显示方法

Similar Documents

Publication Publication Date Title
US9665768B2 (en) Process of handwriting recognition and related apparatus
CN115937873A (zh) 一种基于可辨识单字字符的在线笔迹验证系统及方法
US10963685B2 (en) Generating variations of a known shred
US7327883B2 (en) Character recognition system and method
Kashi et al. A Hidden Markov Model approach to online handwritten signature verification
US20170076152A1 (en) Determining a text string based on visual features of a shred
CN115620312A (zh) 跨模态字符笔迹验证方法、系统、设备及存储介质
US10423817B2 (en) Latent fingerprint ridge flow map improvement
CN112101542A (zh) 机器学习模型的训练方法、装置、人脸的识别方法和装置
CN109933648A (zh) 一种真实用户评论的区分方法和区分装置
US10755074B2 (en) Latent fingerprint pattern estimation
CN113361666B (zh) 一种手写字符识别方法、系统及介质
US20090252417A1 (en) Unsupervised writer style adaptation for handwritten word spotting
CN107103289B (zh) 利用笔迹轮廓特征来进行笔迹鉴别的方法及系统
Korichi et al. A generic feature-independent pyramid multilevel model for Arabic handwriting recognition
CN116645683A (zh) 基于提示学习的签名笔迹鉴别方法、系统及存储介质
CN112200216A (zh) 汉字识别方法、装置、计算机设备和存储介质
Thenuwara et al. Offline handwritten signature verification system using random forest classifier
CN114898473A (zh) 手写签名比对方法、装置及电子设备
JP7420578B2 (ja) 帳票仕分システム、帳票仕分方法、及びプログラム
CN114743249B (zh) 识别模型训练方法、微表情识别方法、装置、设备及介质
JP3374762B2 (ja) 文字認識方法及びその装置
CA2421673C (en) Character recognition system and method
Yermakov et al. CNN Based Predictor of Face Image Quality
Yumang et al. Relationship Strength of Handwriting Consistency and Number of Local Features with the Accuracy of a Handwritten Forgery Detection Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination