CN114005184A - 一种基于少量样本的手写签名真伪识别方法和装置 - Google Patents
一种基于少量样本的手写签名真伪识别方法和装置 Download PDFInfo
- Publication number
- CN114005184A CN114005184A CN202111294914.XA CN202111294914A CN114005184A CN 114005184 A CN114005184 A CN 114005184A CN 202111294914 A CN202111294914 A CN 202111294914A CN 114005184 A CN114005184 A CN 114005184A
- Authority
- CN
- China
- Prior art keywords
- signature
- real
- user
- tuple
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Collating Specific Patterns (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于少量样本的手写签名真伪识别方法和装置,属于人工智能,该方法包括:获取用户预留签名样本;构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。本发明能够在训练样本不足的情况下,提取少量样本的特征信息,提高了小样本手写签名真伪识别的准确率。
Description
技术领域
本发明涉及计算机数据处理技术领域,尤其涉及一种基于少量样本的手写签名真伪识别方法和装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,商业银行移动终端业务普及,有关协议签署的签名信息在移动终端上进行,而签名真伪识别一直是备受关注的问题,近年来,针对手写签名的验证一般采用深度学习的方法,然而神经网络需要大量的样本集对模型进行训练,最终提高验证签名准确率。而银行所存的签名样本数量不足的问题,导致模型训练不充分,影响签名验证准确率,使移动应用验证手写签名不具有规范性。
由于手写签名在后台以图片的格式进行存储,签名图片使用神经网络对模型进行训练,典型的神经网络模型依赖于大量的数据训练才能获得可靠的结果。而在银行等特定的场景下,用户的签名数据稀缺,现实场景下不能提供大量的训练数据,缺少训练样本。
因此,如何提供一种新的方案,其能够解决上述技术问题是本领域亟待解决的技术难题。
发明内容
本发明实施例提供一种基于少量样本的手写签名真伪识别方法,能够在训练样本不足的情况下,提取少量样本的特征信息,提高了小样本手写签名真伪识别的准确率,该方法包括:
获取用户预留签名样本;
构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;
根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;
采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;
根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。
本发明实施例还提供一种基于少量样本的手写签名真伪识别装置,包括:
用户预留签名样本获取模块,用于获取用户预留签名样本;
三元组网络预训练模型构建模块,用于构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;
真实签名嵌入向量确定模块,用于根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;
实时签名嵌入向量确定模块,用于采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;
用户实时签名信息真伪识别模块,用于根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种基于少量样本的手写签名真伪识别方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述一种基于少量样本的手写签名真伪识别方法的计算机程序。
本发明实施例提供的一种基于少量样本的手写签名真伪识别方法和装置,包括:首先获取用户预留签名样本;然后构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;接着根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;下一步采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;最后根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。本发明基于三元组网络训练模型的小样本学习训练方案,进行移动端用户手写签名的真伪识别,能够在训练样本不足的情况下,提取少量样本的特征信息,提高了小样本手写签名真伪识别的准确率。本发明使用在线三元组网络对手写签名进行特征提取,避免限制网络的泛化能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例一种基于少量样本的手写签名真伪识别方法示意图。
图2为本发明实施例一种基于少量样本的手写签名真伪识别方法的对用户预留签名样本进行预处理的过程示意图。
图3为本发明实施例一种基于少量样本的手写签名真伪识别方法的构建并训练得到三元组网络预训练模型的过程示意图。
图4为本发明实施例一种基于少量样本的手写签名真伪识别方法的三元组网络预训练模型训练过程示意图。
图5为本发明实施例一种基于少量样本的手写签名真伪识别方法的识别用户实时签名信息的真伪过程示意图。
图6为运行本发明实施的一种基于少量样本的手写签名真伪识别方法的计算机装置示意图。
图7为本发明实施例一种基于少量样本的手写签名真伪识别装置示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本发明属于人工智能。图1为本发明实施例一种基于少量样本的手写签名真伪识别方法示意图,如图1所示,本发明实施例提供一种基于少量样本的手写签名真伪识别方法,能够在训练样本不足的情况下,提取少量样本的特征信息,提高了小样本手写签名真伪识别的准确率,该方法包括:
步骤101:获取用户预留签名样本;
步骤102:构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;
步骤103:根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;
步骤104:采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;
步骤105:根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。
本发明实施例提供的一种基于少量样本的手写签名真伪识别方法,包括:首先获取用户预留签名样本;然后构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;接着根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;下一步采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;最后根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。本发明基于三元组网络训练模型的小样本学习训练方案,进行移动端用户手写签名的真伪识别,能够在训练样本不足的情况下,提取少量样本的特征信息,提高了小样本手写签名真伪识别的准确率。本发明使用在线三元组网络对手写签名进行特征提取,避免限制网络的泛化能力。
在商业银行数字化转型的驱动下,银行的部分业务通过手机银行等一系列终端的形式进行签约和交易,在签约某项产品或完成一笔交易的过程中需签署对应产品的相关产品文件,并需要提供手写签名以保证客户确认相关产品的风险性和责任方,因此识别移动终端签名的真伪是判断客户行为的重要手段。
现阶段识别签名真伪的普遍方法是基于神经网络进行模型的训练,对签名的大量训练集进行模型训练,并获取特征信息。
基于神经网络的手写签名识别方法可利用电阻式触摸屏,采集签名中含有的书写力度、书写速度等签名特征,并进行分类进而辨别签名真伪。而神经网络需要大量的测试样本对模型进行训练以提高识别的准确率。商业银行等诸多场景下所存客户的签名信息有限,无法满足神经网络所需的大量测试样本集的要求。
由于深度神经网络是对数据量要求较高的算法,当用于测试数据量不足时,会出现过拟合的情况,使得签名的准确率降低。而商业银行所获取的客户签名信息较少,不能满足神经网络训练模型的目的。如何利用少量的客户签名信息进行模型训练成为了急需解决的问题。
为了解决客户手写签名样本不足的问题,本发明采用小样本学习N-shotLearning方法,在样本集中仅有0-5个左右的少量数量的样本下,利用在线三元组网络(Triplet networks)针对神经网络进行改进,使用semi-triplet loss对手写签名的特征进行训练,并将所获模型的签名信息与客户信息如客户号等信息进行匹配,最终形成客户指纹,验证用户签名真伪。
N-shot Learning是机器学习中基于几个训练示例对样本进行准确分类的算法,并已充分应用在人脸识别领域。传统的监督学习方法训练和本地相似的类进行映射,n-shot learning在不专注于训练过程的同时,主要用于区分不同的对象。NSL中的模型被视为特征提取器,以从学习的模型中生成输入的嵌入向量。这些嵌入的向量用于测量相似性,并且预期的预测输出将确定这些输入是否在同一类中。
针对商业银行客户手写签名样本少量的情况下,提出一种移动端手写签名真伪识别验证的方案,能够利用移动端客户留下的手写签名图片,将客户在银行预留的相关信息与移动端客户的签名信息进行匹配,形成用户指纹特征,有效提高识别的准确率。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别方法时,在一个实施例中,该方法可以包括:
获取用户预留签名样本;
构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;前述的少量样本,由于在银行的服务体系中,用户手写签名不会大量留存,一般在实际应用中前述的少量样本的数量小于等于5,甚至更少。因此,前述的三元组网络预训练模型是基于设定样本数量的少量样本训练得到,该设定样本数量远小于训练传统神经网络模型所需的样本数量。
根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;
采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;
根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别方法时,在一个实施例中,还包括:对用户预留签名样本进行预处理。
图2为本发明实施例一种基于少量样本的手写签名真伪识别方法的对用户预留签名样本进行预处理的过程示意图,如图2所示,具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别方法时,在一个实施例中,所述对用户预留签名样本进行预处理,包括:
步骤201:对用户预留签名样本中因手写动作不连贯而产生的无效零点利用线性内插法进行过滤,去除无效零点;
步骤202:对存在方向偏离的用户预留签名样本进行灰度和归一化处理,以得到格式统一的用户预留签名样本。
实施例中,由于客户使用终端触摸屏签名时,存在抖动或触摸屏接触造成的动作不连贯产生的无效零点,而这些零点在特征提取过程中会产生较大的偏差,需将零点去除,本发明使用线性内插法过滤零点,同时,用户在不同状态下的多次签名存在方向不同或位置偏离,需将图片进行灰度和归一化处理以减小签名样本对特征提取造成的影响。
图3为本发明实施例一种基于少量样本的手写签名真伪识别方法的构建并训练得到三元组网络预训练模型的过程示意图,如图3所示,具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别方法时,在一个实施例中,构建并训练得到三元组网络预训练模型,包括:
步骤301:根据机器学习小样本分类算法,利用Semi-Hard-Negative策略生成第一子元组、第二子元组和第三子元组;
步骤302:将用户预留签名样本输入第一子元组;
步骤303:将用户真实签名样本输入第二子元组;
步骤304:将伪造用户签名样本输入第三子元组;
步骤305:对第一子元组、第二子元组和第三子元组进行训练,得到三元组网络预训练模型。
实施例中,小样本学习是一种允许模型仅基于几个训练示例对样本进行准确的分类。如果在对客户的手写签名真伪识别中,需要提供每位客户数百张的手写签名图片是不切实际的。在传统的神经网络监督学习中,对分类器的训练主要用以学习并将输入映射到对应的类中;而在小样本分类学习算法中,模型被用作特征提取器,从学习的模型中生成嵌入向量,并测量嵌入向量的相似性,再确认是否将这些输入是否在同一类中。本方法利用三元组深度嵌入式网络来比较签名输入对象的相似性。首先根据机器学习小样本分类算法,利用Semi-Hard-Negative策略生成第一子元组Anchor(A)、第二子元组Positive(P)和第三子元组Negative(N);
其中,第一子元组Anchor Input(A):为用户在商业银行预留的签名样本;
第二子元组Positive Input(P):与Anchor一致的同类签名,即来自该用户的真实签名样本;
第三子元组Nenative Input(N):与Anchor不一致的样本,及伪造的签名样本。
在三元组网络中,利用Anchor(A)、Positive(P)、Negative(N)作为输入以训练网络。然后对Anchor(A)、Positive(P)、Negative(N)进行训练,得到三元组网络预训练模型。
图4为本发明实施例一种基于少量样本的手写签名真伪识别方法的三元组网络预训练模型训练过程示意图,如图4所示,具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别方法时,在一个实施例中,对第一子元组、第二子元组和第三子元组进行训练,得到三元组网络预训练模型,包括:
步骤401:计算第一子元组与第二子元组的第一距离;
步骤402:计算第一子元组与第三子元组的第二距离;
步骤403:以第一距离小于第二距离为训练目标,对第一子元组、第二子元组和第三子元组进行训练,在第一距离与第二距离的差值达到预设收敛值时,得到三元组网络预训练模型。
实施例中,对第一子元组、第二子元组和第三子元组进行训练,就是进行特征提取,设定特征提取的目标为第一距离小于第二距离作为训练目标,对第一子元组、第二子元组和第三子元组进行训练,在第一距离与第二距离的差值达到预设收敛值时,得到三元组网络预训练模型。
特征提取的目标是使利用A与P和A与N的距离度量嵌入向量的相似性。将A、P、N的样本分别输入三个子网,模型的训练目标是使D(A,P)<D(A,N),同时为了避免在伪造的签名样本与目标A差别太大造成的提取的特征信息不足,本发明实施例适用在线的三元组网络Semi-Hard-Negative策略。在预训练中,系统利用Semi-Hard-Negative策略生成的三元组输入到模型中,提取不同的特征信息,用作后期的分类任务。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别方法时,在一个实施例中,根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量,包括:将用户预留签名样本输入已经训练好的三元组网络预训练模型中,可以得到真实签名嵌入向量。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别方法时,在一个实施例中,采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量,包括:
采集用户实时签名图片;
对用户实时签名图片进行识别处理,确定用户实时签名信息,输入到三元组网络预训练模型,确定实时签名嵌入向量。
实施例中,通过移动终端采集用户实时签名图片,对签名图片进行预处理及识别处理,得到用户实时签名信息,输入到三元组网络预训练模型,确定实时签名嵌入向量。
图5为本发明实施例一种基于少量样本的手写签名真伪识别方法的识别用户实时签名信息的真伪过程示意图,如图5所示,具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别方法时,在一个实施例中,根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪,包括:
步骤501:利用CNN分类器将真实签名嵌入向量和实时签名嵌入向量分别进行标记;
步骤502:比对标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性;
步骤503:当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性小于设定阈值时,则判断本次采集用户实时签名为真实签名;
步骤504:当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性大于设定阈值时,则判断本次采集用户实时签名为伪造签名。
实施例中,前述得到的真实签名嵌入向量和实时签名嵌入向量,用于识别用户实时签名信息的真伪,使用CNN分类器将前序步骤特征提取过程生成的嵌入向量做标记,进而进行分类,识别签名真伪,具体过程包括:
首先利用CNN分类器将真实签名嵌入向量和实时签名嵌入向量分别进行标记;然后比对标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性;当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性小于设定阈值时,则判断本次采集用户实时签名为真实签名;当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性大于设定阈值时,则判断本次采集用户实时签名为伪造签名。
本发明在预训练和分类中包括来自相同类别的样本,能够提高模型训练性能。并在预训练阶段有效的区分样本中的输入,无需将本地映射到分配的签名样本的标记,进而能够有效的减少样本的数量,更具有灵活性。
本发明利用的小样本学习方法是基于三元组网络进行移动端手写签名识别方法,能够在测试样本不足的情况下,提取少量样本的特征信息,提高了小样本手写签名识别的准确率。本发明使用在线三元组网络对手写签名进行特征提取,避免限制网络的泛化能力。
下面结合具体场景,对本发明实施例提供的一种基于少量样本的手写签名真伪识别方法进行简要描述:
为了解决客户手写签名样本不足造成的仅有少量样本留存的问题,本发明采用小样本学习N-shot Learning方法,在样本集中仅有0-5个左右的少量数量的样本下,利用在线三元组网络(Triplet networks)针对神经网络进行改进,使用semi-triplet loss对手写签名的特征进行训练,并将所获模型的签名信息与客户信息如客户号等信息进行匹配,最终形成客户指纹,验证用户签名真伪。
N-shot Learning是机器学习中基于几个训练示例对样本进行准确分类的算法,并已充分应用在人脸识别领域。传统的监督学习方法训练和本地相似的类进行映射,n-shot learning在不专注于训练过程的同时,主要用于区分不同的对象。NSL中的模型被视为特征提取器,以从学习的模型中生成输入的嵌入向量。这些嵌入的向量用于测量相似性,并且预期的预测输出将确定这些输入是否在同一类中。
基于神经网络的手写签名识别方法可利用电阻式触摸屏,采集签名中含有的书写力度、书写速度等签名特征,并进行分类进而辨别签名真伪。而神经网络需要大量的测试样本对模型进行训练以提高识别的准确率。商业银行等诸多场景下所存客户的签名信息有限,无法满足神经网络所需的大量测试样本集的要求。同时基于小样本学习中离线Tripletloss方法会限制网络的泛化能力。
本发明的目的在于针对商业银行客户手写签名样本少量的情况下,提出一种移动端手写签名验证方法。该方法能够利用移动端客户留下的手写签名图片,将客户在银行预留的相关信息与移动端客户的签名信息进行匹配,形成用户指纹特征,有效提高识别的准确率。本发明解决技术问题采取的技术方案是:一种基于在线小样本学习的终端手写签名验证方法。
本发明基于机器学习小样本算法中的在线三元组网络对手写签名进行识别。首先针对客户在商业银行预留的手写签名样本图像进行预处理,其中包括零点噪声去除和归一化处理,为发明中的特征提取器提供高质量样本。在签名图片的预训练阶段,将签名预处理后的样本作为特征提取器的输入,将客户预留的签名作为训练目标,利用在线三元组网络进行特征提取,用以降低网络的泛化能力,并生成嵌入向量,为下一步骤特征信息的分类做准备;本发明使用CNN作为三元组网络模型的子网络,将嵌入向量作为分类器的输入,识别用户的签名和伪造签名。
本发明实施例的主要实施步骤,包括:
步骤1:签名图像预处理:由于客户使用终端触摸屏签名时,存在抖动或触摸屏接触造成的动作不连贯产生的无效零点,而这些零点在特征提取过程中会产生较大的偏差,需将零点去除,本发明使用线性内插法过滤零点,同时,用户在不同状态下的多次签名存在方向不同或位置偏离,需将图片进行灰度和归一化处理以减小签名样本对特征提取造成的影响。
步骤2:基于三元组网络的手写签名的特征提取。小样本学习是一种允许模型仅基于几个训练示例对样本进行准确的分类。如果在对客户的手写签名识别中,需要提供每位客户数百张的手写签名图片是不切实际的。在传统的监督学习中,对分类器的训练主要用以学习并将输入映射到对应的类中,而在小样本学习算法中,模型被用作特征提取器,从学习的模型中生成前乳向量,并测量向量的相似性,再确认是否将这些输入是否在同一类中。本方法利用三元组深度嵌入式网络来比较签名输入对象的相似性。在三元组网络中,利用Anchor(A)、Positive(P)、Negative(N)作为输入以训练网络,其中:
Anchor Input(A):为用户在商业银行预留的签名样本;
Positive Input(P):与Anchor一致的同类签名,即来自该用户的只是签名样本;
Nenative Input(N):与Anchor不一致的样本,及伪造的签名样本
特征提取的目标是使利用A与P和A与N的距离度量嵌入向量的相似性。将A、P、N的样本分别输入三个子网,模型的训练目标是使D(A,P)<D(A,N),同时为了避免在伪造的签名样本与目标A差别太大造成的提取的特征信息不足,本方法适用在线的三元组网络Semi-Hard-Negative策略。
三元组网络预训练模型构建:在预训练中,系统利用Semi-Hard-Negative策略生成的三元组输入到模型中,提取不同的特征信息,用作后期的分类任务。
步骤3:用户签名信息采集与特征提取:从移动终端收集到用户的签名信息,将签名图片预处理后输入到特征提取器,即三组网络的预训练模型,为真实和伪造的签名情况生成嵌入向量。
步骤4:签名信息分类:使用CNN分类器将前序步骤特征提取过程生成的嵌入向量做标记,进而进行分类,识别签名真伪。
本发明在预训练和分类中包括来自相同类别的样本,能够提高模型训练性能。并在预训练阶段有效的区分样本中的输入,无需将本地映射到分配的签名样本的标记,进而能够有效的减少样本的数量,更具有灵活性。
技术人员在开发时,需要注意的是:客户预留信息处理,签名图片预处理;签名图片预训练阶段,基于在线三元组网络的签名图片特征信息提取;将特征提取器的图片特征信息进行分类。
本发明实施例基于在线三元组网络的手写签名信息特征提取;利用样本预训练阶段提取特征信息,将特征提取器中的签名特征信息嵌入向量作为分类器的输入,并进行模型训练。
本发明利用的小样本学习方法是基于三元组网络进行移动端手写签名识别方法,能够在测试样本不足的情况下,提取少量样本的特征信息,提高了小样本手写签名识别的准确率。本发明使用在线三元组网络对手写签名进行特征提取,避免限制网络的泛化能力。
图6为运行本发明实施的一种基于少量样本的手写签名真伪识别方法的计算机装置示意图,如图6所示,本发明实施例还提供一种计算机设备600,包括存储器610、处理器620及存储在存储器上并可在处理器上运行的计算机程序630,所述处理器执行所述计算机程序时实现上述一种基于少量样本的手写签名真伪识别方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行实现上述一种基于少量样本的手写签名真伪识别方法的计算机程序。
本发明实施例中还提供了一种基于少量样本的手写签名真伪识别装置,如下面的实施例所述。由于该装置解决问题的原理与一种基于少量样本的手写签名真伪识别方法相似,因此该装置的实施可以参见一种基于少量样本的手写签名真伪识别方法的实施,重复之处不再赘述。
图7为本发明实施例一种基于少量样本的手写签名真伪识别装置示意图,如图7所示,本发明实施例还提供一种基于少量样本的手写签名真伪识别装置,具体实施时可以包括:
用户预留签名样本获取模块701,用于获取用户预留签名样本;
三元组网络预训练模型构建模块702,用于构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;
真实签名嵌入向量确定模块703,用于根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;
实时签名嵌入向量确定模块704,用于采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;
用户实时签名信息真伪识别模块705,用于根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别装置时,在一个实施例中,还包括:预处理模块,用于对用户预留签名样本进行预处理。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别装置时,在一个实施例中,预处理模块,具体用于:
对用户预留签名样本中因手写动作不连贯而产生的无效零点利用线性内插法进行过滤,去除无效零点;
对存在方向偏离的用户预留签名样本进行灰度和归一化处理,以得到格式统一的用户预留签名样本。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别装置时,在一个实施例中,三元组网络预训练模型构建模块,具体用于:
根据机器学习小样本分类算法,利用Semi-Hard-Negative策略生成第一子元组、第二子元组和第三子元组;
将用户预留签名样本输入第一子元组;
将用户真实签名样本输入第二子元组;
将伪造用户签名样本输入第三子元组;
对第一子元组、第二子元组和第三子元组进行训练,得到三元组网络预训练模型。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别装置时,在一个实施例中,三元组网络预训练模型构建模块,还用于:
计算第一子元组与第二子元组的第一距离;
计算第一子元组与第三子元组的第二距离;
以第一距离小于第二距离为训练目标,对第一子元组、第二子元组和第三子元组进行训练,在第一距离与第二距离的差值达到预设收敛值时,得到三元组网络预训练模型。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别装置时,在一个实施例中,实时签名嵌入向量确定模块,具体用于:
采集用户实时签名图片;
对用户实时签名图片进行识别处理,确定用户实时签名信息,输入到三元组网络预训练模型,确定实时签名嵌入向量。
具体实施本发明实施例提供一种基于少量样本的手写签名真伪识别装置时,在一个实施例中,用户实时签名信息真伪识别模块,具体用于:
利用CNN分类器将真实签名嵌入向量和实时签名嵌入向量分别进行标记;
比对标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性;
当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性小于设定阈值时,则判断本次采集用户实时签名为真实签名;
当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性大于设定阈值时,则判断本次采集用户实时签名为伪造签名。
综上,本发明实施例提供的一种基于少量样本的手写签名真伪识别方法和装置,包括:首先获取用户预留签名样本;然后构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;接着根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;下一步采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;最后根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。本发明基于三元组网络训练模型的小样本学习训练方案,进行移动端用户手写签名的真伪识别,能够在训练样本不足的情况下,提取少量样本的特征信息,提高了小样本手写签名真伪识别的准确率。本发明使用在线三元组网络对手写签名进行特征提取,避免限制网络的泛化能力。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (16)
1.一种基于少量样本的手写签名真伪识别方法,其特征在于,包括:
获取用户预留签名样本;
构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;
根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;
采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;
根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。
2.如权利要求1所述的方法,其特征在于,还包括:对用户预留签名样本进行预处理。
3.如权利要求2所述的方法,其特征在于,所述对用户预留签名样本进行预处理,包括:
对用户预留签名样本中因手写动作不连贯而产生的无效零点利用线性内插法进行过滤,去除无效零点;
对存在方向偏离的用户预留签名样本进行灰度和归一化处理,以得到格式统一的用户预留签名样本。
4.如权利要求1所述的方法,其特征在于,构建并训练得到三元组网络预训练模型,包括:
根据机器学习小样本分类算法,利用Semi-Hard-Negative策略生成第一子元组、第二子元组和第三子元组;
将用户预留签名样本输入第一子元组;
将用户真实签名样本输入第二子元组;
将伪造用户签名样本输入第三子元组;
对第一子元组、第二子元组和第三子元组进行训练,得到三元组网络预训练模型。
5.如权利要求4所述的方法,其特征在于,对第一子元组、第二子元组和第三子元组进行训练,得到三元组网络预训练模型,包括:
计算第一子元组与第二子元组的第一距离;
计算第一子元组与第三子元组的第二距离;
以第一距离小于第二距离为训练目标,对第一子元组、第二子元组和第三子元组进行训练,在第一距离与第二距离的差值达到预设收敛值时,得到三元组网络预训练模型。
6.如权利要求1所述的方法,其特征在于,采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量,包括:
采集用户实时签名图片;
对用户实时签名图片进行识别处理,确定用户实时签名信息,输入到三元组网络预训练模型,确定实时签名嵌入向量。
7.如权利要求1所述的方法,其特征在于,根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪,包括:
利用CNN分类器将真实签名嵌入向量和实时签名嵌入向量分别进行标记;
比对标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性;
当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性小于设定阈值时,则判断本次采集用户实时签名为真实签名;
当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性大于设定阈值时,则判断本次采集用户实时签名为伪造签名。
8.一种基于少量样本的手写签名真伪识别装置,其特征在于,包括:
用户预留签名样本获取模块,用于获取用户预留签名样本;
三元组网络预训练模型构建模块,用于构建并训练三元组网络预训练模型;所述三元组网络预训练模型基于少量样本训练得到;
真实签名嵌入向量确定模块,用于根据用户预留签名样本和三元组网络预训练模型,确定真实签名嵌入向量;
实时签名嵌入向量确定模块,用于采集用户实时签名图片,输入到三元组网络预训练模型,确定实时签名嵌入向量;
用户实时签名信息真伪识别模块,用于根据真实签名嵌入向量和实时签名嵌入向量,识别用户实时签名信息的真伪。
9.如权利要求8所述的装置,其特征在于,还包括:预处理模块,用于对用户预留签名样本进行预处理。
10.如权利要求9所述的装置,其特征在于,预处理模块,具体用于:
对用户预留签名样本中因手写动作不连贯而产生的无效零点利用线性内插法进行过滤,去除无效零点;
对存在方向偏离的用户预留签名样本进行灰度和归一化处理,以得到格式统一的用户预留签名样本。
11.如权利要求8所述的装置,其特征在于,三元组网络预训练模型构建模块,具体用于:
根据机器学习小样本分类算法,利用Semi-Hard-Negative策略生成第一子元组、第二子元组和第三子元组;
将用户预留签名样本输入第一子元组;
将用户真实签名样本输入第二子元组;
将伪造用户签名样本输入第三子元组;
对第一子元组、第二子元组和第三子元组进行训练,得到三元组网络预训练模型。
12.如权利要求11所述的装置,其特征在于,三元组网络预训练模型构建模块,还用于:
计算第一子元组与第二子元组的第一距离;
计算第一子元组与第三子元组的第二距离;
以第一距离小于第二距离为训练目标,对第一子元组、第二子元组和第三子元组进行训练,在第一距离与第二距离的差值达到预设收敛值时,得到三元组网络预训练模型。
13.如权利要求8所述的装置,其特征在于,实时签名嵌入向量确定模块,具体用于:
采集用户实时签名图片;
对用户实时签名图片进行识别处理,确定用户实时签名信息,输入到三元组网络预训练模型,确定实时签名嵌入向量。
14.如权利要求8所述的装置,其特征在于,用户实时签名信息真伪识别模块,具体用于:
利用CNN分类器将真实签名嵌入向量和实时签名嵌入向量分别进行标记;
比对标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性;
当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性小于设定阈值时,则判断本次采集用户实时签名为真实签名;
当标记后的真实签名嵌入向量与标记后的实时签名嵌入向量在距离上的相似性大于设定阈值时,则判断本次采集用户实时签名为伪造签名。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行实现权利要求1至7任一项所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111294914.XA CN114005184A (zh) | 2021-11-03 | 2021-11-03 | 一种基于少量样本的手写签名真伪识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111294914.XA CN114005184A (zh) | 2021-11-03 | 2021-11-03 | 一种基于少量样本的手写签名真伪识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114005184A true CN114005184A (zh) | 2022-02-01 |
Family
ID=79926879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111294914.XA Pending CN114005184A (zh) | 2021-11-03 | 2021-11-03 | 一种基于少量样本的手写签名真伪识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114005184A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223178A (zh) * | 2022-07-13 | 2022-10-21 | 厦门国际银行股份有限公司 | 签名真伪验证方法、系统、终端设备及存储介质 |
-
2021
- 2021-11-03 CN CN202111294914.XA patent/CN114005184A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223178A (zh) * | 2022-07-13 | 2022-10-21 | 厦门国际银行股份有限公司 | 签名真伪验证方法、系统、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009528B (zh) | 基于Triplet Loss的人脸认证方法、装置、计算机设备和存储介质 | |
Darlow et al. | Fingerprint minutiae extraction using deep learning | |
CN111861240A (zh) | 可疑用户识别方法、装置、设备及可读存储介质 | |
CN111444873A (zh) | 视频中人物真伪的检测方法、装置、电子设备及存储介质 | |
CN109903053B (zh) | 一种基于传感器数据进行行为识别的反欺诈方法 | |
CN112215043A (zh) | 一种人脸活体检测方法 | |
Makrushin et al. | Dempster-shafer theory for fusing face morphing detectors | |
CN113807237B (zh) | 活体检测模型的训练、活体检测方法、计算机设备及介质 | |
CN114005184A (zh) | 一种基于少量样本的手写签名真伪识别方法和装置 | |
CN114842524A (zh) | 一种基于不规则显著性像素簇的人脸鉴伪方法 | |
CN113591603A (zh) | 证件的验证方法、装置、电子设备及存储介质 | |
Arısoy | Signature verification using siamese neural network one-shot learning | |
CN112200001A (zh) | 一种指定场景下深度伪造视频识别方法 | |
CN116758643A (zh) | 一种深度伪造人脸图像检测方法及装置 | |
CN116206373A (zh) | 活体检测方法、电子设备及存储介质 | |
Zheng et al. | Capturing micro deformations from pooling layers for offline signature verification | |
Coetzer et al. | Efficient cost-sensitive human-machine collaboration for offline signature verification | |
US11935331B2 (en) | Methods and systems for real-time electronic verification of content with varying features in data-sparse computer environments | |
CN112418078B (zh) | 分数调制方法、人脸识别方法、装置及介质 | |
CN115188031A (zh) | 指纹识别方法、计算机程序产品、存储介质及电子设备 | |
CN111428670B (zh) | 人脸检测方法、装置、存储介质及设备 | |
CN112613341A (zh) | 训练方法及装置、指纹识别方法及装置、电子设备 | |
CN114065867B (zh) | 一种数据分类方法、系统及电子设备 | |
Kiran et al. | Offline signature verification using neural network | |
Cho et al. | Evolutionary singularity filter bank optimization for fingerprint image enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |