CN113239840A - 字迹鉴定方法、装置、设备和存储介质 - Google Patents
字迹鉴定方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN113239840A CN113239840A CN202110566922.9A CN202110566922A CN113239840A CN 113239840 A CN113239840 A CN 113239840A CN 202110566922 A CN202110566922 A CN 202110566922A CN 113239840 A CN113239840 A CN 113239840A
- Authority
- CN
- China
- Prior art keywords
- handwriting
- features
- feature extraction
- identified
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 107
- 230000007246 mechanism Effects 0.000 claims abstract description 35
- 238000000605 extraction Methods 0.000 claims description 124
- 238000012549 training Methods 0.000 claims description 106
- 238000012545 processing Methods 0.000 claims description 66
- 238000013210 evaluation model Methods 0.000 claims description 23
- 238000010606 normalization Methods 0.000 claims description 21
- 238000011176 pooling Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 18
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 244000203593 Piper nigrum Species 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000005337 ground glass Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/33—Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Biodiversity & Conservation Biology (AREA)
- Human Computer Interaction (AREA)
- Collating Specific Patterns (AREA)
- Image Analysis (AREA)
Abstract
本公开的实施例提供一种字迹鉴定方法、装置、设备和存储介质,该方法包括:获取待鉴定图像,待鉴定图像中包括待鉴定字迹;基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征;根据纹理特征和空间结构特征,确定待鉴定字迹的真实性。本公开中,基于注意力机制,可以重点关注待鉴定字迹的纹理特征和空间结构特征,从而降低其他冗余特征的干扰,提升字迹鉴定的准确性。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种字迹鉴定方法、装置、设备和存储介质。
背景技术
随着信息技术的发展,手写签名作为身份认证的一种重要方式,在各行各业都有着普遍应用,对手写签名真实性鉴定的要求也越来越高。
目前,通常采用图像处理技术对手写签名进行字符分割和识别,以鉴定手写签名的真实性。但当光线较差或者字迹不清晰等情况时,通过该鉴定方式获得的鉴定结果会存在不准确的问题,且不够高效。
发明内容
本公开实施例提供一种字迹鉴定方法、装置、设备和存储介质,用于提高字迹鉴定结果的准确性,提升鉴定效率。
第一方面,本公开实施例提供一种字迹鉴定方法,包括:获取待鉴定图像,待鉴定图像中包括待鉴定字迹;基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征;根据纹理特征和空间结构特征,确定待鉴定字迹的真实性。
在一些实施例中,基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征,包括:基于注意力机制,通过对待鉴定字迹进行多次特征提取,得到不同尺寸的特征图,其中,当前次特征提取的输出作为下一次特征提取的输入,特征图包含对应次提取的待鉴定字迹的纹理特征和空间结构特征;相应地,根据纹理特征和空间结构特征,确定待鉴定字迹的真实性,包括:对多次特征提取得到的特征图进行归一化处理,得到鉴定结果,鉴定结果用于反映待鉴定字迹的真实性。
在一些实施例中,基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征,包括:通过特征提取模块提取待鉴定字迹的纹理特征和空间结构特征,特征提取模块是基于注意力机制训练得到的,特征提取模块包括至少一个特征提取单元和全连接层,至少一个特征提取单元依次连接,最后一个特征提取单元与全连接层连接,每个特征提取单元输出的特征图的尺寸不同,特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,卷积模块用于提取待鉴定字迹的形状特征和/或位置特征、多尺度卷积模块用于扩大待鉴定字迹的卷积感受野,提取待鉴定字迹对应的多尺度图像空间的特征、空间注意力模块用于提取待鉴定字迹的空间结构特征、通道注意力模块用于提取待鉴定字迹的纹理特征,池化层用于对图像特征进行降维处理,全连接层用于输出分类结果。
第二方面,本公开实施例提供一种字迹鉴定模型训练方法,字迹鉴定模型包括特征提取模块和归一化层,特征提取模块包括至少一个特征提取单元和全连接层,至少一个特征提取单元依次连接,最后一个特征提取单元与全连接层连接,每个特征提取单元输出的特征图的尺寸不同,特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,卷积模块用于提取待鉴定字迹的形状特征和/或位置特征、多尺度卷积模块用于扩大待鉴定字迹的卷积感受野,提取待鉴定字迹对应的多尺度图像空间的特征、空间注意力模块用于提取待鉴定字迹的空间结构特征、通道注意力模块用于提取待鉴定字迹的纹理特征,池化层用于对图像特征进行降维处理,全连接层用于输出分类结果。
该字迹鉴定模型训练方法包括:获取字迹样本,字迹样本包括真实字迹样本和真实字迹样本对应的临摹字迹样本;根据真实字迹样本和临摹字迹样本,对初始字迹鉴定模型进行迭代训练,直至初始字迹鉴定模型的损失值小于或等于预设损失值,得到字迹鉴定模型。
在一些实施例中,根据真实字迹样本和临摹字迹样本,对初始字迹鉴定模型进行迭代训练,包括:对真实字迹样本和临摹字迹样本进行数据增强处理,获得目标真实字迹样本和目标临摹字迹样本,数据增强处理包括以下至少一种处理方式:旋转处理、模糊处理、加噪处理以及色域调节;根据目标真实字迹样本和目标临摹字迹样本,对初始字迹鉴定模型进行迭代训练。
在一些实施例中,根据目标真实字迹样本和目标临摹字迹样本,对初始字迹鉴定模型进行迭代训练,包括:获取对初始字迹鉴定模型进行训练的训练参数,其中,训练参数包括以下至少一种:优化器类型、初始学习率、迭代次数和提前终止次数;将目标真实字迹样本和目标临摹字迹样本输入到初始字迹鉴定模型中,通过训练参数对初始字迹鉴定模型进行训练。
第三方面,本公开实施例提供一种字迹鉴定装置,包括:获取单元,用于获取待鉴定图像,待鉴定图像中包括待鉴定字迹;处理单元,用于基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征;确定单元,用于根据纹理特征和空间结构特征,确定待鉴定字迹的真实性。
在一些实施例中,处理单元具体用于:基于注意力机制,通过对待鉴定字迹进行多次特征提取,得到不同尺寸的特征图,其中,当前次特征提取的输出作为下一次特征提取的输入,特征图包含对应次提取的待鉴定字迹的纹理特征和空间结构特征;相应地,根据纹理特征和空间结构特征,确定待鉴定字迹的真实性,包括:对多次特征提取得到的特征图进行归一化处理,得到鉴定结果,鉴定结果用于反映待鉴定字迹的真实性。
在一些实施例中,处理单元具体用于:通过特征提取模块提取待鉴定字迹的纹理特征和空间结构特征,特征提取模块是基于注意力机制训练得到的,特征提取模块包括至少一个特征提取单元和全连接层,至少一个特征提取单元依次连接,最后一个特征提取单元与全连接层连接,每个特征提取单元输出的特征图的尺寸不同,特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,卷积模块用于提取待鉴定字迹的形状特征和/或位置特征、多尺度卷积模块用于扩大待鉴定字迹的卷积感受野,提取待鉴定字迹对应的多尺度图像空间的特征、空间注意力模块用于提取待鉴定字迹的空间结构特征、通道注意力模块用于提取待鉴定字迹的纹理特征,池化层用于对图像特征进行降维处理,全连接层用于输出分类结果。
第四方面,本公开实施例提供一种字迹鉴定模型训练装置,包括:字迹鉴定模型包括特征提取模块和归一化层,特征提取模块包括至少一个特征提取单元和全连接层,至少一个特征提取单元依次连接,最后一个特征提取单元与全连接层连接,每个特征提取单元输出的特征图的尺寸不同,特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,卷积模块用于提取待鉴定字迹的形状特征和/或位置特征、多尺度卷积模块用于扩大待鉴定字迹的卷积感受野,提取待鉴定字迹对应的多尺度图像空间的特征、空间注意力模块用于提取待鉴定字迹的空间结构特征、通道注意力模块用于提取待鉴定字迹的纹理特征,池化层用于对图像特征进行降维处理,全连接层用于输出分类结果。
字迹鉴定模型训练装置包括:获取单元,用于获取字迹样本,字迹样本包括真实字迹样本和真实字迹样本对应的临摹字迹样本;训练单元,用于根据真实字迹样本和临摹字迹样本,对初始字迹鉴定模型进行迭代训练,直至初始字迹鉴定模型的损失值小于或等于预设损失值,得到字迹鉴定模型。
在一些实施例中,训练单元具体用于,对真实字迹样本和临摹字迹样本进行数据增强处理,获得目标真实字迹样本和目标临摹字迹样本,数据增强处理包括以下至少一种处理方式:旋转处理、模糊处理、加噪处理以及色域调节;根据目标真实字迹样本和目标临摹字迹样本,对初始字迹鉴定模型进行迭代训练。
在一些实施例中,训练单元具体用于,获取对初始字迹鉴定模型进行训练的训练参数,其中,训练参数包括以下至少一种:优化器类型、初始学习率、迭代次数和提前终止次数;将目标真实字迹样本和目标临摹字迹样本输入到初始字迹鉴定模型中,通过训练参数对初始字迹鉴定模型进行训练。
第五方面,本公开实施例提供一种电子设备,包括存储器和至少一个处理器,存储器用于存储程序指令,处理器用于调用存储器中的程序指令,执行如第一方面提供的字迹鉴定方法,和/或,执行如第二方面提供的字迹鉴定模型训练方法。
第六方面,本公开实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序;计算机程序被执行时,实现如第一方面提供的字迹鉴定方法,和/或,实现如第二方面提供的字迹鉴定模型训练方法。
第七方面,本公开实施例提供一种计算机程序产品,该计算机程序被处理器执行时,实现如第一方面提供的字迹鉴定方法,和/或,实现如第二方面提供的字迹鉴定模型训练方法。
本公开的实施例提供一种字迹鉴定方法、装置、设备和存储介质,该方法包括:获取待鉴定图像,待鉴定图像中包括待鉴定字迹;基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征;根据纹理特征和空间结构特征,确定待鉴定字迹的真实性。本公开中,基于注意力机制,可以重点关注待鉴定字迹的纹理特征和空间结构特征,从而降低其他冗余特征的干扰,提升字迹鉴定的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本公开一实施例提供的字迹鉴定的场景示意图;
图2为本公开一实施例提供的字迹鉴定方法的流程示意图;
图3为本公开另一实施例提供的字迹鉴定方法的流程示意图;
图4为本公开一实施例提供的字迹鉴定模型的结构示意图;
图5为本公开又一实施例提供的字迹鉴定方法的流程示意图;
图6为本公开一实施例提供的特征提取模块的结构示意图;
图7为本公开一实施例提供的特征提取单元的结构示意图;
图8为本公开另一实施例提供的字迹鉴定模型的结构示意图;
图9为本公开一实施例提供的字迹鉴定模型训练方法的流程示意图;
图10为本公开一实施例提供的字迹鉴定模型的训练过程的可视化示意图;
图11为本公开另一实施例提供的字迹鉴定模型训练方法的流程示意图;
图12为本公开一实施例提供的字迹鉴定装置的结构示意图;
图13为本公开一实施例提供的字迹鉴定模型训练装置的结构示意图;
图14为本公开一实施例提供的电子设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
在本公开的实施例的语境中,术语“包括”及其各种变体可以被理解为开放式术语,其意味着“包括但不限于”;术语“基于”可以被理解为“至少部分地基于”;术语“一个实施例”可以被理解为“至少一个实施例”;术语“另一实施例”可以被理解为“至少一个其它实施例”。其他可能出现但在此处未提及的术语,除非明确说明,否则不应以与本公开的实施例所基于的构思相悖的方式做出解释或限定。注意,在下文描述中,可能使用“车辆”作为交通工具的例子。但是本公开的实施例的范围不局限于此,任何能够采用在此描述的充电系统的交通工具均涵盖在本公开的实施例的范围内。
描述包括对形成详细描述的一部分的附图的参考。附图示出了根据示例性实施方式的图示。在本文中也可被称为“示例”的这些实施方式被足够详细地描述,以使本领域中的技术人员能够实践本文所描述的所要求保护的主题的实施方式。在不偏离所要求保护的主题的范围和精神的情况下,可组合实施方式,可使用其它实施方式,或可做出结构、逻辑和电气改变。应理解的是,本文中所描述的实施方式并不旨在限制主题的范围,而是使本领域中的技术人员能够实践、制作和/或使用该主题。
首先,对本公开实施例中的相关术语进行解释:
注意力机制:一种通过网络自主学习出的一组权重系数,并以“动态加权”的方式来强调我们所感兴趣的区域,同时抑制不相关背景区域的机制。
Tensorflow:一个端到端开源机器学习平台,用于深度学习的计算框架。
Keras:以易用、便捷著称的一种用于深度学习的计算框架。
对抗神经网络(Generative Adversarial Network,CNN):神经网络的一种变形,其通过两个神经网络相互博弈的方式来完成学习。
VGG-16:极深的大尺寸图像识别神经网络(Very Deep Convolutional Networksfor Large-Scale Image Recognition),是一种经典的用于图像识别的神经网络结构,16是指这种神经网络结构中卷积层有16层。
随着信息技术的发展,手写签名作为身份认证的一种重要方式,在各行各业都有着普遍应用,对手写签名真实性鉴定的要求也越来越高。
例如,在金融领域,评价金融业最重要的标准就是安全,随着金融业的进步和科技的发展,在互联网技术兴盛的时代,金融业中更多技术开始面向数字化和电子化转型,在转型过程中,金融业的安全问题也被摆在了更突出的位置,其中关键业务中客户手写签名的真伪工作地鉴定变得至关重要。
目前,通常采用图像处理技术对手写签名进行字符分割和识别,以鉴定手写签名的真实性。其他方案中,还会采用CNN和改进的VGG-16网络或者基于对抗神经网络的字迹鉴定方法。
然而上述传统的字迹鉴定方式中,存在以下问题:
(1)光线不佳等复杂场景下字迹鉴定存在误差;
(2)需要对字迹的字符进行单个分割,增加了字符处理工作量,不够高效,同时没有考虑书写者的整体书写习惯,会造成鉴定结果存在误差;
(3)使用传统图像处理方式进行签名笔迹鉴定的处理速度较慢,无法满足日益增长的业务,而且需要手动获取图像特征,普适性不强,自动化程度不高;
(4)使用深度学习方式进行签名笔迹鉴定的方法虽然能有较好结果,但是同时存在神经网络模型过于复杂,模型训练困难等问题。
有鉴于此,本公开实施例提供一种字迹鉴定方法、装置、设备和存储介质,基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征,从而在字迹鉴定过程中重点关注待鉴定字迹的纹理特征和空间结构特征,降低其他冗余特征的干扰,提升字迹鉴定结果的准确性。
为方便理解,首先结合图1对本公开实施例的应用场景进行说明:
图1为本公开一实施例提供的字迹鉴定的场景示意图。如图1所示,该场景包括:字迹鉴定装置101和待鉴定图像,其中,待鉴定图像中包含待鉴定字体。
其中,字迹鉴定装置101可以为任意类型的装置,比如,可以是具备字迹采集功能的字迹采集装置,例如是,pos机等;也可以是其他类型的设备,例如是笔记本、态时电脑、个人数字助理(Personal Digital Assistant,简称:PDA)、智能手机、平板电脑、汽车产品、可穿戴设备等设备,此处不做具体限定。
一方面,字迹鉴定过程可以是实时的,即当字迹鉴定装置101为具备字迹采集功能的字迹采集装置时,当用户在图像采集装置上书写时,字迹采集装置会实时的采集当前书写的图像中的字迹,并实时的鉴定该书写字迹的真实性。
另一方面,字迹鉴定过程也可以是非实时的,即可以由用户在字迹鉴定装置101中输入任意待鉴定图像,由字迹鉴定装置101对待鉴定图像中的待鉴定字迹进行真实性鉴定。
可选的,字迹鉴定装置101还可以批量进行字迹鉴定。
下面以具体地实施例对本公开的实施例的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例的实施例进行描述。
图2为本公开一实施例提供的字迹鉴定方法的流程示意图。本公开实施例的执行主体可以为上述的字迹鉴定装置,该字迹鉴定装置可以通过软件和/或硬件的方式实现,示例地,该字迹鉴定装置可以包括但不限于计算机、服务器等电子设备。其中,服务器可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。如图2所示,本公开实施例提供的字迹鉴定方法包括如下步骤:
S201、获取待鉴定图像。
其中,该待鉴定图像中包括待鉴定字迹。
S202、基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征。
其中,待鉴定字迹的纹理特征用于描述待鉴定图像中待鉴定字迹的表面性质,空间结构特征用于描述待鉴定图像中待鉴定字迹分割出来的多个笔画之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。
在实际应用中,通常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息,其中,相对空间位置信息强调的是笔画之间的相对情况,如上下左右关系等,绝对空间位置信息强调的是笔画之间的距离大小以及方位关系。
需要说明的是,对于提取待鉴定字迹的纹理特征和空间结构特征的具体方案,在后续实施例中示出。
S203、根据纹理特征和空间结构特征,确定待鉴定字迹的真实性。
本公开中,基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征,可以在识别过程中重点关注待鉴定字迹的纹理特征和空间结构特征,从而降低其他冗余特征的干扰,提升字迹鉴定结果的准确性。另外,基于注意力机制,无需对字迹的字符进行单个分割,也无需要手动获取图像特征,大大提升了字迹鉴定的自动化程度,效率较高。
以下,结合实施例对上述实施例中基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征的方案进行详细说明。
图3为本公开另一实施例提供的字迹鉴定方法的流程示意图。在上述实施例的基础上,将对本公开的技术方案进行更详细的描述,如图3所示,本公开实施例提供的字迹鉴定方法可以包括以下步骤:
S301、获取待鉴定图像。
待鉴定图像中包括待鉴定字迹。
S302、基于注意力机制,通过对待鉴定字迹进行多次特征提取,得到不同尺寸的特征图。
其中,当前次特征提取的输出作为下一次特征提取的输入,特征图包含对应次提取的待鉴定字迹的纹理特征和空间结构特征。
S303、对多次特征提取得到的特征图进行归一化处理,得到鉴定结果,鉴定结果用于反映待鉴定字迹的真实性。
需要说明的是,对于归一化处理的具体方式,本公开实施例不做具体限定。示例性的,可以通过归一化指数函数(Softmax函数)对提取到的特征进行归一化处理,至于归一化处理的具体方案,可参考现有技术,此处不再赘述。
本公开实施例中,基于注意力机制,可以在识别过程中重点关注待鉴定字迹的纹理特征和空间结构特征,从而降低其他冗余特征的干扰,提升字迹鉴定结果的准确性。另外,通过注意力机制对待鉴定字迹进行多次特征提取,可以得到不同尺寸特征图,从而能够得到更多的图像特征,以提高图像识别精度,最终提升字迹鉴定结果的准确性。
在一些实施例中,还可以通过字迹鉴定模型来鉴定字迹的真实性。具体的,字迹鉴定模型是基于注意力机制训练得到的,字迹鉴定模型例如可以是基于注意力机制的神经网络模型。
其中,字迹鉴定模型可以包括:特征提取模块和归一化层,特征提取模块用于提取待鉴定字迹中的特征,归一化层用于根据提取出的特征对待鉴定字迹进行鉴定,获得字迹鉴定结果。
具体的,图4为本公开一实施例提供的字迹鉴定模型的结构示意图。如图4所示,本公开实施例的字迹鉴定模型400包括:特征提取模块401和归一化层402。
其中,特征提取模块401用于提取待鉴定图像中待鉴定字迹的图像特征,获取特征图,并将特征图输出至归一化层402,其中,图像特征包括空间结构特征和纹理特征等特征;
进一步的,归一化层402用于根据空间结构特征和纹理特征,对待鉴定字迹的真实性进行鉴定,确定待鉴定字迹的真实性。
以下结合具体实施例对本公开实施例中通过字迹鉴定模型进行字迹鉴定的过程及原理进行详细说明:
图5为本公开又一实施例提供的字迹鉴定方法的流程示意图。在上述实施例的基础上,将对本公开的技术方案进行更详细的描述,如图5所示,本公开实施例提供的字迹鉴定方法可以包括以下步骤:
S501、获取待鉴定图像。
S502、通过特征提取模块提取待鉴定字迹的纹理特征和空间结构特征。
S503、根据纹理特征和空间结构特征,确定待鉴定字迹的真实性。
为方便理解,请参考图6,图6为本公开一实施例提供的特征提取模块的结构示意图。如图6所示,特征提取模块401包括至少一个特征提取单元403和全连接层404。
其中,特征提取单元403用于基于注意力机制,提取待处理图像中待鉴定字迹的特征,生成对应的特征图;全连接层404用于根据特征图输出分类结果。
需要说明的是,图6中的特征提取单元403以特征提取单元1、特征提取单元2…特征提取单元n为例示出,但不以此为限定,其中,n为大于等于1的整数。
在实际应用中,特征提取单元1、特征提取单元2…特征提取单元n之间依次连接,最后一个特征提取单元(特征提取单元n)与全连接层404连接。应理解,每个特征提取单元403输出的特征图的尺寸不同。下面结合图7对特征提取单元403的具体结构以及特征提取原理进行说明。
图7为本公开一实施例提供的特征提取单元的结构示意图。如图7所示,每个特征提取单元403包括卷积模块4031、多尺度卷积模块4032、空间注意力模块4033、通道注意力模块4032和池化层4035。
其中,卷积模块4031用于提取待鉴定字迹的形状特征和/或位置特征等;多尺度卷积模块4032用于扩大待鉴定字迹的卷积感受野,提取待鉴定字迹对应的多尺度图像空间的特征,空间注意力模块4033用于卷积模块注意力模型(Convolutional Block AttentionModule,CBAM),提取待鉴定字迹的空间结构特征;通道注意力模块4034用于基于压缩和扩展网络(Squeeze-and-Excitation Networks,SENet)提取待鉴定字迹的纹理特征,池化层4035用于对图像特征进行降维处理。
一些实施例中,对于每个特征提取单元403中各结构的数量也不做具体限定,例如,特征提取单元1、特征提取单元2、特征提取单元3中均包含两个卷积模块4031,特征提取单元4和特征提取单元5中可以包含3个卷积模块4031等。
另一些实施例中,多尺度空洞卷积模块4032由不同尺度的空洞卷积层组成,多个不同尺度的空洞卷积层的输出结果进行组合,从而得出多尺度空洞卷积模块4032的输出,对于不同尺度的空洞卷积层的数量,本公开实施例也不做具体限定。
另外需要说明的是,对于每个特征提取单元403中各模块的卷积核大小,输出的特征图尺寸以及输出的特征图数量,本公开实施例均不做具体限定。示例性的,以每个特征提取模块401中包含5个特征提取单元403、3个全连接层404为例,本公开实施例提供的字迹鉴定模型的结构的参数如下表所示:
对应的,上表的字迹鉴定模型参数对应的结构请参见图8,图8为本公开另一实施例提供的字迹鉴定模型的结构示意图。需要说明的是,图8中以包含5个特征提取单元、3个全连接层为例示出,但在实际应用中不以此为限定。
本公开实施例中,通过基于注意力机制的字迹鉴定模型,在字迹鉴定过程中可以重点关注待鉴定字迹的纹理特征和空间结构特征,从而降低其他冗余特征的干扰,提升字迹鉴定结果的准确性,且,在鉴定过程中由于采用不同特征提取单元输出不同尺寸的特征图,可以充分挖掘待鉴定字迹中的特征,从而提高图像识别精度,进一步提升字迹鉴定结果的准确性。
另外,由于字迹鉴定模型可以自动的提取待鉴定字迹特征,相比手动提取,可以大大提升字迹特征的提取效率,进而提升字迹鉴定的效率。
以下结合具体实施例对字迹鉴定模型的训练方法进行详细说明。
请继续参考图4,如图4所示,本公开实施例提供的字迹鉴定模型400包括:特征提取模401和归一化层402,其中,特征提取模块401用于提取待鉴定图像中待鉴定字迹的图像特征,获取特征图,并将特征图输出至归一化层402,其中,图像特征包括:空间结构特征和纹理特征。
进一步的,归一化层402用于根据空间结构特征和纹理特征,对待鉴定字迹的真实性进行鉴定,确定待鉴定字迹的真实性。
图9为本公开一实施例提供的字迹鉴定模型训练方法的流程示意图。需要说明的是,本公开实施例的执行主体可以为上述的字迹鉴定装置也可以为其他设备,此处不做限定。
如图9所示,本公开实施例提供的字迹鉴定模型训练方法包括如下步骤:
S901、获取字迹样本。
其中,字迹样本包括真实字迹样本和真实字迹样本对应的临摹字迹样本。
本步骤中,对于获取临摹字迹样本的方式不做限定,例如,可以由人工根据真实样本字迹进行临摹,也可以根据真实字迹样本自动生成。
S902、根据真实字迹样本和临摹字迹样本,对初始字迹鉴定模型进行迭代训练,直至初始字迹鉴定模型的损失值小于或等于预设损失值,得到字迹鉴定模型。
应理解,初始字迹鉴定模型的结构与字迹鉴定模型的结构相同,此处不对初始字迹鉴定模型的结构进行赘述。
本步骤具体为:将真实字迹样本和临摹字迹样本输入至初始字迹鉴定模型中,通过真实字迹样本和临摹字迹样本对初始字迹鉴定模型进行迭代训练,输出每次迭代训练的损失值(loss值)。
进一步的,当输出的损失值小于预设损失值时,说明字迹鉴定模型已完成训练,则确定当前的模型为字迹鉴定模型。其中,预设损失值的大小可根据实际需求进行设定,此处不做具体限定。
图10为本公开一实施例提供的字迹鉴定模型的训练过程的可视化示意图。如图10所示,在训练过程中,验证损失和训练损失均呈下降趋势,说明此时的字迹鉴定模型正在学习,当验证损失和/或训练损失小于预设值时,说明字迹鉴定模型已完成训练,则确定当前的模型为字迹鉴定模型。
在一些实施例中,还可以通过模型的精度值(accuracy)来确定字迹鉴定模型。本步骤为:根据真实字迹样本和临摹字迹样本,对初始字迹鉴定模型进行迭代训练,直至初始字迹鉴定模型的accuracy大于或等于预设精度值,则得到此时的字迹鉴定模型,至于具体的训练过程,此处不再赘述。
本公开实施例中,通过真实字迹样本和临摹字迹样本对初始字迹鉴定模型进行训练,可以使模型能够充分学习真实字迹特征和伪造字迹特征,从而获得精准的字迹鉴定模型,进而在字迹鉴定过程中,通过该字迹鉴定模型获得更准确的鉴定结果。
图11为本公开另一实施例提供的字迹鉴定模型训练方法的流程示意图。在上述实施例的基础上,将对本公开的技术方案进行更详细的描述,如图11所示,本公开实施例提供的字迹鉴定模型训练方法可以包括以下步骤:
S1101、获取字迹样本。
字迹样本包括真实字迹样本和真实字迹样本对应的临摹字迹样本。
其中,步骤S1101和图9所示实施例中的步骤S901类似,具体可参考上述实施例,此处不再赘述。
S1102、对真实字迹样本和临摹字迹样本进行数据增强处理,获得目标真实字迹样本和目标临摹字迹样本。
一些实施例中,由于采集到的字迹样本较少,使得训练得到的字迹鉴定模型的泛化性低,因此,可以通过对字迹样本进行数据增强处理,从而获得不同场景下的字迹样本数据,增加字迹样本的特征类型,最终提升字迹鉴定模型的泛化性。
其中,数据增强处理包括以下至少一种处理方式:旋转处理、模糊处理、加噪处理以及色域调节等。
具体的,旋转处理,例如是,将真实字迹样本和/或临摹字迹样本做一定角度的旋转,从而得出不同倾斜方向的样本图像;模糊处理,例如是,采用毛玻璃效果对真实字迹样本和/或临摹字迹样本进行适当模糊处理;加噪处理,例如是,在真实字迹样本和/或临摹字迹样本中加入高斯噪声或者椒盐噪声;色域调节,例如是,对真实字迹样本和/或临摹字迹样本的明亮度、饱和度、色调进行调节。
至于其他的数据增强方式,此处不再一一赘述。
S1103、根据目标真实字迹样本和目标临摹字迹样本,对初始字迹鉴定模型进行迭代训练,得到字迹鉴定模型。
以下结合步骤S1131、S1132对步骤S1103的训练过程进行说明。
S1131、获取对初始字迹鉴定模型进行训练的训练参数。
其中,训练参数包括以下至少一种:优化器类型(Optimizer)、初始学习率(Learning Rate)、迭代次数(Epochs)、提前终止次数(Early Stopping)以及Dropout等,对于上述训练参数的具体值,可以根据需求进行设定,本公开实施例不做具体限定。
另外需要说明的是,本公开实施例在训练过程中使用的学习框架,例如可以是以Tensorflow为后端的Keras框架。
S1132、将目标真实字迹样本和目标临摹字迹样本输入到初始字迹鉴定模型中,通过训练参数对初始字迹鉴定模型进行训练,直至初始字迹鉴定模型的损失值小于或等于预设损失值,得到字迹鉴定模型。
本方案中,通过模型的损失值的变化来决定是否继续训练,理想情况下损失值为0时表示该模型能够完整学习到字迹样本的特征,但实际上可能无法达到损失值为0。因此,可以根据需求来设置预设损失值,当迭代训练过程中的损失值小于等于预设损失值时,确定训练结束,进而确定当前训练得到的模型为字迹鉴定模型。
另一实施方式中,在训练时,如果损失值始终不下降,甚至还上升的话表示模型已经无法再从字迹样本中学习到有利特征,因此,若确定在预设次数的迭代训练中的损失值都没有下降,则可以确定训练结束,进而确定当前训练得到的模型为字迹鉴定模型。
示例性的,以优化器采用Adam算法、初始学习率为0.001、迭代次数为20000次,且提前终止次数为3为例,若在连续3次的迭代训练中,模型的损失值都没有下降,则停止训练并设置dropout参数。
本公开实施例中,通过对字迹样本进行数据增强处理,从而可以获得不同场景下的字迹样本数据,增加字迹样本的特征类型,最终提升字迹鉴定模型的泛化性。
图12为本公开一实施例提供的字迹鉴定装置的结构示意图。如图12所示,该字迹鉴定装置1200包括:
获取单元1201,用于获取待鉴定图像,待鉴定图像中包括待鉴定字迹;处理单元1202,用于基于注意力机制,提取待鉴定字迹的纹理特征和空间结构特征;确定单元1203,用于根据纹理特征和空间结构特征,确定待鉴定字迹的真实性。
在一些实施例中,处理单元1202具体用于:基于注意力机制,通过对待鉴定字迹进行多次特征提取,得到不同尺寸的特征图,其中,当前次特征提取的输出作为下一次特征提取的输入,特征图包含对应次提取的待鉴定字迹的纹理特征和空间结构特征;相应地,根据纹理特征和空间结构特征,确定待鉴定字迹的真实性,包括:对多次特征提取得到的特征图进行归一化处理,得到鉴定结果,鉴定结果用于反映待鉴定字迹的真实性。
在一些实施例中,处理单元1202具体用于:通过特征提取模块提取待鉴定字迹的纹理特征和空间结构特征,特征提取模块是基于注意力机制训练得到的,特征提取模块包括至少一个特征提取单元和全连接层,至少一个特征提取单元依次连接,最后一个特征提取单元与全连接层连接,每个特征提取单元输出的特征图的尺寸不同,特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,卷积模块用于提取待鉴定字迹的形状特征和/或位置特征、多尺度卷积模块用于扩大待鉴定字迹的卷积感受野,提取待鉴定字迹对应的多尺度图像空间的特征、空间注意力模块用于提取待鉴定字迹的空间结构特征、通道注意力模块用于提取待鉴定字迹的纹理特征,池化层用于对图像特征进行降维处理,全连接层用于输出分类结果。
可以理解的是,本公开实施例所提供的字迹鉴定装置,可用于执行如上述任一方法实施例提供的字迹鉴定方法,其实现原理和技术效果类似,具体可参考上述方法实施例,此处不再赘述。
图13为本公开一实施例提供的字迹鉴定模型训练装置的结构示意图。其中,字迹鉴定模型包括特征提取模块和归一化层,特征提取模块包括至少一个特征提取单元和全连接层,至少一个特征提取单元依次连接,最后一个特征提取单元与全连接层连接,每个特征提取单元输出的特征图的尺寸不同,特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,卷积模块用于提取待鉴定字迹的形状特征和/或位置特征、多尺度卷积模块用于扩大待鉴定字迹的卷积感受野,提取待鉴定字迹对应的多尺度图像空间的特征、空间注意力模块用于提取待鉴定字迹的空间结构特征、通道注意力模块用于提取待鉴定字迹的纹理特征,池化层用于对图像特征进行降维处理,全连接层用于输出分类结果。
如图13所示,该字迹鉴定模型训练装置1300包括:获取单元1301,用于获取字迹样本,字迹样本包括真实字迹样本和真实字迹样本对应的临摹字迹样本;
训练单元1302,用于根据真实字迹样本和临摹字迹样本,对初始字迹鉴定模型进行迭代训练,直至初始字迹鉴定模型的损失值小于或等于预设损失值,得到字迹鉴定模型。
在一些实施例中,获取单元1301具体用于,对真实字迹样本和临摹字迹样本进行数据增强处理,获得目标真实字迹样本和目标临摹字迹样本,数据增强处理包括以下至少一种处理方式:旋转处理、模糊处理、加噪处理以及色域调节;根据目标真实字迹样本和目标临摹字迹样本,对初始字迹鉴定模型进行迭代训练。
在一些实施例中,训练单元1302具体用于,获取对初始字迹鉴定模型进行训练的训练参数,其中,训练参数包括以下至少一种:优化器类型、初始学习率、迭代次数和提前终止次数;将目标真实字迹样本和目标临摹字迹样本输入到初始字迹鉴定模型中,通过训练参数对初始字迹鉴定模型进行训练。
可以理解的是,本公开实施例所提供的字迹鉴定模型训练装置,可用于执行如上述任一方法实施例提供的字迹鉴定模型训练方法,其实现原理和技术效果类似,具体可参考上述方法实施例,此处不再赘述。
图14为本公开一实施例提供的电子设备的结构示意图。本实施例的电子设备1400可以是前述方法实施例中提到的终端设备或者服务器(或者可用于终端设备或服务器的部件),其可用于实现上述方法实施例中描述的对应于终端设备或服务器的方法,具体参见上述方法实施例中的说明,此处不再赘述。
电子设备1400可以包括一个或多个处理器1401,该处理器1401也可以称为处理单元,可以实现一定的控制或者处理功能。处理器1401可以是通用处理器或者专用处理器等。例如可以是基带处理器、或中央处理器。基带处理器可以用于对数据进行处理,中央处理器可以用于对电子设备1400进行控制,执行软件程序,处理软件程序的数据。
在一种可能的设计中,处理器1401也可以存有指令1403或者数据(例如测试参数)。其中,指令1403可以被处理器1401运行,使得电子设备1400执行上述方法实施例中描述的字迹鉴定方法,和/或,字迹鉴定模型训练方法。
在又一种可能的设计中,电子设备1400可以包括电路,该电路可以实现前述方法实施例中发送或接收或者通信的功能。
在一种可能的实现方式中,电子设备1400中可以包括一个或多个存储器1402,其上可以存有指令1404,该指令可在处理器1401上被运行,使得电子设备1400执行上述方法实施例中描述的信息处理方法。
在一种可能的实现方式中,存储器1402中也可以是存储有数据。处理器1401和存储器1402可以单独设置,也可以集成在一起。
在一种可能的实现方式中,电子设备1400还可以包括收发器1405和/或天线1406。处理器1401可以称为处理单元,对电子设备1400进行控制。收发器1405可以称为收发单元、收发机、收发电路、或者收发器等,用于实现电子设备1400的收发功能。
其中,处理器1401和收发器1405的具体实现过程可以参见上述各实施例的相关描述,此处不再赘述。
本公开中描述的处理器1401和收发器1405可实现在集成电路(integratedcircuit,IC)、模拟IC、射频集成电路(radio frequency integrated circuit,RFIC)、混合信号IC、专用集成电路(application specific integrated circuit,ASIC)、印刷电路板(printed circuit board,PCB)、电子设备等上。
本领域技术人员可以理解的是,图14中示出的电子设备的结构并不构成对本电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在此需要说明的是,本公开提供的上述电子设备,用于实现上述方法实施例中描述的字迹鉴定方法或者字迹鉴定模型训练方法,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
本公开实施例还提供一种计算机可读存储介质,当该存储介质中的指令由终端设备的处理器执行时,使得处理器能够执行上述方法实施例中的字迹鉴定方法,和/或,字迹鉴定模型训练方法。
本公开实施例还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时,实现上述方法实施例中的字迹鉴定方法,和/或,字迹鉴定模型训练方法。
在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本公开各个实施例方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random AccessMemory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在上述服务器的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。结合本公开所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本领域技术人员在考虑说明书及实践这里公开的方案后,将容易想到本公开的其它实施方案。本公开的实施例旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。
Claims (11)
1.一种字迹鉴定方法,其特征在于,包括:
获取待鉴定图像,所述待鉴定图像中包括待鉴定字迹;
基于注意力机制,提取所述待鉴定字迹的纹理特征和空间结构特征;
根据所述纹理特征和所述空间结构特征,确定所述待鉴定字迹的真实性。
2.根据权利要求1所述的字迹鉴定方法,其特征在于,所述基于注意力机制,提取所述待鉴定字迹的纹理特征和空间结构特征,包括:
基于注意力机制,通过对所述待鉴定字迹进行多次特征提取,得到不同尺寸的特征图,其中,当前次特征提取的输出作为下一次特征提取的输入,所述特征图包含对应次提取的所述待鉴定字迹的纹理特征和空间结构特征;
相应地,所述根据所述纹理特征和所述空间结构特征,确定所述待鉴定字迹的真实性,包括:对多次特征提取得到的特征图进行归一化处理,得到鉴定结果,所述鉴定结果用于反映所述待鉴定字迹的真实性。
3.根据权利要求1所述的字迹鉴定方法,其特征在于,所述基于注意力机制,提取所述待鉴定字迹的纹理特征和空间结构特征,包括:
通过特征提取模块提取所述待鉴定字迹的纹理特征和空间结构特征,所述特征提取模块是基于注意力机制训练得到的,所述特征提取模块包括至少一个特征提取单元和全连接层,所述至少一个特征提取单元依次连接,最后一个特征提取单元与所述全连接层连接,每个特征提取单元输出的特征图的尺寸不同,所述特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,所述卷积模块用于提取所述待鉴定字迹的形状特征和/或位置特征、所述多尺度卷积模块用于扩大所述待鉴定字迹的卷积感受野,提取所述待鉴定字迹对应的多尺度图像空间的特征、所述空间注意力模块用于提取所述待鉴定字迹的空间结构特征、所述通道注意力模块用于提取所述待鉴定字迹的纹理特征,所述池化层用于对图像特征进行降维处理,所述全连接层用于输出分类结果。
4.一种字迹鉴定模型训练方法,其特征在于,所述字迹鉴定模型包括特征提取模块和归一化层,所述特征提取模块包括至少一个特征提取单元和全连接层,所述至少一个特征提取单元依次连接,最后一个特征提取单元与所述全连接层连接,每个特征提取单元输出的特征图的尺寸不同,所述特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,所述卷积模块用于提取待鉴定字迹的形状特征和/或位置特征、所述多尺度卷积模块用于扩大所述待鉴定字迹的卷积感受野,提取所述待鉴定字迹对应的多尺度图像空间的特征、所述空间注意力模块用于提取所述待鉴定字迹的空间结构特征、所述通道注意力模块用于提取所述待鉴定字迹的纹理特征,所述池化层用于对图像特征进行降维处理,所述全连接层用于输出分类结果;
所述字迹鉴定模型训练方法包括:获取字迹样本,所述字迹样本包括真实字迹样本和所述真实字迹样本对应的临摹字迹样本;
根据所述真实字迹样本和所述临摹字迹样本,对初始字迹鉴定模型进行迭代训练,直至所述初始字迹鉴定模型的损失值小于或等于预设损失值,得到所述字迹鉴定模型。
5.根据权利要求4所述的字迹鉴定模型训练方法,其特征在于,所述根据所述真实字迹样本和所述临摹字迹样本,对初始字迹鉴定模型进行迭代训练,包括:
对所述真实字迹样本和所述临摹字迹样本进行数据增强处理,获得目标真实字迹样本和目标临摹字迹样本,所述数据增强处理包括以下至少一种处理方式:旋转处理、模糊处理、加噪处理以及色域调节;
根据所述目标真实字迹样本和目标临摹字迹样本,对所述初始字迹鉴定模型进行迭代训练。
6.根据权利要求5所述的字迹鉴定模型训练方法,其特征在于,所述根据所述目标真实字迹样本和目标临摹字迹样本,对所述初始字迹鉴定模型进行迭代训练,包括:
获取对所述初始字迹鉴定模型进行训练的训练参数,其中,所述训练参数包括以下至少一种:优化器类型、初始学习率、迭代次数和提前终止次数;
将所述目标真实字迹样本和目标临摹字迹样本输入到所述初始字迹鉴定模型中,通过所述训练参数对所述初始字迹鉴定模型进行训练。
7.一种字迹鉴定装置,其特征在于,包括:获取单元,用于获取待鉴定图像,所述待鉴定图像中包括待鉴定字迹;
处理单元,用于基于注意力机制,提取所述待鉴定字迹的纹理特征和空间结构特征;
确定单元,用于根据所述纹理特征和所述空间结构特征,确定所述待鉴定字迹的真实性。
8.一种字迹鉴定模型训练装置,其特征在于,所述字迹鉴定模型包括特征提取模块和归一化层,所述特征提取模块包括至少一个特征提取单元和全连接层,所述至少一个特征提取单元依次连接,最后一个特征提取单元与所述全连接层连接,每个特征提取单元输出的特征图的尺寸不同,所述特征提取单元包括卷积模块、多尺度卷积模块、空间注意力模块、通道注意力模块和池化层,其中,所述卷积模块用于提取待鉴定字迹的形状特征和/或位置特征、所述多尺度卷积模块用于扩大所述待鉴定字迹的卷积感受野,提取所述待鉴定字迹对应的多尺度图像空间的特征、所述空间注意力模块用于提取所述待鉴定字迹的空间结构特征、所述通道注意力模块用于提取所述待鉴定字迹的纹理特征,所述池化层用于对图像特征进行降维处理,全连接层用于输出分类结果;
所述字迹鉴定模型训练装置包括:获取单元,用于获取字迹样本,所述字迹样本包括真实字迹样本和所述真实字迹样本对应的临摹字迹样本;
训练单元,用于根据所述真实字迹样本和所述临摹字迹样本,对初始字迹鉴定模型进行迭代训练,直至所述初始字迹鉴定模型的损失值小于或等于预设损失值,得到所述字迹鉴定模型。
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器,所述存储器用于存储程序指令,所述处理器用于调用所述存储器中的程序指令,执行如权利要求1至3中任一项所述的字迹鉴定方法,和/或,执行如权利要求4至6中任一项所述的字迹鉴定模型训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序;所述计算机程序被执行时,实现如权利要求1至3中任一项所述的字迹鉴定方法,和/或,实现如权利要求4至6中任一项所述的字迹鉴定模型训练方法。
11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至3中任一项所述的字迹鉴定方法,和/或,实现如权利要求4至6中任一项所述的字迹鉴定模型训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110566922.9A CN113239840B (zh) | 2021-05-24 | 2021-05-24 | 字迹鉴定方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110566922.9A CN113239840B (zh) | 2021-05-24 | 2021-05-24 | 字迹鉴定方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113239840A true CN113239840A (zh) | 2021-08-10 |
CN113239840B CN113239840B (zh) | 2024-10-15 |
Family
ID=77138452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110566922.9A Active CN113239840B (zh) | 2021-05-24 | 2021-05-24 | 字迹鉴定方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113239840B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673415A (zh) * | 2021-08-18 | 2021-11-19 | 山东建筑大学 | 一种手写汉字身份鉴别方法及系统 |
CN114220178A (zh) * | 2021-12-16 | 2022-03-22 | 重庆傲雄在线信息技术有限公司 | 基于通道注意力机制的签名鉴别系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140363074A1 (en) * | 2013-06-09 | 2014-12-11 | Apple Inc. | Multi-script handwriting recognition using a universal recognizer |
CN106934397A (zh) * | 2017-03-13 | 2017-07-07 | 北京市商汤科技开发有限公司 | 图像处理方法、装置及电子设备 |
CN111899292A (zh) * | 2020-06-15 | 2020-11-06 | 北京三快在线科技有限公司 | 文字识别方法、装置、电子设备及存储介质 |
CN112686134A (zh) * | 2020-12-29 | 2021-04-20 | 科大讯飞股份有限公司 | 手写识别方法、装置、电子设备和存储介质 |
CN112686345A (zh) * | 2020-12-31 | 2021-04-20 | 江南大学 | 一种基于注意力机制的脱机英文手写识别方法 |
CN112766082A (zh) * | 2020-12-30 | 2021-05-07 | 大连海事大学 | 基于宏微观特征的中文文本笔迹鉴别方法、装置及存储介质 |
-
2021
- 2021-05-24 CN CN202110566922.9A patent/CN113239840B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140363074A1 (en) * | 2013-06-09 | 2014-12-11 | Apple Inc. | Multi-script handwriting recognition using a universal recognizer |
CN106934397A (zh) * | 2017-03-13 | 2017-07-07 | 北京市商汤科技开发有限公司 | 图像处理方法、装置及电子设备 |
CN111899292A (zh) * | 2020-06-15 | 2020-11-06 | 北京三快在线科技有限公司 | 文字识别方法、装置、电子设备及存储介质 |
CN112686134A (zh) * | 2020-12-29 | 2021-04-20 | 科大讯飞股份有限公司 | 手写识别方法、装置、电子设备和存储介质 |
CN112766082A (zh) * | 2020-12-30 | 2021-05-07 | 大连海事大学 | 基于宏微观特征的中文文本笔迹鉴别方法、装置及存储介质 |
CN112686345A (zh) * | 2020-12-31 | 2021-04-20 | 江南大学 | 一种基于注意力机制的脱机英文手写识别方法 |
Non-Patent Citations (1)
Title |
---|
赵志艳;杨志晓;李卓瑜;骆威;: "一种基于纹理特征的笔迹鉴别方法", 微计算机信息, no. 02 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673415A (zh) * | 2021-08-18 | 2021-11-19 | 山东建筑大学 | 一种手写汉字身份鉴别方法及系统 |
CN113673415B (zh) * | 2021-08-18 | 2022-03-04 | 山东建筑大学 | 一种手写汉字身份鉴别方法及系统 |
CN114220178A (zh) * | 2021-12-16 | 2022-03-22 | 重庆傲雄在线信息技术有限公司 | 基于通道注意力机制的签名鉴别系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113239840B (zh) | 2024-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020258667A1 (zh) | 图像识别方法及装置、非易失性可读存储介质、计算机设备 | |
CN108764195B (zh) | 手写模型训练方法、手写字识别方法、装置、设备及介质 | |
CN104834922B (zh) | 基于混合神经网络的手势识别方法 | |
CN108304357B (zh) | 一种基于字体流形的中文字库自动生成方法 | |
CN102147858B (zh) | 车牌字符识别方法 | |
CN111027563A (zh) | 一种文本检测方法、装置及识别系统 | |
CN109829453A (zh) | 一种卡证中文字的识别方法、装置以及计算设备 | |
CN108351984A (zh) | 硬件高效的深度卷积神经网络 | |
CN113449783B (zh) | 一种对抗样本生成方法、系统、计算机设备和存储介质 | |
CN114387647B (zh) | 对抗扰动生成方法、装置及存储介质 | |
US10878299B2 (en) | Methods and apparatus for testing multiple fields for machine vision | |
CN113239840B (zh) | 字迹鉴定方法、装置、设备和存储介质 | |
CN114297730A (zh) | 对抗图像生成方法、装置及存储介质 | |
US10846563B2 (en) | Methods and apparatus for generating a dense field of three dimensional data for machine vision | |
CN111091075A (zh) | 人脸识别方法、装置、电子设备及存储介质 | |
US20200082566A1 (en) | Methods and apparatus for processing image data for machine vision | |
CN103473492A (zh) | 权限识别方法和用户终端 | |
CN113111880B (zh) | 证件图像校正方法、装置、电子设备及存储介质 | |
CN109697442B (zh) | 一种字符识别模型的训练方法和装置 | |
CN113378609B (zh) | 代理商代签名的识别方法及装置 | |
Tseng et al. | Perceptual edge detection via entropy‐driven gradient evaluation | |
Xu et al. | Multi‐pyramid image spatial structure based on coarse‐to‐fine pyramid and scale space | |
CN116959073A (zh) | 一种方向自适应的多姿态点云人脸识别方法及系统 | |
Yang et al. | Robust affine invariant descriptors | |
CN114170589A (zh) | 一种基于nas的岩石岩性识别方法、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |