CN113077048B - 基于神经网络的印章匹配方法、系统、设备及存储介质 - Google Patents

基于神经网络的印章匹配方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113077048B
CN113077048B CN202110381639.9A CN202110381639A CN113077048B CN 113077048 B CN113077048 B CN 113077048B CN 202110381639 A CN202110381639 A CN 202110381639A CN 113077048 B CN113077048 B CN 113077048B
Authority
CN
China
Prior art keywords
matrix
seal
angle
feature
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110381639.9A
Other languages
English (en)
Other versions
CN113077048A (zh
Inventor
谭黎敏
龚霁程
赵钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xijing Technology Co ltd
Original Assignee
Shanghai Westwell Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Westwell Information Technology Co Ltd filed Critical Shanghai Westwell Information Technology Co Ltd
Priority to CN202110381639.9A priority Critical patent/CN113077048B/zh
Publication of CN113077048A publication Critical patent/CN113077048A/zh
Application granted granted Critical
Publication of CN113077048B publication Critical patent/CN113077048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了基于神经网络的印章匹配方法、系统、设备及存储介质,该方法包括:对N种带印章和真实标签的印章样本图案进行预处理,独立提取特征图阵转,每个像素的每个色彩通道作为独立卷积核;训练预测网络,获得特征矩阵X和权重矩阵W并进行归一化;根据特征矩阵和权重矩阵获得预测向量矩阵;根据真实标签获取反余弦得到角度
Figure DDA0003013205610000011
对所有由真实标签对应的角度值
Figure DDA0003013205610000012
加上惩罚角度m,其他角度值保持原有角度。本发明能够实现在缺少足够可利用的印章训练样本的情况下,能够将机器学习方式应用于印章识别中,提高了印章识别的识别率。

Description

基于神经网络的印章匹配方法、系统、设备及存储介质
背景技术
随着经济的迅猛发展,企事业单位之间、个体和单位之间的票据往来迅速增长,犯罪分子伪造印章获取高额利润的案例也随之日益增多,由于缺乏对印章的有效识别,使得犯罪分子进行商业诈骗谋取暴利的行为得以实现,给社会带来极大损失。早期的人工折角识别印章真伪的方式无论是在检测速度上还是检测精度上都已经无法满足要求,而且识别过程中具有强烈的主观因素。
为了提高印章识别成效,预防与减少印章身份犯罪对个体和社会的巨额损失,采用机器视觉技术准确识别印章已成为迫切需要解决的问题。快速准确地识别印章真伪对于个人、社会团体、单位具有重大的现实意义,也成为社会稳定发展的迫切需求。
目前,传统机器学习通常有两个基本假设,即训练样本与测试样本满足独立同分布的假设和必须有足够可利用的训练样本假设。而印章识别中,由于缺少足够可利用的训练样本,因此很难将传统的机器学习方法应用于印章识别中。
但是,发明人发现现有技术中至少存在如下问题:现有的印章识别方案,由于缺少足够可利用的印章训练样本,很难将机器学习方式应用于印章识别中。
因此,本发明提供了一种基于神经网络的印章匹配方法、系统、设备及存储介质。
发明内容
针对现有技术中的问题,本发明的目的在于提供基于神经网络的印章匹配方法、系统、设备及存储介质,克服了现有技术的困难,能够实现在缺少足够可利用的印章训练样本的情况下,能够将机器学习方式应用于印章识别中,提高了印章识别的识别率。
本发明的实施例提供一种基于神经网络的印章匹配方法,包括训练阶段和预测阶段,所述训练阶段包括以下步骤:
对N种带印章和真实标签的印章样本图案进行预处理,独立提取特征图矩阵,每个所述像素的每个色彩通道作为独立卷积核;
训练预测网络,获得特征矩阵X并进行归一化;
获得权重矩阵W并进行归一化;
根据特征矩阵和权重矩阵获得预测向量矩阵;
根据真实标签获取反余弦得到角度
Figure BDA0003013205590000021
对所有由真实标签对应的角度值
Figure BDA0003013205590000022
加上惩罚角度m,其他角度值保持原有角度;
计算损失函数Loss,通过训练令损失函数减小。
优选地,所述训练阶段至少包括以下步骤:
S110、对N种带印章和真实标签的印章样本图案进行预处理并对每个像素的每个色彩通道进行归一化,自所述印章样本图案独立提取特征图矩阵,每个所述像素的每个色彩通道作为独立卷积核;
S120、训练预测网络,根据每个所述特征图矩阵转化为一个一维矩阵Cin,根据所述一维矩阵Cin获得特征矩阵X,X=N×Cin,对每个所述特征矩阵X中的所有元素进行归一化,获得归一化后的特征矩阵Xnorm
S130、获得每个所述特征矩阵X的权重矩阵W,W=Cin×Cout,Cout表示分类印章的一行N列的类别矩阵每一列分别对应一种印章类别,并对权重矩阵W中的所有元素进行归一化,获得归一化后的权重矩阵Wnorm
S140、获得N行Cout列的预测向量矩阵cosθ,
cosθ=Xnorm×Wnorm
S150、根据真实标签从预测向量cosθ中选择对应的值
Figure BDA0003013205590000023
Figure BDA0003013205590000024
为所述真实标签对应的类别所预测的角度,获取反余弦得到角度
Figure BDA0003013205590000025
Figure BDA0003013205590000031
S160、对所有由真实标签对应的角度值
Figure BDA0003013205590000032
加上惩罚角度m,所述惩罚角度m的取值范围是[25°,35°]其他角度值保持原有角度
Figure BDA0003013205590000033
S180、计算损失函数Loss,通过训练令损失函数减小;
Figure BDA0003013205590000034
N为印章样本数,n为印章类别数,θj表示权重W和特征向量x之间的角度,
Figure BDA0003013205590000035
表示真实标签对应的类别所预测的角度,m表示对预测角度的惩罚角度,s表示对特征的尺度的放大。
优选地,所述预测阶段至少包括以下步骤:
S210、对N种带印章和真实标签的印章样本图案进行预处理并对每个像素的每个色彩通道进行归一化,自所述印章样本图案独立提取特征图矩阵,每个所述像素的每个色彩通道作为独立卷积核;
S220、输入训练好的预测网络,根据每个所述特征图矩阵转化为一个一维矩阵Cin,根据所述一维矩阵Cin获得特征矩阵X,X=N×Cin,对每个所述特征矩阵X中的所有元素进行归一化,获得特征矩阵Xnorm
S230、获得每个所述特征矩阵X的权重矩阵W,W=Cin×Cout,Cout表示分类印章的一行N列的类别矩阵每一列分别对应一种印章类别,并对权重矩阵W中的所有元素进行归一化,获得特征矩阵Wnorm
S240、获得N行Cout列的预测向量矩阵cosθ,
cosθ=Xnorm×Wnorm
根据所述预测向量矩阵cosθ,预测向量矩阵cosθ的每一列分别对应一种印章类别,输出预测向量矩阵cosθ中元素值最大的一个元素所在的列对应的印章类别。
优选地,对所述色彩通道进行归一化包括以下步骤:
S111、预设的图片像素尺寸对所述印章样本图案进行缩放;
S112、随机更改所述印章样本图案的亮度、对比度、饱和度、旋转角度;
S113、对所述印章样本图案的每个像素的每个色彩通道进行归一化。
优选地,所述步骤S113中,包括以下步骤:
S1131、获得所述印章样本图案的每个像素的每个色彩通道的值Y;
S1131、通过排序,获得RGB和值的最高的值Ymax以及最低值Ymin
S1132、获得所述印章样本图案的每个像素归一化后的值Ynorm
Figure BDA0003013205590000041
优选地,对每个所述特征矩阵X中的所有元素进行归一化的公式为:
Figure BDA0003013205590000042
其中,xnorm为归一化后的所述特征矩阵X中的元素,μfeature为所述特征矩阵X中的所有元素的均值,σfeature为所述特征矩阵X中的所有元素方差。
优选地,对每个所述权重矩阵W中的所有元素进行归一化的公式为:
Figure BDA0003013205590000043
其中,Wnorm为归一化后的所述权重矩阵W中的元素,μfeature为所述权重矩阵W中的所有元素的均值,σfeature为所述权重矩阵W中的所有元素方差。
优选地,所述步骤S160与步骤S180之间还包括以下步骤:
S170、对所有的值乘上预设值s进行特征的尺度缩放
cosθ=s*cosθ,s=2R,R为自然数。
优选地,所述预测阶段包括以下步骤:
S310、对于不同类别的印章分别给出一个标准的印章srampgt,通过训练好的特征提取网络分别计算标准印章的特征向量p
p=model(stampgt);
其中,p是一个NxCfea_num,其中N为印章的类别数,Cfea_num表示网络提取的特征数;
S320、将测试印章图stamptest像经过同样的特征提取网络得到一个特征向量q
q=model(stamptest);
其中q是一个1xCfea_num,其中1表示测试印章为1个,Cfea_num表示网络提取的特征数;
S330、分别计算测试印章的特征向量q与标准印章的特征向量p的余弦角度,余弦角度越大,表示测试印章与标准印章的相似性也越大,
Figure BDA0003013205590000051
S340、根据余弦角度的大小,判断测试印章的匹配类别
label=argmax(cosθ);
取cosθ最大值的下标也就得到印章的标签。
本发明的实施例还提供一种基于神经网络的印章匹配系统,用于实现上述的基于神经网络的印章匹配方法,所述基于神经网络的印章匹配系统包括:训练模块和预测模块,所述训练模块至少包括:
预处理子模块,对N种带印章和真实标签的印章样本图案进行预处理,独立提取特征图阵转,每个所述像素的每个色彩通道作为独立卷积核;
特征矩阵子模块,训练预测网络,获得特征矩阵X并进行归一化;
权重矩阵子模块,获得权重矩阵W并进行归一化;
预测向量子模块,根据特征矩阵和权重矩阵获得预测向量矩阵;
预测角度子模块,根据真实标签获取反余弦得到角度
Figure BDA0003013205590000052
惩罚角度子模块,对所有由真实标签对应的角度值
Figure BDA0003013205590000053
加上惩罚角度m,其他角度值保持原有角度;
损失函数子模块,计算损失函数Loss,通过训练令损失函数减小。
本发明的实施例还提供一种基于神经网络的印章匹配设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述基于神经网络的印章匹配方法的步骤。
本发明的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于神经网络的印章匹配方法的步骤。
本发明的目的在于提供基于神经网络的印章匹配方法、系统、设备及存储介质,能够实现在缺少足够可利用的印章训练样本的情况下,能够将机器学习方式应用于印章识别中,提高了印章识别的识别率。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本发明的基于神经网络的印章匹配方法的流程示意图。
图2是本发明的基于神经网络的印章匹配系统的架构示意图。
图3是本发明的基于神经网络的印章匹配设备的结构示意图。
图4是本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
图1是本发明的基于神经网络的印章匹配方法的流程示意图。如图1所示,本发明提供一种基于神经网络的印章匹配方法,包括训练阶段和预测阶段,所述训练阶段包括以下步骤:
对N种带印章和真实标签的印章样本图案进行预处理,独立提取特征图矩阵,每个所述像素的每个色彩通道作为独立卷积核;
训练预测网络,获得特征矩阵X并进行归一化;
获得权重矩阵W并进行归一化;
根据特征矩阵和权重矩阵获得预测向量矩阵;
根据真实标签获取反余弦得到角度
Figure BDA0003013205590000061
对所有由真实标签对应的角度值
Figure BDA0003013205590000071
加上惩罚角度m,其他角度值保持原有角度;
计算损失函数Loss,通过训练令损失函数减小。
在一个优选实施例中,所述训练阶段至少包括以下步骤:
S110、对N种带印章和真实标签的印章样本图案进行预处理并对每个像素的每个色彩通道进行归一化,自所述印章样本图案独立提取特征图矩阵,每个所述像素的每个色彩通道作为独立卷积核;
S120、训练预测网络,根据每个所述特征图矩阵转化为一个一维矩阵Cin,根据所述一维矩阵Cin获得特征矩阵X,X=N×Cin,对每个所述特征矩阵X中的所有元素进行归一化,获得归一化后的特征矩阵Xnorm
S130、获得每个所述特征矩阵X的权重矩阵W,W=Cin×Cout,Cout表示分类印章的一行N列的类别矩阵每一列分别对应一种印章类别,并对权重矩阵W中的所有元素进行归一化,获得归一化后的权重矩阵Wnorm
S140、获得N行Cout列的预测向量矩阵cosθ,
cosθ=Xnorm×Wnorm
S150、根据真实标签从预测向量cosθ中选择对应的值
Figure BDA0003013205590000072
Figure BDA0003013205590000073
为所述真实标签对应的类别所预测的角度,获取反余弦得到角度
Figure BDA0003013205590000074
Figure BDA0003013205590000075
S160、对所有由真实标签对应的角度值
Figure BDA0003013205590000076
加上惩罚角度m,所述惩罚角度m的取值范围是[25°,35°]其他角度值保持原有角度
Figure BDA0003013205590000077
S170、对所有的值乘上预设值s进行特征的尺度缩放,cosθ=s*cosθ,s=2R,R为自然数。
S180、计算损失函数Loss,通过训练令损失函数减小;
Figure BDA0003013205590000078
N为印章样本数,n为印章类别数,θj表示权重W和特征向量x之间的角度,
Figure BDA0003013205590000079
表示真实标签对应的类别所预测的角度,m表示对预测角度的惩罚角度,s表示对特征的尺度的放大。
在一个优选实施例中,所述预测阶段至少包括以下步骤:
S210、对N种带印章和真实标签的印章样本图案进行预处理并对每个像素的每个色彩通道进行归一化,自所述印章样本图案独立提取特征图矩阵,每个所述像素的每个色彩通道作为独立卷积核;
S220、输入训练好的预测网络,根据每个所述特征图矩阵转化为一个一维矩阵Cin,根据所述一维矩阵Cin获得特征矩阵X,X=N×Cin,对每个所述特征矩阵X中的所有元素进行归一化,获得特征矩阵Xnorm
S230、获得每个所述特征矩阵X的权重矩阵W,W=Cin×Cout,Cout表示分类印章的一行N列的类别矩阵每一列分别对应一种印章类别,并对权重矩阵W中的所有元素进行归一化,获得特征矩阵Wnorm
S240、获得N行Cout列的预测向量矩阵cosθ,
cosθ=Xnorm×Wnorm
根据所述预测向量矩阵cosθ,预测向量矩阵cosθ的每一列分别对应一种印章类别,输出预测向量矩阵cosθ中元素值最大的一个元素所在的列对应的印章类别。
在一个优选实施例中,对所述色彩通道进行归一化包括以下步骤:
S111、预设的图片像素尺寸对所述印章样本图案进行缩放;
S112、随机更改所述印章样本图案的亮度、对比度、饱和度、旋转角度;
S113、对所述印章样本图案的每个像素的每个色彩通道进行归一化。
在一个优选实施例中,所述步骤S113中,包括以下步骤:
S1131、获得所述印章样本图案的每个像素的每个色彩通道的值Y;
S1131、通过排序,获得RGB和值的最高的值Ymax以及最低值Ymin
S1132、获得所述印章样本图案的每个像素归一化后的值Ynorm
Figure BDA0003013205590000081
在一个优选实施例中,对每个所述特征矩阵X中的所有元素进行归一化的公式为:
Figure BDA0003013205590000082
其中,xnorm为归一化后的所述特征矩阵X中的元素,μfeature为所述特征矩阵X中的所有元素的均值,σfeature为所述特征矩阵X中的所有元素方差。
在一个优选实施例中,对每个所述权重矩阵W中的所有元素进行归一化的公式为:
Figure BDA0003013205590000091
其中,Wnorm为归一化后的所述权重矩阵W中的元素,μfeature为所述权重矩阵W中的所有元素的均值,σfeature为所述权重矩阵W中的所有元素方差。
在一个优选实施例中,所述预测阶段包括以下步骤:
S310、对于不同类别的印章分别给出一个标准的印章srampgt,通过训练好的特征提取网络分别计算标准印章的特征向量p
p=model(stampgt);
其中,p是一个NxCfea_num,其中N为印章的类别数,Cfea_num表示网络提取的特征数;
S320、将测试印章图stamptest像经过同样的特征提取网络得到一个特征向量q
q=model(stamptest);
其中q是一个1xCfea_num,其中1表示测试印章为1个,Cfea_num表示网络提取的特征数;
S330、分别计算测试印章的特征向量q与标准印章的特征向量p的余弦角度,余弦角度越大,表示测试印章与标准印章的相似性也越大,
Figure BDA0003013205590000092
S340、根据余弦角度的大小,判断测试印章的匹配类别
label=argmax(cosθ);
取cosθ最大值的下标也就得到印章的标签。
本发明的基于神经网络的印章匹配方法,能够实现在缺少足够可利用的印章训练样本的情况下,能够将机器学习方式应用于印章识别中,提高了印章识别的识别率。
本发明的基于神经网络的印章匹配方法的事实是过程如下:
1、图像增广
首先对所有印章进行统一的图像增广处理,包括以下几个步骤:
统一尺寸。使用双线性插值将通过检测算法检测出的不固定尺寸的印章统一为256x256的尺寸。
颜色抖动。随机更改印章图片的亮度,对比度和饱和度。
随机旋转。将印章图片随机旋转任意角度。
数值归一化。使用归一化的方法,将所有的印章图片统一到0到1的范围内。
Figure BDA0003013205590000101
其中x表示印章图片,xmin表示印章图片的最小像素值,xmax表示印章图片的最大像素值,xnorm表示归一化后的印章图片。
2、特征提取网络
特征提取网络采用一种深度可分离的卷积网络。这种深度可分离的网络将一个传统的卷积拆分为两部分。
对输入的特征图矩阵的每个通道作用一个独立的卷积核
使用一个1x1的卷积核对特征图矩阵进行特征的升维
最终的网络结构是通过1个传统卷积层,12个深度可分离卷积层和1个全连接层构成。
3、训练预测网络
输入图像经过特征提取网络之后,生成NxC的特征矩阵。为了减少相同类别之间的类内间距,增加不同类别的类间间距,可以通过计算类别之间的角度关系来确定类别。具体步骤如下:
对NxCin的特征矩阵x进行归一化
Figure BDA0003013205590000102
其中μfeature为特征矩阵x的均值图,σfeature为方差图,xnorm为归一化后的特征矩阵。
1)对相应的权重矩阵W进行归一化
Figure BDA0003013205590000111
其中W为CinxCout的矩阵,μweight为权重矩阵W的均值,σweight为权重矩阵W的方差,Wnorm为归一化后的权重矩阵。
2)计算Wx得到预测向量Cosθ
cosθ=xnormWnorm
其中cosθ为NxCout的矩阵,N表示印章样本数,Cout表示分类印章的类别数。
3)根据真实标签从预测向量cosθ中选择对应的值
Figure BDA0003013205590000112
其中
Figure BDA0003013205590000113
真实标签对应的类别所预测的角度。
4)计算其反余弦得到角度
Figure BDA0003013205590000114
Figure BDA0003013205590000115
5)加上系统给定的惩罚角度m
Figure BDA0003013205590000116
6)对所有由真实标签对应的角度值
Figure BDA0003013205590000117
加上惩罚角度m,所述惩罚角度m的取值范围是[25°,35°]其他角度值保持原有角度
Figure BDA0003013205590000118
7)对所有的值乘上预设值s进行特征的尺度缩放
8)cosθ=s*cosθ,s=2R,R为自然数。
4、损失函数公式
Figure BDA0003013205590000119
其中,N和n分别代表批尺寸和类别数目,θj表示权重W和特征向量x之间的角度,
Figure BDA00030132055900001110
表示真实标签对应的类别所预测的角度,m表示对预测角度的惩罚角度,s表示对特征的尺度的放大。通过大量的训练,使得损失函数Loss的值逐渐减小,后得到训练好的用于识别印章的神经网络。通过定义的损失函数可以计算预测值与真实值的误差,在训练过程中,通过迭代优化这个误差值,可以实现越来越精确的模型。
5、模型推理模块
对于训练好的模型model,可以实现印章分类和匹配两种不同预测功能。
1)分类功能
a.按照训练预测网络中方法对特征矩阵x进行归一化。
b.按照训练预测网络中方法对权重矩阵W进行归一化。
c.计算Wx得到预测的余弦值cosθ。
d.通过余弦值将不同的印章分成不同的类别,余弦值最大的即为类别标签。
2)匹配功能
a.对于不同类别的印章分别给出一个标准的印章stampgt,通过训练好的特征提取网络分别计算标准印章的特征向量p。
p=model(stampgt)
其中p是一个nxCfea_num,其中n表示标准印章的个数,也是印章的类别数,Cfea_num表示网络提取的特征数。
b.将测试印章图stamptest像经过同样的特征提取网络得到一个特征向量q。
q=model(stamptest)
其中q是一个1xCfea_num,其中1表示测试印章为1个,Cfea_num表示网络提取的特征数。
c.分别计算测试印章的特征向量q与标准印章的特征向量p的余弦角度。
Figure BDA0003013205590000121
d.根据余弦角度的大小,判断测试印章的匹配类别。余弦角度越大,表示测试印章与标准印章的相似性也越大。
label=argmax(cosθ)
取cosθ最大值的下标也就得到印章的标签label。
图2是本发明的基于神经网络的印章匹配系统的架构示意图。如图3所示,本发明的实施例还提供一种基于神经网络的印章匹配系统,用于实现上述的基于神经网络的印章匹配方法,基于神经网络的印章匹配系统5包括:训练模块51和预测模块52,所述训练模块51至少包括:
预处理子模块,对N种带印章和真实标签的印章样本图案进行预处理,独立提取特征图阵转,每个所述像素的每个色彩通道作为独立卷积核;
特征矩阵子模块,训练预测网络,获得特征矩阵X并进行归一化;
权重矩阵子模块,获得权重矩阵W并进行归一化;
预测向量子模块,根据特征矩阵和权重矩阵获得预测向量矩阵;
预测角度子模块,根据真实标签获取反余弦得到角度
Figure BDA0003013205590000131
惩罚角度子模块,对所有由真实标签对应的角度值
Figure BDA0003013205590000132
加上惩罚角度m,其他角度值保持原有角度;
损失函数子模块,计算损失函数Loss,通过训练令损失函数减小。
本发明的基于神经网络的印章匹配系统,能够实现在缺少足够可利用的印章训练样本的情况下,能够将机器学习方式应用于印章识别中,提高了印章识别的识别率。
本发明实施例还提供一种基于神经网络的印章匹配设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的基于神经网络的印章匹配方法的步骤。
如上所示,该实施例能够实现在缺少足够可利用的印章训练样本的情况下,能够将机器学习方式应用于印章识别中,提高了印章识别的识别率。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图3是本发明的基于神经网络的印章匹配设备的结构示意图。下面参照图3来描述根据本发明的这种实施方式的电子设备600。图3显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的基于神经网络的印章匹配方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例能够实现在缺少足够可利用的印章训练样本的情况下,能够将机器学习方式应用于印章识别中,提高了印章识别的识别率。
图4是本发明的计算机可读存储介质的结构示意图。参考图4所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的目的在于提供基于神经网络的印章匹配方法、系统、设备及存储介质,能够实现在缺少足够可利用的印章训练样本的情况下,能够将机器学习方式应用于印章识别中,提高了印章识别的识别率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (11)

1.一种基于神经网络的印章匹配方法,其特征在于,包括训练阶段和预测阶段,所述训练阶段包括以下步骤:
S110、对N种带印章和真实标签的印章样本图案进行预处理并对每个像素的每个色彩通道进行归一化,自所述印章样本图案独立提取特征图矩阵,每个所述像素的每个色彩通道作为独立卷积核;
S120、训练预测网络,根据每个所述特征图矩阵转化为一个一维矩阵Cin,根据所述一维矩阵Cin获得特征矩阵X,X=N×Cin,对每个所述特征矩阵X中的所有元素进行归一化,获得归一化后的特征矩阵Xnorm
S130、获得每个所述特征矩阵X的权重矩阵W,W=Cin×Cout,Cout表示分类印章的一行N列的类别矩阵每一列分别对应一种印章类别,并对权重矩阵W中的所有元素进行归一化,获得归一化后的权重矩阵Wnorm
S140、获得N行Cout列的预测向量矩阵cosθ,
cosθ=Xnorm×Wnorm
S150、根据真实标签从预测向量cosθ中选择对应的值
Figure FDA0004078939820000011
Figure FDA0004078939820000012
为所述真实标签对应的类别所预测的角度,获取反余弦得到角度
Figure FDA0004078939820000013
Figure FDA0004078939820000014
S160、对所有由真实标签对应的角度值
Figure FDA0004078939820000015
加上惩罚角度m,所述惩罚角度m的取值范围是[25°,35°]其他角度值保持原有角度
Figure FDA0004078939820000016
S180、计算损失函数Loss,通过训练令损失函数减小;
Figure FDA0004078939820000017
N为印章样本数,n为印章类别数,θj表示权重W和特征向量x之间的角度,
Figure FDA0004078939820000018
表示真实标签对应的类别所预测的角度,m表示对预测角度的惩罚角度,s表示对特征的尺度的放大。
2.根据权利要求1所述的基于神经网络的印章匹配方法,其特征在于,所述预测阶段至少包括以下步骤:
S210、对N种带印章和真实标签的印章样本图案进行预处理并对每个像素的每个色彩通道进行归一化,自所述印章样本图案独立提取特征图矩阵,每个所述像素的每个色彩通道作为独立卷积核;
S220、输入训练好的预测网络,根据每个所述特征图矩阵转化为一个一维矩阵Cin,根据所述一维矩阵Cin获得特征矩阵X,X=N×Cin,对每个所述特征矩阵X中的所有元素进行归一化,获得特征矩阵Xnorm
S230、获得每个所述特征矩阵X的权重矩阵W,W=Cin×Cout,Cout表示分类印章的一行N列的类别矩阵每一列分别对应一种印章类别,并对权重矩阵W中的所有元素进行归一化,获得特征矩阵Wnorm
S240、获得N行Cout列的预测向量矩阵cosθ,
cosθ=Xnorm×Wnorm
根据所述预测向量矩阵cosθ,预测向量矩阵cosθ的每一列分别对应一种印章类别,输出预测向量矩阵cosθ中元素值最大的一个元素所在的列对应的印章类别。
3.根据权利要求1或2所述的基于神经网络的印章匹配方法,其特征在于,对所述色彩通道进行归一化包括以下步骤:
S111、预设的图片像素尺寸对所述印章样本图案进行缩放;
S112、随机更改所述印章样本图案的亮度、对比度、饱和度、旋转角度;
S113、对所述印章样本图案的每个像素的每个色彩通道进行归一化。
4.根据权利要求3所述的基于神经网络的印章匹配方法,其特征在于,所述步骤S113中,包括以下步骤:
S1131、获得所述印章样本图案的每个像素的每个色彩通道的值Y;
S1131、通过排序,获得RGB和值的最高的值Ymax以及最低值Ymin
S1132、获得所述印章样本图案的每个像素归一化后的值Ynorm
Figure FDA0004078939820000021
5.根据权利要求1或2所述的基于神经网络的印章匹配方法,其特征在于,对每个所述特征矩阵X中的所有元素进行归一化的公式为:
Figure FDA0004078939820000022
其中,xnorm为归一化后的所述特征矩阵X中的元素,μfeature为所述特征矩阵X中的所有元素的均值,σfeature为所述特征矩阵X中的所有元素方差。
6.根据权利要求1或2所述的基于神经网络的印章匹配方法,其特征在于,对每个所述权重矩阵W中的所有元素进行归一化的公式为:
Figure FDA0004078939820000031
其中,Wnorm为归一化后的所述权重矩阵W中的元素,μfeature为所述权重矩阵W中的所有元素的均值,σfeature为所述权重矩阵W中的所有元素方差。
7.根据权利要求1或2所述的基于神经网络的印章匹配方法,其特征在于,所述步骤S160与步骤S180之间还包括以下步骤:
S170、对所有的值乘上预设值s进行特征的尺度放大,s=2R,R为自然数。
8.根据权利要求1所述的基于神经网络的印章匹配方法,其特征在于,所述预测阶段包括以下步骤:
S310、对于不同类别的印章分别给出一个标准的印章stampgt,通过训练好的特征提取网络分别计算标准印章的特征向量p
p=model(stampgt);
其中,p=N×Cfea_num,其中N为印章的类别数,Cfea_num表示网络提取的特征数;
S320、将测试印章图stamptest像经过同样的特征提取网络得到一个特征向量q
q=model(stamptest);
其中q=1×Cfea_num,其中1表示测试印章为1个,Cfea_num表示网络提取的特征数;
S330、分别计算测试印章的特征向量q与标准印章的特征向量p的余弦角度
Figure FDA0004078939820000032
S340、根据余弦角度的大小,判断测试印章的匹配类别
label=argmax(cosθ);
取cosθ最大值的下标也就得到印章的标签。
9.一种基于神经网络的印章匹配系统,用于实现权利要求1所述的基于神经网络的印章匹配方法,其特征在于,包括:训练模块和预测模块,所述训练模块至少包括:
预处理子模块,对N种带印章和真实标签的印章样本图案进行预处理,独立提取特征图矩阵,每个像素的每个色彩通道作为独立卷积核;
特征矩阵子模块,训练预测网络,获得特征矩阵X并进行归一化;
权重矩阵子模块,获得权重矩阵W并进行归一化;
预测向量子模块,根据特征矩阵和权重矩阵获得预测向量矩阵;
预测角度子模块,根据真实标签获取反余弦得到角度
Figure FDA0004078939820000041
惩罚角度子模块,对所有由真实标签对应的角度值
Figure FDA0004078939820000042
加上惩罚角度m,其他角度值保持原有角度;
损失函数子模块,计算损失函数Loss,通过训练令损失函数减小。
10.一种基于神经网络的印章匹配设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至8任意一项所述基于神经网络的印章匹配方法的步骤。
11.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至8任意一项所述基于神经网络的印章匹配方法的步骤。
CN202110381639.9A 2021-04-09 2021-04-09 基于神经网络的印章匹配方法、系统、设备及存储介质 Active CN113077048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110381639.9A CN113077048B (zh) 2021-04-09 2021-04-09 基于神经网络的印章匹配方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110381639.9A CN113077048B (zh) 2021-04-09 2021-04-09 基于神经网络的印章匹配方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113077048A CN113077048A (zh) 2021-07-06
CN113077048B true CN113077048B (zh) 2023-04-18

Family

ID=76615714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110381639.9A Active CN113077048B (zh) 2021-04-09 2021-04-09 基于神经网络的印章匹配方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113077048B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860364A (zh) * 2020-07-24 2020-10-30 携程计算机技术(上海)有限公司 人脸识别模型的训练方法、装置、电子设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9609197B1 (en) * 2016-08-19 2017-03-28 Intelligent Security Systems Corporation Systems and methods for dewarping images
WO2019075461A1 (en) * 2017-10-13 2019-04-18 BioAge Labs, Inc. DRUG REPOSITIONING BASED ON DEEP INTEGRATIONS OF GENE EXPRESSION PROFILES
EP3534235B1 (en) * 2018-02-28 2021-04-14 Honda Research Institute Europe GmbH Unsupervised learning of metric representations from slow features
CN109145723A (zh) * 2018-07-09 2019-01-04 长江大学 一种印章识别方法、系统、终端装置及存储介质
CN111445496B (zh) * 2020-02-26 2023-06-30 沈阳大学 一种水下图像识别跟踪系统及方法
CN112560785A (zh) * 2020-12-28 2021-03-26 宋彦震 基于人工智能的面部追踪调整多屏亮度的控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860364A (zh) * 2020-07-24 2020-10-30 携程计算机技术(上海)有限公司 人脸识别模型的训练方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN113077048A (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN107977665A (zh) 一种发票中关键信息的识别方法及计算设备
CN111767954A (zh) 车辆细粒度识别模型生成方法、系统、设备及存储介质
CN108491866B (zh) 色情图片鉴定方法、电子装置及可读存储介质
US11164306B2 (en) Visualization of inspection results
CN112308237B (zh) 一种问答数据增强方法、装置、计算机设备及存储介质
CN112257578B (zh) 人脸关键点检测方法、装置、电子设备及存储介质
CN111950279B (zh) 实体关系的处理方法、装置、设备及计算机可读存储介质
CN111652232A (zh) 票据识别方法及装置、电子设备和计算机可读存储介质
CN112052840B (zh) 图片筛选方法、系统、设备及存储介质
CN113158656B (zh) 讽刺内容识别方法、装置、电子设备以及存储介质
CN112287957A (zh) 目标匹配方法与装置
CN112308069A (zh) 一种软件界面的点击测试方法、装置、设备及存储介质
CN111401309B (zh) 基于小波变换的cnn训练和遥感图像目标识别方法
CN111178357A (zh) 车牌识别方法、系统、设备和存储介质
CN114330588A (zh) 一种图片分类方法、图片分类模型训练方法及相关装置
CN116311214A (zh) 车牌识别方法和装置
CN114282258A (zh) 截屏数据脱敏方法、装置、计算机设备及存储介质
CN113762303B (zh) 图像分类方法、装置、电子设备及存储介质
WO2022126917A1 (zh) 基于深度学习的人脸图像评估方法、装置、设备及介质
CN113077048B (zh) 基于神经网络的印章匹配方法、系统、设备及存储介质
CN112287734A (zh) 碎屏检测及用于碎屏检测的卷积神经网络的训练方法
CN114741697B (zh) 恶意代码分类方法、装置、电子设备和介质
CN112801960B (zh) 图像处理方法及装置、存储介质、电子设备
CN113822313A (zh) 图节点异常检测方法及装置
WO2020172767A1 (zh) 电子签购单识别方法、装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Room 503-3, 398 Jiangsu Road, Changning District, Shanghai 200050

Patentee after: Shanghai Xijing Technology Co.,Ltd.

Address before: Room 503-3, 398 Jiangsu Road, Changning District, Shanghai 200050

Patentee before: SHANGHAI WESTWELL INFORMATION AND TECHNOLOGY Co.,Ltd.