CN117809139B - 合成图像识别的网络训练方法以及合成图像识别方法 - Google Patents
合成图像识别的网络训练方法以及合成图像识别方法 Download PDFInfo
- Publication number
- CN117809139B CN117809139B CN202410225879.3A CN202410225879A CN117809139B CN 117809139 B CN117809139 B CN 117809139B CN 202410225879 A CN202410225879 A CN 202410225879A CN 117809139 B CN117809139 B CN 117809139B
- Authority
- CN
- China
- Prior art keywords
- fingerprint
- network
- training
- preset
- error correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 290
- 239000002131 composite material Substances 0.000 title claims abstract description 125
- 238000000034 method Methods 0.000 title claims abstract description 122
- 238000012937 correction Methods 0.000 claims abstract description 261
- 230000006870 function Effects 0.000 claims description 148
- 230000007246 mechanism Effects 0.000 claims description 54
- 238000000605 extraction Methods 0.000 claims description 45
- 238000013528 artificial neural network Methods 0.000 claims description 32
- 230000015654 memory Effects 0.000 claims description 26
- 238000013507 mapping Methods 0.000 claims description 21
- 238000010586 diagram Methods 0.000 description 9
- 238000010606 normalization Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明涉及图像识别领域,具体涉及合成图像识别的网络训练方法以及合成图像识别方法。获取第一训练数据集;将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络;利用第一预设损失函数对初始合成图像识别网络中的初始指纹解码网络以及初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型。保证了得到的目标合成图像识别模型的准确性,从而实现了可以基于预设纠错网络对虚拟指纹进行纠错,保证得到的纠错后的指纹的准确性。解决了传统纠错码对指纹进行纠错不准确的问题。
Description
技术领域
本发明涉及图像识别领域,具体涉及合成图像识别的网络训练方法以及合成图像识别方法。
背景技术
随着计算机技术的发展,通过生成对抗网络(GANs)进行合成图像变得越来越容易,通过这种方式获得的图像被称作合成图像。
在很多情况下,确认图像是否为合成图像,对人们的生活和工作至关重要。如何能够准确的对合成图像进行识别,是现今急需解决的问题。
发明内容
有鉴于此,本发明提供了一种合成图像识别的网络训练方法以及合成图像识别方法,以解决如何能够准确的对合成图像进行识别的问题。
第一方面,本发明提供了一种合成图像识别的网络训练方法,方法包括:
获取第一训练数据集;第一训练数据集中包括带有训练指纹的训练合成图像以及训练指纹对应的标签信息,标签信息用于表征训练指纹对应的正确值;
将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;
将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络;
利用第一预设损失函数对初始合成图像识别网络中的初始指纹解码网络以及初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型。
本申请实施例提供的合成图像识别的网络训练方法,获取第一训练数据集;根据第一训练数据集,将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络;利用第一预设损失函数对初始合成图像识别网络中的初始指纹解码网络以及初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型。保证了得到的目标合成图像识别模型的准确性,从而实现了可以基于预设纠错网络对虚拟指纹进行纠错,保证得到的纠错后的指纹的准确性。解决了传统纠错码对指纹进行纠错不准确的问题。
在一种可选的实施方式中,第一预设损失函数包括预设指纹解码网络对应的损失函数以及预设纠错网络对应的损失函数。
本申请实施例提供的合成图像识别的网络训练方法,第一预设损失函数包括预设指纹解码网络对应的损失函数以及预设纠错网络对应的损失函数,保证了训练得到的目标合成图像识别模型的准确性。
在一种可选的实施方式中,预设指纹解码网络对应的损失函数包括:第一损失函数和第二损失函数;其中:
第一损失函数为:;
第二损失函数为:;
其中,F表示预设指纹解码网络,G(z,c)表示带有训练指纹的训练合成图像;c为训练指纹,表示预设指纹解码网络解码出的指纹,/>表示预设指纹解码网络解码出的用以生成图像的噪声;/>均为超参数。
本申请实施例提供的合成图像识别的网络训练方法,预设指纹解码网络对应的损失函数包括:第一损失函数和第二损失函数;可以保证训练得到的目标合成图像识别模型中的预设指纹解码网络的准确性。
在一种可选的实施方式中,预设纠错网络对应的损失函数包括:第三损失函数;第三损失函数根据预设指纹解码网络输出的解码指纹中各解码元素的位置以及各解码元素对应的训练指纹对应的训练元素之间的差距构成。
本申请实施例提供的合成图像识别的网络训练方法,预设纠错网络对应的损失函数包括:第三损失函数;第三损失函数根据预设指纹解码网络输出的解码指纹中各解码元素的位置以及各解码元素对应的训练指纹对应的训练元素之间的差距构成,可以保证训练得到的目标合成图像识别模型中的预设纠错网络的准确性。
在一种可选的实施方式中,第三损失函数为:
;
其中,y表示输入向量中标签标识的正确的值,x是预设纠错网络的输出值,是sigmoid函数,用来将x转化为概率值,/>表示注意力机制中,第t位数据的权重,/>表示第t位的标签真实标记,/>表示第t位的输出的概率,
为超参数。
本申请实施例提供的合成图像识别的网络训练方法,第三损失函数为:保证了训练得到的目标合成图像识别模型中的预设纠错网络的准确性。
在一种可选的实施方式中,目标合成图像识别模型中还包括预设对抗生成网络,预设对抗生成网络用于生成合成图像,方法包括:
获取第二训练数据,第二训练数据包括训练合成数据和训练合成数据对应的训练真实数据;训练合成数据包括训练指纹、训练噪声和/或训练合成图像,训练合成图像为训练噪声和训练指纹对应的指纹特征通过生成对抗网络生成的图像;训练真实数据包括训练指纹对应的正确值,以及训练噪声对应的原始图像;
根据第二训练数据,利用第二预设识别损失函数对初始生成对抗网络、初始指纹解码网络和初始纠错网络进行联合训练,得到预设生成对抗网络、预设指纹解码网络和预设纠错网络,进而得到目标合成图像识别模型。
本申请实施例提供的合成图像识别的网络训练方法,获取第二训练数据,根据第二训练数据,利用第二预设识别损失函数对初始生成对抗网络、初始指纹解码网络和初始纠错网络进行联合训练,得到预设生成对抗网络、预设指纹解码网络和预设纠错网络,进而得到目标合成图像识别模型,保证了得到的目标合成图像识别模型的准确性。
在一种可选的实施方式中,第二预设识别损失函数包括预设生成对抗网络对应的损失函数、预设指纹解码网络对应的损失函数以及预设纠错网络对应的损失函数。
本申请实施例提供的合成图像识别的网络训练方法,第二预设识别损失函数包括预设生成对抗网络对应的损失函数、预设指纹解码网络对应的损失函数以及预设纠错网络对应的损失函数,保证了得到的目标合成图像识别模型的准确性。
在一种可选的实施方式中,预设生成对抗网络包括生成器和判别器,第二预设识别损失函数为:
;
其中G表示生成器,D表示判别器,F表示预设指纹解码网络,G(z,c)表示生成器生成的生成图片,其输入为训练噪声z和训练指纹c,x表示真实图像,表示预设指纹解码网络解码出的指纹,/>表示预设指纹解码网络解码出的用以生成图像的噪声;表示判别器对生成图像的判别,/>表示判别器对真实图像的判别,c1和c2为当前训练批次的任意两个训练指纹,/>均为超参数;ECN(表示预设纠错网络的输出,/>是sigmoid函数,用来将x转化为概率值,/>表示注意力机制中,第t位数据的权重,/>表示第t位的标签真实标记,/>表示第t位的输出的概率,是超参数。
本申请实施例提供的合成图像识别的网络训练方法,第二预设识别损失函数为:
;
保证了得到的目标合成图像识别模型的准确性。
在一种可选的实施方式中,根据第二训练数据,利用第二预设识别损失函数对初始生成对抗网络、初始指纹解码网络和初始纠错网络进行联合训练,得到预设生成对抗网络、预设指纹解码网络和预设纠错网络,进而得到目标合成图像识别模型,包括:
将第二训练数据中的训练指纹与训练噪声输入至初始生成对抗网络,基于预设生成对抗网络对应的损失函数,训练初始生成对抗网络,生成预设生成对抗网络;训练指纹为对原始指纹进行编码调制得到;
将预设生成对抗网络输出的训练合成图像输入至初始指纹解码网络,基于预设指纹解码网络对应的损失函数,对初始指纹解码网络进行训练,得到预设指纹解码网络;
将预设指纹解码网络输出的待纠错指纹输入至初始纠错网络,基于预设纠错网络对应的损失函数,对初始纠错网络进行训练,得到预设纠错网络。
本申请实施例提供的合成图像识别的网络训练方法,对原始指纹进行编码并调制,生成训练指纹;将第二训练数据中的训练指纹与训练噪声输入至初始生成对抗网络,基于预设生成对抗网络对应的损失函数,训练初始生成对抗网络,生成预设生成对抗网络;将预设生成对抗网络输出的训练合成图像输入至初始指纹解码网络,基于预设指纹解码网络对应的损失函数,对初始指纹解码网络进行训练,得到预设指纹解码网络;将预设指纹解码网络输出的待纠错指纹输入至初始纠错网络,基于预设纠错网络对应的损失函数,对初始纠错网络进行训练,得到预设纠错网络,保证了得到的目标合成图像识别模型的准确性。
第二方面,本发明提供了一种合成图像识别方法,方法包括:
获取待识别图像;待识别图像中带有待识别指纹;
将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹;目标合成图像识别模型基于上述第一方面或其对应的任一实施方式的合成图像识别的网络训练方法得到;
目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹;
根据纠错指纹,确定待识别图像为合成图像。
本申请实施例提供的合成图像识别方法,获取待识别图像;将待识别图像输入至目标合成图像识别模型,将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹。从而保证了输出的待识别图像对应的待识别指纹的准确性。目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹,保证了确定的待识别指纹对应的纠错指纹的准确性。据纠错指纹,确定待识别图像为合成图像,保证了确定的待识别图像为合成图像的准确性。从而实现了准确的对合成图像进行识别。
在一种可选的实施方式中,预设纠错网络中包括编码器,一个解码器和一个数据输出层,其中,编码器包含第一特征提取层、多个第一自注意力机制层和第一前馈神经网络层;解码器包含第二特征提取层,多个第二自注意力机制层,编码器-解码器注意力机制层和第二前馈神经网络层;数据输出层由多个线性层组成。
在一种可选的实施方式中,当待识别图像中存在待识别指纹,目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹,包括:
第一特征提取层对待识别指纹进行特征提取,第一自注意力机制层基于提取的特征建立待识别指纹不同位置的元素之间的特征关系;
第一前馈神经网络层对第一自注意力机制层输出的特征关系进行映射,生成映射关系,并将映射关系输入至编码器-解码器注意力机制层;
第二特征提取层对上一时刻解码器的输出进行特征提取,各第二自注意力机制层基于第二特征提取层提取的特征建立待识别指纹不同位置之间的特征关系;
编码器-解码器注意力机制层根据第一前馈神经网络层输出的映射关系,输出不同位置的元素所包含的不同语义和上下文信息;
第二前馈神经网络层根据编码器-解码器注意力机制层输出的不同位置的元素所包含的不同语义和上下文信息,生成纠错指纹;
数据输出层输出纠错指纹。
本申请实施例提供的合成图像识别方法,第一特征提取层对待识别指纹进行特征提取,第一自注意力机制层基于提取的特征建立待识别指纹不同位置的元素之间的特征关系,保证了建立的待识别指纹不同位置的元素之间的特征关系的准确性。第一前馈神经网络层对第一自注意力机制层输出的特征关系进行映射,生成映射关系,并将映射关系输入至编码器-解码器注意力机制层,保证了生成的映射关系的准确性。第二特征提取层对上一时刻解码器的输出进行特征提取,各第二自注意力机制层基于第二特征提取层提取的特征建立待识别指纹不同位置之间的特征关系,保证了建立的待识别指纹不同位置之间的特征关系的准确性。编码器-解码器注意力机制层根据第一前馈神经网络层输出的映射关系,输出不同位置的元素所包含的不同语义和上下文信息,保证了输出的不同位置的元素所包含的不同语义和上下文信息的准确性。第二前馈神经网络层根据编码器-解码器注意力机制层输出的不同位置的元素所包含的不同语义和上下文信息,生成纠错指纹,数据输出层输出纠错指纹。保证了生成的纠错指纹的准确性。受限于编码和解码的方式和性能,传统纠错码的纠错能力有一定上限,不能处理过多的误差或者一些复杂的误差模式。而基于深度学习的方法则可以提高这一纠错上限,在数据出现较多错误的情况下,也可以对数据进行有效的恢复。举例说明:有一个原始数据为m,其通过纠错码编码后的数据是x,其在传输过程中受到噪声影响,在接收端是接收到的内容为x’。如果纠错码的纠错能力为3(即只能纠正3个或者3个以内的错误),而接收到的x’的出错位数超过3个时,此时再采用传统的纠错码进行数据纠错时,无法将x’还原为m,只能将其还原为m’,而且由于传统纠错码的局限性,还原成的m’可能和原始数据m大相径庭。但是通过本发明,经过神经网络的纠错,其还原能力可以超过纠错码的纠错局限,从而达到数据的还原。此外,由于神经网络纠错具有更多的纠错位数,因此可以应用在噪声强度较大的场景中。
在一种可选的实施方式中,获取待识别图像,包括:
获取原始指纹;
对原始指纹进行纠错码编码,生成编码指纹;
对编码指纹进行调制,生成纠错指纹;
将纠错指纹嵌入初始生成对抗网络,生成预设生成对抗网络;
利用预设生成对抗网络,生成待识别图像。
本申请实施例提供的合成图像识别方法,获取原始指纹;对原始指纹进行纠错码编码,生成编码指纹,保证了生成的编码指纹的准确性。对编码指纹进行调制,生成纠错指纹,保证了生成的纠错指纹的准确性。将纠错指纹嵌入初始生成对抗网络,生成预设生成对抗网络,保证了生成的预设生成对抗网络的准确性。利用预设生成对抗网络,生成待识别图像,从而可以实现对各个待识别图像进行溯源。
在一种可选的实施方式中,根据纠错指纹,确定待识别图像为合成图像,包括:
利用预设解调方法,对纠错指纹进行解调,得到解调后的编码指纹;
利用预设解码方法,对编码指纹进行解码,得到待识别指纹对应的原始指纹;
根据原始指纹,确定待识别图像为合成图像。
本申请实施例提供的合成图像识别方法,利用预设解调方法,对纠错指纹进行解调,得到解调后的编码指纹,保证了得到的解调后的编码指纹的准确性。利用预设解码方法,对解调指纹进行解码,得到待识别指纹对应的原始指纹,保证了得到的原始指纹的准确性。根据原始指纹,确定待识别图像为合成图像,保证了确定的待识别图像为合成图像的准确性。
在一种可选的实施方式中,根据原始指纹,确定待识别图像为合成图像,包括:
将原始指纹与预设指纹库中的预设指纹进行对比;
若原始指纹存在于预设指纹库,则确定待识别图像为合成图像。
在一种可选的实施方式中,将原始指纹与预设指纹库中的预设指纹进行对比;若原始指纹存在于预设指纹库,则确定待识别图像为合成图像,保证了确定的待识别图像为合成图像的准确性。
在一种可选的实施方式中,若原始指纹存在于预设指纹库,则确定待识别图像为合成图像之后,方法包括:
从预设指纹库中查找与原始指纹相同的目标指纹;
根据目标指纹,确定目标指纹对应的预设生成对抗网络,以对待识别图像进行追溯。
在一种可选的实施方式中,从预设指纹库中查找与原始指纹相同的目标指纹,保证了查找到的目标指纹的准确性。根据目标指纹,确定目标指纹对应的预设生成对抗网络,以对待识别图像进行追溯。
第三方面,本发明提供了一种合成图像识别的网络训练装置,装置包括:
第一获取模块,用于获取第一训练数据集;第一训练数据集中包括带有训练指纹的训练合成图像以及训练指纹对应的标签信息,标签信息用于表征训练指纹对应的正确值;
第一输入模块,用于将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;
第二输入模块,用于将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络;
训练模块,用于利用第一预设损失函数对初始合成图像识别网络中的初始指纹解码网络以及初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型。
本申请实施例提供的合成图像识别的网络训练装置,获取第一训练数据集;根据第一训练数据集,将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络;利用第一预设损失函数对初始合成图像识别网络中的初始指纹解码网络以及初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型。保证了得到的目标合成图像识别模型的准确性,从而实现了可以基于预设纠错网络对虚拟指纹进行纠错,保证得到的纠错后的指纹的准确性。解决了传统纠错码对指纹进行纠错不准确的问题。
第四方面,本发明提供了一种合成图像识别装置,装置包括:
第二获取模块,用于获取待识别图像;待识别图像中带有待识别指纹;
识别模块,用于将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹;目标合成图像识别模型基于上述第一方面或其对应的任一实施方式的合成图像识别的网络训练方法得到;
第一确定模块,用于目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹;
第二确定模块,用于根据纠错指纹,确定待识别图像为合成图像。
本申请实施例提供的合成图像识别装置,获取待识别图像;将待识别图像输入至目标合成图像识别模型,将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹。从而保证了输出的待识别图像对应的待识别指纹的准确性。目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹,保证了确定的待识别指纹对应的纠错指纹的准确性。据纠错指纹,确定待识别图像为合成图像,保证了确定的待识别图像为合成图像的准确性。从而实现了准确的对合成图像进行识别。
第五方面,本发明提供了一种电子设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的合成图像识别的网络训练方法以及上述第二方面或其对应的任一实施方式的合成图像识别方法。
第六方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的合成图像识别的网络训练方法以及上述第二方面或其对应的任一实施方式的合成图像识别方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的合成图像识别的网络训练方法的流程示意图;
图2是根据本发明实施例的合成图像识别的网络训练方法的流程示意图;
图3是根据本发明实施例的合成图像识别方法的流程示意图;
图4是根据本发明实施例的另一合成图像识别方法的流程示意图;
图5是根据本发明实施例的预设纠错网络的结构示意图;
图6是根据本发明实施例的又一合成图像识别方法的流程示意图;
图7是根据本发明实施例的合成图像识别的网络训练装置的结构框图;
图8是根据本发明实施例的合成图像识别装置的结构框图;
图9是本发明实施例的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明实施例,提供了一种合成图像识别方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
需要说明的是,本申请实施例提供的合成图像识别的方法,其执行主体可以是合成图像识别的装置,该合成图像识别的装置可以通过软件、硬件或者软硬件结合的方式实现成为电子设备的部分或者全部,其中,该电子设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
根据本发明实施例,提供了一种合成图像识别的网络训练方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
需要说明的是,本申请实施例提供的合成图像识别的网络训练的方法,其执行主体可以是合成图像识别的网络训练的装置,该合成图像识别的网络训练的装置可以通过软件、硬件或者软硬件结合的方式实现成为电子设备的部分或者全部,其中,该电子设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
在本实施例中提供了一种合成图像识别的网络训练方法,图1是根据本发明实施例的合成图像识别的网络训练方法的流程图,如图1所示,该流程包括如下步骤:
步骤S401,获取第一训练数据集。
第一训练数据集中包括带有训练指纹的训练合成图像以及训练指纹对应的标签信息,标签信息用于表征训练指纹对应的正确值。
具体地,电子设备可以接收用户输入的第一训练数据集,也可以接收其他设备发送的第一训练数据集。
本申请实施例对电子设备获取第一训练数据集的方式不做具体限定。
步骤S402,将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹。
具体地,电子设备可以将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹,然后将虚拟指纹与训练指纹进行对比。
步骤S403,将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络。
具体地,电子设备将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络,将输出结果和标签信息进行对比。
步骤S404,利用第一预设损失函数对初始合成图像识别网络中的初始指纹解码网络以及初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型。
具体地,电子设备可以基于带有训练指纹的训练合成图像,训练目标合成图像识别模型中的预设指纹解码网络,然后预设指纹解码网络输出训练指纹对应的虚拟指纹,电子设备基于虚拟指纹与训练指纹之间的差距,训练预设指纹解码网络。然后,电子设备基于训练指纹以及训练指纹对应的正确值训练预设纠错网络。
在本申请一种可选的实施方式中,第一预设损失函数包括预设指纹解码网络对应的损失函数以及预设纠错网络对应的损失函数。
预设指纹解码网络对应的损失函数包括:第一损失函数和第二损失函数;其中:
第一损失函数为:;
第二损失函数为:;
其中,F表示预设指纹解码网络,G(z,c)表示带有训练指纹的训练合成图像;c为训练指纹,表示预设指纹解码网络解码出的指纹,/>表示预设指纹解码网络解码出的用以生成图像的噪声;/>均为超参数。
预设纠错网络对应的损失函数包括:第三损失函数;第三损失函数根据预设指纹解码网络输出的解码指纹中各解码元素的位置以及各解码元素对应的训练指纹对应的训练元素之间的差距构成。
第三损失函数为:
其中,y表示输入向量中标签标识的正确的值,x是预设纠错网络的输出值,是sigmoid函数,用来将x转化为概率值,/>表示注意力机制中,第t位数据的权重,/>表示第t位的标签真实标记,/>表示第t位的输出的概率,
为超参数。其中,/>为超参数。
本申请实施例提供的合成图像识别的网络训练方法,获取第一训练数据集;根据第一训练数据集,将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络;利用第一预设损失函数对初始合成图像识别网络中的初始指纹解码网络以及初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型。保证了得到的目标合成图像识别模型的准确性,从而实现了可以基于预设纠错网络对虚拟指纹进行纠错,保证得到的纠错后的指纹的准确性。解决了传统纠错码对指纹进行纠错不准确的问题。
其中,第一预设损失函数包括预设指纹解码网络对应的损失函数以及预设纠错网络对应的损失函数,保证了训练得到的目标合成图像识别模型的准确性。预设指纹解码网络对应的损失函数包括:第一损失函数和第二损失函数;可以保证训练得到的目标合成图像识别模型中的预设指纹解码网络的准确性。预设纠错网络对应的损失函数包括:第三损失函数;第三损失函数根据预设指纹解码网络输出的解码指纹中各解码元素的位置以及各解码元素对应的训练指纹对应的训练元素之间的差距构成,可以保证训练得到的目标合成图像识别模型中的预设纠错网络的准确性。
在本申请一种可选的实施方式中,目标合成图像识别模型中还包括预设生成对抗网络,预设生成对抗网络用于生成合成图像,生成对抗网络和预设指纹解码网络以及预设纠错网络可拆分,预设生成对抗网络的数量可以是一个也可以多个,如图2所示,合成图像识别的网络训练方法包括:
步骤501,获取第二训练数据。
第二训练数据包括训练合成数据和训练合成数据对应的训练真实数据;训练合成数据包括训练指纹、训练噪声和/或训练合成图像,训练合成图像为训练噪声和训练指纹对应的指纹特征通过生成对抗网络生成的图像;训练真实数据包括训练指纹对应的正确值。
具体地,电子设备可以接收用户输入的第二训练数据,也可以接收其他设备发送的第二训练数据。
本申请实施例对电子设备获取第二训练数据的方式不做具体限定。
步骤502,根据第二训练数据,利用第二预设识别损失函数对初始生成对抗网络、初始指纹解码网络和初始纠错网络进行联合训练,得到预设生成对抗网络、预设指纹解码网络和预设纠错网络,进而得到目标合成图像识别模型。
其中,第二预设识别损失函数包括预设生成对抗网络对应的损失函数、预设指纹解码网络对应的损失函数以及预设纠错网络对应的损失函数。
预设生成对抗网络包括生成器和判别器,第二预设识别损失函数为:
其中,G表示生成器,D表示判别器,F表示预设指纹解码网络,G(z,c)表示生成器生成的生成图片,其输入为训练噪声z和训练指纹c,x表示真实图像,表示预设指纹解码网络解码出的指纹,/>表示预设指纹解码网络解码出的用以生成图像的噪声;表示判别器对生成图像的判别,/>表示判别器对真实图像的判别,c1和c2为当前训练批次的任意两个训练指纹,/>均为超参数;ECN(表示预设纠错网络的输出,/>是sigmoid函数,用来将x转化为概率值,/>表示注意力机制中,第t位数据的权重,/>表示第t位的标签真实标记,/>表示第t位的输出的概率,是超参数。
具体地,上述步骤502,包括:
步骤5021,将第二训练数据中的训练指纹与训练噪声输入至初始生成对抗网络,基于预设生成对抗网络对应的损失函数,训练初始生成对抗网络,生成预设生成对抗网络。
其中,训练指纹可以为对原始指纹进行编码调制得到。
步骤5022,将预设生成对抗网络输出的训练合成图像输入至初始指纹解码网络,基于预设指纹解码网络对应的损失函数,对初始指纹解码网络进行训练,得到预设指纹解码网络。
步骤5023,将预设指纹解码网络输出的待纠错指纹输入至初始纠错网络,基于预设纠错网络对应的损失函数,对初始纠错网络进行训练,得到预设纠错网络。
具体地,电子设备可以将训练噪声和训练指纹输入至初始生成对抗网络的生成器中,得到生成器输出的生成图像;利用第二预设识别损失函数中的第一部分和第二部分对生成器进行约束。其中,第二预设识别损失函数中的第一部分衡量生成器生成的生成图像与真实图像之间的差距。第二预设识别损失函数中的第二部分也是生成器的损失函数,表示同一噪声,不同指纹作为输入时,生成图像的距离,以此约束生成器,使其在同一噪声不同指纹的情况下,生成的生成图像保持一致。
将生成图像和真实图像输入至生成对抗网络的判别器中,利用判别器判断生成图像的真假,并将判别结果反馈给生成器。其中,第二预设识别损失函数中的第三部分是判别器的损失函数,为了约束判别器对真实数据和虚假数据的分类,其作用是使判别器能够正确的区分真实图像和合成图像;第二预设识别损失函数中的第四部分也是判别器的损失函数,其作用是由同一噪声不同指纹生成的生成图像,判别器应该有相同的判别度。
将预设生成对抗网络输出的训练合成图像输入至初始指纹解码网络,基于预设指纹解码网络对应的损失函数,即第二识别损失函数中的第五部分和第六部分,对初始指纹解码网络进行训练,得到预设指纹解码网络。其中,第二识别损失函数中的第五部分是预设指纹解码网络损失函数,用以约束预设指纹解码网络,其作用是使预设指纹解码网络的输出纠错指纹与图像中嵌入的纠错指纹保持一致;第六部分也是预设指纹解码网络的损失函数,用以约束预设指纹解码网络,其作用是让预设指纹解码网络解码出的用以生成图像的噪声与生成器生成图像时的噪声保持一致,此损失函数可以从另一个维度来约束指纹预设指纹解码网络的准确度。
然后,将预设指纹解码网络输出的待纠错指纹输入至初始纠错网络,基于预设纠错网络对应的损失函数,即第二识别损失函数中的第七部分和第八部分,对初始纠错网络进行训练,得到预设纠错网络。其中,第二识别损失函数中的第七部分和第八部分根据预设指纹解码网络输出的解码指纹中各解码元素的位置以及各解码元素对应的训练指纹对应的训练元素之间的差距构成。
本申请实施例提供的合成图像识别的网络训练方法,获取第二训练数据,将第二训练数据中的训练指纹与训练噪声输入至初始生成对抗网络,基于预设生成对抗网络对应的损失函数,训练初始生成对抗网络,生成预设生成对抗网络;将预设生成对抗网络输出的训练合成图像输入至初始指纹解码网络,基于预设指纹解码网络对应的损失函数,对初始指纹解码网络进行训练,得到预设指纹解码网络;将预设指纹解码网络输出的待纠错指纹输入至初始纠错网络,基于预设纠错网络对应的损失函数,对初始纠错网络进行训练,得到预设纠错网络,保证了得到的目标合成图像识别模型的准确性。
根据本发明实施例,提供了一种合成图像识别方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
需要说明的是,本申请实施例提供的合成图像识别的方法,其执行主体可以是合成图像识别的装置,该合成图像识别的装置可以通过软件、硬件或者软硬件结合的方式实现成为电子设备的部分或者全部,其中,该电子设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
在本实施例中提供了一种合成图像识别方法,图3是根据本发明实施例的合成图像识别方法的流程图,如图3所示,该流程包括如下步骤:
步骤S101,获取待识别图像。
其中,待识别图像中带有待识别指纹,待识别图像可以为需要检测真伪情况的图像;也就是说,本实施例中处理器可以对待识别图像的真伪情况进行检测识别,以识别待识别图像是否为生成对抗网络(GAN)合成的图像(即合成图像)。
可选的,电子设备可以接收用户输入的待识别图像,也可以接收其他设备发送的待识别图像。
可选的,电子设备还可以基于目标合成图像识别模型中的预设生成对抗网络生成待识别图像,其中,本申请实施对目标合成图像识别模型中的预设生成对抗网络生成的待识别图像进行识别,从而便于对待识别图像进行溯源。其中,目标合成图像识别模型中的可以包括多个预设生成对抗网络。
本申请实施例对电子设备获取待识别图像的方式不做具体限定。
关于该步骤将在下文进行详细介绍。
步骤S102,将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹。
其中,目标合成图像识别模型基于上述实施方式中的任一项的合成图像识别的网络训练方法得到。
具体地,电子设备可以将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹。
其中,本实施例中的预设指纹解码网络的输入可以为待识别图像,如真实图像或合成图像;预设指纹解码网络的输出可以包括解码得到的指纹信息(即纠错指纹对应的信息)。例如,预设指纹解码网络输出的图像解码结果可以仅包括纠错指纹对应的信息,也可以包括纠错指纹对应的信息和利用GAN生成合成图像时的噪声信息(即图像噪声信息)对应的解码结果(即图像噪声解码信息),即预设指纹解码网络可以用于还原GAN生成合成图像时嵌入的指纹信息(或嵌入的指纹特征对应的指纹信息)和所用的噪声信息。本实施例对此不做任何限制。
需要说明的是,本实施例中的图像解码结果中的纠错指纹对应的信息可以为数字序列,例如预设指纹长度的数字序列(如0/1序列)。对于本实施例中处理器利用预设指纹解码网络,对待识别图像进行解码,得到图像解码结果的具体方式,即预设指纹解码网络的具体结构,可以由设计人员根据使用场景和用户需求自行设置,如预设指纹解码网络可以包括一系列的卷积层、激活函数和全连接层;例如,预设指纹解码网络可以包括解码卷积层、解码激活函数、解码全连接层和解码归一化层,本步骤中电子设备可以利用解码卷积层和解码激活函数,对待识别图像进行特征提取,得到解码提取特征;利用解码全连接层对解码提取特征进行映射,得到解码输出特征;其中,解码输出特征包括解码指纹特征和解码噪声特征,解码提取特征的维度为解码指纹特征与解码噪声特征的维度之和;利用解码归一化层,对解码指纹特征进行归一化,得到 纠错指纹对应的信息;其中,纠错指纹对应的信息为0和1组成的数字序列,即预设指纹信息同样为0和1组成的数字序列。
举例来说,待识别图像的分辨率是128×128×3,噪声特征的维度为512,指纹特征的维度为50的情况下,本步骤中处理器可以先对输入的待识别图像进行逐级下采样,如通过一个卷积层(即解码卷积层)对待识别图像进行特征提取,该卷积层通道数可以为32,卷积核大小可以为3×3,步长为1,且采用一个激活函数(即解码激活函数,如渗漏整流线性单元,leaky ReLU),接着通过一个下采样层对提取到的特征进行下采样,该下采样层使用了2×2的最大池化操作,将特征图的宽和高分辨率降低至原来的一半,持续上述操作,直至将特征图提取为8×8的特征图,然后通过多个卷积层(即解码卷积层)对特征图进行特征提取,得到解码提取特征;之后通过1个全连接层(即解码全连接层)输出维度为562的特征(即解码输出特征),其中512维为GAN的输入噪声(即图像噪声解码信息),50维为指纹特征(即解码指纹特征);最后将指纹特征通过解码归一化层(如归一化指数函数,softmax函数),得到0/1表达形式的纠错指纹对应的信息。
步骤S103,目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹。
具体地,目标合成图像识别模型中的预设纠错网络中的预设指纹解码网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹。
其中,预设指纹解码网络可以为对输入的图像(即待识别图像)进行解码的软件装置。预设指纹解码网络可以用于对待识别图像进行解码,得到待识别图像对应的待识别指纹的解码结果(即指纠错指纹)。
步骤S104,根据纠错指纹,确定待识别图像为合成图像。
具体地,电子设备可以根据纠错网络生成的过程,对纠错网络进行预设处于,确定纠错网络对应的原始指纹,根据原始指纹,确定待识别图像为合成图像。
关于该步骤将在下文进行详细介绍。
本申请实施例提供的合成图像识别方法,获取待识别图像;将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹,保证了输出的待识别图像中的待识别指纹的准确性。目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹,保证了确定的待识别指纹对应的纠错指纹的准确性。据纠错指纹,确定待识别图像为合成图像,保证了确定的待识别图像为合成图像的准确性。从而实现了准确的对合成图像进行识别。
在本实施例中提供了一种合成图像识别方法,图4是根据本发明实施例的合成图像识别方法的流程图,如图4所示,该流程包括如下步骤:
步骤S201,获取待识别图像。
关于该请参见图3对步骤S101的介绍,在此不进行赘述。
步骤S202,将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹。
关于该请参见图3对步骤S102的介绍,在此不进行赘述。
步骤S203,目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹。
具体地,预设纠错网络中包括编码器,一个解码器和一个数据输出层,其中,编码器包含第一特征提取层、多个第一自注意力机制层和第一前馈神经网络层;解码器包含第二特征提取层,多个第二自注意力机制层,编码器-解码器注意力机制层和第二前馈神经网络层;数据输出层由多个线性层组成。
上述步骤S203,可以包括如下步骤:
步骤S2031,第一特征提取层对待识别指纹进行特征提取,第一自注意力机制层基于提取的特征建立待识别指纹不同位置的元素之间的特征关系。
步骤S2032,第一前馈神经网络层对第一自注意力机制层输出的特征关系进行映射,生成映射关系,并将映射关系输入至编码器-解码器注意力机制层。
步骤S2033,第二特征提取层对上一时刻解码器的输出进行特征提取,各第二自注意力机制层基于第二特征提取层提取的特征建立待识别指纹不同位置之间的特征关系。
步骤S2034,编码器-解码器注意力机制层根据第一前馈神经网络层输出的映射关系,输出不同位置的元素所包含的不同语义和上下文信息。
步骤S2035,第二前馈神经网络层根据编码器-解码器注意力机制层输出的不同位置的元素所包含的不同语义和上下文信息,生成纠错指纹。
步骤S2036,数据输出层输出纠错指纹。
具体地,请参见图5,图5为预设纠错网络的结构示意图。预设纠错网络中编码器中的第一特征提取层对待识别指纹进行特征提取,第一自注意力机制层基于提取的特征建立待识别指纹不同位置的元素之间的特征关系,帮助预设纠错网络理解输入序列的内部结构。
第一前馈神经网络层对第一自注意力机制层输出的特征关系进行映射,生成映射关系,有助于编码器更好地捕捉输入序列的语义信息。并将映射关系输入至编码器-解码器注意力机制层。
第二特征提取层对上一时刻解码器的输出进行特征提取,各第二自注意力机制层基于第二特征提取层提取的特征建立待识别指纹不同位置之间的特征关系,帮助解码器生成正确的顺序。
编码器-解码器注意力机制层根据第一前馈神经网络层输出的映射关系,输出不同位置的元素所包含的不同语义和上下文信息。
第二前馈神经网络层根据编码器-解码器注意力机制层输出的不同位置的元素所包含的不同语义和上下文信息,帮助解码器进一步处理信息和生成输出,生成纠错指纹。数据输出层由多个线性层组成,输出最终的结果,即纠错指纹。
步骤S204,根据纠错指纹,确定待识别图像为合成图像。
关于该步骤请参见图3对步骤S104的介绍,在此不进行赘述。
本申请实施例提供的合成图像识别方法,将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹。从而保证了输出的待识别图像对应的待识别指纹的准确性。预设纠错网络中包括编码器,一个解码器和一个数据输出层,其中,编码器包含第一特征提取层、多个第一自注意力机制层和第一前馈神经网络层;解码器包含第二特征提取层,多个第二自注意力机制层,编码器-解码器注意力机制层和第二前馈神经网络层;数据输出层由多个线性层组成。第一特征提取层对待识别指纹进行特征提取,第一自注意力机制层基于提取的特征建立待识别指纹不同位置的元素之间的特征关系,保证了建立的待识别指纹不同位置的元素之间的特征关系的准确性。第一前馈神经网络层对第一自注意力机制层输出的特征关系进行映射,生成映射关系,并将映射关系输入至编码器-解码器注意力机制层,保证了生成的映射关系的准确性。第二特征提取层对上一时刻解码器的输出进行特征提取,各第二自注意力机制层基于第二特征提取层提取的特征建立待识别指纹不同位置之间的特征关系,保证了建立的待识别指纹不同位置之间的特征关系的准确性。编码器-解码器注意力机制层根据第一前馈神经网络层输出的映射关系,输出不同位置的元素所包含的不同语义和上下文信息,保证了输出的不同位置的元素所包含的不同语义和上下文信息的准确性。第二前馈神经网络层根据编码器-解码器注意力机制层输出的不同位置的元素所包含的不同语义和上下文信息,生成纠错指纹,数据输出层输出纠错指纹。保证了生成的纠错指纹的准确性。
受限于编码和解码的方式和性能,传统纠错码的纠错能力有一定上限,不能处理过多的误差或者一些复杂的误差模式。而基于深度学习的方法则可以提高这一纠错上限,在数据出现较多错误的情况下,也可以对数据进行有效的恢复。举例说明:有一个原始数据为m,其通过纠错码编码后的数据是x,其在传输过程中受到噪声影响,在接收端是接收到的内容为x’。如果纠错码的纠错能力为3(即只能纠正3个或者3个以内的错误),而接收到的x’的出错位数超过3个时,此时再采用传统的纠错码进行数据纠错时,无法将x’还原为m,只能将其还原为m’,而且由于传统纠错码的局限性,还原成的m’可能和原始数据m大相径庭。但是通过本发明,经过神经网络的纠错,其还原能力可以超过纠错码的纠错局限,从而达到数据的还原。此外,由于神经网络纠错具有更多的纠错位数,因此可以应用在噪声强度较大的场景中。
在本实施例中提供了一种合成图像识别方法,图6是根据本发明实施例的合成图像识别方法的流程图,如图6所示,该流程包括如下步骤:
步骤S301,获取待识别图像。
具体地,上述步骤S301,可以包括如下步骤:
步骤S3011,获取原始指纹。
其中,原始指纹可以是预设指纹长度的0和1组成的数字序列(即0/1序列)。
具体地,电子设备可以接收用户输入的原始指纹,也可以接收其他设备发送的原始指纹,电子设备还可以随机生成原始指纹。
本申请实施例对电子设备获取原始指纹的方式不做具体限定。
步骤S3012,对原始指纹进行纠错码编码,生成编码指纹。
具体地,电子设备可以利用预设纠错码编码方式对原始指纹进行纠错码编码,生成编码指纹。
其中,预设纠错码编码方式可以是自动请求重发 (ARQ)、前向纠错 (FEC)和混合纠错 (HEC)方式中的任意一种,本申请实施例对预设纠错码编码方式不做具体限定。
示例性的,电子设备可以利用BCH纠错码编码方式,对采用0,1组成的长度为k的序列组成的原始指纹进行编码,使其本身具有纠错能力,编码后的指纹长度变为n,记录为BCH(n,k)。
步骤S3013,对编码指纹进行调制,生成纠错指纹。
具体地,电子设备可以利用预设调制方法,对编码指纹进行调制,生成纠错指纹。
示例性的,本发明采取的调制方式为:对于每个比特数据,如果数据为0,则相位角度不变,数据变为1。如果数据为1,则调制后相位转移180度,变为数值变为-1。调制后的指纹信息记为x,此调制方法是为了能够提高纠错指纹的抗噪声能力,后续对纠错指纹进行检错和纠错时,可以根据最接近的相位值来恢复原始数据,减小了误码率。
其中,预设调制方法可以根据实际情况进行设定。
步骤S3014,将纠错指纹嵌入初始生成对抗网络,生成预设生成对抗网络。
具体地,电子设备将纠错指纹作为初始生成对抗网络的输入的一部分,进行网络的训练,生成预设生成对抗网络。使得预设生成对抗网络后续生成的图像,都包含隐写纠错指纹,
步骤S3015,利用预设生成对抗网络,生成待识别图像。
具体地,电子设备可以利用预设生成对抗网络,生成待识别图像。
其中,需要说明的是,预设生成对抗网络可以是目标合成图像识别模型中的一部分。预设生成对抗网络生成的待识别图像,可以输入至目标合成图像识别模型中的预设指纹解码网络,预设指纹解码网络对待识别图像进行识别,输出待识别图像中的待识别指纹。
步骤S302,将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹。
关于该步骤请参加图4对步骤S202的介绍,在此不进行赘述。
步骤S303,目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹。
关于该步骤请参加图4对步骤S203的介绍,在此不进行赘述。
步骤S304,根据纠错指纹,确定待识别图像为合成图像。
具体得,上述步骤S304,可以包括如下步骤:
步骤S3041,利用预设解调方法,对纠错指纹进行解调,得到解调后的编码指纹。
其中,预设解调方法可以是根据编码指纹生成纠错指纹所利用的预设调方式相反的解调方式。
具体地,电子设备可以利用预设解调方法,对纠错指纹进行解调,得到解调后的编码指纹。
示例性的,电子设备可以利用BPSK解调方法对纠错指纹进行解调,得到解调后的编码指纹。
示例性的,假设本发明采取的调制方式为:对于每个比特数据,如果数据为0,则相位角度不变,数据变为1。如果数据为1,则调制后相位转移180度,变为数值变为-1。则电子设备将纠错指纹中的-1调制后相位转移180度,变为1;纠错指纹中的1调制后相位角度不变,变为0。
步骤S3042,利用预设解码方法,对编码指纹进行解码,得到待识别指纹对应的原始指纹。
其中,预设解码方式可以是与原始指纹生成编码指纹的编码方式相反的解码方式。
具体地,电子设备可以利用预设解码方法,对编码指纹进行解码,得到待识别指纹对应的原始指纹。
示例性的,当电子设备利用BCH纠错码编码方式对原始指纹进行编码生成编码指纹后,电子设备可以利用BCH解码方式对编码指纹进行解码,得到待识别指纹对应的原始指纹。
步骤S3043,根据原始指纹,确定待识别图像为合成图像。
具体地,上述步骤S3043,可以包括如下步骤:
步骤a1,将原始指纹与预设指纹库中的预设指纹进行对比。
具体地,电子设备可以接收用户输入的预设指纹库,也可以接收其他设备发送的预设指纹库,电子设备还可以根据自身对原始指纹的积累,生成预设指纹库。
本申请实施例对电子设备获取预设指纹库的方式不做具体限定。
在获取到预设指纹库之后,电子设备可以将原始指纹与预设指纹库中的预设指纹进行对比。
步骤a2,若原始指纹存在于预设指纹库,则确定待识别图像为合成图像。
具体地,若原始指纹存在于预设指纹库,则确定待识别图像为合成图像。
在本申请一种可选的实施方式中,若原始指纹存在于预设指纹库,则确定待识别图像为合成图像之后,上述方法还可以包括如下步骤:
步骤b1,从预设指纹库中查找与原始指纹相同的目标指纹。
具体地,电子设备可以从预设指纹库中查找与原始指纹相同的目标指纹。
步骤b2,根据目标指纹,确定目标指纹对应的预设生成对抗网络,以对待识别图像进行追溯。
具体地,电子设备可以根据目标指纹,确定目标指纹对应的预设生成对抗网络,以对待识别图像进行追溯。
本申请实施例提供的合成图像识别方法,获取原始指纹;对原始指纹进行纠错码编码,生成编码指纹,保证了生成的编码指纹的准确性。对编码指纹进行调制,生成纠错指纹,保证了生成的纠错指纹的准确性。将纠错指纹嵌入初始生成对抗网络,生成预设生成对抗网络,保证了生成的预设生成对抗网络的准确性。利用预设生成对抗网络,生成待识别图像,从而可以实现对各个待识别图像进行溯源。
然后,利用预设解调方法,对纠错指纹进行解调,得到解调后的编码指纹,保证了得到的解调后的编码指纹的准确性。利用预设解码方法,对解调指纹进行解码,得到待识别指纹对应的原始指纹,保证了得到的原始指纹的准确性。将原始指纹与预设指纹库中的预设指纹进行对比;若原始指纹存在于预设指纹库,则确定待识别图像为合成图像,保证了确定的待识别图像为合成图像的准确性。若原始指纹存在于预设指纹库,则确定待识别图像为合成图像之后,从预设指纹库中查找与原始指纹相同的目标指纹,保证了查找到的目标指纹的准确性。根据目标指纹,确定目标指纹对应的预设生成对抗网络,以对待识别图像进行追溯。
本申请实施例,将纠错指纹信息作为生成对抗网络的输入的一部分,使预设生成对抗网络生成的合成图像能够包含纠错指纹信息对应的内容,从而能够利用待识别图像解码纠错后得到原始指纹信息和预设指纹库,识别待识别图像的真伪情况,实现对生成对抗网络生成的合成图像的准确识别;并且通过利用预设纠错网络,对指纹解码信息进行纠错,得到指纹纠正信息,能够对待识别图像解码后得到的指纹信息进行纠错,得到纠正后准确的指纹信息,从而提高合成图像的识别准确性。
本实施例提供一种合成图像识别的网络训练装置,如图7所示,装置包括:
第一获取模块601,用于获取第一训练数据集;第一训练数据集中包括带有训练指纹的训练合成图像以及训练指纹对应的标签信息,标签信息用于表征训练指纹对应的正确值;
第一输入模块602,用于将训练指纹和训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;
第二输入模块603,用于将虚拟指纹和标签信息输入至初始合成图像识别网络中的初始纠错网络;
训练模块604,用于利用第一预设损失函数对初始合成图像识别网络中的初始指纹解码网络以及初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型。
在本实施例中还提供了一种合成图像识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种合成图像识别装置,如图8所示,包括:
第二获取模块701,用于获取待识别图像;待识别图像中带有待识别指纹;
识别模块702,用于将待识别图像输入至目标合成图像识别模型,目标合成图像识别模型中的预设指纹解码网络对待识别图像进行特征提取,基于提取的特征,输出待识别图像对应的待识别指纹;目标合成图像识别模型基于上述实施方式中的任一项的合成图像识别的网络训练方法得到;
第一确定模块703,用于目标合成图像识别模型中的预设纠错网络对待识别指纹进行纠错,确定待识别指纹对应的纠错指纹;
第二确定模块704,用于根据纠错指纹,确定待识别图像为合成图像。
本实施例中的合成图像识别装置以及合成图像识别的网络训练装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本发明实施例还提供一种电子设备,具有上述图7所示的合成图像识别的网络训练装置以及图8所示的合成图像识别装置。
请参阅图9,图9是本发明可选实施例提供的一种电子设备的结构示意图,如图9所示,该电子设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,存储器20存储有可由至少一个处理器10执行的指令,以使至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据一种小程序落地页的展现的电子设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该电子设备还包括输入装置30和输出装置40。处理器10、存储器20、输入装置30和输出装置40可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置30可接收输入的数字或字符信息,以及产生与该电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等。输出装置40可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。上述显示设备包括但不限于液晶显示器,发光二极管,显示器和等离子体显示器。在一些可选的实施方式中,显示设备可以是触摸屏。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (17)
1.一种合成图像识别的网络训练方法,其特征在于,所述方法包括:
获取第一训练数据集;所述第一训练数据集中包括带有训练指纹的训练合成图像以及所述训练指纹对应的标签信息,所述标签信息用于表征所述训练指纹对应的正确值;
将所述训练指纹和所述训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;
将所述虚拟指纹和所述标签信息输入至所述初始合成图像识别网络中的初始纠错网络;
利用第一预设损失函数对所述初始合成图像识别网络中的所述初始指纹解码网络以及所述初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型;
其中,所述第一预设损失函数包括所述预设指纹解码网络对应的损失函数以及所述预设纠错网络对应的损失函数;
其中,所述预设指纹解码网络对应的损失函数包括:第一损失函数和第二损失函数;其中:
所述第一损失函数为:;
所述第二损失函数为:;
其中,F表示所述预设指纹解码网络,G(z,c)表示所述带有训练指纹的训练合成图像;c为所述训练指纹,表示所述预设指纹解码网络解码出的指纹,/>表示所述预设指纹解码网络解码出的用以生成图像的噪声;/>均为超参数;
其中,所述目标合成图像识别模型中还包括预设生成对抗网络,所述预设生成对抗网络用于生成合成图像,所述生成对抗网络和所述预设指纹解码网络以及所述预设纠错网络可拆分,所述方法包括:
获取第二训练数据,所述第二训练数据包括训练合成数据和所述训练合成数据对应的训练真实数据;所述训练合成数据包括训练指纹、训练噪声和/或训练合成图像,所述训练合成图像为所述训练噪声和所述训练指纹对应的指纹特征通过生成对抗网络生成的图像;所述训练真实数据包括所述训练指纹对应的正确值;
根据所述第二训练数据,利用第二预设识别损失函数对初始生成对抗网络、初始指纹解码网络和初始纠错网络进行联合训练,得到所述预设生成对抗网络、所述预设指纹解码网络和所述预设纠错网络,进而得到所述目标合成图像识别模型。
2.根据权利要求1所述的方法,其特征在于,所述预设纠错网络对应的损失函数包括:第三损失函数;所述第三损失函数根据所述预设指纹解码网络输出的解码指纹中各解码元素的位置以及各所述解码元素对应的所述训练指纹对应的训练元素之间的差距构成。
3.根据权利要求2所述的方法,其特征在于,所述第三损失函数为:
;
其中,y表示输入向量中标签标识的正确的值,x是所述预设纠错网络的输出值,是sigmoid函数,用来将x转化为概率值,/>表示注意力机制中,第t位数据的权重,/>表示第t位的标签真实标记,/>表示第t位的输出的概率,
为超参数。
4.根据权利要求1所述的方法,其特征在于,所述第二预设识别损失函数包括所述预设生成对抗网络对应的损失函数、所述预设指纹解码网络对应的损失函数以及所述预设纠错网络对应的损失函数。
5.根据权利要求4所述的方法,其特征在于,所述预设生成对抗网络包括生成器和判别器,所述第二预设识别损失函数为:
;
其中G表示所述生成器,D表示所述判别器,F表示所述预设指纹解码网络,G(z,c)表示所述生成器生成的生成图片,其输入为所训练噪声z和所述训练指纹c,x表示真实图像,表示所述预设指纹解码网络解码出的指纹,/>表示所述预设指纹解码网络解码出的用以生成图像的噪声;/>表示所述判别器对所述生成图像的判别,/>表示所述判别器对所述真实图像的判别,c1和c2为当前训练批次的任意两个训练指纹,均为超参数;ECN表示所述预设纠错网络的输出,是sigmoid函数,用来将x转化为概率值,/>表示注意力机制中,第t位数据的权重,表示第t位的标签真实标记,/>表示第t位的输出的概率,/>是超参数。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二训练数据,利用第二预设识别损失函数对初始生成对抗网络、初始指纹解码网络和初始纠错网络进行联合训练,得到所述预设生成对抗网络、所述预设指纹解码网络和所述预设纠错网络,进而得到所述目标合成图像识别模型,包括:
将所述第二训练数据中的所述训练指纹与所述训练噪声输入至所述初始生成对抗网络,基于所述预设生成对抗网络对应的损失函数,训练所述初始生成对抗网络,生成所述预设生成对抗网络;所述训练指纹为对原始指纹进行编码调制得到;
将所述预设生成对抗网络输出的所述训练合成图像输入至所述初始指纹解码网络,基于所述预设指纹解码网络对应的损失函数,对所述初始指纹解码网络进行训练,得到所述预设指纹解码网络;
将所述预设指纹解码网络输出的待纠错指纹输入至所述初始纠错网络,基于所述预设纠错网络对应的损失函数,对所述初始纠错网络进行训练,得到所述预设纠错网络。
7.一种合成图像识别方法,其特征在于,所述方法包括:
获取待识别图像;所述待识别图像中带有待识别指纹;
将所述待识别图像输入至目标合成图像识别模型,所述目标合成图像识别模型中的预设指纹解码网络对所述待识别图像进行特征提取,基于提取的特征,输出所述待识别图像对应的所述待识别指纹;所述目标合成图像识别模型基于权利要求1-6任一项所述的合成图像识别的网络训练方法得到;
所述目标合成图像识别模型中的预设纠错网络对所述待识别指纹进行纠错,确定所述待识别指纹对应的纠错指纹;
根据所述纠错指纹,确定所述待识别图像为合成图像。
8.根据权利要求7所述的方法,其特征在于,所述预设纠错网络中包括编码器,一个解码器和一个数据输出层,其中,所述编码器包含第一特征提取层、多个第一自注意力机制层和第一前馈神经网络层;所述解码器包含第二特征提取层,多个第二自注意力机制层,编码器-解码器注意力机制层和第二前馈神经网络层;所述数据输出层由多个线性层组成。
9.根据权利要求8所述的方法,其特征在于,所述目标合成图像识别模型中的预设纠错网络对所述待识别指纹进行纠错,确定所述待识别指纹对应的纠错指纹,包括:
所述第一特征提取层对所述待识别指纹进行特征提取,所述第一自注意力机制层基于提取的特征建立所述待识别指纹不同位置的元素之间的特征关系;
所述第一前馈神经网络层对所述第一自注意力机制层输出的特征关系进行映射,生成映射关系,并将所述映射关系输入至所述编码器-解码器注意力机制层;
所述第二特征提取层对上一时刻所述解码器的输出进行特征提取,各所述第二自注意力机制层基于所述第二特征提取层提取的特征建立所述待识别指纹不同位置之间的特征关系;
所述编码器-解码器注意力机制层根据所述第一前馈神经网络层输出的所述映射关系,输出不同位置的元素所包含的不同语义和上下文信息;
所述第二前馈神经网络层根据所述编码器-解码器注意力机制层输出的不同位置的元素所包含的所述不同语义和所述上下文信息,生成所述纠错指纹;
所述数据输出层输出所述纠错指纹。
10.根据权利要求7所述的方法,其特征在于,所述获取待识别图像,包括:
获取原始指纹;
对所述原始指纹进行纠错码编码,生成编码指纹;
对所述编码指纹进行调制,生成所述纠错指纹;
将所述纠错指纹嵌入初始生成对抗网络,生成预设生成对抗网络;
利用所述预设生成对抗网络,生成所述待识别图像。
11.根据权利要求10所述的方法,其特征在于,所述根据所述纠错指纹,确定所述待识别图像为合成图像,包括:
利用预设解调方法,对所述纠错指纹进行解调,得到解调后的所述编码指纹;
利用预设解码方法,对所述编码指纹进行解码,得到所述待识别指纹对应的所述原始指纹;
根据所述原始指纹,确定所述待识别图像为合成图像。
12.根据权利要求11所述的方法,其特征在于,所述根据所述原始指纹,确定所述待识别图像为合成图像,包括:
将所述原始指纹与预设指纹库中的预设指纹进行对比;
若所述原始指纹存在于所述预设指纹库,则确定所述待识别图像为合成图像。
13.根据权利要求12所述的方法,其特征在于,所述若所述原始指纹存在于所述预设指纹库,则确定所述待识别图像为合成图像之后,所述方法包括:
从所述预设指纹库中查找与所述原始指纹相同的目标指纹;
根据所述目标指纹,确定所述目标指纹对应的所述预设生成对抗网络,以对所述待识别图像进行追溯。
14.一种合成图像识别的网络训练装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一训练数据集;所述第一训练数据集中包括带有训练指纹的训练合成图像以及所述训练指纹对应的标签信息,所述标签信息用于表征所述训练指纹对应的正确值;
第一输入模块,用于将所述训练指纹和所述训练合成图像输入至初始合成图像识别网络中的初始指纹解码网络,输出虚拟指纹;
第二输入模块,用于将所述虚拟指纹和所述标签信息输入至所述初始合成图像识别网络中的初始纠错网络;
训练模块,用于利用第一预设损失函数对所述初始合成图像识别网络中的所述初始指纹解码网络以及所述初始纠错网络进行训练,得到预设指纹解码网络和预设纠错网络,生成目标合成图像识别模型;其中,所述第一预设损失函数包括所述预设指纹解码网络对应的损失函数以及所述预设纠错网络对应的损失函数;
其中,所述预设指纹解码网络对应的损失函数包括:第一损失函数和第二损失函数;其中:
所述第一损失函数为:;
所述第二损失函数为:;
其中,F表示所述预设指纹解码网络,G(z,c)表示所述带有训练指纹的训练合成图像;c为所述训练指纹,表示所述预设指纹解码网络解码出的指纹,/>表示所述预设指纹解码网络解码出的用以生成图像的噪声;/>均为超参数;
其中,所述目标合成图像识别模型中还包括预设生成对抗网络,所述预设生成对抗网络用于生成合成图像,所述生成对抗网络和所述预设指纹解码网络以及所述预设纠错网络可拆分,包括:
获取第二训练数据,所述第二训练数据包括训练合成数据和所述训练合成数据对应的训练真实数据;所述训练合成数据包括训练指纹、训练噪声和/或训练合成图像,所述训练合成图像为所述训练噪声和所述训练指纹对应的指纹特征通过生成对抗网络生成的图像;所述训练真实数据包括所述训练指纹对应的正确值;
根据所述第二训练数据,利用第二预设识别损失函数对初始生成对抗网络、初始指纹解码网络和初始纠错网络进行联合训练,得到所述预设生成对抗网络、所述预设指纹解码网络和所述预设纠错网络,进而得到所述目标合成图像识别模型。
15.一种合成图像识别装置,其特征在于,所述装置包括:
第二获取模块,用于获取待识别图像;所述待识别图像中带有待识别指纹;
识别模块,用于将所述待识别图像输入至目标合成图像识别模型,所述目标合成图像识别模型中的预设指纹解码网络对所述待识别图像进行特征提取,基于提取的特征,输出所述待识别图像对应的所述待识别指纹;所述目标合成图像识别模型基于权利要求1-6任一项所述的合成图像识别的网络训练方法得到;
第一确定模块,用于所述目标合成图像识别模型中的预设纠错网络对所述待识别指纹进行纠错,确定所述待识别指纹对应的纠错指纹;
第二确定模块,用于根据所述纠错指纹,确定所述待识别图像为合成图像。
16.一种电子设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至6中任一项所述的合成图像识别的网络训练方法以及权利要求7-13中任一项所述的合成图像识别方法。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至6中任一项所述的合成图像识别的网络训练方法以及权利要求7-13中任一项所述的合成图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410225879.3A CN117809139B (zh) | 2024-02-29 | 2024-02-29 | 合成图像识别的网络训练方法以及合成图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410225879.3A CN117809139B (zh) | 2024-02-29 | 2024-02-29 | 合成图像识别的网络训练方法以及合成图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117809139A CN117809139A (zh) | 2024-04-02 |
CN117809139B true CN117809139B (zh) | 2024-05-03 |
Family
ID=90428167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410225879.3A Active CN117809139B (zh) | 2024-02-29 | 2024-02-29 | 合成图像识别的网络训练方法以及合成图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117809139B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114358249A (zh) * | 2021-12-30 | 2022-04-15 | 浙江大华技术股份有限公司 | 目标识别模型训练、目标识别方法及装置 |
CN116822623A (zh) * | 2023-08-29 | 2023-09-29 | 苏州浪潮智能科技有限公司 | 一种生成对抗网络联合训练方法、装置、设备及存储介质 |
CN116824647A (zh) * | 2023-08-29 | 2023-09-29 | 苏州浪潮智能科技有限公司 | 图像伪造识别方法、网络训练方法、装置、设备及介质 |
-
2024
- 2024-02-29 CN CN202410225879.3A patent/CN117809139B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114358249A (zh) * | 2021-12-30 | 2022-04-15 | 浙江大华技术股份有限公司 | 目标识别模型训练、目标识别方法及装置 |
CN116822623A (zh) * | 2023-08-29 | 2023-09-29 | 苏州浪潮智能科技有限公司 | 一种生成对抗网络联合训练方法、装置、设备及存储介质 |
CN116824647A (zh) * | 2023-08-29 | 2023-09-29 | 苏州浪潮智能科技有限公司 | 图像伪造识别方法、网络训练方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117809139A (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107111782B (zh) | 神经网络结构及其方法 | |
RU2634194C1 (ru) | Верификация результатов оптического распознавания символов | |
CN111914775B (zh) | 活体检测方法、装置、电子设备及存储介质 | |
CN110008997B (zh) | 图像纹理相似度识别方法、装置及计算机可读存储介质 | |
CN109886127B (zh) | 指纹识别方法及终端设备 | |
CN112115921B (zh) | 一种真伪鉴别方法、装置以及电子设备 | |
CN111914654B (zh) | 一种文本版面分析方法、装置、设备和介质 | |
CN110765795A (zh) | 二维码识别方法、装置及电子设备 | |
CN115100659B (zh) | 文本识别方法、装置、电子设备和存储介质 | |
WO2023020176A1 (zh) | 图像识别方法和装置 | |
CN113297986A (zh) | 手写字符识别方法、装置、介质及电子设备 | |
WO2015021857A1 (en) | Method and apparatus for data processing | |
CN116824647B (zh) | 图像伪造识别方法、网络训练方法、装置、设备及介质 | |
CN110956133A (zh) | 单字符文本归一化模型训练方法、文本识别方法及装置 | |
CN117809139B (zh) | 合成图像识别的网络训练方法以及合成图像识别方法 | |
CN111931148A (zh) | 图像处理方法、装置和电子设备 | |
CN116563856A (zh) | 一种面向图片文本的命名实体识别方法、电子设备、介质 | |
Chi et al. | Handwriting Recognition Based on Resnet-18 | |
KR20220168924A (ko) | 셀프 어텐션 기반 문자 인식 방법 및 장치 | |
CN114596245A (zh) | 一种图像重构模型的生成方法和计算机设备 | |
CN113743400B (zh) | 一种基于深度学习的电子公文智能审查方法及系统 | |
CN116309274B (zh) | 图像中小目标检测方法、装置、计算机设备及存储介质 | |
CN113688803B (zh) | 公式识别方法、装置、电子设备及存储介质 | |
CN117877115A (zh) | 一种用于确定脚部触地状态的方法、装置和设备 | |
CN116484844A (zh) | 一种单据ocr识别结果纠错方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |