CN117351297A - 噪声干扰图像的识别方法、装置、处理器及电子设备 - Google Patents
噪声干扰图像的识别方法、装置、处理器及电子设备 Download PDFInfo
- Publication number
- CN117351297A CN117351297A CN202311036147.1A CN202311036147A CN117351297A CN 117351297 A CN117351297 A CN 117351297A CN 202311036147 A CN202311036147 A CN 202311036147A CN 117351297 A CN117351297 A CN 117351297A
- Authority
- CN
- China
- Prior art keywords
- sample
- target
- training
- model
- test sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 203
- 238000012360 testing method Methods 0.000 claims abstract description 160
- 238000013145 classification model Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 25
- 230000002776 aggregation Effects 0.000 claims description 20
- 238000004220 aggregation Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 18
- 230000009466 transformation Effects 0.000 description 17
- 238000003860 storage Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 5
- 230000005012 migration Effects 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008485 antagonism Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种噪声干扰图像的识别方法、装置、处理器及电子设备。涉及图像处理领域,该方法包括:在接收到目标请求的情况下,获取训练样本对应的测试样本;获取训练样本对应的第一样本标签,以及获取测试样本的第二样本标签;使用携带有第一样本标签的训练样本和携带有第二样本标签的测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,目标识别模型用于对携带有噪声干扰的目标图像进行人脸识别,得到目标图像中包括的人脸图像所属用户的目标用户类别。通过本申请,解决了相关技术中噪声干扰图像的识别准确率较低的问题。
Description
技术领域
本申请涉及图像处理领域,具体而言,涉及一种噪声干扰图像的识别方法、装置、处理器及电子设备。
背景技术
随着软硬件的不断发展,自助设备的使用得到了极大的推广。各大服务单位纷纷通过引入自助设备来扩展对客渠道,自助终端已成为对客服务的一个重要渠道。自助终端极大的提高了客户的办事效率。在自助终端上,许多业务需要采集客户的面部信息,并通过人脸识别模型识别用户身份来进行相关的安全认证。但是自助终端在做图像识别时由于环境条件影响,环境光线昏暗或者光源分布不均,导致识别的图像上带有干扰噪声,为了实现对这类图像的识别,需要使用大量的噪声干扰的图像对人脸识别模型进行训练。当前在进行模型训练时,可能存在收集到的包括噪声干扰的图像样本数量可能较小的情况,或者样本图像无法覆盖全部噪声干扰的情况,进而导致训练后的模型难以获得较好的识别精度。
针对相关技术中噪声干扰图像的识别准确率较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种噪声干扰图像的识别方法、装置、处理器及电子设备,以解决相关技术中噪声干扰图像的识别准确率较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种噪声干扰图像的识别方法。该方法包括:在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别。
可选的,所述使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对所述初始识别模型进行迭代训练,得到所述目标识别模型,包括:获取所述初始识别模型输出的第一识别结果和第二识别结果,其中,所述第一识别结果是使用所述初始识别模型对携带有所述第一样本标签的所述训练样本进行识别得到的,所述第二识别结果是使用所述初始识别模型对携带有所述第二样本标签的所述测试样本进行识别得到的;使用所述第一识别结果和所述第二识别结果构建所述初始识别模型的目标损失函数;根据所述目标损失函数对所述初始识别模型进行参数调节,得到所述目标识别模型。
可选的,所述获取所述初始识别模型输出的第一识别结果和第二识别结果,包括:分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征;对所述第一样本特征和所述第一样本标签进行外积运算,得到第一运算结果,以及对所述第二样本特征和所述第二样本标签进行外积运算,得到第二运算结果;分别将所述第一运算结果和所述第二运算结果输入至所述初始识别模型,得到所述第一运算结果对应的所述第一识别结果和所述第二运算结果对应的所述第二识别结果。
可选的,所述分别对所述训练样本和所述测试样本进行特征提取,包括:获取预训练的目标分类模型中的目标残差网络,其中,所述目标分类模型是使用标注了用户类别的样本图像对初始分类模型进行训练得到的,所述初始分类模型包括依次连接的初始残差网络和初始分类网络,所述目标分类模型包括依次连接的所述目标残差网络和目标分类网络,所述目标残差网络用于对样本进行特征提取,所述目标分类网络用于对所述目标残差网络输出的样本特征确定样本中记载的人图像所属的用户类别;使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征。
可选的,所述使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,包括:分别将所述训练样本和所述测试样本输入到所述目标残差网络,其中,所述目标残差网络包括依次连接的N级残差模块,所述N级残差模块中的每一级残差模块用于对当前级残差模块输入图像的图像维度和卷积核进行聚合变化计算。
可选的,所述获取所述测试样本的第二样本标签,包括:获取预训练的目标预测模型,其中,所述目标预测模型是使用标注了用户类别的样本图像对初始预测模型进行训练得到的;将所述测试样本输入至所述目标预测模型,得到目标预测模型输出的参考用户类别,其中,所述第二样本标签包括所述参考用户类别。
可选的,所述获取训练样本对应的测试样本,包括:获取目标生成模型,其中,所述目标生成模型用于根据接收到的噪声条件对图像添加所述噪声条件对应的噪声干扰;获取与所述目标噪声干扰对应的目标噪声条件;将所述目标噪声条件和所述训练样本输入至所述目标生成模型,得到所述测试样本。
为了实现上述目的,根据本申请的另一方面,提供了一种噪声干扰图像的识别装置。该装置包括:第一获取模块,用于在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;第二获取模块,用于获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;训练模块,用于使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别。
通过本申请,采用以下步骤:在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有目标噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别,即,通过对训练样本增加目标噪声干扰,从而获取到与训练样本对应的测试样本,实现通过对无噪声干扰的训练样本的处理得到携带有噪声干扰的测试样本,进而使用携带有的第一样本标签的训练样本和携带有第二样本标签的测试样本对初始识别模型进行迭代训练,从而提高训练后的识别模型对包含噪声干扰的图像的识别精度,进而使用训练后的目标识别模型对携带有噪声干扰的图像进行人脸识别,就能够得到更准确的识别结果,解决了相关技术中噪声干扰图像的识别准确率较低的问题。进而达到了提高噪声干扰图像的识别准确率的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的噪声干扰图像的识别方法的流程图;
图2是根据本申请实施例的一种可选的识别模型结构示意图;
图3是传统神经网络内积运算示意图;
图4是根据本申请实施例的一种可选的残差模块示意图;
图5是根据本申请实施例的一种可选的条件对抗生成网络结构示意图;
图6是根据本申请实施例的噪声干扰图像的识别装置的示意图;
图7是根据本申请实施例的一种可选的电子设备示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户人脸图像等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的噪声干扰图像的识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;
步骤S102,获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;
步骤S103,使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有目标噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别。
本申请实施例提供的噪声干扰图像的识别方法,通过对训练样本增加目标噪声干扰,从而获取到与训练样本对应的测试样本,实现通过对无噪声干扰的训练样本的处理得到携带有噪声干扰的测试样本,进而使用携带有的第一样本标签的训练样本和携带有第二样本标签的测试样本对初始识别模型进行迭代训练,从而提高训练后的识别模型对包含噪声干扰的图像的识别精度,进而使用训练后的目标识别模型对携带有噪声干扰的图像进行人脸识别,就能够得到更准确的识别结果,解决了相关技术中噪声干扰图像的识别准确率较低的问题。进而达到了提高噪声干扰图像的识别准确率的效果。
在上述步骤S101提供的实施例中,目标请求可以但不限于是根据对待识别图像的图像类型确定的,比如,当前接收到的当前待识别的图像中携带有噪声干扰,从而确定接收到目标请求。
可选地,在本实施例中,训练样本是不存在任何噪声干扰的人脸图像,测试集是对训练样本添加了噪声干扰的得到。
可选地,在本实施例中,测试样本可以但不限于是构建的条件生成对抗网络中包括的目标生成模型生成的,该条件生成对抗网络是响应目标请求为初始识别模型构建的,条件生成对抗网络中包括依次连接的目标生成模型和初始识别模型,目标生成模型用于根据输入的测试样本生成条件对训练样本进行处理,从而得到测试样本(比如,测试样本生成条件是生成携带有噪声的测试样本,则目标生成模型根据该条件对训练样本添加噪声,从而得到带有噪声的测试样本)。本申请中,构造的条件生成对抗网络用于对初始识别模型进行模型训练,通过将携带有第一样本标签的训练样本和携带有第二样本标签的测试样本输入到初始识别模型中,根据初始识别模型对训练样本和测试样本的识别结果,通过目标生成模型和初始识别模型的对抗博弈的方式,从而迭代初始训练模型,提高初始训练模型对携带有噪声干扰的图像的识别精度。
在上述步骤S102提供的实施例中,训练样本对应的第一样本标签可以是训练样本携带的真实标签,其可以是在构建训练样本是构建的。
可选的,在本申请实施例中,第二样本标签是测试样本的伪标签,由于测试样本是对训练样本经过处理(添加噪声干扰)后的样本,因此训练集携带的真实标签对测试集是不可用的,需要为测试集添加伪标签,在本申请实施例中,第二样本标签可以但不限于是使用预先训练的标签生成模型生成的,本方案对此不做限定。
在上述步骤S103提供的实施例中,在对初始识别模型进行迭代训练时样本标签的作用是辅助初始识别模型的迭代训练,样本标签和样本可以通过合并的方式一同输入到初始识别模型中,或者还可以是通过对样本和样本标签做外积运算的方式,将运算后的结果输入到初始识别模型中。
可选的,在本申请实施例中,初始识别模型可以但不限于通过对输入的样本(测试样本和训练样本)以及样本携带的样本标签判断该样本的真实性,通过捕获样本中图像特征和样本标签之间的交差方差来提高识别模型的识别率。
可选的,在本申请实施例中,识别模型可以但不限于是VGG网络模型,图2是根据本申请实施例的一种可选的识别模型结构示意图,如图2所示,使用VGG网络作为识别模型。为了提升网络性能,使用2个3*3的卷积核代替原有的5*5卷积核,使用3个3*3卷积核替换原有的7*7卷积核,增加网络的深度,提升鉴别器性能。
作为一种可选的实施例,所述使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对所述初始识别模型进行迭代训练,得到所述目标识别模型,包括:
获取所述初始识别模型输出的第一识别结果和第二识别结果,其中,所述第一识别结果是使用所述初始识别模型对携带有所述第一样本标签的所述训练样本进行识别得到的,所述第二识别结果是使用所述初始识别模型对携带有所述第二样本标签的所述测试样本进行识别得到的;
使用所述第一识别结果和所述第二识别结果构建所述初始识别模型的目标损失函数;
根据所述目标损失函数对所述初始识别模型进行参数调节,得到所述目标识别模型。
可选的,在本申请实施例中,初始识别模型输出的识别结果(第一识别结果或者第二识别结果)可以但不限于是初始识别模型对输入的样本(训练样本或者测试样本)的预测得到样本中人脸图像所属的用户类别,或者还可以是预测得到的样本中的人脸图像属于样本标签对应的用户类型的概率,本方案对此不做限定。
可选地,在本申请实施例中,输入到初始识别模型中的样本是携带有样本标签的,其可以但不限于是将样本和样本标签做外积运算得到,其计算公式如下:
其中,f表示样本(训练样本或者测试样本),g表示样本标签(第一样本标签或者第二样本标签),进而交叉上损失函数如下式:
L(·,·)是交叉熵损失函数,D表示鉴别器,G表示生成器,nS表示训练样本数据,nt表示测试样本数据,表示训练样本中包括的第i个训练样本数据,/>表示测试样本中包括的第j个测试样本数据。
作为一种可选的实施例,所述获取所述初始识别模型输出的第一识别结果和第二识别结果,包括:
分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征;
对所述第一样本特征和所述第一样本标签进行外积运算,得到第一运算结果,以及对所述第二样本特征和所述第二样本标签进行外积运算,得到第二运算结果;
分别将所述第一运算结果和所述第二运算结果输入至所述初始识别模型,得到所述第一运算结果对应的所述第一识别结果和所述第二运算结果对应的所述第二识别结果。
可选的,在本申请实施例中,特征提取可以但不限于是使用网络模型进行提取得到的,其可以但不限于是迁移预先训练得到的网络模型,其可以但不限于是卷积网络模型或者残差网络模型,本方案对此不做限定。
可选的,在本申请实施例中,外积预算可以但不限与通过如下公式实现:
其中,f表示特征信息,g表示类别信息。
作为一种可选的实施例,所述分别对所述训练样本和所述测试样本进行特征提取,包括:
获取预训练的目标分类模型中的目标残差网络,其中,所述目标分类模型是使用标注了用户类别的样本图像对初始分类模型进行训练得到的,所述初始分类模型包括依次连接的初始残差网络和初始分类网络,所述目标分类模型包括依次连接的所述目标残差网络和目标分类网络,所述目标残差网络用于对样本进行特征提取,所述目标分类网络用于对所述目标残差网络输出的样本特征确定样本中记载的人图像所属的用户类别;
使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征。
可选的,在本申请实施例中,目标残差网络中包括多级用于对特征进行提取的残差模块,通过设置多级残差模块,从而提高了对样本的特征提取深度。
作为一种可选的实施例,所述使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,包括:
分别将所述训练样本和所述测试样本输入到所述目标残差网络,其中,所述目标残差网络包括依次连接的N级残差模块,所述N级残差模块中的每一级残差模块用于对当前级残差模块输入图像的图像维度和卷积核进行聚合变化计算。
可选的,在本申请实施例中,聚合变换可以但不限于是内积运算,图3是传统神经网络内积运算示意图,神经网络中,不同的神经元之间的信息传递采用的内积的方式计算,即这种内积计算方式就是一种聚合变换计算,如图所示,X=[x1,x2,…,xC]为C维的输入向量,ωi表示第i维的权重值。首先,对于C个通道,将多维通道的输入X分解成多个一维数据元xi;然后,将由分解后的多个一维数据元进行运算,即ωixi;最后,进行聚合操作得到分解、变换后的运算结果求和,经过聚合变换得到最终结果,如下式:
基于以上聚合变换思想,将其引入到目标残差网络中,将整个网络的输入图像维度比作多通道输入向量X,网络中的卷积核比作权重ω,根据以上思想,在特征提取网络中引入聚合变换计算后的计算表达式如下式:
其中,N表示聚合变换的计算分支数量,Ti(x)表示单个通道所对应的卷积计算分支,x表示网络输入特征图像中对应的像素值框。残差学习模块在引入聚合变换操作后,其计算表示如下式:
可选的,在本申请实施例中,在每个残差模块上进行了聚合变换的优化,将整个网络的输入图像维度比作多通道输入向量X,网络中的卷积核比作权重ω,图4是根据本申请实施例的一种可选的残差模块示意图,如图4所示,以ResNet-50网络为例,共有16个残差模块,对每个残差模块都进行聚合变换操作,如图所示,对每个残差模块增加了32个聚合变换分支。在ResNet-50网络的基础上,以聚合变换的形式增加相同的网络子结构,由于结构相同,所以增加的网络子结构所使用的参数与原网络一致,不改变网络参数数量。通过增加网络的子分支结构数量,进一步增强了ResNet-50网络的特征提取能力。极大的提高了网络的特征提取能力,减少了网络的训练成本。
作为一种可选的实施例,所述获取所述测试样本的第二样本标签,包括:
获取预训练的目标预测模型,其中,所述目标预测模型是使用标注了用户类别的样本图像对初始预测模型进行训练得到的;
将所述测试样本输入至所述目标预测模型,得到目标预测模型输出的参考用户类别,其中,所述第二样本标签包括所述参考用户类别。
可选的,在本申请实施例中,目标预测模型是迁移的预训练的预测模型,目标预测模型可以但不限于是上文中的目标分类模型,即标注了用户类别的样本图像对初始分类模型(初始预测模型)进行训练得到的。
作为一种可选的实施例,所述获取训练样本对应的测试样本,包括:
获取目标生成模型,其中,所述目标生成模型用于根据接收到的噪声条件对图像添加所述噪声条件对应的噪声干扰;
获取与所述目标噪声干扰对应的目标噪声条件;
将所述目标噪声条件和所述训练样本输入至所述目标生成模型,得到所述测试样本。
可选的,在本申请实施例中,对初始识别网络的模型训练采用了条件生成对抗网络的训练逻辑,根据目标预测模型和初始识别模型构建了条件生成对抗网络,其中,目标生成模型作为条件生成对抗网络中的生成器,初始识别模型作为条件生成对抗网络中的判别器,生成器为用于根据噪声条件为判别器生成对应的测试样本,将携带有样本标签的训练样本和测试样本输入到初始识别网络中,通过将样本携带的样本标签作为输入到判别器中的条件,进而通过生成器和判别器的博弈,从而迭代判别器(初始识别网络),使得迭代后的判别器(目标识别网络)对人脸数据的判别能力得到提升,直到生成器和判别器达到纳什均衡状态后停止训练。最后,训练结束得到的判别器(目标识别网络)用于对有噪声干扰的人脸图像进行人脸识别。
在本申请实施例中,为了提高训练后的目标识别模型对包含噪声干扰的图像的识别效率,以及提高对这类模型的训练效率,本申请通过使用条件生成对抗网络的网络训练逻辑对初始识别模型进行模型训练。通过构建包括初始识别模型的条件生成对抗网络,该条件生成对抗网络中包括目标生成模型和初始识别模型,将目标生成模型作为条件生成对抗网络的生成器,在本申请实施例中,还可以通过迁移预训练的目标分类模型用于预测生成器生成的测试样本的第二样本标签,该目标分类模型包括依次连接的目标残差网络和目标分类网络,目标残差网络用于对输入图像进行特征提取,目标分类网络用于根据提取的特征进行分类,得到样本对应的样本标签,在实际使用中,可以将目标分类模型中的目标卷积网络设置在条件生成对抗网络的判别器之前,用于为输入到判别器中的图像进行进一步的特征提取,图5是根据本申请实施例的一种可选的条件对抗生成网络结构示意图,如图5所示,至少包括如下内容:
在初始识别模型之前设置有目标残差网络,用于输入到初始识别模型中的训练样本和测试样本进行特征特征识别,利用迁移学习思想,基于预训练的ResNet-50网络,引入聚合变换操作,并去掉其分类器层(目标分类网络),设计并实现基于聚合变换优化的目标残差网络。使用现有的人脸识别数据集作为训练样本,使用对训练样本添加了目标噪声干扰条件后的样本作为测试样本,同时使用预训练的保留有分类器层(目标分类网络)ResNet-50网络对测试样本进行识别,得到输出的标记作为测试样本的伪标签(第二样本标签),将样本标签信息作为条件,将目标残差网络提取到的特征与样本标签做外积运算,将运算结果作为初始识别网络的输入,通过生成器和判别器的对抗博弈,迭代判别器,使迭代得到的判别器(目标识别网络)对人脸数据的判别能力提升,直到生成器和判别器达到纳什均衡状态后停止训练。最后,训练结束得到的目标识别网络用于对有噪声干扰的人脸图像的人脸识别。
损失函数设计如下:
生成对抗网络模型损失函数如下式:
其中,L是网络优化的目标函数,G表示生成器,D分别判别器,E表示期望,x表示服从Pdata(x)分布的向量,z表示服从Pnoise(z)分布的向量。
引入类别信息作为条件,通过将特征表示与分类器预测(伪标签)之间的交叉方差作为鉴别器的输入,其计算如下式:
其中,f表示特征信息,g表示类别信息。
改进后整个网络的损失函数如下式:
其中L(·,·)是交叉熵损失函数,D表示鉴别器,G表示生成器,nS表示训练样本数据,nt表示测试样本数据,表示训练样本中第i个训练样本数据,/>表示测试样本中第j个测试样本数据。
通过上述内容:将条件生成对抗网络用于进行对包含噪声干扰的人脸图像进行人脸识别的网络模型训练,提高了训练后的网络模型对包含噪声干扰图像的人脸识别准确率。在网络训练过程中,先获取到无样本标签的测试样本的伪标签,将类别信息作为条件,进一步约束网络的分类效果。对提取到的特征信息与类别信息做外积运算,将运算结果作为判别器的输入。通过捕获特征表示与类别信息之间的交叉方差来提高判别器的识别准确率,从而提高自助终端人脸识别的准确率。
基于迁移学习思想,结合聚合变换操作,提出了基于聚合变换优化的生成器网络。传统的ResNet网络由于残差模块的引入,使网络在深度较深的情况下,没有出现梯度消失的问题,同时,网络的性能得到了极大提升。但是如果从零训练一个ResNet网络,需要大型数据集且训练时间较长。本发明针对包含噪声的人脸图像数量较少的情况,同时为了降低训练成本,基于迁移学习思想,使用预训练的ResNet网络,并在其基础上,加入聚合变换方法,提出了基于聚合变换优化的生成器网络。由于生成器和鉴别器是对抗博弈,相辅相成的训练过程,所以通过优化生成器,可以进一步提高鉴别器的性能。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种噪声干扰图像的识别装置,需要说明的是,本申请实施例的噪声干扰图像的识别装置可以用于执行本申请实施例所提供的用于噪声干扰图像的识别方法。以下对本申请实施例提供的噪声干扰图像的识别装置进行介绍。
图6是根据本申请实施例的噪声干扰图像的识别装置的示意图。如图6所示,该装置包括:第一获取模块,用于在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;第二获取模块,用于获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;训练模块,用于使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别。
可选的,所述训练模块,包括:获取单元,用于获取所述初始识别模型输出的第一识别结果和第二识别结果,其中,所述第一识别结果是使用所述初始识别模型对携带有所述第一样本标签的所述训练样本进行识别得到的,所述第二识别结果是使用所述初始识别模型对携带有所述第二样本标签的所述测试样本进行识别得到的;构建单元,用于使用所述第一识别结果和所述第二识别结果构建所述初始识别模型的目标损失函数;调节单元,用于根据所述目标损失函数对所述初始识别模型进行参数调节,得到所述目标识别模型。
可选的,所述第一获取单元,用于:分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征;对所述第一样本特征和所述第一样本标签进行外积运算,得到第一运算结果,以及对所述第二样本特征和所述第二样本标签进行外积运算,得到第二运算结果;分别将所述第一运算结果和所述第二运算结果输入至所述初始识别模型,得到所述第一运算结果对应的所述第一识别结果和所述第二运算结果对应的所述第二识别结果。
可选的,所述第一获取单元,用于:获取预训练的目标分类模型中的目标残差网络,其中,所述目标分类模型是使用标注了用户类别的样本图像对初始分类模型进行训练得到的,所述初始分类模型包括依次连接的初始残差网络和初始分类网络,所述目标分类模型包括依次连接的所述目标残差网络和目标分类网络,所述目标残差网络用于对样本进行特征提取,所述目标分类网络用于对所述目标残差网络输出的样本特征确定样本中记载的人图像所属的用户类别;使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征。
可选的,所述第一获取单元,用于:分别将所述训练样本和所述测试样本输入到所述目标残差网络,其中,所述目标残差网络包括依次连接的N级残差模块,所述N级残差模块中的每一级残差模块用于对当前级残差模块输入图像的图像维度和卷积核进行聚合变化计算。
可选的,所述第二获取模块,包括:第二获取单元,用于获取预训练的目标预测模型,其中,所述目标预测模型是使用标注了用户类别的样本图像对初始预测模型进行训练得到的;处理单元,用于将所述测试样本输入至所述目标预测模型,得到目标预测模型输出的参考用户类别,其中,所述第二样本标签包括所述参考用户类别。
可选的,所述第一获取模块,包括:第三获取单元,用于获取目标生成模型,其中,所述目标生成模型用于根据接收到的噪声条件对图像添加所述噪声条件对应的噪声干扰;第四获取单元,用于获取与所述目标噪声干扰对应的目标噪声条件;输入单元,用于将所述目标噪声条件和所述训练样本输入至所述目标生成模型,得到所述测试样本。
本申请实施例提供的噪声干扰图像的识别装置,通过对训练样本增加目标噪声干扰,从而获取到与训练样本对应的测试样本,实现通过对无噪声干扰的训练样本的处理得到携带有噪声干扰的测试样本,进而使用携带有的第一样本标签的训练样本和携带有第二样本标签的测试样本对初始识别模型进行迭代训练,从而提高训练后的识别模型对包含噪声干扰的图像的识别精度,进而使用训练后的目标识别模型对携带有噪声干扰的图像进行人脸识别,就能够得到更准确的识别结果,解决了相关技术中噪声干扰图像的识别准确率较低的问题。进而达到了提高噪声干扰图像的识别准确率的效果。
所述噪声干扰图像的识别装置包括处理器和存储器,上述模块、单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决了相关技术中噪声干扰图像的识别准确率较低的问题。进而达到了提高噪声干扰图像的识别准确率的效果。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述噪声干扰图像的识别方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述噪声干扰图像的识别方法。
图7是根据本申请实施例的一种可选的电子设备示意图,如图7所示,本发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别。
可选的,所述使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对所述初始识别模型进行迭代训练,得到所述目标识别模型,包括:获取所述初始识别模型输出的第一识别结果和第二识别结果,其中,所述第一识别结果是使用所述初始识别模型对携带有所述第一样本标签的所述训练样本进行识别得到的,所述第二识别结果是使用所述初始识别模型对携带有所述第二样本标签的所述测试样本进行识别得到的;使用所述第一识别结果和所述第二识别结果构建所述初始识别模型的目标损失函数;根据所述目标损失函数对所述初始识别模型进行参数调节,得到所述目标识别模型。
可选的,所述获取所述初始识别模型输出的第一识别结果和第二识别结果,包括:分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征;对所述第一样本特征和所述第一样本标签进行外积运算,得到第一运算结果,以及对所述第二样本特征和所述第二样本标签进行外积运算,得到第二运算结果;分别将所述第一运算结果和所述第二运算结果输入至所述初始识别模型,得到所述第一运算结果对应的所述第一识别结果和所述第二运算结果对应的所述第二识别结果。
可选的,所述分别对所述训练样本和所述测试样本进行特征提取,包括:获取预训练的目标分类模型中的目标残差网络,其中,所述目标分类模型是使用标注了用户类别的样本图像对初始分类模型进行训练得到的,所述初始分类模型包括依次连接的初始残差网络和初始分类网络,所述目标分类模型包括依次连接的所述目标残差网络和目标分类网络,所述目标残差网络用于对样本进行特征提取,所述目标分类网络用于对所述目标残差网络输出的样本特征确定样本中记载的人图像所属的用户类别;使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征。
可选的,所述使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,包括:分别将所述训练样本和所述测试样本输入到所述目标残差网络,其中,所述目标残差网络包括依次连接的N级残差模块,所述N级残差模块中的每一级残差模块用于对当前级残差模块输入图像的图像维度和卷积核进行聚合变化计算。
可选的,所述获取所述测试样本的第二样本标签,包括:获取预训练的目标预测模型,其中,所述目标预测模型是使用标注了用户类别的样本图像对初始预测模型进行训练得到的;将所述测试样本输入至所述目标预测模型,得到目标预测模型输出的参考用户类别,其中,所述第二样本标签包括所述参考用户类别。
可选的,所述获取训练样本对应的测试样本,包括:获取目标生成模型,其中,所述目标生成模型用于根据接收到的噪声条件对图像添加所述噪声条件对应的噪声干扰;获取与所述目标噪声干扰对应的目标噪声条件;将所述目标噪声条件和所述训练样本输入至所述目标生成模型,得到所述测试样本。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别。
可选的,所述使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对所述初始识别模型进行迭代训练,得到所述目标识别模型,包括:获取所述初始识别模型输出的第一识别结果和第二识别结果,其中,所述第一识别结果是使用所述初始识别模型对携带有所述第一样本标签的所述训练样本进行识别得到的,所述第二识别结果是使用所述初始识别模型对携带有所述第二样本标签的所述测试样本进行识别得到的;使用所述第一识别结果和所述第二识别结果构建所述初始识别模型的目标损失函数;根据所述目标损失函数对所述初始识别模型进行参数调节,得到所述目标识别模型。
可选的,所述获取所述初始识别模型输出的第一识别结果和第二识别结果,包括:分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征;对所述第一样本特征和所述第一样本标签进行外积运算,得到第一运算结果,以及对所述第二样本特征和所述第二样本标签进行外积运算,得到第二运算结果;分别将所述第一运算结果和所述第二运算结果输入至所述初始识别模型,得到所述第一运算结果对应的所述第一识别结果和所述第二运算结果对应的所述第二识别结果。
可选的,所述分别对所述训练样本和所述测试样本进行特征提取,包括:获取预训练的目标分类模型中的目标残差网络,其中,所述目标分类模型是使用标注了用户类别的样本图像对初始分类模型进行训练得到的,所述初始分类模型包括依次连接的初始残差网络和初始分类网络,所述目标分类模型包括依次连接的所述目标残差网络和目标分类网络,所述目标残差网络用于对样本进行特征提取,所述目标分类网络用于对所述目标残差网络输出的样本特征确定样本中记载的人图像所属的用户类别;使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征。
可选的,所述使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,包括:分别将所述训练样本和所述测试样本输入到所述目标残差网络,其中,所述目标残差网络包括依次连接的N级残差模块,所述N级残差模块中的每一级残差模块用于对当前级残差模块输入图像的图像维度和卷积核进行聚合变化计算。
可选的,所述获取所述测试样本的第二样本标签,包括:获取预训练的目标预测模型,其中,所述目标预测模型是使用标注了用户类别的样本图像对初始预测模型进行训练得到的;将所述测试样本输入至所述目标预测模型,得到目标预测模型输出的参考用户类别,其中,所述第二样本标签包括所述参考用户类别。
可选的,所述获取训练样本对应的测试样本,包括:获取目标生成模型,其中,所述目标生成模型用于根据接收到的噪声条件对图像添加所述噪声条件对应的噪声干扰;获取与所述目标噪声干扰对应的目标噪声条件;将所述目标噪声条件和所述训练样本输入至所述目标生成模型,得到所述测试样本。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种噪声干扰图像的识别方法,其特征在于,包括:
在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;
获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;
使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别。
2.根据权利要求1所述的方法,其特征在于,所述使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对所述初始识别模型进行迭代训练,得到所述目标识别模型,包括:
获取所述初始识别模型输出的第一识别结果和第二识别结果,其中,所述第一识别结果是使用所述初始识别模型对携带有所述第一样本标签的所述训练样本进行识别得到的,所述第二识别结果是使用所述初始识别模型对携带有所述第二样本标签的所述测试样本进行识别得到的;
使用所述第一识别结果和所述第二识别结果构建所述初始识别模型的目标损失函数;
根据所述目标损失函数对所述初始识别模型进行参数调节,得到所述目标识别模型。
3.根据权利要求2所述的方法,其特征在于,所述获取所述初始识别模型输出的第一识别结果和第二识别结果,包括:
分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征;
对所述第一样本特征和所述第一样本标签进行外积运算,得到第一运算结果,以及对所述第二样本特征和所述第二样本标签进行外积运算,得到第二运算结果;
分别将所述第一运算结果和所述第二运算结果输入至所述初始识别模型,得到所述第一运算结果对应的所述第一识别结果和所述第二运算结果对应的所述第二识别结果。
4.根据权利要求3所述的方法,其特征在于,所述分别对所述训练样本和所述测试样本进行特征提取,包括:
获取预训练的目标分类模型中的目标残差网络,其中,所述目标分类模型是使用标注了用户类别的样本图像对初始分类模型进行训练得到的,所述初始分类模型包括依次连接的初始残差网络和初始分类网络,所述目标分类模型包括依次连接的所述目标残差网络和目标分类网络,所述目标残差网络用于对样本进行特征提取,所述目标分类网络用于对所述目标残差网络输出的样本特征确定样本中记载的人图像所属的用户类别;
使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,得到所述训练样本对应的第一样本特征,以及所述测试样本对应的第二样本特征。
5.根据权利要求4所述的方法,其特征在于,所述使用所述目标残差网络分别对所述训练样本和所述测试样本进行特征提取,包括:
分别将所述训练样本和所述测试样本输入到所述目标残差网络,其中,所述目标残差网络包括依次连接的N级残差模块,所述N级残差模块中的每一级残差模块用于对当前级残差模块输入图像的图像维度和卷积核进行聚合变化计算。
6.根据权利要求1所述的方法,其特征在于,所述获取所述测试样本的第二样本标签,包括:
获取预训练的目标预测模型,其中,所述目标预测模型是使用标注了用户类别的样本图像对初始预测模型进行训练得到的;
将所述测试样本输入至所述目标预测模型,得到目标预测模型输出的参考用户类别,其中,所述第二样本标签包括所述参考用户类别。
7.根据权利要求1所述的方法,其特征在于,所述获取训练样本对应的测试样本,包括:
获取目标生成模型,其中,所述目标生成模型用于根据接收到的噪声条件对图像添加所述噪声条件对应的噪声干扰;
获取与所述目标噪声干扰对应的目标噪声条件;
将所述目标噪声条件和所述训练样本输入至所述目标生成模型,得到所述测试样本。
8.一种噪声干扰图像的识别模块,其特征在于,包括:
第一获取模块,用于在接收到目标请求的情况下,获取训练样本对应的测试样本,其中,所述目标请求用于请求获取目标识别能力的识别模型,所述目标识别能力为对携带有目标噪声干扰的人脸图像的人脸识别能力,所述测试样本是对所述训练样本添加了所述目标噪声干扰得到的;
第二获取模块,用于获取所述训练样本对应的第一样本标签,以及获取所述测试样本的第二样本标签,其中,所述第一样本标签用于表征所述训练样本中人脸图像所属用户的用户类别,所述第二样本标签用于表征所述测试样本中人脸图像所属用户的用户类别;
训练模块,用于使用携带有所述第一样本标签的所述训练样本和携带有所述第二样本标签的所述测试样本对初始识别模型进行迭代训练,得到目标识别模型,其中,所述目标识别模型用于对携带有噪声干扰的目标图像进行人脸识别,得到所述目标图像中包括的人脸图像所属用户的目标用户类别。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的噪声干扰图像的识别方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的噪声干扰图像的图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311036147.1A CN117351297A (zh) | 2023-08-16 | 2023-08-16 | 噪声干扰图像的识别方法、装置、处理器及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311036147.1A CN117351297A (zh) | 2023-08-16 | 2023-08-16 | 噪声干扰图像的识别方法、装置、处理器及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117351297A true CN117351297A (zh) | 2024-01-05 |
Family
ID=89360192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311036147.1A Pending CN117351297A (zh) | 2023-08-16 | 2023-08-16 | 噪声干扰图像的识别方法、装置、处理器及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117351297A (zh) |
-
2023
- 2023-08-16 CN CN202311036147.1A patent/CN117351297A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113011646B (zh) | 一种数据处理方法、设备以及可读存储介质 | |
CN111681091A (zh) | 基于时间域信息的金融风险预测方法、装置及存储介质 | |
Rehman et al. | Federated self-supervised learning for video understanding | |
CN112560823B (zh) | 基于分布学习的自适应方差和权重的人脸年龄估计方法 | |
Liu et al. | [Retracted] Brand Marketing Decision Support System Based on Computer Vision and Parallel Computing | |
CN111259975B (zh) | 分类器的生成方法及装置、文本的分类方法及装置 | |
CN116958622A (zh) | 数据的分类方法、装置、设备、介质及程序产品 | |
CN113542527B (zh) | 一种人脸图像传输方法、装置、电子设备及存储介质 | |
CN117351297A (zh) | 噪声干扰图像的识别方法、装置、处理器及电子设备 | |
CN110990164B (zh) | 账户检测方法和装置、账户检测模型的训练方法和装置 | |
Sun et al. | Image steganalysis based on convolutional neural network and feature selection | |
Mao et al. | A shared updatable method of content regulation for deepfake videos based on blockchain | |
Gkalelis et al. | Subclass deep neural networks: re-enabling neglected classes in deep network training for multimedia classification | |
CN115689648B (zh) | 应用于定向投放的用户信息处理方法及系统 | |
CN117133039B (zh) | 图像鉴伪模型训练方法、图像鉴伪方法、装置及电子设备 | |
CN113314206B (zh) | 图像显示方法、装置和终端设备 | |
CN112766407B (zh) | 一种图像识别方法、装置及存储介质 | |
Li et al. | Foundation | |
US20240062051A1 (en) | Hierarchical data labeling for machine learning using semi-supervised multi-level labeling framework | |
CN115115843B (zh) | 数据处理方法及装置 | |
CN115730823A (zh) | 风险概率识别方法、装置、处理器和电子设备 | |
CN116757784A (zh) | 理财产品的推荐预测方法、装置和处理器及电子设备 | |
Appice et al. | Leveraging colour-based pseudo-labels to supervise saliency detection in hyperspectral image datasets | |
Li et al. | The study of scene classification in the multisensor remote sensing image fusion | |
CN117592096A (zh) | 基于联邦学习隐私保护的异常金融账户检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |