CN109272031B - 一种训练样本生成方法及装置、设备、介质 - Google Patents

一种训练样本生成方法及装置、设备、介质 Download PDF

Info

Publication number
CN109272031B
CN109272031B CN201811030419.6A CN201811030419A CN109272031B CN 109272031 B CN109272031 B CN 109272031B CN 201811030419 A CN201811030419 A CN 201811030419A CN 109272031 B CN109272031 B CN 109272031B
Authority
CN
China
Prior art keywords
disturbance
training
round
training sample
perturbation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811030419.6A
Other languages
English (en)
Other versions
CN109272031A (zh
Inventor
高三元
徐晓刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kuandong (Huzhou) Technology Co.,Ltd.
Original Assignee
Kuandeng Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kuandeng Beijing Technology Co ltd filed Critical Kuandeng Beijing Technology Co ltd
Priority to CN201811030419.6A priority Critical patent/CN109272031B/zh
Publication of CN109272031A publication Critical patent/CN109272031A/zh
Application granted granted Critical
Publication of CN109272031B publication Critical patent/CN109272031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Abstract

本申请公开了一种训练样本生成方法及装置、设备、介质。该方法至少包括:从同一图像数据集中,获取多个第一训练样本,根据第一训练样本的第i‑1轮扰动,以及第i‑1轮迭代训练时损失函数对应的梯度,计算第i轮扰动,训练时每个第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签,根据分别计算出的第i轮扰动,确定该同一图像数据集的通用扰动,根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,根据统一的通用扰动生成第二训练样本。本申请通过迭代训练以及对抗扰动通用化和统一化,能够根据已有的训练样本生成新的训练样本,以作为对抗样本对深度模型进行对抗训练,成本较低,而且能够有效地提高模型鲁棒性。

Description

一种训练样本生成方法及装置、设备、介质
技术领域
本申请涉及机器学习技术领域,尤其涉及一种训练样本生成方法及装置、设备、介质。
背景技术
随着机器学习技术的迅速发展,基于深度学习的深度模型也被用在越来越多的地方,包括图像分割领域。利用深度模型来进行图像分割的流程与一般的图像分类相似,但是需要尽量为每个像素都正确分类。
针对图像分割领域,为了提高深度模型分类的准确性,需要利用大量图像作为训练样本对深度模型进行训练,训练过的深度模型仍难免出现混淆现象,需要进一步地优化。
优化技术在应对混淆现象的时候,多在模型结构或者数据上着力。模型结构上优化主要指的是依据现有的研究得到的,在模型结构和训练上一些可以使用的技巧,这些一般在正常的训练中已经被采用。而数据上优化一般更为有效,因为深度模型本来就是数据驱动的机器学习模型。
但是,数据上优化目前是努力采集更多的图像作为新的训练样本,再用这些新的训练样本来再次更新模型的参数,但是,这种方式费时耗力,成本较高,而且难以有针对性地应对混淆现象,从而难以保证模型鲁棒性。
发明内容
本申请实施例提供一种训练样本生成方法及装置、设备、介质,用以解决现有技术中的如下技术问题:现有的努力采集更多的新的训练样本的方式费时耗力,成本较高,而且难以有针对性地应对混淆现象,从而难以保证模型鲁棒性。
本申请实施例采用下述技术方案:
一种训练样本生成方法,包括:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
可选地,在所述生成所述深度模型的第二训练样本后,所述方法还包括:
利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。
可选地,所述根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:
获取分别为多个不同图像数据集确定的通用扰动;
对获取的各所述通用扰动进行归一化处理;
根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。
可选地,所述计算所述第一训练样本的第i轮扰动,具体包括:
利用快速梯度算法,计算所述第一训练样本的第i轮扰动;
其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。
可选地,所述计算过程中还使用了指定的随机扰动及其相关控制因子。
可选地,所述确定该同一图像数据集的通用扰动,具体包括:
采用以下公式,确定该同一图像数据集的通用扰动:
Figure BDA0001789588100000031
其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。
可选地,所述确定统一的通用扰动,具体包括:
采用以下公式,确定统一的通用扰动:
Figure BDA0001789588100000032
其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,
Figure BDA0001789588100000033
表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。
可选地,所述利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure BDA0001789588100000034
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure BDA0001789588100000035
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重。
可选地,所述利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure BDA0001789588100000041
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure BDA0001789588100000042
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布,ε表示该随机扰动的相关控制因子。
可选地,所述一部分像素、所述另一部分像素分别属于指定的易混淆的不同分类。
可选地,所述深度模型包括图像分割模型,所述图像包括道路交通图像。
一种训练样本生成装置,包括:
获取模块,从同一图像数据集中,获取深度模型的多个第一训练样本;
计算模块,根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
第一确定模块,根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
第二确定模块,根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
生成模块,根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
可选地,所述装置还包括:
训练模块,在所述生成模块生成所述深度模型的第二训练样本后,利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。
可选地,所述第二确定模块根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:
所述第二确定模块获取分别为多个不同图像数据集确定的通用扰动;
对获取的各所述通用扰动进行归一化处理;
根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。
可选地,所述计算模块计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块利用快速梯度算法,计算所述第一训练样本的第i轮扰动;
其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。
可选地,所述计算过程中还使用了指定的随机扰动及其相关控制因子。
可选地,所述第一确定模块确定该同一图像数据集的通用扰动,具体包括:
所述第一确定模块采用以下公式,确定该同一图像数据集的通用扰动:
Figure BDA0001789588100000051
其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。
可选地,所述第二确定模块确定统一的通用扰动,具体包括:
所述第二确定模块采用以下公式,确定统一的通用扰动:
Figure BDA0001789588100000052
其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,
Figure BDA0001789588100000053
表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。
可选地,所述计算模块利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure BDA0001789588100000061
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure BDA0001789588100000062
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重。
可选地,所述计算模块利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure BDA0001789588100000063
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure BDA0001789588100000064
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布,ε表示该随机扰动的相关控制因子。
可选地,所述一部分像素、所述另一部分像素分别属于指定的易混淆的不同分类。
可选地,所述深度模型包括图像分割模型,所述图像包括道路交通图像。
一种训练样本生成设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
一种训练样本生成非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:通过迭代训练和主动叠加对抗扰动,以及进行扰动通用化和统一化处理,能够根据已有的训练样本便利地生成新的训练样本,以作为对抗样本对深度模型进行对抗训练,成本较低,更有针对性,能够有效地提高模型鲁棒性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请的一些实施例提供的一种训练样本生成方法的流程示意图;
图2为本申请的一些实施例提供的对应于图1的一种训练样本生成装置的结构示意图;
图3为本申请的一些实施例提供的对应于图1的一种训练样本生成设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑某一用于图像分割的深度模型M,其输入是某一图像数据集中的某一图像I(具体可以是各像素的特征),其输出是I相对应的分割结果,相比于传统的图像分类,分割问题需要在像素级别给出分类结果,其难度更大,分割结果比如可以表示为1个矩阵,矩阵中的元素与I中的像素一一对应,元素的取值可以表示M所预测的该元素对应的像素的分类类别,比如,用取值0~9分别表示10个不同的类别。
分割结果出现混淆即意味着对某些像素点的分类出现错误,当训练样本的数据量足够大的时候,可以缓解这种现象,但是并不能杜绝,而如何寻找这种可能出现混淆现象的样本并且将其用于进一步训练深度模型(将这种训练过程称为对抗训练),是提高模型鲁棒性的重点之一,因为没有出现混淆的样本难以进一步有效地指示模型参数更新的方向。本申请能够高效地生成这种出现混淆现象的样本,以低成本且更有针对性地应对混淆现象。
针对M的输入图像I,假定其分割结果没有混淆,可以主动为I构造扰动(比如,输入噪声R),叠加于I上进行干扰,从而实际输入为R+I,以使新的输入图像的分割结果出现混淆,将这种扰动称为对抗扰动。
对于所包含的图像数据处于相近的流形中的同一图像数据集,其中某一样本的对抗扰动可以对另一样本也起到混淆作用。对于某一图像数据集,可能存在一种通用对抗扰动(对于单个图像数据集通用),其可以对该图像数据集中所有样本起到混淆作用,这种通用的对抗扰动可以用在离线或者在线的对抗训练当中。进一步地,对于相近的多个不同的图像数据集(比如,不同的多个城市分别的道路交通图像数据集等),还可能存在一种统一的通用对抗扰动(对于这多个图像数据集均通用),其可以对这多个图像数据集中所有样本起到混淆作用。本申请主要提供了基于迭代训练和快速梯度的扰动(包括上述的对抗扰动、通用对抗扰动、统一的通用对抗扰动)计算方案,基于计算的扰动和已有的训练样本可以便利地生成新的训练样本,用于对抗训练,以提高模型鲁棒性。下面对本申请的方案进行详细说明。
图1为本申请的一些实施例提供的一种训练样本生成方法的流程示意图。在该流程中,从设备角度而言,执行主体可以是一个或者多个计算设备,比如,单个机器学习服务器或者机器学习服务器集群等,从程序角度而言,执行主体相应地可以是搭载于这些计算设备上的程序,比如,神经网络建模平台、图像处理平台等。
图1中的流程可以包括以下步骤:
S102:从同一图像数据集中,获取深度模型的多个第一训练样本。
在本申请的一些实施例中,该同一图像数据集中的包含的图像数据可以处于相近的流形中,如此有助于后续得到的通用扰动实际的通用性更好。比如,可以采用道路交通图像数据集、身份证件图像数据集等。深度模型用于预测图像中像素的分类类别,据此能够进一步地实现诸如图像分割、图像增强等用途,为了便于描述,下面一些实施例主要以深度模型包括图像分割模型为例进行说明。深度模型可以是已经预先利用该同一图像数据集或者其他的图像数据集训练过的,而为了进一步地提高模型鲁棒性,通过执行图1中的流程生成对抗样本,再进行对抗训练。
在本申请的一些实施例中,每个第一训练样本可以是该同一图像数据集中一组图像数据,每组图像数据至少包含一个图像的各像素的特征,一组图像数据一般可以指一个数字图像。
S104:根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签。
在本申请的一些实施例中,可以分别针对每个或者每多个第一训练样本执行步骤S104,所述的扰动即为上述的对抗扰动,首轮扰动可以预先设定,比如,设定为0或者适当的白噪声等。损失函数及训练深度模型时采用的损失函数的形式可以是多样的,这里不做具体限定,比如,损失函数可以是当前样本包含的每个像素点分割结果的交叉熵等。
在本申请的一些实施例中,出现混淆现象往往是因为对某些易混淆的类别判定错误导致的,因此,在构造扰动时也可以依据这样的原理,针对易混淆的不同类别(像素的类别)局部地正确引导以及局部地错误引导训练方向,以使深度模型混淆。比如,对于至少两个易混淆的类别(是否易混淆可以通过人工或者其他方案等预先判定,这里不做具体限定),给其中第一个类别的像素标注错误分类标签,而给另一个类别的像素标注正确分类标签,再根据标注的标签迭代训练深度模型,从而时深度模型趋向于错误地给第一个类别的像素分类,而正确地给另一个类别的像素分类,从而混淆。
当然,上一段的例子并非唯一实施方式,比如,也可以对第一训练样本随机地选择部分像素,并对其采用错误分类标签或者正确分类标签。
在本申请的一些实施例中,迭代训练时采用了梯度算法,配合损失逐步地调节扰动,如此有助于尽快收敛并得到混淆作用较好的扰动。
在本申请的一些实施例中,可以在未叠加扰动的情况下预先训练深度模型,直至达到至少尚可的分类效果,再叠加扰动进行迭代训练,从而有助于保证混淆主要由扰动导致,即有助于保证所计算出的扰动本身的实用性和有效性。
S106:根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动。
在本申请的一些实施例中,利用步骤S104的计算方案,针对任一深度模型及其任一输入样本,都可以构建其相对应的对抗扰动。在实际应用中,这种方案需要迭代多次,相对而言更适用于离线执行,而为了能够较好地应用于在线场景,可以进一步地提高对抗扰动的通用性。
若该同一图像数据集中的样本处于相近的流形之中,则其对抗扰动的分布也相近,这些扰动之间存在“迁移性”,也即其中某一样本的对抗扰动可以作用于另外的样本。可以根据各样本分别的对抗扰动,采用诸如取样平均、加权、择一等方式,为整个图像数据集中的全部样本构造一个通用的对抗扰动。
在本申请的一些实施例中,对迭代训练的轮数并不做限定,可以根据实际效果尝试确定,比如迭代直至在某轮(比如,第i轮等)计算的扰动能够达到预期效果,再进一步地确定通用扰动。
S108:根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动。
在本申请的一些实施例中,分别针对多个不同图像数据集执行步骤S102、S104、S106,即能够确定它们各自的通用扰动。
在本申请的一些实施例中,若多个不同图像数据集业务上是统一的,具有内容相近的特点,比如,多个不同城市分别的道路交通图像数据集等,则进一步地还可以为这多个不同图像数据集构造更通用的扰动,即所述的统一的通用扰动。类似于构造通用扰动,构造统一的通用扰动所采用的构造方式也可以是多样的,另外,构造时除了可以执行诸如取样、加权、归一化等动作以外,还可以加入一些额外的控制参数或者控制项,比如用于限制幅度的参数,附加的随机项等,后面会举例详细说明。
S110:根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
在本申请的一些实施例中,通过在已有的样本上至少部分叠加统一的通用扰动,则能够生成新的训练样本,即第二训练样本,用于进行对抗训练。
通过图1的方法,通过迭代训练和主动叠加对抗扰动,以及进行扰动通用化和统一化处理,能够根据已有的训练样本便利地生成新的训练样本,以作为对抗样本对深度模型进行对抗训练,成本较低,更有针对性,能够有效地提高模型鲁棒性。
基于图1的方法,本申请的一些实施例还提供了该方法的一些具体实施方案,以及扩展方案,下面进行说明。
在本申请的一些实施例中,在生成第二训练样本后,可以利用第二训练样本继续对抗训练深度模型,当然,由于在该对抗训练和上述的迭代训练中深度模型的参数又会被修正,因此,可以结合未叠加扰动之前的已有样本再次训练深度模型,以使深度模型趋向于更优。
在本申请的一些实施例中,前面已经提到,可以利用梯度算法计算扰动,更具体地,所利用的梯度算法可以是快速梯度算法,如此能够减少计算量,降低方案实施成本。为了便于理解,本申请提供了一种示例性的公式,用于计算步骤S104中的第i轮扰动,下面进行说明。
假定对于深度模型M,针对其输入x,输出的分割结果为f(x),x和f(x)都表示为矩阵,矩阵的元素与像素一一对应,元素的取值表示M所预测的对应像素的分类结果,训练时,x具体可以包含一个第一训练样本待输入M的特征及为其叠加的扰动,一部分像素采用错误分类标签,另一部分像素采用正确分类标签。该公式具体如下:
Figure BDA0001789588100000131
Ladv=w×L;
其中,ri表示第i轮扰动,Clip表示作为输入幅度控制因子的处理函数,可以用于保证扰动叠加后,输入的大小还在限定的范围之内,ri-1表示第i-1轮扰动,α表示扰动幅度控制因子,可以用于控制每轮扰动的幅度,sign表示正负符号判断函数(若
Figure BDA0001789588100000132
Figure BDA0001789588100000133
Figure BDA0001789588100000134
Figure BDA0001789588100000135
Figure BDA0001789588100000136
Figure BDA0001789588100000137
),x表示深度模型的输入,
Figure BDA0001789588100000138
表示上一轮(在公式一中指第i-1轮)Ladv相对于x的梯度,L表示损失函数,比如采用像素级的交叉熵损失函数,w表示损失函数权重,对于不同部分的像素,w可以是差异化的,比如,对于该一部分像素和该另一部分像素,若有需要可以采用不同取值的w。
在实际应用中,上例公式中使用的输入幅度控制因子、扰动幅度控制因子、损失函数权重是可选的,未必需要全部使用。进一步地,根据实际需求,还可以使用其他一些因子,以便实现更多的积极效果,比如,还可以使用指定的随机扰动及其相关控制因子,原因在于深度模型的非线性度十分高,这种特性使得梯度算法的执行过程中有可能陷入局部最小的错误点,从而阻碍对抗扰动的计算,可以通过加入合适的随机扰动以避免该问题发生。继续结合上例说明,对公式一进一步优化,得到如下公式二,也可以用于计算扰动。
Figure BDA0001789588100000141
其中,rrandom表示指定的随机扰动,该随机扰动优选地可以服从均值为0且标准差为1的正态分布,ε表示该随机扰动的相关控制因子,可以用于控制该随机扰动的大小。
在本申请的一些实施例中,提供了一种基于平均采样和权重的示例性计算方案,用于计算通用扰动。下面进行说明。
假定将步骤S102中的同一图像数据集记作D,通过平均采样,从D中抽取一部分的样本记作{x1,x2,...,xN},针对其中的每个样本记作xn,n=1,2,...,N,都可以计算出各自的扰动记作rin,再据此进行结合生成D的通用扰动。考虑到其中有些扰动幅度小,有些幅度大,为了平衡,可以为每个扰动也分配权重再进行结合,比如可以采用如下公式三计算D的通用扰动。
Figure BDA0001789588100000142
其中,rD表示图像数据集D的通用扰动,wn表示从该图像数据集采样得到的第n个样本的扰动权重。
在本申请的一些实施例中,还提供了一种基于归一化的示例性计算方案,用于计算多个不同图像数据集统一的通用扰动。下面进行说明。
对于步骤S106,所述根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体可以包括:获取分别为多个不同图像数据集确定的通用扰动;对获取的各所述通用扰动进行归一化处理;根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。
对于上例,假定有多个不同图像数据集记作{D1,D2,...,DM},分别确定其中的每个图像数据集的通用扰动记作
Figure BDA0001789588100000143
更具体地,比如可以采用如下公式四计算这多个不同图像数据集的统一的通用扰动。
Figure BDA0001789588100000151
其中,R表示该统一的通用扰动,M表示所述多个不同图像数据集的数量,
Figure BDA0001789588100000152
表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动优选地可以服从均值为0且标准差为1的正态分布。
需要说明的是,上述的公式一至公式四都是示例性的,并非唯一的形式。比如,公式四中的γ×rrandom可以通过乘法、指数或者对数等运算进行变形,可以增减其中的参数等,只要能够实现随机扰动的积极效果即可。
基于同样的思路,本申请的一些实施例还提供了上述方法对应的装置、设备和非易失性计算机存储介质。
图2为本申请的一些实施例提供的对应于图1的一种训练样本生成装置的结构示意图,虚线方框表示可选的模块,该装置包括:
获取模块201,从同一图像数据集中,获取深度模型的多个第一训练样本;
计算模块202,根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
第一确定模块203,根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
第二确定模块204,根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
生成模块205,根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
可选地,所述装置还包括:
训练模块206,在所述生成模块205生成所述深度模型的第二训练样本后,利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。
可选地,所述第二确定模块204根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:
所述第二确定模块204获取分别为多个不同图像数据集确定的通用扰动;
对获取的各所述通用扰动进行归一化处理;
根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。
可选地,所述计算模块202计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块202利用快速梯度算法,计算所述第一训练样本的第i轮扰动;
其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。
可选地,所述计算过程中还使用了指定的随机扰动及其相关控制因子。
可选地,所述第一确定模块203确定该同一图像数据集的通用扰动,具体包括:
所述第一确定模块203采用以下公式,确定该同一图像数据集的通用扰动:
Figure BDA0001789588100000161
其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。
可选地,所述第二确定模块204确定统一的通用扰动,具体包括:
所述第二确定模块204采用以下公式,确定统一的通用扰动:
Figure BDA0001789588100000171
其中,R表示该统一的通用扰动,M表示所述多个不同图像数据集的数量,
Figure BDA0001789588100000172
表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。
可选地,所述计算模块202利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块202采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure BDA0001789588100000173
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure BDA0001789588100000174
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重。
可选地,所述计算模块202利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块202采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure BDA0001789588100000175
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure BDA0001789588100000176
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布,ε表示该随机扰动的相关控制因子。
可选地,所述一部分像素、所述另一部分像素分别属于指定的易混淆的不同分类。
可选地,所述深度模型包括图像分割模型,所述图像包括道路交通图像。
图3为本申请的一些实施例提供的对应于图1的一种训练样本生成设备的结构示意图,该设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
本申请的一些实施例提供的对应于图1的一种训练样本生成非易失性计算机存储介质,存储有计算机可执行指令,该计算机可执行指令设置为:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的装置、设备和介质与方法是一一对应的,因此,装置、设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置、设备和介质的有益技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (24)

1.一种训练样本生成方法,其特征在于,包括:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
2.如权利要求1所述的方法,其特征在于,在所述生成所述深度模型的第二训练样本后,所述方法还包括:
利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。
3.如权利要求1所述的方法,其特征在于,所述根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:
获取分别为多个不同图像数据集确定的通用扰动;
对获取的各所述通用扰动进行归一化处理;
根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。
4.如权利要求1所述的方法,其特征在于,所述计算所述第一训练样本的第i轮扰动,具体包括:
利用快速梯度算法,计算所述第一训练样本的第i轮扰动;
其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。
5.如权利要求4所述的方法,其特征在于,所述计算过程中还使用了指定的随机扰动及其相关控制因子。
6.如权利要求1所述的方法,其特征在于,所述确定该同一图像数据集的通用扰动,具体包括:
采用以下公式,确定该同一图像数据集的通用扰动:
Figure FDA0001981027280000021
其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。
7.如权利要求3所述的方法,其特征在于,所述确定统一的通用扰动,具体包括:
采用以下公式,确定统一的通用扰动:
Figure FDA0001981027280000022
其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,
Figure FDA0001981027280000023
表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。
8.如权利要求4所述的方法,其特征在于,所述利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure FDA0001981027280000024
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure FDA0001981027280000031
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重。
9.如权利要求5所述的方法,其特征在于,所述利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure FDA0001981027280000032
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure FDA0001981027280000033
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布,ε表示该随机扰动的相关控制因子。
10.如权利要求1~9任一项所述的方法,其特征在于,所述一部分像素、所述另一部分像素分别属于指定的易混淆的不同分类。
11.如权利要求1~9任一项所述的方法,其特征在于,所述深度模型包括图像分割模型,所述图像包括道路交通图像。
12.一种训练样本生成装置,其特征在于,包括:
获取模块,从同一图像数据集中,获取深度模型的多个第一训练样本;
计算模块,根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
第一确定模块,根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
第二确定模块,根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
生成模块,根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
13.如权利要求12所述的装置,其特征在于,所述装置还包括:
训练模块,在所述生成模块生成所述深度模型的第二训练样本后,利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。
14.如权利要求12所述的装置,其特征在于,所述第二确定模块根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:
所述第二确定模块获取分别为多个不同图像数据集确定的通用扰动;
对获取的各所述通用扰动进行归一化处理;
根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。
15.如权利要求12所述的装置,其特征在于,所述计算模块计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块利用快速梯度算法,计算所述第一训练样本的第i轮扰动;
其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。
16.如权利要求15所述的装置,其特征在于,所述计算过程中还使用了指定的随机扰动及其相关控制因子。
17.如权利要求12所述的装置,其特征在于,所述第一确定模块确定该同一图像数据集的通用扰动,具体包括:
所述第一确定模块采用以下公式,确定该同一图像数据集的通用扰动:
Figure FDA0001981027280000041
其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。
18.如权利要求14所述的装置,其特征在于,所述第二确定模块确定统一的通用扰动,具体包括:
所述第二确定模块采用以下公式,确定统一的通用扰动:
Figure FDA0001981027280000051
其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,
Figure FDA0001981027280000052
表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。
19.如权利要求15所述的装置,其特征在于,所述计算模块利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure FDA0001981027280000053
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure FDA0001981027280000054
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重。
20.如权利要求16所述的装置,其特征在于,所述计算模块利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
所述计算模块采用以下公式,计算所述第一训练样本的第i轮扰动:
Figure FDA0001981027280000055
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,
Figure FDA0001981027280000061
表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布,ε表示该随机扰动的相关控制因子。
21.如权利要求12~20任一项所述的装置,其特征在于,所述一部分像素、所述另一部分像素分别属于指定的易混淆的不同分类。
22.如权利要求12~20任一项所述的装置,其特征在于,所述深度模型包括图像分割模型,所述图像包括道路交通图像。
23.一种训练样本生成设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
24.一种训练样本生成非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
CN201811030419.6A 2018-09-05 2018-09-05 一种训练样本生成方法及装置、设备、介质 Active CN109272031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811030419.6A CN109272031B (zh) 2018-09-05 2018-09-05 一种训练样本生成方法及装置、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811030419.6A CN109272031B (zh) 2018-09-05 2018-09-05 一种训练样本生成方法及装置、设备、介质

Publications (2)

Publication Number Publication Date
CN109272031A CN109272031A (zh) 2019-01-25
CN109272031B true CN109272031B (zh) 2021-03-30

Family

ID=65188411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811030419.6A Active CN109272031B (zh) 2018-09-05 2018-09-05 一种训练样本生成方法及装置、设备、介质

Country Status (1)

Country Link
CN (1) CN109272031B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111488898B (zh) * 2019-01-28 2023-09-19 北京达佳互联信息技术有限公司 对抗数据获取方法、装置、设备及存储介质
CN109934334B (zh) * 2019-03-04 2021-04-20 三峡大学 一种基于扰动的叶绿素a含量相关因子敏感性分析方法
CN110070505A (zh) * 2019-04-12 2019-07-30 北京迈格威科技有限公司 增强图像分类模型噪声鲁棒性的方法和装置
CN110210617B (zh) * 2019-05-15 2021-06-18 北京邮电大学 一种基于特征增强的对抗样本生成方法及生成装置
CN110348475B (zh) * 2019-05-29 2023-04-18 广东技术师范大学 一种基于空间变换的对抗样本增强方法和模型
CN110472672B (zh) * 2019-07-25 2023-04-18 创新先进技术有限公司 用于训练机器学习模型的方法和装置
CN110705652B (zh) * 2019-10-17 2020-10-23 北京瑞莱智慧科技有限公司 对抗样本及其生成方法、介质、装置和计算设备
CN110796594B (zh) * 2019-10-28 2021-11-09 腾讯科技(深圳)有限公司 一种图像生成方法、装置及设备
CN111027717A (zh) * 2019-12-11 2020-04-17 支付宝(杭州)信息技术有限公司 一种模型训练方法和系统
CN111340180B (zh) * 2020-02-10 2021-10-08 中国人民解放军国防科技大学 指定标签的对抗样本生成方法、装置、电子设备及介质
CN113378118B (zh) * 2020-03-10 2023-08-22 百度在线网络技术(北京)有限公司 处理图像数据的方法、装置、电子设备和计算机存储介质
CN111461307B (zh) * 2020-04-02 2022-04-29 武汉大学 一种基于生成对抗网络的通用扰动生成方法
CN112101294B (zh) * 2020-09-29 2022-08-09 支付宝(杭州)信息技术有限公司 针对图像识别模型的增强训练方法及装置
CN112580732B (zh) * 2020-12-25 2024-02-23 北京百度网讯科技有限公司 模型训练方法、装置、设备、存储介质和程序产品
CN112818774A (zh) * 2021-01-20 2021-05-18 中国银联股份有限公司 一种活体检测方法及装置
CN113066002A (zh) * 2021-02-27 2021-07-02 华为技术有限公司 对抗样本的生成方法、神经网络的训练方法、装置及设备
CN112907552B (zh) * 2021-03-09 2024-03-01 百度在线网络技术(北京)有限公司 图像处理模型的鲁棒性检测方法、设备及程序产品
CN113255748A (zh) * 2021-05-14 2021-08-13 广州织点智能科技有限公司 一种商品识别模型的特征底库更新方法及装置
CN113487545A (zh) * 2021-06-24 2021-10-08 广州玖的数码科技有限公司 一种面向姿态估计深度神经网络的扰动图像生成方法
CN113627597B (zh) * 2021-08-12 2023-10-13 上海大学 一种基于通用扰动的对抗样本生成方法及系统
CN113762397B (zh) * 2021-09-10 2024-04-05 北京百度网讯科技有限公司 检测模型训练、高精度地图更新方法、设备、介质及产品
CN113569822B (zh) * 2021-09-24 2021-12-21 腾讯科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质
CN115641490A (zh) * 2022-10-11 2023-01-24 华为技术有限公司 一种数据处理方法及其装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296692A (zh) * 2016-08-11 2017-01-04 深圳市未来媒体技术研究院 基于对抗网络的图像显著性检测方法
US9778115B2 (en) * 2013-03-28 2017-10-03 Exxonmobil Research And Engineering Company Method and system for detecting deposits in a vessel
CN107977683A (zh) * 2017-12-20 2018-05-01 南京大学 基于卷积特征提取和机器学习的联合sar目标识别方法
CN108257194A (zh) * 2018-01-23 2018-07-06 哈尔滨工程大学 基于卷积神经网络的人脸简笔画生成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10007866B2 (en) * 2016-04-28 2018-06-26 Microsoft Technology Licensing, Llc Neural network image classifier

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9778115B2 (en) * 2013-03-28 2017-10-03 Exxonmobil Research And Engineering Company Method and system for detecting deposits in a vessel
CN106296692A (zh) * 2016-08-11 2017-01-04 深圳市未来媒体技术研究院 基于对抗网络的图像显著性检测方法
CN107977683A (zh) * 2017-12-20 2018-05-01 南京大学 基于卷积特征提取和机器学习的联合sar目标识别方法
CN108257194A (zh) * 2018-01-23 2018-07-06 哈尔滨工程大学 基于卷积神经网络的人脸简笔画生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Adcersarial examples in the physical world;Alexey Kurakin et al.;《ArXiv》;20170228;全文 *

Also Published As

Publication number Publication date
CN109272031A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
CN109272031B (zh) 一种训练样本生成方法及装置、设备、介质
US10402448B2 (en) Image retrieval with deep local feature descriptors and attention-based keypoint descriptors
US11501162B2 (en) Device for classifying data
US20190340533A1 (en) Systems and methods for preparing data for use by machine learning algorithms
US10878173B2 (en) Object recognition and tagging based on fusion deep learning models
US20220076136A1 (en) Method and system for training a neural network model using knowledge distillation
CN110533018B (zh) 一种图像的分类方法及装置
WO2022051856A9 (en) Method and system for training a neural network model using adversarial learning and knowledge distillation
CN110349190A (zh) 自适应学习的目标跟踪方法、装置、设备及可读存储介质
US20200065664A1 (en) System and method of measuring the robustness of a deep neural network
CN114359563B (zh) 模型训练方法、装置、计算机设备和存储介质
WO2016095068A1 (en) Pedestrian detection apparatus and method
CN109271957B (zh) 人脸性别识别方法以及装置
CN111178533B (zh) 实现自动半监督机器学习的方法及装置
CN116932909A (zh) 模型的推荐方法、装置、处理器以及电子设备
CN113469111A (zh) 图像关键点检测方法及系统、电子设备、存储介质
CN105426534A (zh) 信息确定方法及装置
CN111027551B (zh) 图像处理方法、设备和介质
CN116152542A (zh) 图像分类模型的训练方法、装置、设备及存储介质
CN115409997A (zh) 一种数据标注方法、装置、设备及介质
CN113658173A (zh) 基于知识蒸馏的检测模型的压缩方法、系统和计算设备
CN112784990A (zh) 一种成员推断模型的训练方法
CN110543549A (zh) 语义等价性判断方法和装置
CN114662487A (zh) 一种文本分段方法、装置、电子设备及可读存储介质
CN111626305B (zh) 目标检测方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 108-27, Building 1, No. 611 Yunxiu South Road, Wuyang Street, Deqing County, Huzhou City, Zhejiang Province, 313200 (Moganshan National High tech Zone)

Patentee after: Kuandong (Huzhou) Technology Co.,Ltd.

Address before: 811, 8 / F, 101, 3-8 / F, building 17, rongchuang Road, Chaoyang District, Beijing 100012

Patentee before: KUANDENG (BEIJING) TECHNOLOGY Co.,Ltd.