CN114612688B - 对抗样本生成方法、模型训练方法、处理方法及电子设备 - Google Patents

对抗样本生成方法、模型训练方法、处理方法及电子设备 Download PDF

Info

Publication number
CN114612688B
CN114612688B CN202210525739.9A CN202210525739A CN114612688B CN 114612688 B CN114612688 B CN 114612688B CN 202210525739 A CN202210525739 A CN 202210525739A CN 114612688 B CN114612688 B CN 114612688B
Authority
CN
China
Prior art keywords
image
iteration
feature vector
image corresponding
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210525739.9A
Other languages
English (en)
Other versions
CN114612688A (zh
Inventor
张天柱
张哲�
张勇东
冯巍巍
徐楠青
吴枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202210525739.9A priority Critical patent/CN114612688B/zh
Publication of CN114612688A publication Critical patent/CN114612688A/zh
Application granted granted Critical
Publication of CN114612688B publication Critical patent/CN114612688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种对抗样本生成方法,包括:基于空间注意力机制,对与当前轮迭代对应的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量;对与当前轮迭代对应的图像的图像特征数据进行第二处理,得到与当前轮迭代对应的图像的第二图像特征向量;对由分散度函数和特征通道权重函数构成的函数组进行求导,基于求导后的函数组,根据与当前轮迭代对应的图像的第二图像特征向量和与当前轮迭代对应的图像的第一图像特征向量,得到与当前轮迭代对应的图像的梯度值,根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像;将满足预定迭代条件的图像确定为对抗样本。本发明还提供一种电子设备。

Description

对抗样本生成方法、模型训练方法、处理方法及电子设备
技术领域
本发明涉及人工智能及机器学习技术领域,具体地涉及一种对抗样本生成方法、模型训练方法、处理方法及电子设备。
背景技术
对抗攻击技术是针对输入样本生成具有人类视觉系统上不可见扰动的图像,使得深度分类模型做出错误判断。对抗攻击在深度神经模型稳健性评估、安全漏洞捕捉等领域有着广泛的应用,尤其是在自动驾驶、姿态检测或数据分析等应用场景。
目前传统的对抗样本生成方法通常是基于分类模型,利用分类模型,将图像输入分类模型中计算相应的损失函数,然后将引导生成使损失函数趋向于较差情况的扰动叠加到输入图像上,使得深度模型分类错误(亦称为攻击成功)。然而传统方法的这一过程非常依赖于分类模型最后的损失函数输出,会使得生成的对抗样本对分类模型过拟合,缺乏对其他任务模型的泛化性(例如检测、分割等),也会降低深度分类模型对对抗样本的鲁棒性,同时也限制了生成的对抗样本迁移性以及在一些实际部署的多任务融合场景中的实用性和拓展性。
发明内容
鉴于上述问题,本发明提供了一种对抗样本生成方法、模型训练方法、图像处理方法及电子设备。
本发明的一方面提供了一种对抗样本生成方法,包括:基于空间注意力机制,对与当前轮迭代对应的图像的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量;对与当前轮迭代对应的图像的图像特征数据进行第二处理,得到与当前轮迭代对应的图像的第二图像特征向量;对由分散度函数和特征通道权重函数构成的函数组进行求导,得到求导后的函数组,基于求导后的函数组,根据与当前轮迭代对应的图像的第二图像特征向量和与当前轮迭代对应的图像的第一图像特征向量,得到与当前轮迭代对应的图像的梯度值,其中,分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数,特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数;根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像;将满足预定迭代条件的图像确定为对抗样本。
可选地,基于空间注意力机制,对与当前轮迭代对应的图像的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量,包括:根据与当前轮迭代对应的图像,得到与当前轮迭代对应的图像的第一中间图像特征向量;基于空间注意力机制,对与当前轮迭代对应的图像进行特征提取,得到与当前轮迭代对应的图像的空间注意力权重矩阵;根据与当前轮迭代对应的图像的第一中间图像特征向量和与当前轮迭代对应的图像的空间注意力权重矩阵,得到与当前轮迭代对应的图像的第一图像特征向量。
可选地,第一图像特征向量包含多个通道对应的第一特征向量;分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数,包括:对第一图像特征向量中的多个通道对应的第一特征向量进行第一特征转换处理,得到第一图像特征向量中的每个通道对应的第一中间特征向量;对第一图像特征向量中的每个通道对应的第一中间特征向量进行计算,得到第一图像特征向量中的每个通道对应的第一中间特征向量的分散度;将第一图像特征向量中的每个通道对应的第一中间特征向量的分散度构建分散度矩阵,得到与每轮迭代对应的图像的第一图像特征向量的分散度。
可选地,第二图像特征向量包含多个通道对应的第二特征向量;特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数,包括:对与每轮迭代对应的第一图像特征向量进行处理,得到与每轮迭代对应的图像的第三图像特征向量;对第三图像特征向量进行转置处理,得到转置后的第三图像特征向量;根据转置后的第三图像特征向量和第二图像特征向量,得到与每轮迭代对应的图像的特征通道权重。
可选地,第三图像特征向量包含多个通道对应的第三特征向量;对第三图像特征向量进行转置处理,得到转置后的第三图像特征向量,包括:对第三图像特征向量中的每个通道对应的第三特征向量进行第二特征转换处理,得到第三图像特征向量中的每个通道对应的第二中间特征向量;对第三图像特征向量中的每个通道对应的第二中间特征向量构建中间第三图像特征向量;对中间第三图像特征向量进行转置处理,得到转置后的第三图像特征向量。
可选地,根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像,包括:确定与当前轮迭代对应的图像的更新步长;基于与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像的更新步长,得到与当前轮迭代对应的图像的更新梯度值;根据与当前轮迭代对应的图像的更新梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像。
可选地,预定迭代条件包括预设迭代次数。
本发明的另一方面提供了一种图像处理模型训练方法,包括:利用对抗样本对待训练模型进行训练,得到训练后的图像处理模型,其中,对抗样本是利用上述对抗样本生成方法生成的。
本发明的另一方面提供了一种图像处理方法,包括:利用图像处理模型处理目标原始图像,得到针对目标原始图像的输出结果,其中,图像处理模型是利用上述图像处理模型训练方法训练得到的。
本发明的另一方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述对抗样本生成方法、图像处理模型训练方法及图像处理方法。
本发明的另一方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述对抗样本生成方法、图像处理模型训练方法及图像处理方法。
本发明的另一方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述对抗样本生成方法、图像处理模型训练方法及图像处理方法。
通过基于空间注意力机制和通道注意力机制,计算出图像特征向量的分散度以及特征通道权重,基于由分散度函数以及特征通道权重函数构成的函数组,对图像的图像深度特征进行优化和细化,确定图像特征向量中每个通道的重要性,并使得优化和细化后的图像深度特征的分散度能够迫使对抗样本图像的高响应特征和低响应特征趋于一致,提高了生成的对抗样本迁移性以及在一些实际部署的多任务融合场景中的实用性和拓展性。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本发明实施例的对抗样本生成方法、图像处理模型的训练方法、图像处理方法及装置的应用场景图;
图2示意性示出了根据本发明实施例的对抗样本生成方法的流程图;
图3示意性示出了根据本发明实施例的得到与当前轮迭代对应的图像的第一图像特征向量的方法的流程图;
图4示意性示出了根据本发明实施例的图像处理模型训练方法的流程图;
图5示意性示出了根据本发明实施例的图像处理方法的流程图;
图6示意性示出了根据本发明实施例的对抗样本生成方法的示意图;
图7示意性示出了根据本发明实施例的对抗样本生成装置的框图;
图8示意性示出了根据本发明实施例的图像处理模型训练装置的框图;
图9示意性示出了根据本发明实施例的图像处理装置的框图;
图10示意性示出了根据本发明实施例的适于实现对抗样本生成方法、图像处理模型训练方法和图像处理方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本发明的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本发明实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本发明。在此使用的术语“包括”、“包含”等表明了特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本发明实施例提供了一种对抗样本生成方法,包括:基于空间注意力机制,对与当前轮迭代对应的图像的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量;对与当前轮迭代对应的图像的图像特征数据进行第二处理,得到与当前轮迭代对应的图像的第二图像特征向量;对由分散度函数和特征通道权重函数构成的函数组进行求导,得到求导后的函数组,基于求导后的函数组,根据与当前轮迭代对应的图像的第二图像特征向量和与当前轮迭代对应的图像的第一图像特征向量,得到与当前轮迭代对应的图像的梯度值,其中,分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数,特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数;根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像;将满足预定迭代条件的图像确定为对抗样本。
图1示意性示出了根据本发明实施例的对抗样本生成方法、图像处理模型的训练方法、图像处理方法及装置的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103、网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本发明实施例所提供的对抗样本生成方法、图像处理模型的训练方法和图像处理方法一般可以由服务器105执行。相应地,本发明实施例所提供的对抗样本生成装置、图像处理模型的训练装置和图像处理装置一般可以设置于服务器105中。本发明实施例所提供的对抗样本生成方法、图像处理模型的训练方法和图像处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本发明实施例所提供的对抗样本生成装置、图像处理模型的训练装置和图像处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本发明实施例的对抗样本生成方法的流程图。
如图2所示,该方法200包括操作S210~操作S250。
在操作S210,基于空间注意力机制,对与当前轮迭代对应的图像的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量。
在操作S220,对与当前轮迭代对应的图像的图像特征数据进行第二处理,得到与当前轮迭代对应的图像的第二图像特征向量。
在操作S230,对由分散度函数和特征通道权重函数构成的函数组进行求导,得到求导后的函数组,基于求导后的函数组,根据与当前轮迭代对应的图像的第二图像特征向量和与当前轮迭代对应的图像的第一图像特征向量,得到与当前轮迭代对应的图像的梯度值。分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数,特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数。
在操作S240,根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像。
在操作S250,将满足预定迭代条件的图像确定为对抗样本。
根据本发明的实施例,预定迭代条件可以用于作为图像是否满足对抗样本生成的条件。预定迭代条件可以包括预设迭代次数,预设迭代次数可以为迭代轮次达到最大迭代轮次的次数,可以根据实际需求自定义设置,在此不作限定。
根据本发明的实施例,预设迭代次数为
Figure 270474DEST_PATH_IMAGE001
,其中,
Figure 607521DEST_PATH_IMAGE002
,将正在 进行的轮次称为当前轮,当前轮为第t轮迭代,则与第t轮迭代对应的图像为
Figure 387258DEST_PATH_IMAGE003
。例如,对 与当前轮迭代对应的图像的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的 第一图像特征向量,如图3所示。
图3示意性示出了根据本发明实施例的得到与当前轮迭代对应的图像的第一图像特征向量的方法的流程图。
如图3所示,该方法300可以包括操作S310-S330。
在操作S310,根据与当前轮迭代对应的图像,得到与当前轮迭代对应的图像的第一中间图像特征向量。
在操作S320,基于空间注意力机制,对与当前轮迭代对应的图像进行特征提取,得到与当前轮迭代对应的图像的空间注意力权重矩阵。
在操作S330,根据与当前轮迭代对应的图像的第一中间图像特征向量和与当前轮迭代对应的图像的空间注意力权重矩阵,得到与当前轮迭代对应的图像的第一图像特征向量。
根据本发明的实施例,可以将与当前轮迭代对应的图像
Figure 454571DEST_PATH_IMAGE003
输入第一中间图像特 征提取模型中,对与当前轮迭代对应的图像进行图像特征提取,得到与当前轮迭代对应的 图像的第一中间图像特征向量
Figure 800102DEST_PATH_IMAGE004
根据本发明的实施例,可以将与当前轮迭代对应的图像
Figure 543936DEST_PATH_IMAGE005
输入空间注意力模型 中,对与当前轮迭代对应的图像进行特征处理,得到与当前轮迭代对应的图像的空间注意 力权重矩阵
Figure 217494DEST_PATH_IMAGE006
。空间注意力权重矩阵可以表征与当前轮迭代对应的图像上的每个目 标的概率。
根据本发明的实施例,空间注意力模型可由Transformer模型来实现。
根据本发明的实施例,根据与当前轮迭代对应的图像的第一中间图像特征向量
Figure 213131DEST_PATH_IMAGE007
和与当前轮迭代对应的图像的空间注意力权重矩阵
Figure 39267DEST_PATH_IMAGE008
,得到与当前轮迭代对 应的第一图像特征向量,可以包括:对空间注意力权重矩阵
Figure 32631DEST_PATH_IMAGE008
进行Sigmoid函数计算, 得到计算后的空间注意力权重
Figure 459064DEST_PATH_IMAGE009
,根据计算后的空间注意力权重
Figure 992814DEST_PATH_IMAGE010
和与当前轮迭代对应的图像的第一中间图像特征向量
Figure 171991DEST_PATH_IMAGE011
,得到与 当前轮迭代对应的空间注意力加权后的图像特征向量,即,与当前轮迭代对应的图像的第 一图像特征向量
Figure 273939DEST_PATH_IMAGE012
。可由式(1)表示:
Figure 46723DEST_PATH_IMAGE013
(1)。
根据本发明的实施例,对与当前轮迭代对应的图像的图像特征数据进行第二处理 可以包括:可以对与当前轮迭代对应的图像的图像特征数据进行变形处理,得到与当前轮 迭代对应的图像的第二图像特征向量,即,变形
Figure 321847DEST_PATH_IMAGE014
根据本发明的实施例,对由分散度函数和特征通道权重函数构成的函数组进行求导,得到求导后的函数组,基于求导后的函数组,根据与当前轮迭代对应的图像的第二图像特征向量和与当前轮迭代对应的图像的第一图像特征向量得到与当前轮迭代对应的图像的梯度值。
根据本发明的实施例,根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对 应的图像,得到与第t+1轮迭代对应的图像
Figure 721162DEST_PATH_IMAGE015
在进行第t+1轮迭代时,将得到的与第t+1轮迭代对应的图像
Figure 587487DEST_PATH_IMAGE015
分别输入第一中 间图像特征提取模型中和空间注意力模型中,对与第t+1轮迭代对应的图像
Figure 988512DEST_PATH_IMAGE015
进行第一 处理,得到与第t+1轮迭代对应的图像的第一图像特征向量。再对与第t+1轮迭代对应的图 像
Figure 988698DEST_PATH_IMAGE016
进行第二处理,得到与第t+1轮迭代对应的第二图像特征向量。对由分散度函数和特 征通道权重函数构成的函数组进行求导,得到求导后的函数组。基于求导后的函数组,根据 与第t+1轮迭代对应的图像的第二图像特征向量和与第t+1轮迭代对应的图像的第一图像 特征向量得到与第t+1轮迭代对应的图像的梯度值,根据该梯度值与第t+1轮迭代对应的图 像,得到与第t+2轮迭代对应的图像。
根据本发明的实施例,特征通道权重函数是利用通道注意力机制,将与每轮迭代对应的图像的图像特征向量输入通道注意力模型中,建立与每轮迭代对应的图像的图像特征向量和图像特征向量的输入通道的关系,确定图像特征向量输入的每个通道的特征的重要性,实现对图像深度特征的进一步优化和细化分析。
根据本发明的实施例,基于空间注意力机制和通道注意力机制,计算出图像特征向量的分散度以及特征通道权重,基于由分散度函数以及特征通道权重函数构成的函数组,对图像的图像深度特征进行优化和细化,确定图像特征向量中每个通道的重要性,并使得优化和细化后的图像深度特征的分散度能够迫使对抗样本图像的高响应特征和低响应特征趋于一致,提高了生成的对抗样本迁移性以及在一些实际部署的多任务融合场景中的实用性和拓展性。
根据本发明的实施例,与每轮迭代对应的图像的第一图像特征向量可以包含多个通道对应的第一特征向量。
根据本发明的实施例,分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数。基于分散度函数计算与每轮迭代对应的图像的第一图像特征向量的分散度,可以包括:对第一图像特征向量中的多个通道对应的第一特征向量进行第一特征转换处理,得到第一图像特征向量中的每个通道对应的第一中间特征向量;对第一图像特征向量中的每个通道对应的第一中间特征向量进行计算,得到第一图像特征向量中的每个通道对应的第一中间特征向量的分散度;将第一图像特征向量中的每个通道对应的第一中间特征向量的分散度构建分散度矩阵,得到与每轮迭代对应的图像的第一图像特征向量的分散度。
根据本发明的实施例,在正在进行的轮次为当前轮的情况下,例如,当前轮可以为 第t轮迭代,与当前轮迭代对应的图像可以为
Figure 158780DEST_PATH_IMAGE003
,与当前轮迭代对应的图像的原始图像特 征数据的维度可以为
Figure 461585DEST_PATH_IMAGE017
,基于空间注意力机制,对与当前轮迭代对应的图像进 行处理后,得到的与当前轮迭代对应的第一图像特征向量的维度为
Figure 569480DEST_PATH_IMAGE018
,其中,
Figure 983144DEST_PATH_IMAGE019
为与第一图像特征向量对应的图像的通道数,
Figure 742153DEST_PATH_IMAGE020
Figure 481439DEST_PATH_IMAGE021
分别为与原始图像特征数据的对应的 图像的原始尺寸的高和宽,
Figure 575166DEST_PATH_IMAGE022
Figure 526941DEST_PATH_IMAGE023
分别为与第一图像特征向量对应的图像的高和宽。
根据本发明的实施例,对与当前轮迭代对应的图像的第一图像特征向量输入通道 注意力模型中,对与当前轮迭代对应的图像的第一图像特征向量进行第一特征转换处理, 例如,对第一图像特征向量进行变形处理,得到变形后的图像特征向量的维度可以为
Figure 406035DEST_PATH_IMAGE024
,变形后的图像特征向量包含有多个通道对应的第一中间特征向量,对每个通道 对应的第一中间特征向量进行分散度的计算,得到每个通道对应的第一中间特征向量的分 散度,即,
Figure 50643DEST_PATH_IMAGE025
,将得到的每个通道对应的第一中间特征向量的分散度构建 分散度矩阵为
Figure 395781DEST_PATH_IMAGE026
,得到与每轮迭代对应的图像的第一图像特征向量的分散度,即,
Figure 26613DEST_PATH_IMAGE027
。与每轮迭代对应的图像的第一图像特征向量的分散度可以用方差 或标准差来表示。
根据本发明的实施例,与每轮迭代对应的图像的第二图像特征向量可以包含多个通道对应的第二特征向量。
根据本发明的实施例,特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数。基于特征通道权重函数,计算与每轮迭代对应的图像的第二图像特征向量的特征通道权重,可以包括:对与每轮迭代对应的图像的第一图像特征向量进行处理,得到与每轮迭代对应的图像的第三图像特征向量;对第三图像特征向量进行转置处理,得到转置后的第三图像特征向量;根据转置后的第三图像特征向量和第二图像特征向量,得到与每轮迭代对应的图像的特征通道权重。
根据本发明的实施例,在正在进行的轮次为当前轮的情况下,例如,当前轮可以为 第t轮迭代,对与当前轮迭代对应的图像的第一图像特征向量进行处理,可以为对第一图像 特征向量对应的图像进行上采样处理,将第一图像特征向量对应的图像的尺寸的高和宽分 别放大至与当前轮迭代对应的图像的原始尺寸的高和宽相同,放大后的第一图像特征向量 的维度可以为
Figure 619269DEST_PATH_IMAGE028
,即,得到与当前轮迭代对应的图像的第三图像特征向量,第三图 像特征向量对应的图像为放大后的第一图像特征向量对应的图像,也就是上采样后的图 像,其中,上采样后的图像的图像特征向量维度可以为
Figure 559412DEST_PATH_IMAGE029
根据本发明的实施例,第三图像特征向量可以包括多个通道对应的第三特征向量。对第三图像特征向量进行转置处理,得到转置后的第三图像特征向量,可以包括:对第三图像特征向量中的每个通道对应的第三特征向量进行第二特征转换处理,得到第三图像特征向量中的每个通道对应的第二中间特征向量;对第三图像特征向量中的每个通道对应的第二中间特征向量构建中间第三图像特征向量;对中间第三图像特征向量进行转置处理,得到转置后的第三图像特征向量。
根据本发明的实施例,第三图像特征向量对应的图像可以为对第一图像特征向量 对应的图像进行上采样后的图像,第三图像特征向量的维度可以为
Figure 503097DEST_PATH_IMAGE030
,对第三 图像特征向量中的每个通道对应的第三特征向量进行第二特征转换处理,得到第三图像特 征向量中的每个通道对应的第二中间特征向量,对第三图像特征向量中的每个通道对应的 第二中间特征向量构建中间第三图像特征向量,中间第三图像特征向量的维度为
Figure 203200DEST_PATH_IMAGE031
,对中间第三图像特征向量进行转置,即,将
Figure 915941DEST_PATH_IMAGE032
进行转置为
Figure 262871DEST_PATH_IMAGE033
, 得到转置后的第三图像特征向量。
根据本发明的实施例,在正在进行的轮次为当前轮的情况下,例如,当前轮可以为 第t轮迭代,得到与当前轮迭代对应的图像的第二图像特征向量可以包括:对与当前轮迭代 对应的图像的原始图像特征数据进行变形处理,与当前轮迭代对应的图像的原始图像特征 数据的维度可以为
Figure 693852DEST_PATH_IMAGE034
,对与当前轮迭代对应的图像的原始图像特征数据进行 变形处理后,得到与当前轮迭代对应的图像的第二图像特征向量的维度可以为
Figure 666487DEST_PATH_IMAGE035
, 即,变形
Figure 889527DEST_PATH_IMAGE005
。根据与当前轮迭代对应的图像的第二图像特征向量的维度
Figure 781260DEST_PATH_IMAGE035
和转置 后的第三图像特征向量对应的图像的维度
Figure 574903DEST_PATH_IMAGE036
进行乘积,得到特征通道相似度较大 的特征通道权重向量
Figure 210284DEST_PATH_IMAGE037
,对该特征通道权重向量
Figure 520786DEST_PATH_IMAGE037
求平均值,获得与当前轮迭 代对应的图像的特征通道权重向量的维度为
Figure 848999DEST_PATH_IMAGE038
根据本发明的实施例,基于Sigmoid函数,可以根据与当前轮迭代对应的图像的第 二图像特征向量,(即,变形
Figure 457835DEST_PATH_IMAGE014
)和与当前轮迭代对应的图像的第一图像特征向量对应的 图像进行上采样后并进行第二特征转换处理后的图像(即,上采样且变形
Figure 303432DEST_PATH_IMAGE039
),得到 与当前轮迭代对应的图像的特征通道权重
Figure 845271DEST_PATH_IMAGE040
。可由式(2)表示:
Figure 734599DEST_PATH_IMAGE041
(2),
其中,mean是求平均操作,*表示相乘,得到的特征通道权重
Figure 502835DEST_PATH_IMAGE042
是一个
Figure 745597DEST_PATH_IMAGE043
的向量,C为第一中间图像特征向量
Figure 610785DEST_PATH_IMAGE044
对应的图像的通道数。
根据本发明的实施例,由分散度函数和特征通道权重函数构成的函数组
Figure 172479DEST_PATH_IMAGE045
可以表 示为式(3):
Figure 162431DEST_PATH_IMAGE046
(3),
其中,
Figure 208885DEST_PATH_IMAGE001
为预设迭代次数,其中,
Figure 82906DEST_PATH_IMAGE047
根据本发明的实施例,基于图像的分散度和特征通道权重函数确定函数组,能够对图像的深度特征信息进行优化和细化,并迫使对抗样本图像的高响应特征和低响应特征趋于一致。
根据本发明的实施例,根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像,包括:确定与当前轮迭代对应的图像的更新步长;基于与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像的更新步长,得到与当前轮对应的图像的更新梯度值;根据与当前轮迭代对应的图像的更新梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像。
根据本发明的实施例,与当前轮迭代对应的图像的梯度值可以通过对函数组
Figure 595927DEST_PATH_IMAGE045
进 行求导计算得到。更新步长可以理解为在每次的迭代过程中,按照梯度值的反方向更新特 定的参数的值,可以表示为
Figure 86558DEST_PATH_IMAGE048
根据本发明的实施例,例如,针对得到与第t+1次迭代对应的对抗样本,也就是与 第t+1次迭代对应的图像可以表示为
Figure 671123DEST_PATH_IMAGE049
,可以基于上述函数组
Figure 635537DEST_PATH_IMAGE045
(当
Figure 788301DEST_PATH_IMAGE050
为t时)通过求导计 算,得到与第t次迭代对应的图像的更新梯度值可以表示为
Figure 611900DEST_PATH_IMAGE051
,结合与第t次迭代对应 的图像
Figure 891834DEST_PATH_IMAGE052
,得到与第t+1次迭代对应的图像
Figure 586121DEST_PATH_IMAGE049
可以表示为式(4):
Figure 644207DEST_PATH_IMAGE053
(4),
根据本发明的实施例,为了避免对与每轮迭代对应的图像的扰动过大,对得到的 与每轮迭代对应的图像
Figure 486261DEST_PATH_IMAGE054
进行扰动上的约束,可以设定扰动上限为
Figure 537262DEST_PATH_IMAGE055
。例如,对得到的与 第t+1次迭代对应的图像
Figure 758159DEST_PATH_IMAGE049
进行扰动约束可以表示为式(5):
Figure 377359DEST_PATH_IMAGE056
(5),
其中,x为初始图像。
图4示意性示出了根据本发明实施例的图像处理模型训练方法的流程图。
如图4所示,该方法400可以包括操作S410。
在操作S410,利用对抗样本对待训练模型进行训练,得到训练后的图像处理模型,其中,对抗样本是利用上述对抗样本生成方法生成的。
根据本发明的实施例,待训练模型可以为待训练的深度学习分类模型,可以为不同图像分类的数据序列的模型。将利用上述对抗样本的生成方法生成的对抗样本输入待训练模型中,训练深度学习分类模型,将训练好的深度学习分类模型确定为图像处理模型。
图5示意性示出了根据本发明实施例的图像处理方法的流程图。
如图5所示,该方法500可以包括操作:S510。
在操作S510,利用图像处理模型处理目标原始图像,得到针对目标原始图像的输出结果,其中,图像处理模型是利用上述图像处理模型训练方法训练得到的。
根据本发明的实施例,例如,需要对目标原始图像进行处理可以包括图像分类、图像检测和图像分割等,利用上述图像处理方法将目标原始图像输入利用上述图像处理模型训练得到的图像处理模型中,得出针对目标原始图像的输出结果,例如,图像分类结果、图像检测结果或图像分割结果等。
根据本发明的实施例,利用上述对抗样本的生成方法生成的对抗样本训练图像处理模型,利用该图像处理模型处理数据,以提高生成的对抗样本针对不同的图像处理任务时图像处理模型的泛化性,以使得生成的对抗样本具有较好的实用性和拓展性。
图6示意性示出了根据本发明实施例的对抗样本生成方法的示意图。
如图6所示,在示意图600中,将与每轮迭代对应的图像601输入第一中间图像特征提取模型602中进行第一处理,得到与每轮迭代对应的图像的第一中间图像特征向量603。将与每轮迭代对应的图像601进行预处理,得到预处理后的图像604,将预处理后的图像604输入Transformer模型605中,获取与每轮迭代对应的图像的空间注意力权重606,将空间注意力权重606与第一中间图像特征向量603进行加权,得到加权后的图像特征向量,即,与每轮迭代对应的图像的第一图像特征向量607,对第一图像特征向量607对应的图像进行上采样,获得上采样后的第一图像特征向量对应的图像特征,即,与每轮迭代对应的第三图像特征向量608。
基于通道注意力机制,将与每轮迭代对应的图像的第一图像特征向量607的每个通道对应的第一特征向量进行第一特征转换处理,生成转换后的第一图像特征向量,即,第一图像特征向量中的每个通道对应的第一中间特征向量609,将第一图像特征向量中的每个通道对应的第一中间特征向量609中的C个通道进行分散度计算,得到第一图像特征向量中的每个通道对应的第一中间特征向量的分散度,将第一图像特征向量中的每个通道对应的第一中间特征向量的分散度构建分散度矩阵610,得到与每轮迭代对应的图像的第一图像特征向量的分散度。将与每轮迭代对应的图像601的图像特征数据进行第二处理,得到与每轮迭代对应的图像的第二图像特征向量611。将与每轮迭代对应的第三图像特征向量608进行第二特征转换处理,得到第三图像特征向量中的每个通道对应的第二中间特征向量,对第三图像特征向量中的每个通道对应的第二中间特征向量构建中间第三图像特征向量612,对中间第三图像特征向量612进行转置处理后,与第二图像特征向量611进行相乘计算并求平均后,得到与每轮迭代对应的图像的特征通道权重613。基于由与每轮迭代对应的图像的分散度函数与特征通道权重函数构成的函数组614进行求导,得到梯度值615,将梯度值添加至与每轮迭代对应的图像601中,得到与下一轮迭代对应的图像616,直到将满足预定迭代条件的图像确定为对抗样本。
图7示意性示出了根据本发明实施例的对抗样本生成装置的框图。
如图7所示,该装置700可以包括:第一处理模块710、第二处理模块720、第一获得模块730、第二获得模块740和确定模块750。
第一处理模块710,用于基于空间注意力机制,对与当前轮迭代对应的图像的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量。
第二处理模块720,用于对与当前轮迭代对应的图像的图像特征数据进行第二处理,得到与当前轮迭代对应的图像的第二图像特征向量。
第一获得模块730,用于对由分散度函数和特征通道权重函数构成的函数组进行求导,得到求导后的函数组,基于求导后的函数组,根据与当前轮迭代对应的图像的第二图像特征向量和与当前轮迭代对应的图像的第一图像特征向量,得到与当前轮迭代对应的图像的梯度值,其中,分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数,特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数。
第二获得模块740,用于根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像。
确定模块750,用于将满足预定迭代条件的图像确定为对抗样本。
根据本发明的实施例,第一处理模块710可以包括:第一获得子模块、提取子模块和第二获得子模块。
第一获得子模块,用于根据与当前轮迭代对应的图像,得到与当前轮迭代对应的图像的第一中间图像特征向量。
提取子模块,用于基于空间注意力机制,对与当前轮迭代对应的图像进行特征提取,得到与当前轮迭代对应的图像的空间注意力权重矩阵。
第二获得子模块,用于根据与当前轮迭代对应的图像的第一中间图像特征向量和与当前轮迭代对应的图像的空间注意力权重矩阵,得到与当前轮迭代对应的图像的第一图像特征向量。
根据本发明的实施例,第一图像特征向量包含多个通道对应的第一特征向量。
根据本发明的实施例,分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数,包括:对第一图像特征向量中的多个通道对应的第一特征向量进行第一特征转换处理,得到第一图像特征向量中的每个通道对应的第一中间特征向量。对第一图像特征向量中的每个通道对应的第一中间特征向量进行计算,得到第一图像特征向量中的每个通道对应的第一中间特征向量的分散度。将第一图像特征向量中的每个通道对应的第一中间特征向量的分散度构建分散度矩阵,得到与每轮迭代对应的图像的第一图像特征向量的分散度。
根据本发明的实施例,第二图像特征向量包含多个通道对应的第二特征向量。
根据本发明的实施例,特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数,包括:对与每轮迭代对应的图像的第一图像特征向量进行处理,得到与每轮迭代对应的图像的第三图像特征向量。对第三图像特征向量进行转置处理,得到转置后的第三图像特征向量。根据转置后的第三图像特征向量和第二图像特征向量,得到与每轮迭代对应的图像的特征通道权重。
根据本发明的实施例,第三图像特征向量包含多个通道对应的第三特征向量。
根据本发明的实施例,对第三图像特征向量进行转置处理,得到转置后的第三图像特征向量,包括:对第三图像特征向量中的每个通道对应的第三特征向量进行第二特征转换处理,得到第三图像特征向量中的每个通道对应的第二中间特征向量。对第三图像特征向量中的每个通道对应的第二中间特征向量构建中间第三图像特征向量。对中间第三图像特征向量进行转置处理,得到转置后的第三图像特征向量。
根据本发明的实施例,第二获得模块740包括:确定子模块、第三获得子模块和第四获得子模块。
确定子模块,用于确定与当前轮迭代对应的图像的更新步长。
第三获得子模块,用于基于与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像的更新步长,得到与当前轮迭代对应的图像的更新梯度值。
第四获得子模块,用于根据与当前轮迭代对应的图像的更新梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像。
根据本发明的实施例,预定迭代条件包括预设迭代次数。
图8示意性示出了根据本发明实施例的图像处理模型训练装置的框图。
如图8所示,该装置800可以包括:训练模块810。
训练模块810,用于利用对抗样本对待训练模型进行训练,得到训练后的图像处理模型,其中,对抗样本是利用上述对抗样本生成方法生成的。
图9示意性示出了根据本发明实施例的图像处理装置的框图。
如图9所示,该装置900可以包括:第三获得模块910。
第三获得模块910,用于利用图像处理模型处理目标原始图像,得到针对目标原始图像的输出结果,其中,图像处理模型是利用上述图像处理模型训练方法训练得到的。
根据本发明的实施例,本发明还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本发明的实施例,一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述对抗样本生成方法、图像处理模型训练方法和图像处理方法。
根据本发明的实施例,一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述对抗样本生成方法、图像处理模型训练方法和图像处理方法。
根据本发明的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述对抗样本生成方法、图像处理模型训练方法和图像处理方法。
图10示意性示出了根据本发明实施例的适于实现对抗样本生成方法、图像处理模型训练方法和图像处理方法的电子设备的方框图。
如图10所示,根据本发明实施例的电子设备1000包括处理器1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。处理器1001例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器1001还可以包括用于缓存用途的板载存储器。处理器1001可以包括用于执行根据本发明实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1003中,存储有电子设备1000操作所需的各种程序和数据。处理器 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。处理器1001通过执行ROM 1002和/或RAM1003中的程序来执行根据本发明实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM 1002和RAM 1003以外的一个或多个存储器中。处理器1001也可以通过执行存储在一个或多个存储器中的程序来执行根据本发明实施例的方法流程的各种操作。
根据本发明的实施例,电子设备1000还可以包括输入/输出(I/O)接口1005,输入/输出(I/O)接口1005也连接至总线1004。电子设备1000还可以包括连接至I/O接口1005的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本发明实施例的方法。
根据本发明的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本发明的实施例,计算机可读存储介质可以包括上文描述的ROM 1002和/或RAM 1003和/或ROM 1002和RAM 1003以外的一个或多个存储器。
本发明的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本发明实施例所提供的对抗样本生成方法、图像处理模型训练方法和图像处理方法。
在该计算机程序被处理器1001执行时执行本发明实施例的系统/装置中限定的上述功能。根据本发明的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分1009被下载和安装,和/或从可拆卸介质1011被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被处理器1001执行时,执行本发明实施例的系统中限定的上述功能。根据本发明的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本发明的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本发明的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本发明中。特别地,在不脱离本发明精神和教导的情况下,本发明的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本发明的范围。
以上对本发明的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本发明的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本发明的范围由所附权利要求及其等同物限定。不脱离本发明的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本发明的范围之内。

Claims (7)

1.一种对抗样本生成方法,包括:
基于空间注意力机制,对与当前轮迭代对应的图像的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量,所述第一图像特征向量包含多个通道对应的第一特征向量;
对与所述当前轮迭代对应的图像的图像特征数据进行第二处理,得到与当前轮迭代对应的图像的第二图像特征向量,所述第二图像特征向量包含多个通道对应的第二特征向量;
对由分散度函数和特征通道权重函数构成的函数组进行求导,得到求导后的函数组,基于所述求导后的函数组,根据与所述当前轮迭代对应的图像的第二图像特征向量和与所述当前轮迭代对应的图像的第一图像特征向量,得到与当前轮迭代对应的图像的梯度值,其中,所述分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数,所述特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数;
根据与所述当前轮迭代对应的图像的梯度值和与所述当前轮迭代对应的图像,得到与下一轮迭代对应的图像;
将满足预定迭代条件的图像确定为所述对抗样本;
其中,所述基于空间注意力机制,对与当前轮迭代对应的图像的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量,包括:
根据与所述当前轮迭代对应的图像,得到与当前轮迭代对应的图像的第一中间图像特征向量;
基于空间注意力机制,对与所述当前轮迭代对应的图像进行特征提取,得到与当前轮迭代对应的图像的空间注意力权重矩阵;
根据与所述当前轮迭代对应的图像的第一中间图像特征向量和与所述当前轮迭代对应的图像的空间注意力权重矩阵,得到与所述当前轮迭代对应的图像的第一图像特征向量;
其中,所述对与所述当前轮迭代对应的图像的图像特征数据进行第二处理,得到与当前轮迭代对应的图像的第二图像特征向量,包括:
对与所述当前轮迭代对应的图像的图像特征数据进行变形处理,得到与所述当前轮迭代对应的图像的第二图像特征向量;
其中,所述分散度函数是用于基于与每轮迭代对应的图像的第一图像特征向量计算分散度的函数,包括:
对所述第一图像特征向量中的多个通道对应的第一特征向量进行第一特征转换处理,得到所述第一图像特征向量中的每个通道对应的第一中间特征向量;
对所述第一图像特征向量中的每个通道对应的第一中间特征向量进行计算,得到所述第一图像特征向量中的每个通道对应的第一中间特征向量的分散度;
将所述第一图像特征向量中的每个通道对应的第一中间特征向量的分散度构建分散度矩阵,得到与每轮迭代对应的图像的第一图像特征向量的分散度;
其中,所述特征通道权重函数是用于基于通道注意力机制,根据与每轮迭代对应的图像的第二图像特征向量计算特征通道权重的函数,包括:
对与所述每轮迭代对应的图像的第一图像特征向量进行处理,得到与每轮迭代对应的图像的第三图像特征向量;
对所述第三图像特征向量进行转置处理,得到转置后的第三图像特征向量;
根据所述转置后的第三图像特征向量和所述第二图像特征向量,得到与每轮迭代对应的图像的特征通道权重。
2.根据权利要求1所述的方法,其中,所述第三图像特征向量包含多个通道对应的第三特征向量;
所述对所述第三图像特征向量进行转置处理,得到转置后的第三图像特征向量,包括:
对所述第三图像特征向量中的每个通道对应的第三特征向量进行第二特征转换处理,得到所述第三图像特征向量中的每个通道对应的第二中间特征向量;
对所述第三图像特征向量中的每个通道对应的第二中间特征向量构建中间第三图像特征向量;
对所述中间第三图像特征向量进行转置处理,得到所述转置后的第三图像特征向量。
3.根据权利要求1所述的方法,其中,所述根据与所述当前轮迭代对应的图像的梯度值和与所述当前轮迭代对应的图像,得到与下一轮迭代对应的图像,包括:
确定与所述当前轮迭代对应的图像的更新步长;
基于与所述当前轮迭代对应的图像的梯度值和与所述当前轮迭代对应的图像的更新步长,得到与所述当前轮对应的图像的更新梯度值;
根据与所述当前轮迭代对应的图像的更新梯度值和与所述当前轮迭代对应的图像,得到与所述下一轮迭代对应的图像。
4.根据权利要求1所述的方法,其中,所述预定迭代条件包括预设迭代次数。
5.一种图像处理模型训练方法,包括:
利用对抗样本对待训练模型进行训练,得到训练后的图像处理模型,
其中,所述对抗样本是利用权利要求1所述的方法生成的。
6.一种图像处理方法,包括:
利用图像处理模型处理目标原始图像,得到针对所述目标原始图像的输出结果,
其中,所述图像处理模型是利用权利要求5所述的训练方法训练得到的。
7.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~6中任一项所述的方法。
CN202210525739.9A 2022-05-16 2022-05-16 对抗样本生成方法、模型训练方法、处理方法及电子设备 Active CN114612688B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210525739.9A CN114612688B (zh) 2022-05-16 2022-05-16 对抗样本生成方法、模型训练方法、处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210525739.9A CN114612688B (zh) 2022-05-16 2022-05-16 对抗样本生成方法、模型训练方法、处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN114612688A CN114612688A (zh) 2022-06-10
CN114612688B true CN114612688B (zh) 2022-09-09

Family

ID=81870706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210525739.9A Active CN114612688B (zh) 2022-05-16 2022-05-16 对抗样本生成方法、模型训练方法、处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN114612688B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115392326B (zh) * 2022-10-27 2024-03-19 中国人民解放军国防科技大学 基于联合多模态信息与域对抗神经网络的调制识别方法
CN116543268B (zh) * 2023-07-04 2023-09-15 西南石油大学 基于通道增强联合变换的对抗样本生成方法及终端

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913450A (zh) * 2016-06-22 2016-08-31 武汉理工大学 基于神经网络图像处理的轮胎橡胶炭黑分散度评价方法及系统
CN109948658A (zh) * 2019-02-25 2019-06-28 浙江工业大学 面向特征图注意力机制的对抗攻击防御方法及应用
CN110147777A (zh) * 2019-05-24 2019-08-20 合肥工业大学 一种基于深度迁移学习的绝缘子类别检测方法
CN110728224A (zh) * 2019-10-08 2020-01-24 西安电子科技大学 一种基于注意力机制深度Contourlet网络的遥感图像分类方法
CN111199233A (zh) * 2019-12-30 2020-05-26 四川大学 一种改进的深度学习色情图像识别方法
CN111460881A (zh) * 2020-01-16 2020-07-28 华中科技大学 基于近邻判别的交通标志对抗样本检测方法和分类装置
CN111542841A (zh) * 2018-06-08 2020-08-14 北京嘀嘀无限科技发展有限公司 一种内容识别的系统和方法
CN111737691A (zh) * 2020-07-24 2020-10-02 支付宝(杭州)信息技术有限公司 对抗样本的生成方法和装置
CN113178255A (zh) * 2021-05-18 2021-07-27 西安邮电大学 一种基于gan的医学诊断模型对抗攻击方法
CN113688894A (zh) * 2021-08-19 2021-11-23 匀熵科技(无锡)有限公司 一种融合多粒度特征的细粒度图像分类方法
WO2022018427A2 (en) * 2020-07-20 2022-01-27 Deep Render Ltd Image compression and decoding, video compression and decoding: training methods and training systems
CN114066912A (zh) * 2021-11-23 2022-02-18 中国人民解放军战略支援部队信息工程大学 基于优化算法和不变性的智能对抗样本生成方法及系统
CN114091554A (zh) * 2020-07-17 2022-02-25 华为技术有限公司 一种训练集处理方法和装置
CN114240951A (zh) * 2021-12-13 2022-03-25 电子科技大学 一种基于查询的医学图像分割神经网络的黑盒攻击方法
WO2022073452A1 (zh) * 2020-10-07 2022-04-14 武汉大学 一种基于自注意力上下文网络的高光谱遥感图像分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11481876B2 (en) * 2020-04-08 2022-10-25 Mitsubishi Electric Research Laboratories, Inc. Systems and methods for blind multi-spectral image fusion

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913450A (zh) * 2016-06-22 2016-08-31 武汉理工大学 基于神经网络图像处理的轮胎橡胶炭黑分散度评价方法及系统
CN111542841A (zh) * 2018-06-08 2020-08-14 北京嘀嘀无限科技发展有限公司 一种内容识别的系统和方法
CN109948658A (zh) * 2019-02-25 2019-06-28 浙江工业大学 面向特征图注意力机制的对抗攻击防御方法及应用
CN110147777A (zh) * 2019-05-24 2019-08-20 合肥工业大学 一种基于深度迁移学习的绝缘子类别检测方法
CN110728224A (zh) * 2019-10-08 2020-01-24 西安电子科技大学 一种基于注意力机制深度Contourlet网络的遥感图像分类方法
CN111199233A (zh) * 2019-12-30 2020-05-26 四川大学 一种改进的深度学习色情图像识别方法
CN111460881A (zh) * 2020-01-16 2020-07-28 华中科技大学 基于近邻判别的交通标志对抗样本检测方法和分类装置
CN114091554A (zh) * 2020-07-17 2022-02-25 华为技术有限公司 一种训练集处理方法和装置
WO2022018427A2 (en) * 2020-07-20 2022-01-27 Deep Render Ltd Image compression and decoding, video compression and decoding: training methods and training systems
CN111737691A (zh) * 2020-07-24 2020-10-02 支付宝(杭州)信息技术有限公司 对抗样本的生成方法和装置
WO2022073452A1 (zh) * 2020-10-07 2022-04-14 武汉大学 一种基于自注意力上下文网络的高光谱遥感图像分类方法
CN113178255A (zh) * 2021-05-18 2021-07-27 西安邮电大学 一种基于gan的医学诊断模型对抗攻击方法
CN113688894A (zh) * 2021-08-19 2021-11-23 匀熵科技(无锡)有限公司 一种融合多粒度特征的细粒度图像分类方法
CN114066912A (zh) * 2021-11-23 2022-02-18 中国人民解放军战略支援部队信息工程大学 基于优化算法和不变性的智能对抗样本生成方法及系统
CN114240951A (zh) * 2021-12-13 2022-03-25 电子科技大学 一种基于查询的医学图像分割神经网络的黑盒攻击方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Enhancing Cross-task Transferability of Adversarial Examples with Dispersion Reduction;Yantao Lu等;《ResearchGate》;20191122;第1-13页 *
基于空间感知的多级损失目标跟踪对抗攻击方法;程旭;《通信学报》;20211130;第242-254页 *

Also Published As

Publication number Publication date
CN114612688A (zh) 2022-06-10

Similar Documents

Publication Publication Date Title
US11681924B2 (en) Training neural networks using a variational information bottleneck
CN108898186B (zh) 用于提取图像的方法和装置
US10936949B2 (en) Training machine learning models using task selection policies to increase learning progress
CN111279362B (zh) 胶囊神经网络
US11361188B2 (en) Method and apparatus for optimizing tag of point of interest
EP3234871B1 (en) Generating numeric embeddings of images
CN114612688B (zh) 对抗样本生成方法、模型训练方法、处理方法及电子设备
US20180189950A1 (en) Generating structured output predictions using neural networks
US11636314B2 (en) Training neural networks using a clustering loss
US20210158211A1 (en) Linear time algorithms for privacy preserving convex optimization
CN111476228A (zh) 针对场景文字识别模型的白盒对抗样本生成方法
EP3998583A2 (en) Method and apparatus of training cycle generative networks model, and method and apparatus of building character library
US11544498B2 (en) Training neural networks using consistency measures
WO2020154537A1 (en) Convolutional neural networks with soft kernel selection
CN114648675A (zh) 对抗训练方法、图像处理方法、装置、设备和介质
US20210166131A1 (en) Training spectral inference neural networks using bilevel optimization
CN113553386A (zh) 嵌入表示模型训练方法、基于知识图谱的问答方法及装置
CN113255819B (zh) 用于识别信息的方法和装置
CN115457365A (zh) 一种模型的解释方法、装置、电子设备及存储介质
CN114186039A (zh) 一种视觉问答方法、装置及电子设备
CN110516717B (zh) 用于生成图像识别模型的方法和装置
CN113011410A (zh) 字符识别模型的训练方法、字符识别方法及装置
JP7047665B2 (ja) 学習装置、学習方法及び学習プログラム
CN114612689B (zh) 对抗样本生成方法、模型训练方法、处理方法及电子设备
US20230244706A1 (en) Model globalization for long document summarization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant