CN110021049B - 一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法 - Google Patents

一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法 Download PDF

Info

Publication number
CN110021049B
CN110021049B CN201910249635.8A CN201910249635A CN110021049B CN 110021049 B CN110021049 B CN 110021049B CN 201910249635 A CN201910249635 A CN 201910249635A CN 110021049 B CN110021049 B CN 110021049B
Authority
CN
China
Prior art keywords
image
antagonistic
complex
area
concealment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910249635.8A
Other languages
English (en)
Other versions
CN110021049A (zh
Inventor
王志波
郑思言
宋梦凯
王骞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201910249635.8A priority Critical patent/CN110021049B/zh
Publication of CN110021049A publication Critical patent/CN110021049A/zh
Application granted granted Critical
Publication of CN110021049B publication Critical patent/CN110021049B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/94Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,相较于以往用于攻击神经网络的对抗性图像生成方法,本方法考虑生成样本的不可见性,通过多尺度区域复杂度融合搜索图像的复杂区域,并自适应地在复杂区域加入生成的噪声,实现高隐蔽性的对抗性图像攻击。此外,本方法具有高扩展性,可以与现有的对抗性图像攻击方法相结合,在不影响攻击成功率的条件下,生成面向深度神经网络的不可见性更高的对抗性图像。

Description

一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图 像攻击方法
技术领域
本发明涉及一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,属于人工智能安全领域。
背景技术
近年来,深度学习技术发展迅速,深度神经网络在各种领域展现出接近甚至超过人类的表现,如:图像分类、目标检测、自然语言处理等。因此,深度神经网络被广泛地用于解决各类实际任务,如无人驾驶、语音识别、智能监控等。然而近期研究表明深度神经网络对于特定的攻击十分脆弱:将输入图像加上精心构建的人类难以察觉的噪声,深度神经网络会输出错误甚至攻击者期望的结果,这类修改后的输入称之为对抗性图像。这类对抗性图像对于深度神经网络具有极高的攻击成功率,且具有可转移性:通过特定的网络生成的对抗性图像可以攻击一系列的网络结构。这类对抗性图像攻击给基于深度学习技术的安全敏感应用带来了巨大的威胁。
然而,通过对现有对抗性图像算法进行研究,我们发现生成的对抗性图像并没有达到高隐蔽性:观察者可以在图像上找到攻击者添加的噪声。这会造成对抗样本与原始图像有较大的差异,从而引起观察者的怀疑,认为图像被攻击者蓄意修改。由于一张图像中不同的区域复杂程度不同,而现有的攻击算法在生成噪声的时候对每一个像素采取同样的策略,这会导致在复杂程度相对低的区域加上了过量噪声,使得生成的对抗性图像容易被人眼所分辨。低隐蔽性的对抗性图像虽然能够达到高攻击成功率,但很容易被受过训练的观察者所察觉,并及时阻止攻击的发动。
本发明认为现有的对抗性图像生成方法仅仅满足对深度神经网络的高攻击成功率,在不可见性上表现很差,使得对抗性图像引起观察者的怀疑,无法实施成功的攻击,因此急需一种高隐蔽性的对抗性图像生成方法。
发明内容
本发明的目的是克服现有技术的不足,提供一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法。
面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法包含如下步骤:
1)给定一个图像分类器,输入原始图像,该分类器输出图像的类别以及分类到每一个类别的概率。攻击者能够访问目标模型的参数和权重,并设定给定图像的目标类别。
2)考虑图像对比度、能量、同质性、边缘密度和压缩比,提出衡量图像区域复杂度的函数。通过该函数来确定给定图像不同尺度下图像复杂的区域。
3)为了确定给定图像加噪声区域,提出细粒度图像复杂区域搜索算法,将不同尺度下的复杂区域进行融合,得到最终的满足添加噪声不被人眼察觉的复杂区域。
4)与现有的对抗性图像生成算法结合,仅在确定的复杂区域对图像进行修改,得到基于空间约束的并对抗性图像生成方法,生成高隐蔽性对抗性图像,使目标模型分类到目标类别。
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,不同于现有对抗性图像生成方法,通过对给定图像的像素空间进行约束,自适应地在图像复杂区域加上噪声,使得这些精细构建的噪声被很好地被掩盖。将选择的复杂区域作为限制,与现有对抗性图像生成方法相结合,通过优化目标函数生成噪声使目标模型分类对抗性图像到目标类别的概率最大,从而达到攻击者的目标,使分类器输出攻击者设计的目标类别。由于噪声加到了图像复杂区域,会对观察者不可见,所以能够使发动的攻击不被检测到和被观察者阻止。
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,目标图像分类器可以表示为f(x,θ)=y,其中x为模型输入的图像,θ为模型参数,y为模型输出,即对输入图像x的类别预测。模型输出倒数第二层被称作logits层,输出原始图像对应的每种类别的置信度。而最后一层称作softmax层,输出logits层结果归一化后的结果,即分类到每种类别的概率。分类器最后的输出y即为softmax层的最大值,表示为:
f((x,θ))=max(softmax(logits(x)))=y
攻击者以一个训练好的基于神经网络图像分类器为攻击目标,对目标模型具有白盒访问权限,即能够访问目标模型的参数和权重,并对给定图像设定目标类别,生成高隐蔽性对抗性图像使得目标模型将其分类到目标类别。
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,攻击者首先计算给定图像的不同尺度下的区域复杂度,计算图像的对比度、能量、同质性、边缘密度和压缩比,用M1~M5来表示。将各项指标进行线性组合,得到图像区域复杂度函数:
Figure BDA0002012034180000031
其中g为图像划分的一个单位区域,ωi为对应指标Mi的系数,n取值为5。我们选取对比度、能量、同质性、边缘密度以及压缩比5个图像复杂度指标,分别计算在大尺度下和小尺度下的图像区域复杂度。对比度通过计算每个像素与相邻像素之间的对比度总和得到;能量为图像灰度共生矩阵中元素平方的总和;同质性由图像灰度共生矩阵中元素分布的接近程度刻画;边缘密度通过canny边缘算子计算平均边缘密度;压缩比为压缩的JPEG图像与未压缩图像的比率。在小尺度下的权值向量
Figure BDA0002012034180000032
在大尺度下的权值向量
Figure BDA0002012034180000033
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,提出细粒度图像复杂区域搜索算法,选取不同尺度下的复杂度高的区域进行融合,得到原始图像对噪声隐蔽性高的区域。首先选取小尺度P0下的复杂区域集合:
Figure BDA0002012034180000034
其中G0为按复杂度从高到低排列的小尺度P0图像区域集合,η0为小尺度P0下选择的复杂区域数目,gk为选取的复杂区域集合。同样的,对于大尺度Pi下的复杂区域集合的选取如下:
Figure BDA0002012034180000041
其中Gi为按复杂度从高到低排列的尺度Pi图像区域集合,ηi为小尺度P0下选择的复杂区域数目,gk为选取的复杂区域集合。将每一个大尺度Pi下的复杂区域集合与小尺度P0下的复杂区域进行融合:
Figure BDA0002012034180000042
其中
Figure BDA0002012034180000043
表示每一个选择小尺度区域g和大尺度区域集合
Figure BDA0002012034180000044
重合的面积,当该面积大于g的一半时,将g融合到
Figure BDA0002012034180000045
中。如此迭代直到
Figure BDA0002012034180000046
不再变化。最后取与小尺度区域融合后的所有大尺度下的复杂区域的交集作为最终原始图像的复杂区域:
Figure BDA0002012034180000047
其中
Figure BDA0002012034180000048
为融合后的大尺度Pi下的复杂区域,n为选取的大尺度数量,求得的R(x)即为图像可加噪的区域。
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,考虑图像可加噪的区域,得到如下生成对抗性图像的优化问题:
min‖δ·Mask‖p+c·loss(x+δ,t)
这里δ是所求的噪声,Mask是一个与图像相同大小的矩阵,由图像可加噪的区域求得:
Figure BDA0002012034180000049
这里xi,j为图像坐标为(i,j)的像素点。loss(x+δ,t)为目标分类器的损失函数,t为攻击者所设的目标类别。该方法可以与现有的对抗性图像生成算法相结合,来生成具有高隐蔽性的对抗性图像。基于空间约束的FGSM对抗性图像生成算法可以表示为:
Figure BDA00020120341800000410
其中ε表示步长。同样的,基于空间约束的BIM对抗性图像生成算法可以表示为:
Figure BDA00020120341800000411
其中clipx,ε(·)为裁剪函数,保证图像的像素的值在有效范围之内。对于基于空间约束的CW对抗性图像生成算法,可以表示为:
Figure BDA0002012034180000051
其中
Figure BDA0002012034180000052
在优化式中优化ω来保证图像各个像素的值在有效范围之内。
本发明和现有技术相比,具有的有益效果是:1、与现存的对抗性图像生成算法不同,本发明考虑生成样本的不可见性,基于空间约束地在图像复杂区域加入生成的噪声,实现高隐蔽性的对抗性图像攻击。2、本发明提出衡量不同尺度下图像划分的区域复杂度计算方法,能够得到不同尺度下的图像复杂区域。3、为了得到图像能够掩盖噪声的区域,本发明提出多尺度复杂区域融合算法,将不同尺度下求得的复杂区域进行融合。4、本发明具有高扩展性,可以与现存的各种对抗性图像生成算法结合,得到具有高隐蔽性且攻击能力强的对抗性图像。
附图说明
图1为基于空间约束的高隐蔽性对抗性图像攻击框架。
图2为三种基于空间约束的对抗性图像生成算法的攻击示意图。
图3为细粒度图像复杂区域搜索算法。
具体实施方式
面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法包含如下步骤:
1)给定一个图像分类器,输入原始图像,该分类器输出图像的类别以及分类到每一个类别的概率。攻击者能够访问目标模型的参数和权重,并设定给定图像的目标类别。
2)考虑图像对比度、能量、同质性、边缘密度和压缩比,提出衡量图像区域复杂度的函数。通过该函数来确定给定图像不同尺度下图像复杂的区域。
3)为了确定给定图像加噪声区域,提出细粒度图像复杂区域搜索算法,将不同尺度下的复杂区域进行融合,得到最终的满足添加噪声不被人眼察觉的复杂区域。
4)与现有的对抗性图像生成算法结合,仅在确定的复杂区域对图像进行修改,得到基于空间约束的并对抗性图像生成方法,生成高隐蔽性对抗性图像,使目标模型分类到目标类别。
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,不同于现有对抗性图像生成方法,通过对给定图像的像素空间进行约束,自适应地在图像复杂区域加上噪声,使得这些精细构建的噪声被很好地被掩盖。将选择的复杂区域作为限制,与现有对抗性图像生成方法相结合,通过优化目标函数生成噪声使目标模型分类对抗性图像到目标类别的概率最大,从而达到攻击者的目标,使分类器输出攻击者设计的目标类别。由于噪声加到了图像复杂区域,会对观察者不可见,所以能够使发动的攻击不被检测到和被观察者阻止。
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,目标图像分类器可以表示为f(x,θ)=y,其中x为模型输入的图像,θ为模型参数,y为模型输出,即对输入图像x的类别预测。模型输出倒数第二层被称作logits层,输出原始图像对应的每种类别的置信度。而最后一层称作softmax层,输出logits层结果归一化后的结果,即分类到每种类别的概率。分类器最后的输出y即为softmax层的最大值,表示为:
f((x,θ))=max(softmax(logits(x)))=y
攻击者以一个训练好的基于神经网络图像分类器为攻击目标,对目标模型具有白盒访问权限,即能够访问目标模型的参数和权重,并对给定图像设定目标类别,生成高隐蔽性对抗性图像使得目标模型将其分类到目标类别。
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,攻击者首先计算给定图像的不同尺度下的区域复杂度,计算图像的对比度、能量、同质性、边缘密度和压缩比,用M1~M5来表示。将各项指标进行线性组合,得到图像区域复杂度函数:
Figure BDA0002012034180000061
其中g为图像划分的一个单位区域,ωi为对应指标Mi的系数,n取值为5。我们选取对比度、能量、同质性、边缘密度以及压缩比5个图像复杂度指标,分别计算在大尺度下和小尺度下的图像区域复杂度。对比度通过计算每个像素与相邻像素之间的对比度总和得到;能量为图像灰度共生矩阵中元素平方的总和;同质性由图像灰度共生矩阵中元素分布的接近程度刻画;边缘密度通过canny边缘算子计算平均边缘密度;压缩比为压缩的JPEG图像与未压缩图像的比率。在小尺度下的权值向量
Figure BDA0002012034180000071
在大尺度下的权值向量
Figure BDA0002012034180000072
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,提出细粒度图像复杂区域搜索算法,选取不同尺度下的复杂度高的区域进行融合,得到原始图像对噪声隐蔽性高的区域。首先选取小尺度P0下的复杂区域集合:
Figure BDA0002012034180000073
其中G0为按复杂度从高到低排列的小尺度P0图像区域集合,η0为小尺度P0下选择的复杂区域数目,gk为选取的复杂区域集合。同样的,对于大尺度Pi下的复杂区域集合的选取如下:
Figure BDA0002012034180000074
其中Gi为按复杂度从高到低排列的尺度Pi图像区域集合,ηi为小尺度P0下选择的复杂区域数目,gk为选取的复杂区域集合。将每一个大尺度Pi下的复杂区域集合与小尺度P0下的复杂区域进行融合:
Figure BDA0002012034180000075
其中
Figure BDA0002012034180000076
表示每一个选择小尺度区域g和大尺度区域集合
Figure BDA0002012034180000077
重合的面积,当该面积大于g的一半时,将g融合到
Figure BDA0002012034180000078
中。如此迭代直到
Figure BDA0002012034180000079
不再变化。最后取与小尺度区域融合后的所有大尺度下的复杂区域的交集作为最终原始图像的复杂区域:
Figure BDA00020120341800000710
其中
Figure BDA00020120341800000711
为融合后的大尺度Pi下的复杂区域,n为选取的大尺度数量,求得的R(x)即为图像可加噪的区域。
所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,考虑图像可加噪的区域,得到如下生成对抗性图像的优化问题:
min‖δ·Mask‖p+c·loss(x+δ,t)
这里δ是所求的噪声,Mask是一个与图像相同大小的矩阵,由图像可加噪的区域求得:
Figure BDA0002012034180000081
这里xi,j为图像坐标为(i,j)的像素点。loss(x+δ,t)为目标分类器的损失函数,t为攻击者所设的目标类别。该方法可以与现有的对抗性图像生成算法相结合,来生成具有高隐蔽性的对抗性图像。基于空间约束的FGSM对抗性图像生成算法可以表示为:
Figure BDA0002012034180000082
其中ε表示步长。同样的,基于空间约束的BIM对抗性图像生成算法可以表示为:
Figure BDA0002012034180000083
其中clipx,ε(·)为裁剪函数,保证图像的像素的值在有效范围之内。对于基于空间约束的CW对抗性图像生成算法,可以表示为:
Figure BDA0002012034180000084
其中
Figure BDA0002012034180000085
在优化式中优化ω来保证图像各个像素的值在有效范围之内。
实施例
1)一个训练好的基于神经网络图像分类器f(x,θ)=y为攻击目标,其中x为模型输入的图像,θ为模型参数,y为模型对输入图像x的类别预测。给定原始图像,攻击者拥有对目标模型的白盒访问权限,并设定目标类别,生成高隐蔽性对抗性图像使得目标模型将其分类到目标类别。
2)通过图像区域复杂度函数计算图像在不同尺度下划分的区域复杂度:
Figure BDA0002012034180000091
其中g为图像划分的一个单位区域,ωi为对应指标Mi的系数,n取值为5。M1~M5分别表示图像的对比度、能量、同质性、边缘密度和压缩比。该函数将各项指标进行线性组合,小尺度下的权值向量
Figure BDA0002012034180000092
所有大尺度下的权值向量
Figure BDA0002012034180000093
3)为了得到图像对噪声隐蔽性高的区域,通过多尺度融合算法将不同尺度下的复杂区域进行融合,求得原始图像加噪声区域。首先选取小尺度P0下的复杂区域集合:
Figure BDA0002012034180000094
其中G0为按复杂度从高到低的按小尺度P0图像区域集合,η0为小尺度P0下选择的复杂区域数目。对于大尺度Pi下的复杂区域集合的选取如下:
Figure BDA0002012034180000095
将每一个大尺度Pi下的复杂区域集合与小尺度P0下的复杂区域进行融合:
Figure BDA0002012034180000096
其中
Figure BDA0002012034180000097
表示两者重合的面积,当该面积大于g的一半时,将g融合到
Figure BDA0002012034180000098
中。如此迭代直到
Figure BDA0002012034180000099
不再变化。取所有大尺度下的复杂区域的交集作为最终原始图像的复杂区域:
Figure BDA00020120341800000910
求得的R(x)即为图像可加噪的区域。
4)得到如下生成隐蔽性对抗性图像的优化问题:
min‖δ·Mask‖p+c·loss(x+δ,t)
其中Mask是一个与图像相同大小的矩阵,在属于R(x)的点取值为1,其他的点取值为0。求解该优化问题,得到使目标模型分类到目标类别的高隐蔽性对抗性图像
5)与现存的对抗性图像生成算法结合,提高对抗性图像的不可见性。基于空间约束的FGSM对抗性图像生成算法可以表示为:
Figure BDA0002012034180000101
基于空间约束的BIM对抗性图像生成算法可以表示为:
Figure BDA0002012034180000103
对于基于空间约束的CW对抗性图像生成算法,可以表示为:
Figure BDA0002012034180000102
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (4)

1.一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,其特征在于,包含如下步骤:
步骤1、给定一个图像分类器,输入原始图像,该分类器输出图像的类别以及分类到每一个类别的概率;攻击者能够访问目标模型的参数和权重,并设定给定图像的目标类别;
步骤2、考虑图像对比度、能量、同质性、边缘密度和压缩比,提出衡量图像区域复杂度的函数;通过该函数来确定给定图像不同尺度下图像复杂的区域;
步骤3、为了确定给定图像加噪声区域,提出细粒度图像复杂区域搜索算法,将不同尺度下的复杂区域进行融合,得到最终的满足添加噪声不被人眼察觉的复杂区域,具体是:通过细粒度图像复杂区域搜索算法,选取不同尺度下的复杂度高的区域进行融合,得到原始图像对噪声隐蔽性高的区域;首先选取小尺度P0下图像x的复杂区域集合:
Figure FDA0003746676900000011
其中G0为按复杂度从高到低排列的小尺度P0图像区域集合,η0为小尺度P0下选择的复杂区域数目,gk为选取的复杂区域集合;同样的,对于大尺度Pi下的复杂区域集合的选取如下:
Figure FDA0003746676900000012
其中Gi为按复杂度从高到低排列的尺度Pi图像区域集合,ηi为小尺度P0下选择的复杂区域数目,gk为选取的复杂区域集合;将每一个大尺度Pi下的复杂区域集合与小尺度P0下的复杂区域进行融合:
Figure FDA0003746676900000013
其中
Figure FDA0003746676900000014
表示每一个选择小尺度区域g和大尺度区域集合
Figure FDA0003746676900000015
重合的面积,当该面积大于g的一半时,将g融合到
Figure FDA0003746676900000016
中;如此迭代直到
Figure FDA0003746676900000017
不再变化;最后取与小尺度区域融合后的所有大尺度下的复杂区域的交集作为最终原始图像的复杂区域:
Figure FDA0003746676900000018
其中
Figure FDA0003746676900000021
为融合后的大尺度Pi下的复杂区域,n为选取的大尺度数量,求得的R(x)即为图像可加噪的区域;
步骤4、与现有的对抗性图像生成算法结合,仅在确定的复杂区域对图像进行修改,得到基于空间约束的并对抗性图像生成方法,生成高隐蔽性对抗性图像,使目标模型分类到目标类别。
2.如权利要求1所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,其特征在于:目标图像分类器可以表示为f(x,θ)=y,其中x为模型输入的图像,θ为模型参数,y为模型输出,即对输入图像x的类别预测;模型输出倒数第二层被称作logits层,输出原始图像对应的每种类别的置信度;而最后一层称作softmax层,输出logits层结果归一化后的结果,即分类到每种类别的概率;分类器最后的输出y即为softmax层的最大值,表示为:
Figure FDA0003746676900000022
攻击者以一个训练好的基于神经网络图像分类器为攻击目标,对目标模型具有白盒访问权限,即能够访问目标模型的参数和权重,并对给定图像设定目标类别,生成高隐蔽性对抗性图像使得目标模型将其分类到目标类别。
3.如权利要求1所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,其特征在于:计算给定图像的不同尺度下的区域复杂度,计算图像的对比度、能量、同质性、边缘密度和压缩比,用M1~M5来表示;将各项指标进行线性组合,得到图像区域复杂度函数:
Figure FDA0003746676900000023
其中g为图像划分的一个单位区域,ωi为对应指标Mi的系数,n取值为5;我们选取对比度、能量、同质性、边缘密度以及压缩比5个图像复杂度指标,分别计算在大尺度下和小尺度下的图像区域复杂度;对比度通过计算每个像素与相邻像素之间的对比度总和得到;能量为图像灰度共生矩阵中元素平方的总和;同质性由图像灰度共生矩阵中元素分布的接近程度刻画;边缘密度通过canny边缘算子计算平均边缘密度;压缩比为压缩的JPEG图像与未压缩图像的比率;在小尺度下的权值向量
Figure FDA0003746676900000024
在大尺度下的权值向量
Figure FDA0003746676900000025
4.如权利要求1所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,其特征在于:考虑图像可加噪的区域,得到如下生成对抗性图像的优化问题:
min||δ·Mask||p+c·loss(x+δ,t)
这里δ是所求的噪声,Mask是一个与图像相同大小的矩阵,由图像可加噪的区域求得:
Figure FDA0003746676900000031
这里xi,j为图像坐标为(i,j)的像素点;loss(x+δ,t)为目标分类器的损失函数,t为攻击者所设的目标类别;该方法可以与现有的对抗性图像生成算法相结合,来生成具有高隐蔽性的对抗性图像;基于空间约束的FGSM对抗性图像生成算法可以表示为:
Figure FDA0003746676900000032
其中ε表示步长;同样的,基于空间约束的BIM对抗性图像生成算法可以表示为:
Figure FDA0003746676900000033
其中clipx,ε(·)为裁剪函数,保证图像的像素的值在有效范围之内;对于基于空间约束的CW对抗性图像生成算法,可以表示为:
Figure FDA0003746676900000034
其中
Figure FDA0003746676900000035
在优化式中优化ω来保证图像各个像素的值在有效范围之内。
CN201910249635.8A 2019-03-29 2019-03-29 一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法 Active CN110021049B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910249635.8A CN110021049B (zh) 2019-03-29 2019-03-29 一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910249635.8A CN110021049B (zh) 2019-03-29 2019-03-29 一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法

Publications (2)

Publication Number Publication Date
CN110021049A CN110021049A (zh) 2019-07-16
CN110021049B true CN110021049B (zh) 2022-08-30

Family

ID=67190238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910249635.8A Active CN110021049B (zh) 2019-03-29 2019-03-29 一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法

Country Status (1)

Country Link
CN (1) CN110021049B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111047658B (zh) * 2019-11-29 2022-11-18 武汉大学 面向深度神经网络的抗压缩对抗性图像生成方法
CN111292396B (zh) * 2020-01-16 2023-08-29 武汉轻工大学 图像样本集生成方法、设备、装置及存储介质
CN114067184B (zh) * 2022-01-17 2022-04-15 武汉大学 一种基于噪声模式分类的对抗样本检测方法及系统
CN114663946B (zh) * 2022-03-21 2023-04-07 中国电信股份有限公司 对抗样本生成方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004051917A1 (en) * 2002-11-28 2004-06-17 Digimarc Corporation Systems and methods for authentication of print media
CN101246589A (zh) * 2008-03-17 2008-08-20 北京交通大学 一种基于稳定圆形区域的抗几何攻击鲁棒水印方法
CN108257116A (zh) * 2017-12-30 2018-07-06 清华大学 一种生成对抗图像的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004051917A1 (en) * 2002-11-28 2004-06-17 Digimarc Corporation Systems and methods for authentication of print media
CN101246589A (zh) * 2008-03-17 2008-08-20 北京交通大学 一种基于稳定圆形区域的抗几何攻击鲁棒水印方法
CN108257116A (zh) * 2017-12-30 2018-07-06 清华大学 一种生成对抗图像的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Image copy detection via learning from copies based on virtual prior attacks;Yanrong Min;《2012 9th International Conference on Fuzzy Systems and Knowledge Discovery》;20120709;全文 *
一种基于SAR图像视觉特征的改进像素掩蔽方法;雷斌;《电子测量技术》;20141115;全文 *

Also Published As

Publication number Publication date
CN110021049A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN110021049B (zh) 一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法
CN108322349B (zh) 基于对抗式生成网络的深度学习对抗性攻击防御方法
CN111723654B (zh) 基于背景建模、YOLOv3与自优化的高空抛物检测方法及装置
Sathya et al. PSO-based Tsallis thresholding selection procedure for image segmentation
CN110941794A (zh) 一种基于通用逆扰动防御矩阵的对抗攻击防御方法
Li et al. An approximated gradient sign method using differential evolution for black-box adversarial attack
CN111783551B (zh) 基于贝叶斯卷积神经网络的对抗样本防御方法
CN113627543B (zh) 一种对抗攻击检测方法
CN112818783B (zh) 一种基于交通标志目标检测器改进的对抗样本生成方法
CN111178504B (zh) 基于深度神经网络的鲁棒压缩模型的信息处理方法及系统
Razmjooy et al. Image thresholding based on evolutionary algorithms
CN111047658B (zh) 面向深度神经网络的抗压缩对抗性图像生成方法
CN114387195A (zh) 一种基于非全局预增强的红外图像与可见光图像融合方法
CN114399630A (zh) 基于信念攻击和显著区域扰动限制的对抗样本生成方法
CN113591975A (zh) 基于Adam算法的对抗样本生成方法及系统
CN115062306A (zh) 一种针对恶意代码检测系统的黑盒对抗攻击方法
CN111914938A (zh) 一种基于全卷积二分支网络的图像属性分类识别方法
Guesmi et al. Advart: Adversarial art for camouflaged object detection attacks
Li et al. Detecting adversarial patch attacks through global-local consistency
CN114049537A (zh) 一种基于卷积神经网络的对抗样本防御方法
Wang et al. A hybrid adaptive quantum behaved particle swarm optimization algorithm based multilevel thresholding for image segmentation
Ismael et al. An enhanced fireworks algorithm to generate prime key for multiple users in fingerprinting domain
Aparna Swarm intelligence for automatic video image contrast adjustment
CN113283536B (zh) 面向成员推理攻击的基于异常点检测的深度模型隐私保护方法
CN112766401A (zh) 基于显著性对抗训练的对抗样本防御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant