CN111768325B - 大数据隐私保护中基于生成对抗样本的安全性提升方法 - Google Patents
大数据隐私保护中基于生成对抗样本的安全性提升方法 Download PDFInfo
- Publication number
- CN111768325B CN111768325B CN202010257323.4A CN202010257323A CN111768325B CN 111768325 B CN111768325 B CN 111768325B CN 202010257323 A CN202010257323 A CN 202010257323A CN 111768325 B CN111768325 B CN 111768325B
- Authority
- CN
- China
- Prior art keywords
- image
- generator
- disturbance
- mask
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000006872 improvement Effects 0.000 title claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 4
- 239000002131 composite material Substances 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000017105 transposition Effects 0.000 claims description 2
- 230000001788 irregular Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 19
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 241001428906 Indian cassava mosaic virus Species 0.000 description 1
- 238000006229 Nazarov cyclization reaction Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/16—Program or content traceability, e.g. by watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioethics (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Technology Law (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
本发明公开了一种大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,主要包括步骤如下:(1)原始信息的初始化;(2)通过生成器生成载体图像和通过对抗攻击生成对抗扰动图像;(3)将载体图像和对抗扰动图像进行线性混合;(4)对合成载体图像应用信息隐藏算法进行处理;所述步骤(1)~(4)中通过建立前景物体生成模块、强对抗扰动生成模块、信息隐藏模块以及线性混合函数,实现大数据隐私保护的安全性。本发明基于GAN的框架及对抗攻击算法,通过生成针对隐写分析模型的对抗扰动,实现对隐写分析的对抗干扰;使扰动与前景物体融合,降低不规则扰动的可察觉性;提供一种基于GAN生成对抗样本的大数据隐私保护方法。
Description
技术领域
本发明涉及对抗样本的安全性提升方法,尤其涉及大数据隐私保护中基于生成对抗样本的安全性提升方法。
背景技术
大数据作为当今普遍使用的技术,为企业和个人提供海量数据的云端存储和管理服务。大数据中丰富的多媒体数据在分享和通信中为个人和企业的各种社会活动提供了便利。但与此同时,大数据分析和数据挖掘可能会过度使用隐私和重要信息,例如利用技术漏洞,使用关键字爬取数据拥有者在云端的私密信息、与个人和企业财产相关的信息等。即使用户设置云端密码,一些提供云端秘钥保存的应用也存在被恶意攻击的风险,造成大量用户数据泄露的隐患。这些重要数据的泄露会带来严重的安全问题,给个人和企业利益造成损害。所以在发展大数据技术的同时,保护大数据中的隐私安全也至关重要。现有技术主要通过加对称密算法来对重要数据加密管理,然而这种方式存在以下的弊端:对称加密算法需要管理好秘钥,如秘钥泄露,则会造成直接性的损失;每次实施对称加密算法都会产生秘钥,久而久之秘钥数量巨大,秘钥管理也将成为数据拥有者的负担。
为解决上述存在的问题,现已对信息隐藏进行了一些研究,例如,基于生成对抗网络(Generative AdversarialNetworks,GAN)和生成对抗样本,并用于图像信息隐藏已有基础研究。其中一部分方法是以Volkhonskiy等人在《隐写生成对抗网络》(Volkhonskiy D,Nazarov I,Burnaev E.Steganographic generative adversarial networks[C]//Twelfth International Conference on Machine Vision(ICMV 2019).InternationalSociety for Optics and Photonics,2020,11433:114333M.)中提出的基于GAN在生成图像上隐藏信息为代表,这个过程中模拟信息的嵌入采用的是生成一个随机的0/1比特矩阵,因此存在生成图像的真实性难以保证、判别器对嵌入的随机信息难以获取特征的问题,即难以学习载体图像和含密图像的区别。现有的基于添加对抗样本攻击隐写分析的方法中,以Zhang等人在《对抗基于深度神经网络的隐写分析的对抗样本》(Zhang Y,Zhang W,ChenK,et al.Adversarial examples against deep neural network based steganalysis[C]//Proceedings of the 6th ACM Workshop on Information Hiding and MultimediaSecurity.2018:67-72)中提出的方法为代表,只把攻击隐写分析作为目标,虽然验证了通过迭代式训练添加微弱扰动,使该扰动添加在载体图像,可以有效地攻击隐写分析算法,使隐写分析器不能有效的区分原始载体图像和含密图像;但是,这种方法由于过于强调靶向攻击,导致训练出的对抗样本的可转移性不强,无法保证针对一个隐写分析模型训练后的网络参数,对其他隐写分析模型依然有效。因此,这种方法并不能真正用于信息隐藏;在这些方法的基础上,Tang等人在《基于CNN的对抗嵌入图像隐写术》(Tang W,Li B,Tan S,etal.CNN-based adversarial embedding for image steganography[J].IEEETransactions on Information Forensics and Security,2019,14(8):2074-2087.)中提出将对抗扰动嵌入和隐写嵌入分为两组,互不干扰,在信息嵌入的阶段,将对抗样本以微小扰动的形式嵌入一组分组中以对抗检测,将待隐藏信息嵌入到另一组分组中。这样既达到了对抗隐写分析的目的,也不会对隐藏后的信息提取有所影响;但是这些方法只考虑到提升安全性,这些微小对抗扰动占据了一部分区域,因此在一定程度对隐藏容量有所牺牲。另外,Cui等人在《物联网移动边缘计算中基于前景对象生成的生成对抗网络图像隐写技术》(Cui Q,Zhou Z,Fu Z,et al.Image steganography based on foreground objectgeneration by generative adversarial networks in mobile edge computing withInternet of Things[J].IEEE Access,2019,7:90815-90824.)中提出基于GAN生成前景物体,并用于信息隐藏的方法,但是,这类方法的角度是,相对于原始图像中较为平滑的背景区域,生成具有纹理的前景的物体更适用于隐写;这类方法的缺陷在于无法确保每次生成的前景物体的隐藏能力完全强于覆盖的背景区域。因此,也就不能完全保证对载体图像隐藏能力的有效提升。
发明内容
发明目的:本发明的目的是提供一种在保证大数据安全性的同时避免产生秘钥的大数据隐私保护中基于生成对抗样本的安全性提升方法。
技术方案:本发明的安全性提升方法,主要包括步骤如下:(1)原始信息的初始化;(2)通过生成器生成载体图像和通过对抗攻击生成对抗扰动图像;(3)将载体图像和对抗扰动图像进行线性混合;(4)对合成载体图像应用隐藏算法进行处理;所述步骤(1)~(4)中通过建立前景物体生成模块、强对抗扰动生成模块、信息隐藏模块以及线性混合函数实现大数据隐私保护的安全性。
步骤(1)中所述的原始信息包括随机噪声、原始载体图像和前景蒙版;步骤(1)中的信息初始化包括:生成器从原始载体图像随机采样一个批次的原始数据,生成器从随机噪声分布中随机采样一个批次的随机噪声,生成器从前景蒙版集中随机采样一个批次的真实前景蒙版。
所述前景物体生成模块包括生成器和判别器,所述生成器将整体呈残差连接进行同等尺度上的特征复用;所述判别器为一个下采样网络,将特征映射成向量并用以分类。
进一步,步骤(2)根据步骤(1)的初始条件,生成器生成一个批次的生成载体图像;所述生成器通过共享得到其损失函数。
步骤(2)中判别器从真实图像数据集中随机采样一组数据;
所述判别器将“图像-蒙版”作为输入格式,将图像与蒙版的特征相拼接;
所述判别器分别计算真实的一组“图像-蒙版”和以随机采样蒙版为驱动生成的一组“图像-蒙版”的卷积特征;
所述判别器根据计算结果实施分类,将交叉熵函数作为损失函数,判别生成图像的效果。
步骤(2)通过强对抗扰动生成模块从步骤(1)得到真实前景蒙版。
步骤(2)通过对抗攻击将预训练隐写分析模型作为白盒攻击的对象,以前景蒙版控制形状,训练生成具有对抗扰动特性的强扰动图像。
进一步,步骤(3)将步骤(2)生成的生成载体图像和强扰动图像进行线性混合,完成对原始载体图像到合成载体图像的安全性提升。
进一步,步骤(4)将步骤(3)得到的合成载体图像通过信息隐藏模块应用信息隐藏算法嵌入隐私数据,以信息隐藏方式完成隐私数据保护。
有益效果:本发明与现有技术相比,其显著效果如下:1、基于GAN的框架以及对抗攻击算法,通过生成针对隐写分析模型的对抗扰动,实现对隐写分析的对抗干扰;2、在含有对抗样本块的图像上隐藏信息后,带来的隐写嵌入不会干扰对抗样本块的攻击能力,整个过程不会产生秘钥,解除了数据拥有者在秘钥管理上的负担;3、使扰动与前景物体融合,降低了不规则扰动的可察觉性;4、提供一种基于GAN生成对抗样本的大数据隐私保护方法。
附图说明
图1为本发明的总流程示意图;
图2为本发明的前景物体生成模块的生成器网络结构图;
图3为本发明的前景物体生成模块的判别器网络结构图。
具体实施方式
下面结合说明书附图和具体实施方式对本发明做进一步详细描述。
本发明以图像文件作为嵌入信息的载体,通过嵌入算法将待隐藏的信息嵌入到图像的冗余信息位,所以不会破坏载体图像的“原貌”。载体图像传输的同时,嵌入其中的数据也一并被传递。另外,可以用对应的提取算法提取出载体图像中嵌入的信息,还原隐藏信息和原始载体。此外,通过GAN生成符合载体图像语义分布的前景图像块,同时该图像块在训练后作为对抗样本,攻击隐写检测算法,旨在使隐写检测算法失效,从而提升安全性。
本发明的大数据隐私保护中基于生成对抗样本的安全性提升方法在结构上主要包括以下部分:前景物体生成模块、强对抗扰动生成模块、信息隐藏模块以及线性混合函数。
(一)前景物体生成模块
为了掩盖强对抗扰动造成的视觉保真度(visualfidelity)下降,本模块利用前景蒙版,以GAN作为基础结构,生成前景物体,与之后生成的强对抗扰动合成。具体的结构包括生成器网络和判别器网络,如图2和图3所示。生成器先经过一个下采样网络,后经过上采样网络,整体呈残差连接(skip-connection)进行同等尺度上的特征复用,辅助上采样网络学习。生成器的主要结构单元包括卷积层(Conv2D)、正则化层(BatchNorm)、反卷积层(DeConv2D)、激活层(Relu)及残差块网络(ResBlock)。判别器为一个下采样网络,将特征映射成向量并用以分类。判别器的主要结构单元包括卷积层(Conv2D)、正则化层(BatchNorm)、激活层(Relu)及分类层(Softmax)。
生成器网络Gfg(·,·,·)以原始载体图像xbg为背景,以前景蒙版mt规定形状和位置,并以随机噪声z作为驱动,在原始载体图像上生成前景物体(如一只鸟)后作为生成载体图像输出生成载体图像/>生成器网络的目标函数如公式(1)所示:
其中,Pdata为真实图像分布,⊙代表矩阵的点乘法运算,(xt,mt)是数据集中的原始载体图像和对应的前景蒙版。
判别器网络D(·,·)将真实图像分布Pdata和生成器生成的生成载体图像作为输入,判别生成载体图像的真实性,其目标函数的公式(2)如下:
(二)强对抗扰动生成模块
该模块在数据集Pdata(X|x)上,基于卷积神经网络(CNN)预训练隐写分析模型Φw(·),网络结构如图1所示。该网络的首层是一个高通滤波(HPF),选取隐写分析关注的高频区域,因为隐写算法往往在高频区域嵌入信息。该预训练隐写分析模型通过提取CNN特征,可以在隐写分析任务上实现正确率高于95%的分类。通过计算Φw(·)的反向梯度信息寻找合适的扰动δ,实施定向攻击,使得生成的对抗扰动mδ=mt⊙δ可以使Φw(·)的分类失效,并且在后续的隐写算法嵌入信息后仍然具有较强的攻击性,从而完成对隐写分析模型的鲁棒性攻击。该模块的目标函数的公式(3)如下:
其中,F代表预训练的隐写分析模型Φw(·),y代表带有对抗扰动的前景蒙版变量,y=ystego代表该隐写分析模型Φw(·)将y分类为含密图像,y=ycover代表该隐写分析模型Φw(·)将y分类为载体图像。
(三)线性混合函数
在分别得到生成载体图像和对抗扰动mδ后,通过一个线性混合函数将这两部分混合以组成合成载体图像/>该混合函数的公式(4)如下:
其中,λ∈(0,1)。
(四)信息隐藏模块
本模块通过信息隐藏算法,将需要保护的信息m嵌入到线性混合函数输出的合成载体图像。首先计算信息隐藏算法的嵌入过程带来的失真代价。设X=(xi,j)H×W代表合成载体图像,Y=(yi,j)H×W代表含密图像,其中xi,j、yi,j分别代表合成载体图像和含密图像中的坐标为(i,j)的图像单元(像素点)。H和W分别代表图像的高度和宽度。令ρi,j代表将坐标为(i,j)的图像单元(像素点)xi,j修改为yi,j,则信息隐藏带来的失真代价D(X,Y)为:
接着,参照失真代价D(X,Y),使用STC编码的方式将需要保护的信息m嵌入到线性混合函数输出的合成载体图像,实现对m的保护。此过程需定义一个校验矩阵H,通过找到使失真代价最小的y,来实现嵌入m,即
HyT=mT (6)
其中T代表矩阵转置操作。
本发明的安全性提升方法实现的详细步骤如下:
(1)原始数据初始化
(1-1)如图1的前景生成模块,首先,生成器Gfg(·,·,·)从原始载体图像集Xbg随机采样出一个批次(Batch)的原始载体图像其中n表示Batch的尺寸,即一个Batch包含的样本数量,k代表Batch的序号,即第k个Batch;
(1-2)生成器Gfg(·,·,·)从随机噪声分布Pz中随机采样出一个Batch的随机噪声zk=(z1,z2,…,zn)∈Pz;
(1-3)生成器Gfg(·,·,·)从前景蒙版集M中随机采样一个Batch的真实前景蒙版
(2)通过生成器生成载体图像和通过对抗攻击生成强扰动图像
(2-1)根据上述的初始条件,生成器生成一个Batch的结果,即 表示在背景图像上生成前景物体的过程,生成器Gfg的具体结构如图2所示;
(2-2)判别器D(·,·)从真实图像数据集(包含图像-蒙版对)中随机采样一组(xk,mk)∈Pdata;
(2-3)由于判别器D(·,·)将“图像-蒙版”作为输入格式,即将图像与蒙版的特征相拼接。
判别器D(·,·)分别计算真实的一组“图像-蒙版”,和以随机采样蒙版为驱动生成的一组“图像-蒙版”的卷积特征,即计算和/>判别器D(·,·)的具体结构如图3所示。
(2-4)判别器D(·,·)根据计算结果,最后实施分类。将交叉熵函数作为损失函数,判别生成图像的效果,即计算
(2-5)生成器Gfg(·,·,·)通过共享得到其损失函数的结果:
(2-6)以Adam为随机梯度下降算法更新参数梯度,以最小化判别器D(·,·)的损失,即计算θD=θD+ΔD,ΔD为针对判别器D(·,·)计算出的梯度;
(2-7)以Adam为随机梯度下降算法更新参数梯度,以最小化生成器Gfg(·,·,·)的损失,即计算θG=θG-ΔG,ΔG为针对生成器Gfg(·,·,·)计算出的梯度,此时完成前景物体生成模块的一次迭代过程;
(2-8)接下来,强对抗扰动生成模块从步骤(1-3)得到真实前景蒙版
(2-9)通过将预训练隐写分析模型Φw(·)作为白盒攻击的对象,以前景蒙版控制形状,训练生成具有对抗扰动特性的强扰动图像/>此过程的目标函数如公式3所示;
(3)进行线性混合
将步骤(2-1)生成的的生成载体图像与步骤(2-9)生成的强扰动图像/>做线性混合,即按照公式(4),合成/>为了同时保证合成载体图像的视觉保真度和强攻击性,将λ设置为0.3。至此完成了对原始载体图像/>到合成载体图像/>的安全性提升。
(4)将合成载体图像应用信息隐藏算法进行处理
将合成载体图像应用信息隐藏算法(例如S-UNIWARD)嵌入隐私数据,以信息隐藏方式完成隐私数据保护,得到含密图像/>
(4-1)定义水平、垂直和对角线三个方向滤波算子Ka、Kb和Kc,令h和g分别代表低通滤波器系数和高通滤波器系数,T代表矩阵转置,则:
K1=h·gT,K2=g·hT,K3=g·gT;
(4-2)和/>分别代表合成载体图像和含密图像的第k组滤波残差,其中k=(1,2,3)。
(4-3)令(4-2)中的滤波残差在坐标(u,v)位置上的小波系数在合成载体图像和含密图像上分别为和/>则失真代价为:
其中调节参数σ设为1。
(4-4)参照(4-3)中的失真代价,使用STC编码的方式将需要保护的信息m嵌入到线性混合函数输出的合成载体图像。定义一个校验矩阵H,通过在含密图像对于H的所有右陪集中找到使失真代价最小的y,来实现嵌入m,目标函数为:
HyT=mT
由上述可知,本发明通过GAN和对抗样本,生成接近真实的前景物体与对抗样本的线性混合,以掩盖对抗样本的可见性,同时也保证了对抗扰动的鲁棒性,从而实现了在大数据隐私保护中的高容量、高安全信息隐藏。
Claims (9)
1.一种大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,主要包括步骤如下:
(1)原始信息的初始化;
(1-1)首先,生成器Gfg(·,·,·)从原始载体图像集Xbg随机采样出一个批次的原始载体图像其中n表示Batch的尺寸,即一个Batch包含的样本数量,k代表Batch的序号,即第k个Batch;
(1-2)生成器Gfg(·,·,·)从随机噪声分布Pz中随机采样出一个Batch的随机噪声zk=(z1,z2,…,zn)∈Pz;
(1-3)生成器Gfg(·,·,·)从前景蒙版集M中随机采样一个Batch的真实前景蒙版
(2)通过生成器生成载体图像和通过对抗攻击生成对抗扰动图像;
(2-1)根据上述的初始条件,生成器Gfg生成一个Batch的结果,即 表示在背景图像上生成前景物体的过程;
(2-2)判别器D(·,·)从真实图像数据集中随机采样一组(xk,mk)∈Pdata;
(2-3)由于判别器D(·,·)将“图像-蒙版”作为输入格式,即将图像与蒙版的特征相拼接;
判别器D(·,·)分别计算真实的一组“图像-蒙版”,和以随机采样蒙版为驱动生成的一组“图像-蒙版”的卷积特征,即计算和/>
(2-4)判别器D(·,·)根据计算结果,最后实施分类;将交叉熵函数作为损失函数,判别生成图像的效果,即计算
(2-5)生成器Gfg(·,·,·)通过共享得到其损失函数的结果:
(2-6)以Adam为随机梯度下降算法更新参数梯度,以最小化判别器D(·,·)的损失,即计算θD=θD+ΔD,ΔD为针对判别器D(·,·)计算出的梯度;
(2-7)以Adam为随机梯度下降算法更新参数梯度,以最小化生成器Gfg(·,·,·)的损失,即计算θG=θG-ΔG,ΔG为针对生成器Gfg(·,·,·)计算出的梯度,此时完成前景物体生成模块的一次迭代过程;
(2-8)接下来,强对抗扰动生成模块从步骤(1-3)得到真实前景蒙版
(2-9)通过将预训练隐写分析模型Φw(·)作为白盒攻击的对象,以前景蒙版控制形状,训练生成具有对抗扰动特性的强扰动图像/>此过程的目标函数如下式所示;
其中,F代表预训练的隐写分析模型Φw(·),y代表带有对抗扰动的前景蒙版变量,y=ystego代表该隐写分析模型Φw(·)将y分类为含密图像,y=ycover代表该隐写分析模型Φw(·)将y分类为载体图像;
(3)将载体图像和对抗扰动图像进行线性混合;
将步骤(2-1)生成的的生成载体图像与步骤(2-9)生成的强扰动图像/>做线性混合,合成/>为了同时保证合成载体图像/>的视觉保真度和强攻击性,将λ设置为0.3;至此完成了对原始载体图像/>到合成载体图像/>的安全性提升;
(4)对合成载体图像应用信息隐藏算法进行处理;
将合成载体图像应用信息隐藏算法嵌入隐私数据,以信息隐藏方式完成隐私数据保护,得到含密图像/>
(4-1)定义水平、垂直和对角线三个方向滤波算子Ka、Kb和Kc,令h和g分别代表低通滤波器系数和高通滤波器系数,T代表矩阵转置,则:
K1=h·gT,K2=g·hT,K3=g·gT;
(4-2)和/>分别代表合成载体图像和含密图像的第k组滤波残差,其中k=(1,2,3);
(4-3)令(4-2)中的滤波残差在坐标(u,v)位置上的小波系数在合成载体图像和含密图像上分别为和/>则失真代价为:
其中调节参数σ设为1;
(4-4)参照(4-3)中的失真代价,使用STC编码的方式将需要保护的信息m嵌入到线性混合函数输出的合成载体图像;定义一个校验矩阵H,通过在含密图像对于H的所有右陪集中找到使失真代价最小的y,来实现嵌入m,目标函数为:
HyT=mT
所述步骤(1)~(4)中通过建立前景物体生成模块、强对抗扰动生成模块、信息隐藏模块以及线性混合函数实现大数据隐私保护的安全性。
2.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(1)中所述的原始信息包括随机噪声、原始载体图像和前景蒙版;信息初始化包括:生成器从原始载体图像随机采样一个批次的原始数据,生成器从随机噪声分布中随机采样一个批次的随机噪声,生成器从前景蒙版集中随机采样一个批次的真实前景蒙版。
3.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,所述前景物体生成模块包括生成器和判别器,所述生成器将整体呈残差连接进行同等尺度上的特征复用;所述判别器为一个下采样网络,将特征映射成向量并用以分类。
4.根据权利要求1或3所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(2)根据步骤(1)的初始条件,生成器生成一个批次的生成载体图像;所述生成器通过共享得到其损失函数。
5.根据权利要求1或3所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(2)中判别器从真实图像数据集中随机采样一组数据;
所述判别器将“图像-蒙版”作为输入格式,将图像与蒙版的特征相拼接;
所述判别器分别计算真实的一组“图像-蒙版”和以随机采样蒙版为驱动生成的一组“图像-蒙版”的卷积特征;
所述判别器根据计算结果实施分类,将交叉熵函数作为损失函数,判别生成图像的效果。
6.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(2)通过强对抗扰动生成模块从步骤(1)得到真实前景蒙版。
7.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(2)通过对抗攻击将预训练隐写分析模型作为白盒攻击的对象,以前景蒙版控制形状,训练生成具有对抗扰动特性的强扰动图像。
8.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(3)将步骤(2)生成的生成载体图像和强扰动图像进行线性混合,完成对原始载体图像到合成载体图像的安全性提升。
9.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(4)将步骤(3)得到的合成载体图像通过信息隐藏模块应用信息隐藏算法嵌入隐私数据,以信息隐藏方式完成隐私数据保护。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010257323.4A CN111768325B (zh) | 2020-04-03 | 2020-04-03 | 大数据隐私保护中基于生成对抗样本的安全性提升方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010257323.4A CN111768325B (zh) | 2020-04-03 | 2020-04-03 | 大数据隐私保护中基于生成对抗样本的安全性提升方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111768325A CN111768325A (zh) | 2020-10-13 |
CN111768325B true CN111768325B (zh) | 2023-07-25 |
Family
ID=72719412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010257323.4A Active CN111768325B (zh) | 2020-04-03 | 2020-04-03 | 大数据隐私保护中基于生成对抗样本的安全性提升方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111768325B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561773B (zh) * | 2020-12-28 | 2024-03-29 | 中国科学技术大学 | 基于深层扰动的对抗隐写方法 |
CN112884628B (zh) * | 2021-01-13 | 2024-04-02 | 深圳大学 | 一种针对空域富模型的图像隐写分析模型的攻击方法 |
CN112990357B (zh) * | 2021-04-16 | 2021-07-27 | 中国工程物理研究院计算机应用研究所 | 一种基于稀疏扰动的黑盒视频对抗样本生成方法 |
CN113239852B (zh) * | 2021-05-27 | 2022-06-07 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私保护的隐私图像处理方法、装置及设备 |
CN113450271B (zh) * | 2021-06-10 | 2024-02-27 | 南京信息工程大学 | 一种基于人类视觉模型的鲁棒自适应对抗样本生成方法 |
CN113486377A (zh) * | 2021-07-22 | 2021-10-08 | 维沃移动通信(杭州)有限公司 | 图像加密方法、装置、电子设备和可读存储介质 |
CN113886885A (zh) * | 2021-10-21 | 2022-01-04 | 平安科技(深圳)有限公司 | 数据脱敏方法、数据脱敏装置、设备及存储介质 |
CN114332569B (zh) * | 2022-03-17 | 2022-05-27 | 南京理工大学 | 基于注意力机制的低扰动对抗攻击方法 |
CN114820380B (zh) * | 2022-05-13 | 2023-04-18 | 四川大学 | 基于内容自适应对抗扰动的空域隐写载体图像增强方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368752A (zh) * | 2017-07-25 | 2017-11-21 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN108665005A (zh) * | 2018-05-16 | 2018-10-16 | 南京信息工程大学 | 一种利用dcgan提高基于cnn图像识别性能的方法 |
CN109492416A (zh) * | 2019-01-07 | 2019-03-19 | 南京信息工程大学 | 一种基于安全区域的大数据图像保护方法和系统 |
CN110084734A (zh) * | 2019-04-25 | 2019-08-02 | 南京信息工程大学 | 一种基于物体局部生成对抗网络的大数据权属保护方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107563155B (zh) * | 2017-08-08 | 2023-02-28 | 中国科学院信息工程研究所 | 一种基于生成对抗网络的安全隐写方法和装置 |
US20190213705A1 (en) * | 2017-12-08 | 2019-07-11 | Digimarc Corporation | Artwork generated to convey digital messages, and methods/apparatuses for generating such artwork |
CN108921764B (zh) * | 2018-03-15 | 2022-10-25 | 中山大学 | 一种基于生成对抗网络的图像隐写方法及系统 |
CN108346125B (zh) * | 2018-03-15 | 2021-10-08 | 中山大学 | 一种基于生成对抗网络的空域图像隐写方法及系统 |
US10885111B2 (en) * | 2018-04-16 | 2021-01-05 | International Business Machines Corporation | Generating cross-domain data using variational mapping between embedding spaces |
CN110457910A (zh) * | 2018-05-07 | 2019-11-15 | 中国人民武装警察部队工程大学 | 一种基于图像合成的生成式信息隐藏方法 |
CN109284684B (zh) * | 2018-08-21 | 2021-06-01 | Oppo广东移动通信有限公司 | 一种信息处理方法、装置以及计算机存储介质 |
CN109214973B (zh) * | 2018-08-24 | 2020-10-27 | 中国科学技术大学 | 针对隐写分析神经网络的对抗安全载体生成方法 |
CN109587372B (zh) * | 2018-12-11 | 2020-06-16 | 北京邮电大学 | 一种基于生成对抗网络的不可见图像隐写术 |
CN109818739B (zh) * | 2019-01-24 | 2022-02-25 | 中国人民武装警察部队工程大学 | 一种基于对抗网络的生成式图像隐写方法 |
CN110889797B (zh) * | 2019-10-15 | 2021-06-08 | 浙江大学 | 基于对抗样本生成的深度自适应图像隐藏方法 |
-
2020
- 2020-04-03 CN CN202010257323.4A patent/CN111768325B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368752A (zh) * | 2017-07-25 | 2017-11-21 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN108665005A (zh) * | 2018-05-16 | 2018-10-16 | 南京信息工程大学 | 一种利用dcgan提高基于cnn图像识别性能的方法 |
CN109492416A (zh) * | 2019-01-07 | 2019-03-19 | 南京信息工程大学 | 一种基于安全区域的大数据图像保护方法和系统 |
CN110084734A (zh) * | 2019-04-25 | 2019-08-02 | 南京信息工程大学 | 一种基于物体局部生成对抗网络的大数据权属保护方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111768325A (zh) | 2020-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111768325B (zh) | 大数据隐私保护中基于生成对抗样本的安全性提升方法 | |
Emad et al. | A secure image steganography algorithm based on least significant bit and integer wavelet transform | |
Bhatti et al. | Hybrid watermarking algorithm using Clifford algebra with Arnold scrambling and chaotic encryption | |
Kabulov et al. | Algorithmic method of security of the Internet of Things based on steganographic coding | |
CN109919303B (zh) | 一种深度神经网络的知识产权保护方法、系统及终端 | |
CN112115490B (zh) | 一种基于gan的载体图像合成隐写方法 | |
CN111241554A (zh) | 基于视觉密码的数字图像加密解密系统 | |
CN114329549A (zh) | 一种基于生成对抗网络的图像隐私保护方法及系统 | |
Liu et al. | Making DeepFakes more spurious: evading deep face forgery detection via trace removal attack | |
Yin et al. | Reversible adversarial attack based on reversible image transformation | |
Priya et al. | Robust and secure video watermarking based on cellular automata and singular value decomposition for copyright protection | |
Li et al. | Privacy protection method based on multidimensional feature fusion under 6G networks | |
Ouyang et al. | A semi-fragile reversible watermarking method based on qdft and tamper ranking | |
CN115879516B (zh) | 一种数据取证方法 | |
Li et al. | Designing three-dimensional cellular automata based video authentication with an optical integral imaging generated memory-distributed watermark | |
Holla et al. | A GPU scheme for multi-secret visual sharing with varied secret dimensions and contrast enhancement using blind super-resolution | |
Jiang et al. | Meaningful secret image sharing resist to typical image processing of shadows | |
CN115131465A (zh) | 一种基于身份关系保持的人脸匿名图像生成及识别方法 | |
Chuang et al. | Data steganography for optical color image cryptosystems | |
Srikanth et al. | Copyright protection of 3d anaglyph color image watermarking over thin mobile devices | |
Usha et al. | Image steganography using hybrid soft computing techniques–a survey | |
Zhang et al. | High Quality Image Steganography Model Based on Encoder-Decoder Networks and 2D Logistic Chaotic Encryption | |
Kohli et al. | Two Layer Data Security Using 2-D Cellular Automata | |
CN114241581A (zh) | 一种基于语义特征的人脸生成式图像隐写术 | |
Kumar et al. | Digital Image Watermarking using DWT and Encryption with RGB Pixel Shuffling and PWP Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |