CN112364310A

CN112364310A - 一种基于后门攻击的数据集保护和验证方法

Info

Publication number: CN112364310A
Application number: CN202011279636.6A
Authority: CN
Inventors: 潘晓光; 王小华; 焦璐璐; 樊思佳; 马彩霞
Original assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Current assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority date: 2020-11-16
Filing date: 2020-11-16
Publication date: 2021-02-12

Abstract

本发明属于互联网技术领域，具体涉及一种基于后门攻击的数据集保护和验证方法，包括下列步骤：根据实际需求设置水印γ的比例；根据γ划分原始数据集

为良性样本数据集D_benign和攻击样本数据集D_attack；划分后所得的攻击样本数据集D_attack添加水印，得到处理后的攻击样本数据集D_modified；将处理后的攻击样本数据集D_modified与良性样本数据集D_benign混合，得到水印数据集D_watermarked。本发明使用在部分样本上添加触发器的方式设置攻击样本，这使得在水印数据集上用标准的训练过程训练模型时，能在保持对良性样本的预测精度的同时指定隐藏的后门。本发明用于数据集的保护。

Description

一种基于后门攻击的数据集保护和验证方法

技术领域

本发明属于互联网技术领域，具体涉及一种基于后门攻击的数据集保护和验证方法。

背景技术

近年来，深度神经网络在各个领域都取得了较为广泛的应用。其中数据集，特别是高质量的开源数据集是深度神经网络繁荣的关键因素。这些开源数据集让研究人员可以很容易地验证他们的算法或模型的有效性，而这一过程反过来又加速了深度学习的发展。数据集的收集耗费了大量资源，其价值不言而喻，所以现有的开源数据集基本都要求它们只能用于学术或教育目的，而不能用于商业目的。基于此背景，已经有人提出了一些数据集保护技术，如匿名化、加密和水印方法进行数据集保护，它们的目的是防止未经授权的用户访问数据集。

然而，以上所提到的数据集保护方法却并不适合保护开源数据集。因为许多开源数据集对每个人都是开放访问的，唯一的要求是它们只能用于学术或教育目的。因此，保护开源数据集的主要问题是验证它是否被用于训练第三方模型。

发明内容

针对上述数据集保护方法不适合保护开源数据集的技术问题，本发明提供了一种效率高、可靠性强、实用性广的基于后门攻击的数据集保护方法。

为了解决上述技术问题，本发明采用的技术方案为：

一种基于后门攻击的数据集保护和验证方法，包括下列步骤：

S1、根据实际需求设置水印γ的比例；

所述

γ越小，则代表包含水印的数据所占比重越小，水印设置的越隐蔽，所述D_attack为攻击样本数据集，所述D_train为原始数据集；

S2、根据S1所得的γ划分原始数据集

为良性样本数据集D_benign和攻击样本数据集D_attack；

所述x_i为输入数据，y_i为输出标签，且x_i∈{0,…,255}^C×W×H，y_i＝{1,…,K}；

S3、为S2中划分后所得的攻击样本数据集D_attack添加水印，得到处理后的攻击样本数据集D_modified；

S4、将处理后的攻击样本数据集D_modified与良性样本数据集D_benign混合，得到水印数据集D_watermarked

所述D_watermarked＝D_benign∪D_modified。

所述S3中攻击样本数据集D_attack添加水印的方法为：

S3.1、设置y_t＝{1,…,K}和t∈{0,…,255}^C×W×H分别为目标标签和指定的触发器；

S3.2、根据S3.1设置的目标标签和指定的触发器确定对攻击样本添加水印；

S3.3、根据S3.2的方法对D_attack中包含的数据进行处理，生成处理后的攻击样本数据集D_modified。

所述根据设置的目标标签与指定的触发器为样本数据添加水印的方法为：

所述x_watermarked为添加水印后的输入数据，λ∈[0,1]^C×W×H是相关参数，λ参数越小，触发器越不可见，水印越隐蔽，所述

是矩阵乘法Element-wise Product。

所述生成处理后的攻击样本数据集D_modified的方法为：

所述D_modified＝{(x',y_target)∣x'＝w(x；t),(x,y)∈D_train\D_benign},

x为输入数据，y为输出标签，w为权利要求3所述的水印添加方法，y_target为添加的目标后门标签。

还包括若p_watermarked>p_benign，则判断此第三方模型使用了包含水印测试样本的数据集；若p_watermarked≤p_benign，则判断此第三方模型未使用包含水印测试样本的数据集；所述p_watermarked为测试目标类水印测试样本在第三方训练模型中的后验概率，所述p_benign为良性测试样本在第三方训练模型中的后验概率。

本发明与现有技术相比，具有的有益效果是：

本发明使用在部分样本上添加触发器的方式设置攻击样本，这使得在水印数据集上用标准的训练过程训练模型时，能在保持对良性样本的预测精度的同时指定隐藏的后门。

附图说明

图1为本发明的保护方法实现流程框图；

图2为本发明的验证方法实现流程框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于后门攻击的数据集保护和验证方法，如图1所示，包括下列步骤：

S1、根据实际需求设置水印γ的比例；

其中：

γ越小，则代表包含水印的数据所占比重越小，水印设置的越隐蔽，D_attack为攻击样本数据集，D_train为原始数据集；

S2、根据S1所得的γ划分原始数据集

为良性样本数据集D_benign和攻击样本数据集D_attack；

其中：D_watermarked＝D_benign∪D_modified。

进一步，S3中攻击样本数据集D_attack添加水印的方法为：

进一步，根据设置的目标标签与指定的触发器为样本数据添加水印的方法为：

其中：x_watermarked为添加水印后的输入数据，λ∈[0,1]^C×W×H是相关参数，λ参数越小，触发器越不可见，水印越隐蔽，

是矩阵乘法Element-wise Product。

进一步，生成处理后的攻击样本数据集D_modified的方法为：

D_modified＝{(x',y_target)∣x'＝w(x；t),(x,y)∈D_train\D_benign},

进一步，如图2所示，还包括若p_watermarked>p_benign，则判断此第三方模型使用了包含水印测试样本的数据集；若p_watermarked≤p_benign，则判断此第三方模型未使用包含水印测试样本的数据集；p_watermarked为测试目标类水印测试样本在第三方训练模型中的后验概率，p_benign为良性测试样本在第三方训练模型中的后验概率。

上面仅对本发明的较佳实施例作了详细说明，但是本发明并不限于上述实施例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化，各种变化均应包含在本发明的保护范围之内。

Claims

1.一种基于后门攻击的数据集保护和验证方法，其特征在于：包括下列步骤：

S1、根据实际需求设置水印γ的比例；

所述

S2、根据S1所得的γ划分原始数据集

为良性样本数据集D_benign和攻击样本数据集D_attack；

所述x_i为输入，y_i为输出标签，且x_i∈{0,…,255}^C×W×H，y_i＝{1,…,K}；

S4、将处理后的攻击样本数据集D_modified与良性样本数据集D_benign混合，得到水印数据集D_watermarked；

所述D_watermarked＝D_benign∪D_modified。

2.根据权利要求1所述的一种基于后门攻击的数据集保护和验证方法，其特征在于：所述S3中攻击样本数据集D_attack添加水印的方法为：

3.根据权利要求2所述的一种基于后门攻击的数据集保护和验证方法，其特征在于：所述根据设置的目标标签与指定的触发器为样本数据添加水印的方法为：

是矩阵乘法Element-wise Product。

4.根据权利要求2所述的一种基于后门攻击的数据集保护和验证方法，其特征在于：所述生成处理后的攻击样本数据集D_modified的方法为：

所述D_modified＝{(x',y_target)∣x'＝w(x；t),(x,y)∈D_train\D_benign},

5.根据权利要求1所述的一种基于后门攻击的数据集保护和验证方法，其特征在于：还包括若p_watermarked>p_benign，则判断此第三方模型使用了包含水印测试样本的数据集；若p_watermarked≤p_benign，则判断此第三方模型未使用包含水印测试样本的数据集；所述p_watermarked为测试目标类水印测试样本在第三方训练模型中的后验概率，所述p_benign为良性测试样本在第三方训练模型中的后验概率。