CN114417427B

CN114417427B - 一种面向深度学习的数据敏感属性脱敏系统及方法

Info

Publication number: CN114417427B
Application number: CN202210320910.2A
Authority: CN
Inventors: 王志波; 袁伟; 庞晓艺; 任奎
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2022-08-02
Anticipated expiration: 2042-03-30
Also published as: CN114417427A

Abstract

本发明公开了一种面向深度学习的数据敏感属性脱敏系统及方法，系统包括特征提取器和隐私对抗训练模块；特征提取器的输入端连接训练数据集，输出端连有隐私对抗训练模块；特征提取器由卷积神经网络组成，是训练的核心模块，由数据中心训练，训练完成后分发给个人用户用于后续的本地端数据预处理；隐私对抗训练模块包含代理攻击分类器。本方案提出隐私对抗训练在特征空间中将隐私属性置于决策超平面，使得攻击者无法推断，提出条件重构模块保障除隐私属性以外的其他信息被保留下来，能够有效应用于下游任务，同时提出联合优化策略，对数据隐私和数据可用性进行权衡，使得二者能够同时达到最优效果。

Description

一种面向深度学习的数据敏感属性脱敏系统及方法

技术领域

本发明涉及人工智能（AI）数据隐私安全领域，具体地说，是一种面向深度学习的数据敏感属性脱敏系统及方法。

背景技术

近年来，深度学习在许多领域表现出了卓越的性能，如图像分类、语音识别、自然语言处理等。深度学习的成功可以部分归因于大规模的训练数据，许多的服务提供商从他们的用户手中收集数据用于训练更加精确的模型。然而，这些被收集的训练数据往往包含大量的隐私信息，如种族、性别、年龄等，这些信息可以轻易的被预训练模型获取，并且这种隐私可能被进一步的用于定向广告甚至其他的恶意行为。为了解决数据收集中产生的隐私泄露问题，研究者提出了许多的隐私保护技术。传统的方法，如k-匿名技术，通常是基于句法匿名的方式保护隐私属性。近期被广泛研究的差分隐私技术通过添加噪声的方式能够提供可证明的隐私保护保障。然而，这些方法通常在原始数据产生不可忽视的扰动，导致训练出来的深度学习模型精度下降。为解决以上缺陷，一些研究者提出为每个用户的原始数据提取特征并且只上传这些被提取的特征到数据收集方用于训练需求，这种方法相较于传统的匿名与扰动技术能较好的均衡隐私与可用性需求。但这种基于特征的方法在深度学习的推断攻击下仍然会产生隐私泄露，攻击者能通过公开数据集上训练的模型从上传的特征中推断出原始数据中的隐私信息，同时需要预先定义下游任务难以泛化到实际的应用场景，即服务提供商期望收集到的数据与原始数据有类似的可用性而不是仅仅针对某一特定任务有效，因此需要提出一种有效的隐私保护方式来抵御推断攻击同时保障数据在后续任务上可用性。

发明内容

本发明就是针对现有技术的不足，提供一种面向深度学习的数据敏感属性脱敏系统及方法，有效防御来自恶意攻击者的推断攻击，同时保障数据在模型训练中的可用性。

为了实现本发明的目的，本发明是通过以下技术方法实现的：

本发明公开了一种面向深度学习的数据敏感属性脱敏系统，系统包括特征提取器和隐私对抗训练模块；特征提取器的输入端连接训练数据集，输出端连有隐私对抗训练模块；特征提取器由卷积神经网络组成，是训练的核心模块，由数据中心训练，训练完成后分发给个人用户用于后续的本地端数据预处理；隐私对抗训练模块包含代理攻击分类器，由卷积神经网络及全连接神经网络组成，用于优化特征提取器，使其产生有效的隐私保护能力。

作为进一步地改进，本发明所述的系统还包含条件重构模块，条件重构模块包含隐私编码模型和条件重构网络，条件重构网络由反卷积神经网络组成，条件重构网络分别与特征提取器与隐私编码模型的输出端相连，条件重构网络用于优化特征提取器，使其产生的特征数据保持与原始数据类似的可用性，隐私编码模型由卷积神经网络组成，用于参与条件重构优化流程。

作为进一步地改进，本发明所述的隐私编码模型由隐私编码器与辅助预测模型构成，辅助预测模型与隐私编码器的输出端相连，用于监督隐私编码器的效果，隐私对抗训练模块包括代理攻击分类器。

本发明还公开了一种使用面向深度学习的数据敏感属性脱敏方法，包括如下步骤：用户预先定义其敏感属性信息，由数据中心训练一个用于脱敏的特征提取器，用户共享数据之前，利用的特征提取器在本地端将原始数据转换为脱敏后的特征向量，并将脱敏后的特征向量上传，恶意攻击者即使能访问到该特征向量无法从中获取到任何用户方的隐私信息，训练一个用于脱敏的特征提取器的训练方法如下：

1）训练数据集输入到特征提取器产生特征向量，隐私对抗训练模块接收来自特征提取器产生的特征向量，基于交叉熵损失，产生梯度回传至特征提取器；

2）训练数据集输入到特征提取器与隐私编码模型，分别产生特征向量与隐私编码向量，条件重构模块中的条件重构网络接收来自特征提取器以及隐私编码模型产生的特征向量，计算重构损失，回传梯度至特征提取器；

3）通过联合学习策略对步骤1）与步骤2）中产生的梯度回传信息进行权衡，引入超参数，提高步骤1）中隐私对抗训练模块的权重则提升隐私保护效果，提升步骤2）中条件重构网络梯度则提升数据可用性效果。

作为进一步地改进，本发明所述的步骤1）具体算法为：

1）首先对用户隐私泄漏情况进行定义；

2）模拟攻击方行为进行代理攻击分类器优化；

3）对特征提取器进行优化防止隐私泄漏。

作为进一步地改进，所述的步骤1）具体为，对于隐私属性

有

个可观测的类别标签，其中

代表第

个类别标签，对某个用户该隐私属性的真值为

，攻击者的目标是成功从用户上传的特征中推断出

，其隐私泄露程度由对数条件分布

，

则是一个典型的预测模型用于判别真值

的概率大小，则对于用户上传数据，整体隐私泄露情况衡量如下：

其中

为用户上传的特征向量，

是用户上传的特征向量的分布，

则是一个典型的预测模型用于判别真值

的概率大小，

代表隐私泄露期望值，其值越大，隐私泄露程度越严重。

作为进一步地改进，本发明所述的步骤2）具体为，在博弈论框架下，模拟攻击方训练一个代理攻击分类器，通过最大化隐私泄露期望

，来揭露用户上传数据的隐私泄露程度，代理攻击分类器的表现用如下的交叉熵损失函数来描述，损失函数是负的

：

其中

是模型参数为

的攻击分类器网络，

，

则表示该攻击分类器网络对于真值标签的预测值，

是典型的交叉熵损失，衡量攻击分类器网络推断效果。

在训练过程中，该代理攻击分类模型的优化目标通过更新模型参数

来最小化上述的交叉熵损失函数：

作为进一步地改进，本发明所述的步骤3）中，特征提取器的训练目标是最小化隐私泄露程度，即使得攻击方的预测成为一致分布，为了实现该目标，在特征空间中将隐私属性置于决策超平面上，给定代理攻击分类器防御方用如下的损失函数描述到决策超平面距离：

其中

代表隐私属性

的

个标签中的一个，

则代表对于隐私属性

中第

个类别的预测，

是对于隐私属性所有标签上的交叉熵误差的期望值，代理攻击器模型对于隐私信息预测的不确定性需要被最大化，可以通过优化特征提取器来最小化上述损失函数来实现：

在对抗学习过程中，特征提取器与代理攻击分类器交替优化，最终收敛使得攻击者在推断隐私的过程只能以随即猜测的方式进行。

作为进一步地改进，本发明所述的步骤2）如下算法流程构成：

1）.获得隐私编码向量作为条件重构网络输入；

2）.度量重构损失，产生回传梯度；

步骤1）具体为，隐私编码模型产生的隐私编码向量的精确程度利用辅助预测模型由以下损失函数来衡量：

其中

为隐私编码模型，参数为

，

为辅助预测模型，参数为

，

代表对于隐私信息的预测置信度，

用来衡量隐私编码模型

产生的隐私特征向量

是否完整保留了隐私信息，最终由

产生隐私编码向量

；

步骤2）具体为，采用 Mean Square error(MSE)作为度量函数，利用欧式距离上的期望值，即

，作为重构误差值：

其中

代表由

和

拼接所产生的重构数据，

，MSE均方误差是用于衡量原始数据

以及由

重构数据

间信息相似度的函数。

作为进一步地改进，本发明所述的步骤3）具体为，设计了联合学习策略，引入超参数

，进行联合建模训练，用于权衡数据隐私与数据可用性，训练过程中关键的特征提取器交替参与进行条件重构模块与隐私对抗训练模块训练，用于训练特征提取网络的最终优化目标如下：

在联合学习模型中，首先在不进行对抗学习和条件重构学习的情况下，预训练特征提取器与代理攻击分类器模型使得攻击者在最开始时能够对隐私属性的判别达到一个较好的水平；然后，在随后的每一个训练批次中，交替执行隐私对抗训练模块和条件重构模块，同时使用权衡超参数

来更新特征提取器的参数

。

本发明的有益技术效果如下：

本发明提出了一种面向深度学习的数据敏感属性脱敏系统及方法，提升深度学习模型的性能往往需要从个人用户手中收集海量的信息，这些被收集的数据往往包含大量的隐私信息，以往隐私保护方案，通常在原始数据产生不可忽视的扰动，导致训练出来的深度学习模型精度下降，或者隐私保护效果不佳，攻击者能通过公开数据集上训练的模型从上传的特征中推断出原始数据中的隐私信息，此外难以达到与原始数据接近的可用性。为解决上述问题，能够有效的保障个人用户上传数据的隐私安全，同时保障数据在下游任务保持可用性。本发明提出了隐私对抗训练模块，通过将隐私属性置于决策超平面上，能够有效使得攻击者的隐私推断攻击失效，保护个人用户的隐私安全。本发明同时提出了条件重构模块，不同于当前方法仅能保障对于特定数据有效性，还能够有效保障数据达到在下游任务上相同的泛化性。本发明提出了联合学习方法，有效实现对于数据隐私与数据可用性间的权衡，使得二者能够同时达到最优效果。

附图说明

图1为本发明技术方法数据处理流程图；

图2为本发明的总体技术框架图；

图3为隐私对抗训练模块框架图；

图4为条件重构模块框架图。

具体实施方式

本发明公开了一种面向深度学习的数据敏感属性脱敏系统，图2为本发明的总体技术框架图；系统包括特征提取器和隐私对抗训练模块；特征提取器的输入端连接训练数据集，输出端连有隐私对抗训练模块；特征提取器由卷积神经网络组成，是训练的核心模块，由数据中心训练，训练完成后分发给个人用户用于后续的本地端数据预处理；隐私对抗训练模块包含代理攻击分类器，由卷积神经网络及全连接神经网络组成，用于优化特征提取器，使其产生有效的隐私保护能力。

系统还包含条件重构模块，条件重构模块包含隐私编码模型和条件重构网络，条件重构网络由反卷积神经网络组成，条件重构网络分别与特征提取器与隐私编码模型的输出端相连，条件重构网络用于优化特征提取器，使其产生的特征数据保持与原始数据类似的可用性，所述的隐私编码模型由卷积神经网络组成，用于参与条件重构优化流程；隐私编码模型由隐私编码器与辅助预测模型构成，辅助预测模型与隐私编码器的输出端相连，用于监督隐私编码器的效果，隐私对抗训练模块包括代理攻击分类器。

图1为本发明数据处理过程流程图；整个过程主要为两方参与，数据中心以及提供数据的个人用户，考虑到可能存在的恶意第三方窃取用户信息，同时为兼顾数据可用性，整个流程包括如下步骤：用户预先定义其敏感属性信息，由数据中心训练一个用于脱敏的特征提取器，用户共享数据之前，利用的特征提取器在本地端将原始数据转换为脱敏后的特征向量，并将所述的脱敏后的特征向量上传，恶意攻击者即使能访问到该特征向量无法从中获取到任何用户方的隐私信息，所述的训练一个用于脱敏的特征提取器的训练方法如下：

一、隐私对抗训练模块构建过程：训练数据集输入到特征提取器产生特征向量，隐私对抗训练模块接收来自特征提取器产生的特征向量，基于交叉熵损失，产生梯度回传至特征提取器；

二、条件重构模块构建过程：训练数据集输入到特征提取器与隐私编码模型，分别产生特征向量与隐私编码向量，条件重构模块中的条件重构网络接收来自特征提取器以及隐私编码模型产生的特征向量，计算重构损失，回传梯度至特征提取器；

三、通过联合学习策略对步骤1）与步骤2）中产生的梯度回传信息进行权衡，引入超参数，提高步骤1）中隐私对抗训练模块的权重则提升隐私保护效果，提升步骤2）中条件重构网络梯度则提升数据可用性效果。

步骤一中隐私对抗训练模块构建过程具体可分为如下几个步骤：

1）：对用户属性隐私泄漏进行形式化定义，衡量用户的隐私泄漏程度。攻击者的目标是利用在公开数据集上的预训练模型从用户上传的特征中推断出用户某一特定隐私属性的真值，即对于隐私属性

有

个可观测的类别标签，其中

代表第

个类别标签，对某个用户该隐私属性的真值为

，攻击者的目标是成功从用户上传的特征中推断出

。对于推断攻击的攻击策略，最佳的防御效果是使得攻击对于隐私属性的推断分布成为一个一致分布。需要训练一个特征提取器

,其中

为模型参数，使得攻击者的推断网络对于隐私属性的推断满足以下范式：

其中

为攻击者的推断网络，

为模型参数。为训练满足此范式的特征提取器，基于对抗博弈框架，防御方首先模拟攻击方行为，执行推断攻击，用于从特征提取器产生的特征中分析其隐私泄露程度。对于隐私属性

,其隐私泄露程度可以由对数条件分布

来衡量，

则是一个典型的预测模型用于判别真值

的概率大小，则对于用户上传数据，整体隐私泄露情况可衡量如下：

其中

是用户上传的特征向量的分布，

为用户上传的特征向量，

则是一个典型的预测模型用于判别真值

的概率大小。

代表隐私泄露期望值，其值越大，隐私泄露程度越严重。

2）：基于对用户隐私泄漏的衡量，在博弈论框架下，模拟攻击方训练一个代理攻击分类器通过最大化隐私泄露期望

，来揭露用户上传数据的隐私泄露程度，图3为隐私对抗训练模块框架图。给定训练输入图像数据

，用户指定需要保护的隐私属性

，构建随机初始化的特征提取器

，以及模拟攻击方行为构建的代理攻击分类器模型

，其中

和

分别为二者的模型参数。该攻击分类器网络的表现可以用如下的交叉熵损失函数来描述，该损失函数是负的

：

其中

则表示该攻击分类器网络对于真值标签的预测值。

是典型的交叉熵损失，衡量攻击分类器网络推断效果。

来最小化上述的交叉熵损失函数：

3）：基于训练好的代理攻击分类器，优化特征提取器。训练目标是最小化隐私泄露程度，即使得攻击者的预测成为一致分布，为了实现该目标，在特征空间中将隐私属性置于决策超平面上。给定攻击分类器网络，可以用如下的损失函数描述到决策超平面距离：

其中

代表隐私属性

的

个标签中的一个，

则代表对于隐私属性

中第

个类别的预测。

是对于隐私属性所有标签上的交叉熵误差的期望值。在抵御隐私信息泄露的过程中，代理攻击器模型对于隐私信息预测的不确定性需要被最大化，可以通过优化特征提取器来最小化上述损失函数来实现：

基于上述的优化目标，迭代优化特征提取器网络以及代理攻击分类器模型，直到两方训练收敛，此时攻击者只能以随机猜测水平去推断用户隐私信息。

为了保障数据与原始数据达到几乎一致的可用性的同时保障数据的隐私，需要将原始数据中的可判别信息完整的保留到特征向量中，设计了由隐私编码模型与条件重构网络组成的条件重构模块来实现这个目标，隐私编码模型由隐私编码器与辅助预测模型构成，图4为条件重构模块框架图。在保留原始数据可判别信息的过程中，需要最小化条件重构误差。

步骤二中条件重构模块构建过程分为一下几个步骤：

1）：为衡量条件重构误差，首先需要获得与特征向量同维度的隐私属性信息作为条件重构网络的输入，利用隐私编码器来产生这样的特征，隐私编码器产生的特征向量的精确程度可以利用辅助预测模型来约束，给定原始数据

，以及构建的好隐私保护特征提取器

，首先需要构建隐私编码器

用于产生条件重构模型的输入，利用辅助预测模型

来度量隐私编码模型产生的隐私特征向量的准确程度，该度量函数可以用如下损失函数描述：：

其中

为隐私编码器，

为辅助预测模型参数为

，

代表对于隐私信息的预测置信度。

用来衡量隐私特征向量

是否完整保留了隐私信息。该模型可以最小上述损失函数来更新辅助模型及隐私编码模型参数，如下：

2）：进一步地，给定由隐私编码模型产生的隐私特征向量

与特征提取器产生的特征向量

，设计条件重构网络按照如下范式来衡量重构误差：

其中

代表由

和

拼接所产生的重构数据，

。

是用于衡量原始数据

以及由

重构数据

间信息相似度的函数。考虑到度量的便捷性，采用 Mean Square error(MSE)作为度量函数，利用欧式距离上的期望值，即

，作为重构误差值：

其中

代表由

和

拼接所产生的重构数据。

为最大化保留除开隐私属性的之外的可判别信息，特征提取网络及条件重构网络可通过优化参数最小化上述损失函数来实现，优化范式如下：

当特征提取器训练收敛到最小化如上重构误差，则原始数据中除隐私属性外的可判别信息被最大化保留。

在对数据进行隐私保护的同时往往难以保障数据可用性，保障数据有较好的可用的同时往往难以保障数据的隐私安全，因此，设计了一种联合学习方法，对条件重构模块以及隐私对抗训练模块分配权重，用于对数据的隐私及数据可用性进行权衡，使得二者能够同时达到最优效果。通过联合学习策略对隐私对抗训练模块与条件重构模块中产生的梯度回传信息进行权衡，引入超参数，提高隐私对抗训练模块中权重则提升隐私保护效果，提升条件重构模块中的梯度则提升数据可用性效果。

步骤三中具体为，引入超参数

，进行联合建模训练，用于权衡数据隐私与数据可用性，训练过程中关键的特征提取器交替参与进行条件重构模块与隐私对抗学习模块训练，用于训练特征提取网络的最终优化目标如下：

在联合学习模型中，首先在不进行对抗学习和条件重构学习的情况下，预训练特征提取器与代理攻击分类器模型使得攻击者在最开始时能够对隐私属性的判别达到一个较好的水平。然后，在随后的每一个训练批次中，交替的执行隐私对抗学习和条件重构，同时使用权衡超参数

来更新特征提取器的参数。

本发明提出了对用户属性隐私的形式化描述，用户定于用户属性隐私的泄漏情况，提供了用户属性隐私衡量标准。

本发明利用对抗学习来将隐私属性在特征空间中置于决策的超平面，使得攻击方所能获取到的隐私信息最小化，利用条件重构学习来保障除了隐私属性之外的其他信息被尽可能的保留，使得下游训练任务的数据可用性最大化，最终利用联合学习模型保证数据隐私与数据可用性间的权衡，本方法在下游任务未知的深度学习数据收集已能达到较好的效果。

表1为本发明与现有方法在隐私保护与数据可用性上的比较。

第一列表示当前不同的隐私保护方法，第二列表示各种方法的参数设定，第三列及第六列为用户需要保护的隐私信息。表格中隐私属性所在列表示攻击利用模型推断隐私属性的精度，其他行表示在其他下游任务下的精度。本实验对比当前最先进的隐私保护方法，如 DP、DPFE等进行对比，所有方法均收集其在不同参数设定下的平均结果，如DP，其隐私预算参数

有三组参数设定，分别为0.9、0.5、0.1，则分别取其三组参数下的平均隐私保护效果与平均任务精度。可以明显看出，本方法TF-ARL在大部分情况下隐私保护效果与数据可用性均高于其他方法，同时该实验还展示了本方法在隐私保护与数据可用性上达到了更好的权衡。

本发明所设计的面向深度学习的数据敏感属性脱敏方法，给定训练数据集，利用联合学习训练，构建代理攻击分类器模型，构建隐私编码模型，产生特征向量表示，隐私编码向量表示，计算抵御隐私推断攻击损失，产生梯度，计算条件重构损失，产生梯度，利用超参数，权衡两个梯度大小，进行梯度回传，使得隐私属性在特征空间中置于决策的超平面，攻击者无法推断隐私，同时数据可用性得到保障。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种面向深度学习的数据敏感属性脱敏系统的脱敏方法，其特征在于，包括如下步骤：用户预先定义其敏感属性信息，由数据中心训练一个用于脱敏的特征提取器，用户共享数据之前，利用的特征提取器在本地端将原始数据转换为脱敏后的特征向量，并将所述的脱敏后的特征向量上传，恶意攻击者即使能访问到该特征向量无法从中获取到任何用户方的隐私信息，所述的训练一个用于脱敏的特征提取器的训练方法如下：

所述的步骤1）具体算法为：

1.1）首先对用户隐私泄漏情况进行定义；

所述的步骤1.1）具体为，对于隐私属性