CN109034228B

CN109034228B - 一种基于差分隐私和层级相关性传播的图像分类方法

Info

Publication number: CN109034228B
Application number: CN201810781097.2A
Authority: CN
Inventors: 李蜀瑜; 陈竑毓; 李泽堃
Original assignee: Shaanxi Normal University
Current assignee: Shaanxi Normal University
Priority date: 2018-07-17
Filing date: 2018-07-17
Publication date: 2021-10-12
Anticipated expiration: 2038-07-17
Also published as: CN109034228A

Abstract

本发明公开了一种基于差分隐私和层级相关性传播的图像分类方法，属于数据安全技术领域，其思路为：确定灰度图像数据集D，灰度图像数据集D包括m个灰度图像数据；计算灰度图像数据集D的相关性矩阵R和灰度图像数据集D的噪声平均相关性矩阵

设定卷积神经网络包括num_conv个卷积层和num_FC个全连接层，使用θ表示卷积神经网络全部参数，θ＝{θ^Conv,θ^FC}，θ^Conv表示卷积神经网络num_conv个卷积层的参数，θ^FC表示卷积神经网络num_FC个全连接层的参数；进而得到卷积神经网络最优参数

表示卷积神经网络num_conv个卷积层的最优参数，

表示卷积神经网络num_FC个全连接层的最优参数；将卷积神经网络num_conv个卷积层的最优参数

和卷积神经网络num_FC个全连接层的最优参数

作为一种基于差分隐私和层级相关性传播的图像分类结果。

Description

一种基于差分隐私和层级相关性传播的图像分类方法

技术领域

本发明属于数据安全技术领域，特别涉及一种基于差分隐私和层级相关性传播的图像分类方法。

背景技术

随着人工智能在推荐系统中的广泛应用，其高效的信息过滤技术，使用户更高效的获得自己感兴趣的商品和信息，但推荐系统向用户推荐的同时，存在侵犯用户隐私的风险。一方面，用户可能担心推荐结果中包含太多内容，会泄露自己的隐私信息；另一方面，对推荐结果感兴趣的用户可能担心推荐内容中包含低俗信息，限制其技术改进的能力；因此，处理隐私数据通常需要考虑数据可用性与隐私保护之间的平衡。

在整个大数据营销中，图像作为用户行为数据的重要组成部分，被广泛应用于各大电商网站，推荐系统通过模型分析模块提取图像的内容特征，例如颜色、纹理、形状等低级特征，PHOG、SIFT、CEDD等高级特征，然后对图像进行分类建模，计算与同一分类的库中图像的相似性，最终通过图像的相似性程度和相关匹配程度进行智能推荐；但是，当前基于图像数据的推荐系统并没有对数据进行隐私保护。

发明内容

针对上述现有技术中存在的隐私保护问题，本发明的目的在于提出一种基于差分隐私和层级相关性传播的图像分类方法，该种基于差分隐私和层级相关性传播的图像分类方法结合图像相关性及差分隐私技术设计一种隐私保护模型，基于卷积神经网络，通过训练多层网络来解决图像分类问题；在具体改进中，采用层级相关性传播(Layer-wiseRelevance Propagation,LRP)算法对神经网络中输入的图像特征数据与图像的分类结果之间的相关性进行量化，然后通过量化的相关性来确定对输入特征的隐私保护力度；通过这样的方式，使得图像在隐私保护的前提下，依然能够有较好的分类结果。

本发明的主要思路：利用LRP算法计算得到每个输入特征的平均相关性，并为其添加拉普拉斯噪声，实现图像相关性的隐私保护；根据分配的隐私预算，为神经网络的训练过程添加差分隐私保护，具体表现在为神经网络构造差分隐私变换层用于对图像部分区域中的输入特征按照一定规则添加噪声，同时对神经网络的损失函数添加噪声处理；为了提升神经网络的收敛速度，采用Adam算法迭代更新模型参数并最终输出得到稳定的模型。

为达到上述技术目的，本发明采用如下技术方案予以实现。

一种基于差分隐私和层级相关性传播的图像分类方法，包括以下步骤：

步骤1，确定灰度图像数据集D，所述灰度图像数据集D包括m个灰度图像数据和m个灰度图像数据对应的分类标签；然后基于层级相关性传播计算得到灰度图像数据集D的相关性矩阵R；

步骤2，基于差分隐私以及根据灰度图像数据集D的相关性矩阵R，得到灰度图像数据集D的噪声平均相关性矩阵

步骤3，将灰度图像数据集D划分为训练集D₁与测试集D₂，训练集D₁包括

个灰度图像数据，测试集D₂包括

个灰度图像数据，

设定卷积神经网络包括num_conv个卷积层和num_FC个全连接层，使用θ表示卷积神经网络全部参数，θ＝{θ^Conv,θ^FC}，θ^Conv表示卷积神经网络num_conv个卷积层的参数，θ^FC表示卷积神经网络num_FC个全连接层的参数；

初始化：令loop表示第loop次迭代，loop的初始值设为1，loop的最大值为预设值max_loop；对于第loop次迭代，1≤loop≤max_loop；

步骤4，从训练集D₁中确定第loop次迭代后的灰度图像数据集D_loop，进而得到第loop次迭代后的扰动批量数据

步骤5，根据第loop次迭代后的扰动批量数据

计算得到第loop次迭代后的交叉熵损失函数Loss_loop，进而得到第loop次迭代后的扰动损失函数

步骤6，根据第loop次迭代后的扰动损失函数

计算得到第loop次迭代后一阶矩偏差修正结果

和第loop次迭代后二阶矩偏差修正结果

步骤7，如果loop<max_loop，则令loop的值加1，根据第loop-1次迭代后一阶矩偏差修正结果

和第loop-1次迭代后二阶矩偏差修正结果

计算loop次迭代后的卷积神经网络全部参数θ_loop，然后返回步骤4；

直到得到第max_loop次迭代后的卷积神经网络全部参数θ_{max_loop}，此时迭代停止，并将迭代停止时得到的第max_loop次迭代后的卷积神经网络全部参数θ_{max_loop}，作为卷积神经网络最优参数

表示卷积神经网络num_conv个卷积层的最优参数，

表示卷积神经网络num_FC个全连接层的最优参数；

将卷积神经网络num_conv个卷积层的最优参数

和卷积神经网络num_FC个全连接层的最优参数

作为一种基于差分隐私和层级相关性传播的图像分类结果。

本发明的有益效果：

本发明基于图像相关性，充分考虑到图像特征数据的重要特征，并根据这些重要程度自适应地扰动输入特征，对图像本身进行隐私保护；再者，扰动神经网络的损失函数来保护模型参数，对模型进行隐私保护；通过上述隐私保护步骤，使得图像在隐私保护的前提下，依然能够有较好的分类效果。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细说明。

图1是本发明的一种基于差分隐私和层级相关性传播的图像分类方法流程图；

图2a是计算得到的的平均相关性示意图；

图2b是经过噪声处理的平均相关性示意图图；

图3a是原始图像示意图；

图3b是经过噪声处理后的图像示意图；

图4是本发明的一种基于差分隐私和层级相关性传播的图像分类方法在不同隐私预算下的模型分类准确率对比图。

具体实施方式

参照图1，为本发明的一种基于差分隐私和层级相关性传播的图像分类方法流程图；其中所述基于差分隐私和层级相关性传播的图像分类方法，包括以下步骤：

步骤1：输入数据集，计算输入特征的相关性并累加求和。

输入灰度图像数据集D，其中灰度图像数据集D包含第一部分和第二部分两部分内容，第一部分是m个灰度图像数据，每个灰度图像数据都为n×n维矩阵，且n×n维矩阵中每个元素分别代表一个输入特征；第二部分是m个灰度图像数据对应的分类标签，记分类标签数量为C，则C个分类标签是一个C维的one-hot向量。

设置神经网络共有L层，分别用0,1,2,...,l,l+1,...,L-1表示，神经网络第0层表示输入层，第L-1层表示输出层，中间第1层至第L-2层都是隐藏层；神经网络第0层神经元总个数为|n×n|，第L-1层神经元总个数为C。

神经网络连接权重用w表示，w＝{w^(0,1),w^(1,2),...,w^(l,l+1),...,w^(L-2,L-1)}，w^(0,1)表示神经网络第0层和第1层的连接权重，w^(l,l+1)表示神经网络第l层和第l+1层的连接权重，w^(l，l+1)是一个行数为神经网络第l+1层神经元总个数、列数为神经网络第l层神经元总个数的权重矩阵；神经网络偏置项用b表示，b＝{b⁽¹⁾,b⁽²⁾,...,b^(l),...,b^(L-1)}，b⁽¹⁾表示神经网络第1层的偏置项，是一个维数为第1层神经元总个数的实数向量；b^(l)表示神经网络第l层的偏置项，是一个维数为第l层神经元总个数的实数向量。

基于上述神经网络，计算每个灰度图像数据的图像输入特征与分类结果的相关性并对其累加求和，进而得到灰度图像数据集D的相关性矩阵R，R是一个与每个灰度图像数据行数和列数均相同的矩阵，其每一维度上的相关性用R_row,col表示，其中row和col表示位于灰度图像数据集D的相关性矩阵R的第row行、第col列，且1≤row≤n，1≤col≤n；实际计算灰度图像数据集D的相关性矩阵R的过程包括如下几个子步骤：

(1a)前向计算过程可以表述为计算当前神经元的偏置项加上神经网络上一层每一个神经元的输出乘以其与当前神经元的连接权重累加之和的值，然后将求和结果作为当前神经元的输入，再经过激活函数处理得到输出，又将输出值用于下一层神经元输入的计算，直至达到神经网络输出层，其中神经元的输入由下述公式(1)计算得到：

其中，j＝1,2,…,|l'+1|，i＝1,2,…,|l'|，|l'|表示神经网络第l'层神经元总个数，|l'+1|表示神经网络第l'+1层神经元总个数，l'＝0,1,2,…,L-2，

表示神经网络第l'+1层第j个神经元的输入，

表示神经网络第l'层第i个神经元的输出，若l'＝0，则

表示神经网络第0层第i个神经元的输出；

表示神经网络第l'层第i个神经元和第l'+1层第j个神经元的连接权重，

表示神经网络第l'+1层第j个神经元的偏置项；将输入值经过

计算可得到神经网络第l'+1层第j个神经元的输出

其中f(·)表示应用在当前神经元的激活函数，当l'+1＝L-1时，

表示神经网络第L-1层第j个神经元的输出。

(1b)令j的值分别取1至|l'+1|，重复执行(1a)，进而分别得到神经网络第l'+1层第1个神经元的输入

至神经网络第l'+1层第|l'+1|个神经元的输入

以及神经网络第l'+1层第1个神经元的输出

至神经网络第l'+1层第|l'+1|个神经元的输出

并分别记为神经网络第l'+1层的输入z^(l'+1)和神经网络第l'+1层的输出x^(l'+1)，然后将j的值初始化为1。

(1c)令l'的值分别取0至L-2，重复执行(1a)和(1b)，进而分别得到神经网络第1层的输入z⁽¹⁾至神经网络第L-1层的输入z^(L-1)，以及神经网络第1层的输出x⁽¹⁾至神经网络第L-1层的输出x^(L-1)，然后将l'的值初始化为0。

从灰度图像数据集D中读取第k个灰度图像数据，将第k个灰度图像数据处理成|n×n|长度的列向量形式，并在设置的神经网络上使用传统神经网络中的前向算法计算得到第k个灰度图像数据的C维输出量Out_k；k＝1,2,…,m。

将第k个灰度图像数据的C维输出量Out_k作为神经网络第L-1层的相关性r^(L-1)，计算输入特征与分类结果的相关性就是将这些相关性利用计算公式从输出层逐层向后传播至输入层，即传播到输入特征；根据神经网络的特点，当前神经元上计算得到的相关性会在向后传播过程中被分散到上一层相连的所有神经元上，给出相关性在层级之间的传播方式如公式(2)所示：

其中，因相关性计算过程是向后传播的，所以l″+1的初始值是L-1，l″的初始值为L-2，可取l″+1＝L-1,L-2,…,2,1，l″＝L-2,L-3,…,2,1,0；

表示神经网络第l″层第i'个神经元上的相关性，i'＝1,2,…,|l″|，|l″|表示神经网络第l″层神经元总个数；当l″取值为0时，神经网络第0层神经元总个数为|n×n|，此时

也就是第i个输入特征上的相关性；

表示神经网络第l″+1层第j″个神经元上的相关性，j″＝1,2,…,|l″+1|，|l″+1|表示神经网络第l″+1层神经元总个数；

表示神经网络第l″+1层第j″个神经元的输入，

表示神经网络第l″层第i'个神经元和第l″+1层第j″个神经元的连接权重，

表示神经网络第l″层第i'个神经元的输出。

基于层级相关性传播并根据公式(2)计算得到神经网络第0层的相关性r⁽⁰⁾，

表示神经网络第0层第q个神经元的相关性，q＝1,2,…,|n×n|，|n×n|表示神经网络第0层神经元总个数，也就是第k个灰度图像数据的输入特征数；然后将神经网络第0层的相关性r⁽⁰⁾，作为第k个灰度图像数据相关性列向量。

(1d)将第k个灰度图像数据相关性列向量转换为与第k个灰度图像数据同形状的相关性矩阵，记为第k个灰度图像数据的相关性矩阵P_k。

(1e)令k的值分别取1至m，重复子步骤(1a)至(1d)，进而得到第1个灰度图像数据的相关性矩阵P₁至第m个灰度图像数据的相关性矩阵P_m，并记为m个灰度图像数据的相关性矩阵P₁,P₂,P₃,...,P_m。

(1f)计算第row行、第col列上的相关性R_row,col，其计算过程如公式(3)所示：

其中，row＝1,2,…,n，col＝1,2,…,n，P_k,row,col表示第k个灰度图像数据的相关性矩阵P_k在第row行、第col列上的相关性。

(1g)令col的值分别取1至n，重复执行(1f)，进而分别得到第row行、第1列上的相关性R_row,1至第row行、第n列上的相关性R_row,n，记为第row行上的相关性R_row，然后将col的值初始化为1。

(1h)令row的值分别取1至n，重复执行(1f)和(1g)，进而分别得到第1行上的相关性R₁至第n行上的相关性R_n，记为灰度图像数据集D的相关性矩阵R。

步骤2：计算平均相关性进行噪声处理。

步骤1计算得到的灰度图像数据集D的相关性矩阵R衡量了灰度图像数据集D中不同维度的输入特征对m个灰度图像数据的分类结果影响；为使计算过程中占据内存量小，可对灰度图像数据集D的相关性矩阵R求平均值；但同时考虑到相关性数据可能造成的隐私泄露风险，步骤2计算每个输入特征的平均相关性并对其进行噪声处理。

噪声处理操作中添加噪声的规模与平均相关性计算函数的敏感度△F相关，即计算函数对单一相关性值的最大敏感程度，因此为方便对输入特征的平均相关性的噪声处理，可将其进行归一化处理。

在本发明方法中，样本计算得到的相关性取值经过归一化处理，最大值为1，共有m个灰度图像数据的相关性参与计算，得出平均相关性计算函数的函数敏感度△F取值为

确定了平均相关性计算函数的函数敏感度，添加噪声的规模还与隐私预算相关；在(0,1)内随机抽取数据作为第一隐私预算ε₁的值，将灰度图像数据集D的噪声平均相关性矩阵用

表示，令

表示灰度图像数据集D的噪声平均相关性矩阵

的第row行、第col列元素，其计算公式如公式(5)所示：

其中，row＝1,2,…,n，col＝1,2,…,n，R_row,col表示第row行、第col列上的相关性，

表示服从拉普拉斯Laplace分布的噪声添加量，normalize(·)表示将平均相关性进行归一化处理。

步骤2给出了量化每个输入特征对数据集样本总体分类结果的影响程度的步骤，并对其添加了隐私保护；本发明方法后续步骤会利用这个噪声平均相关性矩阵对输入数据添加隐私保护，并确保较好的分类效果。

步骤3：构造卷积神经网络模型。

构造需要训练的卷积神经网络模型并进行参数初始化；在本实施例中，卷积神经网络不仅需要对每一个灰度图像数据进行分类任务，而且需要保护每一个灰度图像数据的数据隐私，因此构造神经网络过程中，在传统的模型之外，添加差分隐私变换层DPT，用于对每一个灰度图像数据进行噪声处理。

差分隐私变换层DPT的运行原理首先在于每一个灰度图像数据中的重要像素点处于绝对中心或者是相对中心的位置，因此其处理步骤在于先将每一个灰度图像数据归一化，此时较大概率上灰度图像边缘都是0值或是接近于0的值，之后判断从哪一行哪一列开始到哪一行哪一列结束的矩形范围内都有特征值不小于设定的阈值thv，设定的阈值thv根据具体数据集确定，一般取0或者m个灰度图像数据的所有输入特征中最大值的十分之一。

利用上述原理确定图像的矩形区域范围作为待加噪区域，然后根据步骤2计算的平均相关性矩阵对区域内输入特征进行加噪，加噪原则是非零且相关性较大的特征添加更小的噪声，反之亦然，对于待加噪区域内的零值输入特征，按照概率添加噪声，具体应用方式将在步骤4进行讲解；差分隐私变换层DPT减小了每一个灰度图像数据的加噪范围，使得较于为整个图像数据添加噪声的方式能够支持更小的隐私预算，即实现更好的隐私保护；扰动之后，将输入特征从[0,1]扩展到[-1,1]，用于后续模型计算。

构造一个卷积神经网络模型，在神经网络输入层之后添加差分隐私变换层DPT，对于卷积神经网络模型中的连接权重以及偏置项等模型参数采用随机方式进行初始化；本发明中采用模型的层数及其超参数将在实验仿真阶段给出。

利用交叉验证方式将灰度图像数据集D分成训练集D₁与测试集D₂，在训练集D₁包括

个灰度图像数据，并在训练集D₁上迭代步骤4、5、6进行模型训练；测试集D₂包括

个灰度图像数据，

初始化：令loop表示第loop次迭代，loop的初始值设为1，loop的最大值为预设值max_loop；对于第loop次迭代，1≤loop≤max_loop。

训练过程遵循差分隐私保护原则，根据经验分配的第二隐私预算为ε₂，ε₂∈(0,1)。具体的训练过程中要保证对m个灰度图像数据本身以及对模型参数的隐私保护，具体方式是对输入特征进行噪声处理，以及对损失函数进行噪声处理，卷积神经网络模型将第二隐私预算ε₂平均分到两个处理过程中，即每个步骤的隐私预算均为

步骤4：训练过程批数据读取，并对输入特征进行噪声处理。

考虑到神经网络的训练效率，训练过程采用批量方式读取数据，将批量大小记为batch_size；从训练集D₁随机读取batch_size个灰度图像数据用于训练，读取的批量数据记为第loop次迭代后的灰度图像数据集D_loop，

为避免训练过程中图像数据的隐私泄露，利用差分隐私变换层DPT对每个灰度图像数据的输入特征进行扰动处理，得到扰动图像的输入特征；扰动图像的输入特征一方面可以对对应灰度图像数据本身进行隐私保护，另一方面也有可能会降低对应灰度图像的分类准确率；本发明方法希望通过扰动更小范围内的输入特征，以及对重要特征扰动更少的原则实现对隐私保护与分类准确率之间的平衡。

对于每个灰度图像数据，差分隐私变换层DPT的具体运行原理可划分为几个子步骤，包括：

(4a)确定加噪区域。

选取第loop次迭代后的灰度图像数据集D_loop中第d幅灰度图像数据，记为D_loop,d，d＝1,2,…,batch_size；对D_loop,d进行归一化处理，并根据差分隐私变换层DPT的运行原理，设定阈值为0的方式确定D_loop,d的部分矩形区域范围作为第loop次迭代后第d幅灰度图像数据的待加噪区域F_loop,d，缩小D_loop,d的加噪范围。

具体地，构造一个长为n且值全为thv的行向量，行向量的行标依次为1、2、…、n，计算行标的下限需从D_loop,d中第1行开始比较，依次将D_loop,d的行标加1，直到D_loop,d中的行首次出现行内输入特征超过设定阈值thv，则将该行的行标设定为待加噪区域F_loop,d的行下限，记为R_low；计算行标的上限则需要从D_loop,d中第n行开始比较，依次将D_loop,d中的行标减1，直到D_loop,d中首次出现行内输入特征超过设定阈值thv，则将该行的行标设定为待加噪区域F_loop,d的行上限，记为R_high。

同样原理，构造一个长为n且值全为thv的列向量，列向量的列标依次为1、2、…、n，计算列标的下限需从D_loop,d中第1列开始比较，依次将D_loop,d的列标加1，直到D_loop,d中的列首次出现列内输入特征超过设定阈值thv，则将该列的列标设定为待加噪区域F_loop,d的列下限，记为C_low；计算列标的上限则需要从D_loop,d的第n列开始比较，依次将D_loop,d的列标减1，直到D_loop,d中首次出现列内输入特征超过设定阈值thv，则将该列的列标设定为待加噪区域F_loop,d的列上限，记为C_high。

将D_loop,d中行在[R_low,R_high]内、列在[C_low，C_high]内的区域，作为第loop次迭代后第d幅灰度图像数据的待加噪区域F_loop,d。

(4b)确定隐私预算分配

算法对输入特征的扰动原则是为相关性更小的输入特征添加更多的噪声，而噪声大小的一个决定因素是为其分配的隐私预算的大小，分配的隐私预算越小，添加的噪声越大，因此这一步需要确定为待加噪区域F_loop,d内的每个输入特征分配隐私预算，隐私预算分配需要借助步骤2中计算的噪声平均相关性矩阵，分配原则如公式(6)所示：

其中，ε_{row',col',loop,d}表示分配到D_loop,d中第row'行、第col'列输入特征的隐私预算，其中row'和col'的取值必须符合待加噪区域F_loop,d的范围，即R_low≤row'≤R_high，C_low≤col'≤C_high；

表示灰度图像数据集D的噪声平均相关性矩阵

的第row'行、第col'列元素；

表示噪声平均相关性矩阵

内行在[R_low,R_high]内、列在[C_low,C_high]内的所有噪声平均相关性相加之和。

根据公式(6)可以保证相关性较小的输入特征分配的隐私预算更小，从而导致更大的噪声，反之，相关性较大的输入特征添加更小的噪声，使得对于图像整体的扰动更小。

(4c)为输入特征添加噪声。

根据(4b)的计算结果，为D_loop,d的输入特征进行加噪，加噪方法如公式(7)所示得到待加噪区域F_loop,d内第row'行、第col'列的扰动输入特征

其中，I_{loop,d,row',col'}表示待加噪区域F_loop,d内第row'行、第col'列的输入特征，即row'和col'的取值必须符合待加噪区域F_loop,d的范围，

表示服从拉普拉斯Laplace分布的噪声添加量，△_I表示输入的训练集分类结果对单一灰度图像数据的最大敏感程度，取值为

|D|表示训练集D₁的大小，|n×n|表示神经元第0层神经元总个数。

(4d)令col'的值分别取C_low至C_high，重复执行(4c)，直到得到待加噪区域F_loop,d内第row'行、第C_low列的扰动输入特征

至待加噪区域F_loop,d内第row'行、第C_high列的扰动输入特征

记为待加噪区域F_loop,d内第row'行的扰动输入特征

然后将col'的值初始化为C_low。

(4e)令row'的值分别取R_low至R_high，重复执行(4c)和(4d)，直到得到待加噪区域F_loop,d内第R_low行的扰动输入特征

至待加噪区域F_loop,d内第R_high行的扰动输入特征

记为待加噪区域F_loop,d内的扰动输入特征

并作为D_loop中第d幅灰度图像数据输入特征加噪处理结果，然后将col'的值初始化为C_low，将row'的值初始化为R_low。

(4f)令d的值分别取1至batch_size，重复执行(4c)至(4e)，直到得到D_loop中第1幅灰度图像数据输入特征加噪处理结果至D_loop中第batch_size幅灰度图像数据输入特征加噪处理结果，记为第loop次迭代后的扰动批量数据

步骤4描述过程是针对单一灰度图像数据的输入特征进行噪声处理，对D_loop中每个灰度图像数据都用同样方法进行噪声扰动，最终实现了批量数据读取以及扰动，扰动的批量数据用

表示；相较于其他的方法，本发明方法扰动范围更小，使得能够支持更强的隐私保护，另外对重要特征的扰动更小，基于此，对最终分类结果的影响程度也将更小。

步骤5：计算损失函数并进行噪声处理。

利用上面的扰动样本进行前向计算得到

的分类结果y，针对Softmax型的输出结果，本发明方法采用交叉熵损失函数作为模型的优化目标；交叉熵损失函数计算公式如公式(9)所示：

其中，公式(9)表明需要对

中的每个灰度图像数据进行计算，Loss_loop表示第loop次迭代后的交叉熵损失函数，a_(sp)表示

中第sp个灰度图像数据对应的分类标签，y_(sp)表示

中第sp个灰度图像数据的模型计算分类结果，即

中第sp个灰度图像数据在神经网络第L-1层的输出结果，

表示神经网络第L-1层第q'个神经元的输出，q'＝1,2,…,|L-1|，|L-1|表示神经网络第L-1层神经元总个数，上标T表示转置操作。

针对神经网络训练过程中的隐私问题，本方面方法通过对损失函数进行噪声处理来保护隐私，具体加噪方法如公式(10)所示：

其中，

表示第loop次迭代后的扰动损失函数，△_L表示损失函数对D_loop中每个灰度图像数据的最大敏感程度，取值为

|D|表示训练集D₁的大小，|n×n|表示神经网络第0层神经元总个数；

表示服从拉普拉斯Laplace分布的噪声添加量。

步骤6：优化目标函数，更新模型参数。

神经网络训练过程需要最小化损失函数，基于所述第loop次迭代后的扰动损失函数

步骤6采用Adam算法代替传统的随机梯度下降SGD算法更新模型参数，一方面能有效解决梯度消失或梯度爆炸的问题，另一方面收敛速度更快，学习效果更好。

首先设定卷积神经网络包括num_conv个卷积层和num_FC个全连接层，使用θ表示卷积神经网络全部参数，θ＝{θ^Conv,θ^FC}，θ^Conv表示卷积神经网络num_conv个卷积层的参数，θ^Conv＝{θ^Conv_1,θ^Conv_2,...,θ^Conv_no,...,θ^{Conv_num_conv}}，no＝1,2,…,num_conv，θ^Conv_no表示第no个卷积层的参数，θ^Conv_no的个数为(Size_{Filter_no}+1)×Depth_no，Size_{Filter_no}表示卷积神经网络中第no个卷积层的过滤器大小，Depth_no表示卷积神经网络中第no个卷积层的过滤器个数；θ^FC表示卷积神经网络num_FC个全连接层的参数，

θ^FC＝{θ^FC_(1，2),θ^FC_(2，3),...,θ^{FC_(index，index+1)},...,θ^{FC_(num_FC-1，num_FC)}}，θ^{FC_(index,index+1)}表示第index个全连接层和第index+1个全连接层之间的连接权重及偏置项，θ^{FC_(index，index+1)}的参数个数为(number_index+1)×number_index+1，number_index表示第index个全连接层神经元总个数，number_index+1表示第index+1个全连接层神经元总个数。

以随机化方式为卷积神经网络全部参数分别赋任意实数值，得到卷积神经网络全部参数初始值θ₀。

步骤6的具体更新子步骤为：

6.1计算得到第loop次迭代后的梯度g_loop，

表示第loop次迭代后的扰动损失函数，

表示θ_loop的梯度，θ_loop表示第loop次迭代后的卷积神经网络全部参数。

6.2计算得到第loop次迭代后一阶矩估计s_loop，s_loop＝ρ₁s_loop-1+(1-ρ₁)g_loop，s_loop-1表示第loop-1次迭代后一阶矩估计，s₀＝0；ρ₁表示矩估计的指数衰减速率，且值在区间[0,1)内的随机数。

6.3计算得到第loop次迭代后二阶矩估计r_loop，

r_loop-1表示第loop-1次迭代后二阶矩估计，r₀＝0；ρ₂表示矩估计的指数衰减速率，且值在区间[0,1)内的随机数。

6.4计算得到第loop次迭代后一阶矩偏差修正结果

6.5计算得到第loop次迭代后二阶矩偏差修正结果

和第loop-1次迭代后二阶矩偏差修正结果

计算第loop次迭代后的卷积神经网络全部参数θ_loop，

θ_loop＝θ_loop-1+△θ_loop-1，

表示第loop-1次迭代后一阶矩偏差修正结果，

表示第loop-1次迭代后二阶矩偏差修正结果；δ表示一个小常数，一般取10^-8，用于数值稳定；α表示学习步长，通常α取值为0.001；然后返回步骤4。

表示卷积神经网络num_conv个卷积层的最优参数，

表示卷积神经网络num_FC个全连接层的最优参数。

将卷积神经网络num_conv个卷积层的最优参数

和卷积神经网络num_FC个全连接层的最优参数

作为一种基于差分隐私和层级相关性传播的图像分类结果，也是一种基于差分隐私和层级相关性传播的图像分类方法的最优模型参数。

上述循环过程达到最大迭代次数或者目标函数，也就是损失函数达到最优时，结束循环过程，本发明方法将输出构造的卷积神经网络及其对应的参数，包括卷积神经网络num_conv个卷积层的最优参数

和卷积神经网络num_FC个全连接层的最优参数

本发明效果通过以下仿真实验进一步说明。

(一)仿真条件：

采用TensorFlow1.4.0 CPU版本、Python3.6、Windows Server 2008R2Enterprise64位操作系统版本作为开发环境，采用MNIST数据集，使用灰度手写数字图片作为模型输入，其中包含训练样本60000个，测试样本10000个，每个样本均由28*28的像素点组成。

实例中采用以下卷积网络模型：

Input→DPT→Conv1→Pool1→Conv2→Pool2→Conv3→Pool3→FC→Softmax

其中所有池化层均采用平均池化方式，Conv1层有10个5*5的过滤器，步长为1，Conv2层有25个5*5的过滤器，步长为1，Conv3有100个4*4的过滤器，步长为1，FC有10个神经元；数据经过FC全连接层的运算将得到对应的分类结果，在其之后添加Softmax回归处理，进行结果的归一化处理。

以下仿真将图像分类准确率作为衡量模型性能的标准，通过不同隐私预算的独立多次迭代实验，计算训练数据分类准确率。

(二)仿真内容：

仿真1：取隐私预算ε₁为0.01，计算训练集样本输入特征的平均相关性并进行噪声处理，对比结果如图2a和图2b所示，其中图2a表示计算得到的平均相关性，图2b是经过噪声处理的平均相关性。

仿真2：取batch_size为1000，隐私预算ε₂为0.10，阈值设置为0，零值扰动概率设置为0.8；根据仿真1的加噪平均相关性对图像输入特征进行扰动，对比结果如图3a和图3b所示，其中图3a表示原始图像，图3b是经过噪声处理的图像。

仿真3：取batch_size为5000，隐私预算ε₂分别取值0.10、0.20、0.30、0.40、0.50，根据仿真1的加噪平均相关性对图像输入特征进行扰动之后用于模型训练，并比较不同隐私预算下模型的分类准确率，对比结果如图4所示。

(三)仿真分析：

从图2a和图2b可以看出，本发明所设计的一种基于差分隐私和层级相关性传播的图像分类方法在平均相关性加噪处理阶段，扰动了平均相关性数据，保护了图像输入特征重要程度隐私，同时保持输入特征重要程度基本不变，为后面的图像输入特征扰动阶段隐私预算分配提供依据。

从图3a和图3b可以看出，本发明所设计的基于差分隐私和层级相关性传播的图像分类方法在输入特征扰动阶段，对加噪区域内的输入特征进行扰动，且遵循相关性大的输入特征扰动较小，相关性小的输入特征扰动较大的原则，对于零值输入特征，以一定概率进行噪声处理；多次实验可知，隐私预算越小，输入特征扰动程度越大，图像偏离程度也越大。

从图4可以看出，在batch_size为5000的情况下，隐私预算ε₂取值小于0.10时，会因为输入特征添加噪声过大而导致无法收敛，也就得不到一个很好的训练模型；当隐私预算ε₂取值较大时，模型实现了隐私保护与分类准确性之间的平衡，且收敛速度较快；经过加噪公式(7)可知，添加的噪声规模与批量大小与隐私预算相关，只要两者达到一定数量级上的平衡，就可以保护图像及模型隐私，还可以保证图像的分类准确性。

综上所述，仿真实验验证了本发明的正确性和有效性。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于差分隐私和层级相关性传播的图像分类方法，其特征在于，包括以下步骤：

个灰度图像数据，测试集D₂包括

个灰度图像数据，

步骤5，根据第loop次迭代后的扰动批量数据

步骤6，根据第loop次迭代后的扰动损失函数

计算得到第loop次迭代后一阶矩偏差修正结果

和第loop次迭代后二阶矩偏差修正结果

和第loop-1次迭代后二阶矩偏差修正结果

直到得到第max_loop次迭代后的卷积神经网络全部参数θ_{max_loop}，此时迭代停止，并将迭代停止时得到的第max_loop次迭代后的卷积神经网络全部参数θ_max__loop，作为卷积神经网络最优参数

表示卷积神经网络num_conv个卷积层的最优参数，

表示卷积神经网络num_FC个全连接层的最优参数；

将卷积神经网络num_conv个卷积层的最优参数

和卷积神经网络num_FC个全连接层的最优参数

作为一种基于差分隐私和层级相关性传播的图像分类结果。

2.如权利要求1所述的一种基于差分隐私和层级相关性传播的图像分类方法，其特征在于，在步骤1中，所述m个灰度图像数据，每个灰度图像数据都为n×n维矩阵，且n×n维矩阵中每个元素分别代表一个输入特征；

将所述m个灰度图像数据对应的分类标签，记分类标签数量为C；

所述灰度图像数据集D的相关性矩阵R，其得到过程为：

(1a)设置神经网络共有L层，分别用0,1,2,...,l,l+1,...,L-1表示，神经网络第0层表示输入层，第L-1层表示输出层，中间第1层至第L-2层都是隐藏层；神经网络第0层神经元总个数为|n×n|，第L-1层神经元总个数为C；

(1b)计算神经网络第l'+1层第j个神经元的输入

表示神经网络第l'层第i个神经元的输出，若l'＝0，则

表示神经网络第0层第i个神经元的输出；

表示神经网络第l'+1层第j个神经元的偏置项；

f(·)表示激活函数，当l'+1＝L-1时，

表示神经网络第L-1层第j个神经元的输出；

(1c)令j的值分别取1至|l'+1|，重复执行(1b)，进而分别得到神经网络第l'+1层第1个神经元的输入

至神经网络第l'+1层第|l'+1|个神经元的输入

以及神经网络第l'+1层第1个神经元的输出

至神经网络第l'+1层第|l'+1|个神经元的输出

并分别记为神经网络第l'+1层的输入z^(l'+1)和神经网络第l'+1层的输出x^(l'+1)，然后将j的值初始化为1；

(1d)令l'的值分别取0至L-2，重复执行(1b)和(1c)，进而分别得到神经网络第1层的输入z⁽¹⁾至神经网络第L-1层的输入z^(L-1)，以及神经网络第1层的输出x⁽¹⁾至神经网络第L-1层的输出x^(L-1)，然后将l'的值初始化为0；

从灰度图像数据集D中读取第k个灰度图像数据，并在设置的神经网络上使用传统神经网络中的前向算法计算得到第k个灰度图像数据的C维输出量Out_k；k＝1,2,…,m；

(1e)计算神经网络第l”层第i'个神经元上的相关性

其中，l”+1的初始值是L-1，l”的初始值为L-2，l”+1＝L-1,L-2,…,2,1，l”＝L-2,L-3,…,2,1,0；

表示神经网络第l”层第i'个神经元上的相关性，

i'＝1,2,…,|l”|，|l”|表示神经网络第l”层神经元总个数；

表示神经网络第l”+1层第j”个神经元上的相关性，j”＝1,2,…,|l”+1|，|l”+1|表示神经网络第l”+1层神经元总个数；

表示神经网络第l”+1层第j”个神经元的输入，

表示神经网络第l”层第i'个神经元和第l”+1层第j”个神经元的连接权重，

表示神经网络第l”层第i'个神经元的输出；

基于层级相关性传播计算得到神经网络第0层的相关性r⁽⁰⁾，

表示神经网络第0层第q个神经元的相关性，q＝1,2,…,|n×n|，|n×n|表示神经网络第0层神经元总个数；然后将神经网络第0层的相关性r⁽⁰⁾，作为第k个灰度图像数据相关性列向量；

(1f)将第k个灰度图像数据相关性列向量转换为与第k个灰度图像数据同形状的相关性矩阵，记为第k个灰度图像数据的相关性矩阵P_k；

(1g)令k的值分别取1至m，重复子步骤(1b)至(1f)，进而得到第1个灰度图像数据的相关性矩阵P₁至第m个灰度图像数据的相关性矩阵P_m，并记为m个灰度图像数据的相关性矩阵P₁,P₂,P₃,...,P_m；

(1h)计算第row行、第col列上的相关性R_row,col：

其中，row＝1,2,…,n，col＝1,2,…,n，P_k,row,col表示第k个灰度图像数据的相关性矩阵P_k在第row行、第col列上的相关性；

(1i)令col的值分别取1至n，重复执行(1h)，进而分别得到第row行、第1列上的相关性R_row,1至第row行、第n列上的相关性R_row,n，记为第row行上的相关性R_row，然后将col的值初始化为1；

(1j)令row的值分别取1至n，重复执行(1h)和(1i)，进而分别得到第1行上的相关性R₁至第n行上的相关性R_n，记为灰度图像数据集D的相关性矩阵R。

3.如权利要求2所述的一种基于差分隐私和层级相关性传播的图像分类方法，其特征在于，在步骤2中，所述灰度图像数据集D的噪声平均相关性矩阵

具体为：

令

表示灰度图像数据集D的噪声平均相关性矩阵

的第row行、第col列元素，其计算公式为：

其中，row＝1,2,…,n，col＝1,2,…,n，R_row,col表示第row行、第col列上的相关性，lap表示拉普拉斯分布，ε₁表示第一隐私预算，第一隐私预算ε₁为(0,1)内的随机数，

normalize(·)表示归一化处理操作。

4.如权利要求3所述的一种基于差分隐私和层级相关性传播的图像分类方法，其特征在于，步骤4的子步骤为：

(4a)从训练集D₁随机读取batch_size个灰度图像数据，记为第loop次迭代后的灰度图像数据集D_loop，

选取第loop次迭代后的灰度图像数据集D_loop中第d幅灰度图像数据，记为D_loop,d，d＝1,2,…,batch_size；

确定D_loop,d的部分矩形区域范围作为第loop次迭代后第d幅灰度图像数据的待加噪区域F_loop,d；

(4b)计算分配到D_loop,d中第row'行、第col'列输入特征的隐私预算ε_{row',col',loop,d}：

其中，R_low≤row'≤R_high，C_low≤col'≤C_high；

表示灰度图像数据集D的噪声平均相关性矩阵

的第row'行、第col'列元素；

表示噪声平均相关性矩阵

内行在[R_low,R_high]内、列在[C_low,C_high]内的所有噪声平均相关性相加之和；

(4c)计算待加噪区域F_loop,d内第row'行、第col'列的输入特征I_{loop,d,row',col'}：

其中，I_{loop,d,row',col'}表示待加噪区域F_loop,d内第row'行、第col'列的输入特征，lap表示拉普拉斯分布，

|D|表示训练集D₁的大小，|n×n|表示神经元第0层神经元总个数；

至待加噪区域F_loop,d内第row'行、第C_{_}high列的扰动输入特征

记为待加噪区域F_loop,d内第row'行的扰动输入特征

然后将col'的值初始化为C_low；

至待加噪区域F_loop,d内第R_high行的扰动输入特征

记为待加噪区域F_loop,d内的扰动输入特征

并作为D_loop中第d幅灰度图像数据输入特征加噪处理结果，然后将col'的值初始化为C_low，将row'的值初始化为R_low；

5.如权利要求4所述的一种基于差分隐私和层级相关性传播的图像分类方法，其特征在于，所述第loop次迭代后第d幅灰度图像数据的待加噪区域F_loop,d，其确定过程为：

构造一个长为n且值全为设定阈值thv的行向量，行向量的行标依次为1、2、…、n，计算行标的下限需从D_loop,d中第1行开始比较，依次将D_loop,d的行标加1，直到D_loop,d中的行首次出现行内输入特征超过设定阈值thv，则将该行的行标设定为待加噪区域F_loop,d的行下限，记为R_low；计算行标的上限则需要从D_loop,d中第n行开始比较，依次将D_loop,d中的行标减1，直到D_loop,d中首次出现行内输入特征超过设定阈值thv，则将该行的行标设定为待加噪区域F_loop,d的行上限，记为R_high；

构造一个长为n且值全为设定阈值thv的列向量，列向量的列标依次为1、2、…、n，计算列标的下限需从D_loop,d中第1列开始比较，依次将D_loop,d的列标加1，直到D_loop,d中的列首次出现列内输入特征超过设定阈值thv，则将该列的列标设定为待加噪区域F_loop,d的列下限，记为C_low；计算列标的上限则需要从D_loop,d的第n列开始比较，依次将D_loop,d的列标减1，直到D_loop,d中首次出现列内输入特征超过设定阈值thv，则将该列的列标设定为待加噪区域F_loop,d的列上限，记为C_high；

将D_loop,d中行在[R_low,R_high]内、列在[C_low,C_high]内的区域，作为第loop次迭代后第d幅灰度图像数据的待加噪区域F_loop,d。

6.如权利要求4所述的一种基于差分隐私和层级相关性传播的图像分类方法，其特征在于，在步骤5中，所述第loop次迭代后的交叉熵损失函数Loss_loop和所述第loop次迭代后的扰动损失函数