CN117951694A

CN117951694A - 一种基于量子态振荡优化的后门攻击防御方法

Info

Publication number: CN117951694A
Application number: CN202410353491.1A
Authority: CN
Inventors: 王晓东; 尚宇; 王楠; 魏志强; 曲海鹏
Original assignee: Ocean University of China
Current assignee: Ocean University of China
Priority date: 2024-03-27
Filing date: 2024-03-27
Publication date: 2024-04-30

Abstract

本发明属于后门攻击防御技术领域，公开了一种基于量子态振荡优化的后门攻击防御方法，模型训练时，利用量子态振荡优化方法进行权重参数优化，首先为每一个权重参数初始化一个量子态，在每一轮迭代中，为每一个量子态引入一个新的随机偏移，并计算新的参数值和对应的适应度值；然后根据当前的量子态以及模型的当前适应度值，对权重进行自适应的校准；然后根据适应度函数的变化情况，动态调整每个参数的振荡频率；然后选择两个量子态模拟量子撞击，得到量子撞击后的量子态，评估新生成的量子态，并计算其对应的适应度值；最后对所有参数的量子态进行合并，模拟量子干涉，达到预设条件后，训练完成。通过本发明降低了后门攻击的成功率。

Description

一种基于量子态振荡优化的后门攻击防御方法

技术领域

本发明属于后门攻击防御技术领域，特别涉及一种基于量子态振荡优化的后门攻击防御方法。

背景技术

机器学习和深度学复杂的高级模型对计算能力和存储空间提出了巨大挑战，面对这些挑战，很多企业通过第三方云计算服务进行训练和计算。然而，将敏感的数据和模型训练过程外包给第三方，意味着用户必须信任这些平台不会对他们的数据和模型进行非授权的访问或修改。

如果第三方服务提供商或其平台中的其他用户怀有恶意意图，他们可能会轻易篡改模型，攻击者秘密地修改模型，深度学习模型在中毒数据集上训练后就被植入了可以被触发器激活的后门, 使得模型对于正常输入仍可保持高精度的工作, 但是当输入具有后门触发器时, 模型将按照攻击者所指定的目标类别输出。这一过程被称为后门攻击。后门攻击的目标是使全局模型在输入恶意数据时将其分类为攻击者指定的类别，但是不影响正常数据的分类结果，这保证了训练主任务的整体性能良好。后门攻击对于深度学习模型构成潜在威胁，仅当模型得到特定输入时才会被触发，具有很强的隐蔽性，给防御工作带来了极大挑战。

针对后门攻击的防御，现有技术面临防御困难、防御成功率低等挑战。专利CN202310754608.2公开了一种基于频域特征融合再构的模型后门攻击对抗方法，此专利主要针对在时域中注入的后门攻击模式，对其他类型的攻击模式可能没有足够的对抗能力。此外，基于傅里叶卷积的处理和连续的特征图融合可能导致较高的计算和时间成本。CN202310734163.1公开了利用文本特征构建自然隐蔽的后门攻击方法及装置，主要针对文本数据，对于非文本数据（如图像、声音等）并不适用。CN202310726024.4公开了一种面向智能声纹识别系统的后门安全性评估方法，主要基于预定义的隐形触发器模型和注入后门的声纹识别模型进行安全性评估，不能针对动态、实时的新型攻击手段进行评估。而且使用特定的隐形触发器模型进行测试可能会导致一些真正的威胁被忽略（假阴性）或将一些非威胁的模型误判为危险（假阳性）。

发明内容

针对现有技术存在的不足，本发明提供一种基于量子态振荡优化的后门攻击防御方法，通过采用量子态振荡优化方法，提升模型的训练质量和稳定性，还有效地增加了模型分类的准确性。此外，在基于量子态振荡优化方法的基础上，采用了量子态自适应权重校准机制，当模型识别到异常的输出或行为，自适应校准机制便会自动激活，利用量子态振荡优化方法迅速调整权重，纠正模型行为，使其在受到后门攻击的威胁时仍能保持稳定，并迅速回复到正常状态，进一步降低了后门攻击的成功概率。

为了解决上述技术问题，本发明采用的技术方案是：

一种基于量子态振荡优化的后门攻击防御方法，包括以下步骤：

步骤1、构建数据集；

步骤2、将数据集中的数据输入全连接神经网络模型FCNN，利用量子态振荡优化方法进行权重参数优化，训练模型；具体是，首先，为每一个权重参数初始化一个量子态，在每一轮迭代中，为每一个量子态引入一个新的随机偏移，并根据随机偏移计算新的参数值和对应的适应度值；然后，根据当前的量子态以及模型的当前适应度值，对权重进行自适应的校准；然后根据适应度函数的变化情况，动态调整每个参数的振荡频率；然后，选择多个量子态模拟量子撞击，得到量子撞击后的量子态，评估新生成的量子态，并计算其对应的适应度值；最后对所有参数的量子态进行合并，模拟量子干涉，达到预设条件后，训练完成。

进一步的，所述全连接神经网络模型FCNN包括输入层、第一隐藏层、第二隐藏层和第三隐藏层，其中输入层包含Nin个神经元，其中Nin为输入到神经网络的数据的拉伸为一维向量后的维度；每个隐藏层都包含若干个神经元，使用ReLU作为激活函数。

进一步的，步骤2中，利用量子态振荡优化方法训练模型的具体步骤如下：

步骤21、参数初始化：

为每一个神经网络模型的权重参数p和偏置参数初始化一个量子态，每个量子态代表一个参数值的可能性，人为预设一个初始的振荡频率；

步骤22、多量子态探索：

在每一轮迭代中，为每一个量子态引入一个新的随机偏移，计算新的参数值p_new，并计算对应的适应度值，其中，适应度值由适应度函数计算得到，具体是采用量子凝聚适应度函数计算适应度值，通过量子凝聚项，衡量不同量子态的协同效应；

步骤23、量子自适应权重校准：

根据当前的量子态以及模型的当前适应度值，对权重进行自适应的校准；

步骤24、动态频率调整：

根据适应度函数的变化情况，动态调整每个参数的振荡频率，如果适应度值降低，则增加频率，加快探索；如果适应度值增加，则减小频率，减缓探索；

步骤25、量子撞击：

选择多个量子态模拟量子撞击，得到量子撞击后的量子态q_new2和新的参数p_new2；根据步骤22中的适应度函数计算新的适应度值L_new，若L_new＜L_previous，则p_new2替代p，并将新的量子态用于接下来的迭代，其中L_previous表示前一次迭代的适应度值；

步骤26、干涉效应模拟：

对所有参数的量子态进行合并，模拟量子干涉，得到更新后的参数值q_interference；

步骤27、终止条件：

重复步骤22到步骤26，达到预设的迭代次数，或适应度函数达到预设的阈值，终止，模型训练完成。

进一步的，步骤22中，给定一个参数p在其量子态q中，其偏移可以表示为：

；

其中，是振荡频率；/>是从均匀随机分布中抽取的随机数；

计算新的参数值，表示为：

；

其中，p_new为多量子态探索后产生的新的参数值；p为多量子态探索前的参数值；为偏移。

进一步的，步骤22中，定义适应度函数如下：

；

其中L为适应度函数；F_base(p_new)是均方误差损失函数；F_cohesion(Q)是量子凝聚项，衡量不同量子态的协同效应；Q是一个集合，包含所有的量子态；λ是一个超参数，用于调整量子凝聚项的权重；

定义量子凝聚项如下：

；

其中，N是量子态的数量；是量子凝聚函数，用于衡量两个量子态q_i和q_j之间的凝聚程度；

定义为：

；

其中，d(q_i, q_j)是量子态q_i和q_j之间的欧几里得距离；c是常数，确保分母不为零。

进一步的，步骤23中，通过引入均匀随机分布中的随机数来增加权重调整的随机性，具体而言，权重的自适应校准用以下公式表示：

；

其中W_new为调整后的权重，W为调整前的权重，r是自适应校准，是从均匀随机分布中抽取的随机数。

进一步的，步骤24中，根据适应度函数的变化，动态调整频率的方式表示为：

；

其中，ω为动态频率调整前的频率；ω_new为动态频率调整后的频率；α为人为预设的学习率；δ为适应度函数的变化率，计算方式如下：

；

其中，L_current和L_previous分别是当前和前一次迭代的适应度值。

进一步的，步骤25中，选择两个量子态q₁和q₂进行撞击，模拟撞击的方式表示为：

；

其中，q_new2为量子撞击后的量子态，是一个从均匀随机分布中抽取的系数；

评估新生成的量子态表示为：

；

其中，p_new2为量子撞击后产生的新的参数值。

进一步的，步骤26中，两个量子态q_a和q_b的干涉结果表示为：

；

其中，γ为人为预设的干涉系数，决定了q_a和q_b在干涉中的权重，q_interference为干涉效应更新后的参数值。

与现有技术相比，本发明优点在于：

1、本发明使用基于量子态振荡优化方法进行权重参数优化，优点如下：（1）搜索能力增强:通过使用多量子态探索和动态频率调整，该方法能够在参数空间中进行广泛的搜索，这有助于防止模型陷入局部最小值。（2）增强的参数协同效应：通过量子凝聚适应度函数，鼓励那些距离较近的量子态进行协同工作，有助于更有效地探索高维参数空间并提高算法的收敛速度。（3）模拟真实的量子现象：通过模拟量子撞击和量子干涉效应，该方法可以更好地利用量子计算的特性，从而在一定程度上提高模型的优化效率。（4）增强对后门攻击抵抗性：通过利用量子计算的特性，该方法可以为神经网络提供了一种更为稳健的防御机制，使模型对后门攻击更为韧性。（5）灵活的终止条件：预设的迭代次数和适应度函数阈值为模型提供了多种终止条件，可以根据实际需求进行调整，增加了方法的灵活性。

2、本发明结合了量子态自适应权重校准机制，当模型识别到异常的输出或行为，自适应校准机制便会自动激活，利用量子态振荡优化方法迅速调整权重，纠正模型行为。这一动态权重调整机制赋予模型出色的韧性，使其在受到后门攻击的威胁时仍能保持稳定，并迅速回复到正常状态，进一步降低了后门攻击的成功概率。优点如下：（1）收敛速度提高：传统的神经网络优化方法可能会在寻找最优权重时遇到困难，而基于量子态的自适应权重校准提供了一种更快速寻找最优权重的方式，从而加快模型的收敛速度。（2）模型的泛化能力增强：通过根据量子态自适应地调整权重，该方法提高了模型在面对未知数据时的预测能力，使其更具有泛化性。（3）减少过拟合：自适应权重校准为神经网络提供了一种机制，使其在训练过程中不易受到噪声数据的干扰，从而降低过拟合的风险。（4）节省计算资源：该方法可以加快收敛速度并提高模型的性能，在实际应用中需要较少的计算资源和时间来达到相同的效果。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图；

图2为本发明的量子态振荡优化方法的流程图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步的说明。

术语解释：

后门攻击：后门攻击是一种针对深度学习模型的目标投毒攻击，其目的是在操纵本地模型的同时拟合主任务与后门任务，使得带有后门标记的数据样本被全局模型误分类为攻击者指定的类别，而其他不带标记的数据样本的分类结果不受影响。

量子态振荡优化方法：量子态振荡优化方法指的是利用量子物理原理来解决优化问题的方法。在许多实际应用中，传统计算方法面临的优化问题可能非常复杂，导致在可接受的时间内难以找到最优解或近似最优解。量子优化旨在利用量子计算的特性来加速这些优化任务。

神经网络：神经网络是模拟人脑工作原理的计算模型，用于模式识别、数据分类和预测。由多个层组成，其中包括输入层、输出层和隐藏层。在训练过程中，通过权重调整和激活函数来处理数据，使网络输出接近期望值。作为深度学习的核心，神经网络已广泛应用于图像识别、语言处理和许多其他领域。

量子态自适应权重校准机制：这是一个结合量子技术与神经网络权重调整策略的方法。当模型检测到异常输出时，它将利用量子态表示权重，并使用量子算法对其进行调整。这种量子技术提供了一种更快速、更全局的权重优化方法。

结合图1-图2所示，本实施例设计了一种基于量子态振荡优化的后门攻击防御方法，作为本发明的一个实施例，本实施例中和附图中，均是以图像数据为例进行说明。需要说明的是，本发明的后门攻击防御方法不仅针对文本数据，对于非文本数据（如图像、声音等）仍然可以拥有更快速、更准确的响应。

步骤1、构建数据集。

为了实现针对后门攻击模型的后门攻击，首先需要选择适当的数据作为训练样本。本发明选择使用Cifar10数据集，进一步地，对数据集中的数据进行数据归一化，使其处于同一尺度。构建好数据集后开始训练模型。

本发明采用全连接神经网络模型（FCNN）进行特征提取，包括输入层、第一隐藏层、第二隐藏层和第三隐藏层，其中输入层包含Nin个神经元，其中Nin为输入到神经网络的数据的拉伸为一维向量后的维度；每个隐藏层都包含若干个神经元，使用ReLU作为激活函数。

作为一个具体实施例，本实施例中具体结构如下：第一隐藏层：第一隐藏层每层有128个神经元，使用ReLU作为激活函数。第二隐藏层：第二隐藏层每层有256个神经元，使用ReLU作为激活函数。第三隐藏层：第三隐藏层每层有100个神经元，使用ReLU作为激活函数。

权重和偏置参数初始化的方式为使用Xavier初始化。

在训练过程中，本发明提出一种基于量子态振荡优化的参数优化方法，由于量子态表示了一个系统的状态，而振荡则描述了量子态在不同状态之间的转换。借鉴量子振荡的特性，将每一个神经网络参数都处于一个“量子态”，并通过模拟量子振荡来实现对这些参数的优化。

具体来说，本发明提出的利用量子态振荡优化方法训练模型的具体步骤如下：

步骤21、参数初始化：

为每一个参数（包括神经网络的权重参数p和偏置参数）初始化一个量子态，每个量子态代表一个参数值的可能性，人为预设一个初始的振荡频率。为直观表示本申请技术方案，图1中的每个圆圈代表参数p。

步骤22、多量子态探索：

在每一轮迭代中，为每一个量子态引入一个新的随机偏移，模拟量子系统中的振荡。

给定一个神经网络的参数p在其量子态q中，其偏移可以表示为：

；

其中，是振荡频率；/>是从均匀随机分布中抽取的随机数。

进一步地，计算新的参数值p_new，并计算对应的适应度值。具体来说，更新参数的方式可以表示为：

；

适应度值由适应度函数计算得到。传统的适应度函数通常采用损失函数的倒数，容易导致神经网络收敛慢。本发明采用一种量子凝聚适应度函数，通过量子凝聚项，衡量不同量子态的协同效应。这样可以借鉴量子凝聚的现象，增强算法中不同量子态的协同作用。

本发明中神经网络的参数优化为多参数的优化问题，每个参数有其对应的量子态，定义适应度函数如下：

；

其中L为适应度函数；F_base(p_new)是均方误差损失函数；F_cohesion(Q)是量子凝聚项，衡量不同量子态的协同效应；Q是一个集合，包含所有的量子态；λ是一个超参数，用于调整量子凝聚项的权重。

定义量子凝聚项如下：

；

定义为：

；

该适应度函数试图在最小化基础适应度值的同时，增强不同量子态之间的凝聚程度。通过添加量子凝聚项，模型会偏向于选择那些量子态，这些量子态之间的距离较小，因此更有可能协同工作，从而产生更好的解，有助于模型在高维参数空间中更有效地探索，并可能避免陷入局部最小值，加快模型训练过程的收敛速度。

步骤23、量子自适应权重校准：

在完成多量子态探索后，根据当前的量子态以及模型的当前适应度值，对权重进行自适应的校准。这一自适应校准方法旨在基于量子态的概率幅度或振荡特性，动态地调整权重，以确保调整过程与量子态的性质保持一致。这是一个充分利用量子计算特性的权重优化策略，可以通过引入均匀随机分布中的随机数来增加权重调整的随机性。

具体来说，权重的自适应校准用以下公式表示：

；

其中W_new为调整后的权重，W为调整前的权重，r是自适应校准，是从均匀随机分布中抽取的随机数。这一自适应校准机制通过引入随机性，使权重调整具有一定的随机性，从而在搜索权重空间时更灵活和全面地探索可能的解空间。

这种自适应的校准方法将确保模型的权重更好地与其对应的量子态相匹配，从而提高模型的整体性能。

步骤24、动态频率调整：

根据适应度函数的变化情况，动态调整每个参数的振荡频率，根据适应度函数的变化，动态调整频率的方式表示为：

；

如果适应度值降低，则增加频率，加快探索；如果适应度值增加，则减小频率，减缓探索。

步骤25、量子撞击：

选择多个量子态模拟量子撞击，模拟撞击的过程中，这些选中的量子态之间会进行信息交换。这种交换是非线性的，并且可能产生一个新的量子态，得到量子撞击后的量子态q_new2和新的参数p_new2。

比如本实施例中，选择两个量子态q₁和q₂进行撞击，模拟撞击的方式表示为：

；

其中，q_new2为量子撞击后的量子态，是一个从均匀随机分布中抽取的系数。

进一步地，评估新生成的量子态，表示为：

；

其中，p_new2为量子撞击后产生的新的参数值。

然后，计算新的适应度值。根据步骤22中的适应度函数计算新的适应度值L_new，L_new＜L_previous，则p_new2替代p，并将新的量子态用于接下来的迭代，其中L_previous表示前一次迭代的适应度值。这一步的操作的目的是，如果这个新态导致了更小的适应度值，则认为撞击成功，并将新的量子态用于接下来的迭代。

步骤26、干涉效应模拟：

对所有参数的量子态进行合并，模拟量子干涉，得到更新后的参数值q_interference。

具体来说，两个量子态q_a和q_b的干涉结果表示为：

；

作为一个优选的实施方式，选择那些产生更低适应度值的量子态，淘汰其余的量子态。

进一步地，根据选择的最佳量子态，更新神经网络的参数。考虑所有的q_interference和q_new2，选择导致最小适应度值的量子态进行参数更新，可以表示为：

；

其中，p_optimal为本次迭代确定的神经网络参数；ap和aq为本次迭代神经网络的参数及其量子态的集和。

步骤27、终止条件：

最后，为了验证本发明的防御效果，随机选择cifar10数据集图像中的一对源标签和目标标签，构建后门触发器；然后用修改后的训练数据生成模型更新，误导模型按照目标标签进行分类以达到攻击目的。实验验证，将cifar10数据集输入到训练完成的全连接神经网络模型上，后门攻击的攻击成功率达到了98.99%，而通过本发明提出的方法，将cifar10数据集输入到训练好的全连接神经网络模型上，后门攻击的成功率只有37%，降低了攻击成功率，大大提升了对后门攻击的防御效果。

综上所述，首先，本发明不同于传统的神经网络权重初始化方法，而是为每个网络参数分配了一个对应的量子态，从而将参数的确定性表示转化为一种概率性的可能性描述。这样的构思使得参数在优化过程中具有更大的探索空间和灵活性。

其次，为了更好地寻找最优解并避免陷入局部最优，本发明提出了多量子态探索策略。这一策略通过模拟量子系统中的振荡特性为每个量子态引入随机偏移，从而实现了对神经网络参数的动态更新。更为关键的是，这一探索策略结合了量子凝聚适应度函数，它考虑了不同量子态之间的凝聚程度，鼓励那些协同效应较强的量子态，从而在高维参数空间中进行更为高效的搜索。

再者，本发明考虑到了量子态与神经网络权重之间的一致性，提出了量子自适应权重校准策略。这种策略根据当前的量子态特性和模型适应度值来自适应地调整神经网络权重，确保神经网络的权重与其对应的量子态在优化过程中始终保持良好的同步。此外，为了响应训练过程中的变化，本发明引入了动态频率调整机制。

总之，本发明构思的关键在于将量子原理与神经网络优化相结合，旨在提高模型的训练质量和稳定性，增加模型分类的准确性，从而降低后门攻击的攻击成功率。

当然，上述说明并非是对本发明的限制，本发明也并不限于上述举例，本技术领域的普通技术人员，在本发明的实质范围内，做出的变化、改型、添加或替换，都应属于本发明的保护范围。

Claims

1.一种基于量子态振荡优化的后门攻击防御方法，其特征在于，包括以下步骤：

步骤1、构建数据集；

2.根据权利要求1所述的一种基于量子态振荡优化的后门攻击防御方法，其特征在于，所述全连接神经网络模型FCNN包括输入层、第一隐藏层、第二隐藏层和第三隐藏层，其中输入层包含Nin个神经元，其中Nin为输入到神经网络的数据的拉伸为一维向量后的维度；每个隐藏层都包含若干个神经元，使用ReLU作为激活函数。

3.根据权利要求1所述的一种基于量子态振荡优化的后门攻击防御方法，其特征在于，步骤2中，利用量子态振荡优化方法训练模型的具体步骤如下：

步骤21、参数初始化：

步骤22、多量子态探索：

步骤23、量子自适应权重校准：

步骤24、动态频率调整：

步骤25、量子撞击：

步骤26、干涉效应模拟：

步骤27、终止条件：

4.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法，其特征在于，步骤22中，给定一个参数p在其量子态q中，其偏移可以表示为：

；

其中，是振荡频率；/>是从均匀随机分布中抽取的随机数；

计算新的参数值，表示为：

；

5.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法，其特征在于，步骤22中，定义适应度函数如下：

；

定义量子凝聚项如下：

；

定义为：

；

6.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法，其特征在于，步骤23中，通过引入均匀随机分布中的随机数来增加权重调整的随机性，具体而言，权重的自适应校准用以下公式表示：

；

7.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法，其特征在于，步骤24中，根据适应度函数的变化，动态调整频率的方式表示为：

；

8.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法，其特征在于，步骤25中，选择两个量子态q₁和q₂进行撞击，模拟撞击的方式表示为：

；

评估新生成的量子态表示为：

；

其中，p_new2为量子撞击后产生的新的参数值。

9.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法，其特征在于，步骤26中，两个量子态q_a和q_b的干涉结果表示为：

；