CN117951694A - 一种基于量子态振荡优化的后门攻击防御方法 - Google Patents
一种基于量子态振荡优化的后门攻击防御方法 Download PDFInfo
- Publication number
- CN117951694A CN117951694A CN202410353491.1A CN202410353491A CN117951694A CN 117951694 A CN117951694 A CN 117951694A CN 202410353491 A CN202410353491 A CN 202410353491A CN 117951694 A CN117951694 A CN 117951694A
- Authority
- CN
- China
- Prior art keywords
- quantum
- quantum state
- new
- fitness
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000010355 oscillation Effects 0.000 title claims abstract description 49
- 238000005457 optimization Methods 0.000 title claims abstract description 43
- 230000007123 defense Effects 0.000 title claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 29
- 230000008859 change Effects 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 49
- 238000013528 artificial neural network Methods 0.000 claims description 25
- 238000009833 condensation Methods 0.000 claims description 17
- 230000005494 condensation Effects 0.000 claims description 17
- 101100460203 Schizosaccharomyces pombe (strain 972 / ATCC 24843) new2 gene Proteins 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 12
- 230000003044 adaptive effect Effects 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 10
- 238000003062 neural network model Methods 0.000 claims description 10
- 230000001965 increasing effect Effects 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 9
- 230000002195 synergetic effect Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 238000005354 coacervation Methods 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 9
- 230000006399 behavior Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 231100000572 poisoning Toxicity 0.000 description 2
- 230000000607 poisoning effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005667 quantum oscillations Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于后门攻击防御技术领域,公开了一种基于量子态振荡优化的后门攻击防御方法,模型训练时,利用量子态振荡优化方法进行权重参数优化,首先为每一个权重参数初始化一个量子态,在每一轮迭代中,为每一个量子态引入一个新的随机偏移,并计算新的参数值和对应的适应度值;然后根据当前的量子态以及模型的当前适应度值,对权重进行自适应的校准;然后根据适应度函数的变化情况,动态调整每个参数的振荡频率;然后选择两个量子态模拟量子撞击,得到量子撞击后的量子态,评估新生成的量子态,并计算其对应的适应度值;最后对所有参数的量子态进行合并,模拟量子干涉,达到预设条件后,训练完成。通过本发明降低了后门攻击的成功率。
Description
技术领域
本发明属于后门攻击防御技术领域,特别涉及一种基于量子态振荡优化的后门攻击防御方法。
背景技术
机器学习和深度学复杂的高级模型对计算能力和存储空间提出了巨大挑战,面对这些挑战,很多企业通过第三方云计算服务进行训练和计算。然而,将敏感的数据和模型训练过程外包给第三方,意味着用户必须信任这些平台不会对他们的数据和模型进行非授权的访问或修改。
如果第三方服务提供商或其平台中的其他用户怀有恶意意图,他们可能会轻易篡改模型,攻击者秘密地修改模型,深度学习模型在中毒数据集上训练后就被植入了可以被触发器激活的后门, 使得模型对于正常输入仍可保持高精度的工作, 但是当输入具有后门触发器时, 模型将按照攻击者所指定的目标类别输出。这一过程被称为后门攻击。后门攻击的目标是使全局模型在输入恶意数据时将其分类为攻击者指定的类别,但是不影响正常数据的分类结果,这保证了训练主任务的整体性能良好。后门攻击对于深度学习模型构成潜在威胁,仅当模型得到特定输入时才会被触发,具有很强的隐蔽性,给防御工作带来了极大挑战。
针对后门攻击的防御,现有技术面临防御困难、防御成功率低等挑战。专利CN202310754608.2公开了一种基于频域特征融合再构的模型后门攻击对抗方法,此专利主要针对在时域中注入的后门攻击模式,对其他类型的攻击模式可能没有足够的对抗能力。此外,基于傅里叶卷积的处理和连续的特征图融合可能导致较高的计算和时间成本。CN202310734163.1公开了利用文本特征构建自然隐蔽的后门攻击方法及装置,主要针对文本数据,对于非文本数据(如图像、声音等)并不适用。CN202310726024.4公开了一种面向智能声纹识别系统的后门安全性评估方法,主要基于预定义的隐形触发器模型和注入后门的声纹识别模型进行安全性评估,不能针对动态、实时的新型攻击手段进行评估。而且使用特定的隐形触发器模型进行测试可能会导致一些真正的威胁被忽略(假阴性)或将一些非威胁的模型误判为危险(假阳性)。
发明内容
针对现有技术存在的不足,本发明提供一种基于量子态振荡优化的后门攻击防御方法,通过采用量子态振荡优化方法,提升模型的训练质量和稳定性,还有效地增加了模型分类的准确性。此外,在基于量子态振荡优化方法的基础上,采用了量子态自适应权重校准机制,当模型识别到异常的输出或行为,自适应校准机制便会自动激活,利用量子态振荡优化方法迅速调整权重,纠正模型行为,使其在受到后门攻击的威胁时仍能保持稳定,并迅速回复到正常状态,进一步降低了后门攻击的成功概率。
为了解决上述技术问题,本发明采用的技术方案是:
一种基于量子态振荡优化的后门攻击防御方法,包括以下步骤:
步骤1、构建数据集;
步骤2、将数据集中的数据输入全连接神经网络模型FCNN,利用量子态振荡优化方法进行权重参数优化,训练模型;具体是,首先,为每一个权重参数初始化一个量子态,在每一轮迭代中,为每一个量子态引入一个新的随机偏移,并根据随机偏移计算新的参数值和对应的适应度值;然后,根据当前的量子态以及模型的当前适应度值,对权重进行自适应的校准;然后根据适应度函数的变化情况,动态调整每个参数的振荡频率;然后,选择多个量子态模拟量子撞击,得到量子撞击后的量子态,评估新生成的量子态,并计算其对应的适应度值;最后对所有参数的量子态进行合并,模拟量子干涉,达到预设条件后,训练完成。
进一步的,所述全连接神经网络模型FCNN包括输入层、第一隐藏层、第二隐藏层和第三隐藏层,其中输入层包含Nin个神经元,其中Nin为输入到神经网络的数据的拉伸为一维向量后的维度;每个隐藏层都包含若干个神经元,使用ReLU作为激活函数。
进一步的,步骤2中,利用量子态振荡优化方法训练模型的具体步骤如下:
步骤21、参数初始化:
为每一个神经网络模型的权重参数p和偏置参数初始化一个量子态,每个量子态代表一个参数值的可能性,人为预设一个初始的振荡频率;
步骤22、多量子态探索:
在每一轮迭代中,为每一个量子态引入一个新的随机偏移,计算新的参数值pnew,并计算对应的适应度值,其中,适应度值由适应度函数计算得到,具体是采用量子凝聚适应度函数计算适应度值,通过量子凝聚项,衡量不同量子态的协同效应;
步骤23、量子自适应权重校准:
根据当前的量子态以及模型的当前适应度值,对权重进行自适应的校准;
步骤24、动态频率调整:
根据适应度函数的变化情况,动态调整每个参数的振荡频率,如果适应度值降低,则增加频率,加快探索;如果适应度值增加,则减小频率,减缓探索;
步骤25、量子撞击:
选择多个量子态模拟量子撞击,得到量子撞击后的量子态qnew2和新的参数pnew2;根据步骤22中的适应度函数计算新的适应度值Lnew,若Lnew<Lprevious,则pnew2替代p,并将新的量子态用于接下来的迭代,其中Lprevious表示前一次迭代的适应度值;
步骤26、干涉效应模拟:
对所有参数的量子态进行合并,模拟量子干涉 ,得到更新后的参数值qinterference;
步骤27、终止条件:
重复步骤22到步骤26,达到预设的迭代次数,或适应度函数达到预设的阈值,终止,模型训练完成。
进一步的,步骤22中,给定一个参数p在其量子态q中,其偏移可以表示为:
;
其中,是振荡频率;/>是从均匀随机分布中抽取的随机数;
计算新的参数值,表示为:
;
其中,pnew为多量子态探索后产生的新的参数值;p为多量子态探索前的参数值;为偏移。
进一步的,步骤22中,定义适应度函数如下:
;
其中L为适应度函数;Fbase(pnew)是均方误差损失函数;Fcohesion(Q)是量子凝聚项,衡量不同量子态的协同效应;Q是一个集合,包含所有的量子态;λ是一个超参数,用于调整量子凝聚项的权重;
定义量子凝聚项如下:
;
其中,N是量子态的数量;是量子凝聚函数,用于衡量两个量子态qi和qj之间的凝聚程度;
定义为:
;
其中,d(qi , qj)是量子态qi和qj之间的欧几里得距离;c是常数,确保分母不为零。
进一步的,步骤23中,通过引入均匀随机分布中的随机数来增加权重调整的随机性,具体而言,权重的自适应校准用以下公式表示:
;
其中Wnew为调整后的权重,W为调整前的权重,r是自适应校准,是从均匀随机分布中抽取的随机数。
进一步的,步骤24中,根据适应度函数的变化,动态调整频率的方式表示为:
;
其中,ω为动态频率调整前的频率;ωnew为动态频率调整后的频率;α为人为预设的学习率;δ为适应度函数的变化率,计算方式如下:
;
其中,Lcurrent和Lprevious分别是当前和前一次迭代的适应度值。
进一步的,步骤25中,选择两个量子态q1和q2进行撞击,模拟撞击的方式表示为:
;
其中,qnew2为量子撞击后的量子态,是一个从均匀随机分布中抽取的系数;
评估新生成的量子态表示为:
;
其中,pnew2为量子撞击后产生的新的参数值。
进一步的,步骤26中,两个量子态qa和qb的干涉结果表示为:
;
其中,γ为人为预设的干涉系数,决定了qa和qb在干涉中的权重,qinterference为干涉效应更新后的参数值。
与现有技术相比,本发明优点在于:
1、本发明使用基于量子态振荡优化方法进行权重参数优化,优点如下:(1)搜索能力增强:通过使用多量子态探索和动态频率调整,该方法能够在参数空间中进行广泛的搜索,这有助于防止模型陷入局部最小值。(2)增强的参数协同效应:通过量子凝聚适应度函数,鼓励那些距离较近的量子态进行协同工作,有助于更有效地探索高维参数空间并提高算法的收敛速度。(3)模拟真实的量子现象:通过模拟量子撞击和量子干涉效应,该方法可以更好地利用量子计算的特性,从而在一定程度上提高模型的优化效率。(4)增强对后门攻击抵抗性:通过利用量子计算的特性,该方法可以为神经网络提供了一种更为稳健的防御机制,使模型对后门攻击更为韧性。(5)灵活的终止条件:预设的迭代次数和适应度函数阈值为模型提供了多种终止条件,可以根据实际需求进行调整,增加了方法的灵活性。
2、本发明结合了量子态自适应权重校准机制,当模型识别到异常的输出或行为,自适应校准机制便会自动激活,利用量子态振荡优化方法迅速调整权重,纠正模型行为。这一动态权重调整机制赋予模型出色的韧性,使其在受到后门攻击的威胁时仍能保持稳定,并迅速回复到正常状态,进一步降低了后门攻击的成功概率。优点如下:(1)收敛速度提高:传统的神经网络优化方法可能会在寻找最优权重时遇到困难,而基于量子态的自适应权重校准提供了一种更快速寻找最优权重的方式,从而加快模型的收敛速度。(2)模型的泛化能力增强:通过根据量子态自适应地调整权重,该方法提高了模型在面对未知数据时的预测能力,使其更具有泛化性。(3)减少过拟合:自适应权重校准为神经网络提供了一种机制,使其在训练过程中不易受到噪声数据的干扰,从而降低过拟合的风险。(4)节省计算资源:该方法可以加快收敛速度并提高模型的性能,在实际应用中需要较少的计算资源和时间来达到相同的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的方法流程图;
图2为本发明的量子态振荡优化方法的流程图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
术语解释:
后门攻击:后门攻击是一种针对深度学习模型的目标投毒攻击,其目的是在操纵本地模型的同时拟合主任务与后门任务,使得带有后门标记的数据样本被全局模型误分类为攻击者指定的类别,而其他不带标记的数据样本的分类结果不受影响。
量子态振荡优化方法:量子态振荡优化方法指的是利用量子物理原理来解决优化问题的方法。在许多实际应用中,传统计算方法面临的优化问题可能非常复杂,导致在可接受的时间内难以找到最优解或近似最优解。量子优化旨在利用量子计算的特性来加速这些优化任务。
神经网络:神经网络是模拟人脑工作原理的计算模型,用于模式识别、数据分类和预测。由多个层组成,其中包括输入层、输出层和隐藏层。在训练过程中,通过权重调整和激活函数来处理数据,使网络输出接近期望值。作为深度学习的核心,神经网络已广泛应用于图像识别、语言处理和许多其他领域。
量子态自适应权重校准机制:这是一个结合量子技术与神经网络权重调整策略的方法。当模型检测到异常输出时,它将利用量子态表示权重,并使用量子算法对其进行调整。这种量子技术提供了一种更快速、更全局的权重优化方法。
结合图1-图2所示,本实施例设计了一种基于量子态振荡优化的后门攻击防御方法,作为本发明的一个实施例,本实施例中和附图中,均是以图像数据为例进行说明。需要说明的是,本发明的后门攻击防御方法不仅针对文本数据,对于非文本数据(如图像、声音等)仍然可以拥有更快速、更准确的响应。
一种基于量子态振荡优化的后门攻击防御方法,包括以下步骤:
步骤1、构建数据集。
为了实现针对后门攻击模型的后门攻击,首先需要选择适当的数据作为训练样本。本发明选择使用Cifar10数据集,进一步地,对数据集中的数据进行数据归一化,使其处于同一尺度。构建好数据集后开始训练模型。
步骤2、将数据集中的数据输入全连接神经网络模型FCNN,利用量子态振荡优化方法进行权重参数优化,训练模型;具体是,首先,为每一个权重参数初始化一个量子态,在每一轮迭代中,为每一个量子态引入一个新的随机偏移,并根据随机偏移计算新的参数值和对应的适应度值;然后,根据当前的量子态以及模型的当前适应度值,对权重进行自适应的校准;然后根据适应度函数的变化情况,动态调整每个参数的振荡频率;然后,选择多个量子态模拟量子撞击,得到量子撞击后的量子态,评估新生成的量子态,并计算其对应的适应度值;最后对所有参数的量子态进行合并,模拟量子干涉,达到预设条件后,训练完成。
本发明采用全连接神经网络模型(FCNN)进行特征提取,包括输入层、第一隐藏层、第二隐藏层和第三隐藏层,其中输入层包含Nin个神经元,其中Nin为输入到神经网络的数据的拉伸为一维向量后的维度;每个隐藏层都包含若干个神经元,使用ReLU作为激活函数。
作为一个具体实施例,本实施例中具体结构如下:第一隐藏层:第一隐藏层每层有128个神经元,使用ReLU作为激活函数。第二隐藏层:第二隐藏层每层有256个神经元,使用ReLU作为激活函数。第三隐藏层:第三隐藏层每层有100个神经元,使用ReLU作为激活函数。
权重和偏置参数初始化的方式为使用Xavier初始化。
在训练过程中,本发明提出一种基于量子态振荡优化的参数优化方法,由于量子态表示了一个系统的状态,而振荡则描述了量子态在不同状态之间的转换。借鉴量子振荡的特性,将每一个神经网络参数都处于一个“量子态”,并通过模拟量子振荡来实现对这些参数的优化。
具体来说,本发明提出的利用量子态振荡优化方法训练模型的具体步骤如下:
步骤21、参数初始化:
为每一个参数(包括神经网络的权重参数p和偏置参数)初始化一个量子态,每个量子态代表一个参数值的可能性,人为预设一个初始的振荡频率。为直观表示本申请技术方案,图1中的每个圆圈代表参数p。
步骤22、多量子态探索:
在每一轮迭代中,为每一个量子态引入一个新的随机偏移,模拟量子系统中的振荡。
给定一个神经网络的参数p在其量子态q中,其偏移可以表示为:
;
其中,是振荡频率;/>是从均匀随机分布中抽取的随机数。
进一步地,计算新的参数值pnew,并计算对应的适应度值。具体来说,更新参数的方式可以表示为:
;
其中,pnew为多量子态探索后产生的新的参数值;p为多量子态探索前的参数值;为偏移。
适应度值由适应度函数计算得到。传统的适应度函数通常采用损失函数的倒数,容易导致神经网络收敛慢。本发明采用一种量子凝聚适应度函数,通过量子凝聚项,衡量不同量子态的协同效应。这样可以借鉴量子凝聚的现象,增强算法中不同量子态的协同作用。
本发明中神经网络的参数优化为多参数的优化问题,每个参数有其对应的量子态,定义适应度函数如下:
;
其中L为适应度函数;Fbase(pnew)是均方误差损失函数;Fcohesion(Q)是量子凝聚项,衡量不同量子态的协同效应;Q是一个集合,包含所有的量子态;λ是一个超参数,用于调整量子凝聚项的权重。
定义量子凝聚项如下:
;
其中,N是量子态的数量;是量子凝聚函数,用于衡量两个量子态qi和qj之间的凝聚程度;
定义为:
;
其中,d(qi , qj)是量子态qi和qj之间的欧几里得距离;c是常数,确保分母不为零。
该适应度函数试图在最小化基础适应度值的同时,增强不同量子态之间的凝聚程度。通过添加量子凝聚项,模型会偏向于选择那些量子态,这些量子态之间的距离较小,因此更有可能协同工作,从而产生更好的解,有助于模型在高维参数空间中更有效地探索,并可能避免陷入局部最小值,加快模型训练过程的收敛速度。
步骤23、量子自适应权重校准:
在完成多量子态探索后,根据当前的量子态以及模型的当前适应度值,对权重进行自适应的校准。这一自适应校准方法旨在基于量子态的概率幅度或振荡特性,动态地调整权重,以确保调整过程与量子态的性质保持一致。这是一个充分利用量子计算特性的权重优化策略,可以通过引入均匀随机分布中的随机数来增加权重调整的随机性。
具体来说,权重的自适应校准用以下公式表示:
;
其中Wnew为调整后的权重,W为调整前的权重,r是自适应校准,是从均匀随机分布中抽取的随机数。这一自适应校准机制通过引入随机性,使权重调整具有一定的随机性,从而在搜索权重空间时更灵活和全面地探索可能的解空间。
这种自适应的校准方法将确保模型的权重更好地与其对应的量子态相匹配,从而提高模型的整体性能。
步骤24、动态频率调整:
根据适应度函数的变化情况,动态调整每个参数的振荡频率,根据适应度函数的变化,动态调整频率的方式表示为:
;
其中,ω为动态频率调整前的频率;ωnew为动态频率调整后的频率;α为人为预设的学习率;δ为适应度函数的变化率,计算方式如下:
;
其中,Lcurrent和Lprevious分别是当前和前一次迭代的适应度值。
如果适应度值降低,则增加频率,加快探索;如果适应度值增加,则减小频率,减缓探索。
步骤25、量子撞击:
选择多个量子态模拟量子撞击,模拟撞击的过程中,这些选中的量子态之间会进行信息交换。这种交换是非线性的,并且可能产生一个新的量子态,得到量子撞击后的量子态qnew2和新的参数pnew2。
比如本实施例中,选择两个量子态q1和q2进行撞击,模拟撞击的方式表示为:
;
其中,qnew2为量子撞击后的量子态,是一个从均匀随机分布中抽取的系数。
进一步地,评估新生成的量子态,表示为:
;
其中,pnew2为量子撞击后产生的新的参数值。
然后,计算新的适应度值。根据步骤22中的适应度函数计算新的适应度值Lnew,Lnew<Lprevious,则pnew2替代p,并将新的量子态用于接下来的迭代,其中Lprevious表示前一次迭代的适应度值。这一步的操作的目的是,如果这个新态导致了更小的适应度值,则认为撞击成功,并将新的量子态用于接下来的迭代。
步骤26、干涉效应模拟:
对所有参数的量子态进行合并,模拟量子干涉 ,得到更新后的参数值qinterference。
具体来说,两个量子态qa和qb的干涉结果表示为:
;
其中,γ为人为预设的干涉系数,决定了qa和qb在干涉中的权重,qinterference为干涉效应更新后的参数值。
作为一个优选的实施方式,选择那些产生更低适应度值的量子态,淘汰其余的量子态。
进一步地,根据选择的最佳量子态,更新神经网络的参数。考虑所有的qinterference和qnew2,选择导致最小适应度值的量子态进行参数更新,可以表示为:
;
其中,poptimal为本次迭代确定的神经网络参数;ap和aq为本次迭代神经网络的参数及其量子态的集和。
步骤27、终止条件:
重复步骤22到步骤26,达到预设的迭代次数,或适应度函数达到预设的阈值,终止,模型训练完成。
最后,为了验证本发明的防御效果,随机选择cifar10数据集图像中的一对源标签和目标标签,构建后门触发器;然后用修改后的训练数据生成模型更新,误导模型按照目标标签进行分类以达到攻击目的。实验验证,将cifar10数据集输入到训练完成的全连接神经网络模型上,后门攻击的攻击成功率达到了98.99%,而通过本发明提出的方法,将cifar10数据集输入到训练好的全连接神经网络模型上,后门攻击的成功率只有37%,降低了攻击成功率,大大提升了对后门攻击的防御效果。
综上所述,首先,本发明不同于传统的神经网络权重初始化方法,而是为每个网络参数分配了一个对应的量子态,从而将参数的确定性表示转化为一种概率性的可能性描述。这样的构思使得参数在优化过程中具有更大的探索空间和灵活性。
其次,为了更好地寻找最优解并避免陷入局部最优,本发明提出了多量子态探索策略。这一策略通过模拟量子系统中的振荡特性为每个量子态引入随机偏移,从而实现了对神经网络参数的动态更新。更为关键的是,这一探索策略结合了量子凝聚适应度函数,它考虑了不同量子态之间的凝聚程度,鼓励那些协同效应较强的量子态,从而在高维参数空间中进行更为高效的搜索。
再者,本发明考虑到了量子态与神经网络权重之间的一致性,提出了量子自适应权重校准策略。这种策略根据当前的量子态特性和模型适应度值来自适应地调整神经网络权重,确保神经网络的权重与其对应的量子态在优化过程中始终保持良好的同步。此外,为了响应训练过程中的变化,本发明引入了动态频率调整机制。
总之,本发明构思的关键在于将量子原理与神经网络优化相结合,旨在提高模型的训练质量和稳定性,增加模型分类的准确性,从而降低后门攻击的攻击成功率。
当然,上述说明并非是对本发明的限制,本发明也并不限于上述举例,本技术领域的普通技术人员,在本发明的实质范围内,做出的变化、改型、添加或替换,都应属于本发明的保护范围。
Claims (9)
1.一种基于量子态振荡优化的后门攻击防御方法,其特征在于,包括以下步骤:
步骤1、构建数据集;
步骤2、将数据集中的数据输入全连接神经网络模型FCNN,利用量子态振荡优化方法进行权重参数优化,训练模型;具体是,首先,为每一个权重参数初始化一个量子态,在每一轮迭代中,为每一个量子态引入一个新的随机偏移,并根据随机偏移计算新的参数值和对应的适应度值;然后,根据当前的量子态以及模型的当前适应度值,对权重进行自适应的校准;然后根据适应度函数的变化情况,动态调整每个参数的振荡频率;然后,选择多个量子态模拟量子撞击,得到量子撞击后的量子态,评估新生成的量子态,并计算其对应的适应度值;最后对所有参数的量子态进行合并,模拟量子干涉,达到预设条件后,训练完成。
2.根据权利要求1所述的一种基于量子态振荡优化的后门攻击防御方法,其特征在于,所述全连接神经网络模型FCNN包括输入层、第一隐藏层、第二隐藏层和第三隐藏层,其中输入层包含Nin个神经元,其中Nin为输入到神经网络的数据的拉伸为一维向量后的维度;每个隐藏层都包含若干个神经元,使用ReLU作为激活函数。
3.根据权利要求1所述的一种基于量子态振荡优化的后门攻击防御方法,其特征在于,步骤2中,利用量子态振荡优化方法训练模型的具体步骤如下:
步骤21、参数初始化:
为每一个神经网络模型的权重参数p和偏置参数初始化一个量子态,每个量子态代表一个参数值的可能性,人为预设一个初始的振荡频率;
步骤22、多量子态探索:
在每一轮迭代中,为每一个量子态引入一个新的随机偏移,计算新的参数值pnew,并计算对应的适应度值,其中,适应度值由适应度函数计算得到,具体是采用量子凝聚适应度函数计算适应度值,通过量子凝聚项,衡量不同量子态的协同效应;
步骤23、量子自适应权重校准:
根据当前的量子态以及模型的当前适应度值,对权重进行自适应的校准;
步骤24、动态频率调整:
根据适应度函数的变化情况,动态调整每个参数的振荡频率,如果适应度值降低,则增加频率,加快探索;如果适应度值增加,则减小频率,减缓探索;
步骤25、量子撞击:
选择多个量子态模拟量子撞击,得到量子撞击后的量子态qnew2和新的参数pnew2;根据步骤22中的适应度函数计算新的适应度值Lnew,若Lnew<Lprevious,则pnew2替代p,并将新的量子态用于接下来的迭代,其中Lprevious表示前一次迭代的适应度值;
步骤26、干涉效应模拟:
对所有参数的量子态进行合并,模拟量子干涉 ,得到更新后的参数值qinterference;
步骤27、终止条件:
重复步骤22到步骤26,达到预设的迭代次数,或适应度函数达到预设的阈值,终止,模型训练完成。
4.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法,其特征在于,步骤22中,给定一个参数p在其量子态q中,其偏移可以表示为:
;
其中,是振荡频率;/>是从均匀随机分布中抽取的随机数;
计算新的参数值,表示为:
;
其中,pnew为多量子态探索后产生的新的参数值;p为多量子态探索前的参数值;为偏移。
5.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法,其特征在于,步骤22中,定义适应度函数如下:
;
其中L为适应度函数;Fbase(pnew)是均方误差损失函数;Fcohesion(Q)是量子凝聚项,衡量不同量子态的协同效应;Q是一个集合,包含所有的量子态;λ是一个超参数,用于调整量子凝聚项的权重;
定义量子凝聚项如下:
;
其中,N是量子态的数量;是量子凝聚函数,用于衡量两个量子态qi和qj之间的凝聚程度;
定义为:
;
其中,d(qi , qj)是量子态qi和qj之间的欧几里得距离;c是常数,确保分母不为零。
6.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法,其特征在于,步骤23中,通过引入均匀随机分布中的随机数来增加权重调整的随机性,具体而言,权重的自适应校准用以下公式表示:
;
其中Wnew为调整后的权重,W为调整前的权重,r是自适应校准,是从均匀随机分布中抽取的随机数。
7.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法,其特征在于,步骤24中,根据适应度函数的变化,动态调整频率的方式表示为:
;
其中,ω为动态频率调整前的频率;ωnew为动态频率调整后的频率;α为人为预设的学习率;δ为适应度函数的变化率,计算方式如下:
;
其中,Lcurrent和Lprevious分别是当前和前一次迭代的适应度值。
8.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法,其特征在于,步骤25中,选择两个量子态q1和q2进行撞击,模拟撞击的方式表示为:
;
其中,qnew2为量子撞击后的量子态,是一个从均匀随机分布中抽取的系数;
评估新生成的量子态表示为:
;
其中,pnew2为量子撞击后产生的新的参数值。
9.根据权利要求3所述的一种基于量子态振荡优化的后门攻击防御方法,其特征在于,步骤26中,两个量子态qa和qb的干涉结果表示为:
;
其中,γ为人为预设的干涉系数,决定了qa和qb在干涉中的权重,qinterference为干涉效应更新后的参数值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410353491.1A CN117951694A (zh) | 2024-03-27 | 2024-03-27 | 一种基于量子态振荡优化的后门攻击防御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410353491.1A CN117951694A (zh) | 2024-03-27 | 2024-03-27 | 一种基于量子态振荡优化的后门攻击防御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117951694A true CN117951694A (zh) | 2024-04-30 |
Family
ID=90798543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410353491.1A Pending CN117951694A (zh) | 2024-03-27 | 2024-03-27 | 一种基于量子态振荡优化的后门攻击防御方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117951694A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113868671A (zh) * | 2021-12-01 | 2021-12-31 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、神经网络模型的后门防御方法及装置 |
CN116050506A (zh) * | 2022-10-31 | 2023-05-02 | 武汉大学 | 一种后门攻击防御方法、装置、电子设备以及存储介质 |
CN117390491A (zh) * | 2023-10-23 | 2024-01-12 | 普元信息技术股份有限公司 | 基于神经网络实现数据服务操作信息审计审核处理的方法、装置、处理器及其存储介质 |
-
2024
- 2024-03-27 CN CN202410353491.1A patent/CN117951694A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113868671A (zh) * | 2021-12-01 | 2021-12-31 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、神经网络模型的后门防御方法及装置 |
CN116050506A (zh) * | 2022-10-31 | 2023-05-02 | 武汉大学 | 一种后门攻击防御方法、装置、电子设备以及存储介质 |
CN117390491A (zh) * | 2023-10-23 | 2024-01-12 | 普元信息技术股份有限公司 | 基于神经网络实现数据服务操作信息审计审核处理的方法、装置、处理器及其存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Gan enhanced membership inference: A passive local attack in federated learning | |
Dong et al. | Privacy for free: How does dataset condensation help privacy? | |
Lee et al. | Defending against neural network model stealing attacks using deceptive perturbations | |
CN111209497A (zh) | 基于GAN和Char-CNN的DGA域名检测方法 | |
CN111753881A (zh) | 一种基于概念敏感性量化识别对抗攻击的防御方法 | |
CN110493262A (zh) | 一种改进分类的网络攻击检测方法及系统 | |
CN113988312A (zh) | 一种面向机器学习模型的成员推理隐私攻击方法及系统 | |
Hu et al. | Model scheduling and sample selection for ensemble adversarial example attacks | |
Bountakas et al. | Defense strategies for adversarial machine learning: A survey | |
Grierson et al. | Min-max training: Adversarially robust learning models for network intrusion detection systems | |
Xu et al. | Ofei: A semi-black-box android adversarial sample attack framework against dlaas | |
Ning et al. | Hibernated backdoor: A mutual information empowered backdoor attack to deep neural networks | |
CN110598794A (zh) | 一种分类对抗的网络攻击检测方法及系统 | |
Ferrag et al. | Generative adversarial networks-driven cyber threat intelligence detection framework for securing internet of things | |
Pasquini et al. | Adversarial out-domain examples for generative models | |
Jin et al. | DANAA: Towards transferable attacks with double adversarial neuron attribution | |
CN117951694A (zh) | 一种基于量子态振荡优化的后门攻击防御方法 | |
Yang et al. | Towards stochastic neural network via feature distribution calibration | |
Gao et al. | Defensive distillation based end-to-end auto-encoder communication system | |
CN113935913A (zh) | 一种具有视觉感知隐蔽性的黑盒图像对抗样本生成方法 | |
Wang et al. | Research on the Validity of Network Security Model Based on WOA-BP Neural Network | |
Ayaz et al. | Improving Robustness Against Adversarial Attacks with Deeply Quantized Neural Networks | |
Malik et al. | TETRAA-Trained and Selective Transmutation of Encoder-based Adversarial Attack | |
Zhou et al. | GAN-Based Siamese Neuron Network for Modulation Classification Against White-Box Adversarial Attacks | |
Rangapur et al. | Phish-Defence: Phishing Detection Using Deep Recurrent Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |