CN116862021A - 基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统 - Google Patents
基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统 Download PDFInfo
- Publication number
- CN116862021A CN116862021A CN202310953891.1A CN202310953891A CN116862021A CN 116862021 A CN116862021 A CN 116862021A CN 202310953891 A CN202310953891 A CN 202310953891A CN 116862021 A CN116862021 A CN 116862021A
- Authority
- CN
- China
- Prior art keywords
- node
- reputation
- value
- learning
- neighbor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000011156 evaluation Methods 0.000 title claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 77
- 230000008569 process Effects 0.000 claims abstract description 30
- 230000006870 function Effects 0.000 claims description 19
- 238000005457 optimization Methods 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 claims description 10
- 125000004122 cyclic group Chemical group 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 2
- 230000004931 aggregating effect Effects 0.000 claims 1
- 238000012163 sequencing technique Methods 0.000 claims 1
- 238000009826 distribution Methods 0.000 abstract description 5
- 230000007246 mechanism Effects 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 7
- 230000006399 behavior Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000008260 defense mechanism Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统,涉及人工智能与信息安全交叉技术领域,该方法包括:基于获取的分布式网络中各个节点的训练数据,通过不断迭代训练实现去中心化学习,其训练过程中:分布式网络中的每一节点获取自节点的邻居节点当前轮次的局部参数,以此计算每一邻居节点当前轮次的信誉贡献值和信誉损失值,确定信誉有效值,进而确定自节点及其每一邻居节点的全局历史信誉值;基于全局历史信誉值为自节点及其每一邻居节点分配权重,进而更新自节点的局部参数并发送至邻居节点。本发明构建信誉评估机制,建立全局历史信誉值模型,通过权重分配,降低拜占庭攻击的影响,达到保护学习模型的目的。
Description
技术领域
本发明涉及人工智能与信息安全交叉技术领域,尤其涉及一种基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统。
背景技术
机器学习(Machine Learning,ML)的基本任务之一是利用训练数据学习并构建一个模型,使统计风险最小化。实现这一任务的典型技术是经验风险最小化(Empirical RiskMinimization,ERM)策略。在ERM框架下,学习模型优化算法的目的是最小化某单个位置训练数据的平均损失。然而,在许多机器学习ML的应用中,训练数据往往是地理分布的,如物联网系统、智能电网、传感器网络等,同时,由于训练数据的数据量巨大且可能包含隐私信息,训练数据无法在一台机器上收集,如社交网络数据、智能手机数据、医疗保健数据等。在此情形下,通常使用分布在网络上的训练数据来学习并训练ML模型。当这一方式下应用程序中的机器学习优化算法需要一个连接到网络中所有节点的中央服务器协调时,所得到的框架通常被称为分布式学习。而由于多种实际限制,很多时候也要求应用程序在没有中央服务器的情况下完成学习任务,在这种情况下,所得到的框架被称为去中心化学习。由于分布式学习中,一旦中心服务器受到攻击就容易导致模型优化失败,相比之下,去中心化学习消除了中心服务器的影响,使分布式网络中的每个节点都扮演着服务器和工作者的双重角色,具有更好的性能,能够使模型训练的效率更高,且成本更低。因此,去中心化学习受到了广泛的关注。如在电力系统负荷预测中,获取分布式传感器网络中每一传感器节点采集的气象数据及历史负荷数据,通过去中心化学习,训练得到每一节点的电力负荷预测模型,能够预测未来一段时间内的电力负荷变化和具体数值,为电力系统运行和规划提供依据。
然而,在去中心化学习训练过程中,网络节点之间需要进行参数交互,一些节点会发送虚假信息给正常节点,这些节点被称为拜占庭节点,而这种行为则被称为拜占庭攻击,这也就使得去中心化学习模型的训练失败,或训练得到的去中心化学习模型性能较差。通常情况下这些拜占庭节点不可预测,因此,在存在不可预测的拜占庭节点的情况下,如何以最小的计算代价获得正确的去中心化学习模型是目前如物联网系统、智能电网、传感器网络等分布式网络在去中心化分布式学习过程中所亟需解决的问题。
发明内容
为解决上述现有技术的不足,本发明提供了一种基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统,在分布式网络的去中心化学习过程中,从信誉评估的角度出发,构建信誉评估机制,建立全局历史信誉值模型,以邻居节点的全局历史信誉值为基准进行权重分配,结合分布式梯度下降法,更新去中心化学习模型,这一方法计算代价小,而且能够有效抵抗拜占庭攻击对去中心化学习模型的影响,达到保护学习模型的目的,使得最终训练得到的模型正确且性能更优。
第一方面,本发明提供了一种基于信誉评估的抗拜占庭攻击的去中心化学习方法。
一种基于信誉评估的抗拜占庭攻击的去中心化学习方法,包括:
获取分布式网络中各个节点的训练数据,基于获取的训练数据进行去中心化学习,通过不断循环迭代训练,更新各个节点的局部参数,且各个节点基于更新后的局部参数进行训练,直至迭代训练完成,得到去中心化学习模型;其中,在循环迭代的训练过程中:
分布式网络中的每一节点获取自节点的邻居节点当前轮次的局部参数;
基于获取的局部参数,计算每一邻居节点当前轮次的信誉贡献值和信誉损失值;
基于信誉贡献值和信誉损失值,确定每一邻居节点当前轮次的信誉有效值,并结合自节点的信誉有效值,确定自节点及其每一邻居节点初始轮次到当前轮次的全局历史信誉值;
基于全局历史信誉值为自节点及其每一邻居节点分配权重,基于权重和当前轮次局部参数,更新自节点的局部参数,并将自节点更新后的局部参数发送至邻居节点。
第二方面,本发明提供了一种基于信誉评估的抗拜占庭攻击的去中心化学习系统。
一种基于信誉评估的抗拜占庭攻击的去中心化学习系统,包括:
数据获取模块,用于获取分布式网络中各个节点的训练数据;
去中心化学习模块,用于基于获取的训练数据进行去中心化学习,通过不断循环迭代训练,更新各个节点的局部参数,且各个节点基于更新后的局部参数进行训练,直至迭代训练完成,得到去中心化学习模型;其中,在循环迭代的训练过程中:
分布式网络中的每一节点获取自节点的邻居节点当前轮次的局部参数;
基于获取的局部参数,计算每一邻居节点当前轮次的信誉贡献值和信誉损失值;
基于信誉贡献值和信誉损失值,确定每一邻居节点当前轮次的信誉有效值,并结合自节点的信誉有效值,确定自节点及其每一邻居节点初始轮次到当前轮次的全局历史信誉值;
基于全局历史信誉值为自节点及其每一邻居节点分配权重,基于权重和当前轮次局部参数,更新自节点的局部参数,并将自节点更新后的局部参数发送至邻居节点。
以上一个或多个技术方案存在以下有益效果:
1、本发明提供了一种基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统,在传感器网络等分布式网络的去中心化学习过程中,从信誉评估的角度出发,构建信誉评估机制,通过评估邻居节点在学习过程中每次迭代中的表现,为邻居节点构建全局历史信誉值模型,以邻居节点的全局历史信誉值为基准进行权重分配,结合分布式梯度下降法,更新去中心化学习模型。本发明基于信誉评估,为去中心化学习设置了防御机制,能够有效抵御去中心化学习过程中拜占庭攻击对学习模型的影响,训练得到性能更优的模型,且这一方式计算代价小,容易实现。
2、本发明所提出的抗拜占庭攻击的去中心化学习方法,可以应用到电力系统负荷预测中,通过电力系统中分布式传感器网络的抗拜占庭攻击的去中心化学习,训练得到性能更优的电力负荷预测模型,实现更精准的电力负荷预测。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例中抗拜占庭攻击的去中心化学习中循环迭代学习过程的流程图。
具体实施方式
应该指出,以下详细说明都是示例性的,仅是为了描述具体实施方式,旨在对本发明提供进一步的说明,并非意图限制根据本发明的示例性实施方式。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
去中心化学习能够使模型训练的效率更高,且模型训练的成本较低,但是去中心化学习的过程中,拜占庭攻击会严重影响学习模型的性能。为了有效抵御拜占庭攻击对去中心化学习模型的影响,需要为去中心化学习设置防御机制。考虑拜占庭节点的攻击手段,无论拜占庭节点如何伪装,从长远来看,其若想达到攻击效果,则必须有攻击行为。因此,本实施例提出了一种基于信誉评估的抗拜占庭攻击的去中心化学习方法,在传感器网络等分布式网络的去中心化学习过程中,从信誉评估的角度出发,构建信誉评估机制,通过评估邻居节点在学习过程中每次迭代中的表现,为邻居节点构建全局历史信誉值模型,其中,拜占庭节点由于攻击行为,使得其全局历史信誉不佳,之后,根据邻居节点的全局历史信誉值分配权重,降低拜占庭攻击的影响,并结合分布式梯度下降法,更新去中心化学习模型,以此达到保护学习模型的目的。
本实施例所提供的一种基于信誉评估的抗拜占庭攻击的去中心化学习方法,包括:
获取分布式网络中各个节点的训练数据,基于获取的训练数据进行去中心化学习,通过不断循环迭代训练,更新各个节点的局部参数,且各个节点基于更新后的局部参数进行训练,直至迭代训练完成,得到去中心化学习模型;其中,在循环迭代的训练过程中:
分布式网络中的每一节点获取自节点的邻居节点当前轮次的局部参数;
基于获取的局部参数,计算每一邻居节点当前轮次的信誉贡献值和信誉损失值;
基于信誉贡献值和信誉损失值,确定每一邻居节点当前轮次的信誉有效值,并结合自节点的信誉有效值,确定自节点及其每一邻居节点初始轮次到当前轮次的全局历史信誉值;
基于全局历史信誉值为自节点及其每一邻居节点分配权重,基于权重和当前轮次局部参数,更新自节点的局部参数,并将自节点更新后的局部参数发送至邻居节点。
通过下述内容对本实施例所述提出的抗拜占庭攻击的去中心化学习方法进行详细的介绍。
在去中心化学习的过程中,拜占庭节点清楚全局信息,在同一时刻它会向分布式网络中不同的节点发送不同的参数,而且这个参数可以是经过精心设计的,能够伪装成正常节点的参数。
首先,针对分布式网络,建立机器学习模型。在本实施例中,设共有n个节点参与去中心化学习过程,其中,为了使去中心化学习网络具有一定的冗余性,其拓扑约束建立在源组件和约简图这两个定义之上,其中,源组件作为第一定义,是指:图中的一个节点子集,该节点子集中的每个节点都可以通过有向路径到达图中的其他节点;约简图作为第二定义,是指:一个图G的约简图经两步获得:1、将原图G中的拜占庭节点及其所有入边和出边全部删除,2、从每个非故障节点中额外删除b条入边,b表示拜占庭节点的最大数量。则网络拓扑约束为:分布式网络的网络拓扑图G的所有约简图中都至少包含一个基数大于或等于(b+1)的源组件。实际上,上述步骤为构建分布式网络,分布式网络包括多个节点和广播总线,其中所述节点均连接所述广播总线,且所述节点之间通过所述广播总线进行通信,所构成的分布式网络满足上述网络拓扑约束。
在基于上述拓扑约束的分布式网络的基础上,为网络中的每个节点i∈n分配一个本地数据集Di,其各自独立,并来自同一分布D,即所述训练数据满足独立同分布。获取分布式网络中各个节点的训练数据,基于获取的训练数据进行去中心化学习,通过不断循环迭代训练,得到去中心化学习模型。在迭代训练的过程中,利用经验风险最小化方法构建机器学习优化问题,这一优化问题即最小化学习模型的损失函数,其中影响损失函数的参数包括训练数据和模型参数。上述优化问题可表示为:
其中,l表示模型的损失函数,ξ表示采样的训练数据,x表示模型参数,E表示期望。
以分布式传感器网络在电力负荷预测中的去中心化学习为例进行介绍。在电力系统负荷预测中,通常利用分布式气象传感器采集相应的气象数据,并获取相应的历史负荷数据,以此进行训练,得到电力负荷预测模型。具体的,针对分布式传感器网络的电力系统负荷预测,每一节点传感器获取相应的气象数据及其电力负荷数据,每一节点使用本地数据进行模型训练,并将模型(模型参数)更新发送给周围的邻居节点,邻居节点接受更新并根据其自身的本地数据进行模型训练,不断循环迭代,直至所有节点训练的模型达到收敛状态,完成去中心化学习与训练,此时每一节点得到相应的电力负荷预测模型(即去中心化学习模型),实现电力负荷预测。而由于受到拜占庭攻击的影响,导致模型训练过程中节点接收异常数据,使得最终训练得到的预测模型不正确,预测精度不高。
为了避免上述训练过程中的拜占庭攻击,上述去中心化学习模型的训练过程中,在不断循环迭代过程中更新各个节点的局部参数,直至训练完成,这一循环迭代的学习过程具体包括以下步骤,如图1所示:
首先,分布式网络中的每一节点获取自节点的邻居节点当前轮次的局部参数;基于获取的局部参数,计算每一邻居节点当前轮次的信誉贡献值和信誉损失值。其中,以每个邻居节点当前轮次的局部参数到自节点局部参数之间的欧式距离为影响因素,计算得到每一邻居节点相对于自节点的信誉贡献值,距离越远,则本轮次所获得的信誉贡献值就越低;此外,当发现某一邻居节点出现可疑行为时,则扣除其一定的信誉贡献值,其中,当邻居节点本轮次的距离排名大于该邻居节点的历史排名平均值时,则认为该邻居节点存在可疑行为。具体包括以下步骤:
基于获取的局部参数,计算每一邻居节点当前轮次的局部参数到自节点局部参数之间的欧式距离;
基于欧式距离,计算得到每一邻居节点相对于自节点的信誉贡献值Ccon(Creditcontribution)。这一步骤可通过下述公式表示:
其中,Ni为节点i的邻居节点集合,每个节点i获取邻居节点j发送的局部参数xj(t),t表示循环迭代次数或循环迭代轮次。计算每个邻居节点的局部参数xj(t)到自节点局部参数xi(t)的欧式距离Dij(t),距离越远,则该邻居节点本轮次的信誉贡献值越小。当距离为0时,本轮次的信誉贡献值为1。
另外,自节点对于自身的信誉贡献值(后续简称为自节点的信誉贡献值)为其所有邻居节点的信誉贡献值之和的3t/(2t+1)倍,这样可以使得自节点在训练过程中更多的接受正常邻居节点的信息,从而加快收敛速度。自节点i的信誉贡献值的计算公式为:
其中,CcOnij(t)为邻居节点j相对于自节点i的信誉贡献值,Ni为节点i的邻居节点集合。
其次,基于所有邻居节点当前轮次的欧式距离进行排序,确定每一邻居节点当前轮次的排名,根据某一邻居节点当前轮次的排名和当前轮次之前所有轮次的历史平均排名进行比较,确定该邻居节点的惩罚开关参数;
基于邻居节点的惩罚开关参数,结合该邻居节点的信誉贡献值,计算得到该邻居节点的信誉损失值,此时获得每一邻居节点的信誉损失值。
上述步骤可通过下述公式表示:
上式中,α为惩罚开关参数,rankij(t)表示节点i的邻居节点j在第t轮次的排名,avgrankij(t-1)表示节点i的邻居节点j在第t轮次之前t-1次的历史平均排名。
对于出现恶意行为的节点,需要要对其进行惩罚,即减少其本轮次的信誉贡献值。在本实施例中,判断恶意行为的方式为:对本轮次所有邻居节点的欧式距离进行排名,其中自节点的排名为1。记录邻居节点本轮次即第t轮次的排名为rankij(t);同时,计算邻居节点前t-1次的历史平均排名avgrankij(t-1),以此用于对未来排名预测。当邻居节点当前轮次的排名大于历史平均排名时,则将其视为存在恶意行为的节点,需要对其进行惩罚;反之,则不做处理。其中,自节点的排名始终为1,其惩罚开关参数为0,自节点的信誉损失值为0。
根据邻居节点的惩罚开关参数,结合该邻居节点的信誉贡献值,计算该邻居节点的信誉损失值Clos(Credit loss),公式为:
上式中,t表示循环迭代次数,Hij(t-1)表示该邻居节点上一轮次的全局历史信誉值。
当α=-1时,惩罚生效,惩罚程度通过上述信誉损失函数获得。其中,损失大小以信誉贡献值为基准,损失至多为两倍的信誉贡献值。考虑拜占庭节点会通过前期伪装不断积累其全局历史信誉值H到一个很高的程度,后期当它发生恶意行为时,它所获得的信誉损失相对于全局历史信誉而言微乎其微。因此,在本实施例中,信誉损失值与迭代次数t和全局历史信誉值H成正比,从而达到防范这种伪装攻击的目的。
之后,基于信誉贡献值和信誉损失值,确定每一邻居节点当前轮次的信誉有效值。该信誉有效值Cval(Valid Credit)为信誉贡献值和信誉损失值之和,公式为:
将信誉贡献值和信誉损失值相加得到本次迭代的信誉有效值,其中,由于自节点的信誉损失值为0,则自节点的信誉有效值等于自节点的信誉贡献值。然后,基于自节点及其邻居节点中每一节点当前轮次的信誉有效值,结合该节点上一轮次的全局历史信誉值,计算得到该节点当前轮次的全局历史信誉值H(History Credit),公式为:
Hij(t)=max{Hij(t-1)+Cvalij(t),0}
其中,初始轮次的全局历史信誉值Hij(0)为0。
实际上,节点的全局历史信誉值为节点每轮信誉有效值的累加。随着不断迭代,当前轮次信誉贡献值的作用越来越小,加速了模型收敛。另外,为了防止全局历史信誉值H为负影响权重分配,本实施例采用取最大值的方法。
接着,基于全局历史信誉值为自节点及其每一邻居节点分配权重。具体的,计算自节点及其邻居节点的全局历史信誉值之和,根据每个节点各自的全局历史信誉值在总和的占比,为每个节点分配权重,公式为:
上式中,wij(t)表示为自节点及其邻居节点中的每个节点分配的当前轮次的权重。
最后,基于每一节点的权重和当前轮次的局部参数,更新自节点的局部参数。具体的,基于每一节点的权重和当前轮次局部参数进行聚合,计算得到每一节点的权重和当前轮次局部参数的累加和,结合分布式梯度下降法,更新自节点的局部参数,公式为:
其中,σ为学习率,gi为梯度。
将自节点更新后的局部参数发送给邻居节点,其中拜占庭节点可以发送任意数据给邻居节点,此处不需要建模。此外,根据更新后的局部参数和训练数据集,计算下一迭代的梯度gi(t+1),为下一迭代过程中各节点局部参数的更新奠定基础。
对上述梯度的计算进行介绍。首先,梯度是一个向量,其方向是指函数在某一点上取得最大增长率的方向。在最优化问题中,通常希望找到函数的最小值;对于最小化问题,可以沿着梯度的反方向移动,因为负梯度的方向指向函数值减小最快的方向。因此,本实施例计算下一迭代的梯度gi(t+1)的计算方法包括:根据链式法则,从损失函数开始,按照网络的反向顺序计算每个参数对于损失函数的梯度,具体的:
a.计算输出层的梯度。根据所使用的损失函数,计算输出层预测值对于损失函数的梯度,这可以通过损失函数的导数和输出层的激活函数来确定。
b.传播梯度至隐藏层。将输出层的梯度逐层向后传播,计算每一层的梯度,即:利用链式法则,将当前层的梯度乘以下一层对当前层输入的导数,得到当前层对于损失函数的梯度。
通过上述方式最终计算得到梯度gi(t+1),并将计算得到的梯度返回至自节点i,为下一迭代过程中各节点局部参数的更新奠定基础。
在本实施例中,分布式网络中的各个节点基于获取的训练数据进行去中心化学习,在不断循环迭代学习与训练的过程中,基于上述方法更新各个节点的局部参数,各个节点基于更新后的局部参数进行训练,直至满足上述优化问题,即满足最小化损失函数,此时迭代训练完成,得到最优的去中心化学习模型。上述过程中,本实施例基于信誉评估,为去中心化学习设置了防御机制,能够有效抵御去中心化学习过程中拜占庭攻击对学习模型的影响,且上述方式的计算代价小,容易实现。
实施例二
本实施例提供了一种基于信誉评估的抗拜占庭攻击的去中心化学习系统,该系统包括:
数据获取模块,用于获取分布式网络中各个节点的训练数据;
去中心化学习模块,用于基于获取的训练数据进行去中心化学习,通过不断循环迭代训练,更新各个节点的局部参数,且各个节点基于更新后的局部参数进行训练,直至迭代训练完成,得到去中心化学习模型;其中,在循环迭代的训练过程中:
分布式网络中的每一节点获取自节点的邻居节点当前轮次的局部参数;
基于获取的局部参数,计算每一邻居节点当前轮次的信誉贡献值和信誉损失值;
基于信誉贡献值和信誉损失值,确定每一邻居节点当前轮次的信誉有效值,并结合自节点的信誉有效值,确定自节点及其每一邻居节点初始轮次到当前轮次的全局历史信誉值;
基于全局历史信誉值为自节点及其每一邻居节点分配权重,基于权重和当前轮次局部参数,更新自节点的局部参数,并将自节点更新后的局部参数发送至邻居节点。
以上实施例二中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
以上所述仅为本发明的优选实施例,虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于信誉评估的抗拜占庭攻击的去中心化学习方法,其特征是,包括:
获取分布式网络中各个节点的训练数据,基于获取的训练数据进行去中心化学习,通过不断循环迭代训练,更新各个节点的局部参数,且各个节点基于更新后的局部参数进行训练,直至迭代训练完成,得到去中心化学习模型;其中,在循环迭代的训练过程中:
分布式网络中的每一节点获取自节点的邻居节点当前轮次的局部参数;
基于获取的局部参数,计算每一邻居节点当前轮次的信誉贡献值和信誉损失值;
基于信誉贡献值和信誉损失值,确定每一邻居节点当前轮次的信誉有效值,并结合自节点的信誉有效值,确定自节点及其每一邻居节点初始轮次到当前轮次的全局历史信誉值;
基于全局历史信誉值为自节点及其每一邻居节点分配权重,基于权重和当前轮次局部参数,更新自节点的局部参数,并将自节点更新后的局部参数发送至邻居节点。
2.如权利要求1所述的基于信誉评估的抗拜占庭攻击的去中心化学习方法,其特征是,在迭代训练的过程中,利用经验风险最小化方法构建机器学习优化问题,所述优化问题为最小化学习模型的损失函数,其中影响损失函数的参数包括训练数据和模型参数。
3.如权利要求1所述的基于信誉评估的抗拜占庭攻击的去中心化学习方法,其特征是,所述基于获取的局部参数,计算每一邻居节点当前轮次的信誉贡献值和信誉损失值,包括:
基于获取的局部参数,计算每一邻居节点当前轮次的局部参数到自节点局部参数之间的欧式距离;
基于欧式距离,计算得到每一邻居节点相对于自节点的信誉贡献值。
4.如权利要求3所述的基于信誉评估的抗拜占庭攻击的去中心化学习方法,其特征是,还包括:
基于所有邻居节点当前轮次的欧式距离进行排序,确定每一邻居节点当前轮次的排名,根据某一邻居节点当前轮次的排名和当前轮次之前所有轮次的历史平均排名进行比较,确定该邻居节点的惩罚开关参数;
基于邻居节点的惩罚开关参数,结合该邻居节点的信誉贡献值,计算得到该邻居节点的信誉损失值。
5.如权利要求1所述的基于信誉评估的抗拜占庭攻击的去中心化学习方法,其特征是,所述基于信誉贡献值和信誉损失值,确定每一邻居节点当前轮次的信誉有效值,包括:
针对每一邻居节点,将信誉贡献值和信誉损失值相加得到当前轮次的信誉有效值;其中,当前轮次自节点的信誉有效值等于自节点的信誉贡献值。
6.如权利要求1所述的基于信誉评估的抗拜占庭攻击的去中心化学习方法,其特征是,每一节点的全局历史信誉值为该节点每轮信誉有效值的累加。
7.如权利要求1所述的基于信誉评估的抗拜占庭攻击的去中心化学习方法,其特征是,所述基于全局历史信誉值为自节点及其每一邻居节点分配权重,包括:
计算自节点及其邻居节点的全局历史信誉值之和,根据每个节点各自的全局历史信誉值在总和中的占比,为每个节点分配权重。
8.如权利要求1所述的基于信誉评估的抗拜占庭攻击的去中心化学习方法,其特征是,所述基于权重和当前轮次局部参数,更新自节点的局部参数,包括:
基于自节点及其邻居节点中每一节点的权重和当前轮次局部参数进行聚合,计算得到每一节点的权重和当前轮次局部参数的累加和,再结合分布式梯度下降法,更新自节点的局部参数。
9.一种基于信誉评估的抗拜占庭攻击的去中心化学习系统,其特征是,包括:
数据获取模块,用于获取分布式网络中各个节点的训练数据;
去中心化学习模块,用于基于获取的训练数据进行去中心化学习,通过不断循环迭代训练,更新各个节点的局部参数,且各个节点基于更新后的局部参数进行训练,直至迭代训练完成,得到去中心化学习模型;其中,在循环迭代的训练过程中:
分布式网络中的每一节点获取自节点的邻居节点当前轮次的局部参数;
基于获取的局部参数,计算每一邻居节点当前轮次的信誉贡献值和信誉损失值;
基于信誉贡献值和信誉损失值,确定每一邻居节点当前轮次的信誉有效值,并结合自节点的信誉有效值,确定自节点及其每一邻居节点初始轮次到当前轮次的全局历史信誉值;
基于全局历史信誉值为自节点及其每一邻居节点分配权重,基于权重和当前轮次局部参数,更新自节点的局部参数,并将自节点更新后的局部参数发送至邻居节点。
10.如权利要求9所述的基于信誉评估的抗拜占庭攻击的去中心化学习系统,其特征是,在迭代训练的过程中,利用经验风险最小化方法构建机器学习优化问题,所述优化问题为最小化学习模型的损失函数,其中影响损失函数的参数包括训练数据和模型参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310953891.1A CN116862021B (zh) | 2023-07-31 | 2023-07-31 | 基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310953891.1A CN116862021B (zh) | 2023-07-31 | 2023-07-31 | 基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116862021A true CN116862021A (zh) | 2023-10-10 |
CN116862021B CN116862021B (zh) | 2024-05-03 |
Family
ID=88227010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310953891.1A Active CN116862021B (zh) | 2023-07-31 | 2023-07-31 | 基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116862021B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745433A (zh) * | 2024-02-19 | 2024-03-22 | 成都理工大学 | 基于改进pbft共识机制的能源区块链节点共识方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103812696A (zh) * | 2014-01-28 | 2014-05-21 | 河南科技大学 | 一种基于混合蛙跳算法的物联网节点信誉评估方法 |
CN111967015A (zh) * | 2020-07-24 | 2020-11-20 | 复旦大学 | 一种提升分布式学习系统拜占庭鲁棒性的防御代理方法 |
CN113645190A (zh) * | 2021-07-12 | 2021-11-12 | 中国科学院信息工程研究所 | 一种考虑节点信誉的拜占庭容错共识方法及区块链 |
WO2023071106A1 (zh) * | 2021-10-26 | 2023-05-04 | 平安科技(深圳)有限公司 | 联邦学习管理方法、装置、计算机设备及存储介质 |
CN116233177A (zh) * | 2022-12-29 | 2023-06-06 | 山东省计算中心(国家超级计算济南中心) | 基于区块链和动态信誉的车联网数据安全共享方法及系统 |
-
2023
- 2023-07-31 CN CN202310953891.1A patent/CN116862021B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103812696A (zh) * | 2014-01-28 | 2014-05-21 | 河南科技大学 | 一种基于混合蛙跳算法的物联网节点信誉评估方法 |
CN111967015A (zh) * | 2020-07-24 | 2020-11-20 | 复旦大学 | 一种提升分布式学习系统拜占庭鲁棒性的防御代理方法 |
CN113645190A (zh) * | 2021-07-12 | 2021-11-12 | 中国科学院信息工程研究所 | 一种考虑节点信誉的拜占庭容错共识方法及区块链 |
WO2023071106A1 (zh) * | 2021-10-26 | 2023-05-04 | 平安科技(深圳)有限公司 | 联邦学习管理方法、装置、计算机设备及存储介质 |
CN116233177A (zh) * | 2022-12-29 | 2023-06-06 | 山东省计算中心(国家超级计算济南中心) | 基于区块链和动态信誉的车联网数据安全共享方法及系统 |
Non-Patent Citations (3)
Title |
---|
XIN WANG ET AL.: "The Research on the Incentive Method of Consortium Blockchain Based on Practical Byzantine Fault Tolerant", 《2018 11TH INTERNATIONAL SYMPOSIUM ON COMPUTATIONAL INTELLIGENCE AND DESIGN》, 25 April 2019 (2019-04-25), pages 154 - 156 * |
YUSEN WU ET AL.: "Tolerating Adversarial Attacks and Byzantine Faults in Distributed Machine Learning", 《2021 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA)》, 13 January 2022 (2022-01-13), pages 3380 - 3389 * |
杨明 等: "基于信誉评估机制和区块链的移动网络联邦学习方案", 《网络与信息安全学报》, vol. 7, no. 6, 31 December 2021 (2021-12-31), pages 99 - 112 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745433A (zh) * | 2024-02-19 | 2024-03-22 | 成都理工大学 | 基于改进pbft共识机制的能源区块链节点共识方法 |
CN117745433B (zh) * | 2024-02-19 | 2024-05-28 | 成都理工大学 | 基于改进pbft共识机制的能源区块链节点共识方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116862021B (zh) | 2024-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hardiansyah et al. | Solving economic load dispatch problem using particle swarm optimization technique | |
CN116862021B (zh) | 基于信誉评估的抗拜占庭攻击的去中心化学习方法及系统 | |
CN108111335B (zh) | 一种调度和链接虚拟网络功能的方法及系统 | |
CN110601777B (zh) | 一种低轨移动卫星星座下星地下行链路同频干扰估计方法 | |
Swenson et al. | Distributed inertial best-response dynamics | |
CN113537580B (zh) | 一种基于自适应图学习的公共交通客流预测方法及系统 | |
Asheralieva et al. | Ultra-reliable low-latency slicing in space-air-ground multi-access edge computing networks for next-generation internet of things and mobile applications | |
Zhang et al. | Clique-based cooperative multiagent reinforcement learning using factor graphs | |
CN115001978B (zh) | 一种基于强化学习模型的云租户虚拟网络智能映射方法 | |
Wei et al. | Drl-deploy: adaptive service function chains deployment with deep reinforcement learning | |
Hadjicostis et al. | Distributed balancing of commodity networks under flow interval constraints | |
Jasmin et al. | Reinforcement learning solution for unit commitment problem through pursuit method | |
CN108521345A (zh) | 一种考虑通信中断的孤岛微电网的信息物理协同应对方法 | |
Wang | Optimization of wireless network node deployment in smart city based on adaptive particle swarm optimization | |
CN112163690A (zh) | 多时间尺度的多智能体强化学习方法及装置 | |
Rahmat et al. | Differential evolution immunized ant colony optimization technique in solving economic load dispatch problem | |
CN118400788B (zh) | 异构无人平台集群的自适应稳态组网方法及装置 | |
Hedar et al. | Wireless Sensor Networks Management Using Differential Evolution and Minimum Dominating Sets | |
CN116980982B (zh) | 一种柔性组网架构下任务处理方法及系统 | |
CN115660324B (zh) | 基于图强化学习的电网多断面越限调控方法和系统 | |
CN118555599B (zh) | 一种基于多目标优化的无线传感器网络关键节点识别方法 | |
CN113971330B (zh) | 一种公共场合监控设备的布局方法 | |
CN117911197B (zh) | 基于改进多目标粒子群算法的光伏选址定容方法及系统 | |
Jirutitijaroen et al. | Multi-area generation adequacy planning using stochastic programming | |
CN118133936A (zh) | 基于光滑化和动量技术的分布式随机非光滑优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |