CN112148478B - 变电站分布式无线网中数据安全和资源分配联合优化方法 - Google Patents
变电站分布式无线网中数据安全和资源分配联合优化方法 Download PDFInfo
- Publication number
- CN112148478B CN112148478B CN202010912048.5A CN202010912048A CN112148478B CN 112148478 B CN112148478 B CN 112148478B CN 202010912048 A CN202010912048 A CN 202010912048A CN 112148478 B CN112148478 B CN 112148478B
- Authority
- CN
- China
- Prior art keywords
- node
- preparation
- slave node
- representing
- flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013468 resource allocation Methods 0.000 title claims abstract description 33
- 238000005457 optimization Methods 0.000 title abstract description 8
- 238000002360 preparation method Methods 0.000 claims description 71
- 230000005540 biological transmission Effects 0.000 claims description 54
- 238000004891 communication Methods 0.000 claims description 46
- 238000004364 calculation method Methods 0.000 claims description 36
- 230000009471 action Effects 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 12
- 230000002787 reinforcement Effects 0.000 claims description 10
- 230000007704 transition Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Bioethics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Mobile Radio Communication Systems (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明提出一种变电站分布式无线网中数据安全和资源分配联合优化方法,解决了如何同时保证变电站分布式无线系统中的数据安全性及最优资源分配的问题,本发明首先将分散的变电站构成的分布式系统作为区块链来存储变电站的通信数据,保证数据的安全性,基于拜占庭容错协议达成数据的一致性,根据拜占庭容错协议的请求、预准备、准备、提交和响应流程,设计数据达成一致性过程中所消耗的通信时延参数,以系统的吞吐量函数达到最大化为深度强化学习目标,采用深度强化学习进行学习训练,使系统的吞吐量及通信时延均达到最优,实现由变电站形成的分布式系统的通信通道资源、区块链区块数量和容量的最优分配的同时,降低通信时延的目的。
Description
技术领域
本发明涉及变电站无线通信的技术领域,更具体地,涉及一种变电站分布式无线网中数据安全和资源分配联合优化方法。
背景技术
无线通信技术是当前利用电磁波信号所有的自由空间的传播特定而进行数据信息交互的一种现代化、智能化通信方式,变电站则是改变电压的场所,通过升降电压来实现电能的输送,无线通信技术在变电站中的应用,可以保证变电站日常业务的高效率开展。
但在变电站分布式无线网络系统中,数据信息传输的安全性一直都是电网关注的焦点之一,数据的安全性保障着整个变电站所在的系统能够获得正确的数据,从而进行正确的操作,近年来区块链技术凭借其保证数据安全性的优点,广泛应该于金融、计算以及通信等各个方面,引起了人们对于区块链技术在其他方面的研究和探索,但目前区块链特点是低吞吐量和高延迟,无法保证数据安全性的同时兼具高效性以及最优的资源分配。
2019年10月,方维维,王子岳,宋慧丽,等在《北京交通大学学报》中公开了一种面向区块链的优化PBFT共识算法(2019,43(05)),此方案基于拜占庭容错协议(PBFT)的算法思想首先进行数据一致性的达成,在考虑降低系统的通信时延及资源分配层面引入积分机制,降低通信时延,但是该方法仅考虑了利用区块链技术的数据一致性达成的结果角度,并未从数据一致性达成的过程角度考虑兼顾分布式无线网络系统中的资源分配问题,无法降低拜占庭容错协议流程中的计算时延和传输时延。
发明内容
为解决如何同时保证变电站分布式无线系统中的数据安全性及最优资源分配的问题,本发明提出了一种变电站分布式无线网中数据安全和资源分配联合优化方法,达到数据安全性的保证和通信时延的降低的目的。
为了达到上述技术效果,本发明的技术方案如下:
一种变电站分布式无线网中数据安全和资源分配联合优化方法,所述方法将由变电站形成的分布式系统作为区块链,变电站作为区块链中的节点,区块链基于拜占庭容错协议达成数据的一致性,至少包括:
S1.初始化变电站分布式无线系统的状态空间、动作空间、各个变电站之间的通信信道状态、各个变电站所配备的服务器的计算资源状态、双重深度Q网络的参数;
S2.将系统所处的当前状态s输入到双重深度Q网络的主网络中,依据当前状态所采取的资源分配决策输出动作及每个动作对应的Q值,选取最大Q值对应的动作作为当前状态s1的动作;
S3.考虑变电站所配备的服务器的计算资源及各个变电站之间的通信信道状态的变化,根据拜占庭容错协议的请求、预准备、准备、提交和响应流程,设计数据达成一致性过程中所消耗的通信时延参数,获得即刻奖励和系统所处的下一状态s′,并存储到经验池中;
S4.判断经验池存储的经验数量是否达到阈值E,若是,执行步骤S5;否则,返回执行步骤S2;
S5.以长期奖励函数最大化即系统的吞吐量函数达到最大化为深度强化学习目标,以设计的数据达成一致性过程中所消耗的通信时延参数为指导,基于竞争架构的双重深度Q网络算法,进行深度强化学习;
S6.判断算法是否收敛,若是,系统的吞吐量及通信时延均达到最优,资源分配终止;否则,返回步骤S5。
在此,各个变电站之间的通信信道状态和各个变电站所配备的服务器的计算资源状态为有限状态马尔可夫模型,在同一时刻不会发生变化,各个变电站所配备的服务器里面包括了本地数据库和全局数据库,全局数据库中全局数据的生成需要变电站之间相互通信,通信信道状态的初始化即按照实际环境选取一定的参数,进行初始化。
优选地,步骤S1所述的各个变电站所配备的服务器的计算资源初始化为服务器标称性能的50%;双重深度Q网络的参数包括权重和偏移,权重按照正态分布初始化,偏移按照0.1初始化。
在此,各个变电站所配备的服务器的计算资源初始化为服务器标称性能的50%,即在中等水平,可以为后续留出调整自身参数的空间,保证系统性能的最大化。
优选地,步骤S3所述的通信时延参数包括传输时延参数和计算时延参数;
1)拜占庭容错协议的请求流程的传输时延参数的表达式为:
其中,表示一个交易的平均大小,U表示基站的总集合;Um表示总集合U中的第m个基站,Bp表示主节点;/>表示为从基站Um到主节点Bp的传输速率;/>表示传输时延参数;
在拜占庭容错协议的请求流程中,主节点Bp验证数量的交易签名和MACs,SB表示区块容量,执行/>数量交易的智能合约,产生计算消耗,计算时延的表达式为:
其中,表示计算消耗,表达式为/>β、θ、g为参数;
2)预准备流程:请求流程之后,生成新区块,主节点Bp将多播签名区块和预准备信息发送至所有的从节点验证,预准备信息包括主节点ID、主节点签名和新区块的哈希计算结果,拜占庭容错协议的预准备流程的传输时延参数表达式为:
其中,表示拜占庭容错协议预准备流程的传输时延;B表示节点集合;Bn表示从节点;/>表示主节点Bp向从节点发送预准备信息验证的传输速率;
在预准备流程中,主节点Bp需生成一个签名和N-1个MACs,主节点的计算消耗为:从节点的计算消耗为:/>其中Bn≠Bp,拜占庭容错协议的预准备流程的计算时延参数表达式为:/>
其中,表示拜占庭容错协议的预准备流程的计算时延参数;/>表示预准备流程的从节点的计算消耗;
3)准备流程:预准备流程验证新区块之后,每一个从节点Bn发送准备信息至其余从节点Bn′,Bn≠Bn′,也发送准备信息至主节点Bp,准备信息包括从节点ID和从节点签名,在准备流程,传输时延由发送准备信息引起,传输时延参数的表达式为:
其中,表示拜占庭容错协议准备流程的传输时延;/>表示每一个从节点Bn发送准备信息至其余从节点Bn′的传输速率;
主节点Bp验证来自其余从节点Bn′的2f个签名和MACs,主节点Bp计算消耗为每个从节点Bn为准备信息生成一个签名和N-1个MACs,2f个签名和MACs被验证,从节点Bn(Bn≠Bp)的计算消耗/>为/>
准备流程的计算时延参数表达式为:
其中,表示准备流程的计算时延参数;/>表示从节点Bn(Bn≠Bp)的计算消耗;
4)提交流程:每个从节点Bn接收到来自其余从节点Bn′的2f匹配的准备信息包含预准备信息之后,发送提交信息给其余从节点Bn′,也发送提交信息给主节点Bp,提交信息包括从节点的ID及从节点签名;提交流程传递提交信息的传输时延参数的表达式为:
其中,表示提交流程传递提交信息的传输时延;
每个从节点Bn为提交信息生成一个签名和N-1个MACs,在接收到提交信息后,每个从节点Bn验证2f个签名和MACs,每个从节点Bn的计算消耗为:
提交流程的计算时延参数表达式为:
其中,表示提交流程的计算时延;
5)响应流程:提交信息被从节点Bn接收后,新的区块变成合法区块并被加入到区块链中,同时包括有签名、ID及卸载任务的计算结果的响应消息将被传输,响应流程的传输时延的表达式为:
从节点生成个签名和/>个MACs,计算消耗/>表示为主节点验证2f个签名和MACs,计算消耗/>表示为/>响应流程的计算时延/>的表达式为:
在此,变电站的分布式系统数据一致性达成问题采用基于实用型拜占庭容错协议,同时该协议的达成涉及请求、预准备、准备、提交和响应5个阶段,并且五个阶段中涉及计算时延和传输时延,即在数据一致性达成的过程中存在通信消耗,是为变电站环境设计的参数和计算结果,是资源分配和数据安全性联合优化的关键。
优选地,步骤S3所述的即刻奖励获得的条件为:
I.通由变电站形成的分布式系统的信道的资源分配数不超过运营商分配至变电站的规定信道数;
II.区块最终完成时间Tf不超过期望通信最终完成时间Te;
在此,区块最终完成时间是基于拜占庭容错协议的5流程计算出来的,是考虑和环境交互的结果,不同的环境可以倒追不同的完成时间,而规定的最大时间是期望通信最终完成时间,通过调整期望,使系统完成短时间的通信。
优选地,系统所处的下一状态s′通过状态转移概率转换。
优选地,即刻奖励的表达式为:
其中,Υ表示系统的吞吐量,K表示连续生成的区块数量,SB表示区块容量,T表示时间间隔,表示平均交易大小,Rp,p+1当前主节点和下一主节点之间的传输速率,IB传输过程中丢失的区块。
优选地,区块最终完成时间Tf满足:
Tf=Tp+Tc
其中,Tp表示拜占庭容错协议中传输信息所消耗的传输时延;Tc表示拜占庭容错协议中数据信息验证所消耗的计算时延。
优选地,步骤S5所述的系统的吞吐量函数表达式为:
其中,SB表示区块容量;K表示连续生成的区块数量;t表示时间;W为通信信道数量;γ为折扣因子。
优选地,步骤S5所述的深度强化学习的方法满足:
yDouble DQN=r+γQ(s',arg maxQ(s',a;θ);θ-)
其中,yDouble DQN表示目标值即实际值,γ表示折扣因子,s′表示系统的下一状态,a表选取的动作,θ表示主神经网络的参数,θ-表示目标神经网络的参数。
优选地,算法收敛的标准为:随着时间t的增加,系统的吞吐量函数值不再增加。
在此,随着时间t′的增加,γt'-t会趋于零,从而系统的吞吐量函数值也将趋于一个稳定值,不再发生变化,即系统的吞吐量函数值不再增加。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出一种变电站分布式无线网中数据安全和资源分配联合优化方法,首先将分散的变电站构成的分布式系统作为区块链,以此来存储变电站的通信数据,保证数据的安全性,基于拜占庭容错协议达成数据的一致性,根据拜占庭容错协议的请求、预准备、准备、提交和响应流程,设计数据达成一致性过程中所消耗的通信时延参数,以此为学习基础,以长期奖励函数最大化即系统的吞吐量函数达到最大化为深度强化学习目标,采用深度强化学习进行学习训练,使系统的吞吐量及通信时延均达到最优,实现由变电站形成的分布式系统的通信通道资源、区块链区块数量和容量的最优分配的同时,降低通信时延的目的。
附图说明
图1表示本发明实施例中提出的由分散变电站组成分布式无线系统架构图。
图2表示本发明实施例中提出的变电站分布式无线网中数据安全和资源分配联合优化方法的流程示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,各个变电站1配备有服务器2,变电站1分散部署在多个地方,分散的变电站组成分布式系统,本发明提出的变电站分布式无线网中数据安全和资源分配联合优化方法将此分布式系统作为区块链,各个变电站1抽象为区块链网络中的节点,参见图1,包括主节点3和从节点4,区块链的主节点3与从节点4连接,系统基于拜占庭容错协议达成数据一致性,在本实施例中,该系统为离散时隙系统,同时系统状态建模为马尔可夫决策模型。考虑到真实环境下系统状态的动态变化,将系统状态建模为一阶马尔可夫决策模型。
参见图2所示的变电站分布式无线网中数据安全和资源分配联合优化方法的流程示意图,包括:
S1.初始化变电站分布式无线系统的状态空间、动作空间、各个变电站之间的通信信道状态、各个变电站所配备的服务器的计算资源状态、双重深度Q网络的参数;在本实施例中,各个变电站所配备的服务器的计算资源初始化为服务器标称性能的50%,即在中等水平,可以为后续留出调整自身参数的空间,保证系统性能的最大化;双重深度Q网络的参数包括权重和偏移,权重按照正态分布初始化,偏移按照0.1初始化;
S2.将系统所处的当前状态s输入到双重深度Q网络的主网络中,依据当前状态所采取的资源分配决策输出动作及每个动作对应的Q值,选取最大Q值对应的动作作为当前状态s1的动作;
S3.考虑变电站所配备的服务器的计算资源及各个变电站之间的通信信道状态的变化,根据拜占庭容错协议的请求、预准备、准备、提交和响应流程,设计数据达成一致性过程中所消耗的通信时延参数,获得即刻奖励和系统所处的下一状态s′,并存储到经验池中;
S4.判断经验池存储的经验数量是否达到阈值E,若是,执行步骤S5;否则,返回执行步骤S2;
S5.以长期奖励函数最大化即系统的吞吐量函数达到最大化为深度强化学习目标,以设计的数据达成一致性过程中所消耗的通信时延参数为指导,基于竞争架构的双重深度Q网络算法,进行深度强化学习;在本实施例中,在之后学习的过程中,采取小批量样本进行学习,目的是减小数据之间的相关性;采用的基于竞争架构的双重深度Q网络算法,该算法在深度网络结构的建立上,在最后一层神经网络输出的Q值先转化为状态价值和动作优势,最后再将其结合为一个Q值。
S6.判断算法是否收敛,若是,系统的吞吐量及通信时延均达到最优,资源分配终止;否则,返回步骤S5。算法收敛的标准为:随着时间t的增加,系统的吞吐量函数值不再增加。
在本实施例中,步骤S3所述的通信时延参数包括传输时延参数和计算时延参数;
1)拜占庭容错协议的请求流程的传输时延参数的表达式为:
其中,表示一个交易的平均大小,U表示基站的总集合;Um表示总集合U中的第m个基站,Bp表示主节点;/>表示为从基站Um到主节点Bp的传输速率;/>表示传输时延参数;
在拜占庭容错协议的请求流程中,主节点Bp验证数量的交易签名和MACs,SB表示区块容量,执行/>数量交易的智能合约,产生计算消耗,计算时延的表达式为:
其中,表示计算消耗,表达式为/>β、θ、g均为参数;
2)预准备流程:请求流程之后,生成新区块,主节点Bp将多播签名区块和预准备信息发送至所有的从节点验证,预准备信息包括主节点ID、主节点签名和新区块的哈希计算结果,拜占庭容错协议的预准备流程的传输时延参数表达式为:
其中,表示拜占庭容错协议预准备流程的传输时延;B表示节点集合;Bn表示从节点;/>表示主节点Bp向从节点发送预准备信息验证的传输速率;
在预准备流程中,主节点Bp需生成一个签名和N-1个MACs,主节点的计算消耗为:从节点的计算消耗为:/>其中Bn≠Bp,拜占庭容错协议的预准备流程的计算时延参数表达式为:/>
其中,表示拜占庭容错协议的预准备流程的计算时延参数;/>表示预准备流程的从节点的计算消耗;
3)准备流程:预准备流程验证新区块之后,每一个从节点Bn发送准备信息至其余从节点Bn′,Bn≠Bn′,也发送准备信息至主节点Bp,准备信息包括从节点ID和从节点签名,在准备流程,传输时延由发送准备信息引起,传输时延参数的表达式为:
其中,表示拜占庭容错协议准备流程的传输时延;/>表示每一个从节点Bn发送准备信息至其余从节点Bn′的传输速率;
主节点Bp验证来自其余从节点Bn′的2f个签名和MACs,主节点Bp计算消耗为每个从节点Bn为准备信息生成一个签名和N-1个MACs,2f个签名和MACs被验证,从节点Bn(Bn≠Bp)的计算消耗/>为/>
准备流程的计算时延参数表达式为:
其中,表示准备流程的计算时延参数;/>表示从节点Bn(Bn≠Bp)的计算消耗;
4)提交流程:每个从节点Bn接收到来自其余从节点Bn′的2f匹配的准备信息包含预准备信息之后,发送提交信息给其余从节点Bn′,也发送提交信息给主节点Bp,提交信息包括从节点的ID及从节点签名;提交流程传递提交信息的传输时延参数的表达式为:
其中,表示提交流程传递提交信息的传输时延;
每个从节点Bn为提交信息生成一个签名和N-1个MACs,在接收到提交信息后,每个从节点Bn验证2f个签名和MACs,每个从节点Bn的计算消耗为:
提交流程的计算时延参数表达式为:
其中,表示提交流程的计算时延;
5)响应流程:提交信息被从节点Bn接收后,新的区块变成合法区块并被加入到区块链中,同时包括有签名、ID及卸载任务的计算结果的响应消息将被传输,响应流程的传输时延的表达式为:
从节点生成个签名和/>个MACs,计算消耗/>表示为主节点验证2f个签名和MACs,计算消耗/>表示为/>响应流程的计算时延/>的表达式为:
在本实施例中,步骤S3所述的即刻奖励获得的条件为:
I.通由变电站形成的分布式系统的信道的资源分配数不超过运营商分配至变电站的规定信道数;
II.区块最终完成时间Tf不超过期望通信最终完成时间Te;
系统所处的下一状态s′通过状态转移概率转换,即刻奖励的表达式为:
其中,Υ表示系统的吞吐量,K表示连续生成的区块数量,SB表示区块容量,T表示时间间隔,表示平均交易大小,Rp,p+1当前主节点和下一主节点之间的传输速率,IB传输过程中丢失的区块。
区块最终完成时间Tf满足:
Tf=Tp+Tc
其中,Tp表示拜占庭容错协议中传输信息所消耗的传输时延;Tc表示拜占庭容错协议中数据信息验证所消耗的计算时延。
在本实施例中,步骤S5所述的系统的吞吐量函数表达式为:
其中,SB表示区块容量;K表示连续生成的区块数量;t表示时间;W为通信信道数量;γ为折扣因子。
在本实施例中,步骤S5所述的深度强化学习的方法满足:
yDouble DQN=r+γQ(s',arg maxQ(s',a;θ);θ-)
其中,yDouble DQN表示目标值即实际值,γ表示折扣因子,s′表示系统的下一状态,a表选取的动作,θ表示主神经网络的参数,θ-表示目标神经网络的参数。
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (8)
1.一种变电站分布式无线网中数据安全和资源分配联合优化方法,其特征在于,所述方法将由变电站形成的分布式系统作为区块链网络,变电站作为区块链网络中的节点,区块链基于拜占庭容错协议达成数据的一致性,所述方法包括:
S1.初始化变电站分布式系统的状态空间、动作空间、各个变电站之间的通信信道状态、各个变电站所配备的服务器的计算资源状态、双重深度Q网络的参数;
S2.将系统所处的当前状态s输入到双重深度Q网络的主网络中,依据当前状态s所采取的资源分配决策输出动作及每个动作对应的Q值,选取最大Q值对应的动作作为当前状态s的动作;
S3.考虑变电站所配备的服务器的计算资源及各个变电站之间的通信信道状态的变化,根据拜占庭容错协议的请求、预准备、准备、提交和响应流程,设计数据达成一致性过程中所消耗的通信时延参数,获得即刻奖励和系统所处的下一状态s′,并存储到经验池中;
S4.判断经验池存储的经验数量是否达到阈值E,若是,执行步骤S5;否则,返回执行步骤S2;
S5.以长期奖励函数最大化即系统的吞吐量函数达到最大化为深度强化学习目标,以设计的数据达成一致性过程中所消耗的通信时延参数为约束条件,基于竞争架构的双重深度Q网络算法,进行深度强化学习;
S6.判断算法是否收敛,若是,系统的吞吐量及通信时延均达到最优,资源分配终止;否则,返回步骤S5。
2.根据权利要求1所述的变电站分布式无线网中数据安全和资源分配联合优化方法,其特征在于,步骤S1所述的各个变电站所配备的服务器的计算资源初始化为服务器标称性能的50%;双重深度Q网络的参数包括权重和偏移,权重按照正态分布初始化,偏移按照0.1的大小初始化。
3.根据权利要求2所述的变电站分布式无线网中数据安全和资源分配联合优化方法,其特征在于,步骤S3所述的通信时延参数包括传输时延参数和计算时延参数;
1)拜占庭容错协议的请求流程的传输时延参数的表达式为:
其中,表示一个交易的平均大小,U表示基站的总集合;Um表示总集合U中的第m个基站,Bp表示主节点;/>表示为从基站Um到主节点Bp的传输速率;
在拜占庭容错协议的请求流程中,主节点Bp验证数量的交易签名和MACs,SB表示区块容量,执行/>数量交易的智能合约,产生计算消耗,主节点Bp在请求流程计算时延的表达式为:
其中,表示主节点在请求流程的计算消耗,表达式为/>β、θ、α为参数;
2)预准备流程:请求流程之后,生成新区块,主节点Bp将多播签名区块和预准备信息发送至所有的从节点验证,预准备信息包括主节点ID、主节点签名和新区块的哈希计算结果,拜占庭容错协议的预准备流程的传输时延参数表达式为:
其中,B表示节点集合;Bn表示第n个从节点;RBp,Bn表示主节点Bp向从节点发送预准备信息验证的传输速率;
在预准备流程中,主节点Bp需生成一个签名和N-1个MACs,主节点在预准备流程的计算消耗为:从节点在预准备流程的计算消耗为:/>其中Bn≠Bp,拜占庭容错协议的预准备流程的计算时延参数表达式为:/>
3)准备流程:预准备流程验证新区块之后,每一个从节点Bn发送准备信息至其余从节点Bn′,Bn≠Bn′,也发送准备信息至主节点Bp,准备信息包括从节点ID和从节点签名,在准备流程,传输时延由发送准备信息引起,在准备流程中的传输时延参数的表达式为:
其中,表示每一个从节点Bn发送准备信息至其余从节点Bn′的传输速率;
主节点Bp验证来自其余从节点Bn′的2f个签名和MACs,主节点Bp在准备流程的计算消耗为/>每个从节点Bn为准备信息生成一个签名和N-1个MACs,2f个签名和MACs被验证,从节点Bn在准备流程的计算消耗/>为/>Bn≠Bp;
准备流程的计算时延参数表达式为:
4)提交流程:每个从节点Bn接收到来自其余从节点Bn′的2f匹配的准备信息包含预准备信息之后,发送提交信息给其余从节点Bn′,也发送提交信息给主节点Bp,提交信息包括从节点的ID及从节点签名;提交流程传递提交信息的传输时延参数的表达式为:
每个从节点Bn为提交信息生成一个签名和N-1个MACs,在接收到提交信息后,每个从节点Bn验证2f个签名和MACs,每个从节点Bn的提交流程的计算消耗为:
提交流程的计算时延参数表达式为:
5)响应流程:提交信息被从节点Bn接收后,新的区块变成合法区块并被加入到区块链中,同时包括有其余从节点Bn′的签名、ID及卸载任务的计算结果的响应消息将被传输,响应流程的传输时延的表达式为:
从节点生成个签名和/>个MACs,从节点在响应流程中计算消耗/>表示为主节点验证2f个签名和MACs,主节点在响应流程中计算消耗/>表示为响应流程的计算时延/>的表达式为:
4.根据权利要求3所述的变电站分布式无线网中数据安全和资源分配联合优化方法,其特征在于,步骤S3所述的即刻奖励获得的条件为:
I.由变电站形成的分布式系统的信道的资源分配数不超过运营商分配至变电站的规定信道数;
II.区块最终完成通信时间Tf不超过期望通信最终完成时间Te。
5.根据权利要求4所述的变电站分布式无线网中数据安全和资源分配联合优化方法,系统所处的下一状态s′通过状态转移概率转换。
6.根据权利要求5所述的变电站分布式无线网中数据安全和资源分配联合优化方法,其特征在于,即刻奖励的表达式为:
其中,γ(SB,K,W)表示系统的吞吐量,K表示连续生成的区块数量,W为通信信道数量,SB表示区块容量,T表示时间间隔,表示平均交易大小,Rp,p+1当前主节点和下一主节点之间的传输速率,IB表示传输过程中丢失的区块。
7.根据权利要求6所述的变电站分布式无线网中数据安全和资源分配联合优化方法,其特征在于,区块最终完成通信时间Tf满足:
Tf=Tp+Tc
其中,Tp表示拜占庭容错协议中传输信息所消耗的传输时延;Tc表示拜占庭容错协议中数据信息验证所消耗的计算时延。
8.根据权利要求1所述的变电站分布式无线网中数据安全和资源分配联合优化方法,其特征在于,算法收敛的标准为:随着时间t的增加,系统的吞吐量函数值不再增加。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010912048.5A CN112148478B (zh) | 2020-09-02 | 2020-09-02 | 变电站分布式无线网中数据安全和资源分配联合优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010912048.5A CN112148478B (zh) | 2020-09-02 | 2020-09-02 | 变电站分布式无线网中数据安全和资源分配联合优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112148478A CN112148478A (zh) | 2020-12-29 |
CN112148478B true CN112148478B (zh) | 2023-09-26 |
Family
ID=73890421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010912048.5A Active CN112148478B (zh) | 2020-09-02 | 2020-09-02 | 变电站分布式无线网中数据安全和资源分配联合优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112148478B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114153640B (zh) * | 2021-11-26 | 2024-05-31 | 哈尔滨工程大学 | 一种基于深度强化学习的系统容错策略方法 |
CN114938374B (zh) * | 2022-05-10 | 2023-05-23 | 北京交通大学 | 跨协议负载均衡方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107111710A (zh) * | 2014-09-13 | 2017-08-29 | 先进元素科技公司 | 用于基于安全和可靠标识的计算的方法和系统 |
AU2017101165A4 (en) * | 2017-08-25 | 2017-11-02 | Liu, Yichen MR | Method of Structural Improvement of Game Training Deep Q-Network |
CN109947740A (zh) * | 2019-01-25 | 2019-06-28 | 北京邮电大学 | 区块链系统的性能优化方法及装置 |
CN111507601A (zh) * | 2020-04-12 | 2020-08-07 | 北京工业大学 | 基于深度强化学习与区块链共识的资源优化分配决策方法 |
CN111612455A (zh) * | 2020-04-21 | 2020-09-01 | 国网江苏省电力有限公司电力科学研究院 | 一种面向用电信息保护的拜占庭容错联盟链共识方法及其系统、存储介质 |
-
2020
- 2020-09-02 CN CN202010912048.5A patent/CN112148478B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107111710A (zh) * | 2014-09-13 | 2017-08-29 | 先进元素科技公司 | 用于基于安全和可靠标识的计算的方法和系统 |
AU2017101165A4 (en) * | 2017-08-25 | 2017-11-02 | Liu, Yichen MR | Method of Structural Improvement of Game Training Deep Q-Network |
CN109947740A (zh) * | 2019-01-25 | 2019-06-28 | 北京邮电大学 | 区块链系统的性能优化方法及装置 |
CN111507601A (zh) * | 2020-04-12 | 2020-08-07 | 北京工业大学 | 基于深度强化学习与区块链共识的资源优化分配决策方法 |
CN111612455A (zh) * | 2020-04-21 | 2020-09-01 | 国网江苏省电力有限公司电力科学研究院 | 一种面向用电信息保护的拜占庭容错联盟链共识方法及其系统、存储介质 |
Non-Patent Citations (2)
Title |
---|
Cooperative Computation Offloading and Resource Allocation for Blockchain-Enabled Mobile Edge Computing: A Deep Reinforcement Learning Approach;Jie Feng et.al;《IEEE Internet of Things Journal》;20191231;第1-15页 * |
基于深度强化学习的移动边缘计算中的计算卸载与资源分配算法研究与实现;李季;《中国优秀硕士学位论文全文数据库信息科技辑》;20190915(第9期);第I136-495页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112148478A (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113296845B (zh) | 一种边缘计算环境下基于深度强化学习的多小区任务卸载算法 | |
Chen et al. | Federated learning over wireless IoT networks with optimized communication and resources | |
CN111314889B (zh) | 车联网中基于移动边缘计算的任务卸载与资源分配方法 | |
CN111132175B (zh) | 一种协同计算卸载和资源分配方法及应用 | |
US12035380B2 (en) | Industrial 5G dynamic multi-priority multi-access method based on deep reinforcement learning | |
CN112148478B (zh) | 变电站分布式无线网中数据安全和资源分配联合优化方法 | |
CN107370802A (zh) | 一种基于交替方向乘子法的协同存储调度方法 | |
CN111629380A (zh) | 面向高并发多业务工业5g网络的动态资源分配方法 | |
CN108900237A (zh) | 一种多波束卫星通信系统资源分配方法 | |
CN111556089A (zh) | 基于使能区块链移动边缘计算系统的资源联合优化方法 | |
CN101207601A (zh) | 基于博弈论的ofdm比特功率分配方法与系统 | |
CN110707691B (zh) | 一种基于用户的分布式智能电网监控系统的控制方法 | |
CN102523585A (zh) | 基于改进遗传算法的认知无线电方法 | |
CN104869646B (zh) | 异构无线网络中能量有效的资源分配方法 | |
CN112115505A (zh) | 基于移动边缘计算和区块链技术的新能源汽车充电站计费数据传输方法 | |
CN116089091A (zh) | 基于物联网边缘计算的资源分配和任务卸载方法 | |
Dou et al. | Mobile edge computing based task offloading and resource allocation in smart grid | |
CN104540203A (zh) | 基于独立集的无线体域网能效优化方法 | |
Zhang et al. | Transaction transmission model for blockchain channels based on non-cooperative games | |
Zhang et al. | An efficient and reliable byzantine fault tolerant blockchain consensus protocol for single-hop wireless networks | |
CN111885551B (zh) | 基于边云协同模式的多移动社交网络中高影响力用户的选择和分配机制 | |
CN117440518A (zh) | 一种配电通信网的资源分配方法及相关组件 | |
CN104410976B (zh) | 一种分布式端到端用户和蜂窝网络用户关联及时间分配方法 | |
CN114567909A (zh) | 一种联合优化计算卸载和资源分配的方法及系统 | |
CN109150739B (zh) | 一种基于moea/d的多目标基站主动存储分配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |