CN115550236B - 一种面向安全中台资源池路由优化的数据保护方法 - Google Patents
一种面向安全中台资源池路由优化的数据保护方法 Download PDFInfo
- Publication number
- CN115550236B CN115550236B CN202211052272.7A CN202211052272A CN115550236B CN 115550236 B CN115550236 B CN 115550236B CN 202211052272 A CN202211052272 A CN 202211052272A CN 115550236 B CN115550236 B CN 115550236B
- Authority
- CN
- China
- Prior art keywords
- user
- security
- virtual machine
- rewards
- job
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000005457 optimization Methods 0.000 title claims description 20
- 230000007246 mechanism Effects 0.000 claims abstract description 18
- 230000002787 reinforcement Effects 0.000 claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 238000011176 pooling Methods 0.000 claims abstract description 5
- 230000009471 action Effects 0.000 claims description 18
- 230000006399 behavior Effects 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 14
- 238000004904 shortening Methods 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000011161 development Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims 1
- 230000002776 aggregation Effects 0.000 description 6
- 238000004220 aggregation Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/14—Routing performance; Theoretical aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/008—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2209/00—Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
- H04L2209/46—Secure multiparty computation, e.g. millionaire problem
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种面向安全中台资源池路由优化的数据保护方法,首先,本发明从数据安全角度对安全中台进行完整细致的建模,对于安全中台进行资源池化和云部署,并通过自适应注意力机制的DQN深度强化学习算法优化路由,优化云中台的资源调度以达到数据保护的目的,同时在中台与前台间使用安全多方计算来进一步保证用户隐私不会受到推理攻击,保证用户的身份隐私不泄露,本发明重视中台设计和资源池化,降低底层业务的相关性,提高了资源的重用率,并将中台发布到云端,进一步降低成本,提高稳定性、易用性、分布式特性,立足并强化了数据保护,极大规避了有可能会遇到的数据安全问题。同时立足于现有的基础,无需大量额外投入,可行性很高。
Description
技术领域
本发明属于电力信息安全技术领域,特别涉及一种面向安全中台资源池路由优化的数据保护方法。
背景技术
近些年来,用户对信息安全和隐私保护的要求越来越高,而且随着用户基数和用电量的不断提升,为了应对用户需求,安全服务的数量和质量要求越来越高,供应商总是需要很多重复的底层开发,因此提出了安全中台的概念,封装重复的开发,通过调用开放接口,避免底层冗余的软件和硬件配置。但是安全中台并不完备,尤其是将安全中台发布到云端,有很多问题亟待改进,云计算的被人们发现巨大隐患在于隐私保护和数据安全。
发明内容
本发明的目的在于提供一种面向安全中台资源池路由优化的数据保护方法,针对安全中台资源池,采用自适应注意力机制的DQN深度强化学习的算法通过优化路由来优化云中台的资源调度进而实现数据保护,并根据用户需求满足个性化偏好,同时在中台与前台间使用安全多方计算来进一步保证用户隐私不会受到推理攻击,保证用户的身份隐私不泄露。
一种面向安全中台资源池路由优化的数据保护方法,包括如下步骤:
步骤1:网络安全设备硬件与软件,从云中台的角度出发,定义、重构、部署,虚拟化,中台资源池化、封装化形成安全共享中台;
步骤2:中台资源池封装,脱敏,大中台小前台,要方便调用还要尽可能避免中台资源在后续部署实施阶段可能出现的死锁及各种问题,使中间层满足设备无关性,能兼容的迁移到各种服务器上;
步骤3:将中台资源池中的资源部署到云端,主要为异地部署的商业服务器,也包括出于隐私保护和数据保护考虑的专用安全服务器,这些部署在不同服务器上具有不同功能的虚拟机是主要的硬件部分,也是数据流量转发接受的直接工作者;
步骤4:采用自适应注意力机制的DQN深度强化学习算法通过优化路由来优化云中台的资源调度,对云中台资源池中携带位置信息的安全虚拟机与前台业务要求进行训练,以通过减少数据的转发次数、缩短传输路径来实现数据保护为主要优化目标,以降低成本、负载均衡、缩短响应时间为次要优化目标;
步骤5:安全中台建立在包括各种基础设施及各级软件在内的网络安全研发平台之上的由安全共享中台、云中台资源池、调度器、用户行为分析器、监视器及相关组件组成,封装对前台开发人员显示为统一的开放API,用户和开发人员无需知道任何中台的详细信息就可以友好的使用功能;
步骤6:用户通过前端编辑的友好的可视化界面,与底层网络安全设备进行交互,用户只关心自己的信息安全和以请求快速响应为主的用户体验,为了进一步保证用户隐私,采用安全多方计算,对同区域的用户进行分组,并对用户敏感的位置信息进行清洗,从用户源头确保身份隐私不泄露。
所述云中台的部署虚拟机,由于用户基数越来越大,以及价格及响应时间的考虑,往往是异地部署,甚至不同城市部署,因此不同节点间的数据转发要比传统非云端部署非中台架构多得多,数据转发次数越多,数据传输路径越远,信息窃取、泄露、被嗅探、被篡改等等安全事故发生的可能性就越高,用户并不关心企业为了效率和成本等考量而选择云中台,只关心从传统到云中台重构自己需要面对直线上升的安全威胁,因此,数据保护对用户来说是非常重要的,在源头到传输过程再到接收方,通过减少转发次数和降低传输距离,进行数据保护能明显降低安全威胁发生的概率,同时能根据用户需求满足其它个性化偏好。
采用自适应注意力机制的DQN深度强化学习算法通过优化路由来优化云中台的资源调度,步骤如下:
步骤4.1:用户提交的需求表示为Ji={JID,Jat,Jt,Jl,Jq,Ja},分别意味着作业ID,作业到达时间,作业类型,作业长度,服务质量要求,位置信息,执行的虚拟机表示为VMj={VMid,VMt,VMp,P,VMa},分别意味着虚拟机ID,虚拟机类型,虚拟机处理速度,价格,位置;
步骤4.2:定义并计算路由转发次数f,设计定义路由次数的奖励函数同等距离l,转发次数越多奖励越少,同等转发次数f,传输距离越远奖励越高,服务质量作业响应时间的奖励/>其中Jl是作业长度,Jrt是作业响应时间,Vp是虚拟机执行速度,Jq是服务质量要求,价格奖励/>其中Vp是虚拟机执行速度,Jl是作业长度,P是作业开销;
步骤4.3:虚拟机监视器收集虚拟机信息,用户监视器收集用户(自愿提供的)请求信息,以供调度器统一调度,用户行为分析器收集用户行为偏好,并对其进行自适应的注意力得分计算;
步骤4.4:用户行为分析器根据计算得出的注意力得分W={w1,w2,w3,w4},对DRL的奖励各部分的权重W进行比例运算,按用户和运营商的需求得出适合的R计算权重,将各个R加权求和R=∑wiRi,i={1,2,3};
步骤4.5:将所有虚拟机的编号合并作为动作空间A={VM1,VM2,VM3…}来选择调度,虚拟机状态和用户需求状态统一作为自适应注意力机制的DQN深度强化学习的状态空间S={Sjob∪SVM},Sjob是当前时刻的所有作业的状态集合,SVM是候选虚拟机的状态集合;
步骤4.6:用Q(s,a)来评估当前选择的好与坏,s是当前状态,a是可选动作,不同于Q学习从一张表格中取得,DQL的Q值从DNN深度神经网络中获得,选择能持续提供累计Q值的动作作为目标策略P=p(st+1|st;at),将轨迹以(St,At,Rt+1,St+1)形式存储起来,序列含义为t时间状态St和动作At,t+1时间奖励Rt+1和状态St+1,采样回放机制从中随机取出多条经验,完成从t时刻到t+1时刻的状态转移;
步骤4.7:通过奖励函数r来估计Q值,有折扣率γ的W权重的奖励r累加来确定回报R=∑Wγnr,含义为从现在到本次迭代结束所有的奖励加权折扣累加,选择回报R最大作为目标策略,R由多个部分一起组成,确定了所有DQL需要的马尔可夫MDP(S,A,D,P,R),即状态、动作、策略、奖励、回报。用时序差分法的梯度下降策略进行训练,迭代更新神经网络参数θ,使得损失函数Loss=(r+γmaxQ′(s,a′)-Q(s,a))2梯度下降到最小来完成收敛,目标maxQ′(s,a′)值是根据当前状态s采取预测动作a′得到的预测值,Q(s,a)是实际上执行a得到的预测值;
步骤4.8:中台供应商的DRL调度器通过自适应注意力机制的DQN深度强化学习的算法,以通过减少数据的转发次数、缩短传输路径来实现数据保护为主要优化目标,以降低成本、负载均衡、缩短响应时间为次要优化目标,对监视器收集来的信息进行训练。
所述安全多方计算:
以同一组的几个用户为例,来说明算法的运行(转发次数,敏感位置信息),常规方法直接上传后如果遭到了信息泄露,攻击方可以直接根据这个数据对推测出用户身份和各种其他信息。安全多方计算步骤如下:
步骤6.1:使用同态加密的算法生成秘密,将数据对扩张,在本地进行数据拆分;
步骤6.2:秘密共享,将拆分后的数据,同组用户终端间互相发送;
步骤6.3:局部聚合,同组用户终端彼此接收其它代理发来的重新生成的数据对,同态解密,与自己未发送的数据对进行局部聚合,形成新的无身份特征的数据对;
步骤6.4:各个同组用户终端将局部聚合后的消除了身份特征和语义的聚合结果发送给中台可信任接入网关。
与现有技术相比,本发明的有益效果是:
1)首先,本发明从数据安全角度对安全中台进行完整细致的建模,对于安全中台进行资源池化和云部署,并通过自适应注意力机制的DQN深度强化学习算法优化路由,优化云中台的资源调度以达到数据保护的目的,同时能根据用户需求满足其它个性化偏好。
2)不同于传统的只注重封装和调用的中台模型,本发明从语义角度出发,用安全多方计算,隔绝用户行为和安全中台间的关系,实现了对于用户敏感信息的隐私保护,保证用户的匿名性,强化中台前台的分布式特性并保证其数据安全和不可篡改。
3)本发明契合大中台小前台的号召,重视中台设计和资源池化,降低底层业务的相关性,提高了资源的重用率,并将中台发布到云端,进一步降低成本,提高稳定性、易用性、分布式特性,立足并强化了数据保护,极大规避了有可能会遇到的数据安全问题。同时立足于现有的基础,无需大量额外投入,可行性很高。
附图说明
图1是本发明提供的安全中台资源池路由优化的数据保护方法的整体架构图;
图2是本发明提供的安全中台资源池路由优化自适应注意力机制的DQN深度强化学习流程图;
图3是本发明提供的前台用户设备安全多方计算的隐私保护方法图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步说明。
如图1所示,网络安全设备硬件与软件,从云中台的角度出发,定义、重构、部署,虚拟化,中台资源池化、封装化形成安全共享中台。
中台资源池封装,脱敏,大中台小前台,要方便调用还要尽可能避免中台资源在后续部署实施阶段可能出现的死锁及各种问题,使中间层满足设备无关性,能兼容的迁移到各种服务器上。
将中台资源池中的资源部署到云端,主要为异地部署的商业服务器,也包括出于隐私保护和数据保护考虑的专用安全服务器,这些部署在不同服务器上具有不同功能的虚拟机是主要的硬件部分,也是数据流量转发接受的直接工作者。
而云中台的部署虚拟机,由于用户基数越来越大,以及价格及响应时间的考虑,往往是异地部署,甚至不同城市部署,因此不同节点间的数据转发要比传统非云端部署非中台架构多得多,数据转发次数越多,数据传输路径越远,信息窃取、泄露、被嗅探、被篡改等等安全事故发生的可能性就越高,用户并不关心企业为了效率和成本等考量而选择云中台,只关心从传统到云中台重构自己需要面对直线上升的安全威胁,因此,数据保护对用户来说是非常重要的,在源头到传输过程再到接收方,通过减少转发次数和降低传输距离,进行数据保护能明显降低安全威胁发生的概率。
通过自适应注意力机制的DQN深度强化学习算法,对云中台资源池中携带位置信息的安全虚拟机与前台业务要求进行训练,以通过减少数据的转发次数、缩短传输路径来实现数据保护为主要优化目标,以降低成本、负载均衡、缩短响应时间为次要优化目标。
采用自适应注意力机制的DQN深度强化学习算法通过优化路由来优化云中台的资源调度,如图2所示,步骤如下:
步骤1:用户提交的需求表示为Ji={JID,Jat,Jt,Jl,Jq,Ja},分别意味着作业ID,作业到达时间,作业类型,作业长度,服务质量要求,位置信息,执行的虚拟机表示为VMj={VMid,VMt,VMp,P,VMa},分别意味着虚拟机ID,虚拟机类型,虚拟机处理速度,价格,位置;
步骤2:定义并计算路由转发次数f,设计定义路由次数的奖励函数同等距离l,转发次数越多奖励越少,同等转发次数f,传输距离越远奖励越高,服务质量作业响应时间的奖励/>其中Jl是作业长度,Jrt是作业响应时间,Vp是虚拟机执行速度,Jq是服务质量要求,价格奖励/>其中Vp是虚拟机执行速度,Jl是作业长度,P是作业开销;
步骤3:虚拟机监视器收集虚拟机信息,用户监视器收集用户(自愿提供的)请求信息,以供调度器统一调度,用户行为分析器收集用户行为偏好,并对其进行自适应的注意力得分计算;
步骤4:用户行为分析器根据计算得出的注意力得分W={w1,w2,w3,w4},对DRL的奖励各部分的权重W进行比例运算,按用户和运营商的需求得出适合的R计算权重,将各个R加权求和R=∑wiRi,i={1,2,3};
步骤5:将所有虚拟机的编号合并作为动作空间A={VM1,VM2,VM3…}来选择调度,虚拟机状态和用户需求状态统一作为自适应注意力机制的DQN深度强化学习的状态空间S={Sjob∪SVM},Sjob是当前时刻的所有作业的状态集合,SVM是候选虚拟机的状态集合;
步骤6:用Q(s,a)来评估当前选择的好与坏,s是当前状态,a是可选动作,不同于Q学习从一张表格中取得,DQL的Q值从DNN深度神经网络中获得,选择能持续提供累计Q值的动作作为目标策略P=p(st+1|st;at),将轨迹以(St,At,Rt+1,St+1)形式存储起来,序列含义为t时间状态St和动作At,t+1时间奖励Rt+1和状态St+1,采样回放机制从中随机取出多条经验,完成从t时刻到t+1时刻的状态转移;
步骤7:通过奖励函数r来估计Q值,有折扣率γ的W权重的奖励r累加来确定回报R=∑Wγnr,含义为从现在到本次迭代结束所有的奖励加权折扣累加,选择回报R最大作为目标策略,R由多个部分一起组成,确定了所有DQL需要的马尔可夫MDP(S,A,D,P,R),即状态、动作、策略、奖励、回报。用时序差分法的梯度下降策略进行训练,迭代更新神经网络参数θ,使得损失函数Loss=(r+γmaxQ′(s,a′)-Q(s,a))2梯度下降到最小来完成收敛,目标maxQ′(s,a′)值是根据当前状态s采取预测动作a′得到的预测值,Q(s,a)是实际上执行a得到的预测值;
步骤8:中台供应商的DRL调度器通过自适应注意力机制的DQN深度强化学习的算法,以通过减少数据的转发次数、缩短传输路径来实现数据保护为主要优化目标,以降低成本、负载均衡、缩短响应时间为次要优化目标,对监视器收集来的信息进行训练。
安全中台建立在包括各种基础设施及各级软件在内的网络安全研发平台之上的由安全共享中台、云中台资源池、用户行为分析器、调度器、监视器及相关组件组成,封装对前台开发人员显示为统一的开放API,用户和开发人员无需知道任何中台的详细信息就可以友好的使用功能。
用户通过前端编辑的友好的可视化界面,与底层网络安全设备进行交互,用户只关心自己的信息安全和以请求快速响应为主的用户体验,为了进一步保证用户隐私,采用安全多方计算,对同区域的用户进行分组,并对用户敏感的位置信息进行清洗,从用户源头确保身份隐私不泄露。
采用的安全多方计算,如图3所示,步骤如下:
以同一组的几个用户为例,来说明算法的运行(转发次数,敏感位置信息),常规方法直接上传后如果遭到了信息泄露,攻击方可以直接根据这个数据对推测出用户身份和种种其他信息。安全多方计算步骤如下:
步骤1:使用同态加密的算法生成秘密,将数据对扩张,在本地进行数据拆分;
步骤2:秘密共享,将拆分后的数据,同组用户终端间互相发送;
步骤3:局部聚合,同组用户终端彼此接收其它代理发来的重新生成的数据对,同态解密,与自己未发送的数据对进行局部聚合,形成新的无身份特征的数据对;
步骤4:各个同组用户终端将局部聚合后的消除了身份特征和语义的聚合结果发送给中台可信任接入网关。
以上所述仅表达了本发明的优选实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形、改进及替代,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (1)
1.一种面向安全中台资源池路由优化的数据保护方法,其特征在于:包括如下步骤:
步骤1:网络安全设备硬件与软件部署在云中台,分别在重构层面、部署层面、虚拟化层面、中台资源池化层面,封装形成安全共享中台;
步骤2:中台资源池封装,脱敏,大中台小前台,要方便调用还要避免中台资源在后续部署实施阶段出现的死锁问题,使中间层满足设备无关性,能兼容的迁移到各种服务器上;
步骤3:将中台资源池中的资源部署到云端,主要为异地部署的商业服务器,也包括出于隐私保护和数据保护考虑的专用安全服务器,这些部署在不同服务器上具有不同功能的虚拟机是主要的硬件部分,也是数据流量转发接受的直接工作者;
步骤4:采用自适应注意力机制的DQN深度强化学习算法通过优化路由来优化云中台的资源调度,对云中台资源池中携带位置信息的安全虚拟机与前台业务要求进行训练,以通过减少数据的转发次数、缩短传输路径来实现数据保护为主要优化目标,以降低成本、负载均衡、缩短响应时间为次要优化目标;
步骤5:安全中台建立在包括基础设施及软件在内的网络安全研发平台之上的由安全共享中台、云中台资源池、用户行为分析器、调度器组成,封装对前台开发人员显示为统一的开放API,用户和开发人员无需知道任何中台的详细信息就可以友好的使用功能;
步骤6:用户通过前端编辑的友好的可视化界面,与底层网络安全设备进行交互,为了进一步保证用户隐私,采用安全多方计算,对同区域的用户进行分组,并对用户敏感的位置信息进行清洗,从用户源头确保身份隐私不泄露;
所述步骤4中,采用自适应注意力机制的DQN深度强化学习算法通过优化路由来优化云中台的资源调度,步骤如下:
步骤4.1:用户提交的需求表示为Ji={JID,Jat,Jt,Jl,Jq,Ja},分别意味着作业ID,作业到达时间,作业类型,作业长度,服务质量要求,位置信息,执行的虚拟机表示为VMj={VMid,VMt,VMp,P,VMa},分别意味着虚拟机ID,虚拟机类型,虚拟机处理速度,价格,位置;
步骤4.2:定义并计算路由转发次数f,设计定义路由次数的奖励函数同等距离I,转发次数越多奖励越少,同等转发次数f,传输距离越远奖励越高,服务质量作业响应时间的奖励/>其中JI是作业长度,Jrt是作业响应时间,Vp是虚拟机执行速度,Jq是服务质量要求,价格奖励/>其中Vp是虚拟机执行速度,JI是作业长度,JP是作业开销;
步骤4.3:虚拟机监视器收集虚拟机信息,用户监视器收集用户请求信息,以供调度器统一调度,用户行为分析器收集用户行为偏好,并对其进行自适应的注意力得分计算;
步骤4.4:用户行为分析器根据计算得出的注意力得分W={w1,w2,w3,wa},对DRL的奖励各部分的权重进行比例运算,按用户和运营商的需求得出适合的R计算权重,将各个R加权求和R=∑wiRi,i={1,2,3};
步骤4.5:将所有虚拟机的编号合并作为动作空间A={VM1,VM2,VM3...}来选择调度,虚拟机状态和用户需求状态统一作为自适应注意力机制的DQN深度强化学习的状态空间S={Sjob∪SVM},Sjob是当前时刻的所有作业的状态集合,SVM是候选虚拟机的状态集合;
步骤4.6:用Q(s,a)来评估当前选择的好与坏,s是当前状态,a是可选动作,不同于Q学习从一张表格中取得,DQL的Q值从DNN深度神经网络中获得,选择能持续提供累计Q值的动作作为目标策略Pc=p(st+1|st;at),将轨迹以(St,At,Rt+1,St+1)形式存储起来,序列含义为t时间状态St和动作At,t+1时间奖励Rt+1和状态St+1,采样回放机制从中随机取出多条经验,完成从t时刻到t+1时刻的状态转移;
步骤4.7:通过奖励函数R来估计Q值,有折扣率γ的权重的奖励R累加来确定回报Return=∑WγnR,含义为从现在到本次迭代结束所有的奖励加权折扣累加,选择回报Retum最大作为目标策略,R由多个部分一起组成,确定了所有DQL需要的马尔可夫集合:状态、动作、策略、奖励、回报;用时序差分法的梯度下降策略进行训练,迭代更新神经网络参数θ,使得损失函数Loss=(R+γmax Q′(s,a′)-Q(s,a))2梯度下降到最小来完成收敛,目标maxQ′(s,a′)值是根据当前状态s采取预测动作a′得到的预测值,Q(s,a)是实际上执行a得到的预测值;
步骤4.8:中台供应商的DRL调度器通过自适应注意力机制的DQN深度强化学习的算法,以通过减少数据的转发次数、缩短传输路径来实现数据保护为主要优化目标,以降低成本、负载均衡、缩短响应时间为次要优化目标,对监视器收集来的信息进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211052272.7A CN115550236B (zh) | 2022-08-31 | 2022-08-31 | 一种面向安全中台资源池路由优化的数据保护方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211052272.7A CN115550236B (zh) | 2022-08-31 | 2022-08-31 | 一种面向安全中台资源池路由优化的数据保护方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115550236A CN115550236A (zh) | 2022-12-30 |
CN115550236B true CN115550236B (zh) | 2024-04-30 |
Family
ID=84725700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211052272.7A Active CN115550236B (zh) | 2022-08-31 | 2022-08-31 | 一种面向安全中台资源池路由优化的数据保护方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115550236B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115878295B (zh) * | 2023-03-02 | 2023-05-30 | 国网江西省电力有限公司信息通信分公司 | 基于深度强化学习的软件定义安全中台调度方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109936628A (zh) * | 2019-02-25 | 2019-06-25 | 南京世界村云数据产业集团有限公司 | 一种数据中心云平台构架 |
CN110986979A (zh) * | 2019-11-27 | 2020-04-10 | 浙江工商大学 | 一种基于强化学习的sdn多路径路由规划方法 |
CN111143036A (zh) * | 2019-12-31 | 2020-05-12 | 广东省电信规划设计院有限公司 | 一种基于强化学习的虚拟机资源调度方法 |
CN112101729A (zh) * | 2020-08-18 | 2020-12-18 | 华南理工大学 | 一种基于深度双q学习的移动边缘计算系统能源分配方法 |
CN112241543A (zh) * | 2020-10-27 | 2021-01-19 | 国网福建省电力有限公司信息通信分公司 | 一种基于数据中台的敏感数据梳理方法 |
JP2021034050A (ja) * | 2019-08-21 | 2021-03-01 | 哈爾浜工程大学 | 強化学習に基づくauv行動計画及び動作制御方法 |
CN112580914A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 汇集多源数据的企业级数据中台系统的实现方法及装置 |
CN112612481A (zh) * | 2020-12-23 | 2021-04-06 | 江苏苏州农村商业银行股份有限公司 | 一种智能中台的系统架构 |
WO2021069309A1 (en) * | 2019-10-10 | 2021-04-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Reinforcement learning systems for controlling wireless communication networks |
CN112764905A (zh) * | 2021-01-25 | 2021-05-07 | 江苏赞奇科技股份有限公司 | 一种基于软件定义的云渲染系统的能源管理方法 |
CN113239392A (zh) * | 2021-04-02 | 2021-08-10 | 国网福建省电力有限公司信息通信分公司 | 一种基于数据中台敏感数据脱敏方法 |
CN113254197A (zh) * | 2021-04-30 | 2021-08-13 | 西安电子科技大学 | 一种基于深度强化学习的网络资源调度方法及系统 |
CN113673857A (zh) * | 2021-08-13 | 2021-11-19 | 南京理工大学 | 一种面向数据中台的服务感知与资源调度系统及方法 |
WO2022084952A1 (en) * | 2020-10-23 | 2022-04-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Qos aware reinforcement learning prevention intrusion system |
CN114741060A (zh) * | 2022-06-13 | 2022-07-12 | 浪潮通信技术有限公司 | 基于中台的业务系统开发方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11393250B2 (en) * | 2020-06-21 | 2022-07-19 | Actimize Ltd. | Sentiment analysis of content using expression recognition |
-
2022
- 2022-08-31 CN CN202211052272.7A patent/CN115550236B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109936628A (zh) * | 2019-02-25 | 2019-06-25 | 南京世界村云数据产业集团有限公司 | 一种数据中心云平台构架 |
JP2021034050A (ja) * | 2019-08-21 | 2021-03-01 | 哈爾浜工程大学 | 強化学習に基づくauv行動計画及び動作制御方法 |
CN112580914A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 汇集多源数据的企业级数据中台系统的实现方法及装置 |
WO2021069309A1 (en) * | 2019-10-10 | 2021-04-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Reinforcement learning systems for controlling wireless communication networks |
CN110986979A (zh) * | 2019-11-27 | 2020-04-10 | 浙江工商大学 | 一种基于强化学习的sdn多路径路由规划方法 |
CN111143036A (zh) * | 2019-12-31 | 2020-05-12 | 广东省电信规划设计院有限公司 | 一种基于强化学习的虚拟机资源调度方法 |
CN112101729A (zh) * | 2020-08-18 | 2020-12-18 | 华南理工大学 | 一种基于深度双q学习的移动边缘计算系统能源分配方法 |
WO2022084952A1 (en) * | 2020-10-23 | 2022-04-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Qos aware reinforcement learning prevention intrusion system |
CN112241543A (zh) * | 2020-10-27 | 2021-01-19 | 国网福建省电力有限公司信息通信分公司 | 一种基于数据中台的敏感数据梳理方法 |
CN112612481A (zh) * | 2020-12-23 | 2021-04-06 | 江苏苏州农村商业银行股份有限公司 | 一种智能中台的系统架构 |
CN112764905A (zh) * | 2021-01-25 | 2021-05-07 | 江苏赞奇科技股份有限公司 | 一种基于软件定义的云渲染系统的能源管理方法 |
CN113239392A (zh) * | 2021-04-02 | 2021-08-10 | 国网福建省电力有限公司信息通信分公司 | 一种基于数据中台敏感数据脱敏方法 |
CN113254197A (zh) * | 2021-04-30 | 2021-08-13 | 西安电子科技大学 | 一种基于深度强化学习的网络资源调度方法及系统 |
CN113673857A (zh) * | 2021-08-13 | 2021-11-19 | 南京理工大学 | 一种面向数据中台的服务感知与资源调度系统及方法 |
CN114741060A (zh) * | 2022-06-13 | 2022-07-12 | 浪潮通信技术有限公司 | 基于中台的业务系统开发方法及装置 |
Non-Patent Citations (3)
Title |
---|
大数据架构剖析及数据安全融合技术;刘晓军;武娟;徐晓青;;电信科学(第07期);全文 * |
数据中台技术相关进展及发展趋势;苏萌;贾喜顺;杜晓梦;高体伟;;数据与计算发展前沿(第05期);全文 * |
面向电力物联网新业务的电力通信网需求及发展趋势;刘林等;电网技术;第44卷(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115550236A (zh) | 2022-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Haibeh et al. | A survey on mobile edge computing infrastructure: Design, resource management, and optimization approaches | |
Toczé et al. | A taxonomy for management and optimization of multiple resources in edge computing | |
Islam et al. | Mobile cloud-based big healthcare data processing in smart cities | |
Luo et al. | Resource scheduling in edge computing: A survey | |
Qiu et al. | Networking integrated cloud–edge–end in IoT: A blockchain-assisted collective Q-learning approach | |
Sun et al. | Cooperative task scheduling for computation offloading in vehicular cloud | |
Zhao et al. | Optimal placement of virtual machines for supporting multiple applications in mobile edge networks | |
Enayet et al. | A mobility-aware optimal resource allocation architecture for big data task execution on mobile cloud in smart cities | |
Miao et al. | Balancing quality and budget considerations in mobile crowdsourcing | |
Ali et al. | A volunteer-supported fog computing environment for delay-sensitive IoT applications | |
Zhu et al. | Energy-efficient deep reinforced traffic grooming in elastic optical networks for cloud–fog computing | |
Deng et al. | A multi-hop VANETs-assisted offloading strategy in vehicular mobile edge computing | |
CN108009028A (zh) | 消息处理方法、装置、设备及计算机可读存储介质 | |
CN108170530B (zh) | 一种基于混合元启发式算法的Hadoop负载均衡任务调度方法 | |
Qu et al. | ChainFL: A simulation platform for joint federated learning and blockchain in edge/cloud computing environments | |
CN115550236B (zh) | 一种面向安全中台资源池路由优化的数据保护方法 | |
CN103927216A (zh) | 用于管理虚拟装置的方法和系统 | |
Huang et al. | A vehicle-assisted data offloading in mobile edge computing enabled vehicular networks | |
Gonçalves et al. | Dynamic network slicing in fog computing for mobile users in mobfogsim | |
Khan et al. | A cache‐based approach toward improved scheduling in fog computing | |
Meneguette et al. | A virtual machine migration policy based on multiple attribute decision in vehicular cloud scenario | |
Deb et al. | DEFT: Decentralized multiuser computation offloading in a fog-enabled IoV environment | |
Meneguette et al. | An efficient green-aware architecture for virtual machine migration in sustainable vehicular clouds | |
Li et al. | A novel genetic service function deployment management platform for edge computing | |
Liu et al. | Learning based fluctuation-aware computation offloading for vehicular edge computing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |