CN113326002A - 基于计算迁移的云边协同控制系统及迁移决策生成方法 - Google Patents

基于计算迁移的云边协同控制系统及迁移决策生成方法 Download PDF

Info

Publication number
CN113326002A
CN113326002A CN202110561206.1A CN202110561206A CN113326002A CN 113326002 A CN113326002 A CN 113326002A CN 202110561206 A CN202110561206 A CN 202110561206A CN 113326002 A CN113326002 A CN 113326002A
Authority
CN
China
Prior art keywords
terminal
edge node
edge
computing
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110561206.1A
Other languages
English (en)
Inventor
胡伟
郭秋婷
苏雪源
马坤
刘文亮
陈行滨
林日晖
熊军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
State Grid Corp of China SGCC
Xiamen Power Supply Co of State Grid Fujian Electric Power Co Ltd
Original Assignee
Tsinghua University
State Grid Corp of China SGCC
Xiamen Power Supply Co of State Grid Fujian Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, State Grid Corp of China SGCC, Xiamen Power Supply Co of State Grid Fujian Electric Power Co Ltd filed Critical Tsinghua University
Priority to CN202110561206.1A priority Critical patent/CN113326002A/zh
Publication of CN113326002A publication Critical patent/CN113326002A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Human Computer Interaction (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提出一种基于计算迁移的云边协同控制系统及迁移决策生成方法,属于电力系统运行调度领域。该系统包括:云端、由多个边缘节点构成的边缘计算中心以及多个终端;其中,各终端采集电力系统各环节的数据,当计算任务超出本地计算能力时,终端向对应的边缘节点发送计算请求;各边缘节点接收请求后,各边缘节点上传自身带宽和计算资源的分配情况的状态信息至云端,云端计算得到最优的迁移决策并逐层下发;之后各终端按照该决策上传计算任务的数据至对应边缘节点,并从边缘节点接收计算的结果。本发明可有效调配电力系统不同层级的数据存储能力与计算能力,对于电力系统运行调度指令高效传输以及电力系统优化分级调度具有重要意义。

Description

基于计算迁移的云边协同控制系统及迁移决策生成方法
技术领域
本发明属于电力系统运行调度领域,特别涉及一种基于计算迁移的云边协同控制系统及迁移决策生成方法。
背景技术
随着信息通信技术(Information and Communication Technology,ICT)的跨越式发展,电力大数据检测技术在电力行业领域的应用愈发广泛。一方面借助大量传感设备和复杂通信网络使电网变成了能够实时感知、动态控制和进行信息查询的多维异构复杂网络;另一方面,其海量外部数据能影响电力系统的控制决策,增加了运行和控制的复杂性。因此,亟待开发全新技术手段解决ICT革新所来的问题。
从数据层面,检测大数据涵盖了用户侧供需数据、各营业网点营业报表数据、终端设备维护数据、电网调度运行数据等多源异构数据源,各层级数据分析、存储、处理能力差距明显。对于不同层级的数据存储能力与计算能力调配也成为了重要关切。
已有的电力系统领域云边协同系统研究大多集中于系统整体运行框架设计,形成了云边系统理论性整体架构,但是云边协同系统落地的重要依托是对于上下行数据传输的调度,由此才能实现对于电力系统整体的高效运行调度控制。但是现有电力领域云边协同技术研究对于系统内不同层级间的数据传输效率,存储方式,计算能力调配研究不足,解决上述问题对于电力系统运行调度指令高效传输以及电力系统优化分级调度具有重要意义。
发明内容
本发明的目的是为克服已有技术的不足之处,提出一种基于计算迁移的云边协同控制系统及迁移决策生成方法。本发明可有效调配电力系统不同层级的数据存储能力与计算能力,对于电力系统运行调度指令高效传输以及电力系统优化分级调度具有重要意义。
本发明提出一种基于计算迁移的云边协同控制系统,包括:云端、由多个边缘节点构成的边缘计算中心以及多个终端;其中,所述云端与每个边缘节点之间、每个边缘节点与该节点聚集的各终端之间相互连接;其特征在于,所述云端用于从各边缘节点接收该节点的带宽和计算资源的分配情况的状态信息并储存,云端利用储存的当前状态信息及所有历史状态信息,通过云边协同深度强化学习算法生成当前时刻最优的迁移决策,并将该最优的迁移决策返回给边缘计算中心的各个边缘节点;其中,所述迁移决策包括各边缘节点执行各终端发送的计算任务的计算成本,边缘节点分配给各终端的带宽占比和计算资源占比,以及各终端是否选择边缘节点执行计算的指标值;
所述每个边缘节点用于接收该边缘节点聚集的各终端发来的计算任务请求;当收到计算任务请求时,边缘计算中心将当前各边缘节点的带宽和计算资源的分配情况的状态信息发送给云端,然后各边缘节点接收云端生成的最优的迁移决策并将该迁移决策发送给对应的终端;之后边缘节点接收其聚集的各终端按照对应的迁移决策上传的计算任务的数据,该边缘节点接收数据后进行计算,再将对应的计算结果发送回该终端;
所述终端用于进行电力系统各环节的数据采集并通过采集的数据判定是否需要执行计算任务;当终端中需要处理的计算任务数据超出本地的计算能力,该终端向对应的边缘节点发送计算请求,然后各终端接收对应的边缘节点发送的最优的迁移决策并按照该决策上传计算任务的数据,并从边缘节点接收计算的结果。
本发明的特点及有益效果为:
(1)本发明综合考虑了电力系统领域云边协同系统已有的算力、带宽及迁移决策的低延迟低能耗优化问题,构建了一个可有效调配电力系统不同层级的数据存储能力与计算能力的云边协同系统,并进一步提出深度学习算法对计算迁移决策进行求解,解决了云边协同系统落地过程中所面临的各层级网络计算能力分配的切实问题。
(2)本发明设计的计算迁移方法能够高效利用云边协同系统中云端与边缘计算中心的计算处理能力,在此基础上实现对云边协同框架下三级数据处理需求的及时响应;同时,对于时变及多样化的环境下的边缘节点,能高效给出自适应迁移策略。
(3)本发明所采用的Critic-Actor深度学习算法对于解决优化问题具有高准确度,高效率的特点。
附图说明
图1是本发明的一种基于计算迁移的云边协同控制系统结构示意图。
具体实施方式
本发明提出一种基于计算迁移的云边协同控制系统及迁移决策生成方法,下面结合附图和具体实施例对本发明进一步详细说明如下。
本发明提出一种基于计算迁移的云边协同控制系统,结构如图1所示,包括:云端、由多个边缘节点构成的边缘计算中心以及包含电力系统各环节和设备的多个终端;其中,每个边缘节点聚集若干终端;所述云端与每个边缘节点之间、每个边缘节点与该节点聚集的各终端之间皆通过无线通信及光纤通信信道连接,以此保证调度指令及数据信息的高速准确传输。
所述云端,由拥有强大计算能力的服务器群组搭建而成;云端用于从各边缘节点接收该节点的带宽和计算资源的分配情况的状态信息并储存,云端利用储存的当前状态信息及所有历史状态信息,模拟各终端与边缘计算中心的交互过程,通过云边协同深度强化学习算法生成当前时刻最优的迁移决策,并将该最优的迁移决策返回给边缘计算中心的各个边缘节点,提升边缘节点对后续任务的处理效率。其中,所述迁移决策包括各边缘节点执行各终端发送的计算任务的计算成本,边缘节点分配给各终端的带宽占比和计算资源占比,以及各终端是否选择边缘节点执行计算的指标值。
所述云端还用于接收每个边缘节点上传的该节点聚集的各终端的自身状态参数,通过存储在云端的电力系统控制模型计算各边缘节点聚集的各终端参与电力系统控制的参数并将该参数发送给对应的边缘节点。其中,电力系统控制模型可为任意设置好的电力系统控制模型。
所述每个边缘节点,其由拥有较强计算能力的服务器搭建而成,形成相对小规模服务器机组。每个边缘节点用于接收该边缘节点聚集的各终端发来的计算任务请求,其中计算任务包括储能容量配置、削峰调谷比例确定、分布式能源利用率计算等;当收到计算任务请求时,边缘计算中心将当前各边缘节点的带宽和计算资源的分配情况的状态信息发送给云端,然后各边缘节点接收云端生成的最优的迁移决策并将该迁移决策发送给对应的终端;之后边缘节点接收其聚集的各终端按照对应的迁移决策上传的计算任务的数据,该边缘节点接收数据后进行计算,再将对应的计算结果发送回该终端。
每个边缘节点还用于接收该边缘节点聚集的各终端发送的自身状态参数,该边缘节点将接收到的所有状态参数发送给云端;每个边缘节点辅助云端进行电力系统控制模型的计算,接收云端发出的该边缘节点聚集的各终端参与电力系统控制的参数,并将该参数发给对应的各终端。
所述终端,包含了“发、变、输、配、用”电力系统中的各环节中的电力系统设备,传感器设备,AR设备。各终端设备被部署在指定区域内进行数据采集并通过采集的数据判定是否需要执行计算任务;其中,终端具备执行计算任务的能力,但是当终端中需要处理的计算任务数据超出本地的计算能力,该终端会向对应的边缘节点发送计算请求,然后各终端接收对应的边缘节点发送的最优的迁移决策并按照该决策上传计算任务的数据,并从边缘节点接收计算的结果。
各终端还用于向对应边缘节点上传自身的状态参数,并接收对应边缘节点发送的该终端的参与电力系统控制的参数并执行。
进一步地,本发明还提出一种基于上述系统的迁移决策生成方法,具体步骤如下:
1)计算模型构造;
假设i表示第i个终端,其中i∈{1,2,…,N},N代表终端的总数;j表示第j个边缘节点,其中j∈{0,1,2,…,M},M代表边缘节点的总数;其中,当j=0时,其对应的边缘节点特指用户终端本身。各边缘节点对其聚集的各终端的信息进行同步更新,并对其聚集的每个终端建立一个对应的任务表:
Figure BDA0003079012730000041
其中xij表示计算任务在本地执行还是被迁移的0-1变量,当xij=1时,计算任务需要被迁移,当xij=0时,计算任务在本地执行;λij表示边缘节点j分配给终端i的带宽占比,βij表示边缘节点j分配给终端i的计算资源占比;Ttol i表终端i的最大容许延迟。
由所有的任务表可以得到总任务集F:F={Fij|i∈{1,2,3,…,N},j∈{1,2,3,…,M}},基于总任务集,可以得出所有任务的迁移决策,并计算出各个任务相应的成本。
2)本地执行;
终端i的本地计算延迟为:
Figure BDA0003079012730000042
其中
Figure BDA0003079012730000043
表示终端i的算力。
因此终端i在本地计算时产生的能耗为:
Figure BDA0003079012730000044
其中
Figure BDA0003079012730000045
表示终端i的计算功率。
终端i的计算成本为:
Figure BDA0003079012730000046
其中α和1-α分别表示时间成本和能耗成本的权重,α∈[0,1]。
3)迁移执行;
当终端i的本地计算任务计算时间
Figure BDA0003079012730000047
大于最大容许延迟Ttol i,则通过迁移计算,由终端i对应的边缘节点j进行迁移计算;
用户端任务i迁移至边缘节点j上下行链路速率分别如下:
Figure BDA0003079012730000048
其中Bj表示边缘节点j的带宽;
Figure BDA0003079012730000049
表示终端i上传数据的传输功率;Hi表示终端i的无线信道的信道增益;N0表示噪声功率;gup目标误码率;d(i,j)表示终端i与边缘节点j之间的距离,ξ表示传输信道路径的损耗指数;
终端i的任务迁移到边缘节点j的执行过程总延迟为:
Figure BDA0003079012730000051
式中,
Figure BDA0003079012730000052
分别代表终端i的任务迁移到边缘节点j的上传时间延迟,在节点j的计算时间以及将计算结果返回用户终端i的时间延迟。
终端i的任务迁移到边缘节点j的执行过程总能耗为:
Figure BDA0003079012730000053
式中,
Figure BDA0003079012730000054
分别代表终端i的任务迁移到边缘节点j上传传输功率,在节点j的计算功率以及将计算结果返回终端i的传输功率。
最后得到终端i的任务迁移到边缘节点j的传输总成本为:
Figure BDA0003079012730000055
式中,α和1-α分别表示时间成本和能耗成本的权重。
综合以上三个部分设计完成计算迁移模型,该模型自适应的调整迁移策略以实现系统总成本的最小化,能够良好的适应边缘节点所面对的多样化动态特征。
4)基于Actor-Critic算法的云边协同深度强化学习算法;
每个边缘节点通过不断地学习,同时与云端进行交互,由云端执行基于Actor-Critic算法的云边协同深度强化学习算法,从而获得最优的迁移策略。
强化学习算法三大要素:状态,奖励和动作定义如下:
状态空间:St=(Cij(t)) (5)
动作空间:At=(zij(t),λij(t),βij(t)) (6)
式中Cij(t)表示t时刻终端i的任务迁移至边缘节点j计算的总成本;λij(t)、βij(t)分别t时刻边缘节点j分配给终端i的带宽和计算资源占比;zij(t)表示t时刻终端i选择边缘节点j进行迁移。
本发明优化目标是最小化所有终端以及边缘节点的降低执行时间以及功率消耗的成本,而强化学习求解目标是获得最大的奖励函数值,故而两者呈现反比关系。据此,奖励函数定义为:
Figure BDA0003079012730000061
其中v为具体环境决定的奖励值。
定义策略函数为:π(st,at)=π(at|st;θ)
其中θ为使用策略迭代更新网络中的权重参数,关于奖励期望E[Rt]的策略梯度更新公式为:
Figure BDA0003079012730000062
其中,bt(st)为基线函数,基于价值函数的深度神经网络,损失函数定义为:
Figure BDA0003079012730000063
其中
Figure BDA0003079012730000064
为权重参数,Target Q定义为:
Figure BDA0003079012730000065
式中,γ为衰减因子。
算法执行过程中,输入设置为:
假设i表示第i个终端,其中i∈{1,2,…,N};j表示第j个边缘节点,其中j∈{0,1,2,…,M},当j=0时,特指用户终端本身。需要计算的任务数据大小为Di,i∈{1,2,…,N};用户终端i的最大容许延迟为
Figure BDA0003079012730000066
i∈{1,2,…,N};带宽设置为Bj,j∈{1,2,…,M};计算能力表示为:
Figure BDA0003079012730000067
j∈{1,2,…,M};
输出设置为:
优化得到的计算成本
Figure BDA0003079012730000068
以及边缘节点分配给终端i的带宽占比
Figure BDA0003079012730000069
边缘节点j分配给终端i的计算资源占比
Figure BDA00030790127300000610
以及表示终端i是否选择边缘节点j执行计算的指标
Figure BDA00030790127300000611
算法具体步骤如下:
1:初始化深度神经网络(DNN)权重指标θ,θ',ω,ω'以及每个边缘节点的最大迭代次数;
2:设置t=1;
3:设置t0=t;同步边缘节点中的参数:θ=θ',ω=ω';
4:基于策略π(at|st;θ')选取动作at,记录奖励值rt以及由动作at执行得到的新的状态st+1,t=t+1;重复执行这一步骤直到t-t0=T;
5:设置h=t-1,通过式(8)优化奖励值;
6:根据损失函数式(9)和目标Q值函数式(10)来计算Q值;
7:根据计算得到的Q值,进一步得出R=rh+γR;
8:依据以下函数更新累计梯度:
Figure BDA0003079012730000071
9:判断h是否与t0相等,如果不相等则返回步骤5;如果相等则进入步骤10;
10:更新云端的深度神经网络(DNN)参数:θ=θ-ρ1dθ,ω=ω-ρ2dω;
11:将更新后的DNN参数θ,ω传递给云端;
12:判断是否所以边缘节点均已执行,如果没有执行完,则返回步骤3;如果所以边缘节点均已执行则进入步骤13;
13:求解得到当前时刻最优的迁移策略,输出最优参数
Figure BDA0003079012730000072
以及
Figure BDA0003079012730000073

Claims (3)

1.一种基于计算迁移的云边协同控制系统,包括:云端、由多个边缘节点构成的边缘计算中心以及多个终端;其中,所述云端与每个边缘节点之间、每个边缘节点与该节点聚集的各终端之间相互连接;其特征在于,所述云端用于从各边缘节点接收该节点的带宽和计算资源的分配情况的状态信息并储存,云端利用储存的当前状态信息及所有历史状态信息,通过云边协同深度强化学习算法生成当前时刻最优的迁移决策,并将该最优的迁移决策返回给边缘计算中心的各个边缘节点;其中,所述迁移决策包括各边缘节点执行各终端发送的计算任务的计算成本,边缘节点分配给各终端的带宽占比和计算资源占比,以及各终端是否选择边缘节点执行计算的指标值;
所述每个边缘节点用于接收该边缘节点聚集的各终端发来的计算任务请求;当收到计算任务请求时,边缘计算中心将当前各边缘节点的带宽和计算资源的分配情况的状态信息发送给云端,然后各边缘节点接收云端生成的最优的迁移决策并将该迁移决策发送给对应的终端;之后边缘节点接收其聚集的各终端按照对应的迁移决策上传的计算任务的数据,该边缘节点接收数据后进行计算,再将对应的计算结果发送回该终端;
所述终端用于进行电力系统各环节的数据采集并通过采集的数据判定是否需要执行计算任务;当终端中需要处理的计算任务数据超出本地的计算能力,该终端向对应的边缘节点发送计算请求,然后各终端接收对应的边缘节点发送的最优的迁移决策并按照该决策上传计算任务的数据,并从边缘节点接收计算的结果。
2.如权利要求1所述的系统,其特征在于,所述云端用于接收每个边缘节点上传的该节点聚集的各终端的自身状态参数,通过存储在云端的电力系统控制模型计算各边缘节点聚集的各终端参与电力系统控制的参数并将该参数发送给对应的边缘节点;每个边缘节点用于接收该边缘节点聚集的各终端发送的自身状态参数,该边缘节点将接收到的所有状态参数发送给云端;每个边缘节点辅助云端进行电力系统控制模型的计算,接收云端发出的该边缘节点聚集的各终端参与电力系统控制的参数,并将该参数发给对应的各终端;各终端用于向对应边缘节点上传自身的状态参数,并接收对应边缘节点发送的该终端参与电力系统控制的参数并执行。
3.一种基于权利要求1所述系统的迁移决策生成方法,其特征在于,该方法包括以下步骤:
1)记i表示第i个终端,其中i∈{1,2,…,N},N代表终端的总数;j表示第j个边缘节点,其中j∈{0,1,2,…,M},M代表边缘节点的总数;其中,当j=0时,其对应的边缘节点为终端本身;
各边缘节点对其聚集的各终端的信息进行同步更新,并对其聚集的每个终端建立一个对应的任务表:
Figure FDA0003079012720000021
其中xij表示计算任务在本地执行还是被迁移的0-1变量,当xij=1时,计算任务需要被迁移,当xij=0时,计算任务在本地执行;λij表示边缘节点j分配给终端i的带宽占比,βij表示边缘节点j分配给终端i的计算资源占比;Ttol i表终端i的最大容许延迟;
由所有的任务表可以得到总任务集F:F={Fij|i∈{1,2,3,…,N},j∈{1,2,3,…,M}};
2)终端i的本地计算延迟为:
Figure FDA0003079012720000022
其中fi l表示终端i的算力;
因此终端i在本地计算时产生的能耗为:
Figure FDA0003079012720000023
其中pi l表示终端i的计算功率;
终端i的计算成本为:
Figure FDA0003079012720000024
其中α和1-α分别表示时间成本和能耗成本的权重,α∈[0,1];
3)当终端i的本地计算任务计算时间
Figure FDA0003079012720000025
大于最大容许延迟Ttol i,则通过迁移计算,由终端i对应的边缘节点j进行迁移计算;
用户端任务i迁移至边缘节点j上下行链路速率分别如下:
Figure FDA0003079012720000026
其中Bj表示边缘节点j的带宽;Pi up表示终端i上传数据的传输功率;Hi表示终端i的无线信道的信道增益;N0表示噪声功率;gup目标误码率;d(i,j)表示终端i与边缘节点j之间的距离,ξ表示传输信道路径的损耗指数;
终端i的任务迁移到边缘节点j的执行过程总延迟为:
Figure FDA0003079012720000027
式中,
Figure FDA0003079012720000028
分别代表终端i的任务迁移到边缘节点j的上传时间延迟,在节点j的计算时间以及将计算结果返回用户终端i的时间延迟;
终端i的任务迁移到边缘节点j的执行过程总能耗为:
Figure FDA0003079012720000031
式中,
Figure FDA0003079012720000032
分别代表终端i的任务迁移到边缘节点j上传传输功率,在节点j的计算功率以及将计算结果返回终端i的传输功率;
最后得到终端i的任务迁移到边缘节点j的传输总成本为:
Figure FDA0003079012720000033
4)云端执行基于Actor-Critic算法的云边协同深度强化学习算法,得到最优的迁移策略;具体方法如下
定义:
状态空间:St=(Cij(t)) (5)
动作空间:At=(zij(t),λij(t),βij(t)) (6)
式中Cij(t)表示t时刻终端i的任务迁移至边缘节点j计算的总成本;λij(t)、βij(t)分别t时刻边缘节点j分配给终端i的带宽和计算资源占比;zij(t)表示t时刻终端i选择边缘节点j进行迁移;
定义奖励函数为:
Figure FDA0003079012720000034
其中v为奖励值;
定义策略函数为:π(st,at)=π(at|st;θ)
其中θ为使用策略迭代更新网络中的权重参数,关于奖励期望E[Rt]的策略梯度更新公式为:
Figure FDA0003079012720000035
其中,bt(st)为基线函数,基于价值函数的深度神经网络,损失函数定义为:
Figure FDA0003079012720000036
其中
Figure FDA0003079012720000037
为权重参数,Target Q定义为:
Figure FDA0003079012720000038
式中,γ为衰减因子;
算法执行过程中,输入设置为:
记需要计算的任务数据大小为Di,i∈{1,2,…,N};用户终端i的最大容许延迟为
Figure FDA0003079012720000041
带宽设置为Bj,j∈{1,2,…,M};计算能力表示为:
Figure FDA0003079012720000042
输出设置为:
优化得到的计算成本
Figure FDA0003079012720000043
以及边缘节点分配给终端i的带宽占比
Figure FDA0003079012720000044
边缘节点j分配给终端i的计算资源占比
Figure FDA0003079012720000045
以及表示终端i是否选择边缘节点j执行计算的指标
Figure FDA0003079012720000046
算法具体步骤如下:
1初始化深度神经网络(DNN)权重指标θ,θ',ω,ω'以及每个边缘节点的最大迭代次数;
2设置t=1;
3设置t0=t;同步边缘节点中的参数:θ=θ',ω=ω';
4基于策略π(at|st;θ')选取动作at,记录奖励值rt以及由动作at执行得到的新的状态st+1,t=t+1;重复执行此步骤直到t-t0=T;
5设置h=t-1,通过式(8)优化奖励值;
6根据损失函数式(9)和目标Q值函数式(10)来计算Q值;
7根据计算得到的Q值,得到R=rh+γR;
8依据以下函数更新累计梯度:
Figure FDA0003079012720000047
9判断h是否与t0相等:如果不相等则返回步骤5;如果相等则进入步骤10;
10更新云端的深度神经网络DNN参数:θ=θ-ρ1dθ,ω=ω-ρ2dω;
11将更新后的DNN参数θ,ω传递给云端;
12判断是否所以边缘节点均已执行,如果没有执行完,则返回步骤3;如果所以边缘节点均已执行则进入步骤13;
13求解得到当前时刻最优的迁移策略,包括:
Figure FDA0003079012720000048
以及
Figure FDA0003079012720000049
CN202110561206.1A 2021-05-22 2021-05-22 基于计算迁移的云边协同控制系统及迁移决策生成方法 Pending CN113326002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110561206.1A CN113326002A (zh) 2021-05-22 2021-05-22 基于计算迁移的云边协同控制系统及迁移决策生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110561206.1A CN113326002A (zh) 2021-05-22 2021-05-22 基于计算迁移的云边协同控制系统及迁移决策生成方法

Publications (1)

Publication Number Publication Date
CN113326002A true CN113326002A (zh) 2021-08-31

Family

ID=77416316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110561206.1A Pending CN113326002A (zh) 2021-05-22 2021-05-22 基于计算迁移的云边协同控制系统及迁移决策生成方法

Country Status (1)

Country Link
CN (1) CN113326002A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836796A (zh) * 2021-09-08 2021-12-24 清华大学 一种基于云边协同的配电物联网数据监测系统及调度方法
CN113986121A (zh) * 2021-10-14 2022-01-28 北京师范大学珠海校区 一种数据安全存储与同步更新的自适应阈值调整方法
CN114125370A (zh) * 2021-12-06 2022-03-01 山西双驱电子科技有限公司 一种多节点协同运算的无纸质化会议执行方法及系统
CN114139800A (zh) * 2021-11-30 2022-03-04 广东电网有限责任公司广州供电局 一种大规模异构电力系统管理方法及电力系统
CN114285855A (zh) * 2022-03-07 2022-04-05 济南英华自动化技术有限公司 一种基于智能边缘物联的云边协同方法
CN114615264A (zh) * 2022-02-22 2022-06-10 东南大学 边云协同计算环境下的城市交通网络数据传输分配方法
CN114625519A (zh) * 2022-05-11 2022-06-14 北京智芯微电子科技有限公司 边缘计算的业务调度方法、装置及设备
CN114938372A (zh) * 2022-05-20 2022-08-23 天津大学 一种基于联邦学习的微网群请求动态迁移调度方法及装置
CN115237580A (zh) * 2022-09-21 2022-10-25 之江实验室 面向智能计算的流水并行训练自适应调整系统、方法
CN115277692A (zh) * 2022-06-21 2022-11-01 华北电力科学研究院有限责任公司 边缘网络计算终端设备自动运维方法、装置和系统
CN115309535A (zh) * 2022-10-11 2022-11-08 中诚华隆计算机技术有限公司 一种由调度芯片进行任务迁移的方法及系统
CN116166444A (zh) * 2023-04-26 2023-05-26 南京邮电大学 一种面向深度学习分层模型的协同推理方法
CN116489711A (zh) * 2023-04-25 2023-07-25 北京交通大学 一种基于深度强化学习的边缘计算网络的任务迁移方法
WO2024022267A1 (zh) * 2022-07-28 2024-02-01 维沃移动通信有限公司 算力任务迁移方法及通信设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112134916A (zh) * 2020-07-21 2020-12-25 南京邮电大学 一种基于深度强化学习的云边协同计算迁移方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112134916A (zh) * 2020-07-21 2020-12-25 南京邮电大学 一种基于深度强化学习的云边协同计算迁移方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈思光等: "基于深度强化学习的云边协同计算迁移研究", 《电子学报》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836796A (zh) * 2021-09-08 2021-12-24 清华大学 一种基于云边协同的配电物联网数据监测系统及调度方法
CN113986121A (zh) * 2021-10-14 2022-01-28 北京师范大学珠海校区 一种数据安全存储与同步更新的自适应阈值调整方法
CN114139800A (zh) * 2021-11-30 2022-03-04 广东电网有限责任公司广州供电局 一种大规模异构电力系统管理方法及电力系统
CN114125370A (zh) * 2021-12-06 2022-03-01 山西双驱电子科技有限公司 一种多节点协同运算的无纸质化会议执行方法及系统
CN114615264A (zh) * 2022-02-22 2022-06-10 东南大学 边云协同计算环境下的城市交通网络数据传输分配方法
CN114615264B (zh) * 2022-02-22 2024-02-09 东南大学 边云协同计算环境下的城市交通网络数据传输分配方法
CN114285855A (zh) * 2022-03-07 2022-04-05 济南英华自动化技术有限公司 一种基于智能边缘物联的云边协同方法
CN114625519A (zh) * 2022-05-11 2022-06-14 北京智芯微电子科技有限公司 边缘计算的业务调度方法、装置及设备
CN114938372B (zh) * 2022-05-20 2023-04-18 天津大学 一种基于联邦学习的微网群请求动态迁移调度方法及装置
CN114938372A (zh) * 2022-05-20 2022-08-23 天津大学 一种基于联邦学习的微网群请求动态迁移调度方法及装置
CN115277692A (zh) * 2022-06-21 2022-11-01 华北电力科学研究院有限责任公司 边缘网络计算终端设备自动运维方法、装置和系统
WO2024022267A1 (zh) * 2022-07-28 2024-02-01 维沃移动通信有限公司 算力任务迁移方法及通信设备
CN115237580A (zh) * 2022-09-21 2022-10-25 之江实验室 面向智能计算的流水并行训练自适应调整系统、方法
CN115237580B (zh) * 2022-09-21 2022-12-16 之江实验室 面向智能计算的流水并行训练自适应调整系统、方法
CN115309535B (zh) * 2022-10-11 2022-12-20 中诚华隆计算机技术有限公司 一种由调度芯片进行任务迁移的方法及系统
CN115309535A (zh) * 2022-10-11 2022-11-08 中诚华隆计算机技术有限公司 一种由调度芯片进行任务迁移的方法及系统
CN116489711A (zh) * 2023-04-25 2023-07-25 北京交通大学 一种基于深度强化学习的边缘计算网络的任务迁移方法
CN116166444A (zh) * 2023-04-26 2023-05-26 南京邮电大学 一种面向深度学习分层模型的协同推理方法

Similar Documents

Publication Publication Date Title
CN113326002A (zh) 基于计算迁移的云边协同控制系统及迁移决策生成方法
CN112134916B (zh) 一种基于深度强化学习的云边协同计算迁移方法
CN110351754B (zh) 基于Q-learning的工业互联网机器设备用户数据计算卸载决策方法
CN111800828B (zh) 一种超密集网络的移动边缘计算资源分配方法
CN111722910B (zh) 一种云作业调度及资源配置的方法
CN113452956B (zh) 一种输电线路巡检任务智能分配方法及系统
CN110234127B (zh) 一种基于sdn的雾网络任务卸载方法
Liu et al. Minimization of offloading delay for two-tier UAV with mobile edge computing
CN113810233B (zh) 一种在随机网络中基于算网协同的分布式计算卸载方法
CN112636338B (zh) 一种基于边缘计算的负荷分区调控系统及方法
CN113238847B (zh) 基于分散式网络环境下可分任务的分发和调度方法
CN112650581A (zh) 一种面向智能楼宇的云边协同任务调度方法
CN113573363B (zh) 基于深度强化学习的mec计算卸载与资源分配方法
CN110287034A (zh) 一种可充电移动边缘计算中能量-延迟平衡的动态任务分配方法
CN115392481A (zh) 一种基于响应时间实时均衡的联邦学习高效通信方法
Wang et al. Task allocation mechanism of power internet of things based on cooperative edge computing
CN115395647A (zh) 基于一致性算法的配电台区群云边协同调控方法和系统
CN113821346B (zh) 基于深度强化学习的边缘计算中计算卸载与资源管理方法
CN114172558A (zh) 一种车辆网络中基于边缘计算和无人机集群协同的任务卸载方法
CN116880923A (zh) 一种基于多智能体强化学习的动态任务卸载方法
Chen et al. Two-phase deep reinforcement learning of dynamic resource allocation and client selection for hierarchical federated learning
CN115912430A (zh) 基于云边端协同的大规模储能电站资源分配方法及系统
CN113285988B (zh) 一种基于雾计算的能耗最小化公平计算迁移方法
Chang et al. Low-latency controller load balancing strategy and offloading decision generation algorithm based on lyapunov optimization in SDN mobile edge computing environment
CN114189877A (zh) 一种面向5g基站的复合式能耗优化控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210831