CN113377531B - 基于无线能量驱动的移动边缘计算分布式服务部署方法 - Google Patents

基于无线能量驱动的移动边缘计算分布式服务部署方法 Download PDF

Info

Publication number
CN113377531B
CN113377531B CN202110625127.2A CN202110625127A CN113377531B CN 113377531 B CN113377531 B CN 113377531B CN 202110625127 A CN202110625127 A CN 202110625127A CN 113377531 B CN113377531 B CN 113377531B
Authority
CN
China
Prior art keywords
energy
delay
client
server
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110625127.2A
Other languages
English (en)
Other versions
CN113377531A (zh
Inventor
王小洁
宁兆龙
郭磊
高新波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202110625127.2A priority Critical patent/CN113377531B/zh
Publication of CN113377531A publication Critical patent/CN113377531A/zh
Application granted granted Critical
Publication of CN113377531B publication Critical patent/CN113377531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/502Proximity
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明请求保护一种基于无线能量驱动的移动边缘计算分布式在线服务部署方法,考虑到6G网络分布式特性、边缘服务器计算和能量传输能力有限,在保证用户能量供给的同时最小化用户平均任务完成时间,实现移动边缘网络环境下高效卸载和能量传输。本发明利用贝尔曼方程将平均时延最小化问题转化为原始‑对偶优化问题。此外,本发明设计了一种基于深度强化学习的在线调度策略,合理的进行能量传输和任务处理时间分配。为了实现分布式模型训练,边缘服务器协同工作实现模型参数同步。理论分析表明本发明提出的在线分布式资源调度策略为渐进最优解。本发明为无线能量驱动的分布式移动边缘计算数据部署提供了一种新方法。

Description

基于无线能量驱动的移动边缘计算分布式服务部署方法
技术领域
本发明属于基于无线能量驱动的移动边缘计算对用户服务数据进行分布式动态部署的方法,尤其涉及一种基于深度强化学习的在线服务部署方法。
背景技术
移动边缘计算和无线能量传输技术已成为平衡资源与需求的两大主流技术。移动边缘计算可以缓解终端设备压力,无线能量传输可以通过无线频谱传输能量实现无线充电。无线能量驱动的移动边缘计算平台就是将这两种技术相结合,不仅能够实现高效数据卸载而且可以进行无线充电。由于终端设备的半双工特性,数据卸载和能量传输过程不能同时进行。对于无线能量驱动的移动边缘计算平台,一个关键问题是如何对数据卸载和能量传输过程进行合理的时间分配。这两个过程相互影响,一方面时间分配影响移动终端收获的能量,而任务卸载决策又依赖于收获的能量;另一方面,任务调度结果会影响后续时间分配方案。目前基于无线能量驱动的边缘计算方案大多为集中式,需要统筹全网信息进行调度。6G网络的发展提出了分布式网络管理的需求,以往集中式方案不再使用。性能优、效率高的分布式部署方法有待于研究人员的进一步探索。
本发明的目的主要针对现有研究的一些不足之处,提出基于无线能量驱动的移动边缘计算分布式服务部署方法,利用贝尔曼方程将平均时延最小化问题转化为原始-对偶优化问题,结合深度强化学习以及马尔可夫模型设计多智能体在线资源调度策略,为基于无线能量驱动的移动边缘计算分布式服务数据部署提供一种新方法。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种基于无线能量驱动的移动边缘计算分布式服务部署方法。本发明的技术方案如下:
一种基于无线能量驱动的移动边缘计算分布式服务部署方法,其包括以下步骤:
1)构建系统模型,确定用户能耗和延迟计算模型;
2)利用马尔科夫优化理论,将步骤1)中平均时延最小化问题转化为在线策略优化问题;
3)利用深度强化学习理论对步骤2)中的在线策略优化优化问题中的约束条件进行松弛,并对动作和奖励函数进行重组;
4)针对步骤3)中的问题建立智能体训练模型,并对模型进行训练获得资源部署策略。
进一步的,所述步骤1)构建系统模型,确定用户能耗和延迟计算模型,具体包括以下步骤:
构建一个系统模型,包括M个边缘计算服务器以及N个用户,在每个时隙t内用户i以概率产生服务请求,可由三个变量定义:
Figure BDA0003101879900000021
其中
Figure BDA0003101879900000022
表示数据大小;
Figure BDA0003101879900000023
表示完成服务所需的CPU周期数;
Figure BDA0003101879900000024
表示最大容忍延迟,移动客户端i的CPU频率为
Figure BDA0003101879900000025
边缘服务器j的CPU频率为
Figure BDA0003101879900000026
在时隙t内,能量传输的持续时间为τt,数据卸载的持续时间为
Figure BDA0003101879900000027
用户i的服务请求完成时间由以下公式进行计算:
Figure BDA0003101879900000028
其中
Figure BDA0003101879900000029
代表服务请求
Figure BDA00031018799000000210
能否在客户端i本地进行处理,如果可以,
Figure BDA00031018799000000211
否则
Figure BDA00031018799000000212
变量
Figure BDA00031018799000000213
代表服务请求
Figure BDA00031018799000000214
是否在时隙t内被卸载到边缘服务器j上;变量
Figure BDA00031018799000000215
Figure BDA00031018799000000216
分别代表在本地处理的计算延迟、传输到服务器j的传输延迟、由服务器j处理的计算延迟,以及在本地的排队延迟;
客户端i在时隙t内收获的能量通过以下公式获得:
Figure BDA00031018799000000217
其中μ是能量获取的效率,为0和1之间的小数,变量
Figure BDA00031018799000000218
是发送端到客户端i发送功率,
Figure BDA00031018799000000219
为信道增益;
客户端i的能量消耗表示为:
Figure BDA0003101879900000031
其中
Figure BDA0003101879900000032
为本地计算能量消耗,由如下公式进行计算:
Figure BDA0003101879900000033
变量Pij为从客户端i到服务器j的发送功率,
Figure BDA0003101879900000034
为从客户端i到服务器j的传输能耗,通过如下公式获得:
Figure BDA0003101879900000035
其中κi为客户端i的能效系数;
优化目标为最小化用户请求平均完成时延,问题描述如下:
Figure BDA0003101879900000036
约束条件1要求客户端i调度服务请求所消耗的能量必须小于客户端剩余能量;约束条件2确保服务请求能够在可容忍的延迟内完成。
进一步的,移动客户端采用半双工通信方式,能量传输和数据卸载过程不能同时进行,因此采用先能量传输后任务卸载的调度方式。
进一步的,本地计算延迟
Figure BDA0003101879900000037
可由如下公式进行计算:
Figure BDA0003101879900000038
传输延迟可通过如下公式获得:
Figure BDA0003101879900000039
其中
Figure BDA00031018799000000310
是从客户端i到服务器j的传输速率,远端计算延迟
Figure BDA00031018799000000311
可以通过如下公式进行计算:
Figure BDA00031018799000000312
本地排队延迟可通过如下公式进行计算:
Figure BDA0003101879900000041
其中t′代表服务请求在该时隙内被处理,Δt′代表在时隙t′内能量传输结束后到服务请求被处理前的等待时间。
进一步的,所述步骤2:利用马尔科夫优化理论,将步骤1)中平均时延最小化问题转化为在线策略优化问题,具体包括:
延迟最小化问题定义为一个马尔科夫优化问题,用元组
Figure BDA0003101879900000042
表示,各元素含义如下:
状态S:代表所建立的马尔科夫模型的状态,可表示为
Figure BDA0003101879900000043
其中,S1表示服务器的状态,包括服务器的位置和计算能力;S2表示用户的状态,包括用户当前位置和用户的服务请求;S3表示信道的状态,包括数据传输速率和发送功率;
动作A:表示为
Figure BDA0003101879900000044
包含能量传输时间决策和任务调度决策;
状态转移概率P:表示为P:S×A×S→[0,1],基于概率P(st+1|st,at)和动作at,系统状态从st跳转到st+1
奖励函数R:表示为
Figure BDA0003101879900000045
代表时隙t内智能体k执行动作
Figure BDA0003101879900000046
后获得的瞬时奖励,目标是最小化服务完成时间,因此瞬时奖励通过以下公式获得:
Figure BDA0003101879900000047
步骤1中的优化问题转化为:
Figure BDA0003101879900000048
其中V*(st)表示训练模型的状态值函数,γ表示折扣因子,代表当前动作对未来奖励的影响。
进一步的,所述步骤3:利用深度强化学习理论对步骤2)中的优化问题进行进一步分析和转化,具体包括:
首先对动作进行等价变换,时隙t内的动作定义为
Figure BDA0003101879900000051
其中
Figure BDA0003101879900000052
为能量传输的持续时间,
Figure BDA0003101879900000053
是任务处理顺序;其次对利用拉格朗日松弛约束条件并对瞬时奖励函数进行变换,变换后的瞬时奖励利用如下公式进行计算:
Figure BDA0003101879900000054
之后引入折扣熵正则项,系统值函数通过如下公式进行计算:
Figure BDA0003101879900000055
其中ξ是一个控制变量,H(π,st)是熵;
最后,将值函数分解成M个元素对应于M个智能体,对于每个智能体只需要求解如下优化问题:
Figure BDA0003101879900000056
s.t.V1(st)=...=Vj(st)=Vj+1(st)=...=VM(st).。
进一步的,所述步骤4:针对步骤3)中的问题建立智能体训练模型,并对模型进行训练,具体包括以下步骤:
1)神经网络模型初始化;
2)所有智能体与环境进行交互,并输入观测状态到神经网络模型,获取当前执行动作;
3)将智能体在每个时隙的观察状态和执行的动作以批处理的方式进行保存;
4)基于保存的批处理结果,对神经网络模型进行训练以获得资源分配策略;
5)基于训练获得的策略,边缘服务器对资源进行配置,若实验时间未结束,重复步骤2)。
本发明的优点及有益效果如下:
本发明构建了一个动态服务部署框架,用于在基于无线能量驱动的移动边缘计算网络中实现高效卸载和能量传输。由于原始问题是NP难问题且变量间的相互耦合,本发明利用贝尔曼方程将平均时延最小化问题转化为原始-对偶优化问题,这样可以利用随机优化理论进行求解。此外,本发明设计了一种基于深度强化学习的调度策略,合理的进行能量传输和任务处理时间分配,克服了传统算法在无线能量驱动的多服务器并存情况下无法进行有效的在线资源调度的缺点,显著提升了系统的性能。为了实现分布式模型训练,边缘服务器协同工作实现模型参数同步。实验结果证明了本发明在平均服务完成时间和完成比率方面的高效性。本发明提供了一种新的应用于无线能量驱动的分布式移动边缘计算服务数据部署方法。
附图说明
图1是本发明提供优选实施例为随机移动模型。
图2为为基于深度强化学习的算法训练示意图。
图3和图4对比了本发明提出的OLD-COP算法与其他三种算法在平均服务完成时间上的性能。
图5和图6对比了本发明提出的OLD-COP算法与其他三种算法在平均服务完成比率上的性能。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
一种无线能量驱动的移动边缘计算分布式服务部署方法,步骤如下:
1.构建系统模型,确定用户能耗和延迟计算模型;
2.利用马尔科夫优化理论,将步骤1)中平均时延最小化问题转化为在线策略优化问题;
3.利用深度强化学习理论对步骤2)中的优化问题进行进一步分析和转化;
4.针对步骤3)中的问题建立智能体训练模型,并对模型进行训练。
步骤1):构建系统模型,确定用户能耗和延迟计算模型。
本发明构建一个系统模型,其中包含M个边缘计算服务器以及N个用户。在每个时隙t内用户i以概率产生服务请求,可由三个变量定义:
Figure BDA0003101879900000071
其中
Figure BDA0003101879900000072
表示数据大小;
Figure BDA0003101879900000073
表示完成服务所需的CPU周期数;
Figure BDA0003101879900000074
表示最大容忍延迟。移动客户端i的CPU频率为
Figure BDA0003101879900000075
边缘服务器j的CPU频率为
Figure BDA0003101879900000076
移动客户端采用半双工通信方式,能量传输和数据卸载过程不能同时进行,因此本发明采用先能量传输后任务卸载的调度方式。在时隙t内,能量传输的持续时间为τt,数据卸载的持续时间为
Figure BDA0003101879900000077
用户i的服务请求完成时间可以由以下公式进行计算:
Figure BDA0003101879900000078
其中
Figure BDA0003101879900000079
代表服务请求
Figure BDA00031018799000000710
能否在客户端i本地进行处理,如果可以,
Figure BDA00031018799000000711
否则
Figure BDA00031018799000000712
变量
Figure BDA00031018799000000713
代表服务请求
Figure BDA00031018799000000718
是否在时隙t内被卸载到边缘服务器j上。变量
Figure BDA00031018799000000714
Figure BDA00031018799000000715
分别代表在本地处理的计算延迟、传输到服务器j的传输延迟、由服务器j处理的计算延迟,以及在本地的排队延迟。本地计算延迟
Figure BDA00031018799000000716
可由如下公式进行计算:
Figure BDA00031018799000000717
传输延迟可通过如下公式获得:
Figure BDA0003101879900000081
其中
Figure BDA0003101879900000082
是从客户端i到服务器j的传输速率。远端计算延迟
Figure BDA0003101879900000083
可以通过如下公式进行计算:
Figure BDA0003101879900000084
本地排队延迟可通过如下公式进行计算:
Figure BDA0003101879900000085
其中t′代表服务请求在该时隙内被处理,Δt′代表在时隙t′内能量传输结束后到服务请求被处理前的等待时间。
客户端i在时隙t内收获的能量可以通过以下公式获得:
Figure BDA0003101879900000086
其中μ是能量获取的效率,为0和1之间的小数。变量
Figure BDA0003101879900000087
可以认为是发送端到客户端i发送功率,
Figure BDA0003101879900000088
为信道增益。
客户端i的能量消耗可以表示为:
Figure BDA0003101879900000089
其中
Figure BDA00031018799000000810
为本地计算能量消耗,可由如下公式进行计算:
Figure BDA00031018799000000811
变量Pij为从客户端i到服务器j的发送功率。
Figure BDA00031018799000000812
为从客户端i到服务器j的传输能耗,可以通过如下公式获得:
Figure BDA00031018799000000813
其中κi为客户端i的能效系数。
本发明优化目标为最小化用户请求平均完成时延,问题描述如下:
Figure BDA00031018799000000814
Figure BDA0003101879900000091
约束条件1要求客户端i调度服务请求所消耗的能量必须小于客户端剩余能量;约束条件2确保服务请求能够在可容忍的延迟内完成。
步骤2):利用马尔科夫优化理论,将步骤1)中平均时延最小化问题转化为在线策略优化问题。
在步骤1)描述的优化问题中,服务处理决策和能量传输决策互相耦合,即使在集中式的环境下也是NP难问题。在分布式环境下的求解困难重重,一方面所有服务器需要在能量传输时间上达成一致,另一方面客户端需要基于部分可观测信息进行服务请求调度。为了解决上述挑战,本发明利用马尔科夫优化方法来将步骤1)中的优化问题进行转化,将平均时延最小化问题转化为在线策略优化问题。
根据马尔科夫优化理论,步骤1中的延迟最小化问题可以定义为一个马尔科夫优化问题,可以用元组
Figure BDA0003101879900000092
表示,各元素含义如下:
状态S:代表所建立的马尔科夫模型的状态,可表示为
Figure BDA0003101879900000093
其中,S1表示服务器的状态,包括服务器的位置和计算能力;S2表示用户的状态,包括用户当前位置和用户的服务请求;S3表示信道的状态,包括数据传输速率和发送功率。
动作A:可以表示为
Figure BDA0003101879900000094
包含能量传输时间决策和任务调度决策。
状态转移概率P:表示为P:S×A×S→[0,1]。基于概率P(st+1|st,at)和动作at,系统状态从st跳转到st+1
奖励函数R:可表示为
Figure BDA0003101879900000095
代表时隙t内智能体k执行动作
Figure BDA0003101879900000096
后获得的瞬时奖励。本发明的目标是最小化服务完成时间,因此瞬时奖励可以通过以下公式获得:
Figure BDA0003101879900000097
因此,步骤1中的优化问题可以转化为:
Figure BDA0003101879900000101
步骤3):利用深度强化学习理论对步骤2)中的优化问题进行进一步分析和转化。
步骤2)中的优化问题仍然难以解决,这是因为每个服务器都需要独立的进行动作选择,导致能量传输时间和任务调度时间难以统一。本部分首先对智能体的动作进行等价变换,使用任务处理顺序代替任务调度决策。然后对约束条件进行松弛,并对奖励函数进行相应转换。同时引入折扣熵正则项,建立适用于本系统的值函数。同时将步骤2)中的优化问题转化为其对偶问题。
步骤3:利用深度强化学习理论对步骤2)中的优化问题进行进一步分析和转化。
首先对动作进行等价变换,时隙t内的动作可以定义为
Figure BDA0003101879900000102
其中
Figure BDA0003101879900000103
为能量传输的持续时间,
Figure BDA0003101879900000104
是任务处理顺序。其次对利用拉格朗日松弛约束条件并对瞬时奖励函数进行变换,变换后的瞬时奖励可以利用如下公式进行计算:
Figure BDA0003101879900000105
之后引入折扣熵正则项,系统值函数可以通过如下公式进行计算:
Figure BDA0003101879900000106
其中ξ是一个控制变量,H(π,st)是熵。
最后,将值函数分解成M个元素对应于M个智能体,对于每个智能体只需要求解如下优化问题:
Figure BDA0003101879900000111
s.t.V1(st)=...=Vj(st)=Vj+1(st)=...=VM(st).
步骤4:针对步骤3)中的问题建立智能体训练模型,并对模型进行训练。对智能体建立训练模型并进行分布式训练,伪代码流程如表1所示。
表1智能体策略模型训练伪代码
Figure BDA0003101879900000112
Figure BDA0003101879900000121
所设计在线算法OLD-COP伪代码流程如表2所示。
Figure BDA0003101879900000122
Figure BDA0003101879900000131
图1为随机移动模型,多个服务器协同为用户提供移动边缘计算服务,并标明每个时隙的时间分配。
图2为为基于深度强化学习的算法训练示意图。多个智能体(边缘服务器)与环境进行交互获得系统可观测信息。智能体通过策略、值、对偶等模块进行在线策略训练,多个智能体之间定期进行参数同步与更新。边缘服务器通过训练的模型输出服务处理顺序。客户端根据服务器输出的顺序,选择合适的服务器进行服务处理。
图3和图4对比了本发明提出的OLD-COP算法与其他三种算法在平均服务完成时间上的性能。实验结果表明所设计的分布式算法利用参数同步进行模型训练是有益的,相比于对比算法,本发明能够获得较低的平均服务完成时间。
图5和图6对比了本发明提出的OLD-COP算法与其他三种算法在平均服务完成比率上的性能。实验结果表明本发明可以在用户数较多和服务器数量较少的情况下,仍能获得较高的服务完成比率。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (3)

1.一种基于无线能量驱动的移动边缘计算分布式服务部署方法,其特征在于,包括以下步骤:
1)构建系统模型,确定用户能耗和延迟计算模型;
2)利用马尔科夫优化理论,将步骤1)中平均时延最小化问题转化为在线策略优化问题;
3)利用深度强化学习理论对步骤2)中的在线策略优化优化问题中的约束条件进行松弛,并对动作和奖励函数进行重组;
4)针对步骤3)中的问题建立边缘服务器训练模型,并对模型进行训练获得资源部署策略;
所述步骤1)构建系统模型,确定用户能耗和延迟计算模型,具体包括以下步骤:
构建一个系统模型,包括M个边缘计算服务器以及N个用户,在每个时隙t内用户i以概率产生服务请求,可由三个变量定义:
Figure FDA0003743247500000011
其中
Figure FDA0003743247500000012
表示数据大小;
Figure FDA00037432475000000117
表示完成服务所需的CPU周期数;
Figure FDA0003743247500000013
表示最大容忍延迟,移动客户端i的CPU频率为
Figure FDA0003743247500000014
边缘服务器j的CPU频率为
Figure FDA0003743247500000015
在时隙t内,能量传输的持续时间为τ′,数据卸载的持续时间为
Figure FDA0003743247500000016
用户i的服务请求完成时间由以下公式进行计算:
Figure FDA0003743247500000017
其中
Figure FDA0003743247500000018
代表服务请求
Figure FDA0003743247500000019
能否在客户端i本地进行处理,如果可以,
Figure FDA00037432475000000110
否则
Figure FDA00037432475000000111
变量
Figure FDA00037432475000000112
代表服务请求
Figure FDA00037432475000000118
是否在时隙t内被卸载到边缘服务器j上;变量
Figure FDA00037432475000000113
Figure FDA00037432475000000114
分别代表在本地处理的计算延迟、传输到服务器j的传输延迟、由服务器j处理的计算延迟,以及在本地的排队延迟;
客户端i在时隙t内收获的能量通过以下公式获得:
Figure FDA00037432475000000115
其中μ是能量获取的效率,为0和1之间的小数,变量
Figure FDA00037432475000000116
是发送端到客户端i发送功率,
Figure FDA0003743247500000021
为信道增益;
客户端i的能量消耗表示为:
Figure FDA0003743247500000022
其中
Figure FDA0003743247500000023
为本地计算能量消耗,由如下公式进行计算:
Figure FDA0003743247500000024
变量Pij为从客户端i到服务器j的发送功率,
Figure FDA0003743247500000025
为从客户端i到服务器j的传输能耗,通过如下公式获得:
Figure FDA0003743247500000026
其中κi为客户端i的能效系数;
优化目标为最小化用户请求平均完成时延,问题描述如下:
Figure FDA0003743247500000027
s.t.,
Figure FDA0003743247500000028
Figure FDA0003743247500000029
约束条件1要求客户端i调度服务请求所消耗的能量必须小于客户端剩余能量;约束条件2确保服务请求能够在可容忍的延迟内完成;
所述步骤2:利用马尔科夫优化理论,将步骤1)中平均时延最小化问题转化为在线策略优化问题,具体包括:
延迟最小化问题定义为一个马尔科夫优化问题,用元组
Figure FDA00037432475000000210
表示,各元素含义如下:
状态S:代表所建立的马尔科夫模型的状态,可表示为
Figure FDA00037432475000000211
其中,S1表示服务器的状态,包括服务器的位置和计算能力;S2表示用户的状态,包括用户当前位置和用户的服务请求;S3表示信道的状态,包括数据传输速率和发送功率;
动作A:表示为
Figure FDA0003743247500000031
包含能量传输时间决策和任务调度决策;
状态转移概率P:表示为P:S×A×S→[0,1],基于概率P(st+1|st,at)和动作at,系统状态从st跳转到st+1
奖励函数R:表示为
Figure FDA0003743247500000032
代表时隙t内边缘服务器k执行动作
Figure FDA0003743247500000033
后获得的瞬时奖励,目标是最小化服务完成时间,因此瞬时奖励通过以下公式获得:
Figure FDA0003743247500000034
步骤1中的优化问题转化为:
Figure FDA0003743247500000035
s.t.,
Figure FDA0003743247500000036
Figure FDA0003743247500000037
其中V*(st)表示训练模型的状态值函数,γ表示折扣因子,代表当前动作对未来奖励的影响;
所述步骤3:利用深度强化学习理论对步骤2)中的优化问题进行进一步分析和转化,具体包括:
首先对动作进行等价变换,时隙t内的动作定义为
Figure FDA0003743247500000038
其中
Figure FDA0003743247500000039
为能量传输的持续时间,
Figure FDA00037432475000000310
是任务处理顺序;其次对利用拉格朗日松弛约束条件并对瞬时奖励函数进行变换,变换后的瞬时奖励利用如下公式进行计算:
Figure FDA00037432475000000311
之后引入折扣熵正则项,系统值函数通过如下公式进行计算:
Figure FDA0003743247500000041
其中ξ是一个控制变量,H(π,st)是熵;
最后,将值函数分解成M个元素对应于M个边缘服务器,对于每个边缘服务器只需要求解如下优化问题:
P2:
Figure FDA0003743247500000042
s.t. V1(st)=...=Vj(st)=Vj+1(st)=...=VM(st).;
所述步骤4:针对步骤3)中的问题建立边缘服务器训练模型,并对模型进行训练,具体包括以下步骤:
1)神经网络模型初始化;
2)所有边缘服务器与环境进行交互,并输入观测状态到神经网络模型,获取当前执行动作;
3)将边缘服务器在每个时隙的观察状态和执行的动作以批处理的方式进行保存;
4)基于保存的批处理结果,对神经网络模型进行训练以获得资源分配策略;
5)基于训练获得的策略,边缘服务器对资源进行配置,若实验时间未结束,重复步骤2)。
2.根据权利要求1所述的一种基于无线能量驱动的移动边缘计算分布式服务部署方法,其特征在于,移动客户端采用半双工通信方式,能量传输和数据卸载过程不能同时进行,因此采用先能量传输后任务卸载的调度方式。
3.根据权利要求1所述的一种基于无线能量驱动的移动边缘计算分布式服务部署方法,其特征在于,本地计算延迟
Figure FDA0003743247500000043
可由如下公式进行计算:
Figure FDA0003743247500000044
传输延迟可通过如下公式获得:
Figure FDA0003743247500000051
其中
Figure FDA0003743247500000052
是从客户端i到服务器j的传输速率,远端计算延迟
Figure FDA0003743247500000053
可以通过如下公式进行计算:
Figure FDA0003743247500000054
本地排队延迟可通过如下公式进行计算:
Figure FDA0003743247500000055
其中t′代表服务请求在该时隙内被处理,Δt′代表在时隙t′内能量传输结束后到服务请求被处理前的等待时间。
CN202110625127.2A 2021-06-04 2021-06-04 基于无线能量驱动的移动边缘计算分布式服务部署方法 Active CN113377531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110625127.2A CN113377531B (zh) 2021-06-04 2021-06-04 基于无线能量驱动的移动边缘计算分布式服务部署方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110625127.2A CN113377531B (zh) 2021-06-04 2021-06-04 基于无线能量驱动的移动边缘计算分布式服务部署方法

Publications (2)

Publication Number Publication Date
CN113377531A CN113377531A (zh) 2021-09-10
CN113377531B true CN113377531B (zh) 2022-08-26

Family

ID=77575816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110625127.2A Active CN113377531B (zh) 2021-06-04 2021-06-04 基于无线能量驱动的移动边缘计算分布式服务部署方法

Country Status (1)

Country Link
CN (1) CN113377531B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113835886B (zh) * 2021-09-14 2023-08-29 北京信息科技大学 物联网资源分配方法、装置、电子设备及存储介质
CN114640861B (zh) * 2022-03-14 2023-12-12 上海小潮缇姆信息科技有限公司 一种基于视频流行度先验预测的边缘缓存优化方法
CN115276754B (zh) * 2022-06-20 2023-06-16 南京邮电大学 一种基于栅格时延预测的卫星传输优化方法
CN115237581B (zh) * 2022-09-21 2022-12-27 之江实验室 一种面向异构算力的多策略智能调度方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109257429A (zh) * 2018-09-25 2019-01-22 南京大学 一种基于深度强化学习的计算卸载调度方法
CN109756378A (zh) * 2019-01-12 2019-05-14 大连理工大学 一种车载网络下的智能计算卸载方法
CN110971706A (zh) * 2019-12-17 2020-04-07 大连理工大学 Mec中近似最优化与基于强化学习的任务卸载方法
CN111182582A (zh) * 2019-12-30 2020-05-19 东南大学 面向移动边缘计算的多任务分布式卸载方法
CN111405569A (zh) * 2020-03-19 2020-07-10 三峡大学 基于深度强化学习的计算卸载和资源分配方法及装置
CN111835827A (zh) * 2020-06-11 2020-10-27 北京邮电大学 物联网边缘计算任务卸载方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110099384B (zh) * 2019-04-25 2022-07-29 南京邮电大学 基于边-端协同的多用户多mec任务卸载资源调度方法
CN112364507B (zh) * 2020-11-10 2022-11-18 大连理工大学 一种基于移动边缘计算的分布式动态服务部署方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109257429A (zh) * 2018-09-25 2019-01-22 南京大学 一种基于深度强化学习的计算卸载调度方法
CN109756378A (zh) * 2019-01-12 2019-05-14 大连理工大学 一种车载网络下的智能计算卸载方法
CN110971706A (zh) * 2019-12-17 2020-04-07 大连理工大学 Mec中近似最优化与基于强化学习的任务卸载方法
CN111182582A (zh) * 2019-12-30 2020-05-19 东南大学 面向移动边缘计算的多任务分布式卸载方法
CN111405569A (zh) * 2020-03-19 2020-07-10 三峡大学 基于深度强化学习的计算卸载和资源分配方法及装置
CN111835827A (zh) * 2020-06-11 2020-10-27 北京邮电大学 物联网边缘计算任务卸载方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
5G移动边缘计算中任务调度策略研究;张永超;《中国优秀硕士学位论文全文数据库 信息科技辑》;20210215(第2期);I136-730 *
Dynamic Computation Offloading and Resource Allocation for Multi-user Mobile Edge Computing;Samrat Nath 等;《GLOBECOM 2020 - 2020 IEEE Global Communications Conference》;20210211;1-6 *
移动边缘计算中基于深度强化学习的任务卸载研究进展;梁俊斌 等;《计算机科学》;20210311;316-323 *
移动边缘计算中基于深度强化学习的计算卸载调度方法;詹文翰 等;《计算机应用研究》;20200424;第38卷(第1期);241-245,263 *
边缘计算任务卸载与资源优化研究;兰延文;《中国博士学位论文全文数据库 信息科技辑》;20210115(第1期);I136-190 *

Also Published As

Publication number Publication date
CN113377531A (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
CN113377531B (zh) 基于无线能量驱动的移动边缘计算分布式服务部署方法
CN110928654B (zh) 一种边缘计算系统中分布式的在线任务卸载调度方法
CN110113190B (zh) 一种移动边缘计算场景中卸载时延优化方法
CN109814951A (zh) 移动边缘计算网络中任务卸载及资源分配的联合优化方法
WO2024159708A1 (zh) 基于数字孪生的异构任务与资源端边协同调度方法
CN111148134A (zh) 一种基于移动边缘计算的多用户多任务卸载方法
CN112511336B (zh) 一种边缘计算系统中的在线服务放置方法
CN113543156A (zh) 基于多智能体深度强化学习的工业无线网络资源分配方法
CN111565380B (zh) 车联网中基于noma-mec混合卸载方法
CN113781002B (zh) 云边协同网络中基于代理模型和多种群优化的低成本工作流应用迁移方法
CN113946423B (zh) 基于图注意力网络的多任务边缘计算调度优化方法
CN115413044B (zh) 一种工业无线网络的计算和通信资源联合分配方法
CN113590279B (zh) 一种面向多核边缘计算服务器的任务调度和资源分配方法
CN114938381B (zh) 一种基于深度强化学习的d2d-mec卸载方法
CN115499441A (zh) 超密集网络中基于深度强化学习的边缘计算任务卸载方法
CN112667406A (zh) 一种云边融合异构网络中任务卸载与数据缓存方法
CN108601076A (zh) 能量收集无线网络中可持续传输需求驱动的多信道功率分配方法
Yuan et al. Profit-optimized computation offloading with autoencoder-assisted evolution in large-scale mobile-edge computing
Yuan et al. Cost-minimized user association and partial offloading for dependent tasks in hybrid cloud–edge systems
CN117880122A (zh) 一种基于madfpg的任务卸载和资源分配联合优化方法
CN117608821A (zh) 确定计算任务卸载策略的方法、装置、设备及介质
CN111294886B (zh) 一种基于无线能量驱动的移动边缘计算方法及装置
CN116431326A (zh) 一种基于边缘计算和深度强化学习的多用户依赖性任务卸载方法
CN116347522A (zh) 云边协同下基于近似计算复用的任务卸载方法及装置
CN113543225A (zh) 一种电力无线专网安全动态资源分配的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant