CN117729571A - 一种动态mec网络中迁移决策与资源分配的联合优化方法 - Google Patents

一种动态mec网络中迁移决策与资源分配的联合优化方法 Download PDF

Info

Publication number
CN117729571A
CN117729571A CN202410177424.9A CN202410177424A CN117729571A CN 117729571 A CN117729571 A CN 117729571A CN 202410177424 A CN202410177424 A CN 202410177424A CN 117729571 A CN117729571 A CN 117729571A
Authority
CN
China
Prior art keywords
user
server
time slot
resource allocation
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410177424.9A
Other languages
English (en)
Inventor
林世俊
朱凯歌
石江宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CN202410177424.9A priority Critical patent/CN117729571A/zh
Publication of CN117729571A publication Critical patent/CN117729571A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种动态MEC网络中迁移决策和资源分配的联合优化方法,通过Lyapunov框架将长期问题转化为每个时隙下的确定性问题,涉及服务器选择,发射功率和服务器资源分配的优化。首先根据拉格朗日对偶分解得到给定服务器选择下的最优资源分配,然后结合深度强化学习求解服务器选择使得Lyapunov漂移最小,最终使得在长期迁移代价的约束下用户的长期能耗最小。

Description

一种动态MEC网络中迁移决策与资源分配的联合优化方法
技术领域
本发明涉及MEC网络技术领域,具体涉及一种动态MEC网络中迁移决策与资源分配的联合优化方法。
背景技术
在传统移动边缘计算(Mobile Edge Computing,MEC)网络中,服务器与用户通常处于相对固定的位置。然而,当用户在多个基站的服务范围内移动时,可能会导致网络性能显著降低和服务质量(Quality of Service,QoS)大幅下降,甚至中断正在进行的边缘业务,很难保证业务的连续性。
在传统的无线接入网络中,移动性的一个关键解决方案是将移动用户的无线链路从一个基站切换到另一个基站,以确保连接的可靠性。在MEC系统中,除了考虑用户设备之间的无线连接切换外,还需要关注服务器之间的计算任务迁移,即服务迁移。
服务迁移在以下几点展示了巨大的应用潜力:
第一,降低延迟:对延迟敏感的应用程序的交互响应将随着逻辑网络距离的增加而降低,这种退化可能比物理距离所暗示的要严重得多。跟随用户的移动性进行服务迁移能够极大地提高MEC系统中的用户体验。
第二,用户的移动性在可能会卸载过程中引入间歇性连接,导致多个服务器之间负载不平衡,已被证明是导致卸载失败和服务降级的根本原因。当接入点过载时,将导致网络拥塞,这将成为与服务通信的主要开销部分,服务迁移在不降低QoS的前提下,保证所有服务器的平均运行,尽可能地减少网络拥堵的可能。
第三,密集部署下的切换失败(FHO)和乒乓效应(PP)问题显著增加了系统的能量消耗,因为很多能量被浪费在不必要的移交上。高效的服务迁移策略能够很好地改善这一状况。
在以设备为目标的服务场景中优化迁移策略,是学界的一大研究方向。当前多数方案都是只优化迁移策略,也就是只考虑用户移动过程中的服务器选择问题。然而,只考虑服务器的选择不能够让系统的性能达到最优,还需要考虑其他资源的优化,如移动用户发射功率,服务器端的计算资源分配等。
发明内容
针对现有技术存在的问题,本发明的目的在于提供一种动态MEC网络中迁移决策与资源分配的联合优化方法,其考虑了服务器选择、发射功率和服务器资源分配的优化,以实现在长期迁移代价的约束下用户的长期耗能最小。
为实现上述目的,本发明采用的技术方案是:
一种动态MEC网络中迁移决策和资源分配的联合优化方法,其包括以下步骤:
步骤1、将系统中的移动用户、服务器和系统的时间分别标注为和/>,目标是最小化用户端的长期能耗,根据该目标得到长期优化模型/>
步骤2、利用李雅普诺夫Lyapunov优化框架将长期优化模型转为每个时隙下的确定性优化模型/>
步骤2.1、引入虚拟队列,用来表示到时隙/>结束时执行的业务迁移超过的成本,初始时虚拟队列积压为0,即/>;/>的更新方法如下:
其中,是MEC服务提供商设置的长期平均迁移代价,/>表示在时隙/>内所有用户总的服务迁移代价,计算如下:
其中,表示用户/>的选择服务器从/>切换至服务器/>时所产生的迁移代价,若/>,则/>
步骤2.2、分别定义二次Lyapunov函数和Lyapunov漂移函数如下:
步骤2.3、定义Lyapunov漂移加惩罚函数如下:
其中,为控制参数,/>表示期望;
步骤2.4、根据Lyapunov理论,Lyapunov漂移加惩罚函数满足以下条件:,其中,/>,是一个有界常数;则长期优化模型/>转化为每个时隙下的确定性优化模型/>,在每个时隙/>使得/>的上界最小,即最小化/>
步骤3、在MEC系统中求取各个时隙用户任意服务器选择下使得最小的最优发射功率/>和服务器资源分配/>
步骤3.1、给定时,优化模型/>中的/>和/>通过步骤2.1进行计算得到,/>为定值,则每个服务器下的资源分配问题彼此独立;设时隙/>中每个服务器/>下的用户构成集合/>,则确定性优化模型/>转化为/>个并行求解的子模型/>,每一个子模型/>表示为:
为时隙/>内用户/>的能耗,/>为二进制变量,用于表示移动用户的服务器选择情况,/>表示在时隙/>内用户/>由服务器/>提供服务;
步骤3.2、写出子模型的拉格朗日函数/>,约束对应的拉格朗日乘子分别为/>,/>
步骤3.3、在给定拉格朗日乘子的前提下求解子模型最优;
具体地,给定拉格朗日乘子,然后分别对拉格朗日函数中发射功率和服务器端的资源分配求偏导,令各自的偏导为0,求得给定拉格朗日乘子下的最优资源分配,即发射功率/>和服务器资源分配/>
步骤3.4、使用次梯度方法更新拉格朗日乘子,为迭代次数,/>、/>和/>分别为大于零的步长,更新拉格朗日乘子更新方法如下:
表示/>
其中,表示用户/>在时隙/>的卸载数据量,单位为bit;/>表示用户/>在时隙/>需要的CPU周期,单位为cycle;/>表示用户/>在时隙/>允许的最大延迟,单位为s;/>为最大发射功率,/>为MEC服务器的最大计算频率,/>是平均小区干扰,/>是系统噪声,/>是时隙/>中用户/>与服务器/>之间的信道增益,计算如下:
其中,是时隙/>中用户/>与服务器/>之间的距离,是/>参考损耗,/>是路径损耗指数;
步骤3.5、重复步骤3.2-3.4,直至达到最大迭代次数或者用户总能耗收敛,求得给定下的最优发射功率/>与服务器资源分配/>
步骤4、使用MAPPO算法解决每个时隙下的最优服务器选择,使得Lyapunov漂移的上界最小;
步骤4.1、定义状态空间与动作空间;
每个用户作为一个智能体所能观测到的状态空间为
其中,表示代表时隙/>用户与每个服务器之间的信道状态,每个智能体的动作空间设置为
步骤4.2、定义奖励:将每一智能体的奖励设置为:
步骤5、通过基于MAPPO的强化学习算法获得每个时隙中最小化Lyapunov漂移的最优服务器选择;
具体地,给定最大训练回合数、单个回合中最大时隙数、折扣因子/>、截断系数/>,清空经验缓冲区,采用经验共享策略,所有智能体共享同一套参数,并随机初始化Actor的神经网络参数/>、Critic的神经网络参数/>
在每个时隙中,每个智能体基于观察到的MEC系统的状态/>,做出各自的服务选择/>,当所有的动作确定后,分别根据步骤2.1和步骤3.1-3.5计算虚拟队列/>以及用户长期总耗能/>,进而根据步骤4.2中计算出相应的奖励/>并进入下一个状态,将/>放入经验缓冲区;
每个回合结束时对智能体进行训练,从经验缓冲区中取出一批数据,更新Actor的神经网络参数、Critic的神经网络参数/>后清空缓冲区;当训练结束时,得到使系统Lyapunov漂移上界最小的最优服务器选择。
所述长期优化模型如下:
约束表示每个用户只能由一个服务器提供服务;
约束表示任意时隙内用户的发射功率不能超过最大发射功率;约束/>表示在任一时隙中服务器分配给所有用户的CPU频率之和不能超过MEC服务器的最大计算频率
约束表示任务是延迟敏感的,计算卸载花费的总时延不能超过其计算任务的最大计算截止时延;
约束表示长期平均迁移代价需要小于一定值。
所述优化模型具体如下:
约束表示每个用户只能由一个服务器提供服务;
约束表示任意时隙内用户的发射功率不能超过最大发射功率;约束/>表示在任一时隙中服务器分配给所有用户的CPU频率之和不能超过MEC服务器的最大计算频率
约束表示任务是延迟敏感的,计算卸载花费的总时延不能超过其计算任务的最大计算截止时延。
子模型具体表示为:
约束表示任意时隙内用户的发射功率不能超过最大发射功率;约束/>表示在任一时隙中服务器分配给所有用户的CPU频率之和不能超过MEC服务器的最大计算频率
约束表示任务是延迟敏感的,计算卸载花费的总时延不能超过其计算任务的最大计算截止时延。
所述时隙内用户/>的能耗/>由两部分组成,分别是通信能耗和等待能耗,通过下式计算,
其中,是用户功率放大器的漏极效率,/>是用户/>在时隙/>功率放大器的功率,是电路功率,/>是等待计算结果时的功耗,称之为等待功耗,/>是用户/>在时隙/>的传输时延,/>是用户/>在时隙/>服务器端的计算时延,计算如下,
其中,是每个用户的带宽,/>是用户/>在时隙/>的发射功率,/>是平均小区干扰,是系统噪声,/>是用户/>在时隙/>分得的服务器计算资源,/>是时隙/>中用户/>与服务器/>之间的信道增益。
所述拉格朗日函数表示如下:
其中,表示用户/>在时隙/>的卸载数据量,单位为bit;/>表示用户/>在时隙/>需要的CPU周期,单位为cycle;/>表示用户/>在时隙/>允许的最大延迟,单位为s;/>为最大发射功率,/>为MEC服务器的最大计算频率,/>是平均小区干扰,/>是系统噪声,/>是时隙/>中用户/>与服务器/>之间的信道增益。
所述步骤3.3中对拉格朗日函数中发射功率和服务器端的资源分配求偏导,令各自的偏导为0,结果如下:
采用上述方案后,本发明通过Lyapunov框架将长期问题转化为每个时隙下的确定性问题,涉及服务器选择,发射功率和服务器资源分配的优化。首先根据拉格朗日对偶分解得到给定服务器选择下的最优资源分配,然后结合深度强化学习求解服务器选择使得Lyapunov漂移最小,最终使得在长期迁移代价的约束下用户的长期能耗最小。
附图说明
图1为本发明适用的MEC系统示意图;
图2为本发明的方法流程图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
如图1所示,本发明揭示了一种动态MEC网络中迁移决策和资源分配的联合优化方法,适用于以设备为目标的服务模型。在本发明所应用的MEC系统中存在多个移动用户和多个服务器,用户在多个服务器的覆盖范围内移动,服务器的位置则保持不变。移动用户,服务器/>。MEC系统的时间被划分为等间隔的离散槽,时隙长度为/>
每个时隙用户都有一个需要卸载的任务,用户本身没有计算能力,需要将任务卸载至边缘服务器进行计算。用户在时隙/>的计算任务由元组/>表征,其中/>表示用户/>在时隙/>的卸载数据量,单位为bit,/>表示该任务需要的CPU周期,单位为cycle,/>表示该任务允许的最大延迟,单位为s。每个用户只能由一个服务器提供服务,而每个服务器能够服务多个用户,用户切换服务器会产生一定的迁移代价。用户的计算任务总能在一个时隙完成。
使用二进制变量来表示移动用户的服务器选择情况,/>表示在时隙/>内用户/>由服务器/>提供服务。使用/>表示用户/>的关联的服务器从/>切换至服务器/>时所产生的迁移代价。若/>,则/>。所以,在时隙/>内所有用户总的服务迁移代价表示为:
关联决策意味着用户/>切换了服务器,即进行了服务迁移,所以迁移策略在用户的服务器选择策略中隐性的表示。
时隙内用户/>的能耗/>由两部分组成,分别是通信能耗和等待能耗,通过下式计算:
其中,是用户功率放大器的漏极效率,/>是用户/>在时隙/>功率放大器的功率,是设备中除功率放大器外其他电路块如混频器、滤波器、本振、D/A转换器等的功率,称为电路功率。/>是等待计算结果时的功耗,称之为等待功耗,/>是用户/>在时隙/>的传输时延,/>是用户/>在时隙/>服务器端的计算时延,计算如下:
其中,是每个用户的带宽,/>是用户/>在时隙/>的发射功率,/>是平均小区干扰,是系统噪声,/>是用户/>在时隙/>分得的服务器计算资源,/>是时隙/>中用户/>与服务器/>之间的信道增益,计算如下:
其中,是时隙/>中用户/>与服务器/>之间的距离,/>是参考损耗,/>是路径损耗指数,/>是MEC服务提供商设置的长期平均迁移代价。任务时延/>是时隙/>中用户/>传输时延和服务器计算时延之和,计算如下:
本发明的目标是在满足长期迁移成本约束的前提下,最小化用户端的长期总能耗。表述为:
约束表示每个用户只能由一个服务器提供服务;约束/>表示任意时隙内用户的发射功率不能超过最大发射功率;约束/>表示在任一时隙中服务器分配给所有用户的CPU频率之和不能超过MEC服务器的最大计算频率/>;约束/>表示任务是延迟敏感的,计算卸载花费的总时延不能超过其计算任务的最大计算截止时延;约束/>表示长期平均迁移代价需要小于一定值。
模型是一个多阶段随机优化模型,和普通优化模型相比多了阶段性与随机性。约束/>使得需要迭代求解每一个时刻期望,但全部时间段的信息无法提前预知。李雅普诺夫(Lyapunov)优化技术为解耦多阶段随机模型提供了一种有效的方法。它不需要任何先验的系统信息,同时以在线的方式保持队列的稳定性。因此,本发明提出了一种结合Lyapunov优化的深度强化学习(Deep Reinforcement Learning, DRL)方法,首先基于Lyapunov优化技术提出了一种在线算法,将原始优化问题转化为一系列实时的最小化模型。然后将每个时隙下依然非凸的问题分解为发射功率与计算资源分配联合优化模型和服务器选择优化模型,并分别提出了基于朗格朗日对偶分解和基于DRL的求解算法。最终在满足长期迁移成本约束的前提下,最小化用户端的长期总能耗。
如图2所示,本发明的优化方法具体包括以下步骤:
步骤1、将该系统中的移动用户、服务器和系统的时间分别标注为,/>和/>
步骤2、利用Lyapunov框架将长期总能耗优化模型转为每个时隙下的确定性优化模型/>,具体如下:
步骤2.1、引入虚拟队列,用来表示到时隙/>结束时执行的业务迁移超过的成本,也就是迁移成本队列。初始时,队列积压为0,即/>,/>的更新方法如下:
步骤2.2、分别定义二次Lyapunov函数和Lyapunov漂移函数/>如下:
步骤2.3、定义Lyapunov漂移加惩罚函数如下:
其中,为控制参数,/>表示期望。
步骤2.4、根据Lyapunov框架,Lyapunov漂移加惩罚函数满足以下条件
其中,,是一个有界常数;
原多阶段随机优化模型转化为每个时隙下的确定性优化模型/>
即在每个时隙使得/>的上界最小。
步骤3、在MEC系统中求取各个时隙中任意取值下使得最小的/>和/>,即求解上述模型/>
此时和/>已知,/>为定值,使用拉格朗日对偶分解计算各种给定服务器选择下的资源分配模型,使得用户总能耗/>最小。
步骤3.1、给定时,每个服务器下的资源分配模型彼此独立,设时隙/>中每个服务器/>下的用户构成集合/>,则模型/>转化为/>个并行求解的子模型,每个子模型表述为/>
步骤3.2、写出子模型的拉格朗日函数/>,约束对应的拉格朗日乘子分别为/>,/>如下:
步骤3.3、在给定拉格朗日乘子的前提下求解子模型最优。
具体地,给定拉格朗日乘子,然后分别对拉格朗日函数中发射功率和服务器端的资源分配求偏导,令各自的偏导为0,有:
求得给定拉格朗日乘子下的最优资源分配,即发射功率和服务器资源分配/>
步骤3.4、使用次梯度方法更新拉格朗日乘子,为迭代次数,/>、/>和/>分别为大于零的步长。更新拉格朗日乘子更新方法如下:
表示/>
步骤3.5、重复步骤3.2-3.4,直至达到最大迭代次数或者用户总能耗收敛,求得给定下的最优发射功率/>与服务器资源分配/>
步骤4、将服务器选择模型表述为深度强化学习模型,并使用MAPPO算法解决每个时隙下的最优服务器选择,使得Lyapunov漂移的上界最小。
步骤4.1、定义状态空间与动作空间/>
每个用户作为一个智能体所能观测到的状态空间为
其中,表示代表时隙/>用户与每个服务器之间的信道状态。
每个智能体的动作空间设置为
步骤4.2、定义奖励。
设置奖励可以反映什么行为决定对系统有利。在每个时隙中智能体根据观察结果采取行动并获得奖励,然后进入下一个状态。基于奖励,智能体更新策略,建立从状态到行动的映射。将所有智能体的奖励都设置为:
步骤5、通过基于MAPPO的强化学习算法获得每个时隙中最小化Lyapunov漂移的最优服务器选择;
给定最大训练回合数、单个回合中最大时隙数、折扣因子/>、截断系数/>,清空经验缓冲区,采用经验共享策略,所有智能体共享同一套参数,并随机初始化Actor的神经网络参数/>、Critic的神经网络参数/>
在每个时隙中,每个智能体基于观察到的MEC系统的状态空间/>,做出各自的服务选择动作空间/>,当所有的动作确定后,分别根据步骤2.1和步骤3.1-3.5计算虚拟队列/>以及用户总耗能/>,进而根据步骤4.2中计算出相应的奖励/>并转换至下一个状态/>,将/>放入经验缓冲区。/>
每个回合结束时对智能体进行训练,从经验缓冲区中取出一批数据,更新Actor的神经网络参数、Critic的神经网络参数/>后清空缓冲区,当训练结束时,得到使系统Lyapunov漂移上界最小化的最优服务器选择。
本发明的关键在于,本发明通过Lyapunov框架将长期问题转化为每个时隙下的确定性问题,先根据拉格朗日对偶分解得到给定服务器选择下的最优资源分配,即用户的发射功率以及服务器端的计算资源分配,然后结合深度强化学习求解服务器选择使得Lyapunov漂移最小,最终使得在长期迁移代价的约束下用户的长期能耗最小。
以上所述,仅是本发明实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (7)

1.一种动态MEC网络中迁移决策和资源分配的联合优化方法,其特征在于,包括以下步骤:
步骤1、将系统中的移动用户、服务器和系统的时间分别标注为和/>,目标是最小化用户端的长期能耗,根据该目标得到长期优化模型/>
步骤2、利用李雅普诺夫Lyapunov优化框架将长期优化模型转为每个时隙下的确定性优化模型/>
步骤2.1、引入虚拟队列,用来表示到时隙/>结束时执行的业务迁移超过的成本,初始时虚拟队列积压为0,即/>;/>的更新方法如下:
其中,是MEC服务提供商设置的长期平均迁移代价,/>表示在时隙/>内所有用户总的服务迁移代价,计算如下:
其中,表示用户/>的选择服务器从/>切换至服务器/>时所产生的迁移代价,若,则/>
步骤2.2、分别定义二次Lyapunov函数和Lyapunov漂移函数如下:
步骤2.3、定义Lyapunov漂移加惩罚函数如下:
其中,为控制参数,/>表示期望;
步骤2.4、根据Lyapunov理论,Lyapunov漂移加惩罚函数满足以下条件:,其中,/>,是一个有界常数;则长期优化模型/>转化为每个时隙下的确定性优化模型/>,在每个时隙/>使得/>的上界最小,即最小化/>
步骤3、在MEC系统中求取各个时隙用户任意服务器选择下使得最小的最优发射功率/>和服务器资源分配/>
步骤3.1、给定时,优化模型/>中的/>和/>通过步骤2.1进行计算得到,/>为定值,则每个服务器下的资源分配问题彼此独立;设时隙/>中每个服务器/>下的用户构成集合,则确定性优化模型/>转化为/>个并行求解的子模型/>,每一个子模型/>表示为:
为时隙/>内用户/>的能耗,/>为二进制变量,用于表示移动用户的服务器选择情况,/>表示在时隙/>内用户/>由服务器/>提供服务;
步骤3.2、写出子模型的拉格朗日函数/>,约束对应的拉格朗日乘子分别为/>,/>
步骤3.3、在给定拉格朗日乘子的前提下求解子模型最优;
具体地,给定拉格朗日乘子,然后分别对拉格朗日函数中发射功率和服务器端的资源分配求偏导,令各自的偏导为0,求得给定拉格朗日乘子下的最优资源分配,即发射功率/>和服务器资源分配/>
步骤3.4、使用次梯度方法更新拉格朗日乘子,为迭代次数,/>、/>和/>分别为大于零的步长,更新拉格朗日乘子更新方法如下:
表示/>
其中,表示用户/>在时隙/>的卸载数据量,单位为bit;/>表示用户/>在时隙/>需要的CPU周期,单位为cycle;/>表示用户/>在时隙/>允许的最大延迟,单位为s;/>为最大发射功率,/>为MEC服务器的最大计算频率,/>是平均小区干扰,/>是系统噪声,/>是时隙/>中用户/>与服务器/>之间的信道增益,计算如下:
其中,是时隙/>中用户/>与服务器/>之间的距离,是/>参考损耗,/>是路径损耗指数;
步骤3.5、重复步骤3.2-3.4,直至达到最大迭代次数或者用户总能耗收敛,求得给定下的最优发射功率/>与服务器资源分配/>
步骤4、使用MAPPO算法解决每个时隙下的最优服务器选择,使得Lyapunov漂移的上界最小;
步骤4.1、定义状态空间与动作空间;
每个用户作为一个智能体所能观测到的状态空间为
其中,表示代表时隙/>用户与每个服务器之间的信道状态,每个智能体的动作空间设置为
步骤4.2、定义奖励:将每一智能体的奖励设置为:
步骤5、通过基于MAPPO的强化学习算法获得每个时隙中最小化Lyapunov漂移的最优服务器选择;
具体地,给定最大训练回合数、单个回合中最大时隙数、折扣因子/>、截断系数/>,清空经验缓冲区,采用经验共享策略,所有智能体共享同一套参数,并随机初始化Actor的神经网络参数/>、Critic的神经网络参数/>
在每个时隙中,每个智能体基于观察到的MEC系统的状态/>,做出各自的服务选择,当所有的动作确定后,分别根据步骤2.1和步骤3.1-3.5计算虚拟队列/>以及用户长期总耗能/>,进而根据步骤4.2中计算出相应的奖励/>并进入下一个状态/>,将/>放入经验缓冲区;
每个回合结束时对智能体进行训练,从经验缓冲区中取出一批数据,更新Actor的神经网络参数、Critic的神经网络参数/>后清空缓冲区;当训练结束时,得到使系统Lyapunov漂移上界最小的最优服务器选择。
2.根据权利要求1所述的一种动态MEC网络中迁移决策和资源分配的联合优化方法,其特征在于,所述长期优化模型如下:
约束表示每个用户只能由一个服务器提供服务;
约束表示任意时隙内用户的发射功率不能超过最大发射功率;约束/>表示在任一时隙中服务器分配给所有用户的CPU频率之和不能超过MEC服务器的最大计算频率/>
约束表示任务是延迟敏感的,计算卸载花费的总时延不能超过其计算任务的最大计算截止时延;
约束表示长期平均迁移代价需要小于一定值。
3.根据权利要求1所述的一种动态MEC网络中迁移决策和资源分配的联合优化方法,其特征在于,所述优化模型具体如下:
约束表示每个用户只能由一个服务器提供服务;
约束表示任意时隙内用户的发射功率不能超过最大发射功率;约束/>表示在任一时隙中服务器分配给所有用户的CPU频率之和不能超过MEC服务器的最大计算频率/>
约束表示任务是延迟敏感的,计算卸载花费的总时延不能超过其计算任务的最大计算截止时延。
4.根据权利要求1所述的一种动态MEC网络中迁移决策和资源分配的联合优化方法,其特征在于,子模型具体表示为:
约束表示任意时隙内用户的发射功率不能超过最大发射功率;约束/>表示在任一时隙中服务器分配给所有用户的CPU频率之和不能超过MEC服务器的最大计算频率/>
约束表示任务是延迟敏感的,计算卸载花费的总时延不能超过其计算任务的最大计算截止时延。
5.根据权利要求1所述的一种动态MEC网络中迁移决策和资源分配的联合优化方法,其特征在于,所述时隙内用户/>的能耗/>由两部分组成,分别是通信能耗和等待能耗,通过下式计算,
其中,是用户功率放大器的漏极效率,/>是用户/>在时隙/>功率放大器的功率,/>是电路功率,/>是等待计算结果时的功耗,称之为等待功耗,/>是用户/>在时隙/>的传输时延,/>是用户/>在时隙/>服务器端的计算时延,计算如下,
其中,是每个用户的带宽,/>是用户/>在时隙/>的发射功率,/>是平均小区干扰,/>是系统噪声,/>是用户/>在时隙/>分得的服务器计算资源,/>是时隙/>中用户/>与服务器/>之间的信道增益。
6.根据权利要求1所述的一种动态MEC网络中迁移决策和资源分配的联合优化方法,其特征在于,所述拉格朗日函数表示如下:
其中,表示用户/>在时隙/>的卸载数据量,单位为bit;/>表示用户/>在时隙/>需要的CPU周期,单位为cycle;/>表示用户/>在时隙/>允许的最大延迟,单位为s;/>为最大发射功率,/>为MEC服务器的最大计算频率,/>是平均小区干扰,/>是系统噪声,/>是时隙/>中用户/>与服务器/>之间的信道增益。
7.根据权利要求1所述的一种动态MEC网络中迁移决策和资源分配的联合优化方法,其特征在于,所述步骤3.3中对拉格朗日函数中发射功率和服务器端的资源分配求偏导,令各自的偏导为0,结果如下:
CN202410177424.9A 2024-02-08 2024-02-08 一种动态mec网络中迁移决策与资源分配的联合优化方法 Pending CN117729571A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410177424.9A CN117729571A (zh) 2024-02-08 2024-02-08 一种动态mec网络中迁移决策与资源分配的联合优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410177424.9A CN117729571A (zh) 2024-02-08 2024-02-08 一种动态mec网络中迁移决策与资源分配的联合优化方法

Publications (1)

Publication Number Publication Date
CN117729571A true CN117729571A (zh) 2024-03-19

Family

ID=90205687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410177424.9A Pending CN117729571A (zh) 2024-02-08 2024-02-08 一种动态mec网络中迁移决策与资源分配的联合优化方法

Country Status (1)

Country Link
CN (1) CN117729571A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113286329A (zh) * 2021-05-19 2021-08-20 南京邮电大学 基于移动边缘计算的通信和计算资源联合优化方法
CN114143355A (zh) * 2021-12-08 2022-03-04 华北电力大学 一种电力物联网低时延安全云边端协同方法
CN114980039A (zh) * 2022-05-24 2022-08-30 中山大学 D2d协作计算的mec系统中的随机任务调度和资源分配方法
CN115877933A (zh) * 2022-11-28 2023-03-31 厦门大学 一种基于非完全重叠noma的mec系统的长期能耗优化方法
CN116193546A (zh) * 2022-11-17 2023-05-30 厦门大学 一种动态广义用户noma分组cchn-mec网络卸载决策优化方法
CN116209084A (zh) * 2023-03-07 2023-06-02 重庆邮电大学 一种能量收集mec系统中任务卸载和资源分配方法
US20230199061A1 (en) * 2021-09-17 2023-06-22 Chongqing University Of Posts And Telecommunications Distributed computation offloading method based on computation-network collaboration in stochastic network
CN116390161A (zh) * 2023-03-20 2023-07-04 重庆邮电大学 一种移动边缘计算中基于负载均衡的任务迁移方法
CN117354934A (zh) * 2023-10-24 2024-01-05 东南大学 一种多时隙mec系统双时间尺度任务卸载和资源分配方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113286329A (zh) * 2021-05-19 2021-08-20 南京邮电大学 基于移动边缘计算的通信和计算资源联合优化方法
US20230199061A1 (en) * 2021-09-17 2023-06-22 Chongqing University Of Posts And Telecommunications Distributed computation offloading method based on computation-network collaboration in stochastic network
CN114143355A (zh) * 2021-12-08 2022-03-04 华北电力大学 一种电力物联网低时延安全云边端协同方法
CN114980039A (zh) * 2022-05-24 2022-08-30 中山大学 D2d协作计算的mec系统中的随机任务调度和资源分配方法
CN116193546A (zh) * 2022-11-17 2023-05-30 厦门大学 一种动态广义用户noma分组cchn-mec网络卸载决策优化方法
CN115877933A (zh) * 2022-11-28 2023-03-31 厦门大学 一种基于非完全重叠noma的mec系统的长期能耗优化方法
CN116209084A (zh) * 2023-03-07 2023-06-02 重庆邮电大学 一种能量收集mec系统中任务卸载和资源分配方法
CN116390161A (zh) * 2023-03-20 2023-07-04 重庆邮电大学 一种移动边缘计算中基于负载均衡的任务迁移方法
CN117354934A (zh) * 2023-10-24 2024-01-05 东南大学 一种多时隙mec系统双时间尺度任务卸载和资源分配方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Y.LUO等: "DRL-Assisted Resource Allocation for Non-Completely Overlapping NOMA Based Dynamic MEC Systems", 《IEEE INTERNET OF THINGS JOURNAL》, 8 January 2024 (2024-01-08), pages 1 *
Z.JIAN等: "Joint Computation Offloading and Resource Allocation in C-RAN With MEC Based on Spectrum Efficiency", 《IEEE ACCESS》, vol. 7, 13 June 2019 (2019-06-13), pages 79056 - 79068, XP011732284, DOI: 10.1109/ACCESS.2019.2922702 *
吴大鹏等: "移动性感知的边缘服务迁移策略", 《通信学报》, vol. 41, no. 04, 14 April 2020 (2020-04-14), pages 1 - 13 *
李世超等: "基于车辆边缘计算的用户能耗最小化资源分配研究", 《电子科技大学学报》, vol. 49, no. 02, 30 March 2020 (2020-03-30), pages 206 - 212 *
黄思进等: "面向边缘车联网系统的智能服务迁移方法", 《系统仿真学报》, 19 December 2023 (2023-12-19), pages 1 - 13 *
黄恒杰等: "MSs-MEC中基于DRL的服务缓存和任务迁移联合优化算法", 《计算机应用研究》, 25 January 2024 (2024-01-25), pages 1 - 10 *

Similar Documents

Publication Publication Date Title
CN111836283B (zh) 一种基于mec多服务器的车联网资源分配方法
CN111405568B (zh) 基于q学习的计算卸载和资源分配方法及装置
CN108809695B (zh) 一种面向移动边缘计算的分布上行链路卸载策略
CN109413724B (zh) 一种基于mec的任务卸载和资源分配方案
CN109947545B (zh) 一种基于用户移动性的任务卸载及迁移的决策方法
CN111405569A (zh) 基于深度强化学习的计算卸载和资源分配方法及装置
CN111556572B (zh) 一种基于强化学习的频谱资源和计算资源联合分配方法
Liu et al. A constrained reinforcement learning based approach for network slicing
Guo et al. Energy efficient computation offloading for multi-access MEC enabled small cell networks
CN111800812B (zh) 一种应用在非正交多址接入的移动边缘计算网络中的用户接入方案的设计方法
Li et al. A delay-aware caching algorithm for wireless D2D caching networks
CN112512065B (zh) 支持mec的小小区网络中在移动感知下的卸载和迁移方法
CN110191489B (zh) 一种超密集网络中基于强化学习的资源分配方法及装置
CN116260871A (zh) 一种基于本地和边缘协同缓存的独立任务卸载方法
Wang et al. Task allocation mechanism of power internet of things based on cooperative edge computing
Jiang et al. Q-learning based task offloading and resource allocation scheme for internet of vehicles
CN117042050A (zh) 一种基于分布式混合异质决策的多用户智能数据卸载方法
CN111796880A (zh) 一种边缘云计算任务的卸载调度方法
Suzuki et al. Multi-agent deep reinforcement learning for cooperative offloading in cloud-edge computing
Hu et al. Mobility-aware offloading and resource allocation in MEC-enabled IoT networks
Dai et al. Multi-objective intelligent handover in satellite-terrestrial integrated networks
Merluzzi et al. Latency-constrained dynamic computation offloading with energy harvesting IoT devices
CN116828534B (zh) 基于强化学习的密集网络大规模终端接入与资源分配方法
Liu et al. Mobility-aware task offloading and migration schemes in scns with mobile edge computing
CN112689296B (zh) 一种异构IoT网络中的边缘计算与缓存方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination