CN114339819B

CN114339819B - 一种基于最优资源分配量和搜索算法的计算卸载方法

Info

Publication number: CN114339819B
Application number: CN202011228560.4A
Authority: CN
Inventors: 王岩; 杨钧尧
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2020-11-06
Filing date: 2020-11-06
Publication date: 2023-10-03
Anticipated expiration: 2040-11-06
Also published as: CN114339819A

Abstract

本发明涉及一种基于最优资源分配量和搜索算法的计算卸载方法。本发明将组合优化问题切分为资源分配问题和卸载决策问题两部分，首先利用任务信息与边缘服务器状态输入资源分配网络，根据任务密度，任务计算量与负载均衡作为优化函数，通过深度强化学习算法，获得假设任务在各个边缘服务器卸载计算时的最优资源分配量，融合资源分配网络输出与用户状态信息，基站信道信息，输入卸载决策网络，通过遗传算法，搜索最优化平衡时延与能耗的卸载决策，实现计算卸载。本发明在系统模型中引入时间参数，更贴近实际模型，在卸载决策部分使用最优资源分配量条件下的的搜索算法，无需迭代更新模型，提高了实时性。本发明方法具有实时性强，贴近实际等优点。

Description

一种基于最优资源分配量和搜索算法的计算卸载方法

技术领域

本发明涉及一种基于最优资源分配量和搜索算法的计算卸载方法，可用于多基站多边缘服务器环境下的计算卸载。

背景技术

随着科技的快速发展，移动设备流量急剧增长。由于自身资源及计算性能有限，智能移动设备在处理计算密集型和时间敏感型应用时面临能力不足的情况。使用网络边缘节点来处理分析数据的边缘计算模式应运而生，并与传统云计算模式形成互补。然而，边缘设备往往具有轻量化的特点，如何合理利用边缘有限的计算资源便成为边缘计算亟需解决的重要问题。

计算卸载为资源受限设备运行计算密集型应用提供计算资源，加快计算速度，节省能源，将移动终端的计算任务卸载到边缘云环境中，解决了设备在资源存储、计算性能以及能效等方面存在的不足。

然而，由于边缘计算目前缺乏统一的仿真模型，导致研究者们所建立的模型大多与实际不够相符。目前的相关研究多将卸载决策与资源分配看作一个组合优化问题，是不可分割的两部分，必须先解决卸载决策问题才能解决资源分配问题。已发表的论文“无线供电的移动边缘计算网络中基于深度强化学习的在线计算卸载”，通过从经验中学习二进制决策消除了解决组合优化问题的需要，并通过自适应参数调整优化进程，但只考虑了单边缘服务器的全部卸载，且将能量与基站发送射频能量联系起来，削减了资源分配问题的难度，先进行了卸载决策而后进行资源分配。已发表的论文“基于深度强化学习的移动边缘计算轻量级任务卸载策略优化”，对DQN算法进行了改进，但将卸载决策与资源分配放在同一个MDP问题中来解决，考虑多用户多边缘服务器时状态空间过大，具有较高的计算复杂度。已发表的论文“用于移动边缘计算网络的基于深度学习的分布式卸载—移动网络和应用”，使用多个并行的DNN来高效的生成卸载决策，但多个DNN同步训练与记忆，对用户之间同步执行联动过高，且固定了用户数，新用户难以加入。

发明内容

本发明的技术解决问题是：克服现有技术的不足，提供一种基于最优资源分配量和搜索算法的计算卸载方法。通过更贴近实际的仿真模型，引入参数漂移，对一日的任务进行优化。改变资源分配与卸载决策的顺序，消除解决组合优化问题的需要，降低计算复杂度，实现多目标联合优化。

本发明的技术方案是：一种基于最优资源分配量和搜索算法的边缘计算计算卸载方法，其实现步骤如下：

(1)获取周围距离最近的固定数量个边缘服务器的资源占用状态与任务N信息，包括任务数据量d_n，计算任务所需CPU周期数c_n，任务到来时间t_n与m个边缘服务器剩余资源量F^left＝(f₁，f₂，...f_m)；

(2)将计算任务所需CPU周期数c_n，任务到来时间t_n与m个边缘服务器剩余资源量F^left作为资源分配网络的输入，通过深度强化学习算法获得当前环境下的最优资源分配量作为输出，奖励函数主要目标为优化负载均衡；

(3)获取用户状态信息与基站信道状态信息，包括用户剩余计算资源用户能量传输效率/>用户数据发送功率/>与各个基站信道占用情况channel；

(4)融合任务信息，最优资源分配量，用户状态信息，基站信道状态信息作为新的状态输入卸载决策网络，通过遗传算法，优化函数平衡时延与能耗，搜索最优卸载决策，最终输出卸载决策，基站及信道选择决策与最终使用的边缘服务器的资源分配量，实现任务的计算卸载。

所述步骤(2)具体实现如下：

将资源分配任务化为马尔可夫决策过程，其MDP状态为：

x_n＝(task_n，edge environment)

其中task_n为第N个任务的数据量与计算所需CPU周期数，边缘服务器状态为边缘服务器剩余计算资源。不考虑用户与基站的状态信息直接假设将任务卸载到各个边缘服务器，因此输入不含有用户与基站的状态信息，通过如下奖励函数：

Cost_n1＝I^ρρ_n+I^cc_n/f_n+I^bb_n+I^finish+I^fail

其中Cost_n1就是第n个任务在资源分配部分的奖励函数；ρ_n为当前时间条件下的任务密度，c_n为计算任务所需CPU周期数，f_n为边缘服务器所分配的计算资源，b_n为负载均衡，即各边缘服务器之间占用资源的均衡程度，I^ρ，I^c，I^b均为所设权重，平衡各优化目标间优化份额，I^finish与I^fail表示任务完成与失败时的固定奖励与惩罚，任务失败时奖励函数前四项为0。

任务密度的表示依靠系统模型中通过改变环境的参数创造符合实际的仿真环境，以一天为一个周期，单用户需求处理的任务恒定为N个，分布符合两个正态分布取均值，其中上午A时刻与下午B时刻分别为高峰期，任务密度据此表示为：

负载均衡b_n表示依靠用户周围固定数量边缘服务器系统整体的熵值的计算，可以通过方差来进行表示：

其中n表示第n个任务，m表示第m个边缘服务器，F表示任务未卸载时边缘服务器占用的计算资源，F‘表示任务卸载后边缘服务器占用的计算资源。

通过以上MDP状态，动作，回报，及深度强化学习算法DDPG获得最优资源分配量。

所述步骤(3)具体实现如下：

用户的状态信息基于系统模型随机生成，而基站信道的状态信息倚靠任务密度进行改变，通过调整被占用频带的数量显示网络状态的拥挤程度，表示如下：

其中K∈[0，1]表示通信网络的最大拥挤程度，当K＝1时，在附图2中A或B时刻通信网络中没有可用频带，MBS表示宏基站个数，SBS表示微基站个数，Y表示各基站所含有的相同频带数。

所述步骤(4)具体实现如下:

将任务信息，最优资源分配量与用户信息，基站信道状态信息融合作为输入，此时原来的组合优化问题变为在当前最优资源分配量的条件下，选择最优卸载决策与选择最优基站及信道，而所有的可选卸载决策已经固定，只需要使用搜素算法寻找优化最优解即可。因此，在解决卸载决策问题时并非采用训练好的资源分配模型而是选择最优搜索，无需实时更新模型，便保证了实时性。

优化函数为：

Cost_n2＝I^tt_n+I^ee_n+I^finish+I^fail

其中，Cost_n2就是任务卸载后产生的时间与能量的加权消耗；t_n表示所用时延，e_n表示所耗能量，I^t，I^e均为所设权重，平衡各优化目标间优化份额，I^finish与I^fail表示任务完成与失败时的固定奖励与惩罚，任务失败时优化函数前三项为0。

至此，搜索到最优卸载决策后，完成任务的计算卸载。

本发明与现有技术相比的优点在于：

(1)与现有基于强化学习的方法相比，将资源分配问题提前，减小了状态空间的大小，降低了计算复杂度。

(3)与现有解决组合优化问题的方法相比，将优化函数切分，先对负载均衡进行优化，之后对能耗和时延进行优化，通过两部分逐步优化实现了时延，能耗与负载均衡的联合优化。

(2)与现有的仿真模型相比，引入参数漂移，考虑一天内随时间任务网密度，网络拥堵状况的变化，将一天的所有任务进行优化，获得更有说服力的优化效果。

附图说明

图1为本发明的程序流程图。

图2任务密度随时间变化曲线图。

具体实施方式

本发明可具体实施于物联网智能制造中仪器仪表等固定用户的计算卸载任务。仪器仪表是智能工厂现场数据智能感知与采集的基础和关键。在工业现场，智能需要分布到网络边缘侧，在边缘侧直接采集、感知、分析、预测、优化、决策，实现工业现场的自主化和协作化，提高工业现场的确定性和业务实时性，以满足在敏捷连接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。现有边缘计算计算卸载技术的系统模型考虑与实际相比比较简易，训练出的模型可迁移性较差，组合优化问题不易解决，本发明提供一种基于最优资源分配量和搜索算法的计算卸载方法。采用更贴近实际的仿真模型，引入参数漂移，增强方法可迁移性，改变资源分配与卸载决策的顺序，消除解决组合优化问题的需要，降低计算复杂度，实现多目标联合优化，在固定位置的用户端训练适用于该用户的卸载决策模型，保护用户安全与隐私。

如图1所示，本发明的具体实现步骤如下：

(1)获取周围距离发布计算任务的用户最近的固定数量个边缘服务器的资源占用状态与所发布计算任务的信息，包括任务数据量d_n，计算任务所需CPU周期数c_n，任务到来时间t_n与m个边缘服务器剩余资源量F^left＝(f₁，f₂，...f_m)；

(3)获取用户状态信息与基站信道状态信息，包括用户的剩余计算资源能量传输效率/>数据发送功率/>与各个基站信道占用情况channel；

所述步骤(2)具体实现如下：

将资源分配任务化为马尔可夫决策过程，其MDP状态为：

x_n＝(task_n，edge environment)

Cost_n1＝I^ρρ_n+I^cc_n/f_n+I^bb_n+I^finish+I^fail

其中ρ_n为当前时间条件下的任务密度，c_n为计算任务所需CPU周期数，f_n为边缘服务器所分配的计算资源，b_n为负载均衡，即各边缘服务器之间占用资源的均衡程度，I^ρ，I^c，I^b均为所设权重，平衡各优化目标间优化份额，I^finish与I^fail表示任务完成与失败时的固定奖励与惩罚，任务失败时奖励函数前四项为0。

任务密度的表示倚靠系统模型中通过改变环境的参数创造符合实际的仿真环境，如图2所示，以一天为一个周期，单用户需求处理的任务恒定为N个，分布符合两个正态分布取均值，其中上午A时刻与下午B时刻分别为高峰期，任务密度据此表示为：

负载均衡的表示依靠用户周围固定数量边缘服务器系统整体的熵值的计算，可以通过方差来进行表示:

其中n表示第n个任务，m表示第m个边缘服务器，其中F表示任务未卸载时边缘服务器占用的计算资源，F‘表示任务卸载后边缘服务器占用的计算资源。通过以上MDP状态，动作，回报，及深度强化学习算法DDPG获得最优资源分配量。

所述步骤(3)具体实现如下：

用户状态信息基于系统模型随机生成，而基站信道的状态信息倚靠任务密度进行改变，通过调整被占用频带的数量显示网络状态的拥挤程度，表示如下：

所述步骤(4)具体实现如下：

优化函数为：

Cost_n2＝I^tt_n+I^ee_n+I^finish+I^fail

其中，t_n表示所用时延，e_n表示所耗能量，I^t，I^e均为所设权重，平衡各优化目标间优化份额，I^finish与I^fail表示任务完成与失败时的固定奖励与惩罚，任务失败时优化函数前三项为0。

至此，搜索到最优卸载决策后，完成任务的计算卸载。

Claims

1.一种基于最优资源分配量和搜索算法的计算卸载方法，其特征在于，实现步骤如下：

(2)将计算任务所需CPU周期数c_n，任务到来时间t_n与m个边缘服务器剩余资源量F^left作为资源分配网络的输入，通过深度强化学习算法获得当前环境下的最优资源分配量作为输出，奖励函数目标为优化负载均衡；

(4)融合任务信息、最优资源分配量、用户状态信息、基站信道状态信息作为新的状态输入卸载决策网络，通过遗传算法，优化函数平衡时延与能耗，搜索最优卸载决策，最终输出卸载决策，基站及信道选择决策与最终使用的边缘服务器的资源分配量，实现任务的计算卸载。

2.根据权利要求1所述的基于最优资源分配量和搜索算法的计算卸载方法，其特征在于：所述步骤(2)具体实现如下：

将资源分配任务化为马尔可夫决策过程，其MDP状态为：

x_n＝(task_n，edge environment)

其中task_n为第N个任务的数据量与计算所需CPU周期数，边缘服务器状态为边缘服务器剩余计算资源；不考虑用户与基站的状态信息直接假设将任务卸载到各个边缘服务器，因此输入不含有用户与基站的状态信息，通过如下奖励函数：

Cost_n1＝I^ρρ_n+I^cc_n/f_n+I^bb_n+I^finish+I^fail

其中ρ_n为当前时间条件下的任务密度，c_n为计算任务所需CPU周期数，f_n为边缘服务器所分配的计算资源，b_n为负载均衡，即各边缘服务器之间占用资源的均衡程度，I^ρ，I^c，I^b均为所设权重，平衡各优化目标间优化份额，I^finish与I^fail表示任务完成与失败时的固定奖励与惩罚，任务失败时奖励函数前四项为0；

负载均衡的表示依靠用户周围固定数量边缘服务器系统整体的熵值的计算，通过方差表示：

3.根据权利要求1所述的基于最优资源分配量和搜索算法的计算卸载方法，其特征在于：所述步骤(3)具体实现如下：用户的状态信息基于系统模型随机生成，而基站信道的状态信息倚靠任务密度进行改变，通过调整被占用频带的数量显示网络状态的拥挤程度，表示如下：

其中K∈[0，1]表示通信网络的最大拥挤程度，MBS表示宏基站个数，SBS表示微基站个数，Y表示各基站所含有的相同频带数。

4.根据权利要求1所述的基于最优资源分配量和搜索算法的计算卸载方法，其特征在于：所述步骤(4)具体实现如下：将任务信息、最优资源分配量与用户状态信息、基站信道状态信息融合作为输入，此时原来的组合优化问题变为在当前最优资源分配量的条件下，选择最优卸载决策与选择最优基站及信道，而所有的可选卸载决策已经固定，只需要使用搜素算法寻找优化最优解即可；因此，在解决卸载决策问题时并非采用训练好的资源分配模型而是选择最优搜索，无需实时更新模型，便保证了实时性；

优化函数为：

Cost_n2＝I^tt_n+I^ee_n+I^finish+I^fail

其中，t_n表示所用时延，e_n表示所耗能量，I^t，I^e均为所设权重，平衡各优化目标间优化份额，I^finish与I^fail表示任务完成与失败时的固定奖励与惩罚，任务失败时优化函数前三项为0；

至此，搜索到最优卸载决策后，完成任务的计算卸载。