CN113590232A

CN113590232A - 一种基于数字孪生的中继边缘网络任务卸载方法

Info

Publication number: CN113590232A
Application number: CN202110965259.XA
Authority: CN
Inventors: 徐江; 柏基成; 李斌; 谈昊哲
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2021-08-23
Filing date: 2021-08-23
Publication date: 2021-11-02
Anticipated expiration: 2041-08-23
Also published as: CN113590232B

Abstract

本发明公开了一种基于数字孪生的中继边缘网络任务卸载方法，包括搭建中继边缘网络任务卸载策略模型；更新数字孪生体环境中对应的各个部分的状态；将数字孪生体的参数传入模拟任务卸载系统进行迭代训练，得到最优任务卸载策略模型；将最优任务卸载策略模型传输到模拟人工控制界面进行备份；将当前的数字孪生参数训练模型以及最优任务卸载策略模型传输到数字孪生体环境缓存，并由现实中的边缘服务器转发给每个中继节点，中继节点再转发给与其通信的用户终端；用户终端和中继节点根据最优任务卸载策略模型进行相应的任务卸载。本发明可以减少现实5G边缘计算技术在落地过程中的试错成本，提高了落地效率。

Description

一种基于数字孪生的中继边缘网络任务卸载方法

技术领域

本发明属于移动边缘计算技术领域，具体涉及一种基于数字孪生的中继边缘网络任务卸载方法。

背景技术

随着5G和工业互联网的快速发展，对边缘计算的需求愈加迫切，智能制造、智慧城市、车联网、云游戏等领域都对边缘计算服务提出了要求。

目前，边缘计算技术试点大多在4G或早期5G网络上进行，但现阶段有限的资源和碎片化的生态限制了边缘计算技术的发展和边缘服务器的部署，使得仍然有大部分用户无法直接享受到边缘计算技术的服务。这些用户有可能申请将本地无法及时计算的任务卸载到边缘服务器进行计算。但是，由于距离过远或者被建筑物等障碍阻挡等因素无法直接和边缘服务器建立通信链路。

面对差异化的用户需求和性能各异的终端设备，如何合理对边缘计算资源进行分配是不可避免的难题。在试点过程中，资源分配策略的改变会对现实中的边缘服务器和终端用户造成相当大的影响。

现有的边缘计算相关的技术大多是直接假设已知边缘服务器和终端用户设备的状态进行决策优化，减少能耗和时延。然而，对于更加复杂的现实情况不一定取得最优解。

数字孪生技术可以充分利用物理模型、传感器、运行历史等数据，集成多学科、多尺度的仿真过程，在虚拟空间中构建对实体的镜像，反映相对应物理实体的全生命周期过程，非常适合在当前阶段辅助边缘计算技术对现实情况进行适配和落地。

发明内容

本发明所要解决的技术问题是针对上述现有技术的不足，提供一种基于数字孪生的中继边缘网络任务卸载方法，帮助用户终端进行任务卸载，在可接受的代价范围内得到良好效果，同时帮助当前阶段的边缘计算技术对现实情况进行适配和落地。

为实现上述技术目的，本发明采取的技术方案为：

一种基于数字孪生的中继边缘网络任务卸载方法，包括：

步骤(1)：搭建中继边缘网络任务卸载策略模型，包括：物理通信卸载环境、数字孪生体环境、模拟任务卸载系统和模拟人工控制界面；

所述物理通信卸载环境，包括：物理边缘服务器，中继节点以及用户终端集合；

所述数字孪生体环境为边缘服务器将中继节点和用户终端训练得到的数字孪生参数模型聚合所构建的环境，包括：边缘服务器的状态、每个中继节点和用户终端的状态；

所述模拟任务卸载系统，包括：每一种卸载情况对应的人工智能算法模型库、基于DQN算法的卸载策略选择模块以及任务卸载策略模型缓存模块；

所述模拟人工控制界面为边缘服务器通过与真实人工控制界面进行虚实信息传递所构建的虚拟控制环境，决定了真正使用的数字孪生参数训练模型以及任务卸载策略模型；

步骤(2)：物理实体通过数字孪生参数模型更新数字孪生体环境中对应的各个部分的状态；

步骤(3)：数字孪生体环境将数字孪生体的参数传入模拟任务卸载系统进行迭代训练，得到最优任务卸载策略模型；

步骤(4)：将最优任务卸载策略模型传输到模拟人工控制界面进行备份；

步骤(5)：模拟人工控制界面将当前的数字孪生参数训练模型以及最优任务卸载策略模型传输到数字孪生体环境缓存，并由现实中的边缘服务器转发给每个中继节点，中继节点再转发给与其通信的用户终端；

步骤(6)：用户终端和中继节点根据最优任务卸载策略模型进行相应的任务卸载。

为优化上述技术方案，采取的具体措施还包括：

上述的用户终端包括智能手机、笔记本电脑、移动平板等设备；

用户终端在边缘服务器的覆盖范围之外。

上述的边缘服务器的状态包括边缘服务器的处理器频率、可用的内存容量、可用的信道以及工作状态；

中继节点的状态包括中继节点的处理器频率、传输功率、可用的信道以及工作状态；

用户终端的状态包括用户终端的处理器频率、传输功率、任务的数据量规模和计算复杂度、任务类型、设备类型、剩余能量。

上述的步骤(2)包括：

用户终端首先在本地迭代训练数字孪生参数模型，在任务卸载时将训练好的数字孪生参数模型一并传输到中继节点；

中继节点将用户终端和中继节点训练好的数字孪生参数模型打包传输到边缘服务器，边缘服务器在训练边缘服务器模型的同时聚合用户终端和中继节点的模型，在训练完成后更新数字孪生体环境中相应部分的状态。

上述的步骤(3)，模拟任务卸载系统中的训练过程包括：

步骤(3.1)：调用人工智能算法模型库得到：任务在用户终端本地计算不进行任务卸载、任务卸载到中继节点计算、任务卸载到边缘服务器计算，这三种情况各自的最优任务成本，将参数传入卸载策略选择模块；

步骤(3.2)：卸载策略选择模块先将步骤(3.1)三种情况的最优任务成本合成为最终卸载成本，结合数字孪生体环境的状态参数，卸载策略选择模块建立最小化最终成本的优化模型，使用DQN算法训练，得到最优任务卸载策略模型；

步骤(3.3)：使用数字孪生体环境的历史数据对最优任务卸载策略模型进行检测评估，将模型和评分暂存至任务卸载模型缓存模块；

步骤(3.4)：重复步骤(3.1)-步骤(3.3)直到评分符合标准或者训练结束，得到最终的最优任务卸载策略模型。

上述的步骤(3.1)中，任务在用户端本地计算，不进行任务卸载时，调用相关人工智能算法得到的最优任务成本记为

上述的步骤(3.1)中，任务卸载到中继节点计算时，对应的最优任务成本计算方法为：

中继节点j和用户终端i之间的传输速率记为

传输时延记为

传输过程中的能耗记为

任务在中继节点j计算所需的时间记为

中继节点j计算数字孪生参数训练模型并打包所需的时间为：

其中，

为中继节点j的CPU频率，D_j为中继节点j的本地数据集合，H为与中继节点j通信的用户终端的个数，完成训练以及打包后得到中继节点j的数字孪生参数模型

中继节点的能耗忽略不计；

任务卸载到中继节点计算时，对应的最优任务成本为：

调用相关人工智能算法，得到最优成本

上述的步骤(3.1)中，任务卸载到边缘服务器计算时，对应的最优任务成本计算方法为：

边缘服务器能直接接收的用户终端i的信号为：

其中，

是边缘服务器和用户终端i之间的信道，

是边缘服务器和用户终端i之间的噪声信号。边缘服务器通过中继节点j辅助接收到用户终端i的信号为：

其中，

是中继节点j的传输功率，

是中继节点j分给用户终端i到边缘服务器的辅助信道，

是对应信道上在边缘服务器处的噪声信号，

是归一化参数；

在边缘服务器处通过最大比值幅度合成得到用户终端i的信噪比为：

其中，P_i ^MT是用户终端i的传输功率，

是中继节点j和用户终端i之间的信道；

用户终端i与边缘服务器之间的传输速率为：

其中，W_i是边缘服务器和用户终端i之间的带宽。传输时延记为

传输能耗记为

任务在边缘服务器计算所需的时间记为

边缘服务器计算数字孪生参数训练模型并聚合中继节点和用户终端的数字孪生参数模型所需的时间为：

其中，f^ECS为边缘服务器的CPU频率，D^ECS为边缘服务器的本地数据集合，N为与边缘服务器通信的中继节点的个数；

由于

很小，并且f^ECS很高，相比训练边缘服务器的模型所用的时间，聚合中继节点模型所用的时间

可忽略不计；

完成训练后得到边缘服务器的数字孪生参数模型

边缘服务器的能耗忽略不计，任务卸载到边缘服务器计算时，对应的最优任务成本为：

调用相关人工智能算法，得到最优成本

上述的步骤(3.2)中，卸载策略选择模块建立最小化最终成本的优化模型：

用户终端i在步骤(3.1)三种情况下的最终卸载成本表示为：

其中，a_i∈{0,1},i＝1,2,3并且

对于用户终端i的每一个计算任务，选择哪种情况进行计算可以最小化最终成本，最小化最终成本的优化模型为：

其中，

为用户终端的预期能耗阈值。

上述的步骤(3.2)中，本发明使用DQN作为DRL算法的框架。

在训练过程中，卸载策略选择模块与数字孪生体环境交互得到每个迭代t任务卸载系统的状态：

学习Agent的动作表示为：

A_t＝{a_t|a_t∈I_t}

其中a_t是从可能的决策动作集合I_t中选择的动作；

奖励函数反映了所选动作在系统状态s_t中的得分，表示为：

其中ψ是保证R_t为正值的固定参数，λ是学习速率，μ_i(t)是迭代t时的最终成本；

使用神经网络Q(s,a；w)结合时间差分算法近似最优动作价值函数以得到最优任务卸载策略模型，并将最优任务卸载策略模型传入任务卸载模型缓存模块。

本发明具有以下有益效果：

(1)本发明采用数字孪生方法的进行模拟任务卸载决策，可以较大程度减少现实5G边缘计算技术在落地过程中的试错成本；在现阶段边缘计算资源有限的条件下帮助用户在可以接受的代价范围内得到结果；

(2)相比于其他任务卸载方法，本发明提出的数字孪生体环境随物理实体的变化而更新，确保了模拟任务卸载决策系统得到的卸载策略模型更贴近真实情况，提高了落地效率。

附图说明

图1为本发明的物理通信卸载环境示意图；

图2为基于数字孪生的中继边缘网络任务卸载方法的框架结构图；

图3为任务卸载策略模型的工作流程图。

具体实施方式

以下结合附图对本发明的实施例作进一步详细描述。

参见图1和图2，本发明的一种基于数字孪生的中继边缘网络任务卸载方法，包括：

实施例中，所述用户终端包括智能手机、笔记本电脑、移动平板等设备；

用户终端在边缘服务器的覆盖范围之外。

所述边缘服务器的状态包括边缘服务器的处理器频率、可用的内存容量、可用的信道以及工作状态；

步骤(5)：模拟人工控制界面将当前的数字孪生参数训练模型m^ECS、m^RN、m^UT以及最优任务卸载策略模型um^RN、um^UT传输到数字孪生体环境缓存，并由现实中的边缘服务器转发给每个中继节点，中继节点再转发给与其通信的用户终端；

实施例中，所述步骤(2)包括：

实施例中，所述步骤(3)，模拟任务卸载系统中的训练过程包括：

实施例中，步骤(3.1)：调用人工智能算法模型库得到三种情况对应的最优任务成本。

情况一：任务在用户端本地计算，不进行任务卸载时，对应的最优任务成本计算方法为：

对于每一个用户终端i，将其要计算的任务记为T_i＝(C_i,L_i)，其中C_i是任务的计算复杂度，L_i是任务的数据量大小；

任务在本地计算所需的时间记为

所需的能耗记为

用户终端i计算数字孪生参数训练模型所需的时间为：

其中，f_i ^UT为用户终端i的CPU频率，D_i用户终端i的本地数据集合，完成训练后得到用户终端i的数字孪生参数模型

该过程所需的能耗记为

用户终端i完成任务所需的总成本为：

其中，α_i∈(0,1)和β_i∈(0,1)是基于任务类型和设备类型决定的时延与能耗的权重系数；调用相关人工智能算法得到最优任务成本

情况二：任务卸载到中继节点计算时，对应的最优任务成本计算方法为：

中继节点j和用户终端i之间的传输速率记为

传输时延记为

传输过程中的能耗记为

任务在中继节点j计算所需的时间记为

中继节点j计算数字孪生参数训练模型并打包所需的时间为：

其中，

中继节点的能耗忽略不计；

任务卸载到中继节点计算时，对应的最优任务成本为：

调用相关人工智能算法，得到最优成本

情况三：任务卸载到边缘服务器计算时，对应的最优任务成本计算方法为：

边缘服务器能直接接收的用户终端i的信号为：

其中，

是边缘服务器和用户终端i之间的信道，

其中，

是中继节点j的传输功率，

是中继节点j分给用户终端i到边缘服务器的辅助信道，

是对应信道上在边缘服务器处的噪声信号，

是归一化参数；

其中，P_i ^MT是用户终端i的传输功率，

是中继节点j和用户终端i之间的信道；

用户终端i与边缘服务器之间的传输速率为：

传输能耗记为

任务在边缘服务器计算所需的时间记为

由于

可忽略不计；

完成训练后得到边缘服务器的数字孪生参数模型

调用相关人工智能算法，得到最优成本

实施例中，所述步骤(3.2)中，卸载策略选择模块建立最小化最终成本的优化模型：

用户终端i在步骤(3.1)三种情况下的最终卸载成本表示为：

其中，a_i∈{0,1},i＝1,2,3并且

其中，

为用户终端的预期能耗阈值。

所述步骤(3.2)中，本发明使用DQN作为DRL算法的框架。

学习Agent的动作表示为：

A_t＝{a_t|a_t∈I_t}

其中a_t是从可能的决策动作集合I_t中选择的动作；

奖励函数反映了所选动作在系统状态s_t中的得分，表示为：

图3具体展示了用户终端和中继节点执行任务卸载策略模型的过程，用户终端卸载决策模型会判断承担计算任务的最终对象，在本地计算时还会根据任务类型执行相应的优化目标策略，中继节点和边缘服务器的卸载决策模型根据任务类型执行相应的优化目标策略。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。

Claims

1.一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，包括：

2.根据权利要求1所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，所述用户终端包括智能手机、笔记本电脑、移动平板；

用户终端在边缘服务器的覆盖范围之外。

3.根据权利要求1所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，所述边缘服务器的状态包括边缘服务器的处理器频率、可用的内存容量、可用的信道以及工作状态；

4.根据权利要求1所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，所述步骤(2)包括：

5.根据权利要求1所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，所述步骤(3)，模拟任务卸载系统中的训练过程包括：

6.根据权利要求5所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，步骤(3.1)中，任务在用户端本地计算，不进行任务卸载时，调用相关人工智能算法得到的最优任务成本记为

7.根据权利要求5所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，所述步骤(3.1)中，任务卸载到中继节点计算时，对应的最优任务成本计算方法为：

中继节点j和用户终端i之间的传输速率记为

传输时延记为

传输过程中的能耗记为

任务在中继节点j计算所需的时间记为

中继节点j计算数字孪生参数训练模型并打包所需的时间为：

其中，

中继节点的能耗忽略不计；

任务卸载到中继节点计算时，对应的最优任务成本为：

调用相关人工智能算法，得到最优成本

8.根据权利要求5所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，所述步骤(3.1)中，任务卸载到边缘服务器计算时，对应的最优任务成本计算方法为：

边缘服务器能直接接收的用户终端i的信号为：

其中，

是边缘服务器和用户终端i之间的信道，

其中，

是中继节点j的传输功率，

是中继节点j分给用户终端i到边缘服务器的辅助信道，

是对应信道上在边缘服务器处的噪声信号，

是归一化参数；

其中，

是用户终端i的传输功率，

是中继节点j和用户终端i之间的信道；

用户终端i与边缘服务器之间的传输速率为：

传输能耗记为

任务在边缘服务器计算所需的时间记为

由于

可忽略不计；

完成训练后得到边缘服务器的数字孪生参数模型

调用相关人工智能算法，得到最优成本

9.根据权利要求5所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，所述步骤(3.2)中，卸载策略选择模块建立最小化最终成本的优化模型：

用户终端i在步骤(3.1)三种情况下的最终卸载成本表示为：

其中，a_i∈{0,1},i＝1,2,3并且

其中，

为用户终端的预期能耗阈值。

10.根据权利要求5所述的一种基于数字孪生的中继边缘网络任务卸载方法，其特征在于，所述步骤(3.2)中，本发明使用DQN作为DRL算法的框架。

学习Agent的动作表示为：

A_t＝{a_t|a_t∈I_t}

其中a_t是从可能的决策动作集合I_t中选择的动作；

奖励函数反映了所选动作在系统状态s_t中的得分，表示为：

使用神经网络Q(s,a；w)结合时间差分算法近似最优动作价值函数以得到最优任务卸载策略模型。