CN114138373A - 一种基于强化学习的边缘计算任务卸载方法 - Google Patents

一种基于强化学习的边缘计算任务卸载方法 Download PDF

Info

Publication number
CN114138373A
CN114138373A CN202111483883.2A CN202111483883A CN114138373A CN 114138373 A CN114138373 A CN 114138373A CN 202111483883 A CN202111483883 A CN 202111483883A CN 114138373 A CN114138373 A CN 114138373A
Authority
CN
China
Prior art keywords
task
node
calculation
user
computing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111483883.2A
Other languages
English (en)
Other versions
CN114138373B (zh
Inventor
于银辉
郭思宇
程国豪
田子玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202111483883.2A priority Critical patent/CN114138373B/zh
Publication of CN114138373A publication Critical patent/CN114138373A/zh
Application granted granted Critical
Publication of CN114138373B publication Critical patent/CN114138373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44594Unloading
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/502Proximity

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于强化学习的边缘计算任务卸载方法,包括以下步骤:S1.建立边缘计算系统模型;S2.普通用户节点产生任务上报至SDN总控制器节点,根据用户任务情况,选择本地计算或卸载计算,在需要进行卸载计算时,通过强化学习方法训练后的SDN总控制器节点根据实时网络状态,频谱资源和计算资源,获得基于边缘节点网络状态的最优卸载策略并反馈至普通用户节点;S3.普通用户节点根据最优卸载策略将任务卸载给服务节点,服务节点执行分配到的计算任务,并将计算结果反馈至普通用户节点。本发明能够有效缓解计算资源紧张的问题。

Description

一种基于强化学习的边缘计算任务卸载方法
技术领域
本发明涉及无线通信技术领域,更具体的说是涉及一种基于强化学习的边缘计算任务卸载方法。
背景技术
随着通信和计算技术的先进发展,具有联网需求的设备在数量上已经十分庞大,设备功能也呈现多样化的特点,如车联网,智能医疗等可预测的物联网应用也在蓬勃发展,其任务的可容忍时延具有非常严格的要求,而且联网设备数量的庞大必然会存在数据流量的爆发,这些都对传统的云计算的集中式计算处理与大规模数据存储提出了严峻的挑战,主要存在以下问题:1)延迟:设备与云计算中心距离较远,对于一些时延敏感型设备就会造成严重影响,例如车联网中,时延可能会对人的生命安全造成严重威胁;2)流量:设备数量的指数型增长必然也会造成流量的增多,通信堵塞,降低用户体验质量;3)安全及能耗:设备传输信息时,需要经过较长路径容易导致数据丢失或者信息泄露等风险;数据中心的高负载导致的高能耗也是云计算的核心问题。
上述问题均可由边缘计算加以解决,边缘计算即为将具有一定计算能力、存储能力的计算设备放置在网络边缘,即临近用户侧,为用户提供IT服务环境和计算功能,将原本位于云计算中心的服务和功能“下沉”到移动网络的边缘,在移动网络边缘提供计算、存储、网络和通信资源。这样设备就不需要向云计算中心服务器发送请求,很大程度上减少了通信时延。同时,由于可以在用户附近进行数据处理,减少了路由长度,安全性得到了一定的保障,并且能够有效缓解云计算中心主干道路上的拥塞。
因此,如何提供一种基于强化学习的边缘计算任务卸载方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于强化学习的边缘计算任务卸载方法,用于解决传统云计算中所存在的技术问题。
为了实现上述目的,本发明采用如下技术方案:
一种基于强化学习的边缘计算任务卸载方法,包括以下步骤:
S1.建立边缘计算系统模型,边缘计算系统模型包括:普通用户节点、可租用用户节点、MEC服务器节点和SDN总控制器节点,其中,每个SDN总控制器节点下,包括N个泊松分布的普通用户节点N={u1,u2,u3,…,uN},可租用用户节点和MEC服务器节点作为服务节点共M个,记为K={k1,k2,k3,…,kM};
S2.普通用户节点产生任务上报至SDN总控制器节点,根据用户任务情况,选择本地计算或卸载计算,在需要进行卸载计算时,通过强化学习方法训练后的SDN总控制器节点根据实时网络状态,频谱资源和计算资源,获得基于边缘节点网络状态的最优卸载策略并反馈至普通用户节点;
S3.普通用户节点根据最优卸载策略将任务卸载给服务节点,服务节点执行分配到的计算任务,并将计算结果反馈至普通用户节点。
优选的,S2中选择本地计算或卸载计算的具体内容包括:
普通用户节点产生的一个任务Ri包括:当前任务的数据包大小di,当前任务的最大可容忍时延
Figure BDA0003396654120000021
当前任务计算能力需求αi
根据本地计算能力获取在时隙t时任务计算执行时间
Figure BDA0003396654120000022
具体方法为:
Figure BDA0003396654120000023
若当前任务本地执行所需时间不超过最大可容忍时延
Figure BDA0003396654120000031
则在本地执行,若不是则选择卸载计算。
优选的,对SDN总控制器节点进行强化学习训练的内容包括:
在每个时隙t,SDN总控制器节点根据当前环境状态st,发布卸载策略进行动作at选择,普通用户节点采取动作at,根据所采取的每个动作at返回一个奖赏值信号rt+1和一个新的状态St+1,将新的状态St+1更新当前环境状态st进行循环迭代;
针对每个环境状态st和动作at通过Q-learning函数计算Q值,并根据Q值通过Bellman最优方程获取最优策略,使总期望回报最大化;
其中,环境状态st∈S,S为所有状态的合集,每个环境状态s包括:系统总开销e,当前信道使用情况g,服务节点有效计算资源f;动作at∈A,A为所有动作的合集。
优选的,在迭代过程中,通过学习率δ来进行更新Q值,Q值的更新表达式为:
Figure BDA0003396654120000032
其中,δ(0≤δ≤1)为学习率,表示当前学习的知识对先前学习的知识的影响。
优选的,动作选择包括信道选择、功率选择和计算资源选择,表示为通道、功率、计算资源矩阵at=[cg,p,cf]。
优选的,产生奖赏值信号的奖赏函数r为规定时隙t内所有任务的计算及传输能耗与可容忍时延满足情况的联合效用值:
Figure BDA0003396654120000033
其中,etran(t),ecomp(t)表示当前任务的传输能耗以及计算能耗,Ttran(t),Tcomp(t)分别为当任务卸载执行时,任务传输时间与计算时间,
Figure BDA0003396654120000034
Figure BDA0003396654120000035
均为权重系数,Pout表示当任务实际时延超过可容忍时延时产生的惩罚值。
优选的,根据Q值通过Bellman最优方程获取最优策略的具体方法为:
Figure BDA0003396654120000041
其中,ζ值反映未来收益相对于当前收益的重要性,若ζ趋向于0,倾向于考虑立即的回报;若ζ趋向于1时,则更关注未来的收益;
最优策略表示为:
Figure BDA0003396654120000042
优选的,服务节点卸载计算时,首先卸载计算任务,通过无线通信链路将计算任务发送给服务节点;计算任务从用户传输到服务节点的时间为:
Figure BDA0003396654120000043
其中,VM为边缘计算网络的数据传输能力;
当数据卸载到服务节点时,将执行数据计算;执行数据计算的时间为:
Figure BDA0003396654120000044
其中,
Figure BDA0003396654120000045
为服务节点的计算数据处理能力;
当任务卸载到服务节点进行计算时,任务处理时间为:
Figure BDA0003396654120000046
优选的,普通用户节点将任务卸载给服务器节点进行D2I模式通信,将任务卸载给附近的可租用用户节点进行D2D模式通信,并使D2I模式和D2D模式工作在同一频段;
将系统的总频谱分为G个正交子信道,G={1,2,3,…,g},将子信道的带宽设为BHz,假设每个普通用户节点都有一个计算密集型任务要完成,并且每个用户仅被分配一个子通道,子信道的信噪比为:
Figure BDA0003396654120000047
其中,pi表示用户的上行传输功率,
Figure BDA0003396654120000051
表示用户Di与服务节点Sj进行数据传输时的所使用子信道g的信道增益,N0为高斯白噪声,
Figure BDA0003396654120000052
表示D2I模式通信用户对Di的干扰,
Figure BDA0003396654120000053
表示D2D模式通信对Di的干扰;
当计算任务在服务节点执行时,D2I模式干扰为:
Figure BDA0003396654120000054
其中Nc为D2I模式执行计算任务的所有用户节点,φx,g表示子信道g是否被分配给x,φx,g取0或1,φx,g=1时表示g被分配给x;
D2D模式干扰为:
Figure BDA0003396654120000055
上行链路传输速率为:
Figure BDA0003396654120000056
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于强化学习的边缘计算任务卸载方法,该方法针对边缘计算网络,基于软件定义网络技术下,由SDN控制器收集网络状态,计算资源,用户任务情况等,无需用户参与决策,以用户任务对时延的要求和总体能耗为优化目标,并提出可租用用户节点来缓解计算资源紧张的问题的一种计算卸载和资源分配的方法。该方法的优势在于SDN总控制器对于整体网络状态与资源的掌握,回收用户自主决策权力,进行集中控制,以减少对用户设备智能程度的要求,并能够达成在满足用户需求的同时,对整体能耗的优化,而不是某个用户的能耗优化。另外,对于可租用节点的合理利用减少了可用资源的闲置,增加资源的利用率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的一种基于强化学习的边缘计算任务卸载方法中系统模型示意图;
图2附图为本发明提供的一种基于强化学习的边缘计算任务卸载方法中卸载过程示意图;
图3附图为本发明提供的一种基于强化学习的边缘计算任务卸载方法中的整体流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于强化学习的边缘计算任务卸载方法,下面将进一步详细对上述方法进行说明:
1.构建系统模型框架
系统模型构建如图1所示,将边缘计算网络中设备节点主要分为四种:普通用户节点,可租用用户节点,MEC服务器节点,软件定义网络(Software Defined Network,SDN)总控制器节点。普通用户节点一定时间内较高概率产生计算密集型任务,计算能力较差,可租用用户节点一定时间内较低概率产生计算任务或具备一定计算能力,愿意将闲置的资源出租给附近用户节点,接受系统卸载的计算任务,并在计算后返回结果,MEC服务器节点为固定位置的能够提供存储,计算能力较高的设备,SDN总控制器能够收集实时网络状态,以及用户节点的任务产生情况和服务器节点的使用情况,并应答用户节点的任务申请。由于可租用用户的存在,普通用户节点既可以将任务卸载给服务器节点进行D2I模式通信,也可以将任务卸载给附近的可租用用户进行D2D模式通信。如图1所示:在SDN总控制器范围内,有N个用户泊松分布,N={u1,u2,u3,…,uN}。由于可租用用户节点和MEC服务器节点都可以提供计算服务,因此将它们统一定义为服务节点,表示为K={k1,k2,k3,…,kM}。
2.任务模型及卸载过程
当用户产生任务时,一个任务将被描述为
Figure BDA0003396654120000071
其中di表示为该任务的数据包大小,
Figure BDA0003396654120000072
表示为该任务可容忍的最大时延,αi为该任务计算能力需求。服务节点则可被描述为Kj=cj,j∈M。cj表示该服务节点的计算能力,具体描述为CPU周期。
由于用户节点自身计算能力有限,所以当任务计算需求较大或者对时延敏感,就要借助附近服务节点进行计算,以满足时延要求,计算卸载过程如图2所示。
卸载具体步骤描述如下:
(1)用户节点向附近无线接入节点(例如RSU和基站)发送卸载请求,接入点将请求转发给SDN控制器。
(2)收到卸载请求后,SDN控制器获得基于边缘节点网络状态的最优卸载策略。实时计算资源和卸载的数据容量以及复杂性指标任务,并确定是否卸载用户的任务。如果卸载,将卸载任务分配给哪个服务节点进行处理,通过无线接入点将卸载策略返回给用户节点。
(3)服务器节点接收卸载策略后,如果不需要卸载,则用户节点在本地计算。如果需要卸载,则将需要卸载的计算任务上传到接入点,接入点根据卸载决策对卸载任务进行分解,并将其发送到指定的服务节点。
(4)服务节点收到分配的计算任务后开始执行。执行结束后,通过接入点将计算结果返回给用户节点。
3.传输模型
根据上述描述,计算任务可以分为本地执行和服务节点执行,当SDN控制器做决策时需要计算其任务时延,假设计算任务被描述为
Figure BDA0003396654120000081
时,其中di为计算任务的数据量,
Figure BDA0003396654120000082
为该任务可容忍时延,αi为该任务计算能力需求。当进行本地计算时,本地计算能力描述为
Figure BDA0003396654120000083
在时隙t时,该次任务计算执行时间可表述为:
Figure BDA0003396654120000084
服务节点卸载计算时,首先卸载计算任务,通过无线通信链路将计算任务发送给服务节点。计算任务从用户传输到服务节点的时间可以表述为:
Figure BDA0003396654120000085
公式中,VM为边缘计算网络的数据传输能力,当数据卸载到服务节点时,将执行数据计算。假设服务节点的计算数据处理能力为
Figure BDA0003396654120000086
则数据计算的执行时间可表述为:
Figure BDA0003396654120000087
因此,当任务卸载到服务节点进行计算时,任务处理时间可表述为:
Figure BDA0003396654120000088
为合理使用频谱资源,可以复用频谱,让D2I模式和D2D模式工作在同一频段。系统的总频谱分为G个正交子信道,G={1,2,3,…,g},将子信道的带宽设为B Hz,假设每个普通用户节点都有一个计算密集型任务要完成,并且每个用户仅被分配一个子通道。而子信道的信噪比可以表述为:
Figure BDA0003396654120000091
其中,pi表示用户的上行传输功率,
Figure BDA0003396654120000092
表示用户Di与服务节点Sj进行数据传输时的所使用子信道g的信道增益,N0为高斯白噪声,
Figure BDA0003396654120000093
表示D2I模式通信用户对Di的干扰,
Figure BDA0003396654120000094
表示D2D模式通信对Di的干扰。当计算任务在服务节点执行时,D2I模式干扰如下公式所示:
Figure BDA0003396654120000095
其中Nc为D2I模式执行计算任务的所有用户节点,φx,g表示子信道g是否被分配给x,φx,g可取0或1,φx,g=1时表示g被分配给x。
同理,D2D模式干扰如下公式所示:
Figure BDA0003396654120000096
综上,上行链路传输速率为
Figure BDA0003396654120000097
4.基于强化学习的通信与计算资源分配
强化学习是一种机器学习。在解决顺序决策问题时,智能体使用强化学习来寻找有效的策略。这个策略决定了智能体应该如何在它可能遇到的每个状态中做出最佳选择。与监督学习不同,代理不能确定行为是否正确。相反地,我们使用了一个由价值表示的奖励信号。代理的当前行为不仅会影响它获得的即时奖励,还会影响下一个状态或未来的奖励。
SDN控制器能够收集网络状态,计算资源和用户任务情况,因此可以由SDN控制器进行统筹分配资源让用户任务进行卸载,SDN控制器策略选择的最终目标为系统总开销以及任务时延的联合最优策略。
在每个时隙t,当前环境状态st∈S,其中S为所有状态的合集,然后采取动作at∈A,A为所有动作的合集,环境会返回一个奖赏值信号rt+1和一个新的状态st+1。系统状态的设置分为三个部分,S={e,g,f},其中e表示系统总开销,g为当前信道使用情况,f为服务节点有效计算资源。SDN总控制器的动作选择为信道选择,功率选择,以及计算资源选择,表示为通道、功率、计算资源矩阵at=[cg,p,cf]。其奖赏函数r设置为规定时隙t内所有任务的计算及传输能耗与可容忍时延满足情况的联合效用值,公式如下:
Figure BDA0003396654120000101
其中,etran(t),ecomp(t)表示当前任务的传输能耗以及计算能耗,
Ttran(t),Tcomp(t)表示当任务卸载执行时,任务传输时间与计算时间,其中
Figure BDA0003396654120000102
Figure BDA0003396654120000103
为权重系数,Pout表示当任务实际时延超过可容忍时延时产生的惩罚值。
Q-learning使用Q函数作为评价函数,并将其定义为状态-行为值函数,并使用Bellman最优方程给出最优策略,使总期望回报最大化。
Figure BDA0003396654120000104
其中,ζ值反映了未来收益相对于当前收益的重要性。如果ζ趋向于0,倾向于考虑立即的回报;当ζ趋向于1时,则更关注未来的收益。
最优策略表示为:
Figure BDA0003396654120000105
根据实施场景中,用户数与服务器数量合理设置迭代次数,在迭代过程中,Q值需要更新,但不能遍历所有的状态动作对。因此,我们使用学习率δ来操作有限的样本。那么Q值的更新表达式可以表示为:
Figure BDA0003396654120000106
其中,δ(0≤δ≤1)为学习率,表示当前学习的知识对先前学习的知识的影响。
通过迭代学习,SDN控制器将在一段时间后,基于当前网络状态,衡量计算资源以及用户任务情况等采取较优的计算卸载方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种基于强化学习的边缘计算任务卸载方法,其特征在于,包括以下步骤:
S1.建立边缘计算系统模型,边缘计算系统模型包括:普通用户节点、可租用用户节点、MEC服务器节点和SDN总控制器节点,其中,每个SDN总控制器节点下,包括N个泊松分布的普通用户节点N={u1,u2,u3,…,uN},可租用用户节点和MEC服务器节点作为服务节点共M个,记为K={k1,k2,k3,…,kM};
S2.普通用户节点产生任务上报至SDN总控制器节点,根据用户任务情况,选择本地计算或卸载计算,在需要进行卸载计算时,通过强化学习方法训练后的SDN总控制器节点根据实时网络状态,频谱资源和计算资源,获得基于边缘节点网络状态的最优卸载策略并反馈至普通用户节点;
S3.普通用户节点根据最优卸载策略将任务卸载给服务节点,服务节点执行分配到的计算任务,并将计算结果反馈至普通用户节点。
2.根据权利要求1所述的一种基于强化学习的边缘计算任务卸载方法,其特征在于,S2中选择本地计算或卸载计算的具体内容包括:
普通用户节点产生的一个任务Ri包括:当前任务的数据包大小di,当前任务的最大可容忍时延
Figure FDA0003396654110000011
当前任务计算能力需求αi
根据本地计算能力获取在时隙t时任务计算执行时间
Figure FDA0003396654110000012
具体方法为:
Figure FDA0003396654110000013
若当前任务本地执行所需时间不超过最大可容忍时延
Figure FDA0003396654110000014
则在本地执行,若不是则选择卸载计算。
3.根据权利要求1所述的一种基于强化学习的边缘计算任务卸载方法,其特征在于,对SDN总控制器节点进行强化学习训练的内容包括:
在每个时隙t,SDN总控制器节点根据当前环境状态st,发布卸载策略进行动作at选择,普通用户节点采取动作at,根据所采取的每个动作at返回一个奖赏值信号rt+1和一个新的状态st+1,将新的状态st+1更新当前环境状态st进行循环迭代;
针对每个环境状态st和动作at通过Q-learning函数计算Q值,并根据Q值通过Bellman最优方程获取最优策略,使总期望回报最大化;
其中,环境状态st∈S,S为所有状态的合集,每个环境状态s包括:系统总开销e,当前信道使用情况g,服务节点有效计算资源f;动作at∈A,A为所有动作的合集。
4.根据权利要求3所述的一种基于强化学习的边缘计算任务卸载方法,其特征在于,在迭代过程中,通过学习率δ来进行更新Q值,Q值的更新表达式为:
Figure FDA0003396654110000021
其中,δ(0≤δ≤1)为学习率,表示当前学习的知识对先前学习的知识的影响。
5.根据权利要求3所述的一种基于强化学习的边缘计算任务卸载方法,其特征在于,动作选择包括信道选择、功率选择和计算资源选择,表示为通道、功率、计算资源矩阵at=[cg,p,cf]。
6.根据权利要求3所述的一种基于强化学习的边缘计算任务卸载方法,其特征在于,产生奖赏值信号的奖赏函数r为规定时隙t内所有任务的计算及传输能耗与可容忍时延满足情况的联合效用值:
Figure FDA0003396654110000022
其中,etran(t),ecomp(t)表示当前任务的传输能耗以及计算能耗,Ttran(t),Tcomp(t)分别为当任务卸载执行时,任务传输时间与计算时间,
Figure FDA0003396654110000023
Figure FDA0003396654110000024
均为权重系数,Pout表示当任务实际时延超过可容忍时延时产生的惩罚值。
7.根据权利要求1所述的一种基于强化学习的边缘计算任务卸载方法,其特征在于,根据Q值通过Bellman最优方程获取最优策略的具体方法为:
Figure FDA0003396654110000031
其中,ζ值反映未来收益相对于当前收益的重要性,若ζ趋向于0,倾向于考虑立即的回报;若ζ趋向于1时,则更关注未来的收益;
最优策略表示为:
Figure FDA0003396654110000032
8.根据权利要求1所述的一种基于强化学习的边缘计算任务卸载方法,其特征在于,服务节点卸载计算时,首先卸载计算任务,通过无线通信链路将计算任务发送给服务节点;计算任务从用户传输到服务节点的时间为:
Figure FDA0003396654110000033
其中,VM为边缘计算网络的数据传输能力;
当数据卸载到服务节点时,将执行数据计算;执行数据计算的时间为:
Figure FDA0003396654110000034
其中,
Figure FDA0003396654110000035
为服务节点的计算数据处理能力;
当任务卸载到服务节点进行计算时,任务处理时间为:
Figure FDA0003396654110000036
9.根据权利要求8所述的一种基于强化学习的边缘计算任务卸载方法,其特征在于,普通用户节点将任务卸载给服务器节点进行D2I模式通信,将任务卸载给附近的可租用用户节点进行D2D模式通信,并使D2I模式和D2D模式工作在同一频段;
将系统的总频谱分为G个正交子信道,G={1,2,3,…,g},将子信道的带宽设为B Hz,假设每个普通用户节点都有一个计算密集型任务要完成,并且每个用户仅被分配一个子通道,子信道的信噪比为:
Figure FDA0003396654110000037
其中,pi表示用户的上行传输功率,
Figure FDA0003396654110000041
表示用户Di与服务节点Sj进行数据传输时的所使用子信道g的信道增益,N0为高斯白噪声,
Figure FDA0003396654110000042
表示D2I模式通信用户对Di的干扰,
Figure FDA0003396654110000043
表示D2D模式通信对Di的干扰;
当计算任务在服务节点执行时,D2I模式干扰为:
Figure FDA0003396654110000044
其中Nc为D2I模式执行计算任务的所有用户节点,φx,g表示子信道g是否被分配给x,φx,g取0或1,φx,g=1时表示g被分配给x;
D2D模式干扰为:
Figure FDA0003396654110000045
上行链路传输速率为:
Figure FDA0003396654110000046
CN202111483883.2A 2021-12-07 2021-12-07 一种基于强化学习的边缘计算任务卸载方法 Active CN114138373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111483883.2A CN114138373B (zh) 2021-12-07 2021-12-07 一种基于强化学习的边缘计算任务卸载方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111483883.2A CN114138373B (zh) 2021-12-07 2021-12-07 一种基于强化学习的边缘计算任务卸载方法

Publications (2)

Publication Number Publication Date
CN114138373A true CN114138373A (zh) 2022-03-04
CN114138373B CN114138373B (zh) 2023-10-24

Family

ID=80384374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111483883.2A Active CN114138373B (zh) 2021-12-07 2021-12-07 一种基于强化学习的边缘计算任务卸载方法

Country Status (1)

Country Link
CN (1) CN114138373B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114466409A (zh) * 2022-04-11 2022-05-10 清华大学 一种面向机器通信的数据卸载的控制方法和装置
CN114637608A (zh) * 2022-05-17 2022-06-17 之江实验室 一种计算任务分配和更新方法、终端及网络设备
CN114827028A (zh) * 2022-03-09 2022-07-29 北京邮电大学 一种多层算网一体路由系统及方法
CN115190033A (zh) * 2022-05-22 2022-10-14 重庆科技学院 一种基于强化学习的云边融合网络任务卸载方法
CN115396955A (zh) * 2022-08-24 2022-11-25 广西电网有限责任公司 一种基于深度强化学习算法的资源分配方法及装置
CN115865761A (zh) * 2022-12-07 2023-03-28 安世亚太科技股份有限公司 一种考虑阻塞反馈的网络实体任务活动代价评估方法
CN116643808A (zh) * 2023-05-29 2023-08-25 北京邮电大学 一种基于远期合同的边缘网络计算卸载方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109302709A (zh) * 2018-09-14 2019-02-01 重庆邮电大学 面向移动边缘计算的车联网任务卸载与资源分配策略
CN111160525A (zh) * 2019-12-17 2020-05-15 天津大学 一种边缘计算环境下基于无人机群的任务卸载智能决策方法
CN111641681A (zh) * 2020-05-11 2020-09-08 国家电网有限公司 基于边缘计算和深度强化学习的物联网服务卸载决策方法
WO2020216135A1 (zh) * 2019-04-25 2020-10-29 南京邮电大学 基于边-端协同的多用户多mec任务卸载资源调度方法
CN112422346A (zh) * 2020-11-19 2021-02-26 北京航空航天大学 一种考虑多资源限制的变周期移动边缘计算卸载决策方法
KR20210069549A (ko) * 2019-12-03 2021-06-11 경희대학교 산학협력단 다중 무인항공기 네비게이션 최적화 방법 및 그를 이용한 무인항공항 시스템
CN113612843A (zh) * 2021-08-02 2021-11-05 吉林大学 一种基于深度强化学习的mec任务卸载和资源分配方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109302709A (zh) * 2018-09-14 2019-02-01 重庆邮电大学 面向移动边缘计算的车联网任务卸载与资源分配策略
WO2020216135A1 (zh) * 2019-04-25 2020-10-29 南京邮电大学 基于边-端协同的多用户多mec任务卸载资源调度方法
KR20210069549A (ko) * 2019-12-03 2021-06-11 경희대학교 산학협력단 다중 무인항공기 네비게이션 최적화 방법 및 그를 이용한 무인항공항 시스템
CN111160525A (zh) * 2019-12-17 2020-05-15 天津大学 一种边缘计算环境下基于无人机群的任务卸载智能决策方法
CN111641681A (zh) * 2020-05-11 2020-09-08 国家电网有限公司 基于边缘计算和深度强化学习的物联网服务卸载决策方法
CN112422346A (zh) * 2020-11-19 2021-02-26 北京航空航天大学 一种考虑多资源限制的变周期移动边缘计算卸载决策方法
CN113612843A (zh) * 2021-08-02 2021-11-05 吉林大学 一种基于深度强化学习的mec任务卸载和资源分配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张文献;杜永文;张希权;: "面向多用户移动边缘计算轻量任务卸载优化", 小型微型计算机系统, no. 10 *
彭军;王成龙;蒋富;顾欣;牟??;刘伟荣;: "一种车载服务的快速深度Q学习网络边云迁移策略", 电子与信息学报, no. 01 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114827028A (zh) * 2022-03-09 2022-07-29 北京邮电大学 一种多层算网一体路由系统及方法
CN114827028B (zh) * 2022-03-09 2023-03-28 北京邮电大学 一种多层算网一体路由系统及方法
CN114466409A (zh) * 2022-04-11 2022-05-10 清华大学 一种面向机器通信的数据卸载的控制方法和装置
CN114466409B (zh) * 2022-04-11 2022-08-12 清华大学 一种面向机器通信的数据卸载的控制方法和装置
CN114637608A (zh) * 2022-05-17 2022-06-17 之江实验室 一种计算任务分配和更新方法、终端及网络设备
CN115190033A (zh) * 2022-05-22 2022-10-14 重庆科技学院 一种基于强化学习的云边融合网络任务卸载方法
CN115190033B (zh) * 2022-05-22 2024-02-20 重庆科技学院 一种基于强化学习的云边融合网络任务卸载方法
CN115396955A (zh) * 2022-08-24 2022-11-25 广西电网有限责任公司 一种基于深度强化学习算法的资源分配方法及装置
CN115865761A (zh) * 2022-12-07 2023-03-28 安世亚太科技股份有限公司 一种考虑阻塞反馈的网络实体任务活动代价评估方法
CN116643808A (zh) * 2023-05-29 2023-08-25 北京邮电大学 一种基于远期合同的边缘网络计算卸载方法
CN116643808B (zh) * 2023-05-29 2024-04-16 北京邮电大学 一种基于远期合同的边缘网络计算卸载方法

Also Published As

Publication number Publication date
CN114138373B (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
CN114138373B (zh) 一种基于强化学习的边缘计算任务卸载方法
CN111586696B (zh) 一种基于多智能体架构强化学习的资源分配及卸载决策方法
Chen et al. A game-based deep reinforcement learning approach for energy-efficient computation in MEC systems
WO2021233053A1 (zh) 计算卸载的方法和通信装置
Feng et al. Collaborative data caching and computation offloading for multi-service mobile edge computing
CN111556572B (zh) 一种基于强化学习的频谱资源和计算资源联合分配方法
CN110234127B (zh) 一种基于sdn的雾网络任务卸载方法
Nath et al. Multi-user multi-channel computation offloading and resource allocation for mobile edge computing
WO2023040022A1 (zh) 一种在随机网络中基于算网协同的分布式计算卸载方法
US11616702B2 (en) Method and apparatus for differentially optimizing quality of service QoS
Salh et al. Smart packet transmission scheduling in cognitive IoT systems: DDQN based approach
CN112650581A (zh) 一种面向智能楼宇的云边协同任务调度方法
CN111988792A (zh) 无人机联盟网络卸载模型及决策计算方法
CN112860429A (zh) 一种移动边缘计算系统中任务卸载的成本效率优化系统及方法
CN110996390B (zh) 一种无线接入网络计算资源分配方法及网络系统
Wu et al. A mobile edge computing-based applications execution framework for Internet of Vehicles
Liu et al. Mobility-aware and code-oriented partitioning computation offloading in multi-access edge computing
CN116566838A (zh) 一种区块链与边缘计算协同的车联网任务卸载和内容缓存方法
Lakew et al. Adaptive partial offloading and resource harmonization in wireless edge computing-assisted ioe networks
CN115665869A (zh) 基于边缘计算和有向无环图的多用户协作平台及其方法
CN111511028A (zh) 一种多用户资源分配方法、装置、系统及存储介质
CN116828534B (zh) 基于强化学习的密集网络大规模终端接入与资源分配方法
Jiang et al. Age of information-based computation offloading and transmission scheduling in mobile edge computing-enabled iot networks
CN114928611B (zh) 一种基于IEEE802.11p协议的车联网节能计算卸载优化方法
CN116170844A (zh) 一种用于工业物联网场景中的数字孪生辅助任务卸载方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant