CN112988285B - 任务卸载方法和装置、电子设备及存储介质 - Google Patents

任务卸载方法和装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112988285B
CN112988285B CN202110537588.4A CN202110537588A CN112988285B CN 112988285 B CN112988285 B CN 112988285B CN 202110537588 A CN202110537588 A CN 202110537588A CN 112988285 B CN112988285 B CN 112988285B
Authority
CN
China
Prior art keywords
task
model
offloading
unloading
cost function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110537588.4A
Other languages
English (en)
Other versions
CN112988285A (zh
Inventor
任涛
胡哲源
李青锋
牛建伟
杜东峰
豆渊博
李默
谷宁波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Innovation Research Institute of Beihang University
Original Assignee
Hangzhou Innovation Research Institute of Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Innovation Research Institute of Beihang University filed Critical Hangzhou Innovation Research Institute of Beihang University
Priority to CN202110537588.4A priority Critical patent/CN112988285B/zh
Publication of CN112988285A publication Critical patent/CN112988285A/zh
Application granted granted Critical
Publication of CN112988285B publication Critical patent/CN112988285B/zh
Priority to PCT/CN2022/091260 priority patent/WO2022242468A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44594Unloading
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请实施例提供的任务卸载方法和装置、电子设备及存储介质,涉及任务卸载技术领域。任务卸载方法应用于电子设备,电子设备与任务卸载系统通信连接,任务卸载系统包括第二设备和至少一个第一设备,任务卸载方法包括:首先,获取至少一个第一设备的待处理任务;其次,将待处理任务输入预设的任务卸载模型,得到任务卸载策略;然后,将任务卸载策略发送至至少一个第一设备,以使至少一个第一设备基于任务卸载策略将目标任务卸载至第二设备,第二设备对目标任务进行执行处理。通过上述方法,可以提高任务卸载的效率。

Description

任务卸载方法和装置、电子设备及存储介质
技术领域
本申请涉及任务卸载技术领域,具体而言,涉及一种任务卸载方法和装置、电子设备及存储介质。
背景技术
在移动边缘计算网络中需要解决的关键问题之一是计算卸载问题,即无线用户设备选择将计算任务卸载到附近的服务器上执行还是在本地执行,以及如何为卸载到服务器的任务分配资源(如计算资源和能源资源)。
但是,经发明人研究发现,在现有技术中,任务要么全部在无线用户设备本地执行,要么全部卸载在服务器上远程执行,从而存在着任务卸载的效率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种任务卸载方法和装置、电子设备及存储介质,以改善现有技术中存在的问题。
为实现上述目的,本申请实施例采用如下技术方案:
第一方面,本发明提供一种任务卸载方法,所述任务卸载方法应用于电子设备,所述电子设备与任务卸载系统通信连接,所述任务卸载系统包括第二设备和至少一个第一设备,所述任务卸载方法包括:
获取所述至少一个第一设备的待处理任务,其中,所述待处理任务包括目标任务;
将所述待处理任务输入预设的任务卸载模型,得到任务卸载策略,其中,所述任务卸载模型基于建立的系统模型进行训练得到;
将所述任务卸载策略发送至所述至少一个第一设备,以使所述至少一个第一设备基于所述任务卸载策略将所述目标任务卸载至所述第二设备,所述第二设备对所述目标任务进行执行处理。
在可选的实施方式中,所述任务卸载方法还包括获取任务卸载模型的步骤,该步骤包括:
根据所述任务卸载系统的成本参数建立系统模型和优化成本函数;
根据所述优化成本函数对所述系统模型进行训练,得到任务卸载模型。
在可选的实施方式中,所述根据所述任务卸载系统的成本参数建立系统模型和优化成本函数的步骤,包括:
根据所述至少一个第一设备和第二设备的成本参数建立系统模型;
根据所述系统模型建立优化成本函数。
在可选的实施方式中,所述任务卸载模型包括第一任务卸载模型和第二任务卸载模型,所述根据所述优化成本函数对所述系统模型进行训练,得到任务卸载模型的步骤,包括:
对所述优化成本函数进行分割处理,得到第一优化成本函数和第二优化成本函数;
根据所述第一优化成本函数对所述系统模型进行训练,得到第一任务卸载模型;
根据所述第二优化成本函数对所述系统模型进行训练,得到第二任务卸载模型。
在可选的实施方式中,所述任务卸载策略包括第一任务卸载策略和第二任务卸载策略,所述将所述待处理任务输入预设的任务卸载模型,得到任务卸载策略的步骤,包括:
将所述待处理任务输入所述第一任务卸载模型,得到第一任务卸载策略;
将所述待处理任务输入所述第二任务卸载模型,得到第二任务卸载策略。
在可选的实施方式中,所述根据所述第一优化成本函数对所述系统模型进行训练,得到第一任务卸载模型的步骤,包括:
基于所述系统模型建立深度强化学习模型;
根据所述第一优化成本函数对所述深度强化学习模型进行训练,得到第一任务卸载模型。
在可选的实施方式中,所述根据所述第二优化成本函数对所述系统模型进行训练,得到第二任务卸载模型的步骤,包括:
基于所述系统模型建立交替方向乘子法模型;
根据所述第二优化成本函数对所述交替方向乘子法模型进行训练,得到第二任务卸载模型。
第二方面,本发明提供一种任务卸载装置,所述任务卸载装置应用于电子设备,所述电子设备与任务卸载系统通信连接,所述任务卸载系统包括第二设备和至少一个第一设备,所述任务卸载装置包括:
任务获取模块,用于获取所述至少一个第一设备的待处理任务,其中,所述待处理任务包括目标任务;
策略获取模块,用于将所述待处理任务输入预设的任务卸载模型,得到任务卸载策略,其中,所述任务卸载模型基于建立的系统模型进行训练得到;
策略发送模块,用于将所述任务卸载策略发送至所述至少一个第一设备,以使所述至少一个第一设备基于所述任务卸载策略将所述目标任务卸载至所述第二设备,所述第二设备对所述目标任务进行执行处理。
第三方面,本发明提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施方式任一项所述的任务卸载方法。
第四方面,本发明提供一种存储介质,所述存储介质包括计算机程序,所述计算机程序运行时控制所述存储介质所在电子设备执行前述实施方式任一项所述的任务卸载方法。
本申请实施例提供的任务卸载方法和装置、电子设备及存储介质,通过将待处理任务输入任务卸载模型得到任务卸载策略,将任务卸载策略发送至第一设备,以使第一设备基于任务卸载策略将目标任务卸载至第二设备进行处理,实现了将目标任务卸载到服务器上进行处理,避免了现有技术中任务要么全部在无线用户设备本地执行,要么全部卸载在服务器上远程执行,所导致的任务卸载的效率低的问题。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的数据处理系统的结构框图。
图2示出了本申请实施例提供的任务卸载系统的结构框图。
图3示出了本申请实施例提供的电子设备的结构框图。
图4为本申请实施例提供的任务卸载方法的流程示意图。
图5为本申请实施例提供的任务卸载模型的结构示意图。
图6为本申请实施例提供的深度强化学习模型的结构示意图。
图7为本申请实施例提供的ECRA算法的流程示意图。
图8为本申请实施例提供的任务卸载方法的另一流程示意图。
图9为本申请实施例提供的任务卸载装置的结构框图。
图标:10-数据处理系统;100-电子设备;110-第一存储器;120-第一处理器;130-通信模块;200-任务卸载系统;210-第一设备;220-第二设备;900-任务卸载装置;910-任务获取模块;920-策略获取模块;930-策略发送模块。
具体实施方式
随着无线通信技术的飞速发展和智能移动设备的普及,近年来,各类移动应用的数量呈爆发增长的趋势。其中如人脸识别支付系统、在线云游戏、虚拟/增强现实(VR/AR)这些应用属于计算密集型与延时关键型应用,而运行这些应用的移动设备(如智能手机、可穿戴设备)通常只有有限的计算能力和电池电量,因此计算密集型应用和资源有限的设备之间的矛盾关系为提高用户的体验质量(the quality of experience,QoE)带来了挑战。
移动边缘计算(Mobile edge computing,MEC)是一种很有前途的技术,可以通过在边缘计算网络中设置边缘服务器为用户的移动设备提供强大的计算能力和能源资源,移动设备可以选择将计算密集型任务卸载到边缘服务器上,以减少任务的执行时延并节省本地设备消耗的电池能量。同时,随着无线电力传输技术(wireless power transfer,WPT)的发展,无线用户设备的电池可以通过无线传输的方式持续进行充电,大大延长了电池供电时间,缓解了无线用户设备由于能量不足带来的限制。
在移动边缘计算网络中需要解决的关键问题之一是计算卸载问题,即无线用户设备选择将计算任务卸载到附近的MEC服务器上执行还是在本地执行,以及如何为卸载到服务器的任务分配资源(如计算资源和能源资源)。一般情况下,无线网络由多个无线用户设备组成,无线用户设备的移动性导致的时变信道条件的动态变化使卸载调度过程变得复杂。一个好的计算卸载策略可以提高无线用户设备的整体计算能力,增强移动边缘计算系统的性能。因此,最近很多研究与发明都集中于设计高效的计算卸载和资源分配策略。
现有一些发明或研究提出了使用动态规划算法和分支定界法在移动边缘计算网络中进行计算任务卸载和资源分配,然而这些方法在求解优化变量时算法的计算复杂较大需要耗费大量的计算时间只适用于网络环境较简单的场景。基于启发式算法的卸载优化方法虽然可以减少计算复杂度,但这类方法通常需要大量的计算迭代才能达到满意的优化结果,这可能无法实际运用到动态的移动边缘计算网络中(即无线用户设备的移动引起的时变信道条件)进行在线计算卸载。
为了改善本申请所提出的上述至少一种技术问题,本申请实施例提供一种任务卸载方法和装置、电子设备及存储介质,下面通过可能的实现方式对本申请的技术方案进行说明。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请实施例针对上述问题所提出的解决方案,都应该是发明人在发明过程中做出的贡献。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
图1为本申请实施例提供的数据处理系统10的结构框图,其提供了一种数据处理系统10可能的实现方式,参见图1,该数据处理系统10可以包括电子设备100、任务卸载系统200中的一种或多种。
其中,电子设备100与任务卸载系统200通信连接,电子设备100获取任务卸载系统200的待处理任务,根据待处理任务得到任务卸载策略,以使任务卸载系统200根据任务卸载策略进行任务卸载处理。
可选地,任务卸载系统200的具体组成不受限制,可以根据实际应用需求进行设置。例如,在一种可以替代的示例中,任务卸载系统200可以包括第二设备220和至少一个第一设备210。
需要说明的是,在一种可以替代的示例中,电子设备100和第一设备210可以为同一设备;在另一种可以替代的示例中,电子设备100和第二设备220可以为同一设备。
可选地,第一设备210和第二设备220的具体类型不受限制,可以根据实际应用需求进行设置。例如,在一种可以替代的示例中,第一设备210可以为无线用户设备,第二设备220可以为边缘计算服务器。
结合图2,在大规模移动边缘计算网络中包含一个带有无线访问接入点(accesspoint, AP)的边缘计算服务器和N个无线用户设备,其中
Figure F_210514162322419_419812001
,每一个无线用户设备都能在一定范围内移动,无线访问接入点的能量足够稳定,可以通过无线射频向无线用户设备传输电力。每个无线用户设备都配备有无线传输天线,可以与无线访问接入点进行数据传输,也可以从无线访问接入点接收能量。从无线访问接入点接收到的能量存储在无线用户设备的可充电电池中。
请参照图3,是本申请实施例提供的一种电子设备100的方框示意图,本实施例中的电子设备100可以为能够进行数据交互、处理的服务器、处理设备、处理平台等。电子设备100包括第一存储器110、第一处理器120及通信模块130。第一存储器110、第一处理器120以及通信模块130各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
其中,第一存储器110用于存储程序或者数据。第一存储器110可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(ErasableProgrammable Read-Only Memory,EPROM),电可擦除只读存储器(Electric ErasableProgrammable Read-Only Memory,EEPROM)等。
第一处理器120用于读/写第一存储器110中存储的数据或程序,并执行相应地功能。通信模块130用于通过网络建立电子设备100与其它通信终端之间的通信连接,并用于通过网络收发数据。
应当理解的是,图3所示的结构仅为电子设备100的结构示意图,电子设备100还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。
图4示出了本申请实施例所提供的任务卸载方法的流程图之一,该方法可应用于图3所示的电子设备100,由图3中的电子设备100执行。应当理解,在其他实施例中,本实施例的任务卸载方法中的部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。下面对图4所示的任务卸载方法的流程进行详细描述。
步骤S410,获取至少一个第一设备210的待处理任务。
其中,待处理任务包括目标任务。
步骤S420,将待处理任务输入预设的任务卸载模型,得到任务卸载策略。
其中,任务卸载模型基于建立的系统模型进行训练得到。
步骤S430,将任务卸载策略发送至至少一个第一设备210,以使至少一个第一设备210基于任务卸载策略将目标任务卸载至第二设备220,第二设备220对目标任务进行执行处理。
上述方法通过将待处理任务输入任务卸载模型得到任务卸载策略,将任务卸载策略发送至第一设备,以使第一设备基于任务卸载策略将目标任务卸载至第二设备进行处理,实现了将目标任务卸载到服务器上进行处理,避免了现有技术中任务要么全部在无线用户设备本地执行,要么全部卸载在服务器上远程执行,所导致的任务卸载的效率低的问题。
在步骤S410之前,本申请提供的任务卸载方法还可以包括获取任务卸载模型的步骤,该步骤可以包括:
根据任务卸载系统200的成本参数建立系统模型和优化成本函数;根据优化成本函数对系统模型进行训练,得到任务卸载模型。
可选地,根据任务卸载系统200的成本参数建立系统模型和优化成本函数的具体方式不受限制,可以根据实际应用需求进行设置。例如,在一种可以替代的示例中,可以包括以下子步骤:
根据至少一个第一设备210和第二设备220的成本参数建立系统模型;根据系统模型建立优化成本函数。
详细地,首先建立系统模型,整个系统时间可以被划分为多个恒定的时间片,表示为
Figure F_210514162322513_513562002
,每个时间片的长度都为T秒,且假设当每个无线用户设备在时间片t产生一个计算密集型任务时,这些任务的执行时间不会超过一个时间的长度。部署无线访问接入点的MEC服务器的计算能力比无线用户设备强大得多,因此每个无线用户设备可以选择通过计算卸载的方式在服务器上远程执行任务,也可以选择在本地执行任务。
在每个时间片t,由于无线用户设备和无线访问接入点之间的无线信道增益对无线电力传输和任务数据传输的效率有很大影响,因此本申请使用
Figure P_210514162328685_685437001
表示时间片ti个无线用户设备于无线访问接入点的信道增益,时间片的长度足够小以保证在该时间片内信道增益
Figure P_210514162328763_763562002
的大小不变。根据瑞利衰落信道模型,无线信道增益可以表示为
Figure P_210514162328779_779187003
,其中
Figure P_210514162328810_810437004
表示是单位均值的独立指数随机变量,
Figure P_210514162328826_826062005
由下式表示:
Figure P_210514162328857_857312001
其中,
Figure P_210514162328888_888562001
表示天线增益,
Figure P_210514162328904_904187002
表示载波频率,
Figure P_210514162328935_935437003
表示路劲衰落指数,
Figure P_210514162328951_951062004
表示第i个无线用户设备与无线访问接入点在二维平面的距离,从式中可以看出,随着距离
Figure P_210514162328966_966687005
的增大,无线信道增益越小。
其次建立无线用户设备能量获取模型,在每个时间片t的开始阶段,边缘计算服务器通过无线电力传输技术为每个用户设备充电
Figure F_210514162322607_607312003
秒,其中
Figure F_210514162322685_685437004
,第i个无线用户设备获得的能量为:
Figure P_210514162328997_997937001
其中,
Figure P_210514162329029_029187001
表示无线能量获取的效率,
Figure P_210514162329044_044812002
表示无线访问连接点与用户设备的传输功率,
Figure F_210514162322747_747937005
表示无线充电所占时间比例。
本申请假设每一个无线用户设备的电池能量是有限的,在时间片t末(即时间片
Figure F_210514162322826_826062006
开始),用户设备剩余的电量为:
Figure P_210514162329076_076062001
其中,
Figure F_210514162322904_904187007
为在时间片t消耗的能量,
Figure F_210514162322982_982312008
是在时间片t通过无线电力传输技术获得的能量,
Figure F_210514162323044_044812009
是无线用户设备所能容纳的最大电量。正常情况下,
Figure F_210514162323122_122937010
应为非负值,如果当前时间片没有充足的能量(
Figure F_210514162323185_185437011
),无线用户设备就会丢弃当前的任务,并将
Figure F_210514162323263_263562012
设置为0,在下一时间片重新执行该任务。
然后建立计算任务模型,本申请将在时间片ti个无线用户设备产生的任务
Figure P_210514162329107_107312001
可以表示为
Figure P_210514162329138_138562002
,其中
Figure P_210514162329154_154187003
表示任务
Figure P_210514162329185_185437004
的数据量(单位:比特),
Figure P_210514162329216_216687005
表示CPU处理1比特数据需要时间周期数。这样,在执行任务
Figure P_210514162329232_232312006
时需要的执行周期为
Figure P_210514162329263_263562007
。定义W为无线信道的带宽,信道之间的干扰可以忽略不计,如果k个无线用户设备在时间片t同时卸载当前的任务,无线带宽W将平均分配给各个决定卸载的用户设备。
在获得从无线访问接入点传输的能量后,每个无线用户设备需要决定是将计算任务卸载到边缘服务器端还是在本地执行,从而优化调度降低总体任务的延迟和能耗。本申请采用完全卸载的方式,即当前时间片到达的任务要么选择在无线用户设备本地执行,要么通过计算卸载在MEC服务器上远程执行。使用
Figure P_210514162329279_279187001
表示在时间片ti个无线用户设备的卸载决策变量,其中,
Figure P_210514162329294_294812002
表示无线用户设备选择卸载到边缘计算服务器端(边缘计算),
Figure P_210514162329326_326062003
表示计算任务在无线用户设备本地执行。以下根据两种方式分别进行描述:
1)本地计算模型:
本申请移动边缘计算网络中的无线用户设备可以同时无线获取电能以及进行本地计算,
Figure P_210514162329341_341687001
表示第i个无线用户设备的计算能力(单位:CPU周期/秒),不同设备的计算能力不同,处理任务
Figure P_210514162329372_372937002
的本地计算时延
Figure P_210514162329388_388562003
表示为:
Figure P_210514162329419_419812001
本地计算消耗的能量
Figure P_210514162329435_435437001
为:
Figure P_210514162329466_466687001
其中,
Figure P_210514162329482_482312001
表示第i个无线用户设备在一个CPU周期消耗的能量,具体地,
Figure P_210514162329513_513562002
可以由下式计算:
Figure P_210514162329529_529187001
2)边缘计算模型:
如果第i个无线用户设备选择将任务
Figure P_210514162329560_560437001
卸载到边缘计算服务器上进行远程执行,那么计算卸载过程可以分为三个部分:首先,无线用户设备通过无线传输方式将任务数据卸载到边缘计算服务器;然后,边缘计算服务器将计算资源分配给卸载的任务完成计算;最后,将任务的计算结果再通过无线传输的方式发送回相应的无线用户设备。由于任务计算结果的量远小于任务数据的量,本发明忽略了计算结果下载产生的传输延迟和能耗。因此,第i个无线用户设备到边缘计算服务器的计算卸载时延可以表示为:
Figure P_210514162329576_576062001
边缘计算服务器运行任务
Figure P_210514162329607_607312001
的时间为:
Figure P_210514162329638_638562001
其中,
Figure P_210514162329669_669812001
表示边缘服务器为任务
Figure P_210514162329685_685437002
分配的计算资源(单位:CPU周期/秒),用F表示整个边缘服务器的计算资源,需满足条件:
Figure P_210514162329716_716687001
即表示从边缘服务器分配给所有卸载任务的计算资源总量应小于整个服务器的计算资源F
i个无线用户设备在边缘服务器上本地等待远程执行任务
Figure P_210514162329732_732312001
期间消耗的能量可以用下式表示:
Figure P_210514162329763_763562001
其中,
Figure P_210514162329794_794812001
表示处于空闲状态下第i个无线用户设备的功耗。
基于上述建立的网络系统模型,本发明通过对任务卸载和资源分配的联合优化,提出使系统总成本最小化的优化成本函数,具体优化目标问题描述如下:
Figure P_210514162329826_826062001
上式中整个系统的优化成本函数分为本地计算成本和计算卸载到边缘服务器的成本两部分,分别用
Figure P_210514162329935_935437001
Figure P_210514162329966_966687002
表示,具体地表示为:
Figure P_210514162329997_997937001
Figure P_210514162330029_029187001
其中,ω1和ω3为任务处理延迟的权重,ω2和ω4为能耗的权重,并满足
Figure P_210514162330076_076062001
Figure P_210514162330107_107312002
问题P中
Figure P_210514162330138_138562001
表示所有无线用户设备的卸载决策变量,
Figure P_210514162330169_169812002
是指无线用户设备卸载数据所消耗的能量占总能量的百分比,
Figure P_210514162330185_185437003
是资源分配向量,每个分量表示边缘服务器分配给每个上传任务的计算资源。本发明规定如果无线用户设备i选择本地执行任务
Figure P_210514162330216_216687004
,那么边缘服务器将不会为其分配计算资源,即当
Figure P_210514162330247_247937005
时,
Figure P_210514162330263_263562006
。约束条件(a)表示无线用户设备要么选择将任务卸载到服务器执行要么再本地执行。约束条件(b)表示边缘服务器分配给执行卸载任务的任意无线用户设备的计算资源不能超过资源最大值。约束条件(c)保证分配的计算资源之和不超过边缘服务器的资源最大值。(f)规定在时间片t,每个无线用户设备的当前的电量既不能大于设备所能提供的最大能量,也不能为负值,否则需要加上惩罚项。
可选地,根据优化成本函数对系统模型进行训练,得到任务卸载模型的具体方式不受限制,可以根据实际应用需求进行设置。例如,在一种可以替代的示例中,任务卸载模型包括第一任务卸载模型和第二任务卸载模型,根据优化成本函数对系统模型进行训练,得到任务卸载模型的步骤可以包括以下子步骤:
对优化成本函数进行分割处理,得到第一优化成本函数和第二优化成本函数;根据第一优化成本函数对系统模型进行训练,得到第一任务卸载模型;根据第二优化成本函数对系统模型进行训练,得到第二任务卸载模型。
详细地,可以将原优化问题分解为1)无线用户设备的任务计算卸载与能量传输和2)边缘计算服务器计算资源与能量分配两个子问题,结合图5,可以分别设计基于深度强化学习方法和交替方向乘子法的系统优化框架。
显然,优化函数的求解P属于混合整数非线性规划(Mixed-Integer NonLinearProgramming , MINLP)问题,即它是一个非凸问题。当用户数N增加时,该问题的计算复杂度急剧增加,难以直接求解。因此,考虑到四个待求变量(
Figure F_210514162323357_357312013
)的依赖性(例如,如果
Figure F_210514162323451_451062014
的某个分量
Figure P_210514162330294_294812003
为0,那么对应
Figure F_210514162323529_529187015
Figure F_210514162323607_607312016
的分量的值也为0。本申请将问题分解为以下两个子问题,每个子问题的待求变量之间不存在依赖性:1) 无线用户设备的任务计算卸载与能量传输 (P1),即如何确定
Figure F_210514162323685_685437017
Figure F_210514162323763_763562018
的值;2) 边缘计算服务器计算资源与能量分配 (P2)。一旦确定了
Figure F_210514162323857_857312019
Figure F_210514162323951_951062020
的值,求解
Figure F_210514162324029_029187021
Figure F_210514162324107_107312022
就会变得容易。
可选地,根据第一优化成本函数对系统模型进行训练,得到第一任务卸载模型的具体方式不受限制,可以根据实际应用需求进行设置。例如,在一种可以替代的示例中,可以包括以下子步骤:
基于系统模型建立深度强化学习模型;根据第一优化成本函数对深度强化学习模型进行训练,得到第一任务卸载模型。
详细地,对于子问题P1,每个无线用户设备产生的任务的计算卸载决策优化问题仍然是非凸的问题。传统的数值优化方法往往需要大量的迭代计算才能得到满意的结果,这使得其不适合在信道增益变化的动态环境中进行实时MEC。因此,本发明采用强化学习来实现计算卸载的实时调度。
在信道条件和无线用户设备位置动态变化的计算卸载环境中,根据子问题P1,由于高维的状态空间和动作空间,移动边缘计算网络的系统状态转换概率通常无法获得,本申请基于深度强化学习的方法让每个无线用户设备根据当前系统状态选择是否将时间片
Figure F_210514162324185_185437023
到达的任务卸载到边缘服务器。
具体的P1问题可以表示为:
Figure P_210514162330341_341687001
首先,基于强化学习的方法需要定义求解问题的状态、动作和奖励函数,具体如下:
状态:在每个时间片t,移动边缘计算网络的状态包括:每个无线用户设备与无线访问接入点距离
Figure F_210514162324279_279187024
以及信道增益
Figure F_210514162324357_357312025
,当前处理的每个计算任务的数据量大小
Figure F_210514162324435_435437026
,在时间片
Figure F_210514162324513_513562027
的开始阶段可用的能量
Figure F_210514162324607_607312028
,即
Figure P_210514162330388_388562006
动作:根据问题P1的定义,需要确定每个无线用户设备的计算卸载向量
Figure F_210514162324685_685437029
与能量传输变量
Figure F_210514162324763_763562030
,即
Figure P_210514162330419_419812003
。基于观测到的状态
Figure F_210514162324841_841687031
,基于强化学习的方法通过学习系统的状态转移策略
Figure F_210514162324935_935437032
,获得状态
Figure F_210514162325029_029187033
到动作
Figure F_210514162325107_107312034
的近似最优映射。
奖励函数:当动作
Figure P_210514162330451_451062001
的值确定之后,
Figure F_210514162325201_201062035
Figure F_210514162325294_294812036
的值可以根据ECRA算法求解,优化问题的目标是使系统成本和由于电量不足丢弃任务引入的惩罚项之和最小化,而强化学习的目标是获得最大的奖励,因此,我们可以将强化学习算法的即时奖励函数定义为:
Figure P_210514162330482_482312001
其中,
Figure P_210514162330513_513562001
表示当无线用户设备的能量不足以执行当前时间片到达的任务时(也就是
Figure F_210514162325388_388562037
),此时应该丢弃该任务,因此需要引入惩罚项尽可能防止发生这样的情况。本申请采用指示函数
Figure F_210514162325497_497937038
表示满足
Figure F_210514162325576_576062039
条件时引入任务失败的惩罚,因此惩罚代价成本函数表示为:
Figure P_210514162330544_544812001
其中,
Figure F_210514162325669_669812040
Figure F_210514162325779_779187041
为惩罚的权重,
Figure F_210514162325857_857312042
表示绝对值。
完成上述问题定义之后,本申请基于双延迟深度确定性策略梯度算法(twindelayed deep deterministic policy gradient, TD3)对复杂高维动作空间的探索策略进行改进,提出了基于强化学习的计算卸载和能量传输方法(RL-Based approach forComputation Offloading and Energy Transmission, RLCOET),从而避免了因难以充分探索动作空间而导致收敛缓慢或陷入局部最优解的问题。
TD3算法包含两个评论家网络和一个动作网络,两个评论家网络分别估计两个Q值(价值预测值),即
Figure P_210514162330576_576062001
Figure P_210514162330607_607312002
,动作网络以当前状态为输入,输出相应的动作。为了加快动作空间维度较高时模型的学习进程,我们改进了原算法的探索或利用策略,经过该策略生成的动作
Figure F_210514162325935_935437043
结合ECRA优化方法计算出当前时间片剩余的优化变量并进一步得到当前奖励
Figure F_210514162326029_029187044
和下一阶段状态
Figure P_210514162330654_654187005
,将
Figure P_210514162330669_669812006
作为一次与环境交互得到的经验存储到经验池中,并在神经网络训练阶段选取一批损失值较大的经验,通过优先经验重放技术来训练神经网络。以下是RLCOET算法用到的相关技术:
1)动作候选解集的生成与选择:
由于RLCOET算法的动作网络输出的动作
Figure P_210514162330701_701062001
属于高维空间,共
Figure F_210514162326122_122937045
维。直接引入高斯噪声的方式对动作空间进行探索只使用只有少量动作变量的情况,在高维空间中则很难通过有效的探索来使神经学习到最优策略,所以我们改进了动作空间中的探索策略。参见图6,动作网络有两个分支:一部分用于预测能量传输比例
Figure F_210514162326216_216687046
,它是0和1之间的一维连续变量,所以这一项在进行动作探索时引入高斯噪声并对结果进行剪裁,使其也保持在0和1之间;另一部分
Figure F_210514162326294_294812047
N维离散向量,求解的搜索空间为
Figure F_210514162326388_388562048
。动作网络的输出为连续的松弛决策变量
Figure P_210514162330732_732312006
,使用保序量化法生成
Figure F_210514162326482_482312049
个离散的决策动作
Figure P_210514162330763_763562008
。保序量化法具有平衡模型计算复杂度和模型性能的优点,可以在K较小的情况下实现对
Figure F_210514162326560_560437050
动作空间的广泛搜索。对于生成的每一个卸载决策向量
Figure P_210514162330810_810437010
,联合ECRA算法求出的
Figure F_210514162326654_654187051
Figure F_210514162326763_763562052
即时奖励函数计算得到当前的K个候选的奖励值
Figure P_210514162330826_826062013
,其中选择最高的
Figure P_210514162330857_857312014
值对应的动作变量作为当前最优卸载决策行为,记为
Figure P_210514162330888_888562015
,即:
Figure P_210514162330904_904187001
2)优先经验回放
RLCOET算法每次与系统环境交互获得的经验
Figure P_210514162330935_935437001
存放到经验池中,其中,
Figure F_210514162326857_857312053
Figure F_210514162326935_935437054
是在动作生成与选择的最佳行动和奖励。在模型训练过程中,我们从经验池中抽取一批经验样本来更新动作网络和评论家网络。与常见的强化学习中随机采样训练神经网络不同,本发明采用优先经验回放技术,以SumTree结构设置经验池,将样本按照优先级进行排序,如果样本的损失值较高,则优先级较高,更有可能被选取来更新网络参数,这种方式可以更有效地训练网络,加速模型的收敛。为了防止部分样本频繁地被选取训练造成的过拟合,以及网络在早期训练过程中容易出现离群值的问题,在样本的选取中加入了随机性,这样优先级较低的样本也有可能被选到,样本i被选取的概率是:
Figure P_210514162330966_966687001
其中,
Figure P_210514162330997_997937001
是样本i的优先级,
Figure F_210514162327029_029187055
是优先级被使用的数量。
3)策略更新:
设演员网络和对应的目标演员网络的参数分别表示为
Figure F_210514162327138_138562056
Figure P_210514162331029_029187002
,评论家网络和对应的评论家目标网络的参数分别表示为
Figure P_210514162331060_060437003
Figure P_210514162331091_091687004
,由于两个评论家网络的输出Q值不同,选择两个Q值中小的一个作为网络的更新目标,即:
Figure P_210514162331107_107312001
其中,一个与
Figure P_210514162331154_154187001
相关的评论家网络用于更新,
Figure P_210514162331169_169812002
Figure P_210514162331201_201062003
Figure P_210514162331216_216687004
的更新目标。
由于网络参数的初始值不同,在网络训练之初选择两个评论家网络预测的较小的数值来估计Q值,以防止过高估计Q值造成的偏差,因为在每一次更新时都会出现一个小的误差,当网络更新很多次时,误差就会累积起来,导致性能不佳。除了使用延迟策略更新来避免偏差的过度积累外,本发明还对目标动作空间周围邻域进行数值平滑化以减少误差,即在目标动作网络中加入一定量的噪声
Figure F_210514162327232_232312057
Figure P_210514162331247_247937001
其中,噪声
Figure F_210514162327326_326062058
可以看作是一种正则化,它使值函数的更新更加平稳,让目标Q值
Figure P_210514162331294_294812002
的预测值更精确、更鲁棒。
评论家网络的估计值
Figure P_210514162331310_310437001
对目标网络
Figure P_210514162331341_341687002
进行近似,它们的损失函数L计算如下
Figure P_210514162331372_372937001
由于动作
Figure P_210514162331404_404187001
包含离散向量
Figure P_210514162331435_435437002
和连续变量
Figure P_210514162331466_466687003
,所以网络损失函数也包含两部分。对于变量
Figure P_210514162331497_497937004
,推导出损失函数的梯度,以更新动作网络的参数,如下所示:
Figure P_210514162331513_513562001
其中,
Figure P_210514162331560_560437001
是从优先经验回放经验池中选择的样本数,对于卸载向量
Figure P_210514162331591_591687002
,使用平均交叉熵损失来更新动作网络的参数
Figure F_210514162327435_435437059
Figure P_210514162331607_607312001
其中,
Figure P_210514162331654_654187001
Figure P_210514162331669_669812002
的卸载向量部分。综上,更新动作网络的总损失函数为:
Figure P_210514162331701_701062001
其中,
Figure P_210514162331732_732312001
为变量
Figure P_210514162331763_763562002
损失项的权重。
可选地,根据第二优化成本函数对系统模型进行训练,得到第二任务卸载模型的具体方式不受限制,可以根据实际应用需求进行设置。例如,在一种可以替代的示例中,可以包括以下子步骤:
基于系统模型建立交替方向乘子法模型;根据第二优化成本函数对交替方向乘子法模型进行训练,得到第二任务卸载模型。
详细地,对于子问题P2,由于P2的待求变量存在大量的约束条件,强化学习很难在有限的时间内获得理想的策略,在求解问题P1后,原问题P变成了一个凸优化问题,这时就可以使用传统的凸优化算法来解决。本申请基于交替方向乘子法 (AlternatingDirection Method of Multipliers, ADMM)提出能量与计算资源分配算法(Energy andComputation-Resource Allocation, ECRA)求解P2,其时间复杂度仅为O(N)。
也就是说,可以使用交替方向乘子法获得每个上传至边缘服务器的任务分配的计算资源大小与能量分配比例。根据RLCOET强化学习算法,可以得到问题P1的优化变量
Figure P_210514162331794_794812001
。本步骤中采用基于ADMM的方法来解决问题P2。ADMM方法是一种求解优化问题的计算框架,适用于解决大规模分布式凸优化问题。ADMM通过“分解-协调”的处理将一个大的全局问题分解成多个较小且容易解决的子问题,并协调各子问题的解,从而得到总的全局问题的解。这种方法弥补了最优解附近的惩罚项的系数趋于无穷大的缺点。为了将原优化目标问题P转换为ADMM方法容易求解的形式,引入两个额外的变量
Figure P_210514162331810_810437002
Figure P_210514162331841_841687003
,并由此提出ECRA算法,转换后的问题P2可表示为:
Figure P_210514162331872_872937001
Figure P_210514162331951_951062001
Figure P_210514162331982_982312001
Figure P_210514162332013_013562001
Figure P_210514162332060_060437001
时,
Figure P_210514162332076_076062002
Figure P_210514162332107_107312003
的值与参与本地执行的设备无关。P2被转化为包含两类变量的带约束优化问题。这种结构可以很容易地处理优化目标中的正则化项。P2采用ADMM算法与增广拉格朗日方法求解,如下所示:
Figure P_210514162332138_138562001
其中,
Figure P_210514162332185_185437001
。惩罚项系数
Figure F_210514162327544_544812060
为一个固定值。通过逐渐迭代更新
Figure P_210514162332216_216687003
的值来解决上式优化问题。假设第j轮的变量为
Figure P_210514162332232_232312004
,那么在第j+1轮中更新各变量的步骤如下:
1)给定第j轮的变量
Figure P_210514162332263_263562001
,通过最小化上式的值更新
Figure P_210514162332294_294812002
,即:
Figure P_210514162332310_310437001
其中,在
Figure P_210514162332341_341687001
中存在对N的求和运算,因此可以将其分解为N个并行计算的子问题。每一个子问题可以表示为:
Figure P_210514162332372_372937001
Figure P_210514162332404_404187001
通过这样的方式,可以将上式可以转化为满足限制条件的凸优化问题,其解可以通过传统的优化算法得到。因此,根据N个子问题的解,我们可以得到
Figure P_210514162332451_451062001
的值。上式的计算复杂度为O(1),N问题的总复杂度为O(N)。
2)上一步得到
Figure P_210514162332482_482312001
的值后,就可以在给定
Figure P_210514162332497_497937002
Figure P_210514162332529_529187003
的情况下,更新
Figure F_210514162327654_654187061
的值,使
Figure P_210514162332560_560437005
最小化,可以将此步骤的优化问题表示为:
Figure P_210514162332576_576062001
此问题的计算复杂度为O(N)。
3)当求出
Figure P_210514162332654_654187001
Figure P_210514162332685_685437002
的值后,通过最小化
Figure P_210514162332716_716687003
更新
Figure P_210514162332747_747937004
的值,如下式所示:
Figure P_210514162332779_779187001
具体地,本问题的计算复杂度为O(N)。
不断迭代执行上述三个步骤,直到满足以下两个条件:绝对误差
Figure P_210514162332826_826062001
和相对误差
Figure P_210514162332872_872937002
均小于给定的阈值。基于ADMM的方法,问题P2可由图7所示的ECRA算法求解并且可以保证算法的收敛性,其收敛性与
Figure F_210514162327763_763562062
有关,根据以上对各步计算复杂度的分析,总算法的复杂度为O(N)。值得注意的是,由于原问题是非凸问题,虽然不能保证用该算法能找到原问题的最优解,但得出的近似解与最优解的误差在可控范围内。
最后,可以根据深度强化学习模型与交替方向乘子法模型的计算结果提出有效的优化算法训练模型直到满足要求,得到任务卸载模型。
需要说明的是,整个基于强化学习的调度优化方法可以由图8表示,与训练深度强化学习模型和交替方向乘子法模型的步骤对应。首先,初始化评论家网络的参数和动作网络参数,初始化强化学习评论家目标网络和动作目标网络的参数以及经验池的经验数据,初始化大规模无人机辅助移动边缘计算网络模型的参数与神经网络训练轮数t=1。其次,判断当前随机概率是否小于预设值,若是,则直接输出当前动作,若否,则量化K组候选解集,对动作加入高斯噪声,选择最优的动作。然后,根据ECRA算法计算资源与能量分配优化变量,获得下一阶段状态与立即奖励,并将经验存入经验池,根据优先经验回放策略从经验池中抽取一批经验,更新神经网络参数,t=t+1,判断t是否小于T,若是,则重新判断随机概率,若否,则结束。
对于步骤S420,需要说明的是,得到任务卸载策略的具体方式不受限制,可以根据实际应用需求进行设置。例如,在一种可以替代的示例中,任务卸载策略包括第一任务卸载策略和第二任务卸载策略,将待处理任务输入预设的任务卸载模型,得到任务卸载策略的步骤可以包括以下子步骤:
将待处理任务输入第一任务卸载模型,得到第一任务卸载策略;将待处理任务输入第二任务卸载模型,得到第二任务卸载策略。
其中,第一任务卸载策略可以包括每个无线用户设备的计算卸载决策变量与设备无线充电所占时间比例,第二任务卸载策略可以包括每个上传至边缘服务器的任务分配的计算资源大小与能量分配比例。
也就是说,本申请实施例提供了一种大规模移动边缘计算网络中的高效在线卸载方法,包括以下子步骤:
步骤1、构建针对大规模移动计算网络的系统模型并给出基于无线充电设备卸载任务执行时延与消耗能量的优化目标函数。
步骤2、将原优化问题分解为1)无线用户设备的任务计算卸载与能量传输和2)边缘计算服务器计算资源与能量分配两个子问题,分别设计基于深度强化学习方法和交替方向乘子法的系统优化框架。
步骤3、针对步骤2中子问题1),提出基于深度强化学习的方法求出每个无线用户设备的计算卸载决策变量与设备无线充电所占时间比例。
步骤4、针对步骤2中子问题2),使用交替方向乘子法获得每个上传至边缘服务器的任务分配的计算资源大小与能量分配比例。
步骤5、根据步骤3与步骤4的计算结果提出有效的优化算法训练模型直到满足要求。
本申请使用一种全新的针对移动边缘计算网络的计算卸载方法,提出的RLCOET算法可以通过学习与动态边缘计算网络环境下因无线用户设备移动产生的交互经验,获得高效的卸载策略。与传统的优化方法相比,本申请的方法减轻了通过反复迭代计算解决调度优化的要求,并使所有任务获得满意的计算延迟和较低的能耗。相对于现有的大多数基于学习的方法,将所有的调度变量一起优化,在求解变量较多的情况下可能面临收敛麻烦,本算法将整个优化问题分解为两个子问题(计算卸载和能量传输、计算资源和能量分配)并分别进行求解,有效降低了算法复杂度。通过改进深度学习算法的优化动作变量生成策略和经验采样策略,使所提出的算法易收敛性,并在具有大规模调度变量的MEC网络中获得接近最优的计算卸载策略。
结合图9,本申请实施例还提供了一种任务卸载装置900,该任务卸载装置900实现的功能对应上述方法执行的步骤。该任务卸载装置900可以理解为上述电子设备100的处理器,也可以理解为独立于上述电子设备100或处理器之外的在电子设备100控制下实现本申请功能的组件。其中,任务卸载装置900可以包括任务获取模块910、策略获取模块920和策略发送模块930。
任务获取模块910,用于获取至少一个第一设备210的待处理任务,其中,待处理任务包括目标任务。在本申请实施例中,任务获取模块910可以用于执行图4所示的步骤S410,关于任务获取模块910的相关内容可以参照前文对步骤S410的描述。
策略获取模块920,用于将待处理任务输入预设的任务卸载模型,得到任务卸载策略,其中,任务卸载模型基于建立的系统模型进行训练得到。在本申请实施例中,策略获取模块920可以用于执行图4所示的步骤S420,关于策略获取模块920的相关内容可以参照前文对步骤S420的描述。
策略发送模块930,用于将任务卸载策略发送至至少一个第一设备210,以使至少一个第一设备210基于任务卸载策略将目标任务卸载至第二设备220,第二设备220对目标任务进行执行处理。在本申请实施例中,策略发送模块930可以用于执行图4所示的步骤S430,关于策略发送模块930的相关内容可以参照前文对步骤S430的描述。
此外,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任务卸载方法的步骤。
本申请实施例所提供的任务卸载方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行上述方法实施例中的任务卸载方法的步骤,具体可参见上述方法实施例,在此不再赘述。
综上所述,本申请实施例提供的任务卸载方法和装置、电子设备及存储介质,通过将待处理任务输入任务卸载模型得到任务卸载策略,将任务卸载策略发送至第一设备,以使第一设备基于任务卸载策略将目标任务卸载至第二设备进行处理,实现了将目标任务卸载到服务器上进行处理,避免了现有技术中任务要么全部在无线用户设备本地执行,要么全部卸载在服务器上远程执行,所导致的任务卸载的效率低的问题。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (9)

1.一种任务卸载方法,其特征在于,所述任务卸载方法应用于电子设备,所述电子设备与任务卸载系统通信连接,所述任务卸载系统包括第二设备和至少一个第一设备,所述任务卸载方法包括:
获取所述至少一个第一设备的待处理任务,其中,所述待处理任务包括目标任务;
将所述待处理任务输入预设的任务卸载模型,得到任务卸载策略,其中,所述任务卸载模型基于建立的系统模型进行训练得到;
将所述任务卸载策略发送至所述至少一个第一设备,以使所述至少一个第一设备基于所述任务卸载策略将所述目标任务卸载至所述第二设备,所述第二设备对所述目标任务进行执行处理;
所述任务卸载方法还包括获取任务卸载模型的步骤,该步骤包括:
根据所述任务卸载系统的成本参数建立系统模型和优化成本函数;
根据所述优化成本函数对所述系统模型进行训练,得到任务卸载模型;
所述优化成本函数包括本地计算成本和计算卸载到边缘服务器的成本:
Figure 156373DEST_PATH_IMAGE001
Figure 431497DEST_PATH_IMAGE002
其中,
Figure 12651DEST_PATH_IMAGE003
表示无线充电所占时间比例,T表示时间片段长度,
Figure 347817DEST_PATH_IMAGE004
表示本地计算时延,
Figure 76739DEST_PATH_IMAGE005
表示本地计算消耗的能量,
Figure 113744DEST_PATH_IMAGE006
表示第i个无线用户设备到边缘计算服务器的计算卸载时延,
Figure 611721DEST_PATH_IMAGE007
表示边缘计算服务器运行任务的时间,
Figure 321051DEST_PATH_IMAGE008
表示在第t个时间片,第i个无线用户设备将任务上传到边缘服务器所消耗的能量,
Figure 271690DEST_PATH_IMAGE009
表示第i个无线用户设备在边缘服务器上本地等待远程执行任务期间消耗的能量,ω1和ω3为任务处理延迟的权重,ω2和ω4为能耗的权重,并满足
Figure 154195DEST_PATH_IMAGE010
且,
Figure 506679DEST_PATH_IMAGE011
2.如权利要求1所述的任务卸载方法,其特征在于,所述根据所述任务卸载系统的成本参数建立系统模型和优化成本函数的步骤,包括:
根据所述至少一个第一设备和第二设备的成本参数建立系统模型;
根据所述系统模型建立优化成本函数。
3.如权利要求2所述的任务卸载方法,其特征在于,所述任务卸载模型包括第一任务卸载模型和第二任务卸载模型,所述根据所述优化成本函数对所述系统模型进行训练,得到任务卸载模型的步骤,包括:
对所述优化成本函数进行分割处理,得到第一优化成本函数和第二优化成本函数;
根据所述第一优化成本函数对所述系统模型进行训练,得到第一任务卸载模型;
根据所述第二优化成本函数对所述系统模型进行训练,得到第二任务卸载模型。
4.如权利要求3所述的任务卸载方法,其特征在于,所述任务卸载策略包括第一任务卸载策略和第二任务卸载策略,所述将所述待处理任务输入预设的任务卸载模型,得到任务卸载策略的步骤,包括:
将所述待处理任务输入所述第一任务卸载模型,得到第一任务卸载策略;
将所述待处理任务输入所述第二任务卸载模型,得到第二任务卸载策略。
5.如权利要求3所述的任务卸载方法,其特征在于,所述根据所述第一优化成本函数对所述系统模型进行训练,得到第一任务卸载模型的步骤,包括:
基于所述系统模型建立深度强化学习模型;
根据所述第一优化成本函数对所述深度强化学习模型进行训练,得到第一任务卸载模型。
6.如权利要求3所述的任务卸载方法,其特征在于,所述根据所述第二优化成本函数对所述系统模型进行训练,得到第二任务卸载模型的步骤,包括:
基于所述系统模型建立交替方向乘子法模型;
根据所述第二优化成本函数对所述交替方向乘子法模型进行训练,得到第二任务卸载模型。
7.一种任务卸载装置,其特征在于,所述任务卸载装置应用于电子设备,所述电子设备与任务卸载系统通信连接,所述任务卸载系统包括第二设备和至少一个第一设备,所述任务卸载装置包括:
任务获取模块,用于获取所述至少一个第一设备的待处理任务,其中,所述待处理任务包括目标任务;
策略获取模块,用于将所述待处理任务输入预设的任务卸载模型,得到任务卸载策略,其中,所述任务卸载模型基于建立的系统模型进行训练得到;
策略发送模块,用于将所述任务卸载策略发送至所述至少一个第一设备,以使所述至少一个第一设备基于所述任务卸载策略将所述目标任务卸载至所述第二设备,所述第二设备对所述目标任务进行执行处理;
所述任务卸载装置还用于根据所述任务卸载系统的成本参数建立系统模型和优化成本函数;根据所述优化成本函数对所述系统模型进行训练,得到任务卸载模型;
所述优化成本函数包括本地计算成本和计算卸载到边缘服务器的成本:
Figure 386911DEST_PATH_IMAGE001
Figure 824845DEST_PATH_IMAGE012
其中,
Figure 245462DEST_PATH_IMAGE013
表示无线充电所占时间比例,T表示时间片段长度,
Figure 655715DEST_PATH_IMAGE014
表示本地计算时延,
Figure 769164DEST_PATH_IMAGE015
表示本地计算消耗的能量,
Figure 694395DEST_PATH_IMAGE016
表示第i个无线用户设备到边缘计算服务器的计算卸载时延,
Figure 856386DEST_PATH_IMAGE017
表示边缘计算服务器运行任务的时间,
Figure 917883DEST_PATH_IMAGE018
表示在第t个时间片,第i个无线用户设备将任务上传到边缘服务器所消耗的能量,
Figure 139917DEST_PATH_IMAGE009
表示第i个无线用户设备在边缘服务器上本地等待远程执行任务期间消耗的能量,ω1和ω3为任务处理延迟的权重,ω2和ω4为能耗的权重,并满足
Figure 552444DEST_PATH_IMAGE019
且,
Figure 580443DEST_PATH_IMAGE011
8.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至6任一项所述的任务卸载方法。
9.一种存储介质,其特征在于,所述存储介质包括计算机程序,所述计算机程序运行时控制所述存储介质所在电子设备执行权利要求1至6任一项所述的任务卸载方法。
CN202110537588.4A 2021-05-18 2021-05-18 任务卸载方法和装置、电子设备及存储介质 Active CN112988285B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110537588.4A CN112988285B (zh) 2021-05-18 2021-05-18 任务卸载方法和装置、电子设备及存储介质
PCT/CN2022/091260 WO2022242468A1 (zh) 2021-05-18 2022-05-06 任务卸载方法、调度优化方法和装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110537588.4A CN112988285B (zh) 2021-05-18 2021-05-18 任务卸载方法和装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112988285A CN112988285A (zh) 2021-06-18
CN112988285B true CN112988285B (zh) 2021-08-03

Family

ID=76336771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110537588.4A Active CN112988285B (zh) 2021-05-18 2021-05-18 任务卸载方法和装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112988285B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114116052A (zh) * 2021-11-18 2022-03-01 天津市英贝特航天科技有限公司 一种边缘计算方法及装置
CN114398106B (zh) * 2022-01-21 2023-11-21 中国联合网络通信集团有限公司 一种卸载策略确定方法、装置、电子设备及存储介质
CN116361009B (zh) * 2023-05-19 2023-11-10 南京邮电大学 一种mec计算卸载、资源分配及缓存联合优化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920280A (zh) * 2018-07-13 2018-11-30 哈尔滨工业大学 一种单用户场景下的移动边缘计算任务卸载方法
CN110377353A (zh) * 2019-05-21 2019-10-25 湖南大学 计算任务卸载系统与方法
CN110968366A (zh) * 2019-11-29 2020-04-07 长沙理工大学 一种基于有限mec资源的任务卸载方法、装置及设备
CN111182048A (zh) * 2019-12-25 2020-05-19 大连理工大学 一种基于区块链使能的群智感知的智能交通管理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920280A (zh) * 2018-07-13 2018-11-30 哈尔滨工业大学 一种单用户场景下的移动边缘计算任务卸载方法
CN110377353A (zh) * 2019-05-21 2019-10-25 湖南大学 计算任务卸载系统与方法
CN110968366A (zh) * 2019-11-29 2020-04-07 长沙理工大学 一种基于有限mec资源的任务卸载方法、装置及设备
CN111182048A (zh) * 2019-12-25 2020-05-19 大连理工大学 一种基于区块链使能的群智感知的智能交通管理方法

Also Published As

Publication number Publication date
CN112988285A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN112988285B (zh) 任务卸载方法和装置、电子设备及存储介质
CN112882815B (zh) 基于深度强化学习的多用户边缘计算优化调度方法
CN113346944B (zh) 空天地一体化网络中时延最小化计算任务卸载方法及系统
CN113207136B (zh) 一种联合优化计算卸载和资源分配的方法及装置
CN110971706A (zh) Mec中近似最优化与基于强化学习的任务卸载方法
CN112422644B (zh) 计算任务卸载方法及系统、电子设备和存储介质
CN113543176A (zh) 基于智能反射面辅助的移动边缘计算系统的卸载决策方法
Hu et al. An efficient online computation offloading approach for large-scale mobile edge computing via deep reinforcement learning
Li et al. An integrated optimization-learning framework for online combinatorial computation offloading in MEC networks
CN113220356B (zh) 一种移动边缘计算中的用户计算任务卸载方法
Liao et al. Online computation offloading with double reinforcement learning algorithm in mobile edge computing
CN110531996B (zh) 一种多微云环境下基于粒子群优化的计算任务卸载方法
CN113568727A (zh) 一种基于深度强化学习的移动边缘计算任务分配方法
CN115002123B (zh) 基于移动边缘计算的快速适应任务卸载系统和方法
CN113645637B (zh) 超密集网络任务卸载方法、装置、计算机设备和存储介质
CN112835715A (zh) 基于强化学习的无人机任务卸载策略的确定方法和装置
CN114661466A (zh) 用于边缘计算环境中面向智能工作流应用的任务卸载方法
CN113760511A (zh) 一种基于深度确定性策略的车辆边缘计算任务卸载方法
Bi et al. Stable online computation offloading via Lyapunov-guided deep reinforcement learning
CN115408072A (zh) 基于深度强化学习的快速适应模型构建方法及相关装置
CN114090108A (zh) 算力任务执行方法、装置、电子设备及存储介质
Chen et al. An intelligent task offloading algorithm (iTOA) for UAV network
CN117436485A (zh) 基于权衡时延和精度的多退出点的端-边-云协同系统及方法
CN116009990B (zh) 基于宽注意力机制的云边协同元强化学习计算卸载方法
CN116828541A (zh) 基于多智能体强化学习的边缘计算依赖任务动态卸载方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant