CN110392377B - 一种5g超密集组网资源分配方法及装置 - Google Patents

一种5g超密集组网资源分配方法及装置 Download PDF

Info

Publication number
CN110392377B
CN110392377B CN201910657277.4A CN201910657277A CN110392377B CN 110392377 B CN110392377 B CN 110392377B CN 201910657277 A CN201910657277 A CN 201910657277A CN 110392377 B CN110392377 B CN 110392377B
Authority
CN
China
Prior art keywords
ultra
long
resource allocation
dense networking
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910657277.4A
Other languages
English (en)
Other versions
CN110392377A (zh
Inventor
陈莹
刘智勇
陈昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN201910657277.4A priority Critical patent/CN110392377B/zh
Publication of CN110392377A publication Critical patent/CN110392377A/zh
Application granted granted Critical
Publication of CN110392377B publication Critical patent/CN110392377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明实施例提供了一种5G超密集组网资源分配方法及装置,方法包括:针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;将所述近似长期价值和实际长期价值对比,以更新长期价值函数;当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配。本发明实施例提供的一种5G超密集组网资源分配方法及装置,基于深度强化学习来解决随机优化问题,从而使得资源的分配能够适应用户到达和离开的随机性,并且同时降低了求解复杂性。

Description

一种5G超密集组网资源分配方法及装置
技术领域
本发明涉及5G超密集组网和强化学习技术领域,尤其涉及一种5G超密集组网资源分配方法及装置。
背景技术
随着移动互联网和物联网技术的快速发展,对移动通信业务的需求也在迅速增长。智能设备的通信需求和海量物联网环境促进了网络基础设施的密集化。超密集网络UDN应运而生,将成为5G网络的关键技术。在UDN架构中,单元的半径会进一步减小,导致单元之间的干扰增加。此外,随着网络环境的变化,系统的性能要求也可能发生变化。因此,网络资源配置应考虑与环境的交互作用,并且由于用户设备在空间和时间上的不均匀性,使得UDN的资源管理更加困难。
现有的组网资源分配方法不能很好适应用户到达和离开的高度动态性并且现有方法的求解复杂度较高,导致其无法很好满足应用的服务质量要求并在实际环境中难以实施。
因此,现在亟需一种新的5G超密集组网资源分配方法来解决上述问题。
发明内容
为了解决上述问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的一种5G超密集组网资源分配方法及装置。
第一方面本发明实施例提供一种5G超密集组网资源分配方法,包括:
针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;
将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;
将所述近似长期价值和实际长期价值对比,以更新长期价值函数;
当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配。
其中,所述5G超密集组网系统包括:
多个小小区组成的宏小区,所述宏小区包括一个宏基站,每个小小区包括一个小基站。
其中,所述即时奖励的计算函数为:
Figure BDA0002137231990000021
其中,rt为即时奖励,
Figure BDA0002137231990000022
为5G超密集组网系统的能量效率,
Figure BDA0002137231990000023
为5G超密集组网系统的频谱效率,ξ(t)为能量效率与频谱效率之间的权衡因子。
其中,所述长期价值函数为:
Q(st,at)=(1-α)Q(st,at)+α[rt+γmaxQ(st+1,at+1)];
其中,α表示学习效率,γ表示折扣因子,st表示t时刻系统的状态,
Figure BDA0002137231990000024
表示所述宏基站在t时刻做出的决策。
其中,所述方法还包括:
获取每个时刻的5G超密集组网系统的系统状态,所述系统状态包括每个小小区的用户数量、每个小基站的吞吐量以及资源块的复用情况。
其中,所述将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值,包括:
将当前时刻的系统状态、决策、即使奖励以及下一时刻的系统状态作为样本集存储在预设存储空间中;
当所述存储空间的数据量达到上限时,从所述存储空间中随机选择部分样本集进行拟合,得到所述近似长期价值。
第二方面本发明实施例还提供一种5G超密集组网资源分配装置,包括:
决策模块,用于针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;
神经网络拟合模块,用于将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;
更新模块,用于将所述近似长期价值和实际长期价值对比,以更新长期价值函数;
资源分配模块,用于当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配。
第三方面本发明实施例提供了一种电子设备,包括:
处理器、存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述5G超密集组网资源分配方法。
第四方面本发明实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述5G超密集组网资源分配方法。
本发明实施例提供的一种5G超密集组网资源分配方法及装置,基于深度强化学习来解决随机优化问题,从而使得资源的分配能够适应用户到达和离开的随机性,并且同时降低了求解复杂性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种5G超密集组网资源分配方法流程示意图;
图2是本发明实施例提供的一种5G超密集组网资源分配装置结构示意图;
图3是本发明实施例提供的一种电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种5G超密集组网资源分配方法流程示意图,如图1所示,包括:
101、针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;
102、将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;
103、将所述近似长期价值和实际长期价值对比,以更新长期价值函数;
104、当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配。
需要说明的是,本发明实施例的执行主体为5G超密集组网系统中的宏基站MgNB,本发明实施例针对的应用场景主要为UDN架构中资源管理,但其他的应用场景也可以使用本发明实施例提供的资源分配方法,对此本发明实施例不作具体限定。
具体的,在步骤101中,本发明实施例首先需要对每个时刻的网络系统状态进行状态获取,在本发明实施例中,5G超密集组网系统是由n个小小区组成的宏小区,其中有M个资源块可被分配,资源块的集合表示为
Figure BDA0002137231990000051
其中整个宏小区内有一个宏基站(MgNB),每个小小区内有一个小基站(SgNB),小小区与小基站与集合都为
Figure BDA0002137231990000052
通过本发明实施例提供的MgNB下发资源分配策略来完成让SgNB选择可用的资源块分配给每个小小区的用户,需要说明的是,在本发明实施例提供的5G超密集组网系统中,多个SgNB同时可以复用相同的资源块。那么在时刻t时,MgNB即可以进行决策,并计算决策后网络系统的即时奖励,可以理解的是,该即时奖励与每个时刻的系统状态是一一对应关系,每个时刻所计算出的即时奖励不同。
进一步的,在步骤102中,本发明实施例提供了一个深度神经网络来解决无线网络中的随机优化问题,可以理解的是,在未知环境下,强化学习通过与环境的交互作用得到最优策略,其中,Q-学习算法是目前最流行的强化学习算法之一,然而,由于实际问题中动作状态空间的爆炸,Q-学习收敛速度较慢,很难找到最优的动作来求解。因而本发明实施例提供了深度神经网络来将强化学习过程与深度神经网络相结合,拟合动作状态值函数。优选的采用了深度Q网络,从而解决了Q-学习收敛速度较慢的缺点。那么通过本发明实施例提供的深度Q网络,即能够拟合出动作状态值函数,在本发明实施例中称为近似长期价值。
在步骤103中,可以理解的是,5G超密集组网系统在进行决策后会计算出一个实际的长期价值,那么将实际长期价值与本发明实施例拟合得到的近似长期价值进行比对能够更新当前时刻的长期价值函数,从而缩小近似长期价值的计算误差。
最后,在步骤104中,经过不断的迭代更新,当长期价值函数的更新过程收敛时,即可以判定此时的资源分配方案是最优解,获取此时的各个时刻资源分配策略作为资源分配方案即可完成资源分配,此时得到的资源分配方案能够自动适应用户到达和离开的随机性。
本发明实施例提供的一种5G超密集组网资源分配方法,基于深度强化学习来解决随机优化问题,从而使得资源的分配能够适应用户到达和离开的随机性,并且同时降低了求解复杂性。
在上述实施例的基础上,所述5G超密集组网系统包括:
多个小小区组成的宏小区,所述宏小区包括一个宏基站,每个小小区包括一个小基站。
由上述实施例的内容可知,本发明实施例所针对的具体5G超密集组网系统是由特定的n个小小区组成的宏小区,宏小区内有一个宏基站(MgNB),每个小小区内有一个小基站(SgNB)。
在上述实施例的基础上,所述即时奖励的计算函数为:
Figure BDA0002137231990000061
其中,rt为即时奖励,
Figure BDA0002137231990000062
为5G超密集组网系统的能量效率,
Figure BDA0002137231990000063
为5G超密集组网系统的频谱效率,ξ(t)为能量效率与频谱效率之间的权衡因子。
由上述实施例的内容可知,本发明实施例可以计算每个时刻MgNB在进行决策后系统的即时奖励,其计算函数rt具体为:
Figure BDA0002137231990000064
其中,rt为即时奖励,
Figure BDA0002137231990000065
为5G超密集组网系统的能量效率,
Figure BDA0002137231990000066
为5G超密集组网系统的频谱效率,ξ(t)为能量效率与频谱效率之间的权衡因子。
在上述实施例的基础上,所述长期价值函数为:
Q(st,at)=(1-α)Q(st,at)+α[rt+γmaxQ(st+1,at+1)];
其中,α表示学习效率,γ表示折扣因子,st表示t时刻系统的状态,
Figure BDA0002137231990000071
表示所述宏基站在t时刻做出的决策。
由上述实施例的内容可知,本发明实施例需要计算系统的长期价值,那么相应的系统的长期价值计算函数Q(st,at)具体为:
Q(st,at)=(1-α)Q(st,at)+α[rt+γmaxQ(st+1,at+1)];
其中,α表示学习效率,γ表示折扣因子,st表示t时刻系统的状态,
Figure BDA0002137231990000072
表示所述宏基站在t时刻做出的决策。
在上述实施例的基础上,所述方法还包括:
获取每个时刻的5G超密集组网系统的系统状态,所述系统状态包括每个小小区的用户数量、每个小基站的吞吐量以及资源块的复用情况。
由上述实施例的内容可知,本发明实施例会针对每个时刻的5G超密集组网系统状态,计算出相应的即时奖励,那么相应的在计算之前,本发明实施例需要对每个时刻的5G超密集组网系统的系统状态进行获取,系统状态主要包括了所有小小区的用户数目Sn(t),每个小基站的吞吐量Rn(t),以及资源块的复用情况。
在上述实施例的基础上,所述将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值,由上述实施例的内容可知,本发明实施例利用了深度神经网络,拟合得到近似长期过程,具体的拟合过程实际包括了:
将当前时刻的系统状态、决策、即使奖励以及下一时刻的系统状态作为样本集存储在预设存储空间中;
当所述存储空间的数据量达到上限时,从所述存储空间中随机选择部分样本集进行拟合,得到所述近似长期价值。
具体的,本发明实施例在具体实施时的实施流程为:
首先由MgNB获得当前时刻的系统状态st,即所有小小区的用户数目Sn(t),每个小基站的吞吐量Rn(t),以及资源块的复用情况;
然后MgNB通过贪婪策略选择资源块分配给每个用户,并根据公式即时奖励计算函数计算即时奖励rt,然后MgNB接收下一时刻的系统状态st+1
接着MgNB将当前时刻的系统状态,决策,即时奖励以及下一时刻的状态作为一批样本进行存储,当存储空间的数据达到饱和时,从存储空间随机选择部分样本,拟合出状态动作价值神经网络的两个数据流包括状态函数,优势函数,并合并成神经网络拟合的近似长期价值;
再根据长期价值计算函数的计算公式更新当前时刻的价值函数,并结合实际长期价值对神经网络进行训练,缩小长期价值的误差;最后通过迭代循环,当系统的长期价值函数收敛时,便得出每个时刻的资源分配策略。
图2是本发明实施例提供的一种5G超密集组网资源分配装置结构示意图,如图2所示,包括:决策模块201、神经网络拟合模块202、更新模块203和资源分配模块204,其中:
决策模块201用于针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;
神经网络拟合模块202用于将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;
更新模块203用于将所述近似长期价值和实际长期价值对比,以更新长期价值函数;
资源分配模块204用于当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配。
具体的如何通过决策模块201、神经网络拟合模块202、更新模块203和资源分配模块204可用于执行图1所示的5G超密集组网资源分配方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本发明实施例提供的一种5G超密集组网资源分配装置,基于深度强化学习来解决随机优化问题,从而使得资源的分配能够适应用户到达和离开的随机性,并且同时降低了求解复杂性。
在上述实施例的基础上,所述5G超密集组网系统包括:
多个小小区组成的宏小区,所述宏小区包括一个宏基站,每个小小区包括一个小基站。
在上述实施例的基础上,所述即时奖励的计算函数为:
Figure BDA0002137231990000091
其中,rt为即时奖励,
Figure BDA0002137231990000092
为5G超密集组网系统的能量效率,
Figure BDA0002137231990000093
为5G超密集组网系统的频谱效率,ξ(t)为能量效率与频谱效率之间的权衡因子。
在上述实施例的基础上,所述长期价值函数为:
Q(st,at)=(1-α)Q(st,at)+α[rt+γmaxQ(st+1,at+1)];
其中,α表示学习效率,γ表示折扣因子,st表示t时刻系统的状态,
Figure BDA0002137231990000094
表示所述宏基站在t时刻做出的决策。
在上述实施例的基础上,所述5G超密集组网资源分配装置还包括:
系统状态获取模块,用于获取每个时刻的5G超密集组网系统的系统状态,所述系统状态包括每个小小区的用户数量、每个小基站的吞吐量以及资源块的复用情况。
在上述实施例的基础上,所述神经网络拟合模块具体用于:
将当前时刻的系统状态、决策、即使奖励以及下一时刻的系统状态作为样本集存储在预设存储空间中;
当所述存储空间的数据量达到上限时,从所述存储空间中随机选择部分样本集进行拟合,得到所述近似长期价值。
图3是本发明实施例提供的一种电子设备的结构框图,参照图3,所述电子设备,包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和总线304,其中,处理器301,通信接口302,存储器303通过总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行如下方法:针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;将所述近似长期价值和实际长期价值对比,以更新长期价值函数;当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配。
本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;将所述近似长期价值和实际长期价值对比,以更新长期价值函数;当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配。
本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;将所述近似长期价值和实际长期价值对比,以更新长期价值函数;当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行每个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种5G超密集组网资源分配方法,其特征在于,包括:
针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;
将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;
将所述近似长期价值和实际长期价值对比,以更新长期价值函数;
当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配;
所述5G超密集组网系统包括:多个小小区组成的宏小区,所述宏小区包括一个宏基站,每个小小区包括一个小基站;
所述方法还包括:获取每个时刻的5G超密集组网系统的系统状态,所述系统状态包括每个小小区的用户数量、每个小基站的吞吐量以及资源块的复用情况;
所述即时奖励的计算函数为:
Figure FDA0003622244250000011
其中,rt为即时奖励,
Figure FDA0003622244250000012
为5G超密集组网系统的能量效率,
Figure FDA0003622244250000013
为5G超密集组网系统的频谱效率,ξ(t)为能量效率与频谱效率之间的权衡因子;
所述长期价值函数为:
Q(st,at)=(1-α)Q(st,at)+α[rt+γmaxQ(st+1,at+1)];
其中,α表示学习效率,γ表示折扣因子,st表示t时刻系统的状态,
Figure FDA0003622244250000014
表示所述宏基站在t时刻做出的决策;n为小小区或小基站个数,m表示资源块数。
2.根据权利要求1所述的5G超密集组网资源分配方法,其特征在于,所述将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值,包括:
将当前时刻的系统状态、决策、即时奖励以及下一时刻的系统状态作为样本集存储在预设存储空间中;
当所述存储空间的数据量达到上限时,从所述存储空间中随机选择部分样本集进行拟合,得到所述近似长期价值。
3.一种5G超密集组网资源分配装置,其特征在于,包括:
决策模块,用于针对每个时刻的5G超密集组网系统状态,基于贪婪策略进行决策,计算每个状态对应的即时奖励;
神经网络拟合模块,用于将所述每个状态对应的即时奖励输入深度神经网络中,拟合得到近似长期价值;
更新模块,用于将所述近似长期价值和长期价值函数计算得到的实际长期价值对比,以更新长期价值函数;
资源分配模块,用于当所述长期价值函数收敛时,得到每个时刻的资源分配方案,并按照所述每个时刻的资源分配方案进行资源分配;
所述5G超密集组网系统包括:
多个小小区组成的宏小区,所述宏小区包括一个宏基站,每个小小区包括一个小基站;
所述装置还用于:
获取每个时刻的5G超密集组网系统的系统状态,所述系统状态包括每个小小区的用户数量、每个小基站的吞吐量以及资源块的复用情况;
所述即时奖励的计算函数为:
Figure FDA0003622244250000021
其中,rt为即时奖励,
Figure FDA0003622244250000022
为5G超密集组网系统的能量效率,
Figure FDA0003622244250000023
为5G超密集组网系统的频谱效率,ξ(t)为能量效率与频谱效率之间的权衡因子;
所述长期价值函数为:
Q(st,at)=(1-α)Q(st,at)+α[rt+γmaxQ(st+1,at+1)];
其中,α表示学习效率,γ表示折扣因子,st表示t时刻系统的状态,
Figure FDA0003622244250000031
表示所述宏基站在t时刻做出的决策;n为小小区或小基站个数,m表示资源块数。
4.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至2任一项所述5G超密集组网资源分配方法的步骤。
5.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至2任一项所述5G超密集组网资源分配方法的步骤。
CN201910657277.4A 2019-07-19 2019-07-19 一种5g超密集组网资源分配方法及装置 Active CN110392377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910657277.4A CN110392377B (zh) 2019-07-19 2019-07-19 一种5g超密集组网资源分配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910657277.4A CN110392377B (zh) 2019-07-19 2019-07-19 一种5g超密集组网资源分配方法及装置

Publications (2)

Publication Number Publication Date
CN110392377A CN110392377A (zh) 2019-10-29
CN110392377B true CN110392377B (zh) 2022-07-12

Family

ID=68286828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910657277.4A Active CN110392377B (zh) 2019-07-19 2019-07-19 一种5g超密集组网资源分配方法及装置

Country Status (1)

Country Link
CN (1) CN110392377B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401769A (zh) * 2020-03-25 2020-07-10 国网江苏省电力有限公司扬州供电分公司 一种基于深度强化学习的配电网故障智能抢修方法及装置
CN112218337B (zh) * 2020-09-04 2023-02-28 暨南大学 一种移动边缘计算中的缓存策略决策方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103209419A (zh) * 2013-04-25 2013-07-17 西安电子科技大学 一种面向用户需求和提升网络性能的动态频谱接入的方法
CN106358308A (zh) * 2015-07-14 2017-01-25 北京化工大学 一种超密集网络中的强化学习的资源分配方法
CN107071784A (zh) * 2017-05-22 2017-08-18 西安邮电大学 一种超密集组网的频谱资源分配方法
CN109982434A (zh) * 2019-03-08 2019-07-05 西安电子科技大学 无线资源调度一体智能化控制系统及方法、无线通信系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10111250B2 (en) * 2014-01-21 2018-10-23 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatuses for coordinating resource scheduling between wireless networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103209419A (zh) * 2013-04-25 2013-07-17 西安电子科技大学 一种面向用户需求和提升网络性能的动态频谱接入的方法
CN106358308A (zh) * 2015-07-14 2017-01-25 北京化工大学 一种超密集网络中的强化学习的资源分配方法
CN107071784A (zh) * 2017-05-22 2017-08-18 西安邮电大学 一种超密集组网的频谱资源分配方法
CN109982434A (zh) * 2019-03-08 2019-07-05 西安电子科技大学 无线资源调度一体智能化控制系统及方法、无线通信系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
超密集异构蜂窝网多维资源联合优化算法;辛杰等;《太赫兹科学与电子信息学报》;20170225(第01期);全文 *

Also Published As

Publication number Publication date
CN110392377A (zh) 2019-10-29

Similar Documents

Publication Publication Date Title
CN112181666B (zh) 一种基于边缘智能的设备评估和联邦学习重要性聚合方法
Yu et al. Computation offloading for mobile edge computing: A deep learning approach
CN111414252B (zh) 一种基于深度强化学习的任务卸载方法
CN109814951B (zh) 移动边缘计算网络中任务卸载及资源分配的联合优化方法
JP7083476B1 (ja) ネットワークアクセスデバイスのリソース割り当て方法および装置
Wei et al. Deep Q-Learning Based Computation Offloading Strategy for Mobile Edge Computing.
US12067487B2 (en) Method and apparatus employing distributed sensing and deep learning for dynamic spectrum access and spectrum sharing
CN111277437A (zh) 一种智能电网的网络切片资源分配方法
CN113574842B (zh) 用于对应用请求的处理进行优化的方法和系统
CN112188503B (zh) 一种应用于蜂窝网络的基于深度强化学习的动态多信道接入方法
KR102371534B1 (ko) 비직교 다중접속(noma) 방식을 지원하는 다중접속 에지 컴퓨팅(mec)에서 심층 강화학습 기반 컴퓨팅 오프로딩 최적화 방법
CN108495340A (zh) 一种基于异构混合缓存的网络资源分配方法和装置
CN113687875B (zh) 一种车联网中车辆任务卸载方法及装置
CN110392377B (zh) 一种5g超密集组网资源分配方法及装置
Li et al. Distributed task offloading strategy to low load base stations in mobile edge computing environment
CN107615846B (zh) 一种用于资源分配的方法、装置、系统以及基站
Balakrishnan et al. Deep reinforcement learning based traffic-and channel-aware OFDMA resource allocation
Yu et al. Collaborative computation offloading for multi-access edge computing
CN114118748B (zh) 一种服务质量预测方法、装置、电子设备及存储介质
CN118227328A (zh) 资源调度模型训练方法、装置、网络设备及存储介质
CN113094180B (zh) 无线联邦学习调度优化方法及装置
CN113747507A (zh) 一种面向5g超密集网络的计算资源管理方法及装置
CN114022731A (zh) 基于drl的联邦学习节点选择方法
CN108901047A (zh) 基于内容流行度变化的基站与终端协作缓存方法及装置
CN110933687A (zh) 一种基于解耦的用户上下行接入方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant