CN111726845A - 多用户异构网络系统中的基站切换选择和功率分配方法 - Google Patents
多用户异构网络系统中的基站切换选择和功率分配方法 Download PDFInfo
- Publication number
- CN111726845A CN111726845A CN202010625770.0A CN202010625770A CN111726845A CN 111726845 A CN111726845 A CN 111726845A CN 202010625770 A CN202010625770 A CN 202010625770A CN 111726845 A CN111726845 A CN 111726845A
- Authority
- CN
- China
- Prior art keywords
- user
- base station
- users
- power
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000006870 function Effects 0.000 claims description 28
- 230000009471 action Effects 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 8
- 230000002787 reinforcement Effects 0.000 claims description 8
- 230000009916 joint effect Effects 0.000 claims description 7
- 238000005259 measurement Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008054 signal transmission Effects 0.000 abstract 1
- 239000003795 chemical substances by application Substances 0.000 description 11
- 238000005457 optimization Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W36/00—Hand-off or reselection arrangements
- H04W36/08—Reselecting an access point
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/04—Wireless resource allocation
- H04W72/044—Wireless resource allocation based on the type of the allocated resource
- H04W72/0473—Wireless resource allocation based on the type of the allocated resource the resource being transmission power
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种多用户异构网络系统中的基站切换选择和功率分配方法,包括1个宏基站和M个毫米波小基站,以及N个移动的用户终端,用户只能根据局部观测信息做出决策,包括如下步骤:每个用户同步地选择连接至某一宏基站或小基站,并且同时发射一个功率分配请求因子给所连接的基站,基站根据所服务需求因子的比例来分配信号发射的能量。本发明使系统对用户的切换选择和能量分配策略进行优化,使得系统同时兼顾吞吐量和切换频率,在最大化吞吐量的同时降低用户切换频率。
Description
技术领域
本发明属于无线通信领域,具体涉及一种多用户异构网络系统(简称“系统”)中最优化基站切换和能量分配方法,更具体涉及一种基于多智能体强化学习算法MAPPO(multi-agent proximal policy optimization,多智能体近端策略优化)的基站切换和能量分配策略的优化方法。
背景技术
第五代(5G)网络预计将满足日益增长的无线通信需求。由于可用的宽频谱和预期的高数据速率,30-300GHz范围内的毫米波将在5G中发挥关键作用。另一方面,由于受到发射功率、高温噪声和高吸氧量的限制,毫米波信号的传输距离较短。在交通热点地区密集部署小型基站被认为是克服毫米波缺点的潜在解决方案之一。
在无线网络中,用户需要在移动过程中切换服务基站以保持通信质量。传统上,切换过程是由第三代合作伙伴计划(3GPP)协议中定义的HO事件决定的。3GPP中的切换机制是为了传统宏基站而设计,在密集网络中,3GPP中传统的切换策略可能会导致频繁切换的问题,且会增加切换带来额外的开销。因此,建立适合毫米波系统的切换机制至关重要。此外,能量分配是无线通信中的一个传统问题,其会对系统的信息吞吐量造成至关重要的影响。如何分配这些能量,发送多少或者发送给谁,都需要研究。
目前通常的切换控制优化方法是去通过与几个特定的指标进行阈值比较来自适应地调整3GPP中定义切换参数,这类方法通常不具有很好的理论保证。另一种是将问题构建成一个多臂赌博机模型,来优化当前的最优解,但是这种方法没有考虑最大化长期吞吐量,并且这些方法通常没有考虑多用户之间的影响和合作。此外,随着隐私意识的提升,用户设备更倾向于分布式的作出决策。因此,构建一种合适的算法,使得分布式系统中的多个互相影响的用户在最大化系统总吞吐量的同时降低用户切换频率具有重要意义。
发明内容
发明目的:针对上述现有技术存在的问题和不足,本发明的目的是提供一种多用户异构网络系统中的基站切换选择和功率分配方法,使得系统通过优化用户端的切换控制和功率分配请求策略,获得最大系统吞吐量的同时,降低用户平均切换频率。
技术方案:为实现上述发明目的,本发明采用的技术方案为一种多用户异构网络系统中的基站切换选择和功率分配方法,包括1个宏基站和M个毫米波小基站(简称小基站),以及N个移动的用户终端,每个用户只知道各自局部观测信息,包括如下步骤:
(1)设用户的集合为基站的集合为其中0是宏基站的编号,其余编号为小基站的编号,宏基站的总功率为PM,小基站总功率为PS,为保证基本需求,PS被分为和其中可自由分配给用户,而由基站平均分配给用户,类似地,PM被分为用于可自由分配给用户的部分和平均分配给用户的部分通信系统在无穷个时隙中进行,在第t个时隙,每个用户同时地选择连接到第个基站,并且发送一个功率分配请求因子给基站其中qmax为最大功率分配请求因子,所述基站根据所述功率分配请求因子来分配信号功率;
(2)每个用户使用自身策略并基于自己的局部观测信息来进行基站切换选择和发送功率分配请求因子,所述局部观测信息包括用户的信号测量信息,当前连接的基站编号,以及每个基站当前所服务的用户数量,然后优化用户的个人策略使得用户能独立做出全局最佳的决策,从而最大化系统总的吞吐量,并且在目标函数中引入了切换惩罚,通过增加切换惩罚的权重来降低切换频率。
进一步的,所述步骤(1)中,在时隙t≥0时,用户u的动作表示为 其中为任意用户的动作空间的集合,所有用户的联合动作 其中联合动作空间为的笛卡尔N次积给定 当m=0时,宏基站根据如下标准分配功率给用户u:
更进一步的,所述步骤(2)中,还包含以下步骤
1)对于所有时隙t≥0时,定义每个用户u的局部观测信息为定义全局状态为每个用户局部观测信息的集合其中为状态空间,用户的策略表示为πu,是一个基于的条件概率分布,定义x~p(x)表示变量x服从概率分布p(x),用户基于所述条件概率分布选取动作 策略集合为∏={π1,…,πN},由于每个用户独立的选择动作,所以定义联合策略π为从而联合动作at~π(at|st);
2)在时隙t≥0时,所有用户u在执行完动作后,系统得到共同奖赏为r(st,at),简写为rt,定义期望折扣平均奖赏 其中0≤γ<1为折扣因子,ρ0(s0)为初始状态s0的概率分布,表示对轨迹a0,s1,a1,…取均值;
3)利用多智能体强化学习算法来优化∏={π1,…,πN}使得η(π)达到最大。
更进一步的,所述步骤3)中,还包含以下步骤:
其中表示对变量x求梯度, 表示采样平均,cε(x)是一个将x限制在区间[1-ε,1+ε]之间的函数,是时隙t时的策略的概率比,然后计算值函数梯度最后更新参数θu←θu+αΔθu,ωu←ωu+αΔωu,其中←表示箭头右边的数值赋值给左边,α为更新步长,然后返回步骤32),直至策略的参数θu不再改变。
有益效果:本发明通过使用多智能体深度强化学习算法MAPPO来优化用户的基站切换选择和功率分配请求因子的方法,并且考虑切换带来的损失,从而使得系统在最大的吞吐量的同时,避免频繁切换问题。
附图说明
图1是本发明的系统模型图;
图2是本发明的策略迭代算法程序流程图;
图3是本发明所使用的方法和其他方法的性能比较图;
图4是改变β对信息吞吐量和切换频率的影响示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,我们考虑的通信系统由1个宏基站,M个毫米波小基站,和N个移动的用户组成。设是基站的集合,其中0是宏基站的编号,其余编号为小基站的编号,为用户的集合。宏基站的总功率为PM,小基站总功率为PS,为保证基本需求,PS被分为和其中可自由分配给用户,而由基站平均分配给用户,类似地,PM被分为用于可自由分配给用户的部分和平均分配给用户的部分在每个时隙,用户可以选择连接至区域内任意一个的基站,并且对其发射一个功率分配请求因子,其所连接的基站根据所收到的所有用户发来的功率分配请求因子成比例的分配信息传输功率。
(1)我们认为通信系统在无限个等间隔时隙中进行,每个时隙的长度为ΔT。在第t个时隙,用户选择连接至基站并且对其发送了一个功率分配请求因子其中qmax为最大功率分配请求因子。基站根据所收到的所有用户发来的功率请求因子成比例的分配信息传输功率:假设当m=0时,宏基站根据如下标准分配功率给用户u:
(2)定义每个用户u的局部观测信息由其当前连接的基站,信号测量信息,和每个基站当前所服务的用户数所构成。在第t个时隙,用户u当前所连接的基站为基站当前所服务的用户数量信息为其中 是基站所服务的用户数量。定义信号测量信息为基站广播的参考信号在用户端的信噪比,令表示时隙t时基站m发射的参考信号在用户u端所测量的信噪比,从而用户u的信号测量值为 并假设信道状态在一个时隙内是不变的。在时隙t,用户u的局部观测信息为并且定义全局状态为每个用户局部观测的集合其中为状态空间。
(3)假设小基站的总带宽为WS,宏基站的总带宽为WM。毫米波的小区内干扰可以通过空间预编码消除,所以当用户连接至小基站时,可以利用全部WS的带宽,而宏基站需要通过分配不重叠的子频带来消除小区内干扰,所以宏基站将带宽平均分配给所有连接到其上的用户。可以得知功率和带宽分配是受到其他用户动作的影响,所以,设那么用户u的在时隙t信息吞吐量为
此外,由于切换会带来连接中断,我们定义Tq≤ΔT为中断时长,在中断的时间内没有信息传输。所以用户u在时隙t的个人奖赏为
其中β≥0是调节切换损失的权重因子。
为了最大化系统长期吞吐量并且降低切换频率,我们将这个问题建模成合作多智能体任务,其中用户们具有一个共同奖赏:
我们将r(st,at)简写为rt。在我们随后介绍的多智能体强化学习算法中,可以通过调节β来改变策略关于增大吞吐量和降低切换频率之间的权重。
(4)定义折扣奖赏为其中0<γ<1为折扣因子。定义用户的策略为是一个基于的条件概率分布,用户基于该概率分布选取动作:策略集合为∏={π1,…,πN};由于每个用户独立的选择动作,所以联合策略为π是个体策略的连乘:
分别定义标准的联合状态-动作值函数Qπ,联合状态值函数Vπ,和联合优势函数Aπ如下:
Aπ(st,at)=Qπ(st,at)-Vπ(st),
其中P(·|·)为条件概率。
为解决问题(9),我们采用一种多智能体强化学习算法——MAPPO(multi-agentproximal policy optimization,多智能体近端策略优化)来为每个用户学得各自最优的分布式的策略πu。
其中
我们采用梯度上升的方法求解问题(10),目标函数的梯度为
对于每个用户u,用于更新其策略的梯度为
注意到(14)式中的梯度计算与联合优势函数有关。但事先我们不知道它的具体值,所以需要估计。对于用户u,我们首先构建一个参数为ωu的参数化函数来作为Qπ(st,at)的估计。表示除了用户u的动作以外的联合动作。对于用户u,联合优势函数的估计值为:
由于最小化相当于最大化负的目标函数,所以用于更新ωu的梯度为:
我们给出利用MAPPO求解原始问题(9)的详细流程,如下:
2)在数据收集阶段,第t步时,系统状态为用户根据当前观测值选取动作:所有用户的动作为联合动作 然后系统转移至下一个状态st+1~P(st+1|st,at),并且得到奖赏rt。假设一轮迭代一共有T步,那么获得的轨迹为然后根据上述(14)式计算再根据(13)式计算{Au(st,at),从而得到一组数据
3)利用收集到的数据组更新参数θu和ωu,为了提高数据利用率,我们反复使用D更新K轮参数。在第k∈{1,2,…,K}轮中,首先打乱数据组D中关于时间维度上的排列,然后对其重新编号,以打破相邻数据之间的相关性从而稳定学习过程。我们采取批更新的方式,也就是每次选取D中的一批数据用于更新,假设每次选取B组数据,其中B为可以被T整除的数,那么一共确批数据。第 批中,数据为然后对于每个用户u,计算策Δθu和Δωu:
然后使用梯度上升来更新参数:
θu←θu+αΔθu,
ωu←ωu+αΔωu, (22)
最后我们对系统进行了仿真。仿真参数设为:N=10,M=4,PS=3W,PM=120W,假设区域为半径500m的圆形区域,宏基站位于坐标原点,四个小基站分别位于(400,0)m,(0,400)m,(-400,0)m,和(0,400)m四个点上,WS=100MHz,WM=20MHz,Tq=ΔT=100ms,用户移动速度在[3,20]m/s区间内,qmax=4。设T=1024,γ=0.9,λ=0,5,更新步长α=10-3。策略πu和值函数均利用多层感知器(人工神经网络的一种)来参数化,激活函数为ReLu(Rectified Linear Unit,线性整流单元),一共有两层,每层64个神经元。惩罚项权重β默认为0。
在图3中,我们与几种其他的方法进行了对比,其中A3C(Asynchronous advantageactor-critic,异步优势行动者-批评家)方法来自《Handover Control in WirelessSystems via Asynchronous Multiuser Deep Reinforcement Learning》,MADDPG(multi-agent deep deterministic policy gradient,多智能体深度确定策略梯度)方法来自《Multi-agent actor-critic for mixed cooperative-competitive environments》,而δsig是一种简单的对比方法,当用户的信噪比低于0dB时,就切换至基站而功率则采取平均分配。从图可以看出我们的方法能获得很大的性能提升,远超过其他对比方法,结果表明我们的方法能够显著提升系统的信息吞吐量。在图4中,我们可以改变切换惩罚权重β的值来改变增大信息吞吐量和降低切换频率之间的权重,随着增大切换惩罚因子β的值,可以发现频繁切换的问题被显著缓解,因此我们的方法能有效解决频繁切换问题。
Claims (4)
1.一种多用户异构网络系统中的基站切换选择和功率分配方法,包括1个宏基站和M个毫米波小基站,以及N个移动的用户终端,用户只知道局部观测信息,包括如下步骤:
(1)设用户的集合为基站的集合为其中0是宏基站的编号,其余编号为小基站的编号,宏基站的总功率为PM,小基站的总功率为PS,为保证基本需求,PS被分为和其中可自由分配给用户,而由基站平均分配给用户,类似地,PM被分为用于可自由分配给用户的部分和平均分配给用户的部分通信系统在无穷个时隙中进行,在第t个时隙,每个用户同时地选择连接到第个基站,并且发送一个功率分配请求因子给基站其中qmax为最大功率分配请求因子,所述基站根据所述功率分配请求因子来分配信号功率;
(2)每个用户使用自身策略并基于自己的局部观测信息来进行基站切换选择和发送功率分配请求因子,所述局部观测信息包括用户的信号测量信息,当前连接的基站编号,以及每个基站当前所服务的用户数量,然后优化用户的个人策略使得用户能独立做出全局最佳的决策,从而最大化系统总的吞吐量,并且在目标函数中引入了切换惩罚,通过增加切换惩罚的权重来降低切换频率。
3.根据权利要求2所述的多用户异构网络系统中的基站切换选择和功率分配方法,其特征在于:所述步骤(2)中,还包含以下步骤:
1)对于所有时隙t≥0时,定义每个用户u的局部观测信息为定义全局状态为每个用户局部观测信息的集合其中为状态空间,用户的策略表示为πu,是一个基于的条件概率分布,定义x~p(x)表示变量x服从概率分布p(x),用户基于所述条件概率分布选取动作 策略集合为Π={π1,…,πN},由于每个用户独立的选择动作,所以定义联合策略π为从而联合动作at~π(at|st);
2)在时隙t≥0时,所有用户u在执行完动作后,系统得到共同奖赏为r(st,at),简写为rt,定义期望折扣平均奖赏 其中0≤γ<1为折扣因子,ρ0(s0)为初始状态s0的概率分布,表示对轨迹a0,s1,α1,…取均值;
3)利用多智能体强化学习算法来优化Π={π1,…,πN}使得η(π)达到最大。
4.根据权利要求3所述的多用户异构网络系统中的基站切换选择和功率分配方法,其特征在于:所述步骤3)中,还包含以下步骤:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010625770.0A CN111726845B (zh) | 2020-07-01 | 2020-07-01 | 多用户异构网络系统中的基站切换选择和功率分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010625770.0A CN111726845B (zh) | 2020-07-01 | 2020-07-01 | 多用户异构网络系统中的基站切换选择和功率分配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111726845A true CN111726845A (zh) | 2020-09-29 |
CN111726845B CN111726845B (zh) | 2021-10-26 |
Family
ID=72571178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010625770.0A Active CN111726845B (zh) | 2020-07-01 | 2020-07-01 | 多用户异构网络系统中的基站切换选择和功率分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111726845B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112492691A (zh) * | 2020-11-26 | 2021-03-12 | 辽宁工程技术大学 | 一种深度确定性策略梯度的下行noma功率分配方法 |
CN112822734A (zh) * | 2020-12-31 | 2021-05-18 | 上海擎昆信息科技有限公司 | 一种高铁沿线网络接入方法和系统 |
CN113839696A (zh) * | 2021-09-22 | 2021-12-24 | 东南大学 | 一种在线鲁棒的分布式多小区大规模mimo预编码方法 |
CN114189877A (zh) * | 2021-12-06 | 2022-03-15 | 天津大学 | 一种面向5g基站的复合式能耗优化控制方法 |
WO2022077393A1 (zh) * | 2020-10-15 | 2022-04-21 | 北京小米移动软件有限公司 | Ue的目标小区确定方法、装置、通信设备及存储介质 |
CN115296705A (zh) * | 2022-04-28 | 2022-11-04 | 南京大学 | 一种mimo通信系统中的主动监听方法 |
CN117408052A (zh) * | 2023-10-18 | 2024-01-16 | 南栖仙策(南京)高新技术有限公司 | 一种蒸镀机镀膜控制优化方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110505644A (zh) * | 2019-09-26 | 2019-11-26 | 江南大学 | 5g超密集异构网络下的用户任务卸载与资源分配联合优化方法 |
US20200052349A1 (en) * | 2018-08-08 | 2020-02-13 | The Boeing Company | Heterogeneous battery system and method |
CN110798851A (zh) * | 2019-10-25 | 2020-02-14 | 西安交通大学 | 无线异构网络基于QoS的能量效率和负载均衡的联合优化方法 |
-
2020
- 2020-07-01 CN CN202010625770.0A patent/CN111726845B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200052349A1 (en) * | 2018-08-08 | 2020-02-13 | The Boeing Company | Heterogeneous battery system and method |
CN110505644A (zh) * | 2019-09-26 | 2019-11-26 | 江南大学 | 5g超密集异构网络下的用户任务卸载与资源分配联合优化方法 |
CN110798851A (zh) * | 2019-10-25 | 2020-02-14 | 西安交通大学 | 无线异构网络基于QoS的能量效率和负载均衡的联合优化方法 |
Non-Patent Citations (3)
Title |
---|
DELIN GUO: "《2019 IEEE Globecom Workshops》", 13 December 2019 * |
DELIN GUO: "《Joint Optimization of Handover Control and Power Allocation Based on Multi-Agent Deep Reinforcement Learning》", 《IEEE TRANSACTION ON VEHICULAR TECHNOLOGY》 * |
程楠: "《LTE网络覆盖优化分析》", 《电信工程技术与标准化》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022077393A1 (zh) * | 2020-10-15 | 2022-04-21 | 北京小米移动软件有限公司 | Ue的目标小区确定方法、装置、通信设备及存储介质 |
CN112492691A (zh) * | 2020-11-26 | 2021-03-12 | 辽宁工程技术大学 | 一种深度确定性策略梯度的下行noma功率分配方法 |
CN112492691B (zh) * | 2020-11-26 | 2024-03-26 | 辽宁工程技术大学 | 一种深度确定性策略梯度的下行noma功率分配方法 |
CN112822734A (zh) * | 2020-12-31 | 2021-05-18 | 上海擎昆信息科技有限公司 | 一种高铁沿线网络接入方法和系统 |
CN112822734B (zh) * | 2020-12-31 | 2023-01-31 | 上海擎昆信息科技有限公司 | 一种高铁沿线网络接入方法和系统 |
CN113839696A (zh) * | 2021-09-22 | 2021-12-24 | 东南大学 | 一种在线鲁棒的分布式多小区大规模mimo预编码方法 |
CN114189877A (zh) * | 2021-12-06 | 2022-03-15 | 天津大学 | 一种面向5g基站的复合式能耗优化控制方法 |
CN114189877B (zh) * | 2021-12-06 | 2023-09-15 | 天津大学 | 一种面向5g基站的复合式能耗优化控制方法 |
CN115296705A (zh) * | 2022-04-28 | 2022-11-04 | 南京大学 | 一种mimo通信系统中的主动监听方法 |
CN115296705B (zh) * | 2022-04-28 | 2023-11-21 | 南京大学 | 一种mimo通信系统中的主动监听方法 |
CN117408052A (zh) * | 2023-10-18 | 2024-01-16 | 南栖仙策(南京)高新技术有限公司 | 一种蒸镀机镀膜控制优化方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111726845B (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111726845B (zh) | 多用户异构网络系统中的基站切换选择和功率分配方法 | |
Zhang et al. | Energy-efficient mode selection and resource allocation for D2D-enabled heterogeneous networks: A deep reinforcement learning approach | |
Guo et al. | Joint optimization of handover control and power allocation based on multi-agent deep reinforcement learning | |
Anandakumar et al. | A bio-inspired swarm intelligence technique for social aware cognitive radio handovers | |
CN113163451B (zh) | 一种基于深度强化学习的d2d通信网络切片分配方法 | |
Zhang et al. | Deep reinforcement learning for multi-agent power control in heterogeneous networks | |
CN112367132B (zh) | 基于强化学习解决认知无线电中的功率分配算法 | |
CN112383922A (zh) | 一种基于优先经验重放的深度强化学习频谱共享方法 | |
Wang et al. | Decentralized learning based indoor interference mitigation for 5G-and-beyond systems | |
Cui et al. | QoS guaranteed network slicing orchestration for Internet of Vehicles | |
CN110213776B (zh) | 一种基于Q学习和多属性决策的WiFi卸载方法 | |
Mehbodniya et al. | A fuzzy extension of VIKOR for target network selection in heterogeneous wireless environments | |
CN113316154A (zh) | 一种授权和免授权d2d通信资源联合智能分配方法 | |
CN114827191B (zh) | 一种车路协同系统中融合noma的动态任务卸载方法 | |
CN113453358B (zh) | 一种无线携能d2d网络的联合资源分配方法 | |
CN112492691A (zh) | 一种深度确定性策略梯度的下行noma功率分配方法 | |
CN108848535B (zh) | 一种面向共享模式的雾计算环境资源分配方法 | |
Dai et al. | Multi-objective intelligent handover in satellite-terrestrial integrated networks | |
CN116390125A (zh) | 一种基于ddpg-d3qn的工业物联网云边协同卸载及资源分配方法 | |
CN114885422A (zh) | 一种超密集网络中基于混合接入方式的动态边缘计算卸载方法 | |
CN115065678A (zh) | 一种基于深度强化学习的多智能设备任务卸载决策方法 | |
Wei et al. | Resource allocation and power control policy for device-to-device communication using multi-agent reinforcement learning | |
CN116261224A (zh) | 一种无线网络资源分配方法及系统 | |
Kaur et al. | A reinforcement learning-based green resource allocation for heterogeneous services in cooperative cognitive radio networks | |
Kaur et al. | Intelligent spectrum management based on reinforcement learning schemes in cooperative cognitive radio networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |