CN113301638A - 一种基于q学习的d2d通信频谱分配与功率控制算法 - Google Patents

一种基于q学习的d2d通信频谱分配与功率控制算法 Download PDF

Info

Publication number
CN113301638A
CN113301638A CN202110553177.4A CN202110553177A CN113301638A CN 113301638 A CN113301638 A CN 113301638A CN 202110553177 A CN202110553177 A CN 202110553177A CN 113301638 A CN113301638 A CN 113301638A
Authority
CN
China
Prior art keywords
user
cellular
learning
resource block
power control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110553177.4A
Other languages
English (en)
Inventor
郑军
陈文泰
姜书瑞
张源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202110553177.4A priority Critical patent/CN113301638A/zh
Publication of CN113301638A publication Critical patent/CN113301638A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/24TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
    • H04W52/241TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account channel quality metrics, e.g. SIR, SNR, CIR, Eb/lo
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/26TPC being performed according to specific parameters using transmission rate or quality of service QoS [Quality of Service]
    • H04W52/267TPC being performed according to specific parameters using transmission rate or quality of service QoS [Quality of Service] taking into account the information rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC
    • H04W52/38TPC being performed in particular situations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/0453Resources in frequency domain, e.g. a carrier in FDMA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/0473Wireless resource allocation based on the type of the allocated resource the resource being transmission power
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/50Allocation or scheduling criteria for wireless resources
    • H04W72/54Allocation or scheduling criteria for wireless resources based on quality criteria
    • H04W72/542Allocation or scheduling criteria for wireless resources based on quality criteria using measured or perceived quality

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于Q学习的D2D通信频谱分配与功率控制算法,包括如下步骤:步骤1、利用距离信息计算蜂窝链路和D2D链路的信道增益,利用初始频谱分配信息计算链路的信干噪比,根据香农公式计算用户吞吐量;步骤2、根据D2D通信频谱分配与功率控制场景定义Q学习中的智能体、动作、状态、奖励函数等参数;步骤3、运行Q学习算法。本发明在保证蜂窝用户通信质量的前提下,能够有效提高蜂窝用户、D2D用户对共存系统的吞吐量。

Description

一种基于Q学习的D2D通信频谱分配与功率控制算法
技术领域
本发明属于无线通信技术领域,尤其涉及一种基于Q学习的D2D通信频谱分配与功率控制算法。
背景技术
由于通信终端的急速增长,无线频谱资源短缺问题日益严重,为缓解频谱资源短缺问题,D2D通信方式被提出并应用于蜂窝网络中,这种通信方式具有提高频谱利用率、降低通信时延、节约功率能耗等优势。在共享模式中,D2D用户对复用蜂窝用户的频谱资源块,能够有效提高蜂窝网络的频谱利用率,但两者之间的互相干扰无法避免。因此,如何在保证蜂窝用户通信质量的前提下有效缓解D2D链路与蜂窝链路之间的干扰成为D2D通信中的一个重要问题。
针对干扰控制问题,目前的解决方法主要包括功率控制、频谱分配和模式选择三种。功率控制是指为D2D用户对选择合理的发射功率;频谱分配是指为D2D用户对分配合适的频谱资源;模式选择是指在给定频谱分配和功率控制的前提下,为D2D通信选择合适的通信方式。针对蜂窝网络D2D通信的功率控制和频谱分配方法已经得到广泛研究,博弈论、图论等传统优化算法均能在干扰控制中获得较好的性能,但随着机器学习的广泛应用,需要探索和研究基于机器学习的D2D通信干扰控制方法,以进一步提升蜂窝网络D2D通信的性能。
发明内容
本发明目的在于提供一种基于Q学习的D2D通信频谱分配与功率控制算法,以解决在单小区上行链路共享场景中引入D2D通信导致的基站、蜂窝用户、D2D用户对三者之间的干扰以及系统吞吐量低的技术问题。
为解决上述技术问题,本发明的具体技术方案如下:
一种基于Q学习的D2D通信频谱分配与功率控制算法,包括以下步骤:
步骤1、为D2D用户对随机分配初始频谱资源块,利用基站和用户之间的距离信息计算基站、蜂窝用户、D2D用户对三者之间的信道增益,利用频谱分配信息计算共享同一频谱资源块的用户链路的信干噪比,根据香农公式计算用户吞吐量;
步骤2、根据D2D通信频谱分配与功率控制场景定义Q学习中的智能体、动作、状态、奖励函数的参数;
步骤3、根据Q学习算法更新Q值表,实现频谱分配和功率控制。
进一步地,步骤1中蜂窝链路的信干噪比为:
Figure BDA0003076088710000021
其中,Ci表示第i个蜂窝用户,i=1,2,…,M;Dj表示第j个D2D用户对,j=1,2,…,N;r表示网络中频谱资源块的编号,r=1,2,…,K;M表示蜂窝用户的数量;N表示D2D用户对的数量;K表示频谱资源块的数量;
Figure BDA0003076088710000022
表示共享第r个频谱资源块的所有D2D用户对的集合;
Figure BDA0003076088710000023
表示占用第r个频谱资源块的蜂窝用户Ci的发射功率,
Figure BDA0003076088710000024
表示占用第r个频谱资源块的D2D用户对Dj的发射功率;
Figure BDA0003076088710000025
表示占用第r个频谱资源块的蜂窝用户Ci与基站之间的信道增益,
Figure BDA0003076088710000026
表示占用第r个频谱资源块的D2D用户对Dj发送端与基站之间的信道增益,σ2表示噪声功率。
进一步地,所述步骤1中D2D链路的信干噪比为:
Figure BDA0003076088710000031
其中,
Figure BDA0003076088710000032
表示占用第r个频谱资源块的D2D用户对Dj发送端与接收端之间的信道增益,
Figure BDA0003076088710000033
表示占用第r个频谱资源块的蜂窝用户Ci和D2D用户对Dj接收端之间的信道增益,
Figure BDA0003076088710000034
表示共享第r个频谱资源块的不同D2D用户对Dj'发送端与Dj接收端之间的信道增益。
进一步地,所述步骤1中网络中蜂窝用户的吞吐量为:
Figure BDA0003076088710000035
其中,W表示网络的频谱带宽;
网络中D2D用户对的吞吐量为:
Figure BDA0003076088710000036
其中,
Figure BDA0003076088710000037
表示网络中所有D2D用户对的集合。因此,网络中所有用户的总吞吐量为:
Figure BDA0003076088710000038
进一步地,所述步骤2中智能体是蜂窝网络中的D2D用户对,网络中存在N个智能体;
所述动作用a表示,为为每个D2D用户对选择一个频谱资源块B∈{B1,B2,…,Bk}和发射功率p∈{p1,p2,…,pL},其中,B1,B2,…,Bk为可供选择的频谱资源块,p1,p2,…,pL为可供选择的发射功率,共有K·L个动作;
所述状态用s表示,是单状态,即学习过程中只有一个状态;
所述奖励函数用R表示,指所有频谱资源块上的条件吞吐量;
第r个频谱资源块上的条件吞吐量定义为:
Figure BDA0003076088710000041
其中,τ0表示蜂窝链路信干噪比的门限值;
上式表示当蜂窝链路的信干噪比高于门限值时,奖励函数为该频谱资源块上的总吞吐量,否则,奖励函数为-1,表示惩罚值;
所有频谱资源块上的条件吞吐量为:
Figure BDA0003076088710000042
进一步地,所述步骤3中,根据Q学习算法更新Q值表的步骤包括:
步骤3.1、对于N个D2D用户对Dj,j∈{1,2,…,N},初始化所有Q值表的值为0;
步骤3.2、选择第j个D2D用户对;
步骤3.3、基于当前Q值表,根据ε-greedy策略选择一个动作a;
步骤3.4、执行动作a,计算奖励函数R;
步骤3.5、根据公式
Figure BDA0003076088710000043
更新Q值表,其中,Q'(s,a)表示Q值表的更新值,Q(s,a)表示Q值表的当前值,α表示学习率,0≤α≤1,γ表示衰减因子,0≤γ≤1,
Figure BDA0003076088710000044
表示当前Q值表中的最大值;
步骤3.6、重复步骤3.3到步骤3.5直到Q值表收敛;
步骤3.7、重复步骤3.2到步骤3.6直到所有D2D用户对均被考虑;
步骤3.8、将j赋值为1,重复步骤3.2到步骤3.7直到所有D2D用户对的Q值表收敛到相同的最优Q值。
本发明的一种基于Q学习的D2D通信频谱分配与功率控制算法,具有以下优点:在保证蜂窝用户通信质量的前提下,能够有效提高蜂窝用户、D2D用户共存系统的吞吐量。
附图说明
图1为本发明的蜂窝网络D2D通信上行链路共享系统模型示意图;
图2为本发明的定义Q学习参数步骤流程示意图;
图3为本发明的根据Q学习算法更新Q值表步骤流程示意图;
图4为本发明的算法流程示意图。
具体实施方式
为了更好地了解本发明的目的、结构及功能,下面结合附图,对本发明一种基于Q学习的D2D通信频谱分配与功率控制算法做进一步详细的描述。
本发明实施例公开的一种基于Q学习的D2D通信频谱分配与功率控制算法,应用于单小区场景中。小区内有一个基站BS、M个蜂窝用户,记为C={C1,C2,…,CM}和N个D2D用户对,记为
Figure BDA0003076088710000051
系统中有K个频谱资源块,记为
Figure BDA0003076088710000052
D2D用户对复用蜂窝用户上行链路的频谱资源块,蜂窝用户和D2D用户对在小区范围内随机均匀分布。
因为D2D用户复用上行链路的频谱资源,此时系统中存在三种干扰,如图1所示:(1)蜂窝用户发射给基站的信号被D2D用户对接收端接收到,对D2D用户对产生干扰;(2)D2D用户对发送端发射给D2D用户对接收端的信号被基站接收到,对基站产生干扰;(3)D2D用户对发送端发射给D2D用户对接收端的信号被同小区内其他D2D用户对接收端接收到,对其他D2D用户对产生干扰。
本发明实施例的一种基于Q学习的D2D通信频谱分配与功率控制算法主要包含3个步骤:(1)计算用户信干噪比、吞吐量;(2)定义Q学习参数;(3)根据Q学习算法更新Q值表。
首先,为D2D用户对随机分配初始频谱资源块,利用基站和用户之间的距离信息计算基站、蜂窝用户、D2D用户对三者之间的信道增益,利用频谱分配信息计算共享同一频谱资源块的用户链路的信干噪比,根据香农公式计算用户吞吐量;
然后,根据D2D通信频谱分配与功率控制场景定义Q学习中的智能体、动作、状态、奖励函数等参数;
最后,根据Q学习算法更新Q值表,实现频谱分配和功率控制。
如图4所示,本发明实施例公开的一种基于Q学习的D2D通信频谱分配与功率控制算法的实施步骤如下:
步骤1、计算用户信干噪比、吞吐量:
基站与移动用户之间、不同移动用户之间的信道增益分别为:
Figure BDA0003076088710000061
其中,BS表示基站,u、v表示移动用户,PLBS,u表示基站与用户u之间的路径损耗,du,v表示不同用户u、v之间的距离,β表示增益系数。
蜂窝链路的信干噪比为:
Figure BDA0003076088710000062
其中,Ci表示第i个蜂窝用户(i=1,2,…,M),Dj表示第j个D2D用户对(j=1,2,…,N),r=1,2,…,K表示网络中频谱资源块的编号,M、N和K分别表示蜂窝用户、D2D用户对和频谱资源块的数量;
Figure BDA0003076088710000063
表示共享第r个频谱资源块的所有D2D用户对的集合;
Figure BDA0003076088710000071
表示占用第r个频谱资源块的蜂窝用户Ci的发射功率,
Figure BDA0003076088710000072
表示共享第r个频谱资源块的D2D用户对Dj的发射功率;
Figure BDA0003076088710000073
表示占用第r个频谱资源块的蜂窝用户Ci与基站之间的信道增益,
Figure BDA0003076088710000074
表示共享第r个频谱资源块的D2D用户对Dj发送端与基站之间的信道增益,σ2表示噪声功率。
D2D链路的信干噪比为:
Figure BDA0003076088710000075
其中,
Figure BDA0003076088710000076
表示共享第r个频谱资源块的D2D用户对Dj发送端与接收端之间的信道增益,
Figure BDA0003076088710000077
表示共享第r个频谱资源块的蜂窝用户Ci和D2D用户对Dj接收端之间的信道增益,
Figure BDA0003076088710000078
表示共享第r个频谱资源块的不同D2D用户对Dj'发送端与Dj接收端之间的信道增益。
根据香农公式,网络中蜂窝用户的吞吐量为:
Figure BDA0003076088710000079
其中,W表示网络的频谱带宽。网络中D2D用户对的吞吐量为:
Figure BDA00030760887100000710
其中,
Figure BDA00030760887100000711
表示网络中所有D2D用户对的集合。因此,网络中所有用户的总吞吐量为:
Figure BDA00030760887100000712
步骤2、定义Q学习参数:
根据D2D通信频谱分配与功率控制的场景定义Q学习中的智能体、动作、状态、奖励函数等参数如下:
1)智能体:蜂窝网络中的D2D用户对,一个D2D用户对即为一个智能体,网络中存在N个智能体。
2)动作a:为每个D2D用户对选择一个合适的频谱资源块B∈{B1,B2,…,Bk}和发射功率p∈{p1,p2,…,pL},其中,B1,B2,…,Bk为可供选择的频谱资源块,p1,p2,…,pL为可供选择的发射功率,共有K·L个动作。
3)状态s:单状态,即学习过程中只有一个状态。
4)奖励函数R:所有频谱资源块上的条件吞吐量。第r个频谱资源块上的条件吞吐量定义为:
Figure BDA0003076088710000081
其中,τ0表示蜂窝链路信干噪比的门限值。上式表示当蜂窝链路的信干噪比高于门限值时,奖励函数为该频谱资源块上的总吞吐量,否则,奖励函数为-1,表示惩罚值。因此,所有频谱资源块上的条件吞吐量为:
Figure BDA0003076088710000082
具体操作详见图2的流程示意图。
步骤3、根据Q学习算法更新Q值表:
步骤3.1、对于N个D2D用户对Dj,j∈{1,2,…,N},初始化所有Q值表的值为0;
步骤3.2、选择第j个D2D用户对;
步骤3.3、基于当前Q值表,根据ε-greedy策略选择一个动作a;
步骤3.4、执行动作a,计算奖励函数R;
步骤3.5、根据公式
Figure BDA0003076088710000091
更新Q值表,其中,Q'(s,a)表示Q值表的更新值,Q(s,a)表示Q值表的当前值,α表示学习率,0≤α≤1,γ表示衰减因子,0≤γ≤1,
Figure BDA0003076088710000092
表示当前Q值表中的最大值;
步骤3.6、重复步骤3.3到步骤3.5直到Q值表收敛;
步骤3.7、重复步骤3.2到步骤3.6直到所有D2D用户对均被考虑;
步骤3.8、将j赋值为1,重复步骤3.2到步骤3.7直到所有D2D用户对的Q值表收敛到相同的最优Q值。
具体操作详见图3的流程示意图。
可以理解,本发明是通过一些实施例进行描述的,本领域技术人员知悉的,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本申请的权利要求范围内的实施例都属于本发明所保护的范围内。

Claims (6)

1.一种基于Q学习的D2D通信频谱分配与功率控制算法,其特征在于,包括以下步骤:
步骤1、为D2D用户对随机分配初始频谱资源块,利用基站和用户之间的距离信息计算基站、蜂窝用户、D2D用户对三者之间的信道增益,利用频谱分配信息计算共享同一频谱资源块的用户链路的信干噪比,根据香农公式计算用户吞吐量;
步骤2、根据D2D通信频谱分配与功率控制场景定义Q学习中的智能体、动作、状态、奖励函数的参数;
步骤3、根据Q学习算法更新Q值表,实现频谱分配和功率控制。
2.根据权利要求1所述的基于Q学习的D2D通信频谱分配与功率控制算法,其特征在于,所述步骤1中蜂窝链路的信干噪比为:
Figure FDA0003076088700000011
其中,Ci表示第i个蜂窝用户,i=1,2,…,M;Dj表示第j个D2D用户对,j=1,2,…,N;r表示网络中频谱资源块的编号,r=1,2,…,K;M表示蜂窝用户的数量;N表示D2D用户对的数量;K表示频谱资源块的数量;
Figure FDA0003076088700000012
表示共享第r个频谱资源块的所有D2D用户对的集合;
Figure FDA0003076088700000013
表示占用第r个频谱资源块的蜂窝用户Ci的发射功率,
Figure FDA0003076088700000014
表示占用第r个频谱资源块的D2D用户对Dj的发射功率;
Figure FDA0003076088700000015
表示占用第r个频谱资源块的蜂窝用户Ci与基站之间的信道增益,
Figure FDA0003076088700000016
表示占用第r个频谱资源块的D2D用户对Dj发送端与基站之间的信道增益,σ2表示噪声功率。
3.根据权利要求1所述的基于Q学习的D2D通信频谱分配与功率控制算法,其特征在于,所述步骤1中D2D链路的信干噪比为:
Figure FDA0003076088700000021
其中,
Figure FDA0003076088700000022
表示占用第r个频谱资源块的D2D用户对Dj发送端与接收端之间的信道增益,
Figure FDA0003076088700000023
表示占用第r个频谱资源块的蜂窝用户Ci和D2D用户对Dj接收端之间的信道增益,
Figure FDA0003076088700000024
表示共享第r个频谱资源块的不同D2D用户对Dj'发送端与Dj接收端之间的信道增益。
4.根据权利要求1所述的基于Q学习的D2D通信频谱分配与功率控制算法,其特征在于,所述步骤1中网络中蜂窝用户的吞吐量为:
Figure FDA0003076088700000025
其中,W表示网络的频谱带宽;
网络中D2D用户对的吞吐量为:
Figure FDA0003076088700000026
其中,
Figure FDA0003076088700000027
表示网络中所有D2D用户对的集合。因此,网络中所有用户的总吞吐量为:
Figure FDA0003076088700000028
5.根据权利要求1所述的基于Q学习的D2D通信频谱分配与功率控制算法,其特征在于,所述步骤2中智能体是蜂窝网络中的D2D用户对,网络中存在N个智能体;
所述动作用a表示,为每个D2D用户对选择一个频谱资源块B∈{B1,B2,…,Bk}和发射功率p∈{p1,p2,…,pL},其中,B1,B2,…,Bk为可供选择的频谱资源块,p1,p2,…,pL为可供选择的发射功率,共有K·L个动作;
所述状态用s表示,是单状态,即学习过程中只有一个状态;
所述奖励函数用R表示,指所有频谱资源块上的条件吞吐量;
第r个频谱资源块上的条件吞吐量定义为:
Figure FDA0003076088700000031
其中,τ0表示蜂窝链路信干噪比的门限值;
上式表示当蜂窝链路的信干噪比高于门限值时,奖励函数为该频谱资源块上的总吞吐量,否则,奖励函数为-1,表示惩罚值;
所有频谱资源块上的条件吞吐量为:
Figure FDA0003076088700000032
6.根据权利要求1所述的基于Q学习的D2D通信频谱分配与功率控制算法,其特征在于,所述步骤3中,根据Q学习算法更新Q值表的步骤包括:
步骤3.1、对于N个D2D用户对Dj,j∈{1,2,…,N},初始化所有Q值表的值为0;
步骤3.2、选择第j个D2D用户对;
步骤3.3、基于当前Q值表,根据ε-greedy策略选择一个动作a;
步骤3.4、执行动作a,计算奖励函数R;
步骤3.5、根据公式
Figure FDA0003076088700000033
更新Q值表,其中,Q'(s,a)表示Q值表的更新值,Q(s,a)表示Q值表的当前值,α表示学习率,0≤α≤1,γ表示衰减因子,0≤γ≤1,
Figure FDA0003076088700000034
表示当前Q值表中的最大值;
步骤3.6、重复步骤3.3到步骤3.5直到Q值表收敛;
步骤3.7、重复步骤3.2到步骤3.6直到所有D2D用户对均被考虑;
步骤3.8、将j赋值为1,重复步骤3.2到步骤3.7直到所有D2D用户对的Q值表收敛到相同的Q值。
CN202110553177.4A 2021-05-20 2021-05-20 一种基于q学习的d2d通信频谱分配与功率控制算法 Pending CN113301638A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110553177.4A CN113301638A (zh) 2021-05-20 2021-05-20 一种基于q学习的d2d通信频谱分配与功率控制算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110553177.4A CN113301638A (zh) 2021-05-20 2021-05-20 一种基于q学习的d2d通信频谱分配与功率控制算法

Publications (1)

Publication Number Publication Date
CN113301638A true CN113301638A (zh) 2021-08-24

Family

ID=77323254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110553177.4A Pending CN113301638A (zh) 2021-05-20 2021-05-20 一种基于q学习的d2d通信频谱分配与功率控制算法

Country Status (1)

Country Link
CN (1) CN113301638A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113891481A (zh) * 2021-09-28 2022-01-04 东南大学 一种面向吞吐量的蜂窝网络d2d通信动态资源分配方法
CN114466386A (zh) * 2022-01-13 2022-05-10 重庆邮电大学 一种d2d通信的直接接入方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107484244A (zh) * 2017-08-01 2017-12-15 东南大学 一种QoS感知的蜂窝网络D2D通信频谱资源分配算法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107484244A (zh) * 2017-08-01 2017-12-15 东南大学 一种QoS感知的蜂窝网络D2D通信频谱资源分配算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈文泰: "《基于机器学习的蜂窝网络D2D通信频谱分配与功率控制算法研究》", 《中国优秀博硕士学位论文》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113891481A (zh) * 2021-09-28 2022-01-04 东南大学 一种面向吞吐量的蜂窝网络d2d通信动态资源分配方法
CN114466386A (zh) * 2022-01-13 2022-05-10 重庆邮电大学 一种d2d通信的直接接入方法
CN114466386B (zh) * 2022-01-13 2023-09-29 深圳市晨讯达科技有限公司 一种d2d通信的直接接入方法

Similar Documents

Publication Publication Date Title
CN111884696B (zh) 一种基于多载波的中继协作移动边缘计算方法
CN104105158B (zh) 一种基于d2d中继通信的中继选择方法
CN103476140B (zh) 蜂窝系统中d2d和固定中继两种协作多播模式的选择方法
CN109905918A (zh) 一种基于能效的noma蜂窝车联网动态资源调度方法
CN105744628B (zh) 一种数能一体化通信网络的资源分配最优化方法
CN108600999B (zh) Fd-d2d基于信道分配与功率控制联合优化方法
CN110493804B (zh) 一种毫米波系统的波束和功率分配方法
CN111586646B (zh) 一种蜂窝网络中联合上下信道的d2d通信的资源分配方法
CN113079577B (zh) 基于embb和urllc共存场景下的资源分配方法
CN113301638A (zh) 一种基于q学习的d2d通信频谱分配与功率控制算法
CN108718446A (zh) Lte-a网络中d2d模式选择与资源分配方法
CN104918257A (zh) 中继协同异构蜂窝网络d2d通信资源分配方法
Muckenheim et al. A framework for load control in 3/sup rd/generation CDMA networks
CN113891481B (zh) 一种面向吞吐量的蜂窝网络d2d通信动态资源分配方法
CN113301637A (zh) 一种基于q学习和神经网络的d2d通信功率控制算法
CN110753329A (zh) 蜂窝网络中d2d中继通信的功率控制与中继选择方法
CN111314938B (zh) 一种用于单个蜂窝小区的蜂窝网络时频域资源分配的优化方法
CN113301639A (zh) 一种基于q学习的蜂窝网络d2d通信功率控制算法
CN105072686B (zh) 一种基于ofdma中继网络的无线资源分配方法
CN106912059A (zh) 支持互信息积累的认知中继网络联合中继选择及资源分配方法
CN103281695B (zh) 一种多跳中继网络频谱规划方法
CN106301501B (zh) 一种联合编码调制的即时数据传输优化方法
CN106102146B (zh) 一种多蜂窝下的d2d通信的能耗优化方法
CN115915454A (zh) Swipt辅助的下行资源分配方法及装置
Sarker Stable and unstable operating regions of slotted ALOHA with number of retransmission attempts and number of power levels

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210824

RJ01 Rejection of invention patent application after publication