CN110753329A - 蜂窝网络中d2d中继通信的功率控制与中继选择方法 - Google Patents
蜂窝网络中d2d中继通信的功率控制与中继选择方法 Download PDFInfo
- Publication number
- CN110753329A CN110753329A CN201911034781.5A CN201911034781A CN110753329A CN 110753329 A CN110753329 A CN 110753329A CN 201911034781 A CN201911034781 A CN 201911034781A CN 110753329 A CN110753329 A CN 110753329A
- Authority
- CN
- China
- Prior art keywords
- relay
- user
- energy efficiency
- cellular
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/70—Services for machine-to-machine communication [M2M] or machine type communication [MTC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W40/00—Communication routing or communication path finding
- H04W40/02—Communication route or path selection, e.g. power-based or shortest path routing
- H04W40/22—Communication route or path selection, e.g. power-based or shortest path routing using selective relaying for reaching a BTS [Base Transceiver Station] or an access point
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/04—TPC
- H04W52/06—TPC algorithms
- H04W52/14—Separate analysis of uplink or downlink
- H04W52/146—Uplink power control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/04—TPC
- H04W52/18—TPC being performed according to specific parameters
- H04W52/24—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
- H04W52/241—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account channel quality metrics, e.g. SIR, SNR, CIR, Eb/lo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/04—TPC
- H04W52/18—TPC being performed according to specific parameters
- H04W52/24—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
- H04W52/243—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account interferences
Abstract
本发明公开了一种蜂窝网络中D2D中继通信的功率控制与中继选择方法,先建立系统模型,在保证D2D用户和蜂窝用户最小传输速率的情况下,将功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为对D2D发射端、中继和蜂窝用户的功率控制以及D2D用户的中继选择两个子问题进行求解;随后分别求出给定某个中继下,D2D发射端、中继和蜂窝用户的最优传输功率;最后采用Q学习解决中继选择问题,在保证第一跳以及第二跳D2D链路的能效条件下,为D2D用户分配合适的中继以最大化系统总能效。解决D2D中继通信的功率控制和中继选择问题,实现了系统总能效的最大化。
Description
技术领域
本发明属于无线通信技术领域,特别是涉及一种蜂窝网络中D2D中继通信的功率控制与中继选择方法。
背景技术
作为5G的关键技术之一D2D(Device-to-Device)通信技术是指通信网络中邻近设备不通过基站直接交换信息的技术。当D2D用户之间距离较远或者链路质量差时,引入中继不仅可以提高用户的信道增益,还能提升网络频谱效率,扩大小区覆盖范围,保证信息的有效传输。但是,随着用户设备的大量增长以及终端设备有限的电池容量限制,怎样有效提高能量效率,实现绿色通信,是未来无线通信发展的关键。
在D2D中继通信中,仅仅考虑功率的控制而忽略中继的选择对于能效的提高是微乎其微的。并且,选择合适的中继也有利于增加系统的吞吐量。一般地,中继可采用的模式有放大转发(Amplify and Forward)和解码转发(Decode and Forward),放大转发模式的优点是复杂度低于解码转发方式,解码转发模式的优点是可以保证通信链路的质量。通常,D2D通信可选用的中继有多个,基于提高系统能效的目的,如何选择合适的中继最大化能效是值得考虑的。随着中继数目的增加,计算复杂度也是成倍地增加,如何限制备选中继的数量以及选用合适的算法也是需要考虑的。
在D2D通信中引入中继的同时,也给系统内原有蜂窝用户的通信质量造成了干扰,降低了用户的服务质量,增大了功率的消耗,如何为D2D中继通信设定最优的传输功率,选择最合适的中继是实现绿色通信的关键。
发明内容
为实现上述目的,本发明提供一种蜂窝网络中D2D中继通信的功率控制与中继选择方法,在多个备选中继的情况下,解决D2D中继通信的功率控制与中继选择问题,实现了系统能效的最大化。
本发明所采用的技术方案是,蜂窝网络中D2D中继通信的功率控制与中继选择方法,按照以下步骤进行:
步骤S1,建立系统模型,系统内N个D2D用户对与K个蜂窝用户共存,D2D用户对用集合I={1,2,...,N}表示,D2D发射端、D2D接收端以及蜂窝用户分别用集合S={1,2,...,N},D={1,2,...,N}和C={1,2,...,K}表示;假设系统中存在M个理想用户作为中继,用集合表示为R={1,2,...,M};
若一个D2D用户对m=(s,d)通过某一中继r进行通信,其中m∈I,s∈S,d∈D,r∈R,D2D通信第一跳链路中继以及基站的信干噪比为和第二跳链路中D2D接收端及基站的信干噪比为和D2D发射端到D2D接收端的能效为EE(Ps,Pr,Pc,),Ps、Pr、Pc分别表示D2D发射端、中继、蜂窝用户的传输功率;
步骤S2,在保证蜂窝网络中D2D用户和蜂窝用户的最小传输速率条件下,首先将D2D中继通信的功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为D2D发射端、中继以及蜂窝用户的功率控制与D2D中继选择两个子问题逐步进行求解;
步骤S2.1:定义矩阵X为中继选择矩阵,第m行、第r列的元素表示为中继因子xmr,当某一D2D用户对m通过某一中继r进行通信时xmr=1,否则xmr=0; 以及分别表示D2D发射端、中继以及蜂窝用户的功率分配矩阵,其中分别表示D2D发射端1,2,...,N的传输功率,分别表示中继1,2,...,M的传输功率,分别表示蜂窝用户1,2,...,K的传输功率;
步骤S2.2:引入中继复用因子xmr之后,将D2D中继通信的功率控制与中继选择问题转化为如下混合整数非线性规划问题:
U(r1)(Ps,Pc)≥Umin; (8e)
U(r2)(Pr,Pc)≥Umin; (8f)
其中,Pmax为传输功率的阈值,Umin和Rmin为D2D链路和蜂窝链路最小传输速率,W表示信道的带宽,U、T表示函数符号;
步骤S3,分别求出D2D发射端、中继和蜂窝用户的最优传输功率;
步骤S4,最后提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效。
其中,Gsr、Gsb、Gcr和Gcb分别表示D2D发射端到中继、D2D发射端到基站、蜂窝用户到中继以及蜂窝用户到基站的信道增益,N0表示加性高斯白噪声;
以及
其中,Pr表示中继的传输功率,Grd、Grb、Gcd和Gcb分别表示中继到D2D接收端、中继到基站、蜂窝用户到D2D接收端和蜂窝用户到基站的信道增益。
进一步的,步骤S1中所述D2D发射端到D2D接收端的能效具体求解过程如下:
D2D用户通信第一跳链路的能效表达式为:
D2D用户通信第二跳链路的能效表达式为:
D2D发射端到D2D接收端的能效可表示为D2D发射端到D2D接收端的传输速率比上总功率消耗,基于式(5)、式(6),具体为:
其中,Pcir表示电路功率损耗,η表示功率放大系数。
进一步的,步骤S3中所述D2D发射端、中继和蜂窝用户的最优传输功率具体求解步骤如下:
步骤3.1:假设给定一个中继,则xmr=1;通过所述公式(8)可以将功率分配问题表示为:
可以明显看出公式(9)的分子不是一个确定的表达式,为了保证D2D用户对在第一跳链路和第二跳链路的传输速率,将公式(9)分成问题I和问题II,其中问题I为最大化D2D用户在第一跳链路的能效问题II为最大化D2D用户在第二跳链路的能效问题I和问题II分别表示为:
步骤S3.3:利用Dinkelbach方法和拉格朗日对偶分解求解问题I;首先,将问题I转化成等价的减式形式,可得:
其中,用q1表示为D2D反射端到中继的能效,则为D2D发射端到中继的最大能效;假设第n次迭代中得到D2D发射端的传输功率Ps(n),第n-1次迭代中得到D2D反射端到中继的能效q1(n-1),则优化问题公式(13)的增广拉格朗日式为:
其中,δr1(n)和θr1(n)是第一跳链路约束条件的拉格朗日算子;由对偶分解可得式(14)可分解为如下最大化最小问题,即:
θr1(n,τ+1)={θr1(n,τ)-α[U(r1)(n,τ)-Umin]}+; (18)
同理可得:
θr2(n,τ+1)={θr2(n,τ)-α[U(r2)(n,τ)-Umin]}+; (21)
其中,δr2(n),θr2(n)表示第二跳链路约束条件的拉格朗日算子,q2表示中继到D2D接收端的能效,τ表示内部迭代的次数、α表示迭代的步长,e表示自然对数;通过多次迭代之后,求出合适的D2D发射端、中继的传输功率。
进一步的,步骤S4中所述提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效,具体过程如下:
步骤S4.1:首先定义Q学习中的几个要素:
智能体:智能体为D2D用户对;
动作:动作集合表示为:
A=(a1,a2,...,aM); (22)
其中,a1,a2,...,aM分别表示中继1,2,...,M的动作;
设定以D2D发射端到D2D接收端的距离为半径,分别以D2D发射端和D2D接收端为圆心做出两个相交的圆,而辅助通信的中继只能从相交区域中选出;
状态:智能体在t时刻所处的状态用St表示,智能体的状态取决于D2D用户在第一跳链路和第二跳链路的能效,具体地:
其中,EEth代表D2D链路的最低能效要求,EE(r1)、EE(r2)分别表示第一跳链路和第二跳链路的能效,s1,s2,s3,s4表示智能体可能处于的四个状态;
回报函数:回报函数Reward表示执行动作后的报酬,当回报函数为正值时表示所选动作有益,当回报函数为负值时表示所选的动作对于最终结果有负面影响,具体表达式为:
其中,C是折扣因子,EE表示D2D发射端到D2D接收端的能效;
步骤S4.2:初始化状态,然后从多个备选中继中随机选择一个中继进行通信,通过式(5)、式(6)计算出EE(r1)(Ps,Pc)和EE(r2)(Pr,Pc);
步骤S4.3:根据Q学习算法,依次遍历所有的备选中继,利用Q学习更新D2D用户对的Q表,在经过多次迭代后Q表收敛,根据Q表选择最佳中继。
本发明的有益效果:将蜂窝网络中D2D功率控制与中继选择过程分为两个阶段,第一阶段为D2D发射端、中继和蜂窝用户的功率控制阶段,分别获取给定某个中继下D2D发射端、中继和蜂窝用户的最优发射功率,第二阶段为中继选择阶段,在分别获取给定某个中继下D2D发射端、中继和蜂窝用户的最优传输功率,计算出能效,提出一种基于Q学习的中继选择方法,以系统能效最大化为准则,为D2D用户对选择合适的中继,提升系统的能效。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的蜂窝网络中D2D中继通信的功率控制与中继选择的系统模型图。
图2是本发明实施例中功率控制及中继选择方法执行的流程图。
图3是本发明实施例中系统总能效随网络内D2D用户数变化的曲线示意图。
图4是本发明实施例中系统总能效随网络内中继数变化的曲线示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例首先建立系统模型,在保证蜂窝网络中D2D用户与蜂窝用户的最小传输速率的条件下,将D2D中继通信的功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为D2D发射端、中继和蜂窝用户的功率控制以及D2D用户的中继选择两个子问题进行求解,随后分别求出D2D发射端、中继以及蜂窝用户的最优传输功率,最后采用基于Q学习的中继选择方法,以实现系统总能效的最大化。具体地,按照以下步骤进行:
步骤S1,首先建立系统模型。系统模型如图1所示,该系统有一个基站(BS),系统内N个D2D用户对与K个蜂窝用户共存,D2D用户对包括一个D2D发射端以及与之对应的一个D2D接收端,并且用集合I={1,2,...,N}表示D2D用户对。D2D发射端、D2D接收端以及蜂窝用户分别用集合S={1,2,...,N},D={1,2,...,N}和C={1,2,...,K}表示。假设系统中存在M个理想用户作为中继,用集合表示为R={1,2,...,M}。D2D发射端与D2D接收端之间由于链路质量较差,不能直连通路,只能通过多个备选中继中的某一个通信,而中继均采用放大转发协议。
若一个D2D用户对m=(s,d)(m∈I,s∈S,d∈D)通过某一中继r(r∈R)进行通信,在D2D通信第一跳链路中,D2D发射端对所复用频谱资源的蜂窝用户传输链路产生干扰,同时中继也会受到蜂窝用户的干扰,设第一跳链路中继以及基站的信干噪比为和
以及
其中,Ps、Pc分别表示D2D发射端和蜂窝用户的传输功率,Gsr、Gsb、Gcr和Gcb分别表示D2D发射端到中继、D2D发射端到基站、蜂窝用户到中继以及蜂窝用户到基站的信道增益,N0表示加性高斯白噪声。
以及
其中,Pr表示中继的传输功率,Grd、Grb、Gcd和Gcb分别表示中继到D2D接收端、中继到基站、蜂窝用户到D2D接收端和蜂窝用户到基站的信道增益。
D2D用户通信第一跳链路的能效表达式为:
D2D用户通信第二跳链路的能效表达式为:
其中,Pcir表示电路功率损耗,η表示功率放大系数,W表示信道的带宽,U、T表示函数符号,无实际含义。
D2D发射端到D2D接收端的能效可表示为D2D发射端到D2D接收端的传输速率比上总功率消耗,基于式(5)、式(6),具体为:
步骤S2,在保证蜂窝网络中D2D用户和蜂窝用户的最小传输速率条件下,首先将D2D中继通信的功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为D2D发射端、中继以及蜂窝用户的功率控制与D2D中继选择两个子问题逐步进行求解。
步骤S2.1:定义矩阵X为中继选择矩阵,第m行、第r列的元素表示为中继因子xmr,当D2D用户对m通过中继r进行通信时xmr=1,否则xmr=0; 以及分别表示D2D发射端、中继以及蜂窝用户的功率分配矩阵。
步骤S2.2:引入中继复用因子xmr之后,将D2D中继通信的功率控制与中继选择问题转化为如下混合整数非线性规划问题:
U(r1)(Ps,Pc)≥Umin; (8e)
U(r2)(Pr,Pc)≥Umin; (8f)
其中,Pmax为传输功率的阈值,Umin和Rmin为D2D链路和蜂窝链路最小传输速率。约束条件(8a)和(8b)保证一个中继最多只能辅助一个D2D用户对;约束条件(8c)和(8d)是对于D2D发射端和中继的传输功率限制;约束条件(8e)和(8f)保证D2D第一跳链路以及第二跳链路的最小传输速率需求;约束条件(8g)保证了蜂窝用户的最小传输速率要求。
步骤S3,分别求出D2D发射端、中继和蜂窝用户的最优传输功率。
步骤3.1:假设给定一个中继,则xmr=1。通过所述公式(8)可以将功率分配问题表示为:
步骤S3.2:求出蜂窝用户的最优传输功率,公式(9)是蜂窝功率的减函数,想要最大化公式(9),那么蜂窝功率必须取最小值,由(8g)可得:
在得到蜂窝用户的功率之后,还需求解D2D发射端、中继的最优传输功率。并且,可以明显看出公式(9)的分子不是一个确定的表达式,为了保证D2D用户对在第一跳链路和第二跳链路的传输速率,将公式(9)分成问题I和问题II。其中,问题I为最大化D2D用户在第一跳链路的能效;问题II为最大化D2D用户在第二跳链路的能效,问题I和问题II分别表示为:
步骤S3.3:问题I和问题II表达式类似,可用相同的方法求解。具体地,利用Dinkelbach方法和拉格朗日对偶分解求解问题I。首先,将问题I转化成等价的减式形式,可得:
其中,用q1表示为D2D反射端到中继的能效,则为D2D发射端到中继的最大能效。假设第n次迭代中得到D2D发射端的传输功率Ps(n),第n-1次迭代中得到D2D反射端到中继的能效q1(n-1),则优化问题公式(13)的增广拉格朗日式为:
其中,δr1(n)和θr1(n)是第一跳链路约束条件的拉格朗日算子。由对偶分解可得式(14)可分解为如下最大化最小问题,即:
θr1(n,τ+1)={θr1(n,τ)-α[U(r1)(n,τ)-Umin]}+; (18)
同理可得:
θr2(n,τ+1)={θr2(n,τ)-α[U(r2)(n,τ)-Umin]}+; (21)
其中,δr2(n),θr2(n)表示第二跳链路约束条件的拉格朗日算子。q2表示中继到D2D接收端的能效。τ表示内部迭代的次数、α表示迭代的步长,e表示自然对数。
由此,通过多次迭代之后,求出合适的D2D发射端、中继的传输功率。
步骤S4,最后提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效。
步骤S4.1:首先定义Q学习中的几个要素:
智能体:对于动作决策的执行以及Q表的更新,本实施例中智能体为D2D用户对。
动作:智能体所执行动作即为选择中继,所以动作数和中继数相等。动作集合表示为:
A=(a1,a2,...,aM); (22)
其中,a1,a2,...,aM分别表示中继1,2,...,M的动作;
为了降低计算的复杂度,我们设定以D2D发射端到D2D接收端的距离为半径,分别以D2D发射端和D2D接收端为圆心做出两个相交的圆,而辅助通信的中继只能从相交区域中选出。
状态:智能体在t时刻所处的状态用St表示。智能体的状态取决于D2D用户在第一跳链路和第二跳链路的能效,具体地:
其中,EEth代表D2D链路的最低能效要求,EE(r1)、EE(r2)分别表示第一跳链路和第二跳链路的能效,s1,s2,s3,s4表示智能体可能处于的四个状态。
回报函数:回报函数Reward表示执行动作后的报酬,当回报函数为正值时表示所选动作有益;当回报函数为负值时表示所选的动作对于最终结果有负面影响。具体表达式为:
其中,C是折扣因子,EE表示D2D发射端到D2D接收端的能效。
步骤S4.2:初始化状态,然后从多个备选中继中随机选择一个中继进行通信,通过式(5)、式(6)计算出EE(r1)(Ps,Pc)和EE(r2)(Pr,Pc);
步骤S4.3:根据Q学习算法,依次遍历所有的备选中继,利用Q学习更新D2D用户对的Q表。在经过多次迭代后,Q表收敛。根据Q表,选择最佳中继。如图2所示,经过Q学习过程之后,D2D用户对通过Q表进行中继选择。
图3所示是系统总能效随网络内D2D用户数变化的曲线示意图,从图中可以看出,系统总能效随网络内D2D用户数的增加而呈现递增的趋势。仿真结果表明本发明实施例的总能效网络优于“能效-中继选择算法”,“匹配-功率控制算法”和“能效-功率控制算法”。
图4所示是系统总能效随网络内中继数变化的曲线示意图,从图中可以看出,随着中继数的增加,采用本发明实施例的系统总能效呈现递增的趋势。这是因为当中继数增加之后,本发明实施例所述方法可以选择更优的中继进行辅助通信,并且该方法的优化性能优于“能效-中继选择算法”,“匹配-功率控制算法”和“能效-功率控制算法”。而“能效-功率控制算法”的总能效曲线是平缓的,原因是其方法中不包含中继选择,所以当中继数增加对于系统总能效影响不大。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (5)
1.蜂窝网络中D2D中继通信的功率控制与中继选择方法,其特征在于,按照如下步骤进行:
步骤S1,建立系统模型,系统内N个D2D用户对与K个蜂窝用户共存,D2D用户对用集合I={1,2,...,N}表示,D2D发射端、D2D接收端以及蜂窝用户分别用集合S={1,2,...,N},D={1,2,...,N}和C={1,2,...,K}表示;假设系统中存在M个理想用户作为中继,用集合表示为R={1,2,...,M};
若一个D2D用户对m=(s,d)通过某一中继r进行通信,其中m∈I,s∈S,d∈D,r∈R,D2D通信第一跳链路中继以及基站的信干噪比为和第二跳链路中D2D接收端及基站的信干噪比为和D2D发射端到D2D接收端的能效为EE(Ps,Pr,Pc,),Ps、Pr、Pc分别表示D2D发射端、中继、蜂窝用户的传输功率;
步骤S2,在保证蜂窝网络中D2D用户和蜂窝用户的最小传输速率条件下,首先将D2D中继通信的功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为D2D发射端、中继以及蜂窝用户的功率控制与D2D中继选择两个子问题逐步进行求解;
步骤S2.1:定义矩阵X为中继选择矩阵,第m行、第r列的元素表示为中继因子xmr,当某一D2D用户对m通过某一中继r进行通信时xmr=1,否则xmr=0;Es={Ps 1,Ps 2,...,Ps N},以及分别表示D2D发射端、中继以及蜂窝用户的功率分配矩阵,其中Ps 1,Ps 2,...,Ps N分别表示D2D发射端1,2,...,N的传输功率,分别表示中继1,2,...,M的传输功率,分别表示蜂窝用户1,2,...,K的传输功率;
步骤S2.2:引入中继复用因子xmr之后,将D2D中继通信的功率控制与中继选择问题转化为如下混合整数非线性规划问题:
U(r1)(Ps,Pc)≥Umin; (8e)
U(r2)(Pr,Pc)≥Umin; (8f)
其中,Pmax为传输功率的阈值,Umin和Rmin为D2D链路和蜂窝链路最小传输速率,W表示信道的带宽,U、T表示函数符号;
步骤S3,分别求出D2D发射端、中继和蜂窝用户的最优传输功率;
步骤S4,最后提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效。
4.根据权利要求1所述蜂窝网络中D2D中继通信的功率控制与中继选择方法,其特征在于,步骤S3中所述D2D发射端、中继和蜂窝用户的最优传输功率具体求解步骤如下:
步骤3.1:假设给定一个中继,则xmr=1;通过所述公式(8)可以将功率分配问题表示为:
可以明显看出公式(9)的分子不是一个确定的表达式,为了保证D2D用户对在第一跳链路和第二跳链路的传输速率,将公式(9)分成问题I和问题II,其中问题I为最大化D2D用户在第一跳链路的能效问题II为最大化D2D用户在第二跳链路的能效问题I和问题II分别表示为:
问题II:
步骤S3.3:利用Dinkelbach方法和拉格朗日对偶分解求解问题I;首先,将问题I转化成等价的减式形式,可得:
其中,用q1表示为D2D反射端到中继的能效,则为D2D发射端到中继的最大能效;假设第n次迭代中得到D2D发射端的传输功率Ps(n),第n-1次迭代中得到D2D反射端到中继的能效q1(n-1),则优化问题公式(13)的增广拉格朗日式为:
其中,δr1(n)和θr1(n)是第一跳链路约束条件的拉格朗日算子;由对偶分解可得式(14)可分解为如下最大化最小问题,即:
步骤S3.4:使用Karush-Kuhn-Tucker条件,可得第n次迭代时得到的最优D2D发射端的传输功率
θr1(n,τ+1)={θr1(n,τ)-α[U(r1)(n,τ)-Umin]}+; (18)
同理可得:
θr2(n,τ+1)={θr2(n,τ)-α[U(r2)(n,τ)-Umin]}+; (21)
其中,δr2(n),θr2(n)表示第二跳链路约束条件的拉格朗日算子,q2表示中继到D2D接收端的能效,τ表示内部迭代的次数,α表示迭代的步长,e表示自然对数;通过多次迭代之后,求出合适的D2D发射端、中继的传输功率。
5.根据权利要求1所述蜂窝网络中D2D中继通信的功率控制与中继选择方法,其特征在于,步骤S4中所述提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效,具体过程如下:
步骤S4.1:首先定义Q学习中的几个要素:
智能体:智能体为D2D用户对;
动作:动作集合表示为:
A=(a1,a2,...,aM); (22)
其中,a1,a2,...,aM分别表示中继1,2,...,M的动作;
设定以D2D发射端到D2D接收端的距离为半径,分别以D2D发射端和D2D接收端为圆心做出两个相交的圆,而辅助通信的中继只能从相交区域中选出;
状态:智能体在t时刻所处的状态用St表示,智能体的状态取决于D2D用户在第一跳链路和第二跳链路的能效,具体地:
其中,EEth代表D2D链路的最低能效要求,EE(r1)、EE(r2)分别表示第一跳链路和第二跳链路的能效,s1,s2,s3,s4表示智能体可能处于的四个状态;
回报函数:回报函数Reward表示执行动作后的报酬,当回报函数为正值时表示所选动作有益,当回报函数为负值时表示所选的动作对于最终结果有负面影响,具体表达式为:
其中,C是折扣因子,EE表示D2D发射端到D2D接收端的能效;
步骤S4.2:初始化状态,然后从多个备选中继中随机选择一个中继进行通信,通过式(5)、式(6)计算出EE(r1)(Ps,Pc)和EE(r2)(Pr,Pc);
步骤S4.3:根据Q学习算法,依次遍历所有的备选中继,利用Q学习更新D2D用户对的Q表,在经过多次迭代后Q表收敛,根据Q表选择最佳中继。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911034781.5A CN110753329B (zh) | 2019-10-29 | 2019-10-29 | 蜂窝网络中d2d中继通信的功率控制与中继选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911034781.5A CN110753329B (zh) | 2019-10-29 | 2019-10-29 | 蜂窝网络中d2d中继通信的功率控制与中继选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110753329A true CN110753329A (zh) | 2020-02-04 |
CN110753329B CN110753329B (zh) | 2020-12-18 |
Family
ID=69280647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911034781.5A Active CN110753329B (zh) | 2019-10-29 | 2019-10-29 | 蜂窝网络中d2d中继通信的功率控制与中继选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110753329B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111885671A (zh) * | 2020-07-17 | 2020-11-03 | 燕山大学 | 一种基于深度强化学习的水下联合中继选择和功率分配方法 |
CN112637927A (zh) * | 2020-12-16 | 2021-04-09 | 温州大学 | 基于能量效率的多用户多模式d2d通信资源分配方法 |
CN116669137A (zh) * | 2023-05-30 | 2023-08-29 | 山东大学 | 一种自适应单跳和两跳的d2d数据传输方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102883451A (zh) * | 2012-10-12 | 2013-01-16 | 南京邮电大学 | 终端直通技术共享系统上行资源的跨层设计方法 |
CN103607750A (zh) * | 2013-11-25 | 2014-02-26 | 南京邮电大学 | 下一代蜂窝系统中基于终端直通通信的中继选择方法 |
CN104284407A (zh) * | 2014-10-28 | 2015-01-14 | 中国矿业大学 | 嵌入d2d的蜂窝网络中基于全双工中继的功率控制方法 |
WO2016022065A1 (en) * | 2014-08-08 | 2016-02-11 | Telefonaktiebolaget L M Ericsson (Publ) | D2d power control |
US20160227518A1 (en) * | 2013-09-27 | 2016-08-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Device to device (d2d) control information relay |
CN106304112A (zh) * | 2016-08-14 | 2017-01-04 | 辛建芳 | 一种基于中继协作的蜂窝网络能量效率优化方法 |
CN106535284A (zh) * | 2016-12-12 | 2017-03-22 | 西安电子科技大学 | 一种基于全双工中继的d2d通信中的功率控制方法 |
CN108112084A (zh) * | 2018-01-04 | 2018-06-01 | 重庆邮电大学 | 一种蜂窝d2d通信系统中联合模式选择和资源分配方法 |
US20180206176A1 (en) * | 2015-08-12 | 2018-07-19 | Intel Corporation | Methods to enable high data rate relay operation using d2d air-interface |
CN108495332A (zh) * | 2018-03-28 | 2018-09-04 | 山东大学 | 一种基于蜂窝d2d通信系统的联合资源公平分配方法 |
CN108834109A (zh) * | 2018-05-03 | 2018-11-16 | 中国人民解放军陆军工程大学 | 全双工主动窃听下基于q学习的d2d协同中继功率控制方法 |
-
2019
- 2019-10-29 CN CN201911034781.5A patent/CN110753329B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102883451A (zh) * | 2012-10-12 | 2013-01-16 | 南京邮电大学 | 终端直通技术共享系统上行资源的跨层设计方法 |
US20160227518A1 (en) * | 2013-09-27 | 2016-08-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Device to device (d2d) control information relay |
CN103607750A (zh) * | 2013-11-25 | 2014-02-26 | 南京邮电大学 | 下一代蜂窝系统中基于终端直通通信的中继选择方法 |
WO2016022065A1 (en) * | 2014-08-08 | 2016-02-11 | Telefonaktiebolaget L M Ericsson (Publ) | D2d power control |
CN104284407A (zh) * | 2014-10-28 | 2015-01-14 | 中国矿业大学 | 嵌入d2d的蜂窝网络中基于全双工中继的功率控制方法 |
US20180206176A1 (en) * | 2015-08-12 | 2018-07-19 | Intel Corporation | Methods to enable high data rate relay operation using d2d air-interface |
CN106304112A (zh) * | 2016-08-14 | 2017-01-04 | 辛建芳 | 一种基于中继协作的蜂窝网络能量效率优化方法 |
CN106535284A (zh) * | 2016-12-12 | 2017-03-22 | 西安电子科技大学 | 一种基于全双工中继的d2d通信中的功率控制方法 |
CN108112084A (zh) * | 2018-01-04 | 2018-06-01 | 重庆邮电大学 | 一种蜂窝d2d通信系统中联合模式选择和资源分配方法 |
CN108495332A (zh) * | 2018-03-28 | 2018-09-04 | 山东大学 | 一种基于蜂窝d2d通信系统的联合资源公平分配方法 |
CN108834109A (zh) * | 2018-05-03 | 2018-11-16 | 中国人民解放军陆军工程大学 | 全双工主动窃听下基于q学习的d2d协同中继功率控制方法 |
Non-Patent Citations (2)
Title |
---|
YUNG-FA HUANG: "RESOURCE ALLOCATION FOR D2D COMMUNICATIONS WITH A NOVEL DISTRIBUTED Q-LEARNING ALGORITHM IN HETEROGENEOUS NETWORKS", 《2018 INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND CYBERNETICS》 * |
王倩: "D2D通信中基于Q学习的联合资源分配与功率控制算法", 《南京大学学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111885671A (zh) * | 2020-07-17 | 2020-11-03 | 燕山大学 | 一种基于深度强化学习的水下联合中继选择和功率分配方法 |
CN111885671B (zh) * | 2020-07-17 | 2022-04-15 | 燕山大学 | 一种基于深度强化学习的水下联合中继选择和功率分配方法 |
CN112637927A (zh) * | 2020-12-16 | 2021-04-09 | 温州大学 | 基于能量效率的多用户多模式d2d通信资源分配方法 |
CN116669137A (zh) * | 2023-05-30 | 2023-08-29 | 山东大学 | 一种自适应单跳和两跳的d2d数据传输方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110753329B (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109474980B (zh) | 一种基于深度增强学习的无线网络资源分配方法 | |
CN109729528B (zh) | 一种基于多智能体深度强化学习的d2d资源分配方法 | |
CN110753329B (zh) | 蜂窝网络中d2d中继通信的功率控制与中继选择方法 | |
CN105451322B (zh) | D2D网络中一种基于QoS的信道分配和功率控制方法 | |
CN103298084B (zh) | 一种基于能效准则的协作多中继选择与功率分配方法 | |
CN110493804B (zh) | 一种毫米波系统的波束和功率分配方法 | |
CN106792451B (zh) | 一种基于多种群遗传算法的d2d通信资源优化方法 | |
CN107071914A (zh) | 一种能量捕获d2d网络中的动态模式选择与能量分配方法 | |
CN104954975A (zh) | Ofdm蜂窝网络中进行能量收集的d2d协作通信方法 | |
CN104717755A (zh) | 一种蜂窝网络中引入d2d技术的下行频谱资源分配方法 | |
CN105873214A (zh) | 一种基于遗传算法的d2d通信系统的资源分配方法 | |
CN110139249B (zh) | 基于机器类型通信设备分组的半非授权随机接入方法 | |
CN106686683B (zh) | 一种基于网络编码的d2d通信功率分配和中继选择方法 | |
CN112788764A (zh) | 针对noma超密集网络任务卸载和资源分配方法及系统 | |
CN111787543A (zh) | 一种基于改进灰狼优化算法的5g通信系统资源分配方法 | |
Khalili et al. | Performance trade-off between uplink and downlink in full-duplex communications | |
CN107071695A (zh) | 一种终端直通协作中继网络的路由和频谱资源管理方案 | |
CN105979477A (zh) | 一种基于博弈论的d2d通信的能耗优化方法 | |
CN110677176A (zh) | 一种基于能量效率与频谱效率的联合折中优化方法 | |
CN106413098B (zh) | D2d网络中一种基于中断概率的资源分配方法 | |
CN104780610A (zh) | 一种基于终端直通通信的资源分配方法 | |
CN109982407B (zh) | Noma系统中基于中继选择的安全传输系统及其方法 | |
CN108521643B (zh) | 一种基于合作博弈的中继辅助d2d通信系统的优化方法 | |
CN109661026A (zh) | 一种基于noma的d2d辅助中继系统功率分配方法 | |
CN115361725A (zh) | 一种引入社交域信息的多跳d2d通信中的中继选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |