CN110753329A - 蜂窝网络中d2d中继通信的功率控制与中继选择方法 - Google Patents

蜂窝网络中d2d中继通信的功率控制与中继选择方法 Download PDF

Info

Publication number
CN110753329A
CN110753329A CN201911034781.5A CN201911034781A CN110753329A CN 110753329 A CN110753329 A CN 110753329A CN 201911034781 A CN201911034781 A CN 201911034781A CN 110753329 A CN110753329 A CN 110753329A
Authority
CN
China
Prior art keywords
relay
user
energy efficiency
cellular
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911034781.5A
Other languages
English (en)
Other versions
CN110753329B (zh
Inventor
王雪
金涛
钱志鸿
蒙武杰
许多
王嘉麟
胡良帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201911034781.5A priority Critical patent/CN110753329B/zh
Publication of CN110753329A publication Critical patent/CN110753329A/zh
Application granted granted Critical
Publication of CN110753329B publication Critical patent/CN110753329B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/70Services for machine-to-machine communication [M2M] or machine type communication [MTC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/02Communication route or path selection, e.g. power-based or shortest path routing
    • H04W40/22Communication route or path selection, e.g. power-based or shortest path routing using selective relaying for reaching a BTS [Base Transceiver Station] or an access point
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC
    • H04W52/06TPC algorithms
    • H04W52/14Separate analysis of uplink or downlink
    • H04W52/146Uplink power control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/24TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
    • H04W52/241TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account channel quality metrics, e.g. SIR, SNR, CIR, Eb/lo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/24TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
    • H04W52/243TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account interferences

Abstract

本发明公开了一种蜂窝网络中D2D中继通信的功率控制与中继选择方法,先建立系统模型,在保证D2D用户和蜂窝用户最小传输速率的情况下,将功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为对D2D发射端、中继和蜂窝用户的功率控制以及D2D用户的中继选择两个子问题进行求解;随后分别求出给定某个中继下,D2D发射端、中继和蜂窝用户的最优传输功率;最后采用Q学习解决中继选择问题,在保证第一跳以及第二跳D2D链路的能效条件下,为D2D用户分配合适的中继以最大化系统总能效。解决D2D中继通信的功率控制和中继选择问题,实现了系统总能效的最大化。

Description

蜂窝网络中D2D中继通信的功率控制与中继选择方法
技术领域
本发明属于无线通信技术领域,特别是涉及一种蜂窝网络中D2D中继通信的功率控制与中继选择方法。
背景技术
作为5G的关键技术之一D2D(Device-to-Device)通信技术是指通信网络中邻近设备不通过基站直接交换信息的技术。当D2D用户之间距离较远或者链路质量差时,引入中继不仅可以提高用户的信道增益,还能提升网络频谱效率,扩大小区覆盖范围,保证信息的有效传输。但是,随着用户设备的大量增长以及终端设备有限的电池容量限制,怎样有效提高能量效率,实现绿色通信,是未来无线通信发展的关键。
在D2D中继通信中,仅仅考虑功率的控制而忽略中继的选择对于能效的提高是微乎其微的。并且,选择合适的中继也有利于增加系统的吞吐量。一般地,中继可采用的模式有放大转发(Amplify and Forward)和解码转发(Decode and Forward),放大转发模式的优点是复杂度低于解码转发方式,解码转发模式的优点是可以保证通信链路的质量。通常,D2D通信可选用的中继有多个,基于提高系统能效的目的,如何选择合适的中继最大化能效是值得考虑的。随着中继数目的增加,计算复杂度也是成倍地增加,如何限制备选中继的数量以及选用合适的算法也是需要考虑的。
在D2D通信中引入中继的同时,也给系统内原有蜂窝用户的通信质量造成了干扰,降低了用户的服务质量,增大了功率的消耗,如何为D2D中继通信设定最优的传输功率,选择最合适的中继是实现绿色通信的关键。
发明内容
为实现上述目的,本发明提供一种蜂窝网络中D2D中继通信的功率控制与中继选择方法,在多个备选中继的情况下,解决D2D中继通信的功率控制与中继选择问题,实现了系统能效的最大化。
本发明所采用的技术方案是,蜂窝网络中D2D中继通信的功率控制与中继选择方法,按照以下步骤进行:
步骤S1,建立系统模型,系统内N个D2D用户对与K个蜂窝用户共存,D2D用户对用集合I={1,2,...,N}表示,D2D发射端、D2D接收端以及蜂窝用户分别用集合S={1,2,...,N},D={1,2,...,N}和C={1,2,...,K}表示;假设系统中存在M个理想用户作为中继,用集合表示为R={1,2,...,M};
若一个D2D用户对m=(s,d)通过某一中继r进行通信,其中m∈I,s∈S,d∈D,r∈R,D2D通信第一跳链路中继以及基站的信干噪比为
Figure BDA0002251161000000029
第二跳链路中D2D接收端及基站的信干噪比为
Figure BDA00022511610000000212
D2D发射端到D2D接收端的能效为EE(Ps,Pr,Pc,),Ps、Pr、Pc分别表示D2D发射端、中继、蜂窝用户的传输功率;
步骤S2,在保证蜂窝网络中D2D用户和蜂窝用户的最小传输速率条件下,首先将D2D中继通信的功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为D2D发射端、中继以及蜂窝用户的功率控制与D2D中继选择两个子问题逐步进行求解;
步骤S2.1:定义矩阵X为中继选择矩阵,第m行、第r列的元素表示为中继因子xmr,当某一D2D用户对m通过某一中继r进行通信时xmr=1,否则xmr=0;
Figure BDA00022511610000000213
Figure BDA0002251161000000021
以及
Figure BDA0002251161000000022
分别表示D2D发射端、中继以及蜂窝用户的功率分配矩阵,其中
Figure BDA00022511610000000214
分别表示D2D发射端1,2,...,N的传输功率,
Figure BDA00022511610000000215
分别表示中继1,2,...,M的传输功率,
Figure BDA00022511610000000216
分别表示蜂窝用户1,2,...,K的传输功率;
步骤S2.2:引入中继复用因子xmr之后,将D2D中继通信的功率控制与中继选择问题转化为如下混合整数非线性规划问题:
Figure BDA0002251161000000023
Figure BDA0002251161000000024
Figure BDA0002251161000000025
Figure BDA0002251161000000026
Figure BDA0002251161000000027
U(r1)(Ps,Pc)≥Umin; (8e)
U(r2)(Pr,Pc)≥Umin; (8f)
其中,Pmax为传输功率的阈值,Umin和Rmin为D2D链路和蜂窝链路最小传输速率,W表示信道的带宽,U、T表示函数符号;
步骤S3,分别求出D2D发射端、中继和蜂窝用户的最优传输功率;
步骤S4,最后提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效。
进一步的,步骤S1中所述D2D通信第一跳链路中继以及基站的信干噪比
Figure BDA0002251161000000031
Figure BDA0002251161000000032
具体求解过程如下:
Figure BDA0002251161000000033
其中,Gsr、Gsb、Gcr和Gcb分别表示D2D发射端到中继、D2D发射端到基站、蜂窝用户到中继以及蜂窝用户到基站的信道增益,N0表示加性高斯白噪声;
所述第二跳链路中D2D接收端及基站的信干噪比为
Figure BDA0002251161000000035
Figure BDA0002251161000000036
具体求解过程如下:
Figure BDA0002251161000000037
以及
Figure BDA0002251161000000038
其中,Pr表示中继的传输功率,Grd、Grb、Gcd和Gcb分别表示中继到D2D接收端、中继到基站、蜂窝用户到D2D接收端和蜂窝用户到基站的信道增益。
进一步的,步骤S1中所述D2D发射端到D2D接收端的能效具体求解过程如下:
D2D用户通信第一跳链路的能效表达式为:
Figure BDA0002251161000000039
D2D用户通信第二跳链路的能效表达式为:
Figure BDA0002251161000000041
D2D发射端到D2D接收端的能效可表示为D2D发射端到D2D接收端的传输速率比上总功率消耗,基于式(5)、式(6),具体为:
Figure BDA0002251161000000042
其中,Pcir表示电路功率损耗,η表示功率放大系数。
进一步的,步骤S3中所述D2D发射端、中继和蜂窝用户的最优传输功率具体求解步骤如下:
步骤3.1:假设给定一个中继,则xmr=1;通过所述公式(8)可以将功率分配问题表示为:
Figure BDA0002251161000000043
步骤S3.2:求出蜂窝用户的最优传输功率,想要最大化公式(9),那么蜂窝功率
Figure BDA0002251161000000044
必须取最小值,由(8g)可得:
可以明显看出公式(9)的分子不是一个确定的表达式,为了保证D2D用户对在第一跳链路和第二跳链路的传输速率,将公式(9)分成问题I和问题II,其中问题I为最大化D2D用户在第一跳链路的能效
Figure BDA0002251161000000046
问题II为最大化D2D用户在第二跳链路的能效
Figure BDA0002251161000000047
问题I和问题II分别表示为:
问题I:
Figure BDA0002251161000000051
问题II:
Figure BDA0002251161000000052
步骤S3.3:利用Dinkelbach方法和拉格朗日对偶分解求解问题I;首先,将问题I转化成等价的减式形式,可得:
Figure BDA0002251161000000053
其中,用q1表示为D2D反射端到中继的能效,则
Figure BDA0002251161000000059
为D2D发射端到中继的最大能效;假设第n次迭代中得到D2D发射端的传输功率Ps(n),第n-1次迭代中得到D2D反射端到中继的能效q1(n-1),则优化问题公式(13)的增广拉格朗日式为:
Figure BDA0002251161000000054
其中,δr1(n)和θr1(n)是第一跳链路约束条件的拉格朗日算子;由对偶分解可得式(14)可分解为如下最大化最小问题,即:
Figure BDA0002251161000000055
步骤S3.4:使用Karush-Kuhn-Tucker条件,可得第n次迭代时得到的最优D2D发射端的传输功率
Figure BDA0002251161000000056
Figure BDA0002251161000000057
θr1(n,τ+1)={θr1(n,τ)-α[U(r1)(n,τ)-Umin]}+; (18)
同理可得:
Figure BDA0002251161000000061
Figure BDA0002251161000000062
θr2(n,τ+1)={θr2(n,τ)-α[U(r2)(n,τ)-Umin]}+; (21)
其中,δr2(n),θr2(n)表示第二跳链路约束条件的拉格朗日算子,q2表示中继到D2D接收端的能效,τ表示内部迭代的次数、α表示迭代的步长,e表示自然对数;通过多次迭代之后,求出合适的D2D发射端、中继的传输功率。
进一步的,步骤S4中所述提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效,具体过程如下:
步骤S4.1:首先定义Q学习中的几个要素:
智能体:智能体为D2D用户对;
动作:动作集合表示为:
A=(a1,a2,...,aM); (22)
其中,a1,a2,...,aM分别表示中继1,2,...,M的动作;
设定以D2D发射端到D2D接收端的距离为半径,分别以D2D发射端和D2D接收端为圆心做出两个相交的圆,而辅助通信的中继只能从相交区域中选出;
状态:智能体在t时刻所处的状态用St表示,智能体的状态取决于D2D用户在第一跳链路和第二跳链路的能效,具体地:
Figure BDA0002251161000000063
其中,EEth代表D2D链路的最低能效要求,EE(r1)、EE(r2)分别表示第一跳链路和第二跳链路的能效,s1,s2,s3,s4表示智能体可能处于的四个状态;
回报函数:回报函数Reward表示执行动作后的报酬,当回报函数为正值时表示所选动作有益,当回报函数为负值时表示所选的动作对于最终结果有负面影响,具体表达式为:
Figure BDA0002251161000000071
其中,C是折扣因子,EE表示D2D发射端到D2D接收端的能效;
步骤S4.2:初始化状态,然后从多个备选中继中随机选择一个中继进行通信,通过式(5)、式(6)计算出EE(r1)(Ps,Pc)和EE(r2)(Pr,Pc);
步骤S4.3:根据Q学习算法,依次遍历所有的备选中继,利用Q学习更新D2D用户对的Q表,在经过多次迭代后Q表收敛,根据Q表选择最佳中继。
本发明的有益效果:将蜂窝网络中D2D功率控制与中继选择过程分为两个阶段,第一阶段为D2D发射端、中继和蜂窝用户的功率控制阶段,分别获取给定某个中继下D2D发射端、中继和蜂窝用户的最优发射功率,第二阶段为中继选择阶段,在分别获取给定某个中继下D2D发射端、中继和蜂窝用户的最优传输功率,计算出能效,提出一种基于Q学习的中继选择方法,以系统能效最大化为准则,为D2D用户对选择合适的中继,提升系统的能效。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的蜂窝网络中D2D中继通信的功率控制与中继选择的系统模型图。
图2是本发明实施例中功率控制及中继选择方法执行的流程图。
图3是本发明实施例中系统总能效随网络内D2D用户数变化的曲线示意图。
图4是本发明实施例中系统总能效随网络内中继数变化的曲线示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例首先建立系统模型,在保证蜂窝网络中D2D用户与蜂窝用户的最小传输速率的条件下,将D2D中继通信的功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为D2D发射端、中继和蜂窝用户的功率控制以及D2D用户的中继选择两个子问题进行求解,随后分别求出D2D发射端、中继以及蜂窝用户的最优传输功率,最后采用基于Q学习的中继选择方法,以实现系统总能效的最大化。具体地,按照以下步骤进行:
步骤S1,首先建立系统模型。系统模型如图1所示,该系统有一个基站(BS),系统内N个D2D用户对与K个蜂窝用户共存,D2D用户对包括一个D2D发射端以及与之对应的一个D2D接收端,并且用集合I={1,2,...,N}表示D2D用户对。D2D发射端、D2D接收端以及蜂窝用户分别用集合S={1,2,...,N},D={1,2,...,N}和C={1,2,...,K}表示。假设系统中存在M个理想用户作为中继,用集合表示为R={1,2,...,M}。D2D发射端与D2D接收端之间由于链路质量较差,不能直连通路,只能通过多个备选中继中的某一个通信,而中继均采用放大转发协议。
若一个D2D用户对m=(s,d)(m∈I,s∈S,d∈D)通过某一中继r(r∈R)进行通信,在D2D通信第一跳链路中,D2D发射端对所复用频谱资源的蜂窝用户传输链路产生干扰,同时中继也会受到蜂窝用户的干扰,设第一跳链路中继以及基站的信干噪比为
Figure BDA0002251161000000081
Figure BDA0002251161000000083
以及
Figure BDA0002251161000000084
其中,Ps、Pc分别表示D2D发射端和蜂窝用户的传输功率,Gsr、Gsb、Gcr和Gcb分别表示D2D发射端到中继、D2D发射端到基站、蜂窝用户到中继以及蜂窝用户到基站的信道增益,N0表示加性高斯白噪声。
在D2D通信第二跳链路中,采用放大转发协议的中继会对所复用频谱资源的蜂窝用户传输链路产生干扰,同时D2D接收端受到蜂窝用户的干扰,设第二跳链路中D2D接收端及基站的信干噪比为
Figure BDA0002251161000000085
Figure BDA0002251161000000086
Figure BDA0002251161000000091
以及
Figure BDA0002251161000000092
其中,Pr表示中继的传输功率,Grd、Grb、Gcd和Gcb分别表示中继到D2D接收端、中继到基站、蜂窝用户到D2D接收端和蜂窝用户到基站的信道增益。
D2D用户通信第一跳链路的能效表达式为:
Figure BDA0002251161000000093
D2D用户通信第二跳链路的能效表达式为:
其中,Pcir表示电路功率损耗,η表示功率放大系数,W表示信道的带宽,U、T表示函数符号,无实际含义。
D2D发射端到D2D接收端的能效可表示为D2D发射端到D2D接收端的传输速率比上总功率消耗,基于式(5)、式(6),具体为:
Figure BDA0002251161000000095
步骤S2,在保证蜂窝网络中D2D用户和蜂窝用户的最小传输速率条件下,首先将D2D中继通信的功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为D2D发射端、中继以及蜂窝用户的功率控制与D2D中继选择两个子问题逐步进行求解。
步骤S2.1:定义矩阵X为中继选择矩阵,第m行、第r列的元素表示为中继因子xmr,当D2D用户对m通过中继r进行通信时xmr=1,否则xmr=0;
Figure BDA0002251161000000108
Figure BDA0002251161000000109
以及
Figure BDA00022511610000001010
分别表示D2D发射端、中继以及蜂窝用户的功率分配矩阵。
步骤S2.2:引入中继复用因子xmr之后,将D2D中继通信的功率控制与中继选择问题转化为如下混合整数非线性规划问题:
Figure BDA0002251161000000101
Figure BDA0002251161000000102
Figure BDA0002251161000000103
Figure BDA0002251161000000104
U(r1)(Ps,Pc)≥Umin; (8e)
U(r2)(Pr,Pc)≥Umin; (8f)
Figure BDA0002251161000000106
其中,Pmax为传输功率的阈值,Umin和Rmin为D2D链路和蜂窝链路最小传输速率。约束条件(8a)和(8b)保证一个中继最多只能辅助一个D2D用户对;约束条件(8c)和(8d)是对于D2D发射端和中继的传输功率限制;约束条件(8e)和(8f)保证D2D第一跳链路以及第二跳链路的最小传输速率需求;约束条件(8g)保证了蜂窝用户的最小传输速率要求。
步骤S3,分别求出D2D发射端、中继和蜂窝用户的最优传输功率。
步骤3.1:假设给定一个中继,则xmr=1。通过所述公式(8)可以将功率分配问题表示为:
Figure BDA0002251161000000107
步骤S3.2:求出蜂窝用户的最优传输功率,公式(9)是蜂窝功率的减函数,想要最大化公式(9),那么蜂窝功率必须取最小值,由(8g)可得:
在得到蜂窝用户的功率之后,还需求解D2D发射端、中继的最优传输功率。并且,可以明显看出公式(9)的分子不是一个确定的表达式,为了保证D2D用户对在第一跳链路和第二跳链路的传输速率,将公式(9)分成问题I和问题II。其中,问题I为最大化D2D用户在第一跳链路的能效;问题II为最大化D2D用户在第二跳链路的能效,问题I和问题II分别表示为:
问题I:
Figure BDA0002251161000000112
问题II:
Figure BDA0002251161000000113
步骤S3.3:问题I和问题II表达式类似,可用相同的方法求解。具体地,利用Dinkelbach方法和拉格朗日对偶分解求解问题I。首先,将问题I转化成等价的减式形式,可得:
Figure BDA0002251161000000114
其中,用q1表示为D2D反射端到中继的能效,则
Figure BDA0002251161000000115
为D2D发射端到中继的最大能效。假设第n次迭代中得到D2D发射端的传输功率Ps(n),第n-1次迭代中得到D2D反射端到中继的能效q1(n-1),则优化问题公式(13)的增广拉格朗日式为:
Figure BDA0002251161000000116
其中,δr1(n)和θr1(n)是第一跳链路约束条件的拉格朗日算子。由对偶分解可得式(14)可分解为如下最大化最小问题,即:
Figure BDA0002251161000000117
步骤S3.4:使用Karush-Kuhn-Tucker(KKT)条件,可得第n次迭代时得到的最优D2D发射端的传输功率
Figure BDA0002251161000000121
Figure BDA0002251161000000122
θr1(n,τ+1)={θr1(n,τ)-α[U(r1)(n,τ)-Umin]}+; (18)
同理可得:
Figure BDA0002251161000000124
Figure BDA0002251161000000125
θr2(n,τ+1)={θr2(n,τ)-α[U(r2)(n,τ)-Umin]}+; (21)
其中,δr2(n),θr2(n)表示第二跳链路约束条件的拉格朗日算子。q2表示中继到D2D接收端的能效。τ表示内部迭代的次数、α表示迭代的步长,e表示自然对数。
由此,通过多次迭代之后,求出合适的D2D发射端、中继的传输功率。
步骤S4,最后提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效。
步骤S4.1:首先定义Q学习中的几个要素:
智能体:对于动作决策的执行以及Q表的更新,本实施例中智能体为D2D用户对。
动作:智能体所执行动作即为选择中继,所以动作数和中继数相等。动作集合表示为:
A=(a1,a2,...,aM); (22)
其中,a1,a2,...,aM分别表示中继1,2,...,M的动作;
为了降低计算的复杂度,我们设定以D2D发射端到D2D接收端的距离为半径,分别以D2D发射端和D2D接收端为圆心做出两个相交的圆,而辅助通信的中继只能从相交区域中选出。
状态:智能体在t时刻所处的状态用St表示。智能体的状态取决于D2D用户在第一跳链路和第二跳链路的能效,具体地:
其中,EEth代表D2D链路的最低能效要求,EE(r1)、EE(r2)分别表示第一跳链路和第二跳链路的能效,s1,s2,s3,s4表示智能体可能处于的四个状态。
回报函数:回报函数Reward表示执行动作后的报酬,当回报函数为正值时表示所选动作有益;当回报函数为负值时表示所选的动作对于最终结果有负面影响。具体表达式为:
其中,C是折扣因子,EE表示D2D发射端到D2D接收端的能效。
步骤S4.2:初始化状态,然后从多个备选中继中随机选择一个中继进行通信,通过式(5)、式(6)计算出EE(r1)(Ps,Pc)和EE(r2)(Pr,Pc);
步骤S4.3:根据Q学习算法,依次遍历所有的备选中继,利用Q学习更新D2D用户对的Q表。在经过多次迭代后,Q表收敛。根据Q表,选择最佳中继。如图2所示,经过Q学习过程之后,D2D用户对通过Q表进行中继选择。
图3所示是系统总能效随网络内D2D用户数变化的曲线示意图,从图中可以看出,系统总能效随网络内D2D用户数的增加而呈现递增的趋势。仿真结果表明本发明实施例的总能效网络优于“能效-中继选择算法”,“匹配-功率控制算法”和“能效-功率控制算法”。
图4所示是系统总能效随网络内中继数变化的曲线示意图,从图中可以看出,随着中继数的增加,采用本发明实施例的系统总能效呈现递增的趋势。这是因为当中继数增加之后,本发明实施例所述方法可以选择更优的中继进行辅助通信,并且该方法的优化性能优于“能效-中继选择算法”,“匹配-功率控制算法”和“能效-功率控制算法”。而“能效-功率控制算法”的总能效曲线是平缓的,原因是其方法中不包含中继选择,所以当中继数增加对于系统总能效影响不大。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (5)

1.蜂窝网络中D2D中继通信的功率控制与中继选择方法,其特征在于,按照如下步骤进行:
步骤S1,建立系统模型,系统内N个D2D用户对与K个蜂窝用户共存,D2D用户对用集合I={1,2,...,N}表示,D2D发射端、D2D接收端以及蜂窝用户分别用集合S={1,2,...,N},D={1,2,...,N}和C={1,2,...,K}表示;假设系统中存在M个理想用户作为中继,用集合表示为R={1,2,...,M};
若一个D2D用户对m=(s,d)通过某一中继r进行通信,其中m∈I,s∈S,d∈D,r∈R,D2D通信第一跳链路中继以及基站的信干噪比为第二跳链路中D2D接收端及基站的信干噪比为
Figure FDA0002251160990000013
Figure FDA0002251160990000014
D2D发射端到D2D接收端的能效为EE(Ps,Pr,Pc,),Ps、Pr、Pc分别表示D2D发射端、中继、蜂窝用户的传输功率;
步骤S2,在保证蜂窝网络中D2D用户和蜂窝用户的最小传输速率条件下,首先将D2D中继通信的功率控制与中继选择问题转化为混合整数非线性规划问题,并将其拆分为D2D发射端、中继以及蜂窝用户的功率控制与D2D中继选择两个子问题逐步进行求解;
步骤S2.1:定义矩阵X为中继选择矩阵,第m行、第r列的元素表示为中继因子xmr,当某一D2D用户对m通过某一中继r进行通信时xmr=1,否则xmr=0;Es={Ps 1,Ps 2,...,Ps N},
Figure FDA0002251160990000015
以及
Figure FDA0002251160990000016
分别表示D2D发射端、中继以及蜂窝用户的功率分配矩阵,其中Ps 1,Ps 2,...,Ps N分别表示D2D发射端1,2,...,N的传输功率,分别表示中继1,2,...,M的传输功率,分别表示蜂窝用户1,2,...,K的传输功率;
步骤S2.2:引入中继复用因子xmr之后,将D2D中继通信的功率控制与中继选择问题转化为如下混合整数非线性规划问题:
Figure FDA0002251160990000019
Figure FDA00022511609900000111
Figure FDA00022511609900000112
U(r1)(Ps,Pc)≥Umin; (8e)
U(r2)(Pr,Pc)≥Umin; (8f)
Figure FDA0002251160990000021
其中,Pmax为传输功率的阈值,Umin和Rmin为D2D链路和蜂窝链路最小传输速率,W表示信道的带宽,U、T表示函数符号;
步骤S3,分别求出D2D发射端、中继和蜂窝用户的最优传输功率;
步骤S4,最后提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效。
2.根据权利要求1所述蜂窝网络中D2D中继通信的功率控制与中继选择方法,其特征在于,步骤S1中所述D2D通信第一跳链路中继以及基站的信干噪比
Figure FDA0002251160990000022
Figure FDA0002251160990000023
具体求解过程如下:
Figure FDA0002251160990000024
Figure FDA0002251160990000025
其中,Gsr、Gsb、Gcr和Gcb分别表示D2D发射端到中继、D2D发射端到基站、蜂窝用户到中继以及蜂窝用户到基站的信道增益,N0表示加性高斯白噪声;
所述第二跳链路中D2D接收端及基站的信干噪比为
Figure FDA0002251160990000026
Figure FDA0002251160990000027
具体求解过程如下:
Figure FDA0002251160990000028
以及
Figure FDA0002251160990000029
其中,Pr表示中继的传输功率,Grd、Grb、Gcd和Gcb分别表示中继到D2D接收端、中继到基站、蜂窝用户到D2D接收端和蜂窝用户到基站的信道增益。
3.根据权利要求1所述蜂窝网络中D2D中继通信的功率控制与中继选择方法,其特征在于,步骤S1中所述D2D发射端到D2D接收端的能效具体求解过程如下:
D2D用户通信第一跳链路的能效表达式为:
Figure FDA0002251160990000031
D2D用户通信第二跳链路的能效表达式为:
Figure FDA0002251160990000032
D2D发射端到D2D接收端的能效可表示为D2D发射端到D2D接收端的传输速率比上总功率消耗,基于式(5)、式(6),具体为:
Figure FDA0002251160990000033
其中,Pcir表示电路功率损耗,η表示功率放大系数。
4.根据权利要求1所述蜂窝网络中D2D中继通信的功率控制与中继选择方法,其特征在于,步骤S3中所述D2D发射端、中继和蜂窝用户的最优传输功率具体求解步骤如下:
步骤3.1:假设给定一个中继,则xmr=1;通过所述公式(8)可以将功率分配问题表示为:
Figure FDA0002251160990000034
步骤S3.2:求出蜂窝用户的最优传输功率,想要最大化公式(9),那么蜂窝功率
Figure FDA0002251160990000035
必须取最小值,由(8g)可得:
Figure FDA0002251160990000036
可以明显看出公式(9)的分子不是一个确定的表达式,为了保证D2D用户对在第一跳链路和第二跳链路的传输速率,将公式(9)分成问题I和问题II,其中问题I为最大化D2D用户在第一跳链路的能效问题II为最大化D2D用户在第二跳链路的能效
Figure FDA0002251160990000042
问题I和问题II分别表示为:
问题I:
Figure FDA0002251160990000043
Figure FDA0002251160990000044
问题II:
Figure FDA0002251160990000046
步骤S3.3:利用Dinkelbach方法和拉格朗日对偶分解求解问题I;首先,将问题I转化成等价的减式形式,可得:
Figure FDA0002251160990000047
其中,用q1表示为D2D反射端到中继的能效,则
Figure FDA0002251160990000048
为D2D发射端到中继的最大能效;假设第n次迭代中得到D2D发射端的传输功率Ps(n),第n-1次迭代中得到D2D反射端到中继的能效q1(n-1),则优化问题公式(13)的增广拉格朗日式为:
Figure FDA0002251160990000049
其中,δr1(n)和θr1(n)是第一跳链路约束条件的拉格朗日算子;由对偶分解可得式(14)可分解为如下最大化最小问题,即:
Figure FDA00022511609900000410
步骤S3.4:使用Karush-Kuhn-Tucker条件,可得第n次迭代时得到的最优D2D发射端的传输功率
Figure FDA0002251160990000051
Figure FDA0002251160990000052
θr1(n,τ+1)={θr1(n,τ)-α[U(r1)(n,τ)-Umin]}+; (18)
同理可得:
Figure FDA0002251160990000053
Figure FDA0002251160990000054
θr2(n,τ+1)={θr2(n,τ)-α[U(r2)(n,τ)-Umin]}+; (21)
其中,δr2(n),θr2(n)表示第二跳链路约束条件的拉格朗日算子,q2表示中继到D2D接收端的能效,τ表示内部迭代的次数,α表示迭代的步长,e表示自然对数;通过多次迭代之后,求出合适的D2D发射端、中继的传输功率。
5.根据权利要求1所述蜂窝网络中D2D中继通信的功率控制与中继选择方法,其特征在于,步骤S4中所述提出一种基于强化学习中的Q学习算法的中继选择策略,最大化系统中D2D用户对的能效,具体过程如下:
步骤S4.1:首先定义Q学习中的几个要素:
智能体:智能体为D2D用户对;
动作:动作集合表示为:
A=(a1,a2,...,aM); (22)
其中,a1,a2,...,aM分别表示中继1,2,...,M的动作;
设定以D2D发射端到D2D接收端的距离为半径,分别以D2D发射端和D2D接收端为圆心做出两个相交的圆,而辅助通信的中继只能从相交区域中选出;
状态:智能体在t时刻所处的状态用St表示,智能体的状态取决于D2D用户在第一跳链路和第二跳链路的能效,具体地:
Figure FDA0002251160990000055
其中,EEth代表D2D链路的最低能效要求,EE(r1)、EE(r2)分别表示第一跳链路和第二跳链路的能效,s1,s2,s3,s4表示智能体可能处于的四个状态;
回报函数:回报函数Reward表示执行动作后的报酬,当回报函数为正值时表示所选动作有益,当回报函数为负值时表示所选的动作对于最终结果有负面影响,具体表达式为:
Figure FDA0002251160990000061
其中,C是折扣因子,EE表示D2D发射端到D2D接收端的能效;
步骤S4.2:初始化状态,然后从多个备选中继中随机选择一个中继进行通信,通过式(5)、式(6)计算出EE(r1)(Ps,Pc)和EE(r2)(Pr,Pc);
步骤S4.3:根据Q学习算法,依次遍历所有的备选中继,利用Q学习更新D2D用户对的Q表,在经过多次迭代后Q表收敛,根据Q表选择最佳中继。
CN201911034781.5A 2019-10-29 2019-10-29 蜂窝网络中d2d中继通信的功率控制与中继选择方法 Active CN110753329B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911034781.5A CN110753329B (zh) 2019-10-29 2019-10-29 蜂窝网络中d2d中继通信的功率控制与中继选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911034781.5A CN110753329B (zh) 2019-10-29 2019-10-29 蜂窝网络中d2d中继通信的功率控制与中继选择方法

Publications (2)

Publication Number Publication Date
CN110753329A true CN110753329A (zh) 2020-02-04
CN110753329B CN110753329B (zh) 2020-12-18

Family

ID=69280647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911034781.5A Active CN110753329B (zh) 2019-10-29 2019-10-29 蜂窝网络中d2d中继通信的功率控制与中继选择方法

Country Status (1)

Country Link
CN (1) CN110753329B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111885671A (zh) * 2020-07-17 2020-11-03 燕山大学 一种基于深度强化学习的水下联合中继选择和功率分配方法
CN112637927A (zh) * 2020-12-16 2021-04-09 温州大学 基于能量效率的多用户多模式d2d通信资源分配方法
CN116669137A (zh) * 2023-05-30 2023-08-29 山东大学 一种自适应单跳和两跳的d2d数据传输方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102883451A (zh) * 2012-10-12 2013-01-16 南京邮电大学 终端直通技术共享系统上行资源的跨层设计方法
CN103607750A (zh) * 2013-11-25 2014-02-26 南京邮电大学 下一代蜂窝系统中基于终端直通通信的中继选择方法
CN104284407A (zh) * 2014-10-28 2015-01-14 中国矿业大学 嵌入d2d的蜂窝网络中基于全双工中继的功率控制方法
WO2016022065A1 (en) * 2014-08-08 2016-02-11 Telefonaktiebolaget L M Ericsson (Publ) D2d power control
US20160227518A1 (en) * 2013-09-27 2016-08-04 Telefonaktiebolaget Lm Ericsson (Publ) Device to device (d2d) control information relay
CN106304112A (zh) * 2016-08-14 2017-01-04 辛建芳 一种基于中继协作的蜂窝网络能量效率优化方法
CN106535284A (zh) * 2016-12-12 2017-03-22 西安电子科技大学 一种基于全双工中继的d2d通信中的功率控制方法
CN108112084A (zh) * 2018-01-04 2018-06-01 重庆邮电大学 一种蜂窝d2d通信系统中联合模式选择和资源分配方法
US20180206176A1 (en) * 2015-08-12 2018-07-19 Intel Corporation Methods to enable high data rate relay operation using d2d air-interface
CN108495332A (zh) * 2018-03-28 2018-09-04 山东大学 一种基于蜂窝d2d通信系统的联合资源公平分配方法
CN108834109A (zh) * 2018-05-03 2018-11-16 中国人民解放军陆军工程大学 全双工主动窃听下基于q学习的d2d协同中继功率控制方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102883451A (zh) * 2012-10-12 2013-01-16 南京邮电大学 终端直通技术共享系统上行资源的跨层设计方法
US20160227518A1 (en) * 2013-09-27 2016-08-04 Telefonaktiebolaget Lm Ericsson (Publ) Device to device (d2d) control information relay
CN103607750A (zh) * 2013-11-25 2014-02-26 南京邮电大学 下一代蜂窝系统中基于终端直通通信的中继选择方法
WO2016022065A1 (en) * 2014-08-08 2016-02-11 Telefonaktiebolaget L M Ericsson (Publ) D2d power control
CN104284407A (zh) * 2014-10-28 2015-01-14 中国矿业大学 嵌入d2d的蜂窝网络中基于全双工中继的功率控制方法
US20180206176A1 (en) * 2015-08-12 2018-07-19 Intel Corporation Methods to enable high data rate relay operation using d2d air-interface
CN106304112A (zh) * 2016-08-14 2017-01-04 辛建芳 一种基于中继协作的蜂窝网络能量效率优化方法
CN106535284A (zh) * 2016-12-12 2017-03-22 西安电子科技大学 一种基于全双工中继的d2d通信中的功率控制方法
CN108112084A (zh) * 2018-01-04 2018-06-01 重庆邮电大学 一种蜂窝d2d通信系统中联合模式选择和资源分配方法
CN108495332A (zh) * 2018-03-28 2018-09-04 山东大学 一种基于蜂窝d2d通信系统的联合资源公平分配方法
CN108834109A (zh) * 2018-05-03 2018-11-16 中国人民解放军陆军工程大学 全双工主动窃听下基于q学习的d2d协同中继功率控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUNG-FA HUANG: "RESOURCE ALLOCATION FOR D2D COMMUNICATIONS WITH A NOVEL DISTRIBUTED Q-LEARNING ALGORITHM IN HETEROGENEOUS NETWORKS", 《2018 INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND CYBERNETICS》 *
王倩: "D2D通信中基于Q学习的联合资源分配与功率控制算法", 《南京大学学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111885671A (zh) * 2020-07-17 2020-11-03 燕山大学 一种基于深度强化学习的水下联合中继选择和功率分配方法
CN111885671B (zh) * 2020-07-17 2022-04-15 燕山大学 一种基于深度强化学习的水下联合中继选择和功率分配方法
CN112637927A (zh) * 2020-12-16 2021-04-09 温州大学 基于能量效率的多用户多模式d2d通信资源分配方法
CN116669137A (zh) * 2023-05-30 2023-08-29 山东大学 一种自适应单跳和两跳的d2d数据传输方法及装置

Also Published As

Publication number Publication date
CN110753329B (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN109474980B (zh) 一种基于深度增强学习的无线网络资源分配方法
CN109729528B (zh) 一种基于多智能体深度强化学习的d2d资源分配方法
CN110753329B (zh) 蜂窝网络中d2d中继通信的功率控制与中继选择方法
CN105451322B (zh) D2D网络中一种基于QoS的信道分配和功率控制方法
CN103298084B (zh) 一种基于能效准则的协作多中继选择与功率分配方法
CN110493804B (zh) 一种毫米波系统的波束和功率分配方法
CN106792451B (zh) 一种基于多种群遗传算法的d2d通信资源优化方法
CN107071914A (zh) 一种能量捕获d2d网络中的动态模式选择与能量分配方法
CN104954975A (zh) Ofdm蜂窝网络中进行能量收集的d2d协作通信方法
CN104717755A (zh) 一种蜂窝网络中引入d2d技术的下行频谱资源分配方法
CN105873214A (zh) 一种基于遗传算法的d2d通信系统的资源分配方法
CN110139249B (zh) 基于机器类型通信设备分组的半非授权随机接入方法
CN106686683B (zh) 一种基于网络编码的d2d通信功率分配和中继选择方法
CN112788764A (zh) 针对noma超密集网络任务卸载和资源分配方法及系统
CN111787543A (zh) 一种基于改进灰狼优化算法的5g通信系统资源分配方法
Khalili et al. Performance trade-off between uplink and downlink in full-duplex communications
CN107071695A (zh) 一种终端直通协作中继网络的路由和频谱资源管理方案
CN105979477A (zh) 一种基于博弈论的d2d通信的能耗优化方法
CN110677176A (zh) 一种基于能量效率与频谱效率的联合折中优化方法
CN106413098B (zh) D2d网络中一种基于中断概率的资源分配方法
CN104780610A (zh) 一种基于终端直通通信的资源分配方法
CN109982407B (zh) Noma系统中基于中继选择的安全传输系统及其方法
CN108521643B (zh) 一种基于合作博弈的中继辅助d2d通信系统的优化方法
CN109661026A (zh) 一种基于noma的d2d辅助中继系统功率分配方法
CN115361725A (zh) 一种引入社交域信息的多跳d2d通信中的中继选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant