CN113193893B - 毫米波大规模mimo智能混合波束成形设计方法 - Google Patents

毫米波大规模mimo智能混合波束成形设计方法 Download PDF

Info

Publication number
CN113193893B
CN113193893B CN202110480431.2A CN202110480431A CN113193893B CN 113193893 B CN113193893 B CN 113193893B CN 202110480431 A CN202110480431 A CN 202110480431A CN 113193893 B CN113193893 B CN 113193893B
Authority
CN
China
Prior art keywords
matrix
network
action
time
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110480431.2A
Other languages
English (en)
Other versions
CN113193893A (zh
Inventor
季书鹏
王琪胜
凌泰炀
伍诗语
李潇
王闻今
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202110480431.2A priority Critical patent/CN113193893B/zh
Publication of CN113193893A publication Critical patent/CN113193893A/zh
Application granted granted Critical
Publication of CN113193893B publication Critical patent/CN113193893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • H04B7/0426Power distribution
    • H04B7/043Power distribution using best eigenmode, e.g. beam forming or beam steering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • H04B7/0456Selection of precoding matrices or codebooks, e.g. using matrices antenna weighting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Power Engineering (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种毫米波大规模MIMO智能混合波束成形设计方法,该方法构造了一个用于联合优化模拟预编码矩阵和模拟合并矩阵的深度强化学习智能体,该智能体通过与环境交互进行学习,输入信道信息以及上一时刻模拟预编码矩阵和模拟合并矩阵的相位,输出当前时刻模拟预编码矩阵和模拟合并矩阵的相位,利用信道信息、模拟预编码矩阵和模拟合并矩阵计算数字预编码矩阵,通过最小均方误差准则计算数字合并矩阵。本发明的一种毫米波大规模MIMO智能混合波束成形设计方法学习训练时间短,能够充分利用信道的空间特性,有效提升频谱效率。

Description

毫米波大规模MIMO智能混合波束成形设计方法
技术领域
本发明涉及一种毫米波大规模MIMO智能混合波束成形设计方法,属于点对点MIMO下行系统自适应传输技术领域。
背景技术
大规模多输入多输出(MIMO)作为一种可以提高网络传输速率和能量效率的有效方法,被视为新一代无线通信网络的关键技术之一。大规模MIMO系统能充分利用空间资源,在不增加频谱资源和天线发射功率的情况下,大幅提高系统容量。
然而,在实际应用中,大规模MIMO系统仍面临着诸多挑战。传统的全数字波束成形结构需要为每一根发射天线和接收天线配备一个射频链路用于模数转换和上下变频,天线数的增大使得基站侧所需射频链路数增大,带来系统成本的提高,尤其是射频硬件昂贵的毫米波通信系统。混合预编码技术将全数字预编码拆分为高维的模拟预编码和低维的数字预编码,模拟预编码可由简单的相移器实现,数字预编码维数较低,仅使用很少的射频链路即可,可在一定程度上缓解这一问题。
目前,基于数值优化方法的混合预编码算法存在计算复杂度高的问题,且难以充分利用信道的空间特征。基于深度学习的混合预编码设计方法能够以较低的计算复杂度得到逼近最优的性能。然而,该类方法需要提前准备大量的训练数据,在天线阵列维度较高且路径数变化较大的情况下训练数据的获得极其困难,且该类方法泛化性较差,信道特征的微小变化将带来性能的急剧下降。因此,需要新的低复杂度和高性能混合波束成形算法来进一步解决这些问题。
发明内容
技术问题:为了克服现有技术中的不足,本发明针对毫米波大规模MIMO系统,利用深度强化学习进行混合预编码设计。深度强化学习智能体可通过与环境交互有效地学习到解决复杂问题的最优行为策略,从而以较低的计算复杂度取得逼近最优的频谱效率,并且对信道的变化具有较好的鲁棒性。
技术方案:根据本发明提出的一种毫米波大规模MIMO智能混合波束成形设计方法,包括以下步骤:
步骤一、t=0时刻,考虑毫米波大规模MIMO系统,基站配备NT根天线,将Ns个数据流发送给配备NR根天线的用户,发送端具有
Figure RE-GDA0003120919870000011
条射频链路,
Figure RE-GDA0003120919870000012
接收端具有
Figure RE-GDA0003120919870000021
条射频链路,
Figure RE-GDA0003120919870000022
基站已知其与用户间的信道矩阵H,初始化用于生成模拟预编码矩阵和模拟合并矩阵的深度强化学习智能体a,随机生成初始模拟预编码矩阵
Figure RE-GDA0003120919870000023
和模拟合并矩阵
Figure RE-GDA0003120919870000024
并令t=t+1,
所述深度强化学习智能体a包括:动作现实网络A、动作目标网络A′、评价现实网络C、评价目标网络C′和一个容量为ND的经验池D,经验池中存放智能体学习的样本,动作现实网络A和动作目标A′根据当前环境状态输出当前最佳动作,其输入是
Figure RE-GDA0003120919870000025
的向量,输出是
Figure RE-GDA0003120919870000026
的向量。评价现实网络C和评价目标C′根据当前状态- 动作对输出该状态-动作对的价值函数,其输入是
Figure RE-GDA0003120919870000027
的向量,输出是标量,A′与C′的网络结构分别与A和C的网络结构相同,A′与C′的网络参数均是每隔固定时隙通过A和C的网络参数软更新得到;
步骤二、在t时刻,令当前环境状态为:
Figure RE-GDA0003120919870000028
其中,
Figure RE-GDA0003120919870000029
表示t-1时刻所得的模拟预编码矩阵,
Figure RE-GDA00031209198700000210
表示t-1时刻所得的模拟合并矩阵,vec(·)表示将矩阵列向量化,(·)T表示转置,arg(·)表示取相位;
步骤三、将状态s(t)输入网络A,得到动作A(s(t)),其中A(·)表示网络A的函数,然后加上服从标准正态分布的噪声矢量
Figure RE-GDA00031209198700000211
其中
Figure RE-GDA00031209198700000212
得到t时刻动作a(t)=A(s(t))+n(t),并根据下式的对应关系生成t时刻的模拟预编码矩阵
Figure RE-GDA00031209198700000213
和模拟合并矩阵
Figure RE-GDA00031209198700000214
Figure RE-GDA00031209198700000215
步骤四、利用t时刻的模拟预编码矩阵
Figure RE-GDA00031209198700000216
和模拟合并矩阵
Figure RE-GDA00031209198700000217
求得相应等效信道矩阵
Figure RE-GDA00031209198700000218
并对其做奇异值分解
Figure RE-GDA00031209198700000219
其中 (·)H表示共轭转置,
Figure RE-GDA00031209198700000220
是一个
Figure RE-GDA00031209198700000221
的酉矩阵,
Figure RE-GDA00031209198700000222
是一个
Figure RE-GDA0003120919870000031
的对角矩阵,对角线上的奇异值按照降序排列,
Figure RE-GDA0003120919870000032
是一个
Figure RE-GDA0003120919870000033
的酉矩阵,rank(·)表示矩阵的秩,进而得到t时刻的数字预编码矩阵
Figure RE-GDA0003120919870000034
其中V(t)
Figure RE-GDA0003120919870000035
的前Ns列构成的矩阵,||·||F表示Frobenius范数,利用信道矩阵H、t时刻的数字预编码矩阵
Figure RE-GDA0003120919870000036
t时刻的模拟预编码矩阵
Figure RE-GDA0003120919870000037
和t时刻的模拟合并矩阵
Figure RE-GDA0003120919870000038
计算t时刻的数字合并矩阵:
Figure RE-GDA0003120919870000039
其中,Y(t)是t时刻的接收信号矢量的协方差矩阵,
Figure RE-GDA00031209198700000310
是t时刻的接收端全数字最小均方误差合并矩阵,采用下式计算
Figure RE-GDA00031209198700000311
Figure RE-GDA00031209198700000312
ρ是平均发射功率,
Figure RE-GDA00031209198700000313
是噪声方差,
Figure RE-GDA00031209198700000314
表示NR×NR的单位矩阵,
Figure RE-GDA00031209198700000315
表示 Ns×Ns的单位矩阵,利用下式计算t时刻的频谱效率:
Figure RE-GDA00031209198700000316
其中,
Figure RE-GDA00031209198700000317
det(·)表示行列式,令智能体a的奖励函数r(t)=R(t),并得到t+1时刻状态:
Figure RE-GDA00031209198700000318
步骤五、若|R(t)-R(t-1)|≤ε,或者t>L,则停止迭代,并转到步骤九,其中ε和 L是预先设定的判断收敛性的指标;否则,进入步骤六;
步骤六、将<s(t),a(t),r(t),s(t+1)>作为样本存入经验池中,若经验池已存满,则用该样本<s(t),a(t),r(t),s(t+1)>替换最先存入的样本。判断是否满足t≥M,其中M 表示从经验池D中采样的批量大小,若满足则进入步骤七,否则令t=t+1并转至步骤三;
步骤七、智能体a将状态-动作对(s(t),a(t))输入评价现实网络C中,输出评价值 QC(s(t),a(t)),其中QC(·,·)表示评价现实网络C所对应的函数。从经验池D中采样批量大小为M的样本ε={e1,....,eM},其中
Figure RE-GDA0003120919870000041
ti表示第i个采样样本所对应的时刻,智能体通过随机梯度下降来更新网络A和C的参数,其损失函数分别为:
Figure RE-GDA0003120919870000042
Figure RE-GDA0003120919870000043
其中,θA表示动作现实网络A的参数,θC表示评价现实网络C的参数,
Figure RE-GDA0003120919870000044
其中,γ∈[0,1]为预先设定的折扣因子,QC(·,·)表示评价目标网络C′所对应的函数, A′(·)表示动作目标网络A′所对应的函数;
步骤八、对目标网络A′和C′进行软更新,即:
θA′=τθA+(1-τ)θA′
θC′=τθC+(1-τ)θC′
其中,θA′表示动作目标网络的参数,θC′表示评价目标网络的参数,τ<<1,令t=t+1;
步骤九、将当前时刻t的模拟预编码矩阵
Figure RE-GDA0003120919870000045
数字预编码矩阵
Figure RE-GDA0003120919870000046
模拟合并矩阵
Figure RE-GDA0003120919870000047
数字合并矩阵
Figure RE-GDA0003120919870000048
作为混合预编码矩阵和混合合并矩阵。
进一步地,所述的动作现实网络A,动作目标网络A′,评价现实网络C和评价目标网络C′均包含四个全连接层,前三层全连接层之后各有一个激活函数ReLU,A和A′最后一个全连接层之后的激活函数为Tanh,C和C′最后一个全连接层之后没有激活函数。
进一步地,所述步骤一、步骤七和步骤八中的动作现实网络A、动作目标网络A′、评价现实网络C、评价目标网络C′的参数包括全连接层的权重以及偏置。
有益效果:
(1)本方法适用于毫米波大规模MIMO下行传输系统,计算复杂度低,能够取得较高的频谱效率。
(2)相较于基于深度学习的方法,本方法可以使用前期产生的样本来训练智能体,无需大量数据用于离线训练。
附图说明
图1是本发明方法使用深度强化学习智能体设计模拟预编码矩阵和模拟合并矩阵的流程图。
图2是本发明方法所涉及深度强化学习智能体学习模拟预编码矩阵和模拟合并矩阵的示意图。
具体实施方式
下面结合说明书附图对本发明作更进一步的说明。
如图1所示的使用深度强化学习智能体设计模拟预编码矩阵和模拟合并矩阵的流程图,考虑一个毫米波大规模MIMO下行链路,基站按如下步骤进行混合波束成形设计:
步骤一、t=0时刻,考虑毫米波大规模MIMO系统,基站配备NT=64根天线,将Ns=6个数据流发送给配备NR=16根天线的用户,发送端具有
Figure RE-GDA0003120919870000051
条射频链路,接收端具有
Figure RE-GDA0003120919870000052
条射频链路,基站已知其与用户间的信道矩阵H,初始化用于生成模拟预编码矩阵和模拟合并矩阵的深度强化学习智能体a,随机生成初始模拟预编码矩阵
Figure RE-GDA0003120919870000053
和模拟合并矩阵
Figure RE-GDA0003120919870000054
并令t=t+1;
如图2所示的深度强化学习智能体学习模拟预编码矩阵和模拟合并矩阵的示意图,所述深度强化学习智能体a包括:动作现实网络A、动作目标网络A′、评价现实网络C、评价目标网络C′和一个容量为ND=5000的经验池D,经验池中存放智能体学习的样本,动作现实网络A和动作目标网络A′根据当前环境状态输出当前最佳动作,其输入是
Figure RE-GDA0003120919870000061
的向量,输出是
Figure RE-GDA0003120919870000062
的向量,评价现实网络C和评价目标C′根据当前状态-动作对输出该状态-动作对的价值函数,其输入是
Figure RE-GDA0003120919870000063
的向量,输出是标量,A′与C′的网络结构分别与A和C的网络结构相同,A′与C′的网络参数均是每隔固定时隙通过A和C的网络参数软更新得到;
步骤二、在t时刻,令当前环境状态为:
Figure RE-GDA0003120919870000064
其中,
Figure RE-GDA0003120919870000065
表示t-1时刻所得的模拟预编码矩阵,
Figure RE-GDA0003120919870000066
表示t-1时刻所得的模拟合并矩阵,vec(·)表示将矩阵列向量化,(·)T表示转置,arg(·)表示取相位;
步骤三、将状态s(t)输入网络A,得到动作A(s(t)),其中A(·)表示网络A的函数,然后加上服从标准正态分布的噪声矢量
Figure RE-GDA0003120919870000067
其中
Figure RE-GDA0003120919870000068
得到t时刻动作a(t)=A(s(t))+n(t),并根据下式的对应关系生成t时刻的模拟预编码矩阵
Figure RE-GDA0003120919870000069
和模拟合并矩阵
Figure RE-GDA00031209198700000610
Figure RE-GDA00031209198700000611
步骤四、利用t时刻的模拟预编码矩阵
Figure RE-GDA00031209198700000612
和模拟合并矩阵
Figure RE-GDA00031209198700000613
求得相应等效信道矩阵
Figure RE-GDA00031209198700000614
并对其做奇异值分解
Figure RE-GDA00031209198700000615
其中 (·)H表示共轭转置,
Figure RE-GDA00031209198700000616
是一个
Figure RE-GDA00031209198700000617
的酉矩阵,
Figure RE-GDA00031209198700000618
是一个
Figure RE-GDA00031209198700000619
的对角矩阵,对角线上的奇异值按照降序排列,
Figure RE-GDA00031209198700000620
是一个
Figure RE-GDA00031209198700000621
的酉矩阵,rank(·)表示矩阵的秩,进而得到t时刻的数字预编码矩阵
Figure RE-GDA00031209198700000622
其中V(t)
Figure RE-GDA00031209198700000623
的前Ns列构成的矩阵,||·||F表示Frobenius范数。利用信道矩阵H、t时刻的数字预编码矩阵
Figure RE-GDA00031209198700000624
t时刻的模拟预编码矩阵
Figure RE-GDA00031209198700000625
和t时刻的模拟合并矩阵
Figure RE-GDA00031209198700000626
计算t时刻的数字合并矩阵:
Figure RE-GDA00031209198700000627
其中,Y(t)是t时刻的接收信号矢量的协方差矩阵,
Figure RE-GDA0003120919870000071
是t时刻的接收端全数字最小均方误差合并矩阵,采用下式计算:
Figure RE-GDA0003120919870000072
Figure RE-GDA0003120919870000073
ρ是平均发射功率,
Figure RE-GDA0003120919870000074
是噪声方差,
Figure RE-GDA0003120919870000075
表示NR×NR的单位矩阵,
Figure RE-GDA0003120919870000076
表示 Ns×Ns的单位矩阵,利用下式计算t时刻的频谱效率:
Figure RE-GDA0003120919870000077
其中,
Figure RE-GDA0003120919870000078
det(·)表示行列式。令智能体a的奖励函数r(t)=R(t),并得到t+1时刻状态:
Figure RE-GDA0003120919870000079
步骤五、若|R(t)-R(t-1)|≤0.0001,或者t>320,则停止迭代,并转到步骤九;否则,进入步骤六;
步骤六、将<s(t),a(t),r(t),s(t+1)>作为样本存入经验池中,若经验池已存满,则用该样本<s(t),a(t),r(t),s(t+1)>替换最先存入的样本。判断是否满足t≥M,其中M=32表示从经验池D中采样的批量大小,若满足则进入步骤七,否则令t=t+1并转至步骤三;
步骤七、智能体a将状态-动作对(s(t),a(t))输入评价现实网络C中,输出评价值 QC(s(t),a(t)),其中QC(·,·)表示评价现实网络C所对应的函数,从经验池D中采样批量大小为M=32的样本ε={e1,...,eM},其中
Figure RE-GDA00031209198700000710
ti表示第i个采样样本所对应的时刻,智能体通过随机梯度下降来更新网络A和C的参数,其损失函数分别为
Figure RE-GDA0003120919870000081
Figure RE-GDA0003120919870000082
其中,θA表示动作现实网络A的参数,θC表示评价现实网络C的参数,
Figure RE-GDA0003120919870000083
其中,γ=0.95为预先设定的折扣因子,QC′(·,·)表示评价目标网络C′所对应的函数,A′(·)表示动作目标网络A′所对应的函数:
步骤八、对目标网络A′和C′进行软更新,即:
θA′=τθA+(1-τ)θA′
θC′=τθC+(1-τ)θC′
其中,θA′表示动作目标网络的参数,θC′表示评价目标网络的参数,τ=0.001,令 t=t+1;
步骤九、将当前时刻t的模拟预编码矩阵
Figure RE-GDA0003120919870000084
数字预编码矩阵
Figure RE-GDA0003120919870000085
模拟合并矩阵
Figure RE-GDA0003120919870000086
数字合并矩阵
Figure RE-GDA0003120919870000087
作为混合预编码矩阵和混合合并矩阵。
所述的动作现实网络A,动作目标网络A′,评价现实网络C和评价目标网络C′均包含四个全连接层,前三层全连接层之后各有一个激活函数ReLU,A和A′最后一个全连接层之后的激活函数为Tanh,C和C′最后一个全连接层之后没有激活函数。
所述步骤一、步骤七和步骤八中的动作现实网络A、动作目标网络A′、评价现实网络C、评价目标网络C′的参数包括全连接层的权重以及偏置。
综上,本发明在时间复杂度和系统性能上均超过传统的毫米波大规模MIMO混合预编码设计方法,深度强化学习智能体能够通过与环境的交互学习,得到逼近最优的模拟预编码矩阵和模拟合并合并矩阵,对于信道的变化具有较强的鲁棒性,能够实现较高的频谱效率。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (3)

1.一种毫米波大规模MIMO智能混合波束成形设计方法,其特征在于,包括以下步骤:
步骤一、t=0时刻,考虑毫米波大规模MIMO系统,基站配备NT根天线,将Ns个数据流发送给配备NR根天线的用户,发送端具有
Figure FDA0003120919860000011
条射频链路,
Figure FDA0003120919860000012
接收端具有
Figure FDA0003120919860000013
条射频链路,
Figure FDA0003120919860000014
基站已知其与用户间的信道矩阵H,初始化用于生成模拟预编码矩阵和模拟合并矩阵的深度强化学习智能体a,随机生成初始模拟预编码矩阵
Figure FDA0003120919860000015
和模拟合并矩阵
Figure FDA0003120919860000016
并令t=t+1;
所述深度强化学习智能体a包括:动作现实网络A、动作目标网络A′、评价现实网络C、评价目标网络C′和一个容量为ND的经验池D,经验池中存放智能体学习的样本,动作现实网络A和动作目标网络A′根据当前环境状态输出当前最佳动作,其输入是
Figure FDA0003120919860000017
的向量,输出是
Figure FDA0003120919860000018
的向量,评价现实网络C和评价目标网络C′根据当前状态-动作对输出该状态-动作对的价值函数,其输入是
Figure FDA0003120919860000019
的向量,输出是标量,A′与C′的网络结构分别与A和C的网络结构相同,A′与C′的网络参数均是每隔固定时隙通过A和C的网络参数软更新得到;
步骤二、在t时刻,令当前环境状态为:
Figure FDA00031209198600000110
其中,
Figure FDA00031209198600000111
表示t-1时刻所得的模拟预编码矩阵,
Figure FDA00031209198600000112
表示t-1时刻所得的模拟合并矩阵,vec(·)表示将矩阵列向量化,(·)T表示转置,arg(·)表示取相位;
步骤三、将状态s(t)输入动作现实网络A,得到动作A(s(t)),其中A(·)表示网络A的函数,然后加上服从标准正态分布的噪声矢量
Figure FDA00031209198600000113
其中
Figure FDA00031209198600000114
得到t时刻动作a(t)=A(s(t))+n(t),并根据下式的对应关系生成t时刻的模拟预编码矩阵
Figure FDA00031209198600000115
和模拟合并矩阵
Figure FDA00031209198600000116
Figure FDA00031209198600000117
步骤四、利用t时刻的模拟预编码矩阵
Figure FDA00031209198600000118
和模拟合并矩阵
Figure FDA00031209198600000119
求得相应等效信道矩阵
Figure FDA0003120919860000021
并对其做奇异值分解
Figure FDA0003120919860000022
其中(·)H表示共轭转置,
Figure FDA0003120919860000023
是一个
Figure FDA0003120919860000024
的酉矩阵,
Figure FDA0003120919860000025
是一个
Figure FDA0003120919860000026
的对角矩阵,对角线上的奇异值按照降序排列,
Figure FDA0003120919860000027
是一个
Figure FDA0003120919860000028
的酉矩阵,rank(·)表示矩阵的秩,进而得到t时刻的数字预编码矩阵
Figure FDA0003120919860000029
其中V(t)
Figure FDA00031209198600000210
的前Ns列构成的矩阵,||·||F表示Frobenius范数,利用信道矩阵H、t时刻的数字预编码矩阵
Figure FDA00031209198600000211
t时刻的模拟预编码矩阵
Figure FDA00031209198600000212
和t时刻的模拟合并矩阵
Figure FDA00031209198600000213
计算t时刻的数字合并矩阵:
Figure FDA00031209198600000214
其中,Y(t)是t时刻的接收信号矢量的协方差矩阵,
Figure FDA00031209198600000215
是t时刻的接收端全数字最小均方误差合并矩阵,采用下式计算:
Figure FDA00031209198600000216
Figure FDA00031209198600000217
ρ是平均发射功率,
Figure FDA00031209198600000218
是噪声方差,
Figure FDA00031209198600000219
表示NR×NR的单位矩阵,
Figure FDA00031209198600000220
表示Ns×Ns的单位矩阵,利用下式计算t时刻的频谱效率:
Figure FDA00031209198600000221
其中,
Figure FDA00031209198600000222
det(·)表示行列式,令智能体a的奖励函数r(t)=R(t),并得到t+1时刻状态:
Figure FDA00031209198600000223
步骤五、若|R(t)-R(t-1)|≤ε,或者t>L,则停止迭代,并转到步骤九,其中ε和L是预先设定的判断收敛性的指标;否则,进入步骤六;
步骤六、将<s(t),a(t),r(t),s(t+1)>作为样本存入经验池中,若经验池已存满,则用该样本<s(t),a(t),r(t),s(t+1)>替换最先存入的样本,判断是否满足t≥M,其中M表示从经验池D中采样的批量大小,若满足则进入步骤七,否则令t=t+1并转至步骤三;
步骤七、智能体a将状态-动作对(s(t),a(t))输入评价现实网络C中,输出评价值QC(s(t),a(t)),其中QC(·,·)表示评价现实网络C所对应的函数,从经验池D中采样批量大小为M的样本ε={e1,...,eM},其中
Figure FDA0003120919860000031
ti表示第i个采样样本所对应的时刻,智能体通过随机梯度下降来更新网络A和C的参数,其损失函数分别为:
Figure FDA0003120919860000032
Figure FDA0003120919860000033
其中,θA表示动作现实网络A的参数,θC表示评价现实网络C的参数,
Figure FDA0003120919860000034
其中,γ∈[0,1]为预先设定的折扣因子,QC′(·,·)表示评价目标网络C′所对应的函数,A′(·)表示动作目标网络A′所对应的函数;
步骤八、对目标网络A′和C′进行软更新,即:
θA′=τθA+(1-τ)θA′
θC′=τθC+(1-τ)θC′
其中,θA′表示动作目标网络的参数,θC′表示评价目标网络的参数,τ<<1,令t=t+1;
步骤九、将当前时刻t的模拟预编码矩阵
Figure FDA0003120919860000035
数字预编码矩阵
Figure FDA0003120919860000036
模拟合并矩阵
Figure FDA0003120919860000037
数字合并矩阵
Figure FDA0003120919860000038
作为混合预编码矩阵和混合合并矩阵。
2.根据权利要求1所述一种毫米波大规模MIMO智能混合波束成形设计方法,其特征在于:所述的动作现实网络A,动作目标网络A′,评价现实网络C和评价目标网络C′均包含四个全连接层,前三层全连接层之后各有一个激活函数ReLU,A和A′最后一个全连接层之后的激活函数为Tanh,C和C′最后一个全连接层之后没有激活函数。
3.根据权利要求1所述毫米波大规模MIMO智能混合波束成形设计方法,其特征在于:所述步骤一、步骤七和步骤八中的动作现实网络A、动作目标网络A′、评价现实网络C、评价目标网络C′的参数包括全连接层的权重以及偏置。
CN202110480431.2A 2021-04-30 2021-04-30 毫米波大规模mimo智能混合波束成形设计方法 Active CN113193893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110480431.2A CN113193893B (zh) 2021-04-30 2021-04-30 毫米波大规模mimo智能混合波束成形设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110480431.2A CN113193893B (zh) 2021-04-30 2021-04-30 毫米波大规模mimo智能混合波束成形设计方法

Publications (2)

Publication Number Publication Date
CN113193893A CN113193893A (zh) 2021-07-30
CN113193893B true CN113193893B (zh) 2022-04-29

Family

ID=76983128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110480431.2A Active CN113193893B (zh) 2021-04-30 2021-04-30 毫米波大规模mimo智能混合波束成形设计方法

Country Status (1)

Country Link
CN (1) CN113193893B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113922853B (zh) * 2021-09-17 2024-06-04 南京慧尔视智能科技有限公司 一种mimo雷达的波束成形方法、系统和设备
CN113839697B (zh) * 2021-09-23 2022-06-28 南通大学 一种基于深度学习的联合反馈和混合预编码设计方法
CN114866119B (zh) * 2022-04-15 2023-09-26 电子科技大学长三角研究院(湖州) 一种非完美信道状态信息条件下的混合波束成形方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107135024B (zh) * 2017-05-12 2020-08-28 西安交通大学 一种低复杂度的混合波束赋形迭代设计方法
CN110099016B (zh) * 2019-05-14 2022-05-31 东南大学 一种基于深度学习网络的毫米波稀疏阵面信道估计方法
CN110557177A (zh) * 2019-09-05 2019-12-10 重庆邮电大学 毫米波大规模MIMO系统中基于DenseNet的混合预编码方法
CN111181619B (zh) * 2020-01-03 2022-05-13 东南大学 基于深度强化学习的毫米波混合波束成形设计方法

Also Published As

Publication number Publication date
CN113193893A (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN113193893B (zh) 毫米波大规模mimo智能混合波束成形设计方法
CN111181619B (zh) 基于深度强化学习的毫米波混合波束成形设计方法
CN111092641B (zh) 基于毫米波mimo系统深度学习的混合预编码设计方法
CN113411110B (zh) 一种基于深度强化学习的毫米波通信波束训练方法
CN111917447A (zh) 基于波束选择的低频辅助混合预编码设计方法
CN103763782B (zh) 一种mu‑mimo下行链路基于加权用户相关的公平调度方法
CN109714091B (zh) 一种在毫米波mimo系统中基于分层设计的迭代混合预编码方法
CN110011712B (zh) 一种面向毫米波大规模多输入多输出的混合预编码方法
CN110365388B (zh) 一种低复杂度毫米波多播波束成形方法
CN112929075B (zh) 一种适用于低轨卫星通信的混合预编码方法
CN110138427A (zh) 基于部分连接的大规模多输入多输出混合波束赋形算法
WO2024164448A1 (zh) 基于主被动混合智能超表面的无线通信传输方法及系统
CN114465643B (zh) 一种基于梯度下降法的毫米波大规模mimo天线系统的混合预编码方法
CN110719127B (zh) 一种具有恒模约束的毫米波mimo系统波束成形方法
CN114204971A (zh) 一种迭代的聚合波束成形设计和用户设备选择方法
CN117560043A (zh) 一种基于图神经网络的无蜂窝网络功率控制方法
CN117240331A (zh) 一种基于图神经网络的无蜂窝网络下行预编码设计方法
CN115426013B (zh) 基于无监督学习的ris辅助通信系统预编码与相移方法
CN112398513A (zh) 一种massive MIMO系统的波束赋形方法
Huang et al. Self-attention reinforcement learning for multi-beam combining in mmWave 3D-MIMO systems
CN114745032B (zh) 一种无蜂窝大规模mimo智能分布式波束选择方法
CN114665929B (zh) 基于动态连接结构的混合预编码方法及mimo系统
CN114285443B (zh) 动态超表面天线辅助的近场宽带上行mimo传输方法
CN105610476B (zh) 分离型数模混合收发通信系统中的模拟波束矢量优化方法
Jiang et al. Deep learning assisted hybrid precoding with dynamic subarrays in mmWave MU-MIMO system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant