CN110912598B - 基于长短时注意力机制的大规模mimo系统csi反馈方法 - Google Patents

基于长短时注意力机制的大规模mimo系统csi反馈方法 Download PDF

Info

Publication number
CN110912598B
CN110912598B CN201911154769.8A CN201911154769A CN110912598B CN 110912598 B CN110912598 B CN 110912598B CN 201911154769 A CN201911154769 A CN 201911154769A CN 110912598 B CN110912598 B CN 110912598B
Authority
CN
China
Prior art keywords
csinet
model
alstm
layer
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911154769.8A
Other languages
English (en)
Other versions
CN110912598A (zh
Inventor
张爱华
李琪
宁冰
李春雷
贺博鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongyuan University of Technology
Original Assignee
Zhongyuan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongyuan University of Technology filed Critical Zhongyuan University of Technology
Priority to CN201911154769.8A priority Critical patent/CN110912598B/zh
Publication of CN110912598A publication Critical patent/CN110912598A/zh
Application granted granted Critical
Publication of CN110912598B publication Critical patent/CN110912598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0619Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal using feedback from receiving side
    • H04B7/0621Feedback content
    • H04B7/0626Channel coefficients, e.g. channel state information [CSI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • H04B7/0417Feedback systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0619Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal using feedback from receiving side
    • H04B7/0658Feedback reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Radio Transmission System (AREA)

Abstract

本发明提出了一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法,其步骤为:首先,利用COST 2100信道模型产生空频域信道矩阵的样本数据,并通过离散傅里叶变换和截断操作对样本数据进行预处理得训练集和测试集;其次,利用LSTM和注意力机制搭建ALSTM‑CsiNet信道状态信息反馈重建模型;然后将训练集输入ALSTM‑CsiNet信道状态信息反馈重建模型,采用均方误差和自适应估计梯度下降算法对模型进行迭代训练,获取优化的ALSTM‑CsiNet模型;最后,将测试集直接输入ALSTM‑CsiNet模型进行信道状态信息重建。本发明采用LSTM学习信道的时间相关性,并利用注意力机制感知局部信息和自动加权特征信息,提高了信道反馈精度。

Description

基于长短时注意力机制的大规模MIMO系统CSI反馈方法
技术领域
本发明涉及宽带无线通信技术领域,特别是指一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法。
背景技术
近年来,大规模MIMO(multiple-input multiple-out)技术被学术界和工业界认定为下一代网络的关键技术,该技术通过在基站和用户端配置成百上千根天线,在空间域形成多个独立传输信道,从而大幅提高了系统能效、系统容量以及系统鲁棒性。大规模MIMO系统潜在的增益主要依赖准确的下行链路的CSI(Channel State Information),并通过预编码来消除多用户间的干扰。目前,采用FDD(frequency division duplexity)方式的MIMO系统中,下行链路信道状态信息是在用户端获得,通过反馈链路返回到基站端。然而,随着天线数量的增加,上行信道反馈开销急剧增加以致难以在实际中实施。因此,如何在实际应用中降低CSI的反馈开销是大规模MIMO通信系统中的一项关键技术。
传统的矢量量化或基于码本的方法一定程度上地减少了反馈开销。然而,这种方法降低了信道反馈的准确性,并且产生的反馈量需要与发射天线的数量线性缩放,此思路不适于在大规模MIMO系统中应用。
随着DL(Deep Learning)理论的日益成熟,研究者们已将其成功应用于无线通信领域。文献[Wen C K,Shih W T,Jin S.Deep Learning for Massive MIMO CSI Feedback[J].IEEE Wireless Communications Letters,2018:1-1.]提供了一种名为CsiNet的自动编码器:编码器对特征向量进行压缩,解码器对信息进行解压,恢复CSI。然而,在CsiNet中,FCN(Fully connected network)作为压缩和解压模块没有充分利用时变信道的时间相关特性。文献[Wang T,Wen C K,Jin S,et al.Deep Learning-based CSI FeedbackApproach for Time-Varying Massive MIMO Channels[J].IEEE WirelessCommunications Letters,2018:1-1.]提出的LSTM-CsiNet方案,挖掘了信道的时间相关特性,显著地提高了信道反馈的准确性,但网络训练参数的增加使反馈网络模型更加复杂化。
发明内容
针对上述背景技术中存在的不足,本发明提出了一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法,解决了现有MIMO系统中的编码方法的信道反馈精度低、网络模型复杂的技术问题。
本发明的技术方案是这样实现的:
一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法,其步骤如下:
S1、利用COST 2100信道模型产生空频域信道矩阵的样本数据
Figure GDA0002582587520000021
通过离散傅里叶变换和截断操作对样本数据
Figure GDA0002582587520000022
进行预处理,得到数据集H,其中,数据集H包括训练集和测试集;
S2、利用长短期记忆(LSTM)和注意力机制对CsiNet自动编码器进行改进,搭建ALSTM-CsiNet信道状态信息反馈重建模型;
S3、将步骤S1得到的训练集输入ALSTM-CsiNet信道状态信息反馈重建模型,采用均方误差算法检测预测值与实际值的误差,并利用自适应估计梯度下降算法对模型进行迭代训练优化,获取优化的ALSTM-CsiNet模型;
S4、在用户端,将测试集直接输入ALSTM-CsiNet模型的编码器单元,得到压缩的特征,经过反馈链路传输,在基站端,压缩的特征经ALSTM-CsiNet模型的解码器单元解压缩恢复出信道状态信息。
所述步骤S1中通过离散傅里叶变换和截断操作对样本数据
Figure GDA0002582587520000023
进行预处理,得到数据集H的方法为:利用离散傅里叶变换对样本数据
Figure GDA0002582587520000024
进行稀疏化,再通过截断操作删除稀疏化后的样本数据的零元素得到数据集H,其中,
Figure GDA0002582587520000025
C为复数矩阵,
Figure GDA0002582587520000026
为OFDM子载波个数,Nt为基站端配置天线个数,Nc为截断操作后所保留长度。
所述ALSTM-CsiNet信道状态信息反馈重建模型包括特征提取模块、特征压缩模块、特征解压模块和信道恢复模块;
所述特征提取模块:将数据集H的实数和复数分开构造为维度为Nc×Nt×2的矩阵,经过深度卷积网络I得到大小为Nc×Nt×2特征矩阵;
所述特征压缩模块:将Nc×Nt×2特征矩阵转化为向量l∈RN×1,将向量l∈RN×1分别输入第一全连接网络(FCN)模块和第一LSTM-attention模块后的输出进行融合,获得压缩向量s∈RM×1,其中,N=2NtNc,压缩率为r=M/N;
所述特征解压模块:将压缩向量s∈RM×1分别输入第二LSTM-attention模块和第二FCN模块后的特征进行融合得到解压缩向量
Figure GDA0002582587520000027
所述信道恢复模块:将解压缩向量
Figure GDA0002582587520000028
转化为维度为Nc×Nt×2的矩阵,经过两个Refine网络和深度卷积网络II得到估计矩阵
Figure GDA0002582587520000029
所述深度卷积网络I的结构为:卷积层I-正则化层I-RelyRelu激活函数I,所述深度卷积网络II的结构为:卷积层II-正则化层II-Sigmoid激活层,Refine网络的结构为:卷积层III-正则化层III-RelyRelu激活函数II-卷积层IV-正则化层IV-RelyRelu激活函数III-卷积层V-正则化层V-信息融合层。
所述卷积层I、卷积层II和卷积层V的维度均为3×3×2;所述卷积层III的维度为3×3×8;所述卷积层IV的维度为3×3×16。
所述步骤S3中优化的ALSTM-CsiNet模型的获取方法为:
S31、设置步长ε、矩估计的指数衰减速率ρ1和ρ2、稳定数值的常数δ和最大迭代步数tmax
S32、初始化训练参数θ,初始化一阶矩变量κ=0和二阶矩变量r=0,初始化时间步t=0,其中,训练参数θ包括训练参数θe和训练参数θd
S33、从训练集中随机选取m个样本{H(1),…,H(m)}输入ALSTM-CsiNet信道状态信息反馈重建模型,输出m个样本的预测值,并计算预测值与实际值的误差:
Figure GDA0002582587520000031
其中,i=1,2,…,m,fd(fe(Hie),θd)为第i个样本的预测值,fd(·)表示解码器,fe(·)表示编码器,Hi为第i个样本的真实值;
S34、根据步骤S33中预测值与实际值的误差计算m个样本的梯度:
Figure GDA0002582587520000032
S35、根据步骤S34中的梯度更新一阶矩变量和二阶矩变量:κ←ρ1κ+(1-ρ1)g,r←ρ2r+(1-ρ2)g⊙g;
S36、计算一阶矩变量和二阶矩变量的偏差:
Figure GDA0002582587520000033
S37、根据一阶矩变量和二阶矩变量的偏差更新训练参数θ:
Figure GDA0002582587520000034
S38、循环执行步骤S33至步骤S37,直至达到最大迭代次数tmax时结束迭代,保存最后一次迭代更新的训练参数θ,获取优化的ALSTM-CsiNet模型。
所述步骤S2中的LSTM包括遗忘门、输入门和输出门,且LSTM表示为:
Figure GDA0002582587520000035
其中,σ为logistic sigmoid函数,ft为时间步t的遗忘门,it为时间步t的输入门,ot为时间步t的输出门,ct为时间步t的记忆单元,ct-1时间步t-1的记忆单元,at为时间步t的隐藏层,Wl*={Wlf,Wli,Wla,Wlo}和Wm*={Wmf,Wmi,Wma,Wmo}均为相应门的权重,bf、bi、bo、ba均为偏置,
Figure GDA0002582587520000041
为Hadamard乘积,lt为时间步t的LSTM的输入,mt为时间步t的LSTM的输出,mt-1为时间步t-1的LSTM的输出。
所述步骤S2中的注意力机制的核心为全连接层和softmax激活函数,且注意力机制的表示为
Figure GDA0002582587520000042
其中,(s2)i为注意力机制输出序列中的位置i相对应的值,j=1,2,…,T,T为时间长度,mj为LSTM的第j步输出,
Figure GDA0002582587520000043
为输出mj的概率分布拟合能力,
Figure GDA0002582587520000044
为全连接层完成的对齐模型,
Figure GDA0002582587520000045
为权重。
本技术方案能产生的有益效果:
1)本发明将深度神经网络引用CSI反馈,避免了传统方法中大量的迭代计算,从而减少计算复杂度;
2)本发明将LSTM用于学习信道的时间相关特性,并将注意力机制的自动加权能力提高信息的表征能力,有效地提升了信道反馈的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的算法网络框图;
图2为本发明的压缩和解压缩中LSTM-attention模块框图;
图3为本发明实施例针对室内场景基于本发明方法和LASSO、CS-CsiNet、CsiNet方法的NMSE性能对比结果;
图4为本发明实施例针对室外场景基于本发明方法和LASSO、CS-CsiNet、CsiNet方法的NMSE性能对比结果;
图5为本发明实施例针对室内场景基于本发明方法和LASSO、CS-CsiNet、CsiNet、TVAL3方法的余弦相似性性能对比结果;
图6为本发明实施例针对室外场景基于本发明方法和LASSO、CS-CsiNet、CsiNet、TVAL3方法的余弦相似性性能对比结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法,在大量的数据集基础上,用户端将信道状态信息压缩成低维度码字,通过上行链路反馈给基站,基站端通过解压缩恢复CSI,具体步骤如下:
S1、利用文献[Liu L,Poutanen J,
Figure GDA0002582587520000051
Quitin,et al.The COST 2100 MIMOchannel model[J].IEEE Wireless Communications,2012,19(6):92-99.]提出的COST2100信道模型产生空频域信道矩阵的样本数据
Figure GDA0002582587520000052
通过离散傅里叶变换和截断操作对样本数据
Figure GDA0002582587520000053
进行预处理,利用离散傅里叶变换对样本数据
Figure GDA0002582587520000054
进行稀疏化,再通过截断操作删除稀疏化后的样本数据的零元素得到数据集H,其中,数据集H包括训练集和测试集,
Figure GDA0002582587520000055
C表示复数矩阵,
Figure GDA0002582587520000056
表示OFDM子载波个数,Nt为基站端配置天线个数,Nc为截断操作后所保留的长度。
在MIMO频分双工系统的下行链路中,设定基站端配置Nt=32根天线,用户端配置单根天线,另外系统采用子载波个数为
Figure GDA0002582587520000057
的OFDM调制方式。采用COST 2100信道模型分别在5.3GHZ的微蜂窝网和300MHZ的乡村两种场景下,产生空频域信道矩阵训练样本集100000个、验证样本集30000个以及检测样本集20000个。此外对所采集到的数据集进行DFT变换操作得到稀疏矩阵
Figure GDA0002582587520000058
Figure GDA0002582587520000059
其中Rd∈C1024×1024和Ra∈C32×32是DFT矩阵。因为多径到达时间之间的延迟在有限的的时间范围内,所以在延迟域上,稀疏矩阵H只有在前Nc=32行是非零值,因此只保留前32行,即得到H∈C32×32,则Nt=32。
S2、利用LSTM(Long Short-Term Memory)和注意力机制对CsiNet自动编码器进行改进,搭建ALSTM-CsiNet信道状态信息反馈重建模型;所述ALSTM-CsiNet信道状态信息反馈重建模型包括特征提取模块、特征压缩模块、特征解压模块和信道恢复模块;所述特征提取模块:将数据集H的实数和复数分开构造为维度为Nc×Nt×2的矩阵,输入用户端的编码器,经过深度卷积网络I得到Nc×Nt×2特征矩阵;所述特征压缩模块:将Nc×Nt×2特征矩阵转化为向量l∈RN×1,将向量l∈RN×1分别输入第一FCN模块和第一LSTM-attention模块后的输出进行融合,获得压缩向量s∈RM×1,再将压缩向量s∈RM×1通过反馈链路反馈给基站的编码器,其中,N=2NtNc,压缩率为r=M/N,M表示编码压缩后的长度。其中,第一FCN模块加快了收敛速度,缓解梯度消失问题,第一LSTM-attention模块中LSTM可以学习信道之间的时间相关性,注意力机制利用自动加权增强特征信息的表征能力。所述特征解压模块:将压缩向量s∈RM×1分别输入第二LSTM-attention模块和第二FCN模块后的特征进行融合得到解压缩向量
Figure GDA0002582587520000061
所述信道恢复模块:将解压缩向量
Figure GDA0002582587520000062
转化为维度为Nc×Nt×2的矩阵,经过两个Refine网络和深度卷积网络II得到估计矩阵
Figure GDA0002582587520000063
所述LSTM-attention模块如图2所示,LSTM学习时间相关性和注意力机制自动加权的能力增强了ALSTM-CsiNet网络信道重建精度。
所述深度卷积网络I的结构为:卷积层I-正则化层I-RelyRelu激活函数I,所述深度卷积网络II的结构为:卷积层II-正则化层II-Sigmoid激活层,Refine网络的结构为:卷积层III-正则化层III-RelyRelu激活函数II-卷积层IV-正则化层IV-RelyRelu激活函数III-卷积层V-正则化层V-信息融合层;且所述卷积层I、卷积层II和卷积层V的维度均为3×3×2;所述卷积层III的维度为3×3×8;所述卷积层IV的维度为3×3×16。
所述LSTM包括遗忘门、输入门和输出门,且LSTM表示为:
Figure GDA0002582587520000064
其中,σ为logistic sigmoid函数,ft为时间步t的遗忘门,it为时间步t的输入门,ot为时间步t的输出门,ct为时间步t的记忆单元,ct-1时间步t-1的记忆单元,at为时间步t的隐藏层,Wl*={Wlf,Wli,Wla,Wlo}和Wm*={Wmf,Wmi,Wma,Wmo}均为相关门的权重,bf、bi、bo、ba均为偏置,
Figure GDA0002582587520000065
为Hadamard乘积,lt为时间步t的LSTM的输入,mt为时间步t的LSTM的输出,mt-1为时间步t-1的LSTM的输出。
所述注意力机制的核心为全连接层(Dense layer)和softmax激活函数,且注意力机制的表示为
Figure GDA0002582587520000066
其中,(s2)i为为注意力机制输出序列中的位置i相对应的值,j=1,2,…,T,T为时间长度,mj为LSTM的第j步输出,
Figure GDA0002582587520000067
为输出mj的概率分布拟合能力,
Figure GDA0002582587520000068
为全连接层完成的对齐模型,
Figure GDA0002582587520000069
为权重。
S3、将步骤S1得到的训练集输入ALSTM-CsiNet信道状态信息反馈重建模型,采用均方误差算法检测预测值与实际值的误差,并利用自适应估计梯度下降算法对模型进行迭代训练优化,获取优化的ALSTM-CsiNet模型;
所述步骤S3中ALSTM-CsiNet模型的优化方法为:
S31、设置步长ε=0.001、矩估计的指数衰减速率ρ1=0.9和ρ2=0.999、稳定数值的常数δ=10-8和最大迭代步数tmax=250000;
S32、初始化训练参数θ,初始化一阶矩变量κ=0和二阶矩变量r=0,初始化时间步t=0,其中,训练参数θ包括训练参数θe和训练参数θd
S33、从训练集中随机选取m=200个样本{H(1),…,H(m)}输入ALSTM-CsiNet信道状态信息反馈重建模型,输出m个样本的预测值,并计算预测值与实际值的误差:
Figure GDA0002582587520000071
其中,i=1,2,…,m,fd(fe(Hie),θd)为第i个样本的预测值,fd(·)表示解码器,fe(·)表示编码器,Hi为第i的样本的真实值;
S34、根据步骤S33中预测值与实际值的误差计算m个样本的梯度:
Figure GDA0002582587520000072
S35、根据步骤S34中的梯度更新一阶矩变量和二阶矩变量:κ←ρ1κ+(1-ρ1)g,r←ρ2r+(1-ρ2)g⊙g;
S36、计算一阶矩变量和二阶矩变量的偏差:
Figure GDA0002582587520000073
S37、根据一阶矩变量和二阶矩变量的偏差更新训练参数θ:
Figure GDA0002582587520000074
并返回步骤S33;
S38、循环执行步骤S33至步骤S37,直至遍历训练集中所有样本;
S39、时间步t+1,返回步骤S33,直至达到最大迭代次数tmax时结束迭代,保存最后一次迭代更新的训练参数θ,输出优化的ALSTM-CsiNet模型。
S4、在用户端,将测试集直接输入ALSTM-CsiNet模型的编码器单元,得到压缩的特征,经过反馈链路传输,在基站端,压缩的特征经ALSTM-CsiNet模型的解码器单元解压缩恢复出信道状态信息。
本发明实施例的运行环境包括硬件系统和软件系统,硬件系统的处理器GPU、CPU的型号均为英伟达Geforce GTX 1080 Ti;软件系统包括操作系统和操作环境,其中,操作系统为Linux,操作环境为tensorflow。基于实施例的运行环境本发明通过NMSE指标对本发明方法和LASSO、CS-CsiNet、CsiNet方法进行性能对比。其中,NMSE值越小,信道反馈精度越高。如图3所示,室内条件下,本发明方法的NMSE值比CsiNet方法的NMSE值小4dB,并且明显优于CS-CsiNet和LASSO方法。如图4所示,在室外条件下,本发明方法的NMSE值比CsiNet方法的NMSE值小2.5dB,同样优于CS-CsiNet和LASSO方法。
为了进一步验证所提算法的性能,本发明利用余弦相似度作为波束形成增益对本发明方法和LASSO、CS-CsiNet、CsiNet、TVAL3方法重构的大规模MIMO系统的信道进行对比。其中,余弦相似度值越大,信道反馈精度越高。如图5和图6所示,本发明方法的余弦相似度值平均比CsiNet方法高1.5%,并且明显高于LASSO、CS-CsiNet、TVAL3方法。其中,所述LASSO方法来源于文献[Daubechies I,Defrise M,De Mol C.An iterative thresholdingalgorithm for linear inverse problems with a sparsity constraint[J].2003.],CS-CsiNet和CsiNet方法均来源于文献[Wen C K,Shih W T,Jin S.Deep Learning forMassive MIMO CSI Feedback[J].IEEE Wireless Communications Letters,2018:1-1.],TVAL3方法来源于文献[C.Li,W.Yin,and Y.Zhang,“User’s guide for tval3:Tvminimization by augmented lagrangian and alternating direction algorithms,”CAAM report,vol.20,pp.46–47,2009]。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法,其特征在于,其步骤如下:
S1、利用COST 2100信道模型产生空频域信道矩阵的样本数据
Figure FDA0002582587510000011
通过离散傅里叶变换和截断操作对样本数据
Figure FDA0002582587510000012
进行预处理,得到数据集H,其中,数据集H包括训练集和测试集;
S2、利用长短期记忆(LSTM)和注意力机制对CsiNet自动编码器进行改进,搭建ALSTM-CsiNet信道状态信息反馈重建模型;
所述ALSTM-CsiNet信道状态信息反馈重建模型包括特征提取模块、特征压缩模块、特征解压模块和信道恢复模块;
所述特征提取模块:将数据集H的实数和复数分开构造为维度为Nc×Nt×2的矩阵,经过深度卷积网络I得到大小为Nc×Nt×2特征矩阵;
所述特征压缩模块:将Nc×Nt×2特征矩阵转化为向量l∈RN×1,将向量l∈RN×1分别输入第一全连接网络(FCN)模块和第一LSTM-attention模块后的输出进行融合,获得压缩向量s∈RM×1,其中,N=2NtNc,压缩率为r=M/N,Nt为基站端配置天线个数,Nc为截断操作后所保留长度;
所述特征解压模块:将压缩向量s∈RM×1分别输入第二LSTM-attention模块和第二FCN模块后的特征进行融合得到解压缩向量
Figure FDA0002582587510000013
所述信道恢复模块:将解压缩向量
Figure FDA0002582587510000014
转化为维度为Nc×Nt×2的矩阵,经过两个Refine网络和深度卷积网络II得到估计矩阵
Figure FDA0002582587510000015
所述步骤S2中的LSTM包括遗忘门、输入门和输出门,且LSTM表示为:
Figure FDA0002582587510000016
其中,σ为logistic sigmoid函数,ft为时间步t的遗忘门,it为时间步t的输入门,ot为时间步t的输出门,ct为时间步t的记忆单元,ct-1时间步t-1的记忆单元,at为时间步t的隐藏层,Wl*={Wlf,Wli,Wla,Wlo}和Wm*={Wmf,Wmi,Wma,Wmo}均为相应门的权重,bf、bi、bo、ba均为偏置,
Figure FDA0002582587510000017
为Hadamard乘积,lt为时间步t的LSTM的输入,mt为时间步t的LSTM的输出,mt-1为时间步t-1的LSTM的输出;
所述步骤S2中的注意力机制的核心为全连接层和softmax激活函数,且注意力机制的表示为
Figure FDA0002582587510000021
其中,(s2)i为注意力机制输出序列中的位置i相对应的值,j=1,2,…,T,T为时间长度,mj为LSTM的第j步输出,
Figure FDA0002582587510000022
为输出mj的概率分布拟合能力,
Figure FDA0002582587510000023
为全连接层完成的对齐模型,
Figure FDA0002582587510000024
为权重;
S3、将步骤S1得到的训练集输入ALSTM-CsiNet信道状态信息反馈重建模型,采用均方误差算法检测预测值与实际值的误差,并利用自适应估计梯度下降算法对模型进行迭代训练优化,获取优化的ALSTM-CsiNet模型;
所述优化的ALSTM-CsiNet模型的获取方法包括步骤S31~步骤S38:
S31、设置步长ε、矩估计的指数衰减速率ρ1和ρ2、稳定数值的常数δ和最大迭代步数tmax
S32、初始化训练参数θ,初始化一阶矩变量κ=0和二阶矩变量r=0,初始化时间步t=0,其中,训练参数θ包括训练参数θe和训练参数θd
S33、从训练集中随机选取m个样本{H(1),…,H(m)}输入ALSTM-CsiNet信道状态信息反馈重建模型,输出m个样本的预测值,并计算预测值与实际值的误差:
Figure FDA0002582587510000025
其中,i=1,2,…,m,fd(fe(Hie),θd)为第i个样本的预测值,fd(·)表示解码器,fe(·)表示编码器,Hi为第i个样本的真实值;
S34、根据步骤S33中预测值与实际值的误差计算m个样本的梯度:
Figure FDA0002582587510000026
S35、根据步骤S34中的梯度更新一阶矩变量和二阶矩变量:κ←ρ1κ+(1-ρ1)g,r←ρ2r+(1-ρ2)g⊙g;
S36、计算一阶矩变量和二阶矩变量的偏差:
Figure FDA0002582587510000027
S37、根据一阶矩变量和二阶矩变量的偏差更新训练参数θ:
Figure FDA0002582587510000028
S38、循环执行步骤S33至步骤S37,直至达到最大迭代次数tmax时结束迭代,保存最后一次迭代更新的训练参数θ,获取优化的ALSTM-CsiNet模型;
S4、在用户端,将测试集直接输入ALSTM-CsiNet模型的编码器单元,得到压缩的特征,经过反馈链路传输,在基站端,压缩的特征经ALSTM-CsiNet模型的解码器单元解压缩恢复出信道状态信息。
2.根据权利要求1所述的一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法,其特征在于,所述步骤S1中通过离散傅里叶变换和截断操作对样本数据
Figure FDA0002582587510000031
进行预处理,得到数据集H的方法为:利用离散傅里叶变换对样本数据
Figure FDA0002582587510000032
进行稀疏化,再通过截断操作删除稀疏化后的样本数据的零元素得到数据集H,其中,
Figure FDA0002582587510000033
C为复数矩阵,
Figure FDA0002582587510000034
为OFDM子载波个数。
3.根据权利要求1所述的一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法,其特征在于,所述深度卷积网络I的结构为:卷积层I-正则化层I-RelyRelu激活函数I,所述深度卷积网络II的结构为:卷积层II-正则化层II-Sigmoid激活层,Refine网络的结构为:卷积层III-正则化层III-RelyRelu激活函数II-卷积层IV-正则化层IV-RelyRelu激活函数III-卷积层V-正则化层V-信息融合层。
4.根据权利要求3所述的一种基于长短时注意力机制的大规模MIMO系统CSI反馈方法,其特征在于,所述卷积层I、卷积层II和卷积层V的维度均为3×3×2;所述卷积层III的维度为3×3×8;所述卷积层IV的维度为3×3×16。
CN201911154769.8A 2019-11-22 2019-11-22 基于长短时注意力机制的大规模mimo系统csi反馈方法 Active CN110912598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911154769.8A CN110912598B (zh) 2019-11-22 2019-11-22 基于长短时注意力机制的大规模mimo系统csi反馈方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911154769.8A CN110912598B (zh) 2019-11-22 2019-11-22 基于长短时注意力机制的大规模mimo系统csi反馈方法

Publications (2)

Publication Number Publication Date
CN110912598A CN110912598A (zh) 2020-03-24
CN110912598B true CN110912598B (zh) 2020-08-28

Family

ID=69818868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911154769.8A Active CN110912598B (zh) 2019-11-22 2019-11-22 基于长短时注意力机制的大规模mimo系统csi反馈方法

Country Status (1)

Country Link
CN (1) CN110912598B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111555781B (zh) * 2020-04-27 2022-07-12 天津大学 一种基于深度学习注意力机制的大规模mimo信道状态信息压缩及重建方法
CN113824479A (zh) * 2020-06-19 2021-12-21 株式会社Ntt都科摩 无线通信系统的终端、基站以及由终端和基站执行的方法
CN111901024B (zh) * 2020-07-29 2021-11-05 燕山大学 基于抗拟合深度学习的mimo信道状态信息反馈方法
CN112564881A (zh) * 2020-12-01 2021-03-26 国网安徽省电力有限公司 基于长短时多门限信道状态预测的5g通信自适应传输方法
CN113112819B (zh) * 2021-03-26 2022-10-25 华南理工大学 一种基于改进lstm的图卷积交通速度预测方法
CN113346966A (zh) * 2021-05-27 2021-09-03 上海电机学院 一种智能电网无人机巡检通信子系统信道反馈方法
CN113872652B (zh) * 2021-06-25 2023-12-12 南京邮电大学 一种基于3d mimo时变系统的csi反馈方法
CN113660020A (zh) * 2021-06-25 2021-11-16 陕西尚品信息科技有限公司 一种无线通信信道信息传输方法、系统和解码器
CN113676287B (zh) * 2021-07-07 2024-06-11 杭州红岭通信息科技有限公司 简化5g nr中rm码算法和提高csi置信度的方法
CN113556158B (zh) * 2021-07-21 2023-06-20 重庆工程学院 一种面向车联网的大规模mimo智能csi反馈方法
CN113556159A (zh) * 2021-07-22 2021-10-26 上海海事大学 一种大规模mimo多用户系统的信道反馈方法
CN115706595A (zh) * 2021-08-10 2023-02-17 中兴通讯股份有限公司 码本传输方法、终端、基站和存储介质
CN114422059B (zh) * 2022-01-24 2023-01-24 清华大学 信道预测方法、装置、电子设备及存储介质
CN114925723B (zh) * 2022-05-06 2023-04-07 盐城工学院 采用编码器和解码器的滚动轴承剩余使用寿命预测方法
CN115913423B (zh) * 2022-10-31 2024-05-14 华中科技大学 非平稳大规模mimo信道的多步预测模型训练方法及预测方法
CN115512717A (zh) * 2022-11-21 2022-12-23 东北石油大学三亚海洋油气研究院 一种基于集成学习的二阶段单传感器管道泄漏定位方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108390706A (zh) * 2018-01-30 2018-08-10 东南大学 一种基于深度学习的大规模mimo信道状态信息反馈方法
CN108847876A (zh) * 2018-07-26 2018-11-20 东南大学 一种大规模mimo时变信道状态信息压缩反馈及重建方法
US10305766B1 (en) * 2017-11-07 2019-05-28 Amazon Technologies, Inc. Coexistence-insensitive presence detection
CN110138595A (zh) * 2019-04-12 2019-08-16 中国科学院深圳先进技术研究院 动态加权网络的时间链路预测方法、装置、设备及介质
CN110311718A (zh) * 2019-07-05 2019-10-08 东南大学 一种大规模mimo信道状态信息反馈中的量化和逆量化方法
CN110350958A (zh) * 2019-06-13 2019-10-18 东南大学 一种基于神经网络的大规模mimo的csi多倍率压缩反馈方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388900B (zh) * 2018-02-05 2021-06-08 华南理工大学 基于多特征融合和时空注意力机制相结合的视频描述方法
CN109672464B (zh) * 2018-12-13 2021-09-03 西安电子科技大学 基于fcfnn的大规模mimo信道状态信息反馈方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10305766B1 (en) * 2017-11-07 2019-05-28 Amazon Technologies, Inc. Coexistence-insensitive presence detection
CN108390706A (zh) * 2018-01-30 2018-08-10 东南大学 一种基于深度学习的大规模mimo信道状态信息反馈方法
CN108847876A (zh) * 2018-07-26 2018-11-20 东南大学 一种大规模mimo时变信道状态信息压缩反馈及重建方法
CN110138595A (zh) * 2019-04-12 2019-08-16 中国科学院深圳先进技术研究院 动态加权网络的时间链路预测方法、装置、设备及介质
CN110350958A (zh) * 2019-06-13 2019-10-18 东南大学 一种基于神经网络的大规模mimo的csi多倍率压缩反馈方法
CN110311718A (zh) * 2019-07-05 2019-10-08 东南大学 一种大规模mimo信道状态信息反馈中的量化和逆量化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于压缩感知的协同OFDM稀疏信道估计方法;张爱华;《计算机应用》;20140110;第34卷(第01期);全文 *

Also Published As

Publication number Publication date
CN110912598A (zh) 2020-03-24

Similar Documents

Publication Publication Date Title
CN110912598B (zh) 基于长短时注意力机制的大规模mimo系统csi反馈方法
CN108390706B (zh) 一种基于深度学习的大规模mimo信道状态信息反馈方法
CN111630787B (zh) 基于深度学习的mimo多天线信号传输与检测技术
CN112737985B (zh) 基于深度学习的大规模mimo信道联合估计和反馈方法
CN110311718B (zh) 一种大规模mimo信道状态信息反馈中的量化和逆量化方法
CN108847876B (zh) 一种大规模mimo时变信道状态信息压缩反馈及重建方法
Liao et al. CSI feedback based on deep learning for massive MIMO systems
Lu et al. Bit-level optimized neural network for multi-antenna channel quantization
CN109474388B (zh) 基于改进梯度投影法的低复杂度mimo-noma系统信号检测方法
CN109951214B (zh) 一种适用于大规模mimo系统的信号检测方法
CN111555781B (zh) 一种基于深度学习注意力机制的大规模mimo信道状态信息压缩及重建方法
CN114268388B (zh) 一种在大规模mimo中基于改进gan网络的信道估计方法
Arvinte et al. MIMO channel estimation using score-based generative models
CN111901069B (zh) 一种基于神经网络与近似消息传递算法的多用户检测方法
WO2023035736A1 (zh) 基于双时间尺度和深度学习的天线系统预编码方法和装置
CN113726375B (zh) 一种基于深度学习的信道信息压缩反馈重建方法
Hussien et al. PRVNet: A novel partially-regularized variational autoencoders for massive MIMO CSI feedback
CN108199990B (zh) 一种非高斯噪声3d-mimo信道估计方法
Li et al. A novel CSI feedback approach for massive MIMO using LSTM-attention CNN
CN116248156A (zh) 基于深度学习的大规模mimo信道状态信息反馈及重建方法
Hussien PRVNet: Variational autoencoders for massive MIMO CSI feedback
CN115865145A (zh) 一种基于Transformer的大规模MIMO信道状态信息反馈方法
Liu et al. Spherical normalization for learned compressive feedback in massive MIMO CSI acquisition
CN115549742A (zh) 一种基于深度学习的csi压缩反馈方法
Jeon et al. Communication-efficient federated learning over MIMO multiple access channels

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant