CN115913423B - 非平稳大规模mimo信道的多步预测模型训练方法及预测方法 - Google Patents

非平稳大规模mimo信道的多步预测模型训练方法及预测方法 Download PDF

Info

Publication number
CN115913423B
CN115913423B CN202211348415.9A CN202211348415A CN115913423B CN 115913423 B CN115913423 B CN 115913423B CN 202211348415 A CN202211348415 A CN 202211348415A CN 115913423 B CN115913423 B CN 115913423B
Authority
CN
China
Prior art keywords
csi
data
dimensional
prediction model
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211348415.9A
Other languages
English (en)
Other versions
CN115913423A (zh
Inventor
彭薇
毛栋厅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202211348415.9A priority Critical patent/CN115913423B/zh
Publication of CN115913423A publication Critical patent/CN115913423A/zh
Application granted granted Critical
Publication of CN115913423B publication Critical patent/CN115913423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Radio Transmission System (AREA)

Abstract

本发明公开了一种非平稳大规模MIMO信道的多步预测模型训练方法及利用该预测模型进行多步预测的方法,其中,训练方法包括:准备训练集,其中每对样本以前n个时刻的CSI数据作为输入数据,以后n个时刻的CSI数据作为输出数据;获取多步预测模型,多步预测模型包括依次连接的伪三维卷积层网络、混合注意力模块和伪三维转置卷积层网络;使每个样本重构为(时间×频点高×频点宽)的三维CSI实部数据和(时间×频点高×频点宽)的三维CSI虚部数据并分别输入多步预测模型的不同通道,进行训练,以使多步预测模型输出n个预测CSI数据向真实数据收敛。本发明利用频域相关性,采用图像处理方式训练神经网络得到多步预测模型,实现高精度的多步预测。

Description

非平稳大规模MIMO信道的多步预测模型训练方法及预测方法
技术领域
本发明属于大规模多入多出(multi-input multi-output,MIMO)无线通信领域,更具体地,涉及一种非平稳大规模MIMO信道的多步预测模型训练方法及预测方法。
背景技术
大规模MIMO系统中,基站端配备了大量的天线,通常是几十或数百甚至数千根天线,比现有普通的通信系统中的天线数量高出几个数量级。大规模MIMO卓越的频谱效率以及能量效率使其成为当今5G移动通信的关键技术之一。
然而大规模MIMO传输性能中频谱效率和能量效率与信道估计得到的CSI(ChannelState Information,信道状态信息)的准确度息息相关。在实际的应用情景下,在最常用的时分双工模式中,由于大规模MIMO无线信道的非平稳特性的存在会导致系统的相干时间急剧降低;从而使得信道估计得到的CSI面临过时的问题。目前已有文献提出信道预测技术,利用系统中的信道估计所得到的一系列时刻的CSI作为训练基础,来训练拟合得到适合当前信道状态的信道预测模型。一旦获得预测模型即可实现对未来时刻信道的CSI的预测。在预测阶段,将过去多个时刻的CSI或当前时刻的CSI作为预测模型的输入,得到未来一个时刻或多个时刻的CSI。然而,目前已有的多步预测方案都只利用了时域,在实际的无线通信环境中,由于移动端的移动性而导致大规模MIMO的信道状态呈现出非平稳的特性,因此传统的多步信道预测方法在当前的非平稳环境下的信道预测准确度并不高。还有一些文献也提到了利用LSTM同时提取时域和频域特征来提高预测精度,但是只能进行单步预测。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种非平稳大规模MIMO信道的多步预测模型训练方法及预测方法,其目的在于对非平稳大规模MIMO信道进行准确的多步预测。
为实现上述目的,按照本发明的一个方面,提供了一种非平稳大规模MIMO信道的多步预测模型训练方法,包括:
准备训练集,所述训练集包括多对不同的样本,每对样本包括连续2n个时刻的CSI数据,每个时刻具有对应M个频点的CSI数据,以前n个时刻的CSI数据作为对应样本的输入数据,以后n个时刻的CSI数据作为对应样本的输出数据;
获取多步预测模型,所述多步预测模型包括依次连接的伪三维卷积层网络、混合注意力模块和伪三维转置卷积层网络,所述伪三维转置卷积层网络的结构参数与所述伪三维卷积层网络的结构参数中心对称以对特征进行上采样,使模型输出维度与模型输入维度相同,所述多步预测模型的输入为(时间×高度×宽度×通道)的四维张量,所述混合注意力模块用于对空间和通道的特征进行学习和加权操作;
对样本输入数据进行预处理,将每个时刻的对应M个频点的CSI数据重构成频点高×频点宽的矩阵,并将每个CSI数据拆分为实部数据和虚部数据,以使每个样本前n个时刻的CSI数据重构为(时间×频点高×频点宽)的三维CSI实部数据和(时间×频点高×频点宽)的三维CSI虚部数据;
分别将每个样本前n个时刻的三维CSI实部数据和三维CSI虚部数据输入所述多步预测模型的不同通道,对所述多步预测模型进行训练,以使所述多步预测模型输出的后n个时刻的CSI数据向对应样本中的后n个时刻的CSI数据收敛。
在其中一个实施例中,收集样本的过程包括:
在移动状态下,由移动端的任一天线在N个不同时刻重复向基站端的任一天线发送OFDM调制导频信号,N个不同时刻的发送信号集为[st1,st2,……,stN],每个OFDM调制导频信号具有M个子载波,每个子载波承载一个导频信号,每组发送信号sti包括M个导频信号[sti(1),sti(2),……,stN(M)],其中,sti为第i时刻的发送信号,sti(j)为发送信号sti中的第j个子载波上的导频信号;
由基站端的任一天线获取N组接收信号每组接收信号/>包括M个导频信号/>其中,/>为对应sti的接收信号,/>为接收信号/>中的第j个子载波上的导频信号;
根据每个时刻移动端的发送信号和基站的接收信号进行信道状态信息估计,得到对应时刻的CSI数据,N个不同时刻对应N组CSI数据[ht1,ht2,……,htN],每组CSI数据hti具有对应M个频点的CSI数据[ht1(1),ht2(2),……,htN(M)],其中,hti为第i时刻的信道状态信息,hti(j)第i时刻第j个子载波频点的信道状态信息;
从N组CSI数据选择多组连续2n个时刻的CSI数据,形成多个样本。
在其中一个实施例中,伪三维卷积层网络包括依次连接的二维卷积和一维卷积,伪三维转置卷积层网络包括依次连接的一维卷积和二维卷积,其中,
在伪三维卷积层网络和伪三维转置卷积层网络中,每一层卷积的卷积核数量相同,每个二维卷积的卷积核尺寸为(1×k2×k3),每个一维卷积的卷积核尺寸为(k1×1×1),所述二维卷积用于提取频域空间维度的特征,所述一维卷积用于提取时域维度的特征。
在其中一个实施例中,k1=5,k2=3,k3=3。
在其中一个实施例中,所述多步预测模型包括依次连接的三层伪三维卷积层网络和依次连接的三层伪三维转置卷积层网络。
在其中一个实施例中,所述混合注意力模块包括依次连接的通道注意力模块和空间注意力模块,特征输入所述混合注意力模块后,先通过所述通道注意力模块确定不同通道的特征权重分布,再通过空间注意力模块确定同一通道内不同空间区域的特征权重分布。
在其中一个实施例中,特征F输入所述通道注意力模块后,执行:
第一步:同时经过全局平均池化和全局最大池化来汇聚每个通道的空间信息,分别得到全局平均池化后的通道特征描述算子和全局最大池化后的通道特征描述算子
第二步:使通道特征描述算子和/>分别通过由两层连接层构成的共享感知机,分别输出特征向量/>和/>其中,W0为第一层连接层的参数,W1为第二层连接层的参数;
第三步:将特征向量和/>使用相加的方式进行融合后,经过sigmoid激活函数σ,得到通道注意力特征/>
在其中一个实施例中,特征F′输入所述空间注意力模块后,执行:
第一步:特征F′同时经过全局平均池化和全局最大池化操作,分别得到全局平均池化后的空间特征描述算子和全局最大池化后的通道特征描述算子/>
第二步:将空间特征描述算子和/>进行拼接,得到拼接向量
第三步:将拼接向量经过一个卷积核为(7×7)的卷积操作,以进行降维和增大感受野,得到卷积结果/>
第四步:将卷积结果经过sigmoid激活函数σ,得到空间注意力特征/>
在其中一个实施例中,对所述多步预测模型进行训练时,将任一样本中的前n个时刻的CSI数据{h(t-n·d),h(t-(n-1)d),L,h(t-d)}进行预处理后输入所述多步预测模型,确定损失函数为:
其中,n为预测步长,d为相邻时刻的时间间隔,t为任一时刻,h(t+(n-l)d)为样本中在t+(n-l)d时刻的真实CSI,为模型输出的在t+(n-l)d时刻的预测CSI,||·||2表示二范数;
根据损失函数求模型预测CSI与真实CSI之间的误差,根据误差反向调节模型参数以使误差收敛至预期程度。
按照本发明的另一方面,提供了一种非平稳大规模MIMO信道的多步预测方法,将前n个时刻的CSI真实数据输入多步预测模型,得到后n个时刻的CSI预测数据,其中,所述多步预测模型为根据上述的非平稳大规模MIMO信道的多步预测模型训练方法训练所得的多步预测模型。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
本发明通过对CSI数据进行预处理,将数据原本的(时间×频点)的维度重构为(时间×频点高×频点宽),也就是说将频域上的频点重构为频点高×频点宽的矩阵,并同时将CSI数据拆分为实部数据和虚部数据并作为不同通道的数据,由此将原始的CSI数据重构为(时间×高度×宽度×通道)的四维张量。同时,获取多步预测模型,该多步预测模型具有伪三维卷积层网络、混合注意力模块和伪三维转置卷积层网络,将重构的(时间×高度×宽度×通道)的四维张量输入该多步预测模型,利用神经网络图像处理的特性,来进行多步信道预测,其中,伪三维卷积层网络可以同时提取时域和频域特征,混合注意力模块可以对空间和通道的特征进行学习和加权操作,伪三维转置卷积层网络可以使模型输出维度与模型输入维度保持相同,通过将以前n个时刻的CSI数据输入模型并利用n个时刻的CSI数据计算预测误差,多次训练使模型收敛,完成训练。相比于传统只基于时域相关性进行信道预测或只进行单步预测,本发明设计了能够对时域和频域特征进行较好融合的预测模型,结合频域相关性和时域相关性并利用图像处理方式训练神经网络,由此得到准确度较高的多步预测模型,利用该模型进行多步信道预测,可以有效提高预测准确度,实现高精度的多步预测。
附图说明
图1为一实施例的非平稳大规模MIMO信道的多步预测模型训练方法的步骤流程图;
图2为一实施例的多步预测模型的结构框图;
图3(a)为一实施例的二维卷积在频域维度上滑动示意图;
图3(b)为一实施例的二维卷积在时间维度上滑动示意图;
图4为一实施例的混合注意力模块的结构框图;
图5为一实施例的通道注意力模块的工作流程图;
图6为一实施例的空间注意力模块的工作流程图;
图7(a)为一实施例的单步预测时预测实部CSI与真实实部CSI的对比图;
图7(b)为一实施例的单步预测时预测虚部CSI与真实虚部CSI的对比图;
图8(a)为一实施例的5步预测时预测实部CSI与真实实部CSI的对比图;
图8(b)为一实施例的5步预测时预测虚部CSI与真实虚部CSI的对比图;
图9(a)为一实施例的单步预测时各频点上的CSI真实值与预测值之间在不同预测步长下的NMSE值;
图9(b)为一实施例的5步预测时各频点上的CSI真实值与预测值之间在不同预测步长下的NMSE值;
图10为本发明中的预测模型与AR模型和全连接LSTM模型在各个预测步长上的预测值与真实值之间的平均NMSE的对比。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示为一实施例中非平稳大规模MIMO信道的多步预测模型训练方法的步骤流程图,其主要包括以下步骤:
步骤S100:准备训练集,训练集包括多对不同的样本,每对样本包括连续2n个时刻的CSI数据,每个时刻具有对应M个频点的CSI数据,以前n个时刻的CSI数据作为对应样本的输入数据,以后n个时刻的CSI数据作为对应样本的输出数据。
训练集中的样本均为实际检测获得的CSI数据。为了获取样本,具体可执行以下过程:
移动端在移动状态下向基站端发送M个子载波的OFDM(Orthogonal FrequencyDivision Multiplexing,正交频分复用)调制导频信号,重复N次该流程,共在N个不同的时刻发送N组信号[st1,st2,……,stN],每组信号包括M个子载波的导频信号,即,每组发送信号sti包括M个导频信号[sti(1),sti(2),……,stN(M)],其中,sti为第i时刻的发送信号,sti(j)为发送信号sti中的第j个子载波上的导频信号。
在移动端发射信号期间,基站端则接收对应的信号,移动端发射了N组信号,相应的,基站端也会接收到N组信号,为每组接收信号也会包含M个子载波的导频信号,即,每组接收信号/>包括M个导频信号/>其中,为对应sti的接收信号,/>为接收信号/>中的第j个子载波上的导频信号。也就是说,通过上述方式,得到了N个连续时刻的接收信号,在每个时刻,包含了M个频点的接收信号。
基于发送信号和对应的接收信号,计算对应时刻每个子载波的信道状态信息,得到N组CSI数据[ht1,ht2,……,htN],每组CSI数据hti具有对应M个频点的CSI数据[ht1(1),ht2(2),……,htN(M)],其中,hti为第i时刻的信道状态信息,hti(j)第i时刻第j个子载波频点的信道状态信息。具体的,可以通过公式计算第i时刻第j个子载波频点的CSI。
在得到上述N组实测的CSI后,可以从中选择多对样本,每对样本包括连续2n个时刻的CSI数据,例如,第k对样本为[ht(k-n),ht(k-n-1),……,ht(k-1),htk,ht(k+1),……,ht(k+n-1)],以其中的[ht(k-n),ht(k-n-1),……,ht(k-1)]作为第k对样本的输入数据用于后续输入模型进行训练,以其中的[htk,ht(k+1),……,ht(k+n-1)]作为第k对样本的输出数据用于对模型的预测结果计算预测误差。具体的,可以将N组实测的CSI按照9:1划分训练集与验证集,由此可以得到对训练集样本与/>对验证集样本。
步骤S200:获取多步预测模型,多步预测模型包括依次连接的伪三维卷积层网络、混合注意力模块和伪三维转置卷积层网络,伪三维转置卷积层网络的结构参数与伪三维卷积层网络的结构参数中心对称以对特征进行上采样,使模型输出维度与模型输入维度相同,多步预测模型的输入为(时间×高度×宽度×通道)的四维张量,混合注意力模块用于对空间和通道的特征进行学习和加权操作。
如图2所示为一实施例中多步预测模型的结构框图,其主要包括依次串连的伪三维卷积层网络、混合注意力模块和伪三维转置卷积层网络,其中,伪三维卷积层网络的输入为(时间×高度×宽度×通道)的四维张量,四维张量输入伪三维卷积层网络后,由伪三维卷积层网络对不同通道内的(时间×高度×宽度)的空间特征进行上采样以识别特征,混合注意力模块则用于对空间和通道的特征进行学习和加权操作,伪三维转置卷积层网络的结构参数与伪三维转置卷积层的结构参数中心对称,用于对特征进行上采样以使模型的输出特征与输入特征的维度保持一致,即,伪三维转置卷积层网络的输出也为(时间×高度×宽度×通道)的四维张量。
步骤S300:对样本输入数据进行预处理,将每个时刻的对应M个频点的CSI数据重构成频点高×频点宽的矩阵,并将每个CSI数据拆分为实部数据和虚部数据,以使每个样本前n个时刻的CSI数据重构为(时间×频点高×频点宽)的三维CSI实部数据和(时间×频点高×频点宽)的三维CSI虚部数据。
在搭建出上述多步预测模型后,需要利用该模型同时识别时域信息和频域信息。而原始的样本数据为n个时刻的CSI数据,每个时刻包含M个频点的CSI数据,即原始每个样本数据为(时间×频点)的二维CSI数据,无法适应多步预测模型的输入,因此,需要对原始数据进行预处理,使二维CSI数据转变为三维CSI数据。本发明通过对每个时刻的频点进行重构,将M个频点的CSI数据重构为频点高×频点宽的矩阵,使原本每个样本的(时间×频点)二维CSI数据重构为(时间×频点高×频点宽)的三维CSI数据。同时,由于CSI数据包含由实部数据和虚部数据,神经网络对复数的处理复杂度极高,因此,本发明进一步将每个CSI数据拆分为实部数据和虚部数据,每对样本中,包含(时间×频点高×频点宽)的三维CSI实部数据和(时间×频点高×频点宽)的三维CSI虚部数据,后续可以分别将实部数据和虚部数据喂入不同的通道。
步骤S400:分别将每个样本前n个时刻的三维CSI实部数据和三维CSI虚部数据输入多步预测模型的不同通道,对多步预测模型进行训练,以使多步预测模型输出的后n个时刻的CSI数据向对应样本中的后n个时刻的CSI数据收敛。
将每个样本中重构后的三维CSI实部数据和三维CSI虚部数据输入伪三维卷积层网络的不同通道,由伪三维卷积层网络分别对每个通道的(时间×频点高×频点宽)的三维CSI信息进行上采样,识别CSI在时域和频域上的信息,再由混合注意力模块对每个通道内的特征进行加权操作以及对两个不同通道内的特征进行加权操作,最后由伪三维转置卷积层网络对每个通道的(时间×频点高×频点宽)的三维CSI信息进行下采样,使模型最终的输出保持与输入相同的维度。
由于常规的三维卷积(3D-CNN)网络对于三维空间特征提取的计算量非常大,为了降低基于3D-CNN网络模型带来的计算资源的成本,本发明采用伪三维卷积网络,通过2D-CNN与1D-CNN组合为伪三维卷积(Pseudo-3D Convolutional Neural Network,P3D-CNN)来替代3D-CNN,从而降低模型的计算量。
在一实施例中,伪三维卷积层网络包括依次连接的二维卷积2D-CNN和一维卷积1D-CNN,伪三维转置卷积层网络包括依次连接的一维卷积1D-CNN和二维卷积2D-CNN。其中,二维卷积的卷积核尺寸为(1×k2×k3),一维卷积的卷积核尺寸为(k1×1×1)。如图3(a)所示为二维卷积在频点高×频点宽的频域维度上滑动,以提取频域特征,如图3(b)所示为二维卷积在时间维度上滑动,以提取时域特征。结合一维卷积和二维卷积,实现时域和频域特征的提取。具体的,可以令k1=5,k2=3,k3=3,实验表明,该参数下的提取能力较佳。进一步的,多步预测模型包括三层伪三维卷积层网络,每一层参数设置相同,以更好地学习时域和频域特征。伪三维转置卷积层网络参数的设置与伪三维卷积层网络参数的设置相同。
在一实施例中,如图4所示,混合注意力模块包括依次连接的通道注意力模块和空间注意力模块,特征输入混合注意力模块后,先通过通道注意力模块确定不同通道的特征权重分布,再通过空间注意力模块确定同一通道内不同空间区域的特征权重分布。
具体地,如图5所示,特征F输入通道注意力模块后,执行:
第一步:特征F同时经过全局平均池化和全局最大池化来汇聚每个通道的空间信息,分别得到全局平均池化后的通道特征描述算子和全局最大池化后的通道特征描述算子/>
第二步:使通道特征描述算子和/>分别通过由两层连接层构成的共享感知机,分别输出特征向量/>和/>其中,W0为第一层连接层的参数,W1为第二层连接层的参数。
第三步:将特征向量和/>使用相加的方式进行融合后,经过sigmoid激活函数σ,得到通道注意力特征/>
具体地,如图6所示,特征F′输入空间注意力模块后,执行:
第一步:特征F′同时经过全局平均池化和全局最大池化操作,分别得到全局平均池化后的空间特征描述算子和全局最大池化后的通道特征描述算子/>
第二步:将空间特征描述算子和/>进行拼接,得到拼接向量
第三步:将拼接向量经过一个卷积核为(7×7)的卷积操作,以进行降维和增大感受野,得到卷积结果/>
第四步:将卷积结果经过sigmoid激活函数σ,得到空间注意力特征/>
在一实施例中,对多步预测模型进行训练时,将任一样本中的前n个时刻的CSI数据{h(t-n·d),h(t-(n-1)d),L,h(t-d)}进行预处理后输入多步预测模型,根据损失函数求模型预测CSI与真实CSI之间的误差,根据误差反向调节模型参数以使误差收敛至预期程度。其中,损失损失函数为:
其中,n为预测步长,d为相邻时刻的时间间隔,t为任一时刻,h(t+(n-l)d)为样本中在t+(n-l)d时刻的真实CSI,为模型输出的在t+(n-l)d时刻的预测CSI,||·||2表示二范数。
具体地,在训练的过程中,通过梯度下降结合Adam优化算法对网络模型中的参数进行调整更新,使其达到最优,优化的目标即为使损失函数最小,其学习率设置为0.001,一阶矩估计的指数衰减速率设置为0.9,二阶矩估计的指数衰减速率设置为0.999。
相应的,本申请还涉及一种非平稳大规模MIMO信道的多步预测方法,将前n个时刻的CSI真实数据输入多步预测模型,得到后n个时刻的CSI预测数据,其中,多步预测模型为上文介绍的非平稳大规模MIMO信道的多步预测模型训练方法训练所得的多步预测模型。
为了验证本发明的效果,利用上述训练好的预测模模型,在60个时间点,频点500上预测值与真实值在不同预测步长下的对比效果图。如图7(a)所示为单步预测时预测实部CSI与真实实部CSI的对比图,如图7(b)所示为单步预测时预测虚部CSI与真实虚部CSI的对比图,其中在单步预测时预测值与真实值之间的归一化均方误差(normalized meansquared error,NMSE)仅为0.0318。如图8(a)所示为5步预测时预测实部CSI与真实实部CSI的对比图,如图8(b)所示为5步预测时预测虚部CSI与真实虚部CSI的对比图,其中在5步预测时预测值与真实值之间的归一化均方误差0.0930,由此证明了该模型无论对于单步或多步预测,均能很好的学习CSI随时间的变化趋势,依此做出准确的预测。
同时,还进一步比较了利用上述预测模模型,在60个时间点,各频点上的CSI真实值与预测值之间在不同预测步长下的NMSE情况。如图9(a)所示,在单步预测时,平均NMSE为0.0768,如图9(b)所示,在在5步预测时,平均NMSE为0.1653,证明本发明实施例在不同预测步长下都有较低的预测误差。
同时,还进一步比较了本发明中的预测模型以及目前常规的AR(Auto-Regressive,基于自回归)模型和全连接LSTM模型在各个预测步长上的预测值与真实值之间的平均NMSE的对比,如图10所示,本发明实施例预测模型的预测效果明显优于AR模型和全连接LSTM模型的预测效果,最下方曲线为本发明实施例预测模型在预测步长1至10上的预测值与真实值之间的平均NMSE的变化曲线,均远小于AR模型以及全连接LSTM模型的预测结果的NMSE。由此可见,本发明基于卷积神经网络与注意力机制结合的多步信道预测方法在实际的非平稳大规模MIMO预测场景下可以通过很好的利用时域与频域上的相关性,进而实现优异的多步预测性能。
本领域的技术人员容易理解,以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种非平稳大规模MIMO信道的多步预测模型训练方法,其特征在于,包括:
准备训练集,所述训练集包括多对不同的样本,每对样本包括连续2n个时刻的CSI数据,每个时刻具有对应M个频点的CSI数据,以前n个时刻的CSI数据作为对应样本的输入数据,以后n个时刻的CSI数据作为对应样本的输出数据;
获取多步预测模型,所述多步预测模型包括依次连接的伪三维卷积层网络、混合注意力模块和伪三维转置卷积层网络,所述伪三维转置卷积层网络的结构参数与所述伪三维卷积层网络的结构参数中心对称以对特征进行上采样,使模型输出维度与模型输入维度相同,所述多步预测模型的输入为(时间×高度×宽度×通道)的四维张量,所述混合注意力模块用于对空间和通道的特征进行学习和加权操作;伪三维卷积层网络包括依次连接的二维卷积和一维卷积,伪三维转置卷积层网络包括依次连接的一维卷积和二维卷积,其中,在伪三维卷积层网络和伪三维转置卷积层网络中,每一层卷积的卷积核数量相同,每个二维卷积的卷积核尺寸为(1×k2×k3),每个一维卷积的卷积核尺寸为(k1×1×1),所述二维卷积用于提取频域空间维度的特征,所述一维卷积用于提取时域维度的特征;
对样本输入数据进行预处理,将每个时刻的对应M个频点的CSI数据重构成频点高×频点宽的矩阵,并将每个CSI数据拆分为实部数据和虚部数据,以使每个样本前n个时刻的CSI数据重构为(时间×频点高×频点宽)的三维CSI实部数据和(时间×频点高×频点宽)的三维CSI虚部数据;
分别将每个样本前n个时刻的三维CSI实部数据和三维CSI虚部数据输入所述多步预测模型的不同通道,对所述多步预测模型进行训练,以使所述多步预测模型输出的后n个时刻的CSI数据向对应样本中的后n个时刻的CSI数据收敛。
2.如权利要求1所述的非平稳大规模MIMO信道的多步预测模型训练方法,其特征在于,收集样本的过程包括:
在移动状态下,由移动端的任一天线在N个不同时刻重复向基站端的任一天线发送OFDM调制导频信号,N个不同时刻的发送信号集为[st1,st2,……,stN],每个OFDM调制导频信号具有M个子载波,每个子载波承载一个导频信号,每组发送信号sti包括M个导频信号[sti(1),sti(2),……,stN(M)],其中,sti为第i时刻的发送信号,sti(j)为发送信号sti中的第j个子载波上的导频信号;
由基站端的任一天线获取N组接收信号每组接收信号/>包括M个导频信号/>其中,/>为对应sti的接收信号,/>为接收信号/>中的第j个子载波上的导频信号;
根据每个时刻移动端的发送信号和基站的接收信号进行信道状态信息估计,得到对应时刻的CSI数据,N个不同时刻对应N组CSI数据[ht1,ht2,……,htN],每组CSI数据hti具有对应M个频点的CSI数据[ht1(1),ht2(2),……,htN(M)],其中,hti为第i时刻的信道状态信息,hti(j)第i时刻第j个子载波频点的信道状态信息;
从N组CSI数据选择多组连续2n个时刻的CSI数据,形成多个样本。
3.如权利要求1所述的非平稳大规模MIMO信道的多步预测模型训练方法,其特征在于,k1=5,k2=3,k3=3。
4.如权利要求3所述的非平稳大规模MIMO信道的多步预测模型训练方法,其特征在于,所述多步预测模型包括依次连接的三层伪三维卷积层网络和依次连接的三层伪三维转置卷积层网络。
5.如权利要求1所述的非平稳大规模MIMO信道的多步预测模型训练方法,其特征在于,所述混合注意力模块包括依次连接的通道注意力模块和空间注意力模块,特征输入所述混合注意力模块后,先通过所述通道注意力模块确定不同通道的特征权重分布,再通过空间注意力模块确定同一通道内不同空间区域的特征权重分布。
6.如权利要求5所述的非平稳大规模MIMO信道的多步预测模型训练方法,其特征在于,特征F输入所述通道注意力模块后,执行:
第一步:同时经过全局平均池化和全局最大池化来汇聚每个通道的空间信息,分别得到全局平均池化后的通道特征描述算子和全局最大池化后的通道特征描述算子
第二步:使通道特征描述算子和/>分别通过由两层连接层构成的共享感知机,分别输出特征向量/>和/>其中,W0为第一层连接层的参数,W1为第二层连接层的参数;
第三步:将特征向量和/>使用相加的方式进行融合后,经过sigmoid激活函数σ,得到通道注意力特征/>
7.如权利要求5所述的非平稳大规模MIMO信道的多步预测模型训练方法,特征F′输入所述空间注意力模块后,执行:
第一步:特征F′同时经过全局平均池化和全局最大池化操作,分别得到全局平均池化后的空间特征描述算子和全局最大池化后的通道特征描述算子/>
第二步:将空间特征描述算子和/>进行拼接,得到拼接向量
第三步:将拼接向量经过一个卷积核为(7×7)的卷积操作,以进行降维和增大感受野,得到卷积结果/>
第四步:将卷积结果经过sigmoid激活函数σ,得到空间注意力特征/>
8.如权利要求1所述的非平稳大规模MIMO信道的多步预测模型训练方法,其特征在于,对所述多步预测模型进行训练时,将任一样本中的前n个时刻的CSI数据{h(t-n·d),h(t-(n-1)d),…,h(t-d)}进行预处理后输入所述多步预测模型,确定损失函数为:
其中,n为预测步长,d为相邻时刻的时间间隔,t为任一时刻,h(t+(n-l)d)为样本中在t+(n-l)d时刻的真实CSI,为模型输出的在t+(n-l)d时刻的预测CSI,||·||2表示二范数;
根据损失函数求模型预测CSI与真实CSI之间的误差,根据误差反向调节模型参数以使误差收敛至预期程度。
9.一种非平稳大规模MIMO信道的多步预测方法,其特征在于,将前n个时刻的CSI真实数据输入多步预测模型,得到后n个时刻的CSI预测数据,其中,所述多步预测模型为根据权利要求1至8任一项所述的非平稳大规模MIMO信道的多步预测模型训练方法训练所得的多步预测模型。
CN202211348415.9A 2022-10-31 2022-10-31 非平稳大规模mimo信道的多步预测模型训练方法及预测方法 Active CN115913423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211348415.9A CN115913423B (zh) 2022-10-31 2022-10-31 非平稳大规模mimo信道的多步预测模型训练方法及预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211348415.9A CN115913423B (zh) 2022-10-31 2022-10-31 非平稳大规模mimo信道的多步预测模型训练方法及预测方法

Publications (2)

Publication Number Publication Date
CN115913423A CN115913423A (zh) 2023-04-04
CN115913423B true CN115913423B (zh) 2024-05-14

Family

ID=86477023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211348415.9A Active CN115913423B (zh) 2022-10-31 2022-10-31 非平稳大规模mimo信道的多步预测模型训练方法及预测方法

Country Status (1)

Country Link
CN (1) CN115913423B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016026350A1 (zh) * 2014-08-18 2016-02-25 电信科学技术研究院 一种三维信道状态信息确定方法及装置
CN108363049A (zh) * 2018-03-09 2018-08-03 西安电子科技大学 非平稳噪声下相干信源mimo雷达角度估计方法
CN110691049A (zh) * 2019-10-31 2020-01-14 华中科技大学 一种频分双工模式下的大规模mimo系统信道预测方法
CN110912598A (zh) * 2019-11-22 2020-03-24 中原工学院 基于长短时注意力机制的大规模mimo系统csi反馈方法
WO2020220278A1 (zh) * 2019-04-30 2020-11-05 华为技术有限公司 一种信道估计模型训练方法及设备
CN113595666A (zh) * 2021-07-13 2021-11-02 华中科技大学 大规模mimo系统基于时频联合相关性的信道预测方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016026350A1 (zh) * 2014-08-18 2016-02-25 电信科学技术研究院 一种三维信道状态信息确定方法及装置
CN108363049A (zh) * 2018-03-09 2018-08-03 西安电子科技大学 非平稳噪声下相干信源mimo雷达角度估计方法
WO2020220278A1 (zh) * 2019-04-30 2020-11-05 华为技术有限公司 一种信道估计模型训练方法及设备
CN110691049A (zh) * 2019-10-31 2020-01-14 华中科技大学 一种频分双工模式下的大规模mimo系统信道预测方法
CN110912598A (zh) * 2019-11-22 2020-03-24 中原工学院 基于长短时注意力机制的大规模mimo系统csi反馈方法
CN113595666A (zh) * 2021-07-13 2021-11-02 华中科技大学 大规模mimo系统基于时频联合相关性的信道预测方法和系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
3D MIMO信道建模与预测技术研究;赵岚;《中国优秀硕士学位论文全文数据库 信息科技辑》;20220915;全文 *
Statistical CSI Acquisition in the Nonstationary Massive MIMO Environment;Wang, Guoliang;《IEEE Transactions on Vehicular Technology》;20181231;全文 *
一种基于深度学习的FDD大规模MIMO系统CSI反馈方法;廖勇;姚海梅;花远肖;赵砚;;电子学报;20200615(06);全文 *
基于实测信道的大规模MIMO信道估计与信道预测方法研究;徐康;《万方学位论文》;20220831;全文 *
大规模天线系统帧结构的设计与研究;陶志毫;《中国优秀硕士学位论文全文数据库 信息科技辑》;20220515;全文 *

Also Published As

Publication number Publication date
CN115913423A (zh) 2023-04-04

Similar Documents

Publication Publication Date Title
CN112737985A (zh) 基于深度学习的大规模mimo信道联合估计和反馈方法
CN113472706A (zh) 一种基于深度神经网络的mimo-ofdm系统信道估计方法
CN114580498A (zh) 一种无线通信场景下高通信效率的联邦学习方法
CN114338301B (zh) 一种基于压缩感知的ris辅助毫米波系统的信道估计方法
CN110336594A (zh) 一种基于共轭梯度下降法的深度学习信号检测方法
CN113595666B (zh) 大规模mimo系统基于时频联合相关性的信道预测方法和系统
CN112910811B (zh) 基于联合学习的噪声水平未知条件下的盲调制识别方法和装置
CN116054887A (zh) 一种基于神经网络模型的天线信号调制方法
CN114896887B (zh) 一种基于深度学习的用频设备射频指纹识别方法
CN110430150A (zh) 一种基于神经网络的蜂窝移动通信系统接收机设计方法
CN114268388A (zh) 一种在大规模mimo中基于改进gan网络的信道估计方法
CN116192307A (zh) 非高斯噪声下分布式协同的多天线协作频谱智能感知方法、系统、设备及介质
EP4405854A1 (en) Domain adaptation for wireless sensing
CN115022134A (zh) 基于非迭代重构网络的毫米波大规模mimo系统信道估计方法及系统
CN115913423B (zh) 非平稳大规模mimo信道的多步预测模型训练方法及预测方法
CN114726412B (zh) 信道信息获取方法、装置及相关设备
CN107181705A (zh) 一种半盲信道估计方法及系统
CN115473553B (zh) 一种智能抑制波束斜视的方法、装置及电子设备
CN114422310B (zh) 一种基于联合分布矩阵与多输入神经网络的数字正交调制信号识别方法
CN114866120A (zh) 一种mimo-noma系统信号检测方法
Song et al. Deep learning based low-rank channel recovery for hybrid beamforming in millimeter-wave massive MIMO
Sun et al. AI enlightens wireless communication: Analyses and solutions for DMRS channel estimation
CN113572709B (zh) 一种大规模mimo系统中基站端导频辅助信道估计方法和系统
CN114785433A (zh) 信道场景识别的方法、网络设备及存储介质
Shi et al. Automatic Neural Network Construction-Based Channel Estimation for IRS-Aided Communication Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant