CN115276729A - 一种面向大规模mimo系统的信号检测方法及系统 - Google Patents
一种面向大规模mimo系统的信号检测方法及系统 Download PDFInfo
- Publication number
- CN115276729A CN115276729A CN202210864604.5A CN202210864604A CN115276729A CN 115276729 A CN115276729 A CN 115276729A CN 202210864604 A CN202210864604 A CN 202210864604A CN 115276729 A CN115276729 A CN 115276729A
- Authority
- CN
- China
- Prior art keywords
- mean value
- iteration
- signal
- unit
- sori
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 58
- 238000009826 distribution Methods 0.000 claims abstract description 122
- 239000011159 matrix material Substances 0.000 claims abstract description 94
- 238000013016 damping Methods 0.000 claims abstract description 53
- 239000013598 vector Substances 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000005540 biological transmission Effects 0.000 claims description 32
- 238000007781 pre-processing Methods 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 18
- 101710149632 Pectinesterase A Proteins 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 14
- 101710149624 Pectinesterase B Proteins 0.000 claims description 7
- 238000003491 array Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 229920006771 PE-C Polymers 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/02—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
- H04B7/04—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
- H04B7/0413—MIMO systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L25/00—Baseband systems
- H04L25/02—Details ; arrangements for supplying electrical power along data transmission lines
- H04L25/0202—Channel estimation
- H04L25/024—Channel estimation channel estimation algorithms
- H04L25/0242—Channel estimation channel estimation algorithms using matrix methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Power Engineering (AREA)
- Radio Transmission System (AREA)
Abstract
本申请提供一种面向大规模MIMO系统的信号检测方法及系统,根据发送端的天线数目和接收端的天线数目,确定第一阻尼系数和第二阻尼系数;根据接收信号、信道矩阵、平均符号能量和第一阻尼系数,确定发送信号后验概率分布的初始均值;利用SORI方法对发送信号的后验概率分布的均值进行SORI迭代,根据完成SORI迭代后的均值向量,确定腔边缘概率服从的高斯分布的初始均值;采用EPA迭代方法,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。将SORI和EPA算法相结合,利用SORI来近似EPA算法初始化部分的矩阵求逆,从而大大提高收敛速度。
Description
技术领域
本申请涉及移动通信技术领域,具体涉及一种面向大规模MIMO系统的信号检测方法及系统。
背景技术
大规模多输入多输出技术(Multiple-Input Multiple-Output,MIMO)作为多用户通信的解决方案,已经成为5G通信系统的关键技术之一。由于相比传统小规模MIMO系统增加了接收端和发送端的天线数目,大规模天线系统在频谱效率、能量效率和连接可靠性方面都具有很大的优势。尽管如此,天线数目的大量增加也使得接收端的信号检测成为一个巨大的挑战。
目前的信号检测方法主要分为线性检测和非线性检测。传统的线性检测需要矩阵求逆运算,复杂度较高,为了减小复杂度,现有技术公开了一些基于迭代对矩阵求逆进行近似的方法,例如二阶Richardson迭代(SORI)和纽曼级数近似(NSA)。然而,随着天线数目的增加,线性检测和它们的近似算法性能都达到了饱和。非线性检测算法相比线性检测往往能够实现更优的检测性能,特别是期望传播(EP)算法可以实现近似最优的检测性能。
传统EP算法的每次迭代都需要一个矩阵求逆运算,极高的复杂度给硬件实现带来了困难。现有技术1(X.Tan,Y.-L.Ueng,Z.Zhang,X.You and C.Zhang,“A low complexitymassive MIMO detection based on approximate expectation propagation,”IEEETrans.Veh.Technol.,vol.68,no.8,pp.7260–7272,Aug.2019)提出一种近似EP算法(EPA),通过重建和近似将EP算法进行简化,同时消除每次迭代时的矩阵求逆,但保留一个初始的矩阵求逆运算。现有技术2(X.Tan et al:,“Approximate expectation propagationmassive MIMO detector with weighted Neumann-series,”IEEE Trans.CircuitsSyst.II:Exp.Briefs,vol.68,no.2,pp.662–666,Feb.2021.)提出在EPA的基础上提出了EPA-wNSA算法,通过加权的纽曼序列(wNSA)的迭代运算来近似初始的矩阵求逆,同时将EPA的迭代过程进一步优化,从而减小了复杂度。
然而,EPA-wNSA算法仍然有一些需要改进的地方,它比较慢的收敛速度不利于高吞吐量的硬件实现,并且算法的初始化部分和所需的除法操作也消耗了大量的计算资源。
发明内容
本申请提供一种面向大规模MIMO系统的信号检测方法及系统,以实现更快收敛速度和更低复杂度的信号检测。
本申请第一方面提供一种面向大规模MIMO系统的信号检测方法,包括:
获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差;
根据所述发送端的天线数目和所述接收端的天线数目,确定接收端信号检测器的第一阻尼系数和第二阻尼系数;
根据所述接收信号、所述信道矩阵、所述噪声方差、所述平均符号能量和所述第一阻尼系数,确定发送信号后验概率分布的初始均值、逆协方差矩阵和接收信号的匹配滤波输出;
根据所述发送信号后验概率分布的初始均值、所述匹配滤波输出、所述逆协方差矩阵、所述第一阻尼系数和所述第二阻尼系数,对发送信号的后验概率分布的均值进行SORI迭代,得到完成SORI迭代后的发送信号的后验概率分布的均值向量,以及,根据完成SORI迭代后的发送信号的后验概率分布的均值向量,确定腔边缘概率服从的高斯分布的初始均值;
根据所述逆协方差矩阵得到发送信号的后验概率分布的方差,以及,基于所述后验概率分布的方差和腔边缘概率服从的高斯分布的初始均值,采用EPA迭代方法,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。
可选地,所述根据所述发送端的天线数目和所述接收端的天线数目,确定接收端信号检测器的第一阻尼系数和第二阻尼系数,采用以下模型:
δ=2/(λ1+λ2);
式中,K和N分别为发送端和接收端的天线数目,δ为第一阻尼系数,ω为第二阻尼系数。
可选地,所述根据所述接收信号、所述信道矩阵、所述噪声方差、所述平均符号能量和所述第一阻尼系数,确定发送信号后验概率分布的初始均值、逆协方差矩阵和接收信号的匹配滤波输出,包括:
根据信道矩阵和噪声方差确定逆协方差矩阵的过程,采用以下模型:
W=HHH+diag′(Λi);
根据信道矩阵和接收信号确定接收信号的匹配滤波输出的过程,采用以下模型:
式中,B为匹配滤波输出,y为接收信号向量;
根据匹配滤波输出和第一阻尼系数对后验概率分布的均值初始化,得到后验概率分布的初始均值,所述初始均值包括第一次迭代后验概率分布的均值和第二次迭代后验概率分布的均值,表示为:
μ0=0,μ1=δB;
其中,μ0为第一次迭代后验概率分布的均值,μ1为第二次迭代后验概率分布的均值。
可选地,所述根据所述发送信号后验概率分布的初始均值、所述匹配滤波输出、所述逆协方差矩阵、所述第一阻尼系数和所述第二阻尼系数,对发送信号的后验概率分布的均值进行SORI迭代,得到完成SORI迭代后的发送信号的后验概率分布的均值向量,采用以下模型:
可选地,所述根据完成SORI迭代后的发送信号的后验概率分布的均值向量,确定腔边缘概率服从的高斯分布的初始均值,采用以下模型:
式中,t0为腔边缘概率服从的高斯分布的初始均值。
可选地,所述基于所述后验概率分布的方差和腔边缘概率服从的高斯分布的初始均值,采用EPA迭代方法,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值,包括:
预设迭代次数,得到达到预设迭代次数的腔边缘概率服从的高斯分布的均值,以及,以达到预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。
本申请第二方面提供一种面向大规模MIMO系统的信号检测系统,用于执行本申请第一方面提供的信号检测方法,包括输入单元、预处理单元、SORI单元和EPA单元;
所述输入单元用于获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差,确定接收端信号检测器的第一阻尼系数和第二阻尼系数,将接收信号、信道矩阵、平均符号能量和噪声方差、第一阻尼系数和第二阻尼系数输入至预处理单元、SORI单元和EPA单元;
所述预处理单元用于根据接收信号、信道矩阵、噪声方差、平均符号能量和第一阻尼系数,确定发送信号的后验概率分布的初始均值和逆协方差矩阵;
所述SORI单元用于基于SORI迭代方法得到完成SORI迭代后的发送信号的后验概率分布的均值向量,以及,根据完成SORI迭代后的发送信号的近似后验概率分布的均值向量,确定腔边缘概率服从的高斯分布的初始均值;
所述EPA单元用于基于EPA迭代方法和腔边缘概率服从的高斯分布的初始均值,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。
可选地,所述预处理单元配置有基于对角的脉动阵列,所述脉动阵列包括K(K+1)/2个处理单元PE,所述处理单元PE在每个时钟周期处理多组数据;
所述脉动阵列用于接收包括信道矩阵H和接收信号向量y的输入数据,输出HHH和HHy;所述处理单元PE包括计算共轭的PE-A单元和PE-Atop单元、计算HHH的对角部分的PE-B单元和PE-Btop单元、计算HHy的PE-D单元和PE-BTop单元以及计算HHH的非对角部分的PE-C单元和PE-D单元;
所述脉动阵列采用逆向数据流,所述输入数据从所述脉动阵列的长边输入至所述PE-A单元和所述PE-Atop单元,得到HH;所述信道矩阵H沿阵列的方向从脉动阵列的长边到脉动阵列一边流动,所述HH从脉动阵列的长边到脉动阵列的另一边流动。
可选地,所述预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘;
所述脉动阵列配置有提前相加模块,用于进行复数乘法运算的前处理,其中,所述复数乘法运算为第一乘数和第二乘数相乘,所述第一乘数表示为a+jb,所述第二乘数表示为c+jd;
所述提前相加模块包括第一加法单元和第二加法单元,所述第一加法单元用于计算a+b,所述第二加法单元用于计算c+d;所述提前相加模块用于将所述第一加法单元的输出和所述第二加法单元的输出传递至处理单元PE中。
可选地,所述预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘;所述脉动阵列配置有四舍五入模块,所述四舍五入模块用于将输入数据进行四舍五入来减小位宽。
由以上技术方案可知,本申请提供的面向大规模MIMO系统的信号检测方法及系统,将SORI和EPA算法相结合,利用SORI来近似EPA算法初始化部分的矩阵求逆,从而大大提高收敛速度,相比EPA-wNSA可以减少约50%到67%的迭代次数。其次,通过算法转换降低初始化部分的复杂度,并消除两个迭代之间的除法操作。此外,本申请提供的信号检测系统采用一款高吞吐量的硬件架构,该硬件架构包括基于对角的脉动阵列,该脉动阵列用于计算矩阵与矩阵相乘、矩阵与向量相乘,其中包含三种改进方法,可以任选使用,包括采用逆向数据流,相比其他MIMO检测中应用的脉动阵列可以明显减少运算时间;配置提前相加单元,进行复数乘法运算时可以缩短脉动阵列的关键路径;配置四舍五入单元,能够缩小输入数据的比特宽度从而减少硬件资源。
附图说明
图1为本申请实施例提供的信号检测系统的结构示意图;
图2为本申请实施例提供的预处理单元采用的脉动阵列的结构示意图;
图3为本申请实施例提供的信号检测系统的时序安排示意图。
具体实施方式
以下将结合附图,对本申请的技术方案进行详细说明。
参见图1,本申请提供一种面向大规模MIMO系统的信号检测方法,包括步骤S1至步骤S5。
S1、获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差。
在大规模MIMO系统的上行链路中,设定发送端和接收端的天线数目分别为K和N,发送信号采用M阶正交幅度调制(M-QAM)。假定发送信号的向量表示,即发送信号向量x从星座集Θ中取值,平均符号能量为Es,接收信号的向量表示,即接收信号向量为y,则MIMO系统模型可以表示为y=Hx+n,其中H为瑞利平坦衰落信道矩阵,n表示均值为0,方差为的加性高斯白噪声。MIMO检测任务是接收端基站中MIMO信号检测器根据接收信号y来估计发送信号x。
S2、根据所述发送端的天线数目和所述接收端的天线数目,确定接收端信号检测器的第一阻尼系数和第二阻尼系数。
在信号接收端,提前根据发送端的天线数目和接收端的天线数目,计算接收端信号检测器所需要的阻尼系数,计算方法为:
δ=2/(λ1+λ2);
式中,K和N分别为发送端和接收端的天线数目,δ为第一阻尼系数,ω为第二阻尼系数。
S3、根据接收信号、信道矩阵、噪声方差、平均符号能量和第一阻尼系数,确定发送信号的后验概率分布的初始均值和逆协方差矩阵。
由于在大规模MIMO系统中,直接求解每个发送信号向量的后验概率会带来极大的计算复杂度,因此本申请实施例将发送信号向量的后验概率分布近似为一个高斯分布,首先进行预处理运算,确定后验概率的近似高斯分布的初始均值μ和逆协方差矩阵W,为后续的SORI迭代和EPA迭代提供所需要的变量。
其中,diag′(·)表示以一个向量或者一个矩阵的对角元素构成的对角矩阵。
本申请实施例通过上述转换可以减少4K2的乘法运算。
根据匹配滤波输出B和第一阻尼系数δ对后验概率分布的均值μ进行初始化,均值μ在后续的SORI迭代中迭代更新,趋于最佳。初始均值包括第一次迭代后验概率分布的均值和第二次迭代后验概率分布的均值,表示为:
μ0=0,μ1=δB;
其中,μ0为第一次迭代后验概率分布的均值,μ1为第二次迭代后验概率分布的均值。
在得到逆协方差矩阵后,通过逆协方差矩阵确定后验概率的近似高斯分布的方差σ2,需要说明的是,确定后验概率的方差的步骤可在得到逆协方差矩阵之后进行,也可以在EPA迭代过程的开始进行,在本申请实施例的信号检测方法中计算一次方差即可。根据逆协方差矩阵W的对角构成的对角矩阵D可以得到后验概率分布的方差为:
σ2=diag(D-1);
S4、基于SORI迭代方法得到完成SORI迭代后的发送信号的后验概率分布的均值向量,以及,根据完成SORI迭代后的发送信号的近似后验概率分布的均值向量,确定腔边缘概率服从的高斯分布的初始均值。
现有技术2的EPA-wNSA方法中采用wNSA迭代,本申请实施例采用SORI迭代取代wNSA迭代,首先根据发送信号后验概率分布的初始均值、所述匹配滤波输出、所述逆协方差矩阵、所述第一阻尼系数和所述第二阻尼系数,对发送信号的后验概率分布的均值进行SORI迭代,得到完成SORI迭代后的发送信号的后验概率分布的均值向量,采用如下模型:
在得到完成SORI迭代后的发送信号的后验概率分布的均值向量之后,确定腔边缘概率服从的高斯分布的初始均值。在现有技术2的EPA-wNSA方法中,将腔边缘概率服从的高斯分布的均值t初始化为(diag(·)表示一个矩阵的对角元素构成的向量),在本申请实施例中通过步骤S2的改进可以得到由于噪声的方差diag(D-1)→1/N,可以推导出随着Es和SNR的增大无限趋近于0。因此本申请实施例提出将t0近似为表示为:
通过上式的操作可以减少2K的除法,2K乘法和2K的加法运算。
S5、基于EPA迭代方法和腔边缘概率服从的高斯分布的初始均值,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。
预设EPA的迭代次数为L2,对于i=1,...,K的K个发送端天线序号,可以同时进行以下迭代过程,也可以分批进行:
本申请实施例还提供一种面向大规模MIMO系统的信号检测系统,用于执行本申请实施例前述提供的信号检测方法,该信号检测系统包括输入单元、预处理单元、SORI单元和EPA单元。
该输入单元用于获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差,确定接收端信号检测器的第一阻尼系数和第二阻尼系数,将接收信号、信道矩阵、平均符号能量和噪声方差、第一阻尼系数和第二阻尼系数输入至信号检测系统的其他单元。
该预处理单元用于根据接收信号、信道矩阵、噪声方差、平均符号能量和第一阻尼系数,确定发送信号的后验概率分布的初始均值和逆协方差矩阵。
该SORI单元用于基于SORI迭代方法得到完成SORI迭代后的发送信号的后验概率分布的均值向量,以及,根据完成SORI迭代后的发送信号的近似后验概率分布的均值向量,确定腔边缘概率服从的高斯分布的初始均值。
该EPA单元用于基于EPA迭代方法和腔边缘概率服从的高斯分布的初始均值,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。
在一部分优选实施例中,该预处理单元采用基于对角的脉动阵列来计算HHH和HHy。本申请提出三种针对基于对角的脉动阵列的改进方法,用于计算矩阵与矩阵相乘、矩阵与向量相乘,可以任选使用,也可以组合使用。
(1)第一种改进方法为脉动阵列采用逆向数据流,相比其他MIMO检测中应用的脉动阵列可以明显减少运算时间。
该脉动阵列采用并行的方式进行数据处理,包括K(K+1)/2个处理单元PE,处理单元PE在每个时钟周期处理多组数据,假设并行度为P,则每个处理单元PE在每个时钟周期处理P组数据。
所述脉动阵列用于接收包括信道矩阵H和接收信号向量y的输入数据,输出HHH和HHy;所述处理单元PE包括计算共轭的PE-A单元和PE-Atop单元、计算HHH的对角部分的PE-B单元和PE-Btop单元、计算HHy的PE-D单元和PE-Btop单元以及计算HHH的非对角部分的PE-C单元和PE-D单元;该脉动阵列采用与其他MIMO检测中应用的脉动阵列相反的数据流动方向,所述输入数据从所述脉动阵列的长边输入至所述PE-A单元和所述PE-Atop单元,得到HH;所述信道矩阵H沿阵列的方向从脉动阵列的长边到脉动阵列一边流动,所述HH从脉动阵列的长边到脉动阵列的另一边流动。
通过这样的方式,矩阵与矩阵相乘的运算时间减少到N/P+K+1,相比之下其他MIMO检测中应用的脉动阵列需要的处理时间高达N/P+2K-1。
(2)第二种改进方法为脉动阵列配置提前相加单元,进行复数乘法运算时可以缩短脉动阵列的关键路径。
预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘,所述脉动阵列配置有提前相加模块,用于进行复数乘法运算的前处理,其中,所述复数乘法运算为第一乘数和第二乘数相乘,所述第一乘数表示为a+jb,所述第二乘数表示为c+jd;
所述提前相加模块包括第一加法单元和第二加法单元,所述第一加法单元用于计算a+b,所述第二加法单元用于计算c+d;所述提前相加模块用于将所述第一加法单元的输出和所述第二加法单元的输出传递至处理单元PE中。
由于第一乘数和第二乘数的复数乘法可以转化为:
(a+jb)(c+jd)=ac-bd+j[(a+b)(c+d)-(ac+bd)];
为了缩短关键路径,配置第一加法单元和第二加法单元,再将计算结果和a,b,c,d一起传递到处理单元PE中,通过该方法可以将脉动阵列的关键路径减少一个加法,同时只有可以忽略的硬件面积增加。
(3)第三种改进方法为脉动阵列配置四舍五入单元,能够缩小输入数据的比特宽度从而减少硬件资源。
预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘,所述脉动阵列配置有四舍五入模块,所述四舍五入模块用于将输入数据进行四舍五入来减小位宽,可以明显缩短脉动阵列的关键路径,降低复杂度,同时仍然保持了良好的检测性能。
在另一部分优选实施例中,SORI单元和EPA单元中的矩阵向量相乘的运算可采用部分并行的方式,每个时钟周期将矩阵的F列与向量的F个元素相乘,重复多次即可完成整个运算。
在另一部分优选实施例中,EPA单元的运算中采用简化的硬判决方法,其具有低复杂度和低延时的特性,主要应用于未归一化的符号的硬判决。如表1所示,简化的硬判决方法为:假设(二进制表示)为待判决符号的实部或虚部的符号位和整数位,通过判决符号位和最高整数位来进行溢出保护,当和分别为0和1时,判决结果为当二者分别为1和0时,判决结果为当最低整数位b0为0时,判决结果为b+1,为1时判决结果为b。该简化的硬判决方法仅需要判决三个比特,对比之下传统的硬判决方法需要个加法,次取绝对值操作和级的比较操作。
表1简化的硬判决方法
以下实施例将进一步说明本申请。
实施例1
参见图1,本申请实施例中信号检测系统的架构以K=32,N=128为例进行实现,该架构可支持QPSK到256-QAM多种调制。
本申请实施例提供的信号检测系统包括输入单元、预处理单元、SORI单元和EPA单元,参见图2,本申请实施例在预处理单元采用基于对角的脉动阵列来计算HHH和HHy。基于对角的脉动阵列采用二并行的方式,每个处理单元PE在每个时钟周期处理2组数据。处理单元PE-A和PE-Atop中配置了计算共轭的功能,将H输入其中,即可运算得到其共轭转置HH。处理单元PE-B和PE-Btop用来计算HHH的对角部分,HHy由处理单元PE-D和PE-Btop计算得到。HHH的非对角部分由处理单元PE-C和PE-D运算得到。
该脉动阵列采用与其他MIMO信号检测器中使用的脉动阵列相反的数据流动方向,H、y从脉动阵列的长边输入到预处理单元PE-A和PE-Atop中,经过预处理单元处理之后得到HH,之后H从上到下流动,HH从右到左流动。通过这样的方式,HHH、HHy的运算时间仅仅为N/2+K+1=97,对比之下其他MIMO信号检测器中使用的脉动阵列需要的运算时间为N/2+2K-1=127。
此外,在预处理单元添加提前相加模块来缩短脉动阵列的关键路径,复数乘法的计算可以转化为:
(a+jb)(c+jd)=ac-bd+j[(a+b)(c+d)-(ac+bd)];
为了减小关键路径,在预处理单元先计算a+b和c+d,即先将H,y及HH的实部与虚部相加,再将计算结果和输入数据一起传递到下一个运算单元,通过该方法可以将关键路径减少一个加法。
为了进一步减小硬件复杂度,在预处理单元添加四舍五入模块。具体操作为:将输入数据进行四舍五入操作来减小位宽。通过四舍五入,H和HH的位宽从9比特减小到8比特,y的位宽从11比特减小到10比特。此外,为了减小位宽缩减带来的性能损失,在HHH的计算结果中添加了0.0625的补偿项。通过以上方法可以明显缩短脉动阵列的关键路径,降低复杂度,同时仍然保持了良好的检测性能。
SORI单元和EPA单元迭代中的矩阵向量相乘的运算采用部分并行的方式。在SORI单元,每个时钟周期将逆协方差矩阵W的3列与后验概率分布的均值的估计的3个元素相乘,因此,通过11个时钟周期的计算即可得到。在EPA单元,每个时钟周期将Gram(格拉姆)矩阵A的2列与硬判决后的符号向量的2个元素相乘,经过16个时钟周期的计算可以得到
进一步地,实施例1中得到的为未归一化的符号,因此在EPA的迭代中还采用简化的硬判决方法,具体为:假设(二进制表示)为的实部或虚部的符号位和整数位,通过判决符号位和最高整数位来进行溢出保护,当和分别为0和1时,判决结果为当二者分别为1和0时,判决结果为当最低整数位b0为0时,判决结果为b+1,为1时判决结果为b。
进一步地,为了充分利用硬件资源,提高吞吐量,本申请实施例的架构采用overlap(重叠)结构,向脉动阵列中不断输入数据。参见图3,当一帧的数据向脉动阵列输入完毕,立即进行下一帧的输入。在256-QAM时,SORI和EPA单元分别需要4次和3次迭代。通过该结构,每隔N/P=64个时钟周期,就会得到一帧的计算结果。
为了评估实施例1设计的可行性和性能,硬件设计使用SystemVerilog实现,利用Design Compiler在台积电TSMC 28nm工艺下进行综合,并利用Integrated Circuit(IC)编译器进行布局布线,功耗由PrimeTime PX在平均模式下进行评估。最终本申请实施例提出的EPA-SORI检测器相比先前最优的检测器EPA-wNSA实现了更高的吞吐量,面积效率,和能量效率,其中吞吐量达到了2.2倍,面积效率达到了1.36倍。
其他具体细节可参照本申请实施例前述的信号检测方法,在此不再赘述。
由以上技术方案可知,本申请实施例提供一种面向大规模MIMO系统的信号检测方法及系统,将现有的SORI方法与EPA-wNSA方法进行结合,利用SORI来近似EPA算法初始化部分的矩阵求逆,在保证了良好的检测性能的同时减少了MIMO信号检测所需要的迭代次数;将预处理部分的变量转换为新的计算方式,即省略了其中的部分乘法运算,从而可以减少4K2的乘法运算,降低了复杂度;在SORI迭代和EPA迭代之间的数据传递过程中,经过算法推导将t0近似为消除了部分除法、乘法和加法运算,进一步降低了算法复杂度。
进一步地,本申请实施例在信号检测系统的预处理单元还采用脉动阵列,用于计算矩阵与矩阵相乘、矩阵与向量相乘。该脉动阵列可以采用逆向数据流,相比其他MIMO检测中应用的脉动阵列可以明显减少运算时间,还可以配置提前相加单元,进行复数乘法运算时可以缩短脉动阵列的关键路径,还可以配置四舍五入单元,能够缩小输入数据的比特宽度从而减少硬件资源。
进一步地,本申请实施例在EPA迭代单元还提出一种简化的硬判决方法,具有低复杂度、低延时的特性。
综上,本申请实施例提出的信号检测方法及系统与之前的EPA-wNSA方法相比,迭代次数更少,更有利于高吞吐量的硬件实现,性能可以达到相同甚至更优,同时信号检测系统的硬件架构使得实现的吞吐量更高,面积效率和能量效率也更高。
以上所述的本申请实施方式并不构成对本申请保护范围的限定。
Claims (10)
1.一种面向大规模MIMO系统的信号检测方法,其特征在于,包括:
获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、噪声方差和平均符号能量;
根据所述发送端的天线数目和所述接收端的天线数目,确定接收端信号检测器的第一阻尼系数和第二阻尼系数;
根据所述接收信号、所述信道矩阵、所述噪声方差、所述平均符号能量和所述第一阻尼系数,确定发送信号后验概率分布的初始均值、逆协方差矩阵和接收信号的匹配滤波输出;
根据所述发送信号后验概率分布的初始均值、所述匹配滤波输出、所述逆协方差矩阵、所述第一阻尼系数和所述第二阻尼系数,对发送信号的后验概率分布的均值进行SORI迭代,得到完成SORI迭代后的发送信号的后验概率分布的均值向量,以及,根据完成SORI迭代后的发送信号的后验概率分布的均值向量,确定腔边缘概率服从的高斯分布的初始均值;
根据所述逆协方差矩阵得到发送信号的后验概率分布的方差,以及,基于所述后验概率分布的方差和腔边缘概率服从的高斯分布的初始均值,采用EPA迭代方法,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。
3.根据权利要求1所述的一种面向大规模MIMO系统的信号检测方法,其特征在于,所述根据所述接收信号、所述信道矩阵、所述噪声方差、所述平均符号能量和所述第一阻尼系数,确定发送信号后验概率分布的初始均值、逆协方差矩阵和接收信号的匹配滤波输出,包括:
根据信道矩阵和噪声方差确定逆协方差矩阵的过程,采用以下模型:
W=HHH+diag′(Λi);
根据信道矩阵和接收信号确定接收信号的匹配滤波输出的过程,采用以下模型:
式中,B为匹配滤波输出,y为接收信号向量;
根据匹配滤波输出和第一阻尼系数对后验概率分布的均值初始化,得到后验概率分布的初始均值,所述初始均值包括第一次迭代后验概率分布的均值和第二次迭代后验概率分布的均值,表示为:
μ0=0,μ1=δB;
其中,μ0为第一次迭代后验概率分布的均值,μ1为第二次迭代后验概率分布的均值。
6.根据权利要求1所述的一种面向大规模MIMO系统的信号检测方法,其特征在于,所述基于所述后验概率分布的方差和腔边缘概率服从的高斯分布的初始均值,采用EPA迭代方法,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值,包括:
预设迭代次数,得到达到预设迭代次数的腔边缘概率服从的高斯分布的均值,以及,以达到预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。
7.一种面向大规模MIMO系统的信号检测系统,用于执行权利要求1至权利要求6中任一项的所述信号检测方法,其特征在于,包括输入单元、预处理单元、SORI单元和EPA单元;
所述输入单元用于获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差,确定接收端信号检测器的第一阻尼系数和第二阻尼系数,将接收信号、信道矩阵、平均符号能量和噪声方差、第一阻尼系数和第二阻尼系数输入至预处理单元、SORI单元和EPA单元;
所述预处理单元用于根据接收信号、信道矩阵、噪声方差、平均符号能量和第一阻尼系数,确定发送信号的后验概率分布的初始均值和逆协方差矩阵;
所述SORI单元用于基于SORI迭代方法得到完成SORI迭代后的发送信号的后验概率分布的均值向量,以及,根据完成SORI迭代后的发送信号的近似后验概率分布的均值向量,确定腔边缘概率服从的高斯分布的初始均值;
所述EPA单元用于基于EPA迭代方法和腔边缘概率服从的高斯分布的初始均值,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。
8.根据权利要求7所述的一种面向大规模MIMO系统的信号检测系统,其特征在于,所述预处理单元配置有基于对角的脉动阵列,所述脉动阵列包括K(K+1)/2个处理单元PE,所述处理单元PE在每个时钟周期处理多组数据;
所述脉动阵列用于接收包括信道矩阵H和接收信号向量y的输入数据,输出HHH和HHy;所述处理单元PE包括计算共轭的PE-A单元和PE-Atop单元、计算HHH的对角部分的PE-B单元和PE-Btop单元、计算HHy的PE-D单元和PE-Btop单元以及计算HHH的非对角部分的PE-C单元和PE-D单元;
所述脉动阵列采用逆向数据流,所述输入数据从所述脉动阵列的长边输入至所述PE-A单元和所述PE-Atop单元,得到HH;所述信道矩阵H沿阵列的方向从脉动阵列的长边到脉动阵列一边流动,所述HH从脉动阵列的长边到脉动阵列的另一边流动。
9.根据权利要求7所述的一种面向大规模MIMO系统的信号检测系统,其特征在于,所述预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘;
所述脉动阵列配置有提前相加模块,用于进行复数乘法运算的前处理,其中,所述复数乘法运算为第一乘数和第二乘数相乘,所述第一乘数表示为a+jb,所述第二乘数表示为c+jd;
所述提前相加模块包括第一加法单元和第二加法单元,所述第一加法单元用于计算a+b,所述第二加法单元用于计算c+d;所述提前相加模块用于将所述第一加法单元的输出和所述第二加法单元的输出传递至处理单元PE中。
10.根据权利要求7所述的一种面向大规模MIMO系统的信号检测系统,其特征在于,所述预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘;所述脉动阵列配置有四舍五入模块,所述四舍五入模块用于将输入数据进行四舍五入来减小位宽。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210864604.5A CN115276729A (zh) | 2022-07-21 | 2022-07-21 | 一种面向大规模mimo系统的信号检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210864604.5A CN115276729A (zh) | 2022-07-21 | 2022-07-21 | 一种面向大规模mimo系统的信号检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115276729A true CN115276729A (zh) | 2022-11-01 |
Family
ID=83766177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210864604.5A Pending CN115276729A (zh) | 2022-07-21 | 2022-07-21 | 一种面向大规模mimo系统的信号检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115276729A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105915477A (zh) * | 2016-04-19 | 2016-08-31 | 东南大学 | 基于gs方法的大规模mimo检测方法及硬件架构 |
CN113055060A (zh) * | 2021-03-08 | 2021-06-29 | 上海交通大学 | 面向大规模mimo信号检测的粗粒度可重构架构系统 |
CN113541747A (zh) * | 2021-07-01 | 2021-10-22 | 网络通信与安全紫金山实验室 | 一种大规模mimo检测方法、装置和存储介质 |
CN113630160A (zh) * | 2021-08-13 | 2021-11-09 | 网络通信与安全紫金山实验室 | 一种大规模mimo检测方法、装置、设备和存储介质 |
CN113660016A (zh) * | 2021-08-20 | 2021-11-16 | 网络通信与安全紫金山实验室 | 基于epa的mimo检测方法、装置、设备和存储介质 |
CN113691353A (zh) * | 2021-08-26 | 2021-11-23 | 南京大学 | 一种低复杂度的信号检测方法及系统 |
-
2022
- 2022-07-21 CN CN202210864604.5A patent/CN115276729A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105915477A (zh) * | 2016-04-19 | 2016-08-31 | 东南大学 | 基于gs方法的大规模mimo检测方法及硬件架构 |
CN113055060A (zh) * | 2021-03-08 | 2021-06-29 | 上海交通大学 | 面向大规模mimo信号检测的粗粒度可重构架构系统 |
CN113541747A (zh) * | 2021-07-01 | 2021-10-22 | 网络通信与安全紫金山实验室 | 一种大规模mimo检测方法、装置和存储介质 |
CN113630160A (zh) * | 2021-08-13 | 2021-11-09 | 网络通信与安全紫金山实验室 | 一种大规模mimo检测方法、装置、设备和存储介质 |
CN113660016A (zh) * | 2021-08-20 | 2021-11-16 | 网络通信与安全紫金山实验室 | 基于epa的mimo检测方法、装置、设备和存储介质 |
CN113691353A (zh) * | 2021-08-26 | 2021-11-23 | 南京大学 | 一种低复杂度的信号检测方法及系统 |
Non-Patent Citations (3)
Title |
---|
QIAN DENG ET AL.: "Improved Approximate Expectation Propagation Massive MIMO Detector with Second-Order Richardson Iteration", 《WIRELESS COMMUNICATIONS AND MOBILE COMPUTING》, vol. 2022, 16 February 2022 (2022-02-16), pages 1 - 13 * |
XIAOSI TAN ET AL.: "Efficient Expectation Propagation Massive MIMO Detector With Neumann-Series Approximation", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS—II: EXPRESS BRIEFS》, vol. 67, no. 10, 31 October 2020 (2020-10-31), pages 1924 - 1928, XP011810792, DOI: 10.1109/TCSII.2019.2959402 * |
YANGYANG CHEN ET AL.: "An Efficient Massive MIMO Detector Based on Approximate Expectation Propagation", 《IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS》, vol. 31, no. 5, 31 May 2023 (2023-05-31) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7492815B2 (en) | Reduced parallel and pipelined high-order MIMO LMMSE receiver architecture | |
Liu et al. | Energy-and area-efficient recursive-conjugate-gradient-based MMSE detector for massive MIMO systems | |
US9729277B2 (en) | Signal detecting method and device | |
Peng et al. | Low-computing-load, high-parallelism detection method based on Chebyshev iteration for massive MIMO systems with VLSI architecture | |
Chen et al. | Low-complexity precoding design for massive multiuser MIMO systems using approximate message passing | |
Chen et al. | An intra-iterative interference cancellation detector for large-scale MIMO communications based on convex optimization | |
CN105049097A (zh) | 非理想信道下大规模mimo线性检测硬件构架及检测方法 | |
CN107086971A (zh) | 一种适用于多种天线配置的大规模mimo软检测方法 | |
Tu et al. | An efficient massive MIMO detector based on second-order Richardson iteration: From algorithm to flexible architecture | |
CN113691353B (zh) | 一种低复杂度的信号检测方法及系统 | |
Azari et al. | Automated deep learning-based wide-band receiver | |
CN107222246B (zh) | 一种近似mmse性能的高效大规模mimo检测方法及系统 | |
Cuong et al. | Hardware implementation of the efficient SOR-based massive MIMO detection for uplink | |
CN107231177B (zh) | 基于大规模mimo的高效cr检测方法和架构 | |
Hwang et al. | A low complexity geometric mean decomposition computing scheme and its high throughput VLSI implementation | |
Wu et al. | Efficient near-MMSE detector for large-scale MIMO systems | |
CN105978609A (zh) | 一种相关信道下大规模mimo线性检测硬件构架及方法 | |
Chen et al. | An efficient massive MIMO detector based on approximate expectation propagation | |
CN115276729A (zh) | 一种面向大规模mimo系统的信号检测方法及系统 | |
CN109379116B (zh) | 基于切比雪夫加速法与sor算法的大规模mimo线性检测算法 | |
US7974370B2 (en) | Parallel processing for single antenna interference cancellation | |
Zhang et al. | A model-driven deep learning network for quantized GFDM receiver | |
CN109525296B (zh) | 基于自适应阻尼Jacobi迭代的大规模MIMO检测方法和装置 | |
Chen et al. | Selection based list detection with approximate matrix inversion for large-scale MIMO systems | |
Xue et al. | Hardware efficient signal detector based on Lanczos method for massive MIMO systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |