CN115276729A

CN115276729A - 一种面向大规模mimo系统的信号检测方法及系统

Info

Publication number: CN115276729A
Application number: CN202210864604.5A
Authority: CN
Inventors: 王中风; 陈洋洋; 宋苏文; 林军
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2022-07-21
Filing date: 2022-07-21
Publication date: 2022-11-01

Abstract

本申请提供一种面向大规模MIMO系统的信号检测方法及系统，根据发送端的天线数目和接收端的天线数目，确定第一阻尼系数和第二阻尼系数；根据接收信号、信道矩阵、平均符号能量和第一阻尼系数，确定发送信号后验概率分布的初始均值；利用SORI方法对发送信号的后验概率分布的均值进行SORI迭代，根据完成SORI迭代后的均值向量，确定腔边缘概率服从的高斯分布的初始均值；采用EPA迭代方法，迭代更新腔边缘概率服从的高斯分布的均值，将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。将SORI和EPA算法相结合，利用SORI来近似EPA算法初始化部分的矩阵求逆，从而大大提高收敛速度。

Description

一种面向大规模MIMO系统的信号检测方法及系统

技术领域

本申请涉及移动通信技术领域，具体涉及一种面向大规模MIMO系统的信号检测方法及系统。

背景技术

大规模多输入多输出技术(Multiple-Input Multiple-Output，MIMO)作为多用户通信的解决方案，已经成为5G通信系统的关键技术之一。由于相比传统小规模MIMO系统增加了接收端和发送端的天线数目，大规模天线系统在频谱效率、能量效率和连接可靠性方面都具有很大的优势。尽管如此，天线数目的大量增加也使得接收端的信号检测成为一个巨大的挑战。

目前的信号检测方法主要分为线性检测和非线性检测。传统的线性检测需要矩阵求逆运算，复杂度较高，为了减小复杂度，现有技术公开了一些基于迭代对矩阵求逆进行近似的方法，例如二阶Richardson迭代(SORI)和纽曼级数近似(NSA)。然而，随着天线数目的增加，线性检测和它们的近似算法性能都达到了饱和。非线性检测算法相比线性检测往往能够实现更优的检测性能，特别是期望传播(EP)算法可以实现近似最优的检测性能。

传统EP算法的每次迭代都需要一个矩阵求逆运算，极高的复杂度给硬件实现带来了困难。现有技术1(X.Tan,Y.-L.Ueng,Z.Zhang,X.You and C.Zhang,“A low complexitymassive MIMO detection based on approximate expectation propagation,”IEEETrans.Veh.Technol.,vol.68,no.8,pp.7260–7272,Aug.2019)提出一种近似EP算法(EPA)，通过重建和近似将EP算法进行简化，同时消除每次迭代时的矩阵求逆，但保留一个初始的矩阵求逆运算。现有技术2(X.Tan et al:,“Approximate expectation propagationmassive MIMO detector with weighted Neumann-series,”IEEE Trans.CircuitsSyst.II:Exp.Briefs,vol.68,no.2,pp.662–666,Feb.2021.)提出在EPA的基础上提出了EPA-wNSA算法，通过加权的纽曼序列(wNSA)的迭代运算来近似初始的矩阵求逆，同时将EPA的迭代过程进一步优化，从而减小了复杂度。

然而，EPA-wNSA算法仍然有一些需要改进的地方，它比较慢的收敛速度不利于高吞吐量的硬件实现，并且算法的初始化部分和所需的除法操作也消耗了大量的计算资源。

发明内容

本申请提供一种面向大规模MIMO系统的信号检测方法及系统，以实现更快收敛速度和更低复杂度的信号检测。

本申请第一方面提供一种面向大规模MIMO系统的信号检测方法，包括：

获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差；

根据所述发送端的天线数目和所述接收端的天线数目，确定接收端信号检测器的第一阻尼系数和第二阻尼系数；

根据所述接收信号、所述信道矩阵、所述噪声方差、所述平均符号能量和所述第一阻尼系数，确定发送信号后验概率分布的初始均值、逆协方差矩阵和接收信号的匹配滤波输出；

根据所述发送信号后验概率分布的初始均值、所述匹配滤波输出、所述逆协方差矩阵、所述第一阻尼系数和所述第二阻尼系数，对发送信号的后验概率分布的均值进行SORI迭代，得到完成SORI迭代后的发送信号的后验概率分布的均值向量，以及，根据完成SORI迭代后的发送信号的后验概率分布的均值向量，确定腔边缘概率服从的高斯分布的初始均值；

根据所述逆协方差矩阵得到发送信号的后验概率分布的方差，以及，基于所述后验概率分布的方差和腔边缘概率服从的高斯分布的初始均值，采用EPA迭代方法，迭代更新腔边缘概率服从的高斯分布的均值，将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。

可选地，所述根据所述发送端的天线数目和所述接收端的天线数目，确定接收端信号检测器的第一阻尼系数和第二阻尼系数，采用以下模型：

δ＝2/(λ₁+λ₂)；

式中，K和N分别为发送端和接收端的天线数目，δ为第一阻尼系数，ω为第二阻尼系数。

可选地，所述根据所述接收信号、所述信道矩阵、所述噪声方差、所述平均符号能量和所述第一阻尼系数，确定发送信号后验概率分布的初始均值、逆协方差矩阵和接收信号的匹配滤波输出，包括：

根据信道矩阵和噪声方差确定逆协方差矩阵的过程，采用以下模型：

W＝H^HH+diag′(Λ_i)；

式中，W为逆协方差矩阵，H为信道矩阵，diag′(·)表示以一个向量或者一个矩阵的对角元素构成的对角矩阵，Λ_i为设置参数，

i表示发送信号的信号维度即发送端天线的序号，

为噪声方差，E_s为平均符号能量；

根据信道矩阵和接收信号确定接收信号的匹配滤波输出的过程，采用以下模型：

式中，B为匹配滤波输出，y为接收信号向量；

根据匹配滤波输出和第一阻尼系数对后验概率分布的均值初始化，得到后验概率分布的初始均值，所述初始均值包括第一次迭代后验概率分布的均值和第二次迭代后验概率分布的均值，表示为：

μ⁰＝0，μ¹＝δB；

其中，μ⁰为第一次迭代后验概率分布的均值，μ¹为第二次迭代后验概率分布的均值。

可选地，所述根据所述发送信号后验概率分布的初始均值、所述匹配滤波输出、所述逆协方差矩阵、所述第一阻尼系数和所述第二阻尼系数，对发送信号的后验概率分布的均值进行SORI迭代，得到完成SORI迭代后的发送信号的后验概率分布的均值向量，采用以下模型：

式中，预设SORI迭代次数为L₁-1，则完成SORI迭代后的发送信号的后验概率分布的均值向量为

可选地，所述根据完成SORI迭代后的发送信号的后验概率分布的均值向量，确定腔边缘概率服从的高斯分布的初始均值，采用以下模型：

式中，t⁰为腔边缘概率服从的高斯分布的初始均值。

可选地，所述基于所述后验概率分布的方差和腔边缘概率服从的高斯分布的初始均值，采用EPA迭代方法，迭代更新腔边缘概率服从的高斯分布的均值，将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值，包括：

对第i维腔边缘概率服从的高斯分布的均值

进行硬判决，得到当前迭代的估计符号向量

具体采用以下模型：

式中，l₂表示当前迭代次数，

为星座集Θ中的星座点，该星座集Θ是由调制阶数和调制方式所确定的，

表示在第l₂次迭代，使

最小时的

的取值，

为上一次迭代更新的腔边缘概率服从的高斯分布的均值；

更新第i维腔边缘概率服从的高斯分布的均值

具体采用以下模型：

式中，Gram(格拉姆)矩阵A＝H^HH，

为第i维后验概率分布的方差，B_i为匹配滤波输出

的第i行的元素；

利用缩放因子β(0＜β＜1)对

进行缩放，具体采用以下模型：

预设迭代次数，得到达到预设迭代次数的腔边缘概率服从的高斯分布的均值，以及，以达到预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。

本申请第二方面提供一种面向大规模MIMO系统的信号检测系统，用于执行本申请第一方面提供的信号检测方法，包括输入单元、预处理单元、SORI单元和EPA单元；

所述输入单元用于获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差，确定接收端信号检测器的第一阻尼系数和第二阻尼系数，将接收信号、信道矩阵、平均符号能量和噪声方差、第一阻尼系数和第二阻尼系数输入至预处理单元、SORI单元和EPA单元；

所述预处理单元用于根据接收信号、信道矩阵、噪声方差、平均符号能量和第一阻尼系数，确定发送信号的后验概率分布的初始均值和逆协方差矩阵；

所述SORI单元用于基于SORI迭代方法得到完成SORI迭代后的发送信号的后验概率分布的均值向量，以及，根据完成SORI迭代后的发送信号的近似后验概率分布的均值向量，确定腔边缘概率服从的高斯分布的初始均值；

所述EPA单元用于基于EPA迭代方法和腔边缘概率服从的高斯分布的初始均值，迭代更新腔边缘概率服从的高斯分布的均值，将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。

可选地，所述预处理单元配置有基于对角的脉动阵列，所述脉动阵列包括K(K+1)/2个处理单元PE，所述处理单元PE在每个时钟周期处理多组数据；

所述脉动阵列用于接收包括信道矩阵H和接收信号向量y的输入数据，输出H^HH和H^Hy；所述处理单元PE包括计算共轭的PE-A单元和PE-A_top单元、计算H^HH的对角部分的PE-B单元和PE-B_top单元、计算H^Hy的PE-D单元和PE-B_Top单元以及计算H^HH的非对角部分的PE-C单元和PE-D单元；

所述脉动阵列采用逆向数据流，所述输入数据从所述脉动阵列的长边输入至所述PE-A单元和所述PE-A_top单元，得到H^H；所述信道矩阵H沿阵列的方向从脉动阵列的长边到脉动阵列一边流动，所述H^H从脉动阵列的长边到脉动阵列的另一边流动。

可选地，所述预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘；

所述脉动阵列配置有提前相加模块，用于进行复数乘法运算的前处理，其中，所述复数乘法运算为第一乘数和第二乘数相乘，所述第一乘数表示为a+jb，所述第二乘数表示为c+jd；

所述提前相加模块包括第一加法单元和第二加法单元，所述第一加法单元用于计算a+b，所述第二加法单元用于计算c+d；所述提前相加模块用于将所述第一加法单元的输出和所述第二加法单元的输出传递至处理单元PE中。

可选地，所述预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘；所述脉动阵列配置有四舍五入模块，所述四舍五入模块用于将输入数据进行四舍五入来减小位宽。

由以上技术方案可知，本申请提供的面向大规模MIMO系统的信号检测方法及系统，将SORI和EPA算法相结合，利用SORI来近似EPA算法初始化部分的矩阵求逆，从而大大提高收敛速度，相比EPA-wNSA可以减少约50％到67％的迭代次数。其次，通过算法转换降低初始化部分的复杂度，并消除两个迭代之间的除法操作。此外，本申请提供的信号检测系统采用一款高吞吐量的硬件架构，该硬件架构包括基于对角的脉动阵列，该脉动阵列用于计算矩阵与矩阵相乘、矩阵与向量相乘，其中包含三种改进方法，可以任选使用，包括采用逆向数据流，相比其他MIMO检测中应用的脉动阵列可以明显减少运算时间；配置提前相加单元，进行复数乘法运算时可以缩短脉动阵列的关键路径；配置四舍五入单元，能够缩小输入数据的比特宽度从而减少硬件资源。

附图说明

图1为本申请实施例提供的信号检测系统的结构示意图；

图2为本申请实施例提供的预处理单元采用的脉动阵列的结构示意图；

图3为本申请实施例提供的信号检测系统的时序安排示意图。

具体实施方式

以下将结合附图，对本申请的技术方案进行详细说明。

参见图1，本申请提供一种面向大规模MIMO系统的信号检测方法，包括步骤S1至步骤S5。

S1、获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差。

在大规模MIMO系统的上行链路中，设定发送端和接收端的天线数目分别为K和N，发送信号采用M阶正交幅度调制(M-QAM)。假定发送信号的向量表示，即发送信号向量x从星座集Θ中取值，平均符号能量为E_s，接收信号的向量表示，即接收信号向量为y，则MIMO系统模型可以表示为y＝Hx+n，其中H为瑞利平坦衰落信道矩阵，n表示均值为0，方差为

的加性高斯白噪声。MIMO检测任务是接收端基站中MIMO信号检测器根据接收信号y来估计发送信号x。

S2、根据所述发送端的天线数目和所述接收端的天线数目，确定接收端信号检测器的第一阻尼系数和第二阻尼系数。

在信号接收端，提前根据发送端的天线数目和接收端的天线数目，计算接收端信号检测器所需要的阻尼系数，计算方法为：

δ＝2/(λ₁+λ₂)；

S3、根据接收信号、信道矩阵、噪声方差、平均符号能量和第一阻尼系数，确定发送信号的后验概率分布的初始均值和逆协方差矩阵。

由于在大规模MIMO系统中，直接求解每个发送信号向量的后验概率会带来极大的计算复杂度，因此本申请实施例将发送信号向量的后验概率分布近似为一个高斯分布，首先进行预处理运算，确定后验概率的近似高斯分布的初始均值μ和逆协方差矩阵W，为后续的SORI迭代和EPA迭代提供所需要的变量。

在现有技术2的EPA-wNSA方法中采用的逆协方差矩阵

其中设置参数Λ_i的值为

i表示发送信号的信号维度即发送端天线的序号，并对接收信号向量y进行匹配滤波得到匹配滤波输出为

本申请实施例为减少乘法运算，将现有技术2中的逆协方差矩阵W扩大

将匹配滤波输出B扩大

表示为：

其中，diag′(·)表示以一个向量或者一个矩阵的对角元素构成的对角矩阵。

本申请实施例通过上述转换可以减少4K²的乘法运算。

根据匹配滤波输出B和第一阻尼系数δ对后验概率分布的均值μ进行初始化，均值μ在后续的SORI迭代中迭代更新，趋于最佳。初始均值包括第一次迭代后验概率分布的均值和第二次迭代后验概率分布的均值，表示为：

μ⁰＝0，μ¹＝δB；

在得到逆协方差矩阵后，通过逆协方差矩阵确定后验概率的近似高斯分布的方差σ²，需要说明的是，确定后验概率的方差的步骤可在得到逆协方差矩阵之后进行，也可以在EPA迭代过程的开始进行，在本申请实施例的信号检测方法中计算一次方差即可。根据逆协方差矩阵W的对角构成的对角矩阵D可以得到后验概率分布的方差为：

σ²＝diag(D^-1)；

S4、基于SORI迭代方法得到完成SORI迭代后的发送信号的后验概率分布的均值向量，以及，根据完成SORI迭代后的发送信号的近似后验概率分布的均值向量，确定腔边缘概率服从的高斯分布的初始均值。

现有技术2的EPA-wNSA方法中采用wNSA迭代，本申请实施例采用SORI迭代取代wNSA迭代，首先根据发送信号后验概率分布的初始均值、所述匹配滤波输出、所述逆协方差矩阵、所述第一阻尼系数和所述第二阻尼系数，对发送信号的后验概率分布的均值进行SORI迭代，得到完成SORI迭代后的发送信号的后验概率分布的均值向量，采用如下模型：

预设SORI迭代次数为L₁-1，则迭代结果为

在得到完成SORI迭代后的发送信号的后验概率分布的均值向量之后，确定腔边缘概率服从的高斯分布的初始均值。在现有技术2的EPA-wNSA方法中，将腔边缘概率服从的高斯分布的均值t初始化为

(diag(·)表示一个矩阵的对角元素构成的向量)，在本申请实施例中通过步骤S2的改进可以得到

由于噪声的方差

diag(D^-1)→1/N，可以推导出

随着E_s和SNR的增大无限趋近于0。因此本申请实施例提出将t⁰近似为

表示为：

通过上式的操作可以减少2K的除法，2K乘法和2K的加法运算。

S5、基于EPA迭代方法和腔边缘概率服从的高斯分布的初始均值，迭代更新腔边缘概率服从的高斯分布的均值，将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。

预设EPA的迭代次数为L₂，对于i＝1，...，K的K个发送端天线序号，可以同时进行以下迭代过程，也可以分批进行：

S501、对第i维腔边缘概率服从的高斯分布的均值

进行硬判决，得到当前迭代的估计符号向量

其中，l₂表示当前迭代次数，

表示在第l₂次迭代，使

最小时的

的取值，

为上一次迭代更新的腔边缘概率服从的高斯分布的均值。

S502、更新第i维腔边缘概率服从的高斯分布的均值

其中，Gram(格拉姆)矩阵A＝H^HH，

为第i维后验概率分布的方差，B_i为匹配滤波输出

的第i行的元素。

S503、利用缩放因子β(0＜β＜1)对

进行缩放，以加速收敛。

在L₂次迭代之后，得到

即为最终得到的对发送信号向量x的软信息的估计。

本申请实施例还提供一种面向大规模MIMO系统的信号检测系统，用于执行本申请实施例前述提供的信号检测方法，该信号检测系统包括输入单元、预处理单元、SORI单元和EPA单元。

该输入单元用于获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、平均符号能量和噪声方差，确定接收端信号检测器的第一阻尼系数和第二阻尼系数，将接收信号、信道矩阵、平均符号能量和噪声方差、第一阻尼系数和第二阻尼系数输入至信号检测系统的其他单元。

该预处理单元用于根据接收信号、信道矩阵、噪声方差、平均符号能量和第一阻尼系数，确定发送信号的后验概率分布的初始均值和逆协方差矩阵。

该SORI单元用于基于SORI迭代方法得到完成SORI迭代后的发送信号的后验概率分布的均值向量，以及，根据完成SORI迭代后的发送信号的近似后验概率分布的均值向量，确定腔边缘概率服从的高斯分布的初始均值。

该EPA单元用于基于EPA迭代方法和腔边缘概率服从的高斯分布的初始均值，迭代更新腔边缘概率服从的高斯分布的均值，将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。

在一部分优选实施例中，该预处理单元采用基于对角的脉动阵列来计算H^HH和H^Hy。本申请提出三种针对基于对角的脉动阵列的改进方法，用于计算矩阵与矩阵相乘、矩阵与向量相乘，可以任选使用，也可以组合使用。

(1)第一种改进方法为脉动阵列采用逆向数据流，相比其他MIMO检测中应用的脉动阵列可以明显减少运算时间。

该脉动阵列采用并行的方式进行数据处理，包括K(K+1)/2个处理单元PE，处理单元PE在每个时钟周期处理多组数据，假设并行度为P，则每个处理单元PE在每个时钟周期处理P组数据。

所述脉动阵列用于接收包括信道矩阵H和接收信号向量y的输入数据，输出H^HH和H^Hy；所述处理单元PE包括计算共轭的PE-A单元和PE-A_top单元、计算H^HH的对角部分的PE-B单元和PE-B_top单元、计算H^Hy的PE-D单元和PE-B_top单元以及计算H^HH的非对角部分的PE-C单元和PE-D单元；该脉动阵列采用与其他MIMO检测中应用的脉动阵列相反的数据流动方向，所述输入数据从所述脉动阵列的长边输入至所述PE-A单元和所述PE-A_top单元，得到H^H；所述信道矩阵H沿阵列的方向从脉动阵列的长边到脉动阵列一边流动，所述H^H从脉动阵列的长边到脉动阵列的另一边流动。

通过这样的方式，矩阵与矩阵相乘的运算时间减少到N/P+K+1，相比之下其他MIMO检测中应用的脉动阵列需要的处理时间高达N/P+2K-1。

(2)第二种改进方法为脉动阵列配置提前相加单元，进行复数乘法运算时可以缩短脉动阵列的关键路径。

预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘，所述脉动阵列配置有提前相加模块，用于进行复数乘法运算的前处理，其中，所述复数乘法运算为第一乘数和第二乘数相乘，所述第一乘数表示为a+jb，所述第二乘数表示为c+jd；

由于第一乘数和第二乘数的复数乘法可以转化为：

(a+jb)(c+jd)＝ac-bd+j[(a+b)(c+d)-(ac+bd)]；

为了缩短关键路径，配置第一加法单元和第二加法单元，再将计算结果和a，b，c，d一起传递到处理单元PE中，通过该方法可以将脉动阵列的关键路径减少一个加法，同时只有可以忽略的硬件面积增加。

(3)第三种改进方法为脉动阵列配置四舍五入单元，能够缩小输入数据的比特宽度从而减少硬件资源。

预处理单元采用脉动阵列计算矩阵与矩阵或矩阵与向量相乘，所述脉动阵列配置有四舍五入模块，所述四舍五入模块用于将输入数据进行四舍五入来减小位宽，可以明显缩短脉动阵列的关键路径，降低复杂度，同时仍然保持了良好的检测性能。

在另一部分优选实施例中，SORI单元和EPA单元中的矩阵向量相乘的运算可采用部分并行的方式，每个时钟周期将矩阵的F列与向量的F个元素相乘，重复多次即可完成整个运算。

在另一部分优选实施例中，EPA单元的运算中采用简化的硬判决方法，其具有低复杂度和低延时的特性，主要应用于未归一化的符号的硬判决。如表1所示，简化的硬判决方法为：假设

(二进制表示)为待判决符号的实部或虚部的符号位和整数位，通过判决符号位

和最高整数位

来进行溢出保护，当

和

分别为0和1时，判决结果为

当二者分别为1和0时，判决结果为

当最低整数位b₀为0时，判决结果为b+1，为1时判决结果为b。该简化的硬判决方法仅需要判决三个比特，对比之下传统的硬判决方法需要

个加法，

次取绝对值操作和

级的比较操作。

表1简化的硬判决方法

以下实施例将进一步说明本申请。

实施例1

参见图1，本申请实施例中信号检测系统的架构以K＝32，N＝128为例进行实现，该架构可支持QPSK到256-QAM多种调制。

本申请实施例提供的信号检测系统包括输入单元、预处理单元、SORI单元和EPA单元，参见图2，本申请实施例在预处理单元采用基于对角的脉动阵列来计算H^HH和H^Hy。基于对角的脉动阵列采用二并行的方式，每个处理单元PE在每个时钟周期处理2组数据。处理单元PE-A和PE-A_top中配置了计算共轭的功能，将H输入其中，即可运算得到其共轭转置H^H。处理单元PE-B和PE-B_top用来计算H^HH的对角部分，H^Hy由处理单元PE-D和PE-B_top计算得到。H^HH的非对角部分由处理单元PE-C和PE-D运算得到。

该脉动阵列采用与其他MIMO信号检测器中使用的脉动阵列相反的数据流动方向，H、y从脉动阵列的长边输入到预处理单元PE-A和PE-A_top中，经过预处理单元处理之后得到H^H，之后H从上到下流动，H^H从右到左流动。通过这样的方式，H^HH、H^Hy的运算时间仅仅为N/2+K+1＝97，对比之下其他MIMO信号检测器中使用的脉动阵列需要的运算时间为N/2+2K-1＝127。

此外，在预处理单元添加提前相加模块来缩短脉动阵列的关键路径，复数乘法的计算可以转化为：

(a+jb)(c+jd)＝ac-bd+j[(a+b)(c+d)-(ac+bd)]；

为了减小关键路径，在预处理单元先计算a+b和c+d，即先将H，y及H^H的实部与虚部相加，再将计算结果和输入数据一起传递到下一个运算单元，通过该方法可以将关键路径减少一个加法。

为了进一步减小硬件复杂度，在预处理单元添加四舍五入模块。具体操作为：将输入数据进行四舍五入操作来减小位宽。通过四舍五入，H和H^H的位宽从9比特减小到8比特，y的位宽从11比特减小到10比特。此外，为了减小位宽缩减带来的性能损失，在H^HH的计算结果中添加了0.0625的补偿项。通过以上方法可以明显缩短脉动阵列的关键路径，降低复杂度，同时仍然保持了良好的检测性能。

SORI单元和EPA单元迭代中的矩阵向量相乘的运算采用部分并行的方式。在SORI单元，每个时钟周期将逆协方差矩阵W的3列与后验概率分布的均值的估计

的3个元素相乘，因此，

通过11个时钟周期的计算即可得到。在EPA单元，每个时钟周期将Gram(格拉姆)矩阵A的2列与硬判决后的符号向量

的2个元素相乘，经过16个时钟周期的计算可以得到

进一步地，实施例1中得到的

为未归一化的符号，因此在EPA的迭代中还采用简化的硬判决方法，具体为：假设

(二进制表示)为

的实部或虚部的符号位和整数位，通过判决符号位

和最高整数位

来进行溢出保护，当

和

分别为0和1时，判决结果为

当二者分别为1和0时，判决结果为

当最低整数位b₀为0时，判决结果为b+1，为1时判决结果为b。

进一步地，为了充分利用硬件资源，提高吞吐量，本申请实施例的架构采用overlap(重叠)结构，向脉动阵列中不断输入数据。参见图3，当一帧的数据向脉动阵列输入完毕，立即进行下一帧的输入。在256-QAM时，SORI和EPA单元分别需要4次和3次迭代。通过该结构，每隔N/P＝64个时钟周期，就会得到一帧的计算结果。

为了评估实施例1设计的可行性和性能，硬件设计使用SystemVerilog实现，利用Design Compiler在台积电TSMC 28nm工艺下进行综合，并利用Integrated Circuit(IC)编译器进行布局布线，功耗由PrimeTime PX在平均模式下进行评估。最终本申请实施例提出的EPA-SORI检测器相比先前最优的检测器EPA-wNSA实现了更高的吞吐量，面积效率，和能量效率，其中吞吐量达到了2.2倍，面积效率达到了1.36倍。

其他具体细节可参照本申请实施例前述的信号检测方法，在此不再赘述。

由以上技术方案可知，本申请实施例提供一种面向大规模MIMO系统的信号检测方法及系统，将现有的SORI方法与EPA-wNSA方法进行结合，利用SORI来近似EPA算法初始化部分的矩阵求逆，在保证了良好的检测性能的同时减少了MIMO信号检测所需要的迭代次数；将预处理部分的变量转换为新的计算方式，即省略了其中的部分乘法运算，从而可以减少4K²的乘法运算，降低了复杂度；在SORI迭代和EPA迭代之间的数据传递过程中，经过算法推导将t⁰近似为

消除了部分除法、乘法和加法运算，进一步降低了算法复杂度。

进一步地，本申请实施例在信号检测系统的预处理单元还采用脉动阵列，用于计算矩阵与矩阵相乘、矩阵与向量相乘。该脉动阵列可以采用逆向数据流，相比其他MIMO检测中应用的脉动阵列可以明显减少运算时间，还可以配置提前相加单元，进行复数乘法运算时可以缩短脉动阵列的关键路径，还可以配置四舍五入单元，能够缩小输入数据的比特宽度从而减少硬件资源。

进一步地，本申请实施例在EPA迭代单元还提出一种简化的硬判决方法，具有低复杂度、低延时的特性。

综上，本申请实施例提出的信号检测方法及系统与之前的EPA-wNSA方法相比，迭代次数更少，更有利于高吞吐量的硬件实现，性能可以达到相同甚至更优，同时信号检测系统的硬件架构使得实现的吞吐量更高，面积效率和能量效率也更高。

以上所述的本申请实施方式并不构成对本申请保护范围的限定。

Claims

1.一种面向大规模MIMO系统的信号检测方法，其特征在于，包括：

获取发送端的天线数目、接收端的天线数目、接收信号、信道矩阵、噪声方差和平均符号能量；

2.根据权利要求1所述的一种面向大规模MIMO系统的信号检测方法，其特征在于，所述根据所述发送端的天线数目和所述接收端的天线数目，确定接收端信号检测器的第一阻尼系数和第二阻尼系数，采用以下模型：

δ＝2/(λ₁+λ₂)；

3.根据权利要求1所述的一种面向大规模MIMO系统的信号检测方法，其特征在于，所述根据所述接收信号、所述信道矩阵、所述噪声方差、所述平均符号能量和所述第一阻尼系数，确定发送信号后验概率分布的初始均值、逆协方差矩阵和接收信号的匹配滤波输出，包括：

W＝H^HH+diag′(Λ_i)；

i表示发送信号的信号维度即发送端天线的序号，

为噪声方差，E_s为平均符号能量；

式中，B为匹配滤波输出，y为接收信号向量；

μ⁰＝0，μ¹＝δB；

4.根据权利要求1所述的一种面向大规模MIMO系统的信号检测方法，其特征在于，所述根据所述发送信号后验概率分布的初始均值、所述匹配滤波输出、所述逆协方差矩阵、所述第一阻尼系数和所述第二阻尼系数，对发送信号的后验概率分布的均值进行SORI迭代，得到完成SORI迭代后的发送信号的后验概率分布的均值向量，采用以下模型：