CN109039416B - 基于矩阵分块的大规模mimo高效检测方法和架构 - Google Patents

基于矩阵分块的大规模mimo高效检测方法和架构 Download PDF

Info

Publication number
CN109039416B
CN109039416B CN201811099167.2A CN201811099167A CN109039416B CN 109039416 B CN109039416 B CN 109039416B CN 201811099167 A CN201811099167 A CN 201811099167A CN 109039416 B CN109039416 B CN 109039416B
Authority
CN
China
Prior art keywords
matrix
diagonal
partitioning
submatrix
mmse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811099167.2A
Other languages
English (en)
Other versions
CN109039416A (zh
Inventor
张川
季雅惠
吴至榛
申怡飞
尤肖虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201811099167.2A priority Critical patent/CN109039416B/zh
Publication of CN109039416A publication Critical patent/CN109039416A/zh
Application granted granted Critical
Publication of CN109039416B publication Critical patent/CN109039416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/08Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the receiving station
    • H04B7/0837Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the receiving station using pre-detection combining
    • H04B7/0842Weighted combining
    • H04B7/0848Joint weighting
    • H04B7/0854Joint weighting using error minimizing algorithms, e.g. minimum mean squared error [MMSE], "cross-correlation" or matrix inversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems

Abstract

本发明公开了一种基于矩阵分块的大规模MIMO高效检测方法及架构,提出的多层迭代的块对角化算法(block diagonal with multiple‑level iterations,BD‑MLI)同时适用于单天线和多天线用户系统,且在非理想传播条件中,如相关信道和低配置比,表现出鲁棒性。同时,本发明也公开了一种对应的基于超大规模集成电路的高效硬件架构。本发明在低复杂度的前提下,同时能克服相关信道、降低系统对高配置比的依赖,并且提高算法在多天线用户系统中的性能。

Description

基于矩阵分块的大规模MIMO高效检测方法和架构
技术领域
本发明涉及MIMO技术,尤其涉及一种基于矩阵分块的大规模MIMO高效检测方法和架构。
背景技术
多输入多输出(Multiple-Input Multiple-Output,MIMO)技术是指在发射端和接收端分别使用多个发射天线和多个接收天线,使信号通过发射端与接收端的多个天线进行传送和接收。长期研究表明,MIMO无线传输技术可以在不增大额外频谱带宽的情况下,大大提高传输链路的可靠性,减少基站的能量消耗,并成倍地提高通信系统的容量。区别于第四代移动通信技术中的只能在基站配置8根天线的小规模MIMO技术,大规模MIMO在基站配置数量较多的天线以同时服务于数量较少的移动终端,被视为下一代移动通信的核心技术。
然而,大规模MIMO的优势是以在基站端的急剧增加的计算复杂度为代价。考虑基站天线数为N,用户端天线数为M的大规模MIMO系统,典型取值为N=128,M=6,定义配置比为N/M。以大规模MIMO系统的上行链路信号检测为例,基于最小均方误差(minimum meansquare error,MMSE)理论的线性检测方法中,其主要复杂度来源于一个M×M阶矩阵的求逆。传统的矩阵精确求逆方法,如QR分解法、Gauss消元法、Cholesky分解法等,其复杂度很高,在O(M3)数量级。为了克服高计算复杂度、高硬件代价的困难,矩阵近似求逆的思想被提出。矩阵近似求逆旨在以较低的复杂度来逼近矩阵精确求逆下的检测性能,其中较典型的为基于诺依曼级数的矩阵近似求逆算法(Neumann series spproximation,NSA)。然而,NSA在迭代次数较多时,与传统的矩阵精确求逆复杂度并无区别。且NSA仅在理想传播条件下,即高配置比和理想信道中,才具有较好的检测性能,在非理想传播条件下,即配置比较低和相关信道中,诺依曼级数收敛速度慢或几乎不收敛,导致检测性能变得非常差。为了解决这个问题,NSA的改进算法被提出,如三对角阵近似算法(tridiagonal matrixapproximation,TMA)和矩阵分块算法(matrix partition,MP)等。这些改进算法都取得了特定的优化,如TMA在一定程度上克服了相关信道带来的检测障碍,MP能有效降低MIMO系统对高配置比的依赖且能降低NSA约68%的计算复杂度。但同时都有一定的局限性——TMA在复杂度降低上没有取得突破,MP在相关信道中检测性能急剧下降。因此,需要一种更高效的检测算法,在低复杂度的前提下,同时能克服相关信道、降低系统对高配置比的依赖。
此外,当前绝大部分文献的研究对象为各用户端仅配置单根天线的MIMO系统(以下简称单天线用户系统),然而面临用户端配置多根天线的MIMO系统(以下简称多天线用户系统),同一个用户端的天线之间由于不充分分离而导致的强相关性,使得大多数对应于单天线用户系统提出的检测算法在应用于多天线用户系统时,性能急剧下降甚至几乎失效。因此,需要提高MIMO检测算法在多天线用户系统中的性能。
发明内容
发明目的:本发明针对现有技术存在的问题,提供一种基于矩阵分块的大规模MIMO高效检测方法和架构,在低复杂度的前提下,同时能克服相关信道、降低系统对高配置比的依赖,并且提高算法在多天线用户系统中的性能。
技术方案:本发明所述的基于矩阵分块的大规模MIMO高效检测方法包括:
(1)获取经接收端匹配滤波器输出的接收信号矩阵yMF和信道响应矩阵H,并根据信道响应矩阵H构造MMSE检测矩阵W;
(2)将MMSE检测矩阵W的对角线元素块组成矩阵D,并计算得到矩阵E=W-D;
(3)将矩阵D和E分别分块,分别得到上下两个对角子矩阵,再分别将上下两个对角子矩阵按照此方式分块,直至分块级数达到T=log2m,并依照诺依曼级数定理,逐级向上求逆,直至得到矩阵D的逆D-1,其中,m为用户数;
(4)依照诺依曼级数定理根据矩阵D-1和E,计算得到MMSE检测矩阵W的逆W-1
(5)根据MMSE检测矩阵W的逆W-1以及经接收端匹配滤波器输出的接收信号矩阵yMF,计算发射信号矩阵估计值
Figure GDA0001848758830000021
进一步的,步骤(1)中MMSE检测矩阵W的计算公式为:
W=HHH+N0IM
式中,IM是M阶单位矩阵,M是用户端的天线总数,N0是加性高斯白噪声方差。
进一步的,所述信道响应矩阵H=R1/2H0T1/2,H0表示理想信道,即瑞利衰落信道,R、T分别表示接收端、用户端的空间相关性矩阵,且R和T的元素分别为
Figure GDA0001848758830000022
Figure GDA0001848758830000023
式中,Rpq、Tpq分别表示R、T的第p行第q列的元素,
Figure GDA0001848758830000024
分别表示Rpq和Tpq的共轭,相关系数ζr和ζt分别表示基站端和用户端的第p根天线与第q根天线之间的相关程度,θ是给定的相位。
进一步的,步骤(2)具体包括:
(2-1)将MMSE检测矩阵W的对角线元素块组成矩阵D,其中:
Figure GDA0001848758830000031
式中,Di表示矩阵W的第i个对角线元素块,i=1,2,..,K,Di都是O′O阶的矩阵,且O′K=M,M是用户端的天线总数,K为MMSE检测矩阵W的对角线元素块数目;
(2-2)根据矩阵D计算得到矩阵E=W-D。
进一步的,步骤(3)具体包括:
(3-1)将矩阵D按照下式分块,得到上下两个对角子矩阵D1,(1)和D2,(1)
Figure GDA0001848758830000032
其中,D1,(1)表示第1级分块时得到的第一个对角子矩阵,D2,(1)表示第1级分块时得到的第2个对角子矩阵;
(3-2)将矩阵D1,(1)和D2,(1)按照下式分块,得到子矩阵D1,(2)、D2,(2)、D3,(2)和D4,(2)
Figure GDA0001848758830000033
(3-3)按照步骤(3-2)中的方式分块,直至分块级数达到T停止,得到矩阵Dj,(t),t=1,…,T,j=1,…,2t,;
(3-4)对于矩阵E按照步骤(3-1)到(3-3)执行,得到矩阵Ej,(t),t=1,…,T,j=1,…,2t
(3-5)根据Dj,(t)和Ej,(t),依照诺依曼级数定理,逐级向上求逆,直至得到矩阵D的逆D-1,其中:
Figure GDA0001848758830000034
式中,t=T-1,…,0,j=1,…,2t,D1,(0)=D,k表示迭代次数。
进一步的,步骤(4)中MMSE检测矩阵W的逆W-1计算公式为:
Figure GDA0001848758830000041
进一步的,步骤(5)中发射信号矩阵估计值计算公式为:
Figure GDA0001848758830000042
本发明所述的基于矩阵分块的大规模MIMO高效检测架构包括:
MMSE检测矩阵W计算模块,用于根据信道响应矩阵H构造MMSE检测矩阵W;
矩阵形成模块,用于将MMSE检测矩阵W的对角线元素块组成矩阵D,并计算得到矩阵E=W-D;
矩阵分块模块,用于将矩阵D和E分别分块,分别得到上下两个对角子矩阵,再分别将上下两个对角子矩阵按照此方式分块,直至分块级数达到T=log2m;
矩阵求逆模块,用于依照诺依曼级数定理,逐级向上求逆,直至得到矩阵W的逆W-1
发射信号估计模块,用于根据MMSE检测矩阵W的逆W-1以及经接收端匹配滤波器输出的接收信号矩阵yMF,计算发射信号矩阵估计值
Figure GDA0001848758830000043
进一步的,矩阵求逆模块具体包括T级级联的PE单元,第t级有2t-1个PE单元,第t级第j个PE单元用于执行以下计算:
Figure GDA0001848758830000044
有益效果:本发明与现有技术相比,其显著优点是:
(1)在算法的误码率性能方面,本算法对于单天线和多天线用户系统在理想(理想信道、高配置比),非理想(相关性较弱的信道、低配置比)和恶劣传播条件(相关性较强的信道、低配置比)下均能在一定的迭代次数下取得接近于MMSE的检测性能,相比于仅能对于单天线用户系统在理想或至多非理想条件下收敛的NSA、TMA、MP等先前算法,有了本质上的误码率性能突破。
(2)在算法的计算复杂度方面,对于单天线用户系统在非理想传播条件下,本算法与MP算法均取得接近MMSE检测性能的同时,本算法较MP算法降低了47%的复数乘法次数,有较明显的计算复杂度上的突破。
附图说明
图1是本发明所采用的的K=2的分块方式与其他的分块方式在收敛性能上的比较图;
图2是在天线配置为N=256,M=32,信道状况为ζr=0的单天线用户系统中,本发明中的算法与TMA算法、MP算法以及标准MMSE检测的误码率性能对比图;
图3是在天线配置为N=128,M=32,信道状况为ζr=0.2的单天线用户系统中,本发明中的算法与TMA算法、MP算法以及标准MMSE检测的误码率性能对比图;
图4是在天线配置为N=128,M=32,信道状况为5的单天线用户系统中,本发明中的算法与TMA算法、MP算法以及标准MMSE检测的误码率性能对比图;
图5是在天线配置为N=256,M=32,mUE=4,信道状况为ζr=0,ζt=0.2的多天线用户系统中,本发明中的算法与TMA算法、MP算法以及标准MMSE检测的误码率性能对比图;
图6是在天线配置为N=128,M=32,mUE=4信道状况为ζr=0.2,ζt=0.4的多天线用户系统中,本发明中的算法与TMA算法、MP算法以及标准MMSE检测的误码率性能对比图;
图7是在天线配置为N=128,M=32,mUE=4,信道状况为ζr=0.5,ζt=0.6的多天线用户系统中,本发明中的算法与TMA算法、MP算法以及标准MMSE检测的误码率性能对比图;
图8是本发明中的算法对于m=8的流水线架构图;
图9是PE(t)进行计算
Figure GDA0001848758830000051
的架构细节图。
具体实施方式
一、系统模型介绍
考虑大规模MIMO系统的上行链路检测模型,其中基站端配置N根接收天线同时服务于m个用户,且每个用户配置mUE根发射天线,则用户端的天线总数为M=m′mUE。显然,当mUE=1时为单天线用户系统,当mUE≠1时为多天线用户系统。发射向量记为s=[s1...si...sm]T,其中
Figure GDA0001848758830000052
且发射能量归一化到E{|sij|2}=1。上行链路信道矩阵定义为H=[H1...Hi...Hm],其中
Figure GDA0001848758830000053
Hij是一个N维列向量,表示从第i个用户的第j根天线到基站各天线之间的信道状况。基于以上定义,基站端的接收向量y可表示为
y=Hs+n
其中,n是一个N维列向量,代表加性高斯白噪声,且每个元素服从均值为零,方差为N0的高斯分布。
关于信道矩阵,由于信道之间的空间相关性会很大程度上影响算法检测性能,多数近期文献也不再仅基于理想信道来分析,而是引入经典的相关MIMO信道模型——Kronecker模型:
H=R1/2H0T1/2,H0表示理想信道,即瑞利衰落信道,R、T分别表示接收端、用户端的空间相关性矩阵,且R和T的元素分别为
Figure GDA0001848758830000061
Figure GDA0001848758830000062
式中,Rpq、Tpq分别表示R、T的第p行第q列的元素,
Figure GDA0001848758830000063
分别表示Rpq和Tpq的共轭,相关系数ζr和ζt分别表示基站端和用户端的第p根天线与第q根天线之间的相关程度,θ是给定的相位。相关系数ζr和ζt的取值范围为0到1,且越接近于1表示相关程度越强。
二、问题分析
基于MMSE理论的线性检测,对发射向量的估计为
Figure GDA0001848758830000064
其中W=HHH+N0IM,yMF=HHy为基站端匹配滤波器的输出。可以看出,这里涉及M*M阶矩阵W的求逆。
根据诺依曼级数定理,如果矩阵W存在一个正定可逆的相近矩阵X,即
Figure GDA0001848758830000065
那么W-1可以用诺依曼级数展开为
Figure GDA0001848758830000066
在实际应用中,取前k项作为W-1的近似,并令D=X和E=W-X,可以得到W-1的近似表达式为
Figure GDA0001848758830000071
三、技术方案
针对上述的问题分析,采用以下方法进行处理,具体包括步骤:
(1)获取经接收端匹配滤波器输出的接收信号矩阵yMF和信道响应矩阵H,并根据信道响应矩阵H构造MMSE检测矩阵W,计算公式为:
W=HHH+N0IM
式中,IM是M阶单位矩阵,M是用户端的天线总数,N0是加性高斯白噪声方差。
(2)将MMSE检测矩阵W的对角线元素块组成矩阵D,并计算得到矩阵E=W-D。具体包括步骤:
(2-1)将MMSE检测矩阵W的对角线元素块组成矩阵D,其中:
Figure GDA0001848758830000072
式中,Di表示矩阵W的第i个对角线元素块,i=1,2,..,K,Di都是O′O阶的矩阵,且O′K=M,M是用户端的天线总数,K为MMSE检测矩阵W的对角线元素块数目。
其中,参数K可有不同的取值,且取值可能会影响算法性能。为了使本项发明具有说服力,以下从理论与仿真两点来说明最优参数K的选取。首先从理论上,考虑算法的误码率(bit-error-rate,BER)性能,有相关文献指出,当D包含W的尽可能多的元素时,算法的BER性能会有很大提升,显然当K=2时,D包含W的元素最多;考虑算法的计算复杂度,可以证明当K=2时,算法的计算复杂度最低,这是因为以k=3为例,当采取的K=2分块方式后,(-D-1E)2D-1的迭代过程可以表示为
Figure GDA0001848758830000073
可以看出每次的迭代结果,即
Figure GDA0001848758830000081
都有一半的元素为零,也就大大降低了计算复杂度。而对于其他分块方式,即K≠2,当迭代次数大于等于2时,迭代过程变成两个满阵相乘,计算复杂度会因此升高。综合算法的BER性能及计算复杂度的理论分析,可知K=2为最优的分块方式。为了验证理论观点,图2给出了仿真验证,可以清晰看出K=2的分块方式较其他分块方式有明显优势,即BER性能最好且迭代次数较少。
(2-2)根据矩阵D计算得到矩阵E=W-D。
(3)将矩阵D和E分别分块,分别得到上下两个对角子矩阵,再分别将上下两个对角子矩阵按照此方式分块,直至分块级数达到T=log2m,并依照诺依曼级数定理,逐级向上求逆,直至得到矩阵D的逆D-1,其中,m为用户数。具体包括以下步骤:
(3-1)将矩阵D按照下式分块,得到上下两个对角子矩阵D1,(1)和D2,(1)
Figure GDA0001848758830000082
其中,D1,(1)表示第1级分块时得到的第一个对角子矩阵,D2,(1)表示第1级分块时得到的第2个对角子矩阵;
(3-2)将矩阵D1,(1)和D2,(1)按照下式分块,得到子矩阵D1,(2)、D2,(2)、D3,(2)和D4,(2)
Figure GDA0001848758830000083
(3-3)按照步骤(3-2)中的方式分块,直至分块级数达到T停止,得到矩阵Dj,(t),t=1,…,T,j=1,…,2t,;
(3-4)对于矩阵E按照步骤(3-1)到(3-3)执行,得到矩阵Ej,(t),t=1,…,T,j=1,…,2t
(3-5)根据Dj,(t)和Ej,(t),依照诺依曼级数定理,逐级向上求逆,直至得到矩阵D的逆D-1,其中:
Figure GDA0001848758830000084
式中,t=T-1,…,0,j=1,…,2t,D1,(0)=D,k表示迭代次数。
其中,在求解子矩阵D1,(1)和D2,(1)的逆时,MP通过NSA来求
Figure GDA0001848758830000091
Figure GDA0001848758830000092
的近似,因此该算法对W-1的近似由两层迭代(two-level iterations,TLI)组成。区别于TLI,本发明提出一种多层迭代(multiple-level iterations,MLI)的方法。考虑到D1,(1)和D2,(1)为M/2阶矩阵,以和第一层迭代相同的方式进行第二层迭代得到
Figure GDA0001848758830000093
Figure GDA0001848758830000094
考虑到D1,(1)和D2,(1)为M/2阶矩阵,以和第一层迭代相同的方式进行第三层迭代得到
Figure GDA0001848758830000095
Figure GDA0001848758830000096
以此类推,直到最后一层迭代。在最后一层迭代中,需要有不同的额外操作。在单天线用户系统中,需要对W主对角线的元素求倒数。而多天线系统中,由于同一用户天线之间的强相干性使得W呈块对角占优而不是主对角占优,且理论上块对角占优的这些子矩阵的维度为mUE′mUE,由于这些子矩阵更加接近于满阵,因此不能继续采用矩阵近似求逆法,而只能采用矩阵精确求逆法。虽然矩阵精确求逆的复杂度很高,但由于该处子矩阵的规模mUE′mUE较小,因为一般同一个用户端不会配置过多的天线,子矩阵的个数也较少,为m=M/mUE,因此该部分的计算复杂度相对于整体的计算复杂度是可忽略的。以上完整叙述了本项发明,即多层迭代的块对角化算法(block diagonal with multiple-level iterations,BD-MLI)的内容。
(4)依照诺依曼级数定理根据矩阵D-1和E,计算得到MMSE检测矩阵W的逆W-1,计算公式为:
Figure GDA0001848758830000097
(5)根据MMSE检测矩阵W的逆W-1以及经接收端匹配滤波器输出的接收信号矩阵yMF,计算发射信号矩阵估计值
Figure GDA0001848758830000098
四、复杂度分析
与大多数MIMO检测算法的复杂度分析一样,仅考虑算法中的复数乘法次数,本项发明中的算法BD-MLI与另两种NSA优化算法TMA和MP的复杂度列于表1中。
表1 TMA,MP,BD-MLI的复杂度对比
Figure GDA0001848758830000099
Figure GDA0001848758830000101
对于TMA,k为算法的迭代次数,对于MP,kF为算法的第一层迭代次数,kS为算法的第二层迭代次数;对于BD-MLI,kF为算法的第一层迭代次数,kN为算法余下层数的迭代次数。
结合图1和表1,需要指出图中的“分块方式K=2(多层迭代)”正是本发明中的BD-MLI算法,而“分块方式K=2(两层迭代)”正是上面提到的MP算法,可以看出图1中BD-MLI与MP均取得接近MMSE的BER性能,但通过表1中的复杂度公式可得,BD-MLI较MP降低了约47%的复数乘法次数。
五、仿真结果与性能对比
图2-7给出了不同类型系统、不同传播条件下的仿真结果。图2-4分别为单天线用户系统在理想传播条件(理想信道、高配置比),非理想传播条件(相关性较弱的信道、低配置比),恶劣传播条件(相关性较强的信道、低配置比)下的仿真结果,图5-7分别为多天线用户系统在理想传播条件,非理想传播条件,恶劣传播条件下的仿真结果,均以误码率随信噪比(signal-to-noise ratio,SNR)的变化来表示算法性能。
可以看出,TMA仅在理想传播条件下才能有较好的检测性能(如图2、5所示),在非理想和恶劣传播环境中,均已失效(如图3、4、6、7所示)。MP在理想传播条件及单天线用户系统中的非理想传播条件能有较好的检测性能(如图2、5、3所示),在恶劣传播条件的多天线用户系统中性能非常差(如图5所示),在非理想及恶劣传播环境下的多天线用户系统中也已失效(如图6、7所示)。但是对于本发明中的算法BD-MLI,无论是单天线还是多天线用户,无论是理想、非理想、恶劣传播环境,均能以较低的复杂度取得接近MMSE的检测性能。
由此可见,本发明方法提出了一种更高效的MIMO检测算法,在低复杂度的前提下,同时能克服相关信道、降低系统对高配置比的依赖,并且提高算法在多天线用户系统中的性能。
六、硬件架构
为本发明中的算法设计一套相应的硬件架构。为了方便叙述,这里以m=8为例,展开相应的设计过程。
根据式
Figure GDA0001848758830000111
仅需要利用W-1和匹配滤波器的输出yMF就可得到发射向量的估计。由于关于计算W和yMF的硬件架构是比较简单直接的,因此我们仅关注计算W-1的硬件架构。对于本发明中的算法,总迭代级数可记为T=log2m,可见这是一个与N和mUE均无关的量。
图8给出了本发明算法对用于m=8的硬件架构,注意这里仅画出了对应于矩阵的处理单元(processing elements,PE)。这套流水线架构进行了不同阶段的分化,因而是结构良好的。
Figure GDA0001848758830000112
由INV模块求出,这里需要说明,在单天线用户系统中,INV的作用为求倒数,在多天线用户系统中,INV的作用为进行一个mUE′mUE阶的矩阵精确求逆,由于对于小规模矩阵的精确求逆有很多现存的高效硬件架构,因此我们不再给出这部分的具体细节。显然,该硬件架构中的总阶段数与算法中的总迭代层数是对于并且相等的。对于级t,PE的数目应为2t-1。经过T级后,可以获得矩阵W的近似求逆。
PE的作用是计算
Figure GDA0001848758830000113
Figure GDA0001848758830000114
对于不同的级别,PE(t)本质上是相似的,不同之处仅在于输入输出矩阵的阶数。图9画出了PE(t)进行计算
Figure GDA0001848758830000115
的架构细节。首先,PE(t)
Figure GDA0001848758830000116
和E1,(t)、E2,(t)作为输入并为下一步运行构建过渡矩阵。然后级别t的诺依曼级数可以由矩阵加法器和矩阵乘法器求出。这里,我们利用寄存器来节省硬件消耗。
表2给出了改架构的硬件复杂度,这里我们仅以复数加法器和复数乘法器的数量表示硬件消耗。
表2硬件复杂度分析
Figure GDA0001848758830000117
以上所揭露的仅为本发明一种较佳实施例而已,不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (9)

1.一种基于矩阵分块的大规模MIMO高效检测方法,其特征在于该方法包括:
(1)获取经接收端匹配滤波器输出的接收信号矩阵yMF和信道响应矩阵H,并根据信道响应矩阵H构造MMSE检测矩阵W;
(2)将MMSE检测矩阵W的对角线元素块组成矩阵D,并计算得到矩阵E=W-D;
(3)将矩阵D和E分别分块,分别得到上下两个对角子矩阵,再分别将上下两个对角子矩阵按照此方式分块,直至分块级数达到T=log2 m,并依照诺依曼级数定理,逐级向上求逆,直至得到矩阵D的逆D-1,其中,m为用户数;
(4)依照诺依曼级数定理根据矩阵D-1和E,计算得到MMSE检测矩阵W的逆W-1
(5)根据MMSE检测矩阵W的逆W-1以及经接收端匹配滤波器输出的接收信号矩阵yMF,计算发射信号矩阵估计值
Figure FDA0002897804900000014
2.根据权利要求1所述的基于矩阵分块的大规模MIMO高效检测方法,其特征在于:步骤(1)中MMSE检测矩阵W的计算公式为:
W=HHH+N0IM
式中,IM是M阶单位矩阵,M是用户端的天线总数,N0是加性高斯白噪声方差。
3.根据权利要求1所述的基于矩阵分块的大规模MIMO高效检测方法,其特征在于:所述信道响应矩阵H=R1/2H0T1/2,H0表示理想信道,即瑞利衰落信道,R、T分别表示接收端、用户端的空间相关性矩阵,且R和T的元素分别为
Figure FDA0002897804900000011
Figure FDA0002897804900000012
式中,Rpq、Tpq分别表示R、T的第p行第q列的元素,
Figure FDA0002897804900000013
分别表示Rpq和Tpq的共轭,相关系数ζr和ζt分别表示基站端和用户端的第p根天线与第q根天线之间的相关程度,θ是给定的相位。
4.根据权利要求1所述的基于矩阵分块的大规模MIMO高效检测方法,其特征在于:步骤(2)具体包括:
(2-1)将MMSE检测矩阵W的对角线元素块组成矩阵D,其中:
Figure FDA0002897804900000021
式中,Di表示矩阵W的第i个对角线元素块,i=1,2,..,K,Di都是O×O阶的矩阵,且O×K=M,M是用户端的天线总数,K为MMSE检测矩阵W的对角线元素块数目;
(2-2)根据矩阵D计算得到矩阵E=W-D。
5.根据权利要求1所述的基于矩阵分块的大规模MIMO高效检测方法,其特征在于:步骤(3)具体包括:
(3-1)将矩阵D按照下式分块,得到上下两个对角子矩阵D1,(1)和D2,(1)
Figure FDA0002897804900000022
其中,D1,(1)表示第1级分块时得到的第一个对角子矩阵,D2,(1)表示第1级分块时得到的第2个对角子矩阵;
(3-2)将矩阵D1,(1)和D2,(1)按照下式分块,得到子矩阵D1,(2)、D2,(2)、D3,(2)和D4,(2)
Figure FDA0002897804900000023
(3-3)按照步骤(3-2)中的方式分块,直至分块级数达到T停止,得到矩阵Dj,(t),t=1,…,T,j=1,…,2t,;
(3-4)对于矩阵E按照步骤(3-1)到(3-3)执行,得到矩阵Ej,(t),t=1,…,T,j=1,…,2t
(3-5)根据Dj,(t)和Ej,(t),依照诺依曼级数定理,逐级向上求逆,直至得到矩阵D的逆D-1,其中:
Figure FDA0002897804900000024
式中,t=T-1,…,0,j=1,…,2t,D1,(0)=D,k表示迭代次数。
6.根据权利要求1所述的基于矩阵分块的大规模MIMO高效检测方法,其特征在于:步骤(4)中MMSE检测矩阵W的逆W-1计算公式为:
Figure FDA0002897804900000031
7.根据权利要求1所述的基于矩阵分块的大规模MIMO高效检测方法,其特征在于:步骤(5)中发射信号矩阵估计值计算公式为:
Figure FDA0002897804900000032
8.一种权利要求1所述的基于矩阵分块的大规模MIMO高效检测方法的架构,其特征在于包括:
MMSE检测矩阵W计算模块,用于根据信道响应矩阵H构造MMSE检测矩阵W;
矩阵形成模块,用于将MMSE检测矩阵W的对角线元素块组成矩阵D,并计算得到矩阵E=W-D;
矩阵分块模块,用于将矩阵D和E分别分块,分别得到上下两个对角子矩阵,再分别将上下两个对角子矩阵按照此方式分块,直至分块级数达到T=log2 m;
矩阵求逆模块,用于依照诺依曼级数定理,逐级向上求逆,直至得到矩阵W的逆W-1
发射信号估计模块,用于根据MMSE检测矩阵W的逆W-1以及经接收端匹配滤波器输出的接收信号矩阵yMF,计算发射信号矩阵估计值
Figure FDA0002897804900000034
9.根据权利要求8所述的架构,其特征在于:所述矩阵求逆模块具体包括T级级联的处理单元,第t级有2t-1个处理单元,第t级第j个处理单元用于执行以下计算:
Figure FDA0002897804900000033
CN201811099167.2A 2018-09-20 2018-09-20 基于矩阵分块的大规模mimo高效检测方法和架构 Active CN109039416B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811099167.2A CN109039416B (zh) 2018-09-20 2018-09-20 基于矩阵分块的大规模mimo高效检测方法和架构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811099167.2A CN109039416B (zh) 2018-09-20 2018-09-20 基于矩阵分块的大规模mimo高效检测方法和架构

Publications (2)

Publication Number Publication Date
CN109039416A CN109039416A (zh) 2018-12-18
CN109039416B true CN109039416B (zh) 2021-06-01

Family

ID=64617133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811099167.2A Active CN109039416B (zh) 2018-09-20 2018-09-20 基于矩阵分块的大规模mimo高效检测方法和架构

Country Status (1)

Country Link
CN (1) CN109039416B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113644943B (zh) * 2021-08-13 2023-01-24 网络通信与安全紫金山实验室 一种mmse检测方法、装置、设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136437B2 (en) * 2002-07-17 2006-11-14 Lucent Technologies Inc. Method and apparatus for receiving digital wireless transmissions using multiple-antenna communication schemes
CN101399803A (zh) * 2007-09-27 2009-04-01 大唐移动通信设备有限公司 正交频分复用传输信号的多用户检测方法及装置
CN102298570A (zh) * 2011-09-13 2011-12-28 浙江大学 一种点数可变的混合基 fft/ifft实现装置及其方法
CN104954056A (zh) * 2015-06-05 2015-09-30 东南大学 大规模mimo线性检测中矩阵求逆的硬件构架及方法
CN105871439A (zh) * 2016-05-31 2016-08-17 华南理工大学 一种基于投影算子的迭代bd预编码方法
CN107231177A (zh) * 2017-05-19 2017-10-03 东南大学 基于大规模mimo的高效cr检测方法和架构

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136437B2 (en) * 2002-07-17 2006-11-14 Lucent Technologies Inc. Method and apparatus for receiving digital wireless transmissions using multiple-antenna communication schemes
CN101399803A (zh) * 2007-09-27 2009-04-01 大唐移动通信设备有限公司 正交频分复用传输信号的多用户检测方法及装置
CN102298570A (zh) * 2011-09-13 2011-12-28 浙江大学 一种点数可变的混合基 fft/ifft实现装置及其方法
CN104954056A (zh) * 2015-06-05 2015-09-30 东南大学 大规模mimo线性检测中矩阵求逆的硬件构架及方法
CN105871439A (zh) * 2016-05-31 2016-08-17 华南理工大学 一种基于投影算子的迭代bd预编码方法
CN107231177A (zh) * 2017-05-19 2017-10-03 东南大学 基于大规模mimo的高效cr检测方法和架构

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Low-complexity detection algorithms based on matrix partition for massive MIMO;Haijian Wu等;《2017 9th International Conference on Wireless Communications and Signal Processing (WCSP)》;20171211;全文 *
MIMO系统的改进序贯蒙特卡罗迭代检测算法;丁睿等;《电子与信息学报》;20100228;第32卷(第2期);全文 *

Also Published As

Publication number Publication date
CN109039416A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN105071843B (zh) 大规模mimo系统低复杂度多项式展开矩阵求逆方法及应用
CN109951214B (zh) 一种适用于大规模mimo系统的信号检测方法
WO2005120000A1 (en) Fourier-transform based linear equalization for mimo cdma downlink
TWI591973B (zh) A signal detection method and device
Yazdanpanah et al. New trinion and quaternion set-membership affine projection algorithms
CN104954056A (zh) 大规模mimo线性检测中矩阵求逆的硬件构架及方法
CN105049097A (zh) 非理想信道下大规模mimo线性检测硬件构架及检测方法
US20030048861A1 (en) Dynamic diversity combiner with associative memory model for recovering signals in communication systems
CN104779988A (zh) 一种快速迭代波束成形的方法
Zhang et al. Subspace system identification for training-based MIMO channel estimation
CN109039416B (zh) 基于矩阵分块的大规模mimo高效检测方法和架构
CN112953865A (zh) 一种用于大规模多输入多输出系统的信道估计方法
CN107231177B (zh) 基于大规模mimo的高效cr检测方法和架构
Azari et al. Automated deep learning-based wide-band receiver
CN114142905A (zh) 时变信道下基于牛顿迭代法的mimo检测算法的改进方法
JP6063607B2 (ja) 送信信号のための多入力多出力mimo検出方法、装置及びシステム
CN107733487B (zh) 一种大规模多输入多输出系统的信号检测方法及装置
CN107222246A (zh) 一种近似mmse性能的高效大规模mimo检测方法及系统
Arablouei et al. Low-complexity adaptive decision-feedback equalization of MIMO channels
CN107615804A (zh) 用于设备通信的新传输方案
CN109639607B (zh) 一种低复杂度的非正交多址接入系统信号检测方法
CN114520699A (zh) 可重构智能表面辅助毫米波通信的低复杂度信道估计方法
CN109525296B (zh) 基于自适应阻尼Jacobi迭代的大规模MIMO检测方法和装置
CN113644943B (zh) 一种mmse检测方法、装置、设备和存储介质
Wu et al. A generalized matrix-decomposition processor for joint MIMO transceiver design

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant