CN104360986B - 一种并行化矩阵求逆硬件装置的实现方法 - Google Patents

一种并行化矩阵求逆硬件装置的实现方法 Download PDF

Info

Publication number
CN104360986B
CN104360986B CN201410621516.8A CN201410621516A CN104360986B CN 104360986 B CN104360986 B CN 104360986B CN 201410621516 A CN201410621516 A CN 201410621516A CN 104360986 B CN104360986 B CN 104360986B
Authority
CN
China
Prior art keywords
processing unit
msgr
input
matrix
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410621516.8A
Other languages
English (en)
Other versions
CN104360986A (zh
Inventor
何世文
余登高
黄永明
王海明
杨绿溪
张军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing etaco Communication Technology Co.,Ltd.
Original Assignee
In Jiangsu Emerging Micro-Communication Ceases Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by In Jiangsu Emerging Micro-Communication Ceases Science And Technology Ltd filed Critical In Jiangsu Emerging Micro-Communication Ceases Science And Technology Ltd
Priority to CN201410621516.8A priority Critical patent/CN104360986B/zh
Publication of CN104360986A publication Critical patent/CN104360986A/zh
Application granted granted Critical
Publication of CN104360986B publication Critical patent/CN104360986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Devices For Executing Special Programs (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种并行化矩阵求逆硬件装置的实现方法,根据输入待求逆矩阵的维数确定脉动阵列的总体架构,对不同类型的处理单元进行了算法描述与功能分析,并设计了各处理单元的内部结构,实现了对数据的并行化处理。本发明提出的并行化矩阵求逆硬件装置的实现方法,设计了基于改进Givens旋转的矩阵求逆脉动阵列,避免平方根运算的同时去掉大量除法运算,降低了算法复杂度,能有效节省硬件资源,同时整个矩阵求逆过程采用并行化处理,能有效提高矩阵求逆的硬件实现速度。本发明可以应用于无线通信、信号处理以及数值计算等领域矩阵求逆问题的硬件实现。

Description

一种并行化矩阵求逆硬件装置的实现方法
技术领域
本发明属于信号处理领域,特别涉及一种并行化矩阵求逆硬件装置的实现方法。
背景技术
随着无线通信技术的不断发展,用户对通信系统的可靠性和有效性要求越来越高。为了提高系统的传输速率、增加系统的频谱效率,多输入多输出(Multiple InputMultiple Output,MIMO)技术作为一种关键技术得到了广泛研究。IEEE802.11n、IEEE802.11ac、IEEE 802.11ad以及3GPP-LTE等无线通信标准,都采用了MIMO技术。
MIMO通信系统,在接收端的设计相当复杂。接收端信道估计会涉及到大量的矩阵求逆运算,尤其随着发射天线以及接收天线数目的增加,矩阵的维数也随着增加,矩阵求逆的运算复杂度也会大量增加,导致矩阵求逆的算法设计以及硬件实现难度大大提高,这也成为当前MIMO系统亟待解决的一个技术难题。
发明内容
发明目的:针对现有技术的不足,本发明公开了一种并行化矩阵求逆硬件实现装置,主要包括对矩阵求逆脉动阵列的设计,实现数据的并行化处理,提高矩阵求逆的硬件实现效率。
技术方案:一种并行化矩阵求逆硬件装置的实现方法,包括以下步骤:
步骤1:根据输入矩阵A的维数确定脉动阵列的维数以及总体架构,所述脉动阵列包括MSGR(Modified Square Givens Rotation)阵列模块和IAM(Invert and Multiply)阵列模块,其中MSGR阵列模块主要完成矩阵A的SGR(Square Givens Rotation)分解获得上三角矩阵U,随后输入与矩阵A同阶的单位矩阵E,用存储的系数对单位矩阵E进行相同的变换后获得矩阵B;IAM阵列模块利用迭代算法求上三角矩阵U的逆矩阵U-1,并且将U-1与矩阵B相乘,从而完成整个矩阵求逆过程;
步骤2:
若矩阵A是N×N维的,则MSGR阵列模块是一个N行N+1列的倒梯形模块,包括N个MSGR阵列第一类边界处理单元、N(N+1)/2个MSGR阵列内部处理单元和N个MSGR阵列第二类方形处理单元,MSGR阵列第一类边界处理单元将输入参数对<XIN,YIN>映射到输出参数对<MOUT,NOUT>;MSGR阵列内部处理单元将<X'IN,Y'IN>和<M'IN,N'IN>更新到<X'OUT,Y'OUT>、<M'OUT,N'OUT>;MSGR阵列第二类边界处理单元根据输入参数对<M”IN,N”IN>确定UOUT,同时进行溢出处理;其中位于MSGR阵列模块上部边缘的1个第一类边界处理单元和N-1个内部处理单元需要外部输入数据,第一类边界处理单元的输出是相邻下一列内部处理单元的输入,内部处理单元的一个输出是相邻下一行的第一类边界处理单元或者内部处理单元的输入,内部处理单元的另一个输出是相邻下一列内部处理单元或者第二类方形处理单元的输入,位于MSGR阵列模块右侧边缘的N个第二类方形处理单元的输出为MSGR阵列模块的输出;
步骤3:设计IAM阵列模块,IAM阵列模块包含N个第二类圆形处理单元,N(N-1)/2个第三类方形处理单元,IAM阵列模块的输入即为MSGR阵列模块的输出,IAM阵列边界处根据输入参数X”'IN确定输出参数Y”'OUT;IAM阵列内部处理单元根据输入参数<X””IN,Y””IN>确定<X””OUT,Y””OUT>,其中位于IAM阵列模块左侧边缘的1个第二类圆形处理单元和N-1个第三类方形处理单元接收MSGR阵列模块的输出,位于IAM阵列模块下侧边缘的1个第二类圆形处理单元和N-1个第三类方形处理单元的输出即为IAM阵列模块的输出,IAM阵列模块第二类圆形处理单元的输出是相邻下一行第三类方形处理单元的输入,IAM阵列模块第三类方形处理单元的一个输出为相邻下一行的第三类方形处理单元的输入,IAM阵列模块第三类方形处理单元的另一个输出为相邻下一列第三类方形处理单元的或者第二类圆形处理单元的输入。
有益效果:与现有技术相比,本发明具有如下优点:本发明公开了一种并行化矩阵求逆硬件装置的实现方法,设计了基于改进Givens旋转的矩阵求逆脉动阵列,整个矩阵求逆过程采用并行化处理,能有效提高矩阵求逆的硬件实现速度。本发明可以应用于无线通信、信号处理以及数值计算等领域矩阵求逆问题的硬件实现。
附图说明
图1为本发明的脉动阵列总体架构;
图2为本发明的输入参数示意图;
图3为本发明的MSGR阵列第一类边界处理单元示意图;
图4为本发明的MSGR阵列第一类边界处理单元内部结构简化图;
图5为本发明的MSGR阵列内部处理单元示意图;
图6为本发明的MSGR阵列第二类边界处理单元示意图;
图7为本发明的IAM阵列边界处理单元示意图;
图8为本发明的IAM阵列边界处理单元内部结构简化图;
图9为本发明的IAM阵列内部处理单元示意图;
图10为本发明的IAM阵列内部处理单元内部结构简化图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等同变换均落于本申请所附权利要求所限定的范围。
本发明公开了一种并行化矩阵求逆硬件装置的实现方法,应用于MIMO通信系统接收端的信道估计和接收端的信号均衡处理,对于一个发送天线数为M,接收天线数为N的MIMO通信系统,其接收机信号可以表示为r=Hs+n,其中,r表示接收信号,是维数为M的列向量;s表示发送信号,是维数为N的列向量;H表示信道矩阵,是维数为M×N的矩阵;n表示加性高斯白噪声,是维数为M的列向量。接收端的均衡器从接收到的信号r估计出发送信号s,常见的均衡算法包括迫零算法和最小均方误差算法。基于迫零算法的均衡表达式为其中表示基于迫零算法的均衡器对发送信号的估计量;基于最小均方误差算法的均衡表达式为其中表示基于最小均方误差算法的均衡器对发送信号的估计量,上标H表示矩阵的共轭转置,IM表示M维单位矩阵,表示噪声的平均功率。将待求逆矩阵(HHH)或矩阵记为A,且表示如下:
本发明提供了一种并行化矩阵求逆硬件装置的实现方法,主要包括以下步骤:
步骤1:根据输入矩阵A的维数确定脉动阵列的维数以及总体架构。该脉动阵列主要包括两个大模块,MSGR阵列模块和IAM阵列模块,其中MSGR阵列模块主要完成矩阵A的SGR分解获得上三角矩阵U,随后输入与矩阵A同阶的单位矩阵E,用存储的系数对单位矩阵E进行相同的变换后获得IAM阵列模块主要是利用迭代算法求上三角矩阵U的逆矩阵U-1,并且将U-1相乘,从而完成整个矩阵求逆过程。输入数据即作为MSGR阵列模块的输入,MSGR阵列模块的输出作为IAM阵列模块的输入,IAM阵列模块的输出即为矩阵求逆的结果。待求逆矩阵A的维数决定了MSGR阵列模块以及IAM阵列模块的结构,如果矩阵A是N×N维的,则MSGR阵列模块是一个N行N+1列的倒梯形模块,IAM阵列模块是一个N行N列的下三角模块,总体架构如图1所示。
步骤2:设计MSGR阵列模块:输入矩阵A的维数决定了MSGR阵列模块是一个N行N+1列的倒梯形模块。MSGR阵列模块包含N个MSGR阵列第一类边界处理单元,N(N+1)/2个MSGR阵列内部处理单元以及N个MSGR阵列第二类方形处理单元。
步骤2.1:设计MSGR阵列模块的输入:
每个时序MSGR阵列模块有N个输入接口,每个输入接口输入两个参数,即位于MSGR阵列模块上部边缘的1个MSGR阵列第一类边界处理单元和N-1个MSGR阵列内部处理单元需要外部输入数据。MSGR阵列第一类边界处理单元和MSGR阵列内部处理单元的输入输出参数分别如图3和图5所示。每个时序参数YIN的输入值均为1,关于参数XIN的输入如图2所示,第1个时序输入a11,z…,z;第2个时序输入a12,a21,z,…,z;……;第N个时序输入a1N,a2,N-1,…,aN1,此时矩阵A的第一列元素全部输入完毕;紧接着输入单位矩阵E,即第N+1个时序输入1,a2,N,a3,N-1,…,aN2;第N+2个时序输入0,0,…,aN-1,4,aN3;……;第2N个时序输入0,0,0,…,aNN,此时单位矩阵E的第一列元素全部输入完毕;第2N+1个时序输入x,0,0,…,0;第2N+2个时序输入x,x,0,…,0;直到单位矩阵E输入完毕,即输入x,x,…x,1;其中z表示延迟一个时序,如果没有新的待求逆矩阵输入时,x处的元素输入空,如果需要接着进行新的矩阵求逆运算,则在x处输入新的待求逆矩阵元素。
步骤2.2:设计MSGR阵列第一类边界处理单元:
步骤2.2.1:MSGR阵列第一类边界处理单元的算法及功能描述:MSGR阵列第一类边界处理单元主要是将输入参数对<XIN,YIN>映射到输出参数对<MOUT,NOUT>。如果参数XIN的输入值是矩阵A的对角元素,则
同时定义寄存器R1和寄存器R2,如果YIN等于0,则寄存器R1赋值为R1=1,寄存器R2赋值为R2=1;否则,寄存器R1和寄存器R2分别赋值为
如果参数XIN的输入值不是矩阵A的对角元素,则
且寄存器R1和寄存器R2的值保持不变。
约定语句If(A)表示如果条件A成立,则执行B操作,否则执行C操作。则MSGR阵列第一类边界处理单元的算法可以描述为:
If(XIN是对角元素)Then
Else
步骤2.2.2:设计MSGR阵列第一类边界处理单元的内部结构:由步骤2.2.1可知,MSGR阵列第一类边界处理单元包括两个选择器,2个乘法器和6个寄存器,其内部结构如图4所示。
步骤2.3:设计MSGR阵列内部处理单元:
步骤2.3.1:MSGR阵列内部处理单元的算法及功能描述:MSGR阵列内部处理单元主要是将输入参数对<X'IN,Y'IN>和<M'IN,N'IN>更新到<X'OUT,Y'OUT>、<M'OUT,N'OUT>。如果输入参数MIN对应矩阵A中的对角元素,则
同时定义寄存器α1,寄存器α2,寄存器β1,寄存器β2,寄存器γ1,寄存器γ2,以及寄存器δ1。如果输入参数M'IN等于0,寄存器α1,寄存器α2,寄存器γ1,寄存器γ2,以及寄存器δ1分别赋值为α1=1,α2=1,γ1=0,γ2=0,δ1=1,寄存器β1和寄存器β2的赋值取决于输入参数Y'IN,如果Y'IN等于0,则β1=1,β2=1,否则如果输入参数M'IN不等于0,则寄存器α1,寄存器α2,寄存器β1,寄存器β2,寄存器γ1,寄存器γ2,以及寄存器δ1分别赋值为α1=Y'IN,α2=0,β2=0,γ1=X'IN,γ2=M'IN,δ1=N'IN
如果输入参数M'IN不是对应矩阵A中的对角元素,则
且寄存器α1,寄存器α2,寄存器β1,寄存器β2,寄存器γ1,寄存器γ2,以及寄存器δ1的值保持不变。
由步骤2.2.1中的语句约定,MSGR阵列内部处理单元的算法可以描述为:
If(MIN是对角元素)Then
Else
步骤2.3.2:由步骤2.3.1可知,MSGR阵列内部处理单元包括3个选择器,11个乘法器,4个加法器,11个寄存器。
步骤2.4:设计MSGR阵列第二类边界处理单元:
步骤2.4.1:MSGR阵列第二类边界处理单元的算法及功能描述:
MSGR阵列第二类边界处理单元主要是将输入参数对<M”IN,N”IN>映射到UOUT,同时进行溢出处理。令令M”IN_real和N”IN_real分别表示输入参数M”IN和N”IN的实部,M”IN_imag和N”IN_imag分别表示输入参数M”IN和N”IN的虚部,令S=N”IN_real2+N”IN_imag2,。如果S大于4,则
如果S小于0.25,则
通过(公式8)和(公式9),M”IN_real,N”IN_real,M”IN_imag和N”IN_imag的指数值都得到了更新,将更新后的M”IN和N”IN相除得到输出UOUT
由步骤2.2.1中的语句约定,MSGR阵列第二类边界处理单元的算法可以描述为:
S=NIN_real2+NIN_imag2
If(S>4)Then
If(S<0.25)Then
步骤2.4.2:由步骤2.4.1可知,MSGR阵列第二类边界处理单元包括两个乘法器,1个选择器,1个移位寄存器,8个加法器,6个寄存器。
步骤3:设计IAM阵列模块;IAM阵列模块主要是根据迭代算法求上三角矩阵U的逆矩阵U-1,并且将U-1相乘,由输入矩阵A的维数确定IAM阵列模块是一个N行N列的下三角模块,IAM阵列模块包含N个第二类圆形处理单元,N(N-1)/2个第三类方形处理单元。IAM阵列模块的输入即为MSGR阵列模块的输出。
步骤3.1:设计IAM阵列边界处理单元:
步骤3.1.1:IAM阵列边界处理单元的算法及功能描述:
如果输入参数X”'IN对应矩阵A中的对角元素,则
Y”'OUT=0 (公式11)
同时定义寄存器R,寄存器R赋值为1/X”'IN
如果输入参数X”'IN不是对应矩阵A中的对角元素,则
Y”'OUT=-R×X”'IN (公式12)
且寄存器R的值保持不变。
由步骤2.2.1中的语句约定,IAM阵列边界处理单元的算法可以描述为:
步骤3.1.2:由步骤3.1.1,IAM阵列边界处理单元包含1个选择器,3个寄存器,1个除法器,1个乘法器,其内部结构如图8所示。
步骤3.2:设计IAM阵列内部处理单元:
步骤3.2.1:IAM阵列内部处理单元的算法及功能描述:
如果输入参数X””IN对应矩阵A中的对角元素,则
同时定义寄存器R,寄存器R赋值为Y””IN/X””IN
如果输入参数X””IN不是对应矩阵A中的对角元素,则
且寄存器R的值保持不变。
由步骤2.2.1中的语句约定,IAM阵列内部处理单元的算法可以描述为:
步骤3.2.3:由步骤3.2.1,IAM阵列内部处理单元包括1个选择器,5个寄存器,1个除法器,1个乘法器和1个加法器,其内部结构如图10所示。

Claims (9)

1.一种并行化矩阵求逆硬件装置的实现方法,其特征在于,包括以下步骤:
步骤1:根据输入矩阵A的维数确定脉动阵列的维数以及总体架构,所述脉动阵列包括MSGR阵列模块和IAM阵列模块,其中MSGR阵列模块主要完成矩阵A的SGR分解获得上三角矩阵U,随后输入与矩阵A同阶的单位矩阵E,用存储的系数对单位矩阵E进行相同的变换后获得矩阵B;IAM阵列模块利用迭代算法求上三角矩阵U的逆矩阵U-1,并且将U-1与矩阵B相乘,从而完成整个矩阵求逆过程;
步骤2:设计MSGR阵列模块,若矩阵A是N×N维的,则MSGR阵列模块是一个N行N+1列的倒梯形模块,包括N个MSGR阵列第一类边界处理单元、N(N+1)/2个MSGR阵列内部处理单元和N个MSGR阵列第二类方形处理单元,MSGR阵列第一类边界处理单元将输入参数对<XIN,YIN>映射到输出参数对<MOUT,NOUT>;MSGR阵列内部处理单元将<X′IN,Y′IN>和<M′IN,N′IN>更新到<X′OUT,Y′OUT>、<M′OUT,N′OUT>;MSGR阵列第二类边界处理单元根据输入参数对<M″IN,N″IN>确定UOUT,同时进行溢出处理;其中位于MSGR阵列模块上部边缘的1个第一类边界处理单元和N-1个内部处理单元需要外部输入数据,第一类边界处理单元的输出是相邻下一列内部处理单元的输入,内部处理单元的一个输出是相邻下一行的第一类边界处理单元或者内部处理单元的输入,内部处理单元的另一个输出是相邻下一列内部处理单元或者第二类方形处理单元的输入,位于MSGR阵列模块右侧边缘的N个第二类方形处理单元的输出为MSGR阵列模块的输出;
步骤3:设计IAM阵列模块,IAM阵列模块包含N个第二类圆形处理单元,N(N-1)/2个第三类方形处理单元,IAM阵列模块的输入即为MSGR阵列模块的输出,IAM阵列边界处根据输入参数X″′IN确定输出参数Y″′OUT;IAM阵列内部处理单元根据输入参数〈X″″IN,Y″″IN>确定<X″″OUT,Y″″OUT>,其中位于IAM阵列模块左侧边缘的1个第二类圆形处理单元和N-1个第三类方形处理单元接收MSGR阵列模块的输出,位于IAM阵列模块下侧边缘的1个第二类圆形处理单元和N-1个第三类方形处理单元的输出即为IAM阵列模块的输出,IAM阵列模块第二类圆形处理单元的输出是相邻下一行第三类方形处理单元的输入,IAM阵列模块第三类方形处理单元的一个输出为相邻下一行的第三类方形处理单元的输入,IAM阵列模块第三类方形处理单元的另一个输出为相邻下一列第三类方形处理单元的或者第二类圆形处理单元的输入。
2.如权利要求1所述的并行化矩阵求逆硬件装置的实现方法,其特征在于,所述MSGR阵列模块设计的具体实现方法是:
步骤1:设计MSGR阵列模块的输入;
步骤2:设计MSGR阵列第一类边界处理单元;
步骤3:设计MSGR阵列内部处理单元;
步骤4:设计MSGR阵列第二类边界处理单元。
3.如权利要求2所述的并行化矩阵求逆硬件装置的实现方法,其特征在于,每个时序MSGR阵列模块有N个输入接口,每个输入接口输入两个参数<XIN,YIN>,其具体实现方法是:
每个时序参数YIN的输入值均为1,关于参数XIN的输入,第1个时序输入a11;第2个时序输入a12,a21;……;第N个时序输入a1N,a2,N-1,…,aN1;此时矩阵A的第一列元素全部输入完毕,紧接着输入单位矩阵E,即第N+1个时序输入1,a2,N,a3,N-1,…,aN2;第N+2个时序输入0,0,…,aN3;……;直到单位矩阵E输入完毕。
4.如权利要求1所述的并行化矩阵求逆硬件装置的实现方法,其特征在于,所述MSGR阵列第一类边界处理单元将输入参数对〈XIN,YIN>映射到输出参数对<MOUT,NOUT>,同时定义寄存器R1和R2,其具体实现方法是:
判断参数XIN的输入值是矩阵A的对角元素,如果是,则
再根据YIN定义寄存器R1、R2,如果YIN等于0,则R1=1、R2=1;如果YIN不等于0,则 分别表示XIN和YIN的共轭;
如果参数XIN的输入值不是矩阵A的对角元素,则
且R1和R2的值保持不变。
5.如权利要求1所述的并行化矩阵求逆硬件装置的实现方法,其特征在于,所述MSGR阵列内部处理单元将<X′IN,Y′IN>和<M′IN,N′IN>更新到<X′OUT,Y′OUT>、〈M′OUT,N′OUT>,同时定义寄存器α1、α2、β1、β2、γ1、γ2、δ1,其具体实现方法是:
如果输入参数M′IN对应矩阵A的对角元素,则
再根据M′IN和Y′IN定义寄存器α1、α2、β1、β2、γ1、γ2、δ1,如果输入参数M′IN等于0且Y′IN等于0,则α1=1、α2=1、γ1=0、γ2=0、δ1=1、β1=1、β2=1;如果M′IN等于0且Y′IN不等于0,则α1=1、α2=1、γ1=0、γ2=0、δ1=1、如果输入参数M′IN不等于0,则α1=Y′IN、α2=0、β2=0、γ1=X′IN、γ2=M′IN、δ1=N′IN分别表示X′IN和Y′IN的共轭;
如果输入参数M′IN不是对应矩阵A的对角元素,则
且寄存器α1、α2、β1、β2、γ1、γ2、δ1的值保持不变。
6.如权利要求1所述的并行化矩阵求逆硬件装置的实现方法,其特征在于,所述MSGR阵列第二类边界处理单元根据输入参数对<M″IN,N″IN>确定UOUT,同时进行溢出处理,其具体实现方法是:
令M″IN_real和N″IN_real分别表示输入参数M″IN和N″IN的实部,M″IN_imag和N″IN_imag分别表示输入参数M″IN和N″IN的虚部,令S=N″IN_real2+N″IN_imag2,exp()表示取浮点数的指数值,表示向下取整
如果S大于4,则
如果S小于0.25,则
通过(公式8)和(公式9),M″IN_real,N″IN_real,M″IN_imag和N″IN_imag的指数值都得到了更新,将更新后的M″IN和N″IN相除得到输出UOUT
7.如权利要求1所述的并行化矩阵求逆硬件装置的实现方法,其特征在于,所述IAM阵列模块的具体实现方法为:
步骤1:设计IAM阵列边界处理单元;
步骤2:设计IAM阵列内部处理单元。
8.如权利要求1所述的并行化矩阵求逆硬件装置的实现方法,其特征在于,所述IAM阵列边界处理单元根据输入参数X″′IN确定输出参数Y″′OUT,同时定义寄存器R,其具体实现方法是:
如果输入参数X″′IN对应矩阵A的对角元素,则
Y″′OUT=0 (公式11)
且寄存器R赋值为1/X″′IN
如果输入参数X″′IN不是对应矩阵A的对角元素,则
Y″′OUT=-R×X″′IN (公式12)
且寄存器R的值保持不变。
9.如权利要求1所述的并行化矩阵求逆硬件装置的实现方法,其特征在于,所述IAM阵列内部处理单元根据输入参数<X″″IN,Y″″IN>确定<X″″OUT,Y″″OUT>,同时定义寄存器R,其具体实现方法是:
如果输入参数X″″IN对应矩阵A的对角元素,则
且寄存器R赋值为Y″″IN/X″″IN
如果输入参数X″″IN不是对应矩阵A的对角元素,则
且寄存器R的值保持不变。
CN201410621516.8A 2014-11-06 2014-11-06 一种并行化矩阵求逆硬件装置的实现方法 Active CN104360986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410621516.8A CN104360986B (zh) 2014-11-06 2014-11-06 一种并行化矩阵求逆硬件装置的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410621516.8A CN104360986B (zh) 2014-11-06 2014-11-06 一种并行化矩阵求逆硬件装置的实现方法

Publications (2)

Publication Number Publication Date
CN104360986A CN104360986A (zh) 2015-02-18
CN104360986B true CN104360986B (zh) 2017-07-25

Family

ID=52528249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410621516.8A Active CN104360986B (zh) 2014-11-06 2014-11-06 一种并行化矩阵求逆硬件装置的实现方法

Country Status (1)

Country Link
CN (1) CN104360986B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021188B (zh) * 2016-05-11 2019-04-12 广州广电运通金融电子股份有限公司 浮点矩阵求逆的并行硬件架构和并行计算方法
CN109726823A (zh) * 2018-12-19 2019-05-07 中国地质大学(武汉) 一种基于并行架构的迭代分割核学习方法
CN111596320B (zh) * 2020-05-28 2023-03-24 成都天奥信息科技有限公司 一种高性能的抗干扰方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1998464A1 (en) * 2007-05-29 2008-12-03 Nokia Siemens Networks Oy Method and device for data processing and communication system comprising such device
CN101827044A (zh) * 2010-04-01 2010-09-08 清华大学 一种基于混合qr分解的最小二乘fpga求解装置
WO2011038940A1 (en) * 2009-10-01 2011-04-07 Intracom S.A. Telecom Solutions Matrix inversion using qr decomposition on a parallel pipelined systolic array
CN102662917A (zh) * 2012-04-28 2012-09-12 电子科技大学 正定Hermite矩阵Cholesky分解高速脉动阵列的设计方法
CN102662918A (zh) * 2012-04-28 2012-09-12 电子科技大学 基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法
CN102882579A (zh) * 2012-09-24 2013-01-16 东南大学 一种用于多天线系统的并行矩阵求逆方法
CN103294649A (zh) * 2013-05-23 2013-09-11 东南大学 双边cordic运算单元及基于该运算单元的并行雅克比埃尔米特阵特征分解方法和实现电路
CN103927290A (zh) * 2014-04-18 2014-07-16 南京大学 一种任意阶下三角复矩阵求逆运算方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8824603B1 (en) * 2013-03-01 2014-09-02 Futurewei Technologies, Inc. Bi-directional ring-bus architecture for CORDIC-based matrix inversion

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1998464A1 (en) * 2007-05-29 2008-12-03 Nokia Siemens Networks Oy Method and device for data processing and communication system comprising such device
WO2011038940A1 (en) * 2009-10-01 2011-04-07 Intracom S.A. Telecom Solutions Matrix inversion using qr decomposition on a parallel pipelined systolic array
CN101827044A (zh) * 2010-04-01 2010-09-08 清华大学 一种基于混合qr分解的最小二乘fpga求解装置
CN102662917A (zh) * 2012-04-28 2012-09-12 电子科技大学 正定Hermite矩阵Cholesky分解高速脉动阵列的设计方法
CN102662918A (zh) * 2012-04-28 2012-09-12 电子科技大学 基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法
CN102882579A (zh) * 2012-09-24 2013-01-16 东南大学 一种用于多天线系统的并行矩阵求逆方法
CN103294649A (zh) * 2013-05-23 2013-09-11 东南大学 双边cordic运算单元及基于该运算单元的并行雅克比埃尔米特阵特征分解方法和实现电路
CN103927290A (zh) * 2014-04-18 2014-07-16 南京大学 一种任意阶下三角复矩阵求逆运算方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于 CORDIC的滑窗最小二乘递推算法;石斌斌等;《系统工程与电子技术》;20101130;第32卷(第11期);全文 *
基于 QR 分解自适应波束形成算法的 FPGA 实现;朱少彬等;《无线通信技术》;20131231(第4期);全文 *

Also Published As

Publication number Publication date
CN104360986A (zh) 2015-02-18

Similar Documents

Publication Publication Date Title
CN105301608B (zh) 高动态接收机及其对北斗卫星信号b1频点的捕获方法
CN110533164B (zh) 一种面向卷积神经网络加速器的Winograd卷积拆分方法
CN104360986B (zh) 一种并行化矩阵求逆硬件装置的实现方法
US9729277B2 (en) Signal detecting method and device
US10210135B2 (en) Methods and apparatus for providing a programmable mixed-radix DFT/IDFT processor using vector engines
CN102170302A (zh) 基于fpga的智能天线抗干扰片上系统及方法
CN110147252A (zh) 一种卷积神经网络的并行计算方法及装置
CN102111350A (zh) 矩阵qr分解的fpga装置
CN104216866A (zh) 一种数据处理装置
CN103516643A (zh) 一种mimo检测预处理装置及方法
CN103532888B (zh) 数据处理装置以及消除干扰的方法
CN103430500B (zh) 信道脉冲响应/直流偏移联合估测装置、方法及相关接收器
CN105182378A (zh) 一种lll模糊度降相关算法
Guenther et al. A scalable, multimode SVD precoding ASIC based on the cyclic Jacobi method
Lee et al. High-speed tournament givens rotation-based QR Decomposition Architecture for MIMO Receiver
CN107957977A (zh) 一种计算方法及相关产品
CN107404346A (zh) 一种接收信号检测方法及系统
CN102970545A (zh) 一种基于二维离散小波变换算法的静态图像压缩方法
CN103986497B (zh) 双边抽头结构的时域自适应窄带干扰抑制滤波器和方法
CN105182299B (zh) 基于复旋转矩阵的非正交联合对角化回波信号处理方法
CN109558944A (zh) 基于可配置卷积层的卷积神经网络的算法优化方法及装置
CN106549882B (zh) 等效信道矩阵计算方法及装置
CN110163793B (zh) 卷积计算加速方法和装置
CN102655424B (zh) 一种多天线均衡系统的矩阵分解方法和装置
CN102662918B (zh) 基于伴随矩阵的四阶以下正定Hermite矩阵求逆的硬件架构及实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 211100 9 Jiangning Road, Jiangning economic and Technological Development Zone, Nanjing, China

Patentee after: NANJING ZEPUTUO INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 211100 No.9, mozhou East Road, Jiangning Economic Development Zone, Nanjing, Jiangsu Province

Patentee before: ZTE Wavetone Science and Technology Ltd.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20210707

Address after: 211100 8th floor, building B4, wireless Valley, No.9, mozhou East Road, Jiangning District, Nanjing City, Jiangsu Province

Patentee after: Nanjing etaco Communication Technology Co.,Ltd.

Address before: 211100 9 Jiangning Road, Jiangning economic and Technological Development Zone, Nanjing, China

Patentee before: NANJING ZEPUTUO INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right