CN105426345A - 一种矩阵求逆运算方法 - Google Patents
一种矩阵求逆运算方法 Download PDFInfo
- Publication number
- CN105426345A CN105426345A CN201510994192.7A CN201510994192A CN105426345A CN 105426345 A CN105426345 A CN 105426345A CN 201510994192 A CN201510994192 A CN 201510994192A CN 105426345 A CN105426345 A CN 105426345A
- Authority
- CN
- China
- Prior art keywords
- matrix
- row
- real
- result
- multiply
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 248
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 21
- 230000017105 transposition Effects 0.000 claims abstract description 18
- 230000009466 transformation Effects 0.000 claims abstract description 7
- 238000009825 accumulation Methods 0.000 claims description 7
- 241001269238 Data Species 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 241000288673 Chiroptera Species 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
Abstract
本发明涉及一种矩阵求逆运算方法,包括如下步骤:1)首先进行列选主元LU分解:根据公式PA=LU,将源矩阵A分解为单位下三角矩阵L、上三角矩阵U和置换矩阵P;2)接着进行三角矩阵求逆:对L矩阵求逆得到其逆矩阵L-1,将U矩阵的转置矩阵求逆后再转置得到U-1;3)最后进行矩阵相乘:将矩阵U-1和矩阵?L-1相乘,并根据置换矩阵P将矩阵乘法结果进行列变换得到源矩阵A-1。有益效果为:通过使用列选主元LU分解算法,有效地降低矩阵求逆算法的时间复杂度,增加矩阵求逆运算的可并行性,减少矩阵求逆运算的时间,并且支持任意阶数的矩阵求逆运算,可以根据运算点数需求增加或减少硬件资源,更好地满足实际应用的需求。
Description
技术领域
本发明涉及矩阵求逆方法,尤其涉及基于时分复用技术的矩阵求逆运算的VLSI设计方法。
背景技术
矩阵求逆的方法有很多,包括伴随矩阵法、初等变换法、分块矩阵法、Gauss.Jordan消去法、矩阵分解法等等。上述各种矩阵求逆的方法中,伴随矩阵法中需要求大量的行列式,每个行列式都几乎要计算到所有的矩阵元素,计算量大,对存储空间的需求也较大,不利于实现。
矩阵分解是将矩阵分解为一些较简单矩阵的乘积,如三角矩阵或酉矩阵,他们都具有某种特性,较容易得到逆矩阵。对分解得到的矩阵求逆后相乘,得到原矩阵的逆矩阵。矩阵分解常见的有三种:1)LU分解法,2)QR分解法,3)奇异值分解法。
LU分解是一种科学计算中的矩阵分解方法,常用于线性方程的求解、矩阵求逆和行列式计算,在图形图像处理、科学计算等诸多领域也有广泛应用。LU分解法是将原正方矩阵分解成一个上三角形矩阵和一个下三角形矩阵。
例如若将矩阵A作LU分解成两个三角矩阵,即A=LU,则A-1=U-1L-1。其中三角矩阵L和U几乎一半数据都为0,所以求逆简单。将分解得到的特殊矩阵分别求逆后再相乘,即最终得到原矩阵的逆。比较三种分解方法,发现LU分解法的可并行度最高。
当矩阵A为n阶非奇异矩并且所有顺序主子式不为0,则矩阵A可以分解为一个主对角元素全为1的下三角矩阵L和一个上三角矩阵U的乘积,即A=LU,且分解是唯一的。
L和U的元素可由下面的递推式求出:
由于主元出现在分母中,因此只有当urr≠0(k=1,,n)时,分解才能进行到底。此外,在实际的计算过程中,即使不为零,但当它很小的时候,由于计算机的精度限制,会导致下溢,也会使分解运算不稳定。因此需要借助选主元的方法,即适当交换矩阵的行(或列),以得到较大的非零主元。
如果分解不进行主元选取,会影响到计算精度和正确性,在碰到一些奇异矩阵时,甚至会导致计算失败。
发明内容
本发明的目的在于提供一种矩阵求逆方法,以克服现有技术领域的不足,本发明的方法包括如下步骤:
1)首先进行列选主元LU分解:根据公式PA=LU,将源矩阵A分解为单位下三角矩阵L、上三角矩阵U和置换矩阵P;
2)接着进行三角矩阵求逆:对L矩阵求逆得到其逆矩阵L-1,将U矩阵的转置矩阵求逆后再转置得到U-1;
3)最后进行矩阵相乘:将矩阵U-1和矩阵L-1相乘,并根据置换矩阵P将矩阵乘法结果进行列变换得到源矩阵A-1。
所述的矩阵求逆运算方法的进一步设计在于,步骤1)包括如下步骤:
I)进行选主元:从第一列中选取最大主元,与该列的第一个元素的值进行交换,并存储最大主元的行下标;
II)进行归一化:将第一行与最大主元所在行互换,得到U分解因子的一行元素u1j,用交换后的第一列第一个元素依次除以该列的其它元素,得到L分解因子的一列元素li1,其中1≤i≤n,1≤j≤n,n表示矩阵阶数;
III)进行数据更新:对矩阵进行更新操作:a1 ij=aij-li1*u1j,得到新子矩阵a1 ij,每次更新操作后的子矩阵的阶数比原矩阵的阶数少一阶,其中,aij为原矩阵中的值,2≤i≤n,2≤j≤n,n表示矩阵阶数。对新的子矩阵循环重复以上三个步骤,最终得到L矩阵和U矩阵。
所述的矩阵求逆运算方法的进一步设计在于,所述步骤I)中根据当前循环次数k,将矩阵的主列元素读出,先将所述主列元素通过两个实数乘法器和一个实数加法器,流水运算得出主列元素的实部虚部平方和,再通过一个实数减法器,找出主元。
所述的矩阵求逆运算方法的进一步设计在于,所述步骤II)中根据当前循环中找到的最大主元行下标,将源矩阵的第k行与最大主元所在行互换,接着将数据交换后的主列对角线数的实部和虚部分别送入两个实数除法器中用于算出主元的倒数,再将主列对角线以下元素读出,通过一个复数乘法器与主元的倒数相乘,完成归一操作,其中k表示当前循环次数。
所述的矩阵求逆运算方法的进一步设计在于,所述步骤III)中采用四路并行运算,每路运算使用一个复数乘法器和一个复数加法器,将矩阵第k行第k+1列、第k行第k+2列、第k行第k+3列、第k行第k+4列的数据,分别送入四路运算的对应复数乘法器中,与步骤2)中归一化的结果进行复数乘法运算;复数乘法器的结果直接送入复数加法器,与矩阵第k+1列、第k+2列、第k+3列、第k+4列中第k+1行至第n行数据分别相减,当所述四列数据更新完后,再对所述四列数据后续四列数据进行数据更新操作,依此类推直至矩阵的最后一列完成数据更新操作,即完成了一次数据更新,其中k表示当前循环次数,n为矩阵阶数。
所述的矩阵求逆运算方法的进一步设计在于,所述步骤2)通过取倒单元、乘累加单元以及取反乘单元实现矩阵的求逆、转置,其中,
A.取倒单元:根据下三角矩阵求逆公式,首先将对角线元素进行取倒,对于L矩阵,结果为1;对于转置后的U矩阵,将对角线元素读出,通过两个实数乘法器、一个实数加法器、一个实数除法器和一个复数乘法器得到取倒运算的结果;
B.乘累加单元:根据下三角矩阵求逆公式分别分析L矩阵和转置后的U矩阵的数据依赖关系,通过四组由一个复数乘法器和一个复数加法器所组成的乘累加器进行乘累加运算,所述乘累加运算从第2行开始按行顺序计算非对角线元素,L矩阵和转置后的U矩阵同时进行乘累加运算;
C.取反乘单元:通过复数乘法器对步骤B)中乘累加单元的结果,与步骤A)中取倒单元的结果进行取反乘运算,即得到相应行的取反结果。
所述的矩阵求逆运算方法的进一步设计在于,所述步骤A)中将复数的实部虚部分别输出到所述两个实数乘法器,两个实数乘法器的输出端分别与所述实数加法器的两个输入端连接,实数加法器的输出端与所述实数除法器的输入端连接,实数除法器的另一输入端固定地设置为1,实数除法器的输出端与所述复数乘法器的输入端连接。
所述的矩阵求逆运算方法的进一步设计在于,所述步骤B)中L矩阵和转置后的U矩阵进行乘累加运算时,分别使用两组乘累加器,每组乘累加器包括
复数乘法器完成L、U递推公式 中lik与Skj的复数相乘操作,lik表示L矩阵中的数,Skj表示L矩阵的逆矩阵中的数,i表示行号,j表示列号,k表示累加循环次数;
复数加法器和延迟控制逻辑,根据复数乘法器的结果完成累加操作。
所述的矩阵求逆运算方法的进一步设计在于,所述步骤C)中对于L矩阵,将乘累加单元结果的符号位取反作为取反结果;对于U矩阵,需将乘累加单元的结果取反后再与对应行的对角线元素相乘作为取反结果。
所述的矩阵求逆运算方法的进一步设计在于,所述步骤3)中将U-1矩阵按行划分为四等份,同时使用四路乘累加运算单元分别与L-1矩阵进行乘累加运算,并根据步骤1)中的P矩阵,对乘法结果矩阵进行列变换得到最终的矩阵求逆结果。
本发明的优点如下:
(1)本发明可以实现任意阶可逆矩阵的求逆运算,可以通过增减存储资源和增减运算资源,满足不同阶数的性能需求。
(2)本发明将矩阵求逆运算分为列选主元LU分解、下三角矩阵求逆、矩阵乘法模块三步骤执行,通过一个状态机控制每步的执行,每个步骤都可以有效地并行计算,且具有可扩展性。
(3)本发明有效的重复利用运算和存储资源,相对于其他求逆方法有效地减少运算的资源需求量,通过分时复用的方式最大限度地提高硬件资源的利用率以及运算效率。
(4)本发现在LU分解过程中通过列选主元方式,有效地提高了矩阵求逆的计算精度和正确性,在基于单精度浮点运算单元条件下,128阶矩阵求逆的误差矩阵均方根统计误差(RMS)小于10-4。
附图说明
图1为矩阵求逆整体架构示意图。
图2为4×4的矩阵进行列选主元LU分解示意图。
图3为列选主元LU分解流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明的矩阵求逆运算方法进行详细的描述。
矩阵求逆分三步骤进行,分别是列选主元LU分解、三角矩阵求逆、矩阵相乘,使用一个状态机控制先后顺序,并且通过控制复选器,分时复用运算资源和存储资源,整体架构如图1。
(1)列选主元LU分解
计算矩阵A的部分选主元LU分解:PA=LU,其中P为置换矩阵,L为单位下三角矩阵(对角线元素为1),U为上三角矩阵。置换矩阵P为单位矩阵的行重新排列后的矩阵,每行每列有且仅有一个为1的元素,所以只需使用一个向量表示,向量中的第i个元素为置换矩阵中第i行中唯一一个1的列数。
下面举例介绍4×4的矩阵A上进行部分选主元LU分解的过程。如图2所示,首先从第一列中选取最大主元u11,与该列的第一个元素的值进行交换,并存储最大主元的行下标i;然后进行归一化,用u11去除该列其它元素,得到L分解因子的一列元素l21、l31和l41。后续每一列第一个元素的值与行下标i指向的元素的值进行交换,分别得到U分解因子的一行元素u12、u13和u14,同时得到新的子矩阵aij(2≤i,j≤4),对子矩阵进行更新操作:a1 ij=aij-li1*u1j。然后再对新的子矩阵重复以上步骤,最终得到L矩阵和U矩阵。另外存储下来的最大主元行下标要对三角矩阵L和U求逆后的乘法结果进行列变换。
列选主元LU分解循环重复三个步骤:选主元、归一化、数据更新。对于一个n阶矩阵,需要循环n-1次,k表示当前循环次数,如图3所示。
I.选主元:根据当前循环次数k,将矩阵的主列元素(第k列对角线及以下)读出,通过两个实数乘法器和一个实数加法器,流水运算得出主列元素的实部虚部平方和,再通过一个实数减法器,找出主元(即第k列对角线及以下元素中模最大的点)。具体实现过程是:首先读出两个平方和结果送到实数减法器,通过判断减法结果浮点数的符号位,确定并记录较大数及其行下标后,读入下一个平方和结果与当前最大数进行比较,直至找出当前循环中n-k+1个主列元素中主元(即模最大的数)。每次循环找出的主元行下标即组成置换矩阵P。
II.归一化:根据当前循环中找到的最大主元行下标i,将源矩阵的第k行与第i行互换。随后将数据交换后的主列(第k列)对角线数的实部和虚部,分别送入两个实数除法器算出主元的倒数,再将主列(第k列)对角线以下元素读出,通过一个复数乘法器与主元的倒数相乘(即归一化操作)。
III.数据更新:数据更新操作是列选主元LU中计算量最大的一步,针对此特点本设计采用四路并行运算,每路运算单元使用一个复数乘法器和一个复数加法器,将矩阵第k行第k+1列、第k行第k+2列、第k行第k+3列、第k行第k+4列的数据,分别送入四路运算单元中复数乘法器,同时与归一化的结果进行复数乘法运算;复数乘法器的结果直接送入复数加法器,与矩阵第k+1列、第k+2列、第k+3列、第k+4列中第k+1行至第n行数据分别相减。当这四列数据更新完后,再对矩阵第k行第k+5列、第k行第k+6列、第k行第k+7列、第k行第k+8列并行的进行数据更新操作,依此类推直至矩阵的最后一列完成数据更新操作,即完成了一次循环运算。
每次循环完成之后,对k进行加1操作,进行下一次循环,重复执行上述三大步骤,直至k=n-1,即得到矩阵分解的结果,上三角矩阵U和单位下三角矩阵L。
(2)三角矩阵求逆
对L矩阵求逆得到其逆矩阵L-1,将U矩阵的转置矩阵求逆后再转置得到U-1。对于分解后的下三角矩阵L的求逆,有以下的计算公式:
lij≠0(i=1,2,…n-1;i=j+1,j+2,…,n)
lij=0(j>i)的逆矩阵为其中:
上三角矩阵U的求逆过程可以利用U-1=((U-1)H)H=((UH)-1)H,先转置成下三角矩阵求逆,然后再转置回U的逆矩阵。
本实施例中,根据上述步骤2),提供一种下三角矩阵求逆运算模块,该模块划分为取倒单元、乘累加单元和取反乘单元。对于一个n阶下三角矩阵求逆,取倒单元只需1次,乘累加单元和取反乘单元需要循环n-1次。
A.取倒单元:根据下三角矩阵求逆公式,首先将对角线元素进行取倒。对于L矩阵,其对角线元素全为1,所以结果也都为1。对于转置后的U矩阵,将对角线元素读出,通过两个实数乘法器、一个实数加法器、一个实数除法器和一个复数乘法器得到其取倒的结果。具体实施如下:将复数的实部虚部分别输出到两个实数乘法器,两个实数乘法器的输出端分别与实数加法器的两个输入端连接,实数加法器的输出端与实数除法器的输入端连接,实数除法器的另一输入端固定地设置为1,最后实数除法器的输出端与复数乘法器的输入端连接。
B.乘累加单元:根据下三角矩阵求逆公式分析其数据依赖关系,通过四组由一个复数乘法器和一个复数加法器所组成的乘累加器,按行顺序并行计算非对角线元素,从第2行开始执行。L矩阵和转置后的U矩阵同时计算,分别使用两组乘累加器。乘累加器的具体实施如下:复数乘法器完成公式 中lik与Skj的复数相乘操作,其结果通过复数加法器和延迟控制逻辑完成累加操作。lik表示L矩阵中的数,Skj表示L矩阵的逆矩阵中的数,i表示行号,j表示列号,k表示累加循环次数。
C.取反乘单元:通过复数乘法器对前一步乘累加单元的结果,与取倒单元的结果(对应行的对角线元素倒数)进行取反乘运算,即得到相应行的求逆结果。对于L矩阵,因其对角线元素为1,只需将乘累加单元结果的符号位取反即为求逆结果。对于U矩阵,需将乘累加单元的结果取反后再与对应行的对角线元素相乘。
经过上述二、三步骤循环执行n-1次后,即可求得L、U矩阵的逆矩阵。
(3)矩阵相乘
最后A矩阵的求逆要通过计算公式A-1=U-1*L-1*P来完成。矩阵乘法模块采用四路并行运算,每路运算单元使用一个复数乘法器和两个复数加法器,其中两个复数加法器负责累加操作。整个乘法的过程当中,乘法器和累加器保持流水,累加器每隔n个周期出一个结果数据,其中n是矩阵的阶数。乘法的结果矩阵根据列选主元LU分解步骤中的置换矩阵P,对结果矩阵进行列变换得到最终的矩阵求逆结果。
本实施例根据上述技术方案(参见图1)提供了一种硬件模块。该硬件模块具体采用仿真/综合工具和40nmCMOS工艺,主频达到1GHz。基于1GHz时钟频率下,复数乘法器、复数加法器、实数乘法器、实数加法器均为4拍延迟的流水运算单元,实数除法器为19拍延迟的非流水运算单元,所有运算单元均为单精度浮点运算单元,存储器的取数延迟为6拍,128阶矩阵求逆的运行时间为1.42ms,结果误差矩阵均方根统计误差(RMS)小于10-4,增加了整体的可靠性。另一方面,该技术方案是基于单端口Memory和单精度浮点运算单元的并行流水处理,并支持任意阶数矩阵求逆的硬件模块有效加快了运算速度,提高了硬件利用率,且具有良好的可扩展性,适合于VLSI的设计实现。
Claims (10)
1.一种矩阵求逆运算方法,其特征在于包括如下步骤:
1)首先进行列选主元LU分解:根据公式PA=LU,将源矩阵A分解为单位下三角矩阵L、上三角矩阵U和置换矩阵P;
2)接着进行三角矩阵求逆:对L矩阵求逆得到其逆矩阵L-1,将U矩阵的转置矩阵求逆后再转置得到U-1;
3)最后进行矩阵相乘:将矩阵U-1和矩阵L-1相乘,并根据置换矩阵P将矩阵乘法结果进行列变换得到源矩阵A-1。
2.根据权利1所述的矩阵求逆运算方法,其特征在于,步骤1)包括如下步骤:
I)进行选主元:从第一列中选取最大主元,与该列的第一个元素的值进行交换,并存储最大主元的行下标;
II)进行归一化:将第一行与最大主元所在行互换,得到U分解因子的一行元素u1j,用交换后的第一列第一个元素依次除以该列的其它元素,得到L分解因子的一列元素li1,其中1≤i≤n,1≤j≤n,n表示矩阵阶数;
III)进行数据更新:对矩阵进行更新操作:a1 ij=aij-li1*u1j,得到新子矩阵a1 ij,每次更新操作后的子矩阵的阶数比原矩阵的阶数少一阶,其中,aij为原矩阵中的值,2≤i≤n,2≤j≤n,n表示矩阵阶数。对新的子矩阵循环重复以上三个步骤,最终得到L矩阵和U矩阵。
3.根据权利要求2所述的矩阵求逆运算方法,其特征在于,所述步骤I)中根据当前循环次数k,将矩阵的主列元素读出,先将所述主列元素通过两个实数乘法器和一个实数加法器,流水运算得出主列元素的实部虚部平方和,再通过一个实数减法器,找出主元。
4.根据权利要求2所述的矩阵求逆运算方法,其特征在于,所述步骤II)中根据当前循环中找到的最大主元行下标,将源矩阵的第k行与最大主元所在行互换,接着将数据交换后的主列对角线数的实部和虚部分别送入两个实数除法器中用于算出主元的倒数,再将主列对角线以下元素读出,通过一个复数乘法器与主元的倒数相乘,完成归一操作,其中k表示当前循环次数。
5.根据权利要求2所述的矩阵求逆运算方法,其特征在于,所述步骤III)中采用四路并行运算,每路运算使用一个复数乘法器和一个复数加法器,将矩阵第k行第k+1列、第k行第k+2列、第k行第k+3列、第k行第k+4列的数据,分别送入四路运算的对应复数乘法器中,与步骤2)中归一化的结果进行复数乘法运算;复数乘法器的结果直接送入复数加法器,与矩阵第k+1列、第k+2列、第k+3列、第k+4列中第k+1行至第n行数据分别相减,当所述四列数据更新完后,再对所述四列数据后续四列数据进行数据更新操作,依此类推直至矩阵的最后一列完成数据更新操作,即完成了一次数据更新,其中k表示当前循环次数,n为矩阵阶数。
6.根据权利要求2所述的矩阵求逆运算方法,其特征在于,所述步骤2)通过取倒单元、乘累加单元以及取反乘单元实现矩阵的求逆、转置,其中,
A.取倒单元:根据下三角矩阵求逆公式,首先将对角线元素进行取倒,对于L矩阵,结果为1;对于转置后的U矩阵,将对角线元素读出,通过两个实数乘法器、一个实数加法器、一个实数除法器和一个复数乘法器得到取倒运算的结果;
B.乘累加单元:根据下三角矩阵求逆公式分别分析L矩阵和转置后的U矩阵的数据依赖关系,通过四组由一个复数乘法器和一个复数加法器所组成的乘累加器进行乘累加运算,所述乘累加运算从第2行开始按行顺序计算非对角线元素,L矩阵和转置后的U矩阵同时进行乘累加运算;
C.取反乘单元:通过复数乘法器对步骤B)中乘累加单元的结果,与步骤A)中取倒单元的结果进行取反乘运算,即得到相应行的取反结果。
7.根据权利要求6所述的矩阵求逆运算方法,其特征在于,所述步骤A)中将复数的实部虚部分别输出到所述两个实数乘法器,两个实数乘法器的输出端分别与所述实数加法器的两个输入端连接,实数加法器的输出端与所述实数除法器的输入端连接,实数除法器的另一输入端固定地设置为1,实数除法器的输出端与所述复数乘法器的输入端连接。
8.根据权利要求6所述的矩阵求逆运算方法,其特征在于,所述步骤B)中L矩阵和转置后的U矩阵进行乘累加运算时,分别使用两组乘累加器,每组乘累加器包括
复数乘法器完成L、U递推公式 中lik与Skj的复数相乘操作,lik表示L矩阵中的数,Skj表示L矩阵的逆矩阵中的数,i表示行号,j表示列号,k表示累加循环次数;
复数加法器和延迟控制逻辑,根据复数乘法器的结果完成累加操作。
9.根据权利要求6所述的矩阵求逆运算方法,其特征在于,所述步骤C)中对于L矩阵,将乘累加单元结果的符号位取反作为取反结果;对于U矩阵,需将乘累加单元的结果取反后再与对应行的对角线元素相乘作为取反结果。
10.根据权利要求1所述的矩阵求逆运算方法,其特征在于,所述步骤3)中将U-1矩阵按行划分为四等份,同时使用四路乘累加运算单元分别与L-1矩阵进行乘累加运算,并根据步骤1)中的P矩阵,对乘法结果矩阵进行列变换得到最终的矩阵求逆结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510994192.7A CN105426345A (zh) | 2015-12-25 | 2015-12-25 | 一种矩阵求逆运算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510994192.7A CN105426345A (zh) | 2015-12-25 | 2015-12-25 | 一种矩阵求逆运算方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105426345A true CN105426345A (zh) | 2016-03-23 |
Family
ID=55504560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510994192.7A Pending CN105426345A (zh) | 2015-12-25 | 2015-12-25 | 一种矩阵求逆运算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105426345A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021188A (zh) * | 2016-05-11 | 2016-10-12 | 广州广电运通金融电子股份有限公司 | 浮点矩阵求逆的并行硬件架构和并行计算方法 |
CN106980600A (zh) * | 2016-01-18 | 2017-07-25 | 普天信息技术有限公司 | 一种lte接收系统中fpga处理复数矩阵乘法的方法及系统 |
CN108228536A (zh) * | 2018-02-07 | 2018-06-29 | 成都航天通信设备有限责任公司 | 使用FPGA实现Hermitian矩阵分解的方法 |
CN108509386A (zh) * | 2018-04-19 | 2018-09-07 | 武汉轻工大学 | 生成可逆模m矩阵的方法和装置 |
CN108536651A (zh) * | 2018-04-19 | 2018-09-14 | 武汉轻工大学 | 生成可逆模m矩阵的方法和装置 |
CN109033649A (zh) * | 2018-08-01 | 2018-12-18 | 东南大学 | 一种计算作用在电机转子上的均布电磁力的方法 |
CN109446478A (zh) * | 2018-10-30 | 2019-03-08 | 南京大学 | 一种基于迭代和可重构方式的复协方差矩阵计算系统 |
CN109902498A (zh) * | 2019-02-27 | 2019-06-18 | 南京师范大学 | 数据加密方法、数据解密方法及相应的装置和设备 |
CN110162742A (zh) * | 2019-03-31 | 2019-08-23 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 实数矩阵求逆的浮点运算电路实现方法 |
CN110377875A (zh) * | 2019-07-16 | 2019-10-25 | 广东省新一代通信与网络创新研究院 | 矩阵求逆方法、装置、设备及计算机可读存储介质 |
CN110598271A (zh) * | 2019-08-22 | 2019-12-20 | 中国电子科技集团公司第二十九研究所 | 一种基于fpga实现4辅助天线slc功能的系统及方法 |
CN110851780A (zh) * | 2019-10-18 | 2020-02-28 | 南京大学 | Levy频率特性拟合算法中复杂系数矩阵计算的FPGA实现装置及方法 |
CN111222092A (zh) * | 2018-11-26 | 2020-06-02 | 北京华航无线电测量研究所 | 一种基于fpga的矩阵特征分解方法 |
CN111596320A (zh) * | 2020-05-28 | 2020-08-28 | 成都天奥信息科技有限公司 | 一种高性能的抗干扰方法及装置 |
CN111935746A (zh) * | 2020-08-14 | 2020-11-13 | Oppo广东移动通信有限公司 | 获取通信参数的方法、装置、终端及存储介质 |
CN112445752A (zh) * | 2019-08-28 | 2021-03-05 | 上海华为技术有限公司 | 一种基于乔列斯基分解的矩阵求逆装置 |
CN112799637A (zh) * | 2021-01-22 | 2021-05-14 | 西安电子科技大学 | 一种并行环境下高吞吐量的模逆计算方法及系统 |
CN113326477A (zh) * | 2021-07-30 | 2021-08-31 | 华控清交信息科技(北京)有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN113779500A (zh) * | 2021-08-23 | 2021-12-10 | 华控清交信息科技(北京)有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN114756814A (zh) * | 2022-04-29 | 2022-07-15 | 北京大学 | 一种可变电阻阵列构成方法及基于其实现的模拟矩阵计算电路 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101604306A (zh) * | 2009-06-03 | 2009-12-16 | 中国人民解放军国防科学技术大学 | 基于fpga的列选主元lu分解方法 |
CN102722470A (zh) * | 2012-05-18 | 2012-10-10 | 大连理工大学 | 一种线性方程组的单机并行求解方法 |
CN103399841A (zh) * | 2013-07-31 | 2013-11-20 | 清华大学 | 基于gpu的稀疏矩阵lu分解方法 |
CN103927290A (zh) * | 2014-04-18 | 2014-07-16 | 南京大学 | 一种任意阶下三角复矩阵求逆运算方法 |
CN104636315A (zh) * | 2015-02-06 | 2015-05-20 | 中国人民解放军国防科学技术大学 | 面向gpdsp的矩阵lu分解向量化计算的方法 |
-
2015
- 2015-12-25 CN CN201510994192.7A patent/CN105426345A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101604306A (zh) * | 2009-06-03 | 2009-12-16 | 中国人民解放军国防科学技术大学 | 基于fpga的列选主元lu分解方法 |
CN102722470A (zh) * | 2012-05-18 | 2012-10-10 | 大连理工大学 | 一种线性方程组的单机并行求解方法 |
CN103399841A (zh) * | 2013-07-31 | 2013-11-20 | 清华大学 | 基于gpu的稀疏矩阵lu分解方法 |
CN103927290A (zh) * | 2014-04-18 | 2014-07-16 | 南京大学 | 一种任意阶下三角复矩阵求逆运算方法 |
CN104636315A (zh) * | 2015-02-06 | 2015-05-20 | 中国人民解放军国防科学技术大学 | 面向gpdsp的矩阵lu分解向量化计算的方法 |
Non-Patent Citations (3)
Title |
---|
宋一鑫等: "RMMSE雷达脉冲压缩快速算法中矩阵求逆的FPGA实现", 《成都信息工程学院学报》 * |
牛新等: "可选主元LU分解流水线算法设计与FPGA实现", 《高技术通讯》 * |
邵仪: "基于FPGA的矩阵运算固化实现技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106980600B (zh) * | 2016-01-18 | 2019-09-06 | 普天信息技术有限公司 | 一种lte接收系统中fpga处理复数矩阵乘法的方法及系统 |
CN106980600A (zh) * | 2016-01-18 | 2017-07-25 | 普天信息技术有限公司 | 一种lte接收系统中fpga处理复数矩阵乘法的方法及系统 |
CN106021188A (zh) * | 2016-05-11 | 2016-10-12 | 广州广电运通金融电子股份有限公司 | 浮点矩阵求逆的并行硬件架构和并行计算方法 |
CN108228536A (zh) * | 2018-02-07 | 2018-06-29 | 成都航天通信设备有限责任公司 | 使用FPGA实现Hermitian矩阵分解的方法 |
CN108228536B (zh) * | 2018-02-07 | 2021-03-23 | 成都航天通信设备有限责任公司 | 使用FPGA实现Hermitian矩阵分解的方法 |
CN108509386A (zh) * | 2018-04-19 | 2018-09-07 | 武汉轻工大学 | 生成可逆模m矩阵的方法和装置 |
CN108509386B (zh) * | 2018-04-19 | 2022-04-08 | 武汉轻工大学 | 生成可逆模m矩阵的方法和装置 |
CN108536651A (zh) * | 2018-04-19 | 2018-09-14 | 武汉轻工大学 | 生成可逆模m矩阵的方法和装置 |
CN108536651B (zh) * | 2018-04-19 | 2022-04-05 | 武汉轻工大学 | 生成可逆模m矩阵的方法和装置 |
CN109033649A (zh) * | 2018-08-01 | 2018-12-18 | 东南大学 | 一种计算作用在电机转子上的均布电磁力的方法 |
CN109446478A (zh) * | 2018-10-30 | 2019-03-08 | 南京大学 | 一种基于迭代和可重构方式的复协方差矩阵计算系统 |
CN109446478B (zh) * | 2018-10-30 | 2021-09-28 | 南京大学 | 一种基于迭代和可重构方式的复协方差矩阵计算系统 |
CN111222092B (zh) * | 2018-11-26 | 2023-06-13 | 北京华航无线电测量研究所 | 一种基于fpga的矩阵特征分解方法 |
CN111222092A (zh) * | 2018-11-26 | 2020-06-02 | 北京华航无线电测量研究所 | 一种基于fpga的矩阵特征分解方法 |
CN109902498B (zh) * | 2019-02-27 | 2023-08-18 | 南京师范大学 | 数据加密方法、数据解密方法及相应的装置和设备 |
CN109902498A (zh) * | 2019-02-27 | 2019-06-18 | 南京师范大学 | 数据加密方法、数据解密方法及相应的装置和设备 |
CN110162742B (zh) * | 2019-03-31 | 2023-09-15 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 实数矩阵求逆的浮点运算电路实现方法 |
CN110162742A (zh) * | 2019-03-31 | 2019-08-23 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 实数矩阵求逆的浮点运算电路实现方法 |
CN110377875B (zh) * | 2019-07-16 | 2024-01-16 | 广东省新一代通信与网络创新研究院 | 矩阵求逆方法、装置、设备及计算机可读存储介质 |
CN110377875A (zh) * | 2019-07-16 | 2019-10-25 | 广东省新一代通信与网络创新研究院 | 矩阵求逆方法、装置、设备及计算机可读存储介质 |
CN110598271A (zh) * | 2019-08-22 | 2019-12-20 | 中国电子科技集团公司第二十九研究所 | 一种基于fpga实现4辅助天线slc功能的系统及方法 |
CN112445752A (zh) * | 2019-08-28 | 2021-03-05 | 上海华为技术有限公司 | 一种基于乔列斯基分解的矩阵求逆装置 |
CN112445752B (zh) * | 2019-08-28 | 2024-01-05 | 上海华为技术有限公司 | 一种基于乔列斯基分解的矩阵求逆装置 |
CN110851780A (zh) * | 2019-10-18 | 2020-02-28 | 南京大学 | Levy频率特性拟合算法中复杂系数矩阵计算的FPGA实现装置及方法 |
CN111596320A (zh) * | 2020-05-28 | 2020-08-28 | 成都天奥信息科技有限公司 | 一种高性能的抗干扰方法及装置 |
CN111935746A (zh) * | 2020-08-14 | 2020-11-13 | Oppo广东移动通信有限公司 | 获取通信参数的方法、装置、终端及存储介质 |
CN111935746B (zh) * | 2020-08-14 | 2024-01-09 | Oppo广东移动通信有限公司 | 获取通信参数的方法、装置、终端及存储介质 |
CN112799637B (zh) * | 2021-01-22 | 2023-03-14 | 西安电子科技大学 | 一种并行环境下高吞吐量的模逆计算方法及系统 |
CN112799637A (zh) * | 2021-01-22 | 2021-05-14 | 西安电子科技大学 | 一种并行环境下高吞吐量的模逆计算方法及系统 |
CN113326477A (zh) * | 2021-07-30 | 2021-08-31 | 华控清交信息科技(北京)有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN113779500A (zh) * | 2021-08-23 | 2021-12-10 | 华控清交信息科技(北京)有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN113779500B (zh) * | 2021-08-23 | 2024-01-30 | 华控清交信息科技(北京)有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN114756814A (zh) * | 2022-04-29 | 2022-07-15 | 北京大学 | 一种可变电阻阵列构成方法及基于其实现的模拟矩阵计算电路 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105426345A (zh) | 一种矩阵求逆运算方法 | |
CN103927290A (zh) | 一种任意阶下三角复矩阵求逆运算方法 | |
Benner et al. | State-space truncation methods for parallel model reduction of large-scale systems | |
US7065545B2 (en) | Computer methods of vector operation for reducing computation time | |
Park | Guaranteed-stable sliding DFT algorithm with minimal computational requirements | |
CN108228536A (zh) | 使用FPGA实现Hermitian矩阵分解的方法 | |
Paksoy et al. | Tmvp-based multiplication for polynomial quotient rings and application to saber on arm cortex-m4 | |
Gasiorek | Efficient computation of the isotropy group of a finite graph: a combinatorial approach | |
CN105630741A (zh) | 一种改进的按位替换法求矩阵逆矩阵模块 | |
Pan | Fast approximate computations with Cauchy matrices, polynomials and rational functions | |
EP4168943A1 (en) | System and method for accelerating training of deep learning networks | |
Meini | Solving M/G/l type Markov chains: recent advances and applications | |
Eidelman et al. | On generators of quasiseparable finite block matrices | |
Felisiak et al. | On computing mesh root systems and the isotropy group for simply-laced Dynkin diagrams | |
Chen et al. | On realizations of least-squares estimation and Kalman filtering by systolic arrays | |
Ma et al. | Accelerating SVD computation on FPGAs for DSP systems | |
Hariri et al. | Digit-level semi-systolic and systolic structures for the shifted polynomial basis multiplication over binary extension fields | |
Triantafyllou et al. | On rank and null space computation of the generalized Sylvester matrix | |
CN103942027A (zh) | 一种可重构的快速并行乘法器 | |
Austin et al. | A memory efficient parallel tridiagonal solver | |
Saito et al. | Computation of true chaotic orbits using cubic irrationals | |
Atighehchi et al. | Arithmetic in finite fields based on the Chudnovsky-Chudnovsky multiplication algorithm | |
Kaloorazi et al. | Randomized ULV decomposition for approximating low-rank matrices | |
Kulkarni | Parallel hardware implementation of convolution using vedic mathematics | |
CN104239279A (zh) | 一种乘法器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160323 |