CN105701068A - 基于分时复用技术的cholesky矩阵求逆系统 - Google Patents

基于分时复用技术的cholesky矩阵求逆系统 Download PDF

Info

Publication number
CN105701068A
CN105701068A CN201610094119.9A CN201610094119A CN105701068A CN 105701068 A CN105701068 A CN 105701068A CN 201610094119 A CN201610094119 A CN 201610094119A CN 105701068 A CN105701068 A CN 105701068A
Authority
CN
China
Prior art keywords
matrix
module
cholesky
state machine
upper triangular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610094119.9A
Other languages
English (en)
Other versions
CN105701068B (zh
Inventor
沙金
陈万雄
胡光辉
沈伟
任道
邵伟
张盟盟
潘红兵
李丽
李伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201610094119.9A priority Critical patent/CN105701068B/zh
Publication of CN105701068A publication Critical patent/CN105701068A/zh
Application granted granted Critical
Publication of CN105701068B publication Critical patent/CN105701068B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于分时复用技术的cholesky矩阵求逆系统,降低了在雷达信号处理中对共轭对称矩阵求逆所使用的硬件资源,同时通过提高矩阵求逆运算的并行度来保证运算速度。本发明根据公式A = L * D * LH,通过主控状态机将cholesky分解矩阵求逆划为三个步骤进行,分别是cholesky分解、上三角矩阵求逆和矩阵相乘。在主控状态机的控制下,通过复选器,分时复用运算资源和存储资源。该技术方案是基于单端口存储器和单精度浮点复数运算单元的并行流水处理,并支持任意阶数的共轭对称矩阵求逆,有效加快了运算速度,提高了硬件利用率,且具有良好的兼容性。

Description

基于分时复用技术的cholesky矩阵求逆系统
技术领域
本发明属于雷达信号处理技术领域,具体是一种基于FPGA的正定复数矩阵求逆的硬件结构。在雷达信号处理中,常对正定复数矩阵求逆,若使用通用矩阵求逆的算法和结构,会使用额外的资源。本发明提出的硬件结构专门针对正定复数矩阵求逆,适合雷达信号处理中的求逆操作。
背景技术
矩阵求逆的方法有很多,包括伴随矩阵法、高斯消元法、初等变换法、矩阵分解法等等。
上述各种矩阵求逆的方法中,伴随矩阵法、高斯消元法、初等变换法中需要求大量的行列式,每个行列式都几乎要计算到所有的矩阵元素,计算量大,对存储空间的需求大,在FPGA上实现比较困难。
矩阵分解法是将矩阵分解为一些较简单矩阵的乘积,如三角矩阵或酉矩阵,他们都具有某种特性,较容易得到逆矩阵。对分解得到的矩阵求逆后相乘,得到原矩阵的逆矩阵。矩阵分解法分为几种:1)LU分解法,2)QR分解法,3)奇异值分解法,4)cholesky分解法。
前三种矩阵分解法,都是对所有可逆复数矩阵进行求解与计算,算法较复杂,资源使用较多;而第四种分解法是针对共轭对称矩阵求逆,算法较简单,资源使用也较少。而在雷达信号处理中,主要是对自相关后得到的共轭对称矩阵进行求逆操作,因此本发明选择cholesky分解法。
cholesky分解法常用于线性方程的求解、矩阵求逆和行列式计算,在雷达信号处理、科学计算等诸多领域也有广泛应用。根据公式A=L*D*LH,cholesky分解法是将原矩阵A分解为单位下三角矩阵L(对角线元素为1)、对角矩阵D,上三角矩阵LH(是L的共轭转置矩阵),原矩阵A对角线上的元素必须是实数,其他元素可以是复数。
因三角矩阵几乎一半数据都为0,所以求逆简单,且LH是L的共轭转置矩阵,因此只需求得(LH)-1,取共轭转置即得到了L-1
令Gij=Lij*Dii,则cholesky分解公式可由此推得:
d11=a11
对i=2...n有
g i j = a i j - Σ k = 1 j - 1 g i k * l j k * , ( j = 1 , 2... i - 1 ) ; l i j = g i j d i j , ( j = 1 , 2... i - 1 ) ; d i i = d i i - Σ k = 1 i - 1 g i k * l i k * ;
由于dii出现在分母中,因此只有当dii≠0(i=1...n)时,分解才能进行到底。此外,在实际的计算过程中,即使不为零,但当它很小的时候,由于计算机的精度限制,会导致下溢,也会使分解运算不稳定。
发明内容
发明目的:在FPGA芯片上提供一种硬件复杂度低,资源利用率高的正定矩阵浮点求逆结构。在尽可能减少硬件资源消耗的情况下,通过提高矩阵求逆运算的并行度来保证运算速度。
技术方案:一种基于分时复用技术的cholesky矩阵求逆系统,包括五个模块:1)主控状态机模块2)资源复用模块3)cholesky分解模块4)上三角矩阵求逆模块5)矩阵相乘模块。
所述的主控状态机模块与系统总线相连接,在求逆操作开始前,接收使能拉高,根据待求逆矩阵维度,从外部按行顺序接收原矩阵数据,存放在资源复用模块的存储器中,接收完成后,将接收使能拉低,并通过cholesky分解模块、上三角矩阵求逆模块、矩阵相乘模块分别进行cholesky分解、上三角矩阵求逆、矩阵乘法3个步骤进行cholesky矩阵求逆操作。求逆完成后向总线发出求逆结束信号,通知系统总线从存储模块读取运算结果。
所述的资源复用模块内部有3个存储器,1个单精度浮点复数乘法器,1个单精度浮点复数累加器,存储器用于存放求逆过程中各个阶段的矩阵数据,在cholesky分解,上三角求逆,矩阵乘法的运算中,都需进行复数乘法,复数累加操作,且三个运算步骤是顺序执行,因此可复用单精度浮点复数乘法器和单精度浮点复数累加器(见表1)。资源复用模块与主控状态机模块、cholesky分解模块、上三角矩阵求逆模块、矩阵相乘模块相连接。根据主控状态机的状态,资源复用内部的存储资源和运算资源受不同模块控制。
所述的cholesky分解模块是通过对原矩阵元素进行乘法,加法,除法运算将原矩阵A分解为单位下三角矩阵L(对角线元素为1)、对角矩阵D,上三角矩阵LH(是L的共轭转置矩阵)。cholesky分解模块内部是一个地址生成状态机和两个单精度浮点除法器,外部与主控状态机和资源复用模块相连,在分解过程中将使用资源复用模块中的2个存储器和浮点乘法器,浮点累加器,2个存储器分别存放原始矩阵A和分解得到的上三角矩阵LH
在接收到主控状态机模块输入的cholesky分解起始信号后,cholesky分解模块的内部地址生成状态机根据矩阵维度开始按cholesky分解公式的计算顺序生成原矩阵读地址和分解后上三角矩阵的写地址。将读出的数据依次送入浮点乘法器,浮点累加器,浮点除法器,除法器结果即为分解后上三角矩阵的元素。在分解完成后,通过复用浮点除法器对分解后得到的对角矩阵的所有对角元素求倒数(即求对角阵的逆)。
所述的上三角矩阵求逆模块,因choelsky分解后得到的上三角矩阵的对角线元素全为1,所以可以对上三角矩阵求逆公式进行简化,省去除法操作。上三角矩阵求逆模块内部是一个地址生成状态机,外部与主控状态机和资源复用模块相连,在上三角矩阵求逆过程中将使用资源复用模块中的2个存储器、浮点乘法器和浮点累加器,2个存储器分别存放的是分解得到的上三角矩阵LH和求逆得到的上三角逆矩阵(LH)-1,在接收到主控状态机模块输入的上三角矩阵求逆起始信号后,上三角矩阵求逆模块的内部地址生成状态机根据矩阵维度开始按上三角矩阵求逆公式的计算顺序生成原上三角矩阵读地址和上三角逆矩阵的写地址,将读出的数据依次送入浮点乘法器,浮点累加器,累加器结果即为上三角逆矩阵的元素。
所述的矩阵乘法模块内部是一个地址生成状态机,外部与主控状态机和资源复用模块相连,在矩阵乘法过程中将使用资源复用模块中的3个存储器、浮点乘法器和浮点累加器,3个存储器分别存放的是求逆得到的上三角逆矩阵(LH)-1、矩阵(LH)-1和矩阵D-1相乘的结果(LH)-1*D-1和原矩阵的逆A-1。在接收到主控状态机模块输入的矩阵乘法模块起始信号后,通过矩阵乘法模块内部的地址生成状态机控制的存储器读写,先进行上三角矩阵(LH)-1与对角阵D-1相乘,再进行上三角矩阵(LH)-1*D-1与下三角矩阵L-1相乘,得到元矩阵的逆A-1
工作原理:cholesky分解矩阵求逆运算划分为三个步骤进行:
(1)cholesky分解,根据公式A=L*D*LH,将原矩阵A分解为单位下三角矩阵L(对角线元素为1)、对角矩阵D,上三角矩阵LH(LH是L的共轭转置矩阵),并且将D对角线上的各个元素分别求倒数(即D的逆),原矩阵A对角线上的元素必须是实数,其他元素可以是复数;
(2)上三角矩阵求逆,将LH矩阵求逆得到其逆矩阵(LH)-1
(3)矩阵乘法,根据公式A-1=(LH)-1*D-1*L-1,先将矩阵(LH)-1和矩阵D-1相乘,再将矩阵(LH)-1*D-1与矩阵L-1相乘得到原矩阵的逆A-1
有益效果:在雷达信号处理中,常对正定复数矩阵求逆,若使用通用矩阵求逆的算法和结构,会使用额外的资源。本发明提出的硬件结构专门针对正定复数矩阵求逆,适合雷达信号处理中的求逆操作。同时,通过分时复用存储器和运算资源,最大限度地提高硬件资源的利用率以及运算效率。
附图说明
图1为cholesky矩阵求逆硬件架构示意图;
图2为cholesky分解流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
基于分时复用技术的cholesky矩阵求逆系统,包括五个模块:1)主控状态机模块2)资源复用模块3)cholesky分解模块4)上三角矩阵求逆模块5)矩阵相乘模块。
主控状态机模块与系统总线相连接,在求逆操作开始前,接收使能拉高,根据待求逆矩阵维度,从外部按行顺序接收原矩阵数据,存放在资源复用模块的存储器中,接收完成后,将接收使能拉低,并通过cholesky分解模块、上三角矩阵求逆模块、矩阵相乘模块分别进行cholesky分解、上三角矩阵求逆、矩阵乘法3个步骤进行cholesky矩阵求逆操作。求逆完成后向总线发出求逆结束信号,通知系统总线从存储模块读取运算结果。
资源复用模块内部有3个存储器(图1中RAMA-C),1个单精度浮点复数乘法器,2个单精度浮点累加器。资源复用模块与主控状态机模块、cholesky分解模块、上三角矩阵求逆模块、矩阵相乘模块相连接。根据主控状态机的状态,资源复用内部的存储资源和运算资源受不同模块控制。
cholesky分解模块是通过对原矩阵元素进行乘法,加法,除法运算将原矩阵A分解为单位下三角矩阵L(对角线元素为1)、对角矩阵D,上三角矩阵LH(是L的共轭转置矩阵)。cholesky分解模块内部是一个地址生成状态机和两个单精度浮点除法器,外部与主控状态机和资源复用模块相连,在分解过程中将使用资源复用模块中的存储资源和浮点乘法器,浮点累加器。
在接收到主控状态机模块输入的cholesky分解起始信号后,cholesky分解模块的内部地址状态机根据矩阵维度开始按顺序生成原矩阵读地址和分解后上三角矩阵的写地址。在分解完成后,通过复用浮点除法器对分解后得到的对角矩阵的所有对角元素求倒数(即求对角阵的逆)。
上三角矩阵求逆模块,因choelsky分解后得到的上三角矩阵的对角线元素全为1,所以可以对上三角矩阵求逆公式进行简化,省去除法操作。上三角矩阵求逆模块内部是一个地址生成状态机,外部与主控状态机和资源复用模块相连,在上三角矩阵求逆过程中将使用资源复用模块中的存储资源、浮点乘法器和浮点累加器。在接收到主控状态机模块输入的上三角矩阵求逆起始信号后,上三角矩阵求逆模块的内部地址生成状态机根据矩阵维度开始按顺序生成原上三角矩阵读地址和上三角逆矩阵的写地址。
矩阵乘法模块内部是一个地址生成状态机,外部与主控状态机和资源复用模块相连,在矩阵乘法模过程中将使用资源复用模块中的存储资源、浮点乘法器和浮点累加器。在接收到主控状态机模块输入的矩阵乘法模块起始信号后,通过矩阵乘法模块内部状态机控制的存储器读写,先进行上三角矩阵与对角阵相乘,再进行上三角矩阵与下三角矩阵相乘。
cholesky矩阵求逆操作分为3个步骤,分别是cholesky分解、上三角矩阵求逆、矩阵相乘,由cholesky矩阵求逆顶层模块的一个主控状态机控制三步顺序执行,并分时复用资源复用模块中的3个存储器、浮点乘法器和浮点累加器,整体架构如图1。
(1)cholesky分解
根据公式A=L*D*LH,令G=L*D,d11=a11,对i=2...n有
g i j = a i j - Σ k = 1 j - 1 g i k * l j k * , ( j = 1 , 2... i - 1 ) ; l i j = g i j d i j , ( j = 1 , 2... i - 1 ) ; d i i = d i i - Σ k = 1 i - 1 g i k * l i k * ;
硬件实现过程如下:
Ⅰ.计算矩阵G当前列的所有元素:由cholesky分解公式,按列依次从资源复用模块的两片RAM中分别读出gik和lik的共轭(虚部符号取反)送入浮点复数乘法器,再将乘法结果送入累加器(实虚部符号位取反实现累减)得到gij,并将gij写入对应的RAM,读写gik和ljk的地址,由cholesky分解模块内部的地址生成状态机产生。
Ⅱ.计算三角矩阵L当前列所有元素:由cholesky分解公式,将累加器的结果gij实部和虚部分别和存放在寄存器中的dii送入两个浮点除法器,再将除法结果lij写入对应的RAM,lij的写地址由状态机计算产生。因为输入原矩阵的特殊性,分解得到的对角矩阵D的各元素都是实数,所以浮点除法器不需要设为通用的浮点复数除法器,节省了运算资源。
Ⅲ.更新对角矩阵D当前列元素:根据公式可得,矩阵D的对角元素等于分解后得到的矩阵G的对角元素;因此,若当前列是第一列,则直接令d11=a11,存入寄存器中,否则,通过计数器判断此时矩阵G当前元素是否为对角元素,若是,则将此时矩阵G元素存放在存储D矩阵元素的寄存器中。
重复上述三个步骤,直到cholesky分解完成。
Ⅳ.在cholesky分解完成后,通过复选器改变浮点除法器的输入,从存储D矩阵元素的寄存器中将D矩阵对角线上的各个元素读出并分别求倒数(即D的逆);
(2)上三角矩阵求逆
对上三角矩阵求逆,有以下计算公式:
b i j ( i ≤ j ) = 1 a i i , ( i = j ) - 1 a i i · Σ k = i + 1 j a i k · b k j , ( i ≠ j )
而我们cholesky分解得到的上三角矩阵LH对角元素都为1,因此上三角矩阵求逆公式可化简为:
b i j ( i ≤ j ) = 1 , ( i = j ) - Σ k = i + 1 j a i k · b k j , ( i ≠ j )
求逆过程从对角线开始,按斜行进行,硬件实现过程如下:
Ⅰ.对角线元素初始化:分解得到的上三角矩阵LH和上三角逆矩阵(LH)-1分别存放在资源复用模块的两片RAM中,通过计数器判断当前斜行是否为对角线,若是,则直接将1写入(LH)-1对角线对应的RAM地址。
Ⅱ.非对角线元素计算:若当前斜行不是对角线,依次从资源复用模块的两片RAM中读取LH和(LH)-1对应位置的元素,送入浮点复数乘法器,再将乘法器结果送入浮点累加器(实虚部符号位取反实现累减)得到(LH)-1当前计算的元素并写入对应RAM的地址,经过迭代直到算出(LH)-1右上角的值后,上三角求逆结束。对LH和(LH)-1对应RAM的读写地址,由上三角求逆模块内部的地址生成状态机产生。
(3)矩阵相乘
得到原矩阵A的逆要通过计算公式A-1=(LH)-1*D-1*L-1,硬件实现过程如下:
Ⅰ.上三角矩阵乘对角阵:从资源复用模块的RAM中按行读取(LH)-1的值,将其与寄存器中的D-1的对角元素按计算顺序送入浮点乘累加单元,并将计算结果存储在资源复用模块的RAM中。RAM的读写地址和对角阵元素的读取由模块内部的地址生成状态机产生。
Ⅱ.上三角矩阵乘下三角阵:从资源复用模块的RAM中读取矩阵(LH)-1*D-1和矩阵L-1的值,将它们顺序送入浮点乘累加单元,让后把累加器的结果存入资源复用模块的存放A-1的RAM中。RAM的读写地址由矩阵相乘模块内部的地址生成状态机产生。
本设计具体在V7-690芯片上进行验证,主频达到200MHz。基于200MHz时钟频率下,复数浮点乘法器、浮点累加器、浮点除法器均为的流水运算单元,且延时拍数可调,所有运算单元均为单精度浮点运算单元,72阶矩阵求逆的运行时间为2.15ms,与传统cpu进行矩阵求逆操作相比,大幅提高了计算速度,且结果相对误差小于10-4
表1cholesky矩阵求逆资源复用表
RAM A RAM B RAM C 复数乘法器 复数累加器
cholesky A LH ×
上三角求逆 (LH)-1 LH ×
矩阵相乘 (LH)-1 (LH)-1*D-1 A-1

Claims (6)

1.一种基于分时复用技术的cholesky矩阵求逆系统,其特征在于,包括五个模块:主控状态机模块、资源复用模块、cholesky分解模块、上三角矩阵求逆模块和矩阵相乘模块;
所述的主控状态机模块与系统总线相连接,在求逆操作开始前,接收使能拉高,根据待求逆矩阵维度,从外部按行顺序接收原矩阵数据,存放在资源复用模块的存储器中,接收完成后,将接收使能拉低,并通过cholesky分解模块、上三角矩阵求逆模块、矩阵相乘模块分别进行cholesky分解、上三角矩阵求逆、矩阵乘法3个步骤进行cholesky矩阵求逆操作;求逆完成后向总线发出求逆结束信号,通知系统总线从存储模块读取运算结果。
2.如权利要求1所述的基于分时复用技术的cholesky矩阵求逆系统,其特征在于,所述的资源复用模块内部有3个存储器,1个单精度浮点复数乘法器,1个单精度浮点复数累加器;资源复用模块与主控状态机模块、cholesky分解模块、上三角矩阵求逆模块、矩阵相乘模块相连接;根据主控状态机的状态,资源复用内部的存储资源和运算资源受不同模块控制。
3.如权利要求1所述的基于分时复用技术的cholesky矩阵求逆系统,其特征在于,所述的cholesky分解模块是通过对原矩阵元素进行乘法,加法,除法运算将原矩阵A分解为单位下三角矩阵L、对角矩阵D,上三角矩阵LH;cholesky分解模块内部是一个地址生成状态机和两个单精度浮点除法器,外部与主控状态机和资源复用模块相连,在分解过程中将使用资源复用模块中的存储资源和浮点乘法器,浮点累加器。
4.如权利要求1所述的基于分时复用技术的cholesky矩阵求逆系统,其特征在于,在接收到主控状态机模块输入的cholesky分解起始信号后,cholesky分解模块的内部地址状态机根据矩阵维度开始按顺序生成原矩阵读地址和分解后上三角矩阵的写地址;在分解完成后,通过复用浮点除法器对分解后得到的对角矩阵的所有对角元素求倒数。
5.如权利要求1所述的基于分时复用技术的cholesky矩阵求逆系统,其特征在于,所述的上三角矩阵求逆模块,因choelsky分解后得到的上三角矩阵的对角线元素全为1,所以可以对上三角矩阵求逆公式进行简化,省去除法操作;上三角矩阵求逆模块内部是一个地址生成状态机,外部与主控状态机和资源复用模块相连,在上三角矩阵求逆过程中将使用资源复用模块中的存储资源、浮点乘法器和浮点累加器;在接收到主控状态机模块输入的上三角矩阵求逆起始信号后,上三角矩阵求逆模块的内部地址生成状态机根据矩阵维度开始按顺序生成原上三角矩阵读地址和上三角逆矩阵的写地址。
6.如权利要求1所述的基于分时复用技术的cholesky矩阵求逆系统,其特征在于,所述的矩阵乘法模块内部是一个地址生成状态机,外部与主控状态机和资源复用模块相连,在矩阵乘法模过程中将使用资源复用模块中的存储资源、浮点乘法器和浮点累加器;在接收到主控状态机模块输入的矩阵乘法模块起始信号后,通过矩阵乘法模块内部状态机控制的存储器读写,先进行上三角矩阵与对角阵相乘,再进行上三角矩阵与下三角矩阵相乘。
CN201610094119.9A 2016-02-19 2016-02-19 基于分时复用技术的cholesky矩阵求逆系统 Active CN105701068B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610094119.9A CN105701068B (zh) 2016-02-19 2016-02-19 基于分时复用技术的cholesky矩阵求逆系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610094119.9A CN105701068B (zh) 2016-02-19 2016-02-19 基于分时复用技术的cholesky矩阵求逆系统

Publications (2)

Publication Number Publication Date
CN105701068A true CN105701068A (zh) 2016-06-22
CN105701068B CN105701068B (zh) 2018-06-19

Family

ID=56222329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610094119.9A Active CN105701068B (zh) 2016-02-19 2016-02-19 基于分时复用技术的cholesky矩阵求逆系统

Country Status (1)

Country Link
CN (1) CN105701068B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021188A (zh) * 2016-05-11 2016-10-12 广州广电运通金融电子股份有限公司 浮点矩阵求逆的并行硬件架构和并行计算方法
CN108536651A (zh) * 2018-04-19 2018-09-14 武汉轻工大学 生成可逆模m矩阵的方法和装置
CN109359247A (zh) * 2018-12-07 2019-02-19 广州市百果园信息技术有限公司 内容推送方法及存储介质、计算机设备
CN110598271A (zh) * 2019-08-22 2019-12-20 中国电子科技集团公司第二十九研究所 一种基于fpga实现4辅助天线slc功能的系统及方法
CN111596320A (zh) * 2020-05-28 2020-08-28 成都天奥信息科技有限公司 一种高性能的抗干扰方法及装置
WO2021036313A1 (zh) * 2019-08-28 2021-03-04 华为技术有限公司 一种基于乔列斯基分解的矩阵求逆装置
CN112816948A (zh) * 2020-12-31 2021-05-18 中国电子科技集团公司第十四研究所 一种利用埃尔米特矩阵对称性实现自适应信号处理的方法
CN114417249A (zh) * 2022-01-24 2022-04-29 合肥工业大学 一种多阶矩阵快速求逆硬件结构实现方法
CN116662730A (zh) * 2023-08-02 2023-08-29 之江实验室 一种基于FPGA的Cholesky分解计算加速系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129420A (zh) * 2011-03-07 2011-07-20 哈尔滨工业大学 基于Cholesky分解解决最小二乘问题的FPGA实现装置
CN102662918A (zh) * 2012-04-28 2012-09-12 电子科技大学 基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法
CN103902762A (zh) * 2014-03-11 2014-07-02 复旦大学 一种针对正定对称矩阵进行最小二乘方程求解的电路结构
CN103927290A (zh) * 2014-04-18 2014-07-16 南京大学 一种任意阶下三角复矩阵求逆运算方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129420A (zh) * 2011-03-07 2011-07-20 哈尔滨工业大学 基于Cholesky分解解决最小二乘问题的FPGA实现装置
CN102662918A (zh) * 2012-04-28 2012-09-12 电子科技大学 基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法
CN103902762A (zh) * 2014-03-11 2014-07-02 复旦大学 一种针对正定对称矩阵进行最小二乘方程求解的电路结构
CN103927290A (zh) * 2014-04-18 2014-07-16 南京大学 一种任意阶下三角复矩阵求逆运算方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
潘晓等: "基于Cholesky 分解的可配置矩阵求逆FPGA实现", 《信息技术》 *
王少军等: "一种解线性最小二乘问题的FPGA 计算方法", 《仪器仪表学报》 *
王阳等: "基于流水技术的三角矩阵求逆硬件加速技术研究", 《第十九届计算机工程与工艺年会暨第五届微处理器技术论坛论文集》 *
郭磊等: "基于FPGA的Cholesky分解细粒度并行结构与实现", 《计算机研究与发展》 *
魏婵娟等: "一种基于Cholesky分解的快速矩阵求逆方法设计", 《电子设计工程》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021188A (zh) * 2016-05-11 2016-10-12 广州广电运通金融电子股份有限公司 浮点矩阵求逆的并行硬件架构和并行计算方法
CN108536651A (zh) * 2018-04-19 2018-09-14 武汉轻工大学 生成可逆模m矩阵的方法和装置
CN108536651B (zh) * 2018-04-19 2022-04-05 武汉轻工大学 生成可逆模m矩阵的方法和装置
CN109359247A (zh) * 2018-12-07 2019-02-19 广州市百果园信息技术有限公司 内容推送方法及存储介质、计算机设备
CN110598271A (zh) * 2019-08-22 2019-12-20 中国电子科技集团公司第二十九研究所 一种基于fpga实现4辅助天线slc功能的系统及方法
CN112445752A (zh) * 2019-08-28 2021-03-05 上海华为技术有限公司 一种基于乔列斯基分解的矩阵求逆装置
WO2021036313A1 (zh) * 2019-08-28 2021-03-04 华为技术有限公司 一种基于乔列斯基分解的矩阵求逆装置
CN112445752B (zh) * 2019-08-28 2024-01-05 上海华为技术有限公司 一种基于乔列斯基分解的矩阵求逆装置
CN111596320A (zh) * 2020-05-28 2020-08-28 成都天奥信息科技有限公司 一种高性能的抗干扰方法及装置
CN112816948A (zh) * 2020-12-31 2021-05-18 中国电子科技集团公司第十四研究所 一种利用埃尔米特矩阵对称性实现自适应信号处理的方法
CN114417249A (zh) * 2022-01-24 2022-04-29 合肥工业大学 一种多阶矩阵快速求逆硬件结构实现方法
CN114417249B (zh) * 2022-01-24 2024-03-26 合肥工业大学 一种多阶矩阵快速求逆硬件结构实现方法
CN116662730A (zh) * 2023-08-02 2023-08-29 之江实验室 一种基于FPGA的Cholesky分解计算加速系统
CN116662730B (zh) * 2023-08-02 2023-10-20 之江实验室 一种基于FPGA的Cholesky分解计算加速系统

Also Published As

Publication number Publication date
CN105701068B (zh) 2018-06-19

Similar Documents

Publication Publication Date Title
CN105701068A (zh) 基于分时复用技术的cholesky矩阵求逆系统
George Computer implementation of the finite element method
CN110765709B (zh) 一种基于fpga的基2-2快速傅里叶变换硬件设计方法
CN103970720B (zh) 基于大规模粗粒度嵌入式可重构系统及其处理方法
CN102298570A (zh) 一种点数可变的混合基 fft/ifft实现装置及其方法
CN101763338A (zh) 一种点数可变的混合基fft/ifft实现装置及其方法
CN108897716B (zh) 通过存储器读写操作来缩减计算量的数据处理装置及方法
CN102129420B (zh) 基于Cholesky分解解决最小二乘问题的FPGA实现装置
CN105137428A (zh) 去斜率信号的极坐标格式成像算法的fpga实现方法
CN106330276A (zh) 基于sor算法的大规模mimo线性检测方法及装置
CN112231626A (zh) 一种fft处理器
CN115133953B (zh) 一种基于pmf-fft算法在fpga上实现信号捕获的方法
CN102567282B (zh) 通用dsp处理器中fft计算实现装置和方法
CN105630741A (zh) 一种改进的按位替换法求矩阵逆矩阵模块
CN103034621B (zh) 基2×k并行fft架构的地址映射方法及系统
CN108563421B (zh) Fpga运算电路和斯皮尔曼秩次相关系数的求解方法
CN105955896A (zh) 一种可重构dbf算法硬件加速器及控制方法
CN103176949A (zh) 实现fft/ifft变换的电路及方法
CN116822616A (zh) 一种用于大语言模型中Softmax函数训练的装置
CN102662917B (zh) 正定Hermite矩阵Cholesky分解高速脉动阵列的设计方法
CN102117264B (zh) 基于fpga的快速沃尔什变换的实现方法
CN105975436A (zh) 一种SoC系统中通用可配置加速单元的IP电路
CN113890508A (zh) 一种批处理fir算法的硬件实现方法和硬件系统
CN101833540B (zh) 信号处理方法和装置
CN103902506A (zh) 一种基于龙芯3b的fftw3优化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant