CN109740114A - 基于fpga的实对称矩阵特征分解实时处理方法 - Google Patents

基于fpga的实对称矩阵特征分解实时处理方法 Download PDF

Info

Publication number
CN109740114A
CN109740114A CN201811617362.XA CN201811617362A CN109740114A CN 109740114 A CN109740114 A CN 109740114A CN 201811617362 A CN201811617362 A CN 201811617362A CN 109740114 A CN109740114 A CN 109740114A
Authority
CN
China
Prior art keywords
matrix
multiplied
cos
sin
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811617362.XA
Other languages
English (en)
Other versions
CN109740114B (zh
Inventor
李仙法
金雅萍
罗国星
苏保禹
唐遒
马蕊
靳东
肖楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
8511 Research Institute of CASIC
Original Assignee
8511 Research Institute of CASIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 8511 Research Institute of CASIC filed Critical 8511 Research Institute of CASIC
Priority to CN201811617362.XA priority Critical patent/CN109740114B/zh
Publication of CN109740114A publication Critical patent/CN109740114A/zh
Application granted granted Critical
Publication of CN109740114B publication Critical patent/CN109740114B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供了一种基于FPGA的实对称矩阵特征分解实时处理方法,包括:对输入的实对称矩阵进行FIFO1寄存,设定特征向量矩阵为单位矩阵;对迭代处理后的结果矩阵和特征向量矩阵进行FIFO2寄存,等待流水处理模块进行读取;流水控制模块每隔固定周期读取FIFO1或者FIFO2中的矩阵进行处理;多个旋转变换模块并行对矩阵的上三角非对角元素进行旋转变换,使非对角元素的绝对值趋于零,同时计算每次旋转变换后的特征向量矩阵;对最后一个旋转变换模块输出的结果进行判断,如果满足固定迭代次数,则结束处理过程,将特征向量和特征值进行输出;如果不满足,则将处理结果矩阵和特征向量矩阵存入到FIFO2中寄存,等待下次迭代处理。

Description

基于FPGA的实对称矩阵特征分解实时处理方法
技术领域
本发明涉及一种电子侦查技术,特别是一种基于FPGA的实对称矩阵特征分解实时处理方法。
背景技术
在电子侦察领域,估计辐射源的波达方向具有很重要的意义。目前常用的测向技术主要有干涉仪测向和空间谱测向。干涉仪测向虽然具有精度高、计算简单的优点,难以克服多径效应引起的测向误差,无法满足复杂电磁环境下测向要求。空间谱测向具有精度高等优点,能够克服多径效应带来相同频率不同方向的测向问题,但空间谱测向方法运算量较大,无法满足在密度信号环境下实时处理。
针对空间谱测向方法无法满足实时处理问题,学者们提出了许多快速处理的方法。有文献提出了对矩阵特征分解的Jacobi算法进行并行改进,采用脉动阵列结构在FPGA上高速并行实现了对数据协方差矩阵的特征分解,完成一次特征分解的最低耗时为14.82us,但并没有对整个结构进行流水设计,只缩短了一次特征分解的时间而没有考虑整个模块的吞吐率,无法满足电子侦察领域高重频高密度信号的特征分解需求。。
因此,本方案提供一种基于FPGA的实对称矩阵特征分解实时处理方法。该方法理论上沿用传统的Jacobi迭代法,对高阶实对称矩阵的上三角非对角元素分多个相同模块完成1次矩阵的旋转变换,每个模块并行完成多个非对角元素的旋转变换;该方法通过模块复用的思想,对一个矩阵进行多次循环迭代完成旋转变换,减少FPGA逻辑资源消耗;通过整个模块的流水设计,满足高重频同时多信号的矩阵进行特征分解的需求,满足在密度信号环境下实时处理。
发明内容
本发明提供了一种基于FPGA的实对称矩阵特征分解实时处理方法,包括以下步骤:
对输入的实对称矩阵进行FIFO1寄存,设定特征向量矩阵为单位矩阵;对迭代处理后的结果矩阵和特征向量矩阵进行FIFO2寄存,等待流水处理模块进行读取;
流水控制模块每隔固定周期读取FIFO1或者FIFO2中的矩阵进行处理;
多个旋转变换模块并行对矩阵的上三角非对角元素进行旋转变换,使非对角元素的绝对值趋于零,同时计算每次旋转变换后的特征向量矩阵;
对最后一个旋转变换模块输出的结果进行判断,如果满足固定迭代次数,则结束处理过程,将特征向量和特征值进行输出;如果不满足,则将处理结果矩阵和特征向量矩阵存入到FIFO2中寄存,等待下次迭代处理。
本发明沿用传统的Jacobi迭代法,对高阶实对称矩阵的上三角非对角元素分多个相同模块完成1次矩阵的旋转变换,每个模块并行完成多个非对角元素的旋转变换;该方法通过模块复用的思想,对一个矩阵进行多次循环迭代完成旋转变换,减少FPGA逻辑资源消耗;通过整个模块的流水设计,满足高重频同时多信号的矩阵进行特征分解的需求,满足在密度信号环境下实时处理。
下面结合说明书附图对本发明作进一步描述。
附图说明
图1一种基于FPGA的实对称矩阵特征分解实时处理方法流程图。
具体实施方式
结合图1,本发明的一种基于FPGA的实对称矩阵特征分解实时处理方法,包括以下步骤:
步骤1,对输入的实对称矩阵进行FIFO1寄存,对迭代处理后的结果矩阵和特征向量矩阵进行FIFO2寄存,等待流水处理模块进行读取;
步骤2,流水控制模块每隔固定周期读取FIFO1或者FIFO2中的矩阵进行处理;
步骤3,多个旋转变换模块并行对矩阵的上三角非对角元素进行旋转变换,使非对角元素的绝对值趋于零,同时计算每次旋转变换后的特征向量矩阵;
步骤4,对最后一个旋转变换模块输出的结果进行判断,如果满足固定迭代次数,则结束处理过程,将特征向量和特征值进行输出;如果不满足,则将处理结果矩阵和特征向量矩阵存入到FIFO2中寄存,等待下次迭代处理;
步骤1对输入实对称矩阵进行FIFO1寄存:
步骤11、将输入的实对称矩阵进行FIFO1寄存,同时设定特征向量矩阵为单位矩阵;
步骤12、将进一步需要进行迭代处理的结果矩阵和特征向量矩阵进行FIFO2寄存,需要将迭代次数同时保存在FIFO2中。
步骤2读取FIFO1或者FIFO2中的数据包括以下步骤:
步骤21、每间隔固定周期,判断步骤1的两个FIFO是否为非空;
步骤22、满足非空,则读取FIFO1或者FIFO2中的矩阵,优先读取FIFO2中的矩阵;
步骤23、如果读取FIFO2中的矩阵,则在原来迭代次数增加1;如果读取FIFO1中的矩阵,则将迭代次数设置为1;
步骤3多个旋转变换模块对矩阵非对角元素进行旋转变换具体包括以下步骤:
步骤31、n阶矩阵总共有n(n-1)/2个上三角非对角元素,每个旋转变换模块同时并行旋转变换x个非对角元素,总共需要n(n-1)/2x个旋转变换模块流水处理完成一次所有上三角非对角元素的旋转变换。以8阶矩阵为例,总共有28个上三角非对角元素,一个旋转变换模块处理4个对角元素,总共需要7个旋转变换模块。一个旋转变换模块处理的元素的行列值必需不相同。
步骤32、每个旋转变换模块具有相同实现过程。以下以8阶矩阵特征分解的旋转变换模块1对模块实现功能进行说明。旋转变换模块1需要对元素r12、r34、r56、r78进行旋转变换,令p分别为1、3、5、7,q分别为2、4、6、8。对元素rpq进行旋转变换,计算旋转角度如下:
根据4个旋转角度θ1、θ2、θ3、θ4计算可以得到相应的sinθ1和cosθ1、sinθ2和cosθ2、sinθ3和cosθ3、sinθ4和cosθ4
步骤33、将输入矩阵第1行元素分别与cosθ1的相乘,第2行元素分别与sinθ1相乘,将相乘结果对应相加得到A1~A8;将矩阵第1行元素分别与-sinθ1相乘,将第2行元素分别与cosθ1相乘,将相乘结果对应相加得到B1~B8;将矩阵第3行、第4行和sinθ2、cosθ2类似运算可以得到C1~C8和D1~D8;类似的处理可以得到E1~E8、F1~F8、G1~G8、H1~H8。同时将特征向量矩阵进行本步骤类似的处理,可以得到旋转变换模块1输出的特征向量矩阵。
步骤34、将步骤33的结果数据A1、B1分别与cosθ1相乘,将A2、B2分别与sinθ1相乘,两相乘结果进行对应相加可以得到R11、R21;将A1、B1与-sinθ1相乘,将A2、B2与cosθ1相乘,两相乘结果进行对应相加可以得到R12、R22;将A3、B3、C3、D3与cosθ2相乘,将A4、B4、C4、D4与sinθ2相乘,两相乘结果进行对应相加得到R13、R23、R33、R43;将A3、B3、C3、D3与-sinθ2相乘,将A4、B4、C4、D4与cosθ2相乘,两相乘结果进行对应相加得到R14、R24、R34、R44;对A5~F5和A6~F6类似处理得到R15、R25、R35、R45、R55、R65和R16、R26、R36、R46、R56、R66;对A7~H7和A8~H8类似处理得到R17、R27、R37、R47、R57、R67、R77、R87和R18、R28、R38、R48、R58、R68、R78、R88;
步骤35、经过步骤32、33、34处理得到非对角上三角元素和对角元素,因为对称矩阵经过步骤32、33、34处理后仍是对称矩阵,所以可以根据非对角上三角元素得到非对角下三角元素;最后将整个处理结果矩阵和步骤33处理后的特征向量矩阵进行寄存输出。
步骤36、旋转变换模块1处理的结果矩阵和特征向量矩阵作为旋转变换模块2的输入,旋转变换模块3的结果作为旋转变换模块4的输入,依次类推;一个矩阵经过所有旋转变换模块全部处理后才完成一次迭代处理。
步骤37、对步骤32、步骤33、步骤34进行中间数据寄存,以便达到流水处理的效果,使得1个旋转变换模块同时进行多个矩阵的处理,多个旋转变换模块同时进行更多的矩阵处理,增加整个算法的吞吐率。
步骤4对迭代次数进行判断具体包括以下步骤:
步骤41、判断最后一个旋转变换模块输出矩阵的迭代次数是否满足固定迭代次数;如果不满足条件,则将最后一个旋转变换模块输出的处理结果矩阵、特征向量矩阵和迭代次数存储到FIFO2中,等待流水控制模块进行读取,进行下一次迭代处理。
步骤42、如果满足条件,则将最后一个旋转变换模块输出的处理结果矩阵的对角元素作为特征值进行输出,将最后一个旋转变换模块输出的特征向量矩阵作为特征向量进行输出,结束该矩阵处理。

Claims (4)

1.一种基于FPGA的实对称矩阵特征分解实时处理方法,其特征在于,包括以下步骤:
对输入的实对称矩阵进行FIFO1寄存,设定特征向量矩阵为单位矩阵;对迭代处理后的结果矩阵和特征向量矩阵进行FIFO2寄存,等待流水处理模块进行读取;
流水控制模块每隔固定周期读取FIFO1或者FIFO2中的矩阵进行处理;
多个旋转变换模块并行对矩阵的上三角非对角元素进行旋转变换,使非对角元素的绝对值趋于零,同时计算每次旋转变换后的特征向量矩阵;
对最后一个旋转变换模块输出的结果进行判断,如果满足固定迭代次数,则结束处理过程,将特征向量和特征值进行输出;如果不满足,则将处理结果矩阵和特征向量矩阵存入到FIFO2中寄存,等待下次迭代处理。
2.根据权利要求1所述的方法,其特征在于,读取FIFO1或者FIFO2中的数据进行处理包括以下步骤:
步骤21,每间隔固定周期,判断步骤1的两个FIFO是否为非空;
步骤22,满足非空,则读取FIFO1或者FIFO2中的矩阵,优先读取FIFO2中的矩阵;
步骤23,如果读取FIFO2中的矩阵,则在原来迭代次数增加1;如果读取FIFO1中的矩阵,则将迭代次数设置为1。
3.根据权利要求1所述方法,其特征在于,多个旋转变换模块对矩阵非对角元素进行旋转变换具体包括以下步骤:
步骤31,矩阵为8阶矩阵共有28个上三角非对角元素,一个旋转变换模块处理4个对角元素,总共需要7个旋转变换模块;
步骤32,每一旋转变换模块对元素apq进行旋转变换,p为奇数,q为偶数,计算旋转角度如下:
根据旋转角度θ1、θ2、θ3、θ4计算得到相应的sinθ1和cosθ1、sinθ2和cosθ2、sinθ3和cosθ3、sinθ4和cosθ4
步骤33,将输入矩阵第1行元素分别与cosθ1的相乘,第2行元素分别与sinθ1相乘,将相乘结果对应相加得到A1~A8;将矩阵第1行元素分别与-sinθ1相乘,将第2行元素分别与cosθ1相乘,将相乘结果对应相加得到B1~B8;
将输入矩阵第3行元素分别与cosθ2的相乘,第4行元素分别与sinθ2相乘,将相乘结果对应相加得到C1~C8;将矩阵第3行元素分别与-sinθ2相乘,将第4行元素分别与cosθ2相乘,将相乘结果对应相加得到D1~D8;
将输入矩阵第5行元素分别与cosθ3的相乘,第6行元素分别与sinθ3相乘,将相乘结果对应相加得到E1~E8;将矩阵第3行元素分别与-sinθ3相乘,将第4行元素分别与cosθ3相乘,将相乘结果对应相加得到F1~F8;
将输入矩阵第7行元素分别与cosθ4的相乘,第8行元素分别与sinθ4相乘,将相乘结果对应相加得到G1~G8;将矩阵第7行元素分别与-sinθ4相乘,将第8行元素分别与cosθ4相乘,将相乘结果对应相加得到H1~H8;
步骤34,将步骤33的结果数据A1、B1分别与cosθ1相乘,将A2、B2分别与sinθ1相乘,两相乘结果进行对应相加可以得到R11、R21;将A1、B1与-sinθ1相乘,将A2、B2与cosθ1相乘,两相乘结果进行对应相加可以得到R12、R22;将A3、B3、C3、D3与cosθ2相乘,将A4、B4、C4、D4与sinθ2相乘,两相乘结果进行对应相加得到R13、R23、R33、R43;将A3、B3、C3、D3与-sinθ2相乘,将A4、B4、C4、D4与cosθ2相乘,两相乘结果进行对应相加得到R14、R24、R34、R44;
将步骤33的结果数据A5、B5分别与cosθ3相乘,将A6、B6分别与sinθ3相乘,两相乘结果进行对应相加可以得到R15、R25;将A1、B1与-sinθ3相乘,将A2、B2与cosθ3相乘,两相乘结果进行对应相加可以得到R16、R26;将A3、B3、C3、D3与cosθ4相乘,将A4、B4、C4、D4与sinθ4相乘,两相乘结果进行对应相加得到R17、R27、R37、R47;将A3、B3、C3、D3与-sinθ4相乘,将A4、B4、C4、D4与cosθ4相乘,两相乘结果进行对应相加得到R18、R28、R38、R48;
步骤35,经过步骤32、33、34处理得到非对角上三角元素和对角元素,因为对称矩阵经过步骤32、33、34处理后仍是对称矩阵,根据非对角上三角元素得到非对角下三角元素,将整个处理结果矩阵和步骤33处理后的特征向量矩阵进行寄存输出;
步骤36,旋转变换模块1处理的结果矩阵和特征向量矩阵作为旋转变换模块2的输入,旋转变换模块3的结果作为旋转变换模块4的输入,依次类推;。
步骤37,对步骤32、步骤33、步骤34进行中间数据寄存。
4.根据权利要求1所述的方法,其特征在于,对迭代次数进行判断具体包括以下步骤:
步骤41,判断最后一个旋转变换模块输出矩阵的迭代次数是否满足固定迭代次数;如果不满足条件,则将最后一个旋转变换模块输出的处理结果矩阵、特征向量矩阵和迭代次数存储到FIFO2中,等待流水控制模块进行读取,进行下一次迭代处理。
步骤42,如果满足条件,则将最后一个旋转变换模块输出的处理结果矩阵的对角元素作为特征值进行输出,将最后一个旋转变换模块输出的特征向量矩阵作为特征向量进行输出,结束该矩阵处理。
CN201811617362.XA 2018-12-28 2018-12-28 基于fpga的实对称矩阵特征分解实时处理方法 Active CN109740114B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811617362.XA CN109740114B (zh) 2018-12-28 2018-12-28 基于fpga的实对称矩阵特征分解实时处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811617362.XA CN109740114B (zh) 2018-12-28 2018-12-28 基于fpga的实对称矩阵特征分解实时处理方法

Publications (2)

Publication Number Publication Date
CN109740114A true CN109740114A (zh) 2019-05-10
CN109740114B CN109740114B (zh) 2023-07-28

Family

ID=66361676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811617362.XA Active CN109740114B (zh) 2018-12-28 2018-12-28 基于fpga的实对称矩阵特征分解实时处理方法

Country Status (1)

Country Link
CN (1) CN109740114B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222307A (zh) * 2019-06-12 2019-09-10 哈尔滨工程大学 基于fpga的实对称矩阵的特征值分解的并行实现方法
CN112528224A (zh) * 2020-12-28 2021-03-19 上海微波技术研究所(中国电子科技集团公司第五十研究所) 一种矩阵特征值分解分组循环迭代流水实现方法及系统
CN112632465A (zh) * 2021-03-05 2021-04-09 之江实验室 基于fpga的实对称矩阵特征值分解的数据存储方法
US11249684B2 (en) * 2020-05-22 2022-02-15 Raytheon Company Computation of solution to sparse matrix

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847086A (zh) * 2010-05-14 2010-09-29 清华大学 一种基于循环雅克比的实对称阵特征分解装置
CN105323037A (zh) * 2014-08-01 2016-02-10 中国移动通信集团公司 根据复矩阵进行预编码的方法及装置
CN105608057A (zh) * 2015-12-09 2016-05-25 合肥工业大学 一种分时复用硬件资源的信号子空间分解的fpga实现模块及其fpga实现方法
CN108228536A (zh) * 2018-02-07 2018-06-29 成都航天通信设备有限责任公司 使用FPGA实现Hermitian矩阵分解的方法
US20180285318A1 (en) * 2017-04-04 2018-10-04 Intel Corporation High performance qr decomposition systems and methods

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847086A (zh) * 2010-05-14 2010-09-29 清华大学 一种基于循环雅克比的实对称阵特征分解装置
CN105323037A (zh) * 2014-08-01 2016-02-10 中国移动通信集团公司 根据复矩阵进行预编码的方法及装置
CN105608057A (zh) * 2015-12-09 2016-05-25 合肥工业大学 一种分时复用硬件资源的信号子空间分解的fpga实现模块及其fpga实现方法
US20180285318A1 (en) * 2017-04-04 2018-10-04 Intel Corporation High performance qr decomposition systems and methods
CN108228536A (zh) * 2018-02-07 2018-06-29 成都航天通信设备有限责任公司 使用FPGA实现Hermitian矩阵分解的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SERVER KASAP: "Novel Field-Programmable Gate Array Architecture for Computing the Eigenvalue Decomposition of Para-Hermitian Polynomial Matrices", 《IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS》 *
刘永勤: "对称矩阵特征值分解的FPGA实现", 《现代电子技术》 *
赵文扬: "信号处理中矩阵运算的FPGA实现技术_", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222307A (zh) * 2019-06-12 2019-09-10 哈尔滨工程大学 基于fpga的实对称矩阵的特征值分解的并行实现方法
CN110222307B (zh) * 2019-06-12 2022-10-28 哈尔滨工程大学 基于fpga的实对称矩阵的特征值分解的并行实现方法
US11249684B2 (en) * 2020-05-22 2022-02-15 Raytheon Company Computation of solution to sparse matrix
CN112528224A (zh) * 2020-12-28 2021-03-19 上海微波技术研究所(中国电子科技集团公司第五十研究所) 一种矩阵特征值分解分组循环迭代流水实现方法及系统
CN112528224B (zh) * 2020-12-28 2022-09-13 上海微波技术研究所(中国电子科技集团公司第五十研究所) 一种矩阵特征值分解分组循环迭代流水实现方法及系统
CN112632465A (zh) * 2021-03-05 2021-04-09 之江实验室 基于fpga的实对称矩阵特征值分解的数据存储方法
CN112632465B (zh) * 2021-03-05 2021-06-01 之江实验室 基于fpga的实对称矩阵特征值分解的数据存储方法

Also Published As

Publication number Publication date
CN109740114B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN109740114A (zh) 基于fpga的实对称矩阵特征分解实时处理方法
US8332451B2 (en) Programmable CORDIC Processor
CN107633297B (zh) 一种基于并行快速fir滤波器算法的卷积神经网络硬件加速器
CN111859273A (zh) 矩阵乘法器
CN108733348A (zh) 融合向量乘法器和使用其进行运算的方法
EP0421639B1 (en) Parallel data processing system
Hsiao et al. Parallel singular value decomposition of complex matrices using multidimensional CORDIC algorithms
CN110222307B (zh) 基于fpga的实对称矩阵的特征值分解的并行实现方法
Meher Systolic designs for DCT using a low-complexity concurrent convolutional formulation
US8447799B2 (en) Process for QR transformation using a CORDIC processor
CN110766128A (zh) 卷积计算单元、计算方法及神经网络计算平台
CN108122030A (zh) 一种卷积神经网络的运算方法、装置和服务器
CN110276447A (zh) 一种计算装置及方法
CN112015369B (zh) 基于fpga的信号处理方法、电子设备和存储介质
CN113330466A (zh) 涉及混合量子机器、量子信息技术的方面和/或其他特征的系统和方法
Liu et al. Application-specific instruction set processor for SoC implementation of modern signal processing algorithms
US7480689B2 (en) Systolic de-multiplexed finite impulse response filter array architecture for linear and non-linear implementations
CN107210984A (zh) 用于在多执行单元处理系统上进行并行的基于qrd的操作的方法和装置
CN108566237B (zh) 基于双对角化的低复杂度几何均值分解预编码实现方法
WO2020206716A1 (zh) 一种用于FPGA的并行Jacobi计算加速实现方法
Wang et al. Hardware efficient architectures of improved Jacobi method to solve the eigen problem
US8452830B2 (en) Programmable CORDIC processor with stage re-use
CN110880032B (zh) 使用自适应3d阵列的卷积神经网络
Ren et al. HBP: Hierarchically Balanced Pruning and Accelerator Co-Design for Efficient DNN Inference
CN104484312B (zh) 一种多数字调解系统中的最优掩膜计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant