CN113094646B - 一种基于矩阵联合近似对角化的矩阵数据处理系统及方法 - Google Patents
一种基于矩阵联合近似对角化的矩阵数据处理系统及方法 Download PDFInfo
- Publication number
- CN113094646B CN113094646B CN202110322262.XA CN202110322262A CN113094646B CN 113094646 B CN113094646 B CN 113094646B CN 202110322262 A CN202110322262 A CN 202110322262A CN 113094646 B CN113094646 B CN 113094646B
- Authority
- CN
- China
- Prior art keywords
- rotation angle
- matrix
- multiplexer
- vector
- rotator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于矩阵联合近似对角化的矩阵数据处理系统及方法,属于通信数据处理领域,本发明基于FPGA平台,具有脉动阵列、流水线处理思想,对传统数据处理进行了并行化设计,兼有多种优点,既可以在较短的时间内完成算法的计算,也同时在保证计算速度的同时兼顾了硬件资源开销,并且基于模块化的设计具有较好的移植性。
Description
技术领域
本发明涉及通信数据处理领域,具体涉及一种基于矩阵联合近似对角化的矩阵数据处理系统及方法。
背景技术
在矩阵分析中,将若干个矩阵的近似联合对角化的问题可以由以下描述所定义:考虑K个N×N矩阵的集合A={A1,A2,…,AK}。现在希望求一个联合对角化器(jointdiagonalizer)U∈CN×N和K个对应的对角矩阵Λ1,Λ2,…,ΛK,使目标函数最小化,式中,ω1,ω2,…,ωk为正的权系数。这一问题称为近似联合对角化。
矩阵的联合对角化问题广泛存在于盲信号分离、盲波束形成、时延估计、频率估计、阵列信号处理、多输入-多输出(MIMO)盲均衡以及盲MIMO系统辨识等中。传统处理方式通常使用双边旋转方法对矩阵进行联合对角化,但是传统方法在硬件实现中存在一定的改进空间,通过对传统方法分析可以得出,在硬件平台上可以实现一种并行的双边旋转方法,有效提高了对矩阵联合对角化的计算效率。
由此给出了传统计算矩阵联合近似对角化的算法,但目前对于基于硬件(FPGA)来实现该算法的研究较为缺乏,而该算法对于信号分离等领域有着重要的应用。用硬件实现此类算法有着相比软件实现不可比拟的优势,用硬件实现有着更好的实时性、更快的计算速度以及为一体化硬件平台服务的可移植性。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于矩阵联合近似对角化的矩阵数据处理系统及方法解决了现有对数据构成的矩阵进行旋转的算法存在无法进行并行运算,造成运算时间长的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于矩阵联合近似对角化的矩阵数据处理系统,包括:数据存储及控制模块和迭代脉动阵列模块;
所述数据存储及控制模块包括:寄存器组和逻辑控制单元,所述寄存器组与逻辑控制单元连接;所述迭代脉动阵列模块包括:左旋转角计算单元、右旋转角计算单元和脉冲阵列;所述逻辑控制单元分别与左旋转角计算单元、右旋转角计算单元和脉冲阵列连接;所述左旋转角计算单元和右旋转角计算单元分别与脉冲阵列连接。
进一步地,所述脉冲阵列包括四个基础计算子单元PE;
每个基础计算子单元PE的外围接口包括:第一向量输入接口X1和Y1、第二向量输入接口X2和Y2、第一左旋转角接口、第二左旋转角接口、第一右旋转角接口、第二右旋转角接口、第一行列向量输出接口X1′和Y1′、及第二行列向量输出接口X2′和Y2′;
所述第一向量输入接口X1和Y1、第二向量输入接口X2和Y2分别与逻辑控制单元连接;所述第一左旋转角接口和第二左旋转角接口分别与左旋转角计算单元连接;所述第一右旋转角接口和第二右旋转角接口分别与右旋转角计算单元连接;
每个基础计算子单元PE包括:第一多路选择器、第二多路选择器、第一旋转器、第二旋转器和状态机控制器;
所述第一多路选择器的输入端分别与第一向量输入接口X1和Y1、第一左旋转角接口和第一右旋转角接口连接;所述第二多路选择器的输入端分别与第二向量输入接口X2和Y2、第一右旋转角接口和第二右旋转角接口连接;所述第一旋转器的输入端与第一多路选择器的输出端连接,其输出端与第一多路选择器的输入端连接,并作为第一行列向量输出接口X1′和Y1′;所述第二旋转器的输入端与第二多路选择器的输出端连接,其输出端与第二多路选择器的输入端连接,并作为第二行列向量输出接口X2′和Y2′;所述状态机控制器分别与第一多路选择器的控制端和第二多路选择器的控制端连接。
一种基于矩阵联合近似对角化的矩阵数据处理方法,包括以下分步骤:
S1、在逻辑控制单元中状态机由等待状态进入工作状态后,通过逻辑控制单元从寄存器组中存储的矩阵组提取2K个二阶主子式矩阵,得到2个原始矩阵;
S2、将2个原始矩阵发送至左旋转角计算单元和右旋转角计算单元,计算得到左旋转角和右旋转角;
S3、通过逻辑控制单元从寄存器组中存储的矩阵组提取一个待旋转矩阵,并对其进行分块生成四个子矩阵;
S4、将四个子矩阵、左旋转角和右旋转角发送至脉冲阵列,并根据左旋转角和右旋转角,将四个子矩阵均进行并行旋转,得到该次迭代的旋转矩阵;
S5、根据左旋转角和右旋转角,通过逻辑控制单元检测联合对角化的目标函数是否达到目标值,若是,则该次迭代的旋转矩阵为目标旋转矩阵,若否,则丢弃该次迭代的旋转矩阵,并跳转至步骤S1。
进一步地,步骤S3中四个子矩阵均为待旋转矩阵的二阶主子式。
进一步地,步骤S3中计算左旋转角和右旋转角的公式为:
G=[g1,…,gk,…,gK]
gk=[ek-fk,gk+hk]T
进一步地,步骤S4包括以下分步骤:
S41、将每一个二阶主子式的2个行向量或2个列向量分别输入对应的第一向量输入接口X1和Y1,及第二向量输入接口X2和Y2,将左旋转角输入第一左旋转角接口和第二左旋转角接口;
S42、通过状态机控制器控制第一多路选择器和第二多路选择器对应的输入接口,将第一多路选择器中的1个行向量或1个列向量、及左旋转角输入到第一旋转器,将第二多路选择器中的另1行向量或另1个列向量、及左旋转角输入到第二旋转器;
S43、通过第一旋转器计算旋转后的第一行列向量,通过第二旋转器计算旋转后的第二行列向量;
S44、将第一行列向量和右旋转角输入第一多路选择器,将第二行列向量和右旋转角输入第二多路选择器;
S45、通过状态机控制器控制第一多路选择器和第二多路选择器,将第一行列向量和右旋转角输入第一旋转器,将第二行列向量和右旋转角输入第二旋转器;
S46、通过第一旋转器计算再次旋转后的第三行列向量,通过第二旋转器计算再次旋转后的第四行列向量,第三行列向量和第四行列向量即为该次迭代的旋转矩阵。
上述进一步的有益效果为:过复用旋转器减少了旋转器的使用,节省了硬件资源,使得旋转器在连续工作时没有空闲状态,提高了工作效率。
进一步地,步骤S43中通过第一旋转器和第二旋转器进行一次旋转的公式为:
进一步地,步骤S5中联合对角化的目标函数的公式为:
Q=vTGGTv
v=[cos(2θ),-sin(2θ)]
G=[g1,…,gk,…,gK]
gk=[ek-fk,gk+hk]T
其中,Q为联合对角化的目标函数,G为矩阵组,gk为矩阵组的第k个原始矩阵,为第k个原始矩阵的一个二阶主子式,K为矩阵组中矩阵的数量,v为联合对角化的目标函数Q取极大值时对应的特征向量,θ为左旋转角或右旋转角。
综上,本发明的有益效果为:本发明实现基于FPGA平台,具有脉动阵列、流水线处理思想,对传统数据处理进行了并行化设计,兼有多种优点,既可以在较短的时间内完成算法的计算,也同时在保证计算速度的同时兼顾了硬件资源开销,并且基于模块化的设计具有较好的移植性。
附图说明
图1为一种基于矩阵联合近似对角化的矩阵数据处理系统的系统框图;
图2为基础计算子单元PE的结构示意图;
图3为一种基于矩阵联合近似对角化的矩阵数据处理方法的流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于矩阵联合近似对角化的矩阵数据处理系统,包括:数据存储及控制模块和迭代脉动阵列模块;
所述数据存储及控制模块包括:寄存器组和逻辑控制单元,所述寄存器组与逻辑控制单元连接;所述迭代脉动阵列模块包括:左旋转角计算单元、右旋转角计算单元和脉冲阵列;所述逻辑控制单元分别与左旋转角计算单元、右旋转角计算单元和脉冲阵列连接;所述左旋转角计算单元和右旋转角计算单元分别与脉冲阵列连接。
所述脉冲阵列包括四个基础计算子单元PE;
如图2所示,每个基础计算子单元PE的外围接口包括:第一向量输入接口X1和Y1、第二向量输入接口X2和Y2、第一左旋转角接口、第二左旋转角接口、第一右旋转角接口、第二右旋转角接口、第一行列向量输出接口X1′和Y1′、及第二行列向量输出接口X2′和Y2′;
所述第一向量输入接口X1和Y1、第二向量输入接口X2和Y2分别与逻辑控制单元连接;所述第一左旋转角接口和第二左旋转角接口分别与左旋转角计算单元连接;所述第一右旋转角接口和第二右旋转角接口分别与右旋转角计算单元连接;
每个基础计算子单元PE包括:第一多路选择器、第二多路选择器、第一旋转器、第二旋转器和状态机控制器;
所述第一多路选择器的输入端分别与第一向量输入接口X1和Y1、第一左旋转角接口和第一右旋转角接口连接;所述第二多路选择器的输入端分别与第二向量输入接口X2和Y2、第一右旋转角接口和第二右旋转角接口连接;所述第一旋转器的输入端与第一多路选择器的输出端连接,其输出端与第一多路选择器的输入端连接,并作为第一行列向量输出接口X1′和Y1′;所述第二旋转器的输入端与第二多路选择器的输出端连接,其输出端与第二多路选择器的输入端连接,并作为第二行列向量输出接口X2′和Y2′;所述状态机控制器分别与第一多路选择器的控制端和第二多路选择器的控制端连接。
如图3所示,一种基于矩阵联合近似对角化的矩阵数据处理方法,包括以下分步骤:
S1、在逻辑控制单元中状态机由等待状态进入工作状态后,通过逻辑控制单元从寄存器组中存储的矩阵组提取2K个二阶主子式矩阵,得到2个原始矩阵;
S2、将2个原始矩阵发送至左旋转角计算单元和右旋转角计算单元,计算得到左旋转角和右旋转角,一个原始矩阵计算一个旋转角;
步骤S3中四个子矩阵均为待旋转矩阵的二阶主子式。
S3、通过逻辑控制单元从寄存器组中存储的矩阵组提取一个待旋转矩阵,并对其进行分块生成四个子矩阵;
步骤S3中计算左旋转角和右旋转角的公式为:
G=[g1,…,gk,…,gK]
gk=[ek-fk,gk+hk]T
S4、将四个子矩阵、左旋转角和右旋转角发送至脉冲阵列,并根据左旋转角和右旋转角,将四个子矩阵均进行并行旋转,得到该次迭代的旋转矩阵;
步骤S4包括以下分步骤:
S41、将每一个二阶主子式的2个行向量或2个列向量分别输入对应的第一向量输入接口X1和Y1,及第二向量输入接口X2和Y2,将左旋转角输入第一左旋转角接口和第二左旋转角接口;
如图2所示,X1、Y1、X2和Y2四个接口,每个接口输入一个子矩阵中元素。
S42、通过状态机控制器控制第一多路选择器和第二多路选择器对应的输入接口,将第一多路选择器中的1个行向量或1个列向量、及左旋转角输入到第一旋转器,将第二多路选择器中的另1行向量或另1个列向量、及左旋转角输入到第二旋转器;
S43、通过第一旋转器计算旋转后的第一行列向量,通过第二旋转器计算旋转后的第二行列向量;
步骤S43中通过第一旋转器和第二旋转器进行一次旋转的公式为:
以4×4矩阵A为例,可通过以下顺序两两同时进行Givnes旋转:
①、(1,2)(3,4)
②、(1,4)(2,3)
③、(1,3)(2,4)
序号①、②和③后的括号内的数字代表二阶主子式的行序号和列序号。
由此可得进行一次旋转的表达式,以同时对序号(1,2)和(3,4)的二阶主子式矩阵进行旋转为例,有
其中θ1是对序号(1,2)的二阶主子式矩阵进行旋转的角度,θ2是对序号(3,4)的二阶主子式矩阵进行旋转的角度。
S44、将第一行列向量和右旋转角输入第一多路选择器,将第二行列向量和右旋转角输入第二多路选择器;
S45、通过状态机控制器控制第一多路选择器和第二多路选择器,将第一行列向量和右旋转角输入第一旋转器,将第二行列向量和右旋转角输入第二旋转器;
S46、通过第一旋转器计算再次旋转后的第三行列向量,通过第二旋转器计算再次旋转后的第四行列向量,第三行列向量和第四行列向量即为该次迭代的旋转矩阵。
S5、根据左旋转角和右旋转角,通过逻辑控制单元检测联合对角化的目标函数是否达到目标值,若是,则该次迭代的旋转矩阵为目标旋转矩阵,若否,则丢弃该次迭代的旋转矩阵,并跳转至步骤S1。
步骤S5中联合对角化的目标函数的公式为:
Q=vTGGTv
v=[cos(2θ),-sin(2θ)]
G=[g1,…,gk,…,gK]
gk=[ek-fk,gk+hk]T
Claims (7)
1.一种基于矩阵联合近似对角化的矩阵数据处理系统,其特征在于,包括:数据存储及控制模块和迭代脉动阵列模块;
所述数据存储及控制模块包括:寄存器组和逻辑控制单元,所述寄存器组与逻辑控制单元连接;所述迭代脉动阵列模块包括:左旋转角计算单元、右旋转角计算单元和脉冲阵列;所述逻辑控制单元分别与左旋转角计算单元、右旋转角计算单元和脉冲阵列连接;所述左旋转角计算单元和右旋转角计算单元分别与脉冲阵列连接;
所述脉冲阵列包括四个基础计算子单元PE;
每个基础计算子单元PE的外围接口包括:第一向量输入接口X1和Y1、第二向量输入接口X2和Y2、第一左旋转角接口、第二左旋转角接口、第一右旋转角接口、第二右旋转角接口、第一行列向量输出接口X1′和Y1′、及第二行列向量输出接口X2′和Y2′;
所述第一向量输入接口X1和Y1、第二向量输入接口X2和Y2分别与逻辑控制单元连接;所述第一左旋转角接口和第二左旋转角接口分别与左旋转角计算单元连接;所述第一右旋转角接口和第二右旋转角接口分别与右旋转角计算单元连接;
每个基础计算子单元PE包括:第一多路选择器、第二多路选择器、第一旋转器、第二旋转器和状态机控制器;
所述第一多路选择器的输入端分别与第一向量输入接口X1和Y1、第一左旋转角接口和第一右旋转角接口连接;所述第二多路选择器的输入端分别与第二向量输入接口X2和Y2、第一右旋转角接口和第二右旋转角接口连接;所述第一旋转器的输入端与第一多路选择器的输出端连接,其输出端与第一多路选择器的输入端连接,并作为第一行列向量输出接口X1′和Y1′;所述第二旋转器的输入端与第二多路选择器的输出端连接,其输出端与第二多路选择器的输入端连接,并作为第二行列向量输出接口X2′和Y2′;所述状态机控制器分别与第一多路选择器的控制端和第二多路选择器的控制端连接。
2.根据权利要求1所述的基于矩阵联合近似对角化的矩阵数据处理系统的方法,其特征在于,包括以下分步骤:
S1、在逻辑控制单元中状态机由等待状态进入工作状态后,通过逻辑控制单元从寄存器组中存储的矩阵组提取2K个二阶主子式矩阵,得到2个原始矩阵;
S2、将2个原始矩阵发送至左旋转角计算单元和右旋转角计算单元,计算得到左旋转角和右旋转角;
S3、通过逻辑控制单元从寄存器组中存储的矩阵组提取一个待旋转矩阵,并对其进行分块生成四个子矩阵;
S4、将四个子矩阵、左旋转角和右旋转角发送至脉冲阵列,并根据左旋转角和右旋转角,将四个子矩阵均进行并行旋转,得到该次迭代的旋转矩阵;
S5、根据左旋转角和右旋转角,通过逻辑控制单元检测联合对角化的目标函数是否达到目标值,若是,则该次迭代的旋转矩阵为目标旋转矩阵,若否,则丢弃该次迭代的旋转矩阵,并跳转至步骤S1。
3.根据权利要求2所述的基于矩阵联合近似对角化的矩阵数据处理系统的方法,其特征在于,所述步骤S3中四个子矩阵均为待旋转矩阵的二阶主子式。
5.根据权利要求3所述的基于矩阵联合近似对角化的矩阵数据处理系统的方法,其特征在于,所述步骤S4包括以下分步骤:
S41、将每一个二阶主子式的2个行向量或2个列向量分别输入对应的第一向量输入接口X1和Y1,及第二向量输入接口X2和Y2,将左旋转角输入第一左旋转角接口和第二左旋转角接口;
S42、通过状态机控制器控制第一多路选择器和第二多路选择器对应的输入接口,将第一多路选择器中的1个行向量或1个列向量、及左旋转角输入到第一旋转器,将第二多路选择器中的另1行向量或另1个列向量、及左旋转角输入到第二旋转器;
S43、通过第一旋转器计算旋转后的第一行列向量,通过第二旋转器计算旋转后的第二行列向量;
S44、将第一行列向量和右旋转角输入第一多路选择器,将第二行列向量和右旋转角输入第二多路选择器;
S45、通过状态机控制器控制第一多路选择器和第二多路选择器,将第一行列向量和右旋转角输入第一旋转器,将第二行列向量和右旋转角输入第二旋转器;
S46、通过第一旋转器计算再次旋转后的第三行列向量,通过第二旋转器计算再次旋转后的第四行列向量,第三行列向量和第四行列向量即为该次迭代的旋转矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110322262.XA CN113094646B (zh) | 2021-03-25 | 2021-03-25 | 一种基于矩阵联合近似对角化的矩阵数据处理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110322262.XA CN113094646B (zh) | 2021-03-25 | 2021-03-25 | 一种基于矩阵联合近似对角化的矩阵数据处理系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113094646A CN113094646A (zh) | 2021-07-09 |
CN113094646B true CN113094646B (zh) | 2023-04-28 |
Family
ID=76669679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110322262.XA Active CN113094646B (zh) | 2021-03-25 | 2021-03-25 | 一种基于矩阵联合近似对角化的矩阵数据处理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113094646B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101038582A (zh) * | 2007-04-02 | 2007-09-19 | 中国科学院光电技术研究所 | 用于自适应光学波前复原运算的脉动阵列处理方法及电路 |
WO2018045594A1 (zh) * | 2016-09-12 | 2018-03-15 | 深圳大学 | 一种基于互质脉冲重复间隔的空时自适应处理方法及装置 |
CN108021393A (zh) * | 2017-12-15 | 2018-05-11 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN110188320A (zh) * | 2019-04-23 | 2019-08-30 | 山东大学 | 基于多核平台的二阶盲源分离并行优化方法及系统 |
CN110263925A (zh) * | 2019-06-04 | 2019-09-20 | 电子科技大学 | 一种基于fpga的卷积神经网络前向预测的硬件加速实现架构 |
CN111291323A (zh) * | 2020-02-17 | 2020-06-16 | 南京大学 | 一种基于脉动阵列的矩阵乘法处理器及其数据处理方法 |
-
2021
- 2021-03-25 CN CN202110322262.XA patent/CN113094646B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101038582A (zh) * | 2007-04-02 | 2007-09-19 | 中国科学院光电技术研究所 | 用于自适应光学波前复原运算的脉动阵列处理方法及电路 |
WO2018045594A1 (zh) * | 2016-09-12 | 2018-03-15 | 深圳大学 | 一种基于互质脉冲重复间隔的空时自适应处理方法及装置 |
CN108021393A (zh) * | 2017-12-15 | 2018-05-11 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN110188320A (zh) * | 2019-04-23 | 2019-08-30 | 山东大学 | 基于多核平台的二阶盲源分离并行优化方法及系统 |
CN110263925A (zh) * | 2019-06-04 | 2019-09-20 | 电子科技大学 | 一种基于fpga的卷积神经网络前向预测的硬件加速实现架构 |
CN111291323A (zh) * | 2020-02-17 | 2020-06-16 | 南京大学 | 一种基于脉动阵列的矩阵乘法处理器及其数据处理方法 |
Non-Patent Citations (2)
Title |
---|
Min Wang 等.A beamforming method in UWB pulse array based on neural network.《2005 IEEE International Symposium on Circuits and Systems》.2005,第3946-3949页. * |
夏飞 等.基于FPGA的非编码RNA基因检测算法加速器研究.《计算机工程与科学》.2011,第33卷(第12期),第153-158页. * |
Also Published As
Publication number | Publication date |
---|---|
CN113094646A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023169224A (ja) | ニューラルネットワークプロセッサにおけるベクトル計算ユニット | |
CN110288086B (zh) | 一种基于Winograd的可配置卷积阵列加速器结构 | |
CN111666255B (zh) | 脉动阵列和处理系统 | |
CN107633297B (zh) | 一种基于并行快速fir滤波器算法的卷积神经网络硬件加速器 | |
CN109767007B (zh) | 一种基于量子计算的最小均方误差检测方法 | |
US8447799B2 (en) | Process for QR transformation using a CORDIC processor | |
CN109740114B (zh) | 基于fpga的实对称矩阵特征分解实时处理方法 | |
CN113094646B (zh) | 一种基于矩阵联合近似对角化的矩阵数据处理系统及方法 | |
Véstias et al. | Lite-CNN: A high-performance architecture to execute CNNs in low density FPGAs | |
CN107210984B (zh) | 用于在多执行单元处理系统上进行并行的基于qrd的操作的方法和装置 | |
US20220100815A1 (en) | Method of realizing accelerated parallel jacobi computing for fpga | |
WO2021083101A1 (zh) | 数据处理方法、装置及相关产品 | |
CN112258410B (zh) | 一种可微分的低秩学习网络图像修复方法 | |
Kurniawan et al. | Multidimensional Householder based high-speed QR decomposition architecture for MIMO receivers | |
CN112422462B (zh) | 复值信道均衡器的设计方法 | |
Zhang et al. | Side information based orthogonal matching pursuit in distributed compressed sensing | |
CN108566237A (zh) | 基于双对角化的低复杂度几何均值分解预编码实现方法 | |
WO2021036361A1 (zh) | 一种基于修改方向的量子彩色图像加密方法及线路 | |
US10127040B2 (en) | Processor and method for executing memory access and computing instructions for host matrix operations | |
CN111814884A (zh) | 一种基于可变形卷积的目标检测网络模型的升级方法 | |
CN109190755B (zh) | 面向神经网络的矩阵转换装置及方法 | |
WO2020037512A1 (zh) | 一种神经网络计算方法和装置 | |
CN112818416B (zh) | 一种基于脉动阵列的全同态加密硬件加速器及其设计方法 | |
Mi et al. | Behavioral Implementation of SVD on FPGA | |
CN112766471B (zh) | 运算装置及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |