CN101038582A - 用于自适应光学波前复原运算的脉动阵列处理方法及电路 - Google Patents

用于自适应光学波前复原运算的脉动阵列处理方法及电路 Download PDF

Info

Publication number
CN101038582A
CN101038582A CN 200710065047 CN200710065047A CN101038582A CN 101038582 A CN101038582 A CN 101038582A CN 200710065047 CN200710065047 CN 200710065047 CN 200710065047 A CN200710065047 A CN 200710065047A CN 101038582 A CN101038582 A CN 101038582A
Authority
CN
China
Prior art keywords
array
processing unit
matrix
error amount
wave front
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200710065047
Other languages
English (en)
Other versions
CN101038582B (zh
Inventor
郑文佳
王春鸿
姜文汉
李梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Optics and Electronics of CAS
Original Assignee
Institute of Optics and Electronics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Optics and Electronics of CAS filed Critical Institute of Optics and Electronics of CAS
Priority to CN200710065047A priority Critical patent/CN101038582B/zh
Publication of CN101038582A publication Critical patent/CN101038582A/zh
Application granted granted Critical
Publication of CN101038582B publication Critical patent/CN101038582B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

用于实现自适应光学波前复原运算的脉动阵列处理方法:(1)波前复原矩阵数据变换,目的是将矩阵变换为两个独立的带状矩阵,以便脉动阵列在处理时达到最高的使用效率;(2)将变换后的矩阵元素以适当的顺序预存入存储器中,计算时按顺序输出;(3)安排合理的数据流组织方式,使数据在线性阵列中流动起来,计算得到的复原电压值从阵列左端顺序输出。实现该脉动阵列处理方法的电路由多个处理单元PE(processing element)排列成线性结构,各个PE为一个乘法累加单元,同步工作,阵列中存在两条相向的数据流,具有数据通信局部化,数据流、控制流简单的特点,便于硬件实现。

Description

用于自适应光学波前复原运算的脉动阵列处理方法及电路
技术领域
本发明涉及一种用于矩阵矢量积运算的双向流水脉动阵列电路,具体适用于自适应光学系统波前处理机的波前复原运算。
背景技术
在自适应光学系统中,为了有效校正大气湍流造成的动态波前误差,对波前处理机的计算能力和实时性要求非常高。通用的微型计算机已不能满足要求,必须根据自适应光学系统波前处理的特点研制专用的高速波前处理机。波前处理机的工作流程包括图像处理、斜率计算、波前复原、控制运算和D/A转换五个模块,波前复原运算是波前处理中运算量较大的部分,将子孔径波前斜率向量G乘波前复原矩阵D得到波前误差向量E,即
E=DG                                        (1)
设子孔径数为n,驱动器数为m,则D是m×2n的矩阵,G有2n个分量,且一般有2n>m。
目前处理这种矩阵运算的方法主要有两种:一种是可以将其矩阵分块运算,由多个DSP的多处理器系统来执行,在使用多处理器进行矩阵运算的方法中需要在处理器之间传达信息,从而易发生处理的延迟,且装置集成度不高,不易于大规模集成化;另一种是可以在FPGA构成的脉动阵列实现,可参考2004年3月发表在《光电工程》的一篇论文,题为《用脉动阵列实现实时波前复原处理》,王彩霞著。这种方法是一种线性单向流水脉动阵列,该方法存在两个缺点:(1)只有斜率向量在阵列中流动,计算结果不能在阵列中流动,每个处理单元PE(processing element)计算完成后都需要向I/O口输出结果,因此该结构需要全局通信和公共数据总线,不是纯脉动阵列。当单元数增大时,将导致系统的结构复杂,且输出带宽易成为系统瓶颈,使得超大规模集成电路VLSI实现变得困难;(2)需要m个处理单元PE,因此PE数目较多,硬件实现的成本高。
发明内容
本发明的目的在于提供一种实现用于自适应光学波前复原运算的脉动阵列处理方法,该方法为双向流水纯脉动阵列处理方法,数据只有局部传输,无全局通信和公共数据总线,阵列结构简单,从而使处理速度提高且数据吞吐量增大。
本发明的另一目的是提供一种用于自适应光学波前复原运算的脉动阵列处理电路,该电路能够使每个处理部件PE的效能达到最大,从而促进装置的小型化和低耗电化。
本发明的技术方案如下:用于自适应光学波前复原运算的脉动阵列处理方法,其特点在于步骤如下:
(1)波前复原矩阵数据变换:将m行×2n列的波前复原矩阵分为奇数行和偶数行两个独立的分块矩阵矢量积,若m不为偶数则补一行零;分块后的矩阵Do、De是m/2行×2n列的长方形矩阵;再将其分成m/2行×m/2列大小的块,若4n/m不为整数,则在第一列元素前补零使矩阵列的数目可以被其行数整除;然后分别将每个m/2行×m/2列的方形矩阵对角线以下的元素移到矩阵的上边,其余元素补零;最后将其分别变换为带宽m/2,大小为m/2+2n-1行×2n列的带状矩阵,记为A、B;
(2)数据预存:将所述的A、B矩阵中的元素交错存储在m/2个深度为m/2+4n-1存储器中,其中第x个存储器中第x个至第x+2n-1个存储单元顺序存储矩阵A、B的元素ax,1、bx,1、a(x+1),2、b(x+1),2、……a(x+2n-1),2n、b(x+2n-1),2n,其余存储单元为0;
(3)脉动阵列处理:阵列由m个处理单元排成线性,阵列启动后,每个处理单元在时钟的推动下同步工作,每个流水节拍完成从对应的存储器中取出数据与从单元左端流入的斜率数据相乘再累加到从单元右端流入的误差值部分和上,变换后的矩阵元素从存储器中开始自上而下流入阵列,阵列中存在两条相向的数据流:斜率值gi和误差值ei,斜率值gi有节奏地从阵列左端流进,每个斜率值重复输入两次;误差值ei从右向左流动,每个节拍从阵列左端流出一个部分和,再经过m/2+1个流水节拍的延时又从右自左循环流入阵列参与运算,当最后一个斜率值进入阵列后,阵列最左端处理单元得到的误差值计算完成并向外输出,m个计算节拍计算结束。
用于自适应光学波前复原运算的脉动阵列处理电路,由m/2个乘累加处理单元PE1-PEm/2、m/2个单口输出存储模块RAM1-RAMm/2、延迟寄存器组Delay和多路开关PW组成,乘累加处理单元PE1-PEm/2排列成线性阵列结构,每个处理单元的复原矩阵元素输入端口Din连接相同下标的RAM的数据输出口,位于左方的处理单元的斜率值输出端口Gout、误差值输入端口Ein分别连接位于右方的处理单元的斜率值输入端口Gin、误差值输出端口Eout,处理单元PE1的斜率值输入端口Gin与整个阵列的斜率数据输入端口G相接,处理单元PE1的误差值输出端口Eout接多路开关PW的输入端,多路开关PW的一个出口端连接延迟寄存器组Delay的输入端,Delay的输出端连接处理单元PEm/2的误差值输入端口Ein,多路开关PW的另一出口端为作整个阵列误差值输出端口E。
所述的每个乘累加处理单元PE都由两个寄存器REG1和REG2、一个乘法器MUL和一个加法器ADD组成,乘累加处理单元PE的斜率值输入端口Gin作为第一个寄存器REG1的输入端,第一个寄存器REG1的输出端分别作为乘累加处理单元PE的误差值输出端口Gout和乘法器MUL的一个输入端,乘法器MUL的另一个输入端接乘累加处理单元PE的复原矩阵元素输入端口Din,乘法器MUL的输出端接加法器ADD的一个输入端,加法器ADD的另一个输入端作为乘累加处理单元PE的误差值输入端口Ein,加法器ADD的输出端接第二个寄存器REG2的输入端,第二个寄存器REG2的输出端作为乘累加处理单元PE的误差值输出端口Eout。
本发明与现有技术相比的优点在于:
(1)本发明的自适应光学波前复原运算的脉动阵列处理方法是一种线性双向流水纯脉动阵列,实现流水线式的处理,其阵列中存在两条相向的数据流,且计算结果从阵列的一端顺序流出,因此数据只有局部传输,无全局通信和公共数据总线,阵列结构简单,便于硬件实现,可以使处理速度提高且数据吞吐量增大。
(2)本发明的自适应光学波前复原运算的脉动阵列处理电路,通过将复原矩阵进行数据变换成带状矩阵,提高了阵列处理单元的利用效率,使每个PE的工作效率接近100%,从而促进了装置的小型化和低耗电化。
(3)本发明的自适应光学波前复原运算的脉动阵列处理电路,通过分时使用阵列的处理单元来合理有效地减少品了处理单元的数目,PE数目为(m/2),减少了一半的处理单元,节省了硬件资源50%。
(4)本发明的计算延时为m个流水节拍,实时性好。
附图说明
图1为本发明中的波前复原矩阵数据变换的示意图;
图2为本发明中的乘累加处理单元PE的结构示意图;
图3为本发明中的m单元n个子孔径自适应光学系统波前复原运算电路的硬件结构。
具体实施方式
下面结合图1至图3具体说明本实施方式。本发明的用于自适应光学系统波前复原脉动阵列处理方法,它通过以下步骤完成:
(1)进行波前复原矩阵数据变换,将矩阵变换为两个独立的带状矩阵
因为线性脉动阵列在处理带状矩阵矢量积时单元利用率最高,且可以在一个脉动阵列中通过时分使用阵列的处理单元同时完成两个独立的矩阵矢量积以使单元利用率提高一倍,故本发明将m行×2n列的波前复原矩阵分为奇数行和偶数行两个独立的分块矩阵矢量积,设m为偶(若m不为偶数则补一行零),则
e 1 e 3 M e m - 1 = d 11 d 12 L d 1,2 n d 31 O M M O M d m - 1,1 L L d m - 1,2 n g 1 g 2 M g 2 n - 1 g 2 n 记为:Eo=DoG          (2)
e 2 e 4 M e m = d 21 d 22 L d 2 , 2 n d 41 O M M O M d m , 1 L L d m , 2 n g 1 g 2 M g 2 n - 1 g 2 n 记为:Ee=DeG          (3)
分块后的矩阵Do、De是(m/2)行×2n列的长方形矩阵,再将其分成若干个(m/2)行×(m/2)列大小的块,(若4n/m不为整数,则在第一列元素前补零使矩阵列的数目可以被其行数整除),然后将每个(m/2)行×(m/2)列的方形矩阵D对角线以下的元素移到矩阵的上边,最后将其变换为一个带宽(m/2),大小为((m/2)+2n-1)行×2n列的带状矩阵,记为A、B,图1给出了变换过程示意图。
(2)将变换后的矩阵进行数据预存
将上述A、B矩阵中的元素交错存储在(m/2)个深度为(m/2)+4n-1存储器中,在存放的过程中确定存放的位置和存放的顺序。其中第x个存储器中第x个至第x+2n-1个存储单元顺序存储矩阵A、B的元素ax,1、bx,1、a(x+1),2、b(x+1),2、……a(x+2n-1),2n、b(x+2n-1),2n,其余存储单元为0。
(3)进行脉动阵列处理,使数据在线性阵列中流动起来,计算得到的波前得复原电压值从阵列左端顺序输出
由m个处理单元排成线性阵列,阵列启动后,每个处理单元在时钟的推动下同步工作,每个流水节拍完成从对应的存储器中取出数据与从单元左端流入的斜率数据相乘再累加到从单元右端流入的误差值部分和上。变换后的矩阵元素从存储器中开始自上而下流入阵列,阵列中存在两条相向的数据流:斜率值gi和误差值ei,斜率值gi有节奏地从阵列左端流进,每个斜率值重复输入两次。误差值ei从右向左流动,每个节拍从阵列左端流出一个部分和,再经过m/2+1个流水节拍的延时又从右自左循环流入阵列参与运算,当最后一个斜率值进入阵列后,阵列最左端处理单元得到的误差值计算完成并向外输出,m个计算节拍计算结束。阵列工作时,只有相邻两个处理单元通信,没有全局通信。
如图3所示,本发明的用于自适应光学波前复原运算的处理电路:由m/2个乘累加处理单元PE1-PEm/2、m/2个单口输出存储模块RAM1-RAMm/2、一个延迟寄存器组Delay和一个多路开关PW组成。
如图2所示,每个乘累加处理单元PE都由两个寄存器REG1和REG2、一个乘法器MUL、一个加法器ADD组成。其中Gin、Gout:分别为斜率值的输入输出端口,中间进行了锁存;Ein和Eout:分别为误差值的输入输出端口,中间进行了锁存;Din:为波前复原矩阵元素的输入端口。乘法器MUL取寄存器REG1中的斜率数据与Din口输入的波前复原矩阵元素相乘,加法器ADD将乘法器MUL输出与Ein相加后,在时钟的锁存下到REG2做为Eout进行输出,它执行的就是一个乘累加运算。
乘累加处理单元PE的脚Gin接寄存器REG1的输入端,寄存器REG1的输出端接乘累加处理单元PE的脚Gout和乘法器MUL的一个输入端,乘法器MUL的另一个输入端接乘累加处理单元PE的脚Din,乘法器MUL的输出端接加法器ADD的一个输入端,加法器ADD的另一个输入端接乘累加处理单元PE的脚Ein,加法器ADD的输出端接寄存器REG2的输入端,寄存器REG2的输出端接乘累加处理单元的脚Eout。
在图3中乘累加处理单元PE1-PEm/2排列成线性阵列结构,只有相邻两个处理单元之间有数据交换,即具有数据通信局部性的特点。每个处理单元的脚Din连接相同下标的RAM的数据输出口,位于左方的处理单元的脚Gout、脚Ein分别连接位于右方的处理单元的脚Gin、脚Eout,处理单元PE1的脚Gin接阵列的斜率数据输入端口,处理单元PE1的脚Gin接阵列的斜率值输入端口G,处理单元PE1的脚Eout接多路开关PW的输入,多路开关PW的一个出口端连接延迟寄存器组Delay的输入端,Delay的输出端连接处理单元REm/2的脚Ein,多路开关PW的另一出口端接阵列误差值输出端口E。
每个PE在时钟的驱动下同步工作。RAM1-RAM(m/2)的存储单元数为m/2+4n-1。矩阵A、B离线变换出,RAMx中第x个至第x+2n-1个存储单元交错存储矩阵A、B的元素:ax,1、bx,1、a(x+1),2、b(x+1),2、……a(x+2n-1),2n、b(x+2n-1),2n,其余存储单元为0。运算时按节拍顺序输出。Delay为深度为(m/2)+1的延迟移位寄存器组。
本发明电路的工作原理为:
(1)在电路开始工作前,将变换好的矩阵A、B中的元素交替存储在RAM1-RAMm/2中,寄存器组Delay的各存储单元和各个PE中的寄存器初值都为零。
(2)从第一个斜率值输入,启动电路为时间节拍的零点。各个PE在时钟的推动下同步工作,在第1拍斜率从Gin读入斜率值存入REG1,第2拍取REG1中的斜率值与Din口送入的复原矩阵元素相乘,第3拍加法器取乘法结果与从Ein口读入的数据相加,第4拍加法结果在锁存到REG2作为Eout进行输出,第5拍延迟寄存器组Delay单元中的数据从左向右移动一个存储单元,这样就完成了一次乘累加操作,记为一个流水节拍,包括5个时钟节拍。每当一个误差值输入阵列,就启动阵列运行一个流水节拍,每一个流水节拍各个执行相同的操作。阵列中存在两条相向的数据流:斜率值gi和误差值ei,,斜率值gi从阵列左端顺序输入,每个斜率值重复输入两次,分别参加奇数行、偶数行两个独立的矩阵矢量积运算,斜率值每个流水节拍在阵列中从左向右流经一个PE;误差值ei每个流水节拍在阵列中从右向左流经一个PE。RAM每个流水节拍送入一个数据。在前4n个流水节拍多路开关PW控制从PE1流出的误差值输入延迟寄存器组后再从阵列最右端循环流入阵列参与运算,在第4n+1个流水节拍,即最后一个斜率值g2n流入阵列后,多路开关PW控制将计算完成的误差值e1、e2、e3……输出阵列,每个流水节拍输出一个误差值,在最后一个斜率值送入阵列后m个流水节拍计算结束。

Claims (3)

1、一种用于自适应光学波前复原运算的脉动阵列处理方法,其特征在于步骤如下:
(1)波前复原矩阵数据变换:将m行×2n列的波前复原矩阵分为奇数行和偶数行两个独立的分块矩阵矢量积,若m不为偶数则补一行零;分块后的矩阵Do、De是m/2行×2n列的长方形矩阵;再将其分成m/2行×m/2列大小的块,若4n/m不为整数,则在第一列元素前补零使矩阵列的数目可以被其行数整除;然后分别将每个m/2行×m/2列的方形矩阵对角线以下的元素移到矩阵的上边,其余元素补零;最后将其分别变换为带宽m/2,大小为m/2+2n-1行×2n列的带状矩阵,记为A、B;
(2)数据预存:将所述的A、B矩阵中的元素交错存储在m/2个深度为m/2+4n-1存储器中,其中第x个存储器中第x个至第x+2n-1个存储单元顺序存储矩阵A、B的元素ax,1、bx,1、a(x+1),2、b(x+1),2、……a(x+2n-1),2n、b(x+2n-1),2n,其余存储单元为0;
(3)脉动阵列处理:阵列由m个处理单元排成线性,阵列启动后,每个处理单元在时钟的推动下同步工作,每个流水节拍完成从对应的存储器中取出数据与从单元左端流入的斜率数据相乘再累加到从单元右端流入的误差值部分和上,变换后的矩阵元素从存储器中开始自上而下流入阵列,阵列中存在两条相向的数据流:斜率值gi和误差值ei,斜率值gi从阵列左端流进,每个斜率值重复输入两次;误差值ei从右向左流动,每个节拍从阵列左端流出一个部分和,再经过m/2+1个流水节拍的延时又从右自左循环流入阵列参与运算,当最后一个斜率值进入阵列后,阵列最左端处理单元得到的误差值计算完成并向外输出,m个计算节拍计算结束。
2、一种用于自适应光学波前复原运算的脉动阵列处理电路,其特征在于:它由m/2个乘累加处理单元PE1-PEm/2、m/2个单口输出存储模块RAM1-RAMm/2、延迟寄存器组Delay和多路开关PW组成,乘累加处理单元PE1-PEm/2排列成线性阵列结构,每个处理单元的复原矩阵元素输入端口Din连接相同下标的RAM的数据输出口,位于左方的处理单元的斜率值输出端口Gout、误差值输入端口Ein分别连接位于右方的处理单元的斜率值输入端口Gin、误差值输出端口Eout,处理单元PE1的斜率值输入端口Gin与整个阵列的斜率数据输入端口G相接,处理单元PE1的误差值输出端口Eout接多路开关PW的输入端,多路开关PW的一个出口端连接延迟寄存器组Delay的输入端,Delay的输出端连接处理单元PEm/2的误差值输入端口Ein,多路开关PW的另一出口端为作整个阵列误差值输出端口E。
3、根据权利要求2所述的用于实现自适应光学波前复原运算的脉动阵列处理电路,其特征在于:所述的每个乘累加处理单元PE都由两个寄存器REG1和REG2、一个乘法器MUL和一个加法器ADD组成,乘累加处理单元PE的斜率值输入端口Gin作为第一个寄存器REG1的输入端,第一个寄存器REG1的输出端分别作为乘累加处理单元PE的误差值输出端口Gout和乘法器MUL的一个输入端,乘法器MUL的另一个输入端接乘累加处理单元PE的复原矩阵元素输入端口Din,乘法器MUL的输出端接加法器ADD的一个输入端,加法器ADD的另一个输入端作为乘累加处理单元PE的误差值输入端口Ein,加法器ADD的输出端接第二个寄存器REG2的输入端,第二个寄存器REG2的输出端作为乘累加处理单元PE的误差值输出端口Eout。
CN200710065047A 2007-04-02 2007-04-02 用于自适应光学波前复原运算的脉动阵列处理方法及电路 Expired - Fee Related CN101038582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200710065047A CN101038582B (zh) 2007-04-02 2007-04-02 用于自适应光学波前复原运算的脉动阵列处理方法及电路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710065047A CN101038582B (zh) 2007-04-02 2007-04-02 用于自适应光学波前复原运算的脉动阵列处理方法及电路

Publications (2)

Publication Number Publication Date
CN101038582A true CN101038582A (zh) 2007-09-19
CN101038582B CN101038582B (zh) 2010-05-12

Family

ID=38889488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710065047A Expired - Fee Related CN101038582B (zh) 2007-04-02 2007-04-02 用于自适应光学波前复原运算的脉动阵列处理方法及电路

Country Status (1)

Country Link
CN (1) CN101038582B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902064A (zh) * 2019-02-01 2019-06-18 京微齐力(北京)科技有限公司 一种二维脉动阵列的芯片电路
CN110673824A (zh) * 2018-07-03 2020-01-10 赛灵思公司 矩阵向量乘电路以及循环神经网络硬件加速器
CN110704024A (zh) * 2019-09-28 2020-01-17 深圳芯英科技有限公司 一种矩阵处理装置、方法及处理设备
CN113094646A (zh) * 2021-03-25 2021-07-09 电子科技大学 一种基于矩阵联合近似对角化的矩阵数据处理系统及方法
CN114580628A (zh) * 2022-03-14 2022-06-03 北京宏景智驾科技有限公司 一种神经网络卷积层的高效量化加速方法及硬件电路
CN115033843A (zh) * 2022-08-09 2022-09-09 之江实验室 基于三角脉动阵列的协方差矩阵计算的电路实现方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW305943B (zh) * 1995-04-21 1997-05-21 Daewoo Electronics Co Ltd
WO2003092171A2 (en) * 2002-04-25 2003-11-06 Koninklijke Philips Electronics N.V. Processing method and apparatus for implementing systolic arrays

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110673824A (zh) * 2018-07-03 2020-01-10 赛灵思公司 矩阵向量乘电路以及循环神经网络硬件加速器
CN109902064A (zh) * 2019-02-01 2019-06-18 京微齐力(北京)科技有限公司 一种二维脉动阵列的芯片电路
CN110704024A (zh) * 2019-09-28 2020-01-17 深圳芯英科技有限公司 一种矩阵处理装置、方法及处理设备
CN113094646A (zh) * 2021-03-25 2021-07-09 电子科技大学 一种基于矩阵联合近似对角化的矩阵数据处理系统及方法
CN113094646B (zh) * 2021-03-25 2023-04-28 电子科技大学 一种基于矩阵联合近似对角化的矩阵数据处理系统及方法
CN114580628A (zh) * 2022-03-14 2022-06-03 北京宏景智驾科技有限公司 一种神经网络卷积层的高效量化加速方法及硬件电路
CN115033843A (zh) * 2022-08-09 2022-09-09 之江实验室 基于三角脉动阵列的协方差矩阵计算的电路实现方法
CN115033843B (zh) * 2022-08-09 2022-11-08 之江实验室 基于三角脉动阵列的协方差矩阵计算的电路实现方法

Also Published As

Publication number Publication date
CN101038582B (zh) 2010-05-12

Similar Documents

Publication Publication Date Title
CN101038582B (zh) 用于自适应光学波前复原运算的脉动阵列处理方法及电路
CN100449522C (zh) 基于多fpga的矩阵乘法并行计算系统
CN107341133B (zh) 基于任意维数矩阵lu分解的可重构计算结构的调度方法
CN101751376B (zh) 利用cpu和gpu协同工作对三角线性方程组求解的加速方法
CN102122275A (zh) 一种可配置处理器
CN110705703B (zh) 基于脉动阵列的稀疏神经网络处理器
CN100510836C (zh) 用于自适应光学系统波前控制运算的脉动阵列处理电路
CN101685385A (zh) 一种复数乘法器
CN110851779B (zh) 用于稀疏矩阵运算的脉动阵列架构
CN103677739A (zh) 一种可配置的乘累加运算单元及其构成的乘累加运算阵列
CN109271138A (zh) 一种适用于大维度矩阵乘的链式乘法结构
CN100390782C (zh) 一种实时快速傅立叶变换电路
CN103984677A (zh) 基于大规模粗粒度嵌入式可重构系统及其处理方法
CN102360281B (zh) 用于微处理器的多功能定点乘加单元mac运算装置
CN100409259C (zh) 可缩放大规模二维卷积电路
CN101697486A (zh) 一种二维小波变换集成电路结构
CN1983246A (zh) 一种变换地址原址返回的级间流水fft处理模块
CN104407836A (zh) 利用定点乘法器进行级联乘累加运算的装置和方法
CN107368459B (zh) 基于任意维数矩阵乘法的可重构计算结构的调度方法
CN201111042Y (zh) 一种二维小波变换集成电路结构
CN1564125A (zh) 一种基于cordic单元的阵列式可重构dsp引擎芯片结构
CN104268124A (zh) 一种fft实现装置和方法
CN100378719C (zh) 基2单路深度延时反馈的流水线构成fft处理器的实现方法
CN103902762A (zh) 一种针对正定对称矩阵进行最小二乘方程求解的电路结构
CN116702851A (zh) 适用于权重复用神经网络的脉动阵列单元及脉动阵列结构

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100512

Termination date: 20140402