CN106372034B - 一种混合基fft处理器 - Google Patents
一种混合基fft处理器 Download PDFInfo
- Publication number
- CN106372034B CN106372034B CN201610757111.6A CN201610757111A CN106372034B CN 106372034 B CN106372034 B CN 106372034B CN 201610757111 A CN201610757111 A CN 201610757111A CN 106372034 B CN106372034 B CN 106372034B
- Authority
- CN
- China
- Prior art keywords
- base
- data
- arithmetic element
- interleaving block
- input data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
- G06F17/142—Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/523—Multiplying only
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Discrete Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Complex Calculations (AREA)
Abstract
本发明涉及处理器技术领域,公开了一种混合基FFT处理器,包括存储单元、控制单元、块浮点单元以及运算单元。该处理器采用基于存储的架构,通过支持基2、基3、基4、基5、基8以及基16的运算单元实现支持多种FFT运算和DFT运算。该FFT处理器可以用于多模无线通信系统,相比于传统方案可以节省芯片的面积和功耗,并减小SOC设计复杂度。
Description
技术领域
本发明涉及处理器技术领域,特别是涉及一种混合基FFT处理器。
背景技术
FFT是一种用于正交频分复用(OFDM)系统物理层的计算密集型算法,可以将数据在时域和频域之间进行转换。融合多模的OFDM无线通信系统要求FFT处理器具有较高的运算速度,并且能够支持多种FFT运算和DFT运算。
基于存储架构的FFT处理器的运算速度取决于处理器支持的基数以及数据并行度。基数越大,数据并行度越多,处理器的运算速度就越块。FFT处理器能够支持的基数决定了处理器能否支持FFT运算和DFT运算。若处理器仅支持2的整数幂的基数,如基2,基4,基8,基16,则此处理器仅支持FFT运算,若除此之外处理器还支持基3和基5运算,则此处理器能够支持FFT和DFT运算。
目前,FFT处理器通常仅支持基2和基4运算,其数据并行度不超过8,这种FFT处理器仅能支持FFT运算,且无法达到较高的运算速度;一些FFT处理器可以支持基2、基4、基8以及基16运算,其数据并行度可以达到16或更高,这种FFT处理器可以达到很高的运算速度,但是不能支持DFT运算;少数FFT处理器可以支持基2、基3、基4以及基5运算,其数据并行度不超过8,这种FFT处理器可以支持FFT运算和DFT运算,但是无法达到较高的运算速度。
FFT处理器无法做到一个处理器同时支持所有的FFT和DFT运算,并且支持FFT高速处理,所以在多模无线通信系统中需要采用FFT核和DFT核分别支持FFT运算和DFT运算。然而,这种解决方案不仅增大了芯片的面积和功耗,同时,也会增大SOC的设计复杂度。
发明内容
(一)要解决的技术问题
本发明的目的是提供一种混合基FFT处理器,通过恰当的处理器运算单元设计实现FFT的高速处理,以及同时支持FFT运算和DFT运算的功能。
(二)技术方案
为了解决上述技术问题,本发明提供一种混合基FFT处理器,包括:存储单元,用于存储输入数据、中间运算结果和输出数据;控制单元,用于根据FFT算法,计算需要读取和存储的数据的存储地址并控制运算单元进行蝶形运算;块浮点单元,用于进行块浮点操作和块浮点指数的存储和读取;以及运算单元,用于进行蝶形运算。
其中,所述运算单元包括乘法单元和蝶形单元,其数据并行度为16。
其中,所述运算单元最多可同时进行一个基16、两个基8、两个基5、四个基4、四个基3或八个基2的蝶形运算。
其中,所述乘法单元包括15个旋转因子乘法器,所述旋转因子乘法器采用CORDIC算法实现。在多路并行数据中,除第一路数据外,其余路的数据均需通过所述旋转因子乘法器进行旋转因子乘法运算。
其中,所述蝶形单元包括六个交织模块和五级运算单元,其中,所述六个交织模块分别为第一交织模块、第二交织模块、第三交织模块、第四交织模块、第五交织模块以及第六交织模块;
所述五级运算单元分别为第一级运算单元、第二级运算单元、第三级运算单元、第四级运算单元以及第五级运算单元。
其中,所述第一交织模块的输入数据为所述乘法单元输出的且经过对齐操作后的数据,所述第一交织模块输出的数据为所述第一级运算单元的输入数据;
所述第二交织模块、第三交织模块、第四交织模块、第五交织模块以及第六交织模块的输入数据为上一级运算单元的输出数据;
所述第二交织模块、第三交织模块、第四交织模块以及第五交织模块的输出数据为本级运算单元的输入数据;
所述第六交织模块的输出数据为所述蝶形单元的输出数据。
其中,所述第一级运算单元由并行的8个基二蝶形单元组成;
所述第二级运算单元由并行的4个基二蝶形单元、4个可变蝶形单元和4个简单乘法器组成;
所述第三级运算单元包括并行的简单乘法器、多个复杂乘法器以及2个复数加法器组成;
所述第四级运算单元由8个并行的基二蝶形单元组成;
所述第五级运算单元由8个并行的基二蝶形单元和4个简单乘法器组成。
其中,所述基二蝶形单元具有两个并行的数据输入端口和两个并行的数据输出端口,所述基二蝶形单元包括一个复数加法器和一个复数减法器,其中,第一个输入数据为a,第二个输入数据为b,则第一个输出数据c=a+b,第二个输出数据d=a-b。
其中,所述可变蝶形单元具有两个并行的数据输入端口和两个并行的数据输出端口。所述可变蝶形单元包括一个复数加法器和一个复数减法器。其中,第一个输入数据为a,第二个输入数据为b,则第一个输出数据c=a+b,当进行基2、基4、基8或基16运算时,第二个输出数据d=a-b,当进行基3或基5运算时,第二个输出数据d=a-(b/2)。
其中,所述简单乘法器具有一个数据输入端口和一个数据输出端口,当进行基3和基5运算时,基于输入数据和输出数据构建的第一平衡方程为
b=a=m+(i×n)
其中,b为输出数据,a为输入数据,i为虚部单位,m为输入数据a的实部,n为输入数据a的虚部;
当进行基4、基8和基16运算时,基于输入数据和输出数据构建的第二平衡方程为b=a×(-i)=n-(i×m),其中,b为输出数据,a为输入数据,i为虚部单位,m为输入数据a的实部,n为输入数据a的虚部。
其中,所述复杂乘法器具有一个数据输入端口和一个数据输出端口,基于输入数据和输出数据构建的第三平衡方程为b=e×a,
其中,b为输出数据,a为输入数据,e为系数。复杂乘法器根据当前进行运算的基选择系数e。
(三)有益效果
本发明提供的FFT处理器与现有技术相比,具有如下优点:
数据并行度为16,最大支持基16运算,可以实现FFT高速处理运算单元能够进行基2、基3、基4、基5、基8以及基16运算,保证了处理器能够支持FFT和DFT运算。
附图说明
图1为本申请的实施例的混合基FFT处理器的整体结构示意图;
图2为图1中的运算单元中的蝶形单元的结构示意图;
图3为图1中的运算单元中的乘法单元的结构示意图;
图4为图2中的基二蝶形单元的结构示意图;
图5为图2中的可变蝶形单元的结构示意图。
图中,100:FFT处理器;1:存储单元;11:第一存储子单元;12:第二存储子单元;2:控制单元;3:块浮点单元;4:运算单元;41:乘法单元;411:旋转因子乘法器;42:蝶形单元;420a:第一交织模块;421a:第一级运算单元;420b:第二交织模块;421b:第二级运算单元;420c:第三交织模块;421c:第三级运算单元;420d:第四交织模块;421d:第四级运算单元;420e:第五交织模块;421e:第五级运算单元;420f:第六交织模块;51:基二蝶形单元;511:复数加法器;512:复数减法器;52:可变蝶形单元;521:复数加法器;522:复数减法器;523:1/2乘法器;524:多路选择器;6:简单乘法器;7:复数加法器;8:复杂乘法器。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实例用于说明本发明,但不用来限制本发明的范围。
如图1和图2所示,其中,图1示意性地显示了本申请的FFT处理器100包括存储单元1、控制单元2、块浮点单元3以及运算单元4。其中,存储单元1、控制单元2、块浮点单元3以及运算单元4彼此间相互连接,并能实现信号的传递。
该存储单元1,其作用在于存储输入数据、中间运算结果和输出数据。该存储单元为ping-pang结构,其包括第一存储子单元11和第二存储子单元12,各存储子单元均为单口SRAM。
在一个具体的实施例中,每个存储子单元均包括16个组(bank),每个组的深度为512。
控制单元2,其作用在于根据无冲突存取算法,计算需要读取和存储的数据的存储地址。另外,该控制单元2还用于控制运算单元4进行蝶形运算。
块浮点单元3用于在数据经过乘法单元41之后,进入蝶形单元42之前进行对齐操作;在数据经过蝶形单元42之后进行缩放操作;块浮点指数的存储和读取。
运算单元4用于既支持FFT运算又支持DFT运算。这样,本申请的FFT处理器100中的运算单元4由于具有既支持FFT运算又支持DFT运算的功能,因而,也就是说本申请的FFT处理器100能够支持2的整数幂点FFT运算和非2的整数幂点DFT运算。同时,本申请的FFT处理器100采用16路并行的数据通路以及基16运算,从而提高了数据的吞吐率。容易理解,相比于现有技术需要多个处理器分别进行FFT运算和DFT运算而言,本申请的FFT处理器100节省了芯片的面积和功耗,同时,也降低了SOC的设计复杂度。
如图1和图2所示,在一个实施例中,该运算单元4包括乘法单元41和蝶形单元42,其中,蝶形单元42支持基2、基3、基4、基5、基8以及基16运算。即,可以同时进行一个基16、两个基8、两个基5、四个基4、四个基3或八个基2的运算。
如图3所示,图1还示意性地显示了该乘法单元41包括多个旋转因子乘法器411,在多路并行数据中,除第一路数据外,其余路的并行数据均需通过多个旋转因子乘法器411中的一个旋转因子乘法器411进行旋转因子乘法运算。在一个具体的实施例中,该乘法单元41包括15个旋转因子乘法器411,各旋转因子乘法器411采用CORDIC算法(坐标旋转数字计算方法)。在16路并行数据中,除第一路数据之外,其余15路均需通过一个旋转因子乘法器411进行与旋转因子相乘的运算。
如图2所示,,还示意性地显示了该蝶形单元42包括六个交织模块和五级运算单元,其中,六个交织模块分别为第一交织模块420a、第二交织模块420b、第三交织模块420c、第四交织模块420d以及第五交织模块420e以及第六交织模块420f。
五级运算单元分别为第一级运算单元421a、第二级运算单元421b、第三级运算单元421c、第四级运算单元421d以及第五级运算单元421e。
在另一个实施例中,该第一交织模块420a的输入数据为乘法单元41输出的且经过对齐操作后的数据,第一交织模块420b输出的数据为第一级运算单元421a的输入数据。
第二交织模块420b、第三交织模块420c、第四交织模块420d、第五交织模块420e以及第六交织模块420f的输入数据为上一级运算单元的输出数据。
第二交织模块420b、第三交织模块420c、第四交织模块420d、第五交织模块420e的输出数据为本级运算单元的输入数据。
第六交织模块420f的输出数据为蝶形单元42的输出数据。
在一个实施例中,在第一级运算单元421a之前,每两级运算单元之间和第五级运算单元421e之后就有一个交织模块,以进行数据交织处理。
如图2所示,图2还示意性地显示了该第一级运算单元421a由8个并行的基二蝶形单元51组成。
如图2所示,该第二级运算单元421b由并行的4个基二蝶形单元51、4个可变蝶形单元52和4个简单乘法器6组成。其中,4个简单乘法器6的输出数据分别作为四个基二蝶形单元5的第二个输入数据。
如图2所示,该第三级运算单元421c包括并行的简单乘法器6、8个复杂乘法器8以及2个复数加法器7组成。
该第四级运算单元由8个并行的基二蝶形单元51组成。
该第五级运算单元421e由8个并行的基二蝶形单元51和4个简单乘法器6组成。其中,4个简单乘法器6的输出数据分别作为四个基二蝶形单元51的第二个输入数据。
如图4所示,图4还示意性地显示了该基二蝶形单元51具有两个并行的数据输入端口和两个数据输出端口,该基二蝶形单元51包括一个复数加法器511和一个复数减法器512。其中,若第一输入数据为a,第二个输入数据为b,则第一个输出数据c=a+b,第二个输出数据d=a-b。
如图5所示,图5还示意性地显示了该可变蝶形单元52具有两个并行的数据输入端口和两个数据输出端口,该可变蝶形单元52包括一个复数加法器521、一个复数减法器522、一个1/2乘法器523和一个多路选择器524。其中,若第一个输入数据为a,第二个输入数据为b,则第一个输出数据c=a+b,当进行基2、基4、基8或基16运算时,第二个输出数据d=a-b,当进行基3或基5运算时,第二个输出数据d=a-(b/2)。
在另一个实施例中,简单乘法器6具有一个数据输入端口和一个数据输出端口,当进行基3和基5运算时,基于输入数据和输出数据构建的第一平衡方程为,
b=a=m+(i×n),
其中,b为输出数据,a为输入数据,i为虚部单位,m为输入数据a的实部,n为输入数据a的虚部;当进行基4、基8和基16运算时,基于输入数据和输出数据构建的第二平衡方程为
b=a×(-i)=n-(i×m),
其中,b为输出数据,a为输入数据,i为虚部单位,m为输入数据a的实部,n为输入数据a的虚部。
在另一个实施例中,复杂乘法器8具有一个数据输入端口和一个数据输出端口,基于输入数据和输出数据构建的第三平衡方程为
b=e×a,
其中,b为输出数据,a为输入数据,e为系数。复杂乘法器根据当前进行运算的基选择系数e。容易理解,该控制单元2可根据当前进行运算的基控制复数乘法器选择相应的系数e。
在一个实施例中,第三级运算单元421c中的复数加法器6也可以移动到第二级运算单元421b或第四级运算单元421d中,同时,在对复数加法器6的位置进行调整时,也要相应地调整交织模块的连接关系。
综上所述,本申请的FFT处理器100中的运算单元4具有既支持FFT运算又支持DFT运算的优点。这样,本申请的FFT处理器100中的运算单元4由于具有既支持FFT运算又支持DFT运算的功能,因而,也就是支持2的整数幂点FFT运算和非2的整数幂点DFT运算。同时,本申请的FFT处理器100采用16路并行的数据通路以及基16运算,从而提高了数据的吞吐率。容易理解,相比于现有技术需要多个处理器分别进行FFT运算和DFT运算而言,本申请的FFT处理器100则节省了芯片的面积和功耗,同时,也降低了SOC的设计的复杂度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种混合基FFT处理器,其特征在于,包括:
存储单元,用于存储输入数据、中间运算结果和输出数据;
控制单元,用于根据FFT算法,计算需要读取和存储的数据的存储地址并控制运算单元进行蝶形运算;
块浮点单元,用于进行块浮点操作和块浮点指数的存储和读取;以及
运算单元,用于进行蝶形运算;
所述运算单元包括乘法单元和蝶形单元,其数据并行度为16;
所述蝶形单元包括六个交织模块和五级运算单元,其中,所述六个交织模块分别为第一交织模块、第二交织模块、第三交织模块、第四交织模块、第五交织模块以及第六交织模块;
所述五级运算单元分别为第一级运算单元、第二级运算单元、第三级运算单元、第四级运算单元以及第五级运算单元。
2.根据权利要求1所述的混合基FFT处理器,其特征在于,所述运算单元最多可同时进行一个基16、两个基8、两个基5、四个基4、四个基3或八个基2的蝶形运算。
3.根据权利要求1所述的混合基FFT处理器,其特征在于,所述乘法单元包括15个旋转因子乘法器,所述旋转因子乘法器采用CORDIC算法实现;在多路并行数据中,除第一路数据外,其余路的数据均需通过所述旋转因子乘法器进行旋转因子乘法运算。
4.根据权利要求1所述的混合基FFT处理器,其特征在于,所述第一交织模块的输入数据为所述乘法单元输出的且经过对齐操作后的数据,所述第一交织模块输出的数据为所述第一级运算单元的输入数据;
所述第二交织模块、第三交织模块、第四交织模块、第五交织模块以及第六交织模块的输入数据为上一级运算单元的输出数据;
所述第二交织模块、第三交织模块、第四交织模块以及第五交织模块的输出数据为本级运算单元的输入数据;
所述第六交织模块的输出数据为所述蝶形单元的输出数据。
5.根据权利要求1所述的混合基FFT处理器,其特征在于,所述第一级运算单元由8个并行的基二蝶形单元组成;
所述第二级运算单元由并行的4个基二蝶形单元、4个可变蝶形单元和4个简单乘法器组成;
所述第三级运算单元包括并行的1个简单乘法器、8个复杂乘法器以及2个复数加法器组成;
所述第四级运算单元由8个并行的基二蝶形单元组成;
所述第五级运算单元由并行的8个基二蝶形单元和4个简单乘法器组成。
6.根据权利要求5所述的混合基FFT处理器,其特征在于,所述基二蝶形单元具有两个并行的数据输入端口和两个并行的数据输出端口,所述基二蝶形单元包括一个复数加法器和一个复数减法器,其中,第一个输入数据为a,第二个输入数据为b,则第一个输出数据c=a+b,第二个输出数据d=a-b。
7.根据权利要求5所述的混合基FFT处理器,其特征在于,所述可变蝶形单元具有两个并行的数据输入端口和两个并行的数据输出端口;所述可变蝶形单元包括一个复数加法器和一个复数减法器;其中,第一个输入数据为a,第二个输入数据为b,则第一个输出数据c=a+b,当进行基2、基4、基8或基16运算时,第二个输出数据d=a-b,当进行基3或基5运算时,第二个输出数据d=a-(b/2)。
8.根据权利要求5所述的混合基FFT处理器,其特征在于,所述简单乘法器具有一个数据输入端口和一个数据输出端口,当进行基3和基5运算时,基于输入数据和输出数据构建的第一平衡方程为
b=a=m+(i×n)
其中,b为输出数据,a为输入数据,i为虚部单位,m为输入数据a的实部,n为输入数据a的虚部;
当进行基4、基8和基16运算时,基于输入数据和输出数据构建的第二平衡方程为
b=a×(-i)=n-(i×m),
其中,b为输出数据,a为输入数据,i为虚部单位,m为输入数据a的实部,n为输入数据a的虚部。
9.根据权利要求5所述的混合基FFT处理器,其特征在于,所述复杂乘法器具有一个数据输入端口和一个数据输出端口,基于输入数据和输出数据构建的第三平衡方程为
b=e×a,
其中,b为输出数据,a为输入数据,e为系数;复杂乘法器根据当前进行运算的基选择系数e。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610757111.6A CN106372034B (zh) | 2016-08-29 | 2016-08-29 | 一种混合基fft处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610757111.6A CN106372034B (zh) | 2016-08-29 | 2016-08-29 | 一种混合基fft处理器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106372034A CN106372034A (zh) | 2017-02-01 |
CN106372034B true CN106372034B (zh) | 2019-09-17 |
Family
ID=57900626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610757111.6A Expired - Fee Related CN106372034B (zh) | 2016-08-29 | 2016-08-29 | 一种混合基fft处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106372034B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133194B (zh) * | 2017-04-11 | 2019-11-26 | 西安电子科技大学 | 基于混合基底的可配置fft/ifft协处理器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101571849A (zh) * | 2008-05-04 | 2009-11-04 | 中兴通讯股份有限公司 | 一种快速傅立叶变换处理器及其方法 |
CN102810087A (zh) * | 2011-05-30 | 2012-12-05 | 中兴通讯股份有限公司 | 一种傅立叶变换的实现装置 |
CN103488611A (zh) * | 2013-09-02 | 2014-01-01 | 电子科技大学 | 基于IEEE802.11.ad协议的FFT处理器 |
CN103823789A (zh) * | 2014-01-26 | 2014-05-28 | 北京理工大学 | 一种低复杂度的通用混合基fft设计方法 |
CN105718423A (zh) * | 2016-01-19 | 2016-06-29 | 清华大学 | 一种流水可重构的单精度浮点fft/ifft协处理器 |
-
2016
- 2016-08-29 CN CN201610757111.6A patent/CN106372034B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101571849A (zh) * | 2008-05-04 | 2009-11-04 | 中兴通讯股份有限公司 | 一种快速傅立叶变换处理器及其方法 |
CN102810087A (zh) * | 2011-05-30 | 2012-12-05 | 中兴通讯股份有限公司 | 一种傅立叶变换的实现装置 |
CN103488611A (zh) * | 2013-09-02 | 2014-01-01 | 电子科技大学 | 基于IEEE802.11.ad协议的FFT处理器 |
CN103823789A (zh) * | 2014-01-26 | 2014-05-28 | 北京理工大学 | 一种低复杂度的通用混合基fft设计方法 |
CN105718423A (zh) * | 2016-01-19 | 2016-06-29 | 清华大学 | 一种流水可重构的单精度浮点fft/ifft协处理器 |
Non-Patent Citations (1)
Title |
---|
基于CORDIC算法的流水线型FFT处理器设计;李靖宇等;《电视技术》;20121202;第36卷(第23期);第61-64、145页 |
Also Published As
Publication number | Publication date |
---|---|
CN106372034A (zh) | 2017-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ma et al. | Performance modeling for CNN inference accelerators on FPGA | |
Ahmed et al. | Heterogeneous hardware/software acceleration of the BWA-MEM DNA alignment algorithm | |
CN103955447B (zh) | 基于dsp芯片的fft加速器 | |
CN106445471A (zh) | 处理器和用于在处理器上执行矩阵乘运算的方法 | |
Cheng et al. | High-throughput VLSI architecture for FFT computation | |
WO2020220743A1 (zh) | 一种计算机数据处理方法及装置 | |
KR20180123846A (ko) | 합성곱 신경망을 위한 논리적 3차원 구조의 재구성형 연산 가속기 | |
CN109977347B (zh) | 一种支持多模式配置的可重构fft处理器 | |
KR20150132287A (ko) | 멀티-모드 래딕스-2x 버터플라이 벡터 프로세싱 회로들, 및 연관된 벡터 프로세서들을 제공하기 위한 프로그램 가능한 데이터 경로 구성들을 가지는 벡터 프로세싱 엔진들, 시스템들, 및 방법들 | |
WO2017000756A1 (zh) | 基于3072点快速傅里叶变换的数据处理方法及处理器、存储介质 | |
WO2022007266A1 (zh) | 一种卷积神经网络的加速方法及装置 | |
CN107797962A (zh) | 基于神经网络的计算阵列 | |
CN101083643A (zh) | 一种低存储器开销的混合基fft处理器及其方法 | |
KR100989797B1 (ko) | Fft/ifft 연산코어 | |
Deng et al. | An efficient online direction-preserving compression approach for trajectory streaming data | |
CN105335331A (zh) | 一种基于大规模粗粒度可重构处理器的sha256实现方法及系统 | |
US9262378B2 (en) | Methods and devices for multi-granularity parallel FFT butterfly computation | |
WO2018027706A1 (zh) | Fft处理器及运算方法 | |
CN102122241A (zh) | 一种适用于素域和多项式域的模乘模除器 | |
CN106951394A (zh) | 一种可重构定浮点通用fft处理器 | |
CN106372034B (zh) | 一种混合基fft处理器 | |
KR101696987B1 (ko) | Fft/dft의 역순 배열 시스템과 방법 및 그 연산 시스템 | |
CN105718424B (zh) | 一种并行快速傅立叶变换处理方法 | |
Dann et al. | GraphScale: Scalable bandwidth-efficient graph processing on FPGAs | |
US20190236752A1 (en) | Wide key hash table for a graphics processing unit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190917 Termination date: 20210829 |
|
CF01 | Termination of patent right due to non-payment of annual fee |