CN106469134B - 一种用于fft处理器的数据无冲突存取方法 - Google Patents
一种用于fft处理器的数据无冲突存取方法 Download PDFInfo
- Publication number
- CN106469134B CN106469134B CN201610755558.XA CN201610755558A CN106469134B CN 106469134 B CN106469134 B CN 106469134B CN 201610755558 A CN201610755558 A CN 201610755558A CN 106469134 B CN106469134 B CN 106469134B
- Authority
- CN
- China
- Prior art keywords
- data
- accessed
- fft processor
- grades
- max
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Discrete Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Complex Calculations (AREA)
Abstract
本发明涉及FFT处理器的存取方法技术领域,公开了一种用于FFT处理器的数据无冲突存取方法,包括:基于数据堆计算公式以获得待存取数据所在的堆;计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址。该方法具有支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,可以充分利用FFT处理器的硬件并行度,从而能够避免在同时存取多个待存取数据时发生数据冲突的问题的优点。
Description
技术领域
本发明涉及FFT处理器的存取方法技术领域,特别是涉及一种用于FFT处理器的数据无冲突存取方法。
背景技术
FFT是离散傅里叶变换(DFT)的一种快速实现方法,可以将数据在时域和频域之间进行转换。由于FFT是计算密集型算法,通常采用专用硬件进行FFT运算处理。基于存储的(memory-based)架构是一种常用的FFT专用硬件架构。基于存储的FFT架构,即,FFT处理器,其至少包括一个存储器、一组处理单元和一个控制单元。
FFT处理器可以采用数据无冲突算法同时存取多个数据用于处理单元做蝶形运算,存储器还需要同时存储多个数据用于保存当前蝶形运算的结果。为了解决同时存取多个数据时的数据冲突问题,需要一种用于FFT处理器的数据无冲突存取方法以保证需要的数据能够并行无冲突存取。
通常基于存储架构的FFT处理器的处理单元支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,比如处理单元同时支持一个基四和两个基二运算。但是大部分现有的数据无冲突存取算法只能支持特定的FFT处理器中的处理单元,有些数据无冲突存取算法无法同时支持较大基的单蝶形单元运算和较小基的多蝶形单元运算。
发明内容
(一)要解决的技术问题
本发明的目的是提供一种用于FFT处理器的数据无冲突存取方法,以解决FFT处理器同时支持较大基的单蝶形单元运算和较小基的多蝶形单元运算时的数据冲突问题。
(二)技术方案
为了解决上述技术问题,本发明提供一种用于FFT处理器的数据无冲突存取方法,包括:基于数据堆计算公式以获得待存取数据所在的堆;计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址。
其中,基于FFT处理器的并行度以及FFT处理器内的最大基构建第一平衡方程,所述第一平衡方程为
P=Nmax=2L,
其中,P为FFT处理器的并行度,Nmax为FFT处理器内的最大基,L为2的幂指数。
其中,将FFT运算的总点数N总按照混合基算法分解为m级蝶形运算,每一级蝶形运算的点数为N1,N2……..Nm,待存取数据在每一级蝶形运算中可由n1,n2…….nm来确定,其中,
ni(i=1,2,3·······m)分别代表待存取数据在第i级的蝶形运算中的排序。
其中,所述数据堆计算公式为
其中,bank为待存取数据在存储器组中的堆,ai(i=1,2,3·····m)为ni或ni的位倒序,modNmax为对Nmax进行取模运算。
其中,当FFT运算的总点数N总按照混合基算法分解为m级蝶形运算时,若m≥2,则至少有一个ai满足
其中,为ni的位倒序,ni为待存取数据在第i级蝶形运算的排序。
其中,在计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址的步骤中,当FFT处理器中的总点数N总小于等于Nmax时,所述待存取数据在所述堆中的存储地址都相同,即,addr=0;当FFT处理器中的总点数N总大于Nmax时,所述待存取数据在所述堆中的存储地址有两种选择。
其中,若在m级蝶形运算中有一个级为j级,j级满足
1≤j<m,
N0×N1×…×Nj≤Nmax,
N0×N1×…×Nj+1>Nmax,
则所述待存取数据的地址方程为
addr=Nm…Nj+2n'j+1+…+Nmnm-1+nm,
其中,addr为待存取数据的地址,m代表蝶形运算的级,Nm为第m级蝶形运算的点数,nm为待存取数据在第m级蝶形运算中的排序。
其中,n’j+1为nj+1的高位比特,>>为右移符号,为对向上取整。
其中,若在m级蝶形运算中有一个级为j级且j级满足
1<j≤m,
Nj…Nm≤Nmax,
Nj-1…Nm>Nmax,
则所述待存取数据的地址方程为
addr=N'j-1…N2n1+…+N'j-1nj-2+n'j-1,
其中,N'j-1为Nj-1的高位比特,n'j-1为nj-1的高位比特。
其中,
其中,N'j-1为nj-1的高位比特,Nj-1为第j-1级蝶形运算的点数,>>为右移符号,Nmax为FFT处理器内的最大基,n’j-1为nj-1的高位比特,nj-1为待存取数据在第j-1级蝶形运算中的排序,Nm为第m级蝶形运算的点数。Nj为第j级蝶形运算的点数。
(三)有益效果
本发明提供的用于FFT处理器的数据无冲突存取方法,与现有技术相比,具有如下优点:
该方法支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,可以充分利用FFT处理器的硬件并行度,从而能够避免在同时存取多个待存取数据时发生数据冲突的问题。
附图说明
图1为本申请的实施例的用于FFT处理器的数据无冲突存取方法的步骤流程示意图;
图2为本申请的实施例的用于FFT处理器的数据无冲突存取方法的位倒序示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实例用于说明本发明,但不用来限制本发明的范围。
如图1所示,图1示意性地显示了该数据无冲突存取方法的步骤流程示意图。该方法包括:
步骤S410,基于数据堆计算公式以获得待存取数据所在的堆。
步骤S420,计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址。
基于存储的FFT处理器的硬件数据用于无线通信系统(4G和WLAN),其并行度为16,可以最多支持同时处理一个基16、两个基8、两个基5、四个基4、四个基3或八个基2蝶形运算。
FFT处理器可以支持8至8192点的2的整数幂FFT运算和12至2400点的非2的整数幂DFT运算(可以用基2、基3、基5完成运算)。该FFT处理器的存储器包含一个或多个存储器组,每个寄存器组包含P个堆。在每一级蝶形运算中,存储器从一个确定的存储器组中读取待存取数据,并将该待存取数据送入处理单元,然后,将处理单元的结果保存到同一个或另一个确定的存储器组中。待存取数据在存储器组中的地址由其所在的堆和其在堆中的地址唯一确定。由此可知,若想确定出待存取数据在存储器组中的地址,则首先应当确定出待存取数据在存储器组中的堆,即,通过步骤S410便可获得。然后,确定出该待存取数据在堆中的地址,即通过步骤S420便可获得。
该方法支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,可以充分利用FFT处理器的硬件并行度,从而能够避免在同时存取多个待存取数据时发生数据冲突的问题。
为优化上述技术方案中的步骤S410,基于FFT处理器的并行度以及FFT处理器内的总点数构建第一平衡方程,所述第一平衡方程为
P=Nmax=2L,
其中,P为FFT处理器的并行度,Nmax为FFT处理器内的最大基,L为2的幂指数。
在一个实施例中,将FFT运算的总点数N总按照混合基算法分解为m级蝶形运算,每一级蝶形运算的点数为N1,N2……..Nm,待存取数据在每一级蝶形运算中可由n1,n2…….nm来确定,其中,
ni(i=1,2,3·····m)分别代表待存取数据在第i级的蝶形运算中的排序。
为优化上述技术方案中的步骤S410,在上述技术方案的基础上,该数据堆计算公式为
其中,bank为待存取数据在存储器组中的堆,ai(i=1,2,3·····m)为ni或ni的位倒序,modNmax为对Nmax进行取模运算。
ni(i=1,2,...m)的数据位宽为L比特,不满L比特的通过高位补零达到L比特。
需要说明的是,位倒序是将数据按照比特位倒序输出,结果的最高位是位倒序前的最低位,结果的次高位是位倒序的次低位,依次类推。
在一个实施例中,当FFT运算的总点数N总按照混合基算法分解为m级蝶形运算时,若m≥2,则至少有一个ai满足
其中,ai(i=1,2,3·····m)为ni的位倒序,ni为待存取数据在每一级蝶形运算中的排序。
在一个实施例中,在计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址的步骤中,当FFT处理器中的总点数N总小于等于Nmax时,所述待存取数据在所述堆中的存储地址都相同,即,addr=0。
在一个具体的实施例中,当FFT运算的总点数N总小于16时,所述待存取数据在所述堆中的存储地址都相同,即,addr=0。
在另一个实施例中,在计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址的步骤中,当FFT处理器中的总点数N总大于Nmax时,所述待存取数据在所述堆中的存储地址有两种选择。
若在m级蝶形运算中有一个级为j级且j级满足
1≤j<m,
N0×N1×…×Nj≤Nmax,
N0×N1×…×Nj+1>Nmax,
则所述待存取数据的地址方程为
addr=Nm…Nj+2n'j+1+…+Nmnm-1+nm,
其中,m代表蝶形运算的级,addr为待存取数据的地址,Nm为第m级蝶形运算的点数,nm代表待存取数据在第m级蝶形运算中排在第nm个数。
在一个具体的实施例中,当FFT处理器中的总点数N总大于16时,若在m级蝶形运算中有一个级为j级且j级满足
1≤j<m,
N0…Nj≤16,
N0…Nj+1>16,
且
其中,n’j+1为nj+1的高位比特,>>为右移符号,为对向上取整。
在第i个阶段的运算中,控制单元需要每次从存储器中存取K个数据,这K个数据组成一个数据块。每个周期控制单元从存储器中读取一个数据块到运算单元,并将运算单元得出的结果数据块存入存储器中。
如果,Ni=16则K=16。每个数据块包含一个基16蝶形的数据。每个数据块有ni=(0,1,…,15)和相同的nk(K不等于i)。
如果Ni≠16,则每个数据块中包含多个蝶形单元的待存取数据。相同的蝶形单元中有ni=(0,1,…,Ni-1),每个数据块中不同的蝶形单元有不同的nj和相同的nk(K不等于i或j)。其中j的取值为
以216点FFT为例。假设
待存取数据的存储公式为:
bank=(n1+n2+n3+n4)mod16,
addr=9n’2+3n3+n4,
其中,
n’2=n2>>1,
在数据输入阶段,数据并行度为9,同时输入的数据有相同的n1,n2和n3=(0,1,2),n4=(0,1,2)。
在第一个阶段的运算中,数据块中相同的基8蝶形单元中有n1=(0,1,…,7),不同的基8单元有n2=(0,1)或n2=(2),分别对应同时进行两个或一个基8运算。
在第二个阶段的运算中,数据块中相同的基3蝶形单元中有n2=(0,1,2),不同的基3单元有n1=(0,1,2,3)或n1=(4,5,6,7),对应同时进行四个基3运算。
在第三个阶段的运算中,数据块中相同的基3蝶形单元中有n3=(0,1,2),不同的基3单元有n1=(0,1,2,3)或n1=(4,5,6,7),对应同时进行四个基3运算。
在第四个阶段的运算中,数据块中相同的基3蝶形单元中有n4=(0,1,2),不同的基3单元有n3=(0,1,2),对应同时进行三个基3运算。
在数据输出阶段,数据并行度为8,同时输出的数据有相同的
n2,n3,n4和n1=(0,1,2,3,4,5,6,7)。
若在m级蝶形运算中有一个级为j级且j级满足
1<j≤m,
Nj…Nm≤Nmax,
Nj-1…Nm>Nmax,
则所述待存取数据的地址方程为
addr=N'j-1…N2n1+…+N'j-1nj-2+n'j-1,
其中,N'j-1为Nj-1的高位比特,n'j-1为nj-1的高位比特。
在一个实施例中,
其中,N'j-1为Nj-1的高位比特,Nj-1为第j-1级蝶形运算的点数,>>为右移符号,Nmax为FFT处理器内的总点数,n’j-1为nj-1的高位比特,nj-1为待存取数据在第j-1级蝶形运算中的排序,Nm为第m级蝶形运算的点数。Nj为第j级蝶形运算的点数。
综上所述,该方法支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,可以充分利用FFT处理器的硬件并行度,从而能够避免在同时存取多个待存取数据时发生数据冲突的问题。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种用于FFT处理器的数据无冲突存取方法,其特征在于,包括:
基于数据堆计算公式以获得待存取数据所在的堆;
计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址;
在计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址的步骤中,当FFT处理器中的总点数N总小于等于Nmax时,所述待存取数据在所述堆中的存储地址都相同,即,addr=0;
当FFT处理器中的总点数N总大于Nmax时,所述待存取数据在所述堆中的存储地址有两种选择;
若在m级蝶形运算中有一个级为j级且j级满足
1≤j<m,
N0×N1×…×Nj≤Nmax,
N0×N1×…×Nj+1>Nmax,
则所述待存取数据的地址方程为
addr=Nm…Nj+2n'j+1+…+Nmnm-1+nm,
其中,addr为待存取数据的地址,m代表蝶形运算的级,Nm为第m级蝶形运算的点数,n'j+1为nj+1的高位比特,nm为待存取数据在第m级蝶形运算中的排序。
2.根据权利要求1所述的用于FFT处理器的数据无冲突存取方法,其特征在于,基于FFT处理器的并行度以及FFT处理器内的最大基构建第一平衡方程,所述第一平衡方程为
P=Nmax=2L,
其中,P为FFT处理器的并行度,Nmax为FFT处理器内的最大基,L为2的幂指数。
3.根据权利要求2所述的用于FFT处理器的数据无冲突存取方法,其特征在于,将FFT运算的总点数N总按照混合基算法分解为m级蝶形运算,每一级蝶形运算的点数为N1,N2........Nm,待存取数据在每一级蝶形运算中可由n1,n2.......nm来确定,其中,
ni分别代表待存取数据在第i级的蝶形运算中的排序,其中,i=1,2,3.......m。
4.根据权利要求3所述的用于FFT处理器的数据无冲突存取方法,其特征在于,所述数据堆计算公式为
其中,bank为待存取数据在存储器组中的堆,ai为ni或ni的位倒序,其中,i=1,2,……m,modNmax为对Nmax进行取模运算。
5.根据权利要求4所述的用于FFT处理器的数据无冲突存取方法,其特征在于,当FFT运算的总点数N总按照混合基算法分解为m级蝶形运算时,若m≥2,则至少有一个ai满足
其中,为ni的位倒序,ni为待存取数据在第i级蝶形运算的排序。
6.根据权利要求1所述的用于FFT处理器的数据无冲突存取方法,其特征在于,
其中,n’j+1为nj+1的高位比特,>>为右移符号,为对向上取整。
7.根据权利要求1所述的用于FFT处理器的数据无冲突存取方法,其特征在于,若在m级蝶形运算中有一个级为j级,j级满足
1<j≤m,
Nj…Nm≤Nmax,
Nj-1…Nm>Nmax,
则所述待存取数据的地址方程为
addr=N'j-1…N2n1+…+N'j-1nj-2+n'j-1,
其中,N'j-1为Nj-1的高位比特,n'j-1为nj-1的高位比特。
8.根据权利要求7所述的用于FFT处理器的数据无冲突存取方法,其特征在于,
其中,N'j-1为Nj-1的高位比特,Nj-1为第j-1级蝶形运算的点数,>>为右移符号,Nmax为FFT处理器内的最大基,n'j-1为nj-1的高位比特,nj-1为待存取数据在第j-1级蝶形运算中的排序,Nm为第m级蝶形运算的点数,Nj为第j级蝶形运算的点数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610755558.XA CN106469134B (zh) | 2016-08-29 | 2016-08-29 | 一种用于fft处理器的数据无冲突存取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610755558.XA CN106469134B (zh) | 2016-08-29 | 2016-08-29 | 一种用于fft处理器的数据无冲突存取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106469134A CN106469134A (zh) | 2017-03-01 |
CN106469134B true CN106469134B (zh) | 2019-02-15 |
Family
ID=58230663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610755558.XA Expired - Fee Related CN106469134B (zh) | 2016-08-29 | 2016-08-29 | 一种用于fft处理器的数据无冲突存取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106469134B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112689832A (zh) * | 2020-05-28 | 2021-04-20 | 深圳市大疆创新科技有限公司 | 数据处理方法、装置、可移动平台及存储介质 |
CN113094639B (zh) * | 2021-03-15 | 2022-12-30 | Oppo广东移动通信有限公司 | 一种dft并行处理方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101339546A (zh) * | 2008-08-07 | 2009-01-07 | 那微微电子科技(上海)有限公司 | 地址映射方法和操作数并行的fft处理系统 |
CN103034621A (zh) * | 2012-12-13 | 2013-04-10 | 合肥工业大学 | 基2×k并行fft架构的地址映射方法及系统 |
WO2014108718A1 (en) * | 2013-01-09 | 2014-07-17 | Intel Corporation | Continuous-flow conflict-free mixed-radix fast fourier transform in multi-bank memory |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150331634A1 (en) * | 2013-01-09 | 2015-11-19 | Sergei I. SALISHCHEV | Continuous-flow conflict-free mixed-radix fast fourier transform in multi-bank memory |
-
2016
- 2016-08-29 CN CN201610755558.XA patent/CN106469134B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101339546A (zh) * | 2008-08-07 | 2009-01-07 | 那微微电子科技(上海)有限公司 | 地址映射方法和操作数并行的fft处理系统 |
CN103034621A (zh) * | 2012-12-13 | 2013-04-10 | 合肥工业大学 | 基2×k并行fft架构的地址映射方法及系统 |
WO2014108718A1 (en) * | 2013-01-09 | 2014-07-17 | Intel Corporation | Continuous-flow conflict-free mixed-radix fast fourier transform in multi-bank memory |
Non-Patent Citations (8)
Title |
---|
"802.11n系统中FFT/IFFT处理器的设计与实现";姜鑫;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110315;第2011年卷(第3期);I136-606 |
"A Generalized Conflict-Free Memory Addressing Scheme for Continuous-Flow Parallel-Processing FFT Processors With Rescheduling";Pei-Yun Tsai等;《IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS》;20111130;第19卷(第12期);第2290-2302页 |
"A generalized mixed-radix algorithm for memory-based FFT processors";Chen-Fong Hsiao等;《IEEE Transactions on Circuits and Systems II: Express Briefs》;20100131;第57卷(第1期);第26-30页 |
"A high-throughput radix-16 FFT processor with parallel and normal input/output ordering for IEEE 802.15.3c systems";Shen-Jui Huang等;《IEEE Transactions on Circuits and Systems I: Regular Papers》;20120831;第59卷(第8期);第1752-1765页 |
"Conflict-free data access for multi-bank memory architectures using padding";Joar Sohl等;《20th Annual International Conference on High Performance Computing》;20131221;第425-432页 |
"基于无冲突地址生成的高性能FFT处理器设计";王江等;《微电子学与计算机》;20070331;第24卷(第3期);第15-19页 |
"无存储访问冲突的基2*K并行FFT架构";侯宁等;《微电子学与计算机》;20140731;第31卷(第7期);第93-97页 |
"高性能FFT处理器的研究与FPGA实现";梁赫西;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120715;第2012年卷(第7期);I137-40 |
Also Published As
Publication number | Publication date |
---|---|
CN106469134A (zh) | 2017-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8422330B2 (en) | Memory controller and memory controlling method | |
US9886418B2 (en) | Matrix operands for linear algebra operations | |
US20150095391A1 (en) | Determining a Product Vector for Performing Dynamic Time Warping | |
Rocki et al. | Accelerating 2-opt and 3-opt local search using GPU in the travelling salesman problem | |
US11275741B2 (en) | Merge join system and method | |
Duan et al. | An adaptive treecode for computing nonbonded potential energy in classical molecular systems | |
CN103955446B (zh) | 基于dsp芯片的可变长度fft计算方法 | |
WO2019236479A1 (en) | Providing multi-element multi-vector (memv) register file access in vector-processor-based devices | |
US20160026607A1 (en) | Parallelization of scalar operations by vector processors using data-indexed accumulators in vector register files, and related circuits, methods, and computer-readable media | |
Yamazaki et al. | One-sided dense matrix factorizations on a multicore with multiple GPU accelerators | |
CN106469134B (zh) | 一种用于fft处理器的数据无冲突存取方法 | |
US20140330880A1 (en) | Methods and devices for multi-granularity parallel fft butterfly computation | |
KR101696987B1 (ko) | Fft/dft의 역순 배열 시스템과 방법 및 그 연산 시스템 | |
He et al. | Efficient dense matrix‐vector multiplication on GPU | |
US20050010627A1 (en) | Apparatus, methods, and computer program products for determining the coefficients of a function with decreased latency. | |
CN101661457A (zh) | 多处理器系统的三角线性方程组求解的方法和装置 | |
US20150095390A1 (en) | Determining a Product Vector for Performing Dynamic Time Warping | |
US9268744B2 (en) | Parallel bit reversal devices and methods | |
Li et al. | HOM4PS-2.0 para: Parallelization of HOM4PS-2.0 for solving polynomial systems | |
Misra et al. | Parallel mutual information based construction of genome-scale networks on the Intel® Xeon Phi™ Coprocessor | |
Li et al. | SeqMapReduce: software and web service for accelerating sequence mapping | |
CN104615582B (zh) | 面向gpdsp的大点数一维fft向量化计算的方法 | |
Chan et al. | Myphi: efficient levenshtein distance computation on xeon phi based architectures | |
Hongxia et al. | High Performance Algorithm for Twiddle Factor of Variable-size FFT Processor and Its Implementation | |
Tan et al. | Parallel particle swarm optimization algorithm based on graphic processing units |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190215 Termination date: 20210829 |
|
CF01 | Termination of patent right due to non-payment of annual fee |