CN106469134B - 一种用于fft处理器的数据无冲突存取方法 - Google Patents

一种用于fft处理器的数据无冲突存取方法 Download PDF

Info

Publication number
CN106469134B
CN106469134B CN201610755558.XA CN201610755558A CN106469134B CN 106469134 B CN106469134 B CN 106469134B CN 201610755558 A CN201610755558 A CN 201610755558A CN 106469134 B CN106469134 B CN 106469134B
Authority
CN
China
Prior art keywords
data
accessed
fft processor
grades
max
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610755558.XA
Other languages
English (en)
Other versions
CN106469134A (zh
Inventor
刘大可
刘劭晗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201610755558.XA priority Critical patent/CN106469134B/zh
Publication of CN106469134A publication Critical patent/CN106469134A/zh
Application granted granted Critical
Publication of CN106469134B publication Critical patent/CN106469134B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及FFT处理器的存取方法技术领域,公开了一种用于FFT处理器的数据无冲突存取方法,包括:基于数据堆计算公式以获得待存取数据所在的堆;计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址。该方法具有支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,可以充分利用FFT处理器的硬件并行度,从而能够避免在同时存取多个待存取数据时发生数据冲突的问题的优点。

Description

一种用于FFT处理器的数据无冲突存取方法
技术领域
本发明涉及FFT处理器的存取方法技术领域,特别是涉及一种用于FFT处理器的数据无冲突存取方法。
背景技术
FFT是离散傅里叶变换(DFT)的一种快速实现方法,可以将数据在时域和频域之间进行转换。由于FFT是计算密集型算法,通常采用专用硬件进行FFT运算处理。基于存储的(memory-based)架构是一种常用的FFT专用硬件架构。基于存储的FFT架构,即,FFT处理器,其至少包括一个存储器、一组处理单元和一个控制单元。
FFT处理器可以采用数据无冲突算法同时存取多个数据用于处理单元做蝶形运算,存储器还需要同时存储多个数据用于保存当前蝶形运算的结果。为了解决同时存取多个数据时的数据冲突问题,需要一种用于FFT处理器的数据无冲突存取方法以保证需要的数据能够并行无冲突存取。
通常基于存储架构的FFT处理器的处理单元支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,比如处理单元同时支持一个基四和两个基二运算。但是大部分现有的数据无冲突存取算法只能支持特定的FFT处理器中的处理单元,有些数据无冲突存取算法无法同时支持较大基的单蝶形单元运算和较小基的多蝶形单元运算。
发明内容
(一)要解决的技术问题
本发明的目的是提供一种用于FFT处理器的数据无冲突存取方法,以解决FFT处理器同时支持较大基的单蝶形单元运算和较小基的多蝶形单元运算时的数据冲突问题。
(二)技术方案
为了解决上述技术问题,本发明提供一种用于FFT处理器的数据无冲突存取方法,包括:基于数据堆计算公式以获得待存取数据所在的堆;计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址。
其中,基于FFT处理器的并行度以及FFT处理器内的最大基构建第一平衡方程,所述第一平衡方程为
P=Nmax=2L
其中,P为FFT处理器的并行度,Nmax为FFT处理器内的最大基,L为2的幂指数。
其中,将FFT运算的总点数N按照混合基算法分解为m级蝶形运算,每一级蝶形运算的点数为N1,N2……..Nm,待存取数据在每一级蝶形运算中可由n1,n2…….nm来确定,其中,
ni(i=1,2,3·······m)分别代表待存取数据在第i级的蝶形运算中的排序。
其中,所述数据堆计算公式为
其中,bank为待存取数据在存储器组中的堆,ai(i=1,2,3·····m)为ni或ni的位倒序,modNmax为对Nmax进行取模运算。
其中,当FFT运算的总点数N按照混合基算法分解为m级蝶形运算时,若m≥2,则至少有一个ai满足
其中,为ni的位倒序,ni为待存取数据在第i级蝶形运算的排序。
其中,在计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址的步骤中,当FFT处理器中的总点数N小于等于Nmax时,所述待存取数据在所述堆中的存储地址都相同,即,addr=0;当FFT处理器中的总点数N大于Nmax时,所述待存取数据在所述堆中的存储地址有两种选择。
其中,若在m级蝶形运算中有一个级为j级,j级满足
1≤j<m,
N0×N1×…×Nj≤Nmax
N0×N1×…×Nj+1>Nmax
则所述待存取数据的地址方程为
addr=Nm…Nj+2n'j+1+…+Nmnm-1+nm
其中,addr为待存取数据的地址,m代表蝶形运算的级,Nm为第m级蝶形运算的点数,nm为待存取数据在第m级蝶形运算中的排序。
其中,n’j+1为nj+1的高位比特,>>为右移符号,为对向上取整。
其中,若在m级蝶形运算中有一个级为j级且j级满足
1<j≤m,
Nj…Nm≤Nmax
Nj-1…Nm>Nmax
则所述待存取数据的地址方程为
addr=N'j-1…N2n1+…+N'j-1nj-2+n'j-1
其中,N'j-1为Nj-1的高位比特,n'j-1为nj-1的高位比特。
其中,
其中,N'j-1为nj-1的高位比特,Nj-1为第j-1级蝶形运算的点数,>>为右移符号,Nmax为FFT处理器内的最大基,n’j-1为nj-1的高位比特,nj-1为待存取数据在第j-1级蝶形运算中的排序,Nm为第m级蝶形运算的点数。Nj为第j级蝶形运算的点数。
(三)有益效果
本发明提供的用于FFT处理器的数据无冲突存取方法,与现有技术相比,具有如下优点:
该方法支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,可以充分利用FFT处理器的硬件并行度,从而能够避免在同时存取多个待存取数据时发生数据冲突的问题。
附图说明
图1为本申请的实施例的用于FFT处理器的数据无冲突存取方法的步骤流程示意图;
图2为本申请的实施例的用于FFT处理器的数据无冲突存取方法的位倒序示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实例用于说明本发明,但不用来限制本发明的范围。
如图1所示,图1示意性地显示了该数据无冲突存取方法的步骤流程示意图。该方法包括:
步骤S410,基于数据堆计算公式以获得待存取数据所在的堆。
步骤S420,计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址。
基于存储的FFT处理器的硬件数据用于无线通信系统(4G和WLAN),其并行度为16,可以最多支持同时处理一个基16、两个基8、两个基5、四个基4、四个基3或八个基2蝶形运算。
FFT处理器可以支持8至8192点的2的整数幂FFT运算和12至2400点的非2的整数幂DFT运算(可以用基2、基3、基5完成运算)。该FFT处理器的存储器包含一个或多个存储器组,每个寄存器组包含P个堆。在每一级蝶形运算中,存储器从一个确定的存储器组中读取待存取数据,并将该待存取数据送入处理单元,然后,将处理单元的结果保存到同一个或另一个确定的存储器组中。待存取数据在存储器组中的地址由其所在的堆和其在堆中的地址唯一确定。由此可知,若想确定出待存取数据在存储器组中的地址,则首先应当确定出待存取数据在存储器组中的堆,即,通过步骤S410便可获得。然后,确定出该待存取数据在堆中的地址,即通过步骤S420便可获得。
该方法支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,可以充分利用FFT处理器的硬件并行度,从而能够避免在同时存取多个待存取数据时发生数据冲突的问题。
为优化上述技术方案中的步骤S410,基于FFT处理器的并行度以及FFT处理器内的总点数构建第一平衡方程,所述第一平衡方程为
P=Nmax=2L
其中,P为FFT处理器的并行度,Nmax为FFT处理器内的最大基,L为2的幂指数。
在一个实施例中,将FFT运算的总点数N按照混合基算法分解为m级蝶形运算,每一级蝶形运算的点数为N1,N2……..Nm,待存取数据在每一级蝶形运算中可由n1,n2…….nm来确定,其中,
ni(i=1,2,3·····m)分别代表待存取数据在第i级的蝶形运算中的排序。
为优化上述技术方案中的步骤S410,在上述技术方案的基础上,该数据堆计算公式为
其中,bank为待存取数据在存储器组中的堆,ai(i=1,2,3·····m)为ni或ni的位倒序,modNmax为对Nmax进行取模运算。
ni(i=1,2,...m)的数据位宽为L比特,不满L比特的通过高位补零达到L比特。
需要说明的是,位倒序是将数据按照比特位倒序输出,结果的最高位是位倒序前的最低位,结果的次高位是位倒序的次低位,依次类推。
在一个实施例中,当FFT运算的总点数N按照混合基算法分解为m级蝶形运算时,若m≥2,则至少有一个ai满足
其中,ai(i=1,2,3·····m)为ni的位倒序,ni为待存取数据在每一级蝶形运算中的排序。
在一个实施例中,在计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址的步骤中,当FFT处理器中的总点数N小于等于Nmax时,所述待存取数据在所述堆中的存储地址都相同,即,addr=0。
在一个具体的实施例中,当FFT运算的总点数N小于16时,所述待存取数据在所述堆中的存储地址都相同,即,addr=0。
在另一个实施例中,在计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址的步骤中,当FFT处理器中的总点数N大于Nmax时,所述待存取数据在所述堆中的存储地址有两种选择。
若在m级蝶形运算中有一个级为j级且j级满足
1≤j<m,
N0×N1×…×Nj≤Nmax
N0×N1×…×Nj+1>Nmax
则所述待存取数据的地址方程为
addr=Nm…Nj+2n'j+1+…+Nmnm-1+nm
其中,m代表蝶形运算的级,addr为待存取数据的地址,Nm为第m级蝶形运算的点数,nm代表待存取数据在第m级蝶形运算中排在第nm个数。
在一个具体的实施例中,当FFT处理器中的总点数N大于16时,若在m级蝶形运算中有一个级为j级且j级满足
1≤j<m,
N0…Nj≤16,
N0…Nj+1>16,
其中,n’j+1为nj+1的高位比特,>>为右移符号,为对向上取整。
在第i个阶段的运算中,控制单元需要每次从存储器中存取K个数据,这K个数据组成一个数据块。每个周期控制单元从存储器中读取一个数据块到运算单元,并将运算单元得出的结果数据块存入存储器中。
如果,Ni=16则K=16。每个数据块包含一个基16蝶形的数据。每个数据块有ni=(0,1,…,15)和相同的nk(K不等于i)。
如果Ni≠16,则每个数据块中包含多个蝶形单元的待存取数据。相同的蝶形单元中有ni=(0,1,…,Ni-1),每个数据块中不同的蝶形单元有不同的nj和相同的nk(K不等于i或j)。其中j的取值为
以216点FFT为例。假设
待存取数据的存储公式为:
bank=(n1+n2+n3+n4)mod16,
addr=9n’2+3n3+n4
其中,
n’2=n2>>1,
在数据输入阶段,数据并行度为9,同时输入的数据有相同的n1,n2和n3=(0,1,2),n4=(0,1,2)。
在第一个阶段的运算中,数据块中相同的基8蝶形单元中有n1=(0,1,…,7),不同的基8单元有n2=(0,1)或n2=(2),分别对应同时进行两个或一个基8运算。
在第二个阶段的运算中,数据块中相同的基3蝶形单元中有n2=(0,1,2),不同的基3单元有n1=(0,1,2,3)或n1=(4,5,6,7),对应同时进行四个基3运算。
在第三个阶段的运算中,数据块中相同的基3蝶形单元中有n3=(0,1,2),不同的基3单元有n1=(0,1,2,3)或n1=(4,5,6,7),对应同时进行四个基3运算。
在第四个阶段的运算中,数据块中相同的基3蝶形单元中有n4=(0,1,2),不同的基3单元有n3=(0,1,2),对应同时进行三个基3运算。
在数据输出阶段,数据并行度为8,同时输出的数据有相同的
n2,n3,n4和n1=(0,1,2,3,4,5,6,7)。
若在m级蝶形运算中有一个级为j级且j级满足
1<j≤m,
Nj…Nm≤Nmax
Nj-1…Nm>Nmax
则所述待存取数据的地址方程为
addr=N'j-1…N2n1+…+N'j-1nj-2+n'j-1
其中,N'j-1为Nj-1的高位比特,n'j-1为nj-1的高位比特。
在一个实施例中,
其中,N'j-1为Nj-1的高位比特,Nj-1为第j-1级蝶形运算的点数,>>为右移符号,Nmax为FFT处理器内的总点数,n’j-1为nj-1的高位比特,nj-1为待存取数据在第j-1级蝶形运算中的排序,Nm为第m级蝶形运算的点数。Nj为第j级蝶形运算的点数。
综上所述,该方法支持较大基的单蝶形单元运算和较小基的多蝶形单元运算,可以充分利用FFT处理器的硬件并行度,从而能够避免在同时存取多个待存取数据时发生数据冲突的问题。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种用于FFT处理器的数据无冲突存取方法,其特征在于,包括:
基于数据堆计算公式以获得待存取数据所在的堆;
计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址;
在计算所述待存取数据在所述堆中的地址,从而确定出所述待存取数据在FFT处理器的存储器组中的地址的步骤中,当FFT处理器中的总点数N小于等于Nmax时,所述待存取数据在所述堆中的存储地址都相同,即,addr=0;
当FFT处理器中的总点数N大于Nmax时,所述待存取数据在所述堆中的存储地址有两种选择;
若在m级蝶形运算中有一个级为j级且j级满足
1≤j<m,
N0×N1×…×Nj≤Nmax
N0×N1×…×Nj+1>Nmax
则所述待存取数据的地址方程为
addr=Nm…Nj+2n'j+1+…+Nmnm-1+nm
其中,addr为待存取数据的地址,m代表蝶形运算的级,Nm为第m级蝶形运算的点数,n'j+1为nj+1的高位比特,nm为待存取数据在第m级蝶形运算中的排序。
2.根据权利要求1所述的用于FFT处理器的数据无冲突存取方法,其特征在于,基于FFT处理器的并行度以及FFT处理器内的最大基构建第一平衡方程,所述第一平衡方程为
P=Nmax=2L
其中,P为FFT处理器的并行度,Nmax为FFT处理器内的最大基,L为2的幂指数。
3.根据权利要求2所述的用于FFT处理器的数据无冲突存取方法,其特征在于,将FFT运算的总点数N按照混合基算法分解为m级蝶形运算,每一级蝶形运算的点数为N1,N2........Nm,待存取数据在每一级蝶形运算中可由n1,n2.......nm来确定,其中,
ni分别代表待存取数据在第i级的蝶形运算中的排序,其中,i=1,2,3.......m。
4.根据权利要求3所述的用于FFT处理器的数据无冲突存取方法,其特征在于,所述数据堆计算公式为
其中,bank为待存取数据在存储器组中的堆,ai为ni或ni的位倒序,其中,i=1,2,……m,modNmax为对Nmax进行取模运算。
5.根据权利要求4所述的用于FFT处理器的数据无冲突存取方法,其特征在于,当FFT运算的总点数N按照混合基算法分解为m级蝶形运算时,若m≥2,则至少有一个ai满足
其中,为ni的位倒序,ni为待存取数据在第i级蝶形运算的排序。
6.根据权利要求1所述的用于FFT处理器的数据无冲突存取方法,其特征在于,
其中,n’j+1为nj+1的高位比特,>>为右移符号,为对向上取整。
7.根据权利要求1所述的用于FFT处理器的数据无冲突存取方法,其特征在于,若在m级蝶形运算中有一个级为j级,j级满足
1<j≤m,
Nj…Nm≤Nmax
Nj-1…Nm>Nmax
则所述待存取数据的地址方程为
addr=N'j-1…N2n1+…+N'j-1nj-2+n'j-1
其中,N'j-1为Nj-1的高位比特,n'j-1为nj-1的高位比特。
8.根据权利要求7所述的用于FFT处理器的数据无冲突存取方法,其特征在于,
其中,N'j-1为Nj-1的高位比特,Nj-1为第j-1级蝶形运算的点数,>>为右移符号,Nmax为FFT处理器内的最大基,n'j-1为nj-1的高位比特,nj-1为待存取数据在第j-1级蝶形运算中的排序,Nm为第m级蝶形运算的点数,Nj为第j级蝶形运算的点数。
CN201610755558.XA 2016-08-29 2016-08-29 一种用于fft处理器的数据无冲突存取方法 Expired - Fee Related CN106469134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610755558.XA CN106469134B (zh) 2016-08-29 2016-08-29 一种用于fft处理器的数据无冲突存取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610755558.XA CN106469134B (zh) 2016-08-29 2016-08-29 一种用于fft处理器的数据无冲突存取方法

Publications (2)

Publication Number Publication Date
CN106469134A CN106469134A (zh) 2017-03-01
CN106469134B true CN106469134B (zh) 2019-02-15

Family

ID=58230663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610755558.XA Expired - Fee Related CN106469134B (zh) 2016-08-29 2016-08-29 一种用于fft处理器的数据无冲突存取方法

Country Status (1)

Country Link
CN (1) CN106469134B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112689832A (zh) * 2020-05-28 2021-04-20 深圳市大疆创新科技有限公司 数据处理方法、装置、可移动平台及存储介质
CN113094639B (zh) * 2021-03-15 2022-12-30 Oppo广东移动通信有限公司 一种dft并行处理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339546A (zh) * 2008-08-07 2009-01-07 那微微电子科技(上海)有限公司 地址映射方法和操作数并行的fft处理系统
CN103034621A (zh) * 2012-12-13 2013-04-10 合肥工业大学 基2×k并行fft架构的地址映射方法及系统
WO2014108718A1 (en) * 2013-01-09 2014-07-17 Intel Corporation Continuous-flow conflict-free mixed-radix fast fourier transform in multi-bank memory

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150331634A1 (en) * 2013-01-09 2015-11-19 Sergei I. SALISHCHEV Continuous-flow conflict-free mixed-radix fast fourier transform in multi-bank memory

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339546A (zh) * 2008-08-07 2009-01-07 那微微电子科技(上海)有限公司 地址映射方法和操作数并行的fft处理系统
CN103034621A (zh) * 2012-12-13 2013-04-10 合肥工业大学 基2×k并行fft架构的地址映射方法及系统
WO2014108718A1 (en) * 2013-01-09 2014-07-17 Intel Corporation Continuous-flow conflict-free mixed-radix fast fourier transform in multi-bank memory

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
"802.11n系统中FFT/IFFT处理器的设计与实现";姜鑫;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110315;第2011年卷(第3期);I136-606
"A Generalized Conflict-Free Memory Addressing Scheme for Continuous-Flow Parallel-Processing FFT Processors With Rescheduling";Pei-Yun Tsai等;《IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS》;20111130;第19卷(第12期);第2290-2302页
"A generalized mixed-radix algorithm for memory-based FFT processors";Chen-Fong Hsiao等;《IEEE Transactions on Circuits and Systems II: Express Briefs》;20100131;第57卷(第1期);第26-30页
"A high-throughput radix-16 FFT processor with parallel and normal input/output ordering for IEEE 802.15.3c systems";Shen-Jui Huang等;《IEEE Transactions on Circuits and Systems I: Regular Papers》;20120831;第59卷(第8期);第1752-1765页
"Conflict-free data access for multi-bank memory architectures using padding";Joar Sohl等;《20th Annual International Conference on High Performance Computing》;20131221;第425-432页
"基于无冲突地址生成的高性能FFT处理器设计";王江等;《微电子学与计算机》;20070331;第24卷(第3期);第15-19页
"无存储访问冲突的基2*K并行FFT架构";侯宁等;《微电子学与计算机》;20140731;第31卷(第7期);第93-97页
"高性能FFT处理器的研究与FPGA实现";梁赫西;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120715;第2012年卷(第7期);I137-40

Also Published As

Publication number Publication date
CN106469134A (zh) 2017-03-01

Similar Documents

Publication Publication Date Title
US8422330B2 (en) Memory controller and memory controlling method
US9886418B2 (en) Matrix operands for linear algebra operations
US20150095391A1 (en) Determining a Product Vector for Performing Dynamic Time Warping
Rocki et al. Accelerating 2-opt and 3-opt local search using GPU in the travelling salesman problem
US11275741B2 (en) Merge join system and method
Duan et al. An adaptive treecode for computing nonbonded potential energy in classical molecular systems
CN103955446B (zh) 基于dsp芯片的可变长度fft计算方法
WO2019236479A1 (en) Providing multi-element multi-vector (memv) register file access in vector-processor-based devices
US20160026607A1 (en) Parallelization of scalar operations by vector processors using data-indexed accumulators in vector register files, and related circuits, methods, and computer-readable media
Yamazaki et al. One-sided dense matrix factorizations on a multicore with multiple GPU accelerators
CN106469134B (zh) 一种用于fft处理器的数据无冲突存取方法
US20140330880A1 (en) Methods and devices for multi-granularity parallel fft butterfly computation
KR101696987B1 (ko) Fft/dft의 역순 배열 시스템과 방법 및 그 연산 시스템
He et al. Efficient dense matrix‐vector multiplication on GPU
US20050010627A1 (en) Apparatus, methods, and computer program products for determining the coefficients of a function with decreased latency.
CN101661457A (zh) 多处理器系统的三角线性方程组求解的方法和装置
US20150095390A1 (en) Determining a Product Vector for Performing Dynamic Time Warping
US9268744B2 (en) Parallel bit reversal devices and methods
Li et al. HOM4PS-2.0 para: Parallelization of HOM4PS-2.0 for solving polynomial systems
Misra et al. Parallel mutual information based construction of genome-scale networks on the Intel® Xeon Phi™ Coprocessor
Li et al. SeqMapReduce: software and web service for accelerating sequence mapping
CN104615582B (zh) 面向gpdsp的大点数一维fft向量化计算的方法
Chan et al. Myphi: efficient levenshtein distance computation on xeon phi based architectures
Hongxia et al. High Performance Algorithm for Twiddle Factor of Variable-size FFT Processor and Its Implementation
Tan et al. Parallel particle swarm optimization algorithm based on graphic processing units

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190215

Termination date: 20210829

CF01 Termination of patent right due to non-payment of annual fee