CN103902505A - 一种基于开关网络的可配置fft处理器电路结构 - Google Patents
一种基于开关网络的可配置fft处理器电路结构 Download PDFInfo
- Publication number
- CN103902505A CN103902505A CN201410146046.4A CN201410146046A CN103902505A CN 103902505 A CN103902505 A CN 103902505A CN 201410146046 A CN201410146046 A CN 201410146046A CN 103902505 A CN103902505 A CN 103902505A
- Authority
- CN
- China
- Prior art keywords
- switching network
- processing unit
- data
- read
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Multi Processors (AREA)
Abstract
本发明属于信号处理硬件电路设计领域,具体为一种基于开关网络的可配置FFT处理器电路结构。本发明提出的可配置FFT处理器电路结构主要由控制器、若干个处理单元、开关网络和若干个存储器单元组成。本发明包括混合基蝶形运算单元的电路结构,以实现高效的FFT操作;单周期传输数据的开关网络电路结构,以实现流水线的处理;还包括单周期传输数据的开关网络电路结构等。同时,为了解决多处理单元之间的快速同步问题,本发明还提出了自同步访存方法来实现高效同步。本发明具有很高的可配置性,可以针对不同的FFT应用场合。本发明具有高度的灵活性,可以满足不同FFT大小、高吞吐率、低延时、低功耗等方面的要求。
Description
技术领域
本发明属于信号处理电路设计领域,具体为一种基于开关网络的可配置FFT处理器电路结构设计。
背景技术
近些年来,随着FFT的应用越来越广泛,以及像软件无线电等领域的发展,对FFT处理器的可配置性与灵活性都提出了较高的要求。此外,从集成电路的生产制造成本来说,随着工艺的不断演进,相同面积的流片成本不断增加,同时面向不同领域设计不同的芯片会带来较大的人力以及财力开销,而设计出一款可配置的芯片来尽量满足不同的应用场合,可以较好的实现小的开销。所以高度可配置的FFT处理器也是目前的需求与挑战。对于一些MIMO系统,多路的FFT并发运算也对FFT处理器提出了更高的要求。传统的芯片只能同时进行一路的FFT处理,多路的话需要进行时分复用工作,这样会大大降低效率。于此同时,在一些通信应用中对延时比较敏感,所以对FFT处理器的低延时特性也提出了要求。传统的低延时FFT处理器一般采用流水线的结构,然后其主要的问题是灵活性太差,很难满足不同的协议需求。一般传统的FFT处理器设计主要有基于存储器的设计和流水线设计,如图1所示。对于基于存储器的设计,由于其仅具有一个运算单元,虽然其灵活性较好,但是很难实现较高的吞吐率。而流水线FFT设计,由于其具有多个运算单元,并且可以流水线工作,所以其可以实现很高的吞吐率,但是其问题在于数据路径过于专用化,灵活性很差。因此,有必要设计一种高度可配置与灵活性的FFT处理器。
发明内容
本发明的目的在于提供一种灵活性强、吞吐率高的基于开关网络的可配置FFT处理器电路结构,基于其可配性型与灵活性,能够用于较多的应用场合,并且可以满足相应的性能需求。
本发明所提供的基于开关网络的可配置FFT处理器电路结构,其电路结构主要由控制器、若干个处理单元、开关网络和若干个存储器单元组成。如图2所示。
所述控制器用于通过发送指令来配置各个处理单元的功能,其可以由简单的状态机来实现,也可以由一个通用处理器来实现;所述处理单元作为实现FFT计算与控制的处理电路,其需要根据控制器发过来的相应指令来配置相应蝶形运算但单元的功能,并且处理一些开关网络的协议封包和解包操作;所述开关网络为处理单元与存储器单元之间通信的桥梁,可以实现任意处理单元对任意存储器单元的访问,主要负责数据包的解析与路由,并且可以实现单周期高速的数据连续传输;所述存储器单元为可以实现向量读取与写入等复杂功能的存储器模块;其需要根据处理单元发过来的读写数据的指令,连续地产生相应满足FFT运算的读写地址,并把读出来的数据经过封包后送到开关网络,或者把需要写的数据写入相应的存储单元中;其中:
所述处理单元主要由指令缓冲队列、处理单元控制器和混合基蝶形运算单元构成;其中:
所述控制器向处理单元发出的64比特指令,该指令通过指令缓冲队列的写端口进行指令写入;处理单元控制器根据指令缓冲队列中的指令进行相应的操作;其中:
首先,处理单元控制器通过控制一个复用器的选通将存储器读取指令包送到开关网络接口;
然后,处理单元控制器接收到开关网络发来的数据包后,发出用于混合基蝶形运算单元的旋转因子控制信号、混合基选择信号和流水线暂停信号;混合基蝶形运算单元根据处理单元控制器发来的信号,对开关网络的输入数据进行运算,并将结果通过所述复用器送到开关网络的输入接口。如图3所示。
所述混合基蝶形运算单元可以进行一次基4蝶形运算或者同时进行2次基2蝶形运算;其主要由旋转因子产生电路、蝶形单元、复数乘法器以及若干个寄存器组成,从而实现了流水线高性能的运算单元;所述流水线暂停信号直接控制所有的寄存器实现流水线暂停;其他数据以及控制信号首先会在输入时经过寄存器寄存;经过寄存的旋转因子控制信号会送给三路旋转因子产生电路用于产生在下一拍需要使用的旋转因子;经过寄存的4个复数数据输入在混合基选择信号的控制下经过可配置的蝶形运算单元实现一次基4的运算或者两次基2的运算;在第一级产生的蝶形运算结果以及三个旋转因子将经过中间的一级寄存器进行寄存;在流水线第二级中,如果混合基选择信号为两个基2的运算,那么第一级计算的结果将直接送到输出寄存器寄存输出,否则通过复数乘法器与相应的旋转因子相乘后再送到输出寄存器寄存输出;如图4所示。
所述开关网络主要由两个完全相同的但方向相反的单向通信通路构成,如图8所示;
所述单向通信通路主要由输入/输出FIFO、请求器、仲裁器和复用器构成;如图7所示;其中:
所述输入/输出FIFO用于实现用开关网络的输入/输出缓冲队列,其中处理单元与存储单元将开关网络的输入FIFO接口作为开关网络的写接口,将开关网络的输出FIFO接口作为开关网络的读端口;
所述请求器用于对在输入FIFO的数据包包头进行解析,并且根据包头的信息区对相应的输出端口的仲裁器进行请求;请求器会连接到输出端口所有的仲裁器,输出端口的仲裁器也会接收所有输入端口的请求信号;
所述仲裁器用于对多个输入请求进行仲裁,并对相应的请求器进行应答;
开关网络中,所述请求器会将请求信号和源标号发给多个仲裁器,同时仲裁器也会将应答信号反馈给各个请求器。
本发明中,所述存储器单元主要由四个双端口存储器、In-Place策略逻辑、读地址产生单元、写地址产生单元和存储器控制器构成;存储器控制器接收开关网络发过来的数据包,并根据数据包的信息将配置信息发给读地址产生单元和写地址产生单元;读写地址产生单元分写要产生四个数的存储地址并送给In-Place策略逻辑;In-Place策略逻辑根据四个读写地址,产生相应的块(Bank)选择地址并送给四个双端口存储器;开关网络的数据输出也经过In-Place策略逻辑送给四个双端口存储器;四个双端口存储器的读端口经过相应的In-Place策略逻辑输出128比特信息到选通的复用器并送到开关网络接口;存储控制器会控制复用器选择存储器的输出数据还是存储器控制器发出的数据包头;如图5所示;
所述双端口存储器为FFT数据的物理存储单元;所述In-Place策略逻辑用于避免Bank间的访存冲突;所述读地址产生单元会根据读指令中的信息进行相应的向量读取地址产生,来实现满足运算顺序的连续数据读取;所述写地址产生单元也同样会根据写指令中的信息连续地产生相应的满足写顺序的地址;所述存储器控制器用于对存储器指令进行解析,并根据信息对读写地址产生单元进行配置,同时存储器控制还负责数据的封包解包操作。
本发明中,若干个处理单元间的可实现快速同,即通过一个处理单元为其他处理单元发起输出的读请求;当一个处理单元处理完一批数据后,直接为下一个处理单元发起读数据请求,存储器单元将读出来的数据直接通过开关网络传输给下一个处理单元。
这样,下一个处理单元可以在前一个处理单元运算完后就立即拿到数据,并且可以避免下一个处理单元读到还没有写完的数据,从而实现了多处理单元之间的高效同步,并且保证了数据读取的正确性。其访存示意如图10所示。
本发明还提出了一种用于减少访存开销的FFT批处理方式。该方法可以在一次访存开销下,通过完成FFT的后面一些级的操作,来实现多个小FFT的批量计算操作,如图9所示,通过执行32点FFT的第二级和第三级可以批量地实现4个8点独立的FFT运算。对于独立地去做4个8点FFT运算,需要发出4次访存请求,带来4次访存开销。而通过设置蝶形运算的起始级为32点FFT的第二级,只需要通过一次访存请求就可以进行4个8点FFT的第一级计算,从而可以减少FFT运算中的平均访存开销。尤其是对于小点数的FFT操作,该方法可以大大提高吞吐率。其执行时间比较可以见图11。
表1为处理单元指令说明。
表1
。
附图说明
图1为经典的FFT处理器结构。
图2为基于开关网络的可配置FFT处理器结构。
图3为处理单元电路结构。
图4为混合基蝶形运算单元电路结构。
图5为存储器单元电路结构。
图6为FIFO快速数据传递示意图。
图7为单向开关网络电路结构。
图8为双向开关网路电路结构。
图9为32点FFT示例。
图10为自同步访存方法。
图11为简单模式与批处理模式运算时间对比图。
图12为开关网络接口协议。
图13为处理单元指令定义。
图14为包含路由器包头的存储器访存指令定义。
图15为多种工作模式示意图。
具体实施方式
本发明提出的基于开关网络的可配置FFT处理器电路结构,主要由控制器、若干处理单元、开关网络以及若干存储器单元组成。详见图2。
控制器用于通过发送指令来配置各个处理单元的功能,其可以由简单的状态机来实现,也可以由一个通用处理器来实现。控制器的作用使用对PE发出相应的指令执行功能配置,其中PE指令采用64比特的格式,其指令字段定义如图13所示,其字段说明详见表1。指令主要由4种,分别为单级蝶形操作指令、多级蝶形操作指令、单个自动同步流水线FFT运算指令、连续自动同步流水线FFT运算指令。
处理单元作为实现FFT计算与控制的处理电路,其需要根据控制器发过来的相应指令来配置相应蝶形运算但单元的功能,并且处理一些开关网络的协议封包和解包操作。其主要由指令缓冲队列、处理单元控制器、以及混合基蝶形运算单元构成。详见图3所示。其中,混合基运算单元可以进行一次基4蝶形运算或者同时进行2次基2蝶形运算。其主要由旋转因子产生电路、蝶形单元、复数乘法器以及一些寄存器构成的流水线高性能运算单元。详见图4。由于这里可以实现基4或者2个基2的操作,所以数据路径的位宽为4个复数的位宽,这里由于复数的实数部分和虚数部分分别采用16比特来表示,所以数据路径的宽度为128比特。
开关网络为处理单元与存储器单元之间通信的桥梁,可以实现任意处理单元对任意存储器单元的访问,主要负责数据包的解析与路由,并且可以实现单周期高速的数据连续传输。首先,为了实现单周期的数据传输,我们可以参考图6所示的电路。其中控制信号都为高电平有效,那么当前一个FIFO不空且后一个FIFO不满的时候,就可以将前一个FIFO的读使能和后一个FIFO的写使能同时置位,从而实现数据从前一个FIFO到后一个FIFO的数据传输。这样,如果前面的FIFO一直不空,后面的FIFO一直不满,那么就可以实现单周期的数传输。为了实现开关网络的路由功能,需要通过请求器和应答器来建立上述的快速通信通路。这里单向的开关网络主要由输入输出FIFO、请求器与仲裁器构成,如图7所示。请求器用于对在输入FIFO的数据包包头进行解析,并且根据包头的信息区对相应的输出端口的仲裁器进行请求。仲裁器用于对多个输入请求进行仲裁,并对相应的请求器进行应答。为了实现双向的数据通路,需要用两个图7所示的电路进行反向组合即可,其简化的结构如图8所示。开关网络的数据包格式如图12所示。为了配合蝶形运算单元,网络的位宽也为128位。其中数据包的包头低40位用于网络的路由功能。其中,返回处理单元标号用于支持快速同步方法。当返回处理单元标号和源处理单元标号相同时,则是普通的为自己进行访存的操作,否则实现为其他处理单元发出访存请求的功能。
存储器单元为可以实现向量读取与写入等复杂功能的存储器模块。其需要根据处理单元发过来的读写数据的指令,连续地产生相应满足FFT运算的读写地址,并把读出来的数据经过封包后送到开关网络,或者把需要写的数据写入相应的存储单元中。其主要由四个双端口存储器、In-Place策略逻辑、读地址产生单元、写地址产生单元、存储器控制器构成,如图5所示。双端口存储器为FFT数据的物理存储单元。In-Place策略逻辑用于避免Bank间的访存冲突。读地址产生单元会根据读指令中的信息进行相应的向量读取地址产生,来实现满足运算顺序的连续数据读取。写地址产生单元也同样会根据写指令中的信息连续地产生相应的满足写顺序的地址。存储器控制器用于对存储器指令进行解析,并根据信息对读写地址产生单元进行配置。同时存储器控制还负责数据的封包解包操作。存储器单元的读写指令格式如图14所示,其中也包含了用于开关网络路由的数据包头。其中读写标志位用于标明操作类型。起始地址和蝶形运算组数,以及组内偏移用于配置读写地址产生单元来产生符合FFT读写顺序的数据地址。
本发明还提出了一种用于多处理单元间的快速同步方法。该方法可以通过一个处理单元为其他处理单元发起输出的读请求。这样,当一个处理单元处理完一批数据后,可以直接为下一个处理单元发起读数据请求,这样存储器单元会直接将读出来的输出直接通过开关网络送给下一个处理单元。从而实现了下一个处理单元可以再前一个处理单元运算完后就立即拿到数据,并且可以避免下一个处理单元读到还没有写完的数据,从而实现了多处理单元之间的高效同步,并且保证了数据读取的正确性。其访存示意如图10所示。对于普通模式,处理单元1为自己进行读操作的请求。而当用于处理单元间同步时,其可以为处理单元2进行读操作的请求。其只要在发送读操作数据包的时候,设置返回处理单元标号为2即可。
本发明还提出了一种用于减少访存开销的FFT批处理方式。该方法可以在一次访存开销下,通过完成FFT的后面一些级的操作,来实现多个小FFT的批量计算操作,如图9所示,通过执行32点FFT的第二级和第三级可以批量地实现4个8点独立的FFT运算,从而可以减少FFT运算中的平均访存开销。尤其是对于小点数的FFT操作,该方法可以大大提高吞吐率。其执行时间比较可以见图11,可见其访存的开销被多个批处理的FFT平均了。
本发明提出的基于开关网络的可配置FFT处理器电路结构具有很好的灵活性。可以工作在多种模式,如图15所示。其中左上角为多并行多路模式,每一路的操作和基于存储器FFT的操作类似。左下角为流水线FFT模式,对于单路的FFT操作可以实现较高的吞吐率。右上角工作在双通道流水线模式,相当于是前两种模式的折衷。右下角工作在低功耗模式,可以将其他的处理单元和存储单元关闭,来以低性能实现低功耗。可以发现本发明具有很好的灵活性,可以使用与各种场合。
Claims (4)
1. 一种基于开关网络的可配置FFT处理器电路结构,其特征在于主要由控制器、若干个处理单元、开关网络和若干个存储器单元组成;
所述控制器通过发送指令来配置各个处理单元的功能,由状态机来实现,或由一个通用处理器来实现;所述处理单元作为实现FFT计算与控制的处理电路,根据控制器发过来的相应指令来配置相应蝶形运算单元的功能,并且处理一些开关网络的协议封包和解包操作;所述开关网络为处理单元与存储器单元之间通信的桥梁,用于实现任意处理单元对任意存储器单元的访问,主要负责数据包的解析与路由,并且实现单周期高速的数据连续传输;所述存储器单元为可以实现向量读取与写入功能的存储器模块,其根据处理单元发过来的读写数据的指令,连续地产生相应满足FFT运算的读写地址,并把读出来的数据经过封包后送到开关网络,或者把需要写的数据写入相应的存储单元中;其中:
所述处理单元主要由指令缓冲队列、处理单元控制器和混合基蝶形运算单元构成;其中:
所述控制器向处理单元发出64比特指令,该指令通过指令缓冲队列的写端口进行指令写入;处理单元控制器根据指令缓冲队列中的指令进行相应的操作;其中:
首先,处理单元控制器通过控制一个复用器的选通将存储器读取指令包送到开关网络接口;
然后,处理单元控制器接收到开关网络发来的数据包后,发出用于混合基蝶形运算单元的旋转因子控制信号、混合基选择信号和流水线暂停信号;
混合基蝶形运算单元根据处理单元控制器发来的信号,对开关网络的输入数据进行运算,并将结果通过所述复用器送到开关网络的输入接口;
所述开关网络主要由两个完全相同的但方向相反的单向通信通路构成;
所述单向通信通路主要由输入/输出FIFO、请求器、仲裁器和复用器构成;其中:
所述输入/输出FIFO用于实现用开关网络的输入/输出缓冲队列,其中处理单元与存储单元将开关网络的输入FIFO接口作为开关网络的写接口,将开关网络的输出FIFO接口作为开关网络的读端口;
所述请求器用于对在输入FIFO的数据包包头进行解析,并且根据包头的信息区对相应的输出端口的仲裁器进行请求;请求器会连接到输出端口所有的仲裁器,输出端口的仲裁器也会接收所有输入端口的请求信号;
所述仲裁器用于对多个输入请求进行仲裁,并对相应的请求器进行应答;
开关网络中,所述请求器将请求信号和源标号发给多个仲裁器,同时仲裁器将应答信号反馈给各个请求器。
2. 如权利要求1所述的基于开关网络的可配置FFT处理器电路结构,其特征在于所述存储器单元主要由四个双端口存储器、In-Place策略逻辑、读地址产生单元、写地址产生单元和存储器控制器构成;存储器控制器接收开关网络发过来的数据包,并根据数据包的信息将配置信息发给读地址产生单元和写地址产生单元;读写地址产生单元分写别要产生四个数的存储地址并送给In-Place策略逻辑;In-Place策略逻辑根据四个读写地址,产生相应的块(Bank)选择地址并送给四个双端口存储器;开关网络的数据输出也经过In-Place策略逻辑送给四个双端口存储器;四个双端口存储器的读端口经过相应的In-Place策略逻辑输出128比特信息到选通的复用器并送到开关网络接口;存储控制器会控制复用器选择存储器的输出数据还是存储器控制器发出的数据包头;所述双端口存储器为FFT数据的物理存储单元;所述In-Place策略逻辑用于避免Bank间的访存冲突;所述读地址产生单元会根据读指令中的信息进行相应的向量读取地址产生,来实现满足运算顺序的连续数据读取;所述写地址产生单元也同样会根据写指令中的信息连续地产生相应的满足写顺序的地址;所述存储器控制器用于对存储器指令进行解析,并根据信息对读写地址产生单元进行配置,同时存储器控制还负责数据的封包解包操作。
3. 如权利要求1所述的基于开关网络的可配置FFT处理器电路结构,其特征在于所述混合基蝶形运算单元可以进行一次基4蝶形运算或者同时进行2次基2蝶形运算;其主要由旋转因子产生电路、蝶形单元、复数乘法器以及若干个寄存器组成,从而实现了流水线高性能的运算单元;所述流水线暂停信号直接控制所有的寄存器实现流水线暂停;其他数据以及控制信号首先会在输入时经过寄存器寄存;经过寄存的旋转因子控制信号会送给三路旋转因子产生电路用于产生在下一拍需要使用的旋转因子;经过寄存的4个复数数据输入在混合基选择信号的控制下经过可配置的蝶形运算单元实现一次基4的运算或者两次基2的运算;在第一级产生的蝶形运算结果以及三个旋转因子将经过中间的一级寄存器进行寄存;在流水线第二级中,如果混合基选择信号为两个基2的运算,那么第一级计算的结果将直接送到输出寄存器寄存输出,否则通过复数乘法器与相应的旋转因子相乘后再送到输出寄存器寄存输出。
4. 如权利要求1所述的基于开关网络的可配置FFT处理器电路结构,其特征在于若干个处理单元工作于流水线模式时,各处理单元间可实现快速同步:
通过一个处理单元为其他处理单元发起输出的读请求;当一个处理单元处理完一批数据后,直接为下一个处理单元发起读数据请求,存储器单元将读出来的数据直接通过开关网络传输给下一个处理单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410146046.4A CN103902505A (zh) | 2014-04-12 | 2014-04-12 | 一种基于开关网络的可配置fft处理器电路结构 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410146046.4A CN103902505A (zh) | 2014-04-12 | 2014-04-12 | 一种基于开关网络的可配置fft处理器电路结构 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103902505A true CN103902505A (zh) | 2014-07-02 |
Family
ID=50993835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410146046.4A Pending CN103902505A (zh) | 2014-04-12 | 2014-04-12 | 一种基于开关网络的可配置fft处理器电路结构 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103902505A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718423A (zh) * | 2016-01-19 | 2016-06-29 | 清华大学 | 一种流水可重构的单精度浮点fft/ifft协处理器 |
CN107844451A (zh) * | 2017-10-23 | 2018-03-27 | 复旦大学 | 一种级联板间流水线的“蝶式”传输方法 |
CN111343106A (zh) * | 2020-02-25 | 2020-06-26 | 母国标 | 多路中频数字信号处理装置和方法 |
CN112419140A (zh) * | 2020-12-02 | 2021-02-26 | 海光信息技术股份有限公司 | 数据处理装置、数据处理方法及电子设备 |
CN112765536A (zh) * | 2021-01-26 | 2021-05-07 | 中国科学院半导体研究所 | 一种可配置的fft架构系统 |
CN113438171A (zh) * | 2021-05-08 | 2021-09-24 | 清华大学 | 一种低功耗存算一体系统的多芯片连接方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226543A (zh) * | 2013-04-26 | 2013-07-31 | 中国科学院微电子研究所 | 一种流水线结构的fft处理器 |
CN103699516A (zh) * | 2014-01-13 | 2014-04-02 | 中国人民解放军国防科学技术大学 | 向量处理器中基于simd的并行fft/ifft蝶形运算方法及装置 |
CN103699517A (zh) * | 2014-01-17 | 2014-04-02 | 合肥工业大学 | 一种1-d/2-d混合架构fft处理器 |
-
2014
- 2014-04-12 CN CN201410146046.4A patent/CN103902505A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226543A (zh) * | 2013-04-26 | 2013-07-31 | 中国科学院微电子研究所 | 一种流水线结构的fft处理器 |
CN103699516A (zh) * | 2014-01-13 | 2014-04-02 | 中国人民解放军国防科学技术大学 | 向量处理器中基于simd的并行fft/ifft蝶形运算方法及装置 |
CN103699517A (zh) * | 2014-01-17 | 2014-04-02 | 合肥工业大学 | 一种1-d/2-d混合架构fft处理器 |
Non-Patent Citations (2)
Title |
---|
RENFENG DOU等: "design of a high throughput configurable vaiable-length FFT processor based on swich network architecture", 《ASIC(ASICON),2013 IEEE 10TH INTERNATIONAL CONFERENCE》 * |
翁新钎等: "a parallel implementation and performance evaluation of skein tree hashing", 《复旦大学学报(自然科学版)》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718423A (zh) * | 2016-01-19 | 2016-06-29 | 清华大学 | 一种流水可重构的单精度浮点fft/ifft协处理器 |
WO2017125023A1 (zh) * | 2016-01-19 | 2017-07-27 | 清华大学 | 一种流水可重构的单精度浮点fft/ifft协处理器 |
CN107844451A (zh) * | 2017-10-23 | 2018-03-27 | 复旦大学 | 一种级联板间流水线的“蝶式”传输方法 |
CN107844451B (zh) * | 2017-10-23 | 2020-11-20 | 复旦大学 | 一种级联板间流水线的“蝶式”传输方法 |
CN111343106A (zh) * | 2020-02-25 | 2020-06-26 | 母国标 | 多路中频数字信号处理装置和方法 |
CN111343106B (zh) * | 2020-02-25 | 2023-03-24 | 母国标 | 多路中频数字信号处理装置和方法 |
CN112419140A (zh) * | 2020-12-02 | 2021-02-26 | 海光信息技术股份有限公司 | 数据处理装置、数据处理方法及电子设备 |
CN112419140B (zh) * | 2020-12-02 | 2024-01-23 | 海光信息技术股份有限公司 | 数据处理装置、数据处理方法及电子设备 |
CN112765536A (zh) * | 2021-01-26 | 2021-05-07 | 中国科学院半导体研究所 | 一种可配置的fft架构系统 |
CN112765536B (zh) * | 2021-01-26 | 2023-09-19 | 中国科学院半导体研究所 | 一种可配置的fft架构系统 |
CN113438171A (zh) * | 2021-05-08 | 2021-09-24 | 清华大学 | 一种低功耗存算一体系统的多芯片连接方法 |
CN113438171B (zh) * | 2021-05-08 | 2022-11-15 | 清华大学 | 一种低功耗存算一体系统的多芯片连接方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103902505A (zh) | 一种基于开关网络的可配置fft处理器电路结构 | |
US10027433B2 (en) | Multiple clock domains in NoC | |
US9569579B1 (en) | Automatic pipelining of NoC channels to meet timing and/or performance | |
US9294354B2 (en) | Using multiple traffic profiles to design a network on chip | |
US9825809B2 (en) | Dynamically configuring store-and-forward channels and cut-through channels in a network-on-chip | |
US8769458B2 (en) | Prototype verification system and verification method for high-end fault-tolerant computer | |
CN102685017A (zh) | 一种基于fpga的片上网络路由器 | |
WO2014059024A1 (en) | Heterogeneous channel capacities in an interconnect | |
CN110995598B (zh) | 一种变长报文数据处理方法和调度装置 | |
US10523599B2 (en) | Buffer sizing of a NoC through machine learning | |
CN103530245A (zh) | 一种基于fpga的srio互联交换装置 | |
US20180227215A1 (en) | Systems and Methods for NoC Construction | |
US20230132724A1 (en) | Broadcast adapters in a network-on-chip | |
CN107391422A (zh) | 多路异步串行通讯数据访问系统及方法 | |
Marcon et al. | Tiny NoC: A 3D mesh topology with router channel optimization for area and latency minimization | |
CN104035896B (zh) | 一种适用于2.5d多核系统的融合存储器的片外加速器 | |
CN102308538B (zh) | 报文处理方法及装置 | |
US9864728B2 (en) | Automatic generation of physically aware aggregation/distribution networks | |
CN105550157A (zh) | 一种分形树结构通信结构、方法、控制装置及智能芯片 | |
Ju et al. | NoC research and practice: Design and implementation of 2× 4 2D-torus topology | |
CN114760241B (zh) | 一种用于数据流架构的计算设备中的路由方法 | |
Hsu et al. | Design of a dual-mode noc router integrated with network interface for amba-based ips | |
CN114844757B (zh) | 一种面向分布式并行运算类算法的片上网络设计方法 | |
Valuskar et al. | Analysis of Mesh Topology of NoC for Blocking and Non-blocking Techniques | |
Toyohara et al. | Distributed MQTT Brokers Infrastructure with Network Transparent Hardware Broker |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140702 |
|
WD01 | Invention patent application deemed withdrawn after publication |