CN103226464A - 一种归并排序结构 - Google Patents

一种归并排序结构 Download PDF

Info

Publication number
CN103226464A
CN103226464A CN2013101064877A CN201310106487A CN103226464A CN 103226464 A CN103226464 A CN 103226464A CN 2013101064877 A CN2013101064877 A CN 2013101064877A CN 201310106487 A CN201310106487 A CN 201310106487A CN 103226464 A CN103226464 A CN 103226464A
Authority
CN
China
Prior art keywords
fifo
subcontrol
team
merger
formation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013101064877A
Other languages
English (en)
Inventor
柴志雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU COMPLEX CORE IOT TECHNOLOGY Co Ltd
Original Assignee
JIANGSU COMPLEX CORE IOT TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU COMPLEX CORE IOT TECHNOLOGY Co Ltd filed Critical JIANGSU COMPLEX CORE IOT TECHNOLOGY Co Ltd
Priority to CN2013101064877A priority Critical patent/CN103226464A/zh
Publication of CN103226464A publication Critical patent/CN103226464A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)

Abstract

本发明涉及排序算法领域,具体为一种归并排序结构,其利用FPGA结构实现归并排序的操作,实现资源和效率的最大化,能够完全满足对于高清实时图片的特征点排序的要求,且时间复杂度优于基于PC操作的归并排序,其包括归并组件,所述归并组件包括存储的队列,所述队列连接比较器和辅助控制器,所述辅助控制器上设置有计数所述队列出队或入队操作的计数器。

Description

一种归并排序结构
技术领域
本发明涉及排序算法领域,具体为一种归并排序结构。
背景技术
排序算法在科学技术领域已经有了极其详尽的研究,已有许多成熟的排序算法,近年来,在不同的应用下也提出了多种基于FPGA的排序方法,根据应用的不同,基于FPGA的排序一般分为两类:基于网络的排序和基于线性数组的排序。
基于网络的排序一般使用两输入的交换比较器来排序,Zhang, Y.采用了固定大小的排序网络,分为输入队列,乒乓排序网络,和输出检测模块。Martinez et al. 提出了应用在块排序压缩上的网络排序算法,采用了乒乓操作,实现数据循环处理,排序单元处理128个字符,最终的结果显示可达到的最大时钟频率为50MHZ左右。基于线性数组的排序基于可扩展的线性数组,Paraham,Kwai采用比较/插入单元,每个单元包含比较器,乘法器和控制单元,可扩展线性数组包含一系列的单元。K. Ratnayake 和A. Amer提出了计数排序算法,不过他们是在BRAMS上实现排序算法,较为复杂,M. Edahiro在EDK的开发环境下实现了并行的排序算法。
纵观以上排序算法,有的是针对特殊应用的排序,有的在对有限的数据排序的时候,资源利用率较高的同时,最大时钟频率很低,无法满足对于高清实时图片的特征点排序的要求。
归并排序是建立在归并操作上的一种有效排序算法,归并操作是将两个或两个以上有序队列合并成一组新的有序表,举例如下,若已知两组有序队列分别为1,3,5和2,4,6,见图1所示,两路归并操作,A,B分别为排完序的有序队列,C为A,B的归并结果,其归并步骤如下:
1、分别取A,B的队头,设a,b,比较a,b两者的大小;(比较操作)
2、a,b中较大者出队,放入缓存tmp中;(出队操作)
3、tmp压入C的队尾;(入队操作)
重复步骤1-3直到A,B中一个为空,执行步骤4;
4、A/B为空,将B/A队头放入tmp中;(出队操作)
5、将tmp压入C的队尾;(入队操作)
重复步骤5-6,直到A,B两者都为空。
一种基于归并操作的归并排序,设待排序的数列为D[n],数列的长度为N,其归并步骤如下所述:将D[n]分为N个已排完序的长度为1的队列,两两之间运行用归并操作,合并成floor[n/2]个两两有序的队列,循环进行之,两两之间进行归并操作,直到最后合并成一个N有序的队列,举例见图2所示,数列为1,3,5,2,4,6,对其进行归并排序,步骤如下
1、将队列中1和3,5和2,4和6进行归并操作得到3个队列3,1和5,2及6,4;
2、将队列3,1和5,2记性归并操作得到队列5,3,2,1;
3、将队列5,3,2,1与队列6,4进行归并操作得到有序队列6,5,4,3,2,1。
以上归并排序的是基于PC操作,其算法比较简单,适用于多种队列的排序,归并排序效率高且稳定,但是比较占用内存,其时间复杂度为O(Nlog(N)),空间负责度是O(N)。
发明内容
为了解决上述问题,本发明提供了一种归并排序结构,其利用FPGA结构实现归并排序的操作,实现资源和效率的最大化,能够完全满足对于高清实时图片的特征点排序的要求,且时间复杂度优于基于PC操作的归并排序。
其技术方案是这样的:一种归并排序结构,其特征在于,其包括归并组件,所述归并组件包括存储的队列,所述队列连接比较器和辅助控制器,所述辅助控制器上设置有计数所述队列出队或入队操作的计数器。
其进一步特征在于,所述存储的队列包括两个队列寄存器,两个所述队列寄存器连接所述比较器,两个所述队列寄存器分别连接所述辅助控制器;所述比较器采用上升沿触发;所述辅助控制器设置有计数每个所述队列寄存器的出队或入队的计数器。
其进一步特征在于,所述存储的队列包括两个FIFO,所述辅助控制器包括时序逻辑辅助控制器和组合逻辑辅助控制器,所述时序逻辑辅助控制器和所述组合逻辑辅助控制器分别连接所述FIFO,所述FIFO分别设置有FIFOIN和FIFOOUT端口,所述其中一个FIFO的FIFOOUT端口连接所述另一个FIFO的FIFOIN端口,读信号口、写信号口分别连接所述FIFO;所述FIFO的FIFOOUT端口分别连接比较器,所述时序逻辑辅助控制器设置有计数所述每个所述FIFO出队或入队操作的计数器;
所述读信号口和所述比较器通过与门分别连接所述FIFO,通过所述比较器分别处理得到额外读信号与所述读信号口读信号共同控制每个所述FIFO的读操作。
其更进一步特征在于,所述归并组件包括两个及两个以上,每个所述归并组件中的所述辅助控制器上还设置有所述归并组件的输入输出切换的组计数器;相邻的两个所述归并组件的输出可以作为下一所述归并组件的输入。
采用本发明的结构后,其利用FPGA结构中的存储的队列、比较器、辅助控制来实现归并排序的操作,且其归并排序的空间复杂度是                                                
Figure 2013101064877100002DEST_PATH_IMAGE002
,优于基于PC操作的归并排序的时间复杂度
Figure 722164DEST_PATH_IMAGE004
,结构简单,且操作稳定,实现资源和效率的最大化,能够完全满足对于高清实时图片的特征点排序的要求。
附图说明
图1为归并操作示意图;
图2为基于归并操作的归并排序示意图;
图3为基于寄存器归并操作示意图;
图4为基于FIFO的归并操作示意图。
具体实施方式
见图3所示,为基于寄存器的归并操作,其硬件结构:存储的队列包括两个队列寄存器,两个队列寄存器连接比较器,两个队列寄存器分别连接辅助控制器,比较器采用上升沿触发,辅助控制器设置有计数每个队列寄存器的出队或入队的计数器;队列:队列长度为N:N个寄存器D1, D2… DN, 其中D1为队头,DN为队尾;比较器:排序的数据位n位,采用n位的比较器,由上升沿触发;辅助控制器:每个队列有一个标记位FLAG,用一个标记位FLAG来计数,初始为0,入队时标记加一,出队时标记减一,一组队列(两个)有一个组标记位BUFFFLAG,用来判断归并组件之间的输入输出切换,实现多组归并组件的乒乓操作。
需要排列的数据分别输入到两个队列寄存器中,队列寄存器每进入一个数据,通过计数器对标记位FLAG加一,直到所有数据都进入到两个队列寄存器中,然后分别从两个队列寄存器的队头取出数据,通过比较器进行比较,将比较结果输出,同时队列寄存器每取出一个数据,通过计数器对标记位FLAG减一,重复以上操作,直到一个队列寄存器中的数据全部取出,即标记位FLAG为0时,将另一个队列寄存器中的数据依次输出,完成排序。
行为描述:(以下操作均为一个时间周期内,由上升沿触发)
队列行为:
(1)出队操作,OUT<=D1;D1<=D2; D2<=D3;… D(N-1)<=DN;
(2)入队操作,D1<=D2;D2<=D3;…D(N-1)<=DN;DN<=IN;
(3)判断队列是否为空,FLAG为0时,队列空;FLAG等于N,队列满。
归并输入:
(1)在
Figure 576988DEST_PATH_IMAGE006
时,A依次入队,队列标记位FLAG加一,组标记位BUFFFLAG加一。
(2)在
Figure 356725DEST_PATH_IMAGE008
时,B依次入队,队列标记位FLAG加一,组标记位BUFFFLAG加一。
归并输出:
(1)在A, B非空时(即A_FLAG>0,B_FLAG>0),比较A, B的队头,输出其中较大者,并将其队头出队;将其队列标记位FLAG减一,组标记位BUFFFLAG减一,OUTENABLE为1;
(2)当A, B任一为空时,依次输出另一队列,将其标记位FLAG减一,组标记位BUFFFLAG减一,OUTENABLE为0;直到A, B均为空,OUTENABLE为0。
以上步骤可见基于寄存器的归并操作步骤和经典的PC操作几乎一样,因为在基于寄存器实现的时候,出队,入队,取队头,比较大小都可以在同一个时钟周期内实现,所以可以直接用时序逻辑实现。
见图4所示,为基于FIFO的归并操作,存储的队列包括两个FIFO,辅助控制器包括时序逻辑辅助控制器和组合逻辑辅助控制器,时序逻辑辅助控制器和组合逻辑辅助控制器分别连接FIFO,FIFO分别设置有FIFOIN和FIFOOUT端口,其中一个FIFO的FIFOOUT端口连接另一个FIFO的FIFOIN端口,读信号口、写信号口分别连接FIFO;FIFO的FIFOOUT端口分别连接比较器,时序逻辑辅助控制器设置有计数每个FIFO出队或入队操作的计数器;读信号口和比较器通过与门分别连接FIFO,通过比较器分别处理得到额外读信号与读信号口读信号共同控制每个FIFO的读操作。
当基于FIFO实现的时候,入队,出队要依靠W,R信号位来控制,当一个上升沿后设置R=1,等一个时钟周期才能获得FIFO队头数据,若比较器用时序逻辑实现,则需要再等一个时钟周期之后,才能比较两个队头数据,那么数据的输出比输入多一倍的时钟周期,无法组合成乒乓操作和并行的多层次结构,所以将FIFO的控制用时序逻辑实现,而将比较器用组合逻辑实现,从而实现输入,输出的时钟周期数相等。
写信号设置为1,数据输入,由于A_FIFO的FIFOOUT与B_FIFO的FIFOIN
连接,数据一次输入后,每个FIFO进入一个数据,标记位FLAG加一,取出一个,标记位FLAG减一,直到数据全部输入,分别取两个FIFO的FIFOOUT中的数据进行比较,将比较结果输出,同时,根据比较结果输出一个额外读信号与读信号口的读信号通过与门控制下组数据的读信号,同时FIFO每取出一个数据,通过计数器对标记位FLAG减一,重复以上操作,直到一个FIFO中的数据全部取出,即标记位FLAG为0时,将另一个FIFO的数据依次输出,完成排序。
硬件结构:
     队列:FIFO队列。FIFO长度为 
Figure 188153DEST_PATH_IMAGE010
(大于等于N) ,有数据输入端口FIFOIN、输出端口FIFOOUT,和读信号W,写信号R,以及空满信号。
   比较器:排序的数据位n位,采用n位的比较器,采用组合逻辑实现。
时序逻辑辅助控制器:每个FIFO有一个读信号R,写信号W,用一个标记位FLAG来计数,初始为0,W=1,入队时标记位FLAG加一,R=1,出队时标记位FLAG减一;一组队列(两个)有一个组标记位BUFFFLAG,用来判断组件的输入输出切换,实现多组的乒乓操作。
组合逻辑辅助控制器:每个队列有一个额外读信号R1,由比较器的比较结果控制。
队列行为:
(1)出队操作,FIFOIN<=IN; R<=1;
(2)入队操作,OUT<=FIFOOUT; W<=1;
(3)判断队列是否为空,FIFO自己空满信号,不过一般FIFO的长度和有序队列的长度不等,所以还是用FLGA来判断,FLAG为0时,队列空;FLAG等于N,队列满。
归并输入:
将A的队头和B的队尾衔接,数据始终由A的队尾插入,再由A的队头插入B的队尾,A、B由A_FIFOOUT和B_FIFOIN衔接,等价模型就是A、B中间加了2个寄存器:
1:A的队头和B的队尾衔接; B_FIFIIN<=A_FIFOOUT;
2:数据输入A,时,A_W<=1;
3:数据输入B,
Figure 762670DEST_PATH_IMAGE014
时B_W<=1;
4:AB中有2个寄存器,所以A的R信号要比B的W信号提前2个周期,即
Figure 967387DEST_PATH_IMAGE016
时A_R<=1;
归并输出
输出的控制分为时序逻辑和组合逻辑,FIFO的控制用时序逻辑,由上升沿触发,比较器及依据判断结果设置R1,用组合逻辑。
时序逻辑:
Figure 166287DEST_PATH_IMAGE018
,同时取AB队头,即A_R<=1;B_R<=1;
组合逻辑:
时,T时刻设置A,B的读信号为1,T+1,A,B的队头更新,比较两者大小,根据比较器比较结果设置A、B的R1信号。
(1)A_Rn<=A_R&A_R1;B_Rn<=B_R&B_R1;(Rn为R信号和R1信号与操作后传递给A、B的下组读信号)
(2)在A, B非空时(即A_FLAG>0,B_FLAG>0),比较A, B的队头,输出其中较大者,并将其队头出队,设置其额外读信号R1等于1,将其标记位FLAG减一,组标记位BUFFFLAG减一,OUTENABLE为1。
(3)当A, B任一为空时,依次输出另一队列,将另一队列标记位FLAG减一,组标记位BUFFFLAG减一,设置另一队列额外读信号R1等于1,OUTENABLE为0,直到A,B均为空,OUTENABLE为0。
见图3,图4所示,当归并组件有两个或者两个以上时,即可实现乒乓的归并操作,每个归并组件中的辅助控制器上还设置有归并组件的输入输出切换的组计数器,即用来对BUFFFLAG进行计数:
设置两组队列A、B与C、D,实现乒乓操作,用BUFFFLAG切换每一组的输入输出。
1:
Figure 766213DEST_PATH_IMAGE022
时,队列A、B输入;OUTENABLE<=0;
2:
Figure 956760DEST_PATH_IMAGE024
时,队列A、B输出,队列C、D输入;OUTENABLE<=1;
循环执行1,2直到所有的数据都变成2N有序的输出;相邻的两个归并组件的输出可以作为下一归并组件的输入。
基于归并操作的排序,不论是基于寄存器的归并操作,还是基于FIFO的归并操作,都可以看成一个归并组件,作为归并排序的一层。他们拥有统一的接口。
归并组件接口:
输入:
INDATA; 待排序数输入端口
INENABLE; 输入使能信号。INENABLE为1是INDATA有效;
输出:
OUTDATA; 待排序数输出端口
OUTENABLE;输出使能信号。OUTENABLE为1是OUTDATA输出有效;
基于归并操作的排序中,将归并排序分多层,首先是长度为1,最后一层是长度为N/2。上一层的输出和下一层的输入衔接,并通过上一层的OUTENBALE信号,控制下一层的归并的开始,第一层的输入原始的待排序数据,最后一层无需乒乓操作,只使用一组队列就可以输出排序之后的数据。
     在此基础上可以灵活的选用基于寄存器的组件和选用基于FIFO的组件搭配,当待排序的队列长度较小时使用基于寄存器的归并,当长度较大时使用基于FIFO的归并,实现小规模数据和大规模数据下不同的配置。
多层次归并排序,一层的输出作为下一层的输入,通过乒乓操作形成流水操作,每一层的输出周期即为下一层的输入时间周期,所以总的时间周期分为两部分:每一层的输入时间周期和最后一层的输出时间周期;设总时间周期为T,第i层的输入时间为Ti,最后一层的输出周期数为T’,待排序队列长度为N,排序层数为M:
Figure 693772DEST_PATH_IMAGE026
那么可以求得最终的时间周期之和为:
Figure 154840DEST_PATH_IMAGE028
即并行归并排序时间复杂度为
Figure 522368DEST_PATH_IMAGE030
,优于传统的的归并排序。
本发明中基于寄存器的归并操作和基于FIFO的归并操作都可以采用乒乓操作实现排序的完全流水,其中基于寄存器的结构采用时序逻辑,基于FIFO的结构采用时序逻辑和组合逻辑,最后在FPGA的归并操作基础之上,采用多层次构架,可以灵活的选用不同的归并组件,实现资源和效率的最大化,因此能够完全满足对于高清实时图片的特征点排序的要求。

Claims (9)

1.一种归并排序结构,其特征在于,其包括归并组件,所述归并组件包括存储的队列,所述队列连接比较器和辅助控制器,所述辅助控制器上设置有计数所述队列出队或入队操作的计数器。
2.根据权利要求1所述的一种归并排序结构,其特征在于,所述存储的队列包括两个队列寄存器,两个所述队列寄存器连接所述比较器,两个所述队列寄存器分别连接所述辅助控制器。
3.根据权利要求2所述的一种归并排序结构,其特征在于, 所述比较器采用上升沿触发。
4.根据权利要求3所述的一种归并排序结构,其特征在于,所述辅助控制器设置有计数每个所述队列寄存器的出队或入队的计数器。
5.根据权利要求1所述的一种归并排序结构,其特征在于,所述存储的队列包括两个FIFO,所述辅助控制器包括时序逻辑辅助控制器和组合逻辑辅助控制器,所述时序逻辑辅助控制器和所述组合逻辑辅助控制器分别连接所述FIFO,所述FIFO分别设置有FIFOIN和FIFOOUT端口,所述其中一个FIFO的FIFOOUT端口连接所述另一个FIFO的FIFOIN端口,读信号口、写信号口分别连接所述FIFO。
6.根据权利要求5所述的一种归并排序结构,其特征在于,所述FIFO的FIFOOUT端口分别连接比较器,所述时序逻辑辅助控制器设置有计数所述每个所述FIFO出队或入队操作的计数器。
7.根据权利要求6所述的一种归并排序结构,其特征在于,所述读信号口和所述比较器通过与门分别连接所述FIFO,通过所述比较器分别处理得到额外读信号与所述读信号口读信号共同控制每个所述FIFO的读操作。
8.根据权利要求1所述的一种归并排序结构,其特征在于,所述归并组件包括两个及两个以上,每个所述归并组件中的所述辅助控制器上还设置有所述归并组件的输入输出切换的组计数器。
9.根据权利要求8所述的一种归并排序结构,其特征在于,相邻的两个所述归并组件的输出可以作为下一所述归并组件的输入。
CN2013101064877A 2013-03-29 2013-03-29 一种归并排序结构 Pending CN103226464A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013101064877A CN103226464A (zh) 2013-03-29 2013-03-29 一种归并排序结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013101064877A CN103226464A (zh) 2013-03-29 2013-03-29 一种归并排序结构

Publications (1)

Publication Number Publication Date
CN103226464A true CN103226464A (zh) 2013-07-31

Family

ID=48836931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013101064877A Pending CN103226464A (zh) 2013-03-29 2013-03-29 一种归并排序结构

Country Status (1)

Country Link
CN (1) CN103226464A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104932864A (zh) * 2015-06-25 2015-09-23 许继电气股份有限公司 基于流水线进程的归并排序方法及使用该方法的阀控装置
CN105515420A (zh) * 2015-12-01 2016-04-20 中国西电电气股份有限公司 一种基于fpga的模块电压并行多路归并排序方法
CN106843803A (zh) * 2016-12-27 2017-06-13 南京大学 一种基于归并树的全排序加速器及应用
CN111443891A (zh) * 2020-03-19 2020-07-24 江苏方天电力技术有限公司 一种电力物联数据可变长归并排序实现方法
CN111562898A (zh) * 2020-05-11 2020-08-21 上海大学 一种基于fpga实现的多级归并排序方法
CN111813370A (zh) * 2020-07-08 2020-10-23 上海雪湖科技有限公司 基于fpga的多路并行归并排序系统
CN114528111A (zh) * 2022-02-17 2022-05-24 北京有竹居网络技术有限公司 用于数据召回的fpga芯片和数据召回方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612100A (zh) * 2003-10-27 2005-05-04 陈启星 分级定位排序和分级定位查找的动态查找表的算法
US20070156685A1 (en) * 2005-12-28 2007-07-05 Hiroshi Inoue Method for sorting data using SIMD instructions
CN101261576A (zh) * 2008-04-03 2008-09-10 启攀微电子(上海)有限公司 实现并行数据排序的硬件电路及方法
CN203217553U (zh) * 2013-03-29 2013-09-25 江苏复芯物联网科技有限公司 归并排序结构

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612100A (zh) * 2003-10-27 2005-05-04 陈启星 分级定位排序和分级定位查找的动态查找表的算法
US20070156685A1 (en) * 2005-12-28 2007-07-05 Hiroshi Inoue Method for sorting data using SIMD instructions
CN101261576A (zh) * 2008-04-03 2008-09-10 启攀微电子(上海)有限公司 实现并行数据排序的硬件电路及方法
CN203217553U (zh) * 2013-03-29 2013-09-25 江苏复芯物联网科技有限公司 归并排序结构

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104932864A (zh) * 2015-06-25 2015-09-23 许继电气股份有限公司 基于流水线进程的归并排序方法及使用该方法的阀控装置
CN105515420A (zh) * 2015-12-01 2016-04-20 中国西电电气股份有限公司 一种基于fpga的模块电压并行多路归并排序方法
CN106843803A (zh) * 2016-12-27 2017-06-13 南京大学 一种基于归并树的全排序加速器及应用
CN111443891A (zh) * 2020-03-19 2020-07-24 江苏方天电力技术有限公司 一种电力物联数据可变长归并排序实现方法
CN111443891B (zh) * 2020-03-19 2022-07-08 江苏方天电力技术有限公司 一种电力物联数据可变长归并排序实现方法
CN111562898A (zh) * 2020-05-11 2020-08-21 上海大学 一种基于fpga实现的多级归并排序方法
CN111562898B (zh) * 2020-05-11 2023-06-09 上海大学 一种基于fpga实现的多级归并排序方法
CN111813370A (zh) * 2020-07-08 2020-10-23 上海雪湖科技有限公司 基于fpga的多路并行归并排序系统
CN111813370B (zh) * 2020-07-08 2023-10-31 上海雪湖科技有限公司 基于fpga的多路并行归并排序系统
CN114528111A (zh) * 2022-02-17 2022-05-24 北京有竹居网络技术有限公司 用于数据召回的fpga芯片和数据召回方法
CN114528111B (zh) * 2022-02-17 2023-06-16 北京有竹居网络技术有限公司 用于数据召回的fpga芯片和数据召回方法
WO2023155758A1 (zh) * 2022-02-17 2023-08-24 北京有竹居网络技术有限公司 用于数据召回的fpga芯片和数据召回方法

Similar Documents

Publication Publication Date Title
CN103226464A (zh) 一种归并排序结构
EP3607505B1 (en) Task synchronization for accelerated deep learning
CN104112053B (zh) 一种面向图像处理的可重构架构平台设计方法
EP3607506B1 (en) Fabric vectors for deep learning acceleration
CN105051711B (zh) 用于提供由状态机引擎接收的数据的方法及设备
Chen et al. Interconnection networks using shuffles
Harshini et al. Design of hybrid sorting unit
Norollah et al. RTHS: A low-cost high-performance real-time hardware sorter, using a multidimensional sorting algorithm
Geng et al. O3BNN-R: An out-of-order architecture for high-performance and regularized BNN inference
CN203217553U (zh) 归并排序结构
Usui et al. A cost-effective and scalable merge sorter tree on FPGAs
Hematian et al. Zero-delay FPGA-based odd-even sorting network
CN111582226B (zh) 目标检测中候选框去冗余方法
CN106843803B (zh) 一种基于归并树的全排序加速器及应用
Maggiani et al. Reconfigurable architecture for computing histograms in real-time tailored to FPGA-based smart camera
US11429850B2 (en) Performing consecutive mac operations on a set of data using different kernels in a MAC circuit
Ray et al. Worst case O (N) comparison-free hardware sorting engine
Oge et al. Design and implementation of a handshake join architecture on FPGA
Zeng FPGA-based high throughput merge sorter
CN105190579B (zh) 一种用于实现线路速度互连结构的方法
Huang et al. A low-bit quantized and hls-based neural network fpga accelerator for object detection
Ortiz et al. A Streaming High‐Throughput Linear Sorter System with Contention Buffering
Ali Hardware Solution to Sorting Algorithms: A Review
Gerards et al. Streaming reduction circuit
JPS6324325A (ja) デ−タ項目を分類する方法および分類装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130731