CN102025614B - 一种线上可重构的4元树状片上网络系统及其重构方法 - Google Patents
一种线上可重构的4元树状片上网络系统及其重构方法 Download PDFInfo
- Publication number
- CN102025614B CN102025614B CN2010105589917A CN201010558991A CN102025614B CN 102025614 B CN102025614 B CN 102025614B CN 2010105589917 A CN2010105589917 A CN 2010105589917A CN 201010558991 A CN201010558991 A CN 201010558991A CN 102025614 B CN102025614 B CN 102025614B
- Authority
- CN
- China
- Prior art keywords
- network
- node
- tree
- yuan
- switch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000004891 communication Methods 0.000 claims abstract description 20
- 230000003993 interaction Effects 0.000 claims abstract description 3
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012856 packing Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
Abstract
一种线上可重构的4元树状片上网络系统,包括处理单元,用以实现片上网络的计算任务;网络接口,用以对网络上传输的数据包进行打包、解包;交换机,用以进行数据交互;控制单元,用以根据收集来的各处理单元的任务量信息,按照重构方法重组网络群集;交换机有五个端口,其中四个连接同级之间的处理单元,并行工作的处理单元每隔固定时间进行任务交互,另一个端口通向下一级网络;每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集,直至整个网络系统。以及提供了4元树状片上网络系统的重构方法。本发明有效减少通信量、降低通信延迟、重构过程具有良好的划分结果。
Description
技术领域
本发明涉及一种片上网络与复杂性理论中数字划分领域,是一种采用线上可重构技术的4元树状片上网络系统及其可重构方法。
背景技术
随着半导体技术的不断前进,系统芯片(System on Chip, SoC)也日趋复杂,包含着越来越多的处理器、存储器等IP模块,以片上网络为代表的新一代片上通信系统成为了SoC的研究热点。树状拓扑结构的片上网络由于其较低的通信延迟、物理设计中布局的灵活性在同构系统中被广泛应用。
然而传统的树形片上网络系统由于各节点链接固定,参照图3 (a),从而导致部分数据包可能需要经过较远的距离才能传输到目的节点,以致片上通讯延迟高,数据传输量大,功耗高。
树形片上网络系统的重构问题涉及复杂性理论中数字划分领域,尤其是平衡数字划分(Balanced Number Partitioning),解决这类问题的方法包括可在多项式时间和空间内找到近似解的启发式算法,在多项式时间内完成但需要大量空间的动态规划算法,以及只要运行时间足够长即可找到最佳解的任意时间算法(Anytime Algorithm)。介于重构控制模块的计算能力及空间所限,启发式算法是重构方法的最佳选择。平衡最大差分法(Balanced Largest Differencing Method, BLDM)是解决平衡数字划分的经典方法,好过其他通用多项式时间方法。
发明内容
为了克服已有树形片上网络系统的通信量较大、通信延迟较大、重构过程中划分结果不可靠的不足,本发明提供了一种有效减少通信量、降低通信延迟、重构过程具有良好的划分结果的线上可重构的4元树状片上网络系统及其重构方法。
本发明解决其技术问题所采用的技术方案是:
一种线上可重构的4元树状片上网络系统,所述4元树状片上网络系统包括:处理单元,用以实现片上网络的计算任务;网络接口,用以对网络上传输的数据包进行打包、解包;交换机,用以进行数据交互;控制单元,用以根据收集来的各处理单元的任务量信息,按照重构方法重组网络群集;
所述交换机有五个端口,其中四个连接同级之间的处理单元,并行工作的处理单元每隔固定时间进行任务交互,另一个端口通向下一级网络;每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集,直至整个网络系统。
作为优选的一种方案:片上网络中传输的数据包括处理单元发给控制器的任务量信息、控制器发给交换机的群集信息、控制器发给处理单元的任务发送信息和处理单元之间发送的任务信息。
进一步,所述控制单元中,所述重构方法采用平衡最远绑定法,即将n个节点分为 组,记做,每组4个节点,其中n为能被4整除的自然数;某一时刻各节点的当前任务量为,排序后为序列,并且为节点平均任务量,即,使得交换机通信量近似最小,其中,。
一种线上可重构的4元树状片上网络系统的重构方法,所述4元树状片上网络系统中,每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集;
为使得交换机通信量近似最小,其中,,重构的基本思想是每一次循环将任务量最大和最小的两个节点分到同一组并作为一个新的节点重新归入序列中,循环次后完成重构,可以使得重构后交换机通信量近似最小,各群集任务量比较平均。
作为优选的一种方案:所述重构方法包括以下步骤:
1)首先,各节点当前任务量减去平均任务量,得到节点通信量,因此,各元素值为;
2)除去两个距离最远的元素,所述距离最远即节点通信量最大;
3)将除去的两元素值以及标签加起来成为一个新的元素,按照元素值的大小重新插入到序列L当中;
4)返回步骤2),直到划分完毕。
进一步,所述序列L每个元素包括两个部分,即元素值和标签,标签标识元素的源数据的个数,初始值为1。
再进一步,步骤3)中合并的两个元素的标签和需小于等于4,同时,当序列中有元素标签为3时,接下来的循环需要找到一个距离最远并与之对应的元素和它配对,所述对应的元素的标签为1。
更进一步,每一次重构过程,将群集中的四个设备单元组合到一起,所述设备单元包括处理单元或群集子集。由于群集以此方式递归组成更大的群集,因此,更大的群集中含有四个群集子集。
本发明的技术构思为:发明的线上可重构4元树状片上网络系统可以根据各节点的待通讯数据量对其群集重组,以最大程度地减少通信量、减小通信延迟,从而提高实时处理性能,降低系统功耗。
对于重构方法中,针对4元树状片上网络系统,提出了平衡最远绑定法(Balanced Farthest Binding Method,BFBM)在划分结果上要优于BLDM。
本发明的有益效果主要表现在:有效减少通信量、降低通信延迟、重构过程具有良好的划分结果。
附图说明
图1 是4元树状片上网络系统的示意图。
图2 是重构方法的迭代方式的示意图。
图3 (a) 是传统树状片上网络通信的示意图。
图3 (b) 是可重构的树状片上网络通信的示意图。
图4是交换机外围可重构电路图。
图5是BFBM重构方法示意图。
具体实施方式
下面结合附图对本发明做进一步描述。
实施例1
参照图1,一种线上可重构的4元树状片上网络系统,包括处理单元(Processing Element, PE)、网络接口(Network Interface, NI)、交换机(Switch)、控制单元(Control Unit, CU)。系统中各处理单元硬件结构完全相同,是计算任务的主要承担者。为保证系统工作效率,各并行工作的处理单元需每隔固定时间进行任务交互,以平衡工作量。网络接口负责对网络上传输的数据包进行打包、解包。传输的数据包括四类:处理单元发给控制器的任务量信息、控制器发给交换机的群集信息、控制器发给处理单元的任务发送信息、处理单元之间发送的任务信息。交换机有五个端口,其中四个连接同级之间的处理单元,另一个端口通向下一级网络。系统中每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,如图所示1,各群集以此方式递归组成更大的群集,直至整个系统。树状片上网络系统的根节点为顶层的交换机,与控制单元相连。控制单元根据收集来的各处理单元的任务量信息,按照重构方法重组网络群集。
为支持线上可重构,发明的片上网络系统在传统树形系统的基础上增加控制单元。控制单元可以为专用电路模块亦可为嵌入式CPU来执行重构方法。每固定间隔时间,各处理单元将其正在处理的任务量信息以数据包的形式发送给控制单元。控制单元根据这些信息通过重构方法计算出重构后的节点位置并告知各交换机。
所述控制单元中,所述重构方法采用平衡最远绑定法,即将n个节点分为组,记做,每组4个节点,其中n为能被4整除的自然数;某一时刻各节点的当前任务量为,排序后为序列,并且为节点平均任务量,即,使得交换机通信量近似最小,其中,。
实施例2
参照图1~图5,一种线上可重构的4元树状片上网络系统的重构方法,假设系统节点数为n,某一时刻各节点的当前任务量为,排序后为序列,并且为节点平均任务量,即。发明的BFBM可重构方法将n个节点分为组,记做,每组4个节点,使得交换机通信量近似最小,其中。
BFBM重构方法中序列L每个元素包括两个部分,即元素值和标签。标签标识元素的源数据的个数,初始值为1。
重构方法的具体步骤如下:
2) 除去两个距离最远的元素,所述距离最远即节点通信量最大。
3) 将除去的两元素值以及标签加起来成为一个新的元素,按照元素值的大小重新插入到序列当中。
4) 返回步骤2),直到划分完毕。
值得注意的是由于数字划分的基数(Cardinality)为4,因此步骤2中除去的两个元素的标签和需小于等于4。同时,当序列中有元素标签为3时,接下来重构方法需要找到一个距离最远并与之对应的元素(标签为1)和它配对,只有这样才能保证最终划分得到的各组元素的数目为4个。
为使系统各层交换机通信量近似最小,可在重构时将此方法迭代使用,如图2所示。每一次使用重构方法,将每四个设备单元(处理单元或群集)组合到一起,可保证此层次交换机的通信量较小。
以16节点系统为例,假设某一时刻各处理单元之间的通信量如图3 (a)所示,此时传统树形系统第一层交换机的通信量分别为:118、54、132、84,共388个单位数据包;顶层交换机需转发170个单位数据包。而当采用提出的可重构树形系统时,各节点根据重构方法重新组合,如图3 (b)所示。此时,第一层交换机通信量分别为:48、86、64、22,共220个单位数据包;顶层交换机的通信量仅为2个单位数据包。因此,提出的可重构的片上网络系统可以有效地减少通信延迟,节省系统功耗。
交换机的外围可重构硬件支持如图4所示,每层交换机通过多路选择器(MUX)与同层所有设备单元(处理单元或群集)相连接。重构时,交换机根据控制单元发来的重构结果选择处理单元或群集。
Claims (3)
1.一种线上可重构的4元树状片上网络系统,其特征在于:所述4元树状片上网络系统包括:
处理单元,用以实现片上网络的计算任务;
网络接口,用以对网络上传输的数据包进行打包、解包;
交换机,用以进行数据交互;
控制单元,用以根据收集来的各处理单元的任务量信息,按照重构方法重组网络群集;
所述重构方法采用平衡最远绑定法,即将n个节点分为k=n/4组,记做A1,A2,...,Ak,每组4个节点,其中n为能被4整除的自然数;某一时刻各节点的当前任务量为b1,b2,...bn,排序后为序列L=a1,a2,...an,a1≤a2≤...≤an,并且c为节点平均任务量,即∑j∈Aaj=nc,使得交换机通信量 近似最小,其中,
所述交换机有五个端口,其中四个连接同级之间的处理单元,并行工作的处理单元每隔固定时间进行任务交互,另一个端口通向下一级网络;每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集,直至整个网络系统。
2.如权利要求1所述的线上可重构的4元树状片上网络系统,其特征在于:片上网络中传输的数据包括处理单元发给控制单元的任务量信息、控制单元发给交换机的群集信息、控制单元发给处理单元的任务发送信息和处理单元之间发送的任务信息。
3.一种如权利要求1所述的线上可重构的4元树状片上网络系统的重构方法,其特征在于:所述4元树状片上网络系统中,每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集;
设网络系统的节点数为n,n为能被4整除的自然数,将n个节点分为k=n/4组,记做A1,A2,...,Ak,每组4个节点,某一时刻各节点的当前任务量为b1,b2,...bn,排序后为序列L=a1,a2,...an,a1≤a2≤...≤an,并且c为节点平均任务量,即∑j∈Aaj=nc;
所述重构方法包括以下步骤:
1)首先,各节点当前任务量减去平均任务量,得到节点通信量,因此,各元素值为aj-c;
2)除去两个距离最远的元素,所述距离最远即节点通信量最大;
3)将除去的两元素值以及标签加起来成为一个新的元素,按照元素值的大小重新插入到序列L当中;
4)返回步骤2),直到划分完毕;
所述序列L每个元素包括两个部分,即元素值和标签,标签标识元素的源数据的个数,初始值为1;
步骤3)中合并的两个元素的标签和需小于等于4,同时,当序列中有元素标签为3时,接下来的循环需要找到一个距离最远并与之对应的元素和它配对,所述对应的元素的标签为1;
每一次重构过程,将群集中的四个设备单元组合到一起,所述设备单元包括处理单元或群集子集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105589917A CN102025614B (zh) | 2010-11-25 | 2010-11-25 | 一种线上可重构的4元树状片上网络系统及其重构方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105589917A CN102025614B (zh) | 2010-11-25 | 2010-11-25 | 一种线上可重构的4元树状片上网络系统及其重构方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102025614A CN102025614A (zh) | 2011-04-20 |
CN102025614B true CN102025614B (zh) | 2013-01-30 |
Family
ID=43866488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105589917A Expired - Fee Related CN102025614B (zh) | 2010-11-25 | 2010-11-25 | 一种线上可重构的4元树状片上网络系统及其重构方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102025614B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103986672B (zh) * | 2014-05-23 | 2017-12-19 | 清华大学 | 片上网络拓扑结构的重构方法及系统 |
CN105450481B (zh) * | 2014-07-10 | 2018-09-14 | 龙芯中科技术有限公司 | 片上网络的布局优化方法及装置 |
CN105634960B (zh) * | 2015-12-24 | 2017-04-05 | 中国科学院计算技术研究所 | 基于分形树结构的数据发布装置、方法、控制装置及智能芯片 |
CN105550157B (zh) * | 2015-12-24 | 2017-06-27 | 中国科学院计算技术研究所 | 一种分形树结构通信结构、方法、控制装置及智能芯片 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7467358B2 (en) * | 2004-06-03 | 2008-12-16 | Gwangju Institute Of Science And Technology | Asynchronous switch based on butterfly fat-tree for network on chip application |
US7382154B2 (en) * | 2005-10-03 | 2008-06-03 | Honeywell International Inc. | Reconfigurable network on a chip |
CN101420355B (zh) * | 2008-11-28 | 2011-06-01 | 西安邮电学院 | 一种星簇双环片上网络拓扑结构装置 |
CN101420380B (zh) * | 2008-11-28 | 2012-11-14 | 西安邮电学院 | 一种双层双环型片上系统 |
-
2010
- 2010-11-25 CN CN2010105589917A patent/CN102025614B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102025614A (zh) | 2011-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shen et al. | A new binomial mapping and optimization algorithm for reduced-complexity mesh-based on-chip network | |
CN107211036B (zh) | 一种数据中心网络组网的方法以及数据中心网络 | |
KR20140139032A (ko) | 패킷플로우 상호연결 패브릭 | |
CN102025614B (zh) | 一种线上可重构的4元树状片上网络系统及其重构方法 | |
CN107430574A (zh) | 用于分析系统的io、处理和存储器带宽的优化的方法和装置 | |
CN108628800A (zh) | 一种动态可重构的智能计算集群及其配置方法 | |
Wolfe et al. | Preliminary performance analysis of multi-rail fat-tree networks | |
CN102325089A (zh) | 基于差分进化和捕食搜索策略的胖树型片上网络映射方法 | |
CN106101262A (zh) | 一种基于以太网的直连架构计算集群系统及构建方法 | |
Marcon et al. | Tiny NoC: A 3D mesh topology with router channel optimization for area and latency minimization | |
CN102752207B (zh) | 可重配置的2D mesh片上网络结构及其重配置方法 | |
Bhanu et al. | Fault-tolerant application mapping on mesh-of-tree based network-on-chip | |
CN104065577B (zh) | 一种适用于航空电子的片上网络系统 | |
Moradi et al. | A memory-efficient routing method for large-scale spiking neural networks | |
Agyeman et al. | Optimised application specific architecture generation and mapping approach for heterogeneous 3d networks-on-chip | |
Joseph et al. | NEWROMAP: Mapping CNNs to NoC-interconnected self-contained data-flow accelerators for edge-AI | |
CN105634960B (zh) | 基于分形树结构的数据发布装置、方法、控制装置及智能芯片 | |
Filiposka et al. | Community-based complex cloud data center | |
Ueno et al. | VCSN: Virtual circuit-switching network for flexible and simple-to-operate communication in HPC FPGA cluster | |
Bouhraoua et al. | Improved modified fat-tree topology network-on-chip | |
Zhang et al. | KGT: An Application Mapping Algorithm Based on Kernighan–Lin Partition and Genetic Algorithm for WK-Recursive NoC Architecture | |
CN113986813B (zh) | 片上网络结构构建及使用的方法、系统、设备和存储介质 | |
Urgese et al. | Work-in-progress: Multiple alignment of packet sequences for efficient communication in a many-core neuromorphic system | |
Yamada et al. | Folded fat H-tree: An interconnection topology for dynamically reconfigurable processor array | |
Shruthi et al. | Study and Analysis of Wired and Wireless Network-on-Chip Using Noxim |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130130 Termination date: 20131125 |