CN109587080A - 一种基于拓扑划分的片上网络快速映射算法 - Google Patents
一种基于拓扑划分的片上网络快速映射算法 Download PDFInfo
- Publication number
- CN109587080A CN109587080A CN201710901864.4A CN201710901864A CN109587080A CN 109587080 A CN109587080 A CN 109587080A CN 201710901864 A CN201710901864 A CN 201710901864A CN 109587080 A CN109587080 A CN 109587080A
- Authority
- CN
- China
- Prior art keywords
- search
- algorithm
- individual
- network
- genetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0893—Assignment of logical groups to network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/10—Packet switching elements characterised by the switching fabric construction
- H04L49/109—Integrated on microchip, e.g. switch-on-chip
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Genetics & Genomics (AREA)
- Physiology (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种基于拓扑划分的片上网络快速映射算,为求解通信时延受约束的低能耗片上网络映射问题,发明一种基于拓扑划分的片上网络快速映射算法。该算法由局部搜索和精英重组2个步骤经过多次迭代完成,局部搜索采用简化的robust tabu search(Ro TS),精英重组步骤选用COHX交叉操作。该发明具有有优化性能好、搜索空间小、低能耗等优点,适于求解大规模NoC映射问题。
Description
所属技术领域
本发明涉及片上网络设计,尤其涉及片上网络中映射问题。
背景技术
随着CMOS工艺步入纳米级,单个芯片上集成的晶体管的数目越来越多,片上系统(SoC)设计也越来越复杂,逐渐开始集成更多的功能模块。为了提高性能,处理器的时钟频率也不断提高,随之而来的是芯片的功耗也迅速增加,导致片上系统(SoC)朝着多处理器系统芯片(MPSoC)发展。随着一个芯片上的集成的IP核越来越多,芯片要考虑的不再是它自身的计算能力,而是逐渐将重心转移到如何处理好多核之间的通信问题上,如果还是依循传统的总线(bus)结构将会严重制约着SoC的性能提升。为了解决上述问题,一种全新的大规模多核的片上系统互连架构技术——片上网络(NoC)被提出,其核心思想是将计算机网络技术移植到芯片设计中来,从体系结构上彻底解决总线架构带来的问题。
NoC由路由器、路由器之间的链路以及网络接口组成。路由器按照一定的拓扑结构相连,不同功能的IP通过网络接口与路由器相连接入到片上网络中来,网络接口对IP核发送的数据进行数据封装,形成适合路由器传输的固定格式分组。片上路由器根据分组的目的地址信息,将数据正确传输给通信的目的IP核,不同的分组根据目的地址在网络中独立的传输,这样不同的IP对可以同时并行通信,提高了系统的通信效率。另外NoC将计算单元(IP 核)和通信单元分离,作为一个独立于IP核之外的片上通信平台,它能够满足不同应用特性片上系统的设计需求,而且当系统扩展新的功能时,只需要将增加的IP核接入到网络中,不需要重新进行设计,并且现有规模的SoC完全可以基于片上通信协议作为计算节点“即插即用”于NoC的通信网络,这样就能大大的缩短设计周期,减少开发成本。因此,片上网络具有更好的扩展性。同时NoC从SoC的全局同步问题着手,采用全局异步局部同步 (GALS)的时钟技术把一个系统划分成很多个相互独立的单元,这些单元内部同步,并且都工作在自己的工作时钟域下,不同的单元之间采用异步的方式进行通信。这样通过GALS技术把全局时钟划分成很多的局部时钟,使得每个局部时钟都可以使用当前的设计技术独立设计,从而在一定程度上避免了采用单一全局同步时钟给系统设计带来的麻烦。因此对于大规模集成电路芯片设计,采用全局异步局部同步的时钟策略是解决全局时钟同步的关键技术。
NoC映射是NoC设计中的一个重要步骤。确定了SoC所选用的IP核之后,NoC映射就决定了从IP核到NoC体系结构的对应关系.不同的映射结果,对于系统的执行时间、通信时延、通信能耗等性能有着重要的影响。映射问题属于二次分配问题的范畴,用分支限界法求解带宽约束下的能耗最优NoC映射问题;但是当NoC规模变大时,该算法的执行时间呈指数级增长,在有限时间和空间中大规模精确求解相当复杂。
通过对映射方法的优化,可节省通信能耗。此外,片上网络大多属于实时系统,对系统的计算和通信时间有严格的要求,因此NoC映射应当满足系统的通信时延约束,并以降低 NoC的通信能耗为目标。
发明内容
本发明的目的是设计满足系统的通信时延约束并降低片上网络通信能耗的映射优化方法。
本发明解决其技术问题所采用的技术方案是:
一种有效的改进禁忌搜索算法(tabu search for NoC mapping,TSNM)。TSNM算法基于集中和分散机制,采用禁忌搜索和遗传算法混合优化策略,用简化后的RoTS实现对求解空间局部区域的集中搜索,并用COHX交叉操作完成分散搜索。
所述的禁忌搜索(tabu search,TS)是一种具有记忆功能的全局逐步优化方法,算法设计的关键主要有邻域结构、禁忌表、禁忌长度和特赦规则等。
所述的遗传算法(Genetic Algorithm,GA)是进化计算中最初形成的一种具有普遍影响性的随机化搜索方法,它借鉴生物界的进化规律演化而来,采用概率化的寻找方法在较大空间进行有效搜索。遗传算法的内容包括:算法初始化、选择操作、交叉操作和变异操作等。其中,选择操作是指从群体中选择优胜的个体,淘汰劣势个体的过程。选择的目的主要是把优化的个体或解直接遗传到下一代或通过其它遗传操作产生的新个体遗传到下一代。而交叉操作和变异操作则以一定概率执行,交叉操作主要是将两个父代个体的部分结构加以替换重组而产生的新个体操作,从而期望提升个体的适应度。变异操作主要是对群体中特定个体编码串上的某些基因值进行变动,在每个染色体上自发地产生随机变化替换一个或多个基因,它的引入主要是为提升算法的局部搜索能力以及解的多样性。
所述的集中和分散机制是提高TS的搜索质量和效率的一种重要手段。其中,集中搜索机制强调算法对优良区域的重点搜索;分散搜索机制则强调拓宽搜索范围,尤其是未探索的区域,与遗传算法中增强种群的多样性比较相似。采用TS和遗传算法混合优化策略实现当搜索过程“停滞”时,及时对已有局部优化解中的优良个体(称为精英)进行重组,跳出发生“停滞”现象的搜索区域,同时又保留了已有的搜索状态信息。
所述的COHX交叉操作模拟了生物进化过程中的有性繁殖现象。通过两个染色体的交叉组合,来产生新的优良个体。交叉算子是遗传操作中最重要的操作,在交叉过程中优秀个体的基因模式得以迅速繁殖并在种群中扩散,使种群中其它的个体能向最优解的方向进化,同时交叉操作又是一种变相的变异操作,它增加了种群中个体的多样性。
具体实施方式
一、IP核通信任务图GTC(C,A),有向图GTC中,每个顶点ci∈C表示一个IP核.每条有向边aij∈A,aij表示从IP核ci到IP核cj的通信任务;权重v(aij)表示通信任务aij的数据流量,单位为bit;权重l(aij)表示通信任务aij允许的最大传输时延,用跳数表示。
二、定义NoC体系结构图NAG(R,P),有向完全图NAG中,每个顶点ri∈R表示一个资源节点;每条有向边pij∈P,pij表示从节点ri到节点rj的路由路径;权重d(pij)表示节点ri与节点rj间的路由距离,用跳数表示;权重e(pij)表示沿路由路径pij传输1位数据的能耗, e(pij)=Ebit(d(pij))。
三、给定IP核通信任务图CTG和NoC体系结构图NAG,且有C=R,通信时延受约束的低能NoC映射问题(简称为NoC映射)就是要寻求一个一一映射关系:
使NoC通信能耗最优:
四、开始利用局部搜索方法和精英重组的x次迭代来实现TSNM算法;
五、局部搜索:1)邻域搜索结构:实际上是一个置换排列,所有可能的置换构成了NoC 映射的状态空间。定义邻域搜索结构为互换操作,即随机交换置换中两点的位置。若当前的搜索状态为φ,定义的邻域为N(φ),则φ通过交换IP核ci和IP核cj的位置,移动到状态φ′∈ N(φ),须满足:
φ(ci)=φ′(cj),φ(cj)=φ′(ci)
2)禁忌表:将互换对(ci,cj)作为禁忌对,禁忌表存储在一个大小为n×n的二维数组t中, tij表示互换对(ci,cj)的禁忌次数,即IP核ci和IP核cj在tij次迭代以后才可以被选中互换位置。
3)禁忌长度:禁忌长度采用动态变化的方式,在区间(hmin,hmax)中随机取值。其中,hmin=0.4×n,hmax=0.6×n。
4)特赦规则.如果当前的禁忌对象所对应状态的目标函数值优于“best so far”(当前最好) 状态,则无视其禁忌属性,仍采纳其为当前选择。
5)终止规则.若局部搜索子过程内邻域搜索的迭代次数超过了最大迭代次数x,并且在本轮迭代中“best so far”状态没有得到更新,则终止运行。
六、精英重组:为了提高交叉操作的效率,抑制非法解的产生,使新的个体尽量满足时延约束,本发明针对NoC映射,引入了COHX(cohesive crossover)交叉操作,取最近一次局部搜索输出的个体1,并从EQ中随机取得另一个体2,作为2个父代个体。对父代个体1和2采用 COHX交叉,产生新的个体。
1)在NAG中,随机选择一个资源节点rm∈R,称为轴点。定义m为rm到其他节点路由距离的最大值,即m=max{d(pmi),ri∈R}。
2)对于NAG中距离rm不到m/2的所有节点ri∈R1={rk|d(pmk)<m/2,rk∈R},继承1中IP核的对应位置,若φ1(ci)=ri,则φc(ci)=ri。
3)对于NAG中的其余节点rj∈R2=R-R1,继承φ2中IP核的对应位置,若φ2(cj)=ri,则φc(cj)=rj。
4)φc可能不满足一一映射,首先找出φc中没有对应资源节点的所有IP核集合,然后对于在R1和R2中都有对应资源节点的所有IP核,找出这些IP核在R2中对应的子集R3;最后在Cnull与 R3间建立一一映射。
5)此时φc构成了从C到R的一一映射。若φc不满足式l(aij)≥d(pφ(ci),φ(cj)),则对c做进一步调整,最终得到一个新的可行解。
Claims (5)
1.一种基于拓扑划分的片上网络快速映射算法,算法基于集中和分散机制,采用禁忌搜索和遗传算法混合优化策略,用简化后的RoTS实现对求解空间局部区域的集中搜索,并用COHX交叉操作完成分散搜索。
2.根据权利要求1所述的一种基于拓扑划分的片上网络快速映射算法,其禁忌搜索(tabu search, TS)是一种具有记忆功能的全局逐步优化方法,算法设计的关键主要有邻域结构、禁忌表、禁忌长度和特赦规则等。
3.根据权利要求1所述的一种基于拓扑划分的片上网络快速映射算法,其遗传算法(Genetic Algorithm,GA)是进化计算中最初形成的一种具有普遍影响性的随机化搜索方法,它借鉴生物界的进化规律演化而来,采用概率化的寻找方法在较大空间进行有效搜索,遗传算法的内容包括:算法初始化、选择操作、交叉操作和变异操作等,其中,选择操作是指从群体中选择优胜的个体,淘汰劣势个体的过程,选择的目的主要是把优化的个体或解直接遗传到下一代或通过其它遗传操作产生的新个体遗传到下一代,而交叉操作和变异操作则以一定概率执行,交叉操作主要是将两个父代个体的部分结构加以替换重组而产生的新个体操作,从而期望提升个体的适应度,变异操作主要是对群体中特定个体编码串上的某些基因值进行变动,在每个染色体上自发地产生随机变化替换一个或多个基因,它的引入主要是为提升算法的局部搜索能力以及解的多样性。
4.根据权利要求1所述的一种基于拓扑划分的片上网络快速映射算法,其集中和分散机制是提高TS的搜索质量和效率的一种重要手段,其中,集中搜索机制强调算法对优良区域的重点搜索;分散搜索机制则强调拓宽搜索范围,尤其是未探索的区域,与遗传算法中增强种群的多样性比较相似,采用TS和遗传算法混合优化策略实现当搜索过程“停滞”时,及时对已有局部优化解中的优良个体(称为精英)进行重组,跳出发生“停滞”现象的搜索区域,同时又保留了已有的搜索状态信息。
5.根据权利要求1所述的一种基于拓扑划分的片上网络快速映射算法,其COHX交叉操作模拟了生物进化过程中的有性繁殖现象,通过两个染色体的交叉组合,来产生新的优良个体,交叉算子是遗传操作中最重要的操作,在交叉过程中优秀个体的基因模式得以迅速繁殖并在种群中扩散,使种群中其它的个体能向最优解的方向进化,同时交叉操作又是一种变相的变异操作,它增加了种群中个体的多样性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710901864.4A CN109587080A (zh) | 2017-09-28 | 2017-09-28 | 一种基于拓扑划分的片上网络快速映射算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710901864.4A CN109587080A (zh) | 2017-09-28 | 2017-09-28 | 一种基于拓扑划分的片上网络快速映射算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109587080A true CN109587080A (zh) | 2019-04-05 |
Family
ID=65913994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710901864.4A Pending CN109587080A (zh) | 2017-09-28 | 2017-09-28 | 一种基于拓扑划分的片上网络快速映射算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109587080A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113051215A (zh) * | 2019-12-27 | 2021-06-29 | 阿特里斯公司 | 用于片上网络的增量拓扑综合的系统和方法 |
CN113360450A (zh) * | 2021-06-09 | 2021-09-07 | 中山大学 | 一种基于片上网络的构造启发式映射方法 |
CN114625692A (zh) * | 2020-12-09 | 2022-06-14 | 阿特里斯公司 | 片上网络(NoC)的多阶段拓扑合成 |
-
2017
- 2017-09-28 CN CN201710901864.4A patent/CN109587080A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113051215A (zh) * | 2019-12-27 | 2021-06-29 | 阿特里斯公司 | 用于片上网络的增量拓扑综合的系统和方法 |
CN113051215B (zh) * | 2019-12-27 | 2022-07-22 | 阿特里斯公司 | 用于片上网络的增量拓扑综合的系统和方法 |
CN114625692A (zh) * | 2020-12-09 | 2022-06-14 | 阿特里斯公司 | 片上网络(NoC)的多阶段拓扑合成 |
CN113360450A (zh) * | 2021-06-09 | 2021-09-07 | 中山大学 | 一种基于片上网络的构造启发式映射方法 |
CN113360450B (zh) * | 2021-06-09 | 2022-09-20 | 中山大学 | 一种基于片上网络的构造启发式映射方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102325089B (zh) | 基于差分进化和捕食搜索策略的胖树型片上网络映射方法 | |
CN109189720B (zh) | 层次化片上网络拓扑结构及其路由方法 | |
WO2015196833A1 (zh) | 一种集成网络路由器的众核处理器系统及其集成方法和实现方法 | |
Subramoni et al. | Design and evaluation of network topology-/speed-aware broadcast algorithms for infiniband clusters | |
CN112468401B (zh) | 用于类脑处理器的片上网络路由通信方法及片上网络 | |
Sepúlveda et al. | A multi-objective approach for multi-application NoC mapping | |
Amudhavel et al. | Effective maintenance of replica in distributed network environment using DST | |
CN109587080A (zh) | 一种基于拓扑划分的片上网络快速映射算法 | |
CN109582985A (zh) | 一种改进的遗传退火的片上网络映射方法 | |
Li et al. | Scalable Graph500 design with MPI-3 RMA | |
WO2024051388A1 (zh) | 一种基于禁忌搜索算法的神经网络片上映射方法和装置 | |
CN108173760B (zh) | 一种基于改进模拟退火算法的片上网络映射方法 | |
CN101847168A (zh) | 基于规则拓扑库面向应用的片上网络生成方法 | |
Marcon et al. | Tiny NoC: A 3D mesh topology with router channel optimization for area and latency minimization | |
Lit et al. | Comparative performance evaluation of routing algorithm and topology size for wireless network-on-chip | |
Ashby et al. | The impact of global communication latency at extreme scales on Krylov methods | |
CN104270327A (zh) | 一种基于集群的共享射频片上网络及映射方法 | |
Dehghani et al. | Design and performance evaluation of Mesh-of-Tree-based hierarchical wireless network-on-chip for multicore systems | |
CN111695316B (zh) | 一种基于改进混合算法的片上网络测试规划方法 | |
Ning et al. | A cloud-supported cps approach to control decision of process manufacturing: 3D ONoC | |
Tavanpour et al. | Chain-Mapping for mesh based Network-on-Chip architecture | |
CN107911245A (zh) | 一种芯弹性光网络中虚拟网络映射模型及算法 | |
Xu et al. | Explorations of optimal core and cache placements for chip multiprocessor | |
Qingqi et al. | Multi-objective mapping for network-on-chip based on bio-inspired optimization algorithms | |
Teng et al. | A New Frog Leaping Algorithm Based on Simulated Annealing and Immunization Algorithm for Low-power Mapping in Network-on-chip. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190405 |
|
WD01 | Invention patent application deemed withdrawn after publication |