CN109587048A - 一种带有均衡策略的无虚通道容错路由算法 - Google Patents

一种带有均衡策略的无虚通道容错路由算法 Download PDF

Info

Publication number
CN109587048A
CN109587048A CN201710902003.8A CN201710902003A CN109587048A CN 109587048 A CN109587048 A CN 109587048A CN 201710902003 A CN201710902003 A CN 201710902003A CN 109587048 A CN109587048 A CN 109587048A
Authority
CN
China
Prior art keywords
node
network
balance policy
boundary
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710902003.8A
Other languages
English (en)
Inventor
邢筱丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710902003.8A priority Critical patent/CN109587048A/zh
Publication of CN109587048A publication Critical patent/CN109587048A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种带有均衡策略的无虚通道容错路由算法,设置相应的故障模型和故障绕行策略保障网络的可靠性,并将数据负载分配到其他空闲的通信节点上,使得空闲的带宽资源能被充分的利用,在保证网络不发生死锁的同时减少了过热通信节点的数量、缓解了局部过热和路径拥塞问题,降低了数据包的平均延迟,提升了NoC的性能。本发明的目的在保障网络可靠性的前提下充分利用片上网络的带宽资源并缓解局部过热和路径拥塞问题,最大化保障网络的性能。

Description

一种带有均衡策略的无虚通道容错路由算法
所属技术领域
本发明涉及片上网络设计,尤其涉及片上网络的可靠性设计。
背景技术
随着集成电路制造工艺的不断发展,集成在芯片上晶体管的数量也随之增多,已超过几十亿晶体管的规模,因此芯片上可以集成越来越多的IP核。随着芯片中IP核数量的增多,基于总线结构的片上系统(System-on-Chip, So C)将面临以下问题:可扩展性问题、不能真正实行并行通信而引起的通信效率问题、由于全局同步而引起的功耗和面积等问题,这些都是片上系统无法逾越的障碍。因此,为了解决传统的 So C 所面临的问题,片上网络(Network-on-Chip, NoC)作为一种全新的互联结构被提出来。片上网络不仅从通信架构上解决了传统SoC 所固有的问题,还采用了全局异步局部同步(Globally AsynchronousLocally Synchronous, GALS)的通信机制,使得NoC成为面向纳米工艺的新型体系结构。
伴随着芯片特征尺寸的持续下降、芯片密集度和复杂度的不断增大,芯片对制造工艺偏差、外界干扰和元器件老化变得越来越敏感,致使发生故障的可能性变大,而且芯片在使用过程中产生的热量会加剧故障发生的可能性.这些故障可能会使NoC性能急剧下降甚至直接瘫痪.因此,为了确保芯片工作的可靠性,必须要对芯片进行容错设计。
容错技术是片上网络NoC提供可靠性数据通信的关键技术之一,是影响网络吞吐量和延迟性能的重要因素。一个高效的容错路由算法能在NoC发生故障时,能在很大程度上降低No 的性能损失。容错路由算法是NoC容错技术中容忍永久性故障的主要方法。当前容错路由算法按照是否使用虚通道可分为基于虚通道的路由算法和无虚通道路由算。使用虚通道虽然可以解决死锁问题,并在一定程度上提升网络的吞吐量,但是会导致NoC硬件开销增大、硬件复杂度变大、带宽下降。此外,研究容错路由算法必须基于一定的故障模型,容错路由算法采用的故障模型按照故障粒度的大小可以分为区域故障模型、单故障模型和细粒度故障模型。然而,当前针对不同粒度故障模型NoC容错路由算法的研究还存在一些不足,主要体现在以下三个方面:(1)单故障模型容错路由算法采用“一步一比较”的数据传输方式,导致整个网络的平均延迟较高(2)现有细粒度故障模型处理链路故障的方式过于粗犷,使得节点内的很多有效资源无法得到充分的利用;(3)细粒度故障模型容错路由算法采用传统的“避绕容错”方式处理通道故障,导致数据的路由路径过长,整个NoC的网络性能较低。
然而,目前的容错方法只把工作都集中在容错上,而忽略了负载的均衡和功耗的分布,导致数据包在收发过程中平均延迟变大、网络中出现局部过热和路径拥塞等问题,严重影响了NoC的性能。因此有必要发明新型的具有均衡策略的容错路由算法来缓解局部过热和路径拥塞问题,提升片上网络的性能。
发明内容
本发明的目的在保障网络可靠性的前提下充分利用片上网络的带宽资源并缓解局部过热和路径拥塞问题,最大化保障网络的性能。
本发明解决其技术问题所采用的技术方案是:
一种带有均衡策略的无虚通道容错路由算法,设置相应的故障模型和故障绕行策略保障网络的可靠性,并将数据负载分配到其他空闲的通信节点上,使得空闲的带宽资源能被充分的利用,在保证网络不发生死锁的同时减少了过热通信节点的数量、缓解了局部过热和路径拥塞问题,降低了数据包的平均延迟,提升了NoC的性能。
所述的故障绕行策略将网络中的节点按照禁用节点、边界节点和非边界节点进行区分,非边界节点包含缓冲节点和自由节点,按照当前节点所处的边界类型施用不同的绕行规则,以确保在网络不发生死锁前提下,绕过所遇到的故障节点达到目的节点。
所述的故障模型定义安全节点、危险节点和边界节点以形成故障区和故障边界,并添加一类缓冲节点来解除部分转向限制,把数据负载分配到各条路径上,分利用网络中的空闲路径来缓解网络中局部拥塞和过热的问题。
所述的均衡策略是在遵循奇偶转向模型和最短路径的前提下,对存在多个输出端口的数据进行负载均衡。为了施行均衡策略,在每个路由节点中会有一个寄存器用于决定均衡模式下的数据的输出端口。
所述的不发生死锁特性通过保障故障绕行策略和均衡策略都基于奇偶转向模型进行扩展,利用奇偶转向模型的无死锁特性来保障发明算法不会发生死锁现象。
附图说明
图1表示的是算法流程图。
具体实施方式
一、定义危险节点:模型中包括安全节点、危险节点,边界节点和缓冲节点。所有的无故障节点在初始状态下都是安全节点,一个安全节点只要满足下面两个条件中的其中一个,则变为危险节点:1)在X轴和Y 轴的相邻位置上至少各有一个危险节点或故障节点,则该安全节点变为危险节点。2)在 X 轴的相邻位置上有一个危险节点或者故障节点,且在 X 轴的另外一个方向上的相邻点的Y 轴方向上有相邻的危险节点或者故障节点,则该安全节点变为危险节点。重复上述过程直到不再生成新的危险节点。最终把危险节点和故障节点统称为禁用节点,然后由这些禁用节点形成故障区。
二、边界节点的定义:为了给东向、西向路由的数据包提供足够多的转向许可,绕过所遇到的故障区,在故障区的东、西两个方向上会有两条边界。边界是与故障区相邻的安全节点转化而成,具体的生成方案为故障区形成之后,网络中只有禁用节点和安全节点.一个安全节点满足以下其中一种条件时,则变为边界节点:1)在Y轴方向上与禁用节点相邻的安全节点变为边界节点;2)在 X 轴方向上与禁用节点相距两跳之内的安全节点变成边界节点。通过顺序执行1、2过程生成边界节点,并由这些边界节点相互连接形成故障边界。
三、定义缓冲节点:缓冲节点则是由故障区南、北方向上的安全节点转变而成,根据缓冲节点的位置,可把其分为南边界缓冲节点和北边界缓冲节点.其转化方案在边界形成之后网络中会出现禁用节点、边界节点和安全节点,其中一些与边界节点相邻的安全节点满足以下任一条件时,将转化为缓冲节点:1)在Y轴负方向上与边界节点或者南边界节缓冲点相邻的安全节点变为南边界缓冲节点;2)在Y轴正方向上与边界节点或者北边界缓冲节点相邻的安全节点变为北边界缓冲节点;重复上述过程直到不再变化。缓冲节点离故障区较近,是否能施行均衡策略还需要对处于缓冲节点中的数据路由路径进行预判。
四、均衡路由算法设计,在故障模型的基础上均衡容错路由算法将在不同的节点施行不同的路由策略,以实现容错路由的同时对负载进行均衡,以提高NoC芯片的性能。算法流程图如图1所示,其具体步骤为:1)判断当前节点是否为目的节点,如果为目的节点,则将数据包吸收,否则转向步骤2;2)判断节点的类型和路由策略的执行.这里特别需要注意的是缓冲节点,当缓冲节点中的数据需要绕过故障区才能到达目的节点时,则施行故障绕行策略,反之,则施行均衡策略.边界节点和自由节点分别执行故障绕行策略和均衡策略。
五、故障绕行策略:在实施故障绕行策略时,网络中的节点只按禁用节点、边界节点和非边界节点进行区分,非边界节点包含缓冲节点和自由节点。由于禁用节点中不存在数据路由任务,在故障绕行策略中只考虑边界节点和非边界节点。按照当前所处的边界类型施用不同的绕行规则,以确保在网络不发生死锁前提下,绕过所遇到的故障节点达到目的节点。在叙述绕行策略之前,先对部分字母符号做以下定义:dx为数据包的目的节点横坐标与当前节点横坐标的差值,dy为数据包的目的节点纵坐标与当前节点纵坐标的差值,S为源节点,E 代表偶数列,O代表奇数列.算法将根据节点所处的位置,选择不同的绕行路径,其规则如下:
1) 如果当前节点为源节点,处于奇数列,且dy不为0,数据要向西发送到相邻的偶数列节点,反之,转向步骤2。
2) 如果当前节点为非边界节点,dy不为0,则优先进行Y方向路由.在dy等于0且dx不为0时,进行X方向路由。反之,当前节点为边界节点转步骤3。
3) 对于边界节点,如果数据包的路由方向与边界垂直,则根据边界节点的位置执行不同的绕行策略。数据包处于南、北边界时,只有当dy为0且dx大于0时向X轴正方向路由,其他情况一律沿X轴负方向绕行数据包。
六、均衡策略:均衡策略是在遵循奇偶转向模型和最短路径的前提下,对存在多个输出端口的数据进行负载均衡。为了施行均衡策略,在每个路由节点中会有一个4bit的寄存器用于决定均衡模式下的数据的输出端口。在最短路径的限定下,数据包有多个输出端口的必要条件是:dx、dy都不为0。因此,本发明做如下规定:1)dx、dy都大于0 时,均衡模式下的输出端口由 bit_0决定;2) dx大于0,而dy小于0时,均衡模式下的输出端口由bit_1决定;3) dx小于0,而dy大于0时,均衡模式下的输出端口由bit_2决定;4) dx、dy都小于0时,均衡模式下的输出端口由bit_3决定。数据包确定输出端口后会把相应的bit_x位取反,在下一个数据到达这个节点时能把它分配到另外一条路径上,以实现负载的均衡和空余的带宽资源的充分利用,提升NoC的性能。

Claims (5)

1.一种带有均衡策略的无虚通道容错路由算法,设置相应的故障模型和故障绕行策略保障网络的可靠性,并将数据负载分配到其他空闲的通信节点上,使得空闲的带宽资源能被充分的利用,在保证网络不发生死锁的同时减少了过热通信节点的数量、缓解了局部过热和路径拥塞问题,降低了数据包的平均延迟,提升了NoC的性能。
2.根据权利要求1所述的一种带有均衡策略的无虚通道容错路由算法,其故障绕行策略将网络中的节点按照禁用节点、边界节点和非边界节点进行区分,非边界节点包含缓冲节点和自由节点,按照当前节点所处的边界类型施用不同的绕行规则,以确保在网络不发生死锁前提下,绕过所遇到的故障节点达到目的节点。
3.根据权利要求1所述的一种带有均衡策略的无虚通道容错路由算法,其故障模型定义安全节点、危险节点和边界节点以形成故障区和故障边界,并添加一类缓冲节点来解除部分转向限制,把数据负载分配到各条路径上,分利用网络中的空闲路径来缓解网络中局部拥塞和过热的问题。
4.根据权利要求1所述的一种带有均衡策略的无虚通道容错路由算法,其均衡策略是在遵循奇偶转向模型和最短路径的前提下,对存在多个输出端口的数据进行负载均衡,为了施行均衡策略,在每个路由节点中会有一个寄存器用于决定均衡模式下的数据的输出端口。
5.根据权利要求1所述的一种带有均衡策略的无虚通道容错路由算法,其不发生死锁特性通过保障故障绕行策略和均衡策略都基于奇偶转向模型进行扩展,利用奇偶转向模型的无死锁特性来保障发明算法不会发生死锁现象。
CN201710902003.8A 2017-09-29 2017-09-29 一种带有均衡策略的无虚通道容错路由算法 Pending CN109587048A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710902003.8A CN109587048A (zh) 2017-09-29 2017-09-29 一种带有均衡策略的无虚通道容错路由算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710902003.8A CN109587048A (zh) 2017-09-29 2017-09-29 一种带有均衡策略的无虚通道容错路由算法

Publications (1)

Publication Number Publication Date
CN109587048A true CN109587048A (zh) 2019-04-05

Family

ID=65914495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710902003.8A Pending CN109587048A (zh) 2017-09-29 2017-09-29 一种带有均衡策略的无虚通道容错路由算法

Country Status (1)

Country Link
CN (1) CN109587048A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213162A (zh) * 2019-06-05 2019-09-06 中国人民解放军国防科技大学 一种面向大规模计算机系统的容错路由方法
CN110460523A (zh) * 2019-08-15 2019-11-15 电子科技大学 一种用于实现片上网络跨层路由机制的路由控制单元
CN114185844A (zh) * 2021-12-07 2022-03-15 浙江大学 一种适用于电力边缘计算的片上网路容错路由方法
CN114374651A (zh) * 2021-12-31 2022-04-19 海光信息技术股份有限公司 传输流量控制方法、片上网络、电子装置及存储介质
CN114866475A (zh) * 2022-04-06 2022-08-05 中山大学 一种片上网络拥塞控制方法、系统、装置及存储介质
CN115361332A (zh) * 2022-08-16 2022-11-18 中国工商银行股份有限公司 容错路由的处理方法及装置、处理器和电子设备
CN117785567A (zh) * 2024-02-28 2024-03-29 上海特高信息技术有限公司 一种基于连接方向的可重构容错策略及重构控制器

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213162A (zh) * 2019-06-05 2019-09-06 中国人民解放军国防科技大学 一种面向大规模计算机系统的容错路由方法
CN110460523A (zh) * 2019-08-15 2019-11-15 电子科技大学 一种用于实现片上网络跨层路由机制的路由控制单元
CN110460523B (zh) * 2019-08-15 2021-06-11 电子科技大学 一种用于实现片上网络跨层路由机制的路由控制单元
CN114185844A (zh) * 2021-12-07 2022-03-15 浙江大学 一种适用于电力边缘计算的片上网路容错路由方法
CN114185844B (zh) * 2021-12-07 2024-04-26 浙江大学 一种适用于电力边缘计算的片上网路容错路由方法
CN114374651A (zh) * 2021-12-31 2022-04-19 海光信息技术股份有限公司 传输流量控制方法、片上网络、电子装置及存储介质
CN114866475A (zh) * 2022-04-06 2022-08-05 中山大学 一种片上网络拥塞控制方法、系统、装置及存储介质
CN114866475B (zh) * 2022-04-06 2023-05-26 中山大学 一种片上网络拥塞控制方法、系统、装置及存储介质
CN115361332A (zh) * 2022-08-16 2022-11-18 中国工商银行股份有限公司 容错路由的处理方法及装置、处理器和电子设备
CN115361332B (zh) * 2022-08-16 2024-05-28 中国工商银行股份有限公司 容错路由的处理方法及装置、处理器和电子设备
CN117785567A (zh) * 2024-02-28 2024-03-29 上海特高信息技术有限公司 一种基于连接方向的可重构容错策略及重构控制器
CN117785567B (zh) * 2024-02-28 2024-05-28 上海特高信息技术有限公司 一种基于连接方向的可重构容错策略及重构控制器

Similar Documents

Publication Publication Date Title
CN109587048A (zh) 一种带有均衡策略的无虚通道容错路由算法
CN104579951B (zh) 片上网络中新颖的故障与拥塞模型下的容错方法
CN102387077B (zh) 具有容错功能的热量均衡片上网络路径选择方法
CN101834789B (zh) 面向包-电路交换片上路由器的回退转向路由算法及所用路由器
CN102882783B (zh) 基于tsv的三维集成电路的片上网络的拓扑架构、路由方法
CN102629912B (zh) 面向无缓冲片上网络的容错偏转路由方法及装置
CN102129418A (zh) 一种高端容错计算机系统及实现方法
CN102761475A (zh) 一种基于通道依赖关系图的片上互联网络容错路由方法
Neishaburi et al. ERAVC: Enhanced reliability aware NoC router
US10033666B2 (en) Techniques for virtual Ethernet switching of a multi-node fabric
Mortazavi et al. A fault-tolerant and congestion-aware architecture for wireless networks-on-chip
Taheri et al. Advertiser elevator: A fault tolerant routing algorithm for partially connected 3D Network-on-Chips
CN107171954A (zh) 容错路由方法、装置及片上网络
JPS63501663A (ja) マルチプロセッサ通信装置
US9081891B2 (en) Reconfigurable crossbar networks
Neishaburi et al. NISHA: A fault-tolerant NoC router enabling deadlock-free interconnection of subnets in hierarchical architectures
CN110336744A (zh) 一种无线片上网络中区域故障感知的容错路由方法
Rezaei et al. Fault-tolerant 3-D network-on-chip design using dynamic link sharing
Yang et al. A fault tolerance noc topology and adaptive routing algorithm
JP2015119387A (ja) 誤り耐性ルータ、これを使用するic、及び誤り耐性ルータの制御方法
Marcon et al. Phoenix NoC: A distributed fault tolerant architecture
Zhang et al. Very fine-grained fault-tolerant routing algorithm of NoC based on buffer reuse
Somasundaram Design of a Virtual Channel Router Architecture for Low Power on Mesh-of-Grid Topology for Network on Chip
Chen et al. An effective routing algorithm to avoid unnecessary link abandon in 2D mesh NoCs
Khichar et al. Fault aware adaptive routing algorithm for mesh based NoCs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190405