CN102387080A - 片上网络虫洞路由容错方法 - Google Patents

片上网络虫洞路由容错方法 Download PDF

Info

Publication number
CN102387080A
CN102387080A CN2011103214916A CN201110321491A CN102387080A CN 102387080 A CN102387080 A CN 102387080A CN 2011103214916 A CN2011103214916 A CN 2011103214916A CN 201110321491 A CN201110321491 A CN 201110321491A CN 102387080 A CN102387080 A CN 102387080A
Authority
CN
China
Prior art keywords
flit
data
packet
network
data packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011103214916A
Other languages
English (en)
Inventor
宋向明
付宇卓
蒋江
刘婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN2011103214916A priority Critical patent/CN102387080A/zh
Publication of CN102387080A publication Critical patent/CN102387080A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明揭示了一种片上网络虫洞路由容错方法,所述方法包括如下步骤:在发送端,IP Core将数据包发送到NI接口,在NI接口将数据包分解为flit进行传输;如果是关键的数据包,对于data flit,每个data flit都连续发送2次或2次以上;如果不是关键的数据包,则data flit只发送一次;在接收端,路由器首先接收head flit,对head flit的目的地址部分进行三模冗余判断,确定此数据包的目的地是当前NoC块tile;接着接收data flit,如果是关键数据包,则每个data flit都是双模冗余的,路由器在接收时进行奇偶校验和双模冗余校验,将正确的结果提交给NI接口;如果发现全部data flit都是错误的,则报告NI接口该数据包出错,将错误恢复交给上层协议处理。本发明可提高片上网络数据传输的可靠性、灵活性。

Description

片上网络虫洞路由容错方法
技术领域
本发明属于片上网络技术领域,涉及一种容错方法,尤其涉及一种片上网络虫洞路由容错方法。
背景技术
随着IC制程向深亚微米阶段发展,单个芯片集成的IP越来越多,传统的总线不能满足带宽和时延需求,片上网络NoC(Network on Chip)因此被提出。在特征尺寸减小时,芯片更容易受到串扰,电磁干扰,电子迁移等因素引起频繁的软错误,NoC可靠性成为亟待解决的问题。软错误主要是由于干扰引起的,比如SEU(Single Event Upset),阿尔法射线、电子迁移,噪声等引起的路由节点或链路中数据或控制信息的暂时出错,干扰消失的时候,暂时性故障也会随之消失,即这种错误是瞬时的,通过一定机制是可以恢复的。
现有的容错机制大多是针对硬错误的,对于软错误的容错,一般有纠错码和检错重传以及泛洪。其中纠错码的硬件开销和功耗比较大,而且容错能力一般,检错重传具有较高的延时,泛洪算法容错能力高,但是功耗很大,且降低网络吞吐。容错机制的研究就是在功耗、面积、延时以及可靠性之间取平衡。针对不同的应用和不同的数据,对于可靠性的需求也有差别,利用这个一般性,可以对上述因素取一个更好的折中,满足应用的设计要求。
发明内容
本发明所要解决的技术问题是:提供一种片上网络虫洞路由容错方法,可提高片上网络数据传输的可靠性、灵活性。
为解决上述技术问题,本发明采用如下技术方案:
一种片上网络虫洞路由容错方法,所述方法包括如下步骤:
对于片上网络NoC的每个NoC块tile,NI接口是连接IP核IP Core与路由器的接口;
在发送端,IP Core将数据包发送到NI接口,在NI接口将数据包分解为flit进行传输,数据包由head flit、一个或多个data flit、tail flit组成;对于head flit,对目的地址部分采用三模冗余;如果是关键的数据包,对于data flit,每个data flit都连续发送2次或2次以上;如果不是关键的数据包,则data flit只发送一次;
在接收端,路由器首先接收head flit,对head flit的目的地址部分进行三模冗余判断,确定此数据包的目的地是当前NoC块tile;接着接收data flit,如果是关键数据包,则每个data flit都是双模冗余的,路由器在接收时进行奇偶校验和双模冗余校验,将正确的结果提交给NI接口;如果发现全部dataflit都是错误的,则报告NI接口该数据包出错,将错误恢复交给上层协议处理。
作为本发明的一种优选方案,在发送端,所有的flit都加上简单的奇偶校验或者循环冗余校验。在发送端,对于tail flit不做修改。
作为本发明的一种优选方案,在接收端,对于head flit和tail flit的校验依赖奇偶校验或者循环冗余校验。
作为本发明的一种优选方案,在发送端,如果是关键的数据包,对于dataflit,每个data flit都连续发送2次。
进一步地,在接收端,对于关键数据包,如果第一个data flit出错,选择第二个data flit;如果两个都出错,则标识该数据包为错误数据包。
作为本发明的一种优选方案,数据包是否是关键数据的标记设置在headflit的payload中。
本发明的有益效果在于:本发明提出的片上网络虫洞路由容错方法,将片上网络传输的关键数据进行双模冗余,在接收端进行校验,获得正确的值,相比重传和泛洪的方法,在相同可靠性下,可以降低硬件开销,并具有更好的性能。本发明可提高片上网络数据传输的可靠性、灵活性。
附图说明
图1为传统片上网络packet结构的示意图。
图2为传统的head flit结构的示意图。
图3为本发明中数据包packet结构的示意图。
图4为本发明中head flit结构的示意图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例一
本发明揭示了一种片上网络虫洞路由容错方法。每个数据包packet,都由head flit、data flit和tail flit组成。
在接收端,对于head flit,对目的地址部分采用三模冗余。在head flit中指明该数据包是否是关键的数据包,如果不是关键的数据包就使用图1中传统的数据包格式;如果是关键的数据包,就采用图3中的数据包格式,增强数据的抗干扰能力。IP core生成上述带有关键数据标记符的数据后,将数据传入网络接口NI中,NI接口根据标记信息,将数据包分解成flit,关键数据的标记放在head flit的payload中,如果是关键数据,就生成图4中的head flit格式,如果是非关键数据,就生成图2中传统的head flit。
路由器从NI接口中取得分解为flit的数据,若发现该数据是关键数据,则启动计数器,对于data flit需要连续传输两次;否则只需要传输一次。在网络中传统的数据包由m个data flit和1个head flit以及1个tail flit构成,本发明提出的关键数据包则由2m个data flit和1个head flit以及1个tail flit构成;数据的可靠性因此达到提高。
在接收端,接收过程是上述过程的逆过程,路由器根据head flit的关键信息标识,正确接收余下的data flit和tail flit。将接收到的flit进行校验,如果是关键数据,则可以有两次选择的机会,如果第一个data flit出错,可以选择第二个data flit。如果两个都出错,则标识该数据包为错误数据包(实验证明此概率非常小)。
本发明有助于提高片上网络数据传输的可靠性,灵活性高,适用于多种路由算法和流控制方法,对现有的片上网络结构只需要很小的修改,可以实现对程序可见和非可见的配置,容错性能显著。
实施例二
本实施例与实施例一的区别在于,本实施例中,在发送端,对于关键的数据包,每个data flit都连续发送2次以上;如果不是关键的数据包,则data flit只发送一次;
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

Claims (7)

1.一种片上网络虫洞路由容错方法,其特征在于,所述方法包括如下步骤:
对于片上网络NoC的每个NoC块tile,NI接口是连接IP核IP Core与路由器的接口;
在发送端,IP Core将数据包发送到NI接口,在NI接口将数据包分解为flit进行传输,数据包由head flit、一个或多个data flit、tail flit组成;对于head flit,对目的地址部分采用三模冗余;如果是关键的数据包,对于data flit,每个data flit都连续发送2次或2次以上;如果不是关键的数据包,则data flit只发送一次;
在接收端,路由器首先接收head flit,对head flit的目的地址部分进行三模冗余判断,确定此数据包的目的地是当前NoC块tile;接着接收data flit,如果是关键数据包,则每个data flit都是双模冗余的,路由器在接收时进行奇偶校验和双模冗余校验,将正确的结果提交给NI接口;如果发现全部data flit都是错误的,则报告NI接口该数据包出错,将错误恢复交给上层协议处理。
2.根据权利要求1所述的片上网络虫洞路由容错方法,其特征在于:
在发送端,所有的flit都加上简单的奇偶校验或者循环冗余校验。
3.根据权利要求1所述的片上网络虫洞路由容错方法,其特征在于:
在发送端,对于tail flit不做修改。
4.根据权利要求1所述的片上网络虫洞路由容错方法,其特征在于:
在接收端,对于head flit和tail flit的校验依赖奇偶校验或者循环冗余校验。
5.根据权利要求1所述的片上网络虫洞路由容错方法,其特征在于:
在发送端,如果是关键的数据包,对于data flit,每个data flit都连续发送2次。
6.根据权利要求5所述的片上网络虫洞路由容错方法,其特征在于:
在接收端,对于关键数据包,如果第一个data flit出错,选择第二个data flit;如果两个都出错,则标识该数据包为错误数据包。
7.根据权利要求1所述的片上网络虫洞路由容错方法,其特征在于:
数据包是否是关键数据的标记设置在head flit的payload中。
CN2011103214916A 2011-10-21 2011-10-21 片上网络虫洞路由容错方法 Pending CN102387080A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103214916A CN102387080A (zh) 2011-10-21 2011-10-21 片上网络虫洞路由容错方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103214916A CN102387080A (zh) 2011-10-21 2011-10-21 片上网络虫洞路由容错方法

Publications (1)

Publication Number Publication Date
CN102387080A true CN102387080A (zh) 2012-03-21

Family

ID=45826076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103214916A Pending CN102387080A (zh) 2011-10-21 2011-10-21 片上网络虫洞路由容错方法

Country Status (1)

Country Link
CN (1) CN102387080A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710530A (zh) * 2012-06-28 2012-10-03 黑龙江大学 可配置片上网络容错方法
CN102904807A (zh) * 2012-10-10 2013-01-30 清华大学 一种通过数据分割传输实现容错可重构片上网络的方法
CN103618673A (zh) * 2013-11-15 2014-03-05 中国航空无线电电子研究所 一种保障服务质量的片上网络路由方法
CN105095147A (zh) * 2014-05-21 2015-11-25 华为技术有限公司 片上网络的Flit传输方法及装置
CN113162906A (zh) * 2021-02-26 2021-07-23 西安微电子技术研究所 一种NoC传输方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075961A (zh) * 2007-06-22 2007-11-21 清华大学 片上网络设计用的一种自适应打包方法
CN101335606A (zh) * 2008-07-25 2008-12-31 中国科学院计算技术研究所 一种高可靠片上网络路由器系统及其设计方法
WO2009140707A1 (en) * 2008-05-21 2009-11-26 Technische Universität Wien Cross-domain soc architecture for dependable embedded applications
CN101753388A (zh) * 2008-11-28 2010-06-23 中国科学院微电子研究所 适用于多核处理器片上和片间扩展的路由及接口装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075961A (zh) * 2007-06-22 2007-11-21 清华大学 片上网络设计用的一种自适应打包方法
WO2009140707A1 (en) * 2008-05-21 2009-11-26 Technische Universität Wien Cross-domain soc architecture for dependable embedded applications
CN101335606A (zh) * 2008-07-25 2008-12-31 中国科学院计算技术研究所 一种高可靠片上网络路由器系统及其设计方法
CN101753388A (zh) * 2008-11-28 2010-06-23 中国科学院微电子研究所 适用于多核处理器片上和片间扩展的路由及接口装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIAO JIAJIA等: "EXPLOITING LOW COST RELIABILITY FOR NOC TRANSIENT ROUTING ERROR", 《2011 3RD INTERNATIONAL CONFERENCE ON COMPUTER TECHNOLOGY AND DEVELOPMENT (ICCTD 2011)》, vol. 2, 27 November 2011 (2011-11-27), pages 289 - 293 *
MURALI, S.等: "A multi-path routing strategy with guaranteed in-order packet delivery and fault-tolerance for networks on chip", 《DESIGN AUTOMATION CONFERENCE, 2006 43RD ACM/IEEE 》, 28 July 2006 (2006-07-28), pages 845 - 848, XP010936620, DOI: doi:10.1109/DAC.2006.229239 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710530A (zh) * 2012-06-28 2012-10-03 黑龙江大学 可配置片上网络容错方法
CN102710530B (zh) * 2012-06-28 2015-01-14 黑龙江大学 可配置片上网络容错方法
CN102904807A (zh) * 2012-10-10 2013-01-30 清华大学 一种通过数据分割传输实现容错可重构片上网络的方法
CN103618673A (zh) * 2013-11-15 2014-03-05 中国航空无线电电子研究所 一种保障服务质量的片上网络路由方法
CN105095147A (zh) * 2014-05-21 2015-11-25 华为技术有限公司 片上网络的Flit传输方法及装置
US10129147B2 (en) 2014-05-21 2018-11-13 Huawei Technologies Co., Ltd. Network-on-chip flit transmission method and apparatus
CN113162906A (zh) * 2021-02-26 2021-07-23 西安微电子技术研究所 一种NoC传输方法

Similar Documents

Publication Publication Date Title
CN102387080A (zh) 片上网络虫洞路由容错方法
US7876751B2 (en) Reliable link layer packet retry
CN103220218B (zh) 纵向堆叠组网中防止环路的方法和装置
JP4619806B2 (ja) インターネット・プロトコル・パケットの複数のコピーの伝搬
CN103716130A (zh) 提高网络传输可靠性的物理层自适应处理方法
US8514885B2 (en) Using variable length packets to embed extra network control information
CN105162868B (zh) 一种教师端与学生端之间的可靠数据传输方法
CN107968756A (zh) 高性能互连链路层
Ssu et al. Detection and diagnosis of data inconsistency failures in wireless sensor networks
CN110518959B (zh) 一种基于mpls与dtn的leo卫星网络通信方法及其系统
CN103248467A (zh) 基于片内连接管理的rdma通信方法
US11139995B2 (en) Methods and router devices for verifying a multicast datapath
CN106487673B (zh) 一种基于三模冗余的检错重传容错路由单元
EP3668018B1 (en) Efficient self-checking redundancy comparison in a network
CN110166354A (zh) 一种包含片上网络容错路由的数据处理系统
Khichar et al. Fault tolerant dynamic XY-YX routing algorithm for network on-chip architecture
WO2015027738A1 (zh) 一种传输、接收元数据的方法、开放流逻辑交换机
Fochi et al. An integrated method for implementing online fault detection in NoC-based MPSoCs
CN106301871A (zh) 一种基于lacp的转发检测方法及系统
Ali et al. An efficient fault tolerant mechanism to deal with permanent and transient failures in a network on chip
CN102710530B (zh) 可配置片上网络容错方法
Anisi et al. FEDA: fault-tolerant energy-efficient data aggregation in wireless sensor networks
Nunez-Yanez et al. Adaptive routing strategies for fault-tolerant on-chip networks in dynamically reconfigurable systems
Schwiebert et al. Improved fault recovery for core based trees
Borhani et al. A new deterministic fault tolerant wormhole routing strategy for k-ary 2-cubes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120321