CN106603276B - 一种serdes链路组的故障处理方法和故障处理装置 - Google Patents

一种serdes链路组的故障处理方法和故障处理装置 Download PDF

Info

Publication number
CN106603276B
CN106603276B CN201611048858.0A CN201611048858A CN106603276B CN 106603276 B CN106603276 B CN 106603276B CN 201611048858 A CN201611048858 A CN 201611048858A CN 106603276 B CN106603276 B CN 106603276B
Authority
CN
China
Prior art keywords
lanes
state
serdes link
link group
lane
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611048858.0A
Other languages
English (en)
Other versions
CN106603276A (zh
Inventor
杨艳伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201611048858.0A priority Critical patent/CN106603276B/zh
Publication of CN106603276A publication Critical patent/CN106603276A/zh
Application granted granted Critical
Publication of CN106603276B publication Critical patent/CN106603276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明实施例涉及通信领域,尤其涉及一种SERDES链路组的故障处理方法和故障处理装置,用以在SERDES链路组中存在故障的LANE的情况下保证SERDES链路组的工作性能。本发明实施例适用于初始配置N条LANE、且包括N+M条LANE的SERDES链路组,若N条LANE中的K条LANE处于故障状态,则从处于空闲状态、且处于非故障状态的LANE中确定出K条LANE,并将K条LANE设置为工作状态,从而保证了出现故障的情况下SERDES链路组中处于工作状态且处于非故障状态的LANE也为N条,进而提升了SERDES链路组的稳定性。

Description

一种SERDES链路组的故障处理方法和故障处理装置
技术领域
本发明实施例涉及通信领域,尤其涉及一种SERDES链路组的故障处理方法和故障处理装置。
背景技术
串行器/解串行器(SERializer/DESerializer,简称SERDES)是一种主流的时分复用((Time Division Multiplexing,简称TDM)、点对点(peer-to-peer,简称P2P)的串行通信技术。SERDES链路组在发送端和接收端之间通常设置发送通道和接收通道,一个发送通道和一个接收通道称之为一个通道(英文称为LANE)。一组LANE,称之为一个SERDES链路组。
具体来说,SERDES链路组中的每个LANE中,在发送端多路低速并行信号被转换成高速串行信号,经过传输媒体传输至接收端,比如通过光缆或铜线传输至接收端,在接收端将接收到的高速串行信号重新转换成低速并行信号。可见,该串行通信技术充分利用传输媒体的信道容量,减少所需的传输信道和器件引脚数目,大大降低通信成本。该串行通信技术可以提升信号的传输速度,并且降低通信成本。
现有技术中SERDES在串行总线(PCI-Express,简称PCIe)中的应用通常来说有多种规格,比如GEN3X1、X2、X4、X8、X16等等,不同的规格中SERDES链路组对应包括不同的LANE的数量。比如,在GEN3X1、X2、X4、X8、X16中,SERDES链路组中包括的LANE的数量分别为1、2、4、8、16。
现有技术中,当一个SERDES链路组中的一个LANE存在故障时,会导致该SERDES链路组的工作性能下降,严重的可能导致该SERDES中所有的LANE均不能正常工作。
发明内容
本发明实施例提供一种SERDES链路组的故障处理方法和故障处理装置,用以在SERDES链路组中存在故障的LANE的情况下保证SERDES链路组的工作性能。
第一方面,本发明实施例提供一种串行器/解串行器SERDES链路组的故障处理方法,适用于包括初始配置N条通道LANE的SERDES链路组,SERDES链路组中包括N+M条LANE;其中,N和M分别为大于等于1的整数;方法包括:在确定SERDES链路组中处于工作状态的N条LANE中的K条LANE处于故障状态的情况下,其中,K为大于等于1、且小于等于N的整数:从N+M条LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K条LANE;将K条LANE设置为工作状态。
由于SERDES链路组初始配置N条LANE,因此SERDES链路组的工作能力即需要靠N条LANE的正常工作来保证,一旦N条LANE中的K条LANE处于故障状态,则从处于空闲状态、且处于非故障状态的LANE中确定出K条LANE,并将K条LANE设置为工作状态,从而保证了即使SERDES链路组中的K条LANE出现故障,SERDES链路组中处于工作状态且处于非故障状态的LANE也能保证为N条,因此在SERDES链路组中存在故障的LANE的情况下,本发明实施例中的SERDES链路组的工作性能也保证为N条LANE的工作能力,工作性能并未下降,进而提升了SERDES链路组的稳定性。
可选地,在确定SERDES链路组中处于工作状态的N条LANE中的K条LANE发生故障的情况下之后,还包括:将K条LANE设置为空闲状态和故障状态;上报用于指示K条LANE处于故障状态的指示信息。本发明实施例中可周期性检测每条LANE的状态,若已发生故障的LANE已经被修复,则将被修复的LANE设置为非故障状态。如此,可实现故障修复快,上层系统不感知的目的。
可选地,N+M条LANE包括:N条初始化LANE和M条冗余LANE;从N+M条LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K条LANE,将K条LANE设置为工作状态,包括:将N条初始化LANE中的处于空闲状态、且处于非故障状态的P条初始化LANE设置为工作状态;其中,P为大于等于1、且小于等于K的整数;从M条冗余LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K-P条LANE,并将K-P条LANE设置为工作状态。如此,若处于工作状态的N条LANE中存在K条LANE发生了故障,则先从初始化LANE中选择可以重新启用的LANE,之后再从M条冗余LANE中选择可以重新启用的LANE,如此,使SERDES链路组尽可能的使用自身初始化配置的LANE,为其它共享该M条冗余LANE的SERDES链路组提供更加充足的LANE。
可选地,M条冗余LANE为多个SERDES链路组共享的M条冗余LANE;多个SERDES链路组包括SERDES链路组。如此,可在保证多个SERDES链路组的工作稳定性的情况下尽可能的节省冗余LANE的数量。
可选地,K小于等于M和N中的较小值。具体来说,M小于N,则K应小于等于N,若M大于N,则K小于等于N。若M等于N,则K小于等于N或者K小于等于M。如此,在M小于N的情况下,M应为系统中可能出现故障的LANE的数量。在M大于N的情况下,则K是N条LANE中出现故障的LANE的数量,因此K一定小于等于N,进一步保证了SERDES链路组的工作性能。
可选地,在确定SERDES链路组中处于工作状态的N条LANE中的K条LANE发生故障的情况下之前,还包括:以第一时长为周期周期性检测SERDES链路组中处于工作状态的N条LANE中每条LANE是处于故障状态还是非故障状态;以第二时长为周期周期性检测SERDES链路组中处于空闲状态的M条LANE中每条LANE是处于故障状态还是非故障状态;其中,第一时长小于第二时长。如此,一方面可以更快速的检测处于工作状态的N条LANE中每条LANE是否发生了故障,从而可更加及时准确的保证SERDES链路组的工作能力,另一方面,也可及时的将发生故障且已经修复的LANE的状态变更为非故障状态,以便在后续需要再次从空闲状态中选取LANE时有充足的LANE可供选择,进而提高SERDES链路组的工作性能的稳定性。
第二方面,本发明实施例提供一种SERDES链路组的故障处理装置,用于实现上述第一方面中的任意一种方法,包括相应的功能模块,分别用于实现以上方法中的步骤。
第三方面,本发明实施例提供一种SERDES链路组,SERDES链路组中包括N+M条通道LANE和如第二方面,的故障处理装置.其中,N+M条LANE中包括初始配置N条LANE;其中,N和M分别为大于等于1的整数。
本发明实施例适用于初始配置N条LANE的SERDES链路组,SERDES链路组中包括N+M条LANE,由于SERDES链路组初始配置N条LANE,因此SERDES链路组的工作能力即需要靠N条LANE的正常工作来保证,一旦N条LANE中的K条LANE处于故障状态,则从处于空闲状态、且处于非故障状态的LANE中确定出K条LANE,并将K条LANE设置为工作状态,从而保证了即使SERDES链路组中的K条LANE出现故障,SERDES链路组中处于工作状态且处于非故障状态的LANE也能保证为N条,因此在SERDES链路组中存在故障的LANE的情况下,本发明实施例中的SERDES链路组的工作性能也保证为N条LANE的工作能力,工作性能并未下降,进而提升了SERDES链路组的稳定性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。
图1为本发明实施例适用一种SERDES链路组的结构示意图;
图2为本发明实施例提供的一种SERDES链路组的故障处理方法的流程示意图;
图3为本发明实施例提供的一种SERDES链路组的结构示意图;
图4为本发明实施例提供的一种包括多个SERDES链路组的结构示意图;
图5为本发明实施例提供的一种SERDES链路组的故障处理装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例中所提供的方案可应用于终端的硬件电路结构中。终端可为各种能够实现通信的设备,比如手机、平板电脑和服务器等等。本发明实施例所提供的方案可具体用于终端的背板的电路连接中,比如用于服务器的背板上,比如用于串行总线(PCI-Express,简称PCIe)的SERDES链路组,或者用于网口的SERDES链路组等等。
用于PCIe的SERDES链路组通常来说有多种规格,比如GEN3X1、X2、X4、X8、X16等等,不同的规格中SERDES链路组对应包括不同的LANE的数量。比如,在GEN3X1、X2、X4、X8、X16中,SERDES链路组中包括的LANE的数量分别为1、2、4、8、16。SERDES链路组在10GE、40GE和100GE背板中的应用如下所示:
10GBASE-KR背板:1条LANE;通信速度10Gb/s(G比特每秒);应用于PHY;条款(Clause)72;
40GBASE-KR4背板:4条LANE;通信速度40Gb/s;应用于PHY(Clause 84);
100GBASE-KR4背板:4条LANE;通信速度100Gb/s;应用于PHY(Clause93);
100GBASE-KP4背板:4条LANE;通信速度100Gb/s;应用于PHY(Clause94)。
可见,在不同规格的背板中所使用的SERDES链路组中包括的LANE的数量也不同,随着通讯速度的提升,SERDES链路组的LANE数量在不断增加。且,SERDES链路组技术可充分利用传输媒体的信道容量,减少所需的传输信道和器件引脚数目,大大降低通信成本。该串行通信技术可以提升信号的传输速度,并且降低通信成本。
图1示出了本发明实施例适用一种SERDES链路组的结构示意图。如图1所示,该SERDES链路组101包括发送端102和接收端103,发送端102和接收端103之间共配置N+M条LANE104。其中,初始配置N条LANE,之后冗余配置M条LANE。每条LANE中包括一条发送通道和一条接收通道。SERDES链路组中的每个LANE中,在发送端多路低速并行信号被转换成高速串行信号,经过传输媒体传输至接收端,比如通过光缆或铜线传输至接收端,在接收端将接收到的高速串行信号重新转换成低速并行信号。
SERDES链路组初始配置N条LANE表示该SERDES链路组的工作能力为N条LANE处于正常工作状态的工作能力。举个例子,用于PCIe的SERDES链路组的规格为X4,即该SERDES链路组初始配置4条LANE,该X4的SERDES链路组中在4条LANE处于正常工作状态的情况下,该X4的SERDES链路组的工作能力达到最大。X4的SERDES链路组中处于正常工作状态的LANE的数量小于4,比如为2、3等,则X4的SERDES链路组的工作性能下降。若该X4的SERDES链路组配置大于4条的LANE处于正常工作状态,比如配置5、6条等等,则X4的SERDES链路组也无法实现5条LANE同时工作的性能,其工作能力可能仍为4条LANE处于正常工作状态的情况下的工作能力,或者由于为该X4的SERDES链路组多配置了几条处于工作状态的LANE,可能导致其工作紊乱,从而降低工作性能。
但SERDES链路组中的LANE通常可能会因为各种原因产生故障,比如静电释放(Electro-Static discharge,简称ESD)、倒针、有杂质等等。SERDES链路组中的LANE发生故障可能会导致SERDES链路组的工作性能下降,严重的可能导致该SERDES中所有的LANE均不能正常,还可能导致单板故障,以致需更换硬件单板。为了实现即使在SERDES链路组中存在故障的LANE的情况下仍能保证SERDES链路组的工作性能的目的,本发明实施例提供的以下解决方案。
图2示例性示出了本发明实施例提供的一种SERDES链路组的故障处理方法的流程示意图。
基于上述内容,如图2所示,本发明实施例提供的一种SERDES链路组的故障处理方法,适用于包括初始配置N条通道LANE的SERDES链路组,SERDES链路组中包括N+M条LANE;其中,N和M分别为大于等于1的整数;方法可由设置于SERDES链路组的故障处理装置执行,该方法包括:
步骤201,故障处理装置在确定SERDES链路组中处于工作状态的N条LANE中的K条LANE处于故障状态的情况下,其中,K为大于等于1、且小于等于N的整数:
步骤202,故障处理装置从N+M条LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K条LANE;
步骤203,故障处理装置将K条LANE设置为工作状态。
本发明实施例中每条LANE对应四个状态,分别为工作状态和空闲状态,以及故障状态和非故障状态。具体来说,LANE在进行工作,则该LANE位于工作状态,若LANE未进行工作,则该LANE处于空闲状态,LANE处于空闲状态也就是说该LANE处于被屏蔽状态,不用于传输数据。若该LANE发生了故障,则该LANE处于故障状态,若该LANE未发生故障,或者所发生的故障已经被修复,则该LANE处于非故障状态。
本发明实施例中还提供一种可选地方案,即在确定SERDES链路组中处于工作状态的N条LANE中的K条LANE处于故障状态的情况下,从N+M条LANE中的处于非故障状态的LANE中确定出N条LANE,将K条LANE设置为工作状态。即在该组SERDES链路组的LANE出现故障时,重新协商确定出N条LANE作为该组SERDES链路组的LANE。
本发明实施例适用于初始配置N条LANE的SERDES链路组,SERDES链路组中包括N+M条LANE,由于SERDES链路组初始配置N条LANE,因此SERDES链路组的工作能力即需要靠N条LANE的正常工作来保证,一旦N条LANE中的K条LANE处于故障状态,则从处于空闲状态、且处于非故障状态的LANE中确定出K条LANE,并将K条LANE设置为工作状态,从而保证了即使SERDES链路组中的K条LANE出现故障,SERDES链路组中处于工作状态且处于非故障状态的LANE也能保证为N条,因此在SERDES链路组中存在故障的LANE的情况下,本发明实施例中的SERDES链路组的工作性能也保证为N条LANE的工作能力,工作性能并未下降,进而提升了SERDES链路组的稳定性。
可选地,在上述步骤202之后,将K条LANE设置为空闲状态和故障状态;上报用于指示K条LANE处于故障状态的指示信息。本发明实施例中可周期性检测每条LANE的状态,若已发生故障的LANE已经被修复,则将被修复的LANE设置为非故障状态。如此,可实现故障修复快,上层系统不感知的目的。检测每条LANE的状态可由多种方式,比如电平检测方法等等,本发明实施例不做限制。
可选地,在确定SERDES链路组中处于工作状态的N条LANE中的K条LANE发生故障的情况下之前,还包括:以第一时长为周期周期性检测SERDES链路组中处于工作状态的N条LANE中每条LANE是处于故障状态还是非故障状态;以第二时长为周期周期性检测SERDES链路组中处于空闲状态的M条LANE中每条LANE是处于故障状态还是非故障状态;其中,第一时长小于第二时长。如此,一方面可以更快速的检测处于工作状态的N条LANE中每条LANE是否发生了故障,从而可更加及时准确的保证SERDES链路组的工作能力,另一方面,也可及时的将发生故障且已经修复的LANE的状态变更为非故障状态,以便在后续需要再次从空闲状态中选取LANE时有充足的LANE可供选择,进而提高SERDES链路组的工作性能的稳定性。
可选地,N+M条LANE包括:N条初始化LANE和M条冗余LANE。图3示例性示出了本发明实施例提供的一种SERDES链路组的结构示意图,如图3所示,SERDES链路组301包括发送端302和接收端303,发送端302和接收端303之间共配置N条初始化LANE304和M条冗余LANE305。
可选地,从N+M条LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K条LANE,将K条LANE设置为工作状态,包括:将N条初始化LANE中的处于空闲状态、且处于非故障状态的P条初始化LANE设置为工作状态;其中,P为大于等于1、且小于等于K的整数;从M条冗余LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K-P条LANE,并将K-P条LANE设置为工作状态。如此,若处于工作状态的N条LANE中存在K条LANE发生了故障,则先从初始化LANE中选择可以重新启用的LANE,之后再从M条冗余LANE中选择可以重新启用的LANE,如此,使SERDES链路组尽可能的使用自身初始化配置的LANE,为其它共享该M条冗余LANE的SERDES链路组提供更加充足的LANE。
可选地,M条冗余LANE为多个SERDES链路组共享的M条冗余LANE;多个SERDES链路组包括SERDES链路组。如此,可在保证多个SERDES链路组的工作稳定性的情况下尽可能的节省冗余LANE的数量。另一方面可尽可能的保图4示例性示出了本发明实施例提供的一种包括多个SERDES链路组的结构示意图,如图4所示,SERDES链路组一401包括SERDES链路组一发送端402和SERDES链路组一接收端403,SERDES链路组一发送端402和SERDES链路组一接收端403之间配置SERDES链路组一N条初始化LANE407,以及M条冗余LANE408。M条冗余LANE408两端分别连接SERDES链路组一发送端402和SERDES链路组一接收端403。
该M条冗余LANE408为SERDES链路组一401和SERDES链路组二404共享的LANE。如图4所示,SERDES链路组二404包括SERDES链路组二发送端405和SERDES链路组二接收端406,SERDES链路组二发送端405和SERDES链路组二接收端406之间配置SERDES链路组二N条初始化LANE409,以及M条冗余LANE408。M条冗余LANE408两端也分别连接SERDES链路组二发送端405和SERDES链路组二接收端406。
本发明实施例中图4中仅示例性示出了两个SERDES链路组共享M条冗余LANE的情况,具体实施中,可存在多个,比如3个、4个等等链路组共享M条冗余LANE的情况,也可一个SERDES链路组对应一个M条冗余LANE。
可选地,本发明实施例中,M可大于N,M也可小于等于N,M与N的关系本发明实施例中不做限制,具体可根据实际情况进行设置。可选地,K小于等于M和N中的较小值。具体来说,M小于N,则K应小于等于N,若M大于N,则K小于等于N。若M等于N,则K小于等于N或者K小于等于M。如此,在M小于N的情况下,M应为系统中可能出现故障的LANE的数量。在M大于N的情况下,则K是N条LANE中出现故障的LANE的数量,因此K一定小于等于N,进一步保证了SERDES链路组的工作性能。
图5示例性示出了本发明实施例提供的一种SERDES链路组的故障处理装置的结构示意图。
基于相同构思,本发明实施例提供一种SERDES链路组的故障处理装置,用于执行上述实施例中所提供的任一个方案,适用于包括初始配置N条通道LANE的SERDES链路组501,SERDES链路组501中包括N+M条LANE504;其中,N和M分别为大于等于1的整数;故障处理装置包括检测模块和控制模块。SERDES链路组501包括发送端502和接收端503,故障处理装置可安装于发送端502,也可安装于接收端503,或者在发送端502和接收端503分别安装一个。如,5所示,检测模块可为图5中发送端的检测模块505,也可为接收端的检测模块507,控制模块可为图5中发送端的控制模块506,也可为接收端的控制模块508。
检测模块,用于确定出SERDES链路组中处于工作状态的N条LANE中的每条LANE是处于故障状态还是非故障状态,其中,K为大于等于1、且小于等于N的整数;
控制模块,用于在通过检测模块确定SERDES链路组中处于工作状态的N条LANE中的K条LANE处于故障状态的情况下,从N+M条LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K条LANE;将K条LANE设置为工作状态。
可选地,控制模块,还用于:将K条LANE设置为空闲状态和故障状态;上报用于指示K条LANE处于故障状态的指示信息。
可选地,N+M条LANE包括:N条初始化LANE和M条冗余LANE;控制模块,用于:将N条初始化LANE中的处于空闲状态、且处于非故障状态的P条初始化LANE设置为工作状态;其中,P为大于等于1、且小于等于K的整数;从M条冗余LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K-P条LANE,并将K-P条LANE设置为工作状态。
可选地,M条冗余LANE为多个SERDES链路组共享的M条冗余LANE;多个SERDES链路组包括SERDES链路组。
可选地,检测模块,用于:以第一时长为周期周期性检测SERDES链路组中处于工作状态的N条LANE中每条LANE是处于故障状态还是非故障状态;以第二时长为周期周期性检测SERDES链路组中处于空闲状态的M条LANE中每条LANE是处于故障状态还是非故障状态;其中,第一时长小于第二时长。
本发明实施例适用于初始配置N条LANE的SERDES链路组,SERDES链路组中包括N+M条LANE,由于SERDES链路组初始配置N条LANE,因此SERDES链路组的工作能力即需要靠N条LANE的正常工作来保证,一旦N条LANE中的K条LANE处于故障状态,则从处于空闲状态、且处于非故障状态的LANE中确定出K条LANE,并将K条LANE设置为工作状态,从而保证了即使SERDES链路组中的K条LANE出现故障,SERDES链路组中处于工作状态且处于非故障状态的LANE也能保证为N条,因此在SERDES链路组中存在故障的LANE的情况下,本发明实施例中的SERDES链路组的工作性能也保证为N条LANE的工作能力,工作性能并未下降,进而提升了SERDES链路组的稳定性。
基于相同构思,本发明实施例提供一种SERDES链路组,包括N+M条通道LANE和上述实施例中的故障处理装置。其中,N+M条LANE中包括初始配置N条LANE;其中,N和M分别为大于等于1的整数。故障处理装置可集成在SERDES链路组的处理器芯片中。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种串行器/解串行器SERDES链路组的故障处理方法,其特征在于,适用于包括初始配置N条通道LANE的SERDES链路组,所述SERDES链路组中包括N+M条LANE;其中,所述N和所述M分别为大于等于1的整数;所述方法包括:
在确定所述SERDES链路组中处于工作状态的N条LANE中的K条LANE处于故障状态的情况下,其中,所述K为大于等于1、且小于等于N的整数:
从所述N+M条LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K条LANE;
将所述K条LANE设置为工作状态;
其中,所述在确定所述SERDES链路组中处于工作状态的N条LANE中的K条LANE发生故障的情况下之后,还包括:
将所述K条LANE设置为空闲状态和故障状态;
上报用于指示所述K条LANE处于故障状态的指示信息;
其中,所述N+M条LANE包括:N条初始化LANE和M条冗余LANE;所述M条冗余LANE为多个SERDES链路组共享的M条冗余LANE;所述多个SERDES链路组包括所述SERDES链路组。
2.如权利要求1所述的方法,其特征在于,所述从所述N+M条LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K条LANE,将所述K条LANE设置为工作状态,包括:
将所述N条初始化LANE中的处于空闲状态、且处于非故障状态的P条初始化LANE设置为工作状态;其中,所述P为大于等于1、且小于等于K的整数;
从所述M条冗余LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K-P条LANE,并将所述K-P条LANE设置为工作状态。
3.如权利要求1至2任一权利要求所述的方法,其特征在于,所述K小于等于所述M和所述N中的较小值。
4.如权利要求1至2任一权利要求所述的方法,其特征在于,所述在确定所述SERDES链路组中处于工作状态的N条LANE中的K条LANE发生故障的情况下之前,还包括:
以第一时长为周期周期性检测所述SERDES链路组中处于工作状态的N条LANE中每条LANE是处于故障状态还是非故障状态;
以第二时长为周期周期性检测所述SERDES链路组中处于空闲状态的M条LANE中每条LANE是处于故障状态还是非故障状态;
其中,所述第一时长小于所述第二时长。
5.一种串行器/解串行器SERDES链路组的故障处理装置,其特征在于,适用于包括初始配置N条通道LANE的SERDES链路组,所述SERDES链路组中包括N+M条LANE;其中,所述N和所述M分别为大于等于1的整数;所述故障处理装置包括:
检测模块,用于确定出所述SERDES链路组中处于工作状态的N条LANE中的每条LANE是处于故障状态还是非故障状态,其中,所述K为大于等于1、且小于等于N的整数;
控制模块,用于在通过所述检测模块确定所述SERDES链路组中处于工作状态的N条LANE中的K条LANE处于故障状态的情况下,从所述N+M条LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K条LANE;将所述K条LANE设置为工作状态;
其中,所述控制模块,还用于:
将所述K条LANE设置为空闲状态和故障状态;
上报用于指示所述K条LANE处于故障状态的指示信息;
其中,所述N+M条LANE包括:N条初始化LANE和M条冗余LANE;所述M条冗余LANE为多个SERDES链路组共享的M条冗余LANE;所述多个SERDES链路组包括所述SERDES链路组。
6.如权利要求5所述的故障处理装置,其特征在于,所述控制模块,用于:
将所述N条初始化LANE中的处于空闲状态、且处于非故障状态的P条初始化LANE设置为工作状态;其中,所述P为大于等于1、且小于等于K的整数;
从所述M条冗余LANE中的处于空闲状态、且处于非故障状态的LANE中确定出K-P条LANE,并将所述K-P条LANE设置为工作状态。
7.如权利要求5至6任一权利要求所述的故障处理装置,其特征在于,所述检测模块,用于:
以第一时长为周期周期性检测所述SERDES链路组中处于工作状态的N条LANE中每条LANE是处于故障状态还是非故障状态;
以第二时长为周期周期性检测所述SERDES链路组中处于空闲状态的M条LANE中每条LANE是处于故障状态还是非故障状态;
其中,所述第一时长小于所述第二时长。
8.一种串行器/解串行器SERDES链路组,其特征在于,所述SERDES链路组中包括N+M条通道LANE和如权利要求5至7中任一权利要求所述的故障处理装置;其中,所述N+M条LANE中包括初始配置N条LANE;其中,所述N和所述M分别为大于等于1的整数。
CN201611048858.0A 2016-11-22 2016-11-22 一种serdes链路组的故障处理方法和故障处理装置 Active CN106603276B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611048858.0A CN106603276B (zh) 2016-11-22 2016-11-22 一种serdes链路组的故障处理方法和故障处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611048858.0A CN106603276B (zh) 2016-11-22 2016-11-22 一种serdes链路组的故障处理方法和故障处理装置

Publications (2)

Publication Number Publication Date
CN106603276A CN106603276A (zh) 2017-04-26
CN106603276B true CN106603276B (zh) 2020-08-25

Family

ID=58593170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611048858.0A Active CN106603276B (zh) 2016-11-22 2016-11-22 一种serdes链路组的故障处理方法和故障处理装置

Country Status (1)

Country Link
CN (1) CN106603276B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111585602B (zh) * 2020-04-30 2021-11-30 展讯通信(上海)有限公司 接口电路及通信装置
CN118202632A (zh) * 2021-11-11 2024-06-14 华为技术有限公司 一种发送故障告警信息的方法及装置
CN115314168B (zh) * 2022-09-22 2023-01-13 江苏云涌电子科技股份有限公司 一种以太网传输数据的冗余系统
CN117724886B (zh) * 2023-12-11 2024-08-02 南京中新赛克科技有限责任公司 一种自动监测和修复嵌入式设备中serdes对接异常的方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100531183C (zh) * 2005-07-08 2009-08-19 华为技术有限公司 一种均衡复数条并行的串行反串行链路数据的方法
CN101764706B (zh) * 2009-12-28 2012-02-01 重庆邮电大学 基于epa网桥的链路冗余控制方法
CN101807986A (zh) * 2010-04-20 2010-08-18 杭州和利时自动化有限公司 一种冗余串行总线的实现方法及装置
CN103840972B (zh) * 2014-02-20 2018-03-20 烽火通信科技股份有限公司 包交换网络中链路聚合组间备份的系统及方法
US9209962B1 (en) * 2015-05-18 2015-12-08 Inphi Corporation High-speed clock skew correction for serdes receivers

Also Published As

Publication number Publication date
CN106603276A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
CN106603276B (zh) 一种serdes链路组的故障处理方法和故障处理装置
US10236973B2 (en) Rerouting bus data signals from faulty signal carriers to existing healthy signal carriers
US8799702B2 (en) Cable redundancy and failover for multi-lane PCI express IO interconnections
US8645747B2 (en) Cable redundancy and failover for multi-lane PCI express IO interconnections
US9229897B2 (en) Embedded control channel for high speed serial interconnect
US9697167B2 (en) Implementing health check for optical cable attached PCIE enclosure
CN102882704B (zh) 一种issu的软重启升级过程中的链路保护方法和设备
US9774389B2 (en) Dynamic link repair from lane failure with minimal link down-time while sparing fault channels
US20070183337A1 (en) FC-AL cabling management system
CN101557379B (zh) 一种pcie接口的链路重组方法和装置
US9929944B2 (en) Redundancy device unit and method for determining fault in industrial control system, industrial control system and industrial system comprising redundancy device unit
CN104158586A (zh) 一种倒换实现方法、站点及系统
KR102033112B1 (ko) Pci 익스프레스 스위치 장치 및 그의 접속 제어 방법
US7656789B2 (en) Method, system and storage medium for redundant input/output access
US11342935B2 (en) Cyclic redundancy check (CRC) system for detecting error in data communication
CN115733729B (zh) 通信故障处理方法、系统及设备
US8954623B2 (en) Universal Serial Bus devices supporting super speed and non-super speed connections for communication with a host device and methods using the same
CN101729349B (zh) 一种基于rrpp的主环通道连通性检测方法及装置
CN107704403B (zh) 一种优化主背板信号传输的装置及方法
CN113850033A (zh) 一种余度系统、余度管理方法及可读存储介质
US9632885B2 (en) Fault detection method and related device and stack system
US8943365B2 (en) Computer program product for handling communication link problems between a first communication means and a second communication means
JP6106994B2 (ja) 情報処理装置、データ転送装置、情報処理システム、および方法
CN116680224A (zh) 不对称PCIe总线设计方法、装置、总线装置及系统
JP2014106680A (ja) 情報処理装置、縮退方法、及び縮退プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant