CN111106981B - 一种pcie通道的检修方法及装置 - Google Patents

一种pcie通道的检修方法及装置 Download PDF

Info

Publication number
CN111106981B
CN111106981B CN201911331662.6A CN201911331662A CN111106981B CN 111106981 B CN111106981 B CN 111106981B CN 201911331662 A CN201911331662 A CN 201911331662A CN 111106981 B CN111106981 B CN 111106981B
Authority
CN
China
Prior art keywords
pcie
service card
channel
card
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911331662.6A
Other languages
English (en)
Other versions
CN111106981A (zh
Inventor
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruijie Networks Co Ltd
Original Assignee
Ruijie Networks Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruijie Networks Co Ltd filed Critical Ruijie Networks Co Ltd
Priority to CN201911331662.6A priority Critical patent/CN111106981B/zh
Publication of CN111106981A publication Critical patent/CN111106981A/zh
Application granted granted Critical
Publication of CN111106981B publication Critical patent/CN111106981B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种PCIE通道的检修方法及装置,该方法包括:监控在第一设定时长内是否接收到至少一个业务卡分别通过连接的PCIE通道和以太通道发送的心跳信号;若在所述第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到所述第一业务卡通过连接的第一以太通道发送的心跳信号,则确定所述第一PCIE通道异常而所述第一以太通道正常;按照预设逐级修复策略修复所述第一PCIE通道。该方案可以大大提升用户体验。

Description

一种PCIE通道的检修方法及装置
技术领域
本发明涉及通信技术领域,尤指一种高速串行计算机扩展总线标准(PeripheralComponent Interconnect Express,PCIE)通道的检修方法及装置。
背景技术
随着网络技术的飞速发展,分布式网络设备的使用越来越广泛。分布式网络设备中通常会包括一个主控卡和至少一个业务卡,其中,主控卡与每个业务卡之间会设置PCIE通道和以太通道两种物理通道,两种物理通道分别用于不同的用途。为了确保分布式网络设备的可靠性需要检测每个物理通道的正确性,并在检测到异常时及时修复。
目前,PCIE通道的检修方法主要依靠心跳机制检测,在检测到PCIE通道异常后,会对PCIE通道连接的业务卡直接进行复位,从而实现修复异常的PCIE通道。
上述方法中,一旦检测到PCIE通道异常,会直接复位对应的业务卡,而分布式网络设备中每个业务卡承载的业务很多,直接复位业务卡需要的时间比较长,用户断网的时间比较长,从而严重影响用户体验。
发明内容
本发明实施例提供一种PCIE通道的检修方法及装置,用以解决现有技术中存在的直接复位业务卡需要的时间比较长,严重影响用户体验的问题。
根据本发明实施例,提供一种PCIE通道的检修方法,应用于分布式网络设备中,所述分布式网络设备包括主控卡和至少一个业务卡,所述主控卡与所述至少一个业务卡之间分别通过PCIE通道和以太通道连接,所述方法包括:
监控在第一设定时长内是否接收到至少一个业务卡分别通过连接的PCIE通道和以太通道发送的心跳信号;
若在所述第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到所述第一业务卡通过连接的第一以太通道发送的心跳信号,则确定所述第一PCIE通道异常而所述第一以太通道正常;
按照预设逐级修复策略修复所述第一PCIE通道。
可选的,还包括:
若在所述第一设定时长内未接收到所述第一业务卡通过所述第一PCIE发送的心跳信号、且未接收到所述第一业务卡通过所述第一以太通道发送的心跳信号,则确定所述第一PCIE通道和所述第一以太通道均异常;
复位所述第一业务卡。
具体的,按照预设逐级修复策略修复所述第一PCIE通道,具体包括:
修复所述第一业务卡的PCIE芯片;
确定是否成功修复所述第一业务卡的PCIE芯片;
若确定未成功维修所述第一业务卡的PCIE芯片,则修复所述主控卡的PCIE芯片;
若成功修复所述主控卡的PCIE芯片,则通过所述第一PCIE通道向所述第一业务卡发送心跳信号;若未成功修复所述主控卡的PCIE芯片,则复位所述第一业务卡。
具体的,确定是否成功修复所述第一业务卡的PCIE芯片,具体包括:
监控在第二时长内是否接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号;
若在所述第二时长内接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号,则确定成功修复所述第一业务卡的PCIE芯片;
若在所述第二时长内未接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号,则确定未成功修复所述第一业务卡的PCIE芯片。
根据本发明实施例,还提供一种PCIE通道的检修装置,应用于分布式网络设备中,所述分布式网络设备包括主控卡和至少一个业务卡,所述主控卡与所述至少一个业务卡之间分别通过PCIE通道和以太通道连接,所述装置包括:
监控模块,用于监控在第一设定时长内是否接收到至少一个业务卡分别通过连接的PCIE通道和以太通道发送的心跳信号;
确定模块,用于若在所述第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到所述第一业务卡通过连接的第一以太通道发送的心跳信号,则确定所述第一PCIE通道异常而所述第一以太通道正常;
修复模块,用于按照预设逐级修复策略修复所述第一PCIE通道。
可选的,所述确定模块,还用于若在所述第一设定时长内未接收到所述第一业务卡通过所述第一PCIE发送的心跳信号、且未接收到所述第一业务卡通过所述第一以太通道发送的心跳信号,则确定所述第一PCIE通道和所述第一以太通道均异常;
所述修复模块,还用于复位所述第一业务卡。
具体的,所述修复模块,用于按照预设逐级修复策略修复所述第一PCIE通道,具体用于:
修复所述第一业务卡的PCIE芯片;
确定是否成功修复所述第一业务卡的PCIE芯片;
若确定未成功维修所述第一业务卡的PCIE芯片,则修复所述主控卡的PCIE芯片;
若成功修复所述主控卡的PCIE芯片,则通过所述第一PCIE通道向所述第一业务卡发送心跳信号;若未成功修复所述主控卡的PCIE芯片,则复位所述第一业务卡。
具体的,所述修复模块,用于确定是否成功修复所述第一业务卡的PCIE芯片,具体用于:
监控在第二时长内是否接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号;
若在所述第二时长内接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号,则确定成功修复所述第一业务卡的PCIE芯片;
若在所述第二时长内未接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号,则确定未成功修复所述第一业务卡的PCIE芯片。
根据本发明实施例,还提供一种电子设备,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存储的程序时,实现上述的方法步骤。
根据本发明实施例,还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法步骤。
本发明有益效果如下:
本发明实施例提供一种PCIE通道的检修方法及装置,通过监控在第一设定时长内是否接收到至少一个业务卡分别通过连接的PCIE通道和以太通道发送的心跳信号;若在所述第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到所述第一业务卡通过连接的第一以太通道发送的心跳信号,则确定所述第一PCIE通道异常而所述第一以太通道正常;按照预设逐级修复策略修复所述第一PCIE通道。该方案中,会根据在第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到第一业务卡通过连接的第一以太通道发送的心跳信号,确定第一PCIE通道异常而第一以太通道正常,由于第一业务卡并没有完全异常,之后会按照预设逐级修复策略修复第一PCIE通道,而不是简单地直接复位第一业务卡,从而可以更加灵活地、准确地修复异常的PCIE通道,相对于现有技术中直接复位第一业务卡的方式,可以大大提升用户体验。
附图说明
图1为本发明实施例中一种PCIE通道的检修方法的流程图;
图2为本发明实施例中一种状态机的示意图;
图3为本发明实施例中另一种状态机的示意图;
图4为本发明实施例中一种PCIE通道的检修装置的结构示意图;
图5为本申请示出的一种电子设备的结构示意图。
具体实施方式
针对现有技术中存在的直接复位业务卡需要的时间比较长,严重影响用户体验的问题,本发明实施例提供一种PCIE通道的检修方法,应用于分布式网络设备中,分布式网络设备包括主控卡和至少一个业务卡,主控卡与至少一个业务卡之间分别通过PCIE通道和以太通道连接,该方法的流程如图1所示,执行步骤如下:
S11:监控在第一设定时长内是否接收到至少一个业务卡分别通过连接的PCIE通道和以太通道发送的心跳信号。
主控卡与至少一个业务卡之间设置心跳检测机制,至少一个业务卡可以分别通过连接的PCIE通道和以太通道发送的心跳信号。
其中,可以根据实际需要设置第一设定时长,例如,可以设置为10毫秒、30豪秒、2秒等等。
S12:若在第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到第一业务卡通过连接的第一以太通道发送的心跳信号,则确定第一PCIE通道异常而第一以太通道正常。
在第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号,说明第一PCIE通道异常,从而无法通过第一PCIE通道接收到来自第一业务卡的心跳信号;而在第一设定时长内接收到第一业务卡通过连接的第一以太通道发送的心跳信号,说明第一以太通道是正常的,因此,可以通过第一以太通道接收来自第一业务卡的心跳信号。
S13:按照预设逐级修复策略修复第一PCIE通道。
由于第一PCIE通道异常而第一以太通道正常,说明第一业务卡并没有完全异常,此时无需复位第一业务卡,可以按照预设逐级修复策略修复第一PCIE通道。
该方案中,会根据在第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到第一业务卡通过连接的第一以太通道发送的心跳信号,确定第一PCIE通道异常而第一以太通道正常,由于第一业务卡并没有完全异常,之后会按照预设逐级修复策略修复第一PCIE通道,而不是简单地直接复位第一业务卡,从而可以更加灵活地、准确地修复异常的PCIE通道,相对于现有技术中直接复位第一业务卡的方式,可以大大提升用户体验。
可选的,上述方法还包括:
若在第一设定时长内未接收到第一业务卡通过第一PCIE发送的心跳信号、且未接收到第一业务卡通过第一以太通道发送的心跳信号,则确定第一PCIE通道和第一以太通道均异常;
复位第一业务卡。
由于第一PCIE通道和第一以太通道均异常,说明第一业务卡此时已完全发生异常,可以直接复位第一业务卡来修复第一业务卡的异常,从而使得第一业务卡可以正常处理业务。
具体的,上述S13中的按照预设逐级修复策略修复第一PCIE通道,实现方式具体包括:
修复第一业务卡的PCIE芯片;
确定是否成功修复第一业务卡的PCIE芯片;
若确定未成功维修第一业务卡的PCIE芯片,则修复主控卡的PCIE芯片;
若成功修复主控卡的PCIE芯片,则通过第一PCIE通道向第一业务卡发送心跳信号;若未成功修复主控卡的PCIE芯片,则复位第一业务卡。
预设逐级修复策略可以根据实际需要进行设定,设置的方式有很多种,下面列举一种进行说明。例如,可以先修复业务卡的PCIE芯片,未成功修复的话,再修复主控卡的PCIE芯片,若仍未修复成功,此时只能通过复位业务卡来解决当前的异常;当然,也可以先修复主控卡的PCIE芯片,未成功修复的话,再修复业务卡的PCIE芯片,若仍未修复成功,此时只能通过复位业务卡来解决当前的异常;需要说明的是,PCIE芯片是主控卡和业务卡中与PCIE通道有关的芯片,因此,只需修复PCIE芯片即可。在检测到第一PCIE通道异常而第一以太通道正常时,可以采用该预设逐级修复策略依次进行修复就可以实现修复第一PCIE通道。
具体的,上述确定是否成功修复第一业务卡的PCIE芯片,实现过程具体包括:
监控在第二时长内是否接收到第一业务卡通过第一PCIE通道发送的心跳信号;
若在第二时长内接收到第一业务卡通过第一PCIE通道发送的心跳信号,则确定成功修复第一业务卡的PCIE芯片;
若在第二时长内未接收到第一业务卡通过第一PCIE通道发送的心跳信号,则确定未成功修复第一业务卡的PCIE芯片。
通道,若成功修复第一PCIE通道,可以通过第一PCIE通道接收到第一业务卡发送的心跳信号,因此,可以根据是否接收到该心跳信号确定是否成功修复第一PCIE通道。
一种可选的实施方式,可以采用状态机记录分布式网络设备中主控卡与每个业务卡之间的PCIE通道和以太通道的状态,下面以检测主控卡与第一业务卡之间的第一PCIE通道和第一以太通道为例进行说明。
如图2所示,初始状态是NONE,若在第一设定时长内通过第一PCIE通道接收到第一业务卡发送的心跳信号,则检测到PCIE-UP事件,此时就转变为CTRL_LOST状态。若在第一设定时长内通过第一以太通道接收到第一业务卡发送的心跳信号,则检测到CTRL-UP事件,此时就转变为PCIE_LOST状态。若在CTRL_LOST状态检测到PCIE-UP事件或者在PCIE-LOST状态检测CTRL_UP事件,就变为最终的FULL状态。
在如图2所示的FULL状态的基础上,如图3所示,若在第一设定时长内通过第一PCIE通道未接收到第一业务卡发送的心跳信号,则检测到PCIE-LOST事件,此时就转变为PCIE_LOST状态。若在第一设定时长内通过第一以太通道未接收到第一业务卡发送的心跳信号,则检测到CTRL-LOST事件,此时就转变为CTRL_LOST状态。当处于CTRL_LOST状态时又发生了PCIE-LOST事件,就变为了NONE状态。当处于PCIE_LOST状态时又发生了CTRL-LOST事件,就变为了NONE状态。在PCIE-LOST状态需要按照预设逐级修复策略修复第一PCIE通道,修复成功后状态重新变为FULL;复位第一业务卡,状态变为NONE。
基于同一发明构思,本发明实施例提供一种PCIE通道的检修装置,应用于分布式网络设备中,分布式网络设备包括主控卡和至少一个业务卡,主控卡与至少一个业务卡之间分别通过PCIE通道和以太通道连接,该装置的结构如图4所示,包括:
监控模块41,用于监控在第一设定时长内是否接收到至少一个业务卡分别通过连接的PCIE通道和以太通道发送的心跳信号;
确定模块42,用于若在第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到第一业务卡通过连接的第一以太通道发送的心跳信号,则确定第一PCIE通道异常而第一以太通道正常;
修复模块43,用于按照预设逐级修复策略修复第一PCIE通道。
该方案中,会根据在第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到第一业务卡通过连接的第一以太通道发送的心跳信号,确定第一PCIE通道异常而第一以太通道正常,由于第一业务卡并没有完全异常,之后会按照预设逐级修复策略修复第一PCIE通道,而不是简单地直接复位第一业务卡,从而可以更加灵活地、准确地修复异常的PCIE通道,相对于现有技术中直接复位第一业务卡的方式,可以大大提升用户体验。
可选的,确定模块42,还用于若在第一设定时长内未接收到第一业务卡通过第一PCIE发送的心跳信号、且未接收到第一业务卡通过第一以太通道发送的心跳信号,则确定第一PCIE通道和第一以太通道均异常;
修复模块43,还用于复位第一业务卡。
具体的,修复模块43,用于按照预设逐级修复策略修复第一PCIE通道,具体用于:
修复第一业务卡的PCIE芯片;
确定是否成功修复第一业务卡的PCIE芯片;
若确定未成功维修第一业务卡的PCIE芯片,则修复主控卡的PCIE芯片;
若成功修复主控卡的PCIE芯片,则通过第一PCIE通道向第一业务卡发送心跳信号;若未成功修复主控卡的PCIE芯片,则复位第一业务卡。
具体的,修复模块43,用于确定是否成功修复第一业务卡的PCIE芯片,具体用于:
监控在第二时长内是否接收到第一业务卡通过第一PCIE通道发送的心跳信号;
若在第二时长内接收到第一业务卡通过第一PCIE通道发送的心跳信号,则确定成功修复第一业务卡的PCIE芯片;
若在第二时长内未接收到第一业务卡通过第一PCIE通道发送的心跳信号,则确定未成功修复第一业务卡的PCIE芯片。
本申请实施例还提供了一种电子设备,请参见图5所示,包括处理器510、通信接口520、存储器530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。
存储器530,用于存放计算机程序;
处理器510,用于执行存储器530上所存放的程序时,实现上述实施例中任一所述的PCIE通道的检修方法。
通信接口520用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
该方案中,会根据在第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到第一业务卡通过连接的第一以太通道发送的心跳信号,确定第一PCIE通道异常而第一以太通道正常,由于第一业务卡并没有完全异常,之后会按照预设逐级修复策略修复第一PCIE通道,而不是简单地直接复位第一业务卡,从而可以更加灵活地、准确地修复异常的PCIE通道,相对于现有技术中直接复位第一业务卡的方式,可以大大提升用户体验。
相应地,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的PCIE通道的检修方法。
该方案中,会根据在第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE发送的心跳信号、而接收到第一业务卡通过连接的第一以太通道发送的心跳信号,确定第一PCIE通道异常而第一以太通道正常,由于第一业务卡并没有完全异常,之后会按照预设逐级修复策略修复第一PCIE通道,而不是简单地直接复位第一业务卡,从而可以更加灵活地、准确地修复异常的PCIE通道,相对于现有技术中直接复位第一业务卡的方式,可以大大提升用户体验。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的可选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括可选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种高速串行计算机扩展总线标准PCIE通道的检修方法,应用于分布式网络设备中,所述分布式网络设备包括主控卡和至少一个业务卡,所述主控卡与所述至少一个业务卡之间分别通过PCIE通道和以太通道连接,其特征在于,所述方法包括:
监控在第一设定时长内是否接收到至少一个业务卡分别通过连接的PCIE通道和以太通道发送的心跳信号;
若在所述第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE通道发送的心跳信号、而接收到所述第一业务卡通过连接的第一以太通道发送的心跳信号,则确定所述第一PCIE通道异常而所述第一以太通道正常;
按照预设逐级修复策略修复所述第一PCIE通道。
2.如权利要求1所述的方法,其特征在于,还包括:
若在所述第一设定时长内未接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号、且未接收到所述第一业务卡通过所述第一以太通道发送的心跳信号,则确定所述第一PCIE通道和所述第一以太通道均异常;
复位所述第一业务卡。
3.如权利要求1或2所述的方法,其特征在于,按照预设逐级修复策略修复所述第一PCIE通道,具体包括:
修复所述第一业务卡的PCIE芯片;
确定是否成功修复所述第一业务卡的PCIE芯片;
若确定未成功修复所述第一业务卡的PCIE芯片,则修复所述主控卡的PCIE芯片;
若成功修复所述主控卡的PCIE芯片,则通过所述第一PCIE通道向所述第一业务卡发送心跳信号;若未成功修复所述主控卡的PCIE芯片,则复位所述第一业务卡。
4.如权利要求3所述的方法,其特征在于,确定是否成功修复所述第一业务卡的PCIE芯片,具体包括:
监控在第二时长内是否接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号;
若在所述第二时长内接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号,则确定成功修复所述第一业务卡的PCIE芯片;
若在所述第二时长内未接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号,则确定未成功修复所述第一业务卡的PCIE芯片。
5.一种PCIE通道的检修装置,应用于分布式网络设备中,所述分布式网络设备包括主控卡和至少一个业务卡,所述主控卡与所述至少一个业务卡之间分别通过PCIE通道和以太通道连接,其特征在于,所述装置包括:
监控模块,用于监控在第一设定时长内是否接收到至少一个业务卡分别通过连接的PCIE通道和以太通道发送的心跳信号;
确定模块,用于若在所述第一设定时长内未接收到至少一个业务卡中的第一业务卡通过连接的第一PCIE通道发送的心跳信号、而接收到所述第一业务卡通过连接的第一以太通道发送的心跳信号,则确定所述第一PCIE通道异常而所述第一以太通道正常;
修复模块,用于按照预设逐级修复策略修复所述第一PCIE通道。
6.如权利要求5所述的装置,其特征在于,所述确定模块,还用于若在所述第一设定时长内未接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号、且未接收到所述第一业务卡通过所述第一以太通道发送的心跳信号,则确定所述第一PCIE通道和所述第一以太通道均异常;
所述修复模块,还用于复位所述第一业务卡。
7.如权利要求5或6所述的装置,其特征在于,所述修复模块,用于按照预设逐级修复策略修复所述第一PCIE通道,具体用于:
修复所述第一业务卡的PCIE芯片;
确定是否成功修复所述第一业务卡的PCIE芯片;
若确定未成功修复所述第一业务卡的PCIE芯片,则修复所述主控卡的PCIE芯片;
若成功修复所述主控卡的PCIE芯片,则通过所述第一PCIE通道向所述第一业务卡发送心跳信号;若未成功修复所述主控卡的PCIE芯片,则复位所述第一业务卡。
8.如权利要求7所述的装置,其特征在于,所述修复模块,用于确定是否成功修复所述第一业务卡的PCIE芯片,具体用于:
监控在第二时长内是否接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号;
若在所述第二时长内接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号,则确定成功修复所述第一业务卡的PCIE芯片;
若在所述第二时长内未接收到所述第一业务卡通过所述第一PCIE通道发送的心跳信号,则确定未成功修复所述第一业务卡的PCIE芯片。
9.一种电子设备,其特征在于,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存储的程序时,实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
CN201911331662.6A 2019-12-21 2019-12-21 一种pcie通道的检修方法及装置 Active CN111106981B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911331662.6A CN111106981B (zh) 2019-12-21 2019-12-21 一种pcie通道的检修方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911331662.6A CN111106981B (zh) 2019-12-21 2019-12-21 一种pcie通道的检修方法及装置

Publications (2)

Publication Number Publication Date
CN111106981A CN111106981A (zh) 2020-05-05
CN111106981B true CN111106981B (zh) 2022-01-11

Family

ID=70423076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911331662.6A Active CN111106981B (zh) 2019-12-21 2019-12-21 一种pcie通道的检修方法及装置

Country Status (1)

Country Link
CN (1) CN111106981B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101257405A (zh) * 2008-04-03 2008-09-03 中兴通讯股份有限公司 主从设备间双链路的实现方法
CN103095463A (zh) * 2013-02-01 2013-05-08 福建星网锐捷网络有限公司 Pcie交换网系统和通信方法
CN106502944A (zh) * 2015-09-08 2017-03-15 杭州华为数字技术有限公司 计算机、pcie设备以及pcie设备的心跳检测方法
CN107566301A (zh) * 2017-10-23 2018-01-09 济南浪潮高新科技投资发展有限公司 一种实现RapidIO交换机系统总线速度自动配置的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101257405A (zh) * 2008-04-03 2008-09-03 中兴通讯股份有限公司 主从设备间双链路的实现方法
CN103095463A (zh) * 2013-02-01 2013-05-08 福建星网锐捷网络有限公司 Pcie交换网系统和通信方法
CN106502944A (zh) * 2015-09-08 2017-03-15 杭州华为数字技术有限公司 计算机、pcie设备以及pcie设备的心跳检测方法
CN107566301A (zh) * 2017-10-23 2018-01-09 济南浪潮高新科技投资发展有限公司 一种实现RapidIO交换机系统总线速度自动配置的方法及装置

Also Published As

Publication number Publication date
CN111106981A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
US20190205233A1 (en) Fault injection testing apparatus and method
CN107436414B (zh) 一种存储系统中bbu的有效性测试方法和装置
CN109342848B (zh) 用于调度自动化主站的雪崩测试方法、系统及终端设备
CN104699620B (zh) 一种加速芯片中断控制器验证的系统及方法
CN110968352A (zh) 一种pcie设备的复位系统及服务器系统
CN106155826B (zh) 用于在总线结构中检测及处理错误的方法和系统
WO2022095847A1 (zh) 系统升级方法、装置、设备和存储介质
CN106610885A (zh) 服务器故障检测系统及方法
CN106372026A (zh) 一种链路检测方法和接收设备
US10613963B2 (en) Intelligent packet analyzer circuits, systems, and methods
CN108802627B (zh) Bbu独立供电的测试方法、装置、系统及可读存储介质
CN111106981B (zh) 一种pcie通道的检修方法及装置
CN109086081A (zh) 一种即时提示SATA和NVMe设备在位变化的方法、系统及介质
CN111124818B (zh) 一种扩展器Expander的监控方法、装置及设备
CN111030871A (zh) 基于双机热备系统的配置信息同步方法和装置
CN108804152B (zh) 配置参数的调节方法及装置
CN108388228B (zh) 一种针对多通道嵌入式控制系统的同步调试方法和装置
CN104731723A (zh) 一种存储设备断电保护方法及装置
CN109614307B (zh) 业务系统的线上压力测试的方法、装置及服务器
CN110247833B (zh) 通信控制方法、装置、子设备和通信系统
CN113778732A (zh) 业务板卡的故障定位方法及装置
CN110399258B (zh) 一种服务器系统的稳定性测试方法、系统及装置
CN104216857B (zh) 多工切换装置及其切换方法
CN108388481B (zh) Olt设备的智能看门狗电路系统
CN112466383B (zh) 存储系统仲裁可靠性的测试方法、测试装置及测试设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant