CN110995478B - 一种OpenVPX设备内板卡冗余备份的实现方法 - Google Patents

一种OpenVPX设备内板卡冗余备份的实现方法 Download PDF

Info

Publication number
CN110995478B
CN110995478B CN201911145334.7A CN201911145334A CN110995478B CN 110995478 B CN110995478 B CN 110995478B CN 201911145334 A CN201911145334 A CN 201911145334A CN 110995478 B CN110995478 B CN 110995478B
Authority
CN
China
Prior art keywords
standby mode
board
main control
openvpx
control board
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911145334.7A
Other languages
English (en)
Other versions
CN110995478A (zh
Inventor
包冲
李壮
梁学峰
王增强
李婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ucas Technology Co ltd
Original Assignee
Beijing Ucas Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ucas Technology Co ltd filed Critical Beijing Ucas Technology Co ltd
Priority to CN201911145334.7A priority Critical patent/CN110995478B/zh
Publication of CN110995478A publication Critical patent/CN110995478A/zh
Application granted granted Critical
Publication of CN110995478B publication Critical patent/CN110995478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0826Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for reduction of network costs

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种OpenVPX设备内板卡冗余备份的实现方法,本发明实施例确定OpenVPX设备是自主设备还是受控设备,当OpenVPX设备为自主设备时,则对其中的电源板和主控板设置为热备方式进行冗余备份切换,对其他功能板采用热备方式或冷备方式进行冗余备份切换;当OpenVPX设备为受控设备时,其中的所有板卡采用热备方式或冷备方式进行冗余备份切换。这样,就可以在提高可靠性及降低成本的情况下,实现OpenVPX设备内的各个板卡冗余备份。

Description

一种OpenVPX设备内板卡冗余备份的实现方法
技术领域
本发明涉及计算机技术领域,特别涉及一种OpenVPX设备内板卡冗余备份的实现方法。
背景技术
OpenVPX标准作为一个能够实现高性能数据处理的标准,使用灵活,且具有一定可靠性,已经开始在军工电子领域中成为单机电子设备的首选标准。OpenVPX标准规定了串行快速输入输出接口(SRIO)、高速串行计算机扩展总线(PCIe)和10G以太网三种数据平面总线,以及千兆以太网的控制平面总线,都是交换结构。除了PCIe总线为了向上兼容PCI总线,而采用一主多从方式外,其他都是分布式总线,在工作过程中,不分主从。这几类总线大多采用高速串行的串化解器(serders),并采用交流耦合方式进行连接,容易实现电气隔离,这些都为在采用OpenVPX标准实现的电子设备,即OpenVPX设备中实现冗余备份提供了便利。
OpenVPX设备采用背板+插板的机箱架构,OpenVPX标准对各类功能板之间的总线、电源、连接器、单板和机箱结构等都做出了详细的规定,OpenVPX设备从传输逻辑层面上可以划分为5个部分:
1)管理平面(Management Plane):采用智能平台管理接口(IPMI)总线,用于OpenVPX设备的整个系统及各个板卡的状态监控及电源管理;
2)控制平面(Control Plane):采用千兆以太网,用于低延迟、中等带宽、基于数据包的数据通信,实现各个板卡间的工作模式管理;
3)数据平面(Data Plane):可以采用快速输入输出接口(RapidIO)、10GB以太网或PCIe总线,在各个板卡之间构建了一套高宽带及低延迟的数据通路;
4)扩展平面(Expansion Plane):用于各个板卡之间额外的逻辑控制层面的相互通信;
5)公共平面(Utility Plane):为系统提供最基础的服务,如:电源供给、参考时钟、系统复位等低级别信号。
图1为现有技术提供的双OpenVPX设备冗余备份的拓扑结构示意图,图2为现有技术提供的单OpenVPX设备内板卡冗余备份的拓扑结构示意图。从图1和图2可以看出,在OpenVPX设备中,在板卡数量不变的情况下,可以进行交叉冗余备份,使得可靠性上有非常大的提升。
可以看出,图1和图2仅仅是在OpenVPX设备的数据平面中提出了双交换的冗余拓扑结构,并没有对整个系统内各个板卡的冗余备份作出规定。如果要实现图2中所示的交叉冗余备份,就需要综合考虑OpenVPX设备中的单点故障(即无法实现备份的节点),电气隔离,故障诊断与切换等诸多因素。
因此,如何实现OpenVPX设备板卡内的冗余备份成为了一个亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种OpenVPX设备内板卡冗余备份的实现方法,该方法在提高可靠性及降低成本的情况下,能够实现OpenVPX设备内的各个板卡冗余备份。
本发明实施例是这样实现的:
一种OpenVPX设备内板卡冗余备份的实现方法,包括:
确定OpenVPX设备是自主设备还是受控设备;
当OpenVPX设备为自主设备时,则对其中的电源板和主控板设置为热备方式进行冗余备份切换,对其他功能板采用热备方式或冷备方式进行冗余备份切换;
当OpenVPX设备为受控设备时,其中的所有板卡采用热备方式或冷备方式进行冗余备份切换。
当OpenVPX设备为自主设备时,所述电源板采用热备方式进行冗余备份切换时,包括:
电源板的一次电源输入具有过流保护功能;
电源板的各路输出的主、辅二次电源均具有均流功能及故障切断功能。
所述主控板及其他功能板的电源设置包括:
二次电源输入端设置保护电路,其中,对于输入的辅助电源,采用过流保护电路,对于输入的主电源,包括过流保护电路及在板卡上布置智能协议管理控制器IPMC模块对主电源进行通断控制。
当OpenVPX设备为自主设备时,所述对其他功能板采用热备方式或冷备方式进行冗余备份切换是在主控板的控制下完成的。
当OpenVPX设备为自主设备时,所述主控板的控制包括:
主控板通过OpenVPX设备中的管理平面总线和控制平面总线,对其他功能板的工作状态进行监控,当监控到其中的某一功能板进行冗余备份切换时,确定该功能板是采用热备方式或冷备方式进行冗余备份切换;
如果是热备方式,则通过控制平面总线通知处于待机的对应备份功能板接替功能板工作;如果是冷备方式,则通过管理平面总线,分别控制功能板和对应备份的功能板上的IPMC模块,分别切断和打开相应的主供电,并通知处于待机的对应备份功能板接替功能板工作。
当OpenVPX设备为受控设备时,所述其中的所有板卡采用热备方式或冷备方式进行冗余备份切换包括:
在上位机的控制下电源板采用热备方式进行冗余备份切换;
在上位机的控制下主控板采用热备方式或冷备方式进行冗余备份切换;
其他功能板在主控板的控制下采用热备方式或冷备方式进行冗余备份切换。
所述在上位机的控制下电源板和主控板采用热备方式进行冗余备份切换包括:
上位机对电源板和主控板分别进行工作状态监控,在监控时通过之间的通信通道,及分别与电源板设置的IPMC模块和主控板设置的板级管理控制器ChMC模块的通信通道进行;
上位机在确定电源板故障时,则通过之间的通信通道发送OC指令,控制电源板切断输入输出电源,打开备份电源板的输入输出电源,接替电源板工作;
上位机在确定主控板故障时,如果主控板采用热备方式,则通过之间的通信通道发送OC指令,通知备用主控板接替主控板的工作,控制主控板的ChMC模块关闭主控板的电源;如果主控板采用冷备方式,则分别控制备用主控板和主控板的ChMC模块,分别打开和关闭备用主控板和主控板的电源。
所述电源板在采用冷备方式切换时,为电源板设置保护电路,防止潜通。
还包括:OpenVPX设备设置的冗余备份拓扑结构中是否包括单点故障板,如果是,则对该单点故障板进行高可靠性的增强设置。
如上所见,本发明实施例确定OpenVPX设备是自主设备还是受控设备,当OpenVPX设备为自主设备时,则对其中的电源板和主控板设置为热备方式进行冗余备份切换,对其他功能板采用热备方式或冷备方式进行冗余备份切换;当OpenVPX设备为受控设备时,其中的所有板卡采用热备方式或冷备方式进行冗余备份切换。这样,就可以在提高可靠性及降低成本的情况下,实现OpenVPX设备内的各个板卡冗余备份。
附图说明
图1为现有技术提供的双OpenVPX设备冗余备份的拓扑结构示意图;
图2为现有技术提供的单OpenVPX设备内板卡冗余备份的拓扑结构示意图;
图3为本发明实施例提供的OpenVPX设备内板卡冗余备份的实现方法流程图;
图4为本发明实施例提供的自主设备的可靠性模型结构示意图;
图5为本发明实施例提供的功能板的二次电源输入保护电路示意图;
图6为本发明实施例提供的主控板对OpenVPX设备内其他功能板的管理示意图;
图7为本发明实施例提供的受控设备的可靠性模型结构示意图;
图8为本发明实施例提供的系统状态管理与模式控制示意图;
图9为本发明实施例提供的单机设备内非完全交叉冗余备份拓扑结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
本发明实施例在最大程度遵守OpenVPX标准规定的基础上,充分利用了OpenVPX标准关于传输逻辑层面的各项规定,针对有较高可靠性要求的OpenVPX设备,提出了一套较为完备的,在OpenVPX设备内各个板卡的交叉冗余备份方法。采用这种方法,可以在不增加太大成本的情况下,实现OpenVPX设备内的各个板卡的交叉冗余备份,大大提高了OpenVPX设备的可靠性。
具体地说,本发明实施例确定OpenVPX设备是自主设备还是受控设备,当OpenVPX设备为自主设备时,则对其中的电源板和主控板设置为热备方式进行冗余备份切换,对其他功能板采用热备方式或冷备方式进行冗余备份切换;当OpenVPX设备为受控设备时,其中的所有板卡采用热备方式或冷备方式进行冗余备份切换。
图3为本发明实施例提供的OpenVPX设备内板卡冗余备份的实现方法流程图,其具体步骤为:
步骤301、确定OpenVPX设备是自主设备还是受控设备;
步骤302、当OpenVPX设备为自主设备时,则对其中的电源板和主控板设置为热备方式进行冗余备份切换,对其他功能板采用热备方式或冷备方式进行冗余备份切换;
步骤303、当OpenVPX设备为受控设备时,其中的所有板卡采用热备方式或冷备方式进行冗余备份切换。
在该方法中,当OpenVPX设备为自主设备时,所述电源板采用热备方式进行冗余备份切换时,包括:
电源板的一次电源输入具有过流保护功能;
电源板的各路输出的主、辅二次电源均具有均流功能及故障切断功能。
在这里,所述主控板及其他功能板的电源设置包括:
二次电源输入端设置保护电路,其中,对于输入的辅助电源,采用过流保护电路,对于输入的主电源,包括过流保护电路及在板卡上布置智能协议管理控制器(IPMC)模块对主电源进行通断控制。
在该方法中,当OpenVPX设备为自主设备时,所述对其他功能板采用热备方式或冷备方式进行冗余备份切换是在主控板的控制下完成的。
在这里,当OpenVPX设备为自主设备时,所述主控板的控制包括:
主控板通过OpenVPX设备中的管理平面总线和控制平面总线,对其他功能板的工作状态进行监控,当监控到其中的某一功能板进行冗余备份切换时,确定该功能板是采用热备方式或冷备方式进行冗余备份切换;
如果是热备方式,则通过控制平面总线通知处于待机的对应备份功能板接替功能板工作;如果是冷备方式,则通过管理平面总线,分别控制功能板和对应备份的功能板上的IPMC模块,分别切断和打开相应的主供电,并通知处于待机的对应备份功能板接替功能板工作。
在该方法中,当OpenVPX设备为受控设备时,所述其中的所有板卡采用热备方式或冷备方式进行冗余备份切换包括:
在上位机的控制下电源板采用热备方式进行冗余备份切换;
在上位机的控制下主控板采用热备方式或冷备方式进行冗余备份切换;
其他功能板在主控板的控制下采用热备方式或冷备方式进行冗余备份切换。
在该方法中,所述在上位机的控制下电源板和主控板采用热备方式进行冗余备份切换包括:
上位机对电源板和主控板分别进行工作状态监控,在监控时通过之间的通信通道,及分别与电源板设置的IPMC模块和主控板设置的板级管理控制器(ChMC)模块的通信通道进行;
上位机在确定电源板故障时,则通过之间的通信通道发送OC指令,控制电源板切断输入输出电源,打开备份电源板的输入输出电源,接替电源板工作;
上位机在确定主控板故障时,如果主控板采用热备方式,则通过之间的通信通道发送OC指令,通知备用主控板接替主控板的工作,控制主控板的ChMC模块关闭主控板的电源;如果主控板采用冷备方式,则分别控制备用主控板和主控板的ChMC模块,分别打开和关闭备用主控板和主控板的电源。
在该方法中,所述电源板在采用冷备方式切换时,为电源板设置保护电路,防止潜通。
该方法还包括:OpenVPX设备设置的冗余备份拓扑结构中是否包括单点故障板,如果是,则对该单点故障板进行高可靠性的增强设置。
以下对本发明实施例进行详细说明。
本发明实施例根据OpenVPX设备的实际应用场景,将它们分为两类:
一类成为自主设备,它们是整个应用OpenVPX设备的系统,尤其该系统是无人值守的系统的管理核心,如卫星、飞机、车辆、船艇的主控计算机,这类设备需要能够自主的在主、备份之间完成故障诊断和功能切换工作;
另外一类成为受控设备,这类设备在整个应用OpenVPX设备的系统中承担一定的功能,来辅助自主设备完成整个系统的部分工作,如卫星、飞机、车、船艇的各种分系统设备和特定功能设备,如载荷设备等。在整个系统中,存在更高级别的管理计算机,即上位机(可能为自主设备,也可能是整个系统中的二级或三级的管理设备),对这里设备进行故障诊断和功能切换。
在OpenVPX设备进行冗余备份时,其中与冗余备份相关的功能板包括:
1)电源板,即符合OpenVPX标准的电源板,主要完成OpenVPX设备外部提供的一次电源到设备内各个功能板卡所需二次电话的转换,它与系统中的其他板卡,在可靠性上为串联关系,是影响系统可靠性的关键模块;
2)主控板,指OpenVPX设备内对其他功能板卡进行状态监控和故障管理的功能板卡,在实际设计中,常与满足OpenVPX设备功能而定义的主控板在同一功能板卡中实现;
3)上位机,上位机是相对受控设备而言,承当对受控设备中的电源板和主控板的故障诊断和功能切换工作;
4)管理平面,即智能协议管理接口(IPMI)系统,包括IPMC模块、ChMC模块及板载智能协议管理控制器总线(IPMB)。ChMC模块为主模块,分布在主控板中,IPMC模块为从模块,分布于各个OpenVPX设备中的功能板内,所有模块通过IPMB连接,IPMC模块和ChMC模块均可监控所在板卡的硬件状态,可以对该板卡的主供电源进行通断控制;
5)控制平面,OpenVPX设备中的控制平面总线为千兆以太网,它帮助主控板实现对其他功能板的状态监视和故障管理。
在本发明实施例中,分别针对OpenVPX设备是自主设备还是受控设备,分别从系统供电设计、设备的状态监控和故障管理的角度进行说明,并对基于交换的,各个功能板的冗余备份的拓扑结构进行了说明。在具体例子中,仅仅叙述双冗余备份的方法,对于多冗余备份情况类似。
在OpenVPX设备中实现功能板卡的冗余备份时,是采用冷备方式还是热备方式,是需要考虑的问题。在本发明实施例提供的交叉冗余备份方法中,对于自主设备,设备内的电源板和主控板采用的是热备方式,其他功能板采用热备或冷备方式;对于受控设备,则设备内的所有板卡,均采用热备或冷备方式。冷备或热备的实现方式,各有优缺点,具体参见表1。
Figure BDA0002282010990000071
表1
此外,在本发明实施例提供的冗余备份方法中,也需要识别到单点故障。对于不可避免的单点故障,可以通过采用冗余备份之外的一些措施,来进行加固。这些措施包括选用更高等级电子元器件,以及在硬件电路和软件上进行可靠性增强设置等。
一、自主设备的交叉冗余备份方法
当OpenVPX设备被确定为自主设备时,该设备根据实时监控自身完成状态进行故障切换。在这种情况下的可靠性模型参见图4,在可靠性模型中,OpenVPX设备的电源模块、主控板和其他功能板进行串联。其中,电源模块和主控板分别实时监控自身状态,以确定是否进行故障切换并进行对应的切换,在进行故障切换时,采用热备方式。其他的功能板可以由主控板对其进行状态监控,以确定是否进行故障切换并进行对应的切换,可以酌情选择热备方式或冷备方式。
1)OpenVPX设备的电源系统设置
设备的电源系统包括电源板及各个插板上的电源控制电路。
按照OpenVPX标准的规定,OpenVP设备的二次电源分为主供电和辅助供电。主供电为12V,5V和3.3V,辅助供电为辅助(AUX)3.3V和AUX±12V。为了实现电源板的冗余热备份,要求电源板除了符合OpenVPX标准规定外,还应该具有以下功能:
一次电源输入具有过流保护功能,防止互为备份的两个电源板之一发生一次电源故障后,将输入的一次电源母线拉死;
各路输出的主、辅二次电源均具有均流功能,因为互为备份的两个电源板输出的同类二次电源是并在一起的;
各路输入的主、辅二次电源均具有故障切断功能,防止互为备份的两个电源板之一发生某路的二次电源故障后,影响背板上该路电源的母线。
同理,作为负载的各类功能板及主控板的二次电源输入端,也需要设计保护电路,防止某个功能板的二次电源输入端故障,影响到整个背板上的该二次电源母线。对于辅助电源,采用简单可靠的过流保护电路即可,对于主电源,除了必要的过流保护,还需要由该板卡上的IPMC(或ChMC)模块对电源输入进行通断控制,如图5所示,图5为本发明实施例提供的二次主电源输入的保护电路结构示意图。
2)OpenVPX设备的状态监控和故障管理
在自主设备中,主控板主要通过管理平面总线和控制平面总线完成对设备内其他功能板卡的状态监控和故障管理功能,其关系示意图参见图6。
在正常工作情况下,主控板通过管理平面总线完成对设备内其他功能板卡的硬件工作状态的采集和监控,如电压、电流、温度和处理器心跳等;通过控制平面总线完成对设备内其他功能板卡的软硬件工作状态的采集和监控,如任务执行情况、工作模式情况等。而主控板处于热备状态,只负责通过管理平面总线和控制平面总线对设备主控板进行状态监控,这需要在两者之间设定专门的通信协议。
处于工作状态的主控板通过判断设备内其他功能板卡的工作状态,来判断它们是否发生故障。发生故障后,如果故障功能板采用的是热备方式,则主控板通过控制平面总线通知处于待机状态的备份功能板接替故障功能板的工作;如果故障功能板采取的是冷备方式,则主控板通过管理平面总线,控制故障功能板和对应的备份功能板上的IPMC模块,分别切断和打开相应的主供电,通知备份功能板代替故障功能板开始工作。
同理,主控板如果检测到主控板发生故障后,就会接管设备主控板的工作,保证整个设备的正常运行。此外,备份主控板还可以通过故障主控板上的ChMC模块,对故障主控板采样采取适当的故障隔离措施,防止其对备份主控板的正常工作产生干扰。
二、受控设备的冗余备份方法
1)设备电源系统的设计
当OpenVPX设备为受控设备时,设备的电源板和主控板可以由该设备所处系统的上位机来进行故障诊断和主备份的切换管理。图7为本发明实施例提供的受控设备的可靠性模型结构示意图。当电源板采用双冗余冷备方式时,为了避免潜通造成的危害,可以用继电器对电源板内各个DC-DC的输入和输出端进行切换,否则就需要额外设计保护电路,来保证冷备接口的断电高阻。
在受控设备中,主控板的冗余备份同样可以采用冷备或热备方式,具体方法与自主设备类型。当两个主控板采用冷备方式时,两个主控板的ChMC模块均应与上位机有通信接口(按照IPMB总线协议,可以为百兆以太网接口或RS232接口),同时保留ChMC模块与主控板本身的通信接口,用于主控板对其他功能板的管理。由上位机通过ChMC模块完成对主控板的主备份切换。
2)OpenVPX设备的状态监控和故障处理
在这里例子中,仅说明受控设备设计为电源板冷备的情况。
在OpenVPX设备为受控设备时,设备的状态监控和故障管理分为两个层次,如图8所示,图8为本发明实施例提供的状态管理与模式控制示意图。首先由上位机完成对电源板和主控板的状态监控和故障管理;其次,主控板对其他功能板间状态监控和故障管理(与自主设备管理相似,不再赘述)。
上位机完成对电源板和主控板的状态监控和故障管理的具体过程如下所述。
上位机主要通过三种途径实现对电源板和主控板的状态监控和故障管理,分别是:上位机对设备的遥测、遥控资源,上位机与设备之间的通信通道,以及上位机与两个主控板上的ChMC模块的通信通道。
一般情况下,上位机为设备提供的遥测和遥控资源非常有限,遥测资源主要为模拟量和温度遥测,遥控资源一般为操作控制器(OC)指令,这些资源应重点提供给设备的电源板和主控板。上位机通过对设备的遥测,可以最直观地判断其工作状态。此外,通过上位机与设备之间的通道,上位机可以通过设备的主控板获得关于整个设备工作状态的数字量遥测,而通过上位机与两个主控板的ChMC模块的通信通道,上位机可以获得设备内每个板卡的基础硬件信息,如电压、电流和心跳等。
上位机在判断出电源板故障后,可以通过OC遥控指令,控制电源板内的各个继电器,切断故障电源板的一次电源输入和二次电源输出,同时打开备份电源板的相应电源通道,由备份电源板接替故障电源板对设备内其它板卡进行供电。
上位机判断出主控板故障后,如果主控板采用热备方式,则上位机通过其与热备主板之间的通信接口,通知备用主控板接替故障主控板的工作,并通过故障主控板上的ChMC模块,对故障主控板采用适当的故障隔离措施。如果主控板采用冷备方式,则上位机可以通过两个主控板上的ChMC模块,分别关闭和打开故障主控板和备份主控板的电源,完成功能切换。
在本发明实施例中,无论自主设备还是受控设备,都是由主控板完成对各个功能板的状态监控和故障管理。各个功能板卡之间的冗余备份的核心问题是选择合适的交换拓扑结构。
OpenVPX设备采用OpenVPX标准,相比于之前的架构标准,更容易实现交叉冗余备份。控制平面的千兆以太网总线与数据平面的三种高速数据传输总线都是交换结构,它们都可以应用本发明实施例提供的交叉冗余备份的拓扑结构。需要特殊说明的是,由于PCI-E总线是需要分主从的,在可靠性模型中,PCI-E总线的ROOT节点与其他EP节点及交换单元是串联关系,因此,相比于其他总线,同等情况下,它的可靠性预计值要低一些。
本发明实施例提出了两种交叉冗余备份的拓扑结构。当OpenVPX设备中的功能板的总线接口数量足够多的情况下,可以采用如图2所示的完全交叉冗余备份的拓扑结构,这种拓扑结构实现了交换板与各个功能板之间的完全交叉冗余备份,是一种最理想的备份方法。在实际应用过程中,由于硬件资源限制或采用货架产品等原因,如果功能板的总线接口数量受限,则可以采用图9所示的非完全交叉冗余备份的拓扑结构。这种接口可以在一定程度上实现交叉冗余备份,由于其中的交换板为单点故障模块,通过提高交换板的可靠性,来提高整个设备的可靠性。
本发明实施例提供的两种冗余备份的拓扑结构,均适合于千兆以太网、SRIP总线和10G以太网总线。
采用本发明实施例提供的为OpenVPX设备板卡的冗余备份方法,可以高效设计出具有高可靠性的OpenVPX设备,达到缩短开发周期并提高涉及完备性的效果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (9)

1.一种OpenVPX设备内板卡冗余备份的实现方法,其特征在于,包括:
确定OpenVPX设备是自主设备还是受控设备;
当OpenVPX设备为自主设备时,则对其中的电源板和主控板设置为热备方式进行冗余备份切换,对其他功能板采用热备方式或冷备方式进行冗余备份切换;
当OpenVPX设备为受控设备时,其中的所有板卡采用热备方式或冷备方式进行冗余备份切换。
2.如权利要求1所述的方法,其特征在于,当OpenVPX设备为自主设备时,所述电源板采用热备方式进行冗余备份切换时,包括:
电源板的一次电源输入具有过流保护功能;
电源板的各路输出的主、辅二次电源均具有均流功能及故障切断功能。
3.如权利要求1或2所述的方法,其特征在于,所述主控板及其他功能板的电源设置包括:
二次电源输入端设置保护电路,其中,对于输入的辅助电源,采用过流保护电路,对于输入的主电源,包括过流保护电路及在板卡上布置智能协议管理控制器IPMC模块对主电源进行通断控制。
4.如权利要求1所述的方法,其特征在于,当OpenVPX设备为自主设备时,所述对其他功能板采用热备方式或冷备方式进行冗余备份切换是在主控板的控制下完成的。
5.如权利要求4所述的方法,其特征在于,当OpenVPX设备为自主设备时,所述主控板的控制包括:
主控板通过OpenVPX设备中的管理平面总线和控制平面总线,对其他功能板的工作状态进行监控,当监控到其中的某一功能板进行冗余备份切换时,确定该功能板是采用热备方式或冷备方式进行冗余备份切换;
如果是热备方式,则通过控制平面总线通知处于待机的对应备份功能板接替功能板工作;如果是冷备方式,则通过管理平面总线,分别控制功能板和对应备份的功能板上的IPMC模块,分别切断和打开相应的主供电,并通知处于待机的对应备份功能板接替功能板工作。
6.如权利要求1所述的方法,其特征在于,当OpenVPX设备为受控设备时,所述其中的所有板卡采用热备方式或冷备方式进行冗余备份切换包括:
在上位机的控制下电源板采用热备方式进行冗余备份切换;
在上位机的控制下主控板采用热备方式或冷备方式进行冗余备份切换;
其他功能板在主控板的控制下采用热备方式或冷备方式进行冗余备份切换。
7.如权利要求6所述的方法,其特征在于,所述在上位机的控制下电源板采用热备方式进行冗余备份切换;在上位机的控制下主控板采用热备方式或冷备方式进行冗余备份切换包括:
上位机对电源板和主控板分别进行工作状态监控,在监控时通过上位机和OpenVPX设备之间的通信通道,及分别与电源板设置的IPMC模块和主控板设置的板级管理控制器ChMC模块的通信通道进行;
上位机在确定电源板故障时,则通过上位机和电源板之间的通信通道发送操作控制器OC指令,控制电源板切断输入输出电源,打开备份电源板的输入输出电源,接替电源板工作;
上位机在确定主控板故障时,如果主控板采用热备方式,则通过上位机和主控板之间的通信通道发送OC指令,通知备用主控板接替主控板的工作,控制主控板的ChMC模块关闭主控板的电源;如果主控板采用冷备方式,则分别控制备用主控板和主控板的ChMC模块,分别打开和关闭备用主控板和主控板的电源。
8.如权利要求1所述的方法,其特征在于,所述电源板在采用冷备方式切换时,为电源板设置保护电路,防止潜通。
9.如权利要求1所述的方法,其特征在于,还包括:OpenVPX设备设置的冗余备份拓扑结构中是否包括单点故障板,如果是,则对该单点故障板进行高可靠性的增强设置。
CN201911145334.7A 2019-11-21 2019-11-21 一种OpenVPX设备内板卡冗余备份的实现方法 Active CN110995478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911145334.7A CN110995478B (zh) 2019-11-21 2019-11-21 一种OpenVPX设备内板卡冗余备份的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911145334.7A CN110995478B (zh) 2019-11-21 2019-11-21 一种OpenVPX设备内板卡冗余备份的实现方法

Publications (2)

Publication Number Publication Date
CN110995478A CN110995478A (zh) 2020-04-10
CN110995478B true CN110995478B (zh) 2022-04-22

Family

ID=70085415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911145334.7A Active CN110995478B (zh) 2019-11-21 2019-11-21 一种OpenVPX设备内板卡冗余备份的实现方法

Country Status (1)

Country Link
CN (1) CN110995478B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113595419B (zh) * 2021-06-17 2023-07-28 中国电力科学研究院有限公司 一种继电保护装置电源板及其配置方法
CN114488888B (zh) * 2022-01-14 2024-01-30 上海卫星工程研究所 基于SpaceVPX架构的星载单机双冗余高可靠电源

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9832135B2 (en) * 2014-10-23 2017-11-28 Bae Systems Information And Electronic Systems Integration Inc. Apparatus for managing data queues in a network
CN105930732B (zh) * 2016-04-12 2018-11-06 中国电子科技集团公司第五十四研究所 一种适合vpx设备业务板卡的可信启动方法
CN109101348A (zh) * 2018-08-07 2018-12-28 武汉滨湖电子有限责任公司 一种雷达信号处理集群平台及软件便于扩展的实现方法

Also Published As

Publication number Publication date
CN110995478A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN100477547C (zh) 通信设备主从切换方法及通信设备
CN101378267B (zh) 一种主备切换装置及使用该装置进行主备切换的方法
CN104407556B (zh) 一种热备冗余的模块切换装置
CN110995478B (zh) 一种OpenVPX设备内板卡冗余备份的实现方法
CN102724093B (zh) 一种atca机框及其ipmb连接方法
CN108462529B (zh) 主备板卡切换方法、光传送网络设备及存储介质
CN107919652B (zh) 一种柔性直流系统换流阀的三取二保护拓扑结构及方法
CN101123487A (zh) 一种星上网络总线冗余备份的实现方法
CN105717787A (zh) 用于智能电源配电装置的双余度控制系统及其控制方法
CN107807630A (zh) 一种主备设备的切换控制方法、其切换控制系统及装置
CN110196564B (zh) 一种抗单粒子辐照的平滑切换双机冗余配电系统
CN103793300A (zh) 一种双机热备系统中快速主备切换装置和主备切换方法
CN210608666U (zh) 一种冗余电源的控制装置及供电系统
CN113759694A (zh) 一种双余度流量调节机构控制系统及其余度切换方法
CN110166334B (zh) 基于SpaceVPX标准的空间信息系统
CN203733107U (zh) 一种双机热备系统中快速主备切换装置
CN108415866A (zh) 智能平台管理控制器
CN205071015U (zh) 以太网供电装置
CN111371613A (zh) 刀片服务器混插拓扑结构和系统
US6801973B2 (en) Hot swap circuit module
CN115268339A (zh) 一种三余度综合控制系统和控制方法
CN110162432B (zh) 一种基于arm的多级容错星载计算机系统
CN103095502A (zh) 动态双机倒换机制的单路iic机框管理系统
CN115047750B (zh) 无感备份电路板
CN111880999A (zh) 用于高密度刀片服务器的高可用监控管理装置及冗余切换方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant