CN106656437A - 冗余热备平台 - Google Patents
冗余热备平台 Download PDFInfo
- Publication number
- CN106656437A CN106656437A CN201611160028.7A CN201611160028A CN106656437A CN 106656437 A CN106656437 A CN 106656437A CN 201611160028 A CN201611160028 A CN 201611160028A CN 106656437 A CN106656437 A CN 106656437A
- Authority
- CN
- China
- Prior art keywords
- microcycle
- motherboard
- arbitration modules
- input
- initiation command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/22—Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
- H04L41/0661—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明公开一种冗余热备平台,包括主系、备系和仲裁模块;其中,所示仲裁模块与主系主机板、备系主机板以及该冗余热备平台的输出模块双向通信,该平台通过引入第三方同步管理功能模块,对冗余热备平台添加了输入输出数据比较功能、周期同步功能、跟随功能、宕机后自动恢复功能,在保证安全的前提下,有效的增强了冗余热备平台的可用性。
Description
技术领域
本发明涉及冗余热备平台技术领域,具体涉及一种冗余热备平台。
背景技术
传统冗余热备平台硬件结构包括主备系独立的电源、输入模块、主机板和主备系共用的输出模块,硬件结构图如图1所示。主备系切换输出是依靠链接输出板的继电器来实现的。
主机板A与主机板B通过主备系通道实现周期同步,数据跟随,链路刷新、主备状态管理等功能;主机板A与主机板B的底座上有专门用于标记主机板是A或B的硬线,系统上电在初始化阶段会读取硬线的状态从而决定主机板的状态。系统只能默认其中一个为主系另一个为备系,系统两系均正常工作的必要条件是两个主机板在上电时都必须插在机柜上,中途插上则会造成不可预知结果。主系每个周期都要留出给备系设置同步数据的时间,而且还要等待备系接收主系数据回复备系的工作状态。冗余热备平台软件冗余功能如下表所示。
传统冗余热备平台的解决方案严重依赖硬件平台,增加了维护难度,影响可用性;两系间同步采用的是软同步方法,即依据信息交互来实现两系同步,不利于系统安全和故障判断;备系只是单纯的跟随主系关键数据,没有两系比较功能,有造成主系宕机后备系由于缺少主系的关键数据而输出错误数据的风险。主系每个周期都要同步跟随数据到备系占用较多的时间,导致平台留给应用的时间相对会减少。
发明内容
有鉴于此,本发明提供一种冗余热备平台,通过引入第三方同步管理功能模块,对冗余热备平台添加了输入输出数据比较功能、周期同步功能、跟随功能、宕机后自动恢复功能,在保证安全的前提下,有效的增强了冗余热备平台的可用性。
本发明实施例提出一种冗余热备平台,包括主系和备系,还包括:
仲裁模块;其中,
所示仲裁模块与主系主机板、备系主机板以及该冗余热备平台的输出模块双向通信;
该冗余热备平台的工作流程如下:
所述主系和备系上电自检,在上电自检通过后,所述输出模块向所述仲裁模块发送可正常工作信息,所述主系和备系的主机板向所述仲裁模块发送可进入周期信息,若所述仲裁模块在计时结束时收到所述输出模块发送的可正常工作信息,且收到所述主系和备系的主机板发送的可进入周期信息,则向所述主系和备系的主机板发送输入微周期开始命令;
所述主系和备系的主机板收到所述输入微周期开始命令后,进入输入微周期,依据所述输入微周期开始命令主系主机板发送输入数据到备系主机板,之后,所述主系主机板向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,若所述备系主机板比较获知所述输入数据与周期读取的输入数据相同,则向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的输入微周期结束命令,则向所述主系和备系的主机板发送应用微周期开始命令;
所述主系和备系的主机板收到所述应用微周期开始命令后,进入应用微周期,在应用微周期结束后,向所述仲裁模块发送应用微周期结束命令,并等待所述仲裁模块发送输出微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的应用微周期结束命令,则向所述主系和备系的主机板发送输出微周期开始命令;
所述主系主机板收到所述输出微周期开始命令后,发送输出数据到所述备系主机板,之后,所述主系主机板向所述仲裁模块发送输出微周期结束命令,并等待所述仲裁模块发送记录微周期开始命令,若所述备系主机板比较获知所述输出数据与计算出的输出数据相同,则通知所述仲裁模块以使所述仲裁模块控制所述输出模块输出所述输出数据,向所述仲裁模块发送输出微周期结束命令,并等待所述仲裁模块发送记录微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的输出微周期结束命令,则向所述主系和备系的主机板发送记录微周期开始命令;
所述主系和备系的主机板收到所述记录微周期开始命令后,进入记录微周期,在记录微周期结束后,向所述仲裁模块发送记录微周期结束命令,并等待所述仲裁模块发送输入微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的记录微周期结束命令,则向所述主系和备系的主机板发送输入微周期开始命令,以使所述主系和备系的主机板再次进入输入微周期。
优选地,若所述仲裁模块在计时结束时收到所述输出模块发送的可正常工作信息,且收到一块主机板发送的可进入周期信息,则向该主机板发送输入微周期开始命令,以使该主机板进入输入微周期;
该主机板收到所述输入微周期开始命令后,进入输入微周期,并在输入微周期结束后,向所述仲裁模块发送输入微周期结束命令,等待所述仲裁模块发送应用微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的输入微周期结束命令,则向该主机板发送应用微周期开始命令;
该主机板收到所述应用微周期开始命令后,进入应用微周期,并在应用微周期结束后,向所述仲裁模块发送应用微周期结束命令,等待所述仲裁模块发送输出微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的应用微周期结束命令,则向该主机板发送输出微周期开始命令;
该主机板收到所述输出微周期开始命令后,进入输出微周期,在输出微周期控制所述输出模块输出输出数据,并在输出微周期结束后,向所述仲裁模块发送输出微周期结束命令,等待所述仲裁模块发送记录微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的输出微周期结束命令,则向该主机板发送记录微周期开始命令;
该主机板收到所述记录微周期开始命令后,进入记录微周期,并在记录微周期结束后,向所述仲裁模块发送记录微周期结束命令,等待所述仲裁模块发送输入微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的记录微周期结束命令,则向该主机板发送输入微周期开始命令,以使该主机板再次进入输入微周期。
优选地,所述仲裁模块,还用于监控是否收到主机板发送的可进入周期信息,若收到一主机板发送的可进入周期信息,且判断获知另一主机板处于运行状态,则在该另一主机板向所述仲裁模块发送记录微周期结束命令后,向该另一主机板发送第一输入微周期开始命令,向该一主机板发送第二输入微周期开始命令,其中,所述第一输入微周期开始命令包括本机为主机以及为跟随模式的信息,所述第二输入微周期开始命令包括本机不为主机以及为跟随模式的信息;
该另一主机板收到所述第一输入微周期开始命令后,根据所述第一输入微周期开始命令的指示,设置跟随数据,并将所述跟随数据发送给该一主机板,同时该一主机板收到所述第二输入微周期开始命令后,根据所述第二输入微周期开始命令的指示,等待所述跟随数据,并在收到所述跟随数据后进行跟随;
在跟随结束后,该另一主机板向该一主机板发送输入数据,之后,该另一主机板向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,该一主机板收到所述输入数据后,若比较获知所述输入数据与周期读取的输入数据相同,则向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的输入微周期结束命令,则向所述主系和备系的主机板发送应用微周期开始命令,以使所述主系和备系的主机板进入应用微周期。
优选地,若所述备系主机板比较获知所述输入数据与周期读取的输入数据不相同,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过;
若所述备系主机板比较获知所述输出数据与计算出的输出数据不相同,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过。
优选地,若所述仲裁模块仅收到一块主机板的输入微周期结束命令,则发送宕机命令到未收到命令的主机,并复位相应的主机;
若所述仲裁模块仅收到一块主机板的应用微周期结束命令,则发送宕机命令到未收到命令的主机,并复位相应的主机;
若所述仲裁模块仅收到一块主机板的输出微周期结束命令,则发送宕机命令到未收到命令的主机,并复位相应的主机;
若所述仲裁模块仅收到一块主机板的记录微周期结束命令,则发送宕机命令到未收到命令的主机,并复位相应的主机。
优选地,若所述主系和/或备系上电自检未通过,则未通过的主机置本机,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过。
本发明实施例从冗余热备平台架构上优化平台对应用软件的监控策略,尽可能的减少因为平台软件架构不合理造成的宕机问题。该平台具备如下特点:
引入了宕机自动恢复的概念,主系宕机后进入自动复位恢复流程,进入跟随模式,除了硬件故障无法运行,理论上不会存在系统不可用状态,从根本上降低了维护难度,提高了平台的可用性;
引入了仲裁机制,仲裁机制监控管理两个主机各个微周期的运行时间和运行状态,监控输出模块的工作状态,有效的防止了错误数据的输出,有助于故障判断,同时,由于不需要每个周期都同步跟随数据到备系,能够减少跟随数据同步占用的时间,增加平台留给应用的时间;
引入了输入输出比较功能,提高了系统的安全机制;
引入了输出回采比较功能,防止输出模块输出的数据与主机板输出的数据不一致。
附图说明
图1为现有的冗余热备平台硬件结构示意图;
图2为本发明冗余热备平台一实施例的硬件结构示意图;
图3为图2所示的冗余热备平台主备系所涉及的部分流程示意图;
图4为图2所示的冗余热备平台的仲裁模块所涉及的部分流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参看图2,本实施例公开一种冗余热备平台,包括主系和备系,还包括:
仲裁模块1;其中,
所示仲裁模块1与主系主机板A、备系主机板B以及该冗余热备平台的输出模块2双向通信;
参看图3和图4,该冗余热备平台的工作流程如下:
所述主系和备系上电自检,在上电自检通过后,所述输出模块2向所述仲裁模块1发送可正常工作信息,所述主系和备系的主机板向所述仲裁模块1发送可进入周期信息,若所述仲裁模块1在计时结束时收到所述输出模块2发送的可正常工作信息,且收到所述主系和备系的主机板发送的可进入周期信息,则向所述主系和备系的主机板发送输入微周期开始命令;
所述主系和备系的主机板收到所述输入微周期开始命令后,进入输入微周期,依据所述输入微周期开始命令主系主机板A发送输入数据到备系主机板B,之后,所述主系主机板A向所述仲裁模块1发送输入微周期结束命令,并等待所述仲裁模块1发送应用微周期开始命令,若所述备系主机板B比较获知所述输入数据与周期读取的输入数据相同,则向所述仲裁模块1发送输入微周期结束命令,并等待所述仲裁模块1发送应用微周期开始命令,若所述仲裁模块1在计时结束时收到所述主系和备系的主机板发送的输入微周期结束命令,则向所述主系和备系的主机板发送应用微周期开始命令;
所述主系和备系的主机板收到所述应用微周期开始命令后,进入应用微周期,在应用微周期结束后,向所述仲裁模块1发送应用微周期结束命令,并等待所述仲裁模块1发送输出微周期开始命令,若所述仲裁模块1在计时结束时收到所述主系和备系的主机板发送的应用微周期结束命令,则向所述主系和备系的主机板发送输出微周期开始命令;
所述主系主机板A收到所述输出微周期开始命令后,发送输出数据到所述备系主机板B,之后,所述主系主机板A向所述仲裁模块1发送输出微周期结束命令,并等待所述仲裁模块1发送记录微周期开始命令,若所述备系主机板B比较获知所述输出数据与计算出的输出数据相同,则通知所述仲裁模块1以使所述仲裁模块1控制所述输出模块2输出所述输出数据,向所述仲裁模块1发送输出微周期结束命令,并等待所述仲裁模块1发送记录微周期开始命令,若所述仲裁模块1在计时结束时收到所述主系和备系的主机板发送的输出微周期结束命令,则向所述主系和备系的主机板发送记录微周期开始命令;
所述主系和备系的主机板收到所述记录微周期开始命令后,进入记录微周期,在记录微周期结束后,向所述仲裁模块1发送记录微周期结束命令,并等待所述仲裁模块1发送输入微周期开始命令,若所述仲裁模块1在计时结束时收到所述主系和备系的主机板发送的记录微周期结束命令,则向所述主系和备系的主机板发送输入微周期开始命令,以使所述主系和备系的主机板再次进入输入微周期。
参看图1,为了在不增加安全风险的前提下增加冗余热备平台的可用性,冗余热备平台引入了仲裁模块。增加的仲裁模块可与主机板A、主机板B和输出模块双向通信,监控管理两系主机板和输出模块的工作状态,防止错误数据输出。图3为冗余热备平台主备系所涉及的部分流程示意图,图4为冗余热备平台的仲裁模块所涉及的部分流程示意图,如图3和图4所示,当主备系均正常工作时,仲裁模块默认A系为主系,不设置跟随模式,即仲裁模块反馈的输入微周期开始命令仅用于指示A系为主系,两系主机板每个微周期结束时都要向仲裁模块汇报工作状态,根据仲裁模块的指示进入下一个微周期。对输出模块增加了回采比较功能,回采比较结果报告到仲裁模块,供仲裁模块管理系统工作状态,具体地,输出模块在收到输出数据后,要向仲裁模块汇报准备输出信息,由仲裁模块根据备系输出数据的比较结果决定是否可以输出,当主系主机板发送的输出数据与计算出的输出数据相同时才允许输出模块输出输出数据。
可选地,若所述仲裁模块在计时结束时收到所述输出模块发送的可正常工作信息,且收到一块主机板发送的可进入周期信息,则向该主机板发送输入微周期开始命令,以使该主机板进入输入微周期;
该主机板收到所述输入微周期开始命令后,进入输入微周期,并在输入微周期结束后,向所述仲裁模块发送输入微周期结束命令,等待所述仲裁模块发送应用微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的输入微周期结束命令,则向该主机板发送应用微周期开始命令;
该主机板收到所述应用微周期开始命令后,进入应用微周期,并在应用微周期结束后,向所述仲裁模块发送应用微周期结束命令,等待所述仲裁模块发送输出微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的应用微周期结束命令,则向该主机板发送输出微周期开始命令;
该主机板收到所述输出微周期开始命令后,进入输出微周期,在输出微周期控制所述输出模块输出输出数据,并在输出微周期结束后,向所述仲裁模块发送输出微周期结束命令,等待所述仲裁模块发送记录微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的输出微周期结束命令,则向该主机板发送记录微周期开始命令;
该主机板收到所述记录微周期开始命令后,进入记录微周期,并在记录微周期结束后,向所述仲裁模块发送记录微周期结束命令,等待所述仲裁模块发送输入微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的记录微周期结束命令,则向该主机板发送输入微周期开始命令,以使该主机板再次进入输入微周期。
本实施例中,如果只有一块主机板上电通过,则仲裁模块会默认本机为主系。此外,所述仲裁模块,还会监控是否收到主机板发送的可进入周期信息,若收到一主机板发送的可进入周期信息,且判断获知另一主机板处于运行状态,则在该另一主机板向所述仲裁模块发送记录微周期结束命令后,向该另一主机板发送第一输入微周期开始命令,向该一主机板发送第二输入微周期开始命令,其中,所述第一输入微周期开始命令包括本机为主机以及为跟随模式的信息,所述第二输入微周期开始命令包括本机不为主机以及为跟随模式的信息;
该另一主机板收到所述第一输入微周期开始命令后,根据所述第一输入微周期开始命令的指示,设置跟随数据,并将所述跟随数据发送给该一主机板,同时该一主机板收到所述第二输入微周期开始命令后,根据所述第二输入微周期开始命令的指示,等待所述跟随数据,并在收到所述跟随数据后进行跟随;
在跟随结束后,该另一主机板向该一主机板发送输入数据,之后,该另一主机板向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,该一主机板收到所述输入数据后,若比较获知所述输入数据与周期读取的输入数据相同,则向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的输入微周期结束命令,则向所述主系和备系的主机板发送应用微周期开始命令,以使所述主系和备系的主机板进入应用微周期。
本实施例中,仲裁模块会实时监控主机板是否发送可进入周期信息,当某一主机板发送可进入周期信息,则说明该主机板复位且上电自检通过。此时会检查另一主机板的状态,若另一主机板处于正常运行状态,则会设置该另一主机板为主系主机板,并设置该某一主机板对该另一主机板进行跟随。
参看下表,当仅备系初始化故障、微周期超时、备系跟随处理超时、微周期故障、输入表决失败或输出表决失败时,由仲裁模块设置,主系正常运行,备系复位后恢复,平台能正常运行;当仅主系初始化故障、微周期超时或出故障时,由仲裁模块设置,主系复位后恢复为备系,备系升为主系运行,平台能正常运行;当主备系微周期同时初始化故障、同时超时或同时出故障时,由仲裁模块设置,双系复位后恢复,平台不可用。
当故障为硬件故障时,若仅为主系故障,则备系升为主系运行,平台能正常运行;若仅为备系故障,则备系复位后不能恢复,平台能正常运行;当主备系同时故障,则平台不能正常运行。
参看图3和图4,对应的,为了使平台正常运行,需要在超时或故障时复位相应的主机,具体操作如下:若所述备系主机板比较获知所述输入数据与周期读取的输入数据不相同,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过;
若所述备系主机板比较获知所述输出数据与计算出的输出数据不相同,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过;
若所述仲裁模块仅收到一块主机板的输入微周期结束命令,则发送宕机命令到未收到命令的主机,并重复复位相应的主机的步骤,直至相应的主机上电自检通过;
若所述仲裁模块仅收到一块主机板的应用微周期结束命令,则发送宕机命令到未收到命令的主机,并重复复位相应的主机的步骤,直至相应的主机上电自检通过;
若所述仲裁模块仅收到一块主机板的输出微周期结束命令,则发送宕机命令到未收到命令的主机,并重复复位相应的主机的步骤,直至相应的主机上电自检通过;
若所述仲裁模块仅收到一块主机板的记录微周期结束命令,则发送宕机命令到未收到命令的主机,并重复复位相应的主机的步骤,直至相应的主机上电自检通过;
若所述主系和/或备系上电自检未通过,则未通过的主机置本机,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过。
本实施例中,通过对多种故障情况下的对应主机进行复位,便于仲裁模块对该主机进行复位恢复,增加了平台可用性。
本发明引入了第三方监控模块作为两个主机板的仲裁管理单元,管理两个主机板的工作状态和异常状态处理,使冗余热备平台在异常情况下能够更加快速的定位异常原因,保证不会有错误信息输出,增加系统的安全性。
本发明提出的方法是专门针对天津6号线和深圳7号线ATO宕机频率较高,可用性差提出的一种增强冗余热备平台可用性的方法。经理论验证和实际测试,本发明提及的改进方法在一定程度上减少了宕机频率,增加了可用性,受到了用户的欢迎。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面,也不局限于任何单一的实施例,也不局限于这些方面和/或实施例的任意组合和/或置换。而且,可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施例结合使用。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (6)
1.一种冗余热备平台,包括主系和备系,其特征在于,还包括:
仲裁模块;其中,
所示仲裁模块与主系主机板、备系主机板以及该冗余热备平台的输出模块双向通信;
该冗余热备平台的工作流程如下:
所述主系和备系上电自检,在上电自检通过后,所述输出模块向所述仲裁模块发送可正常工作信息,所述主系和备系的主机板向所述仲裁模块发送可进入周期信息,若所述仲裁模块在计时结束时收到所述输出模块发送的可正常工作信息,且收到所述主系和备系的主机板发送的可进入周期信息,则向所述主系和备系的主机板发送输入微周期开始命令;
所述主系和备系的主机板收到所述输入微周期开始命令后,进入输入微周期,依据所述输入微周期开始命令主系主机板发送输入数据到备系主机板,之后,所述主系主机板向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,若所述备系主机板比较获知所述输入数据与周期读取的输入数据相同,则向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的输入微周期结束命令,则向所述主系和备系的主机板发送应用微周期开始命令;
所述主系和备系的主机板收到所述应用微周期开始命令后,进入应用微周期,在应用微周期结束后,向所述仲裁模块发送应用微周期结束命令,并等待所述仲裁模块发送输出微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的应用微周期结束命令,则向所述主系和备系的主机板发送输出微周期开始命令;
所述主系主机板收到所述输出微周期开始命令后,发送输出数据到所述备系主机板,之后,所述主系主机板向所述仲裁模块发送输出微周期结束命令,并等待所述仲裁模块发送记录微周期开始命令,若所述备系主机板比较获知所述输出数据与计算出的输出数据相同,则通知所述仲裁模块以使所述仲裁模块控制所述输出模块输出所述输出数据,向所述仲裁模块发送输出微周期结束命令,并等待所述仲裁模块发送记录微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的输出微周期结束命令,则向所述主系和备系的主机板发送记录微周期开始命令;
所述主系和备系的主机板收到所述记录微周期开始命令后,进入记录微周期,在记录微周期结束后,向所述仲裁模块发送记录微周期结束命令,并等待所述仲裁模块发送输入微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的记录微周期结束命令,则向所述主系和备系的主机板发送输入微周期开始命令,以使所述主系和备系的主机板再次进入输入微周期。
2.根据权利要求1所述的冗余热备平台,其特征在于,若所述仲裁模块在计时结束时收到所述输出模块发送的可正常工作信息,且收到一块主机板发送的可进入周期信息,则向该主机板发送输入微周期开始命令,以使该主机板进入输入微周期;
该主机板收到所述输入微周期开始命令后,进入输入微周期,并在输入微周期结束后,向所述仲裁模块发送输入微周期结束命令,等待所述仲裁模块发送应用微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的输入微周期结束命令,则向该主机板发送应用微周期开始命令;
该主机板收到所述应用微周期开始命令后,进入应用微周期,并在应用微周期结束后,向所述仲裁模块发送应用微周期结束命令,等待所述仲裁模块发送输出微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的应用微周期结束命令,则向该主机板发送输出微周期开始命令;
该主机板收到所述输出微周期开始命令后,进入输出微周期,在输出微周期控制所述输出模块输出输出数据,并在输出微周期结束后,向所述仲裁模块发送输出微周期结束命令,等待所述仲裁模块发送记录微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的输出微周期结束命令,则向该主机板发送记录微周期开始命令;
该主机板收到所述记录微周期开始命令后,进入记录微周期,并在记录微周期结束后,向所述仲裁模块发送记录微周期结束命令,等待所述仲裁模块发送输入微周期开始命令,若所述仲裁模块在计时结束时收到该主机板发送的记录微周期结束命令,则向该主机板发送输入微周期开始命令,以使该主机板再次进入输入微周期。
3.根据权利要求1或2所述的冗余热备平台,其特征在于,所述仲裁模块,还用于监控是否收到主机板发送的可进入周期信息,若收到一主机板发送的可进入周期信息,且判断获知另一主机板处于运行状态,则在该另一主机板向所述仲裁模块发送记录微周期结束命令后,向该另一主机板发送第一输入微周期开始命令,向该一主机板发送第二输入微周期开始命令,其中,所述第一输入微周期开始命令包括本机为主机以及为跟随模式的信息,所述第二输入微周期开始命令包括本机不为主机以及为跟随模式的信息;
该另一主机板收到所述第一输入微周期开始命令后,根据所述第一输入微周期开始命令的指示,设置跟随数据,并将所述跟随数据发送给该一主机板,同时该一主机板收到所述第二输入微周期开始命令后,根据所述第二输入微周期开始命令的指示,等待所述跟随数据,并在收到所述跟随数据后进行跟随;
在跟随结束后,该另一主机板向该一主机板发送输入数据,之后,该另一主机板向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,该一主机板收到所述输入数据后,若比较获知所述输入数据与周期读取的输入数据相同,则向所述仲裁模块发送输入微周期结束命令,并等待所述仲裁模块发送应用微周期开始命令,若所述仲裁模块在计时结束时收到所述主系和备系的主机板发送的输入微周期结束命令,则向所述主系和备系的主机板发送应用微周期开始命令,以使所述主系和备系的主机板进入应用微周期。
4.根据权利要求1所述的冗余热备平台,其特征在于,若所述备系主机板比较获知所述输入数据与周期读取的输入数据不相同,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过;
若所述备系主机板比较获知所述输出数据与计算出的输出数据不相同,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过。
5.根据权利要求1所述的冗余热备平台,其特征在于,若所述仲裁模块仅收到一块主机板的输入微周期结束命令,则发送宕机命令到未收到命令的主机,并重复复位相应的主机的步骤,直至相应的主机上电自检通过;
若所述仲裁模块仅收到一块主机板的应用微周期结束命令,则发送宕机命令到未收到命令的主机,并重复复位相应的主机的步骤,直至相应的主机上电自检通过;
若所述仲裁模块仅收到一块主机板的输出微周期结束命令,则发送宕机命令到未收到命令的主机,并重复复位相应的主机的步骤,直至相应的主机上电自检通过;
若所述仲裁模块仅收到一块主机板的记录微周期结束命令,则发送宕机命令到未收到命令的主机,并重复复位相应的主机的步骤,直至相应的主机上电自检通过。
6.根据权利要求1所述的冗余热备平台,其特征在于,若所述主系和/或备系上电自检未通过,则未通过的主机置本机,则重复置本机故障状态,将状态发送给所述仲裁模块,并对本机进行复位的步骤,直至本机上电自检通过。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611160028.7A CN106656437A (zh) | 2016-12-15 | 2016-12-15 | 冗余热备平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611160028.7A CN106656437A (zh) | 2016-12-15 | 2016-12-15 | 冗余热备平台 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106656437A true CN106656437A (zh) | 2017-05-10 |
Family
ID=58822751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611160028.7A Pending CN106656437A (zh) | 2016-12-15 | 2016-12-15 | 冗余热备平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106656437A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107390513A (zh) * | 2017-07-27 | 2017-11-24 | 湖南中车时代通信信号有限公司 | 一种冗余系统接入单路总线的方法和系统 |
CN109677454A (zh) * | 2018-11-23 | 2019-04-26 | 交控科技股份有限公司 | 城市轨道交通信号系统中安全计算机平台的状态监控方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5583769A (en) * | 1990-09-21 | 1996-12-10 | Kabushiki Kaisha Toshiba | Automatic train operation apparatus incorporating security function with improved reliability |
JP2004082981A (ja) * | 2002-08-29 | 2004-03-18 | Nippon Signal Co Ltd:The | Ato装置 |
CN102955903A (zh) * | 2012-11-15 | 2013-03-06 | 同济大学 | 一种轨道交通计算机控制系统安全苛求信息的处理方法 |
CN203027276U (zh) * | 2012-12-10 | 2013-06-26 | 北京交控科技有限公司 | 双机热备平台 |
CN103645715A (zh) * | 2013-12-12 | 2014-03-19 | 中国铁道科学研究院 | 一种双机热备的列车自动驾驶系统 |
CN103744753A (zh) * | 2013-12-26 | 2014-04-23 | 北京交控科技有限公司 | 一种双机系统的数据交互方法与装置 |
CN203732945U (zh) * | 2013-12-12 | 2014-07-23 | 中国铁道科学研究院 | 一种双机热备的列车自动驾驶系统 |
CN104111881A (zh) * | 2014-07-25 | 2014-10-22 | 中国航天科工集团第二研究院七〇六所 | 一种用于双机冗余热备份计算机的仲裁装置 |
CN104267713A (zh) * | 2014-09-01 | 2015-01-07 | 北京交通大学 | 双机热备结构的ato设备的故障检测和切换方法 |
CN104401365A (zh) * | 2014-10-16 | 2015-03-11 | 北京交控科技有限公司 | Ato双机热备的实现方法和ato双机热备 |
CN104503272A (zh) * | 2014-11-20 | 2015-04-08 | 北京交控科技有限公司 | 基于双系热备冗余的列车自动驾驶系统 |
-
2016
- 2016-12-15 CN CN201611160028.7A patent/CN106656437A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5583769A (en) * | 1990-09-21 | 1996-12-10 | Kabushiki Kaisha Toshiba | Automatic train operation apparatus incorporating security function with improved reliability |
JP2004082981A (ja) * | 2002-08-29 | 2004-03-18 | Nippon Signal Co Ltd:The | Ato装置 |
CN102955903A (zh) * | 2012-11-15 | 2013-03-06 | 同济大学 | 一种轨道交通计算机控制系统安全苛求信息的处理方法 |
CN203027276U (zh) * | 2012-12-10 | 2013-06-26 | 北京交控科技有限公司 | 双机热备平台 |
CN103645715A (zh) * | 2013-12-12 | 2014-03-19 | 中国铁道科学研究院 | 一种双机热备的列车自动驾驶系统 |
CN203732945U (zh) * | 2013-12-12 | 2014-07-23 | 中国铁道科学研究院 | 一种双机热备的列车自动驾驶系统 |
CN103744753A (zh) * | 2013-12-26 | 2014-04-23 | 北京交控科技有限公司 | 一种双机系统的数据交互方法与装置 |
CN104111881A (zh) * | 2014-07-25 | 2014-10-22 | 中国航天科工集团第二研究院七〇六所 | 一种用于双机冗余热备份计算机的仲裁装置 |
CN104267713A (zh) * | 2014-09-01 | 2015-01-07 | 北京交通大学 | 双机热备结构的ato设备的故障检测和切换方法 |
CN104401365A (zh) * | 2014-10-16 | 2015-03-11 | 北京交控科技有限公司 | Ato双机热备的实现方法和ato双机热备 |
CN104503272A (zh) * | 2014-11-20 | 2015-04-08 | 北京交控科技有限公司 | 基于双系热备冗余的列车自动驾驶系统 |
Non-Patent Citations (2)
Title |
---|
林福栋: "基于COTS和软件差异性的双机热备平台的设计与实现", 《中国优秀硕士学位论文全文数据库(电子期刊)》 * |
陈海燕: "面向无人驾驶ATO设备冗余机制的设计和实现", 《中国优秀硕士学位论文全文数据库(电子期刊)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107390513A (zh) * | 2017-07-27 | 2017-11-24 | 湖南中车时代通信信号有限公司 | 一种冗余系统接入单路总线的方法和系统 |
CN109677454A (zh) * | 2018-11-23 | 2019-04-26 | 交控科技股份有限公司 | 城市轨道交通信号系统中安全计算机平台的状态监控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107634855A (zh) | 一种嵌入式系统的双机热备方法 | |
CN201909961U (zh) | 一种冗余控制系统 | |
CN103647781B (zh) | 一种基于设备冗余和网络冗余的混合冗余可编程控制系统 | |
WO2021073105A1 (zh) | 一种双机热备系统 | |
CN102103532B (zh) | 列控车载设备的安全冗余计算机系统 | |
CN103425553B (zh) | 一种双机热备份系统及该系统的故障检测方法 | |
CN104570721B (zh) | 冗余控制器主从状态确定方法 | |
CN101207408A (zh) | 一种用于主备倒换的综合故障检测装置和方法 | |
CN107347018A (zh) | 一种三冗余1553b总线动态切换方法 | |
CN109507866A (zh) | 一种基于网络地址漂移技术的双机冗余系统及方法 | |
WO2020143243A1 (zh) | 一种应用于列车自动运行系统的双系热备切换方法及系统 | |
CN102724083A (zh) | 基于软件同步的可降级三模冗余计算机系统 | |
CN103744753B (zh) | 一种双机系统的数据交互方法与装置 | |
CN104794028A (zh) | 一种容灾处理方法、装置、主用数据中心和备用数据中心 | |
CN110427283B (zh) | 一种双余度的燃油管理计算机系统 | |
CN103744743A (zh) | 一种基于数据库rac模式心跳信号的冗余配置的方法 | |
US9952579B2 (en) | Control device | |
CN103257908A (zh) | 一种软硬件协同的多控制器磁盘阵列设计方法 | |
CN112714173B (zh) | 一种站台门控制器云平台系统及控制方法 | |
CN102830647A (zh) | 一种故障安全的二乘二取二装置 | |
CN105487945A (zh) | 一种非相似双余度四机自监控容错控制方法 | |
CN113791937B (zh) | 一种数据同步冗余系统及其控制方法 | |
CN103246585A (zh) | 一种存储控制器故障检测方法 | |
CN106656437A (zh) | 冗余热备平台 | |
CN110147343A (zh) | 一种全比较的Lockstep处理器架构 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170510 |
|
RJ01 | Rejection of invention patent application after publication |