CN108964978B - 一种基于三机通信有限状态机模型的三机表决方法 - Google Patents

一种基于三机通信有限状态机模型的三机表决方法 Download PDF

Info

Publication number
CN108964978B
CN108964978B CN201810578117.6A CN201810578117A CN108964978B CN 108964978 B CN108964978 B CN 108964978B CN 201810578117 A CN201810578117 A CN 201810578117A CN 108964978 B CN108964978 B CN 108964978B
Authority
CN
China
Prior art keywords
machine
priority
communication
low
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810578117.6A
Other languages
English (en)
Other versions
CN108964978A (zh
Inventor
詹盼盼
王菁
曹雅婷
孙勇
韦涌泉
郭坚
邱骐
王红光
刘欣
徐勇
李耀楠
乔梁
冯承钰
周波
张晓峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Spacecraft System Engineering
Original Assignee
Beijing Institute of Spacecraft System Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Spacecraft System Engineering filed Critical Beijing Institute of Spacecraft System Engineering
Priority to CN201810578117.6A priority Critical patent/CN108964978B/zh
Publication of CN108964978A publication Critical patent/CN108964978A/zh
Application granted granted Critical
Publication of CN108964978B publication Critical patent/CN108964978B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Selective Calling Equipment (AREA)
  • Communication Control (AREA)

Abstract

本发明公开了一种基于三机通信有限状态机模型的三机表决方法,提供了一种可靠的三机数据比对和切机策略,当某机出现故障或者软件运行异常时,能够通过另外两机的状态进行三取二识别,并有效地将故障机切除,避免其影响系另外两机正常工作;采用软硬件协同设计,将三机通信中各种复杂状态统一为三机通信有限状态机模型,并依据该模型进行表决和切机,解决了三机表决过程中的多种分支状态导致紊乱的难题,提高了三机系统的可靠性和确定性;统一了硬件异常、通信链路失效和软件运行异常的状态,将其统一为通信异常,并通过软件有效判别。

Description

一种基于三机通信有限状态机模型的三机表决方法
技术领域
本发明属于航天计算机技术领域,尤其涉及一种基于三机通信有限状态机模型的三机表决方法。
背景技术
在三机热备份冗余系统中,三台单机的软硬件状态相同,由于三台单机中只能有一台单机作为当班主机,负责总线通信数据等对外数据的输出,因此需要提供一种表决机制来选择出一台正常单机作为当班主机负责系统任务的运行和总线数据的输出。根据三机通信状态和数据交换状态,如何有效且可靠地进行三机通信与表决是三机热备份冗余系统需要解决的关键技术之一。
目前,在三机热备份冗余系统中,原有的方法将通信链路状态和三机软件运行状态混在一起,导致状态繁多且容易产生紊乱,缺乏对三机运行和通信的状态进行全面判断的机制,缺乏一套统一的表决方法实现确定的切机策略。
发明内容
针对航天器三机热备份冗余系统的特点(在硬件设计上,三机优先级A机>B机>C机),本发明提出了一种基于三机通信有限状态机模型的三机表决方法,将三机的运行状态和通信状态聚化成一种有限状态机模型,解决了三机表决过程中的分支和通信状态过多导致状态紊乱的问题,能够容忍通信链路失效,可靠性高。
一种基于三机通信有限状态机模型的三机表决方法,包括如下步骤:
步骤一,将三机的优先级分别设为高、中和低三个优先级;
定义三机通信模式判别字,定义如下:其中一个字节表示本机标识,用于表示当前机为A机、B机或C机;其中三个字节分别表示A机、B机或C机状态,包含初始同步状态、完成同步状态和通信超时状态;初始化时为初始同步状态;
步骤二,除本机外,将其它两机分别定义为高优先级机和低优先级机;读空本机对应的高优先级机FIFO和低优先级机FIFO;高优先级通信超时计数和低优先级通信超时计数初始化为0;
步骤三,生成本机同步数据;
步骤四,本机向其他两机写入本机同步数据,再接收其他两机的同步数据,完成通信后根据通信结果进行判断:
如果本机与另外两机通信正常,高优先级通信超时计数置0,低优先级通信超时计数置0,在遥测信息中记录高、低优先级机通信累计次数,三机分别生成三机通信模式判别字,此时,三机状态均为完成同步状态,当前模式为三机正常模式,转至步骤八;
如果通信结果为本机与低优先级机通信正常、与高优先级机通信超时,转至步骤五;
如果通信结果为本机与高优先级机通信正常、与低优先级机通信超时,转至步骤六;
如果通信结果为本机与高优先级机、与低优先级机均通信超时,转至步骤七;
步骤五,将高优先级通信超时计数加1,在遥测信息中记录低优先级机通信次数;如果高优先级通信超时计数连续大于或等于3,生成三机通信模式判别字,此时本机和低优先级机状态为完成同步状态,高优先级机状态为通信超时状态,当前模式为两机模式,本机与低优先级机加电,转至步骤八;
步骤六,将低优先级通信超时计数加1,在遥测信息中记录高优先级机通信次数;如果低优先级通信计数连续大于或等于3,生成三机通信模式判别字,本机和高优先级机状态为完成同步状态,低优先级机状态为通信超时状态,当前模式为两机模式,本机与高优先级机加电,转至步骤八;
步骤七,将高优先级通信超时计数加1、低优先级通信超时计数加1;如果高优先级通信计数连续大于或等于3、且低优先级通信计数连续大于或等于3,生成三机通信模式判别字,此时三机状态为通信超时状态,当前模式为单机模式,转至步骤八;
步骤八,根据三机通信模式判别字执行相应处理:
如果三机状态均为完成同步状态,继续选择当前当班机为当班主机;
如果两机处于完成同步状态,另一机处于通信超时状态,系统选择两机中优先级较高的单机作为当班主机;
如果三机状态均为通信超时状态,且只有一个单机正常运行,此单机作为当班主机。
进一步的,在系统运行中,三机两两互相通信,并根据得到的通信模式判别字对三机正常运行过程中进行三机状态表决:
如果三机的通信模式判别字的结果一致,表示三机均为正常状态;
否则,进行切机处理,进行如下判断:
A、如果高优先级机、低优先级机数据一致,且与本机数据不一致连续达到3次,则执行本机复位;
B、如果高优先级机和本机数据一致,且与低优先级机数据不一致连续达到3次,获取低优先级机标识,发送切低优先级机指令,将低优先级机关闭;
C、如果本机和低优先级机数据一致,且与高优先级机数据不一致达到3次,获取高优先级机标识,发送切高优先级机指令,将高优先级机关闭。
较佳的,所述步骤1中,将A机的本机标识为0x00,B机的本机标识为0x01,C机的本机标识为0x02;A/B/C机状态的定义如下:初始同步状态用0x01表示;完成同步状态用0x10表示;通信超时状态用0x00表示。
本发明具有如下有益效果:
(1)本发明提供了一种基于三机通信有限状态机模型的三机表决设计,采用软硬件协同设计,将三机通信中各种复杂状态统一为三机通信有限状态机模型,并依据该模型进行表决和切机,解决了三机表决过程中的多种分支状态导致紊乱的难题,提高了三机系统的可靠性和确定性;
(2)统一了硬件异常、通信链路失效和软件运行异常的状态,将其统一为通信异常,并通过软件有效判别;
(3)提供了一种可靠的三机数据比对和切机策略,当某机出现故障或者软件运行异常时,能够通过另外两机的状态进行三取二识别,并有效地将故障机切除,避免其影响系另外两机正常工作。
附图说明
图1为本发明三机硬件优先链逻辑图。
图2为本发明三机管理任务流程图。
图3为本发明三机通信处理流程图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
如附图1所示,本发明提供了一种基于三机通信有限状态机模型的三机表决方法,通过优先链决定三机优先级,A机最高,B机次之,C机最低。三机表决/选择综合后产生主/从机控制信号,主机选择如下表所示:
Figure BDA0001685897970000041
当班状态为1时该机为主机,表决方式主要是通过A、B、C三机间的通信链路相互通讯比较来完成的。当A、B、C三机都正常,A为主机,B机、C机为从机,各自状态置为正常1。
步骤一,定义三机通信模式判别字,用于标识本机的表决策略,长度4字节,定义如下:第0字节表示本机标识,用于表示当前机为A机、B机或C机;其它三个字节分别表示A机、B机或C机状态,包含初始同步状态、完成同步状态和通信超时状态;初始化时为初始同步状态,如下表所示:
第0字节 第1字节 第2字节 第3字节
本机标识 A机状态 B机状态 C机状态
本实施例中,A机的本机标识为0x00,B机的本机标识为0x01,C机的本机标识为0x02。A/B/C机状态的定义如下:初始同步状态用0x01表示;完成同步状态用0x10表示;通信超时状态用0x00表示。
步骤二,初始化三机管理任务;由于设定了三机的高、中、低三级优先级,按照设定的优先级,除本机外,可将其它两机分别定义为高优先级机和低优先级机;读空本机对应的高优先级机FIFO和低优先级机FIFO;高优先级通信超时计数和低优先级通信超时计数初始化为0,向三机管理任务发送第一个激励消息通知其运行,启动4s定时器作为三机管理任务运行激励;
步骤三,如附图2所示,执行三机管理任务,生成本机同步数据,然后执行步骤四至步骤九,4s定时器到时后,返回本步骤;
步骤四,如附图3所示,向其他两机写入本机同步数据,再接收其他两机的同步数据,完成通信后根据通信结果进行判断:
如果本机与另外两机通信正常,高优先级通信超时计数置0,低优先级通信超时计数置0,在遥测信息中记录高、低优先级机通信累计次数,三机分别生成各自的三机通信模式判别字(此时,三机状态均为完成同步状态),当前模式为三机正常模式,转至步骤八;
如果通信结果为本机与低优先级机通信正常、与高优先级机通信超时,转至步骤五;
如果通信结果为本机与高优先级机通信正常、与低优先级机通信超时,转至步骤六;
如果通信结果为本机与高优先级机、与低优先级机均通信超时,转至步骤七;
步骤五,设置高优先级通信超时计数加1,在遥测信息中记录低优先级机通信次数;如果高优先级通信超时计数连续大于或等于3,生成三机通信模式判别字(此时本机和低优先级机状态为完成同步状态,高优先级机状态为通信超时状态),当前模式为两机模式,本机与低优先级机加电,转至步骤八;
步骤六,设置低优先级通信超时计数加1,在遥测信息中记录高优先级机通信次数;如果低优先级通信计数连续大于或等于3,生成三机通信模式判别字(本机和高优先级机状态为完成同步状态,低优先级机状态为通信超时状态),当前模式为两机模式,本机与高优先级机加电,转至步骤八;
步骤七,设置高优先级通信超时计数加1、低优先级通信超时计数加1;如果高优先级通信计数连续大于等于3、低优先级通信计数连续大于货等于3,生成三机通信模式判别字(此时三机状态为通信超时状态),当前模式为单机模式,转至步骤八;
步骤八,根据三机通信模式判别字执行相应处理:
如果三机状态均为完成同步状态,系统选择A机为当班主机;
如果两机处于完成同步状态,另一机处于通信超时状态,系统选择两机中优先级较高的单机作为当班主机;
如果三机状态均为通信超时状态,只有单机正常运行,此单机中作为当班主机;
步骤九,三机正常运行过程中进行三机状态表决:
如果三机的信模式判别字的结果一致,表示三机均为正常状态;
否则,进行切机处理,进行如下判断:
A、如果高优先级机、低优先级机数据一致,且与本机数据不一致连续达到3次,则执行本机复位;
B、如果高优先级机和本机数据一致,且与低优先级机数据不一致连续达到3次,则根据本机标识,获取低优先级机标识,发送切低优先级机指令,将低优先级机关闭;
C、如果本机和低优先级机数据一致,且与高优先级机数据不一致达到3次,则根据本机标识,获取高优先级机标识,发送切高优先级机指令,将高优先级机关闭;当4s定时器到时,返回执行步骤三。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于三机通信有限状态机模型的三机表决方法,其特征在于,包括如下步骤:
步骤一,将三机的优先级分别设为高、中和低三个优先级;
定义三机通信模式判别字,定义如下:其中一个字节表示本机标识,用于表示当前机为A机、B机或C机;其中三个字节分别表示A机、B机或C机状态,包含初始同步状态、完成同步状态和通信超时状态;初始化时为初始同步状态;
步骤二,除本机外,将其它两机分别定义为高优先级机和低优先级机;读空本机对应的高优先级机FIFO和低优先级机FIFO;高优先级通信超时计数和低优先级通信超时计数初始化为0;
步骤三,生成本机同步数据;
步骤四,本机向其他两机写入本机同步数据,再接收其他两机的同步数据,完成通信后根据通信结果进行判断:
如果本机与另外两机通信正常,高优先级通信超时计数置0,低优先级通信超时计数置0,在遥测信息中记录高、低优先级机通信累计次数,三机分别生成三机通信模式判别字,此时,三机状态均为完成同步状态,当前模式为三机正常模式,转至步骤八;
如果通信结果为本机与低优先级机通信正常、与高优先级机通信超时,转至步骤五;
如果通信结果为本机与高优先级机通信正常、与低优先级机通信超时,转至步骤六;
如果通信结果为本机与高优先级机、与低优先级机均通信超时,转至步骤七;
步骤五,将高优先级通信超时计数加1,在遥测信息中记录低优先级机通信次数;如果高优先级通信超时计数连续大于或等于3,生成三机通信模式判别字,此时本机和低优先级机状态为完成同步状态,高优先级机状态为通信超时状态,当前模式为两机模式,本机与低优先级机加电,转至步骤八;
步骤六,将低优先级通信超时计数加1,在遥测信息中记录高优先级机通信次数;如果低优先级通信计数连续大于或等于3,生成三机通信模式判别字,本机和高优先级机状态为完成同步状态,低优先级机状态为通信超时状态,当前模式为两机模式,本机与高优先级机加电,转至步骤八;
步骤七,将高优先级通信超时计数加1、低优先级通信超时计数加1;如果高优先级通信计数连续大于或等于3、且低优先级通信计数连续大于或等于3,生成三机通信模式判别字,此时三机状态为通信超时状态,当前模式为单机模式,转至步骤八;
步骤八,根据三机通信模式判别字执行相应处理:
如果三机状态均为完成同步状态,继续选择当前当班机为当班主机;
如果两机处于完成同步状态,另一机处于通信超时状态,系统选择两机中优先级较高的单机作为当班主机;
如果三机状态均为通信超时状态,且只有一个单机正常运行,此单机作为当班主机。
2.如权利要求1所述的一种基于三机通信有限状态机模型的三机表决方法,其特征在于,在系统运行中,三机两两互相通信,并根据得到的通信模式判别字对三机状态进行表决:
如果三机的通信模式判别字的结果一致,表示三机均为正常状态;
否则,进行切机处理,进行如下判断:
A、如果高优先级机、低优先级机数据一致,且与本机数据不一致连续达到3次,则执行本机复位;
B、如果高优先级机和本机数据一致,且与低优先级机数据不一致连续达到3次,获取低优先级机标识,发送切低优先级机指令,将低优先级机关闭;
C、如果本机和低优先级机数据一致,且与高优先级机数据不一致达到3次,获取高优先级机标识,发送切高优先级机指令,将高优先级机关闭。
3.如权利要求1所述的一种基于三机通信有限状态机模型的三机表决方法,其特征在于,
所述步骤一中,将A机的本机标识为0x00,B机的本机标识为0x01,C机的本机标识为0x02;A/B/C机状态的定义如下:初始同步状态用0x01表示;完成同步状态用0x10表示;通信超时状态用0x00表示。
CN201810578117.6A 2018-06-05 2018-06-05 一种基于三机通信有限状态机模型的三机表决方法 Active CN108964978B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810578117.6A CN108964978B (zh) 2018-06-05 2018-06-05 一种基于三机通信有限状态机模型的三机表决方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810578117.6A CN108964978B (zh) 2018-06-05 2018-06-05 一种基于三机通信有限状态机模型的三机表决方法

Publications (2)

Publication Number Publication Date
CN108964978A CN108964978A (zh) 2018-12-07
CN108964978B true CN108964978B (zh) 2021-03-16

Family

ID=64493473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810578117.6A Active CN108964978B (zh) 2018-06-05 2018-06-05 一种基于三机通信有限状态机模型的三机表决方法

Country Status (1)

Country Link
CN (1) CN108964978B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114291133A (zh) * 2021-12-17 2022-04-08 交控科技股份有限公司 用于地面设备远程重启的控制方法及装置、远程重启设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6292905B1 (en) * 1997-05-13 2001-09-18 Micron Technology, Inc. Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure
CN102724083A (zh) * 2012-05-25 2012-10-10 哈尔滨工程大学 基于软件同步的可降级三模冗余计算机系统
JP2014134925A (ja) * 2013-01-09 2014-07-24 Kansai Electric Power Co Inc:The 情報処理システム、制御方法および制御プログラム
CN104731670A (zh) * 2015-03-25 2015-06-24 北京空间飞行器总体设计部 一种面向卫星的轮换式星载计算机容错系统
CN104993571A (zh) * 2015-07-02 2015-10-21 南京国电南自美卓控制系统有限公司 一种发电控制设备双机热备方法
CN107276731A (zh) * 2016-04-01 2017-10-20 横河电机株式会社 冗余化装置、冗余化系统以及冗余化方法
CN107634855A (zh) * 2017-09-12 2018-01-26 天津津航计算技术研究所 一种嵌入式系统的双机热备方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6292905B1 (en) * 1997-05-13 2001-09-18 Micron Technology, Inc. Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure
CN102724083A (zh) * 2012-05-25 2012-10-10 哈尔滨工程大学 基于软件同步的可降级三模冗余计算机系统
JP2014134925A (ja) * 2013-01-09 2014-07-24 Kansai Electric Power Co Inc:The 情報処理システム、制御方法および制御プログラム
CN104731670A (zh) * 2015-03-25 2015-06-24 北京空间飞行器总体设计部 一种面向卫星的轮换式星载计算机容错系统
CN104993571A (zh) * 2015-07-02 2015-10-21 南京国电南自美卓控制系统有限公司 一种发电控制设备双机热备方法
CN107276731A (zh) * 2016-04-01 2017-10-20 横河电机株式会社 冗余化装置、冗余化系统以及冗余化方法
CN107634855A (zh) * 2017-09-12 2018-01-26 天津津航计算技术研究所 一种嵌入式系统的双机热备方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
三模冗余容错计算机的设计与实现;柳振华;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20101215;I137-3 *
全三模冗余星载计算机系统设计与实现;童天成;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20151215;C031-44 *

Also Published As

Publication number Publication date
CN108964978A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
CN103559053B (zh) 一种板卡系统及通信接口卡fpga在线升级方法
CN102508716B (zh) 任务控制装置和任务控制方法
EP1760559B1 (en) Method and apparatus for synchronizing an industrial controller with a redundant controller
CN102782655A (zh) 微机相互监视系统及微机相互监视方法
CN110231995B (zh) 一种基于Actor模型的任务调度方法、装置及存储介质
CN101276297A (zh) 一种处理器系统、设备及故障处理方法
CN108509327A (zh) 一种日志输出方法、装置、终端设备和存储介质
CN112363972B (zh) 支持多cpu间通信的电子设备及方法
CN113157710B (zh) 区块链数据并行写入方法、装置、计算机设备及存储介质
CN110162344A (zh) 一种隔离限流的方法、装置、计算机设备及可读存储介质
CN108964978B (zh) 一种基于三机通信有限状态机模型的三机表决方法
CN104516796A (zh) 一种基于命令集的网元备份与恢复方法及装置
CN110737504B (zh) 一种深度学习模型训练容错方法、系统、终端及存储介质
CN114546510A (zh) 一种挂起功能的验证方法、装置、电子设备及存储介质
CN107590009A (zh) 用于主机运行过程的故障处理方法及装置
CN103890713B (zh) 用于管理处理系统内的寄存器信息的装置及方法
CN110286852A (zh) 双控构架分布式存储系统、数据读取方法、装置和存储介质
CN109062733A (zh) 一种恢复bmc初始设置的方法、系统、设备及存储介质
CN110908644B (zh) 状态节点的配置方法、装置、计算机设备和存储介质
CN101556542A (zh) 一种成对冗余结构中器件的升级方法及设备
CN111400097A (zh) 数据的备份方法、装置、系统和计算机可读存储介质
CN103927153B (zh) 一种系统配置的方法、设备及系统
CN111752911A (zh) 一种基于Flume的数据传输方法、系统、终端及存储介质
CN110687854A (zh) 一种pa总线控制器以及一种pa总线控制系统
CN109522153A (zh) 一种用于监护仪的配置文件自动修复方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant