CN111221673B - 一种故障恢复方法及装置 - Google Patents

一种故障恢复方法及装置 Download PDF

Info

Publication number
CN111221673B
CN111221673B CN201911387464.1A CN201911387464A CN111221673B CN 111221673 B CN111221673 B CN 111221673B CN 201911387464 A CN201911387464 A CN 201911387464A CN 111221673 B CN111221673 B CN 111221673B
Authority
CN
China
Prior art keywords
fault
channel
check code
check
updating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911387464.1A
Other languages
English (en)
Other versions
CN111221673A (zh
Inventor
张翔
王�琦
宋乐
童燕
梁阿迎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Lianfei Intelligent Equipment Research Institute Co ltd
Original Assignee
Xi'an Lianfei Intelligent Equipment Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Lianfei Intelligent Equipment Research Institute Co ltd filed Critical Xi'an Lianfei Intelligent Equipment Research Institute Co ltd
Priority to CN201911387464.1A priority Critical patent/CN111221673B/zh
Publication of CN111221673A publication Critical patent/CN111221673A/zh
Application granted granted Critical
Publication of CN111221673B publication Critical patent/CN111221673B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种故障恢复方法及装置,用以解决现有技术中系统总线故障进行恢复时,因各个通道未建立隔离而导致恢复操作时易将已经发生故障的通道恢复为正常状态。该方法包括:若连续第一设定值个周期内未采集到至少两个第一通道的地址指令时,确定与所述地址指令对应的两个所述通道发生更新故障;若在当前周期内采集到至少一个所述第二通道的正常更新以及校验码匹配成功信息,将所述第二通道发生的所述更新故障确定为可恢复故障;其中,所述第二通道为两个所述第一通道中的任意一个。

Description

一种故障恢复方法及装置
技术领域
本发明涉及飞行控制系统技术领域,更具体的涉及一种故障恢复方法及装置。
背景技术
系统总线故障的恢复用于将某些特殊的总线交联信号从由于通讯失联或超出范围而造成的故障中恢复为正常状态,比如测控数据链、无线电高度等。
现有的系统总线故障的恢复通常为手动恢复,或者在自动恢复的过程中将不希望恢复的故障一并进行了恢复。系统总线故障在进行恢复时并没有对故障的通道进行有效的隔离,因而,当被恢复的故障通道采集的信号进入系统的表决面后,会对信号表决值的选取造成不利影响。最终,可能会导致系统将错误的信号值送往控制器进行后续计算。
综上所述,现有技术中系统总线故障进行恢复时,因各个通道未建立隔离而导致恢复操作时易将已经发生故障的通道恢复为正常状态。
发明内容
本发明实施例提供一种故障恢复方法及装置,用以解决现有技术中系统总线故障进行恢复时,因各个通道未建立隔离而导致恢复操作时易将已经发生故障的通道恢复为正常状态。
本发明实施例提供了一种故障恢复方法,包括:
若连续第一设定值个周期内未采集到至少两个第一通道的地址指令时,确定与所述地址指令对应的两个所述通道发生更新故障;
若在当前周期内采集到至少一个所述第二通道的正常更新以及校验码匹配成功信息,将所述第二通道发生的所述更新故障确定为可恢复故障;其中,所述第二通道为两个所述第一通道中的任意一个。
优选地,所述校验码匹配包括:
对通过所述第二通道接收到的第一指令进行解析,并根据所述第二通道的计算方式得到与所述第二通道对应的第一校验码;
将所述第一校验码与通过所述第二通道发送的第二校验码进行匹配,若第一校验码与所述第二校验码一致,确认校验码匹配成功,确认所述第二通道未发生校验故障。
优选地,还包括:
若所述第一校验与所述第二校验码不一致,则确认校验码匹配不成功;
所述第二通道内的校验瞬态故障计数开始计数,当所述第二通道在连续第一设定值个周期内均发生所述校验码匹配不成功,且所述校验瞬态故障计数的数值等于所述第一设定值时,确认所述第二通道发生校验故障,所述第二通道内的校验故障标志置出故障信息;
其中,所述校验故障标志表示所述第二通道发送的所述更新故障为不可恢复故障,所述第二通道内携带有所述校验瞬态故障计数和所述校验故障标志所述校验故障标志包括故障信息和正常信息。
优选地,所述确定与所述地址指令对应的两个所述通道发生更新故障时,还包括:
所述第一通道携带的瞬态更新故障计数的数值等于所述第一设定值,所述第一通道内的更新故障标志置出故障信息。
优选地,所述将所述第二通道发生的所述更新故障确定为可恢复故障之后,还包括:
对所述第二通道进行故障恢复,将所述第二通道内的更新故障标志置出正常信息,将所述第二通道内的瞬态更新故障计数的数值清零。
本发明实施例还提供了一种故障恢复装置,包括:
第一确定单元,用于若连续第一设定值个周期内未采集到至少两个第一通道的地址指令时,确定与所述地址指令对应的两个所述通道发生更新故障;
第二确定单元,用于若在当前周期内采集到至少一个所述第二通道的正常更新以及校验码匹配成功信息,将所述第二通道发生的所述更新故障确定为可恢复故障;其中,所述第二通道为两个所述第一通道中的任意一个。
优选地,所述第二确定单元具体用于:
对通过所述第二通道接收到的第一指令进行解析,并根据所述第二通道的计算方式得到与所述第二通道对应的第一校验码;
将所述第一校验码与通过所述第二通道发送的第二校验码进行匹配,若第一校验码与所述第二校验码一致,确认校验码匹配成功,确认所述第二通道未发生校验故障。
优选地,所述第二确定单元还用于:
若所述第一校验与所述第二校验码不一致,则确认校验码匹配不成功;
所述第二通道内的校验瞬态故障计数开始计数,当所述第二通道在连续第一设定值个周期内均发生所述校验码匹配不成功,且所述校验瞬态故障计数的数值等于所述第一设定值时,确认所述第二通道发生校验故障,所述第二通道内的校验故障标志置出故障信息;
其中,所述校验故障标志表示所述第二通道发送的所述更新故障为不可恢复故障,所述第二通道内携带有所述校验瞬态故障计数和所述校验故障标志所述校验故障标志包括故障信息和正常信息。
优选地,所述第二确定单元还用于:
所述第一通道携带的瞬态更新故障计数的数值等于所述第一设定值,所述第一通道内的更新故障标志置出故障信息。
优选地,所述第二确定单元还用于:
对所述第二通道进行故障恢复,将所述第二通道内的更新故障标志置出正常信息,将所述第二通道内的瞬态更新故障计数的数值清零。
本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种故障恢复方法所包括的步骤。
本发明实施例还提供了一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现一种故障恢复方法所包括的步骤。
本发明实施例提供了一种故障恢复方法,该方法包括:若连续第一设定值个周期内未采集到至少两个第一通道的地址指令时,确定与所述地址指令对应的两个所述通道发生更新故障;若在当前周期内采集到至少一个所述第二通道的正常更新以及校验码匹配成功信息,将所述第二通道发生的所述更新故障确定为可恢复故障;其中,所述第二通道为两个所述第一通道中的任意一个。在该方法中,将至少两个通道发生更新故障和第一地址指令与校验码匹配成功确定为可恢复故障的条件;第一个条件体现了各个通道之间的故障进行恢复时的条件是彼此独立的,该条件能够具有针对性的对某一类故障进行恢复,避免引入其他故障;第二个条件表明当机载测控终端与飞控计算机之间的总线通行未发生故障时,即当前通道发生的更新故障并不属于系统内的故障,因此可以将该通道的故障确定为可恢复故障,避免了在进行故障恢复时,将系统故障所导致的通道更新故障恢复为正常通道。本发明实施例提供的总线故障恢复方法,解决了现有技术中系统总线故障进行恢复时,因各个通道未建立隔离而导致恢复操作时易将已经发生故障的通道恢复为正常通道。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种故障恢复方法流程示意图;
图2为本发明实施例一提供的故障恢复流程示意图;
图3为本发明实施例提供的一种故障恢复装置结构示意图;
图4为本发明实施例提供的电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示例性的示出了本发明实施例提供的一种故障恢复方法流程示意图,该方法至少可以应用于飞行控制系统。
如图1所示,该方法主要包括以下步骤:
步骤101,若连续第一设定值个周期内未采集到至少两个第一通道的地址指令时,确定与所述地址指令对应的两个所述通道发生更新故障;
步骤102,若在当前周期内采集到至少一个所述第二通道的正常更新以及校验码匹配成功信息,将所述第二通道发生的所述更新故障确定为可恢复故障;其中,所述第二通道为两个所述第一通道中的任意一个。
需要说明的是,在实际应用中,该方法的执行主体为飞控计算机。具体地,飞控计算机的FPGA(Field-Programmable Gate Array,现场可编程逻辑门阵列)会在每个周期内从双口RAM(random access memory,随机存取存储器)里采集测控系统通过串行总线发送的每个通道的地址指令。进一步地,飞控计算机会将采集到的每个通道的地址指令存储在非易失存储器内。
测控指令是按照一定的周期间隔连续发送的,当地面测控终端的操作手没有向无人机飞控系统发送实际有效的指令时,测控终端依旧向飞控发送数据,只是数据内容全部为0,这样就保证了正常情况下飞控计算机每个通讯周期都是能采集到测控终端发送的指令,便于识别和监控通讯是否断开。
在步骤101中,飞控计算机按照设置的周期采集多个通道的地址指令,需要根据采集到的地址指令,判断哪个通道没有采集到地址指令。比如,若在设定的周期内没有采集到一个通道的地址指令时,则可以判断有可能是基站测控终端与飞控计算机的某一个通道的CPU板之间的总连接线出现了问题。
进一步地,当飞控计算机在连续的几个周期内没有采集到至少有两个第一通道的地址指令时,则需要进一步确定没有采集到的地址指令所对应的两个第一通道的编码,比如,若地址指令分别携带有A、B时,则可以确定地址指令A对应第一通道A,地址指令B对应第一通道B。在实际应用中,若飞控计算机在连续第一设定值个周期内至少有两个第一通道的地址指令未采集到时,则说明了数据链丢失的概率比较大,则确认上述两个第一通道发生更新故障;进一步地,则需要确认发生更新故障的通道是否可以进行故障恢复,即发生更新故障的通道当前的故障是否为可以恢复故障。
需要说明的是,在实际应用中,第一通道内有故障标志和瞬态故障计数器,其中,更新故障对应的更新故障标志和更新瞬态故障计数器,校验故障对应的校验故障标志和校验瞬态故障计数器。更新瞬态故障计数器的作用是在飞控计算机第一次在第一通道内没有采集到地址指令时就开始计数,若在下一个周期内飞控计算机采集到地址指令,则更新瞬态故障计数器的计数清零,否则更新瞬态故障计数器的计数增加1,直到更新瞬态故障计数达到第一设定值,才认为第一通道发生更新故障;当确认该第一通道发送更新故障时,则该第一通道内的更新故障标志会置出故障标志。
在本发明实施例中,第一设定值为一个设定阈值,比如,该第一设定值可以是3,可以是5,在本发明实施例中,对第一设定值的具体数值不做限定。
在实际应用中,若发生更新故障的通道当前的故障为可恢复故障,则该通道就可以恢复更新;若发生更新故障的通道当前的故障为不可恢复故障,则该通道就不能恢复更新。
在本发明实施例中,判断发生更新故障的通道当前的故障是否为可以恢复故障,需要进行以下操作:
在步骤102中,由于飞控计算机在连续第一设定值个周期内未采集到第一通道的地址指令,而飞控计算机会将连续第一设定值个周期之前采集到的第一通道的地址指令均存储在系统内的存储器内,则飞控计算机可以从存储器内获取到该周期之前接收到的第一地址指令。
进一步地,飞控计算机从存储器内获取到第一地址指令之后,需要对第一地址指令进行解析,需要说明的是,在这里为了与步骤101中的第一通道进行区别,可以将从存储器内获取第一地址指令的通道称为第二通道。对通过第二通道接收的第一地址指令进行解析,并根据第二通道的计算方式对解析后的第一地址指令进行计算,得到第二通道的第一校验码。
将计算得到的第二通道的第一校验码与第二通道发送的第二校验码进行匹配,若第一校验码和第二校验码匹配成功,则确认第二通道未发生校验故障,即第二通道发生的更新故障为可恢复故障。
需要说明的是,在实际应用中,校验码进行匹配是每个监控周期都需要进行的,校验码匹配的原理就是将通过第二通道发送的地址指令中的所有字节的数据按照该通道的计算方式进行运算,运算的结果就是第二通道的第一校验码,相应的,第二通道在接收地址指令时,地址指令中还携带有发送方发送的第一校验码,当进行校验码匹配是,就是将第一校验码与第二校验码进行匹配。
进一步地,若第一校验码和第二校验码匹配不一致,则第二通道内的校验瞬态故障计数器开始计数,当第二通道在连续第一设定值个周期内均发送校验码匹配不成功,且校验瞬态故障计数器的计数数值等于第一设定值时,则确认第二通道发生校验故障,将第二通道内的校验故障标志置出故障信息。在本发明实施例中,若第二通道内的校验故障标志置出故障信息时,则表明第二通道发送的更新故障为不可恢复故障。
在实际应用中,在第一通道内的故障标志初始化时均默认为false,瞬态故障计数器都为0。即更新故障标志默认的标志为false,校验故障标志默认的标志为false,更新瞬态故障计数器和校验瞬态故障计数器的计时都为0;当系统判断出第一通道的更新瞬态故障计数器的计数达到给第一设定值后,锁定计数,并将更新故障标志置为true。当系统判断出第二通道的校验瞬态故障计数器的计数达到给第一设定值后,锁定计数,并将第二通道的校验故障标志置为true。进一步地,若第二通道恢复更新故障时,将第二通道的更新瞬态故障计数器的值写为0,并将第二通道的更新故障标志重置为false。
图2为本发明实施例一提供的故障恢复流程示意图,该故障恢复是以双余度飞控系统中的一种总线故障“测控指令更新故障”为例。在实际应用中,造成更新故障的原因可能是由于遮挡或者信号不好而造成的数据链丢失,此时机载测控终端无法接收到地面站的上行遥控指令,则可以确定该更新故障不属于系统内在的故障,因此,当数据链通讯恢复时,更新故障也应该被恢复。换言之,当测控系统发生“测控指令校验故障”时,则表明机载测控终端和飞控计算机之间的总线通讯发生了故障,因此,当数据链通信恢复时,该更新故障也不能被恢复,则该更新故障属于不可恢复故障。
如图2所示,该故障恢复方法主要包括以下步骤:
步骤201,飞控计算机在连续若干个周期内确定未采集到A通道和B通道的地址指令;
步骤202,飞控计算机确认A通道发生测控指令更新故障,当前A通道的瞬态更新故障计数的数值等于或者设定的一个阈值,相应地,A通道内的更新故障标志置出故障信息的标志。
步骤203,飞控计算机确认B通道发生测控指令更新故障,当前B通道的瞬态更新故障计数的数值等于或者设定的一个阈值,相应地,B通道内的更新故障标志置出故障信息的标志。
步骤204,飞控计算机对通过A通道接收到的地址指令进行解析,并根据A通道自身的计算方式对解析后的地址指令进行计算,得到与A通道对应的A校验码,进一步地,将通过A通道发送的第二校验码进行匹配,若A校验码和第二校验码一致,则确认校验码匹配成功,即飞控计算机在当前周期内从A通道采集到正常更新信息和校验码匹配成功信息,因此,可以确认A通道未发生校验故障,即A通道发生的更新故障为可恢复故障,可以执行步骤205;若A校验码和第二校验码不一致,则确认校验码匹配不成功,进一步地,A通道内的用于确认校验故障的瞬态故障计数开始计数,若在下一个周期内采集到的地址指令进行校验码匹配成功,则该瞬态故障计数的数值清零,若在连续多个周期内采集到的地址指令进行校验码匹配均不成功,则瞬态故障计数的数值一致在增加,若瞬态故障计数的数值达到一个设置阈值时,则确认A通道发生校验故障,且A通道内的校验故障标志置出故障信息,可以执行步骤208。
需要说明的是,在上述步骤204中,若A通道内的校验故障标志已经置出故障,可以说明A通道已经发生校验故障,则说明在之前已经的监控过程中已经确认A通道发生了校验故障,则可以直接执行步骤208,即飞控计算机可以需要进行校验码匹配,就可以确定A通道已经发生可校验故障。
步骤205,飞控计算机对通过B通道接收到的地址指令进行解析,并根据A通道自身的计算方式对解析后的地址指令进行计算,得到与B通道对应的B校验码,进一步地,将通过B通道发送的第二校验码进行匹配,若B校验码和第二校验码一致,则确认校验码匹配成功,即飞控计算机在当前周期内从B通道采集到正常更新信息和校验码匹配成功信息,因此,可以确认B通道未发生校验故障,即B通道发生的更新故障为可恢复故障,可以执行步骤207;若B校验码和第二校验码不一致,则确认校验码匹配不成功,进一步地,B通道内的用于确认校验故障的瞬态故障计数开始计数,若在下一个周期内采集到的地址指令进行校验码匹配成功,则该瞬态故障计数的数值清零,若在连续多个周期内采集到的地址指令进行校验码匹配均不成功,则瞬态故障计数的数值一致在增加,若瞬态故障计数的数值达到一个设置阈值时,则确认B通道发生校验故障,且B通道内的校验故障标志置出故障信息,可以执行步骤206。
需要说明的是,在上述步骤205中,若B通道内的校验故障标志已经置出故障,可以说明B通道已经发生校验故障,则说明在之前已经的监控过程中已经确认B通道发生了校验故障,则可以直接执行步骤206,即飞控计算机可以需要进行校验码匹配,就可以确定B通道已经发生可校验故障。
步骤206,确定A通道的测控指令更新故障属于可恢复故障。
步骤207,确定A通道和B通道的测控指令更新故障均属于可恢复故障;
步骤208,飞控计算机对通过B通道接收到的地址指令进行解析,并根据A通道自身的计算方式对解析后的地址指令进行计算,得到与B通道对应的B校验码,进一步地,将通过B通道发送的第二校验码进行匹配,若B校验码和第二校验码一致,则确认校验码匹配成功,即飞控计算机在当前周期内从B通道采集到正常更新信息和校验码匹配成功信息,因此,可以确认B通道未发生校验故障,即B通道发生的更新故障为可恢复故障,可以执行步骤209;若B校验码和第二校验码不一致,则确认校验码匹配不成功,进一步地,B通道内的用于确认校验故障的瞬态故障计数开始计数,若在下一个周期内采集到的地址指令进行校验码匹配成功,则该瞬态故障计数的数值清零,若在连续多个周期内采集到的地址指令进行校验码匹配均不成功,则瞬态故障计数的数值一致在增加,若瞬态故障计数的数值达到一个设置阈值时,则确认B通道发生校验故障,且B通道内的校验故障标志置出故障信息,可以执行步骤210。
步骤209,确定B通道的测控指令更新故障属于可恢复故障;
步骤210,确定A通道和B通道的测控指令更新故障均属于无可恢复故障;
步骤211,飞控计算机对在当前周期内发生更新故障的A通道和B通道数据恢复完成。
需要说明的是,在步骤206,步骤207和步骤209中,当确认通道的更新故障为可恢复故障之后,当通道满足更新故障恢复条件之后,可以将通道的故障状态恢复为正常,比如,当恢复条件为连续300ms重新收到正常信号,而上述A通道和B通道均满足连续300ms重新收到正常信号时,则可以将A通道和B通道的更新故障恢复为正常。进一步地,若A通道和B通道确认为更新故障时,在A通道和B通道内的更新故障标志的标志为故障,且瞬态更新故障计数的数值也不是零,则在A通道和B通道恢复为正常之后,A通道和B通道内的更新故障标志的标志为正常,且瞬态更新故障计数的数值清零。
基于同一发明构思,本发明实施例提供了一种故障恢复装置,由于该装置解决技术问题的原理与一种故障恢复方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
图3为本发明实施例提供的一种故障恢复装置结构示意图,如图3所示,该装置主要包括有第一确定单元301和第二确定单元302。
第一确定单元301,用于若连续第一设定值个周期内未采集到至少两个第一通道的地址指令时,确定与所述地址指令对应的两个所述通道发生更新故障;
第二确定单元302,用于若在当前周期内采集到至少一个所述第二通道的正常更新以及校验码匹配成功信息,将所述第二通道发生的所述更新故障确定为可恢复故障;其中,所述第二通道为两个所述第一通道中的任意一个。
优选地,所述第二确定单元302具体用于:
对通过所述第二通道接收到的第一指令进行解析,并根据所述第二通道的计算方式得到与所述第二通道对应的第一校验码;
将所述第一校验码与通过所述第二通道发送的第二校验码进行匹配,若第一校验码与所述第二校验码一致,确认校验码匹配成功,确认所述第二通道未发生校验故障。
优选地,所述第二确定单元302还用于:
若所述第一校验与所述第二校验码不一致,则确认校验码匹配不成功;
所述第二通道内的校验瞬态故障计数开始计数,当所述第二通道在连续第一设定值个周期内均发生所述校验码匹配不成功,且所述校验瞬态故障计数的数值等于所述第一设定值时,确认所述第二通道发生校验故障,所述第二通道内的校验故障标志置出故障信息;
其中,所述校验故障标志表示所述第二通道发送的所述更新故障为不可恢复故障,所述第二通道内携带有所述校验瞬态故障计数和所述校验故障标志所述校验故障标志包括故障信息和正常信息。
所述第二确定单元302还用于:
所述第一通道携带的瞬态更新故障计数的数值等于所述第一设定值,所述第一通道内的更新故障标志置出故障信息。
优选地,所述第二确定单元302还用于:
对所述第二通道进行故障恢复,将所述第二通道内的更新故障标志置出正常信息,将所述第二通道内的瞬态更新故障计数的数值清零。
应当理解,以上一种故障恢复装置包括的单元仅为根据该设备装置实现的功能进行的逻辑划分,实际应用中,可以进行上述单元的叠加或拆分。并且该实施例提供的一种故障恢复装置所实现的功能与上述实施例提供的一种故障恢复方法一一对应,对于该装置所实现的更为详细的处理流程,在上述方法实施例一中已做详细描述,此处不再详细描述。
本发明实施例还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述飞控系统的总线故障恢复方法的步骤。
计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。
本发明实施例还提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现上述飞控系统的总线故障恢复方法的步骤。
图4为本发明实施例提供的电子设备结构示意图,如图4所示,该电子设备400包括处理器401、存储器402和收发器403;其中,处理器401、存储器402和收发器403通过总线404相互连接。
存储器402用于存储程序;具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器402可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,简称RAM);存储器也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory),硬盘(hard disk drive,简称HDD)或固态硬盘(solid-state drive,简称SSD);存储器402还可以包括上述种类的存储器的组合。
存储器402存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
总线404可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
处理器401可以是中央处理器(central processing unit,简称CPU),网络处理器(network processor,简称NP)或者CPU和NP的组合。还可以是硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,简称ASIC),可编程逻辑器件(programmable logic device,简称PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,简称CPLD),现场可编程逻辑门阵列(fieldprogrammable gate array,简称FPGA),通用阵列逻辑(generic array logic,简称GAL)或其任意组合。
所述处理器401,用于执行所述存储器102中的所述计算机程序,以实现一种故障恢复方法所包括的步骤。
综上所述,本发明实施例提供了一种故障恢复方法及装置,在该方法中,将至少两个通道发生更新故障和第一地址指令与校验码匹配成功确定为可恢复故障的条件;第一个条件体现了各个通道之间的故障进行恢复时的条件是彼此独立的,该条件能够具有针对性的对某一类故障进行恢复,避免引入其他故障;第二个条件表明当机载测控终端与飞控计算机之间的总线通行未发生故障时,即当前通道发生的更新故障并不属于系统内的故障,因此可以将该通道的故障确定为可恢复故障,避免了在进行故障恢复时,将系统故障所导致的通道更新故障恢复为正常通道。本发明实施例提供的总线故障恢复方法,解决了现有技术中系统总线故障进行恢复时,因各个通道未建立隔离而导致恢复操作时易将已经发生故障的通道恢复为正常通道。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种故障恢复方法,其特征在于,包括:
若连续第一设定值个周期内未采集到至少两个第一通道的地址指令时,确定与所述地址指令对应的两个所述第一 通道发生更新故障;
若在当前周期内采集到至少一个所述第二通道的正常更新以及校验码匹配成功信息,将所述第二通道发生的所述更新故障确定为可恢复故障;其中,所述第二通道为两个所述第一通道中的任意一个;
所述校验码匹配包括:
对通过所述第二通道接收到的第一指令进行解析,并根据所述第二通道的计算方式得到与所述第二通道对应的第一校验码;
将所述第一校验码与通过所述第二通道发送的第二校验码进行匹配,若第一校验码与所述第二校验码一致,确认校验码匹配成功,确认所述第二通道未发生校验故障;
若所述第一校验与所述第二校验码不一致,则确认校验码匹配不成功;
所述第二通道内的校验瞬态故障计数开始计数,当所述第二通道在连续第一设定值个周期内均发生所述校验码匹配不成功,且所述校验瞬态故障计数的数值等于所述第一设定值时,确认所述第二通道发生校验故障,所述第二通道内的校验故障标志置出故障信息;
其中,所述校验故障标志表示所述第二通道发送的所述更新故障为不可恢复故障,所述第二通道内携带有所述校验瞬态故障计数和所述校验故障标志,所述校验故障标志包括故障信息和正常信息。
2.如权利要求1所述的方法,其特征在于,所述确定与所述地址指令对应的两个所述通道发生更新故障时,还包括:
所述第一通道携带的瞬态更新故障计数的数值等于所述第一设定值,所述第一通道内的更新故障标志置出故障信息。
3.如权利要求1所述的方法,其特征在于,所述将所述第二通道发生的所述更新故障确定为可恢复故障之后,还包括:
对所述第二通道进行故障恢复,将所述第二通道内的更新故障标志置出正常信息,将所述第二通道内的瞬态更新故障计数的数值清零。
4.一种故障恢复装置,其特征在于,包括:
第一确定单元,用于若连续第一设定值个周期内未采集到至少两个第一通道的地址指令时,确定与所述地址指令对应的两个所述第一 通道发生更新故障;
第二确定单元,用于若在当前周期内采集到至少一个所述第二通道的正常更新以及校验码匹配成功信息,将所述第二通道发生的所述更新故障确定为可恢复故障;其中,所述第二通道为两个所述第一通道中的任意一个;
所述第二确定单元具体用于:
对通过所述第二通道接收到的第一指令进行解析,并根据所述第二通道的计算方式得到与所述第二通道对应的第一校验码;
将所述第一校验码与通过所述第二通道发送的第二校验码进行匹配,若第一校验码与所述第二校验码一致,确认校验码匹配成功,确认所述第二通道未发生校验故障;
所述第二确定单元还用于:
若所述第一校验与所述第二校验码不一致,则确认校验码匹配不成功;
所述第二通道内的校验瞬态故障计数开始计数,当所述第二通道在连续第一设定值个周期内均发生所述校验码匹配不成功,且所述校验瞬态故障计数的数值等于所述第一设定值时,确认所述第二通道发生校验故障,所述第二通道内的校验故障标志置出故障信息;
其中,所述校验故障标志表示所述第二通道发送的所述更新故障为不可恢复故障,所述第二通道内携带有所述校验瞬态故障计数和所述校验故障标志, 所述校验故障标志包括故障信息和正常信息。
5.如权利要求4所述的装置,其特征在于,所述第二确定单元还用于:
所述第一通道携带的瞬态更新故障计数的数值等于所述第一设定值,所述第一通道内的更新故障标志置出故障信息。
6.如权利要求4所述的装置,其特征在于,所述第二确定单元还用于:
对所述第二通道进行故障恢复,将所述第二通道内的更新故障标志置出正常信息,将所述第二通道内的瞬态更新故障计数的数值清零。
CN201911387464.1A 2019-12-27 2019-12-27 一种故障恢复方法及装置 Active CN111221673B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911387464.1A CN111221673B (zh) 2019-12-27 2019-12-27 一种故障恢复方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911387464.1A CN111221673B (zh) 2019-12-27 2019-12-27 一种故障恢复方法及装置

Publications (2)

Publication Number Publication Date
CN111221673A CN111221673A (zh) 2020-06-02
CN111221673B true CN111221673B (zh) 2021-12-14

Family

ID=70832177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911387464.1A Active CN111221673B (zh) 2019-12-27 2019-12-27 一种故障恢复方法及装置

Country Status (1)

Country Link
CN (1) CN111221673B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02135535A (ja) * 1988-11-16 1990-05-24 Nec Corp 情報処理システム
CN1175143A (zh) * 1996-08-22 1998-03-04 波音公司 多通道系统中获得高度综合和可用性的方法与装置
CN101631057A (zh) * 2009-08-17 2010-01-20 北京航空航天大学 一种双余度can总线的网络控制方法
CN204463106U (zh) * 2015-04-03 2015-07-08 张家祺 Um-bus总线通道故障检测控制器
CN105467973A (zh) * 2015-12-23 2016-04-06 北京卫星制造厂 一种下位机故障监测及处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140036621A (ko) * 2012-09-17 2014-03-26 한국전자통신연구원 레인 장애 복구 장치 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02135535A (ja) * 1988-11-16 1990-05-24 Nec Corp 情報処理システム
CN1175143A (zh) * 1996-08-22 1998-03-04 波音公司 多通道系统中获得高度综合和可用性的方法与装置
CN101631057A (zh) * 2009-08-17 2010-01-20 北京航空航天大学 一种双余度can总线的网络控制方法
CN204463106U (zh) * 2015-04-03 2015-07-08 张家祺 Um-bus总线通道故障检测控制器
CN105467973A (zh) * 2015-12-23 2016-04-06 北京卫星制造厂 一种下位机故障监测及处理方法

Also Published As

Publication number Publication date
CN111221673A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
US8862944B2 (en) Isolation of faulty links in a transmission medium
CN109800104A (zh) 数据存储的检测方法、装置、存储介质及电子装置
CN111209343B (zh) 节点数据同步方法、装置、设备以及存储介质
CN109254956B (zh) 一种数据下载的方法、装置及电子设备
CN106372026B (zh) 一种链路检测方法和接收设备
CN111221673B (zh) 一种故障恢复方法及装置
CN108512675B (zh) 一种网络诊断的方法、装置、控制节点和网络节点
CN111010706B (zh) 一种异常恢复方法及装置
CN116015425A (zh) 光模块的控制方法和装置、存储介质及电子装置
CN111371582B (zh) 一种pcie链路故障的处理方法及装置
CN105791514B (zh) 一种应用启动监测方法及装置
CN108664361B (zh) Pcie非透明通道修复方法及装置
CN108008800B (zh) 一种复位请求处理方法、装置和设备
CN107273291B (zh) 一种处理器调试方法及系统
CN114170705A (zh) 车辆数据上传方法、装置和设备
CN105511848A (zh) 一种动态链接库的检测方法和装置
CN114915441A (zh) 包括数据完整性监测的网络
CN108683163A (zh) 线路保护装置校验方法及校验装置
CN115599310B (zh) 存储节点中存储资源的控制方法、装置以及存储节点
CN111506330A (zh) 一种程序更新方法、装置、星务计算机及存储介质
CN112148514B (zh) 看门狗复位的方法、装置、存储介质和电子设备
CN111176700B (zh) 智能卡cos后下载更新方法及系统
CN111106981B (zh) 一种pcie通道的检修方法及装置
CN114978891B (zh) 网络设备bios配置的处理方法、设备及存储介质
CN112100000B (zh) 基于安全苛求系统的数据恢复方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant