CN104679610A - 计算机系统的管理方法和装置 - Google Patents

计算机系统的管理方法和装置 Download PDF

Info

Publication number
CN104679610A
CN104679610A CN201510076488.0A CN201510076488A CN104679610A CN 104679610 A CN104679610 A CN 104679610A CN 201510076488 A CN201510076488 A CN 201510076488A CN 104679610 A CN104679610 A CN 104679610A
Authority
CN
China
Prior art keywords
computer unit
predetermined instruction
switching command
reset signal
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510076488.0A
Other languages
English (en)
Other versions
CN104679610B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Dongguan Institute Of Science And Technology Innovation
Original Assignee
Dongguan Frontier Technology Institute
Shenzhen Kuang Chi Space Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Frontier Technology Institute, Shenzhen Kuang Chi Space Technology Co Ltd filed Critical Dongguan Frontier Technology Institute
Priority to CN201510076488.0A priority Critical patent/CN104679610B/zh
Publication of CN104679610A publication Critical patent/CN104679610A/zh
Application granted granted Critical
Publication of CN104679610B publication Critical patent/CN104679610B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种计算机系统的管理方法和装置,其中,计算机系统包括处于工作状态的当前计算机单元和处于非工作状态的至少一个备份计算机单元,该方法包括:接收表示计算机单元处于正常工作状态的第一预定指令;在未接收到第一预定指令的情况下发送复位信号和切换指令;根据复位信号对当前计算机单元进行复位;根据切换指令将备份计算机单元切换为当前计算机单元。本发明通过对当前计算机单元的工作状态进行实时监测,并在当前计算机单元运行异常时发送复位信号以及切换指令,来实现计算机单元之间的热切换,从而避免了系统冷切换所导致的信号中断问题,实现了系统与外设通信的高可靠性设计。

Description

计算机系统的管理方法和装置
技术领域
本发明涉及计算机领域,具体来说,涉及一种计算机系统的管理方法和装置。
背景技术
在目前的带备份系统的计算机系统中主要采用的是冷备份设计,即,当主系统出现故障需要使用备份系统进行切换时,首先需要对主系统进行复位,并在主系统复位完成后,才可实现主系统与备份系统之间的切换,那么在主系统复位的一段时间内其必然会引起短暂通信过程的信号中断,对系统的实时性产生一定的影响。
针对相关技术中在对系统进行切换时所导致的信号中断的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中在对系统进行切换时所导致的信号中断的问题,本发明提出一种计算机系统的管理方法和装置,能够实现计算机单元之间的热切换,并避免系统冷切换所导致的信号中断问题,实现系统与外设通信的高可靠性设计。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种计算机系统的管理方法,其中,计算机系统包括处于工作状态的当前计算机单元和处于非工作状态的至少一个备份计算机单元。
该管理方法包括:
接收表示计算机单元处于正常工作状态的第一预定指令;
在未接收到第一预定指令的情况下发送复位信号和切换指令;
根据复位信号对当前计算机单元进行复位;
根据切换指令将备份计算机单元切换为当前计算机单元。
其中,优选的,在接收第一预定指令时可在预定的时间内接收表示计算机单元处于正常工作状态的第一预定指令;
而在发送复位信号和切换指令时,则可在超过预定的时间、且未接收到第一预定指令的情况下来发送复位信号和切换指令。
可选的,该管理方法进一步包括:
接收表示计算机单元运行状况的第二预定指令;
在接收到第二预定指令、且未接收到第一预定指令的情况下,可根据第二预定指令发送复位信号和切换指令。
其中,在根据切换指令将备份计算机单元切换为当前计算机单元时,可根据预定的规则从多个备份计算机单元中选择一个计算机单元作为目标计算机单元;并将目标计算机单元切换为当前计算机单元。
此外,当前计算机单元和多个备份计算机单元接收相同的外部数据。
根据本发明的另一方面,提供了一种计算机系统的管理装置,其中,计算机系统包括处于工作状态的当前计算机单元和处于非工作状态的至少一个备份计算机单元。
该管理装置包括:
第一接收模块,用于接收表示计算机单元处于正常工作状态的第一预定指令;
发送模块,用于在未接收到第一预定指令的情况下发送复位信号和切换指令;
复位模块,用于根据复位信号对当前计算机单元进行复位;
切换模块,用于根据切换指令将备份计算机单元切换为当前计算机单元。
其中,优选的,第一接收模块进一步用于在预定的时间内接收表示计算机单元处于正常工作状态的第一预定指令;
发送模块则进一步用于在超过预定的时间、且未接收到第一预定指令的情况下发送复位信号和切换指令。
可选的,该管理装置进一步包括:
第二接收模块,用于接收表示计算机单元运行状况的第二预定指令;
发送模块,进一步用于在接收到第二预定指令、且未接收到第一预定指令的情况下,根据第二预定指令发送复位信号和切换指令。
此外,该切换模块包括:
选择模块,用于根据预定的规则从多个备份计算机单元中选择一个计算机单元作为目标计算机单元;
切换子模块,用于将目标计算机单元切换为当前计算机单元。
另外,计算机系统的当前计算机单元和多个备份计算机单元接收相同的外部数据。
本发明通过对当前计算机单元的工作状态进行实时监测,并在当前计算机单元运行异常时发送复位信号以及切换指令,来实现计算机单元之间的热切换,从而避免了系统冷切换所导致的信号中断问题,实现了系统与外设通信的高可靠性设计。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的计算机系统的管理方法的流程图;
图2是根据本发明一具体实施例的计算机系统的管理方法的流程图;
图3是根据本发明实施例的计算机系统的管理装置的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种计算机系统的管理方法,其中,计算机系统包括处于工作状态的当前计算机单元和处于非工作状态的多个备份计算机单元。
如图1所示,根据本发明实施例的管理方法包括:
步骤S101,接收表示计算机单元处于正常工作状态的第一预定指令;
步骤S103,在未接收到第一预定指令的情况下发送复位信号和切换指令;
步骤S105,根据复位信号对当前计算机单元进行复位;
步骤S107,根据切换指令将备份计算机单元切换为当前计算机单元。
通过本发明的上述方案,能够通过对当前计算机单元的工作状态进行实时监测,并在当前计算机单元运行异常时发送复位信号以及切换指令,来实现计算机单元之间的热切换,从而避免了系统冷切换所导致的信号中断问题,实现了系统与外设通信的高可靠性设计。
为了更好的理解本发明的上述技术方案,下面结合图2来对本发明的上述技术方案进行详细阐述。
在本实施例的计算机系统(这里为带双控计算机的通信冗余备份系统)中包括主控制单元(即计算机单元)、备份控制单元(即计算机单元)、逻辑控制单元(其中,这里的逻辑控制单元为复杂可编程逻辑器件(CPLD))、模拟通道切换控制器、卫星通信设备以及视距图像传输子系统、RS422总线接口、以太网接口等部件组成。
其中,从图2中可以看出,模拟通道切换控制器可通过RS422总线接口与卫星通信设备连接进行通信,并且模拟通道切换控制器还可通过以太网接口与视距图像传输子系统连接进行通信。
此外,从图2中还可以看出主控制单元和备份控制单元是两个完全相同的计算机单元,即运行的是完全相同的操作系统,这里为一种实时操作系统:vxWorks程序,使用相同的电源供电模块、相同的处理器、相同的FLASH和同步动态随机存储器(SDRAM)以及数据、地址总线等,其中,电源供电模块与处理器相连为其进行供电,而处理器则与FLASH和SDRAM相连。并且,当其中一个计算机单元处于工作状态时,二者接收相同的外部数据输入,从而保证了主控制单元和备控制单元的完全相同,在任何情况下,当任意一个控制单元出现故障时均可由另一个控制单元进行实时的替换,从而保证系统的正常运行,值得注意的是,这里虽然对两个计算机单元进行了主、备方式的命名,但是二者之间是平等的关系,并不存在主从控制。
此外,为了方便读者理解本发明的技术方案,在本例中只是示意性的以两个计算机单元为例,即一个处于工作状态的主控制单元和一个处于非工作状态的备份控制单元,但是在实际应用中,本发明对于备份控制单元的数量并不作限定,其可以根据实际需要进行不同数量的设定,从而使得当一个备份控制单元出现故障时,还可利用其它的备份控制单元来实现计算机单元的可靠性切换。
同样的,如果存在一个以上的多个备份控制单元时,那么多个备份控制单元和主控制单元必然是使用相同的操作系统,接收完全相同的数据的相同的计算机单元,以此来保证即便切换系统的计算机单元,系统仍然能够正常运行,不存在兼容性的问题。
那么在本实施例中,当系统上电后默认情况下由主控制单元接管系统的控制工作,具体的,模拟通道切换控制器会负责将总线通道(即通信总线)连接至主计算机,即主控制单元,那么当系统运行过程中,不论支持系统运行的计算机单元为哪一个计算机单元,为了保证CPLD知晓此时运行的计算机单元是否运行正常,在系统运行过程中,当前的计算机单元(这里为主控制单元)会定期,即每隔一定的时间(即在预定的时间内)向CPLD发送硬件看门狗喂狗信号(喂狗指令),即表示计算机单元处于正常工作状态的第一预定指令,使得CPLD每隔一定的时间(即在预定的时间内)均可接收到来自主控制单元的喂狗信号,实现对当前计算机单元的运行监测。
那么当主控制单元工作异常时,其必然无法向CPLD发送喂狗信号,那么在超过预定的时间后,如果CPLD还没有接收到来自主控制单元的喂狗信号,则可确定主控制单元处于工作异常状态,那么CPLD就会发送复位信号至主控制单元单元(或者复位电路)、以及发送切换指令(即通信切换指令)至模拟通道切换控制器,那么当前出现异常的计算机单元(主控制单元)即可根据接收到的复位信号来进行复位,同时,模拟通道切换控制器就会根据接收到的切换指令来将备份控制单元切换为当前控制单元(即当前计算机单元)。具体的,模拟通道切换控制器会断开总线通道(系统通信总线链路)与主控制单元之间的连接,而使总线通道(系统通信总线链路)连接至备份控制单元,从而使得备份控制单元接管当前系统的控制工作,实现了对异常的主控制单元的快速切换,而不必等待主控制单元复位完成后再使系统重新开始工作,能够避免在主控制单元复位期间所导致的系统通信短暂过程的信号中断,对系统造成影响。
而且,因为主控制单元和备份控制单元为完全相同的两个计算机单元,且在主控制单元进行工作时,备份控制单元接收的是与主控制单元完全相同的外部数据,因此,可保证在计算机单元完成热切换后对数据的处理不造成影响(即采用同样的数据处理方式),而且处理的数据也是完全相同的,从而保证了计算机单元的无缝切换。
而在上述实施例中,CPLD在对是否发送复位信号、切换指令的判断上是以喂狗信号的接收情况来判定的,而在一个优选的实施例中,也可能存在一种虽然主控制单元的工作情况出现了异常,从而导致喂狗信号未发出,但是该异常是可修复的或者说其对计算机单元的正常业务处理不会产生较大的影响,那么CPLD就可基于表示计算机单元运行状况的第二预定指令来对是否发出复位信号、切换指令进行判断,具体的:
在系统运行过程中,当前计算机单元(主控制单元)不仅仅会发送喂狗信号至CPLD,其还会通过IO信号引脚(即第二预定指令)来将主控制单元的运行状况实时的发送给CPLD,例如每个引脚的状态对应一种应用程序的运行状况,那么CPLD就可通过读取每个IO信号引脚的状态来判断主控制单元的每个应用程序的运行状况,如果CPLD在预定的时间内没有接收到喂狗信号,就可根据接收到的IO信号引脚的状态(即,第二预定指令)来判断是哪个程序运行异常所导致的喂狗信号未发出,如果判断导致主机算机异常的程序为非关键程序,那么此时CPLD则无需发送复位信号至主控制单元(或者复位电路)、也无需发送切换指令至模拟通道切换控制器;另一方面,如果CPLD通过对IO信号引脚的状态进行判断发现导致主控制单元异常的程序为系统运行的关键程序,那么,此时CPLD就可发送复位信号至主控制单元、同时发送切换指令至模拟通道切换控制器来进行主控制单元和备份计算机之间的切换。
在本实施例中,通过使CPLD在接收表示计算机单元处于正常工作状态的喂狗信号的同时,还可实时的接收并读取IO信号引脚的状态来判断当前计算机单元的哪个部分处于工作异常状态,因为,只要系统异常,当前计算机单元就不会发送喂狗信号至CPLD,那么在加入了IO信号引脚的状态的读取,就可避免不必要的系统复位和系统切换,使对计算机系统的计算机单元的管理上更加细化,并保证了系统工作的高效性,而且在系统的复位和切换上也更加灵活,从而适应了系统不同的运行异常场景,并能够针对不同的异常场景进行不同的处理。
此外,在一个实施例中,在系统工作时,模拟通道切换控制器还会实时获取主控制单元和备份控制单元(即本系统中的所有计算机单元)的工作状态信息,并将工作状态信息反馈给CPLD,CPLD就可结合该工作状态信息来判断是否进行计算机单元的切换,即发送复位信号至当前计算机单元、发送通信切换指令至模拟通道切换控制器。
值得注意的是,虽然在本实施例中是将喂狗信号作为表示计算机单元处于正常工作状态的第一预定指令的,但是在实际应用中,其也可以是其他的可表示计算机单元处于正常工作状态的指令,本发明对于第一预定指令的种类、形式并不作限定,其只要是可作为识别计算机单元处于正常工作状态的标识即可。
同样的,虽然在本实施例中是将IO信号引脚的状态作为表示计算机单元运行状况的第二预定指令的,但是在实际应用中,其也可以是其他形式的可表示计算机单元运行状况的指令,也就是说,本发明对于第二预定指令的种类、形式并不作限定,其只要是可表示计算机单元运行状况即可。
此外,在另一个实施例中,当计算机系统中存在两个以上的计算机单元时,即一个以上的备份计算机单元时,那么在进行计算机单元的切换时,就存在一个CPLD从多个备份计算机单元中进行选择的问题,而至于在对多个计算机单元进行选择时所用的选择规则可以是由CPLD指定的,那么在这种情况下,通道切换控制器在接收到切换信号时,就已经指定了目标计算机单元,那么通道切换控制器就会从多个备份计算机单元中选择一个计算机单元作为目标计算机单元,然后,通道切换控制器就会断开总线通道与当前计算机单元的连接,使总线通道与目标计算机单元相连接。
其中,当从多个计算机单元中选择目标计算机单元的选择规则由CPLD指定时,那么CPLD就可根据通道切换控制器所反馈的各个计算机单元的工作状态信息来确定相应的选择规则,即根据该工作状态信息来确定由哪个计算机单元作为目标计算机单元,从而实现目标计算机单元对当前计算机单元的实时切换。
当然该选择规则还可以是由模拟通道切换控制器指定的,那么在这种情况下,当模拟通道切换控制器在接收到CPLD的切换信号时,模拟通道切换控制器就会根据预定的选择规则,从多个备份计算机单元中选择一个计算机单元作为目标计算机单元。
那么在确定了目标计算机单元后,在一个实施例中,模拟通道切换控制器则会断开总线通道与当前计算机单元的连接,使总线通道与目标计算机单元相连接,从而实现计算机单元之间的灵活切换。
通过本发明上述实施例的双冗余计算机控制系统的热备份设计,能够利用逻辑故障处理模块(即,CPLD)实现主及备份控制单元的热切换,实现系统与外设通信的高可靠性设计,有效的解决了控制单元(即计算机单元)冷切换所导致的信号中断问题。
而在实际应用中,本发明的上述技术方案则可应用于航天飞行器与地面设备的通信,能为该通信链路提供高可靠性的、无间断的实时通讯保障,在航天飞行器主控制器出现异常时,能无缝切换到备用系统,实时恢复系统通信到正常状态。
根据本发明的实施例,还提供了一种计算机系统的管理装置,其中,计算机系统包括处于工作状态的当前计算机单元和处于非工作状态的多个备份计算机单元。
如图3所示,根据本发明实施例的管理装置包括:
第一接收模块31,用于接收表示计算机单元处于正常工作状态的第一预定指令;
发送模块32,用于在未接收到第一预定指令的情况下发送复位信号和切换指令;
复位模块33,用于根据复位信号对当前计算机单元进行复位;
切换模块34,用于根据切换指令将备份计算机单元切换为当前计算机单元。
为了更好的理解本发明的计算机系统的管理装置,下面同样结合图2来对图3所示的管理装置进行详细阐述。
在本实施例的计算机系统(这里为带双控计算机的通信冗余备份系统)中包括主控制单元(即计算机单元)、备份控制单元(即计算机单元)、逻辑控制单元(其中,这里的逻辑控制单元为复杂可编程逻辑器件(CPLD))、模拟通道切换控制器、卫星通信设备以及视距图像传输子系统、RS422总线接口、以太网接口等部件组成。
其中,CPLD包括第一接收模块31和发送模块32;模拟通道切换控制器包括切换模块34;复位模块33则是设置在计算机单元中的复位电路。
其中,从图2中可以看出,模拟通道切换控制器可通过RS422总线接口与卫星通信设备连接进行通信,并且模拟通道切换控制器还可通过以太网接口与视距图像传输子系统连接进行通信。
此外,从图2中还可以看出主控制单元和备份控制单元是两个完全相同的计算机单元,即运行的是完全相同的操作系统,这里为一种实时操作系统:vxWorks程序,使用相同的电源供电模块、相同的处理器、相同的FLASH和同步动态随机存储器(SDRAM)以及数据、地址总线等,其中,电源供电模块与处理器相连为其进行供电,而处理器则与FLASH和SDRAM相连。并且,当其中一个计算机单元处于工作状态时,二者接收相同的外部数据输入,从而保证了主控制单元和备控制单元的完全相同,在任何情况下,当任意一个控制单元出现故障时均可由另一个控制单元进行实时的替换,从而保证系统的正常运行,值得注意的是,这里虽然对两个计算机单元进行了主、备方式的命名,但是二者之间是平等的关系,并不存在主从控制。
此外,为了方便读者理解本发明的技术方案,在本例中只是示意性的以两个计算机单元为例,即一个处于工作状态的主控制单元和一个处于非工作状态的备份控制单元,但是在实际应用中,本发明对于备份控制单元的数量并不作限定,其可以根据实际需要进行不同数量的设定,从而使得当一个备份控制单元出现故障时,还可利用其它的备份控制单元来实现计算机单元的可靠性切换。
同样的,如果存在一个以上的多个备份控制单元时,那么多个备份控制单元和主控制单元必然是使用相同的操作系统,接收完全相同的数据的相同的计算机单元,以此来保证即便切换系统的计算机单元,系统仍然能够正常运行,不存在兼容性的问题。
那么具体到管理装置的各个模块的工作情况,具体如图2所示,当系统上电后默认情况下由主控制单元接管系统的控制工作,具体的,模拟通道切换控制器会负责将总线通道(即通信总线)连接至主计算机,即主控制单元,那么在系统运行过程中,不论支持系统运行的计算机单元为哪一个计算机单元,为了保证CPLD知晓此时运行的计算机单元是否运行正常,在系统运行过程中,当前的计算机单元(这里为主控制单元)会定期,即每隔一定的时间(即在预定的时间内)向CPLD中的第一接收模块31发送硬件看门狗喂狗信号(喂狗指令),即表示计算机单元处于正常工作状态的第一预定指令,使得CPLD中的第一接收模块31每隔一定的时间(即在预定的时间内)均可接收到来自主控制单元的喂狗信号,实现对当前计算机单元的运行监测。
那么当主控制单元工作异常时,主控制单元必然无法向CPLD发送喂狗信号,那么在超过预定的时间后,如果CPLD中的第一接收模块31还没有接收到来自主控制单元的喂狗信号,则可确定主控制单元处于工作异常状态,那么CPLD中的发送模块32就会发送复位信号至主控制单元单元的复位电路,即复位模块33、以及发送切换指令(即通信切换指令)至模拟通道切换控制器中的切换模块34,那么主控制单元的复位电路就可根据接收到的复位信号来进行主控制单元的复位,同时,模拟通道切换控制器中的切换模块34就会根据接收到的切换指令通过通信总线来将备份控制单元切换为当前控制单元(即当前计算机单元)。具体的,模拟通道切换控制器中的切换模块34会断开总线通道(系统通信总线链路)与主控制单元之间的连接,而使总线通道(系统通信总线链路)连接至备份控制单元,从而使得备份控制单元接管当前系统的控制工作,实现了对异常的主控制单元的快速切换,而不必等待主控制单元复位完成后再使系统重新开始工作,能够避免在主控制单元复位期间所导致的系统通信短暂过程的信号中断,对系统造成影响。
而且,因为主控制单元和备份控制单元为完全相同的两个计算机单元,且在主控制单元进行工作时,备份控制单元接收的是与主控制单元完全相同的外部数据,因此,可保证在计算机单元完成热切换后对数据的处理不造成影响(即采用同样的数据处理方式),而且处理的数据也是完全相同的,从而保证了计算机单元的无缝切换。
而在上述实施例中,CPLD中的发送模块32在对是否发送复位信号、切换指令的判断上是以CPLD中的第一接收模块31是否接收到喂狗信号的情况来判定的,而在一个优选的实施例中,也可能存在一种虽然主控制单元的工作情况出现了异常,从而导致喂狗信号未发出,但是该异常是可修复的或者说其对计算机单元的正常业务处理不会产生较大的影响,那么CPLD中的发送模块32就可基于表示计算机单元运行状况的第二预定指令来对是否发出复位信号、切换指令进行判断,具体的:
在系统运行过程中,当前计算机单元(主控制单元)不仅仅会发送喂狗信号至CPLD,其还会通过IO信号引脚(即第二预定指令)来将主控制单元的运行状况实时的发送给CPLD,例如每个引脚的状态对应一种应用程序的运行状况,因此,根据本发明实施例的管理装置进一步包括第二接收模块(图3未示出),该第二接收模块(图3未示出)同样设置在CPLD中,那么第二接收模块就可通过读取每个IO信号引脚的状态来判断主控制单元的每个应用程序的运行状况,如果CPLD的第二接收模块(图3未示出)在预定的时间内没有接收到喂狗信号,就可根据接收到的IO信号引脚的状态(即,第二预定指令)来判断是哪个程序运行异常所导致的喂狗信号未发出,如果判断导致主机算机异常的程序为非关键程序,那么此时CPLD中的发送模块32则无需发送复位信号至主控制单元的复位电路(即复位模块33)、也无需发送切换指令至模拟通道切换控制器中的切换模块34;另一方面,如果CPLD的第二接收模块通过对IO信号引脚的状态进行判断发现导致主控制单元异常的程序为系统运行的关键程序,那么,此时CPLD中的发送模块32就可发送复位信号至主控制单元的复位电路,即复位模块33,同时发送切换指令(即通信切换指令)至模拟通道切换控制器中的切换模块34来进行主控制单元和备份计算机之间的切换。
在本实施例中,通过使CPLD中的第一接收模块31在接收表示计算机单元处于正常工作状态的喂狗信号的同时,还可由CPLD中的第二接收模块(图3未示出)实时的接收并读取IO信号引脚的状态来判断当前计算机单元的哪个部分处于工作异常状态,因为,只要系统异常,当前计算机单元就不会发送喂狗信号至CPLD,那么在加入了IO信号引脚的状态的读取,就可避免不必要的系统复位和系统切换,使对计算机系统的计算机单元的管理上更加细化,并保证了系统工作的高效性,而且在系统的复位和切换上也更加灵活,从而适应了系统不同的运行异常场景,并能够针对不同的异常场景进行不同的处理。
此外,在一个实施例中,根据本发明实施例的管理装置还可包括获取模块(图3未示出)和判断模块(图3未示出),其中,在本例中,获取模块设置在模拟通道切换控制器中,判断模块设置在CPLD中。在系统工作时,模拟通道切换控制器中的获取模块还会实时获取主控制单元和备份控制单元(即本系统中的所有计算机单元)的工作状态信息,并将工作状态信息反馈给CPLD的判断模块,CPLD的判断模块就可结合该工作状态信息来判断是否进行计算机单元的切换,即,使发送模块32发送复位信号至当前计算机单元、发送通信切换指令至模拟通道切换控制器。
值得注意的是,虽然在本实施例中是将喂狗信号作为表示计算机单元处于正常工作状态的第一预定指令的,但是在实际应用中,其也可以是其他的可表示计算机单元处于正常工作状态的指令,本发明对于第一预定指令的种类、形式并不作限定,其只要是可作为识别计算机单元处于正常工作状态的标识即可。
同样的,虽然在本实施例中是将IO信号引脚的状态作为表示计算机单元运行状况的第二预定指令的,但是在实际应用中,其也可以是其他形式的可表示计算机单元运行状况的指令,也就是说,本发明对于第二预定指令的种类、形式并不作限定,其只要是可表示计算机单元运行状况即可。
此外,在另一个实施例中,当计算机系统中存在两个以上的计算机单元时,即一个以上的备份计算机单元时,那么在进行计算机单元的切换时,就存在一个从多个备份计算机单元中进行选择的问题,而至于在对多个计算机单元进行选择时所用的选择规则可以是由CPLD指定的,也可以是由通道切换控制器指定的。
在本例中,选择规则是由通道切换控制器指定的,并且,在本例中,切换模块24还可包括选择模块(图3未示出)和切换子模块(图3未示出),那么在这种情况下,通道切换控制器的切换模块24在接收到切换信号时,切换模块24中的选择模块就会根据预定的选择规则从多个备份计算机单元中选择一个计算机单元作为目标计算机单元,然后,切换模块24中的切换子模块就会断开总线通道与当前计算机单元的连接,使总线通道与目标计算机单元相连接,即将目标计算机单元切换为当前计算机单元。
当然在另一个实施例中,该选择规则还可以是由CPLD指定的,那么在这种情况下,那么CPLD的判断模块就可根据接收的来自通道切换控制器所反馈的各个计算机单元的工作状态信息来确定相应的选择规则,即判断模块根据该工作状态信息来确定由哪个计算机单元作为目标计算机单元,从而实现目标计算机单元对当前计算机单元的实时切换。
通过本发明上述实施例的双冗余计算机控制系统的热备份设计,能够利用逻辑故障处理模块(即,CPLD)实现主及备份控制单元的热切换,实现系统与外设通信的高可靠性设计,有效的解决了控制单元(即计算机单元)冷切换所导致的信号中断问题。
而在实际应用中,本发明的上述技术方案则可应用于航天飞行器与地面设备的通信,能为该通信链路提供高可靠性的、无间断的实时通讯保障,在航天飞行器主控制器出现异常时,能无缝切换到备用系统,实时恢复系统通信到正常状态。
综上所述,借助于本发明的上述技术方案,通过对当前计算机单元的工作状态进行实时监测,并根据监测结果在发送复位信号的同时也发送切换指令,能够实现主及备份控制单元的热切换,而无需等待主控制单元复位完成再重新开始工作,从而避免因通信中断造成的影响,从而实现了系统与外设通信的高可靠性设计,有效的解决了控制单元冷切换所导致的信号中断问题。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于计算机系统的管理方法,其中,所述计算机系统包括处于工作状态的当前计算机单元和处于非工作状态的至少一个备份计算机单元,其特征在于,包括:
接收表示计算机单元处于正常工作状态的第一预定指令;
在未接收到所述第一预定指令的情况下发送复位信号和切换指令;
根据所述复位信号对当前计算机单元进行复位;
根据所述切换指令将备份计算机单元切换为当前计算机单元。
2.根据权利要求1所述的管理方法,其特征在于,在预定的时间内接收表示计算机单元处于正常工作状态的所述第一预定指令;
在超过所述预定的时间、且未接收到所述第一预定指令的情况下发送所述复位信号和所述切换指令。
3.根据权利要求1所述的管理方法,其特征在于,所述管理方法进一步包括:
接收表示计算机单元运行状况的第二预定指令;
在接收到所述第二预定指令、且未接收到所述第一预定指令的情况下,根据所述第二预定指令发送所述复位信号和切换指令。
4.根据权利要求1所述的管理方法,其特征在于,根据所述切换指令将备份计算机单元切换为当前计算机单元包括:
根据预定的规则从所述多个备份计算机单元中选择一个计算机单元作为目标计算机单元;
将所述目标计算机单元切换为当前计算机单元。
5.根据权利要求1所述的管理方法,其特征在于,所述当前计算机单元和所述多个备份计算机单元接收相同的外部数据。
6.一种用于计算机系统的管理装置,其中,所述计算机系统包括处于工作状态的当前计算机单元和处于非工作状态的至少一个备份计算机单元,其特征在于,包括:
第一接收模块,用于接收表示计算机单元处于正常工作状态的第一预定指令;
发送模块,用于在未接收到所述第一预定指令的情况下发送复位信号和切换指令;
复位模块,用于根据所述复位信号对当前计算机单元进行复位;
切换模块,用于根据所述切换指令将备份计算机单元切换为当前计算机单元。
7.根据权利要求6所述的管理装置,其特征在于,所述第一接收模块,进一步用于在预定的时间内接收表示计算机单元处于正常工作状态的所述第一预定指令;
所述发送模块,进一步用于在超过所述预定的时间、且未接收到所述第一预定指令的情况下发送所述复位信号和所述切换指令。
8.根据权利要求6所述的管理装置,其特征在于,所述管理装置进一步包括:
第二接收模块,用于接收表示计算机单元运行状况的第二预定指令;
所述发送模块,进一步用于在接收到所述第二预定指令、且未接收到所述第一预定指令的情况下,根据所述第二预定指令发送所述复位信号和切换指令。
9.根据权利要求6所述的管理装置,其特征在于,所述切换模块包括:
选择模块,用于根据预定的规则从所述多个备份计算机单元中选择一个计算机单元作为目标计算机单元;
切换子模块,用于将所述目标计算机单元切换为当前计算机单元。
10.根据权利要求6所述的管理装置,其特征在于,所述当前计算机单元和所述多个备份计算机单元接收相同的外部数据。
CN201510076488.0A 2015-02-11 2015-02-11 计算机系统的管理方法和装置 Active CN104679610B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510076488.0A CN104679610B (zh) 2015-02-11 2015-02-11 计算机系统的管理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510076488.0A CN104679610B (zh) 2015-02-11 2015-02-11 计算机系统的管理方法和装置

Publications (2)

Publication Number Publication Date
CN104679610A true CN104679610A (zh) 2015-06-03
CN104679610B CN104679610B (zh) 2020-05-01

Family

ID=53314700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510076488.0A Active CN104679610B (zh) 2015-02-11 2015-02-11 计算机系统的管理方法和装置

Country Status (1)

Country Link
CN (1) CN104679610B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315626A (zh) * 2016-04-27 2017-11-03 比亚迪股份有限公司 车载多媒体及其控制方法
CN107426756A (zh) * 2017-08-23 2017-12-01 京信通信系统(中国)有限公司 热备份通信系统及其通信接口控制模块
CN108227474A (zh) * 2016-12-13 2018-06-29 中核控制系统工程有限公司 安全级dcs平台零延时冗余切换方法
CN110187659A (zh) * 2019-05-28 2019-08-30 成都星时代宇航科技有限公司 状态监控方法、系统及立方星
CN110647426A (zh) * 2018-06-27 2020-01-03 龙芯中科技术有限公司 双机热备份方法、装置、系统与计算机存储介质
CN111737062A (zh) * 2020-06-24 2020-10-02 浙江大华技术股份有限公司 一种备份处理方法、装置及系统
CN113342613A (zh) * 2021-06-25 2021-09-03 深圳市商汤科技有限公司 数据处理装置、方法、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281483A (zh) * 2008-05-12 2008-10-08 北京邮电大学 双机冗余容错系统及其冗余切换方法
CN102141947A (zh) * 2011-03-30 2011-08-03 东方通信股份有限公司 一种对采用嵌入式操作系统的计算机应用系统中异常任务的处理方法及系统
US20130262913A1 (en) * 2012-03-29 2013-10-03 Nec Corporation Information processing apparatus, system time synchronization method and computer readable medium

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281483A (zh) * 2008-05-12 2008-10-08 北京邮电大学 双机冗余容错系统及其冗余切换方法
CN102141947A (zh) * 2011-03-30 2011-08-03 东方通信股份有限公司 一种对采用嵌入式操作系统的计算机应用系统中异常任务的处理方法及系统
US20130262913A1 (en) * 2012-03-29 2013-10-03 Nec Corporation Information processing apparatus, system time synchronization method and computer readable medium

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315626A (zh) * 2016-04-27 2017-11-03 比亚迪股份有限公司 车载多媒体及其控制方法
CN107315626B (zh) * 2016-04-27 2020-10-20 比亚迪股份有限公司 车载多媒体及其控制方法
CN108227474A (zh) * 2016-12-13 2018-06-29 中核控制系统工程有限公司 安全级dcs平台零延时冗余切换方法
CN107426756A (zh) * 2017-08-23 2017-12-01 京信通信系统(中国)有限公司 热备份通信系统及其通信接口控制模块
CN110647426A (zh) * 2018-06-27 2020-01-03 龙芯中科技术有限公司 双机热备份方法、装置、系统与计算机存储介质
CN110647426B (zh) * 2018-06-27 2023-04-11 龙芯中科技术股份有限公司 双机热备份方法、装置、系统与计算机存储介质
CN110187659A (zh) * 2019-05-28 2019-08-30 成都星时代宇航科技有限公司 状态监控方法、系统及立方星
CN110187659B (zh) * 2019-05-28 2020-12-11 成都星时代宇航科技有限公司 状态监控方法、系统及立方星
CN111737062A (zh) * 2020-06-24 2020-10-02 浙江大华技术股份有限公司 一种备份处理方法、装置及系统
CN113342613A (zh) * 2021-06-25 2021-09-03 深圳市商汤科技有限公司 数据处理装置、方法、计算机设备及存储介质

Also Published As

Publication number Publication date
CN104679610B (zh) 2020-05-01

Similar Documents

Publication Publication Date Title
CN104679610A (zh) 计算机系统的管理方法和装置
US9582448B2 (en) Transmission apparatus and control unit
CN204406385U (zh) 计算机系统的管理装置
CN107070731B (zh) 一种主从仲裁方法及系统
CN103647781A (zh) 一种基于设备冗余和网络冗余的混合冗余可编程控制系统
KR20150088559A (ko) 네트워크의 장애를 복구하는 방법 및 장치
EP1999893A2 (en) Customer traffic forwarding continues while control plane is reset
CN104050061A (zh) 一种基于PCIe总线多主控板冗余备份系统
CN111767244A (zh) 基于国产龙芯平台的双冗余计算机设备
CN105652851A (zh) 冗余自动化系统和运行方法
CN111107572A (zh) 一种冗余备份方法及装置
CN103853626A (zh) 一种星载电子设备的双工冗余备份总线通信方法及装置
WO2016095344A1 (zh) 链路切换方法、装置及线卡
CN102508746A (zh) 一种用于三机变结构容错计算机系统管理方法
WO2021057438A1 (zh) 主备切换方法、装置、bras设备及存储介质
CN212541329U (zh) 基于国产龙芯平台的双冗余计算机设备
CN109120386B (zh) 无线通信装置、系统和方法
JP4728159B2 (ja) 分散電源装置および分散電源の障害復旧方法
CN105577444A (zh) 一种无线控制器管理方法及无线控制器
CN103441878A (zh) Vcf网络中pe设备的归属处理方法及设备
CN103152209B (zh) 基于多机热备份的应用服务运行处理系统
CN103793300A (zh) 一种双机热备系统中快速主备切换装置和主备切换方法
CN101739317B (zh) 双机软冗余系统切换方法
CN105049263A (zh) 一种数据处理方法和系统
CN103067205A (zh) 同一主机管理下共用同一地址的rt与备份rt切换方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230706

Address after: Room 501, Building D2, Songshan Lake International Innovation and Entrepreneurship Community, Songshan Lake High tech Industrial Development Zone, Dongguan City, Guangdong Province, 523000

Patentee after: Dongguan Dongguan Institute of Science and Technology Innovation

Address before: 523786 Room 502, Floor 5, Building 1, Innovation Science Park, Songshan Lake High tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee before: DONGGUAN FRONTIER TECHNOLOGY INSTITUTE

Patentee before: SHENZHEN KUANG-CHI SPACE TECH. Co.,Ltd.