CN111290885A - 一种火星探测用多计算机双级数据备份及分级恢复方法 - Google Patents
一种火星探测用多计算机双级数据备份及分级恢复方法 Download PDFInfo
- Publication number
- CN111290885A CN111290885A CN202010144764.3A CN202010144764A CN111290885A CN 111290885 A CN111290885 A CN 111290885A CN 202010144764 A CN202010144764 A CN 202010144764A CN 111290885 A CN111290885 A CN 111290885A
- Authority
- CN
- China
- Prior art keywords
- data
- computer
- backup
- satellite
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1456—Hardware arrangements for backup
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1469—Backup restoration techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种火星探测用多计算机双级数据备份及分级恢复方法,首先将所需备份的数据进行分级。然后将所需备份的数据分别向本机内存中事先划定的备份数据区和备份计算机进行备份操作。当计算机发生故障,故障处理时清除内存中除备份数据区以外的所有数据,等待故障处理完毕后,使用3取2的方式从本机读取第一步中所定义的备份数据中的关键数据。读取数据结束后,判断关键数据是否为全零状态。若不是,则继续从本机的备份数据区读取第一步中所定义的过程数据,与关键数据结合在一起恢复计算机状态。若确实为全零状态,则清除本机所有的内存数据,再采用N取2的方式从N台备份计算机中读取备份数据,使用最终的表决结果恢复计算机状态。
Description
技术领域
本发明涉及一种火星探测用多计算机双级数据备份及分级恢复方法,属于火星探测的星载计算机系统管理技术。
背景技术
我国将于2020年发射火星探测器,随着探测器飞往火星,器地距离增加,地面不能实时监控、干预火星探测器的器上状态,需星载计算机系统具备高度自主的管理能力。计算机发生故障时,使用备份数据自主可靠的快速恢复故障前计算机状态。现有的计算机数据备份和自主恢复的方法主要有两种:1、将本计算机的数据周期性的备份至备份计算机,当计算机发生故障,故障处理时清除本机内存的所有数据,等待故障处理完毕后,再从备份计算机读取数据进行状态恢复;2、将本计算机数据存储在本机内存中事先划定的备份数据区。当计算机发生故障,故障处理时清除内存中除备份数据区以外的所有数据,等待故障处理完毕后,从备份数据区读取数据,进行状态恢复。
第一种方法的缺点在于:受计算机之间通讯能力的约束,将本计算机的数据周期性的备份至备份计算机不会很频繁,一般为计算机软件运行周期的20~50倍,计算机备份数据不连续。因此计算机故障处理完毕后,再从备份计算机读取的数据不是故障发生点的数据,其时间间隔与备份数据的周期有关,最终计算机无法准确恢复到故障发生点的状态。这对于火星探测中的关键动作(例如制动捕获)时期的故障处理与自主恢复造成了风险。第二种方法的缺点在于:对于计算机异常断电再上电的故障工况,由于计算机的内存数据已在断电时期被全部清除,再上电后,无法得到本机内存中的备份数据,最终导致状态恢复失败。因此有必要发明一种火星探测用多计算机双级数据备份及分级恢复方法。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提出了一种火星探测用多计算机双级数据备份及分级恢复方法,解决了计算机无法准确恢复到故障发生点的状态,能够避免火星探测中的关键动作(例如制动捕获)时期的故障处理与自主恢复造成的风险问题。
本发明的技术方案是:
一种火星探测用多计算机双级数据备份及分级恢复方法,包括步骤如下:
1)在火星探测器上设置N+1台星载计算机,将当前正在执行任务的星载计算机作为主份计算机,其余N台星载计算机作为备份计算机;同一时刻有且仅有一台主份计算机;N为正整数,N大于1;在每台星载计算机的硬件内存中划分一定区域作为备份数据区,所述备份数据区用于备份数据,每台星载计算机均设置有三个数据容量大小相同的备份数据区;
2)将所需备份的数据按数据内容划分为关键数据或过程数据;若星载计算机在当前控制周期内出现断电情况时,将特定的数据值写入关键数据;
3)将所需备份的数据分别向每台星载计算机进行备份操作,具体为:对应任一一台星载计算机,采用三存方式向本机的备份数据区备份数据;采用通讯协议向其他N台星载计算机的备份数据区备份数据;当任意一台星载计算机发生故障时,利用备份数据区中的备份数据恢复发生故障的星载计算机;所述三存方式,具体为:将所需备份的数据分别存入本机的三个备份数据区中;
其中,步骤3)所述利用备份数据区中的备份数据恢复发生故障的星载计算机的方法,具体为:
31)清除发生故障的星载计算机硬件内存中除备份数据区以外所有区域的数据;
32)使用3取2的方法从发生故障的星载计算机的三个备份数据区中读取步骤2)所述的关键数据,获得待判读关键数据;
33)对步骤32)读取出的待判读关键数据进行判读,判断发生故障的星载计算机上一个工作周期运行过程中是否出现过断电情况;若发生故障的星载计算机上一个工作周期运行过程中没有出现过断电情况,则从发生故障的星载计算机的备份数据区读取步骤2)所述的过程数据并进入步骤34);反之,则进入步骤35);
34)根据步骤32)获得的过程数据和步骤33)获得的关键数据恢复发生故障的星载计算机;
35)清除发生故障的星载计算机硬件内存中所有区域的数据,然后从其他N台星载计算机的备份数据区中读取出备份数据,采用N取2的方法进行终极表决,获得终极表决结果,利用终极表决结果恢复发生故障的星载计算机。
步骤2)所述将所需备份的数据按数据内容划分为关键数据或过程数据的方法,具体为:
将所需备份的数据中数据内容为计算机上一工作周期的工作模式与状态的数据,划分为关键数据;
将所需备份的数据中数据内容为计算机上一周运行过程中产生的过程数据,划分为过程数据。
步骤32)所述获得待判读关键数据的方法,具体为:
从发生故障的星载计算机的三个备份数据区中分别读取关键数据,获得三份关键数据;
判断三份关键数据中是否存在两份关键数据的内容一致,若存在,则将内容相同的关键数据作为待判读关键数据;若三份关键数据的内容均不一致,则任意选取一份关键数据作为待判读关键数据。
步骤35)所述进行终极表决的方法,具体为:
判读其他N台星载计算机的备份数据是否数据内容相同,若存在数据内容相同的多份备份数据,则将数据内容相同的备份数据作为终极表决结果;若其他N台星载计算机的备份数据的数据内容均不相同,则将N台星载计算机中任意一台的备份数据作为终极表决结果。
本发明与现有技术相比的有益效果是:
本发明采用了双级数据备份的方法,本机数据实时备份,其他机数据周期备份。发生故障后分级数据恢复,首先尝试使用本机数据自行进行数据恢复,保证了用于恢复的数据时最新的数据,使计算机准确恢复到故障发生点的状态;使用本机数据恢复失败后,再使用其他计算机的数据进行恢复,保证计算机可以运行。
附图说明
图1为本发明双级数据备份及分级自主恢复示意图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详细的描述。
第一步:将所需备份的数据进行分级,第一级数据为"关键数据",包含计算机工作模式标志、轨道递推初值、各个GNC单机使用方式标志、探测器惯量参数等,此类数据更新周期长、变化慢,对时间不敏感;第二级数据为"过程数据",包含陀螺积分值、角速度计积分值、工作模式转换软件计时器等,此类数据更新周期短、变化快、对时间较敏感。
第二步:将所需备份的数据同时向本机内存中事先划定的备份数据区和备份计算机进行数据备份操作。向本机内存中备份数据的周期即为计算机软件的运行周期,存储数据时采用数据“三存”的方式,即向不同的三个内存地址写入相同的数据内容。按计算机之间通讯能力,向备份计算机备份数据的周期选择为计算机软件的运行周期的若干倍数,存储数据时按照预先约定的通讯协议进行存储,协议中设计校验位。并同时向多台备份计算机备份同样的数据。
第三步:当计算机发生故障,故障处理时清除内存中除备份数据区以外的所有数据,等待故障处理完毕后,首先从本机的备份数据区读取第一步中所定义的"关键数据",读取数据时使用“3取2”的方式:按照第二步中“三存”的地址,从三个内存地址中读取三份数据,读取完毕后进行表决,若有两份数据一致,则使用此数据作为最终结果,若三份数据均不一致,则使用第一份数据作为最终结果。
第四步:读取数据结束后,判断"关键数据"是否为“全零”状态。若不是,则继续使用“3取2”的方式从本机从本机的备份数据区读取第一步中所定义的"过程数据",与"关键数据"结合在一起恢复计算机状态。若确实为“全零”状态,则说明本机出现了异常断电再上电的故障工况,此时需进行第五步操作。
第五步:首先清除本机所有的内存控制,然后依次向多台备份计算机请求备份数据,含所有的"关键数据"和"过程数据"。获得备份数据后,采用“N取2”的方式:从N台备份计算机中读取第二步所备份的数据,读取完毕后对这N份数据进行表决,若有两份数据一致,则使用此数据作为最终结果,若N份数据均不一致,则使用第一份数据作为最终结果。多份备份数据表决结束后,使用最终的表决结果恢复计算机状态。
双级数据备份及分级自主恢复方法具体步骤如图1所示。本发明一种火星探测用多计算机双级数据备份及分级恢复方法,包括步骤如下:
1)在火星探测器上设置N+1台星载计算机,将当前正在执行任务的星载计算机作为主份计算机,其余N台星载计算机作为备份计算机;同一时刻有且仅有一台主份计算机;N为正整数,N大于1;在每台星载计算机的硬件内存中划分一定区域作为备份数据区,所述备份数据区用于备份数据,每台星载计算机均设置有三个数据容量大小相同的备份数据区;
2)将所需备份的数据按数据内容划分为关键数据或过程数据;若星载计算机在当前控制周期内出现断电情况时,将特定的数据值写入关键数据;
3)将所需备份的数据分别向每台星载计算机进行备份操作,具体为:对应任一一台星载计算机,采用三存方式向本机的备份数据区备份数据;采用通讯协议向其他N台星载计算机的备份数据区备份数据;当任意一台星载计算机发生故障时,利用备份数据区中的备份数据恢复发生故障的星载计算机;所述三存方式,具体为:将所需备份的数据分别存入本机的三个备份数据区中;
其中,步骤3)所述利用备份数据区中的备份数据恢复发生故障的星载计算机的方法,具体为:
31)清除发生故障的星载计算机硬件内存中除备份数据区以外所有区域的数据;
32)使用3取2的方法从发生故障的星载计算机的三个备份数据区中读取步骤2)所述的关键数据,获得待判读关键数据;
33)对步骤32)读取出的待判读关键数据进行判读,判断发生故障的星载计算机上一个工作周期运行过程中是否出现过断电情况;若发生故障的星载计算机上一个工作周期运行过程中没有出现过断电情况,则从发生故障的星载计算机的备份数据区读取步骤2)所述的过程数据并进入步骤34);反之,则进入步骤35);
34)根据步骤32)获得的过程数据和步骤33)获得的关键数据恢复发生故障的星载计算机;
35)清除发生故障的星载计算机硬件内存中所有区域的数据,然后从其他N台星载计算机的备份数据区中读取出备份数据,采用N取2的方法进行终极表决,获得终极表决结果,利用终极表决结果恢复发生故障的星载计算机。
步骤2)所述将所需备份的数据按数据内容划分为关键数据或过程数据的方法,具体为:
将所需备份的数据中数据内容为计算机上一工作周期的工作模式与状态的数据,划分为关键数据;
将所需备份的数据中数据内容为计算机上一周运行过程中产生的过程数据,划分为过程数据。
步骤32)所述获得待判读关键数据的方法,具体为:
从发生故障的星载计算机的三个备份数据区中分别读取关键数据,获得三份关键数据;
判断三份关键数据中是否存在两份关键数据的内容一致,若存在,则将内容相同的关键数据作为待判读关键数据;若三份关键数据的内容均不一致,则任意选取一份关键数据作为待判读关键数据。
步骤35)所述进行终极表决的方法,具体为:
判读其他N台星载计算机的备份数据是否数据内容相同,若存在数据内容相同的多份备份数据,则将数据内容相同的备份数据作为终极表决结果;若其他N台星载计算机的备份数据的数据内容均不相同,则将N台星载计算机中任意一台的备份数据作为终极表决结果。
本发明说明书中未作详细描述的内容属本领域专业技术人员的公知技术。
Claims (4)
1.一种火星探测用多计算机双级数据备份及分级恢复方法,其特征在于,包括步骤如下:
1)在火星探测器上设置N+1台星载计算机,将当前正在执行任务的星载计算机作为主份计算机,其余N台星载计算机作为备份计算机;同一时刻有且仅有一台主份计算机;N为正整数,N大于1;在每台星载计算机的硬件内存中划分一定区域作为备份数据区,所述备份数据区用于备份数据,每台星载计算机均设置有三个数据容量大小相同的备份数据区;
2)将所需备份的数据按数据内容划分为关键数据或过程数据;若星载计算机在当前控制周期内出现断电情况时,将特定的数据值写入关键数据;
3)将所需备份的数据分别向每台星载计算机进行备份操作,具体为:对应任一一台星载计算机,采用三存方式向本机的备份数据区备份数据;采用通讯协议向其他N台星载计算机的备份数据区备份数据;当任意一台星载计算机发生故障时,利用备份数据区中的备份数据恢复发生故障的星载计算机;所述三存方式,具体为:将所需备份的数据分别存入本机的三个备份数据区中;
其中,步骤3)所述利用备份数据区中的备份数据恢复发生故障的星载计算机的方法,具体为:
31)清除发生故障的星载计算机硬件内存中除备份数据区以外所有区域的数据;
32)使用3取2的方法从发生故障的星载计算机的三个备份数据区中读取步骤2)所述的关键数据,获得待判读关键数据;
33)对步骤32)读取出的待判读关键数据进行判读,判断发生故障的星载计算机上一个工作周期运行过程中是否出现过断电情况;若发生故障的星载计算机上一个工作周期运行过程中没有出现过断电情况,则从发生故障的星载计算机的备份数据区读取步骤2)所述的过程数据并进入步骤34);反之,则进入步骤35);
34)根据步骤32)获得的过程数据和步骤33)获得的关键数据恢复发生故障的星载计算机;
35)清除发生故障的星载计算机硬件内存中所有区域的数据,然后从其他N台星载计算机的备份数据区中读取出备份数据,采用N取2的方法进行终极表决,获得终极表决结果,利用终极表决结果恢复发生故障的星载计算机。
2.根据权利要求1所述的一种火星探测用多计算机双级数据备份及分级恢复方法,其特征在于,步骤2)所述将所需备份的数据按数据内容划分为关键数据或过程数据的方法,具体为:
将所需备份的数据中数据内容为计算机上一工作周期的工作模式与状态的数据,划分为关键数据;
将所需备份的数据中数据内容为计算机上一周运行过程中产生的过程数据,划分为过程数据。
3.根据权利要求1~2任意之一所述的一种火星探测用多计算机双级数据备份及分级恢复方法,其特征在于,步骤32)所述获得待判读关键数据的方法,具体为:
从发生故障的星载计算机的三个备份数据区中分别读取关键数据,获得三份关键数据;
判断三份关键数据中是否存在两份关键数据的内容一致,若存在,则将内容相同的关键数据作为待判读关键数据;若三份关键数据的内容均不一致,则任意选取一份关键数据作为待判读关键数据。
4.根据权利要求3所述的一种火星探测用多计算机双级数据备份及分级恢复方法,其特征在于,步骤35)所述进行终极表决的方法,具体为:
判读其他N台星载计算机的备份数据是否数据内容相同,若存在数据内容相同的多份备份数据,则将数据内容相同的备份数据作为终极表决结果;若其他N台星载计算机的备份数据的数据内容均不相同,则将N台星载计算机中任意一台的备份数据作为终极表决结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010144764.3A CN111290885B (zh) | 2020-03-04 | 2020-03-04 | 一种火星探测用多计算机双级数据备份及分级恢复方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010144764.3A CN111290885B (zh) | 2020-03-04 | 2020-03-04 | 一种火星探测用多计算机双级数据备份及分级恢复方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111290885A true CN111290885A (zh) | 2020-06-16 |
CN111290885B CN111290885B (zh) | 2022-07-29 |
Family
ID=71028570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010144764.3A Active CN111290885B (zh) | 2020-03-04 | 2020-03-04 | 一种火星探测用多计算机双级数据备份及分级恢复方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111290885B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113791602A (zh) * | 2021-08-18 | 2021-12-14 | 中国科学院国家空间科学中心 | 一种面向深空探测应用的高效载荷探测控制方法 |
CN114048063A (zh) * | 2021-09-28 | 2022-02-15 | 北京控制工程研究所 | 一种火星车驶离过程中切机或复位故障处理的方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473156A (zh) * | 2013-09-24 | 2013-12-25 | 北京控制工程研究所 | 一种基于实时操作系统的星载计算机三机热备份容错方法 |
US20140287679A1 (en) * | 2011-12-08 | 2014-09-25 | Ajou University Industry-Academic Cooperation Foundation | Apparatus and method for communicating with satellite based on analog network coding |
CN106649173A (zh) * | 2016-10-10 | 2017-05-10 | 上海航天控制技术研究所 | 基于1553b总线的高可靠星载计算机在轨自修正系统及方法 |
-
2020
- 2020-03-04 CN CN202010144764.3A patent/CN111290885B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140287679A1 (en) * | 2011-12-08 | 2014-09-25 | Ajou University Industry-Academic Cooperation Foundation | Apparatus and method for communicating with satellite based on analog network coding |
CN103473156A (zh) * | 2013-09-24 | 2013-12-25 | 北京控制工程研究所 | 一种基于实时操作系统的星载计算机三机热备份容错方法 |
CN106649173A (zh) * | 2016-10-10 | 2017-05-10 | 上海航天控制技术研究所 | 基于1553b总线的高可靠星载计算机在轨自修正系统及方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113791602A (zh) * | 2021-08-18 | 2021-12-14 | 中国科学院国家空间科学中心 | 一种面向深空探测应用的高效载荷探测控制方法 |
CN113791602B (zh) * | 2021-08-18 | 2022-08-02 | 中国科学院国家空间科学中心 | 一种面向深空探测应用的高效载荷探测控制方法 |
CN114048063A (zh) * | 2021-09-28 | 2022-02-15 | 北京控制工程研究所 | 一种火星车驶离过程中切机或复位故障处理的方法及系统 |
CN114048063B (zh) * | 2021-09-28 | 2024-06-07 | 北京控制工程研究所 | 一种火星车驶离过程中切机或复位故障处理的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111290885B (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102981931B (zh) | 虚拟机备份方法及装置 | |
US8046547B1 (en) | Storage system snapshots for continuous file protection | |
US10146502B2 (en) | Stream-processing data | |
CN111913469B (zh) | 一种航天器控制系统在轨稳定运行能力构建方法 | |
EP2425344B1 (en) | Method and system for system recovery using change tracking | |
US20070185936A1 (en) | Managing deletions in backup sets | |
US20080168218A1 (en) | Backup system with continuous data protection | |
US20060206544A1 (en) | Automatic backup and restore system and method | |
US20110302140A1 (en) | Failover systems and methods for performing backup operations | |
CN111290885B (zh) | 一种火星探测用多计算机双级数据备份及分级恢复方法 | |
US9069711B2 (en) | Source cleaning cascaded volumes using write and background copy indicators | |
WO2010144913A2 (en) | Memory change track logging | |
US20140108345A1 (en) | Exchanging locations of an out of synchronization indicator and a change recording indicator via pointers | |
CN101373450B (zh) | 处理cpu异常的方法及系统 | |
US10127114B2 (en) | Method of file system design and failure recovery with non-volatile memory | |
CN115562911B (zh) | 虚拟机数据备份方法及装置、系统、电子设备、存储介质 | |
WO2017122060A1 (en) | Parallel recovery for shared-disk databases | |
CN110968459B (zh) | 一种卫星数据处理方法、装置及卫星备份子系统 | |
CN111090491B (zh) | 虚拟机任务状态的恢复方法、装置及电子设备 | |
CN110727544A (zh) | 一种基于工业器件的微小卫星星载计算机系统 | |
CN105988885A (zh) | 基于补偿回滚的操作系统故障自恢复方法 | |
CN116185721B (zh) | 卫星能源安全的保障方法、装置、计算设备及存储介质 | |
CN106371952A (zh) | 一种基于物理机应急的管理系统 | |
JP5180578B2 (ja) | 業務継続システム | |
JP2019159882A (ja) | コントローラ及びデータ保存方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |