CN111290885B - 一种火星探测用多计算机双级数据备份及分级恢复方法 - Google Patents

一种火星探测用多计算机双级数据备份及分级恢复方法 Download PDF

Info

Publication number
CN111290885B
CN111290885B CN202010144764.3A CN202010144764A CN111290885B CN 111290885 B CN111290885 B CN 111290885B CN 202010144764 A CN202010144764 A CN 202010144764A CN 111290885 B CN111290885 B CN 111290885B
Authority
CN
China
Prior art keywords
data
computer
backup
satellite
borne
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010144764.3A
Other languages
English (en)
Other versions
CN111290885A (zh
Inventor
谭晓宇
许贤峰
鲁启东
孙杰
张玉花
陆丹萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aerospace Control Technology Institute
Original Assignee
Shanghai Aerospace Control Technology Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aerospace Control Technology Institute filed Critical Shanghai Aerospace Control Technology Institute
Priority to CN202010144764.3A priority Critical patent/CN111290885B/zh
Publication of CN111290885A publication Critical patent/CN111290885A/zh
Application granted granted Critical
Publication of CN111290885B publication Critical patent/CN111290885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种火星探测用多计算机双级数据备份及分级恢复方法,首先将所需备份的数据进行分级。然后将所需备份的数据分别向本机内存中事先划定的备份数据区和备份计算机进行备份操作。当计算机发生故障,故障处理时清除内存中除备份数据区以外的所有数据,等待故障处理完毕后,使用3取2的方式从本机读取第一步中所定义的备份数据中的关键数据。读取数据结束后,判断关键数据是否为全零状态。若不是,则继续从本机的备份数据区读取第一步中所定义的过程数据,与关键数据结合在一起恢复计算机状态。若确实为全零状态,则清除本机所有的内存数据,再采用N取2的方式从N台备份计算机中读取备份数据,使用最终的表决结果恢复计算机状态。

Description

一种火星探测用多计算机双级数据备份及分级恢复方法
技术领域
本发明涉及一种火星探测用多计算机双级数据备份及分级恢复方法,属于火星探测的星载计算机系统管理技术。
背景技术
我国将于2020年发射火星探测器,随着探测器飞往火星,器地距离增加,地面不能实时监控、干预火星探测器的器上状态,需星载计算机系统具备高度自主的管理能力。计算机发生故障时,使用备份数据自主可靠的快速恢复故障前计算机状态。现有的计算机数据备份和自主恢复的方法主要有两种:1、将本计算机的数据周期性的备份至备份计算机,当计算机发生故障,故障处理时清除本机内存的所有数据,等待故障处理完毕后,再从备份计算机读取数据进行状态恢复;2、将本计算机数据存储在本机内存中事先划定的备份数据区。当计算机发生故障,故障处理时清除内存中除备份数据区以外的所有数据,等待故障处理完毕后,从备份数据区读取数据,进行状态恢复。
第一种方法的缺点在于:受计算机之间通讯能力的约束,将本计算机的数据周期性的备份至备份计算机不会很频繁,一般为计算机软件运行周期的20~50倍,计算机备份数据不连续。因此计算机故障处理完毕后,再从备份计算机读取的数据不是故障发生点的数据,其时间间隔与备份数据的周期有关,最终计算机无法准确恢复到故障发生点的状态。这对于火星探测中的关键动作(例如制动捕获)时期的故障处理与自主恢复造成了风险。第二种方法的缺点在于:对于计算机异常断电再上电的故障工况,由于计算机的内存数据已在断电时期被全部清除,再上电后,无法得到本机内存中的备份数据,最终导致状态恢复失败。因此有必要发明一种火星探测用多计算机双级数据备份及分级恢复方法。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提出了一种火星探测用多计算机双级数据备份及分级恢复方法,解决了计算机无法准确恢复到故障发生点的状态,能够避免火星探测中的关键动作(例如制动捕获)时期的故障处理与自主恢复造成的风险问题。
本发明的技术方案是:
一种火星探测用多计算机双级数据备份及分级恢复方法,包括步骤如下:
1)在火星探测器上设置N+1台星载计算机,将当前正在执行任务的星载计算机作为主份计算机,其余N台星载计算机作为备份计算机;同一时刻有且仅有一台主份计算机;N为正整数,N大于1;在每台星载计算机的硬件内存中划分一定区域作为备份数据区,所述备份数据区用于备份数据,每台星载计算机均设置有三个数据容量大小相同的备份数据区;
2)将所需备份的数据按数据内容划分为关键数据或过程数据;若星载计算机在当前控制周期内出现断电情况时,将特定的数据值写入关键数据;
3)将所需备份的数据分别向每台星载计算机进行备份操作,具体为:对应任一一台星载计算机,采用三存方式向本机的备份数据区备份数据;采用通讯协议向其他N台星载计算机的备份数据区备份数据;当任意一台星载计算机发生故障时,利用备份数据区中的备份数据恢复发生故障的星载计算机;所述三存方式,具体为:将所需备份的数据分别存入本机的三个备份数据区中;
其中,步骤3)所述利用备份数据区中的备份数据恢复发生故障的星载计算机的方法,具体为:
31)清除发生故障的星载计算机硬件内存中除备份数据区以外所有区域的数据;
32)使用3取2的方法从发生故障的星载计算机的三个备份数据区中读取步骤2)所述的关键数据,获得待判读关键数据;
33)对步骤32)读取出的待判读关键数据进行判读,判断发生故障的星载计算机上一个工作周期运行过程中是否出现过断电情况;若发生故障的星载计算机上一个工作周期运行过程中没有出现过断电情况,则从发生故障的星载计算机的备份数据区读取步骤2)所述的过程数据并进入步骤34);反之,则进入步骤35);
34)根据步骤32)获得的过程数据和步骤33)获得的关键数据恢复发生故障的星载计算机;
35)清除发生故障的星载计算机硬件内存中所有区域的数据,然后从其他N台星载计算机的备份数据区中读取出备份数据,采用N取2的方法进行终极表决,获得终极表决结果,利用终极表决结果恢复发生故障的星载计算机。
步骤2)所述将所需备份的数据按数据内容划分为关键数据或过程数据的方法,具体为:
将所需备份的数据中数据内容为计算机上一工作周期的工作模式与状态的数据,划分为关键数据;
将所需备份的数据中数据内容为计算机上一周运行过程中产生的过程数据,划分为过程数据。
步骤32)所述获得待判读关键数据的方法,具体为:
从发生故障的星载计算机的三个备份数据区中分别读取关键数据,获得三份关键数据;
判断三份关键数据中是否存在两份关键数据的内容一致,若存在,则将内容相同的关键数据作为待判读关键数据;若三份关键数据的内容均不一致,则任意选取一份关键数据作为待判读关键数据。
步骤35)所述进行终极表决的方法,具体为:
判读其他N台星载计算机的备份数据是否数据内容相同,若存在数据内容相同的多份备份数据,则将数据内容相同的备份数据作为终极表决结果;若其他N台星载计算机的备份数据的数据内容均不相同,则将N台星载计算机中任意一台的备份数据作为终极表决结果。
本发明与现有技术相比的有益效果是:
本发明采用了双级数据备份的方法,本机数据实时备份,其他机数据周期备份。发生故障后分级数据恢复,首先尝试使用本机数据自行进行数据恢复,保证了用于恢复的数据时最新的数据,使计算机准确恢复到故障发生点的状态;使用本机数据恢复失败后,再使用其他计算机的数据进行恢复,保证计算机可以运行。
附图说明
图1为本发明双级数据备份及分级自主恢复示意图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详细的描述。
第一步:将所需备份的数据进行分级,第一级数据为"关键数据",包含计算机工作模式标志、轨道递推初值、各个GNC单机使用方式标志、探测器惯量参数等,此类数据更新周期长、变化慢,对时间不敏感;第二级数据为"过程数据",包含陀螺积分值、角速度计积分值、工作模式转换软件计时器等,此类数据更新周期短、变化快、对时间较敏感。
第二步:将所需备份的数据同时向本机内存中事先划定的备份数据区和备份计算机进行数据备份操作。向本机内存中备份数据的周期即为计算机软件的运行周期,存储数据时采用数据“三存”的方式,即向不同的三个内存地址写入相同的数据内容。按计算机之间通讯能力,向备份计算机备份数据的周期选择为计算机软件的运行周期的若干倍数,存储数据时按照预先约定的通讯协议进行存储,协议中设计校验位。并同时向多台备份计算机备份同样的数据。
第三步:当计算机发生故障,故障处理时清除内存中除备份数据区以外的所有数据,等待故障处理完毕后,首先从本机的备份数据区读取第一步中所定义的"关键数据",读取数据时使用“3取2”的方式:按照第二步中“三存”的地址,从三个内存地址中读取三份数据,读取完毕后进行表决,若有两份数据一致,则使用此数据作为最终结果,若三份数据均不一致,则使用第一份数据作为最终结果。
第四步:读取数据结束后,判断"关键数据"是否为“全零”状态。若不是,则继续使用“3取2”的方式从本机从本机的备份数据区读取第一步中所定义的"过程数据",与"关键数据"结合在一起恢复计算机状态。若确实为“全零”状态,则说明本机出现了异常断电再上电的故障工况,此时需进行第五步操作。
第五步:首先清除本机所有的内存控制,然后依次向多台备份计算机请求备份数据,含所有的"关键数据"和"过程数据"。获得备份数据后,采用“N取2”的方式:从N台备份计算机中读取第二步所备份的数据,读取完毕后对这N份数据进行表决,若有两份数据一致,则使用此数据作为最终结果,若N份数据均不一致,则使用第一份数据作为最终结果。多份备份数据表决结束后,使用最终的表决结果恢复计算机状态。
双级数据备份及分级自主恢复方法具体步骤如图1所示。本发明一种火星探测用多计算机双级数据备份及分级恢复方法,包括步骤如下:
1)在火星探测器上设置N+1台星载计算机,将当前正在执行任务的星载计算机作为主份计算机,其余N台星载计算机作为备份计算机;同一时刻有且仅有一台主份计算机;N为正整数,N大于1;在每台星载计算机的硬件内存中划分一定区域作为备份数据区,所述备份数据区用于备份数据,每台星载计算机均设置有三个数据容量大小相同的备份数据区;
2)将所需备份的数据按数据内容划分为关键数据或过程数据;若星载计算机在当前控制周期内出现断电情况时,将特定的数据值写入关键数据;
3)将所需备份的数据分别向每台星载计算机进行备份操作,具体为:对应任一一台星载计算机,采用三存方式向本机的备份数据区备份数据;采用通讯协议向其他N台星载计算机的备份数据区备份数据;当任意一台星载计算机发生故障时,利用备份数据区中的备份数据恢复发生故障的星载计算机;所述三存方式,具体为:将所需备份的数据分别存入本机的三个备份数据区中;
其中,步骤3)所述利用备份数据区中的备份数据恢复发生故障的星载计算机的方法,具体为:
31)清除发生故障的星载计算机硬件内存中除备份数据区以外所有区域的数据;
32)使用3取2的方法从发生故障的星载计算机的三个备份数据区中读取步骤2)所述的关键数据,获得待判读关键数据;
33)对步骤32)读取出的待判读关键数据进行判读,判断发生故障的星载计算机上一个工作周期运行过程中是否出现过断电情况;若发生故障的星载计算机上一个工作周期运行过程中没有出现过断电情况,则从发生故障的星载计算机的备份数据区读取步骤2)所述的过程数据并进入步骤34);反之,则进入步骤35);
34)根据步骤32)获得的过程数据和步骤33)获得的关键数据恢复发生故障的星载计算机;
35)清除发生故障的星载计算机硬件内存中所有区域的数据,然后从其他N台星载计算机的备份数据区中读取出备份数据,采用N取2的方法进行终极表决,获得终极表决结果,利用终极表决结果恢复发生故障的星载计算机。
步骤2)所述将所需备份的数据按数据内容划分为关键数据或过程数据的方法,具体为:
将所需备份的数据中数据内容为计算机上一工作周期的工作模式与状态的数据,划分为关键数据;
将所需备份的数据中数据内容为计算机上一周运行过程中产生的过程数据,划分为过程数据。
步骤32)所述获得待判读关键数据的方法,具体为:
从发生故障的星载计算机的三个备份数据区中分别读取关键数据,获得三份关键数据;
判断三份关键数据中是否存在两份关键数据的内容一致,若存在,则将内容相同的关键数据作为待判读关键数据;若三份关键数据的内容均不一致,则任意选取一份关键数据作为待判读关键数据。
步骤35)所述进行终极表决的方法,具体为:
判读其他N台星载计算机的备份数据是否数据内容相同,若存在数据内容相同的多份备份数据,则将数据内容相同的备份数据作为终极表决结果;若其他N台星载计算机的备份数据的数据内容均不相同,则将N台星载计算机中任意一台的备份数据作为终极表决结果。
本发明说明书中未作详细描述的内容属本领域专业技术人员的公知技术。

Claims (4)

1.一种火星探测用多计算机双级数据备份及分级恢复方法,其特征在于,包括步骤如下:
1)在火星探测器上设置N+1台星载计算机,将当前正在执行任务的星载计算机作为主份计算机,其余N台星载计算机作为备份计算机;同一时刻有且仅有一台主份计算机;N为正整数,N大于1;在每台星载计算机的硬件内存中划分一定区域作为备份数据区,所述备份数据区用于备份数据,每台星载计算机均设置有三个数据容量大小相同的备份数据区;
2)将所需备份的数据按数据内容划分为关键数据或过程数据;若星载计算机在当前控制周期内出现断电情况时,将特定的数据值写入关键数据;
3)将所需备份的数据分别向每台星载计算机进行备份操作,具体为:对应任一一台星载计算机,采用三存方式向本机的备份数据区备份数据;采用通讯协议向其他N台星载计算机的备份数据区备份数据;当任意一台星载计算机发生故障时,利用备份数据区中的备份数据恢复发生故障的星载计算机;所述三存方式,具体为:将所需备份的数据分别存入本机的三个备份数据区中;
其中,步骤3)所述利用备份数据区中的备份数据恢复发生故障的星载计算机的方法,具体为:
31)清除发生故障的星载计算机硬件内存中除备份数据区以外所有区域的数据;
32)使用3取2的方法从发生故障的星载计算机的三个备份数据区中读取步骤2)所述的关键数据,获得待判读关键数据;
33)对步骤32)读取出的待判读关键数据进行判读,判断发生故障的星载计算机上一个工作周期运行过程中是否出现过断电情况;若发生故障的星载计算机上一个工作周期运行过程中没有出现过断电情况,则从发生故障的星载计算机的备份数据区读取步骤2)所述的过程数据并进入步骤34);反之,则进入步骤35);
34)根据步骤32)获得的过程数据和步骤33)获得的关键数据恢复发生故障的星载计算机;
35)清除发生故障的星载计算机硬件内存中所有区域的数据,然后从其他N台星载计算机的备份数据区中读取出备份数据,采用N取2的方法进行终极表决,获得终极表决结果,利用终极表决结果恢复发生故障的星载计算机。
2.根据权利要求1所述的一种火星探测用多计算机双级数据备份及分级恢复方法,其特征在于,步骤2)所述将所需备份的数据按数据内容划分为关键数据或过程数据的方法,具体为:
将所需备份的数据中数据内容为计算机上一工作周期的工作模式与状态的数据,划分为关键数据;
将所需备份的数据中数据内容为计算机上一周运行过程中产生的过程数据,划分为过程数据。
3.根据权利要求1~2任意之一所述的一种火星探测用多计算机双级数据备份及分级恢复方法,其特征在于,步骤32)所述获得待判读关键数据的方法,具体为:
从发生故障的星载计算机的三个备份数据区中分别读取关键数据,获得三份关键数据;
判断三份关键数据中是否存在两份关键数据的内容一致,若存在,则将内容相同的关键数据作为待判读关键数据;若三份关键数据的内容均不一致,则任意选取一份关键数据作为待判读关键数据。
4.根据权利要求3所述的一种火星探测用多计算机双级数据备份及分级恢复方法,其特征在于,步骤35)所述进行终极表决的方法,具体为:
判读其他N台星载计算机的备份数据是否数据内容相同,若存在数据内容相同的多份备份数据,则将数据内容相同的备份数据作为终极表决结果;若其他N台星载计算机的备份数据的数据内容均不相同,则将N台星载计算机中任意一台的备份数据作为终极表决结果。
CN202010144764.3A 2020-03-04 2020-03-04 一种火星探测用多计算机双级数据备份及分级恢复方法 Active CN111290885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010144764.3A CN111290885B (zh) 2020-03-04 2020-03-04 一种火星探测用多计算机双级数据备份及分级恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010144764.3A CN111290885B (zh) 2020-03-04 2020-03-04 一种火星探测用多计算机双级数据备份及分级恢复方法

Publications (2)

Publication Number Publication Date
CN111290885A CN111290885A (zh) 2020-06-16
CN111290885B true CN111290885B (zh) 2022-07-29

Family

ID=71028570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010144764.3A Active CN111290885B (zh) 2020-03-04 2020-03-04 一种火星探测用多计算机双级数据备份及分级恢复方法

Country Status (1)

Country Link
CN (1) CN111290885B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113791602B (zh) * 2021-08-18 2022-08-02 中国科学院国家空间科学中心 一种面向深空探测应用的高效载荷探测控制方法
CN114048063A (zh) * 2021-09-28 2022-02-15 北京控制工程研究所 一种火星车驶离过程中切机或复位故障处理的方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013085122A1 (ko) * 2011-12-08 2013-06-13 아주대학교산학협력단 아날로그 네트워크 코딩 기반의 위성통신 방법 및 그 장치
CN103473156B (zh) * 2013-09-24 2015-07-08 北京控制工程研究所 一种基于实时操作系统的星载计算机三机热备份容错方法
CN106649173B (zh) * 2016-10-10 2019-04-09 上海航天控制技术研究所 基于1553b总线的高可靠星载计算机在轨自修正系统及方法

Also Published As

Publication number Publication date
CN111290885A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN102981931B (zh) 虚拟机备份方法及装置
US8046547B1 (en) Storage system snapshots for continuous file protection
US7979741B2 (en) Method and apparatus for data recovery system using storage based journaling
US10146502B2 (en) Stream-processing data
US20100318746A1 (en) Memory change track logging
US9251010B2 (en) Caching backed-up data locally until successful replication
US20080168218A1 (en) Backup system with continuous data protection
EP2425344B1 (en) Method and system for system recovery using change tracking
CN111913469B (zh) 一种航天器控制系统在轨稳定运行能力构建方法
US20110302140A1 (en) Failover systems and methods for performing backup operations
CN111290885B (zh) 一种火星探测用多计算机双级数据备份及分级恢复方法
US20140108345A1 (en) Exchanging locations of an out of synchronization indicator and a change recording indicator via pointers
US9069711B2 (en) Source cleaning cascaded volumes using write and background copy indicators
CN113360322B (zh) 一种基于备份系统恢复数据的方法及设备
US8229892B2 (en) Storage apparatus and data restoring method used therein
US10127114B2 (en) Method of file system design and failure recovery with non-volatile memory
CN112506710B (zh) 分布式文件系统数据修复方法、装置、设备及存储介质
CN115562911A (zh) 虚拟机数据备份方法及装置、系统、电子设备、存储介质
WO2017122060A1 (en) Parallel recovery for shared-disk databases
CN110968459B (zh) 一种卫星数据处理方法、装置及卫星备份子系统
CN110727544A (zh) 一种基于工业器件的微小卫星星载计算机系统
US10275509B2 (en) Replica checkpointing without quiescing
CN111090491B (zh) 虚拟机任务状态的恢复方法、装置及电子设备
CN116185721B (zh) 卫星能源安全的保障方法、装置、计算设备及存储介质
CN106371952A (zh) 一种基于物理机应急的管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant