CN106933692A - 一种基于处理器阵列的航天器星载计算机系统及故障处理方法 - Google Patents

一种基于处理器阵列的航天器星载计算机系统及故障处理方法 Download PDF

Info

Publication number
CN106933692A
CN106933692A CN201710152243.0A CN201710152243A CN106933692A CN 106933692 A CN106933692 A CN 106933692A CN 201710152243 A CN201710152243 A CN 201710152243A CN 106933692 A CN106933692 A CN 106933692A
Authority
CN
China
Prior art keywords
processor
data
module
spacecraft
calculating task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710152243.0A
Other languages
English (en)
Other versions
CN106933692B (zh
Inventor
陈健
曹喜滨
徐国栋
李化义
王峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Technology Satellite Technology Co.,Ltd.
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201710152243.0A priority Critical patent/CN106933692B/zh
Publication of CN106933692A publication Critical patent/CN106933692A/zh
Application granted granted Critical
Publication of CN106933692B publication Critical patent/CN106933692B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0796Safety measures, i.e. ensuring safe condition in the event of error, e.g. for controlling element
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/167Interprocessor communication using a common memory, e.g. mailbox
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8038Associative processors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

一种基于处理器阵列的航天器星载计算机系统及故障处理方法,本发明涉及基于处理器阵列的星载计算机设计方法。本发明为了解决现有技术处理能力不强、无法运行复杂的软件、经常出现跑飞、复位等故障现象的问题。本发明包括:用于完成星载计算任务的处理器阵列模块;用于为处理器阵列模块提供数据存储和外部通信功能的公用资源模块;用于为处理器阵列模块和公用资源模块之间提供数据交互通道并识别处理器阵列模块中的故障处理器的调度管理模块。本发明通过故障处理器的自主恢复保障系统运行连续性,通过处理器连接多个处理器组成处理器阵列,实现系统计算能力的进一步扩展。本发明用于星载计算机设计领域。

Description

一种基于处理器阵列的航天器星载计算机系统及故障处理 方法
技术领域
本发明涉及基于处理器阵列的星载计算机设计方法。
背景技术
星载计算机是指运行在航天器中的中心计算机,该计算机承担卫星部件管理、数据管理、任务管理、姿态控制等功能,是航天器的重要组成部分,其可靠性及性能直接影响整个航天器的性能及可靠运行。
目前,星载计算机通常采用具有抗辐射指标的高等级处理器,以抵抗复杂的空间运行环境,同时采用双备份体系结构,进一步增强系统可靠性。这种处理器虽然抗辐照指标较高,但是处理能力不强(通常不超过100MIPS),无法运行复杂的软件。同时,某些微小卫星的星载计算机采用低等级处理器,虽然处理能力得到提升,但是由于抗辐照能力不足,在轨经常出现跑飞、复位等故障现象,影响了飞行任务的正常运行。
发明内容
本发明的目的是为了解决现有技术处理能力不强、无法运行复杂的软件、经常出现跑飞、复位等故障现象的问题,而提出一种基于处理器阵列的航天器星载计算机系统及故障处理方法。
一种基于处理器阵列的航天器星载计算机系统包括:
用于完成星载计算任务的处理器阵列模块;
用于为处理器阵列模块提供数据存储和外部通信功能的公用资源模块;
用于为处理器阵列模块和公用资源模块之间提供数据交互通道并识别处理器阵列模块中的故障处理器的调度管理模块。
一种基于处理器阵列的航天器星载计算机系统的故障处理方法包括以下步骤:
步骤一:星载计算机启动后,进行计算任务的数据输入,每个处理器的输入数据由其他处理器或外部输入给出;
步骤二:由处理器管理单元对处理器进行任务分配;
步骤三:根据步骤二的任务分配处理器执行计算任务;
步骤四:得到计算任务的输出数据,即计算结果。
本发明的有益效果为:
(1)实现了由多个低等级高性能处理器组成高可靠、高性能星载计算系统。
(2)通过处理器间软件功能冗余保证系统运行可靠性。
(3)通过故障处理器的自主恢复保障系统运行连续性。
(4)通过处理器连接多个处理器组成处理器阵列,实现系统计算能力的进一步扩展。
计算能力:若系统采用10个500MIPS处理能力的处理器,即使单处理器能力也是高等级处理器的5倍,考虑通信引起的计算损耗(假设为50%),再考虑处理器故障情况(假设同一时间有两个处理器故障),则系统计算能力为500×(10-2)×50%=2000MIPS,为高等级处理器的200倍。
可靠性提升:假设单处理器可靠性为0.5(实际远大于该值),则10个处理器并行计算的可靠性为1-(1-0.5)10=0.999,满足在轨可靠运行。
附图说明
图1是本发明系统示意图;
图2是计算任务外部输出示意图。
具体实施方式
具体实施方式一:如图1所示,一种基于处理器阵列的航天器星载计算机系统包括:
用于完成星载计算任务的处理器阵列模块;
用于为处理器阵列模块提供数据存储和外部通信功能的公用资源模块;
用于为处理器阵列模块和公用资源模块之间提供数据交互通道并识别处理器阵列模块中的故障处理器的调度管理模块。
具体实施方式二:本实施方式与具体实施方式一不同的是:所述处理器阵列模块由N个处理器组成,其中N≥3,处理器之间通过处理器总线连接。
处理器是由高性能处理器为核心构成的最小运算单元,用来实现高性能运算,同时每个处理器单元均可单独配电、复位;处理器之间通过处理器总线连接,用来实现处理器单元之间的数据共享。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是:所述公用资源模块包括:
用于为处理器提供程序存储及数据存储的存储器模块;
用于为星载计算机系统与外部组件提供连接接口的对外接口模块。如CAN、1553B等系统总线接口。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:所述调度管理模块包括:
用于通过数据总线连接处理器阵列模块中的处理器,同时连接公用资源模块,为公用资源模块和处理器阵列模块之间提供数据交互通道的数据转发单元模块;
用于为处理器阵列模块中的处理器进行任务分配,并接收处理器的仲裁结果,识别处理器阵列中故障处理器的处理器管理单元模块。
处理器管理单元为处理器阵列模块中的各个处理器进行任务分配,健康运行状态,并对故障处理器进行故障处理与恢复。
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:一种基于处理器阵列的航天器星载计算机系统的故障处理方法包括以下步骤:
步骤一:星载计算机启动后,进行计算任务的数据输入,每个处理器的输入数据由其他处理器或外部输入给出;
步骤二:由处理器管理单元对处理器进行任务分配;资源调度模块完成对处理器阵列的任务分配,使每个处理器需承担系统分配的一个或多个计算任务,且同一个计算任务由三个处理器同时承担,计算任务的输入数据由其他处理器或外部输入给出。
步骤三:根据步骤二的任务分配处理器执行计算任务;
步骤四:得到计算任务的输出数据,即计算结果。
具体实施方式六:本实施方式与具体实施方式五不同的是:所述步骤一中进行计算任务的数据输入的具体过程为:
当处理器的输入数据由外部输入给出时,通过对外接口由数据转发单元传输给处理器;
当处理器的输入数据由其他处理器给出时,处理器之间通过处理器总线直接进行数据传输。
其它步骤及参数与具体实施方式五相同。
具体实施方式七:本实施方式与具体实施方式五或六不同的是:所述步骤二中由处理器管理单元对处理器进行任务分配的具体过程为:
处理器管理单元分配给每个处理器n个计算任务,n≥1;1个计算任务由3个处理器同时进行计算;且两个相关的计算任务不分配到同一个处理器中。
其它步骤及参数与具体实施方式五或六相同。
具体实施方式八:本实施方式与具体实施方式五至七之一不同的是:所述步骤三中根据步骤二的任务分配处理器执行计算任务的具体过程为:
若计算任务的输入数据由外部给出,则处理器直接执行计算任务;
若计算任务的输入数据由其他处理器给出,该处理器需获取三个不同的处理器给出的输入数据,并执行三取二仲裁,输入的三份数据中至少两份一致的数据,若存在一组数据和其他两组数据不同,则判定给出该组数据的处理器,即为处理器故障。
其它步骤及参数与具体实施方式五至七之一相同。
具体实施方式九:本实施方式与具体实施方式五至八之一不同的是:所述步骤四中得到计算任务的输出数据具体为:
若计算任务的输入数据由其他处理器给出,仲裁结果和计算结果输入到处理器总线上,通过数据转发单元将仲裁结果传输到处理器管理单元,识别故障处理器;当处理器管理单元确定故障处理器后,将故障处理器的计算任务重新分配给其他处理器,并控制故障处理器复位或断电;
计算结果若需要外部输出(如图2所示),则处理器管理单元接收三份不同处理器给出的数据并通过数据转发单元和对外接口对数据进行外部数据输出,使其从故障状态中恢复。
其它步骤及参数与具体实施方式五至八之一相同。

Claims (9)

1.一种基于处理器阵列的航天器星载计算机系统,其特征在于:所述航天器星载计算机系统包括:
用于完成星载计算任务的处理器阵列模块;
用于为处理器阵列模块提供数据存储和外部通信功能的公用资源模块;
用于为处理器阵列模块和公用资源模块之间提供数据交互通道并识别处理器阵列模块中的故障处理器的调度管理模块。
2.根据权利要求1所述的一种基于处理器阵列的航天器星载计算机系统,其特征在于:所述处理器阵列模块由N个处理器组成,其中N≥3,处理器之间通过处理器总线连接。
3.根据权利要求2所述的一种基于处理器阵列的航天器星载计算机系统,其特征在于:所述公用资源模块包括:
用于为处理器提供程序存储及数据存储的存储器模块;
用于为星载计算机系统与外部组件提供连接接口的对外接口模块。
4.根据权利要求3所述的一种基于处理器阵列的航天器星载计算机系统,其特征在于:所述调度管理模块包括:
用于通过数据总线连接处理器阵列模块中的处理器,同时连接公用资源模块,为公用资源模块和处理器阵列模块之间提供数据交互通道的数据转发单元模块;
用于为处理器阵列模块中的处理器进行任务分配,并接收处理器的仲裁结果,识别处理器阵列中故障处理器的处理器管理单元模块。
5.一种基于处理器阵列的航天器星载计算机系统的故障处理方法,其特征在于:所述基于处理器阵列的航天器星载计算机系统的故障处理方法的具体过程为:
步骤一:星载计算机启动后,进行计算任务的数据输入,每个处理器的输入数据由其他处理器或外部输入给出;
步骤二:由处理器管理单元对处理器进行任务分配;
步骤三:根据步骤二的任务分配处理器执行计算任务;
步骤四:得到计算任务的输出数据,即计算结果。
6.根据权利要求5所述的一种基于处理器阵列的航天器星载计算机系统的故障处理方法,其特征在于:所述步骤一中进行计算任务的数据输入的具体过程为:
当处理器的输入数据由外部输入给出时,通过对外接口由数据转发单元传输给处理器;
当处理器的输入数据由其他处理器给出时,处理器之间通过处理器总线直接进行数据传输。
7.根据权利要求6所述的一种基于处理器阵列的航天器星载计算机系统的故障处理方法,其特征在于:所述步骤二中由处理器管理单元对处理器进行任务分配的具体过程为:
处理器管理单元分配给每个处理器n个计算任务,n≥1;1个计算任务由3个处理器同时进行计算;且两个相关的计算任务不分配到同一个处理器中。
8.根据权利要求7所述的一种基于处理器阵列的航天器星载计算机系统的故障处理方法,其特征在于:所述步骤三中根据步骤二的任务分配处理器执行计算任务的具体过程为:
若计算任务的输入数据由外部给出,则处理器直接执行计算任务;
若计算任务的输入数据由其他处理器给出,该处理器需获取三个不同的处理器给出的输入数据,并执行三取二仲裁,输入的三份数据中至少两份一致的数据,若存在一组数据和其他两组数据不同,则判定给出该组数据的处理器,即为处理器故障。
9.根据权利要求8所述的一种基于处理器阵列的航天器星载计算机系统的故障处理方法,其特征在于:所述步骤四中得到计算任务的输出数据具体为:
若计算任务的输入数据由其他处理器给出,仲裁结果和计算结果输入到处理器总线上,通过数据转发单元将仲裁结果传输到处理器管理单元,识别故障处理器;当处理器管理单元确定故障处理器后,将故障处理器的计算任务重新分配给其他处理器,并控制故障处理器复位或断电;
计算结果若需要外部输出,则处理器管理单元接收三份不同处理器给出的数据并通过数据转发单元和对外接口对数据进行外部数据输出。
CN201710152243.0A 2017-03-14 2017-03-14 一种基于处理器阵列的航天器星载计算机系统及故障处理方法 Active CN106933692B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710152243.0A CN106933692B (zh) 2017-03-14 2017-03-14 一种基于处理器阵列的航天器星载计算机系统及故障处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710152243.0A CN106933692B (zh) 2017-03-14 2017-03-14 一种基于处理器阵列的航天器星载计算机系统及故障处理方法

Publications (2)

Publication Number Publication Date
CN106933692A true CN106933692A (zh) 2017-07-07
CN106933692B CN106933692B (zh) 2020-06-09

Family

ID=59432497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710152243.0A Active CN106933692B (zh) 2017-03-14 2017-03-14 一种基于处理器阵列的航天器星载计算机系统及故障处理方法

Country Status (1)

Country Link
CN (1) CN106933692B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108255149A (zh) * 2017-12-08 2018-07-06 中国航空工业集团公司成都飞机设计研究所 一种遥控清除无人机飞管系统故障的方法
WO2020103706A1 (zh) * 2018-11-21 2020-05-28 北京灵汐科技有限公司 一种数据处理系统及数据处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744754A (zh) * 2014-01-26 2014-04-23 上海交通大学 一种抗辐射加固并行星载计算机系统及其使用方法
CN104182304A (zh) * 2014-08-12 2014-12-03 西北工业大学 通用多模冗余皮/纳卫星星载计算机系统
CN205507610U (zh) * 2016-04-05 2016-08-24 上海航天测控通信研究所 一种采用串行内总线的星载计算机

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744754A (zh) * 2014-01-26 2014-04-23 上海交通大学 一种抗辐射加固并行星载计算机系统及其使用方法
CN104182304A (zh) * 2014-08-12 2014-12-03 西北工业大学 通用多模冗余皮/纳卫星星载计算机系统
CN205507610U (zh) * 2016-04-05 2016-08-24 上海航天测控通信研究所 一种采用串行内总线的星载计算机

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108255149A (zh) * 2017-12-08 2018-07-06 中国航空工业集团公司成都飞机设计研究所 一种遥控清除无人机飞管系统故障的方法
CN108255149B (zh) * 2017-12-08 2020-12-29 中国航空工业集团公司成都飞机设计研究所 一种遥控清除无人机飞管系统故障的方法
WO2020103706A1 (zh) * 2018-11-21 2020-05-28 北京灵汐科技有限公司 一种数据处理系统及数据处理方法

Also Published As

Publication number Publication date
CN106933692B (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
CN105045672B (zh) 一种基于sram fpga的多级容错加固卫星信息处理系统
CN100470494C (zh) 集群可用性管理方法和系统
CN111309477B (zh) 卫星在轨数据处理系统及方法
CN101788927B (zh) 一种基于fpga的自适应星载计算机实现内部资源动态分配的方法
Arnold The concept of coverage and its effect on the reliability model of a repairable system
CN105279133A (zh) 基于SoC在线重构的VPX并行DSP信号处理板卡
CN101833536B (zh) 一种冗余仲裁机制的可重构星载计算机
CN105549460A (zh) 星载电子设备综合化管控系统
CN105242761A (zh) 一种服务器架构
Chen et al. Optimal load distribution for multi-state systems under selective maintenance strategy
CN106933692A (zh) 一种基于处理器阵列的航天器星载计算机系统及故障处理方法
CN104199440A (zh) 一种四机三总线冗余异构gnc系统
CN104408014A (zh) 一种计算系统之间处理单元互连的系统及方法
CN104866460B (zh) 一种基于SoC的容错自适应可重构系统与方法
CN116860463A (zh) 一种分布式自适应星载中间件系统
CN114764374A (zh) 一种在加速卡系统中执行通信任务的方法和设备
CN106803770B (zh) 面向卫星有效载荷控制与处理系统
CN102231126A (zh) 一种实现多核处理器中核间备份的方法及系统
CN103106174A (zh) 一种复杂soc的片上通信方法
CN113347029B (zh) 基于拓扑重构和路径规划的Torus网络容错方法
CN115114224A (zh) 一种soc+fpga的飞控计算机硬件系统
CN114580193A (zh) 一种支持space vpx架构的抗辐照加固载荷主控设备
CN103631668A (zh) 一种适用于空间应用多机系统优先链表决装置
CN112419140A (zh) 数据处理装置、数据处理方法及电子设备
CN203982379U (zh) 用于粗粒度动态可重构阵列的多模式数据传输互连器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Chen Jian

Inventor after: Wang Feng

Inventor after: Li Huayi

Inventor after: Cao Xibin

Inventor after: Xu Guodong

Inventor before: Chen Jian

Inventor before: Cao Xibin

Inventor before: Xu Guodong

Inventor before: Li Huayi

Inventor before: Wang Feng

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210618

Address after: Room 1107, 11 / F, National University Science Park, Harbin Institute of technology, No. 434, youyou street, Nangang District, Harbin City, Heilongjiang Province, 150001

Patentee after: Harbin Institute of Technology Asset Management Co.,Ltd.

Address before: 150001 No. 92 West straight street, Nangang District, Heilongjiang, Harbin

Patentee before: HARBIN INSTITUTE OF TECHNOLOGY

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210625

Address after: 150028 6 / F, building 1, innovation and entrepreneurship Plaza, science and technology innovation city, high tech Industrial Development Zone, Harbin City, Heilongjiang Province

Patentee after: Harbin University of Technology Satellite Technology Co.,Ltd.

Address before: Room 1107, 11 / F, National University Science Park, Harbin Institute of technology, No. 434, youyou street, Nangang District, Harbin City, Heilongjiang Province, 150001

Patentee before: Harbin Institute of Technology Asset Management Co.,Ltd.