CN112241352A - 一种网格化容错计算机平台的监控系统 - Google Patents

一种网格化容错计算机平台的监控系统 Download PDF

Info

Publication number
CN112241352A
CN112241352A CN202011209830.7A CN202011209830A CN112241352A CN 112241352 A CN112241352 A CN 112241352A CN 202011209830 A CN202011209830 A CN 202011209830A CN 112241352 A CN112241352 A CN 112241352A
Authority
CN
China
Prior art keywords
monitoring
output
fault
main processor
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011209830.7A
Other languages
English (en)
Other versions
CN112241352B (zh
Inventor
王萌
康晓东
冯非
赵熠
冯军波
亢晓丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Aeronautics Computing Technique Research Institute of AVIC
Original Assignee
Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Aeronautics Computing Technique Research Institute of AVIC filed Critical Xian Aeronautics Computing Technique Research Institute of AVIC
Priority to CN202011209830.7A priority Critical patent/CN112241352B/zh
Publication of CN112241352A publication Critical patent/CN112241352A/zh
Application granted granted Critical
Publication of CN112241352B publication Critical patent/CN112241352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Abstract

本申请提供一种网格化容错计算机平台的监控系统,所述系统包括主处理器A、主处理器B、系统I/O处理器电路A和系统I/O处理器电路B,其中:主处理器A通过主处理器A总线连接看门狗A‑A、ID识别A‑A、同步A、数据发送A、数据接收A、双口存储A‑M、双口存储B‑M;主处理器A连接嵌入式U盘A;主处理器B通过主处理器B总线连接看门狗B‑A、ID识别B‑A、同步B、数据发送B、数据接收B、双口存储A‑S、双口存储B‑S;主处理器B连接嵌入式U盘B,看门狗B‑A。

Description

一种网格化容错计算机平台的监控系统
技术领域
本申请涉及航空机载容错计算机体系结构技术领域,具体涉及一种网格化容错计算机平台的监控系统。
背景技术
经典冗余计算机系统以完整资源构成的通道为核心实现容错能力(如图1所示),与单机系统相比可提升整机的安全与可靠工作特性,但由于独立资源与通道概念捆绑,因此这种经典的体系结构对资源的利用率偏低,对产品可靠性的提升受限,仅单主处理器故障就会将其所属通道完全切除,其未故障的局部资源不能得到有效利用;通道间仅存在交叉传输链路,一旦失效则双通道间将失去通信互联而导致监控能力丧失;主控制计算应用与计算机平台通道仲裁都由通道内主处理器完成,导致应用层软件开发较复杂,用户不能专注于核心控制应用的开发;产品的系统功能集成度低,不能有效降低系统负荷。
发明内容
为了解决上述技术问题,本申请提供一种网格化容错计算机平台的监控系统,能够提高产品的系统功能集成度,有效降低系统负荷。
本申请提供一种网格化容错计算机平台的监控系统,所述系统包括主处理器A、主处理器B、系统I/O处理器电路A和系统I/O处理器电路B,其中:
主处理器A通过主处理器A总线连接看门狗A-A、ID识别A-A、同步A、数据发送A、数据接收A、双口存储A-M、双口存储B-M;主处理器A连接嵌入式U盘A;
主处理器B通过主处理器B总线连接看门狗B-A、ID识别B-A、同步B、数据发送B、数据接收B、双口存储A-S、双口存储B-S;主处理器B连接嵌入式U盘B,看门狗B-A;;
系统I/O处理器电路A通过局部双口存储器A总线连接双口存储A-M、双口存储A-S;系统I/O处理器电路A通过系统I/O处理器A总线连接ID识别A-B、看门狗A-B、系统I/O输出A、输出监控A、故障综合监控A-B,ID识别A-B、内部电源A监控;
系统I/O处理器电路B通过局部双口存储器B总线连接双口存储B-M、双口存储B-S;系统I/O处理器电路B通过系统I/O处理器B总线连接ID识别B-B、看门狗B-B、系统I/O输出B、输出监控B、故障综合监控B-B、ID识别B-B、内部电源B监控。
具体的,主处理器A通过USB总线连接嵌入式U盘A。
具体的,主处理器B通过如USB总线连接嵌入式U盘B。
具体的,看门狗A-A、ID识别A-A输出的监控结果信号连接故障综合监控A-A,故障综合监控A-A的输出指示信号连接故障综合监控B-A。
具体的,ID识别B-A输出的监控结果信号连接故障综合监控B-A。
具体的,故障综合监控A-A的输出指示信号连接故障综合监控A-A。
具体的,外部电源A监控的输出指示信号连接故障综合监控A-B,故障综合监控A-B的输出信号连接控制开关KA-A、控制开关KA-B;系统I/O输出A所输出的信号、KA-A开关输出信号、KA-B开关输出信号连接输出监控A,故障综合监控A--B输出指示信号连接故障综合监控B-B。
具体的,外部电源B监控的输出指示信号连接故障综合监控B-B,故障综合监控B-B的输出信号连接控制开关KB-A、控制开关KB-B;系统I/O输出B所输出的信号、KB-A开关输出信号、KB-B开关输出信号连接输出监控B,故障综合监控B-B输出指示信号连接故障综合监控A-B。
综上所述,本申请提供的网格化容错计算机平台的监控系统,具有以下特点:1.监控功能全资源部署,融合了看门狗监控、ID监控、自监控、指示监控、同步监控、数据通讯监控、电源监控、监控记录等等;2.主处理器电路采用“减负”的监控设计,不实现对输出信号的直接开关控制;3.针对系统I/O处理器电路采用强化的监控设计,监控结果信号直接参与对输出信号的开关控制。
附图说明
图1为现有技术中的经典并联系统可靠性结构框图
图2为现有技术中的网格化可靠性结构框图
图3为本申请提供的一种网格化容错计算机平台的监控体系结构设计示意。
具体实施方式
为了克服经典冗余计算机在可靠性方面的不足,目前针对军用无人机中最核心的飞管计算机已经提出了网格化的容错计算机体系结构,其中监控能力的设计是进一步确保该体系结构的容错计算机在实际应用中能够安全可靠稳定运行的关键。经典冗余计算机系统的监控功能设计是以主处理器电路为核心,在网格化可靠性结构框架下的容错计算机必须采用一种新的监控体系结构。本方案所述体系结构具体包括3方面内容:1.监控功能全资源部署,融合了看门狗监控、ID监控、自监控、指示监控、同步监控、数据通讯监控、电源监控、监控记录等等;2.主处理器电路采用“减负”的监控设计,不实现对输出信号的直接开关控制;3.针对系统I/O处理器电路采用强化的监控设计,监控结果信号直接参与对输出信号的开关控制。
针对上述技术背景需求,本提案给出了一种监控体系结构设计(如图3所示),以应用于网格化后的容错计算机平台。具体包括3方面内容:1.监控功能全资源部署,融合了看门狗监控、ID监控、自监控、指示监控、同步监控、数据通讯监控、电源监控、监控记录等等;2.主处理器电路采用“减负”的监控设计,不实现对输出信号的直接开关控制;3.针对系统I/O处理器电路采用强化的监控设计,监控结果信号直接参与对输出信号的开关控制。详细内容如下:
1.监控功能全资源部署。如图3所示主处理器A、主处理器B、系统I/O处理器电路A、系统I/O处理器电路B各部分均设置相应的监控功能。其中的“故障综合监控”、“ID识别”、“看门狗”等监控电路属共有设计,嵌入式U盘A、嵌入式U盘B、数据发送、数据接收、同步等电路是主处理器专署监控使用,“嵌入式U盘”用于对监控数据的记录,数据发送与数据接收为主处理器A和主处理器B之间提供交叉数据传输监控通路,“同步”为主处理器A和主处理器B之间提供同步监控指示;“输出监控”、对“内部电源”及“外部电源”的监控是系统I/O处理器电路部分专署监控使用。
2.主处理器电路采用减负的监控结构设计。主处理器A通过主处理器A总线连接看门狗A-A、ID识别A-A、同步A、数据发送A、数据接收A、双口存储A-M、双口存储B-M,实现对这些监控以及支持电路的控制访问,主处理器A通过专用数据通信线路(如USB总线)连接嵌入式U盘A,看门狗A-A、ID识别A-A输出的监控结果信号连接故障综合监控A-A,故障综合监控A-A的输出指示信号连接故障综合监控B-A;主处理器B通过主处理器B总线连接看门狗B-A、ID识别B-A、同步B、数据发送B、数据接收B、双口存储A-S、双口存储B-S,实现对这些监控电路的控制访问,主处理器B通过专用数据通信线路(如USB总线)连接嵌入式U盘B,看门狗B-A、ID识别B-A输出的监控结果信号连接故障综合监控B-A,故障综合监控A-A的输出指示信号连接故障综合监控B-A。
3.针对系统I/O处理器电路采用强化的监控结构设计。系统I/O处理器电路A通过局部双口存储器A总线连接双口存储A-M、双口存储A-S,系统I/O处理器电路A通过系统I/O处理器A总线连接ID识别A-B、看门狗A-B、系统I/O输出A、输出监控A、故障综合监控A-B,ID识别A-B、看门狗A-B、内部电源A监控、外部电源A监控的输出指示信号连接故障综合监控A-B,故障综合监控A-B的输出信号连接控制开关KA-A、KA-B,系统I/O输出A所输出的信号、KA-A开关输出信号、KA-B开关输出信号连接输出监控A,故障综合监控A-B输出指示信号连接故障综合监控B-B;
系统I/O处理器电路B通过局部双口存储器B总线连接双口存储B-M、双口存储B-S,系统I/O处理器电路B通过系统I/O处理器B总线连接ID识别B-B、看门狗B-B、系统I/O输出B、输出监控B、故障综合监控B-B,ID识别B-B、看门狗B-B、内部电源B监控、外部电源B监控的输出指示信号连接故障综合监控B-B,故障综合监控B-B的输出信号连接控制开关KB-A、KB-B,系统I/O输出B所输出的信号、KB-A开关输出信号、KB-B开关输出信号连接输出监控B,故障综合监控B-B输出指示信号连接故障综合监控A-B。
综上所述,为了克服经典冗余计算机在可靠性方面的不足,目前针对军用无人机中最核心的飞管计算机已经提出了网格化的容错计算机体系结构(如图2所示),其中监控能力的设计是进一步确保该体系结构的容错计算机在实际应用中能够安全可靠稳定运行的关键。经典冗余计算机系统的监控功能设计是以主处理器电路为核心,在网格化可靠性结构框架下的容错计算机必须采用一种新的监控体系结构。

Claims (8)

1.一种网格化容错计算机平台的监控系统,其特征在于,所述系统包括主处理器A、主处理器B、系统I/O处理器电路A和系统I/O处理器电路B,其中:
主处理器A通过主处理器A总线连接看门狗A-A、ID识别A-A、同步A、数据发送A、数据接收A、双口存储A-M、双口存储B-M;主处理器A连接嵌入式U盘A;
主处理器B通过主处理器B总线连接看门狗B-A、ID识别B-A、同步B、数据发送B、数据接收B、双口存储A-S、双口存储B-S;主处理器B连接嵌入式U盘B,看门狗B-A;
系统I/O处理器电路A通过局部双口存储器A总线连接双口存储A-M、双口存储A-S;系统I/O处理器电路A通过系统I/O处理器A总线连接ID识别A-B、看门狗A-B、系统I/O输出A、输出监控A、故障综合监控A-B,ID识别A-B、内部电源A监控;
系统I/O处理器电路B通过局部双口存储器B总线连接双口存储B-M、双口存储B-S;系统I/O处理器电路B通过系统I/O处理器B总线连接ID识别B-B、看门狗B-B、系统I/O输出B、输出监控B、故障综合监控B-B、ID识别B-B、内部电源B监控。
2.根据权利要求1所述的监控系统,其特征在于,主处理器A通过USB总线连接嵌入式U盘A。
3.根据权利要求1所述的监控系统,其特征在于,主处理器B通过如USB总线连接嵌入式U盘B。
4.根据权利要求1所述的监控系统,其特征在于,看门狗A-A、ID识别A-A输出的监控结果信号连接故障综合监控A-A,故障综合监控A-A的输出指示信号连接故障综合监控B-A。
5.根据权利要求1所述的监控系统,其特征在于,ID识别B-A输出的监控结果信号连接故障综合监控B-A。
6.根据权利要求5所述的监控系统,其特征在于,
故障综合监控A-A的输出指示信号连接故障综合监控A-A。
7.根据权利要求1所述的监控系统,其特征在于,外部电源A监控的输出指示信号连接故障综合监控A-B,故障综合监控A-B的输出信号连接控制开关KA-A、控制开关KA-B;系统I/O输出A所输出的信号、KA-A开关输出信号、KA-B开关输出信号连接输出监控A,故障综合监控A-B输出指示信号连接故障综合监控B-B。
8.根据权利要求1所述的监控系统,其特征在于,外部电源B监控的输出指示信号连接故障综合监控B-B,故障综合监控B-B的输出信号连接控制开关KB-A、控制开关KB-B;系统I/O输出B所输出的信号、KB-A开关输出信号、KB-B开关输出信号连接输出监控B,故障综合监控B-B输出指示信号连接故障综合监控A-B。
CN202011209830.7A 2020-11-03 2020-11-03 一种网格化容错计算机平台的监控系统 Active CN112241352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011209830.7A CN112241352B (zh) 2020-11-03 2020-11-03 一种网格化容错计算机平台的监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011209830.7A CN112241352B (zh) 2020-11-03 2020-11-03 一种网格化容错计算机平台的监控系统

Publications (2)

Publication Number Publication Date
CN112241352A true CN112241352A (zh) 2021-01-19
CN112241352B CN112241352B (zh) 2023-10-20

Family

ID=74169780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011209830.7A Active CN112241352B (zh) 2020-11-03 2020-11-03 一种网格化容错计算机平台的监控系统

Country Status (1)

Country Link
CN (1) CN112241352B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113868077A (zh) * 2021-09-08 2021-12-31 中国航空工业集团公司西安航空计算技术研究所 一种双双并联体系结构计算机平台

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009054041A (ja) * 2007-08-28 2009-03-12 Fujitsu Ten Ltd 模擬マイクロコンピュータ装置
WO2016102055A2 (de) * 2014-12-23 2016-06-30 Liebherr-Aerospace Lindenberg Gmbh Verfahren zum betrieb einer steuerungskomponente für ein luftfahrzeug sowie steuerungskomponente
US20170242761A1 (en) * 2014-10-31 2017-08-24 Red Hat, Inc. Fault tolerant listener registration in the presence of node crashes in a data grid
CN107634855A (zh) * 2017-09-12 2018-01-26 天津津航计算技术研究所 一种嵌入式系统的双机热备方法
CN209911778U (zh) * 2019-04-23 2020-01-07 徐州威卡电子控制技术有限公司 基于功能安全的工程机械车载控制器
US20200310920A1 (en) * 2019-03-29 2020-10-01 Honeywell International Inc. Redundant controllers or input-output gateways without dedicated hardware

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009054041A (ja) * 2007-08-28 2009-03-12 Fujitsu Ten Ltd 模擬マイクロコンピュータ装置
US20170242761A1 (en) * 2014-10-31 2017-08-24 Red Hat, Inc. Fault tolerant listener registration in the presence of node crashes in a data grid
WO2016102055A2 (de) * 2014-12-23 2016-06-30 Liebherr-Aerospace Lindenberg Gmbh Verfahren zum betrieb einer steuerungskomponente für ein luftfahrzeug sowie steuerungskomponente
CN107634855A (zh) * 2017-09-12 2018-01-26 天津津航计算技术研究所 一种嵌入式系统的双机热备方法
US20200310920A1 (en) * 2019-03-29 2020-10-01 Honeywell International Inc. Redundant controllers or input-output gateways without dedicated hardware
CN209911778U (zh) * 2019-04-23 2020-01-07 徐州威卡电子控制技术有限公司 基于功能安全的工程机械车载控制器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
魏志明、李文新、马动涛、王彬: "双机容错系统中基于FPGA容错控制器的设计", 《科学技术与工程》, vol. 9, no. 15, pages 4506 - 4511 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113868077A (zh) * 2021-09-08 2021-12-31 中国航空工业集团公司西安航空计算技术研究所 一种双双并联体系结构计算机平台
CN113868077B (zh) * 2021-09-08 2024-04-16 中国航空工业集团公司西安航空计算技术研究所 一种双双并联体系结构计算机平台

Also Published As

Publication number Publication date
CN112241352B (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
CN110351174B (zh) 一种模块冗余的安全计算机平台
CN107347018B (zh) 一种三冗余1553b总线动态切换方法
CN110376876B (zh) 一种双系同步的安全计算机平台
EP3699764B1 (en) Redundant ethernet-based secure computer system
CN110427283B (zh) 一种双余度的燃油管理计算机系统
US9952579B2 (en) Control device
CN104749949A (zh) 一种基于PowerPC和x86的混合三余度无人机飞控计算机及内核设计方法
CN102130722A (zh) 光传飞行控制系统交叉通道数据链路系统
CN110764585B (zh) 一种通用的独立bmc板卡
CN103441863A (zh) 一种空管自动化系统中的双服务器热备系统及控制方法
CN112241352A (zh) 一种网格化容错计算机平台的监控系统
CN101788940A (zh) 基于可编程逻辑器件2x2冗余容错计算机上电复位的电路
CN111694305B (zh) 一种异构多核无人机控制计算机
CN111858456A (zh) 一种箭载全三模冗余计算机体系架构
CN115114224A (zh) 一种soc+fpga的飞控计算机硬件系统
CN115391251A (zh) 一种无人机智能飞控芯片架构
CN112232523B (zh) 一种国产化人工智能计算设备
CN114200855A (zh) 一种无中心裁决冗余控制系统
CN113609039A (zh) 一种边缘控制器主板、边缘控制器及数据处理方法
CN209784990U (zh) 一种高性能服务器主板
CN212515798U (zh) 一种箭载全三模冗余计算机体系架构
CN113868077B (zh) 一种双双并联体系结构计算机平台
CN115964228A (zh) 一种异构双容错飞控计算机及运行方法
CN216350933U (zh) 一种宽频测量处理装置及监测系统
CN115185877B (zh) 一种双余度通用处理模块及其信息同步方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant