CN101216795A - Tmr容错计算机 - Google Patents

Tmr容错计算机 Download PDF

Info

Publication number
CN101216795A
CN101216795A CNA2007101449732A CN200710144973A CN101216795A CN 101216795 A CN101216795 A CN 101216795A CN A2007101449732 A CNA2007101449732 A CN A2007101449732A CN 200710144973 A CN200710144973 A CN 200710144973A CN 101216795 A CN101216795 A CN 101216795A
Authority
CN
China
Prior art keywords
sub
computer
computing machine
circuit
voting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101449732A
Other languages
English (en)
Inventor
崔刚
汪东升
杨孝宗
李斌
吴智博
左德承
刘宏伟
董剑
苗百利
张展
向琳
罗丹彦
舒燕君
温东新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CNA2007101449732A priority Critical patent/CN101216795A/zh
Publication of CN101216795A publication Critical patent/CN101216795A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

TMR容错计算机,本发明涉及一种TMR容错计算机。它克服了传统TMR容错计算机因只有一个表决器,如该表决器出错则系统无法工作的缺陷。它包括一号子计算机、二号子计算机和三号子计算机,每个子计算机内部还包括:表决电路,以实现把一号子计算机、二号子计算机和三号子计算机的运算结果放到表决电路内比对,按照“少数服从多数的原则”判定哪个运算结果为正确,并认定该表决电路所在的子计算机是否有权占据外部通信总线;仲裁排队器,以接收表决电路的表决结果,对表决电路已经认定的有权占据外部通信总线的子计算机的优先顺序进行排队;和串行总线接口电路,执行仲裁排队器的仲裁结果,沟通外部通信总线与相应的子计算机之间的通信往来。

Description

TMR容错计算机
技术领域
本发明涉及一种TMR容错计算机。
背景技术
在工作可靠性要求很高的场合下往往使用三模容错计算机,这时三模容错计算机(TMR)与系统中的其它部件通过高速串行总线互连在一起构成一个“网络”系统。因为TMR担任中央数据管理之功能故称为中央终端CTU,而其它部件称为遥控终端(RTU)或远程终端,即形成如下一种以CTU为中心节点控制,以其它部件为远程节点的″局部网络″。传统TMR容错计算机内只有一个表决器,由这个表决器来判定三个子计算机中的哪一个占据外部通信总线并与系统内的其它部件通信。如果这个表决器出错,则系统会无法工作。
发明内容
本发明的目的是提供一种TMR容错计算机,以克服传统TMR容错计算机因只有一个表决器,如该表决器出错则系统无法工作的缺陷。它包括一号子计算机1、二号子计算机2和三号子计算机3,上述三个子计算机通过通讯链路4实现子计算机之间的通信;每个子计算机内部还包括:
表决电路5,以实现把一号子计算机1、二号子计算机2和三号子计算机3分别执行同一个任务所得到的运算结果放到表决电路5内比对,按照“少数服从多数的原则”判定哪个运算结果为正确,并根据子计算机的运算结果是否与正确的运算结果相同,认定该表决电路5所在的子计算机是否有权占据外部通信总线8;
仲裁排队器6,接收表决电路5的表决结果,对表决电路5已经认定的有权占据外部通信总线的子计算机的优先顺序进行排队,由位列第一的子计算机占据外部通信总线8;仲裁排队器6内默认三个子计算机之间的总线控制优先权限是一号子计算机1最高、二号子计算机2次之,三号子计算机3最低;
串行总线接口电路7,执行仲裁排队器6的仲裁结果,沟通外部通信总线8与相应的子计算机之间的通信往来。
本发明的TMR容错计算机是一种无“硬核”的TMR容错计算机,它与传统的TMR的根本不同在于引入了冗余的表决电路5。传统的TMR只有一个表决电路,也就必然形成了单故障点,即“硬核”。无硬核的TMR容错计算机的每个子计算机中都有一个表决电路,这样在表决电路的设置上形成了冗余,大大提高了系统的可靠性和稳定性。本发明的容错计算机在容错模式下工作时采用3-2-1逐步降级的工作方式,即子计算机在模数不少于三时,其表决原则是以多数为准。而在分布模式下工作时三机各自独立运行,分别完成自身分配的任务及控制,因此它的通用性非常强,也可以叫做松耦合同步的TMR容错计算机。
附图说明
图1是本发明实施方式一的结构示意图,图2是实施方式二和三的结构示意图。
具体实施方式
具体实施方式一:下面结合图1具体说明本实施方式。本实施方式由一号子计算机1、二号子计算机2和三号子计算机3组成,上述三个子计算机通过通讯链路4实现子计算机之间的通信;每个子计算机内部还包括:
表决电路5,以实现把一号子计算机1、二号子计算机2和三号子计算机3分别执行同一个任务所得到的运算结果放到表决电路5内比对,按照“少数服从多数的原则”判定哪个运算结果为正确,并根据子计算机的运算结果是否与正确的运算结果相同,认定该表决电路5所在的子计算机是否有权占据外部通信总线8;
仲裁排队器6,接收表决电路5的表决结果,对表决电路5已经认定的有权占据外部通信总线的子计算机的优先顺序进行排队,由位列第一的子计算机占据外部通信总线8;仲裁排队器6内默认三个子计算机之间的总线控制优先权限是一号子计算机1最高、二号子计算机2次之,三号子计算机3最低;
串行总线接口电路7,执行仲裁排队器6的仲裁结果,沟通外部通信总线8与相应的子计算机之间的通信往来。
每个子计算机都包括常规组成结构的普通计算机Y,即包括CPU、时钟系统、中断系统、I/O系统、存储器系统。每个子计算机通过表决电路5及仲裁排队器6与一个相应的串行总线接口电路7相连,组成一个逻辑上的整体。
具体实施方式二:下面结合图2具体说明本实施方式。本实施方式与实施方式一的不同点是:每个子计算机内部还包括时间监视器10,所述时间监视器10实时监视自身子计算机是否有故障,并把时间监视器10的监视结果输入仲裁排队器6内,与表决电路5的表决结果和三个子计算机之间默认的总线控制优先权限共同进行逻辑运算,从而产生谁占据外部通信总线8的选择结果。所述时间监视器10选用硬件看门狗芯片,由它定期向子计算机的CPU发信号,如在一定时间内没有接收到该信号,即认为该子计算机有故障。其它的组成和连接方式与实施方式一相同。
具体实施方式三:下面结合图2具体说明本实施方式。本实施方式与实施方式二的不同点是:所述TMR容错计算机还包括共享外存储器11,所述共享外存储器11根据仲裁排队器6内的结果,由占据外部通信总线8的子计算机占有共享外存储器11的访问权利。所述共享外存储器11选用固态盘SSD。对SSD的访问,目的主要是存储来自BIU(串行总线接口电路7)的数据以及子计算机对共享外存储器11进行“读”和“写”的操作。
在容错工作模式下,占据外部通信总线8控制权的子计算机组成一个当前工作的整体,以此整体形成对外部通信总线8的控制及对共享外存储器11的访问权。即只有一个整体去控制,而其它两个整体处于被动态或接收态。当占用总线的整体中有一个模块或全部坏掉之后,不能再正确地完成容错方式下的任务时,就要交换外部通信总线8占用权,即交移另一完整体。
两台子计算机进行两模工作时,软件可采用卷回,比较。硬件以看门狗来检测此两台子计算机的错误。
当某一子计算机被切出三机容错组态后,可在该子计算机内以相应命令切断该子计算机的电源。过一段时间后,再重新加电以恢复该子计算机。恢复好后可继续参加三模组态,以加强整个容错计算机的可靠性。

Claims (3)

1.TMR容错计算机,它包括一号子计算机(1)、二号子计算机(2)和三号子计算机(3),上述三个子计算机通过通讯链路(4)实现子计算机之间的通信;其特征在于每个子计算机内部还包括:
表决电路(5),以实现把一号子计算机(1)、二号子计算机(2)和三号子计算机(3)分别执行同一个任务所得到的运算结果放到表决电路(5)内比对,按照“少数服从多数的原则”判定哪个运算结果为正确,并根据子计算机的运算结果是否与正确的运算结果相同,认定该表决电路(5)所在的子计算机是否有权占据外部通信总线(8);
仲裁排队器(6),接收表决电路(5)的表决结果,对表决电路(5)已经认定的有权占据外部通信总线的子计算机的优先顺序进行排队,由位列第一的子计算机占据外部通信总线(8);仲裁排队器(6)内默认三个子计算机之间的总线控制优先权限是一号子计算机(1)最高、二号子计算机(2)次之,三号子计算机(3)最低;
串行总线接口电路(7),执行仲裁排队器(6)的仲裁结果,沟通外部通信总线(8)与相应的子计算机之间的通信往来。
2.根据权利要求1所述的TMR容错计算机,其特征在于每个子计算机内部还包括时间监视器(10),所述时间监视器(10)实时监视自身子计算机是否有故障,并把时间监视器(10)的监视结果输入仲裁排队器(6)内,与表决电路(5)的表决结果和三个子计算机之间默认的总线控制优先权限共同进行逻辑运算,从而产生谁占据外部通信总线(8)的选择结果。
3.根据权利要求1所述的TMR容错计算机,其特征在于所述TMR容错计算机还包括共享外存储器(11),所述共享外存储器(11)根据仲裁排队器(6)内的结果,由占据外部通信总线(8)的子计算机占有共享外存储器(11)的访问权利。
CNA2007101449732A 2007-12-29 2007-12-29 Tmr容错计算机 Pending CN101216795A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007101449732A CN101216795A (zh) 2007-12-29 2007-12-29 Tmr容错计算机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007101449732A CN101216795A (zh) 2007-12-29 2007-12-29 Tmr容错计算机

Publications (1)

Publication Number Publication Date
CN101216795A true CN101216795A (zh) 2008-07-09

Family

ID=39623231

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101449732A Pending CN101216795A (zh) 2007-12-29 2007-12-29 Tmr容错计算机

Country Status (1)

Country Link
CN (1) CN101216795A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521084A (zh) * 2011-12-20 2012-06-27 惠州市亿能电子有限公司 一种数据存储以及读取方法
CN103473154A (zh) * 2013-08-23 2013-12-25 北京控制工程研究所 一种三机热备份计算机的当班机确定系统
CN116668230A (zh) * 2023-06-20 2023-08-29 西门子交通技术(北京)有限公司 云主机及多路比较方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521084A (zh) * 2011-12-20 2012-06-27 惠州市亿能电子有限公司 一种数据存储以及读取方法
CN102521084B (zh) * 2011-12-20 2013-11-20 惠州市亿能电子有限公司 一种电动汽车电池管理系统的数据存储以及读取方法
CN103473154A (zh) * 2013-08-23 2013-12-25 北京控制工程研究所 一种三机热备份计算机的当班机确定系统
CN103473154B (zh) * 2013-08-23 2015-08-19 北京控制工程研究所 一种三机热备份计算机的当班机确定系统
CN116668230A (zh) * 2023-06-20 2023-08-29 西门子交通技术(北京)有限公司 云主机及多路比较方法
CN116668230B (zh) * 2023-06-20 2024-06-25 西门子交通技术(北京)有限公司 云主机及多路比较方法

Similar Documents

Publication Publication Date Title
CN101576836B (zh) 一种可降级的三机冗余容错系统
CN103559053B (zh) 一种板卡系统及通信接口卡fpga在线升级方法
CN103634150B (zh) 一种冗余的高安全性can总线通信方法
CN106970857A (zh) 一种可重构三冗余计算机系统及其重构降级方法
CN201909961U (zh) 一种冗余控制系统
CN104570721B (zh) 冗余控制器主从状态确定方法
CN101000591A (zh) 基于嵌入式cpu的双机冗余系统
CN103019889A (zh) 分布式文件系统及其故障处理方法
CN106814603A (zh) 一种基于非实时操作系统的双机冗余容错系统
CN103853622A (zh) 一种互为备份的双余度控制方法
CN103729329A (zh) 核间通信装置及方法
CN102360204A (zh) 基于FlexRay的分布式飞行控制计算机通信系统及控制方法
US20060149886A1 (en) Bus controller and bus control method for use in computer system
CN103257908A (zh) 一种软硬件协同的多控制器磁盘阵列设计方法
CN106487721A (zh) 网络设备和用于网络设备中的报文转发方法
CN103853626A (zh) 一种星载电子设备的双工冗余备份总线通信方法及装置
US20150012714A1 (en) Method and System for Multiple Processors to Share Memory
CN105159851A (zh) 多控存储系统
CN105912492A (zh) Axi互联总线的扩展方法
US20160004241A1 (en) Control device
CN102508746A (zh) 一种用于三机变结构容错计算机系统管理方法
CN110427283A (zh) 一种双余度的燃油管理计算机系统
CN101813934A (zh) 基于可编程器件的三冗余总线同步和表决电路
CN105760241A (zh) 一种内存数据导出方法和系统
CN103744753A (zh) 一种双机系统的数据交互方法与装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication