JP2011095837A - フェールセーフシステム - Google Patents

フェールセーフシステム Download PDF

Info

Publication number
JP2011095837A
JP2011095837A JP2009246675A JP2009246675A JP2011095837A JP 2011095837 A JP2011095837 A JP 2011095837A JP 2009246675 A JP2009246675 A JP 2009246675A JP 2009246675 A JP2009246675 A JP 2009246675A JP 2011095837 A JP2011095837 A JP 2011095837A
Authority
JP
Japan
Prior art keywords
data
processing unit
cpu
reset
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009246675A
Other languages
English (en)
Inventor
Jun Murai
純 村井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009246675A priority Critical patent/JP2011095837A/ja
Publication of JP2011095837A publication Critical patent/JP2011095837A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】リセットされたCPUは初期状態から再起動し、その後データ及びアドレス記録部に蓄積された最終のデータ値、アドレス値を読み込むことにより、制御の連続性を妨げないリカバリー処理を実施する。
【解決手段】各系統は、データ通信用のバスと、このバスに接続されたCPUデバイス及びメモリデバイスを備える。各系統には各系統のバス間の情報を比較して検定する連続検定処理部を接続する。この連続検定処理部における各バス間の情報が不一致の場合にエラーとの判定を行う。リセット処理部は、連続検定処理部によるエラーと判定された際のトリガ情報に基づいて、いずれかのCPUもしくは両系CPUにリセット信号を発生する。データ及びアドレス記録部は、リセット処理後に所定のアドレスから処理を再開するために必要な情報を記録する。
【選択図】図1

Description

本発明は、例えば列車制御装置などのコンピュータシステムに使用されるフェールセーフシステムに関するものである。
従来のフェールセーフコンピュータ技術としては、特許文献1に示すように、バス照合方式とデータ照合方式のいづれかを用いることが一般的である。これらのシステムは複数のCPUを利用し、バスデータの連続検定や、重要データの間欠的エラー検定処理を実行し、エラー発生時にはCPU処理を停止して安全側制御(列車ブレーキ動作や踏切遮断動作など)に移行する点においては類似している。
図4は、バス照合方式によるフェールセーフシステムの構成図である。この制御装置は、A系及びB系から成る2重系の構成を有しており、A系及びB系はそれぞれマイクロプロセッサ(以下、CPUという)11A,11B及び記憶回路12A,12Bを有し、入出力部13A,13Bを介して情報の入出力を行っている。これらCPU11A,11Bはクロック回路14からのクロック信号により同期を取りながら走行している。
CPU11A,11Bにはバス15A,15Bを介してバス照合交番信号出力回路16が接続されている。このバス照合交番信号出力回路16は、バス15A,15B上に現れるCPU11A,11Bの信号を照合し、両者が一致するか否かについてその照合結果を照合異常検出回路17に出力している。バス照合交番信号出力回路16は、常時、交番信号を出力しており、両者が一致している場合は、この交番信号の出力を継続することによりCPU11A,11Bの走行を許容する。
しかし、バス照合交番信号出力回路16は、両者の信号の不一致が一度でも発生すると、この不一致の情報を記憶し、以後の交番信号の出力を停止する。バス照合交番信号出力回路16からの交番信号の停止で、照合異常検出回路17は照合異常を検出し、CPU11A,11Bにリセット信号を出力する。CPU11A,11Bがリセットされることにより、バス照合交番信号出力回路16が照合すべきデータがなくなり、照合不一致となって交番信号を出力できなくなる。そして、双方のCPUユニットはリセットされた状態(安全側の状態となっている)で走行を停止するので、フェールセーフ機能が確保されることになる。
図5は、データ照合方式によるフェールセーフシステムの構成図である。図15ではフェールセーフシステムは、3重系で構成されており、入力部18A,18B,18C、プロセッサ19A,19B,19C、出力部20A,20B,20Cを有し、各系間に共通メモリDPM(Dual Port Memory)21A,21B,21Cを接続して構成されている。また、出力部20A,20B,20Cからの出力信号はアンド回路22を介して3種類の演算結果が同一となったときのみ安全と判断して出力する構成としている。
このようなデータ照合方式のフェールセーフシステムの動作は、各系の入力部18A,18B,18Cから得られる入力情報を共通メモリ21A,21B,21Cに書き込み、これを各系のプロセッサ19A,19B,19C内の比較回路により系間で照合する。照合した結果、一致していれば、次の各系のプロセッサ19A,19B,19Cの演算動作を許容する。不一致であれば、入力情報を前回値ないし安全側に固定する。
次の演算動作では、入力動作で決定された入力情報を用いて演算を行う。さらに、次の出力処理では、各系の各系のプロセッサ19A,19B,19Cで演算した結果を共通メモリ21A,21B,21Cに書き込み、これを各系のプロセッサ19A,19B,19C内の比較回路により系間で照合する。照合した結果、一致していれば、各系は次の出力動作を許容する。不一致であれば、出力を前回値ないし安全側に固定する。
このように、データ照合方式は、入力→演算→出力と繰り返し実行されるフェールセーフシステムの各動作フェーズにおいて、入出力情報を照合し各データの異常を検出する方式である。このデータ照合方式は、共通メモリ21A,21B,21Cを利用することで汎用のプロセッサとの接続を良くするメリットを有している。
特開2005−49967号公報
近年のCPUデバイスの高速化及びメモリデバイスの高速化・大容量化などに代表される、部品供給側の大きな流れに逆行して低速かつ低容量の部品を選択してシステム構築することは、将来の応用性を損なうだけでなく、長期のシステム供給性を困難にしてしまうため、高速、大容量化は避けられない技術課題の1つである。
このような近年のCPUデバイスの高速化及びメモリデバイスの高速化・大容量化に伴い、1bit単位が保有する電力エネルギーが小さくなってきているのに対し、エラー検出回路の動作速度は高速化し、その処理すべきデのータ量は多大になってきており、システム全体のエラー発生確率が高くなってきている。
特に、1bit単位での電力エネルギーが小さくなると外来ノイズやγ線含む電磁波の影響を受けやすくなり、意図しないシステム停止を引き起こす要因となるが、これらの問題点はエラー発生の再現性が非常に低い事象であることである。
一方、フェールセーフを構築するようなバイタルなシステムにおいては、一旦発生した安全側制御をいわゆる“機器故障”の位置付けで処理するため、ユーザーに対しなぜ機器故障に至ったかの説明責任が生じる。しかし、実際はハードウェアの固定的な故障ではなく、非常に再現性が低い一過性の外来ノイズやピンポイント的な電磁波によるデータ化けが原因であるケースも多く、これらの解析や対策には膨大な時間と費用がかかる。
このような場合、システムをリセットするだけで、エラーが回復する可能性がある。しかし、前記のような構成を有するバス照合方式及びデータ照合方式のいずれのシステムにおいては、非常に高い安全性を確保する設計思想から、一旦エラーが発生してしまうと、そのリカバリー処理(再制御開始)は実行しないことが周知の技術となっている。
また、仮に、図4のように、不一致と判定した瞬間のトリガ情報を単純にリセット処理して初期状態から再起動するだけでは、装置全体として制御の連続性を失ってしまうため、システムの信頼性が損なわれる。
本発明は、上記のような従来技術の問題点を解決するために提案されたものである。本発明の目的は、従来のデュアルCPUを用いた高い安全性のシステムを踏襲しつつ、非常に稀に発生する、一時的な外来阻害要因に対し耐性を高め、システム全体の信頼性を向上したフェールセーフシステムを提供することにある。
前記の目的を達成するために、本発明は、バス照合方式またはデータ照合方式のフェールセーフコンピュータシステムにおいて、連続検定処理部によるエラーと判定された際のトリガ情報に基づいて、いずれかのCPUもしくは両系CPUにリセット信号を発生するリセット処理部と、そのリセット処理後に所定のアドレスから処理を再開するために必要な情報を記録するデータ及びアドレス記録部を有することを特徴とする。
本発明によれば、リセットされたCPUは初期状態から再起動し、その後データ及びアドレス記録部に蓄積された最終のデータ値、アドレス値を読み込むことにより、制御の連続性を妨げないリカバリー処理を実施することができる。また、両系へのリセット指令ではなく、異常が発生したどちらかのみのCPUへリセット指令を発効すれば、正常なCPUは今までの制御処理を継続するため、装置全体として完全な制御の連続性を保つことができる。
本発明をバス照合方式に適用したフェールセーフシステムの一例を示すブロック図。 本発明をデータ照合方式に適用したフェールセーフシステムの一例を示すブロック図。 従来のバス照合方式のフェールセーフシステムの一例を示すブロック図。 従来のデータ照合方式のフェールセーフシステムの一例を示すブロック図。
以下、本発明をバス照合方式に適用した実施例1について、図1に従って具体的に説明する。なお、この実施例1は、2系統のバスを有するフェールセーフシステムであるが、従来技術に記載したような3系統若しくはそれ以上の系統のバスを有するシステムについても、本発明は適用可能である。
(1)実施例1の構成
図1において、符号1AはA系のバス、2AはB系のバスである。これら各系統のバス1A,1Bには、それぞれCPUデバイス2A,2Bと、1個あるいは複数個のメモリデバイス3A,3Bが接続されている。2系統のバス1A,1Bには、A系バス1Aの処理データとB系バス1Bの処理データを同一時間上に検定(照合)処理する連続検定処理部4が接続されている。
前記連続検定処理部4は、検定結果の出力部と、エラー判定の際にエラー検出を示すトリガの出力部が設けられている。連続検定処理部4のエラー検出トリガの出力部は、出力されたトリガに従い各系統のCPUデバイス2A,2Bをリセットするリセット処理部5に接続されている。このリセット処理部5の出力側は、各系統のCPUデバイス2A,2Bに接続されている。
各系統のバスには、CPUデバイス2A,2Bのリセット処理後に所定のアドレスから処理を再開するためのデータ及びアドレス記録部6が接続されている。このデータ及びアドレス記録部6は、前記リセット処理部5によってCPUデバイス2A,2Bがリセットされた時点で処理されていたデータ及びその書き込みあるいは読み出しのアドレスを記憶するものである。なお、このデータ及びアドレスの記憶のタイミングは、前記連続検定処理部4からのトリガの受信時、リセット処理部5からのリセット信号の発生時、あるいはCPUデバイス2A,2Bのリセット開始時のいずれでも良い。少なくとも、CPUデバイスの起動再開後にリセット前の処理を継続して実施するための情報を記憶できるタイミングとする。
(2)実施例1の作用
前記のような構成を有する実施例1の連続検定処理部4においては、A系バス1Aの処理データとB系バス1Bの処理データを同一時間上に検定(照合)処理し、一致であればしていれば正常動作と判定し、不一致であればA系/B系いずれかのデバイスもしくはバス上に異常が発生したと判定する。この場合、従来技術では、異常が発生したと判定された装置は、やがて安全側制御へと移行し、一般的にはリカバリー処理は許可しない。
これに対して、実施例1においては、連続検定処理部4が不一致と判定した瞬間のトリガ情報をリセット処理部5へ送信し、いずれかのCPUデバイス2A,2Bもしくは両系CPUデバイス2A,2Bにリセット信号を発生させる。リセットされたCPUデバイス1A,2Bは初期状態から再起動し、その後、データ及びアドレス記録部6に蓄積された最終のデータ値とアドレス値を読み込むことにより、制御の連続性を妨げないリカバリー処理を実施する。
(3)実施例1の効果
実施例1によれば、不一致と判定した瞬間のトリガ情報を単純にリセット処理して初期状態から再起動するだけでは、装置全体として制御の連続性を失ってしまうため、データ及びアドレス記録部を設けることにより、異常が発生する直前までの処理に瞬時にリカバリーし、制御の連続性を保持することができる。また、両系へのリセット指令ではなく、異常が発生したどちらかのみのCPUへリセット指令を発効するように構成すれば、正常なCPUは今までの制御処理を継続するため、装置全体として完全な制御の連続性を保つことができる。
以下、本発明をデータ照合方式に適用した実施例2について、図2に従って具体的に説明する。この実施例2は、2系統のバスを有するフェールセーフシステムであるが、前記実施例1と同様に、従来技術に記載したような3系統若しくはそれ以上の系統のバスを有するシステムについても、適用可能である。
(1)実施例2の構成
図1において、符号1AはA系のバス、2AはB系のバスである。これら各系統のバス1A,1Bには、それぞれCPUデバイス2A,2Bと、1個あるいは複数個のメモリデバイス3A,3Bが接続されている。各系統のCPUデバイス2A,2Bには、処理データの中でシステム上の重要データと位置付けられるデータを一定周期または不定期に記憶させるための共通メモリ30が接続されている。実施例2では、この共通メモリとして、DPRAM(Dual Port Random Access Memory)を使用する。
各系統のCPUデバイス2A,2Bには、前記共通メモリ50に記憶されたシステム上の重要データと位置付けられるデータと、各系統のCPUデバイス2A,2Bのデータとを、同一時間上において比較検定(照合)する間欠検定処理部40が接続されている。前記間欠検定処理部40は、検定結果の出力部と、エラー判定の際にエラー検出を示すトリガの出力部が設けられている。間欠検定処理部40のエラー検出トリガの出力部は、出力されたトリガに従い各系統のCPUデバイス2A,2Bをリセットするリセット処理部5に接続されている。このリセット処理部5の出力側は、各系統のCPUデバイス2A,2Bに接続されている。
前記実施例1と同様に、各系統のバスには、CPUデバイス2A,2Bのリセット処理後に所定のアドレスから処理を再開するためのデータ及びアドレス記録部6が接続されている。このデータ及びアドレス記録部6は、前記リセット処理部5によってCPUデバイス2A,2Bがリセットされた時点で処理されていたデータ及びその書き込みあるいは読み出しのアドレスを記憶する。
(2)実施例2の作用
前記のような構成を有する実施例2においては、共通メモリ30にシステム上の重要データと位置付けられるデータを一定周期または不定期に記憶させる。そして、それぞれのCPUデバイス2A,2Bにおいては、自系データと他系データの記憶値が一致であれば正常動作と判定し、不一致であればA系/B系いずれかのデバイスもしくはバス上に異常が発生したと判定する。
正常動作の判定であれば、A系/B系それぞれのCPUデバイス2A,2Bはフェールセーフ性が確保される励振信号(交番信号)を間欠検定処理部40に対して同時に書き込む。この正常動作は、不一致を検出して励振信号を停止するまで継続される。図4のデータ照合方式において、異常が発生したと判定された装置は、やがて安全側制御へと移行し、一般的にはリカバリー処理は許可しない。
しかし、実施例2の構成においては、間欠検定処理部40は、不一致と判定した瞬間のトリガ情報をリセット処理部5へ送信し、いずれかのCPUデバイスもしくは両系のCPUデバイスにリセット信号を発生させる。リセットされたCPUデバイス2A,2Bは初期状態から再起動し、その後、データ及びアドレス記録部6に蓄積された最終のデータ値とアドレス値を読み込むことにより、制御の連続性を妨げないリカバリー処理を実施する。
(3)実施例2の効果
前記のような構成並びに作用を有する実施例2においても、データ及びアドレス記録部6を設けることにより、異常が発生する直前までの処理に瞬時にリカバリーし、制御の連続性を保持することができる。また、両系へのリセット指令ではなく、異常が発生したどちらかのみのCPUへリセット指令を発効すれば、正常なCPUは今までの制御処理を継続するため、装置全体として完全な制御の連続性を保つことができる。
1A,1B…A系バス,B系バス
2A,2B…CPUデバイス
3A,3B…メモリデバイス
4…連続検定処理部
5…リセット処理部
6…データ及びアドレス記憶部
30…共通メモリ
40…間欠検定処理部

Claims (2)

  1. 複数の系統を備え、それぞれの系統がデータ通信用のバスと、このバスに接続されたCPUデバイス及びメモリデバイスを備え、各系統には各系統のバス間の情報を比較して検定する連続検定処理部を接続し、この連続検定処理部において各バス間の情報が不一致の場合にエラーとの判定を行うフェールセーフコンピュータシステムにおいて、
    前記連続検定処理部によるエラーと判定された際のトリガ情報に基づいて、いずれかのCPUもしくは両系CPUにリセット信号を発生するリセット処理部と、
    そのリセット処理後に所定のアドレスから処理を再開するために必要な情報を記録するデータ及びアドレス記録部を有することを特徴とするフェールセーフシステム。
  2. 複数の系統を備え、それぞれの系統がデータ通信用のバスと、このバスに接続されたCPUデバイス及びメモリデバイスを備え、各系統には比較対象となるデータを記憶する共通メモリと、各系統各系のCPUの入力情報と前記共通メモリに記憶されているデータとを間欠的に比較検定する間欠検定処理部を接続し、この間欠検定処理部において前記記憶データと入力情報が不一致の場合にエラーとの判定を行うフェールセーフコンピュータシステムにおいて、
    前記間欠検定処理部によるエラーと判定された際のトリガ情報に基づいて、いずれかのCPUもしくは両系CPUにリセット信号を発生するリセット処理部と、
    そのリセット処理後に所定のアドレスから処理を再開するために必要な情報を記録するデータ及びアドレス記録部を有することを特徴とするフェールセーフシステム。
JP2009246675A 2009-10-27 2009-10-27 フェールセーフシステム Pending JP2011095837A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009246675A JP2011095837A (ja) 2009-10-27 2009-10-27 フェールセーフシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009246675A JP2011095837A (ja) 2009-10-27 2009-10-27 フェールセーフシステム

Publications (1)

Publication Number Publication Date
JP2011095837A true JP2011095837A (ja) 2011-05-12

Family

ID=44112699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009246675A Pending JP2011095837A (ja) 2009-10-27 2009-10-27 フェールセーフシステム

Country Status (1)

Country Link
JP (1) JP2011095837A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015177927A1 (ja) * 2014-05-23 2015-11-26 株式会社日立製作所 情報処理装置
JP2016110502A (ja) * 2014-12-09 2016-06-20 株式会社デンソー 電子制御装置
CN110651259A (zh) * 2017-06-14 2020-01-03 日立汽车系统株式会社 车载设备的控制装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0695902A (ja) * 1992-09-17 1994-04-08 Hitachi Ltd プロセッサ二重化方式の情報処理装置
JP2005049967A (ja) * 2003-07-30 2005-02-24 Toshiba Corp フェイルセーフプロセッサ及び鉄道用保安制御装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0695902A (ja) * 1992-09-17 1994-04-08 Hitachi Ltd プロセッサ二重化方式の情報処理装置
JP2005049967A (ja) * 2003-07-30 2005-02-24 Toshiba Corp フェイルセーフプロセッサ及び鉄道用保安制御装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015177927A1 (ja) * 2014-05-23 2015-11-26 株式会社日立製作所 情報処理装置
JP2016110502A (ja) * 2014-12-09 2016-06-20 株式会社デンソー 電子制御装置
CN110651259A (zh) * 2017-06-14 2020-01-03 日立汽车系统株式会社 车载设备的控制装置
CN110651259B (zh) * 2017-06-14 2023-12-01 日立安斯泰莫株式会社 车载设备的控制装置

Similar Documents

Publication Publication Date Title
US9417946B2 (en) Method and system for fault containment
JP5973196B2 (ja) 1553バス動作の自己検査のためのシステムおよび方法
US9069953B2 (en) Method for checking data consistency in a system on chip
US8499193B2 (en) Integrated dissimilar high integrity processing
CN101313281A (zh) 用于在包括至少两个具有寄存器的执行单元的系统中消除错误的装置和方法
CN101349905A (zh) 引擎控制模块的双核体系结构
CN105868060B (zh) 用于运行驾驶员辅助系统的数据处理单元的方法和数据处理单元
US10191670B2 (en) Method and device of data protection, storage equipment
JP5341928B2 (ja) 時間的に分離した冗長プロセッサの実行を使用しての周辺機器への読み書き
CN106815153B (zh) 一种安全存储方法、装置和系统
JP2011095837A (ja) フェールセーフシステム
CN102521086B (zh) 基于锁步同步的双模冗余系统及其实现方法
US8392642B2 (en) Timeout preventing device, a timeout preventing method and a program thereof
US20200409773A1 (en) Safety monitor for incorrect kernel computation
CN103144657B (zh) 带校验板的通用轨旁安全平台主处理子系统
JP2006344087A (ja) 制御装置のタスク管理装置、及び、制御装置のタスク管理方法
US11113099B2 (en) Method and apparatus for protecting a program counter structure of a processor system and for monitoring the handling of an interrupt request
JP2010102565A (ja) 二重化制御装置
JP4876093B2 (ja) 制御装置のタスク管理装置、及び、制御装置のタスク管理方法
JP6332134B2 (ja) メモリ診断回路
JP2008192108A (ja) 二重化情報処理システム
JP2006338425A (ja) 制御装置
CN107423029B (zh) 计算单元
JP2006011576A (ja) 高信頼性制御装置
WO2016042751A1 (ja) メモリ診断回路

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140513