JPH03269745A - 二重化プロセッサシステム - Google Patents

二重化プロセッサシステム

Info

Publication number
JPH03269745A
JPH03269745A JP2070080A JP7008090A JPH03269745A JP H03269745 A JPH03269745 A JP H03269745A JP 2070080 A JP2070080 A JP 2070080A JP 7008090 A JP7008090 A JP 7008090A JP H03269745 A JPH03269745 A JP H03269745A
Authority
JP
Japan
Prior art keywords
memory
contents
data
repair
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2070080A
Other languages
English (en)
Inventor
Hideo Sano
秀雄 佐野
Yoshiji Fukai
深井 吉士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2070080A priority Critical patent/JPH03269745A/ja
Publication of JPH03269745A publication Critical patent/JPH03269745A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は、それぞれメモリを有する二重化構成のプロセ
ッサと、これらの二重化されたプロセッサのどちらかを
稼動状態(制御状態)、どちらかを待機状態にするかの
制御を行う二重化制御部とでm戒される二重化プロセッ
サシステムに関し、さらに詳しくは、この様な二重化プ
ロセッサシステムにおいて、メモリのトランジェントな
エラー(パリティエラーやECCなと)の修復に関する
ものである。
〈従来の技術〉 従来より、プロセッサシステムの信頼性を高めるために
、待機冗長形の二重化プロセッサシステムが採用されて
いる。
第8図は、例えば「特公昭61−19060号」公報に
開示されている二重化プロセッサシステムの構成概念図
である。
このシステムは、2台のプロセッサPC1,PC2と、
これらのプロセッサの動作を監視し、どちらか一方のプ
ロセッサを実作業につかせ、他方プロセッサを待機状態
になるように制御する二重化制御部DXで構成されてい
る。
二重化制御部DXは、一方のプロセッサが故障した場合
に、待i側のプロセッサが連続性を維持ながら制御状態
を引継ぎできるようにするために、それぞれのプロセッ
サにつながるメモリMl、M2の内容を一致させるため
のメモリ等値化手段や、プロセッサ、メモリの自己診断
結果に基づいて制tXlflの切換えを行う制御権切換
え手段が設けられている。
〈発明が解決しようとする課題〉 この様な構成の二重化システムにおいて、二重化制御部
DXは、例えば、制御部のメモリの自己診断でパリティ
エラーが発生すると、即座に制御権を交代させ、それま
で待機側であったプロセッサが制御を続行するように、
また、待機側のメモリの自己診断でパリティエラーが発
生すると、即座に待aOlを停止させるように構成され
ている。
したがって、ノイズなどの一時的な要因によって、トラ
ンジェントなパリティエラーが発生したときなど、回復
可能なものについても一方のプロセッサの動作が停止す
ることとなり、二重化構成のプロセッサの一方が停止し
ている期間が長くなって信頼性を高める上で問題であっ
た。
本発明は、この様な問題点に鑑みてなされたもので、そ
の目的は、メモリの自己診断でトランジェントなエラー
が発生したような場合、そのアドレスのデータを正規に
修復できるようにし、二重化システムをできるだけ長い
時間維持できるようにして信頼性を向上させることを目
的とする。
〈課題を解決するための手段〉 前記した課題を解決する本発明は、 それぞれメモリを有する二重化構成のプロセッサと、こ
れらの二重化されたプロセッサのどちらかを稼動状態(
制御状態)、どちらかを待機状態にするかの制御を行う
二重化制御部とで構成される二重化プロセッサシステム
において、前記各プロセッサに、 自分のメモリの診断を行うメモリ診断手段と、このメモ
リ診断手段が異常を検出したのを受けメモリの内容を修
復しても問題ないか否か判断するメモリ内容修復判断手
段と、 このメモリ内容修復判断手段で、修復が問題ないと判断
されると、前記二重化制御部を介して待機側のメモリか
ら正規のデータを取出し、当該データを異常が発生した
アドレスに書込んでメモリ内容を修復するメモリ修復手
段と、 を設けて構成される。
く作用〉 2つのプロセッサは二重化制御部からの制御権を示す信
号にしたがって一方が制御状態に、他方が一方のプロセ
ッサの故障に備えて待機状態になっている。この間、2
つのプロセッサ内のメモリ内容は、二重化制御部のメモ
リ等値化手段により常に同じになるように等値化されて
いる。
メモリ診断手段は、メモリ診断を例えば一番優先順位の
低いタスクとして実施しており、パリティエラー等のエ
ラーを検出すると、エラー検出をメモリ内容修復判断手
段に伝える。
メモリ内容修復手段は、メモリの内容を修復しても問題
ないか否かを判断する。
メモリ修復手段は、メモリ内容を修復しても問題ないと
判断された場合、二重化制御部を介して待m側のメモリ
から異常が検出されたアドレスと同じアドレスから正規
のデータを取出し、そのデータを異常が発生したアドレ
スに書込んでメモリ内容を修復する。
〈実施例〉 以下図面を用いて、本発明の実施例を詳細に説明する。
第1図は、本発明の一実腫例を示すm戒ブロック図であ
る0図において、PCI、PO2はそれぞれメモリM1
.M2を有する二重化構成のプロセッサ、DXはこれら
の二重化されたプロセッサPct、PO2に対してデー
タバスBSを介して接続された二重化制御部で、2つの
プロセッサのどちらかを稼動状態(制御状B)、どちら
がを稼動状態にあるプロセッサの故障に備えて待機状態
にするかの制御を行うものである。
この二重化制御部DXは、各プロセッサから動作状態を
示すレディ信号RDYを受け、制御権を与えるための信
号DO3を出力する制御権切換え手段21、各プロセッ
サからアクセスが可能な共有メモリを有し、この共有メ
モリを介して各プロセッサ内のメモリからデータの取出
し/書き込みを行うデータ取出し手段22、各プロセッ
サ内のメモリ内容を一致させるためのメモリ等値化手段
23等を備えている。
各プロセッサPct、PO2において、11は自分のメ
モリMl (M2)の診断を行うメモリ診断手段、12
はこのメモリ診断手段11が異常を検出したのを受け、
メモリの内容を修復しても問題ないか否か判断するメモ
リ内容修復判断手段、13はメモリ内容修復判断手段1
2で、修復が問題ないと判断された場合、二重化制御部
DXを介して待inのメモリから異常が検出されたアド
レスと同じアドレスから正規のデータを取出し、そのデ
ータを異常が発生したアドレスに書込んでメモリ内容を
修復するメモリ修復手段である。
このように構成した装置の動作を次に説明する。
第2図は、各プロセッサPct、PO2において、メモ
リ診断手段11.メモリ内容修復判断手段12.メモリ
修復手段13の動作を示す概念図で、各手段11〜13
はいずれもプログラムによって実現される。
第3図は、その動作を示す概略フローチャートである。
制御権のあるプロセッサにおいて、メモリ診断手段11
は、例えばプライオリティが最下位のタスクとなってい
て、このメモリ診断のためのプログラムが起動されると
、自分のプロセッサ測メモリMに対して、アドレスを順
次更新しながらそこに格納されているデータを例えば2
バイトづつ読出し診断を行う(ステップ1.2)。
このようなメモリ診断の実行中にエラーが検出されると
、次に、メモリ内容修復判断手段12の一部として機能
するエラー処理1のプログラムが起動される。
エラー処理1のプログラムでは、エラー発生がパリティ
エラーであるか判断し、パリティエラーである場合、メ
モリの内容を再度読出しメモリ診断を再試行する(ステ
ップ3.4〉。ここで正常と判断されればステップ2に
戻る。
再試行の結果でも、エラーが発生した場合は、続いてメ
モリ内容修復判断手段12の一部として機能するエラー
処理2のプログラムが起動される。
エラー処理2のプログラムでは、エラー発生がパリティ
エラーであるか再び判断し、パリティエラーである場合
、それが未使用のデータベースか判断し、未使用でない
場合、次にシステムがシングルシステム(一つのプロセ
ッサで動作している状態)か、二重化構成か判断し、二
重化構成となっている場合、続いて、自分が制御側であ
って二重化制御部DX及び待IHmプロセッサが故障し
ていないか判断する(ステップ6.7.8>。
ステップ6で未使用のデータベースである場合は、”O
Jを書き込む処理を行う(ステップ9)。
また、ステップ7でシングルシステムであると判断され
た場合、および二重化制御部DX及び待Ilrmプロセ
ッサが故障していると判断された場合は、そのことを示
すメツセージを送出する〈ステップ10)。
ステップ8で、二重化制御部DX及び待amプロセッサ
が正常であると判断されると、次に、エラーが発生した
部分がプログラム領域か否か、自分が制御側にあるか否
か判断する(ステップ11゜12)。
ステップ11.12でプログラム領域で、かつ自分が制
御側にあると判断されると、メモリ内容を修復しても問
題ないとして、待機側からデータを取出しそのデータを
自分の開のメモリに書き込むメモリ修復処理を行う(ス
テップ13)。
ステップ11において、プログラム領域でないと判断さ
れる(データ領域であると判断される)と、続いて、自
分が待機側にあるのか否か、書換え可能かを判断する(
ステップ14.15>。
自分が待機側であって、書換え可能と判断されると、メ
モリ内容を修復しても問題ないとして、制御側からデー
タを取出しそのデータを書き込むメモリ修復処理を行う
(ステップ16)。
なお、ステップ3.5において、パリティエラーでない
場合、エラーの発生原因は重要な事項であると判断し、
システムを停止するようになっている。
第4図は、第3図のステップ16における制御側からデ
ータを取出して書き込む処理の詳細を示すフローチャー
トであり、第5図は、二重化制御部DXにおいて、デー
タ取出し手段22が行う待aamからデータを取出す動
作を示すフローチャートである。
制御側プロセッサのメモリ修復手段13は、はじめに、
取出したいデータのアドレスを、二重化制御部DX内の
共有メモリのアドレス部に設定し、続いて共有メモリの
コマンド部にデータの読出しを指示するコマンド’$8
000Jを設定する(ステップ17.18)。
二重化制御部DXのデータ取出手段22は、第5図のス
テップ31に示すように、共有メモリのコマンド部にデ
ータの読出しを指示するコマンドr$80004が設定
されたか否か判断していて、このコマンドが設定される
と、アドレス部で指定されたアドレスからメモリ内容を
読出し、それをデータ部に設定する(ステップ32)。
続いて、コマンド部にデータ設定完了を示すコマンド「
$0080Jを設定する(ステップ33)。
第4図に戻り、ステップ1つでコマンド部に1’$00
80」が設定され、データが設定されたと判断されると
、次に、共有メモリのデータ部からステップ32で設定
されたデータを取出し、そのデータを自分〈制61側〉
のメモリに設定する(ステップ20)。
続いて、共有メモリのコマンド部に「0」を設定して(
ステップ21)、リターンする。
第6図は、第4図と第5図の各フローチャートで示す、
待m側メモリから修復のためのデータを読出し、そのデ
ータを制allotメモリに等値化するメモリ修復動作
を、共有メモリ内にm戒された制御側修復用メモリ領域
を中心にして示す概念図である。
ここでは、二重化制御部DXの共有メモリが初期化され
ていないので、使用に先立ってr I STC」を設定
するようにしている。
第7図は、制御側メモ・りから修復のためのデータを読
出し、そのデータを待機間メモリに等値化するメモリ修
復動作を、共有メモリ内に構成された待111測修復用
メモリ領域を中心にして示す概念図である。
ここでは、二重化制御部DXの共有メモリが初期化され
ていないので、使用に先立ってrIC3T」を設定する
ようにしている。
なお、上記の実腫例では、一方のメモリにパリティエラ
ーが発生した場合を想定して説明したが、これ以外に例
えばノイズの影響などによるトランジェントな異常発生
であって、回復可能なエラーについても同様に適用する
ことができる。
〈発明の効果〉 以上詳細に説明したように、本発明によれば二重化構成
のプロセッサシステムにおいて、−時的な要因による異
常発生時に、それが回復可能のものであれば、二重化構
成のままでメモリの修復ができるので、一方のプロセッ
サを停止する必要がなくなり、信頼性を高めることかで
きる。
また、メモリの修復を例えばハードウェアでECC方式
により行うのに比べて、メモリアクセスのスピードを早
くできる上に、全体構成を簡単にできる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すm威ブロック図、 第2図は2つのプロセッサにおいてメモリ診断手段、メ
モリ内容修復判断手段、メモリ修復手段の動作概要を示
す概念図、 第3図はその動作を示す概略フローチャート、第4図は
第3図のステップ16における制御側からデータを取出
して書き込む処理の詳細を示すフローチャート、第5図
は、二重化制御部において、データ取出し手段が行う待
1111JIからデータを取出す動作を示すフローチャ
ート、 第6図は待機間メモリから修復のためのデータを読出し
、そのデータを制御量メモリに等値化するメモリ修復動
作を、制611rpJ修復用メモリ領域を中心にして示
す概念図、 第7図は制御量メモリから修復のためのデータを読出し
、そのデータを待機間メモリに等値化するメモリ修復動
作を、待Il@修復用メモリ領域を中心にして示す概念
図、 第8図は「特公昭61−19060号」公報に開示され
ている二重化プロセッサシステムの構成概念図である。 22・・・データ取出し手段 23・・・メモリ等値化手段 PCI、PO2・・・プロセッサ DX・・・二重化制御部 Ml、M2・・・メモリ 11・・・メモリ診断手段 12・・・メモリ内容修復判断手段 13・・・メモリ修復手段 21・・・制御権切換手段 第 図 第 2図 彎5゛J君1P夜j−−−1・・−fシトJ1門にイワ
“1第 4 図 治・j ぞ即 イ則 第 図 埼↑氏側

Claims (1)

  1. 【特許請求の範囲】 それぞれメモリを有する二重化構成のプロセッサと、こ
    れらの二重化されたプロセッサのどちらかを稼動状態(
    制御状態)、どちらかを稼動状態にあるプロセッサの故
    障に備えて待機状態にするかの制御を行う二重化制御部
    とで構成される二重化プロセッサシステムにおいて、 前記各プロセッサに、 自分のメモリの診断を行うメモリ診断手段と、このメモ
    リ診断手段が異常を検出したのを受けメモリの内容を修
    復しても問題ないか否かを判断するメモリ内容修復判断
    手段と、 このメモリ内容修復判断手段で、修復が問題ないと判断
    されると、前記二重化制御部を介して待機側のメモリか
    ら正規のデータを取出し、当該データを異常が検出され
    たアドレスに書込んでメモリ内容を修復するメモリ修復
    手段と、 を設けたことを特徴とする二重化プロセッサシステム。
JP2070080A 1990-03-20 1990-03-20 二重化プロセッサシステム Pending JPH03269745A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2070080A JPH03269745A (ja) 1990-03-20 1990-03-20 二重化プロセッサシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2070080A JPH03269745A (ja) 1990-03-20 1990-03-20 二重化プロセッサシステム

Publications (1)

Publication Number Publication Date
JPH03269745A true JPH03269745A (ja) 1991-12-02

Family

ID=13421209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2070080A Pending JPH03269745A (ja) 1990-03-20 1990-03-20 二重化プロセッサシステム

Country Status (1)

Country Link
JP (1) JPH03269745A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6237108B1 (en) 1992-10-09 2001-05-22 Fujitsu Limited Multiprocessor system having redundant shared memory configuration
JP2013033402A (ja) * 2011-08-02 2013-02-14 Nec Access Technica Ltd 情報更生装置、メモリ制御システム、情報更生方法およびコンピュータプログラム
US9032190B2 (en) 2009-08-24 2015-05-12 International Business Machines Corporation Recovering from an error in a fault tolerant computer system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5081235A (ja) * 1973-11-16 1975-07-01
JPS55125598A (en) * 1979-03-21 1980-09-27 Fujitsu Ltd Restoration system of memory content
JPS608962A (ja) * 1983-06-29 1985-01-17 Fujitsu Ltd 記憶情報一時障害検出方式
JPS61267844A (ja) * 1985-05-22 1986-11-27 Fuji Electric Co Ltd 耐故障演算制御装置
JPH01295338A (ja) * 1987-12-25 1989-11-29 Fujitsu Ltd 二重化システムの切離し表示フラグオン切換え制御方式

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5081235A (ja) * 1973-11-16 1975-07-01
JPS55125598A (en) * 1979-03-21 1980-09-27 Fujitsu Ltd Restoration system of memory content
JPS608962A (ja) * 1983-06-29 1985-01-17 Fujitsu Ltd 記憶情報一時障害検出方式
JPS61267844A (ja) * 1985-05-22 1986-11-27 Fuji Electric Co Ltd 耐故障演算制御装置
JPH01295338A (ja) * 1987-12-25 1989-11-29 Fujitsu Ltd 二重化システムの切離し表示フラグオン切換え制御方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6237108B1 (en) 1992-10-09 2001-05-22 Fujitsu Limited Multiprocessor system having redundant shared memory configuration
US9032190B2 (en) 2009-08-24 2015-05-12 International Business Machines Corporation Recovering from an error in a fault tolerant computer system
JP2013033402A (ja) * 2011-08-02 2013-02-14 Nec Access Technica Ltd 情報更生装置、メモリ制御システム、情報更生方法およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
EP0889409B1 (en) Mirrored write-back cache module warmswap
US7370248B2 (en) In-service raid mirror reconfiguring
JP2994070B2 (ja) データ処理システムにおけるミラー化された一対のデータ記憶ユニットの状態を決定する方法及び装置
JPH10177498A (ja) フォルトトレラント・コンピュータ・システムのメモリ・マネージメント
JPH07117903B2 (ja) 障害回復方法
JPH1031610A (ja) データベースのデータ回復装置及びその方法
JP2000181887A5 (ja)
US5381544A (en) Copyback memory system and cache memory controller which permits access while error recovery operations are performed
JPH03269745A (ja) 二重化プロセッサシステム
JPS6119061B2 (ja)
JP2000293389A (ja) フォールトトレラントシステムにおけるミラーディスク復旧方式
JPH02294723A (ja) 補助記憶装置の2重化制御方法
JPS6326407B2 (ja)
JPS62115555A (ja) 計算機システムの補助記憶装置2重化管理方法
JPS61136137A (ja) 二重化計算機システム
JPH10187355A (ja) ディスク制御システム
JPS6119060B2 (ja)
JPH0944317A (ja) 代替セクタの登録方式
JPH03204746A (ja) 二重化共有メモリ自己診断方式
JPS63148348A (ja) デ−タ書戻し方式
JPH04125753A (ja) メモリのオンライン診断方式
JP2817458B2 (ja) ディスクキャッシュの再オンライン化システム
JPH0736629A (ja) ディスク障害自動復旧処理方法
JPS5851364A (ja) 二重化周辺記憶制御装置
JPS60112171A (ja) 2重化処理方式