JPS622339A - 処理装置の立上げ処理方法 - Google Patents

処理装置の立上げ処理方法

Info

Publication number
JPS622339A
JPS622339A JP60140485A JP14048585A JPS622339A JP S622339 A JPS622339 A JP S622339A JP 60140485 A JP60140485 A JP 60140485A JP 14048585 A JP14048585 A JP 14048585A JP S622339 A JPS622339 A JP S622339A
Authority
JP
Japan
Prior art keywords
page
main memory
system program
address
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60140485A
Other languages
English (en)
Inventor
Yoshihiro Miyazaki
義弘 宮崎
Masayuki Tanji
雅行 丹治
Atsuhiko Nishikawa
敦彦 西川
Soichi Takatani
高谷 壮一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60140485A priority Critical patent/JPS622339A/ja
Publication of JPS622339A publication Critical patent/JPS622339A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、処理装置の立上げ処理方法にかかわり、特に
ワークステーション等の再立上げの許容されるシステム
で主メモリエラー発生により動作を停止した後の再立上
げ時の処理方法に関する。
〔発明の効果〕
処理装置内の主記憶の高信頼化については、例えば公知
例1 rICマニュアル(富士通)」のP。
10−1〜P、10−18  に示されるような誤り訂
正符号(FCC)を用いた1ビット自動修正力式が知ら
れている。この方式を使用すれば、故障率5 fitの
ダイナミックRAMを約300個使ったシステムの1年
間の故障率は約3 X 10−”であり信頼性上の問題
はない、しかしデータ16ビツトに対し6ビツトもの冗
長ビットを付加するため、価格の上昇、1ボードに実装
できる記憶容量減少という欠点がある。また、公知例2
「マニュアルHITACM −240H,システム概説
」のP62〜63に示されている方式、即ち故障の発生
したページを切離し、新たなページを確保する方式を採
れば、1ビツトの冗長ビットで済むパリティチェック方
式でよく1価格の上昇はない、しかしページの管理を行
うシステムプログラムが走る主記憶上のエリア内で発生
した故障に対してはバックアップできない。従って故障
率5 fitのダイナミックR′AM17個をシステム
プログラムの走るエリアに用いたとすると、このエリア
に対しては何の対策もないから、1年間の故障率は約0
.0007となる。もし、このようなシステムを100
0台フィールドに出せば、1年間にいずれかのシステム
がダウンする確率は約0.7であり、信頼性が不充分で
ある。
〔発明の目的〕
本発明の目的は、上記故障発生ページを切離す方式に於
て、主メモリ上のシステムプログラム領域故障時にも直
ちに復旧して処理動作を継続できる処理装置の立上げ処
理方法を提供するにある。
〔発明の概要〕
本発明は、故障発生ページを切はなす方式に於て、両立
上げ時にメモリ配置を自動変更するためのアドレス一部
変更手段を付加し、ページ管理を行うシステムプログラ
ムが走るエリア内で故障が発生しダウンした場合であっ
ても、再立上げ時にシステムプログラムが故障発生エリ
アとは異るエリアに自動的に割付けられるようにしたこ
とを特徴とするものである。
〔発明の実施例〕
本発明の実施例を以下に説明する。第1図は、例えば公
知例3rマニュアルHIIACE −7100処理装置
 解説書」の図1.2−3に示された処理装置に本発明
を適用した場合の主記憶1の内部構成を示すもので1通
常の処理装置における誤り訂正機構の代わりにパリティ
機構6が設けられ、またアドレス一部変更機構8が新た
に加えられている。
主記憶1の主要構成を成すダイナミックRAM2はデー
タ用16ビツト対応部とパリティ用1ビツト対応部に分
割される。ダイナミックRAM制御機構5はインターフ
ェイス4を介してダイナミックRAM2のアクセスを制
御し、また、リフレッシュの制御も行う、パリティ機構
6は、主記憶1のリードアクセス時にダイナミックRA
M12からの読出しデータをパリティビットを含めてチ
ェックし、パリティエラーの場合はパリティエラー信号
9がオンする。主記憶1のライトアクセス時は、ダイナ
ミックRAM制御機構5からインターフェイス4に出力
されたダイナミックRAM書込用データ16のビットに
対してパリティを生成し、インターフェイス4にダイナ
ミックRAM書込用パリティ1ビツトとして出力する0
本発明の特徴とするアドレス一部変更機構8は、インタ
ーフェイス10を介してプロセッサからアクセスされる
アドレスを一部変更し、インターフェイス7を通してダ
イナミックRAM制御機構5に出力する機能を持つ、パ
リティエラー信号9は、アドレス一部変更機構8に入力
される。また同信号9はプロセッサにも返される。プロ
セッサでは、パリティエラーが発生したことを知るとエ
ラー割込を発生してシステムプログラムに報告する。シ
ステムプログラムは公知例2に示す如く、そのページを
使用禁止とし、別に新たなページを確保し、必要に応じ
て磁気ディスク等の補助記憶装置から新たなページに再
ロードし、処理を一続行することができる。しかし、ペ
ージを管理するシステムプログラムの使用エリアでのパ
リティエラー発生時はプロセッサは即時に停止する。停
止した場合、ユーザーは公知例3に示されるようなコン
ソールパネルのリセットスイッチを押して再立上げを試
みることができる。なお、リセットスイッチを押したと
き、リセット信号11がオンする。
第2図は、アドレス一部変更機構8の内部構成を示す。
プロセッサとのインターフェイス10上のアドレス信号
21、データ信号24.起動信号25、書込みファンク
ション信号26、応答信号27は、アドレス信号21を
除き、ダイナミックRAM制御機構5とのインターフェ
イス7上の同類の信号と同一である。アドレス信号の一
部の信。
号33のみEOR(排他的論理)ゲート34に入力され
、その出力がインターフェイス7上のアドレス信号23
の一部になっている。前記ゲート34のもう一方の入力
32がOのとき信号22は信号33に等しく(スルーモ
ード)、入力32が1のとき信号22は信号33の反転
したものになる(反転モード)。DT形フリップフロッ
プ28は、そのD入力にパリティエラー信号9.T入力
に応答信号27が接続されている。従ってその出力29
は最新の主メモリへのアクセスがパリティエラーでなか
ったときO,パリティエラーであったとき1である。別
のDT形ツブリップフロップ31そのD入力に自フリッ
プフロップの否定出力が接続され、T入力に前記フリッ
プフロップの出力29とリセット信号11のアンドをと
った信号30が接続されている。従ってその出力32は
、最新の主メモリへのアクセスがパリティエラーの場合
にリセットが行われると1反転(1ならば0゜0ならば
1)する。
第3図に、スルーモード(信号32=O)の場合と1反
転モード(信号32=1)の場合の、主メモリアドレス
と実際のダイナミックRAM2との対応を示す。スルー
モードの場合1例えば主メモリアドレスoooooo〜
IFFFFFはダイナミックRAM2のMaブロックに
対応し、200000〜3 FFFFFはMbブロック
に対応しているが、反転モードの場合は逆になる。従っ
て、ダイナミックRAM2のMaブロックの中で回復不
可能なエラーが発生したとき、スルーモードでは主メモ
リアドレスoooooo〜I FFFFFの中のいずれ
かのアドレスが使用不可となるに対し、反転モードでは
主メモリアドレス200000〜3 FFFFFの中の
いずれかのアドレスが使用不可となる。
第4図は、後述のページ管理用のシステムプログラムが
使用する。主メモリ管理テーブルの構成を示す6本テー
ブルはページ管理用のシステムプログラムと共に、主メ
モリの最初の2Mバイト即ち主メモリアドレスoooo
oo〜I FFFFF内に配置される。主メモリアドレ
ス200000〜FFFFFFまでは4にバイト(本実
施例ではページサイズ=4にバイト)毎にページ番号が
付けられている。従ってページ番号は200〜FFFま
でである。主メモリ管理テーブルは各ページ毎に有効ビ
ットV、ユーザ一番号UN、仮想ページVPAGE! 
、パリティエラーPEという情報を持つ、有効ビットV
はそのコラムの他の情報が有効であるかどうかを示す。
ユーザーの番号UNは、そのページを使用中のユーザー
の番号(ただし0のときは空き)、仮想ページVPAG
Eはこのページに対応する論理アドレスのページ番号、
パリティエラーPEは、それが1のときそのページにお
いてパリティエラーが発生したので使用禁止状態である
ことを示す。
第5図に、ページ管理用のシステムプログラムのフロー
チャートを示す、パリティエラーが発生して割込みがか
けられるとスタートし、ステップ41ではシステムプロ
グラム実行中かどうか判定する。システムプログラム実
行中ならばプロセッサは停止する。そうでない場合ステ
ップ42に進む、ステップ42では、パリティエラーの
発生したページを算出する0次のステップ43では、主
メモリ管理テーブルの同ページに対応するエントリ(エ
ントリAとする)のパリティエラーPEを1にセットし
、このページを使用禁止状態にする。
次のステップ44では、主メモリ管理テーブルのUN=
O(空き)、PE=Oのエントリを探す。
その結果選択されたエントリをエントリBとする。
次のステップ45ではエントリBのU N 、 VPA
GII!にエントリAのU N 、 VPAGEをセッ
トする。即ち、別に新たなページを確保し、障害発生ペ
ージをこれに割当てる0次のステップ46では、UN。
VPAGEを参照して、磁気ディスク等の補助記憶装置
から新たに確保したページに再ロードする0次のステッ
プ47では、パリティエラーが発生し中断されたユーザ
ープログラムを再起動する。このようにして、ページ管
理のシステムプログラムはパリティエラー発生ページを
再割付、再生し、ユーザーの処理を続行させることがで
きる。この処理は公知例と同じ処理である。
第6図に、システムプログラム使用エリアにパリティエ
ラーが発生した場合の本発明の特徴とする処理フローを
、また第7図にその時の主メモリ割付の動きを示す、今
、スルーモードのときにメモリブロックMaのどこか1
ビツトが故障したとする。すると、システムプログラム
の使用エリアにおいてパリティエラーが発生するので、
まず第5図のステップ41でシステムプログラム実行中
と判定され、ステップ48でプロセッサは停止する。停
止するとユーザーはこのプロセッサ停止をみてコンソー
ルパネルのリセットスイッチをオンし、再立上げを試み
る。すると、第2図で説明した如く、フリップフロップ
31が反転し、反転モードになる。すると、システムプ
ログラム使用エリアを含む主メモリアドレスooooo
o〜I FFFFFにはメモリブロックMbが割付けら
れ、システムプログラムの使用しない主メモリアドレス
2000000〜3 FFFFFにメモリブロックMa
が割付けられる。
(第7図の入れ替えEt)ブロックMbはその全ビット
が正常のため、パリティエラーは発生せず、システムプ
ログラムは実行可能である。従ってステップ53で磁気
ディスク等の補助記憶装置よりシステムプログラムを再
ロードし、ステップ54でユーザープログラムの実行を
開始する。ところが、主メモリアドレス200000〜
3 FFFFFに割当てられたメモリブロックMaは1
ビツト故障しているので、いずれそこを使用するユーザ
ープログラムでパリティエラーが発生するが、この時は
第5図のプログラムが起動され、システムプログラム実
行中ではないので第5図で説明したようなエラー発生ペ
ージの使用禁止を新たなページの確保(第7図のEs)
−再生、ユーザープログラムの再起動が行われる。この
ようにして、システムプログラム使用エリアで1ビツト
故障が発生しても、わずかなダウン時間で処理の再開が
できる。
(発明の効果〕 以上のように、本発明によれば、パリティチェックのみ
を用いた簡単で低価格の主メモリ構成において、1ビツ
ト故障がたとえシステムプログラムの使用エリアで発生
したとしても、わずかなダウン時間(瞬時停電の場合と
ほぼ同一)で処理の再開ができ、保守員到着までシステ
ムが使えず、ユーザーの仕事が止まってしまうという不
具合の発生を防止することができる。
【図面の簡単な説明】
第1図は、本発明を適用した主メモリの内部構成図、第
2図はアドレス一部変更機構の内部構成例を示す図、第
3図はスルーモード/反転モードの主メモリアドレスと
実際のRAMとの対応図、第4図は主メモリ管理テーブ
ルの構成図、第5図はページ管理用システムプログラム
のフローチャート、第6図及び第7図はシステムプログ
ラム使用エリアにパリティエラーが発生した場合の処理
フロー図、及び主メモリ割付の動きを示す図である。 1・・・主記憶、2・・・ダイナミックRAM、8・・
・アドレス一部変更機構、28,31・・・DTフリッ
プフロップ、34・・・排他的論理和ゲート。

Claims (1)

    【特許請求の範囲】
  1. 1、ページ単位に分割された主メモリ上の、システムプ
    ログラムを格納していないページの故障が検出された時
    には、当該ページを他の正常な空きページに置きかえて
    処理を続行可能とする回復機能を有した処理装置の立上
    げ処理方法に於て、主メモリへのアクセスアドレスの一
    部を変更することによってアクセスアドレスと主メモリ
    の実空間との対応をページ単位で変更するアドレス一部
    変更手段を設け、システムプログラムを格納したページ
    の故障が検出されてプロセッサ動作が停止しかつコンソ
    ールから再立上げ操作が指示された時には、上記アドレ
    ス一部変更手段を作動せしめてアクセスアドレスと主メ
    モリ実空間との対応を変更することによってシステムプ
    ログラムを正常なページへロードして再起動可能とした
    ことを特徴とする処理装置の立上げ処理方法。
JP60140485A 1985-06-28 1985-06-28 処理装置の立上げ処理方法 Pending JPS622339A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60140485A JPS622339A (ja) 1985-06-28 1985-06-28 処理装置の立上げ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60140485A JPS622339A (ja) 1985-06-28 1985-06-28 処理装置の立上げ処理方法

Publications (1)

Publication Number Publication Date
JPS622339A true JPS622339A (ja) 1987-01-08

Family

ID=15269699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60140485A Pending JPS622339A (ja) 1985-06-28 1985-06-28 処理装置の立上げ処理方法

Country Status (1)

Country Link
JP (1) JPS622339A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6170039B1 (en) 1997-05-16 2001-01-02 Nec Corporation Memory controller for interchanging memory against memory error in interleave memory system
US8051333B2 (en) 2007-02-13 2011-11-01 Nec Corporation Memory failure recovery method, information processing apparatus, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6170039B1 (en) 1997-05-16 2001-01-02 Nec Corporation Memory controller for interchanging memory against memory error in interleave memory system
US8051333B2 (en) 2007-02-13 2011-11-01 Nec Corporation Memory failure recovery method, information processing apparatus, and program

Similar Documents

Publication Publication Date Title
US10459814B2 (en) Drive extent based end of life detection and proactive copying in a mapped RAID (redundant array of independent disks) data storage system
US7058782B2 (en) Method and apparatus for coordinating dynamic memory deallocation with a redundant bit line steering mechanism
US5805790A (en) Fault recovery method and apparatus
US4674038A (en) Recovery of guest virtual machines after failure of a host real machine
US6038680A (en) Failover memory for a computer system
US6408400B2 (en) Disk array device
US4351023A (en) Process control system with improved system security features
CN109614276B (zh) 故障处理方法、装置、分布式存储系统和存储介质
EP0433979A2 (en) Fault-tolerant computer system with/config filesystem
US5734814A (en) Host-based RAID-5 and NV-RAM integration
US20040078663A1 (en) Information processing system and disk control method used in the same
JPH07500203A (ja) ロールバックのためのデータ・バックアップ・システム
JPH04338849A (ja) 記憶エラー訂正方法及び過剰エラー状態を報告する方法
JPS61502223A (ja) 再構成可能なデュアル・プロセッサ・システム
US5632013A (en) Memory and system for recovery/restoration of data using a memory controller
EP0683456B1 (en) Fault-tolerant computer system with online reintegration and shutdown/restart
US7130973B1 (en) Method and apparatus to restore data redundancy and utilize spare storage spaces
US7389446B2 (en) Method to reduce soft error rate in semiconductor memory
JPS622339A (ja) 処理装置の立上げ処理方法
US5621887A (en) Fault tolerant disk management system which tests failed disks during varied time intervals which are based upon the criticality associated with the failed disks
JPH07121315A (ja) ディスクアレイ
JPH05265876A (ja) エラー報告処理方式
JPS6326407B2 (ja)
JPH11259323A (ja) マルチモジュールマシンにおける重要データの管理のためのアーキテクチャ及びこのようなタイプのアーキテクチャを実施するための方法
JPS59180897A (ja) バツテリバツクアツプメモリの二重化方式