JPH02178861A - 情報処理装置 - Google Patents

情報処理装置

Info

Publication number
JPH02178861A
JPH02178861A JP63331972A JP33197288A JPH02178861A JP H02178861 A JPH02178861 A JP H02178861A JP 63331972 A JP63331972 A JP 63331972A JP 33197288 A JP33197288 A JP 33197288A JP H02178861 A JPH02178861 A JP H02178861A
Authority
JP
Japan
Prior art keywords
storage device
primary storage
fault
page table
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63331972A
Other languages
English (en)
Inventor
Jun Koizumi
純 小泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63331972A priority Critical patent/JPH02178861A/ja
Publication of JPH02178861A publication Critical patent/JPH02178861A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は情報処理装置に関し、特に一次記憶装置の障害
発生時に一次記憶の再構成を行う機能を有する情報処理
装置に関する。
〔従来の技術〕
従来、複数の一次記憶装置を含む情報処理装置において
、オペレーティングシステムの核プログラムおよびその
運用の為のページテーブルが存在する一次記憶装置で障
害が発生した場合、不正な動作の発生を防止する為、中
央処理装置はその旨のメツセージを出力して運転を停止
していた。この場合、保守者は、障害を起こした一次記
憶装置の保守を行い、その保守した一次記憶装置をシス
テムに再び組込み、二次記憶装置からオペレーティング
システムの核プログラムおよびページテーブルを保守後
の一次記憶装置にロードし、その後に中央処理装置の再
立上げを行うことにより、情報処理装置を元の状態に復
旧している。
〔発明が解決しようとする課題〕
従来の情報処理装置は上述したように構成され動作す名
ものであった為、オペレーティングシステムの核プログ
ラムおよびページテーブルの存在する一次記憶装置に障
害が発生した場合、保守者によるその一次記憶装置の保
守等が完了するまでシステムの運用を再開し得す、情報
処理装置の稼働率が低下するという欠点があった。
本発明はこのような従来の欠点を解決したものであり、
その目的は、オペレーティングシステムの核プログラム
およびページテーブルの存在する一次記憶装置に障害が
発生した場合でも自動的な一次記憶再構成によってシス
テムの運用を継続することができる情報処理装置を提供
することにある。
〔課題を解決するための手段] 本発明は上記の目的を達成するために、中央処理装置と
複数の一次記憶装置と二次記憶装置とを含む情報処理装
置において、障害状態記憶部と、前記一次記憶装置の障
害を検出しその障害にかかる情報を前記障害状態記憶部
に登録する障害検出登録手段と、前記障害状態記憶部に
登録された障害情報に基づき障害箇所が使用されず且つ
障害のない一次記憶装置が論理的低位アドレスに割りイ
」けられるようにページテーブルを作成すると共に、こ
の作成したページテーブルおよび前記二次記憶装置に記
憶されたオペレーティングシステムの核プログラムを障
害のない−・次記憶装置に書き込むロード手段と、前記
中央処理装置を再起動する再起動手段とを含む立上げ処
理装置を備えている。
〔作用〕
本発明の情報処理装置においては、一次記憶装置に障害
が発生すると、立上げ処理装置内の障害検出登録手段が
それを検出すると共にその障害にかかる情報を障害状態
記憶部に登録し、次にロード手段が、その登録された障
害情報に基づき障害箇所が使用されず且つ障害のない一
次記憶装置が論理的低位アドレスに割り付けられるよう
にページテーブルを作成すると共にこの作成したページ
テーブルおよび二次記憶装置に記憶されたオペレーティ
ングシステムの核プログラムを障害のない一次記憶装置
に書き込み、次に再起動手段が、中央処理装置を再起動
する。
〔実施例〕
次に、本発明の実施例について図面を参照して詳細に説
明する。
第1図を参照すると、本発明の第1の実施例の情報処理
装置は、内部に第5図に示す如きページテーブルヘース
格納レジスタ201を有する中央処理装置2と、この中
央処理装置2に接続された複数の一次記憶装置3.4と
、中央処理装置2および一次記憶装置3,4に接続され
た立上げ処理装置1と、この立上げ処理装置1に接続さ
れ、第6図に示す如きページテーブル領域501および
オペレーティングシステム(O8)の核プログラム50
2を記憶する二次記憶装置5とで構成されている。また
、同図において、6は中央処理装置2から立上げ処理装
置1へ一次記憶装置3,4の障害通知を行う為の信号線
、8は立上げ処理装置1から一次記憶装置3ヘプログラ
ム等のロードを行う為のデータバス、9は立上げ処理装
置1から一次記憶装置4ヘプログラム等のロードを行う
為のデータバス、10は立上げ処理装置1から中央処理
装置2へのデータバス、11は二次記憶装置5から立上
げ処理装置1へのデータバスである。
なお、本実施例では一次記憶装置3,4の障害にかかる
情報を中央処理装置2が立上げ処理装置1に通知するよ
うにしたが、一次記憶装置3.4自体から立上げ処理装
置1に通知するようにしても良いことは勿論のことであ
る。
第2図を参照すると、立上げ処理装置1は、障害検出登
録手段101と、障害状態記憶部102と、ロード手段
103と、再起動手段104とを含んでいる。
障害状態記憶部102は、第3図に示す如く一次記憶装
置障害情報1021を記憶するものであり、この一次記
憶装置障害情報1021は第4図を参照すると、一次記
憶装置3障害情報フラグ10211と一次記憶装置4障
害情報フラグ10212とで構成されている。
障害検出登録手段101は、信号線6による障害通知に
よって一次記憶装置3または一次記憶装置4の障害を検
出し、その障害光に応じて障害状態記憶部102の一次
記憶装置障害情報1021における一次記憶装置3障害
情報フラグ10211または一次記憶装置4障害情報フ
ラグ10212をセットし、その後にロード手段103
を起動するものであり、その処理例を第7図に示す。
ロード手段103は、障害検出登録手段101からの起
動時、障害状態記憶部102の一次記憶装置障害情報1
021における一次記憶装置3障害情報フラグ1021
1または一次記憶装置4障害情報フラグ10212の状
態に従って、障害の発生した一次記憶装置が使用されず
且つ障害のない一次記憶装置が論理的低位アドレスに割
り付けられるように第6図に示した二次記憶装置5中の
ページテーブル領域501の内容を変更して新たな内容
のページテーブルを作成し、この作成したページテーブ
ルおよび二次記憶装置5に記憶されたO8核プログラム
502を障害のない一次記憶装置に書き込み、その後に
再起動手段104を起動するものであり、その処理の一
例を第8図に示す。
再起動手段104は、ロード手段103からの起動時、
データバス10を介して中央処理装置2の再起動を行う
手段であり、その処理例を第9図に示す。
次に、このように構成された本発明の第1の実施例の動
作を説明する。状況としては、二次記憶装置5のページ
テーブル領域501に記憶された例えば第10図のペー
ジテーブルPTの内容、および同じく二次記憶装置5に
記憶されたO3核プログラム502が一次記憶装置3に
ロートされてシステムが運用されている最中に、その一
次記憶装置3に障害が発生した場合を想定する。
運用中に一次記憶装置3に障害が発生すると、中央処理
装置2は運転を停止し、また立上げ処理装置1に対して
信号線6を通してその障害にかかる情報が通知される。
立上げ処理装置1の障害検出登録手段101は、上記の
障害情報の通知を受けると第7図に示す処理を開始する
。先ず、受は取った障害情報に基づき、障害状態記憶部
102における一次記憶装置障害情報1021中の該当
するフラグ即ちこの場合は一次記憶装置3障害情報フラ
グ10211をセットしく処理1011)、ロード手段
103を起動する(処理1012)。
ロード手段103は起動されると第8図に示す処理を行
う。まず、障害状態記憶部102中の一次記憶装置障害
情報1021を参照して障害のない一次記憶装置4を判
定し、この一次記憶装置4を論理的低位アドレスに割り
付け、且つ障害のある一次記憶装置3を除いた第10図
に示す如きページテープ)L、 P T ’ を作成し
く処理1031)、この作成した新たなページテーブル
PT’ をデータバス11を介して二次記憶装置5のペ
ージテーブル領域501に格納する(処理1032)。
次に、そのページテーブル領域501に格納した新たな
ページテーブルPT’およびO8核プログラム502を
データバス11を介して読み出し、障害の起こっていな
い一次記憶装置4にデータバス9を介してロードする(
処理1033)。そして、ページテーブルFT’が格納
された一次記憶装置4上のアドレスを通知して再起動手
段104を起動する(処理1034)。
起動された再起動手段104は、第9図に示す処理を開
始し、新たなページテーブルPT”の格納された一次記
憶装置4上のアドレスをデータバス10を介して中央処
理装置2内のページテーブルベース格納レジスタ201
に設定しく処理1041)、次いで中央処理装置2に対
し再起動要求を出す(処理1042)。
中央処理装置2は、再起動要求が与えられると、ページ
テーブルベース格納レジスタ201の内容に従い、一次
記憶装置4に格納されているページテーブルPT’ を
参照してオペレーティングシステムの核プログラムを起
動し、システムを再開させる。
以上のように、この第1の実施例によれば、障害のあっ
た一次記憶装置3を使用しないようにページテーブルを
再構成し、この再構成したページチーフルおよびオペレ
ーティングシステムの核プログラムを障害のない一次記
憶装置4にロートし、運用を開始することができる。
なお、障害の生じた一次記憶装置3を保守する場合、一
次記憶装置3はページテーブル上使用していないため、
運用を中止することなく、一次記憶装置3の電源を切断
し、不良箇所の交換を行い、既存のページテーブルPT
’ の後に一次記憶装置3にかかるページテーブル上使
用を付加することにより、保守後の一次記憶装置3をオ
ペレーティングシステムへ組み込むことができる。
以上の動作説明は、オペレーティングシステムの核プロ
グラムおよびページテーブルの存在する一次記憶装置3
に障害が発生した場合のものであるが、それらが存在し
ない一次記憶装置4に障害が発生した場合も同様の動作
が行われる。即ち、本実施例では障害の発生した一次記
憶装置にオペレーティングシステムの核プログラムおよ
びページテーブルが存在するか否かを調べることなく画
一的な処理が行われる。なお、障害の発生した一次記憶
装置にオペレーティングシステムの核プログラムおよび
ページテーブルが存在するか否かを調べ、存在しなけれ
ば核プログラムのロードを省略し再構成したページテー
ブルのみをロードするように構成することもできる。
次に本発明の第2の実施例について説明する。
第2の実施例の情報処理装置が、前述した第1の実施例
の情報処理装置と相違するところは、概ね以下の点であ
る。
■ 一次記憶装置3.4は複数の障害検出単位(MU;
メモリユニット)で構成される。第11図は複数の障害
検出単位で構成された一次記憶装置3,4の構成例を示
しており、次記憶装置3はメモリユニット301〜30
4で構成され、一次記憶装置4はメモリユニット401
〜404で構成されている。障害発生の有無は文字通り
障害検出単位(メモリユニット)毎に可能である。なお
、電源切断等が個別に行え、保守の単位となるものは、
各々の一次記憶装置3.4である。
■ 立上げ処理装置1の障害状態記憶部102には、第
12図に示す如く、一次記憶装置障害情報1021”と
メモリユニット構成情報1022とが格納される。ここ
で、メモリユニット構成情報1022は一次記憶装置3
゜4をどのようなメモリユニットで構成するかを示す情
報である。また一次記憶装置障害情報1021’には第
4図のフラグ10211゜10212に加え各メモリユ
ニット毎にその障害の有無が識別できるようなフラグ(
図示せず)が設けられる。
■ 障害検出登録手段101は、第7図の処理に代えて
第13図の処理を実行する。
■ ロード手段103は、第8図の処理に代えて第14
図の処理を実行する。
次に、この第2の実施例の動作を、第1図2第2図、第
5図、第6図、第9図、第11図乃至第15図を参照し
て説明する。状況としては、二次記憶装置5のページテ
ーブル領域501に記憶された例えば第15図の如き内
容のページテーブルPT、および同じく二次記憶装置5
に記憶されたO8核プログラム502が一次記憶装置3
のメモリユニット301にロードされてシステムが運用
されている最中に、その一次記憶装置3のメモリユニッ
ト302に障害が発生した場合を想定する。
運用中に一次記憶装置3のメモリユニット302に障害
が発生すると、中央処理装置2は運転を停止し、また立
上げ処理装置1に対して信号線6を通じてその障害にか
かる情報が通知される。立上げ処理装置1の障害検出登
録手段101は、」二記の障害情報の通知を受けると第
13図に示す処理を開始する。先ず、受は取った障害情
報に基づき、障害状態記憶部102における一次記憶装
置障害情報1021′中の該当するフラグをセットする
ことにより障害情報の登録を行い(処理1013)、次
にメモリユニット構成情報1022をメモリユニット3
02のみ使用不可(無効)にした構成に変更しく処理1
014)、ロード手段103を起動する(処理1015
)。
ロード手段103は起動されると第14図に示す処理を
行う。まず、障害状態記憶部102中の一次記憶装置障
害情報1021’およびメモリユニット構成情報102
2を参照し、障害のない一次記憶装置4を低位アドレス
に割り付け、且つ一次記憶装置3から障害のあるメモリ
ユニット302のみを除いた第15図に示す如きページ
テーブルPT”を作成しく処理1035)、この作成し
た新たなページテーブルPT“をデータバス11を介し
て二次記憶装置5のページテーブル領域501に格納す
る(処理1036)。次に、そのページテーブル領域5
01に格納した新たなページテーブルPT”およびO8
核プログラム502をデータバス11を介して読み出し
、障害の起こっていない一次記憶装置4のメモリユニッ
ト401にデータバス9を介してロードする(処理10
37)。そして、再起動手段104を起動する(処理1
038)。
起動された再起動手段104は、第9図に示したと同様
の処理を開始し、新たにページテーブルPT”の格納さ
れた一次記憶装置4上のアドレスをデータバス10を介
して中央処理装置2内のページテーブルベース格納レジ
スタ201に設定しく処理1041L次いで中央処理装
置2に対し再起動要求を出す(処理1042)。
中央処理装置2は、再起動要求が与えられると、ページ
テーブルベース格納レジスタ201の内容に従い、一次
記憶装置4に格納されているページテーブルPT’ を
参照してオペレーティングシステムの核プログラムを起
動し、システムを再開させる。
以上のように、この第2の実施例によれば、障害のあっ
た一次記憶装置3の全体を切り離すことなく、障害単位
(メモリユニット)のみを切り離したページテーブルを
再構成し、この再構成したページテーブルおよびオペレ
ーティングシステムの核プログラムを障害のない一次記
憶装置4にロードし、運用を開始することができる。こ
の第2の実施例は第1の実施例の如(障害の生じた一次
記憶装置全体を切り離す必要がないので、残りの正常な
メモリユニットの有効利用が可能になるという効果があ
る。
なお、障害の生じた一次記憶装置3を保守する場合、メ
モリユニット301,303,304をオペレーティン
グシステムより切り離し、一次記憶装置3の電源を切断
し、不良箇所の交換を行い、交換後、メモリユニット3
01,303,304をオペレーティングシステムに組
み込み、メモリユニット302は既存のページテーブル
PT’ の後にそれにかかるページテーブルワードを付
加するごとによりオペレーティングシステムへ組み込む
以上の動作説明は、オペレーティングシステムの核プロ
グラムおよびページテーブルの存在する一次記憶装置3
に障害が発生した場合のものであるが、それらが存在し
ない一次記憶装置4に障害が発生した場合も同様の動作
が行われる。即ち、本実施例でも障害の発生した一次記
憶装置にオペレーティングシステムの核プログラムおよ
びページテーブルが存在するか否かを調べることな(画
一的な処理が行われる。前述したと同様に、障害の発生
した一次記憶装置にオペレーティングシステムの核プロ
グラムおよびページテーブルが存在するか否かを調べ、
存在しなければ核プログラムのロードを省略し再構成し
たページテーブルのみをロードするように構成すること
もできる。
〔発明の効果〕
以上説明したように、本発明の情報処理装置においては
、オペレーティングシステムの核プログラムおよびペー
ジテーブルの存在する一層記1:a装置に障害が発生し
た場合、障害箇所すなわち障害のある一次記憶装置全体
あるいは障害検出単位が使用されず且つ障害のない一次
記憶装置が論理的に低位アドレスに割り付けられるよう
にページテーブルを作成し、このページテーブルおよび
二次記憶装置に記憶されたオペレーティングシステムの
核プログラムを障害のない一次記憶装置に書き込み、そ
の後に中央処理装置を再起動するので、−時的に運用が
停止するだけであり、また、保守時に切り離し対象とな
る一次記憶装置にはページテーブルおよびオペレーティ
ングシステムの核プログラムが含まれないため、障害を
起こした一次記憶装置の保守を運用中に実施することが
できる。
従って、情報処理装置の稼働率を向上することができる
等の効果がある。
【図面の簡単な説明】
第1図は本発明の実施例の情報処理装置のブロック図、 第2図は立上げ処理装置1の構成例を示すブロック図、 第3図は障害状態記憶部102の内容例を示す図、 第4図は一次記憶装置障害情報1021の内容例を示す
図、 第5図は中央処理装置2の内容の一部を示す図、第6図
は二次記憶装置5の内容例を示す図、第7図は障害検出
登録手段101の処理例の流れ図、 第8図はロード手段103の処理例の流れ図、第9図は
再起動手段104の処理例の流れ図、第10図はページ
テーブルの変換例を示す図、第11図は本発明の第2の
実施例における一次記憶装置3.4の構成例を示す図、 第12図は本発明の第2の実施例における障害状態記憶
部102の内容例を示す図、 第13図は本発明の第2の実施例における障害検出登録
手段101の処理例を示す流れ図、第14図は本発明の
第2の実施例におけるロド手段103の処理例を示す流
れ図および、第15図は本発明の第2の実施例における
ペジテーブルの変換例を示すばである。 図において、 1・・・立上げ処理装置 2・・中央処理装置 3.4・・・一次記憶装置 5・・・二次記憶装置 6・・・信号線 8〜11・−データハノ、 101・・・障害検出登録手段 102・・・障害状態記憶部 103・・・ロート手段 +04・・・再起動手段

Claims (1)

  1. 【特許請求の範囲】 中央処理装置と複数の一次記憶装置と二次記憶装置とを
    含む情報処理装置において、 障害状態記憶部と、前記一次記憶装置の障害を検出し該
    障害にかかる情報を前記障害状態記憶部に登録する障害
    検出登録手段と、前記障害状態記憶部に登録された障害
    情報に基づき障害箇所が使用されず且つ障害のない一次
    記憶装置が論理的低位アドレスに割り付けられるように
    ページテーブルを作成すると共に該作成したページテー
    ブルおよび前記二次記憶装置に記憶されたオペレーティ
    ングシステムの核プログラムを障害のない一次記憶装置
    に書き込むロード手段と、前記中央処理装置を再起動す
    る再起動手段とを含む立上げ処理装置を備えてなること
    を特徴とする情報処理装置。
JP63331972A 1988-12-29 1988-12-29 情報処理装置 Pending JPH02178861A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63331972A JPH02178861A (ja) 1988-12-29 1988-12-29 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63331972A JPH02178861A (ja) 1988-12-29 1988-12-29 情報処理装置

Publications (1)

Publication Number Publication Date
JPH02178861A true JPH02178861A (ja) 1990-07-11

Family

ID=18249706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63331972A Pending JPH02178861A (ja) 1988-12-29 1988-12-29 情報処理装置

Country Status (1)

Country Link
JP (1) JPH02178861A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264976A (ja) * 2006-03-28 2007-10-11 Nec Corp コンピュータシステム、データ退避方法、及び、プログラム
JP2010225054A (ja) * 2009-03-25 2010-10-07 Nec Corp コンピュータシステム、障害処理方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264976A (ja) * 2006-03-28 2007-10-11 Nec Corp コンピュータシステム、データ退避方法、及び、プログラム
JP2010225054A (ja) * 2009-03-25 2010-10-07 Nec Corp コンピュータシステム、障害処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
US6658599B1 (en) Method for recovering from a machine check interrupt during runtime
US6574748B1 (en) Fast relief swapping of processors in a data processing system
US9798556B2 (en) Method, system, and apparatus for dynamic reconfiguration of resources
US5317752A (en) Fault-tolerant computer system with auto-restart after power-fall
WO2022198972A1 (zh) 一种服务器启动过程中的故障定位方法、系统及装置
US8132057B2 (en) Automated transition to a recovery kernel via firmware-assisted-dump flows providing automated operating system diagnosis and repair
KR100743180B1 (ko) 데이타이중화시스템
US7716520B2 (en) Multi-CPU computer and method of restarting system
EP0433979A2 (en) Fault-tolerant computer system with/config filesystem
US20120272091A1 (en) Partial fault processing method in computer system
US10445295B1 (en) Task-based framework for synchronization of event handling between nodes in an active/active data storage system
US6594709B1 (en) Methods and apparatus for transferring data using a device driver
JP2010224847A (ja) 計算機システム及び設定管理方法
JP3030658B2 (ja) 電源故障対策を備えたコンピュータシステム及びその動作方法
US6081892A (en) Initial program load
CN105959145B (zh) 一种适用高可用性集群的并行管理服务器的方法及系统
CN111966520A (zh) 数据库高可用切换方法、设备及系统
JPH02178861A (ja) 情報処理装置
JPH07121395A (ja) 予備装置優先選択方法
JP3117666B2 (ja) コールドスタンバイ型二重系システム
US20060242471A1 (en) Monitoring error-handler vector in architected memory
TW200307200A (en) Multiple fault location in a series of devices
JPS62115555A (ja) 計算機システムの補助記憶装置2重化管理方法
JP2004046474A (ja) マルチos環境の計算機システムおよびそのプログラム
JPH10275090A (ja) 基本処理装置の二重化方式