JP2600861B2 - 入出力システムエリアエラー処理方式 - Google Patents
入出力システムエリアエラー処理方式Info
- Publication number
- JP2600861B2 JP2600861B2 JP63282806A JP28280688A JP2600861B2 JP 2600861 B2 JP2600861 B2 JP 2600861B2 JP 63282806 A JP63282806 A JP 63282806A JP 28280688 A JP28280688 A JP 28280688A JP 2600861 B2 JP2600861 B2 JP 2600861B2
- Authority
- JP
- Japan
- Prior art keywords
- error
- input
- output
- software
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Debugging And Monitoring (AREA)
Description
【発明の詳細な説明】 〔目 次〕 概要 産業上の利用分野 従来の技術と発明が解決しようとする課題 課題を解決するための手段 作用 実施例 発明の効果 〔概要〕 主記憶(MSU)上に、一般にオペレーティングシステ
ム(以下OSと呼ぶ)と呼ばれるシステム制御プログラム
などのソフトウェアからアクセスできないハードウェア
専用の領域(HSA)が割付けられており、更に、該ハー
ドウェア専用の領域(HSA)内に、入出力の制御データ
領域(IOSA)が存在する計算機システムにおけるIOSAエ
ラー処理方式に関し、 中央処理装置(CPU)からの入出力システムエリア(I
OSA)へのアクセスでエラーが検出されたときのエラー
処理を、高速に,且つ、確実に行い、計算機システムの
信頼度を向上させることを目的とし、 中央処理装置(CPU),チャネルプロセッサ(CHP)の
双方が、入出力処理の実行の為に上記入出力の制御デー
タ領域(IOSA)をアクセスする機構と、上記ハードウェ
ア専用の領域(HSA)内に、ソフトウェアからは不可
視であって、アーキテクチャ上はハードウェア構造とし
て動作し、ハードウェアを支援する為のプログラム(フ
ァームウェア)手段を有する計算機システムにおいて、
上記中央処理装置(CPU)が上記入出力の制御データ領
域(IOSA)をアクセスして、メモリエラーを検出したと
き、上記中央処理装置(CPU)によるエラー報告から、
上記プログラム手段が該エラーの発生した上記入出力の
制御データ領域(IOSA)内の制御ブロックを特定し、該
エラーに対する特定の後処理を実行後、上記チャネルプ
ロセッサ(CHP)が生成する形式のエラー報告(CEW)を
生成してソフトウェアに、マシンチェック割込み手段
で通知するように構成する。
ム(以下OSと呼ぶ)と呼ばれるシステム制御プログラム
などのソフトウェアからアクセスできないハードウェア
専用の領域(HSA)が割付けられており、更に、該ハー
ドウェア専用の領域(HSA)内に、入出力の制御データ
領域(IOSA)が存在する計算機システムにおけるIOSAエ
ラー処理方式に関し、 中央処理装置(CPU)からの入出力システムエリア(I
OSA)へのアクセスでエラーが検出されたときのエラー
処理を、高速に,且つ、確実に行い、計算機システムの
信頼度を向上させることを目的とし、 中央処理装置(CPU),チャネルプロセッサ(CHP)の
双方が、入出力処理の実行の為に上記入出力の制御デー
タ領域(IOSA)をアクセスする機構と、上記ハードウェ
ア専用の領域(HSA)内に、ソフトウェアからは不可
視であって、アーキテクチャ上はハードウェア構造とし
て動作し、ハードウェアを支援する為のプログラム(フ
ァームウェア)手段を有する計算機システムにおいて、
上記中央処理装置(CPU)が上記入出力の制御データ領
域(IOSA)をアクセスして、メモリエラーを検出したと
き、上記中央処理装置(CPU)によるエラー報告から、
上記プログラム手段が該エラーの発生した上記入出力の
制御データ領域(IOSA)内の制御ブロックを特定し、該
エラーに対する特定の後処理を実行後、上記チャネルプ
ロセッサ(CHP)が生成する形式のエラー報告(CEW)を
生成してソフトウェアに、マシンチェック割込み手段
で通知するように構成する。
本発明は、主記憶(MSU)上に、OSなどのソフトウェ
アからアクセスできないハードウェア専用の領域(HS
A)が割付けられており、更に、該ハードウェア専用の
領域(HSA)内に、入出力の制御データ領域(IOSA)が
存在する計算機システムにおけるIOSAエラー処理方式に
関する。
アからアクセスできないハードウェア専用の領域(HS
A)が割付けられており、更に、該ハードウェア専用の
領域(HSA)内に、入出力の制御データ領域(IOSA)が
存在する計算機システムにおけるIOSAエラー処理方式に
関する。
一般に、計算機システムにおいては、主記憶上に、OS
などのソフトウェアからはアクセスできないハードウェ
ア専用の領域(以下、HSAという)が割付けられてお
り、該ハードウェア専用の領域(HSA)内に入出力の制
御データ領域{入出力システムエリア(以下、IOSAとい
う)}が存在する場合がある。
などのソフトウェアからはアクセスできないハードウェ
ア専用の領域(以下、HSAという)が割付けられてお
り、該ハードウェア専用の領域(HSA)内に入出力の制
御データ領域{入出力システムエリア(以下、IOSAとい
う)}が存在する場合がある。
このような計算機システムにおいて、中央処理装置
(CPU)が該IOSA領域をアクセスしてエラーを検出した
とき、該IOSA領域がHSA内にあることから、アーキテク
チャとして規定されておらず、ソフトウェアからは該エ
ラー領域(例えば、制御ブロック)を特定して、対応す
る入出力処理を中断,再開処理する等のエラー処理がで
きず、エラーの儘に放置され、ダウン期間の長いシステ
ムダウンとなる危険があり、計算機システムの信頼度が
低下する為、このような場合にも、リカバリの早いエラ
ー処理が必要とされていた。
(CPU)が該IOSA領域をアクセスしてエラーを検出した
とき、該IOSA領域がHSA内にあることから、アーキテク
チャとして規定されておらず、ソフトウェアからは該エ
ラー領域(例えば、制御ブロック)を特定して、対応す
る入出力処理を中断,再開処理する等のエラー処理がで
きず、エラーの儘に放置され、ダウン期間の長いシステ
ムダウンとなる危険があり、計算機システムの信頼度が
低下する為、このような場合にも、リカバリの早いエラ
ー処理が必要とされていた。
第2図は従来の入出力システムエリアエラー処理を説
明する図である。
明する図である。
前述のように、主記憶(MSU)2上に、ソフトウェア
からアクセスできないHSA2aが割付けられており、更
に、該HSA2a内に、IOSA21が存在する計算機システムに
おいては、該IOSA21内に入出力実行キュー25,或いは、
入出力割込みキュー26が設けられており、中央処理装置
(CPU)1が、特定の命令、例えば、スタートサブチャ
ネル(SSCH)命令,ホルトサブチャネル(HSCH)命令等
を実行するとき、上記IOSA21内の入出力実行キュー25に
入出力要求をキューイングし、クリアサブチャネル(CS
CH),テストペンディング割込み(TPI)命令等を実行
するときには、上記入出力割込みキュー26から、一つ宛
先頭から、或いは、該当する割込み要求を刈り取る処理
を実行し、その時に、該IOSA21内のサブチャネルブロッ
ク(SCB)等をアクセスする。
からアクセスできないHSA2aが割付けられており、更
に、該HSA2a内に、IOSA21が存在する計算機システムに
おいては、該IOSA21内に入出力実行キュー25,或いは、
入出力割込みキュー26が設けられており、中央処理装置
(CPU)1が、特定の命令、例えば、スタートサブチャ
ネル(SSCH)命令,ホルトサブチャネル(HSCH)命令等
を実行するとき、上記IOSA21内の入出力実行キュー25に
入出力要求をキューイングし、クリアサブチャネル(CS
CH),テストペンディング割込み(TPI)命令等を実行
するときには、上記入出力割込みキュー26から、一つ宛
先頭から、或いは、該当する割込み要求を刈り取る処理
を実行し、その時に、該IOSA21内のサブチャネルブロッ
ク(SCB)等をアクセスする。
このとき、該中央処理装置(CPU)1が該IOSA21に対
するメモリエラーを検出した場合、そのエラーに対する
後処理と,ソフトウェアへの報告方法は、同じエラー
をチャネルプロセッサ(CHP)3が検出した場合の後処
理,及び報告方法とは異なっていた。以下、更に、具体
的に説明する。
するメモリエラーを検出した場合、そのエラーに対する
後処理と,ソフトウェアへの報告方法は、同じエラー
をチャネルプロセッサ(CHP)3が検出した場合の後処
理,及び報告方法とは異なっていた。以下、更に、具体
的に説明する。
(1) 中央処理装置(CPU)により、IOSAメモリエラ
ーが検出された場合: a)後処理: 特に、該IOSAメモリエラー{例えば、サブチャネル制
御ブロック(SCB)の2ビットエラー等}に関連する入
出力処理に対する後処理{該エラーの発生したサブチャ
ネル制御ブロック(SCB)の修復,又は、初期化,或い
は、必要ならば、対応する入出力装置(I/O)の入出力
動作の中断,再開処理等}は行われず、該IOSA21内でメ
モリエラーの発生した制御ブロック{上記、サブチャネ
ル制御ブロック(SCB)等}は、エラーを保持した儘、
残されていた。
ーが検出された場合: a)後処理: 特に、該IOSAメモリエラー{例えば、サブチャネル制
御ブロック(SCB)の2ビットエラー等}に関連する入
出力処理に対する後処理{該エラーの発生したサブチャ
ネル制御ブロック(SCB)の修復,又は、初期化,或い
は、必要ならば、対応する入出力装置(I/O)の入出力
動作の中断,再開処理等}は行われず、該IOSA21内でメ
モリエラーの発生した制御ブロック{上記、サブチャネ
ル制御ブロック(SCB)等}は、エラーを保持した儘、
残されていた。
b)ソフトウェアへのエラー報告: 上記、中央処理装置(CPU)1によるIOSAメモリエラ
ーは、メモリエラー,又は、入出力割込みの異常終了と
してソフトウェアに報告され、追加情報として故障メ
モリアドレスが、主記憶(MSU)2の特定の領域に格納
されていた。
ーは、メモリエラー,又は、入出力割込みの異常終了と
してソフトウェアに報告され、追加情報として故障メ
モリアドレスが、主記憶(MSU)2の特定の領域に格納
されていた。
上記IOSA21は各計算機システムのモデル固有のもので
あり、アーキテクチャとしては規定されていないので、
ソフトウェアは該IOSA21の内部構造を意識していず、
上記故障メモリアドレスのみでは、該ソフトウェアで
は、該異常の検出された制御ブロックに対応する入出力
処理の構成要素(上記、SCB)を特定することができな
かった。
あり、アーキテクチャとしては規定されていないので、
ソフトウェアは該IOSA21の内部構造を意識していず、
上記故障メモリアドレスのみでは、該ソフトウェアで
は、該異常の検出された制御ブロックに対応する入出力
処理の構成要素(上記、SCB)を特定することができな
かった。
従って、該異常の検出された入出力構成要素(SCB)
に対する処理の中断,或いは、再実行も行われず、シス
テムダウンに繋がる危険があった。
に対する処理の中断,或いは、再実行も行われず、シス
テムダウンに繋がる危険があった。
(2) チャネルプロセッサ(CHP)によりIOSAメモリ
エラーが検出された場合: a)後処理: HSAメモリエラーを検出したチャネルプロセッサ(CH
P)3から、例えば、HSA2a内のファームウェア20が起動
され、ハードウェア的に可能であるならば、該HSAメモ
リエラーを含む制御ブロック(SCB)等の修復,又は、
初期化を行う。
エラーが検出された場合: a)後処理: HSAメモリエラーを検出したチャネルプロセッサ(CH
P)3から、例えば、HSA2a内のファームウェア20が起動
され、ハードウェア的に可能であるならば、該HSAメモ
リエラーを含む制御ブロック(SCB)等の修復,又は、
初期化を行う。
又、該制御ブロック(SCB)の初期化が行われる場合
には、特定の専用命令(SELECTIVE RESET命令)によっ
て、対応する入出力装置(I/O)の入出力動作の中断,
及び初期化を行う。
には、特定の専用命令(SELECTIVE RESET命令)によっ
て、対応する入出力装置(I/O)の入出力動作の中断,
及び初期化を行う。
b)ソフトウェアへのエラー報告: ソフトウェアに対しては、IOSAメモリエラーとして
は報告されず、チャネルプロセッサ(CHP)3の制御異
常,又は、入出力構成要素の異常終了割込みとして、チ
ャネルエラー語(CEW)22等が生成,キューイングさ
れ、該チャネルエラー語(CEW)22内に、該異常のあっ
た構成要素の番号や,その構成要素の状態(初期化され
ているかどうか等)も報告される。
は報告されず、チャネルプロセッサ(CHP)3の制御異
常,又は、入出力構成要素の異常終了割込みとして、チ
ャネルエラー語(CEW)22等が生成,キューイングさ
れ、該チャネルエラー語(CEW)22内に、該異常のあっ
た構成要素の番号や,その構成要素の状態(初期化され
ているかどうか等)も報告される。
ソフトウェアは、このチャネルプロセッサ(CHP)
3からの入出力構成要素の異常報告を該チャネルエラー
語(CEW)22の形で報告{具体的には、該ソフトウェア
内のストアCEW(STCEW)命令による読み出しによる}
されると、該当構成要素に対するソフトウェア処理の中
断,及び、可能ならば処理の再実行を行う。
3からの入出力構成要素の異常報告を該チャネルエラー
語(CEW)22の形で報告{具体的には、該ソフトウェア
内のストアCEW(STCEW)命令による読み出しによる}
されると、該当構成要素に対するソフトウェア処理の中
断,及び、可能ならば処理の再実行を行う。
上記のように動作する為、中央処理装置(CPU)1に
おいて、IOSAメモリエラーを検出した場合の処理が、チ
ャネルプロセッサ(CHP)3で同じIOSAメモリエラーを
検出した場合の処理と異なり、計算機システムの信頼度
を低下させる要因となる問題があった。
おいて、IOSAメモリエラーを検出した場合の処理が、チ
ャネルプロセッサ(CHP)3で同じIOSAメモリエラーを
検出した場合の処理と異なり、計算機システムの信頼度
を低下させる要因となる問題があった。
本発明は上記従来の欠点に鑑み、主記憶(MSU)上
に、ソフトウェアからアクセスできないハードウェア
専用の領域(HSA)が割付けられており、更に、該ハー
ドウェア専用の領域(HSA)内に、入出力の制御データ
領域(IOSA)が存在する計算機システムにおけるIOSAエ
ラー処理方式において、中央処理装置(CPU)によるIOS
A異常の検出時にも、チャネルプロセッサ(CHP)でIOSA
異常を検出したときと同様のエラー修復機構を動作させ
て、計算機システムの信頼性を向上させる入出力システ
ムエリアエラー処理方式を提供することを目的とするも
のである。
に、ソフトウェアからアクセスできないハードウェア
専用の領域(HSA)が割付けられており、更に、該ハー
ドウェア専用の領域(HSA)内に、入出力の制御データ
領域(IOSA)が存在する計算機システムにおけるIOSAエ
ラー処理方式において、中央処理装置(CPU)によるIOS
A異常の検出時にも、チャネルプロセッサ(CHP)でIOSA
異常を検出したときと同様のエラー修復機構を動作させ
て、計算機システムの信頼性を向上させる入出力システ
ムエリアエラー処理方式を提供することを目的とするも
のである。
上記の問題点は下記の如くに構成された入出力システ
ムエリアエラー処理方式によって解決される。
ムエリアエラー処理方式によって解決される。
主記憶(MSU)上に、ソフトウェアからアクセスで
きないハードウェア専用の領域(HSA)が割付けられて
おり、 更に、該ハードウェア専用の領域内に、入出力の制御
データ領域(IOSA)が存在する計算機システムであって 中央処理装置(CPU),チャネルプロセッサ(CHP)の
双方が、入出力処理の実行の為に上記入出力の制御デー
タ領域(IOSA)をアクセスする機構と、 上記ハードウェア専用の領域(HSA)内に、ソフトウ
ェアからは不可視であって、アーキテクチャ上はハー
ドウェア構造として動作し、ハードウェアを支援する為
のプログラム手段(ファームウェア)を備えた計算機シ
ステムにおいて、 上記中央処理装置(CPU)が上記入出力の制御データ
領域(IOSA)をアクセスして、メモリエラーを検出した
とき、 上記中央処理装置(CPU)によるエラー報告から、上
記プログラム手段が該エラーの発生した上記入出力の制
御データ領域(IOSA)内の制御ブロックを特定し、該エ
ラーに対する特定の後処理を実行後、上記チャネルプロ
セッサ(CHP)が生成する形式のエラー報告(CEW)を生
成してソフトウェアに、マシンチェック割込み手段で
通知するように構成する。
きないハードウェア専用の領域(HSA)が割付けられて
おり、 更に、該ハードウェア専用の領域内に、入出力の制御
データ領域(IOSA)が存在する計算機システムであって 中央処理装置(CPU),チャネルプロセッサ(CHP)の
双方が、入出力処理の実行の為に上記入出力の制御デー
タ領域(IOSA)をアクセスする機構と、 上記ハードウェア専用の領域(HSA)内に、ソフトウ
ェアからは不可視であって、アーキテクチャ上はハー
ドウェア構造として動作し、ハードウェアを支援する為
のプログラム手段(ファームウェア)を備えた計算機シ
ステムにおいて、 上記中央処理装置(CPU)が上記入出力の制御データ
領域(IOSA)をアクセスして、メモリエラーを検出した
とき、 上記中央処理装置(CPU)によるエラー報告から、上
記プログラム手段が該エラーの発生した上記入出力の制
御データ領域(IOSA)内の制御ブロックを特定し、該エ
ラーに対する特定の後処理を実行後、上記チャネルプロ
セッサ(CHP)が生成する形式のエラー報告(CEW)を生
成してソフトウェアに、マシンチェック割込み手段で
通知するように構成する。
即ち、本発明によれば、主記憶(MSU)上に、ソフト
ウェアからアクセスできないHSAが割付けられており、
更に、該HSA内に、IOSAと、該IOSAメモリエラーを処理
するファームウェアが存在する計算機システムにおい
て、(1) 中央処理装置(CPU)がIOSAメモリエラー
を検出した時、該機械異常時に発生される割込み(マシ
ンチェック割込み)を直接ソフトウェアに反映させず
に、一旦ファームウェアに反映させる。
ウェアからアクセスできないHSAが割付けられており、
更に、該HSA内に、IOSAと、該IOSAメモリエラーを処理
するファームウェアが存在する計算機システムにおい
て、(1) 中央処理装置(CPU)がIOSAメモリエラー
を検出した時、該機械異常時に発生される割込み(マシ
ンチェック割込み)を直接ソフトウェアに反映させず
に、一旦ファームウェアに反映させる。
(2) 該中央処理装置(CPU)による機械異常報告
は、直接、IOSAの異常を明示的に示していないので、該
ファームウェアが中央処理装置(CPU)による機械異常
の報告を解析し、IOSAの異常があるかどうかを判定す
る。
は、直接、IOSAの異常を明示的に示していないので、該
ファームウェアが中央処理装置(CPU)による機械異常
の報告を解析し、IOSAの異常があるかどうかを判定す
る。
(3) IOSAの異常がない場合には、該ファームウェア
は該当マシンチェック割込みをソフトウェアに反映し
て、この場合のマシンチェック処理は終了する。若し、
IOSAの異常があった場合には、以下の処理を実行する。
は該当マシンチェック割込みをソフトウェアに反映し
て、この場合のマシンチェック処理は終了する。若し、
IOSAの異常があった場合には、以下の処理を実行する。
(4) 異常のあったIOSA内の制御ブロック{例えば、
サブチャネル制御ブロック(SCB)}の修復を行う。
サブチャネル制御ブロック(SCB)}の修復を行う。
先ず、異常のあった制御ブロック(SCB)等,及び、
それ以外の制御ブロック(SCB)等を見て、前述の入出
力実行キュー,及び入出力割込みキューとの関連性を解
析し、該異常のあった制御ブロック(SCB)等に関する
キュー情報を該当キューから消去し、他の制御ブロック
(SCB),及び,キューの再構成を行う。
それ以外の制御ブロック(SCB)等を見て、前述の入出
力実行キュー,及び入出力割込みキューとの関連性を解
析し、該異常のあった制御ブロック(SCB)等に関する
キュー情報を該当キューから消去し、他の制御ブロック
(SCB),及び,キューの再構成を行う。
次に、該異常のあった制御ブロック(SCB)を初期化
する。
する。
(5) IOSA内の制御ブロック(SCB)等を修復したと
きには、その制御ブロック(SCB)に対応する入出力装
置(I/O)に対して、入出力処理の中断と初期化(リセ
ット処理)を行う必要がある場合がある。
きには、その制御ブロック(SCB)に対応する入出力装
置(I/O)に対して、入出力処理の中断と初期化(リセ
ット処理)を行う必要がある場合がある。
従って、該ファームウェアはチャネルプロセッサ(CH
P)に対して該当処理を依頼する。
P)に対して該当処理を依頼する。
この処理は、通常の入出力命令では要求することがで
きない細かな入出力機構に対する要求であり、この細か
な入出力機構の呼び出しの為に、該ファームウェアにお
いてのみ使用可能な入出力命令{例えば、セレクティブ
リセット(SELECTIVE RESET)命令}が用意されてい
る。
きない細かな入出力機構に対する要求であり、この細か
な入出力機構の呼び出しの為に、該ファームウェアにお
いてのみ使用可能な入出力命令{例えば、セレクティブ
リセット(SELECTIVE RESET)命令}が用意されてい
る。
(6) ファームウェアは、該当エラーに対して、チャ
ネルプロセッサ(CHP)が生成する形式のエラー報告
{チャネルエラー語(CEW)}を作成する。
ネルプロセッサ(CHP)が生成する形式のエラー報告
{チャネルエラー語(CEW)}を作成する。
その際、前述のように、異常のあった入出力構成要素
の種類,番号や,その構成要素の状態(初期化されてい
るかどうか等)が報告される。
の種類,番号や,その構成要素の状態(初期化されてい
るかどうか等)が報告される。
この報告が、本来のマシンチェック割込みの形で、ソ
フトウェアに反映されると共に、通常の中央処理装置
(CPU)からのエラー報告も、その儘、該ソフトウェア
に反映される。
フトウェアに反映されると共に、通常の中央処理装置
(CPU)からのエラー報告も、その儘、該ソフトウェア
に反映される。
ここで、該IOSA異常に対するファームウェア処理は終
了する。
了する。
(7) 該ファームウェアが生成した上記チャネルプロ
セッサ(CHP)生成形式{チャネルエラー語(CEW)}の
入出力異常報告は、上記異常が生成された時の終結状態
(後処理)を含めて、該チャネルプロセッサ(CHP)が
この報告を生成した場合と等価である。
セッサ(CHP)生成形式{チャネルエラー語(CEW)}の
入出力異常報告は、上記異常が生成された時の終結状態
(後処理)を含めて、該チャネルプロセッサ(CHP)が
この報告を生成した場合と等価である。
この為、ソフトウェアがこの入出力異常の報告を受
け取ったとき、該チャネルプロセッサ(CHP)が入出力
異常を報告した場合と同じ様に処理することができる。
け取ったとき、該チャネルプロセッサ(CHP)が入出力
異常を報告した場合と同じ様に処理することができる。
即ち、異常のあった入出力構成要素{例えば、上記サ
ブチャネル制御ブロック(SCB)}を特定できると共
に、その入出力構成要素に対するソフトウェア処理の中
断,及び、再実行を行うことができる。
ブチャネル制御ブロック(SCB)}を特定できると共
に、その入出力構成要素に対するソフトウェア処理の中
断,及び、再実行を行うことができる。
従って、ハードウェア・ソフトウェア間のインタフェ
ースは、従来のマシンチェック割込みと、該ソフトウェ
アが実行するストアチャネルエラー語(STCEW)命令に
よるチャネルエラー語(CEW)の主記憶の特定領域への
書き込みを介した読み取りインタフェース以外に、新た
なインタフェースを必要とせず、恰も、従来のチャネル
プロセッサ(CHP)による入出力異常報告があったかの
ように、中央処理装置(CPU)からのIOSAメモリエラー
を処理でき、該計算機システムの信頼度を向上させるこ
とができる効果がある。
ースは、従来のマシンチェック割込みと、該ソフトウェ
アが実行するストアチャネルエラー語(STCEW)命令に
よるチャネルエラー語(CEW)の主記憶の特定領域への
書き込みを介した読み取りインタフェース以外に、新た
なインタフェースを必要とせず、恰も、従来のチャネル
プロセッサ(CHP)による入出力異常報告があったかの
ように、中央処理装置(CPU)からのIOSAメモリエラー
を処理でき、該計算機システムの信頼度を向上させるこ
とができる効果がある。
以下本発明の実施例を図面によって詳述する。第3図
は本発明の実施の形態における計算機システムを説明す
る図である。第3図の1が中央処理装置(CPU)、2が
主記憶(MSU)、3がCPU1から入出力命令を受取り、デ
ータ転送を行うなどしてIO装置を制御するチャネルプロ
セッサー(CHP)である。
は本発明の実施の形態における計算機システムを説明す
る図である。第3図の1が中央処理装置(CPU)、2が
主記憶(MSU)、3がCPU1から入出力命令を受取り、デ
ータ転送を行うなどしてIO装置を制御するチャネルプロ
セッサー(CHP)である。
MSU2には一般にOSと呼ばれるシステム制御プログラム
などのソフトウェアや一般の応用プログラムからアク
セスできる領域と、一般のソフトウェアからはアクセス
できないハードウェア専用の領域(HSA)2aが割付けら
れている。
などのソフトウェアや一般の応用プログラムからアク
セスできる領域と、一般のソフトウェアからはアクセス
できないハードウェア専用の領域(HSA)2aが割付けら
れている。
HSA2aには入出力装置を制御するための制御データ領
域(IOSA)21が割付けられており、CPU1がCHP3の双方
が、入出力処理の実行の為にアクセスする。またHSA2a
には一般にOSと呼ばれるシステム制御プログラムとは異
なり、一般にファームウェアと呼ばれるアーキテクチャ
上はハードウェア構造として動作する、ハードウェアを
支援する為のプログラム手段20が格納されている。
域(IOSA)21が割付けられており、CPU1がCHP3の双方
が、入出力処理の実行の為にアクセスする。またHSA2a
には一般にOSと呼ばれるシステム制御プログラムとは異
なり、一般にファームウェアと呼ばれるアーキテクチャ
上はハードウェア構造として動作する、ハードウェアを
支援する為のプログラム手段20が格納されている。
プログラム手段20すなわちファームウェア20は以下の
ようにCPU1で実行される。例えば入出力命令がソフトウ
ェアから発行される場合、実際にはCPU1がMSU2に格納
されている入出力命令を読み出すことにより開始される
が、CPU1が入出力命令であると認識するとその制御をフ
ァームウェア20に渡す。ファームウェア20は入出力命令
の前処理を行い、実際に10装置を制御するCHP3に入出力
命令を実行するよう指示する。
ようにCPU1で実行される。例えば入出力命令がソフトウ
ェアから発行される場合、実際にはCPU1がMSU2に格納
されている入出力命令を読み出すことにより開始される
が、CPU1が入出力命令であると認識するとその制御をフ
ァームウェア20に渡す。ファームウェア20は入出力命令
の前処理を行い、実際に10装置を制御するCHP3に入出力
命令を実行するよう指示する。
また入出力命令以外の命令実行中に発生するマシンチ
ェック割込みの場合もファームウェア20が実際にソフト
ウェアに割込み動作を実行する前にCPU1で実行され
る。例えばCPU1がMSU2をアクセスしてメモリエラーを検
出した場合でも、ファームウェア20がエラーアドレスを
解析し、マシンチェック割込み手段すなわちソフトウェ
ア用のプログラムカウンタとパラメータを使ってソフ
トウェアに通知する。
ェック割込みの場合もファームウェア20が実際にソフト
ウェアに割込み動作を実行する前にCPU1で実行され
る。例えばCPU1がMSU2をアクセスしてメモリエラーを検
出した場合でも、ファームウェア20がエラーアドレスを
解析し、マシンチェック割込み手段すなわちソフトウェ
ア用のプログラムカウンタとパラメータを使ってソフ
トウェアに通知する。
またファームウェア20への割込みの仕方は、通常のソ
フトウェアへの割込みと同様に、ファームウェア用の
プログラムカウンタとパラメータを使用してCPU1がプロ
グラムカウンタを書き換えることにより行われる。
フトウェアへの割込みと同様に、ファームウェア用の
プログラムカウンタとパラメータを使用してCPU1がプロ
グラムカウンタを書き換えることにより行われる。
第1図は本発明の一実施例を示した図であって、
(a)は主記憶(MSU)の構成例を示し、(b)はCPU検
出のSCB2ビットエラーの処理例を模式的に示したもので
本図のファームウェア手段20が本発明を実施するのに必
要な手段である。尚、全図を通して同じ符号は同じ対象
物を示している。
(a)は主記憶(MSU)の構成例を示し、(b)はCPU検
出のSCB2ビットエラーの処理例を模式的に示したもので
本図のファームウェア手段20が本発明を実施するのに必
要な手段である。尚、全図を通して同じ符号は同じ対象
物を示している。
以下、中央処理装置(CPU)1がスタートサブチャネ
ル(SSCH)命令を実行して、サブチャネル制御ブロック
(SCB)をアクセスした時に、例えば、2ビットエラー
を検出した場合について、第1図によって、本発明の入
出力システムエリアエラー処理の動作例を説明する。
ル(SSCH)命令を実行して、サブチャネル制御ブロック
(SCB)をアクセスした時に、例えば、2ビットエラー
を検出した場合について、第1図によって、本発明の入
出力システムエリアエラー処理の動作例を説明する。
(1) 先ず、中央処理装置(CPU)1がスタートサブ
チャネル(SSCH)命令を実行中に、該入出力命令に関連
するサブチャネル制御ブロック(以下、SCBという)
に、修正できない2ビットメモリエラーを検出したとす
る。
チャネル(SSCH)命令を実行中に、該入出力命令に関連
するサブチャネル制御ブロック(以下、SCBという)
に、修正できない2ビットメモリエラーを検出したとす
る。
(2) 中央処理装置(CPU)1は、以下に示すマシン
チェック割込みをファームウェア20に反映させる。この
とき、マシンチェック割込み要因は:・命令が正しく実
行されなかったことを示すプロセシングダメジ(PROCES
SING DAMAGE)PD・修正不可能なストレージエラー(STO
RAGE ERROR UNCORRECTED)SEと共に、障害ストレージア
ドレス(FAILING STORAGE ADDRESS)FSAがファームウェ
アに通達される。該FSAはエラーの発生したメモリアド
レスを指している。
チェック割込みをファームウェア20に反映させる。この
とき、マシンチェック割込み要因は:・命令が正しく実
行されなかったことを示すプロセシングダメジ(PROCES
SING DAMAGE)PD・修正不可能なストレージエラー(STO
RAGE ERROR UNCORRECTED)SEと共に、障害ストレージア
ドレス(FAILING STORAGE ADDRESS)FSAがファームウェ
アに通達される。該FSAはエラーの発生したメモリアド
レスを指している。
(3) ファームウェア20は上記FSAから、IOSA21内の
エラーの発生したSCB21aを特定する。
エラーの発生したSCB21aを特定する。
(4) ここで、該ファームウェア20は、メモリエラー
の発生したSCB21aを初期化し、該2ビットメモリエラー
を解消する。
の発生したSCB21aを初期化し、該2ビットメモリエラー
を解消する。
このとき、該初期化等の後処理が終了する迄、当該SC
B21aが使用されないようにする為、該SCB21aをロックす
る。
B21aが使用されないようにする為、該SCB21aをロックす
る。
(5) ファームウェア20は、該初期化したSCB21aに対
応する入出力装置(I/O)4をリセットする為に、チャ
ネルプロセッサ(CHP)3に、該入出力装置(I/O)4へ
のセレクティブリセット(SELECTIVE RESET)の実行要
求を依頼する。
応する入出力装置(I/O)4をリセットする為に、チャ
ネルプロセッサ(CHP)3に、該入出力装置(I/O)4へ
のセレクティブリセット(SELECTIVE RESET)の実行要
求を依頼する。
(6) 入出力装置(I/O)4から、上記セレクティブ
リセット(SELECTIVE RESET)の終結報告がチャネルプ
ロセッサ(CHP)3を介して、該ファームウェア20に送
られてくると、該ファームウェア20は該当サブチャネル
に対するチャネルエラー語(CEW)(SUBCHANNEL INTIAL
IZED CEW)を作成し、CEWのキュー22にキューイングす
る。
リセット(SELECTIVE RESET)の終結報告がチャネルプ
ロセッサ(CHP)3を介して、該ファームウェア20に送
られてくると、該ファームウェア20は該当サブチャネル
に対するチャネルエラー語(CEW)(SUBCHANNEL INTIAL
IZED CEW)を作成し、CEWのキュー22にキューイングす
る。
(7) 上記CEWペンディング割込みの発生条件がある
場合には、以下の処理をファームウェア20が行う。
場合には、以下の処理をファームウェア20が行う。
1)CEWペンディング割込み(CP)が割込み可能のと
き、即ち、割込みマスクが開いているとき、ソフトウェ
アに報告するマシンチェック割込みコード(MCIC)
に、CEWペンディング割込み(CP)をマージ(追加)す
る。
き、即ち、割込みマスクが開いているとき、ソフトウェ
アに報告するマシンチェック割込みコード(MCIC)
に、CEWペンディング割込み(CP)をマージ(追加)す
る。
2)CEWペンディング割込み(CP)が割込み不可能のと
き、即ち、割込みマスクが閉じているとき、該CEWペン
ディング割込み(CP)をペンディングとする。
き、即ち、割込みマスクが閉じているとき、該CEWペン
ディング割込み(CP)をペンディングとする。
(8) 中央処理装置(CPU)1が生成したマシンチェ
ック割込み,又は、上記のように、該マシンチェック割
込みを補正したものを、本来のマシンチェック割込みの
インタフェースを介してソフトウェアに反映させる。
ック割込み,又は、上記のように、該マシンチェック割
込みを補正したものを、本来のマシンチェック割込みの
インタフェースを介してソフトウェアに反映させる。
この結果、該ソフトウェアでの割込み処理におい
て、上記キューイングされているチャネルエラー語(CE
W)22をストアCEW命令で読み取り、該チャネルエラー語
(CEW)22内に設定されているサブチャネル番号から、
エラーの発生した入出力処理を特定することができる。
て、上記キューイングされているチャネルエラー語(CE
W)22をストアCEW命令で読み取り、該チャネルエラー語
(CEW)22内に設定されているサブチャネル番号から、
エラーの発生した入出力処理を特定することができる。
このように、本発明は、主記憶(MSU)上に、ソフト
ウェアからアクセスできないハードウェア専用の領域
(HSA)が割付けられており、更に、該ハードウェア専
用の領域(HSA)内に、入出力の制御データ領域(IOS
A)が存在する計算機システムにおいて、チャネルプロ
セッサ(CHP)が検出したIOSAメモリエラーについて、
該HSA内に設けられているファームウェアによる該当SCB
に対する後処理後、チャネルエラー語(CEW)を生成し
てソフトウェアに報告する機構を、中央処理装置(CP
U)が該IOSAメモリエラーを検出した場合にも起動する
ことにより、恰も、チャネルプロセッサ(CHP)がIOSA
メモリエラーを検出したと同じ処理過程でソフトウェア
に報告して、SCBの修復,入出力処理の中断,再開処理
等を行えるようにした所に特徴がある。
ウェアからアクセスできないハードウェア専用の領域
(HSA)が割付けられており、更に、該ハードウェア専
用の領域(HSA)内に、入出力の制御データ領域(IOS
A)が存在する計算機システムにおいて、チャネルプロ
セッサ(CHP)が検出したIOSAメモリエラーについて、
該HSA内に設けられているファームウェアによる該当SCB
に対する後処理後、チャネルエラー語(CEW)を生成し
てソフトウェアに報告する機構を、中央処理装置(CP
U)が該IOSAメモリエラーを検出した場合にも起動する
ことにより、恰も、チャネルプロセッサ(CHP)がIOSA
メモリエラーを検出したと同じ処理過程でソフトウェア
に報告して、SCBの修復,入出力処理の中断,再開処理
等を行えるようにした所に特徴がある。
尚、本実施例においては、チャネルプロセッサ(CH
P)3が使用するファームウェア20を、中央処理装置(C
PU)1がIOSAメモリエラーを検出したときにも使用する
例で説明したが、該ファームウェア20をチャネルプロセ
ッサ(CHP)3用と,中央処理装置(CPU)1に別々に構
成してもよいことはいう迄もないことである。
P)3が使用するファームウェア20を、中央処理装置(C
PU)1がIOSAメモリエラーを検出したときにも使用する
例で説明したが、該ファームウェア20をチャネルプロセ
ッサ(CHP)3用と,中央処理装置(CPU)1に別々に構
成してもよいことはいう迄もないことである。
以上、詳細に説明したように、本発明の入出力システ
ムエリアエラー処理方式は、主記憶(MSU)上に、ソフ
トウェアからアクセスできないハードウェア専用の領域
(HSA)が割付けられており、更に、該ハードウェア専
用の領域(HSA)内に、入出力の制御データ領域(IOS
A)が存在する計算機システムであって、中央処理装置
(CPU),チャネルプロセッサ(CHP)の双方が、入出力
処理の実行の為に上記入出力の制御データ領域(IOSA)
をアクセスする機構と、上記ハードウェア専用の領域
(HSA)内に、ソフトウェアからは不可視であって、
アーキテクチャ上はハードウェア構造として動作し、ハ
ードウェアを支援する為のプログラム(ファームウェ
ア)手段を有する計算機システムにおいて、上記中央処
理装置(CPU)が上記入出力の制御データ領域(IOSA)
をアクセスして、メモリエラーを検出したとき、上記中
央処理装置(CPU)によるエラー報告から、上記プログ
ラム手段が該エラーの発生した上記入出力の制御データ
領域(IOSA)内の制御ブロックを特定し、該エラーに対
する特定の後処理を実行後、上記チャネルプロセッサ
(CHP)が生成する形式のエラー報告(CEW)を生成し
て、マシンチェック割込み手段でソフトウェアに通知
するようにしたものであるので、ハードウェア・ソフト
ウェア間のインタフェースは、従来のマシンチェック割
込みと、該ソフトウェアが実行するストアチャネルエラ
ー語(STCRW)命令によるチャネルエラー語(CEW)の主
記憶の特定領域への書き込みを介した読み取りインタフ
ェース以外に、新たなインタフェースを必要とせず、恰
も、従来のチャネルプロセッサ(CHP)による入出力異
常報告があったかのように、中央処理装置(CPU)から
のIOSAメモリエラーを処理でき、該計算機システムの信
頼度を向上させることができる効果がある。
ムエリアエラー処理方式は、主記憶(MSU)上に、ソフ
トウェアからアクセスできないハードウェア専用の領域
(HSA)が割付けられており、更に、該ハードウェア専
用の領域(HSA)内に、入出力の制御データ領域(IOS
A)が存在する計算機システムであって、中央処理装置
(CPU),チャネルプロセッサ(CHP)の双方が、入出力
処理の実行の為に上記入出力の制御データ領域(IOSA)
をアクセスする機構と、上記ハードウェア専用の領域
(HSA)内に、ソフトウェアからは不可視であって、
アーキテクチャ上はハードウェア構造として動作し、ハ
ードウェアを支援する為のプログラム(ファームウェ
ア)手段を有する計算機システムにおいて、上記中央処
理装置(CPU)が上記入出力の制御データ領域(IOSA)
をアクセスして、メモリエラーを検出したとき、上記中
央処理装置(CPU)によるエラー報告から、上記プログ
ラム手段が該エラーの発生した上記入出力の制御データ
領域(IOSA)内の制御ブロックを特定し、該エラーに対
する特定の後処理を実行後、上記チャネルプロセッサ
(CHP)が生成する形式のエラー報告(CEW)を生成し
て、マシンチェック割込み手段でソフトウェアに通知
するようにしたものであるので、ハードウェア・ソフト
ウェア間のインタフェースは、従来のマシンチェック割
込みと、該ソフトウェアが実行するストアチャネルエラ
ー語(STCRW)命令によるチャネルエラー語(CEW)の主
記憶の特定領域への書き込みを介した読み取りインタフ
ェース以外に、新たなインタフェースを必要とせず、恰
も、従来のチャネルプロセッサ(CHP)による入出力異
常報告があったかのように、中央処理装置(CPU)から
のIOSAメモリエラーを処理でき、該計算機システムの信
頼度を向上させることができる効果がある。
【図面の簡単な説明】 第1図は本発明の一実施例を示した図, 第2図は従来の入出力システムエリアエラー処理を説明
する図, 第3図は本発明実施の形態の計算機システムを説明する
図, である。 図面において、 1は中央処理装置(CPU),2は主記憶(MSU), 2aはハードウェア専用の領域(HSA), 20はプログラム手段,又は、ファームウェア, 21は入出力の制御データ領域,又は、入出力システムエ
リア(IOSA), 22はチャネルエラー語(CEW),又は、そのキュー, 25は入出力実行キュー,26は入出力割込みキュー, 3はチャネルプロセッサ(CHP), 4は入出力装置(I/O), はソフトウェア, をそれぞれ示す。
する図, 第3図は本発明実施の形態の計算機システムを説明する
図, である。 図面において、 1は中央処理装置(CPU),2は主記憶(MSU), 2aはハードウェア専用の領域(HSA), 20はプログラム手段,又は、ファームウェア, 21は入出力の制御データ領域,又は、入出力システムエ
リア(IOSA), 22はチャネルエラー語(CEW),又は、そのキュー, 25は入出力実行キュー,26は入出力割込みキュー, 3はチャネルプロセッサ(CHP), 4は入出力装置(I/O), はソフトウェア, をそれぞれ示す。
Claims (1)
- 【請求項1】主記憶上にソフトウェアからアクセスでき
ないハードウェア専用の領域が割付けられており、 更に該ハードウェア専用の領域内に入出力の制御データ
領域が存在する計算機システムであって 中央処理装置、チャネルプロセッサの双方が入出力処理
の実行の為に上記入出力の制御データ領域をアクセスす
る機構と、 上記ハードウェア専用の領域内にソフトウェアからは不
可視であって、アーキテクチャ上はハードウェア構造と
して動作しハードウェアを支援する為のプログラム手段
を備えた計算機システムにおいて、 上記中央処理装置が上記入出力の制御データ領域をアク
セスしてメモリエラーを検出したとき、 上記中央処理装置によるエラー報告から上記プログラム
手段が該エラーの発生した上記入出力の制御データ領域
内の制御ブロックを特定し、該エラーに対する特定の後
処理を実行後上記チャネルプロセッサが生成する形式の
エラー報告を生成してソフトウェアにマシンチェック割
込み手段で通知することを特徴とする入出力システムエ
リアエラー処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63282806A JP2600861B2 (ja) | 1988-11-09 | 1988-11-09 | 入出力システムエリアエラー処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63282806A JP2600861B2 (ja) | 1988-11-09 | 1988-11-09 | 入出力システムエリアエラー処理方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02128261A JPH02128261A (ja) | 1990-05-16 |
JP2600861B2 true JP2600861B2 (ja) | 1997-04-16 |
Family
ID=17657327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63282806A Expired - Fee Related JP2600861B2 (ja) | 1988-11-09 | 1988-11-09 | 入出力システムエリアエラー処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2600861B2 (ja) |
-
1988
- 1988-11-09 JP JP63282806A patent/JP2600861B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH02128261A (ja) | 1990-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5437033A (en) | System for recovery from a virtual machine monitor failure with a continuous guest dispatched to a nonguest mode | |
US4740969A (en) | Method and apparatus for recovering from hardware faults | |
US5802345A (en) | Computer system with a reduced number of command end interrupts from auxiliary memory unit and method of reducing the number of command end interrupts | |
US5072368A (en) | Immediate duplication of I/O requests on a record by record basis by a computer operating system | |
JP2600861B2 (ja) | 入出力システムエリアエラー処理方式 | |
JPH07141176A (ja) | コマンドリトライ制御方式 | |
JPH02294739A (ja) | 障害検出方式 | |
US8151028B2 (en) | Information processing apparatus and control method thereof | |
Droulette | Recovery through programming system/360: system/370 | |
JP2548475B2 (ja) | アレイディスク装置のデータ復元量制御方法 | |
JPH09330141A (ja) | 動的再構成処理における障害回復処理方式 | |
EP0221275B1 (en) | Method and apparatus for ensuring data integrity in a computer system | |
JPH05265876A (ja) | エラー報告処理方式 | |
JPS6215897B2 (ja) | ||
JPS6343771B2 (ja) | ||
JPS6228841A (ja) | 入出力処理装置 | |
JPS5832422B2 (ja) | マイクロシンダンホウシキ | |
JPH0458352A (ja) | 個別チャネル部の再ロード方式及び方法 | |
JPH0411890B2 (ja) | ||
JPS6146535A (ja) | 擬似エラ−設定制御方式 | |
JPS6198435A (ja) | エラ−処理方式 | |
JP2014081884A (ja) | 計算機システム | |
CN115543666A (zh) | 故障处理的方法、设备和计算机可读存储介质 | |
JPH0520049A (ja) | 制御メモリの修正機能を有する情報処理システムおよび制御メモリの修正方法 | |
JPH076103A (ja) | 入出力チャネルの障害処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |