JP2002099437A - ネットワーク接続装置の制御方法 - Google Patents

ネットワーク接続装置の制御方法

Info

Publication number
JP2002099437A
JP2002099437A JP2000289047A JP2000289047A JP2002099437A JP 2002099437 A JP2002099437 A JP 2002099437A JP 2000289047 A JP2000289047 A JP 2000289047A JP 2000289047 A JP2000289047 A JP 2000289047A JP 2002099437 A JP2002099437 A JP 2002099437A
Authority
JP
Japan
Prior art keywords
queue
connection device
interrupt
data
activation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000289047A
Other languages
English (en)
Other versions
JP4205843B2 (ja
Inventor
Akira Takeshita
晃 竹下
Toshiaki Miyakoshi
利晋 宮越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information Technology Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Information Technology Co Ltd filed Critical Hitachi Ltd
Priority to JP2000289047A priority Critical patent/JP4205843B2/ja
Publication of JP2002099437A publication Critical patent/JP2002099437A/ja
Application granted granted Critical
Publication of JP4205843B2 publication Critical patent/JP4205843B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 起動キュー、再起動キュー、割り込みキュー
が脱落した場合でも、正常な動作を継続し、信頼性を向
上させる。 【解決手段】 LPAR01、02の OSが不当ウェ
イトしたことを検出した際に、LAN接続装置06に対
し、OSの動作不能状態を通知し、 OSに対する送信
データをLAN接続装置内06バッファから破棄するこ
とにより、バッファを開放し、当該LAN接続装置06
を共有する他システムには影響を与えず、連続使用を可
能とする。またLAN接続装置06の内部バッファ使用
量の規定値オーバーを契機として、又はREADコマン
ドの終了報告から次READコマンドの起動迄の待ち時
間の規定時間オーバーを契機として、コマンド起動の状
態を判定し、起動キュー又は割込みキューから要因の脱
落が発生していた場合は、キューを回復する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワーク接続
装置の制御方法に係わり、特に、ホストコンピュータに
内蔵されるLAN接続装置の障害検出と障害のリカバリ
を行うネットワーク接続装置の制御方法に関する。
【0002】
【従来の技術】一般に、計算機システムのハードウェア
資源を論理的に分割して、複数のプロセッサとして使用
する形態をLPAR(Logically Partitioned)モード
と呼ぶ。このモードでは、ハードウェア資源(LAN接
続装置も含む)は、複数のOS(基本ソフトウェア、オペ
レーティングシステム)に共有されて使用される。
【0003】従来より、資源分割管理機構であるLPA
R環境下で、 ひとつのLAN接続装置が複数のOSに
共用され使用される場合、あるOSが不当にウェイトす
ると、そのLAN接続装置を共用している全てのシステ
ムに影響が生じる場合がある。その理由は、例えば、ウ
ェイトしたOSからは、コマンドが発行されず、LAN
接続装置内部バッファに取り込んたデータが処理されな
い為、当該障害システムに対するデータで埋め尽くさ
れ、データバッファを共有している他のシステムへのサ
ービスが出来なくなるからである。
【0004】そこで従来技術としては、 LAN接続装
置がOSの障害によるウェイトを検出する手段として、
OSから一定間隔で、専用のコマンドを発行してもら
い、LAN接続装置側でそのコマンドの発行される間隔
をタイマー監視し、タイムアウトした際は、当該システ
ムはダウンしたとみなし、当該システムに対するデータ
を破棄する方式がある。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来技術では、一定間隔でOSから起動を発行する
必要があること、またLAN接続装置側でもその起動に
対する時間監視を常に行う必要があることから、これら
処理のオーバヘッドにより性能が劣化することとなる。
また、起動処理中、割込み処理中のハードウェアに障害
が発生すると、たとえそのリカバリに成功しても、入出
力動作に使用する各種のキューから、起動、割り込みの
要因が脱落することがある。このような脱落は、たとえ
ば、起動キュー、再起動キューからの起動要因の脱落、
割り込みキューからの割り込み要因の脱落である。
【0006】また、従来、LAN接続装置等のネットワ
ークを制御するデバイスに対するREAD(読取り)コ
マンドは、対象となるデータがいつLANから届くか判
断できない為、OSによるREADコマンドのタイムア
ウト監視はむずかしかった。従って、障害等でREAD
コマンドの終了報告が消滅した様なケースにおいても、
OSは障害を検出することが出来ず、おそらく永遠に来
るはずの無いであろう終了報告を待つことになる。ま
た、何らかの方法で動作上の不具合を検出できたとして
も、障害の発生からあまりにも時間が経過している為
に、障害の原因を特定できる有効なデータは採取できな
いことがあった。
【0007】このように従来の方式では、上述の様なハ
ードウエアの障害等でREADコマンドに対する起動、
割込み要因が抜けた場合には対応できず、結果としてさ
らに重度の障害を引き起こす可能性があった。
【0008】以下に、従来のREAD動作に関する課題
を説明する。図6に、本発明に関連するLAN接続装置
を有するホストコンピュータの構成図を示す。ホストコ
ンピュータ(600)は、LPAR1(601)のO
S、LPAR2(602)のOS、ホストコンピュータ
の命令プロセッサ(Instruction Processor、IP)
(603)、入出力命令に使用する起動キュー(60
4)、入出力命令に使用する割り込みキュー(60
5)、ホストコンピュータに内蔵されているLAN接続
装置(606)を備える。LPAR1(601)のOS
は、LAN(607)と接続される。
【0009】通常、LPAR1(601)のホストOS
のREAD処理は、先にREADコマンドを発行し、そ
の終了割込みを待ち、終了を確認すると、次READコ
マンドを発行する方式を採用している。従って、REA
Dコマンドは常に発行された状態であり、 LAN接続
装置(606)はLAN(607)からのデータを待
ち、LAN(607)からデータが到着した時点で、L
PAR1(601)へのデータ読み込み動作を行うのが
一般的である。
【0010】ところが、LAN(607)からのデータ
は、いつ到着するか予想できない。従って、LPAR1
(601)のOSは、このREADコマンドの終了に対
する時間監視を行うことができない。READコマンド
の起動、終了割込みが、ハードウエアの一時的な障害に
より、起動キュー(604)、あるいは割込みキュー
(605)から脱落したとしても、LPAR1(60
1)のOSは、その障害を検出できず、結果として、L
AN接続装置の内部のデーターバッファは、当該OSに
対するデータで埋めつくされ、LPAR1(601)の
みならず、当LAN接続装置(606)を共有している
他システムであるLPAR2(602)でも、通信障害
等の影響が発生する。
【0011】また、LPAR1(601)のOSが不当
にウェイトした場合も同様である。OSがウェイトして
いる為、READコマンドは発行されず、結果として、
上述と同様にLAN接続装置内部のデータバッファは、
当該OSに対するデータで埋めつくされ、当LAN接続
装置(606)を共有している他システムのLPAR2
(602)でも、通信障害等の影響が発生する。
【0012】LAN接続装置(606)でない、ディス
ク装置、MT装置など他の入出力装置の場合は、REA
Dコマンドに対する時間監視が可能である。従ってLP
AR(601)OSは時間監視を実施し、タイムアウト
した際には、例えばHALT/CLEAR命令と言っ
た、リカバリ系の命令が発行される。ホストコンピュー
タ(600)のハードウェアは、これらの命令を契機と
して、起動キュー、割込みキューの正常性をチェック
し、異常を検出したならば、キューの回復を行ってい
る。しかしながら、先に述べた様にLAN接続装置(6
06)に関しては、READコマンドの時間監視を行え
ない為、 HALT/CLEAR命令等は発行されず、
各キューの正常性チェックを行う契機がない。
【0013】本発明は、以上の点に鑑み、特に、複数の
システムから共有されるLAN接続装置を有するホスト
コンピュータにおいて、信頼性を向上することを目的と
する。また、本発明は、プログラム、ハードウェアの通
常処理におけるオーバヘッド無しに、OSの不当なウェ
イトを検知し、OSがウェイトしていた場合には、当該
OSに対するデータを破棄し、共有している他システム
に影響を与えず、動作を継続することを目的とする。ま
た、本発明は、ハードウエアの障害等でREADコマン
ドが起動キュー、再起動キュー、または、割り込みキュ
ーから脱落した場合でも、 LAN接続装置内バッファ
使用量の規定値オーバー、あるいはREADコマンド待
ち時間の規定時間オーバーを契機として、入出力動作で
使用する各種キューを回復することで、正常な動作を継
続し、共有している他システムに影響を与えない高信頼
性のLAN接続装置を提供することを目的とする。
【0014】
【課題を解決するための手段】本発明に関するホストコ
ンピュータでは、内蔵されるLAN接続装置に於いて、
例えば、次の(1)〜(7)の手段を備える事で、上述
のような課題を解決する。 (1)OS(基本ソフト)が不当ウェイトしたことを検
出した際に、ホストコンピュータに内蔵されるLAN接
続装置に対し、OSの動作不能状態を通知するOS動作
不能通知手段 (2)OSの動作不能状態通知を受領した際に、当該O
Sに対するLAN接続装置内送信データを破棄するデー
タ破棄手段 (3)LANから受信したデータを格納するLAN接続
装置の内部バッファ使用量を、接続システム毎に判定可
能なバッファ使用量判定手段 (4)READコマンドの終了報告から、次READコ
マンドの起動を受領する迄の時間を監視するREADコ
マンド待ち時間監視手段 (5)バッファ使用量が規定値以上の場合、あるいはR
EADコマンドの終了報告から、次READコマンドの
起動を受領する迄が規定時間以上である場合は、入出力
動作で使用する各種キューのチェックを指示するキュー
チェック指示手段 (6)指示を受けキューチェックを行うキューチェック
実行手段 (7)キューチェックにより、起動が起動キュー、ある
いは割込みが割込みキューから抜け落ちていた場合は、
キューへのつなぎこみを行う起動・割込みキュー回復手
【0015】本発明の第1の解決手段によると、計算機
システムのハードウェア資源を論理的に分割して、複数
のプロセッサとして使用する機構におけるネットワーク
接続装置の制御方法であって、基本ソフトウェアが不当
ウェイトしたことを検出した際に、ホストコンピュータ
に関連するネットワーク接続装置に対し、基本ソフトウ
ェアの動作不能状態を通知するステップと、基本ソフト
ウェアの動作不能状態の通知に基づき、 当該基本ソフ
トウェアに対するデータをネットワーク接続装置内のバ
ッファから破棄することにより、バッファを開放するス
テップとを含むネットワーク接続装置の制御方法を提供
する。
【0016】本発明の第2の解決手段によると、計算機
システムのハードウェア資源を論理的に分割して、複数
のプロセッサとして使用する機構におけるネットワーク
接続装置の制御方法であって、ネットワークから受信し
たデータを格納するネットワーク接続装置のバッファ使
用量が規定値を超えているか検出するステップと、バッ
ファ使用量が規定値以上と判定された場合、入出力動作
で使用する各種キューのチェックを指示するステップ
と、この指示を受けキューチェックを行うステップと、
起動が起動キューあるいは割込みが割込みキューから脱
落していた場合は、脱落した起動キューあるいは割込み
キューを回復するステップとを含むネットワーク接続装
置の制御方法を提供する。
【0017】本発明の第3の解決手段によると、計算機
システムのハードウェア資源を論理的に分割して、複数
のプロセッサとして使用する機構におけるネットワーク
接続装置の制御方法であって、読出しコマンドの終了報
告から、次の読出しコマンドの起動を受領する迄の時間
を監視し、規定時間を超えているか検出するステップ
と、規定時間を過ぎても次の読出しコマンドが発行され
ていないと判断された場合、入出力動作で使用する各種
キューのチェックを指示するステップと、この指示を受
けキューチェックを行うステップと、起動が起動キュー
あるいは割込みが割込みキューから脱落していた場合
は、脱落した起動キューあるいは割込みキューを回復す
るステップとを含むネットワーク接続装置の制御方法を
提供する。
【0018】
【発明の実施の形態】以下に、本発明の実施の形態を図
面を用いて詳細に説明する。まず、LAN接続装置を有
するホストコンピュータの動作について具体的に説明す
る。図1は、LAN接続装置を有するホストコンピュー
タの基本構成図を示している。ホストコンピュータ(0
0)は、LPAR1(01)のOS(オペレーティング
システム、基本ソフトウェア)、LPAR2(02)の
OS、ホストコンピュータの命令プロセッサ(Instruct
ion Processor、IP)(03)、入出力命令に使用す
る起動キュー(04)、入出力命令に使用する割り込み
キュー(05)、ホストコンピュータに内蔵されている
LAN接続装置(06)を備える。LPAR1(01)
のOSは、LAN(07)と接続される。LPAR1
(01)のOS、LPAR2(02)のOSは、それぞ
れ、LPAR1(01)のOSで使用しているメインメ
モリ(MS)(011)、LPAR2で使用しているM
S(021)を有する。IP(03)は、OS動作不能
通知手段(031)、キューチェック実行手段(03
2)、起動・割込みキュー回復手段(033)を有す
る。LAN接続装置(06)は、LAN接続装置内のデ
ータバッファ(061)、LAN接続装置内のLANボ
ード(062)、データ破棄手段(063)、バッファ
使用量判定手段(064)、キューチェック指示手段
(065)、READコマンド待ち時間監視手段(06
6)、データバッファ制御手段(067)を有する。こ
れら各手段に関しては、図2、図3および図4を用い、
後で詳しく説明する。
【0019】LPARは、資源分割管理機構である。本
実施の形態では、ひとつのホストコンピュータ(ハード
ウェア)(00)を、LPAR1(01)のOS、LP
AR2(02)のOSの二つのシステムに分割して使用
し、LAN接続装置は、これら二つのシステムで共用さ
れている。実際の使用環境下では、さらに複数のシステ
ムで共用される場合が多いが、ここでは、説明を簡単化
する為に本構成で説明する。
【0020】まず、OS−LAN間のデータの流れにつ
いてLPAR1(01)での動作を例に説明する。 L
AN接続装置(06)の動作として、 MS(011)
からLAN(07)へデータを転送するWRITE動作
と、 LAN(07)からのデータを、ホストMS(0
11)へ読み込むREAD動作があるが、本発明は、特
に、READ動作に関するものである。以下にREAD
動作について説明する。
【0021】LPAR(01)のOSは、MS(01
1)上にデータを格納する為のエリアを準備し、LAN
接続装置(06)に対して、READコマンドのスター
ト起動を発行する、スタート起動は、一旦起動キュー
(04)に登録され、その後、起動キュー(04)の先
頭から取り出され、 LAN接続装置(06)が起動さ
れる。この時点でLAN接続装置内のデータバッファ
(061)にLPAR1(01)宛てのデータが無い場
合は、本起動は待たされ、 LAN接続装置(06)は
LAN(07)からのデータ到着を待つ。LAN(0
7)からデータが届くとLAN接続装置(06)は、L
ANボード(062)を介してデータを受領し、LAN
接続装置内部のデータバッファ(061)に格納する。
ホストLPAR(01)のOSからのREADコマンド
のスタート起動が発行されている場合は、コマンドの指
示に従って、データバッファ(061)からMS(01
1)に対してデータを書込み、終了したら、その結果を
割込みキュー(05)に登録し、LPAR1(01)の
OSに割込む。もしもREADコマンドのスタート起動
が発行されていない場合は、LPAR1(01)のホス
トOSからのREADコマンドのスタート起動を待つこ
とになる。
【0022】本発明においては、例えば、通常のよう
に、LPAR1(01)のホストOSのREAD処理
は、先にREADコマンドを発行し、その終了割込みを
待ち、終了を確認すると、次READコマンドを発行す
る方式を採用している。従って、READコマンドは常
に発行された状態であり、 LAN接続装置(06)は
LAN(07)からのデータを待ち、LAN(07)か
らデータが到着した時点で、ホストMS(011)への
データ読み込み動作を行うのが一般的である。
【0023】図2は、OSが不当ウェイトしたケースの
処理概要の説明図を示す。ここでは、一例として、LP
AR(01)のOSについて説明する。まず、図2のO
Sが不当にウェイトしたケースの処理概要を説明図を示
す。LPAR(01)のOSの不当なウェイトは、IP
(03)がPSW(プログラム・ステータス・ワード)の
ウェイトフラグを参照すること、また資源分割管理機構
を使用している場合は、資源分割管理機構がゲストOS
の不当ウェイトを検出し(「動作不能状態発生」)、I
P(03)に通知することにより検出される(「動作不
能状態検出」)。LPAR(01)のOSの不当なウェ
イトの検出に関しては、既知の技術である。ここでの詳
細な説明は省略する。LPAR(01)のOSの不当な
ウェイトを検出したIP(03)は、OS「動作不能通
知手段(031)」を用いてLAN接続装置(06)に
通知する。OSの動作不能状態通知を受領したLAN接
続装置(06)は(「OS動作不能状態受領」)、「デ
ータの破棄手段(063)」を用いて、当該LPAR
(01)のOSに対する転送データを破棄し、LAN接
続装置(06)を共有している他システムには影響を与
えず連続使用を可能とする。
【0024】次に、図3に、バッファ使用量判定手段に
よるリカバリについてのキュー障害における処理概要の
説明図を示す。以下に、各種キューから起動、あるいは
割込みが脱落したキュー障害のケースの処理概要を説明
する。
【0025】起動キュー、割込みキューを更新中にハー
ドウエア障害が発生すると、リカバリが正常に行われて
いても、起動、割込み要因が各キューから脱落すること
がある。ここで、ハードウェア障害とは、例えば、IP
(03)から起動キュー(04)へのキュー登録、起動
キュー(04)からLAN接続装置(06)へのキュー
取り出し、LAN接続装置(06)から割込みキュー
(05)へのキュー登録、又は、割込みキュー(05)
からIP(03)へのキュー取り出しのいずれか又は複
数に関するハードウェアについての障害である。
【0026】まず、この図は、バッファ使用量判定手段
によるリカバリを、起動キューから起動要因が脱落した
ケースを例に示している。なお、割込みキューについて
も同様にバッファ使用量判定手段によりリカバリするこ
とができる(この点については、以下の説明中かっこ内
を参照)。
【0027】LPAR(01)のOSが「READ起動
発行」を行うと、IP(03)は「起動キュー登録」を
行う(かぎかっこは図との対応を示す。以下同様)。こ
こで、「ハードウェア障害発生」により、READコマ
ンドの起動(あるいは割込み)がこれらキューから脱落
すると、 LPAR(01)のOSはコマンドの終了を
待ち続ける為、その後のREADコマンドが発行され
ず、LAN接続装置(06)内のデータバッファに転送
すべきデータが蓄積される。 LAN接続装置(06)
は、「バッファ使用量判定手段(064)」により、当
該システムに対する送信データが規定値をオーバーして
いることを検出し、「キューチェック指示手段(06
5)」により、IP(03)に対し当該転送に関する、
起動キュー・(割込みキュー)のチェックを指示する。
IP(03)は、「キューチェック指示受領」に従い、
起動キュー(割込みキュー)についての「キューチェッ
ク実行手段(032)」によりキューのチェックを実行
し、キューに関する要因がキューから脱落していた場合
は、「キューの回復手段(033)」を用いてキューを
回復する。その後、IP(03)は、LAN接続装置
(06)を「起動」し、LAN接続装置(06)は「起
動受領(データ転送)」を行う。LAN接続装置(0
6)の「終了(終了割込み)」、IP(03)の「割込
みキュー登録」及びLPAR1(01)のOSの「終了
割込み受領」を経て、割込みが正しくキューに登録され
る。このようにして、LAN接続装置(06)は、正常
動作を継続可能となる。
【0028】図4に、READコマンド待ち時間監視手
段によるリカバリについてのキュー障害における処理概
要の説明図を示す。この図は、READコマンド待ち時
間監視手段によるリカバリを、割込みキューから割込み
要因が脱落したケースを例に示している。なお、起動キ
ューについても同様にREADコマンド待ち時間監視手
段により、リカバリすることができる(以下の説明中か
っこ内参照)。
【0029】LPAR(01)のOSが「READ起動
発行」を行うと、IP(03)が「起動キュー登録」
後、LAN接続装置(06)を「起動」する。LAN接
続装置(06)は「起動受領(データ転送)」により、
「終了(終了割込み)」をIP(03)に送り、IP
(03)は「割込みキュー登録」を行う。LAN接続装
置(06)は、READコマンド待ち時間監視手段(0
66)により、READコマンドの終了報告を行ってか
ら、次READコマンドの起動を受領する迄の時間を監
視する。上述のようにハードウェアの障害が発生し、R
EADコマンド割込み(あるいは起動)が各キューから
脱落すると、 LPAR(01)のOSはコマンドの終
了を待ち続ける為、その後のREADコマンドが発行さ
れない。 LAN接続装置(06)は、「READコマ
ンド待ち時間監視手段(066)」により、 READ
コマンドの待ち時間が規定時間をオーバーした場合、
「キューチェック指示手段(065)」により、IP
(03)に対し当該転送に関する、割込みキュー(起動
キュー)のチェックを指示する。「キューチェック指示
受領によりIP(03)は、「起動・割込みキューのチ
ェック実行手段(032)」で、キューのチェックを実
行し、キュー障害が発生していた場合は、「キューの回
復手段(033)」を用いてキューを回復する。LPA
R(01)のOSは、IP(03)からの「終了割込み
受領」により、「次READ起動発行」を行う。IP
(03)が「起動キュー登録」後、LAN接続装置(0
6)を「起動」する。LAN接続装置(06)は「起動
受領(データ転送)」により、「終了(終了割込み)」
をIP(03)に送り、IP(03)は「割込みキュー
登録」を行い、LPAR(01)のOSは「終了割込み
受領」をする。こうして、割込みが正しくキューに登録
されることにより、LAN接続装置(06)は、正常動
作を継続可能となる。
【0030】本実施の形態では、一例としてIP(0
3)により、キューのチェックとキューの回復を行う例
を示した。キューのチェックとキューの回復は、キュー
の更新を行えるユニットであれば、どのユニットが実施
しても良く、本方式は適用可能である。
【0031】また、キューチェック、キューの回復処理
は従来技術の範疇であり、ここでは詳しく説明しないが
以下に補足する。起動キュー、割込みキューの作りは、
装置により様々あり、一般的な例を上げて説明する。一
般に、キューには、デバイス情報(サブチャネル情報)の
番号が登録される。デバイス情報は、入出力動作を行う
入出力装置(入出力経路)の情報であり、入出力装置と1
対1に対応している。この情報の中に起動の有無、起動
の種類、割込みを保留しているか否か、起動キューある
いは割込みキューに登録されているか否かを示す制御フ
ラグ等も含まれる。LAN接続装置(06)は、REA
D命令が発行されず、障害を起こす可能性があるとキュ
ーチェックを指示する。IP(03)は、キューチェッ
クが指示されると、キューチェックを要求した入出力装
置の番号から、デバイス情報を読み、未処理の起動が有
るか、未処理の割込みが有るか、あるいは起動キュー、
割込みキューに登録されているか否かを示す制御フラグ
(起動・割込みキュー登録フラグ)が‘1’かを調べる。
未処理の起動が有る、あるいは起動キュー登録フラグが
‘1’の場合は、起動キューの先頭から、キューに登録
されている入出力装置(デバイス情報の番号)を調査し、
当該入出力装置が登録されていなければ、キューからの
脱落が発生していると判断し、当該入出力装置を再度キ
ューイングする。さらにキューの情報として、キュー長
(キューに登録されている装置の数)を持っている場合、
上述のようなキューのチェックにより、キュー長の矛盾
が発生していても、キュー長の書き換えが行われる。起
動キューに関して説明したが、割込みキューに関しても
同様である。
【0032】次に、 LAN接続装置内部のデータバッ
ファ(061)の使用例と、バッファ使用量判定手段
(064)を説明する。図5は、LAN接続装置内部の
データバッファ(061)の使用例の説明図を示してい
る。有効なディスクリプタの位置を示すポインタ(50
1)〜(50n)は、LPAR1の有効なディスクリプ
タのスタートポインタ(001)、LPAR1の有効な
ディスクリプタのエンドポインタ(002)、LPAR
nの有効なディスクリプタのスタートポインタ(01
1)、LPARnの有効なディスクリプタのエンドポイ
ンタ(012)を含む。レジスタ(003)及び(01
3)は、当該LPARに対するバッファ使用量、あるい
は有効ディスクリプタ数の上限を設定する規定値を記憶
する。LAN接続装置内部のデータバッファ(061)
は、内部バッファ内のデータのアドレスとデータ長を示
すディスクリプタ(03)及び(04)、転送データ
(050)〜(052)及び(060)〜(062)を
含む。
【0033】つぎに、 LAN接続装置(06)のデー
タ受信動作について説明する。データバッファ制御手段
(067)は、LAN(07)からデータを受信する
と、 LAN接続装置内部のデータバッファ(061)
にデータを格納し、データの中に記述されているIP
(インターネット・プロトコル)アドレスから、どのL
PAR(システム)に対するデータであるかを判断し、対
応するLPARのエンドポインタ(002/012)で
示されるディスクリプタ(03/04)に、データを格
納したアドレスとデータ長を書き込み、当該LPARの
ディスクリプタのエンドポインタ(002/012)を
更新し、作成したディスクリプタを有効にする。
【0034】また、データバッファ制御手段(067)
は、ホストOSからREADコマンドの起動が発行され
ると、コマンドが発行されたLPARのポインタ(00
/01)を参照し、有効なディスクリプタが存在する場
合は、スタートポインタ(001/011)で示される
ディスクリプタ(03/04)を読出し、ディスクリプ
タに書かれているアドレスとデータ長に従い、ホストの
メインメモリにデータを転送し、当該スタートポインタ
(001/011)を更新して処理したディスクリプタ
を無効とする。
【0035】次にLAN接続装置内のバッファ使用量の
計測方法について、図5のLPAR1を例にとり説明す
る。LPAR1のスタートポインタ(001)とエンド
ポインタ(002)の値を参照すると、LPAR1に対
する有効なディスクリプタ(03)が特定できる。バッ
ファ使用量判定手段(064)は、この有効なディスク
リプタを読込みディスクリプタに記述されているカウン
ト(データ長)を全て加算することにより、LAN接続
装置バッファ内のLPAR1に転送すべきデータの量を
算出する。
【0036】バッファ使用量判定手段(064)は、デ
ータを受信し、エンドポインタ(002/012)を更
新する際、あるいは定期的にスタートポインタ(001
/011)とエンドポインタ(002/012)の値か
ら、有効なディスクリプタの数を計算し、有効なディス
クリプタ数が当該LAN接続装置で許されている規定値
(003/013)に達した時、あるいは上記方法で有
効なディスクリプタ(03/04)より、当該LPAR
に転送すべきデータの量を算出し、データ量が規定値
(003/013)を超過していた場合は、コマンド起
動の障害を想定してリカバリ処理を実行する。
【0037】本実施例では、LAN接続装置バッファ内
の特定番地にディスクリプタを設けているが、 ディス
クリプタをLAN接続装置内専用のレジスタに設けるこ
と、またポインタをバッファ内に設けること等、接続シ
ステム毎にLAN接続装置内のデータ量が推定可能な構
成であれば、いずれも本方式は適用可能であり、本発明
の範疇である。
【0038】
【発明の効果】本発明によると、以上のように、特に、
複数のシステムから共有されるLAN接続装置を有する
ホストコンピュータにおいて、信頼性を向上することが
できる。また、本発明によると、プログラム、ハードウ
ェアの通常処理におけるオーバヘッド無しに、OSの不
当なウェイトを検知し、OSがウェイトしていた場合に
は、当該OSに対するデータを破棄し、共有している他
システムに影響を与えず、動作を継続することができ
る。また、本発明によると、ハードウエアの障害等でR
EADコマンドが起動キュー、再起動キュー、または、
割り込みキューから脱落した場合でも、 LAN接続装
置内バッファ使用量の規定値オーバー、あるいはREA
Dコマンド待ち時間の規定時間オーバーを契機として、
入出力動作で使用する各種キューを回復することで、正
常な動作を継続し、共有している他システムに影響を与
えない高信頼性のLAN接続装置を提供することができ
る。
【図面の簡単な説明】
【図1】LAN接続装置を有するホストコンピュータの
基本構成図。
【図2】OSが不当ウェイトしたケースの処理概要の説
明図。
【図3】バッファ使用量判定手段によるリカバリについ
てのキュー障害における処理概要の説明図。
【図4】READコマンド待ち時間監視手段によるリカ
バリについてのキュー障害における処理概要の説明図。
【図5】LAN接続装置内部のデータバッファの使用例
の説明図。
【図6】LEN接続装置を有するホストコンピュータの
構成図。
【符号の説明】
00 :ホストコンピュータ 01 :資源分割管理機構におけるLPAR1の基本ソ
フト 011:LPAR1で使用するメインメモリ 02 :資源分割管理機構におけるLPAR2の基本ソ
フト 021:LPAR2で使用するメインメモリ 03 :ホストコンピュータのハードウェア内IP 04 :入出力処理に使用する起動キュー 05 :入出力処理に使用する割込みキュー 06 :LAN接続装置 061:LAN接続装置内データバッファ 062:LAN接続装置内LANボード 07 :LAN環境
───────────────────────────────────────────────────── フロントページの続き (72)発明者 宮越 利晋 神奈川県秦野市堀山下1番地 株式会社日 立製作所エンタープライズサーバ事業部内 Fターム(参考) 5B014 GD25 HA10 HA14 5B042 GA12 GA23 GB09 JJ17 JJ42 KK04 KK09 5B098 AA09 FF02 GB05 GD05 GD22 JJ08

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】計算機システムのハードウェア資源を論理
    的に分割して、複数のプロセッサとして使用する機構に
    おけるネットワーク接続装置の制御方法であって、 基本ソフトウェアが不当ウェイトしたことを検出した際
    に、ホストコンピュータに関連するネットワーク接続装
    置に対し、基本ソフトウェアの動作不能状態を通知する
    ステップと、 基本ソフトウェアの動作不能状態の通知に基づき、 当
    該基本ソフトウェアに対するデータをネットワーク接続
    装置内のバッファから破棄することにより、バッファを
    開放するステップとを含むネットワーク接続装置の制御
    方法。
  2. 【請求項2】計算機システムのハードウェア資源を論理
    的に分割して、複数のプロセッサとして使用する機構に
    おけるネットワーク接続装置の制御方法であって、 ネットワークから受信したデータを格納するネットワー
    ク接続装置のバッファ使用量が規定値を超えているか検
    出するステップと、 バッファ使用量が規定値以上と判定された場合、入出力
    動作で使用する各種キューのチェックを指示するステッ
    プと、 この指示を受けキューチェックを行うステップと、 起動が起動キューあるいは割込みが割込みキューから脱
    落していた場合は、脱落した起動キューあるいは割込み
    キューを回復するステップとを含むネットワーク接続装
    置の制御方法。
  3. 【請求項3】計算機システムのハードウェア資源を論理
    的に分割して、複数のプロセッサとして使用する機構に
    おけるネットワーク接続装置の制御方法であって、 読出しコマンドの終了報告から、次の読出しコマンドの
    起動を受領する迄の時間を監視し、規定時間を超えてい
    るか検出するステップと、 規定時間を過ぎても次の読出しコマンドが発行されてい
    ないと判断された場合、入出力動作で使用する各種キュ
    ーのチェックを指示するステップと、 この指示を受けキューチェックを行うステップと、 起動が起動キューあるいは割込みが割込みキューから脱
    落していた場合は、脱落した起動キューあるいは割込み
    キューを回復するステップとを含むネットワーク接続装
    置の制御方法。
JP2000289047A 2000-09-22 2000-09-22 ネットワーク接続装置の制御方法 Expired - Fee Related JP4205843B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000289047A JP4205843B2 (ja) 2000-09-22 2000-09-22 ネットワーク接続装置の制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000289047A JP4205843B2 (ja) 2000-09-22 2000-09-22 ネットワーク接続装置の制御方法

Publications (2)

Publication Number Publication Date
JP2002099437A true JP2002099437A (ja) 2002-04-05
JP4205843B2 JP4205843B2 (ja) 2009-01-07

Family

ID=18772523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000289047A Expired - Fee Related JP4205843B2 (ja) 2000-09-22 2000-09-22 ネットワーク接続装置の制御方法

Country Status (1)

Country Link
JP (1) JP4205843B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680965B2 (en) 2004-09-16 2010-03-16 Hitachi, Ltd. Data processing system having a channel adapter shared by multiple operating systems
JP2010079468A (ja) * 2008-09-25 2010-04-08 Hitachi Ltd ファイルサーバリソース分割方法、システム、装置及びプログラム
JP2013541091A (ja) * 2010-09-14 2013-11-07 マイクロソフト コーポレーション メッセージキュー管理

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680965B2 (en) 2004-09-16 2010-03-16 Hitachi, Ltd. Data processing system having a channel adapter shared by multiple operating systems
US7877526B2 (en) 2004-09-16 2011-01-25 Hitachi, Ltd. Data processing system having a channel adapter shared by multiple operating systems
JP2010079468A (ja) * 2008-09-25 2010-04-08 Hitachi Ltd ファイルサーバリソース分割方法、システム、装置及びプログラム
JP2013541091A (ja) * 2010-09-14 2013-11-07 マイクロソフト コーポレーション メッセージキュー管理

Also Published As

Publication number Publication date
JP4205843B2 (ja) 2009-01-07

Similar Documents

Publication Publication Date Title
US7003775B2 (en) Hardware implementation of an application-level watchdog timer
JP4468426B2 (ja) 高可用システム及び実行状態制御方法
US9430266B2 (en) Activating a subphysical driver on failure of hypervisor for operating an I/O device shared by hypervisor and guest OS and virtual computer system
US7424666B2 (en) Method and apparatus to detect/manage faults in a system
CN108121630B (zh) 电子装置、重新启动方法及记录媒介
US7672247B2 (en) Evaluating data processing system health using an I/O device
CN111273923B (zh) 基于PCIe接口的FPGA升级方法
KR20000006576A (ko) 디지탈데이터처리시스템내의다수의호스트컴퓨터사이에서자원의공유를용이하게하기위한시스템
JP2002082816A (ja) 障害監視システム
US5805791A (en) Method and system for detection of and graceful recovery from a peripheral device fault
US5983359A (en) Processor fault recovering method for information processing system
US8839268B2 (en) Method and system of preventing silent data corruption
US8156386B2 (en) Information processing apparatus, and method and computer program for controlling same, for detecting certain failures
JP2006285384A (ja) プロセッサ障害処理方式、管理プロセッサ及びプロセッサ障害処理方法
EP3748496A1 (en) Parallel processing apparatus
US8028189B2 (en) Recoverable machine check handling
JP2002099437A (ja) ネットワーク接続装置の制御方法
JP4487756B2 (ja) コンピュータシステム及びシステム監視プログラム
JP2018092571A (ja) 電子装置、再起動方法およびプログラム
JP4572138B2 (ja) サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法
US9176806B2 (en) Computer and memory inspection method
KR102211853B1 (ko) 이종의 멀티 cpu가 탑재된 시스템-온-칩 및 cpu 리부팅을 제어하는 방법
JP2004334863A (ja) 順番のある(in−order)キューをドレインする(drain)システムおよび方法
JP2001101034A (ja) 異種os間制御による障害復旧方法
EP3729271B1 (en) Devices with networking functionality

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050126

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20070220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070314

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070410

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081017

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees