JP2002229806A - 計算機システム - Google Patents

計算機システム

Info

Publication number
JP2002229806A
JP2002229806A JP2001026825A JP2001026825A JP2002229806A JP 2002229806 A JP2002229806 A JP 2002229806A JP 2001026825 A JP2001026825 A JP 2001026825A JP 2001026825 A JP2001026825 A JP 2001026825A JP 2002229806 A JP2002229806 A JP 2002229806A
Authority
JP
Japan
Prior art keywords
hardware
information
computer
management
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001026825A
Other languages
English (en)
Inventor
Toshiaki Arai
Hiroshi Furukawa
Hiroyuki Igata
Kenichi Shimooka
健一 下岡
博之 井形
博 古川
利明 新井
Original Assignee
Hitachi Ltd
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, 株式会社日立製作所 filed Critical Hitachi Ltd
Priority to JP2001026825A priority Critical patent/JP2002229806A/ja
Publication of JP2002229806A publication Critical patent/JP2002229806A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs

Abstract

(57)【要約】 【課題】 複数のOSを稼働させるオープン系計算機に
おいて、ハードウェア資源の構成管理、障害監視、制御
を可能にする。 【解決手段】 各パーティション211上で動作する管
理エージェント2111は、管理コンソール10との通
信、各パーティション211上で発生したハードウェ
ア、ソフトウェアの障害情報の管理、分割制御部221
との通信を行う。分割制御部221は、パーティション
構成情報2211を利用して、各パーティション211
に割り当てられているハードウェアの管理、制御、およ
びハードウェア231と管理エージェント2111との
通信の仲介を行う。ハードウェア情報収集部23111
は、計算機内の全ハードウェアの構成情報の管理、状態
や障害の監視を行う。

Description

【発明の詳細な説明】

【0001】

【発明の属する技術分野】本発明は、仮想計算機、論理
分割計算機、物理分割計算機などの計算機システムに関
し、特に、そのような計算機システムにおける計算機内
ハードウェア資源の構成管理、障害監視、制御に関す
る。

【0002】

【従来の技術】従来、基幹業務などの重要業務には、メ
インフレーム系計算機が利用されていた。メインフレー
ム系計算機は、一般に、特定のハードウェアアーキテク
チャとその特定アーキテクチャを対象とした特定のオペ
レーティングシステムで構成される。このようなメイン
フレーム系計算機におけるハードウェア資源の構成管
理、障害監視、制御は、計算機本体とは別に設けられる
専用の監視装置や端末により実現されていた。そして、
管理者は、ネットワークを介した1台の管理コンソール
で、専用監視装置等により収集された、計算機内のハー
ドウェア資源情報を管理、監視、制御するのが一般的で
あった。

【0003】メインフレーム系計算機におけるハードウ
ェア資源の管理、監視、制御で、このような構成が採用
された理由は、基幹業務などの重要業務に利用されてお
り、システムとして重要であるので、計算機本体とは異
なる専用監視装置等を用意することが必要であり、ま
た、管理すべき台数が少ないため、専用監視装置等を設
けることが容易でもあったからである。

【0004】また、メインフレーム系計算機において
は、従来から、1台の計算機内で複数のオペレーティン
グシステムを並列稼働させる、仮想計算機、論理分割計
算機、物理分割計算機などの計算機システムが知られて
いる。このような計算機システムにおいても、ハードウ
ェア資源の構成管理等は、単数のオペレーティングシス
テムを稼働させる計算機システムと同様に実現されてい
た。仮想計算機における従来例としては、例えば、特開
平9−171475号公報や特開平8−227406号
公報などが挙げられる。

【0005】一方、パーソナルコンピュータやワークス
テーションなどのオープンハードウェアアーキテクチャ
と、そのアーキテクチャを対象とした汎用的なオペレー
ティングシステムで構成されるオープン系計算機は、こ
れまで計算機自身の性能の関係上、基幹業務に利用され
ることは少なかった。また、複数のオペレーティングシ
ステムを稼働させる計算機システムの構成を採ることも
極稀であった。更に、オープン系計算機を使って構成さ
れるシステムは、一般に、メインフレーム系計算機を使
って構成されるシステムに比べて、計算機の台数が多く
なり、各計算機に専用監視装置等を設けることは容易で
はなかった。

【0006】そのため、オープン系計算機では、通常
は、オペレーティングシステム上で動作する管理エージ
ェントが計算機内のハードウェア資源の構成管理、障害
監視、制御を実行し、管理者は、ネットワークを介した
管理コンソールで、計算機内のハードウェア資源情報を
管理、監視、制御していた。また、致命的なハードウェ
ア障害に対応するため、一部のサーバ系計算機において
は、本体ハードウェア資源を管理、監視、制御するため
の装置が設けられることもあったが、当該装置は、比較
的簡易な本体内蔵可能な拡張ボードなどで実現されるこ
とが多かった。このような従来例としては、例えば、特
開平9−50386号公報が挙げられる。

【0007】

【発明が解決しようとする課題】しかし、近年、メイン
フレーム系計算機とオープン系計算機の性能差も縮ま
り、オープン系計算機が基幹系業務の中枢システムとし
て利用されるケースも増加している。また、計算機の管
理もメインフレーム系、オープン系の区別なく統合管理
することが望まれている。更に、基幹系業務への対応の
ため、オープン系計算機でも、複数のオペレーティング
システムを稼働させる構成の計算機システムを実現する
ことが望まれている。

【0008】前述したように、従来のメインフレーム系
の管理方式では、ハードウェア資源の管理、監視、制御
のための専用監視装置等が存在していることが前提であ
った。一方、オープン系計算機には、その台数の多さか
ら専用監視装置等が存在しないことが多く、また、たと
え存在したとしても、その管理機能は簡略化されている
場合が多かった。つまり、メインフレーム系計算機と同
様な管理構成が実現されてはいなかった。更に、オープ
ン系計算機で、複数のオペレーティングシステムを稼働
させる計算機システムのハードウェア資源を管理するた
めの構成は、これまで検討さえされていなかった。

【0009】本発明の目的は、複数のオペレーティング
システムを稼働させる計算機システム構成を採ったオー
プン系計算機における、ハードウェア資源管理方式を提
供することにある。

【0010】

【課題を解決するための手段】本発明に係る計算機シス
テムは、1台の計算機のハードウェア上で、複数のOS
を稼働させる計算機システムである。そして、各OS上
で実行され、当該OSの管理を行う管理エージェント
と、各OSとハードウェアとの対応関係を示すパーティ
ション構成情報を保持し、各OSに対するハードウェア
の割り当て制御を行う分割制御部と、前記ハードウェア
の情報収集を行うハードウェア情報収集部とを備え、前
記パーティション構成情報を利用して、各OS毎のハー
ドウェア管理を行うことを特徴とする。

【0011】この場合に、前記複数のOSが稼働してい
る計算機の情報収集、障害受信、制御を行うための管理
コンソールを更に備えるようにしてもよい。

【0012】更に、前記管理コンソールから、ハードウ
ェア構成情報取得要求を受け取ると、前記管理エージェ
ントは、当該要求を、前記分割制御部に通知し、当該通
知を受けた分割制御部は、前記ハードウェア情報収集部
から、前記ハードウェアの情報を取得し、前記パーティ
ション構成情報を利用して、要求されたハードウェアに
関する情報を抽出して、前記管理エージェントに送り、
前記管理エージェントは、前記分割制御部から受け取っ
た情報を、前記管理コンソールに通知するようにしても
よい。

【0013】また、前記ハードウェア情報収集部は、ハ
ードウェアの障害発生を検知すると、障害情報を前記分
割制御部に通知し、前記分割制御部は、当該障害情報
を、障害が発生したハードウェアが割り当てられている
OSの管理エージェントに通知し、当該通知を受けた管
理エージェントは、通知された障害情報を、前記管理コ
ンソールに通知するようにしてもよいし、通知された障
害情報に基づいて、ソフトウェアの制御を行うようにし
てもよい。

【0014】また、前記管理エージェントは、ソフトウ
ェアの障害発生を検知すると、障害情報を前記分割制御
部に通知し、前記分割制御部は、当該障害情報に基づい
て、各OSに割り当てられているハードウェアの割当変
更制御又は各OSの起動制御を行うようにしてもよい。

【0015】本発明に係る別の計算機システムは、第1
のOS上で実行され、計算機の管理を行う統合管理エー
ジェントと、前記第1のOS以外のOS上で実行され、
当該OS上で実行されているソフトウェアの管理を行う
ソフトウェア管理エージェントと、各OSとハードウェ
アとの対応関係を示すパーティション構成情報を保持
し、各OSに対するハードウェアの割り当て制御を行う
分割制御部と、前記ハードウェアの情報収集を行うハー
ドウェア情報収集部とを備え、前記パーティション構成
情報を利用して、各OS毎のハードウェア管理を行うこ
とを特徴とする。

【0016】この場合において、前記複数のOSが稼働
している計算機の情報収集、障害受信、制御を行うため
の管理コンソールを更に備えるようにしてもよい。

【0017】更に、前記管理コンソールから、ハードウ
ェア構成情報取得要求を受け取ると、前記統合管理エー
ジェントは、当該要求を、前記分割制御部に通知し、当
該通知を受けた前記分割制御部は、前記ハードウェア情
報収集部から、前記ハードウェアの情報を取得し、前記
パーティション構成情報を利用して、要求されたハード
ウェアに関する情報を抽出して、前記統合管理エージェ
ントに送り、前記統合管理エージェントは、前記分割制
御部から受け取った情報を、前記管理コンソールに通知
するようにしてもよい。

【0018】また、前記ハードウェア情報収集部は、ハ
ードウェアの障害発生を検知すると、障害情報を前記分
割制御部に通知し、前記分割制御部は、当該障害情報
を、前記統合管理エージェントに通知し、前記統合管理
エージェントは、通知された障害情報を、前記管理コン
ソールに通知するようにしてもよいし、通知された障害
情報に基づいて、前記ソフトウェア管理エージェントを
介して、ソフトウェアの制御を行うようにしてもよい。

【0019】また、前記ソフトウェア管理エージェント
は、ソフトウェアの障害発生を検知すると、障害情報を
前記分割制御部に通知し、前記分割制御部は、当該障害
情報に基づいて、各OSに割り当てられているハードウ
ェアの割当変更制御又は各OSの起動制御を行うように
してもよい。

【0020】また、上述した計算機システムにおいて、
前記管理コンソールの指示に応じて、前記分割制御部
は、各OSに割り当てられているハードウェアの割当変
更処理又は各OSの起動制御を行うようにしてもよい。

【0021】

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しつつ詳細に説明する。なお、以下の説
明および図面の表記では、説明の便宜上、複数のオペレ
ーティングシステム(以下,OSと略記する)を稼働さ
せる計算機システムを分割システムと称し、単数OSを
稼働させる計算機システムを非分割システムと称するこ
ととする。 《第1実施形態》図1は、本発明が適用される計算機シ
ステムの構成例を示す図である。

【0022】同図に示すように、本計算機システムは、
管理コンソール10と、オープン系分割システム20
と、オープン系非分割システム30と、メインフレーム
系分割システム40と、メインフレーム系非分割システ
ム50とを備える。

【0023】管理コンソール10は、本計算機システム
における管理計算機であり、一方、オープン系分割シス
テム20、オープン系非分割システム30、メインフレ
ーム系分割システム40及びメインフレーム系非分割シ
ステム50は、管理コンソール10によって管理される
管理対象計算機である。

【0024】管理コンソール10は、ネットワーク60
を介して、複数台の管理対象計算機群20〜40と接続
されている。ネットワーク60は、例えば、ローカルエ
リアネットワーク(LAN)やワイドエリアネットワー
ク(WAN)、専用回線や電話回線、無線回線や有線回
線等により実現される。

【0025】同図では、説明を簡略化するため、各シス
テム20〜50の計算機は1台づつ示しているが、各種
類の計算機は、複数台存在してもよい。

【0026】管理コンソール10は、管理者が各管理対
象計算機のハードウェアの構成管理、障害監視、制御な
ど行うためのユーザインタフェースを提供するものであ
り、管理者の要求を受け付け、実行するものである。

【0027】オープン系分割システム20は、オープン
系計算機で実現される分割システムであり、メインフレ
ーム系分割システム40は、メインフレーム系計算機で
実現される分割システムである。

【0028】分割システム20,40は、それぞれ、複
数のOSが稼動可能な環境が提供された1台の計算機で
構成され、複数のOSが動作している。分割システムの
例としては、仮想計算機、論理分割計算機、物理分割計
算機などがある。

【0029】オープン系非分割システム30は、オープ
ン系計算機で実現される非分割システムであり、メイン
フレーム系非分割システム50は、メインフレーム系計
算機で実現される非分割システムである。

【0030】非分割システム30,50は、それぞれ、
1個のOSが稼動可能な環境が提供された1台の計算機
で構成され、1個のOSが動作している。

【0031】本実施形態では、管理コンソール10か
ら、ネットワーク60を介して接続される全ての種類の
計算機システム20〜50が管理可能である。すなわ
ち、各システム20〜50は、管理コンソール10から
見たとき、同様の管理用インタフェースを提供している
ので、管理コンソール10によって統合管理することが
可能になる。

【0032】以下、オープン系分割システム20におけ
るハードウェア資源管理方式について詳細に説明する。

【0033】図2は、オープン系分割システム20の構
成を示す図である。同図には、ハードウェア資源の構成
管理、障害監視、制御を行うために必要な構成が示され
ている。同図に示すように、オープン系分割システム2
0は、複数のパーティション211(A〜N)と、分割
制御部221と、ハードウェア231とを備える。

【0034】パーティション211は、それぞれ、1個
のOSが動作する単位であり、各パーティション211
は、1個のOS2110と、OS2110上で動作する
管理エージェント2111とを備える。

【0035】管理エージェント2111は、管理コンソ
ール10と、ネットワーク60を介して通信を行い、オ
ープン分割システム20の構成管理、障害監視、制御を
実現する。管理エージェント2111は、例えば、OS
2110上で動作するソフトウェア(プログラム)とし
て実装される。

【0036】同図に示すように、管理エージェント21
11は、外部通信部21111と、障害情報管理部21
112と、ログファイル21113と、ソフト障害監視
部21114と、分割制御通信部21115とを備え
る。

【0037】外部通信部21111は、管理コンソール
10との通信インタフェース(I/F)を提供するもの
である。ログファイル21113は、各パーティション
毎の障害情報を記録するものである。障害情報管理部2
1112は、ログファイル21113を管理し、管理コ
ンソール10や分割制御部221へ障害情報の通知等を
行うものである。ソフト障害監視部21114は、各パ
ーティション内で発生したソフトウェア障害を検知する
ものである。分割制御通信部21115は、分割制御部
221との通信I/Fを提供するものである。

【0038】また、分割制御部221は、分割システム
において、1台の計算機のハードウェアを各パーティシ
ョン211のOSに割振り制御するものである。分割制
御部221は、例えば、ファームウェア(プログラム)
として実装される。

【0039】同図に示すように、分割制御部212は、
パーティション構成情報2211と、通信中継部221
2と、パーティション構成管理制御部2213とを備え
る。

【0040】パーティション構成情報2211は、各パ
ーティション211とハードウェア231との対応関係
を示す情報であり、物理的構成割当や、割込アドレスや
メモリなどのリソース関係割当等を含む。パーティショ
ン構成情報2211の詳細については後述する。

【0041】通信中継部2212は、パーティション構
成情報2211を利用し、各パーティション211とハ
ードウェア231と間の通信を中継する。また、通信中
継部2212は、各パーティション211に割り当てる
ハードウェアの動的変更制御や、各パーティション21
1上のOS2110の起動、終了、強制終了などの起動
制御を行うため、管理エージェント2111等からの指
示を、パーティション構成管理制御部2213に中継す
る。

【0042】パーティション構成管理制御部2213
は、管理エージェント2111経由での指示や、ローカ
ルな入力装置を使った管理者による直接の指示等によ
り、各パーティション211の制御を実行すると共に、
パーティション構成情報2211の更新等の管理を行
う。

【0043】また、ハードウェア231は、オープン系
分割システム20を構成する計算機のハードウェアであ
り、本体ハードウェア群2311を備える。

【0044】同図に示すように、本体ハードウェア群2
311には、プロセッサ23112、プロセッサ温度セ
ンサ23113、プロセッサファン23114、メモリ
23115、入出力装置23116、電源23117、
電源ファン23118、電圧センサ23119、筐体フ
ァン23120、筐体温度センサ23121等のハード
ウェアが含まれる。

【0045】本体ハードウェア群2311は、更に、ハ
ードウェア情報収集部23111を備える。ハードウェ
ア情報収集部23111は、本体ハードウェア群231
1に含まれる各ハードウェアの構成情報を管理し、ま
た、センサデバイスや各ハードウェアの状態監視を行
い、ハードウェア障害を検出する。

【0046】また、ハードウェア231は、必要に応じ
て、サービスプロセッサ2313を備える。サービスプ
ロセッサ2313は、ハードウェア情報収集部2311
1と連携して、本体ハードウェア群2311の構成管
理、障害監視、制御などを実行可能な拡張装置であり、
本体ハードウェア群2311とは異なる、プロセッサ、
電源もしくは蓄電池、記憶域、通信I/F、タイマー、
入出力装置などを備える。オープン系分割システム20
本体とは独立した装置であるサービスプロセッサ231
3を備えることにより、オープン系分割システム20本
体で致命的障害(例えば、本体停止やオペレーティング
システムの停止)が発生した場合の障害情報の通知等の
処理や、オープン系分割システム20本体の電源制御を
することが可能になる。

【0047】次に、前述したパーティション構成情報2
211の詳細について説明する。

【0048】図3は、パーティション構成情報2211
の構成例を示す図である。

【0049】同図に示すように、パーティション構成情
報2211は、プロセッサに関する情報として、プロセ
ッサ番号221101、プロセッサモード221102
及び共有比率221103を備え、メモリに関する情報
として、メモリスロット番号221104、トータルメ
モリサイズ221105、専有メモリサイズ22110
6、共有メモリサイズ221107及び共有パーティシ
ョン名221108を備え、入出力装置に関する情報と
して、入出力装置割当状況221109を備える。

【0050】プロセッサ番号221101は、各パーテ
ィション211に割り当てられているプロセッサの物理
位置を示す情報である。プロセッサモード221102
は、プロセッサを1つのパーティション211で専有す
るか、複数のパーティション211で共有するかを示す
情報である。共有比率221103は、プロセッサモー
ド221102が共有の場合に、割込処理などのプロセ
ッサ処理能力の割合を示す情報である。

【0051】メモリスロット番号221104は、各パ
ーティション211に割り当てられているメモリの物理
位置を示す情報である。トータルメモリサイズ2211
05は、各パーティション211に割り当てられている
メモリの全容量を示す情報である。専有メモリサイズ2
21106は、トータルメモリサイズ221105の
内、各パーティション211で専有しているメモリ容量
を示す。共有メモリサイズ221107は、トータルメ
モリサイズ221105の内、他のパーティション21
1と共有しているメモリの容量を示す。共有パーティシ
ョン名221108は、メモリを共有している他のパー
ティション211を示す情報である。

【0052】入出力装置割当状況221109は、キー
ボード、マウス、ディスプレイ等の筐体本体に1つしか
存在しないハードウェアデバイスが現在どのパーティシ
ョン211に割り当てられているかを示す情報である。

【0053】また、パーティション構成情報2211
は、計算機識別情報221110を備える。計算機識別
情報221110は、計算機自体を一意に示す識別情報
(例えば、計算機のシリアル番号等)であり、分割処理
部221が管理エージェント2111へ情報を送る際に
は必ず付加される。計算機識別情報221110は、管
理コンソール10が、計算機自身が分割システムであ
り、各ハードウェアが1台の計算機のものであることを
判別するため等に利用される。

【0054】なお、同図には示していないが、パーティ
ション構成情報2211は、更に、各パーティション毎
に、電源投入時に同時に起動すべきであるか否かを示す
情報を備える。また、各パーティション211で、プロ
セッサやメモリと同様に、計算機内のハードディスク等
の拡張ハードウェアを分割・共有する場合は、パーティ
ション構成情報2211内には、プロセッサ、メモリの
例と同様に、各拡張ハードウェアと各パーティションと
の関係を示す情報が保持される。

【0055】次に、上述したような構成を備えたオープ
ン系分割システム20の動作について説明する。

【0056】まず、オープン系分割システム20におけ
る、システム起動時の初期化処理について説明する。

【0057】図4は、オープン系分割システム20にお
ける、システム起動時の初期化処理の流れを示す図であ
る。ここでは、システム起動時に一つのパーティション
211(例えば、パーティションA)を起動する処理に
ついて説明する。なお、システム起動時に複数のパーテ
ィションを起動する場合は、同様にして、順次起動され
る。

【0058】オープン系分割システム20の電源231
17が手動やサービスプロセッサ2313からの指示等
によりオンされると、本体ハードウェア群2311が、
それぞれ動きだす(S1001)。

【0059】次いで、分割制御部221が起動され、パ
ーティション構成情報2211に基づき、各パーティシ
ョンに割り当てるべきハードウェアが決定される(S1
002)。パーティション構成情報2211は、実装条
件に応じた適当な値が管理コンソール10やローカルな
入力装置を使って管理者によって予め設定されている。
なお、サービスプロセッサ2313が存在する場合は、
サービスプロセッサ2313が分割処理部211に代わ
り同様な処理を行うようにしてもよい。

【0060】次いで、パーティションAのOS2110
が起動され、更に、OS2110上で動作する管理エー
ジェント2111が起動される(S1003)。

【0061】次いで、分割制御部221内の通信中継部
2212、管理エージェント2111内の分割制御通信
部21115、外部通信部21111経由で、パーティ
ション構成情報2211が管理コンソール10に通知さ
れる(S1004)。なお、このとき、計算機識別情報
221110も管理コンソール10に通知される。

【0062】管理コンソール10は、当該情報を受け取
ると、当該情報を解析し、管理対象計算機が分割システ
ムであることや、管理対象計算機を構成するパーティシ
ョンの数や、各パーティション211が現在起動状態で
あるか否か等を、画面に表示する(S1005)。

【0063】なお、計算機の起動後、管理者からの指示
によって、個別に追加のパーティションが起動される場
合も、計算機識別情報221110等が管理コンソール
10に通知され、管理コンソール10は、通知された計
算機識別情報221110を利用して、同一計算機内に
存在する他のパーティションが起動したのか否かの判定
を行う。

【0064】次に、オープン系分割システム20におけ
る、ハードウェア構成情報の取得処理について説明す
る。

【0065】図5は、オープン系分割システム20にお
ける、ハードウェア構成情報取得処理の流れを示す図で
ある。ここでは、オープン系分割システム20の1つの
パーティション211(例えば、パーティションA)の
ハードウェア構成情報を取得する場合について説明す
る。

【0066】まず、管理者は、管理コンソール10から
オープン系分割システム20のパーティションAにハー
ドウェア構成情報の取得を要求する(S301)。

【0067】パーティションA上の管理エージェント2
111は、当該要求を、外部通信部21111経由で受
け取ると、分割制御通信部21115経由で分割制御部
221にハードウェア構成情報取得命令を発行する(S
302)。

【0068】分割制御部221内のパーティション構成
管理制御部2213は、当該命令を受け取ると、通信中
継部2212を介して、ハードウェア情報取得部231
11から、オープン系分割システム20内に存在する全
ハードウェアの構成情報を取得する(S303)。

【0069】そして、パーティション構成情報2211
から、パーティションAに割り当てられているハードウ
ェア情報を取得し、当該情報を利用して、全ハードウェ
アの構成情報から、パーティションAに関連するハード
ウェア構成情報のみを抽出する。そして、抽出したハー
ドウェア構成情報を、通信中継部2212経由で管理エ
ージェント2111に通知する(S304)。

【0070】管理エージェント211は、分割制御部2
21より通知されたハードウェア構成情報を、外部通信
部21111経由で管理コンソール10に通知し、管理
者の見ている管理コンソール10に情報が表示される
(S305)。

【0071】なお、ステップS304において、管理エ
ージェント211に通知される各ハードウェア構成情報
には、計算機識別情報221110も含まれている。管
理コンソール10は、当該情報によって、各パーティシ
ョン211からの情報が同一計算機内のパーティション
からの情報であるか否かを認識することができる。

【0072】ここでは、1つのパーティションに割り当
てられたハードウェア構成情報を取得する場合について
説明した。なお、計算機全体のハードウェア構成情報2
211を取得する要求の場合は、分割制御部221は、
ステップS304での抽出処理なしに管理エージェント
2111に全ハードウェアの構成情報を返す。

【0073】次に、オープン系分割システム20におけ
るハードウェア障害発生時の処理について説明する。

【0074】図6は、オープン系分割システム20にお
けるハードウェア障害発生時の処理の流れを示す図であ
る。ここでは、オープン系分割システム20の1つのパ
ーティション211(例えば、パーティションA)に割
り当てられているハードウェアに障害が発生した場合に
ついて説明する。

【0075】まず、ハードウェア情報収集部23111
は、センサデバイスや各ハードウェアの状態を監視し、
障害の発生を検出すると、検出したハードウェア障害の
情報を分割制御部221に通知する(S401)。

【0076】分割制御部221は、ハードウェア障害情
報が通知されると、パーティション構成情報2211を
参照し、障害が検出されたハードウェアを割り当てられ
ているパーティション211(例えば、パーティション
A)を特定する(S402)。そして、特定したパーテ
ィションAの管理エージェント2111に、検出された
ハードウェア障害の情報を通知する(S403)。

【0077】管理エージェント2111に通知されてき
たハードウェア障害情報は、分割制御通信部21115
経由で、障害情報管理部21112に渡され、ログファ
イル21113に記録されると共に、外部通信部211
11経由で管理コンソール10に通報される(S40
4)。

【0078】当該通報を受け取ると、管理コンソール1
0は、通報されたハードウェア障害を画面に表示等し、
管理者にハードウェア障害の発生を知らせる(S40
5)。

【0079】なお、管理エージェント2111は、分割
制御部211からハードウェア障害情報が通知されたと
き、前述したステップS404において、当該障害情報
を管理コンソール10に通知すると共に、又は、通知す
る代わりに、パーティション211内のソフトウェアに
対する各種制御を実行するようにしてもよい。例えば、
障害情報管理部21112が、OS2110やOS21
10上で動作するアプリケーションに障害情報を通知し
たり、OS2110やOS2110上で動作するアプリ
ケーションを停止させたり、OS2110やOS211
0上で動作するアプリケーションで実行中の処理を他の
OSや他のOS上で動作するアプリケーションに引き継
がせる移行処理等を行う。

【0080】このような処理を行うことにより、ハード
ウェア障害発生時にソフトウェア制御を連携させること
が可能となり、1台の計算機内で閉じた自律的な障害対
策処理も可能になる。

【0081】なお、ハードウェア情報収集部23111
によって検出されたハードウェア障害が、計算機上のシ
ステムを停止させるような致命的障害の場合、前述した
ような情報伝達は不可能になるが、このような場合で
も、サービスプロセッサ2313が存在する計算機で
は、サービスプロセッサ2313経由で管理コンソール
10に障害情報が通報される。また、サービスプロセッ
サ2313が存在する計算機においては、ハードウェア
情報収集部23111によって検出されたハードウェア
障害が致命的でない障害の場合でも、当該障害情報をサ
ービスプロセッサ2312に通知し、当該障害情報を、
サービスプロセッサ2313内に設けられたログ管理部
に蓄積すると共に、サービスプロセッサ2313からも
管理コンソール10に通知するようにしてもよい。

【0082】次に、オープン系分割システム20におけ
るソフトウェア障害発生時の処理について説明する。

【0083】図7は、オープン系分割システム20にお
いて、ソフトウェア障害が発生した時の処理の流れを示
す図である。ここでは、オープン系分割システム20の
1つのパーティション211(例えば、パーティション
A)でソフトウェア障害が発生した場合について説明を
行う。

【0084】まず、管理エージェント2111内のソフ
ト障害監視部21114は、OS2110やOS211
0上で動作するアプリケーションでソフトウェア障害が
発生したことを検出すると、検出したソフトウェア障害
の情報を、障害情報管理部21112に通知する(S6
01)。

【0085】障害情報管理部21112は、通知された
ソフトウェア障害情報を、ログファイル21113に記
録すると共に、分割制御通信部21115経由で分割制
御部221に通知する(S602)。なお、このとき、
外部通信部21111を介して、管理コンソール10に
対しても、ソフトウェア障害情報を通知するようにして
もよい。

【0086】分割制御部221では、パーティション構
成管理制御部2213が、通信中継部2212を介し
て、ソフトウェア障害情報を受け取ると、ソフトウェア
障害が発生したパーティション211(例えば、パーテ
ィションA)に対する各種制御を実行する(S60
3)。例えば、パーティションAの終了処理、再起動処
理や、パーティションAに割り当てられているハードウ
ェアの割当変更処理などを行う。なお、ハードウェア割
当変更処理が実施される場合、変更内容に応じて、パー
ティション構成情報2211が更新される。

【0087】このような処理を行うことにより、ソフト
ウェア障害発生時にハードウェア制御を連携させること
が可能となり、1台の計算機で閉じた自律的な障害対策
処理も可能になる。

【0088】次に、オープン系分割システム20におい
て、管理コンソール10からの指示で、各パーティショ
ン211に割り当てられているハードウェアの動的制御
や各パーティション211の起動終了制御を行う処理に
ついて説明する。

【0089】図8は、オープン系分割システム20にお
いて、管理コンソール10からの指示で、各パーティシ
ョン211に割り当てられているハードウェアの動的制
御や各パーティション211の起動終了制御を行う処理
の流れを示す図である。ここでは、分割システム20の
1つのパーティション211(例えば、パーティション
A)に対して制御指示する場合について説明する。

【0090】まず、管理コンソール10を使い、管理者
が、オープン系分割システム20に対する分割制御部2
21用の処理指示を発行する(S701)。

【0091】発行された指示は、管理エージェント21
11又はサービスプロセッサ2313経由で、分割制御
部221に伝達される(S702)。

【0092】指示を受けた分割制御部221では、パー
ティション構成管理制御部2213が、指示内容に応じ
て、パーティションAに割り当てられているハードウェ
アの動的制御やパーティションAの起動終了制御を行う
(S703)。なお、ハードウェア割当変更処理が実施
される場合、変更内容に応じて、パーティション構成情
報2211が更新される。

【0093】なお、管理コンソール10からの指示だけ
ではなく、ハードウェア情報収集部23111から通知
されるハードウェア障害情報に基づいて、分割制御部2
11が、各パーティション211に割り当てられている
ハードウェアの動的制御等を行うことも考えられる。 《第2実施形態》次に、オープン系分割システム20の
別の構成について説明する。

【0094】図9は、オープン系分割システム20の別
の構成を示す図である。同図の場合も、ハードウェア資
源の構成管理、障害監視、制御を行うために必要な構成
が示されている。同図に示すように、オープン系分割シ
ステム20aは、複数のパーティション211(A〜
N)と、管理専用パーティション240と、分割制御部
221と、ハードウェア231とを備える。

【0095】図2に示した構成との違いは、管理専用パ
ーティション240が設けられていることと、管理専用
パーティション240以外の各パーティション211
が、管理エージェント2111の代わりに、ソフトウェ
ア管理エージェント2113を備えていることである。

【0096】分割制御部221及びハードウェア231
は、図2に示したものと同様に構成される。

【0097】管理専用パーティション240は、オープ
ン系分割システム20aに設けられる複数のパーティシ
ョンのうちの1つを、計算機全体を管理するために動作
させたものである。

【0098】管理専用パーティション240上では、リ
アルタイム動作が保証される管理用OS(以下、RAS
−OSという)2410と統合管理エージェント241
1とが動作し、管理コンソール10と通信する。

【0099】RAS−OS2410は、リアルタイム制
御が可能なOSであり、必要最低限なハードウェアリソ
ースが割り当てられ、分割システムが動作している限り
常に動作し続ける。

【0100】RAS−OS2410上で動作する統合管
理エージェント2411は、各パーティション211上
で動作するソフトウェア管理エージェント2113、分
割制御部221及びハードウェア情報収集部23111
と連携して、計算機全体の構成管理、障害監視、制御を
実現する。

【0101】図9に示すように、統合管理エージェント
2411は、外部通信部21111と、障害情報管理部
21112と、ログファイル21113と、分割制御通
信部21115とを備える。外部通信部21111、障
害情報管理部21112、ログファイル21113及び
分割制御通信部21115は、それぞれ、図2に示した
管理エージェント2111が備える外部通信部2111
1、障害情報管理部21112、ログファイル2111
3及び分割制御通信部21115と同様のものである。

【0102】また、ソフトウェア管理エージェント21
13は、ソフト障害監視部21114と分割制御通信部
21115とを備える。ソフト障害監視部21114及
び分割制御通信部21115は、それぞれ、図2に示し
た管理エージェント2111が備えるソフト障害監視部
21114及び分割制御通信部21115と同様のもの
である。

【0103】ソフトウェア管理エージェント2113
は、OS2110やOS2110上で動作するアプリケ
ーションのソフトウェア障害を監視する。そして、分割
制御部221と通信し、管理コンソール10とは直接通
信しない。

【0104】図9に示したオープン系分割システム20
aでは、統合管理エージェント2411が、分割制御部
221及びハードウェア情報収集部23111を利用
し、計算機上に存在する全ハードウェアを含む全パーテ
ィションのハードウェアに対する構成管理、障害監視、
制御を実行する。

【0105】つまり、統合管理エージェント2411
が、図2に示したオープン系分割システム20におい
て、個々のパーティション211上の管理エージェント
2111が担ってきた仕事を全て引き受ける。

【0106】例えば、ハードウェア情報収集部2311
1が検知したハードウェア障害情報は、分割制御部22
1経由で、統合管理エージェント2411に通知され
る。当該通知を受けた統合管理エージェント2411
は、通知された障害情報を、管理コンソール10に通知
したり、ソフトウェア管理エージェント2113と連携
して、ソフトウェアの制御等を行う。

【0107】また、個々のパーティション211上で発
生したソフトウェア障害の情報は、各パーティション2
11上のソフトウェア管理エージェント2113から、
分割制御部221経由で、統合管理エージェント241
1に通知される。

【0108】本実施形態における統合管理エージェント
2411を使ってのハードウェアの構成管理、障害監
視、制御の処理の流れは、基本的には、前述した図4〜
図8の処理の流れと同様である。

【0109】

【発明の効果】以上詳細に説明したように、本発明によ
れば、複数OSを稼働させるオープン系計算機システム
におけるハードウェア構成管理、障害監視、制御が可能
になる。

【図面の簡単な説明】

【図1】 本発明が適用される計算機システムの構成例
を示す図である。

【図2】 オープン系分割システムにおける管理構成を
示す図である。

【図3】 パーティション構成情報2211の構成例を
示す図である。

【図4】 システム起動時の初期化処理の流れを示す図
である。

【図5】 ハードウェア構成情報取得時の処理の流れを
示す図である。

【図6】 ハードウェア障害発生時の処理の流れを示す
図である。

【図7】 ソフトウェア障害発生時の処理の流れを示す
図である。

【図8】 管理コンソールからの指示で、ハードウェア
の制御等を行う処理の流れを示す図である。

【図9】 オープン系分割システムにおける別の管理構
成を示す図である。

【符号の説明】

10…管理コンソール、20…オープン系分割システ
ム、30…オープン系非分割システム、40…メインフ
レーム系分割システム、50…メインフレーム系非分割
システム、60…ネットワーク、211…パーティショ
ン、2110…オペレーティングシステム、2111…
管理エージェント、2113…ソフトウェア管理エージ
ェント、21111…外部通信部、21112…障害情
報管理部、21113…ログファイル、21114…ソ
フト障害監視部、21115…分割制御通信部、221
…分割制御部、2211…パーティション構成情報、2
212…通信中継部、2213…パーティション構成管
理制御部、231…ハードウェア、2311…本体ハー
ドウェア群、2313…サービスプロセッサ、2311
1…ハードウェア情報収集部、23112…プロセッ
サ、23113…プロセッサ温度センサ、23114…
プロセッサファン、23115…メモリ、23116…
入出力装置、23117…電源、23118…電源ファ
ン、23119…電圧センサ、23120…筐体ファ
ン、23121…筐体温度センサ、240…管理専用パ
ーティション、2410…管理用オペレーティングシス
テム、2411…統合管理エージェント

───────────────────────────────────────────────────── フロントページの続き (72)発明者 新井 利明 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (72)発明者 井形 博之 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア開発本部内 Fターム(参考) 5B042 GA21 KK07 MC15 5B098 GA02 GD00 GD02 GD03 GD07 HH01

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 1台の計算機のハードウェア上で、複数
    のOSを稼働させる計算機システムであって、 各OS上で実行され、当該OSの管理を行う管理エージ
    ェントと、 各OSとハードウェアとの対応関係を示すパーティショ
    ン構成情報を保持し、各OSに対するハードウェアの割
    り当て制御を行う分割制御部と、 前記ハードウェアの情報収集を行うハードウェア情報収
    集部とを備え、 前記パーティション構成情報を利用して、各OS毎のハ
    ードウェア管理を行うことを特徴とする計算機システ
    ム。
  2. 【請求項2】 前記複数のOSが稼働している計算機の
    情報収集、障害受信、制御を行うための管理コンソール
    を更に備えることを特徴とする請求項1に記載の記載の
    計算機システム。
  3. 【請求項3】 前記管理コンソールから、ハードウェア
    構成情報取得要求を受け取ると、前記管理エージェント
    は、当該要求を、前記分割制御部に通知し、 当該通知を受けた分割制御部は、前記ハードウェア情報
    収集部から、前記ハードウェアの情報を取得し、前記パ
    ーティション構成情報を利用して、要求されたハードウ
    ェアに関する情報を抽出して、前記管理エージェントに
    送り、 前記管理エージェントは、前記分割制御部から受け取っ
    た情報を、前記管理コンソールに通知することを特徴と
    する請求項2に記載の計算機システム。
  4. 【請求項4】 前記ハードウェア情報収集部は、ハード
    ウェアの障害発生を検知すると、障害情報を前記分割制
    御部に通知し、 前記分割制御部は、当該障害情報を、障害が発生したハ
    ードウェアが割り当てられているOSの管理エージェン
    トに通知し、 当該通知を受けた管理エージェントは、通知された障害
    情報を、前記管理コンソールに通知することを特徴とす
    る請求項2に記載の計算機システム。
  5. 【請求項5】 前記ハードウェア情報収集部は、ハード
    ウェアの障害発生を検知すると、障害情報を前記分割制
    御部に通知し、 前記分割制御部は、当該障害情報を、障害が発生したハ
    ードウェアが割り当てられているOSの管理エージェン
    トに通知し、 当該通知を受けた管理エージェントは、通知された障害
    情報に基づいて、ソフトウェアの制御を行うことを特徴
    とする請求項1に記載の計算機システム。
  6. 【請求項6】 前記管理エージェントは、ソフトウェア
    の障害発生を検知すると、障害情報を前記分割制御部に
    通知し、 前記分割制御部は、当該障害情報に基づいて、各OSに
    割り当てられているハードウェアの割当変更制御又は各
    OSの起動制御を行うことを特徴とする請求項1記載の
    計算機システム。
  7. 【請求項7】 1台の計算機のハードウェア上で、複数
    のOSを稼働させる計算機システムであって、 第1のOS上で実行され、前記計算機の管理を行う統合
    管理エージェントと、 前記第1のOS以外のOS上で実行され、当該OS上で
    実行されているソフトウェアの管理を行うソフトウェア
    管理エージェントと、 各OSとハードウェアとの対応関係を示すパーティショ
    ン構成情報を保持し、各OSに対するハードウェアの割
    り当て制御を行う分割制御部と、 前記ハードウェアの情報収集を行うハードウェア情報収
    集部とを備え、 前記パーティション構成情報を利用して、各OS毎のハ
    ードウェア管理を行うことを特徴とする計算機システ
    ム。
  8. 【請求項8】 前記複数のOSが稼働している計算機の
    情報収集、障害受信、制御を行うための管理コンソール
    を更に備えることを特徴とする請求項7に記載の記載の
    計算機システム。
  9. 【請求項9】 前記管理コンソールから、ハードウェア
    構成情報取得要求を受け取ると、前記統合管理エージェ
    ントは、当該要求を、前記分割制御部に通知し、 当該通知を受けた前記分割制御部は、前記ハードウェア
    情報収集部から、前記ハードウェアの情報を取得し、前
    記パーティション構成情報を利用して、要求されたハー
    ドウェアに関する情報を抽出して、前記統合管理エージ
    ェントに送り、前記統合管理エージェントは、前記分割
    制御部から受け取った情報を、前記管理コンソールに通
    知することを特徴とする請求項8に記載の計算機システ
    ム。
  10. 【請求項10】 前記ハードウェア情報収集部は、ハー
    ドウェアの障害発生を検知すると、障害情報を前記分割
    制御部に通知し、 前記分割制御部は、当該障害情報を、前記統合管理エー
    ジェントに通知し、 前記統合管理エージェントは、通知された障害情報に基
    づいて、前記ソフトウェア管理エージェントを介して、
    ソフトウェアの制御を行うことを特徴とする請求項7に
    記載の計算機システム。
  11. 【請求項11】 前記ソフトウェア管理エージェント
    は、ソフトウェアの障害発生を検知すると、障害情報を
    前記分割制御部に通知し、 前記分割制御部は、当該障害情報に基づいて、各OSに
    割り当てられているハードウェアの割当変更制御又は各
    OSの起動制御を行うことを特徴とする請求項7記載の
    計算機システム。
JP2001026825A 2001-02-02 2001-02-02 計算機システム Pending JP2002229806A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001026825A JP2002229806A (ja) 2001-02-02 2001-02-02 計算機システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001026825A JP2002229806A (ja) 2001-02-02 2001-02-02 計算機システム
US09/917,830 US6957364B2 (en) 2001-02-02 2001-07-31 Computing system in which a plurality of programs can run on the hardware of one computer

Publications (1)

Publication Number Publication Date
JP2002229806A true JP2002229806A (ja) 2002-08-16

Family

ID=18891580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001026825A Pending JP2002229806A (ja) 2001-02-02 2001-02-02 計算機システム

Country Status (2)

Country Link
US (1) US6957364B2 (ja)
JP (1) JP2002229806A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007513405A (ja) * 2003-12-16 2007-05-24 インテル・コーポレーション ネットワークベース管理におけるプロキシ、情報集約、及び仮想マシン情報の最適化のための方法、装置、及びシステム
JP2007233687A (ja) * 2006-03-01 2007-09-13 Nec Corp 仮想計算機システム、仮想計算機の制御方法、および仮想計算機プログラム
JP2008165347A (ja) * 2006-12-27 2008-07-17 Fujitsu Ltd 情報処理装置,障害処理方法,障害処理プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
JP2008269194A (ja) * 2007-04-19 2008-11-06 Hitachi Ltd 仮想計算機システム
JP2009080563A (ja) * 2007-09-25 2009-04-16 Nec Corp 仮想マシンモニタをモニタするコンピュータとその方法、および仮想マシンモニタモニタプログラム
WO2009110111A1 (ja) 2008-03-04 2009-09-11 三菱電機株式会社 サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム
JP2010009411A (ja) * 2008-06-27 2010-01-14 Hitachi Information Systems Ltd 仮想化環境運用支援システム及び仮想環境運用支援プログラム
JP2010122805A (ja) * 2008-11-18 2010-06-03 Hitachi Ltd 仮想サーバシステム並びに物理cpu及び物理メモリの割り当て方法
JP2011081847A (ja) * 2011-01-25 2011-04-21 Hitachi Ltd 仮想計算機システム
JPWO2012023183A1 (ja) * 2010-08-18 2013-10-28 富士通株式会社 計算機管理装置、計算機管理システム及び計算機システム
JP2014160502A (ja) * 2014-04-28 2014-09-04 Fujitsu Ltd 情報処理装置およびメモリアクセス方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3943865B2 (ja) * 2001-06-05 2007-07-11 株式会社日立製作所 コンピュータ装置および診断方法
US7925894B2 (en) * 2001-07-25 2011-04-12 Seagate Technology Llc System and method for delivering versatile security, digital rights management, and privacy services
US20030212883A1 (en) * 2002-05-09 2003-11-13 International Business Machines Corporation Method and apparatus for dynamically managing input/output slots in a logical partitioned data processing system
US7480911B2 (en) * 2002-05-09 2009-01-20 International Business Machines Corporation Method and apparatus for dynamically allocating and deallocating processors in a logical partitioned data processing system
US6941436B2 (en) * 2002-05-09 2005-09-06 International Business Machines Corporation Method and apparatus for managing memory blocks in a logical partitioned data processing system
JP2006260325A (ja) * 2005-03-18 2006-09-28 Fujitsu Ltd 障害の伝達方法
US8949404B2 (en) * 2005-05-24 2015-02-03 Hewlett-Packard Development Company, L.P. Acquiring graphical operating system post-failure screen
US7685107B2 (en) * 2005-06-07 2010-03-23 International Business Machines Corporation Apparatus, system, and method for scanning a partitioned data set
US7478268B2 (en) * 2005-09-13 2009-01-13 International Business Machines Corporation Deallocation of memory in a logically-partitioned computer
CN100420202C (zh) * 2005-10-20 2008-09-17 联想(北京)有限公司 计算机管理系统以及计算机管理方法
US8429724B2 (en) 2006-04-25 2013-04-23 Seagate Technology Llc Versatile access control system
US7539890B2 (en) * 2006-04-25 2009-05-26 Seagate Technology Llc Hybrid computer security clock
US8028166B2 (en) * 2006-04-25 2011-09-27 Seagate Technology Llc Versatile secure and non-secure messaging
US20070283147A1 (en) * 2006-05-30 2007-12-06 Fried Eric P System and method to manage device access in a software partition
US9317309B2 (en) * 2006-12-28 2016-04-19 Hewlett-Packard Development Company, L.P. Virtualized environment allocation system and method
US8161299B2 (en) * 2007-12-20 2012-04-17 Intel Corporation Location based policy system and method for changing computing environments
US20090163226A1 (en) * 2007-12-20 2009-06-25 Burges Karkaria Device, system, and method of power saving using location sensing modules
US8543712B2 (en) * 2008-02-19 2013-09-24 International Business Machines Corporation Efficient configuration of LDAP user privileges to remotely access clients within groups
TW201222274A (en) * 2010-11-30 2012-06-01 Inventec Corp Computer chassis system
US8713378B2 (en) * 2011-07-07 2014-04-29 Microsoft Corporation Health monitoring of applications in a guest partition
US9886312B2 (en) * 2011-09-28 2018-02-06 Microsoft Technology Licensing, Llc Dynamic provisioning of virtual video memory based on virtual video controller configuration
US9665090B2 (en) 2012-07-24 2017-05-30 General Electric Company Systems and methods for rule-based control system reliability
US9218233B2 (en) * 2012-07-24 2015-12-22 Paul Venditti Systems and methods for control reliability operations
US9645873B2 (en) 2013-06-03 2017-05-09 Red Hat, Inc. Integrated configuration management and monitoring for computer systems
US9912733B2 (en) 2014-07-31 2018-03-06 General Electric Company System and method for maintaining the health of a control system
US9529661B1 (en) * 2015-06-18 2016-12-27 Rockwell Collins, Inc. Optimal multi-core health monitor architecture
JP6579255B1 (ja) * 2018-12-28 2019-09-25 富士通クライアントコンピューティング株式会社 情報処理システム、および中継装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08227406A (ja) 1995-02-22 1996-09-03 Hitachi Ltd 並列計算機
JP3196004B2 (ja) * 1995-03-23 2001-08-06 株式会社日立製作所 障害回復処理方法
JP3653335B2 (ja) 1995-05-31 2005-05-25 株式会社日立製作所 コンピュータ管理システム
JP3555047B2 (ja) 1995-12-20 2004-08-18 株式会社日立製作所 複合コンピュータシステム
US6542926B2 (en) * 1998-06-10 2003-04-01 Compaq Information Technologies Group, L.P. Software partitioned multi-processor system with flexible resource sharing levels
US6691146B1 (en) * 1999-05-19 2004-02-10 International Business Machines Corporation Logical partition manager and method
JP2002041305A (ja) * 2000-07-26 2002-02-08 Hitachi Ltd 仮想計算機システムにおける計算機資源の割当て方法および仮想計算機システム
JP2002202959A (ja) * 2000-12-28 2002-07-19 Hitachi Ltd 動的な資源分配をする仮想計算機システム
US20020124201A1 (en) * 2001-03-01 2002-09-05 International Business Machines Corporation Method and system for log repair action handling on a logically partitioned multiprocessing system
US6792564B2 (en) * 2001-03-01 2004-09-14 International Business Machines Corporation Standardized format for reporting error events occurring within logically partitioned multiprocessing systems
US20020184576A1 (en) * 2001-03-29 2002-12-05 International Business Machines Corporation Method and apparatus for isolating failing hardware in a PCI recoverable error
US6792514B2 (en) * 2001-06-14 2004-09-14 International Business Machines Corporation Method, system and computer program product to stress and test logical partition isolation features

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007513405A (ja) * 2003-12-16 2007-05-24 インテル・コーポレーション ネットワークベース管理におけるプロキシ、情報集約、及び仮想マシン情報の最適化のための方法、装置、及びシステム
JP2007233687A (ja) * 2006-03-01 2007-09-13 Nec Corp 仮想計算機システム、仮想計算機の制御方法、および仮想計算機プログラム
JP2008165347A (ja) * 2006-12-27 2008-07-17 Fujitsu Ltd 情報処理装置,障害処理方法,障害処理プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
US8145956B2 (en) 2006-12-27 2012-03-27 Fujitsu Limited Information processing apparatus, failure processing method, and recording medium in which failure processing program is recorded
JP2008269194A (ja) * 2007-04-19 2008-11-06 Hitachi Ltd 仮想計算機システム
JP2009080563A (ja) * 2007-09-25 2009-04-16 Nec Corp 仮想マシンモニタをモニタするコンピュータとその方法、および仮想マシンモニタモニタプログラム
JP4678396B2 (ja) * 2007-09-25 2011-04-27 日本電気株式会社 仮想マシンモニタをモニタするコンピュータとその方法、および仮想マシンモニタモニタプログラム
JPWO2009110111A1 (ja) * 2008-03-04 2011-07-14 三菱電機株式会社 サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム
WO2009110111A1 (ja) 2008-03-04 2009-09-11 三菱電機株式会社 サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム
JP2010009411A (ja) * 2008-06-27 2010-01-14 Hitachi Information Systems Ltd 仮想化環境運用支援システム及び仮想環境運用支援プログラム
JP2010122805A (ja) * 2008-11-18 2010-06-03 Hitachi Ltd 仮想サーバシステム並びに物理cpu及び物理メモリの割り当て方法
JPWO2012023183A1 (ja) * 2010-08-18 2013-10-28 富士通株式会社 計算機管理装置、計算機管理システム及び計算機システム
JP5549733B2 (ja) * 2010-08-18 2014-07-16 富士通株式会社 計算機管理装置、計算機管理システム及び計算機システム
JP2011081847A (ja) * 2011-01-25 2011-04-21 Hitachi Ltd 仮想計算機システム
JP2014160502A (ja) * 2014-04-28 2014-09-04 Fujitsu Ltd 情報処理装置およびメモリアクセス方法

Also Published As

Publication number Publication date
US6957364B2 (en) 2005-10-18
US20020108074A1 (en) 2002-08-08

Similar Documents

Publication Publication Date Title
JP6195958B2 (ja) アプリケーションサーバとクラスタ化されたデータベースとを接続するためのシステムおよび方法
US9294338B2 (en) Management computer and method for root cause analysis
AU2014309371B2 (en) Virtual hadoop manager
US8937965B2 (en) Storage system comprising function for migrating virtual communication port added to physical communication port
US8051254B2 (en) Application migration and power consumption optimization in partitioned computer system
US7305462B2 (en) Data storage system and control method thereof
JP4353005B2 (ja) クラスタ構成コンピュータシステムの系切替方法
EP1179770B1 (en) File system
US6145098A (en) System for displaying system status
US7925817B2 (en) Computer system and method for monitoring an access path
US8015431B2 (en) Cluster system and failover method for cluster system
US7653725B2 (en) Management system selectively monitoring and storing additional performance data only when detecting addition or removal of resources
US5696701A (en) Method and system for monitoring the performance of computers in computer networks using modular extensions
US7487390B2 (en) Backup system and backup method
US8074222B2 (en) Job management device, cluster system, and computer-readable medium storing job management program
US7451359B1 (en) Heartbeat mechanism for cluster systems
JP4701929B2 (ja) ブート構成変更方法、管理サーバ、及び計算機システム
JP5458308B2 (ja) 仮想計算機システム、仮想計算機システムの監視方法及びネットワーク装置
US9304849B2 (en) Implementing enhanced error handling of a shared adapter in a virtualized system
US7917811B2 (en) Virtual computer system
JP5874879B2 (ja) I/oデバイスの制御方法及び仮想計算機システム
US7779297B2 (en) Fail-over method, computer system, management server, and backup server setting method
US8464092B1 (en) System and method for monitoring an application or service group within a cluster as a resource of another cluster
JP2750312B2 (ja) チャネルの使用中時間を測定する手段
US6931640B2 (en) Computer system and a method for controlling a computer system

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040810

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061211

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070403