JP4495248B2

JP4495248B2 - 情報処理装置、障害処理方法

Info

Publication number: JP4495248B2
Application number: JP2009507374A
Authority: JP
Inventors: 大士村上
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2007-03-29
Filing date: 2007-03-29
Publication date: 2010-06-30
Anticipated expiration: 2027-03-29
Also published as: US7930599B2; US20100011257A1; JPWO2008120383A1; WO2008120383A1

Description

本発明は、ハードウェア資源を分割してそれぞれを異なるパーティションで利用する物理分割を行うことができる情報処理装置、障害処理方法に関するものである。

基幹システムで運用されるサーバには、高い可用性や柔軟なリソース運用が要求される。この要求に対し、ＡＳＩＣ（Application Specific Integrated Circuit）およびＦｉｒｍｗａｒｅ（以下Ｆ／Ｗ）の機能として、従来はＨａｒｄｗａｒｅ（以下Ｈ／Ｗ）（例えば、プロセッサやメモリ等）に固定であったリソース配分をｎ個のパーティションに分割し、それぞれを別のＯＳ（Operating System）で使用する物理分割機能が存在する。この機能により、Ｈ／Ｗに制限されない柔軟なリソース運用が可能となる。

物理分割機能を使用している場合も使用しない場合と同様に、正確な障害情報の解析と通知の機能が必要である。そのために、物理分割機能を使用しない場合と同等の障害検知機能の他に、障害を管理する機能が実装される。物理分割機能使用時の障害を管理する方法として、大きく分けて以下の３つの方法がある。

（管理方法１）Ｈ／Ｗリソースの配分、および情報の振り分け機能を全てＡＳＩＣに実装する。
（管理方法２）Ｈ／Ｗリソースの配分、および情報の振り分け機能をＡＳＩＣおよびＦ／Ｗそれぞれの特性に合わせて実装し、連携させる。
（管理方法３）Ｈ／Ｗリソースの配分、および情報の振り分け機能を全てＦ／Ｗに実装する。（＝仮想化）

ここでは、信頼性、実装、コスト、および他機能との融合性を考慮し、Ｈ／Ｗの障害によるパーティションへの影響が少なく、より柔軟な機能拡張が可能な、管理方法２を対象とする。このとき、ＡＳＩＣはＨ／Ｗを管理し、Ｈ／Ｗリソースを分割し、障害情報を含むリソース管理情報をＦ／Ｗへ提供する。Ｆ／Ｗはそのリソース管理情報を必要に応じて解析し、ＯＳなどの上位のレイヤにパーティションの障害情報を提供する。

なお、本発明の関連ある従来技術として、第１及び第２のデータ処理装置群にそれぞれ対応する障害処理装置が、第１及び第２のデータ処理装置群からの障害情報を切り替えて入力する障害処理システムがある（例えば、特許文献１参照）。
特開平１−５０１３５号公報

サーバの運用時に障害が発生した場合、ほとんどの場合は障害情報が格納され、障害対策時間を短縮する役割を果たす。しかし、多重障害の発生や、障害報告パスの障害、設計時に予期し得なかったＡＳＩＣ、Ｆ／Ｗ障害等により障害情報が格納されない場合も存在する。

障害情報が格納されない場合とは、Ｆ／Ｗが利用するメモリのアドレス障害や、プロセサ情報を退避する領域の固定障害等の場合である。

本発明は上述した問題点を解決するためになされたものであり、物理分割機能の使用時に障害情報が取得できる確率を向上させる情報処理装置、障害処理方法を提供することを目的とする。

上述した課題を解決するため、本発明は、ハードウェア資源を分割してそれぞれを異なるパーティションで利用する物理分割を行うことができる情報処理装置であって、複数のパーティションに割り当てられた少なくとも１つのハードウェア資源に接続され、前記ハードウェア資源の管理を行うハードウェア管理部であって、前記複数のパーティションのいずれかで障害が発生したことを検知した場合、前記障害が発生したパーティションを障害発生パーティションとし、前記障害の発生を報知するハードウェア管理部と、前記パーティション毎に備えられたパーティション管理部であって、物理分割の状態であり、且つ前記ハードウェア管理部による報知に基づいて前記障害の発生を認識し、且つ自己のパーティションが前記障害発生パーティションと異なり、且つ前記障害に関する情報である障害情報の取得が必要であると判定した場合、前記障害情報の取得を行うパーティション管理部とを備える。

また、本発明は、ハードウェア資源を分割してそれぞれを異なるパーティションで利用することができる情報処理装置の障害処理方法であって、複数のパーティションに割り当てられた少なくとも１つのハードウェア資源の管理を行い、前記複数のパーティションのいずれかで障害が発生したことを検知した場合、前記障害が発生したパーティションを障害発生パーティションとし、前記障害の発生を報知するハードウェア管理ステップと、パーティション毎に実行され、物理分割の状態であり、且つ前記ハードウェア管理ステップによる報知に基づいて前記障害の発生を認識し、且つ自己のパーティションが前記障害発生パーティションと異なり、且つ前記障害に関する情報である障害情報の取得が必要であると判定した場合、前記障害情報の取得を行うパーティション管理ステップとを実行する。

本実施の形態に係るサーバの構成の一例を示すブロック図である。本実施の形態に係るサーバの障害発生時の第１の動作を示すフローチャートである。本実施の形態に係るサーバの障害発生時の第２の動作を示すフローチャートである。本実施の形態に係るサーバにおける物理分割及びパーティションの構成の一例を示すブロック図である。

以下、本発明の実施の形態について図面を参照しつつ説明する。

本実施の形態においては、本発明の情報処理装置を適用したサーバについて説明する。

まず、本実施の形態に係るサーバの構成について説明する。

図１は、本実施の形態に係るサーバの構成の一例を示すブロック図である。このサーバは、筐体管理装置１１、Ｈ／Ｗ１２ａ，１２ｂ，１２ｃ，１２ｄ、ＡＳＩＣ１３ａ、Ｆ／Ｗ１４ａ，１４ｂ、ＯＳ１５ａ，１５ｂを備える。また、このサーバには、パーティション１６ａ，１６ｂが設定される。パーティション１６ａには、ＯＳ１５ａ，Ｆ／Ｗ１４ａ，ＡＳＩＣ１３ａ，Ｈ／Ｗ１２ａ，１２ｂが割り当てられ、パーティション１６ｂには、ＯＳ１５ｂ，Ｆ／Ｗ１４ｂ，ＡＳＩＣ１３ａ，Ｈ／Ｗ１２ｃ，１２ｄが割り当てられる。Ｆ／Ｗ１４ａ，１４ｂ、ＯＳ１５ａ，１５ｂは、サーバのＣＰＵ上で動作するソフトウェアであり、Ｆ／Ｗ及びＯＳは、パーティション毎にそれぞれ１つずつ動作する。

物理分割により分割されたＨ／Ｗ１２ａ，１２ｂ，１２ｃ，１２ｄについて、設定された情報及び取得した障害情報は管理するＡＳＩＣ１３ａの記憶領域に保存されており、特別なプログラムやハードウェアを仲介せずにＦ／Ｗ１４ａ，１４ｂから取得することが可能である。

ＡＳＩＣ１３ａは、通信の制御を行うチップであり、例えば、ＣＰＵとインターフェースとクロスバとを接続及び制御するNorth-Bridge、メモリとインターフェースとクロスバとを接続及び制御するＭＬＤＳ（Memory And Local Data Switch）、Ｉ／Ｏデバイスとバスとクロスバとを接続及び制御するSouth-Bridge等である。

筐体管理装置１１は、Ｆ／Ｗ１４ａ，１４ｂから受信したサーバの障害情報の格納を行い、外部からの要求により外部へ障害情報を出力することができる。

次に、本実施の形態に係るサーバにおける障害発生時の動作の概要について説明する。

図１におけるＳ１〜Ｓ３は、サーバにおける障害発生時の動作の概要を示す。

（Ｓ１）ＡＳＩＣ１３ａは、自らの管理下のＨ／Ｗ１２ａ，１２ｂで障害が起きた場合、その内容を全てのパーティションへ通知する。

（Ｓ２）Ｆ／Ｗ１４ａ，１４ｂは、動作モードを判定し、物理分割時には障害報告にタイムアウト監視する。

（Ｓ３）Ｆ／Ｗ１４ａ，１４ｂは、タイムアウトが発生した場合、ＡＳＩＣ１３ａの反対側のパーティションの障害情報をＡＳＩＣ１３ａから採取して解析し、筐体管理装置１１へ通知する。この図の例において、Ｆ／Ｗ１４ａ側の多重障害によりＦ／Ｗ１４ａの障害処理が中断し、Ｆ／Ｗ１４ｂは、タイムアウトにより、パーティション１６ａの障害情報をＡＳＩＣ１３ａから採取して解析し、筐体管理装置１１へ通知する。

次に、本実施の形態に係るサーバにおける障害発生時の動作の詳細について説明する。

ＡＳＩＣ１３ａの記憶領域は、物理分割モードであることを示す動作モード情報（動作情報）、障害が発生したか否かを示す障害発生情報、障害が発生した物理分割位置を示す物理分割位置情報（位置情報）、障害が発生した部位（物理分割の位置）を示す障害部位情報、障害の詳細を示す障害詳細情報、異なるパーティションからのアクセスに対する障害情報（障害部位情報、障害詳細情報）の隠蔽を解除するか否かを設定する解除情報、障害処理が正常終了したか否かを示す正常終了情報を有する。解除情報、正常終了情報、障害情報は、パーティション毎に保持される。

また、ＡＳＩＣ１３ａは、誤動作防止、信頼性及びセキュリティ確保のために障害情報の隠蔽機能を有する。通常は解除情報のフラグがリセットされた状態であり、この状態でＡＳＩＣ１３ａに保持された特定のパーティションの障害情報に対して、他のパーティションからのアクセスがあった場合、隠蔽機能は障害情報の代わりに所定のデータを返す。また、特定のパーティションの解除情報のフラグがセットされると隠蔽が解除され、そのパーティションの障害情報は他のパーティションから読み出すことができる。

図２は、本実施の形態に係るサーバの障害発生時の第１の動作を示すフローチャートである。図３は、本実施の形態に係るサーバの障害発生時の第２の動作を示すフローチャートである。まず、ＡＳＩＣ１３ａが管理下のパーティションにおける障害を検知する（Ｓ１１）。図１の例において、パーティション１６ａに所属するＨ／Ｗ１２ｂで障害が発生したとする。Ｈ／Ｗ１２ｂを管理するＡＳＩＣ１３ａは、検知した障害情報を保持すると共に、自己に割り当てられた全てのパーティション１６ａ，１６ｂへ障害発生を通知（ブロードキャスト）する（Ｓ１２）。図１の例において、ＡＳＩＣ１３ａは、障害発生情報のフラグをセットすると共に、物理分割位置情報に障害の発生した物理分割位置（パーティション１６ａのＨ／Ｗ１２ｂ）を記録する。

次に、Ｆ／Ｗ１４ａ，１４ｂは、障害割り込みを受け付ける（Ｓ１３）。ここで、Ｆ／Ｗ１４ａ，１４ｂは、ＡＳＩＣ１３ａの障害発生情報を監視しており、障害発生情報のフラグにより障害発生を認識する。次に、Ｆ／Ｗ１４ａ，１４ｂは、ＡＳＩＣ１３ａの動作モード情報を参照し、物理分割モードか否かの判断を行う（Ｓ１４）。物理分割モードでない場合（Ｓ１４，Ｎ）、処理Ｓ１６へ移行する。物理分割モードである場合（Ｓ１４，Ｙ）、Ｆ／Ｗ１４ａ，１４ｂは、物理分割位置情報を参照して障害が発生したパーティション（障害発生パーティション）を認識し（Ｓ１５）、自己のパーティションが障害発生パーティションであるか否かの判断を行う（Ｓ１６）。図１の例において、Ｆ／Ｗ１４ａ，１４ｂは、障害発生パーティションがパーティション１６ａであることを認識する。

障害発生パーティションである場合（Ｓ１６，Ｙ）、Ｆ／Ｗ１４ａ，１４ｂは、ＡＳＩＣ１３ａから自己のパーティションの障害部位情報を収集し（Ｓ１７）、処理Ｓ３１へ移行する。図１の例において、障害発生パーティションに所属するＦ／Ｗ１４ａは、パーティション１６ａの障害部位情報を収集する。

障害の起きたパーティションでない場合（Ｓ１６，Ｎ）、Ｆ／Ｗ１４ａ，１４ｂは、ＡＳＩＣ１３ａにおける他のパーティションの正常終了情報のフラグのタイムアウト監視を行い、タイムアウトしたか否かの判断を行う（Ｓ２１）。図１の例において、障害発生パーティションに所属しないＦ／Ｗ１４ｂは、このタイムアウト監視を行う。

タイムアウトしなかった場合（Ｓ２１，Ｎ）、即ち、所定の時間内にＡＳＩＣ１３ａにおける障害発生パーティションの正常終了情報のフラグがセットされた場合、このフローは終了する。

タイムアウトした場合（Ｓ２１，Ｙ）、Ｆ／Ｗ１４ａ，１４ｂは、障害発生パーティションの解除情報を設定する（Ｓ２３）。ここで、Ｆ／Ｗ１４ａ，１４ｂは、解除情報のフラグをセットすることにより、ＡＳＩＣ１３ａに隠蔽の解除の要求を行う。解除情報のフラグがセットされたＡＳＩＣ１３ａは、障害発生パーティションの障害情報の隠蔽を解除する（Ｓ２４）。次に、Ｆ／Ｗ１４ａ，１４ｂは、物理分割位置情報と所定の算出式により、障害情報のアドレスを算出し（Ｓ２５）、ＡＳＩＣ１３ａから障害部位情報を収集する（Ｓ２６）。図１の例において、障害発生パーティションに所属しないＦ／Ｗ１４ｂは、障害発生パーティションの正常終了情報のタイムアウト監視を行い、これがタイムアウトすると、パーティション１６ａの解除情報のフラグをセットし、パーティション１６ａの障害部位情報を収集する。

次に、Ｆ／Ｗ１４ａ，１４ｂは、障害詳細情報が必要であるか否かの判断を行う（Ｓ３１）。障害詳細情報が必要でない場合（Ｓ３１，Ｎ）、処理Ｓ３３へ移行する。障害詳細情報が必要である場合（Ｓ３１，Ｙ）、Ｆ／Ｗ１４ａ，１４ｂは、取得した障害部位情報に対応する障害詳細情報を取得する（Ｓ３２）。次に、Ｆ／Ｗ１４ａ，１４ｂは、取得した障害情報（障害部位情報、障害詳細情報）のマージを行い（Ｓ３３）、障害情報を解析することにより、その障害の影響を受けるパーティションと影響を与える障害情報とを特定し（Ｓ３４）、障害解析が正常終了したか否かの判断を行う（Ｓ３５）。

正常終了しない場合（Ｓ３５，Ｎ）、このフローは終了する。正常終了しない場合とは、多重障害により障害情報の収集ができなかった場合等である。図１の例において、Ｆ／Ｗ１４ａは、多重障害により障害処理が中断し、パーティション１６ａの正常終了情報のフラグはセットされない。

正常終了した場合（Ｓ３５，Ｙ）、Ｆ／Ｗ１４ａ，１４ｂは、ＡＳＩＣ１３ａの影響範囲のうち自己の所属するパーティション以外へ障害処理の終了報告を行う（Ｓ４１）。ここで、Ｆ／Ｗ１４ａ，１４ｂは、ＡＳＩＣ１３ａにおける自己のパーティションの正常終了情報のフラグをセットし、他のパーティションのＦ／Ｗは正常終了情報のフラグを監視することにより正常終了を認識する。図１の例において、Ｆ／Ｗ１４ｂは、パーティション１６ｂの正常終了情報のフラグをセットする。

次に、Ｆ／Ｗ１４ａ，１４ｂは、自己のパーティションが障害発生パーティションであるか否かの判断を行う（Ｓ４２）。障害発生パーティションである場合（Ｓ４２，Ｙ）、Ｆ／Ｗ１４ａ，１４ｂは、障害解析結果を筐体管理装置１１及び自己のパーティションのＯＳへ送信し（Ｓ４３）、このフローは終了する。障害発生パーティションでない場合（Ｓ４２，Ｎ）、Ｆ／Ｗ１４ａ，１４ｂは、障害解析結果を筐体管理装置１１へ送信し（Ｓ４４）、このフローは終了する。通常、筐体管理装置１１へ送信される障害解析結果は、障害発生パーティションからの報告である。処理Ｓ４３における障害解析結果は、障害発生パーティション以外からの報告であるが、障害発生パーティションからの報告として表される。

なお、本実施の形態において、ＡＳＩＣ１３ａは、２つのパーティションについてＨ／Ｗの管理を行うとしたが、３つ以上のパーティションについてＨ／Ｗの管理を行う場合でも本発明を適用することができる。

次に、本実施の形態の効果について、物理分割及びパーティションの具体例を用いて説明する。

図４は、本実施の形態に係るサーバにおける物理分割及びパーティションの構成の一例を示すブロック図である。この図のサーバは、ハードウェアとして、システムボード（ＳＢ）３０，３１，３２，３３と、ＩＯユニット（ＩＯＵ）４０，４１，４２，４３を備える。また、パーティション（Ｐ）５０，５１，５２，５３が設定される。ＳＢ３０，３１，３２，３３のそれぞれにおいて、上述したＡＳＩＣが１つずつ備えられる。また、Ｐ５０，５１，５２，５３のそれぞれにおいて、Ｆ／Ｗ及びＯＳが１つずつ動作する。

ＳＢ３０，３３は、物理分割されず、それぞれ１つのＳＢ（ＰＳＢ）３００，３３０として利用される。ＳＢ３１，３２は、物理分割され、それぞれ２つの分割されたＳＢ（ＸＳＢ）３１０及び３１１、３２０及び３２１として利用される。

ＩＯＵ４１，４３は、物理分割されず、それぞれ１つのＩＯＵ４１０，４３０として利用される。ＩＯＵ４０，４２は、物理分割され、それぞれ２つの分割されたＩＯＵ（ＬＩＯＵ）４００及び４０１、４２０及び４２１として利用される。

Ｐ５０には、ＰＳＢ３００、ＬＩＯＵ４００が割り当てられている。Ｐ５１には、ＸＳＢ３１０、ＬＩＯＵ４０１が割り当てられている。Ｐ５２には、ＸＳＢ３１１、ＩＯＵ４１０が割り当てられている。Ｐ５３には、ＸＳＢ３２０，３２１、ＰＳＢ３３０、ＬＩＯＵ４２０，４２１、ＩＯＵ４３０が割り当てられている。

ＳＢ３１のいずれかのＸＳＢにおいて、ＸＳＢ内を影響範囲とする障害が発生した場合、何らかの原因で障害処理が継続出来なければ、もう片方のＸＳＢが属するパーティションで障害処理が続行される。このように、ハードウェアが自らのパーティション以外の障害を処理する場合、本発明の効果により障害情報の取得及び解析を行うことができる。

また、ＳＢ３２のいずれかのＸＳＢで障害が発生した場合、このＸＳＢが属しているＰ５３はパーティションダウンしてしまう。このように、物理分割しているハードウェアが同一のパーティションに属している場合、本発明の効果が得られない。

本実施の形態によれば、従来、多重障害等により障害情報を採取できなかった場合でも、障害情報を採取することができ、障害対策時間を短縮することができる。

なお、ハードウェア管理部は、実施の形態におけるＡＳＩＣに対応する。また、パーティション管理部は、実施の形態におけるＦ／Ｗに対応する。また、障害情報記録部は、実施の形態における筐体管理装置に対応する。ハードウェア管理ステップは、実施の形態におけるＡＳＩＣの処理に対応する。また、パーティション管理ステップは、実施の形態におけるＦ／Ｗの処理に対応する。また、障害情報記録ステップは、実施の形態における筐体管理装置の処理に対応する。

以上説明したように、物理分割機能の使用時に障害情報が取得できる確率を向上させることができる。

Claims

ハードウェア資源を分割してそれぞれを異なるパーティションで利用する物理分割を行うことができる情報処理装置であって、
複数のパーティションに割り当てられた少なくとも１つのハードウェア資源に接続され、前記ハードウェア資源の管理を行うハードウェア管理部であって、前記複数のパーティションのいずれかで障害が発生したことを検知した場合、前記障害が発生したパーティションを障害発生パーティションとし、前記障害の発生を報知するハードウェア管理部と、
前記パーティション毎に備えられたパーティション管理部であって、物理分割の状態であり、且つ前記ハードウェア管理部による報知に基づいて前記障害の発生を認識し、且つ自己のパーティションが前記障害発生パーティションと異なり、且つ前記障害に関する情報である障害情報の取得が必要であると判定した場合、前記障害情報の取得を行うパーティション管理部と
を備える情報処理装置。
請求項１に記載の情報処理装置において、
前記パーティション管理部は、取得した前記障害情報の解析を行い、該解析の結果を障害解析情報として出力し、
更に、前記パーティション管理部により出力された障害解析情報を記録する障害情報記録部を備える情報処理装置。
請求項１または請求項２に記載の情報処理装置において、
前記パーティション管理部は、前記障害発生パーティションにおいて前記障害の情報である障害情報の取得が失敗したと認識した場合、前記障害情報の取得が必要であると判定する情報処理装置。
請求項１乃至請求項３のいずれかに記載の情報処理装置において、
前記ハードウェア管理部は、前記パーティション毎に前記障害情報を保持し、
前記パーティション管理部は、物理分割の状態であり、且つ前記ハードウェア管理部による報知に基づいて前記障害の発生を認識し、且つ自己のパーティションが前記障害発生パーティションと異なり、且つ前記障害情報の取得が必要であると判定した場合、前記ハードウェア管理部から前記障害発生パーティションの前記障害情報を取得する情報処理装置。
請求項４に記載の情報処理装置において、
前記ハードウェア管理部は、前記障害発生パーティションの障害情報を他のパーティションから隠蔽しておき、
前記パーティション管理部は、物理分割の状態であり、且つ前記ハードウェア管理部による報知に基づいて前記障害の発生を認識し、且つ自己のパーティションが前記障害発生パーティションと異なり、且つ前記障害に関する情報である障害情報の取得が必要であると判定した場合、前記ハードウェア管理部による前記隠蔽を解除させ、前記障害情報の取得を行う情報処理装置。
ハードウェア資源を分割してそれぞれを異なるパーティションで利用することができる情報処理装置の障害処理方法であって、
複数のパーティションに割り当てられた少なくとも１つのハードウェア資源の管理を行い、
前記複数のパーティションのいずれかで障害が発生したことを検知した場合、前記障害が発生したパーティションを障害発生パーティションとし、前記障害の発生の報知を行い、
前記複数のパーティションの一つである特定パーティションについて、物理分割の状態であり、且つ前記報知に基づいて前記障害の発生を認識し、且つ前記特定パーティションが前記障害発生パーティションと異なり、且つ前記障害に関する情報である障害情報の取得が必要であると判定した場合、前記障害情報の取得を行う
障害処理方法。