JP2005050084A - 障害時動作検証装置及び障害時動作検証方法 - Google Patents

障害時動作検証装置及び障害時動作検証方法 Download PDF

Info

Publication number
JP2005050084A
JP2005050084A JP2003280762A JP2003280762A JP2005050084A JP 2005050084 A JP2005050084 A JP 2005050084A JP 2003280762 A JP2003280762 A JP 2003280762A JP 2003280762 A JP2003280762 A JP 2003280762A JP 2005050084 A JP2005050084 A JP 2005050084A
Authority
JP
Japan
Prior art keywords
failure
computer
time
server
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003280762A
Other languages
English (en)
Other versions
JP4189854B2 (ja
Inventor
Shoji Otokuni
将司 乙訓
Naoya Haraguchi
直也 原口
Hisao Hayase
久雄 早瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Original Assignee
NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp filed Critical NS Solutions Corp
Priority to JP2003280762A priority Critical patent/JP4189854B2/ja
Publication of JP2005050084A publication Critical patent/JP2005050084A/ja
Application granted granted Critical
Publication of JP4189854B2 publication Critical patent/JP4189854B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】障害毎に、当該障害の発生時における各コンピュータの動作状況を的確に検証することができる障害時動作検証装置を提供する。
【解決手段】定常負荷発生部11はクラスタリングシステム50の各サーバ51a,51bに対して定常的な負荷を継続的に与える。障害発生部12はシステム50に特定の障害を発生させる。処理速度計測部13は、各サーバ51a,51bに対して負荷を継続的に与え始めた後に障害発生部12がシステム50に特定の障害を発生させた場合に、少なくとも当該障害が発生してからシステム50が復旧するまでの間、サーバ51a,51b毎に、負荷に対する当該サーバからの返値を受信し、当該返値に基づいて当該サーバのスループットを計測する。中央処理装置16はその計測された結果に基づいて各サーバ51a,51bのスループットの経時変化を示すグラフを生成し、表示装置15に表示させる。
【選択図】図1

Description

本発明は、一又は複数のコンピュータを有するコンピュータシステムに障害が発生したときに、各コンピュータの動作状況を検証するための障害時動作検証装置及び障害時動作検証方法に関する。
コンピュータシステムはさまざまな原因から動作障害を起こすことがある。かかる動作障害が生ずると、レスポンスが低下したり、コンピュータシステムの動作が停止したりすることがある。このため、コンピュータシステムを構築する際には、このような障害をある程度想定し、高性能のマシンを導入したり、また、複数のマシンを併用する、いわゆるクラスタリングシステムを構成したりする等の対策を講じている。
また、従来、コンピュータシステムに発生する障害を監視する技術(例えば、特許文献1参照。)や、障害が発生したときの復旧に関する技術(例えば、特許文献2参照。)が提案されている。前者の技術によれば、例えば、二台のマシンを併用するクラスタリングシステムにおいて、二台のマシンが互いに相手のマシンに監視信号を送り、その応答信号を受信することにより、各マシンは相手のマシンにおける障害の発生を監視することができる。また、後者の技術によれば、二台のマシンが一台のストレージを共有しているクラスタリングシステムにおいて、動作している側のマシンが、ストレージ内のファイル構成の変更に関する情報を待機している側のマシンに通知することにより、動作している側のマシンに障害が発生した場合、動作している側のマシンから待機している側のマシンへの切り替えの際に、ファイルの一致処理に要する時間を短縮することができる。
特開平6−175868号公報 特開平5−197583号公報
ところで、コンピュータシステムに発生する障害については、CPU、ネットワーク、記憶装置或いはアプリケーション等、さまざまな部位が原因となることが考えられる。そして、その原因に応じて復旧作業の内容が変わってくる。例えば、クラスタリングシステムでは、一台のマシンが障害によって停止状態になっても他のマシンが使える場合が多い。しかし、この場合、必ずしも他のマシンが同じパフォーマンスで稼動し続けるわけではなく、障害の原因によっては当該他のマシンに対する負荷があまりに高くなり、さらに障害が発生することも考えられる。つまり、コンピュータシステムでは、当該システムに発生する障害毎に、当該障害時における各マシンの動作状況を予め知ることが、システム復旧への重要な指標となる。
本発明は上記事情に基づいてなされたものであり、障害毎に、当該障害の発生時における各コンピュータの動作状況を的確に検証することができる障害時動作検証装置及び障害時動作検証方法を提供することを目的とするものである。
上記の目的を達成するための請求項1記載の発明は、一又は複数のコンピュータを有するコンピュータシステムに障害が発生したときに、前記各コンピュータの動作状況を検証するための障害時動作検証装置であって、前記各コンピュータに対して定常的な負荷を与える定常負荷発生手段と、前記コンピュータシステムに対して特定の障害を発生させる障害発生手段と、前記定常負荷発生手段が前記各コンピュータに対して前記負荷を継続的に与え始めた後に前記障害発生手段が前記コンピュータシステムに特定の障害を発生させた場合に、少なくとも当該障害が発生してから前記コンピュータシステムが復旧するまでの間、前記コンピュータ毎に、前記負荷に対する当該コンピュータからの返値を受信し、当該返値に基づいて当該コンピュータの処理速度を計測する処理速度計測手段と、前記処理速度計測手段で得られた前記各コンピュータの処理速度を記憶する記憶手段と、を具備することを特徴とするものである。
上記の目的を達成するための請求項2記載の発明は、一又は複数のコンピュータを有するコンピュータシステムに障害が発生したときに、前記各コンピュータの動作状況を検証するための障害時動作検証装置であって、前記各コンピュータに対して定常的な負荷を与える定常負荷発生手段と、前記定常負荷発生手段が前記各コンピュータに対して前記負荷を継続的に与え始めた後に前記コンピュータシステムに特定の障害を発生させた場合に、少なくとも当該障害が発生してから前記コンピュータシステムが復旧するまでの間、前記コンピュータ毎に、前記負荷に対する当該コンピュータからの返値を受信し、当該返値に基づいて当該コンピュータの処理速度を計測する処理速度計測手段と、前記処理速度計測手段で計測された結果に基づいて前記各コンピュータの処理速度の経時変化を示すグラフを生成し、表示手段に表示させるグラフ生成手段と、を具備することを特徴とするものである。
請求項3記載の発明は、請求項2記載の障害時動作検証装置において、前記コンピュータシステムに対して前記特定の障害を発生させる障害発生手段を備えることを特徴とするものである。
請求項4記載の発明は、請求項1又は3記載の障害時動作検証装置において、前記障害発生手段は、ネットワークカードの障害、コンピュータと外部記憶手段との間のインターフェースの障害、コンピュータ自体の障害、アプリケーションプログラムの障害のうちいずれかの障害を発生させることを特徴とするものである。
請求項5記載の発明は、請求項4記載の障害時動作検証装置において、前記コンピュータシステムは複数のコンピュータを組み合わせて一つのシステムとして利用するクラスタリングシステムであり、前記障害発生手段は、直結されたコンピュータ間のコネクト障害、クラスタソフトウェアの障害のうちいずれかの障害を発生させることを特徴とするものである。
上記の目的を達成するための請求項6記載の発明は、一又は複数のコンピュータを有するコンピュータシステムに障害が発生したときに、前記各コンピュータの動作状況を検証するための障害時動作検証方法であって、検証用コンピュータが前記各コンピュータに対して定常的な負荷を継続的に与える第一ステップと、前記コンピュータシステムに特定の障害を発生させる第二ステップと、前記検証用コンピュータが、少なくとも当該障害が発生してから前記コンピュータシステムが復旧するまでの間、前記コンピュータ毎に、前記負荷に対する当該コンピュータからの返値を受信し、当該返値に基づいて当該コンピュータの処理速度を計測する第三ステップと、前記検証用コンピュータが、前記第三ステップで計測された結果に基づいて前記各コンピュータの処理速度の経時変化を示すグラフを生成し、表示手段に表示する第四ステップと、を具備することを特徴とするものである。
上記の目的を達成するための請求項7記載の発明に係るコンピュータ読み取り可能な記録媒体は、請求項1、2、3、4又は5のいずれかに記載の障害時動作検証装置の機能をコンピュータに実現させるためのプログラムを記録したものである。
上記の目的を達成するための請求項8記載の発明に係るプログラムは、請求項1、2、3、4又は5のいずれかに記載の障害時動作検証装置の機能をコンピュータに実現させるためのものである。
本発明に係る障害時動作検証装置によれば、定常負荷発生手段が各コンピュータに対して負荷を継続的に与え始めた後にコンピュータシステムに特定の障害が与えられた場合に、処理速度計測手段が、コンピュータ毎に、当該負荷に対する当該コンピュータからの返値を受信し、当該返値に基づいて当該コンピュータの処理速度を計測する。このため、コンピュータシステムに各種の障害を与えて各コンピュータのスループットを計測することにより、障害毎に、当該障害の発生時における各コンピュータの動作状況を的確に検証することができる。具体的には、当該障害が発生したときに、各コンピュータが、どのくらいの時間、どの程度の処理を行うことができるのかを検証することができる。また、かかる計測結果を用いて、各コンピュータが当該障害に対して強いのか、弱いのかを評価することができるので、障害発生時におけるシステムの復旧対策を予め講じることができる。
また、処理速度計測手段で得られた計測結果に基づいて、障害発生時における各コンピュータの処理速度の経時変化を示すグラフを生成し、表示手段に表示させることにより、障害発生時における各コンピュータの動作状況をオペレータに容易に知らせることができる。更に、障害発生部がコンピュータシステムに対して特定の障害を発生させることにより、処理速度の計測作業を自動で行うことができる。
本発明の障害時動作検証方法によれば、上記と同様に、障害毎に、当該障害の発生時における各コンピュータの動作状況を的確に検証することができる。また、障害発生時における各コンピュータの処理速度の経時変化を示すグラフを生成し、表示手段に表示させることにより、障害発生時における各コンピュータの動作状況をオペレータに容易に知らせることができる。
以下に、図面を参照して、本願に係る発明を実施するための最良の形態について説明する。図1は本発明の一実施形態に係る障害時動作検証装置と検証の対象となるコンピュータシステムとの概略構成図である。
本実施形態の障害時動作検証装置10は、一又は複数のコンピュータを有するコンピュータシステム50に障害が発生したときに、各コンピュータの動作状況を検証するためのものである。かかる障害時動作検証装置10は、図1に示すように、定常負荷発生部11と、障害発生部12と、処理速度計測部13と、記憶部14と、表示装置15と、中央処理装置16とを備える。この障害時動作検証装置10は、例えば、パーソナルコンピュータ(検証用コンピュータ)により実現される。
本実施形態では、障害時動作検証装置10による検証の対象となるコンピュータシステム50として、二台のサーバを組み合わせて一つのシステムとして利用するクラスタリングシステムを用いる場合について説明する。かかるクラスタリングシステム50は、図1に示すように、二台のサーバ51a,51bと、一台のストレージ(外部記憶手段)52とを有する。サーバ51a,51bとしては略同じ性能のものが用いられる。また、ストレージ52には、データベースが構築されている。各サーバ51a,51bには、図1に示すように、データベースを管理するためのアプリケーションプログラムEが組み込まれている。ここで、データベースを管理するためのアプリケーションプログラムとしては、例えば、Oracle社製のソフトウェアを用いることができる。尚、図1では、各サーバ51a,51b自体を「D」という符号でも表している。
このクラスタリングシステム50では、二台のサーバ51a,51bを設けているので、例えば、システムの一部に障害が発生し、一方のサーバ51a(51b)の機能が停止した場合に、当該一方のサーバ51a(51b)から他方のサーバ51b(51a)に処理を引き継がせることができる。これにより、障害発生時にシステム全体がダウンしてしまうことを防ぐことができる。このようなクラスタリングの機能は、図1に示すように、各サーバ51a,51bがクラスタソフトウェアFを実行することにより、実現される。ここで、クラスタソフトウェアとしては、例えば、Veritas社製のソフトウェアを用いることができる。
また、このクラスタリングシステム50では、二台のサーバ51a,51bを有するという点以外にも、二重化が図られている。すなわち、図1に示すように、サーバ51aとサーバ51bとは、二つのインターコネクトA1,A2によって接続されている。各サーバ51a,51bは、かかるインターコネクトA1,A2を介して相手のサーバと通信を行う。また、各サーバ51a,51bは二つのネットワークカード(NIC)B1,B2を備えており、各サーバ51a,51bにおいては、二つのネットワークカードB1,B2に通信回線が接続されている。更に、ストレージ52はそれ自体が内部で二重化されている。そして、各サーバ51a,51bは、ストレージ52と接続するためのインターフェースを二つ備えており、二つのストレージ経路C1,C2を介してストレージ52にアクセスすることができる。
本実施形態の障害時動作検証装置10は、ネットワークを介して各サーバ51a,51bと接続されている。このため、この障害時動作検証装置10は、クラスタリングシステム50に対してクライアントとして動作することになる。定常負荷発生部11は、各サーバ51a,51bに対して定常的な負荷を与えるものである。障害発生部12は、クラスタリングシステム50に対して特定の障害を発生させるものである。障害発生部12によって発生させる障害については後に詳述する。
処理速度計測部13は、定常負荷発生部11が各サーバ51a,51bに対して負荷を継続的に与え始めた後に、サーバ51a,51b毎に、負荷に対する当該サーバからの返値を受信し、当該返値に基づいて当該サーバの処理速度を計測するものである。具体的に、処理速度計測部13には、各サーバ51a,51bからの返値として処理データ(トランザクション)が送られてくる。処理速度計測部13は、かかる処理データが1秒間にいくつ送られてきたのかを計測し続けることにより、各サーバ51a,51bの処理速度(スループット)を1秒毎に求める。特に、本実施形態では、処理速度計測部13は、障害発生部12がクラスタリングシステム50に特定の障害を発生させた場合に、少なくとも当該障害が発生してからクラスタリングシステム50が復旧するまでの間、各サーバ51a,51bのスループットを計測する。ここで、本実施形態において、「復旧する」とは、障害を与えた側のサーバが処理を完全に停止する場合には、障害を与えていない側のサーバによる処理が正常に行われるようになることをいい、障害を与えた側のサーバが処理を一時的に停止する場合には、当該サーバによる処理が正常に行われるようになることをいうものとする。
ところで、従来、ベンチマークテストによりコンピュータシステムの性能を評価することが行われている。ベンチマークテストは、コンピュータシステムに所定の負荷を与えて、スループットを測定するための技術である。このベンチマークテストの結果を用いると、例えば、あるシステムを構築しようとした場合に、当該マシンに所望の処理を行わせることができるかどうかを事前に評価することができる。本実施形態においては、例えば、このようなベンチマークテストを行うソフトウェアを中央処理装置16に実行させることにより、定常負荷発生部11及び処理速度計測部13の機能を実現することができる。しかし、従来、ベンチマークテストは、あくまで正常なコンピュータシステムの性能を評価するために用いられており、コンピュータシステムに障害が発生した際に行われることはなかった。したがって、ベンチマークテストの技術を利用して、障害の発生時に各サーバ51a,51bのスループットを計測するという点は、本実施形態の障害時動作検証装置10の一つの特徴点であるということができる。
記憶部14には、処理速度計測部13で得られた各サーバ51a,51bのスループットが記憶される。中央処理装置16は、各部の動作を統括するものである。また、この中央処理装置16は、記憶部14に記憶された処理速度計測部13の計測結果に基づいて、各サーバ51a,51bのスループットの経時変化を示すグラフを生成すると共に障害発生時における動作の特徴量を算出する。かかるグラフや特徴量は、表示装置15の表示される。すなわち、中央処理装置16は、本発明の「グラフ生成手段」の役割を果たす。
次に、障害時動作検証装置10が検証を行う際にクラスタリングシステム50に与える障害について説明する。かかる障害としては、例えば、「インターコネクト障害」、「NIC障害」、「ストレージ経路障害」、「ノード障害」、「アプリケーション障害」、「クラスタソフトウェア障害」等を挙げることができる。これらは、クラスタリングシステム50において、一般的に、その発生が想定される障害である。
インターコネクト障害とは、直結されたサーバ51a,51b間のコネクト障害のことである。例えば、このインターコネクト障害には、インターコネクトA1,A2のうちいずれか一方に障害を与える「インターコネクト一重障害」、インターコネクトA1,A2の両方に同時に障害を与える「インターコネクト同時二重障害」、インターコネクトA1,A2のうちいずれか一方に障害を与え、クラスタリングシステム50が復旧した後に、他方のインターコネクトに障害を与える「インターコネクト非同期二重障害」がある。
NIC障害とは、ネットワークカードの障害のことである。例えば、このNIC障害には、一のサーバについて、二つのネットワークカードB1,B2のうちいずれか一方に障害を与える「NIC一重障害」、一のサーバについて、二つのネットワークカードB1,B2の両方に同時に障害を与える「NIC同時二重障害」、一のサーバについて、二つのネットワークカードB1,B2のうちいずれか一方に障害を与え、クラスタリングシステム50が復旧した後に、他方のネットワークカードに障害を与える「NIC非同期二重障害」がある。
ストレージ経路障害とは、サーバとストレージ52との間のインターフェースの障害のことである。例えば、このストレージ経路障害には、一のサーバについて、二つのストレージ経路C1,C2のうちいずれか一方に障害を与える「ストレージ経路一重障害」、一のサーバについて、二つのストレージ経路C1,C2の両方に同時に障害を与える「ストレージ経路同時二重障害」、一のサーバについて、二つのストレージ経路C1,C2のうちいずれか一方に障害を与え、クラスタリングシステム50が復旧した後に、他方のストレージ経路に障害を与える「ストレージ経路非同期二重障害」がある。尚、本実施形態では、各サーバ51a,51bは、二つのストレージ経路C1,C2のうち一方だけを使ってストレージ52にアクセスしている。「ストレージ経路一重障害」の場合には、実際に使用している方のストレージ経路に障害を与えることにしている。
ノード障害とは、サーバ51a,51b自体の障害のことである。例えば、このノード障害には、一のサーバについて、オペレーティングシステム(OS)に障害を与え、サーバ自体を停止させてしまう「ノード異常停止障害」がある。また、アプリケーション障害とは、アプリケーションプログラムの障害のことである。例えば、このアプリケーション障害には、一のサーバについて、データベースを管理するアプリケーションプログラムに障害を与える「データベースソフト障害」がある。更に、クラスタソフトウェア障害とは、クラスタソフトウェアの障害のことである。例えば、このクラスタソフトウェア障害には、一のサーバでクラスタソフトウェアを停止させてしまう「クラスタソフトウェア停止障害」がある。
本実施形態では、障害発生部12は、クラスタリングシステム50の一方のサーバに所定のコマンドを送信することにより、これらの障害を発生させる。具体的に、クラスタリングシステム50にノード障害、アプリケーション障害又はクラスタソフトウェア障害を与える場合には、障害発生部12は、一方のサーバに、それぞれOS、アプリケーションプログラム、クラスタソフトウェアを停止させる旨のコマンドを送信する。また、クラスタリングシステム50にインターコネクト障害、NIC障害又はストレージ経路障害を与える場合には、障害発生部12は、一方のサーバに、例えば、当該ポートの設定を変更する旨のコマンド、あるいは当該ドライバを停止させる旨のコマンドを送信する。
尚、インターコネクト障害、NIC障害、ストレージ経路障害については、障害発生部12が所定のコマンドを送信するのではなく、オペレータが物理的に当該接続線を引き抜くことにより、これらの障害をクラスタリングシステム50に与えるようにしてもよい。
次に、本実施形態の障害時動作検証装置10が、クラスタリングシステム50に障害が発生したときに各サーバ51a,51bの動作状況を検証する手順について説明する。
かかる検証は、クラスタリングシステム50が稼動している状態にあるときに行われる。ここでは、二台のサーバ51a,51bがともに処理を実行している状態のときに、検証を行う場合を考える。但し、検証が行われている間、障害時動作検証装置10以外のクライアントからクラスタリングシステム50への通信はすべてシャットアウトしておく。
まず、定常負荷発生部11は、各サーバ51a,51bに対して定常的な負荷を継続的に与える。かかる負荷は、具体的には、当該サーバに所定の処理を行わせるための命令である。ここで、クラスタリングシステム50に対して一般のベンチマークテストを行う場合には、いずれのサーバに処理を行わせるのかを決めずに、負荷を与える。すなわちシステム全体に対して負荷を与えている。これに対し、本実施形態では、定常負荷発生部は、サーバ51aに対する負荷、サーバ51bに対する負荷というように、負荷を与える対象を指定している。これは、各サーバ51a,51bから負荷に対する返値が送られたときに、障害時動作検証装置10が、当該返値がいずれのサーバ51a,51bから送られたものであるかを識別することができるようにするためである。
こうして、定常負荷発生部11が各サーバ51a,51bに対して負荷を継続的に与えると、各サーバ51a,51bからは当該負荷に対する返値が送られてくる。処理速度計測部13は、サーバ51a,51b毎に、当該返値に基づいて当該サーバのスループットを1秒毎に計測する。そして、処理速度計測部13で得られた各サーバ51a,51bのスループットは記憶部14に格納される。
次に、クラスタリングシステム50に特定の障害を発生させる。具体的には、障害発生部12が一のサーバに対して当該障害を発生させるための所定のコマンドを送信する。但し、クラスタリングシステム50にインターコネクト障害、NIC障害又はストレージ経路障害を発生させる場合には、障害発生部12が所定のコマンドを送信するのではなく、オペレータが所定の接続線を引き抜くようにしてもよい。
障害が発生した後も、定常負荷発生部11は各サーバ51a,51bに対して負荷を継続的に与えており、処理速度計測部13は、障害が発生してからクラスタリングシステム50が復旧するまでの間も、サーバ51a,51b毎に、当該サーバのスループットを計測している。これにより、障害が発生してからクラスタリングシステム50が復旧するまでの間における各サーバ51a,51bの性能に関する情報を得ることができる。すなわち、障害が発生した場合に、各サーバ51a,51bが、どのくらいの時間、どの程度の負荷の下でどのくらいの量の処理を行うことができるのかという情報を得ることができる。
次に、中央処理装置16は、記憶部14に記憶された処理速度計測部13の計測結果に基づいて、各サーバ51a,51bのスループットの経時変化を示すグラフを生成する。そして、中央処理装置16は、その生成したグラフを表示装置15の画面上に表示させる。図2は、各サーバ51a,51bのスループットの経時変化を示すグラフの一例を示す図である。このグラフは、クラスタリングシステム50が正常に動作しているときに得られたものである。ここで、図2において、縦軸にスループット(処理数/秒)、横軸に時間(秒)をとっている。この図2のグラフによれば、障害が発生してない場合、各サーバ51a,51bは略一定のスループットで処理を行っていることが分かる。
また、中央処理装置16は、記憶部14に記憶された処理速度計測部13の計測結果に基づいて、障害発生時における動作の特徴量を算出する。そして、中央処理装置16は、その算出した特徴量を表示装置15の画面上に表示させる。中央処理装置16が算出する特徴量としては、「復旧時間」、「処理停止時間」、「性能劣化時間」、「各サーバの障害時処理数」等が用いられる。復旧時間は、障害が発生したときから当該システムが復旧するまでの時間である。処理停止時間は、障害が発生したときから当該システムが復旧するまでの間において、二台のサーバが同時に処理を停止している時間の合計である。性能劣化時間は、障害が発生したときから当該システムが復旧するまでの間において、一のサーバのスループットがゼロではないが正常時よりも低下している時間の合計である。ここで、性能劣化時間を求める対象となるサーバは、障害を起こしたサーバが処理を完全に停止した場合には当該サーバではないもう一方のサーバであり、障害を起こしたサーバが処理を再開した場合には当該サーバである。処理停止時間と性能劣化時間とを加えると、復旧時間になる。
また、各サーバの障害時処理数は、障害が発生したときから当該システムが復旧するまでの間に各サーバ51a,51bが行った処理数である。かかる障害時処理数は、スループットの経時変化を示すグラフにおいて、障害発生時から復旧時までの間で、当該サーバのスループットを示す折れ線と横軸とで囲まれる面積として表される。
以上で、障害時動作検証装置10による検証動作が終了する。クラスタリングシステム50に他の種類の障害を発生させたときの各サーバ51a,51bの動作状況を検証する場合には、上記の手順を再度繰り返す。
本実施形態では、障害発生時における各サーバ51a,51bのスループットの経時変化を示すグラフに加えて、復旧時間、処理停止時間、性能劣化時間、各サーバの障害時処理数が表示装置15の画面上に表示される。従来、クラスタリングシステム50に障害が起こった場合には、復旧時間だけを計測しており、障害発生時からシステムの復旧時までの間に各サーバ51a,51bがどのような動作をするのかを知ることができなかった。これに対し、本実施形態では、各サーバ51a,51bのスループットの経時変化を示すグラフを表示装置15の画面上に表示することができるので、障害発生時における各サーバ51a,51bの動作状況を詳細に知ることができる。しかも、本実施形態では、障害発生時におけるクラスタリングシステム50の動作状況を示す指標としては、復旧時間だけでなく、処理停止時間、性能劣化時間、各サーバの障害時処理数をも用いることができる。このため、本実施形態の障害時動作検証装置10を用いると、クラスタリングシステム50が当該障害に対して強いのか、弱いのかを評価することができる。
本発明者等は、実際に、障害時動作検証装置10を用いて、クラスタリングシステム50に各種の障害を発生させ、そのときの各サーバ51a,51bの動作状況を検証した。その結果、各サーバ51a,51bのスループットの経時変化を示すグラフは、発生させた障害に応じていくつかのパターンに分類されることが分かった。
図3及び図4は障害発生時におけるスループットの経時変化を示すグラフのパターンを説明するための図である。ここで、図3及び図4では各グラフを模式的に示している。各グラフでは、縦軸にスループット(処理数/秒)を、横軸に時間(秒)をとっている。また、各グラフにおいて、手前側には、障害を与えた側のサーバ(障害側サーバ)についてのグラフを、奥側には、障害を与えなかった側のサーバ(正常側サーバ)についてのグラフを示している。図3及び図4に示すように、障害発生時における各サーバのスループットの経時変化を示すグラフは、7つのパターンに分類される。また、この7つのパターンは、大きく二つに分類される。すなわち、障害側サーバが処理を継続するか、若しくは一定時間経過後に処理を開始する第一のパターンと、障害側サーバが障害によって処理を完全に停止する第二のパターンとである。ここで、第一のパターンには、A−1,A−2,A−3が属し、第二のパターンには、B−1a,B−1b,B−2a,B−2bが属する。尚、第一及び第二のパターンにおいて、正常側サーバは処理を継続するか、若しくは一定時間経過後に処理を開始する。
各パターンについて詳しく説明する。パターンA−1では、障害側サーバ、正常側サーバはともに処理を停止することなく、処理を継続する。パターンA−2では、障害側サーバは障害発生時に処理を一時停止し、一定時間経過後に処理を開始するが、正常側サーバは処理を停止することなく、処理を継続する。パターンA−3では、障害側サーバ、正常側サーバはともに障害発生時に処理を一時停止し、一定時間経過後に処理を開始する。
また、パターンB−1aでは、障害側サーバは障害発生時に処理を停止するが、正常側サーバは、障害発生時に処理を一時停止し、一定時間経過後に処理を開始する。パターンB−1bでは、障害側サーバが障害発生時に処理を停止するが、正常側サーバは、障害発生時から少し遅れて処理を一時停止し、一定時間経過後に処理を開始する。パターンB−2aでは、障害側サーバは障害発生時に処理を停止し、一方、正常側サーバは、障害発生時に処理を一時停止し、一定時間経過後に処理を開始するが、そのスループットが徐々に正常時の値に戻る。パターンB−2bでは、障害側サーバは障害発生時に処理を停止し、一方、正常側サーバは、障害発生時から少し遅れて処理を一時停止し、一定時間経過後に処理を開始するが、そのスループットが徐々に正常時の値に戻る。
ここで、パターンA−1,A−2では、処理停止時間、性能劣化時間はともにゼロである。パターンA−3,B−1a,B−1bでは、二台のサーバが処理を停止している時間が処理停止時間T1である。この場合には、性能劣化時間はゼロである。また、パターンB−2a,B−2bでは、二台のサーバが処理を停止している時間が処理停止時間T1であり、正常側サーバが処理を再開してからスループットが正常に戻るまでの時間が性能劣化時間T2である。
尚、図3及び図4にはグラフのパターンとして理想的なパターンを示しており、実際に得られるグラフが図3及び図4に示すパターンと完全に一致するとは限らない。このため、例えば、実際に得られたグラフがパターンA−2に分類されたとしても、当該グラフにおいて、障害側サーバのスループットが徐々に正常時の値に戻るような場合には、性能劣化時間がゼロでないことがある。
次に、実際に各種の障害をクラスタリングシステム50に発生させたときに得られた各グラフがどのパターンに属するのかを説明する。
「インターコネクト一重障害」を発生させた場合のグラフはパターンA−3に属する。すなわち、インターコネクト一重障害が発生すると、二台のサーバは互いに相手を認識することができなくなってしまい、各サーバにおいて処理が一時停止した。その後、二台のサーバは、もう一方の正常なインターコネクトを認識し、それを利用することにより処理を開始した。また、「インターコネクト同時二重障害」又は「インターコネクト非同期二重障害」を発生させた場合のグラフはパターンB−2bに属する。ここで、「インターコネクト非同期二重障害」については、二度目のインターコネクト障害を発生させた場合のグラフを考えている。インターコネクト同時二重障害が発生すると、二台のサーバ間で通信ができなくなるので、この状態で、各サーバがストレージにデータの書き込みを行うと、一方のサーバは、他方のサーバが書き込んだデータを認識できなくなる。このため、クラスタソフトウェアは、かかる障害が発生した場合、二台のサーバのうちいずれか一方のサーバだけを生き残らせるようにしている。実際には、障害側サーバは障害発生時に処理を停止し、正常側サーバは障害発生時から少し遅れて処理を一時停止し、一定時間経過後に処理を徐々に開始した。また、インターコネクト非同期二重障害を発生させた場合のグラフも、インターコネクト同時二重障害を発生させた場合のグラフと略同様の振る舞いを示した。
「NIC一重障害」を発生させた場合のグラフはパターンA−2に属する。すなわち、NIC一重障害が発生すると、障害側サーバは、処理を一時停止したが、もう一方の正常なNICを認識し、それを利用することにより処理を開始した。一方、正常側サーバは処理を継続した。また、「NIC同時二重障害」又は「NIC非同期二重障害」を発生させた場合のグラフはパターンB−2bに属する。ここで、「NIC非同期二重障害」については、二度目のNIC障害を発生させた場合のグラフを考えている。NIC同時二重障害が発生すると、障害側サーバはネットワークに接続できなくなるので、処理を停止した。一方、正常側サーバは、障害発生時から少し遅れて処理を一時停止し、一定時間経過後に処理を徐々に開始した。また、NIC非同期二重障害を発生させた場合のグラフも、NIC同時二重障害を発生させた場合のグラフと略同様の振る舞いを示した。
「ストレージ経路一重障害」を発生させた場合のグラフはパターンA−2に属する。すなわち、ストレージ経路一重障害が発生すると、障害側サーバは、処理を一時停止したが、もう一方の正常なストレージ経路を認識し、それを利用することにより処理を開始した。一方、正常側サーバは処理を継続した。また、「ストレージ経路同時二重障害」又は「ストレージ経路非同期二重障害」を発生させた場合のグラフはパターンB−2bに属する。ここで、「ストレージ経路非同期二重障害」については、二度目のストレージ経路障害を発生させた場合のグラフを考えている。ストレージ経路同時二重障害が発生すると、障害側サーバは処理を行うことができなくなるので、当然に処理を停止した。一方、正常側サーバは、障害発生時から少し遅れて処理を一時停止し、一定時間経過後に処理を徐々に開始した。また、ストレージ経路非同期二重障害を発生させた場合のグラフも、ストレージ経路同時二重障害を発生させた場合のグラフと略同様の振る舞いを示した。
「ノード異常停止障害」はパターンB−2bに属する。すなわち、ノード異常停止障害が発生すると、障害側サーバのOSが停止するので、障害側サーバは当然に処理を停止した。一方、正常側サーバは、障害発生時から少し遅れて処理を一時停止し、一定時間経過後に処理を徐々に開始した。また、「データベースソフト障害」はパターンB−2aに属する。すなわち、データベースソフト障害が発生すると、データベースを管理しているアプリケーションソフトが停止するので、障害側サーバは処理を停止した。一方、正常側サーバは、障害発生時から少し遅れて処理を一時停止し、一定時間経過後に処理を開始した。更に、「クラスタソフトウェア停止障害」はパターンB−1bに属する。すなわち、クラスタソフトウェア停止障害が発生すると、障害側サーバは処理を停止し、一方、正常側サーバは、障害発生時から少し遅れて処理を一時停止し、一定時間経過後に処理を開始した。
また、本発明者等は、検証の対象であるクラスタリングシステム50の構成を変更したときに、障害発生時におけるスループットの経時変化を示すグラフがどのような影響を受けるかを調べた。その結果、次のことが分かった。すなわち、障害発生時におけるスループットの経時変化を示すグラフについての定性的な傾向は、負荷を与えるためのソフトウェアの種類や、サーバの性能には依存しないことが分かった。また、障害時におけるスループットの経時変化を示すグラフについての定性的な傾向は、主にクラスタソフトウェアに依存することが分かった。このため、クラスタリングシステム50において異なるクラスタソフトウェアを用いた場合には、同じ障害を発生させた場合でも、障害発生時におけるスループットの経時変化を示すグラフの定性的な傾向が変わってしまう。但し、この場合であっても、スループットの経時変化を示すグラフは、発生させた障害に応じていくつかのパターンに分類される。
本実施形態の障害時動作検証装置では、定常負荷発生部が各サーバに対して負荷を継続的に与え始めた後にクラスタリングシステムに特定の障害が与えられた場合に、処理速度計測部が、サーバ毎に、当該負荷に対する当該サーバからの返値を受信し、当該返値に基づいて当該サーバのスループットを計測する。このため、クラスタリングシステムに各種の障害を与えて各サーバのスループットを計測することにより、障害毎に、当該障害の発生時における各サーバの動作状況を的確に検証することができる。具体的には、当該障害が発生したときに、各サーバが、どのくらいの時間、どの程度の処理を行うことができるのかを検証することができる。また、かかる計測結果を用いて、各サーバが当該障害に対して強いのか、弱いのかを評価することができるので、障害発生時におけるシステムの復旧対策を予め講じることができる。
また、処理速度計測部で得られた計測結果に基づいて、障害発生時における各サーバのスループットの経時変化を示すグラフを生成し、表示装置の画面上に表示させることにより、障害発生時における各サーバの動作状況をオペレータに容易に知らせることができる。更に、障害発生部がクラスタリングシステムに対して特定の障害を発生させることにより、スループットの計測作業を自動で行うことができる。
尚、本発明は上記の実施形態に限定されるものではなく、その要旨の範囲内において種々の変形が可能である。
例えば、上記の実施形態では、障害発生部を、障害時動作検証装置本体に組み込んだ場合について説明したが、障害発生部を、クラスタリングシステムの各サーバに組み込むようにしてもよい。この場合、例えば、障害発生部は、所定の時刻に所定のコマンドを発することにより当該サーバに所定の障害を与えるようにする。また、障害発生部を、障害時動作検証装置本体とは別のクライアントに組み込むようにしてもよい。
また、上記の実施形態では、クラスタリングシステムの二台のサーバがともに処理を実行しているときに障害時動作検証装置が検証を行う場合について説明したが、一方のサーバだけが処理を実行し、他方のサーバが待機しているときに障害時動作検証装置が検証を行うようにしてもよい。
更に、上記の実施形態では、検証の対象として、二台のサーバを有するクラスタリングシステムを用いる場合について説明したが、検証の対象としては、一般に、一又は複数のコンピュータを有するコンピュータシステムを用いることができる。尚、当然のことであるが、検証対象のシステムに応じて、検証の際に当該システムに与えることのできる障害の種類は異なる。例えば、単体のコンピュータに対して検証を行う場合には、そのコンピュータに対してインターコネクト障害を与えることはない。
本発明の目的は、上述した実施形態の装置の機能を実現するソフトウェアのプログラムコード(実行形式を含む)を、その全体あるいは一部を記録した記録媒体により、本実施形態の装置に供給し、その装置のコンピュータ(又はCPU、MPU)が記録媒体に格納されたプログラムコードを読み出して、動作の全部あるいは一部を実行することによっても達成されることはいうまでもない。この場合、記録媒体から読み出されたプログラムコード自体が本実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
プログラムコードを供給するための記録媒体としては、ROM、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード等を用いることができる。さらに、通信回線を介してダウンロードすることによってプログラムコードを供給するようにしてもよいし、JAVA(登録商標)などの技術を利用してプログラムコードを供給して実行するようにしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、本実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOSなどが実際の処理の一部又は全部を行い、その処理によって本実施形態の機能が実現される場合も本発明に含まれることはいうまでもない。
更に、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータが接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって本実施形態の機能が実現される場合も本発明に含まれることはいうまでもない。
加えて、本発明はコンピュータに上記の実施形態の装置の機能を実現させるためのプログラムを含むプログラム・プロダクトであってもよい。ここで、プログラム・プロダクトというのは、コンピュータ・プログラムだけでなく、プログラムを記録した記録媒体あるいはコンピュータを含むものである。
以上説明したように、本発明の障害時動作検証装置及び障害時動作検証方法によれば、一又は複数のコンピュータを有するコンピュータシステムについて、障害が発生したときに各コンピュータの処理速度を計測することにより、当該障害の発生時に各コンピュータがどのくらいの時間、どの程度の処理を行うことができるのかを検証することができる。また、かかる計測結果を用いて、各コンピュータが当該障害に対して強いのか、弱いのかを評価することができるので、障害発生時におけるシステムの復旧対策を予め講じることができる。したがって、本発明は、障害毎に、当該障害の発生時における各コンピュータの動作状況を的確に検証する場合に適用することができる。
本発明の一実施形態に係る障害時動作検証装置と検証の対象となるコンピュータシステムとの概略構成図である。 クラスタリングシステムにおける各サーバのスループットの経時変化を示すグラフの一例を示す図である。 障害発生時におけるスループットの経時変化を示すグラフのパターンを説明するための図である。 障害発生時におけるスループットの経時変化を示すグラフのパターンを説明するための図である。
符号の説明
10 障害時動作検証装置
11 定常負荷発生部
12 障害発生部
13 処理速度計測部
14 記憶部
15 表示装置
16 中央処理装置
50 クラスタリングシステム
51a,51b サーバ
52 ストレージ

Claims (8)

  1. 一又は複数のコンピュータを有するコンピュータシステムに障害が発生したときに、前記各コンピュータの動作状況を検証するための障害時動作検証装置であって、
    前記各コンピュータに対して定常的な負荷を与える定常負荷発生手段と、
    前記コンピュータシステムに対して特定の障害を発生させる障害発生手段と、
    前記定常負荷発生手段が前記各コンピュータに対して前記負荷を継続的に与え始めた後に前記障害発生手段が前記コンピュータシステムに特定の障害を発生させた場合に、少なくとも当該障害が発生してから前記コンピュータシステムが復旧するまでの間、前記コンピュータ毎に、前記負荷に対する当該コンピュータからの返値を受信し、当該返値に基づいて当該コンピュータの処理速度を計測する処理速度計測手段と、
    前記処理速度計測手段で得られた前記各コンピュータの処理速度を記憶する記憶手段と、
    を具備することを特徴とする障害時動作検証装置。
  2. 一又は複数のコンピュータを有するコンピュータシステムに障害が発生したときに、前記各コンピュータの動作状況を検証するための障害時動作検証装置であって、
    前記各コンピュータに対して定常的な負荷を与える定常負荷発生手段と、
    前記定常負荷発生手段が前記各コンピュータに対して前記負荷を継続的に与え始めた後に前記コンピュータシステムに特定の障害を発生させた場合に、少なくとも当該障害が発生してから前記コンピュータシステムが復旧するまでの間、前記コンピュータ毎に、前記負荷に対する当該コンピュータからの返値を受信し、当該返値に基づいて当該コンピュータの処理速度を計測する処理速度計測手段と、
    前記処理速度計測手段で計測された結果に基づいて前記各コンピュータの処理速度の経時変化を示すグラフを生成し、表示手段に表示させるグラフ生成手段と、
    を具備することを特徴とする障害時動作検証装置。
  3. 前記コンピュータシステムに対して前記特定の障害を発生させる障害発生手段を備えることを特徴とする請求項2記載の障害時動作検証装置。
  4. 前記障害発生手段は、ネットワークカードの障害、コンピュータと外部記憶手段との間のインターフェースの障害、コンピュータ自体の障害、アプリケーションプログラムの障害のうちいずれかの障害を発生させることを特徴とする請求項1又は3記載の障害時動作検証装置。
  5. 前記コンピュータシステムは複数のコンピュータを組み合わせて一つのシステムとして利用するクラスタリングシステムであり、前記障害発生手段は、直結されたコンピュータ間のコネクト障害、クラスタソフトウェアの障害のうちいずれかの障害を発生させることを特徴とする請求項4記載の障害時動作検証装置。
  6. 一又は複数のコンピュータを有するコンピュータシステムに障害が発生したときに、前記各コンピュータの動作状況を検証するための障害時動作検証方法であって、
    検証用コンピュータが前記各コンピュータに対して定常的な負荷を継続的に与える第一ステップと、
    前記コンピュータシステムに特定の障害を発生させる第二ステップと、
    前記検証用コンピュータが、少なくとも当該障害が発生してから前記コンピュータシステムが復旧するまでの間、前記コンピュータ毎に、前記負荷に対する当該コンピュータからの返値を受信し、当該返値に基づいて当該コンピュータの処理速度を計測する第三ステップと、
    前記検証用コンピュータが、前記第三ステップで計測された結果に基づいて前記各コンピュータの処理速度の経時変化を示すグラフを生成し、表示手段に表示する第四ステップと、
    を具備することを特徴とする障害時動作検証方法。
  7. 請求項1、2、3、4又は5のいずれかに記載の障害時動作検証装置の機能をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  8. 請求項1、2、3、4又は5のいずれかに記載の障害時動作検証装置の機能をコンピュータに実現させるためのプログラム。
JP2003280762A 2003-07-28 2003-07-28 障害時動作検証装置及び障害時動作検証方法 Expired - Lifetime JP4189854B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003280762A JP4189854B2 (ja) 2003-07-28 2003-07-28 障害時動作検証装置及び障害時動作検証方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003280762A JP4189854B2 (ja) 2003-07-28 2003-07-28 障害時動作検証装置及び障害時動作検証方法

Publications (2)

Publication Number Publication Date
JP2005050084A true JP2005050084A (ja) 2005-02-24
JP4189854B2 JP4189854B2 (ja) 2008-12-03

Family

ID=34266487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003280762A Expired - Lifetime JP4189854B2 (ja) 2003-07-28 2003-07-28 障害時動作検証装置及び障害時動作検証方法

Country Status (1)

Country Link
JP (1) JP4189854B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133870A (ja) * 2005-11-07 2007-05-31 Internatl Business Mach Corp <Ibm> コンピューティング・システムのオートノミック能力を測定するための方法、システム及びコンピュータ・プログラム
JP2008181432A (ja) * 2007-01-26 2008-08-07 Mitsubishi Electric Corp ヘルスチェック装置及びヘルスチェック方法及びプログラム
KR101266359B1 (ko) * 2009-05-08 2013-05-22 한국전자통신연구원 선택적 오류 주입 활성화를 통한 저비용 소프트웨어 신뢰성 시험 방법, 소프트웨어 신뢰성 시험을 지정 대상 모듈로 한정하는 방법, 소프트웨어 신뢰성 시험을 위한 대상 모듈에 부하를 발생시키는 방법 및 이러한 방법들을 사용하여 소프트웨어 신뢰성 시험을 하는 컴퓨팅 장치
KR101269549B1 (ko) * 2009-05-08 2013-06-04 한국전자통신연구원 오류 주입을 이용한 소프트웨어 신뢰성 테스트 시스템 및 방법
JP2013537344A (ja) * 2010-09-20 2013-09-30 ネットフリックス・インコーポレイテッド ネットワーク化アプリケーションの弾力性検証

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133870A (ja) * 2005-11-07 2007-05-31 Internatl Business Mach Corp <Ibm> コンピューティング・システムのオートノミック能力を測定するための方法、システム及びコンピュータ・プログラム
JP2008181432A (ja) * 2007-01-26 2008-08-07 Mitsubishi Electric Corp ヘルスチェック装置及びヘルスチェック方法及びプログラム
KR101266359B1 (ko) * 2009-05-08 2013-05-22 한국전자통신연구원 선택적 오류 주입 활성화를 통한 저비용 소프트웨어 신뢰성 시험 방법, 소프트웨어 신뢰성 시험을 지정 대상 모듈로 한정하는 방법, 소프트웨어 신뢰성 시험을 위한 대상 모듈에 부하를 발생시키는 방법 및 이러한 방법들을 사용하여 소프트웨어 신뢰성 시험을 하는 컴퓨팅 장치
KR101269549B1 (ko) * 2009-05-08 2013-06-04 한국전자통신연구원 오류 주입을 이용한 소프트웨어 신뢰성 테스트 시스템 및 방법
JP2013537344A (ja) * 2010-09-20 2013-09-30 ネットフリックス・インコーポレイテッド ネットワーク化アプリケーションの弾力性検証
KR101575010B1 (ko) 2010-09-20 2015-12-08 넷플릭스, 인크. 네트워크화된 애플리케이션들의 리질리언시의 검증
US9858133B2 (en) 2010-09-20 2018-01-02 Netflix, Inc. Techniques for assessing the resiliency of a distribution computing service provided by a collection of interacting servers

Also Published As

Publication number Publication date
JP4189854B2 (ja) 2008-12-03

Similar Documents

Publication Publication Date Title
US8959375B2 (en) System and method for power management of storage resources
JP2002333935A (ja) 冗長コントローラシステムにコントローラを活線挿入する方法およびシステム
CN102171662B (zh) 用于管理替换单元的测试的、具有可替换单元的计算机化存储系统
CN114675791B (zh) 一种磁盘处理方法、系统及电子设备
CN110291505A (zh) 减少应用的恢复时间
CN100545814C (zh) 信息处理设备及其控制设备、控制方法
JP4189854B2 (ja) 障害時動作検証装置及び障害時動作検証方法
CN109324549B (zh) 一种双主控设备配置方法及双主控设备
JPS6375963A (ja) システム回復方式
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JP5040970B2 (ja) システム制御サーバ、ストレージシステム、設定方法および設定プログラム
WO2012131868A1 (ja) 計算機システムの管理方法及び管理装置
CN110968456B (zh) 分布式存储系统中故障磁盘的处理方法及装置
US7533297B2 (en) Fault isolation in a microcontroller based computer
JP2013061841A (ja) 情報処理装置および情報処理装置の試験方法
CN104346233A (zh) 一种用于计算机系统的故障恢复方法及装置
CN110287066B (zh) 一种服务器分区迁移方法及相关装置
JPH07183891A (ja) 計算機システム
JPH08320852A (ja) 二重化cpu保守交換時の動作一致検証方式
CN112162887A (zh) 存储设备及其机框共享部件访问方法、装置、存储介质
JP3448197B2 (ja) 情報処理装置
CN105306256B (zh) 一种基于VxWorks设备的双机热备实现方法
CN113688017B (zh) 多节点BeeGFS文件系统自动化异常测试方法及装置
US20080209259A1 (en) Method and system for testing reliability of data stored in raid
TWI759926B (zh) 開機測試系統及開機測試方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080907

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4189854

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130926

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term