JP5216910B2 - 冗長状態検証装置 - Google Patents

冗長状態検証装置 Download PDF

Info

Publication number
JP5216910B2
JP5216910B2 JP2011286502A JP2011286502A JP5216910B2 JP 5216910 B2 JP5216910 B2 JP 5216910B2 JP 2011286502 A JP2011286502 A JP 2011286502A JP 2011286502 A JP2011286502 A JP 2011286502A JP 5216910 B2 JP5216910 B2 JP 5216910B2
Authority
JP
Japan
Prior art keywords
redundant
state
computer
state information
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011286502A
Other languages
English (en)
Other versions
JP2012064248A (ja
Inventor
祐次 宮部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MUFG Bank Ltd
Original Assignee
Bank of Tokyo Mitsubishi UFJ Trust Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of Tokyo Mitsubishi UFJ Trust Co filed Critical Bank of Tokyo Mitsubishi UFJ Trust Co
Priority to JP2011286502A priority Critical patent/JP5216910B2/ja
Publication of JP2012064248A publication Critical patent/JP2012064248A/ja
Application granted granted Critical
Publication of JP5216910B2 publication Critical patent/JP5216910B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は冗長状態検証装置及びプログラムに係り、特に、冗長化された部分を有するコンピュータ・システムの状態を検証する冗長状態検証装置、及び、コンピュータを前記冗長状態検証装置として機能させるための冗長状態検証プログラムに関する。
コンピュータ・システムの耐障害性の向上にはシステム構成の冗長化が有効であり、安定稼働に対する要求水準の高いコンピュータ・システムでは、現用系が障害の発生により稼働を停止すると稼働状態へ切り替わる待機系が追加されたシステム構成が採用されることが一般的である。しかし、冗長化されたコンピュータ・システムであっても、例えばシステム環境を変更した等の場合に、システム環境の変更が予期せぬ影響を及ぼすことで、現用系が稼働を停止しても待機系が稼働状態へ切り替わらない等のように、冗長化が有効に機能しない状態に陥ることが生じ得る。そして、冗長化が有効に機能しない状態は、通常時は待機系が稼働していないために管理者が気付かないことも多く、この状態が見過ごされた場合、現用系が稼働を停止しても待機系が稼働状態へ切り替わらずに両系共に稼働停止状態となることで、大規模なシステム障害が引き起されるという問題があった。
上記に関連して特許文献1には、システム構成を検証する要求を受け取ると、システム構成の問題を識別するための1つ以上の規則を規則データを取得すると共に、システム構成に関する情報を含むシステム構成データを取得し、システム構成データを規則データに照らして検証し、システムのための全ての構成問題を識別する検証の結果を生成する技術が開示されている。
また特許文献2には、コンピュータ・システムを構築する際に用いるシステム構成情報を記したパラメータシートと、オペレーティング・システムの情報であるシステム構成情報と、の対応箇所を比較し、比較結果を一覧表で色分けした比較レポートを出力する技術が開示されている。
特開2003−330720号公報 特開2007−241533号公報
特許文献1に記載の技術は、規則データに基づいてシステム構成を検証する技術であるが、特許文献1には、冗長化された部分を有するコンピュータ・システムに対するシステム構成の検証について何ら記載されておらず、冗長化された部分のうち現用系は正常に稼働しているものの、待機系が稼働状態へ切り替わらない状態(冗長化が有効に機能しない状態)となっている可能性があるコンピュータ・システムに対し、冗長化が有効に機能しない状態をシステム構成の問題として識別することや、その識別のために必要な規則データの内容等については示唆すら見当たらない。
また、特許文献2に記載の技術は、コンピュータ・システムを構築する際に用いたシステム構成情報(を記したパラメータシート)と、構築したコンピュータシステムから取得したシステム構成情報とを比較することで、システムの構築が当初の予定通りに行われたか否かを確認するものであり、この特許文献2にも、冗長化された部分を有するコンピュータ・システムに適用することや、当該コンピュータ・システムが冗長化が有効に機能する状態か否かを確認するための構成について何ら記載されていない。
本発明は上記事実を考慮して成されたもので、冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる冗長状態検証装置及び冗長状態検証プログラムを得ることが目的である。
本願発明者は、冗長化された部分を有するコンピュータ・システムが、仮に冗長化が有効に機能しない状態であった場合に、現用系に障害が発生した際に冗長化が有効に機能しない状態であることが及ぼす影響の大きさ(システム障害の重大さ)を検証する作業を行った。その結果、冗長化が有効に機能しない状態であることが障害発生時に及ぼす影響の大きさは、冗長化が有効に機能しない状態がシステムの何れの部分に生じているかに応じて大きく相違することが明らかになった。そして、記憶装置を含むコンピュータ・システムにおける特に重大なシステム障害はコンピュータと記憶装置との通信が途絶するシステム障害であり、冗長化が有効に機能しない状態となっていることで障害発生時に上記のシステム障害を引き起される場合は、記憶装置のコントローラと記憶媒体本体との接続が冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合、及び、前記システムのコンピュータと記憶装置の記憶媒体本体との間のパスが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合であることが明らかになった。
上記に基づき第1の発明に係る冗長状態検証装置は、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段と、前記取得手段によって取得された前記状態情報を記憶する記憶手段と、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、を含んで構成されている。
第1の発明では、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報が取得手段によって取得され、取得手段によって取得された状態情報は記憶手段に記憶される。取得手段によって取得される状態情報は、検証対象のコンピュータ・システムの冗長化された部分の現在の状態を表す情報であり、判定手段は、取得手段によって取得された状態情報を、取得手段によって過去に取得されて記憶手段に記憶された状態情報と比較することで、検証対象のコンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態(現用系に障害が発生して稼働を停止した場合に、待機系が稼働状態へ切り替わる状態)を維持しているか否か判定する。
これにより、判定手段による判定では、取得手段によって取得された第1状態情報に基づき、記憶装置のコントローラと記憶装置の記憶媒体本体との接続の冗長化が有効に機能する状態を維持しているか否かが判定されると共に、取得手段によって取得された第2状態情報に基づき、検証対象のコンピュータ・システムのコンピュータと記憶装置の記憶媒体本体との間のパスの冗長化が有効に機能する状態を維持しているか否かも判定されることになる。従って、第1の発明によれば、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
なお、第1の発明において、検証対象のコンピュータ・システムが、コントローラと記憶媒体本体との接続の冗長化として、記憶装置に冗長化された複数のコントローラが設けられ、個々のコントーラに複数の媒体側アダプタが各々設けられ、複数のコントローラの各々毎に、個々の媒体側アダプタが、冗長化された複数の共有メモリのうちの互いに異なる共有メモリを経由して記憶媒体本体と接続された構成である場合、取得手段は、例えば第2の発明のように、コントローラに対し、複数のコントローラの各々と記憶装置の記憶媒体本体との間の接続経路を個々の媒体側アダプタ毎に表す情報を要求するコマンドを送信することで、コントローラから前記情報を第1状態情報として取得するように構成することができる。
また、第1の発明において、検証対象のコンピュータ・システムが、検証対象のコンピュータ・システムのコンピュータと記憶装置の記憶媒体本体との間のパスの冗長化として、コンピュータに冗長化された複数のホストアダプタが設けられ、記憶装置のコントローラに、複数のホストアダプタの何れかと接続される冗長化された複数のホスト側アダプタと、複数のホスト側アダプタの何れかと接続されると共に記憶装置の記憶媒体本体と接続され冗長化された複数の媒体側アダプタと、が各々設けられ、コンピュータ上で動作する所定のプログラムが、検証対象のコンピュータ・システムの個々のホストアダプタから記憶装置の記憶媒体本体に至る個々のパス毎に経路及び稼働状態を管理する構成である場合、取得手段は、例えば第3の発明のように、所定のプログラムに対し、検証対象のコンピュータ・システムの個々のホストアダプタから記憶装置の記憶媒体本体に至る個々のパス毎の経路及び稼働状態を表す情報を要求するコマンドを送信することで、コントローラから前記情報を第2状態情報として取得するように構成することができる。
また、本願発明者による前述の検証作業の結果、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含むコンピュータ・システムにおいて、特に重大なシステム障害はコンピュータとネットワークとの通信が途絶するシステム障害であり、冗長化が有効に機能しない状態となっていることで障害発生時に上記のシステム障害を引き起される場合は、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合であることが明らかになった。
上記に基づき第4の発明に係る冗長状態検証装置は、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段と、前記取得手段によって取得された前記状態情報を記憶する記憶手段と、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、を含んで構成されている。
第4の発明では、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報が取得手段によって取得され、取得手段によって取得された状態情報は記憶手段に記憶される。取得手段によって取得される状態情報は、検証対象のコンピュータ・システムの冗長化された部分の現在の状態を表す情報であり、判定手段は、取得手段によって取得された状態情報を、取得手段によって過去に取得されて記憶手段に記憶された状態情報と比較することで、検証対象のコンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態(現用系に障害が発生して稼働を停止した場合に、待機系が稼働状態へ切り替わる状態)を維持しているか否か判定する。
これにより、判定手段による判定では、取得手段によって取得された第3状態情報に基づき、ネットワーク接続デバイスへのIPアドレスの割り当ての冗長化が有効に機能する状態を維持しているか否かが判定されると共に、取得手段によって取得された第4状態情報に基づき、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当ての冗長化が有効に機能する状態を維持しているか否かも判定されることになる。従って、第4の発明によれば、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
なお、第4の発明において、検証対象のコンピュータ・システムが、ネットワーク接続デバイスへのIPアドレスの割り当ての冗長化として、ネットワーク接続デバイスが複数設けられていると共に、複数のネットワーク接続デバイスの各々にIPアドレスが割り当てされる構成である場合、取得手段は、例えば第5の発明のように、オペレーティング・システムに対し、複数のネットワーク接続デバイスの各々に割り当てられているIPアドレスを表す情報を要求するコマンドを送信することで、オペレーティング・システムから前記情報を第3状態情報として取得するように構成することができる。
また、第4の発明において、検証対象のコンピュータ・システムが、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当ての冗長化として、ネットワーク接続デバイスが複数設けられ、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスが互いに異なるネットワークアダプタに割り当てされる構成である場合、取得手段は、例えば第6の発明のように、オペレーティング・システムに対し、複数のネットワーク接続デバイスの各々が何れのネットワークアダプタに割り当てられているかを表す情報を要求するコマンドを送信することで、オペレーティング・システムから前記情報を第4状態情報として取得するように構成することができる。
また、第1又は第4の発明において、検証対象のコンピュータ・システムが、クラスタを構成するコンピュータの冗長化として、単一のクラスタが複数台のコンピュータで構成された構成である場合、取得手段は、例えば第7の発明のように、オペレーティング・システムに対し、検証対象のコンピュータ・システムの単一のクラスタを構成するコンピュータの台数及びそれぞれの稼働状態を表す情報を要求するコマンドを送信することで、オペレーティング・システムから、前記情報を、検証対象のコンピュータ・システムの単一のクラスタが複数台のコンピュータで構成されている状態か否かを表す第5状態情報として取得するように構成することが好ましい。
本願発明者による前述の検証作業によれば、単一のクラスタが複数台のコンピュータで構成されることで冗長化されたコンピュータ・システムにおいて、前記冗長化が有効に機能しない状態となっていた場合にも、現用系のコンピュータに障害が発生して稼働を停止すると、前記クラスタ自体が稼働停止状態となることで、大規模なシステム障害が引き起されることが判明している。これに対して第7の発明では、取得手段によって取得された第5状態情報に基づき、単一のクラスタを構成するコンピュータの冗長化が有効に機能する状態を維持しているか否かも判定手段によって判定されることになるので、
単一のクラスタを複数台のコンピュータで構成する冗長化がされたコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
また、第1又は第4の発明において、検証対象のコンピュータ・システムが記憶装置を含んで構成され、検証対象のコンピュータ・システムのコンピュータと記憶装置との接続の冗長化として、コンピュータに冗長化された複数のホストアダプタが設けられ、複数のホストアダプタのうち対を成すホストアダプタが、記憶装置に設けられ冗長化された複数のコントローラのうちの異なるコントローラに接続された構成である場合、取得手段は、例えば第8の発明のように、コントローラに対し、複数のホストアダプタの各々が、複数のコントローラの何れに接続されているかを表す情報を要求するコマンドを送信することで、前記情報を、複数のホストアダプタのうち対を成すホストアダプタが複数のコントローラのうちの異なるコントローラに接続されている状態か否かを表す第6状態情報として取得するように構成することが好ましい。
本願発明者による前述の検証作業によれば、記憶装置を含んで構成されコンピュータと記憶装置との接続が冗長化された構成、すなわち、コンピュータに冗長化された複数のホストアダプタが設けられ、複数のホストアダプタのうち対を成すホストアダプタが、記憶装置に設けられ冗長化された複数のコントローラのうちの異なるコントローラに接続された構成のコンピュータ・システムにおいて、前記冗長化が有効に機能しない状態となっていた場合にも、現用系の接続に障害が発生すると、コンピュータと記憶装置との通信が途絶する大規模なシステム障害が引き起されることが明らかになっている。これに対して第8の発明では、取得手段によって取得された第6状態情報に基づき、コンピュータと記憶装置との接続の冗長化が有効に機能する状態を維持しているか否かも判定手段によって判定されることになるので、コンピュータと記憶装置との接続が冗長化がされたコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
また、第1〜第8の何れかの発明において、例えば第9の発明に記載したように、判定手段により、検証対象のコンピュータの冗長化された部分が、冗長化が有効に機能する状態を維持していないと判定された場合に、取得手段によって取得された状態情報が表す冗長化部分の現在の状態を通知する情報を出力する出力手段を更に設けることが好ましい。これにより、管理者等の利用者は、検証対象のコンピュータのうち冗長化が有効に機能する状態を維持していないと判定された部分が現在はどのような状態かを容易に把握することができ、冗長化が有効に機能する状態へ回復させるための対策を容易に講ずることができる。
第10の発明に係る冗長状態検証プログラムは、記憶装置を含む検証対象のコンピュータ・システムを構成するか又は前記検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、前記検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段、及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段として機能させる。
第10の発明に係る冗長状態検証プログラムは、記憶装置を含む検証対象のコンピュータ・システムを構成するか又は検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、上記の取得手段及び判定手段として機能させるためのプログラムであるので、上記のコンピュータが第10の発明に係る冗長状態検証プログラムを実行することで、上記のコンピュータが第1の発明の冗長状態検証装置として機能することになり、第1の発明と同様に、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
第11の発明に係る冗長状態検証プログラムは、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムを構成するか又は前記検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、前記検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段、及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段として機能させる。
第11の発明に係る冗長状態検証プログラムは、複数のネットワークアダプタポートを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムを構成するか又は検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、上記の取得手段及び判定手段として機能させるためのプログラムであるので、上記のコンピュータが第11の発明に係る冗長状態検証プログラムを実行することで、上記のコンピュータが第4の発明の冗長状態検証装置として機能することになり、第4の発明と同様に、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
以上説明したように本発明は、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、記憶装置のコントローラと記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、コンピュータと記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得し、取得した状態情報を過去に取得した状態情報と比較することで、コンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態を維持しているか否か判定するので、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる、という優れた効果を有する。
また本発明は、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得し、取得した状態情報を過去に取得した状態情報と比較することで、コンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態を維持しているか否か判定するので、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる、という優れた効果を有する。
本実施形態に係るコンピュータ・システムの概略構成を示すブロック図である。 検証対象のコンピュータ・システムとしてのウェブサービス提供システムの概略構成を示すブロック図である。 冗長化構成検証処理の内容を示すフローチャートである。 端末装置のディスプレイに表示される画面の一例を示すイメージ図である。
以下、図面を参照して本発明の実施形態の一例を詳細に説明する。図1には本実施形態に係るコンピュータ・システム10が示されている。コンピュータ・システム10は、検証対象のコンピュータ・システムとしてのウェブサービス提供システム12を備え、このウェブサービス提供システム12がイントラネットから成るネットワーク14を介し、管理装置として使用される端末装置16に接続されて構成されている。
端末装置16はPC(Personal Computer)等から成り、CPU16A、ROMやRAM等を含むメモリ16C、HDD(Hard Disk Drive)やフラッシュメモリ等から成る不揮発性の記憶部16C、通信I/F(インタフェース)部16Dを備え、通信I/F部16Dがネットワーク14に接続されている。記憶部16CにはOS(Operating System)のプログラム(図示省略)やブラウザ(ウェブ閲覧ソフト)のプログラムが各々イントールされている。また端末装置16には、LCD等から成るディスプレイ18、マウス20及びキーボード22が各々接続されている。
一方、ウェブサービス提供システム12は、ネットワーク(このネットワークはネットワーク14でもよいし、インターネット等の他のネットワークであってもよい)経由で利用者に所定のウェブサービスを提供するコンピュータ・システムであり、2台のDB(DataBase)サーバ26,28と、2台のAP(APplication)サーバ30,32と、を含んで構成されている。個々のサーバ26〜32はCPU34、ROMやRAM等を含むメモリ36、不揮発性の記憶部38、通信I/F部40を備え、通信I/F部40がネットワーク14に接続され、記憶部38にはOS(Operating System)のプログラム(図示省略)や冗長化構成検証プログラム、パス管理ソフトのプログラムが各々イントールされている。冗長化構成検証プログラム及びパス管理ソフトのプログラムは、各サーバ26〜32の起動時に記憶部38から読み出されてメモリ36に各々記憶され、パス管理ソフトのプログラムはCPU34によって常時実行され、冗長化構成検証プログラムは必要時(端末装置16からの指示時:詳細は後述)にCPU34によって実行される。なお、パス管理ソフトのプログラムは第3の発明の所定のプログラムの一例である。
なお、冗長化構成検証プログラムは本発明に係る冗長状態検証プログラムの一例であり、各サーバ26〜32はCPU34によって冗長化構成検証プログラムが実行されることで、本発明に係る冗長状態検証装置として機能する。また、詳細は後述するが、各サーバ26〜32の記憶部38は、実際には後述するディスク装置56(の論理ディスク)によって構成され、各サーバ26〜32の通信I/F部40は実際には後述するネットワークアダプタ52A,52B及びネットワーク接続デバイス54A,54Bによって構成される。
ウェブサービス提供システム12は、安定稼働に対する要求水準の高いコンピュータ・システムであり、各部分が冗長化されている。すなわち、ウェブサービス提供システム12では、DBサーバが冗長化され、DBサーバ26,28が単一のクラスタを構成しており、DBサーバ26は通常時に稼働する現用系、 DBサーバ28は障害の発生によりDBサーバ26が稼働を停止した場合に稼働が開始される待機系とされている。また、APサーバも冗長化され、APサーバ30,32が単一のクラスタを構成しており、APサーバ30は通常時に稼働する現用系、APサーバ32は障害の発生によりAPサーバ30が稼働を停止した場合に稼働が開始される待機系とされている。
一方、図2に示すように、DBサーバ26及びAPサーバ30はサーバシャーシ42に搭載され、DBサーバ28及びAPサーバ32はサーバシャーシ44に搭載されており、DBサーバ26及びAPサーバ30には、サーバシャーシ42に搭載された電源部(図示省略)から電力が供給され、DBサーバ28及びAPサーバ32には、サーバシャーシ44に搭載された電源部(図示省略)から電力が供給される。
また、サーバシャーシ42には2個のIOAモジュール46,48が搭載されている。IOAモジュール46,48には、DBサーバ26を光ファイバ経由でディスク装置56と接続するためのHBA(Host Bus Adapter)50Aと、APサーバ30を光ファイバ経由でディスク装置56と接続するためのHBA50Bと、DBサーバ26をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Aと、APサーバ30をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Bと、が各々設けられており、DBサーバ26及びAPサーバ30はIOAモジュール46,48に各々接続されている。また、個々のネットワークアダプタ52A,52Bには、各々2個のネットワーク接続デバイス(ネットワーク接続ボード)54A,54Bが取付けられている。なお、HBA50A,50Bは第3,8の発明のホストアダプタの一例である。
また、サーバシャーシ44には2個のIOAモジュール56,58が搭載されている。IOAモジュール56,58には、DBサーバ28を光ファイバ経由でディスク装置56と接続するためのHBA50Aと、APサーバ32を光ファイバ経由でディスク装置56と接続するためのHBA50Bと、DBサーバ28をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Aと、APサーバ32をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Bと、が各々設けられており、DBサーバ28及びAPサーバ32はIOAモジュール56,58に各々接続されている。また、個々のネットワークアダプタ52A,52Bには、各々2個のネットワーク接続デバイス(ネットワーク接続ボード)54A,54Bが取付けられている。
本実施形態に係るウェブサービス提供システム12では、ネットワーク接続デバイス54A,54BへのIPアドレスの割り当ての冗長化として、IOAモジュール46,48,56,58に設けられた全てのネットワーク接続デバイス54A,54BにIPアドレスが割り当てされる。
また、本実施形態では、各サーバ26〜32とネットワーク14との接続の冗長化として、サーバ1台当りネットワーク接続デバイス54が合計4個設けられ、2個1組のネットワーク接続デバイス54により、一方のネットワーク接続デバイス54を現用系、他方のネットワーク接続デバイス54を待機系とする単一の仮想的なネットワーク接続デバイスが構成され(ボンディング(bonding)という)、2個1組のネットワーク接続デバイス54から成る仮想的なネットワーク接続デバイスがサーバ1台当り2組設けられており、更に、単一の仮想的なネットワーク接続デバイスを構成する2個のネットワーク接続デバイス54として、異なるネットワークアダプタ52に取付けられたネットワーク接続デバイス54を用いている。
例えばDBサーバ28については、IOAモジュール46のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Aと、IOAモジュール48のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Aと、によって単一の仮想的なネットワーク接続デバイスが構成されると共に、IOAモジュール46のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Bと、IOAモジュール48のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Bと、によって単一の仮想的なネットワーク接続デバイスが構成されている。
一方、ディスク装置56は、ディスク駆動装置(DKU)58によって駆動される多数台のディスクドライブを備えている。多数台のディスクドライブは、各々冗長化された複数の論理ディスクを形成するように互いに接続されている。また、ディスク装置56にはディスク制御装置(DKC)60が設けられている。ディスク制御装置(DKC)60には冗長化された2個のクラスタ62A,62Bが設けられており、クラスタ62A,62Bの一方が現用系、他方が待機系とされている。個々のクラスタ62A,62Bには、各々複数個のチャネル・アダプタ(CHA)64が設けられたチャネル・アダプタ群66,68と、複数個のディスク・アダプタ(DKA)70が設けられたディスク・アダプタ群72と、チャネル・アダプタ群66,68の個々のチャネル・アダプタ(CHA)64とディスク・アダプタ群72の個々のディスク・アダプタ(DKA)70を接続するキャッシュ・スイッチ(CSW)74が各々設けられている。また、ディスク装置56には冗長化された一対の共有メモリ76A,76Bが設けられている。
ディスクドライブの個々の論理ディスクはクラスタ62A,62Bの何れか1つのディスク・アダプタ(DKA)70に各々接続されているが、本実施形態ではディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化として、個々の論理ディスクは、クラスタ62Aの何れか1つのディスク・アダプタ(DKA)70と共有メモリ76Aを経由して接続されている一方、クラスタ62Bの何れか1つのディスク・アダプタ(DKA)70とは共有メモリ76Bを経由して接続されている。
また、個々のHBA50A,50Bは光ファイバケーブル78を介して何れかのチャネル・アダプタ(CHA)64と接続されているが、本実施形態では各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化として、単一のサーバをディスク装置56と接続するHBA50が冗長化されて2個設けられており(一方が現用系で他方が待機系)、当該2個のHBA50は互いに異なるクラスタ62のチャネル・アダプタ(CHA)64と接続されている。例えば、DBサーバ26をディスク装置56と接続する2個のHBA50Aのうち、IOAモジュール46に設けられたHBA50Aはクラスタ62Aのチャネル・アダプタ(CHA)64と接続されている一方、IOAモジュール48に設けられたHBA50Aはクラスタ62Bのチャネル・アダプタ(CHA)64と接続されている。
なお、ディスク制御装置(DKC)60は第1〜3,8の発明のコントローラの一例であり、クラスタ62A,62Bは第2,8の発明の複数のコントローラの一例であり、ディスク・アダプタ(DKA)70は第2,3の発明の媒体側アダプタの一例であり、チャネル・アダプタ(CHA)64は第3の発明のホスト側アダプタの一例である。
次に本実施形態の作用を説明として、ウェブサービス提供システム12を含むコンピュータ・システム10の管理者が、端末装置16からウェブサービス提供システム12の各サーバ26〜32に対して冗長化構成の検証を各々指示したことを契機として、各サーバ26〜32のCPU34で冗長化構成検証プログラムが実行されることによって実現される冗長化構成検証処理について、図3を参照して説明する。
なお、管理者はウェブサービス提供システム12の構築が完了してウェブサービス提供システム12の稼働が開始される際に、マスタとして用いる状態情報の取得(後述)を目的として冗長化構成の検証を一度指示し、その後、例えばウェブサービス提供システム12を構成する一部のハードウェアの交換や一部の設定の変更、各サーバ26〜32にインストールされているプログラムのバージョンアップ等のように、ウェブサービス提供システム12の環境や一部構成が変更される度に、ウェブサービス提供システム12の冗長化部分が冗長化が有効に機能する状態を維持しているか否かを確認することを目的として、冗長化構成の検証を指示する。そして、各サーバ26〜32では、冗長化構成の検証が指示される都度、以下で説明する冗長化構成検証処理が行われる。
冗長化構成検証処理では、まずステップ100において、冗長化構成検証処理を前回実行した際に取得した状態情報を記憶部38の所定領域から削除する。なお、冗長化構成検証処理を最初に実行する際には、記憶部38の所定領域に状態情報が記憶されていないので、上記のステップ100の実行は省略される。次のステップ102では、自サーバ上で稼働しているOSに対し、自サーバが属するクラスタを構成しているサーバの台数及び稼働状態(例えば「稼働中」/「待機中」/「停止中」の何れか)を表す情報を要求する所定のコマンドを送信する。
OSは自サーバが属するクラスタを構成しているサーバの台数及び識別情報を表す情報を保持しており、前記コマンドを受信すると自サーバが属するクラスタを構成しているサーバの台数及び識別情報を表す情報を読み出し、自サーバと同一のクラスタを構成している他のサーバの稼働状態については、読み出した情報に含まれる前記他のサーバの識別情報に基づき前記他のサーバ上で稼働しているOSに対して稼働状態を問い合わせ、例えば応答が無ければ前記他のサーバの稼働状態を「停止中」と判断し、応答を受信した場合は当該応答により通知された稼働状態に従って前記他のサーバの稼働状態を「稼働中」又は「待機中」と判断する。そしてOSは、判断した他のサーバの稼働状態を含む、自サーバが属するクラスタを構成しているサーバの台数及び稼働状態を表す情報を、冗長化構成検証プログラムへ引き渡す処理を行う。
冗長化構成検証処理では、上記情報がOSから引き渡されるとステップ104へ移行し、まず、引き渡された情報の中に実行の都度内容が相違する情報(例えば現在の日付や時刻等)が含まれているか否かを探索し、該当する情報が含まれていれば該当する情報を削除した後に、引き渡された情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は第7の発明の第5状態情報の一例であり、ステップ102,104は第7の発明の取得手段による処理の一例である。
次のステップ106では、ディスク装置56のディスク制御装置(DKC)60に対し、自サーバに対応する2個のHBA50が光ファイバケーブル78を介して接続されているクラスタ62がクラスタ62A,62Bの何れであるかを表す情報を要求する所定のコマンドを送信する。ディスク制御装置(DKC)60は、クラスタ62A,62Bに設けられた個々のチャネル・アダプタ(CHA)64が何れのHBA50と接続されているかを表す情報を保持・管理しており、上記コマンドを受信すると、コマンド送信元のサーバに対応する2個のHBA50が何れのクラスタ62の何れのチャネル・アダプタ(CHA)64と接続されているかを表す情報を前記情報から抽出し、抽出した情報をコマンド送信元のサーバへ送信する。
冗長化構成検証処理では、上記情報をディスク制御装置(DKC)60から受信するとステップ108へ移行し、受信した情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば該当する情報を削除した後に、受信した情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は第8の発明の第6状態情報の一例であり、ステップ106,108は第8の発明の取得手段による処理の一例である。
続いてステップ110では、ディスク装置56のディスク制御装置(DKC)60に対し、クラスタ62A,62Bとディスク装置56の論理ディスクとの接続経路を、クラスタ62A,62Bに設けられた個々のディスク・アダプタ(DKA)70毎に表す情報を要求する所定のコマンドを送信する。ディスク制御装置(DKC)60は、クラスタ62A,62Bとディスク装置56の論理ディスクとが共有メモリ76A,76Bの何れを経由して接続されているかを、クラスタ62A,62Bに設けられた個々のディスク・アダプタ(DKA)70毎に表す情報を保持・管理しており、上記コマンドを受信すると上記情報をコマンド送信元のサーバへ送信する。
冗長化構成検証処理では、上記情報をディスク制御装置(DKC)60から受信するとステップ112へ移行し、受信した情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば削除した後に、受信した情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は第1,2の発明の第1状態情報の一例であり、ステップ110,112は第1,2の発明の取得手段による処理の一例である。
次のステップ114では、自サーバ上で稼働しているパス管理ソフトに対し、自サーバに対応する2個のHBA50からディスク装置56の論理ディスクに至る2本のパスについて、その経路及び稼働状態を管理する管理情報を要求する所定のコマンドを送信する。パス管理ソフトは、自サーバに対応する2個のHBA50からディスク装置56の論理ディスクに至る2本のパスについて、その経路(HBA50とチャネル・アダプタ(CHA)64の間、及び、ディスク・アダプタ(DKA)70と論理ディスクの間の各経路が重複していないか否か)及び稼働状態(例えば「稼働中」/「待機中」/「停止中」の何れか)を表す管理情報を保持・管理しており、上記コマンドを受信すると上記の管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。
冗長化構成検証処理では、上記の管理情報がパス管理ソフトから引き渡されるとステップ116へ移行し、引き渡された管理情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば削除した後に、引き渡された管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は第1,3の発明の第2状態情報の一例であり、ステップ114,116は第1,3の発明の取得手段による処理の一例である。
続いてステップ118では、自サーバ上で稼働しているOSに対し、自サーバに対応する4個のネットワーク接続デバイス54に割り当てられているIPアドレスの通知を要求するコマンドを送信する。OSは自サーバに対応する全てのネットワーク接続デバイス54の各々に割り当てられているIPアドレスをIPアドレス管理情報として保持・管理しており、上記コマンドを受信すると、上記のIPアドレス管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。
冗長化構成検証処理では、上記のIPアドレス管理情報がOSから引き渡されるとステップ120へ移行し、引き渡されたIPアドレス管理情報の中に実行の都度内容が相違する情報が含まれていれば当該情報を削除した後に、引き渡されたIPアドレス管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は第4,5の発明の第3状態情報の一例であり、ステップ118,120は第4,5の発明の取得手段による処理の一例である。
次のステップ122では、自サーバ上で稼働しているOSに対し、自サーバに対応する4個のネットワーク接続デバイス54が、各々何れのネットワークアダプタ52に割り当てられているかを表す情報を要求するコマンドを送信する。OSは自サーバに対応する全てのネットワーク接続デバイス54の各々が割り当てられているネットワークアダプタ52を表す割当管理情報を保持・管理しており、上記コマンドを受信すると、上記の割当管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。
冗長化構成検証処理では、上記の割当管理情報がOSから引き渡されるとステップ124へ移行し、引き渡された割当管理情報の中に実行の都度内容が相違する情報が含まれていれば当該情報を削除した後に、引き渡された割当管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は第4,6の発明の第4状態情報の一例であり、ステップ118,120は第4,6の発明の取得手段による処理の一例である。
次のステップ126では、ウェブサービス提供システム12における冗長化された他の部分の状態を表す状態情報を、前記他の部分の状態を管理する管理部(例えばOSやディスク制御装置(DKC)60、パス管理ソフト等のプログラム)に要求し、前記管理部から状態情報を受信してメモリ36に記憶させる処理を行う。なお、このステップ126で取得される状態情報の一例については後述する。
次のステップ128では、今回の冗長化構成検証処理の実行が初回の実行(ウェブサービス提供システム12の稼働が開始される際の実行)か否か判定する。この判定は、記憶部38のうち状態情報のマスタを記憶するための所定の記憶領域に状態情報が記憶されているか否かを判定することで行うことができる。この判定が肯定された場合はステップ130へ移行し、ステップ102〜ステップ126でメモリ36に記憶させた状態情報(今回の処理で取得した状態情報)を、状態情報のマスタとして記憶部38の前記所定の記憶領域に記憶させ、冗長化構成検証処理を終了する。
一方、ステップ128の判定が否定された場合はステップ132へ移行し、ステップ102〜ステップ126でメモリ36に記憶させた状態情報(今回の処理で取得した状態情報)を、その種別毎に、記憶部38の前記所定の記憶領域に記憶されている状態情報のマスタと比較し、マスタと不一致の状態情報があれば、その種別及び内容を抽出する。次のステップ134では管理者から指示された状態情報の出力対象を判定し、判定結果に応じてステップ136又はステップ138へ分岐する。
本実施形態において、状態情報の出力対象としては、今回の状態情報とマスタとの「比較結果」と状態情報の「全内容」を選択可能とされており、管理者が端末装置16を介し出力対象として「比較結果」を選択した場合には、ステップ134からステップ136へ移行し、例として図4(A)に示すように、状態情報の各項目毎に、今回の状態情報とマスタとの比較結果が一致していれば「○」を、不一致であれば「×」を表示すると共に、マスタと不一致の項目についてはその内容も表示した比較結果表示画面を生成し、生成した比較結果表示画面のデータを端末装置16へ送信することで、図4(A)に示すような比較結果表示画面を端末装置16のディスプレイ18に表示させる。
先に説明したように、ウェブサービス提供システム12では、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化として、個々の論理ディスクが、クラスタ62Aの何れか1つのディスク・アダプタ(DKA)70と共有メモリ76Aを経由して接続されている一方、クラスタ62Bの何れか1つのディスク・アダプタ(DKA)70とは共有メモリ76Bを経由して接続されているが、例えば論理ディスク又は共有メモリ76又はディスク・アダプタ(DKA)70(或いはクラスタ62)を交換した等の場合、交換後の接続復旧作業のミス等により、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能しない状態に陥る可能性がある。
これに対して本実施形態では、上記の状態に陥ると、先のステップ112で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。
また、ウェブサービス提供システム12では、サーバ26〜32の各々からディスク装置56の論理ディスクに至るパスの冗長化として、各サーバ毎に2個のHBA50が設けられ、2個のHBA50からディスク装置56の論理ディスクに至る2本のパスが設けられているが、例えば一方のパスの経路上に存在する機器で障害が発生した等の場合、2本のパスの経路の一部が重複していたり、一方のパスの状態が「停止中」になっていたり等のように、サーバ26〜32の各々からディスク装置56の論理ディスクに至るパスの冗長化が有効に機能しない状態に陥る可能性がある。
これに対して本実施形態では、上記の状態に陥ると、先のステップ116で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバからディスク装置56の論理ディスクに至るパスの冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかからディスク装置56の論理ディスクに至るパスの冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。
また、ウェブサービス提供システム12では、ネットワーク接続デバイス54へのIPアドレスの割り当ての冗長化として、各サーバ毎に4個設けられているネットワーク接続デバイス54の全てにIPアドレスを割り当てている(但し、単一の仮想的なネットワーク接続デバイスを構成する2個1組のネットワーク接続デバイス54には同一のIPアドレスが割り当てされる)が、例えば故障等により何れかのネットワーク接続デバイス54を交換した等の場合、交換後のネットワーク接続デバイス54に対してIPアドレスの割り当てが行われない等により、ネットワーク接続デバイス54へのIPアドレスの割り当ての冗長化が有効に機能しない状態(無効状態)に陥る可能性がある。
これに対して本実施形態では、上記の状態に陥ると、先のステップ120で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、IPアドレス未割り当てのネットワーク接続デバイス54に対してIPアドレスを割り当てさせる作業が行われることで、障害の発生時に、IPアドレス未割り当てのネットワーク接続デバイス54が存在していたことで、重大なシステム障害へ発展することが未然に防止される。
また、ウェブサービス提供システム12では、各サーバ26〜32とネットワーク14との接続の冗長化として、互いに異なるネットワークアダプタ52に取付けられた2個1組のネットワーク接続デバイス54により単一の仮想的なネットワーク接続デバイスを構成しているが、例えばネットワーク接続デバイス54又はネットワークアダプタ52を交換した等の場合、交換後の接続復旧作業のミス等により、各サーバ26〜32とネットワーク14との接続の冗長化が有効に機能しない状態に陥る可能性がある。
これに対して本実施形態では、上記の状態に陥ると、先のステップ124で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバとネットワーク14との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかとネットワーク14との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することも未然に防止される。
更に、ウェブサービス提供システム12では、単一のクラスタを構成するサーバが冗長化され、DBサーバ26,28によって単一のクラスタが構成され、APサーバ30,32によって単一のクラスタが構成されているが、例えば待機系のサーバのハードウェアに故障が発生した等の場合、当該サーバの稼働状態が「待機中」から「停止中」へ変化することで、単一のクラスタを構成するサーバの冗長化が有効に機能しない状態に陥る可能性がある。
これに対して本実施形態では、上記の状態に陥ると、先のステップ104で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、例えば故障したハードゥエアの交換する等により、稼働状態が「停止中」のサーバを「待機中」へ復旧させる作業が行われることで、障害の発生時に、単一のクラスタを構成するサーバの冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。
また、ウェブサービス提供システム12では、各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化として、単一のサーバをディスク装置56と接続する2個のHBA50が互いに異なるクラスタ62のチャネル・アダプタ(CHA)64と接続されているが、例えばHBA50又はチャネル・アダプタ(CHA)64(或いはクラスタ62)を交換した等の場合、交換後の接続復旧作業のミス等により、各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能しない状態に陥る可能性がある。
これに対して本実施形態では、上記の状態に陥ると、先のステップ108で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバとディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかとディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することも未然に防止される。
一方、管理者が状態情報の全内容の確認を所望している場合は、管理者により端末装置16を介し出力対象として状態情報の「全内容」が選択される。この場合はステップ134からステップ138へ移行し、例として図4(B)に示すように、状態情報の各項目毎に、マスタ及び今回の状態情報の内容を各々表示した内容表示画面を生成し、生成した内容表示画面のデータを端末装置16へ送信することで、図4(B)に示すような内容表示画面を端末装置16のディスプレイ18に表示させる。なお、ステップ134〜ステップ138は第9の発明の出力手段による処理の一例である。また、管理者による状態情報の比較結果又は全内容の確認が終了するとステップ140へ移行し、状態情報のマスタの更新が管理者から指示されたか否か判定する。通常はこの判定は否定され、冗長化構成検証処理を終了する。
ところで、今回の状態情報がマスタと不一致になる原因としては、先に説明したように、接続復旧作業のミス等により、ウェブサービス提供システム12の何れかの部分の冗長化が有効に機能しない状態に陥った場合以外に、例えばウェブサービス提供システム12の仕様変更に伴い意図的に構成を変更した等の場合も考えられる。この場合、ウェブサービス提供システム12は以後、変更後の構成で運用されるので、管理者は状態情報のマスタの更新を指示する。この場合はステップ140の判定が肯定されてステップ142へ移行し、記憶部38の所定の記憶領域に記憶されている状態情報のマスタに上書きして今回の状態情報を記憶させ、冗長化構成検証処理を終了する。この場合は、今回の状態情報が以後、状態情報のマスタとして用いられることになる。
次に、先に説明したステップ126で取得対象となる(又はその可能性がある)状態情報について説明する。冗長化された部分を有するコンピュータ・システムにおいて、その冗長化が有効に機能する状態を維持しているか否かの判定項目としては、ステップ102〜ステップ124で取得される状態情報を用いて実現可能な項目以外に、例えば次の表1に示す判定項目が挙げられる。
Figure 0005216910
上記各項目の判定を行う必要があるか否かは、検証対象のコンピュータ・システムにおける冗長化の構成によって個々の項目毎に相違しているので、検証対象のコンピュータ・システムに適した判定項目を予め選択しておき、選択した判定項目の判定が可能な状態情報を先のステップ126で取得するようにすればよい。
なお、検証対象のコンピュータ・システム10は図2に示した構成に限られるものではなく、本発明は冗長化された部分を有する任意のコンピュータ・システムに適用可能である。
また、上記では検証対象のコンピュータ・システムとしてのウェブサービス提供システム12を構成するコンピュータ(サーバ26〜32)を本発明に係る冗長状態検証装置として機能させる態様を説明したが、これに限定されるものではなく、検証対象のコンピュータ・システムと接続された別のコンピュータを本発明に係る冗長状態検証装置として機能させることも可能である。
また、上記では本発明に係る冗長化構成検証プログラムが各サーバ26〜32の記憶部38に予め記憶(インストール)されている態様を説明したが、本発明に係る冗長状態検証プログラムは、CD−ROMやDVD−ROM等の記録媒体に記録されている形態で提供することも可能である。
10 コンピュータ・システム
12 ウェブサービス提供システム
16 端末装置
18 ディスプレイ
26,28 DBサーバ
30,32 APサーバ
50A,50B HBA
52 ネットワークアダプタ
54A,54B ネットワーク接続デバイス
60 ディスク制御装置(DKC)
62A,62B クラスタ
64 チャネル・アダプタ(CHA)
70 ディスク・アダプタ(DKA)

Claims (18)

  1. それぞれが複数のネットワーク接続デバイスを有する複数のネットワークアダプタを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムであり、複数の仮想的に単一のネットワーク接続デバイスをそれぞれ構成する複数の前記ネットワーク接続デバイスが互いに異なるネットワークアダプタに割り当てられる構成となり、同一の仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスには同一のIPアドレスが割り当てられ、前記複数のネットワーク接続デバイスと前記複数のネットワークアダプタとのそれぞれが現用系と待機系とを構成しているコンピュータ・システムにおける冗長化部分の現在の状態を前記コンピュータで稼働しているオペレーティング・システムに問い合わせることで、前記複数の仮想的なネットワーク接続デバイスへのIPアドレスの割り当てが冗長化され、現用系の仮想的なネットワーク接続デバイスに障害が発生した場合に待機系に切り替わことができる状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化され、現用系のネットワークアダプタに障害が発生した場合に待機系に切り替わることができる状態か否かを表す第4状態情報を含む状態情報を取得する取得手段と、
    前記取得手段によって取得された前記状態情報を記憶するメモリと、
    前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記メモリとは異なる記憶手段にマスタとして記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、
    を含む冗長状態検証装置。
  2. 前記検証対象のコンピュータ・システムは、
    前記取得手段は、前記オペレーティング・システムに対し、複数の前記ネットワーク接続デバイスの各々が何れのネットワークアダプタに割り当てられているかを表す情報を要求するコマンドを送信することで、前記オペレーティング・システムから前記情報を前記第4状態情報として取得する請求項記載の冗長状態検証装置。
  3. 前記検証対象のコンピュータ・システムは、クラスタを構成するコンピュータの冗長化として、単一のクラスタが複数台のコンピュータで構成された構成であり、
    前記取得手段は、前記オペレーティング・システムに対し、検証対象のコンピュータ・システムの単一のクラスタを構成するコンピュータの台数及びそれぞれの稼働状態を表す情報を要求するコマンドを送信することで、前記オペレーティング・システムから、前記情報を、前記検証対象のコンピュータ・システムの単一のクラスタが複数台のコンピュータで構成されている状態か否かを表す第5状態情報として取得する求項記載の冗長状態検証装置。
  4. 前記検証対象のコンピュータ・システムは記憶装置を含んで構成され、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置との接続の冗長化として、前記コンピュータに冗長化された複数のホストアダプタが設けられ、複数の前記ホストアダプタのうち対を成すホストアダプタが、前記記憶装置に設けられ冗長化された複数のコントローラのうちの異なる前記コントローラに接続された構成であり、
    前記取得手段は、前記コントローラに対し、複数の前記ホストアダプタの各々が、複数の前記コントローラの何れに接続されているかを表す情報を要求するコマンドを送信することで、前記情報を、複数の前記ホストアダプタのうち対を成すホストアダプタが複数の前記コントローラのうちの異なる前記コントローラに接続されている状態か否かを表す第6状態情報として取得する求項記載の冗長状態検証装置。
  5. 前記検証対象のコンピュータ・システムは、さらにそれぞれが現用系と待機系とのいずれかを構成する複数のコントローラを有する記憶装置を含み、前記コンピュータのホストアダプタと前記記憶装置とが接続されており、
    前記取得手段は、前記記憶装置に設けられたそれぞれが現用系と待機系のいずれかを構成する複数のコントローラと前記記憶装置の記憶媒体本体との接続が冗長化され、現用系のコントローラに障害が発生した場合に待機系に切り替わことができる状態か否かを表す第1状態情報を前記記憶装置から取得し、前記検証対象のコンピュータ・システムのコンピュータ前記記憶装置の記憶媒体本体との間のパスが冗長化され、現用系のパスに障害が発生した場合に、待機系のパスに切り替わことができる状態か否かを表す第2状態情報を前記記憶媒体に接続される前記コンピュータのホストアダプタより取得する請求項1記載の冗長状態検証装置。
  6. 前記検証対象のコンピュータ・システムは、前記コントローラと前記記憶媒体本体との接続の冗長化として、個々の前記コントーラに複数の媒体側アダプタが各々設けられ、複数の前記コントローラの各々毎に、個々の媒体側アダプタが、冗長化された複数の共有メモリのうちの互いに異なる共有メモリを経由して前記記憶媒体本体と接続された構成であり、
    前記取得手段は、前記コントローラに対し、複数の前記コントローラの各々と前記記憶装置の記憶媒体本体との間の接続経路を個々の前記媒体側アダプタ毎に表す情報を要求するコマンドを送信することで、前記コントローラから前記情報を前記第1状態情報として取得する請求項記載の冗長状態検証装置。
  7. 前記検証対象のコンピュータ・システムは、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスの冗長化として、前記コンピュータに冗長化された複数のホストアダプタが設けられ、前記記憶装置のコントローラに、複数の前記ホストアダプタの何れかと接続される冗長化された複数のホスト側アダプタと、複数の前記ホスト側アダプタの何れかと接続されると共に前記記憶装置の記憶媒体本体と接続され冗長化された複数の媒体側アダプタと、が各々設けられ、前記コンピュータ上で動作する所定のプログラムが、前記検証対象のコンピュータ・システムの個々の前記ホストアダプタから前記記憶装置の記憶媒体本体に至る個々のパス毎に経路及び稼働状態を管理する構成であり、
    前記取得手段は、前記所定のプログラムに対し、前記検証対象のコンピュータ・システムの個々の前記ホストアダプタから前記記憶装置の記憶媒体本体に至る個々のパス毎の経路及び稼働状態を表す情報を要求するコマンドを送信することで、前記コントローラから前記情報を前記第2状態情報として取得する請求項記載の冗長状態検証装置。
  8. 前記判定手段により、前記検証対象のコンピュータの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持していないと判定された場合に、前記取得手段によって取得された前記状態情報が表す前記冗長化部分の現在の状態を通知する情報を出力する出力手段を更に備えた請求項1〜請求項の何れか1項記載の冗長状態検証装置。
  9. 前記取得手段は、前記記憶装置において前記コンピュータ・システムのオペレーティング・システムをインストールするためのシステムディスクが冗長化されている状態か否かを表す第7状態情報、前記記憶装置においてデータを格納するデータディスクが冗長化されている状態か否かを表す第8状態情報、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されているか否かを表す第9状態情報および前記記憶装置との接続のためのアダプタカードが冗長化されているか否かを表す第10状態情報を含む状態情報を取得する請求項5記載の冗長状態検証装置。
  10. 前記第7状態情報は、前記システムディスクが複数の物理ディスクで構成されているか否かを表すことを特徴とする請求項に記載の冗長状態検証装置。
  11. 前記第8状態情報は、前記データディスクが複数の物理ディスクで構成されているか否かを表すことを特徴とする請求項に記載の冗長状態検証装置。
  12. 前記第9状態情報は、さらに前記記憶装置のコントローラ複数の前記ホストアダプタのいずれかと接続されているか否かを表すことを特徴とする請求項に記載の冗長状態検証装置。
  13. 前記第10状態情報は、前記アダプタカードが冗長に構成され、かつ、前記コンピュータ・システムのコンピュータ内部で独立した内部パスに接続されているか否かを表すことを特徴とする請求項に記載の冗長状態検証装置。
  14. 前記コンピュータ・システムは、ネットワークに接続され、
    前記取得手段は、前記ネットワークへの接続が冗長化されている状態か否かを表す第11状態情報を取得することを特徴とする請求項に記載の冗長状態検証装置。
  15. 前記第11状態情報は、前記ネットワークへの接続に用いられるアダプタカードが冗長に構成され、かつ、前記コンピュータ・システムのコンピュータ内部で独立した内部パスに接続されているか否かを表すことを特徴とする請求項14に記載の冗長状態検証装置。
  16. 前記取得手段は、前記記憶装置に設けられRAIDグループに接続されるコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第12状態情報およびソフトウェア的に実現されるRAIDの構成が冗長化されている状態か否かを表す第13状態情報を取得する請求項5記載の冗長状態検証装置。
  17. 前記第12状態情報は、RAIDグループそれぞれに接続されるコントローラが冗長な構成となっているか否かを表すことを特徴とする請求項16に記載の冗長状態検証装置。
  18. 前記第13状態情報は、ソフトウェア的に実現されるRAIDの構成において、ミラー元とミラー先とが異なるディスクになっており、ミラーが複数の物理ディスクで構成され、かつ、前記ディスク間が対象に構成されているか否かを表す情報であることを特徴とする請求項16に記載の冗長状態検証装置。
JP2011286502A 2011-12-27 2011-12-27 冗長状態検証装置 Expired - Fee Related JP5216910B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011286502A JP5216910B2 (ja) 2011-12-27 2011-12-27 冗長状態検証装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011286502A JP5216910B2 (ja) 2011-12-27 2011-12-27 冗長状態検証装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009292480A Division JP4902728B2 (ja) 2009-12-24 2009-12-24 冗長状態検証装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2012064248A JP2012064248A (ja) 2012-03-29
JP5216910B2 true JP5216910B2 (ja) 2013-06-19

Family

ID=46059814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011286502A Expired - Fee Related JP5216910B2 (ja) 2011-12-27 2011-12-27 冗長状態検証装置

Country Status (1)

Country Link
JP (1) JP5216910B2 (ja)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3809915B2 (ja) * 1995-12-28 2006-08-16 富士通株式会社 入出力構成変更装置
JPH11353776A (ja) * 1998-06-08 1999-12-24 Hitachi Ltd ディスクアレイ制御装置
US7051243B2 (en) * 2002-04-30 2006-05-23 Sun Microsystems, Inc. Rules-based configuration problem detection
JP3950679B2 (ja) * 2001-11-29 2007-08-01 株式会社日立製作所 Sanのアクセスパスの診断システム
JP2005010956A (ja) * 2003-06-17 2005-01-13 Hitachi Ltd 情報処理装置の制御方法、情報処理装置、情報処理システム、及びプログラム
JP2007241533A (ja) * 2006-03-07 2007-09-20 Oki Electric Ind Co Ltd システム構成情報比較装置およびコンピュータプログラム
JP2007310656A (ja) * 2006-05-18 2007-11-29 Hitachi Ltd 計算機システム及び論理パス差分検出方法
JP2007334484A (ja) * 2006-06-13 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> 通信装置および通信装置の物理インタフェース切り替え方法
JP5020601B2 (ja) * 2006-11-10 2012-09-05 株式会社日立製作所 アクセス環境構築システム及び方法
JP2008172592A (ja) * 2007-01-12 2008-07-24 Hitachi Ltd クラスタシステム、コンピュータおよびその異常検出方法

Also Published As

Publication number Publication date
JP2012064248A (ja) 2012-03-29

Similar Documents

Publication Publication Date Title
EP1760591B1 (en) System and method of managing access path
US7480780B2 (en) Highly available external storage system
US7464236B2 (en) Storage system and storage management method
JP4940967B2 (ja) ストレージシステム、ストレージ装置、ファームウェアの活性交換方法、ファームウェアの活性交換プログラム
US6571354B1 (en) Method and apparatus for storage unit replacement according to array priority
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
JP4958673B2 (ja) ストレージシステム及びこれの管理方法
WO2014083598A1 (en) Hierarchical storage system and file management method
IE20000203A1 (en) Storage domain management system
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
JP2007226400A (ja) 計算機管理方法、計算機管理プログラム、実行サーバの構成を管理する待機サーバ及び計算機システム
JP2007086972A (ja) ストレージシステム、二重化制御方法、及びプログラム
US7937481B1 (en) System and methods for enterprise path management
JP2005149436A (ja) ストレージ装置、ストレージ装置における制御方法、ジョブスケジューリング処理方法及び障害処理方法並びにそれらのプログラム
US8234447B2 (en) Storage control device for storage system provided with storage device coupled to switch network
US20120047327A1 (en) Disk array device and control method for the same
JPWO2004104845A1 (ja) ストレージシステム
US7886186B2 (en) Storage system and management method for the same
JP2006227856A (ja) アクセス制御装置及びそれに搭載されるインターフェース
US20080288671A1 (en) Virtualization by multipath management software for a plurality of storage volumes
JP4738438B2 (ja) 外部接続ストレージシステムのパス管理及び障害箇所検出方法
JP2013117922A (ja) ディスクシステム、データ保持装置、及びディスクデバイス
JP2010020410A (ja) リモートコピーシステム及びリモートコピー方法
US20090249010A1 (en) Apparatus and method for controlling copying
JP5216910B2 (ja) 冗長状態検証装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111227

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111229

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20111229

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130304

R150 Certificate of patent or registration of utility model

Ref document number: 5216910

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees