JP2015082238A - 通知装置及び通知方法 - Google Patents

通知装置及び通知方法 Download PDF

Info

Publication number
JP2015082238A
JP2015082238A JP2013220309A JP2013220309A JP2015082238A JP 2015082238 A JP2015082238 A JP 2015082238A JP 2013220309 A JP2013220309 A JP 2013220309A JP 2013220309 A JP2013220309 A JP 2013220309A JP 2015082238 A JP2015082238 A JP 2015082238A
Authority
JP
Japan
Prior art keywords
time
software
failure
notification
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013220309A
Other languages
English (en)
Other versions
JP6224985B2 (ja
Inventor
雅仁 室井
Masahito Muroi
雅仁 室井
幸久 西澤
Yukihisa Nishizawa
幸久 西澤
大子郎 横関
Daigoro Yokozeki
大子郎 横関
平井 利治
Toshiji Hirai
利治 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013220309A priority Critical patent/JP6224985B2/ja
Publication of JP2015082238A publication Critical patent/JP2015082238A/ja
Application granted granted Critical
Publication of JP6224985B2 publication Critical patent/JP6224985B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】ソフトウェア毎に監視方法を変更する必要なく、ソフトウェアの稼働時間を外部装置に適切に通知し、かつ監視コストを低減することを課題とする。
【解決手段】ソフトウェア稼働時間通知装置10は、ソフトウェア稼働時間通知装置10は、現用系ノードの故障が待機系ノードによって検知された場合に、該待機系ノードが現用系ノードの故障を検知した時刻を検出し、待機系ノードにおいて稼働時間通知対象ソフトウェア20の起動が完了した場合に、該稼働時間通知対象ソフトウェア20の起動が完了した時刻を検出する。そして、ソフトウェア稼働時間通知装置10は、待機系ノードが現用系ノードの故障を検知した時刻と、待機系ノードにおいてソフトウェアの起動が完了した時刻とを外部通知先監視システム40へ通知する。
【選択図】 図3

Description

本発明は、通知装置及び通知方法に関する。
従来、ソフトウェアの冗長化クラスタを実現し、システムの可用性を高める技術として、ソフトウェアを冗長化することで、ソフトウェアが動作する現用系ハードウェアで故障が発生した場合でも、ソフトウェアが動作するハードウェアを切り替える事でシステムの動作を継続する技術が知られている(例えば、非特許文献1参照)。
このような技術では、現用系ハードウェアの故障を待機系のハードウェアで検知するために、同一クラスタを構成する高可用性クラスタソフトウェア同士で、死活監視のパケットを送受信し合い、それぞれのハードウェアやソフトウェアでの故障の有無を監視している。
また、クラスタ内の各ノードにソフトウェアの動作監視エージェントを配置し、ノード上のソフトウェアの動作状況を監視して外部装置へ通知をすることで、ソフトウェアの稼働時間を外部装置で管理させる。
"サービスの可用性を向上させるOSSミドルHeartbeatの開発"、[online]、[平成25年10月11日検索]、インターネット<http://www.ntt.co.jp/journal/0903/files/jn20090346.pdf> "Crane 〜Management Solution from NTT R&D〜"、[online]、[平成25年10月11日検索]、インターネット<http://www.oss.ecl.ntt.co.jp/ossc/download/Crane.pdf>
しかしながら、従来の技術では、ソフトウェアの稼働時間を外部装置に適切に通知することができない場合があるという課題があった。つまり、現用系ハードウェアで故障が発生した場合には、ハードウェアが故障しているため監視エージェントの動作と、外部へ稼働状態を通知できるかが保証されないため、ソフトウェアの稼働時間を通知することができない場合があった。
なお、ソフトウェアの稼働状況を確認する方法として、例えば、高可用性クラスタ以外の監視システムが、論理リソースの稼働時間を測定してソフトウェアの稼働状況を監視する技術もある(非特許文献2参照)。しかし、サービスを提供するためのシステムの規模に合わせて、監視システムによるソフトウェアの稼働状況の監視に必要なコストが増加してしまう。また、ソフトウェア毎に稼働状況を監視する方法が異なるため、監視システムは冗長化対象のソフトウェア毎に監視方法を変更する必要があった。
そこで、この発明は、ソフトウェア毎に監視方法を変更する必要なく、ソフトウェアの稼働時間を外部装置に適切に通知し、かつ監視コストを低減することを目的とする。
上述した課題を解決し、目的を達成するため、開示の通知装置は、現用系ノードが故障した場合に、該現用系ノードで稼働するソフトウェアを待機系ノードにおいて起動させるクラスタシステムにおいて、前記ソフトウェアに関する情報を外部装置へ通知する通知装置であって、前記現用系ノードの故障が待機系ノードによって検知された場合に、該待機系ノードが現用系ノードの故障を検知した時刻である第1時刻を検出する故障時刻検出部と、前記待機系ノードにおいて前記ソフトウェアの起動が完了した場合に、該ソフトウェアの起動が完了した時刻である第2時刻を検出する起動時刻検出部と、前記第1時刻と、前記第2時刻とを外部装置へ通知する通知部と、を備えることを特徴とする。
また、開示の通知方法は、現用系ノードが故障した場合に、該現用系ノードで稼働するソフトウェアを待機系ノードにおいて起動させるクラスタシステムにおいて、前記ソフトウェアに関する情報を外部装置へ通知する通知装置により実行される通知方法であって、前記現用系ノードの故障が待機系ノードによって検知された場合に、該待機系ノードが現用系ノードの故障を検知した時刻である第1時刻を検出する故障時刻検出工程と、前記待機系ノードにおいて前記ソフトウェアの起動が完了した場合に、該ソフトウェアの起動が完了した時刻である第2時刻を検出する起動時刻検出工程と、前記第1時刻と、前記第2時刻とを外部装置へ通知する通知工程と、を含んだことを特徴とする。
本願に開示する通知装置及び通知方法は、ソフトウェア毎に監視方法を変更する必要なく、ソフトウェアの稼働時間を外部装置に適切に通知し、かつ監視コストを低減することが可能である。
図1は、第一の実施形態に係るシステムの構成の一例を示す図である。 図2は、第一の実施形態に係るシステムにおける現用系ノードおよび待機系ノードの構成の一例を示す図である。 図3は、第一の実施形態に係るソフトウェア稼働時間通知装置の構成を示すブロック図である。 図4は、第一の実施形態に係る故障検知情報記憶部に記憶される情報の一例を示す図である。 図5は、第一の実施形態に係るソフトウェア起動時間記憶部に記憶される情報の一例を示す図である。 図6は、第一の実施形態に係るソフトウェア稼働時間通知装置における通知処理の概要を説明する図である。 図7は、第一の実施形態に係るソフトウェア稼働時間通知装置における通知処理の流れを説明するためのフローチャートである。 図8は、通知プログラムを実行するコンピュータを示す図である。
以下に図面を参照して、この発明に係る通知装置及び通知方法の実施形態を詳細に説明する。なお、この実施形態によりこの発明が限定されるものではない。
[第一の実施形態]
以下の実施形態では、第一の実施形態に係るシステムの構成、ソフトウェア稼働時間通知装置の構成及び解析装置による処理の流れを順に説明し、最後に第一の実施形態による効果を説明する。
[システムの構成]
まず、第一の実施形態に係るシステムの構成の一例を説明する。図1は、第一の実施形態に係るシステムの構成の一例を示す図である。図1に示すように、第一の実施形態に係るシステムでは、ソフトウェアを冗長化させて可用性を高める複数のソフトウェアクラスタ50A、50Bと、ソフトウェアクラスタ50において稼働するソフトウェアを監視する外部通知先監視システム40とを有し、ソフトウェアクラスタ50A、50Bと外部通知先監視システム40とはネットワーク60を介して接続されている。
なお、図1では、ソフトウェアクラスタ50A、50Bが2つ、外部通知先監視システム40が一つ存在する場合を例示しているが、ソフトウェアクラスタの数および外部通知先監視システムの数は、これに限定されるものではない。また、ソフトウェアクラスタ50A、50Bについて特に区別することなく説明する場合には、ソフトウェアクラスタ50と記載する。
ソフトウェアクラスタ50A、50Bは、現用系ノード50aと、待機系ノード50bとをそれぞれ有する。また、現用系ノード50aおよび待機系ノード50bは、ソフトウェア稼働時間通知装置10a、10bを含んでいる。ここで、現用系ノード50aとソフトウェア稼働時間通知装置10aとは、共通のハードウェア資源により構成されていてもよいし、別々のハードウェア資源により構成されていてもよい。また、待機系ノード50bとソフトウェア稼働時間通知装置10bについても同様である。
現用系ノード50aは、ソフトウェア(以下では、稼働時間通知対象ソフトウェア20aという)を動作させている。また、待機系ノード50bは、現用系ノード50aの故障を検知すると、稼働時間通知対象ソフトウェア20aを起動し、故障した現用系ノード50aの代わりに、稼働時間通知対象ソフトウェア20aを動作させる。また、ソフトウェア稼働時間通知装置10a、10bについて特に区別することなく説明する場合には、ソフトウェア稼働時間通知装置10と記載する。
ソフトウェア稼働時間通知装置10bは、現用系ノード50aの故障が待機系ノード50bによって検知された場合に、該待機系ノード50bが現用系ノード50aの故障を検知した時刻を検出する。また、ソフトウェア稼働時間通知装置10bは、待機系ノード50bにおいてソフトウェアの起動が完了した場合に、該ソフトウェアの起動が完了した時刻を検出する。
そして、ソフトウェア稼働時間通知装置10bは、待機系ノード50bが現用系ノード50aの故障を検知した時刻と、待機系ノード50bにおいてソフトウェアの起動が完了した時刻とを外部通知先監視システム40へ通知する。
次に、図2を用いて、現用系ノード50aおよび待機系ノード50bの構成について説明する。図2は、第一の実施形態に係るシステムにおける現用系ノードおよび待機系ノードの構成の一例を示す図である。なお、以下の例では、外部通知先監視システム40とソフトウェアクラスタ50とが一対一の関係である場合を例に説明するが、これに限定されるものではなく、一対複数や複数対複数でもよく、例えば、一つの外部通知先監視システム40に対して複数のソフトウェアクラスタ50が存在してもよい。
ソフトウェアクラスタ50は、高可用性クラスタソフトウェア30によって管理されるサーバの単位であり、冗長化対象のソフトウェアである稼働時間通知対象ソフトウェア20aが動作する現用系ノード50aと、稼働時間通知対象ソフトウェア20aが動作せず、現用系ノード50aで障害が発生した際に稼働時間通知対象ソフトウェアの切り替わり先となる待機系ノード50bで構成される。
また、現用系ノード50aと待機系ノード50bは、ソフトウェアクラスタ50内に、それぞれ複数ノードの存在が可能である。また、ソフトウェアクラスタ50は外部通知先監視システム40に対して、複数のソフトウェアクラスタ50の存在が可能である。
現用系ノード50aでは、稼働時間通知対象ソフトウェア20aおよび高可用性クラスタソフトウェア30aが稼働している。稼働時間通知対象ソフトウェア20aは、現用系ノード50a上で稼働しているソフトウェアであり、稼働状態の監視対象となるソフトウェアである。
待機系ノード50bでは、高可用性クラスタソフトウェア30bが稼働している。また、現用系ノード50aに故障が発生した場合には、待機系ノード50bにおいて、稼働時間通知対象ソフトウェア20bが起動し、現用系ノード50aの代わりに稼働時間通知対象ソフトウェア20bを稼働させる。
高可用性クラスタソフトウェア30a、30bは、高可用性クラスタを作成するために利用される既存のソフトウェアである。高可用性クラスタソフトウェア30a、30bは、ソフトウェアが動作するハードウェアとソフトウェアの稼働状態を監視し、ハードウェアとソフトウェアの故障の有無を確認する。
また、同一クラスタに所属する高可用性クラスタソフトウェア30a、30b同士で定期的に死活監視パケットを送受信し、他のハードウェアで動作するソフトウェアの故障の有無、他のハードウェアの故障の有無、高可用性クラスタソフトウェア30a、30b自身の故障の有無をお互いに監視している。
稼働時間通知対象ソフトウェア20aは冗長化対象のソフトウェアであり、本発明のソフトウェア稼働時間通知装置10bによって稼働時間が、外部通知先監視システム40へ通知される対象のソフトウェアである。
[ソフトウェア稼働時間通知装置の構成]
次に、図3を用いて、第一の実施形態に係るソフトウェア稼働時間通知装置の構成について説明する。図3は、第一の実施形態に係るソフトウェア稼働時間通知装置の構成を示すブロック図である。図3に示すように、ソフトウェア稼働時間通知装置10は、通信処理部11、記憶部12および制御部13を有する。
通信処理部11は、接続される外部通知先監視システム40との間でやり取りする各種情報に関する通信を制御する。例えば、通信処理部11は、待機系ノード50bが現用系ノード50aの故障を検知した時刻と、待機系ノード50bにおいてソフトウェアの起動が完了した時刻とを外部通知先監視システム40に送信する。
記憶部12は、図3に示すように、故障時刻記憶部12aおよび起動時刻記憶部12bを有する。記憶部12は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置などである。
故障時刻記憶部12aは、待機系ノード50bが現用系ノード50aの故障を検知した時刻を記憶する。例えば、故障時刻記憶部12aは、図4に例示するように、故障した現用系ノード50aを一意に識別する「ノードID」と、待機系ノード50bが現用系ノード50aの故障を検知した時刻である「故障検知時刻」とを対応付けて記憶する。図4は、第一の実施形態に係る故障検知情報記憶部に記憶される情報の一例を示す図である。
図4の例を挙げて説明すると、故障時刻記憶部12aは、例えば、ノードIDである「1」と、故障検知時刻である「2013/10/10 10:22」とを対応付けて記憶する。
起動時刻記憶部12bは、待機系ノード50bによりソフトウェアの起動が完了した時刻を記憶する。例えば、起動時刻記憶部12bは、図5に例示するように、待機系ノード50bにより起動された稼働時間通知対象ソフトウェア20を一意に識別する「ソフトウェアID」と、待機系ノード50bによりソフトウェアの起動が完了した時刻である「起動完了時刻」とを対応付けて記憶する。図5は、第一の実施形態に係るソフトウェア起動時間記憶部に記憶される情報の一例を示す図である。
図5の例を挙げて説明すると、起動時刻記憶部12bは、例えば、ソフトウェアIDである「A」と、起動完了時刻である「2013/10/10 13:10」とを対応付けて記憶する。
図3に戻って、制御部13は、故障時刻検出部13a、起動時刻検出部13bおよび通知部13cを有する。ここで、制御部13は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などの電子回路やASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路である。
故障時刻検出部13aは、現用系ノード50aの故障が待機系ノード50bによって検知された場合に、該待機系ノード50bが現用系ノード50aの故障を検知した時刻を検出する。具体的には、故障時刻検出部13aは、待機系ノード50bが現用系ノード50aの故障を検知した時刻を検出すると、該時刻を故障時刻記憶部12aに格納する。
また、故障時刻検出部13aは、待機系ノード50bの高可用性クラスタソフトウェア30bが、ハートビートパケットなどとも呼ばれる死活監視パケットを用いて現用系ノード50aの故障を検知した場合に、該待機系ノード50bが現用系ノード50aの故障を検知した時刻を検出する。
ここで、待機系ノード50bの高可用性クラスタソフトウェア30bが死活監視パケットを用いて現用系ノード50aの故障を検知する方法について説明する。なお、以下の説明では、故障発生前の現用系ノード50aのハードウェアをハードウェアA、待機系ノード50bのハードウェアをハードウェアBとして説明する。また、待機系ノード50bの高可用性クラスタソフトウェア30bが死活監視パケットを用いて現用系ノード50aの故障を検知する方法として、故障したハードウェア以外の他のハードウェアにより故障が検知される方法と故障した現用系ノード50a自身により自ハードウェアの故障を検知する方法とがある。
まず、故障したハードウェア以外の他のハードウェアにより故障が検知される方法の一例について説明する。高可用性クラスタソフトウェア30bは、一定間隔で同一クラスタに属する他の高可用性クラスタソフトウェア30aに対して死活監視用のパケット(以下では、適宜「ハートビートパケット」と記載する)を定期的に送信する。
そして、ハートビートパケットを高可用性クラスタソフトウェア30aが受信すると、自身が動作するハードウェアやソフトウェアに関する監視結果を応答する。ここで、ハードウェアAがハートビートパケットを受信した場合には、ソフトウェアの状態監視の結果とハードウェアAの状態監視の結果をハートビートパケットに含めて、ハードウェアBへ応答を返す。なお、ハードウェアBがハートビートパケットを受信した場合にも、上記と同様に、ハードウェアBの状態監視の結果をハードウェアAへ応答を返す。
また、高可用性クラスタソフトウェア30bが送信したハートビートパケットへの応答がない場合には、または、応答に故障の情報が含まれている場合には、待機系ノード50bは、現用系ノード50aのハードウェアAにて故障が発生したことを検知する。
次に、故障した現用系ノード50a自身により自ハードウェアの故障を検知する方法の一例について説明する。故障した現用系ノード50a自身により自ハードウェアの故障を検知する方法には、ソフトウェアによる故障検知方法とハードウェアによる故障検知方法とがある。
例えば、ソフトウェアによる故障検知方法として、HTTPによるレスポンスの確認やデータベースへのコネクションの接続の確認など、冗長化対象のソフトウェアへアクセスを行い、ソフトウェアが動作していることを確認し、適切な応答が得られない場合に故障と判断をする。
また、ハードウェアによる故障検知方法としては、ハードウェアに対してicmpによる監視などを実施し、ハードウェアが稼働しているかを確認し、応答が無い場合に故障と判断をする。
このように、故障した現用系ノード50a自身により自ハードウェアの故障を検知すると、高可用性クラスタソフトウェア30aは、他のハードウェアへ送信するハートビートパケットや、他のハードウェアからのハートビートパケットへの応答を利用して故障を、同一クラスタ内の他の高可用性クラスタソフトウェア30bへ通知する。
また、高可用性クラスタソフトウェア30bは、ハードウェアやソフトウェアの故障を検知すると、ログとして記録した故障を検知したことを示す情報をハードウェア上に通知する。ここで、故障時刻検出部13aは、現用系ノード50aが故障したことを示すログが記録されたことを契機に、待機系ノード50bが現用系ノード50aの故障を検知した時刻を検出する。つまり、高可用性クラスタソフトウェア30bにより故障を検知したことを示す情報がログとして記録されたことを契機に、故障時刻報記憶部12aへ高可用性クラスタソフトウェア30が故障を検知した時刻を記録する。
起動時刻検出部13bは、待機系ノード50bにおいて稼働時間通知対象ソフトウェア20bの起動が完了した場合に、該稼働時間通知対象ソフトウェア20bの起動が完了した時刻を検出する。具体的には、起動時刻検出部13bは、稼働時間通知対象ソフトウェア20bの起動が完了した時刻を検出すると、該時刻を起動時刻記憶部12bに格納する。
例えば、起動時刻検出部13bは、稼働時間通知対象ソフトウェア20bの起動完了を検知すると、稼働時間通知対象ソフトウェア20の起動時刻を起動時刻記憶部12aに格納する。
通知部13cは、故障時刻検出部13aによって検出された時刻と、起動時刻検出部13bによって検出された時刻とを外部通知先監視システム40へ通知する。例えば、通知部13cは、通信処理部11に対して外部通知先監視システム40へ通知の実施依頼を行い、通信処理部11を介して、待機系ノード50bが現用系ノード50aの故障を検知した時刻と、待機系ノード50bにおいてソフトウェアの起動が完了した時刻とを外部通知先監視システム40へ通知する。
ここで、図6を用いて、ソフトウェアクラスタ50において現用系ノード50aのハードウェアに故障が発生した場合において、待機系ノード50bが現用系ノード50aの故障を検知した時刻と、待機系ノード50bにおいてソフトウェアの起動が完了した時刻とを外部通知先監視システム40へ通知する通知処理の全体の流れを説明する。図6は、第一の実施形態に係るソフトウェア稼働時間通知装置における通知処理の概要を説明する図である。
例えば、図6に例示するように、稼働時間通知対象ソフトウェア20aに障害が発生した場合に、上述したように、高可用性クラスタソフトウェア30bは、ハートビートパケットから稼働時間通知対象ソフトウェア20aの障害を検知する。そして、故障時刻検出部13aは、現用系ノード50aの故障が待機系ノード50bによって検知された場合に、該待機系ノード50bが現用系ノード50aの故障を検知した時刻を検出する。
続いて、待機系ノード50bでは、稼働時間通知対象ソフトウェア20bを起動する。そして、起動時刻検出部13bは、待機系ノード50bにおいて稼働時間通知対象ソフトウェア20bの起動が完了した場合に、該稼働時間通知対象ソフトウェア20bの起動が完了した時刻を検出する。その後、ソフトウェア稼働時間通知装置10bの通知部13cは、故障時刻検出部13aによって検出された時刻と、起動時刻検出部13bによって検出された時刻とを外部通知先監視システム40へ通知する。
[ソフトウェア稼働時間通知装置による処理]
次に、図7を用いて、高可用性クラスタソフトウェア30による稼働時間通知対象ソフトウェア20の故障検知から、ソフトウェア稼働時間通知装置10による外部通知先監視システム40へ通知を実施するまでの流れを説明する。図7は、第一の実施形態に係るソフトウェア稼働時間通知装置における通知処理の流れを説明するためのフローチャートである。
図7に示すように、待機系ノード50bの高可用性クラスタソフトウェア30bが、クラスタ内の稼働時間通知対象ソフトウェア20の故障を検知すると(ステップS101肯定)、ソフトウェア稼働時間通知装置10の故障時刻検出部13aは、待機系ノード50bの高可用性クラスタソフトウェア30が現用系ノード50aの故障を検知した時刻を検出し、該時刻を故障時刻記憶部12aに記録する(ステップS102)。
例えば、故障時刻検出部13aは、現用系ノード50aが故障したことを示すログが記録されたことを契機に、待機系ノード50bが現用系ノード50aの故障を検知した時刻を検出する。つまり、高可用性クラスタソフトウェア30bにより故障を検知したことを示す情報がログとして記録されたことを契機に、高可用性クラスタソフトウェア30bが故障を検知した時刻を故障時刻報記憶部12aに記録する。
そして、待機系ノード50bは、監視対象のソフトウェアである稼働時間通知対象ソフトウェア20の起動、および起動時刻検出部13bによる起動時刻の監視を開始する(ステップS103)。続いて、起動時刻検出部13bは、ノード内で動作するプロセスを監視し、稼働時間通知対象ソフトウェア20の起動を検知したか否かを判定する(ステップS104)。
この結果、起動時刻検出部13bは、稼働時間通知対象ソフトウェア20の起動を検知すると(ステップS104肯定)、監視対象のソフトウェアの起動時刻を起動時刻記憶部12bに記録する(ステップS105)。その後、通知部13cは、高可用性クラスタソフトウェア30bが故障を検知した故障時刻と、稼働時間通知対象ソフトウェア20の起動時刻とを外部通知先監視システム40へ送信し(ステップS106)、ソフトウェア稼働時間通知装置10による通知処理を終了する。
また、上記の一連の処理の流れの説明では、待機系ノード50bにおいて、自ノードで稼働時間通知対象ソフトウェア20の起動を行う場合を説明したが、他ノードで稼働時間通知対象ソフトウェア20の起動を行われる場合もある。
このような場合には、例えば、他の待機系ノード50bで稼働時間通知対象ソフトウェア20の起動を高可用性クラスタソフトウェア30が検知すると、検知した情報をノード内へログなどを利用して通知する。そして、他のノードでの稼働時間通知対象ソフトウェア20の起動を起動時刻検出部13bが検知し、起動時刻検出部13bへ稼働時間通知対象ソフトウェア20の監視終了を指示する。その後、ソフトウェア稼働時間通知装置10による通知処理を終了する。
[第一の実施形態の効果]
上述してきたように、第一の実施形態にかかるソフトウェア稼働時間通知装置10は、ソフトウェア稼働時間通知装置10は、現用系ノード50aの故障が待機系ノード50bによって検知された場合に、該待機系ノード50bが現用系ノード50aの故障を検知した時刻を検出し、待機系ノード50bにおいて稼働時間通知対象ソフトウェア20の起動が完了した場合に、該稼働時間通知対象ソフトウェア20の起動が完了した時刻を検出する。そして、ソフトウェア稼働時間通知装置10は、待機系ノード50bが現用系ノード50aの故障を検知した時刻と、待機系ノード50bにおいてソフトウェアの起動が完了した時刻とを外部通知先監視システム40へ通知する。これにより、ソフトウェア毎に監視方法を変更する必要なく、ソフトウェアの稼働時間を外部装置に適切に通知し、かつ監視コストを低減することが可能である。
また、ソフトウェア稼働時間通知装置10が稼働時間通知対象ソフトウェア20の稼働時間を外部通知先監視システム40へ通知するため、外部通知先監視システム40の機能に依存せずに稼働時間通知対象ソフトウェアの切り替わりに要した時間を通知することが可能である。
また、待機系ノード50bで動作するソフトウェア稼働時間通知装置10から外部通知先監視システム40へ通知するため、現用系ノード50aの通信機能に故障が発生した場合でも、外部通知先監視システム40へ稼働時間通知対象ソフトウェア20の稼働時間を通知することが可能である。
また、現用系ノード50aの故障発生時に、稼働時間通知対象ソフトウェア20が切り替わった待機系ノード50bで動作するソフトウェア稼働時間通知装置10から外部通知先監視システム40へ通知するため、ソフトウェアクラスタ50や稼働時間通知対象ソフトウェア20の数が増加しても監視コストが増加することがなく、監視コストを低減することが可能である。
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、故障時刻検出部13aと起動時刻検出部13bとを統合してもよい。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[プログラム]
また、上記実施形態において説明したソフトウェア稼働時間通知装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、第一の実施形態に係るソフトウェア稼働時間通知装置10が実行する処理をコンピュータが実行可能な言語で記述した通知プログラムを作成することもできる。この場合、コンピュータが通知プログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる通知プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録され通知プログラムをコンピュータに読み込ませて実行することにより上記第一の実施形態と同様の処理を実現してもよい。以下に、図3に示したソフトウェア稼働時間通知装置10と同様の機能を実現する通知プログラムを実行するコンピュータの一例を説明する。
図8は、通知プログラムを実行するコンピュータ1000を示す図である。図8に例示するように、コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有し、これらの各部はバス1080によって接続される。
メモリ1010は、図8に例示するように、ROM(Read Only Memory)1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、図8に例示するように、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、図8に例示するように、ディスクドライブ1041に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1041に挿入される。シリアルポートインタフェース1050は、図8に例示するように、例えばマウス1051、キーボード1052に接続される。ビデオアダプタ1060は、図8に例示するように、例えばディスプレイ1061に接続される。
ここで、図8に例示するように、ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、上記の通知プログラムは、コンピュータ1000によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ1031に記憶される。
また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ1010やハードディスクドライブ1031に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出し、各種処理手順を実行する。
なお、通知プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限られず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ等を介してCPU1020によって読み出されてもよい。あるいは、通知プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
10、10a、10b ソフトウェア稼働時間通知装置
11 通信処理部
12 記憶部
12a 故障時刻記憶部
12b 起動時刻記憶部
13 制御部
13a 故障時刻検出部
13b 起動時刻検出部
13c 通知部
13 記憶部
13a 故障時刻記憶部
13b 起動時刻記憶部
20、20a、20b 稼働時間通知対象ソフトウェア
30、30a、30b 高可用性クラスタソフトウェア
40 外部通知先監視システム

Claims (8)

  1. 現用系ノードが故障した場合に、該現用系ノードで稼働するソフトウェアを待機系ノードにおいて起動させるクラスタシステムにおいて、前記ソフトウェアに関する情報を外部装置へ通知する通知装置であって、
    前記現用系ノードの故障が待機系ノードによって検知された場合に、該待機系ノードが現用系ノードの故障を検知した時刻である第1時刻を検出する故障時刻検出部と、
    前記待機系ノードにおいて前記ソフトウェアの起動が完了した場合に、該ソフトウェアの起動が完了した時刻である第2時刻を検出する起動時刻検出部と、
    前記第1時刻と、前記第2時刻とを外部装置へ通知する通知部と、
    を備えることを特徴とする通知装置。
  2. 前記第1時刻を記憶する故障時刻記憶部と、
    前記第2時刻を記憶する起動時刻記憶部と
    をさらに備え、
    前記故障時刻検出部は、前記第1時刻を検出すると、前記第1時刻を前記故障時刻記憶部に格納し、
    前記起動時刻検出部は、前記第2時刻を検出すると、前記第2時刻を前記起動時刻記憶部に格納し、
    前記通知部は、前記故障時刻記憶部に格納された第1時刻と前記起動時刻記憶部に格納された第2時刻とを外部装置へ通知することを特徴とする請求項1に記載の通知装置。
  3. 前記故障時刻検出部は、前記現用系ノードが故障したことを示すログが記録されたことを契機に、前記第1時刻を検出することを特徴とする請求項1または2に記載の通知装置。
  4. 前記起動時刻検出部は、前記待機系ノードが死活パケットを用いて前記現用系ノードの故障を検知した場合に、前記第1時刻を検出することを特徴とする請求項1〜3のいずれか一つに記載の通知装置。
  5. 現用系ノードが故障した場合に、該現用系ノードで稼働するソフトウェアを待機系ノードにおいて起動させるクラスタシステムにおいて、前記ソフトウェアに関する情報を外部装置へ通知する通知装置により実行される通知方法であって、
    前記現用系ノードの故障が待機系ノードによって検知された場合に、該待機系ノードが現用系ノードの故障を検知した時刻である第1時刻を検出する故障時刻検出工程と、
    前記待機系ノードにおいて前記ソフトウェアの起動が完了した場合に、該ソフトウェアの起動が完了した時刻である第2時刻を検出する起動時刻検出工程と、
    前記第1時刻と、前記第2時刻とを外部装置へ通知する通知工程と、
    を含んだことを特徴とする通知方法。
  6. 前記故障時刻検出工程は、前記第1時刻を検出すると、前記第1時刻を故障時刻記憶部に格納し、
    前記起動時刻検出工程は、前記第2時刻を検出すると、前記第2時刻を起動時刻記憶部に格納し、
    前記通知工程は、前記故障時刻記憶部に格納された第1時刻と前記起動時刻記憶部に格納された第2時刻とを外部装置へ通知することを特徴とする請求項5に記載の通知方法。
  7. 前記故障時刻検出工程は、前記現用系ノードが故障したことを示すログが記録されたことを契機に、前記第1時刻を検出することを特徴とする請求項5または6に記載の通知方法。
  8. 前記起動時刻検出工程は、待機系ノードが死活パケットを用いて前記現用系ノードの故障を検知した場合に、前記第1時刻を検出することを特徴とする請求項5〜7のいずれか一つに記載の通知方法。
JP2013220309A 2013-10-23 2013-10-23 通知装置及び通知方法 Active JP6224985B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013220309A JP6224985B2 (ja) 2013-10-23 2013-10-23 通知装置及び通知方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013220309A JP6224985B2 (ja) 2013-10-23 2013-10-23 通知装置及び通知方法

Publications (2)

Publication Number Publication Date
JP2015082238A true JP2015082238A (ja) 2015-04-27
JP6224985B2 JP6224985B2 (ja) 2017-11-01

Family

ID=53012801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013220309A Active JP6224985B2 (ja) 2013-10-23 2013-10-23 通知装置及び通知方法

Country Status (1)

Country Link
JP (1) JP6224985B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022117451A (ja) * 2021-01-29 2022-08-10 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 変更タスクを実行する方法、装置、電子機器、及び読み取り可能な記憶媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269332A (ja) * 2007-04-20 2008-11-06 Hitachi Ltd サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム
JP2013161251A (ja) * 2012-02-03 2013-08-19 Fujitsu Ltd コンピュータ障害監視プログラム、方法、及び装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269332A (ja) * 2007-04-20 2008-11-06 Hitachi Ltd サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム
JP2013161251A (ja) * 2012-02-03 2013-08-19 Fujitsu Ltd コンピュータ障害監視プログラム、方法、及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022117451A (ja) * 2021-01-29 2022-08-10 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 変更タスクを実行する方法、装置、電子機器、及び読み取り可能な記憶媒体
JP7367287B2 (ja) 2021-01-29 2023-10-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 変更タスクを実行する方法、装置、電子機器、及び読み取り可能な記憶媒体

Also Published As

Publication number Publication date
JP6224985B2 (ja) 2017-11-01

Similar Documents

Publication Publication Date Title
US10860311B2 (en) Method and apparatus for drift management in clustered environments
US10558517B2 (en) Proactive cloud orchestration
US8117487B1 (en) Method and apparatus for proactively monitoring application health data to achieve workload management and high availability
US11157373B2 (en) Prioritized transfer of failure event log data
US8065560B1 (en) Method and apparatus for achieving high availability for applications and optimizing power consumption within a datacenter
US8112518B2 (en) Redundant systems management frameworks for network environments
CN110830283B (zh) 故障检测方法、装置、设备和系统
US9210059B2 (en) Cluster system
CN107508694B (zh) 一种集群内的节点管理方法及节点设备
US8381014B2 (en) Node controller first failure error management for a distributed system
JP5855724B1 (ja) 仮想機器管理装置、仮想機器管理方法及び仮想機器管理プログラム
CN107071189B (zh) 一种通讯设备物理接口的连接方法
US11163630B2 (en) Using real-time analytics to manage application features
CN111147274B (zh) 为集群解决方案创建高度可用的仲裁集的系统和方法
JPWO2019049433A1 (ja) クラスタシステム、クラスタシステムの制御方法、サーバ装置、制御方法、及びプログラム
JP6224985B2 (ja) 通知装置及び通知方法
JP2018056633A (ja) クラスタシステム、サーバ、サーバの動作方法、及びプログラム
JP5631285B2 (ja) 障害監視システムおよび障害監視方法
US11349964B2 (en) Selective TCP/IP stack reconfiguration
JP6277069B2 (ja) 仮想機器管理装置、仮想機器管理方法及び仮想機器管理プログラム
JP6237055B2 (ja) ライセンス管理システム、装置、方法及びプログラム
US11010269B2 (en) Distributed processing system and method for management of distributed processing system
JP2023526174A (ja) ネットワーク・ファブリックにおける非応答ポートの隔離
CN115499296B (zh) 一种云桌面热备管理方法、装置及系统
JP2013156963A (ja) 制御プログラム、制御方法、情報処理装置、制御システム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20151001

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151005

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170321

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171006

R150 Certificate of patent or registration of utility model

Ref document number: 6224985

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150