JP2016151965A - 冗長構成システム及び冗長構成制御方法 - Google Patents

冗長構成システム及び冗長構成制御方法 Download PDF

Info

Publication number
JP2016151965A
JP2016151965A JP2015029981A JP2015029981A JP2016151965A JP 2016151965 A JP2016151965 A JP 2016151965A JP 2015029981 A JP2015029981 A JP 2015029981A JP 2015029981 A JP2015029981 A JP 2015029981A JP 2016151965 A JP2016151965 A JP 2016151965A
Authority
JP
Japan
Prior art keywords
information processing
processing apparatus
server
state
notification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015029981A
Other languages
English (en)
Inventor
学 竹田
Manabu Takeda
学 竹田
真一 田部
Shinichi Tanabe
真一 田部
茂美 橋本
Shigemi Hashimoto
茂美 橋本
貴志 小野寺
Takashi Onodera
貴志 小野寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015029981A priority Critical patent/JP2016151965A/ja
Publication of JP2016151965A publication Critical patent/JP2016151965A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】冗長構成を実現するための複数のサーバを接続するネットワークにおいて異常が発生したことを検出する。
【解決手段】冗長構成システムは、第1サーバA1及び第2サーバB1を含む第1情報処理システム#1(拠点#1)と、第1情報処理システムにネットワークで接続され、かつ、第3サーバA2及び第4サーバB2を含む第2情報処理システム#2(拠点#2)とを有する。第1のサーバA1は、状態通知を、ネットワークを介して第3サーバA2と交換する第1通知部を有する。第2サーバB1は、状態通知を、ネットワークを介して第4サーバB2と交換する第2通知部と、第2通知部が第4サーバB2と状態通知を交換できないことを検出した場合、第1通知部が状態通知を第3サーバA2と交換できているか否かを示す情報を第1通知部から取得し、第1通知部が状態通知を第3サーバA2と交換できているか判定する判定部とを有する。
【選択図】図1

Description

本発明は、冗長化技術に関する。
可用性を高めるためサーバを冗長化したシステムにおいては、処理を実行中のサーバが何らかの原因で停止した場合に、別のサーバが処理を実行する(すなわち、フェイルオーバーの処理を行う)ことで、常に処理が実行される状態が維持される。ここで、処理を実行中のサーバは稼働系のサーバと呼ばれ、処理を実行せずに待機するサーバは待機系のサーバと呼ばれる。
或る文献は、ネットワークに接続された複数のサーバからなるクラスタシステムを開示する。各サーバは、ハートビートパケットによって他のサーバが正常であるか否かを確認し、稼働系のサーバにおいて実行中のアプリケーションに異常が発生した場合、待機系のサーバにおいてアプリケーションを代わりに実行する。
特開2010−103695号公報
冗長構成を実現するための複数のサーバは1つの拠点に設置されるとは限らず、複数の拠点に分散して設置される場合がある。このような場合、拠点と拠点とを接続するネットワークに異常が発生すると、サーバはハートビットパケットを交換することができなくなる。しかし、待機系のサーバは、ハートビートパケットを交換できない原因がネットワークと稼働系のサーバのいずれであるかを特定できず、フェイルオーバーの処理を実行すべきかわからない。上記の従来技術においては、このような問題には着目されていない。
従って、本発明の目的は、1つの側面では、冗長構成を実現するための複数のサーバを接続するネットワークにおいて異常が発生したことを検出するための技術を提供することである。
本発明に係る冗長構成システムは、第1の情報処理装置及び第2の情報処理装置を含む第1の情報処理システムと、第1の情報処理システムにネットワークを介して接続され且つ第3の情報処理装置及び第4の情報処理装置を含む第2の情報処理システムとを有する。そして、上で述べた第1の情報処理装置は、情報処理装置の状態を通知するためのパケットである状態通知を、ネットワークを介して第3の情報処理装置と交換する第1の通知部を有する。そして、第2の情報処理装置は、状態通知を、ネットワークを介して第4の情報処理装置と交換する第2の通知部と、第2の通知部が第4の情報処理装置と状態通知を交換できないことを検出した場合、第1の通知部が状態通知を第3情報処理装置と交換できているか否かを示す情報を第1の通知部から取得し、第1の通知部が状態通知を第3の情報処理装置と交換できているか判定する判定部とを有する。
1つの側面では、冗長構成を実現するための複数のサーバを接続するネットワークにおいて異常が発生したことを検出できるようになる。
図1は、本実施の形態におけるシステムの概要を示す図である。 図2は、サーバの機能ブロック図である。 図3は、状態テーブル格納部に格納される状態テーブルの一例を示す図である。 図4は、状態に関するデータを対向サーバと交換する処理の処理フローを示す図である。 図5は、サーバのアプリケーション状態特定部が実行する処理の処理フローを示す図である。 図6は、状態に関するデータを同一拠点内におけるサーバ間で交換する処理の処理フローを示す図である。 図7は、アプリケーション状態及びサーバ状態を監視する処理の処理フローを示す図である。 図8は、状態テーブルに格納されるデータの一例を示す図である。 図9は、状態テーブルに格納されるデータの一例を示す図である。 図10は、アプリケーション状態及びサーバ状態を監視する処理の処理フローを示す図である。 図11は、状態テーブルに格納されるデータの一例を示す図である。 図12は、コンピュータの機能ブロック図である。
図1に、本実施の形態におけるシステムの概要を示す。図1の例では、WAN(Wide Area Network)であるネットワーク5には、拠点#1の中継装置100と拠点#2の中継装置200とが接続される。中継装置100及び200は、例えば1台のネットワークスイッチ又はルータ等であるが、複数台のネットワークスイッチ又はルータを集約した中継装置であってもよい。
中継装置100には、物理サーバであるサーバA1とサーバB1とサーバC1とが接続され、中継装置200には、物理サーバであるサーバA2とサーバB2とサーバC2とが接続される。サーバA1及びA2はサーバグループAに属し、一方が稼働系サーバになり、他方が待機系サーバになる。同様に、サーバB1及びB2はサーバグループBに属し、一方が稼働系サーバになり、他方が待機系サーバになる。同様に、サーバC1及びC2はサーバグループCに属し、一方が稼働系サーバになり、他方が待機系サーバになる。
図1における破線はハートビートパケットを表す。サーバA1は対向サーバであるサーバA2にハートビートパケットを送信し、サーバA2からハートビートパケットの応答を受信する。サーバA2も対向サーバであるサーバA1にハートビートパケットを送信し、サーバA1からハートビートパケットの応答を受信する。サーバB1は対向サーバであるサーバB2にハートビートパケットを送信し、サーバB2からハートビートパケットの応答を受信する。サーバB2も対向サーバであるサーバB1にハートビートパケットを送信し、サーバB1からハートビートパケットの応答を受信する。サーバC1は対向サーバであるサーバC2にハートビートパケットを送信し、サーバC2からハートビートパケットの応答を受信する。サーバC2も対向サーバであるサーバC1にハートビートパケットを送信し、サーバC1からハートビートパケットの応答を受信する。なお、対向サーバとは、同じグループに属する他のサーバである。
図2に、図1に示したサーバの機能ブロック図を示す。サーバは、ハートビート制御部301と、アプリケーション状態特定部303と、状態管理部305と、状態テーブル格納部307と、アプリケーション309とを含む。
ハートビート制御部301は、ハートビートパケットの送信及びハートビートパケットの応答の受信を行い、ハートビートパケットの応答を状態管理部305に出力する。アプリケーション状態特定部303は、アプリケーション309の状態を特定し、アプリケーション309の状態を示すデータを状態管理部305に出力する。状態管理部305は、ハートビート制御部301が受信した応答及びアプリケーション状態特定部303からの通知に基づき、状態テーブルを更新する。アプリケーション309は、サーバが提供するサービスに関連する処理を実行する。
図3に、状態テーブル格納部307における状態テーブルに格納されるデータの一例を示す。図3の例では、エントリの番号と、サーバの識別情報と、アプリケーション状態を示すデータと、ハートビート状態を示すデータと、更新時刻とが格納される。本実施の形態においては、アプリケーション状態は「ACT」、「SBY」、「UNKNOWN」、「FLT」又は「OUS」のいずれかである。ACTは「稼働」を表し、SBYは「待機」を表し、UNKNOWNは「不明」を表し、FLTは「異常」を表し、OUSは「停止」を表す。ハートビート状態は「OK」、「NG」、「UNKNOWN」又は「OUS」のいずれかである。OKは「正常」を表し、NGは「失敗」を表し、UNKNOWNは「不明」を表し、OUSは「停止」を表す。
次に、図4乃至図11を用いて、本実施の形態におけるサーバが実行する処理について説明する。はじめに、状態に関するデータを対向サーバと交換する処理について説明する。
まず、サーバのハートビート制御部301は、前回ハートビートパケットを送信してから所定時間(例えば数秒)が経過したか判断する(図4:ステップS1)。前回ハートビートパケットを送信してから所定時間が経過していない場合(ステップS1:Noルート)、ハートビートパケットを送信すべきタイミングではないので、ステップS17の処理に移行する。
一方、前回ハートビートパケットを送信してから所定時間が経過した場合(ステップS1:Yesルート)、ハートビート制御部301は、ハートビートパケットを対向サーバに送信し(ステップS3)、送信時刻をメモリに保存しておく。
ハートビート制御部301は、一定時間待機し(ステップS5)、ステップS3において送信したハートビートパケットに対する応答を対向サーバから受信したか判断する(ステップS7)。ハートビートパケットに対する応答は、対向サーバのアプリケーション状態を示すデータ及びハートビート状態を示すデータを含む。
ハートビートパケットに対する応答を受信した場合(ステップS7:Yesルート)、ハートビート制御部301は、ハートビートパケットに対する応答を状態管理部305に出力する。これに応じ、状態管理部305は、応答の内容に従い、状態テーブルに格納された、対向サーバのアプリケーション状態を示すデータ及びハートビート状態を示すデータを更新する(ステップS9)。また、状態管理部305は、状態テーブルに格納された、自サーバのハートビート状態を示すデータを「OK」に設定する(ステップS11)。そしてステップS17の処理に移行する。
一方、ハートビートパケットに対する応答を受信していない場合(ステップS7:Noルート)、ハートビート制御部301は、ハートビートパケットに対する応答を受信していない旨を状態管理部305に通知する。これに応じ、状態管理部305は、状態テーブルに格納された、対向サーバのアプリケーション状態を示すデータ及び対向サーバのハートビート状態を示すデータを「UNKNOWN」に設定する(ステップS13)。また、状態管理部305は、状態テーブルに格納された、自サーバのハートビート状態を示すデータを「NG」に設定する(ステップS15)。
ハートビート制御部301は、対向サーバからハートビートパケットを受信したか判断する(ステップS17)。ハートビートパケットを受信していない場合(ステップS17:Noルート)、ステップS1の処理に戻る。一方、ハートビートパケットを受信した場合(ステップS17:Yesルート)、状態管理部305は、状態テーブルに基づき、自サーバのアプリケーション状態及びハートビート状態を特定し(ステップS19)、ハートビート制御部301に通知する。
ハートビート制御部301は、自サーバのアプリケーション状態を示すデータ及びハートビート状態を示すデータを含む応答を生成し、対向サーバに送信する(ステップS21)。そしてステップS1の処理に戻る。
以上のような処理を実行すれば、各サーバは対向サーバのアプリケーション状態及びハートビート状態を確認できるようになる。
次に、図5を用いて、サーバのアプリケーション状態特定部303が実行する処理について説明する。
まず、サーバのアプリケーション状態特定部303は、前回アプリケーション状態を特定してから所定時間(例えば数秒)が経過したか判断する(図5:ステップS31)。前回アプリケーション状態を特定してから所定時間が経過していない場合(ステップS31:Noルート)、アプリケーション状態特定部303は、一定時間待機し(ステップS37)、ステップS31の処理に戻る。
一方、前回アプリケーション状態を特定してから所定時間が経過した場合(ステップS31:Yesルート)、アプリケーション状態特定部303は、自サーバのアプリケーション309の状態を特定し(ステップS33)、特定時刻をメモリに保存しておく。
アプリケーション状態特定部303は、状態テーブルに格納された、自サーバのアプリケーション状態を示すデータを、ステップS33の処理結果に基づき更新する(ステップS35)。そしてステップS31の処理に戻る。
以上のような処理を実行すれば、自サーバのアプリケーション状態を確認できるようになる。
次に、図6を用いて、状態に関するデータを同一拠点内におけるサーバ間で交換する処理について説明する。
まず、サーバの状態管理部305は、前回状態確認要求を送信してから所定時間(例えば数秒)が経過したか判断する(図6:ステップS41)。前回状態確認要求を送信してから所定時間が経過していない場合(ステップS41:Noルート)、ステップS47の処理に移行する。
一方、前回状態確認要求を送信してから所定時間が経過した場合(ステップS41:Yesルート)、状態管理部305は、状態に関するデータを取得することを要求する状態確認要求を同一拠点内の他サーバに送信し(ステップS43)、送信時刻をメモリに保存しておく。ここで、他サーバとは、同一拠点内におけるサーバのうち自サーバ以外の全サーバのことである。
状態管理部305は、ステップS43において送信した状態確認要求に対する応答を、同一拠点内における他サーバの各々から受信し、応答の内容に従い状態テーブルを更新する(ステップS45)。
状態管理部305は、同一拠点内における他サーバから状態確認要求を受信したか判断する(ステップS47)。同一拠点内における他サーバから状態確認要求を受信していない場合(ステップS47:Noルート)、ステップS41の処理に戻る。
一方、同一拠点内における他サーバから状態確認要求を受信した場合(ステップS47:Yesルート)、状態管理部305は、状態テーブルから自サーバ及び対向サーバのプリケーション状態を示すデータ及びハートビート状態を示すデータを読み出し、読み出したデータを含む応答を生成する(ステップS49)。
状態管理部305は、ステップS49において生成した応答を、受信した状態確認要求の送信元のサーバに送信する(ステップS51)。そしてステップS41の処理に戻る。
以上のような処理を実行すれば、同一拠点内における他サーバ及び他サーバの対向サーバについて、アプリケーション状態及びハートビート状態を確認できるようになる。
次に、図7乃至図11を用いて、アプリケーション状態及びハートビート状態を監視する処理について説明する。
まず、サーバの状態管理部305は、状態テーブルに基づき、自サーバのハートビート状態が「OK」であるか判断する(図7:ステップS61)。自サーバのハートビート状態が「OK」である場合(ステップS61:Yesルート)、状態管理部305は一定時間待機し、ステップS61の処理に戻る。
一方、自サーバのハートビート状態が「OK」ではない(すなわち「NG」である)場合(ステップS61:Noルート)、状態管理部305は、同一拠点内の他サーバから、他サーバのハートビート状態を示すデータを取得する(ステップS63)。ここで、他サーバとは、同一拠点内におけるサーバのうち自サーバ以外の全サーバのことである。なお、ステップS63においては、他サーバの状態を示すデータを状態テーブルから取得してもよい。
状態管理部305は、同一拠点内の全サーバのハートビート状態が「OK」ではないか判断する(ステップS65)。同一拠点内の全サーバのハートビート状態が「OK」ではない場合(ステップS65:Yesルート)、状態管理部305は、拠点間ネットワークであるネットワーク5の異常であると判定する(ステップS67)。処理は端子Aを介して図10のステップS77に移行する。
図8に、ステップS67の時点においてサーバA1の状態テーブルに格納されるデータの一例を示す。サーバA1、サーバB1、及びサーバC1については、対向サーバからハートビートパケットを取得できないので、ハートビート状態が「NG」に設定されている。また、サーバA2、サーバB2、及びサーバC2については、アプリケーション状態及びハートビート状態が「UNKNOWN」に設定されている。
図7の説明に戻り、同一拠点内のいずれかのサーバのハートビート状態が「OK」である場合(ステップS65:Noルート)、状態管理部305は、状態テーブルに基づき、自サーバのアプリケーション状態が「ACT」であるか判断する(ステップS69)。自サーバのアプリケーション状態が「ACT」である場合(ステップS69:Yesルート)、切替処理を行わなくてもよいので、ステップS61の処理に戻る。
一方、自サーバのアプリケーション状態が「ACT」ではない場合(ステップS69:Noルート)、状態管理部305は、同一拠点内の他サーバのうちハートビート状態が「OK」である1台のサーバに、自サーバ(ここでは、便宜上「サーバX」と呼ぶ)の対向サーバのアプリケーション状態を示すデータを取得することを指示する。これに応じ、同一拠点内の他サーバのうちハートビート状態が「OK」である1台のサーバが、対向サーバから、サーバXのアプリケーション状態を示すデータを取得する。そして、サーバXの状態管理部305は、対向サーバのアプリケーション状態を示すデータを取得する(ステップS71)。
状態管理部305は、対向サーバのアプリケーション状態が異常状態であるか判断する(ステップS73)。例えば、アプリケーション状態が「FLT」である場合に異常状態であると判断される。対向サーバのアプリケーション状態が異常状態ではない場合(ステップS73:Noルート)、ステップS61の処理に戻る。一方、対向サーバのアプリケーション状態が異常状態である場合(ステップS73:Yesルート)、状態管理部305は、自サーバを稼働系サーバに切り替えるための切替処理(すなわち、フェイルオーバーの処理)を実行する(ステップS75)。そしてステップS61の処理に戻る。切替処理とは、例えば、自サーバに稼働系サーバの論理アドレスを割り当て、対向サーバに割り当てた論理ドレスを無効にする処理である。切替処理は一般的な処理であるので、詳細な説明は省略する。
図9に、サーバA1に異常が発生した場合にサーバA2の状態テーブルに格納されるデータの一例を示す。図9の例では、サーバA1については、アプリケーション状態及びハートビート状態が「UNKNOWN」に設定されている。また、サーバA2については、ハートビート状態が「NG」に設定され、アプリケーション状態が「SBY」から「ACT」に切り替えられている。
図10のステップS77の処理に移行し、状態管理部305は、状態テーブルに基づき、自サーバのハートビート状態が「OK」であるか判断する(ステップS77)。自サーバのハートビート状態が「OK」である場合(ステップS77:Yesルート)、ネットワーク5の異常は解消したので、処理は端子Bを介してステップS61の処理に戻る。
一方、自サーバのハートビート状態が「OK」ではない(すなわち「NG」である)場合(ステップS77:Noルート)、状態管理部305は、同一拠点内の他サーバから、他サーバのハートビート状態を示すデータを取得する(ステップS79)。ここで、他サーバとは、同一拠点内におけるサーバのうち自サーバ以外の全サーバのことである。
状態管理部305は、同一拠点内の全サーバのハートビート状態が「OK」ではないか判断する(ステップS81)。同一拠点内の全サーバのハートビート状態が「OK」ではない場合(ステップS81:Yesルート)、ネットワーク5の障害が解消していないので、ステップS77の処理に戻る。
一方、同一拠点内のいずれかのサーバのハートビート状態が「OK」である場合(ステップS81:Noルート)、状態管理部305は、状態テーブルに基づき、自サーバのアプリケーション状態が「ACT」であるか判断する(ステップS83)。
自サーバのアプリケーション状態が「ACT」である場合(ステップS83:Yesルート)、切替処理を行わなくてもよいので、処理は端子Bを介してステップS61の処理に戻る。
一方、自サーバのアプリケーション状態が「ACT」ではない場合(ステップS83:Noルート)、状態管理部305は、同一拠点内の他サーバのうちハートビート状態が「OK」である1台のサーバに、自サーバ(ここでは、便宜上「サーバX」と呼ぶ)の対向サーバのアプリケーション状態を示すデータを取得することを指示する。これに応じ、同一拠点内の他サーバのうちハートビート状態が「OK」である1台のサーバが、対向サーバから、サーバXのアプリケーション状態を示すデータを取得する。そして、サーバXの状態管理部305は、対向サーバのアプリケーション状態を示すデータを取得する(ステップS85)。
状態管理部305は、対向サーバのアプリケーション状態が異常状態であるか判断する(ステップS87)。例えば、アプリケーション状態が「FLT」である場合に異常状態であると判断される。対向サーバのアプリケーション状態が異常状態ではない場合(ステップS87:Noルート)、切替処理を行わなくてもよいので、ステップS61の処理に戻る。
一方、対向サーバのアプリケーション状態が異常状態である場合(ステップS87:Yesルート)、状態管理部305は、自サーバを稼働系サーバに切り替えるための切替処理(すなわち、フェイルオーバーの処理)を実行する(ステップS89)。そしてステップS77の処理に戻る。
図11に、ネットワーク5の異常が解消した直後におけるサーバA1の状態テーブルに格納されるデータの一例を示す。サーバA1については、ハートビートパケットを交換できるようになったので、ハートビート状態が「OK」に設定されている。また、サーバA2については、ハートビート状態が「OK」に設定され、アプリケーション状態は「SBY」に設定されている。
以上のような処理を実行すれば、ネットワーク5の異常と対向サーバの異常とを切り分けることができるようになる。これにより、ネットワーク5の異常が発生した際に切替処理を行うことがなくなるので、スプリットブレインシンドロームの発生を防げるようになる。
以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上で説明したサーバの機能ブロック構成は実際のプログラムモジュール構成に一致しない場合もある。
また、上で説明したテーブルの構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
なお、上で述べたサーバは、コンピュータ装置であって、図12に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本発明の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
以上述べた本発明の実施の形態をまとめると、以下のようになる。
本実施の形態の第1の態様に係る冗長構成システムは、第1の情報処理装置及び第2の情報処理装置を含む第1の情報処理システムと、第1の情報処理システムにネットワークを介して接続され且つ第3の情報処理装置及び第4の情報処理装置を含む第2の情報処理システムとを有する。そして、上で述べた第1の情報処理装置は、(A)情報処理装置の状態を通知するためのパケットである状態通知を、ネットワークを介して第3の情報処理装置と交換する第1の通知部を有する。そして、第2の情報処理装置は、(B)状態通知を、ネットワークを介して第4の情報処理装置と交換する第2の通知部と、(C)第2の通知部が第4の情報処理装置と状態通知を交換できないことを検出した場合、第1の通知部が状態通知を第3情報処理装置と交換できているか否かを示す情報を第1の通知部から取得し、第1の通知部が状態通知を第3の情報処理装置と交換できているか判定する判定部とを有する。
第1の通知部が状態通知を第3の情報処理装置と交換できていない場合には、ネットワークに異常が発生した可能性が高い。従って、上で述べたようにすれば、第1の情報処理システムと第2の情報処理システムとを接続するネットワークにおいて異常が発生したことを検出できるようになる。
また、上で述べた判定部は、(c1)第1の通知部が状態通知を第3情報処理装置と交換できている場合、第2の情報処理装置が待機系であるか判定し、(c2)第2の情報処理装置が待機系である場合、第2の情報処理装置を待機系から稼働系に切り替えるための処理を実行してもよい。第1の通知部が状態通知を第3の情報処理装置と交換できている場合には、ネットワークに異常が発生したのではなく、第4の情報処理装置に異常が発生した可能性がある。そこで、上で述べたようにすれば、稼働系である第4の情報処理装置によるサービスの提供が停止することを防止できるようになる。
また、上で述べた判定部は、(c3)第1の通知部が状態通知を第3情報処理装置と交換できている場合、第4の情報処理装置の状態を示す情報を取得した第3の情報処理装置から当該第4の情報処理装置の状態を示す情報を取得することを指示する取得指示を、第1の通知部に送信し、(c4)第1の通知部から第4の情報処理装置の状態を示す情報を取得し、第4の情報処理装置が異常状態であるか判定し、(c5)第4の情報処理装置が異常状態である場合、第2の情報処理装置が待機系であるか判定し、(c6)第2の情報処理装置が待機系である場合、第2の情報処理装置を待機系から稼働系に切り替えるための処理を実行してもよい。上で述べたようにすれば、稼働系である第4の情報処理装置が異常状態であることを確認できるので、第2の情報処理装置および第4の情報処理装置が両方稼働系になることを回避できるようになる。
また、上で述べた第2の情報処理装置は、(D)第1乃至第4の情報処理装置の各々について、当該情報処理装置の状態を示す情報及び当該情報処理装置が状態通知を交換できているか否かを示す情報を格納する状態情報格納部をさらに有してもよい。これにより、判定を適切に行えるようになる。
本実施の形態の第2の態様に係る冗長構成制御方法は、第1の情報処理装置及び第2の情報処理装置を含む第1の情報処理システムと、第1の情報処理システムにネットワークを介して接続され且つ第3の情報処理装置及び第4の情報処理装置を含む第2の情報処理システムとを有する冗長構成システムにおいて実行される。そして、本冗長構成制御方法は、(E)第1の情報処理装置は、情報処理装置の状態を通知するためのパケットである状態通知を、ネットワークを介して第3の情報処理装置と交換し、(F)第2の情報処理装置は、状態通知を、ネットワークを介して第4の情報処理装置と交換し、(G)第2の情報処理装置は、第4の情報処理装置と状態通知を交換できない場合、第1の情報処理装置が状態通知を第3情報処理装置と交換できているか否かを示す情報を第1の情報処理装置から取得し、第1の情報処理装置が状態通知を第3の情報処理装置と交換できているか判定する処理を含む。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
第1の情報処理装置及び第2の情報処理装置を含む第1の情報処理システムと、
前記第1の情報処理システムにネットワークを介して接続され且つ第3の情報処理装置及び第4の情報処理装置を含む第2の情報処理システムと、
を有し、
前記第1の情報処理装置は、
情報処理装置の状態を通知するためのパケットである状態通知を、前記ネットワークを介して前記第3の情報処理装置と交換する第1の通知部
を有し、
前記第2の情報処理装置は、
前記状態通知を、前記ネットワークを介して前記第4の情報処理装置と交換する第2の通知部と、
前記第2の通知部が前記第4の情報処理装置と前記状態通知を交換できないことを検出した場合、前記第1の通知部が前記状態通知を前記第3情報処理装置と交換できているか否かを示す情報を前記第1の通知部から取得し、前記第1の通知部が前記状態通知を前記第3の情報処理装置と交換できているか判定する判定部と、
を有する冗長構成システム。
(付記2)
前記判定部は、
前記第1の通知部が前記状態通知を前記第3情報処理装置と交換できている場合、前記第2の情報処理装置が待機系であるか判定し、
前記第2の情報処理装置が待機系である場合、前記第2の情報処理装置を待機系から稼働系に切り替えるための処理を実行する、
付記1記載の冗長構成システム。
(付記3)
前記判定部は、
前記第1の通知部が前記状態通知を前記第3情報処理装置と交換できている場合、前記第4の情報処理装置の状態を示す情報を取得した前記第3の情報処理装置から当該第4の情報処理装置の状態を示す情報を取得することを指示する取得指示を、前記第1の通知部に送信し、
前記第1の通知部から前記第4の情報処理装置の状態を示す情報を取得し、前記第4の情報処理装置が異常状態であるか判定し、
前記第4の情報処理装置が異常状態である場合、前記第2の情報処理装置が待機系であるか判定し、
前記第2の情報処理装置が待機系である場合、前記第2の情報処理装置を待機系から稼働系に切り替えるための処理を実行する、
付記1記載の冗長構成システム。
(付記4)
前記第2の情報処理装置は、
前記第1乃至第4の情報処理装置の各々について、当該情報処理装置の状態を示す情報及び当該情報処理装置が前記状態通知を交換できているか否かを示す情報を格納する状態情報格納部
をさらに有する付記1乃至3のいずれか記載の冗長構成システム。
(付記5)
第1の情報処理装置及び第2の情報処理装置を含む第1の情報処理システムと、前記第1の情報処理システムにネットワークを介して接続され且つ第3の情報処理装置及び第4の情報処理装置を含む第2の情報処理システムとを有する冗長構成システムにおいて実行される冗長構成制御方法であって、
前記第1の情報処理装置は、情報処理装置の状態を通知するためのパケットである状態通知を、前記ネットワークを介して前記第3の情報処理装置と交換し、
前記第2の情報処理装置は、前記状態通知を、前記ネットワークを介して前記第4の情報処理装置と交換し、
前記第2の情報処理装置は、前記第4の情報処理装置と前記状態通知を交換できない場合、前記第1の情報処理装置が前記状態通知を前記第3情報処理装置と交換できているか否かを示す情報を前記第1の情報処理装置から取得し、前記第1の情報処理装置が前記状態通知を前記第3の情報処理装置と交換できているか判定する、
処理を含む冗長構成制御方法。
100,200 中継装置 A1,A2,B1,B2,C1,C2 サーバ
301 ハートビート制御部 303 アプリケーション状態特定部
305 状態管理部 307 状態テーブル格納部
309 アプリケーション

Claims (5)

  1. 第1の情報処理装置及び第2の情報処理装置を含む第1の情報処理システムと、
    前記第1の情報処理システムにネットワークを介して接続され且つ第3の情報処理装置及び第4の情報処理装置を含む第2の情報処理システムと、
    を有し、
    前記第1の情報処理装置は、
    情報処理装置の状態を通知するためのパケットである状態通知を、前記ネットワークを介して前記第3の情報処理装置と交換する第1の通知部
    を有し、
    前記第2の情報処理装置は、
    前記状態通知を、前記ネットワークを介して前記第4の情報処理装置と交換する第2の通知部と、
    前記第2の通知部が前記第4の情報処理装置と前記状態通知を交換できないことを検出した場合、前記第1の通知部が前記状態通知を前記第3情報処理装置と交換できているか否かを示す情報を前記第1の通知部から取得し、前記第1の通知部が前記状態通知を前記第3の情報処理装置と交換できているか判定する判定部と、
    を有する冗長構成システム。
  2. 前記判定部は、
    前記第1の通知部が前記状態通知を前記第3情報処理装置と交換できている場合、前記第2の情報処理装置が待機系であるか判定し、
    前記第2の情報処理装置が待機系である場合、前記第2の情報処理装置を待機系から稼働系に切り替えるための処理を実行する、
    請求項1記載の冗長構成システム。
  3. 前記判定部は、
    前記第1の通知部が前記状態通知を前記第3情報処理装置と交換できている場合、前記第4の情報処理装置の状態を示す情報を取得した前記第3の情報処理装置から当該第4の情報処理装置の状態を示す情報を取得することを指示する取得指示を、前記第1の通知部に送信し、
    前記第1の通知部から前記第4の情報処理装置の状態を示す情報を取得し、前記第4の情報処理装置が異常状態であるか判定し、
    前記第4の情報処理装置が異常状態である場合、前記第2の情報処理装置が待機系であるか判定し、
    前記第2の情報処理装置が待機系である場合、前記第2の情報処理装置を待機系から稼働系に切り替えるための処理を実行する、
    請求項1記載の冗長構成システム。
  4. 前記第2の情報処理装置は、
    前記第1乃至第4の情報処理装置の各々について、当該情報処理装置の状態を示す情報及び当該情報処理装置が前記状態通知を交換できているか否かを示す情報を格納する状態情報格納部
    をさらに有する請求項1乃至3のいずれか1つ記載の冗長構成システム。
  5. 第1の情報処理装置及び第2の情報処理装置を含む第1の情報処理システムと、前記第1の情報処理システムにネットワークを介して接続され且つ第3の情報処理装置及び第4の情報処理装置を含む第2の情報処理システムとを有する冗長構成システムにおいて実行される冗長構成制御方法であって、
    前記第1の情報処理装置は、情報処理装置の状態を通知するためのパケットである状態通知を、前記ネットワークを介して前記第3の情報処理装置と交換し、
    前記第2の情報処理装置は、前記状態通知を、前記ネットワークを介して前記第4の情報処理装置と交換し、
    前記第2の情報処理装置は、前記第4の情報処理装置と前記状態通知を交換できない場合、前記第1の情報処理装置が前記状態通知を前記第3情報処理装置と交換できているか否かを示す情報を前記第1の情報処理装置から取得し、前記第1の情報処理装置が前記状態通知を前記第3の情報処理装置と交換できているか判定する、
    処理を含む冗長構成制御方法。
JP2015029981A 2015-02-18 2015-02-18 冗長構成システム及び冗長構成制御方法 Pending JP2016151965A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015029981A JP2016151965A (ja) 2015-02-18 2015-02-18 冗長構成システム及び冗長構成制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015029981A JP2016151965A (ja) 2015-02-18 2015-02-18 冗長構成システム及び冗長構成制御方法

Publications (1)

Publication Number Publication Date
JP2016151965A true JP2016151965A (ja) 2016-08-22

Family

ID=56696527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015029981A Pending JP2016151965A (ja) 2015-02-18 2015-02-18 冗長構成システム及び冗長構成制御方法

Country Status (1)

Country Link
JP (1) JP2016151965A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018037535A1 (ja) * 2016-08-25 2018-03-01 富士通株式会社 生存管理プログラム、生存管理方法、および生存管理装置
JP2018056633A (ja) * 2016-09-26 2018-04-05 日本電気株式会社 クラスタシステム、サーバ、サーバの動作方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018037535A1 (ja) * 2016-08-25 2018-03-01 富士通株式会社 生存管理プログラム、生存管理方法、および生存管理装置
JP2018056633A (ja) * 2016-09-26 2018-04-05 日本電気株式会社 クラスタシステム、サーバ、サーバの動作方法、及びプログラム

Similar Documents

Publication Publication Date Title
US7225356B2 (en) System for managing operational failure occurrences in processing devices
CN110224871A (zh) 一种Redis集群的高可用方法及装置
US8112518B2 (en) Redundant systems management frameworks for network environments
WO2017118080A1 (zh) 一种中央处理器cpu热移除、热添加方法及装置
TW201340649A (zh) 具有改良之故障處理之多片式網路流量管理設備及其方法
US8370897B1 (en) Configurable redundant security device failover
CN103731287A (zh) 一种故障接管服务器选择方法
JP2016151965A (ja) 冗長構成システム及び冗長構成制御方法
JP2014191401A (ja) 処理装置、制御プログラム、及び制御法
JP2011203941A (ja) 情報処理装置、監視方法、および監視プログラム
JP4806382B2 (ja) 冗長化システム
CN114296995B (zh) 一种服务器自主修复bmc的方法、系统、设备及存储介质
JP2019153055A (ja) クラスタシステム、情報処理装置、クラスタ監視方法及びクラスタ監視プログラム
JP2008299658A (ja) 監視制御システム
JP2015114952A (ja) ネットワークシステム、監視制御装置およびソフトウェア検証方法
TW201408885A (zh) 風扇共用控制系統及方法
JP5631285B2 (ja) 障害監視システムおよび障害監視方法
JP5691248B2 (ja) タスク引継プログラム、処理装置及びコンピュータ・システム
JP5653947B2 (ja) ネットワーク管理システム、ネットワーク管理装置、ネットワーク管理方法及びネットワーク管理プログラム
KR101883251B1 (ko) 가상 시스템에서 장애 조치를 판단하는 장치 및 그 방법
US20210247996A1 (en) Service continuation system and service continuation method
WO2014010021A1 (ja) 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム
US11947431B1 (en) Replication data facility failure detection and failover automation
JP6601198B2 (ja) 中継装置、設定方法、設定プログラム及び情報処理システム
JP6112205B2 (ja) 情報処理システム、装置、方法及びプログラム