JP2004171370A - Address control system and method between client/server in redundant constitution - Google Patents

Address control system and method between client/server in redundant constitution Download PDF

Info

Publication number
JP2004171370A
JP2004171370A JP2002337987A JP2002337987A JP2004171370A JP 2004171370 A JP2004171370 A JP 2004171370A JP 2002337987 A JP2002337987 A JP 2002337987A JP 2002337987 A JP2002337987 A JP 2002337987A JP 2004171370 A JP2004171370 A JP 2004171370A
Authority
JP
Japan
Prior art keywords
server
client
address
isolated
active
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002337987A
Other languages
Japanese (ja)
Inventor
Etsushi Yoshida
悦士 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002337987A priority Critical patent/JP2004171370A/en
Publication of JP2004171370A publication Critical patent/JP2004171370A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To prevent both of an active server and a reserve server in duplex servers from acting as active servers in detecting a fault caused by health check between the active server and the reserve server. <P>SOLUTION: The active server 1 comprises an isolation determination part 112 for determining the isolation of the server 1 itself by checking the connection of a client 3 through a LAN 901 in detecting the abnormality of the reserve server 2 by health check of a monitoring part 113 and an IP floating control part 111 for invalidating a shared IP address when the isolation is determined. The reserve server 2 comprises an isolation determination part 212 for determining the isolation of the server 2 itself by checking the connection of the client 3 through the LAN 901 when the down of the server 1 is determined by checking the connection of the server 1 through the LAN 901 in detecting the abnormality of the server 1 by the health check of the monitoring part 213 and an IP floating control part 211 for validating the shared IP address when no isolation is determined. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、冗長構成におけるクライアント/サーバ間のアドレス制御方式および方法に関し、特に、現用系サーバおよび待機系サーバとの間でヘルスチェックを行う冗長構成におけるクライアント/サーバ間のアドレス制御方式および方法に関する。
【0002】
【従来の技術】
従来、サーバの二重化構成でサーバ間のヘルスチェックを行って待機系のサーバを現用系に切り替える方式として、例えば、特開2001−344125号公報および特開2001−344125号公報に開示されている。この特開2001−344125号公報によれば、予備系のサーバが現用系のサーバのヘルスチェックを行い、ヘルスチェックによりダウンと認識した場合には、自サーバの論理アドレスの活性化を行うことで自サーバを予備系から現用系に切り替え、LAN伝送路と別の複数の回線を介して相手のサーバの論理アドレスの活性化を行うことで相手サーバを現用系から予備系に切り替えている。
【0003】
また、特開2000−324121号公報によれば、ヘルスチェック用の回線を介して現用系サーバおよび予備系サーバともお互いにヘルスチェックを行い、障害を検出すると、複数のLAN経路を介してヘルスチェックを行い、全て失敗したときに相手サーバの障害と判断する。待機系のサーバが相手サーバと判断した場合には、予備系から現用系に切り替える。
【0004】
【特許文献1】
特開2001−344125号公報
【特許文献2】
特開2000−324121号公報
【0005】
【発明が解決しようとする課題】
しかしながら、上記の特開2001−344125号公報によると、待機系のサーバがヘルスチェックにより相手サーバの障害を検出した後、相手のサーバに対して複数の経路を使用して現用系から予備系に切り替えるように指示を出すが、相手サーバの通信障害の場合、相手サーバに切替の指示が伝達されないため、両方のサーバが現用系になるという問題点が発生する。
【0006】
また、上記の特開2001−344125号公報によると、LANと違う複数の回線を準備する必要があるため、通信ソフトおよび通信ソフトに対応したハードウェアを数種類揃える必要があるため、コスト高となる問題点がある。
【0007】
また、上記の特開2000−324121号公報によると、現用系のサーバに通信障害が発生した場合、サーバ間のヘルスチェックがエラーとなるため、LAN経路を介してヘルスチェックを行う。ところがLAN経路を介してヘルスチェックを行っても相手サーバの障害と判断するため、両方のサーバは相手方がダウンしたと判断し、両方のサーバがともに現用系に遷移する。すなわち、二重化されたサーバが両系とも現用系になるため、IPフローティング制御方式を使用した二重化構成では、2重化された2台のサーバが同じIPアドレスを持つという問題点が発生する。
【0008】
本発明の目的は、上記問題点を鑑み、現用系サーバと予備系サーバとの間でヘルスチェックによる障害を検出した場合に、二重化サーバが両系とも現用系になるのを防ぐことにある。
【0009】
【課題を解決するための手段】
上記目的を達成するために、本発明の冗長構成におけるクライアント/サーバ間のアドレス制御方式は、第1のネットワークに複数のクライアントが接続され、同一のIPアドレスを持つ現用系サーバと待機系サーバにより構成され、第2のネットワークを介して現用系サーバと待機系サーバとの間でお互いにヘルスチェックを行う冗長構成におけるクライアント/サーバ間のアドレス制御方式において、前記現用系サーバは、前記ヘルスチェックにより待機系サーバの異常を検出すると、前記第1のネットワークを介して前記クライアントの接続確認を行うことで自サーバが孤立しているかどうかの判定を行う第1の孤立判定手段と、前記第1の孤立判定手段で孤立していると判定した場合に前記IPアドレスを無効化することで待機状態に遷移する第1の遷移手段と、を有し、前記待機系サーバは、前記ヘルスチェックにより待機系サーバの異常を検出すると、前記第1のネットワークを介して前記現用系サーバの接続確認を行うことで現用系サーバがダウンしているかどうかを判定するダウン判定手段と、前記ダウン判定手段でダウンと判定した場合に前記第1のネットワークを介して前記クライアントの接続確認を行うことで自サーバが孤立しているかどうかの判定を行う第2の孤立判定手段と、前記第2の孤立判定手段で孤立していないと判定した場合に前記IPアドレスを有効化することで現用状態に遷移する第2の遷移手段と、を有することを特徴としている。
【0010】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方式において、前記第1の孤立判定手段は、pingコマンドを実行することにより前記クライアントの接続確認を行う手段を有し、前記ダウン判定手段は、前記pingコマンドを実行することにより前記現用系のサーバの接続確認を行う手段を有し、前記第2の孤立判定手段は、前記pingコマンドを実行することにより前記クライアントの接続確認を行う手段を有することを特徴としている。
【0011】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方式において、前記第1の遷移手段は、前記第1の孤立判定手段で孤立していると判定した場合にMACアドレスを無効化する手段を有し、前記第2の遷移手段は、前記第2の孤立判定手段で孤立していないと判定した場合に前記MACアドレスを有効化する手段を有することを特徴としている。
【0012】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方式において、前記第1および第2の孤立判定手段は、複数の前記クライアントうち1台でも確認が取れれば自サーバが孤立していないと判断する手段を有することを特徴としている。
【0013】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方式において、前記第1および第2の孤立判定手段は、複数の前記クライアントうち1台でも確認が取れなければ自サーバが孤立していると判断する手段を有することを特徴としている。
【0014】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方式において、前記第1および第2の孤立判定手段は、複数の前記クライアントうち予め決められた台数以上の確認が取れなければ自サーバが孤立していると判断する手段を有することを特徴としている。
【0015】
また、本発明の冗長構成におけるクライアント/サーバ間のアドレス制御方法は、第1のネットワークに複数のクライアントが接続され、同一のIPアドレスを持つ現用系サーバと待機系サーバにより構成され、第2のネットワークを介して現用系サーバと待機系サーバとの間でお互いにヘルスチェックを行う冗長構成におけるクライアント/サーバ間のアドレス制御方法であって、前記現用系サーバは、前記ヘルスチェックにより待機系サーバの異常を検出すると、前記第1のネットワークを介して前記クライアントの接続確認を行うことで自サーバが孤立しているかどうかの第1の判定を行い、前記第1の判定の結果、孤立していると判定した場合に前記IPアドレスを無効化することで待機状態に遷移し、前記待機系サーバは、前記ヘルスチェックにより待機系サーバの異常を検出すると、前記第1のネットワークを介して前記現用系サーバの接続確認を行うことで現用系サーバがダウンしているかどうかを第2の判定を行い、前記第2の判定の結果、ダウンと判定した場合に前記第1のネットワークを介して前記クライアントの接続確認を行うことで自サーバが孤立しているかどうかの第3の判定を行い、前記第3の判定の結果、孤立していないと判定した場合に前記IPアドレスを有効化することで現用状態に遷移することを特徴としている。
【0016】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方法において、前記第1の判定は、pingコマンドを実行することにより前記クライアントの接続確認を行い、前記第2の判定は、前記pingコマンドを実行することにより前記現用系のサーバの接続確認を行い、前記第3の判定は、前記pingコマンドを実行することにより前記クライアントの接続確認を行うことを特徴としている。
【0017】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方法において、前記待機状態に遷移する場合は、前記第1の判定で孤立している判定した場合にMACアドレスを無効化にし、前記現用状態に遷移する場合は、前記第3の判定で孤立していないと判定した場合に前記MACアドレスを有効化することを特徴としている。
【0018】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方法において、前記第1および第3の判定は、複数の前記クライアントうち1台でも確認が取れれば自サーバが孤立していないと判断することを特徴としている。
【0019】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方法において、前記第1および第3判定は、複数の前記クライアントうち1台でも確認が取れなければ自サーバが孤立していると判断することを特徴としている。
【0020】
更に、上記の冗長構成におけるクライアント/サーバ間のアドレス制御方法において、前記第1および第3の判定は、複数の前記クライアントうち予め決められた台数以上の確認が取れなければ自サーバが孤立していると判断することを特徴としている。
【0021】
【発明の実施の形態】
次に、本発明の実施の形態について、図面を参照して説明する。
【0022】
図1を参照すると、2台の二重化構成されたサーバ1、サーバ2と、ユーザの操作端末であるクライアント3と、既存運用の運用LAN901と、二重化構成されたサーバ1とサーバ2の間のヘルスチェック用のLAN902と、通信機器4とから構成されている。
【0023】
サーバ1は、図示していないプロセッサ(CPU)によりプログラム制御で動作する制御部11と、LAN901とのデータやり取りを行うLANインタフェース部12と、LAN901とのデータやり取りを行うLANインタフェース部13と、サーバ2とのデータのやり取りを行うLANインタフェース部14と、時間監視を行うタイマ15とか構成される。
【0024】
サーバ2は、図示していないプロセッサ(CPU)によりプログラム制御で動作する制御部21と、LAN901とのデータやり取りを行うLANインタフェース部22と、LAN901とのデータやり取りを行うLANインタフェース部23と、サーバ1とのデータのやり取りを行うLANインタフェース部24と、時間監視を行うタイマ25とか構成される。
【0025】
2重化されたサーバ1およびサーバ2は、同一のIPアドレスでLAN901と接続されており、現用状態(現用系)となるサーバがそのIPアドレスを有効にするIPアドレスの制御方式を持ち(以降、本制御方式のことを、IPフローティング方式と呼び、そのIPアドレスをフローティングIPアドレスと呼ぶ)、待機状態(待機系)となるサーバがフローティングIPアドレスを無効にする。従って、クライアント3は、そのフローティングIPアドレスに接続することにより、現用状態のサーバへ接続可能な構成となっている。
【0026】
サーバ1の制御部11は、IPフローティング制御部111と、孤立判定部112と、監視部113とを含んでいる。
【0027】
サーバ1のIPフローティング部111は、立ち上げ時に現用状態にする場合にはLANインタフェース部13にフローティングIPアドレスを割り当て(有効化して)LANインタフェース部13内部の送受信回路を有効化にする手段と、待機状態で孤立判定部112がサーバ2を孤立していると判断した場合にはLANインタフェース部13にフローティングIPアドレスを割り当て(有効化して)LANインタフェース部13内部の送受信回路を有効化にする手段と、現用状態で孤立判定部112がサーバ1自身孤立していると判断した場合にはフローティングIPアドレスを解除(無効化)してLANインタフェース部13内部の送受信回路を無効化することで待機状態にする手段と、を有する。
【0028】
サーバ1の孤立判定部112は、待機状態で監視部113がサーバ2の異常を検出した場合にサーバ2がダウンしていないかの判定を、pingコマンドを実行することによりLAN901を介してサーバ2の接続確認を行う手段と、待機状態でサーバ2がダウンしていると判定した場合または現用状態で監視部113がサーバ2の異常を検出した場合にpingコマンドを実行することによりLAN901を介してクライアント3との接続状態を確認することでサーバ1自身が孤立していないかを判定する手段と、を有する。
【0029】
サーバ1の監視部113は、タイマ15のタイマ割り込みにより、ヘルスチェック用のLAN902を介してpingコマンドを使用(実行)してサーバ2のヘルスチェックを行う手段を有する。ping(Packet Internet Groper)コマンドとは、ネットワーク上で機器が繋がっているかを確認するコマンドである。すなわち、監視部113がpingコマンドを実行することでICMP(Internet Message Protocol)エコー要求を出し、その応答としてサーバ2が返すICMPエコー応答の確認を行う。
【0030】
サーバ1のLANインタフェース部12は、サーバ2と区別するためにサーバ1の実IPアドレスおよびその実IPアドレスに対応したMACアドレスが割り当てられている。なお、本発明では、このLANインタフェース部12が存在しなくても良い。
【0031】
サーバ1のLANインタフェース部13には、LANインタフェース部23と同じMACアドレスが割り当てられており、サーバ1が現用状態になる場合に、フローティングIPアドレスが割り当て送受信回路を有効化(LANインタフェース部13内の送受信回路を有効化することでMACアドレスも有効化となる)する。この場合、フローティングIPアドレスをLANインタフェース部13内に予め設定し、待機状態すなわちフローティングIPアドレスを無効化(LANインタフェース部13内の送受信回路の無効化すなわちMACアドレスの無効化も含む)にしておき、現用状態になる場合にフローティングIPアドレスを有効化(LANインタフェース部13内の送受信回路の有効化すなわちMACアドレスの有効化も含む)してLAN901と送受信ができるようにしても良い。
【0032】
サーバ1のLANインタフェース部14は、ヘルスチェック用としてのサーバ1のIPアドレスおよびそのIPアドレスに対応したMACアドレスが割り当てられている。
【0033】
サーバ1のタイマ15は、起動をかけられると、予め決められた時間後に制御部11に割り込みをかける。
【0034】
サーバ2の制御部21は、IPフローティング制御部211と、孤立判定部212と、監視部213とを含んでいる。
【0035】
サーバ2のIPフローティング部211は、立ち上げ時に現用状態にする場合にはLANインタフェース部23にフローティングIPアドレスを割り当て(有効化して)LANインタフェース部23内部の送受信回路を有効化にする手段と、待機状態で孤立判定部212がサーバ1を孤立していると判断した場合にはLANインタフェース部23にフローティングIPアドレスを割り当て(有効化して)LANインタフェース部23内部の送受信回路を有効化にする手段と、現用状態で孤立判定部212がサーバ2自身孤立していると判断した場合にはフローティングIPアドレスを解除(無効化)してLANインタフェース部23内部の送受信回路を無効化することで待機状態にする手段と、を有する。
【0036】
サーバ2の孤立判定部212は、待機状態で監視部213がサーバ1の異常を検出した場合にサーバ1がダウンしていないかの判定を、pingコマンドを実行することによりLAN901を介してサーバ1の接続確認を行う手段と、待機状態でサーバ1がダウンしていると判定した場合または現用状態で監視部213がサーバ1の異常を検出した場合にpingコマンドを実行することによりLAN901を介してクライアント3との接続状態を確認することでサーバ2自身が孤立していないかを判定する手段と、を有する。
【0037】
サーバ2の監視部213は、タイマ25のタイマ割り込みにより、ヘルスチェック用のLAN902を介してpingコマンドを使用(実行)してサーバ2のヘルスチェックを行う手段を有する。すなわち、監視部213がpingコマンドを実行することでICMP(Internet Message Protocol)エコー要求を出し、その応答としてサーバ2が返すICMPエコー応答の確認を行う。
【0038】
サーバ2のLANインタフェース部22は、サーバ1と区別するためにサーバ1の実IPアドレスおよびその実IPアドレスに対応したMACアドレスが割り当てられている。なお、本発明では、このLANインタフェース部22が存在しなくても良い。
【0039】
サーバ2のLANインタフェース部23には、LANインタフェース部13と同じMACアドレスが割り当てられており、サーバ2が現用状態になる場合に、フローティングIPアドレスが割り当て送受信回路を有効化(送受信回路を有効化することでMACアドレスも有効化となる)する。この場合、フローティングIPアドレスをLANインタフェース部23内に予め設定し、待機状態すなわちフローティングIPアドレスを無効化(LANインタフェース部23内の送受信回路の無効化すなわちMACアドレスの無効化も含む)にしておき、現用状態になる場合にはフローティングIPアドレスを有効化(LANインタフェース部23内の送受信回路の有効化すなわちMACアドレスの有効化も含む)してLAN901と送受信ができるようにしても良い。
【0040】
サーバ2のLANインタフェース部24は、ヘルスチェック用としてのサーバ2のIPアドレスおよびそのIPアドレスに対応したMACアドレスが割り当てられている。
【0041】
サーバ2のタイマ25は、起動をかけられると、予め決められた時間後に制御部21に割り込みをかける。
【0042】
なお、LANインタフェース部13とLANインタフェース部23には、運用状態になる場合は、どちらかが有効となり、同じフローティングIPアドレスと同じMACアドレスが使用されることになる。
【0043】
クライアント3は、例えば、サーバ1とサーバ2が管理している共有データベースにアクセスするための通信用アプリケーションソフトウェアであるアプリケーション31を搭載している。
【0044】
次に、図1〜図3を参照して、本発明の実施の形態の動作について図面を参照して説明する。
【0045】
0系側のサーバ1が起動されると、サーバ1の制御部11は、LANインタフェース部12に対してサーバ1の実IPアドレスを割り当て、IPフローティング制御部111を起動する。IPフローティング制御部111がLANインタフェース部13に対してフローティングIPアドレスを割り当てることで、制御部11は、IPフローティング制御部111が正常に立ちあがったことを確認すると現用状態へ遷移する。更に、制御部11は、タイマ15を起動することにより、孤立判定部112および監視部113を起動する(図2のステップA11〜A15)。
【0046】
一方、1系側のサーバ2が起動されると、サーバ2の制御部21は、LANインタフェース部22に対してサーバ1の実IPアドレスを割り当て、IPフローティング制御部211を起動する。IPフローティング制御部211がLANインタフェース部23に対してフローティングIPアドレスを割り当てないことで、制御部21は、IPフローティング制御部4が正常に立ちあがったことを確認すると待機状態へ遷移する。更に、制御部21は、タイマ25を起動することにより、孤立判定部212および監視部213を起動する(図4のステップB11〜B14)。
【0047】
アプリケーション31を実行するクライアント3は、サーバと通信を行うために、フローティングIPアドレスを使用してサーバにアクセスすることになるが、サーバの状態を意識することなく、現用状態のサーバ1へアクセス可能になる。
【0048】
一方、サーバ1の監視部113は、定期的にタイマ15のタイマ割り込みによりサーバ2のヘルスチェックを行うために、pingコマンドを実行すると、LANインタフェース部14、LAN902を介して、サーバ2宛にICMPエコー要求を送信する。サーバ2の制御部21は、LANインタフェース部902を介してICMPエコー要求を受信するとICMPエコー応答を返す。すると、サーバ1の監視部113は、正常と判断し、タイマ15を再起動して終了する(図3のステップA21,A22,A29)。
【0049】
同様に、サーバ2の監視部213は、定期的にタイマ25のタイマ割り込みによりサーバ1のヘルスチェックを行うために、pingコマンドを実行すると、LANインタフェース部24、LAN902を介して、サーバ1宛にICMPエコー要求を送信する。サーバ1の制御部11は、LANインタフェース部902を介してICMPエコー要求を受信するとICMPエコー応答を返す。すると、サーバ2の監視部213は、正常と判断し、タイマ25を再起動して終了する(図5のステップB21,B22,B29)。
【0050】
このように、ヘルスチェックの結果が正常であれば、サーバ1の監視部およびサーバ2の監視部213は、定期的にタイマ割り込みによりヘルスチェックを行っているが、今、サーバ1に通信障害が発生したと仮定する。
【0051】
現用状態となっているサーバ1において、タイマ15によるタイマ割込みが制御部11に発生すると、制御部11の監視部113は、サーバ2のヘルスチェックを行うために、サーバ2に対してLANインタフェース部14およびLAN902を介してpingコマンドを発行すると、サーバ2から応答が返って来ないため、異常と判断して、孤立判定部112へ通知する(ステップA21,A22,A23)。
【0052】
通知を受けた孤立判定部112は、pingコマンドを実行して、クライアント3に対してLANインタフェース部13およびLAN901を介してICMPエコー要求を送信すると、サーバ1の通信障害のため、クライアント3からICMPエコー応答が返って来ないため、自分自身が孤立し、サーバ2が現用状態に遷移したと判断して、IPフローティング制御部111へ通知する(異常通知による処理)。異常通知を受けたIPフローティング制御部11は、LANインタフェース部13に対して、フローティングIPアドレスを無効化すると共に、受信できないように送受信回路の無効化も行う。すると、制御部11は、待機状態に遷移して終了する(ステップA24〜A28)。
【0053】
一方、待機状態となっているサーバ2において、タイマ25によるタイマ割込みが制御部21に発生すると、制御部21の監視部213は、サーバ1のヘルスチェックを行うために、pingコマンドを実行すると、サーバ1に対してLANインタフェース部24およびLAN902を介してICMPエコー要求を送信しても、サーバ1から応答が返って来ないため、異常と判断して、孤立判定部212へ通知する(ステップB21,B22,B23)。
【0054】
通知を受けた孤立判定部212は、pingコマンドを実行することによりサーバ1に対してLANインタフェース部23およびLAN901を介してICMPエコー要求を送信すると、サーバ1からICMPエコー応答が返って来ないため、サーバ1がダウンしたと判断し、更に、pingコマンドを実行することによりクライアント3に対してLANインタフェース部23およびLAN901を介してICMPエコー要求送信することでサーバ2自身の孤立の確認を行う(ステップB24〜B27)。
【0055】
ステップB27において、クライアント3からICMPエコー応答が返ってくると、サーバ2の孤立判定部212は、サーバ2自身は正常と判断し、IPフローティング制御部211へ通知する(正常通知による処理)。サーバ2自身の正常通知を受けたIPフローティング制御部211は、LANインタフェース部23に対して、フローティングIPアドレスを有効化すると共に、受信できるように送受信回路の有効化も行う。すると、制御部21は、現用状態に遷移して、監視部213にタイマ25を再起動させて終了する(ステップB26〜B31)。
【0056】
一方、アプリケーション31を実行するクライアント3は、前回と同じようにサーバと通信を行うために、フローティングIPアドレスを使用してサーバにアクセスすることになるが、サーバの状態を意識することなく、今度は現用状態に切り替わったサーバ2へアクセス可能になる。
【0057】
ステップB27において、サーバ1からICMPエコー応答が返ってくると、サーバ2の孤立判定部212は、サーバ1は正常だと判断し、タイマを再起動して終了する(ステップB31)。
【0058】
すなわち、図6で示すように、サーバ1は現用状態から待機状態に遷移し、サーバ2は待機状態から現用状態に遷移するが、フローティングIPアドレスおよびMACアドレスがサーバ1からサーバ2も遷移したことになるので、クライアント3は、フローティングIPアドレス(およびMACアドレス)で、サーバにアクセスしたとしても、異常なサーバ1にアクセスすることなく、正常なサーバ2にアクセスすることができる。
【0059】
更に、ダウンしたサーバ1を修理し、立ち上げると、サーバ1は、待機状態となり、その後サーバ2で以上が検出されるとサーバ1とサーバ2が逆になるだけで上記で説明した動作と同じになることは言うまでもない。
【0060】
上記説明では、孤立判定の為に現用状態のサーバ1とクライアント3との間でpingコマンドを使用して接続確認を行っているが、現用状態のサーバ1からの接続確認を行う機器は、サーバ1またはサーバ2との通信を行うクライアントに限定する必要なく、LAN901に接続された通信機器であれば良く、現用状態のサーバ1からのpingコマンドによるICMPエコー要求に応答できる通信機器に置換え可能であることは言うまでもない。
【0061】
また、現用状態のサーバ1が孤立判定する際にpingコマンドによる接続確認は、複数のクライアントおよびその他通信機器に対してLAN901上の現用状態のサーバ1からのpingコマンドによる接続確認を行うことにより、孤立判定の信頼性が向上することは言うまでもない。この場合、例えば、ステップA25(およびステップB27)において、サーバ1(およびサーバ2)が複数のクライアント3にpingコマンドを使用してエコー要求を送信した場合に、1台でも応答があれば正常にするようにしても良いし、全て応答があれば正常(1台でも応答がなければ正常ではない)にしても良いし、予め決められた台数(この場合の台数は図示していないメモリ等の記憶部に予め保存)以上の応答があれば正常としても良い。
【0062】
以上説明したように、現用状態(現用系)のサーバ1に致命的な障害が発生したと仮定した場合、サーバ1が、ヘルスチェックにより待機状態(待機系)のサーバ2の異常を検出するとLAN901を介してクライアント3の接続確認を行うことで自サーバ1が孤立していると判定した場合に共通のフローティングIPアドレスを無効化することにより待機状態にし、サーバ2が、ヘルスチェックによるサーバ2の異常を検出するとLAN901を介してサーバ1の接続確認を行うことでダウンと判定し更にクラアント3との接続確認を行うことで自サーバ1が孤立していないと判定した場合に共通のフローティングIPアドレスを有効化することにより現用状態に遷移するようにしているため、サーバ1およびサーバ2の両方が現用状態になるのを防ぐことができる。
【0063】
【発明の効果】
以上説明したように、本発明は、二重化されたサーバ間のヘルスチェック機能に加え、現用系サーバが、ヘルスチェックによる待機系サーバの異常を検出するとクライアントとの接続確認を行うことでサーバ自身孤立しているかの判定を行い、孤立と判定すると待機状態に遷移するようにし、待機系サーバが、ヘルスチェックによる現用系のサーバの異常を検出すると現用系サーバの接続確認およびクライアントとの接続確認を行うことで現用系サーバのダウンおよびサーバ自身孤立しているかの判定を行い、現用系サーバのダウンおよび自サーバの孤立でないと判定した場合に現用状態に遷移するようにしているため、2重化サーバが両系とも現用状態になるのを防ぐことができるという効果がある。
【図面の簡単な説明】
【図1】本発明の実施の形態の構成を示すブロック図である。
【図2】現用状態となる図1のサーバの起動時の動作を示すフローチャートである。
【図3】図1の現用状態のサーバのタイマ割り込みによる動作を示すフローチャートである。
【図4】待機状態となる図1のサーバの起動時の動作を示すフローチャートである。
【図5】図1の待機状態のサーバのタイマ割り込みによる動作を示すフローチャートである。
【図6】図1のサーバの状態におけるクライアント側のサーバの見え方を示す構成概略図である。
【符号の説明】
1,2 サーバ
3 クライアント
11,21 制御部
12,13,14,22,23,24 LANインタフェース部
15,25 タイマ
31 アプリケーション
111,211 IPフローティング制御部
112,212 孤立判定部
113,213 監視部
901,902 LAN
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a client / server address control method and method in a redundant configuration, and more particularly, to a client / server address control method and method in a redundant configuration that performs a health check between an active server and a standby server. .
[0002]
[Prior art]
Conventionally, as a method of performing a health check between servers in a redundant configuration of servers and switching a standby server to an active server, for example, JP-A-2001-344125 and JP-A-2001-344125 disclose such methods. According to Japanese Patent Application Laid-Open No. 2001-344125, the standby server performs a health check on the active server, and when it is recognized as down by the health check, the logical address of the own server is activated. The own server is switched from the standby system to the active system, and the logical address of the other server is activated via the LAN transmission path and another plurality of lines, thereby switching the other server from the active system to the standby system.
[0003]
According to Japanese Patent Application Laid-Open No. 2000-324121, the active server and the standby server mutually perform a health check via a health check line, and when a failure is detected, the health check is performed via a plurality of LAN paths. Is performed, and when all of them fail, it is determined that the other server has failed. If the server in the standby system is determined to be the partner server, the server is switched from the standby system to the active system.
[0004]
[Patent Document 1]
JP 2001-344125 A
[Patent Document 2]
JP 2000-324121 A
[0005]
[Problems to be solved by the invention]
However, according to JP-A-2001-344125, after a standby server detects a failure of a partner server by a health check, the standby server switches from the active system to the standby system using a plurality of paths to the partner server. An instruction to switch is issued, but in the case of a communication failure of the partner server, the switching instruction is not transmitted to the partner server, so that there is a problem that both servers become active systems.
[0006]
Further, according to the above-mentioned Japanese Patent Application Laid-Open No. 2001-344125, it is necessary to prepare a plurality of lines different from the LAN, so that it is necessary to prepare communication software and several types of hardware corresponding to the communication software, resulting in high cost. There is a problem.
[0007]
According to Japanese Patent Laid-Open Publication No. 2000-324121, if a communication failure occurs in an active server, a health check between the servers results in an error. Therefore, a health check is performed via a LAN path. However, even if a health check is performed via the LAN path, it is determined that the partner server has failed, so that both servers determine that the partner server is down, and both servers transition to the active system. In other words, since both servers become the active system, the dual configuration using the IP floating control method has a problem that the two servers have the same IP address.
[0008]
SUMMARY OF THE INVENTION In view of the above problems, it is an object of the present invention to prevent a redundant server from becoming an active system when a failure is detected by a health check between an active server and a standby server.
[0009]
[Means for Solving the Problems]
In order to achieve the above object, an address control method between a client and a server in a redundant configuration according to the present invention is a method in which a plurality of clients are connected to a first network and an active server and a standby server having the same IP address. In an address control method between a client and a server in a redundant configuration, wherein the health check is performed between an active server and a standby server via a second network, the active server is configured by the health check. A first isolation determining unit configured to determine whether the server is isolated by performing a connection check of the client via the first network upon detecting an abnormality of the standby server; If the isolation determining unit determines that the IP address is isolated, the IP address is invalidated to be in a standby state. And a first transition unit that transits, wherein when the standby server detects an abnormality of the standby server by the health check, the standby server confirms connection of the active server via the first network. And a down determination unit for determining whether or not the active server is down, and when the down determination unit determines that the active server is down, the client is connected via the first network to confirm the connection of the own server, thereby isolating the server. A second isolation determining unit for determining whether the IP address is not isolated, and a second status transitioning to a working state by validating the IP address when the second isolation determining unit determines that the device is not isolated. And transition means.
[0010]
Further, in the above-described address control method between the client and the server in the redundant configuration, the first isolation determining means has means for confirming the connection of the client by executing a ping command, and the down determining means includes: Executing the ping command to check the connection of the active server, and the second isolation determining means executes the ping command to check the connection of the client. It is characterized by having.
[0011]
Further, in the above-described address control method between the client and the server in the redundant configuration, the first transition means may invalidate the MAC address when the first isolation determination means determines that the MAC address is isolated. Wherein the second transition means includes means for validating the MAC address when the second isolation determination means determines that the MAC address is not isolated.
[0012]
Further, in the address control method between the client and the server in the above-mentioned redundant configuration, the first and second isolation determining means determine that the own server is not isolated if at least one of the plurality of clients can be confirmed. It is characterized by having a means for performing.
[0013]
Further, in the above-described address control method between the client and the server in the redundant configuration, the first and second isolation determining means may determine that the own server is isolated unless one of the plurality of clients can be confirmed. It is characterized by having means for determining.
[0014]
Further, in the above-described address control method between a client and a server in the redundant configuration, the first and second isolation determining means may isolate the server if a predetermined number or more of the plurality of clients cannot be confirmed. It is characterized by having means for judging that the operation is performed.
[0015]
Further, in the address control method between a client and a server in the redundant configuration according to the present invention, a plurality of clients are connected to a first network, the system comprises an active server and a standby server having the same IP address. An address control method between a client and a server in a redundant configuration in which a health check is performed between an active server and a standby server via a network, wherein the active server performs a health check on the standby server by the health check. When an abnormality is detected, a first determination is made as to whether or not the server is isolated by confirming the connection of the client via the first network, and as a result of the first determination, the server is isolated. When it is determined that the IP address is invalidated, the standby server transitions to the standby state, and the standby server When an error of the standby server is detected by the check, a second determination is made as to whether the active server is down by checking the connection of the active server via the first network, and If it is determined that the server is down as a result of the determination of 2, the third determination of whether or not the server is isolated is performed by confirming the connection of the client via the first network, and the third determination is performed. As a result, when it is determined that the IP address is not isolated, the IP address is validated to transition to the working state.
[0016]
Further, in the above-described address control method between a client and a server in the redundant configuration, the first determination is to confirm connection of the client by executing a ping command, and the second determination is to execute the ping command by executing the ping command. By executing the command, the connection of the active server is confirmed, and in the third determination, the connection of the client is confirmed by executing the ping command.
[0017]
Further, in the above-described address control method between a client and a server in the redundant configuration, when transitioning to the standby state, the MAC address is invalidated when it is determined that the first state is isolated, and the active state is determined. When the third determination is made that the MAC address is not isolated, the MAC address is validated.
[0018]
Further, in the above-described address control method between a client and a server in the redundant configuration, the first and third determinations may include determining that the own server is not isolated if at least one of the plurality of clients can be confirmed. It is characterized by.
[0019]
Further, in the above-described address control method between a client and a server in a redundant configuration, the first and third determinations may include determining that the own server is isolated if at least one of the plurality of clients cannot be confirmed. It is characterized by.
[0020]
Further, in the above-described address control method between a client and a server in the redundant configuration, the first and third determinations may be made such that the server is isolated unless a predetermined number or more of the plurality of clients can be confirmed. It is characterized by judging that there is.
[0021]
BEST MODE FOR CARRYING OUT THE INVENTION
Next, embodiments of the present invention will be described with reference to the drawings.
[0022]
Referring to FIG. 1, two redundant servers 1 and 2, a client 3 which is a user operation terminal, an existing operation LAN 901, and a health between the redundant servers 1 and 2 It comprises a LAN 902 for checking and the communication device 4.
[0023]
The server 1 includes a control unit 11 that operates under program control by a processor (CPU) (not shown), a LAN interface unit 12 that exchanges data with the LAN 901, a LAN interface unit 13 that exchanges data with the LAN 901, and a server. The LAN interface unit 14 exchanges data with the LAN 2 and a timer 15 monitors time.
[0024]
The server 2 includes a control unit 21 that operates under program control by a processor (CPU) (not shown), a LAN interface unit 22 that exchanges data with the LAN 901, a LAN interface unit 23 that exchanges data with the LAN 901, 1 includes a LAN interface unit 24 for exchanging data with the communication device 1 and a timer 25 for monitoring time.
[0025]
The duplicated server 1 and server 2 are connected to the LAN 901 with the same IP address, and the server in the active state (active system) has an IP address control method for validating the IP address (hereinafter, referred to as “server”). This control method is called an IP floating method, and its IP address is called a floating IP address), and a server in a standby state (standby system) invalidates the floating IP address. Therefore, the client 3 is configured to be able to connect to the active server by connecting to the floating IP address.
[0026]
The control unit 11 of the server 1 includes an IP floating control unit 111, an isolation determination unit 112, and a monitoring unit 113.
[0027]
The IP floating unit 111 of the server 1 assigns (enables) a floating IP address to the LAN interface unit 13 to activate the transmission / reception circuit inside the LAN interface unit 13 when the active state is set at the time of startup, Means for assigning (enabling) a floating IP address to the LAN interface unit (13) and enabling the transmission / reception circuit inside the LAN interface unit (13) when the isolation determining unit (112) determines that the server (2) is isolated in the standby state. If the isolation determining unit 112 determines that the server 1 is isolated in the active state, the floating IP address is released (invalidated) and the transmission / reception circuit inside the LAN interface unit 13 is invalidated, so that the standby state is established. Means.
[0028]
When the monitoring unit 113 detects an abnormality in the server 2 in the standby state, the isolation determination unit 112 of the server 1 determines whether the server 2 is down by executing the ping command to determine whether the server 2 is down via the LAN 901. A ping command when the server 2 is determined to be down in the standby state or when the monitoring unit 113 detects an abnormality in the server 2 in the active state by executing the ping command via the LAN 901. Means for determining whether the server 1 itself is isolated by checking the connection state with the client 3.
[0029]
The monitoring unit 113 of the server 1 has means for performing a health check of the server 2 by using (executing) the ping command via the health check LAN 902 by a timer interrupt of the timer 15. The ping (Packet Internet Grouper) command is a command for confirming whether devices are connected on a network. That is, the monitoring unit 113 issues an ICMP (Internet Message Protocol) echo request by executing the ping command, and confirms an ICMP echo response returned by the server 2 as a response.
[0030]
The LAN interface unit 12 of the server 1 is assigned a real IP address of the server 1 and a MAC address corresponding to the real IP address to distinguish it from the server 2. In the present invention, the LAN interface unit 12 does not have to exist.
[0031]
The same MAC address as that of the LAN interface unit 23 is assigned to the LAN interface unit 13 of the server 1, and when the server 1 is in the active state, the floating IP address is assigned and the transmission / reception circuit is activated (in the LAN interface unit 13). Activating the transmission / reception circuit described above also activates the MAC address). In this case, the floating IP address is set in the LAN interface unit 13 in advance, and the standby state, that is, the floating IP address is invalidated (including the invalidation of the transmission / reception circuit in the LAN interface unit 13, that is, the invalidation of the MAC address). Alternatively, in the case of the active state, the floating IP address may be validated (including the validation of the transmission / reception circuit in the LAN interface unit 13, that is, the validation of the MAC address) so that transmission and reception with the LAN 901 may be performed.
[0032]
The LAN interface 14 of the server 1 is assigned the IP address of the server 1 for health check and the MAC address corresponding to the IP address.
[0033]
When activated, the timer 15 of the server 1 interrupts the control unit 11 after a predetermined time.
[0034]
The control unit 21 of the server 2 includes an IP floating control unit 211, an isolation determination unit 212, and a monitoring unit 213.
[0035]
The IP floating unit 211 of the server 2 assigns (enables) a floating IP address to the LAN interface unit 23 to activate the transmitting / receiving circuit inside the LAN interface unit 23 when the active state is set at the time of startup, Means for assigning (enabling) a floating IP address to the LAN interface unit (23) and enabling the transmission / reception circuit inside the LAN interface unit (23) when the isolation determining unit (212) determines that the server (1) is isolated in the standby state. When the isolation determination unit 212 determines that the server 2 is isolated in the active state, the floating IP address is released (invalidated) and the transmission / reception circuit inside the LAN interface unit 23 is invalidated to set the standby state. Means.
[0036]
When the monitoring unit 213 detects an abnormality in the server 1 in the standby state, the isolation determination unit 212 of the server 2 determines whether the server 1 is down by executing the ping command to determine whether the server 1 is down via the LAN 901. And the LAN 901 by executing a ping command when the monitoring unit 213 detects that the server 1 is down in the standby state or when the monitoring unit 213 detects an abnormality of the server 1 in the active state. Means for determining whether the server 2 itself is isolated by checking the connection state with the client 3.
[0037]
The monitoring unit 213 of the server 2 has means for performing a health check of the server 2 by using (executing) the ping command via the LAN 902 for health check by a timer interrupt of the timer 25. That is, the monitoring unit 213 issues an ICMP (Internet Message Protocol) echo request by executing the ping command, and confirms an ICMP echo response returned by the server 2 as a response.
[0038]
The LAN interface unit 22 of the server 2 is assigned a real IP address of the server 1 and a MAC address corresponding to the real IP address in order to distinguish it from the server 1. In the present invention, the LAN interface unit 22 need not be provided.
[0039]
The same MAC address as that of the LAN interface unit 13 is assigned to the LAN interface unit 23 of the server 2, and when the server 2 enters the active state, the floating IP address is assigned and the transmission / reception circuit is activated (the transmission / reception circuit is activated). By doing so, the MAC address is also enabled). In this case, the floating IP address is set in the LAN interface unit 23 in advance, and the standby state, that is, the floating IP address is invalidated (including the invalidation of the transmission / reception circuit in the LAN interface unit 23, that is, the invalidation of the MAC address). In the active state, the floating IP address may be validated (including the activation of the transmission / reception circuit in the LAN interface unit 23, that is, the activation of the MAC address) to enable transmission and reception with the LAN 901.
[0040]
The LAN interface 24 of the server 2 is assigned the IP address of the server 2 for health check and the MAC address corresponding to the IP address.
[0041]
When activated, the timer 25 of the server 2 interrupts the control unit 21 after a predetermined time.
[0042]
When the LAN interface unit 13 and the LAN interface unit 23 are in the operating state, one of them is valid, and the same floating IP address and the same MAC address are used.
[0043]
The client 3 includes, for example, an application 31 which is communication application software for accessing a shared database managed by the server 1 and the server 2.
[0044]
Next, the operation of the embodiment of the present invention will be described with reference to the drawings with reference to FIGS.
[0045]
When the server 1 of the system 0 is started, the control unit 11 of the server 1 assigns the real IP address of the server 1 to the LAN interface unit 12 and starts the IP floating control unit 111. When the IP floating control unit 111 assigns a floating IP address to the LAN interface unit 13 and the control unit 11 confirms that the IP floating control unit 111 has started up normally, the control unit 11 makes a transition to the working state. Further, by activating the timer 15, the control unit 11 activates the isolation determining unit 112 and the monitoring unit 113 (Steps A11 to A15 in FIG. 2).
[0046]
On the other hand, when the server 2 of the first system is started, the control unit 21 of the server 2 assigns the real IP address of the server 1 to the LAN interface unit 22 and starts the IP floating control unit 211. When the IP floating control unit 211 does not assign the floating IP address to the LAN interface unit 23, and the control unit 21 confirms that the IP floating control unit 4 has started up normally, the control unit 21 shifts to the standby state. Further, the control unit 21 activates the timer 25 to activate the isolation determining unit 212 and the monitoring unit 213 (steps B11 to B14 in FIG. 4).
[0047]
The client 3 executing the application 31 accesses the server using the floating IP address to communicate with the server, but can access the server 1 in the active state without being aware of the state of the server. become.
[0048]
On the other hand, when the monitoring unit 113 of the server 1 executes the ping command in order to periodically check the health of the server 2 by the timer interruption of the timer 15, the monitoring unit 113 transmits the ICMP to the server 2 via the LAN interface unit 14 and the LAN 902. Send an echo request. When receiving the ICMP echo request via the LAN interface unit 902, the control unit 21 of the server 2 returns an ICMP echo response. Then, the monitoring unit 113 of the server 1 determines that the operation is normal, restarts the timer 15, and ends the processing (steps A21, A22, and A29 in FIG. 3).
[0049]
Similarly, when the ping command is executed by the monitoring unit 213 of the server 2 to periodically perform the health check of the server 1 by the timer interrupt of the timer 25, the monitoring unit 213 sends the ping command to the server 1 via the LAN interface unit 24 and the LAN 902. Send an ICMP echo request. When receiving the ICMP echo request via the LAN interface unit 902, the control unit 11 of the server 1 returns an ICMP echo response. Then, the monitoring unit 213 of the server 2 determines that the operation is normal, restarts the timer 25, and ends the processing (steps B21, B22, and B29 in FIG. 5).
[0050]
As described above, if the result of the health check is normal, the monitoring unit of the server 1 and the monitoring unit 213 of the server 2 periodically perform the health check by the timer interrupt. Assume that it has occurred.
[0051]
When a timer interrupt by the timer 15 occurs in the control unit 11 in the server 1 in the active state, the monitoring unit 113 of the control unit 11 sends a LAN interface unit to the server 2 to check the health of the server 2. When the ping command is issued through the LAN 14 and the LAN 902, no response is returned from the server 2, so that the server 2 determines that the server is abnormal and notifies the isolation determining unit 112 (steps A21, A22, A23).
[0052]
Upon receiving the notification, the isolation determining unit 112 executes the ping command and transmits an ICMP echo request to the client 3 via the LAN interface unit 13 and the LAN 901. Since no echo response is returned, the server 2 is isolated and determines that the server 2 has transitioned to the active state, and notifies the IP floating control unit 111 (processing by abnormal notification). Upon receiving the abnormality notification, the IP floating control unit 11 invalidates the floating IP address to the LAN interface unit 13 and also invalidates the transmission / reception circuit so that the LAN interface unit 13 cannot receive the IP address. Then, the control unit 11 transitions to the standby state and ends (Steps A24 to A28).
[0053]
On the other hand, when a timer interrupt by the timer 25 occurs in the control unit 21 in the server 2 in the standby state, the monitoring unit 213 of the control unit 21 executes a ping command to perform a health check of the server 1. Even if an ICMP echo request is transmitted to the server 1 via the LAN interface unit 24 and the LAN 902, no response is returned from the server 1, so that the server 1 is determined to be abnormal and notified to the isolation determination unit 212 (step B21). , B22, B23).
[0054]
When the isolation determining unit 212 that has received the notification transmits an ICMP echo request to the server 1 via the LAN interface unit 23 and the LAN 901 by executing the ping command, the server 1 does not return an ICMP echo response. Then, it is determined that the server 1 has gone down, and further, the ping command is executed to transmit an ICMP echo request to the client 3 via the LAN interface unit 23 and the LAN 901 to confirm the isolation of the server 2 itself ( Steps B24 to B27).
[0055]
In step B27, when the ICMP echo response is returned from the client 3, the isolation determining unit 212 of the server 2 determines that the server 2 itself is normal, and notifies the IP floating control unit 211 (processing by the normal notification). The IP floating control unit 211 that has received the normal notification of the server 2 activates the floating IP address for the LAN interface unit 23 and also activates the transmission / reception circuit so that the LAN interface unit 23 can receive the IP address. Then, the control unit 21 transitions to the active state, restarts the timer 25 by the monitoring unit 213, and ends (Steps B26 to B31).
[0056]
On the other hand, the client 3 executing the application 31 accesses the server using the floating IP address in order to communicate with the server in the same manner as the previous time, but this time, without being aware of the state of the server, Can access the server 2 switched to the active state.
[0057]
When the ICMP echo response is returned from the server 1 in step B27, the isolation determining unit 212 of the server 2 determines that the server 1 is normal, restarts the timer, and ends (step B31).
[0058]
That is, as shown in FIG. 6, the server 1 transitions from the active state to the standby state, the server 2 transitions from the standby state to the active state, but the floating IP address and the MAC address also transition from the server 1 to the server 2. Therefore, even if the client 3 accesses the server with the floating IP address (and the MAC address), the client 3 can access the normal server 2 without accessing the abnormal server 1.
[0059]
Further, when the downed server 1 is repaired and started up, the server 1 enters a standby state, and when the server 2 detects the above, the server 1 and the server 2 are reversed, and the same operation as described above is performed. Needless to say,
[0060]
In the above description, the connection is confirmed using the ping command between the server 1 in the active state and the client 3 for the purpose of isolation determination. It is not necessary to limit the communication device to a client that communicates with the server 1 or the server 2. Any communication device connected to the LAN 901 may be used. The communication device can respond to an ICMP echo request by a ping command from the server 1 in the active state. Needless to say, there is.
[0061]
In addition, when the active server 1 determines the isolation, the connection confirmation by the ping command is performed by performing the connection confirmation by the ping command from the active server 1 on the LAN 901 to a plurality of clients and other communication devices. It goes without saying that the reliability of the isolation determination is improved. In this case, for example, in step A25 (and step B27), when the server 1 (and server 2) transmits an echo request to a plurality of clients 3 using a ping command, if there is at least one response, the server 1 (and server 2) will normally operate. May be performed, may be normal if all responses are received (not normal if there is no response), or may be a predetermined number (the number in this case is a memory or the like not shown). If there is a response equal to or more than (previously stored in the storage unit), it may be set to normal.
[0062]
As described above, when it is assumed that a fatal failure has occurred in the server 1 in the working state (active system), when the server 1 detects an abnormality in the server 2 in the waiting state (standby system) through a health check, the LAN 901 is activated. When it is determined that the own server 1 is isolated by confirming the connection of the client 3 through the server, the common floating IP address is invalidated to put the server 3 in a standby state, and the server 2 performs a health check on the server 2. When an abnormality is detected, it is determined that the server 1 is down by checking the connection of the server 1 via the LAN 901, and when it is determined that the own server 1 is not isolated by checking the connection with the client 3, a common floating IP address Is activated to make the transition to the active state, so that both the server 1 and the server 2 are switched to the active state. That it can be prevented.
[0063]
【The invention's effect】
As described above, according to the present invention, in addition to the health check function between the redundant servers, when the active server detects an error in the standby server due to the health check, the active server checks the connection with the client, thereby isolating the server itself. If the standby server detects an abnormality in the active server by health check, it checks the connection of the active server and the connection with the client. By doing so, it is determined whether the active server is down and the server itself is isolated. If it is determined that the active server is not down and the own server is not isolated, the state transitions to the active state. There is an effect that both servers can be prevented from becoming active.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an embodiment of the present invention.
FIG. 2 is a flowchart showing an operation at the time of starting the server of FIG. 1 which is in an active state;
FIG. 3 is a flowchart showing an operation of the server in the active state of FIG. 1 by a timer interrupt;
FIG. 4 is a flowchart illustrating an operation of the server in FIG. 1 in a standby state when the server is started.
FIG. 5 is a flowchart showing an operation of the server in a standby state in FIG. 1 by a timer interrupt;
FIG. 6 is a schematic configuration diagram showing how the server on the client side looks in the state of the server in FIG. 1;
[Explanation of symbols]
1,2 server
3 clients
11, 21 control unit
12, 13, 14, 22, 23, 24 LAN interface unit
15, 25 timer
31 Application
111, 211 IP floating control unit
112,212 Isolation judgment unit
113, 213 monitoring unit
901 and 902 LAN

Claims (12)

第1のネットワークに複数のクライアントが接続され、同一のIPアドレスを持つ現用系サーバと待機系サーバにより構成され、第2のネットワークを介して現用系サーバと待機系サーバとの間でお互いにヘルスチェックを行う冗長構成におけるクライアント/サーバ間のアドレス制御方式において、前記現用系サーバは、前記ヘルスチェックにより待機系サーバの異常を検出すると、前記第1のネットワークを介して前記クライアントの接続確認を行うことで自サーバが孤立しているかどうかの判定を行う第1の孤立判定手段と、
前記第1の孤立判定手段で孤立していると判定した場合に前記IPアドレスを無効化することで待機状態に遷移する第1の遷移手段と、を有し、
前記待機系サーバは、前記ヘルスチェックにより待機系サーバの異常を検出すると、前記第1のネットワークを介して前記現用系サーバの接続確認を行うことで現用系サーバがダウンしているかどうかを判定するダウン判定手段と、
前記ダウン判定手段でダウンと判定した場合に前記第1のネットワークを介して前記クライアントの接続確認を行うことで自サーバが孤立しているかどうかの判定を行う第2の孤立判定手段と、
前記第2の孤立判定手段で孤立していないと判定した場合に前記IPアドレスを有効化することで現用状態に遷移する第2の遷移手段と、を有することを特徴とする冗長構成におけるクライアント/サーバ間のアドレス制御方式。
A plurality of clients are connected to the first network, and are configured by an active server and a standby server having the same IP address. The active server and the standby server have a mutual health via the second network. In the address control method between the client and the server in the redundant configuration for performing the check, when the active server detects an abnormality of the standby server by the health check, the active server checks the connection of the client via the first network. First isolation determining means for determining whether the own server is isolated,
A first transition unit that transitions to a standby state by invalidating the IP address when the first isolation determination unit determines that it is isolated,
When the standby server detects an abnormality of the standby server by the health check, the standby server determines whether the active server is down by checking the connection of the active server via the first network. Down determining means;
A second isolation determination unit that determines whether the server is isolated by performing connection confirmation of the client via the first network when the down determination unit determines that the server is down;
A second transition unit that transitions to an active state by validating the IP address when the second isolation determination unit determines that the client is not isolated. Address control method between servers.
前記第1の孤立判定手段は、pingコマンドを実行することにより前記クライアントの接続確認を行う手段を有し、
前記ダウン判定手段は、前記pingコマンドを実行することにより前記現用系のサーバの接続確認を行う手段を有し、
前記第2の孤立判定手段は、前記pingコマンドを実行することにより前記クライアントの接続確認を行う手段を有することを特徴とする請求項1記載の冗長構成におけるクライアント/サーバ間のアドレス制御方式。
The first isolation determination unit has a unit that confirms the connection of the client by executing a ping command,
The down determining means has means for confirming connection of the active server by executing the ping command,
2. An address control method between a client and a server in a redundant configuration according to claim 1, wherein said second isolation determining means has means for confirming connection of said client by executing said ping command.
前記第1の遷移手段は、前記第1の孤立判定手段で孤立していると判定した場合にMACアドレスを無効化する手段を有し、
前記第2の遷移手段は、前記第2の孤立判定手段で孤立していないと判定した場合に前記MACアドレスを有効化する手段を有することを特徴とする請求項1記載の冗長構成におけるクライアント/サーバ間のアドレス制御方式。
The first transition unit includes a unit that invalidates a MAC address when the first isolation determination unit determines that the MAC address is isolated,
2. The client / client in a redundant configuration according to claim 1, wherein the second transition unit has a unit that validates the MAC address when the second isolation unit determines that the MAC address is not isolated. Address control method between servers.
前記第1および第2の孤立判定手段は、複数の前記クライアントうち1台でも確認が取れれば自サーバが孤立していないと判断する手段を有することを特徴とする請求項1,2,または3記載の冗長構成におけるクライアント/サーバ間のアドレス制御方式。4. The apparatus according to claim 1, wherein the first and second isolation determining means include means for determining that the server is not isolated if at least one of the plurality of clients can be confirmed. An address control method between a client and a server in the redundant configuration described above. 前記第1および第2の孤立判定手段は、複数の前記クライアントうち1台でも確認が取れなければ自サーバが孤立していると判断する手段を有することを特徴とする請求項1,2,または3記載の冗長構成におけるクライアント/サーバ間のアドレス制御方式。4. The method according to claim 1, wherein the first and second isolation determining means include means for determining that the server is isolated if at least one of the plurality of clients cannot be confirmed. 3. An address control method between a client and a server in the redundant configuration according to 3. 前記第1および第2の孤立判定手段は、複数の前記クライアントうち予め決められた台数以上の確認が取れなければ自サーバが孤立していると判断する手段を有することを特徴とする請求項1,2,または3記載の冗長構成におけるクライアント/サーバ間のアドレス制御方式。2. The apparatus according to claim 1, wherein the first and second isolation determining means include means for determining that the server is isolated if a predetermined number or more of the plurality of clients cannot be confirmed. , 2, or 3, the address control method between the client and the server in the redundant configuration. 第1のネットワークに複数のクライアントが接続され、同一のIPアドレスを持つ現用系サーバと待機系サーバにより構成され、第2のネットワークを介して現用系サーバと待機系サーバとの間でお互いにヘルスチェックを行う冗長構成におけるクライアント/サーバ間のアドレス制御方法であって、前記現用系サーバは、前記ヘルスチェックにより待機系サーバの異常を検出すると、前記第1のネットワークを介して前記クライアントの接続確認を行うことで自サーバが孤立しているかどうかの第1の判定を行い、
前記第1の判定の結果、孤立していると判定した場合に前記IPアドレスを無効化することで待機状態に遷移し、
前記待機系サーバは、前記ヘルスチェックにより待機系サーバの異常を検出すると、前記第1のネットワークを介して前記現用系サーバの接続確認を行うことで現用系サーバがダウンしているかどうかを第2の判定を行い、
前記第2の判定の結果、ダウンと判定した場合に前記第1のネットワークを介して前記クライアントの接続確認を行うことで自サーバが孤立しているかどうかの第3の判定を行い、
前記第3の判定の結果、孤立していないと判定した場合に前記IPアドレスを有効化することで現用状態に遷移することを特徴とする冗長構成におけるクライアント/サーバ間のアドレス制御方法。
A plurality of clients are connected to the first network, and are configured by an active server and a standby server having the same IP address. The active server and the standby server have a mutual health via the second network. An address control method between a client and a server in a redundant configuration for performing a check, wherein the active server confirms connection of the client via the first network when detecting an abnormality of a standby server by the health check. Performs a first determination of whether the server is isolated,
As a result of the first determination, when it is determined that the IP address is isolated, the IP address is invalidated to transition to a standby state,
When the standby server detects an abnormality of the standby server by the health check, the standby server checks the connection of the active server via the first network to determine whether the active server is down. Is determined,
As a result of the second determination, if it is determined to be down, a third determination of whether the server is isolated by performing a connection check of the client via the first network,
As a result of the third determination, when it is determined that the IP address is not isolated, the IP address is validated and a transition is made to a working state.
前記第1の判定は、pingコマンドを実行することにより前記クライアントの接続確認を行い、
前記第2の判定は、前記pingコマンドを実行することにより前記現用系のサーバの接続確認を行い、
前記第3の判定は、前記pingコマンドを実行することにより前記クライアントの接続確認を行うことを特徴とする請求項7記載の冗長構成におけるクライアント/サーバ間のアドレス制御方法。
The first determination is to confirm the connection of the client by executing a ping command,
The second determination is to confirm the connection of the active server by executing the ping command,
8. The address control method between clients and servers in a redundant configuration according to claim 7, wherein in the third determination, the connection of the client is confirmed by executing the ping command.
前記待機状態に遷移する場合は、前記第1の判定で孤立している判定した場合にMACアドレスを無効化にし、
前記現用状態に遷移する場合は、前記第3の判定で孤立していないと判定した場合に前記MACアドレスを有効化することを特徴とする請求項7記載の冗長構成におけるクライアント/サーバ間のアドレス制御方法。
When transitioning to the standby state, invalidate the MAC address when it is determined in the first determination that it is isolated,
8. The address between a client and a server in a redundant configuration according to claim 7, wherein when transitioning to the working state, the MAC address is validated when it is determined in the third determination that the MAC address is not isolated. Control method.
前記第1および第3の判定は、複数の前記クライアントうち1台でも確認が取れれば自サーバが孤立していないと判断することを特徴とする請求項7,8,または9記載の冗長構成におけるクライアント/サーバ間のアドレス制御方法。10. The redundant configuration according to claim 7, wherein the first and third determinations determine that the own server is not isolated if at least one of the plurality of clients can be confirmed. Address control method between client / server. 前記第1および第3判定は、複数の前記クライアントうち1台でも確認が取れなければ自サーバが孤立していると判断することを特徴とする請求項7,8,または9記載の冗長構成におけるクライアント/サーバ間のアドレス制御方法。10. The redundant configuration according to claim 7, wherein the first and third determinations determine that the own server is isolated if at least one of the plurality of clients cannot be confirmed. Address control method between client / server. 前記第1および第3の判定は、複数の前記クライアントうち予め決められた台数以上の確認が取れなければ自サーバが孤立していると判断することを特徴とする請求項7,8,または9記載の冗長構成におけるクライアント/サーバ間のアドレス制御方法。10. The method according to claim 7, wherein the first and third determinations determine that the server is isolated if a predetermined number or more of the plurality of clients cannot be confirmed. An address control method between a client and a server in the redundant configuration described above.
JP2002337987A 2002-11-21 2002-11-21 Address control system and method between client/server in redundant constitution Withdrawn JP2004171370A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002337987A JP2004171370A (en) 2002-11-21 2002-11-21 Address control system and method between client/server in redundant constitution

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002337987A JP2004171370A (en) 2002-11-21 2002-11-21 Address control system and method between client/server in redundant constitution

Publications (1)

Publication Number Publication Date
JP2004171370A true JP2004171370A (en) 2004-06-17

Family

ID=32701346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002337987A Withdrawn JP2004171370A (en) 2002-11-21 2002-11-21 Address control system and method between client/server in redundant constitution

Country Status (1)

Country Link
JP (1) JP2004171370A (en)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007142976A (en) * 2005-11-21 2007-06-07 Hitachi Communication Technologies Ltd Sip server system
WO2007104191A1 (en) * 2006-03-15 2007-09-20 Zte Corporation A method for logging-off ip address
JP2007249659A (en) * 2006-03-16 2007-09-27 Hitachi Ltd System-switching method, computer system therefor, and program
JP2008177710A (en) * 2007-01-17 2008-07-31 Nec Corp Media service system, media service device, and lan redundancy method used therefor
JP2008287632A (en) * 2007-05-21 2008-11-27 Panasonic Corp Control device recovery system
JP2009017344A (en) * 2007-07-06 2009-01-22 Nippon Telegr & Teleph Corp <Ntt> Tcp session switching device and method, program, and recording medium
JP2010009462A (en) * 2008-06-30 2010-01-14 Yamatake Corp Server-client system and server switching method thereof
JP2010160537A (en) * 2009-01-06 2010-07-22 Hitachi Ltd Communication equipment and system switching method
US7895358B2 (en) 2007-01-15 2011-02-22 Hitachi, Ltd. Redundancy switching method
JP2012095013A (en) * 2010-10-26 2012-05-17 Nec Corp Network monitoring system, network monitoring method and server
US8264989B2 (en) 2006-11-01 2012-09-11 Nec Infrontia Corporation VoIP server apparatus and method for maintaining software in VoIP server apparatus
JP2013041367A (en) * 2011-08-12 2013-02-28 Ntt Comware Corp Operation management device, operation management method, and operation management program
US8533525B2 (en) 2009-12-25 2013-09-10 Canon Kabushiki Kaisha Data management apparatus, monitoring apparatus, replica apparatus, cluster system, control method and computer-readable medium
JP2014178797A (en) * 2013-03-14 2014-09-25 Nec Corp Monitoring control device and method, built-in control device, and computer program
JP2018136794A (en) * 2017-02-22 2018-08-30 日本電信電話株式会社 Router and communication control method
WO2019216210A1 (en) * 2018-05-09 2019-11-14 日本電信電話株式会社 Service continuation system and service continuation method
JP2020091618A (en) * 2018-12-05 2020-06-11 アズビル株式会社 Facility monitoring system and communication method in facility monitoring system
JP7474168B2 (en) 2020-09-25 2024-04-24 株式会社日立製作所 Monitoring system and fault monitoring method

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007142976A (en) * 2005-11-21 2007-06-07 Hitachi Communication Technologies Ltd Sip server system
WO2007104191A1 (en) * 2006-03-15 2007-09-20 Zte Corporation A method for logging-off ip address
JP2007249659A (en) * 2006-03-16 2007-09-27 Hitachi Ltd System-switching method, computer system therefor, and program
US8264989B2 (en) 2006-11-01 2012-09-11 Nec Infrontia Corporation VoIP server apparatus and method for maintaining software in VoIP server apparatus
US7895358B2 (en) 2007-01-15 2011-02-22 Hitachi, Ltd. Redundancy switching method
JP2008177710A (en) * 2007-01-17 2008-07-31 Nec Corp Media service system, media service device, and lan redundancy method used therefor
JP2008287632A (en) * 2007-05-21 2008-11-27 Panasonic Corp Control device recovery system
JP2009017344A (en) * 2007-07-06 2009-01-22 Nippon Telegr & Teleph Corp <Ntt> Tcp session switching device and method, program, and recording medium
JP4550867B2 (en) * 2007-07-06 2010-09-22 日本電信電話株式会社 TCP session switching apparatus and method, program, and recording medium
JP2010009462A (en) * 2008-06-30 2010-01-14 Yamatake Corp Server-client system and server switching method thereof
JP2010160537A (en) * 2009-01-06 2010-07-22 Hitachi Ltd Communication equipment and system switching method
US8533525B2 (en) 2009-12-25 2013-09-10 Canon Kabushiki Kaisha Data management apparatus, monitoring apparatus, replica apparatus, cluster system, control method and computer-readable medium
JP2012095013A (en) * 2010-10-26 2012-05-17 Nec Corp Network monitoring system, network monitoring method and server
JP2013041367A (en) * 2011-08-12 2013-02-28 Ntt Comware Corp Operation management device, operation management method, and operation management program
JP2014178797A (en) * 2013-03-14 2014-09-25 Nec Corp Monitoring control device and method, built-in control device, and computer program
JP2018136794A (en) * 2017-02-22 2018-08-30 日本電信電話株式会社 Router and communication control method
WO2019216210A1 (en) * 2018-05-09 2019-11-14 日本電信電話株式会社 Service continuation system and service continuation method
JP2020091618A (en) * 2018-12-05 2020-06-11 アズビル株式会社 Facility monitoring system and communication method in facility monitoring system
JP7316779B2 (en) 2018-12-05 2023-07-28 アズビル株式会社 FACILITY MONITORING SYSTEM AND COMMUNICATION METHOD IN FACILITY MONITORING SYSTEM
JP7474168B2 (en) 2020-09-25 2024-04-24 株式会社日立製作所 Monitoring system and fault monitoring method

Similar Documents

Publication Publication Date Title
JP2004171370A (en) Address control system and method between client/server in redundant constitution
US6934880B2 (en) Functional fail-over apparatus and method of operation thereof
FI115271B (en) Procedure and system for implementing a rapid rescue process in a local area network
US20130173839A1 (en) Switch disk array, storage system and data storage path switching method
US20070288585A1 (en) Cluster system
JPH04217136A (en) Data integrity assurance system
TWI410084B (en) Intelligent failover in a load-balanced networking environment
US20070270984A1 (en) Method and Device for Redundancy Control of Electrical Devices
CN111585835B (en) Control method and device for out-of-band management system and storage medium
US20040255186A1 (en) Methods and apparatus for failure detection and recovery in redundant systems
JPH09259096A (en) System for enhancing reliability of network
JP2011203941A (en) Information processing apparatus, monitoring method and monitoring program
KR20030048503A (en) Communication system and method for data synchronization of duplexing server
JP2009003491A (en) Server switching method in cluster system
CN101202658A (en) System and method for service take-over of multi-host system
JP2012075009A (en) Redundancy device and redundancy program
JP7220997B2 (en) FACILITY MONITORING SYSTEM AND COMMUNICATION METHOD IN FACILITY MONITORING SYSTEM
JP3325785B2 (en) Computer failure detection and recovery method
US20210247996A1 (en) Service continuation system and service continuation method
CN113852514A (en) Data processing system with uninterrupted service, processing equipment switching method and connecting equipment
JP2000244526A (en) Multiplexed network connector system
JP7431034B2 (en) Controller and facility monitoring system
US11947431B1 (en) Replication data facility failure detection and failover automation
KR101397993B1 (en) Duplex System and Method of Access Switching Processor
CN111045872B (en) Method and system for realizing high-availability self-protection mechanism

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050309

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060207