JP4940624B2 - 相互監視システム、相互監視装置、相互監視方法およびプログラム - Google Patents

相互監視システム、相互監視装置、相互監視方法およびプログラム Download PDF

Info

Publication number
JP4940624B2
JP4940624B2 JP2005304277A JP2005304277A JP4940624B2 JP 4940624 B2 JP4940624 B2 JP 4940624B2 JP 2005304277 A JP2005304277 A JP 2005304277A JP 2005304277 A JP2005304277 A JP 2005304277A JP 4940624 B2 JP4940624 B2 JP 4940624B2
Authority
JP
Japan
Prior art keywords
monitoring
mutual
identification information
monitoring device
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005304277A
Other languages
English (en)
Other versions
JP2007114941A (ja
Inventor
俊一 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005304277A priority Critical patent/JP4940624B2/ja
Priority to US11/422,706 priority patent/US7734769B2/en
Publication of JP2007114941A publication Critical patent/JP2007114941A/ja
Application granted granted Critical
Publication of JP4940624B2 publication Critical patent/JP4940624B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、ネットワークに接続されたコンピュータ等のネットワーク接続装置に障害が発生したか否かを監視する監視技術に関し、特に、各ネットワーク接続装置が他のネットワーク接続装置に障害が発生したか否かを監視する相互監視技術に関する。
ネットワーク接続装置に障害が発生したか否かを監視する従来の技術としては、例えば、管理サーバからネットワーク接続装置に対して所定周期で問い合わせを行い、この問い合わせに対してネットワーク接続装置から応答がなかった場合、ネットワーク接続装置に障害が発生していると判定する技術が良く知られている。しかし、この従来の技術は、管理サーバに負荷が集中するため、監視対象にするネットワーク接続装置の台数が多い場合、管理サーバとして高速動作可能な高価な装置を用意しなければならないという問題がある。更に、管理サーバに障害が発生した場合、障害の発生したネットワーク接続装置を全く検出できなくなってしまうという問題もある。
そこで、このような問題を解決するため、各ネットワーク接続装置が自律的に他のネットワーク接続装置を監視するという技術が提案された(例えば、特許文献1、2参照)。
特許文献1に記載されている従来の技術では、監視対象となる各コンピュータは、それぞれ所定周期で自コンピュータの識別情報を含むパケットを、ブロードキャスト或いはマルチキャストにより、他のコンピュータに送信している。また、上記した各コンピュータは、それぞれ監視対象とする全てのコンピュータの識別情報が登録された構成機器情報記憶部を備えている。そして、各コンピュータは、自コンピュータ内の構成機器情報記憶部に識別子が登録されているコンピュータの中に、そのコンピュータからのパケットを所定時間以上受信していないコンピュータが発生したとき、そのコンピュータに障害が発生したと判定する。
また、特許文献2に記載されている従来の技術では、監視対象となる各計算機は、それぞれリング型順序リストを有している。このリング型順序リストは、各計算機がどのような順番で他の計算機に対して問い合わせを行うのかを示すリストであり、監視対象とする全ての計算機の識別情報がポインタによって問い合わせ順に接続されている。各計算機は、他の計算機からの問い合わせに対して応答を返すと、自身が保持しているリング型順序リストに基づいて問い合わせ順が第1番目の計算機を認識し、その計算機に対して問い合わせを行う。この問い合わせに対して、第1番目の計算機から応答があった場合は、第1番目の計算機は正常であると判断し、処理を終了する。これに対して、第1番目の計算機から応答がなかった場合は、第1番目の計算機に障害が発生していると判断し、更に、リング型順序リストに基づいて問い合わせ順が第2番目の計算機に対して問い合わせを行う。そして、第2番目の計算機から応答があった場合は、第2番目の計算機が正常であると判断し、処理を終了する。また、第2番目の計算機は、応答を返すと、自身が保持しているリング型順序リストに従って上記した処理と同様の処理を行う。
特開2001−75837号公報 特開2002−312199号公報
しかし、特許文献1に記載されている従来の技術は、ブロードキャスト或いはマルチキャストによりパケットを送信する必要があるため、ネットワークの負荷が高くなるという問題がある。更に、特許文献1に記載されている従来の技術は、機器構成情報記憶部に、監視対象にする全てのコンピュータの識別情報を登録することが必要なため、監視対象にするコンピュータの台数が多い場合、機器構成情報記憶部を構成するために、多くのメモリ量が必要になってしまうという問題もある。
一方、特許文献2に記載されている従来の技術は、リング型順序リストに従って特定の計算機に対して問い合わせを行っているので、ブロードキャスト或いはマルチキャストによりパケットを送信することが必要な特許文献1に記載されている従来の技術のようにネットワーク負荷を高くすることはない。しかし、特許文献2に記載されている従来の技術も、監視対象とする全ての計算機の識別情報をポインタによって接続したリング型順序リストを各計算機において保持しておく必要があるため、監視対象にする計算機の台数が多い場合、多くのメモリ量が必要になってしまうという問題がある。
〔発明の目的〕
そこで、本発明の目的は、監視対象となるネットワーク接続装置の台数が多い場合であっても、少ないメモリ量で、各ネットワーク接続装置が、自律的に他のネットワーク接続装置に障害が発生したか否かを監視できるようにすることにある。
本発明にかかる第1の相互監視システムは、
複数台の相互監視装置と、管理サーバとを含む相互監視システムにおいて、
前記各相互監視装置が、それぞれ、
自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては被監視対象装置となる相互監視装置を示す被監視対象識別情報が登録された管理情報記憶部と、
該管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段と、
切り離し処理手段とを備え、
該切り離し処理手段が、
前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段と、
前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている被監視対象識別情報を自装置を示すものに変更する管理情報変更手段とを含むことを特徴とする。
本発明にかかる第2の相互監視システムは、第1の相互監視システムにおいて、
前記探索手段が、
自装置の管理情報記憶部に登録されている被監視対象識別情報によって示される相互監視装置から順番に、その管理情報記憶部に登録されている被監視対象識別情報を問い合わせ、この問い合わせに応答して返却された被監視対象識別情報が示す相互監視装置と自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置とが一致する場合は、前記被監視対象識別情報を返却した相互監視装置を前記監視対象装置が監視対象装置にしていた相互監視装置と判定し、一致しない場合は、返却された被監視対象識別情報によって示される相互監視装置に対してその管理情報記憶部に登録されている被監視対象識別情報を問い合わせる構成を有することを特徴とする。
本発明にかかる第3の相互監視システムは、第1の相互監視システムにおいて、
前記探索手段が、
ブロードキャストにより前記各相互監視装置に対してその管理情報記憶部に登録されている被監視対象識別情報を問い合わせ、この問い合わせに応答して自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置と同一の相互監視装置を示す被監視対象識別情報を返却してきた相互監視装置を、前記監視対象装置が監視対象装置にしていた相互監視装置と判定する構成を有することを特徴とする。
本発明にかかる第4の相互監視システムは、第1の相互監視システムにおいて、
前記各相互監視装置が、
自装置のログ情報および前記管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置のログ情報が登録されたログ情報記憶部と、
自装置のログ情報を収集し、前記ログ情報記憶部に登録するログ収集手段と、
ログ取得要求に応答して、前記ログ情報記憶部に登録されている自装置のログ情報を要求元に返却する応答手段とを備え、且つ、
前記監視手段が、所定時間毎に、前記管理情報記憶部に登録されている監視対象情報識別情報によって示される監視対象装置に対してログ取得要求を送信し、このログ取得要求に応答してログ情報が返却された場合は、該返却されたログ情報を前記ログ情報記憶部に登録し、ログ情報が返却されなかった場合は、前記監視対象装置に障害が発生したと判定する構成を有し、
前記切り離し処理手段が、
前記監視手段が前記監視対象装置に障害が発生したことを検出したとき、前記ログ情報記憶部に登録されている監視対象装置のログ情報を前記管理サーバへ送信すると共に、前記ログ情報記憶部に登録されている監視対象装置のログ情報を前記新たな監視対象装置のログ情報記憶部に登録されている前記新たな監視対象装置自身のログ情報に変更するログ情報更新手段を備えたことを特徴とする。
本発明にかかる第5の相互監視システムは、第4の相互監視システムにおいて、
前記各相互監視装置の中から、自装置にとって監視対象装置となる相互監視装置および自装置にとって被監視対象装置となる相互監視装置を選択する選択手段と、
該選択手段によって選択された監視対象装置のログ情報記憶部に登録されている前記監視対象装置自身のログ情報を、自装置内のログ情報記憶部に登録するログ情報管理手段と、
自装置内の管理情報記憶部に、前記選択手段が選択した監視対象装置および被監視対象装置を示す監視対象識別情報および被監視対象識別情報を格納すると共に、前記選択手段が選択した監視対象装置および被監視対象装置の管理情報記憶部に登録されている被監視対象識別情報および監視対象識別情報を自装置を示すものに変更する管理情報管理手段とを備えたことを特徴とする。
本発明にかかる第6の相互監視システムは、第5の相互監視システムにおいて、
前記選択手段が、ブロードキャストによって前記各相互監視装置のIPアドレスを取得し、その中からホスト部の値が自装置のIPアドレスのホスト部の値に近い2個のIPアドレスを抽出し、該抽出した2個のIPアドレスの内の、一方のIPアドレスによって示される相互監視装置を監視対象装置とし、他方のIPアドレスによって示される相互監視装置を被監視対象装置とする構成を有することを特徴とする。
本発明にかかる第7の相互監視システムは、第1〜第6の相互監視システムにおいて、
前記監視対象識別情報が監視対象装置のIPアドレスであり、前記被監視対象識別情報が被監視対象装置のIPアドレスであることを特徴とする。
本発明にかかる第1の相互監視装置は、
複数台の相互監視装置と、管理サーバとを含む相互監視システムの構成要素である相互監視装置において、
自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては被監視対象装置となる相互監視装置を示す被監視対象識別情報が登録された管理情報記憶部と、
該管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段と、
切り離し処理手段とを備え、
該切り離し処理手段が、
前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段と、
前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている被監視対象識別情報を自装置を示すものに変更する管理情報変更手段とを含むことを特徴とする。
本発明にかかる第2の相互監視装置は、第1の相互監視装置において、
前記探索手段が、
自装置の管理情報記憶部に登録されている被監視対象識別情報によって示される相互監視装置から順番に、その管理情報記憶部に登録されている被監視対象識別情報を問い合わせ、この問い合わせに応答して返却された被監視対象識別情報が示す相互監視装置と自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置とが一致する場合は、前記被監視対象識別情報を返却した相互監視装置を前記監視対象装置が監視対象装置にしていた相互監視装置と判定し、一致しない場合は、返却された被監視対象識別情報によって示される相互監視装置に対してその管理情報記憶部に登録されている被監視対象識別情報を問い合わせる構成を有することを特徴とする。
本発明にかかる第3の相互監視装置は、第1の相互監視装置において、
前記探索手段が、
ブロードキャストにより前記各相互監視装置に対してその管理情報記憶部に登録されている被監視対象識別情報を問い合わせ、この問い合わせに応答して自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置と同一の相互監視装置を示す被監視対象識別情報を返却してきた相互監視装置を、前記監視対象装置が監視対象装置にしていた相互監視装置と判定する構成を有することを特徴とする。
本発明にかかる第4の相互監視装置は、第1の相互監視装置において、
自装置のログ情報および前記管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置のログ情報が登録されたログ情報記憶部と、
自装置のログ情報を収集し、前記ログ情報記憶部に登録するログ収集手段と、
ログ取得要求に応答して、前記ログ情報記憶部に登録されている自装置のログ情報を要求元に返却する応答手段とを備え、且つ、
前記監視手段が、所定時間毎に、前記管理情報記憶部に登録されている監視対象情報識別情報によって示される監視対象装置に対してログ取得要求を送信し、このログ取得要求に応答してログ情報が返却された場合は、該返却されたログ情報を前記ログ情報記憶部に登録し、ログ情報が返却されなかった場合は、前記監視対象装置に障害が発生したと判定する構成を有し、
前記切り離し処理手段が、
前記監視手段が前記監視対象装置に障害が発生したことを検出したとき、前記ログ情報記憶部に登録されている監視対象装置のログ情報を前記管理サーバへ送信すると共に、前記ログ情報記憶部に登録されている監視対象装置のログ情報を前記新たな監視対象装置のログ情報記憶部に登録されている前記新たな監視対象装置自身のログ情報に変更するログ情報更新手段を備えたことを特徴とする。
本発明にかかる第5の相互監視装置は、第4の相互監視装置において、
前記各相互監視装置の中から、自装置にとって監視対象装置となる相互監視装置および自装置にとって被監視対象装置となる相互監視装置を選択する選択手段と、
該選択手段によって選択された監視対象装置のログ情報記憶部に登録されている前記監視対象装置自身のログ情報を、自装置内のログ情報記憶部に登録するログ情報管理手段と、
自装置内の管理情報記憶部に、前記選択手段が選択した監視対象装置および被監視対象装置を示す監視対象識別情報および被監視対象識別情報を格納すると共に、前記選択手段が選択した監視対象装置および被監視対象装置の管理情報記憶部に登録されている被監視対象識別情報および監視対象識別情報を自装置を示すものに変更する管理情報管理手段とを備えたことを特徴とする。
本発明にかかる第6の相互監視装置は、第5の相互監視装置において、
前記選択手段が、ブロードキャストによって前記各相互監視装置のIPアドレスを取得し、その中からホスト部の値が自装置のIPアドレスのホスト部の値に近い2個のIPアドレスを抽出し、該抽出した2個のIPアドレスの内の、一方のIPアドレスによって示される相互監視装置を監視対象装置とし、他方のIPアドレスによって示される相互監視装置を被監視対象装置とする構成を有することを特徴とする。
本発明にかかる第7の相互監視装置は、第1〜第6の相互監視装置において、
前記監視対象識別情報が監視対象装置のIPアドレスであり、前記被監視対象識別情報が被監視対象装置のIPアドレスであることを特徴とする。
本発明にかかる第1の相互監視方法は、
複数台の相互監視装置と、管理サーバとを含み、且つ前記各相互監視装置が、それぞれ自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては被監視対象装置となる相互監視装置を示す被監視対象識別情報が登録された管理情報記憶部を備えた相互監視システムにおける相互監視方法であって、
各相互監視装置が、
自装置内の管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視ステップと、
前記監視ステップで前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索ステップと、
前記管理情報記憶部に登録されている監視対象識別情報を、前記探索ステップで探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている被監視対象識別情報を自装置を示すものに変更する管理情報変更ステップとを実行することを特徴とする。
本発明にかかる第2の相互監視方法は、第1の相互監視方法において、
前記探索ステップでは、
自装置の管理情報記憶部に登録されている被監視対象識別情報によって示される相互監視装置から順番に、その管理情報記憶部に登録されている被監視対象識別情報を問い合わせ、この問い合わせに応答して返却された被監視対象識別情報が示す相互監視装置と自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置とが一致する場合は、前記被監視対象識別情報を返却した相互監視装置を前記監視対象装置が監視対象装置にしていた相互監視装置と判定し、一致しない場合は、返却された被監視対象識別情報によって示される相互監視装置に対してその管理情報記憶部に登録されている被監視対象識別情報を問い合わせることを特徴とする。
本発明にかかるに第1のプログラムは、
監視対象装置となる相互監視装置を示す監視対象識別情報および被監視対象装置となる相互監視装置を示す被監視対象識別情報が登録された管理情報記憶部を備えたコンピュータを、複数台の相互監視装置と、管理サーバとを含む相互監視システムの構成要素である相互監視装置として機能させるためのプログラムであって、
前記コンピュータを、
前記管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段、
前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段、
前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている被監視対象識別情報を自装置を示すものに変更する管理情報変更手段として機能させる。
本発明にかかる第2のプログラムは、第1のプログラムにおいて、
前記探索手段が、
自装置の管理情報記憶部に登録されている被監視対象識別情報によって示される相互監視装置から順番に、その管理情報記憶部に登録されている被監視対象識別情報を問い合わせ、この問い合わせに応答して返却された被監視対象識別情報が示す相互監視装置と自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置とが一致する場合は、前記被監視対象識別情報を返却した相互監視装置を前記監視対象装置が監視対象装置にしていた相互監視装置と判定し、一致しない場合は、返却された被監視対象識別情報によって示される相互監視装置に対してその管理情報記憶部に登録されている被監視対象識別情報を問い合わせる構成を有する。
〔作用〕
各相互監視装置は、それぞれ自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては被監視対象装置となる相互監視装置を示す被監視対象識別情報が登録された管理情報記憶部を備えている。
また、各相互監視装置においては、監視手段が、それぞれ自装置内の管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視しており、その装置に障害が発生したことを検出すると、管理サーバに対して上記監視対象装置に障害が発生したことを通知する。
更に、各相互監視装置においては、自装置内の監視手段が監視対象装置に障害が発生したことを検出すると、上記障害の発生した監視対象装置が監視対象にしていた相互監視装置を自装置で監視するため、探索手段が、各相互監視装置の管理情報記憶部の内容に基づいて、上記障害の発生した監視対象装置が監視対象にしていた相互監視装置を探索し、管理情報変更手段が、自装置内の管理情報記憶部に登録されている監視対象識別情報を、探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている被監視対象識別情報を自装置を示すものに変更する。
本発明によれば、監視対象となる相互監視装置の台数が多い場合であっても、少ないメモリ量で、各相互監視装置が、自律的に他の相互監視装置に障害が発生したか否かを監視することが可能になる。
その理由は、各相互監視装置が、自装置内の管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視する監視手段と、監視手段によって監視対象装置に障害が発生したことが検出されたとき、上記障害の発生した監視対象装置が監視対象にしていた相互監視装置を、各相互監視装置の管理情報記憶部の内容に基づいて探索する探索手段と、自装置内の管理情報記憶部に登録されている監視対象識別情報を、探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている被監視対象識別情報を自装置を示すものに変更する管理情報変更手段とを備えているからである。即ち、各相互監視装置は、監視対象装置1台分の監視対象識別情報と、被監視対象装置1台分の監視対象識別情報とを保持しておくだけで良いので、全ての相互監視装置の識別情報を保持していおかなければならなかった従来の技術に比較して、メモリ量を少なくすることが可能になる(相互監視装置の台数が3台以上の場合)。
次に本発明の実施の形態について図面を参照して詳細に説明する。
〔実施の形態の構成の説明〕
図1は本発明にかかる相互監視システムの実施の形態の構成例を示すブロック図であり、コンピュータ等のネットワーク接続装置からなる複数台の相互監視装置1A〜1Dと、管理サーバ2と、それらを相互に接続するネットワーク3とから構成されている。なお、本実施の形態では、相互監視装置1A、1B、1C、1Dは、それぞれ相互監視装置1B、1C、1D、1Aを監視対象にしているとする。
図2は、相互監視装置1Aの構成例を示すブロック図であり、送受信手段11Aと、監視手段12Aと、応答手段13Aと、構成変更手段14Aと、ログ収集手段17Aと、記憶装置18Aと、キーボード等の入力部21Aと、LCD等の表示部22Aとを備えている。
記憶装置18Aは、磁気ディスク装置などによって実現されるものであり、ログ情報記憶部19Aと、管理情報記憶部20Aとを有している。
ログ情報記憶部19Aは、自装置1Aのログ情報が登録される自装置ログ記憶部191Aと、監視対象装置のログ情報が登録される監視対象ログ記憶部192Aとを備えている。また、管理情報記憶部20Aは、自装置1Aが監視対象にしている相互監視装置(監視対象装置)、1台分のIPアドレスが登録される監視対象アドレス記憶部201Aと、自装置1Aを監視対象にしている相互監視装置(被監視対象装置)、1台分のIPアドレスが登録される被監視対象アドレス記憶部202Aとを備えている。なお、本実施の形態では、監視対象アドレス記憶201Aには相互監視装置1BのIPアドレスが、被監視対象アドレス記憶部202Aには相互監視装置1DのIPアドレスが格納されている。
ログ収集手段17Aは、所定時間毎に自装置1Aのログ情報を収集し、収集したログ情報を自装置ログ記憶部191Aに追加登録する機能を有する。ログ収集手段17Aが収集するログ情報には、温度センサ等の各種センサの検出結果が異常であるか否かを示す情報も含まれている。
送受信手段11Aは、ネットワーク3を介してデータを送受信する機能を有する。
監視手段12Aは、次のような機能を有する。
・監視対象装置である相互監視装置1Bに対して所定周期でログ取得要求を送信する機能。
・ログ取得要求に応答して相互監視装置1Bから返却されたログ情報を監視対象ログ記憶部192Aに追加登録する機能。
・ログ取得要求を送信後、所定時間が経過しても相互監視装置1Bからログ情報が返却されなかった場合、および返却されたログ情報が相互監視装置1Bに障害が発生していることを示している場合は、管理サーバ2に対して障害発生通知を送信すると共に、構成変更手段14Aに対して切り離し処理開始を指示する機能。
応答手段13Aは、被監視対象装置である相互監視装置1Dからログ情報取得要求が送られてきた場合、自装置ログ記憶部191Aに登録されているログ情報の内の、未送信のログ情報を相互監視装置1Dへ送信する機能を有する。
構成変更手段14Aは、障害の発生した相互監視装置を相互監視システムから切り離すための処理を行う切り離し処理手段15Aと、相互監視システムに新たな相互監視装置を追加するための処理を行う追加処理手段16Aとを備えている。
図3は、切り離し処理手段15Aの構成例を示すブロック図であり、探索手段151A、管理情報変更手段152A、ログ情報変更手段153A及び切り離し通知手段154Aを備えている。
探索手段151Aは、監視対象装置である相互監視装置1Bに障害が発生したとき、相互監視装置1Bが監視対象装置にしていた相互監視装置1Cを探索する機能を有する。
管理情報変更手段152Aは、次のような機能を有する。
・監視対象アドレス記憶部201Aに登録されている相互監視装置1BのIPアドレスを、探索手段151Aが探し出した相互監視装置1CのIPアドレスに変更することにより、監視対象装置を相互監視装置1Bから相互監視装置1Cに変更する機能。
・新たな監視対象装置(相互監視装置1C)に対して、被監視対象装置のIPアドレスを自装置1AのIPアドレスに変更することを要求する第1のアドレス変更要求を送信する機能。
・他の相互監視装置から第1のアドレス変更要求が送られてきたとき、被監視対象アドレス記憶部202Aの内容を上記要求に従って変更する機能。
ログ情報変更手段153Aは、次のような機能を有する。
・監視対象ログ記憶部192Aに登録されているログ情報を管理サーバ2へ送信する機能。
・新たな監視対象装置(相互監視装置1C)に対して、その装置1C自身のログ情報を要求する第1のログ情報要求を送信する機能。
・この第1のログ情報要求に応答して相互監視装置1Cから送られてきたログ情報を監視対象ログ記憶部192Aに登録(上書き)する機能。
・他の相互監視装置から第1のログ情報要求が送られてきたとき、自装置ログ記憶部191Aに登録されている自装置1Aのログ情報を要求元に送信する機能。
切り離し通知手段154Aは、管理サーバ2に対して障害の発生した相互監視装置1Bを切り離したことを通知する機能を有する。
図4は、追加処理手段16Aの構成例を示すブロック図であり、選択手段161A、管理情報管理手段162A、ログ情報管理手段163A及び組み込み通知手段164Aを備えている。
選択手段161Aは、自装置1Aが新たに相互監視システムに加わる場合、相互監視システムを構成している相互監視装置の中から、監視対象装置にする相互監視装置と、被監視対象装置にする相互監視装置を選択する機能を有する。
管理情報管理手段162Aは、次のような機能を有する。
・選択手段161Aによって選択された監視対象装置および被監視対象装置のIPアドレスを、それぞれ監視対象アドレス記憶部201Aおよび被監視対象アドレス記憶部202Aに登録する機能。
・選択手段161Aが選択した監視対象装置に対して、被監視対象装置のIPアドレスを自装置1AのIPアドレスに変更することを要求する第2のアドレス変更要求を送信する機能。
・他の相互監視装置から第2のアドレス変更要求が送られてきた場合、被監視対象アドレス記憶部202Aの内容を、上記第2のアドレス変更要求に従って変更する機能。
・選択手段161Aが選択した被監視対象装置に対して、監視対象装置のIPアドレスを自装置1AのIPアドレスに変更することを要求する第3のアドレス変更要求を送信する機能。
・他の相互監視装置から第3のアドレス変更要求が送られてきた場合、監視対象アドレス記憶部201Aの内容を、上記第3のアドレス変更要求に従って変更する機能。
ログ情報管理手段163Aは、次のような機能を有する。
・選択手段161Aが選択した監視対象装置に対して、その装置自身のログ情報を要求する第2のログ情報要求を送信する機能。
・この第2のログ情報要求に応答して上記監視対象装置から送られてきたログ情報を監視対象ログ記憶部192Aに登録する機能。
・他の相互監視装置から第2のログ情報要求が送られてきた場合、自装置ログ記憶部191に登録されているログ情報を要求元に送信する機能。
組み込み通知手段164は、自装置1Aが相互監視システムに組み込まれたことを管理サーバ2へ通知する機能を有する。
このような機能を有する相互監視装置1Aは、コンピュータによって実現可能であり、コンピュータによって実現する場合は、例えば、次のようにする。コンピュータを相互監視装置1Aとして機能させるためのプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、送受信手段11A、監視手段12A、応答手段13A、構成変更手段14A及びログ収集手段17Aを実現する。
なお、他の相互監視装置も相互監視装置1Aと同様の構成を有しており、コンピュータによって実現可能なものである。また、以下の説明では、相互監視装置1B、1C、1D、…内の手段等を表す場合、添え字B、C、D、…を付すものとする。例えば、相互監視装置1C内の監視手段を表す場合には、監視手段12Cと記す。
〔実施の形態の動作の説明〕
次に、本実施の形態の動作について詳細に説明する。
先ず、各相互監視装置1A〜1Dにおいて行われている監視動作について説明する。今、図5(A)に示すように、各相互監視装置1A、1B、1C、1Dがそれぞれ相互監視装置1B、1C、1D、1Aを監視対象装置にしているとする。この場合、各相互監視装置1A、1B、1C、1D内の監視対象アドレス201A、201B、201C、201Dにはそれぞれ相互監視装置1B、1C、1D、1AのIPアドレスが登録され、被監視対象アドレス記憶部202Aにはそれぞれ相互監視装置1D、1A、1B、1CのIPアドレスが登録されている。
各相互監視装置1A〜1D内の監視手段12A〜12Dは、所定周期で図6のフローチャートに示す処理を行っている。この処理を監視手段12Aを例に挙げて説明すると、次のようになる。
監視手段12Aは、先ず、監視対象アドレス記憶部201Aから監視対象装置にしている相互監視装置1BのIPアドレスを入力し、このIPアドレスによって特定される相互監視装置1Bに対してログ取得要求を送信する(ステップS61、S62)。
相互監視装置1B内の応答手段13Bは、相互監視装置1Aからログ取得要求が送られてくると、図7のフローチャートに示すように、自装置ログ記憶部191Bからまだ送信していないログ情報を入力し、要求元の相互監視装置1Aに返信する(ステップS71,S72)。このログ情報には、前述したように、各種センサの状態を示す情報などが含まれている。
相互監視装置1Aの監視手段12Aは、ログ取得要求を送信後、所定時間以内にログ情報を受信すると(図6のステップS63がYES、S64がNO)、受信したログ情報を監視対象ログ記憶部192Aに追加登録する(ステップS65)。その後、ログ情報が相互監視装置1Bに障害が発生していることを示しているか否かを調べ、障害が発生していないことを示している場合(ステップS66がNO)は、その処理を終了する。これに対して、相互監視装置1Bから送られてきたログ情報が障害発生を示している場合(ステップS66がYES)は、管理サーバ2に対して相互監視装置1Bに障害が発生したことを通知すると共に、切り離し処理手段15Aに対して処理開始を指示する(ステップS67、S68)。なお、ログ取得要求を送信後、所定時間以内にログ情報を受信できなかった場合(ステップS64がYES)も、ステップS67、S68の処理を行う。
次に、相互監視装置に障害が発生したときの動作を、相互監視装置1Bに障害が発生した場合を例の挙げて説明する。
相互監視装置1Bに障害が発生すると〔図5(A)のa〕、相互監視装置1Bを監視対象にしている相互監視装置1A内の監視手段12Aは、それを検出し(図6のステップS64或いはステップS66がYES)、管理サーバ2に対して相互監視装置1Bに障害が発生したことを通知し〔図5(A)のb、図6のステップS67〕、更に、切り離し処理手段15Aに処理開始を指示する(ステップS68)。
切り離し処理手段15Aは、監視手段12Aから処理開始が指示されると、先ず、探索手段151Aを用いて、障害の発生した相互監視装置1Bを被監視対象装置としていた相互監視装置を探索する〔図5(A)のc〕。
探索手段151Aは、該当する相互監視装置を探索するため、例えば、図8のフローチャートに示す処理を行う。
先ず、探索手段151Aは、被監視対象アドレス記憶部202Aから相互監視装置1Aが被監視対象にしている相互監視装置1DのIPアドレスを入力し、そのIPアドレスによって特定される相互監視装置1Dに対して、被監視対象問い合わせを送信する(ステップS81、S82)。その後、探索手段151Aは、受信待ち状態となる(ステップS83)。
相互監視装置1D内の探索手段151Dは、相互監視装置1Aから被監視対象問い合わせが送られてくると、図9のフローチャートに示すように、自装置1D内の被監視対象アドレス記憶部202Dから、自装置1Dが被監視対象にしている相互監視装置1CのIPアドレスを入力し、それを問い合わせ元に返却する(ステップS91、S92)。
問い合わせ元の探索手段151Aは、問い合わせ先の相互監視装置1Dから送られてきた相互監視装置1CのIPアドレスを受信すると(図8のステップS83)、この受信したIPアドレスと、監視対象アドレス記憶部201Aに登録されているIPアドレス(自装置1Aが監視対象にしている相互監視装置1BのIPアドレス)とを比較する(ステップS84)。この例の場合、比較結果が不一致となるので(ステップS85がNO)、探索手段151Aは、受信したIPアドレスに基づいて、相互監視装置1Cに対して被監視対象問い合わせを送信する(ステップS86)。
相互監視装置1C内の探索手段151Cは、相互監視装置1Aから被監視対象問い合わせが送られてくると、自装置1Cが被監視装置としている相互監視装置1BのIPアドレスを被監視対象アドレス記憶部202Cから入力し、問い合わせ元の相互監視装置1Aに返却する(図9のステップS91、S92)。
相互監視装置1A内の探索手段151Aは、今回受信した相互監視装置1BのIPアドレスと、監視対象アドレス記憶部201Aに登録されている、監視対象装置としている相互監視装置1BのIPアドレスとが一致するので(ステップS85がYES)、送信元の相互監視装置1CのIPアドレスを、新たな監視対象装置のIPアドレスとして内部に保持し、その後、ログ情報変更手段153Aに処理開始を指示する(ステップS87、S88)。
ログ情報変更手段153Aは、処理開始が指示されると、管理サーバ2に対して、監視対象ログ記憶部192Aに登録されているログ情報(相互監視装置1Bのログ情報)を送る〔図5(B)のd、図10のステップS101〕。その後、ログ情報変更手段153Aは、新たな監視対象装置である相互監視装置1Cに対して第1のログ情報要求を送信し、受信待ち状態となる(ステップS102)。
相互監視装置1C内のログ情報変更手段153Cは、相互監視装置1Aからの第1のログ情報要求を受信すると、自装置ログ記憶部191Cからログ情報(相互監視装置1Cのログ情報)を入力し、要求元の相互監視装置1Aに返信する〔図11のステップS111、S112及び図5(B)のe〕。
相互監視装置1A内のログ情報変更手段153Aは、新たな監視対象装置である相互監視装置1Cからログ情報が送られてくると、それを監視対象ログ記憶部192Aに登録し、その後、管理情報変更手段152Aに対して処理開始を指示する(図10のステップS103、S104)。
管理情報変更手段152Aは、処理開始が指示されると、監視対象アドレス記憶部201Aに登録されている相互監視装置1BのIPアドレスを、新たな監視対象装置である相互監視装置1CのIPアドレスで置き換える(図12のステップS121)。その後、管理情報変更手段152Aは、新たな監視対象装置である相互監視装置1Cに対して、自装置1AのIPアドレスを含む第1のアドレス変更要求を送信し〔ステップS122及び図5(B)のf〕、処理を終了する。
相互監視装置1C内の管理情報変更手段152Cは、第1のアドレス変更要求を受信すると、図13のフローチャートに示すように、被監視対象アドレス記憶部202Cに格納されている相互監視装置1BのIPアドレスを、第1のアドレス変更要求に含まれている、新たな被監視対象装置(相互監視装置1A)のIPアドレスで置き換える(ステップS131)。
一方、相互監視装置1A内の切り離し手段154Aは、管理情報変更手段152Aの処理が終了すると、管理サーバ2に対して、相互監視装置1Bを切り離したことを示す切り離し通知を送信する〔図5(B)のg〕。これ以後は、相互監視装置1Aは、障害の発生した相互監視装置1Bの代わりに相互監視装置1Cを監視対象にして監視処理を行うことになる。なお、相互監視装置1Bが復旧した場合には、以下に述べる相互監視装置の組み込み時の処理と同様の処理が行われ、相互監視装置1Bが再び相互監視システムに組み込まれる。
次に、新たな相互監視装置を相互監視システムに組み込む場合の動作を、図14に示すように、新たな相互監視装置1Eを相互監視システムに組み込む場合を例に挙げて説明する。
相互監視装置1Eを相互監視システムに組み込む場合、相互監視装置1Eの管理者は、入力部21Eから追加処理開始指示を入力する。
相互監視装置1E内の追加処理手段16Eは、入力部21Eから追加処理開始指示が入力されると、選択手段161Eを用いて、相互監視装置1Eの追加位置を選択する〔図14(A)のh〕。
選択手段161Eは、追加位置を選択するため、例えば、図15のフローチャートに示す処理を行う。
先ず、選択手段161Eは、ブロードキャストによりIPアドレス問い合わせを送信し、相互監視システムを構成している各相互監視装置1A〜1Dにその装置のIPアドレスを問い合わせ(ステップS151)、その後、受信待ち状態になる(ステップS152)。
各相互監視装置1A〜1D内の選択手段161A〜161Dは、相互監視装置1EからのIPアドレス問い合わせを受信すると、自装置1A〜1DのIPアドレスを問い合わせ元の相互監視装置1Eに返却する(図16のステップS161)。
問い合わせ元の選択手段161Eは、IPアドレス問い合わせを送信してから所定時間(相互監視システムを構成する全ての相互監視装置1A〜1DからIPアドレスを入手するのに十分な時間)が経過すると、受信した各相互監視装置1A〜1DのIPアドレスの中から、そのホスト部(ホストアドレス)が自装置EのIPアドレスのホスト部に近いIPアドレスを2つ選択し、その内の一方のIPアドレス(例えば、大きな方)によって示される相互監視装置を、相互監視装置1Eが監視対象にする装置、他方のIPアドレスによって示される相互監視装置を、相互監視装置1Eが被監視対象にする装置として選択する(図15のステップS153)。なお、この例では、相互監視装置1B、1Aがそれぞれ監視対象装置、被監視対象装置として選択されたとする。
その後、選択手段161Eは、ログ情報管理手段163Eに対して処理開始を指示する(ステップS154)。
ログ情報管理手段163Eは、処理開始が指示されると、監視対象装置とする相互監視装置1Bに対して第2のログ情報要求を送信し、応答待ち状態となる(図17のステップS171)。
相互監視装置1B内のログ情報管理手段163Bは、第2のログ情報要求を受信すると、自装置ログ記憶部191Bからログ情報を入力し、それを要求元のログ情報管理手段163Eへ返却する〔図18のステップS181、S182および図14(A)のi〕。
要求元のログ情報管理手段163Eは、監視対象装置とする相互監視装置1Bから送られてきたログ情報を、監視対象ログ記憶部192Eに登録し(図17のステップS172)、その後、管理情報管理手段162Eに処理開始を指示する(ステップS173)。
管理情報管理手段162Eは、処理開始が指示されると、図19のフローチャートに示すように、監視対象装置とする相互監視装置1Bおよび被監視対象装置とする相互監視装置1Aに対して、それぞれ第2および第3のアドレス変更要求を送信し(ステップS191)、その後、監視対象アドレス記憶部201Eに監視対象装置となる相互監視装置1BのIPアドレスを格納し、被監視対象アドレス記憶部202Eに被監視対象装置となる相互監視装置1AのIPアドレスを格納し(ステップS192)、処理を終了する。なお、第2および第3のアドレス変更要求には、相互監視装置1EのIPアドレスが含まれている。
相互監視装置1B内の管理情報管理手段162Bは、第2のアドレス変更要求を受信すると、被監視対象アドレス記憶部202Bの内容を上記要求に含まれている相互監視装置1EのIPアドレスに書き換え〔図20のステップS201および図14(A)のj〕、相互監視装置1A内の管理情報管理手段162Aは、第3のアドレス変更要求を受信すると、監視対象アドレス記憶部201Aの内容を上記要求に含まれている相互監視装置1EのIPアドレスに書き換える〔図21のステップS211および図14(A)のk〕。以上の処理により、相互監視装置1Eが相互監視システムに組み込まれ〔図14(B)のm〕、その後、組み込み通知手段164Eが、管理サーバ2に対して相互監視装置1Eが相互監視システムに組み込まれたことを通知する。この通知には、例えば、組み込まれた相互監視装置1EのIPアドレス、監視対象装置とする相互監視装置1BのIPアドレス及び被監視対象とする相互監視装置1AのIPアドレスが含まれる。
なお、上述した説明では、相互監視装置に障害が発生した場合、探索手段が、ユニキャストによって新たな監視対象装置を探索するようにしたが、ブロードキャストによって探索するようにしても良い。この場合、探索手段151は、図8のフローチャートに代わりに、図22のフローチャートに示す処理を行うことになる。なお、以下の説明では、相互監視システムは、図5(A)に示すように相互監視装置1A〜1Dから構成され、相互監視装置1Bに障害が発生しているとする。
図22及び図5を参照すると、探索手段151Aは、先ず、ブロードキャストにより被監視対象問い合わせを、相互監視システムを構成する各相互監視装置へ送信する(ステップS221)。
正常動作している各相互監視装置1C、1D内の探索手段151C、151Dは、それぞれ自装置1C、1D内の被監視対象アドレス記憶部202C、202Dから被監視対象装置としている相互監視装置1B、1CのIPアドレスを入力し、要求元へ返却する(図9のステップS91、S92)。
探索手段151Aは、被監視対象装置のIPアドレスを受信する毎に、それをリスト(図示せず)に登録する(図22のステップS222がYES、S223)。その際、返信元のIPアドレスも併せて登録する。
そして、被監視問い合わせを送信してから所定時間が経過すると(ステップS224がYES)、探索手段151Aは、リストに登録されている被監視対象装置のIPアドレスの1つに注目し、それと自装置1Aが監視対象装置としている相互監視装置1BのIPアドレスとを比較する(ステップS225、S226がYES、S227)。
そして、両者が不一致の場合(ステップS228がNO)は、ステップS225の処理に戻る。これに対して、両者が一致している場合(ステップS228がYES)は、注目したIPアドレスの返却元の相互監視装置のIPアドレスを、新たな監視対象装置にする相互監視装置のIPアドレスとして内部に保持し(ステップS229)、その後、ログ情報変更手段153Aに対して処理開始を指示する(ステップS230)。これ以降の処理は、前述した通りである。なお、リストに登録されている被監視対象装置のIPアドレスの中に、自装置1Aが監視対象装置としている相互監視装置1BのIPアドレスと一致するものがなかった場合(ステップS226がNO)には、表示部22Aのその旨を表示するといったエラー処理を行い(ステップS231)、その処理を終了する。
〔実施の形態の効果〕
本実施の形態によれば、監視対象となる相互監視装置の台数が多い場合であっても、少ないメモリ量で、各相互監視装置が、自律的に他の相互監視装置に障害が発生したか否かを監視することが可能になる。
その理由は、各相互監視装置1A〜1Dが、自装置内の管理情報記憶部20A〜20Dに登録されている監視対象識別情報によって示される監視対象装置を監視する監視手段12A〜12Dと、監視手段12A〜12Dによって監視対象装置に障害が発生したことが検出されたとき、上記障害の発生した監視対象装置が監視対象にしていた相互監視装置を、各相互監視装置の管理情報記憶部20A〜20Dの内容に基づいて探索する探索手段151A〜151Dと、自装置1A〜1D内の管理情報記憶部20A〜20Dに登録されている監視対象識別情報を、探索手段151A〜151Dが探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部20A〜20Dに登録されている被監視対象識別情報を自装置を示すものに変更する管理情報変更手段152A〜152Dとを備えているからである。即ち、各相互監視装置1A〜1Dは、監視対象装置1台分の監視対象識別情報と、被監視対象装置1台分の監視対象識別情報とを保持しておくだけで良いので、全ての相互監視装置の識別情報を保持していおかなければならなかった従来の技術に比較して、メモリ量を少なくすることが可能になる。
また、本実施の形態によれば、障害の発生した相互監視装置(例えば、相互監視装置1B)のログ情報を確実に入手することが可能になる。その理由は、上記相互監視装置1Bを監視対象にしている相互監視装置1A内の監視手段12Aが、所定時間毎に上記相互監視装置1Bからその装置のログ情報を取得し、ログ情報記憶部19Aに登録するようにしているからである。
また、本実施の形態によれば、相互監視システムに新たな相互監視装置(例えば、相互監視装置1E、図14参照)を容易に追加することが可能になる。その理由は、相互監視システムを構成する各相互監視装置1A〜1Dの中から、自装置1Eにとって監視対象装置となる相互監視装置1Bおよび自装置1Eにとって被監視対象装置となる相互監視装置1Aを選択する選択手段161Eと、自装置1E内の管理情報記憶部20Eに、選択手段161Eが選択した監視対象装置1Bおよび被監視対象装置1Aを示す監視対象識別情報および被監視対象識別情報を格納すると共に、上記選択手段161Eが選択した監視対象装置1Bおよび被監視対象装置1Aの管理情報記憶部20B、20Aに登録されている被監視対象識別情報および監視対象識別情報を自装置1Eを示すものに変更する管理情報管理手段162Eとを備えているからである。
本発明は、ネットワークに接続されているコンピュータ等のネットワーク接続装置の障害検出に適用できる。
本発明にかかる相互監視システムの構成例を示すブロック図である。 相互監視装置1Aの構成例を示すブロック図である。 切り離し処理手段15Aの構成例を示すブロック図である。 追加処理手段16Aの構成例を示すブロック図である。 相互監視装置1Bに障害が発生したときの動作を説明するための図である。 監視手段12Aの処理例を示すフローチャートである。 応答手段13Bの処理例を示すフローチャートである。 切り離し処理開始が指示されたときの探索手段151Aの処理例を示すフローチャートである。 被監視対象問い合わせを受信したときの探索手段151Dの処理例を示すフローチャートである。 処理開始が指示されたときのログ情報変更手段152Aの処理例を示すフローチャートである。 第1のログ情報要求を受信したときのログ情報変更手段153Cの処理例を示すフローチャートである。 処理開始が指示されたときの管理情報変更手段152Aの処理例を示すフローチャートである。 第1のアドレス変更要求を受信したときの管理情報変更手段152Cの処理例を示すフローチャートである。 相互監視装置1Eを相互監視システムに追加するときの動作を説明するための図である。 追加処理開始が指示されたときの選択手段161Eの処理例を示すフローチャートである。 IPアドレス問い合わせを受信したときの選択手段161A〜161Dの処理例を示すフローチャートである。 処理開始が指示されたときのログ情報管理手段163Eの処理例を示すフローチャートである。 第2のログ情報要求を受信したときのログ情報管理手段163Bの処理例を示すフローチャートである。 処理開始が指示されたときの管理情報管理手段162Eの処理例を示すフローチャートである。 第2のアドレス変更要求を受信したときの管理情報管理手段162Bの処理例を示すフローチャートである。 第3のアドレス変更要求を受信したときの管理情報管理手段162Aの処理例を示すフローチャートである。 ブロードキャストで新たな監視対象装置を探索する場合の探索手段151Aの処理例を示すフローチャートである。
符号の説明
1A〜1E…相互監視装置
11A…送受信手段
12A…監視手段
13A…応答手段
14A…構成変更手段
15A…切り離し処理手段
151A…探索手段
152A…管理情報変更手段
153A…ログ情報変更手段
154A…切り離し通知手段
16A…追加処理手段
161A…選択手段
162A…管理情報管理手段
163A…ログ情報管理手段
164A…組み込み通知手段
17A…ログ収集手段
18A…記憶装置
19A…ログ情報記憶部
191A…自装置ログ記憶部
192A…監視対象ログ記憶部
20A…管理情報記憶部
201A…監視対象アドレス記憶部
202A…被監視対象アドレス記憶部
21A…入力部
22A…表示部
2…管理サーバ
3…ネットワーク

Claims (8)

  1. 複数台の相互監視装置と、管理サーバとを含み、
    前記各相互監視装置が、それぞれ、
    自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては自装置を監視する監視装置となる相互監視装置を示す監視装置識別情報が登録された管理情報記憶部と、
    該管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段と、
    切り離し処理手段とを備え、
    該切り離し処理手段が、
    前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段と、
    前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている監視装置識別情報を自装置を示すものに変更する管理情報変更手段とを含む相互監視システムであって、
    前記探索手段が、
    自装置の管理情報記憶部に登録されている監視装置識別情報によって示される相互監視装置から順番に、その管理情報記憶部に登録されている監視装置識別情報を問い合わせ、この問い合わせに応答して返却された監視装置識別情報が示す相互監視装置と自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置とが一致する場合は、前記監視装置識別情報を返却した相互監視装置を前記監視対象装置が監視対象装置にしていた相互監視装置と判定し、一致しない場合は、返却された監視装置識別情報によって示される相互監視装置に対してその管理情報記憶部に登録されている監視装置識別情報を問い合わせる構成を有することを特徴とする相互監視システム。
  2. 複数台の相互監視装置と、管理サーバとを含み、
    前記各相互監視装置が、それぞれ、
    自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては自装置を監視する監視装置となる相互監視装置を示す監視装置識別情報が登録された管理情報記憶部と、
    該管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段と、
    切り離し処理手段とを備え、
    該切り離し処理手段が、
    前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段と、
    前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている監視装置識別情報を自装置を示すものに変更する管理情報変更手段とを含む相互監視システムであって、
    前記探索手段が、
    ブロードキャストにより前記各相互監視装置に対してその管理情報記憶部に登録されている監視装置識別情報を問い合わせ、この問い合わせに応答して自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置と同一の相互監視装置を示す監視装置識別情報を返却してきた相互監視装置を、前記監視対象装置が監視対象装置にしていた相互監視装置と判定する構成を有することを特徴とする相互監視システム。
  3. 複数台の相互監視装置と、管理サーバとを含み、
    前記各相互監視装置が、それぞれ、
    自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては自装置を監視する監視装置となる相互監視装置を示す監視装置識別情報が登録された管理情報記憶部と、
    該管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段と、
    切り離し処理手段とを備え
    該切り離し処理手段が、
    前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段と、
    前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている監視装置識別情報を自装置を示すものに変更する管理情報変更手段とを含む相互監視システムであって、
    前記各相互監視装置が、
    前記各相互監視装置の中から、自装置にとって監視対象装置となる相互監視装置および自装置にとって監視装置となる相互監視装置を選択する選択手段であって、ブロードキャストによって前記各相互監視装置のIPアドレスを取得し、その中からホスト部の値が自装置のIPアドレスのホスト部の値に近い2個のIPアドレスを抽出し、該抽出した2個のIPアドレスの内の、一方のIPアドレスによって示される相互監視装置を監視対象装置とし、他方のIPアドレスによって示される相互監視装置を監視装置とする選択手段と、
    自装置内の管理情報記憶部に、前記選択手段が選択した監視対象装置および監視装置を示す監視対象識別情報および監視装置識別情報を格納すると共に、前記選択手段が選択した監視対象装置および監視装置の管理情報記憶部に登録されている監視装置識別情報および監視対象識別情報を自装置を示すものに変更する管理情報管理手段とを備えたことを特徴とする相互監視システム。
  4. 複数台の相互監視装置と、管理サーバとを含む相互監視システムの構成要素である相互監視装置であって、
    自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては自装置を監視する監視装置となる相互監視装置を示す監視装置識別情報が登録された管理情報記憶部と、
    該管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段と、
    切り離し処理手段とを備え、
    該切り離し処理手段が、
    前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段と、
    前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている監視装置識別情報を自装置を示すものに変更する管理情報変更手段とを含み、
    前記探索手段が、
    自装置の管理情報記憶部に登録されている監視装置識別情報によって示される相互監視装置から順番に、その管理情報記憶部に登録されている監視装置識別情報を問い合わせ、この問い合わせに応答して返却された監視装置識別情報が示す相互監視装置と自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置とが一致する場合は、前記監視装置識別情報を返却した相互監視装置を前記監視対象装置が監視対象装置にしていた相互監視装置と判定し、一致しない場合は、返却された監視装置識別情報によって示される相互監視装置に対してその管理情報記憶部に登録されている監視装置識別情報を問い合わせる構成を有することを特徴とする相互監視装置。
  5. 複数台の相互監視装置と、管理サーバとを含む相互監視システムの構成要素である相互監視装置であって、
    自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては自装置を監視する監視装置となる相互監視装置を示す監視装置識別情報が登録された管理情報記憶部と、
    該管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段と、
    切り離し処理手段とを備え、
    該切り離し処理手段が、
    前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段と、
    前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている監視装置識別情報を自装置を示すものに変更する管理情報変更手段とを含み、
    前記探索手段が、
    ブロードキャストにより前記各相互監視装置に対してその管理情報記憶部に登録されている監視装置識別情報を問い合わせ、この問い合わせに応答して自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置と同一の相互監視装置を示す監視装置識別情報を返却してきた相互監視装置を、前記監視対象装置が監視対象装置にしていた相互監視装置と判定する構成を有することを特徴とする相互監視装置。
  6. 複数台の相互監視装置と、管理サーバとを含む相互監視システムの構成要素である相互監視装置であって、
    自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては自装置を監視する監視装置となる相互監視装置を示す監視装置識別情報が登録された管理情報記憶部と、
    該管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段と、
    前記各相互監視装置の中から、自装置にとって監視対象装置となる相互監視装置および自装置にとって自装置を監視する監視装置となる相互監視装置を選択する選択手段であって、ブロードキャストによって前記各相互監視装置のIPアドレスを取得し、その中からホスト部の値が自装置のIPアドレスのホスト部の値に近い2個のIPアドレスを抽出し、該抽出した2個のIPアドレスの内の、一方のIPアドレスによって示される相互監視装置を監視対象装置とし、他方のIPアドレスによって示される相互監視装置を監視装置とする選択手段と、
    自装置内の管理情報記憶部に、前記選択手段が選択した監視対象装置および監視装置を示す監視対象識別情報および監視装置識別情報を格納すると共に、前記選択手段が選択した監視対象装置および監視装置の管理情報記憶部に登録されている監視装置識別情報および監視対象識別情報を自装置を示すものに変更する管理情報管理手段と、
    切り離し処理手段とを備え、
    該切り離し処理手段が、
    前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段と、
    前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている監視装置識別情報を自装置を示すものに変更する管理情報変更手段とを含むことを特徴とする相互監視装置。
  7. 複数台の相互監視装置と、管理サーバとを含み、且つ前記各相互監視装置が、それぞれ自装置にとっては監視対象装置となる相互監視装置を示す監視対象識別情報および自装置にとっては自装置を監視する監視装置となる相互監視装置を示す監視装置識別情報が登録された管理情報記憶部を備えた相互監視システムにおける相互監視方法であって、
    各相互監視装置が、
    自装置内の管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視ステップと、
    前記監視ステップで前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索ステップと、
    前記管理情報記憶部に登録されている監視対象識別情報を、前記探索ステップで探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている監視装置識別情報を自装置を示すものに変更する管理情報変更ステップとを実行し、
    前記探索ステップでは、
    自装置の管理情報記憶部に登録されている監視装置象識別情報によって示される相互監視装置から順番に、その管理情報記憶部に登録されている監視装置識別情報を問い合わせ、この問い合わせに応答して返却された監視装置識別情報が示す相互監視装置と自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置とが一致する場合は、前記監視装置識別情報を返却した相互監視装置を前記監視対象装置が監視対象装置にしていた相互監視装置と判定し、一致しない場合は、返却された監視装置識別情報によって示される相互監視装置に対してその管理情報記憶部に登録されている監視装置識別情報を問い合わせることを特徴とする相互監視方法。
  8. 監視対象装置となる相互監視装置を示す監視対象識別情報および自装置を監視する監視装置となる相互監視装置を示す監視装置識別情報が登録された管理情報記憶部を備えたコンピュータを、複数台の相互監視装置と、管理サーバとを含む相互監視システムの構成要素である相互監視装置として機能させるためのプログラムであって、
    前記コンピュータを、
    前記管理情報記憶部に登録されている監視対象識別情報によって示される監視対象装置を監視し、該監視対象装置に障害が発生したことを検出したとき、前記管理サーバに対して前記監視対象装置に障害が発生したことを通知する監視手段、
    前記監視手段によって前記監視対象装置に障害が発生したことが検出されたとき、各相互監視装置の管理情報記憶部の内容に基づいて、前記監視対象装置が監視対象装置としていた相互監視装置を探索する探索手段、
    前記管理情報記憶部に登録されている監視対象識別情報を、前記探索手段が探索した相互監視装置を示すものに変更すると共に、変更後の監視対象識別情報によって示される新たな監視対象装置の管理情報記憶部に登録されている監視装置識別情報を自装置を示すものに変更する管理情報変更手段として機能させ、且つ、
    前記探索手段が、
    自装置の管理情報記憶部に登録されている監視装置識別情報によって示される相互監視装置から順番に、その管理情報記憶部に登録されている監視装置識別情報を問い合わせ、この問い合わせに応答して返却された監視装置識別情報が示す相互監視装置と自装置内の管理情報記憶部に登録されている監視対象識別情報が示す相互監視装置とが一致する場合は、前記監視装置識別情報を返却した相互監視装置を前記監視対象装置が監視対象装置にしていた相互監視装置と判定し、一致しない場合は、返却された監視装置識別情報によって示される相互監視装置に対してその管理情報記憶部に登録されている監視装置識別情報を問い合わせる構成を有することを特徴とするプログラム。
JP2005304277A 2005-10-19 2005-10-19 相互監視システム、相互監視装置、相互監視方法およびプログラム Expired - Fee Related JP4940624B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005304277A JP4940624B2 (ja) 2005-10-19 2005-10-19 相互監視システム、相互監視装置、相互監視方法およびプログラム
US11/422,706 US7734769B2 (en) 2005-10-19 2006-06-07 Monitoring system of apparatuses connected in a network, monitoring apparatus, monitoring method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005304277A JP4940624B2 (ja) 2005-10-19 2005-10-19 相互監視システム、相互監視装置、相互監視方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2007114941A JP2007114941A (ja) 2007-05-10
JP4940624B2 true JP4940624B2 (ja) 2012-05-30

Family

ID=37949300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005304277A Expired - Fee Related JP4940624B2 (ja) 2005-10-19 2005-10-19 相互監視システム、相互監視装置、相互監視方法およびプログラム

Country Status (2)

Country Link
US (1) US7734769B2 (ja)
JP (1) JP4940624B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4905165B2 (ja) * 2007-02-07 2012-03-28 富士通株式会社 監視支援プログラム、監視方法および監視システム
JP5287402B2 (ja) * 2009-03-19 2013-09-11 富士通株式会社 ネットワーク監視制御装置
JP5471334B2 (ja) * 2009-11-16 2014-04-16 富士通株式会社 マルチプロセッサシステム及びその障害検出方法
JP5681028B2 (ja) * 2010-04-26 2015-03-04 パナソニック株式会社 改ざん監視システム、管理装置及び管理方法
US8943364B2 (en) * 2010-04-30 2015-01-27 International Business Machines Corporation Appliance for storing, managing and analyzing problem determination artifacts
JP5737055B2 (ja) * 2011-08-18 2015-06-17 三菱電機株式会社 プログラム監視システム
JP2014167678A (ja) * 2013-02-28 2014-09-11 Toshiba Corp 制御システム
JP6165597B2 (ja) * 2013-11-12 2017-07-19 日立オートモティブシステムズ株式会社 車載装置
JP6853124B2 (ja) * 2017-06-13 2021-03-31 株式会社Fuji 対基板作業システム、および対基板作業装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0314161A (ja) * 1989-06-13 1991-01-22 Toshiba Corp プロセッサ監視処理方式
JPH05143562A (ja) * 1991-11-19 1993-06-11 Mitsubishi Electric Corp リンク型マルチプロセツサー監視方法
JPH10161907A (ja) * 1996-12-02 1998-06-19 Meidensha Corp コンピュータシステムの状態監視方法
JP2000148539A (ja) * 1998-11-04 2000-05-30 Ntt Data Corp 障害検知方法、コンピュータシステム及び構成装置、記録媒体
JP2001075837A (ja) 1999-09-02 2001-03-23 Hitachi Ltd コンピュータ機器の障害監視システム
US20020135615A1 (en) * 2001-01-31 2002-09-26 Microsoft Corporation Overlaid display for electronic devices
JP2002312199A (ja) 2001-04-13 2002-10-25 Mitsubishi Electric Corp 異常検知電子機器及び異常検知方法及び異常検知電子機器システム及び異常検知プログラム及び異常検知プログラムを記録したコンピュータ読み取り可能な記録媒体
US6944135B2 (en) * 2001-07-16 2005-09-13 International Business Machines Corporation Methods and arrangements for establishing a group collaboration session utilizing multiple multicast distribution trees
JP4313978B2 (ja) * 2002-03-19 2009-08-12 日本電気株式会社 計算機監視方式、計算機監視方法および計算機監視用プログラム

Also Published As

Publication number Publication date
JP2007114941A (ja) 2007-05-10
US20070088682A1 (en) 2007-04-19
US7734769B2 (en) 2010-06-08

Similar Documents

Publication Publication Date Title
JP4940624B2 (ja) 相互監視システム、相互監視装置、相互監視方法およびプログラム
US8893043B2 (en) Method and system for predictive browsing
US9497037B2 (en) Apparatus, method and system for providing event information
CN111399756B (zh) 一种数据存储方法、数据下载方法及装置
JP5353540B2 (ja) 動作履歴収集装置、動作履歴収集方法およびプログラム
CN103069747A (zh) 用于建立通信的方法和设备
CN102792295B (zh) 操作信息生成设备
JP5268589B2 (ja) 情報処理装置及び情報処理装置の運用方法
US10735440B2 (en) Communication destination determination device, communication destination determination method, and recording medium
US6966014B2 (en) Method for system obstacle correspondence support
JP2006238226A (ja) ホームネットワークシステム
US20180253500A1 (en) Visual Mapping of Device Alerts
US8473788B2 (en) Monitoring program, monitoring apparatus, and monitoring method
CN114244686B (zh) 通讯故障的检测方法、装置及系统
US20140019476A1 (en) Information processing apparatus, information processing system, processing method thereof, and recording medium
JP5088738B2 (ja) 障害監視装置及び障害監視方法並びにそのためのプログラム
KR20130042438A (ko) 장애 처리를 수행하는 rfid 자원 관리 방법 및 그 장치
US20070226618A1 (en) Information Processing Device, Device Display Processing Method, And Storage Meidum
JP2008226153A (ja) コンピュータ冗長システム
JP2007072522A (ja) 品質向上支援システムおよびその制御方法、ならびに制御プログラム
CN111064608A (zh) 消息系统的主从切换方法、装置、电子设备及存储介质
JP2005128609A (ja) サーバ計算機、計算機および通信ログの処理方法
Di Giandomenico et al. Automated synthesis of dependable mediators for heterogeneous interoperable systems
JP7119582B2 (ja) 情報処理システム、及び管理サーバ
JP2008282146A (ja) 文書更新通知装置及び文書更新通知方法及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080919

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090721

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120131

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120213

R150 Certificate of patent or registration of utility model

Ref document number: 4940624

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees