JP2004334684A - Obstacle report system and obstacle report device - Google Patents

Obstacle report system and obstacle report device Download PDF

Info

Publication number
JP2004334684A
JP2004334684A JP2003131772A JP2003131772A JP2004334684A JP 2004334684 A JP2004334684 A JP 2004334684A JP 2003131772 A JP2003131772 A JP 2003131772A JP 2003131772 A JP2003131772 A JP 2003131772A JP 2004334684 A JP2004334684 A JP 2004334684A
Authority
JP
Japan
Prior art keywords
contact
communication
failure
monitoring
monitored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003131772A
Other languages
Japanese (ja)
Inventor
Masaya Ito
正也 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003131772A priority Critical patent/JP2004334684A/en
Publication of JP2004334684A publication Critical patent/JP2004334684A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To rapidly report, in the event of a fault, the fault state to a service provider, to facilitate the change of contact address information by the service provider, and to improve the preciseness of the contact address data. <P>SOLUTION: A monitoring device 32 set in a monitoring center 30 periodically requests a response to a monitored device 42 such as a server in a data center 40 and receives the response showing normal or abnormal from the monitored device. When the content of the response received this time is differed from the content of the response received the last, the monitoring device 32 transmits a report item (occurrence of the fault or restoration of the fault) for the monitored device 42 to a reporting device 33. The reporting device 32 has a contact address table 35 storing contact address information correctable by the service provider 20 of the monitored device 42, and transmits the report item to the service provider 20 according to the contact address information. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、サーバ等の被監視装置を監視し、障害発生時に障害を連絡する障害連絡システム及び前記障害連絡システムに適した障害連絡装置に関する。また、本発明は、複数のデータセンタに設置した複数のサーバ等の被監視装置を監視し、障害発生時にはサービス提供者に対して障害を連絡するのに好適な障害連絡システム及び前記障害連絡システムに適した障害連絡装置に関する。
【0002】
【従来の技術】
近年、ミッションクリティカルなシステムが増加し、データセンタを用いてサービスを提供しているサービス提供者は、センタでの障害発生連絡を迅速に求めるようになってきている。センタとしても、その要求に応えるために、SLA(Service Level Agreement)等をサービス提供者と結び、障害通報時間等を定量的に定めると共に、万一、それが満たせない場合は、データセンタ運営者は、サービス提供者に対してペナルティを負うようになってきている。
一方、データセンタでの障害発生時、ネットワーク監視システムは、センタ内装置の障害を検知し運用者に連絡していた。運用者は、その障害発生装置によって、どのサービス提供者に影響を及ぼすのか調査し、影響が及ぶサービス提供者に、電話を利用して報告を行っていた。
【0003】
しかしながら、上記、障害連絡の業務フローにおいては、次のような問題がある。即ち、第1の問題は、障害発生装置の及ぼす影響範囲の特定には、複雑なネットワーク経路を、人手でたどる必要があり、短時間で、影響範囲を特定することはできないということである。第2の問題は、センタ内の装置台数が増加したことと、可用性を高めるために冗長化された構成が複雑に絡み合ったことにより、基幹ネットワークに障害が発生した際等には、多くのサービス提供者に障害影響を及ぼすようになった。そのため、障害発生時は、多くのサービス提供者に連絡する必要がうまれたことである。また、それを解決するために連絡要員の確保などの高いコストがかかっていたことである。
【0004】
第3の問題は、サービス提供者の連絡先情報の変更は書面で行なわれており、書面の受付などの処理時間の影響で、連絡先情報の変更に時間がかかっていた。その結果、サービス提供者とデータセンタ運用者間で、連絡先情報の認識の不一致が発生していた。そのため、障害連絡の際、確実な連絡ができなかったことである。第4の問題は、データセンタ運用者から、サービス提供者への連絡は、電話で行われるのが主であり、短時間に多くの人への連絡ができなかったことである。第5の問題は、多くの連絡先に人手で連絡を行なうため、一部に、連絡漏れが発生していたことである。
これを解決する方法として、特許文献1や特許文献2に記載されているような発明が開発されている。
【0005】
【特許文献1】
特開2000−307526号公報
【特許文献2】
特開平7−44422号公報
【0006】
【発明が解決しようとする課題】
しかしながら、特許文献1記載の発明は、障害発生時に、サービス提供者に対して障害を連絡することを目的とする発明であるが、このために、障害状況テーブルの作成を必要とするように構成されている。
したがって、サービス停止状況を直ちに判定することができないという問題がある。また、サービス提供者による連絡先と連絡手段の更新が考慮されていないため、システムの柔軟性が欠けるという問題がある。
また、特許文献2記載の発明は、監視対象の変更・追加を、ユーザ側の装置に影響を与えることなく、監視センタ側で簡易に実現することを目的とする発明である。
【0007】
そのために、特許文献2記載の発明は、監視する装置に対し、専用の監視装置(SVP,CCP,監視部)を取り付ける必要があり又、監視する装置に障害が発生していても、監視装置に異常が生じていると、監視する装置の障害を検知できなくなる可能性があるという問題がある。また、設定されている通信媒体(例えばTEL、FAXなど)で通報する旨の記載があるのみで、具体的な構成が示されていない。また、短時間に多くの人に連絡する具体的な構成が示されていない。さらに、回線障害に対応するための構成が示されていない。サービス提供者による連絡先と連絡手段の更新が考慮されておらず、システムの柔軟性が欠けるという問題がある。
即ち、前記特許文献1、特許文献2に記載の発明においては、システムで障害検出から影響範囲を明確にし、速やかに、多数のユーザに漏れなく連絡することが困難という問題がある。
【0008】
本発明は、障害発生時に、サービス提供者に対して障害状況を迅速に連絡すると共に、サービス提供者自身による連絡先情報の変更をより容易に行い得るようにすること及び連絡先データの正確性を向上することを課題としている。
【0009】
【課題を解決するための手段】
本発明によれば、サービス利用者が利用する被監視装置を監視し、前記被監視装置の障害発生時に、サービス提供者に対して障害を連絡する障害連絡システムにおいて、前記被監視装置に対して定期的に応答を要求し、前記被監視装置から正常又は異常を表す応答を受信して、今回受信した応答の内容と前回受信した応答の内容に差異がみられる場合は、前記被監視装置の状態を表す連絡事項を連絡装置に送信する監視装置と、前記被監視装置のサービス提供者が修正可能な連絡先情報を記憶した連絡先テーブルを有し、前記連絡先情報に基づいてサービス提供者に対し前記連絡事項を連絡する連絡装置とを備えて成ることを特徴とする障害連絡システムが提供される。
監視装置は、被監視装置に対して定期的に応答を要求し、前記被監視装置から正常又は異常を表す応答を受信して、今回受信した応答の内容と前回受信した応答の内容に差異がみられる場合は、前記被監視装置の状態を表す連絡事項を連絡装置に送信する。連絡装置は、前記被監視装置のサービス提供者が修正可能な連絡先情報を記憶した連絡先テーブルを有し、前記連絡先情報に基づいて前記サービス提供者に対し前記連絡事項を連絡する。
【0010】
ここで、前記連絡先テーブルに記憶した連絡先情報には、前記サービス提供者が指定した連絡先及び連絡手段が含まれて成り、前記連絡装置は前記連絡先テーブルに記憶した連絡先へ前記連絡手段を用いて前記連絡事項を連絡するように構成してもよい。
また、前記連絡先テーブルに記憶した連絡先及び連絡手段は前記サービス提供者が変更可能であるように構成してもよい。
また、前記連絡事項は、障害発生又は障害復旧を表す事項であるように構成してもよい。
また、前記被監視装置はデータセンタに設置されたサーバであると共に、前記監視装置及び連絡装置は監視センタに設置されて成るように構成してもよい。
【0011】
また、本発明によれば、被監視装置の障害発生時に障害を連絡する障害連絡装置において、修正が可能な連絡先情報を格納した連絡先テーブルを有する記憶手段と、前記連絡先情報に基づいて、監視装置から受信した被監視装置の状態を表す連絡事項をサービス提供者に連絡する送信手段とを備えて成ることを特徴とする障害連絡装置が提供される。送信手段は、連絡先情報に基づいて、監視装置から受信した被監視装置の状態を表す連絡事項をサービス提供者に連絡する。
【0012】
ここで、前記連絡先テーブルに記憶した連絡先情報には、前記サービス提供者が指定した連絡先及び連絡手段が含まれて成り、前記送信手段は、前記連絡先テーブルに記憶した連絡先へ前記連絡手段を用いて前記連絡事項を送信するように構成してもよい。
また、前記連絡先テーブルに記憶した連絡先及び連絡手段は前記サービス提供者が変更可能であるように構成してもよい。
また、前記連絡事項は、障害発生又は障害復旧を表す事項であるように構成してもよい。
【0013】
【発明の実施の形態】
以下、本発明の実施の形態に係る障害連絡システム及び前記障害連絡システムに適した障害連絡装置について説明する。
先ず、本発明の実施の形態に係る障害連絡システムの全体構成を示す図1を用いて、本発明の実施の形態に係る障害連絡システム及び障害連絡装置の概要を説明すると、障害連絡システムは複数のデータセンタに設置した複数のサーバを常時監視する障害監視装置及び障害を連絡する障害連絡装置を有しており、複数のデータセンタに設置した複数のサーバを常時監視し、障害発生時はサービス提供者に対して障害を連絡するシステムである。障害発生から迅速、かつ、正確に、データセンタ利用者(サービス提供者)に対して障害を連絡できるように構成している。
【0014】
図1において、監視センタ30に設置された障害監視装置32は、データセンタ40に設置されたサーバ等の被監視装置42に対して、定期的に応答を要求する。
監視装置32は、被監視装置42からの応答(前記応答には、正常を示す応答(正常)と異常を示す応答(異常)(”正常”/”異常”)がある。)を受信する。また、被監視装置42からの応答が得られない場合は、被監視装置42の応答は”異常”と判断する。
監視装置32は、今回受信した応答と前回の応答に差異がみられる場合は、被監視装置42の連絡事項(前記連絡事項には、障害が発生したことを示す連絡(障害発生)と障害が復旧したことを示す連絡(障害復旧)(”障害発生”/”障害復旧”)がある。)を連絡装置33に送信する。また、連絡装置33は、被監視装置42のサービス提供者20自らが修正可能な連絡先情報を有している。連絡装置33は、被監視装置42のサービス提供者20の連絡先情報に従い、サービス提供者20に対し連絡事項を送信する。
【0015】
このようにして、本実施の形態に係る障害連絡システムでは、障害を自動的に検出し、影響を受けるサービス提供者20を短時間で明確にできるので、サービス提供者20へ障害を迅速に連絡できる。これにより、複雑な構内通信網をたどって影響範囲を調査する時間が不要になる。また、データセンタ40の構内通信網41に障害が生じた場合、その影響が多くのサービス提供者20に及ぶが、それらの多くの人に対して迅速、かつ低コストで連絡できる。さらに、サービス提供者20の指定した連絡先と連絡手段(例えば、電子メールやFAX等)をリアルタイムに更新し、更新された連絡先へ更新された連絡手段により障害を連絡するので、連絡先の誤りが無くなり確実に連絡できる。
【0016】
以下、本発明の実施の形態に係る障害連絡システム及び前記障害連絡システムに適した障害監視装置について詳細に説明する。
図1は、本発明の実施の形態に係る障害連絡システムの全体構成を示すブロック図である。
図2は、本実施の形態において、通信を行う際に使用する通信フレームの形態を示す図である。
図1において、連絡端末収容装置01と連絡端末21との送受信を除く、本システム装置間での通信は、図2に示すように、送信先、送信元および内容が、通信フレームという固まりとして送信される。その際、送信先、送信元として、各装置に固有のコードである装置ID(Identification)を設定する。また、本システム内の装置は、一意になるように装置IDを持つ。装置IDの一例を挙げると、IP(Internet Protocol)ネットワークでは、IPアドレスがある。なお、連絡端末収容装置01と連絡端末21との通信に図2の通信フレームを用いないのは、それらの間の通信を、幅広い通信手段によって実現させることを考慮したためである。
【0017】
広域通信網00は、通信事業者が提供する通信回線を使用し、遠隔地にあるコンピュータ同士を接続するネットワークである。広域通信網00内で、連絡端末21への通信回線を接続する装置を連絡端末収容装置01とする。また、広域通信網00内で、監視センタ30への通信回線を接続するネットワーク装置を監視センタ回線収容装置02とする。
連絡端末収容装置01は、広域通信網00内の通信方式と連絡端末21の通信方式の違いを吸収するゲートウェイである。ここで、連絡端末収容装置01の装置IDを、”連絡端末収容装置01ID”と設定する。
【0018】
連絡端末収容装置01は、広域通信網00のバックボーンへ接続するためのインタフェースと、連絡端末21への通信回線を接続するためのインタフェースを持つ。連絡端末収容装置01は、連絡装置33から、連絡手段、アドレス(番号)、対象および連絡事項を表す情報を受信した場合は、当該連絡手段の方法を用いて、アドレス(番号)を指定し、連絡端末21への接続を行ない、対象と連絡事項を送信する。また、連絡端末収容装置01は、連絡端末21からの接続要求を受け付け接続する。その後、連絡端末21に対して、連絡端末21の入力インタフェースから入力できるように入力指示を出力する。その後、連絡端末収容装置01は、連絡端末21から、更新要求(”更新”)、連絡端末21の装置ID(”連絡端末21ID”)、連絡に使用する連絡手段、アドレス(番号)を受信する。連絡端末収容装置01は、それらを受信した場合は連絡装置33へ接続する。その後、連絡装置33に対して、連絡手段やアドレス(番号)の更新要求を送信する。
【0019】
監視センタ回線収容装置02は、ルータ等のネットワーク装置である。ここで、監視センタ回線収容装置02の装置IDを、”監視センタ回線収容装置02ID”と設定する。監視センタ回線収容装置02は、監視装置32から構内通信網31経由で監視センタ回線収容装置02までの通信が正常に行なわれていることを確認する。そのため、監視センタ回線収容装置02は、監視を受けるため監視装置32の被監視装置テーブル34に登録されている。本監視に障害が発生した際は、連絡装置33の記憶手段に記憶している連絡先テーブル35に登録された全てのサービス提供者に対して監視装置が障害を検出した旨連絡する。
監視センタ回線収容装置02は、広域通信網00のバックボーンへ接続するためのインタフェースと、監視センタ30への通信回線を接続するためのインタフェースを持つ。また、監視センタ回線収容装置02は、監視装置32から”応答要求”を受信した際は、自らの状態を判断し、その状態を表す応答として”正常”もしくは”異常”を、監視装置32に返信する。
【0020】
サービス利用者10はサービス利用端末11を利用して、サービスを利用する。
サービス利用端末11はコンピュータである。サービス利用端末11は広域通信網00へ接続するためのインタフェース(モデム等)を持つ。サービス利用端末11は、そのインタフェースを通じて、サーバ等の被監視装置42へ接続する。サービス利用端末11は、被監視装置42に対して情報を入力する。入力された情報は、被監視装置42や連携する他のサーバで加工され、別の形で出力される。これをサービスと言う。サービスの一例を挙げると、情報提供サービス、決済サービス、メールサービス等がある。即ち、サービス利用端末11は、サービス利用者100が操作することによって、サーバ等の被監視装置42を利用し、種々のサービスを利用することができる。
【0021】
サービス提供者20は、データセンタ40内の被監視装置42を用いてサービス利用者10に対してサービスを提供している。また、サービス提供者20は、連絡端末21を利用する。
連絡端末21は、コンピュータ/FAX/電話機等のデータ入出力機能を有する装置である。連絡端末21は、広域通信網00上の連絡端末収容装置01へ接続要求して接続する。その際、連絡端末21は、連絡端末収容装置01の指示に従い、キーボード/ボタン/ダイヤル等を利用して、更新要求を示す”更新”、連絡端末21の装置IDである”連絡端末21ID”、障害の連絡に使用する連絡手段、連絡端末21のアドレス(番号)を送信する。これにより、連絡端末21は、連絡装置33に記憶された連絡先テーブル35の連絡手段、アドレス(番号)を変更できる。また、連絡端末21は、連絡端末収容装置01からの接続要求によって通信でき、連絡端末収容装置01より装置IDと連絡事項を受信し出力する。また、連絡先情報の更新の他に、同様の手段で確認することもできる。
【0022】
監視センタ30は、各地にあるデータセンタを監視するための施設である。
構内通信網31は、広域通信網00と、監視装置32、連絡装置33を接続するために、ルータやHUB等のLAN(local Area Network)装置を組み合わせて構成される。監視センタ回線収容装置02と構内通信網31間の回線や構内通信網31自体に障害が生じても、連絡装置33と連絡端末収容装置01間の通信ができるように、冗長化された構成を持つ。
【0023】
監視装置32はコンピュータである。ここで、監視装置32の装置IDを、”監視装置32ID”と設定する。監視装置32は、構内通信網31へ接続するためのインタフェース(LANインタフェース)を持つ。監視装置32は、そのインタフェースを通じて広域通信網00内の装置やデータセンタ40内の構内通信網41に接続された装置へ接続する。また、監視装置32は、監視装置32に設けられた記憶手段に記憶した被監視装置テーブル34を保持する。監視装置32は、監視装置32内の被監視装置テーブル34に設定された被監視装置IDを有する被監視装置に対して、一定間隔で、順番に応答の要求(”応答要求”)を送信し、被監視装置から、その応答を得る。一定時間経過後、監視装置32は応答を確認し、監視装置32は、そのパターンに従い連絡装置33へ確認結果を送信する。
【0024】
連絡装置33はコンピュータである。ここで、連絡装置33の装置IDを、”連絡装置33ID”と設定する。連絡装置33は、構内通信網31へ接続するためのインタフェース(LANインタフェース)を持つ。連絡装置33は、連絡装置33が有する記憶手段に記憶した連絡先テーブル35を保持する。連絡装置33は、監視装置32から被監視装置IDと確認結果を受信した際、被監視装置IDを確認し、前記確認結果に従った連絡手段、アドレス(番号)を明確にする。その後、連絡装置33は、連絡手段、アドレス(番号)、対象(=被監視装置ID)、連絡事項(=確認結果)、を連絡端末収容装置01へ送信する。
【0025】
また、連絡装置33は、連絡端末収容装置01から、連絡手段やアドレス(番号)の更新要求を受信して、連絡先テーブル35を変更すると共に、連絡端末収容装置01へ更新結果を送信する。
図3は、被監視装置テーブル34を示す図である。被監視装置テーブル34は、図3に示すように、被監視装置IDの欄、今回応答した内容の欄および前回応答した内容の欄を有しており、複数の被監視装置の台数分のレコードがある。被監視装置テーブル34は、監視者36が監視装置32を用いて、登録/変更/削除できる。
【0026】
図4は、連絡先テーブル35を示す図である。連絡先テーブル35は、図4に示すように被監視装置IDの欄、連絡端末IDの欄、連絡手段の欄およびアドレス(番号)の欄を有しており、連絡端末の台数分のレコードがある。連絡先テーブル35は、監視者36が連絡装置33から登録/変更/削除できる。また、サービス提供者20が連絡端末21を用いて、連絡先テーブル35中の連絡装置IDが連絡端末21IDであるレコードの連絡手段およびアドレス(番号)を更新することができる。
データセンタ40は、堅牢な建物に広域通信網00を引き込み、多数のサーバを設置/運用してサービスを提供している場所である。ここでは一例としてデータセンタ40についてのみ述べるが、データセンタは複数存在することができ又、被監視装置も複数存在することができる。
【0027】
構内通信網41は、広域通信網00と、多数のサーバタイプのコンピュータ等を接続するためにルータやHUB等のLAN装置を組み合わせて構成される。
被監視装置42は、通常、サーバタイプのコンピュータで、サービス利用端末11から入力された情報を加工し、何らかの結果やデータを、定められた送信先に対して送信する。ここで、被監視装置42の装置IDを、”被監視装置42ID”と設定する。被監視装置42は、構内通信網41へ接続するためのインタフェース(LANボード等)を持つ。被監視装置42は監視を受けるため監視装置32の被監視装置テーブル34に登録されている。また、被監視装置42は、監視装置32から”応答要求”を受信した際は、自らの状態を判断し、その状態に従い応答として”正常”もしくは”異常”を、監視装置32に送信する。
【0028】
図5は、図1に示した監視装置32の詳細な構成を示すブロック図である。図5において、障害監視装置32は、監視タイマ51、判定タイマ52、監視者36が操作する入力部53、LANインタフェース54、障害確認部55、図示しない記憶手段に記憶した被監視装置テーブル34を備えている。
被監視装置テーブル34は、図3に示すように、”被監視装置ID”の欄、”今回応答”の欄、”前回応答”の欄を有しており、被監視装置の台数分のレコードがある。ここで、被監視装置IDは、監視対象とする装置の装置IDを記録する。”今回応答”の欄は、今回の応答内容を記録する。”前回応答”の欄は、前回の応答内容を記録する。
【0029】
被監視装置テーブル34は、監視タイマ51から監視開始の通知を受信すると、テーブルの初期化処理を行なうと共に、全ての被監視装置に対して、応答を要求するための応答要求の通知を送信する。また、被監視装置テーブル34には、各被監視装置からの応答を受信すると、”今回応答”の欄に、その応答内容を記録する。さらに、被監視装置テーブル34は、判定タイマ52から、判定開始の通知を受信すると、”今回応答”欄の更新を禁止し、被監視装置ID、今回応答の内容および前回応答の内容を、必要に応じて障害確認部55へ送信する。被監視装置テーブル34は、監視者36が入力部53を用いて、登録/変更/削除できる。
【0030】
監視タイマ51は、予め設定された監視間隔(例:3分、5分等)で、被監視装置テーブル34に監視開始の通知を送信する。また、判定タイマ52に対し、判定タイマスタートの通知を送信する。監視タイマ51の監視間隔は、監視者36が、入力部53を用いて設定する。
判定タイマ52は、監視タイマ51から、判定タイマスタートの通知を受信すると、その時点より、設定された判定間隔(例:3分、5分等)経過後に、被監視装置テーブル34に判定開始の通知を送信する。判定タイマ52の判定間隔は、監視者36が、入力部53を用いて設定する。その判定間隔は、通信フレームが監視装置32と被監視装置間を往復する時間と、被監視装置の処理時間を合わせた時間以上である必要がある。
【0031】
入力部53は、監視者36によって、監視タイマ51、判定タイマ52のタイマ値設定、及び、被監視装置テーブル34のレコード追加/変更/削除を行なえる。
LANインタフェース54は、構内通信網31と通信を行なうためのインタフェースである。
障害確認部55は、被監視装置テーブル34から、被監視装置ID、今回応答の内容、前回応答の内容を受信すると、その今回応答の内容と前回応答の内容を比較する。その結果今回応答の内容と前回応答の内容に差異が見られる場合は、連絡装置33に、その確認結果を送信する。
【0032】
図6は、図1に示した連絡装置33の詳細な構成を示すブロック図である。図6において、障害連絡装置33は、監視者36が操作する入力部61、LANインタフェース62、送信手段を構成する送信部63、図示しない記憶手段に記憶した連絡先テーブル35を有している。
連絡先テーブル35は、図4に示すように”被監視装置ID”欄、”連絡端末ID”欄、”連絡手段”欄、”アドレス(番号)”欄から構成され、連絡端末台数分のレコードがある(1つの被監視装置IDが、複数の連絡装置IDを持つこともできる)。被監視装置IDは、監視対象とする装置の装置IDを記録する。連絡端末IDは、被監視装置42を利用してサービスを行なっている人が所有する連絡端末21の装置IDである。連絡手段は、連絡端末21への連絡手段(連絡媒体)を記録する。例えば、”e−mail”/”TEL”/”FAX”/”通知不要”等が選択できる。
【0033】
アドレス(番号)は、連絡手段を用いて連絡端末21への通知を行なう際に利用するアドレス(番号)を記録する。例えば、e−mailアドレス、TEL番号、FAX番号等である。連絡手段で”通知不要”と記録した場合、本レコードへの送信は行なわない。連絡先テーブル35は、監視者36が入力部61から登録/変更/削除できる。
連絡先テーブル35は、監視装置32から、被監視装置IDと確認結果を受信する。その際、連絡先テーブル35は、送信部63に対して、被監視装置IDが監視センタ回線収容装置02である場合は、対象(=”監視装置”)、確認結果、全レコードの連絡手段とアドレス(番号)を送信する。被監視装置IDが監視センタ回線収容装置02でない場合は、対象(=被監視装置ID)、確認結果、その被監視装置IDを含むレコードの連絡手段とアドレス(番号)を送信する。
【0034】
また、連絡先テーブル35は、連絡端末収容装置01から、連絡端末ID、連絡手段、アドレス(番号)及び更新指示(”更新”)を受信すると、連絡先テーブル35内で、連絡装置IDを含むレコードの連絡手段、アドレス(番号)を更新する。更新が正常に行なわれた際、連絡先テーブル35は、連絡端末収容装置01へ連絡手段、アドレス(番号)、対象(=連絡装置ID)、連絡事項として更新が完了した旨(=”更新完了”)を送信する。
入力部61は、監視者36によって、連絡先テーブル35のレコード追加/変更/削除を行なえる。
LANインタフェース62は、構内通信網31と通信を行なうためのインタフェースである。
送信部63は、連絡先テーブル35から、被監視装置ID、連絡手段、アドレス(番号)、確認結果を受信すると、連絡端末収容装置01に対して、連絡手段、アドレス(番号)、対象、連絡事項(=確認結果)を送信する。
【0035】
図7は、図1の障害連絡システムの動作を示すフローチャートである。以下、図1〜図7を用いて、本発明の実施の形態に係る障害連絡システムの動作を説明する。
監視装置32は、監視装置32内の被監視装置テーブル34から被監視装置IDを読み出す(ステップS70)。監視装置32は、被監視装置テーブル34の各被監視装置IDを有する被監視装置に対して応答要求を送信する(ステップS71)。監視装置32は、各被監視装置からの応答を受信する(ステップS72)。監視装置32は、被監視装置IDからの応答を被監視装置テーブル34に記録する(ステップS73)。前記ステップS70〜S73を監視フェーズ77とする。この監視フェーズ77は監視装置32が実行する。
【0036】
一定時間経過後、監視装置32は、被監視装置テーブル34を確認する(ステップS74)。ステップS74の処理を確認フェーズ78とする。確認フェーズ78は監視装置32が実行する。
前記確認結果を連絡端末収容装置01へ送信する(ステップS75)。ステップS75の処理を連絡フェーズ79とする。連絡フェーズ79は連絡装置33が実行する。連絡端末収容装置01は、確認結果を連絡端末21へ出力する(ステップS76)。
【0037】
次に、図7に示した監視フェーズ77、確認フェーズ78、連絡フェーズ79の3フェーズの詳細な動作を、以下にフローチャートを使用して説明する。ここでは、一例として、被監視装置を、複数の被監視装置の中の一つである被監視装置42として説明する。
図8は、監視フェーズ77の詳細を示すフローチャートである。監視フェーズ77について、図8のフローチャートを使用して説明する。
監視タイマ51は、予め設定された所定間隔で、被監視装置テーブル34へ監視開始の通知(”監視開始”)を送信する(ステップS80)。監視タイマ51は、判定タイマ52へ判定タイマスタートの通知を送信する(ステップS86)。
【0038】
監視装置32の制御手段(図示せず)は、監視タイマ51から監視開始の通知を受信すると、被監視装置テーブル34に対して、以下の3つの初期化処理を行う。
第1に、全ての今回応答の欄の内容を、同一レコードの前回応答の欄に転記する。第2に、被監視装置テーブル34の全てのレコードに対して、今回応答の欄に”異常”を記録すると共に、確認結果の欄に””(Null)を記録する。第3に、今回応答の欄の更新が禁止されている場合は、それを解除する(ステップS81)。
【0039】
監視装置32は、被監視装置テーブル34から、全ての被監視装置ID(”監視回線収容装置01ID”も含む)を読み出す(ステップS82)。監視装置32は、被監視装置テーブル34の各被監視装置IDを有する被監視装置に対して、通信フレーム(送信先は被監視装置ID、送信元は監視装置32ID、内容は応答要求)を送信する。例えば、被監視装置42に対して送信する場合は、通信フレーム(送信先=被監視装置42ID、送信元=監視装置32ID、内容=応答要求)となる(ステップS83)。
【0040】
被監視装置42は、監視装置32から、通信フレーム(送信先=被監視装置42ID、送信元=監視装置32ID、内容=応答要求)を受信すると、通信フレーム(送信先=監視装置32ID、送信元=被監視装置42ID、内容=正常もしくは異常)を返信する。監視装置32は、被監視装置42から通信フレーム(送信先=監視装置32ID、送信元=被監視装置42ID、内容=正常もしくは異常)を受信する(ステップS84)。監視装置32は、被監視テーブル34において、被監視装置42IDを含む各レコードの今回応答の欄に、応答があった旨(”応答”)を記録する(ステップS85)。
【0041】
図9は、確認フェーズ78の詳細を示すフローチャートである。確認フェーズ78について、図9のフローチャートを使用して説明する。
判定タイマ52は、監視タイマ51から、監視タイマスタートの通知を受信した時点から、判定間隔経過後に、予め設定された所定間隔で、被監視装置テーブル34へ判定開始する旨の通知を送信する(ステップS90)。
判定タイマ52から判定開始の通知を受信すると、被監視装置テーブル34における今回応答の欄の更新を禁止する(ステップS91)。監視装置32は、被監視装置テーブル34において、被監視装置IDが監視センタ回線収容装置02IDであるレコードを検索する(ステップS92)。監視装置32は、被監視装置テーブル34において、被監視装置IDが監視センタ回線収容装置02IDであるレコードの今回応答の欄の内容を確認する(ステップS93)。
【0042】
障害確認部55は、前記今回応答の欄の内容が”異常”の場合は、被監視装置IDが監視センタ回線収容装置02IDであるレコードについてのみ、被監視装置ID、今回応答の欄の内容および前回応答の欄の内容を受信する(ステップS94)。障害確認部55は、前記今回応答の欄の内容が”正常”の場合は、全てのレコードの被監視装置ID、今回応答の欄の内容および前回応答の欄の内容を受信する(ステップS95)。
障害確認部55は、被監視装置ID、今回応答の欄の内容および前回応答の欄の内容を受信すると、前記今回応答の欄の内容および前回応答の欄の内容を比較する(ステップS96)。
【0043】
障害確認部55は、前記今回応答の欄の内容と前回応答の欄の内容に差異がみられる場合は、LANインタフェース54を介して、連絡装置33に通信フレーム(送信先が連絡装置33ID、送信元が監視装置32IDであり又、内容が被監視装置ID及び確認結果である通信フレーム)を送信する。
その結果は、以下の2パターンに分けられる。第1に、今回応答の欄の内容が”異常”で、かつ前回応答の欄の内容が”正常”である場合、確認結果を”障害発生”とする。第2に、今回応答の欄の内容が”正常”で、かつ前回応答の欄の内容が”異常”である場合、確認結果を”障害復旧”とする(ステップS97)。
【0044】
図10は、連絡フェーズ79の詳細を示すフローチャートである。連絡フェーズ79について、図10のフローチャートを使用して説明する。
連絡装置33は、監視装置32から、通信フレーム(送信先が連絡装置33ID、送信元が監視装置32ID、内容が被監視装置ID及び確認結果)を受信する(ステップS100)。
連絡装置33の図示しない制御手段は、連絡先テーブル35を用いて、被監視装置IDを確認する(ステップS101)。
【0045】
前記制御手段は、被監視装置の装置IDが監視センタ回線収容装置02IDの場合は、対象(=”監視装置”)と確認結果を送信部63へ送信する(ステップS102)。前記制御手段は、被監視装置が監視センタ回線収容装置02ID以外の場合は、対象(=被監視装置ID)と確認結果を送信部63へ送信する。これは、”監視センタ回線収容装置02ID”という名称はサービス利用者には公開しないため、”監視装置”と言い換えるために行う(ステップS103)。
【0046】
次に、前記制御手段は、被監視装置が監視センタ回線収容装置02IDの場合は、連絡先テーブル35における全てのレコードの連絡手段、アドレス(番号)を送信部63へ送信する(ステップS104)。被監視装置=”監視センタ回線収容装置02ID”以外の場合は、連絡先テーブル35中にその被監視装置IDを含むレコードの連絡手段、アドレス(番号)を、全て順番に送信部63へ送信する(ステップS105)。
送信部63は、連絡先テーブル35から、まず対象と確認結果を受信する。次に、送信部63は、連絡先テーブル35から、連絡手段、アドレス(番号)を受信するたびに、通信フレーム(送信先が連絡端末収容装置01ID、送信元が連絡装置33ID、内容が連絡手段、アドレス(番号)、対象および連絡事項(=確認結果)である通信フレーム)を送信する(ステップS106)。
【0047】
次に、連絡端末収容装置01から、連絡端末21への情報出力について、以下に説明する。
連絡端末収容装置01は、連絡装置33から、通信フレーム(送信先が連絡端末収容装置01ID、送信元が連絡装置33ID、内容が連絡手段、アドレス(番号)、対象及び連絡事項である通信フレーム)を受信した場合は、予め定めてある連絡手段を用いて、アドレス(番号)を指定し、連絡端末21への接続を行ない、対象と連絡事項を送信する。例えば、連絡手段が電子メール(”e−mail”)、アドレス(番号)が“name@domain.com”の場合は、連絡端末収容装置01のメールサーバ機能を用いて、宛先を“name@domain.com“、本文を被監視装置IDと連絡事項に設定して電子メール送信する。
【0048】
また、連絡手段が電話(=”TEL”)、アドレス(番号)が”090−1234−5678”の場合は、連絡端末収容装置01は、電話番号”090−1234−5678”をダイヤルして、音声応答機能を用いて被監視装置IDと連絡事項を送信する。
連絡端末21は、連絡端末収容装置01より対象と連絡事項を受信し出力する。例えば、”被監視装置42ID”、”障害発生”や”連絡端末21ID”、”連絡先更新”等を出力できる。
【0049】
図11は、連絡手段及びアドレス(番号)の変更動作を示すフローチャートである。以下、図11に示すフローチャートを使用して、連絡手段及びアドレス(番号)の変更処理を説明する。
サービス提供者20は、連絡端末21を用いて、広域通信網00上の連絡端末収容装置01へ接続要求して接続する(ステップS110)。サービス提供者20は、連絡端末21にて、連絡端末収容装置01の指示に従い、キーボード/ボタン/ダイヤル等の操作手段を操作して、更新要求(”更新”)、連絡端末21ID、連絡手段、アドレス(番号)を送信する(ステップS111)。
【0050】
連絡端末収容装置01は連絡装置33へ接続する。連絡端末収容装置01は、通信フレーム(送信先が連絡装置33ID、送信元が連絡端末21ID、内容が連絡手段、アドレス(番号)および連絡事項が更新(”更新”)である通信フレーム)を送信する(ステップS112)。
連絡装置33は、通信フレーム(送信先が連絡装置33ID、送信元が連絡端末21ID、内容が連絡手段、アドレス(番号)および更新する旨を示す(”更新”)通信フレーム)を受信すると、連絡先テーブル35内の連絡端末IDフィールドに、送信元として連絡端末21IDを含むレコードの連絡手段、アドレス(番号)を更新する(ステップS113)。
【0051】
連絡装置33は、更新が正常に行なわれた際、通信フレーム(送信先が連絡端末収容装置01ID、送信元が連絡装置33IDであり、内容として、連絡手段、アドレス(番号)を含むと共に対象が連絡端末21IDで連絡事項が更新完了(”更新完了”)である通信フレーム)を送信する(ステップS114)。
連絡端末収容装置01は、連絡装置33から、前記通信フレーム(送信先が連絡端末収容装置01ID、送信元が連絡装置33ID、内容が連絡手段、アドレス(番号)、連絡端末21IDおよび連絡事項)を受信した場合は、予め定められている連絡手段を用いて、アドレス(番号)を指定し、連絡端末21への接続を行ない、連絡端末21IDと連絡事項を送信する(ステップS115)。
連絡端末21は、連絡端末収容装置01より、連絡端末21IDと連絡事項を受信し出力する。連絡端末21は、例えば、受信した装置IDである”連絡端末21ID”と、連絡事項である”連絡先更新”等を出力する(ステップS116)。
【0052】
以上説明したように、本発明の実施の形態に係る障害連絡システムは、サービス利用者10が利用する被監視装置42を監視し、前記被監視装置42の障害発生時に、サービス提供者20に対して障害を連絡する障害連絡システムにおいて、前記被監視装置42に対して定期的に応答を要求し、前記被監視装置42からの応答に基づいて前記被監視装置42が正常である異常であるかを監視する監視装置32と、前記被監視装置42のサービス提供者20自らが修正可能な連絡先情報を記憶した連絡先テーブル35を有し、前記監視装置が前記被監視装置の監視結果に基づき、前記連絡先情報に基づいてサービス提供者20に対し、前記被監視装置42の異常を連絡する連絡装置33とを備えて成ることを特徴としている。
【0053】
また、本発明の実施の形態に係る障害連絡システムは、サービス利用者10が利用する被監視装置42を監視し、前記被監視装置42の障害発生時に、サービス提供者20に対して障害を連絡する障害連絡システムにおいて、前記被監視装置42に対して定期的に応答を要求し、前記被監視装置42から正常又は異常を表す応答を受信して、今回受信した応答の内容と前回受信した応答の内容に差異がみられる場合は、前記被監視装置42の状態を表す連絡事項を連絡装置33に送信する監視装置32と、連絡先情報を記憶した連絡先テーブル35を記憶した記憶手段を有し、前記連絡先情報に基づいてサービス提供者20に対し前記連絡事項を送信する連絡装置33と、サービス提供者20が使用し前記連絡先テーブル35に記憶した連絡先情報を変更するための端末装置21とを備えて成ることを特徴としている。
【0054】
前記連絡先テーブル35に記憶した連絡先情報には、前記サービス提供者が指定した連絡先及び連絡手段が含まれて成り、前記連絡装置33は前記連絡先テーブル35に記憶した連絡先へ前記連絡手段によって前記連絡事項を連絡する。前記連絡先テーブル35に記憶した連絡先及び連絡手段は前記サービス提供者20が使用する連絡端末21が変更可能である。前記監視装置32は、前記被監視装置42からの応答が得られない場合は、前記被監視装置42からの応答を異常である旨の応答とみなしている。前記連絡事項は、障害発生又は障害復旧を表す事項である。前記被監視装置42はデータセンタ40に設置されたサーバであると共に、前記監視装置32及び連絡装置33は監視センタ30に設置されている。また、前記実施の形態によれば、被監視装置42の障害発生時に障害を連絡する障害連絡装置33において、修正が可能な連絡先情報を格納した連絡先テーブル35を有する記憶手段と、前記連絡先情報に基づいて、監視装置32から受信した被監視装置42の状態を表す連絡事項をサービス提供者20の連絡端末21に送信する送信手段とを備えて成ることを特徴としている。
【0055】
したがって、システムで障害検出から、影響範囲を明確にし、その通報まで自動的に行えるので、障害発生時には、速やかに多くの人へ連絡できる。また、連絡漏れも発生しない。さらに、連絡コストも削減できることである。
また、障害時の連絡先、連絡手段を、サービス提供者自らが変更できるので、サービス提供者の連絡先、連絡手段の変更要望を、速やかに反映できる。また、サービス提供者自らが連絡先情報を確認できることにより、サービス提供者とセンタ側とで、連絡先情報の認識の不一致が発生しないという効果をも奏する。
また、障害発生時に、サービス提供者に対して障害状況を迅速に連絡でき、サービス提供者自身による連絡先情報の変更容易性の向上と、連絡先データの正確性向上も図りうる。
【0056】
また、障害状況テーブルを作成する必要が無く、被監視装置テーブル34(状変値テーブル)から、直接、サービス停止状況を判定できる。
また、被監視装置側に特別な装置は必要が無い。また、短時間に多くの人に連絡することが可能になる。
また、監視センタ回線収容装置02に対しての監視も行い、回線障害に対しての対応も行なうことが可能である。
また、監視対象の変更・追加を、サービス利用者側の装置に影響を与えることなく、監視センタ30側で実現できるという効果がある。
【0057】
尚、前記実施の形態は、種々の変更が可能である。例えば、広域通信網00を構内通信網として構成してもよい。また、新たに、連絡先テーブル35にレコードを追記することにより、サービス提供者以外のセンタ運用要員、機器保守要員、センタ経営者等に連絡を行なうこともできる。さらに、監視装置32が、被監視装置42から、障害パターンを受信できるように構成すれば、連絡先テーブル35に、障害パターンフィールドを追加し、受信した障害パターンと登録した障害パターンとを比較することにより、障害パターンに応じて連絡先を変更することもできる。
【0058】
【発明の効果】
本発明によれば、障害発生時に、サービス提供者に対して障害状況を迅速に連絡すると共に、サービス提供者自身による連絡先情報の変更をより容易に行い得るようにすること及び連絡先データの正確性を向上することが可能になる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る障害連絡システムの全体構成を示すブロック図である。
【図2】本発明の実施の形態に係る障害連絡システムで使用する通信フレームの形態を示す図である。
【図3】本発明の実施の形態に係る障害連絡システムで使用する被監視装置テーブルを示す図である。
【図4】本発明の実施の形態に係る障害連絡システムで使用する連絡先テーブルを示す図である。
【図5】本発明の実施の形態に係る障害連絡システムにおける監視装置の詳細な構成を示すブロック図である。
【図6】本発明の実施の形態に係る障害連絡システムにおける連絡装置の詳細な構成を示すブロック図である。
【図7】本発明の実施の形態に係る障害連絡システムの動作を示すフローチャートである。
【図8】本発明の実施の形態に係る障害連絡システムにおける監視フェーズの詳細処理を示すフローチャートである。
【図9】本発明の実施の形態に係る障害連絡システムにおける確認フェーズの詳細処理を示すフローチャートである。
【図10】本発明の実施の形態に係る障害連絡システムにおける連絡フェーズの詳細処理を示すフローチャートである。
【図11】本発明の実施の形態に係る障害連絡システムにおける連絡手段等の変更処理を示すフローチャートである。
【符号の説明】
00・・・広域通信網(ネットワーク)
01・・・連絡端末収容装置
02・・・監視センタ回線収容装置
11・・・サービス利用端末
21・・・連絡端末
30・・・監視センタ
40・・・データセンタ
31、41・・・構内通信網
32・・・監視装置
33・・・連絡装置
34・・・被監視装置テーブル
35・・・連絡先テーブル
42・・・被監視装置
51・・・監視タイマ
52・・・判定タイマ
53、61・・・入力部
54、62・・・LANインタフェース
55・・・障害確認部
63・・・送信手段を構成する送信部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a failure communication system that monitors a monitored device such as a server and reports a failure when a failure occurs, and a failure communication device suitable for the failure communication system. Further, the present invention provides a failure communication system and a failure communication system suitable for monitoring a monitored device such as a plurality of servers installed in a plurality of data centers and notifying a service provider of a failure when a failure occurs. The present invention relates to a fault communication device suitable for a vehicle.
[0002]
[Prior art]
In recent years, the number of mission-critical systems has increased, and service providers who provide services using data centers are promptly requesting notification of failure occurrence in the centers. In order to respond to the demands, the center will link an SLA (Service Level Agreement) etc. with the service provider, quantitatively determine the trouble report time, etc., and if it cannot be satisfied, the data center operator Are increasingly penalizing service providers.
On the other hand, when a failure occurred in the data center, the network monitoring system detected a failure in a device in the center and notified the operator. The operator has investigated which service provider is affected by the faulty device and reported to the affected service provider by telephone.
[0003]
However, the work flow of the failure notification has the following problems. That is, the first problem is that it is necessary to manually follow a complicated network route to specify the range of influence of the failure generating device, and the range of influence cannot be specified in a short time. The second problem is that when the number of devices in the center has increased and the redundant configuration for increasing the availability has been intricately intertwined, many services have to be provided when a failure occurs in the backbone network. It has had a disability effect on the provider. Therefore, when a failure occurs, it is necessary to contact many service providers. In addition, high costs, such as securing personnel, were required to solve the problem.
[0004]
A third problem is that the change of the contact information of the service provider is performed in writing, and it takes time to change the contact information due to the processing time such as receiving a document. As a result, there has been a mismatch in the recognition of contact information between the service provider and the data center operator. For this reason, when a failure was reported, reliable communication could not be made. The fourth problem is that the data center operator mainly contacts the service provider by telephone, and cannot contact many people in a short time. The fifth problem is that some contacts are manually contacted, and some of them have been left out of contact.
As a method for solving this, the inventions described in Patent Literature 1 and Patent Literature 2 have been developed.
[0005]
[Patent Document 1]
JP 2000-307526 A
[Patent Document 2]
JP-A-7-44422
[0006]
[Problems to be solved by the invention]
However, the invention described in Patent Literature 1 aims to notify a service provider of a failure when a failure occurs. For this purpose, it is necessary to create a failure status table. Have been.
Therefore, there is a problem that the service stop state cannot be immediately determined. In addition, there is a problem that the system lacks flexibility because the update of the contact information and the contact means by the service provider is not considered.
Further, the invention described in Patent Document 2 is an invention that aims to easily implement change / addition of a monitoring target on a monitoring center side without affecting a device on a user side.
[0007]
For this purpose, the invention described in Patent Document 2 requires a dedicated monitoring device (SVP, CCP, monitoring unit) to be attached to the device to be monitored, and even if a failure occurs in the monitoring device, the monitoring device However, there is a problem that if an abnormality occurs, it may not be possible to detect a failure of the device to be monitored. In addition, there is only a description that a notification is made using a set communication medium (for example, TEL or FAX), but no specific configuration is shown. Further, a specific configuration for contacting many people in a short time is not shown. Further, a configuration for coping with a line failure is not shown. There is a problem that the flexibility of the system is lacking because the update of the contact information and the communication method by the service provider is not considered.
That is, in the inventions described in Patent Literatures 1 and 2, there is a problem that it is difficult to clarify the range of influence from failure detection in the system and to promptly contact many users without omission.
[0008]
The present invention provides a service provider that can promptly notify a service provider of a fault situation when a fault occurs, enables the service provider to change contact information more easily, and improves the accuracy of the contact data. The challenge is to improve.
[0009]
[Means for Solving the Problems]
According to the present invention, in a failure communication system that monitors a monitored device used by a service user and notifies a failure to a service provider when a failure occurs in the monitored device, Request a response periodically, receive a response indicating normal or abnormal from the monitored device, if there is a difference between the content of the response received this time and the content of the previously received response, A monitoring device for transmitting a message indicating a state to the communication device, and a contact table storing contact information that can be modified by a service provider of the monitored device, and a service provider based on the contact information. And a communication device for notifying the user of the communication information.
The monitoring device periodically requests a response from the monitored device, receives a response indicating normality or abnormality from the monitored device, and determines whether a difference between the content of the currently received response and the content of the previously received response is received. If it is found, a message indicating the state of the monitored device is transmitted to the communication device. The contact device has a contact table storing contact information that can be modified by the service provider of the monitored device, and communicates the message to the service provider based on the contact information.
[0010]
Here, the contact information stored in the contact table includes contact information and contact means designated by the service provider, and the contact device communicates with the contact stored in the contact table. You may comprise so that the said message may be communicated using a means.
The contact information and the contact means stored in the contact table may be configured to be changeable by the service provider.
In addition, the message may be configured to indicate a failure occurrence or a failure recovery.
The monitored device may be a server installed in a data center, and the monitoring device and the communication device may be installed in a monitoring center.
[0011]
Further, according to the present invention, in a failure communication device that communicates a failure when a failure occurs in the monitored device, a storage unit having a contact table storing contact information that can be corrected, based on the contact information, And a transmitting means for transmitting a message indicating the state of the monitored device received from the monitoring device to a service provider. The transmitting means notifies the service provider of a message indicating the status of the monitored device received from the monitoring device based on the contact information.
[0012]
Here, the contact information stored in the contact table includes a contact specified by the service provider and a contact unit, and the transmitting unit transmits the contact to the contact stored in the contact table. You may comprise so that the said message may be transmitted using a communication means.
The contact information and the contact means stored in the contact table may be configured to be changeable by the service provider.
In addition, the message may be configured to indicate a failure occurrence or a failure recovery.
[0013]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, a failure communication system according to an embodiment of the present invention and a failure communication device suitable for the failure communication system will be described.
First, an overview of the fault communication system and the fault communication device according to the embodiment of the present invention will be described with reference to FIG. 1 showing the entire configuration of the fault communication system according to the embodiment of the present invention. It has a fault monitoring device that constantly monitors multiple servers installed in data centers and a fault notification device that reports faults. It constantly monitors multiple servers installed in multiple data centers and provides services when a fault occurs. This is a system for notifying the provider of a failure. The system is configured so that a failure can be immediately and accurately notified to a data center user (service provider) from the occurrence of the failure.
[0014]
In FIG. 1, a fault monitoring device 32 installed in a monitoring center 30 periodically requests a response from a monitored device 42 such as a server installed in a data center 40.
The monitoring device 32 receives a response from the monitored device 42 (the response includes a response (normal) indicating normal and a response (abnormal) indicating abnormal ("normal" / "abnormal")). If a response from the monitored device 42 cannot be obtained, the response of the monitored device 42 is determined to be “abnormal”.
When there is a difference between the response received this time and the previous response, the monitoring device 32 notifies the monitored device 42 of the message (the message includes a message indicating that a fault has occurred (failure occurrence) and The communication (failure recovery) (“failure occurrence” / “failure recovery”) indicating the recovery is transmitted to the communication device 33. The communication device 33 has contact information that can be corrected by the service provider 20 of the monitored device 42 itself. The communication device 33 transmits a message to the service provider 20 according to the contact information of the service provider 20 of the monitored device 42.
[0015]
In this way, the fault communication system according to the present embodiment can automatically detect a fault and identify the affected service provider 20 in a short time, so that the fault can be quickly notified to the service provider 20. it can. As a result, there is no need to spend time tracing a complicated local communication network and examining the area of influence. Further, when a failure occurs in the local communication network 41 of the data center 40, the influence is exerted on many service providers 20, but it is possible to contact many of them quickly and at low cost. Further, the contact information and the contact means (for example, e-mail, FAX, etc.) designated by the service provider 20 are updated in real time, and the updated contact means is notified of the trouble by the updated contact means. You will be able to contact without any errors.
[0016]
Hereinafter, a failure communication system according to an embodiment of the present invention and a failure monitoring device suitable for the failure communication system will be described in detail.
FIG. 1 is a block diagram showing the overall configuration of the fault communication system according to the embodiment of the present invention.
FIG. 2 is a diagram showing a form of a communication frame used when performing communication in the present embodiment.
In FIG. 1, the communication between the present system devices except for the transmission and reception between the communication terminal accommodating device 01 and the communication terminal 21 is performed as shown in FIG. Is done. At this time, a device ID (Identification), which is a code unique to each device, is set as a transmission destination and a transmission source. Further, the devices in the present system have device IDs so as to be unique. An example of the device ID is an IP address in an IP (Internet Protocol) network. The reason why the communication frame shown in FIG. 2 is not used for the communication between the communication terminal accommodating apparatus 01 and the communication terminal 21 is because the communication between them is realized by a wide range of communication means.
[0017]
The wide area communication network 00 is a network that connects computers at remote locations using a communication line provided by a communication carrier. A device that connects a communication line to the communication terminal 21 in the wide area communication network 00 is referred to as a communication terminal accommodation device 01. A network device that connects a communication line to the monitoring center 30 in the wide area communication network 00 is referred to as a monitoring center line accommodation device 02.
The contact terminal accommodation device 01 is a gateway that absorbs the difference between the communication method in the wide area communication network 00 and the communication method of the contact terminal 21. Here, the device ID of the contact terminal accommodating device 01 is set as “contact terminal accommodating device 01ID”.
[0018]
The contact terminal accommodation device 01 has an interface for connecting to the backbone of the wide area communication network 00 and an interface for connecting a communication line to the contact terminal 21. When the communication terminal accommodating apparatus 01 receives the information indicating the communication means, the address (number), the object, and the message from the communication apparatus 33, the communication terminal accommodating apparatus 01 specifies the address (number) using the method of the communication means, The connection to the contact terminal 21 is made, and the object and the message are transmitted. Further, the contact terminal accommodation device 01 receives a connection request from the contact terminal 21 and connects. Thereafter, an input instruction is output to the contact terminal 21 so that an input can be made from the input interface of the contact terminal 21. Thereafter, the contact terminal accommodating apparatus 01 receives, from the contact terminal 21, an update request ("update"), a device ID of the contact terminal 21 ("contact terminal 21ID"), a contact means used for contact, and an address (number). . The communication terminal accommodation device 01 connects to the communication device 33 when receiving them. Thereafter, a request for updating the communication means and the address (number) is transmitted to the communication device 33.
[0019]
The monitoring center line accommodation device 02 is a network device such as a router. Here, the device ID of the monitoring center line accommodation device 02 is set as “monitoring center line accommodation device 02ID”. The monitoring center line accommodating device 02 confirms that the communication from the monitoring device 32 to the monitoring center line accommodating device 02 via the local communication network 31 is normally performed. Therefore, the monitoring center line accommodation device 02 is registered in the monitored device table 34 of the monitoring device 32 to be monitored. When a failure occurs in this monitoring, the monitoring device is informed to all the service providers registered in the contact table 35 stored in the storage means of the communication device 33 that the monitoring device has detected the failure.
The monitoring center line accommodating device 02 has an interface for connecting to the backbone of the wide area communication network 00 and an interface for connecting a communication line to the monitoring center 30. Further, when receiving the “response request” from the monitoring device 32, the monitoring center line accommodating device 02 determines its own status and sends “normal” or “abnormal” as a response indicating the status to the monitoring device 32. Reply.
[0020]
The service user 10 uses the service using the service use terminal 11.
The service use terminal 11 is a computer. The service use terminal 11 has an interface (such as a modem) for connecting to the wide area communication network 00. The service use terminal 11 connects to the monitored device 42 such as a server through the interface. The service use terminal 11 inputs information to the monitored device 42. The input information is processed by the monitored device 42 or another server that cooperates, and is output in another form. This is called a service. Examples of services include an information providing service, a settlement service, a mail service, and the like. That is, the service use terminal 11 can use various services by using the monitored device 42 such as a server when the service user 100 operates.
[0021]
The service provider 20 uses the monitored device 42 in the data center 40 to provide a service to the service user 10. The service provider 20 uses the contact terminal 21.
The contact terminal 21 is a device having a data input / output function such as a computer / FAX / telephone. The contact terminal 21 makes a connection request to the contact terminal accommodation device 01 on the wide area communication network 00 and connects. At that time, the contact terminal 21 uses a keyboard / button / dial or the like according to the instruction of the contact terminal accommodation device 01, and indicates “update” indicating an update request, “contact terminal 21ID” which is the device ID of the contact terminal 21, The address (number) of the contact terminal 21 and the contact means used for reporting the failure are transmitted. Thereby, the contact terminal 21 can change the contact means and the address (number) of the contact table 35 stored in the contact device 33. In addition, the communication terminal 21 can perform communication in response to a connection request from the communication terminal accommodation device 01, and receives and outputs a device ID and a message from the communication terminal accommodation device 01. In addition to the update of the contact information, the confirmation can be made by the same means.
[0022]
The monitoring center 30 is a facility for monitoring data centers located in various places.
The local area communication network 31 is configured by combining a wide area communication network 00, a monitoring device 32, and a communication device 33 with a LAN (local area network) device such as a router or a hub. Even if a failure occurs in a line between the monitoring center line accommodating device 02 and the local communication network 31 or in the local communication network 31 itself, a redundant configuration is provided so that communication between the communication device 33 and the communication terminal accommodation device 01 can be performed. Have.
[0023]
The monitoring device 32 is a computer. Here, the device ID of the monitoring device 32 is set as “monitoring device 32 ID”. The monitoring device 32 has an interface (LAN interface) for connecting to the private network 31. The monitoring device 32 connects to a device in the wide area communication network 00 and a device connected to the local communication network 41 in the data center 40 through the interface. The monitoring device 32 holds a monitored device table 34 stored in a storage unit provided in the monitoring device 32. The monitoring device 32 sequentially transmits a response request (“response request”) to the monitored devices having the monitored device ID set in the monitored device table 34 in the monitoring device 32 at regular intervals. From the monitored device. After a certain period of time, the monitoring device 32 confirms the response, and the monitoring device 32 transmits a confirmation result to the communication device 33 according to the pattern.
[0024]
The communication device 33 is a computer. Here, the device ID of the communication device 33 is set as “communication device 33ID”. The communication device 33 has an interface (LAN interface) for connecting to the local communication network 31. The communication device 33 holds a contact table 35 stored in a storage unit of the communication device 33. When receiving the monitored device ID and the confirmation result from the monitoring device 32, the communication device 33 confirms the monitored device ID, and clarifies the communication means and the address (number) according to the confirmation result. After that, the communication device 33 transmits the communication means, the address (number), the target (= monitored device ID), and the message (= confirmation result) to the communication terminal accommodation device 01.
[0025]
In addition, the communication device 33 receives the update request of the communication means and the address (number) from the communication terminal accommodation device 01, changes the contact table 35, and transmits the update result to the communication terminal accommodation device 01.
FIG. 3 is a diagram illustrating the monitored device table 34. As shown in FIG. 3, the monitored device table 34 has a monitored device ID column, a currently responded content column, and a previously responded content column. There is. The monitored device table 34 can be registered / changed / deleted by the monitor 36 using the monitoring device 32.
[0026]
FIG. 4 is a diagram showing the contact table 35. As shown in FIG. 4, the contact table 35 has a monitored device ID column, a contact terminal ID column, a contact means column, and an address (number) column. is there. The contact table 35 can be registered / changed / deleted by the monitor 36 from the communication device 33. Further, the service provider 20 can use the contact terminal 21 to update the contact means and the address (number) of the record in which the contact device ID in the contact table 35 is the contact terminal 21 ID.
The data center 40 is a place where the wide area communication network 00 is drawn into a robust building, and a large number of servers are installed / operated to provide services. Here, only the data center 40 will be described as an example, but there may be a plurality of data centers and a plurality of monitored devices.
[0027]
The private communication network 41 is configured by combining a wide area communication network 00 with LAN devices such as a router and a hub for connecting a large number of server-type computers and the like.
Normally, the monitored device 42 is a server-type computer that processes information input from the service using terminal 11 and transmits some result or data to a predetermined destination. Here, the device ID of the monitored device 42 is set as “monitored device 42ID”. The monitored device 42 has an interface (LAN board or the like) for connecting to the local communication network 41. The monitored device 42 is registered in the monitored device table 34 of the monitoring device 32 to be monitored. Further, when receiving the “response request” from the monitoring device 32, the monitored device 42 determines its own state, and transmits “normal” or “abnormal” to the monitoring device 32 as a response according to the state.
[0028]
FIG. 5 is a block diagram showing a detailed configuration of the monitoring device 32 shown in FIG. In FIG. 5, a fault monitoring device 32 includes a monitoring timer 51, a determination timer 52, an input unit 53 operated by a monitor 36, a LAN interface 54, a fault confirmation unit 55, and a monitored device table 34 stored in a storage unit (not shown). Have.
As shown in FIG. 3, the monitored device table 34 has a "monitored device ID" column, a "current response" column, and a "previous response" column. There is. Here, the monitored device ID records the device ID of the device to be monitored. The “response this time” field records the content of the response this time. The column of "previous response" records the content of the previous response.
[0029]
Upon receiving the notification of the start of monitoring from the monitoring timer 51, the monitored device table 34 initializes the table, and transmits a response request notification for requesting a response to all the monitored devices. . When a response from each monitored device is received, the monitored device table 34 records the content of the response in the “response this time” column. Further, upon receiving the notification of the start of the determination from the determination timer 52, the monitored device table 34 prohibits the updating of the “current response” column, and stores the monitored device ID, the content of the current response and the content of the previous response as necessary. Is transmitted to the failure confirmation unit 55 in response to the request. The monitored device table 34 can be registered / changed / deleted by the monitor 36 using the input unit 53.
[0030]
The monitoring timer 51 transmits a monitoring start notification to the monitored device table 34 at a predetermined monitoring interval (for example, three minutes, five minutes, or the like). Further, a notification of the start of the determination timer is transmitted to the determination timer 52. The monitoring interval of the monitoring timer 51 is set by the monitor 36 using the input unit 53.
When the determination timer 52 receives the notification of the start of the determination timer from the monitoring timer 51, after the set determination interval (for example, three minutes, five minutes, or the like) has elapsed from that point, the determination start of the determination is displayed in the monitored device table 34. Send notifications. The monitor 36 sets the determination interval of the determination timer 52 using the input unit 53. The determination interval needs to be equal to or longer than the sum of the time required for the communication frame to reciprocate between the monitoring device 32 and the monitored device and the processing time of the monitored device.
[0031]
The input unit 53 allows the monitor 36 to set the timer values of the monitoring timer 51 and the determination timer 52, and to add / change / delete records in the monitored device table 34.
The LAN interface 54 is an interface for communicating with the private communication network 31.
Upon receiving the monitored device ID, the content of the current response, and the content of the previous response from the monitored device table 34, the failure checking unit 55 compares the content of the current response with the content of the previous response. As a result, if there is a difference between the content of the current response and the content of the previous response, the confirmation result is transmitted to the communication device 33.
[0032]
FIG. 6 is a block diagram showing a detailed configuration of the communication device 33 shown in FIG. In FIG. 6, the fault communication device 33 has an input unit 61 operated by the monitor 36, a LAN interface 62, a transmission unit 63 constituting a transmission unit, and a contact table 35 stored in a storage unit (not shown).
The contact table 35 includes a “monitored device ID” column, a “contact terminal ID” column, a “contact means” column, and an “address (number)” column as shown in FIG. (One monitored device ID can have a plurality of communication device IDs). The monitored device ID records the device ID of the device to be monitored. The contact terminal ID is a device ID of the contact terminal 21 owned by a person who performs a service using the monitored device 42. The communication means records communication means (communication medium) to the communication terminal 21. For example, “e-mail” / “TEL” / “FAX” / “notification not required” can be selected.
[0033]
The address (number) records the address (number) used when notifying the contact terminal 21 using the contact means. For example, an e-mail address, a TEL number, a FAX number, and the like. If "notification unnecessary" is recorded by the communication means, transmission to this record is not performed. The contact table 35 can be registered / changed / deleted by the monitor 36 from the input unit 61.
The contact table 35 receives the monitored device ID and the confirmation result from the monitoring device 32. At this time, if the monitored device ID is the monitoring center line accommodating device 02, the contact table 35 indicates to the transmitting unit 63 the object (= “monitoring device”), the confirmation result, and the communication means of all records. Send the address (number). If the monitored device ID is not the monitoring center line accommodating device 02, the communication unit and the address (number) of the target (= monitored device ID), the confirmation result, and the record including the monitored device ID are transmitted.
[0034]
When the contact table 35 receives the contact terminal ID, the contact means, the address (number), and the update instruction ("update") from the contact terminal accommodation device 01, the contact table 35 includes the contact device ID in the contact table 35. Update the record contact method and address (number). When the update is performed normally, the contact table 35 indicates that the update has been completed as the communication means, address (number), object (= communication device ID), and communication information to the contact terminal accommodation device 01 (= “update completed”). ”).
The input unit 61 allows the monitor 36 to add / change / delete records in the contact table 35.
The LAN interface 62 is an interface for communicating with the private communication network 31.
Upon receiving the monitored device ID, the contact means, the address (number), and the confirmation result from the contact table 35, the transmitting unit 63 sends the contact means, the address (number), the target, and the contact to the contact terminal accommodation device 01. The item (= confirmation result) is transmitted.
[0035]
FIG. 7 is a flowchart showing the operation of the fault communication system of FIG. Hereinafter, the operation of the fault communication system according to the embodiment of the present invention will be described with reference to FIGS.
The monitoring device 32 reads the monitored device ID from the monitored device table 34 in the monitoring device 32 (Step S70). The monitoring device 32 transmits a response request to the monitored device having each monitored device ID in the monitored device table 34 (Step S71). The monitoring device 32 receives a response from each monitored device (Step S72). The monitoring device 32 records the response from the monitored device ID in the monitored device table 34 (Step S73). The steps S70 to S73 are defined as a monitoring phase 77. This monitoring phase 77 is executed by the monitoring device 32.
[0036]
After a lapse of a fixed time, the monitoring device 32 checks the monitored device table 34 (Step S74). The process of step S74 is referred to as a confirmation phase 78. The confirmation phase 78 is executed by the monitoring device 32.
The confirmation result is transmitted to the contact terminal accommodation device 01 (step S75). The process in step S75 is referred to as a communication phase 79. The communication phase 79 is executed by the communication device 33. The communication terminal accommodating device 01 outputs the confirmation result to the communication terminal 21 (Step S76).
[0037]
Next, detailed operations of the three phases of the monitoring phase 77, the confirmation phase 78, and the communication phase 79 shown in FIG. 7 will be described below with reference to flowcharts. Here, as an example, the monitored device will be described as a monitored device 42 which is one of a plurality of monitored devices.
FIG. 8 is a flowchart showing details of the monitoring phase 77. The monitoring phase 77 will be described with reference to the flowchart in FIG.
The monitoring timer 51 transmits a monitoring start notification (“monitoring start”) to the monitored device table 34 at predetermined intervals (step S80). The monitoring timer 51 transmits a notification of the start of the determination timer to the determination timer 52 (Step S86).
[0038]
Upon receiving the notification of the start of monitoring from the monitoring timer 51, the control means (not shown) of the monitoring device 32 performs the following three initialization processes on the monitored device table 34.
First, the contents of all columns of the current response are transferred to the column of the previous response of the same record. Secondly, for all records in the monitored device table 34, “abnormal” is recorded in the column of the current response, and “” (Null) is recorded in the column of the confirmation result. Third, if the update of the field of the current response is prohibited, it is canceled (step S81).
[0039]
The monitoring device 32 reads out all monitored device IDs (including “monitoring line accommodating device 01 ID”) from the monitored device table 34 (Step S82). The monitoring device 32 transmits a communication frame (the transmission destination is the monitored device ID, the transmission source is the monitoring device 32 ID, and the content is a response request) to the monitored device having each monitored device ID in the monitored device table 34. I do. For example, when transmitting to the monitored device 42, a communication frame (transmission destination = monitored device 42ID, transmission source = monitoring device 32ID, content = response request) is obtained (step S83).
[0040]
When the monitored device 42 receives a communication frame (transmission destination = monitored device 42 ID, transmission source = monitoring device 32 ID, content = response request) from the monitoring device 32, the communication frame (transmission destination = monitoring device 32 ID, transmission source) = Monitored device 42ID, content = normal or abnormal). The monitoring device 32 receives a communication frame (transmission destination = monitoring device 32ID, transmission source = monitored device 42ID, content = normal or abnormal) from the monitored device 42 (step S84). The monitoring device 32 records that there is a response ("response") in the field of the current response of each record including the monitored device 42ID in the monitored table 34 (step S85).
[0041]
FIG. 9 is a flowchart showing details of the confirmation phase 78. The confirmation phase 78 will be described with reference to the flowchart in FIG.
The determination timer 52 transmits a notification to the monitored device table 34 to start the determination at a predetermined interval after the determination interval elapses from the time when the notification of the start of the monitoring timer is received from the monitoring timer 51 (at the predetermined interval) ( Step S90).
When the notification of the start of the determination is received from the determination timer 52, the update of the column of the current response in the monitored device table 34 is prohibited (step S91). The monitoring device 32 searches the monitored device table 34 for a record whose monitored device ID is the monitoring center line accommodation device 02ID (step S92). The monitoring device 32 checks the contents of the column of the current response of the record whose monitored device ID is the monitoring center line accommodating device 02ID in the monitored device table 34 (step S93).
[0042]
When the content of the column of the current response is “abnormal”, the failure confirmation unit 55 determines whether the monitored device ID, the content of the current response column, The contents of the previous response column are received (step S94). If the content of the current response column is "normal", the failure confirmation unit 55 receives the monitored device IDs of all records, the content of the current response column, and the content of the previous response column (step S95). .
Upon receiving the monitored device ID, the content of the column of the current response, and the content of the column of the previous response, the failure checking unit 55 compares the content of the column of the current response with the content of the column of the previous response (step S96).
[0043]
If there is a difference between the contents of the column of the current response and the contents of the column of the previous response, the failure confirmation unit 55 sends the communication frame (the transmission destination is the communication device 33 ID, the transmission destination is the transmission destination) to the communication device 33 via the LAN interface 54. The source device transmits the monitoring device 32 ID, and the communication frame includes the monitored device ID and the confirmation result.
The result is divided into the following two patterns. First, when the content of the current response column is “abnormal” and the content of the previous response column is “normal”, the confirmation result is set to “failure occurred”. Second, when the content of the current response column is “normal” and the content of the previous response column is “abnormal”, the confirmation result is set to “failure recovery” (step S97).
[0044]
FIG. 10 is a flowchart showing details of the communication phase 79. The communication phase 79 will be described with reference to the flowchart of FIG.
The communication device 33 receives a communication frame (the transmission destination is the communication device 33ID, the transmission source is the monitoring device 32ID, the content is the monitored device ID, and the confirmation result) from the monitoring device 32 (step S100).
The control unit (not shown) of the communication device 33 checks the monitored device ID using the contact table 35 (step S101).
[0045]
When the device ID of the monitored device is the monitoring center line accommodating device 02ID, the control unit transmits the target (= “monitoring device”) and the confirmation result to the transmitting unit 63 (step S102). When the monitored device is other than the monitoring center line accommodating device 02ID, the control unit transmits the target (= monitored device ID) and the confirmation result to the transmitting unit 63. This is performed because the name "monitoring center line accommodating device 02ID" is not disclosed to the service user, so that it is rephrased as "monitoring device" (step S103).
[0046]
Next, when the monitored device is the monitoring center line accommodating device 02ID, the control means transmits the communication means and addresses (numbers) of all the records in the contact table 35 to the transmitting unit 63 (step S104). If the monitored device is other than “monitoring center line accommodation device 02ID”, the communication means and the address (number) of the record including the monitored device ID in the contact table 35 are all transmitted to the transmitting unit 63 in order. (Step S105).
The transmitting unit 63 first receives the target and the confirmation result from the contact table 35. Next, each time the transmitting unit 63 receives the communication means and the address (number) from the contact table 35, the communication frame (the transmission destination is the communication terminal accommodation device 01ID, the transmission source is the communication device 33ID, and the content is the communication means , An address (number), an object, and a communication frame that is a message (= confirmation result) (step S106).
[0047]
Next, output of information from the contact terminal accommodation device 01 to the contact terminal 21 will be described below.
The communication terminal accommodating device 01 receives a communication frame from the communication device 33 (the communication destination is the communication terminal accommodating device 01ID, the transmission source is the communication device 33ID, and the content is the communication means, the address (number), the communication frame including the target and the communication items) Is received, the address (number) is specified using a predetermined communication means, a connection to the communication terminal 21 is made, and the object and the message are transmitted. For example, if the contact means is e-mail ("e-mail") and the address (number) is "name@domain.com", the destination is set to "name @ domain" using the mail server function of the contact terminal accommodation device 01. .Com ", the body is set to the monitored device ID and the message, and the electronic mail is transmitted.
[0048]
If the communication means is telephone (= "TEL") and the address (number) is "090-1234-5678", the communication terminal accommodation device 01 dials the telephone number "090-1234-5678", The monitored device ID and the message are transmitted using the voice response function.
The contact terminal 21 receives and outputs the target and the message from the contact terminal accommodation device 01. For example, "monitored device 42ID", "failure occurrence", "contact terminal 21ID", "contact update" and the like can be output.
[0049]
FIG. 11 is a flowchart showing the operation of changing the communication means and the address (number). Hereinafter, the process of changing the communication means and the address (number) will be described with reference to the flowchart shown in FIG.
The service provider 20 uses the contact terminal 21 to make a connection request to connect to the contact terminal accommodation device 01 on the wide area communication network 00 (step S110). The service provider 20 operates an operation means such as a keyboard / button / dial at the communication terminal 21 in accordance with an instruction of the communication terminal accommodating device 01 to request an update ("update"), a communication terminal 21ID, a communication means, The address (number) is transmitted (step S111).
[0050]
The communication terminal accommodation device 01 connects to the communication device 33. The communication terminal accommodating apparatus 01 transmits a communication frame (a communication frame in which the transmission destination is the communication device 33ID, the transmission source is the communication terminal 21ID, the content is the communication means, the address (number), and the communication information is updated ("update")). (Step S112).
When the communication device 33 receives the communication frame (the transmission destination is the communication device 33 ID, the transmission source is the communication terminal 21 ID, the content is the communication means, the address (number), and the communication frame indicating “update” (“update”), the communication device 33 The communication means and the address (number) of the record including the communication terminal 21ID as the transmission source are updated in the communication terminal ID field in the destination table 35 (step S113).
[0051]
When the update is performed normally, the communication device 33 transmits the communication frame (the transmission destination is the communication terminal accommodation device 01ID, the transmission source is the communication device 33ID, and the communication device 33 includes the communication means and the address (number) as the contents. The communication terminal 21ID transmits a communication frame in which the message is updated ("update completed") (step S114).
The communication terminal accommodating device 01 transmits the communication frame (the transmission destination is the communication terminal accommodating device 01ID, the transmission source is the communication device 33ID, the content is the communication means, the address (number), the communication terminal 21ID, and the communication information) from the communication device 33. If it has been received, the address (number) is designated using a predetermined communication means, the connection to the communication terminal 21 is made, and the communication terminal 21 ID and the message are transmitted (step S115).
The contact terminal 21 receives and outputs the contact terminal 21 ID and the message from the contact terminal accommodation device 01. The contact terminal 21 outputs, for example, the received device ID “contact terminal 21ID” and the contact information “contact update” (step S116).
[0052]
As described above, the failure communication system according to the embodiment of the present invention monitors the monitored device 42 used by the service user 10 and, when the failure of the monitored device 42 occurs, notifies the service provider 20 In the fault communication system for notifying a fault by sending a response to the monitored device 42 periodically, and based on the response from the monitored device 42, whether the monitored device 42 is normal or abnormal. 32, and a contact table 35 storing contact information that can be corrected by the service provider 20 of the monitored device 42, and the monitoring device can monitor the monitored device based on the monitoring result of the monitored device. And a communication device 33 for notifying the service provider 20 of the abnormality of the monitored device 42 based on the contact information.
[0053]
Further, the failure communication system according to the embodiment of the present invention monitors the monitored device 42 used by the service user 10 and, when a failure occurs in the monitored device 42, notifies the service provider 20 of the failure. In the failure communication system, a response is periodically requested to the monitored device 42, a response indicating normal or abnormal is received from the monitored device 42, the content of the response received this time and the response received last time. If there is a difference in the content of the monitored device 42, there is provided a monitoring device 32 for transmitting a message indicating the state of the monitored device 42 to the communication device 33, and a storage means for storing a contact table 35 storing contact information. A contact device 33 for transmitting the message to the service provider 20 based on the contact information; and a contact device 33 used by the service provider 20 and stored in the contact table 35. It is characterized in that it comprises a terminal device 21 for changing the information.
[0054]
The contact information stored in the contact table 35 includes contact information and contact means designated by the service provider, and the contact device 33 transmits the contact information to the contact stored in the contact table 35. The above information is communicated by means. The contact information and the contact means stored in the contact table 35 can be changed by the contact terminal 21 used by the service provider 20. When a response from the monitored device 42 cannot be obtained, the monitoring device 32 regards the response from the monitored device 42 as a response indicating that there is an abnormality. The message is an item representing occurrence of a failure or recovery from a failure. The monitored device 42 is a server installed in the data center 40, and the monitoring device 32 and the communication device 33 are installed in the monitoring center 30. Further, according to the above-described embodiment, in the fault communication device 33 for notifying a fault when a fault occurs in the monitored device 42, a storage unit having a contact table 35 storing contact information that can be corrected, It is characterized by comprising transmitting means for transmitting, to the contact terminal 21 of the service provider 20, a message indicating the state of the monitored device 42 received from the monitoring device 32 based on the preceding information.
[0055]
Therefore, the system can automatically detect a failure, clarify the range of influence, and report the failure, so that when a failure occurs, many people can be immediately contacted. Also, there is no omission of communication. In addition, communication costs can be reduced.
In addition, since the service provider can change the contact information and the communication method in the event of a failure, the request for changing the contact information and the communication method of the service provider can be promptly reflected. In addition, since the service provider can check the contact information by itself, there is also an effect that the service provider and the center do not have a mismatch in recognition of the contact information.
In addition, when a failure occurs, the failure status can be promptly notified to the service provider, and the service provider can easily change the contact information and improve the accuracy of the contact data.
[0056]
Further, there is no need to create a failure status table, and the service stop status can be determined directly from the monitored device table 34 (state change value table).
Also, no special device is required on the monitored device side. Also, it is possible to contact many people in a short time.
Also, it is possible to monitor the monitoring center line accommodating device 02 and respond to a line failure.
In addition, there is an effect that the change / addition of the monitoring target can be realized on the monitoring center 30 side without affecting the device on the service user side.
[0057]
Note that the above embodiment can be variously modified. For example, the wide area communication network 00 may be configured as a private network. In addition, by newly adding a record to the contact table 35, it is possible to contact center operation personnel, equipment maintenance personnel, center managers, and the like other than the service provider. Further, if the monitoring device 32 is configured to receive a failure pattern from the monitored device 42, a failure pattern field is added to the contact table 35, and the received failure pattern is compared with the registered failure pattern. Thereby, the contact can be changed according to the failure pattern.
[0058]
【The invention's effect】
According to the present invention, at the time of occurrence of a failure, the failure status is promptly notified to the service provider, the contact information can be easily changed by the service provider itself, and the contact data can be changed. Accuracy can be improved.
[Brief description of the drawings]
FIG. 1 is a block diagram showing an overall configuration of a fault communication system according to an embodiment of the present invention.
FIG. 2 is a diagram showing a form of a communication frame used in the fault communication system according to the embodiment of the present invention.
FIG. 3 is a diagram showing a monitored device table used in the fault communication system according to the embodiment of the present invention.
FIG. 4 is a diagram showing a contact table used in the failure communication system according to the embodiment of the present invention.
FIG. 5 is a block diagram showing a detailed configuration of a monitoring device in the fault communication system according to the embodiment of the present invention.
FIG. 6 is a block diagram showing a detailed configuration of a communication device in the failure communication system according to the embodiment of the present invention.
FIG. 7 is a flowchart showing an operation of the fault communication system according to the embodiment of the present invention.
FIG. 8 is a flowchart showing a detailed process of a monitoring phase in the fault communication system according to the embodiment of the present invention.
FIG. 9 is a flowchart showing a detailed process of a confirmation phase in the fault communication system according to the embodiment of the present invention.
FIG. 10 is a flowchart showing detailed processing of a communication phase in the failure communication system according to the embodiment of the present invention.
FIG. 11 is a flowchart illustrating a change process of a communication unit and the like in the fault communication system according to the embodiment of the present invention.
[Explanation of symbols]
00 ... wide area communication network (network)
01 ・ ・ ・ Contact terminal accommodation device
02 ・ ・ ・ Monitoring center line accommodation device
11 ・ ・ ・ Service use terminal
21 ・ ・ ・ Contact terminal
30 ・ ・ ・ Monitoring center
40 ・ ・ ・ Data center
31, 41 ... private communication network
32 Monitoring device
33 ・ ・ ・ Contact device
34 ・ ・ ・ Monitored device table
35 ・ ・ ・ Contact table
42 ・ ・ ・ Monitored device
51 ・ ・ ・ Monitoring timer
52 ... judgment timer
53, 61 ... input unit
54, 62 ... LAN interface
55 ・ ・ ・ Failure confirmation unit
63 ... Transmission unit constituting transmission means

Claims (9)

サービス利用者が利用する被監視装置を監視し、前記被監視装置の障害発生時に、サービス提供者に対して障害を連絡する障害連絡システムにおいて、
前記被監視装置に対して定期的に応答を要求し、前記被監視装置から正常又は異常を表す応答を受信して、今回受信した応答の内容と前回受信した応答の内容に差異がみられる場合は、前記被監視装置の状態を表す連絡事項を連絡装置に送信する監視装置と、前記被監視装置のサービス提供者が修正可能な連絡先情報を記憶した連絡先テーブルを有し、前記連絡先情報に基づいてサービス提供者に対し前記連絡事項を連絡する連絡装置とを備えて成ることを特徴とする障害連絡システム。
In a failure communication system that monitors a monitored device used by a service user and notifies a failure to a service provider when a failure occurs in the monitored device,
When a response is periodically requested to the monitored device and a response indicating normal or abnormal is received from the monitored device, and there is a difference between the content of the currently received response and the content of the previously received response. Has a monitoring device for transmitting a message indicating a state of the monitored device to a communication device, and a contact table storing contact information that can be modified by a service provider of the monitored device, wherein the contact A communication device for notifying the service provider of the message based on the information.
前記連絡先テーブルに記憶した連絡先情報には、前記サービス提供者が指定した連絡先及び連絡手段が含まれて成り、前記連絡装置は前記連絡先テーブルに記憶した連絡先へ前記連絡手段を用いて前記連絡事項を連絡することを特徴とする請求項1記載の障害連絡システム。The contact information stored in the contact table includes contact information and contact means designated by the service provider, and the contact device uses the contact means to contact the contact stored in the contact table. 2. The failure communication system according to claim 1, wherein the communication information is communicated by a notification. 前記連絡先テーブルに記憶した連絡先及び連絡手段は前記サービス提供者が変更可能であることを特徴とする請求項2記載の障害連絡システム。3. The fault communication system according to claim 2, wherein the contact information and the communication means stored in the contact information table can be changed by the service provider. 前記連絡事項は、障害発生又は障害復旧を表す事項であることを特徴とする請求項1乃至3のいずれか一に記載の障害連絡システム。The failure notification system according to any one of claims 1 to 3, wherein the notification is a matter indicating occurrence of a failure or recovery from a failure. 前記被監視装置はデータセンタに設置されたサーバであると共に、前記監視装置及び連絡装置は監視センタに設置されて成ることを特徴とする請求項1乃至4のいずれか一に記載の障害連絡システム。5. The fault communication system according to claim 1, wherein the monitored device is a server installed in a data center, and the monitoring device and the communication device are installed in a monitoring center. . 被監視装置の障害発生時に障害を連絡する障害連絡装置において、
修正が可能な連絡先情報を格納した連絡先テーブルを有する記憶手段と、前記連絡先情報に基づいて、監視装置から受信した被監視装置の状態を表す連絡事項をサービス提供者に送信する送信手段とを備えて成ることを特徴とする障害連絡装置。
In a failure communication device that reports a failure when a failure occurs in the monitored device,
Storage means having a contact table storing contact information that can be modified, and transmitting means for transmitting, to the service provider, a message received from the monitoring apparatus and indicating the state of the monitored device, based on the contact information. And a failure communication device.
前記連絡先テーブルに記憶した連絡先情報には、前記サービス提供者が指定した連絡先及び連絡手段が含まれて成り、前記送信手段は、前記連絡先テーブルに記憶した連絡先へ前記連絡手段を用いて前記連絡事項を送信することを特徴とする請求項6記載の障害連絡装置。The contact information stored in the contact table includes a contact and a contact unit designated by the service provider, and the transmitting unit transmits the contact unit to the contact stored in the contact table. 7. The fault communication device according to claim 6, wherein the message is transmitted by using the error notification device. 前記連絡先テーブルに記憶した連絡先及び連絡手段は前記サービス提供者が変更可能であることを特徴とする請求項7記載の障害連絡装置。8. The fault communication device according to claim 7, wherein the contact information and the communication means stored in the contact information table can be changed by the service provider. 前記連絡事項は、障害発生又は障害復旧を表す事項であることを特徴とする請求項6乃至8のいずれか一に記載の障害連絡装置。The fault communication device according to any one of claims 6 to 8, wherein the communication item is an item indicating occurrence of a failure or recovery from a failure.
JP2003131772A 2003-05-09 2003-05-09 Obstacle report system and obstacle report device Pending JP2004334684A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003131772A JP2004334684A (en) 2003-05-09 2003-05-09 Obstacle report system and obstacle report device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003131772A JP2004334684A (en) 2003-05-09 2003-05-09 Obstacle report system and obstacle report device

Publications (1)

Publication Number Publication Date
JP2004334684A true JP2004334684A (en) 2004-11-25

Family

ID=33506863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003131772A Pending JP2004334684A (en) 2003-05-09 2003-05-09 Obstacle report system and obstacle report device

Country Status (1)

Country Link
JP (1) JP2004334684A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272464A (en) * 2006-03-30 2007-10-18 Toshiba Corp Information processing system and information processing method
JP2012502544A (en) * 2009-03-20 2012-01-26 ネットマン カンパニー リミテッド IPv6 network host blocking and searching method
US11178256B2 (en) 2019-02-18 2021-11-16 Nec Corporation Business service providing system, business service recovery method, and business service recovery program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272464A (en) * 2006-03-30 2007-10-18 Toshiba Corp Information processing system and information processing method
JP2012502544A (en) * 2009-03-20 2012-01-26 ネットマン カンパニー リミテッド IPv6 network host blocking and searching method
US11178256B2 (en) 2019-02-18 2021-11-16 Nec Corporation Business service providing system, business service recovery method, and business service recovery program

Similar Documents

Publication Publication Date Title
EP1360796B1 (en) Method and system for a set of network appliances which can be connected to provide enhanced collaboration, scalability, and reliability
US7426654B2 (en) Method and system for providing customer controlled notifications in a managed network services system
US6813634B1 (en) Network fault alerting system and method
CN106330475B (en) Method and device for managing main and standby nodes in communication system and high-availability cluster
JP2021141582A (en) Fault recovery method and apparatus, and storage medium
GB2440069A (en) Monitoring simulating device, method, and program
JP2000022783A (en) Method for extending ability of ping function in interconnection between open systems
KR100908131B1 (en) Fault detection device and method using log filtering and fault detection system using the device
US7738362B2 (en) System and method for address notification in a network
JP2007251697A (en) Equipment monitoring and control system, method, and program
CN110474821B (en) Node fault detection method and device
JP2004334684A (en) Obstacle report system and obstacle report device
US9100302B2 (en) Methods and systems for monitoring multicast availability
US20080310314A1 (en) Method for Detecting a Message Interface Fault in a Communication Device
KR101143922B1 (en) Apparatus for automatically restoring a network
EP3607767A1 (en) Network fault discovery
JP2003273930A (en) Network failure monitoring method, communication system and line switching device
CN111064608A (en) Master-slave switching method and device of message system, electronic equipment and storage medium
JP2004295656A (en) Communication system, client device, load distribution method of server device by client device
JP2009100363A (en) Network monitoring system, and terminal device
JP2002271524A (en) Combustion controller alarm supervisory system and remote supervisory device
JP2021016090A (en) Communication device, failure notice system, failure notice method, and failure notice program
JP2013121095A (en) Communication device
JP2000029745A (en) Fault detection method, computer system, and constitution apparatus and storage medium thereof
JPH11351569A (en) Alarm/monitor system for combustion controller, remote monitor and combustion controller

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070424

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080304