JP2002229870A - Server trouble monitoring system - Google Patents

Server trouble monitoring system

Info

Publication number
JP2002229870A
JP2002229870A JP2001027239A JP2001027239A JP2002229870A JP 2002229870 A JP2002229870 A JP 2002229870A JP 2001027239 A JP2001027239 A JP 2001027239A JP 2001027239 A JP2001027239 A JP 2001027239A JP 2002229870 A JP2002229870 A JP 2002229870A
Authority
JP
Japan
Prior art keywords
server
administrator
server computer
monitoring
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001027239A
Other languages
Japanese (ja)
Inventor
Keiso Cho
圭相 趙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brain Kk E
E BRAIN KK
Original Assignee
Brain Kk E
E BRAIN KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brain Kk E, E BRAIN KK filed Critical Brain Kk E
Priority to JP2001027239A priority Critical patent/JP2002229870A/en
Publication of JP2002229870A publication Critical patent/JP2002229870A/en
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

PROBLEM TO BE SOLVED: To promptly and accurately monitor and recover an Internet server trouble regardless of place or time. SOLUTION: This server trouble monitoring system comprises a monitoring server computer and an auxiliary server computer. The monitoring sever computer comprises a database registering means recording distinguish information and administrator information of server computers to be managed in a memory means as an administrator database in advance; a remote monitoring means sending a specified sending signal to the server computers on the Internet registered in the administrator database through the Internet, and determining the presence/absence of trouble occurrence on each server computer on the basis of a response to the sending signal; and a notifying means notifying trouble information to a terminal of an administrator of the server computer wherein trouble occurs. The auxiliary server computer comprises a signal receiving means receiving a recovery command from the terminal of the administrator, and a controlling means recovering the server computer wherein the trouble occurs on the basis of the recovery command.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、サーバコンピュー
タの障害を監視して自動的に復旧させるサーバ障害監視
システムに関するものであり、特に障害情報を遠隔の管
理者端末に自動的に通知し、遠隔の管理者端末から障害
の発生しているサーバコンピュータの復旧を可能とした
サーバ障害監視システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a server fault monitoring system for monitoring a fault of a server computer and automatically recovering the fault, and in particular, automatically notifies fault information to a remote manager terminal, The present invention relates to a server failure monitoring system which enables a failed server computer to be recovered from an administrator terminal of the server.

【0002】[0002]

【従来の技術】インターネット上のサーバコンピュー
タ、あるいはローカルエリアネットワーク上のサーバコ
ンピュータには種種の障害が発生する可能性がある。こ
のような障害状況を監視するために、従来の方法では、
インターネット上でサーバコンピュータから他のサーバ
コンピュータに対する監視を行う方法は採られておら
ず、ローカルエリアネットワーク上にサーバコンピュー
タを監視するためのローカルマシンを設置して、監視用
の担当者が常にローカルマシンをモニタリングしなが
ら、サーバコンピュータの稼働状況を目視で確認すると
いう方法が採られていた。そして、担当者がサーバコン
ピュータの障害を発見すると、サーバのシステム管理者
に障害発生の旨、及び障害の詳細情報等を電話で連絡
し、連絡を受けたシステム管理者が手動でサーバコンピ
ュータを再起動させて障害を除去するようになってい
る。
2. Description of the Related Art Various failures may occur in server computers on the Internet or on a local area network. In order to monitor such a failure situation, the conventional method
There is no method of monitoring a server computer from another server computer on the Internet. A local machine for monitoring the server computer is installed on a local area network, and a person in charge of monitoring always has a local machine. While monitoring the status of the server computer, the operating status of the server computer is visually checked. When the person in charge finds a failure in the server computer, he / she notifies the server system administrator of the failure and detailed information on the failure by telephone, and the system administrator who receives the notification manually restarts the server computer. It is designed to start up and remove the fault.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、このよ
うな従来の障害監視の方法では、ローカルネットワーク
上のローカルマシンで担当者がモニタリングで障害状況
を監視し電話等によりシステム管理者に障害内容を音声
で通知しているので、障害状況を正確に伝達することが
困難である。このため、サーバコンピュータの障害を除
去して再稼働させるまでに時間を要してしまうという問
題がある。
However, according to such a conventional fault monitoring method, a person in charge monitors the fault condition by monitoring on a local machine on a local network, and voices the contents of the fault to a system administrator by telephone or the like. , It is difficult to accurately communicate the failure situation. For this reason, there is a problem that it takes time to remove the failure of the server computer and restart it.

【0004】また、サーバコンピュータをインターネッ
ト上で運用している場合、一般ユーザは他のネットワー
クやダイアルアップ等によりホームページの閲覧等のイ
ンターネットを介して接続してくるため、常にサーバコ
ンピュータを稼働させていることが好ましく、何らかの
障害が発生した場合には迅速な障害除去及び再稼働が必
要となってくる。システム管理者がサーバから離れてい
る状況であれば、障害発生について迅速に通知すること
は困難であり、また、障害が発生したサーバのシステム
管理者が障害内容を把握したとしても即時かつ正確に対
応することは非常に困難である。実際に、ほとんどのイ
ンターネット・サーバは、所有者及び管理者からは距離
の遠いところに離れている場合が多く、海外にインター
ネットのサーバをおく場合も少なくない。このために自
己のサーバに障害が発生していることが判っている場合
でも、自己のインターネット・サーバが設置されている
ところに連絡がつかない場合にはサーバを再稼動させる
ことができず、サーバの復旧までは時間を要してしまう
という問題がある。
[0004] When the server computer is operated on the Internet, a general user is connected via the Internet, such as browsing a homepage, via another network or dial-up, so the server computer is always operated. It is preferable that if any trouble occurs, quick trouble elimination and restarting are required. If the system administrator is away from the server, it is difficult to notify promptly about the occurrence of the failure, and even if the system administrator of the failed server grasps the details of the failure, it can be immediately and accurately performed. It is very difficult to respond. In fact, most Internet servers are often far away from their owners and managers, and often have Internet servers abroad. For this reason, even if you know that your server is faulty, if you can not reach the place where your Internet server is installed, you can not restart the server, There is a problem that it takes time to recover the server.

【0005】一方、インターネット・サーバは、通常、
ホームページを出力するWWWサーバ(通常はApacheサー
バ)、電子メールの配信を管理するメールサーバ、ファ
イル転送のためのFTPサーバ、データベースを管理する
データベースサーバ等、機能が異なる種種のサーバプロ
セスが混在して起動されている。従来のサーバコンピュ
ータの障害監視ではローカルエリアネットワーク上のロ
ーカルマシンがサーバコンピュータの本体に電源が投入
されているか否かという状態をチェックすることにより
判断しているので、サーバコンピュータの中のいずれか
のサーバプロセスで障害が発生している場合にも他のサ
ーバプロセスが正常に稼働していれば、サーバコンピュ
ータ本体に電源が投入されている状態であるため、正常
に稼働していると判断されることが多い。このため、シ
ステム管理者または一般ユーザが直接インターネット・
サーバにアクセスして初めて障害が発生していることを
知り、障害をアクセス前に探知することは困難である。
また、これらのインターネット・サーバは、同一のネッ
トワーク上で監視される場合には、そのネットワークの
回線とインターネット網とを連結するルータまたはDNS
サーバ、インターネット回線の障害が出ても、その障害
を探知することは困難である。
On the other hand, Internet servers are usually
A mix of server processes with different functions, such as a WWW server (usually an Apache server) that outputs home pages, a mail server that manages e-mail distribution, an FTP server for file transfer, and a database server that manages databases Has been started. In conventional fault monitoring of a server computer, the local machine on the local area network determines whether or not the server computer itself is powered on. Even if a failure occurs in the server process, if other server processes are operating normally, it is determined that the server computer is operating normally because the server computer itself is powered on. Often. For this reason, system administrators or general users
It is difficult to know that a failure has occurred only after accessing the server, and to detect the failure before access.
If these Internet servers are monitored on the same network, a router or a DNS connecting the line of the network to the Internet network is used.
Even if a failure occurs in the server or the Internet line, it is difficult to detect the failure.

【0006】本発明はこのような問題点に鑑みてなされ
たものであり、サーバ、特にインターネット・サーバの
障害監視及び復旧を、場所または時間を問わずに迅速か
つ正確に行えるサーバ障害監視システムを提供すること
である。
SUMMARY OF THE INVENTION The present invention has been made in view of such problems, and a server fault monitoring system capable of quickly and accurately monitoring faults and recovering a server, particularly an Internet server, regardless of location or time. To provide.

【0007】[0007]

【課題を解決するための手段】上述の目的を達成するた
め、請求項1に係る発明は、監視サーバコンピュータ
と、補助サーバコンピュータと、を備えたサーバ障害監
視システムであって、前記監視サーバコンピュータは、
管理対象となるサーバコンピュータの識別情報及び管理
者情報を、予め管理者データベースとして記憶手段に記
録するデータベース登録手段と、前記管理者データベー
スに登録されたインターネット上のサーバコンピュータ
に対しインターネットを介して所定の送信信号を送信
し、該送信信号に対する応答に基づいて各サーバコンピ
ュータにおける障害発生の有無を判断するリモート監視
手段と、障害が発生しているサーバコンピュータの管理
者の端末に対して障害情報を通知する通知手段と、を備
えたものであり、前記補助サーバコンピュータは、前記
管理者の端末から復旧指令を受信する着信手段と、前記
復旧指令に基づいて、障害が発生しているサーバコンピ
ュータを復旧させる制御手段と、を備えたものであるこ
とを特徴とする。
According to one aspect of the present invention, there is provided a server failure monitoring system including a monitoring server computer and an auxiliary server computer, wherein the monitoring server computer includes a monitoring server computer and an auxiliary server computer. Is
Database registration means for pre-recording the identification information and the manager information of the server computer to be managed in the storage means as a manager database; Remote monitoring means for transmitting a transmission signal of the above, and determining whether or not a failure has occurred in each server computer based on a response to the transmission signal; and transmitting failure information to a terminal of an administrator of the server computer in which the failure has occurred. Notifying means for notifying, the auxiliary server computer, receiving means for receiving a recovery command from the terminal of the administrator, based on the recovery command, based on the recovery command, the server computer in which a failure has occurred And control means for restoring.

【0008】この請求項1に係る発明では、監視サーバ
において管理者データベースに登録されたサーバコンピ
ュータに対しインターネットを介して所定の送信信号を
送信し、この送信信号に対する応答に基づいて各サーバ
コンピュータにおける障害発生の有無を判断しているの
で、インターネット回線に常時接続されているサーバの
障害監視を自動的に迅速に行える。また、本発明では、
サーバコンピュータに障害が発生した場合には、監視サ
ーバから障害が発生しているサーバコンピュータの管理
者の端末に対して障害情報を通知するので、管理者が自
己の管理するサーバコンピュータから遠隔地にいる場合
でも、管理者はサーバコンピュータの正確な障害情報を
即時に入手することができる。しかも、障害情報を管理
者の端末に通知するので、電話等で口頭で障害状況を知
らせていた従来のサーバ障害監視システムに比べて、よ
り正確な障害情報を得ることができる。
According to the first aspect of the present invention, the monitoring server transmits a predetermined transmission signal to the server computer registered in the administrator database via the Internet, and based on a response to the transmission signal, each server computer Since the presence / absence of a failure is determined, failure monitoring of a server constantly connected to the Internet line can be automatically and promptly performed. In the present invention,
If a failure occurs in the server computer, the monitoring server notifies the administrator's terminal of the failed server computer of the failure information. In such a case, the administrator can immediately obtain accurate fault information of the server computer. Moreover, since the fault information is notified to the administrator's terminal, more accurate fault information can be obtained as compared with a conventional server fault monitoring system that verbally notifies the fault status by telephone or the like.

【0009】また、本発明のサーバ障害監視システムを
インターネット上の複数設置しておき、各管理者データ
ベースに設置したサーバコンピュータの識別情報を登録
しておくことにより、インターネット上の複数のサーバ
コンピュータ間で相互に障害監視を行えるという利点も
ある。
Further, by installing a plurality of server fault monitoring systems of the present invention on the Internet and registering the identification information of the server computers installed in each administrator database, a plurality of server failure monitoring systems can be installed on the Internet. Another advantage is that fault monitoring can be performed mutually.

【0010】更に、本発明では、障害通知を受けた管理
者が、自己の端末から補助サーバに対して自己が管理す
るサーバコンピュータの復旧指令を送信すれば、補助サ
ーバはその復旧指令に基づいて障害が発生しているサー
バコンピュータを復旧させるので、管理者が自己が管理
するサーバコンピュータから遠隔地にいたとしても、迅
速に障害の復旧作業を行える。このため、サーバコンピ
ュータの障害発生から復旧完了までに要する時間は短縮
され、サーバコンピュータをインターネット上で運用す
る場合の障害対処の迅速化が図られる。
Further, according to the present invention, if the administrator who has received the failure notification transmits a restoration command of the server computer managed by the terminal to the auxiliary server from his / her own terminal, the auxiliary server receives the instruction based on the restoration instruction. Since the server computer in which the failure has occurred is recovered, even if the administrator is at a remote location from the server computer managed by the administrator, the failure can be quickly recovered. For this reason, the time required from the occurrence of a failure of the server computer to the completion of recovery is shortened, and quicker troubleshooting can be achieved when the server computer is operated on the Internet.

【0011】本発明における管理者データベースに登録
されるサーバコンピュータの識別情報は、サーバコンピ
ュータをインターネット上で識別できるものであれば良
く、例えば、サーバコンピュータのURL、IPアドレ
ス、ドメイン名等があげられる。
The identification information of the server computer registered in the administrator database in the present invention may be any information as long as the server computer can be identified on the Internet, such as the URL, IP address, and domain name of the server computer. .

【0012】また、本発明における管理者の端末は、イ
ンターネット上に接続されたPC(パーソナルコンピュ
ータ)やワークステーション、あるいは携帯情報端末
(PDA)、携帯電話等の携帯端末等があげられる。ま
た管理者の端末情報とは、管理者に直接通知できるもの
でれば良く、管理者の電子メールアドレス、携帯電話の
電子メールアドレス、携帯電話の電話番号等が挙げられ
る。
The administrator's terminal in the present invention may be a personal computer (PC) or a workstation connected to the Internet, a personal digital assistant (PDA), a mobile terminal such as a mobile phone, or the like. Further, the terminal information of the administrator may be any information that can be directly notified to the administrator, and may include an e-mail address of the administrator, an e-mail address of a mobile phone, a telephone number of a mobile phone, and the like.

【0013】監視サーバの監視手段からサーバコンピュ
ータに送信する所定の送信信号は、サーバコンピュータ
へアクセスするものであれば良く、サーバコンピュータ
のURL、IPアドレス、ドメイン名等を指定した信号
等でも良い。また、監視手段による送信信号の送信は、
常時監視を可能とするために1秒等の短時間毎に送信す
るように構成する他、1時間以上の長時間ごとに送信す
るように構成しても良い。
The predetermined transmission signal transmitted from the monitoring means of the monitoring server to the server computer may be a signal for accessing the server computer, and may be a signal designating the URL, IP address, domain name or the like of the server computer. The transmission of the transmission signal by the monitoring means
In order to enable constant monitoring, transmission may be performed at short intervals such as one second, or transmission may be performed at intervals of one hour or longer.

【0014】また、サーバコンピュータからの応答は、
障害を知らせる旨やエラーの旨等の応答信号の他、サー
バコンピュータに送信した送信信号に対する応答が所定
時間経過してもないことを応答としても良い。
The response from the server computer is
In addition to a response signal indicating a failure or an error, a response indicating that a response to a transmission signal transmitted to the server computer has not elapsed for a predetermined time may be used as the response.

【0015】監視サーバの通知手段によって通知する障
害情報としては、障害に関する情報であれば任意に定め
ることができ、例えば、障害発生サーバ名(IPアドレス
またはドメイン)、障害発生のインターネット・サーバ
種類(WWWサーバ、メールサーバ、FTPサーバ、データベ
ース)、障害発生時刻、予想される障害種類などがあげ
られる。また、ここで障害種類は、発生すると予想さ
れ、かつリモート監視手段によって検知できるものであ
れば良く、例えば、アクセス過剰、メモリ不足、ハード
ディスク(HDD)容量不足、停電、ハッキング、ハッカー
の侵入、不正アクセス、ウィルス感染、ウィルスファイ
ル保存、サービス妨害(DoS)等が挙げられる。
The fault information to be notified by the notification means of the monitoring server can be arbitrarily determined as long as the information is related to a fault. For example, the fault server name (IP address or domain), the type of the Internet server in which the fault occurred ( WWW server, mail server, FTP server, database), failure time, expected failure type, etc. In addition, the fault type may be any type that is expected to occur and can be detected by the remote monitoring means.For example, excessive access, insufficient memory, insufficient hard disk (HDD) capacity, power failure, hacking, hacker intrusion, unauthorized Access, virus infection, virus file storage, denial of service (DoS), and the like.

【0016】補助サーバの制御手段は、サーバコンピュ
ータを復旧させるものであれば良く、障害を除去した
り、サーバコンピュータに対してパワーコントローラを
介して再起動させるように構成しても良い。
The control means of the auxiliary server only needs to restore the server computer, and may be configured to remove a fault or restart the server computer via the power controller.

【0017】尚、本発明におけるサーバコンピュータと
は、単独のコンピュータで構成されるサーバコンピュー
タの他、複数のコンピュータから構成されるワークステ
ーション等のサーバコンピュータ群も含まれる。
Note that the server computer in the present invention includes a group of server computers such as workstations including a plurality of computers, in addition to a server computer configured by a single computer.

【0018】請求項2に係る発明は、管理対象となるサ
ーバコンピュータの識別情報及び管理者情報を、予め管
理者データベースとして記憶手段に記録するデータベー
ス登録手段と、前記管理者データベースに登録されたイ
ンターネット上のサーバコンピュータに対しインターネ
ットを介して所定の送信信号を送信し、該送信信号に対
する応答に基づいて各サーバコンピュータにおける障害
発生の有無を判断するリモート監視手段と、障害が発生
しているサーバコンピュータの管理者の端末に対して障
害情報を通知する通知手段と、を備えたことを特徴とす
るサーバ障害監視装置に係るものである。
According to a second aspect of the present invention, there is provided a database registering means for recording identification information and manager information of a server computer to be managed in a storage means as a manager database in advance, and an Internet registered in the manager database. Remote monitoring means for transmitting a predetermined transmission signal to the above server computer via the Internet and determining whether or not a failure has occurred in each server computer based on a response to the transmission signal, and a server computer having a failure And a notifying unit for notifying the failure information to the terminal of the administrator of the server.

【0019】この請求項2に係る発明は、請求項1に記
載したサーバ障害監視システムの監視サーバコンピュー
タに係るものである。本発明では、管理者データベース
に登録されたサーバコンピュータに対しインターネット
を介して所定の送信信号を送信し、この送信信号に対す
る応答に基づいて各サーバコンピュータにおける障害発
生の有無を判断しているので、インターネット回線に常
時接続されているサーバの障害監視を自動的に迅速に行
える。また、本発明では、サーバコンピュータに障害が
発生した場合には、監視サーバから障害が発生している
サーバコンピュータの管理者の端末に対して障害情報を
通知するので、管理者が自己の管理するサーバコンピュ
ータから遠隔地にいる場合でも、管理者はサーバコンピ
ュータの正確な障害情報を即時に入手することができ
る。しかも、障害情報を管理者の端末に通知するので、
電話等で口頭で障害状況を知らせていた従来のサーバ障
害監視システムに比べて、より正確な障害情報を得るこ
とができる。
The invention according to claim 2 relates to a monitoring server computer of the server failure monitoring system according to claim 1. According to the present invention, a predetermined transmission signal is transmitted to the server computer registered in the administrator database via the Internet, and it is determined whether or not a failure has occurred in each server computer based on a response to the transmission signal. Failure monitoring of a server constantly connected to the Internet line can be automatically and quickly performed. Further, in the present invention, when a failure occurs in the server computer, the monitoring server notifies the terminal of the administrator of the failed server computer of the failure information, so that the administrator manages the failure. Even when the administrator is at a remote location from the server computer, the administrator can immediately obtain accurate fault information of the server computer. In addition, since fault information is notified to the administrator's terminal,
It is possible to obtain more accurate fault information as compared with a conventional server fault monitoring system that verbally notifies a fault status by telephone or the like.

【0020】また、本発明のサーバ障害監視システムを
インターネット上の複数設置しておき、各管理者データ
ベースに設置したサーバコンピュータの識別情報を登録
しておくことにより、インターネット上の複数のサーバ
コンピュータ間で相互に障害監視を行える。
Also, a plurality of server fault monitoring systems of the present invention are installed on the Internet, and the identification information of the server computers installed in each administrator database is registered, so that a plurality of server computers on the Internet can be connected. Can mutually monitor faults.

【0021】請求項3に係る発明は、請求項2に記載の
サーバ障害監視装置において、前記リモート監視手段
は、更に自己のコンピュータの属するローカルエリアネ
ットワーク上のサーバコンピュータに対して前記送信信
号を送信して各サーバコンピュータの障害発生の有無を
判断するものであることを特徴とする。
According to a third aspect of the present invention, in the server fault monitoring apparatus according to the second aspect, the remote monitoring means further transmits the transmission signal to a server computer on a local area network to which the own computer belongs. Then, it is determined whether or not a failure has occurred in each server computer.

【0022】この請求項3に係る発明では、インターネ
ット上のサーバコンピュータの他、自己(監視サーバ)
の属するローカルエリアネットワーク(LAN)上に接
続されたサーバコンピュータをも障害監視の対象として
いるので、LAN上のサーバコンピュータに障害が発生
した場合でも正確かつ迅速に管理者に障害情報を知らせ
ることができる。
According to the third aspect of the invention, in addition to the server computer on the Internet, the self (monitoring server)
Since the server computers connected to the local area network (LAN) to which the server belongs also are subject to fault monitoring, even if a fault occurs in the server computer on the LAN, it is possible to accurately and promptly notify the administrator of the fault information. it can.

【0023】本発明における自己のコンピュータの属す
るローカルエリアネットワーク上のサーバコンピュータ
の識別情報は、管理者データベースに登録する他、イン
ターネット上のサーバコンピュータと区別するために別
個のデータベースで管理するように構成することは任意
である。
In the present invention, the identification information of the server computer on the local area network to which the own computer belongs is registered in an administrator database and managed by a separate database to distinguish it from the server computer on the Internet. It is optional.

【0024】請求項4に係る発明は、請求項2又は3に
記載のサーバ障害監視装置において、自己のコンピュー
タ内で作動するサーバプロセスに対して前記送信信号を
送信し、前記サーバプロセスからの応答に基づいて前記
サーバプロセスの障害発生の有無を判断する自己監視手
段と、前記自己監視手段により前記サーバプロセスにお
ける障害発生を判断した場合に、前記サーバプロセスに
対し再起動指令を発行する起動手段と、を更に備えたも
のであることを特徴とする。
According to a fourth aspect of the present invention, in the server fault monitoring device according to the second or third aspect, the transmission signal is transmitted to a server process operating in its own computer, and a response from the server process is transmitted. Self-monitoring means for judging the presence or absence of a failure in the server process based on a start-up means for issuing a restart command to the server process when the self-monitoring means determines the occurrence of a failure in the server process. , Is further provided.

【0025】この請求項4に係る発明では、インターネ
ット上のサーバコンピュータの他、自己監視手段によっ
て自己(監視サーバ)のサーバコンピュータ内で作動す
るサーバプロセスをも障害監視の対象としているので、
自己のサーバコンピュータのサーバプロセスに障害が発
生した場合でも正確かつ迅速に管理者に障害情報を知ら
せることができる。また、自己監視手段が自己(監視サ
ーバ)のサーバコンピュータのサーバプロセスにおける
障害発生を判断したときに、起動手段によって当該サー
バプロセスに対し再起動指令を発行するので、管理者端
末への障害情報の通知や管理者端末からの復旧指令を待
たずにサーバプロセスを復旧させることができる。この
ため、インターネット上で運用されるサーバコンピュー
タの復旧作業をより迅速に行える。
In the invention according to the fourth aspect, in addition to the server computer on the Internet, the server process operated by the self (monitoring server) server computer by the self-monitoring means is also subject to fault monitoring.
Even if a failure occurs in the server process of its own server computer, the failure information can be accurately and promptly notified to the administrator. Further, when the self-monitoring means determines that a failure has occurred in the server process of the server computer of the self (monitoring server), the activation means issues a restart command to the server process, so that the failure information is transmitted to the administrator terminal. The server process can be recovered without waiting for a notification or a recovery command from the administrator terminal. For this reason, the recovery work of the server computer operated on the Internet can be performed more quickly.

【0026】本発明における自己(監視サーバ)のサー
バコンピュータの識別情報は、管理者データベースに登
録する他、インターネット上のサーバコンピュータと区
別したデータベースにより管理しても良い。
In the present invention, the identification information of the server computer of itself (monitoring server) may be registered in the administrator database, or may be managed by a database distinguished from the server computer on the Internet.

【0027】本発明の自己監視手段によって検知する障
害発生は、発生すると予想され、かつ自己監視手段によ
って検知できるものであれば良く、例えば、アクセス過
剰、メモリ不足、ハードディスク(HDD)容量不足、停
電、ハッキング、ハッカーの侵入、不正アクセス、ウィ
ルス感染、ウィルスファイル保存、サービス妨害(Do
S)等が挙げられる。
The fault occurrence detected by the self-monitoring means of the present invention may be any fault that is expected to occur and can be detected by the self-monitoring means, such as excessive access, insufficient memory, insufficient hard disk (HDD) capacity, and power failure. Hacking, hacker intrusion, unauthorized access, virus infection, virus file storage, denial of service (Do
S) and the like.

【0028】請求項5に係る発明は、請求項2〜4のい
ずれか1項に記載のサーバ障害監視装置において、前記
リモート監視手段は、前記サーバコンピュータ内の複数
の異なるサーバプロセスに対して前記送信信号を送信
し、各サーバプロセスからの応答に基づいて、サーバプ
ロセスにおける障害発生の有無を判断するものであるこ
とを特徴とする。
According to a fifth aspect of the present invention, in the server fault monitoring device according to any one of the second to fourth aspects, the remote monitoring means is provided for the plurality of different server processes in the server computer. A transmission signal is transmitted, and the presence or absence of a failure in the server process is determined based on a response from each server process.

【0029】この請求項5に係る発明は、サーバコンピ
ュータに複数のサーバプロセスが実行されている場合の
監視を行うものである。このようなサーバプロセスとし
ては、例えばホームページを出力するWWWサーバ、電子
メールの配信を管理するメールサーバ、ファイル転送の
ためのFTPサーバ、データベースを管理するデータベー
スサーバ等があげられる。
[0029] The invention according to claim 5 is for monitoring when a plurality of server processes are executed on a server computer. Examples of such server processes include a WWW server that outputs a home page, a mail server that manages the distribution of electronic mail, an FTP server that transfers files, and a database server that manages a database.

【0030】本発明では、このような一つのサーバコン
ピュータで動作する複数のサーバプロセスの夫々につい
て障害監視を行っているので、複数のサーバプロセスの
うちいずれかが正常稼働していればサーバコンピュータ
の障害が認知される可能性の低い従来の障害監視装置に
比べて、正確な障害発生を探知することができる。
In the present invention, failure monitoring is performed for each of a plurality of server processes operating on such one server computer. Therefore, if any of the plurality of server processes is operating normally, the server computer is monitored. It is possible to detect the occurrence of a fault more accurately than a conventional fault monitoring device in which a fault is less likely to be recognized.

【0031】請求項6に係る発明は、請求項2〜5のい
ずれか1項に記載のサーバ障害監視装置において、前記
リモート監視手段は、一定時間毎に前記送信信号を送信
するものであることを特徴とする。
According to a sixth aspect of the present invention, in the server fault monitoring device according to any one of the second to fifth aspects, the remote monitoring means transmits the transmission signal at regular intervals. It is characterized by.

【0032】この請求項6に係る発明では、監視手段が
サーバコンピュータに対して送信信号を一定時間毎に送
信しているので、インターネット上のサーバコンピュー
タの障害発生を必要に応じた的確な間隔で監視すること
ができる。このような監視手段としては、1秒等の短時
間毎に送信信号を送信することにより障害の常時監視を
実現できる。また、24時間全て一定時間毎に送信信号
を送信する他、障害が生じ難い時間帯にに一定時間毎に
送信信号を送信し、その他の障害の生じやすい時間帯に
は常時監視を行うように構成しても良い。
According to the sixth aspect of the present invention, since the monitoring means transmits the transmission signal to the server computer at regular intervals, the occurrence of a failure in the server computer on the Internet can be determined at appropriate intervals as necessary. Can be monitored. Such a monitoring means can always monitor a failure by transmitting a transmission signal every short time such as one second. In addition, in addition to transmitting a transmission signal at regular intervals for all 24 hours, a transmission signal is transmitted at regular intervals during a time period when a failure is unlikely to occur, and monitoring is constantly performed during other time periods when a failure is likely to occur. You may comprise.

【0033】請求項7に係る発明は、請求項2〜6のい
ずれか1項に記載のサーバ障害監視装置において、前記
データベース登録手段は、前記管理者端末からサーバコ
ンピュータの識別情報及び管理者の端末情報の入力があ
ったとき、入力された識別情報及び端末情報に基づいて
サーバコンピュータと管理者端末にアクセスし、正常に
アクセスできた場合にのみ前記入力された識別情報及び
端末情報を前記管理者データベースに登録するものであ
ることを特徴とする。
According to a seventh aspect of the present invention, in the server fault monitoring device according to any one of the second to sixth aspects, the database registration means transmits the identification information of the server computer and the information of the administrator from the administrator terminal. When the terminal information is input, the server computer and the administrator terminal are accessed based on the input identification information and the terminal information, and the input identification information and the terminal information are managed only when the terminal can be normally accessed. It is characterized in that it is to be registered in a user database.

【0034】この請求項7に係る発明は、サーバコンピ
ュータの識別情報及び管理者の端末情報の管理者データ
ベースへの登録の際に、実際に入力された識別情報及び
端末情報に基づいてサーバコンピュータと管理者端末に
アクセスし、正常にアクセスできた場合にのみ入力され
た識別情報及び端末情報を管理者データベースに登録す
るので、管理者が入力した識別情報及び端末情報が正確
なものか否かを自動的に判断することができ、また誤っ
た情報の登録を未然に防止することができる。
According to a seventh aspect of the present invention, when registering the identification information of the server computer and the terminal information of the administrator in the administrator database, the server computer and the server computer are connected to each other based on the identification information and the terminal information actually input. Access to the administrator terminal and register the entered identification information and terminal information in the administrator database only when access is successful, so it is necessary to check whether the identification information and terminal information entered by the administrator are accurate. Automatic determination can be made, and registration of incorrect information can be prevented.

【0035】請求項8に係る発明は、障害が発生してい
るサーバコンピュータのサーバの管理者端末から復旧指
令を受信する着信手段と、前記復旧指令に基づいて、前
記サーバコンピュータに対し再起動コマンドを送出する
制御手段と、を備えたことを特徴とするサーバ復旧装置
に係るものである。
According to an eighth aspect of the present invention, there is provided an incoming call receiving means for receiving a recovery command from an administrator terminal of a server of a server computer in which a failure has occurred, and a restart command to the server computer based on the recovery command. And a control means for sending the server recovery message.

【0036】この請求項8に係る発明は、請求項1に記
載したサーバ障害監視システムの補助サーバコンピュー
タである。本発明では、障害通知を受けた管理者が、自
己の端末からサーバ復旧装置に対して自己が管理するサ
ーバコンピュータの再起動コマンドを送信すれば、サー
バ復旧装置はその再起動コマンドに基づいて障害が発生
しているサーバコンピュータを再起動して復旧させるの
で、管理者が自己が管理するサーバコンピュータから遠
隔地にいたとしても、迅速に障害の復旧作業を行える。
このため、サーバコンピュータの障害発生から復旧完了
までに要する時間は短縮され、サーバコンピュータをイ
ンターネット上で運用する場合の障害対処の迅速化が図
られる。
The invention according to claim 8 is an auxiliary server computer of the server failure monitoring system according to claim 1. According to the present invention, if the administrator who has received the failure notification transmits a restart command of the server computer managed by the terminal to the server recovery device from his / her own terminal, the server recovery device receives the failure based on the restart command. Since the server computer in which the error has occurred is restarted and recovered, even if the administrator is at a remote location from the server computer managed by the administrator, the recovery work can be quickly performed.
For this reason, the time required from the occurrence of a failure of the server computer to the completion of recovery is shortened, and quicker troubleshooting can be achieved when the server computer is operated on the Internet.

【0037】請求項9に係る発明は、管理対象となるサ
ーバコンピュータの識別情報及び管理者情報が予め登録
された管理者データベースに登録されたインターネット
上のサーバコンピュータに対し、インターネットを介し
て所定の送信信号を送信する送信ステップと、該送信信
号に対する応答に基づいて各サーバコンピュータにおけ
る障害発生の有無を判断する監視ステップと、障害が発
生しているサーバコンピュータの管理者の端末に対して
障害情報を通知する通知ステップと、をコンピュータに
実行させるためのリモート監視プログラムに係るもので
ある。
According to a ninth aspect of the present invention, a server computer on the Internet, which is registered in an administrator database in which identification information and administrator information of a server computer to be managed are registered in advance, transmits a predetermined information via the Internet. A transmission step of transmitting a transmission signal; a monitoring step of determining whether or not a failure has occurred in each server computer based on a response to the transmission signal; and failure information to a terminal of an administrator of the server computer in which the failure has occurred. And a remote monitoring program for causing a computer to execute the notification step.

【0038】この請求項9に係る発明は、請求項2に記
載のサーバ障害監視装置を実現するためのプログラムで
あり、請求項2に係る発明と同様の作用効果を奏する。
According to a ninth aspect of the present invention, there is provided a program for realizing the server fault monitoring device according to the second aspect, which has the same operational effects as the second aspect of the invention.

【0039】請求項10に係る発明は、請求項9に記載
のリモート障害監視プログラムにおいて、前記送信ステ
ップは、更に監視サーバの属するローカルエリアネット
ワーク上のサーバコンピュータに対して前記送信信号を
送信するものであることを特徴とする。
According to a tenth aspect of the present invention, in the remote fault monitoring program according to the ninth aspect, the transmitting step further transmits the transmission signal to a server computer on a local area network to which a monitoring server belongs. It is characterized by being.

【0040】この請求項10に係る発明は、請求項3に
記載のサーバ障害監視装置を実現するためのプログラム
であり、請求項2に係る発明と同様の作用効果を奏す
る。
According to a tenth aspect of the present invention, there is provided a program for realizing the server fault monitoring device according to the third aspect, which has the same operation and effect as the second aspect of the invention.

【0041】請求項11に係る発明は、請求項9又は1
0に記載のリモート障害監視プログラムにおいて、前記
送信ステップは、前記サーバコンピュータ内の複数の異
なるサーバプロセスに対して前記送信信号を送信するも
のであり、前記監視ステップは、各サーバプロセスから
の応答に基づいて、サーバプロセスにおける障害発生の
有無を判断するものであることを特徴とする。
The invention according to claim 11 is the invention according to claim 9 or 1
0, the transmitting step transmits the transmission signal to a plurality of different server processes in the server computer, and the monitoring step responds to a response from each server process. It is characterized in that the presence or absence of a failure in the server process is determined based on this.

【0042】この請求項11に係る発明は、請求項5に
記載のサーバ障害監視装置を実現するためのプログラム
であり、請求項5に係る発明と同様の作用効果を奏す
る。
The invention according to claim 11 is a program for realizing the server fault monitoring device according to claim 5, and has the same operation and effect as the invention according to claim 5.

【0043】請求項12に係る発明は、請求項9〜11
のいずれか1項に記載のリモート障害監視プログラムに
おいて、前記送信ステップは、一定時間毎に前記送信信
号を送信するものであることを特徴とする。
The invention according to claim 12 is the invention according to claims 9 to 11
In the remote fault monitoring program according to any one of the above, the transmitting step transmits the transmission signal at regular intervals.

【0044】この請求項12に係る発明は、請求項6に
記載のサーバ障害監視装置を実現するためのプログラム
であり、請求項6に係る発明と同様の作用効果を奏す
る。
According to a twelfth aspect of the present invention, there is provided a program for realizing the server fault monitoring device according to the sixth aspect, which has the same operational effects as the sixth aspect of the invention.

【0045】請求項13に係る発明は、請求項9〜12
のいずれか1項に記載のリモート障害監視プログラムに
おいて、前記管理者端末からサーバコンピュータの識別
情報及び管理者の端末情報の入力があったとき、入力さ
れた識別情報及び端末情報に基づいてサーバコンピュー
タ及び管理者端末にアクセスし、正常にアクセスできた
場合にのみ前記入力された識別情報と端末情報を前記管
理者データベースに登録するデータベース登録ステップ
を、更に監視サーバコンピュータに実行させることを特
徴とする。
The invention according to claim 13 is the invention according to claims 9 to 12
In the remote fault monitoring program according to any one of the above, when identification information of the server computer and terminal information of the administrator are input from the administrator terminal, the server computer is configured based on the input identification information and terminal information. And accessing the administrator terminal and causing the monitoring server computer to further execute a database registration step of registering the input identification information and terminal information in the administrator database only when the administrator terminal can be normally accessed. .

【0046】この請求項13に係る発明は、請求項7に
記載のサーバ障害監視装置を実現するためのプログラム
であり、請求項7に係る発明と同様の作用効果を奏す
る。
According to a thirteenth aspect of the present invention, there is provided a program for realizing the server fault monitoring device according to the seventh aspect, which has the same operational effects as the seventh aspect of the invention.

【0047】請求項14に係る発明は、監視サーバコン
ピュータ内で作動するサーバプロセスに対して所定の送
信信号を送信する送信ステップと、前記サーバプロセス
からの応答に基づいて前記サーバプロセスの障害発生の
有無を判断する監視ステップと、前記監視ステップによ
り前記サーバプロセスにおける障害発生を判断した場合
に、前記サーバプロセスに対し再起動指令を発行する起
動ステップと、をコンピュータに実行させるための自己
障害監視プログラムに係るものである。
According to a fourteenth aspect of the present invention, a transmission step of transmitting a predetermined transmission signal to a server process operating in a monitoring server computer, and a step of generating a failure of the server process based on a response from the server process. A self-monitoring program for causing a computer to execute a monitoring step of determining presence / absence and a start step of issuing a restart command to the server process when the occurrence of a fault in the server process is determined by the monitoring step. It is related to.

【0048】この請求項14に係る発明は、請求項4に
記載のサーバ障害監視装置を実現するためのプログラム
であり、請求項4に係る発明と同様の作用効果を奏す
る。
According to a fourteenth aspect of the present invention, there is provided a program for realizing the server fault monitoring device according to the fourth aspect, which has the same operation and effect as the fourth aspect of the invention.

【0049】請求項15に係る発明は、障害が発生して
いるサーバコンピュータのサーバの管理者端末から復旧
指令を受信する着信ステップと、前記復旧指令に基づい
て、前記サーバコンピュータに対し再起動コマンドを送
出する制御ステップと、をコンピュータに実行させるた
めのサーバ復旧プログラムに係るものである。
The invention according to claim 15 is an incoming call step of receiving a restoration command from a server administrator terminal of a server computer in which a failure has occurred, and a restart command to the server computer based on the restoration command. And a server recovery program for causing a computer to execute the program.

【0050】この請求項15に係る発明は、請求項8に
記載のサーバ復旧装置を実現するためのプログラムであ
り、請求項8に係る発明と同様の作用効果を奏する。
The invention according to claim 15 is a program for realizing the server restoration device according to claim 8, and has the same operation and effect as the invention according to claim 8.

【0051】[0051]

【発明の実施の形態】以下に添付図面を参照して、本発
明に係るサーバ障害監視システム、サーバ障害装置及び
サーバ障害プログラムの好適な実施の形態を詳細に説明
する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of a server failure monitoring system, a server failure device, and a server failure program according to the present invention will be described below in detail with reference to the accompanying drawings.

【0052】(サーバ障害監視システムの全体構成)図
1は本実施形態に係るサーバ障害監視システムの全体構
成図であり、3つの本システムがインターネットに接続
された状態を示している。図1において、N1,N2,
N3はいずれも障害監視の対象となるサーバコンピュー
タが設置されるネットワークであり、各ネットワーク内
には、DNSサーバコンピュータ7、補助サーバコンピ
ュータ5、PC9(パーソナルコンピュータ)、監視サ
ーバコンピュータX1、サーバコンピュータX2、サー
バコンピュータX3等がイーサネット(登録商標)ケー
ブル13により接続され、ローカルエリアネットワーク
(LAN)環境が構築されている。そして、各ネットワ
ークは、ファイアウォール8、ルータ11を通じてイン
ターネット網に接続されている。尚、ネットワークN2
及びN3については、簡略化のため監視サーバコンピュ
ータと補助サーバコンピュータのみを図示し、他の構成
は省略している。
(Overall Configuration of Server Fault Monitoring System) FIG. 1 is an overall configuration diagram of a server fault monitoring system according to the present embodiment, and shows a state where three systems are connected to the Internet. In FIG. 1, N1, N2,
N3 is a network in which server computers to be monitored for failure are installed. Each network includes a DNS server computer 7, an auxiliary server computer 5, a PC 9 (personal computer), a monitoring server computer X1, and a server computer X2. , A server computer X3 and the like are connected by an Ethernet (registered trademark) cable 13 to construct a local area network (LAN) environment. Each network is connected to the Internet via a firewall 8 and a router 11. The network N2
As for N3 and N3, only the monitoring server computer and the auxiliary server computer are shown for simplicity, and other configurations are omitted.

【0053】図1に示すように、本実施形態のサーバ障
害監視システムは、監視サーバコンピュータX1と補助
サーバコンピュータ5とから主に構成される。
As shown in FIG. 1, the server fault monitoring system according to the present embodiment mainly includes a monitoring server computer X1 and an auxiliary server computer 5.

【0054】監視サーバコンピュータX1には、CPU
とメモリと(共に図示せず)、本発明の記憶手段を構成
するハードディスク3とを備えた通常のコンピュータの
構成を有しており、更に電源を再投入するためのパワー
コントローラ4を備えている。また、図1に示すよう
に、監視サーバコンピュータX1のメモリ上ではWWW
サーバ、メールサーバ、FTPサーバ、データベースサ
ーバの各サーバプロセスが動作している。
The monitoring server computer X1 has a CPU
And a memory (both not shown), and a hard disk 3 constituting storage means of the present invention, and has a power controller 4 for turning on the power again. . As shown in FIG. 1, WWW is stored in the memory of the monitoring server computer X1.
Server processes of a server, a mail server, an FTP server, and a database server are operating.

【0055】また、監視サーバコンピュータX1のメモ
リ上では自己監視サーバ1とリモート監視サーバ2と管
理者登録・修正サーバ14の各サーバプロセスが動作し
ている。自己監視サーバ1は、監視サーバコンピュータ
X1内のWWWサーバ、メールサーバ、FTPサーバ及
びデータベースサーバの各サーバプロセスにおける障害
発生を自己監視ものであり、後述する自己監視プログラ
ムを実行することにより監視サーバコンピュータX1の
メモリ上に生成される。また、リモート監視サーバ2
は、LAN上のサーバコンピュータX2及びX3(以
下、「LANサーバX2及びX3」という)内の各サー
バプロセスにおける障害発生及び、インターネット上の
サーバコンピュータY1及びY2(以下、「インターネ
ット・サーバY1及びY2」という)内の各サーバプロ
セスの障害発生を監視するものであり、後述するリモー
ト監視プログラムを実行することにより監視サーバコン
ピュータX1のメモリ上に生成される。管理者登録・修
正サーバ14は、監視サーバコンピュータX1内の後述
する自己サーバ管理者データベースとリモートサーバ管
理者データベースに対する管理者レコードの登録及び修
正を行うものであり、後述するデータベース登録・修正
プログラムを実行することにより監視サーバコンピュー
タX1のメモリ上に生成される。
The server processes of the self-monitoring server 1, the remote monitoring server 2, and the administrator registration / correction server 14 are operating on the memory of the monitoring server computer X1. The self-monitoring server 1 self-monitors the occurrence of a failure in each server process of the WWW server, the mail server, the FTP server, and the database server in the monitoring server computer X1, and executes the self-monitoring program described later to execute the self-monitoring server computer. It is generated on the memory of X1. Also, the remote monitoring server 2
Indicates that a failure has occurred in each server process in the server computers X2 and X3 on the LAN (hereinafter, referred to as "LAN servers X2 and X3") and that the server computers Y1 and Y2 on the Internet (hereinafter, "Internet servers Y1 and Y2"). ) Is monitored on the memory of the monitoring server computer X1 by executing a remote monitoring program described later. The administrator registration / correction server 14 registers and corrects an administrator record in a self-server administrator database and a remote server administrator database (described later) in the monitoring server computer X1, and executes a database registration / correction program described later. By execution, it is generated on the memory of the monitoring server computer X1.

【0056】インターネット・サーバY1及びY2も監
視サーバコンピュータX1と同様の構成をしているが、
X1より規模の大きなインターネット専用サーバのネッ
トワークグループの中に属するように構成しても良い。
Although the Internet servers Y1 and Y2 have the same configuration as the monitoring server computer X1,
You may comprise so that it may belong to the network group of the internet-only server larger than X1.

【0057】補助サーバコンピュータ5は、それが接続
されるサーバコンピュータの電源を再投入するためのも
のであり、このためサーバコンピュータのパワーコント
ローラ4に接続されている。また、補助サーバコンピュ
ータ5は、ハードディスク6と、モデム、ターミナルア
ダプタ(TA)等の通信装置(図示せず)とを有してお
り、通信装置により携帯電話網、公衆回線網、ISDN
網にも接続され、各サーバコンピュータのシステム管理
者の端末10(携帯電話10a、PC10b、PDA
(携帯情報機器)10c等)から後述する復旧指令を受
信するようになっている。
The auxiliary server computer 5 is for turning on the power of the server computer to which it is connected again, and is therefore connected to the power controller 4 of the server computer. The auxiliary server computer 5 has a hard disk 6 and a communication device (not shown) such as a modem and a terminal adapter (TA). The communication device uses a mobile phone network, a public line network, and an ISDN.
It is also connected to a network, and the terminal 10 of the system administrator of each server computer (cellular phone 10a, PC 10b, PDA)
(A portable information device) 10c, etc.) to receive a later-described restoration command.

【0058】(監視サーバコンピュータの機能的構成)
図2(a)は、監視サーバコンピュータX1の機能的構
成(ソフトウェア構成)を示すブロック図である。図2
(a)に示すように、監視サーバコンピュータX1は、
自己監視部202と、リモート監視部205と、通知部
203と、起動部201と、データベース登録・修正部
204と、認証部212とから主に構成される。これら
各部は自己監視プログラム、リモート監視プログラム、
管理者登録・修正プログラムをそれぞれ実行することに
よりメモリ上に生成され、各部は互いに連携して動作す
る。
(Functional Configuration of Monitoring Server Computer)
FIG. 2A is a block diagram illustrating a functional configuration (software configuration) of the monitoring server computer X1. FIG.
As shown in (a), the monitoring server computer X1
It mainly includes a self-monitoring unit 202, a remote monitoring unit 205, a notifying unit 203, a starting unit 201, a database registration / correction unit 204, and an authentication unit 212. Each of these parts is a self-monitoring program, a remote monitoring program,
The information is generated on the memory by executing the administrator registration / correction program, and the units operate in cooperation with each other.

【0059】自己監視部202は、本発明の自己監視手
段を構成し、監視サーバコンピュータX1内で作動する
WWWサーバ、メールサーバ、FTPサーバ及びデータ
ベースサーバの各サーバプロセスの障害発生を監視す
る。リモート監視部205は、本発明のリモート監視手
段を構成し、LANサーバX2及びX3とインターネッ
ト・サーバY1及びY2の夫々における障害発生を監視
する。
The self-monitoring section 202 constitutes the self-monitoring means of the present invention, and monitors the occurrence of a failure in each server process of the WWW server, the mail server, the FTP server, and the database server operating in the monitoring server computer X1. The remote monitoring unit 205 constitutes a remote monitoring unit of the present invention, and monitors the occurrence of a failure in each of the LAN servers X2 and X3 and the Internet servers Y1 and Y2.

【0060】通知部203は、本発明の通知手段を構成
し、自己監視部202又はリモート監視部205により
監視していたサーバコンピュータに障害が発生した場合
に障害情報を含む電子メールを作成して、該当するサー
バのシステム管理者の通知先電子メールのアドレス又は
携帯電話メールのアドレスに送信するものである。
The notifying unit 203 constitutes a notifying means of the present invention, and generates an e-mail including fault information when a fault occurs in the server computer monitored by the self-monitoring unit 202 or the remote monitoring unit 205. The e-mail is transmitted to the e-mail address of the notification destination of the system administrator of the corresponding server or the e-mail address of the mobile phone.

【0061】起動部201は、本発明の起動手段を構成
し、自己監視部202により監視サーバコンピュータX
1内で作動する各サーバプロセスのいずれかに障害が発
生した場合に、自動的に障害のあるサーバを再起動する
ために再起動コマンドを発行するものである。
The activating unit 201 constitutes activating means of the present invention, and the self-monitoring unit 202 controls the monitoring server computer X
When a failure occurs in any of the server processes operating in the server 1, a restart command is issued to automatically restart the failed server.

【0062】自己サーバ管理者データベース206は、
監視サーバコンピュータX1のシステム管理者の情報を
管理するためのデータベースであり、監視サーバコンピ
ュータX1のハードディスク3に作成されている。図1
0は、自己サーバ管理者データベース206に登録され
る管理者レコードのデータ構造図である。自己サーバ管
理者データベース206には全ての管理者がこのように
管理者レコードとして登録されている。図10に示すよ
うに各管理者レコードは、管理名(ID)、パスワー
ド、管理者氏名、通知先携帯電話メールアドレス(複数
フィールド)、携帯電話番号、通知先電子メールアドレ
ス(複数フィールド)、一般電話番号、対象サーバ1〜
5(対象サーバ6以上も指定可)のURL(WWWサー
バ名,FTPサーバ名,メールサーバ名,データベース
サーバ名、その他のサーバ名等)と各対象サーバに対す
る監視の有無、監視結果の定期報告の各フィールドから
構成され、管理名(ID)がキーとなっている。監視の
有無フィールドは、各対象サーバを監視対象とするか否
かを指定するものであり、このフィールドに「監視す
る」と指定されていれば自己監視サーバによる障害監視
の対象とされ、「監視しない」が指定されていれば障害
監視の対象とされない。また、監視結果の定期報告フィ
ールドは、サーバに対する監視の結果の報告メールを定
期的に受信するか否か指定するフィールドであり、この
フィールドに「受ける」が設定されている場合には監視
結果の報告メールを定期的に受信し、「受けない」が設
定されている場合には障害が発見された場合にのみ障害
通知メールを受信するように処理される。
The self server administrator database 206
This is a database for managing information of the system administrator of the monitoring server computer X1, and is created on the hard disk 3 of the monitoring server computer X1. Figure 1
0 is a data structure diagram of an administrator record registered in the server administrator database 206. All administrators are thus registered as administrator records in the self-server administrator database 206. As shown in FIG. 10, each administrator record includes a management name (ID), a password, an administrator name, a notification destination mobile phone e-mail address (multiple fields), a mobile phone number, a notification destination e-mail address (multiple fields), a general Phone number, target server 1
URL (WWW server name, FTP server name, mail server name, database server name, other server name, etc.) of 5 (target server 6 or more can be specified), whether or not there is monitoring for each target server, and the periodic report of the monitoring result Each field is composed of a management name (ID) as a key. The monitoring presence / absence field specifies whether or not each target server is to be monitored. If "monitor" is specified in this field, the failure monitoring is performed by the self-monitoring server. If "No" is specified, failure monitoring is not performed. The monitoring result periodic report field is a field for specifying whether or not to periodically receive a monitoring result report mail to the server. When “receive” is set in this field, the monitoring result The report mail is periodically received, and if “not received” is set, processing is performed so that the failure notification mail is received only when a failure is found.

【0063】リモートサーバ管理者データベース207
は、監視対象となるLANサーバX2及びX3、インタ
ーネット・サーバY1及びY2の各システム管理者の情
報を管理するためのデータベースであり、監視サーバコ
ンピュータX1のハードディスク3に作成されている。
図11は、リモートサーバ管理者データベース207に
登録される管理者レコードのデータ構造図である。リモ
ートサーバ管理者データベース207には全ての監視対
象のインターネット・サーバ及びLANサーバの管理者
がこのように管理者レコードとして登録されている。図
11に示すように、各管理者レコードは自己サーバ管理
データベースと同様に、管理名(ID)、パスワード、
管理者氏名、通知先携帯電話メールアドレス(複数フィ
ールド)、携帯電話番号、通知先電子メールアドレス
(複数フィールド)、一般電話番号、対象サーバ1〜5
(対象サーバ6以上も指定可)のURL(WWWサーバ
名,FTPサーバ名,メールサーバ名,データベースサ
ーバ名、その他のサーバ名等)と各対象サーバに対する
監視の有無、監視結果の定期報告の各フィールドを有
し、更に管理対象サーバドメイン、管理対象サーバIP
アドレスのフィールドを有している。このリモートサー
バ管理者データベース207も、管理名(ID)がキー
となっている。監視の有無フィールドは、各対象サーバ
を監視対象とするか否かを指定するものであり、このフ
ィールドに「監視する」と指定されていればリモート監
視サーバによる障害監視の対象とされ、「監視しない」
が指定されていればリモート監視サーバによる障害監視
の対象とされない。また、監視結果の定期報告フィール
ドは、自己サーバ管理者データベース206と同様に、
サーバに対する監視の結果の報告メールを定期的に受信
するか否か指定するフィールドであり、このフィールド
に「受ける」が設定されている場合には監視結果の報告
メールを定期的に受信し、「受けない」が設定されてい
る場合には障害が発見された場合にのみ障害通知メール
を受信するように処理される。尚、自己サーバ管理者デ
ータベース206とリモートサーバ管理者データベース
207は本発明の管理者データベースを構成する。
The remote server administrator database 207
Is a database for managing information of system administrators of the LAN servers X2 and X3 to be monitored and the Internet servers Y1 and Y2, and is created on the hard disk 3 of the monitoring server computer X1.
FIG. 11 is a data structure diagram of an administrator record registered in the remote server administrator database 207. In the remote server manager database 207, managers of all monitored Internet servers and LAN servers are registered as manager records in this manner. As shown in FIG. 11, each administrator record has a management name (ID), a password,
Administrator name, notification destination mobile phone email address (multiple fields), mobile phone number, notification destination email address (multiple fields), general phone number, target servers 1-5
URLs (WWW server name, FTP server name, mail server name, database server name, other server names, etc.) of (target server 6 or more can also be specified), whether or not there is monitoring for each target server, and periodic reports of monitoring results Field, and also the managed server domain and the managed server IP
It has an address field. This remote server administrator database 207 also has a management name (ID) as a key. The monitoring presence / absence field specifies whether or not each target server is to be monitored. If "monitor" is specified in this field, it is regarded as a failure monitoring target by the remote monitoring server, and the "monitoring" field is displayed. do not do"
If is specified, it will not be monitored by the remote monitoring server. In addition, the regular report field of the monitoring result is similar to the self server administrator database 206,
This field is used to specify whether or not to receive the report mail of the monitoring result to the server periodically. If "receive" is set in this field, the report mail of the monitoring result is received periodically. If "not received" is set, processing is performed so that a failure notification mail is received only when a failure is found. The own server administrator database 206 and the remote server administrator database 207 constitute an administrator database of the present invention.

【0064】データベース登録・修正部204は、本発
明のデータベース登録手段を構成するものである。デー
タベース登録・修正部204は、自己サーバ管理者デー
タベース206及びリモートサーバ管理者データベース
207に対する管理者情報(管理者レコード)の登録及
び修正処理を行うと共に、登録又は修正のために管理者
端末10(携帯電話10a又はPC10b等)から入力
送信されたサーバのURL、通知先電子メールアドレ
ス、通知先携帯電話メールアドレスが正しいか否かをチ
ェックするものである。
The database registration / correction unit 204 constitutes a database registration unit of the present invention. The database registration / correction unit 204 performs registration and correction processing of administrator information (administrator record) in the self server administrator database 206 and the remote server administrator database 207, and also executes the administrator terminal 10 ( The server checks whether the URL of the server, the notification destination e-mail address, and the notification destination mobile phone mail address input and transmitted from the mobile phone 10a or the PC 10b) are correct.

【0065】認証部212は、管理者端末10a,10
b,10cから監視サーバコンピュータX1に対して、
管理者情報の自己サーバ管理者データベース206又は
リモートサーバ管理者データベース207への登録及び
修正のためのアクセスがあったときに、管理者の認証を
行うものである。
The authentication unit 212 includes the administrator terminals 10a, 10
b, 10c to the monitoring server computer X1
When there is an access for registration and correction of the administrator information in the self server administrator database 206 or the remote server administrator database 207, the administrator is authenticated.

【0066】尚、説明ではサーバコンピュータX1を中
心に述べ、便宜上X1を監視サーバコンピュータ、Y1
及びY2をインターネット・サーバとしているが、イン
ターネット・サーバY1及びY2も監視サーバコンピュ
ータとしての機能を有し、監視サーバコンピュータX1
と同様の機能的構成を有している。このため、本実施携
帯のサーバ障害監視システムでは、サーバコンピュータ
X1,Y1,Y2の間で相互に障害監視を行えるように
なっている。また、本実施形態では、自己サーバ管理者
データベース206とリモートサーバ管理者データベー
ス207を監視サーバコンピュータX1のハードディス
クに設けているが、これに限られず、補助サーバコンピ
ュータのハードディスクに設けてもよい。この場合、更
に自己サーバ管理者データベース206とリモートサー
バ管理者データベース207を補助サーバ管理者データ
ベースと統合するように構成してもよい。
In the description, the server computer X1 is mainly described, and for convenience, X1 is a monitoring server computer and Y1
And Y2 are Internet servers, but the Internet servers Y1 and Y2 also have a function as a monitoring server computer, and the monitoring server computer X1
It has the same functional configuration as. For this reason, in the server fault monitoring system of this embodiment, the fault monitoring can be mutually performed between the server computers X1, Y1, and Y2. Further, in the present embodiment, the self server administrator database 206 and the remote server administrator database 207 are provided on the hard disk of the monitoring server computer X1, but are not limited thereto, and may be provided on the hard disk of the auxiliary server computer. In this case, the self server administrator database 206 and the remote server administrator database 207 may be further integrated with the auxiliary server administrator database.

【0067】(補助サーバコンピュータの機能的構成)
図2(b)は、補助サーバコンピュータの機能的構成
(ソフトウェア構成)を示す機能ブロック図である。図
2(b)に示すように、補助サーバコンピュータ5は、
着信部208と、制御部210と、認証部209と、サ
ーバチェック部213と、補助サーバ管理者データベー
ス211とから主に構成される。これら各部は復旧プロ
グラム、サーバチェックプログラムをそれぞれ実行する
ことによりメモリ上に生成される。尚、ネットワークN
2及びN3内の補助サーバコンピュータも同様の機能的
構成を有している。
(Functional Configuration of Auxiliary Server Computer)
FIG. 2B is a functional block diagram showing a functional configuration (software configuration) of the auxiliary server computer. As shown in FIG. 2B, the auxiliary server computer 5
It mainly includes a receiving unit 208, a control unit 210, an authentication unit 209, a server check unit 213, and an auxiliary server administrator database 211. These units are generated on the memory by executing the recovery program and the server check program, respectively. In addition, network N
The auxiliary server computers in N2 and N3 have the same functional configuration.

【0068】着信部208は、補助サーバコンピュータ
5のシステム管理者の携帯電話10aから着信を受け、
復旧指令を受信するものである。認証部209は、管理
者のパスワードにより管理者の認証を行うものである。
The receiving section 208 receives an incoming call from the mobile phone 10a of the system administrator of the auxiliary server computer 5,
It receives a restoration command. The authentication unit 209 authenticates the administrator using the password of the administrator.

【0069】制御部210は、管理者の携帯電話10a
からの指令を受け、障害が発生しているサーバコンピュ
ータに対しパワーコントローラ4を介して電源の再投入
を行うものである。
The control unit 210 controls the mobile phone 10a of the administrator.
The power supply is turned on again via the power controller 4 to the server computer in which the failure has occurred in response to a command from the server computer.

【0070】サーバチェック部213は、管理者からサ
ーバ動作確認の指令があったときに指定されたサーバに
対しアクセスしてサーバの動作確認を行うものである。
The server check unit 213 accesses the specified server when the administrator issues a server operation confirmation command and confirms the operation of the server.

【0071】補助サーバ管理者データベース211は、
補助サーバコンピュータ5のシステム管理者の情報を管
理するためのデータベースであり、補助サーバコンピュ
ータ5のハードディスク6に格納されている。図12
は、補助サーバ管理者データベース211に登録される
管理者レコードのデータ構造図である。補助サーバ管理
者データベース211には補助サーバコンピュータ5の
全ての管理者がこのように管理者レコードとして登録さ
れている。図12に示すように各管理者レコードは、管
理名(ID)、パスワード、管理者氏名、電子メールア
ドレス、接続先携帯電話番号(複数フィールド)、接続
先一般電話番号(複数フィールド)の各フィールドを有
している。この補助サーバ管理者データベース211
は、管理名(ID)がキーとなっている。
The auxiliary server administrator database 211
This is a database for managing information of the system administrator of the auxiliary server computer 5, and is stored on the hard disk 6 of the auxiliary server computer 5. FIG.
9 is a data structure diagram of an administrator record registered in the auxiliary server administrator database 211. FIG. All the administrators of the auxiliary server computer 5 are thus registered as administrator records in the auxiliary server administrator database 211. As shown in FIG. 12, each administrator record includes a management name (ID), a password, an administrator name, an e-mail address, a connection destination mobile phone number (multiple fields), and a connection destination general telephone number (multiple fields). have. This auxiliary server administrator database 211
Has a management name (ID) as a key.

【0072】(監視サーバにおける自己監視処理)次に
監視サーバコンピュータX1における自己監視サーバ1
の処理について説明する。自己監視サーバ1は、監視サ
ーバコンピュータX1のハードディスク3に実行可能な
形式で格納された自己監視プログラムを実行することに
より、上述した自己監視部202、通知部203、起動
部201及びデータベース登録・修正部204を有する
サーバプロセスとしてメモリ上に生成される。図3は、
自己監視サーバ1による自己監視処理のフローチャート
である。自己監視サーバ1は、起動時又は事前のオプシ
ョン設定によって、監視サーバコンピュータ内のWWWサ
ーバ、メールサーバ、FTPサーバ、データベースサー
バの各サーバプロセスを常時監視するか、定期的に監視
するかを設定できるようになっている。
(Self-monitoring process in monitoring server) Next, the self-monitoring server 1 in the monitoring server computer X1
Will be described. The self-monitoring server 1 executes the self-monitoring program stored in the executable form on the hard disk 3 of the monitoring server computer X1 to execute the self-monitoring unit 202, the notification unit 203, the activation unit 201, and the database registration / correction described above. It is generated on a memory as a server process having a unit 204. FIG.
5 is a flowchart of a self-monitoring process performed by the self-monitoring server 1. The self-monitoring server 1 can set whether to constantly monitor the server processes of the WWW server, mail server, FTP server, and database server in the monitoring server computer at the time of start-up or by setting options in advance, or to periodically monitor the server processes. It has become.

【0073】まず自己監視サーバ1は、自己サーバ管理
者データベース206を参照し、管理者レコードのサー
バURLフィールド(対象サーバフィールド、監視の有
無フィールド)を読み込む(ステップ301)。そし
て、監視サーバコンピュータ内で動作している対象サー
バ(WWWサーバ、メールサーバ、FTPサーバ、データ
ベースサーバ、その他のサーバ)の中で、監視の有無フ
ィールドが「監視する」となっている対象サーバのプロ
セスに対して、チェック信号(送信信号)を送信する
(ステップ302)。チェック信号の送信とは、自己の
監視サーバコンピュータX1で動作する上記の各サーバ
に対して所定のプロセスが動作しているか否かをチェッ
クする一方で、実際にサーバURLとして登録されてい
る各サーバのURLのアドレスへアクセスすることであ
る。
First, the self-monitoring server 1 refers to the self-server administrator database 206 and reads the server URL field (target server field, monitoring presence / absence field) of the administrator record (step 301). Then, of the target servers (WWW server, mail server, FTP server, database server, and other servers) operating in the monitoring server computer, the target server whose monitoring presence / absence field is "monitored" A check signal (transmission signal) is transmitted to the process (step 302). The transmission of the check signal refers to checking whether or not a predetermined process is operating for each of the servers operating on its own monitoring server computer X1, and for each server actually registered as a server URL. Is to access the address of the URL.

【0074】例えば、WWWサーバに対しては、htt
pのプロセスの有無をチェックすると共に、サーバUR
Lとして登録されている「http://xxx.xx
x.co.jp」にアクセスする。また、FTPサーバ
に対しては、ftpプロセスの有無をチェックすると共
にサーバURLとして登録されている「ftp://x
xx.xxx.co.jp」にアクセスする。メールサ
ーバに対しては、sendmail、受信サーバとして
POP3又はIMAP、送信サーバとしてSMTPの各
プロセスの有無をチェックし、かつ「mail.xx
x.xxx.co.jp」にアクセスする。一方、デー
タベースサーバは、その本質上、WWWサーバの下で作
動する特定のプログラムと連携して作動しているため、
所定のプロセスの有無をチェックする方法は採らず、例
えばデータベースサーバとしてSQLサーバを起動して
いる場合には、自己監視サーバをそのSQLサーバと連
携し、連携が正常に作動しているか否かをチェックす
る。ここで、SQLサーバと連携するとは、例えば、予
め任意のデータベースプログラムを用意しておき、自己
監視サーバによりこのデータベースプログラムを起動
し、正常に起動した場合にはデータベースサーバが正常
に動作している(障害が発生していない)と判断し、デ
ータベースプログラムが起動しない場合にはデータベー
スサーバに障害が発生していると判断することが考えら
れるが、この方法に限定されるものではない。
For example, for the WWW server, http
p to check for the existence of the process
"Http: //xxx.xx" registered as L
x. co. jp ". In addition, for the FTP server, the presence / absence of the ftp process is checked, and “ftp: // x registered as the server URL” is registered.
xx. xxx. co. jp ". The mail server is checked for sendmail, POP3 or IMAP as a receiving server, and SMTP as a sending server.
x. xxx. co. jp ". On the other hand, the database server operates in cooperation with a specific program operating under the WWW server by its nature,
No method is used to check for the presence or absence of a predetermined process. For example, if an SQL server is running as a database server, the self-monitoring server cooperates with the SQL server to determine whether or not the cooperation is operating normally. To check. Here, cooperating with the SQL server means that, for example, an arbitrary database program is prepared in advance, this database program is started by the self-monitoring server, and when started normally, the database server is operating normally. (No failure has occurred), and if the database program does not start, it may be determined that a failure has occurred in the database server. However, the method is not limited to this method.

【0075】ここで、常時監視を行う場合には、上記各
サーバのチェック過程が一通り終了し各サーバから応答
が返ってきた時点で、上述した方法でサーバ監視を繰り
返して行う。この場合のサーバ監視の間隔は、きわめて
短時間(例えば、1秒、5秒、10秒、30秒、1分以
内)とし、監視サーバコンピュータのハードウェア性能
によって任意に設定することが可能である。一方、定期
的監視を行う場合には、比較的長時間(例えば、10
分、30分、1時間等)毎にチェック信号を送信する。
Here, in the case of performing the constant monitoring, the server monitoring is repeatedly performed by the above-described method when the check process of each server has been completed and a response is returned from each server. In this case, the server monitoring interval is very short (for example, within 1 second, 5 seconds, 10 seconds, 30 seconds, and 1 minute), and can be arbitrarily set according to the hardware performance of the monitoring server computer. . On the other hand, when periodic monitoring is performed, a relatively long time (for example, 10
Every 30 minutes, 1 hour, etc.).

【0076】そして、各サーバプロセスの動作を確認
し、サーバURLへ正常にアクセスできた場合には、応
答があったサーバプロセスは正常に動作しており障害が
発生していないと判断する(ステップ303、32
3)。一方、サーバプロセスの動作を確認できない場合
には、このサーバプロセスには障害が発生していると判
断する(ステップ303、304)。尚、一定時間内に
応答がない場合には、再度(又は数回)チェック信号を
送信し(サーバプロセスの動作確認とサーバURLへの
アクセスを行い)、それでも応答がない場合にサーバプ
ロセスに障害が発生していると判断するように構成して
も良い。
Then, the operation of each server process is confirmed, and if the server URL can be normally accessed, it is determined that the server process that has responded is operating normally and no failure has occurred (step 303, 32
3). On the other hand, if the operation of the server process cannot be confirmed, it is determined that a failure has occurred in this server process (steps 303 and 304). If there is no response within a certain period of time, a check signal is sent again (or several times) (operation check of the server process and access to the server URL are performed). If there is still no response, the server process fails. May be determined to have occurred.

【0077】サーバプロセスに障害が発生していないと
判断した場合において(ステップ312)、登録されて
いる管理者レコードの監視結果の定期報告のフィールド
に「受ける」が設定されている場合には、通知部203
によってサーバ名、URL等のサーバ情報とサーバが正
常動作している旨の内容を含めた定期報告の電子メール
を作成し、管理者の通知先電子メールアドレス又は通知
先携帯電話メールアドレスを指定して作成した定期報告
メールを送信する(ステップ313、314)。そし
て、一定時間経過後に再度上記チェック信号を送信して
(ステップ302)、ステップ303からの上記処理を
繰り返す。
When it is determined that no failure has occurred in the server process (step 312), if “receive” is set in the field of the periodic report of the monitoring result of the registered administrator record, Notification section 203
Creates an e-mail of a periodic report including server information such as server name, URL, etc. and the contents that the server is operating normally, and specifies the e-mail address of the notification destination of the administrator or the e-mail address of the notification destination mobile phone Then, the periodic report mail created is transmitted (steps 313 and 314). Then, the check signal is transmitted again after a lapse of a predetermined time (step 302), and the above processing from step 303 is repeated.

【0078】一方、サーバに障害が発生していると判断
した場合には(ステップ304)、起動部201によっ
て障害が発生しているサーバプロセスに対して再起動コ
マンドを発行し(ステップ305)、サーバプロセスを
再起動させる。そして、復旧確認コマンドを発行し(ス
テップ306)、再起動したサーバプロセスが正常に動
作しているか否かを確認する(ステップ307)。
On the other hand, if it is determined that a failure has occurred in the server (step 304), the restart unit 201 issues a restart command to the failed server process (step 305). Restart the server process. Then, a recovery confirmation command is issued (step 306), and it is confirmed whether the restarted server process is operating normally (step 307).

【0079】再起動したサーバプロセスが正常動作して
いる場合には、再度サーバプロセスにチェック信号を送
信してアクセスし(ステップ310)、サーバプロセス
が不安定か否かをチェックする(ステップ311)。サ
ーバプロセスが不安定であると判断した場合には、再度
サーバプロセスに対し再起動コマンドを発行する(ステ
ップ305)。再起動したサーバプロセスが安定である
と判断した場合には、上述のステップ313,314で
必要な場合に定期報告メールを作成して管理者に送信す
る。
If the restarted server process is operating normally, a check signal is sent to the server process again to access (step 310), and it is checked whether the server process is unstable (step 311). . If it is determined that the server process is unstable, a restart command is issued to the server process again (step 305). If it is determined that the restarted server process is stable, a periodic report e-mail is created and transmitted to the administrator in steps 313 and 314 when necessary.

【0080】再起動したサーバプロセスが正常に動作し
ない場合(障害が除去されない場合)には、通知部20
3により障害情報を含めた障害通知の電子メールを作成
する(ステップ307,308)。ここで、通知するサ
ーバの障害情報は以下のものとする。
If the restarted server process does not operate normally (if the failure is not eliminated), the notification unit 20
Then, an e-mail for a failure notification including the failure information is created (steps 307 and 308). Here, the failure information of the server to be notified is as follows.

【0081】障害発生サーバ名(IPアドレスまたはド
メイン) 障害発生のインターネット・サーバ種類(WWWサーバ、
メールサーバ、FTPサーバ、データベース) 障害発生時刻 予測されるサーバ障害種類(アクセス過剰、メモリ不
足、ハードディスク(HDD)容量不足、停電、ハッキン
グ、ハッカーの侵入、不正アクセス、ウィルス感染、ウ
ィルスファイル保存、サービス妨害(DoS)等)。
Failure server name (IP address or domain) Failure server type (WWW server,
Mail server, FTP server, database) Failure time Predicted server failure types (excessive access, insufficient memory, insufficient hard disk (HDD) capacity, power outage, hacking, hacker intrusion, unauthorized access, virus infection, virus file storage, service Interference (DoS) etc.).

【0082】尚、障害通知メールにはエラー情報を入手
できる場合にはエラー情報や障害経過情報(ログ)等を
含めても良い。
When error information can be obtained, the error notification mail may include error information, error progress information (log), and the like.

【0083】そして、管理者の通知先電子メールアドレ
ス又は通知先携帯電話メールアドレスを指定して作成し
た障害通知メールを送信する(ステップ309)。
Then, the failure notification mail created by designating the notification destination electronic mail address or the notification destination mobile phone mail address of the administrator is transmitted (step 309).

【0084】以上のような処理を各サーバプロセスにつ
いて、一定時間毎(常時監視の場合には短時間毎)に繰
り返す。
The above processing is repeated for each server process at regular intervals (or short intervals in the case of constant monitoring).

【0085】(監視サーバにおけるリモート監視処理)
次に監視サーバコンピュータX1におけるリモート監視
サーバ2の処理について説明する。リモート監視サーバ
2は、監視サーバコンピュータX1のハードディスク3
に実行可能な形式で格納されたリモート監視プログラム
を実行することにより、上述したリモート監視部20
5、通知部203及びデータベース登録・修正部204
を有するサーバプロセスとしてメモリ上に生成される。
(Remote monitoring processing in the monitoring server)
Next, processing of the remote monitoring server 2 in the monitoring server computer X1 will be described. The remote monitoring server 2 is connected to the hard disk 3 of the monitoring server computer X1.
By executing the remote monitoring program stored in an executable format, the remote monitoring unit 20 described above is executed.
5. Notification unit 203 and database registration / correction unit 204
Is generated on the memory as a server process having

【0086】図4は、リモート監視サーバ2によるリモ
ート監視処理のフローチャートである。リモート監視サ
ーバ2も、起動時又は事前のオプション設定によって、
インターネット・サーバY1,Y2及びLANサーバX
2,X3内のWWWサーバ、メールサーバ、FTPサー
バ、データベースサーバの各サーバプロセスを常時監視
するか、定期的に監視するかを設定できるようになって
いる。
FIG. 4 is a flowchart of the remote monitoring process by the remote monitoring server 2. The remote monitoring server 2 is also activated at start-up or by setting options in advance.
Internet servers Y1, Y2 and LAN server X
2. It is possible to set whether the server processes of the WWW server, the mail server, the FTP server, and the database server in X3 are constantly monitored or periodically monitored.

【0087】まずリモート監視サーバ2は、リモートサ
ーバ管理者データベース207を参照し、全ての管理者
レコードのサーバURLフィールド(対象サーバフィー
ルド、監視の有無フィールド)、IPアドレスフィール
ド及びサーバドメインフィールドを読み込む(ステップ
401)。そして、各サーバコンピュータ内で動作して
いる対象サーバ(WWWサーバ、メールサーバ、FTPサ
ーバ、データベースサーバ、その他のサーバ)の中で、
監視の有無フィールドが「監視する」となっている対象
サーバのプロセスに対して、チェック信号(送信信号)
を送信する(ステップ402)。ここで、チェック信号
の送信とは、管理者が予め登録したリモートサーバ管理
者データベース207に基づいて、監視対象のサーバの
URL又はIPアドレス等のアクセスポートに対してア
クセスすることである。
First, the remote monitoring server 2 refers to the remote server administrator database 207 and reads the server URL field (target server field, monitoring presence / absence field), IP address field, and server domain field of all administrator records (see FIG. 1). Step 401). Then, among the target servers (WWW server, mail server, FTP server, database server, other servers) running in each server computer,
Check signal (transmission signal) for the process of the target server whose monitoring status field is set to "monitor"
Is transmitted (step 402). Here, the transmission of the check signal refers to an access to an access port such as a URL or an IP address of the server to be monitored based on the remote server administrator database 207 registered in advance by the administrator.

【0088】例えば、WWWサーバに対しては、サーバ
URLとして登録されている「http://xxx.
xxx.co.jp」にアクセスする。また、FTPサ
ーバに対しては、サーバURLとして登録されている
「ftp://xxx.xxx.co.jp」にアクセ
スする。メールサーバに対しては、サーバURLとして
登録されている「mail.xxx.xxx.co.j
p」にアクセスする。データベースサーバに対しては、
サーバドメインフィールドとして登録されている「デー
タベースサーバ」のポートにアクセスする。
For example, for the WWW server, “http: // xxx.
xxx. co. jp ". For the FTP server, access is made to “ftp://xxx.xxx.co.jp” registered as the server URL. For the mail server, "mail.xxx.xxx.co.j" registered as the server URL
p ". For the database server,
Access the "database server" port registered as the server domain field.

【0089】ここで、常時監視を行う場合には、上記各
サーバのチェック過程が一通り終了し各サーバから応答
が返ってきた時点で、上述した方法でサーバ監視を繰り
返して行う。この場合のサーバ監視の間隔は、きわめて
短時間(例えば、1秒、5秒、10秒、30秒、1分以
内)とし、監視サーバコンピュータのハードウェア性能
によって任意に設定することが可能である。一方、定期
的監視を行う場合には、比較的長時間(例えば、10
分、30分、1時間等)毎にチェック信号を送信する。
Here, in the case of performing the constant monitoring, the server monitoring is repeatedly performed by the above-described method at the time when the checking process of each server is completed and a response is returned from each server. In this case, the server monitoring interval is very short (for example, within 1 second, 5 seconds, 10 seconds, 30 seconds, and 1 minute), and can be arbitrarily set according to the hardware performance of the monitoring server computer. . On the other hand, when periodic monitoring is performed, a relatively long time (for example, 10
Every 30 minutes, 1 hour, etc.).

【0090】そして、このチェック信号の送信に対して
各サーバプロセスから一定時間内(例えば、30秒〜6
0秒以内)に応答があった場合には、応答があったサー
バは正常に動作していると判断する(ステップ403、
407)。一方、一定時間を経過しても応答がない場合
には、このサーバプロセスには障害が発生していると判
断する(ステップ403、404)。尚、一定時間内に
応答がない場合には、再度(又は数回)チェック信号を
送信し、それでも応答がない場合にサーバプロセスに障
害が発生していると判断するように構成しても良い。
Then, each server process responds to the transmission of this check signal within a fixed time (for example, 30 seconds to 6 seconds).
If there is a response within 0 seconds, it is determined that the server that has responded is operating normally (step 403,
407). On the other hand, if there is no response after a certain period of time, it is determined that a failure has occurred in this server process (steps 403 and 404). If there is no response within a certain period of time, a check signal may be transmitted again (or several times), and if there is still no response, it may be determined that a failure has occurred in the server process. .

【0091】サーバプロセスが正常に動作していると判
断した場合において(ステップ407)、登録されてい
る管理者レコードの監視結果の定期報告のフィールドに
「受ける」が設定されている場合には、通知部203に
よってサーバ名、URL、IPアドレス及びサーバドメ
イン等のサーバ情報とサーバが正常動作している旨の内
容を含めた定期報告の電子メールを作成し、管理者の通
知先電子メールアドレス又は通知先携帯電話メールアド
レスを指定して送信する(ステップ408、409)。
そして、一定時間経過後に再度上記チェック信号を送信
して(ステップ402)、ステップ403からの上記処
理を繰り返す。
When it is determined that the server process is operating normally (step 407), if “receive” is set in the field of the periodic report of the monitoring result of the registered administrator record, The notifying unit 203 creates an e-mail of a periodic report including server information such as a server name, a URL, an IP address, and a server domain, and contents indicating that the server is operating normally. The notification destination mobile phone mail address is specified and transmitted (steps 408 and 409).
Then, the check signal is transmitted again after a lapse of a predetermined time (step 402), and the above processes from step 403 are repeated.

【0092】一方、サーバに障害が発生していると判断
した場合には(ステップ404)、通知部203により
障害情報を含めた障害通知の電子メールを作成する(ス
テップ405)。ここで、通知するサーバの障害情報は
自己サーバ監視と同様に以下のものとする。
On the other hand, when it is determined that a failure has occurred in the server (step 404), the notifying section 203 creates a failure notification e-mail including the failure information (step 405). Here, the failure information of the server to be notified is as follows as in the self server monitoring.

【0093】障害発生サーバ名(IPアドレスまたはド
メイン) 障害発生のインターネット・サーバ種類(WWWサーバ、
メールサーバ、FTPサーバ、データベース) 障害発生時刻 予測されるサーバ障害種類(アクセス過剰、メモリ不
足、ハードディスク(HDD)容量不足、停電、ハッキン
グ、ハッカーの侵入、不正アクセス、ウィルス感染、ウ
ィルスファイル保存、サービス妨害(DoS)等)。
Failure server name (IP address or domain) Failure Internet server type (WWW server,
Mail server, FTP server, database) Failure time Predicted server failure types (excessive access, insufficient memory, insufficient hard disk (HDD) capacity, power outage, hacking, hacker intrusion, unauthorized access, virus infection, virus file storage, service Interference (DoS) etc.).

【0094】尚、障害通知メールにはエラー情報を入手
できる場合にはエラー情報や障害経過情報(ログ)等を
含めても良い。
When error information can be obtained, the failure notification mail may include error information, failure progress information (log), and the like.

【0095】そして、管理者の通知先電子メールアドレ
スをして作成した障害通知メールを送信する(ステップ
406)。
Then, the failure notification mail created using the notification destination e-mail address of the administrator is transmitted (step 406).

【0096】以上のような処理を各サーバプロセスにつ
いて、一定時間毎(常時監視の場合には短時間毎)に繰
り返す。
The above processing is repeated for each server process at regular intervals (or short intervals in the case of constant monitoring).

【0097】このように本実施形態のサーバ障害監視シ
ステムによれば、インターネット回線に常時接続されて
いるインターネット・サーバの障害監視を自動的に迅速
に行え、管理者が自己の管理するサーバコンピュータか
ら遠隔地にいる場合でも、管理者はサーバコンピュータ
の正確な障害情報を即時に入手することができる。
As described above, according to the server fault monitoring system of the present embodiment, the fault monitoring of the Internet server constantly connected to the Internet line can be automatically and promptly performed, and the administrator can monitor the fault from the server computer managed by himself / herself. Even in a remote location, the administrator can immediately obtain accurate fault information of the server computer.

【0098】更に、一つのサーバコンピュータで動作す
るWWWサーバ、メールサーバ、FTPサーバ、データ
ベースサーバの各サーバプロセスの夫々について障害監
視を行っているので、複数のサーバプロセスのうちいず
れかが正常稼働していても正確な障害発生を探知でき
る。
Further, since each server process of the WWW server, mail server, FTP server, and database server operating on one server computer is monitored for failure, any one of the plurality of server processes operates normally. Even if it is, it can detect the exact occurrence of the fault.

【0099】(補助サーバにおける復旧処理)次に、障
害通知メールを受け取った管理者のアクセスにより、補
助サーバコンピュータ5で実行されるサーバ復旧処理に
ついて説明する。図5は、管理者の補助サーバコンピュ
ータ5とのやりとりの手順及び補助サーバコンピュータ
5におけるサーバ復旧処理のフローチャートである。
(Recovery Process in Auxiliary Server) Next, a description will be given of a server recovery process executed by the auxiliary server computer 5 by access of the administrator who has received the failure notification mail. FIG. 5 is a flowchart of an administrator's exchange procedure with the auxiliary server computer 5 and a flowchart of server recovery processing in the auxiliary server computer 5.

【0100】管理者は、自己が管理するサーバコンピュ
ータの障害通知メールを自己の管理者端末10(携帯電
話10a,PC10b、PDA10c)の電子メール若
しくは携帯電話メールを受信した場合(ステップ50
1)、その障害内容を確認して、管理者端末10から補
助サーバコンピュータ5の電話番号を入力して補助サー
バコンピュータ5に接続する(ステップ502)。
When the administrator receives the failure notification mail of the server computer managed by himself / herself from the e-mail of the manager terminal 10 (mobile phone 10a, PC 10b, PDA 10c) or the mobile phone mail (step 50).
1) After confirming the contents of the failure, the telephone number of the auxiliary server computer 5 is input from the administrator terminal 10 and connected to the auxiliary server computer 5 (step 502).

【0101】補助サーバコンピュータ5では、管理者の
管理者端末10からのアクセスを着信部208で着信し
(ステップ503)、認証部209により管理名(I
D)とパスワードの入力要求画面を管理者端末10に送
信する(ステップ504)。そして、管理者側では管理
者端末10から管理名(ID)とパスワードを入力する
(ステップ505)。補助サーバコンピュータ5では、
補助サーバ管理者データベース211を参照して、入力
送信された管理名(ID)を検索し、入力されたパスワ
ードによる本人認証処理を行う(ステップ506)。
In the auxiliary server computer 5, an access from the administrator terminal 10 of the administrator is received by the receiving unit 208 (step 503), and the management name (I
D) and transmits a password input request screen to the administrator terminal 10 (step 504). Then, the manager inputs a management name (ID) and a password from the manager terminal 10 (step 505). In the auxiliary server computer 5,
With reference to the auxiliary server manager database 211, the input and transmitted management name (ID) is searched, and the personal authentication process is performed using the input password (step 506).

【0102】管理名(ID)又はパスワードが補助サー
バ管理者データベース211に登録されているものと一
致しない場合には、「ID又はパスワードが異なりま
す」というエラーメッセージを管理者の管理者端末10
に送信し(ステップ508)、再度入力要求画面を表示
する(ステップ505)。
If the management name (ID) or the password does not match the one registered in the auxiliary server manager database 211, an error message “ID or password is different” is displayed on the manager terminal 10 of the manager.
(Step 508), and the input request screen is displayed again (step 505).

【0103】一方、管理名(ID)及びパスワードが補
助サーバ管理者データベース211に登録されているも
のと一致した場合には、管理者端末からのアクセスを許
可し、管理者端末10は補助サーバコンピュータへのロ
グイン状態となる。
On the other hand, if the management name (ID) and the password match those registered in the auxiliary server administrator database 211, access from the administrator terminal is permitted, and the administrator terminal 10 You will be logged in to.

【0104】次いで、管理者は補助サーバコンピュータ
に対して自己の管理するサーバのURLを指定して動作
確認の指令を送信する(ステップ509)。動作確認指
令を受信した補助サーバコンピュータ5では、サーバチ
ェックプログラムを起動し、サーバチェック部213に
より管理者が指定したサーバに対してアクセスする(ス
テップ510)。サーバに障害が発生していれば、アク
セスに対する応答はないので、一定時間してもアクセス
したサーバから応答がなければ無応答であるメッセージ
を、応答があれば応答ありの旨のメッセージを管理者端
末10へ送信する(ステップ511)。
Next, the administrator designates the URL of the server managed by himself / herself and sends an operation confirmation command to the auxiliary server computer (step 509). The auxiliary server computer 5 that has received the operation check command activates the server check program, and accesses the server specified by the administrator by the server check unit 213 (step 510). If there is a failure in the server, there is no response to the access. Therefore, if there is no response from the accessed server for a certain period of time, a message that there is no response if there is a response, and a message that there is a response if there is a response. The data is transmitted to the terminal 10 (step 511).

【0105】かかるメッセージを受信した管理者は自己
が管理するサーバが完全に停止しているか否かを自己判
断する(ステップ512)。
The administrator receiving such a message makes a self-determination as to whether or not the server managed by the administrator is completely stopped (step 512).

【0106】尚、本実施形態では、管理者が補助サーバ
コンピュータにサーバ動作確認指令を送信することによ
り補助サーバコンピュータでサーバにアクセスしている
が、サーバ動作確認の方法はこれに限定されるものでは
ない。例えば、管理者が自己が管理するサーバに管理者
端末10から直接アクセスして応答の有無によりサーバ
の動作状況を自分で確認してもよい。また、管理者端末
10に管理対象のサーバに所定のコマンドを送出するプ
ログラムを予め設けておき、当該プログラムからコマン
ドを管理対象のサーバに送出することによりサーバの動
作確認を行うように構成しても良い。
In the present embodiment, the server is accessed by the auxiliary server computer by transmitting the server operation confirmation command to the auxiliary server computer. However, the method of confirming the server operation is not limited to this. is not. For example, the administrator may directly access the server managed by the administrator from the administrator terminal 10 and check the operation status of the server by himself / herself depending on whether or not there is a response. Also, a program for sending a predetermined command to the server to be managed is provided in the administrator terminal 10 in advance, and the operation of the server is checked by sending a command from the program to the server to be managed. Is also good.

【0107】管理者の自己判断によりサーバが完全に停
止していると判断した場合には、必要に応じ障害が発生
しているサーバを復旧させるため、管理者端末10から
補助サーバコンピュータに対して再起動コマンドを送信
する(ステップ513)。
If it is determined by the administrator that the server is completely stopped, the administrator terminal 10 sends a request to the auxiliary server computer to recover the failed server if necessary. A restart command is transmitted (step 513).

【0108】再起動コマンドを受信した補助サーバコン
ピュータ5側では、制御部210により「電源の再投入
をしてよろしいですか?」の確認メッセージを管理者端
末10に送信し応答を待つ(ステップ514)。管理者
端末10から応答「Y」が入力送信されてきた場合に
は、補助サーバコンピュータ5の制御部210によりサ
ーバ・パワーコントローラ4を起動し、これによりサー
バ・コンピュータが再起動される(ステップ515、5
16)。そして、管理者は管理者端末10から再度動作
確認指令を補助サーバコンピュータ5に送信し、上述し
た方法と同様に、補助サーバコンピュータ5はサーバに
対してアクセスし、その結果を管理者端末10に送信す
る(ステップ519)。
On the side of the auxiliary server computer 5 which has received the restart command, the control unit 210 transmits a confirmation message of "Are you sure you want to turn on the power again?" To the administrator terminal 10 and waits for a response (step 514). ). When the response “Y” is input and transmitted from the administrator terminal 10, the server power controller 4 is started by the control unit 210 of the auxiliary server computer 5, and the server computer is restarted (step 515). , 5
16). Then, the administrator sends the operation confirmation command again from the administrator terminal 10 to the auxiliary server computer 5, and the auxiliary server computer 5 accesses the server in the same manner as described above, and sends the result to the administrator terminal 10. Transmit (step 519).

【0109】ステップ515で管理者の携帯電話10a
から応答「N」が送信された場合には、補助サーバコン
ピュータ5側では管理者端末10による管理者を強制的
にログアウトし、回線接続を終了する(ステップ51
5、517)。
At step 515, the administrator's mobile phone 10a
Sends a response "N" from the server, the auxiliary server computer 5 forcibly logs out the administrator using the administrator terminal 10 and terminates the line connection (step 51).
5, 517).

【0110】このように本実施形態のサーバ障害監視シ
ステムによれば、管理者が自己が管理するサーバコンピ
ュータから遠隔地にいたとしても、迅速に障害の復旧作
業を行え、サーバコンピュータの障害発生から復旧完了
までに要する時間は短縮され、サーバコンピュータをイ
ンターネット上で運用する場合の障害対処の迅速化が図
られる。
As described above, according to the server fault monitoring system of the present embodiment, even if the administrator is at a remote location from the server computer managed by himself / herself, the fault recovery work can be quickly performed, and the server computer can be restored from the fault occurrence. The time required for the restoration to be completed is shortened, and troubleshooting of the server computer when operating on the Internet is expedited.

【0111】(自己サーバ管理者データベースに対する
登録・修正処理)次に、管理者登録・修正サーバ14の
データベース登録・修正部204による自己サーバ管理
者データベース206に対する管理者情報(管理者レコ
ード)の登録、修正処理について説明する。図6は、自
己サーバ管理者データベース206に対する管理者情報
の登録・修正処理のフローチャートである。本実施形態
における登録・修正処理は、監視サーバコンピュータX
1の管理者が携帯電話10a又はPC10b等の管理者
端末10から監視サーバコンピュータX1へ携帯電話
網、公衆回線網又はISDN回線網若しくはインターネ
ット網により自己が管理する監視サーバコンピュータX
1に接続することにより実行される。
(Registration / Correction Processing for Self-Server Manager Database) Next, registration of manager information (manager record) in the self-server manager database 206 by the database registration / correction unit 204 of the manager registration / correction server 14. The correction process will be described. FIG. 6 is a flowchart of a process of registering and correcting administrator information in the own server administrator database 206. The registration / modification processing in the present embodiment is performed by the monitoring server computer X
A monitoring server computer X managed by a first administrator from a management terminal 10 such as a mobile phone 10a or a PC 10b to a monitoring server computer X1 through a mobile phone network, a public line network, an ISDN network or the Internet network.
This is performed by connecting to 1.

【0112】管理者端末10からの着信があると(ステ
ップ601)、管理者登録・修正サーバ14は、図7
(a)に示す「新規登録」と「登録情報修正」の選択画
面を管理者端末10に表示する(ステップ604)。
When there is an incoming call from the administrator terminal 10 (step 601), the administrator registration / correction server 14 returns to FIG.
A selection screen for “new registration” and “registration information correction” shown in (a) is displayed on the administrator terminal 10 (step 604).

【0113】自己サーバ管理者データベース206に管
理名及びパスワードを登録していない管理者は、登録受
付・修正画面で「新規登録」を選択する。この場合、管
理者登録・修正サーバ14は、図7(b)に示す新規登
録フォームの画面を管理者端末10に表示する(ステッ
プ603,604)。未登録の管理者は、この新規登録
フォームで必要項目を入力する。ここで、通知先電子メ
ールアドレス、通知先携帯電話メールアドレスにはそれ
ぞれ複数のアドレスを入力可能となっている。
An administrator who has not registered the management name and password in the self-server administrator database 206 selects "new registration" on the registration reception / modification screen. In this case, the manager registration / modification server 14 displays a screen of a new registration form shown in FIG. 7B on the manager terminal 10 (steps 603 and 604). An unregistered administrator enters necessary items on this new registration form. Here, a plurality of addresses can be input to the notification destination electronic mail address and the notification destination mobile phone mail address, respectively.

【0114】一方、自己サーバ管理者データベース20
6に管理名及びパスワードを既に登録している管理者
は、登録受付・修正画面で「登録情報修正」を選択する
(図9(a)参照)。この場合、管理者登録・修正サー
バ14は、図9(b)に示すように管理名(ID)とパ
スワードの各入力フィールドからなるログイン画面を表
示し、管理者に自己の管理名(ID)とパスワードの入
力を促す(ステップ603,605)。管理者登録・修
正サーバ14では、認証部212により入力された管理
名とパスワードによる認証処理を行い(ステップ60
6)、図9(c)に示すような各フィールドに現在の設
定内容が表示された登録修正フォームの画面を表示する
(ステップ607)。管理者はこの登録修正フォームで
必要項目を入力する。ここで、通知先電子メールアドレ
ス、通知先携帯電話メールアドレスにはそれぞれ複数の
アドレスを入力可能となっている。
On the other hand, the self server administrator database 20
The administrator who has already registered the management name and password in 6 selects “registration information correction” on the registration reception / correction screen (see FIG. 9A). In this case, the administrator registration / modification server 14 displays a login screen including input fields of a management name (ID) and a password, as shown in FIG. 9B, and provides the manager with his / her own management name (ID). And prompting for a password (steps 603 and 605). The administrator registration / correction server 14 performs an authentication process using the management name and the password input by the authentication unit 212 (step 60).
6), a screen of a registration correction form in which the current settings are displayed in each field as shown in FIG. 9C is displayed (step 607). The administrator enters necessary items on this registration correction form. Here, a plurality of addresses can be input to the notification destination electronic mail address and the notification destination mobile phone mail address, respectively.

【0115】これらのフォームにおいて、サーバUR
L、通知先電子メールアドレス、通知先携帯電話メール
アドレスが入力されると、管理者登録・修正サーバ14
のデータベース登録・修正部204では、これらの登録
内容が正しいか否かをチェックする。即ち、入力された
サーバURLを指定してアクセスし(ステップ60
8)、応答があった場合には正しいURLであると判断
する。一方、一定時間内に応答が無かった場合には誤っ
たURLが入力されたと判断し、新規登録フォーム又は
登録修正フォームで管理者の携帯電話10a又はPC1
0bに対し再入力を促す(ステップ609、606,6
07)。また、通知先電子メールアドレス又は通知先携
帯電話メールアドレスが入力された場合には、入力され
たメールアドレスを指定してメース送信信号を送信し
(ステップ610)、正常にメール送信が行えるかどう
かをチェックする(ステップ611)。メール送信が正
常に行われた場合には、入力されたメールアドレスが正
確であると判断するが、メール送信が正常に行われなか
った場合には、入力されたメールアドレスが誤っている
か、あるいは実在しないメールアドレスであると判断し
て、メールアドレスの再入力を促す(ステップ604,
607)。
In these forms, the server UR
L, the notification destination e-mail address, and the notification destination mobile phone mail address are entered, and the administrator registration / correction server 14 is entered.
The database registration / correction unit 204 checks whether these registration contents are correct. That is, access is performed by specifying the input server URL (step 60).
8) If there is a response, it is determined that the URL is correct. On the other hand, if there is no response within a certain period of time, it is determined that an incorrect URL has been entered, and the administrator's mobile phone 10a or PC1
0b is prompted for re-input (steps 609, 606, 6
07). If a notification destination e-mail address or a notification destination mobile phone e-mail address is input, a mail transmission signal is transmitted by designating the input e-mail address (step 610), and whether the mail transmission can be performed normally is determined. Is checked (step 611). If the e-mail was sent successfully, the entered e-mail address is determined to be accurate.If the e-mail was not sent successfully, the entered e-mail address is incorrect or It is determined that the mail address does not exist, and the user is prompted to re-enter the mail address (step 604,
607).

【0116】これにより、管理者が入力したサーバUR
L、通知先電子メールアドレス、通知先携帯電話メール
アドレスが正確か否かを自動的にチェックされ、誤った
情報の登録を未然に防止することができる。そして、こ
れら3つのフィールト゛の入力内容が正しい場合には、各
フォームで入力された内容で管理者レコードを登録又は
更新し、登録を完了する(ステップ612)。
As a result, the server UR entered by the administrator
It is automatically checked whether L, the notification destination e-mail address, and the notification destination mobile phone mail address are correct, thereby preventing erroneous information from being registered. If the input contents of these three fields are correct, the manager record is registered or updated with the contents input in each form, and the registration is completed (step 612).

【0117】(リモートサーバ管理者データベースに対
する登録・修正処理)次に、管理者登録・修正サーバ1
4のデータベース登録・修正部204によるリモートサ
ーバ管理者データベース207に対する管理者情報(管
理者レコード)の登録、修正処理について説明する。図
8は、リモートサーバ管理者データベース207に対す
る管理者情報の登録・修正処理のフローチャートであ
る。本処理も、インターネット・サーバ及びLANサー
バの管理者が携帯電話又はPC10b等の管理者端末1
0から監視サーバコンピュータX1へ公衆回線網又はI
SDN回線網若しくはインターネット網により自己が管
理するサーバコンピュータに接続したときに実行され
る。
(Registration / Correction Processing for Remote Server Administrator Database) Next, the administrator registration / correction server 1
The registration and correction processing of administrator information (administrator record) in the remote server administrator database 207 by the database registration / correction unit 204 of No. 4 will be described. FIG. 8 is a flowchart of a process for registering and correcting administrator information in the remote server administrator database 207. This processing is also performed by the administrator of the Internet server and the LAN server by the administrator terminal 1 such as a mobile phone or a PC 10b.
0 to the monitoring server computer X1 from the public network or I
It is executed when connected to a server computer managed by itself through an SDN line network or the Internet network.

【0118】管理者端末10からの着信があると(ステ
ップ801)、管理者登録・修正サーバ14は図13
(a)に示す「新規登録」と「登録修正情報」からいず
れかを選択させる登録受付・修正画面を管理者端末10
に表示する(ステップ802)。
When there is an incoming call from the administrator terminal 10 (step 801), the administrator registration / correction server 14 executes the process shown in FIG.
A registration reception / modification screen for selecting one of “new registration” and “registration correction information” shown in FIG.
(Step 802).

【0119】リモートサーバ管理者データベース207
に管理名及びパスワードを登録していない管理者は、登
録受付・修正画面で「新規登録」を選択する。この場
合、管理者登録・修正サーバ14は、図13(b)に示
す新規登録フォームの画面を管理者端末10に表示する
(ステップ803,804)。未登録の管理者は、この
新規登録フォームで必要項目を入力する。ここで、通知
先電子メールアドレス、通知先携帯電話メールアドレス
にはそれぞれ複数のアドレスを入力可能となっている。
Remote server administrator database 207
The administrator who does not register the management name and password in the "register" selects "new registration" on the registration reception / modification screen. In this case, the manager registration / modification server 14 displays a screen of a new registration form shown in FIG. 13B on the manager terminal 10 (steps 803 and 804). An unregistered administrator enters necessary items on this new registration form. Here, a plurality of addresses can be input to the notification destination electronic mail address and the notification destination mobile phone mail address, respectively.

【0120】一方、リモートサーバ管理者データベース
207に管理名及びパスワードを既に登録している管理
者は、登録受付・修正画面で「登録情報修正」を選択す
る(図14(a)参照)。この場合、管理者登録・修正
サーバ14は、図14(b)に示すように管理名(I
D)とパスワードの各入力フィールドからなるログイン
画面を表示し、管理者に自己の管理名(ID)とパスワ
ードの入力を促す(ステップ803,805)。管理者
登録・修正サーバ14では、認証部212により入力さ
れた管理名とパスワードによる認証処理を行い(ステッ
プ806)、図14(c)に示すような各フィールドに
現在の設定内容が表示された登録修正フォームの画面を
表示する(ステップ807)。管理者はこの登録修正フ
ォームで必要項目を入力する。ここで、通知先電子メー
ルアドレス、通知先携帯電話メールアドレスにはそれぞ
れ複数のアドレスを入力可能となっている。
On the other hand, the administrator who has already registered the management name and password in the remote server manager database 207 selects “Register registration information” on the registration reception / correction screen (see FIG. 14A). In this case, as shown in FIG. 14B, the administrator registration / modification server 14
A login screen including input fields for D) and a password is displayed, and the administrator is prompted to enter his / her own management name (ID) and password (steps 803 and 805). The administrator registration / correction server 14 performs an authentication process based on the management name and the password input by the authentication unit 212 (step 806), and the current setting contents are displayed in each field as shown in FIG. 14C. A screen for a registration correction form is displayed (step 807). The administrator enters necessary items on this registration correction form. Here, a plurality of addresses can be input to the notification destination electronic mail address and the notification destination mobile phone mail address, respectively.

【0121】新規登録フォーム及び登録修正フォームに
おいて、サーバURL、通知先電子メールアドレス、通
知先携帯電話メールアドレスが入力されると、データベ
ース登録・修正部204では、これらの登録内容が正し
いか否かをチェックする(ステップ808〜811)。
かかるチェックの方法は、自己サーバ管理者データベー
ス206への登録・修正処理におけるチェック方法と同
様であるため説明を省略する。
In the new registration form and the registration correction form, when a server URL, a notification destination electronic mail address, and a notification destination mobile phone mail address are entered, the database registration / correction unit 204 determines whether or not these registration contents are correct. Is checked (steps 808 to 811).
The method of such a check is the same as the check method in the registration / correction processing in the self-server manager database 206, and thus the description is omitted.

【0122】このチェック処理により、管理者が入力し
たサーバURL、通知先電子メールアドレス、通知先携
帯電話メールアドレスが正確か否かを自動的にチェック
される。このため、誤った情報の登録を未然に防止する
ことができる。そして、これら3つのフィールト゛の入力
内容が正しい場合には、各フォームで入力された内容で
管理者レコードを登録又は更新し、登録を完了する(ス
テップ812)。更に通知部203により登録情報を含
めた登録通知の電子メールを作成し、管理者の通知先電
子メールアドレス又は通知先携帯電話メールアドレスを
指定して送信する(ステップ813)。この登録通知メ
ールを管理者が受信することにより、自己の管理者情報
が正しくリモートサーバ管理者データベース207に登
録又は修正されたことがわかる。
By this checking process, it is automatically checked whether the server URL, the notification destination electronic mail address, and the notification destination mobile phone mail address entered by the administrator are correct. For this reason, registration of incorrect information can be prevented. If the input contents of these three fields are correct, the administrator record is registered or updated with the contents input in each form, and the registration is completed (step 812). Further, the notifying unit 203 creates an e-mail of the registration notification including the registration information, and specifies and transmits the e-mail address of the notification destination or the e-mail address of the notification destination mobile phone (step 813). When the administrator receives the registration notification mail, it can be understood that his / her own administrator information has been correctly registered or corrected in the remote server administrator database 207.

【0123】尚、本実施形態のサーバ監視システムで
は、各管理者データベースへの登録修正処理を、監視サ
ーバコンピュータごとに管理者登録・修正サーバ14を
起動して行っているが、図15に示すように、監視サー
バコンピュータの管理者登録・修正サーバの代わりに、
登録インターネット上に登録受付サーバ12を設置し
て、この登録受付サーバ12によって、インターネット
上に存在する全てのインターネット・サーバの各管理者
データベースにインターネットを介して上記管理者登録
・修正処理を行うように構成してもよい。この場合に
は、セキュリティ強化と、登録内容の一元化を維持する
ことができるという利点がある。
In the server monitoring system of the present embodiment, the registration and correction processing in each administrator database is performed by activating the administrator registration / correction server 14 for each monitoring server computer, as shown in FIG. So, instead of the administrator registration / correction server of the monitoring server computer,
A registration reception server 12 is installed on the registration Internet, and the registration reception server 12 performs the above-described administrator registration / correction processing on the respective administrator databases of all the Internet servers existing on the Internet via the Internet. May be configured. In this case, there is an advantage that security enhancement and unification of registered contents can be maintained.

【0124】また、本実施形態のサーバ監視システムで
は、インターネット・サーバごとに補助サーバコンピュ
ータを設置した構成としているが、図15に示すよう
に、インターネット上に一台の補助サーバコンピュータ
を設置し、この一台の補助サーバコンピュータによって
インターネットに接続された全てのサーバコンピュータ
の再起動を制御するように構成しても良い。この場合に
は、補助サーバ管理者データベースに管理対象となる全
てのインターネット・サーバの管理者情報を登録してお
き、上述した復旧処理においてサーバ・パワーコントロ
ーラ4への再起動コマンドの発行をインターネットを介
して行うように構成すればよい。このように構成するこ
とにより、管理者は自己の管理対象のサーバであれば、
常に一台の補助サーバコンピュータへ管理者端末10か
ら接続すればよいので、管理対象のサーバごとに異なる
補助サーバコンピュータへアクセスするという煩雑さを
回避して容易に障害が発生しているサーバを再起動させ
ることができるという利点がある。
In the server monitoring system of this embodiment, an auxiliary server computer is installed for each Internet server. As shown in FIG. 15, one auxiliary server computer is installed on the Internet. The restart of all server computers connected to the Internet may be controlled by this one auxiliary server computer. In this case, the administrator information of all the Internet servers to be managed is registered in the auxiliary server administrator database, and the restart command is issued to the server power controller 4 in the above-described recovery processing. What is necessary is just to be comprised so that it may be performed via a computer. By configuring in this way, the administrator can manage the server
Since the administrator terminal 10 only needs to connect to one auxiliary server computer at all times, the trouble of accessing a different auxiliary server computer for each server to be managed can be avoided, and the failed server can be easily re-created. There is an advantage that it can be activated.

【0125】更に、図15に示すようにインターネット
上にセンタサーバ15を設けると共に、各監視サーバコ
ンピュータで統計プログラム(統計部)を動作させて、
自己監視サーバ又はリモート監視サーバによる監視対象
サーバの時間別・日別・月別・年別のアクセス統計、サ
ーバチェック時刻、応答時間、障害発生時間、障害内
容、障害詳細内容等の情報を統計して、センタサーバ1
5へ送信するように構成しても良い。このとき、センタ
サーバ15では管理者の管理対象のサーバについて統計
情報を、管理者端末からのアクセスによりセンタサーバ
15のホームページ上に表示するように構成することが
できる。
Further, as shown in FIG. 15, a center server 15 is provided on the Internet, and a statistical program (statistical unit) is operated by each monitoring server computer.
Statistics such as hourly, daily, monthly, and yearly access statistics, server check time, response time, failure occurrence time, failure details, and failure details of monitored servers by the self-monitoring server or remote monitoring server , Center server 1
5 may be transmitted. At this time, the center server 15 can be configured to display statistical information on the server managed by the administrator on the home page of the center server 15 by accessing from the administrator terminal.

【0126】[0126]

【発明の効果】以上説明したとおり、本発明によれば、
インターネット回線に常時接続されているサーバの障害
監視を自動的に迅速に行え、管理者が自己の管理するサ
ーバコンピュータから遠隔地にいる場合でも、管理者は
サーバコンピュータの正確な障害情報を即時に入手する
ことができるという効果を有する。
As described above, according to the present invention,
Automatically and quickly monitors faults on servers that are constantly connected to the Internet line. Even if the administrator is remotely located from the server computer managed by the administrator, the administrator can immediately obtain accurate fault information on the server computer. It has the effect of being available.

【0127】また、本発明によれば管理者が自己が管理
するサーバコンピュータから遠隔地にいたとしても、迅
速に障害の復旧作業を行え、サーバコンピュータの障害
発生から復旧完了までに要する時間は短縮され、サーバ
コンピュータをインターネット上で運用する場合の障害
対処の迅速化が図られるという効果を有する。
Further, according to the present invention, even if the administrator is at a remote place from the server computer managed by the administrator, the recovery work can be performed quickly, and the time required from the occurrence of the failure of the server computer to the completion of recovery can be reduced. This has the effect of speeding up troubleshooting when the server computer is operated on the Internet.

【0128】また、請求項5及び11に係る発明によれ
ば、一つのサーバコンピュータで動作する複数のサーバ
プロセスの夫々について障害監視を行うので、複数のサ
ーバプロセスのうちいずれかが正常稼働していても正確
な障害発生を探知できるという効果を有する。
Further, according to the fifth and eleventh aspects of the present invention, a fault is monitored for each of a plurality of server processes operating on one server computer, so that one of the plurality of server processes is operating normally. However, there is an effect that an accurate failure occurrence can be detected.

【0129】更に、請求項7及び13に係る発明によれ
ば、管理者データベースへの管理者情報の登録及び修正
の際に、管理者が入力した識別情報及び端末情報が正確
なものか否かを自動的に判断することができ、誤った情
報の登録を未然に防止することができるという効果を有
する。
Further, according to the seventh and thirteenth aspects of the present invention, when registering and correcting the manager information in the manager database, it is determined whether or not the identification information and the terminal information input by the manager are correct. Is automatically determined, and registration of erroneous information can be prevented beforehand.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施形態のサーバ障害監視システムの全体構
成図である。
FIG. 1 is an overall configuration diagram of a server fault monitoring system according to an embodiment.

【図2】図2(a)は、本実施形態の監視サーバコンピ
ュータの機能的構成を示すブロック図であり、図2
(b)は、本実施形態の補助サーバコンピュータの機能
的構成を示すブロック図である。
FIG. 2A is a block diagram illustrating a functional configuration of a monitoring server computer according to the embodiment;
(B) is a block diagram showing a functional configuration of the auxiliary server computer of the present embodiment.

【図3】本実施形態の監視サーバコンピュータで実行さ
れる自己監視処理のフローチャートである。
FIG. 3 is a flowchart of a self-monitoring process executed by the monitoring server computer of the embodiment.

【図4】本実施形態の監視サーバコンピュータで実行さ
れるリモート監視処理のフローチャートである。
FIG. 4 is a flowchart of a remote monitoring process executed by the monitoring server computer of the embodiment.

【図5】本実施形態における管理者の補助サーバコンピ
ュータへのアクセス手順を示すフローチャート及び補助
サーバコンピュータで実行される復旧処理のフローチャ
ートである。
FIG. 5 is a flowchart illustrating a procedure of an administrator accessing an auxiliary server computer according to the present embodiment, and a flowchart of a recovery process executed by the auxiliary server computer.

【図6】本実施形態の自己サーバ管理者データベースへ
の管理者レコードの登録・修正処理のフローチャートで
ある。
FIG. 6 is a flowchart of processing for registering and correcting an administrator record in a self-server administrator database according to the present embodiment.

【図7】図7(a)は、本実施形態の自己監視サーバに
おいて管理者端末に表示する選択画面の模式図であり、
図7(b)は管理者情報の新規登録フォーム画面の模式
図である。
FIG. 7A is a schematic diagram of a selection screen displayed on an administrator terminal in the self-monitoring server according to the embodiment;
FIG. 7B is a schematic diagram of a new registration form screen for administrator information.

【図8】本実施形態のリモートサーバ管理者データベー
スへの管理者レコードの登録・修正処理のフローチャー
トである。
FIG. 8 is a flowchart of a process of registering and correcting an administrator record in the remote server administrator database according to the embodiment.

【図9】図9(a)は、本実施形態の自己監視サーバに
おいて管理者端末に表示する選択画面の模式図であり、
図9(b)はログイン画面、図9(c)は管理者情報の
登録情報修正フォーム画面の模式図である。
FIG. 9A is a schematic diagram of a selection screen displayed on an administrator terminal in the self-monitoring server according to the embodiment;
FIG. 9B is a schematic diagram of a login screen, and FIG. 9C is a schematic diagram of a registration information correction form screen of administrator information.

【図10】自己サーバ管理者データベースの管理者レコ
ードのデータ構造図である。
FIG. 10 is a data structure diagram of an administrator record of a self-server administrator database.

【図11】リモートサーバ管理者データベースの管理者
レコードのデータ構造図である。
FIG. 11 is a data structure diagram of an administrator record of a remote server administrator database.

【図12】補助サーバ管理者データベースの管理者レコ
ードのデータ構造図である。
FIG. 12 is a data structure diagram of an administrator record of an auxiliary server administrator database.

【図13】図13(a)は、本実施形態の自己監視サー
バにおいて管理者端末に表示する選択画面の模式図であ
り、図13(b)は管理者情報の新規登録フォーム画面
の模式図である。
FIG. 13A is a schematic diagram of a selection screen displayed on an administrator terminal in the self-monitoring server according to the present embodiment, and FIG. 13B is a schematic diagram of a new registration form screen for administrator information; It is.

【図14】図14(a)は、本実施形態のリモート監視
サーバにおいて管理者端末に表示する選択画面の模式図
であり、図14(b)はログイン画面、図14(c)は
管理者情報の登録情報修正フォーム画面の模式図であ
る。
14A is a schematic diagram of a selection screen displayed on an administrator terminal in the remote monitoring server of the present embodiment, FIG. 14B is a login screen, and FIG. 14C is an administrator. It is a schematic diagram of a registration information correction form screen of information.

【図15】本実施形態のサーバ障害監視システムの他の
態様を示す全体構成図である。
FIG. 15 is an overall configuration diagram showing another aspect of the server fault monitoring system of the present embodiment.

【符号の説明】[Explanation of symbols]

X1:監視サーバコンピュータ X2,X3:LAN上のサーバコンピュータ(LANサ
ーバ) Y1,Y2:インターネット上のサーバコンピュータ
(インターネット・サーバ) N1,N2,N3:ネットワーク 1:自己監視サーバ 2:リモート監視サーバ 3:ハードディスク(記憶手段) 4:パワーコントローラ 5:補助サーバコンピュータ 6:ハードディスク 7:DNSサーバコンピュータ 8:ファイアウォール 9:PC 10:管理者端末 10a:携帯電話 10b:管理者用PC 10c:管理者用PDA 11:ルータ 12:登録受付サーバコンピュータ 13:イーサネットケーブル 14:管理者登録・修正サーバ 15:センタサーバコンピュータ 201:起動部 202:自己監視部 203:通知部 204:データベース登録・修正部 205:リモート監視部 206:自己サーバ管理者データベース 207:リモートサーバ管理者データベース 208:着信部 209:認証部(補助サーバ側) 210:制御部 211:補助サーバ管理者データベース 212:認証部(登録・修正サーバ側) 213:サーバチェック部
X1: Monitoring server computer X2, X3: Server computer on LAN (LAN server) Y1, Y2: Server computer on the Internet (Internet server) N1, N2, N3: Network 1: Self-monitoring server 2: Remote monitoring server 3 : Hard disk (storage means) 4: Power controller 5: Auxiliary server computer 6: Hard disk 7: DNS server computer 8: Firewall 9: PC 10: Administrator terminal 10a: Mobile phone 10b: Administrator PC 10c: Administrator PDA 11: Router 12: Registration reception server computer 13: Ethernet cable 14: Administrator registration / correction server 15: Center server computer 201: Activation unit 202: Self-monitoring unit 203: Notification unit 204: Database registration Recording / correcting unit 205: Remote monitoring unit 206: Self server administrator database 207: Remote server administrator database 208: Receiving unit 209: Authentication unit (auxiliary server side) 210: Control unit 211: Auxiliary server administrator database 212: Authentication Section (Registration / Modification Server Side) 213: Server Check Section

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 監視サーバコンピュータと、補助サーバ
コンピュータと、を備えたサーバ障害監視システムであ
って、 前記監視サーバコンピュータは、 管理対象となるサーバコンピュータの識別情報及び管理
者情報を、予め管理者データベースとして記憶手段に記
録するデータベース登録手段と、 前記管理者データベースに登録されたインターネット上
のサーバコンピュータに対しインターネットを介して所
定の送信信号を送信し、該送信信号に対する応答に基づ
いて各サーバコンピュータにおける障害発生の有無を判
断するリモート監視手段と、 障害が発生しているサーバコンピュータの管理者の端末
に対して障害情報を通知する通知手段と、を備えたもの
であり、 前記補助サーバコンピュータは、 前記管理者の端末から復旧指令を受信する着信手段と、 前記復旧指令に基づいて、障害が発生しているサーバコ
ンピュータを復旧させる制御手段と、を備えたものであ
ることを特徴とするサーバ障害監視システム。
1. A server failure monitoring system comprising a monitoring server computer and an auxiliary server computer, wherein the monitoring server computer identifies identification information and administrator information of a server computer to be managed by an administrator in advance. Database registration means for recording in a storage means as a database, transmitting a predetermined transmission signal via the Internet to a server computer on the Internet registered in the administrator database, and each server computer based on a response to the transmission signal Remote monitoring means for determining whether or not a failure has occurred, and a notifying means for notifying failure information to a terminal of an administrator of the server computer in which the failure has occurred. Receives a recovery command from the administrator's terminal A server failure monitoring system, comprising: a receiving means for receiving a message, and a control means for recovering a failed server computer based on the recovery command.
【請求項2】 管理対象となるサーバコンピュータの識
別情報及び管理者情報を、予め管理者データベースとし
て記憶手段に記録するデータベース登録手段と、 前記管理者データベースに登録されたインターネット上
のサーバコンピュータに対しインターネットを介して所
定の送信信号を送信し、該送信信号に対する応答に基づ
いて各サーバコンピュータにおける障害発生の有無を判
断するリモート監視手段と、 障害が発生しているサーバコンピュータの管理者の端末
に対して障害情報を通知する通知手段と、を備えたこと
を特徴とするサーバ障害監視装置。
2. A database registration unit for recording identification information and manager information of a server computer to be managed in a storage unit in advance as a manager database, and a server computer on the Internet registered in the manager database. A remote monitoring unit that transmits a predetermined transmission signal via the Internet and determines whether or not a failure has occurred in each server computer based on a response to the transmission signal; and a terminal of an administrator of the server computer in which the failure has occurred. A server for notifying failure information to the server.
【請求項3】 前記リモート監視手段は、更に自己のコ
ンピュータの属するローカルエリアネットワーク上のサ
ーバコンピュータに対して前記送信信号を送信して各サ
ーバコンピュータの障害発生の有無を判断するものであ
ることを特徴とする請求項2に記載のサーバ障害監視装
置。
3. The remote monitoring means further transmits the transmission signal to a server computer on a local area network to which the own computer belongs to determine whether or not each server computer has a failure. The server fault monitoring device according to claim 2, wherein
【請求項4】 自己のコンピュータ内で作動するサーバ
プロセスに対して前記送信信号を送信し、前記サーバプ
ロセスからの応答に基づいて前記サーバプロセスの障害
発生の有無を判断する自己監視手段と、 前記自己監視手段により前記サーバプロセスにおける障
害発生を判断した場合に、前記サーバプロセスに対し再
起動指令を発行する起動手段と、を更に備えたものであ
ることを特徴とする請求項2又は3に記載のサーバ障害
監視装置。
4. A self-monitoring unit that transmits the transmission signal to a server process operating in its own computer and determines whether a failure has occurred in the server process based on a response from the server process. 4. The device according to claim 2, further comprising: a start unit that issues a restart command to the server process when a self-monitoring unit determines that a failure has occurred in the server process. 5. Server fault monitoring device.
【請求項5】 前記リモート監視手段は、前記サーバコ
ンピュータ内の複数の異なるサーバプロセスに対して前
記送信信号を送信し、各サーバプロセスからの応答に基
づいて、サーバプロセスにおける障害発生の有無を判断
するものであることを特徴とする請求項2〜4のいずれ
か1項に記載のサーバ障害監視装置。
5. The remote monitoring unit transmits the transmission signal to a plurality of different server processes in the server computer, and determines whether a failure has occurred in the server process based on a response from each server process. The server fault monitoring device according to any one of claims 2 to 4, wherein the server fault monitoring device performs the process.
【請求項6】 前記リモート監視手段は、一定時間毎に
前記送信信号を送信するものであることを特徴とする請
求項2〜5のいずれか1項に記載のサーバ障害監視装
置。
6. The server fault monitoring device according to claim 2, wherein the remote monitoring unit transmits the transmission signal at regular intervals.
【請求項7】 前記データベース登録手段は、前記管理
者端末からサーバコンピュータの識別情報及び管理者の
端末情報の入力があったとき、入力された識別情報及び
端末情報に基づいてサーバコンピュータと管理者端末に
アクセスし、正常にアクセスできた場合にのみ前記入力
された識別情報及び端末情報を前記管理者データベース
に登録するものであることを特徴とする請求項2〜6の
いずれか1項に記載のサーバ障害監視装置。
7. The database registration means, when identification information of a server computer and terminal information of an administrator are input from the administrator terminal, the server computer and the administrator based on the input identification information and terminal information. The terminal according to any one of claims 2 to 6, wherein the input identification information and the terminal information are registered in the administrator database only when the terminal is accessed and the terminal is normally accessed. Server fault monitoring device.
【請求項8】 障害が発生しているサーバコンピュータ
のサーバの管理者端末から復旧指令を受信する着信手段
と、 前記復旧指令に基づいて、前記サーバコンピュータに対
し再起動コマンドを送出する制御手段と、を備えたこと
を特徴とするサーバ復旧装置。
8. A receiving means for receiving a restoration command from a server administrator terminal of a server computer in which a failure has occurred, and a control means for sending a restart command to the server computer based on the restoration command. , A server recovery device.
【請求項9】 管理対象となるサーバコンピュータの識
別情報及び管理者情報が予め登録された管理者データベ
ースに登録されたインターネット上のサーバコンピュー
タに対し、インターネットを介して所定の送信信号を送
信する送信ステップと、 該送信信号に対する応答に基づいて各サーバコンピュー
タにおける障害発生の有無を判断する監視ステップと、 障害が発生しているサーバコンピュータの管理者の端末
に対して障害情報を通知する通知ステップと、をコンピ
ュータに実行させるためのリモート監視プログラム。
9. Transmission for transmitting a predetermined transmission signal via the Internet to a server computer on the Internet in which identification information of a server computer to be managed and administrator information are registered in advance in an administrator database registered in advance. A monitoring step of determining whether or not a failure has occurred in each server computer based on a response to the transmission signal; and a notifying step of notifying failure information to a terminal of an administrator of the server computer in which the failure has occurred. , A remote monitoring program to make your computer run.
【請求項10】 前記送信ステップは、更に監視サーバ
の属するローカルエリアネットワーク上のサーバコンピ
ュータに対して前記送信信号を送信するものであること
を特徴とする請求項9に記載のリモート障害監視プログ
ラム。
10. The remote fault monitoring program according to claim 9, wherein the transmitting step further transmits the transmission signal to a server computer on a local area network to which a monitoring server belongs.
【請求項11】 前記送信ステップは、前記サーバコン
ピュータ内の複数の異なるサーバプロセスに対して前記
送信信号を送信するものであり、 前記監視ステップは、各サーバプロセスからの応答に基
づいて、サーバプロセスにおける障害発生の有無を判断
するものであることを特徴とする請求項9又は10に記
載のリモート障害監視プログラム。
11. The transmitting step transmits the transmission signal to a plurality of different server processes in the server computer, and the monitoring step performs a server process based on a response from each server process. 11. The remote fault monitoring program according to claim 9, wherein the remote fault monitoring program determines whether a fault has occurred.
【請求項12】 前記送信ステップは、一定時間毎に前
記送信信号を送信するものであることを特徴とする請求
項9〜11のいずれか1項に記載のリモート障害監視プ
ログラム。
12. The remote fault monitoring program according to claim 9, wherein the transmitting step transmits the transmission signal at regular intervals.
【請求項13】 前記管理者端末からサーバコンピュー
タの識別情報及び管理者の端末情報の入力があったと
き、入力された識別情報及び端末情報に基づいてサーバ
コンピュータ及び管理者端末にアクセスし、正常にアク
セスできた場合にのみ前記入力された識別情報と端末情
報を前記管理者データベースに登録するデータベース登
録ステップを、更に監視サーバコンピュータに実行させ
ることを特徴とする請求項9〜12のいずれか1項に記
載のリモート障害監視プログラム。
13. When the identification information of the server computer and the terminal information of the administrator are input from the administrator terminal, the server computer and the administrator terminal are accessed based on the input identification information and the terminal information. 13. The monitoring server computer further executes a database registration step of registering the input identification information and terminal information in the administrator database only when the user can access the server. Remote fault monitoring program described in section.
【請求項14】 監視サーバコンピュータ内で作動する
サーバプロセスに対して所定の送信信号を送信する送信
ステップと、 前記サーバプロセスからの応答に基づいて前記サーバプ
ロセスの障害発生の有無を判断する監視ステップと、 前記監視ステップにより前記サーバプロセスにおける障
害発生を判断した場合に、前記サーバプロセスに対し再
起動指令を発行する起動ステップと、をコンピュータに
実行させるための自己障害監視プログラム。
14. A transmission step of transmitting a predetermined transmission signal to a server process operating in a monitoring server computer, and a monitoring step of determining whether a failure has occurred in the server process based on a response from the server process. A self-monitoring program for causing a computer to execute a start step of issuing a restart instruction to the server process when the occurrence of a fault in the server process is determined by the monitoring step.
【請求項15】 障害が発生しているサーバコンピュー
タのサーバの管理者端末から復旧指令を受信する着信ス
テップと、 前記復旧指令に基づいて、前記サーバコンピュータに対
し再起動コマンドを送出する制御ステップと、をコンピ
ュータに実行させるためのサーバ復旧プログラム。
15. A receiving step of receiving a restoration command from an administrator terminal of a server of a server computer in which a failure has occurred, and a control step of sending a restart command to the server computer based on the restoration command. , A server recovery program to make your computer run.
JP2001027239A 2001-02-02 2001-02-02 Server trouble monitoring system Pending JP2002229870A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001027239A JP2002229870A (en) 2001-02-02 2001-02-02 Server trouble monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001027239A JP2002229870A (en) 2001-02-02 2001-02-02 Server trouble monitoring system

Publications (1)

Publication Number Publication Date
JP2002229870A true JP2002229870A (en) 2002-08-16

Family

ID=18891934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001027239A Pending JP2002229870A (en) 2001-02-02 2001-02-02 Server trouble monitoring system

Country Status (1)

Country Link
JP (1) JP2002229870A (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008293375A (en) * 2007-05-25 2008-12-04 Fujitsu Ltd Operation monitoring device, method, and program
JP2010073117A (en) * 2008-09-22 2010-04-02 Hitachi Information Systems Ltd Server monitoring system and program therefor
JP2011076626A (en) * 2002-09-24 2011-04-14 Ricoh Co Ltd Management mediating device, image forming apparatus, management mediating program, and recording medium recording the program
JP2011155364A (en) * 2010-01-26 2011-08-11 Kddi Corp Fault detection device, monitoring and control device, and computer program
WO2012054930A2 (en) * 2010-10-22 2012-04-26 Datavail Corporation Centralized private network and database monitoring
JP2012222631A (en) * 2011-04-08 2012-11-12 Kyocera Corp Device control system, control apparatus, electric device, and device control method
KR101552190B1 (en) 2013-06-20 2015-09-25 주식회사 데이타서브 Server for providing monitering service of management objective server and method of thereof
JP2017091104A (en) * 2015-11-06 2017-05-25 株式会社InfoDeliver Error notification robot
KR101813687B1 (en) 2016-08-23 2018-01-02 주식회사 윈스 Monitoring system and method using wireless communications
JP2020173743A (en) * 2019-04-15 2020-10-22 明京電機株式会社 Fault monitoring and restoration system, method thereof, and program thereof

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011076626A (en) * 2002-09-24 2011-04-14 Ricoh Co Ltd Management mediating device, image forming apparatus, management mediating program, and recording medium recording the program
JP2008293375A (en) * 2007-05-25 2008-12-04 Fujitsu Ltd Operation monitoring device, method, and program
US8037172B2 (en) 2007-05-25 2011-10-11 Fujitsu Limited Operation monitoring apparatus, operation monitoring method, and computer-readable recording medium storing operation monitoring program
JP2010073117A (en) * 2008-09-22 2010-04-02 Hitachi Information Systems Ltd Server monitoring system and program therefor
JP2011155364A (en) * 2010-01-26 2011-08-11 Kddi Corp Fault detection device, monitoring and control device, and computer program
WO2012054930A3 (en) * 2010-10-22 2012-06-21 Datavail Corporation Centralized private network and database monitoring
WO2012054930A2 (en) * 2010-10-22 2012-04-26 Datavail Corporation Centralized private network and database monitoring
JP2012222631A (en) * 2011-04-08 2012-11-12 Kyocera Corp Device control system, control apparatus, electric device, and device control method
KR101552190B1 (en) 2013-06-20 2015-09-25 주식회사 데이타서브 Server for providing monitering service of management objective server and method of thereof
JP2017091104A (en) * 2015-11-06 2017-05-25 株式会社InfoDeliver Error notification robot
KR101813687B1 (en) 2016-08-23 2018-01-02 주식회사 윈스 Monitoring system and method using wireless communications
JP2020173743A (en) * 2019-04-15 2020-10-22 明京電機株式会社 Fault monitoring and restoration system, method thereof, and program thereof
JP7288662B2 (en) 2019-04-15 2023-06-08 明京電機株式会社 Fault monitoring recovery system, its method, and its program

Similar Documents

Publication Publication Date Title
US6633538B1 (en) Node representation system, node monitor system, the methods and storage medium
US20030069848A1 (en) A User interface for computer network management
US9037685B2 (en) Intelligent migration between devices having different hardware or software configuration
US8924461B2 (en) Method, system, and computer readable medium for remote assistance, support, and troubleshooting
JP6396887B2 (en) System, method, apparatus, and non-transitory computer readable storage medium for providing mobile device support services
US6907551B2 (en) Fault notification method and related provider facility
US20120203880A1 (en) Method and system for establishing a dlp-compliant environment
WO2007071006A1 (en) Systems, methods and computer-readable media for regulating remote access to a data network
US6959392B1 (en) Information providing system and method for providing information
JP2002229870A (en) Server trouble monitoring system
WO2005096550A1 (en) A method for achieving the small window at client-side in the broadband data intelligent network
US7281027B2 (en) Distributed processing system and network monitoring system
US20100017494A1 (en) Formalizing, diffusing and enforcing policy advisories and monitoring policy compliance in the management of networks
JP2003233512A (en) Client monitoring system with maintenance function, monitoring server, program, and client monitoring/ maintaining method
JP2001188726A (en) Monitor event communication system
WO2002037880A1 (en) Remote controlling system and method
US20080104165A1 (en) System and method for providing network connectivity and computer status information
WO2008109291A1 (en) Intelligent migration between devices having different hardware or software configuration
CN110620695A (en) Data processing method and related equipment
EP2605145A1 (en) Method for finding communication devices connected to communication network, and management device
Cisco Cisco Mobile Wireless Fault Mediator 2.2 - Graphical User Interface User Guide
Cisco Release Notes for Device Fault Manager 1.2 on Windows 2000
Cisco Mobile Wireless Fault Mediator 2.2.1 GUI User Guide
Cisco Release Notes for Device Fault Manager 1.2 on Solaris
Cisco Monitoring the System