JP4918669B2 - Remote maintenance system and method and program - Google Patents

Remote maintenance system and method and program Download PDF

Info

Publication number
JP4918669B2
JP4918669B2 JP2008230412A JP2008230412A JP4918669B2 JP 4918669 B2 JP4918669 B2 JP 4918669B2 JP 2008230412 A JP2008230412 A JP 2008230412A JP 2008230412 A JP2008230412 A JP 2008230412A JP 4918669 B2 JP4918669 B2 JP 4918669B2
Authority
JP
Japan
Prior art keywords
information
failure
message
remote maintenance
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008230412A
Other languages
Japanese (ja)
Other versions
JP2010066840A (en
Inventor
正明 清廣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2008230412A priority Critical patent/JP4918669B2/en
Publication of JP2010066840A publication Critical patent/JP2010066840A/en
Application granted granted Critical
Publication of JP4918669B2 publication Critical patent/JP4918669B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、コンピュータシステムのメンテナンスを行うメンテナンス技術に係り、特に、インターネットに接続されたアプリケーションサーバ等に対する遠隔地からのメンテナンスを効率的に行うのに好適なリモートメンテナンス技術に関するものである。   The present invention relates to a maintenance technique for performing maintenance of a computer system, and more particularly to a remote maintenance technique suitable for efficiently performing maintenance from a remote location on an application server or the like connected to the Internet.

ネットワーク・コンピュータ技術の進歩に伴い、例えば、アプリケーションサーバに搭載されるソフトウェアの数は増加の一途を辿っており、その運用技術もますます複雑化してきている。   With the progress of network computer technology, for example, the number of software installed in application servers is increasing, and the operation technology is becoming more and more complicated.

このような状況のもと、遠隔地にて、かつ、専門家の知識を必要とせず、障害運用を行うことにより、現場で日々障害対応をするオペレータやSE(Systems Engineer)の作業負荷を軽減することが求められている。   Under these circumstances, by operating faults at remote locations without the need for expert knowledge, the workload of operators and SE (Systems Engineers) who handle faults on a daily basis is reduced. It is requested to do.

コンピュータシステムを遠隔地からメンテナンスする従来技術として、例えば、特許文献1に記載の技術がある。この技術では、メンテナンスの対象となる装置・システムに対してメンテナンス処理を実現するメンテナンスサーバ装置と、このメンテナンスサーバ装置に対してリモートから実行を指示する遠隔指示装置が設けられている。   As a conventional technique for maintaining a computer system from a remote place, for example, there is a technique described in Patent Document 1. In this technology, a maintenance server device that realizes maintenance processing for an apparatus / system to be maintained, and a remote instruction device that instructs the maintenance server device to execute remotely are provided.

しかし、一般的に障害メッセージを受信してから対応する場合は、有識者が障害内容を判断してから対応することになり、有識者が不在の場合は対応が遅れがちとなり、エンドユーザに多大な迷惑を掛けるケースが多い。   However, in general, when responding after receiving a failure message, an expert will judge the content of the failure and then respond, and when there is no expert, the response tends to be delayed, which can cause great inconvenience to the end user. In many cases.

また、実際に障害内容を切り分け、しかるべき対応を行うためには事前にシステム環境を理解しておく必要がある。例えば、利用しているサーバの機種や、OS(Operating System)、ミドルウェア、業務アプリケーションの種類等、把握しておくべきことが多く、それら全てを理解する人材を用意することは多大な工数を必要とする。   In addition, it is necessary to understand the system environment in advance in order to actually isolate the failure contents and take appropriate measures. For example, it is often necessary to know the model of the server being used, the OS (Operating System), middleware, the type of business application, etc. It takes a lot of man-hours to prepare human resources who understand all of them. And

特開2001−184233号公報JP 2001-184233 A

解決しようとする問題点は、従来の技術では、夜間や休日にシステム傷害が発生した場合に当該傷害発生を遠隔地にいる保守担当者に迅速かつ安価に通知してメンテナンス作業の容易化を図ることで保守費用の軽減を行うことができるが、保守担当者として障害内容を十分に理解できる人材を用意しなければならない点である。   The problem to be solved is that, in the conventional technology, when a system failure occurs at night or on a holiday, the maintenance is remotely and promptly notified to a maintenance person at a remote place to facilitate the maintenance work. However, it is possible to reduce maintenance costs, but it is necessary to prepare human resources who can fully understand the contents of the failure as maintenance personnel.

本発明の目的は、これら従来技術の課題を解決し、アプリケーションサーバ等において発生する障害に対するリモート(遠隔地)からの確実な対応を人手を掛けずに可能とし、データセンタの運用レベルの向上と運用コストの削減を可能とすることである。   The object of the present invention is to solve these problems of the prior art, enable a reliable response from a remote (remote location) to a failure occurring in an application server or the like without manpower, and improve the operation level of the data center. It is possible to reduce operational costs.

上記目的を達成するため、本発明では、監視対象の装置・システムを構成するハードウェアやソフトウェアに関する情報、および、発生し得る障害内容とそれに対する対処情報等を予めデータベース等において登録しておき、実際に障害が発生した際には、原因を切り分け、予め用意しておいた障害メッセージおよび対処情報から適切な情報を選択し、ネットワーク経由で遠隔地にある通信端末に送信し、メンテナンス担当者に通知する。この際、本発明では、アプリケーションサーバ等の監視対象の装置が出力する複雑で長文となるメッセージを一旦受けて、そのメッセージをメンテナンスに最低限必要な内容に要約して通知する。さらに、本発明では、発生時にすぐには対応が決まらない障害に対しては、過去に発生した障害内容から類似のものを選択して、その対処内容を通知し、また、過去に発生した障害に対して実施した対応方法情報を登録しておき、発生した障害が既知の障害であれば、事前に登録されている当該対応法を実行する。このように、発生した障害が、既知の障害であれば自動対応し、未知の障害であれば、関連する対処情報を選択して提示することにより、人手を掛けることなく、かつ確実なリモートからの障害対応が可能となる。   In order to achieve the above object, in the present invention, information related to the hardware and software constituting the monitoring target device / system, and the contents of the failure that may occur and information for dealing with it are registered in advance in a database, etc. When a failure actually occurs, isolate the cause, select appropriate information from the prepared failure message and countermeasure information, send it to the remote communication terminal via the network, and send it to the maintenance staff Notice. In this case, according to the present invention, a complicated and long message output from a monitoring target device such as an application server is once received, and the message is summarized and notified to a minimum content necessary for maintenance. Furthermore, in the present invention, for a failure that cannot be resolved immediately upon occurrence, a similar one is selected from the content of the failure that occurred in the past, and the countermeasure content is notified, and the failure that occurred in the past is also selected. If the failure that has occurred is a known failure, the corresponding response method registered in advance is executed. In this way, if the failure that has occurred is a known failure, it is automatically handled, and if it is an unknown failure, it is possible to select and present the relevant countermeasure information without any human intervention and from a reliable remote. It becomes possible to cope with the failure.

本発明によれば、リモートメンテナンスシステムが障害発生時に発生した障害内容を要約して通知することにより、運用管理部門のオペレータが的確に障害内容を容易に理解できるとともに、既知の障害で対応方法が決定されている障害については事前に対応方法を登録し、発生時は自動対応することによりオペレータの操作ミスによる二次障害を防止することが可能となり、データセンタの運用レベルの向上と運用コストの削減を図ることができる。   According to the present invention, the remote maintenance system summarizes and notifies the details of the failure that has occurred when the failure occurs, so that the operator of the operation management department can easily understand the failure content accurately, and a method for responding to a known failure is provided. It is possible to prevent the secondary failure due to operator error by registering the response method for the determined failure in advance and automatically responding when it occurs, improving the operational level of the data center and reducing the operating cost. Reduction can be achieved.

以下、図を用いて本発明を実施するための最良の形態例を説明する。図1は、本発明に係るリモートメンテナンスシステムを設けたネットワークコンピュータシステムの構成例を示すブロック図であり、図2は、図1におけるリモートメンテナンスサーバの第1の処理動作例を示すフローチャート、図3は、図1におけるリモートメンテナンスサーバの第2の処理動作例を示すフローチャート、図4は、図1におけるリモートメンテナンスサーバの第3の処理動作例を示すフローチャート、図5は、図1における監視情報データベースが記憶管理するテーブル構成例を示す説明図、図6は、図1におけるデータベース処理部が記憶管理するソフトウェア情報テーブル構成例を示す説明図、図7は、図1におけるデータベース処理部が記憶管理するハードウェア情報テーブル構成例を示す説明図、図8Aは、図1における簡易メッセージデータベースが記憶管理するテーブル構成例(項目説明)を示す説明図、図8Bは、図1における簡易メッセージデータベースが記憶管理するテーブル構成例(データ例)を示す説明図、図9Aは、図1における監視情報データベースが記憶管理するテーブル構成例(項目説明)を示す説明図、図9Bは、図1における監視情報データベースが記憶管理するテーブル構成例(データ例)を示す説明図、図10は、図1における障害対応データベースが記憶管理するテーブル構成例を示す説明図、図11は、図1における通信端末の入出力画面例を示す説明図である。   The best mode for carrying out the present invention will be described below with reference to the drawings. 1 is a block diagram showing a configuration example of a network computer system provided with a remote maintenance system according to the present invention. FIG. 2 is a flowchart showing a first processing operation example of the remote maintenance server in FIG. 1 is a flowchart showing a second processing operation example of the remote maintenance server in FIG. 1, FIG. 4 is a flowchart showing a third processing operation example of the remote maintenance server in FIG. 1, and FIG. 5 is a monitoring information database in FIG. FIG. 6 is an explanatory diagram showing a configuration example of a software information table stored and managed by the database processing unit in FIG. 1, and FIG. 7 is stored and managed by the database processing unit in FIG. FIG. 8A is an explanatory diagram showing a configuration example of the hardware information table, and FIG. FIG. 8B is an explanatory diagram showing a table configuration example (data example) stored and managed by the simple message database in FIG. 1, and FIG. 9A is an explanatory diagram showing a table configuration example (data example) stored and managed by the simple message database in FIG. FIG. 9B is an explanatory diagram showing a table configuration example (item description) stored and managed by the monitoring information database in FIG. 1, FIG. 9B is an explanatory diagram showing a table configuration example (data example) stored and managed by the monitoring information database in FIG. FIG. 11 is an explanatory diagram showing a table configuration example stored and managed by the failure handling database in FIG. 1, and FIG. 11 is an explanatory diagram showing an input / output screen example of the communication terminal in FIG.

図1において、通信端末101、リモートメンテナンスサーバ103、アプリケーションサーバ109、運用監視サーバ110のそれぞれは、CPU(Central Processing Unit)や主メモリ、表示装置、入力装置、外部記憶装置からなるコンピュータ構成からなり、光ディスク駆動装置等を介してCD−ROM等の記憶媒体に記録されたプログラムやデータを外部記憶装置内にインストールした後、この外部記憶装置から主メモリに読み込みCPUで処理することにより、各処理部の機能を実行する。   In FIG. 1, each of the communication terminal 101, the remote maintenance server 103, the application server 109, and the operation monitoring server 110 has a computer configuration including a CPU (Central Processing Unit), a main memory, a display device, an input device, and an external storage device. After installing the program or data recorded in a storage medium such as a CD-ROM via an optical disk drive or the like into the external storage device, each program is read from the external storage device into the main memory and processed by the CPU. The function of the department is executed.

例えば、プログラムに基づくコンピュータ処理を実行する機能として、通信端末101は、障害対応内容検索入力画面処理部(図中「障害対応内容検索入力画面」と記載)101aと障害対応内容検索出力画面処理部(図中「障害対応内容検索出力画面」と記載)101bを有し、リモートメンテナンスサーバ103は、認証機能104とリモートメンテナンス支援機能105、リモートメンテナンス機能106を有し、運用監視サーバ110は、ノード監視部110aとメッセージ監視部110b、リソース監視部110cを有する。   For example, as a function of executing computer processing based on a program, the communication terminal 101 includes a failure handling content search input screen processing unit (described as “fault handling content search input screen” in the figure) 101a and a fault handling content search output screen processing unit. (Denoted as “Fault handling content search output screen” in the figure) 101b, the remote maintenance server 103 has an authentication function 104, a remote maintenance support function 105, and a remote maintenance function 106, and the operation monitoring server 110 has a node It has a monitoring unit 110a, a message monitoring unit 110b, and a resource monitoring unit 110c.

また、リモートメンテナンスサーバ103における認証機能104は、通信端末101との認証処理を行うためのリモートアクセス・ログイン認証部104aとログイン方式選択機部104b、通信端末101で用いるOSに合わせて起動するためのU Terminal部104c、Xサーバエミュレート部104d、Wリモートコントロール部104eを具備している。   Further, the authentication function 104 in the remote maintenance server 103 is activated in accordance with the OS used in the remote access / login authentication unit 104a and the login method selection unit 104b for performing the authentication process with the communication terminal 101 and the communication terminal 101. U Terminal section 104c, X server emulation section 104d, and W remote control section 104e.

また、リモートメンテナンスサーバ103におけるリモートメンテナンス支援機能105は、運用監視サーバ110から出力される情報の受信制御処理を行う監視情報受信設定部105a、複数の運用監視サーバ(110)にアクセスして当該運用監視サーバで監視している障害情報を収集する障害情報一括収集部105b、例えば通信端末101の障害対応内容検索入力画面処理部101aからの要求に応じてリモートメンテナンス機能106におけるデータベース処理部106の障害事例データベース108cで記憶管理している情報の検索等を行う障害事例検索部105cとその検索結果等を通信端末101等に送信する障害メール配信部105dを具備している。   In addition, the remote maintenance support function 105 in the remote maintenance server 103 accesses the monitoring information reception setting unit 105a that performs reception control processing of information output from the operation monitoring server 110, and a plurality of operation monitoring servers (110) to perform the operation. The failure of the database processing unit 106 in the remote maintenance function 106 in response to a request from the failure information batch collection unit 105b that collects failure information monitored by the monitoring server, for example, the failure response content search input screen processing unit 101a of the communication terminal 101 A failure case retrieval unit 105c that retrieves information stored and managed in the case database 108c and a failure mail distribution unit 105d that transmits the retrieval result and the like to the communication terminal 101 and the like are provided.

また、リモートメンテナンスサーバ103におけるリモートメンテナンス機能106は、リモートメンテナンス処理部107とデータベース処理部(図中「DB処理部」と記載)108を具備しており、このリモートメンテナンス処理部107は、本発明に係る機能としてのメッセージ簡略化部107aと障害対応内容表示部107b、障害自動対応部107cを具備し、データベース処理部108は、監視情報データベース(図中「監視情報DB」と記載)108a、簡易メッセージデータベース(図中「簡易メッセージDB」と記載)108b、障害事例データベース(図中「障害事例DB」と記載)108c、障害対応データベース(図中「障害対応DB」と記載)108dを具備している。   The remote maintenance function 106 in the remote maintenance server 103 includes a remote maintenance processing unit 107 and a database processing unit (described as “DB processing unit” in the figure) 108, and the remote maintenance processing unit 107 is the present invention. A message simplification unit 107a, a failure handling content display unit 107b, and a fault auto-handling unit 107c as functions related to the database processing unit 108a, a monitoring information database (described as “monitoring information DB” in the figure) 108a, A message database (described as “simple message DB” in the figure) 108b, a failure case database (described as “failure case DB” in the figure) 108c, and a failure handling database (described as “failure handling DB” in the figure) 108d; Yes.

このようにプログラムされたコンピュータ処理機能で構成された本例のリモートメンテナンスサーバ103は、監視対象のアプリケーションサーバ109で発生した障害に関する情報を、インターネット102を介して接続された通信端末101に通知する。   The remote maintenance server 103 of the present example configured with the computer processing function programmed in this way notifies the communication terminal 101 connected via the Internet 102 of information regarding a failure that has occurred in the application server 109 to be monitored. .

そのために、リモートメンテナンスサーバ103は、簡易メッセージデータベース108bにおいて、複数の監視対象のアプリケーションサーバ(109)毎に、当該監視対象のアプリケーションサーバから出力される障害情報に予め対応付けて入力されたメッセージ情報と当該障害に対する対応指示情報を記憶装置に記憶し管理する。   For this purpose, the remote maintenance server 103, for each of the plurality of monitoring target application servers (109) in the simple message database 108b, message information input in advance in association with failure information output from the monitoring target application server. And the response instruction information for the failure are stored in the storage device and managed.

そして、管理情報データベース108aにおいて、監視対象のアプリケーションサーバで発生した障害に関する運用監視サーバ110から出力された障害情報(障害メッセージ)を入力して記憶し、メッセージ簡略化部107aは、簡易メッセージデータベース108bにアクセスして、管理情報データベース108aにおいて記憶した当該監視対象のアプリケーションサーバの当該障害情報に対応付けられたメッセージ情報と対応指示情報を読み出す。   Then, in the management information database 108a, the failure information (failure message) output from the operation monitoring server 110 relating to the failure that occurred in the monitoring target application server is input and stored, and the message simplification unit 107a receives the simplified message database 108b. To read the message information and the corresponding instruction information associated with the failure information of the monitored application server stored in the management information database 108a.

このようにしてメッセージ簡略化部107aが読み出したメッセージ情報と対応指示情報は、リモートメンテナンス支援機能105における障害メール配信部105bにより、当該監視対象のアプリケーションサーバ(109)の識別情報と共にインターネット102を介して接続された通信端末101に送信する。   The message information and the corresponding instruction information read out by the message simplification unit 107a in this way are transmitted via the Internet 102 together with the identification information of the monitored application server (109) by the failure mail distribution unit 105b in the remote maintenance support function 105. To the connected communication terminal 101.

尚、運用監視サーバ110から受信して管理情報データベース108aにおいて記憶管理するアプリケーションサーバ109の障害情報(障害メッセージ)は、図5の項目説明501とデータ例502で示すように、登録日時、登録番号、監視ホスト名、監視種別、監視メッセージ、重要度等からなり、また、簡易メッセージデータベース108bにおいて記憶管理するメッセージ情報は、図8Aの項目説明801と図8Bのデータ例802,803で示すように、ホスト名、監視メッセージ、ハードウェア種別、ハードウェア名、ソフトウェア種別、ソフトウェアID、ソフトウェア名、簡易メッセージID、簡易メッセージ、障害対応方針等からなり、簡易メッセージデータベース108bにおいて記憶管理するメッセージ情報の方が、管理情報データベース108aにおいて記憶管理する障害情報(障害メッセージ)よりも、障害の内容を把握してその対策を練るのに必要な内容となっている。   Note that the failure information (failure message) of the application server 109 received from the operation monitoring server 110 and stored and managed in the management information database 108a is the registration date, registration number, as shown in the item description 501 and the data example 502 in FIG. , Monitoring host name, monitoring type, monitoring message, importance, etc. The message information stored and managed in the simple message database 108b is as shown in the item description 801 in FIG. 8A and the data examples 802 and 803 in FIG. 8B. , Host name, monitoring message, hardware type, hardware name, software type, software ID, software name, simple message ID, simple message, failure response policy, etc., and the message information stored and managed in the simple message database 108b But, Than the failure information stored and managed in the management information database 108a (failure message), it has become a required content to knead the measures to understand the content of the fault.

また、障害事例データベース108cは、簡易メッセージデータベース108bにおいて記憶管理されている各メッセージ情報の障害に対して過去に実際に行われた障害対処内容を示す事例情報を記憶管理しており、障害対応内容表示部107bは、メッセージ簡略化部107aが簡易メッセージデータベース108bから読み出したメッセージ情報に対応する事例情報を読み出し、障害メール配信部105bは、障害対応内容表示部107bが読み出した事例情報をインターネット102を介して接続された通信端末101に送信する。   In addition, the failure case database 108c stores and manages case information indicating the content of failure handling actually performed in the past for the failure of each message information stored and managed in the simple message database 108b. The display unit 107b reads the case information corresponding to the message information read by the message simplification unit 107a from the simple message database 108b, and the failure mail distribution unit 105b transmits the case information read by the failure response content display unit 107b to the Internet 102. To the communication terminal 101 connected via the network.

障害事例データベース108cにおいて記憶管理する事例情報は、図9Aの項目説明901と図9Bのデータ例902〜904で示すように、障害事例ID、障害発生日時、ホスト名、監視メッセージ、簡易メッセージID、簡易メッセージ、ハードウェア種別、ハードウェア名、OS種別、ソフトウェア種別、ソフトウェアID、ソフトウェア名、重要度、障害原因、対応内容、障害対応日時等からなり、簡易メッセージデータベース108bにおいて記憶管理するメッセージ情報よりもさらに詳細な情報が示されている。   Case information stored and managed in the failure case database 108c includes failure case ID, failure occurrence date, host name, monitoring message, simple message ID, as shown in the item description 901 in FIG. 9A and the data examples 902 to 904 in FIG. 9B. Simple message, hardware type, hardware name, OS type, software type, software ID, software name, importance, failure cause, response content, failure response date and time, etc. From message information stored and managed in the simple message database 108b More detailed information is also shown.

また、通信端末101の障害対応内容検索入力画面101aにおける操作により、認証機能104において認証済みの通信端末101から送信されてきたメッセージ情報を受信すると、リモートメンテナンス処理部107の障害対応内容表示部107bにより、監視情報データベース108aと障害事例データベース108cにアクセスして、当該メッセージ情報に対応する事例情報を読み出し、障害メール配信部105bにより、障害事例検索部105cが読み出した事例情報をインターネット102を介して接続された通信端末101に送信する。通信端末101は、受信した事例情報を障害対応内容検索出力画面101bで表示し、障害対応担当者に通知する。尚、通信端末101は、図示していない音声出力装置により情報の受信を通知する構成としても良い。   When the message information transmitted from the communication terminal 101 authenticated by the authentication function 104 is received by the operation on the failure response content search input screen 101a of the communication terminal 101, the failure response content display unit 107b of the remote maintenance processing unit 107 is received. Thus, the monitoring information database 108a and the failure case database 108c are accessed, the case information corresponding to the message information is read, and the case information read by the failure case search unit 105c is read via the Internet 102 by the failure mail distribution unit 105b. It transmits to the connected communication terminal 101. The communication terminal 101 displays the received case information on the failure handling content search output screen 101b and notifies the failure handling staff. Note that the communication terminal 101 may be configured to notify the reception of information by an audio output device (not shown).

尚、通信端末101の障害対応内容検索入力画面101aにおける操作では、図11の障害対応方針検索条件入力画面1101において示すように、例えば登録番号(2008−2−1−000101)を入力することでも良く、これに対する後述の図3において説明する処理結果として、図11の障害対応方式検索結果出力画面1102に示す内容の情報が通信端末101に表示される。   In the operation on the failure handling content search input screen 101a of the communication terminal 101, as shown on the failure handling policy search condition input screen 1101 in FIG. 11, for example, a registration number (2008-2-1-000101) may be input. For example, information on the contents shown in the failure response method search result output screen 1102 in FIG. 11 is displayed on the communication terminal 101 as a processing result described later with reference to FIG.

また、障害対応データベース108dは、監視対象の装置(アプリケーションサーバ109)から出力され運用監視サーバ110より監視情報データベース108aが収集した障害情報(障害メッセージ)に予め対応付けられた当該障害情報で特定される障害を自動解決するための障害対応プログラム情報を記憶管理しており、障害自動対応部107cは、監視情報データベース108aで記憶管理している障害情報に対応付けられた障害対応プログラム情報を障害対応データベース108dにアクセスして読み出し、読み出した障害対応プログラム情報を実行して、監視対象の装置(アプリケーションサーバ109)に対する障害回復処理を行う。   The failure handling database 108d is specified by the failure information associated with the failure information (failure message) output from the monitoring target device (application server 109) and collected by the monitoring information database 108a from the operation monitoring server 110 in advance. The failure handling program information for automatically resolving a failure is stored and managed, and the failure handling unit 107c handles the failure handling program information associated with the failure information stored and managed in the monitoring information database 108a. The database 108d is accessed and read, and the read failure response program information is executed to perform failure recovery processing for the monitoring target device (application server 109).

例えば、障害対応データベース108dにおいて記憶管理する障害対応プログラム情報は、図10の項目説明1001とデータ例1002〜1003で示すように、障害ホスト名、監視メッセージ、障害時実行スクリプト・パス名、障害時実行スクリプト名、障害時スクリプト開始日時、障害時スクリプト終了日時、障害実行スクリプト結果等からなり、障害自動対応部107cは、監視情報データベース108aにおいて当該監視メッセージに対応付けられた障害時実行スクリプト・パス名で特定される障害時実行スクリプト名のスクリプトを実行する。   For example, the failure handling program information stored and managed in the failure handling database 108d includes the failure host name, monitoring message, failure execution script / path name, failure failure, as shown in the item description 1001 and data examples 1002 to 1003 in FIG. The failure automatic response unit 107c includes an execution script name, a failure script start date / time, a failure script end date / time, a failure execution script result, and the like. The failure automatic response unit 107c is associated with the monitoring message in the monitoring information database 108a. Execute the script with the failure execution script name specified by name.

尚、リモートメンテナンスサーバ103がリモートメンテナンス機能106のデータベース処理部108において記憶管理する情報として、各監視対象の装置(アプリケーションサーバ109)毎のハードウェア構成情報とソフトウェア構成情報があり、ソフトウェア構成情報は、図6の項目説明601とデータ例602で詳細が示され、ハードウェア構成情報は、図7の項目説明701とデータ例702で詳細が示されている。   Information stored and managed by the remote maintenance server 103 in the database processing unit 108 of the remote maintenance function 106 includes hardware configuration information and software configuration information for each monitoring target device (application server 109). Details are shown in the item description 601 and the data example 602 in FIG. 6, and the hardware configuration information is shown in detail in the item description 701 and the data example 702 in FIG.

このような監視対象の装置毎のハードウェア構成情報とソフトウェア構成情報は、アプリケーションサーバ(109:監視対象の装置)から出力され運用監視サーバ110から受信して監視情報データベース108aにおいて記憶管理する障害情報(障害メッセージ)にも含まれている。   Such hardware configuration information and software configuration information for each monitoring target device are output from the application server (109: monitoring target device), received from the operation monitoring server 110, and stored and managed in the monitoring information database 108a. (Fault message).

以下、図2〜図4を用いて本発明に係るリモートメンテナンス処理手順について説明する。   Hereinafter, the remote maintenance processing procedure according to the present invention will be described with reference to FIGS.

図2においては、図1に示すリモートメンテナンスサーバ103における特にリモートメンテナンス機能106による処理内容を示しており、まず、データベース処理部108の監視情報データベース108aにおいて、運用監視サーバ110より受信した障害情報(監視メッセージ)に受信日時と受付番号を付与して登録管理する(ステップS201)。   FIG. 2 shows the details of processing by the remote maintenance function 106 in the remote maintenance server 103 shown in FIG. 1. First, in the monitoring information database 108 a of the database processing unit 108, the failure information (from the operation monitoring server 110 ( A monitoring message is assigned and registered with a reception date and reception number (step S201).

次に、リモートメンテナンス処理部107のメッセージ簡略化部107aにより、監視情報データベース108aで登録管理している障害情報(監視メッセージ)と簡易メッセージデータベース108bで記憶管理している障害情報(監視メッセージ)とを比較する(ステップS202)。   Next, by the message simplification unit 107a of the remote maintenance processing unit 107, fault information (monitoring message) registered and managed in the monitoring information database 108a and fault information (monitoring message) stored and managed in the simple message database 108b Are compared (step S202).

比較の結果、双方が等しい場合は、簡易メッセージデータベース108bが当該障害情報(監視メッセージ)に対応つけて記憶管理している簡易メッセージを抽出し(ステップS203)、また、双方が等しくない場合は、監視情報データベース108aが登録管理している当該障害情報(監視メッセージ)を抽出し(ステップS204)、抽出したメッセージをE−Mail本文にセットして(ステップS205)通信端末101に送信する。   As a result of the comparison, if both are equal, the simple message database 108b extracts a simple message stored and managed in association with the failure information (monitoring message) (step S203). If both are not equal, The failure information (monitoring message) registered and managed by the monitoring information database 108a is extracted (step S204), and the extracted message is set in the E-Mail text (step S205) and transmitted to the communication terminal 101.

図3においては、図1に示すリモートメンテナンスサーバ103における特にリモートメンテナンス機能106のリモートメンテナンス処理部107の障害対応内容表示部107bによる処理内容を示しており、まず、認証機能104での認証確認が正常となった通信端末101から送信されてきた登録番号を入力する(ステップS301)。   FIG. 3 shows the processing contents by the failure response content display unit 107b of the remote maintenance processing unit 107 of the remote maintenance function 106 in the remote maintenance server 103 shown in FIG. The registration number transmitted from the normal communication terminal 101 is input (step S301).

次に、障害対応内容表示部107bは、入力した登録番号と監視情報データベース108aで記憶管理している登録番号を比較し(ステップS302)、等しくない場合は登録番号が未登録であることを表示し(ステップS303)、等しい場合は、当該登録番号が対応付けられた監視情報データベース108aにおける監視メッセージ(障害情報)を特定し、特定した監視メッセージ(障害情報)をキーに障害事例データベース108cにアクセスして検索を行う(ステップS304)。   Next, the failure response content display unit 107b compares the input registration number with the registration number stored and managed in the monitoring information database 108a (step S302), and displays that the registration number is unregistered if they are not equal. (Step S303), if equal, the monitoring message (failure information) in the monitoring information database 108a associated with the registration number is specified, and the failure case database 108c is accessed using the specified monitoring message (failure information) as a key. The search is performed (step S304).

障害事例データベース108cで記憶管理する情報に、当該監視メッセージ(障害情報)と一致する情報があれば、障害事例データベース108cにおいて当該監視メッセージ(障害情報)に対応付けられている事例情報を選択して通信端末101に送信して表示し(ステップS305)、一致する情報がなければ、監視メッセージに対応する事例情報がない旨を示す情報を通信端末101に送信して表示する(ステップS306)。   If the information stored and managed in the failure case database 108c includes information that matches the monitoring message (failure information), the case information associated with the monitoring message (failure information) is selected in the failure case database 108c. If there is no matching information, the information indicating that there is no case information corresponding to the monitoring message is transmitted to the communication terminal 101 and displayed (step S306).

図4においては、図1に示すリモートメンテナンスサーバ103における特にリモートメンテナンス機能106のリモートメンテナンス処理部107の障害自動対応部107cによる処理内容を示しており、まず、監視情報データベース108aにおいて、運用監視サーバから受信した監視メッセージ(障害情報)を登録する(ステップS401)。   FIG. 4 shows the processing contents of the remote maintenance processing unit 107 of the remote maintenance function 106 in the remote maintenance server 103 shown in FIG. The monitoring message (failure information) received from is registered (step S401).

次に、障害自動対応部107cにより、監視情報データベース108aと障害対応データベース108dにアクセスして、監視情報データベース108aが登録管理している監視ホスト名と障害対応データベース108dが記録管理しているホスト名を比較する(ステップS402)。   Next, the automatic failure handling unit 107c accesses the monitoring information database 108a and the failure handling database 108d, and the monitoring host name registered and managed by the monitoring information database 108a and the host name recorded and managed by the failure handling database 108d. Are compared (step S402).

それぞれのホスト名が等しくない場合は「該当ホスト無し」とのメッセージと、監視情報データベース108aにおける監視ホスト名とをメール本文に付加して(ステップS411)、予め登録されたEメールアドレス宛にメール送信して(ステップS410)処理を完了する。   If the host names are not equal, a message “No applicable host” and the monitoring host name in the monitoring information database 108a are added to the mail body (step S411), and the mail addressed to a pre-registered e-mail address is sent. Send (step S410) to complete the process.

それぞれのホスト名が等しい場合は、監視情報データベース108aで管理している監視メッセージ(障害情報)と障害対応データベース108dが管理している監視メッセージ(障害情報)を比較し(ステップS403)、監視メッセージが等しい場合は、障害対応データベース108dにおいて当該監視メッセージに対応付けて登録されている障害時実行スクリプトを実行する(ステップS404)。   When the host names are the same, the monitoring message (failure information) managed by the monitoring information database 108a is compared with the monitoring message (failure information) managed by the failure handling database 108d (step S403), and the monitoring message is compared. If they are equal, the failure execution script registered in association with the monitoring message in the failure handling database 108d is executed (step S404).

そして、監視情報データベース108aで管理している監視メッセージと、障害時実行スクリプトの開始日時とをメール本文に設定し(ステップS405)、予め登録されたEメールアドレス宛にメール送信し(ステップS406)、その後、障害時実行スクリプトの完了を1分間隔でチェックする(ステップS407)。   Then, the monitoring message managed in the monitoring information database 108a and the start date and time of the failure execution script are set in the mail body (step S405), and the mail is transmitted to a pre-registered e-mail address (step S406). Thereafter, the completion of the failure execution script is checked at one minute intervals (step S407).

このようにして、障害時実行スクリプトの完了メッセージがシステムログに出力されたか否かを確認し(ステップS408)、出力されていれば、障害時実行スクリプトの終了日時と実行結果をメール本文に設定して(ステップS409)、予め登録されたEメールアドレス宛にメール送信して(ステップS410)処理を完了する。   In this way, it is confirmed whether or not a failure execution script completion message has been output to the system log (step S408). If it has been output, the end date and time of the failure execution script and the execution result are set in the mail body. Then (step S409), an e-mail is sent to a pre-registered e-mail address (step S410), and the process is completed.

尚、ステップS408の判断処理結果において、障害時実行スクリプトの完了メッセージがシステムログに出力されていない場合には、リモートメンテナンスサーバ103は、再度、ステップS407の処理に戻り、障害時実行スクリプトの完了を1分間隔でチェックする。   If the failure execution script completion message is not output to the system log in the determination processing result of step S408, the remote maintenance server 103 returns to the process of step S407 again to complete the failure execution script. At 1 minute intervals.

また、ステップS403の判定処理において、監視メッセージが等しくないとの結果であれば、障害事例データベース108cにおいて、障害事例IDを自動採番した後(ステップS412)、当該障害事例IDに対応付けて、監視情報データベース108aにおける当該監視メッセージを設定すると共に(ステップS413)、これらの障害事例IDと監視メッセージ以外の項目に対してはスペースを設定し(ステップS414)、監視情報データベース108aにおける当該ホスト名と監視メッセージをメール本文に設定して(ステップS415)、予め登録されたEメールアドレス宛にメール送信して(ステップS410)処理を完了する。   In the determination process in step S403, if the monitoring message is not equal, after the failure case ID is automatically assigned in the failure case database 108c (step S412), the failure case ID is associated with the failure case ID. In addition to setting the monitoring message in the monitoring information database 108a (step S413), spaces are set for items other than the failure case ID and the monitoring message (step S414), and the host name in the monitoring information database 108a is set. The monitoring message is set in the mail body (step S415), and the mail is transmitted to a pre-registered e-mail address (step S410) to complete the process.

以下、図5〜図11について説明する。図5は、監視情報データベース108aが管理する情報を示しており、運用監視サーバ110から受信したアプリケーションサーバ109が出力した生の監視メッセージ(障害情報)が登録される。本例では、図5の項目説明501とデータ例502で示すように、登録日時、登録番号、監視ホスト名、監視種別、監視メッセージ、重要度等の情報が登録されている。   Hereinafter, FIGS. 5 to 11 will be described. FIG. 5 shows information managed by the monitoring information database 108a, and a raw monitoring message (failure information) output from the application server 109 received from the operation monitoring server 110 is registered. In this example, as shown in the item description 501 and the data example 502 in FIG. 5, information such as registration date / time, registration number, monitoring host name, monitoring type, monitoring message, and importance is registered.

図6は、図示されていないソフトウェア情報データベースで管理する情報を示しており、アプリケーションサーバが使用しているOSやミドルウェア等のソフトウェア情報を登録する。本例では、項目説明601とデータ例602で示すように、ホスト名、OS種別、OS名、OSバージョン、ソフトウェア種別、ソフトウェアID、ソフトウェア名、ソフトウェア・バージョン等の情報が登録されている。   FIG. 6 shows information managed by a software information database (not shown), in which software information such as OS and middleware used by the application server is registered. In this example, information such as a host name, an OS type, an OS name, an OS version, a software type, a software ID, a software name, and a software version is registered as shown in the item description 601 and the data example 602.

図7は、図示されていないハードウェア情報データベースで管理する情報を示しており、アプリケーションサーバのハードウェア種別やシステム構成種別、ハードウェア名などのハードウェア情報を登録する。本例では、項目説明701とデータ例702で示すように、ホスト名、ハードウェア種別、システム構成種別、ハードウェア名等の情報が登録されている。   FIG. 7 shows information managed by a hardware information database (not shown), in which hardware information such as the hardware type, system configuration type, and hardware name of the application server is registered. In this example, as shown in the item description 701 and the data example 702, information such as a host name, hardware type, system configuration type, and hardware name is registered.

図8A,Bは、図1に示す簡易メッセージデータベース108bで管理する情報を示しており、アプリケーションサーバ109から出力された監視メッセージ(障害情報)に対応付けられた簡易メッセージ等を登録する。本例では、図8Aにおける項目説明801と図8Bにおけるデータ例802,803で示すように、ホスト名、監視メッセージ、ハードウェア種別、ハードウェア名、ソフトウェア種別、ソフトウェアID、ソフトウェア名、簡易メッセージID、簡易メッセージ、障害対応方式等の情報が登録されている。   8A and 8B show information managed by the simple message database 108b shown in FIG. 1, and registers a simple message associated with the monitoring message (failure information) output from the application server 109. In this example, as shown in the item description 801 in FIG. 8A and the data examples 802 and 803 in FIG. 8B, the host name, monitoring message, hardware type, hardware name, software type, software ID, software name, simple message ID Information such as simple messages and failure handling methods are registered.

図9A,Bは、図1に示す障害事例データベース108cで管理する情報を示しており、アプリケーションサーバ109から出力された監視メッセージ(障害情報)に対応付けられた過去の対処事例等を登録する。本例では、図9Aにおける項目説明901と図9Bにおけるデータ例902〜904で示すように、障害事例ID、障害発生日、ホスト名、監視メッセージ、登録番号、簡易メッセージID、簡易メッセージ、ハードウェア種別、ハードウェア名、OS種別、ソフトウェア種別、ソフトウェアID、ソフトウェア名、重要度、障害原因、対応内容、障害対応日時等の情報が登録されている。   FIGS. 9A and 9B show information managed by the failure case database 108c shown in FIG. 1, and the past countermeasure cases associated with the monitoring message (failure information) output from the application server 109 are registered. In this example, as shown in the item description 901 in FIG. 9A and the data examples 902 to 904 in FIG. 9B, the failure case ID, failure occurrence date, host name, monitoring message, registration number, simple message ID, simple message, hardware Information such as type, hardware name, OS type, software type, software ID, software name, importance, failure cause, response content, failure response date and time is registered.

図10は、図1に示す障害対応データベース108dで管理する情報を示しており、アプリケーションサーバ109から出力された監視メッセージ(障害情報)に対応付けられて、当該障害の原因とその対応内容等を登録する。本例では、図10における項目説明1001とデータ例1002,1003で示すように、障害ホスト名、監視メッセージ、障害時実行スクリプト・パス名、障害時実行スクリプト名、障害時スクリプト開始日時、障害時スクリプト終了日時、障害時スクリプト実行結果等の情報が登録されている。   FIG. 10 shows information managed by the failure handling database 108d shown in FIG. 1, and the cause of the failure and its corresponding contents are associated with the monitoring message (failure information) output from the application server 109. sign up. In this example, as shown in the item description 1001 and data examples 1002 and 1003 in FIG. 10, the failure host name, monitoring message, failure execution script path name, failure execution script name, failure script start date and time, failure failure Information such as the script end date and time and the script execution result at the time of failure is registered.

図11は、図1に示す通信端末101における障害対応内容検索入力画面処理部101aと障害対応内容検索出力画面処理部101bの処理に応じた画面表示内容を示しており、障害対応方針検索入力画面1101では、登録番号として「2008−2−1−000101」が入力された状態が示されており、その入力に対する図1のリモートメンテナンスサーバ103の処理結果が、障害対応方針検索結果出力画面1102において表示されている。   FIG. 11 shows screen display contents corresponding to the processing of the failure handling content search input screen processing unit 101a and the failure handling content search output screen processing unit 101b in the communication terminal 101 shown in FIG. 1101 shows a state in which “2008-2-1-000101” is input as a registration number, and the processing result of the remote maintenance server 103 in FIG. 1 corresponding to the input is displayed on the failure response policy search result output screen 1102. It is displayed.

以上、図1〜図11を用いて説明したように、本例では、リモートメンテナンスサーバ103において、監視対象の装置(アプリケーションサーバ109)を構成するハードウェアやソフトウェアに関する情報と共に、発生し得る障害内容とそれに対する対処情報等を予めデータベース(108a〜108d)において登録しておき、実際に監視対象の装置に障害が発生した際には、原因を切り分け、予め用意しておいた障害メッセージおよび対処情報から適切な情報を選択し、ネットワーク(インターネット102)経由で遠隔地にある通信端末101に送信し、メンテナンス担当者に通知する。   As described above with reference to FIGS. 1 to 11, in this example, in the remote maintenance server 103, the failure contents that may occur together with information on the hardware and software configuring the monitoring target device (application server 109). And the corresponding countermeasure information are registered in the database (108a to 108d) in advance, and when a failure actually occurs in the device to be monitored, the cause is isolated and the prepared failure message and countermeasure information are prepared. Appropriate information is selected and transmitted to the communication terminal 101 at a remote location via the network (Internet 102) to notify the person in charge of maintenance.

この際、本例では、アプリケーションサーバ109等の監視対象の装置が出力する複雑で長文となるメッセージを一旦、監視情報データベース108aにおいて受けて、簡易メッセージデータベースにおいて管理している情報を参照して、そのメッセージをメンテナンスに最低限必要な内容に要約して通知する。   In this case, in this example, the monitoring information database 108a once receives a complicated and long message output from the monitoring target device such as the application server 109, and refers to the information managed in the simple message database. The message is summarized and notified to the minimum necessary contents for maintenance.

さらに、本例では、発生時にすぐには対応が決まらない障害に対しても、障害事例データベース108cにおいて管理している情報を参照して、過去に発生した障害内容から類似のものを選択して、その対処内容を通知する。また、障害対応データベース108dにおいて、過去に発生した障害に対して実施した対応方法情報を登録しておき、発生した障害が既知の障害であれば、障害対応データベース108dにおいて事前に登録されている当該対応法を読み出して実行する。   In addition, in this example, even for a failure that cannot be resolved immediately when it occurs, the information managed in the failure example database 108c is referred to and a similar one is selected from the content of the failure that occurred in the past. , To notify the contents of the countermeasure. In addition, in the failure handling database 108d, information on how to deal with a failure that has occurred in the past is registered, and if the failure that has occurred is a known failure, the information registered in advance in the failure handling database 108d Read and execute the corresponding method.

このように、本例では、発生した障害が、既知の障害であれば自動対応し、未知の障害であれば、関連する対処情報を選択して提示することにより、人手を掛けることなく、かつ確実なリモートからの障害対応が可能となると共に、オペレータの操作ミスによる二次障害を防止することが可能となり、データセンタの運用レベルの向上と運用コストの削減を図ることができる。   In this way, in this example, if the failure that has occurred is a known failure, it is automatically handled, and if it is an unknown failure, it is possible to select and present related handling information without any human intervention, and It is possible to reliably handle failures from a remote location, and to prevent secondary failures due to operator error, improving the data center operation level and reducing operation costs.

尚、本発明は、図1〜図11を用いて説明した例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本例においては、通信端末101とアプリケーションサーバ109はそれぞれ1つずつ設けた構成としているが、それぞれ複数設けた構成としても良い。   In addition, this invention is not limited to the example demonstrated using FIGS. 1-11, In the range which does not deviate from the summary, various changes are possible. For example, in this example, one communication terminal 101 and one application server 109 are provided, but a plurality may be provided.

また、インターネット102を介して通信端末101とリモートメンテナンスサーバ103が接続された構成としているが、イントラネット等のネットワークを介して通信端末101とリモートメンテナンスサーバ103を接続した構成であっても良い。   In addition, although the communication terminal 101 and the remote maintenance server 103 are connected via the Internet 102, the communication terminal 101 and the remote maintenance server 103 may be connected via a network such as an intranet.

また、リモートメンテナンスサーバ103の構成に関しても、各機能を個別のコンピュータ装置、例えば、データベース処理部108を他のコンピュータ装置に設けた構成としても良い。   Further, regarding the configuration of the remote maintenance server 103, each function may be an individual computer device, for example, the database processing unit 108 may be provided in another computer device.

また、通信端末101としては、パーソナルコンピュータや、PDA(Personal Digital Assistant)、携帯電話、PHS等を用いることでも良く、リモートメンテナンスサーバ103から通信端末101に障害情報(簡易メッセージなど)を送信する機能として、Eメール以外の機能を用いることでも良い。   Further, as the communication terminal 101, a personal computer, a PDA (Personal Digital Assistant), a mobile phone, a PHS, or the like may be used, and a function of transmitting fault information (simple message etc.) from the remote maintenance server 103 to the communication terminal 101. It is also possible to use functions other than e-mail.

また、本例のコンピュータ構成例に関しても、キーボードや光ディスクの駆動装置の無いコンピュータ構成としても良い。また、本例では、光ディスクを記録媒体として用いているが、FD(Flexible Disk)等を記録媒体として用いることでも良い。また、プログラムのインストールに関しても、通信装置を介してネットワーク経由でプログラムをダウンロードしてインストールすることでも良い。   The computer configuration example of this example may also be a computer configuration without a keyboard or optical disk drive. In this example, an optical disk is used as a recording medium. However, an FD (Flexible Disk) or the like may be used as a recording medium. As for the program installation, the program may be downloaded and installed via a network via a communication device.

本発明に係るリモートメンテナンスシステムを設けたネットワークコンピュータシステムの構成例を示すブロック図である。It is a block diagram which shows the structural example of the network computer system which provided the remote maintenance system which concerns on this invention. 図1におけるリモートメンテナンスサーバの第1の処理動作例を示すフローチャートである。It is a flowchart which shows the 1st processing operation example of the remote maintenance server in FIG. 図1におけるリモートメンテナンスサーバの第2の処理動作例を示すフローチャートである。It is a flowchart which shows the 2nd processing operation example of the remote maintenance server in FIG. 図1におけるリモートメンテナンスサーバの第3の処理動作例を示すフローチャートである。7 is a flowchart illustrating a third processing operation example of the remote maintenance server in FIG. 1. 図1における監視情報データベースが記憶管理するテーブル構成例を示す説明図である。It is explanatory drawing which shows the example of a table structure which the monitoring information database in FIG. 1 memorize | stores and manages. 図1におけるデータベース処理部が記憶管理するソフトウェア情報テーブル構成例を示す説明図である。It is explanatory drawing which shows the example of a software information table structure which the database process part in FIG. 1 memorize | stores and manages. 図1におけるデータベース処理部が記憶管理するハードウェア情報テーブル構成例を示す説明図である。It is explanatory drawing which shows the example of a hardware information table structure which the database process part in FIG. 1 memorize | stores and manages. 図1における簡易メッセージデータベースが記憶管理するテーブル構成例(項目説明)を示す説明図である。It is explanatory drawing which shows the example of a table structure (item description) which the simple message database in FIG. 1 memorize | stores and manages. 図1における簡易メッセージデータベースが記憶管理するテーブル構成例(データ例)を示す説明図である。It is explanatory drawing which shows the example of a table structure (data example) which the simple message database in FIG. 1 memorize | stores and manages. 図1における監視情報データベースが記憶管理するテーブル構成例(項目説明)を示す説明図である。It is explanatory drawing which shows the example of a table structure (item description) which the monitoring information database in FIG. 1 memorize | stores and manages. 図1における監視情報データベースが記憶管理するテーブル構成例(データ例)を示す説明図である。It is explanatory drawing which shows the example of a table structure (data example) which the monitoring information database in FIG. 1 memorize | stores and manages. 図1における障害対応データベースが記憶管理するテーブル構成例を示す説明図である。It is explanatory drawing which shows the example of a table structure which the failure handling database in FIG. 1 memorize | stores and manages. 図1における通信端末の入出力画面例を示す説明図である。It is explanatory drawing which shows the example of an input / output screen of the communication terminal in FIG.

符号の説明Explanation of symbols

101:通信端末、101a:障害対応内容検索入力画面処理部、101b:障害対応内容検索出力画面処理部、102:インターネット、103:リモートメンテナンスサーバ、104:認証機能、104a:リモートアクセス・ログイン認証部、104b:ログイン方式選択機部、104c:U Terminal部、104d:Xサーバエミュレート部、104e:Wリモートコントロール部、105:リモートメンテナンス支援機能、105a:監視情報受信設定部、105b:障害情報一括収集部、105c:障害事例検索部、105d:障害メール配信部、106:リモートメンテナンス機能、107:リモートメンテナンス処理部、107a:メッセージ簡略化部、107b:障害対応内容表示部、107c:障害自動対応部、108:データベース処理部、108a:監視情報データベース、108b:簡易メッセージデータベース、108c:障害事例データベース、108d:障害対応データベース、109:アプリケーションサーバ、110:運用監視サーバ、110a:ノード監視部、110b:メッセージ監視部、110c:リソース監視部、501:項目説明(監視情報DB)、502:データ例(監視情報DB)、601:項目説明(ソフトウェア情報DB)、602:データ例(ソフトウェア情報DB)、701:項目説明(ハードウェア情報DB)、702:データ例(ハードウェア情報DB)、801:項目説明(簡易メッセージDB)、802,803:データ例(簡易メッセージDB)、901:項目説明(障害事例DB)、902〜904:データ例(障害事例DB)、1001:項目説明(障害対応DB)、1002,1003:データ例(障害対応DB)、1101:障害対応方針検索条件入力画面、1102:障害対応方針検索結果出力画面。   101: Communication terminal, 101a: Fault response content search input screen processing unit, 101b: Fault response content search output screen processing unit, 102: Internet, 103: Remote maintenance server, 104: Authentication function, 104a: Remote access / login authentication unit 104b: login method selection unit 104c: U Terminal unit 104d: X server emulation unit 104e: W remote control unit 105: remote maintenance support function 105a: monitoring information reception setting unit 105b: failure information batch Collection unit, 105c: Failure case search unit, 105d: Failure mail distribution unit, 106: Remote maintenance function, 107: Remote maintenance processing unit, 107a: Message simplification unit, 107b: Failure response content display unit, 107c: Automatic failure response Part 108: database processing unit, 108a: monitoring information database, 108b: simple message database, 108c: failure case database, 108d: failure handling database, 109: application server, 110: operation monitoring server, 110a: node monitoring unit, 110b: message Monitoring unit, 110c: Resource monitoring unit, 501: Item description (monitoring information DB), 502: Data example (monitoring information DB), 601: Item description (software information DB), 602: Data example (software information DB), 701 : Item description (hardware information DB), 702: Data example (hardware information DB), 801: Item description (simple message DB), 802, 803: Data example (simple message DB), 901: Item description (failure example) DB), 902-90 4: data example (failure case DB), 1001: item description (failure response DB), 1002, 1003: data example (failure response DB), 1101: failure response policy search condition input screen, 1102: failure response policy search result output screen.

Claims (8)

プログラムされたコンピュータ処理によって、監視対象の装置で発生した障害に関する情報を、ネットワークを介して接続された通信端末に通知するリモートメンテナンスシステムであって、
前記監視対象の装置から出力される情報に基づき当該装置の障害に関する情報である第1のメッセージ情報を出力する運用監視サーバと、
前記運用監視サーバからの第1のメッセージ情報を受信して記憶し、前記監視対象の装置で発生した障害に関する情報を前記通信端末に通知する機能を持つリモートメンテナンスサーバと、を有し、
前記リモートメンテナンスサーバにおいて、
プログラムされたコンピュータ処理を実行する手段として、
複数の監視対象の装置毎に、当該監視対象の装置から出力される情報に応じて前記運用監視サーバから出力される前記第1のメッセージ情報と、当該第1のメッセージ情報に対応付けて担当者により入力された第2のメッセージ情報及び当該障害に対する対応方針情報と、を記憶装置に記憶するメッセージ記憶処理手段と、
前記監視対象の装置から情報に応じた前記運用監視サーバからの前記第1のメッセージ情報を入力し、当該第1のメッセージ情報に対応付けられた前記第2のメッセージ情報及び前記対応方針情報を上記記憶装置から読み出すメッセージ処理手段と、
該メッセージ処理手段が読み出した前記第2のメッセージ情報及び前記対応方針情報と、当該監視対象の装置の識別情報とを含む情報を、前記通信端末に送信する配信処理手段とを有し、
前記通信端末の表示画面で、前記リモートメンテナンスサーバから送信された情報を表示可能であり、ユーザにより任意に前記第1のメッセージ情報に対して前記第2のメッセージ情報を簡易なメッセージ情報として登録可能であり、ユーザにより当該第2のメッセージ情報または対応する登録番号を用いて前記リモートメンテナンスサーバに対して情報検索可能であることを特徴とするリモートメンテナンスシステム。
A remote maintenance system for notifying a communication terminal connected via a network of information related to a failure that has occurred in a monitored device through programmed computer processing,
An operation monitoring server that outputs first message information that is information relating to a failure of the device based on information output from the device to be monitored;
Receiving and storing the first message information from the operation monitoring server, and having a function of notifying the communication terminal of information relating to a failure that has occurred in the monitored device, and a remote maintenance server,
In the remote maintenance server,
As a means of performing programmed computer processing,
For each of a plurality of monitored devices, charge associates with said first message information that is output from the operation monitoring server in accordance with the information that will be output from the apparatus of the monitoring target, to the first message information Message storage processing means for storing , in a storage device, second message information inputted by a person and countermeasure policy information for the failure;
The first type the message information, said second message information and the Policy information associated with the first message information from said operation monitoring server in accordance with the information from the monitored device Message processing means for reading from the storage device;
Said second message information and the corresponding policy information to the message processing means has read the information including the identification information of the monitored device, possess a distribution processing means for transmitting to the communication terminal,
Information transmitted from the remote maintenance server can be displayed on the display screen of the communication terminal, and the user can arbitrarily register the second message information as simple message information for the first message information. The remote maintenance system is characterized in that the user can retrieve information from the remote maintenance server using the second message information or the corresponding registration number .
請求項1に記載のリモートメンテナンスシステムであって、
前記リモートメンテナンスサーバにおいて、
プログラムされたコンピュータ処理を実行する手段として、
上記メッセージ記憶処理手段が記憶した前記第1及び第2のメッセージ情報に対応付けられた障害に対して実際に行われた障害対処内容を示す事例情報を前記記憶装置に記憶する障害事例記憶処理手段と、
上記メッセージ処理手段が読み出した前記第1及び第2のメッセージ情報に対応付けられた前記障害対処内容を示す事例情報を上記記憶装置から読み出す障害対応内容処理手段と、を有し、
該障害対応内容処理手段が読み出した事例情報を含む情報を、上記配信処理手段により前記通信端末に送信することを特徴とするリモートメンテナンスシステム。
The remote maintenance system according to claim 1,
In the remote maintenance server,
As a means of performing programmed computer processing,
Fault case storage processing means for storing case information indicating the actually performed the troubleshooting content to disorders associated with the first and second message information the message storage processing unit is stored in the storage device When,
The case information indicating the troubleshooting content which is correlated to said first and second message information the message processing means read anda failure dealing contents processing means for reading from the storage device,
Remote maintenance system and transmits the information including the case information that the failure corresponding contents processing unit read, to the communication terminal by the distribution processing unit.
請求項1に記載のリモートメンテナンスシステムであって、
前記リモートメンテナンスサーバにおいて、
プログラムされたコンピュータ処理を実行する手段として、
上記メッセージ記憶処理手段が記憶した前記第1、第2のメッセージ情報に対応付けられた障害に対して実際に行われた障害対処内容を示す事例情報を前記記憶装置に記憶する障害事例記憶処理手段と、
前記通信端末の表示画面でのユーザによる入力に基づいて上記通信端末から送信されてきたメッセージ情報または対応する登録番号を受信して、前記記憶装置の記憶情報から当該メッセージ情報または対応する登録番号に該当する前記第2のメッセージ情報を検索することにより、当該メッセージ情報に対応付けられた前記事例情報を含む情報を上記記憶装置から読み出す障害事例検索処理手段を有し、
該障害事例検索処理手段が読み出した事例情報を含む情報を、上記配信処理手段により前記通信端末に送信することを特徴とするリモートメンテナンスシステム。
The remote maintenance system according to claim 1,
In the remote maintenance server,
As a means of performing programmed computer processing,
The message storage processing said first means is stored, a second fault case storage processing means for storing case information in the storage device that indicates the actually performed the troubleshooting content to disorders associated with the message information When,
The message information or the corresponding registration number transmitted from the communication terminal is received based on the input by the user on the display screen of the communication terminal, and the message information or the corresponding registration number is stored from the storage information of the storage device. by searching the second message information applicable, has a failure case retrieval processing means for reading out information including the case information that is correlated to the message information from the storage device,
A remote maintenance system, wherein information including case information read by the failure case search processing means is transmitted to the communication terminal by the distribution processing means.
請求項1に記載のリモートメンテナンスシステムであって、
前記リモートメンテナンスサーバにおいて、
プログラムされたコンピュータ処理を実行する手段として、
前記監視対象の装置から出力される障害情報に応じた前記第1のメッセージ情報に対応付けられた当該障害を自動解決するための障害対応プログラム情報を前記記憶装置に記憶する障害対応情報記憶処理手段と、
前記監視対象の装置から出力された障害情報に応じた前記第1のメッセージ情報を入力し、当該第1のメッセージ情報に対応付けられた前記障害対応プログラム情報を上記記憶装置から読み出し、読み出した障害対応プログラム情報を当該監視対象の装置に対して実行して、当該監視対象の装置に対する障害回復処理を行う障害自動対応処理手段とを有することを特徴とするリモートメンテナンスシステム。
The remote maintenance system according to claim 1 ,
In the remote maintenance server,
As a means of performing programmed computer processing,
Fault correspondence information storage for storing a failure response program information for automatically solving those 該障 harm associated with said first message information corresponding to the failure information output from the monitoring target device in the storage device Processing means;
The type of the first message information corresponding to the failure information output from the monitored device, reads the failure dealing program information associated with the first message information from the memory device, the read failure remote maintenance system, characterized in that it comprises running a supported program information with respect to the monitored device, and a failure automatic response processing means for performing failure recovery processing for the monitored device.
請求項1に記載のリモートメンテナンスシステムであって、
前記監視対象の装置はアプリケーションサーバからなり、
前記運用監視サーバは、前記アプリケーションサーバから出力される情報に基づき、前記アプリケーションサーバに対するノード監視、メッセージ監視、及びリソース監視の処理を行い、当該監視に応じた障害メッセージ情報である前記第1のメッセージ情報を前記リモートメンテナンスサーバへ送信し、
上記監視対象の装置から出力される情に応じた前記第1のメッセージ情報および上記メッセージ記憶処理手段が記憶装置に記憶する前記第2のメッセージ情報は、当該監視対象の装置毎のハードウェア構成情報及びソフトウェア構成情報に関係付けられ、
前記リモートメンテナンスサーバにおいて、前記監視対象の装置毎に、前記第1及び第2のメッセージ情報に対応付けて、前記ハードウェア構成情報及びソフトウェア構成情報を前記記憶装置に記憶し、
前記通信端末の表示画面で、前記リモートメンテナンスサーバから送信された情報として、前記第1及び第2のメッセージ情報に対応付けられた前記ハードウェア構成及びソフトウェア構成情報を表示可能であることを特徴とするリモートメンテナンスシステム。
The remote maintenance system according to claim 1 ,
The monitored device comprises an application server,
The operation monitoring server performs processing of node monitoring, message monitoring, and resource monitoring for the application server based on information output from the application server, and the first message that is failure message information corresponding to the monitoring Send information to the remote maintenance server,
Said second message information the first message information and the message storage processing unit according to the information that will be output from the monitored devices stored in the storage device, a hardware configuration of each apparatus of the monitoring target related to the information and software configuration information,
In the remote maintenance server, the hardware configuration information and the software configuration information are stored in the storage device in association with the first and second message information for each device to be monitored,
The hardware configuration and software configuration information associated with the first and second message information can be displayed as information transmitted from the remote maintenance server on the display screen of the communication terminal. Remote maintenance system.
請求項に記載のリモートメンテナンスシステムであって、
上記ネットワークはインターネットであり、
上記配信処理手段は電子メール機能により前記通知の各情報を上記インターネットで接続された前記通信端末に送信し、
前記通信端末の表示画面で、障害対応方針の検索条件となる情報として前記第2のメッセージ情報に相当するメッセージ情報または対応する登録番号をユーザにより入力可能であり、当該検索条件による検索結果の情報として、前記障害事例が存在する場合の事例情報として、障害発生日時、監視対象の装置の識別情報、前記第1のメッセージ情報、前記第2のメッセージ情報、監視対象の装置のハードウェア構成情報及びソフトウェア構成情報、障害原因情報、障害対処内容情報、を含む情報を表示することを特徴とするリモートメンテナンスシステム。
The remote maintenance system according to claim 2 ,
The network is the Internet,
The above distribution processing means of each information of the notification transmitted to the communication terminal connected with the Internet by e-mail function,
On the display screen of the communication terminal, message information corresponding to the second message information or a corresponding registration number can be input by the user as information serving as a search condition for the failure response policy, and information on search results based on the search condition As the case information when the failure case exists, the failure occurrence date and time, the identification information of the monitoring target device, the first message information, the second message information, the hardware configuration information of the monitoring target device, and A remote maintenance system that displays information including software configuration information, failure cause information, and troubleshooting information .
コンピュータを、請求項1から請求項6のいずれかに記載のリモートメンテナンスシステムにおける各手段として機能させるためのプログラム。   The program for functioning a computer as each means in the remote maintenance system in any one of Claims 1-6. プログラムされたコンピュータ処理によって、監視対象の装置で発生した障害に関する情報を、ネットワークを介して接続された通信端末に通知するシステムのリモートメンテナンス方法であって、
プログラムされたコンピュータ処理実行手順として、
請求項1から請求項6のいずれかに記載のリモートメンテナンスシステムにおける各手段による処理手順を含むことを特徴とするリモートメンテナンス方法。
A system remote maintenance method for notifying a communication terminal connected via a network of information related to a failure that has occurred in a monitored device by programmed computer processing,
As a programmed computer processing execution procedure,
The remote maintenance method characterized by including the process sequence by each means in the remote maintenance system in any one of Claims 1-6.
JP2008230412A 2008-09-09 2008-09-09 Remote maintenance system and method and program Expired - Fee Related JP4918669B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008230412A JP4918669B2 (en) 2008-09-09 2008-09-09 Remote maintenance system and method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008230412A JP4918669B2 (en) 2008-09-09 2008-09-09 Remote maintenance system and method and program

Publications (2)

Publication Number Publication Date
JP2010066840A JP2010066840A (en) 2010-03-25
JP4918669B2 true JP4918669B2 (en) 2012-04-18

Family

ID=42192401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008230412A Expired - Fee Related JP4918669B2 (en) 2008-09-09 2008-09-09 Remote maintenance system and method and program

Country Status (1)

Country Link
JP (1) JP4918669B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10514974B2 (en) 2015-02-17 2019-12-24 Nec Corporation Log analysis system, log analysis method and program recording medium
JP7143762B2 (en) * 2018-12-28 2022-09-29 オムロン株式会社 Controller system, control device and control program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001184233A (en) * 1999-12-22 2001-07-06 Komu Square:Kk Remote maintenance system and remote maintenance method, and recording medium with remote maintenance program recorded thereon
JP2003323405A (en) * 2002-05-02 2003-11-14 Itmanage Inc Application server monitoring system
JP4689963B2 (en) * 2004-02-12 2011-06-01 Necフィールディング株式会社 Computer remote diagnosis and repair system, server, program, and method
JP2008040750A (en) * 2006-08-04 2008-02-21 Toshiba Corp Remote monitoring control device and system

Also Published As

Publication number Publication date
JP2010066840A (en) 2010-03-25

Similar Documents

Publication Publication Date Title
CN101567807B (en) Knowledge-based failure recovery support system
KR950010833B1 (en) Automated enrollement of a computer system into a service network of computer systems
JP2002108728A (en) Method for inserting fault information and provider facility
JP2015517152A (en) System, method, apparatus, and computer program product for providing mobile device support service
JP6095140B2 (en) Remote monitoring system, remote monitoring method, and program
US20140006600A1 (en) Remote notification and action system
KR100947740B1 (en) System and method for monitoring event in computing network and event management apparatus
JP5198154B2 (en) Fault monitoring system, device, monitoring apparatus, and fault monitoring method
US20050038888A1 (en) Method of and apparatus for monitoring event logs
JP2007241872A (en) Program for monitoring change in computer resource on network
US20170017561A1 (en) Software detection method and device
JP4641714B2 (en) Remote monitoring system
CN102457777B (en) A kind of TV network problem hierarchical processing method, treatment system and TV
JP4918669B2 (en) Remote maintenance system and method and program
JP6015750B2 (en) Log collection server, log collection system, and log collection method
CN112488325A (en) Operation and maintenance work order processing method and device, computer equipment and storage medium
JP2007241873A (en) Program for monitoring change in computer resource on network
US10466984B2 (en) Identifying and associating computer assets impacted by potential change to a particular computer asset
JP5088738B2 (en) Fault monitoring apparatus, fault monitoring method, and program therefor
JP2017220107A (en) Apparatus setting device, apparatus setting method, and program
KR20050058772A (en) System and method for providing internet failure management using wire and wireless network
JP2011170458A (en) Monitoring system and monitoring method
JP3737503B2 (en) Monitoring system, monitoring method and program thereof
CN115484174B (en) Intelligent recognition-based nano tube method, device, equipment and storage medium
JP5492031B2 (en) Work management system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110216

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111228

R150 Certificate of patent or registration of utility model

Ref document number: 4918669

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees