JP2006259891A - System operation management support device, method and program - Google Patents

System operation management support device, method and program Download PDF

Info

Publication number
JP2006259891A
JP2006259891A JP2005073611A JP2005073611A JP2006259891A JP 2006259891 A JP2006259891 A JP 2006259891A JP 2005073611 A JP2005073611 A JP 2005073611A JP 2005073611 A JP2005073611 A JP 2005073611A JP 2006259891 A JP2006259891 A JP 2006259891A
Authority
JP
Japan
Prior art keywords
failure
screen
handling
information
operator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005073611A
Other languages
Japanese (ja)
Other versions
JP4617937B2 (en
Inventor
Teruya Ikegami
輝哉 池上
Kiyoshi Kato
清志 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005073611A priority Critical patent/JP4617937B2/en
Publication of JP2006259891A publication Critical patent/JP2006259891A/en
Application granted granted Critical
Publication of JP4617937B2 publication Critical patent/JP4617937B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To separate fault analysis from fault solution. <P>SOLUTION: A system state monitoring portion 2 outputs the information on symptoms generated in a managing object system to a fault-solving operation control portion 31. The fault-solving operation control portion 31 displays a series of screens, including a screen displaying the information on fault and a screen for encouraging an operator to select the contents of fault solution on an input/output device 1, in response to the operation performed on the input/output device 1. A solution history information recording managing portion 32 records various logs in a fault information storing portion 5, in response to the operation by an operator who executes fault solution. A fault-analyzing operation control portion 41 creates a series of screens, including a screen displaying the information of a list of past faults and a screen displaying the logs relating to each operation executed in solving the fault and makes the same output to the input/output device 1. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、管理対象システムに生じた障害に対する対処や分析を支援するシステム運用管理支援装置、システム運用管理支援方法、システム運用管理支援プログラム、およびシステム運用管理支援装置に適用される障害対処装置、障害分析装置に関する。   The present invention relates to a system operation management support apparatus, a system operation management support method, a system operation management support program, and a failure response apparatus applied to a system operation management support apparatus, which support the handling and analysis of a failure that has occurred in a managed system. The present invention relates to a failure analysis apparatus.

エンドユーザに向けて何らかのサービスを提供している等、規定時間内の安定した稼動を要求されるシステムにおいて、サービスに支障をきたす何らかの障害(負荷の一時的増大や機能停止、ウイルス侵入などを総じて「障害」と呼称する。)が発生した際には、障害分析よりも先ず障害対処が重要となることが多い。障害分析は、障害の発生原因の特定、システム構成変更等の根本的な解決、次に類似した障害発生時の対処策を定めるといった作業である。一方、障害対処は、応急処置的な復旧・回避策により提供できるサービスレベルを維持する作業である。なお、障害分析を単に分析と記し、障害対処を単に対処と記す場合もある。   In a system that requires stable operation within a specified time, such as providing some services to end users, any trouble that interferes with services (temporary increase in load, function stop, virus intrusion, etc.) When a failure occurs), the failure handling is often more important than the failure analysis. The failure analysis is a task of identifying the cause of the failure, fundamental solution such as system configuration change, and then determining a similar countermeasure when a failure occurs. On the other hand, coping with a failure is an operation for maintaining a service level that can be provided by first-aid recovery and avoidance measures. In some cases, failure analysis is simply referred to as analysis, and failure handling is simply referred to as handling.

管理対象とするシステムに発生した障害対処や分析を行う従来の運用管理支援ソフトウェアとして、例えば、日本ヒューレット・パッカード株式会社の“OpenView/ServiceDesk(製品名)”がある。この製品では、障害対処と障害分析のそれぞれのプロセスを実行するための操作画面を提供する。そして、いずれかのプロセス中に、別プロセスの操作画面に切り替えることや、大量に存在するシステムに関する情報の参照画面に切り替えることを可能としている。“OpenView/ServiceDesk(製品名)”は、非特許文献1で紹介されている。また、この製品のマニュアルは、Webサイトである非特許文献2からダウンロード可能である。   For example, “OpenView / ServiceDesk (product name)” of Hewlett-Packard Co., Ltd. is known as a conventional operation management support software that performs troubleshooting and analysis on a system to be managed. This product provides an operation screen for executing each process of troubleshooting and failure analysis. Then, during any one of the processes, it is possible to switch to an operation screen of another process, or to switch to a reference screen for information relating to a large amount of systems. “OpenView / ServiceDesk (product name)” is introduced in Non-Patent Document 1. The manual of this product can be downloaded from Non-Patent Document 2, which is a website.

“ServiceDesk”、[online]、日本ヒューレット・パッカード株式会社、[平成17年3月1日検索]、インターネット<URL:http://h50146.www5.hp.com/products/software/management/openview/lineup/sd/index.html>“Service Desk”, [online], Hewlett-Packard Japan, [March 1, 2005 search], Internet <URL: http://h50146.www5.hp.com/products/software/management/openview/ lineup / sd / index.html> “ServiceDeskマニュアル”、[online]、日本ヒューレット・パッカード株式会社、[平成17年3月2日検索]、インターネット<URL:http://h50146.www5.hp.com/doc/manual/openview/sd.html>"Service Desk Manual", [online], Hewlett-Packard Japan, [March 2, 2005 search], Internet <URL: http://h50146.www5.hp.com/doc/manual/openview/sd .html>

操作者が、障害対処を行っているときに障害分析用の画面に遷移可能であるとすると、その画面上で障害分析において行うべき操作をしてしまうことがある。逆に、障害分析を行っているときに障害対処用の画面に遷移可能であるとすると、その画面上で障害対処において行うべき操作をしてしまうことがある。このように、障害対処と障害分析のいずれか一方を行っているときに、他方の操作において用いる画面に遷移可能とすると、障害対処と障害分析のどちらを目的として作業を行っているかという操作者の目的意識が薄れ、作業が横道に逸れてしまうおそれがある。そのため、障害分析と障害対処とを分離することが好ましい。   If the operator can transition to the failure analysis screen while handling a failure, the operator may perform an operation to be performed in the failure analysis on the screen. On the other hand, if it is possible to transition to a failure handling screen during failure analysis, an operation to be performed in troubleshooting may be performed on the screen. In this way, when one of fault handling and fault analysis is performed, if it is possible to transition to the screen used in the other operation, the operator who is working for fault handling or fault analysis There is a risk that the purpose will be diminished and the work may be diverted. Therefore, it is preferable to separate failure analysis and failure handling.

また、障害分析の結果が障害対処作業に反映され、障害対処を効率的に行えるようにすることが好ましい。   Further, it is preferable that the result of the failure analysis is reflected in the failure handling work so that the failure handling can be performed efficiently.

また、障害対処において有効な情報が何であるかを操作者が判別することは一般的に困難である。例えば、有効な情報を参照するまでに無用な情報を参照したり、参照画面の階層を深く辿っていく必要があったりして、有効な情報をすぐに参照することが困難である場合が多い。   In addition, it is generally difficult for an operator to determine what information is effective in troubleshooting. For example, it is often difficult to refer to valid information immediately because it is necessary to refer to useless information before referring to valid information or to go deeper in the hierarchy of the reference screen. .

そこで、本発明は、障害分析と障害対処とを分離できるようにすることを目的とする。換言すれば、障害対処時には、障害対処用画面間で画面遷移を行い、障害分析時には障害分析用画面間で画面遷移を行えるようにすることを目的とする。ただし、障害対処時と障害分析時それぞれに、同内容の情報を提供する画面を表示することを禁止するものではない(障害対処用画面間と障害分析用画面の中に共通する画面があってもよい)。   Therefore, an object of the present invention is to enable separation of failure analysis and failure handling. In other words, an object is to perform screen transition between failure handling screens when dealing with a failure, and to perform screen transition between failure analysis screens when analyzing a failure. However, it is not prohibited to display a screen that provides the same information at the time of troubleshooting and at the time of failure analysis (there are common screens between failure troubleshooting screens and failure analysis screens). Also good).

また、本発明は、障害対処を効率的に行えるようにすることを目的とする。   It is another object of the present invention to efficiently handle a failure.

本発明によるシステム運用管理支援装置は、管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段と、少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示するとともに操作者による操作の情報を収集する障害対処支援手段と、前記障害対処支援手段が収集した操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを前記障害情報記憶手段に記憶させる対処履歴情報記録管理手段と、前記障害情報記憶手段に記憶された情報に基づいて、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示する障害分析支援手段とを備えたことを特徴とする。   The system operation management support apparatus according to the present invention includes failure information storage means for storing classification information of symptoms of a failure that has occurred in a managed system and a log of coping operations performed on the failure, and at least information on the failure that has occurred. A failure handling support means for displaying a series of screens including a screen to be displayed and a screen for prompting the operator to select the content of failure handling, and collecting information on operations by the operator, and the failure handling support means collected Based on information on operations performed by the operator, handling history information record management means for storing in the fault information storage means a log relating to individual operations performed at the time of handling the fault by the operator, and stored in the fault information storage means Based on the information, at least a screen that displays a list of each failure that occurred in the past, and a log about each operation that was performed during the troubleshooting Characterized by comprising a failure analysis support means for displaying a series of screens including the screen.

そのような構成によれば、障害対処支援手段が、少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示し、障害分析支援手段が、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示する。従って、障害対処作業を行う作業者に対しては、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面に沿って、障害対処作業を行わせることができ、障害分析作業を行う作業者に対しては、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面に沿って、障害分析作業を行わせることができる。そのため、作業者に、対処作業を行っているのか、分析作業を行っているのかを明確に意識させることができる。よって、障害分析作業と障害対処作業とを分離することができる。そして、対処履歴情報記録管理手段が、障害対処支援手段が収集した操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを障害情報記憶手段に記憶させ、障害分析支援手段が、障害情報記憶手段に記憶された情報に基づいて、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示する。従って、対処作業を行った操作者の操作を分析者に提示して、分析を行わせることができる。   According to such a configuration, the failure handling support means displays a series of screens including at least a screen that displays information on the failure that has occurred and a screen that prompts the operator to select the content of the failure handling. The analysis support means displays a series of screens including at least a screen that displays a list of each failure that has occurred in the past and a screen that displays a log regarding each operation performed at the time of handling the failure. Therefore, for a worker who performs trouble-shooting work, the trouble-handling work is performed along a series of screens including a screen that displays information on the trouble that has occurred and a screen that prompts the operator to select the content of the trouble-handling. For a worker who performs failure analysis work, a screen that displays a list of each failure that has occurred in the past, and a screen that displays a log of each operation that was performed during troubleshooting Failure analysis work can be performed along a series of screens including Therefore, it is possible to make the worker clearly aware whether the coping work is being performed or the analysis work is being performed. Therefore, the failure analysis work and the failure handling work can be separated. Then, the handling history information record management means stores, in the fault information storage means, a log relating to each operation performed at the time of handling the fault by the operator based on the operation information collected by the fault handling support means. Based on the information stored in the failure information storage unit, the failure analysis support unit displays a series of screens including a screen for displaying a log regarding each operation performed at the time of handling the failure. Therefore, the operation of the operator who has performed the coping work can be presented to the analyst and analyzed.

管理対象システムに生じた障害の症状および前記障害に対する障害対処の状況を監視し、監視した症状や障害対処の状況を障害対処支援手段に出力するシステム状態監視手段を備え、障害対処支援手段が、前記システム状態監視手段によって出力された障害の症状や障害対処の状況を、発生した障害の情報を表示する画面内で表示する構成であってもよい。   The system includes a system state monitoring unit that monitors a symptom of a failure that has occurred in the managed system and a status of troubleshooting for the failure, and outputs the monitored symptom and the status of troubleshooting to the troubleshooting support unit. The system may be configured to display a failure symptom output by the system state monitoring unit and a failure handling status in a screen that displays information on the failure that has occurred.

そのような構成によれば、障害対処支援手段が、システム状態監視手段によって出力された障害の症状や障害対処の状況を、発生した障害の情報を表示する画面内で表示するので、障害が発生したことや障害対処の状況を操作者に知らせることができる。   According to such a configuration, the failure handling support unit displays the failure symptom and the status of the failure handling output by the system state monitoring unit in the screen displaying the information of the failure that has occurred. The operator can be informed of the situation and the status of trouble handling.

対処履歴情報記録管理手段が、操作中断を示す情報が障害対処支援手段によって収集されたときに、中断された操作に対応するログを障害情報記憶手段から削除する構成であってもよい。   The response history information record management unit may be configured to delete the log corresponding to the interrupted operation from the failure information storage unit when information indicating operation interruption is collected by the failure response support unit.

そのような構成によれば、途中で中断されてしまったために分析を行う操作者に提示する必要がないログを排除することができるので、分析作業を効率的に行わせることができる。   According to such a configuration, it is possible to eliminate a log that does not need to be presented to an operator who performs analysis because it has been interrupted in the middle, so that the analysis work can be performed efficiently.

障害分析支援手段が、操作者による操作に応じて、未知の障害として分類されていた症状が既知の障害として分類されるように、障害情報記憶手段によって記憶される分類情報を更新し、障害対処支援手段が、分類情報を参照することにより、発生した障害の情報を表示する画面内で、管理対象システムに生じた症状が分類される障害を表示する構成であってもよい。   The failure analysis support means updates the classification information stored by the failure information storage means so that the symptoms classified as unknown failures are classified as known failures according to the operation by the operator, and handles the failure. The support unit may be configured to display a failure in which a symptom that has occurred in the managed system is classified in a screen that displays information on the failure that has occurred by referring to the classification information.

そのような構成によれば、障害対処支援手段が、管理対象システムに生じた症状が分類される障害として、既知の障害を表示することができるので、操作者に障害対処作業を効率的に行わせることができる。   According to such a configuration, the failure handling support means can display a known failure as a failure classified as a symptom occurring in the managed system, so that the operator can efficiently perform the failure handling work. Can be made.

障害対処支援手段が表示する画面の表示態様を規定する操作画面ルールを記憶する操作画面ルール記憶手段と、障害対処支援手段によって画面を指定され、当該画面に応じた操作画面ルールを参照して指定された画面を生成する障害対処操作画面生成手段とを備え、障害分析支援手段が、操作者による操作に応じて、操作画面ルール記憶手段が記憶する操作画面ルールを更新する構成であってもよい。   The operation screen rule storage means for storing the operation screen rule that defines the display mode of the screen displayed by the trouble handling support means, the screen is designated by the trouble handling support means, and the operation screen rule corresponding to the screen is designated. A failure handling operation screen generation unit that generates a displayed screen, and the failure analysis support unit may update the operation screen rule stored in the operation screen rule storage unit in response to an operation by the operator. .

そのような構成によれば、操作画面ルールを更新することができるので、障害対処支援手段が表示する画面の表示態様を、より効率的に障害対処作業を行えるように変更することができる。そのため、障害対処作業を効率化することができる。   According to such a configuration, since the operation screen rule can be updated, the display mode of the screen displayed by the failure handling support means can be changed so that the failure handling work can be performed more efficiently. Therefore, it is possible to improve the efficiency of the trouble handling work.

障害分析支援手段が、操作画面ルールの編集画面であって、画面遷移を指示するボタンを新規に表示させるための操作画面ルール編集操作に制約が設けられた編集画面を表示して、操作画面ルールの編集操作を促す構成であってもよい。   If the failure analysis support means is an operation screen rule editing screen, an operation screen rule for restricting the operation screen rule editing operation for newly displaying a button for instructing screen transition is displayed. It may be configured to prompt the editing operation.

そのような構成によれば、画面遷移を指示するボタンを新規に表示させることに制約が設けられる。その結果、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示するという動作に変更が加えられることがなく、障害分析作業と障害対処作業とを分離する運用形態を確実に維持することができる。   According to such a configuration, there is a restriction on newly displaying a button for instructing screen transition. As a result, there is no change to the operation of displaying a series of screens including a screen that displays information on the failure that has occurred and a screen that prompts the operator to select the content of the failure handling. It is possible to reliably maintain an operation mode that separates the troubleshooting operation.

操作画面ルール記憶手段は、障害対処支援手段が表示する画面の表示態様を規定する操作画面ルールとともに、障害分析支援手段が表示する画面の表示態様を規定する操作画面ルールを記憶し、障害分析支援手段によって画面を指定され、当該画面に応じた操作画面ルールを参照して指定された画面を生成する障害分析操作画面生成手段を備え、障害分析支援手段は、操作者による操作に応じて、操作画面ルール記憶手段が記憶する操作画面ルールを更新する構成であってもよい。   The operation screen rule storage unit stores an operation screen rule that defines a display mode of the screen displayed by the failure analysis support unit, together with an operation screen rule that defines a display mode of the screen displayed by the failure handling support unit. A failure analysis operation screen generation unit that generates a specified screen by referring to an operation screen rule corresponding to the screen, and the failure analysis support unit operates according to the operation by the operator. The configuration may be such that the operation screen rule stored by the screen rule storage means is updated.

そのような構成によれば、操作画面ルールを更新することができるので、障害分析支援手段が表示する画面の表示態様を、より効率的に障害分析作業を行えるように変更することができる。そのため、障害分析作業を効率化することができる。   According to such a configuration, since the operation screen rule can be updated, the display mode of the screen displayed by the failure analysis support means can be changed so that the failure analysis work can be performed more efficiently. Therefore, the failure analysis work can be made efficient.

また、本発明によるシステム運用管理支援方法は、障害情報記憶手段が、管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶し、障害対処支援手段が、少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示するとともに操作者による操作の情報を収集し、対処履歴情報記録管理手段が、前記障害対処支援手段が収集した操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを前記障害情報記憶手段に記憶させ、障害分析支援手段が、前記障害情報記憶手段に記憶された情報に基づいて、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示することを特徴とする。   Further, in the system operation management support method according to the present invention, the failure information storage means stores classification information on the symptoms of the failure that has occurred in the managed system and a log of the work to be performed on the failure, and the failure response support means A series of screens including at least a screen that displays information on the failure that has occurred and a screen that prompts the operator to select the content of the failure handling are displayed, and information on the operation by the operator is collected, and history information is recorded Based on the operation information collected by the failure handling support means by the operator, the management means stores in the failure information storage means a log related to each operation performed at the time of handling the failure by the operator, and the failure analysis support means However, based on the information stored in the failure information storage means, at least a screen for displaying a list of each failure that has occurred in the past, and an individual screen that was used when dealing with the failure And displaying a series of screens including a screen for displaying logs of operations.

また、本発明による障害対処装置は、管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段に対するアクセスが可能な障害対処装置であって、少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示装置に出力するとともに、前記表示装置での操作者による操作の情報を収集する障害対処操作制御手段と、前記障害対処操作制御手段が収集した操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを前記障害情報記憶手段に記憶させる対処履歴情報記録管理手段とを備えたことを特徴とする。   The fault handling apparatus according to the present invention is a fault handling apparatus capable of accessing fault information storage means for storing classification information of fault symptoms occurring in a managed system and a log of handling work performed on the fault. In addition, a series of screens including at least a screen for displaying information on the fault that has occurred and a screen for prompting the operator to select the content of the fault handling are output to the display device, and an operation by the operator on the display device is performed. The failure handling operation control means for collecting information on the operation, and a log relating to each operation performed at the time of handling the fault by the operator based on the operation information by the operator collected by the fault handling operation control means. And a handling history information record management means stored in the means.

また、本発明による障害分析装置は、管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段に対するアクセスが可能な障害分析装置であって、前記障害情報記憶手段に記憶された情報に基づいて、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示装置に出力する障害分析操作制御手段を備えたことを特徴とする。   Further, the failure analysis apparatus according to the present invention is a failure analysis apparatus capable of accessing the failure information storage means for storing the classification information of the symptom of the failure that has occurred in the managed system and the log of the coping work performed on the failure. Based on the information stored in the failure information storage means, at least a screen that displays a list of each failure that has occurred in the past, and a screen that displays a log regarding each operation performed at the time of handling the failure A failure analysis operation control means for outputting a series of screens including the display to a display device is provided.

また、本発明によるシステム運用管理支援プログラムは、管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段に対するアクセスが可能なコンピュータに搭載されるシステム運用管理支援プログラムであって、前記コンピュータに、少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示装置に出力するとともに、前記表示装置での操作者による操作の情報を収集する障害対処操作制御処理、および前記障害対処操作制御処理で収集された操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを前記障害情報記憶手段に記憶させる対処履歴情報記録管理処理を実行させることを特徴とする。   Also, the system operation management support program according to the present invention is installed in a computer that can access the failure information storage means for storing the classification information of the symptom of the failure that has occurred in the managed system and the log of the work to be performed for the failure. A system operation management support program that is displayed on the display device, and includes a series of screens including at least a screen for displaying information on the fault that has occurred and a screen for prompting the operator to select the content of the fault handling. The failure handling operation control process for collecting the operation information by the operator on the display device and the operation information by the operator collected in the failure handling operation control process, and the handling of the trouble by the operator The management history information record management process for storing the log relating to each operation performed at times in the failure information storage means is executed. Characterized in that to.

また、本発明によるシステム運用管理支援プログラムは、管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段に対するアクセスが可能なコンピュータに搭載されるシステム運用管理支援プログラムであって、前記コンピュータに、前記障害情報記憶手段に記憶された情報に基づいて、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示装置に出力する障害分析操作制御処理を実行させることを特徴とする。   Also, the system operation management support program according to the present invention is installed in a computer that can access the failure information storage means for storing the classification information of the symptom of the failure that has occurred in the managed system and the log of the work to be performed for the failure. A system operation management support program that is displayed on the computer on the basis of information stored in the failure information storage means, and displays at least a list information of each failure that has occurred in the past. A failure analysis operation control process for outputting a series of screens including a screen for displaying a log regarding each individual operation to a display device is executed.

本発明によれば、作業者に、対処作業を行っているのか、分析作業を行っているのかを明確に意識させ、障害分析作業と障害対処作業とを分離することができる。また、障害対処作業を効率化することができる。   According to the present invention, it is possible to make the operator clearly conscious of whether a coping operation or an analysis operation is performed, and to separate the failure analysis operation and the failure coping operation. In addition, trouble handling work can be made more efficient.

以下、本発明を実施するための最良の形態を図面を参照して説明する。   The best mode for carrying out the present invention will be described below with reference to the drawings.

実施の形態1.
図1は、本発明の第1の実施の形態を示すブロック図である。第1の実施の形態におけるシステム運用管理支援装置は、入出力装置1と、システム状態監視部2と、障害対処プロセス制御部3と、障害分析プロセス制御部4と、障害情報保存部5とを備える。更に、障害対処プロセス制御部3は、障害対処操作制御部31と、対処履歴情報記録管理部32とを備える。更に、障害分析プロセス制御部4は、障害分析操作制御部41を備える。
Embodiment 1 FIG.
FIG. 1 is a block diagram showing a first embodiment of the present invention. The system operation management support apparatus according to the first embodiment includes an input / output device 1, a system state monitoring unit 2, a failure handling process control unit 3, a failure analysis process control unit 4, and a failure information storage unit 5. Prepare. The failure handling process control unit 3 further includes a failure handling operation control unit 31 and a handling history information record management unit 32. Further, the failure analysis process control unit 4 includes a failure analysis operation control unit 41.

本実施の形態では、特に障害対処操作制御部31と、対処履歴情報記録管理部32と、障害分析操作制御部41とが重要な役割を果たす。障害対処操作制御部31が生成する障害対処のための画面(障害対処に用いられる一連の画面)による各種ログを対処履歴記録管理部32が記録する。そして、対処を行った操作者とは異なる操作者が、ログを参照しつつ分析を行う。このとき、障害分析操作制御部41が、障害分析に用いられる一連の画面を提示する。   In the present embodiment, the failure handling operation control unit 31, the handling history information record management unit 32, and the failure analysis operation control unit 41 play an important role. The response history record management unit 32 records various logs generated by the failure handling operation control unit 31 on the screen for troubleshooting (a series of screens used for troubleshooting). Then, an operator who is different from the operator who has dealt with performs analysis while referring to the log. At this time, the failure analysis operation control unit 41 presents a series of screens used for failure analysis.

入出力装置1は、例えば、キーボードやマウス等の入力装置を備えたパーソナルコンピュータ(PC)とディスプレイ装置とによって実現される。入出力装置1は、操作者が障害対処業務を実行する際に、障害対処操作制御部31が生成する画面を表示し、また、操作者による操作やその操作により入力される情報を障害対処操作制御部31に出力する。また、入出力装置1は、操作者が障害分析業務を実行する際に、障害分析操作制御部41が生成する画面を表示し、操作者による操作やその操作により入力される情報を障害分析操作制御部41に出力する。なお、入出力装置1は、画面をウィンドウとして表示するので、画面のことをウィンドウと記す場合がある。また、障害対処を行う操作者と、障害分析を行う操作者とは異なる者であることが一般的である。例えば、障害分析を行う操作者は、システム運用の権限を有する管理者であることが多い。   The input / output device 1 is realized by, for example, a personal computer (PC) including an input device such as a keyboard and a mouse and a display device. The input / output device 1 displays a screen generated by the failure handling operation control unit 31 when the operator executes a failure handling job, and also performs an operation by the operator and information input by the operation as a failure handling operation. Output to the control unit 31. Further, the input / output device 1 displays a screen generated by the failure analysis operation control unit 41 when the operator performs the failure analysis operation, and performs the failure analysis operation on the operation by the operator and information input by the operation. Output to the control unit 41. Since the input / output device 1 displays the screen as a window, the screen may be referred to as a window. In general, the operator who deals with the failure and the operator who performs the failure analysis are different people. For example, an operator who performs failure analysis is often an administrator who has authority to operate the system.

なお、ここでは、システム状態監視部2と、障害対処プロセス制御部3と、障害分析プロセス制御部4とが、入出力装置1となるPCとは別の情報処理装置である場合を例に説明する。ただし、入出力装置1となるPCと、システム状態監視部2および障害対処プロセス制御部3とが同一の情報処理装置として構成されていてもよい。また、システム状態監視部2および障害対処プロセス制御部3が同一の情報処理装置として構成され、入出力装置1となるPCがその情報処理装置とは別の装置として備えられる構成であってもよい。   Here, a case where the system state monitoring unit 2, the failure handling process control unit 3, and the failure analysis process control unit 4 are information processing devices different from the PC that is the input / output device 1 will be described as an example. To do. However, the PC serving as the input / output device 1, the system state monitoring unit 2, and the failure handling process control unit 3 may be configured as the same information processing device. Further, the system state monitoring unit 2 and the failure handling process control unit 3 may be configured as the same information processing apparatus, and the PC serving as the input / output device 1 may be configured as a separate device from the information processing apparatus. .

システム状態監視部2は、管理対象とするシステムの状態(特定のモジュールが発行するイベントや、ping応答、CPU負荷等)を常に監視し、規定の症状と一致あるいは閾値を超えた場合に、障害が発生したとみなし、障害を検知した箇所とあわせて障害対処操作制御部31に出力する。更にシステム状態監視部2は、一度検知した障害への対処状況(誰が対処しているのか、対処の成否等)についても監視し、障害対処操作制御部31に出力する。   The system status monitoring unit 2 constantly monitors the status of the system to be managed (events issued by a specific module, ping response, CPU load, etc.), and if a specified symptom matches or exceeds a threshold, Is output to the failure handling operation control unit 31 together with the location where the failure is detected. Furthermore, the system state monitoring unit 2 also monitors the status of handling a fault once detected (who is handling it, success / failure of the handling, etc.) and outputs it to the fault handling operation control unit 31.

障害情報保存部5は、障害の分類定義や過去に発生した障害に関する情報を保持する。具体的には、障害情報保存部5は、障害の分類を示す障害分類情報と、障害の発生履歴を示す障害履歴と、障害対処を行った操作者がどのような対処を行ったかを示す障害対処ログと、障害対処を行った操作者による個々の操作内容を示す操作ログを記録する。以下、障害情報保存部5が記憶する各情報について説明する。   The failure information storage unit 5 holds information related to failure classification definitions and failures that occurred in the past. Specifically, the failure information storage unit 5 includes failure classification information indicating a failure classification, a failure history indicating a failure occurrence history, and a failure indicating how the operator who has dealt with the failure has dealt with. Record a response log and an operation log indicating the details of each operation performed by the operator who has handled the failure. Hereinafter, each piece of information stored in the failure information storage unit 5 will be described.

図2は、障害分類情報の例を示す説明図である。障害分類情報では、システム状態監視部2が検知し障害と判定したシステムの症状ごとに、どのような障害分類に属するのかやコメントが設定される。また、障害分類情報は、各症状に対応する障害IDも含んでいる。例えば、図2に示す障害F0002 では、EventA2 とEventA3 を同時に検知した場合、この障害を「ping無応答」であるとみなす。また、障害F0005 では、EventD1 あるいはEventD2 を検知した場合、この障害を「OSエラー」とみなす。なお、図2に示す例では「症状」における「* 」は論理積を表し、「+ 」は論理和を表している。新たに生じた症状が既存の障害分類に分類されない場合には、図2に示す障害F1000 に示すように、障害対処操作制御部31が「未知の障害」として分類する。   FIG. 2 is an explanatory diagram illustrating an example of failure classification information. In the failure classification information, a failure classification and a comment are set for each symptom of the system detected by the system state monitoring unit 2 and determined as a failure. The failure classification information also includes a failure ID corresponding to each symptom. For example, in the failure F0002 shown in FIG. 2, when EventA2 and EventA3 are detected at the same time, this failure is regarded as “no ping response”. Further, in the failure F0005, when EventD1 or EventD2 is detected, this failure is regarded as an “OS error”. In the example shown in FIG. 2, “*” in “symptom” represents a logical product, and “+” represents a logical sum. If the newly generated symptom is not classified into the existing fault classification, the fault handling operation control unit 31 classifies it as “unknown fault” as shown by fault F1000 shown in FIG.

図3は、障害履歴の例を示す説明図である。障害履歴は、過去に発生した障害に関する情報として、発生した障害毎に履歴ID、障害ID、発生箇所、発生日時、解決日時、およびその障害対処の流れを記載した障害対処ログのID(対処ログID)を含んでいる。   FIG. 3 is an explanatory diagram illustrating an example of a failure history. The fault history is information on faults that have occurred in the past. For each fault that has occurred, the fault ID, the fault ID, the fault location, the occurrence location, the occurrence date and time, the resolution date and time, and the flow of fault handling are described. ID).

図4は、障害対処ログの例を示す説明図である。障害対処ログは、障害対処毎に(対処ログID毎に)、障害への対処にあたった操作者名、その操作者による個々の操作を記録した操作ログのID(操作ログID)、操作日時、対処内容、対処にあたり実行したコマンド、そのコマンドの実行結果、対処時に操作者が入力したコメントを含んでいる。なお、「対処内容」として、「適用(コマンドの実行)」、「承認依頼(コマンド実行の承認依頼)」、「承認否決(コマンド実行の承認依頼に対する否決)」、および「解決確認」がある。1つの障害に対し、対処を行う操作者や対処内容は一人または1つとは限らない。誰かが対処を行った上で、別の誰かが解決を確認するというように、段階的に作業を進めていくにつれて、対処ログIDに対応する操作者、操作ログID等の情報が追加されることになる。例えば、図4に示す障害対処L0001 では、最初に操作者opeAが対処コマンドおよびコメントを入力し、適用(対処コマンドを実行)した時点で一旦、対処作業を閉じた(止めた)ことを示している。そして、更に、別の操作者opeBが、作業を引き継ぎ、本当に障害が解決したかを確認し、コメントを入力した上で、解決確認を実行し、その障害への対処作業が完了となったことを示している。また、障害対処L1000 では、操作者opeBがコマンドおよびコメントを入力した上で、承認依頼(入力したコマンドの実行の承認依頼)を実行した状態を示していて、その障害は未解決の状態であり、対処作業は完了していないことを示す。   FIG. 4 is an explanatory diagram illustrating an example of a failure handling log. The fault handling log includes, for each fault handling (for each handling log ID), the name of the operator who handled the fault, the ID of the operation log recording each operation by the operator (operation log ID), and the operation date and time. , Action content, command executed for handling, execution result of the command, and comments entered by the operator during handling. Note that “Actions” include “Apply (command execution)”, “Approval request (command execution approval request)”, “Approval reject (command execution approval request reject)”, and “Solution confirmation”. . The operator who handles one failure and the contents of the countermeasure are not limited to one person or one. Information such as the operator and operation log ID corresponding to the response log ID is added as the work progresses step by step, such as when someone takes action and another person confirms the solution. It will be. For example, in the failure handling L0001 shown in FIG. 4, when the operator opeA first inputs a handling command and a comment and applies (executes the handling command), the handling work is temporarily closed (stopped). Yes. Then, another operator opeB took over the work, confirmed whether the problem was really solved, entered a comment, executed a solution confirmation, and completed the work to deal with the problem. Is shown. Also, in the trouble handling L1000, the operator opeB entered the command and comment and then the approval request (approval request for executing the entered command) was executed, and the trouble is in an unresolved state , Indicating that the coping operation has not been completed.

図5は、操作ログの例を示す説明図である。操作ログは、各操作者が行った一連の操作群を識別する操作ログIDと対応付けて、障害対処時に操作者が行った操作日時、操作を行ったウインドウの識別情報(ウィンドウID)、操作群に属する個々の操作の種別(情報参照、ウインドウを閉じる操作、コマンド入力等)、操作対象となるオブジェクト(マウスクリック操作されるボタンや、テキスト情報が入力されるテキストエリア等)、および操作内容を含む。例えば、図5に示す操作ログO0001-01は、障害対処ログL0001 (図4参照)に対応する各操作群を示していて、操作者opeAが、障害対処を開始してコマンドおよびコメントを入力した上でコマンドを適用するまでの操作の流れを記録したものである。この操作ログO0001-01により、コマンド適用(入力したコマンドの実行)に至るまでに、ウインドウwin0001 からwin0002 を呼び出したが直ぐに閉じたことや、ウインドウwin0003 を経てウインドウwin0005 を呼び出したまま、コマンド入力を行ったことを見て取れる。   FIG. 5 is an explanatory diagram illustrating an example of an operation log. The operation log is associated with an operation log ID for identifying a series of operations performed by each operator, the operation date and time performed by the operator when dealing with the failure, the identification information (window ID) of the window in which the operation was performed, and the operation Types of individual operations belonging to the group (information reference, window closing operation, command input, etc.), objects to be operated (buttons operated by mouse clicks, text areas into which text information is input, etc.), and operation details including. For example, the operation log O0001-01 shown in FIG. 5 shows each operation group corresponding to the failure handling log L0001 (see FIG. 4), and the operator opeA starts troubleshooting and inputs a command and a comment. This is a record of the operation flow until the command is applied. According to this operation log O0001-01, command input (execution of input command) was executed by calling win0002 from window win0001 but immediately closing, or entering command while window win0005 was called via window win0003. You can see what you have done.

障害対処操作制御部31は、システム状態監視部2および入出力装置1からの入力を受け、システムに発生している障害への対処を行うための操作画面を生成し、その操作画面を入出力装置1に出力してその操作画面を入出力装置1に表示させる。また、障害対処操作制御部31は、入出力装置1を操作して障害対処作業を行う操作者の操作の内容を対処履歴情報記録管理部32に出力する。   The failure handling operation control unit 31 receives inputs from the system state monitoring unit 2 and the input / output device 1, generates an operation screen for coping with a failure occurring in the system, and inputs and outputs the operation screen. The operation screen is output to the device 1 and the operation screen is displayed on the input / output device 1. In addition, the failure handling operation control unit 31 outputs the content of the operation of the operator who performs the failure handling work by operating the input / output device 1 to the handling history information record management unit 32.

より具体的に、障害対処操作制御部31の処理について説明する。管理対象とするシステム上に障害が発生した場合、システム情報監視部2が障害発生を検知し、障害の情報(管理対象システムの症状、発生箇所等。発生日時等の情報が含まれていてもよい。)を障害対処プロセス制御部3(障害対処操作制御部31)に出力する。すると、障害対処操作制御部31は、システム状態監視部2からの入力に基づいて、検知されたシステムの症状に対応する障害分類があるか否かを障害分類情報を参照して調べる。なお、障害分類情報は、障害情報保存部5によって記憶されている。障害対処操作制御部31は、症状に対応する障害分類があれば、その障害分類の情報を取り出し、また、症状に対応する障害分類がなければ、発生した障害の障害分類を「未知の障害」する。そして、障害対処操作制御部31は、取り出した障害分類あるいは「未知の障害」とした障害分類を、障害の発生日時や障害発生箇所等と併せて、障害情報として、入出力装置1に表示させる。障害対処操作制御部31は、少なくとも、この障害の情報を表示する画面、および障害対処の内容の選択を操作者に促す画面を含む一連の画面を、入出力装置1において行われた操作に応じて、入出力装置1に表示させる。ここで、障害対処の内容の選択を操作者に促す画面とは、障害対処時に、対処内容である「適用」、「承認依頼」、「承認否決」、「障害解決」のいずれかを選択的に入力する画面である。障害対処操作制御部31は、障害対処において用いられる画面として、この一連の画面を出力して、操作者に、管理対象システムにおける障害の存在を認知させ、障害対処作業を促す。また、障害対処操作制御部31は、画面として、予め定められた障害対処の手順に従って必要な項目を入力していくウイザード形式のウィンドウを生成する。そして、障害に関連する情報を表示する画面として、障害情報保存部5に記録されている情報や管理対象システムに関するその他の情報を表示する情報参照用ウィンドウを生成し、そのウィンドウを入出力装置1に表示させる。障害対処操作制御部31は、入出力装置1において行われた操作に応じて、先に述べた一連の画面とは別に、情報参照用ウィンドウも表示させて、分析対処に用いられる情報を操作者に提供する。   More specifically, the processing of the failure handling operation control unit 31 will be described. When a failure occurs on the system to be managed, the system information monitoring unit 2 detects the failure and information about the failure (symptoms, location, etc. of the managed system, even if information such as the date and time of occurrence is included) Is output to the failure handling process control unit 3 (failure handling operation control unit 31). Then, based on the input from the system state monitoring unit 2, the failure handling operation control unit 31 checks whether there is a failure classification corresponding to the detected system symptom with reference to the failure classification information. The failure classification information is stored by the failure information storage unit 5. If there is a failure classification corresponding to the symptom, the failure handling operation control unit 31 extracts information on the failure classification. If there is no failure classification corresponding to the symptom, the failure handling operation control unit 31 sets the failure classification of the occurred failure to “unknown failure”. To do. Then, the failure handling operation control unit 31 causes the input / output device 1 to display the extracted failure classification or failure classification as “unknown failure” as failure information together with the failure occurrence date and time, the failure occurrence location, and the like. . The failure handling operation control unit 31 displays a series of screens including at least a screen for displaying information on the failure and a screen for prompting the operator to select the content of the failure handling according to the operation performed in the input / output device 1. Display on the input / output device 1. Here, the screen that prompts the operator to select the content of the troubleshooting is to select one of “Apply”, “Approval request”, “Approval reject”, or “Disability resolution” as the response when troubleshooting It is a screen to input to. The failure handling operation control unit 31 outputs this series of screens as screens used in handling the failure, makes the operator recognize the presence of the failure in the managed system, and prompts the failure handling work. Further, the failure handling operation control unit 31 generates a wizard-format window for inputting necessary items according to a predetermined troubleshooting procedure as a screen. Then, as a screen for displaying information related to the failure, an information reference window for displaying information recorded in the failure information storage unit 5 and other information related to the management target system is generated. To display. The failure handling operation control unit 31 displays an information reference window in addition to the series of screens described above according to the operation performed in the input / output device 1, and displays information used for analysis handling as an operator. To provide.

対処履歴情報記録管理部32は、障害対処操作制御部31からの入力を受け、障害分類情報、障害履歴、障害対処ログ、操作ログを障害情報保存部5に記録する。より具体的には、対処履歴情報記録管理部32は、障害対処操作制御部31からの障害対処作業の進捗情報を取得し、操作者名や日時、入力項目、別途参照した関連情報等を障害対処ログおよび操作ログとして、障害情報保存部5に記録する。すなわち、対処履歴情報記録管理部32は、入出力装置1における操作に応じて障害対処操作制御部31が出力した操作者名、操作日時、対処内容、対処コマンド、対処コマンドの実行結果、操作者が入力したコメントを、障害対処ログとして障害情報保存部5に記録する。また、対処履歴情報記録管理部32は、入出力装置1における操作に応じて障害対処操作制御部31が出力した日時、操作ウィンドウID、操作種別、操作対象、操作の内容を操作ログとして障害情報保存部5に記録する。   The response history information record management unit 32 receives input from the failure response operation control unit 31 and records failure classification information, failure history, failure response log, and operation log in the failure information storage unit 5. More specifically, the handling history information record management unit 32 acquires the progress information of the fault handling work from the fault handling operation control unit 31, and sets the operator name, date and time, input items, separately referenced related information, etc. Recorded in the failure information storage unit 5 as a handling log and an operation log. That is, the handling history information record management unit 32 outputs the operator name, operation date and time, handling details, handling command, handling command execution result, operator output from the troubleshooting handling control unit 31 according to the operation in the input / output device 1. Is input to the failure information storage unit 5 as a failure handling log. In addition, the handling history information record management unit 32 uses the date and time, the operation window ID, the operation type, the operation target, and the content of the operation output by the failure handling operation control unit 31 according to the operation in the input / output device 1 as the operation log. Record in the storage unit 5.

また、操作者が障害対処ウインドウを閉じ、障害対処作業を途中で中断した場合、障害対処操作制御部31は、その旨の情報を入出力装置1から受信し、対処履歴情報記録管理部32に出力する。対処履歴情報記録管理部32は、この情報を障害対処操作制御部31から受けると、障害対処ログおよび操作ログから中断した作業に関する情報を削除する。例えば、対処履歴情報記録管理部32が、図5に例示する操作ログO0001-01の記録を行っているときに、win0003 が閉じられた後に障害対処作業が中断されたとする。すると、対処履歴情報記録管理部32は、操作ログID“O0001-01”に対応付けて記録した情報を操作ログ中から削除する。また、図4に例示する障害対処ログ中から、操作ログID“O0001-01”に対応付けて記録した情報を削除する。   Further, when the operator closes the failure handling window and interrupts the failure handling work, the failure handling operation control unit 31 receives information to that effect from the input / output device 1 and sends it to the handling history information record management unit 32. Output. When the response history information record management unit 32 receives this information from the failure handling operation control unit 31, the handling history information record management unit 32 deletes information about the suspended work from the failure handling log and the operation log. For example, it is assumed that the trouble handling operation is interrupted after win0003 is closed while the handling history information record management unit 32 is recording the operation log O0001-01 illustrated in FIG. Then, the handling history information record management unit 32 deletes the information recorded in association with the operation log ID “O0001-01” from the operation log. Also, the information recorded in association with the operation log ID “O0001-01” is deleted from the failure handling log illustrated in FIG.

また、対象内容として「障害解決」が入力された場合(すなわち、操作者が障害が解決したと判断し障害対処作業を完了した場合)、対処履歴情報記録管理32は、障害の発生箇所、解決日時、解決に至るまでの対処を示す対処ログIDを障害履歴として、障害情報保存部5に記録する。なお、障害履歴では、対処ログIDが記録され、障害対処ログでは、対処ログIDと操作ログIDが対応付けられている。従って、障害履歴から、各障害を解決するために行われた一連の操作の情報(図5参照。)まで辿ることができる。   Also, when “failure resolution” is input as the target content (that is, when the operator determines that the fault has been resolved and completes the fault handling work), the handling history information record management 32 displays the location of the fault and the resolution The trouble log ID indicating the date and time and the action until the solution is recorded in the trouble information storage unit 5 as a trouble history. In the failure history, the handling log ID is recorded, and in the failure handling log, the handling log ID and the operation log ID are associated with each other. Accordingly, it is possible to trace from the failure history to information on a series of operations performed to solve each failure (see FIG. 5).

障害分析操作制御部41は、障害分析を行う操作者によって入出力装置1において行われる操作に応じて、過去に管理対象システムに発生した障害の分析を行うための操作画面を生成し、その操作画面を入出力装置1に出力してその操作画面を入出力装置1に表示させる。障害分析操作制御部41は、障害の分析を行うための操作画面として、障害情報保存部5に記録されている情報や管理対象システムに関するその他の情報を参照可能な画面を生成し、入出力装置1に出力する。障害分析操作制御部41は、障害分析において用いられる画面として、少なくとも、過去に発生した各障害の一覧情報を表示する画面、および障害対処時に行われた個々の操作に関するログを表示する画面を含む一連の画面を生成し、入出力装置1に表示させる。障害分析操作制御部41は、障害情報保存部5に記憶された情報に基づいて、この一連の画面を表示させればよい。また、障害分析操作制御部41は、各障害に関連する情報(上記の障害情報保存部5に記録されている情報や管理対象システムに関するその他の情報)を表示する画面(すなわち、情報参照用ウィンドウ)も入出力装置に表示させる。情報参照用ウィンドウは、分析対処時に表示される情報参照用ウィンドウと同様のウィンドウであってよい。   The failure analysis operation control unit 41 generates an operation screen for analyzing a failure that has occurred in the management target system in the past in accordance with an operation performed on the input / output device 1 by an operator who performs the failure analysis. The screen is output to the input / output device 1 and the operation screen is displayed on the input / output device 1. The failure analysis operation control unit 41 generates a screen on which information recorded in the failure information storage unit 5 and other information related to the management target system can be referred to as an operation screen for performing failure analysis. Output to 1. The failure analysis operation control unit 41 includes, as screens used in failure analysis, at least a screen that displays a list of each failure that has occurred in the past, and a screen that displays a log relating to each operation performed at the time of handling the failure. A series of screens are generated and displayed on the input / output device 1. The failure analysis operation control unit 41 may display this series of screens based on the information stored in the failure information storage unit 5. The failure analysis operation control unit 41 also displays a screen (that is, an information reference window) that displays information related to each failure (information recorded in the failure information storage unit 5 and other information related to the management target system). ) Is also displayed on the input / output device. The information reference window may be the same window as the information reference window displayed at the time of analysis.

障害分析操作制御部41は、障害対処とは異なるタイミングで(すなわち、障害対処作業が行われていないときに)、少なくとも、過去に発生した各障害の一覧情報を表示する画面、および障害対処時に行われた個々の操作に関するログを表示する画面を含む一連の画面を生成し、入出力装置1に出力させる。また、この一連の画面が含むボタンのうち、情報参照用ウィンドウを表示するためのボタンが押下(クリック)された場合、障害分析操作制御部41は、情報参照用ウィンドウを新たに表示させる。   The failure analysis operation control unit 41 has at least a screen for displaying a list of each failure that has occurred in the past at a timing different from that for the failure handling (that is, when failure handling work is not being performed) A series of screens including a screen for displaying a log regarding each performed operation is generated and output to the input / output device 1. When a button for displaying an information reference window is pressed (clicked) among the buttons included in the series of screens, the failure analysis operation control unit 41 newly displays an information reference window.

また、障害分析操作制御部41は、入出力装置1における管理者の指示に従い、障害情報保存部5が記憶する障害の分類指定をより適切なものに変更したり、障害分類情報内に「未知の障害」が含まれている場合、その「未知の障害」を既知の障害分類に変更する。「未知の障害」を既知の障害分類に変更とき、障害分析操作制御部41は、入出力装置1における管理者の指示に従い、障害分類情報内の「未知の障害」に対応するコメント(図2参照。)を書き換える。例えば、障害分析操作制御部41は、図2に例示する「未知の障害」、「障害分類が不明です。」という箇所を、例えば「CPUエラー」、「CPUに異常があります。」といった具体データなデータに変更する。   In addition, the failure analysis operation control unit 41 changes the failure classification designation stored in the failure information storage unit 5 to a more appropriate one according to the instruction of the administrator in the input / output device 1 or “unknown” in the failure classification information. If the "unknown failure" is included, the "unknown failure" is changed to a known failure classification. When the “unknown failure” is changed to a known failure classification, the failure analysis operation control unit 41 follows the instructions of the administrator in the input / output device 1 and comments corresponding to the “unknown failure” in the failure classification information (FIG. 2). See.). For example, the failure analysis operation control unit 41 uses the data “unknown failure” and “failure classification unknown” illustrated in FIG. 2 as specific data such as “CPU error” and “the CPU has an abnormality”. Change to the correct data.

障害分析操作制御部41は、過去に発生した各障害の一覧情報を表示する画面、および障害対処時に行われた個々の操作に関するログを表示する画面を含む一連の画面を表示させることで、管理者に障害分析作業を促す。なお、本実施の形態では、「障害分析」として、障害の発生原因の特定、システム構成変更等の根本的な解決、次に類似した障害発生時の対処策を定めるといった障害の再発を防ぐための作業の他、「未知の障害」とされていた症状の分類をを既知の障害として変更する作業も含む。   The failure analysis operation control unit 41 displays a series of screens including a screen that displays a list of information on each failure that has occurred in the past and a screen that displays a log regarding each operation performed at the time of handling the failure. Encourage people to analyze problems. In the present embodiment, as “failure analysis”, in order to prevent the recurrence of a failure such as identification of the cause of the failure, fundamental solution such as a change in the system configuration, etc., and determination of a countermeasure for the next occurrence of the failure. In addition to the above-mentioned work, the work of changing the classification of the symptom that has been regarded as “unknown trouble” as a known trouble is included.

障害分析操作制御部41は、例えば、作業者に対する認証を行い、作業者が障害分析を行う権限を有する管理者等であることを確認した後に、障害分析のための画面を表示して障害分析が可能となるようにしてもよい。   The failure analysis operation control unit 41, for example, authenticates the worker, confirms that the worker is an administrator having authority to perform failure analysis, and then displays a failure analysis screen to display the failure analysis. May be possible.

障害対処操作制御部31が入出力装置1に表示させる一連の画面(対処時画面群と記す。)と、障害分析操作制御部41が入出力装置1に表示させる一連の画面(分析時画面群と記す。)では、以下の点が異なる。障害対処操作制御部31は、対処時画面群における最初の画面として、まず、発生した障害の情報を表示する画面を生成する。一方、障害分析操作制御部41は、分析時画面群における最初の画面として、まず、過去に発生した各障害の一覧情報を表示する画面を生成する。このように、最初に表示される画面が、対処時画面群と分析時画面群とで異なる。また、障害対処時において「適用」、「承認依頼」、「承認否決」、「障害解決」のいずれかを選択的に入力する画面が対処時画面群には含まれるが、分析時画面群には含まれない。また、障害対処時に行われた個々の操作に関するログを表示する画面は、分析時画面群に含まれるが、対処時画面群には含まれない。なお、障害に関連する情報(例えば、障害が発生した装置の情報等)は、障害対処時、障害分析時のいずれにいおいても表示してよい。このように、障害対処時および障害分析時で共通の情報を表示してもよい。   A series of screens to be displayed on the input / output device 1 by the failure handling operation control unit 31 (referred to as a screen group at the time of handling), and a series of screens to be displayed on the input / output device 1 by the failure analysis operation control unit 41 (a group of screens at the time of analysis) The following points are different. The failure handling operation control unit 31 first generates a screen that displays information on the failure that has occurred, as the first screen in the handling screen group. On the other hand, the failure analysis operation control unit 41 first generates a screen that displays the list information of each failure that occurred in the past as the first screen in the analysis time screen group. As described above, the screen displayed first differs between the countermeasure screen group and the analysis screen group. In addition, a screen for selectively entering one of “Apply”, “Approval request”, “Approval reject”, or “Solution” is included in the response screen group, but the analysis screen group includes Is not included. A screen for displaying a log regarding each operation performed at the time of handling a failure is included in the analysis time screen group, but is not included in the response time screen group. Note that information related to a failure (for example, information about a device in which a failure has occurred) may be displayed both when dealing with a failure and when analyzing a failure. In this way, common information may be displayed when dealing with a failure and analyzing a failure.

システム状態監視部2は、例えば、プログラムに従って動作するCPUによって実現される。そのプログラムは、システム状態監視部2が備える記憶装置(図示せず。)に記憶させておけばよい。障害対処操作制御部31および対処履歴情報記憶管理部32は、例えば、システム運用管理支援プログラムに従って動作するCPUによって実現される。そのシステム運用管理支援プログラムは、例えば障害対策プロセス制御部3が備える記憶装置(図示せず。)に記憶させておけばよい。障害分析操作制御部41は、例えば、システム運用管理支援プログラムに従って動作するCPUによって実現される。そのシステム運用管理支援プログラムは、例えば障害分析プロセス制御部4が備える記憶装置(図示せず。)に記憶させておけばよい。また、障害情報保存部5は、例えば、記憶装置によって実現される。   The system state monitoring unit 2 is realized by a CPU that operates according to a program, for example. The program may be stored in a storage device (not shown) included in the system state monitoring unit 2. The failure handling operation control unit 31 and the handling history information storage management unit 32 are realized by, for example, a CPU that operates according to a system operation management support program. The system operation management support program may be stored in a storage device (not shown) provided in the failure countermeasure process control unit 3, for example. The failure analysis operation control unit 41 is realized by a CPU that operates according to a system operation management support program, for example. The system operation management support program may be stored in a storage device (not shown) provided in the failure analysis process control unit 4, for example. The failure information storage unit 5 is realized by a storage device, for example.

次に、動作について説明する。   Next, the operation will be described.

図6は、障害対処操作制御部31が、一連の画面(対処時画面群)を入出力装置1に表示させて、操作者に障害対処を促す処理過程の例を示すフローチャートである。システム状態監視部2が障害の発生を検知した場合、障害対処操作制御部31は、管理対象システムに発生している障害の情報を表示する画面を入出力装置1に表示させ、障害対処業務に就く操作者に障害の発生を通知する(ステップS1602)。ステップS1602では、例えば、発生している障害の情報を一覧として表示し、一覧表示した障害の中から障害を指定する操作が入出力装置1において行われた場合、障害対処操作制御部31は、指定された障害の情報を表示する画面を入出力装置1に表示させる。ステップS1602における表示画面によって、操作者は、障害の発生を認知する。発生した障害に関する詳細な情報として、障害発生箇所のシステム構成やサービスの内容、過去の障害事例等を表示する情報参照用ウィンドウを呼び出す操作が入出力装置1において操作者により行われると、障害対処操作制御部31は、情報参照用ウィンドウを入出力装置1に表示させる(ステップS1603)。障害対処操作制御部31は、情報参照用ウィンドウを、ステップS1602で表示する障害通知画面(発生している障害の情報を表示する画面)とは別のウィンドウとして表示させる。障害対処操作制御部31は、入出力装置1における操作に応じて、情報参照用ウィンドウを閉じて、障害通知画面を表示する状態(ステップS1602)に戻ってもよい。また、その状態から再度ステップS1603に移行してもよい。   FIG. 6 is a flowchart illustrating an example of a process in which the failure handling operation control unit 31 displays a series of screens (a group of handling screens) on the input / output device 1 and prompts the operator to deal with the failure. When the system status monitoring unit 2 detects the occurrence of a failure, the failure handling operation control unit 31 causes the input / output device 1 to display a screen for displaying information on the failure that has occurred in the managed system so that the failure handling operation can be performed. The operator is notified of the occurrence of the failure (step S1602). In step S1602, for example, when information on the failure that has occurred is displayed as a list and an operation for designating a failure from the displayed failures is performed in the input / output device 1, the failure handling operation control unit 31 The input / output device 1 is caused to display a screen for displaying information on the specified failure. From the display screen in step S1602, the operator recognizes the occurrence of the failure. As detailed information regarding the failure that has occurred, if the operator performs an operation to call an information reference window that displays the system configuration of the location of the failure, the contents of the service, past failure cases, etc., the failure handling The operation control unit 31 displays an information reference window on the input / output device 1 (step S1603). The failure handling operation control unit 31 displays the information reference window as a window different from the failure notification screen (screen for displaying information on the failure that has occurred) displayed in step S1602. The failure handling operation control unit 31 may close the information reference window and return to the state in which the failure notification screen is displayed (step S1602) according to the operation in the input / output device 1. Moreover, you may transfer to step S1603 again from the state.

発生した障害への対処が必要であると操作者が判断し、対処を開始するための障害対処画面を呼び出す操作が入出力装置1において行われると、障害対処操作制御部31は、その操作に応じて、障害対処画面を入出力装置1に表示させる(ステップS1604)。発生した障害に関する詳細な情報を表示する情報参照用ウィンドウを呼び出す操作が入出力装置1において操作者により行われると、障害対処操作制御部31は、情報参照用ウィンドウを入出力装置1に表示させる(ステップS1605)。障害対処操作制御部31は、情報参照用ウィンドウを表示させることにより、適切な対象方法検討の判断材料を操作者に提供する。障害対処操作制御部31は、入出力装置1における操作に応じて、情報参照用ウィンドウを閉じて、障害対処画面を表示する状態(ステップS1604)に戻ってもよい。また、その状態から再度ステップS1605に移行してもよい。   When the operator determines that it is necessary to deal with the failure that has occurred and an operation for calling up a failure handling screen for starting the handling is performed in the input / output device 1, the failure handling operation control unit 31 performs the operation. In response, a failure handling screen is displayed on the input / output device 1 (step S1604). When the operator performs an operation for calling an information reference window for displaying detailed information regarding the failure that has occurred in the input / output device 1, the failure handling operation control unit 31 causes the input / output device 1 to display the information reference window. (Step S1605). The failure handling operation control unit 31 displays an information reference window to provide the operator with a material for determining appropriate target method examination. The failure handling operation control unit 31 may close the information reference window and return to the state where the failure handling screen is displayed (step S1604) according to the operation in the input / output device 1. Moreover, you may transfer to step S1605 again from the state.

ステップS1604において表示させる障害対処画面は、「適用」、「承認依頼」、「承認否決」、「障害解決」のいずれかを選択的に入力させる画面である。すなわち、ステップS1604において、障害対処操作制御部31は、「適用」、「承認依頼」、「承認否決」、「障害解決」のいずれかの選択を促す。障害対処操作制御部31は、入出力装置1における操作者の操作に応じて、選択された対処内容の情報を入出力装置1から受信する(ステップS1606)。すなわち、障害対処操作制御部31は、対処内容として、「適用(対処コマンドを入力し実行すること)」、「承認依頼(別の人間にコマンド実行の承認を依頼すること)」、「承認否決(依頼された承認を否決すること)」、「解決確認(発生した障害が解決したと見なすこと)」の何れが選択されたのかを、入出力装置1から通知される。   The failure handling screen displayed in step S1604 is a screen for selectively inputting any one of “Apply”, “Approval request”, “Approval reject”, and “Failure resolution”. That is, in step S1604, the failure handling operation control unit 31 prompts the user to select any one of “apply”, “approval request”, “approval rejection”, and “failure resolution”. The failure handling operation control unit 31 receives information of the selected handling content from the input / output device 1 in accordance with the operation of the operator in the input / output device 1 (step S1606). That is, the failure handling operation control unit 31 includes “apply (input and execute a handling command)”, “approval request (request another person to approve command execution)”, “approval rejection” The input / output device 1 is notified of which one of “Reject requested approval” and “Solution confirmation (consider that the fault that has occurred has been resolved)” has been selected.

なお、承認依頼された操作者が「承認否決」を行わずに承認を認める場合には、「適用(対処コマンドの実行)」を選択すればよい。   When the operator who has requested approval approves the approval without performing the “approval rejection”, “apply (execution of countermeasure command)” may be selected.

障害対処操作制御部31は、ステップS1606で選択された対処内容を実行に移すか否かの確認画面を入出力装置1に表示させる(ステップS1607,S1608,S1609,S1610)。すなわち、ステップS1606において、「適用」が選択された場合には、入力された対処コマンドを本当に実行するか否かの確認画面を表示させる(ステップS1607)。また、「承認依頼」が選択された場合、別の人間へのコマンド実行の承認依頼を本当に実行するか否かの確認画面を表示させる(ステップS1608)。「承認否決」が選択された場合、依頼された承認の否決を本当に実行するか否かの確認画面を表示させる(ステップS1609)。「解決確認」が選択された場合、本当に発生した障害が解決したと見なすか否かの確認画面を表示させる(ステップS1610)。   The failure handling operation control unit 31 causes the input / output device 1 to display a confirmation screen as to whether or not to execute the handling content selected in step S1606 (steps S1607, S1608, S1609, S1610). In other words, when “Apply” is selected in step S1606, a confirmation screen as to whether or not to actually execute the input countermeasure command is displayed (step S1607). If “approval request” is selected, a confirmation screen as to whether or not a command execution approval request to another person is actually executed is displayed (step S1608). If “approval rejection” is selected, a confirmation screen as to whether or not to actually execute the requested approval rejection is displayed (step S1609). If “Solution confirmation” is selected, a confirmation screen is displayed as to whether or not it is considered that the fault that has actually occurred has been resolved (step S1610).

障害対処操作制御部31は、入出力装置1に表示させた確認画面において、対処内容を実行する旨の指示が入力されたか否かを判定する(ステップS1611)。対処内容を実行しない旨の指示が入力された場合(ステップS1611におけるNo)、ステップS6104に移行し、ステップS1604以降の処理を繰り返す。この結果、操作者は、対処内容の再考が可能となる。また、対処内容を実行する旨の指示が入力された場合(ステップS1611におけるYes)、障害対処操作制御部31は、対処内容を実際に実行し、結果を提示する(ステップS1612)。なお、対処内容が「承認依頼」、「承認否決」、「障害解決」である場合、例えば、障害通知画面上で、対処中の障害と対応づけて「承認依頼」、「承認否決」または「障害解決」という対処内容を表示することが、対処内容の実行に相当する。この時点で障害対処作業は一旦閉じられる。障害対処操作制御部31は、障害が解決しているか否か(障害が解決しているとみなしたか否か)を判定し(ステップS1613)、障害が解決しているならば(「解決確認」が選択され、障害が解決したとみなしたならば)、発生した障害に対する対処作業が完了したことになる。障害が解決されていないならば(障害が解決したとみなしていないならば)、ステップS1602に移行して、ステップS1602以降の処理を繰り返す。このとき、発生している障害の一覧画面では、発生した障害の対処状況を提示し、他の操作者(あるいはこれまでの操作者と同一人物であってもよい)による引継ぎ作業を待つ状態となる。例えば、「承認依頼」が選択されて再度ステップS1602に移行した場合、障害への対処状況として「承認待ち」等の情報を障害情報の一覧画面内に表示すればよい。なお、障害対処操作制御部31は、障害に対する対処内容が決定されるまでの間、発生している障害の一覧画面内で、その障害と対応づけて「対処中」等の情報を表示する。   The failure handling operation control unit 31 determines whether or not an instruction to execute the handling content is input on the confirmation screen displayed on the input / output device 1 (step S1611). When an instruction not to execute the countermeasure content is input (No in step S1611), the process proceeds to step S6104, and the processes in and after step S1604 are repeated. As a result, the operator can reconsider the countermeasure content. When an instruction to execute the countermeasure content is input (Yes in step S1611), the failure handling operation control unit 31 actually executes the countermeasure content and presents the result (step S1612). In addition, when the countermeasure content is “approval request”, “approval rejection”, “failure resolution”, for example, on the fault notification screen, the “approval request”, “approval rejection” or “ Displaying the countermeasure content “Failure resolution” corresponds to execution of the countermeasure content. At this point, the trouble handling operation is temporarily closed. The failure handling operation control unit 31 determines whether or not the failure has been resolved (whether or not the failure has been resolved) (step S1613), and if the failure has been resolved ("solution confirmation"). Is selected and the failure has been resolved), the work on the failure has been completed. If the failure has not been solved (if the failure has not been resolved), the process proceeds to step S1602, and the processing from step S1602 is repeated. At this time, in the list of faults that have occurred, the status of handling the fault that has occurred is presented, and a state of waiting for takeover work by another operator (or the same person as the previous operator) Become. For example, when “approval request” is selected and the process proceeds to step S1602 again, information such as “waiting for approval” may be displayed in the failure information list screen as the status of handling the failure. The failure handling operation control unit 31 displays information such as “being handled” in association with the failure in the list of occurrences of the failure until the handling content for the failure is determined.

図7は、障害対処作業が行われているときに対処履歴情報記録管理部32が行う情報記録管理処理の例を示すフローチャートである。システム情報監視部2が障害発生を検知し、障害の情報を障害対処操作制御部31に出力すると、障害対処操作制御部31は、システム状態監視部2からの入力に基づいて、検知されたシステムの症状に対応する障害分類があるか否かを障害分類情報を参照して調べる。対処履歴情報記録管理部32は、この障害対処操作制御部31による処理結果に応じて、障害IDを特定し、障害発生箇所、発生日時等を、障害履歴に追加する。このとき、履歴IDを割り当て、履歴IDに対応付けて、上記の各情報を障害履歴に追加する(ステップS1701)。ステップS1701では、1つの履歴IDおよびその履歴IDに対応する障害ID、発生箇所、発生日時等の情報を追加して、図3に例示する障害履歴を更新する。また、システムの症状が「未知の障害」であると障害対処操作制御部31によって判定され、障害対処操作制御部31がその旨および症状の情報を対処履歴情報記録管理部32に出力した場合、対処履歴情報記録管理部32は、新たに障害IDを割り当て、その障害IDと対応させて、その症状の情報、「未知の障害」という障害分類、「障害分類が不明です。」等のコメントとを対応付けて、障害分類情報に追加する。すなわち、図2の最終行に例示するような1行分のデータを作成し、障害分類情報に追加する。また、この場合、対処履歴情報記録管理部32は、「未知の障害」の発生に伴い新たに割り当てた新規障害IDを、障害履歴に追加する。   FIG. 7 is a flowchart illustrating an example of the information record management process performed by the handling history information record management unit 32 when a fault handling work is being performed. When the system information monitoring unit 2 detects the occurrence of a failure and outputs failure information to the failure handling operation control unit 31, the failure handling operation control unit 31 detects the detected system based on the input from the system state monitoring unit 2. Whether or not there is a failure classification corresponding to the symptom is checked with reference to the failure classification information. The handling history information record management unit 32 identifies the fault ID according to the processing result by the fault handling operation control unit 31, and adds the location where the fault has occurred, the date and time of occurrence, etc. to the fault history. At this time, a history ID is assigned, and the above information is added to the failure history in association with the history ID (step S1701). In step S1701, information such as one history ID and a failure ID corresponding to the history ID, an occurrence location, an occurrence date and time is added, and the failure history illustrated in FIG. 3 is updated. In addition, when it is determined by the failure handling operation control unit 31 that the symptom of the system is “unknown failure”, and the failure handling operation control unit 31 outputs information on the fact and the symptom to the handling history information record management unit 32, The handling history information record management unit 32 newly assigns a failure ID, associates it with the failure ID, and provides information on the symptom, failure classification “unknown failure”, “failure classification is unknown”, and the like. Are associated with each other and added to the failure classification information. That is, data for one row as illustrated in the last row in FIG. 2 is created and added to the failure classification information. Further, in this case, the handling history information record management unit 32 adds a new failure ID newly assigned with the occurrence of “unknown failure” to the failure history.

また、このとき、障害対処操作制御部31は、図6に示すステップS1602の処理を開始し、操作者は障害の発生を認知させる。この結果、障害対処作業が開始されることになる(ステップS1702)。障害対処操作制御部31は、入出力装置1において行われる操作の情報を対処履歴情報記録管理部32に出力し、対処履歴情報記録管理部32はその情報を受け取る。   At this time, the failure handling operation control unit 31 starts the process of step S1602 shown in FIG. 6, and the operator recognizes the occurrence of the failure. As a result, failure handling work is started (step S1702). The failure handling operation control unit 31 outputs information on operations performed in the input / output device 1 to the handling history information record management unit 32, and the handling history information record management unit 32 receives the information.

対処履歴情報記録管理部32は、発生した障害に対応する障害対処ログが存在するか否かを判定する(ステップS1703)。発生した障害への対処が初めて開始された場合、その障害に対応する障害対処ログは存在しないため、対処履歴情報記録管理部32は、障害対処ログを新規に作成する(ステップS1704)。ここで、対処履歴情報記録管理部32は、対処ログIDを割り当てる。また、ステップS1701で追加した障害IDに対応させて、障害履歴に対処ログIDを記録する。   The handling history information record management unit 32 determines whether there is a fault handling log corresponding to the fault that has occurred (step S1703). When the handling of the occurred failure is started for the first time, there is no failure handling log corresponding to the failure, so the handling history information record management unit 32 creates a new troubleshooting log (step S1704). Here, the handling history information record management unit 32 assigns a handling log ID. In addition, the countermeasure log ID is recorded in the failure history in association with the failure ID added in step S1701.

対処履歴情報記録管理部32は、対処が行われる障害に対応する障害対処ログに、現在対処作業を行っている作業者による作業内容を記録するためのデータを追加する。具体的には、対処履歴情報記録管理部32は、操作者名、操作日時等を、割り当て済みの対処ログIDに対応付けて記録する。操作者名に関しては、例えば、障害対処操作制御部31が表示画面上で操作者名の入力を促し、入力された操作者名を対処履歴情報記録管理部32に通知してもよい(また、他の方法によって操作者名を通知してもよい)。また、対処履歴情報記録管理部32、新たに操作ログIDを割り当て、対処ログIDと対応付けて障害対処ログに記録する。また、対処履歴情報記録管理部32、新規に割り当てた操作ログIDに対応する操作ログを新たに作成する(ステップS1705)。なお、ステップS1705では、障害対処ログ(図4参照。)の「対処内容」、「対処コマンド」、「結果」、「コメント」は未定であるので、記録されない。   The handling history information record management unit 32 adds data for recording the work content of the worker currently performing the handling work to the trouble handling log corresponding to the trouble to be dealt with. Specifically, the handling history information record management unit 32 records the operator name, the operation date and time, etc. in association with the assigned handling log ID. Regarding the operator name, for example, the failure handling operation control unit 31 may prompt the operator name to be input on the display screen, and notify the handling history information record management unit 32 of the input operator name (also, The operator name may be notified by other methods). Further, the handling history information record management unit 32 newly assigns an operation log ID and records it in the fault handling log in association with the handling log ID. Also, the handling history information record management unit 32 creates a new operation log corresponding to the newly assigned operation log ID (step S1705). In step S1705, “contents to be handled”, “handling command”, “result”, and “comment” in the trouble handling log (see FIG. 4) are not determined and are not recorded.

操作者は、障害対処操作として、様々な関連情報をウインドウを呼び出していく形で参照したり、対処コマンドを入力したりする。入出力装置1は、これらの個々の操作に関する情報(操作日時、操作ウィンドウID、操作種別、操作対象等)を障害対処操作制御部31に出力し、障害対処操作制御部31は、その情報を対処履歴情報記録管理部32に出力する。対処履歴情報記録管理部32は、操作者による操作が行われる毎に操作に関する情報を受け取り、操作ログIDと対応付けて、操作日時、操作ウィンドウID、操作種別、操作対象等を操作ログに記録する(ステップS1706)。また、図5に示す「内容」の情報は、入出力装置1あるいは障害対処操作制御部31が判定し、対処履歴情報記録管理部32に出力してもよい。または、対処履歴情報記録管理部32が、操作ウィンドウID、操作種別、操作対象に基づいて判定し、操作ログに記録してもよい。対処履歴情報記録管理部32は、行われた操作の順番に従って、各操作の情報を追加記録する。従って、各操作の情報は、日時が示す時刻の順に並ぶ。   The operator refers to various related information in a form of calling up a window or inputs a countermeasure command as a trouble handling operation. The input / output device 1 outputs information related to these individual operations (operation date and time, operation window ID, operation type, operation target, etc.) to the failure handling operation control unit 31, and the failure handling operation control unit 31 outputs the information. The information is output to the handling history information record management unit 32. The handling history information record management unit 32 receives information about operations every time an operation is performed by the operator, and records the operation date / time, operation window ID, operation type, operation target, etc. in the operation log in association with the operation log ID. (Step S1706). 5 may be determined by the input / output device 1 or the failure handling operation control unit 31 and output to the handling history information record management unit 32. Alternatively, the handling history information record management unit 32 may make a determination based on the operation window ID, the operation type, and the operation target, and record them in the operation log. The handling history information record management unit 32 additionally records information of each operation according to the order of operations performed. Therefore, the information of each operation is arranged in the order of the time indicated by the date and time.

操作者が、障害対処用の主ウインドウ(例えば、ステップS1604で表示される障害対処画面。後述の図10参照。)を閉じる等の対処作業中断操作を行った場合、入出力装置1は、その操作の情報を障害対処操作制御部31に出力し、障害対処操作制御部31は、その情報を対処履歴情報記録管理部32に出力する。対処履歴情報記録管理部32は、対処作業中断操作が行われたか否かを判定する(ステップS1707)。この判定は、障害対処操作制御部31が対処作業中断操作に関する情報を出力したか否かによって行えばよい。対処作業中断操作が行われたと判定した場合(ステップS1707におけるYes)、対処履歴情報記録管理部32は、障害対処ログにおける最新の一行の情報(直近に記録された「操作者」、「操作ログID」、「操作日時」の情報)を削除する。また、対処履歴情報記録管理部32は、中断した作業に対応する操作ログを削除する(ステップS1708)。例えば、図5に例示する操作ログID“O0001-01”に対応する操作情報を順次記録していて、5行目の記録後、対処作業中断操作が行われたと判定したとする。この場合、対処履歴情報記録管理部32は、それまでに記録していた操作ログID“O0001-01”に対する情報(5行分の情報)および操作ログIDを削除する。ステップS1708の後、ステップS1702以降の動作を繰り返す。   When the operator performs a coping operation interruption operation such as closing a main window for coping with trouble (for example, the trouble coping screen displayed in step S1604; see FIG. 10 described later), the input / output device 1 The operation information is output to the failure handling operation control unit 31, and the failure handling operation control unit 31 outputs the information to the handling history information record management unit 32. The handling history information record management unit 32 determines whether a handling work interruption operation has been performed (step S1707). This determination may be made based on whether or not the failure handling operation control unit 31 has output information related to the handling work interruption operation. When it is determined that the handling work interruption operation has been performed (Yes in step S1707), the handling history information record management unit 32 displays the latest one-line information in the fault handling log (the “operator” and “operation log recorded most recently”). ID ”and“ operation date and time ”). Further, the handling history information record management unit 32 deletes the operation log corresponding to the interrupted work (step S1708). For example, it is assumed that operation information corresponding to the operation log ID “O0001-01” illustrated in FIG. 5 is sequentially recorded, and it is determined that the coping operation interruption operation has been performed after the fifth line is recorded. In this case, the handling history information record management unit 32 deletes the information (information for five lines) and the operation log ID for the operation log ID “O0001-01” recorded so far. After step S1708, the operations after step S1702 are repeated.

なお、対処作業中断操作が行われた後であっても、障害対処操作制御部31は、管理対象システムに発生している障害情報の一覧画面を入出力装置1に表示させ続け、ステップS1702以降の動作が可能な状態にしておく。あるいは、障害対処操作制御部31は、発生している障害情報の一覧画面を対処作業中断操作に伴い閉じてもよい。この場合、ステップS1702以降の動作が可能となるように、その一覧画面の再表示要求が入力された場合には、再度その一覧画面を入出力装置1に表示させればよい。対処作業中断操作が行われた後に表示される障害情報の一覧画面を起点として、それまで作業を行っていた操作者(別の操作者でもよい。)が、障害対処作業を開始することができる   Even after the coping operation interruption operation is performed, the fault coping operation control unit 31 continues to display the list screen of the fault information generated in the managed system on the input / output device 1, and after step S1702 It is in a state that can be operated. Alternatively, the failure handling operation control unit 31 may close the list screen of the failure information that has occurred in response to the handling operation interruption operation. In this case, when a request for redisplaying the list screen is input so that the operation after step S1702 is possible, the list screen may be displayed on the input / output device 1 again. An operator who has been working so far (may be another operator) can start failure handling work starting from the list screen of failure information displayed after the handling operation is interrupted.

操作者は、関連情報の参照や対処コマンドの入力を経て、対処内容を、「適用(対処コマンド実行)」、「承認依頼」、「承認否決」、「障害解決」のいずれかから選択、決定し、対処作業を一旦閉じる。この過程で、障害対処操作制御部31は、図6におけるステップS1604〜S1612の動作を行う。障害対処操作制御部31は、「適用(対処コマンド実行)」、「承認依頼」、「承認否決」、または「障害解決」の実行が指示され、それらの対処内容を実行(ステップS1612)した場合、その旨を対処履歴情報記録管理部32に出力する。対処内容が決定され、その対処内容が実行されたことにより、ある操作者による作業は終了したことになり、再び同一の操作者(あるいは他の操作者)によって作業が開始されたり、あるいはそのまま対処作業が完了したりすることになる。対処履歴情報記録管理部32は、操作者の操作を操作ログに順次記録していくときに、その操作者による作業が終了したことになるのか否かを判定する(ステップS1709)。対処履歴情報記録管理部32は、「適用(対処コマンド実行)」、「承認依頼」、「承認否決」、または「障害解決」を実行した旨の情報を障害対処操作制御部31から受け取った場合、操作者による作業が終了したと判定する(ステップS1709におけるYes)。また、他の操作が行われた情報を受け取った場合には、ステップS1706に移行し、その操作に応じて操作ログへの追加記録を行う。   The operator selects and decides the action to be taken from "Apply (Action command execution)", "Approval request", "Approval rejected", or "Failure resolution" after referring to the related information and entering the action command. Then, the coping operation is temporarily closed. In this process, the failure handling operation control unit 31 performs the operations of steps S1604 to S1612 in FIG. When the failure handling operation control unit 31 is instructed to execute “apply (response command execution)”, “approval request”, “approval rejection”, or “failure resolution”, and executes those countermeasures (step S1612) The fact is output to the handling history information record management unit 32. When the content of the action is determined and the content of the action is executed, the work by a certain operator is completed, and the work is started again by the same operator (or another operator), or the action is taken as it is Work will be completed. The handling history information record management unit 32 determines whether or not the operation by the operator is completed when the operations of the operator are sequentially recorded in the operation log (step S1709). When the response history information record management unit 32 receives information indicating that “application (response command execution)”, “approval request”, “approval rejection”, or “failure resolution” has been executed from the failure handling operation control unit 31 Then, it is determined that the operation by the operator has been completed (Yes in step S1709). If information on another operation is received, the process proceeds to step S1706, and additional recording is performed in the operation log according to the operation.

「適用」、「承認依頼」、「承認否決」、または「障害解決」が実行され、操作者による作業が終了した場合(ステップS1709におけるYes)、対処履歴情報記録管理部32は、操作対処ログにおいて、対処内容、対処コマンド、コメントを記録する。対処内容が、「適用(対処コマンド実行)」の場合は、システム状態監視部2が監視するコマンド適用の成否を障害対処操作制御部31から受け、「結果」として、あわせて操作対処ログに記録する。更に、対処内容が「解決確認」の場合は、対処履歴情報記録管理部32は、解決日時を障害履歴に記録する(S1710)。また、対処内容が「解決確認」の場合、対処履歴情報記録管理部32は、操作対処ログにおける「結果」として「終了」を記録する(図4参照。)。   When “Apply”, “Approval request”, “Approval reject”, or “Failure resolution” is executed and the operation by the operator is completed (Yes in step S1709), the response history information record management unit 32 displays the operation response log. Record the response, response command, and comment. When the countermeasure content is “Apply (Corrective Command Execution)”, the failure handling operation control unit 31 receives the success / failure of command application monitored by the system status monitoring unit 2 and records it as “Result” in the operation countermeasure log. To do. Furthermore, when the countermeasure content is “Solution confirmation”, the countermeasure history information record management unit 32 records the solution date and time in the failure history (S1710). Further, when the countermeasure content is “Solution confirmation”, the countermeasure history information record management unit 32 records “End” as “Result” in the operation countermeasure log (see FIG. 4).

実行された障害対処の内容が、「解決確認」以外の場合は、障害はまだ解決したことにはならない。そのため、再度、同一あるいは別の操作者による対処作業の引継ぎが必要となる。そして、対処作業の引き継ぎが行われ、再度、ステップS1702以降の処理を行う。この場合、先の操作者による操作時において既に障害対処ログは作成されている。従って、対処履歴情報記録管理部32は、ステップS1703において、障害対処ログは存在すると判定する。よって、ステップS1705に移行し、対処履歴情報記録管理部32は、操作者名、操作日時等を、対処ログIDに対応づけて記録する。また、対処履歴情報記録管理部32、新たに操作ログIDを割り当て、対処ログIDと対応付けて障害対処ログに記録する。また、対処履歴情報記録管理部32、新規に割り当てた操作ログIDに対応する操作ログを新たに作成する。そして、ステップS1706以降の処理を行う。   If the content of the executed fault handling is other than “Solution confirmation”, the fault has not yet been solved. Therefore, it is necessary to take over the work again by the same operator or another operator. Then, the handling work is taken over, and the processing from step S1702 is performed again. In this case, a failure handling log has already been created at the time of operation by the previous operator. Accordingly, the handling history information record management unit 32 determines in step S1703 that a fault handling log exists. Therefore, the process proceeds to step S1705, and the handling history information recording management unit 32 records the operator name, the operation date and time, and the like in association with the handling log ID. Further, the handling history information record management unit 32 newly assigns an operation log ID and records it in the fault handling log in association with the handling log ID. Also, the handling history information record management unit 32 creates a new operation log corresponding to the newly assigned operation log ID. And the process after step S1706 is performed.

次に障害対処操作制御部31が生成する障害対処業務のための画面例を図示し、障害対処の作業例について詳細に説明する。図8は、現在発生している障害を一覧表示する画面の例を示す。障害対処操作制御部31は、ステップ1602において、図8に例示する障害の一覧画面を入出力装置1に表示させる。障害対処の業務に就く操作者(opeBとする。)は、図8に例示する一覧画面上のリスト181を参照することによって、serverA上に「未知のエラー」が発生し、未だ対処されていないことを認識することができる。この操作者によって、リスト182のフォーカス182が操作(例えば、マウスクリック)されると、障害対処操作制御部31は、指定された障害の情報を表示するための画面(図9に例示するウィンドウ191)を入出力装置1に表示させる。図8に示すリスト181および図9に示すウィンド191は、発生している障害の情報を表示する画面(発生している障害の情報を操作者に通知するための障害通知画面)であり、ステップS1602で表示される。   Next, an example of a screen for trouble-handling work generated by the trouble-handling operation control unit 31 will be shown, and a trouble-handling work example will be described in detail. FIG. 8 shows an example of a screen for displaying a list of currently occurring failures. In step 1602, the failure handling operation control unit 31 causes the input / output device 1 to display the failure list screen illustrated in FIG. An operator (referred to as opeB) engaged in the trouble handling operation refers to the list 181 on the list screen illustrated in FIG. 8, and an “unknown error” has occurred on serverA, and has not yet been dealt with. I can recognize that. When the operator operates the focus 182 of the list 182 (for example, a mouse click), the failure handling operation control unit 31 displays a screen (window 191 illustrated in FIG. 9) for displaying information on the specified failure. ) Is displayed on the input / output device 1. A list 181 shown in FIG. 8 and a window 191 shown in FIG. 9 are screens for displaying information on the failure that has occurred (failure notification screen for notifying the operator of information on the failure that has occurred). It is displayed in S1602.

図9は、情報参照用ウィンドウの表示例を示す説明図である。障害通知画面の一態様である障害通知ウィンドウ191は、既に述べたように、ステップS1602で表示される。障害通知ウィンドウ191は、選択した障害の分類や、発生箇所、発生日時を表示すると共に、対処状況をリスト192において詳細に表示することが可能である。ただし、障害通知ウィンドウ191を表示した時点では、未対処の状態であるため、図9では、障害対処操作制御部31がリスト192に何も表示させていない場合を示している。図9に例示する障害通知ウィンドウ191において、発生箇所を示す“serverA ”は、ボタン193となっている。ボタン193に対する押下(クリック)操作が行われると、障害対処操作制御部31は、“serverA ”に関する情報を示す他の情報参照用ウィンドウ194を入出力装置1に表示させる(ステップS1603)。さらに、“serverA ”の情報参照用ウィンドウ194に記載されているCPU名称やOS名称、アプリケーション名称、そのサーバで提供されているサービス名称等もボタン195となっている。ボタン195に対するクリック操作が行われると、障害対処操作制御部31は、各ボタンに応じた別の情報参照用ウィンドウを表示させる。   FIG. 9 is an explanatory diagram of a display example of the information reference window. The failure notification window 191 which is an aspect of the failure notification screen is displayed in step S1602 as described above. The failure notification window 191 can display the classification of the selected failure, the occurrence location, the occurrence date and time, and the coping status in detail in the list 192. However, since the failure notification window 191 is not yet handled at the time of displaying the failure notification window 191, FIG. 9 shows a case where the failure handling operation control unit 31 does not display anything in the list 192. In the failure notification window 191 illustrated in FIG. 9, “serverA” indicating the occurrence location is a button 193. When a push (click) operation on the button 193 is performed, the failure handling operation control unit 31 causes the input / output device 1 to display another information reference window 194 indicating information related to “serverA” (step S1603). In addition, a CPU name, an OS name, an application name, a service name provided by the server, and the like described in the information reference window 194 of “serverA” are also buttons 195. When a click operation on the button 195 is performed, the failure handling operation control unit 31 displays another information reference window corresponding to each button.

また、操作者opeBが図9に示す障害通知ウィンドウ191の「対処」ボタンをクリックしたとする。この操作に応じて、障害対処操作制御部31は、図10に例示する障害対処画面(障害対処ウィンドウ111)を入出力装置1に表示させる(図6に示すステップS1604)。障害対処ウィンドウ111は、対処を行う障害に関する情報として、障害分類や発生箇所、発生日時を表示する。また、さらに、障害対処ウィンドウ111は、対処状況を示すリスト112と、発生した障害を解決するために実行する対処コマンドを入力するためのテキストエリア113と、障害対処作業の過程で操作者がコメントを入力するためのテキストエリア114を備える。ただし、障害対処を開始した時点では、図10に示すリスト112、テキストエリア113,114には何も表示されない。障害対処ウィンドウ111は、対処内容を決定するためのボタン(「適用」、「承認依頼」、「承認否決」、「解決確認」の各ボタン)を備えるが、障害対処を開始した時点では対処コマンドも入力されていないため、全て押下(クリック)できない状態となっている。なお、本例では、押下できない状態のボタンを破線で表示している。   Further, it is assumed that the operator opeB clicks the “handling” button in the failure notification window 191 shown in FIG. In response to this operation, the failure handling operation control unit 31 displays the failure handling screen (failure handling window 111) illustrated in FIG. 10 on the input / output device 1 (step S1604 shown in FIG. 6). The failure handling window 111 displays the failure classification, occurrence location, and occurrence date and time as information about the failure to be dealt with. Further, the failure handling window 111 is a list 112 indicating the handling status, a text area 113 for inputting a handling command to be executed in order to solve the occurred failure, and comments made by the operator during the troubleshooting procedure. A text area 114 is provided. However, nothing is displayed in the list 112 and the text areas 113 and 114 shown in FIG. The failure handling window 111 includes buttons (“Apply”, “Approval request”, “Approval reject”, “Solution confirmation” buttons) for determining the action content, but when the failure handling starts, the troubleshooting command Are not entered, and all cannot be pressed (clicked). In this example, the buttons that cannot be pressed are indicated by broken lines.

また、図9に示す障害通知ウインドウ191等と同様、障害対処ウインドウ111でも、発生箇所を示す“serverA ”は、ボタン115となっていて、押下されると、障害対処操作制御部31は、“serverA ”に関する情報を示す情報参照用ウィンドウを入出力装置1に表示させる(図6に示すステップS1605)。なお、障害対処作業を開始した時点から、ボタン193やボタン195等(図9参照)を押下して、何のウインドウを呼び出したかといった情報は、対処履歴情報記録管理部32により操作ログとして記録される。操作者opeBは、関連情報の情報参照用ウインドウを呼び出しながら、発生した障害への対処検討に有効な情報を探索する。その結果、現在発生している障害の症状に類似する事例が、別のサーバ上で発生していた情報を発見し、発生した障害の分類を「httpd無応答」と判断したとする。さらに、操作者opeBは、類似事例で過去に適用された対処コマンドを参照したとする。その場合、入出力装置1は、障害対処ウィンドウ111のテキストエリア113にその対処コマンドを入力される。また、入出力装置1は、障害対処ウィンドウ111のテキストエリア114に操作者opeBのコメントを入力されてもよい。テキストエリア113に対処コマンドが入力されたという操作情報を受け取ると、障害対処操作制御部31は、「適用」ボタンや「承認依頼」ボタンを押下可能な状態に変化させる。そして、操作者opeBは、別の操作者opeAの承認を得るために「承認依頼」ボタンを押下したとする。   Similarly to the failure notification window 191 shown in FIG. 9 and the like, in the failure handling window 111, “serverA” indicating the occurrence location is a button 115, and when pressed, the failure handling operation control unit 31 “ An information reference window indicating information related to serverA "is displayed on the input / output device 1 (step S1605 shown in FIG. 6). Note that information such as what window is called by pressing the button 193, the button 195, etc. (see FIG. 9) from the time when the trouble handling work is started is recorded as an operation log by the handling history information record management unit 32. The The operator opeB searches for information that is effective for examining the handling of the failure that has occurred while calling the information reference window for related information. As a result, it is assumed that a case similar to the symptom of the currently occurring failure has found information that has occurred on another server, and the classification of the occurred failure is determined as “no response to httpd”. Furthermore, it is assumed that the operator opeB refers to a countermeasure command applied in the past in a similar case. In that case, the input / output device 1 inputs the command to the text area 113 of the failure handling window 111. Further, the input / output device 1 may input the comment of the operator opeB in the text area 114 of the failure handling window 111. When receiving the operation information that the handling command has been input to the text area 113, the failure handling operation control unit 31 changes the “Apply” button and the “Approval request” button to a pressable state. Then, it is assumed that the operator opeB presses the “approval request” button to obtain the approval of another operator opeA.

この操作情報を受け取った障害対処操作制御部31は、本当に承認依頼を実行するかを確認するための確認画面を入出力装置1に表示させる(図6に示すステップS1608)。図11は、承認依頼を実行するかを確認するための確認画面の例を示す。図11に示す確認画面(確認ウィンドウ121)は、発生した障害の分類や発生箇所、発生日時を表示する。また、確認ウィンドウ121は、対処内容(本例では「承認依頼」)の実行を確認するメッセージ122と、操作者opeBが入力した対処コマンドの内容123と、操作者opeBが入力したコメント124も表示する。操作者opeBによって「承認依頼」ボタンの押下操作が行われることで、一旦、障害対処作業が閉じられる。また、この時点で、対処履歴情報記録確認部32は、図12に例示する障害対処ログ“L1000 ”の1行目の情報を記録する。2行目および3行の情報はこの時点では記録されない。また、この時点で、障害対処操作制御部31は、システム上の障害情報を一覧するリスト181(図8参照)において、障害の対処状況は「承認待ち」に変更する(図6に示すS1612)。すなわち、図8では、対処状況として「−−」が表示され、具体的な対処状況が示されていなかったが、障害対処操作制御部31は、「−−」という表示を「承認待ち」に変更する   The failure handling operation control unit 31 that has received this operation information causes the input / output device 1 to display a confirmation screen for confirming whether or not to actually execute the approval request (step S1608 shown in FIG. 6). FIG. 11 shows an example of a confirmation screen for confirming whether to execute an approval request. The confirmation screen (confirmation window 121) shown in FIG. 11 displays the classification, the occurrence location, and the occurrence date and time of the failure that has occurred. The confirmation window 121 also displays a message 122 for confirming execution of the countermeasure content (“approval request” in this example), a content 123 of the countermeasure command input by the operator opeB, and a comment 124 input by the operator opeB. To do. When the operator opeB performs an operation of pressing the “approval request” button, the trouble handling work is temporarily closed. At this time, the handling history information record confirmation unit 32 records the information on the first line of the troubleshooting log “L1000” illustrated in FIG. The information in the second and third lines is not recorded at this point. At this time, the failure handling operation control unit 31 changes the handling status of the failure to “waiting for approval” in the list 181 (see FIG. 8) that lists the failure information on the system (S1612 shown in FIG. 6). . That is, in FIG. 8, “-” is displayed as the handling status and the specific handling status is not shown, but the fault handling operation control unit 31 changes the display “-” to “waiting for approval”. change

操作者opeAは、対処状況として「承認待ち」が表示されたリスト181を参照し、障害の対処作業が承認待ちの状態にあることを認め、対処作業に入る。障害対処操作制御部31は、操作者opeAの操作に応じて、障害対処画面(障害対処ウィンドウ111)を入出力装置1に表示させる。障害対処操作制御部31は、このときに表示する障害対処ウィンドウ111において、リスト112に、これまでに行われた対処状況を表示する。操作者opeAは、リスト112を見ることによって、これまでに行われた対処内容を確認することができる。例えば、操作者opeBが承認依頼を行ったこと等を確認することができる。また、テキストエリア113,114には、操作者opeBが入力した対処コマンドやコメントを表示する。したがって、操作者opeAは、障害対処ウインドウ111を見ることによって、前の操作者opeBが入力した対処コマンドやコメントを確認することができる。操作者opeAは、操作者opeB同様、関連情報を参照し、どのような対処コマンドが適切かを判断する。その結果、操作者opeBが入力した対処コマンドが不適切であったと操作者opeAが判断したとする。この場合、操作者opeAは、テキストエリア113内に記述された対処コマンドを修正し、また、テキストエリア114内にコメントを追記する。このときの障害対処ウィンドウ111の例を図13に示す。図13に示す例では、リスト112に、操作者opeBが承認依頼を行ったことが示されている。また、対処コマンド入力のためのテキストエリア113には、操作者opeAにより修正された対処コマンドが入力されている。コメント入力のためのテキストエリア114では、操作者opeAが追記したコメントが操作者opeBのコメントの後に入力されている。操作者opeAが「適用(対処コマンドの実行)」ボタンを押下すると、障害対処操作制御部31は、本当に「適用」を行うか否かを確認する確認画面を入出力装置1に表示する。その画面で、実行する旨の指示が入力されると、障害対処操作制御部31は、入力された対処コマンドを管理対処システムに対して実行し、障害対処作業が閉じられる。   The operator opeA refers to the list 181 in which “waiting for approval” is displayed as the handling status, recognizes that the fault handling work is in a state of waiting for approval, and enters the handling work. The failure handling operation control unit 31 displays a failure handling screen (failure handling window 111) on the input / output device 1 in accordance with the operation of the operator opeA. The failure handling operation control unit 31 displays the status of handling so far in the list 112 in the failure handling window 111 displayed at this time. By looking at the list 112, the operator opeA can confirm the contents of the actions taken so far. For example, it can be confirmed that the operator opeB has requested approval. In the text areas 113 and 114, a countermeasure command and a comment input by the operator opeB are displayed. Therefore, the operator opeA can confirm the coping command or comment input by the previous operator opeB by looking at the failure coping window 111. Like operator opeB, operator opeA refers to related information and determines what type of response command is appropriate. As a result, it is assumed that the operator opeA determines that the countermeasure command input by the operator opeB is inappropriate. In this case, the operator opeA corrects the handling command described in the text area 113 and adds a comment in the text area 114. An example of the failure handling window 111 at this time is shown in FIG. In the example illustrated in FIG. 13, the list 112 indicates that the operator opeB has requested approval. In the text area 113 for inputting a countermeasure command, a countermeasure command corrected by the operator opeA is input. In the text area 114 for inputting a comment, a comment added by the operator opeA is input after the comment of the operator opeB. When the operator opeA presses the “apply (execution of coping command)” button, the fault coping operation control unit 31 displays a confirmation screen on the input / output device 1 for confirming whether or not to really apply “apply”. When an instruction to execute is input on the screen, the failure handling operation control unit 31 executes the entered handling command on the management handling system, and the troubleshooting procedure is closed.

操作者opeAは再度、リスト181を参照し、対処コマンドの実行が成功したことを確認し、再度対処作業に入る。障害対処操作制御部31は、操作者opeAの操作に応じて、障害対処ウィンドウや、関連情報を表示する情報参照用ウィンドウを入出力装置1に表示させる。操作者opeAは、これらのウィンドウ内に示される情報を参照することで、障害が解決したことを確認する。障害対処ウインドウにおいてコメントを入力された後に「解決確認」ボタンが押下されると、障害対処操作制御部31は、障害が解決したと見なしてよいかを確認するための確認画面を表示する。その確認画面で、障害が解決したと見なしてよい旨の指示が入力されると、障害対処操作制御部31は、発生した障害が解決したと見なし、その障害の対処作業が完了する。   The operator opeA refers to the list 181 again, confirms that the countermeasure command has been successfully executed, and enters the countermeasure operation again. The failure handling operation control unit 31 causes the input / output device 1 to display a failure handling window and an information reference window for displaying related information according to the operation of the operator opeA. The operator opeA confirms that the failure has been resolved by referring to the information shown in these windows. When the “solve confirmation” button is pressed after a comment is input in the failure handling window, the failure handling operation control unit 31 displays a confirmation screen for confirming whether or not the failure has been solved. When an instruction indicating that the failure may be resolved is input on the confirmation screen, the failure handling operation control unit 31 regards that the failure that has occurred has been resolved, and the handling operation for the failure is completed.

以上の対処作業完了時の障害対処ログの例を図12に示す。以上の対処作業完了時までに、図12に示す3行目の情報までが障害対処ログとして記録される。図12に示すように、対処にあたった人間や日時、対処内容、コメント修正の過程が記録される。なお、障害分析時に、対応する操作ログを参照すれば、障害対処方法や解決確認の際のどのような情報(ウインドウ)を参照したかも把握可能となる。   An example of the failure handling log when the above handling work is completed is shown in FIG. Up to the completion of the above countermeasure work, the information up to the third line shown in FIG. As shown in FIG. 12, the person who took the countermeasure, the date and time, the contents of the countermeasure, and the process of comment correction are recorded. In addition, when referring to the corresponding operation log at the time of failure analysis, it is possible to grasp what kind of information (window) is referred to when a failure handling method or solution confirmation is made.

なお、既に説明したように、システム状態監視部2は、一度検知した障害への対処状況(誰が対処しているのか、対処の成否等)についても監視し、障害対処操作制御部31に出力する。システム状態監視部2は、入力された対処コマンドを障害対処操作制御部31が管理対処システムに対して実行したときに、管理対処システムの状態がどのように変化したかによって、対処コマンド実行の成否を確認する。そして、システム状態監視部2は、その確認結果を、障害対処操作制御部31に出力する。この確認結果(対処コマンド実行の成否)を受けた障害対処操作制御部31は、図8に示すリスト181において、対処コマンドの実行が成功したか否かを表示する。また、障害対処操作制御部31は、対処コマンドの実行が成功したか否かの情報を、対処履歴情報記録管理部32を介して、図4に例示する障害対処ログに記録する。図8に示すリスト181において、対処コマンドの実行が成功したか否かが「対処状況」として表示されるので、上記の例でも、操作者opeAはリスト181を参照し、対処コマンドの実行が成功したことを確認できる。   As described above, the system status monitoring unit 2 also monitors the status of handling a fault once detected (who is handling it, success or failure of the handling, etc.) and outputs it to the fault handling operation control unit 31. . The system status monitoring unit 2 determines whether or not the response command execution is successful depending on how the status of the management response system changes when the failure response operation control unit 31 executes the input response command on the management response system. Confirm. Then, the system state monitoring unit 2 outputs the confirmation result to the failure handling operation control unit 31. The failure handling operation control unit 31 that has received the confirmation result (success / failure of execution of the handling command) displays whether or not the handling command has been successfully executed in the list 181 shown in FIG. Also, the failure handling operation control unit 31 records information on whether or not the handling command has been successfully executed in the failure handling log illustrated in FIG. 4 via the handling history information record management unit 32. In the list 181 shown in FIG. 8, whether or not the execution of the countermeasure command is successful is displayed as “Countermeasure status”. Therefore, in the above example, the operator opeA refers to the list 181 and the execution of the countermeasure command is successful. You can confirm that

図8に示すように、症状としてEventB1 が発生した場合、その症状は、「未知のエラー(未知の障害)」として分類されていた。障害分析操作制御部41は、障害分析を行う操作者(ここでは、管理者adminAとする。)による操作に従い、障害分類情報内の「未知の障害」という記述およびその記述に対応するコメントを、既知の障害分類に変更する。このとき、管理者adminAは、障害対処作業時に作成された障害履歴、障害対処ログ、操作ログ等を参照して、「未知の障害」をどの障害分類に変更すればよいかを判断すればよい。本例では、管理者adminAは「未知の障害」を「 httpd無応答」に変更すると判断する。そして、障害分析操作制御部41は、「未知の障害」を「 httpd無応答」に変更する操作が入出力装置1で行われると、その操作に応じて、障害情報保存部5に記憶されている障害分類情報における「未知の障害」を「 httpd無応答」に書き換える。   As shown in FIG. 8, when EventB1 occurred as a symptom, the symptom was classified as “unknown error (unknown failure)”. The failure analysis operation control unit 41 follows a description of “unknown failure” in the failure classification information and a comment corresponding to the description in accordance with an operation by an operator who performs failure analysis (here, administrator adminA). Change to a known failure classification. At this time, the administrator adminA may determine which fault classification should be changed from “unknown fault” by referring to the fault history, fault handling log, operation log, etc. created during the fault handling work. . In this example, the administrator adminA determines to change “unknown failure” to “httpd no response”. Then, when an operation to change “unknown failure” to “httpd no response” is performed in the input / output device 1, the failure analysis operation control unit 41 stores the failure in the failure information storage unit 5 according to the operation. Rewrite “unknown failure” in the failure classification information to “httpd no response”.

また、障害分析操作制御部41は、分析を行う操作者の操作に応じて、過去に発生した各障害の一覧情報を表示する画面、および障害対処時に行われた個々の操作に関するログを表示する画面を含む一連の画面を生成し、入出力装置1に表示させる。障害分析操作制御部41は、過去に発生した各障害の一覧情報を表示する画面として、例えば、図14に例示する画面を表示する。障害分析操作制御部41は、図14に例示する画面上に表示された障害を選択する操作が入出力装置1で行われると、その障害の対処履歴を表示する画面を入出力装置1に表示させる。この画面の例を図15(a)に示す。障害分析操作制御部41は、図15(a)に例示する画面上で、障害分類、障害が発生した箇所、発生日時、解決日時、対処履歴等を表示する。また、図15(a)に示す例では、その障害発生時の対処で用いた対処コマンドや、障害対処を行った操作者のコメントも表示している。図15(a)に示す対処履歴では、対処が完了するまでに実行された対処内容(「適用」、「承認依頼」、「障害解決」)が示されている。図15(a)では示していないが、対処履歴において「承認否決」が示されていてもよい。図15(a)に示す対処履歴では、操作日時、操作者、対処内容を示しているが、これらの情報は、障害対処ログの記録に基づいて表示すればよい。対処コマンドやコメントについても同様に障害対処ログの記録に基づいて表示すればよい。障害が発生した箇所、発生日時、解決日時に関しては、障害履歴の記録に基づいて表示すればよい。   Also, the failure analysis operation control unit 41 displays a screen for displaying a list of each failure that has occurred in the past and a log regarding each operation performed at the time of handling the failure according to the operation of the operator performing the analysis. A series of screens including the screen are generated and displayed on the input / output device 1. The failure analysis operation control unit 41 displays, for example, a screen illustrated in FIG. 14 as a screen for displaying list information of each failure that has occurred in the past. When the operation for selecting the failure displayed on the screen illustrated in FIG. 14 is performed on the input / output device 1, the failure analysis operation control unit 41 displays a screen on the input / output device 1 for displaying a history of handling the failure. Let An example of this screen is shown in FIG. The failure analysis operation control unit 41 displays a failure classification, a location where a failure has occurred, an occurrence date and time, a solution date and time, a handling history, and the like on the screen illustrated in FIG. Further, in the example shown in FIG. 15A, a countermeasure command used in dealing with the failure and a comment of the operator who has dealt with the failure are also displayed. In the countermeasure history shown in FIG. 15A, the countermeasure contents ("Apply", "Approval request", "Fault resolution") executed until the countermeasure is completed are shown. Although not shown in FIG. 15A, “approval rejection” may be indicated in the handling history. The handling history shown in FIG. 15A shows the operation date and time, the operator, and the contents of the handling. These pieces of information may be displayed based on the recording of the fault handling log. Similarly, the response command and the comment may be displayed based on the record of the failure response log. The location where the failure has occurred, the occurrence date and time, and the solution date and time may be displayed based on the record of the failure history.

障害分析操作制御部41は、図15(a)に例示する画面の対処履歴表示欄に表示された対処内容が選択されると、その対処内容を実行するまでの間に行われた各操作を示す操作ログを表示する画面(図15(b)参照)を表示する。図15(b)に例示する画面では、操作ログの他に、障害分類( httpd無応答)、操作者(opeA)、対処内容の種類(「適用」)、実行した対処コマンド等を表示している。   When the countermeasure content displayed in the countermeasure history display field on the screen illustrated in FIG. 15A is selected, the failure analysis operation control unit 41 performs each operation performed until the countermeasure content is executed. A screen (see FIG. 15B) for displaying the operation log to be displayed is displayed. In the screen illustrated in FIG. 15B, in addition to the operation log, the failure classification (httpd no response), the operator (opeA), the type of countermeasure content ("Apply"), the countermeasure command executed, etc. are displayed. Yes.

また、図15に示す例では、画面上に表示された「 httpd無応答」、「serverA 」、「メールサーバ1」等の表示はボタンになっている。そしれ、これらのボタンを押下する操作が行われると、障害分析操作制御部41は、障害に関連する情報を表示する画面を表示する。例えば、「 httpd無応答」という障害に関する情報を表示する画面、「serverA 」という障害発生箇所の情報を表示する画面、「メールサーバ1」という障害の影響を受けたサービスの情報を表示する画面等を表示する。これらの画面は、図6に示すステップS1603,S1604で表示される画面(図9に例示する情報参照用ウィンドウ194)と共通であってもよい。   In the example shown in FIG. 15, “httpd no response”, “serverA”, “mail server 1”, and the like displayed on the screen are buttons. If an operation of pressing these buttons is performed, the failure analysis operation control unit 41 displays a screen for displaying information related to the failure. For example, a screen that displays information about the failure “httpd no response”, a screen that displays information about the location of the failure “serverA”, a screen that displays information about the service affected by the failure “mail server 1”, etc. Is displayed. These screens may be the same as the screen displayed in steps S1603 and S1604 shown in FIG. 6 (information reference window 194 illustrated in FIG. 9).

なお、障害分析操作制御部41は、操作者の権限の有無を認証等によって確認し、所定の権限を有する分析操作者に対してのみ操作ログを表示してもよい。   The failure analysis operation control unit 41 may confirm whether or not the operator has authority by authentication or the like, and may display an operation log only for an analysis operator having a predetermined authority.

なお、図15に示す画面は例示であり、障害分析操作制御部41は、図14で選択された障害に応じた画面を表示すればよい。   Note that the screen shown in FIG. 15 is an example, and the failure analysis operation control unit 41 may display a screen corresponding to the failure selected in FIG.

以上のような障害分析操作制御部41の動作により、分析作業に就く管理者adminAは、障害履歴や障害対処時に生成された障害履歴、障害対処ログ、操作ログの記録内容を参照することができ、分析を行うことができる。また、分析の一態様として、未知の障害を既知の障害に変更することができる。さらに、障害の分類、上手く対処できた対処事例、もしくは失敗した対処事例等を分析材料とし、障害原因追求や再発防止、推奨する対処方法の検討等といった、障害分析業務の目的を効率的に遂行することができる。また、障害分析操作制御部41は、操作者の操作に応じて、障害の発生頻度や分布、要した復旧時間、障害によって被った被害等を表示する画面を、障害情報保存部5が記憶する各種情報に基づいて表示してもよい。そして、分析を行う操作者、これらの情報を分析材料として用いてもよい。   By the operation of the failure analysis operation control unit 41 as described above, the administrator adminA who performs the analysis work can refer to the failure history, the failure history generated at the time of failure handling, the failure handling log, and the operation log. Can do the analysis. As an aspect of the analysis, an unknown failure can be changed to a known failure. In addition, failure analysis tasks such as pursuing the cause of failure, preventing recurrence, and examining recommended countermeasures, etc. are efficiently performed using failure classification, successful response cases, or failed response cases as analysis materials. can do. In addition, the failure analysis operation control unit 41 stores a screen for displaying the frequency and distribution of failures, the required recovery time, damage caused by the failure, and the like according to the operation of the operator. You may display based on various information. Then, the operator who performs the analysis and these pieces of information may be used as analysis materials.

管理者adminAによって、障害分類情報における「未知の障害」が「 httpd無応答」に変更された後、再度、同様の障害が発生したとする。このときには、障害対処操作制御部31は、「未知の障害」ではなく、既知の障害である「 httpd無応答」が発生したことを通知する。例えば、ステップS1604で表示される障害対処画面では、図16(a)に示すように、障害対処ウィンドウ111内に「 httpd無応答」という情報が示される。図10に例示する障害対処ウィンドウ111を表示する段階では障害の種類を分類できていなかったので「未知のエラー」と表示されている(図10参照)。   Assume that a similar failure occurs again after the administrator “adminA” changes “unknown failure” in the failure classification information to “httpd no response”. At this time, the failure handling operation control unit 31 notifies that “httpd no response”, which is a known failure, has occurred instead of the “unknown failure”. For example, in the failure handling screen displayed in step S1604, information “httpd no response” is displayed in the failure handling window 111 as shown in FIG. At the stage of displaying the failure handling window 111 illustrated in FIG. 10, the type of failure could not be classified, so “unknown error” is displayed (see FIG. 10).

また、障害対処操作制御部31は、「 httpd無応答」という表示をボタン117として表示する。このボタン117の押下操作が行われた場合、障害対処操作制御部31は、図16(b)に例示する情報参照用ウィンドウ196を表示する(図6に示すステップS1605)。分析時に、既知の障害の症状例を入力して障害情報保存部5に記憶されることが可能であり、そのような情報や各種記録(各種履歴やログ等)に基づいて、障害対処操作制御部31は、情報参照用ウィンドウ196内に症状例や障害履歴を表示する。この結果、以前と同様の障害が発生した場合、操作者は、情報参照用ウィンドウ196を見ることによって、効率的かつ安全に対処作業を進めることが可能となる。   Further, the failure handling operation control unit 31 displays “httpd no response” as a button 117. When the button 117 is pressed, the failure handling operation control unit 31 displays an information reference window 196 illustrated in FIG. 16B (step S1605 shown in FIG. 6). At the time of analysis, it is possible to input a symptom example of a known failure and store it in the failure information storage unit 5. Based on such information and various records (various histories, logs, etc.), troubleshooting operation control The unit 31 displays a symptom example and a failure history in the information reference window 196. As a result, when the same failure as before occurs, the operator can proceed with the work efficiently and safely by looking at the information reference window 196.

本実施の形態によれば、障害対処作業において、操作者に対処開始から解決確認までの操作を、情報参照用ウィンドウを作業者に参照させつつ、障害対処に用いられる一連の画面に沿って行わせることが可能となる。その結果、柔軟な情報参照の手段を提供した上で、的確に操作者を誘導できる。障害対処作業中に、操作ログを参照可能としてまうと、障害対処という目的意識を希薄化させて、対処を行っているのか分析を行っているのかが不明瞭になってしまう。しかし、上記のように、分析対処時には障害対処に用いられる一連の画面に沿って操作を行わせることが可能となるので、対処を行っているのか分析を行っているのかが不明瞭になることはない。   According to the present embodiment, in the trouble handling work, the operation from the start of the action to the confirmation of the solution is performed along the series of screens used for the trouble handling while referring the information reference window to the operator. It becomes possible to make it. As a result, it is possible to accurately guide the operator while providing a flexible information reference means. If it is possible to refer to the operation log during the troubleshooting operation, it becomes unclear whether the countermeasure is being analyzed or analyzed by diluting the purpose of troubleshooting. However, as described above, it is possible to perform operations along a series of screens used for troubleshooting when dealing with analysis, so it is unclear whether you are dealing with or analyzing. There is no.

同様に、分析対処作業では、情報参照用ウィンドウを作業者に参照させつつ、障害分析に用いられる一連の画面に沿って作業を行わせることができる。例えば、分析作業中に、図13に例示するような対処内容を選択させるための画面は表示されないので、分析を行っているのか対処を行っているのかが不明瞭になってしまうことがない。   Similarly, in the analysis coping work, it is possible to perform work along a series of screens used for failure analysis while referring to the information reference window. For example, during the analysis work, since the screen for selecting the countermeasure content as illustrated in FIG. 13 is not displayed, it is not unclear whether the analysis is being performed or the countermeasure is being performed.

また、本実施の形態によれば、対処作業を中断した場合(図7に示すステップS1707におけるYesの場合)を除く対処内容や操作ログを確実に記録する。そして、障害分析操作制御部41は、分析を行う操作者に、障害分析に用いられる一連の画面の1つとして、操作ログを表示する画面を提供する。よって、対処作業を行った操作者の操作を分析者に提示して、分析を行わせることができる。また、対処作業を中断した場合、対処履歴情報記録管理部32は、作成中の操作ログおよびその操作ログに対応する障害対処ログを削除するので、分析作業者に見せる必要のない無駄な操作ログやその操作ログに対応する障害対処ログを排除することができる。   In addition, according to the present embodiment, the countermeasure contents and the operation log are reliably recorded except when the countermeasure work is interrupted (Yes in step S1707 shown in FIG. 7). Then, the failure analysis operation control unit 41 provides a screen for displaying an operation log as one of a series of screens used for failure analysis to the operator who performs the analysis. Therefore, the operation of the operator who has performed the coping work can be presented to the analyst, and the analysis can be performed. In addition, when the handling work is interrupted, the handling history information record management unit 32 deletes the operation log being created and the fault handling log corresponding to the operation log, so that a wasteful operation log that does not need to be shown to the analysis operator And the troubleshooting log corresponding to the operation log can be eliminated.

なお、本実施の形態において、図17に示すように、障害対処操作制御部31に対応する入出力装置1と、障害分析操作制御部41に対応する入出力装置11とを別々に備える構成としてもよい。図17に示す入出力装置1は、対処を行う操作者によって使用され、図17に示す入出力装置11は、分析を行う操作者によって使用される。このように対処操作のための入出力装置1と、分析操作のための入出力装置11とを別々に設け、入出力装置の用途を対処と分析とで明確に区別することで、発生した障害の対処と分析の作業を並行して別の人間が進めることや、対処と分析とを遠距離で行うことが可能となる。   In the present embodiment, as shown in FIG. 17, the input / output device 1 corresponding to the failure handling operation control unit 31 and the input / output device 11 corresponding to the failure analysis operation control unit 41 are separately provided. Also good. The input / output device 1 shown in FIG. 17 is used by an operator who performs a countermeasure, and the input / output device 11 shown in FIG. 17 is used by an operator who performs an analysis. In this way, the input / output device 1 for coping operation and the input / output device 11 for analyzing operation are separately provided, and the use of the input / output device is clearly distinguished from coping and analysis, thereby causing a failure. It is possible for another person to proceed with the coping and analysis work in parallel, and to perform the coping and analysis at a long distance.

第1の実施の形態において、特許請求の範囲に記載の障害情報記憶手段は、障害情報保存部5によって実現される。障害対処支援手段は、障害対処操作制御部31および入出力装置1によって実現される。対処履歴情報記録管理手段は、対処履歴情報記録管理部32によって実現される。障害分析支援手段は、障害分析操作制御部41および入出力装置1(または入出力装置11)によって実現される。システム状態監視手段は、システム状態監視部2によって実現される。障害対処操作制御手段は、障害対処操作制御部31によって実現される。障害分析操作制御手段は、障害分析操作制御部41によって実現される。   In the first embodiment, the failure information storage unit described in the claims is realized by the failure information storage unit 5. The failure handling support means is realized by the failure handling operation control unit 31 and the input / output device 1. The handling history information record management means is realized by the handling history information record management unit 32. The failure analysis support means is realized by the failure analysis operation control unit 41 and the input / output device 1 (or the input / output device 11). The system state monitoring unit is realized by the system state monitoring unit 2. The failure handling operation control means is realized by the failure handling operation control unit 31. The failure analysis operation control means is realized by the failure analysis operation control unit 41.

実施の形態2.
図18は、本発明の第2の実施の形態を示すブロック図である。第1の実施の形態と同様の構成部については、図1と同一の符号を付し、説明を省略する。第2の実施の形態においてシステム運用管理支援装置は、第1の実施の形態に示す構成に加え、操作画面ルール保存部6を備える。また、本実施の形態では、障害対処プロセス制御部3は、障害対処操作画面生成部33を備える。
Embodiment 2. FIG.
FIG. 18 is a block diagram showing a second embodiment of the present invention. The same components as those in the first embodiment are denoted by the same reference numerals as those in FIG. In the second embodiment, the system operation management support apparatus includes an operation screen rule storage unit 6 in addition to the configuration shown in the first embodiment. In the present embodiment, the failure handling process control unit 3 includes a failure handling operation screen generation unit 33.

本実施の形態では、特に操作画面ルール保存部6と、障害対処操作画面生成部33とが重要な役割を果たす。操作画面ルール保存部6は、操作画面に表示する情報やボタン、画面遷移等を規定した操作画面ルールを記憶する。障害対処操作画面生成部33は、その操作画面ルールに従って各種画面を生成する。   In the present embodiment, the operation screen rule storage unit 6 and the failure handling operation screen generation unit 33 particularly play an important role. The operation screen rule storage unit 6 stores operation screen rules that define information, buttons, screen transitions, and the like displayed on the operation screen. The failure handling operation screen generation unit 33 generates various screens according to the operation screen rule.

操作画面ルール保存部6は、画面(ここでは、障害対処作業において用いられる画面とする。)の表示態様を規定する操作画面ルールを記憶する。操作画面ルールは、画面上に表示する情報、ボタン、画面遷移等を規定する。また、操作画面ルールは、画面に表示する色(例えば、背景色等)も規定する。   The operation screen rule storage unit 6 stores an operation screen rule that defines a display mode of a screen (here, a screen used in a failure handling operation). The operation screen rule defines information to be displayed on the screen, buttons, screen transitions, and the like. The operation screen rule also defines a color (for example, background color) to be displayed on the screen.

図19は、操作画面ルールの例を示す説明図である。図19に示すように、操作画面ルールは、基本の設定として、配色等を規定する。また、操作画面ルールには、各ウィンドウ毎に、各ウィンドウを識別するための操作ウィンドウIDや名称、ウインドウ上に表示する情報、ボタン等の規定が記載されている。ボタンに関する規定として、例えば、画面に表示される際のラベル名称、ボタンID、操作内容や操作可能な条件が記載されている。ボタンの操作内容としては、例えば、「別のウインドウを呼び出す。」、「操作ウインドウを別ウインドウへ移行させる。」、「指定ウインドウを閉じる。」等の操作がある。そして、移行するウインドウの規定を変更することにより、操作時における画面遷移が変更されることになる。   FIG. 19 is an explanatory diagram of an example of the operation screen rule. As shown in FIG. 19, the operation screen rule defines a color scheme or the like as a basic setting. In addition, the operation screen rule describes, for each window, an operation window ID and name for identifying each window, information displayed on the window, buttons, and the like. For example, a label name, a button ID, an operation content, and an operable condition are described as the button-related regulations. The operation contents of the buttons include, for example, operations such as “call another window”, “move the operation window to another window”, and “close designated window”. And the screen transition at the time of operation will be changed by changing the rule of the window to transfer.

また、操作画面ルールでは、基本設定とは別に個別の設定として、対処すべきイベントを指定した操作画面ルールを記載してもよい。この場合、指定されたイベントが発生した場合の対処作業に限り、基本設定は異なる操作画面の態様を規定することになる。個別の設定は、例えば、個々の障害の症状毎に記載される。図19に示す例では、原則的に背景色を“#FFFFFF (白色)”とすることが基本設定タグにおいて記載されている。また、個別設定タグにおいて、症状“EventA” を対処するための操作画面は全て、背景色が“#999999 (灰色)”になるように設定されている。   In the operation screen rule, an operation screen rule specifying an event to be dealt with may be described as an individual setting separately from the basic setting. In this case, the basic setting defines different operation screen modes only for the work to be performed when the specified event occurs. The individual setting is described for each symptom of an individual disorder, for example. In the example shown in FIG. 19, the basic setting tag describes that the background color is “#FFFFFF (white)” in principle. In the individual setting tag, all the operation screens for dealing with the symptom “EventA” are set so that the background color is “# 999999 (gray)”.

障害対処操作画面生成部33は、障害対処操作制御部31が出力した情報と、操作画面ルール保存部6が記憶する操作画面ルールとに基づいて操作画面を生成し、障害対処操作制御部31に出力する。障害対処操作画面生成部33が操作画面を生成するときに、障害対処操作制御部31は、障害対処操作画面生成部33に対して、障害対処操作画面生成部33が参照すべき操作画面ルールを特定可能な情報を出力する。例えば、障害対処操作制御部31は、生成すべき画面(ウィンドウ)を指定する情報(具体的にはウィンドウID)および対処中の症状を出力する。障害対処操作画面生成部33は、障害対処操作制御部31が出力したこれらの情報に基づいて、操作画面ルール保存部6に記憶される操作画面ルール中から、指定されたウィンドウIDに対応する操作画面ルールの記載箇所や個別設定の記載箇所等を特定し、その箇所に記載されたルールを参照する。そして、障害対処操作画面生成部33は、そのルールに基づいて、配置する情報(表示すべきボタン等)や色等を決定し、画面(ウィンドウ)を生成する。また、その画面上で禁止すべき操作がルールにおいて指定されている場合、その操作が行えないように画面を生成する。   The failure handling operation screen generation unit 33 generates an operation screen based on the information output from the failure handling operation control unit 31 and the operation screen rules stored in the operation screen rule storage unit 6, and sends the operation screen to the failure handling operation control unit 31. Output. When the failure handling operation screen generation unit 33 generates an operation screen, the failure handling operation control unit 31 gives an operation screen rule to be referred to by the failure handling operation screen generation unit 33 to the failure handling operation screen generation unit 33. Output identifiable information. For example, the failure handling operation control unit 31 outputs information (specifically, a window ID) specifying a screen (window) to be generated and a symptom being handled. The failure handling operation screen generation unit 33 performs an operation corresponding to the specified window ID from among the operation screen rules stored in the operation screen rule storage unit 6 based on the information output by the failure handling operation control unit 31. The description location of the screen rule, the description location of the individual setting, etc. are specified, and the rule described in that location is referred to. Then, the failure handling operation screen generation unit 33 determines information to be arranged (buttons to be displayed), colors, and the like based on the rules, and generates a screen (window). Further, when an operation to be prohibited on the screen is specified in the rule, the screen is generated so that the operation cannot be performed.

また、入出力装置1において操作者によって入力されたが、未だ障害情報保存部5に記録されていない情報を画面上に表示させる場合には、障害対処操作制御部31は、その情報を障害対処操作画面生成部33に出力してもよい。そして、障害対処操作画面生成部33は、その情報を表示する画面を生成してもよい。例えば、入出力装置1に入力されたコメントや対処コマンドは、入力時に直ちに障害対処ログ(図4参照。)に記録されるわけではなく、対処内容(「適用」等)が実行され、ステップS1710(図7参照。)に移行したときに障害対処ログに記録される。対処内容(「適用」等)が実行される前に、入力されたコメントや対処コマンドの情報を表示する画面を新たに生成する場合には、障害対処操作制御部31は、そのコメントや対処コマンドの情報を障害対処操作画面生成部33に出力し、障害対処操作画面生成部33がその情報を含む画面を生成してもよい。   Further, when information on the input / output device 1 that is input by the operator but is not yet recorded in the failure information storage unit 5 is displayed on the screen, the failure handling operation control unit 31 handles the information as a failure handling. You may output to the operation screen production | generation part 33. FIG. Then, the failure handling operation screen generation unit 33 may generate a screen for displaying the information. For example, comments and response commands input to the input / output device 1 are not immediately recorded in the failure response log (see FIG. 4) at the time of input, but the content of the response (such as “apply”) is executed, and step S1710 is performed. It is recorded in the trouble handling log when shifting to (see FIG. 7). When a new screen for displaying the input comment or information of the handling command is generated before the handling content ("Apply" or the like) is executed, the fault handling operation control unit 31 displays the comment or handling command. May be output to the failure handling operation screen generation unit 33, and the failure handling operation screen generation unit 33 may generate a screen including the information.

障害対処操作制御部31は、障害対処操作画面生成部33から生成された画面を受け取ると、その画面を入出力装置1に表示させる。   When the failure handling operation control unit 31 receives the screen generated from the failure handling operation screen generation unit 33, the failure handling operation control unit 31 displays the screen on the input / output device 1.

また、本実施の形態では、障害分析操作制御部41は、分析時に用いられる一連の画面として、操作画面ルール保存部6が記憶する操作画面ルールの編集画面を含む一連の画面を出力する。すなわち、障害分析操作制御部41は、過去に発生した各障害の一覧情報を表示する画面、障害対処時に行われた個々の操作に関するログを表示する画面、および操作画面ルールの編集画面を含む一連の画面を入出力装置1に表示させる。   Further, in the present embodiment, the failure analysis operation control unit 41 outputs a series of screens including an operation screen rule editing screen stored in the operation screen rule storage unit 6 as a series of screens used at the time of analysis. That is, the failure analysis operation control unit 41 includes a series of screens that display a list of each failure that has occurred in the past, a screen that displays a log relating to each operation performed during troubleshooting, and a screen for editing an operation screen rule. Is displayed on the input / output device 1.

障害分析操作制御部41は、操作画面ルールの編集画面において操作画面ルールの編集が行われると、操作画面ルール保存部6が記憶する操作画面ルールを編集後の操作画面ルールに更新する。   When the operation screen rule is edited on the operation screen rule editing screen, the failure analysis operation control unit 41 updates the operation screen rule stored in the operation screen rule storage unit 6 to the edited operation screen rule.

操作画面ルールの編集画面は、例えば、一般的なテキストエディタと同様の編集画面であってもよい。障害分析操作制御部41は、操作画面ルール保存部6が記憶する操作画面ルールを表示し、分析を行う操作者の操作に応じて操作画面ルールを変更してもよい。ただし、分析を行う操作者は、発生した障害の情報を表示する画面、および障害対処の内容の選択を操作者に促す画面を含む一連の画面が障害対処操作制御部31によって出力されるという原則を崩さないように編集を行わなければならない。例えば、図10に例示するような障害対処画面が表示されなくなるように操作画面ルールを編集してはならない。また、例えば、障害対処時に用いられる一連の画面の中に操作ログを表示する画面が含まれるようにするといった操作画面ルールの編集も行ってはならない。このような編集を認めると、第1の実施の形態で説明した「対処を行っているのか分析を行っているのかが不明瞭になることはない。」という効果が得られなくなってしまう。   The operation screen rule editing screen may be an editing screen similar to a general text editor, for example. The failure analysis operation control unit 41 may display the operation screen rule stored in the operation screen rule storage unit 6 and change the operation screen rule according to the operation of the operator who performs the analysis. However, the principle that the operator who performs the analysis outputs a series of screens including a screen that displays information on the failure that has occurred and a screen that prompts the operator to select the content of the failure handling is output by the failure handling operation control unit 31. Editing must be done so as not to break down. For example, the operation screen rule should not be edited so that the failure handling screen illustrated in FIG. 10 is not displayed. In addition, for example, the operation screen rule must not be edited such that a screen for displaying an operation log is included in a series of screens used when dealing with a failure. If such editing is permitted, the effect of “whether the countermeasure is being taken or the analysis is not obscured” described in the first embodiment cannot be obtained.

障害分析操作制御部41が操作画面ルールの編集画面として一般的なテキストエディタと同様の編集画面を提供する場合、上記のような行ってはならない操作画面ルールの編集が行われてしまうおそれがある。そのため、障害分析操作制御部41は、編集内容に制約を設けた操作画面ルールの編集画面を入出力装置1に表示させることが好ましい。編集内容に制約を設けた操作画面ルールの編集画面については後述する。   When the failure analysis operation control unit 41 provides an edit screen similar to a general text editor as an operation screen rule edit screen, the operation screen rule that should not be performed as described above may be edited. . Therefore, it is preferable that the failure analysis operation control unit 41 causes the input / output device 1 to display an operation screen rule editing screen in which restrictions are imposed on editing contents. The operation screen rule editing screen with restrictions on editing contents will be described later.

障害対処操作画面生成部33は、例えば、システム運用管理支援プログラムに従って動作するCPUによって実現される。そのシステム運用管理支援プログラムは、例えば障害対策プロセス制御部3が備える記憶装置(図示せず。)に記憶させておけばよい。   The failure handling operation screen generation unit 33 is realized by a CPU that operates according to a system operation management support program, for example. The system operation management support program may be stored in a storage device (not shown) provided in the failure countermeasure process control unit 3, for example.

次に、操作画面ルールを変更した場合に、障害対処操作画面生成部33が生成する画面がどのように変化するのかについて説明する。ここでは、図3に示す障害履歴が障害情報保存部6に記憶されているものとする。そして、図3に示す履歴ID“H1000 ”に対応する対処ログID“L1000 ”が割り当てられた障害対処ログとして図12に示す障害対処ログが障害情報保存部6に記憶されているものとする。さらに、図12に示す操作ログID“O1000-01”,“O1000-02”,“O1000-03”が割り当てられた操作ログとして、図20に示す操作ログが障害情報保存部6に記憶されているものとする。これらの記録は、症状として“EventB”が発生したときに記録されたものであるとする。   Next, how the screen generated by the failure handling operation screen generation unit 33 changes when the operation screen rule is changed will be described. Here, it is assumed that the failure history shown in FIG. 3 is stored in the failure information storage unit 6. Then, it is assumed that the failure handling log illustrated in FIG. 12 is stored in the failure information storage unit 6 as the failure handling log to which the handling log ID “L1000” corresponding to the history ID “H1000” illustrated in FIG. Furthermore, the operation log shown in FIG. 20 is stored in the failure information storage unit 6 as an operation log assigned with the operation log IDs “O1000-01”, “O1000-02”, and “O1000-03” shown in FIG. It shall be. These records are recorded when “EventB” occurs as a symptom.

障害分析操作制御部41は、図3に示す障害履歴および図12に示す障害対処ログの内容を示す画面や、図20に示す操作ログの内容を示す画面を、障害分析業務に就く操作者(adminAとする。)の操作に応じて入出力装置1に表示する。操作者adminAは、図3に示す障害履歴の内容を参照して、障害が発生していたことを確認し、また、図12に示す障害対処ログの内容を参照して、誰がどのような対処内容を実行して障害解決に至ったかを確認する。図12に示す障害対処ログの内容から、opeAが対処コマンドの承認依頼を行い、opeBがその対処コマンド(コマンドパス)を修正して対処コマンドを実行し、さらにopeBが障害が解決したことを確認したという経過がわかる。   The failure analysis operation control unit 41 displays the screen showing the failure history shown in FIG. 3 and the content of the failure handling log shown in FIG. 12 and the screen showing the content of the operation log shown in FIG. It is displayed on the input / output device 1 according to the operation of adminA). The operator adminA confirms that a failure has occurred by referring to the content of the failure history shown in FIG. 3, and refers to the content of the failure handling log shown in FIG. Execute the contents to check whether the failure has been resolved. From the troubleshooting log shown in Figure 12, opeA requests approval of the handling command, opeB modifies the handling command (command path), executes the handling command, and confirms that opeB has solved the fault You can see the progress.

また、操作者adminAは、図20に示す操作ログの内容を参照して、各操作者opeA,opeBによる個々の操作を確認する。図20に示す操作ログの内容から、対処時にwin0005 をwin0003 経由で呼び出してwin0005 を開いたままの状態で(すなわち、win0005 を参照しながら)対処コマンドを入力していることが読みとれる。また、win0002 やwin0003 は表示されてもすぐに閉じられているので(図20に示す“O1000-01”参照。)、win0002 やwin0003 は障害対処にあまり有益でない情報を表示する画面であったことが読みとれる。   Further, the operator adminA refers to the contents of the operation log shown in FIG. 20 and confirms individual operations by the operators opeA and opeB. From the contents of the operation log shown in FIG. 20, it can be read that win0005 is called through win0003 and win0005 is input while win0005 is open (that is, referring to win0005). In addition, since win0002 and win0003 are closed immediately after being displayed (see “O1000-01” shown in FIG. 20), win0002 and win0003 were screens that displayed information that was not very useful for troubleshooting. Can be read.

opeAやopeBがwin0003 を経由してwin0005 を表示させている状況を図21に示す。障害対処画面111が表示されたのち、操作者(opeA,opeB)は、ボタン“serverA ”をクリックした。この操作に応じて障害対処操作制御部31は、図21に示す情報参照用ウィンドウ131を入出力装置1に表示する。この情報参照用ウィンドウ131を識別するIDは、操作ログに記録されているwin0003 である。操作者はウィンドウ131内のボタン“メールサーバ1”をクリックした。この操作に応じて障害対処操作制御部31は、図21に示す情報参照用ウィンドウ132を入出力装置1に表示する。この情報参照用ウィンドウ132を識別するIDは、操作ログに記録されているwin0005 である。このような操作者の操作により、図20に示す操作ログが記録される。なお、情報参照用ウィンドウ132が示す内容は、システム状態監視部2が収集した情報である。   FIG. 21 shows a situation where opeA and opeB are displaying win0005 via win0003. After the failure handling screen 111 is displayed, the operator (opeA, opeB) clicks the button “serverA”. In response to this operation, the failure handling operation control unit 31 displays an information reference window 131 shown in FIG. The ID for identifying the information reference window 131 is win0003 recorded in the operation log. The operator clicked the button “Mail server 1” in the window 131. In response to this operation, the failure handling operation control unit 31 displays an information reference window 132 shown in FIG. The ID for identifying the information reference window 132 is win0005 recorded in the operation log. The operation log shown in FIG. 20 is recorded by such an operation of the operator. The information shown in the information reference window 132 is information collected by the system state monitoring unit 2.

操作者adminAは、図20に示す操作ログに基づいて、win0005 をwin0003 経由で呼び出してwin0005 を開いたままの状態で対処コマンドを入力していること、win0003 は障害対処にあまり有益でない情報を表示する画面であったこと等を確認する。この結果、操作者adminAは、win0003 を経由せずに、情報参照用ウィンドウ131から直接win0005 が表示する情報を表示できるようにすることが対処作業の迅速化に有効であると判断できる。   Based on the operation log shown in FIG. 20, the operator adminA calls win0005 via win0003 and inputs a countermeasure command with win0005 open, and win0003 displays information that is not very useful for troubleshooting. Confirm that it was a screen to do. As a result, the operator adminA can determine that it is effective in speeding up the coping operation to display the information displayed by win0005 directly from the information reference window 131 without going through win0003.

図22は、分析を行う操作者によって編集された操作画面ルールの例を示す説明図である。図22における記載141は、上記のような操作者adminAの判断に基づいて追加された記載である。記載141は、障害対処画面における「発生箇所」という表示の横に新たに「サービス」に関する情報を表示するというルールを表している。さらに、記載141は、この「サービス」に関する情報を、情報参照用ウィンドウ(IDはwin0008 )を呼び出すためのボタンとして表示するというルールを表している。なお、ここでは障害対処画面から呼び出される新たな画面を規定しているのでwin0008 という新たなIDを割り当てている。また、本例では記号「,(図22に示す5行目の記述参照。)」は、改行せずに要素を配置することを示す。従って、図21に示す障害対処画面111の“serverA ”ボタンの横に、改行されることなく新しいボタンが表示されることになる。   FIG. 22 is an explanatory diagram illustrating an example of an operation screen rule edited by an operator who performs analysis. A description 141 in FIG. 22 is a description added based on the determination of the operator adminA as described above. The description 141 represents a rule that information related to “service” is newly displayed next to the display of “occurrence location” on the failure handling screen. Furthermore, description 141 represents a rule that information related to this “service” is displayed as a button for calling an information reference window (ID is win0008). Here, since a new screen called from the trouble handling screen is defined, a new ID win0008 is assigned. In this example, the symbol “, (see the description on the fifth line shown in FIG. 22)” indicates that an element is arranged without a line feed. Accordingly, a new button is displayed next to the “serverA” button on the failure handling screen 111 shown in FIG.

また、操作者adminAは、図12に示す障害対処ログの内容に基づいて、操作者opeBが入力した対処コマンド“SHELL:/sbin/service2 httpd restart”を実行した場合に、障害が正常に解決できたことを確認する。この結果、操作者adminAは、その障害と同一の障害(症状)に対する推奨対処コマンドとして、その対処コマンド(“SHELL:/sbin/service2 httpd restart”)を障害対処画面から参照できるようにし、その推奨対処コマンドに関しては承認を不要とすることが対処作業の迅速化に有効であると判断できる。   Also, if the operator adminA executes the response command “SHELL: / sbin / service2 httpd restart” entered by the operator opeB based on the content of the failure response log shown in FIG. 12, the failure can be resolved normally. Make sure. As a result, operator adminA can refer to the troubleshooting command ("SHELL: / sbin / service2 httpd restart") from the troubleshooting screen as a recommended troubleshooting command for the same failure (symptom) as the failure. It can be determined that it is effective for speeding up the coping operation to eliminate the approval for the coping command.

図22に示す記載142および記載143は、このような操作者adminAの判断に基づいて編集された記載である。記載142は、推奨対処コマンドを表示する画面(IDはwin0009 であるものとする。)を呼び出すためのボタンを表示するというルールを表している。また、記載143は、障害対処画面111における「承認依頼」ボタンを押下できる条件として追加された記載である。記載143に示す例では、「推奨対処コマンド以外の対処コマンドが入力されている場合」に、「承認依頼」ボタンを押下できることを示している。推奨対処コマンドが入力されている場合には承認を不要としているので、推奨対処コマンドが入力されているにもかかわらず承認依頼を行って対処終了までに時間がかかってしまうことを防止している。   Descriptions 142 and 143 shown in FIG. 22 are descriptions edited based on the judgment of the operator adminA. The description 142 represents a rule for displaying a button for calling a screen (ID is assumed to be win0009) for displaying a recommended countermeasure command. A description 143 is a description added as a condition for pressing the “approval request” button on the failure handling screen 111. The example shown in description 143 indicates that the “approval request” button can be pressed when “a countermeasure command other than the recommended countermeasure command is input”. Approval is not required when a recommended action command has been entered, so it is possible to prevent the time required for the action from being completed by making an approval request even though the recommended action command has been entered. .

また、操作者adminAは、図12に示す障害対処ログの内容に基づいて、操作者opeAに入力された対処コマンド“SHELL:/sbin/service httpd restart ”が典型的な操作ミス、判断ミスの事例であると分析することができる。そして、同一の障害(症状)に対して“SHELL:/sbin/service httpd restart ”が入力された場合には、そのコマンドの入力が禁則事項である旨を表示し、禁止する根拠として前回その障害が発生したときに記録された障害履歴を表示することが好ましいと判断できる。   In addition, the operator adminA is a typical example of an operation error or a determination error when the response command “SHELL: / sbin / service httpd restart” input to the operator opeA is based on the content of the failure response log shown in FIG. Can be analyzed. If “SHELL: / sbin / service httpd restart” is entered for the same failure (symptom), it is displayed that the input of the command is a prohibited matter, and the previous failure It can be determined that it is preferable to display the failure history recorded when the error occurred.

図22に示す記載144は、このような操作者adminAの判断に基づいて編集された記載である。記載144は、所定のテキストエリア(本例では“textarea0001”)に、予め定めた入力データ(本例では対処コマンドである“SHELL:/sbin/service httpd restart ”)が入力され、ボタン“button0001”またはボタン“button0001-2”が押下されたときに確認ダイアログ画面(例えば、警告画面)を表示することを規定している。なお、ボタン“button0001”、ボタン“button0001-2”は、それぞれ「適用」ボタン、「承認依頼」ボタンであるものとする。また、確認ダイアログ画面には、IDが“H1000 ”である障害履歴の内容を関連情報として表示することを規定している。   The description 144 shown in FIG. 22 is a description edited based on the determination of the operator adminA. In the description 144, predetermined input data (in this example, “SHELL: / sbin / service httpd restart”, which is a handling command) is input to a predetermined text area (in this example, “textarea0001”), and the button “button0001” is entered. Alternatively, it is defined that a confirmation dialog screen (for example, a warning screen) is displayed when the button “button0001-2” is pressed. Note that the buttons “button0001” and “button0001-2” are an “apply” button and an “approval request” button, respectively. The confirmation dialog screen specifies that the contents of the failure history with ID “H1000” are displayed as related information.

図22に示すように操作画面ルールが書き換えられた場合、障害対処操作画面生成部33は、書き換えられた後の操作画面ルールに基づいて画面を作成し、障害対処操作制御部31に出力する。そして、障害対処操作制御部31は、その画面を入出力装置1に表示させる。   When the operation screen rule is rewritten as illustrated in FIG. 22, the failure handling operation screen generation unit 33 creates a screen based on the rewritten operation screen rule and outputs the screen to the failure handling operation control unit 31. The failure handling operation control unit 31 displays the screen on the input / output device 1.

後日、先の障害と同様の症状EventBが発生し、操作者opeCが障害対処作業についたとする。そして、opeCの操作に応じて障害対処画面を表示させるとする。この場合、障害対処操作制御部31は、表示させようとする障害対処画面のウィンドウIDおよび症状の情報(ここではEventBが発生したという情報)を障害対処操作画面生成部33に出力する。障害対処操作画面生成部33は、障害対処操作制御部31が出力した情報に基づいて、操作画面ルール保存部6に記憶された操作画面ルールのうち、EventB発生時に障害対処画面を生成するときの規定を定めたルールを特定する。そして、障害対処操作画面生成部33は、特定した操作画面ルールに従って画面(ここでは障害対処画面)を作成し、障害対処操作制御部31に出力する。障害対処操作制御部31は、その画面を入出力装置1に表示させる。   At a later date, suppose EventB, similar to the previous failure, occurs, and operator opeC is working on the failure. Then, suppose that the failure handling screen is displayed according to the operation of opeC. In this case, the failure handling operation control unit 31 outputs to the failure handling operation screen generation unit 33 the window ID and symptom information (in this case, information that EventB has occurred) of the failure handling screen to be displayed. The failure handling operation screen generation unit 33 generates a failure handling screen when an event B occurs, among the operation screen rules stored in the operation screen rule storage unit 6, based on the information output from the failure handling operation control unit 31. Identify the rules that establish the rules. Then, the failure handling operation screen generation unit 33 creates a screen (in this case, a failure handling screen) according to the identified operation screen rule, and outputs the screen to the failure handling operation control unit 31. The failure handling operation control unit 31 causes the input / output device 1 to display the screen.

このときに表示される画面(障害対処画面)およびその画面から呼び出される他の画の例を図23に示す。編集後の操作画面ルール(図22参照。)に基づいて作成された障害対処画面111aは、図21に示す障害対処画面111と比較すると、新たに、サービス名称を示すボタン151を備えている。そして、ボタン151を操作することにより、情報参照用ウィンドウ153を呼び出せる構成となっている。なお、図23に示す情報参照用ウィンドウ153は、図21に示す情報参照用ウィンドウ132と同内容の情報を表示するウィンドウである。従って、図21に示す情報参照用ウィンドウ131を経由することなく、図23に示す情報参照用ウィンドウ153を直接呼び出すことが可能となる。なお、図23に示すボタン151は、図22に示す記載141に基づいて追加されたものである。   FIG. 23 shows an example of a screen (fault handling screen) displayed at this time and another screen called from the screen. The failure handling screen 111a created based on the edited operation screen rule (see FIG. 22) is newly provided with a button 151 indicating a service name as compared with the failure handling screen 111 shown in FIG. Then, the information reference window 153 can be called by operating the button 151. Note that the information reference window 153 shown in FIG. 23 is a window that displays the same information as the information reference window 132 shown in FIG. Therefore, the information reference window 153 shown in FIG. 23 can be directly called without going through the information reference window 131 shown in FIG. Note that a button 151 shown in FIG. 23 is added based on the description 141 shown in FIG.

ボタン151を押下する操作が行われると、障害対処操作制御部31は、表示すべき情報参照用ウィンドウ153のウィンドウIDを障害対処操作画面生成部33に出力する。障害対処操作画面生成部33は、そのウィンドウIDに対応する操作画面ルールを特定し、その操作画面ルールに基づいて、情報参照用ウィンドウ153を生成する。なお、図23に示す情報参照用ウィンドウ153が示す内容は、システム状態監視部2が収集した情報である。このように、障害対処操作画面生成部33は、システム状態監視部2が収集した情報を含む画面を生成してもよい。障害対処操作画面生成部33は、生成した画面を障害対処操作制御部31に出力し、障害対処操作制御部31は、その画面(ここでは情報参照用ウィンドウ153)を入出力装置1に表示させる。   When an operation of pressing the button 151 is performed, the failure handling operation control unit 31 outputs the window ID of the information reference window 153 to be displayed to the failure handling operation screen generation unit 33. The failure handling operation screen generation unit 33 specifies an operation screen rule corresponding to the window ID, and generates an information reference window 153 based on the operation screen rule. The information shown in the information reference window 153 shown in FIG. 23 is information collected by the system state monitoring unit 2. As described above, the failure handling operation screen generation unit 33 may generate a screen including information collected by the system state monitoring unit 2. The failure handling operation screen generation unit 33 outputs the generated screen to the failure handling operation control unit 31, and the failure handling operation control unit 31 causes the input / output device 1 to display the screen (in this case, the information reference window 153). .

また、編集後の操作画面ルールに基づいて作成された障害対処画面111aは、図21に示す障害対処画面111と比較すると、新たに、障害(症状EventB1 )に対する推奨対処コマンドを呼び出すためのボタン152を備えている。そして、ボタン152を操作することにより、推奨対処コマンドを表示するウィンドウ154を呼び出せる構成となっている。従って、操作者opeCは、症状EventB1 に応じた推奨対処コマンドをすぐに呼び出すことが可能となる。なお、図23に示すボタン152は、図22に示す記載142に基づいて追加されたものである。   In addition, the failure handling screen 111a created based on the edited operation screen rule is newly compared with the failure handling screen 111 shown in FIG. It has. Then, by operating the button 152, a window 154 for displaying a recommended countermeasure command can be called. Therefore, the operator opeC can immediately call the recommended countermeasure command corresponding to the symptom EventB1. It should be noted that the button 152 shown in FIG. 23 is added based on the description 142 shown in FIG.

ボタン152を押下する操作が行われると、障害対処操作制御部31は、表示すべきウィンドウ154のウィンドウIDを障害対処操作画面生成部33に出力する。障害対処操作画面生成部33は、そのウィンドウIDに対応する操作画面ルールを特定し、その操作画面ルールに基づいて、ウィンドウ154を生成する。障害対処操作画面生成部33は、生成した画面を障害対処操作制御部31に出力し、障害対処操作制御部31は、その画面(ここではウィンドウ154)を入出力装置1に表示させる。   When an operation of pressing the button 152 is performed, the failure handling operation control unit 31 outputs the window ID of the window 154 to be displayed to the failure handling operation screen generation unit 33. The failure handling operation screen generation unit 33 specifies an operation screen rule corresponding to the window ID, and generates a window 154 based on the operation screen rule. The failure handling operation screen generation unit 33 outputs the generated screen to the failure handling operation control unit 31, and the failure handling operation control unit 31 displays the screen (here, the window 154) on the input / output device 1.

ウィンドウ154は、対処コマンド表示エリア155を有し、そのエリア155に推奨対処コマンドを表示している。操作者opeCは、この推奨対処コマンドを参照することにより、障害対処画面111aにおけるテキストエリア113に推奨対処コマンドを入力することができる。対処コマンドを入力するためのテキストエリア113に推奨対処コマンドが入力された状態の例を図24に示す。障害対処操作画面生成部33は、図22に示す記載143として規定された操作画面ルールも参照して、画面を生成している。図24に示す例では、テキストエリア113に推奨対処コマンドが入力されているので、「承認依頼」ボタンは選択不能(操作不能)な状態になっている。操作者opeCは、直接「適用」を選択し、推奨対処コマンドを実行する。このように、推奨対処コマンド入力時には「承認依頼」ボタンは選択不能な状態になるので、推奨対処コマンドが入力されているにもかかわらず承認依頼を行ってしまい対処終了までに時間がかかるということがなくなる。   The window 154 has a countermeasure command display area 155, and a recommended countermeasure command is displayed in the area 155. The operator opeC can input the recommended countermeasure command into the text area 113 on the failure countermeasure screen 111a by referring to the recommended countermeasure command. FIG. 24 shows an example of a state in which a recommended countermeasure command is input in the text area 113 for inputting a countermeasure command. The failure handling operation screen generation unit 33 generates a screen with reference to the operation screen rule defined as the description 143 shown in FIG. In the example shown in FIG. 24, since the recommended countermeasure command has been input in the text area 113, the “approval request” button is in an inoperable state. The operator opeC directly selects “Apply” and executes the recommended action command. In this way, when the recommended action command is entered, the “Approval Request” button is disabled, so an approval request is made despite the recommended action command being entered, and it takes time to complete the action. Disappears.

図25は、警告ウィンドウを表示する状況を示す説明図である。もしも、操作者opeCが推奨対処コマンドを参照せずに、図12に示す障害対処ログに記録された操作者opeBと同様の判断を下した場合や、単純なタイプミスによって、障害対処画面111aにおいて対処コマンド“SHELL:/sbin/service httpd restart ”テキストエリア113に入力したとする。そして、操作者opeCが「適用」を選択したとする。すると、図22に示す記載144の規定に基づいて、「適用」を確認するウィンドウに移行する前に、操作者opeCに注意を促す警告画面(警告ウィンドウ)171が表示される。障害対処操作画面生成部33は、図22に示す記載144として規定された操作画面ルールも参照して、障害対処画面111aを生成している。従って、障害対処操作制御部31は、テキストエリア113に“SHELL:/sbin/service httpd restart ”が入力された状態で、「適用」ボタンが押下されると、警告ウィンドウ171を入出力装置1に表示させる。また、記載144では、IDが“H1000 ”である障害履歴の内容を関連情報として表示することを規定していたので、障害対処操作制御部31は、障害情報保存部5から障害履歴“H1000 ”を読み込んで、その障害履歴の内容を障害履歴表示欄172に表示する。この結果、システム運用管理支援システムは、操作者opeCが入力した対処コマンドが禁則事項であることを操作者opeCに示すことができ、また、禁則事項の根拠となる過去の障害事例(障害履歴)を操作者opeCに知らせることができる。   FIG. 25 is an explanatory diagram illustrating a situation in which a warning window is displayed. If the operator opeC makes the same determination as the operator opeB recorded in the failure handling log shown in FIG. 12 without referring to the recommended handling command, or if a simple typo causes a failure in the failure handling screen 111a. It is assumed that the countermeasure command “SHELL: / sbin / service httpd restart” is entered in the text area 113. Then, it is assumed that the operator opeC selects “Apply”. Then, based on the definition of the description 144 shown in FIG. 22, a warning screen (warning window) 171 that alerts the operator opeC is displayed before the window for confirming “apply” is displayed. The failure handling operation screen generation unit 33 generates the failure handling screen 111a with reference to the operation screen rule defined as the description 144 shown in FIG. Therefore, when the “Apply” button is pressed while “SHELL: / sbin / service httpd restart” is input in the text area 113, the failure handling operation control unit 31 displays the warning window 171 on the input / output device 1. Display. Further, since the description 144 stipulates that the content of the failure history with the ID “H1000” is displayed as related information, the failure handling operation control unit 31 reads the failure history “H1000” from the failure information storage unit 5. , And the contents of the failure history are displayed in the failure history display field 172. As a result, the system operation management support system can indicate to the operator opeC that the handling command entered by the operator opeC is a prohibited matter, and the past failure cases (failure history) that are the basis of the prohibited matter Can be notified to the operator opeC.

以上のように、本実施の形態によれば、障害分析において、障害対処時に素早く参照できるようにすべき情報や推奨する対処方法、あるいは逆に禁則事項とすべき事項が明らかになった場合、素早く参照すべき情報を表示するウィンドウを、他のウィンドウを介さずに表示させたり、推奨する対処方法を表示するウィンドウを表示させたり、禁則事項に該当する操作が行われたときに警告ウィンドウを表示させたりするように、操作画面ルールを変更することができる。その結果、分析作業で明らかになった事項を障害対処の操作画面に反映させ、類似する障害が発生した場合に、障害対処作業をより効率的かつ安全に遂行するように、的確に操作者を誘導でき、障害対処の効率化を実現することができる。そして、以前に成功した対処方法や以前の対処社等の有益な情報を操作者に迅速に参照させることができる。   As described above, according to the present embodiment, in the failure analysis, when information that should be quickly referred to when troubleshooting a failure, a recommended handling method, or conversely, a matter that should be prohibited is clarified, Display a window that displays information that should be referred to quickly without going through other windows, display a window that displays recommended actions, or display a warning window when an operation that falls under the prohibited items is performed. The operation screen rule can be changed so that it is displayed. As a result, the matters revealed in the analysis work are reflected on the operation screen for troubleshooting, and if a similar failure occurs, the operator can be accurately handled so that the troubleshooting operation can be performed more efficiently and safely. It is possible to guide, and it is possible to realize the efficiency of trouble handling. Then, it is possible to prompt the operator to refer to useful information such as a previously successful coping method and a previous coping company.

また、既に説明したように、障害分析操作制御部41が、一般的なテキストエディタと同様の編集画面を入出力装置1に表示させ、その編集画面上で操作者に操作画面ルールの編集を行わせてもよい。ただし、この場合、操作者は、発生した障害の情報を表示する画面、および障害対処の内容の選択を操作者に促す画面を含む一連の画面が障害対処操作制御部31によって出力されるという原則を崩さないように編集しなければならない。一般的なテキストエディタと同様の編集画面を入出力装置1に表示させた場合には、自由な編集が可能となってしまうため、上記の原則が崩されてしまう可能性がある。そのため、編集内容に制約を設けた操作画面ルールの編集画面を入出力装置1に表示させてもよい。以下、この操作画面ルールの編集画面の例について説明する。   Further, as already described, the failure analysis operation control unit 41 causes the input / output device 1 to display an edit screen similar to that of a general text editor, and the operator edits the operation screen rules on the edit screen. You may let them. However, in this case, the operator outputs a series of screens including a screen that displays information on the failure that has occurred and a screen that prompts the operator to select the content of the failure handling by the failure handling operation control unit 31. It must be edited so as not to break. When an editing screen similar to that of a general text editor is displayed on the input / output device 1, the above principle may be disrupted because free editing is possible. For this reason, an edit screen for an operation screen rule in which restrictions are placed on the editing content may be displayed on the input / output device 1. An example of the operation screen rule editing screen will be described below.

図26は、編集内容に制約を設けた編集画面の例を示す説明図である。障害分析操作制御部41は、分析時に用いられる一連の画面のうちの1つとして、例えば、図26に示す編集画面を入出力装置1に表示させる。   FIG. 26 is an explanatory diagram illustrating an example of an editing screen in which restrictions are imposed on editing contents. The failure analysis operation control unit 41 displays, for example, an edit screen shown in FIG. 26 on the input / output device 1 as one of a series of screens used at the time of analysis.

図26に例示する編集画面において、「基本/個別」選択欄301は、操作画面ルールの基本設定に関する部分を編集するのか、操作画面ルールの個別設定に関する部分を編集するのかの選択を操作者に促す選択欄である。個別設定とは、障害の症状毎の設定(ある症状の場合は、画面の背景色を特定の色にする等の設定)を意味する。基本設定は、症状に依存せずに定められる設定である。基本設定が選択された場合、障害分析操作制御部41は、障害分類情報を表示して、症状の選択を操作者に促し、どの症状に対応する個別設定を編集するのかを決定する。   In the editing screen illustrated in FIG. 26, the “basic / individual” selection field 301 allows the operator to select whether to edit the portion related to the basic setting of the operation screen rule or to edit the portion related to the individual setting of the operation screen rule. It is a selection column for prompting. The individual setting means a setting for each symptom of the failure (a setting for setting a background color of the screen to a specific color in the case of a certain symptom). The basic setting is a setting determined without depending on symptoms. When the basic setting is selected, the failure analysis operation control unit 41 displays the failure classification information, prompts the operator to select a symptom, and determines which symptom to edit the individual setting.

また、図26に例示する操作ウィンドウID指定欄302は、操作画面ルールの編集により表示態様を変更させようとする画面のウィンドウIDの指定を操作者に促す欄である。ウィンドウ名称入力欄303は、そのウィンドウの名称の入力を操作者に促すための入力欄である。   An operation window ID designation field 302 illustrated in FIG. 26 is a field that prompts the operator to designate a window ID of a screen whose display mode is to be changed by editing the operation screen rule. The window name input field 303 is an input field for prompting the operator to input the name of the window.

ウィンドウ種別選択欄304は、表示態様を変更させようとするウィンドウの種別を、「通知」、「対処」、「確認」、「実行」、「情報参照」の中から操作者に選択させるための選択欄である。ここで、「通知」とは、障害の発生を操作者に通知するために用いらられる画面の種別を意味する。具体的には、図6に示すステップS1602で表示される画面(図8に例示する画面や図9に例示する画面191等)の種別を意味する。「対処」とは、障害対処画面(ステップS1604で表示される画面。図10等参照。)の種別を意味する。「確認」とは、選択された対処内容(「適用」、「承認依頼」、「承認否決」、または「解決確認」)を本当に実行するか否かの確認に用いられる画面の種別を意味する。具体的には、図6に示すステップS1607,S1608,S1609,S1610で表示される画面(図11に例示する画面)の種別を意味する。「実行」とは、選択された対処内容の実行に伴って表示される画面の種別を意味する。具体的には、図6に示すステップS1612で表示される画面(例えば、対処コマンドの実行結果等を表示する画面)の種別を意味する。「情報参照」とは、情報参照用画面の種別を意味する。具体的には、ステップS1603,S1605で表示される画面(図9に例示する画面194等)の種別を意味する。   The window type selection column 304 is used for allowing the operator to select the type of window whose display mode is to be changed from “notification”, “handling”, “confirmation”, “execution”, and “information reference”. It is a selection field. Here, “notification” means the type of screen used to notify the operator of the occurrence of a failure. Specifically, it means the type of the screen (screen illustrated in FIG. 8, screen 191 illustrated in FIG. 9, etc.) displayed in step S1602 shown in FIG. “Correction” means the type of the trouble handling screen (the screen displayed in step S1604, see FIG. 10 and the like). “Confirmation” means the type of screen used for confirming whether or not to actually execute the selected action (“Apply”, “Approval request”, “Approval reject”, or “Solution confirmation”). . Specifically, it means the type of screen (screen illustrated in FIG. 11) displayed in steps S1607, S1608, S1609, and S1610 shown in FIG. “Execution” means a type of screen displayed in accordance with execution of the selected countermeasure content. Specifically, it means the type of screen displayed in step S1612 shown in FIG. 6 (for example, a screen for displaying the execution result of the countermeasure command). “Information reference” means the type of information reference screen. Specifically, it means the type of the screen (such as the screen 194 illustrated in FIG. 9) displayed in steps S1603 and S1605.

各画面は、その画面の種別に応じたボタンを有する。例えば、「通知」に分類される画面は、図8に示す「参照」ボタンや、ウィンドウ191(図9参照。)内に示す「対処」ボタン等を有する。また、「対処」に分類される画面は、図10に例示するように、「適用」、「承認依頼」、「承認否決」、「解決確認」、「閉じる」等のボタンを有する。「確認」に分類される画面は、図11に例示するように、確認対象の対処内容を実行させるためのボタン(図11の例では「承認依頼」)や、「もどる」等のボタンを有する。「情報参照」に分類される画面は、図9に例示する情報参照用ウィンドウ194のように「閉じる」等のボタンを有する。このような、画面の種別に応じたボタンを基本ボタンと呼ぶ。障害分析操作制御部41は、ウィンドウ種別選択欄304で選択された種別に応じた基本ボタンの設定欄305を表示する。図26に示す例では、「対処」という種別に応じた基本ボタンの設定を行う設定欄305を表示している。   Each screen has a button corresponding to the type of the screen. For example, a screen classified as “notification” has a “reference” button shown in FIG. 8, a “handling” button shown in a window 191 (see FIG. 9), and the like. Further, the screen classified as “handling” has buttons such as “apply”, “approval request”, “approval rejection”, “solution confirmation”, and “close” as illustrated in FIG. As illustrated in FIG. 11, the screen classified as “confirmation” includes a button (“approval request” in the example of FIG. 11) for executing the action to be confirmed, and a button such as “return”. . The screen classified as “reference information” has a button such as “close” like an information reference window 194 illustrated in FIG. Such a button corresponding to the type of screen is called a basic button. The failure analysis operation control unit 41 displays a basic button setting field 305 corresponding to the type selected in the window type selection field 304. In the example shown in FIG. 26, a setting field 305 for setting a basic button corresponding to the type of “handling” is displayed.

また、図26に例示する編集画面において、表示情報入力欄306は、ウィンドウ内に表示する情報を入力するための入力欄である。本例では、表示すべき文言を操作者が直接指定する場合、その文言を“”で囲んで入力するものとする。また、表示情報入力欄306に変数が入力されてもよい。変数として、例えば、障害分類を表す「$fault」や年月日を表す「$yy/mm/dd 」等がある。変数追加ボタン307が押下されると、障害分析操作制御部41は、変数選択画面308を入出力装置1に表示させる。変数選択画面308上で変数が選択され、変数選択画面308内の追加ボタンが押下されると、障害分析操作制御部41は、表示情報入力欄306内に、選択された変数を追記する。すなわち、変数は、予め用意された変数の中から選択されて表示情報入力欄306内に追記されることになる。また、同様に、部品を指定する情報が、表示情報入力欄306に入力されてもよい。部品として、例えば、リスト(例えば、図8で例示したようなリスト)やテキストエリア等がある。部品追加ボタン309が押下されると、障害分析操作制御部41は、部品選択画面310を入出力装置1に表示させる。部品選択画面310上で部品が選択され、部品選択画面310内の追加ボタンが押下されると、障害分析操作制御部41は、表示情報入力欄306内に、選択された部品の情報を追記する。すなわち、部品の情報は、予め用意された部品の中から選択されて表示情報入力欄306内に追記されることになる。   In the editing screen illustrated in FIG. 26, a display information input field 306 is an input field for inputting information to be displayed in the window. In this example, when the operator directly specifies a word to be displayed, the word is enclosed in “” and input. In addition, a variable may be input in the display information input field 306. Examples of the variable include “$ fault” representing a failure classification and “$ yy / mm / dd” representing a date. When the variable addition button 307 is pressed, the failure analysis operation control unit 41 displays the variable selection screen 308 on the input / output device 1. When a variable is selected on the variable selection screen 308 and the add button in the variable selection screen 308 is pressed, the failure analysis operation control unit 41 adds the selected variable in the display information input field 306. That is, the variable is selected from variables prepared in advance and added to the display information input field 306. Similarly, information for designating a component may be input to the display information input field 306. Examples of the parts include a list (for example, the list illustrated in FIG. 8) and a text area. When the component addition button 309 is pressed, the failure analysis operation control unit 41 causes the input / output device 1 to display the component selection screen 310. When a component is selected on the component selection screen 310 and the add button in the component selection screen 310 is pressed, the failure analysis operation control unit 41 adds information on the selected component in the display information input field 306. . That is, the component information is selected from components prepared in advance and added to the display information input field 306.

また、表示情報入力欄306内に入力された変数や操作者によって直接入力された文字列が選択され(例えば、マウスによるドラッグ操作で選択され)、「リンク付加/解除」ボタン311が押下されると、障害分析操作制御部41は、その選択部分をボタンとして表示するように操作画面ルールを編集する。   Further, a variable input in the display information input field 306 or a character string directly input by the operator is selected (for example, selected by a drag operation with the mouse), and the “link addition / release” button 311 is pressed. Then, the failure analysis operation control unit 41 edits the operation screen rule so that the selected portion is displayed as a button.

図27は、「リンク付加/解除」ボタン押下時および基本ボタンに関する設定時の状況を示す説明図である。図27では、表示情報入力欄306内に入力された変数「$service」が選択され、「リンク付加/解除」ボタン311が押下された状態を示している。この場合、障害分析操作制御部41は、変数「$service」をボタンとして表示する操作画面ルールを生成するために必要な情報の入力を促す情報参照ボタンウィンドウ312を入出力装置1に表示させる。そして、情報参照ボタンウィンドウ312にでは、ボタンとなる変数「$service」が押下された場合に呼び出すウィンドウのウィンドウIDを選択させる。情報参照ボタンウィンドウ312では、予め選択対象となるウィンドウIDの集合の中からウィンドウIDの選択を促す。従って、操作者が任意にウィンドウIDを指定できるわけではない。なお、変数「$service」が新規に選択された場合、情報参照ボタンウィンドウ312内におけるボタンIDは、例えば情報分類操作制御部41によって自動的に割り当てられる。また、ボタンラベルの初期値は、選択された変数に応じた値が表示される。図27に示す例では、ボタンラベルの初期値として「$service」が表示されている。   FIG. 27 is an explanatory diagram showing a situation when the “link addition / release” button is pressed and when the basic button is set. FIG. 27 shows a state where the variable “$ service” input in the display information input field 306 is selected and the “link addition / release” button 311 is pressed. In this case, the failure analysis operation control unit 41 causes the input / output device 1 to display an information reference button window 312 that prompts input of information necessary for generating an operation screen rule that displays the variable “$ service” as a button. In the information reference button window 312, the window ID of the window to be called when the variable “$ service” serving as the button is pressed is selected. The information reference button window 312 prompts the user to select a window ID from a set of window IDs to be selected in advance. Therefore, the operator cannot arbitrarily specify the window ID. When the variable “$ service” is newly selected, the button ID in the information reference button window 312 is automatically assigned by the information classification operation control unit 41, for example. Also, the initial value of the button label is displayed according to the selected variable. In the example shown in FIG. 27, “$ service” is displayed as the initial value of the button label.

なお、ボタンとして表示するように設定された箇所が再度選択され、その後、「リンク付加/解除」ボタン311が押下されると、障害分析操作制御部41は、その選択部分をボタンとして表示しないように操作画面ルールを編集する。   Note that when a location set to be displayed as a button is selected again, and then the “link addition / release” button 311 is pressed, the failure analysis operation control unit 41 does not display the selected portion as a button. Edit the operation screen rule.

以上のように、表示情報入力欄306に表示する文字列や変数をボタンとして表示し、そのボタンが押下されたときに他のウィンドウを呼び出すように操作画像ルールを編集することができる。ここで、変数、部品は、予め用意された変数や部品の中からしか選択することができない(図26に示すウィンドウ308,310に一覧表示されたものの中からしか選択できない。)。同様に、ボタン押下時に呼び出されるウィンドウも、図27に示す情報参照ボタンウィンドウ312において予め用意された選択対象となるウィンドウIDの集合の中からウィンドウIDを選択することによって行われる。よって、任意のウィンドウを呼び出せるように操作画面ルールを編集できるわけではない。このような編集画面により、発生した障害の情報を表示する画面、および障害対処の内容の選択を操作者に促す画面を含む一連の画面が障害対処操作制御部31によって出力されるという原則を崩さずに、操作画面ルールを編集することができる。例えば、対処時に操作ログの表示画面を表示可能とするようなルールを排除することができる。   As described above, the character string or variable to be displayed in the display information input field 306 is displayed as a button, and the operation image rule can be edited so that another window is called when the button is pressed. Here, variables and parts can be selected only from variables and parts prepared in advance (can only be selected from those listed in the windows 308 and 310 shown in FIG. 26). Similarly, the window called when the button is pressed is also performed by selecting a window ID from a set of window IDs to be selected prepared in advance in the information reference button window 312 shown in FIG. Therefore, the operation screen rule cannot be edited so that an arbitrary window can be called. Such an editing screen breaks the principle that the failure handling operation control unit 31 outputs a series of screens including a screen that displays information on the failure that has occurred and a screen that prompts the operator to select the content of the failure handling. Without changing the operation screen rules. For example, it is possible to eliminate a rule that makes it possible to display an operation log display screen when coping.

基本ボタンの設定欄305(図26参照)は、ウィンドウ種別選択欄304で選択された種別に応じた基本ボタンの設定を操作者に促す。図26に示す例では、種別として「対処」が選択されているので、「適用」、「承認依頼」、「承認否決」、「解決確認」、および「閉じる」という基本ボタンの設定が行われる。「適用」、「承認依頼」、「承認否決」、「解決確認」は、対処内容の選択肢となるボタンであり、「閉じる」は、対処作業中断を指示するためのボタンである。   A basic button setting field 305 (see FIG. 26) prompts the operator to set a basic button according to the type selected in the window type selection field 304. In the example shown in FIG. 26, since “Correction” is selected as the type, basic buttons of “Apply”, “Approval request”, “Approval reject”, “Solution confirmation”, and “Close” are set. . “Apply”, “Approval request”, “Approval reject”, “Solution confirmation” are buttons that are options for the countermeasure content, and “Close” is a button for instructing the suspension of the countermeasure work.

基本ボタンの設定欄305では、各基本ボタンを表示するか否かを指定するチェックボックス321が、基本ボタン毎に表示される。本例では、チェックボックス321のデフォルトは、基本ボタンを表示する状態に設定されている。チェックボックス321の設定が切り替えられ、基本ボタンを非表示とする指示が入力された場合、障害分析操作制御部41は、その指示に従って、基本ボタンを表示しないように操作画面ルールを変更する。ただし、図26に示すように、種別として「対処」が選択されている場合、「適用」、「承認依頼」、「承認否決」、「解決確認」、および「閉じる」という各基本ボタンを非表示とすることは、システム運用管理支援装置の運用上あまり意味がない。障害対処画面では、「適用」、「承認依頼」、「承認否決」、「解決確認」、および「閉じる」を全て表示する必要があるからである。   In the basic button setting field 305, a check box 321 for designating whether or not to display each basic button is displayed for each basic button. In this example, the default of the check box 321 is set to display a basic button. When the setting of the check box 321 is switched and an instruction to hide the basic button is input, the failure analysis operation control unit 41 changes the operation screen rule so that the basic button is not displayed according to the instruction. However, as shown in FIG. 26, when “Correction” is selected as the type, the basic buttons “Apply”, “Approval request”, “Approval reject”, “Solution confirmation”, and “Close” are not displayed. Displaying is not meaningful in the operation of the system operation management support apparatus. This is because it is necessary to display all of “Apply”, “Approval request”, “Approval reject”, “Solution confirmation”, and “Close” on the failure handling screen.

また、基本ボタンの設定欄305では、各基本ボタン毎に、その基本ボタンを操作することができる条件(操作可能条件)と、その基本ボタンのラベルを指定する欄が設けられる。この欄に入力された操作可能条件およびラベルを用いて、障害分析操作制御部41は、操作画面ルールを編集する。さらに、各基本ボタンに関する設定の入力欄として、「注意事項」欄322が設けられる。「注意事項」欄322は、確認ダイアログ画面を表示させるか否かの設定を行う欄である。   In the basic button setting field 305, for each basic button, a field for operating the basic button (operable condition) and a field for designating the label of the basic button are provided. The failure analysis operation control unit 41 edits the operation screen rule using the operable condition and label input in this field. Furthermore, a “notes” field 322 is provided as an input field for settings relating to each basic button. The “Notes” column 322 is a column for setting whether or not to display the confirmation dialog screen.

図27に示すように、「注意事項」欄322に「在り」という文字列が入力された場合、障害分析操作制御部41は、注意事項画面323を入出力装置1に表示させる。注意事項画面323は、確認ダイアログ画面の表示態様を定める情報を入力する画面である。注意事項画面323に入力された情報に基づいて、障害分析操作制御部41は、例えば、図22に例示する記載144を含むような操作画面ルールを作成する。   As illustrated in FIG. 27, when a character string “present” is input in the “notes” column 322, the failure analysis operation control unit 41 causes the input / output device 1 to display a notes screen 323. The precautions screen 323 is a screen for inputting information that defines the display mode of the confirmation dialog screen. Based on the information input on the cautions screen 323, the failure analysis operation control unit 41 creates an operation screen rule that includes, for example, the description 144 illustrated in FIG.

基本ボタンの設定欄305では、ウィンドウ種別選択欄304で選択された種別に応じた基本ボタンの設定を行うことしかできない。従って、ウィンドウ種別選択欄304で選択された種別に応じた基本ボタンを非表示に切り替える等の設定は可能であるが、新たに基本ボタンを作成する等の編集操作は行うことができない。例えば、基本ボタンとして、対処時に操作ログの表示画面を呼び出すような新たなボタンを生成させることはできない。このような編集画面により、発生した障害の情報を表示する画面、および障害対処の内容の選択を操作者に促す画面を含む一連の画面が障害対処操作制御部31によって出力されるという原則を崩さずに、操作画面ルールを編集することができる。   In the basic button setting field 305, the basic button can be set only in accordance with the type selected in the window type selection field 304. Therefore, settings such as switching the basic button to non-display according to the type selected in the window type selection field 304 are possible, but editing operations such as creating a new basic button cannot be performed. For example, as a basic button, it is not possible to generate a new button that calls an operation log display screen at the time of handling. Such an editing screen breaks the principle that the failure handling operation control unit 31 outputs a series of screens including a screen that displays information on the failure that has occurred and a screen that prompts the operator to select the content of the failure handling. Without changing the operation screen rules.

また、操作画面ルールの編集画面を表示する場合、編集画面を呼び出すためのボタンを分析時画面群に含まれる画面に設けておけばよい。例えば、図14および図15(a),(b)に例示する画面等に、編集画面を呼び出すためのボタン(図14,図15において図示せず。)を設けておけばよい。そして、そのボタンが押下されたときに、障害分析操作制御部41は、操作画面ルールの編集画面を入出力装置1に表示させればよい。   In addition, when the operation screen rule editing screen is displayed, a button for calling the editing screen may be provided on the screen included in the analysis screen group. For example, a button (not shown in FIGS. 14 and 15) for calling up an edit screen may be provided on the screen illustrated in FIGS. 14 and 15A and 15B. When the button is pressed, the failure analysis operation control unit 41 may display the operation screen rule editing screen on the input / output device 1.

また、分析時画面群に含まれる画面から、特定の障害に応じた対処画面ルールの編集画面に移行できるようにしてもよい。図28は、特定の障害に応じた対処画面ルールの編集画面に移行するためのボタンを備えた画面の例である。図28に示す画面は、「この障害の対処画面ルールの編集」ボタン331を備える点以外は、図15(a)に示す画面と同様であり、図14に例示する画面から呼び出され、また、図15(b)に例示する画面を呼び出すことが可能な画面である。「この障害の対処画面ルールの編集」ボタン331が押下された場合、障害分析操作制御部41は、ボタン331に応じた操作画面のルールを編集する編集画面を入出力装置1に表示させる。なお、障害分析操作制御部41は、操作者の権限の有無を認証等によって確認し、所定の権限を有する分析操作者に対してのみ「この障害の対処画面ルールの編集」ボタン331を表示してもよい。   Further, it may be possible to shift from a screen included in the analysis time screen group to a screen for editing a handling screen rule corresponding to a specific failure. FIG. 28 is an example of a screen provided with a button for shifting to a screen for editing a handling screen rule corresponding to a specific failure. The screen shown in FIG. 28 is the same as the screen shown in FIG. 15A except that the “Edit this trouble handling screen rule” button 331 is provided, and is called from the screen illustrated in FIG. It is a screen which can call the screen illustrated in Drawing 15 (b). When the “Edit this failure handling screen rule” button 331 is pressed, the failure analysis operation control unit 41 causes the input / output device 1 to display an editing screen for editing the rule of the operation screen corresponding to the button 331. The failure analysis operation control unit 41 confirms the authority of the operator by authentication or the like, and displays the “Edit this failure handling screen rule” button 331 only for the analysis operator having a predetermined authority. May be.

以上の説明では、操作画面ルール保存部6が、障害対処作業において用いられる画面の表示態様を規定する操作画面ルールを記憶する場合を説明した。操作画面ルール保存部6は、障害対処作業において用いられる画面だけでなく、障害分析作業において用いられる画面の表示態様を規定する操作画面ルールも記憶してよい。以下、第2の実施の形態の変形例として、操作画面ルール保存部6が、障害分析作業において用いられる画面の表示態様を規定する操作画面ルールも記憶する場合について説明する。図29は、本発明の第2の実施の形態の変形例を示すブロック図である。図18に示す構成と同様の構成部については、図18と同一の符号を付し、説明を省略する。   In the above description, the case where the operation screen rule storage unit 6 stores the operation screen rule that defines the display mode of the screen used in the trouble handling work has been described. The operation screen rule storage unit 6 may store not only the screen used in the trouble handling work but also the operation screen rule that defines the display mode of the screen used in the trouble analysis work. Hereinafter, as a modification of the second embodiment, a case will be described in which the operation screen rule storage unit 6 also stores an operation screen rule that defines a display mode of a screen used in failure analysis work. FIG. 29 is a block diagram showing a modification of the second embodiment of the present invention. The same components as those shown in FIG. 18 are denoted by the same reference numerals as those in FIG.

本変形例では、操作画面ルール保存部6は、障害対処作業において用いられる画面の表示態様を規定する操作画面ルールと、障害分析作業において用いられる画面の表示態様を規定する操作画面ルールとを記憶する。   In the present modification, the operation screen rule storage unit 6 stores an operation screen rule that defines the display mode of the screen used in the failure handling work and an operation screen rule that defines the display mode of the screen used in the failure analysis work. To do.

また、本変形例では、障害分析プロセス制御部4は、図18に示す構成に加えて、障害分析操作画面生成部42を備える。障害分析操作画面生成部42は、障害分析操作制御部41が出力した情報と、操作画面ルール保存部6が記憶する操作画面ルールとに基づいて操作画面を生成し、障害分析操作制御部41に出力する。障害分析操作画面生成部42が操作画面を生成するときに、障害分析操作制御部41は、障害分析操作画面生成部42に対して、障害分析操作画面生成部42が参照すべき操作画面ルールを特定可能な情報を出力する。例えば、障害分析操作制御部41は、生成すべき画面(ウィンドウ)を指定する情報(具体的にはウィンドウID)を出力する。障害分析操作画面生成部42は、障害分析操作制御部41が出力した情報に基づいて、操作画面ルール保存部6に記憶される操作画面ルール中から、指定されたウィンドウIDに対応する操作画面ルールを特定し、その操作画面ルールを参照する。そして、障害分析操作画面生成部42は、その操作画面ルールに基づいて、配置する情報(表示すべきボタン等)や色等を決定し、画面(ウィンドウ)を生成する。また、その画面上で禁止すべき操作がルールにおいて指定されている場合、その操作が行えないように画面を生成する。   In the present modification, the failure analysis process control unit 4 includes a failure analysis operation screen generation unit 42 in addition to the configuration shown in FIG. The failure analysis operation screen generation unit 42 generates an operation screen based on the information output from the failure analysis operation control unit 41 and the operation screen rule stored in the operation screen rule storage unit 6, and sends the operation screen to the failure analysis operation control unit 41. Output. When the failure analysis operation screen generation unit 42 generates an operation screen, the failure analysis operation control unit 41 sets an operation screen rule that the failure analysis operation screen generation unit 42 should refer to the failure analysis operation screen generation unit 42. Output identifiable information. For example, the failure analysis operation control unit 41 outputs information (specifically, a window ID) specifying a screen (window) to be generated. The failure analysis operation screen generation unit 42 selects an operation screen rule corresponding to the specified window ID from among the operation screen rules stored in the operation screen rule storage unit 6 based on the information output from the failure analysis operation control unit 41. And refer to the operation screen rule. Then, the failure analysis operation screen generation unit 42 determines information to be arranged (buttons to be displayed, colors, etc.) based on the operation screen rule, and generates a screen (window). Further, when an operation to be prohibited on the screen is specified in the rule, the screen is generated so that the operation cannot be performed.

障害分析操作制御部41は、障害分析操作画面生成部42から生成された画面を受け取ると、その画面を入出力装置1に表示させる。なお、障害分析作業において用いられる画面の表示態様を規定する操作画面ルールは、過去に発生した各障害の一覧情報を表示する画面、障害対処時に行われた個々の操作に関するログを表示する画面、および操作画面ルールの編集画面を含む一連の画面を入出力装置1に表示させるという原則に反することなく記述されている。   When the failure analysis operation control unit 41 receives the screen generated from the failure analysis operation screen generation unit 42, the failure analysis operation control unit 41 displays the screen on the input / output device 1. In addition, the operation screen rule that defines the display mode of the screen used in the failure analysis work is a screen that displays a list of each failure that has occurred in the past, a screen that displays a log relating to each operation performed at the time of troubleshooting, The operation screen rule is described without violating the principle of displaying a series of screens including an operation screen rule editing screen on the input / output device 1.

障害分析作業において用いられる画面の表示態様を規定する操作画面ルールの編集画面は、例えば、一般的なテキストエディタと同様の編集画面であってもよい。また、過去に発生した各障害の一覧情報を表示する画面、障害対処時に行われた個々の操作に関するログを表示する画面、および操作画面ルールの編集画面を含む一連の画面を入出力装置1に表示させるという原則に反するような編集が行えないように制約が設けられた編集画面であってもよい。   The operation screen rule editing screen that defines the display mode of the screen used in the failure analysis work may be an editing screen similar to a general text editor, for example. In addition, a series of screens including a screen for displaying a list of faults that have occurred in the past, a screen for displaying a log regarding each operation performed at the time of troubleshooting, and a screen for editing an operation screen rule are displayed on the input / output device 1. It may be an editing screen in which restrictions are provided so that editing that violates the principle of display is not possible.

次に、障害分析作業において用いられる画面の表示態様を規定する操作画面ルールを変更した場合における、障害分析操作画面生成部42が生成する画面の変化について説明する。ここでは、図14に例示する画面(過去に発生した各障害の一覧情報を表示する画面)の表示態様を規定する操作画面ルールとして、図30に例示する操作画面ルールが、操作画面ルール保存部6に記憶されているものとする。   Next, changes in the screen generated by the failure analysis operation screen generation unit 42 when the operation screen rule defining the display mode of the screen used in the failure analysis work is changed will be described. Here, as the operation screen rule that defines the display mode of the screen illustrated in FIG. 14 (the screen displaying the list information of each failure that has occurred in the past), the operation screen rule illustrated in FIG. 6 is stored.

図30に例示する操作画面ルールの編集前は、障害分析操作画面生成部42は、この操作画面ルールに基づいて図14に例示する画面を生成し、障害分析操作制御部41がその画面を入出力装置1に表示させる。   Before editing the operation screen rule illustrated in FIG. 30, the failure analysis operation screen generation unit 42 generates the screen illustrated in FIG. 14 based on the operation screen rule, and the failure analysis operation control unit 41 enters the screen. It is displayed on the output device 1.

また、障害分析操作制御部41が、図30に例示する操作画面ルールの編集画面を表示して、分析を行う操作者によっって操作画面ルールが編集されたとする。ここでは、図31に例示する記載332が追加されたとする。障害分析操作制御部41は、操作画面ルール保存部6が記憶していた編集前の操作画面ルール(図30参照。)を、記載332が追加された操作画面ルール(図31に例示する操作画面ルール)に更新する。   Further, it is assumed that the failure analysis operation control unit 41 displays the operation screen rule editing screen illustrated in FIG. 30 and the operation screen rule is edited by the operator who performs the analysis. Here, it is assumed that the description 332 illustrated in FIG. 31 is added. The failure analysis operation control unit 41 uses the operation screen rule (see FIG. 30) before editing stored in the operation screen rule storage unit 6 as the operation screen rule to which the description 332 is added (the operation screen illustrated in FIG. 31). Rule).

なお、記載332は、障害種別毎の障害履歴分布グラフを表示すること、および障害の発生箇所別の障害履歴分布グラフを表示することを規定する記載である。   Note that the description 332 defines that a failure history distribution graph for each failure type is displayed and that a failure history distribution graph for each failure occurrence location is displayed.

この編集後、過去に発生した各障害の一覧情報を表示する画面を表示する場合、障害分析操作画面生成部42は、障害種別毎の障害履歴分布グラフおよび障害の発生箇所別の障害履歴分布グラフを追加した画面を生成する。そして、障害分析操作制御部41は、その画面を入出力装置1に表示させる。この画面の例を図32に示す。すなわち、図30に例示する操作画面ルールが図31に例示するように編集されたことにより、過去に発生した各障害の一覧情報を表示する画面は、図14に例示する画面から、図32に例示する画面に変更されることになる。   After this editing, when displaying a screen for displaying list information of each failure that has occurred in the past, the failure analysis operation screen generation unit 42 displays a failure history distribution graph for each failure type and a failure history distribution graph for each failure location. Generate a screen with added. Then, the failure analysis operation control unit 41 causes the input / output device 1 to display the screen. An example of this screen is shown in FIG. That is, the operation screen rule illustrated in FIG. 30 is edited as illustrated in FIG. 31, so that the screen displaying the list information of each failure that has occurred in the past is changed from the screen illustrated in FIG. It will be changed to the screen illustrated.

以上のように、障害分析プロセス制御部4が、障害対処操作画面生成部33と同様の機能を有する障害分析操作画面生成部42を備え、操作画面ルール保存部6が障害分析作業時の操作画面ルールを保持することで、障害対処時と同様に、障害分析時の操作画面を柔軟に変更することが可能となる。また、実際に運用管理を行う顧客にシステム運用管理支援装置を提供する事業者は、顧客の要求にあった障害分析のための操作画面を容易に提供できる。事業者は、予め操作画面ルール保存部6にデフォルトの操作画面ルールを記憶させた状態で、システム運用管理支援装置を顧客に提供する。そして、顧客が操作者として操作画面ルールを変更することにより、顧客自身の要求にあった障害分析のための操作画面が表示されるようにすることができる。あるいは、システム運用管理支援装置を提供する事業者が、顧客の代わりに操作画面ルールを変更して、顧客の要求にあった障害分析のための操作画面が表示されるようにするようにしてもよい。   As described above, the failure analysis process control unit 4 includes the failure analysis operation screen generation unit 42 having the same function as the failure handling operation screen generation unit 33, and the operation screen rule storage unit 6 operates the operation screen during failure analysis work. By holding the rules, it is possible to flexibly change the operation screen at the time of failure analysis as in the case of failure handling. Further, a business operator who provides a system operation management support apparatus to a customer who actually performs operation management can easily provide an operation screen for failure analysis that meets the customer's request. The business operator provides the system operation management support apparatus to the customer in a state where the default operation screen rule is stored in the operation screen rule storage unit 6 in advance. When the customer changes the operation screen rule as an operator, an operation screen for failure analysis that meets the customer's own request can be displayed. Alternatively, the operator providing the system operation management support device may change the operation screen rules on behalf of the customer so that the operation screen for failure analysis that meets the customer's request is displayed. Good.

なお、本実施の形態において、図33に示すように、障害対処操作制御部31に対応する入出力装置1と、障害分析操作制御部41に対応する入出力装置11とを別々に備える構成としてもよい。図33に示す入出力装置1は、対処を行う操作者によって使用され、図33に示す入出力装置11は、分析を行う操作者によって使用される。このように対処操作のための入出力装置1と、分析操作のための入出力装置11とを別々に設け、入出力装置の用途を対処と分析とで明確に区別することで、発生した障害の対処と分析の作業を並行して別の人間が進めることや、対処と分析とを遠距離で行うことが可能となる。なお、図33では、障害分析操作画面制御部42を備える場合を示したが、障害分析操作画面制御部42を備えない構成において、入出力装置1と入出力装置11とを別々に備えるようにしてもよい。   In the present embodiment, as shown in FIG. 33, the input / output device 1 corresponding to the failure handling operation control unit 31 and the input / output device 11 corresponding to the failure analysis operation control unit 41 are separately provided. Also good. The input / output device 1 shown in FIG. 33 is used by an operator who performs countermeasures, and the input / output device 11 shown in FIG. 33 is used by an operator who performs analysis. In this way, the input / output device 1 for coping operation and the input / output device 11 for analyzing operation are separately provided, and the use of the input / output device is clearly distinguished from coping and analysis, thereby causing a failure. It is possible for another person to proceed with the coping and analysis work in parallel, and to perform the coping and analysis at a long distance. Although FIG. 33 shows the case where the failure analysis operation screen control unit 42 is provided, the input / output device 1 and the input / output device 11 are provided separately in a configuration without the failure analysis operation screen control unit 42. May be.

第2の実施の形態において、特許請求の範囲に記載の障害情報記憶手段は、障害情報保存部5によって実現される。障害対処支援手段は、障害対処操作制御部31および入出力装置1によって実現される。対処履歴情報記録管理手段は、対処履歴情報記録管理部32によって実現される。障害分析支援手段は、障害分析操作制御部41および入出力装置1(または入出力装置11)によって実現される。操作画面ルール記憶手段は、操作画面ルール保存部6によって実現される。障害対処操作画面生成手段は、障害対処操作画面生成部33によって実現される。障害分析操作画面生成手段は、障害分析操作画面生成部42によって実現される。システム状態監視手段は、システム状態監視部2によって実現される。障害対処操作制御手段は、障害対処操作制御部31によって実現される。障害分析操作制御手段は、障害分析操作制御部41によって実現される。   In the second embodiment, the failure information storage unit described in the claims is realized by the failure information storage unit 5. The failure handling support means is realized by the failure handling operation control unit 31 and the input / output device 1. The handling history information record management means is realized by the handling history information record management unit 32. The failure analysis support means is realized by the failure analysis operation control unit 41 and the input / output device 1 (or the input / output device 11). The operation screen rule storage means is realized by the operation screen rule storage unit 6. The failure handling operation screen generation means is realized by the failure handling operation screen generation unit 33. The failure analysis operation screen generation means is realized by the failure analysis operation screen generation unit 42. The system state monitoring unit is realized by the system state monitoring unit 2. The failure handling operation control means is realized by the failure handling operation control unit 31. The failure analysis operation control means is realized by the failure analysis operation control unit 41.

本発明は、発生した障害に対する対処や分析に対して有用である。   The present invention is useful for dealing with and analyzing a failure that has occurred.

本発明の第1の実施の形態を示すブロック図である。It is a block diagram which shows the 1st Embodiment of this invention. 障害分類情報の例を示す説明図である。It is explanatory drawing which shows the example of fault classification information. 障害履歴の例を示す説明図である。It is explanatory drawing which shows the example of a failure log | history. 障害対処ログの例を示す説明図である。It is explanatory drawing which shows the example of a failure handling log. 操作ログの例を示す説明図である。It is explanatory drawing which shows the example of an operation log. 障害対処操作制御部が一連の画面(対処時画面群)を入出力装置に表示させて、操作者に障害対処を促す処理過程の例を示すフローチャートである。10 is a flowchart illustrating an example of a process in which a failure handling operation control unit displays a series of screens (a group of handling screens) on an input / output device to prompt an operator to deal with a failure. 障害対処作業が行われているときに対処履歴情報記録管理部が行う情報記録管理処理の例を示すフローチャートである。It is a flowchart which shows the example of the information record management process which a response history information record management part performs when the failure countermeasure operation | work is performed. 現在発生している障害を一覧表示する画面の例を示す説明図である。It is explanatory drawing which shows the example of the screen which displays the fault which has generate | occur | produced now as a list. 情報参照用ウィンドウの表示例を示す説明図である。It is explanatory drawing which shows the example of a display of the window for information reference. 障害対処画面(障害対処ウィンドウ)の例を示す説明図である。It is explanatory drawing which shows the example of a trouble handling screen (fault handling window). 承認依頼を実行するかを確認するための確認画面の例を示す説明図である。It is explanatory drawing which shows the example of the confirmation screen for confirming whether an approval request is performed. 障害対処ログの例を示す説明図である。It is explanatory drawing which shows the example of a failure handling log. 障害対処画面(障害対処ウィンドウ)の例を示す説明図である。It is explanatory drawing which shows the example of a trouble handling screen (fault handling window). 過去に発生した各障害の一覧情報を表示する画面の例を示す説明図である。It is explanatory drawing which shows the example of the screen which displays the list information of each failure which generate | occur | produced in the past. 障害分析時に表示される画面の例を示す説明図である。It is explanatory drawing which shows the example of the screen displayed at the time of a failure analysis. 障害対処時に表示される画面の例を示す説明図である。It is explanatory drawing which shows the example of the screen displayed at the time of trouble handling. 第1の実施の形態の変形例を示すブロック図である。It is a block diagram which shows the modification of 1st Embodiment. 本発明の第2の実施の形態を示すブロック図である。It is a block diagram which shows the 2nd Embodiment of this invention. 操作画面ルールの例を示す説明図である。It is explanatory drawing which shows the example of an operation screen rule. 操作ログの例を示す説明図である。It is explanatory drawing which shows the example of an operation log. 障害対処画面から他のウィンドウを経由して有用な情報を含むウィンドウを表示させている状況の例を示す説明図である。It is explanatory drawing which shows the example of the condition which is displaying the window containing useful information via another window from a failure handling screen. 分析を行う操作者によって編集された操作画面ルールの例を示す説明図である。It is explanatory drawing which shows the example of the operation screen rule edited by the operator who performs analysis. 編集された操作画面ルールに基づいて生成された画面の例を示す説明図である。It is explanatory drawing which shows the example of the screen produced | generated based on the edited operation screen rule. 編集された操作画面ルールに基づいて生成された画面の例を示す説明図である。It is explanatory drawing which shows the example of the screen produced | generated based on the edited operation screen rule. 警告ウィンドウを表示する状況を示す説明図である。It is explanatory drawing which shows the condition which displays a warning window. 編集内容に制約を設けた編集画面の例を示す説明図である。It is explanatory drawing which shows the example of the edit screen which provided the restriction | limiting in the edit content. 「リンク付加/解除」ボタン押下時および基本ボタンに関する設定時の状況を示す説明図である。It is explanatory drawing which shows the condition at the time of the setting regarding a basic button when "link addition / release" button is pressed. 特定の障害に応じた対処画面ルールの編集画面に移行するためのボタンを備えた画面の例を示す説明図である。It is explanatory drawing which shows the example of the screen provided with the button for shifting to the edit screen of the countermeasure screen rule according to a specific failure. 第2の実施の形態の変形例を示すブロック図である。It is a block diagram which shows the modification of 2nd Embodiment. 過去に発生した各障害の一覧情報を表示する画面の表示態様を規定する操作画面ルールの例を示す説明図である。It is explanatory drawing which shows the example of the operation screen rule which prescribes | regulates the display mode of the screen which displays the list information of each failure which generate | occur | produced in the past. 編集後の操作画面ルールの例を示す説明図である。It is explanatory drawing which shows the example of the operation screen rule after edit. 編集後の操作画面ルールに基づいて作成された画面の例を示す説明図である。It is explanatory drawing which shows the example of the screen produced based on the operation screen rule after edit. 第2の実施の形態の変形例を示すブロック図である。It is a block diagram which shows the modification of 2nd Embodiment.

符号の説明Explanation of symbols

1 入出力装置
2 システム状態監視部
3 障害対処プロセス制御部
4 障害分析プロセス制御部
5 障害情報保存部
6 操作画面ルール保存部
31 障害対処操作制御部
32 対処履歴情報記録管理部
33 障害対処操作画面生成部
41 障害分析操作制御部
42 障害分析操作画面生成部
DESCRIPTION OF SYMBOLS 1 Input / output device 2 System status monitoring part 3 Fault handling process control part 4 Fault analysis process control part 5 Fault information storage part 6 Operation screen rule storage part 31 Fault handling operation control part 32 Handling history information record management part 33 Fault handling operation screen Generation unit 41 Failure analysis operation control unit 42 Failure analysis operation screen generation unit

Claims (12)

管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段と、
少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示するとともに操作者による操作の情報を収集する障害対処支援手段と、
前記障害対処支援手段が収集した操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを前記障害情報記憶手段に記憶させる対処履歴情報記録管理手段と、
前記障害情報記憶手段に記憶された情報に基づいて、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示する障害分析支援手段とを備えた
ことを特徴とするシステム運用管理支援装置。
Failure information storage means for storing the classification information of the symptoms of the failure that has occurred in the managed system and a log of coping operations performed on the failure;
A trouble handling support means for displaying a series of screens including at least a screen for displaying information on the trouble that has occurred and a screen for prompting the operator to select the content of the trouble handling, and collecting information on operations by the operator;
Based on the operation information collected by the trouble handling support means by the operator, a handling history information record management means for storing in the fault information storage means a log relating to each operation performed at the time of handling the trouble by the operator;
Based on the information stored in the failure information storage means, a series including at least a screen for displaying a list of each failure that has occurred in the past and a screen for displaying a log regarding each operation performed at the time of handling the failure. A system operation management support apparatus comprising failure analysis support means for displaying the screen of the system.
管理対象システムに生じた障害の症状および前記障害に対する障害対処の状況を監視し、監視した症状や障害対処の状況を障害対処支援手段に出力するシステム状態監視手段を備え、
障害対処支援手段は、前記システム状態監視手段によって出力された障害の症状や障害対処の状況を、発生した障害の情報を表示する画面内で表示する
請求項1に記載のシステム運用管理支援装置。
A system status monitoring unit that monitors a symptom of a failure that has occurred in a managed system and a status of the fault handling for the fault, and outputs the monitored symptom and the status of the fault handling to a fault handling support unit;
The system operation management support apparatus according to claim 1, wherein the failure handling support unit displays the failure symptom and the status of the failure handling output by the system state monitoring unit in a screen that displays information on the failure that has occurred.
対処履歴情報記録管理手段は、操作中断を示す情報が障害対処支援手段によって収集されたときに、中断された操作に対応するログを障害情報記憶手段から削除する
請求項1または請求項2に記載のシステム運用管理支援装置。
The handling history information record management unit deletes a log corresponding to the interrupted operation from the fault information storage unit when information indicating operation interruption is collected by the failure handling support unit. System operation management support device.
障害分析支援手段は、操作者による操作に応じて、未知の障害として分類されていた症状が既知の障害として分類されるように、障害情報記憶手段によって記憶される分類情報を更新し、
障害対処支援手段は、分類情報を参照することにより、発生した障害の情報を表示する画面内で、管理対象システムに生じた症状が分類される障害を表示する
請求項1から請求項3のうちのいずれか1項に記載のシステム運用管理支援装置。
The failure analysis support means updates the classification information stored by the failure information storage means so that the symptom classified as an unknown failure is classified as a known failure according to an operation by the operator,
The failure handling support means refers to the classification information, and displays the failure in which the symptom occurring in the managed system is classified in the screen displaying the information of the failure that has occurred. The system operation management support apparatus according to any one of the above.
障害対処支援手段が表示する画面の表示態様を規定する操作画面ルールを記憶する操作画面ルール記憶手段と、
障害対処支援手段によって画面を指定され、当該画面に応じた操作画面ルールを参照して指定された画面を生成する障害対処操作画面生成手段とを備え、
障害分析支援手段は、操作者による操作に応じて、操作画面ルール記憶手段が記憶する操作画面ルールを更新する
請求項1から請求項4のうちのいずれか1項に記載のシステム運用管理支援装置。
An operation screen rule storage unit that stores an operation screen rule that defines a display mode of a screen displayed by the failure handling support unit;
A failure handling operation screen generation unit that generates a specified screen by referring to an operation screen rule corresponding to the screen specified by the failure handling support unit,
The system operation management support device according to any one of claims 1 to 4, wherein the failure analysis support means updates the operation screen rule stored in the operation screen rule storage means in accordance with an operation by the operator. .
障害分析支援手段は、操作画面ルールの編集画面であって、画面遷移を指示するボタンを新規に表示させるための操作画面ルール編集操作に制約が設けられた編集画面を表示して、操作画面ルールの編集操作を促す
請求項5に記載のシステム運用管理支援装置。
The failure analysis support means is an operation screen rule editing screen that displays an editing screen with restrictions on the operation screen rule editing operation for newly displaying a button for instructing screen transition, and the operation screen rule. The system operation management support apparatus according to claim 5, which prompts an editing operation.
操作画面ルール記憶手段は、障害対処支援手段が表示する画面の表示態様を規定する操作画面ルールとともに、障害分析支援手段が表示する画面の表示態様を規定する操作画面ルールを記憶し、
障害分析支援手段によって画面を指定され、当該画面に応じた操作画面ルールを参照して指定された画面を生成する障害分析操作画面生成手段を備え、
障害分析支援手段は、操作者による操作に応じて、操作画面ルール記憶手段が記憶する操作画面ルールを更新する
請求項5または請求項6に記載のシステム運用管理支援装置。
The operation screen rule storage means stores the operation screen rule that defines the display mode of the screen displayed by the failure analysis support means, together with the operation screen rule that defines the display mode of the screen displayed by the failure handling support means,
A failure analysis operation screen generation unit that generates a specified screen by referring to an operation screen rule corresponding to the screen is specified by the failure analysis support unit,
The system operation management support apparatus according to claim 5 or 6, wherein the failure analysis support means updates the operation screen rule stored in the operation screen rule storage means in accordance with an operation by the operator.
障害情報記憶手段が、管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶し、
障害対処支援手段が、少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示するとともに操作者による操作の情報を収集し、
対処履歴情報記録管理手段が、前記障害対処支援手段が収集した操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを前記障害情報記憶手段に記憶させ、
障害分析支援手段が、前記障害情報記憶手段に記憶された情報に基づいて、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示する
ことを特徴とするシステム運用管理支援方法。
The failure information storage means stores the classification information of the failure symptom that has occurred in the managed system and the log of coping operations performed on the failure,
The troubleshooting support means displays a series of screens including at least a screen that displays information on the failure that has occurred and a screen that prompts the operator to select the content of the troubleshooting, and collects information on operations performed by the operator. ,
The handling history information record management means stores, in the fault information storage means, a log relating to each operation performed at the time of handling the fault by the operator based on the operation information collected by the fault handling support means.
Based on the information stored in the failure information storage unit, the failure analysis support unit displays at least a screen that displays a list of each failure that has occurred in the past, and a log relating to each operation performed during the failure handling A system operation management support method characterized by displaying a series of screens including a screen to be displayed.
管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段に対するアクセスが可能な障害対処装置であって、
少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示装置に出力するとともに、前記表示装置での操作者による操作の情報を収集する障害対処操作制御手段と、
前記障害対処操作制御手段が収集した操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを前記障害情報記憶手段に記憶させる対処履歴情報記録管理手段とを備えた
ことを特徴とする障害対処装置。
A fault handling apparatus capable of accessing fault information storage means for storing classification information of symptoms of faults occurring in a managed system and a log of coping operations performed on the faults,
A series of screens including at least a screen for displaying information on the failure that has occurred and a screen for prompting the operator to select content for handling the failure are output to the display device, and information on the operation by the operator on the display device Fault handling operation control means for collecting
A handling history information record management means for storing, in the fault information storage means, a log relating to each operation performed at the time of handling the fault by the operator based on the information of the operation by the operator collected by the fault handling operation control means. A failure handling apparatus characterized by comprising.
管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段に対するアクセスが可能な障害分析装置であって、
前記障害情報記憶手段に記憶された情報に基づいて、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示装置に出力する障害分析操作制御手段を備えた
ことを特徴とする障害分析装置。
A failure analysis device capable of accessing failure information storage means for storing classification information of symptoms of failure that occurred in a managed system and a log of coping operations performed on the failure,
Based on the information stored in the failure information storage means, a series including at least a screen for displaying a list of each failure that has occurred in the past and a screen for displaying a log regarding each operation performed at the time of handling the failure. A failure analysis apparatus characterized by comprising failure analysis operation control means for outputting the above screen to a display device.
管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段に対するアクセスが可能なコンピュータに搭載されるシステム運用管理支援プログラムであって、
前記コンピュータに、
少なくとも、発生した障害の情報を表示する画面と、障害対処の内容の選択を操作者に促す画面とを含む一連の画面を表示装置に出力するとともに、前記表示装置での操作者による操作の情報を収集する障害対処操作制御処理、および
前記障害対処操作制御処理で収集された操作者による操作の情報に基づいて、操作者により障害対処時に行われた個々の操作に関するログを前記障害情報記憶手段に記憶させる対処履歴情報記録管理処理
を実行させるためのシステム運用管理支援プログラム。
A system operation management support program installed in a computer capable of accessing failure information storage means for storing classification information of symptom symptoms of a failure that has occurred in a managed system and a log of coping operations performed on the failure,
In the computer,
A series of screens including at least a screen for displaying information on the failure that has occurred and a screen for prompting the operator to select content for handling the failure are output to the display device, and information on the operation by the operator on the display device Troubleshooting operation control processing for collecting faults, and logs relating to individual operations performed at the time of troubleshooting by the operator based on the operation information collected by the operator in the failure handling operation control processing. A system operation management support program for executing the handling history information record management process stored in the system.
管理対象システムに生じた障害の症状の分類情報および障害に対して行われる対処作業のログを記憶する障害情報記憶手段に対するアクセスが可能なコンピュータに搭載されるシステム運用管理支援プログラムであって、
前記コンピュータに、
前記障害情報記憶手段に記憶された情報に基づいて、少なくとも、過去に発生した各障害の一覧情報を表示する画面と、障害対処時に行われた個々の操作に関するログを表示する画面とを含む一連の画面を表示装置に出力する障害分析操作制御処理
を実行させるためのシステム運用管理支援プログラム。
A system operation management support program installed in a computer capable of accessing failure information storage means for storing classification information of symptom symptoms of a failure that has occurred in a managed system and a log of coping operations performed on the failure,
In the computer,
Based on the information stored in the failure information storage means, a series including at least a screen for displaying a list of each failure that has occurred in the past and a screen for displaying a log regarding each operation performed at the time of handling the failure. System operation management support program for executing failure analysis operation control processing to output the above screen to the display device.
JP2005073611A 2005-03-15 2005-03-15 System operation management support device, system operation management support method, and system operation management support program Expired - Fee Related JP4617937B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005073611A JP4617937B2 (en) 2005-03-15 2005-03-15 System operation management support device, system operation management support method, and system operation management support program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005073611A JP4617937B2 (en) 2005-03-15 2005-03-15 System operation management support device, system operation management support method, and system operation management support program

Publications (2)

Publication Number Publication Date
JP2006259891A true JP2006259891A (en) 2006-09-28
JP4617937B2 JP4617937B2 (en) 2011-01-26

Family

ID=37099117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005073611A Expired - Fee Related JP4617937B2 (en) 2005-03-15 2005-03-15 System operation management support device, system operation management support method, and system operation management support program

Country Status (1)

Country Link
JP (1) JP4617937B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193207A (en) * 2008-02-13 2009-08-27 Nec Corp Information collection procedure management system
JP2010146483A (en) * 2008-12-22 2010-07-01 Nec Corp System, method and program for supporting operation
JP2013171385A (en) * 2012-02-20 2013-09-02 Nec Corp Maintenance management device, maintenance system and maintenance method
WO2022149265A1 (en) * 2021-01-08 2022-07-14 日本電信電話株式会社 Extraction device, extraction method, and extraction program
WO2024252567A1 (en) * 2023-06-07 2024-12-12 日本電信電話株式会社 Past case management device, method, and program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07253956A (en) * 1994-03-15 1995-10-03 Fujitsu Ltd Computer monitoring system
JPH1091475A (en) * 1996-09-17 1998-04-10 Nec Corp Fault restoration device, fault restoration method and program medium for fault restoration
JPH10143394A (en) * 1996-11-05 1998-05-29 Nec Corp Alarm control system for fault management
JPH1173259A (en) * 1997-06-30 1999-03-16 Hitachi Ltd Screen generating method for customer operation type automatic machine
JPH11110258A (en) * 1997-10-02 1999-04-23 Nec Corp Error message diagnostic device
JP2000293411A (en) * 1999-04-06 2000-10-20 Nippon Steel Corp Fault management device and method, recording medium
JP2004178296A (en) * 2002-11-27 2004-06-24 Nec Corp Knowledge based operation management system, method and program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07253956A (en) * 1994-03-15 1995-10-03 Fujitsu Ltd Computer monitoring system
JPH1091475A (en) * 1996-09-17 1998-04-10 Nec Corp Fault restoration device, fault restoration method and program medium for fault restoration
JPH10143394A (en) * 1996-11-05 1998-05-29 Nec Corp Alarm control system for fault management
JPH1173259A (en) * 1997-06-30 1999-03-16 Hitachi Ltd Screen generating method for customer operation type automatic machine
JPH11110258A (en) * 1997-10-02 1999-04-23 Nec Corp Error message diagnostic device
JP2000293411A (en) * 1999-04-06 2000-10-20 Nippon Steel Corp Fault management device and method, recording medium
JP2004178296A (en) * 2002-11-27 2004-06-24 Nec Corp Knowledge based operation management system, method and program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193207A (en) * 2008-02-13 2009-08-27 Nec Corp Information collection procedure management system
JP2010146483A (en) * 2008-12-22 2010-07-01 Nec Corp System, method and program for supporting operation
JP2013171385A (en) * 2012-02-20 2013-09-02 Nec Corp Maintenance management device, maintenance system and maintenance method
WO2022149265A1 (en) * 2021-01-08 2022-07-14 日本電信電話株式会社 Extraction device, extraction method, and extraction program
JP7517474B2 (en) 2021-01-08 2024-07-17 日本電信電話株式会社 Extraction device, extraction method, and extraction program
WO2024252567A1 (en) * 2023-06-07 2024-12-12 日本電信電話株式会社 Past case management device, method, and program

Also Published As

Publication number Publication date
JP4617937B2 (en) 2011-01-26

Similar Documents

Publication Publication Date Title
US7949906B2 (en) Management supporting system, management supporting method, and management supporting program
US10380548B2 (en) Event-driven customizable automated workflows for incident remediation
US8332344B2 (en) Operation management apparatus, operation management method, and operation management program
JP7423942B2 (en) information processing system
EP1969469B1 (en) System and method for automated and assisted resolution of it incidents
US20120102543A1 (en) Audit Management System
US20050144151A1 (en) System and method for decision analysis and resolution
JP2011076161A (en) Incident management system
JP2009211611A (en) Operation management system, method, and program
JP4617937B2 (en) System operation management support device, system operation management support method, and system operation management support program
CN116010066A (en) RPA robot and implementation method
JP2005038125A (en) Access log analysis method and analysis system
JP2010067056A (en) Control program, information processing system, and information processing method
KR101490984B1 (en) Providing method for event information, Integrated control system performing the same, Computer program for the same, and Recording medium storing computer program thereof
US8402125B2 (en) Method of managing operations for administration, maintenance and operational upkeep, management entity and corresponding computer program product
JP7036603B2 (en) Operation management system
JP6394032B2 (en) Process management program, process management apparatus, and process management method
JP2007079896A (en) Monitoring device and monitoring method
JP2007072545A (en) Monitoring device and monitoring method
JP2007072546A (en) Flow editing apparatus and flow editing method
JP2008117029A (en) Method for checking out invalid procedure during creation of operational work procedure, method for generating command for preventing occurrence of failure, automatic execution command generation system, and program therefor
JP4683535B2 (en) Job net management system
JP2009026052A (en) Fault monitoring system, manager device, fault monitoring method, and program
US6944866B1 (en) System and method for coordinating operator efforts using action diaries
JPWO2009116126A1 (en) Information acquisition support device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100928

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101011

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees