JP5198154B2 - A monitoring device and fault monitoring method fault monitoring systems and devices - Google Patents

A monitoring device and fault monitoring method fault monitoring systems and devices Download PDF

Info

Publication number
JP5198154B2
JP5198154B2 JP2008146774A JP2008146774A JP5198154B2 JP 5198154 B2 JP5198154 B2 JP 5198154B2 JP 2008146774 A JP2008146774 A JP 2008146774A JP 2008146774 A JP2008146774 A JP 2008146774A JP 5198154 B2 JP5198154 B2 JP 5198154B2
Authority
JP
Japan
Prior art keywords
state transition
monitoring
fault
information
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008146774A
Other languages
Japanese (ja)
Other versions
JP2009294837A (en
Inventor
大輔 福井
真澄 川上
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to JP2008146774A priority Critical patent/JP5198154B2/en
Publication of JP2009294837A publication Critical patent/JP2009294837A/en
Application granted granted Critical
Publication of JP5198154B2 publication Critical patent/JP5198154B2/en
Application status is Expired - Fee Related legal-status Critical
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、障害監視システム及びデバイスと監視装置並びに障害監視方法に関し、特にネットワークを通じて直接的または間接的に通信が可能な複数のデバイスにおける障害の発生を監視する技術に関する。 The present invention relates to a fault monitoring system and device and the monitoring device and fault monitoring method, a technique for monitoring the occurrence of a failure in direct or indirect communication plurality of devices capable especially through the network.

近年、携帯電話やテレビといったコンシューマ機器が多機能化しており、そこに搭載されるソフトウェアの規模は年々増加する傾向にある。 In recent years, consumer devices such as mobile phones and television has multiple functions, the scale of the software that is installed there tends to increase year by year. 一般に、ソフトウェアの規模が増加すると、潜在的なバグの数が増加し、製品出荷後に不良が発生する可能性が高くなる。 In general, when the scale of software increases, the potential number of bugs increases the likelihood that defective after shipment occurs becomes high. こうした状況を避けるため、大規模なソフトウェアの開発を高品位に、かつ高効率に行うために、モデルベース開発やソフトウェアプロダクトラインといったソフトウェア開発の方法論に関する研究が進められている。 In order to avoid this situation, the development of large-scale software to high-quality, and in order to perform in high-efficiency, research on the methodology of software development, such as model-based development and software product line has been developed.
一方、コンシューマ機器の製品出荷後に発生するソフトウェアの不具合を迅速に修正するための要素技術の研究も進んでいる。 On the other hand, it has advanced research of elemental technologies for rapidly modify the software defects that occur after the product shipment of consumer devices. ソフトウェアをリモートから更新するための機能を備えたテレビやゲーム機が製品化されている。 TV and game machine equipped with a function to update the software from a remote have been commercialized. また、機器上で発生した障害を検出するシステムが一般に知られている。 The system for detecting a fault occurring on the device is generally known. 例えば特許文献1記載の障害監視システムや特許文献2記載の組み込み機器用監視装置などがある。 For example, a Patent Document 1, wherein the failure monitoring system and Patent Document 2 for embedded equipment monitoring device according.
特開平9−91219号公報 JP 9-91219 discloses 特開2004−187196号公報 JP 2004-187196 JP

一般的な障害検出システムは、監視対象機器からセンタサーバへ障害情報を送信することで障害の検出を行っている。 Common failure detection system is performing detection of a fault by sending the fault information from the monitored device to the center server. この方式では、監視対象機器の数が増えるにつれて通信回数や通信データ量が増加し、輻輳の発生やサーバ維持費の増加に繋がっている。 This method increases the amount of communication times and communication data as the number increases monitored devices, has led to increased incidence or server maintenance costs congestion. そこで、前記特許文献1では、発生した障害情報の緊急度を判定し、緊急度が高い障害情報は直ちにセンタサーバへ送信し、緊急度が低い障害情報は一定期間蓄積した後にまとめて送信する手段について述べている。 Therefore, the Patent Document 1, to determine the urgency of the generated failure information, failure information is high urgency immediately sent to the center server, low failure information urgency means for transmitting together after a certain period accumulation describe. また、前記特許文献2では、監視対象機器同士が連携し、障害情報を回覧することで通信回数を削減する手段について述べている。 Further, the Patent Document 2, and monitored between devices work together, describes means for reducing the number of communications by circulation failure information.
しかし、前記特許文献1記載の方式では、通信の回数を削減することは可能であるが、通信データ量の削減には課題が残る。 However, in the method described in Patent Document 1, it is possible to reduce the number of times of communication, the problem remains to reduce the communication data amount. また、前記特許文献2記載の方式では、センタサーバに対する負担は軽減されるが、通信データ量は削減されず、かつ障害情報の収集に係る監視対象機器の高コスト化といった課題を持つ。 Further, in the method described in Patent Document 2, the burden on the center server is being reduced, the amount of communication data is not reduced, and have a problem that cost of the monitoring target device according to the collection of the fault information.

一般に通信データ量を削減する方式としてエラーコードの利用や、重要度の低い障害情報を間引いて送信する手段が考えられるが、この方式では障害情報の品質が低下する。 In general use and error codes as a method for reducing the amount of communication data, but the means for transmitting by thinning out the lower error information of importance considered, in this method the quality of the fault information is reduced. エラーコードの送信だけでは想定外の障害に対処することは難しく、障害情報を間引く手段では本当に必要な障害情報にアクセスできなくなる可能性がある。 Only the transmission of error code difficult to cope with unexpected failure may become inaccessible really need fault information by means of thinning out the fault information.

本発明が解決しようとする第1の課題は、監視対象機器の増加に伴う障害情報の通信データ量の増加である。 First object of the present invention is to provide an increase in communication data amount of fault information with increasing monitored equipment. 第2の課題は、通信データ量を削減することによる障害情報の品質低下である。 The second problem is the degradation of the fault information by reducing the amount of communication data.

前記課題を解決するため、本発明ではソフトウェアの開発段階で実施されるテストの結果を基にした障害情報を作成する。 To solve the above problems, the present invention creates failure information based on the results of tests performed during the development phase of the software. 例えばモデルベース開発と呼ばれる開発方法論で用いられる状態遷移表を基にした障害情報を作成する。 For example to create a fault information in which the state transition table used in the development methodology called model-based development based. テスト結果を基に、障害発生箇所のテストが実施済である場合は想定外の障害として詳細な障害情報を作成し、未実施である場合は想定内の障害としてテストの実施を促すための簡易な障害情報を作成し、実施中である場合は現在対策中の障害として障害情報を作成しない。 Based on the test results, if the test failure occurrence location is already performed to create a detailed fault information as fault unexpected, if it is not implemented in simplified to encourage the implementation of the test as a failure in the assumptions create a such failure information, the case is being carried out does not create a disaster information as a failure of the current measures. この方式を採用することで、前記課題を解決する。 By adopting this method, to solve the above problems.

すなわち、本発明は、監視対象となるデバイスと、前記デバイスにおける障害の発生を監視する監視装置と、前記デバイスの障害データを記憶するデータベースである外部記憶装置とからなり、これら装置がネットワークを介してデータの送受信が可能な障害監視システムであって、前記デバイス上で動作するプログラムモジュールにおいて発生した障害を監視する障害監視部と、前記プログラムモジュールの状態遷移を監視する状態遷移監視部と、前記障害監視部が障害の発生を検知した際に前記状態遷移監視部より状態遷移履歴情報を取得し、さらに前記外部記憶装置より前記プログラムモジュールに関して実施されたテストデータを取得し、前記状態遷移履歴情報および前記テストデータを基に障害情報を作成する障害情報作成部と、 That is, the present invention provides, through a device to be monitored, a monitoring device for monitoring the occurrence of a fault in the device, consists of an external storage device as a database that stores fault data of the device, these devices are network a transceiver capable fault monitoring system data Te, a failure monitoring unit that monitors a failure has occurred in the program modules running on the device, and state transitions monitoring unit for monitoring the state transition of the program modules, the the state transition monitoring unit acquires the state transition history information than when the failure monitoring unit detects the occurrence of a failure, to obtain more test data conducted with respect to the program module from the external storage device, the state transition history information and fault information creating unit that creates failure information based on the test data and, 記障害情報作成部により作成された障害情報を、ネットワークを介して前記監視装置に送信する障害情報送信部とを有する障害監視システムである。 The fault information generated by the serial failure information creation unit, a fault monitoring system comprising a fault information transmission unit that transmits to the monitoring device via the network.

本発明によれば、監視対象機器からセンタサーバに送信する障害情報のデータ量を削減でき、よって監視対象機器の増加に伴うネットワークトラフィックの増加を抑制することができる。 According to the present invention, it can reduce the data amount of fault information to be transmitted from the monitoring target device to the center server, thus an increase in network traffic due to an increase in monitored equipment can be suppressed. また、ソフトウェアの開発段階で実施されるテストの結果に依拠した監視方法であることから、既存の方式に比べて障害情報の品質を向上させることができ、かつ本発明の導入コストを低く抑えることが可能である。 Further, since it is monitoring method relied on the results of the tests performed during the development phase of the software, it is possible to improve the quality of the fault information in comparison with the conventional method, and to suppress the cost of introducing the present invention low it is possible.

本発明を実施するための最良の形態を説明する。 Describing the best mode for carrying out the present invention.
本発明の障害監視システム及びデバイスと監視装置並びに障害監視方法の実施形態について、図面を用いて説明する。 Embodiments of the fault monitoring systems and devices and monitoring device and fault monitoring method of the present invention will be described with reference to the drawings.
図1はハードウェア構成図である。 Figure 1 is a hardware configuration diagram. これは、本発明に係る一般的なシステムのハードウェア構成を表すものであり、ハードウェア構成を限定するものではない。 This is representative of the hardware configuration of a general system of the present invention, it does not limit the hardware configuration. また、本発明はネットワークを介した複数の端末を利用するシステムについて述べたものであるが、本図面は単一の端末について示したものであり、本発明に係る全ての端末を網羅するものではない。 Although the present invention has been described system utilizing a plurality of terminals via the network, the drawings are shown for a single terminal, intended to cover all of the terminal according to the present invention Absent.

演算装置101は、主記憶装置102にロードされたプログラムデータを解析し、処理を実行する中央演算ユニットである。 Processing unit 101 analyzes the program data loaded into main memory 102, a central processing unit to execute processing. 例えばIntel社製のPentium(登録商標)プロセッサなどが演算装置101に該当する。 Such as Intel Corp. Pentium (R) processor corresponds to the arithmetic unit 101.
主記憶装置102は、外部記憶装置104に記録されているプログラムデータをロードする揮発メモリである。 Main memory 102 is a volatile memory to load the program data recorded in the external storage device 104. 例えばDRAM等の半導体メモリが主記憶装置102に該当する。 For example, a semiconductor memory such as DRAM corresponds to main memory 102.
通信装置103は、外部ネットワークと通信するための装置である。 Communication device 103 is a device for communicating with an external network. 例えばインターネットに接続するためのネットワークインタフェースカードが通信装置103に該当する。 For example, a network interface card for connecting to the Internet corresponds to the communication device 103.
外部記憶装置104は、プログラムデータ等を記憶する不揮発メモリである。 The external storage device 104 is a nonvolatile memory for storing program data and the like. 例えばハードディスク装置が外部記憶装置104に該当する。 For example, a hard disk device corresponds to the external storage device 104. 外部記憶装置104は、データベース等のネットワークを介した装置であってもよい。 The external storage device 104 may be a device via a network such as a database.

図2はモジュール概念図である。 Figure 2 is a module schematic diagram. これは、本発明に係る一般的なモジュールの概念構成を表すものであり、モジュールの構成を限定するものではない。 This is representative of the conceptual configuration of a typical module according to the present invention, it does not limit the configuration of the module. 図示されているモジュールの包含関係(例えば被監視装置202と監視エージェント206の包含関係)は一般的な例であり、包含関係を規定するものではない。 Inclusion relation modules depicted (e.g. inclusion relationship of the monitoring device 202 and monitoring agent 206) is a common example, it does not define a containment relationship. また、図示されているモジュールがネットワークを介して連携するかどうか、同一の装置上で連携するかどうかについて規定するものではない。 Also, whether the module depicted is through a network linkage, it does not define whether to work on the same device.

ネットワーク201は、データの送受信が行えることを特徴とする通信ネットワークである。 Network 201 is a communication network, wherein the transmission and reception of data can be performed. 例えばインターネットやEthernet(登録商標)などがネットワーク201に該当する。 For example, the Internet and Ethernet (registered trademark), etc. correspond to the network 201.

被監視装置202は、ネットワーク201を介して監視装置215によって監視される装置である。 Monitored device 202 is a device that is monitored by the monitoring apparatus 215 via the network 201. 例えば携帯電話やホームゲートウェイなどが被監視装置202に該当する。 Such as mobile phones and home gateway correspond to the monitored device 202.
被監視プログラム203は、監視エージェント206によって監視されるプログラムである。 The monitoring program 203 is a program monitored by the monitoring agent 206. 例えばホームゲートウェイ上で動作する情報家電制御プログラムなどが被監視プログラム203に該当する。 For example, information appliance control program running on the home gateway correspond to the monitoring program 203.

状態遷移通知部204は、被監視プログラム203上で発生した状態遷移に関する情報を状態遷移監視部207に通知するモジュールである。 State transition notification unit 204 is a module for notifying the information on the state transition that occurred on the monitored program 203 to the state transition monitor 207. また、通知方式は、PUSH型(状態遷移通知部204から状態遷移監視部207へ通知する方式)であってもよく、PULL型(状態遷移監視部207から状態遷移通知部204に問い合わせる方式)であってもよい。 The notification scheme, in may be a PUSH type (method for notifying the state transition notification unit 204 to the state transition monitor 207), PULL type (method to query the state transition monitor 207 to the state transition notification unit 204) it may be. 例えばJava(登録商標)のJMX(Java Management Extensions)仕様で規定されるMBeanなどを利用することで状態遷移通知部204を実装できる。 For example, implement a state transition notification unit 204 by utilizing such MBean defined by JMX (Java Management Extensions) specification of Java (registered trademark). この具体例については後述する。 This specific example will be described later.

障害通知部205は、被監視プログラム203上で発生した障害に関する情報を障害監視部208に通知するモジュールである。 Failure notification unit 205 is a module for notifying the information about the fault that has occurred on the monitored program 203 to the fault monitoring section 208. また、通知方式は、PUSH型(障害通知部205から障害監視部208へ通知する方式)であってもよく、PULL型(障害監視部208から障害通知部205に問い合わせる方式)であってもよい。 The notification system may be a PUSH type (method of notifying the failure notification unit 205 to the fault monitoring section 208), it may be a PULL type (method to query failure monitoring unit 208 in the failure notification unit 205) . 例えばJavaのJMX仕様で規定されるMBeanなどを利用することで障害通知部205を実装できる。 For example, implement a failure notification unit 205 by utilizing such MBean defined by JMX specification for Java. この具体例については後述する。 This specific example will be described later.

監視エージェント206は、被監視プログラム203の状態遷移、および被監視プログラム203における障害の発生を監視し、被監視プログラム203で障害が発生した場合、ネットワーク201を介してデータベース212より状態遷移表テストデータ213および状態遷移パステストデータ214等のテストデータを取得し、当該テストデータを基に発生した障害の種類を判定し、発生した障害の種類を基に障害情報を作成し、必要であればネットワーク201を介して監視装置215に前記障害情報を送信するモジュールであり、また、ネットワーク201を介して監視装置215より最新のテストデータを受信し、当該テストデータを基にネットワーク201を介してデータベース212に格納されている状態遷移表テストデータ Monitoring agent 206, the state transition of the monitoring program 203, and monitors the occurrence of a fault in the monitoring program 203, if a failure in the monitored program 203 occurs, the state transition table test data from the database 212 via the network 201 213 and acquires the test data such as the state transition path test data 214, determines the type of fault occurring on the basis of the test data, creates failure information based on the type of failure that has occurred, if necessary network 201 is a module for transmitting the fault information to the monitoring apparatus 215 via, also receives the latest test data from the monitoring device 215 via the network 201, via the network 201 based on the test data database 212 state transition table test data stored in the 13および状態遷移パステストデータ214等の前記テストデータを更新する機能を持ったモジュールである。 The test data such as 13 and the state transition path test data 214 is a module having a function of updating the.
監視エージェント206は、被監視プログラム203と同じマシン上に存在してもよく、ネットワーク201を介した別のマシン上に存在してもよい。 Monitoring agent 206 may reside on the same machine as the monitoring program 203 may reside on a different machine through a network 201. また、状態遷移表テストデータ213および状態遷移パステストデータ214等のテストデータは、別のテストデータを利用することも可能である。 Further, the test data such as the state transition table test data 213 and the state transition path test data 214, it is also possible to use a separate test data. 本実施例では、テストデータの具体的な例として状態遷移表テストデータ213および状態遷移パステストデータ214を利用する。 In this embodiment, utilizing a state transition table test data 213 and the state transition path test data 214 as a specific example of the test data. これらのテストデータの具体例については後述する。 Specific examples of these test data will be described later.

状態遷移監視部207は、前述の通り、状態遷移通知部204と連携し、被監視プログラム203の状態遷移を監視するモジュールである。 State transition monitor 207, as described above, in conjunction with the state transition notification unit 204 is a module for monitoring the state transition of the monitoring program 203.
障害監視部208は、前述の通り、障害通知部205と連携し、被監視プログラム203上で発生する障害を監視するモジュールである。 Failure monitoring unit 208, as described above, in cooperation with the failure notification unit 205 is a module for monitoring faults occurring on the monitored program 203.
障害情報作成部209は、障害監視部208が障害の発生を検知した際、過去に遷移した状態の履歴情報を状態遷移監視部207より取得し、ネットワーク201を介して当該情報に対応する状態遷移表テストデータ213および状態遷移パステストデータ214をデータベース212より取得し、当該データを基に障害情報を作成し、必要であれば当該障害情報を障害情報送信部210に送信するモジュールである。 Failure information generating unit 209, when the failure monitoring unit 208 detects the occurrence of a failure to acquire historical information transits in the past than that the state transition monitor 207, a state transition corresponding to the information through the network 201 Table test data 213 and the state transition path test data 214 acquired from the database 212, creates the failure information based on the data, a module for transmitting the failure information if necessary failure information transmitting unit 210. 障害情報の作成手順および障害情報の具体例については後述する。 It will be described later examples of creating procedures and failure information of the fault information.

障害情報送信部210は、障害情報作成部209によって作成された障害情報を、ネットワーク201を介して監視装置215の障害情報受信部216に送信するモジュールである。 Failure information transmitting unit 210, a fault information generated by the failure information generating unit 209 is a module for transmitting the failure information receiving unit 216 of the monitoring apparatus 215 via the network 201.
テストデータ更新部211は、監視装置215のテストデータ送信部217がネットワーク201を介して送信したテストデータを受信し、当該テストデータを基にデータベース212に格納されている状態遷移表テストデータ213および状態遷移パステストデータ214を更新するモジュールである。 Test data updating unit 211, the monitoring device test data transmission unit 217 of 215 receives the test data transmitted over the network 201, the state transition table test data 213 and stored in the database 212 based on the test data a module for updating the state transition path test data 214.

データベース212は、状態遷移表テストデータ213および状態遷移パステストデータ214を格納する外部記憶装置104である。 Database 212 is an external storage device 104 for storing a state transition table test data 213 and the state transition path test data 214.
状態遷移表テストデータ213は、被監視プログラム203の開発段階で実施された状態遷移表テストに関するデータである。 State transition table test data 213 is data relating to the state transition table tests conducted during the development phase of the monitoring program 203.
状態遷移パステストデータ214は、被監視プログラム203の開発段階で実施された状態遷移パステストに関するデータである。 State transition path test data 214 is data on a state transition path tests conducted during the development phase of the monitoring program 203.
監視プログラム214は、ネットワーク201を介して監視エージェント206から障害情報を受信し、当該障害情報を管理者等に通知し、また、最新のテストデータが存在する場合は当該テストデータをネットワーク201を介してテストデータ更新部211に送信するモジュールである。 Monitoring program 214 via the network 201 received from the monitoring agent 206 the failure information and notifies the failure information to the administrator or the like, also, through the network 201 the test data when the latest test data exists Te is a module for transmitting the test data updating unit 211.

監視装置215は、ネットワーク201を介して監視エージェント206と通信を行い、被監視装置202を監視する装置である。 Monitoring apparatus 215 communicates with the monitoring agent 206 via the network 201, a device for monitoring the monitored device 202.
障害情報受信部216は、ネットワーク201を介して障害情報送信部210より障害情報を受信し、当該障害情報を障害情報通知部218に通知するモジュールである。 Fault information receiving unit 216 via the network 201 receives the fault information from the fault information transmitting section 210 is a module for notifying the failure information in the failure information reporting unit 218.
テストデータ送信部217は、ネットワーク201を介し、被監視プログラム203の開発担当者によって実施された最新のテストデータをテストデータ更新部211に送信するモジュールである。 Test data transmission unit 217 via the network 201 is a module for transmitting the latest test data conducted by developers of the monitoring program 203 to the test data updating unit 211.
障害情報通知部218は、障害情報受信部216が受信した障害情報を、独自の手段(メール送信、ダイアログ表示等)により管理者等に通知するモジュールである。 Fault information notification unit 218, the failure information failure information receiving unit 216 receives a module which notifies the administrator or the like by their own means (mail transmission, Dialog, etc.).

図3は障害情報の作成に関するフローチャートを示す図である。 Figure 3 is a view showing a flowchart for creating fault information.
ステップ301は、状態遷移監視部207が被監視プログラム203の状態遷移を監視するステップである。 Step 301, the state transition monitor 207 is monitoring the state transition of the monitoring program 203. このステップにおいて、状態遷移監視部207は被監視プログラム203上で発生した状態遷移の履歴を保持する。 In this step, the state transition monitor 207 holds the history of the state transitions that have occurred on the monitored program 203. 具体的な状態遷移の監視手段については後述する。 It will be described later monitoring means specific state transition.
ステップ302は、障害監視部208が被監視プログラム203で発生する障害を監視するステップである。 Step 302, the failure monitoring unit 208 is a step of monitoring failures in the monitored program 203. このステップにおいて、障害監視部208は被監視プログラム203上で発生した障害情報のログを保持する。 In this step, the failure monitoring unit 208 holds a log of trouble information which has occurred over the monitoring program 203. 具体的な障害の監視手段については後述する。 It will be described later monitoring means specific disorder.
ステップ301とステップ302は、処理が前後してもよく、また、並列に実行されていてもよい。 Step 301 and step 302, the process may be back and forth, also, it may be executed in parallel.
ステップ303は、ステップ302で障害が発生したかどうかを調べるステップである。 Step 303 is a step to determine whether failure has occurred in step 302. もし障害が発生していなければ、ステップ301へ戻る。 If not, if a failure occurs, the flow returns to step 301. もし障害が発生した場合は、ステップ304へ進む。 If the event of a failure, the process proceeds to step 304.

ステップ304は、障害情報作成部209が状態遷移監視部207から状態遷移履歴情報を取得するステップである。 Step 304 is a step failure information generating unit 209 obtains the state transition history information from the state transition monitor 207. 状態遷移履歴情報の具体例については後述する。 It will be described later examples of the state transition history information.
ステップ305は、障害情報作成部209がステップ304で取得した状態遷移履歴情報を基にデータベースを検索するステップである。 Step 305, the failure information generating unit 209 is a step of searching the database based on the acquired state transition history information in step 304. このステップにおいて、障害情報作成部209はデータベースから前記状態遷移履歴情報に対応した状態遷移表テストデータ213および状態遷移パステストデータ214を検索する。 In this step, failure information generating unit 209 searches the state transition table test data 213 and the state transition path test data 214 corresponding to the state transition history information from the database.

ステップ306は、障害情報作成部209がステップ305において検索した状態遷移表テストデータ213を検証するステップである。 Step 306 is a step failure information generating unit 209 to verify the state transition table test data 213 retrieved in step 305. ステップ304で取得した状態遷移履歴情報と状態遷移表テストデータ213を比較し、現在のテスト状態を検証する処理を行う。 Comparing the state transition history information and state transition table test data 213 obtained in step 304, it performs a process of verifying the current test condition.
ステップ307は、ステップ306の検証処理において、現在のテスト状態が障害対策中かどうかを判定するステップである。 Step 307, in the verification process of step 306, a step of determining the current test status is whether or not in fault tolerance. もし障害対策中であれば、障害情報を監視装置215に送信する必要がないため、処理を終了する。 If it is in fault tolerance, it is not necessary to transmit the failure information to the monitoring apparatus 215, the process ends. もし障害対策中でなければ、ステップ308へ進む。 If it is not in fault tolerance, the process proceeds to step 308.

ステップ308は、ステップ306の検証処理において、現在のテスト状態が未実施状態かどうかを判定するステップである。 Step 308, in the verification process of step 306, a step of determining the current test state if incomplete state. もし未実施であれば、ステップ315へ進む。 If not implemented if the process proceeds to step 315. もし未実施でなければ、つまり実施済であれば、ステップ309へ進む。 If not yet performed, that is, if the already performed, the process proceeds to step 309.

ステップ309は、障害情報作成部209がステップ305において検索した状態遷移パステストデータ214を検証するステップである。 Step 309 is a step of verifying the state transition path test data 214 failure information generating unit 209 searches in step 305. ステップ304で取得した状態遷移履歴情報と状態遷移パステストデータ214を比較し、現在のテスト状態を検証する処理を行う。 Comparing the state transition history information and status transition path test data 214 obtained in step 304, it performs a process of verifying the current test condition.

ステップ310は、ステップ309の検証処理において、現在のテスト状態が障害対策中かどうかを判定するステップである。 Step 310, in the verification process of step 309 is a step of determining current test condition whether in fault tolerance. もし障害対策中であれば、障害情報を監視装置215に送信する必要がないため、処理を終了する。 If it is in fault tolerance, it is not necessary to transmit the failure information to the monitoring apparatus 215, the process ends. もし障害対策中でなければ、ステップ311へ進む。 If it is not in fault tolerance, the process proceeds to step 311.

ステップ311は、ステップ309の検証処理において、現在のテスト状態が実施済状態かどうかを判定するステップである。 Step 311, in the verification process of step 309 is a step of determining whether current test condition whether the executed state. もし実施済であれば、ステップ313へ進む。 If already been carried out, the process proceeds to step 313. もし実施済でなければ、ステップ312へ進む。 If it is not if the executed, the process proceeds to step 312.
ステップ312は、ステップ311において状態遷移パステストデータ214のテスト状態が実施済でなかった場合にパス障害情報を作成するステップである。 Step 312 is a step of creating a path failure information when testing the state of the state transition path test data 214 was not already performed in step 311. パス障害情報とは、障害発生時点の状態遷移履歴に関する情報である。 The path failure information is information regarding the state transition history of the point of failure. 障害発生箇所は状態遷移パステストが実施されていないため、状態遷移パステストを実施するための最低限の情報のみを作成することで情報量を削減する。 Since the failure point has not been performed the state transition path testing, to reduce the amount of information by creating only minimal information for carrying out the state transition path test. パス障害情報の詳細については後述する。 It will be described in detail later in the path failure information.
ステップ313は、ステップ311において状態遷移パステストデータ214のテスト状態が実施済であった場合に詳細障害情報を作成するステップである。 Step 313 is a step of creating a detailed fault information when testing the state of the state transition path test data 214 was already performed in step 311. 詳細障害情報とは、メモリダンプやエラーログといった、障害原因の特定に必要な情報である。 The detailed fault information, such as memory dump and error log, which is the information necessary to identify root cause. 障害発生箇所は状態遷移パステストが実施されているため、予期せぬ障害が発生したと判断し、詳細な障害情報を作成する。 Since the point of failure is carried state transition path test, determines that unexpected failure, to create a detailed fault information.

ステップ315は、ステップ308において状態遷移表テストデータ213のテスト状態が未実施であった場合に簡易障害情報を作成するステップである。 Step 315 is a step of creating a simple fault information when testing the state of the state transition table test data 213 was not implemented at step 308. 簡易障害情報とは、障害発生箇所に対応する状態遷移表のセル(行、列)に関する情報である。 The simple failure information is information about the cell in the state transition table corresponding to the failure occurrence point (row, column). 障害発生箇所は状態遷移表テストが実施されていないため、状態遷移表テストを実施するための最低限の情報のみを作成することで情報量を削減する。 Since the failure point has not been performed the state transition table test, to reduce the amount of information by creating only minimal information for carrying out the state transition table test. 簡易障害情報の詳細については後述する。 It will be described in detail later simplified fault information.

ステップ314およびステップ316は、ステップ312、ステップ313、およびステップ315で作成された障害情報を監視装置215の障害情報受信部216に送信するステップである。 Step 314 and step 316, step 312, step 313, and a step of transmitting the failure information generated in step 315 to the fault information receiving unit 216 of the monitoring apparatus 215. 以上の手順により障害情報を作成することで、必要最低限の障害情報のみを監視装置215へ送信することができる。 By creating fault information by the above procedure, it is possible to send only the to the monitor 215 the minimum necessary failure information.

図4は、前記JMX技術を利用した場合の状態遷移監視手段および障害監視手段を表すシーケンス図である。 Figure 4 is a sequence diagram showing a state transition monitoring unit and fault monitoring means in the case of using the JMX technology. JMX技術は、MBeanとよばれるプログラム監視向けモジュールを開発することで、プログラムの内部状態を外部から監視できるようにするための技術である。 JMX technology, to develop a program monitoring for modules called MBean, is a technique to allow monitoring the internal state of the program from the outside. Javaのバージョン5(Java SE 5)から、JMX技術が標準技術として導入されている。 From Java version 5 (Java SE 5), JMX technology has been introduced as a standard technique. 図4では、このJMX技術を利用した場合の被監視プログラム203の監視手段を示す。 In Figure 4, shows a monitoring unit of the monitoring program 203 when using this JMX technology. 図では処理の流れを単純化するため、MBeanServer等のJMX関連モジュールについては記載を省略する。 To simplify the process flow in FIG omitted describe JMX related modules such MBeanServer.

最初に、監視エージェント206は、状態遷移監視リスナの登録要求403を状態遷移監視MBean401へ送信する。 First, the monitoring agent 206 transmits a registration request 403 state transition monitoring listener to state transition monitoring MBean401. 当該リスナの登録に成功すると、状態遷移監視MBean401はエラーを発生させずに登録成功メッセージ404を返す。 Upon successful registration of the listener, state transition monitoring MBean401 returns a registration success message 404 without errors.
次に、監視エージェント206は、障害監視リスナの登録要求405を障害監視MBean402へ送信する。 The monitoring agent 206 transmits a registration request 405 fault monitoring listener to fault monitoring MBean402. 当該リスナの登録に成功すると、障害監視MBean402は、エラーを発生させずに登録成功メッセージ406を返す。 Upon successful registration of the listener, fault monitoring MBean402 returns a registration success message 406 without errors.

次に、被監視プログラム203は、プログラム内部の状態が変化すると状態遷移メッセージ407を状態遷移監視MBean401へ送信する。 Next, the monitoring program 203 sends the internal program state changes state transition message 407 to the state transition monitoring MBean401. 状態遷移監視MBean401は、当該状態遷移メッセージ407を受信すると、状態遷移監視リスナを通じて状態遷移通知メッセージ408を監視エージェント206へ送信する。 State transition monitoring MBean401 receives the state transition message 407, transmits through the state transition monitoring listener state transition notification message 408 to the monitoring agent 206. 監視エージェント206は、当該状態遷移通知メッセージ408を受信すると、状態遷移履歴(ログ)更新する処理409を行う。 Monitoring agent 206 receives the state transition notification message 408, performs a process 409 to the state transition history (log) update. このようにして、監視エージェント206は状態遷移履歴情報を保持する。 In this way, the monitoring agent 206 holds the state transition history information.

プログラム内部で障害が発生すると、被監視プログラム203は、障害発生メッセージ410を障害監視MBean402へ送信する。 When a failure occurs in the program inside, the monitoring program 203 sends a failure message 410 to the fault monitoring MBean402. 障害監視MBean402は、障害発生メッセージ410を受信すると、障害監視リスナを通じて障害発生通知メッセージ411を監視エージェント206へ送信する。 Fault monitoring MBean402 receives the failure occurrence message 410, sends a failure notification message 411 to the monitoring agent 206 through fault monitoring listener. 監視エージェント206は、当該障害発生通知メッセージ411を受信すると、状態遷移履歴情報を確認する処理412を行い、次に障害情報を作成する処理413を行い、最後に障害情報を送信する処理414を行う。 Monitoring agent 206 performs when receiving the failure notification message 411, performs a process 412 to check the state transition history information, then performs a process 413 of creating a fault information, and finally a process 414 for transmitting failure information . 障害の作成手順および障害情報の送信処理については図3に示した通りである。 It is as shown in Figure 3 for transmission processing procedure for creating and failure information of the fault. このように、JMX技術等を利用することで外部監視用プログラムを作成できる。 Thus, it creates an external monitoring program by utilizing JMX technology. 但し、これは障害監視方法の一例であり、他のプログラムを記述することも、専用のハードウェアを利用して監視することも可能である。 However, this is an example of a failure monitoring process, it can also be monitored by using a dedicated hardware to write other programs.

図5は本発明で参照している状態遷移表の例を示す図である。 Figure 5 is a diagram showing an example of a state transition table which is referred to in the present invention. これは、モデルベース開発と呼ばれる開発手法において一般に利用される、プログラムの状態遷移を表すデータである。 This is in developing a technique called model-based development is generally utilized is data representing the state transition of the program.
イベントA501、イベントB502、イベントC503、イベントD504は、プログラムに関連して発生するイベントの種類を表し、状態A505、状態B506、状態C507、状態D508、状態E509は、プログラムの遷移し得る状態を表している。 Event A 501, event B 502, event C503, event D504 represents the type of events that occur in connection with the program, the state A505, the state B506, state C507, state D508, state E509 represents a state capable of transition program ing. また、図中の「×」はある状態の時にそのイベントが発生する可能性がないことを表し、図中の「/」はある状態の時にそのイベントが発生しても処理が行われず、無視されることを表し、図中の「遷移X(XはAからEまでのいずれかのアルファベット)」はある状態の時にそのイベントXが発生すると、アルファベットXに対応する別の状態に遷移することを表している。 Also, indicates that there is no possibility that the event occurs when the "×" is the state of the figure, "/" in the drawing process is not performed even is the event when a condition occurs, ignore represents the fact that the "(any of the alphabet from X is a to E) transition X" in the figure when the event X occurs when a certain condition, a transition to another state corresponding to the alphabet X a represents. 例えば図5の表は、状態A505の時にイベントB502は発生する可能性がないことを表し、状態B506の時にイベントA501が発生しても無視されることを表し、状態C507の時にイベントC503が発生するとプログラムの状態が状態A505に遷移することを表している。 For example the table of Figure 5 indicates that there is no possibility that an event B502 occur when the state A505, indicates that the event A501 is ignored even if it occurs in the state B506, event C503 is generated in the state C507 Then the program state indicates that the transition to the state A505. このような状態遷移表がモデルベース開発と呼ばれる開発方法において一般に利用されている。 Generally are used in the development process of such a state transition table is referred to as model-based development.

図6は、図5で示した状態遷移表に対応する数値データの例を示す表である。 Figure 6 is a table showing an example of numerical data corresponding to the state transition table shown in FIG. 図中のe1(601)、e2(602)、e3(603)、e4(604)は、それぞれイベントa501、イベントb502、イベントc503、イベントd504に対応し、s1(605)、s2(606)、s3(607)、s4(608)、s5(609)は、それぞれ状態A505、状態B506、状態C507、状態D508、状態E509に対応している。 e1 (601) in FIG, e2 (602), e3 (603), e4 (604), respectively event a501, event b502, events C503, corresponding to the event d504, s1 (605), s2 (606), s3 (607), s4 (608), s5 (609), respectively state A505, the state B506, state C507, state D508, and corresponds to a state E509. 表中の番号は、図5の表中で示す表記にそれぞれ対応している。 Numbers in the table respectively correspond to the notation shown in the table of FIG. このように状態遷移表そのものを文字列データとして利用するのではなく、状態遷移表に対応した数値データを利用することで情報量を削減できる。 Thus instead of using the state transition table itself as character string data, it can reduce the amount of information by utilizing numerical data corresponding to the state transition table. これは情報量を削減するための一般的な例である。 This is a common example for reducing the amount of information.

図7は、図6で示したフォーマットを用いて表記した状態遷移履歴情報の例を示す表である。 Figure 7 is a table showing an example of a state transition history information expressed by using the format shown in FIG. 図中の発生順序701は状態遷移が発生した順番を表す数値であり、セル番号702は図6で示した数値データに対応する数値である。 Occurrence order 701 in the figure is a number representing the order in which the state transition has occurred, cell number 702 is a value corresponding to the numerical data shown in FIG. この例では、状態Eの時にイベントBが発生して状態Dに遷移し、状態Dの時にイベントCが発生して状態Cに遷移し、状態Cの時にイベントAが発生して状態Bに遷移し、状態Bの時にイベントDが発生して状態Aに遷移し、状態Aの時にイベントBが発生したことを示している。 Transition In this example, a transition to state D and event B occurs in a state E, transition to the state C by the event C occurs in the state D, an event A in a state C occurs in state B and transitions to state a and event D occurs in the state B, which indicates that an event B has occurred in the state a. 図5の状態遷移図では状態Aの時にイベントBは発生しないと表記されているが、この例では状態Aの時にイベントBが発生したことを示している。 Although the state transition diagram of FIG. 5 is described as the event B does not occur when the state A, in this example shows that event B has occurred in the state A.
ここで、図3の説明において述べた簡易障害情報とは、障害発生直前の状態遷移に対応するセル番号702の数値データを障害情報として利用するものである。 Here, the simple fault information described in the description of FIG. 3, is to utilize the numerical data of the cell numbers 702 corresponding to the state transition of the pre-failure as failure information. 図7の例では、簡易障害情報に相当するデータは「2」となる。 In the example of FIG. 7, the data corresponding to the simple failure information is "2". 但し、これは情報量を削減するための簡易障害情報の一例であり、その内容を限定するものではない。 However, this is an example of a simple fault information to reduce the amount of information and do not limit the contents.

図8は、図6で示したフォーマットを用いて表記した状態遷移表テストデータ213の例を示す表である。 Figure 8 is a table showing an example of a state transition table test data 213 expressed by using the format shown in FIG. 状態遷移表テストとは、状態遷移表の各マトリクスが正常に動作するかどうかを確認するテストであり、モデルベース開発で一般的に行われるテスト手法である。 The state transition table test, a test to see if the matrix of the state transition table to work properly, a test method is generally performed in the model-based development. 例えば図5においては、状態Aの時にイベントAが発生した場合に状態Bへ正しく遷移するかどうかといった動作をテストする。 For example, in Figure 5, to test the operation and whether the correct transition to state B if the event A occurs in the state A.
図中のセル番号801は図6で示した数値データに対応する数値であり、テスト状態802はセル番号801に対応した状態遷移表テストの実施状態を表す数値である。 Cell number 801 in the figure is a numeric value corresponding to the numerical data shown in FIG. 6, the test state 802 is a value representing the implementation state of the state transition table tests corresponding to cell number 801. テスト状態802の数値は、「0」が実施済であることを表し、「1」が未実施であることを表し、「2」が実施不可能であることを表し、「3」が対策中であることを表している。 Numerical value of the test state 802, indicates that "0" has already been implemented, "1" indicates that it is not carried out, indicates that "2" is not feasible, "3" in measures It indicates that it is.
ここで、実施不可能とは、ある状態の時にイベントが発生し得ないためにテストが不可能である(図5の「×」に該当する)という意味であり、対策中とは、現在テスト中であるという意味である。 Here, unenforceable and is a sense that it is impossible to test for the event can not occur at the time of a certain state (corresponding to "×" in FIG. 5), and in the measures, currently being tested which means that it is in. このような状態遷移表テストデータ213を利用することで、どういった種類の障害情報を作成すべきか、また、障害情報を監視装置215に送信すべきかどうかを判定することができる。 By using such a state transition table test data 213, it can determine whether to create what kind of type of failure information, also, whether to transmit the failure information to the monitoring device 215. 判定手順の例については図3で示した通りである。 For an example of the determination procedure is as shown in FIG.

図9は、図6で示したフォーマットを用いて表記した状態遷移パステストデータ214の例を示す表である。 Figure 9 is a table showing an example of a state transition path test data 214 expressed by using the format shown in FIG. 状態遷移パステストとは、状態遷移表の一連の状態遷移が正常に動作するかどうかを確認するテストであり、モデルベース開発で一般的に行われるテスト手法である。 The state transition path testing, a test series of state transitions of the state transition table to determine whether to operate normally, a test method is generally performed in the model-based development. 例えば図5においては、状態Aの時にイベントAが発生した場合に状態Bへ正しく遷移し、さらに状態Bの時にイベントBが発生した場合に状態Eへ正しく遷移し、さらに状態Eの時にイベントAが発生した場合に正しく当該イベントを無視するかどうかといった一連の動作をテストする。 In FIG. 5, for example, correctly transitions to state B if the event A to the state A occurs, further correctly transitions to state E when the event B occurs in a state B, event A when the further condition E but to test a series of operations such as correctly whether to ignore the event if that occurred.
図中の状態遷移パス901は図6で示した数値データに対応する状態遷移履歴を表すデータであり、テスト状態902は状態遷移パス901に対応した状態遷移パステストの実施状況を表す数値である。 State transition path 901 in the figure is data representing the state transition history corresponding to the numerical data shown in FIG. 6, the test state 902 is a number that represents the implementation of state transition paths test corresponding to the state transition path 901 . テスト状態902の数値は、「0」が実施済であることを表し、「1」が対策中(例えば事前に受付済み)であることを表す。 Numerical value of the test state 902, indicating that the "0" indicates that it is already implemented, is in the "1" measures (for example, in advance already accepted). 図中に表れない状態遷移パスは、全てテスト状態が未実施であることを示すものとする。 State transition paths that do not appear in the figure is intended to indicate that all test conditions are not implemented. 未実施の状態遷移パスを図中に表記しない理由は、状態遷移パス901の取り得る値を全て網羅するとデータ量が膨大になるためである。 Reasons for not notation unexecuted state transition paths in the figure is for the to cover all possible values ​​of the state transition path 901 the data amount becomes enormous. このような状態遷移パステストデータ214を利用することで、どういった種類の障害情報を作成すべきか、また、障害情報を監視装置215に送信すべきかどうかを判定することができる。 By using such a state transition path test data 214, it can determine whether to create what kind of type of failure information, also, whether to transmit the failure information to the monitoring device 215. 判定手順の例については図3で示した通りである。 For an example of the determination procedure is as shown in FIG.
ここで、図3の説明において述べたパス傷害情報とは、障害発生前の一連の状態遷移に対応する状態遷移パス901の数値データを障害情報として利用するものである。 Here, the path injury information described in the description of FIG. 3, is to utilize the numerical data of the state transition path 901 which corresponds to a series of state transition of the pre-failure as failure information. 図9の例では、パス障害情報に相当するデータは「1、6、20、9、5」等になる。 In the example of FIG. 9, the data corresponding to the path failure information is "1,6,20,9,5" like. 但し、これは情報量を削減するためのパス障害情報の一例であり、その内容を限定するものではない。 However, this is an example of a path failure information to reduce the amount of information and do not limit the contents.

図10は、図3の説明において述べた障害情報の送信手順を示すシーケンス図である。 Figure 10 is a sequence diagram showing a procedure of a transmission failure information described in the description of FIG.
最初に、障害情報作成部209は、前記障害情報の送信要求1001を障害情報送信部210へ送信する。 First, the failure information generating unit 209 transmits the transmission request 1001 of the failure information to the failure information transmitting unit 210. 次に、障害情報送信部210は、前記障害情報を監視装置215の障害情報受信部216へ送信する処理1002を行う。 Next, failure information transmitting unit 210 performs a process 1002 for transmitting the failure information to the failure information receiving unit 216 of the monitoring apparatus 215. 次に、障害情報受信部216は、障害情報送信部210より受信した前記障害情報の通知要求1003を障害情報通知部218へ送信する。 Then, the trouble information reception unit 216 transmits a notification request 1003 of the failure information received from the failure information transmitting unit 210 to the fault information notification unit 218. 障害情報通知部218は前記障害情報の解析処理1004を行い、前記障害情報を人間が読むことのできる形式に変換し、メール送信等の手段により被監視装置202の管理者へ通知する処理1005を行う。 The fault information notification unit 218 performs analysis processing 1004 of the failure information, into a format that can be the failure information human readable, a process 1005 for notifying the administrator of the monitoring device 202 by means of e-mail transmission, etc. do. 最後に、障害情報通知部218は、通知に成功したことを示すメッセージ1006を障害情報受信部216へ送信し、障害情報受信部216は、障害情報の受信に成功したことを示すメッセージ1007を障害情報送信部210へ送信し、障害情報送信部210は、障害情報の送信に成功したことを示すメッセージ1008を障害情報作成部209へ送信する。 Finally, fault information notification unit 218 transmits a message 1006 indicating that a successful notifies the failure information receiving unit 216, the trouble information reception unit 216, fault message 1007 indicating the successful reception of the failure information transmitted to the information transmission section 210, failure information transmitting unit 210 transmits a message 1008 indicating the successful transmission of failure information to the failure information creation section 209. 以上の流れにより障害情報を被監視装置202の管理者に通知するが、これは一般的な通知方法を述べたものであり、通知方法を限定するものではない。 And it notifies the fault information to the administrator of the monitoring device 202 by the above flow, but this is that described a general notification methods, do not limit the notification method.

図11はテストデータの更新手順を示すシーケンス図である。 Figure 11 is a sequence diagram showing a procedure of the update test data. 障害情報の通知を受けた管理者は、障害箇所をテストし、バグを修正したモジュールを配信すると共に、前記テストデータのテスト状態を更新することができる。 Administrator notified of the failure information is to test the fault location, can with distributing module that fixes bugs, updates the test status of the test data.

最初に、管理者1101は、被監視プログラム203に関する最新のテストデータを監視プログラム214へ入力する処理1102を行う。 First, the administrator 1101 performs processing 1102 to enter the latest test data related to a monitored program 203 to the monitoring program 214. 次に、監視プログラム214は、前記最新のテストデータを更新するメッセージを監視エージェント206へ送信する処理1103を行う。 Next, the monitoring program 214 executes the processing 1103 to send a message for updating the latest test data to the monitoring agent 206. 次に、監視エージェント206は、受信した前記最新のテストデータをデータベース212へ送信し、前記テストデータを更新する処理1104を行う。 The monitoring agent 206 transmits the received the latest test data to the database 212, performs the process 1104 of updating the test data. 最後に、データベース212はテストデータの更新に成功したことを示すメッセージ1105を監視エージェント206へ送信し、監視エージェント206は、テストデータの受信に成功したことを示すメッセージ1106を監視プログラム214へ送信し、監視プログラム214は、テストデータの入力に成功したことを示すメッセージ1107を管理者1101へ送信する。 Finally, the database 212 transmits a message 1105 indicating that a successful update of the test data to the monitoring agent 206, the monitoring agent 206 sends a message 1106 indicating the successful reception of the test data to the monitoring program 214 , the monitoring program 214 sends a message 1107 indicating that a successful input of the test data to the administrator 1101. 以上の流れによりテストデータの更新を行うが、これは一般的な更新方法を述べたものであり、更新方法を限定するものではない。 While updating the test data by the above flow, this is intended to described a general update method, not intended to limit the updating method. 特に、テスト状態の更新は監視エージェント206が自動で行うことも考えられるが、ここでは一般的な例として管理者による更新処理を示したものである。 In particular, updating of the test conditions is also conceivable that the monitoring agent 206 performs automatically, wherein there is shown an updating processing by the administrator as a common example.

本発明に係る一般的なシステムのハードウェア構成を示す図である。 It is a diagram showing a hardware configuration of a general system according to the present invention. 本発明に係るモジュールの概念的な構成を示す図である。 It is a diagram showing a conceptual structure of a module according to the present invention. 障害情報の生成手順の一例を示すフローチャートである。 Is a flowchart illustrating an example of a procedure for generating error information. JMX技術を利用した場合の状態監視手段の一例を示すシーケンス図である。 It is a sequence diagram showing an example of a state monitoring means when using JMX technology. モデルベース開発で用いられる状態遷移表の一例を示す図である。 Is a diagram illustrating an example of a state transition table used in the model-based development. 状態遷移表に対応した数値データの一例を示す表である。 Is a table showing an example of the numerical data corresponding to the state transition table. 状態遷移履歴データの一例を示す表である。 Is a table showing an example of the state transition history data. 状態遷移表テストデータの一例を示す表である。 Is a table showing an example of a state transition table test data. 状態遷移パステストデータの一例を示す表である。 Is a table showing an example of a state transition path test data. 障害情報の送信方法の一例を示すシーケンス図である。 Is a sequence diagram showing an example of a method of transmitting fault information. テストデータの更新方法の一例を示すシーケンス図である。 Is a sequence diagram showing an example of a method for updating the test data.

符号の説明 DESCRIPTION OF SYMBOLS

101 演算装置、102 主記憶装置、103 通信装置、104 外部記憶装置、201 ネットワーク、202 被監視装置、203 被監視プログラム、204 状態遷移通知部、205 障害通知部、206 監視エージェント、207 状態遷移監視部、208 障害監視部、209 障害情報策西部、210 障害情報送信部、211 テストデータ更新部、212 データベース、213 状態遷移表テストデータ、214 状態遷移パステストデータ、215 監視装置、216 障害情報受信部、217 テストデータ送信部、218 障害情報通知部。 101 computing device 102 main storage, 103 communication device, 104 external storage device, 201 network, 202 a monitored device, 203 a monitored program, 204 state transition notification unit, 205 failure notification unit, 206 monitoring agent 207 state transition monitoring Department, 208 failure monitoring unit, 209 fault information measures western 210 failure information transmitting unit, 211 test data updating unit, 212 database, 213 state transition table test data, 214 the state transition path test data, 215 monitor, 216 trouble information reception Department, 217 test data transmission unit, 218 fault information notification unit.

Claims (10)

  1. 監視対象となるデバイスと、前記デバイスにおける障害の発生を監視する監視装置と、前記デバイスの障害データを記憶するデータベースである外部記憶装置とからなり、これら装置がネットワークを介してデータの送受信が可能な障害監視システムであって、 A device to be monitored, a monitoring device for monitoring the occurrence of a fault in the device, consists of an external storage device as a database that stores fault data of the device, it can transmit and receive data via these devices Network a such fault monitoring system,
    前記デバイス上で動作するプログラムモジュールにおいて発生した障害を監視する障害監視部と、前記プログラムモジュールの状態遷移を監視する状態遷移監視部と、前記障害監視部が障害の発生を検知した際に前記状態遷移監視部より状態遷移履歴情報を取得し、さらに前記外部記憶装置より前記プログラムモジュールに関して実施されたテストデータを取得し、前記状態遷移履歴情報および前記テストデータを基に障害情報を作成する障害情報作成部と、前記障害情報作成部により作成された障害情報を、ネットワークを介して前記監視装置に送信する障害情報送信部とを有することを特徴とする障害監視システム。 A failure monitoring section which monitors a failure occurring in the program modules running on the device, and state transitions monitoring unit for monitoring the state transition of the program modules, the state when the failure monitoring unit detects the occurrence of a failure transition monitoring unit acquires the state transition history information from the further the test data was performed to obtained for the program module from the external storage device, said state transition history information and fault information generated based on the failure information the test data fault monitoring system comprising: the creating unit, a fault information created by the failure information creation unit, and a fault information transmission unit that transmits to the monitoring device via the network.
  2. 前記テストデータが、前記プログラムモジュールに関して実施された状態遷移表テストの結果に対応する状態遷移表テストデータ、または状態遷移パステストの結果に対応する状態遷移パステストデータ、またはその両方である請求項1記載の障害監視システム。 The test data, said program corresponding state transition table test data results of state transition table tested for modules or state transition path results in corresponding state transition path test data in the test or claim is both, 1 fault monitoring system described.
  3. 前記障害情報作成部が、前記状態遷移表テストデータと前記状態遷移履歴情報を基に、前記プログラムモジュールが前記状態遷移表テストですでに合格しているかどうかを判定し、合格している場合はメモリダンプや障害ログ等の詳細障害情報を作成し、合格していない場合は前記状態遷移表テストデータの状態遷移表に対応する簡易障害情報を作成する請求項2記載の障害監視システム。 The failure information creation unit, on the basis of the state transition history information and the state transition table test data, to determine whether the program module has passed already the state transition table test, if passed in create a detailed failure information such as a memory dump and error log, if not pass fault monitoring system of claim 2, wherein to create a simple failure information corresponding to the state transition table of the state transition table test data.
  4. 前記障害情報作成部が、前記状態遷移パステストデータと前記状態遷移履歴情報を基に、前記プログラムモジュールが前記状態遷移パステストにすでに合格しているかどうかを判定し、合格している場合は前記詳細障害情報を作成し、合格していない場合は前記状態遷移パステストデータの状態遷移パスに対応するパス障害情報を作成する請求項3記載の障害監視システム。 The failure information creation unit, on the basis of the state transition history information and the state transition path test data, if the program module determines whether the already passed the state transition path test, have passed in the create a detailed fault information, if not pass fault monitoring system according to claim 3, wherein creating the path failure information corresponding to the state transition path of the state transition path test data.
  5. 前記障害情報作成部が、前記状態遷移表テストデータと、前記状態遷移履歴情報を基に、前記プログラムモジュールが前記状態遷移表テストにパスしているかどうかを判定し、パスしていない場合は前記簡易障害情報を作成し、パスしている場合は前記状態遷移パステストデータと、前記状態遷移履歴情報を基に、前記プログラムモジュールが前記状態遷移パステストにパスしているかどうかを判定し、パスしていない場合は前記パス障害情報を作成し、パスしている場合は前記詳細障害情報を作成する請求項記載の障害監視システム。 The failure information creation unit, and said state transition table test data, based on the state transition history information, to determine whether the program module is passed to the state transition table test, if not pass the creates a simple failure information, if you have passed the group and the state transition path test data, the state transition history information, to determine whether the program module is passed to the state transition path test path and if not creating the path failure information, failure monitoring system according to claim 4, wherein if you are passed to create the detailed fault information.
  6. 前記障害情報作成部が、前記障害情報を前記監視装置に送信した際、前記状態遷移履歴情報に対応する前記テストデータを対策中のものとして前記外部記憶装置に記憶し、障害が再発した際、前記状態遷移履歴情報に対応する前記テストデータが対策中である場合は、前記障害情報の作成を行わず、また前記監視装置への前記障害情報の送信も行わない請求項1〜請求項5のいずれか1項に記載の障害監視システム。 When the failure information creation unit, upon transmitting the fault information to the monitoring device, the stored in the external storage device the test data corresponding to the state transition history information as in measures, failure recurs, If the test data corresponding to the state transition history information is being measures, the without creation of fault information and the transmission of the fault information is also not performed of claims 1 to 5 to the monitoring device fault monitoring system according to any one.
  7. 前記デバイスの管理者等によって前記監視装置に入力された最新のテストデータおよびテストデータの対策状況を前記外部記憶装置に送信し、前記外部記憶装置が記憶するテストデータを更新させるテストデータ更新部を有する請求項1〜請求項6のいずれか1項に記載の障害監視システム。 Send a measure status of the latest test data and test data input to the monitoring device by the administrator or the like of the device to the external storage device, the test data update unit external storage device to update the test data to be stored fault monitoring system according to any one of claims 1 to 6 having.
  8. プログラムモジュールを備え、監視装置及びデバイス障害データを記憶するデータベースである外部記憶装置とネットワークを介してデータの送受信が可能なデバイスであって、 Comprising a program module, a device capable of transmitting and receiving data through an external storage device and the network is a database that stores the monitoring device and device fault data,
    前記プログラムモジュールにおいて発生した障害を監視する障害監視部と、前記プログラムモジュールの状態遷移を監視する状態遷移監視部と、前記障害監視部が障害の発生を検知した際に前記状態遷移監視部より状態遷移履歴情報を取得し、さらに前記外部記憶装置より前記プログラムモジュールに関して実施されたテストデータを取得し、前記状態遷移履歴情報および前記テストデータを基に障害情報を作成する障害情報作成部と、前記障害情報作成部により作成された障害情報を、ネットワークを介して前記監視装置に送信する障害情報送信部とを有することを特徴とするデバイス。 A failure monitoring section which monitors a failure occurring in the program module, and a state transition monitoring unit for monitoring the state transition of the program modules, the state from said state transition monitoring unit when the failure monitoring unit detects the occurrence of a failure acquires transition history information, and further wherein the test data was performed to get with respect to the program module from the external storage device, said state transition history information and creates failure information based on the test data failure information creation unit, wherein device characterized in that it has a fault information generated by the failure information creation unit, and a fault information transmission unit that transmits to the monitoring device via the network.
  9. 監視対象となるデバイスと、前記デバイスにおける障害の発生を監視する監視装置と、前記デバイスの障害データを記憶するデータベースである外部記憶装置とからなり、これら装置がネットワークを介してデータの送受信が可能な障害監視システムにおける障害を監視する方法であって、 A device to be monitored, a monitoring device for monitoring the occurrence of a fault in the device, consists of an external storage device as a database that stores fault data of the device, it can transmit and receive data via these devices Network a method for monitoring faults in a fault monitoring system,
    前記デバイス上で動作するプログラムモジュールにおいて発生した障害を監視する障害監視ステップと、前記プログラムモジュールの状態遷移を監視する状態遷移監視ステップと、前記障害監視ステップにより障害の発生を検知した際に前記状態遷移監視ステップにより状態遷移履歴情報を取得し、さらに前記外部記憶装置より前記プログラムモジュールに関して実施されたテストデータを取得し、前記状態遷移履歴情報および前記テストデータを基に障害情報を作成する障害情報作成ステップと、前記障害情報作成ステップにより作成された障害情報を、ネットワークを介して前記監視装置に送信する障害情報送信ステップとを有することを特徴とする障害監視方法。 Said state upon detecting a fault monitoring step of monitoring a failure occurring in the program modules running on the device, and state transitions monitoring step of monitoring the state transition of the program modules, the occurrence of a failure by the failure monitoring step Gets the state transition history information by transition monitoring step further wherein the test data was performed to get with respect to the program module from the external storage device, said state transition history information and fault information generated based on the failure information the test data a creation step, the fault information generated by the failure information creation step, fault monitoring method characterized by having a fault information transmission step of transmitting to the monitoring device via the network.
  10. 前記テストデータが、前記プログラムモジュールに関して実施された状態遷移表テストの結果に対応する状態遷移表テストデータ、または状態遷移パステストの結果に対応する状態遷移パステストデータ、またはその両方である請求項9記載の障害監視方法。 The test data, said program corresponding state transition table test data results of state transition table tested for modules or state transition path results in corresponding state transition path test data in the test or claim is both, fault monitoring method according 9.
JP2008146774A 2008-06-04 2008-06-04 A monitoring device and fault monitoring method fault monitoring systems and devices Expired - Fee Related JP5198154B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008146774A JP5198154B2 (en) 2008-06-04 2008-06-04 A monitoring device and fault monitoring method fault monitoring systems and devices

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008146774A JP5198154B2 (en) 2008-06-04 2008-06-04 A monitoring device and fault monitoring method fault monitoring systems and devices

Publications (2)

Publication Number Publication Date
JP2009294837A JP2009294837A (en) 2009-12-17
JP5198154B2 true JP5198154B2 (en) 2013-05-15

Family

ID=41542985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008146774A Expired - Fee Related JP5198154B2 (en) 2008-06-04 2008-06-04 A monitoring device and fault monitoring method fault monitoring systems and devices

Country Status (1)

Country Link
JP (1) JP5198154B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8782612B2 (en) * 2010-05-11 2014-07-15 Ca, Inc. Failsafe mechanism for dynamic instrumentation of software using callbacks
JP5821217B2 (en) * 2011-03-01 2015-11-24 株式会社リコー Image forming apparatus, the management process, the management program, and a recording medium
US9411616B2 (en) 2011-12-09 2016-08-09 Ca, Inc. Classloader/instrumentation approach for invoking non-bound libraries
JP2017091234A (en) * 2015-11-11 2017-05-25 日立オートモティブシステムズ株式会社 Vehicle control device
JP6514182B2 (en) * 2016-12-14 2019-05-15 キャッツ株式会社 Device, management server, information collection system, and information collection method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003985A (en) * 2006-06-26 2008-01-10 Dainippon Screen Mfg Co Ltd Development support system, development support method and development support program

Also Published As

Publication number Publication date
JP2009294837A (en) 2009-12-17

Similar Documents

Publication Publication Date Title
US8161323B2 (en) Health monitor
US6167358A (en) System and method for remotely monitoring a plurality of computer-based systems
KR101021394B1 (en) Programmatic computer problem diagnosis and resolution and automated reporting and updating of the same
US7872982B2 (en) Implementing an error log analysis model to facilitate faster problem isolation and repair
US5287505A (en) On-line problem management of remote data processing systems, using local problem determination procedures and a centralized database
US5408218A (en) Model based alarm coordination
US8997088B2 (en) Methods and systems for automated deployment of software applications on heterogeneous cloud environments
US6026499A (en) Scheme for restarting processes at distributed checkpoints in client-server computer system
CN100345106C (en) Method and apparatus for automatic updating and testing of software
US7124328B2 (en) Capturing system error messages
EP1983686B1 (en) Mobile terminal apparatus and diagnosis method for mobile terminal apparatus
US9606904B1 (en) System and method for data collection and analysis of information relating to mobile applications
EP0471635B1 (en) Automated enrolment of a computer system into a service network of computer systems
US8191048B2 (en) Automated testing and qualification of software-based, network service products
US5805785A (en) Method for monitoring and recovery of subsystems in a distributed/clustered system
CA2869578C (en) System, method, apparatus, and computer program product for providing mobile device support services
US6718489B1 (en) Electronic service request generator for automatic fault management system
US9483344B2 (en) System, method, apparatus, and computer program product for providing mobile device support services
US20020073364A1 (en) Fault notification method and related provider facility
US5179695A (en) Problem analysis of a node computer with assistance from a central site
US8713350B2 (en) Handling errors in a data processing system
US6892317B1 (en) Systems and methods for failure prediction, diagnosis and remediation using data acquisition and feedback for a distributed electronic system
US6845394B2 (en) Software delivery method with enhanced batch redistribution for use in a distributed computer network
US8732516B2 (en) Method and system for providing customer controlled notifications in a managed network services system
US7802128B2 (en) Method to avoid continuous application failovers in a cluster

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120417

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120918

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130206

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees