JP2010097357A - 異常通報システム及び診断方法 - Google Patents

異常通報システム及び診断方法 Download PDF

Info

Publication number
JP2010097357A
JP2010097357A JP2008266789A JP2008266789A JP2010097357A JP 2010097357 A JP2010097357 A JP 2010097357A JP 2008266789 A JP2008266789 A JP 2008266789A JP 2008266789 A JP2008266789 A JP 2008266789A JP 2010097357 A JP2010097357 A JP 2010097357A
Authority
JP
Japan
Prior art keywords
error code
pseudo
server machine
unit
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008266789A
Other languages
English (en)
Inventor
Reiko Ishihara
令子 石原
Masaki Taoda
雅己 垰田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008266789A priority Critical patent/JP2010097357A/ja
Priority to US12/567,012 priority patent/US20100095163A1/en
Publication of JP2010097357A publication Critical patent/JP2010097357A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2215Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test error correction or detection circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

【課題】情報処理装置の有する異常通報機能が全体として正常に動作するか否かを確認できるようにすること。
【解決手段】管理サーバマシン20は、監視対象サーバマシン10のシステム監視機構15に対し、定期的に、疑似エラーコードを引き渡し、システム監視機構15が、疑似エラーコード通知プログラム10bに従って、オペレーティングシステム10cに疑似エラーコードを通知することによって、オペレーティングシステム10cより上流に対して擬似的な故障の発生を認識させる。管理サーバマシン20は、その疑似エラーコードの引き渡しの応答として、監視対象サーバマシン10からエラーメッセージを受信すると、そのエラーメッセージの内容とシステム監視機構15に引き渡した疑似エラーコードとに基づいて、異常通報機能の経路のうち管理サーバマシン20までの経路の動作が正常であるか否かを判定し、判定結果を保守員マシン30に通知する。
【選択図】図2

Description

実施形態は、情報処理装置で発生した異常(エラー)を保守員等が利用する外部装置に通報するシステムに関する。
周知のように、情報処理装置は、記憶装置やCPU[Central Processing Unit]のよ
うな要素から構成されている。情報処理装置の幾つかは、何れかの要素で異常が発生するとその異常を外部装置に通報する異常通報機能を有している。
異常通報機能を実現するため、情報処理装置には、何れかの要素で異常が発生したときに、その異常の種別を特定するための種別コードを生成する機能、及び、生成された種別コードを含むエラーメッセージを生成して送信する機能が組み込まれる。また、情報処理装置には、送信されたエラーメッセージを受信して外部装置に通報する通報装置が接続される。
従来、エラーメッセージを生成して通報装置へ送信する機能が正常に動作するか否かを診断して、その診断結果を外部装置に通知する機能は存在していなかった。このため、外部装置を利用する保守員等は、情報処理装置の有する異常通報機能が全体として正常に動作するか否かを、確認することができなかった。
特開昭56−076852号公報 特開平04−369046号公報 特開平05−324389号公報
本実施形態は、前述したような従来の事情に鑑みてなされたものであり、その課題は、情報処理装置の有する異常通報機能が全体として正常に動作するか否かを確認できるようにすることにある。
前述の課題を解決するために案出した異常通報システムは、情報処理装置で発生した異常を外部装置に通報する異常通報システムであって、情報処理装置を構成するいずれかの要素で異常が発生すると、発生した異常の種別を特定する種別コードを生成する生成部、及び、その生成部が生成した種別コードを含むエラーメッセージを生成して、情報処理装置に接続された通報装置に送信する送信部を備え、通報装置が、情報処理装置からエラーメッセージを受信すると、受信したエラーメッセージに基づいて情報処理装置の異常を外部装置に通報する通報部、擬似エラーコードであることを示す情報と所定の種別コードとを含む擬似エラーコードを生成して、情報処理装置に引き渡す疑似エラー生成部、擬似コードに対する応答として情報処理装置から受信したエラーメッセージと情報処理装置に引き渡した疑似コードとに基づいて、送信部の動作が正常か否かを判定する判定部、及び、その判定部による判定結果を外部装置に通知する通知部を備えることを、特徴としている。
このように構成されると、通報装置から擬似コードが情報処理装置に引き渡されたときには、送信部が、疑似エラーコードの応答として、エラーメッセージを生成して通報装置へ送信し、通報装置では、その送信部から送られてくるエラーメッセージと情報処理装置
に引き渡した疑似コードとに基づいて、送信部が正常に動作しているか否かが判定され、その判定結果が外部装置に通知される。このため、外部装置を利用する保守員等は、情報処理装置の有する異常通報機能が全体として正常に動作するか否かを確認することができる。
なお、以上に開示した異常通報システムに係る動作は、その異常通報システムの各部と同等に機能する複数の手順をコンピュータが実行する方法によって実現されても良いし、それら各部と同等の機能を複数の手段としてコンピュータに実行させるプログラムによって実現されても良い。また、当該動作は、前述したプログラムを格納したコンピュータ可読媒体をコンピュータに装着してそのコンピュータにそのプログラムを読み込ませて実行させることによって実現しても良い。
以上に説明したことから、先に開示した異常通報システムによれば、情報処理装置の有する異常通報機能が全体として正常に動作するか否かが、確認できるようになる。
以下、添付図面を参照しながら、本実施形態のサーバ管理システムについて、説明する。
《構成》
図1は、本実施形態のサーバ管理システムの構成図である。
本実施形態のサーバ管理システムは、監視対象サーバマシン10の保守管理サービスを顧客に提供する業者が利用するシステムであり、監視対象サーバマシン10と、管理サーバマシン20と、保守員マシン30とを備えている。
監視対象サーバマシン10は、ネットワークを介して図示せぬクライアントマシンに各種のサービスを提供するマシンであるとともに、管理サーバマシン20の監視対象となっているマシンである。監視対象サーバマシン10は、管理サーバマシン20とともに、保守管理サービスを享受する顧客の施設内に設置されている。
管理サーバマシン20は、監視対象サーバマシン10を構成する何れかのユニット(要素)で故障が発生することによって監視対象サーバマシン10内の後述する機能がエラーメッセージを送信してきた場合にその故障を異常として保守員マシン30に通報するマシンである。
保守員マシン30は、管理サーバマシン20から通報された監視対象サーバマシン10の異常を保守員や顧客に通知するマシンである。保守員マシン30は、遠隔監視センターの施設内に設置されている。図1に示すように、保守員マシン30は、管理サーバマシン20とネットワークNWを介して通信自在に接続されている。
なお、図1では、管理サーバマシン20には、1台の監視対象サーバマシン10が接続されているが、2台以上の監視対象サーバマシン10が接続されていても良い。また、図1では、保守員マシン30には、2台の管理サーバマシン20が接続されているが、2台以上の管理サーバマシン20が接続されていても良い。
図2は、監視対象サーバマシン10の構成図である。
監視対象サーバマシン10は、通信ユニット11、ストレージユニット12、CPU[
Central Processing Unit]13、メインメモリユニット14、及び、システム監視機構
15を備えている。
通信ユニット11は、他のコンピュータとデータの遣り取りを行うためのユニットである。通信ユニット11としては、イーサネット(米国ゼロックス社の商標)カード、FC[Fiber Channel]カード、ATM[Asynchronous Transfer Mode]カード、トークンリ
ングカード、FDDI[Fiber-distributed data interface]カードなどがある。本実施形態では、通信ユニット11は、ケーブルを介して管理サーバマシン20に通信自在に接続されている。
ストレージユニット12は、各種のプログラム及び各種のデータを記録媒体に記録したりそれらを記録媒体から読み出したりするユニットである。ストレージユニット12としては、ソリッドステートドライブ装置、ハードディスクドライブ装置、DVD[Digital Versatile Disk]ドライブ装置、+R/+RWドライブ装置、又は、BD[Blu-ray Disk]ドライブ装置などがある。また、記録媒体としては、不揮発性半導体メモリ(フラッシュメモリ)を含むシリコンディスク、ハードディスク、DVD(DVD−R[Recordable]、DVD−RW[Rewritable]、DVD−ROM[Read Only Memory]、DVD−RAM[Random Access Memory]を含む)、+R/+RW、又は、BD(BD−R、BD−RE[Rewritable]、BD−ROMを含む)などがある。
CPU13は、ストレージユニット12内のプログラムに従って、監視対象サーバマシン10における処理を行うユニットである。メインメモリユニット14は、CPU13がプログラムやデータをキャッシュしたり作業領域を展開したりするためのユニットである。
システム監視機構15は、ストレージユニット12やCPU13などのユニット(要素)から故障発生とともに出力される故障信号を受信し、受信した故障信号に対応するエラーコードを生成するサービスプロセッサである。
図2に示されたシステム監視機構15は、具体的には、I/F[InterFace]ユニット
15a、故障信号受信ユニット15b、ROM[Read Only Memory]ユニット15c、CPU15d、及び、RAMユニット15eを含んでいる。
I/Fユニット15aは、通信ユニット11、CPU13、メインメモリユニット14とデータの遣り取りをするためのユニットである。故障信号受信ユニット15bは、ストレージユニット12及びCPU13などのユニット(要素)から故障信号を受信するユニットである。ROMユニット15cは、各種のプログラム及び各種のデータが記録されているユニットである。CPU15dは、ROMユニット15c内のプログラムに従ってシステム監視機構15における処理を行うユニットである。RAM[Random Access Memory]ユニット15eは、CPU15dがプログラムやデータをキャッシュしたり作業領域を展開したりするためのユニットである。
システム監視機構15は、ROMユニット15cに、正規エラーコード生成プログラム10a、及び、疑似エラーコード通知プログラム10bを記憶している。なお、図2では、正規エラーコード生成プログラム10a及び疑似エラーコード通知プログラム10bがROMユニット15cから読み出されてRAMユニット15eに機能として展開されている状態が示されている。
正規エラーコード生成プログラム10aは、故障信号受信ユニット15bが何れかのユニットから故障信号を受信したときに、その故障信号に対応する正規エラーコードを生成
してオペレーティングシステム10cに送信するためのプログラムである。故障信号受信ユニット15bが、何れかのユニットが故障によって発した故障信号を受信すると、CPU15dは、正規エラーコード生成プログラム10aに従って、異常(故障)の種別を特定する種別コードと、故障信号を発したユニットを特定する部品コードとを生成する。続いて、CPU15dは、正規エラーコード生成プログラム10aに従って、生成した種別コードと部品コードとを組み合わせる。更に、CPU15dは、エラーコードが正規エラーコードであるか疑似エラーコードであるかを示す1ビットの情報を、疑似フラグとして、種別コードと部品コードとの組み合わせの末尾に附加することによって、エラーコードを生成する。従って、正規エラーコード生成プログラム10aを実行するCPU15dの機能は、前述した生成部に相当している。なお、本実施形態では、エラーコードは、末尾の疑似フラグが「1」である場合に疑似エラーコードとなり、擬似フラグが「0」の場合に現実の故障発生を示す正規エラーコードとなる。
疑似エラーコード通知プログラム10bは、管理サーバマシン20から通信ユニット11とオペレーティングシステム10cとを介して疑似エラーコードが引き渡されたときに、受信した疑似エラーコードをオペレーティングシステム10cに通知するプログラムである。管理サーバマシン20から引き渡される疑似エラーコードは、所定の種別コードと所定の部品コードとを含むとともに、エラーコードが疑似エラーコードであるか否かを示す1ビットの情報を、疑似フラグとして含んでいる。疑似エラーコードに含まれる部品コードは、実際に故障が発生したユニットを特定する情報ではなく、擬似的に故障発生源とされたユニットを特定する情報となっている。また、疑似エラーコードに含まれる種別コードは、擬似的に故障発生源とされたユニットにおいて発生したと擬制された異常(故障)の種別を特定する情報となっている。
監視対象サーバマシン10は、ストレージユニット12に、オペレーティングシステム10cと、サーバ監視ソフトウエア10eとを記憶している。なお、図2では、オペレーティングシステム10c及びサーバ監視ソフトウエア10eがストレージユニット12から読み出されてメインメモリユニット14に展開された状態が示されている。
オペレーティングシステム10cは、各種アプリケーションプログラムへのAPI[Application Programming Interface]やABI[Application Binary Interface]の提供
、ストレージユニット12やメインメモリユニット14の記憶領域の管理、プロセスやタスクの管理、ファイル管理や各種設定ツールやエディタといったユーティリティのアプリケーションプログラムへの提供、及び、画面出力を多重化するための複数タスクへのウインドウの割り当てを行うソフトウエアである。オペレーティングシステム10cには、図示せぬ通信インターフェースプログラムが含まれている。通信インターフェースプログラムは、通信ユニット11を介して接続されている他のコンピュータ、本実施形態では管理サーバマシン20の通信インターフェースプログラムとデータの遣り取りを行うプログラムである。通信インターフェースプログラムとしては、TCP/IP[Transmission Control Protocol/Internet Protocol]スイートがある。また、オペレーティングシステム
10cは、システムログ機能を含んでいる。システムログ機能は、各種のハードウェアや各種のシステムから通報される障害情報、ログイン情報、及び、パフォーマンス情報を、ログとしてシステムログファイル10dに記録する機能である。システムログ機能は、システム監視機構15から正規エラーコード又は疑似エラーコードを受信すると、受信した正規エラーコード又は疑似エラーコードを含むエラーメッセージを生成してシステムログファイル10dに記録するようになっている。なお、エラーメッセージには、正規エラーコード又は疑似エラーコードの他に、故障発生日時を示す日時情報と、故障したユニットの部品名とが含まれる。但し、エラーコードが疑似エラーコードである場合には、故障発生日時を示す日時情報として、疑似エラーコード通知プログラム10bが疑似エラーコードを通知してきた日時を示す日時情報が示される。
サーバ監視ソフトウエア10eは、システムログファイル10dに記録される各種情報を監視し、エラーメッセージがシステムログファイル10dに記録されたときに、記録されたエラーメッセージをシステムログファイル10dから取得して、取得したエラーメッセージを管理サーバマシン20に送信するようになっている。管理サーバマシン20に送信されるエラーメッセージには、正規エラーコードと現実の故障が発生した日時を示す日時情報とが含まれるか、又は、疑似エラーコードとその疑似エラーコードをオペレーティングシステム10cが通知された日時を示す日時情報とが含まれる。
なお、以上のことから、正規エラーコードと疑似エラーコードは、何れも、オペレーティングシステム10cと、システムログファイル10dと、サーバ監視ソフトウエア10eに基づくサーバ監視機能とをこの順に経由して、管理サーバマシン20に送信される。従って、監視対象サーバマシン10においてオペレーティングシステム10cとサーバ監視ソフトウエア10eとを実行するCPU13の機能は、前述した送信部に相当している。
図3は、管理サーバマシン20の構成図である。
管理サーバマシン20は、通信ユニット21、22、ストレージユニット23、CPU24、及び、メインメモリユニット25を、備えている。
通信ユニット21、22は、他のコンピュータとデータの遣り取りを行うためのユニットである。つまり、通信ユニット21、22は、監視対象サーバマシン10の通信ユニット11と同等の機能を発揮するものであり、一例として先に例示したネットワークカードである。本実施形態では、通信ユニット21は、監視対象サーバマシン10に通信自在に接続され、通信ユニット22は、ネットワークを介して保守員マシン30に通信自在に接続されている。
ストレージユニット23は、各種のプログラム及び各種のデータを読み書き自在に記録媒体に記録するユニットである。つまり、ストレージユニット23は、監視対象サーバマシン10のストレージユニット12と同等の機能を発揮するものであり、一例として先に例示した記録媒体を備えるドライブ装置である。
CPU24は、ストレージユニット23内のプログラムに従って管理サーバマシン20における処理を行うユニットである。メインメモリユニット25は、CPU24がプログラムやデータをキャッシュしたり作業領域を展開したりするためのユニットである。
管理サーバマシン20は、ストレージユニット23に、オペレーティングシステム20a、異常通報ソフトウエア20b、レジストレーション情報テーブル20c、種別テーブル20d、及び、部品テーブル20eを記憶している。なお、図3では、オペレーティングシステム20a及び異常通報ソフトウエア20bがストレージユニット23から読み出されてメインメモリユニット25に展開されている状態が示されている。
オペレーティングシステム20aは、監視対象サーバマシン10のオペレーティングシステム10cと同等の機能を発揮するものであり、通信インターフェースプログラムを含んでいる。
異常通報ソフトウエア20bは、監視対象サーバマシン10内のサーバ監視ソフトウエア10eによるサーバ監視機能がエラーメッセージを送信してきた場合にそのエラーメッセージに基づいて監視対象サーバマシン10の異常を保守員マシン30に通報するソフト
ウエアである。異常通報ソフトウエア20bは、通報モジュール(プログラム)201、及び、定期診断モジュール(プログラム)202を含んでいる。
通報モジュール201は、現実の故障発生を示す正規エラーコードを含むエラーメッセージを監視対象サーバマシン10から受信した場合に、そのエラーメッセージに基づいて通報メッセージを生成し、生成した通報メッセージを送信することにより、監視対象サーバマシン10の異常を保守員マシン30に通報するプログラムである。なお、通報メッセージには、監視対象サーバマシン10のホスト名とエラーメッセージとが含まれる。ここで、現実の故障発生に係るエラーメッセージには、前述したように、正規エラーコードと現実の故障が発生した日時を示す日時情報とが含まれるため、通報メッセージにも、これらが含まれることとなる。また、通報メッセージには、正規エラーコードに含まれる種別コード及び部品コードにそれぞれ対応する種別名及び部品名が含まれていても良い。
定期診断モジュール202は、監視対象サーバマシン10のオペレーティングシステム10c内のシステムログ機能によるエラーメッセージの生成と、サーバ監視ソフトウエア10eに基づくサーバ監視機能によるエラーメッセージのシステムログファイル10dからの取得と、サーバ監視機能によるエラーメッセージの管理サーバマシン20への送信と、管理サーバマシン20の異常通報ソフトウエア20b内の通報モジュール201による保守員マシン30への異常の通報とからなる一連の異常通報機能が正常に動作しているか否かを定期的に診断するプログラムである。
レジストレーション情報テーブル20cは、異常通報機能の定期診断に関する情報を記憶するテーブルである。図4は、レジストレーション情報テーブル20cを模式的に示す図である。図4に示すレジストレーション情報テーブル20cの各レコードは、「ホスト名」、「部品名」、「種別名」、「周期」及び「時刻」のフィールドを有している。「ホスト名」フィールドは、異常通報機能の定期診断の対象となる監視対象サーバマシン10のホスト名が記録されるフィールドである。「部品名」フィールドは、異常通報機能の定期診断で擬似的に故障発生源とされるユニットの部品名が記録されるフィールドである。「種別名」フィールドは、異常通報機能の定期診断で擬似的に故障発生源とされたユニットにおいて発生したと擬製された異常(故障)の種別の名称が記録されるフィールドである。「周期」フィールドは、異常通報機能の定期診断についての実行周期が記録されるフィールドである。図4の例では、「周期」として曜日が記録される。「時刻」フィールドは、異常通報機能の定期診断の実行日における実行時刻が記録されるフィールドである。
なお、異常通報機能の定期診断に関する情報は、管理サーバマシン20に接続された図示せぬ制御卓(コンソール)の表示領域に表示される定期診断受付画面を通じて、レジストレーション情報テーブル20cに登録されてもよい。図5は、定期診断受付画面40の一例を示す図である。図5に示す定期診断受付画面40は、5個のコンボボックス41〜45と、2個のボタン46、47とを含んでいる。なお、コンボボックス41〜45は、ドロップダウンリストボックスとエディットフィールドを組み合わせた機能を有するGUI[Graphical User Interface]である。コンボボックス41は、異常通報機能の定期診断の対象となる監視対象サーバマシン10のホスト名を入力するためのコンボボックスである。コンボボックス42は、異常通報機能の定期診断の対象となる監視対象サーバマシン10に含まれるユニットのうち、異常通報機能の定期診断で擬似的に故障発生源とされるユニットの部品名を入力するためのコンボボックスである。コンボボックス43は、異常通報機能の定期診断で擬似的に故障発生源とされるユニットにおいて発生したと擬製された異常(故障)の種別の名称を入力するためのコンボボックスである。コンボボックス44は、異常通報機能の定期診断についての実行周期、例えば曜日を入力するためのコンボボックスである。コンボボックス45は、異常通報機能の定期診断の実行日における実行時刻を入力するためのコンボボックスである。ボタン46は、各コンボボックス41〜
45に入力された情報により特定される定期診断をレジストレーション情報テーブル20cに登録するための登録ボタンである。ボタン47は、定期診断に関する情報をレジストレーション情報テーブル20cへ登録する作業を取り止めるための中止ボタンである。操作者(利用者)は、図示せぬ制御卓を通じて、図5に示したような定期診断受付画面40の各コンボボックス41〜45に任意の情報を入力し、登録ボタン46をクリックすると、異常通報機能の定期診断に関する情報を、レジストレーション情報テーブル20cに登録することができる。
図3に示す種別テーブル20dは、監視対象サーバマシン10内の各ユニットで発生し得る異常(故障)の種別の名称と種別コードとを対応付けて定義するテーブルである。図6は、種別テーブル20dを模式的に示す図である。図6に示す種別テーブル20dの各レコードは、「種別名」及び「種別コード」のフィールドを有している。「種別名」フィールドは、故障種別の名称が記録されるフィールドである。「種別コード」フィールドは、故障種別に対応する種別コードが記録されるフィールドである。
図3に示す部品テーブル20eは、監視対象サーバマシン10内のユニットの部品名と部品コードとを対応付けて定義するテーブルである。図7は、部品テーブル20eを模式的に示す図である。図7に示す部品テーブル20eの各レコードは、「部品名」及び「部品コード」のフィールドを有している。「部品名」フィールドは、ユニットの部品名が記録されるフィールドである。「部品コード」フィールドは、ユニットに対応する部品コードが記録されるフィールドである。
図8は、定期診断モジュール202の構成図である。
定期診断モジュール202は、疑似エラーコード生成プログラム202a、疑似故障発生記録テーブル202b、エラーコード判定プログラム202c、及び、診断結果通知プログラム202dを含んでいる。
疑似エラーコード生成プログラム202aは、疑似エラーコードを生成して監視対象サーバマシン10の疑似エラーコード通知プログラム10bに引き渡すプログラムである。疑似エラーコード生成プログラム202bに従ってCPU24が実行する処理の内容については、図12を用いて後述する。
疑似故障発生記録テーブル202bは、異常通報機能の定期診断の実行に関する情報が記録されるテーブルである。図9は、疑似故障発生記録テーブル202bを模式的に示す図である。図9に示す疑似故障発生記録テーブル202bの各レコードは、「ホスト名」、「開始」、「疑似エラーコード」、「診断中」、「終了」及び「結果」のフィールドを有している。「ホスト名」フィールドは、異常通報機能の定期診断が実行された監視対象サーバマシン10のホスト名が記録されるフィールドである。「開始」フィールドは、異常通報機能の定期診断の実行開始日時が記録されるフィールドである。「疑似エラーコード」フィールドは、異常通報機能の定期診断において疑似エラーコード通知プログラム10bに引き渡された疑似エラーコードが記録されるフィールドである。「診断中」フィールドは、異常通報機能の定期診断が行われている最中であるか否かを示す診断中フラグが記録されるフィールドである。なお、後述するように、本実施形態では、定期診断が行われている最中であるときに診断中フラグが「ON」となり、定期診断が終了すると診断中フラグが「OFF」になる。「終了」フィールドは、異常通報機能の定期診断においてサーバ監視ソフトウエア10eに基づくサーバ監視機能からエラーメッセージを受け取った日時、言い換えれば定期診断が終了した日時が記録されるフィールドである。「結果」フィールドは、異常通報機能における監視対象サーバマシン10のオペレーティングシステム10cから保守員マシン30までの経路のうち、監視対象サーバマシン10のオペレー
ティングシステム10cから管理サーバマシン20までの経路における動作が正常であったか異常であったかを示す診断結果が記録されるフィールドである。診断結果としては、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作が正常であればOK[OKay]が、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作が異常であればNG[No Good]が、それぞれ記録される。
図8に示すエラーコード判定プログラム202cは、監視対象サーバマシン10のサーバ監視ソフトウエア10eに基づくサーバ監視機能からエラーメッセージを受信し、受信したエラーメッセージに含まれるエラーコードが現実の故障発生を示す正規エラーコードであれば、エラーメッセージを通報モジュール201に引き渡し、受信したエラーメッセージに含まれるエラーコードが定期診断に係る疑似エラーコードであれば、エラーメッセージを診断結果通知プログラム202dに引き渡すプログラムである。エラーコード判定プログラム202cに従ってCPU24が実行する処理の内容については、図12及び図13を用いて後述する。
診断結果通知プログラム202dは、異常通報機能における監視対象サーバマシン10のオペレーティングシステム10cから保守員マシン30までの経路のうち、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路での動作に関する診断の結果をエラーコード判定プログラム202cから取得し、取得した診断結果に基づいて診断結果通知メッセージを生成し、生成した診断結果通知メッセージを送信することによって、その診断結果を保守員マシン30に通知するプログラムである。なお、診断結果通知メッセージには、監視対象サーバマシン10のホスト名とエラーメッセージと診断結果を示す「正常」又は「異常」文言とが含まれる。ここで、定期診断に係るエラーメッセージには、前述したように、疑似エラーコードと監視対象サーバマシン10のオペレーティングシステム10cに疑似エラーコードが通知された日時を示す日時情報とが含まれるため、診断結果通知メッセージにも、これらが含まれることとなる。
図10は、保守員マシン30の構成図である。
保守員マシン30は、スピーカ付き液晶ディスプレイ等の出力デバイス31と、キーボードやマウス等の操作デバイス32と、これらデバイス31、32が接続された本体とを有する。本体は、グラフィックサウンド制御ユニット33、入力制御ユニット34、通信ユニット35、ストレージユニット36、CPU37、及び、メインメモリユニット38などを内蔵している。
グラフィックサウンド制御ユニット33は、CPU37から渡される音声映像データに基づいて音声映像信号を生成して出力デバイス31に出力するユニットである。入力制御ユニット34は、操作デバイス32から操作信号を受け付けてCPU37に通知するユニットである。
通信ユニット35は、他のコンピュータとデータの遣り取りを行うユニットである。つまり、通信ユニット35は、監視対象サーバマシン10の通信ユニット11と同等の機能を発揮するものであり、先に例示したネットワークカードである。本実施形態では、通信ユニット35は、ネットワークNWを介して管理サーバマシン20に通信自在に接続されている。
ストレージユニット36は、各種のプログラム及び各種のデータを読み書き自在に記録媒体に記録するユニットである。つまり、ストレージユニット36は、監視対象サーバマシン10のストレージユニット12と同等の機能を発揮するものであり、先に例示した記
録媒体を備えるドライブ装置である。
CPU37は、ストレージユニット36内のプログラムに従って保守員マシン30における処理を行うユニットである。メインメモリユニット38は、CPU37がプログラムやデータをキャッシュしたり作業領域を展開したりするためのユニットである。
保守員マシン30は、ストレージユニット36にオペレーティングシステム30a、顧客情報テーブル30b、受信プログラム30c、イベントログテーブル30d、顧客通知プログラム30e、及び、メーラー30fを記憶している。
オペレーティングシステム30aは、監視対象サーバマシン10のオペレーティングシステム10cと同等の機能を発揮するものであり、通信インターフェースプログラムを含んでいる。
顧客情報テーブル30bは、監視対象サーバマシン10のホスト名と、監視対象サーバマシン10の保守管理サービスを享受する顧客の電子メールアドレスとを対応付けて管理するテーブルである。なお、顧客の施設内に新規の管理サーバマシン20が設置された際、保守員は、新規な管理サーバマシン20が保守員マシン30の管理下に置かれるよう、管理サーバマシン20に図示せぬ操作卓(コンソール)を接続して、操作卓から各種の情報を保守員マシン30に登録する。顧客情報テーブル30bに登録されているホスト名と電子メールアドレスは、この登録作業によって保守員マシン30に登録されたものであっても良い。
受信プログラム30cは、管理サーバマシン20の通報モジュール201から通報メッセージを受信するとともに、定期診断モジュール202から診断結果通知メッセージを受信して、イベントログテーブル30dに記録するプログラムである。また、監視対象サーバマシン10の異常、又は、異常通報機能の定期診断の結果を保守員に提示するため、受信プログラム30cは、通報メッセージ又は診断結果通知メッセージを受信すると、メッセージの内容を出力デバイス31に表示するようにもなっている。
イベントログテーブル30dは、受信プログラム30cが管理サーバマシン20から受信した通報メッセージ又は診断結果通知メッセージの内容を記憶するテーブルである。図11は、イベントログテーブル30dを模式的に示す図である。図11に示すイベントログテーブル30dの各レコードは、「ホスト名」、「イベント日時」、「エラーコード」及び「内容」のフィールドを有している。「ホスト名」フィールドは、通報メッセージ又は診断結果通知メッセージに含まれるホスト名が記録されるフィールドである。すなわち、「ホスト名」フィールドには、現実の故障が発生した監視対象サーバマシン10のホスト名、又は、異常通報機能の定期診断の対象となった監視対象サーバマシン10のホスト名が記録される。「イベント日時」フィールドは、通報メッセージ又は診断結果通知メッセージに含まれる日時情報が記録されるフィールドである。すなわち、「イベント日時」フィールドには、現実の故障が発生した日時を示す日時情報、又は、異常通報機能の定期診断で監視対象サーバマシン10のオペレーティングシステム10cに擬似エラーコードが通知された日時を示す日時情報が記録される。「エラーコード」フィールドは、通報メッセージに含まれる正規エラーコード、又は、診断結果通知メッセージに含まれる疑似エラーコードが記録されるフィールドである。「内容」フィールドは、受信プログラム30cが受信したメッセージが通報メッセージであるか診断結果通知メッセージであるかを示す情報が記録される。また、受信プログラム30cが受信したメッセージが診断結果通知メッセージである場合には、「内容」フィールドには、更に、異常通報機能の定期診断の結果を示す情報が記録される。例えば、受信したメッセージが現実の故障に係る通報メッセージであれば、「内容」フィールドには、通常の故障が発生した旨(例えば、「異常通
報」)が記録される。この場合、「内容」フィールドには、正規エラーコードに含まれる種別コード及び部品コードにそれぞれ対応する種別名(例えば、「コレクタブルエラー」)及び部品名(例えば、「CPU00」)とが記録されても良い。また、例えば、受信したメ
ッセージが異常通報機能の定期診断に係る診断結果通知メッセージであれば、「内容」フィールドには、定期診断が行われた旨(例えば、「定期診断」)と、診断結果を示す「正常」又は「異常」の文言とが記録される。
図10に示す顧客通知プログラム30eは、イベントログテーブル30dに記録されたメッセージを、メッセージに係る監視対象サーバマシン10の保守管理サービスを享受する顧客に対して送信するためのプログラムである。顧客通知プログラム30eに従ってCPU37が実行する処理の内容については、図15及び図16を用いて後述する。
メーラー30fは、電子メールの送受信及び編集を実現するためのソフトウエアである。
《処理》
〈疑似故障発生〉
本実施形態の管理サーバマシン20では、主電源が投入されると、オペレーティングシステム20aが起動されるとともに、疑似エラーコード生成プログラム202aも起動されるようになっている。CPU24は、疑似エラーコード生成プログラム202aを起動すると、疑似エラーコード生成処理を開始する。
図12は、管理サーバマシン20における疑似エラーコード生成処理の流れを示す図である。
疑似エラーコード生成処理の開始後、S1001では、CPU24は、図4のレジストレーション情報テーブル20cから、周期の期日が擬似エラーコード生成処理開始の時点と同じであるとともに、異常通報機能の定期診断の実行時刻がこの時点から所定時間、例えば10分内にあるレコードを検索する。
S1002では、CPU24は、図4のレジストレーション情報テーブル20cから、S1001の条件に合致するレコードが検出されたか否かを判別する。そして、図4のレジストレーション情報テーブル20cからS1001の条件に合致するレコードが検出されなかった場合(S1002;いいえ)、CPU24は、S1002からS1003へ処理を分岐させる。
S1003では、CPU24は、所定時間、例えば10分待機し、その後S1001へ処理を戻す。
一方、図4のレジストレーション情報テーブル20cから定期診断の開始日時が所定時間内にあるレコードが検出された場合(S1002;はい)、CPU24は、擬似エラーコードを生成するために、S1002からS1004へ処理を進める。
S1004では、CPU24は、S1001での検索により検出されたレコードに含まれる実行時刻になるまで待機する。そして、実行時刻になると(S1004;はい)、CPU24は、S1005へ処理を進める。
S1005では、CPU24は、疑似エラーコードを生成する。具体的には、CPU24は、S1001での検索により検出されたレコードに含まれる種別名、例えば「コレクタブルエラー」に対応する種別コード「4126581」を、図6の種別テーブル20dから読
み出す。また、CPU24は、同じレコードに含まれる部品名「CPU00」に対応する部品
コード「2010」を、図7の部品テーブル20eから読み出す。続いて、CPU24は、読み出した種別コードと部品コードとを組み合わせ、更に擬似エラーコードであることを示す「1」の状態の疑似フラグを末尾に附加することにより、疑似エラーコード「4126581-2010-1」を生成する。
S1006では、CPU24は、S1001での検索により検出されたレコードに含まれるホスト名によって監視対象サーバマシン10を特定し、特定した監視対象サーバマシン10のシステム監視機構15における疑似エラーコード通知プログラム10bに基づく疑似エラーコード通知機能に、S1005で生成した疑似エラーコードを引き渡す。
S1007では、CPU24は、図9の疑似故障発生記録テーブル202bに新規レコードを追加する。追加される新規レコードには、S1001での検索により検出されたレコードに含まれるホスト名と、日時と、S1006でシステム監視機構15に引き渡した疑似エラーコードと、診断中フラグとが含まれる。ここで、S1007の時点では診断が実行中であるため、診断中フラグは「ON」に設定される。なお、新規レコードの「終了」及び「結果」のフィールドは、この時点では空欄となっている。また、S1007において、CPU24は、異常通報機能の定期診断が開始された旨を含むメッセージを保守員マシン30に通知しても良い。そのメッセージには、「異常通報機能の定期診断が実行されました」という文言と、定期診断が実行されるホスト名と、定期診断が開始された日時とが含まれていても良い。
CPU24は、前述したような新規レコードを図9の疑似故障発生記録テーブル200bに追加すると、S1001へ処理を戻し、次の定期診断の実行時刻が迫るまで待機する状態になる。
なお、S1001乃至S1007を実行するCPU24の機能は、前述した疑似エラー生成部の機能に相当している。
図12の疑似エラーコード生成処理によると、図4のレジストレーション情報テーブル20cに登録されている異常通報機能の定期診断に係る疑似エラーコードが、設定されている日時に生成され、監視対象サーバマシン10のシステム監視機構における疑似エラーコード通知プログラム10bに基づく疑似エラーコード通知機能に、生成した疑似エラーコードが引き渡されることとなる。
なお、監視対象サーバマシン10の疑似エラーコード通知機能は、管理サーバマシン20から疑似エラーコードを受け取ると、前述したように、監視対象サーバマシン10内のオペレーティングシステム10cに疑似エラーコードを通知する。そして、監視対象サーバマシン10内のオペレーティングシステム10cは、通知された疑似エラーコードと疑似エラーコードが通知された日時を示す日時情報とを含むエラーメッセージを生成し、システムログファイル10d(図2参照)に記録する。
また、図12の疑似エラーコード生成処理とは無関係に、監視対象サーバマシン10では、正規エラーコード生成プログラム10aに基づく正規エラーコード生成機能が、前述したように、監視対象サーバマシン10内の何れかのユニットでの現実の故障によりそのユニットから故障信号を受けると、故障信号に基づいて正規エラーコードを生成し、オペレーティングシステム10cに引き渡すようになっている。監視対象サーバマシン10内のオペレーティングシステム10cは、正規エラーコード生成機能から受け取った正規エラーコードについても、エラーメッセージを生成して、システムログファイル10dに記録する。
つまり、監視対象サーバマシン10内のシステムログファイル10dには、現実の故障が発生すると、正規エラーコードに基づくエラーメッセージが記録され、異常通報機能の定期診断が実行されると、疑似エラーコードに基づくエラーメッセージが記録される。
また、監視対象サーバマシン10のサーバ監視ソフトウエア10eに基づくサーバ監視機能は、前述したように、システムログファイル10dを監視し、エラーメッセージがシステムログファイル10dに記録されると、それを取得して、管理サーバマシン20に送信する。ここで送信されるエラーメッセージは、前述したように、正規エラーコードと現実の故障が発生した日時を示す日時情報とを含んだもの、例えば「07/31/01:25 4126581-2010-0」、又は、疑似エラーコードとその疑似エラーコードをオペレーティングシステム10cが通知された日時を示す日時情報とを含んだもの、例えば「07/31/01:20 4126581-2010-1」となる。
〈エラーコード判定〉
本実施形態の管理サーバマシン20では、主電源が投入されると、オペレーティングシステム20aが起動されるとともに、エラーコード判定プログラム202cも起動されるようになっている。CPU24は、エラーコード判定プログラム202cを起動すると、エラーコード判定処理を開始する。
図13及び図14は、管理サーバマシン20におけるエラーコード判定処理の流れを示す図である。
エラーコード判定処理の開始後、S2001では、CPU24は、何れかの監視対象サーバマシン10のサーバ監視ソフトウエア10eに基づくサーバ監視機能からエラーメッセージを受信するまで待機する。そして、何れかの監視対象サーバマシン10のサーバ監視機能からエラーメッセージを受信すると(S2001;はい)、CPU24は、S2001からS2002へ処理を進める。
なお、S2001を実行するCPU24の機能は、前述した受信部の機能に相当している。
S2002では、CPU24は、S2001で受信したエラーメッセージの中からエラーコードを読み出す。
S2003では、CPU24は、S2002で読み出したエラーコードの末尾の疑似フラグが「0」であるか「1」であるかを判別する。そして、エラーコードの末尾の疑似フラグが「0」であった場合、つまりエラーコードが現実の故障を示す正規エラーコードであった場合、CPU24は、S2004へ処理を進める。
S2004では、CPU24は、S2001で受信したエラーメッセージを通報モジュール201(図8参照)に引き渡す。なお、通報モジュール201は、前述したように、正規エラーコードを含むエラーメッセージを受け取ると、受け取ったエラーメッセージに基づいて通報メッセージを生成し、生成した通報メッセージを保守員マシン30へ送信する。送信される通報メッセージには、前述したように、監視対象サーバマシン10のホスト名、正規エラーコード、及び、現実の故障が発生した日時を示す日時情報が含まれる。CPU24は、エラーメッセージを通報モジュール201に引き渡した後、S2001へ処理を戻し、何れかの監視対象サーバマシン10からエラーメッセージを受信するまで待機する状態になる。
なお、S2002乃至S2004と通報モジュール201とを実行するCPU24の機能は、前述した通報部の機能に相当している。
一方、S2002で読み出したエラーコードの末尾の疑似フラグが「1」であった場合、つまりエラーコードが疑似エラーコードであった場合、CPU24は、S2003から図14のS2005へ処理を分岐させる。
S2005では、CPU24は、図9の疑似故障発生記録テーブル202bから、診断中フラグが「ON」であるレコードを特定し、特定したレコードに含まれる疑似エラーコードと、S2002で読み出した疑似エラーコードとを対比する。
S2006では、CPU24は、S2005での対比において疑似エラーコード同士が一致しているか否かを判別する。そして、疑似エラーコード同士が一致していた場合(S2006;はい)、CPU24は、異常通報機能における監視対象サーバマシン10のオペレーティングシステム10cから保守員マシン30までの経路のうち、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作が正常であったと判断し、S2007へ処理を進める。
S2007では、CPU24は、図9の疑似故障発生記録テーブル202bにおける診断中フラグが「ON」であるレコードの「終了」フィールドに、S2001で監視対象サーバマシン10内のサーバ監視ソフトウエア10eに基づくサーバ監視機能からエラーメッセージを受信した日時を示す日時情報を記録する。また、CPU24は、同じレコードの「結果」フィールドに、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作に関する診断結果として「OK」を記録する。その後、CPU24は、S2009へ処理を進める。
一方、S2005での対比において疑似エラーコード同士が一致していなかった場合(S2006;いいえ)、CPU24は、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作が何らかの理由によって異常であったと判断し、S2006からS2008へ処理を分岐させる。
S2008では、CPU24は、図9の疑似故障発生記録テーブル202bにおける診断中フラグが「ON」であるレコードの「終了」フィールドに、S2001で監視対象サーバマシン10内のサーバ監視ソフトウエア10eに基づくサーバ監視機能からエラーメッセージを受信した日時を示す日時情報を記録する。また、CPU24は、同じレコードの「結果」フィールドに、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作に関する診断結果として「NG」を記録する。その後、CPU24は、S2009へ処理を進める。
S2009では、CPU24は、図9の疑似故障発生記録テーブル202bにおける診断中フラグが「ON」であるレコードにおいて、診断中フラグを診断中ではないことを示す「OFF」に切り替える。
なお、S2002乃至S2009を実行するCPU24の機能は、前述した判定部の機能に相当している。
S2010では、CPU24は、S2001で受信したエラーメッセージを診断結果通知プログラム202dに基づく診断結果通知機能に引き渡す。なお、診断結果通知機能は、前述したように、疑似エラーコードを含むエラーメッセージを受け取ると、受け取ったエラーメッセージと図9の疑似故障発生記録テーブル202bにおけるそのエラーメッセ
ージに対応する診断結果とに基づいて診断結果通知メッセージを生成し、生成した診断結果通知メッセージを保守員マシン30へ送信する。送信される診断結果通知メッセージには、前述したように、監視対象サーバマシン10のホスト名、疑似エラーコード、監視対象サーバマシン10のオペレーティングシステム10cに疑似エラーコードが通知された日時を示す日時情報と、診断結果を示す「正常」又は「異常」の文言とが含まれる。その後、CPU24は、図13のS2001へ処理を戻し、何れかの監視対象サーバマシン10からエラーメッセージを受信するまで待機する状態になる。
なお、S2007と診断結果通知プログラム202dとを実行するCPU24の機能は、前述した通知部の機能に相当している。
図13及び図14のエラーコード判定処理によると、監視対象サーバマシン10から受信したエラーメッセージの中のエラーコードが、正規エラーコードであるか疑似エラーコードであるかが判定される。そして、受信したエラーメッセージ中のエラーコードが正規エラーコードであった場合には、従来の異常通報機能と同様に、監視対象サーバマシン10の異常が保守員マシン30に通報されることとなる。
一方、受信したエラーメッセージ中のエラーコードが維持エラーコードであった場合には、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作が正常であるか異常であるかが判定される。そして、その判定結果が、異常通報機能の診断結果として、保守員マシン30に通知されることとなる。
〈顧客通知〉
本実施形態の保守員マシン30では、主電源が投入されると、オペレーティングシステム30aが起動されるとともに、顧客通知プログラム30eも起動されるようになっている。CPU37は、顧客通知プログラム30eを起動すると、顧客通知処理を開始する。
図15及び図16は、顧客通知処理の流れを示す図である。
顧客通知処理の開始後、S3001では、CPU37は、異常通報機能の定期診断を管理サーバマシン20が実行すべき時刻になったか否かを判別する。なお、本実施形態では、保守員が管理サーバマシン20に図示せぬ制御卓を接続して図5の定期診断受付画面40を通じて定期診断に関する情報を入力したときに、入力された情報の複製が保守員マシン30にも送信され、レジストレーション情報テーブル20cの複製が保守員マシン30に生成されるようになっている。このため、保守員マシン30は、異常通報機能の定期診断を管理サーバマシン20が実行すべき日時と、定期診断の対象となる監視対象サーバマシン10のホスト名とを、レジストレーション情報テーブル20cの複製から把握することができるようになっている。CPU37は、異常通報機能の定期診断を管理サーバマシン20が実行すべき時刻になると、CPU37は、S3001からS3002へ処理を進める。
S3002では、CPU37は、異常通報機能の定期診断を管理サーバマシン20が実行すべき時刻と定期診断の対象となるホスト名とを検索条件として、図11のイベントログテーブル30dを検索する。
S3003では、CPU37は、図11のイベントログテーブル30dからS3002の検索条件に合致するレコードが検出されたか否かを判別する。そして、図11のイベントログテーブル30dからS3002の検索条件に合致するレコードが検出されなかった場合(S3003;はい)、異常通報機能の定期診断を管理サーバマシン20が実行すべき時刻になったにも拘わらず、診断結果通知メッセージが送られてきていないため、CP
U37は、異常通報機能全体の動作、すなわち、監視対象サーバマシン10のオペレーティングシステム10cから保守員マシン30までの経路における動作が正常に動作していないと判断し、S3003からS3004へ処理を分岐させる。
S3004では、CPU37は、異常通報機能全体の動作が正常でない旨が記述された電子メールを顧客に送信する。S3004では、CPU37は、まず、顧客情報テーブル30bから、S3002で検索条件とされたホスト名を有する監視対象サーバマシン10の保守管理サービスを享受する顧客の電子メールアドレスを特定する。続いて、CPU37は、異常通報機能全体の動作が正常でない旨、例えば「リモート通報処理が正しく動作していません」という文言とホスト名とが少なくとも記述された電子メールを、メーラー30fの機能を利用して、特定された電子メールアドレス宛に送信する。その後、CPU37は、S3001へ処理を戻し、別の定期診断の実行時刻になるまで待機する状態になる。
一方、S3002での検索の結果、図11のイベントログテーブル30dからレコードが検出された場合(S3003;いいえ)、異常通報機能の定期診断を管理サーバマシン20が実行すべき時刻になって診断結果通知メッセージが送られてきているため、CPU37は、異常通報機能における監視対象サーバマシン10のオペレーティングシステム10cから保守員マシン30までの経路のうち、少なくとも、管理サーバマシン20から保守員マシン30までの経路での動作が正常に動作していると判断し、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作を更に確認するため、S3003から図15のS3005へ処理を進める。
S3005では、CPU37は、図11のイベントログテーブル30dから検出されたレコードの「内容」フィールドから診断結果を読み出し、管理サーバマシン20による診断の結果が正常であったか異常であったかを判別する。そして、CPU37は、管理サーバマシン20による診断の結果が異常であった場合(S3005;はい)、CPU37は、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作、すなわち、エラーメッセージの生成、エラーメッセージの取得、並びに、エラーメッセージの送信及び受信のうちの何れかが正常に動作していないと判断し、S3006へ処理を進める。
S3006では、CPU37は、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作が正常でない旨が記述された電子メールを顧客に送信する。S3006では、CPU37は、まず、顧客情報テーブル30bから、S3002で検索条件とされたホスト名を有する監視対象サーバマシン10の保守管理サービスを享受する顧客の電子メールアドレスを特定する。続いて、CPU37は、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路における動作が正常でない旨、例えば「故障監視処理が正しく動作していません」という文言とホスト名とが少なくとも記述された電子メールを、メーラー30fの機能を利用して、特定された電子メールアドレス宛に送信する。その後、CPU37は、図15のS3001へ処理を戻し、別の定期診断の実行時刻になるまで待機する状態になる。
一方、管理サーバマシン20による診断の結果が正常であった場合(S3005;いいえ)、CPU37は、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路においても動作が正常であると判断し、S3005からS3007へ処理を分岐させる。
S3007では、CPU37は、異常通報機能全体の動作が正常である旨が記述された
電子メールを顧客に送信する。S3007では、CPU37は、まず、顧客情報テーブル30bから、S3002で検索条件とされたホスト名を有する監視対象サーバマシン10の保守管理サービスを享受する顧客の電子メールアドレスを特定する。続いて、CPU37は、異常通報機能全体の動作が正常である旨、例えば「故障監視処理/リモート通報処理が正しく実行されました」という文言とホスト名とが少なくとも記述された電子メールを、メーラー30fの機能を利用して、特定された電子メールアドレス宛に送信する。その後、CPU37は、S3001へ処理を戻し、別の定期試験の実行時刻になるまで待機する状態になる。
《作用効果》
本実施形態によると、監視対象サーバマシン10内の何れかのユニットにおいて現実の故障が発生することによりそのユニットからシステム監視機構15が故障信号を受信すると、システム監視機構15内の正規エラーコード生成プログラム10aに基づく正規エラーコード生成機能が、故障したユニットと故障の種別とを示す部品コードと種別コードとに基づいて正規エラーコードを生成してオペレーティングシステム10cに通知する。すると、オペレーティングシステム10c内のシステムログ機能が、正規エラーコードを含むエラーメッセージを生成して、システムログファイル10dに記録する。また、監視対象サーバマシン10では、サーバ監視ソフトウエア10eに基づくサーバ監視機能がシステムログファイル10dを監視し、エラーメッセージがシステムログファイル10dに記録されるとそれを取得して、管理サーバマシン20に送信する。管理サーバマシン20では、エラーメッセージ内のエラーコードが正規エラーコードであると判定され(S2001〜S2002、S2003;0、S2004)、その後、通報モジュール201が、正規エラーコードを含むエラーメッセージに基づいて通報メッセージを生成し、保守員マシン30へ送信する。保守員マシン30では、受信プログラム30cが、監視対象サーバマシン10の異常を出力デバイス31に表示する。
そして、本実施形態では、監視対象サーバマシン10に、以上のような異常通報機能の他に、この異常通報機能の動作が正常であるか否かを定期的に診断するための機能が備えられている。具体的には、本実施形態では、管理サーバマシン20内の異常通報ソフトウエア20bに定期診断モジュール202が組み込まれ、この定期診断モジュール202と連係する疑似エラーコード通知プログラム10bが監視対象サーバマシン10のシステム監視機構15に組み込まれている。
このため、本実施形態の管理サーバマシン20は、レジストレーション情報テーブル20cに登録されている情報に従って定期的に、疑似エラーコードを生成して(S1001〜S1005)、監視対象サーバマシン10のシステム監視機構15内の疑似エラーコード通知プログラム10bに基づく疑似エラーコード通知機能に、生成した疑似エラーコードを引き渡すようになる(S1006)。その後、疑似エラーコード通知機能が、オペレーティングシステム10cより上流に疑似エラーコードを通知することにより、オペレーティングシステム10cに対して擬似的な故障の発生を認識させることとなる。これにより、管理サーバマシン20は、疑似エラーコードの引き渡しの応答として、監視対象サーバマシン10からエラーメッセージを受信するため、受信したエラーメッセージの内容に基づいて、異常通報機能における監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路での動作(エラーメッセージの生成、エラーメッセージの取得、並びに、エラーメッセージの送信及び受信)が正常であるか否かを判定することができる(S2001、S2002、S2003;1、S2005〜S2009)。その後、監視対象サーバマシン10のオペレーティングシステム10cから管理サーバマシン20までの経路での動作に関する判定結果が、診断結果通知プログラム202dによって、診断結果通知メッセージとして、保守員マシン30に通知されるので(S2010)、保守員は、管理サーバマシン20から保守員マシン30までの経路における動
作だけでなく、監視対象サーバマシン10の有する異常通報機能が全体として正常に動作しているか否かを確認することができるようになる。
《変形形態》
以上に説明した実施形態は、監視対象サーバマシン10内のシステム監視機構15に疑似エラーコード通知プログラム10bを導入し、この疑似エラーコード通知プログラム10bを、管理サーバマシン20の異常通報ソフトウエア20b内の定期診断モジュール202と連係させるものであったが、先に開示した異常通報システムを実施する上では、これに限定されなくても良い。
第1の変形形態としては、例えば、疑似エラーコードの生成主体が、管理サーバマシン20の異常通報ソフトウエア20b内の定期診断モジュール202ではなく、監視対象サーバマシン10のシステム監視機構15内の疑似エラーコード通知プログラム10bであっても良い。この第1の変形形態では、種別テーブル20d及び部品テーブル20eは、システム監視機構15に用意される。定期診断モジュール202は、疑似故障を発生させるユニットの部品名と疑似故障の種別の名称とをシステム監視機構15内の疑似エラーコード通知プログラム10bに基づく疑似エラーコード通知機能に指示するに留まり、疑似エラーコード通知機能が、疑似故障に係る部品名と種別の名称とに基づいて疑似エラーコードを生成することとなる。なお、生成された疑似エラーコードは、疑似エラーコード通知機能によってオペレーティングシステム10cに通知される。
また、第2の変形形態としては、例えば、疑似エラーコードの生成主体が、管理サーバマシン20の異常通報ソフトウエア20b内の定期診断モジュール202ではなく、監視対象サーバマシン10のシステム監視機構15内の正規エラーコード生成プログラム10aであっても良い。この第2の変形形態では、図17に示すように、監視対象サーバマシン10内のストレージユニット12やCPU13などの各ユニットには、RAS[Remote
Access Service]用LSI[Large Scale Integration]が搭載される。定期診断モジュール202は、疑似故障を発生させるユニットの中のRAS用LSIに対して、疑似故障の種別の名称を指示するに留まり、RAS用LSIが、疑似故障の種別に対応した故障信号を、疑似故障であることを示す信号とともに、システム監視機構15内の正規エラーコード生成プログラム10aに基づく正規エラーコード生成機能に送信することとなる。正規エラーコード生成機能は、この故障信号と疑似故障であることを示す信号とに基づいて疑似エラーコード生成し、生成した疑似エラーコードをオペレーティングシステム10cに通知する。
また、第3の変形形態としては、例えば、疑似エラーコードの生成主体が、管理サーバマシン20の異常通報ソフトウエア20b内の定期診断モジュール202ではなく、監視対象サーバマシン10のオペレーティングシステム10cであっても良い。この第3の変形形態では、図18に示すように、監視対象サーバマシン10のオペレーティングシステム10cには、RASドライバが組み込まれるとともに、種別テーブル20d及び部品テーブル20eが備えられる。定期診断モジュール202は、疑似故障を発生させるユニットの部品名と疑似故障の種別の名称とをRASドライバに指示するに留まり、RASドライバが、疑似故障に係る部品名と種別の名称とに基づいて疑似エラーコードを生成することとなる。なお、生成した疑似エラーコードは、RASドライバによってオペレーティングシステム10c内のシステムログ機能に通知される。
《ユニットに関する説明》
以上に説明した本実施形態及び変形形態において、監視対象サーバマシン10内の各ユニット11〜14、システム監視機構15内の各ユニット15a〜15e、管理サーバマシン20内の各ユニット21〜25、及び、保守員マシン30の各ユニット33〜38は
、何れも、ソフトウエア要素とハードウエア要素とから構成されていても良いし、ハードウエア要素のみで構成されていても良い。
ソフトウエア要素としては、インターフェースプログラム、ドライバプログラム、テーブル、及び、データ、並びに、これらのうちの幾つかを組み合わせたものが、例示できる。これらは、後述のコンピュータ可読媒体に格納されたものであっても良いし、ROM[Read Only Memory]及びLSI[Large Scale Integration]などの記憶装置に固定的に
組み込まれたファームウエアであっても良い。
また、ハードウエア要素としては、FPGA[Field Programmable Gate Array]、A
SIC[Application Specific Integrated Circuit]、ゲートアレイ、論理ゲートの組
み合わせ、信号処理回路、アナログ回路、及び、その他の回路が、例示できる。このうち、論理ゲートには、AND、OR、NOT、NAND、NOR、フリップフロップ、カウンタ回路などが、含まれていてもよい。また、信号処理回路には、信号値の加算、乗算、除算、反転、積和演算、微分、積分などを実行する回路要素が、含まれていてもよい。また、アナログ回路には、増幅、加算、乗算、微分、積分などを実行する回路要素が、含まれていてもよい。
なお、前述した監視対象サーバマシン10内の各ユニット11〜14、システム監視機構15内の各ユニット15a〜15e、管理サーバマシン20内の各ユニット21〜25、及び、保守員マシン30の各ユニット33〜38をそれぞれ構成する要素は、以上に例示したものに限定されず、これらと等価な他の要素であっても良い。
《ソフトウエア及びプログラムに関する説明》
以上に説明した本実施形態及び変形形態において、監視対象サーバマシン10内の各プログラム10a、10b、オペレーティングシステム10c、サーバ監視ソフトウエア10e、管理サーバマシン20内のオペレーティングシステム20a、異常通報ソフトウエア20b、各テーブル20c〜20e、及び、保守員マシン30のオペレーティングシステム30a、各プログラム30c、30e、各テーブル30b、30d、メーラー30f、並びに、前述したソフトウエア要素は、何れも、ソフトウエア部品、手続き型言語による部品、オブジェクト指向ソフトウエア部品、クラス部品、タスクとして管理される部品、プロセスとして管理される部品、関数、属性、プロシジャ(手続き)、サブルーチン(ソフトウエアルーチン)、プログラムコードの断片又は部分、ドライバ、ファームウエア、マイクロコード、コード、コードセグメント、エクストラセグメント、スタックセグメント、プログラム領域、データ領域、データ、データベース、データ構造、フィールド、レコード、テーブル、マトリックステーブル、配列、変数、パラメータなどの要素を、含んでいても良い。
また、前述した監視対象サーバマシン10内の各プログラム10a、10b、オペレーティングシステム10c、サーバ監視ソフトウエア10e、管理サーバマシン20内のオペレーティングシステム20a、異常通報ソフトウエア20b、各テーブル20c〜20e、及び、保守員マシン30のオペレーティングシステム30a、各プログラム30c、30e、各テーブル30b、30d、メーラー30f、並びに、前述したソフトウエア要素は、何れも、C言語、C++、Java(米国サンマイクロシステムズ社の商標)、ビジュアルベーシック(米国マイクロソフト社の商標)、Perl、Ruby、その他の多くのプログラミング言語により記述されたものであっても良い。
また、前述した監視対象サーバマシン10内の各プログラム10a、10b、オペレーティングシステム10c、サーバ監視ソフトウエア10e、管理サーバマシン20内のオペレーティングシステム20a、異常通報ソフトウエア20b、各テーブル20c〜20
e、及び、保守員マシン30のオペレーティングシステム30a、各プログラム30c、30e、各テーブル30b、30d、メーラー30f、並びに、前述したソフトウエア要素に含まれる命令、コード及びデータは、有線ネットワークカード及び有線ネットワークを通じて、又は、無線カード及び無線ネットワークを通じて、コンピュータ、又は、機械若しくは装置に組み込まれたコンピュータに、送信又はローディングされても良い。
前述した送信又はローディングにおいて、データ信号は、例えば搬送波に組み込まれることにより、有線ネットワーク又は無線ネットワーク上を移動する。但し、データ信号は、前述した搬送波に依らず、いわゆるベースバンド信号のまま転送されても良い。このような搬送波は、電気的、磁気的又は電磁的な形態、光、音響、又は、その他の形態で、送信される。
ここで、有線ネットワーク又は無線ネットワークは、例えば、電話回線、ネットワーク回線、ケーブル(光ケーブル、金属ケーブルを含む)、無線リンク、携帯電話アクセス回線、PHS[Personal Handyphone System]網、無線LAN[Local Area Network]、Bluetooth(ブルートゥース特別利益団体の商標)、車両搭載型無線通信(DSRC[Dedicated Short Range Communication]を含む)、及び、これらのうちの何れかからなるネットワークである。そして、このデータ信号は、命令、コード及びデータを含む情報を、ネットワーク上のノード又は要素に、伝達する。
なお、前述した監視対象サーバマシン10内の各プログラム10a、10b、オペレーティングシステム10c、サーバ監視ソフトウエア10e、管理サーバマシン20内のオペレーティングシステム20a、異常通報ソフトウエア20b、各テーブル20c〜20e、及び、保守員マシン30のオペレーティングシステム30a、各プログラム30c、30e、各テーブル30b、30d、メーラー30f、並びに、前述したソフトウエア要素を構成する要素は、以上に例示したものに限定されず、これらと等価な他の要素であっても良い。
《コンピュータ可読媒体に関する説明》
以上に説明した本実施形態及び変形形態における何れかの機能は、コード化されてコンピュータ可読媒体の記憶領域に格納されていても良い。この場合、その機能を実現するためのプログラムが、このコンピュータ可読媒体を介して、コンピュータ、又は、機械若しくは装置に組み込まれたコンピュータに、提供され得る。コンピュータ、又は、機械若しくは装置に組み込まれたコンピュータは、コンピュータ可読媒体の記憶領域からプログラムを読み出してそのプログラムを実行することによって、その機能を実現することができる。
ここで、コンピュータ可読媒体とは、電気的、磁気的、光学的、化学的、物理的又は機械的な作用によって、プログラム及びデータ等の情報を蓄積するとともに、コンピュータに読み取られ得る状態でその情報を保持する記録媒体をいう。
電気的又は磁気的な作用としては、ヒューズによって構成されるROM[Read Only Memory]上の素子へのデータの書き込みが、例示できる。磁気的又は物理的な作用としては、紙媒体上の潜像へのトナーの現像が、例示できる。なお、紙媒体に記録された情報は、例えば、光学的に読み取ることができる。光学的且つ化学的な作用としては、基盤上での薄膜形成又は凹凸形成が、例示できる。なお、凹凸の形態で記録された情報は、例えば、光学的に読み取ることができる。化学的な作用としては、基板上での酸化還元反応、又は、半導体基板上での酸化膜形成、窒化膜形成、若しくは、フォトレジスト現像が、例示できる。物理的又は機械的な作用としては、エンボスカードへの凹凸形成、又は、紙媒体へのパンチの穿孔が、例示できる。
また、コンピュータ可読媒体の中には、コンピュータ、又は、機械若しくは装置に組み込まれたコンピュータに着脱自在に装着できるものがある。着脱自在なコンピュータ可読媒体としては、DVD(DVD−R、DVD−RW、DVD−ROM、DVD−RAMを含む)、+R/+WR、BD(BD−R、BD−RE、BD−ROMを含む)、CD[Compact Disk](CD−R、CD−RW、CD−ROMを含む)、MO[Magneto Optical
]ディスク、その他の光ディスク媒体、フレキシブルディスク(フロッピーディスク(フロッピーは日立製作所社の商標)を含む)、その他の磁気ディスク媒体、メモリーカード(コンパクトフラッシュ(米国サンディスク社の商標)、スマートメディア(東芝社の商標)、SDカード(米国サンディスク社、松下電器産業社、東芝社の商標)、メモリースティック(ソニー社の商標)、MMC(米国ジーメンス社、米国サンディスク社の商標)など)、磁気テープ、及び、その他のテープ媒体、並びに、これらのうちの何れかを内蔵した記憶装置が、例示できる。記憶装置には、DRAM[Dynamic Random Access Memory]又はSRAM[Static Random Access Memory]がさらに内蔵されたものもある。
また、コンピュータ可読媒体の中には、コンピュータ、又は、機械若しくは装置に組み込まれたコンピュータに固定的に装着されたものがある。この種のコンピュータ可読媒体としては、ハードディスク、DRAM、SRAM、ROM、EEPROM[Electronically Erasable and Programmable Read Only Memory]、フラッシュメモリなどが、例示で
きる。
本実施形態のサーバ管理システムの構成図 監視対象サーバマシンの構成図 管理サーバマシンの構成図 レジストレーション情報テーブルを模式的に示す図 定期診断受付画面の一例を示す図 種別テーブルを模式的に示す図 部品テーブルを模式的に示す図 定期診断モジュールの構成図 疑似故障発生記録テーブルを模式的に示す図 保守員マシンの構成図 イベントログテーブルを模式的に示す図 疑似エラーコード生成処理の流れを示す図 エラーコード判定処理の流れを示す図 エラーコード判定処理の流れを示す図 顧客通知処理の流れを示す図 顧客通知処理の流れを示す図 第2の変形形態の監視対象サーバマシンの構成を概略的に示す図 第3の変形形態の監視対象サーバマシンの構成を概略的に示す図
符号の説明
10 監視対象サーバマシン
10a 正規エラーコード生成プログラム
10b 疑似エラーコード通知プログラム
10c オペレーティングシステム
10d システムログファイル
10e サーバ監視ソフトウエア
11 通信ユニット
12 ストレージユニット
13 CPU
14 メインメモリユニット
15 システム監視機構
15a I/Fユニット
15b 故障信号受信ユニット
15c ROMユニット
15d CPU
15e RAMユニット
20 管理サーバマシン
20b 異常通報ソフトウエア
201 通報モジュール
202 定期診断モジュール
202a 疑似エラーコード生成プログラム
202b 疑似故障発生記録テーブル
202c エラーコード判定プログラム
202d 診断結果通知プログラム
23 ストレージユニット
24 CPU
25 メインメモリユニット
30 保守員マシン
30c 受信プログラム
30d イベントログテーブル
20e 顧客通知プログラム
36 ストレージユニット
37 CPU
38 メインメモリユニット

Claims (2)

  1. 情報処理装置で発生した異常を外部装置に通報する異常通報システムであって、
    前記情報処理装置を構成するいずれかの要素で異常が発生すると、発生した異常の種別を特定する種別コードを生成する生成部、及び、
    前記生成部が生成した種別コードを含むエラーメッセージを生成して、前記情報処理装置に接続された通報装置に送信する送信部
    を備え、
    前記通報装置が、
    前記情報処理装置からエラーメッセージを受信すると、受信した前記エラーメッセージに基づいて前記情報処理装置の異常を前記外部装置に通報する通報部、
    擬似エラーコードであることを示す情報と所定の種別コードとを含む擬似エラーコードを生成して、前記情報処理装置に引き渡す疑似エラー生成部、
    前記擬似コードに対する応答として前記情報処理装置から受信したエラーメッセージと前記情報処理装置に引き渡した前記疑似コードとに基づいて、前記送信部の動作が正常か否かを判定する判定部、及び、
    前記判定部による判定結果を前記外部装置に通知する通知部
    を備える
    ことを特徴とする異常通報システム。
  2. 情報処理装置を構成するいずれかの要素で異常が発生すると、発生した異常種別を特定する種別コードを生成する生成部、及び、前記生成部が生成した種別コードを含むエラーメッセージを生成して、前記情報処理装置に接続された通報装置に送信する送信部を備えるとともに、前記通報装置が、前記情報処理装置からエラーメッセージを受信すると、受信した前記エラーメッセージに基づいて前記情報処理装置の異常を外部装置に通報する通報部を備える異常通報システムを診断する方法であって、
    前記通報装置に対し、
    擬似エラーコードであることを示す情報と所定の種別コードとを含む疑似エラーコードを生成して、前記情報処理装置に引き渡させ、
    前記擬似コードの引き渡しに対する応答として前記情報処理装置から受信したエラーメッセージと前記情報処理装置に引き渡した前記疑似コードとに基づいて、前記送信部の動作が正常か否かを判定させ、
    その判定による判定結果を前記外部装置に通知させる
    ことを特徴とする診断方法。
JP2008266789A 2008-10-15 2008-10-15 異常通報システム及び診断方法 Withdrawn JP2010097357A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008266789A JP2010097357A (ja) 2008-10-15 2008-10-15 異常通報システム及び診断方法
US12/567,012 US20100095163A1 (en) 2008-10-15 2009-09-25 Monitoring error notification function system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008266789A JP2010097357A (ja) 2008-10-15 2008-10-15 異常通報システム及び診断方法

Publications (1)

Publication Number Publication Date
JP2010097357A true JP2010097357A (ja) 2010-04-30

Family

ID=42099988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008266789A Withdrawn JP2010097357A (ja) 2008-10-15 2008-10-15 異常通報システム及び診断方法

Country Status (2)

Country Link
US (1) US20100095163A1 (ja)
JP (1) JP2010097357A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012066636A1 (ja) * 2010-11-16 2012-05-24 富士通株式会社 情報処理装置、送信装置及び情報処理装置の制御方法
US10275330B2 (en) 2015-11-06 2019-04-30 Fujitsu Limited Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667864B (zh) * 2009-09-28 2012-05-23 中兴通讯股份有限公司 一种下行物理链路故障诊断的方法、系统及装置
US9015268B2 (en) * 2010-04-02 2015-04-21 Intel Corporation Remote direct storage access
JP2013080454A (ja) * 2011-09-21 2013-05-02 Toshiba Tec Corp 保守装置、保守方法および保守プログラム
JP5945988B2 (ja) * 2014-11-17 2016-07-05 富士ゼロックス株式会社 端末装置、不具合報告システム及びプログラム
US10474519B2 (en) * 2015-09-17 2019-11-12 Netapp, Inc. Server fault analysis system using event logs
US11922377B2 (en) * 2017-10-24 2024-03-05 Sap Se Determining failure modes of devices based on text analysis
CN109344041A (zh) * 2018-09-25 2019-02-15 郑州云海信息技术有限公司 一种异常信息显示方法和基板管理控制器

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1161837B (it) * 1983-05-18 1987-03-18 Telettra Lab Telefon Sistema e apparecchiatura per la telesorveglianza di trasmissioni di dati
JPH01180645A (ja) * 1988-01-13 1989-07-18 Hitachi Ltd 保守診断機構の自動検証方式
US5503350A (en) * 1993-10-28 1996-04-02 Skysat Communications Network Corporation Microwave-powered aircraft
DE19811070C1 (de) * 1998-03-13 1999-09-23 Siemens Ag Insassenschutzsystem für ein Kraftfahrzeug und Verfahren zum Steuern der Auslösung des Insassenschutzsystems
US6318150B1 (en) * 1998-10-30 2001-11-20 Lennox Manufacturing Inc. Apparatus for sampling gas in a combustion appliance
US6636585B2 (en) * 2000-06-26 2003-10-21 Bearingpoint, Inc. Metrics-related testing of an operational support system (OSS) of an incumbent provider for compliance with a regulatory scheme
US7020811B2 (en) * 2001-04-24 2006-03-28 Sun Microsystems, Inc. System and method for verifying error detection/correction logic
US7047442B2 (en) * 2002-04-23 2006-05-16 Agilent Technologies, Inc. Electronic test program that can distinguish results
JP4457083B2 (ja) * 2006-03-28 2010-04-28 富士通株式会社 リコンフィグラブルデバイス搭載ボードのセルフテスト装置および方法
US7783938B1 (en) * 2008-07-31 2010-08-24 Keithly Instruments, Inc. Result directed diagnostic method and system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012066636A1 (ja) * 2010-11-16 2012-05-24 富士通株式会社 情報処理装置、送信装置及び情報処理装置の制御方法
JP5609986B2 (ja) * 2010-11-16 2014-10-22 富士通株式会社 情報処理装置、送信装置及び情報処理装置の制御方法
US10275330B2 (en) 2015-11-06 2019-04-30 Fujitsu Limited Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus

Also Published As

Publication number Publication date
US20100095163A1 (en) 2010-04-15

Similar Documents

Publication Publication Date Title
JP2010097357A (ja) 異常通報システム及び診断方法
JP4185913B2 (ja) 通信システム、設備状態決定システム、警報システム、記録システム、および報告システム
TWI353534B (en) System and method for managing data concerning ser
US20140188729A1 (en) Remote notification and action system with event generating
EP2423817A1 (en) Central cross-system pi monitoring dashboard
JP2007328645A (ja) 故障診断システム、画像形成装置および故障診断プログラム
US20030055946A1 (en) Network monitoring apparatus, computer-readable medium storing a network monitoring program, and network monitoring method
US20100251215A1 (en) Methods and systems of determining risk levels of one or more software instance defects
JP2018147080A (ja) 情報処理装置及び情報処理プログラム
JP4794228B2 (ja) データを転送するエミッション監視システム及び方法
JP2009296531A (ja) 監視装置
WO2016136747A1 (ja) 機械装置管理システム、機械装置の管理装置、機械装置を管理するサーバ、機械装置、および、機械装置の管理方法
US8897713B2 (en) System, method, and computer program product for wireless network monitoring
JP2010097417A (ja) メッセージ管理システム、監視対象装置、監視装置、メッセージ管理方法およびそのプログラム
WO2018093879A1 (en) Remote monitoring of air filter systems
US20100042582A1 (en) System and method for identification of application interdependency
US7640337B1 (en) Framework for application monitoring and management
JP2009098898A (ja) チェック項目表示装置、チェック項目表示方法、プログラムおよび記録媒体
JP5040738B2 (ja) 電子メール送信システム及び電子メール送信方法
JP2020047011A (ja) 情報処理装置、情報処理システム及び情報処理プログラム
JP6872120B2 (ja) 情報処理装置及び情報処理プログラム
JP7260260B2 (ja) 機器診断装置、機器診断方法、及び機器診断プログラム
Duffy et al. Methodology for digitally logging and analyzing manufacturing issues encountered on a factory floor
JP2017162169A (ja) 情報処理装置及び情報処理プログラム
JP2007018131A (ja) 障害情報収集・送信方法、および障害情報収集・送信プログラムおよび、障害情報収集・送信システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110708

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110815