JPH09265415A - 異常診断方法及び異常診断装置 - Google Patents

異常診断方法及び異常診断装置

Info

Publication number
JPH09265415A
JPH09265415A JP8074971A JP7497196A JPH09265415A JP H09265415 A JPH09265415 A JP H09265415A JP 8074971 A JP8074971 A JP 8074971A JP 7497196 A JP7497196 A JP 7497196A JP H09265415 A JPH09265415 A JP H09265415A
Authority
JP
Japan
Prior art keywords
information
abnormality
test
management system
system group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8074971A
Other languages
English (en)
Inventor
Hideyuki Kiyono
秀行 清野
Yuzo Fujita
裕三 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8074971A priority Critical patent/JPH09265415A/ja
Publication of JPH09265415A publication Critical patent/JPH09265415A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 本発明は、異常情報の取得から試験の実施ま
での間にタイムラグを生じることなく、異常にリアルタ
イムに対応する異常診断方法及び装置の提供を目的とす
る。 【解決手段】 異常診断装置(20)は、ネットワーク
を介して接続されたマネジメントシステム群(1)の異
常を監視する手段(22)と、検出された異常を検索情
報として、マネジメントシステム群(1)のリソース情
報と、マネジメントシステム群(1)の異常に対応する
試験項目情報とを含むデータベース(5)を検索し、検
索された結果から試験の対象となる装置及び試験項目を
含む試験情報を編集する手段(24)と、マネジメント
システム群(1)に接続され、試験情報に従って各試験
を実施する手段(26)とからなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報システムのネ
ットワーク管理に係り、特に、情報システムのマネジメ
ントシステム群を管理するための異常診断方法及び異常
診断装置に関する。
【0002】
【従来の技術】情報システムのネットワーク管理におい
て、データベースマネジメントシステム、ファイルマネ
ジメントシステム等のマネジメントシステムの役割は重
要である。しかし、分散処理の環境では、マネジメント
システム自体の数が増加するため、マネジメントシステ
ムの全体を統括して管理する必要が生じる。
【0003】図7は従来のマネジメントシステム群の管
理システムを示す図である。複数のマネジメントシステ
ム11 ,12 ,...,1n は、ネットワーク3を介し
て、複数のマネジメントシステム11 ,12 ,...,
n を管理する上位のマネジメントシステム10に接続
されている。
【0004】上位のマネジメントシステム10は、マネ
ジメントシステム11 ,12 ,...,1n を監視する
監視部12と、監視部12において異常が検出された場
合、異常情報を管理者に通知する異常通知部14と、管
理者から試験項目の情報を受け、試験項目を実施する試
験部16とから構成されている。
【0005】従来の管理システムの場合、上記の如く、
上位のマネジメントシステムの処理に管理者が介在して
いる。管理者は、異常通知部14から通知された異常情
報の内容を確認し、異常の生じた装置の特定、異常内容
に対する再試験項目の決定等の判断処理を行っている。
【0006】
【発明が解決しようとする課題】分散システムの集中管
理を目的として設けられた上記従来のネットワーク環境
における上位のマネジメントシステムは、ネットワーク
上のマネジメントシステムを監視し、異常情報を取得し
た後に、管理者のアクションによって試験を実施するこ
とにより、異常診断を行っている。従って、異常情報の
取得から、試験の実施までの間にタイムラグを生じると
いう問題点がある。
【0007】本発明は、上記従来技術の問題点に鑑み、
異常情報の取得から試験の実施までの間にタイムラグを
生じることなく、異常にリアルタイムに対応する分散シ
ステムのマネジメントシステム群の異常診断方法及び異
常診断装置の提供を目的とする。
【0008】
【課題を解決するための手段】上記本発明の目的を達成
するため、本発明は、マネジメントシステムを対象に異
常情報の監視を行い、異常情報の取得を契機として、異
常情報の内容の分析から試験までを自動的に実施する考
えに基づいている。
【0009】図1は本発明の分散システムのマネジメン
トシステム群の異常診断方法の原理説明図である。本発
明の異常診断方法は、マネジメントシステム群の異常を
監視する段階(ステップ1)と、上記マネジメントシス
テム群のリソース構成情報と、異常に対応する試験項目
とに関するデータベース(5)から、上記検出された異
常の情報に対応して、上記マネジメントシステムの異常
装置を表わす装置情報と、上記異常装置に対する試験項
目情報とを得る段階(ステップ2)と、上記装置識別情
報及び上記試験項目情報に基づいて、上記異常を生じた
マネジメントシステムの上記装置に対し、上記試験項目
情報によって表わされた試験を実施する段階(ステップ
3)とからなる。
【0010】上記本発明の異常診断方法によれば、マネ
ジメントシステム群(1)からの異常情報の取得を契機
にして、データベース(5)で管理されていた試験項目
の中から、異常情報に対応して必要な試験が自動的に選
択される。更に、データべース(5)に管理されていた
マネジメントシステム群(1)のリソース情報から異常
を生じた装置が特定される。これにより、特定された装
置に対し選択された試験を適用することにより、試験が
実施される。従って、異常情報の取得及び分析と、異常
装置の特定と、試験項目の設定が連続的に行われるの
で、管理者を介在させることなく、即ち、タイムラグを
発生させることなく、試験を実施し得るようになる。
【0011】図2は本発明の異常診断装置の原理構成図
である。異常診断装置(20)は、ネットワークを介し
て接続されたマネジメントシステム群(1)の異常を監
視する手段(22)と、上記検出された異常を表わす情
報を検索情報として、上記マネジメントシステム群
(1)の構成を表わすリソース情報と、上記マネジメン
トシステム群(1)の異常に対応する試験項目情報とを
含むデータベース(5)を検索し、検索された結果から
試験の対象となる装置と、上記装置に対する試験項目情
報とを含む試験情報を編集する手段(24)と、上記マ
ネジメントシステム群(1)に接続され、上記試験情報
に従って上記各試験を実施する手段(26)とからな
る。
【0012】
【発明の実施の形態】図3は本発明の一実施例の異常診
断装置の構成図である。同図において、異常診断装置2
0は、ネットワークを介して接続されたマネジメントシ
ステム群1の異常監視部22と、上記マネジメントシス
テム群1の構成を表わすリソース情報と、上記マネジメ
ントシステム群の異常に対応する試験項目情報とを含む
データベース5と、上記検出された異常を表わす情報を
検索情報として上記データベース5を検索し、異常内容
と、上記試験項目情報と、上記異常装置の装置情報とを
取得するデータベース検索部24と、上記取得された異
常内容と、試験項目情報と、装置情報とから、試験の対
象となる装置と、上記装置に対する試験項目情報とを含
む試験情報を編集する試験情報編集部26とからなる。
上記異常診断装置20は、上記試験情報から上記試験の
スケジュールを組み立てる試験スケジュール組立部28
と、上記マネジメントシステム群1に接続され、上記組
み立てられた上記試験のスケジュールに従って上記各試
験を実施し、上記試験の結果を収集する試験実施部30
とを更に有する。
【0013】上記本発明の一実施例の異常診断装置20
によれば、リソース情報、異常内容及び試験項目が共通
に管理されるので、異常診断に関する用語、概念が統一
される。従って、マネジメントシステム毎に異なる用
語、概念を解釈する管理者を介在させることなく、異常
内容の分析から試験の実施までを連続的に行うことが可
能になる。
【0014】更に、上記異常診断装置20において、デ
ータベース更新部32は、上記マネジメントシステム群
1に接続され、上記データベース5を構築し、リアルタ
イムに変更する。これにより、異常情報の蓄積、試験項
目又は装置の特定に必要なデータの蓄積がリアルタイム
に行われるので、データベースから適当な情報を照会す
ることが可能になる。
【0015】診断結果出力部34は、上記収集された試
験の結果から上記マネジメントシステム群1の異常を判
定する。尚、上記本発明の一実施例の異常診断装置の構
成において、異常診断装置20は、データベース5を含
むよう構成されているが、データベース5を異常診断装
置20の独立の外部データベースシステムとして構成し
てもよい。
【0016】
【実施例】図4は本発明の他の実施例の異常診断を行う
ためのサーバ/クライアントシステムの構成図である。
同図に示す如く、サーバ/クライアントシステムは、統
合マネジメントサーバ2と、ネットワークを介して統合
マネジメントサーバ2に接続されたn台のマネジメント
サーバ11 ,12 ,...,1n と、統合マネジメント
サーバ2に接続されたデータベース5とからなる。デー
タベース5は、統合マネジメントサーバ2における統合
マネジメント、即ち、マネジメントサーバ群1の異常診
断に必要となる情報を管理している。
【0017】各マネジメントサーバ11
2 ,...,1n は、夫々、ファイルマネジメントシ
ステム、ネットワークマネジメントシステム、データベ
ースマネジメントシステム等のマネジメントを提供する
サーバ装置である。各マネジメントサーバ11
2 ,...,1n に接続されたクライアントは、サー
バからのサービスの提供を受ける。
【0018】統合マネジメントサーバ2は、図3に示し
た異常診断装置20を含むよう構成される。図3の異常
診断装置20との相違点は、データベース5が独立した
外部のデータベースの形で設けられている点である。各
マネジメントサーバ11 ,12 ,...,1n は、クラ
イアントサーバに接続されている。例えば、マネジメン
トサーバ11 は、m台のクライアントサーバ41
2 ,...,4m に接続されている。尚、同図では、
機能的な関係を表わすため、統合マネジメントサーバ2
と、マネジメントサーバ群1と、クライアント41 ,4
2 ,...,4m が階層的に接続されているように示さ
れているが、一般的に、統合マネジメントサーバ2と、
マネジメントサーバ群1と、クライアント41
2 ,...,4m は、ネットワーク3を介して相互に
直接通信可能な形で接続されている。或いは、同図に示
すように物理的に階層的な関係で接続しても構わない。
【0019】図5は本発明の他の実施例の統合マネジメ
ントサーバの動作フローチャートである。以下、図5を
参照して統合マネジメントサーバの動作を説明する。 ステップ1:異常監視部22は、マネジメントサーバ群
1を監視し、異常が発見された場合、異常情報を取得す
る。より具体的に言うと、異常監視部22は、例えば、
メモリの状況、ハードディスクの容量、起動アプリケー
ションプログラムの動作状況、ネットワークの負荷等の
リソースの異常に関する情報を監視し、異常時に検出さ
れると想定される状況に応じたエラー番号が予め定義さ
れている。異常監視部22が取得する異常情報には、状
況に応じた上記エラー番号と、異常が発生したアクセス
装置の番号を含む端末番号が付与されている。
【0020】例えば、エラー番号=1、端末番号=1に
対応する異常が検出されると、異常監視部22から異常
情報を受けたデータベース検索部24は、異常情報の中
のエラー番号及び端末番号を検索情報として、データベ
ース5にアクセスする。図6はデータベース5に格納さ
れた管理情報の構成図である。同図の(a)は、エラー
番号毎に対応する異常内容及び試験項目が管理された情
報を示し、同図の(b)は、端末番号毎に対応する異常
装置名及び装置情報が管理された情報が示されている。
装置情報は、例えば、当該装置に収容されているメモリ
種別と、回線番号と、アプリケーションプログラム等に
よって構成されている。
【0021】ステップ21:データベース検索部24
は、検索情報であるエラー番号=1から、異常内容とし
て「メモリアクセスエラー」を取得し、試験項目として
「メモリチェック」を取得する。更に、データベース検
索部24は、検索情報である端末番号=1から、装置名
として「通信教育サービス東京地区管理システム」と、
装置情報として、「基本パッケージ、大阪A、エディ
タ」と、「増設パッケージ1、札幌B、プログラミング
言語」と、「増設パッケージ2、名古屋C、データベー
ス」の3種類の情報を取得する。
【0022】ステップ22:試験情報編集部26は、デ
ータベース5から得られた上記の情報を基にして、試験
項目1「基本パッケージのメモリチェック」と、試験項
目2「増設パッケージ1のメモリチェック」と、試験項
目3「増設パッケージ2のメモリチェック」とを含む試
験情報を編集し、試験スケジュール組立部28に通知す
る。
【0023】ステップ31:試験スケジュール組立部2
8は、例えば、収容回線に応じて試験の順序を定める規
準に基づいて、試験項目1、試験項目3、試験項目2の
順序にメモリチェックを行うスケジュールを組み立て、
試験実施部30に試験の実施を依頼する。
【0024】ステップ32:試験実施部30は、スケジ
ュールに従って、試験項目1、試験項目3、試験項目2
の順序でメモリチェックを実施し、「基本パッケージは
異常なし」、「増設パッケージ1は異常あり」、「増設
パッケージは異常なし」のようなメモリチェックの結果
を収集する。
【0025】ステップ4:診断結果出力部34は、上記
メモリチェックの結果を参照して、装置「通信教育サー
ビス東京地区管理システム」の収容メモリ「増設パッケ
ージ1」に「故障あり」という異常診断結果を出力す
る。 以上の統合マネジメントシステムの動作によって、サー
バ/クライアントシステムの異常診断が完了する。
【0026】
【発明の効果】上記説明のように、本発明によれば、異
常診断の際に、異常の内容の分析から試験の実施までが
自動化されるので、異常が生じた時点で直ちに再試験を
行うことができる。従って、異常の瞬時かつ確実な特定
が可能になる。更に、再試験の後に、異常と診断された
場合、故障の修復要求を直ちに出力することができるの
で、時間の経過後の再試験では異常が再現しないという
ような無駄な作業が無くなるので、異常診断、修復を効
率的に行えるようになる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施例の異常診断装置の構成図であ
る。
【図4】本発明の他の実施例の異常診断サーバ/クライ
アントシステムの構成図である。
【図5】本発明の他の実施例の統合マネジメントサーバ
の動作フローチャートである。
【図6】本発明の他の実施例のデータベース管理情報の
構成図である。
【図7】従来のマネジメントシステム群の管理システム
の構成図である。
【符号の説明】 1 マネジメントシステム群 20 異常診断装置 22 異常監視手段 24 試験情報取得手段 26 試験実施手段

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 マネジメントシステム群の異常を監視す
    る第1の段階と、 上記マネジメントシステム群のリソース構成情報と異常
    に対応する試験項目情報とに関するデータベースから、
    上記検出された異常の情報に対応して、上記マネジメン
    トシステムの異常装置を表わす装置情報と、上記異常装
    置に対する試験項目情報とを得る第2の段階と、 上記装置識別情報及び上記試験項目情報に基づいて、上
    記異常を生じたマネジメントシステムの上記装置に対
    し、上記試験項目情報によって表わされた試験を実施す
    る第3の段階とからなる、マネジメントシステム群の異
    常診断方法。
  2. 【請求項2】 上記第2の段階は、 上記検出された異常を表わす情報を検索情報として上記
    データベースを検索し、異常内容、上記試験項目情報、
    及び、上記異常装置の装置情報とを取得する段階と、 上記取得された異常内容、試験項目情報、及び、装置情
    報から、試験の対象となる装置と上記装置に対する試験
    項目情報とを含む試験情報を編集する段階とを更に有
    し、 上記第3の段階は、 上記試験情報から上記試験のスケジュールを組み立てる
    段階と、 上記組み立てられた上記試験のスケジュールに従って、
    上記各試験を実施する段階とを更に有することを特徴と
    する請求項1記載の異常診断方法。
  3. 【請求項3】 ネットワークを介して接続されたマネジ
    メントシステム群の異常を監視する手段と、 上記検出された異常を表わす情報を検索情報として、上
    記マネジメントシステム群の構成を表わすリソース情報
    と、上記マネジメントシステム群の異常に対応する試験
    項目情報とを含むデータベースを検索し、検索された結
    果から試験の対象となる装置と、上記装置に対する試験
    項目情報とを含む試験情報を編集する手段と、 上記マネジメントシステム群に接続され、上記試験情報
    に従って上記各試験を実施する手段とからなる、分散シ
    ステムのマネジメントシステム群の異常診断装置。
  4. 【請求項4】 ネットワークを介して接続されたマネジ
    メントシステム群の異常を監視する手段と、 上記マネジメントシステム群の構成を表わすリソース情
    報と、上記マネジメントシステム群の異常に対応する試
    験項目情報とを含むデータベースと、 上記マネジメントシステム群に接続され、上記データベ
    ースを構築し、リアルタイムに変更する手段と、 上記検出された異常を表わす情報を検索情報として上記
    データベースを検索し、異常内容、上記試験項目情報、
    及び、上記異常装置の装置情報とを取得する手段と、 上記取得された異常内容、試験項目情報、及び、装置情
    報から、試験の対象となる装置と、上記装置に対する試
    験項目情報とを含む試験情報を編集する手段と、 上記試験情報から上記試験のスケジュールを組み立てる
    手段と、 上記マネジメントシステム群に接続され、上記組み立て
    られた上記試験のスケジュールに従って上記各試験を実
    施し、上記試験の結果を収集する手段と、 上記収集された試験の結果から上記マネジメントシステ
    ム群の異常を判定する手段とからなる、マネジメントシ
    ステム群の異常診断装置。
JP8074971A 1996-03-28 1996-03-28 異常診断方法及び異常診断装置 Pending JPH09265415A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8074971A JPH09265415A (ja) 1996-03-28 1996-03-28 異常診断方法及び異常診断装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8074971A JPH09265415A (ja) 1996-03-28 1996-03-28 異常診断方法及び異常診断装置

Publications (1)

Publication Number Publication Date
JPH09265415A true JPH09265415A (ja) 1997-10-07

Family

ID=13562700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8074971A Pending JPH09265415A (ja) 1996-03-28 1996-03-28 異常診断方法及び異常診断装置

Country Status (1)

Country Link
JP (1) JPH09265415A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003131905A (ja) * 2001-10-26 2003-05-09 Sitecare Kk 管理サーバシステム
JP2010108156A (ja) * 2008-10-29 2010-05-13 Mitsubishi Electric Corp 階層型リソース監視システム
CN112185557A (zh) * 2020-09-18 2021-01-05 广州市妇女儿童医疗中心(广州市妇幼保健院、广州市儿童医院、广州市妇婴医院、广州市妇幼保健计划生育服务中心) 检测信息处理系统、装置、计算机设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003131905A (ja) * 2001-10-26 2003-05-09 Sitecare Kk 管理サーバシステム
JP2010108156A (ja) * 2008-10-29 2010-05-13 Mitsubishi Electric Corp 階層型リソース監視システム
CN112185557A (zh) * 2020-09-18 2021-01-05 广州市妇女儿童医疗中心(广州市妇幼保健院、广州市儿童医院、广州市妇婴医院、广州市妇幼保健计划生育服务中心) 检测信息处理系统、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US20220100641A1 (en) System and method for continuous testing and delivery of software
US10901727B2 (en) Monitoring code sensitivity to cause software build breaks during software project development
US10310968B2 (en) Developing software project plans based on developer sensitivity ratings detected from monitoring developer error patterns
US7340649B2 (en) System and method for determining fault isolation in an enterprise computing system
US7788205B2 (en) Using stochastic models to diagnose and predict complex system problems
JP2001188765A (ja) 分散コンピューティング環境で複数の関係する障害を表す障害情報を参照する技法
US7137041B2 (en) Methods, systems and computer program products for resolving problems in an application program utilizing a situational representation of component status
US7500144B2 (en) Resolving problems in a business process utilizing a situational representation of component status
US20100251029A1 (en) Implementing self-optimizing ipl diagnostic mode
CN115114064A (zh) 一种微服务故障分析方法、系统、设备及存储介质
CN112506772B (zh) web自动化测试方法、装置、电子设备和存储介质
JPH09265415A (ja) 異常診断方法及び異常診断装置
US20120016978A1 (en) Method and Apparatus for Performing Services in a Network Data Processing System
JP2003345628A (ja) 障害調査資料採取方法及びその実施システム並びにその処理プログラム
CN117667109A (zh) 一种环境部署方法、装置、电子设备及存储介质
WO2006110235A2 (en) Playbook automation
CN113392006A (zh) 一种使用capsys监控自动化测试日志的方法及设备
CN112015637A (zh) 一种应用性能管理系统及方法
CN115687036A (zh) 日志采集方法、装置及日志系统
CN100517243C (zh) 开放式测试资料收集系统及方法
CN112433915B (zh) 一种基于分布式性能监控工具的数据监控方法及相关装置
CN114020631B (zh) 用于链路测试的方法、装置及机器可读存储介质
CN116225823A (zh) 一种服务器日志收集的方法和装置
JP2015043181A (ja) 回帰テスト支援システム
JP3322002B2 (ja) 情報処理装置のテスト方法およびそのためのテスト装置並びにこのテスト装置を用いた情報処理装置およびこの情報処理装置が複数接続された情報管理装置