JP2005234861A - 管理装置、及び、管理システム - Google Patents
管理装置、及び、管理システム Download PDFInfo
- Publication number
- JP2005234861A JP2005234861A JP2004042741A JP2004042741A JP2005234861A JP 2005234861 A JP2005234861 A JP 2005234861A JP 2004042741 A JP2004042741 A JP 2004042741A JP 2004042741 A JP2004042741 A JP 2004042741A JP 2005234861 A JP2005234861 A JP 2005234861A
- Authority
- JP
- Japan
- Prior art keywords
- information
- failure
- impact
- unit
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】 従来のシステム管理方式では、システム管理者がシステム管理計算機を通して把握できるのは、被管理計算機の停止や異常など局所的な情報であり、障害の発生した計算機上で動作していた業務の内容や、その優先度などの情報を得ることが出来なかった。
【解決手段】 管理装置11は、接続する業務系システムとを階層を有するシステム要素に階層化して記憶するとともに、階層化したそれぞれのシステム要素ごとに障害が発生した場合の影響度を示す影響度情報をシステム要素に対応させて記憶する障害影響テーブル21を備え、システム管理者から障害の影響度の解析を依頼する解析依頼情報を入力して、上記障害影響テーブル21に記憶された情報を解析依頼情報に基づいて解析して、解析結果情報を生成して通知する解析部125とを備えた。
【選択図】 図1
【解決手段】 管理装置11は、接続する業務系システムとを階層を有するシステム要素に階層化して記憶するとともに、階層化したそれぞれのシステム要素ごとに障害が発生した場合の影響度を示す影響度情報をシステム要素に対応させて記憶する障害影響テーブル21を備え、システム管理者から障害の影響度の解析を依頼する解析依頼情報を入力して、上記障害影響テーブル21に記憶された情報を解析依頼情報に基づいて解析して、解析結果情報を生成して通知する解析部125とを備えた。
【選択図】 図1
Description
この発明は、ネットワークに接続された複数の計算機から構成され、所定の業務機能を実行するシステムの運用管理にかかわり、上記システムの構成要素であるハードウェア(例えば計算機)や、ソフトウェア(例えば、計算機上で実行されるプログラム)などに障害や不具合などが発生した場合、その障害がシステム全体に及ぼす影響や、正常に動作しているが停止してもシステム全体に及ぼす影響が小さい業務機能を実行するシステムの構成要素から、障害の発生した機器の代替機器を探索する、管理装置及び管理システムに関する。
従来のシステム運用管理方式を説明する。従来のシステム運用管理方式では、被管理対象計算機は、被管理対象計算機を管理するシステム管理計算機を接続して、被管理対象計算機は、被管理計算機上で動作し、被管理計算機上の情報を収集しシステム管理計算機に送付する情報収集ソフトウェアを記憶する。また、システム管理計算機は、システム管理計算機上で動作し、情報収集ソフトウェアが実行されることによって送付された被管理計算機の情報をシステム管理者に報告するシステム管理ソフトウェアを記憶する。
システム管理ソフトウェアは、被管理計算機の情報収集ソフトウェアに対して、定期的に情報送付要求を送信する。情報収集ソフトウェアは、システム管理ソフトウェアに対して要求された情報を返送する。システム管理ソフトウェアが送付する情報収集要求が収集を要求する情報は、例えば動作を確認するための返答要求や、計算機やネットワークの負荷などがある。
情報送付要求を送信したシステム管理ソフトウェアは、情報収集ソフトウェアからの返送を待つ。情報収集ソフトウェアからの返送を受信したシステム管理ソフトウェアは、結果をシステム管理者へ報告する。また、一定時間返送が無かった情報収集ソフトウェアが動作している被管理計算機を、障害による停止が発生したとしてシステム管理者へ報告する。
被管理計算機上で動作する情報収集ソフトウェアが、被管理計算機上の異常を検出した場合、システム管理ソフトウェアに異常を報告する。情報収集ソフトウェアからの異常通知を入力したシステム管理ソフトウェアは、被管理計算機上で発生した異常をシステム管理者に報告する。以上に示した動作により、システム管理者は複数の被管理計算機で発生した異常をシステム管理計算機上で監視することが可能となる。
また、特開平10−320237の「障害解析装置」には、装置診断部と装置管理部とハードOS部とを有するソフトウェア部と、複数の交換可能な装置を有するハードウェア部と、で構成された障害診断装置において、装置管理部がハードウェア部に対するハードアクセスを実施したことによりハードウェア部が異常を起こして割り込み障害通知を発生したとき、該通知における割り込み障害情報を格納して装置診断部に与える記憶部を備え、装置診断部がハードアクセス時の異常情報と割り込み障害情報とに基づいて障害装置を特定することを特徴とする発明が記載されている。
特開平10−320237号公報
従来のシステム管理方式では、システム管理者がシステム管理計算機を通して把握できるのは、被管理計算機の停止や異常など局所的な情報である。システム管理者は、本情報を元に復旧処置を行うが、障害の発生した計算機上で動作していた業務の内容や、その優先度などの情報を得ることが出来ない。よって、システムで障害が発生した場合に備え、全ての計算機設備に対するバックアップ装置、予備装置、人員などを準備しておく必要があり、システムの維持管理にコストがかかった。
また、従来の障害解析装置では、異常発生時にハードウェア割り込みを用いて障害情報の収集を行うが、障害の発生した計算機よってシステムに障害が発生した場合に備え、全ての計算機設備に対するバックアップ装置、予備装置、人員などを準備しておく必要があり、システムの維持管理にコストがかかった。また、障害の発生した計算機上で動作していた業務の内容や、その優先度などの情報を得ることが出来ない。
この発明は上記のような問題点を解決するため、以下のこと目的とする。
所定の業務機能を実行する業務系を構成するシステムを、システムを構成する構成要素、例えばサブシステム、計算機に階層化し、最終的に機器レベルの構成要素まで抽出した上で、各構成要素の重要度を数値化したFailure Mode and Effects Analysis(「故障モードと影響解析」、以下、「FMEA」とする)表を業務系の運用を管理する運用管理機能と連係させる。これにより、障害が発生した場合に、影響の大きな機器を検出し、事前に対策を行えるようにする。さらに、障害が発生した場合、システム管理者に対して、障害による業務への影響度を報告すると共に、正常に動作している優先度の低い業務システムから障害の発生した機器と同一の仕様をもつ機器を検索して、報告する。これにより、システム管理者は、障害の重要度に合わせたシステム復旧対策を行えると共に、低優先度のシステム設備を流用することで、バックアップ設備などの確保を少なくすることが出来る。さらに、業務系の構成要素である計算機の管理情報などから、計算機のハードウェア構成やソフトウェアの連係情報を抽出し、FMEA表を自動生成させる、管理装置及び管理システムを提供するものである。
この発明に係る所定の業務機能を実行するシステムを接続して、接続したシステムを管理する管理装置は、上記システムが、1つ以上のシステム要素により構成され、上記システム要素はそれぞれ、階層を構成し、上記管理装置は、上記システム要素ごとに、自システム要素と自システム要素を構成する下位階層のシステム要素とを示す構成要素情報と、下位階層のシステム要素に発生する故障を示す故障情報と、上記故障によって上記下位階層のシステム要素が受ける影響度を示す影響度情報とを、障害影響情報として記憶し、障害の影響度の解析依頼情報を入力して、入力した解析依頼情報に基づいて上記記憶した障害影響情報を解析して、解析結果情報を生成して通知することを特徴とする。
本発明では、機器に発生した障害が、業務システム全体にどの程度の影響を及ぼすのかを導出し、システム管理者に報告することが出来る効果がある。
実施の形態1.
この実施の形態では、障害影響テーブルの一例として、「FMEA表」を用いる。一般的には、FMEAは、基本仕様で設定した機能・品質が確保されないときに、故障となる現象とその影響がどうなるかを解析して、開発・設計へフィードバックして、基本仕様の欠落・不備を改善することに主要な目的がある。このような目的を有する「FMEA表」を障害影響テーブルとして使用して、機器に発生した障害が、業務システム全体にどの程度の影響を及ぼすのかを導出し、システム管理者に報告する管理装置、管理システムについて説明する。
この実施の形態では、障害影響テーブルの一例として、「FMEA表」を用いる。一般的には、FMEAは、基本仕様で設定した機能・品質が確保されないときに、故障となる現象とその影響がどうなるかを解析して、開発・設計へフィードバックして、基本仕様の欠落・不備を改善することに主要な目的がある。このような目的を有する「FMEA表」を障害影響テーブルとして使用して、機器に発生した障害が、業務システム全体にどの程度の影響を及ぼすのかを導出し、システム管理者に報告する管理装置、管理システムについて説明する。
図1は、この実施の形態1の管理システムの構成図である。図1において、管理装置11は、ネットワーク1を介して複数の業務系システムを接続する。業務系システムは1つでも、複数でもかまわない。業務系システムは、ハードウェアとソフトウェアとにより実行される所定の業務の処理を示し、ハードウェアは計算機や記憶装置や入力装置や出力装置等を指し、ソフトウェアは計算機上で動作するプログラムであって記憶装置に記憶され、記憶装置や入力装置や出力装置等を使用して所定の処理を行う。ここでは、管理装置11は、業務系システムの一例として支店業務系101と販売店業務系107とを接続する。また、業務系システムは、1つ以上のシステム要素により構成され、システム要素は、階層を有する。ここでは、支店業務系101は、システムA102とシステムB105とを下位階層のシステム要素として有し、さらに、システムA102は、サブシステムA103とサブシステムB104とを下位階層のシステム要素として有し、システムB105は、サブシステムC106を下位階層のシステム要素として有する。さらに、サブシステムA103は、被管理計算機2,3とを下位階層のシステム要素して有し、サブシステムB104は、被管理計算機4を下位階層のシステム要素して有し、サブシステムC106は、被管理計算機5,6,7とを下位階層のシステム要素として有する。一方、販売店業務系107は、システムC108を下位階層のシステム要素として有し、さらに、システムC108は、サブシステムD109とサブシステムE110とを下位階層のシステム要素として有する。さらに、サブシステムD109は、被管理計算機8を下位階層のシステム要素して有し、サブシステムE110は、被管理計算機9,10とを下位階層のシステム要素して有する。さらに、それぞれの被管理計算機は、記憶装置等のハードウェア資源及び所定の処理を実行するためのソフトウェア資源とを有し、上記資源は被管理計算機の下位階層のシステム要素である。なお、被管理計算機は、計算機に相当する。
次に、管理装置11を構成する要素について説明する。
管理装置11は、障害影響テーブル21を備える。障害影響テーブル21は、管理装置11が接続する業務系システムに対応するFMEA表を記憶する。図2に、本実施の形態で用いるFMEA表を示す。FMEA表は、システム要素の階層ごとに作成する。このため、例えば、3階層を構成する業務系システムでは、少なくとも3つのFMEA表を作成する。FMEA表は各表ごとに障害影響情報を記憶する。障害影響情報は、自システムと自システム要素の下位階層のシステム要素とを構成要素情報として有するとともに、構成要素情報に対応させて故障情報と、その故障によって構成要素情報の示すシステム要素が受ける影響度を示す影響度情報とを有する。
図2において、所定の業務機能を運用する工場、支店、営業所、顧客向け端末などの企業システム12は、図1の管理装置11の管理対象である。企業システム12の有する支店業務系101は、さらにシステムA102やシステムB105等の複数のシステムを有している。FMEA表14は、支店業務系101に対応するFMEA表であり、支店業務系101のシステムは、システムA102とシステムB105とから構成されているため、FMEA表14は、被解析系列として、「支店業務機能」を記憶し、構成要素として「システムA」と「システムB」を記憶する。「被解析系列」に設定される情報と「構成要素」に設定される情報とが「構成要素情報」に相当する。FMEA表16は、システムA102に対応するFMEA表であり、システムAは、サブシステムA103と、サブシステムB104とから構成されているため、FMEA表16は被解析系列として「システムA」を記憶し、構成要素として「サブシステムA」と「サブシステムB」とを記憶する。FMEA表18は、サブシステムA103に対応するFMEA表であり、サブシステムA103は被管理計算機2,3とから構成されているため、FMEA表18は被解析系列として「サブシステムA」を記憶し、構成要素として「計算機A1」と「計算機A2」とを記憶する。FMEA表29は、被管理計算機2に対応するFMEA表であり、被管理計算機2は、図1には図示していないが、機能Aと機能Bとを構成要素として有しているため、FMEA表29は被解析系列として「計算機A1」を記憶し、構成要素として「機能A」と「機能B」とを記憶する。
管理装置11は、影響度データ管理部20を備え、影響度データ管理部20は枠組み生成部に相当する。影響度データ管理部20は、データ項目情報122を入力する。データ項目情報122は、FMEA表14を例にとると、最上段に記載されているタイトルに相当し、「被解析系列」と「構成要素」と「故障モード」と「影響」さらに「影響」の下に記載されている「動作」から「総影響」までのタイトルを示す情報である。データ項目情報122は、予め管理装置のシステム管理者が管理対象となるシステムについて検証を行い、決定しておく情報である。データ項目情報122の内容は、システムや監視対象によって変わる可能性がある。例えば、あるシステムには「違約」という項目がなかったり、故障の際により多くのパラメータを考慮しなければならない場合等があって、管理者がタイトルに相当する項目を検証する。
影響度データ管理部20は、データ項目情報122を入力して、障害影響テーブル21に表の枠組みであるタイトルを設定する。
管理装置11は、影響度算出設定部23を備え、影響度算出設定部23は算出入力記憶部に相当する。影響度算出設定部23は、算出式123を入力する。算出式123は、障害影響テーブルの有する総影響の項目に設定する値を計算するための計算式である。図3に算出式の一例を示す。図3に示す算出式の例では、FMEA表の「影響」の項目の有する「動作」と「致命度」と「損失」と「違約」のそれぞれに対して重みを掛け合わせ、それらを加算して総影響度としている。図3の例では、それぞれの項目の値に対して重みを掛け合わせているが、単純に各項目の値を加算する式でも構わない。影響度算出設定部23は、記憶部を備え、入力した算出式123をこの記憶部に記憶する。
管理装置11は、影響度データ設定部22を備える。影響度データ設定部22は、影響情報設定部に相当する。影響度データ設定部22は、障害影響情報121を入力する。障害影響情報121は、影響度データ管理部20が設定したタイトルに対する値である。ここでは、障害影響情報121のデータ構成については、影響度データ設定部22によって判定できる形式であれば構わないものとする。また、影響度データ設定部22は、影響度算出設定部23が記憶する算出式を取得して、算出式に従い総影響度を計算して、計算した総影響度を障害影響テーブル21に設定する。
管理装置11は、解析部125を備える。解析部125は、障害の影響度の解析を依頼する解析依頼情報126を入力する。
解析部125は、高影響要素探索部24と、低影響要素探索部25と、業務影響度探索部26と、代替要素探索部27とを備え、解析依頼情報126は、少なくとも解析を依頼する旨を通知する情報と、どの探索部を用いて解析を行うかにを示す情報とを有するものとする。解析部125は、解析依頼情報126に基づいて障害影響テーブル21が記憶した情報を解析して、解析結果情報127を生成して、解析結果情報127を通知する。
図4に障害影響情報と総影響とを設定したFMEA表18の例を示す。図4の例では、故障モードごとの「影響」の項目ごとに値が設定されている。総影響以外の項目に対する値は、システム管理者が管理対象のシステムを検証して決定し、障害影響情報の有する影響度情報として管理装置11に入力するものとする。
次に、解析部125の備えるそれぞれの探索部について動作を説明する。
高影響要素探索部24は、障害が発生すると最も大きい影響を受けるシステムの構成要素を検出する。高影響要素探索部24の動作の手順を、図5を用いて説明する。
図5において、高影響要素探索部24は、キーボード等の入力装置を介して、システム管理者より解析依頼情報126を入力する(S1)。この解析依頼情報126の内容は、高影響要素探索部24を使用して探索することを指示する内容である。高影響要素探索部24は、システム管理者より解析依頼情報126を入力すると、探索対象システムの最上位層のFMEA表(図2におけるFMEA表14)を探索対象FMEA表とする(S2)。次に、探索対象FMEA表から総影響の最も大きい構成要素を選択する(S3)。探索対象FMEA表が最下位(図2におけるFMEA表29)であった場合には、探索を終了する(S4)。そうでなければ、S3で選択した構成要素を被解析系列とするFMEA表を探索対象FMEA表として(S5)、S3を行う。S4で最下位層のFMEA表であった場合には、S4の直前で実行したS3において選択した構成要素を要対策構成要素として選択して、システム管理者に報告する(S6)。S6で、高影響要素探索部24は、要対策構成要素となった構成要素とともに、その構成要素に関する障害影響情報である被解析系列と故障モードと影響にそれぞれ設定されている値を解析結果情報として、上記要対策要素とともにシステム管理者に報告してもかまわない。
高影響要素探索部24は、上記したように最上位のFMEA表から最下位のFMEA表へ順に探索を行う。
システム管理者は、図5のS1〜S6の処理によって選択された要対策構成要素を参考にして、システムや機器の2重化やバックアップ設備の手配などを行うことができる。
次に、低影響要素探索部25によって、障害が発生した場合に小さい影響を受けるシステムの構成要素を検出する手順を、図6を用いて説明する。
図6において、まず、キーボード等の入力装置を介して、システム管理者より解析依頼情報126を入力する(S11)。この解析依頼情報126の内容は、低影響要素探索部25を使用して探索することを指示する内容である。低影響要素探索部25は、システム管理者より解析依頼情報126を入力すると、探索対象システムの最上位層のFMEA表(図2におけるFMEA表14)を探索対象FMEA表とする(S12)。次に、探索対象FMEA表から総影響の最も小さい構成要素を選択する(S13)。探索対象FMEA表が最下位層(図2における29)であった場合には、探索を終了する(S14)。そうでなければ、S13で選択した構成要素を被解析系列とするFMEA表を探索対象FMEA表として(S15)、S13を行う。S14で最下位層のFMEA表であった場合には、S14の直前で実行したS13において選択した構成要素を低影響の構成要素とする解析結果情報127を、システム管理者に報告する(S16)。S16の後で、低影響要素探索部25は、低影響となった構成要素と同じ仕様を有する他の構成要素を有する被解析系列をFMEA表から検索して、低影響となった構成要素が、検索した被解析系列の冗長構成装置或いは、冗長構成機能として利用可能であることを解析結果情報127としてシステム管理者に報告しても良い。また、システム管理者が、FMEA表から低影響となった構成要素と同じ構成要素を有する他の被解析系列を検索して、低影響となった構成要素が、検索した被解析系列の冗長構成装置或いは、冗長構成機能として利用可能であることを判断しても良い。
低影響要素探索部25は、上記したように最上位のFMEA表から最下位のFMEA表へ順に探索を行う。
システム管理者は、図6のS11〜S16の処理によって選択された低影響の構成要素を他の被解析系列の冗長構成要素候補とすることによって、障害の発生に予って受ける影響度の大きな業務の予備構成要素として、システム構成を検討することができる。
上記した図5のS3と図6のS13では、総影響度が同じであるために複数の構成要素を選択する場合もある。この場合には、次の探索対象となるFMEA表は、1つに限らず複数になるが、次の複数の探索対象FMEA表より構成要素を選択する際に、それぞれの探索対象FMEA表から同じ総影響度の構成要素を選択しなければ、総影響度の小さいほうの構成要素を選択するので、構成要素は1つになる。また、それぞれの探索対象FMEA表から同じ総影響度の構成要素を選択すれば、選択する構成要素は複数になる。このように、選択する構成要素は1つとは限らない。
業務影響度探索部26と代替要素探索部27との動作を説明する前に、被管理計算機から障害の報告が行われることについて説明する。
管理装置11は、図7に示すようにシステム管理部69を備え、システム管理部69は、被管理計算機2〜4に対して定期的に情報の収集を指示する。被管理計算機2〜4はそれぞれ、図7に示すように情報収集部66を備える。情報収集部66は、管理装置11からの指示を受けて、被管理計算機2上の情報を収集する。すなわち、情報収集部66は、障害の発生と障害内容とを示す情報を収集する。情報収集部66が収集した故障の情報は、故障通知部166によって故障通知情報として管理装置11へ送信される。
管理装置11は、被管理装置の故障通知部166から送信された故障通知情報を受信する故障入力部を備える。図8に、故障入力部を備える管理装置11の解析部125を示す。図1に示した解析部125は図8のように故障入力部128を備え、故障入力部128は、ネットワーク1を介して被管理計算機の故障通知部166から故障通知情報129を受信する。この際、故障通知情報129は解析依頼情報に相当する。故障入力部128は故障通知情報129を業務影響度探索部26に通知する。また、故障入力部128は故障通知情報129を代替要素探索部27に通知する。
このように、業務影響度探索部26と代替要素探索部27とは、管理装置11が接続するシステムに障害が発生した場合にその障害による影響度を解析する。一方、高影響要素探索部24と低影響要素探索部25とは障害の発生にかかわらず、管理装置11が接続するシステムの構成要素の中から故障によって最も高い影響度を受ける構成要素と最も低い影響度を受ける構成要素とをそれぞれ探索する。
次に、業務影響度探索部26によって、障害(故障)が発生した場合の影響度を導出する手順を、図9を用いて説明する。
図9において、まず、故障入力部128が解析依頼情報として故障通知情報129を入力して、故障通知情報129を業務影響度探索部26に通知する(S21)。この際、故障通知情報129には少なくとも障害が発生しているシステムの機器を識別する情報が含まれている。業務影響度探索部26は、故障通知情報129より障害の発生した機器が被解析系列となっているFMEA表を検索し、検索したFMEA表を探索対象FMEA表とする(S22)。例えば、図2のFMEA表29の「被解析系列」に記憶されている「計算機A1」に故障が発生したものとする。このため、S22ではFMEA表29を探索対象FMEA表とする。次に、探索対象FMEA表の被解析系列を構成要素とするFMEA表を検索する(S23)。すなわち、S23では、現在探索対象となっているFMEA表29よりも上位層のFMEA表18,16,14を検索することになる。探索対象FMEA表が、最上位層(図2におけるFMEA表14)であった場合には(S24)、S24の直前で検索したFMEA表に設定されている構成要素全てについて総影響を解析結果情報127としてシステム管理者に報告する(S26)。そうでなければ、検索したFMEA表を探索対象FMEA表として(S25)、S23を行う。ここでは、「計算機A1」に障害が発生したものとして探索を開始したので、解析結果情報127として報告されるのは、FMEA表14の「支店業務機能」に関する障害影響情報である。
以上のS21〜S26によって、システム管理者は障害が発生した機器がシステム全体に及ぼす影響度を知り、影響度に対応した対策を取ることが出来る。
次に、代替要素探索部27によって、障害が発生した機器の代替機器を探索する手順を、図10を用いて説明する。
まず、故障入力部128が解析依頼情報126として故障通知情報129を入力して、故障通知情報129を代替要素探索部27に通知する(S31)。この際、故障通知情報129には少なくとも障害が発生しているシステムの機器を識別する情報が含まれている。代替要素探索部27は、故障通知情報129より障害の発生した機器と同一の仕様の機器を、仕様情報記憶部28を参照して取得する。例えば、「計算機A1」に故障が発生して、「計算機A1」と同一の仕様を有する機器を「計算機B1」とする。
同一の仕様を有する機器を取得すると、次に、その取得した機器(「計算機B1」)が「構成要素」に記憶されているFMEA表を検索し、検索したFMEA表を探索対象FMEA表とする(S32)。
S32で複数の探索対象FMEA表が検索できた場合には、それぞれの探索対象FMEA表それぞれについて以下のS33〜S35の処理を行う。また、同一仕様を有する機器を取得できなかった場合には、その旨をシステム管理者に通知して、処理を終了する。
S32の後、探索対象FMEA表の被解析系列が構成要素となっているFMEA表を探索する(S33)。上記したS32の例では「計算機B1」が「構成要素」に記憶されているFMEA表を探索対象FMEA表とした。図2には、「計算機B1」が「構成要素」に記憶されているFMEA表を図示していないが、図1のシステム構成図から「計算機B1」が「構成要素」に記憶されているFMEA表は「サブシステムC」を「被解析系列」に記憶しているFMEA表であることが予想できる。
S34では、探索対象FMEA表が最上位のFMEA表でない場合には、S33で検索したFMEA表を探索対象FMEA表として(S35)、S33を行う。
S34で、探索対象FMEA表が最上位のFMEA表であった場合、S32で取得した、障害の発生した機器「計算機A1」と同一の仕様の機器「計算機B1」を「計算機A1」の代替機器候補として解析結果情報127をシステム管理者に報告する。このとき、探索対象FMEA表の「被解析系列」の有する「総影響度」に設定されている総影響度情報も解析結果情報127としてシステム管理者に報告する。ここでは、図1により、代替機器候補「計算機B1」を下位のシステム要素に有する最上位のシステム要素(または、システム)が「支店業務機能」であることが予想できるので、「支店業務機能」に対応して設定されている「総影響度」を報告する。これは、代替機器候補「計算機B1」を「計算機A1」の代替機器として使用すると、本来「計算機B1」が行う予定であった処理が行えなくなり、そのことによって上位のシステム要素が受ける影響度をシステム管理者に報告するためである。
また、上記S32で同一の仕様を有する機器が複数取得出来る場合がある。この場合は、複数の機器についてそれぞれS32〜S35の処理を行い、S36で、それぞれの代替機器候補について最上位のシステム要素の総影響度を比較して、総影響度が一番小さいシステム要素の代替機器候補を選択して、システム管理者に報告する。
以上のS32〜S36の処理によって、システム管理者は、障害が発生した機器の代替装置として、システムに最も影響の小さい装置を選択し、障害の発生した機器と置き換えることで、影響の大きい業務システムの復旧を行うことが出来る。
この実施の形態1では、以下に記載する管理装置、及び、管理システムについて一例を説明した。
影響度データ設定部において設定された障害影響情報である影響度データを元に、システムに障害が発生した場合に、最も影響の大きな構成要素を解析する高影響要素探索部を備えたことを特徴とする。
影響度データ設定部において設定された障害影響情報である影響度データを元に、システムに障害が発生した場合に、最も影響の少ない構成要素を解析する低影響要素探索部を備えたことを特徴とする。
影響度データ設定部において設定された障害影響情報である影響度データを元に、障害の発生したシステムの構成要素から、障害の影響度を解析する業務影響度探索部を備えたことを特徴とする。
影響度データ設定部において設定された障害影響情報である影響度データを元に、障害の発生したシステムの構成要素と同等のシステム構成要素を、影響の低い業務のシステムから探索する代替要素探索部を備えたことを特徴とする。
上記した特徴を備える管理装置、管理システムは、以下の効果を奏する。
機器に発生した障害が、業務システム全体にどの程度の影響を及ぼすのかを導出し、システム管理者に報告することが出来る。
あるいは、このような、システム障害の影響を解析する管理装置や管理システムを用いることで、システム運用後に影響度の大きな構成要素を抽出し、障害が発生する前に冗長構成に構成変更するなどの対策をとることが出来る。
あるいは、冗長構成をさせる上で、影響度の低いシステムの構成要素を抽出し、影響度の低い機器をバックアップ用として確保することで、余剰設備を削減しシステム全体のコストを抑えることが出来る。
あるいは、実際にシステム障害が発生した場合、その障害が業務システム全体にどの程度の影響を及ぼすのかを導出し、システム管理者に報告する。システム管理者は影響度に応じた適切な対応を取ることにより、障害発生時の対応コストを削減することが出来る。
あるいは、障害の発生した機器と、同一仕様の機器を管理装置が管理するシステム内から検索し、検索した機器がシステムに及ぼす影響度が低い場合、一時的な代替装置として使用することで、システムの障害からの復旧を短時間かつ低コストで対応することが可能となる。
実施の形態2.
この実施の形態では、図2に示した障害影響テーブルを生成する手順を説明する。
この実施の形態では、図2に示した障害影響テーブルを生成する手順を説明する。
図11は、障害影響テーブルを生成する手順を示すフローチャート図である。
図11において、管理装置を用いて接続する業務系システムを管理するシステム管理者は、業務系システムをシステム要素に分割して、さらに分割したそれぞれのシステム要素を下位のシステム要素に分割する(S41)。この分割したシステム要素をそれぞれ下位のシステム要素に分割できなくなるまで分割する。例えば、図2の例では、企業システム12をいくつかの業務系に分割し、分割した1つが支店業務系101であるものとする。支店業務系101は、さらに、システムA102やシステムB105等のいくつかのシステム要素に分割される。さらに、システムA102やシステムB105をいくつかのシステム要素に分割すると、システムA102は、サブシステムA103とサブシステムB104とに分割される。さらに、サブシステムA103やサブシステムB104をいくつかのシステム要素に分割すると、サブシステムA103は、計算機A1と計算機A2のいくつかのシステム要素に分割される。さらに、計算機A1や計算機A2をいくつかのシステム要素に分割すると、計算機A1は、機能Aと機能Bのいくつかのシステム要素に分割される。
このように、分割を繰り返すことによって、システム要素に階層関係が生まれる。
システム管理者は、分割して階層化したシステム要素について、階層化ごとのテーブルが有する項目を決定し、決定した項目をテーブルに設定するためにデータ項目情報を影響度データ管理部20によって入力する(S42)。図2の例では、データ項目情報は「被解析系列」、「構成要素」、「故障モード」、「影響」等に相当する。データ項目情報を設定することによって、障害影響テーブル21の枠組みが出来上がる。
次に、システム管理者は、枠組みが生成された障害影響テーブルの各項目に設定する障害影響情報を影響度データ設定部22によって入力して設定する(S43)。図2の例では「被解析系列」、「構成要素」の項目には障害影響情報の構成要素情報を設定し、「故障モード」と「影響」の有する各項目(「総影響」に対する値の設定を除く)には障害影響情報の故障情報を設定する。障害影響情報を設定することによって、障害影響テーブル21に値が記憶される。
次に、システム管理者は、総影響に設定する値を計算する算出式を考えて、算出式を影響度算出設定部23より入力する。(S44)。算出式は、業務系システムごとに異なる場合がある。また、故障モードごとに異なる場合がある。算出式の一例は図3に示した。
算出式を入力すると、影響度データ設定部22は、影響度算出設定部23が入力した算出式に従い各構成要素ごとの各故障モードごとに総影響を計算して設定する(S45)。
上記したS41〜S45の手順によって障害影響テーブル21を生成する。
この実施の形態2では、以下に記載する管理装置、及び、管理システムの一例を説明した。
ネットワークに接続された複数の被管理計算機、被管理計算機を使用するシステム管理計算機から構成されて、被管理計算機に障害などが発生した場合の影響度を示す障害影響情報を記憶する影響情報テーブルと、前記障害影響情報を管理する影響度データ管理部を備えたことを特徴とする。
影響度データ管理部を用いて、業務システムの各構成要素に対して障害が発生した場合の影響を示す障害影響情報を設定する影響度データ設定部、前記影響度データ設定部によって設定された障害影響度情報を用いて、システムへの影響度を算出する影響度算出式を設定するための影響度算出設定部を備え、システムに障害が発生した場合、その影響度を解析することを特徴とする。
上記した特徴を備える管理装置、管理システムは、以下の効果を奏する。
影響度を導出するために用いる障害影響テーブルの一例であるFMEA表の枠組みを、業務システムの構成情報を元に導出して、導出した枠組みに基づいてFMEA表の有する項目を決定することが出来る。
実施の形態3.
上記した図8では、管理装置11は、接続する被管理計算機からネットワークを介して人手を介さずに故障通知情報129を入力していた。しかし、システム管理者を介して、システム管理者の判断によって故障通知情報129を管理装置11に入力するようにしてもかまわない。
上記した図8では、管理装置11は、接続する被管理計算機からネットワークを介して人手を介さずに故障通知情報129を入力していた。しかし、システム管理者を介して、システム管理者の判断によって故障通知情報129を管理装置11に入力するようにしてもかまわない。
図12は、この実施の形態の管理装置の解析部の構成を示すブロック図である。
図12において、故障入力部128は、システム管理者より故障通知情報を入力する。故障入力部128が故障通知情報を入力した後の処理は、上記実施の形態1と同じ動作を行う。
発生した故障についてシステム管理者の判断が入ることによって、影響度を調査する必要のある故障と、影響度を調査する必要のない故障とに分けることが可能となる。
実施の形態4.
この実施の形態では、被管理計算機からシステム要素を抽出し障害影響情報として利用する管理装置、管理システムの一例を説明する。
この実施の形態では、被管理計算機からシステム要素を抽出し障害影響情報として利用する管理装置、管理システムの一例を説明する。
なお、この実施の形態では、構成情報と資源情報とは同じものを指しているものとする。
図13は、システム要素を取得するための機能を備えた被管理計算機のブロック図である。図13において、被管理計算機2は、ハードウェア資源150とソフトウェア資源151とを備える。構成情報収集部49は、管理装置11から被管理計算機2の備える資源を示す資源情報を取得する資源取得指示情報を受信して、OS(オペレーティング・システム)の情報・H/W(ハードウェア)の情報153や計算機の管理コマンド152などを用いて資源情報を収集する。ハードウェア情報解析部に相当するハードウェア構成解析部50は構成情報収集部49によって収集された資源情報を解析して、被管理計算機2の備えるハードウェア資源150に関するハードウェア情報を抽出する。ソフトウェア情報解析部に相当するソフトウェア構成解析部51は、構成情報収集部49によって収集された資源情報を解析し、被管理計算機2上で動作可能であるソフトウェア資源151に関するソフトウェア情報を抽出する。ハードウェア資源150は、例えば図13に示すようにCPU(central processing unit)やメモリや内蔵する記憶装置であり、ハードウェア構成解析部50が解析して抽出するハードウェア情報は、CPUの種類や処理速度、メモリの容量や、内蔵する記憶装置の容量等である。また、ソフトウェア資源151は、例えば図13に示すようにファイルやプログラムやプログラム間の関連を示す情報等に関するものであり、ソフトウェア構成解析部51が解析して抽出するソフトウェア情報は、プログラムの名称や、ファイルの名称や、プログラムで使用するファイルの名称や、プログラム間の関係を示す情報等である。
図14は、管理装置上で資源情報を管理するための構成図である。被管理計算機3,4とはそれぞれ、図13の被管理計算機2と同様の要素を備えるものとする。資源情報送信部に相当する構成情報送付部52〜54はそれぞれ、被管理計算機2〜4に備えられ、ハードウェア構成解析部50、及び、ソフトウェア構成解析部51によって解析され抽出された資源情報を、管理装置11に送付する。資源情報受信部に相当する構成情報回収部55は、被管理計算機の構成情報送付部52によって送付された資源情報を受信して回収する。また、構成情報回収部55は、被管理計算機に対して被管理計算機の備える資源を示す資源情報を取得する指示をシステム管理者より入力して、被管理計算機の構成情報収集部49に対して送信することを行う。階層解析部に相当する連係情報解析部56は、被管理計算機から回収した被管理計算機のハードウェア資源に関する資源情報とソフトウェア資源に関する資源情報とから被管理計算機間の連係情報を導出して、上位階層の資源情報と下位階層の資源情報との対応関係を示す関係情報を生成する。この関係情報は、例えば、被管理計算機2と被管理計算機3とが図1のようにサブシステムA103とを構成する関係であることを示すものである。連係情報解析部56は、このような関係情報を影響度データ管理部20に対して通知し、影響度データ管理部20は、障害影響テーブル21に記憶するFMEA表に「被解析系列」と「構成要素」との項目を設けることを決定し、FMEA表の枠組みの一部を設定する。また、連係情報解析部56は、被管理計算機2と被管理計算機3とが図1のようにサブシステムA103とを構成する関係であることがわかると、影響度データ設定部22に対して、被管理計算機2と被管理計算機3とがサブシステムA103とを構成する関係であることを通知し、影響度データ設定部22は、図2のFMEA表18のように「被解析系列」に「サブシステムA」を設定し、「構成要素」に「計算機A1」と「計算機B1」とを設定する。
次に、被管理計算機の資源情報を取得する動作の一例を説明する。
システム管理者が、構成情報回収部55より被管理計算機の備える資源を示す資源情報を取得する資源取得指示情報を入力する。構成情報回収部55は、被管理計算機の構成情報収集部49に対して被管理計算機の資源情報を取得することを指示する資源取得指示情報を送信する。資源取得指示情報を受信した構成情報収集部49は、被管理計算機が提供するOSの情報・H/Wの情報153や計算機管理用の管理コマンド152などを用いて被管理計算機上のハードウェアやソフトウェアに関係する資源情報を収集する。使用する管理コマンドとしては、ハードウェア情報は計算機ベンダーが固有に用意しているコマンドとして、「prtconf」や「ioscan」などがある。また、Linux(登録商標)では「/proc」と呼ばれるディレクトリが用意されており、「/proc」以下のファイルを参照することでハードウェア構成情報を取得することが出来る。また、ソフトウェア情報は、「ipcs」コマンドや「netstat」コマンドにより、計算機内で使用されているプロセス間通信の接続情報を参照することが出来る。収集した資源情報を元に、ハードウェア構成解析部50で、被管理計算機が搭載しているCPU(central processing unit)、メモリ、ディスク装置などに関する情報を抽出する。これらの情報は、Linux(登録商標)などでは、「/proc/cpuinfo」,「/proc/meminfo」,「/proc/scsi/scsi」などに格納されている。
次に、ソフトウェア構成解析部51によってソフトウェアの連係情報を解析する手順を、図15を用いて説明する。
システム管理者は、被管理計算機上で動作する複数のプロセスの中から、業務に関係する任意のプロセスを選択して、これを探索対象プロセスとして、プロセスのが使用する資源を示す資源情報を取得することを指示する資源取得指示情報を構成情報回収部55より入力する。構成情報回収部55は、プロセスのが使用する資源を示す資源情報を取得することを指示する資源取得指示情報を、被管理計算機の構成情報収集部49に送信する(S57)。例えば、上記した任意のプロセスの選択は、システム仕様書等のシステム開発時のドキュメントをシステム管理者が調査して選択するものとする。
指示を受けた構成情報収集部49は、探索対象プロセスがプロセス間通信を行っていれば使用していると考えられるプロセス間通信チャネルとして、「socket」、「PIPE」、「共有メモリ」、「ファイル」の有無を管理コマンド152やOSの情報・H/Wの情報153から探索する(S58)。管理コマンド152では、コマンド「netstat」によって、「socket」によるプロセス間通信の使用状況を調べることが出来る。また、「ipcs」コマンドによって、「共有メモリ」によるプロセス間通信の使用状況を調べることが出来る。また、システム管理者が指定した探索対象プロセスのプロセスID番号を「ps」コマンドによって調べた上で、「/proc」ファイルシステム以下に存在するプロセスID番号のディレクトリからプロセスの様々な情報を取得することが可能である。例えば、「/proc/「プロセスID番号」/fd」のディレクトリの下には、現在プロセスが開いているファイルの情報が格納されており、同一のファイルや、「socket」を開いているプロセスを「/proc」以下のファイルから検索することで、探索対象プロセスと通信を行っている別のプロセスを探索することが可能である。S58の探索の結果、プロセス間通信チャネルを使用している場合には、通信先プロセスが存在していると判断する。ソフトウェア構成解析部51は、通信先プロセスが存在する場合には(S59)、通信先プロセスを特定して、通信先プロセスを連係プロセスとして覚えておくために記憶し(S60)、連係プロセスを探索対象プロセスとしてS58からの処理を行う。通信先プロセスが存在しない場合(S59)、S60にて記憶しておいた全てのプロセスを連係プロセスとして、構成情報送付部52から管理装置の構成情報回収部55に送信する(S61)。
送付された被管理計算機の構成情報は、管理装置11上の構成情報回収部55によって受信され回収される。回収された構成情報を元に、連係情報解析部56は被管理計算機間の連係を解析する。被管理計算機間連係の解析手順は、図15に示した手順と同様であるが、S58の調査対象プロセス間通信チャネルが、ネットワークを介する通信に限定される。例えば、連係情報解析部56は、被管理計算機に振り当てられた番号(IPアドレス)と、ポートと呼ばれる一意的な番号が対になった情報をOSから取得する。上記した対になった情報は、[ローカルIP,ローカルポート<−>リモートIP,リモートポート]といったセットで情報が格納されている。このように格納されているので、リモートIPを参照することで、リモート計算機を特定できる。構成情報収集部49が収集したリモート計算機の情報から、リモートポートを使用しているプロセスを調査することで、ローカル・プロセスとリモート・プロセスとの連係を調べることができる。
以上の手順によって、図2に示したサブシステムAのFMEA表18の枠組みの一部と構成要素情報との設定がされる。
この実施の形態4では、以下に記載する管理装置、及び、管理システムの一例を説明した。
被管理計算機の構成情報を収集する構成情報収集部と、収集された構成情報から被管理計算機が有するハードウェアの構成を導出するハードウェア構成解析部と、被管理計算機上で動作しているソフトウェアの構成を導出するソフトウェア構成解析部とを備えたことを特徴とする。
被管理計算機上でハードウェア構成解析部とソフトウェア構成解析部とによって得られた被管理計算機の構成情報を、システム管理計算機に送付する構成情報送部と、被管理計算機から送付された被管理計算機の構成情報を受信する構成情報回収部を備えたことを特徴とする。
被管理計算機から送付された被管理計算機の構成情報より、被管理計算機関の連係情報を解析する連係情報解析部を備えたことを特徴とする。
上記した特徴を備える管理装置、管理システムは、以下の効果を奏する。
システム構成の変更などが発生した場合、障害影響情報を全て作り直すのではなく、被管理計算機から取得した構成要素から連係情報を抽出することで、短時間、低コストで影響度データを作成することが出来る。
また、実施の形態1〜4で説明した管理装置、管理システムは、システムの構成要素の故障を仮定し、影響度探索手段をシミュレーションとして用いて、システム管理者に適切な対応が出来るか否かを評価する、システム管理者の訓練装置として利用することが出来る効果がある。
以上の実施の形態の説明において「〜部」として説明したものは、一部或いはすべてコンピュータで動作可能なプログラムにより構成することができる。これらのプログラムは、例えば、C言語により作成することができる。
また、実施の形態の説明において「〜部」として説明したものは、ROM(Read Only Memory)に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェア或いは、ハードウェア或いは、ソフトウェアとハードウェアとファームウェアとの組み合わせで実施されても構わない。
また、上記各実施の形態を実施させるプログラムは、記録媒体に記録される。記録媒体は、磁気ディスク装置、FD(Flexible Disk)、光ディスク、CD(コンパクトディスク)、MD(ミニディスク)、DVD(Digital Versatile Disk)等のその他の記録媒体による記録装置を用いても構わない。
上記プログラムは、コンピュータにロードされ、プロセッサの制御に基づいて実行される。
1 ネットワーク、2〜10 被管理計算機、11 管理装置、12 企業システム、14,16,18,29 FMEA表、20 影響度データ管理部、21 障害影響テーブル、22 影響度データ設定部、23 影響度算出設定部、24 高影響要素探索部、25 低影響要素探索部、26 業務影響度探索部、27 代替要素探索部、28 仕様情報記憶部、49 構成情報収集部、50 ハードウェア構成解析部、51 ソフトウェア構成解析部、52〜54 構成情報送付部、55 構成情報回収部、56 連係情報解析部、66〜68 情報収集部、69 システム管理部、101 支店業務系、102 システムA、103 サブシステムA、104 サブシステムB、105 システムB、106 サブシステムC、107 販売店業務系、108 システムC、109 サブシステムD、110 サブシステムE、121 障害影響情報、122 データ項目情報、123 算出式、125 解析部、126 解析依頼情報、127 解析結果情報、150 ハードウェア資源、151 ソフトウェア資源、152 管理コマンド、153 OSの情報・H/Wの情報、166〜168 故障通知部。
Claims (11)
- 所定の業務機能を実行するシステムを接続して、接続したシステムを管理する管理装置において、
上記システムは、1つ以上のシステム要素により構成され、上記システム要素はそれぞれ、階層を構成し、
上記管理装置は、
上記システム要素ごとに、自システム要素と自システム要素を構成する下位階層のシステム要素とを示す構成要素情報と、下位階層のシステム要素に発生する故障を示す故障情報と、上記故障によって上記下位階層のシステム要素が受ける影響度を示す影響度情報とを、障害影響情報として記憶し、
障害の影響度の解析依頼情報を入力して、入力した解析依頼情報に基づいて上記記憶した障害影響情報を解析して、解析結果情報を生成して通知する
ことを特徴とする管理装置。 - 上記管理装置は、
上記障害影響情報を階層ごとにそれぞれ記憶する障害影響テーブルと、
上記それぞれの障害影響テーブルの有するデータ項目情報を入力して、それぞれの障害影響テーブルの枠組みを生成する枠組み生成部と、
上記障害影響情報の影響度情報を使用して、上記構成要素情報の示す下位階層のシステム要素の受ける総影響度を算出する算出式を入力して、記憶する算出入力記憶部と、
上記障害影響情報を入力して、上記枠組み生成部によって枠組みが生成されたそれぞれの障害影響テーブルに対して入力した障害影響情報を設定するとともに、上記算出入力記憶部が記憶する算出式に従い障害影響情報の影響度情報を使用して上記下位階層のシステム要素の受ける総影響度を算出して、算出した総影響度を上記それぞれの障害影響テーブルに設定する影響情報設定部と、
上記解析依頼情報を入力して、上記解析依頼情報に基づいて上記それぞれの障害影響度テーブルが記憶する障害影響情報を解析して、上記解析結果情報を生成して通知する解析部と
を備えたことを特徴とする請求項1記載の管理装置。 - 上記解析依頼情報は、所定の障害と所定の障害により高影響を受けるシステム要素を解析することを依頼する情報であり、
上記解析部は、上記解析依頼情報に基づいて上記障害影響テーブルの最上位の階層から最下位の階層へ順に上記障害影響テーブルの総影響度の最も大きい障害影響情報を探索して、探索した障害影響情報から上記解析結果情報を生成して通知する高影響要素探索部を備えたことを特徴とする請求項2記載の管理装置。 - 上記解析依頼情報は、所定の障害と所定の障害により低影響を受けるシステム要素を解析することを依頼する情報であり、
上記解析部は、上記解析依頼情報に基づいて上記障害影響テーブルの最上位の階層から最下位の階層へ順に上記障害影響テーブルの総影響度の最も低い障害影響情報を探索して、探索した障害影響情報から上記解析結果情報を生成して通知する低影響要素探索部を備えたことを特徴とする請求項2記載の管理装置。 - 上記管理装置は、
上記システムから故障の発生したシステム要素を通知する故障通知情報を上記解析依頼情報として入力する故障入力部を備え、
上記解析部は、
上記故障入力部が入力した解析依頼情報の故障の発生したシステム要素と一致する自システム要素を記憶する障害影響テーブルを検索して、検索した障害影響テーブルから最上位の階層の障害影響テーブルへ順に解析依頼情報の故障の発生したシステム要素を下位階層のシステム要素にもつシステムを探索して、探索したシステムの障害影響情報を上記障害影響テーブルから取得して、取得した障害影響情報を基に上記解析結果情報を生成して通知するシステム影響度探索部を備えたことを特徴する請求項2記載の管理装置。 - 上記管理装置は、
上記システムから故障の発生したシステム要素を通知する故障通知情報を上記解析依頼情報として入力する故障入力部と、
上記システム要素ごとにシステム要素の仕様を示す仕様情報を記憶する仕様情報記憶部とを備え、
上記解析部は、
上記故障入力部が入力した解析依頼情報の故障の発生したシステム要素の仕様情報を上記仕様情報記憶部から取得し、取得した仕様情報と一致する仕様情報のシステム要素を代替候補要素として取得して、取得した代替候補要素のシステム要素を下位のシステム要素にもつシステムの総影響度を上記障害影響テーブルを検索して取得し、取得した総影響度と上記代替候補要素とを上記解析結果情報して通知する代替要素探索部
を備えたことを特徴とする請求項2記載の管理装置。 - 上記システム要素は、計算機であり、
上記計算機は、計算機が使用する所定の資源を備え,
上記管理装置は、上記計算機に対して、計算機の備える所定の資源を示す資源情報を取得することを指示して、上記計算機から上記資源情報を受信する資源情報受信部と、
上記資源情報受信部が受信した資源情報を解析して、資源情報が示す資源の階層関係を解析して、解析結果に基づいて上記構成要素情報を生成して、生成した構成要素情報を上記影響情報設定部へ出力する階層解析部と
を備えたことを特徴とする請求項2記載の管理装置。 - 上記計算機は、所定の業務機能を実行し、
上記管理装置は、上記資源情報を取得することを指示する場合に、上記計算機が実行する業務機能が使用する計算機の資源の資源情報を取得することを指示することを特徴とする請求項7記載の管理装置。 - 所定の業務機能を実行する計算機と、上記計算機を接続して計算機を管理する管理装置とを備える管理システムにおいて、
上記計算機は、
計算機が使用する所定の資源を備え、
上記管理装置から計算機の備える所定の資源を示す資源情報を取得することを指示する資源取得指示情報を受信して、計算機の備える資源の資源情報を収集する資源情報収集部と、
上記資源情報収集部が収集した資源情報を上記管理装置へ送信する資源情報送信部とを備え、
上記所定の資源は、他の資源と階層を構成し、
上記管理装置は、
上記計算機から上記資源情報を受信して取得する資源情報受信部と、
上記資源情報受信部が受信した資源情報を解析して、資源情報が示す資源の階層関係を解析して、上位階層の資源情報と下位階層の資源情報との対応関係を示す関係情報を生成する階層解析部とを備えた
ことを特徴とする管理システム。 - 上記所定の資源は、ハードウェア資源とソフトウェア資源とのいずれかであり、
上記計算機は、
上記資源情報収集部が収集した資源情報を入力して、入力した資源情報を解析してハードウェア資源の資源情報を取得するハードウェア情報解析部と、
上記資源情報収集部が収集した資源情報を入力して、入力した資源情報を解析してソフトウェア資源の資源情報を取得するソフトウェア情報解析部と
を備えたことを特徴とする請求項9記載の管理システム。 - 所定の業務機能を実行するシステムと、上記システムを接続して、接続したシステムを管理する管理装置とを備えた管理システムにおいて、
上記システムは、1つ以上のシステム要素により構成され、上記システム要素はそれぞれ、階層を構成し、
上記システムは、障害の発生したシステム要素を通知する故障通知情報を上記管理装置へ送信する故障通知部を備え、
上記管理装置は、
上記システム要素ごとに、自システム要素と自システム要素を構成する下位階層のシステム要素とを示す構成要素情報と、下位階層のシステム要素に発生する故障を示す故障情報と、上記故障によって上記下位階層のシステム要素が受ける影響度を示す影響度情報とを、障害影響情報として記憶する障害影響テーブルと、
上記それぞれの障害影響テーブルの有するデータ項目情報を入力して、それぞれの障害影響テーブルの枠組みを生成する枠組み生成部と、
上記障害影響情報の影響度情報を使用して、上記構成要素情報の示す下位階層のシステム要素の受ける総影響度を算出する算出式を入力して、記憶する算出入力記憶部と、
上記障害影響情報を入力して、上記枠組み生成部によって枠組みが生成されたそれぞれの障害影響テーブルに対して入力した障害影響情報を設定するとともに、上記算出入力記憶部が記憶する算出式に従い障害影響情報の影響度情報を使用して上記下位階層のシステム要素の受ける総影響度を算出して、算出した総影響度を上記それぞれの障害影響テーブルに設定する影響情報設定部と、
上記故障通知部から故障の発生したシステム要素を通知する故障通知情報を入力する故障入力部と、
上記故障入力部が入力した故障通知情報に基づいて、上記障害影響テーブルが記憶する障害影響情報を解析して、解析結果情報を生成して通知する解析部とを備えた
ことを特徴とする管理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004042741A JP2005234861A (ja) | 2004-02-19 | 2004-02-19 | 管理装置、及び、管理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004042741A JP2005234861A (ja) | 2004-02-19 | 2004-02-19 | 管理装置、及び、管理システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005234861A true JP2005234861A (ja) | 2005-09-02 |
Family
ID=35017760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004042741A Pending JP2005234861A (ja) | 2004-02-19 | 2004-02-19 | 管理装置、及び、管理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005234861A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007226526A (ja) * | 2006-02-23 | 2007-09-06 | Ns Solutions Corp | 情報処理装置、情報処理方法、プログラム及び記憶媒体 |
WO2009110111A1 (ja) * | 2008-03-04 | 2009-09-11 | 三菱電機株式会社 | サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム |
US7840517B2 (en) | 2006-12-21 | 2010-11-23 | Hitachi, Ltd. | Performance evaluating apparatus, method, and computer-readable medium |
WO2011138879A1 (ja) * | 2010-05-06 | 2011-11-10 | 株式会社日立製作所 | 情報処理システムの運用管理装置および運用管理方法 |
JP2012174232A (ja) * | 2011-02-24 | 2012-09-10 | Fujitsu Ltd | 監視装置、監視システムおよび監視方法 |
JP2018205811A (ja) * | 2017-05-30 | 2018-12-27 | 富士通株式会社 | 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置 |
CN111639872A (zh) * | 2020-06-04 | 2020-09-08 | 中国航空综合技术研究所 | 一种对民机失效模式与影响分析试验方法进行选择及验证的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11327946A (ja) * | 1998-03-02 | 1999-11-30 | Hewlett Packard Co <Hp> | インタ―ネット・サ―ビスのモデル化方法 |
JP2003208413A (ja) * | 2002-01-17 | 2003-07-25 | Fujitsu Ltd | 資産情報の一元管理を行うコンピュータシステム |
-
2004
- 2004-02-19 JP JP2004042741A patent/JP2005234861A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11327946A (ja) * | 1998-03-02 | 1999-11-30 | Hewlett Packard Co <Hp> | インタ―ネット・サ―ビスのモデル化方法 |
JP2003208413A (ja) * | 2002-01-17 | 2003-07-25 | Fujitsu Ltd | 資産情報の一元管理を行うコンピュータシステム |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007226526A (ja) * | 2006-02-23 | 2007-09-06 | Ns Solutions Corp | 情報処理装置、情報処理方法、プログラム及び記憶媒体 |
US7840517B2 (en) | 2006-12-21 | 2010-11-23 | Hitachi, Ltd. | Performance evaluating apparatus, method, and computer-readable medium |
US7953691B2 (en) | 2006-12-21 | 2011-05-31 | Hitachi, Ltd. | Performance evaluating apparatus, performance evaluating method, and program |
US8099379B2 (en) | 2006-12-21 | 2012-01-17 | Hitachi, Ltd. | Performance evaluating apparatus, performance evaluating method, and program |
WO2009110111A1 (ja) * | 2008-03-04 | 2009-09-11 | 三菱電機株式会社 | サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム |
WO2011138879A1 (ja) * | 2010-05-06 | 2011-11-10 | 株式会社日立製作所 | 情報処理システムの運用管理装置および運用管理方法 |
JP2012174232A (ja) * | 2011-02-24 | 2012-09-10 | Fujitsu Ltd | 監視装置、監視システムおよび監視方法 |
US8996924B2 (en) | 2011-02-24 | 2015-03-31 | Fujitsu Limited | Monitoring device, monitoring system and monitoring method |
JP2018205811A (ja) * | 2017-05-30 | 2018-12-27 | 富士通株式会社 | 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置 |
US10868744B2 (en) | 2017-05-30 | 2020-12-15 | Fujitsu Limited | Influence range identification method and influence range identification apparatus |
CN111639872A (zh) * | 2020-06-04 | 2020-09-08 | 中国航空综合技术研究所 | 一种对民机失效模式与影响分析试验方法进行选择及验证的方法 |
CN111639872B (zh) * | 2020-06-04 | 2023-05-30 | 中国航空综合技术研究所 | 一种对民机失效模式与影响分析试验方法进行选择及验证的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7536370B2 (en) | Inferential diagnosing engines for grid-based computing systems | |
US7191198B2 (en) | Storage operation management program and method and a storage management computer | |
JP4318643B2 (ja) | 運用管理方法、運用管理装置および運用管理プログラム | |
WO2021036229A1 (zh) | 一种变更设备业务的方法和业务变更系统 | |
US20080282321A1 (en) | System and method of managing data protection resources | |
US9411969B2 (en) | System and method of assessing data protection status of data protection resources | |
JP5691723B2 (ja) | 監視方法、情報処理装置および監視プログラム | |
KR20070047427A (ko) | 네트워크상의 장치 그룹을 모니터링하는 시스템 및 방법 | |
KR102580916B1 (ko) | 5g 분산 클라우드 시스템의 빅 데이터를 이용하여 장애를 관리하는 장치 및 방법 | |
EP3935588A1 (en) | Methods and systems for analysis of process performance | |
JP2003208413A (ja) | 資産情報の一元管理を行うコンピュータシステム | |
JP2005234861A (ja) | 管理装置、及び、管理システム | |
US20110022562A1 (en) | System and method for semantic information extraction framework for integrated systems management | |
JP2010072834A (ja) | 障害対処プログラム及び障害対処装置 | |
US9443196B1 (en) | Method and apparatus for problem analysis using a causal map | |
US20080222381A1 (en) | Storage optimization method | |
JP6070040B2 (ja) | データベースシステム、データベース装置、データベースの障害回復方法およびプログラム | |
CA2758682A1 (en) | Plant control system, data to be equalized selection apparatus, and data to be equalized selection method | |
JP2007257645A (ja) | 資産情報の一元管理を行うコンピュータシステム | |
JP3974150B2 (ja) | 資産情報の一元管理を行うコンピュータシステム | |
WO2020100634A1 (ja) | 復旧支援装置、復旧支援方法及びプログラム | |
Lundin et al. | Significant advances in Cray system architecture for diagnostics, availability, resiliency and health | |
KR101753897B1 (ko) | 연속적인 데이터 수집 및 적재 방법, 그리고 그 방법을 위한 시스템 | |
JP2018190205A (ja) | 事業者間一括サービス管理装置および事業者間一括サービス管理方法 | |
JP2005275815A (ja) | ネットワークリモート管理方法および管理サーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100518 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101005 |