JP2007011823A - 分散コンピューティング環境における管理システム - Google Patents

分散コンピューティング環境における管理システム Download PDF

Info

Publication number
JP2007011823A
JP2007011823A JP2005193284A JP2005193284A JP2007011823A JP 2007011823 A JP2007011823 A JP 2007011823A JP 2005193284 A JP2005193284 A JP 2005193284A JP 2005193284 A JP2005193284 A JP 2005193284A JP 2007011823 A JP2007011823 A JP 2007011823A
Authority
JP
Japan
Prior art keywords
information
dependency
state
computing environment
distributed computing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005193284A
Other languages
English (en)
Inventor
Hiroshi Iriguchi
洋 入口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2005193284A priority Critical patent/JP2007011823A/ja
Priority to PCT/JP2006/312312 priority patent/WO2007004417A1/ja
Publication of JP2007011823A publication Critical patent/JP2007011823A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】 分散コンピューティング環境を構築する各構成要素における依存関係に基づき不具合時の影響範囲を検出する手段を設けることにより、不具合の追跡などの作業効率を向上させた分散コンピューティング環境における管理システムを提供する。
【解決手段】 ネットワークに接続された装置群と、この中の複数の装置に分散配置されたアプリケーション群を管理する分散コンピューティング環境における管理システムにおいて、
前記装置群の中の少なくとも1つの装置が、前記装置群および前記アプリケーション群の動作状況を監視し、動作状況が変化した装置により動作が影響されるアプリケーションまたは動作状況が変化したアプリケーションにより動作が影響される装置を特定することを特徴とする分散コンピューティング環境における管理システム。
【選択図】 図1

Description

本発明は、分散コンピューティング環境における管理システムに関し、特に、ネットワーク上の機器やソフトウェアに係る運用管理の作業効率の改善に関する。
分散コンピューティング環境の概要は、ネットワーク上に複数のコンピュータが設置され、あるコンピュータ上のアプリケーションプログラムの要求に従って、異なるコンピュータ上のプログラムが処理を行い、その結果を要求があったコンピュータ上のプログラムに返すシステムである(例えば特許文献1参照。)。
特開2000−278297号公報
図3は、従来の分散コンピューティングおける管理システムの一例を説明する説明図である。
図3において、演算機器31はフィールドコントローラ,演算機器32はリモート監視用コンピュータであって、それぞれが内蔵するハードディスクやメモリなどの記憶媒体に複数のアプリケーションプログラム(以下、APという。)を有し、CPUなどの演算装置により動作する。
演算機器31にはセンサ値収集用のAP1,画像配信用のAP2,空調制御用のAP3が実装され、演算機器32には、室内状態のログなどを記録する遷移保存用AP4,室内状態表示用のAP5,画像受信用のAP6が実装される。
演算機器31には、計測機器24,25,26が接続され、計測機器24は画像センサ(カメラ),計測機器25は温度センサ,計測機器26は湿度センサであって、各APの連携動作に基づき、室内の監視や空調制御が行われる。この場合、画像配信用のAP2と画像受信用のAP6の間で、演算機器31,32,ネットワーク中継器23とネットワークを介してデータの授受が行われる。
このような従来の分散コンピューティング環境における管理システムとしては、機器やAPの運用管理は、主にネットワーク構成管理ドメイン200、アプリケーション構成管理ドメイン201といった個別のドメイン(レイヤ)ごとに行われていた。これを図4を用いて説明する。
図4は、従来の分散コンピューティング環境における管理システムに係る機器の一例を示す構成図である。
なお、図4では、機器やAPの運用管理に係る部分についてのみ記載する。また、この機器は、図3の演算機器31,32またはネットワークに接続された他の装置(図示せず)の少なくとも1つに相当する。
図3のネットワーク構成管理ドメイン200の場合、図4の構成要素情報DB16(DBはデータベース。)は、ネットワークに接続され所定のシステムを構成する機器(図3の計測機器24,25,26,演算機器31,32,ネットワーク中継器23)やAP(図3のAP1〜6)の情報を有する。具体的には、機器の情報は機器名やIPアドレスなどの機器を識別する情報、APの情報はAP名と利用ポート番号などのAPを識別する情報である。
また、構成要素情報DB16には、各構成要素の動作状態を判断するための状態変化条件を有する。この状態変化条件は、構成要素の稼動状態(直接的状態値)に対する閾値を設定し、その閾値を越えるか否かにより、構成要素が正常動作か、ダウン状態にあるか、動作はしているが警告が必要な状態にあるか等を判断する(論理的状態値)情報である。
構成情報DB41は、機器間の物理的な接続やネットワーク的な繋がりの情報や、APが動作する機器とのAPの配置関係の情報を有する。図3のシステムでは以下に例示した情報となる。
1.演算機器31とネットワーク中継器23間はEthernet(登録商標)により接続されることによる依存関係が有るという情報。
2.演算機器31とAP1,2,3間は、APが配置(実装)されることによる依存関係が有るという情報。
3.各依存関係の動作状態を判断するための状態変化条件の情報。
この状態変化条件は、構成要素の稼動状態(直接的状態値)に基づき、その構成要素に関連する依存関係の稼動状態(論理的状態値)がどう変化するかを判断するための閾値を設定し、その閾値を越えるか否かにより、依存関係が正常状態か、ダウン状態にあるか、動作はしているが警告が必要な状態にあるか等を判断するための情報である。このような情報は、例えば、各要素からの応答時間、稼働率、帯域消費に基づくものである。
構成要素状態情報DB42は、APの状態に関する情報(直接的状態値や論理的状態値)を有する。図3のシステムでは以下に例示した情報となる。
1.演算機器31は正常動作。
2.AP1はプロセス正常動作(APの簡易的動作確認)。
一方、図3で示したアプリケーション構成管理ドメイン201の場合、構成要素情報DB16は、分散コンピューティング環境を構築するAPの情報を有する。APの情報は、AP名と利用ポート番号などのAPを識別する情報である。
また、構成要素情報DB16には、各構成要素の動作状態を判断するための状態変化条件を有する。この状態変化条件は、構成要素の稼動状態(直接的状態値)に対する閾値を設定し、その閾値を越えるか否かにより、構成要素が正常動作か、ダウン状態にあるか、動作はしているが警告が必要な状態にあるか等を判断するための情報である。
構成情報DB41は、APが動作する機器とAPの配置関係の情報やAP間の通信関係の情報を有する。図3のシステムでは、以下に例示した情報となる。
1.演算機器31とAP1,2,3間は、APが配置(実装)されることによる依存関係が有るという情報。
2.AP1とAP3,AP2とAP3の間は、HTTP(HyperText Transfer Protoco)で通信することによる依存関係が有るという情報。
3.各依存関係の動作状態を判断するための状態変化条件の情報。
この状態変化条件は、構成要素の稼動状態(直接的状態値)に基づき、その構成要素に関連する稼動状態(論理的状態値)を判断するための閾値を設定し、その閾値を越えるか否かにより、構成要素が正常状態か、ダウン状態にあるか、動作はしているが警告が必要な状態にあるか等を判断するための情報である。
構成要素状態情報DB42は、機器やAPの状態(直接的状態値や論理的状態値)に関する情報を有する。図3のシステムでは、以下に例示した情報となる。
1.演算機器31は通信機能正常動作(APの動作に係る部分のみの簡易的動作確認)。
2.AP1は正常動作。
図4において、構成要素状態監視処理モジュール13は、構成要素情報により、監視すべき構成要素をリストアップすると共に、構成情報により、リストアップした構成要素の動作状態の確認先を認識し(計測器24,25,26であれば演算機器31)、それらの動作状態情報をネットワーク経由で問い合わせるか、各構成要素からの状態通知メッセージによって、動作状態を示す直接的状態値を取得する。なお、各構成要素からの直接的状態値の送信は、各構成要素に状態通知機能として、予め実装されているものである。
構成要素状態監視処理モジュール13は、取得した直接的状態値を状態把握処理モジュール40に送信すると共に、ユーザインターフェース18の直接的状態値に関する表示の更新や構成要素状態情報DB42にある各構成要素の状態値の更新を行う。
状態把握処理モジュール40は、取得した構成要素の直接的状態値と構成要素の状態変化条件、依存関係の状態変化条件に基づき、他の構成要素や依存関係の状態が変化するか判断して論理的状態値を決定し、ユーザインターフェース18の論理的状態値に関する表示の更新や構成要素状態情報DB42にある各構成要素や依存関係の論理的状態値の更新を行う。
具体的には、図3において、ネットワーク中継器23が「ダウン状態」となった場合、演算機器31,32は「通信故障状態」とし、AP1から6を「警告状態」とする。
しかし、このような従来の分散コンピューティング環境における管理システムによると、図3のアプリケーション構成管理ドメイン201での管理システムでは、AP2とAP6の間の通信がエラーと認識できるが、その原因を別のドメインにおける運用管理システムに問い合わせなければならず、不具合原因の切り分けが困難となってしまう。
また、演算機器31,32やネットワーク中継機器23などのハードウェアおよびAPの交換時に際し、影響がおよぶ範囲を作業者に示す手段がなかった。
このように、AP、演算機器、ネットワーク中継器などの多種多様の要素で構成される複雑な分散コンピューティング環境下で、システム管理を行う場合には非常に作業効率が悪くなるという問題があった。
本発明は、このような分散コンピューティング環境における管理システムが有していた問題を解決しようとするものであり、分散コンピューティング環境を構築する各構成要素における依存関係に基づき不具合時の影響範囲を検出する手段を設けることにより、不具合の追跡などの作業効率を向上させた分散コンピューティング環境における管理システムを提供することを目的とする。
本発明は次の通りの構成になった分散コンピューティング環境における管理システムである。
(1)ネットワークに接続された装置群と、この中の複数の装置に分散配置されたアプリケーション群を管理する分散コンピューティング環境における管理システムにおいて、
前記装置群の中の少なくとも1つの装置が、前記装置群および前記アプリケーション群の動作状況を監視し、動作状況が変化した装置により動作が影響されるアプリケーションまたは動作状況が変化したアプリケーションにより動作が影響される装置を特定することを特徴とする分散コンピューティング環境における管理システム。
(2)前記装置群の中の少なくとも1つの装置は、
所定の装置の動作に関連するアプリケーションおよび所定のアプリケーションの動作に関連する装置の少なくとも1つを把握するための情報を記憶した記憶手段と、
この情報に基づき前記所定の機器または前記所定のアプリケーションの動作変化が影響を及ぼす機器またはアプリケーションを特定する処理手段と、
を有することを特徴とする(1)に記載の分散コンピューティング環境における管理システム。
(3)前記記憶手段は、前記装置群の要素および前記アプリケーション群の要素を識別するための識別情報と、要素間の依存関係、この依存関係と他の要素および他の依存関係との依存関係を示す依存関係情報と、要素および依存関係の動作状態を判断するための状態変化条件とを有することを特徴とする(2)に記載の分散コンピューティング環境における管理システム。
(4)前記処理手段は、前記識別情報と、前記依存関係情報と、前記状態変化条件とに基づき、前記各要素が依存関係にある他の要素を特定すると共に、その情報を表示器に表示させることを特徴とする(3)に記載の分散コンピューティング環境における管理システム。
(5)前記各要素をグループ分けし、依存関係ある要素とグループまたは依存関係にあるグループ同士を特定することを特徴とする(3)または(4)に記載の分散コンピューティング環境における管理システム。
本発明によれば、以下のような効果がある。
請求項1から請求項4に記載の発明によれば、分散コンピューティング環境を構成する要素の故障などによる状態変化が、影響する同じ構成管理ドメインの機器だけでなく、別の構成管理ドメインであるAPの状態情報に反映されるので、影響範囲を把握することが可能となる。
請求項5に記載の発明によれば、仮想構成要素として、所望の構成要素をグループ化することにより、ある構成要素の動作変化の影響がグループに対して把握することができるので管理の効率が上がる。
本発明では、複雑な分散コンピューティング環境の構成を把握するために、従来までの管理システムに対して仮想構成情報および依存関係付加情報の2つの情報を追加すると共にその情報に基づき複数の構成管理ドメインを統合的に管理するものである。
図1は、本発明の分散コンピューティング環境における管理システムの一実施例を説明する説明図である。
図2は、本発明の分散コンピューティング環境における管理システムに係る装置の一実施例を示す構成図である。なお、この装置は、図1の演算機器21,22であっても良いし、同様にネットワークに接続され、演算機器21,22、ネットワーク中継器23と通信可能な図示しない他の機器でも良い。
図1および図2を用いて本発明を詳細に説明する。なお、図1および図2において、前出の図と同様の構成要素には同様の符号を付し、その説明は省略する。
図1において、AP1とAP3の通信の依存関係を「依存1」,AP2とAP3の通信の依存関係を「依存2」,AP2とAP6の通信の依存関係を「依存3」,AP5とAP6の通信の依存関係を「依存4」,AP4とAP5の通信の依存関係を「依存5」で示している。これらが従来例で説明したアプリケーション構成管理ドメイン201である。
なお、各APは、従来例と同様のAPとする。この場合、画像配信用のAP2と画像受信用のAP6の間で、演算機器21,22,ネットワーク中継器23とネットワークを介してデータの授受が行われる。
また、演算機器21とネットワーク中継器23のネットワークの接続関係を「依存6」,演算機器22とネットワーク中継器23のネットワークの接続関係を「依存7」,計測機器(画像センサ)24と演算機器31の通信の依存関係を「依存8」,計測機器(温度センサ)25と演算機器21の通信の依存関係を「依存9」,計測機器(湿度センサ)26と演算機器21の通信の依存関係を「依存10」で示している。これらが従来例で説明したネットワーク構成管理ドメイン200である。
なお、演算機器21はフィールドコントローラ,演算機器22はリモート監視用コンピュータである。
さらに、AP1,AP2,AP3と演算機器21のAPの配置関係をそれぞれ「依存11」,「依存12」,「依存13」,AP4,5,6と演算機器22の配置関係をそれぞれ「依存14」,「依存15」,「依存16」で示している。
加えて、「依存3」と「依存6」,ネットワーク中継器23,「依存7」の仮想依存関係をそれぞれ「依存19」,「依存17」,「依存18」で示している。
図2において、従来例と異なる点は、仮想構成情報DB12と依存関係付加情報DB11を有し、状況把握処理モジュール14が、ネットワーク構成管理ドメイン200の構成要素とアプリケーション構成管理ドメイン201の構成要素との間の依存関係を把握し、各構成要素の動作状態の変化が異なる構成管理ドメインの構成要素にどのように影響するかを判断する点である。なお、構成要素状態監視処理モジュール13は、従来例と同様の動作を行う。
このために、構成要素状態情報DB17に、従来例の情報に加え、上記の「依存1」から「依存19」で示した依存関係の論理的状態値が格納される。
さらに、構成情報DB15に、従来例の情報に加え、各構成管理ドメインの依存関係である「依存1」から「依存5」,「依存6」から「依存10」と構成情報とを対応させた情報が格納される。例えば、「依存1」は、AP1とAP3がHTTPで通信することによる依存関係である旨の情報が格納される。
仮想構成情報DB12は、仮想的な構成要素や依存関係を表す情報、間接的に物理機器に依存しているAPの依存関係を有する。例示すれば以下の5つのような情報となる。
1.AP間の依存関係が物理ネットワークに依存している依存関係を表す情報。
具体的には、図1で示す依存関係「依存3」の状態がネットワーク中継器23の稼動状態やネットワークの状態(「依存6」,「依存7」)に依存する依存関係(「依存17」,)「依存18」,「依存19」)を規定した情報である。
2.間接的に物理機器に依存しているAPの依存関係を表す情報。
具体的には、図1で示すAP2,6(画像の送受信監視)はカメラである画像センサ(計測機器24)に依存するという情報である。
3.複数の機器やAPをひとつの構成要素とみなすための仮想構成要素を表す情報。
具体的には、図1で示すカメラによる画像配信システムの運用状況をまとめて、正常状態、エラー状態等を管理するための、AP2,6をグループ化したAPのグループ情報である。
4.仮想構成要素に対する依存関係を示す情報。
具体的には、図1で示す監視画面(AP5)の“画像配信システム”アプリケーションがAP2,6のAPグループへ依存するという情報である。
5.直接通信を確立せず仲介手段(仲介用ソフトウェア)によるメッセージサービスを利用するAP間の依存関係や、ネットワーク共有メモリなどを介して関連しているAP間の依存関係を表す情報。
例えば、RDB(relational database)上のテーブルを介したデータのやり取りの関係を示すものであって、具体的には、図1で示すAP4とAP5は、図示しないRDBのテーブルのデータを互いに参照することによる依存関係を表す情報である。
ここで、上記メッセージサービスとはAP間のメッセージ(通信データ)を中継するサービスを行うプログラムであり、このサービスを利用することで、AP間では互いの接続関係を意識せずに通信をすることが可能となり、AP間の構成変更が容易になる。しかし、AP間の依存関係が不明確になる場合があるという問題があったが、本発明により依存関係を明確にすることができる。
また、上記の各情報は、予め設定した規則に基づき自動的に構築されるようにしても良いし、ユーザがコンソールなどのユーザインターフェース18を介して手動で定義するようにしても良い。
さらに、構成要素間の依存関係は、1つに限るものではなく、複数であっても良い。
加えて、仮想構成要素として、所望の構成要素をグループ化することにより、ある要素やグループの動作変化の影響を、把握することができるので管理の効率が上がる。
依存関係付加情報DB11は、依存関係の詳細情報、状態変化条件、その条件を満たしたときの変更すべき依存関係の状態値や状態変化時のアクションなどの情報を有する。
具体的には、図1で示すAP2,6間の依存関係「依存3」と演算機器22とネットワーク中継器23間のネットワークによる依存関係「依存7」との依存関係「依存18」の場合、各情報は以下のような情報となる。
依存関係の詳細情報は、例えば、「依存7」で示した物理ネットワークの直接的状態値としてダウンの有無、構成要素の応答時間、消費帯域の値などを取得する旨の定義と、「依存7」の構成を特定するための情報であるネットワーク中継器23と演算機器22や、使用されているネットワーク機器のI/Oポート番号やAPのポート番号などの情報である。
また、状態変化条件は、次のような情報である。
1.ネットワークがダウンの時に依存関係「依存3」の論理的状態値をエラー状態とする。
2.ネットワークの消費帯域80%以上の時に依存関係「依存3」の論理的状態値をエラー状態とする。
3.ネットワークの消費帯域50%〜80%の時に依存関係「依存3」の論理的状態値を警告状態とする。
状態変化時のアクションは、上記状態変化の条件を満たしたときに状態把握処理モジュール14がとるべき処理情報である。
また、これらの依存関係付加情報には、対象となる依存関係の両端の構成要素に関する情報だけでなく、他の構成要素や依存関係の情報を参照した付加情報も含まれる。
例えば、画像配信アプリ(AP6)が停止すると室内状態表示用アプリ(AP5)が影響を受けるという情報である。
状態把握処理モジュール14は、取得した構成要素の直接的状態値と構成要素の状態変化条件、構成要素と依存関係の状態変化条件に基づき、他の構成要素や他の依存関係の状態が変化するか判断して論理的状態値を決定し、ユーザインターフェース18の論理的状態値に関する表示の更新や構成要素状態情報DB17にある各構成要素や依存関係の論理的状態値の更新を行う。
また、各構成要素の状態値や各依存関係の状態値と、依存関係付加情報DB11の詳細情報と状態変化条件を用いて、各構成管理ドメインの構成要素や依存関係の動作変化が、異なる構成管理ドメインの構成要素や依存関係の状態を変化させるか判断して論理的状態値を決定し、ユーザインターフェース18の論理的状態値に関する表示の更新や構成要素状態情報DB17にある各構成要素や依存関係の論理的状態値の更新を行う。
さらに、異なる構成管理ドメインの構成要素や依存関係の動作状態が変化するとなった場合には、仮想構成情報DB12の構成情報と構成情報DB15の構成情報を参照して、影響を受ける異なる構成管理ドメインの依存関係とこれに基づく構成要素を特定する。
加えて、構成要素情報DB16の情報をもとに、特定した構成要素にイベント通知する
また、ユーザインターフェース18の論理的状態値に関する表示の更新や構成要素状態情報DB17にある各構成要素や依存関係の論理的状態値の更新を行う。
これらの情報を利用することで、状況把握処理モジュールはある構成要素の影響範囲や、ある構成要素で認識された故障原因に関する原因の絞込みを効果的に行うことが可能となる。
処理の基本動作は、構成情報DB15と仮想構成情報DB12を利用し、構成要素と依存関係を再帰的に追いつつ、依存関係付加情報DB11の情報(条件記述など)を参照して、状況把握処理を進める動作となる。
このような動作を図2におけるネットワーク中継器23の故障時の処理の流れを例にとって説明する。以下は、その処理工程の一例を示すものである。
(S1)従来例と同様に状況把握処理モジュール14は、状態情報(直接的状態値)の問い合わせにより、ネットワーク中継器23の状態変化を認識する。
(S2)状況把握処理モジュール14は、ネットワーク中継器23に依存する同じ管理ドメイン(ネットワーク構成管理ドメイン200)の構成要素である演算機器21と演算機器22を、構成情報DB15にある依存関係情報「依存6」,「依存7」をもとに選択し、それら構成要素(この場合は、演算機器21,22の通信制御部(図示せず))に対して状態変化通知を行う。具体的には、構成要素にイベント信号を送って、それを受けた構成要素は所定の処理(例えば、ネットワーク中継器23との通信を遮断するなど)を行う。
(S3)状況把握処理モジュール14は、依存関係付加情報DB11から詳細情報、状態変化条件および状態変化時のアクションを把握する。そして、ネットワーク中継器23に依存する異なるドメイン(アプリケーション構成管理ドメイン201)の依存関係(「依存3」)を仮想構成情報DB12の仮想依存関係情報(図2で示す「依存17,18,19」)をもとに選択する。
(S4)他の管理ドメイン(アプリケーション構成管理ドメイン201)への影響を考慮するために、状況把握処理モジュール14は、構成要素状態情報DB17の依存関係「依存3」の論理的状態値を変化させる。また、状態変化時のアクション(例えば、故障原因の詳細をアプリケーション構成管理ドメイン201のみを見ている管理者にマンマシンインターフェース18の表示器などを介して通知する。)が定義されていればその処理を行う。
(S5)状況把握処理モジュール14は、構成情報DB15の依存関係「依存3」から依存する構成要素(図2ではAP2,6)を認識し、それら構成要素(動作中のAP2,6)に状態変化通知(イベント送信)を行う。
なお、フィールドコントローラやコンピュータなどの演算機器は、ハードディスクやメモリなどの記憶媒体およびCPUなどの演算装置を有する。各DBは記憶媒体により構成され、これらは、特許請求の範囲の記憶手段に相当する。各モジュールは記憶媒体に格納されたソフトウェアとこれを実行するCPUなどの演算装置により構成され、これらは、特許請求の範囲の処理手段に相当する。また、各APも記憶媒体に格納されており、CPUなどの演算装置により動作する。
これにより、ネットワーク中継器23の故障による状態変化が、影響する同じ管理ドメインの機器だけでなく、別の管理ドメインであるAP(図2ではAP2,6)の状態情報に反映されるので、影響範囲を把握することが可能となる。
このように本発明によれば、従来までの管理システムに対して、仮想構成情報と依存関係付加情報とそれを利用した構成要素の影響範囲の把握処理を付加することで、管理システムに対して以下の効果を与え、管理システムによるユーザのシステム管理作業支援の効果を向上させ、ユーザの作業効率を向上させることができる。
・従来までの構成要素や直接的な依存関係だけでなく、仮想の構成要素や依存関係を柔軟に設定(定義)可能とすることで、構成の意味を正しく把握可能となり、状況把握処理が正しく行うことが可能となる。
・依存関係に関して柔軟な付加情報を設定可能にすることで、付加情報を利用した様々な状況判断処理が可能となる。
なお、本発明は、上記実施例に限定されることなく、その本質から逸脱しない範囲で更に多くの変更、変形をも含むものである。
本発明の分散コンピューティング環境における管理システムの一実施例を説明する説明図である。 本発明の分散コンピューティング環境における管理システムに係る装置の一実施例を示す構成図である。 従来の分散コンピューティングおける管理システムの一例を説明する説明図である。 従来の分散コンピューティング環境における管理システムに係る機器の一例を示す構成図である。
符号の説明
11 依存関係付加情報DB
12 仮想構成情報DB
13 構成要素状態監視処理モジュール
14 状況把握処理モジュール
15 構成情報DB
16 構成要素情報DB
17 構成要素状態情報DB
18 ユーザインターフェース
21、22 演算機器
23 ネットワーク中継器
200 ネットワーク構成管理ドメイン
201 アプリケーション構成管理ドメイン
AP1〜AP6 アプリケーションプログラム

Claims (5)

  1. ネットワークに接続された装置群と、この中の複数の装置に分散配置されたアプリケーション群を管理する分散コンピューティング環境における管理システムにおいて、
    前記装置群の中の少なくとも1つの装置が、前記装置群および前記アプリケーション群の動作状況を監視し、動作状況が変化した装置により動作が影響されるアプリケーションまたは動作状況が変化したアプリケーションにより動作が影響される装置を特定することを特徴とする分散コンピューティング環境における管理システム。
  2. 前記装置群の中の少なくとも1つの装置は、
    所定の装置の動作に関連するアプリケーションおよび所定のアプリケーションの動作に関連する装置の少なくとも1つを把握するための情報を記憶した記憶手段と、
    この情報に基づき前記所定の機器または前記所定のアプリケーションの動作変化が影響を及ぼす機器またはアプリケーションを特定する処理手段と、
    を有することを特徴とする請求項1に記載の分散コンピューティング環境における管理システム。
  3. 前記記憶手段は、前記装置群の要素および前記アプリケーション群の要素を識別するための識別情報と、要素間の依存関係、この依存関係と他の要素および他の依存関係との依存関係を示す依存関係情報と、要素および依存関係の動作状態を判断するための状態変化条件とを有することを特徴とする請求項2に記載の分散コンピューティング環境における管理システム。
  4. 前記処理手段は、前記識別情報と、前記依存関係情報と、前記状態変化条件とに基づき、前記各要素が依存関係にある他の要素を特定すると共に、その情報を表示器に表示させることを特徴とする請求項3に記載の分散コンピューティング環境における管理システム。
  5. 前記各要素をグループ分けし、依存関係にある要素とグループまたは依存関係にあるグループ同士を特定することを特徴とする請求項3または請求項4に記載の分散コンピューティング環境における管理システム。
JP2005193284A 2005-07-01 2005-07-01 分散コンピューティング環境における管理システム Pending JP2007011823A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005193284A JP2007011823A (ja) 2005-07-01 2005-07-01 分散コンピューティング環境における管理システム
PCT/JP2006/312312 WO2007004417A1 (ja) 2005-07-01 2006-06-20 分散コンピューティング環境における管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005193284A JP2007011823A (ja) 2005-07-01 2005-07-01 分散コンピューティング環境における管理システム

Publications (1)

Publication Number Publication Date
JP2007011823A true JP2007011823A (ja) 2007-01-18

Family

ID=37604290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005193284A Pending JP2007011823A (ja) 2005-07-01 2005-07-01 分散コンピューティング環境における管理システム

Country Status (2)

Country Link
JP (1) JP2007011823A (ja)
WO (1) WO2007004417A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009040876A1 (ja) * 2007-09-28 2009-04-02 Fujitsu Limited ネットワーク管理装置及びプログラム
JP2009169863A (ja) * 2008-01-18 2009-07-30 Internatl Business Mach Corp <Ibm> 構成要素を管理するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
JP2009193545A (ja) * 2008-02-18 2009-08-27 Internatl Business Mach Corp <Ibm> 複数の構成要素を管理するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
JP2010527846A (ja) * 2007-05-31 2010-08-19 エアバス オペラシオン 共有メディアに接続する航空システムの監視方法と装置
JP2011113571A (ja) * 2009-11-27 2011-06-09 Korea Electronics Telecommun 資源間の物理的/論理的な関係をマッピングする方法及び装置
JP2013537340A (ja) * 2010-09-15 2013-09-30 クアルコム,インコーポレイテッド ポータブルコンピューティングデバイスのリソースを管理するためのシステムおよび方法
US8639798B2 (en) 2008-01-21 2014-01-28 International Business Machines Corporation Managing configuration items
US8719633B2 (en) 2010-05-31 2014-05-06 Fujitsu Limited Search device, search method, and search program
WO2014083905A1 (ja) * 2012-11-27 2014-06-05 インターナショナル・ビジネス・マシーンズ・コーポレーション コンピュータ・システム中のモジュールの動作状態の表示方法
US8984337B2 (en) 2009-12-28 2015-03-17 Fujitsu Limited Apparatus and method for selecting candidate for failure component

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09128036A (ja) * 1995-11-06 1997-05-16 Yokogawa Electric Corp プラント監視装置
JPH10229396A (ja) * 1997-02-13 1998-08-25 Nippon Telegr & Teleph Corp <Ntt> サービス管理方法及びシステム
JP2000069003A (ja) * 1998-08-21 2000-03-03 Nippon Telegr & Teleph Corp <Ntt> マルチレイヤネットワーク故障影響範囲推定方法及びその装置
JP2000278297A (ja) * 1999-03-29 2000-10-06 Yokogawa Electric Corp 分散オブジェクトシステムにおける通信装置
JP2003241996A (ja) * 2002-02-19 2003-08-29 Yoshihiro Maruyama 動作依存性情報と障害情報を元にコンピュータシステムの障害予測と原因特定を行う方法及びシステム
JP2004222105A (ja) * 2003-01-17 2004-08-05 Fujitsu Ltd 仮想ネットワーク運用状況表示装置
JP2005258501A (ja) * 2004-03-09 2005-09-22 Mitsubishi Electric Corp 障害影響範囲解析システム及び障害影響範囲解析方法及びプログラム
JP2006178834A (ja) * 2004-12-24 2006-07-06 Mitsubishi Electric Corp 依存関係情報収集システム及び依存関係情報収集方法
JP2006221400A (ja) * 2005-02-10 2006-08-24 Yokogawa Electric Corp 構成管理方法及びこれを用いた管理装置
JP2006221399A (ja) * 2005-02-10 2006-08-24 Yokogawa Electric Corp 分散情報統合方法及びこれを用いたシステム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09128036A (ja) * 1995-11-06 1997-05-16 Yokogawa Electric Corp プラント監視装置
JPH10229396A (ja) * 1997-02-13 1998-08-25 Nippon Telegr & Teleph Corp <Ntt> サービス管理方法及びシステム
JP2000069003A (ja) * 1998-08-21 2000-03-03 Nippon Telegr & Teleph Corp <Ntt> マルチレイヤネットワーク故障影響範囲推定方法及びその装置
JP2000278297A (ja) * 1999-03-29 2000-10-06 Yokogawa Electric Corp 分散オブジェクトシステムにおける通信装置
JP2003241996A (ja) * 2002-02-19 2003-08-29 Yoshihiro Maruyama 動作依存性情報と障害情報を元にコンピュータシステムの障害予測と原因特定を行う方法及びシステム
JP2004222105A (ja) * 2003-01-17 2004-08-05 Fujitsu Ltd 仮想ネットワーク運用状況表示装置
JP2005258501A (ja) * 2004-03-09 2005-09-22 Mitsubishi Electric Corp 障害影響範囲解析システム及び障害影響範囲解析方法及びプログラム
JP2006178834A (ja) * 2004-12-24 2006-07-06 Mitsubishi Electric Corp 依存関係情報収集システム及び依存関係情報収集方法
JP2006221400A (ja) * 2005-02-10 2006-08-24 Yokogawa Electric Corp 構成管理方法及びこれを用いた管理装置
JP2006221399A (ja) * 2005-02-10 2006-08-24 Yokogawa Electric Corp 分散情報統合方法及びこれを用いたシステム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
水越邦明: "オブジェクト指向言語を用いたネットワーク管理ツール", 電子情報通信学会技術研究報告, vol. 93, no. 262, JPN6009013064, 7 October 1993 (1993-10-07), JP, pages 1 - 8, ISSN: 0001278887 *
細川武彦、森 信胤、虎渡昌史: "運用管理システムにおける監視対象モデルを用いた障害影響範囲分析の課題と解決策", 情報処理学会研究報告, vol. 2005, no. 33, JPN6009013063, 23 March 2005 (2005-03-23), JP, pages 277 - 282, ISSN: 0001278886 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010527846A (ja) * 2007-05-31 2010-08-19 エアバス オペラシオン 共有メディアに接続する航空システムの監視方法と装置
WO2009040876A1 (ja) * 2007-09-28 2009-04-02 Fujitsu Limited ネットワーク管理装置及びプログラム
JP2009169863A (ja) * 2008-01-18 2009-07-30 Internatl Business Mach Corp <Ibm> 構成要素を管理するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
US8639798B2 (en) 2008-01-21 2014-01-28 International Business Machines Corporation Managing configuration items
JP2009193545A (ja) * 2008-02-18 2009-08-27 Internatl Business Mach Corp <Ibm> 複数の構成要素を管理するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
JP2011113571A (ja) * 2009-11-27 2011-06-09 Korea Electronics Telecommun 資源間の物理的/論理的な関係をマッピングする方法及び装置
US8346816B2 (en) 2009-11-27 2013-01-01 Electronics And Telecommunications Research Institute Method and apparatus for physical/logical relationship mapping between resources
US8984337B2 (en) 2009-12-28 2015-03-17 Fujitsu Limited Apparatus and method for selecting candidate for failure component
US8719633B2 (en) 2010-05-31 2014-05-06 Fujitsu Limited Search device, search method, and search program
JP2013537340A (ja) * 2010-09-15 2013-09-30 クアルコム,インコーポレイテッド ポータブルコンピューティングデバイスのリソースを管理するためのシステムおよび方法
WO2014083905A1 (ja) * 2012-11-27 2014-06-05 インターナショナル・ビジネス・マシーンズ・コーポレーション コンピュータ・システム中のモジュールの動作状態の表示方法
JPWO2014083905A1 (ja) * 2012-11-27 2017-01-05 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation コンピュータ・システム中のモジュールの動作状態の表示方法
US9594658B2 (en) 2012-11-27 2017-03-14 International Business Machines Corporation Method for displaying operation states of modules included in computer system

Also Published As

Publication number Publication date
WO2007004417A1 (ja) 2007-01-11

Similar Documents

Publication Publication Date Title
JP2007011823A (ja) 分散コンピューティング環境における管理システム
US10868857B2 (en) Building management system with distributed data collection and gateway services
EP3327637B1 (en) On-demand fault reduction framework
JP4995104B2 (ja) 性能監視条件の設定・管理方法及びその方法を用いた計算機システム
US11327737B2 (en) Building management system with cloud management of gateway configurations
WO2015140842A1 (ja) システムを監視する情報処理装置及び監視方法
CN113328872A (zh) 故障修复方法、装置和存储介质
US6678729B1 (en) Method of monitoring the availability of a messaging and VOIP networking
US20050038888A1 (en) Method of and apparatus for monitoring event logs
JPWO2014002184A1 (ja) 設備管理システム、設備管理装置、設備管理方法及びプログラム
CA2865650C (en) Aircraft information management system
US20130311646A1 (en) Management method and management system
JP2010128597A (ja) 情報処理装置及び情報処理装置の運用方法
JP6922814B2 (ja) サポート装置、サポートプログラム、設定方法
CN107430391B (zh) 管理系统
US7415505B2 (en) System and method for electronic event logging
JP2010231293A (ja) 監視装置
JP2008148017A (ja) ノード検出装置及びプログラム
JP2003032764A (ja) 保守装置、メンテナンスシステムおよびメンテナンス方法
JP2017004502A (ja) 情報システムおよびアップデート方法
US10372385B2 (en) Operating management server for remotely managing plural image forming apparatuses via network, test environment construction system, and test environment construction method
JP7180207B2 (ja) 提供装置、処理システム及び通信方法
JP2007520806A (ja) システム・パフォーマンスを監視し、高度なグラフィカル・ユーザ・インターフェースを介して詳細なシステム・パフォーマンス・データを伝える方法、システム、データ処理システム及びコンピュータ・プログラム(システム管理データの多次元視覚相関のための方法)
JP2009181537A (ja) インシデント管理システム及び同管理方法並びに同管理プログラム
JP2006227718A (ja) ストレージシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090515

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100308