JP2008234351A - Integrated operation monitoring system and program - Google Patents
Integrated operation monitoring system and program Download PDFInfo
- Publication number
- JP2008234351A JP2008234351A JP2007073492A JP2007073492A JP2008234351A JP 2008234351 A JP2008234351 A JP 2008234351A JP 2007073492 A JP2007073492 A JP 2007073492A JP 2007073492 A JP2007073492 A JP 2007073492A JP 2008234351 A JP2008234351 A JP 2008234351A
- Authority
- JP
- Japan
- Prior art keywords
- operation monitoring
- failure
- information
- integrated operation
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、統合運用監視システム及びプログラムに関し、ローカルエリアネットワーク(以下、LANとする)上に構築されたコンピュータシステムの運用管理サーバ、該サーバを含んだコンピュータシステム、運用管理のためのメッセージの抽出方法、ならびに前記運用管理サーバに実行させるプログラムに関し、特に、複数のコンピュータシステムを既製の運用管理ツールを使用し、一元的、統合的、且つ効率的に管理する統合運用監視システムを提供するものに関する。 The present invention relates to an integrated operation monitoring system and program, and relates to an operation management server of a computer system constructed on a local area network (hereinafter referred to as a LAN), a computer system including the server, and extraction of a message for operation management. The present invention relates to a method and a program to be executed by the operation management server, and particularly relates to a method for providing an integrated operation monitoring system that manages a plurality of computer systems in an integrated, integrated and efficient manner using an off-the-shelf operation management tool. .
統合運用監視システムに関する従来技術は、例えば、特許文献1ないし3に開示された従来技術がある。 Conventional techniques relating to the integrated operation monitoring system include, for example, conventional techniques disclosed in Patent Documents 1 to 3.
特許文献1に記載の従来技術は、統合運用監視コンソールに表示部分を切り出し、作業者が所望する統合運用管理を実現する統合運用監視コンソールへのインターフェースの仕様および実現する手段を提供するものである。 The prior art described in Patent Document 1 provides a specification of an interface to an integrated operation monitoring console that realizes integrated operation management desired by an operator and means for realizing it by cutting a display portion on the integrated operation monitoring console. .
また、特許文献2に記載の従来技術は、運用管理サーバ上に、運用管理端末に出力する信号を選択するための複数のフィルター機能を有し、被監視対象システムのエラーメッセージを、あらかじめ使用するフィルターの使用順序を制御することによって、発生頻度の多いメッセージは、使用順序の早いフィルターにより特定することで、監視速度を早くする手段を提供するものである。
The prior art described in
また、特許文献3に記載の従来技術は、エラーログ収集エージェントシステムにおいて、各製品のベンダが提供する製品ごとのエラー/警告/インフォメーションのメッセージの重要度とは別に、システム全体としての重要度もともに保存する(特に、段落0018、0019参照)ものであり、また、A社製品が異常終了すると連携するB社製品も障害発生するはずなのでこれらのログ情報を関係情報としてグループ化する(特に、段落0029、0030参照)ものである。
しかしながら、上述した従来の統合運用監視システムでは次のような問題がある。 However, the conventional integrated operation monitoring system described above has the following problems.
第1の問題点は、情報システムを複数のサブシステムで構成し、かつ複数の既製の運用管理ツールを使用して運用する場合、統合的、かつ均一な品質で、一元的なシステム全体の障害情報、性能情報を短時間で正確に管理できないということである。その理由は、既製運用管理ソフトウェアは、被監視対象サーバ、ストレージから、出力される障害に関するメッセージ性能に関するメッセージを、それぞれの既製ソフトウェア独自の閾値でフィルタリングして管理するため、複数の既製運用管理ソフトウェアで、システムを構成するサブシステムをそれぞれ独立して監視する場合、既製運用監視ソフトウェアに依存して性能、障害等の被監視対象機器の管理レベルにばらつきが生じるという問題が発生する。 The first problem is that when an information system is composed of a plurality of subsystems and is operated using a plurality of off-the-shelf operation management tools, the failure of the entire system is integrated with uniform quality. This means that information and performance information cannot be managed accurately in a short time. The reason is that off-the-shelf operation management software manages messages that are output from the monitored server and storage by filtering the message performance related to faults with the threshold value unique to each off-the-shelf software. Thus, when the subsystems constituting the system are monitored independently, there arises a problem that the management level of the monitored device such as performance and failure varies depending on the off-the-shelf operation monitoring software.
第2の問題点は、システム全体を統合監視する場合にコストがかかるという問題がある。その理由は、昨今の企業内コンピュータは、機能別、業務別に複数のサブシステムが構築され、複数のサブシステムで1つの業務システムを構成し、サブシステムのそれぞれが、独立して構築され、さらに異なる既製運用管理ソフトウェアで運用されるためである。また、従来の運用監視システムでは、サブシステムごとに、監視コンソールを準備し、複数の監視コンソールを監視、管理するか、新たに統合監視システムを導入する際、既存の既製運用監視ソフトを廃止し、統合運用監視システム導入の目的で、新たに共通の運用監視ソフトウェアを導入する必要が発生し、監視ソフトウェア導入コストが追加コストとして新たに発生するためである。 The second problem is that it is expensive to perform integrated monitoring of the entire system. The reason for this is that in recent enterprise computers, a plurality of subsystems are constructed by function and business, and a plurality of subsystems constitute one business system, and each subsystem is independently constructed. This is because it is operated by different off-the-shelf operation management software. In addition, the conventional operation monitoring system prepares a monitoring console for each subsystem, monitors and manages multiple monitoring consoles, or abolishes existing off-the-shelf operation monitoring software when a new integrated monitoring system is introduced. This is because it is necessary to newly introduce common operation monitoring software for the purpose of introducing the integrated operation monitoring system, and the monitoring software introduction cost is newly generated as an additional cost.
本発明は、上述した問題点を鑑みてなされたものであり、その目的とするところは、複数の既製監視ツールで管理されている複数のサブシステムのすべての被監視対象サーバ、ストレージの監視レベルをあらかじめ設定した標準的な監視レベルで均一かつ容易に実現する統合運用間システムを提供することを目的とする。 The present invention has been made in view of the above-described problems, and an object of the present invention is to monitor all monitored servers and storage monitoring levels of a plurality of subsystems managed by a plurality of off-the-shelf monitoring tools. It aims at providing the system between integrated operation which realizes uniformly and easily at the standard monitoring level set up beforehand.
上記目的を解決するための請求項1記載の発明は、コンピュータシステムの統合運用監視システムであって、サブシステム内の監視対象機器の性能情報を収集する運用監視ツールと、複数のサブシステムの前記運用監視ツールが収集した前記性能情報をまとめて記憶し、また、前記性能情報を標準化するためのテンプレートを記憶するナレッジデータベースと、前記テンプレートに基づき前記性能情報を標準化して出力する演算処理手段と、を有することを特徴とする統合運用監視システムである。 An invention according to claim 1 for solving the above object is an integrated operation monitoring system for a computer system, wherein an operation monitoring tool for collecting performance information of monitored devices in a subsystem, and the plurality of subsystems The performance information collected by the operation monitoring tool is collectively stored, a knowledge database that stores a template for standardizing the performance information, and an arithmetic processing unit that standardizes and outputs the performance information based on the template; And an integrated operation monitoring system.
請求項2記載の発明は、請求項1記載の統合運用監視システムにおいて、前記演算処理手段の標準化された前記性能情報の出力を受け取り、前記出力を管理システム技術者に提示する統合運用監視手段を有することを特徴とする。 According to a second aspect of the present invention, in the integrated operation monitoring system according to the first aspect, there is provided an integrated operation monitoring unit that receives the output of the performance information standardized by the arithmetic processing unit and presents the output to a management system engineer. It is characterized by having.
請求項3記載の発明は、請求項1又は2記載の統合運用監視システムにおいて、前記運用監視ツールは、サブシステム内の監視対象機器の障害情報も収集し、前記ナレッジデータベースは、複数のサブシステムの前記運用監視ツールが収集した障害情報を蓄積し、前記演算処理手段は、サブシステム内の監視対象機器に障害が発生した場合、前記ナレッジデータベースが蓄積した障害情報を基に、当該障害に関連して障害が発生する可能性がある機器を分析し、分析結果を出力することを特徴とする。 According to a third aspect of the present invention, in the integrated operation monitoring system according to the first or second aspect, the operation monitoring tool also collects failure information of monitored devices in the subsystem, and the knowledge database includes a plurality of subsystems. The failure information collected by the operation monitoring tool is accumulated, and when the failure occurs in the monitoring target device in the subsystem, the arithmetic processing means relates to the failure based on the failure information accumulated in the knowledge database. Then, it is characterized by analyzing a device that may cause a failure and outputting an analysis result.
請求項4記載の発明は、コンピュータシステムを統合運用監視システムとして機能させるプログラムであって、前記コンピュータシステム内のサブシステム内の運用監視サーバを、監視対象機器の性能情報を収集させる運用監視ツールとして機能させ、前記コンピュータシステムの統合運用監視サーバを、複数のサブシステムの前記運用監視ツールが収集した前記性能情報をまとめて記憶し、また、前記性能情報を標準化するためのテンプレートを記憶するナレッジデータベースと、前記テンプレートに基づき前記性能情報を標準化して出力する演算処理手段と、として機能させることを特徴とする統合運用監視プログラムである。
The invention according to
請求項5記載の発明は、請求項4記載の統合運用監視プログラムにおいて、前記コンピュータシステムの統合運用監視サーバを、前記演算手段の標準化された前記性能情報の出力を受け取り、前記出力を監視システムの技術者に提示する統合運用監視手段として機能させることを特徴とする。 According to a fifth aspect of the present invention, in the integrated operation monitoring program according to the fourth aspect, the integrated operation monitoring server of the computer system receives the output of the performance information standardized by the computing means, and the output is output from the monitoring system. It is characterized by functioning as an integrated operation monitoring means presented to engineers.
請求項6記載の発明は、請求項4又は5記載の統合運用監視プログラムにおいて、前記運用監視ツールに、サブシステム内の監視対象機器の障害情報も収集する処理と、前記ナレッジデータベースに、複数のサブシステムの前記運用監視ツールが収集した障害情報を蓄積する処理と、前記演算処理手段に、サブシステム内の監視対象機器に障害が発生した場合、前記ナレッジデータベースが蓄積した障害情報を基に、当該障害に関連して障害が発生する可能性がある機器を分析し、分析結果を出力する処理と、を実行させることを特徴とする。
The invention according to
本発明によれば、複数の既製監視ツールで管理されている複数のサブシステムのすべての被監視対象サーバ、ストレージの監視レベルをあらかじめ設定した標準的な監視レベルで均一かつ容易に実現する統合運用間システムを提供することができる。 According to the present invention, an integrated operation that uniformly and easily realizes the monitoring levels of all monitored servers and storages of a plurality of subsystems managed by a plurality of off-the-shelf monitoring tools at a standard monitoring level set in advance. Inter-system can be provided.
次に、本発明の実施の形態について図面を参照して詳細に説明する。 Next, embodiments of the present invention will be described in detail with reference to the drawings.
まず、本実施の形態の構成について説明する。図1は、複数のサブシステム群を有して構成された、本発明の実施の形態に係る4層構造のコンピュータシステムの階層型統合運用管理システムの構成を示す図である。 First, the configuration of the present embodiment will be described. FIG. 1 is a diagram showing a configuration of a hierarchical integrated operation management system of a computer system having a four-layer structure according to an embodiment of the present invention configured with a plurality of subsystem groups.
図1を参照すると、本実施形態の階層型統合運用監視システムは、オペレータ監視層1と、統合運用監視層2と、サブシステム監視層3と、HUB層4とを有する4層構造の構成である。
Referring to FIG. 1, the hierarchical integrated operation monitoring system of this embodiment has a four-layer structure including an operator monitoring layer 1, an integrated
オペレータ監視層1は、システム障害情報を運用監視オペレータへ通報する障害通報機能(この機能を以下、パトライト機能という)を有する。 The operator monitoring layer 1 has a failure notification function for reporting system failure information to the operation monitoring operator (this function is hereinafter referred to as a patrol function).
統合運用監視層2は、運用管理システム技術者により、サブシステム監視層3配下の統合システムの総合性能の監視と、統合システムで起きた障害の分析とが行われる階層である。
The integrated
サブシステム監視層3は、各々が統合システムを構成するサブシステム3a、3b、・・・を有して構成される(以下、サブシステムのどれか1つを指すときは、サブシステム3xとする)。サブシステム3xについて説明する。サブシステム3xは、サブシステム3xが属する統合システムの障害分析と性能分析をし、また、性能情報と障害情報を監視し管理する。なお、サブシステム3xの監視対象となる機器は、サーバやストレージやネットワークルータ等があり、図1に示す例では、サブシステム3aの、サーバ3aa、ストレージ3ab、ネットワーク3acである。また、サブシステム3xで動作する統合システムの障害と性能の監視/管理/分析ソフトウェアは、既製の運用管理ソフトウェアが使用できるが、監視対象機器の性能情報と障害情報を後述するHUB層4に通信出力できるものが好ましい。
The
HUB層4は、ナレッジデータベース41と、サブシステム監視層3から出力される情報を受信する運用情報収集部42と、運用情報収集部42をナレッジデータベース41の情報を用い演算処理を実行する演算処理部43と、演算処理部43の出力情報を上位オペレータ監視層1及び統合運用監視層2へ出力する管理情報出力部44とを備えて構成される。
The
ナレッジデータベース41は、各サブシステム毎に使用されている既製運用監視ソフトのメッセージを標準化するための情報、過去の障害履歴に基づくサブシステム間の障害連係情報をあらかじめテンプレートとして蓄積している。
The
運用情報収集部42は、障害情報又は性能情報をSNTP、メール形式などの種々の形式・プロトコルで送信された情報(以下、メッセージという)を受信する機能を有する。
The operation
なお、HUB層4は、単一のコンピュータにより実装してもよい。この場合は、コンピュータのハードディスク等の2次記憶装置がナレッジデータベース41として、CPU等の処理装置が運用情報収集部42、演算処理部43、管理情報出力部44として機能する。しかしながら、これに限定されるものではなく、相互に通信可能に接続された複数のコンピュータから成るコンピュータシステムによって、仮想的に実装してもよい。複数のコンピュータによって仮想化することによって、処理能力の向上という効果を奏する。また、この場合は、特に、HUB層4を「仮想HUB層4」と呼ぶ。
Note that the
上記構成の本実施形態に係る階層型統合運用管理システムは、下記の動作をする。 The hierarchical integrated operation management system according to the present embodiment having the above configuration operates as follows.
まず、サブシステム監視層3において、各サブシステム3xが、それぞれにインストールされている既製運用監視ツール(又は既製の運用管理ソフトウェア)によって、複数の被監視対象機器(例えば、サーバ3aa、ストレージ3ab)についての、性能情報と障害情報を収集する。次に、各サブシステム3xは、独立して検出・収集した障害情報と性能情報を、上位のHUB層4に出力する。
First, in the
ここで、HUB層4の動作について図2を参照すると、仮想HUB層4の運用情報収集部42は、上記のとおり障害情報又は性能情報をSNTP、メール形式などの形式で送信された情報を受信する機能を有しており、各サブシステム3xから個別に送信されたメッセージが一時収納する(メッセージ受付、ステップS1)。そして、メッセージが一時収納された後、フィルター機能により、障害情報、性能情報に分割し演算処理部43へ送信する(ステップS2、ステップS3)。
Here, referring to FIG. 2 regarding the operation of the
運用情報収集部42で使用するフィルターには、フィルター条件として、障害情報、性能情報を記録したテーブルが準備されている。運用情報収集部42は、入力メッセージをこのフィルター条件のテーブルと比較し障害情報と性能情報に切り分けた後、演算処理部43に出力する。
The filter used in the operation
演算処理層43は、障害情報が入力された場合、ナレッジデータベース41を参照し(ステップS4)、ナレッジデータベース41に格納されている過去の障害発生データと関連付ける。次に、入力された障害情報と、障害発生該当機器の性能情報と、該当機器の過去の障害発生データと、により関連して2次障害を発生する可能性のある機器、サブシステム群を自動的に抽出する(他システムへの影響度分析、ステップS5)。次に、障害情報と併せて、新たなメッセージファイルを作成する(ステップS6)。なお、このメッセージファイルは、オペレータ監視層1と統合運用監視層2において、監視オペレータや運用管理者のユーザインターフェースとなる表示画面を構成するためのデータとなる。次に、管理情報出力部44は、演算処理部43の作成したメッセージファイルを、管理情報出力部44へ出力する(ステップS7)。
When failure information is input, the
また、性能情報が入力された場合、ナレッジデータベース41を参照し(ステップS8)、あらかじめナレッジデータベース41に記録されている既製運用監視ツールの性能比較上を有するテンプレートを用いて、運用情報収集部42で収集されたデータを標準性能情報に換算する(ステップS9)。その後、上記ステップS6と同様にオペレータ監視層1と統合運用監視層2において監視オペレータや運用管理者のユーザインターフェースとなる表示画面を構成するためのデータとなるメッセージファイルを作成する(ステップS10)。次に、管理情報出力部44は、演算処理部43の作成したメッセージファイルを、管理情報出力部44へ出力する(ステップS11)。
When performance information is input, the
次に、本実施形態のナレッジデータベース41について説明する。まず、ナレッジデータベース41に格納される性能情報について説明する。図3は、ナレッジデータベース41のストレージ性能テンプレートの一例を示した図である。
Next, the
図3を参照すると、各サブシステムで使用される運用監視ツール(a)、運用監視ツール(b)では、既製運用監視ソフトウェアの特性によって、同様のストレージを監視した場合に性能情報にばらつきがある。 Referring to FIG. 3, in the operation monitoring tool (a) and the operation monitoring tool (b) used in each subsystem, performance information varies when similar storage is monitored depending on the characteristics of the ready-made operation monitoring software. .
ストレージ性能テンプレートには、あらかじめ、該当システムで既ストレージを使用した場合の標準性能値があらかじめ情報として記録されており、演算処理部43に運用情報収集部のストレージ性能情報が入力されたとき、ストレージ性能テンプレートのテーブルを比較参照することによって、標準的な性能情報に置き換えることが可能となる。
In the storage performance template, the standard performance value when the existing storage is used in the corresponding system is recorded in advance as information, and when the storage performance information of the operation information collection unit is input to the
すなわち、本実施形態のナレッジデータベース41は、例えば同一ディスクの性能測定をした場合、複数の監視ツールによって測定値が異なる実情に鑑みて、あらかじめ複数の監視ツールで同一の被監視対象ストレージを監視した場合のばらつきをモニタリングしておいたモニタリング結果(性能情報)が格納されている。そして、ナレッジデータベース41に格納されている、この性能情報を参照することによって、測定値は、全サブシステムで標準的な値に換算される。この標準的な値は、例えばシステム全体の重要度を示す指数等とは異なり、各被監視対象機器と運用監視ツールの相対値をナレッジデータベースに蓄積したものである。
In other words, the
ナレッジデータベース41には、上記性能情報だけではなく過去の障害情報も格納される。次に、ナレッジデータベース41に格納された障害情報を基に、演算処理部43が、ある障害が発生したときに別の障害が発生する可能性があることを予兆する動作について説明する。
The
ナレッジデータベース41は、過去の障害情報を格納しており、また、この過去の障害情報を基にシステム間の関連情報もナレッジとして格納している。そして、ナレッジデータベース41が、例えば、過去の障害情報を基にAシステムとBシステムが関連しているというナレッジを有する場合、演算処理部43は、仮にAシステムに障害が発生し、Bシステムに障害が発生していなかったとしても、過去の障害情報を検索し、Aシステムで障害が発生した場合、一定時間後にBシステムに障害が発生する可能性があることを予兆する。なお、演算処理部43が、障害発生の可能性があることを特定する監視対象機器は、1つに限定されることなく、複数であってもよい。
The
次に、管理情報出力部44について説明する。管理情報出力部44は、入力された信号が、障害情報であるか、性能情報であるかを識別するためのフィルター機能を有している。
Next, the management
管理情報出力部44へ入力された情報信号は、入力情報信号が性能情報であった場合、入力信号を統合運用監視層2へのみ出力し、入力情報信号が障害情報であった場合、その信号を運用監視層2へ出力するとともに、オペレータ監視層1に出力する。
The information signal input to the management
オペレータ監視層1に伝達される情報信号は、管理情報出力部44のフィルター機能によって制限されるため、オペレータ監視層の備える図示しない監視モニタに出力される運用監視情報は、システム異常時に発信される情報のみを選択的に運用管理することが可能になる。
Since the information signal transmitted to the operator monitoring layer 1 is limited by the filter function of the management
また、本情報には、予兆情報として、障害発生箇所に関連するシステム障害予知情報が付加されているため、障害の影響が拡大する前に、あらかじめオペレータはシステム全体の予兆管理を行うことができる。 In addition, since this information is added with predictive information, system failure prediction information related to the failure location, the operator can perform predictive management of the entire system in advance before the influence of the failure expands. .
また、統合運用監視層2には、入力される性能情報が、既製運用監視ソフトウェアの特性に依存しない、標準的な運用監視性能情報として提供されるため、サブシステムが増設、撤去される場合、複数の既製運用監視ソフトウェアが使用された場合であっても、標準的な閾値で、一定の障害監視、性能監視を行える統合運用監視を実現することが可能となる。
In addition, since the integrated
また、上記実施形態は、統合運用監視層2とオペレータ監視層1で、運用監視機能を分割することより、効率的な統合運用監視を実現している。
In the above embodiment, the integrated
上記本実施形態によれば、少なくとも2つ以上のサブシステムから構成されるコンピュータシステムで、かつ複数の既製運用管理ソフトウェアで管理されているコンピュータシステムにおいて、すべての被監視対象サーバ、ストレージを、あらかじめ設定した均一な運用品質で統合的に管理することができ、かつ、障害が発生したサブシステム、対象機器が、他のシステム、他の対象機器の障害を誘発する可能性をあらかじめ予兆できるシステム運用管理を実現することが可能となる。その理由は、各サブシステム管理層と、オペレーション層の間に、ナレッジデータベースを有するHUB層を採用した4層構造の統合運用監視システムを採用したことによる。 According to the present embodiment, in the computer system composed of at least two or more subsystems and managed by a plurality of off-the-shelf operation management software, all monitored servers and storages are stored in advance. System operation that can be managed in an integrated manner with the set uniform operational quality, and that the subsystem and target device in which the failure occurred can predict in advance the possibility that other systems and other target devices will fail Management can be realized. The reason is that a four-layer integrated operation monitoring system employing a HUB layer having a knowledge database is adopted between each subsystem management layer and the operation layer.
なお、本発明は上記実施形態に限定されず、本発明の技術的思想の範囲内において種々の変形が可能である。上記実施形態の構成要素のHUB層、サブシステム監視層の数は、上記実施形態に限定されず、本発明を実施するために好適な、数、場所に設定することができる。 In addition, this invention is not limited to the said embodiment, A various deformation | transformation is possible within the range of the technical idea of this invention. The number of HUB layers and subsystem monitoring layers of the constituent elements of the above embodiment is not limited to the above embodiment, and can be set to a number and a location suitable for carrying out the present invention.
例えば、複数のサブシステムを異なる複数の場所に分散設置する構成としてもよい。この場合、ナレッジデータベースに共通情報を保管しておくことで、エリアごとに、HUBシステムを構築して、標準化データを作成した後、遠隔地のシステム管理者が、リモートで監視管理する形態をとることも可能である。 For example, a configuration may be adopted in which a plurality of subsystems are installed in a plurality of different locations. In this case, by storing common information in the knowledge database, a HUB system is constructed for each area, standardized data is created, and then a remote system administrator remotely monitors and manages the data. It is also possible.
また、例えば、オペレータ監視層を異なる場所に設置する構成としてもよい(図4参照)。この場合、複数のHUB層を被監視対象機器の近くに設置することによって、統合運用監視層へ伝達する通信のトラフィックを軽減することも可能となる。 Further, for example, the operator monitoring layer may be installed at different locations (see FIG. 4). In this case, it is possible to reduce communication traffic transmitted to the integrated operation monitoring layer by installing a plurality of HUB layers near the device to be monitored.
1 オペレータ監視層
2 統合運用監視層
3 サブシステム監視層
3a,3b,3x サブシステム
4 HUB層
41 ナレッジデータベース
42 運用情報収集部
43 演算処理部
44 管理情報出力部
DESCRIPTION OF SYMBOLS 1
Claims (6)
サブシステム内の監視対象機器の性能情報を収集する運用監視ツールと、
複数のサブシステムの前記運用監視ツールが収集した前記性能情報をまとめて記憶し、また、前記性能情報を標準化するためのテンプレートを記憶するナレッジデータベースと、
前記テンプレートに基づき前記性能情報を標準化して出力する演算処理手段と、
を有することを特徴とする統合運用監視システム。 An integrated operation monitoring system for a computer system,
An operation monitoring tool that collects performance information of monitored devices in the subsystem;
A knowledge database that collectively stores the performance information collected by the operation monitoring tool of a plurality of subsystems, and that stores a template for standardizing the performance information;
Arithmetic processing means for standardizing and outputting the performance information based on the template;
An integrated operation monitoring system characterized by comprising:
前記ナレッジデータベースは、複数のサブシステムの前記運用監視ツールが収集した障害情報を蓄積し、
前記演算処理手段は、サブシステム内の監視対象機器に障害が発生した場合、前記ナレッジデータベースが蓄積した障害情報を基に、当該障害に関連して障害が発生する可能性がある機器を分析し、分析結果を出力することを特徴とする請求項1又は2記載の統合運用監視システム。 The operation monitoring tool also collects failure information of monitored devices in the subsystem,
The knowledge database stores failure information collected by the operation monitoring tool of a plurality of subsystems,
The arithmetic processing means, when a failure occurs in a monitored device in the subsystem, analyzes a device in which a failure may occur in relation to the failure based on the failure information accumulated in the knowledge database. 3. The integrated operation monitoring system according to claim 1, wherein an analysis result is output.
前記コンピュータシステム内のサブシステム内の運用監視サーバを、
監視対象機器の性能情報を収集させる運用監視ツールとして機能させ、
前記コンピュータシステムの統合運用監視サーバを、
複数のサブシステムの前記運用監視ツールが収集した前記性能情報をまとめて記憶し、また、前記性能情報を標準化するためのテンプレートを記憶するナレッジデータベースと、
前記テンプレートに基づき前記性能情報を標準化して出力する演算処理手段と、
として機能させることを特徴とする統合運用監視プログラム。 A program that allows a computer system to function as an integrated operation monitoring system,
An operation monitoring server in a subsystem in the computer system,
It functions as an operation monitoring tool that collects performance information of monitored devices,
An integrated operation monitoring server of the computer system,
A knowledge database that collectively stores the performance information collected by the operation monitoring tool of a plurality of subsystems, and that stores a template for standardizing the performance information;
Arithmetic processing means for standardizing and outputting the performance information based on the template;
Integrated operation monitoring program characterized by functioning as
前記演算手段の標準化された前記性能情報の出力を受け取り、前記出力を監視システムの技術者に提示する統合運用監視手段として機能させることを特徴とする請求項4記載の統合運用監視プログラム。 An integrated operation monitoring server of the computer system,
5. The integrated operation monitoring program according to claim 4, wherein said integrated operation monitoring program receives an output of said performance information standardized by said computing means and functions as an integrated operation monitoring means for presenting said output to a technician of a monitoring system.
前記ナレッジデータベースに、複数のサブシステムの前記運用監視ツールが収集した障害情報を蓄積する処理と、
前記演算処理手段に、サブシステム内の監視対象機器に障害が発生した場合、前記ナレッジデータベースが蓄積した障害情報を基に、当該障害に関連して障害が発生する可能性がある機器を分析し、分析結果を出力する処理と、
を実行させることを特徴とする請求項4又は5記載の統合運用監視プログラム。 Processing for collecting failure information of monitored devices in the subsystem in the operation monitoring tool;
Processing for accumulating failure information collected by the operation monitoring tool of a plurality of subsystems in the knowledge database;
When a failure occurs in a monitoring target device in a subsystem, the arithmetic processing unit analyzes a device that may cause a failure in relation to the failure based on the failure information accumulated in the knowledge database. , Processing to output the analysis results,
The integrated operation monitoring program according to claim 4 or 5, wherein the integrated operation monitoring program is executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007073492A JP2008234351A (en) | 2007-03-20 | 2007-03-20 | Integrated operation monitoring system and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007073492A JP2008234351A (en) | 2007-03-20 | 2007-03-20 | Integrated operation monitoring system and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008234351A true JP2008234351A (en) | 2008-10-02 |
Family
ID=39907045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007073492A Pending JP2008234351A (en) | 2007-03-20 | 2007-03-20 | Integrated operation monitoring system and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008234351A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011158300A1 (en) * | 2010-06-17 | 2011-12-22 | 株式会社日立製作所 | Computer system and upgrade method for same |
JP2012089040A (en) * | 2010-10-22 | 2012-05-10 | Nec Corp | Message monitoring system, message monitoring device, categorization method of message filter and program |
JP2013257915A (en) * | 2013-10-03 | 2013-12-26 | Hitachi Ltd | Management computer |
JP2014139849A (en) * | 2014-05-08 | 2014-07-31 | Hitachi Ltd | Management computer and renovation method |
WO2015029438A1 (en) | 2013-08-29 | 2015-03-05 | 三菱電機株式会社 | Integrated control device and integrated control program |
CN109947623A (en) * | 2019-03-25 | 2019-06-28 | 浪潮软件集团有限公司 | A kind of monitoring system and method shared for government data |
CN111858120A (en) * | 2020-07-20 | 2020-10-30 | 北京百度网讯科技有限公司 | Fault prediction method, device, electronic equipment and storage medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10161952A (en) * | 1996-11-27 | 1998-06-19 | Toshiba Corp | Method and system for monitoring computer fault |
JP2002032337A (en) * | 2000-07-17 | 2002-01-31 | Hitachi Electronics Service Co Ltd | Solution service support system, monitor computer, computer for monitoring center and recording medium |
JP2003006067A (en) * | 2001-06-22 | 2003-01-10 | Fujitsu Ltd | Program and device for supporting collection of management information |
JP2003242277A (en) * | 2002-02-21 | 2003-08-29 | Nec Corp | Maintenance management integrated system and maintenance management method used therein |
JP2005505859A (en) * | 2001-10-12 | 2005-02-24 | メチリンクス | Multi-platform optimization model |
-
2007
- 2007-03-20 JP JP2007073492A patent/JP2008234351A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10161952A (en) * | 1996-11-27 | 1998-06-19 | Toshiba Corp | Method and system for monitoring computer fault |
JP2002032337A (en) * | 2000-07-17 | 2002-01-31 | Hitachi Electronics Service Co Ltd | Solution service support system, monitor computer, computer for monitoring center and recording medium |
JP2003006067A (en) * | 2001-06-22 | 2003-01-10 | Fujitsu Ltd | Program and device for supporting collection of management information |
JP2005505859A (en) * | 2001-10-12 | 2005-02-24 | メチリンクス | Multi-platform optimization model |
JP2003242277A (en) * | 2002-02-21 | 2003-08-29 | Nec Corp | Maintenance management integrated system and maintenance management method used therein |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9766822B2 (en) | 2010-06-17 | 2017-09-19 | Hitachi, Ltd. | Computer system and its renewal method |
US8190789B2 (en) | 2010-06-17 | 2012-05-29 | Hitachi, Ltd. | Computer system and its renewal method |
US8438316B2 (en) | 2010-06-17 | 2013-05-07 | Hitachi, Ltd. | Computer system and its renewal method |
WO2011158300A1 (en) * | 2010-06-17 | 2011-12-22 | 株式会社日立製作所 | Computer system and upgrade method for same |
JP5385458B2 (en) * | 2010-06-17 | 2014-01-08 | 株式会社日立製作所 | Computer system and renewal method thereof |
US8799525B2 (en) | 2010-06-17 | 2014-08-05 | Hitachi, Ltd. | Computer system and its renewal method |
JP2012089040A (en) * | 2010-10-22 | 2012-05-10 | Nec Corp | Message monitoring system, message monitoring device, categorization method of message filter and program |
US9914552B2 (en) | 2013-08-29 | 2018-03-13 | Mitsubishi Electric Corporation | Integrated control device and integrated control program |
WO2015029438A1 (en) | 2013-08-29 | 2015-03-05 | 三菱電機株式会社 | Integrated control device and integrated control program |
JP2013257915A (en) * | 2013-10-03 | 2013-12-26 | Hitachi Ltd | Management computer |
JP2014139849A (en) * | 2014-05-08 | 2014-07-31 | Hitachi Ltd | Management computer and renovation method |
CN109947623A (en) * | 2019-03-25 | 2019-06-28 | 浪潮软件集团有限公司 | A kind of monitoring system and method shared for government data |
CN111858120A (en) * | 2020-07-20 | 2020-10-30 | 北京百度网讯科技有限公司 | Fault prediction method, device, electronic equipment and storage medium |
JP2021121956A (en) * | 2020-07-20 | 2021-08-26 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | Failure prediction method, device, electronic facility, storage media and program |
JP7237110B2 (en) | 2020-07-20 | 2023-03-10 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | FAILURE PREDICTION METHOD, DEVICE, ELECTRONIC EQUIPMENT, STORAGE MEDIUM, AND PROGRAM |
US11675649B2 (en) | 2020-07-20 | 2023-06-13 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Fault prediction method, apparatus and storage medium |
CN111858120B (en) * | 2020-07-20 | 2023-07-28 | 北京百度网讯科技有限公司 | Fault prediction method and device, electronic equipment and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11070439B2 (en) | Hierarchical network analysis service | |
CN107925612B (en) | Network monitoring system, network monitoring method, and computer-readable medium | |
JP2008234351A (en) | Integrated operation monitoring system and program | |
CN100549975C (en) | Computer maintenance support system and analysis server | |
JP2004164637A (en) | Method and apparatus for providing framework for baseline updating and auto-threshold processing | |
CN111522703B (en) | Method, apparatus and computer program product for monitoring access requests | |
US20090070425A1 (en) | Data processing system, method of updating a configuration file and computer program product | |
CN107544832A (en) | A kind of monitoring method, the device and system of virtual machine process | |
US20150074267A1 (en) | Network Anomaly Detection | |
CN110888786A (en) | Operation and maintenance monitoring system | |
CN116204385A (en) | Computer log monitoring method and system | |
WO2021167659A1 (en) | Systems and methods of monitoring and controlling remote assets | |
US8032792B2 (en) | Dynamic discovery algorithm | |
US9201752B2 (en) | System and method for correlating empirical data with user experience | |
CN116895046A (en) | Abnormal operation and maintenance data processing method based on virtualization | |
CN116755992A (en) | Log analysis method and system based on OpenStack cloud computing | |
US20130290224A1 (en) | System or Solution Index Fault - Assessment, Identification, Baseline, and Alarm Feature | |
JP2009245154A (en) | Computer system, method, and computer program for evaluating symptom | |
JP6317074B2 (en) | Failure notification device, failure notification program, and failure notification method | |
CN112882892B (en) | Data processing method and device, electronic equipment and storage medium | |
US9116806B2 (en) | Methods for diagnosing entities associated with software components | |
US20140165058A1 (en) | System resource management method for virtual system | |
KR20030056301A (en) | System hindrance integration management method | |
JP2019009726A (en) | Fault separating method and administrative server | |
JP4850733B2 (en) | Health check device, health check method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101124 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110308 |