JP2020095536A - 運用管理システムおよび運用管理方法 - Google Patents

運用管理システムおよび運用管理方法 Download PDF

Info

Publication number
JP2020095536A
JP2020095536A JP2018233759A JP2018233759A JP2020095536A JP 2020095536 A JP2020095536 A JP 2020095536A JP 2018233759 A JP2018233759 A JP 2018233759A JP 2018233759 A JP2018233759 A JP 2018233759A JP 2020095536 A JP2020095536 A JP 2020095536A
Authority
JP
Japan
Prior art keywords
message
management table
message management
information
maintenance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018233759A
Other languages
English (en)
Inventor
圭介 田淵
Keisuke Tabuchi
圭介 田淵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018233759A priority Critical patent/JP2020095536A/ja
Publication of JP2020095536A publication Critical patent/JP2020095536A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】システムの運用監視において、障害発生時に、その原因の究明を容易にし、即時対応が可能となるよう運用者に具体的な対応方法を提供する。【解決手段】統合運用管理サーバは、運用者から選択された対応メッセージ管理テーブルに格納されたメッセージに対して、保守メッセージ管理テーブルの情報を検索する依頼を受付ける。選択された対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードの情報との一致率を算出して、一致率の高い順に保守メッセージ管理テーブルのレコードの情報を表示する表示情報を、検索結果情報として作成する。運用クライアント端末は、その検索結果情報を表示する。保守メッセージ管理テーブルのレコードの表示は、保守情報として、メッセージの原因、対応方法、メッセージ区分、過去のメッセージの類似度を表す総得点を含める。【選択図】図9A

Description

本発明は、運用管理システムおよび運用管理方法に係り、複数のシステム運用環境が出力する障害などのメッセージから原因を究明し、システム運用者が適切な対策を採用するのを支援するのに好適な運用管理システムおよび運用管理方法に関する。
従来より、情報通信サービスを提供する機器の運用管理を支援する運用管理システムが知られている。このような運用管理システムでは、障害の内容や障害対処として行った操作を操作履歴に残して活用するのが一般的な技法とされている。
複数の環境でノウハウを共有可能とし、効率的に監視運用を行う技術としては、例えば、特許文献1がある。
特許文献1に記載された統合監視運用システムは、運用状況に関する情報を含む現象から運用の常態を学習し、当該学習から障害の原因を決定した障害区分を示す教師データを作成して、記憶装置ら記憶する。そして、新たな障害が発生した場合、障害情報に対応して所得したデータと、教師データから、新たな障害に対する障害区分を判定して障害原因を決定する。
特開2017−207894号公報
データセンタの計算機システムの運用では、監視システムにより検知した障害の情報を管理している。しかしながら、システムごとに運用基盤が異なっており、かつ、その運用も属人的な運用になっているケースも多く、データセンタとしてはシステムの監視・運用の集約が課題となっている。
上記特許文献1では、複数の環境間でノウハウを共有し新たな障害発生時に、パフォーマンス情報やログ情報を収集し障害区分を判定、障害原因を決定するという効果はあるが、具体的な対応手順を出力し、運用者や保守者に提示することについては考慮されていない。
本発明の目的は、複数の環境で運用ノウハウを共有可能とし、障害発生時に、その原因の究明を容易にし、即時対応が可能となるよう運用者に具体的な対応方法を教示することができる運用管理システムおよび運用管理方法を提供することにある。
本発明の運用管理システムの構成は、好ましくは、各々のシステム運用環境における運用監視システムから出力されるメッセージを受信して、そのメッセージを表示する運用管理システムであって、統合運用管理サーバと運用クライアント端末とを備え、統合運用管理サーバは、運用監視システムから出力されるメッセージを格納する対応メッセージ管理テーブルと、過去の運用監視システムから出力されたメッセージに関する情報を格納する保守メッセージ管理テーブルとを有し、統合運用管理サーバは、運用クライアント端末から選択された対応メッセージ管理テーブルに格納されたメッセージに対して、保守メッセージ管理テーブルの情報を検索する依頼を受付け統合運用管理サーバは、選択された対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードの情報との一致率を算出して、一致率の高い順に保守メッセージ管理テーブルのレコードの情報を表示する表示情報を、検索結果情報として作成して、運用クライアント端末に送信し、運用クライアント端末は、検索結果情報を表示するようにしたものである。
本発明によれば、複数の環境で運用ノウハウを共有可能とし、障害発生時に、その原因の究明を容易にし、即時対応が可能となるよう運用者に具体的な対応方法を教示することができる運用管理システムおよび運用管理方法を提供することができる。
運用管理システムと各部の機能構成を示す構成図である。 統合運用管理サーバのハードウェア・ソフトウェア構成図である。 対応メッセージ管理テーブルの一例を示す図である。 保守メッセージ管理テーブルの一例を示す図である。 運用管理システムのメッセージ処理に関する運用の一例を示すフローチャートである。 総得点算出処理の一例を示すフローチャートである。 項目ポイント算出ルールと総得点算出ルールを示す図である。 対応メッセージ管理画面の一例を示す図である。 メッセージ検索画面(検索結果表示)の一例を示す図である。 メッセージ検索画面(詳細表示)の一例を示す図である。 メッセージ対応画面の一例を示す図である。 保守メッセージ管理画面の一例を示す図である。
以下、図1ないし図11を用いて本発明に係る運用管理システムについて説明する。
先ず、図1ないし図2を用いて運用管理システムの構成について説明する。
運用管理システムは、各システム運用環境10(システム運用環境A:10a、システム運用環境B:10b、システム運用環境C:10c…)、統合運用管理サーバ100、運用クライアント端末200からなる。
システム運用環境10は、それぞれのシステムにおいて、運用を監視する運用監視システム20(運用監視システムA:20a、運用監視システムB:20b、運用監視システムC:20c…)を有している。
そして、システム運用環境10の運用監視システム20と統合運用管理サーバ100は、ネットワーク5により、統合運用管理サーバ100と運用クライアント端末200は、ネットワーク7により、それぞれ相互に接続されている。
ここで、ネットワーク5、ネットワーク7は、構内網であるLAN(Local Area Network)であってもよいし、インターネットなどのグローバルなネットワークであってもよい。また、運用クライアント端末200の表示機能は、統合運用管理サーバ100に接続された表示装置が行うようにしてもよい。
統合運用管理サーバ100は、運用監視システム20からネットワーク5経由で送信されてくるシステムのメッセージ(以下、単に「メッセージ」ともいう)を格納し、管理するサーバである。運用クライアント端末200は、システム運用者、システム監視者、システム保守者(以下、単に「運用者」という)が、統合運用管理サーバに格納されたメッセージに関する情報にアクセスし、その情報を表示したり、必要なコマンドやデータを入力するための端末である。
統合運用管理サーバ100は、機能構成として、メッセージ受信部101、メッセージ取込判定部102、メッセージ集約・取込部103、メッセージ更新部104、ポイント付与部106、一致率算出部107、総得点算出部108、表示情報作成部109、入出力部110、端末I/F(InterFace)部111、記憶部120からなる。
メッセージ受信部101は、運用環境システム203からメッセージを受信する機能部である。メッセージ取込判定部102は、受信したメッセージを対応メッセージ管理テーブル121に取り込むか否かを判定する機能部である。メッセージ集約・取込部103は、各システム環境から受信したメッセージを集約して、対応メッセージ管理テーブル121に取り込む機能部である。保守メッセージ更新部104は、対応メッセージ管理テーブル121に格納されているメッセージを取り込んで、保守メッセージ管理テーブル122を更新する機能部である。ポイント付与部106は、項目ポイント付与処理(詳細は、後述)を行う機能部である。一致率算出部107は、一致率算出処理(詳細は、後述)を行う機能部である。総得点算出部108は、総得点算出処理(詳細は、後述)を行う機能部である。表示情報作成部109は、運用クライアント端末200に表示させる情報を作成する機能部である。入出力部110は、統合運用管理サーバ100にデータやコマンドを入出力させる機能部である。端末I/F(InterFace)部111は、運用クライアント端末200との接続インタフェースを司る機能部である。記憶部120は、統合運用管理サーバ100に必要な情報を格納する機能部である。
記憶部120には、対応メッセージ管理テーブル121、保守メッセージ管理テーブル122が格納されている。なお、各々のテーブルは、後に詳述する。
運用クライアント端末200は、運用者が必要なコマンドを入力したり、システムのメッセージに関する情報を表示させる端末である。
運用クライアント端末200は、表示部201、入出力部202、サーバI/F部203からなる。
表示部201は、ディスプレイなどにメッセージやシステム運用に関する情報などを表示する機能部である。入出力部202は、運用クライアント端末200データやコマンドを入出力させる機能部である。サーバI/F部203は、統合運用管理サーバ100との接続インタフェースを司る機能部である。
次に、図2を用いて統合運用管理サーバ100のハードウェア構成・ソフトウェア構成について説明する。
統合運用管理サーバ100のハードウェア構成としては、例えば、図2に示されるサーバ装置のような一般的な情報処理装置で実現される。
統合運用管理サーバ100は、CPU(Central Processing Unit)302、主記憶装置304、ネットワークI/F306、表示I/F308、入出力I/F310、補助記憶I/F312が、バスにより結合された形態になっている。
CPU302は、統合運用管理サーバ100の各部を制御し、主記憶装置304に必要なプログラムをロードして実行する。
主記憶装置304は、通常、RAMなどの揮発メモリで構成され、CPU302が実行するプログラム、参照するデータが記憶される。
ネットワークI/F306は、各運用監視システム20とネットワーク5により、運用クライアント端末200とネットワーク7により、それぞれ接続するためのインタフェースである。
表示I/F308は、LCD(Liquid Crystal Display)などの表示装置320を接続するためのインタフェースである。
入出力I/F310は、入出力装置を接続するためのインタフェースである。図2の例では、キーボード330とポインティングデバイスのマウス332が接続されている。
補助記憶I/F312は、HDD(Hard Disk Drive)250やSSD(Solid State Drive)などの補助記憶装置を接続するためのインタフェースである。
HDD350は、大容量の記憶容量を有しており、本実施形態を実行するためのプログラムが格納されている。統合運用管理サーバ100には、メッセージ受信プログラム401、メッセージ取込判定プログラム402、メッセージ集約プログラム403、メッセージ更新プログラム404、ポイント付与プログラム406、一致率算出プログラム407、総得点算出プログラム408、表示情報作成プログラム409、入出力プログラム410、端末I/Fプログラム411がインストールされている。
メッセージ受信プログラム401、メッセージ取込判定プログラム402、メッセージ集約プログラム403、メッセージ更新プログラム404、ポイント付与プログラム406、一致率算出プログラム407、総得点算出プログラム408、表示情報作成プログラム409、入出力プログラム410、端末I/Fプログラム411は、それぞれ、メッセージ受信部101、メッセージ取込判定部102、メッセージ集約部103、メッセージ更新部104、ポイント付与部106、一致率算出部107、総得点算出部108、表示情報作成部109、入出力部110、端末I/F部111の機能を実行するプログラムである。
次に、図3および図4を用いて運用管理システムで使用されるデータ構造について説明する。
対応メッセージ管理テーブル121は、各システム運用環境10から受信し、運用者が対応をとる必要があるメッセージを格納するためのテーブルであり、図3に示されるように、メッセージID121a、システム名121b、メッセージ内容121c、緊急度121d、ホスト名121e、IP121f、発生時刻121gの各フィールドからなる。
メッセージID121aは、メッセージを識別するための一意的な識別子を格納するフィールドである。システム名121bは各運用監視システムの名称を格納するフィールドである。メッセージ内容121cは、メッセージの具体的な内容を格納するフィールドである。緊急度121dは、そのメッセージの緊急性を表す情報格納するフィールドである。例えば、単なる情報の提示(I:Information)、警告(W:Warning)、重大(S:Serious)、致命的(F:Fatal)などにレベル分けすることができる。ホスト名121eは、ホストのコンピュータ名を格納するフィールドである。IP121fは、ホストのIP(Internet Protocol)アドレスを格納するフィールドである。発生時刻121gは、メッセージが発生した時刻をyyyymmddhhmmの形式で表した文字列を格納するフィールドである。
以下では、対応メッセージ管理テーブル121の各レコードのことを、対応メッセージということにする。
なお、本実施形態では、メッセージIDは、各運用監視システム内で一意的であるとする。したがって、メッセージID121aに格納されるメッセージと、システム名121bに格納されるシステム名の組み合わせによって、メッセージが一意的に格納されることに留意する。
保守メッセージ管理テーブル122は、システムの保守のために、運用者が各運用監視システム100から受信したメッセージに対して、対応を検討するために参照されるテーブルであり、図4に示されるように、メッセージID122a、システム名122b、メッセージ内容122c、緊急度122d、ホスト名122e、IP122f、メッセージ区分122h、原因122i、対応方法122j、総得点122kの各フィールドからなる。
メッセージID122a〜発生時刻122gの内容は、それぞれ対応メッセージ管理テーブル121のメッセージID121a〜発生時刻121gの内容と同様である。保守メッセージ管理テーブル122は、それに加えて、メッセージ区分122h、原因122i、対応方法122j、総得点122kの各フィールドを有する。
メッセージ区分122hは、運用者がメッセージに対して、障害箇所を特定した情報を格納するフィールドである。例えば、1:サーバ、2:ストレージ、3:ネットワーク、4:アプリケーションソフトウェアなどに区分することができる。原因122iは、運用者がそのメッセージの原因を推定または特定した記述を格納するフィールドである。対応方法122jは、運用者がそのメッセージに対する対応方法を記述した情報を格納するフィールドである。総得点122kは、そのメッセージの有用度を示す総得点を格納するフィールドである。総得点の意義と具体的な算出方法は、後に詳述する。
本実施形態の運用管理システムは、対応メッセージ管理テーブル121の各レコードを、保守メッセージ管理テーブル122に取込み、システム技術者、運用者の運用ノウハウに関する情報を負荷して蓄積し、その有効活用を目指すものである。
次に、図5ないし図11を用いて運用管理システムで行われる処理について説明する。
先ず、図5を用いて運用管理システムのメッセージ処理に関する運用の一例について説明する。
統合運用管理サーバ100のメッセージ受信部101は、各システム運用環境10の運用監視システム20からメッセージを受信する(S01)。
次に、統合運用管理サーバ100のメッセージ取込判定部102は、受信したメッセージの緊急度を判定し、該当するメッセージに対して、メッセージ集約・取込部103が取り込んで、対応メッセージ管理テーブル121に格納する(S02)。ここで、メッセージ取込判定部102は、例えば、メッセージの緊急度が、単なる情報の提示(I)のときには、メッセージの取込みを行わず、警告(W)、重大(S)、致命的(F)のときには、メッセージの取込みを行うようにする。また、重大(S)、致命的(F)のときにのみメッセージの取込みを行うようするなど、システムの運用に応じて、定めることができる。
次に、運用者は、運用クライアント端末200を操作し、それに応じて、運用クライアント端末200の表示部201は、対応メッセージ管理画面を表示する(S03)。対応メッセージ管理画面の具体的なユーザインタフェースは、後に、図8を用いて詳説する。
運用者は、対応メッセージ管理画面を表示し、それに対応メッセージが表示されるので、コマンドの対象とする対応メッセージを選択し(以下、選択された対応メッセージを「対象メッセージ」という)、検索を指示する(S04)。
統合運用管理サーバ100は、検索の指示を受け、一致率算出部107は、対象メッセージに関連する保守メッセージ管理テーブルのレコードを検索して、一致率を算出する(S05)。
一致率は、以下のように算出する。
先ず、対応メッセージ管理テーブル121の対象メッセージのレコードのメッセージID121aと、システム名121bと、保守メッセージ管理テーブル122のレコードのメッセージID122aと、システム名122bが全て一致するときの一致率を、100%とする。
そうでないレコードに対しては、以下の(式1)により、一致率を算出する。
Figure 2020095536
統合運用管理サーバ100の表示情報作成部109は、一致率に関して降順に、すなわち、一致率が高いものが上になるように、保守メッセージ管理テーブル122のレコードの情報を表示する表示情報を作成し、運用クライアント端末200に送信し、運用クライアント端末200の表示部201は、検索結果をメッセージ検索画面500に表示する(S06)。なお、このメッセージ検索画面500の検索結果の具体例についても、後に、図9Aを用いて詳細に説明する。
運用者は、メッセージ検索画面500の検索結果を見て、対象メッセージに関して、原因、対応方法、メッセージ区分などを思考する。
そして、結論に至った場合に、運用者は、運用クライアント端末200を操作し、それに応じて、運用クライアント端末200の表示部201は、メッセージ対応画面を表示する(S07)。運用者は、そのメッセージ対応画面を操作し、対象メッセージに関して、原因、対応方法、メッセージ区分を入力する(S08)。
統合運用管理サーバ100の総得点算出部108は、対象メッセージと各々の保守メッセージ管理テーブル122のレコードにおける総得点を算出する(S09)。総得点を算出する処理については、後に、図6を用いて詳細に説明する。
最後に、前ステップS09で算出されたT(後述)を総得点とし、入力された原因、対応方法、メッセージ区分の情報を加えた対象メッセージの情報を保守メッセージ管理テーブル122に新たなレコードとして格納する(S10)。
次に、図6を用いて総得点算出処理の詳細について説明する。
これは、図5のS08に該当する処理である。
先ず、T(総得点を表す変数)を、0に初期化する。
次に、統合運用管理サーバ100の総得点算出部108は、未処理の保守メッセージ管理テーブル122のレコードがあるか否かを判定し(S101)、未処理の保守メッセージ管理テーブル122のレコードがあるときには(S101:YES)、S102に進み、未処理の保守メッセージ管理テーブル122のレコードがないときには(S101:NO)、処理を終了する。
次に、総得点算出部108は、未処理の保守メッセージ管理テーブル122のレコードを選択し(S102)、既に述べたアルゴリズムにより、選択された保守メッセージ管理テーブル122のレコードと対象メッセージとの一致率を算出する(S103)。
次に、図7のルールに従い選択された保守メッセージ管理テーブル122のレコードと対象メッセージと項目ポイントを算出する(S104)。
次に、図7のルールに従い、一致率と項目ポイントにより、選択された保守メッセージ管理テーブル122のレコードと対象メッセージとの総得点を算出し、それをΔTとする(S105)。
次に、T←T+ΔTとする(S106)。
次に、選択された保守メッセージ管理テーブル122のレコードの総得点122kのフィールドに、ΔTを足し込み(S106)、S101に戻る。
次に、図8ないし図11を用いて運用管理システムが運用者に提供するユーザインタフェースについて説明する。
対応メッセージ管理画面400は、運用管理システムのメッセージ管理ユーティリティの初期画面(図示せず)か、特定のコマンドを入力することにより開かれ、各システム運用環境10の運用監視システム20から受信して、運用者が対応をとる必要があるメッセージを表示し、それに対して処理の指示を与えるための画面であり、図8に示されるように、対応メッセージ表示欄410とコマンドボタン欄420からなる。
対応メッセージ表示欄410は、対応メッセージ管理テーブル121の情報を表示する欄である。コマンドボタン欄420は、運用者が運用管理システムに指示を与えるためのボタンを表示する欄である。
対応メッセージ表示欄410は、選択チェックボックス411、メッセージ情報表示領域412を有する。選択チェックボックス411は、選択することにより、そのメッセージをコマンドの対象とするための入力オブジェクトである。メッセージ情報表示領域412は、対応メッセージ管理テーブル121の情報を表示する領域である。
コマンドボタン欄420には、検索ボタン421、編集ボタン422、対応ボタン423、OKボタン424、キャンセルボタン425が配されている。
検索ボタン421は、選択チェックボックス411により選択された対応メッセージを対象として、図9Aに示すメッセージ検索画面を開いて検索結果を表示するボタンである。編集ボタン422は、図には示さなかったが、選択チェックボックス411により選択された対応メッセージを編集するエディタ画面を表示するボタンである。対応ボタン423は、選択チェックボックス411により選択された対応メッセージを対象として、図10に示されたメッセージ対応画面を開くボタンである。OKボタン424は、編集結果を格納して、この対応メッセージ管理画面400を閉じる画面である。キャンセルボタン425は、編集結果をキャンセルして、この対応メッセージ管理画面400を閉じる画面である。
メッセージ検索画面500は、対応メッセージ管理画面400の検索ボタン421から開かれ、選択された対応メッセージ(対象メッセージ)を対象として、保守メッセージ管理テーブル122の情報を検索した結果を表示する画面であり、図9Aに示されるように、対象メッセージ表示欄510と検索結果表示欄520とコマンドボタン欄530からなる。
対象メッセージ表示欄510は、選択された対応メッセージの情報を表示する欄である。
検索結果表示欄520は、対象メッセージに対して、保守メッセージ管理テーブル122の情報を検索した結果を表示する欄である。検索結果表示欄520は、選択チェックボックス521、メッセージ情報表示領域522を有する。選択チェックボックス510は、選択することにより、その保守メッセージ管理テーブル122のレコードをコマンドの対象とするための入力オブジェクトである。メッセージ情報表示領域512は、保守メッセージ管理テーブル122のレコードの情報を表示する領域である。
コマンドボタン欄530は、運用者が運用管理システムに指示を与えるためのボタンを表示する欄である。
検索結果表示欄520には、保守メッセージ管理テーブル122のレコードが一つの行として表示される。表示の順番は、対象メッセージと一致度が高いものが上に表示される。特に、検索結果表示欄520には、保守メッセージ管理テーブル122の総得点122jの情報も表示される。これにより、運用者は、選択した対象メッセージと一致度が高い保守メッセージ管理テーブル122のレコードから調べることができ、総得点も参考にして、どの情報が問題解決のために役に立つかの方針を立てることができる。ここで、総得点は、保守メッセージ管理テーブル122のレコードが、どの程度、受信したメッセージと類似性があったかを指標を示すという意義を有する。また、保守メッセージ管理テーブル122のレコードの原因122i、対応方法122j、メッセージ区分122jの情報も参照することができるため、対象メッセージに対する原因、対応方法、メッセージ区分を立案するときにも有益な情報となる。
コマンドボタン欄530には、戻るボタン531、詳細ボタン532、対応ボタン533、OKボタン534が配されている。
戻るボタン531は、このメッセージ検索画面500を呼び出した対応メッセージ管理画面400に戻るボタンである。詳細ボタン532は、図9Bに示される詳細情報を表示したメッセージ検索画面1500(後述)を表示するボタンである。対応ボタン533は、図8に示した対応メッセージ管理画面400の対応ボタン423と同様に、対象メッセージを対象して、図10に示されたメッセージ対応画面(後述)を開くボタンである。OKボタン534は、このメッセージ検索画面500を閉じる画面である。
詳細情報を表示したメッセージ検索画面1500は、メッセージ検索画面500の詳細ボタン532から呼び出され、選択された保守メッセージ管理テーブル122のレコードに対する詳細情報を表示する画面である。
詳細情報を表示したメッセージ検索画面1500は、メッセージ検索画面500の詳細ボタン532から開かれ、選択された保守メッセージ管理テーブル122のレコードの詳細情報を表示する画面であり、図9Bに示されるように、対応メッセージ表示欄1510と保守メッセージ管理テーブルレコード詳細情報表示欄1520とコマンドボタン欄1530からなる。
対象メッセージ表示欄1510は、図9Aの対象メッセージ表示欄510と同様である。
保守メッセージ管理テーブルレコード詳細情報表示欄1520は、選択された保守メッセージ管理テーブル122のレコードの詳細情報を表示する欄である。保守メッセージ管理テーブルレコード詳細情報表示欄1520は、レコード固有情報表示領域1521と一致率表示領域1522からなる。
レコード固有情報表示領域1521は、保守メッセージ管理テーブル122のレコードのメッセージID122a〜総得点122jの情報を表示する領域である。一致率・項目ポイント表示領域1522は、その保守メッセージ管理テーブル122のレコードの対象メッセージに対する一致率を、それぞれ表示する領域である。
コマンドボタン欄1530は、運用者が運用管理システムに指示を与えるためのボタンを表示する欄である。
コマンドボタン欄1530には、戻るボタン1531、編集ボタン1532、ダウンロードボタン1533が配されている。
戻るボタン1531は、この詳細情報を表示したメッセージ検索画面1500を呼び出したメッセージ検索画面500に戻るボタンである。編集ボタン1532は、図には示さなかったが、選択された保守メッセージ管理テーブル122のレコードを編集するエディタ画面を表示するボタンである。ダウンロードボタン1533は、保守メッセージ管理テーブル122のレコードの格納されたメッセージに対するマニュアルや対応パッチソフトウェアなどをダウンロードする関連サイトを呼び出すためのボタンである。図示しなかったが、そのようなサイトのURLに関する情報を、統合運用管理サーバ100が保持しているものとする。
メッセージ対応画面600は、対応メッセージ管理画面400の対応ボタン423から開かれ、対象メッセージに対して、運用者が、原因、対応方法、メッセージ区分を入力して、保守メッセージ管理テーブル122に対象メッセージの情報を格納するために表示する画面であり、図10に示されるように、対象メッセージ表示欄610と保守情報入力欄620とコマンドボタン欄630からなる。
対象メッセージ表示欄610は、選択された対応メッセージの情報を表示する欄である。
保守情報入力欄620は、対象メッセージに対して、保守のために必要な情報を入力する欄である。保守情報入力欄620は、メッセージ区分欄621、原因欄622、対応方法欄623からなる。
メッセージ区分欄621は、保守メッセージ管理テーブル122のメッセージ区分122hに対応する情報を入力する欄である。原因欄622は、保守メッセージ管理テーブル122の原因122iに対応する情報を入力する欄である。対応方法欄623は、保守メッセージ管理テーブル122の対応方法122jに対応する情報を入力する欄である。
コマンドボタン欄630は、運用者が運用管理システムに指示を与えるためのボタンを表示する欄である。コマンドボタン欄630には、戻るボタン631、OKボタン424、キャンセルボタン425が配されている。戻るボタン631は、このメッセージ対応画面600を呼び出した対応メッセージ管理画面400に戻るボタンである。OKボタン424は、入力内容を反映して、対象メッセージに関する情報を、保守メッセージ管理テーブル122に格納するボタンである。キャンセルボタン425は、入力した内容をキャンセルして、メッセージ対応画面600を閉じるボタンである。
保守メッセージ管理画面700は、運用管理システムのメッセージ管理ユーティリティの初期画面(図示せず)か、特定のコマンドを入力することにより開かれ、保守メッセージ管理テーブル122の情報を保守するための画面であり、図11に示されるように、保守メッセージ管理テーブル情報表示欄710とコマンドボタン欄720からなる。
保守メッセージ管理テーブル情報表示欄710は、保守メッセージ管理テーブル122の情報を表示する欄である。コマンドボタン欄720は、運用者が運用管理システムに指示を与えるためのボタンを表示する欄である。
保守メッセージ管理テーブル情報表示欄710は、選択チェックボックス711、メッセージ情報表示領域712を有する。選択チェックボックス711は、選択することにより、保守メッセージ管理テーブルのレコードをコマンドの対象とするための入力オブジェクトである。メッセージ情報表示領域712は、保守メッセージ管理テーブルのレコードの情報を表示する領域である。
コマンドボタン欄720には、編集ボタン721、OKボタン722、キャンセルボタン723が配されている。
編集ボタン722は、図には示さなかったが、選択チェックボックス710により選択された保守メッセージ管理テーブルのレコードの情報を編集するエディタ画面を表示するボタンである。OKボタン722は、編集結果を格納して、この保守メッセージ管理画面700を閉じる画面である。キャンセルボタン725は、編集結果をキャンセルして、この保守メッセージ管理画面700を閉じる画面である。
以上のように、本実施形態の運用管理システムによれば、各運用監視システムから受信したメッセージに対して、保守用に蓄えたメッセージの保守メッセージ管理テーブルから、類似するメッセージを検索して、一致度の高いものから順に、メッセージ検索結果を表示する。運用者は、そのメッセージの情報を見て、過去の保守時において、判断された運用、対応方法、メッセージ区分を参照することができる。また、メッセージごとに総得点が表示されているため、過去にどれだけ類似のメッセージが出ているかの指標とすることができる。これにより、運用者は、障害などが発生したときに、過去の保守情報を参照することにより、精度が高く、迅速な障害対応が可能となる。
10…システム運用環境、20…運用監視システム、100…統合運用管理サーバ、200…運用クライアント端末、
121…対応メッセージ管理テーブル、122…保守メッセージ管理テーブル、
400…対応メッセージ管理画面、500…メッセージ検索画面、1500…詳細情報を表示したメッセージ検索画面、600…メッセージ対応画面、700…保守メッセージ管理画面

Claims (8)

  1. 各々のシステム運用環境における運用監視システムから出力されるメッセージを受信して、そのメッセージを表示する運用管理システムであって、
    統合運用管理サーバと運用クライアント端末とを備え、
    前記統合運用管理サーバは、
    前記運用監視システムから出力されるメッセージを格納する対応メッセージ管理テーブルと、
    過去の運用監視システムから出力されたメッセージに関する情報を格納する保守メッセージ管理テーブルとを有し、
    前記統合運用管理サーバは、前記運用クライアント端末から選択された前記対応メッセージ管理テーブルに格納されたメッセージに対して、保守メッセージ管理テーブルの情報を検索する依頼を受付け
    前記統合運用管理サーバは、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードの情報との一致率を算出して、一致率の高い順に保守メッセージ管理テーブルのレコードの情報を表示する表示情報を、検索結果情報として作成して、前記運用クライアント端末に送信し、
    前記運用クライアント端末は、前記検索結果情報を表示することを特徴とする運用管理システム。
  2. 前記統合運用管理サーバは、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージに対する原因、対応方法、メッセージ区分を前記運用クライアント端末から受信し、
    前記選択された前記対応メッセージ管理テーブルに格納されたメッセージに対して、原因、対応方法、メッセージ区分の情報を付加して、前記保守メッセージ管理テーブルに格納し、
    前記検索結果情報に原因、対応方法、メッセージ区分の情報を含めることを特徴と請求項1記載の運用管理システム。
  3. 前記保守メッセージ管理テーブルは、過去に受信したメッセージとの類似度を表す指標である総得点の項目を有し、
    前記検索結果情報に、総得点の情報を含めることを特徴とする請求項1記載の運用管理システム。
  4. 前記選択された前記対応メッセージ管理テーブルに格納されたメッセージを、前記保守メッセージ管理テーブルに格納するときに、
    前記統合運用管理サーバは、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードの情報との一致率を算出して、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージの項目と各々の保守メッセージ管理テーブルのレコードの項目との一致による項目ポイントを算出し、
    前記一致率と前記項目ポイントに基づいて、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードとの総得点を算出し、
    前記選択された前記対応メッセージ管理テーブルに格納されたメッセージの総得点を、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードとの総得点の総和として、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージの総得点の情報を付加して、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージを、前記保守メッセージ管理テーブルに格納し、
    保守メッセージ管理テーブルのレコードの総得点の項目に、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、その保守メッセージ管理テーブルのレコードとの総得点を足しこんで更新し、
    前記検索結果情報に、保守メッセージ管理テーブルのレコードの総得点の情報を含めることを特徴とする請求項1記載の運用管理システム。
  5. 各々のシステム運用環境における運用監視システムから出力されるメッセージを受信して、そのメッセージを表示する運用管理方法であって、
    統合運用管理サーバは、前記運用監視システムから出力されるメッセージを格納する対応メッセージ管理テーブルと、
    過去の運用監視システムから出力されたメッセージに関する情報を格納する保守メッセージ管理テーブルとを有し、
    前記統合運用管理サーバが、運用クライアント端末から選択された前記対応メッセージ管理テーブルに格納されたメッセージに対して、保守メッセージ管理テーブルの情報を検索する依頼を受付けるステップと、
    前記統合運用管理サーバが、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードの情報との一致率を算出して、一致率の高い順に保守メッセージ管理テーブルのレコードの情報を表示する表示情報を、検索結果情報として作成して、前記運用クライアント端末に送信するステップと、
    前記運用クライアント端末が、前記検索結果情報を表示するステップとを有することを特徴とする運用管理方法。
  6. 前記統合運用管理サーバが、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージに対する原因、対応方法、メッセージ区分を前記運用クライアント端末から受信するステップと、
    前記選択された前記対応メッセージ管理テーブルに格納されたメッセージに対して、原因、対応方法、メッセージ区分の情報を付加して、前記保守メッセージ管理テーブルに格納するステップを有し、
    前記運用クライアント端末が、前記検索結果情報を表示するステップにおいて、前記検索結果情報に原因、対応方法、メッセージ区分の情報を含めることを特徴とすることを特徴とする請求項5記載の運用管理方法。
  7. 前記保守メッセージ管理テーブルは、過去に受信したメッセージとの類似度を表す指標である総得点の項目を有し、
    前記検索結果情報に、総得点の情報を含めることを特徴とする請求項5記載の運用管理方法。
  8. 前記選択された前記対応メッセージ管理テーブルに格納されたメッセージを、前記保守メッセージ管理テーブルに格納するステップにおいて、
    前記統合運用管理サーバが、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードの情報との一致率を算出して、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージの項目と各々の保守メッセージ管理テーブルのレコードの項目との一致による項目ポイントを算出し、
    前記一致率と前記項目ポイントに基づいて、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードとの総得点を算出し、
    前記選択された前記対応メッセージ管理テーブルに格納されたメッセージの総得点を、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、各々の保守メッセージ管理テーブルのレコードとの総得点の総和として、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージの総得点の情報を付加して、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージを、前記保守メッセージ管理テーブルに格納し、
    保守メッセージ管理テーブルのレコードの総得点の項目に、前記選択された前記対応メッセージ管理テーブルに格納されたメッセージと、その保守メッセージ管理テーブルのレコードとの総得点を足しこんで更新し、
    前記運用クライアント端末が、前記検索結果情報を表示するステップにおいて、
    前記検索結果情報に、保守メッセージ管理テーブルのレコードの総得点の情報を含めることを特徴とする請求項5記載の運用管理方法。
JP2018233759A 2018-12-13 2018-12-13 運用管理システムおよび運用管理方法 Pending JP2020095536A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018233759A JP2020095536A (ja) 2018-12-13 2018-12-13 運用管理システムおよび運用管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018233759A JP2020095536A (ja) 2018-12-13 2018-12-13 運用管理システムおよび運用管理方法

Publications (1)

Publication Number Publication Date
JP2020095536A true JP2020095536A (ja) 2020-06-18

Family

ID=71085614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018233759A Pending JP2020095536A (ja) 2018-12-13 2018-12-13 運用管理システムおよび運用管理方法

Country Status (1)

Country Link
JP (1) JP2020095536A (ja)

Similar Documents

Publication Publication Date Title
US10762113B2 (en) Conversational knowledge graph powered virtual assistant for application performance management
US11405301B1 (en) Service analyzer interface with composite machine scores
US20190303779A1 (en) Digital worker management system
US10423509B2 (en) System and method for managing environment configuration using snapshots
US20110320394A1 (en) Creation and Revision of Network Object Graph Topology for a Network Performance Management System
US20150222731A1 (en) Computer, guide information providing method and recording medium
US20080301486A1 (en) Customization conflict detection and resolution
CN113656407B (zh) 一种数据拓扑生成方法、装置、电子设备及存储介质
US20200342025A1 (en) Interactive and non-interactive execution and rendering of templates to automate control and exploration across systems
US11138221B1 (en) Data aggregation and reporting environment for data center infrastructure management
US9658924B2 (en) Event data merge system in an event historian
JP6565628B2 (ja) 検索プログラム、検索装置および検索方法
JP2006293611A (ja) プラント監視制御システム
JP4865511B2 (ja) サービス管理装置
CN103970816B (zh) 标识要发布的内容的方法和系统
JP2020095536A (ja) 運用管理システムおよび運用管理方法
JP7381290B2 (ja) 計算機システム及びデータの管理方法
US11405276B2 (en) Device configuration management apparatus, system, and program
JP6007320B2 (ja) 計算機、関連性算出方法及び記憶媒体
JP5197128B2 (ja) 依存関係推定装置及び依存関係推定プログラム及び記録媒体
JP4948427B2 (ja) ヘルプデスクにおけるオペレータ業務支援システム、オペレータ業務支援方法及びプログラム
JP4343526B2 (ja) エラー監視装置およびエラー監視方法およびコンピュータが読取り可能な記憶媒体およびプログラム
US20140278717A1 (en) Method for guided data collection management
JP4995505B2 (ja) 情報管理プログラム及び知識情報共有システム
JPWO2006064573A1 (ja) Web情報提供装置及びその方法、プログラム