JP2020141353A - 装置管理方法、管理装置及びプログラム - Google Patents

装置管理方法、管理装置及びプログラム Download PDF

Info

Publication number
JP2020141353A
JP2020141353A JP2019037193A JP2019037193A JP2020141353A JP 2020141353 A JP2020141353 A JP 2020141353A JP 2019037193 A JP2019037193 A JP 2019037193A JP 2019037193 A JP2019037193 A JP 2019037193A JP 2020141353 A JP2020141353 A JP 2020141353A
Authority
JP
Japan
Prior art keywords
monitoring
monitored device
timeline
monitored
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019037193A
Other languages
English (en)
Inventor
衞 高城
Mamoru Takagi
衞 高城
一志 久保田
Kazushi Kubota
一志 久保田
佐々木 崇
Takashi Sasaki
崇 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2019037193A priority Critical patent/JP2020141353A/ja
Publication of JP2020141353A publication Critical patent/JP2020141353A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】監視対象装置を遠隔監視する場合に、障害/故障等の発生に対して適切な対応を可能とする装置管理方法、管理装置及びプログラムを提供する。【解決手段】監視対象装置にネットワークを介して接続されるクラウド側で監視対象装置の監視情報を取得し、監視対象装置で発生した所定のイベントをタイムラインで管理する。コンピュータ装置は、例えばネットワークを介して接続される監視対象装置の監視情報を取得する(S101)。監視情報を取得する監視システムは、クラウド側にあっても、監視対象装置側に配置する構成としてもよい。この場合、監視システムをユーザネットワークのノードとして配置し、複数の監視対象装置を監視し、監視情報をクラウドのサーバに送信するか、あるいは、各監視対象装置毎に監視システムを配置する構成としてもよい。【選択図】図9

Description

本発明は、装置管理方法、管理装置、及びプログラムに関する。
よく知られているように、装置や設備の障害、故障発生等の突発的なトラブルに対してその都度、修理を行う事後保全では、故障発生現場(現地)での対応が必要となる場合が多い。事後保全では、装置や設備の運用方法によって装置個別の対応が必要とされる場合もある。また、経年劣化等による障害や故障の対策として、例えば定期保全や予防保全等が行われ、個別の長寿命化、部品品質のばらつきの管理等により、信頼性の向上や、寿命と想定される時期での機器、設備の置き換え等による対策がとられる。
監視対象装置を監視する監視システムでは、例えば監視対象装置に応じて該監視対象装置専用の監視GUI(Graphical User Interface)等により監視結果等を表示する場合がある。このようなシステムでは、監視対象装置に応じたスキルが装置管理者や監視者側に必要とされることがある。また、障害/故障発生時の状況(故障部位、原因等)の把握に多くの工数を要する場合がある。さらに、監視対象装置の障害等の原因の絞込み等にあたり適切な対応ができない場合、害復旧等の長期化を招くことになる。一般に、監視対象装置の障害/故障等は頻発するものではないことから、障害/故障に備えて、スキルを持つ要員等を常時配備することは現実的ではない。また、故障によっては、監視対象装置のユーザ側で故障の原因の絞込みが困難である場合がある。この場合、装置を製造したメーカ又は該メーカの系列保守会社等の保守要員(カスタマエンジニア)(場合によっては、装置の設計担当者)等を現場に派遣することが必要となることもある。
そして、運用監視センタにおける装置管理システム(Element Management System:EMS)、運用管理システム(Operations Management Suite:OMS)による監視は、設置場所に制限される。
監視対象装置を遠隔監視するシステムとして、インターネット経由でユーザのLAN(Local Area Network)環境にあるシステムの稼動状況を可視化してポータル画面等に表示し、異常検知、故障機器の特定をサポートする各種クラウドサービスが実用化されている。例えば非特許文献1には、データセンタに監視専用ボックスを備え、データセンタに接続する企業ネットワークのネットワーク機器等に対してICMP(Internet Control Message Protocol)(Ping)等による死活監視や、ポートステータスや冗長化状態の監視、CPU(Central Processing Unit)・メモリ使用率やセッション数等の監視といった様々な検知から機器の稼動情報を収集し、正常時のデータと照合し、異常が無いか判定するネットワーク機器監視サービスが開示されている。監視対象に障害が発生・復旧した場合、メール、電話等で通知するシステムも知られている。ただし、上記非特許文献1に開示されるシステムでは、ネットワーク環境内の監視対象機器を監視してデータを収集し異常の有無を判定しているが、例えば装置管理者(監視者)側からの要求に応答して障害/故障箇所の特定に必要とされる情報をさらに収集して該装置管理者(監視者)に提供するサービス等は提供(実現)されていない。
機器のリアルタイム監視の関連技術として、例えば特許文献1には、監視対象システムのコンピュータリソースの状況をリアルタイムに監視・制御することのできるコンピュータリソース制御システムが開示されている。このコンピュータリソース制御システムは、複数の監視エージェントから収集された計測値と予め定義された制御ルールとを比較して、前記コンピュータリソースに対するアクションの要否を判断する管理サーバと、前記管理サーバによって、前記コンピュータリソースに対するアクションを要すると判断された場合に、前記コンピュータリソースに対するアクションを実行するための指示を出力する実行サーバと、を含む複数のサーバを含み、前記コンピュータリソース制御システム内のサーバの少なくとも一つに前記監視エージェントを含む。特許文献1には、前記複数の監視エージェントから収集された計測値を分散データベースサーバに登録し、前記分散データベースに格納された計測値を読み出して編集し、ユーザ端末装置へ送信することも開示されている。
また、特許文献2には、コンピュータリソースサービスの性能をリアルタイムで決定、及び監視するための構成が開示されている。特許文献2に開示されたリソース監視ツールは、コンピュータリソースサービスのコンピュータシステム上で試験仮想マシンを始動することができる。リソース監視ツールは、次に、プロセッサ性能、メモリ性能、入力/出力(I/O)性能、及びネットワーク性能などの、試験仮想マシンの性能を経時的に示す種々のメトリックを監視することができる。さらにリソース監視ツールは、監視される性能メトリックを記憶し、選択される性能メトリックをユーザに提供し、該性能メトリックを使用してコンピュータリソースサービスを管理することができる。
特開2012−89109号公報 特開2018−22520号公報
サーバシステム・ネットワーク機器を遠隔監視で"見える化" ネットワーク機器監視サービス、2019/02/03検索、インターネット<URL:https://www.nec-nexs.com/clovernet/service/gateway_surveillance/>
以下に関連技術の分析を与える。
上記したように、監視対象装置に関して専用のユーザインタフェース(GUI等)により監視結果を表示する監視システムでは、監視対象装置に応じたスキルが装置管理者(監視者)側に必要とされる。また、非特許文献1や特許文献1、2等の関連技術では、監視対象装置での障害/故障によっては障害/故障の発生時の状況把握や原因特定のために装置管理者(監視者)側で必要な情報が提供されない場合がある。この場合、障害故障発生時に適切な対応がとれない、あるいは、状況把握に要する工数が増大する、という問題が生じる。
本発明は、上記した事情等に鑑みて創案されたものであって、その主たる目的の一つは、監視対象装置を遠隔監視する場合に、障害等の発生に対して適切な対応を実施可能とする装置管理方法、管理装置、プログラムを提供することにある。
本発明の1つの側面によれば、監視対象装置にネットワークを介して接続されるクラウド側で前記監視対象装置の監視情報を取得し、
前記クラウド側では、前記監視対象装置で発生した所定のイベントをタイムラインで管理する装置管理方法が提供される。
本発明の1つの側面によれば、監視対象装置にネットワークを介して接続されるクラウド側の管理装置であって、前記監視対象装置の監視情報を取得する手段と、前記監視対象装置で発生した所定のイベントをタイムラインで管理する管理手段を備えた管理装置が提供される。
本発明の1つの側面によれば、監視対象装置にネットワークを介して接続されるクラウド側のコンピュータに、前記監視対象装置の監視情報を取得する処理と、前記監視対象装置で発生した所定のイベントをタイムラインで管理する処理と、を実行させるプログラムが提供される。本発明によれば、上記したプログラムを記憶したコンピュータ読み出し可能な記録媒体((例えばRAM(Random Access Memory)、ROM(Read Only Memory)、又は、EEPROM(Electrically Erasable and Programmable ROM))等の半導体ストレージ、HDD(Hard Disk Drive)、CD(Compact Disc)、DVD(Digital Versatile Disc)等のnon-transitory computer readable recording medium)が提供される。
本発明によれば、監視対象装置を遠隔監視する場合に、障害等の発生に対して適切な対応の実施を可能としている。
本発明の例示的な実施形態のシステム構成を説明する図である。 本発明の例示的な実施形態のユーザネットワークの一例を模式的に例示する図である。 本発明の例示的な実施形態のシステム構成の一例を説明する図である。 本発明の例示的な実施形態のシステム構成の動作の一例を説明する図である。 本発明の例示的な実施形態を説明する図である。 本発明の例示的な実施形態を説明する図である。 本発明の例示的な実施形態を説明する図である。 本発明の例示的な実施形態におけるコンピュータによる実装の一例を説明する図である。 本発明の例示的な実施形態の方法を説明する図である。
図1は、本発明の例示的な実施形態のシステム構成の一例を模式的に例示する図である。図1において、ユーザネットワーク10を構成する監視対象装置11はネットワーク40を介してクラウド20上の監視システム21に接続される。監視システム21は、監視対象装置11を遠隔で監視する。
特に制限されないが、ユーザネットワーク10は、例えばLAN(Local Area Network)(社内LAN、企業ネットワーク)等であってもよい。ネットワーク40は、VPN(Virtual Private Network)(インターネットVPN)等で構成されてもよい。この場合、監視対象装置11は、ユーザネットワーク10の不図示のゲートウェイ(VPNゲートウエイ)を介してクラウド20側のVPNゲートウェイ(不図示)に接続される。
監視対象装置11は、サーバ等の情報通信装置あるいは端末装置等であってもよいし、ユーザネットワーク10を構成するスイッチやルータ等のネットワーク機器等であってもよい。
クラウド20の監視システム21は、クラウド事業者等のデータセンタ内に実装されてもよいし、データセンタと通信接続する構成としてもよい。あるいは、変形例として、監視システム21は、クラウド20に配設されているが、ユーザネットワーク10側や監視対象装置11に配設する構成としてもよい。
図1に例示されるように、本実施形態では、公衆ネットワーク50を介してクラウド20に接続する監視端末30で、直接、監視対象装置11を監視する代わりに、例えばクラウド20側で実行されるアプリケーションであるクラウド監視アプリ22が、監視システム21と連携して、監視サービスを提供する。なお、公衆ネットワーク50は、不特定多数の人が利用するインターネット等であってもよいし、あるいは、無線LAN、携帯電話網やインターネット等のWAN(Wide Area Network)等を含む構成してもよいことは勿論である。
監視システム21は、クラウド監視アプリ22からの制御に基づき、監視対象装置11に対して、監視対象装置11で発生した所定のインシデント(例えば再起動等)の通知を受ける構成としてもよい。監視システム21は、クラウド監視アプリ22からの指示に基づき、監視対象装置11で記憶保持するログ情報(例えばインシデントに対応するイベントログや障害ログ)を取得する構成としてもよい。また、監視システム21は、監視対象装置11での不正アクセス等による再起動等のインシデントの発生を検出する監視サービス(不正アクセス監視)を提供するようにしてもよい。なお、監視システム21は、監視対象装置11に対するICMP(Ping)等による定期的な死活監視や、CPU、メモリ使用率等の稼動状態を監視するようにしてもよいことは勿論である。
図1では、クラウド20において監視システム21は1つとされているが、複数の監視システム21を備えた構成としてもよいことは勿論である。
クラウド監視アプリ22は、クラウド20側の処理を実現するクラウド部23と、監視端末30に対する処理を実現する端末部24を備えている。クラウド監視アプリ22はクラウド20側のサーバ装置等のコンピュータ上で実行される。
図1では、クラウド監視アプリ22の端末部24は、監視端末30の内部に配置されて図示されているが、これは、監視端末30のブラウザ等で表示部31に表示され、監視端末30からの入力を受け付けることを表している。監視端末30のブラウザでクラウド画面(クラウド監視アプリ22)にログインし、クラウド監視アプリ22の端末部24を開くことで、クラウド監視アプリ22による情報の表示、情報入力が行われる。
クラウド監視アプリ22は、例えば以下の機能を有する。
・監視対象装置11について、タイムラインに、装置個別に、時系列なイベント情報を表示する。
・監視対象装置11は、システム上の冗長構成、エッジ/コアのような関連性情報が定義され、関連に応じたイベントをタイムライン上に表示する。
・監視者(監視端末30の利用者)のタイムラインに監視対象装置11のイベント情報を時系列に表示する。
・複数の監視対象装置11を監視対象装置群として定義し、監視対象装置群別に監視者を割り当てる。
・監視対象装置11で発生したイベントの中で、監視者が事前に登録する特徴的なイベントに対し自動でハッシュタグが付与される。
・監視者は、ハッシュタグにより、監視対象装置個別/担当する監視対象装置群毎にイベント情報の集計ができる。
・監視者は、集計したイベント情報をもとに、クラウド監視アプリ22による分析結果に基づき、監視対象装置11で発生したインシデントの影響の見積ができる。
本実施形態において、クラウド監視アプリ22は、監視対象装置11の障害/故障を管理する管理手段として機能する。監視システム21、監視端末30と連携して監視サービスを提供するクラウド監視アプリ22を備えた構成(コンピュータ装置)を、装置管理を行うための「管理装置」と称呼してもよい。
監視端末30は、タブレット端末等移動無線端末であってもよいし、通信機能を備えたPC(Personal Computer)等であってもよい。
図2は、図1のユーザネットワーク10の一例を説明する図である。監視対象装置1−3(11A−11C)はユーザネットワーク10を構成している。なお、図2では、簡単のため3台の監視対象装置が図示されているが、監視対象装置は3台に制限されるものでないことは勿論である。ユーザネットワーク10において、クラウド20により遠隔監視サービスを受けるネットワークを「サービスネットワーク」とも称呼してもよい。ユーザネットワーク10の全ノードをクラウド20による監視対象としてもよい。あるいは、ユーザネットワーク10の一部のノードをクラウド20による監視対象としてもよい。
図3は、図2のユーザネットワーク10を監視するシステムを説明する図である。図3において、監視対象装置1(11A)と監視対象装置2(11B)は冗長構成(一方が運用系、他方が待機系の二重化システム)を構成しているものとする。また、特に制限されないが、監視対象装置3(11C)をユーザネットワーク10のエッジノード(エッジスイッチ又はエッジルータ)としてもよい。監視対象装置1、2(11A、11B)を二重化(冗長化)されたコアスイッチとしてもよい。監視者A(32)は、装置管理を行う要員であり、監視端末30の利用者である。
図4は、図3のシステムのシーケンス動作の一例を説明する図である。図4において、「監視対象装置1タイムライン」と「監視者Aタイムライン」の各タイムラインは、投稿された短い文(例えばツイート等)が時系列で並んだ表示画面である。監視対象装置1タイムライン、監視者Aタイムラインは、例えば使用するSNS(Social Networking Service)のサイトのURL(Uniform Resource Locator)(https://〜)に、監視対象装置1、監視者Aのユーザ名(アカウント名)を足したURLでアクセスされる。なお、本実施形態において、タイムラインは特定のSNSのタイムラインに制限されるものでないことは勿論である。監視者A等が、監視端末30からSNSライクなインタフェース(例えば投稿削除、修正、ハッシュタグ検索、公開範囲設定)でアクセス可能であればよい。
図4において、運用系として稼働中の監視対象装置1(11A)に再起動が発生したとする(ステップS1)。
監視対象装置1(11A)に再起動が発生したことにより、監視対象装置1(11A)から、クラウド20上の監視システム21に対して再起動発生を伝えるメッセージが送られる(ステップS2)。
監視システム21は、監視対象装置1(11A)から再起動発生のメッセージを受けると、クラウド監視アプリ22のクラウド部23に該メッセージを受け渡し(ステップS3)、クラウド部23は、監視対象装置1のタイムラインに「再起動の発生」を表示する(ステップS4)。すなわち、クラウド部23は、監視対象装置1のタイムラインを開き、メッセージを書き込んで[投稿する]をクリックする操作に対応する、コマンドライン(シェルスクリプト等)を実行することで、監視対象装置1のタイムラインにメッセージ「再起動の発生」を自動で書き込む。
図5は、監視対象装置1(11A)の基本データを例示する図である。監視者を監視者Aとし、冗長構成の対向装置は監視対象装置2、ハブやスイッチ等の集線装置無し、配下の装置は、監視対象装置3、監視を行うのは、監視システム21である。
クラウド監視アプリ22のクラウド部23は、監視者Aタイムラインに「監視対象装置1の再起動の発生」を登録・表示する(ステップS5)。
クラウド監視アプリ22の端末部24は、監視者Aタイムラインに登録された「「監視対象装置1の再起動の発生」に応答して(ステップS6)、監視端末30の表示画面に表示する(ステップS7)。クラウド監視アプリ22は、監視対象装置1のタイムラインのメッセージ(再起動発生)の発生に対し、ハッシュタグ:「再起動」を登録する。
監視者A(32)が、監視端末30の画面上の監視者Aタイムラインで「監視対象装置1の再起動の発生」を確認する(ステップS7)。
監視者A(32)が、監視対象装置1(11A)の故障部位の確認のため、監視対象装置1(11A)のログ情報の収集が必要な場合、ログ収集指示を、クラウド監視アプリ22の端末部24から入力する(ステップS8)。クラウド監視アプリ22の端末部24は、クラウド部23にログ収集指示を伝える(ステップS9)。クラウド監視アプリ22のクラウド部23は、監視システム21に対して監視対象装置1(11A)のログ収集を指示する(ステップS10)。クラウド部23は、監視システム21に対して、サービスオーダ(サービスオーダAPI(Application Programming Interface))によりログ収集を指示するようにしてもよい。その際、クラウド監視アプリ22は、監視者A(32)からの設定入力に基づき、監視システム21に対して、監視対象装置1(11A)における特定のインシデントに対応するイベントログ等、ログの種別を指定するようにしてもよい。また、クラウド監視アプリ22は、監視者A(32)からの設定入力に基づき、監視システム21に対して、監視対象装置1(11A)におけるログ情報の期間(いつの時点まで遡るか)を指定するようにしてもよい。
監視システム21は、監視対象装置1(11A)のログの収集を行う(ステップS11)。監視システム21は、監視対象装置1(11A)で再起動が発生する直前又は、再起動発生の所定期間前から再起動発生直前までのログファイル(監視対象装置1(11A)のイベントログ)を取得するようにしてもよい。
監視システム21は、収集した監視対象装置1(11A)のログ情報をクラウド監視アプリ22のクラウド部23に返す(ステップS12)。
クラウド監視アプリ22のクラウド部23は、監視対象装置1タイムライン及び監視者Aタイムラインに、監視対象装置1(11A)のログ情報を登録/表示する(ステップS13、S14)。クラウド監視アプリ22の端末部24は、監視者Aタイムラインにインシデントが表示された通知を受け(ステップS15)、監視端末30の表示画面に表示する(ステップS16)。監視者Aは、監視端末30の監視者Aタイムラインにより監視対象装置1(11A)のログ情報を確認する。
ここで、監視対象装置1(11A)のログ情報から、監視対象装置2と監視対象装置3との通信のログとして各装置との間での送受されるハートビートメッセージ(heart beat message:ネットワークで接続されたコンピュータやネットワーク機器の接続が有効であることを確認するために定期的に送信する信号)の異常、及び、監視対象装置2との間の回線のダウン(リンクダウン)等が検出されたものとする。
監視対象装置1(11A)の基本データでは、冗長構成対向装置として監視対象装置2、配下の装置として、監視対象装置3が設定されている。このため、監視者A32は、ログ情報に基づき、障害の影響範囲を明確化することができる。このため、ユーザネットワーク10が正常に機能していることを確認することができる。また、監視者A32は、監視者Aタイムラインでのハッシュタグの検索により、監視対象装置1(11A)の再起動の発生等の履歴を調べることができる。
なお、図4では、具体例として、監視対象装置1(11A)の再起動の発生の例が説明されたが、監視対象は、再起動の発生に制限されるものではないことは勿論である。
本発明の一実施形態によれば、監視対象装置の例えば突発的な障害/故障等の発生に対してクラウド側で一元的に管理することで、いつでもどこでも監視する体制を構築できる。このため、初期対応を、監視対象装置の例えば突発的な障害/故障の発生に対して無理なく実行可能としている。また、監視対象装置の例えば突発的な障害/故障等の影響範囲の絞込みや事象(イベント)の報告、タイムラインによる事象の把握などにより、障害/故障の絞り込みや特定にあたり、適正な判断を実現可能としている。
また、各種監視対象装置に対して、クラウト事業者の監視システム上で動作する監視アプリケーションであるクラウド監視アプリ22により、監視対象装置の関連する情報をタイムラインで管理することにより、装置管理者(監視者)による、柔軟な監視を可能にする。
監視対象装置11をクラウド20上の監視システム21により常時監視し、監視者がタブレット端末からの操作も容易なSNSライクなユーザインタフェース(タイムライン)により、いつでもどこでも柔軟な監視を実施することができる。
また、本実施形態によれば、監視対象装置11に、監視者の監視端末30が直接接続する形態をとらないことから、監視対象装置11に対するアクセス制限を容易に実現することが可能とされる。この結果、柔軟で安全なシステム構成を実現できる。
また、監視対象装置11から収集した監視データを分析することにより、高度な監視を可能とし、障害発生時の対応の適切な対応を迅速に行うことを可能にする構成としてもよい。図6は、本発明の実施形態の変形例を説明する図である。クラウド監視アプリ22は、分析部25をさらに備えている。監視者A32は、端末部24から報告書の作成指示を入力すると、端末部24から分析部25への報告書の作成指示が通知される。
監視者Aは、監視端末30の端末部24から、例えば図7に示す報告書分析要求シートに、必要な要件を入力/選択する。
本発明を特に制限するものではないが、図7の報告書分析要求シートによれば、分析対象インシデントとして、例えば再起動のインシデントとし(識別情報(ID)で設定)が選択され、項目「同一機種でのインシデント発生状況」、絞込み条件として項目「3か月以内」が選択されている。なお、項目「同じソフトウェアバージョンでのインシデント発生状況」、「同じハードウェアバージョンでのインシデント発生状況」を選択するようにしてもよい。なお、分析対象インシデントでは、「同一機種でのインシデント発生状況」を指定する場合、ユーザネットワーク10の複数の監視対象装置(例えば図2の監視対象装置1、2、3等)のうち特定の監視対象装置を指定するようにしてもよい。分析部25は、入力された報告書分析要求シートに基づき、ユーザネットワーク10に配置された監視対象装置のうち指定された監視対象装置と同一機種の監視対象装置の3ケ月以内のログデータを、監視システム21を介して収集する。この場合、監視システム21にて各監視対象装置11の構成情報、機種情報等を記憶管理するようにしてもよい。なお、監視対象装置11のログ情報を監視システム21側で保持するようにしてもよい。
クラウド監視アプリ22の分析部25は、例えば図7に例示した報告書分析要求シートに従った分析結果を、報告書として、監視者A32のタイムライン上に返却する。このため、監視者A32のタイムラインに登録された報告書(例えば同一機種の3ケ月以内の発生状況等)に基づき、監視者A32による監視対象装置等の障害等の特定を容易化している。
クラウド監視アプリ22の分析部25によって監視者A32のタイムラインに登録(投稿)される報告書は、好ましくは、編集可能な文書ファイルである。監視者A32は、報告書の活用として、関係者のタイムラインにシェアするようにしてもよい。また、タイムラインの報告書の編集を行い報告する等を行うようにしてもよい。関係者のタイムラインにシェアすることで、例えば障害発生時の初動対応等において、監視者A32及び関係者等による適切な対応・対策をとることを可能としている。
また、例えば、監視者A32は、監視者A32のタイムラインに登録された報告書(編集可能な文書ファイル)の内容(例えばインシデント発生状況等)から判断される監視対象装置の障害(異常)原因、障害復旧のための対応/対策を、例えば監視端末30上で、該報告書の対応/対策欄に記入し、編集した報告書を監視者A32のタイムラインに登録し、関係者のタイムラインにシェアする。この結果、タイムライン上の報告書が、監視対象装置の障害の分析に加えて、障害対応・対策を含むものとなり、監視者A32の所属する部署の関係者等への報告を速やかに上げることができる。
クラウド監視アプリ22は、複数の監視システム21を統合的に管理する構成としてもよい。ユーザネットワーク10において別々の監視対象装置グループを複数の監視システム21でそれぞれ監視するようにしてもよい。複数の監視システム21での監視項目(種別)は相違するようにしてもよい。1つの監視対象装置11について、装置故障(例えばCPU、メモリ、通信インタフェース、電源等)や、ネットワーク性能、不正アクセス等を対応する異なる監視システム21で監視するようにしてもよい。複数の監視システム21でそれぞれ監視されるサーバ、通信機器、ファイヤウォール、認証システム、電源監視などをまとめて管理するようにしてもよい。この場合、少数の監視者等により、効果的な監視業務を実施可能としている。
本実施形態によれば、タイムラインでの監視を実施することにより、システムの影響を時系列でどのように波及したか把握することで、影響範囲の特定を容易化可能としている。
また、本実施形態によれば、インシデントの発生した監視対象装置11を絞込むことで、監視対象装置11のタイムラインの経過の確認から、事象の特定を容易化可能としている。
本実施形態によれば、監視対象装置11毎にタイムラインを管理することにより、過去の情報の把握を容易化可能とし、状況にあった判断の実施を可能としている。
本実施形態によれば、監視対象装置11に関して、インシデントのハッシュタグによる検索により、監視対象装置11の運用に必要な情報を容易に集計でき、監視対象装置11(又は部品)の交換時期の見極めなど、運用における判断基準の明確化の実現を容易としている。
さらに、本実施形態によれば、クラウド監視アプリ22に分析部25を備える構成とすることで、報告書の自動作成を可能とし、監視者の負荷を低減することができる。
そして、本実施形態によれば、監視対象装置11に対して、監視者が直接のアクセスができず、アクセスに専用アプリであるクラウド監視アプリ22を備えたことで、監視者等が監視対象装置を直接アクセスすることを困難とし、高セキュリティの確保を可能としている。
また、本実施形態によれば、クラウド監視アプリ22が監視システム21に対してサービスオーダを発行する構成としたことで、実行可能なサービスオーダに対する制限も、クラウド監視アプリ22により容易に実現可能である。
さらに、本実施形態によれば、SNSライクなシステム構成の採用により、大規模システムへの対応実績のあるオープンな技術が一般化しており、容易に高い効果の検証された大規模な仕組みを組み込むことができる。
本実施形態によれば、監視システム21を監視対象装置11側に組み込み、クラウド監視アプリ22で制御する構成とすることも可能とされ、柔軟なシステム構成への対応を可能とすることができる。
本実施形態によれば、多数のエージェントを収容する能力に優れ、エージェント間の関連を定義することにより、センサネットワークの監視への適用が可能であり、IoT(Internet of Things)システムへの適用も可能である。この場合、監視対象装置11はIoT(Internet of Things)機器(センサ等)からなり、ユーザネットワーク10はセンサネットワークからなり、エージェントを用いて監視データを収集するようにしてもよい。センサネットワークは、無線LAN等により移動型センサが接続するモバイルセンサネットワークであってもよい。
図8は、クラウド20のクラウド監視アプリ22を実行する構成を例示する図である。コンピュータ装置300は、クラウド20のサーバ装置等を構成し、プロセッサ301、半導体メモリ又はHDD等のメモリ302、表示装置303、通信インタフェース304を備えている。クラウド20のクラウド監視アプリ22を実行するコンピュータ装置300がサーバ装置である場合、表示装置303は、サーバ装置に通信接続するPC(Personal Computer)等であってもよい。通信インタフェース304は、監視システム21(又は監視対象装置11)に通信接続するためのネットワークインタフェースカード(Network Interface Card:NIC)や監視端末30に通信接続するためのNICを備えた構成としてもよい。プロセッサ301は、メモリ302に記憶されたプログラム(命令)を実行することで、上記した実施形態のクラウド監視アプリ22を実現する。
なお、クラウド20の監視システム21を、図8の構成のコンピュータ装置300(監視サーバ)で構成してもよい。この場合、クラウド監視アプリ22を、監視システム21を構成するサーバ等のコンピュータ装置300で実行するようにしてもよい。
図9は、コンピュータ装置300で実行する処理ステップの一例を説明する流れ図である。コンピュータ装置300は、例えばネットワーク40(図1)を介して接続される監視対象装置11の監視情報を取得する(S101)。監視情報を取得する監視システム21は、クラウド20側にあっても、監視対象装置11側に配置する構成としてもよい。この場合、監視システム21をユーザネットワーク10のノードとして配置し、複数の監視対象装置11を監視し、監視情報をクラウド20のサーバ(不図示)に送信するか、あるいは、各監視対象装置11毎に監視システム21を配置する構成としてもよい。
コンピュータ装置300は、監視対象装置で発生した所定のイベントをタイムライン(SNSライクなタイムライン)で管理する(S102)。コンピュータ装置300は、監視対象装置11で発生したイベントを監視対象装置11毎のタイムラインで管理するようにしてもよい。
ステップS102において、コンピュータ装置300で実行されるアプリケーション(クラウド監視アプリ22)は、監視対象装置11で発生したイベントを監視対象装置11の監視者32Aのタイムラインに登録するようにしてもよい。コンピュータ装置300で実行されるアプリケーション(クラウド監視アプリ22)は、監視者32Aからの監視対象装置11のログ情報取得の指示を受けると、監視システム21を介して、監視対象装置11のログ情報を取得し、監視者32Aのタイムラインに登録するようにしてもよい。
同様にして、監視端末30を、図8の構成のコンピュータ装置300で実現し、プロセッサ301が、メモリ302に記憶されたプログラム(命令群)を実行することで、上記した実施形態の監視端末30を実現するようにしてもよい。
なお、上記の特許文献1、2、非特許文献1の各開示を、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素(各請求項の各要素、各実施例の各要素、各図面の各要素等を含む)の多様な組み合わせ乃至選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
10 ユーザネットワーク(サービスネットワーク)
11、11A、11B、11C 監視対象装置
20 クラウド
21 監視システム
22 クラウド監視アプリ
23 クラウド部
24 端末部
25 分析部
30 監視端末
31 表示部
32 監視者A(装置管理者)
40 ネットワーク
50 公衆ネットワーク
300 コンピュータ装置
301 プロセッサ
302 ストレージ(メモリ)
302 表示装置
304 通信インタフェース

Claims (10)

  1. 監視対象装置にネットワークを介して接続されるクラウド側で前記監視対象装置の監視情報を取得し、
    前記クラウド側では、前記監視対象装置で発生した所定のイベントをタイムラインで管理する、ことを特徴とする装置管理方法。
  2. 前記クラウド側では、前記監視対象装置で発生した前記イベントを、前記監視対象装置の監視者のタイムラインに登録する、ことを特徴とする請求項1に記載の装置管理方法。
  3. 前記監視対象装置について、前記監視者の端末から前記監視対象装置のログ情報取得の指示を受けると、前記クラウド側で、前記監視対象装置を監視する監視システムに指示して、前記監視対象装置のログ情報を取得し、前記ログ情報を前記監視者のタイムラインに登録する、ことを特徴とする請求項2に記載の装置管理方法。
  4. 前記監視対象装置の監視データの分析結果の報告書を前記クラウド側で作成し、前記報告書を前記監視者のタイムライン上に登録する、請求項2又は3に記載の監視管理方法。
  5. 前記監視対象装置で発生した前記イベントを前記監視対象装置毎のタイムラインで管理する、ことを特徴とする請求項1乃至4のいずれか1項に記載の装置管理方法。
  6. 監視対象装置にネットワークを介して接続されるクラウド側の管理装置であって、
    前記監視対象装置の監視情報を取得する手段と、
    前記監視対象装置で発生した所定のイベントをタイムラインで管理する管理手段と、
    を備えたことを特徴とする管理装置。
  7. 前記管理手段は、前記監視対象装置で発生した前記イベントを、前記監視対象装置毎のタイムラインと、前記監視対象装置の監視者のタイムラインの少なくともいずれかに登録する、ことを特徴とする請求項6に記載の管理装置。
  8. 前記管理手段は、前記監視対象装置について、前記監視者からの前記監視対象装置のログ情報取得の指示を受けると、前記監視対象装置の監視システムに指示して、前記監視対象装置のログ情報を取得し、
    前記ログ情報を前記監視者のタイムラインに登録する、ことを特徴とする請求項7に記載の管理装置。
  9. 前記監視対象装置の監視データを分析結果の報告書を作成し前記監視者のタイムライン上に登録する分析手段をさらに備えた請求項7又は8に記載の管理装置。
  10. 監視対象装置にネットワークを介して接続されるクラウド側のコンピュータに、
    前記監視対象装置の監視情報を取得する処理と、
    前記監視対象装置で発生した所定のイベントをタイムラインで管理する処理と、
    を実行させるプログラム。
JP2019037193A 2019-03-01 2019-03-01 装置管理方法、管理装置及びプログラム Pending JP2020141353A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019037193A JP2020141353A (ja) 2019-03-01 2019-03-01 装置管理方法、管理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019037193A JP2020141353A (ja) 2019-03-01 2019-03-01 装置管理方法、管理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2020141353A true JP2020141353A (ja) 2020-09-03

Family

ID=72280654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019037193A Pending JP2020141353A (ja) 2019-03-01 2019-03-01 装置管理方法、管理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2020141353A (ja)

Similar Documents

Publication Publication Date Title
CN104506393B (zh) 一种基于云平台的系统监控方法
EP3399697B1 (en) Operational analytics in managed networks
CN105139139B (zh) 用于运维审计的数据处理方法和装置及系统
US11075819B2 (en) Identifying unauthorized changes to network elements and determining the impact of unauthorized changes to network elements on network services
US11632320B2 (en) Centralized analytical monitoring of IP connected devices
CN103812699A (zh) 基于云计算的监控管理系统
CN110175451A (zh) 一种基于电力云的安全监控方法和系统
Kufel Tools for distributed systems monitoring
CN112073262B (zh) 一种云平台监控方法、装置、设备及系统
US11303538B2 (en) Methods and systems for analysis of process performance
CN110851320A (zh) 一种服务器宕机监管方法、系统、终端及存储介质
Rochim et al. Design Log Management System of Computer Network Devices Infrastructures Based on ELK Stack
CN105045700A (zh) 一种实时监控应用系统用户体验指标的方法
CN105531680A (zh) 远程监视系统、远程监视方法以及程序
CN104579840A (zh) 一种基于zabbix的网络监控系统
US11475758B2 (en) Monitoring control panels of a fire control system
CN111082998A (zh) 一种运维监控校园汇聚层的架构系统
Kučera et al. Fault Detection in Building management system networks
KR102579705B1 (ko) 클라우드 보안 토폴로지 가시화 장치 및 이를 이용한 통합 클라우드 워크로드 운영 및 보안 관리 시스템
Tang et al. Identifying missed monitoring alerts based on unstructured incident tickets
EP3473035B1 (en) Application resilience system and method thereof for applications deployed on a cloud platform
JP2020141353A (ja) 装置管理方法、管理装置及びプログラム
US11811847B2 (en) Server-side workflow improvement based on client-side data mining
Ghoreishi Takantapeh INNOVATIVE MONITORING SYSTEMS AND PROTOCOLS FOR WIRELESS NETWORKS AND WIRELESS SENSOR NETWORKS
Leach et al. Automated service monitoring in the deployment of ARCHER2