JP5643970B2 - 障害復旧装置および通信装置の復旧方法 - Google Patents

障害復旧装置および通信装置の復旧方法 Download PDF

Info

Publication number
JP5643970B2
JP5643970B2 JP2011158188A JP2011158188A JP5643970B2 JP 5643970 B2 JP5643970 B2 JP 5643970B2 JP 2011158188 A JP2011158188 A JP 2011158188A JP 2011158188 A JP2011158188 A JP 2011158188A JP 5643970 B2 JP5643970 B2 JP 5643970B2
Authority
JP
Japan
Prior art keywords
failure
recovery
command
statistical information
recovery command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011158188A
Other languages
English (en)
Other versions
JP2013025483A (ja
Inventor
大歩 笠井
大歩 笠井
林 良樹
良樹 林
和彦 穂原
和彦 穂原
原田 英二
英二 原田
幸義 井村
幸義 井村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2011158188A priority Critical patent/JP5643970B2/ja
Publication of JP2013025483A publication Critical patent/JP2013025483A/ja
Application granted granted Critical
Publication of JP5643970B2 publication Critical patent/JP5643970B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、通信装置で発生した障害を復旧させるためのコマンドを生成して、障害が発生した通信装置に送信する障害復旧装置および通信装置の復旧方法に関する。
通信ネットワーク上で発生した障害の内容と障害の復旧内容をデータベースに保存しておき、障害が発生した場合に、データベースを参照することによって、復旧コマンドを用意して、障害が発生している装置へ送信する技術が知られている(特許文献1、特許文献2、特許文献3参照)。
特開平8―44641号公報 特開平6―164715号公報 特開2005―346331号公報
しかしながら、特許文献1〜3には、障害発生時に発生したアラームと同じアラームを過去に復旧した履歴情報が無い場合に、障害に応じた最適な復旧コマンドを決定する方法についての開示はなかった。
本発明は、上述した問題に鑑みてなされたものであり、障害発生時に発生したアラームと同じアラームを過去に復旧した履歴情報が無い場合でも、障害を復旧させるための最適な復旧コマンドを決定する技術を提供することを目的とする。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、障害復旧装置は、通信装置で発生した障害の情報を受信する障害情報受信部と、前記通信装置で障害が発生した場合に、前記障害が発生した通信装置の性能を示す情報を統計情報として収集する統計情報収集部と、過去に発生した障害の種類と、その障害を復旧させるために用いられた復旧コマンドと、当該障害に対応して前記統計情報収集部によって収集された統計情報とともに、当該障害の復旧実績、復旧コマンドによる当該障害の復旧時間、当該障害が復旧した日時、当該障害が発生した通信装置のID、前記復旧コマンドの評価のうちの少なくとも一つを格納するコマンド履歴格納部と、前記コマンド履歴格納部に格納されている複数の復旧コマンドの中から、前記コマンド履歴格納部に格納されている統計情報を含む複数の項目に基づいて、前記障害を復旧させるための復旧コマンドを決定する復旧コマンド決定部と、前記復旧コマンド決定部によって決定された復旧コマンドを前記障害が発生した通信装置に送信するコマンド実行部と、を備えることを特徴とする。
本発明の代表的な実施の形態によれば、発生した障害と同じ障害を過去に復旧した履歴情報が無い場合でも、障害に応じた最適な復旧コマンドを決定することができる。
一実施の形態における保守監視装置を備えた移動体通信システムの構成を示す図である。 保守監視装置の詳細な構成を示す図である。 統計情報ファイルデータベースに保持される統計情報ファイルの一例を示す図である。 アラーム情報テーブルの内容の一例を示す図である。 コマンド履歴テーブルの内容の一例を示す図である。 最適コマンド判定部によって行われる処理の流れを示すフローチャートである。 優先順位判定処理の流れを示すフローチャートである。 該当アラームに関して、コマンド履歴テーブルに同一アラームに対して復旧コマンドを実施して復旧した履歴があった場合のコマンドランキングテーブルの内容の一例を示す図である。 コマンド履歴テーブルに、該当アラームの発生前後の統計項目と同じ統計項目を持つ履歴があり、かつその履歴上で復旧したコマンドがあった場合に作成されるコマンドランキングテーブルの内容の一例を示す図である。 保守監視装置が無線基地局からアラームを受信して、保守者が復旧コマンドを実施するシーケンスを示す図である。 無線基地局からアラームを受信して、保守監視装置が自動的に復旧コマンドを実施するシーケンスを示す図である。 無線基地局からアラームを受信したが、保守監視装置が自動的に復旧コマンドを実施しないシーケンスを示す図である。
以下、図面を参照しながら、一実施の形態における障害復旧装置について説明する。
図1は、一実施の形態における障害復旧装置を備えた移動体通信システムの構成を示す図である。図1における保守監視装置13が障害復旧装置を構成する。この移動体通信システムでは、無線基地局(通信装置)12を介して、移動体端末11同士が通信を行う。無線基地局12は、自身の異常(障害)を検出する監視機能を有し、異常を検出すると、保守監視装置13に対して、アラームを通知する。
図2は、保守監視装置13の詳細な構成を示す図である。保守監視装置13は、統計情報収集部131と、アラーム受信部(障害情報受信部)132と、アラーム表示部133と、復旧コマンド受付部134と、最適コマンド判定部(復旧コマンド決定部)135と、コマンド実行部136と、コマンド評価部137と、統計情報ファイルデータベース201と、アラーム情報テーブル202と、コマンド履歴テーブル(コマンド履歴格納部)203と、コマンドランキングテーブル204とを備える。
統計情報収集部131は、定期的に無線基地局12から統計情報を収集する。統計情報とは、無線基地局12が保持するパフォーマンス情報(性能情報)であり、無線基地局12自身の性能値や、無線基地局12が移動端末11と通信する際の通信の性能値等である。統計情報収集部131によって収集された統計情報は、統計情報ファイルとして、統計情報ファイルデータベース(統計情報ファイルDB)201に保持される。
図3は、統計情報ファイルデータベース201に保持される統計情報ファイルの一例を示す図である。統計情報ファイルには、統計項目名、基地局ID、統計項目に対応する単位、時間帯の情報が含まれる。統計項目名には、例えば、無線基地局12のCPU使用率や受信フレーム数、破棄パケット数等が含まれる。図3を参照すると、基地局IDが0001の基地局における2011年3月18日の13時のCPU使用率が3.0(%)であることが分かる。なお、図3に示す例では、5分おきに無線基地局12から統計情報を取得している。
アラーム受信部132は、無線基地局12から障害が発生したことを示すアラームを受信すると、アラーム情報テーブル202に、障害の内容を示すアラーム内容を保持する。
図4は、アラーム情報テーブル202の内容の一例を示す図である。アラーム情報テーブル202には、アラーム名、アラームの発生日時、アラームの復旧日時、基地局IDが含まれる。アラーム名、アラームの発生日時、基地局IDの情報は、無線基地局12から受信したアラームに基づいて設定する。ただし、アラーム受信時は、アラーム復旧日時の情報が無いので、アラーム情報テーブル202の「復旧日時」の項目は空欄となっている。「復旧日時」の項目は、無線基地局12からアラームの回復通知が送信されてきた後に設定される。
アラーム表示部133は、アラーム情報テーブル202の内容を保守者14向けに表示する。上述したように、アラーム受信時は、アラーム情報テーブル202の「復旧日時」の項目は空欄となっているので、保守者14向けの表示も、アラーム復旧日時は空欄のまま表示される。保守者は、表示されたアラーム情報テーブル202の内容を確認することによって、発生している障害に対して最適と思われる復旧コマンドを入力することができる。
復旧コマンド受付部134は、保守者14から復旧コマンドが入力された場合と、入力されなかった場合とで、異なる処理を行う。保守者14から復旧コマンドが入力された場合、復旧コマンド受付部134は、保守者14から入力された復旧コマンドと、対象基地局の基地局IDと、コマンド実施日時をコマンド履歴テーブル203に保存する。
図5は、コマンド履歴テーブル203の内容の一例を示す図である。コマンド履歴テーブル203には、アラームの種類を示すアラーム名、コマンドの種類を示すコマンド名、基地局を特定するための基地局ID、復旧コマンドを実施したコマンド実施日時、復旧コマンドを実施した結果である復旧実績、コマンド復旧時間、評価、統計情報(アラーム発生前)、統計情報(アラーム発生後)の各情報が含まれる。
復旧コマンド受付部134は、入力された復旧コマンドと対応するアラーム情報を、アラーム情報テーブル202から取得して、コマンド履歴テーブル203に保存する。また、取得したアラーム情報からアラームの発生日時の情報を取得し、アラーム発生日時の前後の統計情報を統計情報ファイル201から取得して、通常の統計値と比べて特異な値の統計値と統計項目をコマンド履歴テーブル203に保存する。統計情報を取得する時間帯となるアラーム発生日時の前後の時間帯は、保守者14が設定可能とする。例えば、アラーム発生前後30分と設定すれば、該当基地局のアラーム発生前30分とアラーム発生後30分の統計情報をそれぞれ取得し、特異な値となっている統計情報をコマンド履歴テーブル203に保存する。統計情報の異常判定では、例えば、障害が発生していない正常時の数値の数値範囲を求めて、正常時の数値範囲を超える数値を異常と判定する。
最適コマンド判定部135は、保守者14から復旧コマンドが入力された場合と、入力されない場合とで異なる処理を行う。保守者14から復旧コマンドが入力された場合には、特に処理は行なわずに、コマンド実行部136へ処理を移行する。保守者14から復旧コマンドが入力されない場合には、後述する方法によって、最適な復旧コマンドを決定する。
コマンド実行部136は、保守者14から入力された復旧コマンド、または、最適コマンド判定部135によって決定された復旧コマンドを、復旧コマンドの対象となる無線基地局12へ送信する。また、復旧コマンドのコマンド名とコマンド実施日時をコマンド履歴テーブル203に保存する。
復旧コマンドの送信後にアラームが回復すると、無線基地局12より該当アラームの回復通知が保守監視装置13へ通知される。アラーム受信部132は、アラーム情報テーブル202に該当アラームの復旧日時を保存する。アラーム表示部133は、該当アラームの復旧日時を保守者14向けに表示する。復旧コマンド受付部134は、無線基地局12からアラームの回復通知が送信されてきた場合には、復旧実績とコマンド復旧時間をコマンド履歴テーブル203に保存する。
コマンド履歴テーブル203に保存する復旧実績として、ここでは、障害が完全に復旧したことを示す「○」、障害が部分的に復旧したことを示す「△」、障害が復旧しなかったことを示す「×」のいずれかを記録する。
ここで、部分的に復旧とは、1つの障害に起因して、複数のアラームが発生している状況下で、復旧コマンドを実施することで、障害の根本は復旧できないが、一部のアラームが復旧することを意味する。
例えば、無線基地局12内のFANに障害が発生して、そのFANが冷却を行っていた機器系統で温度異常となり、その結果、高温となったカードでカードの障害が発生した場合を想定する。この場合、障害が発生したカードが行っていたパケット送信ができなくなり、パケットエラーが発生する。従って、保守管理装置13は、対象となる無線基地局12からFAN障害、温度異常、カード障害、パケットエラーの4つのアラームを受信する。
ここで、FAN障害自体の復旧は、ハード的な交換が必要なため、保守管理装置13からのコマンドでは復旧できないが、カードを予備のカードに切り替えるコマンドを実施することによって、パケットエラーを復旧することができる。このコマンドを実施することにより、コマンド実施前に検出していたFAN障害、温度異常、カード障害、パケットエラーのうち、パケットエラーのみが回復する。このコマンドの実施では、FAN障害、温度異常、カード障害は復旧しないが、複数の障害のうちの一部が部分的に復旧したことになる。
コマンド復旧時間は、該当アラームについて、アラーム情報テーブル202のアラームの復旧日時と、コマンド履歴テーブル203のコマンド実施日時との時差を記録する。
保守者14は、アラームに対して行った復旧コマンドに対して、評価を行うことができる。保守者の観点から、該当アラームに対して効果のあった復旧コマンドについては「良」を、効果の無かった復旧コマンドについては「不可」を設定し、復旧時間等の観点から特に効果のあった復旧コマンドについては「優」を設定する。なお、評価を3段階ではなく2段階で設定してもよいし、4段階以上で設定するようにしてもよい。
コマンド評価部137は、保守者14から復旧コマンドの評価入力があった場合に、コマンド履歴テーブル203に評価結果を保存する。
なお、一実施の形態における障害復旧装置では、コマンド履歴テーブル203に保存されている情報に基づいて、無線基地局12で発生した障害を復旧させるための復旧コマンドを決定する。従って、障害復旧装置を実施する初期段階では、なるべく保守者14が復旧コマンドを入力することによって、保守監視装置13のコマンド履歴テーブル203に、実施した復旧コマンドとアラームの履歴情報を充実化させることが望ましい。
保守管理装置13が無線基地局12からアラームを受信し、アラーム表示部133がアラームの表示を行った後に、保守者14から復旧コマンドの入力がない場合、復旧コマンド受付部134は、アラーム情報テーブル202から該当アラームの情報を取得して、コマンド履歴テーブル203に保存する。取得したアラーム情報からアラームの発生日時の情報を取得し、アラーム発生日時の前後の統計情報を統計情報ファイル201より取得し、通常の統計値と比べ特異な値の統計値と統計項目をコマンド履歴テーブル203に保存する。
保守者14から復旧コマンドの入力がない場合、最適コマンド判定部135は、無線基地局12の障害を復旧するための最適な復旧コマンドを判定する処理を行う。復旧コマンドの判定処理は、コマンド履歴テーブル203を参照することにより行う。
図6は、最適コマンド判定部135によって行われる処理の流れを示すフローチャートである。
最適コマンド判定部135は、受信したアラームについて、コマンド履歴テーブル203に、同一のアラームの履歴情報があるか否か判定する。(ステップS1001)。同一のアラームの履歴情報があると判定すると、優先順位判定処理(ステップS1002)へ遷移し、同一のアラームの履歴情報が無いと判定すると、最適コマンドなしと判定(ステップS1004)へ遷移する。
図7は、優先順位判定処理(図6のステップS1002)の流れを示すフローチャートである。
該当アラームに対して、コマンド履歴テーブル203に、同一のアラームであって、かつ、復旧コマンドを実施して復旧した履歴があるか否かを判定する。(ステップS1101)。
コマンド履歴テーブル203に、対象アラームと同一のアラームであって、かつ、復旧コマンドを実施して復旧した履歴があると判定すると、該当アラームに対するコマンド一覧を作成する(ステップS1102)。具体的には、これらの復旧コマンドに対応するアラーム名、コマンド名、復旧実績、コマンド復旧時間、コマンド実施日時、基地局ID、評価、統計情報(アラーム発生前)、統計情報(アラーム発生後)をコマンドランキングテーブル204に保存する。
図8は、該当アラームに関して、コマンド履歴テーブル203に、同一アラームに対して復旧コマンドを実施して復旧した履歴があった場合のコマンドランキングテーブル204の内容の一例を示す図である。復旧には、障害の全てが復旧した場合だけでなく、一部の障害が復旧したものも含まれる。
ステップS1102では、コマンド履歴テーブル203から、該当する復旧コマンドを全て抽出して、コマンドランキングテーブル204に保存する。後述するステップS1103〜S1108では、コマンドランキングテーブル204内の復旧コマンドの優先度を判定する。ただし、優先度判定におけるステップS1103〜S1108については、ステップの番号が小さい方が優先度が高いものとする。
コマンドランキングテーブル204にて、復旧実績で優先順位付けを行う(ステップS1103)。優先順位は、「△」より「○」を高い優先順位として、コマンドランキングテーブル204内のRankを入れ替える(図8参照)。Rankは、数値が低いほど、優先順位が高いものとする。
コマンドランキングテーブル204にて、コマンド復旧時間で優先順位付けを行う(ステップS1104)。優先順位は、コマンド復旧時間が短いものを高い優先順位として、コマンドランキングテーブル204内のRankを入れ替える。
コマンドランキングテーブル204にて、コマンド実施日時で優先順位付けを行う(ステップS1105)。優先順位は、コマンド実施日時がより最近のものを高い優先順位として、コマンドランキングテーブル204内のRankを入れ替える。
コマンドランキングテーブル204にて、基地局IDで優先順位付けを行う(ステップS1106)。優先順位は、コマンドを実施した基地局の基地局IDが該当アラームの基地局IDと同じものを高い優先順位として、コマンドランキングテーブル204内のRankを入れ替える。
コマンドランキングテーブル204にて、評価で優先順位付けを行う(ステップS1107)。優先順位は、「不可」、「良」、「優」の順に優先順位が高くなるものとして、コマンドランキングテーブル204内のRankを入れ替える。
コマンドランキングテーブル204にて、統計情報で優先順位付けを行う(ステップS1108)。優先順位付けは、該当アラームの統計情報(アラーム発生前)の統計項目と同じ統計項目がコマンドランキングテーブル204の統計情報(アラーム発生前)にあり、かつ同じ統計項目が多いコマンドを高い優先順位として、コマンドランキングテーブル204内のRankを入れ替える。ただし、統計項目は、統計項目名の同一性を判断し、数値の同一性までは問わないものとする。例えば、該当アラームの統計情報(アラーム発生前)の統計項目が「CPU使用率:80」であれば、コマンドランキングテーブル204の統計情報(アラーム発生前)に「CPU使用率」の項目があるものの優先順位を高くする。
なお、コマンドランキング204での統計情報での優先順位付けでは、統計情報(アラーム発生前)の代わりに、統計情報(アラーム発生後)を使用するようにしてもよい。例えば、上記の統計情報(アラーム発生前)の順位付けと同様に、該当アラームの統計情報(アラーム発生後)の統計項目と同じ統計項目がコマンドランキングテーブル204の統計情報(アラーム発生後)にあり、かつ同じ統計項目が多いコマンドを高い優先順位とする。
ステップS1101の判定において、該当アラームと同一のアラームがコマンド履歴テーブル203に無い場合、または、該当アラームと同一のアラームがコマンド履歴テーブル203にあるが、復旧コマンドを実施して部分的にも復旧した履歴がないと判定すると、該当アラームの発生前後の統計項目と同じ統計項目を持つ履歴があり、かつその履歴上で復旧したコマンドがあるか否かの判定を行う(ステップS1109)。
該当アラームの発生前後の統計項目と同じ統計項目を持つ履歴があり、かつその履歴上で復旧したコマンドがあると判定すると、該当統計項目に対するコマンド一覧を作成し、コマンドランキングテーブル204に保存する(ステップS1110)。
図9は、コマンド履歴テーブル203に、該当アラームの発生前後の統計項目と同じ統計項目を持つ履歴があり、かつその履歴上で復旧したコマンドがあった場合に作成されるコマンドランキングテーブル204の内容の一例を示す図である。該当アラームの発生前後の統計項目として、「CPU使用率」と「破棄パケット数」が存在するものとする。この場合、コマンド履歴テーブル203の統計情報(アラーム発生前)または統計情報(アラーム発生後)に、「CPU使用率」と「破棄パケット数」の項目があり、かつ、アラームが復旧したコマンドがあるデータ、統計情報(アラーム発生前)または統計情報(アラーム発生後)に「CPU使用率」の項目があり、かつ、アラームが復旧したコマンドがあるデータ、統計情報(アラーム発生前)または統計情報(アラーム発生後)に「破棄パケット数」の項目があり、かつ、アラームが復旧したコマンドがあるデータが抽出されて、コマンドランキングテーブル204が作成される。
続いて、コマンドランキングテーブル204にて、統計情報で優先順位付けを行う。優先順位付けは、該当アラームの統計情報(アラーム発生前)の統計項目と同じ統計項目がコマンドランキングテーブル204の統計情報(アラーム発生前)にあり、かつ同じ統計項目が多いコマンドを高い優先順位とする(ステップS1111)。ここでも、統計項目は、統計項目名の同一性を判断し、数値の同一性までは問わないものとする。
なお、コマンドランキング204での統計情報での優先順位付けでは、統計情報(アラーム発生前)の代わりに、統計情報(アラーム発生後)を使用するようにしてもよい。例えば、上記の統計情報(アラーム発生前)の順位付けと同様に、該当アラームの統計情報(アラーム発生後)の統計項目と同じ統計項目がコマンドランキングテーブル204の統計情報(アラーム発生後)にあり、かつ同じ統計項目が多いコマンドを高い優先順位とする。
ステップS1111の処理を終えた後のステップS1103〜S1107の優先順位付けは、ステップS1101の判定でコマンド履歴テーブル203に履歴があった場合と同じである。ただし、統計情報で優先順位付けを行うステップS1108の処理については、ステップS1111で同様の処理を行っているため実施しない。
ステップS1109の判定で、該当アラームの発生前後の統計項目と同じ統計項目を持つ履歴がない、または、該当アラームの発生前後の統計項目と同じ統計項目を持つ履歴はあるが、その履歴上で復旧したコマンドがない場合には、最適コマンドなしと判定(ステップS1112)へ遷移して、図6のステップS1004へと遷移する。
図6に示すフローチャートにおいて、優先順位判定処理(ステップS1002)で優先順位付けを行うと、優先順位が最も高いコマンド、つまりコマンドランキングテーブル204のRankが1のコマンドを最適コマンドとして特定する(ステップS1003)。ただし、優先順位判定処理(ステップS1002)で、最適コマンドなしと判定(図7のステップS1112)した場合には、最適コマンドなしと判定(ステップS1004)へ遷移する。
最適コマンド判定部135によって最適コマンドが特定されると、コマンド実行部136は、最適コマンドを無線基地局12へ送信する。その際、コマンド実施日時をコマンド履歴テーブル203に保存する。
復旧コマンド実施後にアラームが回復すると、無線基地局12より該当アラームの回復通知が保守監視装置13へ通知される。アラーム受信部132は、アラーム情報テーブル202に該当アラームの復旧日時を保存する。アラーム表示部133は、該当アラームの復旧日時を保守者14向けに表示する。復旧コマンド受付部134は、無線基地局12からアラームの回復通知が送信されてきた場合には、コマンド履歴テーブル203に復旧実績とコマンド復旧時間を保存する。
保守者14は、保守監視装置13が自動的に実施した復旧コマンドに対して、評価を行うことができる。コマンド評価部137は、保守者14から復旧コマンドの評価が入力されると、コマンド履歴テーブル203に評価結果を保存する。
なお、最適コマンド判定部135で最適コマンドなしと判定された場合、コマンド実行部136は、コマンド実行処理を行わない。
図10は、保守監視装置13が無線基地局12からアラームを受信して、保守者14が復旧コマンドを実施するシーケンスを示す図である。アラーム受信部132は、無線基地局12からアラームを受信すると、アラーム表示部133へアラーム表示要求を送る。アラーム表示部133は、アラームを保守者14向けに表示するとともに、復旧コマンド受付部134へ復旧コマンド要求を送る。
復旧コマンド受付部134は、保守者14から復旧コマンドが入力されたか判断し、入力されたと判断すると、最適コマンド判定部135へコマンド実行要求を送る。最適コマンド判定部135は、コマンド実行要求をそのままコマンド実行部136へ送る。コマンド実行部136は、無線地局12へ復旧コマンドを送信する。
図11は、無線基地局12からアラームを受信して、保守監視装置13が自動的に復旧コマンドを実施するシーケンスを示す図である。アラーム受信部132は、無線基地局12からアラームを受信すると、アラーム表示部133へアラーム表示要求を送る。アラーム表示部133は、アラームを保守者14向けに表示するとともに、復旧コマンド受付部134へ復旧コマンド要求を送る。
復旧コマンド受付部134は、保守者14から復旧コマンドが入力されたかを判断し、入力なしと判断すると、最適コマンド判定部135へコマンド判定要求を送る。最適コマンド判定部135は、最適コマンドがあるか判断し、最適コマンドありと判断すると、求めた復旧コマンドの実行要求をコマンド実行部136へ送る。コマンド実行部136は、無線地局12へ復旧コマンドを送信する。
図12は、無線基地局12からアラームを受信したが、保守監視装置13が自動的に復旧コマンドを実施しないシーケンスを示す図である。アラーム受信部132は、無線基地局12からアラームを受信すると、アラーム表示部133へアラーム表示要求を送る。アラーム表示部133は、アラームを保守者14向けに表示するとともに、復旧コマンド受付部134へ復旧コマンド要求を送る。
復旧コマンド受付部134は、保守者14から復旧コマンドが入力されたかを判断し、入力なしと判断すると、最適コマンド判定部135へコマンド判定要求を送る。最適コマンド判定部135は、最適コマンドがあるか判断し、最適コマンドなしと判断すると、処理を終了する。すなわち、コマンド実行部136は、復旧コマンドを送信しない。
以上、一実施の形態における障害復旧装置によれば、過去に発生した障害の種類と、その障害を復旧させるために用いた復旧コマンドと、当該障害に対応して収集された統計情報とともに、当該障害の復旧実績、復旧コマンドによる当該障害の復旧時間、当該障害が復旧した日時、当該障害が発生した通信装置のID、復旧コマンドの評価のうちの少なくとも一つを格納しておき、格納されている複数の復旧コマンドの中から、統計情報を含む複数の項目に基づいて、復旧コマンドを決定する。これにより、発生した障害と同じ障害を過去に復旧した履歴情報が無い場合でも、障害に応じた最適な復旧コマンドを決定することができる。
また、一実施の形態における障害復旧装置によれば、発生した障害と同じ種類であって、かつ、少なくとも一部が復旧した実績がある障害履歴が複数格納されている場合に、統計情報を含む複数の項目に基づいて、障害を復旧させるための復旧コマンドを決定する。これにより、過去に部分的に障害が復旧した復旧コマンドを用いて自動的に復旧コマンドを実施することができるので、完全な復旧作業が行われるまでの間に暫定的な復旧を行うことができる。
特に、一実施の形態における障害復旧装置によれば、発生した障害と同じ種類の障害履歴が格納されていない場合、または、発生した障害と同じ種類の障害履歴が格納されているが、部分的にも復旧した実績がない場合には、発生した障害に対応する統計情報と、格納されている統計情報とに基づいて、障害を復旧させるための復旧コマンドを決定する。これにより、発生した障害と同じ種類の障害履歴が無い場合や、障害の復旧履歴が無い場合でも、統計情報から近似していると考えられる障害に対応する復旧コマンドを用いて、障害の復旧を行うことができる。
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。例えば、上述した実施形態では、通信装置の障害を復旧させる一例として、無線基地局12の障害を復旧させる例を挙げて説明したが、通信装置が無線基地局12に限定されることはなく、通信を行う全ての通信装置に適用することができる。
11 移動端末
12 無線基地局
13 保守監視装置
14 保守者
131 統計情報収集部
132 アラーム受信部
133 アラーム表示部
134 復旧コマンド受付部
135 最適コマンド決定部
136 コマンド実行部
137 コマンド評価部
201 統計情報ファイルデータベース
202 アラーム情報テーブル
203 コマンド履歴テーブル
204 コマンドランキングテーブル

Claims (12)

  1. 通信装置で発生した障害の情報を受信する障害情報受信部と、
    前記通信装置で障害が発生した場合に、前記障害が発生した通信装置の性能を示す情報を統計情報として収集する統計情報収集部と、
    過去に発生した障害の種類と、その障害を復旧させるために用いられた復旧コマンドと、当該障害に対応して前記統計情報収集部によって収集された統計情報とともに、当該障害の復旧実績、復旧コマンドによる当該障害の復旧時間、当該障害が復旧した日時、当該障害が発生した通信装置のID、前記復旧コマンドの評価のうちの少なくとも一つを格納するコマンド履歴格納部と、
    前記コマンド履歴格納部に格納されている複数の復旧コマンドの中から、前記コマンド履歴格納部に格納されている統計情報を含む複数の項目に基づいて、前記障害を復旧させるための復旧コマンドを決定する復旧コマンド決定部と、
    前記復旧コマンド決定部によって決定された復旧コマンドを前記障害が発生した通信装置に送信するコマンド実行部と、
    を備え
    前記復旧コマンド決定部は、前記障害情報受信部で受信した障害と同じ種類の障害が前記コマンド履歴格納部に格納されていない場合、または、前記障害情報受信部で受信した障害と同じ種類の障害が前記コマンド履歴格納部に格納されているが、部分的にも復旧した実績がない場合には、当該障害に対応する統計情報と、前記コマンド履歴格納部に格納されている統計情報とに基づいて、前記障害を復旧させるための復旧コマンドを決定することを特徴とする障害復旧装置。
  2. 前記復旧コマンド決定部は、前記障害情報受信部で受信した障害と同じ種類であって、かつ、少なくとも一部が復旧した実績がある障害が前記コマンド履歴格納部に複数格納されている場合に、前記コマンド履歴格納部に格納されている前記統計情報を含む複数の項目に基づいて、前記障害を復旧させるための復旧コマンドを決定する、
    ことを特徴とする請求項1に記載の障害復旧装置。
  3. 前記復旧コマンド決定部は、前記コマンド履歴格納部に格納されている復旧コマンドのうち、前記障害情報受信部で受信した障害に対応する統計情報と少なくとも一部が同じ統計情報があり、かつ、前記少なくとも一部が同じ統計情報に対応する障害の少なくとも一部が復旧した実績がある復旧コマンドを、前記障害を復旧させるための復旧コマンドとして決定する、
    ことを特徴とする請求項1に記載の障害復旧装置。
  4. 前記復旧コマンド決定部は、前記コマンド履歴格納部に格納されている復旧コマンドのうち、前記障害情報受信部で受信した障害に対応する統計情報と少なくとも一部が同じ統計情報があり、かつ、前記少なくとも一部が同じ統計情報に対応する障害の少なくとも一部が復旧した実績がある復旧コマンドが複数存在する場合には、前記障害情報受信部で受信した障害に対応する統計情報と一致する度合いが高い統計情報に対応する復旧コマンドを、前記障害を復旧させるための復旧コマンドとして決定する、
    ことを特徴とする請求項3に記載の障害復旧装置。
  5. 前記コマンド履歴格納部は、障害の復旧実績、復旧コマンドによる障害の復旧時間、障害が復旧した日時、障害が発生した通信装置のID、前記復旧コマンドの評価のうちの少なくとも一つを格納しており、
    前記復旧コマンド決定部は、前記コマンド履歴格納部に格納されている復旧コマンドのうち、前記障害情報受信部で受信した障害に対応する統計情報と少なくとも一部が同じ統計情報があり、前記少なくとも一部が同じ統計情報に対応する障害の少なくとも一部が復旧した実績がある復旧コマンドが複数存在する場合であって、かつ、前記障害情報受信部で受信した障害に対応する統計情報と一致する度合いが最も高い統計情報が複数存在する場合には、前記コマンド履歴格納部に格納されている障害の復旧実績、前記復旧コマンドによる障害の復旧時間、前記障害が復旧した日時、前記障害が発生した通信装置のID、前記復旧コマンドの評価のうちのいずれかに基づいて、前記障害を復旧させるための復旧コマンドを決定する、
    ことを特徴とする請求項4に記載の障害復旧装置。
  6. 前記復旧コマンド決定部は、障害の復旧実績が高い復旧コマンド、前記復旧コマンドによる障害の復旧時間が短い復旧コマンド、前記障害が復旧した日時が最も近い復旧コマンド、前記障害が発生した通信装置のIDが同じ復旧コマンド、評価が高い復旧コマンドの順に、優先順位が低くなるように優先順位付けをして、優先順位が最も高い復旧コマンドを、前記障害を復旧させるための復旧コマンドとして決定する、
    ことを特徴とする請求項5に記載の障害復旧装置。
  7. 障害が発生した通信装置に対して、復旧コマンドを送信することによって、当該障害を復旧させる障害復旧装置による通信装置の復旧方法であって、
    前記通信装置で発生した障害の情報を受信するステップと、
    前記通信装置で障害が発生した場合に、前記障害が発生した通信装置の性能を示す情報を統計情報として収集するステップと、
    過去に発生した障害の種類と、その障害を復旧させるために用いた復旧コマンドと、当該障害に対応して収集された統計情報とともに、当該障害の復旧実績、復旧コマンドによる当該障害の復旧時間、当該障害が復旧した日時、当該障害が発生した通信装置のID、前記復旧コマンドの評価のうちの少なくとも一つを前記障害復旧装置の記憶部に格納するステップと、
    前記記憶部に格納されている複数の復旧コマンドの中から、前記統計情報を含む複数の項目に基づいて、前記障害を復旧させるための復旧コマンドを決定するステップと、
    前記決定された復旧コマンドを前記障害が発生した通信装置に送信するステップと、
    を含み、
    前記復旧コマンドを決定するステップでは、前記受信された障害と同じ種類の障害が前記記憶部に格納されていない場合、または、前記受信された障害と同じ種類の障害が前記記憶部に格納されているが、部分的にも復旧した実績がない場合には、当該障害に対応する統計情報と、前記記憶部に格納されている統計情報とに基づいて、前記障害を復旧させるための復旧コマンドを決定することを特徴とする通信装置の復旧方法。
  8. 前記復旧コマンドを決定するステップでは、前記受信された障害と同じ種類であって、かつ、少なくとも一部が復旧した実績がある障害が前記記憶部に複数格納されている場合に、前記記憶部に格納されている前記統計情報を含む複数の項目に基づいて、前記障害を復旧させるための復旧コマンドを決定する、
    ことを特徴とする請求項7に記載の通信装置の復旧方法。
  9. 前記復旧コマンドを決定するステップでは、前記記憶部に格納されている復旧コマンドのうち、前記受信された障害に対応する統計情報と少なくとも一部が同じ統計情報があり、かつ、前記少なくとも一部が同じ統計情報に対応する障害の少なくとも一部が復旧した実績がある復旧コマンドを、前記障害を復旧させるための復旧コマンドとして決定する、
    ことを特徴とする請求項7に記載の通信装置の復旧方法。
  10. 前記復旧コマンドを決定するステップでは、前記記憶部に格納されている復旧コマンドのうち、前記受信された障害に対応する統計情報と少なくとも一部が同じ統計情報があり、かつ、前記少なくとも一部が同じ統計情報に対応する障害の少なくとも一部が復旧した実績がある復旧コマンドが複数存在する場合には、前記受信された障害に対応する統計情報と一致する度合いが高い統計情報に対応する復旧コマンドを、前記障害を復旧させるための復旧コマンドとして決定する、
    ことを特徴とする請求項9に記載の通信装置の復旧方法。
  11. 前記記憶部は、障害の復旧実績、復旧コマンドによる障害の復旧時間、障害が復旧した日時、障害が発生した通信装置のID、前記復旧コマンドの評価のうちの少なくとも一つを格納し、
    前記復旧コマンドを決定するステップでは、前記記憶部に格納されている復旧コマンドのうち、前記受信された障害に対応する統計情報と少なくとも一部が同じ統計情報があり、前記少なくとも一部が同じ統計情報に対応する障害の少なくとも一部が復旧した実績がある復旧コマンドが複数存在する場合であって、かつ、前記受信された障害に対応する統計情報と一致する度合いが最も高い統計情報が複数存在する場合には、前記記憶部に格納されている障害の復旧実績、前記復旧コマンドによる障害の復旧時間、前記障害が復旧した日時、前記障害が発生した通信装置のID、前記復旧コマンドの評価のうちのいずれかに基づいて、前記障害を復旧させるための復旧コマンドを決定する、
    ことを特徴とする請求項10に記載の通信装置の復旧方法。
  12. 前記復旧コマンドを決定するステップでは、障害の復旧実績が高い復旧コマンド、前記復旧コマンドによる障害の復旧時間が短い復旧コマンド、前記障害が復旧した日時が最も近い復旧コマンド、前記障害が発生した通信装置のIDが同じ復旧コマンド、評価が高い復旧コマンドの順に、優先順位が低くなるように優先順位付けをして、優先順位が最も高い復旧コマンドを、前記障害を復旧させるための復旧コマンドとして決定する、
    ことを特徴とする請求項11に記載の通信装置の復旧方法。
JP2011158188A 2011-07-19 2011-07-19 障害復旧装置および通信装置の復旧方法 Expired - Fee Related JP5643970B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011158188A JP5643970B2 (ja) 2011-07-19 2011-07-19 障害復旧装置および通信装置の復旧方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011158188A JP5643970B2 (ja) 2011-07-19 2011-07-19 障害復旧装置および通信装置の復旧方法

Publications (2)

Publication Number Publication Date
JP2013025483A JP2013025483A (ja) 2013-02-04
JP5643970B2 true JP5643970B2 (ja) 2014-12-24

Family

ID=47783783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011158188A Expired - Fee Related JP5643970B2 (ja) 2011-07-19 2011-07-19 障害復旧装置および通信装置の復旧方法

Country Status (1)

Country Link
JP (1) JP5643970B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6607572B2 (ja) * 2016-08-10 2019-11-20 日本電信電話株式会社 復旧制御システム及び方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008012903A1 (fr) * 2006-07-27 2008-01-31 Fujitsu Limited Programme de gestion de système, dispositif de gestion de gestion de système, et procédé de gestion de système
JP2008244902A (ja) * 2007-03-28 2008-10-09 Kyocera Corp 障害復旧装置、障害復旧方法、及び障害復旧システム
JP5396792B2 (ja) * 2008-09-25 2014-01-22 富士ゼロックス株式会社 画像処理装置及び障害情報管理システム

Also Published As

Publication number Publication date
JP2013025483A (ja) 2013-02-04

Similar Documents

Publication Publication Date Title
CN107003926B (zh) 故障信息提供服务器、故障信息提供方法
CN104126285A (zh) 用于在云网络中进行快速灾难恢复准备的方法和设备
JP6595861B2 (ja) 情報処理装置、ログ取得方法およびログ取得プログラム
CN102740160A (zh) 电视机软件的故障记录方法及装置
CN111565135A (zh) 监控服务器运行的方法、监控服务器和存储介质
JP4901796B2 (ja) ログレベル収集装置およびログレベル収集方法
JP6665503B2 (ja) データ収集システム、データ収集装置及びデータ収集方法
JP5643970B2 (ja) 障害復旧装置および通信装置の復旧方法
JP2014199618A (ja) 故障監視システム
JP2008244902A (ja) 障害復旧装置、障害復旧方法、及び障害復旧システム
CN101854263A (zh) 网络拓扑的分析处理方法、系统和管理服务器
CN109597728B (zh) 测试设备的控制方法及装置、计算机可读存储介质
JP2007264907A (ja) 障害通報システム、障害通報方法及び障害通報プログラム
JP6659383B2 (ja) プラントデータ伝送システム及びプラントデータ伝送方法
WO2014040470A1 (zh) 告警消息的处理方法及装置
JP2015095876A (ja) プラント監視制御システム
JP2006154991A (ja) 情報処理システム、情報処理システムの制御方法、監視装置、監視プログラム、保守管理プログラム
JP5395951B2 (ja) ネットワーク機器
JP5404440B2 (ja) 通報側システム、プラント情報通報システム及びその方法
JP5029697B2 (ja) オペレーションシステムのサーバシステム
JP2009205221A (ja) 保守管理システム及び保守管理方法
JP2020038428A (ja) 情報処理装置及びプログラム
JP2016057971A (ja) 情報処理システム、プログラム及び情報処理装置
JP2014010538A (ja) 運用管理装置、運用管理システム及び運用管理方法
JP5535392B1 (ja) 障害対応システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140729

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141010

R150 Certificate of patent or registration of utility model

Ref document number: 5643970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees