JP2010045624A - 保守システム - Google Patents
保守システム Download PDFInfo
- Publication number
- JP2010045624A JP2010045624A JP2008208489A JP2008208489A JP2010045624A JP 2010045624 A JP2010045624 A JP 2010045624A JP 2008208489 A JP2008208489 A JP 2008208489A JP 2008208489 A JP2008208489 A JP 2008208489A JP 2010045624 A JP2010045624 A JP 2010045624A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- information
- card
- configuration
- maintenance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】被監視装置の構造に起因する障害の原因を特定し、被監視装置の構造に起因する障害を未然に防ぐこと。
【解決手段】保守センタ(OPE)は、各無線ネットワーク制御装置(RNC)から、RNCを構成する各カードのソフトウェアの版数やハードウェア版数などの構成情報を取得し、その構成情報を蓄積する。OPEは、障害が発生したRNCから障害情報を取得し、その障害情報を蓄積する。OPEは、蓄積した構成情報と障害情報に基づいて障害の原因を解析し、障害の原因となるカードとそのソフトウェアの版数やハードウェア版数を特定する。OPEは、予防保全のため、障害の原因を保守者へ通知する。また、障害が発生したRNC、同じ障害の原因を有する運用中または運用中でない他のRNCにおいて、障害箇所の切り離しと、冗長構成への切り替えが行われる。
【選択図】図3
【解決手段】保守センタ(OPE)は、各無線ネットワーク制御装置(RNC)から、RNCを構成する各カードのソフトウェアの版数やハードウェア版数などの構成情報を取得し、その構成情報を蓄積する。OPEは、障害が発生したRNCから障害情報を取得し、その障害情報を蓄積する。OPEは、蓄積した構成情報と障害情報に基づいて障害の原因を解析し、障害の原因となるカードとそのソフトウェアの版数やハードウェア版数を特定する。OPEは、予防保全のため、障害の原因を保守者へ通知する。また、障害が発生したRNC、同じ障害の原因を有する運用中または運用中でない他のRNCにおいて、障害箇所の切り離しと、冗長構成への切り替えが行われる。
【選択図】図3
Description
この発明は、複数の処理ブロックを備えた複数の被監視装置が存在する環境に対する保守システムに関する。
従来、移動通信網における通信品質の指標の測定結果に対し、その統計的信頼度を考慮して異常度を算出し、異常度に応じた保全を行うシステムが提案されている。このシステムでは、移動通信網におけるネットワーク管理装置は、正常稼動時における通信品質の指標を保持し、無線基地局制御装置から定期的に通信品質の測定結果の入力を受ける。測定結果として、無線セル毎の接続要求回数aに対する接続失敗回数fが得られた場合、正常時の呼損率をp0として接続失敗回数がfよりも大きくなる二項分布の上側確率Bを求める。この上側確率Bの負対数を異常度のスコアとし、異常度のスコアが予め定めた閾値を上回る場合には通信の異常と検出する。この後、算出した異常度のスコアに応じた保全制御が行われ、通信システムの障害が適切に回避される(例えば、特許文献1参照。)。
また、多数の設備から連鎖的にアラームが発生し、かつ複数の事象の多重発生を想定しなければならない場合に、多数のアラームの中から発生事象に直接的に関連する重要アラームを選別するシステムが提案されている。このシステムでは、設備相互関連学習手段は、監視対象の設備に含まれる各エレメントで発生した多数のアラーム信号の発生履歴の同期性から相関のあるアラームを選択した相関データと、連鎖的に発生するアラームの同時発生頻度データを用い、相互関連データを作成後、重要アラーム選別手段へ供給する。重要アラーム選別手段は相互関連データをもとにして、障害で発生したアラームパターン中で故障原因であるアラームだけを選別し、他の入力アラームを抑制し、重要アラームを表示手段に供給する(例えば、特許文献2参照。)。
しかしながら、上記に開示されたシステムでは、故障部品のメーカや版数やLSI(Large Scale Integration)の傾向を調査して障害の傾向を分析するものではないため、障害の原因が装置の構造にある場合、その原因を特定することができないという問題点がある。また、故障部品のメーカや版数やLSIの傾向によって同様の故障が起こるおそれのある部品を的確に特定することができないため、他の装置において同様の故障が発生するのを未然に防ぐことができないという問題点がある。
複数の処理ブロックを備えた複数の被監視装置が存在する環境において、被監視装置の構造に起因する障害の原因を特定することができる保守システムを提供することを目的とする。また、複数の処理ブロックを備えた複数の被監視装置が存在する環境において、被監視装置の構造に起因する障害を未然に防ぐことができる保守システムを提供することを目的とする。
この保守システムは、複数の処理ブロックを備えた複数の被監視装置を監視装置が監視して保守するシステムである。保守システムは、構成情報収集部、障害情報収集部および特定部を備えている。構成情報収集部は、複数の被監視装置から、各被監視装置の処理ブロックの構成情報を収集する。障害情報収集部は、複数の被監視装置から、各被監視装置で発生した障害に関する障害情報を収集する。特定部は、収集された構成情報および収集された障害情報に基づいて、障害の原因となる処理ブロックの構成を特定する。
従って、構成情報収集部により、複数の被監視装置の構成情報が収集され、障害情報収集部により、複数の被監視装置の障害情報が収集され、特定部により、障害の原因となる処理ブロックの構成が特定される。その特定された構成と同じ構成を有する他の被監視装置に対して、同様の障害が発生する前に部品交換やソフトウェアの変更を行うことが可能となる。
この保守システムによれば、被監視装置の構造に起因する障害の原因を特定することができるという効果を奏する。また、被監視装置の構造に起因する障害を未然に防ぐことができるという効果を奏する。
以下に添付図面を参照して、この保守システムの好適な実施の形態を詳細に説明する。特に限定しないが、ここでは、保守システムを携帯電話などの無線通信システムの保守に適用した場合について説明する。
(概略)
図1は、無線通信システムの構成の一例を示す概略図である。図1に示すように、無線通信システムは、無線ネットワーク1、コアネットワーク2、保守センタ(OPE:OPeration Equipment)3および開発メーカ各社のサーバ(以下、開発元サーバとする)4により構成されている。無線ネットワーク1は、携帯電話機等のユーザ端末(UE:User Equipment)5、無線基地局装置(BTS:Base Transceiver Station)6、アンテナ等の通信タワー7および無線ネットワーク制御装置(RNC:Radio Network Controller)8を備えている。コアネットワーク2は、移動マルチメディア交換装置(MMS:Mobile Multimedia switching System)9および公衆網10を備えている。
図1は、無線通信システムの構成の一例を示す概略図である。図1に示すように、無線通信システムは、無線ネットワーク1、コアネットワーク2、保守センタ(OPE:OPeration Equipment)3および開発メーカ各社のサーバ(以下、開発元サーバとする)4により構成されている。無線ネットワーク1は、携帯電話機等のユーザ端末(UE:User Equipment)5、無線基地局装置(BTS:Base Transceiver Station)6、アンテナ等の通信タワー7および無線ネットワーク制御装置(RNC:Radio Network Controller)8を備えている。コアネットワーク2は、移動マルチメディア交換装置(MMS:Mobile Multimedia switching System)9および公衆網10を備えている。
移動マルチメディア交換装置9、無線ネットワーク制御装置8および無線基地局装置6は、ピラミッドの階層構造をなしている。保守センタ3は、監視装置として、被監視装置である移動マルチメディア交換装置9、無線ネットワーク制御装置8および無線基地局装置6を監視し、それらの保守および運用を行う。日本国内には、例えば1000を超える数の無線ネットワーク制御装置が存在する。無線ネットワーク制御装置は、制御部(CP)、処理部(FB)および回線部(IF)などの種々のブロックが組み合わされる。各処理ブロックは、無線ネットワーク制御装置に着脱可能なカードとして提供されている。各無線ネットワーク制御装置は、冗長構成を含めて、例えば200枚を超えるカードを搭載している。
無線ネットワーク制御装置には、新たな通信技術に対応することや、長期間安定して運用を継続することが要求される。そのため、ソフトウェアが変更されたり、カードが追加や変更されることがある。また、故障した箇所を切り離したり、交換する必要がある。長期間の運用中には、部品の生産が終了し、在庫がなくなることがある。そのような場合には、部品の交換によって、異なる無線ネットワーク制御装置間で異なる種類の部品が使用されたり、同一の無線ネットワーク制御装置において異なる種類の部品が使用されることになる。このようなことは、無線基地局装置や移動マルチメディア交換装置においても同様である。
図2および図3は、実施の形態にかかる保守システムの概略を示す説明図である。以下の説明では、被監視装置として無線ネットワーク制御装置を例にして説明するが、被監視装置が無線基地局装置や移動マルチメディア交換装置である場合も同様である。図2に示すように、保守センタは、監視対象の各無線ネットワーク制御装置から、無線ネットワーク制御装置を構成する各カードの構成情報を取得し、その構成情報を蓄積する。その構成情報としては、例えばCP、FBおよびIFなどのカード名称、そのカードの搭載位置、そのカードで実行されるソフトウェアの版数、そのカードを構成するハードウェアの版数および製造番号などの、障害の原因を特定するための解析に必要な情報である。
また、図3に示すように、保守センタは、障害が発生した無線ネットワーク制御装置から障害情報を取得し、その障害情報を蓄積する。そして、保守センタは、蓄積した構成情報と障害情報に基づいて障害の原因を解析し、障害の原因を特定する。例えば、図3に示す例では、今回、制御リンク断が発生したRNC#0では、過去にも制御リンク断が発生している。運用中の他のRNC#8では、制御リンク断が発生していない。RNC#0の今回と過去の障害発生時のカード構成と、RNC#8のカード構成とを比較すると、処理部(FB)カードのソフトウェアの版数が異なっている。従って、保守センタにおいて、処理部(FB)カードの被疑レベルが高く(H:High)、かつ処理部(FB)カードのソフトウェアの版数(同図に、太線で囲む箇所)が故障の原因であるという分析結果が導き出される。被疑レベルについては、H(またはHigh)、M(またはMiddle)、L(またはLow)の順で、障害の原因であることの確度が低くなる。
保守センタは、予防保全のため、この分析結果を通信事業者などの保守者へ通知する。また、この分析結果に基づいて、障害が発生しているRNC#0において、障害箇所の切り離しと、冗長構成への切り替えが行われる。同様に、障害原因とされたソフトウェアの版数と同じ版数のソフトウェアを使用している運用中の他のRNC(図3には示されていない)および運用中でない他のRNC#9においても、障害箇所の切り離しと、冗長構成への切り替えが行われる。
(保守センタのハードウェア構成)
図4は、実施の形態にかかる保守センタのハードウェア構成を示す説明図である。図4に示すように、保守センタ3は、中央処理装置21、作業領域として用いられるRAM(Random Access Memory)などの主記憶装置22、専用ネットワーク向けLAN(Local Area Network)インタフェース23、保守者向けLANインタフェース24およびハードディスクや磁気テープなどの補助記憶装置25を備えている。専用ネットワーク向けLANインタフェース23は、専用ネットワーク31との接続を制御する。専用ネットワーク31には、無線基地局装置6、無線ネットワーク制御装置8、移動マルチメディア交換装置9および開発元サーバ4などが接続されている。保守者向けLANインタフェース24は、保守端末ネットワーク26との接続を制御する。保守端末ネットワーク26には、保守者端末27が接続されている。
図4は、実施の形態にかかる保守センタのハードウェア構成を示す説明図である。図4に示すように、保守センタ3は、中央処理装置21、作業領域として用いられるRAM(Random Access Memory)などの主記憶装置22、専用ネットワーク向けLAN(Local Area Network)インタフェース23、保守者向けLANインタフェース24およびハードディスクや磁気テープなどの補助記憶装置25を備えている。専用ネットワーク向けLANインタフェース23は、専用ネットワーク31との接続を制御する。専用ネットワーク31には、無線基地局装置6、無線ネットワーク制御装置8、移動マルチメディア交換装置9および開発元サーバ4などが接続されている。保守者向けLANインタフェース24は、保守端末ネットワーク26との接続を制御する。保守端末ネットワーク26には、保守者端末27が接続されている。
(保守センタの構成)
図5は、実施の形態にかかる保守センタの構成を示す説明図である。図5に示すように、保守センタ3は、カード情報収集部41、障害情報収集部42、詳細対応情報収集・展開部43、構造的障害切り分け部44、対象装置抽出部45、装置制御部46、ダウンロード制御部47および保守者通知部48の各処理部を備えている。これら各処理部は、中央処理装置21が保守用のソフトウェアを実行することにより実現される。保守用のソフトウェアは、例えば主記憶装置22または補助記憶装置25に格納されている。また、保守センタ3は、カード情報51、障害履歴情報52、ハードウェア版数−詳細対応情報53、障害判定パラメータ55、装置状態56、ダウンロードデータ57およびソフトウェア版数変更可否情報58の各データベースを備えている。これら各データベースは、補助記憶装置25に格納されている。主記憶装置22の作業領域には、障害分析領域54が展開される。なお、図5において、実線の矢印は、制御の流れを示し、破線の矢印は、情報の流れを示す(図15においても同じ)。
図5は、実施の形態にかかる保守センタの構成を示す説明図である。図5に示すように、保守センタ3は、カード情報収集部41、障害情報収集部42、詳細対応情報収集・展開部43、構造的障害切り分け部44、対象装置抽出部45、装置制御部46、ダウンロード制御部47および保守者通知部48の各処理部を備えている。これら各処理部は、中央処理装置21が保守用のソフトウェアを実行することにより実現される。保守用のソフトウェアは、例えば主記憶装置22または補助記憶装置25に格納されている。また、保守センタ3は、カード情報51、障害履歴情報52、ハードウェア版数−詳細対応情報53、障害判定パラメータ55、装置状態56、ダウンロードデータ57およびソフトウェア版数変更可否情報58の各データベースを備えている。これら各データベースは、補助記憶装置25に格納されている。主記憶装置22の作業領域には、障害分析領域54が展開される。なお、図5において、実線の矢印は、制御の流れを示し、破線の矢印は、情報の流れを示す(図15においても同じ)。
カード情報収集部41は、カード情報インタフェース61を介して、図示省略した各無線ネットワーク制御装置から、各無線ネットワーク制御装置が搭載する全カードの情報を収集する。カード情報収集部41は、構成情報収集部としての処理を行う。収集された全カードの情報は、カード情報51に格納される。図6に、カード情報51のデータ構成の一例を示す。図6に示すように、カード情報51には、例えば、カードを搭載している装置、その装置におけるカードの搭載位置、そのカードの名称、そのカードを製造したメーカの名称、そのカードで実行されるソフトウェアの版数およびそのカードを構成するハードウェアの版数の各情報がカードごとに格納される。カード情報51は、各無線ネットワーク制御装置のカードの構成が変更されるたびに、更新される。
障害情報収集部42は、障害情報インタフェース62を介して、図示省略した各無線ネットワーク制御装置から、各無線ネットワーク制御装置で発生した障害の情報を収集する。障害情報収集部42は、障害情報収集部としての処理を行う。収集された障害の情報は、障害履歴情報52に格納される。図7に、障害履歴情報52のデータ構成の一例を示す。図7に示すように、障害履歴情報52には、例えば、障害の発生時刻、障害の分類、障害が発生した装置、その装置における被疑カードの搭載位置、被疑レベル、その被疑カードの名称、その被疑カードを製造したメーカの名称、その被疑カードで実行されるソフトウェアの版数およびその被疑カードを構成するハードウェアの版数の各情報が障害の発生ごとに格納される。障害履歴情報52は、無線ネットワーク制御装置から障害の情報を受信するたびに、更新される。被疑カードとは、障害の原因であると疑われるカードのことを意味する。
詳細対応情報収集・展開部43は、例えば、開発元サーバ4のハードウェア版数−詳細対応情報71から詳細対応情報通知部72を介して、各カードに使用されている部品の詳細情報を収集する。収集された詳細情報は、ハードウェア版数−詳細対応情報53に格納される。図8に、ハードウェア版数−詳細対応情報53のデータ構成の一例を示す。図8に示すように、ハードウェア版数−詳細対応情報53には、例えば、カードを製造したメーカの名称、そのカードの名称およびそのカードを構成するハードウェアの版数、並びにそのカードに実装されている全部品について、種別、製造したメーカの名称、型番および固有情報がカードごとに格納される。このハードウェア版数−詳細対応情報53は、ハードウェアの版数をキーとして詳細情報を索引することができるようになっているとよい。ハードウェア版数−詳細対応情報53は、任意に更新される。また、詳細対応情報収集・展開部43は、障害の原因を解析する際に、部品の詳細情報を展開する。
カード情報51、障害履歴情報52およびハードウェア版数−詳細対応情報53は、障害分析領域54に展開され、障害の解析に供せられる。図9に、障害分析領域54のデータ構成の一例を示す。図9に示すように、障害分析領域54には、例えば、障害の有無、障害の発生時刻、障害の分類、障害が発生した装置、装置におけるカードの搭載位置、被疑レベル、カードの名称、カードを製造したメーカの名称、カードで実行されるソフトウェアの版数およびカードを構成するハードウェアの版数、並びにカードに実装されている全部品について、種別、製造したメーカの名称、型番および固有情報がカードごとに展開される。障害分析領域54は、無線ネットワーク制御装置から障害の情報を受信するたびに、更新される。障害分析領域54には、被疑カードだけではなく、正常なカードの情報も展開される。
構造的障害切り分け部44は、障害分析領域54および障害判定パラメータ55に基づいて、障害の原因を解析し、無線ネットワーク制御装置の構造が原因である障害と、そうでない障害とを区別する。図10に障害判定パラメータ55のデータ構成の一例を示す。図10に示すように、障害判定パラメータ55には、例えば、処理部(FB)カードのソフトウェアの版数などの判定の対象、xx障害(例えば、制御リンク断)などの障害の種別および判定の基準となるパラメータが判定の対象と障害の種別の組み合わせごとに格納される。パラメータとしては、例えば、「障害検出数/運用数」、「障害検出数/障害検出版数」および「障害検出版数/運用数」が用意される。
「障害検出数/運用数」は、検出された障害の原因が構造にあると疑うに十分な、全体の運用数に対する障害検出数の割合を規定し、例えば、適当な数値○を用いて○%以上と定義される。障害検出数とは、実際に障害が検出されたカードの数のことである。運用数とは、運用されているカードの数のことである。「障害検出数/運用数」の値が○%以上であれば、検出された障害の原因が構造にあると判断される。○の値が小さいと、障害の原因が構造にあるのか、そうではなくて部品などの突発的な故障が原因であるのか、ということを判断することができない。一方、○の値が大きいと、障害の原因が構造にあると判断するタイミングが遅れ、同様の障害が広範囲に及んでしまう。これらを考慮して、○の値は、適切に設定される。
「障害検出数/障害検出版数」は、検出された障害が、障害検出版数に依存した障害であると判断することができる、障害検出版数に対する障害検出数の割合を規定し、例えば、適当な数値△を用いて△%以上と定義される。障害検出版数とは、検出された障害の原因となる構成と同じ構成を有するカードの数のことである。つまり、障害検出版数は、実際に障害が検出されたカードの数と、未だ障害は検出されていないが、将来、障害が検出されたカードと同じ原因で障害が発生する可能性のあるカードの数を足した数である。「障害検出数/障害検出版数」の値が△%以上であれば、検出された障害が、障害検出版数に依存した障害であると判断される。障害が発生する確率は、ネットワークの負荷や部品の特性やタイミングなどの影響により異なるので、これらを考慮して、△の値は、適切に設定される。
「障害検出版数/運用数」は、検出された障害の原因となる構成と同じ構成を有するカードと、検出された障害の原因となる構成と同じ構成を有していないカードとが混在している状況において、検出された障害の原因が構造にあるか否かの最適な判断を行なうための、全体の運用数に対する障害検出版数の割合を規定し、例えば、適当な数値□を用いて□%未満と定義される。「障害検出版数/運用数」の値が□%未満であれば、適切な判断を行うことができる。運用されているカードの全てが、検出された障害の原因となる構成と同じ構成を有するカードである場合には、適切な判断を行うことができない。これらを考慮して、□の値は、適切に設定される。
前記○、△および□の各値は、判定の対象ごとに設定され、任意に更新されるようになっている。また、カードの出荷開始直後、および出荷後、ある程度の期間が経過した後の安定期では、前記○、△および□の各値を変更することができるようになっていてもよい。さらに、運用者である通信事業者または開発メーカが前記○、△および□の各値を随時提供し、それを障害判定パラメータ55に反映するようになっていてもよい。
対象装置抽出部45は、障害分析領域54に展開された情報に基づいて、全ての無線ネットワーク制御装置のカードの中から、障害の原因となる構造を有するカードを対象カードとして抽出する。詳細対応情報収集・展開部43、構造的障害切り分け部44および対象装置抽出部45は、特定部としての処理を行う。
装置制御部46は、装置状態56に基づいて、対象カードの切り離しを実施した場合の影響を判断し、装置制御インタフェース63を介して、対象カードの切り離しや、冗長構成への切り替えを制御する。装置制御部46は、装置制御部としての処理を行う。装置状態56には、無線通信システム内の全無線ネットワーク制御装置の状態が格納されている。
ダウンロード制御部47は、ソフトウェア版数変更可否情報58に基づいて、版数の異なるソフトウェアへの変更が可能であるか否かを判断する。版数の変更が可能である場合には、ダウンロード制御部47は、ソフトウェア版数変更可否情報58に基づいて、ダウンロードデータ57から適当な版数のソフトウェアを選択し、ダウンロードデータ64として無線ネットワーク制御装置へ送信する。ダウンロード制御部47は、ダウンロード制御部としての処理を行い、この場合、ダウンロードデータ57はサーバとなる。ダウンロードデータ57には、種々の版数の種々のソフトウェアが格納されている。図11にソフトウェア版数変更可否情報58のデータ構成の一例を示す。図11に示すように、ソフトウェア版数変更可否情報58には、例えば、カードの名称と障害の重要度に応じて適用可能なソフトウェアの版数の範囲がカードごとに格納される。ソフトウェア版数変更可否情報58は、任意に更新される。図12に、障害の分類と重要度の関係の一例を示す。
保守者通知部48は、構造的障害切り分け部44により切り分けられた、障害発生の原因となったカードのソフトウェアの版数やハードウェアの版数や部品などの警報を保守者端末27へ送り、それらの情報を保守者に通知する。また、保守者通知部48は、対象装置抽出部45により抽出された対象カードの警報を保守者端末27へ送り、対象カードを保守者に通知する。保守者通知部48は、通知部としての処理を行う。
(カード情報インタフェース)
図13は、カード情報インタフェースの通知情報の一例を示す説明図である。図13に示すように、カード情報インタフェース61は、各無線ネットワーク制御装置から保守センタに、無線ネットワーク制御装置に搭載されている全てのカードの情報または差分のカードの情報を通知する。
図13は、カード情報インタフェースの通知情報の一例を示す説明図である。図13に示すように、カード情報インタフェース61は、各無線ネットワーク制御装置から保守センタに、無線ネットワーク制御装置に搭載されている全てのカードの情報または差分のカードの情報を通知する。
(障害情報インタフェース)
図14は、障害情報インタフェースの通知情報の一例を示す説明図である。図14に示すように、障害情報インタフェース62は、各無線ネットワーク制御装置から保守センタに、全ての被疑カードの情報と被疑レベルを通知する。
図14は、障害情報インタフェースの通知情報の一例を示す説明図である。図14に示すように、障害情報インタフェース62は、各無線ネットワーク制御装置から保守センタに、全ての被疑カードの情報と被疑レベルを通知する。
(無線ネットワーク制御装置の構成)
図15は、実施の形態にかかる無線ネットワーク制御装置の構成を示す説明図である。図15に示すように、無線ネットワーク制御装置8は、制御部(CP)カード81、処理部(FB)カード82および回線部(IF)カード83を備えている。各カードは、各カードで実行されるソフトウェア84と、カード格納情報85を備えている。カード格納情報85は、各カードの不揮発性メモリに予め格納されている。図16に、カード格納情報85のデータ構成の一例を示す。図16に示すように、カード格納情報85には、例えば、カードを製造したメーカの名称、そのカードの名称、そのカードで実行されるソフトウェアの版数、そのカードの版数および製造番号が格納される。また、無線ネットワーク制御装置8は、カード情報収集部86、障害情報検出部87、自己診断制御部88、装置制御部89およびダウンロード制御部90の各処理部を備えている。これら各処理部は、制御部(CP)カード81で、制御部(CP)カード81に格納されているソフトウェア84が実行されることにより実現される。
図15は、実施の形態にかかる無線ネットワーク制御装置の構成を示す説明図である。図15に示すように、無線ネットワーク制御装置8は、制御部(CP)カード81、処理部(FB)カード82および回線部(IF)カード83を備えている。各カードは、各カードで実行されるソフトウェア84と、カード格納情報85を備えている。カード格納情報85は、各カードの不揮発性メモリに予め格納されている。図16に、カード格納情報85のデータ構成の一例を示す。図16に示すように、カード格納情報85には、例えば、カードを製造したメーカの名称、そのカードの名称、そのカードで実行されるソフトウェアの版数、そのカードの版数および製造番号が格納される。また、無線ネットワーク制御装置8は、カード情報収集部86、障害情報検出部87、自己診断制御部88、装置制御部89およびダウンロード制御部90の各処理部を備えている。これら各処理部は、制御部(CP)カード81で、制御部(CP)カード81に格納されているソフトウェア84が実行されることにより実現される。
カード情報収集部86は、各カードのカード格納情報85からカードの情報を収集する。収集されたカードの情報は、無線ネットワーク制御装置8の起動時やカードの保守を行うタイミングで、カード情報インタフェース61を介して、図示省略した保守センタ3へ送信される。障害情報検出部87は、障害の発生を検出し、障害情報インタフェース62を介して、図示省略した保守センタ3へ被疑カードの情報と被疑レベルを通知する。自己診断制御部88は、障害情報検出部87で障害を検出すると、自己診断を行い、カードの切り替えなどによって自律で被疑カードと被疑レベルを特定する。装置制御部89は、装置制御インタフェース63を介して図示省略した保守センタ3から指示された被疑カードの切り離しや、冗長構成への切り替えを制御する。ダウンロード制御部90は、被疑カードのソフトウェア84を、図示省略した保守センタ3から受信したダウンロードデータ64で置き換える。
(無線ネットワーク制御装置の処理手順)
図17は、実施の形態にかかる保守システムにおける無線ネットワーク制御装置の処理手順を示す説明図である。図17に示すように、各無線ネットワーク制御装置においては、起動時やカードの保守を行う際に、自身が搭載する全てのカードの情報を読み出す(ステップS1)。そして、読み出されたカードの情報に変化があるか否かを判断する(ステップS2)。カードの情報に変化がある場合(ステップS2:Yes)、全てのカードの情報を保守センタへ送信する(ステップS3)。カードの情報に変化がない場合(ステップS2:No)、保守センタへカードの情報を送信する必要はない。次いで、障害の発生を検出したか否かを判断する(ステップS4)。障害の発生を検出した場合(ステップS4:Yes)、装置の切り替えなどによって自律で障害を切り分け(ステップS5)、被疑カードと被疑レベルを特定する(ステップS6)。そして、被疑カードと被疑レベルを障害情報として保守センタへ送信する(ステップS7)。その後、監視周期分待機して(ステップS8)、ステップS1へ戻る。障害の発生を検出しない場合(ステップS4:No)、ステップS5〜ステップS7を行わずに、監視周期分待機して(ステップS8)、ステップS1へ戻る。
図17は、実施の形態にかかる保守システムにおける無線ネットワーク制御装置の処理手順を示す説明図である。図17に示すように、各無線ネットワーク制御装置においては、起動時やカードの保守を行う際に、自身が搭載する全てのカードの情報を読み出す(ステップS1)。そして、読み出されたカードの情報に変化があるか否かを判断する(ステップS2)。カードの情報に変化がある場合(ステップS2:Yes)、全てのカードの情報を保守センタへ送信する(ステップS3)。カードの情報に変化がない場合(ステップS2:No)、保守センタへカードの情報を送信する必要はない。次いで、障害の発生を検出したか否かを判断する(ステップS4)。障害の発生を検出した場合(ステップS4:Yes)、装置の切り替えなどによって自律で障害を切り分け(ステップS5)、被疑カードと被疑レベルを特定する(ステップS6)。そして、被疑カードと被疑レベルを障害情報として保守センタへ送信する(ステップS7)。その後、監視周期分待機して(ステップS8)、ステップS1へ戻る。障害の発生を検出しない場合(ステップS4:No)、ステップS5〜ステップS7を行わずに、監視周期分待機して(ステップS8)、ステップS1へ戻る。
(保守センタの処理手順)
図18および図19は、実施の形態にかかる保守システムにおける保守センタの処理手順を示す説明図である。図18に示すように、保守センタにおいては、全ての無線ネットワーク制御装置から、各無線ネットワーク制御装置に搭載されている全てのカードの情報を受信する(ステップS11)。次いで、全ての無線ネットワーク制御装置から全ての障害情報を受信し、その障害情報を障害履歴情報のデータベースに格納する(ステップS12)。次いで、先に受信した全てのカード情報に変化があるか否かを判断する(ステップS13)。カードの情報に変化がある場合(ステップS13:Yes)、その新たなカードの情報をカード情報のデータベースに格納し、全てのカードの情報を更新する(ステップS14)。カードの情報に変化がない場合(ステップS13:No)、カードの情報を更新する必要はない。次いで、いずれかの無線ネットワーク制御装置から障害情報を受信したか否かを判断する(ステップS15)。障害情報を受信しない場合(ステップS15:No)、ステップS11へ戻る。障害情報を受信した場合(ステップS15:Yes)、その障害情報を障害履歴情報のデータベースに格納し、障害情報を更新する(ステップS16)。次いで、被疑カードの被疑レベルの高い順に、カードごとに次のステップS16〜ステップS31(図19参照)の分析処理を行う。
図18および図19は、実施の形態にかかる保守システムにおける保守センタの処理手順を示す説明図である。図18に示すように、保守センタにおいては、全ての無線ネットワーク制御装置から、各無線ネットワーク制御装置に搭載されている全てのカードの情報を受信する(ステップS11)。次いで、全ての無線ネットワーク制御装置から全ての障害情報を受信し、その障害情報を障害履歴情報のデータベースに格納する(ステップS12)。次いで、先に受信した全てのカード情報に変化があるか否かを判断する(ステップS13)。カードの情報に変化がある場合(ステップS13:Yes)、その新たなカードの情報をカード情報のデータベースに格納し、全てのカードの情報を更新する(ステップS14)。カードの情報に変化がない場合(ステップS13:No)、カードの情報を更新する必要はない。次いで、いずれかの無線ネットワーク制御装置から障害情報を受信したか否かを判断する(ステップS15)。障害情報を受信しない場合(ステップS15:No)、ステップS11へ戻る。障害情報を受信した場合(ステップS15:Yes)、その障害情報を障害履歴情報のデータベースに格納し、障害情報を更新する(ステップS16)。次いで、被疑カードの被疑レベルの高い順に、カードごとに次のステップS16〜ステップS31(図19参照)の分析処理を行う。
分析処理では、まず、障害履歴情報のデータベースから、ステップS15で受信した障害情報の被疑カードと障害分類が同じカードの情報を抽出し、それを被疑カードとして障害分析領域に登録する(ステップS17)。また、カード情報のデータベースから正常なカードの情報を取得し、それを正常カードとして障害分析領域に登録する(ステップS18)。そして、ハードウェア版数−詳細対応情報のデータベースから、各カードのハードウェア版数に対応した詳細情報を取得し、それを障害分析領域に展開する(ステップS19)。次いで、図19に示すように、ソフトウェアの版数が原因となる障害であるか否かを判断する(ステップS20)。その際、上述したように、第1に「障害検出数/運用数」の値が○%以上であるか否か、第2に「障害検出数/障害検出版数」の値が△%以上であるか否か、第3に「障害検出版数/運用数」の値が□%未満であるか否かが、判断の基準となる。この3つの条件が全て満たされるときに、障害の原因がソフトウェアの版数にあると判断される。そうでない場合には、障害の原因がソフトウェアの版数以外にあると判断される。ソフトウェアの版数が原因となる障害である場合(ステップS20:Yes)、その原因であると疑われるソフトウェアの版数を保守者へ通知する(ステップS21)。ソフトウェアの版数が原因となる障害でない場合(ステップS20:No)、保守者への通知は行われない。
次いで、ハードウェアの版数が原因となる障害であるか否かを判断する(ステップS22)。その際、部品レベルの詳細情報も解析対象とする。判断の基準は、前記ソフトウェアの場合と同様である。ハードウェアの版数が原因となる障害である場合(ステップS22:Yes)、その原因であると疑われるハードウェアの版数と部品を保守者へ通知する(ステップS23)。ハードウェアの版数が原因となる障害でない場合(ステップS22:No)、保守者への通知は行われない。次いで、ソフトウェアの版数とハードウェアの版数の組み合わせが原因となる障害であるか否かを判断する(ステップS24)。その際、部品レベルの詳細情報も解析対象とする。判断の基準は、前記ソフトウェアの場合と同様である。組み合わせが原因となる障害である場合(ステップS24:Yes)、その原因であると疑われるソフトウェアの版数とハードウェアの版数と部品の組み合わせを保守者へ通知する(ステップS25)。組み合わせが原因となる障害でない場合(ステップS24:No)、保守者への通知は行われない。
上述した3つの原因のうちのいずれかが原因となる障害であるか否かを判断する(ステップS26)。そうである場合(ステップS26:Yes)、カード情報のデータベースから、他の無線ネットワーク制御装置を含めて、その障害の原因と同じ構造を有する全てのカードを対象カードとして抽出する(ステップS27)。そして、その対象カードの警報を保守者へ通知する(ステップS28)。次いで、対象カードを有する無線ネットワーク制御装置から対象カードを切り離した場合に、無線ネットワーク制御装置への影響を判断し、重大な影響がなければ、対象カードの切り離しを制御する(ステップS29)。次いで、障害の原因がソフトウェアの版数にある場合には、ソフトウェア版数変更可否情報に基づいて、ソフトウェアの版数を変更できるか否かを判断する(ステップS30)。変更できる場合(ステップS30:Yes)、ソフトウェア版数変更可否情報の障害の重要度に応じて、ダウンロードデータのデータベースから適用可能なソフトウェアを選択し、無線ネットワーク制御装置へ送信する。それによって、無線ネットワーク制御装置において、ソフトウェアの版数が変更される(ステップS31)。そして、次の被疑カードに対してステップS17〜ステップS31の分析処理を行う。ソフトウェアの版数を変更できない場合(ステップS30:No)、ステップS31を行わずに、次の被疑カードに対する分析処理へ移行する。また、ステップS26において、いずれかが原因となる障害ではない場合(ステップS26:No)、次の被疑カードに対する分析処理へ移行する。全ての被疑カードについて分析処理が終了したら、ステップS11へ戻る。
以上説明したように、本実施の形態によれば、全ての無線ネットワーク制御装置から、各無線ネットワーク制御装置に搭載された全てのカードについて、ソフトウェアの版数、ハードウェアの版数および部品情報を収集するとともに、全ての障害情報を収集し、それらカードの情報と障害情報を照らし合わせることによって、障害の原因となるカードを特定し、その原因が、カードのソフトウェアの版数、ハードウェアの版数、あるいはソフトウェアの版数とハードウェアの版数の組み合わせにあるのかを特定することができる。また、その原因に特定された構成と同じ構成を有する他の無線ネットワーク制御装置に対して、同様の障害が発生する前に部品交換やソフトウェアの変更を行うことができるので、将来発生する可能性のある障害を未然に防ぐことができる。
また、無線ネットワーク制御装置と同様に、無線基地局装置や移動マルチメディア交換装置に対しても本実施の形態の保守システムを適用し、同時間帯に異なる装置で発生した障害を含めて解析することによって、それらの装置間で障害が発生した場合でも、どちらの装置のどのカードで障害が発生したのかを特定することができる。本実施の形態の保守システムを適用しない場合に装置間で障害が発生すると、どちらの装置のどのカードで障害が発生したのかを特定することができないため、両方の装置のカードを交換する必要がある。それに対して、本実施の形態では、特定したカードのみを交換すればよいので、交換に要する工数や交換部品を削減することができる。また、交換用のカードの準備枚数を減らすことができるので、交換用のカードの製造に要する費用や保守に要する費用を削減することができる。
上述した実施の形態に限らず、種々変更可能である。例えば、ハードウェア版数−詳細対応情報、ソフトウェア版数変更可否情報および障害判定パラメータのうちの一つ以上を開発元サーバに格納しておき、保守センタの起動時または障害解析時に保守センタが開発元サーバからダウンロードするようにしてもよい。また、無線ネットワーク制御装置の各カードにおいて、不揮発性メモリに版数の異なる複数のファームウェアを格納しておき、障害発生時に保守センタからダウンロードするのではなく、自身の不揮発性メモリから適当なファームウェアを選択して版数を変更するようにしてもよい。
上述した実施の形態に関し、さらに以下の付記を開示する。
(付記1)複数の処理ブロックを備えた複数の被監視装置を監視装置が監視して保守する保守システムにおいて、複数の前記被監視装置の複数の前記処理ブロックの構成情報を収集する構成情報収集部と、複数の前記被監視装置の障害情報を収集する障害情報収集部と、前記構成情報収集部により収集された前記構成情報および前記障害情報収集部により収集された前記障害情報に基づいて、障害の原因となる前記処理ブロックの構成を特定する特定部と、を備えることを特徴とする保守システム。
(付記2)前記監視装置は、前記被監視装置に使用されている部品に関する部品情報を保持し、前記特定部は、前記部品情報に基づいて障害の原因となる前記部品を特定することを特徴とする付記1に記載の保守システム。
(付記3)前記監視装置は、前記被監視装置の製造元のサーバから、前記被監視装置に使用されている部品に関する部品情報を取得し、前記特定部は、前記部品情報に基づいて障害の原因となる前記部品を特定することを特徴とする付記1に記載の保守システム。
(付記4)前記特定部により障害の原因に特定された構成を有する前記被監視装置を保守者に通知する通知部、をさらに備えることを特徴とする付記1〜3のいずれか一つに記載の保守システム。
(付記5)前記特定部により障害の原因に特定された構成を有する前記被監視装置に対して、障害の原因に特定された前記構成の切り離しを制御する装置制御部、をさらに備えることを特徴とする付記1〜4のいずれか一つに記載の保守システム。
(付記6)前記特定部により障害の原因に特定されたソフトウェアを、ダウンロードによって別の版数のソフトウェアに変更するダウンロード制御部を、さらに備えることを特徴とする付記1〜5のいずれか一つに記載の保守システム。
(付記7)前記ダウンロード制御部は、異なる版数のソフトウェアを格納するサーバからソフトウェアをダウンロードすることを特徴とする付記6に記載の保守システム。
(付記8)前記被監視装置は、異なる版数のソフトウェアを格納し、前記特定部により障害の原因に特定されたソフトウェアを別の版数のソフトウェアに変更することを特徴とする付記1〜5のいずれか一つに記載の保守システム。
(付記9)前記特定部は、障害の原因となる前記処理ブロックの構成として、ハードウェアの版数とソフトウェアの版数の組み合わせを特定することを特徴とする付記1〜8のいずれか一つに記載の保守システム。
3 監視装置
4 サーバ
6,8,9 被監視装置
41 構成情報収集部
42 障害情報収集部
43,44,45 特定部
46 装置制御部
47 ダウンロード制御部
48 通知部
57 サーバ
81,82,83 処理ブロック
4 サーバ
6,8,9 被監視装置
41 構成情報収集部
42 障害情報収集部
43,44,45 特定部
46 装置制御部
47 ダウンロード制御部
48 通知部
57 サーバ
81,82,83 処理ブロック
Claims (5)
- 複数の処理ブロックを備えた複数の被監視装置を監視装置が監視して保守する保守システムにおいて、
複数の前記被監視装置の複数の前記処理ブロックの構成情報を収集する構成情報収集部と、
複数の前記被監視装置の障害情報を収集する障害情報収集部と、
前記構成情報収集部により収集された前記構成情報および前記障害情報収集部により収集された前記障害情報に基づいて、障害の原因となる前記処理ブロックの構成を特定する特定部と、
を備えることを特徴とする保守システム。 - 前記監視装置は、前記被監視装置に使用されている部品に関する部品情報を保持し、
前記特定部は、前記部品情報に基づいて障害の原因となる前記部品を特定することを特徴とする請求項1に記載の保守システム。 - 前記特定部により障害の原因に特定された構成を有する前記被監視装置を保守者に通知する通知部、をさらに備えることを特徴とする請求項1または2に記載の保守システム。
- 前記特定部により障害の原因に特定された構成を有する前記被監視装置に対して、障害の原因に特定された前記構成の切り離しを制御する装置制御部、をさらに備えることを特徴とする請求項1〜3のいずれか一つに記載の保守システム。
- 前記特定部により障害の原因に特定されたソフトウェアを、ダウンロードによって別の版数のソフトウェアに変更するダウンロード制御部を、さらに備えることを特徴とする請求項1〜4のいずれか一つに記載の保守システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008208489A JP2010045624A (ja) | 2008-08-13 | 2008-08-13 | 保守システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008208489A JP2010045624A (ja) | 2008-08-13 | 2008-08-13 | 保守システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010045624A true JP2010045624A (ja) | 2010-02-25 |
Family
ID=42016619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008208489A Withdrawn JP2010045624A (ja) | 2008-08-13 | 2008-08-13 | 保守システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010045624A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017509262A (ja) * | 2014-03-24 | 2017-03-30 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ネットワーク障害のトラブルシューティング・オプションの識別 |
WO2022162947A1 (ja) * | 2021-02-01 | 2022-08-04 | 日本電信電話株式会社 | 無線システム保守支援装置、無線システム保守支援方法、及び無線システム保守支援プログラム |
-
2008
- 2008-08-13 JP JP2008208489A patent/JP2010045624A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017509262A (ja) * | 2014-03-24 | 2017-03-30 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ネットワーク障害のトラブルシューティング・オプションの識別 |
WO2022162947A1 (ja) * | 2021-02-01 | 2022-08-04 | 日本電信電話株式会社 | 無線システム保守支援装置、無線システム保守支援方法、及び無線システム保守支援プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7617423B2 (en) | System and method for detecting, reporting, and repairing of software defects for a wireless device | |
US20070222576A1 (en) | Method and apparatus for dynamically prioritize network faults based on real-time service degradation | |
CN102047683B (zh) | 用于电信系统中的集中管理网络单元的动态故障分析 | |
JP2006094497A (ja) | 無線ネットワーク・パフォーマンスを監視する方法 | |
JP2011138251A (ja) | 監視制御ネットワークシステム | |
CN112612545A (zh) | 一种服务器集群的配置热加载系统、方法、设备及介质 | |
EP2222099B1 (en) | A method, device and system of disaster recovery and handover control | |
US20070147260A1 (en) | Method for loading a list of alarms by means of an alarm application | |
JP4901796B2 (ja) | ログレベル収集装置およびログレベル収集方法 | |
JP2010045624A (ja) | 保守システム | |
CN101854263A (zh) | 网络拓扑的分析处理方法、系统和管理服务器 | |
CN111309456B (zh) | 一种任务执行方法及系统 | |
US6965309B1 (en) | Alarm data delivery method | |
JP6474714B2 (ja) | エレベーターの監視装置及び遠隔監視システム | |
JP2007264907A (ja) | 障害通報システム、障害通報方法及び障害通報プログラム | |
JP5157736B2 (ja) | ネットワーク監視装置、ネットワーク監視システム及びネットワーク監視方法 | |
JP5350975B2 (ja) | 故障検出装置 | |
KR100937003B1 (ko) | 장치 유지 보수 시스템 및 방법 | |
JP5643970B2 (ja) | 障害復旧装置および通信装置の復旧方法 | |
JP2004363946A (ja) | 故障措置システム、及び、故障要因特定方法 | |
JP2007249838A (ja) | マルチプロセッサシステム及び監視制御方法 | |
JP7192155B1 (ja) | 異常検知サーバ、異常検知システム、及び異常検知方法 | |
JP3892836B2 (ja) | 故障推定装置及び故障推定方法 | |
JP2008153735A (ja) | 故障被疑装置を特定する方法 | |
JP2017117063A (ja) | 無線基地局保守装置、無線基地局保守システム、無線基地局保守方法および無線基地局保守プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20111101 |