JP6837017B2 - 作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法 - Google Patents

作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法 Download PDF

Info

Publication number
JP6837017B2
JP6837017B2 JP2018005908A JP2018005908A JP6837017B2 JP 6837017 B2 JP6837017 B2 JP 6837017B2 JP 2018005908 A JP2018005908 A JP 2018005908A JP 2018005908 A JP2018005908 A JP 2018005908A JP 6837017 B2 JP6837017 B2 JP 6837017B2
Authority
JP
Japan
Prior art keywords
failure
location
cause
failure location
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018005908A
Other languages
English (en)
Other versions
JP2019125940A (ja
Inventor
大石 晴夫
晴夫 大石
謙史 糸井
謙史 糸井
鈴木 聡
聡 鈴木
功司 梶原
功司 梶原
太祐 矢川
太祐 矢川
岡崎 勝彦
勝彦 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018005908A priority Critical patent/JP6837017B2/ja
Publication of JP2019125940A publication Critical patent/JP2019125940A/ja
Application granted granted Critical
Publication of JP6837017B2 publication Critical patent/JP6837017B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

この発明は、大規模通信ネットワークにおける推定障害箇所の復旧を行う作業者を補助する作業手順提示装置及び作業手順提示方法に関する。また、この発明は、大規模通信ネットワークにおける推定障害箇所の復旧を行う復旧装置を制御する自動制御装置及び自動制御方法に関する。
通信キャリアネットワーク等の大規模通信ネットワークにおいて、そのネットワーク上の何処かで故障が発生した場合には、故障切り分けとその故障の要因解析を行うことが必要である。この故障切り分け及び要因解析を迅速に行い得るようにするため、障害ケース毎に「各監視対象装置で発生する障害イベントの発生状況」と「障害要因」の因果関係をIF−THENルールとして予め定義しておき、そのルールに基づいて、障害要因の解析を行う手法がある。しかし、ルールを定義するためには、膨大な障害イベントの中から、ルールの条件部に定義すべき障害イベントを検討し絞り込んだ上で、ルール入力が必要となる。そのため、ルール定義者は障害事象に関する知識と経験が必要であり、かつ、時間と労力が掛かるという課題がある。
そこで、非特許文献1には、障害要因箇所を判定可能なルールを自動で生成及び修正する技術が提案されている。この自動障害箇所推定技術は、各障害固有の障害イベントの組合せを障害対応都度、全ての障害事例において抽出することで、ルールの自動学習を実現し、障害推定の判定精度を適応的に向上するというものである。
糸井,大石,岡崎,「キャリアネットワークにおける自動障害箇所推定技術の提案」,電子情報通信学会通信ソサイエティ大会,B−14−12,2016
上記非特許文献1に提案されている自動障害箇所推定技術では、障害箇所と原因が推定され、提示される。この障害を回復させるために次に実施すべき対処は、作業者が判断しなければならない。すなわち、作業者は、マニュアル化された作業手順により障害を回復させるために、マニュアルを検索して、障害回復のための対処方法を探索することが必要である。このように、推定された障害箇所と原因から行うべき作業を作業者が判断して実施するため、作業に時間がかかるという問題がある。特に、マニュアルの検索にはノウハウが必要で、探索時間の長短は作業者のスキルに依存しており、作業者によっては、障害回復のための作業に多大な時間がかかってしまう。
この発明は上記事情に着目してなされたもので、大規模通信ネットワークにおける推定障害箇所の復旧作業を迅速に行える作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法を提供しようとするものである。
上記課題を解決するためにこの発明の第1の態様は、作業手順提示装置が、障害復旧のための作業手順を記憶した作業手順記憶手段と、大規模通信ネットワークにおける障害箇所及び障害原因を推定する障害箇所及び障害原因推定装置から出力された障害箇所及び障害原因の推定結果に基づいて、故障箇所の候補及び故障原因の候補を提示し、故障箇所及び故障原因の選択を受け付ける選択手段と、上記選択手段によって選択された上記故障箇所及び上記故障原因に対応する作業手順を、上記作業手順記憶手段より検索する検索手段と、上記検索手段によって検索した作業手順を提示する提示手段と、を備え、上記選択手段は、上記故障箇所の候補を提示し、上記提示された上記故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、上記選択された故障箇所に従って抽出した上記故障原因の候補を提示し、上記提示された上記故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付けるようにしたものである。
この発明の第2の態様は、上記第1の態様の作業手順提示装置において、作業結果の入力を受け付ける入力手段と、上記入力手段によって入力された作業結果を、上記障害箇所及び障害原因推定装置における障害箇所の特定のための絞込条件として、上記障害箇所及び障害原因推定装置に投入する絞込条件投入手段と、を更に備えるようにしたものである。
この発明の第3の態様は、上記第1の態様の作業手順提示装置において、作業結果の入力を受け付ける入力手段と、上記入力手段によって入力された作業結果を、上記障害箇所及び障害原因推定装置における障害箇所の推定ルールの学習条件として、上記障害箇所及び障害原因推定装置に投入する学習条件投入手段と、を更に備えるようにしたものである。
また、上記課題を解決するためにこの発明の第4の態様は、制御部と、障害復旧のための作業手順を記憶した記憶部と、操作者による操作を受け付ける操作部と、情報を上記操作者に提示する表示部と、を有する作業手順提示装置における作業手順提示方法であって、上記表示部により、大規模通信ネットワークにおける障害箇所及び障害原因を推定する障害箇所及び障害原因推定装置から出力された障害箇所及び障害原因の推定結果に基づく故障箇所の候補を提示し、上記操作部により、上記提示された上記故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、上記表示部により、上記選択された故障箇所に従って抽出した上記障害原因の推定結果に基づく故障原因の候補を提示し、上記操作部により、上記提示された故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付け、上記制御部により、上記選択された故障箇所及び故障原因に対応する作業手順を、上記記憶部より検索し、上記表示部により、上記検索した作業手順を提示するようにしたものである。
また、上記課題を解決するためにこの発明の第5の態様は、自動制御装置が、障害復旧のための制御手順を記憶した制御手順記憶手段と、大規模通信ネットワークにおける障害箇所及び障害原因を推定する障害箇所及び障害原因推定装置から出力された障害箇所及び障害原因の推定結果に基づいて、故障箇所の候補及び故障原因の候補を提示し、故障箇所及び故障原因の選択を受け付ける選択手段と、上記選択手段によって選択された上記故障箇所及び上記故障原因に対応する制御手順を、上記制御手順記憶手段より検索する検索手段と、前記検索手段によって検索した制御手順に従って、上記選択手段によって選択された上記故障箇所に対応する装置の動作を制御する制御コマンドを送信することにより当該装置を復旧するための制御を行う復旧制御手段と、を備え
上記選択手段は、上記故障箇所の候補を提示し、上記提示された上記故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、上記選択された故障箇所に従って抽出した上記故障原因の候補を提示し、上記提示された上記故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付けるようにしたものである。
この発明の第6の態様は、上記第5の態様の自動制御装置において、上記復旧制御手段による制御結果を受信し、その受信した制御結果を、上記障害箇所及び障害原因推定装置における障害箇所の特定のための絞込条件として、上記障害箇所及び障害原因推定装置に投入する絞込条件投入手段を更に備えるようにしたものである。
この発明の第7の態様は、上記第5の態様の自動制御装置において、上記復旧制御手段による制御結果を受信し、その受信した制御結果を、上記障害箇所及び障害原因推定装置における障害箇所の推定ルールの学習条件として、上記障害箇所及び障害原因推定装置に投入する学習条件投入手段を更に備えるようにしたものである。
また、上記課題を解決するためにこの発明の第8の態様は、制御部と、障害復旧のための制御手順を記憶した記憶部と、操作者による操作を受け付ける操作部と、情報を上記操作者に提示する表示部と、通信部と、を有する自動制御装置における自動制御方法であって、上記表示部により、大規模通信ネットワークにおける障害箇所及び障害原因を推定する障害箇所及び障害原因推定装置から出力された障害箇所及び障害原因の推定結果に基づく故障箇所の候補を提示し、上記操作部により、上記提示された上記故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、上記表示部により、上記選択された故障箇所に従って抽出した前記障害原因の推定結果に基づく故障原因の候補を提示し、上記操作部により、上記提示された上記故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付け、上記制御部により、上記選択された上記故障箇所及び上記故障原因に対応する制御手順を、上記記憶部より検索し、上記制御部により、上記検索した制御手順に従って、上記選択された上記故障箇所に対応する装置の動作を制御する制御コマンドを上記通信部を介して送信することにより当該装置を復旧するための制御行うようにしたものである。
この発明の第1の態様によれば、作業手順提示装置は、障害箇所及び障害原因推定装置から大規模通信ネットワークにおける障害箇所及び障害原因の推定結果を受けたとき、それに基づいて故障箇所の候補を提示し、提示された故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、選択された故障箇所に従って抽出した故障原因の候補を提示し、提示された故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付ける。そして、選択された故障箇所及び故障原因に対応する作業手順を、障害復旧のための作業手順を記憶している作業手順記憶手段より検索し、この検索された作業手順を作業者に対して提示する。このように、大規模通信ネットワークにおける推定障害箇所の復旧を行う作業者に作業手順を提示することで、作業者による復旧作業を補助することができ、さらに、不要な故障原因を排除することができるので、復旧作業を迅速に行えるようになる。また、作業者に、作業手順において次に取るべき対処方法を提示することで、作業者が実施すべき作業が明確になり、保守作業の効率化を実現することができる。
この発明の第2の態様によれば、作業手順提示装置は、作業者による復旧作業の結果を入力し、これを、障害箇所及び障害原因推定装置における障害箇所の特定のための絞込条件として、その障害箇所及び障害原因推定装置に投入する。このように、作業手順に従った作業結果を絞込条件として障害箇所及び障害原因推定装置に投入することで、障害箇所及び障害原因推定装置では、作業結果をイベントとして追加して、この作業結果を含む推定を行うことで、障害箇所の推定精度を向上させることが可能となる。よって、誤った障害箇所を推定して復旧を遅らせてしまうことを減少させることが可能となるので、復旧作業を迅速に行えるようになる。
この発明の第3の態様によれば、作業手順提示装置は、作業者による復旧作業の結果を入力し、これを、障害箇所及び障害原因推定装置における障害箇所の推定ルールの学習条件として、その障害箇所及び障害原因推定装置に投入する。このように、作業手順に従った作業結果を推定ルールの学習条件として障害箇所及び障害原因推定装置に投入することで、障害箇所及び障害原因推定装置では、作業結果に基づきルール学習を行うことができ、障害箇所の推定ルールの精度向上、延いては、障害箇所の推定精度を向上させることが可能となる。よって、誤った障害箇所を推定して復旧を遅らせてしまうことを減少させることが可能となるので、復旧作業を迅速に行えるようになる。
また、この発明の第4の態様によれば、障害箇所及び障害原因推定装置から大規模通信ネットワークにおける障害箇所及び障害原因の推定結果を受けたとき、それに基づいて故障箇所の候補を表示部により提示し、操作部により、提示された故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、選択された故障箇所に従って抽出した障害原因の推定結果に基づく故障原因の候補を表示部により提示し、操作部により、提示された故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付ける。そして、制御部により、不要な故障原因を排除された故障原因に対応する作業手順を、障害復旧のための作業手順を記憶している記憶部より検索し、この検索された作業手順を、選択された故障と共に、表示部によって作業者に対して提示する。このように、大規模通信ネットワークにおける推定障害箇所の復旧を行う作業者に、故障箇所と作業手順を提示することで、作業者による復旧作業を補助することができるので、復旧作業を迅速に行えるようになる。また、作業者に、作業手順において次に取るべき対処方法を提示することで、作業者が実施すべき作業が明確になり、復旧作業の効率化を実現することができる。
また、この発明の第5の態様によれば、自動制御装置は、障害箇所及び障害原因推定装置から大規模通信ネットワークにおける障害箇所及び障害原因の推定結果を受けたとき、それに基づいて、故障箇所の候補を提示し、提示された故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、選択された故障箇所に従って抽出した故障原因の候補を提示し、提示された故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付ける。この不要な故障原因が排除された故障箇所及び故障原因に対応する制御手順を、障害復旧のための制御手順を記憶している制御手順記憶手段より検索し、この検索された制御手順に従って、特定された故障箇所を復旧するための制御を行う。このように、大規模通信ネットワークにおける推定障害箇所の復旧を行う制御を、制御手順に従って行うことで、復旧作業を自動実行することができる。よって、復旧作業を迅速に行えると共に、自動化による復旧作業の効率化を実現することができる。
この発明の第6の態様によれば、自動制御装置は、復旧制御の制御結果を受信し、その受信した制御結果を、障害箇所及び障害原因推定装置における障害箇所の特定のための絞込条件として、その障害箇所及び障害原因推定装置に投入する。このように、制御手順に従った復旧のための自動制御の結果を絞込条件として障害箇所及び障害原因推定装置に投入することで、障害箇所及び障害原因推定装置では、自動制御結果をイベントとして追加して、この自動制御結果を含む推定を行うことで、障害箇所の推定精度を向上させることが可能となる。よって、誤った障害箇所を推定して復旧を遅らせてしまうことを減少させることが可能となるので、復旧作業を迅速に行えるようになる。
この発明の第7の態様によれば、自動制御装置は、復旧制御の制御結果を受信し、その受信した制御結果を、障害箇所及び障害原因推定装置における障害箇所の推定ルールの学習条件として、その障害箇所及び障害原因推定装置に投入する。このように、制御手順に従った復旧のための自動制御の結果を推定ルールの学習条件として障害箇所及び障害原因推定装置に投入することで、障害箇所及び障害原因推定装置では、自動制御結果に基づきルール学習を行うことができ、障害箇所の推定ルールの精度向上、延いては、障害箇所の推定精度を向上させることが可能となる。よって、誤った障害箇所を推定して復旧を遅らせてしまうことを減少させることが可能となるので、復旧作業を迅速に行えるようになる。
また、この発明の第8の態様によれば、障害箇所及び障害原因推定装置から大規模通信ネットワークにおける障害箇所及び障害原因の推定結果を受けたとき、それに基づいて故障箇所の候補を表示部により提示し、操作部により、提示された故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、選択された故障箇所に従って抽出した障害原因の推定結果に基づく故障原因の候補を表示部により提示し、操作部により、提示された故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付ける。そして、不要な故障原因が排除された故障原因に対応する制御手順を、障害復旧のための制御手順を記憶している記憶部より検索し、この検索された制御手順に従って、選択された故障箇所を復旧する制御を行う。このように、大規模通信ネットワークにおける推定障害箇所の復旧を行う制御を、制御手順に従って行うことで、復旧作業を自動実行することができる。よって、復旧作業を迅速に行えると共に、自動化による復旧作業の効率化を実現することができる。
すなわちこの発明の各態様によれば、大規模通信ネットワークにおける推定障害箇所の復旧を行う作業者を補助することで、または、推定障害箇所の復旧を行う復旧装置を制御することで、復旧作業を迅速に行えるようにした作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法を提供することができる。
この発明の第1の実施形態における障害復旧システムの全体構成を示すブロック図。 図1に示した障害復旧システムにおける故障原因及び故障箇所選択装置の記憶部に記憶されている故障原因:作業手順リストの一例を示す図。 図1に示した障害復旧システムの動作を示すシーケンス図。 図1に示した障害復旧システムにおける故障原因及び故障箇所選択装置の表示部に表示される故障情報表示画面の一例を示す図。 図3の故障情報表示画面上に表示される故障原因選択ウィンドウの一例を示す図。 作業手順管理装置の表示部に表示される作業手順表示画面の一例を示す図。 第1の実施形態の第1の変形例における障害復旧システムの動作を示すシーケンス図。 第1の実施形態の第2の変形例における障害復旧システムの動作を示すシーケンス図。 第1の実施形態の第3の変形例における障害復旧システムの全体構成を示すブロック図。 第1の実施形態の第3の変形例における障害復旧システムの動作を示すシーケンス図。 この発明の第2の実施形態における障害復旧システムの全体構成を示すブロック図。 図11に示した障害復旧システムにおける自動制御実行装置の記憶部に記憶されている故障原因,故障箇所:制御リストの一例を示す図。 図11に示した障害復旧システムの動作を示すシーケンス図。 第2の実施形態の第1の変形例における障害復旧システムの動作を示すシーケンス図。 第2の実施形態の第2の変形例における障害復旧システムの動作を示すシーケンス図。 第2の実施形態の第3の変形例における障害復旧システムの全体構成を示すブロック図。 第2の実施形態の第3の変形例における障害復旧システムの動作を示すシーケンス図。
以下、図面を参照してこの発明に係わる実施形態を説明する。
[第1の実施形態]
(構成)
図1は、この発明の第1の実施形態における障害復旧システムの全体構成を示すブロック図である。
本実施形態の障害復旧システムは、障害箇所及び障害原因推定装置1と、実施形態に係る作業手順提示装置を構成する故障原因及び故障箇所選択装置2並びに作業手順管理装置3と、を備えている。
障害箇所及び障害原因推定装置1は、CPU(Central Processing Unit)等のプロセッサ、ROMやRAM等のメモリ、などを含むコンピュータである制御部11と、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の記憶媒体を含む記憶部12と、通信部13と、を有している。
通信部13は、光ファイバを用いた有線回線により、通信キャリアネットワーク等の大規模通信ネットワークNWに接続され、大規模通信ネットワークNWに含まれる多数の監視対象装置BSとの間で通信する。さらに通信部13は、有線または無線回線により、故障原因及び故障箇所選択装置2に接続され、その故障原因及び故障箇所選択装置2との間で通信する。なお、上記監視対象装置BSは、例えば、図示しないユーザ側装置との間で無線回線を介して通信が可能な無線アクセス装置としての無線基地局である。
記憶部12は、大規模通信ネットワークNWのネットワークトポロジを記憶している。さらに、記憶部12は、障害ケース毎に「各監視対象装置BSで発生するアラームやログなどのイベント(障害イベント)の発生状況」と「障害原因」の因果関係を、障害箇所の推定ルールとして学習記憶している。また記憶部12は、制御部11のプロセッサが実行するプログラムを記憶していてもよい。
制御部11は、当該制御部11のプロセッサが、当該制御部11のROM又はRAMに記憶されたプログラム、もしくは記憶部12に記憶されたプログラムを実行する。これにより、制御部11は、以下のような処理機能を有することができる。
(1)通信部13により監視対象装置BSからのアラームなどを受信したとき、その障害イベントと、記憶部12に記憶しているネットワークトポロジ及び推定ルールに基づいて、障害箇所及び障害原因を推定する処理。
(2)障害箇所及び障害原因の推定結果を、通信部13により、故障原因及び故障箇所選択装置2に送信することで、推定結果を故障原因及び故障箇所選択装置2に提示する処理。
故障原因及び故障箇所選択装置2は、CPU等のプロセッサ、ROMやRAM等のメモリ、などを含むコンピュータである制御部21と、HDDやSSD等の記憶媒体を含む記憶部22と、通信部23と、液晶ディスプレイや有機EL(Electroluminescence)ディスプレイ等の表示装置である表示部24と、表示部24の表示面上に配置されたタッチパネルや、キーボード、マウス等のポインティングデバイス、などである操作部25と、を有している。
通信部23は、それぞれ有線または無線回線により、障害箇所及び障害原因推定装置1と作業手順管理装置3とに接続され、障害箇所及び障害原因推定装置1との間、及び、作業手順管理装置3との間で通信する。
記憶部22は、障害箇所及び障害原因と故障原因名及び作業手順名との対応関係を記憶している。さらに、記憶部22は、故障原因名と作業手順名との対応関係を、故障原因:作業手順リストとして記憶している。図2は、この記憶部22に記憶されている故障原因:作業手順リストの一例を示す図である。また記憶部22は、制御部21のプロセッサが実行するプログラムを記憶していてもよい。
制御部21は、当該制御部21のプロセッサが、当該制御部21のROM又はRAMに記憶されたプログラム、もしくは記憶部22に記憶されたプログラムを実行する。これにより、制御部21は、以下のような処理機能を有することができる。
(1)通信部23により障害箇所及び障害原因推定装置1から障害箇所及び障害原因の推定結果を受信したとき、その推定結果により、記憶部22に記憶されている障害箇所及び障害原因と故障原因名及び作業手順名との対応関係から、故障原因及び故障箇所の候補を検索する処理。
(2)検索した故障原因及び故障箇所の候補を、表示部24により、所定の操作者または大規模通信ネットワークNWにおける推定障害箇所の復旧を行う作業者に提示する処理。
(3)操作者又は作業者が操作部25により故障原因及び故障箇所の選択を行ったとき、記憶部22に記憶している故障原因:作業手順リストから、選択された故障原因の原因名に該当する作業手順名を検索する処理。
(4)検索した作業手順名を含む作業手順提示指示を、通信部23により作業手順管理装置3に送信する処理。
作業手順管理装置3は、CPU等のプロセッサ、ROMやRAM等のメモリ、などを含むコンピュータである制御部31と、HDDやSSD等の記憶媒体を含む記憶部32と、通信部33と、液晶ディスプレイや有機ELディスプレイ等の表示装置である表示部34と、表示部34の表示面上に配置されたタッチパネルや、キーボード、マウス等のポインティングデバイス、などである操作部35と、を有している。なお、操作部35は、任意であり、無くても良い。
通信部33は、有線または無線回線により、故障原因及び故障箇所選択装置2に接続され、故障原因及び故障箇所選択装置2との間で通信する。
記憶部32は、各作業手順について、実際に作業者が取るべき対処方法の詳細内容を記憶している。また記憶部32は、制御部31のプロセッサが実行するプログラムを記憶していてもよい。
制御部31は、当該制御部31のプロセッサが、当該制御部31のROM又はRAMに記憶されたプログラム、もしくは記憶部32に記憶されたプログラムを実行する。これにより、制御部31は、以下のような処理機能を有することができる。
(1)通信部33により故障原因及び故障箇所選択装置2から作業手順提示指示を受信したとき、その作業手順提示指示に含まれる作業手順名をキーにして記憶部32を検索して、実際に作業者が取るべき作業手順を取得する処理。
(2)取得した作業手順を表示部34により作業者に提示する処理。
(動作)
次に、以上のように構成された障害復旧システムの動作を説明する。図3はその障害復旧システムの動作を示すシーケンス図である。
障害箇所及び障害原因推定装置1の制御部11は、通信部13により監視対象装置BSからのアラームなどを受信すると、その障害イベントと、記憶部12に記憶しているネットワークトポロジ及び推定ルールに基づいて、障害箇所及び障害原因を推定する(ステップS1)。そして、障害箇所及び障害原因の推定結果を、通信部13により、故障原因及び故障箇所選択装置2に送信することで、推定結果を故障原因及び故障箇所選択装置2に提示する(ステップS2)。なお、推定結果として、複数の障害箇所及び/または複数の障害原因が推定された場合には、それら推定結果の全てを送信する。
故障原因及び故障箇所選択装置2の制御部21は、通信部23により障害箇所及び障害原因推定装置1から障害箇所及び障害原因の推定結果を受信すると、その推定結果に基づいて、所定の操作者または復旧を行う作業者に、故障原因及び故障箇所の候補を表示部24により提示し、操作者又は作業者の操作部25の操作による故障原因及び故障箇所の選択を受ける(ステップS3)。
例えば、制御部21は、図4に示すように、表示部24の表示面241に故障情報表示画面242を表示して、推定結果の障害箇所に基づく故障箇所の候補を提示する。故障箇所の候補は、例えば、色を変えるなど識別表示して、候補ではない監視対象装置BSと区別可能にする。図4の例では、二つの監視対象装置BSが故障箇所の候補として挙げられている。操作者又は作業者の操作部25の操作によって、一つの候補が故障箇所として選択されると、制御部21は、その選択された監視対象装置BSに、更に色を変えたり、X印を付したりするなどの更なる識別表示を行う。
故障情報表示画面242は、『作業手順表示』ボタン243を含む。操作者又は作業者の操作部25の操作によって、この『作業手順表示』ボタン243が押下されると、制御部21は、図5に示すように、故障情報表示画面242上に、故障原因選択ウィンドウ244をポップアップ表示する。この故障原因選択ウィンドウ244は、故障原因名の一覧245と、それらに対応するチェックボックス246と、『OK』ボタン247と、『キャンセル』ボタン248とを含む。故障原因名の一覧245では、推定結果の障害原因から、選択された故障箇所に従った故障原因名が抽出されて表示される。制御部21は、ウィンドウの初期表示では、抽出された全故障原因名に対してチェックボックス246にチェックを入れた状態で表示する。操作者又は作業者の操作部25の操作によって、不要な故障原因名に対するチェックを外すことができる。操作部25の操作によって『キャンセル』ボタン248が押下されると、制御部21は、この故障原因選択ウィンドウ244を閉じて、図4の故障情報表示画面242の表示に戻す。
操作部25の操作によって『OK』ボタン247が押下されると、制御部21は、記憶部22に記憶している故障原因:作業手順リストから、チェックボックス246がチェックされている選択された故障原因名に該当する作業手順名を検索し、検索した作業手順名を含む作業手順提示指示を、通信部23により作業手順管理装置3に送信する(ステップS4)。なお、作業手順提示指示は、複数の作業手順名を含むこともあり得る。
作業手順管理装置3の制御部31は、通信部33により故障原因及び故障箇所選択装置2から作業手順提示指示を受信すると、その作業手順提示指示に含まれる作業手順名をキーにして記憶部32を検索して、実際に作業者が取るべき作業手順を取得する(ステップS5)。そして、制御部31は、その取得した作業手順を表示部34により作業者に提示する(ステップS6)。図6は、この表示部34の表示面341に表示される作業手順表示画面342の一例を示す図である。同図では、フローチャートの形式で表示しているが、処理ステップ毎の表示を順次行う等でも良く、特に表示形式は限定しない。また、作業手順提示指示が複数の作業手順名を含む場合、あるいは一つしか含まない場合であっても、複数の作業手順が検索されて取得されることもある。複数の作業手順が取得されたときには、制御部31は、それら複数の作業手順を、作業者の操作部35の操作に応じて、切り替え表示する。
作業者は、この作業手順表示画面342で示される作業手順に従って、実際の復旧作業を実施する(ステップS7)。なお、図3のシーケンス図において、破線は、情報以外の流れを表している。
(効果)
以上詳述したように第1の実施形態では、作業手順提示装置の一部を構成する故障原因及び故障箇所選択装置2の制御部21は、障害箇所及び障害原因推定装置1から大規模通信ネットワークNWにおける障害箇所及び障害原因の推定結果を受けたとき、それに基づいて故障箇所及び故障原因の候補を提示し、故障箇所及び故障原因の選択を受け付ける。そして、同じく作業手順提示装置の一部を構成する作業手順管理装置3の制御部31は、選択された故障箇所及び故障原因に対応する作業手順を、障害復旧のための作業手順を記憶している記憶部32より検索し、この検索された作業手順を作業者に対して提示する。このように、大規模通信ネットワークNWにおける推定障害箇所の復旧を行う作業者に、故障箇所と作業手順を提示することで、作業者による復旧作業を補助することができるので、復旧作業を迅速に行えるようになる。また、作業者に、作業手順において次に取るべき対処方法を提示することで、作業者が実施すべき作業が明確になり、保守作業の効率化を実現することができる。
また、作業手順提示装置を、故障原因及び故障箇所選択装置2と作業手順管理装置3とに分割構成していることで、故障原因及び故障箇所選択装置2から遠隔地に作業手順管理装置3を持ち出すことが可能となる。よって、作業者が作業手順管理装置3を持って、故障箇所の監視対象装置BSへ出向き、作業手順管理装置3の表示部34に表示された作業手順を確認しながら復旧作業を行うことができる。この場合、故障箇所では大規模通信ネットワークNWを介した通信が行えないので、通信量が多く必要な作業手順を作業手順管理装置3へ送信できないが、この実施の形態では、作業手順管理装置3において作業手順を検索して表示することができるため、問題とならない。
なお、上記ステップS4において、故障原因及び故障箇所選択装置2の制御部21が、記憶部22に記憶している故障原因:作業手順リストから選択された故障原因名に該当する作業手順名を検索し、検索した作業手順名を含む作業手順提示指示を作業手順管理装置3に送信するものとしている。故障原因:作業手順リストは作業手順管理装置3の記憶部32に記憶しておき、制御部21は、選択された故障原因名を含む作業手順提示指示を送信して、作業手順管理装置3の制御部31が、この作業手順提示指示に含まれる故障原因名に該当する作業手順名を記憶部32に記憶した故障原因:作業手順リストから検索するようにしてもよい。
また勿論、故障原因及び故障箇所選択装置2と作業手順管理装置3とを一体の作業手順提示装置として構成しても良い。この場合には、故障原因及び故障箇所選択装置2の各部と作業手順管理装置3の各部とは、それぞれ一つに統合することが可能である。
[第1の実施形態の第1の変形例]
(構成)
この発明の第1の実施形態の第1の変形例における障害復旧システムの構成は、図1に示した第1の実施の形態のそれと同様である。但し、この第1の変形例においては、障害箇所及び障害原因推定装置1の制御部11、故障原因及び故障箇所選択装置2の制御部21、及び作業手順管理装置3の制御部31が、更に以下のような処理機能を有している。
すなわち、作業手順管理装置3の制御部31は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)作業者が操作部35により入力した作業結果を受け付け、通信部33により故障原因及び故障箇所選択装置2に送出する処理。
また、故障原因及び故障箇所選択装置2の制御部21は、上記(1)〜(4)の処理に加えて、以下の処理機能を有する。
(5)作業手順管理装置3からの作業結果を通信部23により受領したとき、その作業結果を、障害箇所及び障害原因推定装置1における障害箇所の特定のための絞込条件として、通信部23により障害箇所及び障害原因推定装置1に送信する処理。
そして、障害箇所及び障害原因推定装置1の制御部11は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)故障原因及び故障箇所選択装置2からの絞込条件を通信部13により受信したとき、その絞込条件つまり作業結果をイベントとして追加して、この作業結果を含む障害イベントから障害箇所及び障害原因を再推定する処理。
(動作)
図7は、この発明の第1の実施形態の第1の変形例における障害復旧システムの動作を示すシーケンス図である。
ここで、ステップS1〜ステップS7の動作は、図3に示した第1の実施の形態のそれと同様である。よって、その説明は省略する。
作業者は、上記ステップS7において作業手順表示画面342で示される作業手順に従って実際の復旧作業を実施した作業結果を、作業手順管理装置3の操作部35により入力する(ステップS8)。この作業結果は、障害が復旧した場合だけで無く、復旧が失敗したという場合もあり得る。作業手順管理装置3の制御部31は、この入力された作業結果を、通信部33により故障原因及び故障箇所選択装置2に送出する。
故障原因及び故障箇所選択装置2では、この作業結果を通信部23により受領する(ステップS9)。そして、制御部21は、この受領した作業結果を、障害箇所及び障害原因推定装置1における障害箇所の特定のための絞込条件として、通信部23により障害箇所及び障害原因推定装置1に送信することで、絞込条件を障害箇所及び障害原因推定装置1に投入する(ステップS10)。
障害箇所及び障害原因推定装置1の制御部11は、通信部13により絞込条件を受信すると、その絞込条件つまり作業結果をイベントとして追加して、この作業結果を含む障害イベントから障害箇所及び障害原因の推定を再度行う(ステップS11)。
その後は、上記ステップS2の動作から繰り返すことができる。
(効果)
以上のような第1の実施形態の第1の変形例では、作業手順に従った作業結果を絞込条件として障害箇所及び障害原因推定装置1に投入できるようにしている。従って、上記第1の実施形態と同様の効果に加えて、障害箇所及び障害原因推定装置1では、作業結果をイベントとして追加して、この作業結果を含む推定を行うことで、障害箇所の推定精度を向上させることが可能となる。よって、誤った障害箇所を推定して復旧を遅らせてしまうことを減少させることが可能となるので、復旧作業を迅速に行えるようになる。
なお、上記ステップS8の作業結果入力と上記ステップS9の作業結果受領とに代えて、作業者が故障原因及び故障箇所選択装置2の操作部25により、作業手順管理装置3を介さずに直接、故障原因及び故障箇所選択装置2に入力するようにしてもよい。
[第1の実施形態の第2の変形例]
(構成)
この発明の第1の実施形態の第2の変形例における障害復旧システムの構成は、図1に示した第1の実施の形態のそれと同様である。但し、この第1の変形例においては、障害箇所及び障害原因推定装置1の制御部11、故障原因及び故障箇所選択装置2の制御部21、及び作業手順管理装置3の制御部31が、更に以下のような処理機能を有している。
すなわち、作業手順管理装置3の制御部31は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)作業者が操作部35により入力した作業結果を受け付け、通信部33により故障原因及び故障箇所選択装置2に送出する処理。
また、故障原因及び故障箇所選択装置2の制御部21は、上記(1)〜(4)の処理に加えて、以下の処理機能を有する。
(5)作業手順管理装置3からの作業結果を通信部23により受領したとき、その作業結果を、障害箇所及び障害原因推定装置1における障害箇所の推定ルールの学習条件として、通信部23により障害箇所及び障害原因推定装置1に送信する処理。
そして、障害箇所及び障害原因推定装置1の制御部11は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)故障原因及び故障箇所選択装置2からの推定ルールの学習条件を通信部13により受信したとき、その学習条件つまり作業結果に基づきルール学習を行う処理。
(動作)
図8は、この発明の第1の実施形態の第2の変形例における障害復旧システムの動作を示すシーケンス図である。
ここで、ステップS1〜ステップS9の動作は、図7に示した第1の実施の形態の第1の変形例のそれと同様である。よって、その説明は省略する。
故障原因及び故障箇所選択装置2の制御部21は、上記ステップS9で受領した作業結果を、障害箇所及び障害原因推定装置1における障害箇所の推定ルールの学習条件として、通信部23により障害箇所及び障害原因推定装置1に送信することで、推定ルールの学習条件を障害箇所及び障害原因推定装置1に投入する(ステップS12)。
障害箇所及び障害原因推定装置1の制御部11は、通信部13により推定ルールの学習条件を受信すると、その学習条件つまり作業結果に基づきルール学習を行う(ステップS13)。
その後は、上記ステップS1の動作から繰り返すことができる。
(効果)
以上のような第1の実施形態の第2の変形例では、作業手順に従った作業結果を障害箇所及び障害原因推定装置1における障害箇所の推定ルールの学習条件として障害箇所及び障害原因推定装置1に投入できるようにしている。従って、上記第1の実施形態と同様の効果に加えて、作業手順に従った作業結果を推定ルールの学習条件として障害箇所及び障害原因推定装置1に投入することで、障害箇所及び障害原因推定装置1では、作業結果に基づきルール学習を行うことができ、障害箇所の推定ルールの精度向上、延いては、障害箇所の推定精度を向上させることが可能となる。よって、誤った障害箇所を推定して復旧を遅らせてしまうことを減少させることが可能となるので、復旧作業を迅速に行えるようになる。
なお、従って、上記第1の実施形態の第1の変形例と同様、上記ステップS8の作業結果入力と上記ステップS9の作業結果受領とに代えて、作業者が故障原因及び故障箇所選択装置2の操作部25により、作業手順管理装置3を介さずに直接、故障原因及び故障箇所選択装置2に入力するようにしてもよい。
[第1の実施形態の第3の変形例]
(構成)
図9は、この発明の第1の実施形態の第3の変形例における障害復旧システムの全体構成を示すブロック図である。同図に示すように、第3の変形例における障害復旧システムは、図1に示した第1の実施の形態における障害箇所及び障害原因推定装置1及び故障原因及び故障箇所選択装置2の代わりに、故障原因及び箇所推定及び選択装置4を備えている。
故障原因及び箇所推定及び選択装置4は、CPU等のプロセッサ、ROMやRAM等のメモリ、などを含むコンピュータである制御部41と、HDDやSSD等の記憶媒体を含む記憶部42と、通信部43と、液晶ディスプレイや有機ELディスプレイ等の表示装置である表示部44と、表示部44の表示面上に配置されたタッチパネルや、キーボード、マウス等のポインティングデバイス、などである操作部45と、を有している。
通信部43は、光ファイバを用いた有線回線により、通信キャリアネットワーク等の大規模通信ネットワークNWに接続され、大規模通信ネットワークNWに含まれる多数の監視対象装置BSとの間で通信する。さらに通信部43は、有線または無線回線により、作業手順管理装置3に接続され、作業手順管理装置3との間で通信する。
記憶部42は、第1の実施形態における障害箇所及び障害原因推定装置1の記憶部12と同様、大規模通信ネットワークNWのネットワークトポロジを記憶すると共に、障害ケース毎に「各監視対象装置BSで発生するアラームやログなどのイベント(障害イベント)の発生状況」と「障害原因」の因果関係を、障害箇所の推定ルールとして学習記憶している。また、記憶部42は、第1の実施の形態における故障原因及び故障箇所選択装置2の記憶部22と同様、障害箇所及び障害原因と故障原因名及び作業手順名との対応関係を記憶すると共に、故障原因名と作業手順名との対応関係を、故障原因:作業手順リストとして記憶している。また記憶部42は、制御部41のプロセッサが実行するプログラムを記憶していてもよい。
制御部41は、当該制御部41のプロセッサが、当該制御部41のROM又はRAMに記憶されたプログラム、もしくは記憶部42に記憶されたプログラムを実行する。これにより、制御部41は、以下のような処理機能を有することができる。
(1)通信部43により監視対象装置BSからのアラームなどを受信したとき、その障害イベントと、記憶部42に記憶しているネットワークトポロジ及び推定ルールに基づいて、障害箇所及び障害原因を推定する処理。
(2)障害箇所及び障害原因の推定結果に基づいて、記憶部42に記憶している障害箇所及び障害原因と故障原因名及び作業手順名との対応関係を検索し、所定の操作者または大規模通信ネットワークNWにおける推定障害箇所の復旧を行う作業者に、故障原因及び故障箇所の候補を表示部44により提示する処理。
(3)操作者又は作業者が操作部45により故障原因及び故障箇所の選択を行ったとき、記憶部42に記憶している故障原因:作業手順リストから、選択された故障原因の原因名に該当する作業手順名を検索する処理。
(4)検索した作業手順名を含む作業手順提示指示を、通信部43により作業手順管理装置3に送信する処理。
(動作)
次に、以上のように構成された第3の変形例における障害復旧システムの動作を説明する。図10はその障害復旧システムの動作を示すシーケンス図である。
同図に示すように、故障原因及び箇所推定及び選択装置4の制御部41は、図3に示したような、第1の実施形態における障害箇所及び障害原因推定装置1の制御部11が行っていた上記ステップS1及び上記ステップS2の動作と、第1の実施形態における故障原因及び故障箇所選択装置2の制御部21が行っていた上記ステップS3及び上記ステップS4の動作と、を行う。
その後のステップS5〜ステップS9の動作は、図3に示した第1の実施の形態のそれと同様である。
(効果)
以上のような第1の実施形態の第3の変形例では、作業手順提示装置の一部を構成する故障原因及び箇所推定及び選択装置4が、第1の実施形態における障害箇所及び障害原因推定装置1と故障原因及び故障箇所選択装置2と同様の動作を行うので、上記第1の実施形態と同様の効果を奏する。
なお、この第3の変形例においても、上記第1の実施形態の第1または第2の変形例のように、作業結果をフィードバックするようにしてもよい。すなわち、作業手順管理装置3からの作業結果を受けて、故障原因及び箇所推定及び選択装置4が、第1の実施形態の第1または第2の変形例における障害箇所及び障害原因推定装置1と故障原因及び故障箇所選択装置2と同様の動作を行うことができる。これにより、上記第1の実施形態の第1または第2の変形例と同様の効果を奏することができる。
[第2の実施形態]
(構成)
図11は、この発明の第2の実施形態における障害復旧システムの全体構成を示すブロック図である。
本実施形態の障害復旧システムは、障害箇所及び障害原因推定装置1と、実施形態に係る自動制御装置を構成する故障原因及び故障箇所選択装置5並びに自動制御実行装置6と、を備えている。
障害箇所及び障害原因推定装置1は、上記第1の実施形態のそれと同様である。
故障原因及び故障箇所選択装置5は、CPU等のプロセッサ、ROMやRAM等のメモリ、などを含むコンピュータである制御部51と、HDDやSSD等の記憶媒体を含む記憶部52と、通信部53と、を有している。
通信部53は、それぞれ有線または無線回線により、障害箇所及び障害原因推定装置1と自動制御実行装置6とに接続され、障害箇所及び障害原因推定装置1との間、及び、自動制御実行装置6との間で通信する。
記憶部52は、障害箇所及び障害原因と故障原因名及び作業手順名との対応関係を記憶している。また、記憶部52は、制御部51のプロセッサが実行するプログラムを記憶していてもよい。
制御部51は、当該制御部51のプロセッサが、当該制御部51のROM又はRAMに記憶されたプログラム、もしくは記憶部52に記憶されたプログラムを実行する。これにより、制御部51は、以下のような処理機能を有することができる。
(1)通信部53により障害箇所及び障害原因推定装置1から障害箇所及び障害原因の推定結果を受信したとき、その推定結果により、記憶部52に記憶されている障害箇所及び障害原因と故障原因名及び作業手順名との対応関係から、故障原因名及び故障箇所名を検索する処理。
(2)検索した故障原因名及び故障箇所名を含む自動制御指示を、通信部53により自動制御実行装置6に送信する処理。
自動制御実行装置6は、CPU等のプロセッサ、ROMやRAM等のメモリ、などを含むコンピュータである制御部61と、HDDやSSD等の記憶媒体を含む記憶部62と、通信部63と、を有している。
通信部63は、有線または無線回線により、故障原因及び故障箇所選択装置5に接続され、故障原因及び故障箇所選択装置5との間で通信する。また、通信部63は、有線回線により、大規模通信ネットワークNWに接続され、大規模通信ネットワークNWにおける故障箇所の監視対象装置BSとの間で通信する。あるいは、通信部63は、大規模通信ネットワークNWに配されて、故障箇所の監視対象装置BSの故障に対し復旧作業を行う復旧装置などの他システム7との間で通信する。また、通信部63は、有線または無線回線により、そのような他システム7と接続され、他システム7との間で直接的に通信できるようにしてもよい。故障箇所の監視対象装置BSまたは他システム7は、自動制御実行装置6からの制御コマンドを受け付け、その制御コマンドに従った動作を行うことで、故障箇所の監視対象装置BSを復旧させることが可能に構成されている。また、通信部63は、故障箇所の監視対象装置BSまたは他システム7以外にも、制御コマンドを受け付けて故障箇所の監視対象装置BSを復旧させることが可能な機器であれば、どのような機器との間でも通信可能に接続されることができる。
記憶部62は、故障箇所の監視対象装置BSを復旧させるために、当該故障箇所の監視対象装置BSや他システム7の動作を制御する対処方法の詳細内容を示す制御スクリプトを記憶している。具体的には、故障原因名及び故障箇所名と制御スクリプトとの対応関係を、図12に示すように、故障原因,故障箇所:制御リストとして記憶している。また、記憶部62は、制御部61のプロセッサが実行するプログラムを記憶していてもよい。
制御部61は、当該制御部61のプロセッサが、当該制御部61のROM又はRAMに記憶されたプログラム、もしくは記憶部62に記憶されたプログラムを実行する。これにより、制御部61は、以下のような処理機能を有することができる。
(1)通信部63により故障原因及び故障箇所選択装置5から自動制御指示を受信したとき、その自動制御指示に含まれる故障原因名及び故障箇所名をキーにして記憶部62を検索して、故障箇所の監視対象装置BSや他システム7の動作を制御するための制御手順を取得する処理。
(2)取得した制御手順に従って、通信部63を介して故障箇所の監視対象装置BSや他システム7に制御コマンドを送信する処理。
(動作)
次に、以上のように構成された障害復旧システムの動作を説明する。図13はその障害復旧システムの動作を示すシーケンス図である。
ここで、障害箇所及び障害原因推定装置1におけるステップS1及びステップS2の動作は、図3に示した第1の実施の形態のそれと同様である。よって、その説明は省略する。
故障原因及び故障箇所選択装置5の制御部51は、通信部53により障害箇所及び障害原因推定装置1から障害箇所及び障害原因の推定結果を受信すると、その受信した推定結果により、記憶部52に記憶されている障害箇所及び障害原因と故障原因名及び作業手順名との対応関係から、故障原因名及び故障箇所名を検索し、その検索した故障原因名及び故障箇所名を含む自動制御指示を、通信部53により自動制御実行装置6に送信する(ステップS14)。
自動制御実行装置6の制御部61は、通信部63により故障原因及び故障箇所選択装置5から自動制御指示を受信すると、その自動制御指示に含まれる故障原因名及び故障箇所名をキーにして、故障箇所の監視対象装置BSや他システム7の動作を制御するための制御手順である制御スクリプトを、記憶部62から検索する(ステップS15)。そして、制御部61は、この検索した制御スプリクトに従って、通信部63を介して故障箇所の監視対象装置BSや他システム7に制御コマンドを順次に送信する、自動制御処理を実行する(ステップS16)。
故障箇所の監視対象装置BS又は他システム7は、この自動制御処理によって自動制御実行装置6から順次送信されてくる制御コマンドに従った自動制御により、実際の復旧作業を実施する(ステップS17)。
(効果)
以上詳述したように第2の実施形態では、自動制御装置の一部を構成する故障原因及び故障箇所選択装置5の制御部51は、障害箇所及び障害原因推定装置1から大規模通信ネットワークNWにおける障害箇所及び障害原因の推定結果を受けたとき、それに基づいて故障箇所及び故障原因を特定する。そして、同じく自動制御装置の一部を構成する自動制御実行装置6の制御部61は、特定された故障箇所及び故障原因に対応する制御手順を、障害復旧のための制御手順を記憶している記憶部62より検索し、特定された故障箇所を復旧するための、制御コマンドによって対処が可能な機器に対して、この検索された制御手順に従った制御を行う。このように、大規模通信ネットワークにおける推定障害箇所の復旧を行う制御を、制御手順に従って行うことで、復旧作業を自動実行することができる。よって、復旧作業を迅速に行えると共に、自動化による復旧作業の効率化を実現することができる。
なお、故障原因及び故障箇所選択装置5は、上記第1の実施形態における故障原因及び故障箇所選択装置2と同様、表示部と操作部とを有し、操作者又は作業者による故障原因及び/または故障箇所の選択を受けるようにしてもよい。特に、障害箇所及び障害原因推定装置1が複数の障害箇所及び障害原因を推定した場合、つまり、故障箇所及び故障原因を絞り込めない場合には、これは有効である。
[第2の実施形態の第1の変形例]
(構成)
この発明の第2の実施形態の第1の変形例における障害復旧システムの構成は、図11に示した第2の実施の形態のそれと同様である。但し、この第1の変形例においては、障害箇所及び障害原因推定装置1の制御部11、故障原因及び故障箇所選択装置5の制御部51、及び自動制御実行装置6の制御部61が、更に以下のような処理機能を有している。
すなわち、自動制御実行装置6の制御部61は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)自動制御による復旧作業の結果を示す自動制御結果を、通信部33により受信する処理。
(4)受信した自動制御結果を、通信部33により故障原因及び故障箇所選択装置5に送出する処理。
また、故障原因及び故障箇所選択装置5の制御部51は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)自動制御実行装置6からの自動制御結果を通信部53により受領したとき、その自動制御結果を、障害箇所及び障害原因推定装置1における障害箇所の特定のための絞込条件として、通信部53により障害箇所及び障害原因推定装置1に送信する処理。
そして、障害箇所及び障害原因推定装置1の制御部11は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)故障原因及び故障箇所選択装置5からの絞込条件を通信部13により受信したとき、その絞込条件つまり作業結果をイベントとして追加して、この作業結果を含む障害イベントから障害箇所及び障害原因を再推定する処理。
(動作)
図14は、この発明の第2の実施形態の第1の変形例における障害復旧システムの動作を示すシーケンス図である。
ここで、ステップS1〜ステップS17の動作は、図13に示した第2の実施の形態のそれと同様である。よって、その説明は省略する。
故障箇所の監視対象装置BS又は他システム7は、上記ステップS17において自動制御実行装置6から順次送信されてくる制御コマンドに従った自動制御による実際の復旧作業を実施した結果を、自動制御結果として生成し、それを自動制御実行装置6に送信する(ステップS18)。この自動制御結果は、障害が復旧した場合だけで無く、復旧が失敗したという場合もあり得る。
自動制御実行装置6の制御部61は、この故障箇所の監視対象装置BS又は他システム7から送信されてきた自動制御結果を、通信部33により受領し、それを、通信部33により故障原因及び故障箇所選択装置5に送出する(ステップS19)。
故障原因及び故障箇所選択装置5では、この自動制御結果を通信部53により受領する(ステップS20)。そして、制御部51は、この受領した自動制御結果を、障害箇所及び障害原因推定装置1における障害箇所の特定のための絞込条件として、通信部53により障害箇所及び障害原因推定装置1に送信することで、絞込条件を障害箇所及び障害原因推定装置1に投入する(ステップS21)。
障害箇所及び障害原因推定装置1の制御部11は、通信部13により絞込条件を受信すると、その絞込条件つまり作業結果をイベントとして追加して、この作業結果を含む障害イベントから障害箇所及び障害原因の推定を再度行う(ステップS11)。
その後は、上記ステップS2の動作から繰り返すことができる。
(効果)
以上のような第2の実施形態の第1の変形例では、制御手順に従った自動制御結果を絞込条件として障害箇所及び障害原因推定装置1に投入できるようにしている。従って、上記第2の実施形態と同様の効果に加えて、障害箇所及び障害原因推定装置1では、自動制御結果をイベントとして追加して、この自動制御結果を含む推定を行うことで、障害箇所の推定精度を向上させることが可能となる。よって、誤った障害箇所を推定して復旧を遅らせてしまうことを減少させることが可能となるので、復旧作業を迅速に行えるようになる。
[第2の実施形態の第2の変形例]
(構成)
この発明の第2の実施形態の第2の変形例における障害復旧システムの構成は、図11に示した第2の実施の形態のそれと同様である。但し、この第2の変形例においては、障害箇所及び障害原因推定装置1の制御部11、故障原因及び故障箇所選択装置5の制御部51、及び自動制御実行装置6の制御部61が、更に以下のような処理機能を有している。
すなわち、自動制御実行装置6の制御部61は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)自動制御による復旧作業の結果を示す自動制御結果を、通信部33により受信する処理。
(4)受信した自動制御結果を、通信部33により故障原因及び故障箇所選択装置5に送出する処理。
また、故障原因及び故障箇所選択装置5の制御部51は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)自動制御実行装置6からの自動制御結果を通信部53により受領したとき、その自動制御結果を、障害箇所及び障害原因推定装置1における障害箇所の推定ルールの学習条件として、通信部53により障害箇所及び障害原因推定装置1に送信する処理。
そして、障害箇所及び障害原因推定装置1の制御部11は、上記(1)及び(2)の処理に加えて、以下の処理機能を有する。
(3)故障原因及び故障箇所選択装置2からの推定ルールの学習条件を通信部13により受信したとき、その学習条件つまり作業結果に基づきルール学習を行う処理。
(動作)
図15は、この発明の第2の実施形態の第2の変形例における障害復旧システムの動作を示すシーケンス図である。
ここで、ステップS1〜ステップS20の動作は、図14に示した第2の実施の形態の第2の変形例のそれと同様である。よって、その説明は省略する。
故障原因及び故障箇所選択装置5の制御部51は、上記ステップS20で受領した自動制御結果を、障害箇所及び障害原因推定装置1における障害箇所の推定ルールの学習条件として、通信部53により障害箇所及び障害原因推定装置1に送信することで、推定ルールの学習条件を障害箇所及び障害原因推定装置1に投入する(ステップS22)。
障害箇所及び障害原因推定装置1の制御部11は、通信部13により推定ルールの学習条件を受信すると、その学習条件つまり作業結果に基づきルール学習を行う(ステップS13)。
その後は、上記ステップS1の動作から繰り返すことができる。
(効果)
以上のような第2の実施形態の第2の変形例では、制御手順に従った自動制御結果を障害箇所及び障害原因推定装置1における障害箇所の推定ルールの学習条件として障害箇所及び障害原因推定装置1に投入できるようにしている。従って、上記第2の実施形態と同様の効果に加えて、制御手順に従った自動制御結果を推定ルールの学習条件として障害箇所及び障害原因推定装置1に投入することで、障害箇所及び障害原因推定装置1では、自動制御結果に基づきルール学習を行うことができ、障害箇所の推定ルールの精度向上、延いては、障害箇所の推定精度を向上させることが可能となる。よって、誤った障害箇所を推定して復旧を遅らせてしまうことを減少させることが可能となるので、復旧作業を迅速に行えるようになる。
[第2の実施形態の第3の変形例]
(構成)
図16は、この発明の第2の実施形態の第3の変形例における障害復旧システムの全体構成を示すブロック図である。同図に示すように、第3の変形例における障害復旧システムは、図11に示した第2の実施の形態における障害箇所及び障害原因推定装置1及び故障原因及び故障箇所選択装置5の代わりに、故障原因及び箇所推定及び選択装置8を備えている。
故障原因及び箇所推定及び選択装置8は、CPU等のプロセッサ、ROMやRAM等のメモリ、などを含むコンピュータである制御部81と、HDDやSSD等の記憶媒体を含む記憶部82と、通信部83と、を有している。
通信部83は、光ファイバを用いた有線回線により、通信キャリアネットワーク等の大規模通信ネットワークNWに接続され、大規模通信ネットワークNWに含まれる多数の監視対象装置BSとの間で通信する。さらに通信部83は、有線または無線回線により、自動制御実行装置6に接続され、自動制御実行装置6との間で通信する。
記憶部82は、第2の実施形態における障害箇所及び障害原因推定装置1の記憶部12と同様、大規模通信ネットワークNWのネットワークトポロジを記憶すると共に、障害ケース毎に「各監視対象装置BSで発生するアラームやログなどのイベント(障害イベント)の発生状況」と「障害原因」の因果関係を、障害箇所の推定ルールとして学習記憶している。また、記憶部82は、第2の実施の形態における故障原因及び故障箇所選択装置5の記憶部52と同様、障害箇所及び障害原因と故障原因名及び作業手順名との対応関係を記憶している。また記憶部82は、制御部81のプロセッサが実行するプログラムを記憶していてもよい。
制御部81は、当該制御部81のプロセッサが、当該制御部81のROM又はRAMに記憶されたプログラム、もしくは記憶部82に記憶されたプログラムを実行する。これにより、制御部81は、以下のような処理機能を有することができる。
(1)通信部83により監視対象装置BSからのアラームなどを受信したとき、その障害イベントと、記憶部82に記憶しているネットワークトポロジ及び推定ルールに基づいて、障害箇所及び障害原因を推定する処理。
(2)障害箇所及び障害原因の推定結果により、記憶部52に記憶されている障害箇所及び障害原因と故障原因名及び作業手順名との対応関係から、故障原因名及び故障箇所名を検索する処理。
(3)検索した故障原因名及び故障箇所名を含む自動制御指示を、通信部83により自動制御実行装置6に送信する処理。
(動作)
次に、以上のように構成された第3の変形例における障害復旧システムの動作を説明する。図17はその障害復旧システムの動作を示すシーケンス図である。
同図に示すように、故障原因及び箇所推定及び選択装置8の制御部81は、図13に示したような、第2の実施形態における障害箇所及び障害原因推定装置1の制御部11が行っていた上記ステップS1及び上記ステップS2の動作と、第2の実施形態における故障原因及び故障箇所選択装置5の制御部51が行っていた上記ステップS14の動作と、を行う。
その後のステップS15〜ステップS17の動作は、図13に示した第2の実施の形態のそれと同様である。
(効果)
以上のような第2の実施形態の第3の変形例では、自動制御装置の一部を構成する故障原因及び箇所推定及び選択装置8が、第2の実施形態における障害箇所及び障害原因推定装置1と故障原因及び故障箇所選択装置5と同様の動作を行うので、上記第2の実施形態と同様の効果を奏する。
なお、この第3の変形例においても、上記第2の実施形態の第1または第2の変形例のように、自動制御結果をフィードバックするようにしてもよい。すなわち、自動制御実行装置6からの自動制御結果を受けて、故障原因及び箇所推定及び選択装置8が、第2の実施形態の第1または第2の変形例における障害箇所及び障害原因推定装置1と故障原因及び故障箇所選択装置5と同様の動作を行うことができる。これにより、上記第2の実施形態の第1または第2の変形例と同様の効果を奏することができる。
[その他の変形例]
なお、第1の実施形態における第1の変形例と第2の変形例を組み合わせてもよい。すなわち、故障原因及び故障箇所選択装置2は、作業結果を、障害箇所特定のための絞込条件と障害箇所の推定ルールの学習条件との両方として障害箇所及び障害原因推定装置1に投入することができる。
同様に、第2の実施形態における第1の変形例と第2の変形例を組み合わせてもよい。すなわち、故障原因及び故障箇所選択装置5は、自動制御結果を、障害箇所特定のための絞込条件と障害箇所の推定ルールの学習条件との両方として障害箇所及び障害原因推定装置1に投入することができる。
その他、この発明は、上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記各実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、各実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
1…障害箇所及び障害原因推定装置、 2,5…故障原因及び故障箇所選択装置、 3…作業手順管理装置、 4,8…故障原因及び箇所推定及び選択装置、 6…自動制御実行装置、 7…他システム、 11,21,31,41,51,61,81…制御部、 12,22,32,42,52,62,82…記憶部、 13,23,33,43,53,63,83…通信部、 24,34,44…表示部、 25,35,45…操作部、 241,341…表示面、 242…故障情報表示画面、 243…『作業手順表示』ボタン、 244…故障原因選択ウィンドウ、 245…故障原因名の一覧、 246…チェックボックス、 247…『OK』ボタン、 248…『キャンセル』ボタン、 342…作業手順表示画面。

Claims (8)

  1. 障害復旧のための作業手順を記憶した作業手順記憶手段と、
    大規模通信ネットワークにおける障害箇所及び障害原因を推定する障害箇所及び障害原因推定装置から出力された障害箇所及び障害原因の推定結果に基づいて、故障箇所の候補及び故障原因の候補を提示し、故障箇所及び故障原因の選択を受け付ける選択手段と、
    前記選択手段によって選択された前記故障箇所及び前記故障原因に対応する作業手順を、前記作業手順記憶手段より検索する検索手段と、
    前記検索手段によって検索した作業手順を提示する提示手段と、
    を備え
    前記選択手段は、前記故障箇所の候補を提示し、前記提示された前記故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、前記選択された故障箇所に従って抽出した前記故障原因の候補を提示し、前記提示された前記故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付ける、作業手順提示装置。
  2. 作業結果の入力を受け付ける入力手段と、
    前記入力手段によって入力された作業結果を、前記障害箇所及び障害原因推定装置における障害箇所の特定のための絞込条件として、前記障害箇所及び障害原因推定装置に投入する絞込条件投入手段と、
    を更に備える、請求項1記載の作業手順提示装置。
  3. 作業結果の入力を受け付ける入力手段と、
    前記入力手段によって入力された作業結果を、前記障害箇所及び障害原因推定装置における障害箇所の推定ルールの学習条件として、前記障害箇所及び障害原因推定装置に投入する学習条件投入手段と、
    を更に備える、請求項1記載の作業手順提示装置。
  4. 制御部と、障害復旧のための作業手順を記憶した記憶部と、操作者による操作を受け付ける操作部と、情報を前記操作者に提示する表示部と、を有する作業手順提示装置における作業手順提示方法であって、
    前記表示部により、大規模通信ネットワークにおける障害箇所及び障害原因を推定する障害箇所及び障害原因推定装置から出力された障害箇所及び障害原因の推定結果に基づく故障箇所の候補を提示し、
    前記操作部により、前記提示された前記故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、
    前記表示部により、前記選択された故障箇所に従って抽出した前記障害原因の推定結果に基づく故障原因の候補を提示し、
    前記操作部により、前記提示された前記故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付け、
    前記制御部により、前記選択された前記故障箇所及び前記故障原因に対応する作業手順を、前記記憶部より検索し、
    前記表示部により、前記検索した作業手順を提示する、
    作業手順提示方法。
  5. 障害復旧のための制御手順を記憶した制御手順記憶手段と、
    大規模通信ネットワークにおける障害箇所及び障害原因を推定する障害箇所及び障害原因推定装置から出力された障害箇所及び障害原因の推定結果に基づいて、故障箇所の候補及び故障原因の候補を提示し、故障箇所及び故障原因の選択を受け付ける選択手段と、
    前記選択手段によって選択された前記故障箇所及び前記故障原因に対応する制御手順を、前記制御手順記憶手段より検索する検索手段と、
    前記検索手段によって検索した制御手順に従って、前記選択手段によって選択された前記故障箇所に対応する装置の動作を制御する制御コマンドを送信することにより当該装置を復旧するための制御を行う復旧制御手段と、
    を備え
    前記選択手段は、前記故障箇所の候補を提示し、前記提示された前記故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、前記選択された故障箇所に従って抽出した前記故障原因の候補を提示し、前記提示された前記故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付ける、自動制御装置。
  6. 前記復旧制御手段による制御結果を受信し、その受信した制御結果を、前記障害箇所及び障害原因推定装置における障害箇所の特定のための絞込条件として、前記障害箇所及び障害原因推定装置に投入する絞込条件投入手段を更に備える、請求項5記載の自動制御装置。
  7. 前記復旧制御手段による制御結果を受信し、その受信した制御結果を、前記障害箇所及び障害原因推定装置における障害箇所の推定ルールの学習条件として、前記障害箇所及び障害原因推定装置に投入する学習条件投入手段を更に備える、請求項5記載の自動制御装置。
  8. 制御部と、障害復旧のための制御手順を記憶した記憶部と、操作者による操作を受け付ける操作部と、情報を前記操作者に提示する表示部と、通信部と、を有する自動制御装置における自動制御方法であって、
    前記表示部により、大規模通信ネットワークにおける障害箇所及び障害原因を推定する障害箇所及び障害原因推定装置から出力された障害箇所及び障害原因の推定結果に基づく故障箇所の候補を提示し、
    前記操作部により、前記提示された前記故障箇所の候補の中から故障箇所を選択させる選択操作を受け付け、
    前記表示部により、前記選択された故障箇所に従って抽出した前記障害原因の推定結果に基づく故障原因の候補を提示し、
    前記操作部により、前記提示された前記故障原因の候補の中から不要な故障原因を排除させる選択操作を受け付け、
    前記制御部により、前記選択された前記故障箇所及び前記故障原因に対応する制御手順を、前記記憶部より検索し、
    前記制御部により、前記検索した制御手順に従って、前記選択された前記故障箇所に対応する装置の動作を制御する制御コマンドを前記通信部を介して送信することにより当該装置を復旧するための制御を行う、
    自動制御方法。
JP2018005908A 2018-01-17 2018-01-17 作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法 Active JP6837017B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018005908A JP6837017B2 (ja) 2018-01-17 2018-01-17 作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018005908A JP6837017B2 (ja) 2018-01-17 2018-01-17 作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法

Publications (2)

Publication Number Publication Date
JP2019125940A JP2019125940A (ja) 2019-07-25
JP6837017B2 true JP6837017B2 (ja) 2021-03-03

Family

ID=67399413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018005908A Active JP6837017B2 (ja) 2018-01-17 2018-01-17 作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法

Country Status (1)

Country Link
JP (1) JP6837017B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7268748B2 (ja) * 2019-09-19 2023-05-08 日本電信電話株式会社 情報分析装置、方法およびプログラム
US11892905B2 (en) * 2019-09-26 2024-02-06 Nippon Telegraph And Telephone Corporation Abnormality handling support apparatus, method, and program
WO2022064657A1 (ja) * 2020-09-25 2022-03-31 日本電信電話株式会社 復旧支援装置、復旧支援方法およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10326208A (ja) * 1997-03-24 1998-12-08 N T T Data:Kk 障害復旧システム及び記録媒体
JP2002312027A (ja) * 2001-04-10 2002-10-25 Nissin Electric Co Ltd 故障診断装置、故障診断プログラム、故障診断プログラムを記録したコンピュータ読取可能な記録媒体および故障診断方法
AU2003242223A1 (en) * 2002-06-07 2003-12-22 Arkray, Inc. Trouble countermeasure support system and terminal device connected to the same
JP2007079896A (ja) * 2005-09-14 2007-03-29 Nomura Research Institute Ltd 監視装置及び監視方法
CN104699410B (zh) * 2013-12-04 2019-08-27 联想(北京)有限公司 一种信息处理方法及电子设备

Also Published As

Publication number Publication date
JP2019125940A (ja) 2019-07-25

Similar Documents

Publication Publication Date Title
JP6837017B2 (ja) 作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法
JP2005346331A (ja) 障害復旧装置および障害復旧方法、マネージャ装置並びにプログラム
JP4948679B1 (ja) サーボ制御装置の異常診断装置および異常診断システム
JP6280862B2 (ja) イベント分析システムおよび方法
JP2007267352A (ja) 障害回復システム及びサーバ
JP2016057803A (ja) 異常検知手順開発装置および異常検知手順開発方法
JPWO2003105039A1 (ja) トラブル対処支援システムおよびこれに接続される端末装置
US10809681B2 (en) Data collection for assistance in an industrial automation environment
JP2010049532A (ja) 運転監視支援装置
JPWO2010016239A1 (ja) 障害解析装置
JP6190539B2 (ja) ログ分析装置、ログ分析システム、ログ分析方法及びコンピュータプログラム
JP5641482B2 (ja) 監視制御システム
JP2012003713A (ja) 障害原因判定ルール変化検知装置及びプログラム
JP2006085538A (ja) 復旧支援方法及び復旧支援システム並びに復旧支援用プログラム
JP2019057158A (ja) プラント監視装置および分散制御システム
JP2006053728A (ja) 障害対処ルール伝播方法、障害復旧装置およびプログラム
JP5964777B2 (ja) 優先復旧設備決定装置、優先復旧設備決定方法、プログラムおよび優先復旧設備決定システム
JP6070040B2 (ja) データベースシステム、データベース装置、データベースの障害回復方法およびプログラム
JP2010224829A (ja) 運用管理システム
JP6813077B1 (ja) 生産システム、復旧システム、生産方法、及びプログラム
JP6060123B2 (ja) 影響範囲特定装置、影響範囲特定方法、及びプログラム
JP2015230584A (ja) 警報対応支援装置および警報対応支援方法
WO2016139805A1 (ja) プログラマブルロジックコントローラエンジニアリングツール及びプログラマブルロジックコントローラエンジニアリングツールプログラム
JP7252155B2 (ja) ビル設備の保守作業支援装置
JP4530645B2 (ja) コンピュータシステムの監視装置および監視方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210208

R150 Certificate of patent or registration of utility model

Ref document number: 6837017

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150