WO2018180364A1

WO2018180364A1 - 障害自動復旧システム、制御装置、手順作成装置およびコンピュータ可読記憶媒体

Info

Publication number: WO2018180364A1
Application number: PCT/JP2018/009183
Authority: WO
Inventors: 圭介黒木; 林　通秋
Original assignee: Kddi株式会社
Priority date: 2017-03-29
Filing date: 2018-03-09
Publication date: 2018-10-04
Also published as: EP3605953B1; EP3605953A1; US20190384670A1; EP3605953A4; JP2018170618A; CN110447206A; US11080128B2

Abstract

機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムは、ネットワーク障害を復旧させる複数の復旧タスクを有する復旧実行手段と、ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力するパラメータ作成手段と、障害データおよび予め取得した復旧モデルに基づいて、各復旧手段の実行手順を選定する学習手段と、ネットワークの障害発生時に選定された実行手順を実行する手順実行手段と、実行手順によってネットワークの障害が復旧したかどうかを判断する成功判断手段と、判断の結果、ネットワークの障害の復旧レベルに応じて学習手段に対して手順の修正を通知する手順修正手段と、を備える。

Description

障害自動復旧システム、制御装置、手順作成装置およびコンピュータ可読記憶媒体

　本発明は、機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する技術に関する。

　従来から、ＳＤＮ（Software Defined Networking）やＮＦＶ（Network Function Virtualization）に関連する研究や技術開発が盛んに行なわれている。例えば、特許文献１には、自動運用プロセスの運用時に発生する異常に対処する技術が開示されている。特許文献１では、複数のコンピュータに対する運用操作を自動的に実行する自動運用プロセスにおいて、ある運用操作を実行した場合、当該複数のコンピュータのうちのあるコンピュータにおいて異常を検出すると、複数のコンピュータを含むシステムの構成および複数のコンピュータの各々の役割のうち、異常を検出したコンピュータの役割およびそのコンピュータが属するシステムの構成を読み出す。

　そして、運用操作の内容、異常の内容、当該異常が発生したコンピュータの役割、当該コンピュータが属するシステムの構成、対処方法を含む事例データを読み出す。この場合、ある運用操作の内容とある異常の内容とあるコンピュータの役割およびあるコンピュータが属するシステムの構成とを少なくとも含む条件に一致または類似する条件を含む事例データを読み出すこととされている。

特開２０１４－１２７０３６号公報

　従来から、ＳＤＮやＮＦＶを用いて構築される仮想ネットワークにおいて、効率的な運用を目的に自動運用が期待されているが、将来的に仮想ネットワークの種類が多種に渡る場合、それぞれの仮想ネットワークのそれぞれの障害復旧パターンも多種多様になり、自動復旧のための運用フロー（手順）作成やその維持が難しくなる。

　特許文献１記載の技術でも、運用フローのタスク内で使用されるパラメータ値は、そのタスクを実行した際に、成功しなければ自動で修正（更新）されるが、フローの修正には対応していない。このため、フロー自体に修正が必要な場合には対応することができない。

　本発明は、このような事情に鑑みてなされたものであり、機械学習を利用して、運用フローの作成と修正を実行させ、人間による運用フロー作成や修正を省略させることで、工数を削減することができる障害自動復旧システム、制御装置、手順作成装置およびコンピュータ可読記憶媒体を提供することを目的とする。

　本発明の一態様によると、機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムは、ネットワーク障害を復旧させる複数の復旧タスクを有する復旧実行手段と、ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力するパラメータ作成手段と、前記障害データおよび予め取得した復旧モデルに基づいて、前記各復旧タスクの実行手順を選定する学習手段と、ネットワークの障害発生時に前記選定された実行手順を実行する手順実行手段と、前記実行手順によってネットワークの障害が復旧したかどうかを判断する成功判断手段と、前記判断の結果、ネットワークの障害の復旧レベルに応じて前記学習手段に対して手順の修正を通知する手順修正手段と、を備えている。

　本発明によれば、ネットワークの障害を自動的に復旧させる運用手順を作成し、または修正することが可能となる。これにより、障害復旧とそれに関わる復旧手順作成およびその修正の工数を削減し、迅速な復旧と、障害に対する復旧手順の維持を実現させることが可能となる。

　本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。

　添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、その記述と共に本発明の原理を説明するために用いられる。
本実施形態に係る障害自動復旧システムの概略構成を示す図である。構成情報保管部３が保管する情報の一例を示す図である。手順情報保管部２８が保管する情報の一例を示す図である。本実施形態に係る障害自動復旧システムの動作を示すフローチャートである。本実施形態に係る障害自動復旧システムの動作を示すフローチャートである。本実施形態の変形例を示す図である。

　本発明者らは、ＳＤＮ／ＮＦＶを用いて構築される仮想ネットワークにおいて、効率的な運用を目的に自動運用が期待されているが、将来的に仮想ネットワークの種類が多種に渡る場合に、それぞれの仮想ネットワークのそれぞれの障害復旧パターンも多種多様になり、自動復旧のための運用フロー（手順）作成やその維持が難しくなる点に着目し、機械学習を利用して、運用フローの作成と修正を実行させ、人間による運用フロー作成や修正を省略させることにより、工数を削減することができることを見出し、本発明に至った。

　図１は、本実施形態に係る障害自動復旧システムの概略構成を示す図である。この障害自動復旧システムは、制御システム１と手順作成システム２０とから構成されている。制御システム１は、構成情報保管部３、ユーザインタフェース部５、パラメータ作成部７、復旧部である「タスク－１、タスク－２...タスク－ｎ」を有する復旧実行部９、成功判断部１１を備えている。手順作成システム２０は、入力２２ａ、モデル２２ｂ、出力２２ｃを含む学習部２２を備えている。また、手順実行部２４、手順修正部２６、手順情報保管部２８を備えている。制御システム１は、制御装置群１３またはネットワーク１５に対し、復旧の実行を行ない、手順作成システム２０は、復旧手順の作成を行なう。

　図２は、構成情報保管部３が保管する情報の一例を示す図である。構成情報保管部３は、ネットワークの構成情報を保管し、障害情報（アラームなど）からどのネットワークの障害であるかの判断や、学習部２２へ出力するパラメータの作成に利用される。図２では、例えば、ネットワーク名、ファイヤーウォール、ルータなどの構成機能、ホスト名、ＩＰアドレス、ＴｏＳ値、収容人数、リンク数、利用局舎数、許容最大断時間などが保管されている。

　図３は、手順情報保管部２８が保管する情報の一例を示す図である。手順情報保管部２８は、ネットワークのアラーム種別毎に、学習部２２のモデル２２ｂによって導かれた、タスクの組合せ、つまり手順を、確からしい順番で格納している。障害を契機に、手順実行部２４への連絡や、手順修正部２６による次に確からしい手順を実行させる場合にも用いられる。

　図４Ａ、４Ｂは、本実施形態に係る障害自動復旧システムの動作を示すフローチャートである。図４Ａ、４Ｂでは、制御システムの動作と手順作成システムの動作を分けて表示している。まず、事前学習を行なう（ステップＳ１）。図１に示したように、制御システム１は、復旧のタスクを複数持ち合わせていることが前提となる。例えば、制御システム１の「ＡＰＩ呼び出し」等がそれに該当する。ステップＳ１では、ユーザが、ユーザインタフェース部５を経由して、作成したネットワーク構成情報や、そのネットワークにおいて今までに発生した障害の情報と、それに対するタスクの組合せ（手順：フロー）を、パラメータ作成部７を経由して学習部２２に入力する。学習部２２では、入力２２ａに基づいて、モデル２２ｂを作成する。但し、ここでは、学習部２２内のモデル２２ｂの作成が目的であるため、ネットワーク構成情報や障害情報、またそれに対するタスクの組合せなどは、ランダムデータで構わない。すなわち、モデル２２ｂは、完璧でなくても構わない。

　この場合、学習部２２は、例えば、深層学習等の機械学習を利用する。入力２２ａ（ネットワークの構成情報と障害情報）と出力２２ｃ（タスクの組合せ）を学習させることで、入力から出力に至るまでのモデル２２ｂを自動で作成することが可能である。パラメータ作成部７には、主に２つの役割がある。すなわち、ユーザから与えられたネットワーク構成情報を構成情報保管部３に保管することと、ネットワーク構成情報や障害情報等を数値化・標準化し、学習部２２へ入力することである。

　次に、障害を検知したかどうかを判断する（ステップＳ２）。障害を検知しなければ、この判断を繰り返し、障害を検知した場合は、ステップＳ３に遷移し、該当ネットワークを確認する。そして、その障害が、初めての障害であるかどうかを判断する（ステップＳ４）。初めての障害であった場合、ネットワーク構成情報と障害情報を手順作成システム２０に伝達する（ステップＳ６）。すなわち、ネットワークから制御システム１のパラメータ作成部７に向けて、障害情報が発出される。この場合の障害情報とは、例えば、ネットワーク機器が障害時に発するアラーム等である。パラメータ作成部７は、アラーム情報から、どのネットワークに障害が発生したのかを、構成情報保管部３の情報を参照して導き出す。その後、構成情報保管部３から導き出した、ネットワークの構成情報とアラーム情報を数値化、標準化し、手順作成システムの学習部２２に、入力２２ａとして入力する。

　学習部２２は、その入力２２ａに基づいて、ステップＳ１で構築したモデル２２ｂによって、該当ネットワークに対するアラームのタスクの組合せ（フロー）を導き出し、手順情報保管部２８に格納する（ステップＳ７）。なお、手順情報保管部２８にはネットワーク名、障害アラームの他に、導き出したタスクの組合せの確からしい順番が格納される。手順情報保管部２８は、情報を格納後、該当するタスクの実行を手順実行部２４へ指示する。手順実行部２４は、制御システム１の復旧実行部９にタスク実行を指示し（ステップＳ８）、復旧実行部９は、指示されたタスクを依頼された順番で実行を行なう。この場合の復旧実行は、直接ネットワーク機器等に対して行なっても良いし、別の制御装置群にＡＰＩ等を介して指示するものでも良い。

　成功判断部１１は、上記のように実行したタスクの組合せによって、障害が復旧したかどうか、そのネットワークに定義された許容最大断時間を満たしたかどうかを判断する（ステップＳ１０）。確認処理は、従来の技術を適用することが可能である。例えば、事前に、ネットワーク毎に仮想的なトラフィックジェネレータを準備しておき、常時パケットを疎通させておき、そのトラフィックジェネレータに問い合わせることで、断時間や疎通ができたかどうかなどを確認する方法を適用することが可能である。

　次に、成功判断部１１による判断の結果、疎通ができたかどうかを判定する（ステップＳ１１）。疎通ができなかった場合は、手順情報保管部２８において、直近で実行した手順の次に確からしい手順に修正し（ステップＳ１２）、修正した手順を実行する（ステップＳ８）。一方、ステップＳ１１において、疎通ができた場合は、許容最大断時間を満たしたかどうかを判定する（ステップＳ１３）。許容最大断時間を満たしていない場合は、手順情報保管部２８において、次に障害が発生したときは、直近で実行した手順の次に確からしい手順を実行するように情報を修正し、修正手順を保管後、終了する（ステップＳ１４）。一方、ステップＳ１３において、許容最大断時間を満たした場合は、手順の修正をすることなく（ステップＳ１５）、その手順を手順修正部２６に伝え、手順修正部２６が、学習部２２を通じて成功手順を再学習させて終了する（ステップＳ１６）。

　一方、ステップＳ４において、パラメータ作成部７が、初めて起きた障害ではないと判断すると、ステップＳ５に遷移し、手順情報保管部２８を参照して、該当する手順を実行し、ステップＳ１１に遷移する。

　以上のように、ステップＳ１１において、疎通ができなかった場合は、ステップＳ１２、ステップＳ８、ステップＳ９、ステップＳ１０に処理が遷移し、疎通ができるまでこれらのステップが繰り返されることとなる。また、ステップＳ１１において、疎通ができたが、許容最大断時間であることを満たせなかった場合は、次に実行する手順を変更し、これを保管する。従って、次に障害が発生したときは、直近で許容最大断時間を満たせなかった手順は実行されないこととなる。

　［変形例］
　図５は、本実施形態の変形例を示す図である。本実施形態に係る障害自動復旧システムは、ネットワーク構成情報に基づいて各ネットワークを教師なし学習により分類する分類器５０と、アルゴリズムまたは機械学習を実行する機械学習部５２とを備え、分類結果と対応する手順がテーブル５４に登録されている。なお、機械学習部５２は、図１に示した学習部２２と実質的に同一である。

　分類器５０は、ネットワーク構成に基づいて、ネットワークをクラスタリングし、各ネットワークをネットワーク種別毎に分類する。図５では、ＮＷ－ＡとＮＷ－Ｂがネットワーク種別１に分類されており、ＮＷ－ＣとＮＷ－Ｄがネットワーク種別２に分類されている例を示している。ネットワーク種別１の手順は、アラーム種別が「ｄｏｗｎ」であった場合は、タスク１、２、３の順番で実行する手順が１番目に登録されており、タスク１、３、２の順番で実行する手順が２番目に登録されている。

　この構成により、あるネットワークで障害が発生した場合、ネットワーク種別が同一であるネットワークに対しては、同一の実行手順を選定することができるため、実行データのランダム化が減少し、迅速な復旧を実現させることが可能となる。

　なお、本実施形態に係る制御システム１または手順作成システム２０の少なくとも何れかの処理は、プロセッサなどがプログラムを実行することで実現されてもよい。また、そのようなプログラムは、ハードディスクまたはシリコンドライブなどの記憶媒体に格納されてもよい。

　以上説明したように、本実施形態によれば、ネットワークにおいて障害が発生した場合障害復旧手順を自動で作成することができる。また、障害復旧手順の修正を自動で実行することができる。さらに、人工知能による機械学習を通じ、２回目以降に発生した障害に即座に対応することができる。これにより、ネットワーク毎の復旧手順書の作成や管理を人手で実現する必要がなく、工数の削減に寄与できる。また、復旧を実行する制御システムと連携することによって、自動復旧を実行することが可能となる。

　（１）また、以上説明したように、本実施形態によれば、障害自動復旧システムは、機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムであって、ネットワーク障害を復旧させる複数の復旧タスクを有する復旧実行部と、ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力するパラメータ作成部と、障害データおよび予め取得した復旧モデルに基づいて、各復旧タスクの実行手順を選定する学習部と、ネットワークの障害発生時に選定された実行手順を実行する手順実行部と、実行手順によってネットワークの障害が復旧したかどうかを判断する成功判断部と、判断の結果、ネットワークの障害の復旧レベルに応じて学習部に対して手順の修正を通知する手順修正部と、を備えることを特徴とする。

　このように、ネットワーク障害を復旧させる複数の復旧タスクを有し、ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力し、障害データおよび予め取得した復旧モデルに基づいて、各復旧タスクの実行手順を選定し、ネットワークの障害発生時に選定された実行手順を実行し、実行手順によってネットワークの障害が復旧したかどうかを判断し、判断の結果、ネットワークの障害の復旧レベルに応じて、学習部に対して手順の修正を通知するので、ネットワークの障害を自動的に復旧させる運用手順を作成し、または修正することが可能となる。これにより、障害復旧とそれに関わる復旧手順作成およびその修正の工数を削減し、迅速な復旧の実現と、障害に対する復旧手順の維持を実現させることが可能となる。

　（２）また、以上説明したように、本実施形態によれば、障害自動復旧システムにおいて、成功判断部は、ネットワークが疎通し、かつ許容最大断時間を満たした場合は、その実行手順を成功手順として手順修正部を介して学習部に通知し、学習させることを特徴とする。

　このように、成功判断部は、ネットワークが疎通し、かつ許容最大断時間を満たした場合は、その実行手順を成功手順として学習部に通知し、学習させるので、次に同じようなネットワーク障害が発生した場合も、迅速に障害を復旧させることが可能となる。

　（３）また、以上説明したように、本実施形態によれば、障害自動復旧システムにおいて、成功判断部は、ネットワークが疎通したが、許容最大断時間を満たさなかった場合は、次にネットワーク障害が発生したときにその実行手順の次に確からしい実行手順を実行すべき旨を手順修正部に通知し、手順修正部は、その実行手順の次に確からしい実行手順を選定し、手順実行部は、次にネットワーク障害が発生したときに手順修正部が選定した実行手順を実行することを特徴とする。

　このように、成功判断部は、ネットワークが疎通したが、許容最大断時間を満たさなかった場合は、次にネットワーク障害が発生したときにその実行手順の次に確からしい実行手順を実行すべき旨を手順修正部に通知し、手順修正部は、その実行手順の次に確からしい実行手順を選定し、手順実行部は、次にネットワーク障害が発生したときに手順修正部が選定した実行手順を実行するので、次に同じようなネットワーク障害が発生した場合も、迅速に障害を復旧させる可能性を高めることが可能となる。

　（４）また、以上説明したように、本実施形態によれば、障害自動復旧システムにおいて、成功判断部は、ネットワークが疎通しなかった場合は、その実行手順の次に確からしい実行手順を実行すべき旨を手順修正部に通知し、手順修正部は、その実行手順の次に確からしい実行手順を選定し、手順実行部は、手順修正部が選定した実行手順を実行することを特徴とする。

　このように、成功判断部は、ネットワークが疎通しなかった場合は、その実行手順の次に確からしい実行手順を実行すべき旨を手順修正部に通知し、手順修正部は、その実行手順の次に確からしい実行手順を選定し、手順実行部は、手順修正部が選定した実行手順を実行するので、ネットワークが疎通するまで、各復旧タスクによる実行手順が実行される。これにより、ネットワーク障害の迅速な復旧を図ることが可能となる。

　（５）また、以上説明したように、本実施形態によれば、障害自動復旧システムにおいて、パラメータ作成部は、障害情報およびネットワーク構成情報を数値化および標準化して障害データを作成し、学習部は、障害データを入力して復旧モデルを作成することを特徴とする。

　このように、パラメータ作成部は、障害情報およびネットワーク構成情報を数値化および標準化して障害データを作成し、学習部は、障害データを入力して復旧モデルを作成するので、人工知能による機械学習を活用し、ネットワーク障害の迅速な復旧を図ることが可能となる。

　（６）また、以上説明したように、本実施形態によれば、障害自動復旧システムは、各ネットワークをネットワーク構成情報に基づいて分類し、分類毎にネットワーク種別を示す情報を付与する分類器をさらに備え、学習部は、ネットワーク種別が同一のネットワークに対し、障害発生時に同一の実行手順を選定することを特徴とする。

　このように、各ネットワークをネットワーク構成情報に基づいて分類し、分類毎にネットワーク種別を示す情報を付与し、ネットワーク種別が同一のネットワークに対し、障害発生時に同一の実行手順を選定するので、迅速な復旧を実現することが可能となる。すなわち、同一のネットワーク種別に含まれる各ネットワークは、障害発生の傾向も近似するため、すでに選定されている実行手順をそのまま実行することで復旧がし易くなる。

　（７）また、以上説明したように、本実施形態によれば、制御装置は、機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムに適用される制御装置であって、ネットワーク障害を復旧させる複数の復旧タスクを有する復旧実行部と、ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力するパラメータ作成部と、障害データおよび予め取得した復旧モデルに基づいて選定された各復旧タスクの実行手順が実行された後、実行手順によってネットワークの障害が復旧したかどうかを判断する成功判断部と、を備えることを特徴とする。

　この構成により、ネットワークの障害を自動的に復旧させる運用手順を作成し、または修正するシステムを構築することが可能となる。その結果、障害復旧の工数を削減し、迅速な復旧を実現させることが可能となる。

　（８）また、以上説明したように、本実施形態によれば、手順作成装置は、機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムに適用される手順作成装置であって、ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データおよび予め取得した復旧モデルに基づいて、ネットワーク障害を復旧させる複数の復旧タスクの実行手順を選定する学習部と、ネットワークの障害発生時に選定された実行手順を実行する手順実行部と、実行手順によってネットワークの障害が復旧したかどうかが判断され、判断の結果、ネットワークの障害の復旧レベルに応じて学習部に対して手順の修正を通知する手順修正部と、を備えることを特徴とする。

　この構成により、ネットワークの障害を自動的に復旧させる運用手順を作成し、または修正するシステムを構築することが可能となる。その結果、障害復旧とそれに関わる復旧手順作成およびその修正の工数を削減し、迅速な復旧と、障害に対する復旧手順の維持を実現させることが可能となる。

　（９）また、以上説明したように、本実施形態に係るプログラムは、機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムに適用される制御装置のプログラムであって、パラメータ作成部において、ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力する処理と、障害データおよび予め取得した復旧モデルに基づいて選定され、ネットワーク障害を復旧させる複数の復旧タスクの実行手順が実行された後、成功判断部において、実行手順によってネットワークの障害が復旧したかどうかを判断する処理と、の一連の処理をコンピュータに実行させることを特徴とする。

　（１０）また、以上説明したように、本実施形態に係るプログラムは、機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムに適用される手順作成装置のプログラムであって、学習部において、ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データおよび予め取得した復旧モデルに基づいて、ネットワーク障害を復旧させる複数の復旧タスクの実行手順を選定する処理と、手順実行部において、ネットワークの障害発生時に選定された実行手順を実行する処理と、実行手順によってネットワークの障害が復旧したかどうかが判断され、手順修正部において、判断の結果、ネットワークの障害の復旧レベルに応じて学習部に対して手順の修正を通知する処理と、の一連の処理をコンピュータに実行させることを特徴とする。

　本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。

　本願は、２０１７年３月２９日提出の日本国特許出願特願２０１７－０６６０５９を基礎として優先権を主張するものであり、その記載内容の全てを、ここに援用する。

Claims

　機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムであって、
　ネットワーク障害を復旧させる複数の復旧タスクを有する復旧実行手段と、
　ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力するパラメータ作成手段と、
　前記障害データおよび予め取得した復旧モデルに基づいて、前記各復旧タスクの実行手順を選定する学習手段と、
　ネットワークの障害発生時に前記選定された実行手順を実行する手順実行手段と、
　前記実行手順によってネットワークの障害が復旧したかどうかを判断する成功判断手段と、
　前記判断の結果、ネットワークの障害の復旧レベルに応じて前記学習手段に対して手順の修正を通知する手順修正手段と、を備える障害自動復旧システム。
　前記成功判断手段は、ネットワークが疎通し、かつ許容最大断時間を満たした場合は、その実行手順を成功手順として前記手順修正手段を介して前記学習手段に通知する請求項１記載の障害自動復旧システム。
　前記成功判断手段は、ネットワークが疎通したが、許容最大断時間を満たさなかった場合は、次にネットワーク障害が発生したときにその実行手順の次に確からしい実行手順を実行すべき旨を前記手順修正手段に通知し、
　前記手順修正手段は、その実行手順の次に確からしい実行手順を選定し、選定した実行手順を前記学習手段に通知し、
　前記手順実行手段は、次にネットワーク障害が発生したときに前記手順修正手段が選定した実行手順を実行する請求項１記載の障害自動復旧システム。
　前記成功判断手段は、ネットワークが疎通しなかった場合は、その実行手順の次に確からしい実行手順を実行すべき旨を前記手順修正手段に通知し、
　前記手順修正手段は、その実行手順の次に確からしい実行手順を選定し、
　前記手順実行手段は、前記手順修正手段が選定した実行手順を実行する請求項１記載の障害自動復旧システム。
　前記パラメータ作成手段は、前記障害情報および前記ネットワーク構成情報を数値化および標準化して前記障害データを作成し、
　前記学習手段は、前記障害データを入力して復旧モデルを作成する請求項１記載の障害自動復旧システム。
　各ネットワークをネットワーク構成情報に基づいて分類し、分類毎にネットワーク種別を示す情報を付与する分類手段をさらに備え、
　前記学習手段は、前記ネットワーク種別が同一のネットワークに対し、障害発生時に同一の実行手順を選定する請求項１から請求項５のいずれか１項に記載の障害自動復旧システム。
　機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムに適用される制御装置であって、
　ネットワーク障害を復旧させる複数の復旧タスクを有する復旧実行手段と、
　ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力するパラメータ作成手段と、
　前記障害データおよび予め取得した復旧モデルに基づいて選定された前記各復旧タスクの実行手順が実行された後、前記実行手順によってネットワークの障害が復旧したかどうかを判断する成功判断手段と、を備える制御装置。
　機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムに適用される手順作成装置であって、
　ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データおよび予め取得した復旧モデルに基づいて、ネットワーク障害を復旧させる複数の復旧タスクの実行手順を選定する学習手段と、
　ネットワークの障害発生時に前記選定された実行手順を実行する手順実行手段と、
　前記実行手順によってネットワークの障害が復旧したかどうかが判断され、前記判断の結果、ネットワークの障害の復旧レベルに応じて前記学習手段に対して手順の修正を通知する手順修正手段と、を備えることを特徴とする手順作成装置。
　機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムに適用される制御装置の１つ以上のプロセッサで実行されるプログラムを格納するコンピュータ可読記憶媒体であって、
　前記プログラムは、前記１つ以上のプロセッサで実行されると、
　ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データを出力する処理と、
　前記障害データおよび予め取得した復旧モデルに基づいて選定され、ネットワーク障害を復旧させる複数の復旧タスクの実行手順が実行された後、前記実行手順によってネットワークの障害が復旧したかどうかを判断する処理と、を前記制御装置に実行させる、コンピュータ可読記憶媒体。
　機械学習により、ネットワークの障害を復旧させる運用手順を作成しまたは作成した運用手順を修正する障害自動復旧システムに適用される手順作成装置の１つ以上のプロセッサで実行されるプログラムを格納するコンピュータ可読記憶媒体であって、
　前記プログラムは、前記１つ以上のプロセッサで実行されると、
　ネットワーク障害が発生したときに取得した障害情報およびネットワーク構成情報を示す障害データおよび予め取得した復旧モデルに基づいて、ネットワーク障害を復旧させる複数の復旧タスクの実行手順を選定する処理と、
　ネットワークの障害発生時に前記選定された実行手順を実行する処理と、
　前記実行手順によってネットワークの障害が復旧したかどうかの判断の結果、ネットワークの障害の復旧レベルに応じて前記実行手順の修正を通知する処理と、を前記手順作成装置に実行させる、コンピュータ可読記憶媒体。