JP2020156053A - ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法 - Google Patents

ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法 Download PDF

Info

Publication number
JP2020156053A
JP2020156053A JP2019055440A JP2019055440A JP2020156053A JP 2020156053 A JP2020156053 A JP 2020156053A JP 2019055440 A JP2019055440 A JP 2019055440A JP 2019055440 A JP2019055440 A JP 2019055440A JP 2020156053 A JP2020156053 A JP 2020156053A
Authority
JP
Japan
Prior art keywords
network
communication network
task
failure
reinforcement learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019055440A
Other languages
English (en)
Other versions
JP7050023B2 (ja
Inventor
達史 宮本
Tatsuji Miyamoto
達史 宮本
貴之 蕨野
Takayuki Warabino
貴之 蕨野
雅典 宮澤
Masanori Miyazawa
雅典 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2019055440A priority Critical patent/JP7050023B2/ja
Publication of JP2020156053A publication Critical patent/JP2020156053A/ja
Application granted granted Critical
Publication of JP7050023B2 publication Critical patent/JP7050023B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】機械学習によって通信ネットワークの障害復旧のタスクの実行手順を作成する際の品質向上を図る。【解決手段】通信ネットワークに発生した障害を復旧させるためのタスクが登録されたタスクデータベースと、通信ネットワークの状態を示すネットワーク状態データを取得し、ネットワーク状態データに基づいて前記通信ネットワークに障害が発生しているか否かを判断するネットワーク状態取得部と、通信ネットワークに障害が発生していると判断されたネットワーク状態データに基づいてタスクデータベースから通信ネットワークに適用するタスクを選択する強化学習演算処理を実行する強化学習エンジンと、選択されたタスクを通信ネットワークに対して実行するタスク実行部と、を備える。【選択図】図1

Description

本発明は、ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法に関する。
従来、通信ネットワークの障害復旧における復旧手段の実行手順を機械学習により作成する技術として、例えば特許文献1が知られている。特許文献1に記載の従来技術では、教師データありの事前学習によって予め復旧モデルを取得する。そして、実際の通信ネットワークの障害発生時に、学習部が復旧モデルにより各復旧手段の実行手順を選定し、手順修正部が選定された実行手順の実行結果の通信ネットワークの障害の復旧レベルに応じて学習部に対して手順の修正を通知する。
特開2018−170618号公報
しかし、上述した従来技術では、教師データありの事前学習によって予め復旧モデルを取得するので、通信ネットワークで発生し得る事象が多くなると、全ての事象を網羅する教師データを準備することが難しい場合があった。このため、一部の事象に限定した教師データによって復旧モデルの事前学習を行わなければならない場合、復旧モデルが不十分になって各復旧手段の実行手順の選定結果の品質が低下する可能性があった。
本発明は、このような事情を考慮してなされたものであり、その目的は、機械学習によって通信ネットワークの障害復旧のタスクの実行手順を作成する際の品質向上を図ることにある。
(1)本発明の一態様は、通信ネットワークに発生した障害を復旧させるためのタスクが登録されたタスクデータベースと、前記通信ネットワークの状態を示すネットワーク状態データを取得し、前記ネットワーク状態データに基づいて前記通信ネットワークに障害が発生しているか否かを判断するネットワーク状態取得部と、前記通信ネットワークに障害が発生していると判断された前記ネットワーク状態データに基づいて前記タスクデータベースから前記通信ネットワークに適用するタスクを選択する強化学習演算処理を実行する強化学習エンジンと、前記選択されたタスクを前記通信ネットワークに対して実行するタスク実行部と、を備えるネットワーク障害復旧システムである。
(2)本発明の一態様は、前記通信ネットワークに障害が発生してから復旧するまでに前記通信ネットワークに対して実行されたタスクを記録するワークフロー生成部、をさらに備える上記(1)のネットワーク障害復旧システムである。
(3)本発明の一態様は、前記強化学習エンジンは、前記選択されたタスクが前記通信ネットワークに対して実行されても前記通信ネットワークの障害が復旧しない場合に、前記強化学習演算処理における報酬として負の値を設定する、上記(1)又は(2)のいずれかのネットワーク障害復旧システムである。
(4)本発明の一態様は、前記強化学習エンジンは、前記選択されたタスクの実行に要する時間に応じて、前記強化学習演算処理における報酬を設定する、上記(1)から(3)のいずれかのネットワーク障害復旧システムである。
(5)本発明の一態様は、前記強化学習エンジンは、前記選択されたタスクの実行によって前記通信ネットワークの状態に影響を及ぼした範囲の大きさに応じて、前記強化学習演算処理における報酬を設定する、上記(1)から(4)のいずれかのネットワーク障害復旧システムである。
(6)本発明の一態様は、前記通信ネットワークに障害が発生していると判断された前記ネットワーク状態データをグラフ構造ネットワーク状態データに変換するネットワーク状態データ構造変換部と、前記グラフ構造ネットワーク状態データを行列形式データに変換するネットワーク状態データ行列変換部と、を備え、前記強化学習エンジンは、前記前記グラフ構造ネットワーク状態データの行列形式データを使用して前記強化学習演算処理を実行する、上記(1)から(5)のいずれかのネットワーク障害復旧システムである。
(7)本発明の一態様は、コンピュータに、通信ネットワークの状態を示すネットワーク状態データを取得し、前記ネットワーク状態データに基づいて前記通信ネットワークに障害が発生しているか否かを判断するネットワーク状態取得ステップと、前記通信ネットワークに障害が発生していると判断された前記ネットワーク状態データに基づいて、前記通信ネットワークに発生した障害を復旧させるためのタスクが登録されたタスクデータベースから前記通信ネットワークに適用するタスクを選択する強化学習演算処理を実行する強化学習ステップと、前記選択されたタスクを前記通信ネットワークに対して実行するタスク実行ステップと、を実行させるためのコンピュータプログラムである。
(8)本発明の一態様は、ネットワーク状態取得部が、通信ネットワークの状態を示すネットワーク状態データを取得し、前記ネットワーク状態データに基づいて前記通信ネットワークに障害が発生しているか否かを判断するネットワーク状態取得ステップと、強化学習エンジンが、前記通信ネットワークに障害が発生していると判断された前記ネットワーク状態データに基づいて、前記通信ネットワークに発生した障害を復旧させるためのタスクが登録されたタスクデータベースから前記通信ネットワークに適用するタスクを選択する強化学習演算処理を実行する強化学習ステップと、タスク実行部が、前記選択されたタスクを前記通信ネットワークに対して実行するタスク実行ステップと、を含むネットワーク障害復旧方法である。
本発明によれば、機械学習によって通信ネットワークの障害復旧のタスクの実行手順を作成する際の品質向上を図ることができるという効果が得られる。
一実施形態に係るネットワーク障害復旧システムの構成例を示すブロック図である。 一実施形態に係るネットワーク障害復旧方法の詳細な手順の一例を示すシーケンス図である。 一実施形態に係るネットワーク障害復旧方法の詳細な手順の一例を示すシーケンス図である。 一実施形態に係るネットワーク障害復旧方法の詳細な手順の一例を示すシーケンス図である。 一実施形態に係るネットワーク障害復旧方法の詳細な手順の一例を示すシーケンス図である。 一実施形態に係るネットワーク障害復旧方法の詳細な手順の一例を示すシーケンス図である。 一実施形態に係るネットワーク状態データの機械学習用データの例を示す多層行列図である。 一実施形態に係るネットワーク状態データの機械学習用データの例を示す多層行列図である。
以下、図面を参照し、本発明の実施形態について説明する。
図1は、一実施形態に係るネットワーク障害復旧システムの構成例を示すブロック図である。図1において、ネットワーク障害復旧システム1は、ネットワーク状態取得部(NW状態取得部)10と、強化学習エンジン20と、タスクデータベース30と、ワークフロー実行・生成部40とを備える。NW状態取得部10は、受信部11と、判断部12と、ネットワーク状態データ構造変換部(NW状態データ構造変換部)13と、ネットワーク状態データ行列変換部(NW状態データ行列変換部)14とを備える。強化学習エンジン20は、モデル21と制御部22とを備える。ワークフロー実行・生成部40は、ワークフロー生成部41とタスク実行部42とを備える。
ネットワーク基盤(NW基盤)100は、ネットワーク障害復旧システム1が障害復旧の対象にする通信ネットワークの基盤である。NW基盤100は、ネットワーク基盤管理部(NW基盤管理部)110と、オーケストレータ120と、通信ネットワークを構成するネットワーク機器の一例としてのルータとを備える。図1の例では、NW基盤100は、複数台のルータによって通信ネットワークを構成する。具体的には、障害発生前は3台のルータA,B,Cによって通信ネットワークが構成される。その後、ルータAに障害が発生することが図1に示されている。ルータDは、予備のルータとして予め設けられたものである。なお、ルータA,B,C,Dは、それぞれ独立したルータ装置として設けられてもよく、又は、コンピュータによって実現される仮想マシン(VM)上でルータアプリケーションが実行されることによりルータ機能が実現されるものであってもよい。
NW基盤管理部110は、3台のルータA,B,Cによって構成される通信ネットワークの状態を管理し、当該通信ネットワークの状態を示すネットワーク状態データをNW状態取得部10へ送信する。ネットワーク状態データは、通信ネットワークの接続構成(ネットワークトポロジ)を示すネットワークトポロジ情報を含むデータである。このネットワークトポロジ情報は、通信ネットワークを構成する3台のルータA,B,Cの情報に加えて予備のルータDの情報も含むものである。
また、ネットワーク状態データは、通信ネットワークの状態の一例として通信ネットワークの性能の状態を示すNW性能状態情報を含むデータである。NW性能状態情報は、例えば、ルータ機能を実現するためのCPU(Central Processing Unit:中央演算処理装置)やハードディスク等の記憶装置に関するCPU使用率や記憶容量使用率などのデータである。
NW状態取得部10において、受信部11は、NW基盤管理部110からネットワーク状態データを受信する。判断部12は、受信部11がNW基盤管理部110から受信したネットワーク状態データに基づいて通信ネットワークに障害が発生しているか否かを判断する。NW状態取得部10は、判断部12による判断結果が通信ネットワークに障害発生ありの場合(図1に示す「障害が復旧している?:No」の場合)、通信ネットワークに障害が発生していると判断されたネットワーク状態データを強化学習エンジン20へ出力する。具体的には、NW状態取得部10は、判断部12による判断結果が通信ネットワークに障害発生ありの場合(図1に示す「障害が復旧している?:No」の場合)、通信ネットワークに障害が発生していると判断されたネットワーク状態データをNW状態データ構造変換部13及びNW状態データ行列変換部14により機械学習用データに変換し、変換結果であるネットワーク状態データの機械学習用データを強化学習エンジン20へ出力する。NW状態データ構造変換部13は、ネットワーク状態データをグラフ構造ネットワーク状態データに変換する。NW状態データ行列変換部14は、グラフ構造ネットワーク状態データを行列形式データに変換する。NW状態データ行列変換部14による変換結果のグラフ構造ネットワーク状態データの行列形式データがネットワーク状態データの機械学習用データとして強化学習エンジン20へ出力される。
タスクデータベース30は、NW基盤100の通信ネットワークに発生した障害を復旧させるためのタスクが登録されたデータベースである。
強化学習エンジン20は、NW状態取得部10から出力されたネットワーク状態データ(通信ネットワークに障害が発生していると判断されたネットワーク状態データ)の機械学習用データに基づいてタスクデータベース30から通信ネットワークに適用するタスクを選択する強化学習演算処理を実行する。具体的には、強化学習エンジン20は、NW状態取得部10から出力されたネットワーク状態データの機械学習用データをモデル21の状態の入力にする。モデル21は、機械学習のモデルであって、教師データなしの機械学習である強化学習のモデルである。モデル21としては、例えば、DDQN、DDPG、A3Cなどのモデルを利用することができる。モデル21は、自己の状態に基づいて、タスクデータベース30から通信ネットワークに適用するタスクを選択する。モデル21は、出力として選択結果のタスクを指定する。
制御部22は、モデル21から出力されたタスクの指定に基づいて、当該指定されたタスクの実行をワークフロー実行・生成部40のタスク実行部42へ指示する。タスク実行部42は、制御部22から指示されたタスクを、NW基盤100のオーケストレータ120によって実行させる。オーケストレータ120は、当該タスクを通信ネットワークに適用する。
制御部22は、モデル21によるタスクの選択結果に基づいて、モデル21に対して報酬を設定する。例えば、制御部22は、モデル21によって選択されたタスクの実行結果に基づいて、モデル21に対して報酬を設定してもよい。制御部22は、モデル21によって選択されたタスクの特性(例えば、タスクの実行に要する時間など)に基づいて、モデル21に対して報酬を設定してもよい。
強化学習エンジン20は、CPU及びメモリ等のコンピュータハードウェアを備え、CPUがメモリに格納されたコンピュータプログラムを実行することにより強化学習エンジン20の機能が実現されるものである。
NW状態取得部10は、判断部12による判断結果が通信ネットワークに障害発生ありから障害発生なしに変化した場合(図1に示す「障害が復旧している?:Yes」の場合)、ワークフロー実行・生成部40のワークフロー生成部41に対して、ワークフローの生成を指示する。ワークフロー生成部41は、通信ネットワークに障害が発生してから復旧するまでに当該通信ネットワークに対して実行されたタスクを記録する。このタスクの記録には、各タスクのタスク識別子と実行順序とが記録される。
図1の例では、ルータAに障害が発生し、このルータAによる通信ネットワークの障害発生が判断部12によってネットワーク状態データに基づいて検出される。次いで、強化学習エンジン20のモデル21によって、通信ネットワークに障害が発生していると判断されたネットワーク状態データの機械学習用データに基づいてタスクデータベース30から通信ネットワークに適用するタスクが選択され、選択されたタスクがタスク実行部42によって実行されることにより、当該タスクがオーケストレータ120を介して通信ネットワークに適用される。図1の例では、実行されたタスクは「予備のルータDを適用する」である。このタスクの実行により、通信ネットワークはルータAの代わりにルータDを経由するように再構成される。この結果、ネットワーク状態データに基づいた判断部12による判断結果が通信ネットワークに障害発生ありから障害発生なしに変化する。次いで、NW状態取得部10からワークフロー生成部41に対してワークフローの生成が指示され、ワークフロー生成部41によって、通信ネットワークに障害が発生してから復旧するまでに当該通信ネットワークに対して実行されたタスクが記録されることにより、当該障害の発生に係る復旧のためのタスク実行手順を示すワークフローが生成される。
次に図2から図6を参照して本実施形態に係るネットワーク障害復旧システム1の動作を説明する。図2から図6は、本実施形態に係るネットワーク障害復旧方法の詳細な手順の一例を示すシーケンス図である。ここでは、図1に示されるNW基盤100のルータAに障害が発生する場合を例に挙げて説明する。
(ステップS1) 図2において、NW基盤管理部110は、障害通知をNW状態取得部10へ送信する。
(ステップS2) NW状態取得部10は、ネットワーク(NW)状態送信依頼をNW基盤管理部110へ送信する。
(ステップS3) NW基盤管理部110は、ネットワーク状態データ(NW状態データ)をNW状態取得部10へ送信する。
(ステップS4) NW状態取得部10は、NW状態データに基づいて障害が発生しているか否かを判断する。この結果、障害が発生していると判断された場合、ステップS5に進む。ここでは、図1に示されるNW基盤100のルータAに障害が発生している。
(ステップS5) NW状態取得部10は、NW状態データを機械学習用データに変換する。
(ステップS6) NW状態取得部10は、NW状態データから変換した機械学習用データを強化学習エンジン20へ送信する。
(ステップS7) 強化学習エンジン20は、NW状態データから変換された機械学習用データをモデル21の状態の入力し、モデル21によって、タスクデータベース30から通信ネットワークに適用するタスクを選択する。ここでは、タスク「予備のルータDを適用する」が選択される。
(ステップS8) 強化学習エンジン20は、モデル21によって選択されたタスクの実行をタスク実行部42へ依頼する。
(ステップS9) タスク実行部42は、強化学習エンジン20から実行を依頼されたタスクに対応する障害復旧API(Application Programming Interface)を、オーケストレータ120により実行させる。
(ステップS10) 図3において、オーケストレータ120は、タスク実行部42からの実行制御によって該当する障害復旧APIを実行する。オーケストレータ120は、予備のルータDに対応するインスタンスの生成をNW基盤管理部110へ指示する。
(ステップS11) NW基盤管理部110は、予備のルータDに対応するインスタンスの生成を行う。
(ステップS12) ルータDは、起動通知をNW基盤管理部110へ送信する。
(ステップS13) NW基盤管理部110は、インスタンスの生成完了をオーケストレータ120へ通知する。
(ステップS14) オーケストレータ120は、ルータAの代わりにルータDを経由するようにルーティング設定の変更をNW基盤管理部110へ指示する。
(ステップS15) NW基盤管理部110は、当該ルーティング設定の変更に対応するルーティング設定をルータDに行う。
(ステップS16) ルータDは、自己の性能情報をNW基盤管理部110へ送信する。
(ステップS17) NW基盤管理部110は、ルータDの性能情報に基づいて、ルータDが正常状態であるか否かを判定する。この結果、正常状態であると判定された場合、ステップS18に進む。
(ステップS18) NW基盤管理部110は、ルーティング設定の変更完了をオーケストレータ120へ通知する。
(ステップS19) 図4において、NW基盤管理部110は、NW状態データをNW状態取得部10へ送信する。
(ステップS20) NW状態取得部10は、NW状態データに基づいて障害が発生しているか否かを判断する。この結果、障害が発生していると判断された場合、ステップS21に進む。ここでは、まだルータDによって通信ネットワークが正常状態に復旧していない。
(ステップS21) NW状態取得部10は、NW状態データを機械学習用データに変換する。
(ステップS22) NW状態取得部10は、NW状態データから変換した機械学習用データを強化学習エンジン20へ送信する。
(ステップS23) 強化学習エンジン20は、NW状態データから変換された機械学習用データをモデル21の状態の入力し、モデル21によって、タスクデータベース30から通信ネットワークに適用するタスクを選択する。ここでは、タスク「通信サービスの疎通を確認する」が選択される。また、強化学習エンジン20は、モデル21による過去のタスクの選択結果に基づいて、モデル21に対して報酬を設定する。
(ステップS24) 強化学習エンジン20は、モデル21によって選択されたタスクの実行をタスク実行部42へ依頼する。
(ステップS25) タスク実行部42は、強化学習エンジン20から実行を依頼されたタスクに対応するサービス疎通確認APIを、オーケストレータ120により実行させる。
(ステップS26) 図5において、オーケストレータ120は、タスク実行部42からの実行制御によって該当するサービス疎通確認APIを実行する。オーケストレータ120は、サービス疎通状態確認コマンドの実行をルータDへ指示する。
(ステップS27) ルータDは、サービス疎通状態確認コマンドを実行する。
(ステップS28) ルータDは、サービス疎通状態確認コマンドの実行結果を確認応答としてオーケストレータ120へ送信する。
(ステップS29) 図6において、NW基盤管理部110は、NW状態データをNW状態取得部10へ送信する。
(ステップS30) NW状態取得部10は、NW状態データに基づいて障害が発生しているか否かを判断する。この結果、障害が発生していると判断された場合、ステップS21に戻る。一方、障害が発生していないと判断された場合(これは障害が復旧したと判断された場合に対応する)、ステップS31に進む。ここでは、ルータDによって通信ネットワークが正常状態に復旧している。
(ステップS31) NW状態取得部10は、ワークフローの登録をワークフロー生成部41へ指示する。
(ステップS32) ワークフロー生成部41は、通信ネットワークに障害が発生してから復旧するまでに当該通信ネットワークに対して実行されたタスクを記録する。このタスクの記録は、各タスクのタスク識別子と実行順序とが記録されることにより、当該障害の発生に係る復旧のためのタスク実行手順を示すワークフローとして登録される。
本実施形態によれば、通信ネットワークに障害が発生した場合に当該通信ネットワークを正常な状態に復旧させるためのワークフローを、強化学習を利用して動的に生成することができる。これにより、機械学習によって通信ネットワークの障害復旧のタスクの実行手順を作成する際の品質向上を図る効果が得られる。また、強化学習は教師データなしの機械学習であるので、教師データを準備するためのコストや教師データを用いた事前学習のためのコストを削減することができる。
[強化学習の報酬の例]
強化学習エンジン20の制御部22は、モデル21によるタスクの選択結果に基づいて、モデル21に対して報酬を設定する。以下、モデル21に対する報酬の設定例を説明する。
(報酬の設定例1)
報酬の設定例1では、モデル21によって選択されたタスクが通信ネットワークに対して実行されても、当該通信ネットワークの障害が復旧しない場合に、モデル21に対して報酬として負の値を設定する。この報酬の設定例1によれば、通信ネットワークに障害が発生してから復旧するまでに実行するタスクの個数がより少ないワークフローが優先的に生成される効果が得られる。
(報酬の設定例2)
報酬の設定例2では、モデル21によって選択されたタスクの実行に要する時間に応じて、モデル21に対する報酬を設定する。この報酬の設定例2によれば、モデル21によるタスクの選択において、障害の復旧までにかかる時間がより短いタスクが優先される効果が得られる。
(報酬の設定例3)
報酬の設定例3では、モデル21によって選択されたタスクの実行によって通信ネットワークの状態に影響を及ぼした範囲の大きさに応じて、モデル21に対する報酬を設定する。この報酬の設定例3によれば、モデル21によるタスクの選択において、タスクの実行によって通信ネットワークの状態に影響を及ぼす範囲の大きさがより小さいタスクが優先される効果が得られる。
なお、上述した報酬の設定例1,2,3は、それぞれ単独で使用されてもよく、又は、複数が組み合わされて使用されてもよい。
[ネットワーク状態データの機械学習用データの例]
図7,図8を参照して、ネットワーク状態データの機械学習用データの例を説明する。図7及び図8は、本実施形態に係るネットワーク状態データの機械学習用データの例を示す多層行列図である。図7には、通信ネットワークが正常状態である場合の多層行列が示される。図8には、通信ネットワークが障害予兆状態である場合の多層行列が示される。
図7において、多層行列201は、通信ネットワークのネットワークトポロジを示している。他の多層行列202,203,204,205は、通信ネットワークの性能の状態(NW性能状態)を示している。NW性能状態を示す多層行列は、NW性能状態の監視項目ごとに設けられる。図7及び図8の例では、NW性能状態の監視項目は、通信ネットワークを構成するネットワーク機器の機能を実現するためのCPUやメモリやハードディスクに関するCPU使用率、メモリ容量使用率、及びハードディスク容量使用率である。
多層行列202は、CPU種別wholeのCPU使用率の状態を表すものである。多層行列203は、CPU種別nginxのCPU使用率の状態を表すものである。多層行列204は、メモリ容量使用率の状態を表すものである。多層行列205は、ハードディスク容量使用率の状態を表すものである。各多層行列202,203,204,205において、多層行列201で示されるネットワークトポロジのネットワーク構成要素に対応する行列要素値が「0(空白)」である場合に当該ネットワーク構成要素に係る該当のNW性能状態が正常であることを示し、一方、当該行列要素値が「1」である場合に当該ネットワーク構成要素に係る該当のNW性能状態が異常であることを示す。図7には、通信ネットワークが正常状態である場合の多層行列202,203,204,205が示されるので、各多層行列202,203,204,205において全ての行列要素値が「0(空白)」である。
図8において、多層行列211は通信ネットワークのネットワークトポロジを示している。多層行列212は、CPU種別wholeのCPU使用率の状態を表すものである。多層行列213は、CPU種別nginxのCPU使用率の状態を表すものである。多層行列214は、メモリ容量使用率の状態を表すものである。多層行列215は、ハードディスク容量使用率の状態を表すものである。図8には、通信ネットワークが障害予兆状態である場合の多層行列が示されるのであって、CPU種別wholeのCPU使用率の状態を表す多層行列212において、ネットワーク構成要素nRBのCPU種別wholeのCPU使用率の状態が異常であることが示される。それ以外の他の多層行列213,214,215は全て正常状態を示している。
本実施形態では、ネットワーク状態データから図7や図8に示される多層行列に変換した機械学習用データが、強化学習エンジン20のモデル21の状態の入力に使用される。
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
上述した各装置の機能を実現するためのコンピュータプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するようにしてもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD(Digital Versatile Disc)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
1…ネットワーク障害復旧システム、10…ネットワーク状態取得部(NW状態取得部)、11…受信部、12…判断部、20…強化学習エンジン、21…モデル、22…制御部、30…タスクデータベース、40…ワークフロー実行・生成部、41…ワークフロー生成部、42…タスク実行部、100…ネットワーク基盤(NW基盤)、110…ネットワーク基盤管理部(NW基盤管理部)、120…オーケストレータ

Claims (8)

  1. 通信ネットワークに発生した障害を復旧させるためのタスクが登録されたタスクデータベースと、
    前記通信ネットワークの状態を示すネットワーク状態データを取得し、前記ネットワーク状態データに基づいて前記通信ネットワークに障害が発生しているか否かを判断するネットワーク状態取得部と、
    前記通信ネットワークに障害が発生していると判断された前記ネットワーク状態データに基づいて前記タスクデータベースから前記通信ネットワークに適用するタスクを選択する強化学習演算処理を実行する強化学習エンジンと、
    前記選択されたタスクを前記通信ネットワークに対して実行するタスク実行部と、
    を備えるネットワーク障害復旧システム。
  2. 前記通信ネットワークに障害が発生してから復旧するまでに前記通信ネットワークに対して実行されたタスクを記録するワークフロー生成部、
    をさらに備える請求項1に記載のネットワーク障害復旧システム。
  3. 前記強化学習エンジンは、前記選択されたタスクが前記通信ネットワークに対して実行されても前記通信ネットワークの障害が復旧しない場合に、前記強化学習演算処理における報酬として負の値を設定する、
    請求項1又は2のいずれか1項に記載のネットワーク障害復旧システム。
  4. 前記強化学習エンジンは、前記選択されたタスクの実行に要する時間に応じて、前記強化学習演算処理における報酬を設定する、
    請求項1から3のいずれか1項に記載のネットワーク障害復旧システム。
  5. 前記強化学習エンジンは、前記選択されたタスクの実行によって前記通信ネットワークの状態に影響を及ぼした範囲の大きさに応じて、前記強化学習演算処理における報酬を設定する、
    請求項1から4のいずれか1項に記載のネットワーク障害復旧システム。
  6. 前記通信ネットワークに障害が発生していると判断された前記ネットワーク状態データをグラフ構造ネットワーク状態データに変換するネットワーク状態データ構造変換部と、
    前記グラフ構造ネットワーク状態データを行列形式データに変換するネットワーク状態データ行列変換部と、を備え、
    前記強化学習エンジンは、前記前記グラフ構造ネットワーク状態データの行列形式データを使用して前記強化学習演算処理を実行する、
    請求項1から5のいずれか1項に記載のネットワーク障害復旧システム。
  7. コンピュータに、
    通信ネットワークの状態を示すネットワーク状態データを取得し、前記ネットワーク状態データに基づいて前記通信ネットワークに障害が発生しているか否かを判断するネットワーク状態取得ステップと、
    前記通信ネットワークに障害が発生していると判断された前記ネットワーク状態データに基づいて、前記通信ネットワークに発生した障害を復旧させるためのタスクが登録されたタスクデータベースから前記通信ネットワークに適用するタスクを選択する強化学習演算処理を実行する強化学習ステップと、
    前記選択されたタスクを前記通信ネットワークに対して実行するタスク実行ステップと、
    を実行させるためのコンピュータプログラム。
  8. ネットワーク状態取得部が、通信ネットワークの状態を示すネットワーク状態データを取得し、前記ネットワーク状態データに基づいて前記通信ネットワークに障害が発生しているか否かを判断するネットワーク状態取得ステップと、
    強化学習エンジンが、前記通信ネットワークに障害が発生していると判断された前記ネットワーク状態データに基づいて、前記通信ネットワークに発生した障害を復旧させるためのタスクが登録されたタスクデータベースから前記通信ネットワークに適用するタスクを選択する強化学習演算処理を実行する強化学習ステップと、
    タスク実行部が、前記選択されたタスクを前記通信ネットワークに対して実行するタスク実行ステップと、
    を含むネットワーク障害復旧方法。
JP2019055440A 2019-03-22 2019-03-22 ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法 Active JP7050023B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019055440A JP7050023B2 (ja) 2019-03-22 2019-03-22 ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019055440A JP7050023B2 (ja) 2019-03-22 2019-03-22 ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法

Publications (2)

Publication Number Publication Date
JP2020156053A true JP2020156053A (ja) 2020-09-24
JP7050023B2 JP7050023B2 (ja) 2022-04-07

Family

ID=72559990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019055440A Active JP7050023B2 (ja) 2019-03-22 2019-03-22 ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法

Country Status (1)

Country Link
JP (1) JP7050023B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7391809B2 (ja) 2020-09-25 2023-12-05 Kddi株式会社 ネットワーク状態確認手順の妥当性判定装置、方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354280A (ja) * 2004-06-09 2005-12-22 Fujitsu Ltd ポリシールール最適化方法および装置
WO2018175972A1 (en) * 2017-03-24 2018-09-27 Google Llc Device placement optimization with reinforcement learning
US20180376390A1 (en) * 2017-06-22 2018-12-27 At&T Intellectual Property I, L.P. Mobility management for wireless communication networks
JP2019029856A (ja) * 2017-07-31 2019-02-21 ファナック株式会社 無線中継器選択装置及び機械学習装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354280A (ja) * 2004-06-09 2005-12-22 Fujitsu Ltd ポリシールール最適化方法および装置
WO2018175972A1 (en) * 2017-03-24 2018-09-27 Google Llc Device placement optimization with reinforcement learning
US20180376390A1 (en) * 2017-06-22 2018-12-27 At&T Intellectual Property I, L.P. Mobility management for wireless communication networks
JP2019029856A (ja) * 2017-07-31 2019-02-21 ファナック株式会社 無線中継器選択装置及び機械学習装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7391809B2 (ja) 2020-09-25 2023-12-05 Kddi株式会社 ネットワーク状態確認手順の妥当性判定装置、方法及びプログラム

Also Published As

Publication number Publication date
JP7050023B2 (ja) 2022-04-07

Similar Documents

Publication Publication Date Title
US11086825B2 (en) Telemetry system for a cloud synchronization system
US10509680B2 (en) Methods, systems and apparatus to perform a workflow in a software defined data center
WO2020248507A1 (zh) 基于容器云的系统资源监控方法及相关设备
JP5948933B2 (ja) ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
US6990605B2 (en) Methods and apparatus for recovering work of one computer by another computers
CN106452836B (zh) 主节点设置方法及装置
CN109842500B (zh) 一种调度方法及系统、工作节点及监控节点
CN113672350A (zh) 一种应用处理方法、装置及相关设备
JP7050023B2 (ja) ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法
JP6525761B2 (ja) ウェブサーバ、管理システム、およびその制御方法
US20200304383A1 (en) Generation of templates for cloud computing platforms
JP6965873B2 (ja) 変更手順生成装置、変更手順生成方法および変更手順生成プログラム
JP5061671B2 (ja) 演算プログラム、分散処理プログラム、分散処理システムおよび演算処理方法
US9870249B2 (en) Virtual computer system, method, and non-transitory computer readable medium
JP6309432B2 (ja) 秘密計算システム及び方法並びに管理サーバ及びプログラム
KR20220142210A (ko) 블록체인의 적응적 트랜잭션 처리 방법 및 노드 장치
JP6812732B2 (ja) 情報処理システム、情報処理装置およびプログラム
JP7065686B2 (ja) 情報処理システム、情報処理装置及びプログラム
JP5781652B1 (ja) スタック管理装置、スタック管理方法、および、スタック管理プログラム
US9608854B2 (en) Method and system for automatic execution of scripts on remote agent-less client machines
WO2010035480A1 (ja) 分散処理システム、分散処理方法およびプログラム
US11907102B2 (en) Dynamic debug log enabler for any protection failure jobs
JP5316730B1 (ja) 印刷制御装置、印刷システム及びプログラム
JP7223591B2 (ja) データ移行管理装置、データ移行管理プログラム、およびデータ移行管理方法
JP2010218335A (ja) ファイル保存システム、ファイル保存方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210122

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220328

R150 Certificate of patent or registration of utility model

Ref document number: 7050023

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150