JP2021082873A - 予兆監視装置、予兆監視方法およびプログラム - Google Patents

予兆監視装置、予兆監視方法およびプログラム Download PDF

Info

Publication number
JP2021082873A
JP2021082873A JP2019206368A JP2019206368A JP2021082873A JP 2021082873 A JP2021082873 A JP 2021082873A JP 2019206368 A JP2019206368 A JP 2019206368A JP 2019206368 A JP2019206368 A JP 2019206368A JP 2021082873 A JP2021082873 A JP 2021082873A
Authority
JP
Japan
Prior art keywords
failure
model
communication unit
time
communication system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019206368A
Other languages
English (en)
Other versions
JP6954671B2 (ja
Inventor
悠子 茅根
Yuko Kayane
悠子 茅根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2019206368A priority Critical patent/JP6954671B2/ja
Publication of JP2021082873A publication Critical patent/JP2021082873A/ja
Application granted granted Critical
Publication of JP6954671B2 publication Critical patent/JP6954671B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Optical Communication System (AREA)

Abstract

【課題】通信システムの光モジュールが経年劣化等により故障が発生した場合、原因を分析して故障している部品を特定し、正常な部品への交換を実施していた。しかし、この方法では故障による性能遅延や動作停止を未然に防ぐことはできない。【解決手段】予兆監視装置は、光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得する取得手段と、通信部が故障した場合に通信システムから取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するモデル記憶手段と、通信システムから取得した時系列データを学習済みモデルに入力して、通信部に故障の予兆があるか否かの判定を行う判定手段と、を備える。【選択図】図1

Description

本発明は、予兆監視装置、予兆監視方法およびプログラムに関する。
光モジュールおよびケーブルを用いた通信システムが知られている。特許文献1−3には、光モジュールを用いた通信システムにおける故障の判定技術が開示されている。
特許文献1には、ひずみを受けたサンプルデジタル信号に現れる1波形の波形状と、当該1波形が表す0または1の符号と、の対応関係を示す推論マッピングモデルを記憶し、当該推論マッピングを参照して、実デジタル信号に現れる1波形ごとに符号を逐次特定することにより、内部環境や外部環境の影響でデジタル信号の波形がひずみを受けても、現信号を精度良く推定する技術が開示されている。
特許文献2には、光モジュールの状態を診断監視して所定の診断監視結果を不揮発性メモリに格納し、光通信装置の起動時に所定の出力条件を満たす場合、当該診断監視結果を出力することにより、光モジュールの状況変化を把握して障害や故障の原因分析あるいは予測に反映させる技術が開示されている。
特許文献3には、光モジュールが実装された場合、稼働時間および劣化ポイント累積値を所定時間間隔でメモリに記録し、当該光モジュールが再実装された場合に、当該劣化ポイント累積値に基づいて、当該光モジュールの劣化度を予想することにより、光モジュールの故障劣化具合を高い精度で予想する技術が開示されている。
特開2019−057895号公報 特開2017−195453号公報 特開2015−026955号公報
通信システムの光モジュールの経年劣化等により通信システムに故障が発生した場合、原因を分析して故障している部品を特定し、正常な部品への交換を実施する必要がある。しかし、この方法では故障による性能遅延や動作停止を未然に防ぐことが困難である。
本発明の目的は、上述した課題を解決する予兆監視装置、予兆監視方法およびプログラムを提供することにある。
本発明に係る予兆監視装置は、光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得する取得手段と、通信部が故障した場合に通信システムから取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するモデル記憶手段と、通信システムから取得した時系列データを学習済みモデルに入力して、通信部に故障の予兆があるか否かの判定を行う判定手段と、を備える。
本発明に係る予兆監視方法は、光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得するステップと、通信部が故障した場合に通信システムから取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するステップと、通信システムから取得した時系列データを学習済みモデルに入力して、通信部に故障の予兆があるか否かの判定を行うステップと、を有する。
本発明に係るプログラムは、コンピュータを、光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得する取得手段、通信部が故障した場合に通信システムから取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するモデル記憶手段、通信システムから取得した時系列データを学習済みモデルに入力して、通信部に故障の予兆があるか否かの判定を行う判定手段、として機能させる。
上記態様のうち少なくとも1つの態様によれば、予兆監視装置は通信システムの通信部に故障の予兆があるか否かの判定を行うので、当該通信システムの故障による性能遅延や動作停止を未然に防ぐことができる。
一実施形態に係る予兆監視装置の構成を示す図である。 一実施形態に係る制御装置の構成を示す概略ブロック図である。 一実施形態に係る予兆監視装置の学習に係る動作を示すフローチャートである。 一実施形態に係る予兆監視装置の機械学習に係る動作を示すフローチャートである。 一実施形態に係る予兆監視装置の故障の予兆に係る動作を示すフローチャートである。 基本構成に係る予兆監視装置の構成を示す概略ブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
〈第1の実施形態〉
《予兆監視装置の構成》
以下、図面を参照しながら実施形態について詳しく説明する。
図1は、第1の実施形態に係る予兆監視装置10の構成を示す図である。
予兆監視装置10は、通信システム1に接続し、当該通信システム1から故障データを取得して故障の予兆があるか否かを判定する装置である。
通信システム1は、サーバ20と、スイッチ装置30と、ストレージ40と、通信部50とを備える。上記サーバ20と、スイッチ装置30と、ストレージ40は複数のコンピュータの一例である。通信システム1は通信部50として、サーバ20とスイッチ装置30とを接続させる通信部50Aと、スイッチ装置30とストレージ40とを接続させる通信部50Bとを備える。
サーバ20は、コンピュータネットワークにおいて、他のコンピュータに対して機能やサービス、データなどを提供するコンピュータである。
スイッチ装置30は、サーバ20とストレージ40の接続を中継する装置である。
ストレージ40は、データを記憶する装置である。ストレージ40の例としては、オンプレミスストレージと、クラウドストレージと、が挙げられる。
通信部50は、サーバ20とスイッチ装置30とを接続させ、スイッチ装置30とストレージ40とを接続させる。通信部50は、光モジュール51と、ケーブル52と、を備える。
光モジュール51は、電気信号と光信号を相互に変換する。通信システム1は、サーバ20とケーブル52Aとの間に光モジュール51Aを備え、ケーブル52Aとスイッチ装置30との間に光モジュール51Bを備える。また、通信システム1は、スイッチ装置30と、ケーブル52Bとの間に光モジュール51Cを備え、ケーブル52Bとストレージ40との間に光モジュール51Dを備える。
光モジュール51Aはサーバ20からの電気信号を光信号に変換してケーブル52Aに送り、ケーブル52Aからの光信号を電気信号に変換してサーバ20に送る。光モジュール51Bはケーブル52Aからの光信号を電気信号に変換してスイッチ装置30に送り、スイッチ装置30からの電気信号を光信号に変換してケーブル52Aに送る。光モジュール51Cはスイッチ装置30からの電気信号を光信号に変換してケーブル52Bに送り、ケーブル52Bからの光信号を電気信号に変換してスイッチ装置30に送る。光モジュール51Dはケーブル52Bからの光信号を電気信号に変換してストレージ40に送り、ストレージ40からの電気信号を光信号に変換してケーブル52Bに送る。
ケーブル52は、光信号を送り、保護被覆で覆われた光ファイバーである。ケーブル52Aは、光モジュール51Aから光モジュール51Bに光信号を送り、光モジュール51Bから光モジュール51Aに光信号を送る。また、ケーブル52Bは、光モジュール51Cから光モジュール51Dに光信号を送り、光モジュール51Dから光モジュール51Cに光信号を送る。
通信システム1において、例えばサーバ20からストレージ40に信号を送る場合、以下のような動作となる。
サーバ20の電気信号が光モジュール51Aにより光信号に変換されて、ケーブル52Aが当該光信号を光モジュール51Bに送る。光モジュール51Bは当該光信号を電気信号に変換してスイッチ装置30に送る。スイッチ装置30は電気信号を光モジュール51Cに送り、光モジュール51Cが当該電気信号を光信号に変換してケーブル52Bに送る。ケーブル52Bは光信号を光モジュール51Dに送り、光モジュール51Dは当該光信号を電気信号に変換してストレージ40に送る。ストレージ40は電気信号を受信する。
図1に示す通信システム1は、サーバ20と、スイッチ装置30と、ストレージ40と、をそれぞれ1台ずつ備えるが、それぞれ複数台を備えても良い。例えば、通信システム1は、10台のサーバ20と、1台のスイッチ装置30と、1台のストレージ40と、を備えても良い。
予兆監視装置10は、制御装置100と、取得部200と、を備える。取得部200は、取得手段の一例である。予兆監視装置10は、取得部200として、取得部200Aと、取得部200Bと、取得部200Cと、を備える。
取得部200は、光モジュール51からデータを取得して、制御装置100に当該データを送信する。取得部200が取得するデータは、光量と、バイアス電流値と、ITW(Invalid Transmission Word)のエラー値と、CRC(Cyclic Redundancy Check)のエラー値と、の時系列データを含む。また、取得部200が取得するデータは、光モジュール51の型番と、光モジュール51の位置を特定できる位置情報の、データを含む。取得部200Aは光モジュール51Aに接続して、光モジュール51Aからデータを取得する。取得部200Bは光モジュール51B及び光モジュール51Cからデータを取得する。取得部200Cは光モジュール51Dからデータを取得する。
上記光量とは、光モジュール51Aと、光モジュール51Bと、光モジュール51Cと、光モジュール51Dとの、それぞれの光モジュール51で変換された光信号の光のエネルギーの量である。上記位置情報とは、光モジュール51の位置を特定できる光モジュール51固有の識別情報である。例えば、光モジュール51Aに1の位置情報が、光モジュール51Bに2の位置情報が、光モジュール51Cに3の位置情報が、光モジュール51Dに4の位置情報が与えられても良い。
制御装置100は、取得部200からデータを受け入れて、故障データの特徴量に係るモデルを学習して記憶し、当該モデルにより故障の予兆があるか否かを判定する装置である。上記故障データとは、通信部50が故障した場合に通信システム1から取得した時系列データである。図2は、制御装置100の構成を示す概略ブロック図である。制御装置100は、データ受信手段105と、データ記憶手段110と、入力受入手段120と、モデル学習手段130と、モデル記憶手段140と、モデル更新手段150と、判定手段160と、時期予測手段170と、位置特定手段180と、出力手段190と、を備える。
データ受信手段105は、取得部200Aと、取得部200Bと、取得部200Cと、が送信したデータを受信する。データ記憶手段110は、データ受信手段105が受信したデータを記憶する。データ記憶手段110の例としては、オンプレミスストレージと、クラウドストレージと、が挙げられる。
入力受入手段120は、予兆監視装置10のユーザから故障入力を受け入れ、データ受信手段105が記憶しているデータのうち、当該故障入力が含んでいる故障時刻から一定の時間のデータに上記の故障入力に関連付けて、故障データとしてデータ記憶手段110に記録する。また、入力受入手段120は、予兆監視装置10のユーザから学習開始の入力と、機械学習開始の入力と、機械学習終了の入力と、を受け入れる。上記故障入力とは、通信部50が故障した旨の入力である。
モデル学習手段130は、入力受入手段120が学習開始の入力を受け入れた場合、データ記憶手段110が記憶している故障データの特徴量を学習することにより、学習済みモデルを生成して、モデル記憶手段140に記録する。モデル記憶手段140は、モデル学習手段130により学習された学習済みモデルを記憶する。モデル記憶手段140の例としては、オンプレミスストレージと、クラウドストレージと、が挙げられる。
モデル学習手段130の動作の一例を以下に説明する。
入力受入手段120が学習開始の入力を受け入れた場合、モデル学習手段130は、データ記憶手段110が記憶している故障データの特徴量のうち、故障した時刻の前に係る一部の期間の時系列データを教師データの入力データとし、故障した時刻を含む一部の期間の時系列データを教師データの出力データとして、故障データの特徴量である光量、バイアス電量、ITWのエラー値、CRCのエラー値、位置情報、光モジュール51の型番と、時刻とを関連付けた重みを決定する。モデル学習手段130は、上記重みと、時刻と、当該重みに関連付けられた特徴量とを用いる式であるモデルを生成することにより、モデルを学習する。
通信システム1の故障の場合、以下のような傾向が現れることが知られている。
例えば、通信部50の故障の原因の一つである経年劣化では、光モジュール51の光量の減衰傾向が現れる。また、この場合、光モジュール51からのバイアス電流の一時的な増加が現れる。サーバ20、スイッチ装置30またはストレージ40の故障やケーブル52の故障の場合、ITWのエラー値又はCRCのエラー値が増加傾向を示す。
このため、予兆監視装置10のユーザが通信システム1の故障を検知して故障入力をし、当該故障入力を入力受入手段120が受け入れた場合、当該故障入力を受け入れた時刻から一定の時間のデータには、故障していない場合とは異なる傾向が現れる。このような傾向から現れるデータの特徴量を上記モデル学習手段130が学習することにより、故障を予兆できる学習済みモデルが生成される。
モデル更新手段150は、入力受入手段120が機械学習開始の入力を受け入れた後から入力受入手段120が機械学習終了の入力を受け入れる前まで、当該入力の後に新たにデータ記憶手段110に記録される故障データの特徴量を用いて、モデル記憶手段140が記憶している学習済みモデルを更新する。すなわち、モデル更新手段150は、入力受入手段120が機械学習開始の入力を受け入れた後から入力受入手段120が機械学習終了の入力を受け入れる前まで、入力受入手段120が故障入力を受け入れる度に、当該故障入力に係る故障データの特徴量を用いて、モデル記憶手段140が記憶している学習済みモデルを更新する。上記更新の手法は、モデル学習手段130がモデルを学習する手法を用いる。
判定手段160は、予め設定された時間毎に、データ記憶手段110が記憶しているデータを、モデル記憶手段140が記憶している学習済みモデルに入力して、通信部50に故障の予兆があるか否かの判定を行う。例えば、通信部50が故障する前は、データ記憶手段110が記憶している光量、バイアス電流、ITWのエラー値、CRCのエラー値が変化するため、当該変化に係る時系列データを、モデル記憶手段140が記憶している学習済みモデルに入力することにより、入力の時系列データの将来に係る時系列データを出力し、当該出力された時系列データと故障データに係る時系列データとを照らし合わせることにより、判定手段160は、通信部50に故障の予兆があるか否かの判定を行うことができる。
時期予測手段170は、判定手段160が、通信部50に故障の予兆があるとの判定を行った場合、当該判定の内容に基づいて、当該通信部50が故障する時期を予測する。すなわち、時期予測手段170は、判定手段160が出力した時系列データを、故障データに係る時系列データに照らし合わせることにより、通信部50が故障する時期を予測する。
位置特定手段180は、判定手段160が、通信部50に故障の予兆があるとの判定を行った場合、当該判定の内容に基づいて、故障に係る光モジュール51を特定する。すなわち、位置特定手段180は、判定手段160が出力した時系列データを、故障データに係る時系列データに照らし合わせることにより、故障に係る位置情報を特定して故障に係る光モジュール51を特定する。
出力手段190は、判定手段160が、通信部50に故障の予兆があるとの判定を行った場合、判定手段160が行った判定の内容と、時期予測手段170が予測した故障する時期と、位置特定手段180が特定した故障に係る光モジュール51と、を出力する。出力手段190の例としては、ディスプレイ装置が挙げられる。
《学習に係る動作》
以下、予兆監視装置10がモデルを学習する動作について説明する。図3は、予兆監視装置10のモデルの学習に係る動作を示すフローチャートである。
予兆監視装置10のユーザが予兆監視装置10に学習開始の入力を行う。これにより、入力受入手段120が学習開始の入力を受け入れる(ステップS1)。
モデル学習手段130は、データ記憶手段110が記憶している故障データの特徴量を学習することにより、学習済みモデルを生成する(ステップS2)。例えば、モデル学習手段130は、故障する前に係る故障データの特徴量に係る時系列データを教師データの入力データとし、故障した時刻に係る故障データの特徴量に係る時系列データを教師データの出力データとして、特徴量に重み付けした式をモデルとして生成することにより学習する。
モデル学習手段130は、ステップS2で生成した学習済みモデルをモデル記憶手段140に記録する(ステップS3)。これにより、学習済みモデルはモデル記憶手段140に記憶される。
上記の動作により、予兆監視装置10が故障に係る学習済みモデルを生成するため、予兆監視装置10のユーザは当該学習済みモデルを用いて、通信システム1の故障を予兆することができる。
《機械学習に係る動作》
以下、予兆監視装置10の機械学習に係る動作について説明する。図4は、予兆監視装置10の機械学習に係る動作を示すフローチャートである。
予兆監視装置10のユーザが予兆監視装置10に機械学習開始の入力を行う。これにより、入力受入手段120が機械学習開始の入力を受け入れる(ステップS11)。
ステップS11により、機械学習開始の入力が受け入れた後、入力受入手段120が故障入力を受け入れた場合(ステップS12:YES)、モデル更新手段150は、当該故障入力に係る故障データの特徴量を用いて、モデル記憶手段140が記憶している学習済みモデルを更新する(ステップS13)。すなわち、モデル更新手段150は、予兆監視装置10のユーザが、故障入力を行って、入力受入手段120が故障入力を受け入れる度に、モデル記憶手段140が記憶している学習済みモデルを更新する。
その後、入力受入手段120が機械学習終了の入力を受け入れてない場合(ステップS14:NO)、予め設定された一定時間後に、ステップS12に戻り、ステップS12からの動作を繰り返す。入力受入手段120が機械学習終了の入力を受け入れた場合(ステップS14:YES)、再度ステップS12に戻ることなく動作を終了する。
他方、機械学習開始の入力が受け入れた後、入力受入手段120が故障入力を受け入れていない場合(ステップS12:NO)、ステップS13での更新の動作はなく、ステップ14の動作を行う。
上記の動作により、予兆監視装置10が予め設定された一定時間毎に、故障データを用いて機械学習を行って、学習済みモデルを更新するため、予兆監視装置10のユーザは、故障の度に学習の入力を行わなくても、当該故障に係るデータを反映した学習済みモデルを用いて、通信システム1の故障を予兆することができる。
《故障の予兆に係る動作》
以下、予兆監視装置10の故障の予兆に係る動作について説明する。図5は、予兆監視装置10の故障の予兆に係る動作を示すフローチャートである。
判定手段160は、予め設定された一定時間毎に、データ記憶手段110が記憶しているデータを、モデル記憶手段140が記憶している学習済みモデルに入力して、時系列データを出力して、出力した時系列データを故障データに係る時系列データに照らし合わせて、通信部50に故障の予兆があるか否かを判定する(ステップS21)。
判定手段160が、ステップS21において故障の予兆があると判定した場合(ステップS21:YES)、時期予測手段170は、ステップS21の判定の内容を用いて、通信部50が故障する時期を予測する(ステップS22)。すなわち、時期予測手段170は、判定手段160により出力された時系列データを、故障データに係る時系列データに照らし合わせて、故障に係る時期を予測する。
位置特定手段180は、時期予測手段170は、ステップS21の判定の内容を用いて、通信部50の故障に係る光モジュール51を特定する(ステップS23)。
出力手段190は、ステップS21において判定された故障の予兆がある旨の判定の内容と、ステップS22において予測された故障する時期と、ステップS23において特定された故障に係る光モジュール51と、を出力する(ステップS24)。これにより、予兆監視装置10は、故障が予兆された旨と時期、当該故障に係る光モジュール51を確認できる。
ステップS24の後、一定時間の後に、再びステップS21の動作に戻り、判定手段160が、故障の予兆があるか否かを判定する。
他方、判定手段160が、ステップS21において故障の予兆がないと判定した場合(ステップS21:NO)、予兆監視装置10は、ステップS22からステップS24までの動作を行うことなく、一定時間の後に、再びステップS21の動作に戻り、判定手段160が、故障の予兆があるか否かを判定する。
上記の動作により、予兆管理装置10のユーザは、モデル記憶手段140が記憶している学習済みモデルに基づいて、故障の予兆を判定できるため、通信システム1の故障による性能遅延や動作停止を未然に防ぐことができる。
《作用・効果》
本発明に係る予兆監視装置10は、光モジュール51及びケーブル52を有する通信部50によって複数のコンピュータを接続する通信システム1から時系列データを取得する取得手段と、通信部50が故障した場合に通信システム1から取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するモデル記憶手段140と、通信システム1から取得した時系列データを学習済みモデルに入力して、通信部50に故障の予兆があるか否かの判定を行う判定手段160と、を備える。
これにより、予兆監視装置10は、通信システム1の通信部50に故障の予兆があるか否かの判定を行うため、当該通信システム1の故障による性能遅延や動作停止を未然に防ぐことができる。
故障データには、光量と、バイアス電流値と、ITWのエラー値と、CRCのエラー値と、光モジュール51の型番と、光モジュール51の位置を特定できる位置情報と、が含まれる。
これにより、予兆監視装置10は、通信システム1の通信部50が故障する場合に値が変化する傾向がある光量、バイアス電流値と、ITWのエラー値と、CRCのエラー値と、光モジュール51の型番と、光モジュール51の位置を特定できる位置情報が含まれた故障データを用いて、故障の予兆の判定を行うため、より明確に故障の予兆を判定することができる。
また、予兆監視装置10は、判定手段160が、通信部50に故障の予兆があるとの判定を行った場合、当該判定の内容に基づいて、当該通信部50が故障する時期を予測する時期予測手段170と、を備える。
これにより、予兆監視装置10は、予兆した故障に係る時期を予測するため、予兆監視装置10のユーザは、通信部50が故障する時期を予測することができる。
また、予兆監視装置10は、判定手段160が、通信部50に故障の予兆があるとの判定を行った場合、当該判定の内容に基づいて、故障に係る光モジュールを特定する位置特定手段180と、を備える。
これにより、予兆監視装置10は、予兆した故障に係る光モジュール51を特定するため、予兆監視装置10のユーザは、故障が予兆される光モジュール51を特定することができ、未然に当該光モジュール51の性能遅延や動作停止を防ぐことができる。
また、予兆監視装置10は、判定手段160の判定の内容を出力する出力手段190と、を備える。これにより、予兆監視装置10のユーザは、故障の予兆に係る判定の内容を確認することができる。
また、予兆監視装置10は、通信システム1から取得した故障データの特徴量を用いて、モデル記憶手段140が記憶している学習済みモデルを更新するモデル更新手段150と、を備える。
これにより、予兆監視装置10は、通信システム1から取得した故障データの特徴量を用いて学習済みモデルを更新することにより機械学習を行い、予兆監視装置10のユーザは、取得した故障データに基づいて更新された学習済みモデルでの故障の予兆ができる。
〈基本構成〉
以下、基本構成に係る予兆監視装置10について説明する。図6は、基本構成に係る予兆監視装置10の構成を示す概略ブロック図である。基本構成に係る予兆監視装置10は、データ受信手段105と、データ記憶手段110と、入力受入手段120と、モデル学習手段130と、モデル記憶手段140と、判定手段160と、を備える。
基本構成に係る予兆監視装置10は、サーバ20とストレージ40とスイッチ装置30と光モジュール51及びケーブル52を有する通信部50とを備え、サーバ20とストレージ40とは通信部50によりスイッチ装置30に接続される通信システム1に、接続し、通信部50が故障した場合に通信システム1から取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するモデル記憶手段140と、通信システム1から取得した時系列データを学習済みモデルに入力して、通信部50に故障の予兆があるか否かの判定を行う判定手段160と、を備える。
これにより、予兆監視装置10は、通信システム1の通信部50に故障の予兆があるか否かの判定を行うため、当該通信システム1の故障による性能遅延や動作停止を未然に防ぐことができる。
〈他の実施形態〉
以上、図面を参照して一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、様々な設計変更等をすることが可能である。
上記の実施形態に係る予兆監視装置10は、故障の予兆に用いる学習済みモデルの学習に、光量と、バイアス電流値と、ITWのエラー値と、CRCのエラー値と、光モジュール51の型番と、光モジュール51の位置を特定できる位置情報の、時系列データを用いるが、他に通信システム1から取得できるデータを用いて学習済みモデルを学習して、故障を予兆しても良い。
図7は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1100は、プロセッサ1110、メインメモリ1120、ストレージ1130、インタフェース1140を備える。
上述の制御装置100は、コンピュータ1100に実装される。そして、上述した各処理部の動作は、プログラムの形式でストレージ1130に記憶されている。プロセッサ1110は、プログラムをストレージ1130から読み出してメインメモリ1120に展開し、当該プログラムに従って上記処理を実行する。また、プロセッサ1110は、プログラムに従って、上述した各記憶部に対応する記憶領域をメインメモリ1120に確保する。
プログラムは、コンピュータ1100に発揮させる機能の一部を実現するためのものであってもよい。例えば、プログラムは、ストレージ1130に既に記憶されている他のプログラムとの組み合わせ、または他の装置に実装された他のプログラムとの組み合わせによって機能を発揮させるものであってもよい。なお、他の実施形態においては、コンピュータ1100は、上記構成に加えて、または上記構成に代えてPLD(Programmable Logic Device)などのカスタムLSI(Large Scale Integrated Circuit)を備えてもよい。PLDの例としては、PAL(Programmable Array Logic)、GAL(Generic Array Logic)、CPLD(Complex Programmable Logic Device)、FPGA(Field Programmable Gate Array)が挙げられる。この場合、プロセッサ1110によって実現される機能の一部または全部が当該集積回路によって実現されてよい。
ストレージ1130の例としては、磁気ディスク、光磁気ディスク、半導体メモリ等が挙げられる。ストレージ1130は、コンピュータ1100のバスに直接接続された内部メディアであってもよいし、インタフェース1140または通信回線を介してコンピュータに接続される外部メディアであってもよい。また、このプログラムが通信回線によってコンピュータ1100に配信される場合、配信を受けたコンピュータ1100が当該プログラムをメインメモリ1120に展開し、上記処理を実行してもよい。少なくとも1つの実施形態において、ストレージ1130は、一時的でない有形の記憶媒体である。
また、当該プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、当該プログラムは、前述した機能をストレージ1130に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であってもよい。
1 通信システム
10 予兆監視装置
20 サーバ
30 スイッチ装置
40 ストレージ
50 通信部
51 光モジュール
52 ケーブル
100 制御装置
105 データ受信手段
110 データ記憶手段
120 入力受入手段
130 モデル学習手段
140 モデル記憶手段
150 モデル更新手段
160 判定手段
170 時期予測手段
180 位置特定手段
190 出力手段
200 取得部
1100 コンピュータ
1110 プロセッサ
1120 メインメモリ
1130 ストレージ
1140 インタフェース
本発明に係る予兆監視装置は、光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得する取得手段と、通信部が故障した場合に通信システムから取得した時系列データである故障データの特徴量のうち、故障した時刻の前に係る一部の期間の時系列データを教師データの入力データとし、故障した時刻を含む一部の期間の時系列データを教師データの出力データとして学習した学習済みモデルを記憶するモデル記憶手段と、通信システムから取得した時系列データを学習済みモデルに入力して、通信部に故障の予兆があるか否かの判定を行う判定手段と、を備え、前記時系列データには、光量と、バイアス電流値と、ITWのエラー値と、CRCのエラー値と、前記光モジュールの型番と、前記光モジュールの位置を特定できる位置情報と、が含まれる。
本発明に係る予兆監視方法は、光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得するステップと、通信部が故障した場合に通信システムから取得した時系列データである故障データの特徴量のうち、故障した時刻の前に係る一部の期間の時系列データを教師データの入力データとし、故障した時刻を含む一部の期間の時系列データを教師データの出力データとして学習した学習済みモデルを記憶するステップと、通信システムから取得した時系列データを学習済みモデルに入力して、通信部に故障の予兆があるか否かの判定を行うステップと、を有し、前記時系列データには、光量と、バイアス電流値と、ITWのエラー値と、CRCのエラー値と、前記光モジュールの型番と、前記光モジュールの位置を特定できる位置情報と、が含まれる。
本発明に係るプログラムは、コンピュータを、光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得する取得手段、通信部が故障した場合に通信システムから取得した時系列データである故障データの特徴量のうち、故障した時刻の前に係る一部の期間の時系列データを教師データの入力データとし、故障した時刻を含む一部の期間の時系列データを教師データの出力データとして学習した学習済みモデルを記憶するモデル記憶手段、通信システムから取得した時系列データを学習済みモデルに入力して、通信部に故障の予兆があるか否かの判定を行う判定手段、として機能させ、前記時系列データには、光量と、バイアス電流値と、ITWのエラー値と、CRCのエラー値と、前記光モジュールの型番と、前記光モジュールの位置を特定できる位置情報と、が含まれる。

Claims (8)

  1. 光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得する取得手段と、
    前記通信部が故障した場合に前記通信システムから取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するモデル記憶手段と、
    前記通信システムから取得した時系列データを前記学習済みモデルに入力して、前記通信部に故障の予兆があるか否かの判定を行う判定手段と、
    を備える予兆監視装置。
  2. 前記時系列データには、光量と、バイアス電流値と、ITWのエラー値と、CRCのエラー値と、前記光モジュールの型番と、前記光モジュールの位置を特定できる位置情報と、が含まれる
    請求項1に記載の予兆監視装置。
  3. 前記判定手段が、前記通信部に故障の予兆があるとの判定を行った場合、前記判定の内容に基づいて、当該通信部が故障する時期を予測する時期予測手段と、
    を備える請求項1または請求項2に記載の予兆監視装置。
  4. 前記判定手段が、前記通信部に故障の予兆があるとの判定を行った場合、前記判定の内容に基づいて、故障に係る光モジュールを特定する位置特定手段と、
    を備える請求項1から請求項3の何れか1項に記載の予兆監視装置。
  5. 前記判定手段の判定の内容を出力する出力手段と、
    を備える請求項1から請求項4の何れか1項に記載の予兆監視装置。
  6. 前記通信システムから取得した前記故障データの特徴量を用いて、前記モデル記憶手段が記憶している前記学習済みモデルを更新するモデル更新手段と、
    を備える請求項1から請求項5の何れか1項に記載の予兆監視装置。
  7. 光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得するステップと、
    前記通信部が故障した場合に前記通信システムから取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するステップと、
    前記通信システムから取得した時系列データを前記学習済みモデルに入力して、前記通信部に故障の予兆があるか否かの判定を行うステップと、
    を有する予測監視方法。
  8. コンピュータを、
    光モジュール及びケーブルを有する通信部によって複数のコンピュータを接続する通信システムから時系列データを取得する取得手段、
    前記通信部が故障した場合に前記通信システムから取得した時系列データである故障データの特徴量を学習した学習済みモデルを記憶するモデル記憶手段、
    前記通信システムから取得した時系列データを前記学習済みモデルに入力して、前記通信部に故障の予兆があるか否かの判定を行う判定手段、
    として機能させるプログラム。
JP2019206368A 2019-11-14 2019-11-14 予兆監視装置、予兆監視方法およびプログラム Active JP6954671B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019206368A JP6954671B2 (ja) 2019-11-14 2019-11-14 予兆監視装置、予兆監視方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019206368A JP6954671B2 (ja) 2019-11-14 2019-11-14 予兆監視装置、予兆監視方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2021082873A true JP2021082873A (ja) 2021-05-27
JP6954671B2 JP6954671B2 (ja) 2021-10-27

Family

ID=75963379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019206368A Active JP6954671B2 (ja) 2019-11-14 2019-11-14 予兆監視装置、予兆監視方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6954671B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024034082A1 (ja) * 2022-08-10 2024-02-15 日本電信電話株式会社 故障予測装置、故障予測方法、および、故障予測プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008124945A (ja) * 2006-11-15 2008-05-29 Nec Corp 管理サーバ装置、故障予測システム及びそれらに用いる故障予測方法
JP2016173782A (ja) * 2015-03-18 2016-09-29 エヌ・ティ・ティ・コミュニケーションズ株式会社 故障予測システム、故障予測方法、故障予測装置、学習装置、故障予測プログラム及び学習プログラム
JP2019186618A (ja) * 2018-04-03 2019-10-24 富士通株式会社 光送受信システム、光通信装置及び故障検出方法
JP2020123951A (ja) * 2019-01-30 2020-08-13 華為技術有限公司Huawei Technologies Co.,Ltd. 光モジュールの故障を予測するための方法、装置、およびデバイス

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008124945A (ja) * 2006-11-15 2008-05-29 Nec Corp 管理サーバ装置、故障予測システム及びそれらに用いる故障予測方法
JP2016173782A (ja) * 2015-03-18 2016-09-29 エヌ・ティ・ティ・コミュニケーションズ株式会社 故障予測システム、故障予測方法、故障予測装置、学習装置、故障予測プログラム及び学習プログラム
JP2019186618A (ja) * 2018-04-03 2019-10-24 富士通株式会社 光送受信システム、光通信装置及び故障検出方法
JP2020123951A (ja) * 2019-01-30 2020-08-13 華為技術有限公司Huawei Technologies Co.,Ltd. 光モジュールの故障を予測するための方法、装置、およびデバイス

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024034082A1 (ja) * 2022-08-10 2024-02-15 日本電信電話株式会社 故障予測装置、故障予測方法、および、故障予測プログラム

Also Published As

Publication number Publication date
JP6954671B2 (ja) 2021-10-27

Similar Documents

Publication Publication Date Title
CN112436968B (zh) 一种网络流量的监测方法、装置、设备及存储介质
CN107925612B (zh) 网络监视系统、网络监视方法和计算机可读介质
US7843359B2 (en) Fault management system using satellite telemetering technology and method thereof
US6684180B2 (en) Apparatus, system and method for reporting field replaceable unit replacement
US11675799B2 (en) Anomaly detection system
CN112771504A (zh) 多因素云服务存储设备错误预测
KR102377628B1 (ko) 인공지능 서비스에 대한 성능 관리 장치 및 방법
CN111459692B (zh) 用于预测驱动器故障的方法、设备和计算机程序产品
CN101999101B (zh) 系统运行预测的确定方法
FR2909792A1 (fr) Systeme de maintenance centralisee d'equipements electroniques embarques
JPWO2020021587A1 (ja) 時系列データ診断装置、追加学習方法およびプログラム
US20160147823A1 (en) Pattern-based problem determination guidance
US11455223B2 (en) Using system errors and manufacturer defects in system components causing the system errors to determine a quality assessment value for the components
CN113098715B (zh) 一种信息处理方法、装置、系统、介质和计算设备
JP6880560B2 (ja) 故障予測装置、故障予測方法及び故障予測プログラム
CN111522703A (zh) 监控访问请求的方法、设备和计算机程序产品
WO2023138594A1 (en) Machine learning assisted remediation of networked computing failure patterns
US8601318B2 (en) Method, apparatus and computer program product for rule-based directed problem resolution for servers with scalable proactive monitoring
JP6954671B2 (ja) 予兆監視装置、予兆監視方法およびプログラム
CN106899436A (zh) 一种云平台故障预测诊断系统
US20210055978A1 (en) Analytics initiated predictive failure and smart log
US11436069B2 (en) Method and apparatus for predicting hard drive failure
US20150324267A1 (en) Diagnosing entities associated with software components
AU2021269196B2 (en) Performance event troubleshooting system
US11947406B2 (en) Method, electronic device, and computer program product for memory fault prediction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210922

R150 Certificate of patent or registration of utility model

Ref document number: 6954671

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150