JP2014027395A - 故障原因特定支援装置、方法およびプログラム - Google Patents

故障原因特定支援装置、方法およびプログラム Download PDF

Info

Publication number
JP2014027395A
JP2014027395A JP2012164628A JP2012164628A JP2014027395A JP 2014027395 A JP2014027395 A JP 2014027395A JP 2012164628 A JP2012164628 A JP 2012164628A JP 2012164628 A JP2012164628 A JP 2012164628A JP 2014027395 A JP2014027395 A JP 2014027395A
Authority
JP
Japan
Prior art keywords
failure
information
cause
occurrence time
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012164628A
Other languages
English (en)
Other versions
JP5756064B2 (ja
Inventor
Chihiro Takayama
千尋 高山
Takehiko Ono
健彦 大野
Yutaka Chiaki
裕 千明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012164628A priority Critical patent/JP5756064B2/ja
Publication of JP2014027395A publication Critical patent/JP2014027395A/ja
Application granted granted Critical
Publication of JP5756064B2 publication Critical patent/JP5756064B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

【課題】時々発生する故障の原因特定を容易にする。
【解決手段】監視対象装置であるルータ2の状況と当該状況が生じた時刻とを含む状況情報を記憶する状況情報記憶部101と、監視対象装置が故障したことを認知する故障認知部102と、故障が認知されたなら、故障が生じた時刻である故障発生時刻での監視対象装置の状況の特徴を取得する特徴取得部103と、特徴に類似する特徴を呈する状況を示す状況情報を状況情報記憶部101から検索する状況情報検索部104と、状況情報に示された時刻である類似状況発生時刻での状況をヒヤリングするための当該類似状況発生時刻を示すヒヤリングシートを出力するヒヤリングシート出力部111とを設ける。
を備える
【選択図】図1

Description

本発明は、時々発生する故障の原因特定を容易にする技術に関するものである。
近年、多様なサービスを提供するため、ネットワークに接続される機器は多様化・高機能化し、またネットワークを構成する有線や無線などのメディアも多様化した結果、ネットワークは複雑化している。ネットワークが複雑化するに従って、故障発生時の故障箇所の特定が難しくなってきている。
こうした複雑化するネットワークの故障に対して、故障箇所を判定・可視化する技術が考案されている(特許文献1参照)。
既存技術では、故障時に発生する特定の信号を基に故障箇所の特定を行う仕組みを採用している。そのためこれらの技術では、時々発生する故障であっても、検査時に故障が発生していない場合は、特定の信号を受信できず、正常と診断されてしまう。時々発生する故障の発生原因としては、機器やメディアなどの設備が、劣化によって徐々に正常状態から異常状態に変化するに従って、正常と異常のとの中間状態になることがあるためである。中間状態にあるネットワークの機器やメディアは、設計段階で考慮される系の構成要素とは異なる、想定外の外部要因の影響を受けやすく、気温などの環境のわずかな変化によって正常と異常の状態を行き来することがある。
特許第4714245号公報
上記、背景技術で述べた、時々発生する故障は、故障の発生を検出することは難しく、さらにその原因を突き止めることも難しい。
その要因の一つは、故障が当初想定されていない外部要因によって引き起こされるためである。
外部要因によって発生するネットワークの故障の例としては、気温が下がることによって設備の一部が収縮し、ケーブルの接続が切れてしまう場合や、お客様が機器を触り、その結果ケーブルが抜けてしまう場合など、ネットワークシステムを構成する設備以外からの影響によるものが挙げられる。
これら考えられるすべての外部要因について、故障原因かどうかを検討することは労力がかかる。
また、上記の外部要因の影響を把握するために故障状態を再現させようとしても、そもそも再現性の低い故障であるため、再現させるために長い時間を要したり、多くの回数試験を行う必要が発生したりする。
以上から、時々発生する故障の故障原因究明は、難しい作業となっている。
本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、時々発生する故障の原因特定を容易にすることにある。
上記の課題を解決するために、第1の本発明は、監視対象装置の状況と当該状況が生じた時刻とを示す状況情報を記憶する状況情報記憶部と、前記監視対象装置が故障したことを認知する故障認知部と、前記故障認知部により故障が認知されたなら、当該故障が生じた時刻である故障発生時刻での前記監視対象装置の状況の特徴を取得する特徴取得部と、前記特徴に類似する特徴を呈する状況を示す状況情報を前記状況情報記憶部から検索する状況情報検索部と、当該状況情報に示された時刻である類似状況発生時刻での状況をヒヤリングするための当該類似状況発生時刻を示すヒヤリングシートを出力するヒヤリングシート出力部とを備えることを特徴とする故障原因特定支援装置をもって解決手段とする。
例えば、故障原因特定支援装置は、前記類似状況発生時刻の周期である類似状況発生周期を計算する周期計算部を備え、前記ヒヤリングシート出力部は、当該類似状況発生時刻に当該類似状況発生周期を対応づけたヒヤリングシートを出力する。
例えば、故障原因特定支援装置は、前記監視対象装置内または前記監視対象装置外で発生したイベントのイベント内容と当該イベントの開始時刻と当該イベントの終了時刻とを含むイベント情報を記憶するイベント情報記憶部と、前記監視対象装置を故障させる可能性のある原因または当該原因による故障への対処方法を示す原因対処情報と当該原因が発生する可能性のあるイベントのイベント内容とを含む支援情報を記憶する支援情報記憶部と、前記類似状況発生時刻を含む時間帯の開始時刻と終了時刻とを含むイベント情報を前記イベント情報記憶部から検索し、当該イベント情報内のイベント内容に一致するイベント内容を含む支援情報を前記支援情報記憶部から検索する相関関係判定部とを備え、前記ヒヤリングシート出力部は、前記類似状況発生時刻に当該支援情報内の原因対処情報を対応づけたヒヤリングシートを出力する。
例えば、故障原因特定支援装置は、前記監視対象装置を故障させる可能性のある原因または当該原因による故障への対処方法を示す原因対処情報と当該原因が発生する可能性のある発生時間帯を示す発生時間帯情報と当該原因が発生する周期である原因発生周期とを含む支援情報を記憶する支援情報記憶部と、前記類似状況発生時刻の周期である類似状況発生周期を計算し、当該類似状況発生時刻に当該類似状況発生周期を対応づける周期計算部と、前記類似状況発生時刻を含む時間帯を示す発生時間帯情報と当該類似状況発生時刻に対応づけられた類似状況発生周期に一致する原因発生周期とを含む支援情報を前記支援情報記憶部から検索する相関関係判定部とを備え、前記ヒヤリングシート出力部は、前記類似状況発生時刻に当該支援情報内の原因対処情報を対応づけたヒヤリングシートを出力する。
例えば、故障原因特定支援装置は、前記ヒヤリングシートを用いたヒヤリングにより判明した前記監視対象装置を故障させる可能性のある原因または当該原因による故障への対処方法を示す原因対処情報を含む支援情報を前記支援情報記憶部に記憶させる支援情報登録部を備える。
第2の本発明は、故障原因特定支援装置の動作方法であって、前記故障原因特定支援装置は、監視対象装置の状況と当該状況が生じた時刻とを示す状況情報を記憶する状況情報記憶部を備え、前記動作方法は、前記故障原因特定支援装置の故障認知部が、前記監視対象装置が故障したことを認知し、前記故障原因特定支援装置の特徴取得部が、前記故障認知部により故障が認知されたなら、当該故障が生じた時刻である故障発生時刻での前記監視対象装置の状況の特徴を取得し、前記故障原因特定支援装置の状況情報検索部が、前記特徴に類似する特徴を呈する状況を示す状況情報を前記状況情報記憶部から検索し、前記故障原因特定支援装置のヒヤリングシート出力部が、当該状況情報に示された時刻である類似状況発生時刻での状況をヒヤリングするための当該類似状況発生時刻を示すヒヤリングシートを出力することを特徴とする故障原因特定支援装置の動作方法をもって解決手段とする。
本発明によれば、故障認知部が、監視対象装置が故障したことを認知し、特徴取得部が、故障認知部により故障が認知されたなら、当該故障が生じた時刻である故障発生時刻での監視対象装置の状況の特徴を取得し、状況情報検索部が、特徴に類似する特徴を呈する状況を示す状況情報を状況情報記憶部から検索し、ヒヤリングシート出力部が、当該状況情報に示された時刻である類似状況発生時刻での状況をヒヤリングするための当該類似状況発生時刻を示すヒヤリングシートを出力するので、ヒヤリングシートを用いたヒヤリングの際、ヒヤリングシート内の類似状況発生時刻での状況だけを質問し、回答を得ればよく、よって、時々発生する故障に関する情報を効率的に集めることができ、より正確に故障の原因特定を行うことができる。
本実施の形態に係る故障原因特定支援装置の構成を示す図である。 故障認知部102から特徴取得部103に通知される故障IDと故障発生時刻の一例を示す図である。 特徴取得部103により取得される特徴の一例を示す図である。 特徴取得部103により生成される特徴情報の一例を示す図である。 状況情報検索部104により生成される類似状況発生時刻リストLの一例を示す図である。 類似状況発生周期を含む類似状況発生時刻リストLの一例を示す図である。 イベント情報記憶部107に記憶されたイベント情報の一例を示す図である。 支援情報記憶部108に記憶された支援情報の一例を示す図である。 相関関係判定部110が最初に行う動作を示すフローチャートである。 図9の処理後の類似状況発生時刻リストLの一例を示す図である。 相関関係判定部110が図9の処理後に行う動作を示すフローチャートである。 図11の処理後の類似状況発生時刻リストLの一例を示す図である。
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本実施の形態に係る故障原因特定支援装置の構成を示す図である。
故障原因特定支援装置1は、ネットワークを構成するルータ2(監視対象装置)が故障した際に原因特定を支援する装置である。故障原因特定支援装置1は、例えば、気温の変化やルータ2が動いたときに生じる加速度の変化などを検出するセンサ3とともに用いられる。ルータ2は、パケットの交換などを行う伝送部21を備える。センサ3は、1つだけでなく、複数あってもよい。
故障原因特定支援装置1は、ルータ2の状況と当該状況が生じた時刻と示す状況情報を記憶する状況情報記憶部101と、ルータ2が故障したことを認知する故障認知部102と、故障が発生したときのルータ2の状況の特徴を取得する特徴取得部103と、取得された特徴に類似する特徴を呈する状況を示す状況情報を状況情報記憶部101から検索する状況情報検索部104と、検索された状況情報に示された時刻である類似状況発生時刻の周期である類似状況発生周期を計算する周期計算部105と、センサ3による検出結果等に基づき、ルータ2内やルータ2外で発生したイベントの発生を検出し、そのイベント内容等を含むイベント情報を生成するイベント解析部106と、イベント情報を記憶するイベント情報記憶部107と、ルータ2を故障させる可能性のある原因や当該原因による故障への対処方法を示す原因対処情報を含む支援情報を記憶する支援情報記憶部108と、故障原因特定支援装置1の保守者などにより入力された支援情報を支援情報記憶部108に記憶させる支援情報登録部109と、支援情報登録部109から類似状況発生時刻やイベント内容に基づいて支援情報を検索する相関関係判定部110と、類似状況発生時刻、類似状況発生周期、支援情報等を含むヒヤリングシートを生成し、これを図示しない表示装置などに出力するヒヤリングシート出力部111とを備える。
状況情報記憶部101は、ルータ2の状況と当該状況が生じた時刻と示す状況情報を記憶するものである。状況情報記憶部101には、例えば、ルータ2の初期設定後の状況情報が蓄積されていく。
状況情報は、例えば、伝送部21で送受信されるパケットのトラフィックや特定のパケットが流れたか否かを示す情報やルータ2の内部に記録されたログなどである。
故障認知部102は、ルータ2が故障したことを認知するものであり、故障を認知したなら、その故障に固有の故障IDを割り当て、故障IDと故障発生時刻を特徴取得部103に通知する。
故障IDは、複数の故障についての処理を並行して行う場合に、これらの複数の処理を区別するのに用いられる。
故障認知部102は、例えば、伝送部21から状況情報が送信されて、状況情報記憶部101に記憶される際、状況情報を取得し、予め設定された条件(伝送部21でパケットが送信できなくなったなど)を状況情報が充足するなら、ルータ2で故障が発生したと判定する。
または、故障認知部102は、ユーザによるルータ2へのボタン入力などによって、ルータ2から故障の発生が通知されたら、これをもって、ルータ2で故障が発生したと認知する。この場合も、故障認知部102は、故障IDと故障発生時刻を特徴取得部103に通知する。
図2は、故障認知部102から特徴取得部103に通知される故障IDと故障発生時刻の一例を示す図であり、故障ID「1」を割り当てられた故障が故障発生時刻「2012/04/01 12:22:04」に発生したことを示している。
特徴取得部103は、故障認知部102から故障IDと故障発生時刻が通知されたなら、故障が発生したときのルータ2の状況の特徴を取得する。
例えば、特徴取得部103は、故障発生時刻より過去に一定期間遡り、その期間の状況情報を状況情報記憶部101から読み出し、状況情報を基に特徴を検出する。
または、特徴取得部103は、故障発生時刻を見た故障原因特定支援装置1の保守者などの主観によって設定された期間の状況情報を状況情報記憶部101から読み出し、状況情報を基に特徴を検出する。
または、特徴取得部103は、故障発生時刻に故障が発生したことを知った保守者により故障原因特定支援装置1に入力された特徴を取得する。
図3は、特徴取得部103により取得される特徴の一例を示す図である。
特徴の例として、特定のパケットの発生や、特定のログの発生、トラフィックの急激な変化などが挙げられる。
特徴の検出方法としては、読み出した状況情報が、予め設定された条件を充足する場合、その状況情報を用い、機械学習によって判別器を作る方法が考えられる。
また、保守者により入力された特徴としては、特徴を判別する条件(例えば条件式)が考えられる。
特徴取得部103は、こうして得た各特徴につき、その特徴を示す特徴量(判別器の特徴を表すパラメタ値や、保守者の入力によるif-thenルール条件など)、該当の故障ID、該当の故障発生時刻を含む特徴情報を生成し、状況情報検索部104に送信する。
図4は、特徴取得部103により生成される特徴情報の一例を示す図であり、特徴取得部103は、例えば、3つの特徴のそれぞれにつき、その特徴を示す特徴量を含む特徴情報を生成し、この3つの特徴情報を状況情報検索部104に送信する。
状況情報検索部104は、各特徴情報につき、その特徴情報内の特徴量に対応する特徴に類似する特徴を呈する状況を示す状況情報を状況情報記憶部101から検索する。
検索の方法は、特徴量の種類により異なる。
状況情報検索部104は、特徴量が判別器の特徴を表すパラメタ値であった場合は、そのパラメタ値を判別器に設定し、状況情報記憶部101に記憶された過去の状況情報に対して判別・分類を行うことで、故障時と同様の特徴が発現しているときの状況情報を検索する。
具体例としては、トラフィック変化のパターンを、自己相関を用いて検出する方法などが挙げられる。
一方、状況情報検索部104は、特徴量が条件であった場合は、状況情報記憶部101に記憶された過去の状況情報から条件を充足する状況情報を検索する。
具体例としては、状況情報検索部104は、故障検出時にSIPプロトコルの特定のパケットが流れるという条件式であれば、特定のパケットが流れることを示す状況情報を検索する。
他の例としては、故障検出時にルータ2のログに特定の文字列が発生する、などの条件が考えられる。
状況情報検索部104は、検索された各状況情報につき、状況情報内の故障ID、状況情報内の故障発生時刻である類似状況発生時刻、状況情報内の特徴量を含む類似状況発生時刻情報を生成し、各類似状況発生時刻情報からなる類似状況発生時刻リストLを生成し、類似状況発生時刻リストLを周期計算部105に送信する。
図5は、状況情報検索部104により生成される類似状況発生時刻リストLの一例を示す図であり、状況情報検索部104は、例えば、5つの状況情報のそれぞれにつき、状況情報内の故障ID、類似状況発生時刻、特徴量を含む類似状況発生時刻情報を生成し、各類似状況発生時刻情報からなる類似状況発生時刻リストLを生成し、類似状況発生時刻リストLを周期計算部105に送信する。
周期計算部105は、類似状況発生時刻リストL内の類似状況発生時刻のうちで周期性のあるものについてはその周期である類似状況発生周期を計算し、当該類似状況発生時刻を含む類似状況発生時刻情報に当該類似状況発生周期を含ませ、類似状況発生時刻リストLを相関関係判定部110に送信する。
図6は、類似状況発生周期を含む類似状況発生時刻リストLの一例を示す図であり、周期性のある3つの類似状況発生時刻を含む類似状況発生時刻情報は、類似状況発生周期を含んでいる。
センサ3は、例えば、気温の変化やルータ2の加速度の変化などを予め定められた周期で定期的に検出し、検出結果をイベント解析部106に送信する。
イベント解析部106は、例えば、60度を超える気温の上昇を検出する、加速度が一定値を超える場合、ルータの振動が有る、80%を超える湿度の場合は降水である、などといった、イベントの検出ルールをセンサ3毎に予め有している。
イベント解析部106は、センサ3からの検出結果と検出ルールに基づき、ルータ2内やルータ2外でのイベントの発生を検出し、そのイベント内容とイベントの開始時刻と終了時刻を含むイベント情報を生成し、イベント情報記憶部107に記憶させる。
図7は、イベント情報記憶部107に記憶されたイベント情報の一例を示す図である。
例示したイベント情報1や2は、湿度が90%以上になったというイベント内容を含むものであり、イベント情報3や4や5は、ルータ2の加速度が変化したというイベント内容を含むものであり、イベント情報6は、ルータ2のトラフィックが帯域の80%を超えたというイベント内容を含むものであり、イベント情報6は、室温が60度を超えたというイベント内容を含むものである。
支援情報登録部109は、保守者により、ルータ2を故障させる可能性のある原因(予め分かっている原因や、後述のヒヤリングシートを用いてルータ2のユーザへ行ったヒヤリングで判明した原因)や当該原因による故障への対処方法を示す原因対処情報と、当該原因が発生する可能性のあるイベントのイベント内容とを含む支援情報が入力されるので、支援情報を支援情報記憶部108に記憶させる。
また、支援情報登録部109は、保守者により、同様の原因対処情報、該当原因が発生する可能性のある発生時間帯を示す発生時間帯情報、該当原因が発生する周期である原因発生周期を含む支援情報が入力されるので、支援情報を支援情報記憶部108に記憶させる。
図8は、支援情報記憶部108に記憶された支援情報の一例を示す図である。
例えば、支援情報1は、熱暴走が故障の原因である旨を示す情報と機器設置環境の確認をして対処すべき旨を示す原因対処情報と、室温が60度を超える旨のイベント内容を含む。
例えば、支援情報2は、ルータ2のアップデートによる再起動が故障の原因である旨の原因対処情報と、かかる再起動が発生する可能性のある発生時間帯「12:00−13:00」を示す発生時間帯情報と、かかるアップデートの発生する周期である原因発生周期「1ヶ月」とを含む。
図9は、次に相関関係判定部110が行う動作を示すフローチャートである。
相関関係判定部110は、類似状況発生時刻リストLから1つの類似状況発生時刻情報を選択し、類似状況発生時刻を読み出す(S1)。
次に、相関関係判定部110は、イベント情報記憶部107から1つのイベント情報を選択し、開始時刻および終了時刻を読み出す(S3)。
次に、相関関係判定部110は、類似状況発生時刻が開始時刻と終了時刻の間に含まれるか否かを判定する(S5)。
相関関係判定部110は、ステップS5でYESと判定されたなら、ステップS3で選択したイベント情報からイベント内容を読み出し、ステップS1で選択した類似状況発生時刻情報に当該イベント内容を含ませる(S7)。
相関関係判定部110は、ステップS5でNOと判定されたなら、または、ステップS7の処理を終えたなら、イベント情報記憶部107の全てのイベント情報をステップS3で選択したか否かを判定する(S9)。
相関関係判定部110は、ステップS9でNOと判定されたなら、ステップS3に戻り、まだ選択していない別のイベント情報を選択し、開始時刻および終了時刻を読み出す(S3)。
一方、相関関係判定部110は、ステップ9でYESと判定されたなら、類似状況発生時刻リストLの全ての類似状況発生時刻情報をステップS1で選択したか否かを判定する(S11)。
相関関係判定部110は、ステップS11でNOと判定されたなら、ステップS1に戻り、まだ選択していない別の類似状況発生時刻情報を選択し、類似状況発生時刻を読み出す(S1)。
一方、相関関係判定部110は、ステップS11でYESと判定されたなら、処理を終える。
図10は、図9の処理後の類似状況発生時刻リストLの一例を示す図である。
図9の処理の結果、類似状況発生時刻情報1はイベント内容「トラフィックが帯域の80%を超える」を含むこととなる。
また、類似状況発生時刻情報2はイベント内容「室温が60度を超える」を含むこととなる。
図11は、次に相関関係判定部110が行う動作を示すフローチャートである。
相関関係判定部110は、類似状況発生時刻リストLから1つの類似状況発生時刻情報を選択し、類似状況発生時刻を読み出し、イベント内容や類似状況発生周期があればこれを読み出す(S21)。
次に、相関関係判定部110は、支援情報記憶部108から1つの支援情報を選択し、イベント内容または発生時間帯情報と原因発生周期を読み出す(S23)。
次に、相関関係判定部110は、(1)類似状況発生時刻が発生時間帯情報により示される発生時間帯に含まれ且つ類似状況発生周期が原因発生周期に一致するという条件、(2)ステップS21で読み出したイベント内容がステップS23で読み出したイベント内容に一致するという条件、のいずれかが充足されるか否かを判定する(S25)。
相関関係判定部110は、ステップS25でYESと判定されたなら、ステップS23で選択した支援情報から原因対処情報を読み出し、ステップS21で選択した類似状況発生時刻情報に当該原因対処情報を含ませる(S27)。
相関関係判定部110は、ステップS25でNOと判定されたなら、または、ステップS27の処理を終えたなら、支援情報記憶部108の全ての支援情報をステップS23で選択したか否かを判定する(S29)。
相関関係判定部110は、ステップS29でNOと判定されたなら、ステップS13に戻り、まだ選択していない別の支援情報を選択し、イベント内容または発生時間帯情報および原因発生周期を読み出す(S23)。
一方、相関関係判定部110は、ステップS29でYESと判定されたなら、類似状況発生時刻リストLの全ての類似状況発生時刻情報をステップS21で選択したか否かを判定する(S31)。
相関関係判定部110は、ステップS31でNOと判定されたなら、ステップS21に戻り、まだ選択していない別の類似状況発生時刻情報を選択し、類似状況発生時刻を読み出し、イベント内容や類似状況発生周期があればこれを読み出す(S21)。
一方、相関関係判定部110は、ステップS31でYESと判定されたなら、処理を終える。
図12は、図11の処理後の類似状況発生時刻リストLの一例を示す図である。
図11の処理の結果、類似状況発生時刻情報1は、原因対処情報「ルータのアップデートによる再起動」を含むることとなる。
また、類似状況発生時刻情報2は、原因対処情報「帯域不足によるパケットロス」を含むこととなる。
また、類似状況発生時刻情報3は、原因対処情報「ルータのアップデートによる再起動」を含むこととなる。
また、類似状況発生時刻情報4は、原因対処情報「ルータのアップデートによる再起動」を含むこととなる。
また、類似状況発生時刻情報5は、原因「熱暴走」と対処方法「機器設置環境の確認」とを示す原因対処情報を含むこととなる。
次に、ヒヤリングシート出力部111は、類似状況発生時刻リストLから、原因対処情報を含む類似状況発生時刻情報のみを選択し、当該類似状況発生時刻情報を含むヒヤリングシートを生成し、出力する。ヒヤリングシートは、例えば、図12の類似状況発生時刻情報リストLと同様なものとなる。
保守者は、ヒヤリングシート内の類似状況発生時刻でのルータ2などの状況を、ルータ2のユーザ(お客様)からヒヤリングする。
ユーザは、類似状況発生時刻での状況だけを回答すればよいので、時々発生する故障に関する情報を効率的に集めることができ、より正確に故障の原因特定を行うことができる。
また、ヒヤリングシート内の類似状況発生周期を用い、「1ヶ月ごとに何かありませんでしたか」等の質問を行うことで、類似状況発生時刻だけでは得にくい情報を得ることができる。
また、ヒヤリングシート内の原因対処情報を用い、「原因としては、熱暴走が考えられますので、ルータを壁から離してみましょう」のような、原因と対処方法のアドバイスを行うことができる。
なお、ヒヤリングシート出力部111は、図5に示す類似状況発生時刻リストLと同様のヒヤリングシート、つまり類似状況発生時刻を示すヒヤリングシートを生成し、出力してもよい。
この場合、不要となる周期計算部105、イベント解析部106、イベント情報記憶部107、支援情報記憶部108、支援情報登録部109、相関関係判定部110は、故障原因特定支援装置1に設けなくてもよい。
また、ヒヤリングシート出力部111は、図6に示す類似状況発生時刻リストLと同様のヒヤリングシート、つまり、類似状況発生時刻に類似状況発生周期を対応づけたヒヤリングシートを生成し、出力してもよい。
この場合、不要となるイベント解析部106、イベント情報記憶部107、支援情報記憶部108、支援情報登録部109、相関関係判定部110は、故障原因特定支援装置1に設けなくてもよい。
また、監視対象装置は、ネットワークを構成する装置(ルータ2など)に限らず、時々故障が発生すると思われる装置であればよい。
以上のように、故障原因特定支援装置1は、監視対象装置(2)の状況と当該状況が生じた時刻とを示す状況情報を記憶する状況情報記憶部101と、監視対象装置が故障したことを認知する故障認知部102と、故障認知部102により故障が認知されたなら、故障が生じた時刻である故障発生時刻での監視対象装置の状況の特徴を取得する特徴取得部103と、特徴に類似する特徴を呈する状況を示す状況情報を状況情報記憶部101から検索する状況情報検索部104と、当該状況情報に示された時刻である類似状況発生時刻での状況をヒヤリングするための当該類似状況発生時刻を示すヒヤリングシートを出力するヒヤリングシート出力部111とを備えることで、ヒヤリングシート内の類似状況発生時刻での監視対象装置などの状況をユーザからヒヤリングすることができる。
また、故障原因特定支援装置1は、類似状況発生時刻の周期である類似状況発生周期を計算する周期計算部105を備え、ヒヤリングシート出力部111は、類似状況発生時刻に類似状況発生周期を対応づけたヒヤリングシートを出力するので、類似状況発生時刻だけでは得にくい情報を得ることができる。
また、故障原因特定支援装置1は、監視対象装置内または監視対象装置外で発生したイベント示すイベント内容とイベントの開始時刻とイベントの終了時刻とを含むイベント情報を記憶するイベント情報記憶部107と、監視対象装置を故障させる可能性のある原因または当該原因による故障への対処方法を示す原因対処情報と当該原因が発生する可能性のあるイベントのイベント内容とを含む支援情報を記憶する支援情報記憶部108と、類似状況発生時刻を含む時間帯の開始時刻と終了時刻とを含むイベント情報をイベント情報記憶部107から検索し(S5)、当該イベント情報内のイベント内容に一致するイベント内容を含む支援情報を支援情報記憶部108から検索する(S25)相関関係判定部110とを備え、ヒヤリングシート出力部111は、類似状況発生時刻に当該支援情報内の原因対処情報を対応づけたヒヤリングシートを出力するので、原因と対処方法のアドバイスを行うことができる。
また、故障原因特定支援装置1は、監視対象装置を故障させる可能性のある原因または当該原因による故障への対処方法を示す原因対処情報と当該原因が発生する可能性のある発生時間帯を示す発生時間帯情報と当該原因が発生する周期である原因発生周期とを含む支援情報を記憶する支援情報記憶部108と、類似状況発生時刻の周期である類似状況発生周期を計算し、当該類似状況発生時刻に当該類似状況発生周期を対応づける周期計算部105と、類似状況発生時刻を含む時間帯を示す発生時間帯情報と当該類似状況発生時刻に対応づけられた類似状況発生周期に一致する原因発生周期とを含む支援情報を支援情報記憶部108から検索する(S25)相関関係判定部110とを備え、ヒヤリングシート出力部111は、類似状況発生時刻に当該支援情報内の原因対処情報を対応づけたヒヤリングシートを出力するので、原因と対処方法のアドバイスを行うことができる。
なお、故障原因特定支援装置1としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
1 故障原因特定支援装置
2 ルータ(監視対象装置)
3 センサ
21 伝送部
101 状況情報記憶部
102 故障認知部
103 特徴取得部
104 状況情報検索部
105 周期計算部
106 イベント解析部
107 イベント情報記憶部
108 支援情報記憶部
109 支援情報登録部
110 相関関係判定部
111 ヒヤリングシート出力部
L 類似状況発生時刻リスト

Claims (7)

  1. 監視対象装置の状況と当該状況が生じた時刻とを示す状況情報を記憶する状況情報記憶部と、
    前記監視対象装置が故障したことを認知する故障認知部と、
    前記故障認知部により故障が認知されたなら、当該故障が生じた時刻である故障発生時刻での前記監視対象装置の状況の特徴を取得する特徴取得部と、
    前記特徴に類似する特徴を呈する状況を示す状況情報を前記状況情報記憶部から検索する状況情報検索部と、
    当該状況情報に示された時刻である類似状況発生時刻での状況をヒヤリングするための当該類似状況発生時刻を示すヒヤリングシートを出力するヒヤリングシート出力部と
    を備えることを特徴とする故障原因特定支援装置。
  2. 前記類似状況発生時刻の周期である類似状況発生周期を計算する周期計算部を備え、
    前記ヒヤリングシート出力部は、当該類似状況発生時刻に当該類似状況発生周期を対応づけたヒヤリングシートを出力する
    ことを特徴とする請求項1記載の故障原因特定支援装置。
  3. 前記監視対象装置内または前記監視対象装置外で発生したイベントのイベント内容と当該イベントの開始時刻と当該イベントの終了時刻とを含むイベント情報を記憶するイベント情報記憶部と、
    前記監視対象装置を故障させる可能性のある原因または当該原因による故障への対処方法を示す原因対処情報と当該原因が発生する可能性のあるイベントのイベント内容とを含む支援情報を記憶する支援情報記憶部と、
    前記類似状況発生時刻を含む時間帯の開始時刻と終了時刻とを含むイベント情報を前記イベント情報記憶部から検索し、当該イベント情報内のイベント内容に一致するイベント内容を含む支援情報を前記支援情報記憶部から検索する相関関係判定部とを備え、
    前記ヒヤリングシート出力部は、前記類似状況発生時刻に当該支援情報内の原因対処情報を対応づけたヒヤリングシートを出力する
    ことを特徴とする請求項1記載の故障原因特定支援装置。
  4. 前記監視対象装置を故障させる可能性のある原因または当該原因による故障への対処方法を示す原因対処情報と当該原因が発生する可能性のある発生時間帯を示す発生時間帯情報と当該原因が発生する周期である原因発生周期とを含む支援情報を記憶する支援情報記憶部と、
    前記類似状況発生時刻の周期である類似状況発生周期を計算し、当該類似状況発生時刻に当該類似状況発生周期を対応づける周期計算部と、
    前記類似状況発生時刻を含む時間帯を示す発生時間帯情報と当該類似状況発生時刻に対応づけられた類似状況発生周期に一致する原因発生周期とを含む支援情報を前記支援情報記憶部から検索する相関関係判定部とを備え、
    前記ヒヤリングシート出力部は、前記類似状況発生時刻に当該支援情報内の原因対処情報を対応づけたヒヤリングシートを出力する
    ことを特徴とする請求項1記載の故障原因特定支援装置。
  5. 前記ヒヤリングシートを用いたヒヤリングにより判明した前記監視対象装置を故障させる可能性のある原因または当該原因による故障への対処方法を示す原因対処情報を含む支援情報を前記支援情報記憶部に記憶させる支援情報登録部
    を備えることを特徴とする請求項3または4記載の故障原因特定支援装置。
  6. 故障原因特定支援装置の動作方法であって、
    前記故障原因特定支援装置は、監視対象装置の状況と当該状況が生じた時刻とを示す状況情報を記憶する状況情報記憶部を備え、
    前記動作方法は、
    前記故障原因特定支援装置の故障認知部が、前記監視対象装置が故障したことを認知し、
    前記故障原因特定支援装置の特徴取得部が、前記故障認知部により故障が認知されたなら、当該故障が生じた時刻である故障発生時刻での前記監視対象装置の状況の特徴を取得し、
    前記故障原因特定支援装置の状況情報検索部が、前記特徴に類似する特徴を呈する状況を示す状況情報を前記状況情報記憶部から検索し、
    前記故障原因特定支援装置のヒヤリングシート出力部が、当該状況情報に示された時刻である類似状況発生時刻での状況をヒヤリングするための当該類似状況発生時刻を示すヒヤリングシートを出力する
    ことを特徴とする故障原因特定支援装置の動作方法。
  7. 請求項1ないし5のいずれかに記載の故障原因特定支援装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2012164628A 2012-07-25 2012-07-25 故障原因特定支援装置、方法およびプログラム Expired - Fee Related JP5756064B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012164628A JP5756064B2 (ja) 2012-07-25 2012-07-25 故障原因特定支援装置、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012164628A JP5756064B2 (ja) 2012-07-25 2012-07-25 故障原因特定支援装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2014027395A true JP2014027395A (ja) 2014-02-06
JP5756064B2 JP5756064B2 (ja) 2015-07-29

Family

ID=50200693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012164628A Expired - Fee Related JP5756064B2 (ja) 2012-07-25 2012-07-25 故障原因特定支援装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5756064B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103047A (ja) * 1991-12-12 1994-04-15 Fujitsu Ltd プログラム作成支援装置及びプログラム実行支援装置
JPH08314751A (ja) * 1995-05-18 1996-11-29 Hitachi Ltd 障害対策支援方法
JP2006301910A (ja) * 2005-04-20 2006-11-02 Yaskawa Information Systems Co Ltd 故障動作履歴表示方式
WO2008149975A1 (ja) * 2007-06-06 2008-12-11 Nec Corporation 通信網の障害原因分析システムと障害原因分析方法、及び障害原因分析用プログラム
JP2009010438A (ja) * 2007-06-26 2009-01-15 Mitsubishi Electric Corp ネットワーク管理装置及びネットワーク管理方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103047A (ja) * 1991-12-12 1994-04-15 Fujitsu Ltd プログラム作成支援装置及びプログラム実行支援装置
JPH08314751A (ja) * 1995-05-18 1996-11-29 Hitachi Ltd 障害対策支援方法
JP2006301910A (ja) * 2005-04-20 2006-11-02 Yaskawa Information Systems Co Ltd 故障動作履歴表示方式
WO2008149975A1 (ja) * 2007-06-06 2008-12-11 Nec Corporation 通信網の障害原因分析システムと障害原因分析方法、及び障害原因分析用プログラム
JP2009010438A (ja) * 2007-06-26 2009-01-15 Mitsubishi Electric Corp ネットワーク管理装置及びネットワーク管理方法及びプログラム

Also Published As

Publication number Publication date
JP5756064B2 (ja) 2015-07-29

Similar Documents

Publication Publication Date Title
US10679135B2 (en) Periodicity analysis on heterogeneous logs
AU2019275633B2 (en) System and method of automated fault correction in a network environment
US8275735B2 (en) Diagnostic system
JP6745840B2 (ja) 故障診断装置、故障診断方法、及び故障診断プログラム
CN110121682B (zh) 发现时间系列中的预兆子序列的方法和系统
JP5098821B2 (ja) 監視対象システムの障害等の予兆を検出する監視装置及び監視方法
JP5277667B2 (ja) 障害分析システム、障害分析方法、障害分析サーバおよび障害分析プログラム
KR20190021560A (ko) 빅데이터를 활용한 고장예지보전시스템 및 고장예지보전방법
JP7031743B2 (ja) 異常検知装置
JP6280862B2 (ja) イベント分析システムおよび方法
US20150378806A1 (en) System analysis device and system analysis method
CN110244686A (zh) 智能设备的故障处理方法和装置
JP5756064B2 (ja) 故障原因特定支援装置、方法およびプログラム
WO2015182072A1 (ja) 因果構造推定システム、因果構造推定方法およびプログラム記録媒体
JPWO2018198315A1 (ja) コンピュータシステム、設備異常音判定方法及びプログラム
JP5380386B2 (ja) 機器情報管理システム及び方法
JP2021149821A (ja) 分析装置、分析対象システム、および分析プログラム
JP2015230584A (ja) 警報対応支援装置および警報対応支援方法
KR100937003B1 (ko) 장치 유지 보수 시스템 및 방법
JP7359009B2 (ja) データ分析装置、プログラム及び方法
JPWO2018101070A1 (ja) 異常判定装置、異常判定方法、及び異常判定プログラム
CN114626400A (zh) 设备故障诊断装置、设备故障诊断方法、智能工厂系统和应用代理
JP5255588B2 (ja) プラント監視・制御装置および表示画面履歴データベース管理方法
CN115706695A (zh) 网络故障根因的确定方法、装置、设备及存储介质
JP2005265644A (ja) 腐食管理システムおよび腐食管理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150526

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150528

R150 Certificate of patent or registration of utility model

Ref document number: 5756064

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees