JP6622040B2 - 分析システム、及び、分析方法 - Google Patents

分析システム、及び、分析方法 Download PDF

Info

Publication number
JP6622040B2
JP6622040B2 JP2015185432A JP2015185432A JP6622040B2 JP 6622040 B2 JP6622040 B2 JP 6622040B2 JP 2015185432 A JP2015185432 A JP 2015185432A JP 2015185432 A JP2015185432 A JP 2015185432A JP 6622040 B2 JP6622040 B2 JP 6622040B2
Authority
JP
Japan
Prior art keywords
alarm
failure
information
occurrence
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015185432A
Other languages
English (en)
Other versions
JP2017059152A (ja
Inventor
正裕 本林
正裕 本林
健太郎 堀
健太郎 堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2015185432A priority Critical patent/JP6622040B2/ja
Publication of JP2017059152A publication Critical patent/JP2017059152A/ja
Application granted granted Critical
Publication of JP6622040B2 publication Critical patent/JP6622040B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Description

本発明は、分析システム、及び、分析方法に関する。
機器の保全には、「事後保全」及び「予防保全」がある。事後保全とは、機器が故障した後に修理及び交換を実施する保守方法のことである。点検等の手間が不要であり、保全費用を小さくできるという利点がある一方で、障害が必ず発生する、設備停止が長期化するという欠点がある。
予防保全とは、機器が故障する前に計画的に実施する保守方法のことである。理論的には障害の発生を0件にできるという利点がある一方で、点検、及び、まだ壊れていない部品を交換するため、保全費用が大きくなるという欠点がある。
近年、QoE(Quality of Experience;ユーザが体験するサービス品質)低下防止及びサービス安定提供のために予防保全を採用する企業が増加している。予防保全を効率的に実現するために、故障の予兆をいかに的確に見出せるかが大きな問題となっている。
この問題に対し、従来において、最初及び新規の故障事例に対して容易に予兆検知するための異常診断モデルを作成、追加及び更新することができ、そのモデルを用いることで異常の診断及び対策指示等を、的確に、効率的に実現できる異常診断システムが提案されている(例えば、特許文献1参照)。
このシステムでは、保守作業データの取得に基づき、保守作業の種類とそれに関連するアラーム及び稼動イベントとの因果関係をグラフネットワーク構造によって表現する因果関係モデルを作成する機能を持つ。また、新規作成された因果関係モデルと既存の因果関係モデルとを合成することで、異常診断モデルを更新する機能を持つ。
特開2010−122847号公報
通信機器のような複数の機器と接続され、接続する複数機器と相互の影響を受け運用される機器の場合、例えば、一つの機器が故障した場合、複数の機器に影響を及ぼす。この場合発生された警報は機器自らが起因する警報なのか、他の機器の影響を受けて発生された警報なのかを判定する必要がある。また機器自ら検知しない、又は、できない異常を他の機器が検知することもある。
従来のように一つの装置から発した複数のアラームだけを用いて異常診断モデルを作成する方法では、他の機器の影響を考慮出来ないため、通信機器に適用することは困難であった。
具体的には、接続する複数の機器の影響を受け運用される通信機器の場合、例えば、1つの機器が故障した場合、複数の機器に影響を及ぼす。従来のようにある装置のアラームだけを用いて異常診断モデルを作成する方法では、他の機器の影響を考慮出来ず、通信機器に適用することは困難であった。
本発明の目的は、機器等の保全を行う技術に関し、通信機器のような複数の機器が接続する環境において、機器が発する情報に基づき故障の予兆を検知し部品交換等の保守を行うための、予防保全技術及びそのシステムの提供である。
上記課題を解決するために、本発明は、分析システムであって、プロセッサ及び記憶装置を有し、前記記憶装置は、複数の機器の接続関係を示す接続情報と、警報と故障との組み合わせを示す統合情報とを保持し、前記プロセッサは、前記複数の機器において発生した警報の発生時刻と種類とを示す警報情報を取得し、故障が発生した機器において発生した第1の警報の第1の発生時刻を前記警報情報から取得し、前記故障が発生した機器と直接又は間接に接続する機器を示す接続機器情報を、前記接続情報に基づいて特定し、前記接続機器情報が示す機器において発生した警報の第2の発生時刻を前記警報情報から取得し、前記第1の発生時刻及び前記第2の発生時刻に基づいて、前記接続機器情報が示す機器において発生した警報のうち、前記第1の警報と関連がある第2の警報を、前記警報情報から特定し、前記第1の警報、前記第2の警報及び前記故障の組み合わせを前記統合情報に格納し、前記統合情報及び前記警報情報に基づいて、前記第1の警報と同じ種類の警報及び前記第2の警報と同じ種類の警報が関連して発生する場合の前記故障の発生確率を、前記故障の種類毎に算出する。
本発明によれば、他の機器からの影響を考慮した故障予兆の検知が可能となる。
実施例1の故障予兆検知システムのブロック図である。 実施例1の発生警報履歴DBを示す説明図である。 実施例1の故障情報DBを示す説明図である。 実施例1の機器接続情報DBを示す説明図である。 実施例1の故障予兆検知システムの処理の概要を示すフローチャートである。 実施例1の警報発砲状況を示す説明図である。 実施例1の故障した機器から発した警報と、他の機器から発した警報との関係を特定する処理を示すフローチャートである。 実施例1の故障した機器に接続する機器から発した警報と、他の機器から発した警報との関係を特定する処理を示すフローチャートである。 実施例1の統合DBを示す説明図である。 実施例1の警報故障確率DBを示す説明図である。 実施例1の故障確率算出部の処理を示す説明図である。 実施例2の警報発砲状況を示す説明図である。 実施例2の故障した機器から発した警報と、他の機器から発した警報との関係を特定する処理を示すフローチャートである。 実施例2の故障した機器に接続する機器から発した警報と、他の機器から発した警報との関係を特定する処理を示すフローチャートである。 実施例2の統合DBを示す説明図である。 実施例3の故障予兆検知システムのブロック図である。 実施例3の警報因果関係DBを示す説明図である。 実施例3の警報発砲状況を示す説明図である。 実施例3の故障した機器から発した警報と、他の機器から発した警報との関係を特定する処理を示すフローチャートである。 実施例3の故障した機器に接続する機器から発した警報と、他の機器から発した警報との関係を特定する処理を示すフローチャートである。
以下、本発明の実施の形態について、図面を参照しながら説明する。
図1は、実施例1の故障予兆検知システムのブロック図である。
実施例1の故障予兆検知システムは、計算機101、機器113、機器監視システム111、発生警報履歴DB107、故障情報DB108、及び、機器接続情報DB109を含む。
機器監視システム111は、機器113を監視するシステムである。計算機101は、機器監視システム111による監視結果を分析する装置である。
計算機101は、ネットワーク105を介して計算機102と接続される。計算機101、及び、計算機102は、一般的なコンピュータを想定し、プロセッサ、メモリ及びインターフェースを備える。
計算機101及び計算機102におけるプロセッサは、メモリに記憶されたプログラムを処理することによって、各種処理を実行する。メモリは、処理を実行するためのプログラム及びデータを記憶する。インターフェースは、キーボード、マウスなどの入力装置に接続するインターフェース、ディスプレイ等の表示装置に接続するインターフェース、及び、ネットワーク105を介して、計算機101及び102と接続するインターフェース、などを含む。
また、計算機101は、ネットワーク106を介して発生警報履歴DB107、故障情報DB108、及び、機器接続情報DB109と接続される。発生警報履歴DB107、故障情報DB108、及び、機器接続情報DB109はネットワーク110を介して機器監視システム111と接続される。
発生警報履歴DB107とは、機器113が過去に発した警報を示す情報(発生警報履歴)を保持するDBである。
図2は、実施例1の発生警報履歴DB107を示す説明図である。
発生警報履歴DB107は、発生警報履歴として、警報ID1071、警報発生日時1072、警報発生機器名1073、警報情報1074、及び、詳細情報1075を含む。
警報ID1071は、機器113において発生する警報を一位に識別する識別子である。警報ID1071が示す識別子は、機器113、警報発生日時1072及び警報情報1074の一つの組み合わせに一つの識別子が定められる。
警報発生日時1072は、警報ID1071が示す警報が発生した日時を示す。警報発生機器名1073は、警報ID1071が示す警報が発生した機器113を示す。
警報情報1074は、警報ID1071が示す警報の種類を示す。以下において記載される警報の種類は、警報情報1074が示す警報情報と同義である。
詳細情報1075は、警報ID1071が示す警報の詳細を示し、例えば、通知されるメッセージを示す。
故障情報DB108とは、機器113が故障した際の状況等を示す情報(故障情報)を保持するDBである。
発生警報履歴DB107は、機器監視システム111から送信された情報を蓄積してもよい。
図3は、実施例1の故障情報DB108を示す説明図である。
故障情報DB108は、故障情報として、故障ID1081、故障発生日時1082、故障発生機器1083、故障部品1084、現象1085、及び、原因1086を含む。
故障ID1081は、故障内容の組み合わせを一位に識別する識別子を示す。本実施例において、故障内容とは、故障発生機器1083、故障部品1084、現象1085、及び、原因1086が示す内容である。
故障発生日時1082は、故障ID1081が示す故障が発生した日時を示す。故障発生機器1083は、故障ID1081が示す故障が発生した機器113を示す。
故障部品1084は、故障ID1081が示す故障が発生した部品を示す。現象1085は、故障ID1081が示す故障の内容を示す。原因1086は、故障ID1081が示す故障の原因を示す。
故障情報DB108は、機器監視システム111の利用者によって情報を追加及び更新されてもよい。
機器接続情報DB109とは、接続される機器113間を示すトポロジ情報(機器接続情報)を保持するDBである。
図4は、実施例1の機器接続情報DB109を示す説明図である。
図4(a)は、実施例1の機器接続情報DB109の一つの例を示す説明図である。
図4(b)は、実施例1の機器接続情報DB109の他の例を示す説明図である。
機器接続情報DB109は、機器名1(1091)及び機器名2(1092)を含む。機器接続情報DB109は、接続関係にある二つの機器を、機器名1(1091)及び機器名2(1092)に示す。
データ統合処理部115は、機器接続情報DB109に基づいて、一つの機器113と、当該機器113と直接又は間接的に接続する機器113を取得することができる。
図4(a)に示す機器接続情報DB109は、直列に接続された機器113の接続を示す。図4(b)に示す機器接続情報DB109は、ツリー型に接続された機器113の接続を示す。
機器監視システム111は、例えば一般的なコンピュータに実装され、プロセッサ、メモリ及びインターフェースを備える。機器監視システム111におけるプロセッサは、メモリに記憶されたプログラムを処理することによって、各種処理を実行する。メモリは、処理を実行するためのプログラム及びデータを記憶する。
機器監視システム111のインターフェースは、キーボード、マウスなどの入力装置に接続するインターフェース、ディスプレイ等の表示装置に接続するインターフェースを含む。また、機器監視システム111のインターフェースは、ネットワーク110を介して発生警報履歴DB107、故障情報DB108、及び、機器接続情報DB109と接続するネットワークインターフェース、ネットワーク112を介して複数の機器113と接続するネットワークインターフェース等を含む。
機器113は、機器監視システム111による監視対象であり、例えば、携帯電話の基地局等の通信機器である。機器113間は、リング型、スター型等、様々な形態(トポロジー)によって接続される。各機器113の接続情報は機器接続情報DB109が保持する。
計算機101は、データ統合処理部115、警報故障確率算出部116、及び、故障確率算出部117等の機能部、並びに、統合DB120、及び、警報故障確率DB121等の情報を含む。データ統合処理部115、警報故障確率算出部116、及び、故障確率算出部117は、プログラムとして計算機101のメモリに格納され、計算機101のプロセッサに実行されてもよいし、計算機101の物理的な集積回路によって実装されてもよい。
統合DB120、及び、警報故障確率DB121は、計算機101の補助記憶装置に格納され、必要に応じて計算機101のメモリに読み出されてもよい。統合DB120は、関連のある警報を示す警報リストを格納する。警報故障確率DB121は、警報と故障との関係を示す確率を示す情報を格納する。
データ統合処理部115は、発生警報履歴DB107、故障情報DB108、及び、機器接続情報DB109から取得するデータに基づき、故障した機器113の警報と接続関係にある機器113の警報とから、関連のある警報リストを生成し、統合DB120に登録する機能を持つ。
警報故障確率算出部116は、統合DB120から警報と故障との組を取得し、警報と故障との関係を示す確率を算出し、警報故障確率DB121に登録する機能を持つ。
故障確率算出部117は、警報故障確率DB121に登録されている警報故障確率に基づき、現在の警報発生状況から故障に至る確率を算出する機能を持つ。
図5は、実施例1の故障予兆検知システムの処理の概要を示すフローチャートである。
以下において、故障した機器113を機器Rと記載し、機器Rと接続する機器113を、機器R、…、Rと記載する。また、機器Rにおいて発生した故障内容を故障内容Fと記載する。
まず、データ統合処理部115は、故障した機器Rにおいて発生した警報と、機器R、…、Rにおいて発生した警報とから、関連する複数の警報の組み合わせを示す故障警報リストLAAを生成する。そして、{F,LAA}の組を統合DB120に登録する(S201)。
次に、警報故障確率算出部116は、統合DB120から複数の警報と故障内容との組{F,LAA}を取得し、複数の警報と故障内容との関係を示す確率を算出し、警報故障確率DB121に登録する(S202)。
最後に、故障確率算出部117は、警報故障確率DB121に登録される警報故障確率に基づき、現在または指定期間(後述するf日間)の警報発生状況から故障に至る確率を算出する(S203)。
図6は、実施例1の警報発砲状況を示す説明図である。
また、図6は、データ統合処理部115による処理のイメージを示す。データ統合処理部115は、発生警報履歴DB107、故障情報DB108、機器接続情報DB109から取得する情報(発生警報履歴501、故障情報502、機器接続情報503)に図7及び図8の処理を実行することによって、警報リストLAA504を生成する。
図7及び図8は、ステップS201の手順の詳細の一例を示すフローチャートである。
図7は、実施例1の故障した機器113から発した警報と、他の機器113から発した警報との関係を特定する処理を示すフローチャートである。
なお、以下において、機器Rが故障(故障内容F)した日時(故障発生日時1082)をDと記載する。また、実施例1において、基準の警報と関連する複数の警報は、基準の警報が発生する日時の前後の時間d(2d)の間に発生する警報である。
また、データ統合処理部115は、故障情報DB108のエントリを一つ抽出し、抽出したエントリに対して、図7の処理を開始する。そして、故障情報DB108に格納されるエントリについて、図7の処理を実行する。
データ統合処理部115は、まず、空の警報リストLAAを生成する(S300)。Dからf日前までに機器Rにおいて警報Aに関する警報リストL={A,A,…,A,…,A}を、発生警報履歴DB107から取得する。
ここで、データ統合処理部115は、警報Aとして、発生警報履歴DB107から警報発生日時1072及び警報情報1074を取得する。
すなわち、A={警報発生日時Dn0,警報情報I}、1≦n≦Nであり、nは、機器Rにおける警報の通し番号であり、Nは、機器RにおいてDの前f日間に発生した警報の総数である。
図6に示す例において、データ統合処理部115は、警報A〜Aに関する発生警報履歴を、警報リストLとして取得する。また、警報A〜Aの各々の警報発砲日時は、D10〜D40である。また、fは、任意の日数及び時間であり、計算機101を用いて故障内容を分析する運用者が指定してもよい(S301)。
ステップS301の後、データ統合処理部115は、機器接続情報DB109から機器Rと接続関係にある機器113のリストLR0={R,R,…,R,…,R}を取得する(S302)。ここで、1≦m≦Mである。そして、mは、故障が起きた機器Rに接続する機器113の通し番号であり、Mは、機器Rと接続する機器113の総数である。
なお、機器Rと接続関係にある機器113には、直接機器Rと接続される機器113だけであってもよく、また、間接的に機器Rと接続される機器113が含まれてもよい。リストLR0に間接的に接続される機器113を含めることによって、データ統合処理部115は、故障が発生した機器Rと間接的に接続する機器113における警報から、機器Rにおける警報と関連する警報を特定できる。
ただし、データ統合処理部115は、間接的に機器Rと接続される機器113をリストLR0に含める場合、間接的に接続される機器113として、後述するX層(予め与えられる)までの機器113を取得してもよい。これによって、データ統合処理部115は、管理者又は運用者が指定した接続範囲までの機器113における警報を、関連する警報として特定できる。
そして、データ統合処理部115は、これによって、直接接続する機器113のスペックが十分にあるために直接接続する機器113において警報が発生しない場合にも、機器Rと接続関係にある機器113における警報発生状況を取得することができる。
図6に示す例において、データ統合処理部115は、機器Rと機器Rとが直接接続し、機器Rと機器Rとが直接接続することを示す機器接続情報DB109から、リストLR0を取得する。
ステップS302の後、データ統合処理部115は、ステップS304〜S312をN回繰り返す(S303)。より具体的には、データ統合処理部115は、ステップ302の後、初期値としてnに1を格納する。そして、ステップS303においてnがN以下であるかを判定し、nがN以下である場合、ステップS304を実行する。nがNより大きい場合、データ統合処理部115は、機器Rにおいて発生したすべての警報について、関連する警報を特定し終わったため、ステップS313を実行する。
ステップ304において、データ統合処理部115は、警報リストLから警報Aを取得する(S304)。これによって、データ統合処理部115は、基準となる警報Aを取得する。
ステップS304の後、データ統合処理部115は、ステップS306〜S311をM回繰り返す(S305)。具体的には、ステップ304の後、初期値として1を含む引数mを生成する。そして、引数mがM以下であるか、及び、機器RについてのステップS306の処理を実行済かを判定する。
引数mがM以下である場合、かつ、機器RについてのステップS306の処理が実行されていない場合、データ統合処理部115は、ステップ306を実行する。引数mがMより大きい場合、及び、機器RにステップS306の処理を実行済である場合のいずれか一方の場合、機器Rと直接接続する機器113において発生した警報から、機器Rにおいて発生した警報Aと関連する警報を特定し終えたため、データ統合処理部115は、ステップS312を実行する。
ステップS312において、データ統合処理部115は、nに1を加算し、その後ステップS303に戻る。
ステップS306において、データ統合処理部115は、警報Aから警報発生日時Dn0及び警報情報Iを取得する。そして、Dn0−d≦Dn0≦Dn0+dの期間において機器Rにおいて発生した警報An0と、機器Rにおいて発生した警報AAmのリストLAm={A1m,A2m,…,Akm,…,AKm}と、を発生警報履歴DB107から取得する。
ここで、1≦k≦Kであり、kは、機器Rと直接接続する機器Rにおいて発生した警報であり、Dn0−d≦Dn0≦Dn0+dの期間において発生した警報の通し番号である。KはDn0−d≦Dn0≦Dn0+dの期間においてRにおいて発生した警報AAmの総数である。なお、ここで取得されるリストLAmは、警報An0と関連する警報のリストである。
図6に示す例においてnが3であり、引数mが1である場合、データ統合処理部115はステップ306において、警報An0=Aと、リストLA1={A21,A31}とを取得する。また、nが2であり、引数mが2である場合、データ統合処理部115はステップ306において、警報An0=Aと、リストLA2={A12}とを取得する。また、図6に示す例において、Mは2である。
ステップS306の後、データ統合処理部115は、ステップS308、S309、及び、S401〜S411をK回繰り返す(S307)。具体的には、ステップS306の後、初期値である1を格納した引数kを生成し、引数kがK以下であるかを判定する。そして、データ統合処理部115は、引数kがK以下である場合、ステップS308を実行する。
また、引数kがKより大きい場合、機器Rにおいて発生した警報であり、かつ、警報An0と関連する警報のすべてにステップS308を実行したため、ステップS309を実行する。
ここで、リストLAm={A1m,A2m,…,Akm,…,AKm}の各警報AAmの警報発生日時を警報発生日時Dと記載する。
ステップS308において、データ統合処理部115は、Dn0<Dの場合警報リストLAAに{R,A,R,Akm}を追加する。Dn0>Dの場合警報リストLAAに{R,Akm,R,A}を追加する(S308)。これによって、発生順を示す警報リストLAAを生成できる。ステップS308の後、データ統合処理部115は、引数kに1を加算し、ステップS307に戻る。
図6に示す例においてnが3であり、引数mが1である場合、データ統合処理部115は、ステップS308を繰り返すことにより、{R,A21,R,A}、及び、{R,A21,R,A}をリストLAAに追加する。ステップS308によって、データ統合処理部115は、警報Aと関連して発生する警報Aを、機器Rと直接接続する機器113において発生した警報から抽出できる。
引数kがKを超えた場合、データ統合処理部115は、ステップS401〜S411を予め与えられたX層まで実行する(S309)。予め与えられた層の数Xは、機器Rに接続する機器113の階層の数であり、故障した機器Rにおいて発生した警報に関連する警報を抽出する機器113の範囲を示す。特に、X層は、機器Rと直接接続されていない機器113のうち、関連する警報を抽出する機器113の範囲を示す。
例えば、データ統合処理部115は、X=1の場合、機器Rと直接接続される機器R及び機器Rにおける関連する警報を抽出する。また、X=2の場合、機器Rと機器Rのみを介して間接的に接続される機器113(図6において機器R)において発生した関連する警報を抽出する。X=1の場合については、図7に示す処理において実行済であるため、データ統合処理部115は、ステップS401〜S411における処理においてX=2以上の処理を実行する。
なお、図7に示す処理の後、データ統合処理部115は、ステップS311を実行する。ステップS311において、データ統合処理部115は、引数mに1を加算し、その後ステップS305に戻る。
図8は、実施例1の故障した機器113に接続する機器113から発した警報と、他の機器113から発した警報との関係を特定する処理を示すフローチャートである。
ステップS401において、データ統合処理部115は、Dn0の前後d時間の間(Dn0−d≦Dn0≦Dn0+d)に機器Rにおいて発生した警報リストLAm={A1m,A2m,…,Apm,…,APm}を発生警報履歴DB107から取得する。ここで、警報Apm={警報発生日時Dpm,警報情報Ipm}と記載し、1≦p≦Pである(S401)。pは、機器Rと関連する警報の通し番号であり、Pは、Dn0の前後d時間の間に機器において発生した警報の総数である。
データ統合処理部115は、機器接続情報DB109から機器Rと接続関係にある機器リストLRm={R1m,R2m,…,Rqm,…,RQm}を取得する。1≦q≦Qであり、qは、機器Rと接続関係にある機器113の通し番号である。Qは、機器Rと接続関係にある機器113の総数である(S402)。
なお、データ統合処理部115は、機器リストLRmに、機器Rを含めない。また、機器Rと接続関係にある機器113には、直接機器Rと接続される機器113だけが含まれてもよく、また、間接的に機器Rと接続される機器113(例えば、X層まで)が含まれてもよい。機器リストLRmに間接的に接続される機器113を含めることによって、機器Rにおける警報と関連する警報に、さらに関連する警報を、機器Rと間接的に接続する機器113における警報から特定できる。そして、例えば、接続順に従って異常が発生する状況を取得することができる。
データ統合処理部115は、ステップS404〜S411をP回繰り返す(S403)。具体的には、ステップS402の後、データ統合処理部115は、初期値を1とした引数pを生成する。そして、ステップS403において、引数pがP以下かを判定する。そして、引数pがP以下である場合、ステップS404を実行する。
また、引数pがPを超えており、警報リストLAmのすべての警報Apmと関連のある警報を、機器Rqmの警報から抽出した場合、データ統合処理部115は、図8に示す処理を終了し、図7に示すステップS311を実行する。
ステップS404において、データ統合処理部115は、警報リストLAmから警報Apmを取得する(S404)。そして、ステップS406〜S410をQ回繰り返す(S405)。
具体的には、ステップS404の後、データ統合処理部115は、初期値を1とする引数qを生成する。そして、ステップS405において、引数qがQ以下であるか、機器RqmがステップS406の処理を実行済であるかを判定する。
引数qがQ以下であり、かつ、機器RqmにステップS406の処理をまだ実行していない場合、データ統合処理部115は、ステップS406を実行する。一方、引数qがQを超える場合、及び、機器RqmにステップS406の処理を実行した場合のいずれか一方の場合、データ統合処理部115は、引数pに1を加算し(S411)、ステップ403に戻る。
ステップS406において、データ統合処理部115は、警報Apmから警報発生日時Dpmを取得する。そして、Dpm−d≦Dpm≦Dpm+dの期間に機器Rqmにおいて発生した警報のリストLAqm={A1q,A2q,…,Ahq,…,AHq}を発生警報履歴DB107から取得する。Ahq={警報発生日時Dhq,警報情報Ihq}であり、1≦h≦Hである(S406)。
hは、機器Rqmにおいて発生した警報のうち、警報Apmに関連する警報の通し番号である。Hは、Dpm−d≦Dpm≦Dpm+dの期間に機器Rqmにおいて発生した警報の総数である。
ステップS406の後、データ統合処理部115は、ステップS408、S409をH回繰り返す(S407)。具体的には、ステップS406の後、データ統合処理部115は、初期値を1とする引数hを生成し、ステップS407において、引数hがH以下であるかを判定する。
引数hがH以下である場合、データ統合処理部115は、ステップS408を実行する。引数hがHを超える場合、データ統合処理部115は、引数qに1を加算し(S410)、ステップS405に戻る。
なお、引数hがHを超え、かつ、機器Rqmに機器R以外で接続する機器113がある場合、データ統合処理部115は、予め与えられたX層まで、図8の処理を実行したかを判定する。そして、実行していない場合、図8におけるDn0をDpmに置き換え、機器Rを機器Rqmに置き換え、機器Rqmを機器Rqmに接続する機器に置き換えることによって、図8に示す処理を実行する。そしてX層までの処理が終了した後、ステップS410を実行する。
データ統合処理部115は、ステップS408において、Dpm<Dhqの場合、警報リストLAAに{R,Apm,Rqm,Ahq}を追加する。そして、Dpm>Dhqの場合、警報リストLAAに{Rqm,Ahq,R,Apm}を追加する(S408)。なお、Dpm=Dhqの場合、いずれの形式で警報リストLAAに格納してもよい。
ステップS408の後、データ統合処理部115は、引数hに1を加算し(S409)、ステップS407に戻る。
ステップS303において、引数nがNを越え、機器Rにおいて発生したすべての警報について、関連する警報を抽出した場合、データ統合処理部115は、{F,LAA}の組を統合DB120に登録する(S313)。
図9は、実施例1の統合DB120を示す説明図である。
統合DB120とは、故障内容と警報との関係を保持するDBである。統合DB120は、故障ID125、及び、警報リストLAA126を含む。故障ID125は、故障内容を識別するための識別子を示す。故障ID125は、故障情報DB108の故障ID1081に対応し、故障内容を一意に示す。
警報リストLAA126は、図7及び図8に示す処理によって生成された警報リストLAAを含む。警報リストLAA126は、先に発生した警報及び当該警報が発生した機器113の組み合わせ{機器1、警報1}と、後に発生した警報及び当該警報が発生した機器113の組み合わせ{機器2、警報2}とを示す。
データ統合処理部115が、図7及び図8に示す処理によって統合DB120に値を格納した後、警報故障確率算出部116は、ステップS202を実行する。ステップS202において、警報故障確率算出部116は、統合DB120に基づいて警報リストLAAが示す組み合わせによって警報が発生する確率を算出する。そして、算出した確率を、警報故障確率DB121に格納する。
図10は、実施例1の警報故障確率DB121を示す説明図である。
警報故障確率DB121とは、機器113が発する警報の警報情報間の関係(時間的な発生順序)と確率とを示す情報を保持するDBである。警報故障確率DB121は、時間的に前に発生した{機器1、警報情報1}と時間的に後に発生した{機器2、警報情報2}を示す。
警報故障確率DB121は、番号131、故障ID137、機器1(132)、警報情報1(133)、機器2(134)、警報2(135)、及び、確率136を含む。番号131は、{機器1、警報情報1}と{機器2、警報情報2}との組み合わせ及び順番を一意に示す識別子である。番号131は、数字以外の文字列によって表現されてもよい。
故障ID137は、故障内容を一意に識別する。故障ID137は、統合DB120の故障ID125に対応する。
機器1(132)は、先に警報が発生した機器113を示す。機器1(132)は、警報リストLAA126が示す1番目に警報が発生する機器113に相当する。
警報情報1(133)は、機器1(132)から発生した警報の種類(警報情報1074に相当)を示し、警報リストLAA126が示す1番目に発生する警報の種類に相当する。
機器2(134)は、後に警報が発生した機器113を示す。機器2(134)は、警報リストLAA126が示す2番目の機器113に相当する。
警報2(135)は、機器2(134)から発生した警報の種類(警報情報1074に相当)を示し、警報リストLAA126が示す2番目の警報に相当する。
確率138は、機器1(132)、警報情報1(133)、機器2(134)及び警報2(135)が示す組み合わせによって、警報が発生する確率を示す。
警報故障確率算出部116は、統合DB120の警報リストLAAが示す組み合わせに基づいて、故障に対して各組み合わせが発生する確率を算出できればいかなる方法を用いてもよいが、以下に具体的な例を示す。
警報故障確率算出部116は、例えば、警報リストLAAが示す組み合わせを、警報故障確率DB121からすべて抽出し、さらに、抽出した組み合わせの警報情報1074を発生警報履歴DB107から特定する。そして、{機器1、警報情報1}及び{機器2、警報情報2}が同じである組み合わせの数の総数と、{機器1、警報情報1}及び{機器2、警報情報2}が同じである組み合わせの故障IDごとの数とを算出する。そして、組み合わせの数の総数によって、故障IDごとの組み合わせの数を除算した結果を確率(確率136)として算出する。
これによって、警報故障確率算出部116は、故障内容毎に、{機器1、警報情報1}及び{機器2、警報情報2}が発生した割合を算出することができる。そして、この割合を、後述する処理において、{機器1、警報情報1}及び{機器2、警報情報2}が発生した場合に故障が発生する確率として用いることにより、故障の発生確率を予測することができる。
そして、警報故障確率算出部116は、算出した確率を確率138に格納し、{機器1、警報情報1}及び{機器2、警報情報2}を、機器1(132)、警報情報1(133)、機器2(134)及び警報情報2(135)に格納する。
図11は、実施例1の故障確率算出部117の処理を示す説明図である。
図11は、図5のステップS203に示す、警報発生状況から故障に至る確率を算出する手順を示す。
故障確率算出部117は、まず、発生する故障の確率を算出したい期間の警報状況を取得する(S1101)。図11に示す入力1101は、ステップS1101において取得される警報状況のイメージである。故障確率算出部117は、計算機101が有する入力インターフェースを介して警報状況を取得してもよいし、計算機102から入力された警報状況を取得してもよい。
入力1101は、機器Rにおける警報A23、機器Rにおける警報A12、機器Rにおける警報A11、及び、機器Rにおける警報Aの順で警報が発生することを示す。
ステップS1101の後、故障確率算出部117は、警報故障確率DB121から警報故障確率を故障ID毎に取得し、取得した警報故障確率と、入力された警報状況とに基づいて故障に至る確率を故障ID毎に算出する(S1102)。
故障確率算出部117が故障に至る確率を算出する方法はいかなる方法であってもよいが、以下に例を示す。
故障確率算出部117は、例えば、入力された警報状況が示す警報のうち、所定の期間dの間に発生し、異なる機器113において発生した二つの警報の警報情報を、発生順に{機器1、警報情報1}及び{機器2、警報情報2}として抽出する。そして、抽出した組み合わせを警報故障確率DB121(機器1(132)、警報情報1(133)、機器2(134)及び警報情報2(135))が示す場合、抽出した組み合わせの確率を警報故障確率DB121から特定する。
具体的には、故障確率算出部117は、図11に示す入力1101から、{機器1、警報情報1}及び{機器2、警報情報2}の組み合わせとして、{R,I23}及び{R,I12}の組み合わせ、{R,I12}及び{R,I11}の組み合わせ、並びに、{R,I11}及び{R,I2}の組み合わせを抽出する。そして、これらの組み合わせを示す機器1(132)、警報情報1(133)、機器2(134)及び警報情報2(135)のエントリの確率136を、故障ID137毎に特定する。
そして、故障確率算出部117は、特定した確率136を、故障ID137毎に乗算する。より具体的には、故障確率算出部117は、警報故障確率DB121を故障ID137毎に参照し、{R,I23}及び{R,I12}の組み合わせの確率136と、{R,I12}及び{R,I11}の組み合わせの確率136と、{R1,I11}及び{R,I2}の組み合わせの確率136とを乗算する。
そして、故障確率算出部117は、乗算した結果を故障ID137毎に、故障の発生確率として出力する。図11に示す故障確率算出結果1102は、ステップS1102によって出力された故障の発生確率を、故障ID毎に示す。
実施例1によれば、複数の機器における警報と故障の関係を確率的に表現することが可能となり、また、故障確率算出部117の処理によって、現在または指定期間での複数の警報の発生状況に応じて、故障の発生確率を算出し、故障予兆検知が可能となる。
また、故障が発生した機器Rにおける警報と関連する警報を、当該機器と直接又は間接的に接続する機器から取得することが可能であるため、複数の機器がいかなる接続状態である機器システムにおいても、故障と関連がある可能性のある警報をすべて取得することができる。そして、これに基づいて故障の発生確率を求めることができるため、精度よく発生確率を求めることができる。
実施例1では、異なる警報の出現頻度で警報と故障の確率を算出していた。この場合、複数の警報のパターン(同じ種類の警報が連続して、又は、周期的に発生する等)を考慮することができない。実施例2では、警報のパターンを用いた警報と故障の確率を算出する。
実施例2の故障予兆検知システムの構成は、図1に示す実施例1の故障予兆検知システムと同じである。ただし、実施例2のデータ統合処理部115は、実施例1のデータ統合処理部115と異なる処理を実行する。また、これに伴い警報故障確率算出部116は、異なるデータを処理する。
図12は、実施例2の警報発砲状況を示す説明図である。
図12は、実施例2のデータ統合処理部115による処理のイメージを示す。データ統合処理部115は、発生警報履歴DB107、故障情報DB108、機器接続情報DB109から取得する情報(発生警報履歴1401、故障情報1402、機器接続情報1403)に図13及び図14の処理を実行することによって、警報リストLAA1404を生成する。
図12に示す警報A〜Aは、同じ種類であり、かつ、機器Rにおいて連続して発生する。
図13及び図14は、実施例2のデータ統合処理部115が、図5のステップS201において実行する処理を示す。
図13は、実施例2の故障した機器113から発した警報と、他の機器113から発した警報との関係を特定する処理を示すフローチャートである。
ステップS1200は、図7に示すステップS300と同じである。
実施例2のデータ統合処理部115は、ステップS301と同じく、Dからf日前までの機器Rの警報リストL={A,A,…,A,…,A}を発生警報履歴DB107から取得する。A={警報発生日時Dn0,警報情報I}、1≦n≦Nである。
ここで、実施例2のデータ統合処理部115は、警報リストLに含まれる各要素{R,A}をキーとした連想配列を警報リストLAAに追加する(S1201)。特に、実施例2のデータ統合処理部115は、警報リストLに含まれる警報を警報情報I毎にソートする。そして、警報と、同じ警報情報の警報の数と、を示す連想配列を生成する。
なお、ステップS1201において警報リストLAAに追加された複数の警報は、機器RにおいてDからf日前までに発生した警報であり、本実施例の警報群である。データ統合処理部115は、警報群を関連する複数の機器として取得する。
例えば、データ統合処理部115は、図12に示す機器Rの警報のリストとして、警報リストL={R,A,A,A,A}を抽出する。ここで、警報A、A、Aの警報情報は、すべて警報情報I1であり、かつ、連続して発生する。この場合、データ統合処理部115は、抽出した{R,A,A,A,A}を警報情報毎にソートし、例えば{R,A,3,A}など、警報情報と繰り返し回数とを示すリストを生成し、警報リストLAAに追加する。
また、データ統合処理部115は、警報リストLが同じ警報情報の警報が周期的に発生することを示す場合、同じ警報情報の警報が発生する時間間隔を示す情報を、警報群に含めて、警報リストLAAに格納してもよい。
ステップS1201の後、データ統合処理部115は、ステップS302と同じく、機器接続情報DB109から機器Rと接続関係にある機器リストLR0={R,R,…,R,…,R}を取得し、1≦m≦Mとする(S1202)。ここで、実施例2のデータ統合処理部115は、警報リストLに含まれる各要素{R,A}をキーとした連想配列を警報リストLAAに追加する。
例えば、データ統合処理部115は、図12に示す機器Rの警報のリストとして、{R,A11,A21,A31,A41}を抽出する。そして、警報の繰り返しがないため、抽出したリストを機器Rの警報群として取得する。そして、取得した警報群を警報リストLAAに追加する。
ステップS1202の後、データ統合処理部115は、ステップS1203〜ステップS1213を実行する。ステップS1203〜ステップS1207は、図7に示すステップ303〜ステップS307と同じである。
ステップS1206の後、データ統合処理部115は、ステップS307と同じく、ステップS1208、及びS1209をK回繰り返す(S1207)。そして、データ統合処理部115は、引数kがK以下である場合、ステップS1208を実行し、引数kがKより大きい場合、ステップS1209を実行する。
ステップS1208において、データ統合処理部115は、Dn0<Dkmの場合LAAのキー{R,A}のリストの末尾に{R,Akm}を追加する。Dn0>Dkmの場合LAAのキー{R,A}のリストの先頭に{R,Akm}を追加する(S1208)。ステップS1208は、リストの末尾又は先頭に{R,Akm}を追加する点において、実施例1のステップS308と異なる。
図12における例において、n=3であり、m=1である場合、ステップS1208におけるデータ統合処理部115は、{R,A3}のリストの先頭に{R1,A21}を追加し、次のステップS1208において、{R,A3}のリストの先頭に{R1,A31}を追加する。この結果、データ統合処理部115は、{R1,A31,R1,A21,R,A3}を生成する。
ステップS1210〜ステップS1213は、図7のステップS310〜ステップS313と同じである。ステップS1209において、データ統合処理部115は、図14に示す処理をX層まで実行する。
図14は、実施例2の故障した機器113に接続する機器113から発した警報と、他の機器113から発した警報との関係を特定する処理を示すフローチャートである。
図14におけるステップS1301〜S1307は、図8に示すステップS401〜S407と同じである。なお、ステップS1302において、機器Rqmにおいて発生した警報リストの連想配列が警報リストLAAに含まれていない場合、データ統合処理部115は、当該連想配列を警報リストLAAに格納する。
ステップS1306の後、データ統合処理部115は、ステップ407と同じく、S1308、S1309をH回繰り返す(S1307)。
引数hがH以下である場合、データ統合処理部115は、ステップS1308を実行する。引数hがHを超える場合、データ統合処理部115は、引数qに1を加算し(S1310)、ステップS1305に戻る。
なお、引数hがHを超え、かつ、機器Rqmに機器R以外で接続する機器113がある場合、データ統合処理部115は、実施例1と同じく、予め与えられたX層まで、図13及び図14の処理を実行したかを判定する。そして、実行していない場合、機器Rqmに機器R以外で接続する機器113を機器Rとし、図14に示す処理を実行する。そして次の階層への処理が終了した後、ステップS1310を実行する。
データ統合処理部115は、ステップS1308において、Dn0<Dhqの場合LAAのキー{R,A}及び{R,Apm}が含まれるリストの末尾に{Rqm,Apm}を追加する。また、Dn0>Dhqの場合LAAのキー{R,A}及び{R,Apm}が含まれるリストの先頭に{Rqm,Apm}を追加する。ステップS1308は、リストの末尾又は先頭に{Rqm,Apm}を追加する点において、実施例1のステップS408と異なる。
ステップS1308の後、データ統合処理部115は、ステップ1309を実行する。ステップ1309〜S1311は、図8のステップ409〜S1311と同じである。
ステップS1203において、引数nがNを越え、機器Rにおいて発生したすべての警報について、関連する警報を抽出した場合、データ統合処理部115は、{F,LAA}の組を統合DB120に登録する(S1213)。
図15は、実施例2の統合DB120を示す説明図である。
実施例2の統合DB120は、実施例1の統合DB120と同じく、故障ID125及び警報リストLAA126を含む。
警報故障確率算出部116は、ステップS202において、統合DB120から故障ID125毎に、警報リストLAAが示す機器113と警報との組み合わせを取得する。そして、警報の警報情報1074に基づいて警報の種類(警報情報)の組み合わせを特定し、特定した警報の種類の組み合わせが発生する確率(確率136)を、故障内容毎に算出する。
ここで、警報故障確率算出部116は、警報リストLAA126が示す発生順どおりに発生する警報情報の組み合わせを抽出してもよい。そして、同じ組み合わせの総数によって、故障内容ごとの同じ組み合わせの数を除算することによって、確率を算出してもよい。
また、警報故障確率算出部116は、発生順は考慮せず、発生する警報情報の組み合わせに基づいて確率を算出してもよい。
また、繰り返して同じ警報情報の警報が発生している場合、所定の警報情報が繰り返した回数が一致する組み合わせを同じ組み合わせとして抽出してもよいし、所定の範囲の回数警報が繰り返す組み合わせを同じ組み合わせとして抽出してもよい。
また、周期的に同じ警報情報の警報が発生している場合、警報故障確率算出部116は、警報が周期的に発生する時間間隔の差が所定の範囲内である組み合わせを同じ組み合わせとして抽出してもよい。
そして、警報故障確率算出部116は、ステップS202において、故障内容と、警報情報の組み合わせと、算出した確率とを警報故障確率DB121に格納する。
故障確率算出部117は、ステップS203において、取得した警報状況が示す複数の警報から、警報故障確率DB121が示す警報群と同じ警報情報の複数の警報を抽出する。そして、警報状況から抽出される複数の警報の警報群の確率に基づいて、故障内容毎に確率を算出する。
これによって、例えば、故障確率算出部117は、警報群に含まれる警報と同じ警報情報の警報が、警報群が示す回数(連続して)発生した場合の、故障内容ごとの発生確率を算出できる。
実施例2によれば、複数機器113の警報の発生パターン(機器113間の警報発生パターン)及び単一機器の警報の発生パターン(同じ警報情報の警報が連続して、又は、周期的に発生する等)を考慮して、故障に関連する警報を抽出できる。これにより、正確に警報の発生状況を取得できるため、故障の確率を精度よく算出することが可能となる。
実施例1及び2では、所定の時間範囲で警報を取得し、確率算出及びパターンを生成した。この場合、故障が発生した機器において警報が発生した時刻の所定の時間範囲外の警報については考慮できない。実施例3では、警報因果関係を用いて所定の時間範囲外の警報も考慮可能とした警報と故障の確率を算出する。
図16は、実施例3の故障予兆検知システムのブロック図である。
実施例1及び2の故障予兆検知システムと、実施例3の故障予兆検知システムとの相違点は、実施例3の故障予兆検知システムが、警報因果関係DB122を備える点である。
その他の点は、実施例1及び2の故障予兆検知システムと、実施例3の故障予兆検知システムとは同じである。
実施例3のデータ統合処理部115は、発生警報履歴DB107、故障情報DB108、機器接続情報DB109及び警報因果関係DB122から入手するデータに基づき、故障した機器の警報と接続関係にある機器の警報とから、関連のある警報リストを作成し、統合DB120に登録する機能を持つ。
警報因果関係DB122とは、関係がある警報の警報情報(種類)と警報の警報情報とを示すDBである。
図17は、実施例3の警報因果関係DB122を示す説明図である。
図17(a)は、警報因果関係DB122を示す説明図である。図17(b)は、警報因果関係DB122の異なる例を示す説明図である。
図17(a)に示す警報因果関係DB122aは、関連する複数の警報を示す。警報因果関係DB122aは、警報情報1(1221a)及び警報情報2(1222a)を含む。警報情報1(1221a)は、警報の警報情報を示し、警報情報2(1222a)は、警報情報1(1221a)が示す警報情報の警報と関連する警報の警報情報を示す。
図17(b)に示す警報因果関係DB122bは、関連する複数の警報と、当該複数の警報の発生条件を示す。警報因果関係DB122bは、警報情報1(1221b)、警報情報2(1222b)及び関係1223bを含む。
警報情報1(1221b)は、警報の警報情報を示し、警報情報2(1222b)は、警報情報1(1221b)が示す警報情報の警報と関連する警報の警報情報を示す。関係1223bは、警報情報1(1221b)が示す警報情報の警報と、警報情報2(1222b)が示す警報情報の警報とが関連して発生する条件を示す。
関係1223bは、例えば、警報情報1(1221b)が示す警報情報の警報が発生した時刻の前後d1時間の間に警報情報2(1222b)が示す警報情報の警報が発生した場合、データ統合処理部115は、当該警報情報1(1221b)が示す警報情報の警報と当該警報情報2(1222b)が示す警報情報の警報とを、関連する警報として特定することを示す。
故障予兆検知システムの管理者又は運用者は、設計時に警報因果関係DB122を設定してもよいし、過去の警報発生履歴に基づいて随時更新してもよい。
図18は、実施例3の警報発砲状況を示す説明図である。
また、図18は、実施例3のデータ統合処理部115の処理イメージを示す。データ統合処理部115は、発生警報履歴DB107、故障情報DB108、機器接続情報DB109、及び、警報因果関係DB122から取得する情報(発生警報履歴2001、故障情報2002、機器接続情報2003、及び、警報因果関係2004)に図19及び図20の処理を実行することによって、警報リストLAA2005を生成する。
図19及び図20は、ステップS201の手順の詳細の一例を示すフローチャートである。
図19は、実施例3の故障した機器113から発した警報と、他の機器113から発した警報との関係を特定する処理を示すフローチャートである。
ステップS1700〜ステップS1705は、図7に示すステップS300〜ステップ305と同じである。
ステップS1705において、引数mがM以下である場合、かつ、機器RについてのステップS306の処理が実行されていないと判定した場合、データ統合処理部115は、ステップS1706を実行する。
データ統合処理部115は、ステップS1706において、機器Rにおいて、Dからf日前までに発生した警報リストLfmを発生警報履歴DB107から取得する。そして、警報リストLの全警報の中から任意の警報(警報A)を取得し、さらに、警報リストLfmの全警報の中から任意の警報(警報B)を取得し、警報Aの警報情報と警報Bの警報情報との組が、警報因果関係DB122に含まれるか判定する。含まれる場合、警報Aと、警報Bと、故障内容F0との組み合わせを発生順に警報リストLAAに追加する(S1706)。
これによって、データ統合処理部115は、警報リストLと警報リストLfmとから、関連する警報の組み合わせを取得し、取得した組み合わせと故障内容F0とを警報リストLAAに追加する。そして、これによって、発生日時によらず関連のある警報を特定することができる。
例えば、図18に示す警報発砲状況において警報因果関係2004は、警報情報I21の警報と警報情報I3の警報とが関連することを示す。そして、図18において、警報A21の警報情報は警報情報I21であり、警報Aの警報情報は、警報情報I3である。
このため、データ統合処理部115は、ステップS1706において、警報リストL{A,A,A,A}と、警報リストLfm{A11,A21,A31}とから、関連する警報A及び警報Bとして警報A及び警報A21を取得する。そして、発生順に、{R,A21,R,A}を、警報リストLAAに追加する。
ステップS1706の後、データ統合処理部115は、ステップS1707を実行する。ステップS1707〜ステップS1714は、図7のステップS306〜ステップS313と同じである。ステップ1710において、データ統合処理部115は、図20に示す処理を、X層まで実行する。
図20は、実施例3の故障した機器113に接続する機器113から発した警報と、他の機器113から発した警報との関係を特定する処理を示すフローチャートである。
ステップS1801〜ステップS1805は、図8に示すステップS401〜ステップS405と同じである。引数qがQ以下であり、かつ、機器RqmにステップS1806の処理をまだ実行していない場合、データ統合処理部115は、ステップS1806を実行する。
ステップS1806において、データ統合処理部115は、機器RqmのDからf日前までの警報のリストLqmを発生警報履歴DB107から取得する。機器Rの警報リストLの全警報の中から任意の警報(警報A)を取得し、さらに、警報リストLqmの全警報の中から任意の警報(警報B)を取得し、警報Aの警報情報と警報Bの警報情報との組が、警報因果関係DB122に含まれるか判定する。含まれる場合、警報Aと、警報Bと、故障内容F0との組み合わせを発生順に警報LAAに追加する。
これによって、データ統合処理部115は、機器Rと間接的に接続する機器Rにおいて発生した、警報因果関係DB122が示す関連のある警報を特定することができる。そして、これによって、発生日時によらず関連のある警報を特定することができる。
ステップS1806の後、データ統合処理部115は、ステップS1807を実行する。ステップS1807〜ステップ1814は、図8のステップS406〜ステップS413と同じである。
実施例3によれば、設定された警報因果関係DB122を用いて、所定の時間範囲外の警報も関連する警報として抽出でき、この関連する警報に基づいて故障の確率の算出が可能となる。これによって、時間差以外の条件によって関連する警報を抽出でき、故障に関連する警報の発生状況を正確に取得することができるため、精度よく故障の発生確率を算出できる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除又は置換をすることが可能である。
また、上記の各構成、機能及び処理部等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル又はファイル等の情報は、メモリ、ハードディスク、若しくはSSD(Solid State Drive)等の記録装置、又は、ICカード、若しくはSDカード等の記録媒体に置くことができる。
また、制御線及び情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。
100 利用者
101 計算機
102 計算機
107 発生警報履歴DB
108 故障情報DB
109 機器接続情報DB
111 機器監視システム
113 機器
115 データ統合処理部
116 警報故障確率算出部
117 故障確率算出部
120 統合DB
121 警報故障確率DB
122 警報因果関係DB

Claims (10)

  1. 分析システムであって、
    プロセッサ及び記憶装置を有し、
    前記記憶装置は、複数の機器の接続関係を示す接続情報と、警報と故障との組み合わせを示す統合情報とを保持し、
    前記プロセッサは、
    前記複数の機器において発生した警報の発生時刻と種類とを示す警報情報を取得し、
    故障が発生した機器において発生した第1の警報の第1の発生時刻を前記警報情報から取得し、
    前記故障が発生した機器と直接に接続する機器及び間接に接続する機器を示す接続機器情報を、前記接続情報に基づいて特定し、
    前記接続機器情報が示す機器において発生した警報の第2の発生時刻を前記警報情報から取得し、
    前記第1の発生時刻及び前記第2の発生時刻に基づいて、前記接続機器情報が示す機器において発生した警報のうち、前記第1の警報から第1の所定時間内の第2の警報を、前記警報情報から特定し、
    前記第1の警報、前記第2の警報及び前記故障の組み合わせを前記統合情報に格納し、
    前記統合情報及び前記警報情報に基づいて、前記第1の警報と同じ種類の警報及び前記第2の警報と同じ種類の警報が関連して発生する場合の前記故障の発生確率を、前記故障の種類毎に算出し、
    前記故障が発生した機器から所定数の層までの機器の前記第2の警報を、前記第1の警報と組み合わせて、前記統合情報に格納し、
    前記所定数の層は、前記故障が発生した機器に間接に接続する機器のうち前記第2の警報を抽出する機器の範囲を示し、
    前記記憶装置は、関連がある複数の警報の種類を示す関係情報を保持し、
    前記プロセッサは、前記関係情報が前記第1の警報と関連付ける警報を前記第2の警報として、前記第1の警報と組み合わせて前記統合情報に格納することを特徴とする分析システム。
  2. 請求項1に記載の分析システムであって、
    前記第1の警報から、前記故障が発生した時刻より前の第2の所定時間内に発生した警報を含む警報群を特定し、
    前記特定した警報群及び前記故障の組み合わせを、前記統合情報に格納し、
    前記統合情報及び前記警報情報に基づいて、前記警報群に含まれる警報の種類と同じ種類の警報が発生する場合の前記故障の発生確率を、前記故障の種類毎に算出することを特徴とする分析システム。
  3. 請求項2に記載の分析システムであって、
    前記特定した警報群から、連続して発生した同じ種類の複数の第1の警報を特定し、
    前記特定した複数の第1の警報が連続して発生した回数と前記特定した複数の第1の警報の種類と前記故障との組み合わせを、前記統合情報に格納し、
    前記統合情報及び前記警報情報に基づいて、前記警報群に含まれる警報と同じ種類の警報が同じ回数連続して発生する場合の前記故障の発生確率を、前記故障の種類毎に算出することを特徴とする分析システム。
  4. 請求項1に記載の分析システムであって、
    前記統合情報が示す組み合わせに基づいて、前記第1の警報及び前記第2の警報が関連して発生した場合に前記故障が発生した割合を、警報故障確率として、前記故障の種類毎に算出し、
    前記警報故障確率に基づいて、前記第1の警報と同じ種類の警報及び前記第2の警報と同じ種類の警報が発生する場合の前記故障の発生確率を前記故障の種類毎に算出することを特徴とする分析システム。
  5. 請求項4に記載の分析システムであって、
    所定の期間における警報の発生状況を取得し、
    前記発生状況と前記警報故障確率とに基づいて、前記所定の期間において、前記第1の警報と同じ種類の警報及び前記第2の警報と同じ種類の警報が関連して発生する場合の前記故障の発生確率を前記故障の種類毎に算出することを特徴とする分析システム。
  6. 分析システムが実行する分析方法であって、
    前記分析システムは、プロセッサ及び記憶装置を有し、
    前記記憶装置は、複数の機器の接続関係を示す接続情報と、警報と故障との組み合わせを示す統合情報とを保持し、
    前記分析方法は、
    前記プロセッサが、前記複数の機器において発生した警報の発生時刻と種類とを示す警報情報を取得し、前記記憶装置に格納し、
    前記プロセッサが、故障が発生した機器において発生した第1の警報の第1の発生時刻を前記警報情報から取得し、前記記憶装置に格納し、
    前記プロセッサが、前記故障が発生した機器と直接に接続する機器及び間接に接続する機器を示す接続機器情報を、前記接続情報に基づいて特定し、当該特定した接続機器の情報を前記記憶装置に格納し、
    前記プロセッサが、前記接続機器情報が示す機器において発生した警報の第2の発生時刻を前記警報情報から取得し、前記記憶装置に格納し、
    前記プロセッサが、前記第1の発生時刻及び前記第2の発生時刻に基づいて、前記接続機器情報が示す機器において発生した警報のうち、前記第1の警報から第1の所定時間内の第2の警報を、前記警報情報から特定し、当該特定した警報の情報を前記記憶装置に格納し、
    前記プロセッサが、前記第1の警報、前記第2の警報及び前記故障の組み合わせを前記統合情報に格納し、
    前記プロセッサが、前記統合情報及び前記警報情報に基づいて、前記第1の警報と同じ種類の警報及び前記第2の警報と同じ種類の警報が関連して発生する場合の前記故障の発生確率を、前記故障の種類毎に算出し、
    前記プロセッサが、前記故障が発生した機器から所定数の層までの機器の前記第2の警報を、前記第1の警報と組み合わせて、前記統合情報に格納する、ことを含み、
    前記所定数の層は、前記故障が発生した機器に間接に接続する機器のうち前記第2の警報を抽出する機器の範囲を示し、
    前記記憶装置は、関連がある複数の警報の種類を示す関係情報を保持し、
    前記方法は、
    前記プロセッサが、前記関係情報が前記第1の警報と関連付ける警報を前記第2の警報として、前記第1の警報と組み合わせて前記統合情報に格納することを含むことを特徴とする分析方法。
  7. 請求項6に記載の分析方法であって、
    前記プロセッサが、前記第1の警報から、前記故障が発生した時刻より前の第2所定時間内に発生した警報を含む警報群を特定し、当該特定した警報の情報を前記記憶装置に格納し、
    前記プロセッサが、前記特定した警報群及び前記故障の組み合わせを、前記統合情報に格納し、
    前記プロセッサが、前記統合情報及び前記警報情報に基づいて、前記警報群に含まれる警報の種類と同じ種類の警報が発生する場合の前記故障の発生確率を、前記故障の種類毎に算出することを特徴とする分析方法。
  8. 請求項7に記載の分析方法であって、
    前記プロセッサが、前記特定した警報群から、連続して発生した同じ種類の複数の第1の警報を特定し、
    前記プロセッサが、前記特定した複数の第1の警報が連続して発生した回数と前記特定した複数の第1の警報の種類と前記故障との組み合わせを、前記統合情報に格納し、
    前記プロセッサが、前記統合情報及び前記警報情報に基づいて、前記警報群に含まれる警報と同じ種類の警報が同じ回数連続して発生する場合の前記故障の発生確率を、前記故障の種類毎に算出することを特徴とする分析方法。
  9. 請求項6に記載の分析方法であって、
    前記プロセッサが、前記統合情報が示す組み合わせに基づいて、前記第1の警報及び前記第2の警報が関連して発生した場合に前記故障が発生した割合を、警報故障確率として、前記故障の種類毎に算出し、前記記憶装置に格納し、
    前記プロセッサが、前記警報故障確率に基づいて、前記第1の警報と同じ種類の警報及び前記第2の警報と同じ種類の警報が発生する場合の前記故障の発生確率を前記故障の種類毎に算出することを特徴とする分析方法。
  10. 請求項9に記載の分析方法であって、
    前記プロセッサが、所定の期間における警報の発生状況を取得し、前記記憶装置に格納し、
    前記プロセッサが、前記発生状況と前記警報故障確率とに基づいて、前記所定の期間において、前記第1の警報と同じ種類の警報及び前記第2の警報と同じ種類の警報が関連して発生する場合の前記故障の発生確率を前記故障の種類毎に算出することを特徴とする分析方法。
JP2015185432A 2015-09-18 2015-09-18 分析システム、及び、分析方法 Expired - Fee Related JP6622040B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015185432A JP6622040B2 (ja) 2015-09-18 2015-09-18 分析システム、及び、分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015185432A JP6622040B2 (ja) 2015-09-18 2015-09-18 分析システム、及び、分析方法

Publications (2)

Publication Number Publication Date
JP2017059152A JP2017059152A (ja) 2017-03-23
JP6622040B2 true JP6622040B2 (ja) 2019-12-18

Family

ID=58390635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015185432A Expired - Fee Related JP6622040B2 (ja) 2015-09-18 2015-09-18 分析システム、及び、分析方法

Country Status (1)

Country Link
JP (1) JP6622040B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7163568B2 (ja) * 2017-07-27 2022-11-01 富士電機株式会社 アラーム品質評価装置、アラーム品質評価方法及びアラーム品質評価プログラム
CN113839804B (zh) * 2020-06-24 2023-03-10 华为技术有限公司 一种网络故障的确定方法及网络设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3876692B2 (ja) * 2001-11-13 2007-02-07 株式会社日立製作所 ネットワークシステム障害分析支援方法およびその方式
JP5088411B2 (ja) * 2008-05-27 2012-12-05 富士通株式会社 システム運用管理支援プログラム,方法及び装置
JP5469589B2 (ja) * 2010-12-07 2014-04-16 株式会社日立製作所 プラント設備管理保守支援システム及び管理保守方法

Also Published As

Publication number Publication date
JP2017059152A (ja) 2017-03-23

Similar Documents

Publication Publication Date Title
US11042476B2 (en) Variability system and analytics for continuous reliability in cloud-based workflows
US8825276B2 (en) Maintenance systems and methods for use in analyzing maintenance data
JP5223413B2 (ja) Itシステムのトラブル対処装置、トラブル対処方法およびそのためのプログラム
EP3239840B1 (en) Fault information provision server and fault information provision method
EP4020218B1 (en) Analyzing large-scale data processing jobs
JP6880560B2 (ja) 故障予測装置、故障予測方法及び故障予測プログラム
WO2018073960A1 (ja) 表示方法、表示装置、および、プログラム
JP6109662B2 (ja) 運用管理装置、運用管理方法およびプログラム
US20200201706A1 (en) Recovery of application from error
CN113823396A (zh) 医疗设备管理方法、装置、计算机设备和存储介质
CN113196311A (zh) 用于识别和预测机器的异常感测行为模式的系统和方法
JP6767203B2 (ja) 保守支援装置、保守支援方法およびコンピュータプログラム
US10730642B2 (en) Operation and maintenance of avionic systems
JP6002856B2 (ja) 監視システム、及び、監視方法
JP6622040B2 (ja) 分析システム、及び、分析方法
JP6475469B2 (ja) 診断ジョブ生成システム、診断ジョブ生成方法及び診断ジョブ生成表示方法
JP2010015246A (ja) 故障情報分析管理システム
CN112769615A (zh) 一种异常分析方法及装置
JP6973445B2 (ja) 表示方法、表示装置、および、プログラム
JP2021015321A (ja) 手順特定装置、計算モデル生成装置、手順特定方法、手順特定プログラム、計算モデル生成方法、計算モデル生成プログラム、学習データ生成装置及び計算プログラム
JP2016071696A (ja) 予兆検知支援プログラム、方法、装置、及び予兆検知プログラム、
CN115102838A (zh) 服务器宕机风险的应急处理方法和装置、电子设备
JP2017076165A (ja) 機器監視装置およびアラート情報管理方法
JP7534700B2 (ja) 正解データ生成装置、正解データ生成方法および正解データ生成プログラム
WO2014192066A1 (ja) プラント異常診断システム、プラント異常診断方法、及び計算機読み取り可能な記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191121

R150 Certificate of patent or registration of utility model

Ref document number: 6622040

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees