JP6503223B2 - Device, system, program and method for evaluating failure prediction result in consideration of operation loss - Google Patents

Device, system, program and method for evaluating failure prediction result in consideration of operation loss Download PDF

Info

Publication number
JP6503223B2
JP6503223B2 JP2015101339A JP2015101339A JP6503223B2 JP 6503223 B2 JP6503223 B2 JP 6503223B2 JP 2015101339 A JP2015101339 A JP 2015101339A JP 2015101339 A JP2015101339 A JP 2015101339A JP 6503223 B2 JP6503223 B2 JP 6503223B2
Authority
JP
Japan
Prior art keywords
failure
prediction
type
predicted
correct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015101339A
Other languages
Japanese (ja)
Other versions
JP2016219962A (en
Inventor
喜芳 近藤
喜芳 近藤
篤男 立花
篤男 立花
長谷川 輝之
輝之 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2015101339A priority Critical patent/JP6503223B2/en
Publication of JP2016219962A publication Critical patent/JP2016219962A/en
Application granted granted Critical
Publication of JP6503223B2 publication Critical patent/JP6503223B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Description

本発明は、事業システムでの障害の発生を予測する障害予測手段による予測結果を評価する技術に関する。   The present invention relates to a technology for evaluating prediction results by failure prediction means for predicting the occurrence of a failure in a business system.

今日の通信サービス事業者やインターネット関連サービス事業者にとって、通信ネットワーク(NW)システムに設置されたNW設備等での障害の発生を予測することは、迅速な障害復旧を可能とするNW運用を実現するために重要となる。   For today's communication service providers and Internet related service providers, predicting the occurrence of a failure in an NW facility or the like installed in a communication network (NW) system realizes an NW operation that enables quick failure recovery. To be important.

実際、今日まで、様々な事業システムにおいて種々の障害予測技術が研究開発されている。例えば、特許文献1〜3に記載された技術では、分類学習アルゴリズムとしてナイーブベイズ(例えば非特許文献1参照)やサポートベクタマシン(例えば非特許文献2参照)、決定木(例えば非特許文献3参照)等の機械学習を利用し、監視設備が取得するデータに基づいて障害の発生を予測している。   In fact, to date, various failure prediction techniques have been researched and developed in various business systems. For example, in the techniques described in Patent Documents 1 to 3, as a classification learning algorithm, naive Bayes (see, for example, Non-patent Document 1), support vector machines (see, for example, Non-patent document 2), and decision trees (see, for example, Non-patent Document 3). Etc.) and predict the occurrence of failure based on data acquired by the monitoring equipment.

ここで、これらの障害予測技術による予測結果が実際にどこまで有効であるかを評価し、対象となる通信NW等の事業システムにとってどのような障害予測手法を適用すべきかを判断することは非常に大事である。   Here, it is extremely important to evaluate to what extent the prediction result by these fault prediction techniques is actually effective and to decide what fault prediction method should be applied to the business system such as the target communication network. It is important.

このような発生し得る事象の予測結果の有効性を測る従来の指標としては、非特許文献4に記載されたAccuracy、F-measure、Precision及びRecall、即ち、

Figure 0006503223
が挙げられる。上式(1)において、kは事象種別を指定する指数であり、Kは全事象種別を含む集合である。また、Accuracyは予測全体の正解率を示し、F-measurekは事象種別k毎の予測性能を示す。さらに、Precisionkは、ある事象種別kであると予測された場合に正解もその事象種別kである割合を示し、Recallkは、ある事象種別kが正解である場合に予測結果もその事象種別kである割合を示す。このうち、F-measurekはPrecisionkとRecallkとの調和平均として算出される。 As a conventional index to measure the effectiveness of the prediction result of such an event that may occur, Accuracy, F-measure, Precision and Recall described in Non-Patent Document 4, that is,
Figure 0006503223
Can be mentioned. In the above equation (1), k is an index specifying an event type, and K is a set including all event types. Also, “Accuracy” indicates the accuracy rate of the entire prediction, and “F-measure k” indicates the prediction performance for each event type k. Furthermore, when Precision k is predicted to be a certain event type k, it indicates the ratio that the correct answer is also that event type k, and Recall k shows that the predicted result is also that event type when a certain event type k is correct. Indicates the proportion k. Among these, F-measure k is calculated as a harmonic mean of Precision k and Recall k .

これらの指標は、上式(1)に示すように、TP(True Positive)、FP(False Positive)、FN(False Negative)及びTN(True Negative)から算出される。ここで、事象の予測結果の評価は事象種別k毎の正解率を把握することが基本となるため、TP、FP、FN及びTNは以下のように定義されてその値が取得される。
TPk:事象種別kが、正しく事象種別kと予測された件数
FPk:事象種別kでない障害が、誤って事象種別kと予測された件数
FNk:事象種別kが、誤って事象種別kでない障害と予測された件数
TNk:事象種別kでない障害が、正しく事象種別kではない障害と予測された件数
These indices are calculated from TP (True Positive), FP (False Positive), FN (False Negative), and TN (True Negative), as shown in the above equation (1). Here, since evaluation of the prediction result of an event is based on grasping the correct answer rate for each event type k, TP, FP, FN, and TN are defined as follows and their values are acquired.
TP k : Number of event types k correctly predicted as event type k
FP k : Number of failures that are not event types k and are incorrectly predicted as event types k
FN k : Number of cases where event type k was mistakenly predicted as failure not event type k
TN k : Number of failures that are not event type k predicted as failures that are not correctly event type k

特開2012−128583号公報Unexamined-Japanese-Patent No. 2012-128583 特開2013−191672号公報JP, 2013-191672, A 特開2013−13075号公報JP, 2013-13075, A

Pedro Domingos及びMichael Pazzani、「On the Optimality of the Simple Bayesian Classifier under Zero-One Loss」、Machine learning、Vol.29、pp.103-130、1997年Pedro Domingos & Michael Pazzani, "On the Optimality of the Bayesian Classifier under Zero-One Loss", Machine learning, Vol. 29, pp. 103-130, 1997 Corinna Cortes及びVladimir Vapnik、「Support-Vector Networks」、Machine Learning、Vol.20、pp.273-297、1995年Corinna Cortes and Vladimir Vapnik, "Support-Vector Networks", Machine Learning, Vol. 20, pp. 273-297, 1995 Rokach, Lior及びMaimon, O.、「Data mining with decision trees: theory and applications」、World Scientific Pub Co Inc.、2007年Rokach, Lior and Maimon, O., "Data mining with decision trees: theory and applications", World Scientific Pub Co Inc., 2007 元田浩、津本周作、山口高平、及び沼尾正行、「IT Text データマイニングの基礎」、オーム社、2006年Hiroshi Motoda, Shusaku Tsumoto, Takahira Yamaguchi, and Masayuki Numao, "Basics of IT Text Data Mining", Ohm, 2006

しかしながら、例え、上述した従来のAccuracy、F-measurek、Precisionk及びRecallkといった指標を用いて障害予測技術による予測結果を評価したとしても、尚、事業システムの運用における、障害予測による現実的なメリット・デメリットを評価することは困難である。 However, even if the prediction result by the failure prediction technology is evaluated using the above-mentioned indexes such as conventional Accuracy, F-measure k , Precision k and Recall k mentioned above, it is still realistic by failure prediction in the operation of the business system. It is difficult to evaluate the merits and demerits.

実際、上述したAccuracy、F-measurek、Precisionk及びRecallkといった指標は、TPk、FPk、FNk及びTNkといった事象種別に係る予測結果の単純な総件数に基づいて算出される。一方、特許文献1〜3に記載された障害予測技術においては、その予測結果に、事業システムの運用コスト等の運用面での事情は何ら反映されない。従って、これらの指標による評価結果も、そのような運用面での事情を考慮したものとはなり得ない。 In fact, the indicators such as Accuracy, F-measure k , Precision k, and Recall k described above are calculated based on a simple total number of prediction results regarding event types such as TP k , FP k , FN k, and TN k . On the other hand, in the failure prediction techniques described in Patent Documents 1 to 3, circumstances in the operation aspect such as the operation cost of the business system are not reflected at all in the prediction result. Therefore, the evaluation results by these indicators can not be considered in consideration of such operational circumstances.

これに対し、実際の事業システムの運用においては、例えば障害の発生を予測した場合、故障した設備の交換に要するコストや、障害の発生した現地への出動等に要するコストも考慮した上で、この予測の結果を評価する必要がある。また、予測結果に基づいて障害に対応した際に、提供するサービスがどの程度劣化するかや、障害復旧にどれだけの時間が費やされるかといった運用上発生する損失の度合いも考慮可能であることも望まれる。しかしながら、そのような運用コストを含めた運用損失の観点から障害予測結果を評価することは、従来何ら提案されてこなかった。   On the other hand, in the actual operation of the business system, for example, when the occurrence of a failure is predicted, the cost required to replace the broken equipment and the cost required for dispatching to the site where the failure occurred, etc. are taken into consideration. The outcome of this prediction needs to be evaluated. In addition, when dealing with failures based on the prediction results, it is also possible to take into consideration the degree of operationally occurring loss, such as how much the service provided will deteriorate and how long it will take to recover from the failure. Is also desired. However, it has never been proposed to evaluate failure prediction results from the viewpoint of operation loss including such operation costs.

そこで、本発明は、事業システムの運用損失をも考慮して、障害発生の予測結果を評価することができる装置、システム、プログラム及び方法を提供することを目的とする。   Therefore, the present invention aims to provide an apparatus, a system, a program, and a method capable of evaluating the prediction result of failure occurrence in consideration of the operation loss of the business system.

本発明によれば、事業システムにおける障害の発生を予測する障害予測手段による予測結果を評価する障害予測評価装置であって、
当該障害予測手段による予測結果としての複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得する予測結果取得手段と、
当該正解障害種別毎に、当該予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストを含む運用損失に係る情報である運用損失情報を取得する運用損失取得手段と、
当該正解障害種別と当該予測障害種別との組毎に、1つの予測障害種別における当該正解障害種別毎に、又は1つの正解障害種別における当該予測障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該障害予測手段による予測結果の評価の指標となる評価値を算出する評価値算出手段と
を有する障害予測評価装置が提供される。
According to the present invention, there is provided a failure prediction and evaluation device for evaluating the prediction result by the failure prediction means for predicting the occurrence of a failure in a business system,
For each of a plurality of failure types as prediction results by the failure prediction means, the number of times the failure type is actually predicted as a predicted failure type for each correct failure type that is a failure type that was correct when predicted Forecasting result acquiring means for acquiring such prediction frequency information;
Acquisition of operation loss, which is information related to operation loss including the operation cost that occurs when each correct failure type is dealt with or left according to the content of the predicted failure type for each of the predicted failure types Means,
The prediction frequency information corresponding to each pair of the correct failure type and the predicted failure type, for each correct error type in one predicted failure type, or for each predicted failure type in one correct error type There is provided a failure prediction and evaluation device having evaluation value calculation means for calculating an evaluation value serving as an index of evaluation of a prediction result by the failure prediction means based on a value weighted by operation loss information.

ここで、本発明における障害発生予測対象である事業システムは、少なくとも1つの設備を備えており、
予測結果取得手段は、当該設備の交換又は修理が必要な障害である旨の障害種別、及び当該設備の交換又は修理が不要な障害である旨の障害種別についての当該予測回数情報を取得し、
運用損失取得手段は、当該設備の交換又は修理が不要な障害である旨の正解予測種別と、当該設備の交換又は修理が必要な障害である旨の予測障害種別とに対応する運用損失情報として、当該設備の交換又は修理に係るコスト分が加算された値を採用することも好ましい。
Here, the business system targeted for failure occurrence prediction in the present invention is provided with at least one facility,
The prediction result acquisition means acquires the predicted number of times information on the type of failure indicating that the facility needs replacement or repair, and the type of failure indicating that the facility need not be replaced or repaired.
The operation loss acquiring unit is used as operation loss information corresponding to the correctness prediction type indicating that the equipment need not be replaced or repaired, and the predicted failure type indicating that the facility needs to be exchanged or repaired. It is also preferable to adopt a value to which the cost for replacing or repairing the facility is added.

さらに、障害発生予測対象である事業システムは、障害発生時にその場で対応が必要となる少なくとも1つの現地を有し、
予測結果取得手段は、当該現地での対応が必要な障害である旨の障害種別、及び当該現地での対応が不要な障害である旨の障害種別についての当該予測回数情報を取得し、
運用損失取得手段は、当該現地での対応が不要な障害である旨の正解予測種別と、当該現地での対応が必要な障害である旨の予測障害種別とに対応する運用損失情報として、当該現地への出動コスト分が加算された値を採用することも好ましい。
Furthermore, the business system targeted for failure occurrence prediction has at least one site that needs to be responded on the spot when a failure occurs,
The prediction result acquisition means acquires the number of times of prediction about the failure type to the effect that the local response is required and the failure type to the effect that the local response is unnecessary.
The operation loss acquiring means is used as operation loss information corresponding to the correct answer prediction type indicating that the response in the field is unnecessary and the predicted failure type indicating that the error in the field requires the response. It is also preferable to adopt a value to which the dispatch cost for the field is added.

さらにまた、障害発生予測対象である事業システムは、少なくとも1つの設備を備え、障害発生時にその場で対応が必要となり得る少なくとも1つの現地を有する通信ネットワークシステムであることも好ましい。   Furthermore, it is also preferable that the business system to be subjected to failure occurrence prediction is a communication network system provided with at least one facility and having at least one site that may need to be dealt with on the spot when a failure occurs.

また、通信ネットワークシステムが障害発生予測対象である実施形態において、予測結果取得手段によって取得される予測回数情報を導出するための当該予測結果は、当該障害予測手段が、当該設備から又は予めネットワークに設置された監視設備から収集されるネットワークに係るアラーム情報と、当該正解障害種別とを教師データセットとして学習させて構築した学習器に対し、予測対象であるアラーム情報を入力することによって取得した予測結果であることも好ましい。   Further, in an embodiment in which the communication network system is the failure occurrence prediction target, the prediction result for deriving the prediction number information acquired by the prediction result acquisition means is the equipment from which the failure prediction means is concerned or the network in advance. Prediction acquired by inputting alarm information to be predicted to a learning device constructed by learning alarm information related to the network collected from the installed monitoring equipment and the correct failure type as a teacher data set It is also preferable that it is a result.

さらに、本発明による障害予測評価装置の一実施形態として、当該複数の障害種別は、(a)対処が不要な障害である旨の障害種別、
(b)遠隔リセットが必要な障害である旨の障害種別、
(c)事業システムにおける現地での対応が必要な障害である旨の障害種別、及び
(d)事業システムの有する設備の交換又は修理が必要な障害である旨の障害種別
からなる群から選択された少なくとも1つを含むことも好ましい。
Furthermore, as one embodiment of the failure prediction and evaluation apparatus according to the present invention, the plurality of failure types are (a) failure types indicating that the failure is an unnecessary failure;
(B) Failure type indicating that the remote reset needs to be performed,
(C) selected from the group consisting of a failure type indicating that the business system requires a local response, and (d) a failure type requiring replacement or repair of facilities of the business system. It is also preferable to include at least one.

さらにまた、本発明による障害予測評価装置の他の実施形態として、当該運用損失情報は、
(a)障害予測のない場合に必要となる運用コストと比較した運用コストの増減分、
(b)障害予測が外れる又は当たることによって生じるサービスの向上又は劣化の度合い、及び
(c)障害予測のない場合に必要となる障害復旧のための時間と比較した障害復旧時間の増減分
からなる群から選択された少なくとも1つを含むことも好ましい。
Furthermore, as another embodiment of the failure prediction and evaluation apparatus according to the present invention, the operation loss information is
(A) An increase or decrease in the operation cost compared to the operation cost required when there is no failure prediction
(B) Degree of improvement or deterioration of service caused by failure or failure of failure prediction, and (c) increase or decrease of failure recovery time compared with time for failure recovery required without failure prediction It is also preferable to include at least one selected from

また、本発明において、当該運用損失情報は、対応する当該正解障害種別及び当該予測障害種別が一致する場合に負値又はゼロをとり且つ一致しない場合に正値又はゼロをとり、当該評価値は、負値をとる場合にその絶対値が大きいほど、当該障害予測手段による予測結果の有効性がより高いとの評価を示すことも好ましい。 Further, in the present invention, the operation loss information takes a negative value or zero when the corresponding correct error type and the predicted failure type match, and takes a positive value or zero when they do not match, and the evaluation value is It is also preferable to show an evaluation that the effectiveness of the prediction result by the failure prediction means is higher as the absolute value is larger when taking a negative value.

さらに、事業システムが少なくとも1つの設備を備えている実施形態において、評価値算出手段は、当該設備の交換又は修理が必要な障害である旨の予測障害種別における当該正解障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該設備の交換又は修理が必要である旨の予測結果に対する有効性を評価する評価値を算出することも好ましい。   Furthermore, in the embodiment in which the business system includes at least one facility, the evaluation value calculation means corresponds to each correct fault type in the predicted fault type to the effect that it is a fault requiring replacement or repair of the facility. It is also preferable to calculate an evaluation value for evaluating the effectiveness of the prediction result to the effect that replacement or repair of the facility is necessary based on a value obtained by weighting the prediction frequency information by the operation loss information.

本発明によれば、また、少なくとも1つの設備を備えた通信ネットワークシステムにおける障害の発生を予測する障害予測手段と、この障害予測手段による予測結果を評価する障害予測評価装置とを備えた障害予測システムであって、障害予測評価装置は、
障害予測手段による予測結果としての複数の障害種別であって、当該設備の交換又は修理が必要な障害である旨の障害種別、及び当該設備の交換又は修理が不要な障害である旨の障害種別を含む複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得する予測結果取得手段と、
当該正解障害種別毎に、当該予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストであって、設備の交換又は修理が不要な障害である旨の正解予測種別と、当該設備の交換又は修理が必要な障害である旨の予測障害種別とに対応しており当該設備の交換又は修理に係るコスト分が加算された値を有する運用コストを含む運用損失に係る情報である運用損失情報を取得する運用損失取得手段と、
当該正解障害種別と当該予測障害種別との組毎に、1つの予測障害種別における当該正解障害種別毎に、又は1つの正解障害種別における当該予測障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該障害予測手段による予測結果の評価の指標となる評価値を算出する評価値算出手段と
を有する障害予測システムが提供される。
According to the present invention, there is also provided failure prediction means for predicting the occurrence of a failure in a communication network system provided with at least one facility, and failure prediction and evaluation device for evaluating the prediction result by this failure prediction means. The failure prediction and evaluation system is
A plurality of failure types as prediction results by the failure prediction means, that is a failure type to the effect that the equipment needs replacement or repair, and a failure type to the effect that the facility replacement or repair is unnecessary. For each of a plurality of failure types including, for each correct error type that is the failure type that was the correct answer when predicted, prediction frequency information is acquired regarding the number of times the failure type is actually predicted as a predicted failure type. A prediction result acquisition means,
It is an operation cost that occurs when dealing with or leaving each of the correct failure types according to the content of the predicted failure type for each of the correct failure types, that is, a correct answer indicating that replacement or repair of equipment is unnecessary. An operation loss including an operation cost that corresponds to the prediction type and the predicted failure type indicating that the equipment needs replacement or repair, and the cost for replacement or repair of the equipment is added Operation loss acquisition means for acquiring operation loss information which is information related to
The prediction frequency information corresponding to each pair of the correct failure type and the predicted failure type, for each correct error type in one predicted failure type, or for each predicted failure type in one correct error type There is provided a failure prediction system including: evaluation value calculation means for calculating an evaluation value serving as an index of evaluation of a prediction result by the failure prediction means based on a value weighted by operation loss information.

本発明によれば、さらに、事業システムにおける障害の発生を予測する障害予測手段による予測結果を評価する装置に搭載されたコンピュータを機能させるプログラムであって、
当該障害予測手段による予測結果としての複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得する予測結果取得手段と、
当該正解障害種別毎に、当該予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストを含む運用損失に係る情報である運用損失情報を取得する運用損失取得手段と、
当該正解障害種別と当該予測障害種別との組毎に、1つの予測障害種別における当該正解障害種別毎に、又は1つの正解障害種別における当該予測障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該障害予測手段による予測結果の評価の指標となる評価値を算出する評価値算出手段と
してコンピュータを機能させる障害予測評価プログラムが提供される。
According to the present invention, there is further provided a program for causing a computer mounted on a device for evaluating the prediction result by the failure prediction means for predicting the occurrence of a failure in a business system to function.
For each of a plurality of failure types as prediction results by the failure prediction means, the number of times the failure type is actually predicted as a predicted failure type for each correct failure type that is a failure type that was correct when predicted Forecasting result acquiring means for acquiring such prediction frequency information;
Acquisition of operation loss, which is information related to operation loss including the operation cost that occurs when each correct failure type is dealt with or left according to the content of the predicted failure type for each of the predicted failure types Means,
The prediction frequency information corresponding to each pair of the correct failure type and the predicted failure type, for each correct error type in one predicted failure type, or for each predicted failure type in one correct error type There is provided a failure prediction and evaluation program that causes a computer to function as an evaluation value calculation unit that calculates an evaluation value that is an index of evaluation of a prediction result by the failure prediction unit based on a value weighted by operation loss information.

本発明によれば、さらにまた、事業システムにおける障害の発生を予測する障害予測手段による予測結果を評価する方法であって、
当該障害予測手段による予測結果としての複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得するステップと、
当該正解障害種別毎に、当該予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストを含む運用損失に係る情報である運用損失情報を取得するステップと、
当該正解障害種別と当該予測障害種別との組毎に、1つの予測障害種別における当該正解障害種別毎に、又は1つの正解障害種別における当該予測障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該障害予測手段による予測結果の評価の指標となる評価値を算出するステップと
を有する障害予測評価方法が提供される。
According to the present invention, there is further provided a method of evaluating the prediction result by the failure prediction means for predicting the occurrence of a failure in a business system,
For each of a plurality of failure types as prediction results by the failure prediction means, the number of times the failure type is actually predicted as a predicted failure type for each correct failure type that is a failure type that was correct when predicted Acquiring such prediction number information;
Acquiring operation loss information, which is information relating to operation losses including operation costs generated when taking measures or leaving according to the contents of the predicted failure type for each of the correct failure types,
The prediction frequency information corresponding to each pair of the correct failure type and the predicted failure type, for each correct error type in one predicted failure type, or for each predicted failure type in one correct error type There is provided a failure prediction evaluation method comprising the steps of: calculating an evaluation value serving as an index of evaluation of a prediction result by the failure prediction means based on a value weighted by operation loss information.

本発明の障害予測評価装置、システム、プログラム及び方法によれば、事業システムの運用損失をも考慮して、障害発生の予測結果を評価することができる。   According to the failure prediction and evaluation apparatus, system, program, and method of the present invention, it is possible to evaluate the prediction result of failure occurrence taking into consideration the operation loss of the business system.

本発明による障害予測評価装置を含む障害予測評価システムの一実施形態を示す模式図である。FIG. 1 is a schematic view showing an embodiment of a failure prediction and evaluation system including a failure prediction and evaluation device according to the present invention. 障害予測装置の動作フェーズを概略的に説明するための模式図である。It is a schematic diagram for demonstrating roughly the operation | movement phase of a failure prediction apparatus. 本発明による障害予測評価装置の一実施形態における機能構成を示す機能ブロック図である。It is a functional block diagram which shows the function structure in one Embodiment of the failure prediction evaluation apparatus by this invention. 障害種別テーブルの一実施形態を示すテーブル図である。It is a table figure showing one embodiment of a fault classification table. 運用コストテーブルの一実施形態を示すテーブル図である。It is a table figure showing one embodiment of an operation cost table. 本発明による障害予測評価処理の一実施例を説明するためのテーブル図である。It is a table figure for describing one Example of the failure prediction evaluation process by this invention. 本発明による障害予測評価処理の一実施例を説明するためのテーブル図である。It is a table figure for describing one Example of the failure prediction evaluation process by this invention. 本発明による障害予測評価処理の一実施例を説明するためのテーブル図である。It is a table figure for describing one Example of the failure prediction evaluation process by this invention.

以下、本発明の実施形態について、図面を用いて詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

[障害予測評価システム]
図1は、本発明による障害予測評価装置を含む障害予測評価システムの一実施形態を示す模式図である。
Failure prediction and evaluation system
FIG. 1 is a schematic view showing an embodiment of a failure prediction and evaluation system including a failure prediction and evaluation device according to the present invention.

図1において、本実施形態の障害予測評価システムは、
(a)事業システムとしての通信ネットワーク(NW)システム3における障害の発生を予測する障害予測手段としての障害予測装置2と、
(b)障害予測装置2から出力される予測結果を評価する障害予測評価装置1と
を備えている。
In FIG. 1, the failure prediction and evaluation system of this embodiment is
(A) Failure prediction device 2 as failure prediction means for predicting the occurrence of a failure in a communication network (NW) system 3 as a business system;
(B) A failure prediction and evaluation device 1 for evaluating the prediction result output from the failure prediction device 2 is provided.

通信NWシステム3は、事業者通信網であり、例えば、携帯電話通信網であるLTE(Long Term Evolution)やWiMAX(Worldwide Interoperability for Microwave Access)等の無線系アクセスネットワークであってもよく、光ファイバ網等の固定系アクセスネットワークであってもよい。通信NWシステム3は、複数の通信設備31を備えており、さらに、ネットワークの状態を監視する監視設備32を備えていてもよい。監視設備32は、通信NWシステム3における様々な測定項目データや各種のアラームを通信設備31等から受信し、取りまとめて障害予測装置2に送信する。   The communication NW system 3 is a carrier communication network, and may be, for example, a wireless access network such as LTE (Long Term Evolution) or WiMAX (Worldwide Interoperability for Microwave Access), which is a mobile communication network, or an optical fiber It may be a fixed access network such as a network. The communication NW system 3 includes a plurality of communication facilities 31, and may further include a monitoring facility 32 that monitors the state of the network. The monitoring equipment 32 receives various measurement item data and various alarms in the communication NW system 3 from the communication equipment 31 etc., and collects them and transmits them to the failure prediction device 2.

障害予測装置2は、監視設備32や通信設備31から、通信NWシステム3における測定項目データやアラームを受信し、受信したこれらのデータに基づいて、通信NWシステム3における障害の発生の予測結果を生成し出力する。ここで、アラームは、通信NWシステム3の動作・運用における異常や不具合等に係る情報であり、例えば、NWリンクダウンエラーの情報や、信号同期処理エラーの情報等が挙げられる。   The failure prediction device 2 receives measurement item data and alarms in the communication NW system 3 from the monitoring equipment 32 and the communication equipment 31, and predicts the occurrence of a failure in the communication NW system 3 based on the received data. Generate and output. Here, the alarm is information related to an abnormality or a defect in the operation / operation of the communication NW system 3, and examples thereof include information on an NW link down error and information on a signal synchronization processing error.

また、本実施形態において、障害予測装置2による予測結果は、予測される障害の種類である障害種別となる。障害種別としては、例えば、「対処が不要な障害」、「遠隔リセットが必要な障害」、「現地対応が必要な障害」、「設備交換が必要な障害」等が挙げられる。ここで、例えば、交換対象となり得る通信設備31が複数存在する場合、障害種別として、「設備Aの交換が必要な障害」、「設備Bの交換が必要な障害」、「設備A及び設備Cの交換が必要な障害」等、設備毎又は設備の組毎の種別が挙げられることも好ましい。   Further, in the present embodiment, the prediction result by the failure prediction device 2 is a failure type that is the type of failure to be predicted. As failure types, for example, there may be mentioned “a failure requiring no coping”, “a failure requiring a remote reset”, “a failure requiring on-site handling”, “a failure requiring equipment replacement” and the like. Here, for example, when there are a plurality of communication facilities 31 that can be replaced, “fault requiring replacement of facility A”, “fault requiring replacement of facility B”, “facility A and facility C” as failure types. It is also preferable that the type of each equipment or each set of equipment is listed, such as “failure requiring replacement”.

さらに、例えば、通信NWシステム3において障害時に対応の必要となる現地が複数存在する場合、障害種別として、「現地Dへの対応が必要な障害」、「現地Eへの対応が必要な障害」、「現地D及び現地Fへの対応が必要な障害」等、現地毎又は現地の組毎の種別が挙げられることも好ましい。   Furthermore, for example, when there are a plurality of locations where communication in response to a failure is required in the communication NW system 3, as the failure type, "a failure requiring a response to D" or "a failure requiring a response to E" It is also preferable that the type of each field or each group of fields be listed, such as “a failure requiring a response to the field D and the field F”.

次いで、障害予測評価装置1は、障害予測装置2から、予測結果としての障害種別を受信する。ここで、障害予測評価装置1と障害予測装置2とは、有線又は無線のネットワークで、又は事象者通信網及びインターネットを介して通信接続されている。また、変更態様として、障害予測評価装置1と障害予測装置2とが、1つの装置に組み込まれていてもよい。   Next, the failure prediction and evaluation device 1 receives the failure type as the prediction result from the failure prediction device 2. Here, the failure prediction and evaluation device 1 and the failure prediction device 2 are communicably connected by a wired or wireless network or via an event person communication network and the Internet. Further, as a modification, the failure prediction evaluation device 1 and the failure prediction device 2 may be incorporated in one device.

さらに、障害予測評価装置1は、1つの障害種別を取得した際、実際に正解であった障害種別である正解障害種別の情報も取得する。この正解障害種別は、例えば、事業者(NW運用者)が、通信NWシステム3における障害発生の実際の状況を、障害予測発生毎に又は対処を実施した後に調査して取りまとめ、記録しておくことによって取得することができる。また、この正解障害種別として、後に図2(A)で示す障害予測装置2の学習フェーズで使用される教師データとしての正解障害種別を用いてもよい。   Furthermore, when one failure type is acquired, the failure prediction and evaluation device 1 also acquires information on a correct failure type that is a failure type that was actually the correct answer. The correct failure type is, for example, a business operator (NW operator) investigates the actual situation of failure occurrence in the communication NW system 3 for each failure prediction occurrence or after performing a countermeasure and collects and records Can be obtained by Further, as this correct answer failure type, the correct answer failure type as teacher data to be used later in the learning phase of the failure prediction device 2 shown in FIG. 2 (A) may be used.

障害予測評価装置1は、さらに、
(A)予測結果としての複数の障害種別の各々について、予測した際の正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る「予測回数情報」を取得し、
(B)正解障害種別毎に、予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストを含む運用損失に係る情報である「運用損失情報」を取得し、
(C)正解障害種別と予測障害種別との組毎に、対応する「予測回数情報」を「運用損失情報」によって重み付けした値に基づいて、障害予測装置2による予測結果の評価の指標となる「評価値」を算出する。
The failure prediction and evaluation apparatus 1 further
(A) For each of the plurality of failure types as the prediction result, “predicted number information” is acquired for the number of times the failure type is actually predicted as the predicted failure type, for each correct error type when predicted.
(B) For each correct failure type, for each of the predicted failure types, obtain “operation loss information” that is information related to the operation loss including the operation cost that occurs when handling or leaving according to the content of the predicted failure type ,
(C) For each set of the correct failure type and the predicted failure type, based on the value obtained by weighting the corresponding “predicted number of times information” by the “operation loss information”, it becomes an index of evaluation of the prediction result by the failure prediction device 2 Calculate the "evaluation value".

ここで、上記(B)における「運用損失情報」は、
(B1)障害予測のない場合に必要となる運用コストと比較した運用コスト(例えば金額)の増減分、
(B2)障害予測が外れる又は当たることによって生じるサービスの向上又は劣化の度合い、又は
(B3)障害予測のない場合に必要となる障害復旧のための時間と比較した障害復旧時間の増減分
とすることができる。さらには、上記(B1)〜(B3)から選択された2つ又は上記(B1)〜(B3)の全部を「運用損失情報」とすることも可能である。
Here, the “operation loss information” in the above (B) is
(B1) An increase or decrease in the operation cost (for example, the amount of money) compared to the operation cost required when there is no failure prediction
(B2) Degree of improvement or deterioration of service caused by failure or failure of failure prediction, or (B3) increase or decrease failure recovery time as compared with time for failure recovery required without failure prediction be able to. Furthermore, it is also possible to make all of two selected from the above (B1) to (B3) or all of the above (B1) to (B3) as "operation loss information".

このように、障害予測評価装置1によれば、通信NWシステム3に対する実際の運用に係る情報をも考慮して、障害予測装置2による予測結果を評価することができる。即ち、事業システムの運用における、障害予測による現実的なメリット・デメリットを評価することが可能となるのである。   As described above, according to the failure prediction and evaluation device 1, it is possible to evaluate the prediction result by the failure prediction device 2 also in consideration of the information related to the actual operation of the communication NW system 3. That is, it becomes possible to evaluate the practical merits and demerits of failure prediction in the operation of the business system.

また、このような運用損失を考慮した予測結果の評価を行うことによって、後述するように、予測結果に従い運用対処を実施した又は放置した場合に発生する運用コスト(金額)を算出することもできる。さらに、この算出された運用コストを評価指標として、障害予測装置2を評価することも可能となる。即ち、運用コストの観点から最適な障害予測装置(システム)を決定することもできるのである。さらにまた、予測結果毎の運用コスト面での重要度を考慮して障害予測装置(システム)を評価することも可能となる。   In addition, by evaluating the prediction result in consideration of such an operation loss, as described later, it is possible to calculate the operation cost (amount of money) generated when the operation countermeasure is performed or left according to the prediction result. . Furthermore, the failure prediction device 2 can also be evaluated using this calculated operation cost as an evaluation index. That is, it is also possible to determine an optimal failure prediction device (system) from the viewpoint of the operation cost. Furthermore, it is also possible to evaluate the failure prediction device (system) in consideration of the degree of importance in terms of operation costs for each prediction result.

尚、上記(C)の「評価値」の算出においては、対応する「予測回数情報」を「運用損失情報」によって重み付けするのは、
(C1)正解障害種別と予測障害種別との組毎に
行われる以外にも、
(C2)1つの予測障害種別における正解障害種別毎に、又は
(C3)1つの正解障害種別における予測障害種別毎に
行われてもよい。(C1)〜(C3)の場合、後に詳述するように、それぞれAccuracy、Precision及びRecallに対応した評価値が算出される。このように、障害予測評価装置1によれば、所望の評価基準に対応した「評価値」を算出することも可能となるのである。
In the calculation of the "evaluation value" in (C) above, the corresponding "predicted number of times information" is weighted by the "operation loss information".
(C1) Besides being performed for each pair of the correct failure type and the predicted failure type,
(C2) It may be performed for each correct failure type in one predicted failure type, or (C3) for each predicted failure type in one correct error type. In the case of (C1) to (C3), evaluation values corresponding to Accuracy, Precision, and Recall are calculated, as described in detail later. As described above, according to the failure prediction and evaluation apparatus 1, it is also possible to calculate an "evaluation value" corresponding to a desired evaluation standard.

[障害予測装置]
図2は、障害予測装置2の動作フェーズを概略的に説明するための模式図である。障害予測装置2における動作フェーズとして、「動作フェーズ」、「学習器評価フェーズ」及び「予測フェーズ」が挙げられる。
Failure prediction device
FIG. 2 is a schematic diagram for schematically explaining the operation phase of the failure prediction device 2. The operation phase in the failure prediction device 2 includes an “operation phase”, a “learning device evaluation phase”, and a “prediction phase”.

図2(A)によれば、障害予測装置2の学習フェーズでは、
(a)過去に又は現時点で収集した通信設備31等から発生したアラームと、
(b)当該アラーム発生の際に実際に生じていた障害の種類である正解障害種別と
を教師データセットとし、上記(a)に係るアラーム群から生成された複数の教師データセットを障害予測装置2に入力して、機械学習の学習器を構築する。
According to FIG. 2A, in the learning phase of the failure prediction device 2,
(A) Alarms generated from communication equipment 31 etc. collected in the past or at the present time,
(B) A correct failure type, which is the type of failure that actually occurred when the alarm is generated, is used as a teacher data set, and a plurality of teacher data sets generated from the alarm group according to (a) are failure prediction devices Input 2 to build a machine learning machine.

ここで、構築される学習器は、学習方法(機械学習の種類、機械学習のパラメータ、教師データセットの形式等)により異なる。機械学習の種類としては、ナイーブベイズ、サポートベクタマシン(SVM)、又は決定木といった、教師有り学習を行うものならば種々のアルゴリズムが採用可能である。   Here, the learning device to be constructed differs depending on the learning method (type of machine learning, parameters of machine learning, format of teacher data set, etc.). As a type of machine learning, various algorithms such as naive Bayesian, support vector machine (SVM), or decision tree may be adopted as long as they perform supervised learning.

次いで、図2(B)によれば、学習器評価フェーズでは、構築した学習器に対し、学習フェーズで教師データとして使用したアラーム群を入力し、試験的に、入力したアラーム毎の予測結果(障害種別)を出力させる。次に、出力された予測結果を、学習フェーズで教師データとして使用した障害種別データと比較し、例えば両者の一致率を算出して、構築した学習器の予測性能を評価する。ここで、評価結果が良くない場合(例えば一致率が所定の値を下回る場合)、学習器を再構築することも好ましい。   Next, according to FIG. 2 (B), in the learning device evaluation phase, the alarm group used as teacher data in the learning phase is input to the constructed learning device, and the prediction result for each input alarm is experimentally input ( Output failure type). Next, the output prediction result is compared with failure type data used as teacher data in the learning phase, and for example, the matching rate between the two is calculated to evaluate the prediction performance of the constructed learning device. Here, when the evaluation result is not good (for example, when the matching rate is less than a predetermined value), it is also preferable to reconstruct the learning device.

さらに、図2(C)によれば、予測フェーズでは、学習器評価フェーズでの処理を経た学習器に対し、予測対象のアラーム(群)を入力し、予測結果としての障害種別を出力させる。   Furthermore, according to FIG. 2C, in the prediction phase, the alarm (group) to be predicted is input to the learning device that has undergone the processing in the learning device evaluation phase, and the failure type as the prediction result is output.

以上説明したように、障害予測評価装置1によって取得される障害予測装置2からの予測結果は、障害予測装置2が、通信設備31や監視設備32等から収集されるネットワークに係るアラーム情報と、正解障害種別とを教師データセットとして学習させて構築した学習器に対し、予測対象であるアラーム情報を入力することによって出力した予測結果となっている。   As described above, the prediction result from the failure prediction device 2 acquired by the failure prediction evaluation device 1 is alarm information related to a network in which the failure prediction device 2 is collected from the communication facility 31, the monitoring facility 32, etc. It is the prediction result output by inputting the alarm information which is the prediction target to the learning device which is constructed by learning the correctness type and the failure type as the teacher data set.

[障害予測評価装置]
図3は、本発明による障害予測評価装置の一実施形態における機能構成を示す機能ブロック図である。
[Failure prediction and evaluation system]
FIG. 3 is a functional block diagram showing a functional configuration in an embodiment of a failure prediction and evaluation apparatus according to the present invention.

図3によれば、障害予測評価装置1は、通信インタフェース部101と、予測結果蓄積部102と、運用コスト蓄積部103と、評価結果蓄積部104と、プロセッサ・メモリとを有する。ここで、プロセッサ・メモリは、障害予測評価装置1に搭載されたコンピュータを機能させるプログラムを実行することによって、障害予測装置2による予測結果の有効性を評価する機能を実現させる。   According to FIG. 3, the failure prediction and evaluation apparatus 1 has a communication interface unit 101, a prediction result storage unit 102, an operation cost storage unit 103, an evaluation result storage unit 104, and a processor memory. Here, the processor memory implements a function of evaluating the effectiveness of the prediction result by the failure prediction device 2 by executing a program that causes a computer installed in the failure prediction evaluation device 1 to function.

また、プロセッサ・メモリは、予測結果取得部111と、運用損失取得手段としての運用コスト取得部112と、評価値算出部113と、通信制御部121とを有する。ここで、運用コスト取得部112は、設備交換コスト算定部112aと、現地出動コスト算定部112bとを有する。さらに、評価値算出部113は、アキュラシ対応評価値算出部113aと、プレシジョン対応評価値算出部113bと、リコール対応評価値算出部113cとを有する。尚、図3における各機能構成部を矢印で接続した処理の流れは、本発明による障害予測評価方法の一実施形態としても理解される。   The processor memory also includes a prediction result acquisition unit 111, an operation cost acquisition unit 112 as an operation loss acquisition unit, an evaluation value calculation unit 113, and a communication control unit 121. Here, the operation cost acquisition unit 112 includes a facility replacement cost calculation unit 112 a and a local dispatch cost calculation unit 112 b. Furthermore, the evaluation value calculation unit 113 includes an accuracy correspondence evaluation value calculation unit 113a, a precision correspondence evaluation value calculation unit 113b, and a recall correspondence evaluation value calculation unit 113c. The flow of processing in which each functional component in FIG. 3 is connected by an arrow is also understood as one embodiment of the failure prediction evaluation method according to the present invention.

通信インタフェース部101は、障害予測装置2から、
(a)予測結果としての障害種別の情報と、当該予測結果の出力の際に正解であった障害種別の情報とを受信し、また、
(b)後述する評価値算出部113で算出された評価値を含む評価結果を、外部の通知先、例えば通信NWシステム3を管理する事業者の情報処理装置宛てに送信する。
The communication interface unit 101 receives
(A) receiving information on a failure type as a prediction result and information on a failure type that was correct when outputting the prediction result;
(B) The evaluation result including the evaluation value calculated by the evaluation value calculation unit 113 described later is transmitted to an external notification destination, for example, an information processing apparatus of a provider who manages the communication NW system 3.

通信制御部121は、通信インタフェース部101を介して受信した予測障害種別情報及び正解障害種別情報を予測結果取得部111に出力し、一方、予測障害種別及び正解障害種別として挙げられている障害種別が何であるかの情報を運用コスト取得部112に出力する。また、後述する評価値算出部113で算出された評価値を含む評価結果を外部に送信すべく通信インタフェース部101に出力する。   The communication control unit 121 outputs the predicted failure type information and the correct failure type information received via the communication interface unit 101 to the prediction result acquisition unit 111, while the failure types listed as the predicted failure type and the correct failure type. Is output to the operation cost acquisition unit 112. Further, it outputs the evaluation result including the evaluation value calculated by the evaluation value calculation unit 113 described later to the communication interface unit 101 so as to be transmitted to the outside.

予測結果取得部111は、障害予測装置2による予測結果としての複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得し、障害種別テーブル111tを生成する。生成された障害種別テーブル111tは、予測結果蓄積部102に蓄積されることも好ましい。   The prediction result acquisition unit 111 actually predicts the failure of the failure type for each correct failure type that is the failure type that was correct when the prediction was made for each of the plurality of failure types as the prediction result by the failure prediction device 2 Information on the number of times of prediction associated with the number of times predicted as a type is acquired, and a failure type table 111t is generated. It is also preferable that the generated failure type table 111 t be accumulated in the prediction result accumulation unit 102.

尚、予測結果取得部111は、予測障害種別に対応した正解障害種別情報を、装置1に設けられた(図示していない)入力インタフェース、例えばタッチパネルやキーボードを介した評価者による入力によって取得してもよい。   The prediction result acquisition unit 111 acquires correct failure type information corresponding to the predicted failure type by an input by an evaluator (not shown) provided on the device 1, for example, a touch panel or a keyboard. May be

図4は、障害種別テーブル111tの一実施形態を示すテーブル図である。   FIG. 4 is a table diagram showing an embodiment of the failure type table 111t.

図4によれば、障害種別テーブル111tにおいては、障害予測装置2から取得した予測結果としてのN個の予測障害種別が列項目として並び、予測時での実際の障害種別であるN個の正解障害種別が行項目として並んでいる。並べられた予測障害種別及び正解障害種別の各々には、「対処不要の障害」、「遠隔リセットが必要な障害」、「現地対応が必要な障害」及び「設備の交換(又は修理)が必要な障害」が含まれている。   According to FIG. 4, in the failure type table 111 t, N predicted failure types as prediction results acquired from the failure prediction device 2 are arranged as column items, and N correct answers that are actual failure types at the time of prediction Failure types are arranged as line items. For each of the predicted failure type and the correct error type listed, "Correction-unnecessary failure", "Failure requiring remote reset", "Failure requiring local response", and "Replacement of equipment (or repair)" are required. Failure is included.

また、テーブル111tの各欄におけるデータxij(i=1, 2, ・・・, N、j=1, 2, ・・・, N)は、当該欄の行項目及び列項目に対応する事態の発生した件数を示す。例えば、テーブル111tのA欄は、「設備交換が必要な障害」であると予測されたが、正解は「対処不要の障害」であったという予測失敗の事態に対応しており、A欄の値x1Nは、このような予測失敗事態の発生した件数を示す。一方、テーブル111tのB欄は、予測された「設備交換が必要な障害」が実際に正解であったという予測成功の事態に対応しており、B欄の値xNNは、このような予測成功事態の発生した件数を示す。 Also, the data x ij (i = 1, 2,..., N, j = 1, 2,..., N) in each column of the table 111t correspond to the row items and column items of the column. Indicates the number of occurrences of For example, column A of table 111t is predicted to be "a failure that requires equipment replacement", but corresponds to a situation in which the correct answer is "a failure that requires no action" and failure to cope with. The value x 1 N indicates the number of occurrences of such a forecast failure situation. On the other hand, the B column in the table 111t corresponds to the predicted success that the predicted “fault requiring replacement of equipment” was actually correct, and the value x NN in the B column is such a prediction Indicates the number of successful events that occurred.

尚、予測障害種別及び正解障害種別は、テーブル111tに並べられたものに限定されない。予測障害種別及び正解障害種別が各々、「対処不要の障害」、「遠隔リセットが必要な障害」、「現地対応が必要な障害」及び「設備の交換(又は修理)が必要な障害」のうち少なくとも1つを含む形態であってもよく、また、上述したように設備毎若しくは設備の組毎の障害種別、又は現地毎若しくは現地の組毎の障害種別が個別に採用されることも好ましい。
The predicted failure type and the correct failure type are not limited to those listed in the table 111t. The predicted failure type and the correct failure type are respectively "action-free failure", "remote-reset required failure", "local-needed failure" and "equipment required replacement (or repair) failure" It may be in a form including at least one, and as described above, it is also preferable that failure types for each facility or set of facilities, or fields or types of faults for each site are individually adopted.

また、テーブル111tの各欄におけるデータxijの単位は、件数でなく、例えばテーブル111t内における件数の割合であってもよい。但し、この単位を件数としておくことによって、後に算出する評価値を、例えば運用コスト額(金額)とし、意味を解釈し易い値とすることができる。 Further, the unit of the data x ij in each column of the table 111t may not be the number, but may be, for example, a ratio of the number in the table 111t. However, by setting this unit as the number of cases, it is possible to set an evaluation value to be calculated later as, for example, the operation cost amount (amount of money) and to make the meaning easy to interpret.

図3に戻って、運用コスト取得部112は、正解障害種別毎に、予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストに係る情報である運用コスト情報を取得し、運用コストテーブル112tを生成する。生成された運用コストテーブル112tは、運用コスト蓄積部103に蓄積されることも好ましい。   Returning to FIG. 3, the operation cost acquisition unit 112 is an operation cost that is information relating to an operation cost that occurs when each correct failure type is dealt with or left according to the content of the predicted failure type for each of the predicted failure types. Information is acquired, and the operation cost table 112t is generated. It is also preferable that the generated operation cost table 112 t be accumulated in the operation cost accumulation unit 103.

ここで、本実施形態では、障害種別テーブル111t(図4)において、設備の交換(又は修理)が必要な障害である旨の障害種別、及び設備の交換(又は修理)が不要な障害である旨の障害種別が、予測障害種別及び正解障害種別に挙げられており、これらに対応する予測回数情報が取得されている。このような実施形態において、運用コスト取得部112は、設備交換コスト算定部112aを有することも好ましい。   Here, in the present embodiment, in the failure type table 111t (FIG. 4), a failure type to the effect that the replacement (or repair) of the equipment is necessary and a failure that the replacement (or repair) of the equipment is unnecessary The failure types of the subject are listed as the predicted failure type and the correct failure type, and prediction frequency information corresponding to these is acquired. In such an embodiment, it is preferable that the operation cost acquisition unit 112 also have a facility replacement cost calculation unit 112 a.

この設備交換コスト算定部112aは、設備の交換(又は修理)が不要な障害である旨の正解予測種別と、設備の交換(又は修理)が必要な障害である旨の予測障害種別とに対応する運用コスト情報として、当該設備の交換(又は修理)に係るコスト分が加算された値(例えば金額)を採用する。   The equipment replacement cost calculation unit 112a copes with the correctness prediction type that the equipment replacement (or repair) is unnecessary and the prediction failure type that the equipment replacement (or repair) is necessary. A value (for example, the amount of money) to which the cost amount related to the replacement (or repair) of the facility is added is adopted as the operation cost information to be performed.

さらに、本実施形態では、障害種別テーブル111t(図4)において、現地での対応が必要な障害である旨の障害種別、及び現地での対応が不要な障害である旨の障害種別が、予測障害種別及び正解障害種別に挙げられており、これらに対応する予測回数情報が取得されている。このような実施形態において、運用コスト取得部112は、現地出動コスト算定部112bを有することも好ましい。   Furthermore, in the present embodiment, in the failure type table 111t (FIG. 4), the failure type to the effect that the on-site response is required and the failure type to the on-site response are unnecessary. The failure type and the correct failure type are listed, and prediction number information corresponding to these is acquired. In such an embodiment, the operation cost acquisition unit 112 preferably includes the on-site dispatch cost calculation unit 112 b.

この現地出動コスト算定部112bは、現地での対応が不要な障害である旨の正解予測種別と、現地での対応が必要な障害である旨の予測障害種別とに対応する運用コスト情報として、当該現地への出動コスト分が加算された値(例えば金額)を採用する。   The on-site dispatch cost calculation unit 112 b operates as operation cost information corresponding to the correct answer prediction type indicating that the on-site response is unnecessary and the predicted failure type indicating that the on-site response is necessary. The value (for example, the amount of money) to which the dispatch cost for the field concerned is added is adopted.

図5は、運用コストテーブル112tの一実施形態を示すテーブル図である。   FIG. 5 is a table diagram showing an embodiment of the operation cost table 112t.

図5によれば、運用コストテーブル112tにおいては、列項目及び行項目として、それぞれ障害種別テーブル111t(図4)と同一のN個の予測障害種別及びN個の正解障害種別が並んでいる。   According to FIG. 5, in the operation cost table 112t, N predicted failure types and N correct failure types identical to the failure type table 111t (FIG. 4) are arranged as column items and row items.

また、テーブル112t内の各欄におけるデータyij(i=1, 2, ・・・, N、j=1, 2, ・・・, N)は、当該欄の行項目及び列項目に対応する運用コストの増減分(例えば金額)を示す。 Also, data y ij (i = 1, 2,..., N, j = 1, 2,..., N) in each column in the table 112t correspond to the row item and the column item of the column. Indicates the increase or decrease (for example, the amount of money) of the operation cost.

例えば、テーブル112tのC欄は、「設備交換が必要な障害」であると予測されたが、正解は「対処不要の障害」であったという予測失敗の事態に対応しており、C欄の値y1Nは、この誤った予測結果に従って本来は不要な設備交換を実施してしまうことによる運用コストの増加分(正の金額値)を示す。一方、テーブル112tのD欄は、予測された「設備交換が必要な障害」が実際に正解であったという予測成功の事態に対応しており、D欄の値yNNは、この正しい予測結果に従って必要な設備交換を実施することによる本来必要な運用コストの削減分(予測結果を得ていない状況で設備交換が必要であると判断するまでの調査費用分等)を示す。この場合、yNNは削減分として負の金額値となる。 For example, column C of table 112t is predicted to be "a failure that requires equipment replacement", but corresponds to a situation in which the correct answer is "a failure requiring no action", and it corresponds to a situation in which failure occurs. The value y 1 N indicates an increase (a positive monetary value) in the operation cost due to the originally unnecessary equipment replacement being performed in accordance with this erroneous prediction result. On the other hand, the D column in the table 112t corresponds to the predicted success that the predicted “fault requiring replacement of equipment” was actually correct, and the value y NN in the D column is the correct prediction result. Indicates the reduction of the operation cost originally necessary due to performing the necessary equipment replacement according to the above (for example, the investigation cost until it is judged that the equipment replacement is necessary in the situation where the prediction result is not obtained). In this case, y NN is a negative amount as a reduction.

このように、運用コスト(運用損失)情報は、対応する正解障害種別及び予測障害種別が一致する場合に負値(又はゼロ)をとり、一致しない場合に正値又(はゼロ)をとるように設定される。これにより、後に導出される評価値に対し、予測結果の有効性を評価する値としての方向性をつけることができる。   Thus, the operation cost (operation loss) information takes a negative value (or zero) if the corresponding correct failure type and the predicted failure type match, and takes a positive value or (zero) if they do not match. Set to As a result, it is possible to give direction as a value for evaluating the effectiveness of the prediction result to the evaluation value derived later.

尚、本実施形態では、各予測結果に従い対応する対処を実施した(又は対応する放置処置をとった)場合に、本来必要となる運用コストと比較して、運用コストがどれだけ増大するか又は削減されるかの金額(yij)を予め見積もっておくことを前提とする。運用コスト増減分yijの決定方法として、例えば、以下の見積り方が採用可能である。
(a)正しい対処のみを実施した場合に省けた工数に基づく対処コストの低減分。
(b)誤って設備交換を実施した場合の、設備の値段及び設置費用に基づく設備コスト。
(c)誤って設備をベンダへ修理に出した場合の、ベンダとの契約に基づく修理コスト。
(d)誤って現地作業を実施した場合の、現地までの距離、赴く人数、作業量及び時間帯に基づく出動コスト。
(e)誤って必要な対処を省いた場合の、サービス影響時間及び影響人数に基づく損失コスト。
In the present embodiment, in the case where the corresponding measures are taken (or the corresponding neglected measures are taken) according to each prediction result, how much the operation cost increases as compared with the operation cost originally required, or It is assumed that the amount of money to be reduced (yij) is estimated in advance. For example, the following estimation method can be adopted as a method of determining the operation cost increase / decrease amount yij.
(A) Reduction in cost of handling based on man-hours saved when only correct handling is implemented.
(B) Facility cost based on the price of the facility and the installation cost when the facility replacement is performed accidentally.
(C) Repair cost based on the contract with the vendor when the facility is sent to the vendor for repair by mistake.
(D) Dispatch cost based on the distance to the site, the number of people, the amount of work, and the time zone, when the site work is performed by mistake.
(E) Loss costs based on service impact time and impact numbers if you have inadvertently omitted the necessary actions.

尚、運用コスト取得部112は、上記(a)〜(e)の情報を、装置1に設けられた(図示していない)入力インタフェース、例えばタッチパネルやキーボードを介した評価者による入力によって取得してもよい。   The operation cost acquisition unit 112 acquires the above information (a) to (e) by the input by the evaluator via an input interface (not shown) provided on the device 1, for example, a touch panel or a keyboard. May be

また、変更態様として、運用コストと共に又は運用コストに代わって、障害予測が外れる又は当たることによって生じるサービスの向上又は劣化の度合い、及び/又は障害予測のない場合に必要となる障害復旧のための時間と比較した障害復旧時間の増減分といった運用損失(運用リスク)を数値化、例えば金額化したものを用いて、運用コストテーブル112tと同様の形式の運用損失テーブルを生成し、予測結果の評価に使用することもできる。この場合、サービス品質や障害復旧時間をも考慮した障害予測結果の評価が可能となる。   In addition, as a modification, along with or instead of the operation cost, the degree of improvement or deterioration of service caused by failure or failure of failure prediction, and / or for failure recovery required when there is no failure prediction. Quantify operational loss (operational risk) such as increase or decrease in failure recovery time compared with time, for example, using monetary amount, generate operation loss table in the same format as the operation cost table 112t, and evaluate the prediction result It can also be used for In this case, it is possible to evaluate the failure prediction result in consideration of service quality and failure recovery time.

図3に戻って、評価値算出部113は、
(C1)正解障害種別と予測障害種別との組毎に、
(C2)1つの予測障害種別における正解障害種別毎に、又は
(C3)1つの正解障害種別における予測障害種別毎に
対応する予測回数情報を運用損失情報によって重み付けして加算した値に基づいて、障害予測装置2による予測結果の評価の指標となる評価値を算出する。尚、算出された評価値は、評価対象となった装置2の学習器に付与された識別子、又は評価対象となった装置2の学習器における学習方法(機械学習の種類、機械学習のパラメータ、教師データセットの形式等)毎に付与された識別子と対応付けて評価結果蓄積部104に保存されることも好ましい。
Returning to FIG. 3, the evaluation value calculation unit 113
(C1) For each pair of the correct failure type and the predicted failure type,
(C2) Based on a value obtained by weighting and adding prediction frequency information corresponding to each correct failure type in one predicted failure type or (C3) each predicted failure type in one correct error type with operation loss information, An evaluation value which is an index of evaluation of a prediction result by the failure prediction device 2 is calculated. The calculated evaluation value is an identifier given to the learning device of the device 2 to be evaluated, or a learning method in the learning device of the device 2 to be evaluated (type of machine learning, parameters of machine learning, It is also preferable to be stored in the evaluation result storage unit 104 in association with an identifier given for each format of the teacher data set and the like.

具体的に、評価値算出部113では、障害種別テーブル111t(図4)のデータxijと運用コストテーブル112t(図5)のデータyijとを組み合わせて評価値を算出する。 Specifically, the evaluation value calculation unit 113 calculates an evaluation value by combining the data y ij fault type table 111t data x ij and operational cost table 112t (FIG. 4) (Fig. 5).

ここで、評価値算出部113のアキュラシ対応評価値算出部113aは、上記(C1)の場合のAccuracy(アキュラシ)対応評価値Ea、即ち、
(2) Ea=Σi=1 NΣj=1 Nxijyij
を算出する。上式(2)において、Σi=1 Nはiについての1からNまでの総和であり、Σj=1 Nはjについての1からNまでの総和である。この評価値Eaは、障害種別テーブル111tにおいていわゆるAccuracyに対応する範囲を評価対象としたものであり、全ての予測結果に従って対応する対処を実施した(対応する放置処置をとった)場合に、本来必要となった運用コストと比較した際の運用コストの増大・削減分の総合計を示した値(金額)となる。
Here, the accuracy correspondence evaluation value calculation unit 113 a of the evaluation value calculation unit 113 is the Accuracy (accuracy) correspondence evaluation value E a in the case of the above (C 1), that is,
(2) E a = S i = 1 N S j = 1 N x ij y ij
Calculate In the above equation (2), i i = 1 N is the sum from 1 to N for i, and j j = 1 N is the sum from 1 to N for j. The evaluation value E a is the evaluation target of the range corresponding to the so-called Accuracy in the failure type table 111 t, and the corresponding countermeasure is performed according to all the prediction results (when the corresponding non-disposal treatment is taken), It is a value (amount of money) that indicates the total sum of the increase and decrease in the operation cost when compared with the originally required operation cost.

実際、運用コストの増減分yij(図5)は対応する当該正解障害種別及び当該予測障害種別が一致する場合に負値又はゼロをとり且つ一致しない場合に正値又はゼロをとるので、評価値Eaは、負値としての絶対値が大きいほど、障害予測装置2による予測結果の有効性がより高いとの評価を示すことになる。 In fact, the increase or decrease in the operation cost y ij (FIG. 5) takes a negative value or zero if the corresponding correct failure type and the predicted failure type match, and takes a positive value or zero if they do not match. The value E a indicates an evaluation that the effectiveness of the prediction result by the failure prediction device 2 is higher as the absolute value as the negative value is larger.

また、評価値算出部113のプレシジョン対応評価値算出部113bは、上記(C2)の場合のPrecision(プレシジョン)対応評価値Epj、即ち、
(3) Epj=Σi=1 Nxijyij
を算出する。上式(3)において、Σi=1 Nはiについての1からNまでの総和である。この評価値Epjは、障害種別テーブル111tにおいていわゆるPrecisionに対応する範囲を評価対象としたものであり、1つの予測結果に従って対応する対処を実施した(対応する放置処置をとった)場合に、本来必要となった運用コストと比較した際の運用コストの増大・削減分の合計を示した値(金額)となる。
Further, the precision corresponding evaluation value calculation unit 113 b of the evaluation value calculation unit 113 is a precision (precision) corresponding evaluation value E pj in the case of (C2), that is,
(3) E pj = Σ i = 1 N x ij y ij
Calculate In the above equation (3), i i = 1 N is the sum of 1 to N for i. The evaluation value E pj is evaluated for a range corresponding to so-called precision in the failure type table 111 t as an evaluation target, and when the corresponding countermeasure is performed according to one prediction result (the corresponding undiscarded treatment is taken), It is a value (amount of money) indicating the sum of the increase and decrease in the operation cost when compared with the originally required operation cost.

このプレシジョン対応評価値算出部113bによれば、例えば、「設備の交換(又は修理)が必要な障害」との予測障害種別に従って当該設備を交換(又は修理)した場合における、運用コストの増大・削減分の合計を示す評価値Epjが得られる。この場合、得られた評価値Epjの負値としての絶対値が大きいほど、「設備の交換(又は修理)が必要な障害」との予測結果における運用コストを考慮した有効性がより高いことになる。 According to the precision corresponding evaluation value calculation unit 113b, for example, the operation cost increases when the facility is replaced (or repaired) according to the predicted failure type of "a failure requiring replacement (or repair) of the facility". An evaluation value Epj indicating the sum of the reductions is obtained. In this case, the larger the absolute value of the obtained evaluation value E pj as a negative value, the higher the effectiveness in consideration of the operation cost in the prediction result of "a failure requiring equipment replacement (or repair)". become.

さらに、評価値算出部113のリコール対応評価値算出部113cは、上記(C3)の場合のRecall(リコール)対応評価値Er、即ち、
(4) Eri=Σj=1 Nxijyij
を算出する。上式(4)において、Σj=1 Nはjについての1からNまでの総和である。この評価値Eriは、障害種別テーブル111tにおいていわゆるRecallに対応する範囲を評価対象としたものであり、1つの正解予測結果がある状況で、予測結果に従って対応する対処を実施した(対応する放置処置をとった)場合に、本来必要となった運用コストと比較した際の運用コストの増大・削減分の合計を示した値(金額)となる。
Furthermore, the recall-response evaluation value calculation unit 113c of the evaluation value calculation unit 113 is a Recall-response evaluation value E r in the case of (C3), that is,
(4) E ri = Σ j = 1 N x ij y ij
Calculate In the above equation (4), j j = 1 N is the sum of 1 to N for j. The evaluation value E ri is a evaluation target of a range corresponding to so-called Recall in the failure type table 111t, and in a situation where there is one correct prediction result, the corresponding countermeasure is performed according to the prediction result In the case where the action is taken, this is a value (amount of money) indicating the total of the increase and decrease in the operation cost when compared with the operation cost originally required.

ここで、比較のため、非特許文献4に記載された従来の評価指標としてのAccuracy、Precision及びRecallを算出することを考える。これら従来の評価指標は、運用コストを何ら考慮せず、従って運用コストテーブル112t(図5)を用いることなく、障害種別テーブル111t(図4)のみで算出される。具体的に、Accuracyは、テーブル111tの対角成分が予測正解を示していることから、
(5) Accuracy=Σi=1 Nxii/Σi=1 NΣj=1 Nxij
との形で算出される。また、例えば、「設備交換が必要な障害」について着目すると、Precisionは、
(6) Precision=xNN/Σi=1 NxiN
となり、Recallは、
(7) Recall=xNN/Σj=1 NxNj
との形で算出される。
Here, for comparison, calculation of Accuracy, Precision and Recall as conventional evaluation indexes described in Non-Patent Document 4 will be considered. These conventional evaluation indexes are calculated only by the failure type table 111t (FIG. 4) without considering the operation cost at all and therefore without using the operation cost table 112t (FIG. 5). Specifically, Accuracy indicates that the diagonal component of the table 111t indicates the prediction correct solution.
(5) Accuracy = i i = 1 N x ii / i i = 1 N j j = 1 N x ij
Calculated in the form of Also, for example, when focusing on “failure requiring equipment replacement”, Precision
(6) Precision = x NN / i i = 1 N x iN
And Recall is
(7) Recall = x NN / j j = 1 N x Nj
Calculated in the form of

しかしながら、実際のNW運用では、障害種別毎に運用コスト面での重要度が異なる。このため、例えば1つの障害予測装置による予測結果のAccuracyが高いとしても、運用コストの観点から見ると、この障害予測装置又は予測結果は好適であるとは言えない場合が生じ得る。また、このことは上述したPrecisionやRecallによる評価にも当てはまる。   However, in the actual NW operation, the degree of importance in terms of operation cost differs depending on the type of failure. For this reason, even if, for example, the Accuracy of the prediction result by one failure prediction device is high, there are cases where this failure prediction device or the prediction result is not suitable from the viewpoint of the operation cost. This also applies to the above-mentioned evaluation by Precision and Recall.

これに対し、障害予測評価装置1では、取得された障害発生の予測結果に従って対応する運用対処を実施した(又は対応する放置処置をとった)場合に、本来必要となる運用コストと比較してどれだけ運用コストが発生するか又は削減されるかの情報を予め設定することによって、運用コストをも考慮した障害予測結果の有効性の評価を実施する。これにより、事業システムでの現状の障害予測における運用コスト面から見たメリット・デメリットを評価することも可能となるのである。以下、従来の評価指標と比較した、本発明による障害予測評価の効果について、実施例を用いて説明する。   On the other hand, in the failure prediction and evaluation device 1, when the corresponding operation measures are performed (or the corresponding left measures are taken) according to the obtained prediction result of the failure occurrence, compared with the operation cost originally required. By setting in advance information on how much the operation cost is incurred or reduced, the evaluation of the effectiveness of the failure prediction result is also performed in consideration of the operation cost. As a result, it becomes possible to evaluate the merits and demerits in terms of the operation cost in the present failure prediction in the business system. Hereinafter, the effect of the failure prediction evaluation according to the present invention in comparison with the conventional evaluation index will be described using an example.

[障害予測処理の実施例]
図6、図7及び図8は、本発明による障害予測評価処理の一実施例を説明するためのテーブル図である。
[Example of failure prediction processing]
FIG. 6, FIG. 7 and FIG. 8 are table diagrams for explaining an embodiment of failure prediction evaluation processing according to the present invention.

図6〜8に示した実施例においては、最初に、ある学習対象データに対し、学習方法α及び学習方法βの互いに異なる学習方法によって5種類の障害種別について学習を行い、それぞれの方法で学習器を構築した。次いで、構築した学習器のそれぞれに対し、同じ予測対象データを入力して予測処理を複数回実施した。図6に、学習方法αで構築した学習器による予測結果を、障害種別テーブルの形で示す。また、図7に、学習方法βで構築した学習器による予測結果を、同じく障害種別テーブルの形で示す。ここで、図6及び図7のテーブルにおける各欄の数値は、該当する回数(単位:回)となっている。また、いずれのテーブルにおいても、予測及び正解障害種別には、個別の設備についての障害種別である「設備Aの交換が必要な障害」及び「設備Bの交換が必要な障害」が挙げられている。   In the embodiments shown in FIGS. 6-8, first, learning is performed on five types of faults by different learning methods of the learning method α and the learning method β with respect to certain learning target data, and learning is performed using the respective methods. Built the vessel. Next, the same prediction target data was input to each of the constructed learning devices, and prediction processing was performed multiple times. FIG. 6 shows the prediction result by the learning device constructed by the learning method α in the form of a failure type table. Further, FIG. 7 also shows prediction results by the learning device constructed by the learning method β in the form of a failure type table. Here, the numerical values in each column in the tables of FIG. 6 and FIG. 7 are the corresponding number of times (unit: times). Also, in any of the tables, “prediction and correct answer failure type” includes “failure requiring replacement of facility A” and “failure requiring replacement of facility B,” which are failure types for individual facilities. There is.

さらに、図8に、本実施例の予測結果に従って対応する運用対処を実施した(対応する放置処置をとった)場合に、本来必要となる運用コストと比較してどれだけの運用コストが発生するか又は削減されるかをまとめたものを、運用コストテーブルの形で示す。ここで、図8のテーブルにおける各欄の数値は、該当する金額(単位:万円)となっている。   Further, in FIG. 8, when the corresponding operation measures are performed according to the predicted result of the present embodiment (corresponding left measures are taken), an operation cost is generated in comparison with the originally required operation cost. What is summarized or reduced is shown in the form of an operation cost table. Here, the numerical values in the respective columns in the table of FIG. 8 are the corresponding amounts (unit: 10,000 yen).

次いで、以上に示した障害種別テーブル(図6及び図7)及び運用コストテーブル(図8)の結果を用いて、学習方法α及びβのそれぞれに対する運用コストを考慮した評価値を、上式(2)を用いて導出した。また、比較のために従来の指標として学習方法α及びβのそれぞれに対するAccuracyを、上式(5)を用いて算出した。その結果、
学習方法αを用いた障害予測に対する評価として、
(8) Ea=−230(万円)
(9) Accuracy=0.805
が算出された。また、
学習方法βを用いた障害予測に対する評価として、
(10) Ea=−385(万円)
(11) Accuracy=0.791
が算出された。
Then, using the results of the failure type tables (FIGS. 6 and 7) and the operation cost table (FIG. 8) shown above, evaluation values taking into consideration the operation costs for each of the learning methods α and β It derived using 2). Further, for comparison, Accuracy for each of the learning methods α and β was calculated as the conventional index using the above equation (5). as a result,
As an evaluation for failure prediction using the learning method α,
(8) E a = −230 (10,000 yen)
(9) Accuracy = 0.805
Was calculated. Also,
As an evaluation for failure prediction using the learning method β
(10) E a = − 385 (10,000 yen)
(11) Accuracy = 0.791
Was calculated.

ここで、学習方法αと学習方法βとを比較すると、従来の評価指標であるAccuracyが高いのは学習方法αである。しかしながら、本実施例の評価値Eaをもって評価すると、実際、学習方法βにおいて運用コストの削減額がより大きくなることが分かる。従って、運用コストを考慮した場合、学習方法βを用いた障害予測の方がより優れていると評価される。 Here, when comparing the learning method α with the learning method β, it is the learning method α that the Accuracy, which is the conventional evaluation index, is high. However, when the evaluation value E a of the present embodiment is evaluated, it can be seen that, actually, the reduction amount of the operation cost becomes larger in the learning method β. Therefore, when the operation cost is taken into consideration, it is evaluated that the failure prediction using the learning method β is better.

以上、詳細に説明したように、本発明によれば、事業システムに対する実際の運用に係る情報をも考慮して、この事業スステムにおける障害予測装置による障害発生の予測結果の有効性を評価することができる。即ち、事業システムの運用における、障害予測による現実的なメリット・デメリットを評価することが可能となるのである。   As described above in detail, according to the present invention, the effectiveness of the prediction result of failure occurrence by the failure prediction device in this business system is also evaluated in consideration of the information related to the actual operation of the business system. Can. That is, it becomes possible to evaluate the practical merits and demerits of failure prediction in the operation of the business system.

また、この場合、障害予測装置において使用された機械学習の種類、当該機械学習におけるパラメータ、又は用いた教師データセットの形式等に対して、直接、障害予測における有効性を評価することも可能となる。例えば、現状の事業システムにおいて如何なる種類の機械学習アルゴリズムを用いるのが有効であるか、といった課題に対する解答を得ることもできるのである。   In this case, it is also possible to directly evaluate the effectiveness in failure prediction with respect to the type of machine learning used in the failure prediction device, the parameters in the machine learning, or the format of the teacher data set used. Become. For example, it is also possible to obtain an answer to the task, such as what kind of machine learning algorithm is effective to use in the current business system.

さらに、運用損失として運用コストを考慮した予測結果の評価を行うことによって、予測結果に従い運用対処を実施した又は放置した場合に発生する具体的な運用コスト(金額)を算出することも可能となる。この場合、運用コストの観点から、最適な障害予測装置(システム)を決定してもよい。また、予測結果毎の運用コスト面での重要度を考慮して障害予測装置(システム)を評価することも可能となる。   Furthermore, by evaluating the forecasted results taking into account the operation cost as the operation loss, it becomes possible to calculate the specific operation cost (amount of money) that occurs when the operation countermeasure is performed or left according to the forecasted result. . In this case, an optimal failure prediction apparatus (system) may be determined from the viewpoint of operation cost. In addition, it is also possible to evaluate the failure prediction device (system) in consideration of the degree of importance in terms of operation cost for each prediction result.

尚、本発明による障害予測評価の手法は、上述したような通信NWシステムだけではなく、発電・送電システムや、水道等の配給システム、さらには各種生産・製造プラント等様々な事業システムにおける障害予測に対して適用可能である。   In addition, the method of failure prediction evaluation according to the present invention is not only the communication NW system as described above, but failure prediction in various business systems such as power generation / transmission system, distribution system such as water service, and various production / manufacturing plants. Applicable to

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。   For the various embodiments of the present invention described above, various modifications, corrections and omissions of the scope of the technical idea and aspect of the present invention can be easily made by those skilled in the art. The above description is merely an example and is not intended to be limiting in any way. The present invention is limited only as defined in the following claims and the equivalents thereto.

1 障害予測評価装置
101 通信インタフェース部
102 予測結果蓄積部
103 運用コスト蓄積部
104 評価結果蓄積部
111 測結果取得部
111t 障害種別テーブル
112 運用コスト取得部(運用損失取得手段)
112a 設備交換コスト算定部
112b 現地出動コスト算定部
112t 運用コストテーブル
113 評価値算出部
113a アキュラシ対応評価値算出部
113b プレシジョン対応評価値算出部
113c リコール対応評価値算出部
121 通信制御部
2 障害予測装置
3 通信ネットワークシステム
1 Failure prediction and evaluation apparatus 101 Communication interface unit 102 Prediction result storage unit 103 Operation cost storage unit 104 Evaluation result storage unit 111 Measurement result acquisition unit 111t Failure type table 112 Operation cost acquisition unit (Operation loss acquisition means)
112a facility replacement cost calculation unit 112b local dispatch cost calculation unit 112t operation cost table 113 evaluation value calculation unit 113a accuracy correspondence evaluation value calculation unit 113b accuracy correspondence evaluation value calculation unit 113c recall correspondence evaluation value calculation unit 121 communication control unit 2 failure prediction device 3 Communication network system

Claims (12)

事業システムにおける障害の発生を予測する障害予測手段による予測結果を評価する障害予測評価装置であって、
当該障害予測手段による予測結果としての複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得する予測結果取得手段と、
当該正解障害種別毎に、当該予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストを含む運用損失に係る情報である運用損失情報を取得する運用損失取得手段と、
当該正解障害種別と当該予測障害種別との組毎に、1つの予測障害種別における当該正解障害種別毎に、又は1つの正解障害種別における当該予測障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該障害予測手段による予測結果の評価の指標となる評価値を算出する評価値算出手段と
を有することを特徴とする障害予測評価装置。
A failure prediction and evaluation apparatus for evaluating a prediction result by failure prediction means for predicting the occurrence of a failure in a business system, comprising:
For each of a plurality of failure types as prediction results by the failure prediction means, the number of times the failure type is actually predicted as a predicted failure type for each correct failure type that is a failure type that was correct when predicted Forecasting result acquiring means for acquiring such prediction frequency information;
Acquisition of operation loss, which is information related to operation loss including the operation cost that occurs when each correct failure type is dealt with or left according to the content of the predicted failure type for each of the predicted failure types Means,
The prediction frequency information corresponding to each pair of the correct failure type and the predicted failure type, for each correct error type in one predicted failure type, or for each predicted failure type in one correct error type A fault prediction and evaluation apparatus comprising: evaluation value calculation means for calculating an evaluation value as an index of evaluation of a prediction result by the failure prediction means based on a value weighted by operation loss information.
前記事業システムは、少なくとも1つの設備を備えており、
前記予測結果取得手段は、当該設備の交換又は修理が必要な障害である旨の障害種別、及び当該設備の交換又は修理が不要な障害である旨の障害種別についての当該予測回数情報を取得し、
前記運用損失取得手段は、当該設備の交換又は修理が不要な障害である旨の正解予測種別と、当該設備の交換又は修理が必要な障害である旨の予測障害種別とに対応する運用損失情報として、当該設備の交換又は修理に係るコスト分が加算された値を採用する
ことを特徴とする請求項1に記載の障害予測評価装置。
The business system comprises at least one facility,
The prediction result acquisition means acquires the predicted number of times information about the failure type indicating that the failure is a failure requiring replacement or repair of the facility and the failure type indicating that the replacement or repair of the facility is unnecessary. ,
The operation loss acquisition means is operation loss information corresponding to the correctness prediction type indicating that the equipment need not be replaced or repaired, and the predicted failure type indicating that the facility needs to be exchanged or repaired. The failure prediction and evaluation apparatus according to claim 1, wherein a value obtained by adding a cost amount related to replacement or repair of the facility is adopted.
前記事業システムは、障害発生時にその場で対応が必要となる少なくとも1つの現地を有し、
前記予測結果取得手段は、当該現地での対応が必要な障害である旨の障害種別、及び当該現地での対応が不要な障害である旨の障害種別についての当該予測回数情報を取得し、
前記運用損失取得手段は、当該現地での対応が不要な障害である旨の正解予測種別と、当該現地での対応が必要な障害である旨の予測障害種別とに対応する運用損失情報として、当該現地への出動コスト分が加算された値を採用する
ことを特徴とする請求項1又は2に記載の障害予測評価装置。
The business system has at least one site that needs to be dealt with immediately when a failure occurs.
The prediction result acquisition means acquires the prediction frequency information on the failure type to the effect that the local response is required and the failure type to the effect that the local response is not necessary.
The operation loss acquiring unit is used as operation loss information corresponding to the correctness prediction type indicating that the local response is unnecessary and the predicted failure type indicating that the local response is necessary. The failure prediction and evaluation apparatus according to claim 1 or 2, wherein a value to which the dispatch cost for the field is added is adopted.
前記事業システムは、少なくとも1つの設備を備え、障害発生時にその場で対応が必要となり得る少なくとも1つの現地を有する通信ネットワークシステムであることを特徴とする請求項1から3のいずれか1項に記載の障害予測評価装置。   The business system according to any one of claims 1 to 3, wherein the business system is a communication network system having at least one facility and having at least one site that may need to be dealt with on the spot when a failure occurs. Failure prediction and evaluation device described. 前記予測結果取得手段によって取得される予測回数情報を導出するための当該予測結果は、当該障害予測手段が、当該設備から又は予めネットワークに設置された監視設備から収集されるネットワークに係るアラーム情報と、当該正解障害種別とを教師データセットとして学習させて構築した学習器に対し、予測対象であるアラーム情報を入力することによって取得した予測結果であることを特徴とする請求項4に記載の障害予測評価装置。   The prediction result for deriving the prediction number information acquired by the prediction result acquisition means is alarm information concerning a network collected by the failure prediction means from the equipment or from monitoring equipment installed in advance in the network The obstacle according to claim 4, wherein the obstacle is the prediction result acquired by inputting alarm information which is an object to be predicted to a learning device constructed by learning the correct answer obstacle type as a teacher data set. Predictive evaluation device. 当該複数の障害種別は、対処が不要な障害である旨の障害種別、遠隔リセットが必要な障害である旨の障害種別、前記事業システムにおける現地での対応が必要な障害である旨の障害種別、及び前記事業システムの有する設備の交換又は修理が必要な障害である旨の障害種別からなる群から選択された少なくとも1つを含むことを特徴とする請求項1から5のいずれか1項に記載の障害予測評価装置。   The plurality of fault types are a fault type indicating that the action does not require any action, a fault type indicating that the action requires a remote reset, and a fault type indicating that the action in the business system requires an on-site action. The method according to any one of claims 1 to 5, including at least one selected from the group consisting of: a failure type indicating that the equipment in the business system needs to be replaced or repaired. Failure prediction and evaluation device described. 当該運用損失情報は、障害予測のない場合に必要となる運用コストと比較した運用コストの増減分、障害予測が外れる又は当たることによって生じるサービスの向上又は劣化の度合い、及び障害予測のない場合に必要となる障害復旧のための時間と比較した障害復旧時間の増減分からなる群から選択された少なくとも1つを含むことを特徴とする請求項1から6のいずれか1項に記載の障害予測評価装置。   The operation loss information is an increase or decrease in the operation cost compared to the operation cost required when there is no failure prediction, the degree of improvement or deterioration of service caused by failure or failure of the failure prediction, and when there is no failure prediction. The failure prediction evaluation according to any one of claims 1 to 6, characterized in that it includes at least one selected from the group consisting of increase and decrease in failure recovery time compared with the time required for failure recovery. apparatus. 当該運用損失情報は、対応する当該正解障害種別及び当該予測障害種別が一致する場合に負値又はゼロをとり且つ一致しない場合に正値又はゼロをとり、当該評価値は、負値をとる場合にその絶対値が大きいほど、当該障害予測手段による予測結果の有効性がより高いとの評価を示すことを特徴とする請求項1から7のいずれか1項に記載の障害予測評価装置。 The operation loss information takes a negative value or zero when the corresponding correct error type and the predicted failure type match, and takes a positive value or zero when they do not match, and the evaluation value takes a negative value. The failure prediction and evaluation apparatus according to any one of claims 1 to 7, wherein the larger the absolute value is, the higher the effectiveness of the prediction result by the failure prediction means is. 前記評価値算出手段は、当該設備の交換又は修理が必要な障害である旨の予測障害種別における当該正解障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該設備の交換又は修理が必要である旨の予測結果に対する有効性を評価する評価値を算出することを特徴とする請求項2に記載の障害予測評価装置。   The evaluation value calculation means is based on a value obtained by weighting the corresponding prediction frequency information according to the operation loss information for each correct failure type in the predicted failure type to the effect that the equipment needs replacement or repair. The failure prediction and evaluation apparatus according to claim 2, wherein an evaluation value for evaluating the effectiveness of the prediction result that replacement or repair of the facility is necessary is calculated. 少なくとも1つの設備を備えた通信ネットワークシステムにおける障害の発生を予測する障害予測手段と、前記障害予測手段による予測結果を評価する障害予測評価装置とを備えた障害予測システムであって、前記障害予測評価装置は、
前記障害予測手段による予測結果としての複数の障害種別であって、当該設備の交換又は修理が必要な障害である旨の障害種別、及び当該設備の交換又は修理が不要な障害である旨の障害種別を含む複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得する予測結果取得手段と、
当該正解障害種別毎に、当該予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストであって、設備の交換又は修理が不要な障害である旨の正解予測種別と、当該設備の交換又は修理が必要な障害である旨の予測障害種別とに対応しており当該設備の交換又は修理に係るコスト分が加算された値を有する運用コストを含む運用損失に係る情報である運用損失情報を取得する運用損失取得手段と、
当該正解障害種別と当該予測障害種別との組毎に、1つの予測障害種別における当該正解障害種別毎に、又は1つの正解障害種別における当該予測障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該障害予測手段による予測結果の評価の指標となる評価値を算出する評価値算出手段と
を有することを特徴とする障害予測システム。
A failure prediction system comprising: failure prediction means for predicting the occurrence of a failure in a communication network system provided with at least one facility; and a failure prediction evaluation device for evaluating a prediction result by the failure prediction means, the failure prediction The evaluation device is
A plurality of failure types as a prediction result by the failure prediction means, which is a failure indicating that the equipment needs replacement or repair, and a failure indicating that the equipment replacement or repair is unnecessary For each of the plurality of failure types including the type, for each correct failure type that is the failure type that was correct when predicted, the prediction frequency information regarding the number of times the failure type is actually predicted as the predicted failure type is acquired Means for acquiring prediction results
It is an operation cost that occurs when dealing with or leaving each of the correct failure types according to the content of the predicted failure type for each of the correct failure types, that is, a correct answer indicating that replacement or repair of equipment is unnecessary. An operation loss including an operation cost that corresponds to the prediction type and the predicted failure type indicating that the equipment needs replacement or repair, and the cost for replacement or repair of the equipment is added Operation loss acquisition means for acquiring operation loss information which is information related to
The prediction frequency information corresponding to each pair of the correct failure type and the predicted failure type, for each correct error type in one predicted failure type, or for each predicted failure type in one correct error type What is claimed is: 1. A failure prediction system comprising: evaluation value calculation means for calculating an evaluation value as an index of evaluation of a prediction result by the failure prediction means based on a value weighted by operation loss information.
事業システムにおける障害の発生を予測する障害予測手段による予測結果を評価する装置に搭載されたコンピュータを機能させるプログラムであって、
当該障害予測手段による予測結果としての複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得する予測結果取得手段と、
当該正解障害種別毎に、当該予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストを含む運用損失に係る情報である運用損失情報を取得する運用損失取得手段と、
当該正解障害種別と当該予測障害種別との組毎に、1つの予測障害種別における当該正解障害種別毎に、又は1つの正解障害種別における当該予測障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該障害予測手段による予測結果の評価の指標となる評価値を算出する評価値算出手段と
してコンピュータを機能させることを特徴とする障害予測評価プログラム。
A program that causes a computer mounted on a device to evaluate the prediction result by a failure prediction unit that predicts the occurrence of a failure in a business system.
For each of a plurality of failure types as prediction results by the failure prediction means, the number of times the failure type is actually predicted as a predicted failure type for each correct failure type that is a failure type that was correct when predicted Forecasting result acquiring means for acquiring such prediction frequency information;
Acquisition of operation loss, which is information related to operation loss including the operation cost that occurs when each correct failure type is dealt with or left according to the content of the predicted failure type for each of the predicted failure types Means,
The prediction frequency information corresponding to each pair of the correct failure type and the predicted failure type, for each correct error type in one predicted failure type, or for each predicted failure type in one correct error type A failure prediction and evaluation program that causes a computer to function as an evaluation value calculation unit that calculates an evaluation value that is an index of evaluation of a prediction result by the failure prediction unit based on a value weighted by operation loss information.
事業システムにおける障害の発生を予測する障害予測手段による予測結果を評価する方法であって、
当該障害予測手段による予測結果としての複数の障害種別の各々について、予測した際に正解であった障害種別である正解障害種別毎に、当該障害種別が実際に予測障害種別として予測された回数に係る予測回数情報を取得するステップと、
当該正解障害種別毎に、当該予測障害種別の各々について、当該予測障害種別の内容に従って対処又は放置した際に発生する運用コストを含む運用損失に係る情報である運用損失情報を取得するステップと、
当該正解障害種別と当該予測障害種別との組毎に、1つの予測障害種別における当該正解障害種別毎に、又は1つの正解障害種別における当該予測障害種別毎に、対応する当該予測回数情報を当該運用損失情報によって重み付けした値に基づいて、当該障害予測手段による予測結果の評価の指標となる評価値を算出するステップと
を有することを特徴とする障害予測評価方法。
A method of evaluating a prediction result by failure prediction means for predicting the occurrence of a failure in a business system,
For each of a plurality of failure types as prediction results by the failure prediction means, the number of times the failure type is actually predicted as a predicted failure type for each correct failure type that is a failure type that was correct when predicted Acquiring such prediction number information;
Acquiring operation loss information, which is information relating to operation losses including operation costs generated when taking measures or leaving according to the contents of the predicted failure type for each of the correct failure types,
The prediction frequency information corresponding to each pair of the correct failure type and the predicted failure type, for each correct error type in one predicted failure type, or for each predicted failure type in one correct error type And calculating an evaluation value as an index of evaluation of the prediction result by the failure prediction means based on the value weighted by the operation loss information.
JP2015101339A 2015-05-18 2015-05-18 Device, system, program and method for evaluating failure prediction result in consideration of operation loss Expired - Fee Related JP6503223B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015101339A JP6503223B2 (en) 2015-05-18 2015-05-18 Device, system, program and method for evaluating failure prediction result in consideration of operation loss

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015101339A JP6503223B2 (en) 2015-05-18 2015-05-18 Device, system, program and method for evaluating failure prediction result in consideration of operation loss

Publications (2)

Publication Number Publication Date
JP2016219962A JP2016219962A (en) 2016-12-22
JP6503223B2 true JP6503223B2 (en) 2019-04-17

Family

ID=57581681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015101339A Expired - Fee Related JP6503223B2 (en) 2015-05-18 2015-05-18 Device, system, program and method for evaluating failure prediction result in consideration of operation loss

Country Status (1)

Country Link
JP (1) JP6503223B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102418594B1 (en) * 2017-10-30 2022-07-08 주식회사 케이티 Ict equipment management system and method there of
CN109886443A (en) * 2017-12-26 2019-06-14 广东电网有限责任公司电力调度控制中心 A kind of failure Prediction System based on gray system theory
JP2019140501A (en) * 2018-02-09 2019-08-22 日本電信電話株式会社 Setting regulation controller, setting regulation control method, and setting regulation control program
JPWO2021149191A1 (en) * 2020-01-22 2021-07-29
CN111652479B (en) * 2020-05-19 2023-06-02 三峡大学 Data driving method for dynamic security assessment of power system
WO2023089688A1 (en) * 2021-11-17 2023-05-25 日本電信電話株式会社 Weight parameter setting device, weight parameter setting method, and weight parameter setting program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3579834B2 (en) * 2001-06-29 2004-10-20 インターナショナル・ビジネス・マシーンズ・コーポレーション Proactive online diagnostics in manageable networks
JP4701148B2 (en) * 2006-03-02 2011-06-15 アラクサラネットワークス株式会社 Failure recovery system and server

Also Published As

Publication number Publication date
JP2016219962A (en) 2016-12-22

Similar Documents

Publication Publication Date Title
JP6503223B2 (en) Device, system, program and method for evaluating failure prediction result in consideration of operation loss
Purba Fuzzy probability on reliability study of nuclear power plant probabilistic safety assessment: A review
US20210110319A1 (en) Framework to quantify cybersecurity risks and consequences for critical infrastructure
CN110428018A (en) A kind of predicting abnormality method and device in full link monitoring system
KR20180108446A (en) System and method for management of ict infra
Carpitella et al. A risk evaluation framework for the best maintenance strategy: The case of a marine salt manufacture firm
US20160092808A1 (en) Predictive maintenance for critical components based on causality analysis
Zhang et al. A model-based reinforcement learning approach for maintenance optimization of degrading systems in a large state space
Wu et al. Risk-averse optimization for resilience enhancement of complex engineering systems under uncertainties
Blancke et al. A holistic multi-failure mode prognosis approach for complex equipment
AU2020309879B2 (en) Failure probability assessment system and method therefor
Lee et al. An analytical approach to quantitative effect estimation of operation advisory system based on human cognitive process using the Bayesian belief network
US20170169342A1 (en) System and method for diagnosing at least one component requiring maintenance in an appliance and/or installation
JP6812312B2 (en) Plant support evaluation system and plant support evaluation method
Kim et al. Extending data quality management for smart connected product operations
Lewis et al. Metrics for evaluating the performance of complex engineering system health monitoring models
JP2013105221A (en) Maintenance parts delivery support system, maintenance parts delivery support device and maintenance parts delivery support program
CN105868265A (en) Case management linkage of updates, evidence, and triggers
Baraldi et al. Uncertainty treatment in expert information systems for maintenance policy assessment
Pinto et al. Increasing the reliability of an electrical power system in a big European hospital through the petri nets and fuzzy inference system Mamdani modelling
Ramuhalli et al. Concepts for Autonomous Operation of Microreactors
JP5200678B2 (en) Service system, service system management method, and program
JP7466479B2 (en) Business improvement support device, program, and storage medium storing the program
Shafiee et al. A Bayesian network model for the probabilistic safety assessment of offshore wind decommissioning
Barberá et al. RAM analysis of mining process: a case study of a Copper Smelting Process in the field of mining, Chile

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190325

R150 Certificate of patent or registration of utility model

Ref document number: 6503223

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees