KR102533298B1 - Apparatus for evaluating fault diagnosis model based on system availability and method thereof - Google Patents

Apparatus for evaluating fault diagnosis model based on system availability and method thereof Download PDF

Info

Publication number
KR102533298B1
KR102533298B1 KR1020220148108A KR20220148108A KR102533298B1 KR 102533298 B1 KR102533298 B1 KR 102533298B1 KR 1020220148108 A KR1020220148108 A KR 1020220148108A KR 20220148108 A KR20220148108 A KR 20220148108A KR 102533298 B1 KR102533298 B1 KR 102533298B1
Authority
KR
South Korea
Prior art keywords
failure
data
availability
diagnosis model
time
Prior art date
Application number
KR1020220148108A
Other languages
Korean (ko)
Inventor
김종운
알폰수스 줄란토 엔드하르타
유재윤
Original Assignee
네모시스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네모시스 주식회사 filed Critical 네모시스 주식회사
Priority to KR1020220148108A priority Critical patent/KR102533298B1/en
Application granted granted Critical
Publication of KR102533298B1 publication Critical patent/KR102533298B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • G06F11/3423Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time where the assessed time is active or idle time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/273Tester hardware, i.e. output processing circuits
    • G06F11/277Tester hardware, i.e. output processing circuits with comparison between actual response and known fault-free response
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

One embodiment may provide a device for evaluating a failure diagnosis model based on system availability. Provided may be a device for evaluating a failure diagnosis model which predicts the occurrence of failures in a system. The device comprises: a control unit which calculates a first availability indicating the degree to which the system operates without interruption based on the uptime and downtime of the system, calculates a second availability by reflecting whether a failure actually occurs in the system and whether a failure is predicted by the failure diagnosis model in the first availability, determines the second availability as the final availability for the system, and determines the performance of the failure diagnosis model based on the second availability; and an input unit which obtains actual data on whether a failure actually occurs and prediction data on whether a failure is predicted and transmits the obtained actual data and prediction data to the control unit. According to the present invention, a more accurate performance evaluation can be achieved by reflecting the malfunction of the failure diagnosis model in evaluating the performance of the failure diagnosis model.

Description

시스템 가용도에 기반하여 고장진단모델을 평가하는 장치 및 방법{APPARATUS FOR EVALUATING FAULT DIAGNOSIS MODEL BASED ON SYSTEM AVAILABILITY AND METHOD THEREOF}Apparatus and method for evaluating a failure diagnosis model based on system availability

본 실시예는 시스템에서 발생하는 고장을 진단하는 고장진단모델의 성능을 평가하기 위한 기술에 관한 것이다.This embodiment relates to a technique for evaluating the performance of a failure diagnosis model for diagnosing a failure occurring in a system.

많은 해석모델이 문제의 예측 및 분류를 위해 발전하고 있다. 통계적 또는 기계학습 방식이나 전통적 또는 현대적 모델들이 다양한 분야에서 연구되고 적용되고 있다. 모델의 성능은 평가될 필요가 있고, 이를 통해 고려된 모델들 중에서 가장 우수한 모델이 문제해결을 위해 선정되어 이용될 수 있다. Many analytical models are being developed for problem prediction and classification. Statistical or machine learning methods or traditional or modern models are being studied and applied in various fields. The performance of the model needs to be evaluated, and through this, the best model among the models considered can be selected and used for problem solving.

분류 문제에 있어서, 모델의 정확도, 정밀도, 재현도 및 F1score 등이 평가의 지표로서 이용될 수 있다. 이 지표들은 대게 상태기준 유지보수(condition-baed maintenance, CBM) 또는 예측안전모니터링(prognostic health monitoring, PHD) 모델에서도 활용될 수 있다. 예측안전모니터링은 센서를 통한 지속적 모니터링과 빅데이터 분석을 통한 자동분류모델을 고려할 수 있다. 모델이 적용되었을 때, 모델이 시스템 가용도(system availability), 유지보수비용 및 시스템 중요도(system criticality)에 어떤 영향을 주는지를 확인할 필요가 있다. 가용도나 유지보수비용에 대한 분류모델의 효과가 측정될 수 있다면, 최우수모델이 좀 더 현실적으로 선정될 수 있다. In the classification problem, accuracy, precision, reproducibility and F1 score of the model can be used as evaluation indicators. These metrics can often be utilized in condition-baed maintenance (CBM) or predictive health monitoring (PHD) models as well. Predictive safety monitoring can consider continuous monitoring through sensors and automatic classification models through big data analysis. When the model is applied, it is necessary to check how the model affects system availability, maintenance cost, and system criticality. If the effect of a classification model on availability or maintenance cost can be measured, the best model can be selected more realistically.

이에, 본 발명의 발명자는 시스템 가용도에 기반하여 고장진단모델을 평가하는 기술을 개발하기 위하여 오랜 연구를 거친 끝에 본 발명을 완성하기에 이르렀다.Accordingly, the inventors of the present invention completed the present invention after long research to develop a technique for evaluating a failure diagnosis model based on system availability.

이러한 배경에서, 본 실시예의 일 목적은, 시스템에서 고장의 실제 발생여부와 상기 고장진단모델에 의한 고장의 예측여부를 반영하여 시스템의 가용도를 산출하고, 시스템의 가용도를 기반으로 고장진단모델의 성능을 평가하는 기술을 제공하는 것이다. Against this background, one object of the present embodiment is to calculate the availability of the system by reflecting whether a failure actually occurs in the system and whether the failure is predicted by the failure diagnosis model, and based on the availability of the system, a failure diagnosis model To provide a technique for evaluating the performance of

한편 본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 것이다.Meanwhile, other non-specified objects of the present invention will be additionally considered within the scope that can be easily inferred from the following detailed description and effects thereof.

전술한 목적을 달성하기 위하여, 일 실시예는, 시스템에 고장의 발생을 예측하는 고장진단모델을 평가하는 장치에 있어서, 상기 시스템의 동작시간(uptime) 및 중지시간(downtime)에 기반하여 상기 시스템이 중단없이 동작하는 정도를 나타내는 제1 가용도를 산출하고, 상기 시스템에서 고장의 실제 발생여부와 상기 고장진단모델에 의한 고장의 예측여부를 상기 제1 가용도에 반영하여 제2 가용도를 산출하고, 상기 제2 가용도를 상기 시스템에 대한 최종적인 가용도로 결정하며, 상기 제2 가용도에 기반하여 상기 고장진단모델의 성능을 판단하는 제어부 및 고장의 실제 발생여부에 대한 실제데이터 및 고장의 예측여부에 대한 예측데이터를 획득하여 상기 제어부로 전달하는 입력부를 포함하는 시스템 가용도에 기반하여 고장진단모델을 평가하는 장치를 제공한다.In order to achieve the above object, an embodiment is an apparatus for evaluating a failure diagnosis model for predicting the occurrence of a failure in a system, based on uptime and downtime of the system. A first availability indicating the degree of operation without interruption is calculated, and whether a failure actually occurs in the system and whether a failure is predicted by the failure diagnosis model are reflected in the first availability to calculate a second availability and determining the second availability as the final availability for the system, and determining the performance of the failure diagnosis model based on the second availability, and actual data on whether or not a failure has actually occurred and failure information. Provided is an apparatus for evaluating a failure diagnosis model based on system availability, including an input unit for obtaining prediction data on whether or not to predict and transmitting the obtained prediction data to the control unit.

상기 장치에서, 상기 제어부는, 상기 제2 가용도를 산출하기 위하여, 고장이 실제 발생하고 상기 고장진단모델이 고장(fault)이라고 예측한 경우의 수를 나타내는 TP(true positive)데이터, 고장이 실제 발생하고 상기 고장진단모델이 정상(normal)이라고 예측한 경우의 수를 나타내는 FN(false negative)데이터, 고장이 실제 발생하지 않고 상기 고장진단모델이 고장이라고 예측한 경우의 수를 나타내는 FP(false positive)데이터, 고장이 실제 발생하지 않고 상기 고장진단모델이 정상이라고 예측한 경우의 수를 나타내는 TN(true negative)데이터, 고장이 실제 발생한 경우의 수를 나타내는 F(fault)데이터 및 고장이 실제 발생하지 않은 경우의 수를 나타내는 N(normal)데이터를 생성할 수 있다.In the device, the control unit, in order to calculate the second availability, TP (true positive) data indicating the number of cases in which a failure actually occurs and the failure diagnosis model predicts that the failure is actual, FN (false negative) data indicating the number of cases that occur and the failure diagnosis model predicts that it is normal, FP (false positive) data representing the number of cases where failure does not actually occur and the failure diagnosis model predicts that the failure is normal ) data, TN (true negative) data indicating the number of cases in which the failure diagnosis model predicts that a failure does not actually occur, F (fault) data indicating the number of cases where a failure actually occurs, and failure actually occurs It is possible to generate N (normal) data representing the number of cases that are not.

상기 장치에서, 상기 제어부는, 상기 제2 가용도를 산출하기 위하여, 상기 동작시간에 고장 사이의 간격을 나타내는 고장간격시간을 반영하고, 상기 중지시간에 고장을 검출하기 위한 검사시간과 상기 시스템을 복구하기 위한 복구시간을 반영할 수 있다.In the device, the control unit reflects a failure interval time indicating an interval between failures in the operation time, and the test time for detecting a failure in the stop time and the system, in order to calculate the second availability. Recovery time for recovery can be reflected.

상기 장치에서, 상기 제어부는, 상기 TP데이터, 상기 FN데이터, 상기 FP데이터, 상기 TN데이터, 상기 F데이터, 상기 N데이터, 상기 고장간격시간, 상기 검사시간 및 상기 복구시간으로부터 상기 제2 가용도를 산출할 수 있다.In the device, the controller determines the second availability from the TP data, the FN data, the FP data, the TN data, the F data, the N data, the failure interval time, the inspection time, and the recovery time. can be calculated.

상기 장치에서, 다음의 수학식을 이용하여 상기 제2 가용도를 산출 할 수 있다. In the device, the second availability may be calculated using the following equation.

Figure 112022118778617-pat00001
Figure 112022118778617-pat00001

TP : TP데이터, FN : FN데이터, FP : FP데이터, TN : TN데이터, F : F데이터, N : N데이터, MTBF(mean time between failure) : 고장간격시간, Tinspect : 검사시간, MTTR(mean time to restoration)true : 제1 복구시간(고장이 실제 발생한 경우 상기 고장진단모델이 고장이라고 예측한 경우), MTTR(mean time to restoration)miss : 제2 복구시간(고장이 실제 발생한 경우 상기 고장진단모델이 정상이라고 예측한 경우)TP: TP data, FN: FN data, FP: FP data, TN: TN data, F: F data, N: N data, MTBF (mean time between failure): failure interval time, Tinspect: test time, MTTR (mean time to restoration)true: 1st recovery time (when a failure actually occurs, if the failure diagnosis model predicts a failure), MTTR (mean time to restoration) miss: 2nd recovery time (if a failure actually occurs, the failure diagnosis if the model predicted normal)

다른 실시예는, 시스템에 고장의 발생을 예측하는 고장진단모델을 평가하는 방법에 있어서, 상기 시스템의 동작시간(uptime) 및 중지시간(downtime)에 기반하여 상기 시스템이 중단없이 동작하는 정도를 나타내는 제1 가용도를 산출하는 단계; 상기 시스템에서 고장의 실제 발생여부와 상기 고장진단모델에 의한 고장의 예측여부를 상기 제1 가용도에 반영하여 제2 가용도를 산출하는 단계; 상기 제2 가용도를 상기 시스템에 대한 최종적인 가용도로 결정하는 단계; 및 상기 제2 가용도에 기반하여 상기 고장진단모델의 성능을 판단하는 단계를 포함하는 시스템 가용도에 기반하여 고장진단모델을 평가하는 방법을 제공한다. Another embodiment is a method for evaluating a failure diagnosis model predicting the occurrence of a failure in a system, which indicates the degree to which the system operates without interruption based on uptime and downtime of the system. calculating a first availability; calculating a second availability by reflecting whether a failure actually occurs in the system and whether a failure is predicted by the failure diagnosis model in the first availability; determining the second availability as the final availability for the system; and determining the performance of the fault diagnosis model based on the second availability.

상기 방법에서, 상기 제2 가용도를 산출하는 단계는, 고장이 실제 발생하고 상기 고장진단모델이 고장(fault)이라고 예측한 경우의 수를 나타내는 TP(true positive)데이터, 고장이 실제 발생하고 상기 고장진단모델이 정상(normal)이라고 예측한 경우의 수를 나타내는 FN(false negative)데이터, 고장이 실제 발생하지 않고 상기 고장진단모델이 고장이라고 예측한 경우의 수를 나타내는 FP(false positive)데이터, 고장이 실제 발생하지 않고 상기 고장진단모델이 정상이라고 예측한 경우의 수를 나타내는 TN(true negative)데이터, 고장이 실제 발생한 경우의 수를 나타내는 F(fault)데이터 및 고장이 실제 발생하지 않은 경우의 수를 나타내는 N(normal)데이터를 생성하는 단계를 포함할 수 있다. In the method, the step of calculating the second availability may include true positive (TP) data indicating the number of cases in which a failure actually occurs and the failure diagnosis model predicts that a failure occurs, and the failure actually occurs and the FN (false negative) data representing the number of cases predicted by the failure diagnosis model to be normal, false positive (FP) data representing the number of cases predicted by the failure diagnosis model to be failure without actually occurring; TN (true negative) data representing the number of cases where a failure does not actually occur and the failure diagnosis model predicts that it is normal, F (fault) data representing the number of cases where a failure actually occurs, and It may include generating N (normal) data representing the number.

상기 방법에서, 상기 제2 가용도를 산출하는 단계는, 상기 동작시간에 고장 사이의 간격을 나타내는 고장간격시간을 반영하고 상기 중지시간에 고장을 검출하기 위한 검사시간과 상기 시스템을 복구하기 위한 복구시간을 반영하여 상기 제2 가용도를 산출할 수 있다. In the method, the step of calculating the second availability reflects a failure interval time indicating an interval between failures in the operating time, and a test time for detecting a failure and a recovery for restoring the system in the downtime. The second availability may be calculated by reflecting time.

상기 방법에서, 상기 제2 가용도를 산출하는 단계는, 상기 TP데이터, 상기 FN데이터, 상기 FP데이터, 상기 TN데이터, 상기 F데이터, 상기 N데이터, 상기 고장간격시간, 상기 검사시간 및 상기 복구시간으로부터 상기 제2 가용도를 산출할 수 있다. In the method, the calculating of the second availability may include the TP data, the FN data, the FP data, the TN data, the F data, the N data, the failure interval time, the inspection time, and the recovery The second availability may be calculated from time.

상기 방법에서, 다음의 수학식을 이용하여 상기 제2 가용도를 산출 할 수 있다. In the above method, the second availability may be calculated using the following equation.

Figure 112022118778617-pat00002
Figure 112022118778617-pat00002

TP : TP데이터, FN : FN데이터, FP : FP데이터, TN : TN데이터, F : F데이터, N : N데이터, MTBF(mean time between failure) : 고장간격시간, Tinspect : 검사시간, MTTR(mean time to restoration)true : 제1 복구시간(고장이 실제 발생한 경우 상기 고장진단모델이 고장이라고 예측한 경우), MTTR(mean time to restoration)miss : 제2 복구시간(고장이 실제 발생한 경우 상기 고장진단모델이 정상이라고 예측한 경우)TP: TP data, FN: FN data, FP: FP data, TN: TN data, F: F data, N: N data, MTBF (mean time between failure): failure interval time, Tinspect: test time, MTTR (mean time to restoration)true: 1st recovery time (when a failure actually occurs, if the failure diagnosis model predicts a failure), MTTR (mean time to restoration) miss: 2nd recovery time (if a failure actually occurs, the failure diagnosis if the model predicted normal)

이상에서 설명한 바와 같이 본 실시예에 의하면, 고장진단모델의 성능을 평가하는데 있어서 고장진단모델의 오동작을 반영함으로써 더 정확한 성능 평가가 이루어질 수 있다. As described above, according to the present embodiment, more accurate performance evaluation can be performed by reflecting malfunctions of the failure diagnosis model in evaluating the performance of the failure diagnosis model.

한편, 여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급됨을 첨언한다.On the other hand, even if the effects are not explicitly mentioned here, it is added that the effects described in the following specification expected by the technical features of the present invention and their provisional effects are treated as described in the specification of the present invention.

도 1은 일 실시예에 따른 시스템 가용도에 기반하여 고장진단모델을 평가하는 장치의 구성도이다.
도 2는 일 실시예에 따른 가용도를 산출하기 위한 오차행렬의 예시도이다.
도 3은 일 실시예에 따른 유지보수 조치와 연관되어 해석되는 오차행렬의 예시도이다.
도 4는 일 실시예에 따른 가용도에 기반하여 고장진단모델을 평가하는 제1 예시도이다.
도 5는 일 실시예에 따른 가용도에 기반하여 고장진단모델을 평가하는 제2 예시도이다.
첨부된 도면은 본 발명의 기술사상에 대한 이해를 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되지는 아니한다.
1 is a configuration diagram of an apparatus for evaluating a failure diagnosis model based on system availability according to an exemplary embodiment.
2 is an exemplary diagram of an error matrix for calculating availability according to an embodiment.
3 is an exemplary diagram of an error matrix interpreted in association with maintenance measures according to an embodiment.
4 is a first exemplary view of evaluating a failure diagnosis model based on availability according to an embodiment.
5 is a second exemplary diagram for evaluating a failure diagnosis model based on availability according to an embodiment.
It is revealed that the accompanying drawings are illustrated as references for understanding the technical idea of the present invention, and thereby the scope of the present invention is not limited thereto.

본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. In the description of the present invention, if it is determined that a related known function may unnecessarily obscure the subject matter of the present invention as an obvious matter to those skilled in the art, the detailed description thereof will be omitted.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Terms used in this application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this application, the terms "include" or "have" are intended to designate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, but one or more other features It should be understood that the presence or addition of numbers, steps, operations, components, parts, or combinations thereof is not precluded.

이하, 본 발명에 따른 실시예를 첨부도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, an embodiment according to the present invention will be described in detail with reference to the accompanying drawings, and in the description with reference to the accompanying drawings, the same or corresponding components are assigned the same reference numerals and overlapping descriptions thereof are omitted. do it with

도 1은 일 실시예에 따른 시스템 가용도에 기반하여 고장진단모델을 평가하는 장치의 구성도이다.1 is a configuration diagram of an apparatus for evaluating a failure diagnosis model based on system availability according to an exemplary embodiment.

도 1을 참조하면, 일 실시예에 따른 시스템 가용도에 기반하여 고장진단모델을 평가하는 장치(100, 이하 '장치'라 함)는 시스템에 고장의 발생을 예측하는 고장진단모델을 평가하기 위하여 시스템의 동작시간(uptime) 및 중지시간(downtime)에 기반하여 상기 시스템이 중단없이 동작하는 정도를 나타내는 제1 가용도를 산출하는 단계, 시스템에서 고장의 실제 발생여부와 상기 고장진단모델에 의한 고장의 예측여부를 제1 가용도에 반영하여 제2 가용도를 산출하는 단계, 제2 가용도를 상기 시스템에 대한 최종적인 가용도로 결정하는 단계, 및 제2 가용도에 기반하여 상기 고장진단모델의 성능을 판단하는 단계를 수행할 수 있다. 이를 위하여 장치(100)는 입력부(110), 제어부(120), 출력부(130) 및 저장부(140)를 포함할 수 있다. Referring to FIG. 1, an apparatus (100, hereinafter referred to as 'apparatus') for evaluating a fault diagnosis model based on system availability according to an embodiment is configured to evaluate a fault diagnosis model predicting occurrence of a failure in a system. Calculating a first availability indicating the degree to which the system operates without interruption based on the uptime and downtime of the system, whether a failure actually occurs in the system and failure according to the failure diagnosis model calculating the second availability by reflecting the prediction of the first availability to the first availability, determining the second availability as the final availability for the system, and based on the second availability, the fault diagnosis model Steps to judge performance can be performed. To this end, the device 100 may include an input unit 110, a control unit 120, an output unit 130, and a storage unit 140.

장치(100)는 고장진단모델의 성능을 평가할 수 있다. 고장진단모델은 하나의 시스템에서 고장(fault)이 발생하는지 여부를 예측할 수 있다. 고장진단모델은 시스템이 일정 시점에 고장날 것으로 예측하면, '고장(fault)'이라고 예측하고 이를 사용자에게 출력할 수 있다. 고장진단모델은 시스템이 일정 시점에 고장나지 않고 정상적으로 동작할 것으로 예측하면, '정상(normal)'이라고 예측하고 이를 사용자에게 출력할 수 있다. 장치(100)는 고장진단모델의 성능을 평가하는데, 여기서 성능은 고장진단모델이 시스템을 얼마나 잘 예측하는가를 의미할 수 있다. 시스템에 고장이 실제 발생한 경우에 고장진단모델이 고장이라고 예측하거나, 시스템에 고장이 실제 발생하지 않은 경우에 고장진단모델이 정상이라고 예측한다면, 고장진단모델의 성능은 우수한 것으로 평가될 수 있다. The apparatus 100 may evaluate the performance of the failure diagnosis model. The fault diagnosis model can predict whether a fault will occur in one system. If the failure diagnosis model predicts that the system will fail at a certain point in time, it can predict a 'fault' and output it to the user. If the failure diagnosis model predicts that the system will operate normally without failure at a certain point in time, it can predict that the system is 'normal' and output it to the user. The apparatus 100 evaluates the performance of the fault diagnosis model, where the performance may mean how well the fault diagnosis model predicts the system. If the failure diagnosis model predicts a failure when a system failure actually occurs or the failure diagnosis model predicts a normal failure when a system failure does not actually occur, the performance of the failure diagnosis model can be evaluated as excellent.

여기서 입력부(110)는 고장진단모델의 성능을 평가하는데 필요한 데이터 또는 정보를 입력받고, 입력받은 데이터 또는 정보를 제어부(120)로 전달할 수 있다. 출력부(130)는 제어부(120)가 산출한 데이터 또는 정보를 사용자가 오감으로 인식할 수 있도록 출력할 수 있다. 저장부(140)에는 입력부(110)를 통해 입력되거나 제어부(120)가 산출한 데이터 또는 정보, 제1 가용도 및 제2 가용도를 산출하기 위한 알고리즘 등이 저장될 수 있다. Here, the input unit 110 may receive data or information necessary for evaluating the performance of the failure diagnosis model and transmit the received data or information to the control unit 120 . The output unit 130 may output the data or information calculated by the control unit 120 so that the user can recognize them with five senses. The storage unit 140 may store data or information input through the input unit 110 or calculated by the controller 120, an algorithm for calculating the first availability and the second availability, and the like.

한편 장치(100)는 고장진단모델의 성능을 평가하기 위하여 시스템에 대한 가용도(availability)를 참조할 수 있다. 시스템의 가용도는 시스템이 요구되는 기능을 올바르게 수행할 수 있는 능력 또는 서비스가 중단되지 않고 성능을 유지할 수 있는 능력으로 이해될 수 있다. 장치(100)는 다음의 수학식 1을 통해 시스템의 가용도를 산출할 수 있다. Meanwhile, the apparatus 100 may refer to the availability of the system in order to evaluate the performance of the failure diagnosis model. Availability of a system can be understood as the ability of the system to properly perform required functions or the ability to maintain performance without interruption of service. The device 100 may calculate the availability of the system through Equation 1 below.

Figure 112022118778617-pat00003
Figure 112022118778617-pat00003

여기서 uptime은 동작시간을, downtime은 중지시간을, MTBF(mean time between failure)는 평균고장간격시간을, MTTR(mean time to restoration)는 평균고장간격시간을, 각각 나타낼 수 있다. 동작시간은 MTBF로, 중지시간은 MTBF로, 각각 간주될 수 있다. MTBF는 시스템이 평균적으로 동작가능한 시간으로 일 고장과 다음 고장 사이의 평균적인 간격에 해당할 수 있다. MTTR은 실제 고장의 발생을 올바르게 예측했는지 여부와 무관하게, 고장 이후에 시스템을 복구하는데 소요되는 평균적인 시간-복구시간-에 해당할 수 있다. Here, uptime may indicate operation time, downtime may indicate stop time, MTBF (mean time between failure) may indicate mean time between failures, and MTTR (mean time to restoration) may indicate mean time between failures. Uptime can be regarded as MTBF and downtime as MTBF, respectively. MTBF is the average operating time of a system and may correspond to the average interval between one failure and the next. MTTR may correspond to the average time (recovery time) required to restore a system after a failure, regardless of whether the occurrence of an actual failure is correctly predicted.

구체적으로 장치(100)의 제어부(120)는 시스템의 동작시간 및 중지시간에 기반하여 최초의 가용도 즉, 제1 가용도를 산출할 수 있다. 제어부(120)는 수학식 1을 이용하여 제1 가용도를 산출할 수 있고, 동작시간 대신에 시스템에 대한 MTBF를, 중지시간 대신에 시스템에 대한 MTTR을 이용할 수 있다. In detail, the control unit 120 of the device 100 may calculate the initial availability, that is, the first availability, based on the operation time and stop time of the system. The controller 120 may calculate the first availability by using Equation 1, and may use MTBF for the system instead of operating time and MTTR for the system instead of stop time.

그리고 장치(100)의 제어부(120)는 시스템에서 고장이 실제로 발생하는지 여부와 고장진단모델이 그 고장을 예측하는지 여부를 제1 가용도에 반영하여 제2 가용도를 산출할 수 있다. 그러면 제어부(120)는 제2 가용도를 시스템에 대한 최종적인 가용도로 결정할 수 있다. 제어부(120)는 시스템의 가용도-제2 가용도-에 기반하여 고장진단모델의 성능을 판단할 수 있다. The controller 120 of the device 100 may calculate the second availability by reflecting whether a failure actually occurs in the system and whether the failure diagnosis model predicts the failure in the first availability. Then, the controller 120 may determine the second availability as the final availability for the system. The control unit 120 may determine the performance of the failure diagnosis model based on the availability of the system - the second availability.

일 실시예에 따른 장치(100)의 제어부(120)는 고장진단모델의 성능을 판단하기 위하여 시스템의 가용도를 이용할 수 있다. 구체적으로 제어부(120)는 제1 가용도에 고장진단모델의 예측 결과를 반영한 제2 가용도를 새로이 산출함으로써, 제2 가용도에 비추어 고장진단모델의 성능을 판단할 수 있다. 그 이유는 고장진단모델의 예측 결과-시스템에서 고장이 실제 발생하였는지 여부와 고장진단모델이 이 고장을 예측하였는지 여부-가 제2 가용도에 영향을 주기 때문이다. 고장진단모델이 고장을 올바르게 예측하였는지 또는 틀리게 예측하였는지가 MTBF 및/또는 MTTR에 영향을 줄 수 있다. 그래서 제어부(120)는 고장이 실제 발생하였을 때 특정 고장진단모델이 고장(fault)이라고 예측한 경우, 고장이 실제 발생하였을 때 상기 특정 고장진단모델이 정상(normal)이라고 예측한 경우, 고장이 실제 발생하지 않았을 때 상기 특정 고장진단모델이 고장(fault)이라고 예측한 경우와, 고장이 실제 발생하지 않았을 때 상기 특정 고장진단모델이 정상(normal)이라고 예측한 경우와 같은 4가지 경우에 대한 수치 또는 확률을 제1 가용도를 구하기 위한 수학식 1에 반영할 수 있다. 제2 가용도가 높을수록 시스템의 성능은 우수한 것으로 인정되고 이 시스템을 진단하고 고장을 예측하는 고장진단모델의 성능도 우수한 것으로 인정될 수 있다. 반대로 제2 가용도가 낮을수록 시스템의 성능은 열등한 것으로 인정되고 이 시스템을 위한 고장진단모델의 성능도 열등한 것으로 인정될 수 있다. The control unit 120 of the device 100 according to an embodiment may use system availability to determine the performance of the failure diagnosis model. Specifically, the controller 120 may determine the performance of the fault diagnosis model based on the second availability by newly calculating the second availability by reflecting the prediction result of the fault diagnosis model in the first availability. The reason is that the predicted result of the failure diagnosis model - whether or not a failure actually occurred in the system and whether the failure was predicted by the failure diagnosis model - affects the second availability. Whether a failure diagnosis model predicts failures correctly or incorrectly can affect MTBF and/or MTTR. Therefore, the control unit 120 determines that when a specific failure diagnosis model predicts a fault when a failure actually occurs and when the specific failure diagnosis model predicts that the failure is normal when a failure actually occurs, the failure actually occurs. Values for four cases, such as the case where the specific failure diagnosis model predicted a fault when it did not occur and the case where the specific failure diagnosis model predicted a fault when the failure actually occurred, or The probability may be reflected in Equation 1 for obtaining the first availability. As the second availability is higher, the performance of the system is recognized as excellent, and the performance of the failure diagnosis model for diagnosing the system and predicting failure may be recognized as excellent. Conversely, as the second availability is lower, the performance of the system is recognized as inferior, and the performance of the failure diagnosis model for this system may also be recognized as inferior.

도 2는 일 실시예에 따른 가용도를 산출하기 위한 오차행렬의 예시도이다.2 is an exemplary diagram of an error matrix for calculating availability according to an embodiment.

도 2를 참조하면, 일 실시예에 따른 장치가 시스템의 최종적인 가용도-제2 가용도-를 산출하기 위하여 이용하는 오차행렬이 도시될 수 있다. Referring to FIG. 2 , an error matrix used by the device according to an embodiment to calculate the final availability-second availability-of the system may be illustrated.

장치의 제어부는 고장의 실제 발생여부에 대한 실제데이터 및 고장의 예측여부에 대한 예측데이터를 전달받고, 실제데이터 및 예측데이터로부터 오차행렬을 생성할 수 있다. 실제데이터는 시스템에 고장이 실제 발생한 사건에 대한 정보를 포함하고, 예측데이터는 그 고장을 예측한 사건에 대한 정보를 포함할 수 있다. 제어부는 실제데이터를 가지고 오차행렬의 행(actual condition)을 고장이 실제 발생한 경우(고장, fault)와 고장이 실제 발생하지 않은 경우(정상, normal)로 구분할 수 있다. 또한 제어부는 예측데이터를 가지고 오차행렬의 열(predicted condition)을 고장이라고 예측한 경우(고장, fault)와 정상이라고 예측한 경우(정상, normal)로 구분할 수 있다. 그러면 오차행렬의 각 영역은 고장이 실제 발생하였고 그 고장을 예측한 경우(TP, true positive), 고장이 실제 발생하였으나 정상으로 예측한 경우(FN, false negative), 고장이 실제 발생하지 않았으나 고장으로 예측한 경우(FP, false positive) 및 고장이 실제 발생하지 않았고 정상으로 예측한 경우(TP, true negative)에 해당할 수 있다. 제어부는 실제데이터 및 예측데이터를 위의 4가지 영역에 할당할 수 있다. 제어부가 오차행렬의 각 영역에 고장이 실제 발생하거나 또는 발생하지 않은 경우에 고장진단모델이 고장 또는 정상으로 예측한 경우의 수를 일정기간동안 파악하여 할당할 수 있다. 이와 같이 TP영역에 해당하는 경우의 수는 TP데이터로, FN영역에 해당하는 경우의 수는 FN데이터로, FP영역에 해당하는 경우의 수는 FP데이터로, TN영역에 해당하는 경우의 수는 TN데이터로, 각각 명명될 수 있다. The controller of the device may receive actual data on whether a failure actually occurs and prediction data on whether a failure is predicted, and generate an error matrix from the actual data and the predicted data. The actual data may include information on an event in which a failure actually occurs in the system, and the predicted data may include information on an event in which the failure is predicted. The control unit can classify the row (actual condition) of the error matrix with actual data into a case where a failure actually occurs (fault) and a case where a failure does not actually occur (normal). In addition, the control unit can divide the predicted condition of the error matrix into a case of predicting a failure (failure) and a case of predicting a normal condition (normal) with the prediction data. Then, each region of the error matrix is classified as a case where a failure actually occurred and the failure was predicted (TP, true positive), a failure actually occurred but was predicted as normal (FN, false negative), and a failure did not actually occur but was classified as a failure. This may correspond to a predicted case (FP, false positive) and a case where the failure did not actually occur and was normally predicted (TP, true negative). The control unit can allocate actual data and predicted data to the above four areas. The control unit may identify and allocate the number of cases predicted by the failure diagnosis model to be failure or normal when a failure actually occurs or does not occur in each region of the error matrix for a certain period of time. In this way, the number of cases corresponding to the TP area is TP data, the number of cases corresponding to the FN area is FN data, the number of cases corresponding to the FP area is FP data, and the number of cases corresponding to the TN area is TN data, each of which can be named.

여기서 고장이 실제 발생하였으나 정상으로 예측한 경우(FN)는 타입2 에러(type 2 error)로서 미스(miss)에 해당하고, 고장이 실제 발생하지 않았으나 고장으로 예측한 경우(FP)는 타입1 에러(type 1 error)로서 거짓 알람(false alarm)에 해당할 수 있다. 타입1 에러 및 타입2 에러는 시스템의 고장 발생을 실제와 다르게 예측하는 오동작을 각각 설명할 수 있다.Here, the case where a failure actually occurred but was predicted as normal (FN) is a type 2 error and corresponds to a miss, and the case where a failure did not actually occur but was predicted as a failure (FP) is a type 1 error. (type 1 error) and may correspond to a false alarm. A type 1 error and a type 2 error may respectively describe a malfunction that predicts the occurrence of a system failure differently from reality.

또한 제어부는 TP데이터와 FN데이터로부터 F데이터를 생성할 수 있다. F데이터는 고장이 실제 발생할 때 고장진단모델이 고장이라고 예측한 경우의 수와 고장이 실제 발생할 때 고장진단모델이 정상이라고 예측한 경우의 수의 합에 해당할 수 있다. 또한 제어부는 FP데이터와 TN데이터로부터 N데이터를 생성할 수 있다. N데이터는 고장이 실제 발생하지 않을 때 고장진단모델이 고장이라고 예측한 경우의 수와 고장이 실제 발생하지 않을 때 고장진단모델이 정상이라고 예측한 경우의 수의 합에 해당할 수 있다. In addition, the control unit may generate F data from TP data and FN data. The F data may correspond to the sum of the number of cases in which the failure diagnosis model predicts a failure when a failure actually occurs and the number of cases in which the failure diagnosis model predicts that a failure is normal when a failure actually occurs. Also, the controller may generate N data from FP data and TN data. The N data may correspond to the sum of the number of cases in which the failure diagnosis model predicts a failure when a failure does not actually occur and the number of cases in which the failure diagnosis model predicts a normal failure when a failure does not actually occur.

한편 장치의 제어부는 오차행렬의 TP데이터, FN데이터, FP데이터, TN데이터, N데이터 및 P데이터를 제1 가용도에 반영하여 제2 가용도를 산출할 수 있다. 제어부는 수학식 1을 통해 제1 가용도를 산출하는 반면, 다음의 수학식 2를 통해 제2 가용도를 산출할 수 있다. 수학식 2는 제1 가용도에 시스템에서 고장의 실제 발생여부와 고장진단모델에 의한 고장의 예측여부가 반영된 형태를 가질 수 있다. Meanwhile, the controller of the device may calculate the second availability by reflecting the TP data, FN data, FP data, TN data, N data, and P data of the error matrix to the first availability. While calculating the first availability through Equation 1, the controller may calculate the second availability through Equation 2 below. Equation 2 may have a form in which whether a failure actually occurs in the system and whether a failure is predicted by a failure diagnosis model are reflected in the first availability.

Figure 112022118778617-pat00004
Figure 112022118778617-pat00004

여기서 TP는 TP데이터를, FN는 FN데이터를, FP는 FP데이터를, TN는 TN데이터를, F는 F데이터를, N은 N데이터를, MTBF(mean time between failure)은 고장간격시간을, Tinspect는 검사시간을, MTTR(mean time to restoration)true는 제1 복구시간을, MTTR(mean time to restoration)miss는 제2 복구시간을, 각각 의미할 수 있다. 고장이 실제 발생한 경우나 고장으로 예측된 경우 모두에서 시스템의 고장을 검출할 필요가 있는 바, 검사시간은 이러한 고장 검출에 소요되는 평균시간을 의미할 수 있다. 제1 복구시간은 고장이 실제 발생할 때 고장진단모델이 고장이라고 예측한 경우에서 평균적인 복구시간을 의미할 수 있다. 제2 복구시간은 고장이 실제 발생할 때 고장진단모델이 정상이라고 예측한 경우에서 평균적인 복구시간을 의미할 수 있다. where TP is TP data, FN is FN data, FP is FP data, TN is TN data, F is F data, N is N data, MTBF (mean time between failures) is the time between failures, Tinspect may mean an examination time, mean time to restoration (MTTR) true may mean a first recovery time, and mean time to restoration (MTTR) miss may mean a second restoration time. Since it is necessary to detect a failure of the system both when a failure actually occurs or when a failure is predicted, the inspection time may mean an average time required for detecting such a failure. The first recovery time may mean an average recovery time when a failure diagnosis model predicts a failure when a failure actually occurs. The second recovery time may refer to an average recovery time when a failure diagnosis model predicts that a failure actually occurs.

제어부는 특정 고장진단모델에 대한 TP데이터, FN데이터, FP데이터, TN데이터, N데이터 및 P데이터를 수학식 2에 적용하여 제2 가용도를 산출할 수 있다. 여기서 고장간격시간, 검사시간, 제1 복구시간 및 제2 복구시간은 상기 특정 고장진단모델이 예측하는 대상인 시스템마다 고정되어 있을 수 있다. 이에 제어부는 사용자로부터 해당값을 획득하거나 저장공간에 기저장된 값을 불러와서 수학식 2에 적용할 수 있다. 그러면 제어부는 제2 가용도를 시스템의 가용도로서 최종적으로 결정할 수 있다. 그리고 제어부는 제2 가용도 즉, 시스템의 가용도를 기준으로 고장진단모델의 성능을 판단할 수 있다. 예를 들어 제어부는 제2 가용도가 높을수록 고장진단모델의 성능이 우수한 것으로 판정할 수 있다. The controller may calculate the second availability by applying TP data, FN data, FP data, TN data, N data, and P data for a specific failure diagnosis model to Equation 2. Here, the failure interval time, inspection time, first recovery time, and second recovery time may be fixed for each system that is a target predicted by the specific failure diagnosis model. Accordingly, the control unit may acquire a corresponding value from the user or retrieve a value previously stored in the storage space and apply it to Equation 2. Then, the controller may finally determine the second availability as the availability of the system. Further, the control unit may determine the performance of the failure diagnosis model based on the second availability, that is, system availability. For example, the control unit may determine that the performance of the failure diagnosis model is excellent as the second availability is higher.

도 3은 일 실시예에 따른 유지보수 조치와 연관되어 해석되는 오차행렬의 예시도이다.3 is an exemplary diagram of an error matrix interpreted in association with maintenance measures according to an embodiment.

도 3을 참조하면, 일 실시예에 따른 오차행렬의 각 영역에 대한 의미는 유지보수 조치와 관련하여 다음과 같이 해석될 수 있다. Referring to FIG. 3 , the meaning of each region of the error matrix according to an embodiment may be interpreted as follows in relation to maintenance measures.

고장이 실제 발생하고 상기 고장진단모델이 고장(fault)이라고 예측한 경우에 해당하는 TP영역은, 시스템에 검사 및 사전의 유지보수가 필요할 수 있다. 시스템은 다운(down)되어야 할 수 있다. 고장이 실제 발생하고 고장진단모델이 정상(normal)이라고 예측한 경우에 해당하는 FN영역은, 숨겨진 고장이 존재하고 사후의 유지보수가 필요할 수 있다. 사후의 유지보수는 예측하지 못한 고장이 추후에 발견되었을 때 가해지는 유지보수로 이해될 수 있다. 예측되지 못한 고장은 심각한 사고를 일으킬 수 있다. 고장이 실제 발생하지 않고 고장진단모델이 고장이라고 예측한 경우에 해당하는 FP영역은, 시스템에 검사가 필요할 수 있다. 시스템은 다운되어야 할 수 있다. 고장이 실제 발생하지 않고 고장진단모델이 정상이라고 예측한 경우에 해당하는 FP영역은, 시스템에 어떠한 유지보수도 필요하지 않을 수 있다. In a TP area corresponding to a case in which a failure actually occurs and the failure diagnosis model predicts a failure, the system may require inspection and prior maintenance. The system may have to be down. In the FN area corresponding to the case where a failure actually occurs and the failure diagnosis model predicts that it is normal, a hidden failure may exist and post-maintenance may be required. Ex post maintenance can be understood as maintenance applied when an unexpected failure is later discovered. Unexpected failures can cause serious accidents. An FP area corresponding to a case in which a failure does not actually occur and the failure diagnosis model predicts a failure may require a system inspection. The system may have to go down. In an FP area corresponding to a case where a failure does not actually occur and the failure diagnosis model predicts that it is normal, the system may not require any maintenance.

도 4는 일 실시예에 따른 가용도에 기반하여 고장진단모델을 평가하는 제1 예시도이다. 4 is a first exemplary view of evaluating a failure diagnosis model based on availability according to an embodiment.

도 4를 참조하면, 일 실시예에 따른 장치가 여러 가지 고장진단모델을 평가하는 제1 예시가 도시될 수 있다. 제1 예시는 고장이 사고를 야기하는 것을 가정할 수 있다. 그러면 고장 사이의 간격 시간인 MTBF는 1000hr, 고장을 검출하기 위한 검사시간인 Tinspect는 2hr, 고장 예측을 성공한 경우의 복구시간인 MTTRtrue는 4hr, 고장 예측을 실패한 경우의 복구시간인 MTTRmiss는 12hr이 될 수 있다.Referring to FIG. 4 , a first example of evaluating various failure diagnosis models by an apparatus according to an embodiment may be shown. The first example may assume that a failure causes an accident. Then, MTBF, the interval time between failures, is 1000hr, inspection time to detect a failure, Tinspect, is 2hr, MTTRtrue, the recovery time when failure prediction succeeds, is 4hr, and MTTRmiss, the recovery time when failure prediction fails, is 12hr. can

그리고 일 시스템에서 고장의 실제 발생여부와 제1 내지 3 고장진단모델(model 1~3)이 일 시스템에 대한 고장의 예측여부가 각각 본 도면과 같이 도시될 수 있다. 완전모델(perfect)은 고장의 실제 발생여부를 틀리게 예측하지 않으므로 FN데이터 및 FP데이터는 모두 0(zero)값을 가질 수 있다. 반면에 제1 내지 3 고장진단모델(model 1~3)은 불완전하므로 고장의 실제 발생여부를 틀리게 예측할 수 있다. 제1 내지 3 고장진단모델(model 1~3)에서 FN데이터 및 FP데이터는 일정한 값을 가지게 된다. In addition, whether or not a failure actually occurs in one system and whether or not the first to third failure diagnosis models (models 1 to 3) predict a failure for one system may be shown as shown in this figure. Since a perfect model does not incorrectly predict whether a failure actually occurs, both FN data and FP data may have a value of 0 (zero). On the other hand, since the first to third failure diagnosis models (models 1 to 3) are incomplete, it is possible to predict the actual occurrence of a failure incorrectly. In the first to third failure diagnosis models (models 1 to 3), FN data and FP data have constant values.

장치의 제어부는 제1 내지 3 고장진단모델(model 1~3)이 동일한 시스템을 진단 및 예측에 적용되었을 때 도출되는 가용도를 기준으로, 제1 내지 3 고장진단모델(model 1~3)의 성능을 판단할 수 있다. 제어부는 제1 내지 3 고장진단모델(model 1~3)에 대한 실제데이터 및 예측데이터를 가지고 각각의 오차행렬을 만들 수 있다. 그리고 제어부는 수학식 2에 오차행렬을 구성하는 TP데이터, FN데이터, FP데이터, TN데이터, N데이터 및 P데이터를 적용함으로써, 가용도를 각각 산출할 수 있다. 완전모델과 제1 내지 3 고장진단모델(model 1~3)로부터 산출된 시스템의 가용도는 오차행렬의 옆에 각각 도시될 수 있다. The controller of the device determines the availability of the first to third failure diagnosis models (models 1 to 3) based on the availability derived when the same system is applied to diagnosis and prediction. performance can be judged. The control unit may create each error matrix using actual data and predicted data for the first to third failure diagnosis models (models 1 to 3). Further, the control unit may calculate the availability, respectively, by applying TP data, FN data, FP data, TN data, N data, and P data constituting the error matrix to Equation 2. The availability of the system calculated from the complete model and the first to third fault diagnosis models (models 1 to 3) may be respectively shown next to the error matrix.

추가적으로 고장진단모델의 성능 지표로서 정확도(accuracy), 정밀도(precision), recall(재현도) 및 F1score가 활용될 수 있다. 정확도는 고장진단모델이 얼마나 정확한지를 나타낼 수 있다. 정밀도는 고장진단모델이 얼마나 믿을만한지를 나타낼 수 있다. 재현도는 고장진단모델이 관심영역을 얼마나 잘 추출했는지를 나타낼 수 있다. F1score는 정밀도와 재현도의 합에 대한 정밀도와 재현도의 곱으로 나타낼 수 있다. Additionally, accuracy, precision, recall, and F1score can be used as performance indicators of the fault diagnosis model. Accuracy can indicate how accurate the diagnostic model is. Precision can indicate how reliable a diagnostic model is. Reproducibility can indicate how well the failure diagnosis model extracted the region of interest. F1score can be expressed as the product of precision and recall for the sum of precision and recall.

본 도면을 참조하면, 제1 예시의 경우 가용도는 제2 고장진단모델(model 2)이 시스템을 진단 및 예측하였을 때 가장 높다. 장치의 제어부는 제1 내지 3 고장진단모델(model 1~3) 중에서 제2 고장진단모델(model 2)의 성능이 가장 우수한 것으로 판정할 수 있다. 그 이유는 FN데이터가 0(zero)로서 제2 고장진단모델(model 2)이 고장이 실제 발생하였음에도 정상이라고 예측한 미스(miss)을 가장 적게 발생하기 때문이다. 고장이 사고를 야기하는 경우 미스를 가장 적게 발생시키는 고장진단모델이 유리할 수 있다. Referring to this figure, in the case of the first example, the availability is highest when the second failure diagnosis model (model 2) diagnoses and predicts the system. The controller of the device may determine that the performance of the second failure diagnosis model (model 2) is the best among the first to third failure diagnosis models (models 1 to 3). The reason is that the FN data is 0 (zero), and the second failure diagnosis model (model 2) generates the least number of misses predicted to be normal even when failures actually occur. If a failure causes an accident, a failure diagnosis model that causes the least number of misses may be advantageous.

도 5는 일 실시예에 따른 가용도에 기반하여 고장진단모델을 평가하는 제2 예시도이다. 5 is a second exemplary diagram for evaluating a failure diagnosis model based on availability according to an embodiment.

도 5를 참조하면, 도 4를 참조하면, 일 실시예에 따른 장치가 여러 가지 고장진단모델을 평가하는 제2 예시가 도시될 수 있다. 제1 예시와 다르게, 제2 예시는 고장이 사고를 야기하지 않는 것을 가정할 수 있다. 그러면 고장 사이의 간격 시간인 MTBF는 1000hr, 고장을 검출하기 위한 검사시간인 Tinspect는 2hr, 고장 예측을 성공한 경우의 복구시간인 MTTRtrue는 4hr, 고장 예측을 실패한 경우의 복구시간인 MTTRmiss는 4hr이 될 수 있다. 고장이 사고를 야기하지 않으므로 제1 예시와는 다르게 MTTRmiss이 4hr로 더 짧을 수 있다.Referring to FIG. 5 and FIG. 4 , a second example of evaluating various failure diagnosis models by the apparatus according to an embodiment may be shown. Unlike the first example, the second example may assume that a failure does not cause an accident. Then, the interval time between failures, MTBF, is 1000hr, the inspection time for detecting a failure, Tinspect, is 2hr, the recovery time when failure prediction succeeds, MTTRtrue is 4hr, and the recovery time when failure prediction fails, MTTRmiss is 4hr. can Since failure does not cause an accident, MTTRmiss may be shorter as 4hr, unlike the first example.

마찬가지로, 제2 예시의 경우 가용도는 제3 고장진단모델(model 3)이 시스템을 진단 및 예측하였을 때 가장 높다. 장치의 제어부는 제1 내지 3 고장진단모델(model 1~3) 중에서 제3 고장진단모델(model 3)의 성능이 가장 우수한 것으로 판정할 수 있다. 그 이유는 FP데이터가 0(zero)로서 제3 고장진단모델(model 3)이 고장이 실제 발생하지 않았음에도 고장이라고 예측한 거짓 경보(false alarm)을 가장 적게 발생하기 때문이다. 고장이 사고를 야기하지 않은 경우 거짓 경보를 가장 적게 발생시키는 고장진단모델이 유리할 수 있다.Similarly, in the case of the second example, availability is highest when the third failure diagnosis model (model 3) diagnoses and predicts the system. The control unit of the apparatus may determine that the third failure diagnosis model (model 3) has the best performance among the first to third failure diagnosis models (models 1 to 3). The reason is that the FP data is 0 (zero), and the third failure diagnosis model (model 3) generates the least number of false alarms that predicted a failure even though the failure did not actually occur. If the failure did not cause an accident, a fault diagnosis model that produces the fewest false alarms may be advantageous.

본 발명의 보호범위가 이상에서 명시적으로 설명한 실시예의 기재와 표현에 제한되는 것은 아니다. 또한, 본 발명이 속하는 기술분야에서 자명한 변경이나 치환으로 말미암아 본 발명의 보호범위가 제한될 수도 없음을 다시 한 번 첨언한다.The protection scope of the present invention is not limited to the description and expression of the embodiments explicitly described above. In addition, it is added once again that the protection scope of the present invention cannot be limited due to obvious changes or substitutions in the technical field to which the present invention belongs.

Claims (10)

시스템에 고장의 발생을 예측하는 고장진단모델을 평가하는 장치에 있어서,
상기 시스템의 동작시간(uptime) 및 중지시간(downtime)에 기반하여 상기 시스템이 중단없이 동작하는 정도를 나타내는 제1 가용도를 산출하고, 상기 시스템에서 고장의 실제 발생여부와 상기 고장진단모델에 의한 고장의 예측여부를 상기 제1 가용도에 반영하여 제2 가용도를 산출하고, 상기 제2 가용도를 상기 시스템에 대한 최종적인 가용도로 결정하며, 상기 제2 가용도에 기반하여 상기 고장진단모델의 성능을 판단하는 제어부 및
고장의 실제 발생여부에 대한 실제데이터 및 고장의 예측여부에 대한 예측데이터를 획득하여 상기 제어부로 전달하는 입력부를 포함하고,
상기 제어부는, 고장이 실제 발생하고 상기 고장진단모델이 고장(fault)이라고 예측한 경우의 수를 나타내는 TP(true positive)데이터, 고장이 실제 발생하고 상기 고장진단모델이 정상(normal)이라고 예측한 경우의 수를 나타내는 FN(false negative)데이터, 고장이 실제 발생하지 않고 상기 고장진단모델이 고장이라고 예측한 경우의 수를 나타내는 FP(false positive)데이터, 고장이 실제 발생하지 않고 상기 고장진단모델이 정상이라고 예측한 경우의 수를 나타내는 TN(true negative)데이터, 고장이 실제 발생한 경우의 수를 나타내는 F(fault)데이터 및 고장이 실제 발생하지 않은 경우의 수를 나타내는 N(normal)데이터를 생성하고,
상기 제어부는, 상기 동작시간에 고장 사이의 간격을 나타내는 고장간격시간을 반영하고, 상기 중지시간에 고장을 검출하기 위한 검사시간과 상기 시스템을 복구하기 위한 복구시간을 반영하며,
상기 제어부는, 상기 TP데이터, 상기 FN데이터, 상기 FP데이터, 상기 TN데이터, 상기 F데이터, 상기 N데이터, 상기 고장간격시간, 상기 검사시간 및 상기 복구시간으로부터 상기 제2 가용도를 산출하는 시스템 가용도에 기반하여 고장진단모델을 평가하는 장치.
An apparatus for evaluating a failure diagnosis model predicting the occurrence of a failure in a system,
Based on the uptime and downtime of the system, a first availability indicating the degree to which the system operates without interruption is calculated, and whether a failure actually occurs in the system and the failure diagnosis model The failure diagnosis model calculates a second availability by reflecting whether a failure is predicted in the first availability, determines the second availability as a final availability for the system, and based on the second availability A control unit for determining the performance of and
An input unit for acquiring actual data on whether a failure actually occurs and prediction data on whether a failure is predicted and transmitting them to the control unit;
The control unit includes TP (true positive) data indicating the number of cases in which a failure actually occurs and the failure diagnosis model predicts that it is a fault, and a failure actually occurs and the failure diagnosis model predicts that it is normal. FN (false negative) data indicating the number of cases, FP (false positive) data indicating the number of cases where a failure does not actually occur and the failure diagnosis model predicts a failure, and failure does not actually occur and the failure diagnosis model TN (true negative) data representing the number of cases predicted to be normal, F (fault) data representing the number of cases where a failure actually occurred, and N (normal) data representing the number of cases where a failure did not actually occur are generated. ,
The control unit reflects a failure interval time indicating an interval between failures in the operation time, and reflects an inspection time for detecting a failure and a recovery time for restoring the system in the stop time,
The control unit calculates the second availability from the TP data, the FN data, the FP data, the TN data, the F data, the N data, the failure interval time, the inspection time, and the recovery time. A device that evaluates a fault diagnosis model based on availability.
삭제delete 삭제delete 삭제delete 제1항에 있어서,
상기 제어부는,
다음의 수학식을 이용하여 상기 제2 가용도를 산출하는 시스템 가용도에 기반하여 고장진단모델을 평가하는 장치.
Figure 112023015979729-pat00012

TP : TP데이터, FN : FN데이터, FP : FP데이터, TN : TN데이터, F : F데이터, N : N데이터, MTBF(mean time between failure) : 고장간격시간, Tinspect : 검사시간, MTTR(mean time to restoration)true : 제1 복구시간(고장이 실제 발생한 경우 상기 고장진단모델이 고장이라고 예측한 경우), MTTR(mean time to restoration)miss : 제2 복구시간(고장이 실제 발생한 경우 상기 고장진단모델이 정상이라고 예측한 경우),
According to claim 1,
The control unit,
An apparatus for evaluating a failure diagnosis model based on system availability for calculating the second availability using the following equation.
Figure 112023015979729-pat00012

TP: TP data, FN: FN data, FP: FP data, TN: TN data, F: F data, N: N data, MTBF (mean time between failure): failure interval time, Tinspect: test time, MTTR (mean time to restoration)true: 1st recovery time (when a failure actually occurs, if the failure diagnosis model predicts a failure), MTTR (mean time to restoration) miss: 2nd recovery time (if a failure actually occurs, the failure diagnosis if the model predicted normal),
시스템에 고장의 발생을 예측하는 고장진단모델을 평가하는 방법에 있어서,
상기 시스템의 동작시간(uptime) 및 중지시간(downtime)에 기반하여 상기 시스템이 중단없이 동작하는 정도를 나타내는 제1 가용도를 산출하는 단계;
상기 시스템에서 고장의 실제 발생여부와 상기 고장진단모델에 의한 고장의 예측여부를 상기 제1 가용도에 반영하여 제2 가용도를 산출하는 단계;
상기 제2 가용도를 상기 시스템에 대한 최종적인 가용도로 결정하는 단계; 및
상기 제2 가용도에 기반하여 상기 고장진단모델의 성능을 판단하는 단계를 포함하고,
상기 제2 가용도를 산출하는 단계는,
고장이 실제 발생하고 상기 고장진단모델이 고장(fault)이라고 예측한 경우의 수를 나타내는 TP(true positive)데이터, 고장이 실제 발생하고 상기 고장진단모델이 정상(normal)이라고 예측한 경우의 수를 나타내는 FN(false negative)데이터, 고장이 실제 발생하지 않고 상기 고장진단모델이 고장이라고 예측한 경우의 수를 나타내는 FP(false positive)데이터, 고장이 실제 발생하지 않고 상기 고장진단모델이 정상이라고 예측한 경우의 수를 나타내는 TN(true negative)데이터, 고장이 실제 발생한 경우의 수를 나타내는 F(fault)데이터 및 고장이 실제 발생하지 않은 경우의 수를 나타내는 N(normal)데이터를 생성하는 단계;
상기 동작시간에 고장 사이의 간격을 나타내는 고장간격시간을 반영하고 상기 중지시간에 고장을 검출하기 위한 검사시간과 상기 시스템을 복구하기 위한 복구시간을 반영하는 단계; 및
상기 TP데이터, 상기 FN데이터, 상기 FP데이터, 상기 TN데이터, 상기 F데이터, 상기 N데이터, 상기 고장간격시간, 상기 검사시간 및 상기 복구시간으로부터 상기 제2 가용도를 산출하는 단계를 포함하는
시스템 가용도에 기반하여 고장진단모델을 평가하는 방법.
A method for evaluating a failure diagnosis model for predicting the occurrence of a failure in a system,
Calculating a first availability indicating the degree to which the system operates without interruption based on uptime and downtime of the system;
calculating a second availability by reflecting whether a failure actually occurs in the system and whether a failure is predicted by the failure diagnosis model in the first availability;
determining the second availability as the final availability for the system; and
Determining performance of the failure diagnosis model based on the second availability,
Calculating the second availability,
TP (true positive) data indicating the number of cases in which a failure actually occurs and the failure diagnosis model predicts that it is a fault, and the number of cases in which a failure actually occurs and the failure diagnosis model predicts that it is normal FN (false negative) data indicating, FP (false positive) data indicating the number of cases in which a failure does not actually occur and the failure diagnosis model predicts a failure, and failure does not actually occur and the failure diagnosis model predicts that it is normal Generating TN (true negative) data representing the number of cases, F (fault) data representing the number of cases in which a failure actually occurred, and N (normal) data representing the number of cases in which a failure did not actually occur;
reflecting a failure interval time indicating an interval between failures in the operation time and reflecting an inspection time for detecting a failure and a recovery time for restoring the system in the stop time; and
Calculating the second availability from the TP data, the FN data, the FP data, the TN data, the F data, the N data, the failure interval time, the inspection time, and the recovery time
A method for evaluating fault diagnosis models based on system availability.
삭제delete 삭제delete 삭제delete 제6항에 있어서,
다음의 수학식을 이용하여 상기 제2 가용도를 산출하는 시스템 가용도에 기반하여 고장진단모델을 평가하는 방법.
Figure 112023015979729-pat00013

TP : TP데이터, FN : FN데이터, FP : FP데이터, TN : TN데이터, F : F데이터, N : N데이터, MTBF(mean time between failure) : 고장간격시간, Tinspect : 검사시간, MTTR(mean time to restoration)true : 제1 복구시간(고장이 실제 발생한 경우 상기 고장진단모델이 고장이라고 예측한 경우), MTTR(mean time to restoration)miss : 제2 복구시간(고장이 실제 발생한 경우 상기 고장진단모델이 정상이라고 예측한 경우),
According to claim 6,
A method of evaluating a fault diagnosis model based on system availability, wherein the second availability is calculated using the following equation.
Figure 112023015979729-pat00013

TP: TP data, FN: FN data, FP: FP data, TN: TN data, F: F data, N: N data, MTBF (mean time between failure): failure interval time, Tinspect: test time, MTTR (mean time to restoration)true: 1st recovery time (when a failure actually occurs, if the failure diagnosis model predicts a failure), MTTR (mean time to restoration) miss: 2nd recovery time (if a failure actually occurs, the failure diagnosis if the model predicted normal),
KR1020220148108A 2022-11-08 2022-11-08 Apparatus for evaluating fault diagnosis model based on system availability and method thereof KR102533298B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220148108A KR102533298B1 (en) 2022-11-08 2022-11-08 Apparatus for evaluating fault diagnosis model based on system availability and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220148108A KR102533298B1 (en) 2022-11-08 2022-11-08 Apparatus for evaluating fault diagnosis model based on system availability and method thereof

Publications (1)

Publication Number Publication Date
KR102533298B1 true KR102533298B1 (en) 2023-05-17

Family

ID=86547146

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220148108A KR102533298B1 (en) 2022-11-08 2022-11-08 Apparatus for evaluating fault diagnosis model based on system availability and method thereof

Country Status (1)

Country Link
KR (1) KR102533298B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450415B1 (en) * 2002-11-15 2004-09-30 한국전자통신연구원 A Network Management Method using Availability Prediction
KR20180081396A (en) * 2017-01-06 2018-07-16 서울교통공사 System Of City Railway RAMS Integrated Management
KR20200041515A (en) * 2018-10-12 2020-04-22 한국수력원자력 주식회사 Early warning system and method of power plants using multiple prediction model
KR20210055992A (en) * 2019-11-08 2021-05-18 엘지전자 주식회사 Artificial intelligence model managing method and apparatus therefor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450415B1 (en) * 2002-11-15 2004-09-30 한국전자통신연구원 A Network Management Method using Availability Prediction
KR20180081396A (en) * 2017-01-06 2018-07-16 서울교통공사 System Of City Railway RAMS Integrated Management
KR20200041515A (en) * 2018-10-12 2020-04-22 한국수력원자력 주식회사 Early warning system and method of power plants using multiple prediction model
KR20210055992A (en) * 2019-11-08 2021-05-18 엘지전자 주식회사 Artificial intelligence model managing method and apparatus therefor

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
김재훈 외 3명, "철도시스템의 RAM 체계구축을 위한 가용도 적용에 관한 연구", 한국철도학회 2006년도 추계학술대회논문집, 2006.11.30. *

Similar Documents

Publication Publication Date Title
KR102061810B1 (en) System and Method for Processing Multi type Sensor Signal Based on Multi modal Deep Learning
US10643187B2 (en) Reporting and prioritizing faults for aircraft downtime reduction
Compare et al. Reliability model of a component equipped with PHM capabilities
CN113467420B (en) Method and device for detecting zone controller fault
US9310345B2 (en) Sensor system, computer, and machine
CN104756029B (en) A kind of system of the parts group of monitoring device
JP6655926B2 (en) Fault diagnosis system
US10094740B2 (en) Non-regression method of a tool for designing a monitoring system of an aircraft engine
CN116670608A (en) Hybrid ensemble method for predictive modeling of Internet of things
CN102141948A (en) Noisy monitor detection and intermittent fault isolation
CN114239734A (en) Distributed vehicle-mounted health management system
JP2010049359A (en) Plant monitoring device and plant monitoring method
KR102516227B1 (en) A system for predicting equipment failure in ship and a method of predicting thereof
KR20230125116A (en) The method for fault detection without training data or diagnosis with prediction of remaining time until breakdown using clustering algorithm and statistical methods
KR20210084094A (en) Battery status monitoring system of wireless vibration sensor and method therefor
KR102533298B1 (en) Apparatus for evaluating fault diagnosis model based on system availability and method thereof
US8359577B2 (en) Software health management testbed
CN111579001A (en) Fault detection method and device for robot
KR20210087373A (en) Apparatus for diagnosing plant failure and method therefor
CN116907772A (en) Self-diagnosis and fault source identification method and system of bridge structure monitoring sensor
Dzakowic et al. Advanced Techniques for the verification and validation of prognostics & health management capabilities
KR101736230B1 (en) System and method for quantifying the fault detection rate
ZHANG et al. Approach to anomaly detection in microservice system with multi-source data streams
JP2016085496A (en) Abnormality sign detection device and method of computer system
CN112712304A (en) Spacecraft prediction and health management system evaluation system

Legal Events

Date Code Title Description
GRNT Written decision to grant