KR20220154827A

KR20220154827A - 비-선형 특성들을 갖는 성능 저하 예측

Info

Publication number: KR20220154827A
Application number: KR1020227038021A
Authority: KR
Inventors: 네다 코르다지; 모스후드 오몰레이드 살리우
Original assignee: 인터내셔널 비지네스 머신즈 코포레이션
Priority date: 2020-05-11
Filing date: 2021-05-05
Publication date: 2022-11-22
Also published as: US11175973B1; WO2021229371A1; GB202218236D0; US20210349772A1; DE112021002699T5; GB2610965A; IL296764A; CN115699037A; AU2021271205A1; CA3175610A1; JP2023525959A; AU2021271205B2

Abstract

비-선형 특성들을 갖는 성능 저하 예측(PREDICTION OF PERFORMANCE DEGRADATION WITH NON-LINEAR CHARACTERISTICS)
비-선형 특성들을 갖는 점진적인 성능 저하를 예측하는 기술들의 설명이 제공된다. 상기 기술들은 방법을 포함하고, 상기 방법은 고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계를 포함하며, 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되며, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되고, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되며, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관된다. 상기 방법은 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 더 포함한다.

Description

비-선형 특성들을 갖는 성능 저하 예측

[0001] 본 발명은 예측 모델링에 관한 것이고, 보다 상세하게는, 비-선형 특성들을 갖는 성능 저하 예측(prediction of performance degradation with non-linear characteristics)에 관한 것이다.

[0002] 비-선형 성능 저하는 하나 혹은 그 이상의 기계 시스템들 또는 엘리멘트들의 점진적인 열화(the gradual deterioration)와 관련된 현상을 포함할 수 있고, 하나 혹은 그 이상의 기계 시스템들 또는 엘리멘트들의 점진적인 열화는 궁극적으로 고장, 또는 영구적인 성능 저하(sub-optimal performance)로 이어질 수 있다. 비-선형 성능 저하와 관련된 이러한 점진적인 열화는 모든 유형의 마모(wear) (예를 들어, 다른 물치와의 상호 작용에 따라 컴포넌트의 점진적 제거 또는 변형에 의한 약화), 피로(fatigue)(예를 들어, 주기적 부하로 인한 약화), 크리프(creep)(예를 들어, 지속적인 기계적 응력들(stresses)로 인한 변형) 및/또는 기타 비-선형 현상과 관련될 수 있다. 비-선형 성능 저하는 기계적, 화학적, 열적, 또는 기타 응력들에 의해 유발될 수 있다. 예를 들어, 마모 현상은 연마 마모, 침식 마모, 부식 마모(abrasive wear, erosive wear, corrosive wear), 및 기타 유형들의 마모를 포함할 수 있다.

[0003] 그러나, 마모로-인한 저하와 같은 비-선형 성능 저하를 예측하는 것은 많은 문제들(challenges)을 안고 있다. 첫째, 마모는 장기간에 걸쳐 진행되는 점진적인 고장(failure)이다. 따라서, 정상 상태들과 마모 상태들 사이의 관계는 비선형적이므로 선형 모델들(예를 들어, 나이브 베이즈(Naive Bayes), 서포트 벡터 머신들(SVM), 등)을 적용할 수 없다. 게다가, 유사한 자산들 간의 마모 고장의 진행은, 예를 들어, 사용 특성들에 따라 매우 가변적이다(예를 들어, 일부 자산들은 50일 만에 고장이 나고 다른 자산들은 6개월 만에 고장이 난다). 예를 들어, 프로그래싱 캐비티 펌프들(progressing cavity pumps)(PCP들)의 마모-관련 성능 저하는, 여러 요인들에 따라 달라질 수 있는데, 예를 들어, 지하 지질 형성 유형(sub-surface geological formation type), 모래 입도, 및/또는 특정 PCP의 운영 프로파일에 따라 달라질 수 있다. 따라서, 시간 대 고장의 함수로서(as a function of time-to-failure) 고장까지의-시간에 따른 성능 저하 수준은 다양한 운영 요인들에 따라 여러 자산들에 걸쳐 동일 시점(same time-point)에서 달라질 수 있다.

[0004] 비-선형 성능 저하를 예측하는 또 다른 문제(challenge)는 마모-관련 성능 저하와 같은 비-선형 성능 저하를 경험하는 자산의 정상 작동 상태들과 결함 작동 상태들 간의 불균형과 관련이 있다. 다시 말해, 훈련 데이터 세트의 대다수(예: 90% 이상)는 정상적인 성능으로 구성되며 결함이 있는 성능을 나타내는 데이터는 거의 없다. 불균형한 훈련 데이터에서 정확한 예측들을 하는 것은 매우 어렵다. 예를 들어, 고도로 파라미터화 된 비선형 방법들(예: 인공 신경망들(Artificial Neural Networks: ANNs))을 이용하는 것은 지금까지는 합리적인 해결방안이 아니다. ANN에서 방대한 수의 파라미터들을 미세 조정하고 최적화할 수 있기 위해서는, 엄청난 데이터가 필요하다(모든 클래스들의 충분한 예들을 갖는) 그러나, 데이터의 불균형이 심한 경우들에서, 비정상 상태(the anomaly state)의 예들의 수가 ANN을 효과적으로 훈련시키기에는 부족하다. 데이터의 불균형 문제(issue)를 해결하기 위해, 오버-샘플링 및/또는 언더-샘플링 방법들을 사용할 수 있지만, 그러나 이러한 방법들은 궁극적으로 데이터의 원래 분포를 왜곡하여 해결방안(예를 들어, 거짓 양성 표시들 증가로 인한 정확도 감소)을 편향시킬 수 있다.

[0005] 비-선형 성능 저하를 정확하게 예측하는 것과 관련된 또 다른 문제는 마모-관련 성능 저하와 같은 비-선형 성능 저하가 반드시 치명적인 고장은 아니라는 점이다. PCP의 예로 다시 돌아가면, 마모된 PCP가 반드시 작동을 멈추는 것은, 아니지만 로터 블레이드들의 마모로 인해 최적이 아닌 성능 저하의 상태로 작동한다. 이로 인해 "고장 날짜"는 주어진 성능 저하 수준에서 펌프를 교체하기로 한 운영자의 결정에 따라 주관적이다(치명적인 고장 날짜와 대조적으로). 이것은, 차례로, 데이터 라벨링을 복잡하게 만든다(예를 들어, 실제로 PCP가 표준-이하의 성능으로 계속 기능할 때 PCP의 데이터에 고장이 난 것으로 라벨링할 시기를 결정).

[0006] 실제 세계(real-world) 애플리케이션들에서 비-선형 성능 저하를 예측하는 것과 관련된 또 다른 문제는 고장 징후(a failure signature)를 적절하게 식별하는 것과 관련이 있다. 이 문제는 두-가지이다. 첫째는, 고장 징후들을 식별하기 위해 이용 가능한 데이터가 평가되어야 한다. 여기에는 비-선형 성능 저하와 반드시 직접적으로 관련이 없는 데이터로부터 정보를 추론하는 것도 포함될 수 있다. 예를 들어, 마모를 직접 측정하기 위해 명시적으로 마모-관련 성능 저하가 계측되도록 구성된 자산들은 거의 없다. 다시 PCP들의 예로 돌아가며, 속도, 생산 속도, 토크, 및 케이싱 압력 간의 상호 작용들은 고장 징후를 추론할 수 있는 유일한 정보일 수 있다. 둘째, 식별된 고장 징후의 배타성을 평가해야 한다. 다시 말해서, 식별된 고장 징후는 둘 혹은 그 이상의 현상과 상관될 수 있으며, 따라서 거짓 양성들(false positives)이 증가한다. 이상의 내용에 비추어, 비-선형 성능 저하는 다음과 같은 추가 과제들을 제시한다는 것을 알 수 있다: (i) 비-선형 성능 저하에 대해 이용 가능한 데이터로부터 고장 징후를 식별하는 것, 및 (ii) 식별된 고장 징후가 비-선형 성능 저하를 배타적으로(또는 지배적으로) 대표하는지를 결정하는 것.

[0007] 앞서 언급한 문제들의 조합은 비-선형 성능 저하의 예측 모델링 문제를 해결하기 어렵게 만든다. 따라서, 비-선형 현상으로 인한 성능 저하를 정확하게 예측할 수 있는 기술들이 필요하다.

[0008] 본 발명의 실시 예들은 컴퓨터-구현 방법에 관한 것이고, 상기 방법은 고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계를 포함한다. 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련된다. 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관된다. 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관된다. 상기 방법은 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 더 포함한다.

[0009] 유리하게도, 본 발명은 바람직하게는 불균형 훈련 데이터세트로부터 비선형 성능 저하를 정확하게 예측할 수 있다. 또한, 정상 점수 및 비정상 점수는 바람직하게는 분류와 관련된 비정상 정도를 유리하게 정량화 할 수 있다. 본 발명의 또 다른 이점은 바람직하게는 ANN(불균형 교육 데이터를 과도하게 파라미터화하는 경향이 있음)에 의존하지 않고 불균형 훈련 데이터(편향 분류 경향이 있음)의 오버샘플링 또는 언더샘플링 기술에 의존하지 않는다는 것이다.

[0010] 일 바람직한 실시 예에 따라, 본 발명은 상기 룩-백 윈도우가 각각의 개별 훈련 샘플에 포함할 순차적 이전 데이터 포인트들의 양(a quantity of sequentially previous data points)을 정의하는 것을 더 포함한다. 유리하게도, 상기 룩-백 윈도우는 정상 동작 또는 비정상 동작을 나타내는 특징 징후들(feature signatures)의 크기를 조절할 수 있다. 예를 들어, 룩-백 윈도우가 짧을수록 개별 데이터 포인트들에 더 민감할 수 있지만, 룩-백 윈도우가 길수록 개별 데이터 포인트들에 덜 민감할 수 있다.

[0011] 일 바람직한 실시 예에 따라, 상기 방법은 상기 예측 수평선은 미래의 미리 정의된 시간 량을 정의하고, 미래의 미리 정의된 시간 량의 각 데이터 포인트들의 각 라벨들은 상기 각 훈련 샘플들과 연관되는 것을 더 포함한다. 유리하게도, 상기 예측 지평선은 룩-백 윈도우에 의해 정의된 다양한 특징 징후들을 대응하는 미래 결과에 링크할 수 있다. 예를 들어, 예측 수평선이 짧을수록 주어진 예측에 대해 더 짧은 경고를 제공할 수 있는 반면(예: 마모 관련 고장 하루 전) 예측 수평선이 길수록 주어진 예측에 대해 더 긴 경고를 제공할 수 있다(예: 마모- 관련 고장 한달 전).

[0012] 일 바람직한 실시 예에 따라, 상기 방법은 상기 각각의 훈련 샘플들은 K-평균 클러스터링을 사용하여 클러스터 되는 것을 더 포함한다. 유리하게도, K-평균 클러스터링은 효율적이고 확장 가능한 클러스터링 기술이다

[0013] 일 실시 예에 따라, 시스템이 제공되며, 상기 시스템은: 하나 혹은 그 이상의 프로세서들; 및 프로그램 명령들을 저장하는 하나 혹은 그 이상의 컴퓨터-판독 가능 스토리지 매체를 포함하고, 상기 프로그램 명령들은 상기 하나 혹은 그 이상의 프로세서들에 의해 실행될 때, 상기 하나 혹은 그 이상의 프로세서들이 방법을 수행하도록 구성되며, 상기 방법은: 고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계 - 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함한다.

[0014] 일 실시 예에 따라, 컴퓨터 프로그램 제품이 제공되며, 상기 컴퓨터 프로그램 제품은 하나 혹은 그 이상의 컴퓨터 판독 가능 스토리지 매체, 및 상기 하나 혹은 그 이상의 컴퓨터 판독 가능 스토리지 매체 상에 집합적으로 저장된 프로그램 명령들을 포함하고, 상기 프로그램 명령들은 하나 혹은 그 이상의 프로세서들이 방법을 수행하도록 구성된 명령들을 포함하며, 상기 방법은: 고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계 - 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함한다.

[0015] 본 발명의 다른 실시 예들은 프로그래싱 캐비티 펌프들(PCP들)의 마모-관련 열화를 예측하기 위한 컴퓨터-구현 방법에 관한 것이고, 상기 방법은 PCP의 마모-관련 열화를 예측하도록 구성된 모델에 상기 PCP의 새로운 데이터 샘플을 입력하는 단계를 포함한다. 상기 모델은 라벨 된 과거 PCP 데이터 세트(a labeled historical PCP dataset)를 사용하여 훈련된다. 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관된다. 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관된다. 상기 방법은 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함하고, 상기 분류는 PCP의 마모 관련 저하를 나타낸다.

[0016] 유리하게도, 본 발명의 전술한 실시 예는 PCP 관련 데이터의 불균형 훈련 데이터세트로부터 PCP의 마모 관련 열화의 비선형 성능 저하를 바람직하게 정확하게 예측할 수 있다. 또한, 정상 점수(normalcy score) 및 비정상(anomaly score)는 바람직하게는 분류와 연관된 비정상 정도를 유리하게 정량화 할 수 있다.

[0017] 본 발명의 또 다른 실시 예들은 프로그래싱 캐비티 펌프들(PCP들)의 마모-관련 열화를 예측하기 위한 컴퓨터 구현 방법에 관한 것이고, 상기 방법은 하나 혹은 그 이상의 PCP들과 연관된 과거 데이터의 이진 라벨링을 수행하여 라벨 된 과거 데이터를 생성하는 단계를 포함한다. 상기 방법은 또한 상기 라벨 된 과거 데이터의 각 데이터 포인트들에 룩-백 윈도우 및 예측 지평선을 적용함으로써 복수의 훈련 데이터 샘플들을 생성하는 단계를 더 포함한다. 상기 방법은 상기 복수의 훈련 데이터 샘플들을 복수의 클러스터들로 클러스터 하는 단계를 더 포함한다. 상기 방법은 상기 복수의 클러스터들의 각 클러스터들에 대한 클러스터 점수들을 계산하는 단계를 더 포함한다. 상기 방법은 PCP의 새로운 데이터 샘플을 상기 복수의 클러스터들 중 제1 클러스터에 할당하는 단계를 더 포함한다. 상기 방법은 상기 제1 클러스터와 연관된 클러스터 점수들에 기초하여 상기 새로운 데이터 샘플에 분류를 할당하는 단계를 더 포함하고, 상기 분류는 PCP의 향후 마모-관련 열화의 가능성을 나타낸다.

[0017] 유리하게도, 본 발명의 전술한 실시 예는 PCP 관련 데이터의 불균형 훈련 데이터세트로부터 PCP의 마모 관련 열화의 비선형 성능 저하를 바람직하게 정확하게 예측할 수 있다. 또한, 상기 클러스터 점수들은 바람직하게는 분류와 연관된 비정상 정도를 유리하게 정량화 할 수 있다.

[0019] 일 바람직한 실시 예에 따라, 상기 방법은 상기 라벨 된 과거 데이터는 알려진 펌프 교체 날짜 이전의 미리 결정된 기간 동안 결함이 있는 것으로 라벨 되는 것을 더 포함한다. 유리하게도, 본 발명의 이 실시예는 "정상" 및 "결함" 데이터 사이의 명확한 결정 경계를 제공하며, 그러나 그러한 결정적 결정 경계는 마모 관련 성능 저하의 비선형 및 점진적 특성으로 인해 다른 경우에 반드시 존재하는 것은 아니다.

[0020] 일 바람직한 실시 예에 따라, 상기 방법은 상기 과거 데이터는 상기 PCP와 관련된 펌프 속도 데이터, 펌프 토크 데이터, 케이싱 압력 데이터, 생산 속도 데이터, 및 유지보수 기록들(comprises pump speed data, pump torque data, casing pressure data, production rate data, and maintenance records)을 포함하는 것을 더 포함한다. 유리하게도, 이것은 PCP들이 이용할 수 있는 데이터이다. 다시 말해서, 이 데이터를 사용하여 PCP 성능의 마모 관련 열화들을 예측하면 추가 데이터 계측이 필요하지 않다.

[0021] 일 바람직한 실시 예에 따라, 상기 방법은 상기 각각의 클러스터들에 대한 클러스터 점수들을 계산하는 단계가 상기 제1 클러스터에 대한 정상 점수를 계산하는 단계를 포함하는 것을 더 포함하고, 상기 정상 점수는 상기 제1 클러스터 내의 정상 상태와 연관된 훈련 데이터 샘플들의 제1 부분을 상기 복수의 훈련 데이터 샘플들 내의 정상 상태와 연관된 훈련 데이터 샘플들의 제2 부분에 의해 나눈 값이다. 상기 클러스터 점수들을 계산하는 단계는 상기 제1 클러스터에 대한 비정상 점수를 계산하는 단계를 더 포함하고, 상기 비정상 점수는 상기 제1 클러스터 내의 열화된 상태와 연관된 훈련 데이터 샘플들의 제3 부분을 상기 복수의 훈련 데이터 샘플들의 열화된 상태와 연관된 훈련 데이터 샘플들의 제4 부분에 의해 나눈 값이다. 유리하게도, 정상 점수들 및 비정상 점수들을 계산하는 단계는 예측된 분류들의 상대적인 비정상 정도를 정량화하여 분류에 추가 정확도와 컨텍스트를 제공한다.

[0022] 일 바람직한 실시 예에 따라, 상기 방법은 상기 새로운 데이터 샘플에 대한 고장 신호(a failure signal)를 생성하는 단계를 더 포함하고, 상기 고장 신호는 미리 결정된 수의 이전 데이터 포인트들에 대해 상기 새로운 데이터 샘플에 대한 평균 비정상 점수를 포함한다. 유리하게도, 고장 신호는 주어진 데이터 샘플에 대한 비정상 점수들의 후-처리된 평활화(a post-processed smoothing)를 나타내며, 이에 의해 데이터 스트림에 대한 순차적 비정상 점수들에서 거짓 긍정들 및/또는 노이즈를 줄인다.

[0023] 본 발명의 추가적인 실시 에들은 위에서 설명된 방법을 수행하도록 구성된 시스템들 및 컴퓨터 프로그램 제품들에 관한 것이다. 본 요약은 본 발명의 모든 구현들 및/또는 모든 실시예들의 각각을 예시하도록 의도되지 않는다.

[0024] 이제 본 발명의 바람직한 실시 예들이, 다음 도면들을 참조하여, 단지 예로서, 설명될 것이다:
도 1은 본 발명의 일부 실시 예들에 따른, 예시적인 계산 환경의 블록도를 도시한다.
도 2는 본 발명의 일부 실시 예들에 따른, 예시적인 고장 예측 모델의 블록도를 도시한다.
도 3은 본 발명의 일부 실시 예들에 따른, 비-선형 특성들을 갖는 성능 저하를 예측하기 위한 예시적인 방법의 플로 차트를 도시한다.
도 4는 본 발명의 일부 실시 예들에 따른, 고장 예측 모델을 훈련하기 위한 예시적인 방법의 플로 차트를 도시한다.
도 5A는 본 발명의 일부 실시 예들에 따른, 고장 예측 모델로부터의 출력에 기초하여 결과를 생성하기 위한 예시적인 방법의 플로 차트를 도시한다.
도 5B는 본 발명의 일부 실시 예들에 따른, 고장 신호를 계산하기 위한 예시적인 방법의 플로 차트를 도시한다.
도 6A는 본 발명의 일부 실시 예들에 따른, 고장 일들의 함수로서 누적 비정상 점수의 그래프의 실험 결과를 도시한다.
도 6B는 본 발명의 일부 실시 예들에 따른, 고장 일들의 함수로서 실패 라벨의 강도의 그래프의 실험 결과들을 도시한다.
도 7은 본 발명의 일부 실시 예들에 따른, 실패 이전의 다양한 기간들에 대한 혼동 행렬들의 실험 결과들을 도시한다.
도 8은 본 발명의 일부 실시 예들에 따른, 예시적인 컴퓨터의 블록도를 도시한다.
도 9는 본 발명의 일부 실시 예들에 따른, 클라우드 컴퓨팅 환경들을 도시한다.
도 10은 본 발명의 일부 실시 예들에 따른, 추상적 모델 층들을 도시한다.
[0025] 본 발명 내용은 다양한 수정들 및 대안적 형태들이 가능하지만, 그 세부사항들은 도면들에서 예로서 도시되었고 상세하게 설명될 것이다. 그러나, 본 발명내용을 설명된 특정 실시 예들로 제한하려는 의도가 아님을 이해해야 한다. 반대로, 의도는 본 발명 내용의 정신 및 범위 내에 속하는 모든 수정들, 균등물들, 및 대안들을 포괄하는 것이다.

[0026] 본 발명의 실시 예들은 예측 모델링(predictive modeling)에 관한 것이고, 보다 구체적으로, 비-선형 특성들을 갖는 성능 저하(performance degradation with non-linear characteristics)를 예측하는 것에 관한 것이다. 본 발명의 실시 예들은 그러한 애플리케이션들로 제한되지 않으나, 그러한 애플리케이션들의 전술한 맥락에 비추어 더 잘 이해될 수 있다.

[0027] 본 발명의 실시 예들은 자산의 다가오는 고장을 예측하고 그 고장 이전에 자산의 예방적 유지보수를 권고하기 위해 비-선형 고장 메커니즘(예를 들어, 마모, 피로, 크리프, 등)의 초기 단계들 동안 자산 성능의 저하를 감지하는 기술들에 관한 것이다. 본 발명의 실시 예들은 자산의 과거 데이터를 입력으로 수집하고 비정상 점수(an anomaly score), 분류, 및/또는 자산의 향후 고장 또는 성능 저하 가능성을 나타내는 고장 신호를 출력으로 생성하는 준-지도 머신 러닝 방법(a semi-supervised machine learning method)을 활용한다.

[0028] 비-선형 현상의 예측 모델링에서 이전에 논의된 문제들을 극복함에 있어서, 본 발명의 실시 예들은 다음과 같은 특징들을 실현하지만, 이에 제한되지 않는다: (i) 정상 데이터와 결함 데이터를 구분하는 비-선형 결정 경계; (ii) 계산적으로 간단한 구현(예를 들어, 비-선형성에도 불구하고, ANN들의 경우처럼 과도하게 파라미터화되지 않음); (iii) 클래스 밸런싱 없음(따라서, 데이터의 원래 분포의 왜곡 및 해결 방안의 후속적인 편향 없음); 및/또는 (iv) 유사한 자산들 군에 쉽게 적용할 수 있는 글로벌 해결 방안.

[0029] 이제 도면들을 참조하면, 도 1은 본 발명의 일부 실시 예들에 따른, 예시적인 계산 환경(100)을 도시한다. 계산 환경(100)은 네트워크(108)를 통해 센서 데이터 기록 시스템(104) 및 엔드포인트 애플리케이션(106)에 통신 가능하게 연결된 고장 예측 시스템(102)을 포함한다. 고장 예측 시스템(102)은 센서 데이터 기록 시스템(104)으로부터 데이터를 수신하고 비-선형 현상으로 인한 관련 자산(110)의 향후 성능 저하와 관련된 예측을 하도록 구성될 수 있다(예를 들어, 미래 시간 간격에서 PCP의 마모-관련 성능 저하 예측). 고장 예측 시스템(102)은 엔드포인트 애플리케이션(106)과 상호작용하도록 추가로 구성될 수 있다. 예를 들어, 고장 예측 시스템(102)은 센서 데이터 기록 시스템(104)으로부터 고장의 모든 표시를 검출하기 위해 엔드포인트 애플리케이션(106)으로부터 요청을 수신할 수 있다. 다른 예로서, 고장 예측 시스템(102)은 센서 데이터 기록 시스템(104)으로부터 식별된 잠재적인 고장 징후들에 관한 업데이트들을 엔드포인트 애플리케이션(106)에 푸시(push)할 수 있다.

[0030] 센서 데이터 기록 시스템(104)은 자산(110)의 기능과 직접적으로 또는 간접적으로 관련된 데이터를 획득하도록 구성된 하나 혹은 그 이상의 데이터 수집 시스템들을 포함할 수 있다. 예를 들어, 자산(110)이 유정 생산 시스템(an oil well production system)의 PCP인 경우, 센서 데이터 기록 시스템(104)은 속도, 토크, 케이싱 압력 및/또는 생산 속도와 같은 데이터를 수집할 수 있지만, 이에 제한되지 않는다. 다른 예로서, 자산(110)이 차량의 기계적 컴포넌트(예를 들어, 연료 펌프, 휠 베어링들, 헤드 개스킷, 등)인 경우, 센서 데이터 기록 시스템(104)은 마일리지, 속도, 엔진 오류 코드들, 등과 같은 데이터를 수집할 수 있지만, 이에 제한되지 않는다. 이들 2개의 비-제한적인 예들로부터 알 수 있는 바와 같이, 센서 데이터 기록 시스템(104)은 자산(110)과 직접 관련된 데이터를 반드시 수집할 필요는 없다. 반대로, 일부 실시 예들에서, 센서 데이터 기록 시스템(104)은 자산(110)과 연관된 다른 컴포넌트들과 연관된 데이터를 수집하지만, 수집된 데이터는 그럼에도 불구하고 자산(110)의 기능에 대한 간접적인 추론들을 제공하는 데 유용할 수 있다. 이것은 비-선형 성능 저하를 예측하기 위해 데이터를 수집하는 시스템의 특정 컴포넌트들을 계측하는 것이 경제적으로 불가능하거나 및/또는 기술적으로 비실용적일 수 있는 경우에 유익할 수 있다. 따라서, 많은 실제-세계 애플리케이션들에서, 비-선형 성능 저하의 예측에는 (i) 비-선형 성능 저하에 대해 사용 가능한 데이터에서 고장 징후를 식별하는 것, 및 (ii) 식별된 고장 징후가 비-선형 성능 저하를 배타적으로(또는 대부분) 대표하는지 여부를 결정하는 것의 문제들이 포함된다.

[0031] 엔드포인트 애플리케이션(106)은, 예를 들어, 데스크탑, 랩탑, 태블릿, 스마트폰, 또는 다른 엔드포인트 디바이스와 같은, 사용자 워크스테이션에서 실행되는 애플리케이션일 수 있다. 엔드포인트 애플리케이션(106)은 사용자가 고장 예측 시스템(102)과 상호작용하기 위한 인터페이스를 제공할 수 있다. 예를 들어, 사용자는 센서 데이터 기록 시스템(104)의 데이터를 기반으로 자산(110)에 대한 예측 고장 분석들을 요청할 수 있다. 다른 예로서, 고장 예측 시스템(102)은 자산(110)과 연관되고 센서 데이터 기록 시스템(104)으로부터의 데이터로부터 검출된 고장 징후에 기초하여 업데이트들, 알림들, 또는 경고들을 엔드포인트 애플리케이션(106)에 푸시할 수 있다. 또한, 일부 실시 예들에서, 엔드포인트 애플리케이션(106)은 사용자가 스트리밍 데이터를 수신하도록 이미 훈련된 고장 예측 시스템(102)을 구성할 수 있는 메커니즘을 제공하고, 여기서 스트리밍 데이터는 고장 예측 시스템(102)(예를 들어, 유정 운영자는 자신의 PCP 데이터를 하나 혹은 그 이상의 다른 PCP들로부터 유사한 PCP 데이터에 대해 이전에 훈련된 고장 예측 시스템(102)으로 스트리밍할 수 있음)을 훈련하는 데 사용되는 자산(110)과 유사한 자산에 대한 것일 수 있다.

[0032] 고장 예측 시스템(102)은, 일부 실시 예들에서, 클라우드 컴퓨팅 아키텍처에서 가상으로 제공될 수 있다(provisioned). 일부 실시 예들에서, 고장 예측 시스템(102)은, 예를 들어, 메인프레임, 컴퓨팅 노드, 데스크탑, 랩탑, 태블릿, 또는 하나 혹은 그 이상의 프로세서들 및 하나 혹은 그 이상의 컴퓨터-판독가능 스토리지 미디어를 포함하는 다른 시스템과 같은, 컴퓨터에 상주할 수 있다.

[0033] 고장 예측 시스템(102)은 데이터 웨어하우스(112), 모델 컨테이너(114), 및 컴퓨팅 엔진(116)을 포함할 수 있다. 데이터 웨어하우스(112)는 센서 데이터 기록 시스템(104)으로부터 수집된 데이터일 수 있고 하나 혹은 그 이상의 데이터의 샘플들을 포함할 수 있는 집계된 센서 데이터(118)를 포함할 수 있다.

[0034] 모델 컨테이너(114)는 집계된 센서 데이터(118)에 대해 실행되어 포맷된 센서 데이터(120)를, 적어도, 부분적으로, 생성할 수 있는 데이터 준비/엔지니어링 유틸리티들(126)을 포함할 수 있다. 예를 들어, 데이터 준비/엔지니어링 유틸리티들(126)은 집계된 센서 데이터(118)를 포맷된 센서 데이터(120)로 변환할 때 비정상 값들(outliers)을 제거하고, 데이터 포맷팅 문제들을 수정하며, 널 값들(null values)을 해결하는 등의 작업을 수행하도록 구성될 수 있다. 일부 실시 예들에서, 포맷된 센서 데이터(120)는, 예를 들어, 집계된 센서 데이터(118)에 적용된 룩-백 윈도우(a look-back window)를 포함할 수 있다.

[0035] 포맷된 센서 데이터(120)는 고장 예측 모델(124)에 입력될 수 있다. 일부 실시 예들에서, 포맷된 센서 데이터(120) 및 고장 예측 모델(124)은 컴퓨팅 엔진(116)의 배치 자원들(130)에 로딩된다. 포맷된 센서 데이터(120)를 입력으로 사용하여 고장 예측 모델(124)을 실행한 후, 컴퓨팅 엔진(116)은 결과들(122)을 생성하고 결과들(122)을 데이터 웨어하우스(112)에 저장할 수 있다. 결과들(122)은, 예를 들어, 비정상 점수, 분류, 및/또는 고장 신호를 포함할 수 있다. 결과들(122)은 비-선형 성능 저하로 인한 미래의 성능 저하 가능성(예를 들어, PCP의 마모-관련 성능 저하 가능성)을 나타낼 수 있다.

[0036] 컴퓨팅 엔진(116)은 예측 서비스(128)를 더 포함할 수 있으며, 여기서 예측 서비스(128)는 엔드포인트 애플리케이션(106)으로부터 요청을 수신하거나, 또는 이에 대한, 푸시 알림을, 구성할 수 있다. 예측 서비스(128)는 고장 예측 시스템(102)의 기능을 조정할 수 있다(orchestrate). 예를 들어, 일부 실시 예들에서, 예측 서비스(128)는 데이터 준비/엔지니어링 유틸리티들(126)이 포맷된 센서 데이터(120)를 생성할 목적들로 배치 자원들(130)을 사용하여 집계된 센서 데이터(118)에 대해 실행되게 할 수 있다. 위의 예를 계속하면, 예측 서비스(128)는 결과들(122)을 생성하기 위해 입력으로서 포맷된 센서 데이터(120)를 사용하고 배치 자원들(130)에 고장 예측 모델(124)을 배치하도록 추가로 구성될 수 있다. 예측 서비스(128)는 결과들(122)을 엔드포인트 애플리케이션(106)에 전송하도록 추가로 구성될 수 있다.

[0037] 이제 도 2로 넘어가면, 본 발명의 일부 실시 예들에 따른 고장 예측 모델(124)의 블록도가 도시되어 있다. 고장 예측 모델(124)은 예를 들어 훈련 모드(200) 및 배치 모드(228)를 포함할 수 있다. 훈련 모드(200)에서, 고장 예측 모델(124)은 고장들 또는 마모로 인한 저하들과 같은 비-선형 성능 저하를 정확하게 예측하도록 훈련된다. 배치 모드(228)에서, 고장 예측 모델(124)은 입력 데이터를 수신하고, 입력 데이터를 포맷하고, 데이터(예를 들어, PCP의 마모로 인한 향후 차선의 성능 예측 등)와 관련된 비-선형 현상과 관련된 예측을 하도록 구성된다.

[0038] 훈련 모드(200)에서, 고장 예측 모델(124)은 하나 혹은 그 이상의 자산들(110)과 연관된 하나 혹은 그 이상의 센서 데이터 기록 시스템들(104)으로부터 과거 데이터(202)를 수신할 수 있고, 여기서 과거 데이터(202)는 훈련 서브세트(204-1) 및 테스트 서브세트(204-2)로 분할된다. 훈련 서브세트(204-1)는 고장 예측 모델(124)을 훈련하고 검증하도록 구성될 수 있으며, 테스트 서브세트(204-2)는 고장 예측 모델(124)을 테스트하는 데 사용될 수 있고, 여기서 테스트는 예를 들어, 정확도, 정밀도, 재현율 등과 같은 고장 예측 모델(124)의 특성들을 정량화 하는 데 사용될 수 있다.

[0039] 훈련 모드(200)는 라벨된 과거 데이터(206)를 더 포함할 수 있고, 라벨된 과거 데이터(206)는 센서 판독들(예를 들어, 속도, 토크, 생산 속도, 케이싱 압력, 등)과 시간-정렬 과거 고장 기록들(예를 들어, PCP 교체들을 나타내는 유지 관리 기록들)로부터 도출될 수 있다. 라벨된 과거 데이터(206)는 자산(110)의 정상 작동을 나타내는 정상 상태를 나타내는 데이터(208-1) 및 자산(110)(예: PCP의 마모 상태)의 차선책, 열화, 또는 고장한 성능을 나타내는 열화된 상태를 나타내는 데이터(208-2)를 포함한다. 정상 상태를 나타내는 데이터(208-1)와 열화 상태를 나타내는 데이터(208-2) 사이의 결정 경계는 주제 전문가(a subject matter expert: SME)에 의해 주관적으로 만들어질 수 있고, 통계적 측정에 의해 객관적으로 만들어지며(예를 들어, 정상 작동 중 평균의 1 표준 편차를 벗어남), 머신 러닝에서 추론하거나 다른 전략들이나 기술들을 사용하여 결정한다. 이전에 논의된 바와 같이, 저하된 상태를 나타내는 데이터(208-2)는 기능하지 않는 자산(110)과 관련된 데이터일 필요는 없다. 오히려, 저하된 상태를 나타내는 데이터(208-2)는 자산(110)이 기능을 유지하더라도 자산(110)의 차선의 성능을 나타낸다. 예를 들어, 일부 실시 예들에서, 자산(110)이 명백한 고장을 경험하거나 혹은 x일에 교체된다면, x일 이전의 미리 결정된 기간의 데이터는 열화 상태를 나타내는 데이터(208-2)로서 자동으로 라벨될 수 있다.

[0040] 훈련 모드(200)는 윈도우된 과거 데이터(210)를 더 포함할 수 있다. 윈도우된 과거 데이터(210)는 룩-백 윈도우(212) 및 예측 수평선(214)을 포함할 수 있다. 룩-백 윈도우(212)는 각각의 데이터 샘플에 포함하기 위해 현재 데이터 포인트 이전의 다수의 데이터 포인트들(예: Dx)를 참조할 수 있다. 예측 수평선(214)은 현재 데이터 포인트로부터 미래의 많은 데이터 포인트들(예: Dy)의 데이터 포인트의 라벨을 참조할 수 있다. 룩-백 윈도우(212) 및 예측 수평선(214)은 훈련 서브세트(204-1)의 각각의 데이터 포인트들을 정상 상태와 관련된 각각의 데이터 샘플들(216-1) 및 열화 상태와 관련된 각각의 데이터 샘플들(216-2) (총칭하여 데이터 샘플들(216)이라고 함)로 변환하는 데 사용될 수 있다. 각각의 데이터 샘플들(216)은, 각각의 데이터 스트림에 대해, 현재 데이터 포인트 및 여러 이전 데이터 포인트들(룩-백 윈도우(212)를 기반으로)에 대응하는 데이터 포인트들의 벡터, 행렬, 또는 텐서를 포함할 수 있고, 각각의 데이터 샘플들(216)은 예측 수평선(214)(여기서 미래 데이터 포인트의 라벨은 벡터, 행렬 또는 텐서의 미리 결정된 위치에 추가되거나 벡터, 행렬 또는 텐서와 연관될 수 있다)에 의해 미래의 데이터 포인트의 라벨과 더 연관될 수 있다. 다시 말해, 정상 상태와 연관된 데이터 샘플들(216-1)은 정상 상태를 나타내는 데이터(208-1)인 예측 수평선(214)에서의 데이터 포인트에 의해 식별될 수 있다. 유사하게, 저하 상태와 연관된 데이터 샘플들(216-2)은 열화 상태를 나타내는 데이터(208-2)로 라벨된 예측 수평선(214)에 데이터 포인트를 갖는 데이터 샘플들일 수 있다.

[0041] 예를 들어, 룩-백 윈도우(212)는 10일(ten days)일 수 있고 예측 수평선(214)은 20일(twenty days) 일 수 있다. 이 시나리오에서, 훈련 서브세트(204-1)에서의 단일 데이터 스트림으로부터 처음의 데이터 포인트에서, 상기 데이터 포인트는 이전 10개의 데이터 포인트들(예: 룩백 윈도우 212)를 포함하는 벡터로 변환될 수 있고 상기 벡터는 미래의 20일(예를 들어, 라벨이 정상 상태를 나타내는 데이터(208-1) 또는 열화된 상태를 나타내는 데이터(208-2)인, 예측 수평선(214)) 데이터 포인트의 라벨과 연관될 수 있다. 이 예에서, 미래의 20일 데이터 포인트의 라벨(the label of the data point twenty days in the future)이 열화된 상태를 나타내는 데이터(208-2)인 경우, 현재 데이터 포인트와 이전 10개 데이터 포인트들의 데이터 포인트들 벡터는 훈련 목적들을 위한 예측 고장 징후로 간주될 수 있다. 반대로, 미래의 20일 데이터 포인트의 라벨이 정상 상태를 나타내는 데이터(208-1)인 경우, 현재 데이터 포인트와 이전 10개 데이터 포인트들의 데이터 포인트들 벡터는 훈련 목적들을 위한 예측 정상 징후로 가정할 수 있다.

[0042] 당업자에 의해 이해되는 바와 같이, 룩-백 윈도우(212) 및 예측 수평선(214)은 다양한 스케일들에 따른 다양한 수치들일 수 있다. 예를 들어, 일부 실시 예들에서, 룩-백 윈도우(212) 및 예측 수평선(214)은 초, 분, 일, 주, 월, 등으로 측정될 수 있다. 다양한 실시 예들에서, 룩-백 윈도우(212)는 예측 수평선(214)보다 작거나, 크거나, 동일하다. 일부 실시 예들에서, 룩-백 윈도우(212)는 유틸리티와 계산 오버헤드 사이의 트레이드-오프(trade-off)를 관리하도록 크기가 결정된다. 예를 들어, 상대적으로 더 큰 룩백 윈도우(212)는 고장 징후를 정확하게 검출하기 위해 증가된 정보를 제공하는 동시에 구현을 위해 추가 계산 능력을 필요로 한다. 반대로, 상대적으로 더 작은 룩-백 윈도우(212)는 구현하는데 더 적은 계산 능력을 요구하면서 고장 징후를 정확하게 검출하기 위해 감소된 정보를 제공한다. 일부 실시 예들에서, 예측 수평선(214)은 고장 징후에 기초하여 크기가 결정된다. 예를 들어, 자산(110)이 고장 표시가 데이터에 나타나기 시작한 시간으로부터 20-일 윈도우와 연관되어 있다면, 예측 수평선(214)은 20일 이거나 또는 그 이하여야 한다(다시 말해서, 20일보다 큰 예측 수평선(214)은 거짓 양성들(false positives)을 증가시킬 것이다). 또한, 일부 실시 예들에서, 룩-백 윈도우(212) 및 예측 수평선(214)은 반드시 시간-기반 증가들로 측정될 필요가 전혀 없지만, 그러나 데이터 포인트들의 간격이 비-시간적(non-temporal) 특성들에 기초할 수 있는 다수의 이전 또는 후속 데이터 포인트들에 의해서 간단히 참조될 수 있다. 또한 여전히, 위의 예에서 논의된 데이터 샘플들(216)이 벡터 형식이지더라도, 다른 실시 예들에서 행열들 또는 텐서들이 다-차원 데이터 또는 다-모드 데이터 스트림들을 나타내기 위해 사용될 수 있다. 일례로서, 3개의 데이터 스트림들과 연관된 자산(110)에 대해, 데이터 샘플(216)은 입력 부분이 3개의 데이터 스트림들 각각에 대한 각각의 룩-백 윈도우(212) 샘플들로 구성된 3-차원 텐서를 포함하고, 출력 부분이 예측 수평선(214)에서 미래 성능의 이진 표시자(예를 들어, 정상의 경우 0 및 실패의 경우 1)를 포함하는 입력-출력 데이터 쌍을 포함할 수 있다.

[0043] 훈련 모드(200)는 데이터(218)를 클러스터 하는 단계를 더 포함할 수 있다. 데이터(218)를 클러스터 하는 단계는 현재 알려지거나 나중에 개발되는 모든 테스트 가능한 클러스터링 기술을 사용하여 데이터 샘플들(216)을 클러스터 할 수 있다. 다시 말해, 클러스터 된 데이터(218)는 복수의 클러스터들(220)을 포함할 수 있고, 여기서 각각의 클러스터는 적어도 하나의 데이터 샘플(216)을 포함한다. 특히, 클러스터들(220)의 수는 데이터 샘플들(216)을 (과적합 없이) 정확하게 맞추기 위해 구성 가능하다.

[0044] 일부 실시 예들에서, 클러스터들(220)은 K-평균 클러스터링(K-Means clustering)을 사용하여 결정된다. 바람직하게도, K-평균 클러스터링은 대규모 데이터 세트들로 확장 가능한 계산 효율적인 클러스터링 기술이다. 더 일반적으로, 사용되는 클러스터링 기술의 유형, 사용되는 클러스터들의 수, 사용되는 클러스터들의 파라미터들(예: 모양, 크기, 등)은, 본 발명의 일부 실시 예들에 따라, 모두 고장 예측 모델(124)의 성능을 개선하기 위해 필요에 따라 조정될 수 있는 조정 가능한 파라미터들이다. 예를 들어, 다양한 정상 작동 프로파일들(normal operational profiles)과 다양한 열화하는 작동 프로파일들(deteriorating operational profiles)을 캡처하기에 충분한 수의 클러스터들을 갖는 것이 유리할 수 있다.

[0045] 클러스터된 데이터(218)는 클러스터들(220) 각각에 할당된 클러스터 점수들(222)을 더 포함할 수 있다. 클러스터 점수들(222)은 정상 점수들(224) 및 비정상 점수들(226)을 포함할 수 있다. 일부 실시 예들에서, 정상 점수들(224)은 수학식 1에 따라 계산될 수 있다:

수학식 1:

클러스터들의 수

[0046] 유사하게, 일부 실시 예들에서, 비정상 점수들(226)은 수학식 2에 따라 계산될 수 있다:

수학식 2:

클러스터들의 수

[0047] 수학식 1과 관련하여,

은 클러스터들(220)의 주어진 클러스터

내의 정상 상태(216-1)와 연관된 데이터 샘플들의 카운트를 의미할 수 있고, 한편

은 윈도우에서 윈도우된 과거 데이터 (210)의 정상 상태와 연관된 데이터 샘플들(216-1)의 총 카운트를 의미할 수 있다. 유사하게, 수학식 2에 대해,

은 클러스터(220)의 주어진 클러스터들

내에서 열화된 상태와 관련된 데이터 샘플들(216-2)의 카운트를 의미할 수 있고, 한편

는 윈도우된 과거 데이터(210)의 저하 상태와 관련된 데이터 샘플들(216-2)의 총 카운트를 의미할 수 있다. 수학식 1 및 수학식 2 모두에서,

은 클러스터(220)의 주어진 클러스터들

내의 데이터 샘플들(216)의 총 카운트를 의미할 수 있고, 한편

은 윈도우된 과거 데이터(206)에서 데이터 샘플들(216)의 총 카운트를 의미할 수 있다.

[0048] 다른 말로, 정상 점수(224)는 주어진 클러스터에서 정상 상태와 연관된 데이터 샘플들(216-1)의 부분을 전체 윈도우된 과거 데이터(210)에서 정상 상태와 연관된 데이터 샘플들(216-1)의 부분으로 나눈 것일 수 있다. 유사하게, 비정상 점수(226)는 주어진 클러스터에서 열화된 상태와 관련된 데이터 샘플들(216-2)의 부분을 전체 윈도우된 과거 데이터(210)에서 열화된 상태와 관련된 데이터 샘플들(216-2)의 부분으로 나눈 것일 수 있다.

[0049] 클러스터들(220)를 생성하고 클러스터 점수들(222)를 생성하고 난 후, 고장 예측 모델(124)은 훈련된 것으로 간주될 수 있다. 일부 실시 예들에서, 훈련 서브세트(204-1)를 사용하여 고장 예측 모델(124)을 훈련시킨 후, 고장 예측 모델(124)은 테스트 서브세트(204-2) 및 배치 모드(228)를 사용하여 테스트될 수 있다. 배치 모드(228)의 논의가 훈련 서브세트(204-2)와 관련하여 논의될 것이지만, 배치 모드(228)에 대한 논의는 새로운 데이터와 관련된 미래의 비-선형 현상(예: PCP의 마모-관련 성능 저하)을 예측할 목적으로 스트리밍 실-시간(real-time) 데이터를 수신하는 데에도 동일하게 적용 가능하다.

[0050] 배치 모드(228)에서, 고장 예측 모델(124)은 테스트 서브세트(204-2)를 윈도우 데이터 샘플들(230)로 포맷할 수 있다. 윈도우된 데이터 샘플들(230)은 데이터 샘플들(216)과 유사할 수 있지만 정상 상태 또는 열화된 상태(이것이 고장 예측 모델(124)에 의해 예측될 정보이고 따라서 고장 예측 모델(124)의 성능을 테스트하는 동안 고장 예측 모델(124)로부터 숨겨지는 한) 표시가 없다. 따라서, 윈도우 데이터 샘플들(230)의 각각의 샘플은 테스트 서브세트(204-2)로부터의 데이터 포인트들 및 룩-백 윈도우(212)에 따른 이전 데이터 포인트들의 수를 포함할 수 있다. 이전에 논의된 바와 같이, 이 일련의 데이터는 테스트 서브세트(204-2)에 있는 데이터의 복잡성, 차원 및 양식(the complexity, dimensionality, and modality)에 따라 벡터, 행렬 또는 텐서 형식으로 저장될 수 있다. 일부 실시 예들에서 윈도우 데이터 샘플들(230)은 포맷된 센서 데이터(120)와 일치한다.

[0051] 윈도우된 데이터 샘플들(230)의 각각의 샘플은 각각의 클러스터들(220)과 연관될 수 있다. 분류(232)는 클러스터들(220)의 연관된 클러스터에 기초하여 윈도우된 데이터 샘플들(230) 각각과 연관될 수 있다. 예를 들어, 비정상 점수(226)보다 큰 정상 점수(224)를 갖는 개별 클러스터(220) 내에 배치된 개별 윈도우 데이터 샘플(230)에 대해, 해당 윈도우 데이터 샘플(230)은 정상(예: "0" 점수)으로 간주될 수 있다. 반대로, 해당 윈도우 데이터 샘플(230)이 정상 점수(224)보다 큰 비정상 점수(226)를 갖는 개별 클러스터(220)에 배치되면, 해당 윈도우 데이터 샘플(240)은 비정상적이거나 미래의 고장(예: "1"점수)을 예측하는 것으로 간주될 수 있다. 일부 실시 예들에서, 분류(232)는 윈도우 데이터 샘플(230)을 캡처하는 클러스터(220)의 비정상 점수(226)를 비정상 점수(226)보다 큰 정상 점수(224)를 갖는 모든 클러스터들(220)의 평균 비정상 점수와 비교하는 단계를 포함한다. 이러한 방식으로, 윈도우 데이터 샘플(230)을 캡처하는 클러스터(220)의 비정상 점수(226)는 그렇지 않으면 정상으로 간주되는 다른 클러스터들(220)에서 보여지는 비정상의 기준 레벨과 비교될 수 있다.

[0052] 고장 예측 모델(124)은 고장 신호(234)를 더 포함할 수 있다. 고장 신호(234)는 이전의 미리 결정된 수의 데이터 포인트들에 대한 비정상 점수들의 평균을 획득함으로써 비정상 점수들(226) 또는 분류들(232)을 평탄화하도록 구성될 수 있다. 예를 들어, 고장 신호(234)는 수학식 3에 따라 계산될 수 있다:

수학식 3:

[0053] 수학식 3에서, x는 주어진 윈도우 데이터 샘플(230)에 대한 평균 비정상 점수를 결정하기 위해 순차적으로 이전 데이터 포인트들의 미리 결정된 수를 의미할 수 있다. 일부 실시 예들에서, x는 고장 예측 모델(124)의 설계 고려 사항들에 따라 조정 가능한 파라미터일 수 있다. 예를 들어, 상대적으로 더 큰 x는 고장을 나타내는 모든 특정 비정상 점수에 대한 고장 예측 모델(124)의 민감도를 감소시킬 수 있고(따라서 거짓 양성들을 감소시킬 수 있음), 반면에 상대적으로 작은 x는 고장을 나타내는 각각의 비정상 점수에 대한 고장 예측 모델(124)의 민감도를 증가시킬 수 있다(따라서 거짓 음성들을 감소시킬 수 있다). 추가로 수학식 3에서, ASn은 데이터 포인트 n을 포함하는 클러스터들(220)의 클러스터에 대한 비정상 점수(226)를 의미할 수 있지만, 다른 실시 예들에서, 분류(232)가 또한 사용될 수 있다. 고장 신호(234)는 도 5b와 관련하여 더 자세히 논의된다.

[0054] 이제 도 3를 참조하면, 본 발명의 일부 실시 예들에 따른, 고장 예측 모델(124)을 이용하기 위한 예시적인 방법(300)의 플로 차트가 도시되어 있다. 방법(300)은, 예를 들어, 고장 예측 모델(124), 고장 예측 시스템(102), 컴퓨터, 컴퓨팅 노드, 프로세서, 또는 하드웨어 및/또는 소프트웨어의 다른 조합에 의해 구현될 수 있다.

[0055] 동작(302)은 고장 예측 모델(124)을 훈련하는 단계를 포함한다. 고장 예측 모델(124)을 훈련하는 단계는 고장 예측 모델(124)의 훈련 모드(200)와 관련하여 이전에 논의된 특징들을 포함할 수 있다. 동작(302)은 도 4와 관련하여 이하에서 더 상세히 논의된다.

[0056] 동작(304)은 집계된 센서 데이터(118)를 포맷된 센서 데이터(120)로 포맷하는 단계를 포함한다. 일부 실시 예들에서, 포맷된 센서 데이터(120)는 윈도우 데이터 샘플들(230)과 일치한다. 동작(304)은 포맷된 센서 데이터(120)를 생성하기 위해 집계된 센서 데이터(118)의 각각의 데이터 포인트들에 룩-백 윈도우(212)를 적용하는 단계를 포함할 수 있다. 일부 실시 예들에서, 동작(304)은 다른 데이터 클린싱 동작들 및/또는 비정상 값들 제거, 널 값들 해결(removing outliers, resolving null values), 등과 같은 데이터 포맷팅 동작들을 더 포함한다.

[0057] 동작(306)은 포맷된 센서 데이터(120)를 고장 예측 모델(124)에 입력하는 단계를 포함한다. 동작(308)은 고장 예측 모델(124)로부터의 출력에 기초하여 결과들(122)을 생성하는 단계를 포함한다. 일부 실시 예들에서, 결과들(122)은 분류(232)(예를 들어, 정상 또는 미래 고장의 표시) 및/또는 고장 신호(234)(예를 들어, 미래 고장의 가능성과 관련된 정량화)를 포함한다.

[0058] 동작(310)은 결과들에 기초하여 완화 동작을 수행하는 단계를 포함한다. 예를 들어, 완화 조치(the mitigation action)는 결과들(122)을 알림, 경고, 보고, 또는 다른 전송의 형태로 엔드포인트 애플리케이션(106)에 전송하는 단계를 포함할 수 있다. 일부 실시 예들에서, 동작(310)은 자산(110)을 교체하는 단계, 재구축하는 단계, 또는 달리 유지 보수하는 단계와 같은, 자산(110)의 유지보수와 관련된 스케줄링 이벤트를 트리거하는 단계를 포함한다. 일부 실시 예들에서, 스케줄링 이벤트는 결과들(122)에 기초한다. 예를 들어, 임계값 위의 고장 신호(234)는 시간 윈도우 내에서(예를 들어, 예측 수평선 214 내에서) 스케줄 될 유지 이벤트를 트리거 할 수 있다. 일부 실시 예들에서, 완화 조치는 필요한 교체 부품들을 주문하고 주문된 교체 부품들을 자산(110)과 연관된 위치로 보내는 것과 같은 물류 조치들(actions)과 관련될 수 있다.

[0059] 이제 도 4를 참조하면, 본 발명의 일부 실시 예들에 따른 고장 예측 모델(124)을 훈련하기 위한 예시적인 방법(400)의 플로 차트가 예시되어 있다. 일부 실시 예들에서, 방법(400)은 도 3의 동작(302)의 하위-방법이다. 일부 실시 예들에서, 방법(400)은, 예를 들어, 고장 예측 모델(124), 고장 예측 시스템(102), 컴퓨터, 컴퓨팅 노드, 프로세서, 또는 하드웨어 및/또는 소프트웨어의 다른 조합에 의해 구현될 수 있다.

[0060] 동작(402)은 과거 데이터(202)를 훈련 서브세트(204-1) 및 테스트 서브세트(204-2)로 집계하는 것을 포함한다. 동작(404)은 정상 상태를 나타내는 데이터(208-1) 및 열화 상태를 나타내는 데이터(208-2)를 포함하는 라벨된 과거 데이터(206)를 생성하기 위해 과거 데이터(202)를 라벨 하는 것을 포함한다. 동작(406)은 과거 데이터(202)의 각각의 데이터 포인트들에 룩-백 윈도우(212) 및 예측 수평선(214)을 적용함으로써 정상 상태와 관련된 데이터 샘플들(216-1) 및 저하 상태와 관련된 데이터 샘플들(216-2)을 생성하는 단계를 포함한다.

[0061] 동작(408)은 데이터 샘플들(216)을 복수의 클러스터들(220)로 클러스터 하는 단계를 포함한다. 일부 실시 예들에서, 동작(408)은 K-평균 클러스터링을 이용한다. 동작(410)은 클러스터들(220) 각각과 연관된 클러스터 점수들(222)을 계산하는 단계를 포함한다. 클러스터 점수들(222)은 클러스터들(220)의 각각의 클러스터에 대한 각각의 정상 점수(224) 및 각각의 비정상 점수(226)를 포함할 수 있다.

[0062] 동작(412)은 고장 예측 모델(124)을 조정하는 단계를 포함한다. 고장 예측 모델(124)을 조정하는 단계는, 예를 들어, (i) 정상 상태를 나타내는 데이터(208-1) 및 열화된 상태를 나타내는 데이터(208-2)의 정의들을 변경함으로써 라벨 된 과거 데이터(206)를 수정하는 단계; (ii) 룩-백 윈도우(212)의 크기를 변경하는 단계; (iii) 예측 지평선(214)의 크기를 변경하는 단계; (iv) 클러스터(220)와 연관된 파라미터들(예를 들어, 클러스터들의 수, 클러스터들의 형태들, 클러스터들의 크기 등)을 변경하는 단계; 및/또는 기타 모델 조정 기술들 및/또는 전략들을 포함할 수 있다. 일부 실시 예들에서, 고장 예측 모델(124)은 테스트 서브세트(204-2)를 테스트한 결과들에 기초하여 조정된다.

[0063] 동작(414)은 훈련된 고장 예측 모델(124)을 출력하는 단계를 포함한다. 일부 실시 예들에서, 훈련된 고장 예측 모델(124)을 출력하는 단계는, 예를 들어, 가상 제공된 모델 컨테이너(114)와 같은 컴퓨터-판독 가능 스토리지 매체에 훈련된 고장 예측 모델(124)을 저장하는 단계를 포함한다.

[0064] 이제 도 5a를 참조하면, 본 발명의 일부 실시 예들에 따른, 고장 예측 모델(124)로부터의 출력에 기초하여 결과를 생성하기 위한 예시적인 방법(500)의 플로 차트가 예시되어 있다. 일부 실시 예들에서, 방법(500)은 도 3의 동작(308)의 하위-방법이다. 일부 실시 예들에서, 방법(500)은, 예를 들어, 고장 예측 모델(124), 고장 예측 시스템(102), 컴퓨터, 컴퓨팅 노드, 프로세서, 또는 하드웨어 및/또는 소프트웨어의 다른 조합에 의해 구현될 수 있다.

[0065] 동작(502)은 이진 분류 결과(232)를 고장 예측 모델(124)에 이전에 입력되었던 각각의 데이터 샘플들(예를 들어, 윈도우 데이터 샘플들 230)에 연관시키는 단계를 포함한다. 일부 실시 예들에서, 분류(232)는 "정상"(예를 들어, 0) 또는 "이상", "결함" 또는 다른 비-정상 지표(예를 들어, 1)이다. 분류(232)는 각각의 윈도우 데이터 샘플(230)을 캡처하는 클러스터(220)의 정상 점수(224) 및 비정상 점수(226)에 기초할 수 있다. 보다 구체적으로, 정상 점수(224)가 비정상 점수(226)보다 크면 대응하는 윈도우 데이터 샘플(230)은 정상으로 간주된다. 반대로, 비정상 점수(226)가 정상 점수(224)보다 크면 대응하는 윈도우 데이터 샘플(230)은 비정상으로 간주되거나 그렇지 않으면 고장을 나타내는 것으로 간주된다.

[0066] 동작(504)은 각각의 입력 데이터 샘플들(예를 들어, 윈도우된 데이터 샘플들 230)에 대한 고장 신호(234)를 생성하는 단계를 포함한다. 고장 신호(234)는 정상 점수들(224), 비정상 점수들(226), 및/또는 윈도우 데이터 샘플들(230)과 연관된 분류들(232)에 기초할 수 있다. 일부 실시 예들에서, 고장 신호(234)는 진정으로 비정상적인 데이터의 보다 신뢰할 수 있는 표시자를 나타낸다(예를 들어, 이는 거짓 양성들을 감소시킨다). 고장 신호(234)는 도 5b와 관련하여 이하에서 더 상세히 논의된다.

[0067] 이제 도 5b를 참조하면, 본 발명의 일부 실시 예들에 따른, 고장 신호(234)를 생성하기 위한 예시적인 방법(510)의 플로 차트가 예시되어 있다. 일부 실시 예들에서, 방법(510)은 도 5a의 동작(504)의 하위-방법이다. 일부 실시 예들에서, 방법(510)은 예를 들어, 고장 예측 모델(124), 고장 예측 시스템(102), 컴퓨터, 컴퓨팅 노드, 프로세서, 또는 하드웨어 및/또는 소프트웨어의 다른 조합에 의해 구현될 수 있다.

[0068] 동작(512)은 정상으로 순위가 매겨진 클러스터들(220)의 평균 비정상 점수를 계산하는 단계를 포함한다. 정상 동작들 동안 평균 비정상 점수를 계산하는 단계는 정상 점수(224)가 비정상 점수(226)보다 큰 클러스터들(220)의 각 클러스터에 대한 비정상 점수들(226)을 평균화하는 단계를 포함할 수 있다. 이는 거짓 양성들을 줄이는 기능을 할 수 있는 기준선 비정상 수준을 설정하는 한 이득일 수 있다.

[0069] 동작(514)은 들어오는 윈도우 데이터 샘플(230)을 비정상 점수(226) 및 정상 점수(224)와 연관된 클러스터(220)에 할당하는 단계를 포함한다. 지정된 클러스터의 비정상 점수가 정상 동작들 동안의 평균 비정상 점수(동작 512에서 결정된) 보다 크면, 해당 데이터 샘플은 고장 모드(1로 분류됨)로 분류되고, 그렇지 않으면 데이터 샘플은 정상 모델(0으로 분류됨)에 있는 것으로 분류된다.

[0070] 동작(516)은 미리 결정된 기간(예를 들어, 10일) 또는 미리 결정된 수의 윈도우 데이터 샘플들(230)에 걸쳐 해당 자산에 대한 이진 0 또는 1 분류 결과들(outcomes)의 평균으로서 고장 신호(234)를 계산하는 단계를 포함한다. 일부 실시 예들에서, 동작(516)은 수학식 3을 이용할 수 있다.

[0071] 도면들 1-5를 다시 참조하면, 본 발명의 실시 예들의 하나의 특정 애플리케이션은 프로그래싱 캐비티 펌프들(PCP들)에서 로터들의 마모-유발 성능 저하를 검출하는 것에 관한 것이다. PCP들에서 로터들의 마모-유발 성능 저하는 비-선형 현상이므로, 따라서, 본 발명의 실시 예들에서는 PCP들에서 마모-유발 로터 저하를 정확하게 예측하는 데 매우-적합하다.

[0072] PCP들을 이용한 인공 리프트 시스템들은 모래를 이용한 저온 중유 생산(CHOPS)과 같은 다양한 비-열 유 및 가스 회수 방법들(non-thermal oil and gas recovery methods)을 가능하게 한다. PCP들은 기름과 모래의 점성 혼합물들을 지하 저장소에서 지표면으로 들어올릴 수 있는데, 개선된 리프팅 비용들, 개선된 유지보수 비용들, 향상된 애플리케이션 유연성, 다른 인공 리프트 시스템들(예: 전기 잠수정 펌프(ESP))에 비해 감소된 환경 영향으로 들어올릴 수 있다.

[0073] 중유에서 더 높은 모래 함량을 처리하기 위한 PCP들의 적합성에도 불구하고, 지속적인 모래 흡수로 인해 발생하는 한 가지 문제는 연마 마모 고장이다. 연마 마모는 로터의 경질 크롬 도금이 마모됨에 따라 펌프 성능이 점진적으로 저하되는 것을 의미할 수 있으며 PCP들에서 가장 흔한 유형의 고장이다. 이 마모는 로터의 크롬 도금 표면으로 제한되거나 비금속까지 확장될 수 있다. 두 경우 모두, 원래 로터 프로파일이 변경된다. 이러한 프로파일의 변화는 로터(rotor)와 스테이터(stator) 사이의 맞춤(fit)이 변경되면 PCP의 성능에 영향을 미칠 수 있다. 경질 크롬 도금이 모재까지 마모되는 급격한 마모는 로터 내의 엘라스토머(the elastomer)를 영구적으로 손상시키고 펌프 교체를 필요로 할 수 있다.

[0074] 유정들에서 펌프 고장들은 생산 시간 손실 측면에서 비용이 많이 든다. 따라서, 펌프 마모 고장을 예측하는 기능은 고장이 발생하기 전에 PCP들에 대한 사전 예방적이고 예정된 유지보수를 제공함으로써 이러한 비용을 줄인다. 뿐만 아니라, 마모의 초기 단계에서 펌프 성능 저하에 대한 향상된 인식은 운영자들이 작동 수명을 연장하기 위해 작동 결정들을 적절하게 조정하는 데 도움이 될 수 있다.

[0075] 그러나, PCP들의 고장들을 예측하는 것은 비-선형 특성들을 갖는 성능 저하를 예측하는 것과 유사한 이유들로 어렵다. 하나는, 로터가 점점 마모되는 동안 PCP가 저하된 차선의 성능으로 오랫동안 기능을 유지할 수 있기 때문에 과거 데이터를 "정상" 또는 "비정상"으로 적절하게 라벨하는 데 문제들을 일으키는 실고장 메커니즘은 점진적이다. 또 다른 문제는 PCP들이 사용할 수 있는 불균형한 과거 데이터(예를 들어, 비정상 데이터보다 훨씬 더 많은 정상 데이터) 세트와 관련이 있다. 또 다른 문제는 작동 환경(예를 들어, 모래 함량이 낮은 지층들에 비해 모래 함량이 높은 지층들)에 따라 달라지는 다양한 고장 메커니즘과 관련이 있다. 따라서, PCP 고장을 정확하게 예측하는 것은 어렵다. 그럼에도 불구하고, 본 발명의 실시 예들은 PCP들에 대한 예측 모니터링 분야에서 구현될 때 마모 관련 메커니즘으로 인한 PCP 성능 저하들을 정확하게 예측할 수 있다.

[0076] 예를 들어, PCP와 같은 자산(110)에 대한 고장 예측 모델(124)을 훈련하는 것과 관련하여 도 4의 논의로 다시 돌아가면, 동작(402)는 펌프 속도, 펌프 토크, 케이싱 압력 및 생산 속도와 같은 센서 데이터를 집계할 수 있다. 집계된 센서 데이터는 훈련 서브세트(204-1)(예를 들어, 데이터의 대략 80%) 및 테스트 서브세트(204-2)(예를 들어, 데이터의 대략 20%)로 분리될 수 있다. 동작(404)은 정상 상태를 나타내는 데이터(208-1)(훈련 서브세트 204-1에서 불균형 데이터의 약 97%) 또는 저하된 상태를 나타내는 데이터(208-2)(훈련 서브세트 204-1에서 불균형 데이터의 약 3%)로서 과거 데이터를 라벨 할 수 있다. 일부 실시 예들에서, 저하된 상태를 나타내는 데이터(208-2)는 공지된 PCP 교체 날짜 전 25일 내지 3일 사이의 모든 데이터일 수 있고(유지 기록들로부터 결정됨), 알려진 PCP 교체 날짜 25일 이전의 데이터는 정상 상태 나타내는 데이터(208-1)을 로 간주될 수 있다.

[0077] 동작(406)은 룩-백 윈도우(212) 및 예측 수평선(214)을 각각의 데이터 포인트들에 적용함으로써 데이터 샘플들(216)을 생성할 수 있다. 동작(408)은 K-평균 클러스터링을 사용하여 데이터 샘플들(216)을 클러스터 할 수 있고, 동작(410)은 수학식 1 및 수학식 2에 따라 정상 점수들(224) 및 비정상 점수들(226)을, 각각, 계산할 수 있다. 동작(412)은 고장 예측 모델(124)을 조정할 수 있고, 동작(414)은 훈련된 고장 예측 모델(124)을 출력할 수 있다.

[0078] PCP 애플리케이션의 훈련된 고장 예측 모델(124)에 테스트 서브세트(204-2)를 적용하는 것은 본 발명의 실시 예들의 유용성을 입증한다. 도 6a는 알려진 펌프 교체 날짜(x-축)까지의 일수의 함수로서 누적 비정상 점수들(226)(y-축)의 그래프의 실험 결과들을 예시한다. 보이는 바와 같이, 추세선(trend line)은 고장 전 25일과 알려진 펌프 교체 날짜 사이에 급격히 증가한다. 이에 따라, 도 6a는 PCP 고장들을 성공적으로 예측하기 위해 비정상 점수들(226)이 사용될 수 있음을 보여준다.

[0079] 도 6b는 고장 전 날들(days to failure)(x축)의 함수로서 고장(y축)을 나타내는 분류(232)의 강도 그래프의 실험 결과들을 예시한다. 알 수 있는 바와 같이, 고장을 나타내는 분류(232)의 강도는 고장 전 약 25일과 알려진 펌프 교체 날짜 사이에 상당히 증가한다. 따라서, 도 6b는 분류들(232)이 PCP 고장들을 예측하는 데 성공적으로 사용될 수 있음을 보여준다.

[0080] 특히, 고장 신호(234)와 관련된 그래프는 제공되지 않지만, 고장 신호(234)가 도면들 6a 및 6b에 예시된 결과들에 비해 감소된 잡음으로 유사한 예측 전력을 나타낸다는 것은 당업자에게 명백하다. 이는 고장 신호(234)가 평균 점수를 나타내는 반면 도 6a는 누적 점수를 나타내고 도 6b는 강도 점수를 나타내기 때문이다.

[0081] 도 7은 앞서 논의된 바와 같이 PCP 고장 예측 모델(124)에 대한 테스트 서브세트(204-2)를 사용하여 알려진 펌프 교체 날짜 이전의 다양한 기간들에 대한 혼동 행렬들(confusion matrices)과 관련된 실험 결과를 예시한다. 도 7에 도시된 바와 같이, 고장 전 30일(700-1)에서, 정상(실제 라벨 702-1)-정상(예측 라벨 704-1) 상자는 0.76이고, 결함-정상 상자는 0.38이며, 정상-결함 상자는 0.24이고, 결함-결함 상자는 0.62이다. 고장 전 14일(700-2)에서, 정상(실제 라벨 702-2)-정상(예측 라벨 704-2) 상자는 0.76이고, 결함-정상 상자는 0.26이며, 정상-결함 상자는 0.24이고, 결함-결함 상자는 0.74이다. 고장 전 5일(700-3) 에서, 정상(실제 라벨 702-3)-정상(예측 라벨 704-3) 상자는 0.76이고, 결함-정상 상자는 0.12이며, 정상-결함 상자는 0.24이고, 결함-결함 상자는 0.88이다.

[0082] 일반적으로, 도 7은 실제 펌프 교체 날짜에 가까워짐에 따라 예측 성능이 향상되는 것을 보여준다. 뿐만 아니라, 도 7은 고장 전 5일(700-3)에서 약 88%, 고장 전 14일(700-2) 에서 약 75%, 및 고장 전 30일(700-1) 에서 약 62% 의 리콜(a recall)(예를 들어, 참 양성들을 참 양성들과 거짓 음성들의 합계로 나눈 값)을 보여준다. 한편, 본 발명의 실시 예들은 약 78%(고장 전 5일 700-3), 76%(고장 전 14일 700-2), 72%(고장 전 30일 700-1)의 정밀도(예를 들어, 참 양성들을 참 양성과 거짓 양성들의 합계로 나눈 값)를 구현한다. 따라서, 도 7은 본 발명의 실시 예들이 로터 마모의 결과로서 PCP 성능 저하를 예측하기 위한 강건한(robust) 고장 예측 모델(124)을 실현한다는 것을 입증한다.

[0083] 도 8은 본 발명의 일부 실시 예들에 따른 예시적인 컴퓨터(800)의 블록도를 도시한다. 다양한 실시 예들에서, 컴퓨터(800)는 도 3-5 중 어느 하나 혹은 그 이상에서 설명된 방법들을 수행할 수 있고 및/또는 도 1-2 및/또는 6-7 중 어느 하나에서 설명된 기능을 구현할 수 있다. 일부 실시 예들에서, 컴퓨터(800)는 네트워크(850)를 통해 원격 데이터 처리 시스템으로부터 프로세서 실행가능 명령들을 다운로드함으로써 전술한 방법들 및 기능들과 관련된 명령들을 수신한다. 다른 실시 예들에서, 컴퓨터(800)는 클라이언트 머신이 방법을, 또는 방법의 일부를, 컴퓨터(800)에 의해 제공된 명령들에 기초하여, 실행하도록 전술한 방법들 및/또는 기능들에 대한 명령들을 클라이언트 머신에 제공한다. 일부 실시 예들에서, 컴퓨터(800)(또는 컴퓨터(800)와 유사한 기능이 가상으로 제공되는)는 도 1의 고장 예측 시스템(102), 도 1의 고장 예측 모델(124), 또는 본 발명의 다른 실시 예에 통합될 수 있다.

[0084] 컴퓨터(800)는 메모리(825), 스토리지(830), 인터커넥트(820)(예를 들어, 버스), 하나 혹은 그 이상의 CPU들(805)(여기서 프로세서들로도 지칭됨), I/O 디바이스 인터페이스(810), I/O 디바이스들(812), 및 네트워크 인터페이스(815)를 포함한다.

[0085] 각각의 CPU(805)는 메모리(825) 또는 스토리지(830)에 저장된 프로그래밍 명령들을 검색하고 실행한다. 인터커넥트(820)는 CPU들(805), I/O 디바이스 인터페이스(810), 스토리지(830), 네트워크 인터페이스(815), 및 메모리(825) 사이에서 프로그래밍 명령들과 같은 데이터를 이동하는 데 사용된다. 인터커넥트(820)는 하나 혹은 그 이상의 버스들을 사용하여 구현될 수 있다. CPU들(805)은, 다양한 실시 예들에서, 단일 CPU, 다수의 CPU들, 또는 다수의 처리 코어들을 갖는 단일 CPU일 수 있다. 일부 실시 예들에서, CPU(805)는 디지털 신호 프로세서(DSP)일 수 있다. 일부 실시 예들에서, CPU(805)는 하나 혹은 그 이상의 3D 집적 회로들(3DIC들)(예를 들어, 3D 웨이퍼 레벨 패키징(3DWLP), 3D 인터포저 기반 통합, 3D 적층 IC들(3D-SIC들), 모놀리식 3D IC들, 3D 이종 집적, 3D 시스템 인 패키지(3DSiP) 및/또는 패키지 온 패키지(PoP) CPU 컴포넌트들)을 포함한다. 메모리(825)에는 일반적으로 랜덤 액세스 메모리(예를 들어, 정적 랜덤-액세스 메모리(SRAM), 동적 랜덤 액세스 메모리(DRAM), 또는 플래시)를 대표하는 것이 포함된다. 스토리지(1030)에는 일반적으로 하드 디스크 드라이브, 솔리드 스테이트 디바이스(SSD), 착탈식 메모리 카드들, 광학 스토리지, 또는 플래시 메모리 디바이스들과 같은 비-휘발성 메모리를 대표하는 것이 포함된다. 대안적인 실시예에서, 스토리지(830)는 SAN(Storage Area-Network) 디바이스들, 클라우드, 또는 I/O 디바이스 인터페이스(810)를 통해 컴퓨터(800)에 연결되거나 네트워크 인터페이스(815)를 통해 네트워크(850)에 연결된 다른 디바이스들로 교체될 수 있다.

[0086] 일부 실시 예들에서, 메모리(825)는 명령들(860)을 저장한다. 하지만, 다양한 실시 예들에서, 명령들(860)은 메모리(825)에 부분적으로 저장되고, 스토리지(830)에 부분적으로 저장되거나, 또는 그것들은 완전히 메모리(825)에 저장되거나 완전히 스토리지(830)에 저장되거나, 또는 네트워크 인터페이스(815)를 통해 네트워크(850)를 통해 액세스될 수 있다.

[0087] 명령들(860)은 도 3-5의 방법들 중 어느 하나의 일 부분, 또는 전부를 수행하기 위한, 및/또는 도 1-2 및/또는 6-7에서 논의된 기능들 중 어느 하나를 구현하기 위한 컴퓨터-판독 가능 및 컴퓨터 실행 가능 명령들일 수 있다. 일부 실시 예들에서, 명령들(860)은 하드웨어에 의해 실행될 때 동적 공유 위치 수정 기능을 제공하도록 구성된 소프트웨어일 수 있다.

[0088] 다양한 실시 예들에서, I/O 디바이스들(812)은 정보를 제공시하고 입력을 수신할 수 있는 인터페이스를 포함한다. 예를 들어, I/O 디바이스들(812)은 컴퓨터(800)와 상호작용하는 사용자에게 정보를 제공하고 사용자로부터 입력을 수신할 수 있다.

[0089] 컴퓨터(800)는 네트워크 인터페이스(815)를 통해 네트워크(850)에 연결된다. 네트워크(850)는 물리적, 무선, 셀룰러, 또는 다른 네트워크를 포함할 수 있다.

[0090] 본 명세서는 클라우드 컴퓨팅에 관해서 상세한 설명들을 포함하지만, 여기서 설명된 그러한 기술적 사상들의 구현은 클라우드 컴퓨팅 환경에만 한정되는 것은 아님을 이해하여야 한다. 오히려, 본 발명의 실시 예들은 지금 알려져 있거나 또는 나중에 개발될 모든 다른 유형의 컴퓨팅 환경과 함께 구현될 수 있다.

[0091] 클라우드 컴퓨팅은, 최소한의 관리 노력 또는 서비스 제공자와의 상호작용으로 빠르게 제공되고 해제될 수 있는, 구성 가능한(configurable) 컴퓨팅 자원들(예를 들어, 네트워크들, 네트워크 대역폭, 서버들, 처리, 메모리, 스토리지, 애플리케이션들, 가상 머신들, 및 서비스들)의 공유 풀에 대한 편리한 주문형(on-demand) 네트워크 액세스를 가능하게 하는 서비스 전달 모델이다. 이 클라우드 모델은 적어도 5가지의 특성(characteristics), 적어도 3가지 서비스 모델(service models), 및 적어도 4가지 배치 모델(deployment models)을 포함할 수 있다.

[0092] 클라우드 컴퓨팅 특성들은 다음과 같다:

주문형 셀프-서비스(On-demand self-service): 클라우드 소비자는, 서비스 제공자와의 인적 상호작용을 필요로 하지 않고 필요한 만큼 자동적으로, 서버 시간(server time) 및 네트워크 스토리지 같은 컴퓨팅 용량들을 일방적으로 제공(provision)할 수 있다.

광역 네트워크 액세스(Broad network access): 혼성의 씬 또는 씩 클라이언트 플랫폼들(heterogeneous thin or thick client platforms)(예를 들어, 모바일폰들, 랩탑들, 및 PDA들)에 의한 사용을 장려하는 표준 메커니즘들을 통해 액세스되는 기능들을 네트워크를 통해서 이용할 수 있다.

자원 풀링(Resource pooling): 제공자의 컴퓨팅 자원들은, 각기 다른 물리적 및 가상 자원들을 요구(demand)에 따라 동적으로 할당 및 재할당하는, 멀티-테넌트 모델(a multi-tenant model)을 사용하는 다수의 소비자들에게 서비스할 수 있도록 풀에 넣어둔다(pooled). 소비자는 일반적으로 제공된 자원들의 정확한 위치를 제어할 수 없거나 그에 대한 지식이 없지만 더 높은 추상 수준에서(예를 들어, 국가, 주, 또는 데이터센터) 위치를 명시할 수 있다는 점에서 위치 독립성이 있다.

[0093] 기민한 탄력성(Rapid elasticity): 용량들(capabilities)이 기민하게 탄력적으로 제공되어 (어떤 경우엔 자동으로) 신속히 규모를 확장할 수도 있고(scale out) 그리고 탄력적으로 해제되어 신속히 규모를 축소할 수도 있다(scale in). 소비자에게 제공할 수 있는 가능성이 종종 무제한이고 언제든지 원하는 수량으로 구매할 수 있는 것처럼 보인다.

[0094] 측정 가능한 서비스(Measured service): 클라우드 시스템들은 자원 사용을 자동으로 제어하고 최적화하는데, 서비스의 유형(예를 들어, 스토리지, 처리, 대역폭, 및 활성 사용자 계정)에 적절한 추상화 수준에서(at some level of abstraction) 계측 기능을 이용하여서 그렇게 한다. 자원 사용량은 모니터 되고, 제어되고, 그리고 보고될 수 있으며 이로써 이용하는 서비스의 제공자와 사용자 모두에게 투명성을 제공한다.

[0095] 서비스 모델들(Service Models)은 다음과 같다:

소프트웨어 서비스(Software as a Service)(SaaS): 소비자에게 제공되는 서비스는 클라우드 하부구조 상에서 실행되는 제공자의 애플리케이션들을 사용하게 해주는 것이다. 애플리케이션들은 웹 브라우저(예를 들어, 웹기반 이메일) 같은 씬(thin) 클라이언트 인터페이스를 통해 여러 클라이언트 장치들에서 액세스 가능하다. 소비자는 네트워크, 서버들, 운영 체제들, 스토리지, 또는 개별 애플리케이션 능력들을 포함하는 하부 클라우드 하부구조를 관리하거나 제어하지 않는다. 단, 제한된 사용자-특정 애플리케이션 구성 세팅들은 예외로서 가능하다.

플랫폼 서비스(Platform as a Service)(PaaS): 소비자에게 제공되는 서비스는 제공자에 의해 지원되는 프로그래밍 언어들 및 도구들을 이용하여 생성된 소비자-생성 또는 획득 애플리케이션들을 클라우드 하부구조에 배치하게 해주는 것이다. 소비자는 네트워크, 서버들, 운영 체제들, 또는 스토리지를 포함하는 하부 클라우드 하부구조를 관리하거나 제어하지 않는다. 그러나 배치된 애플리케이션들에 대해서 그리고 가능한 경우 애플리케이션 호스팅 환경 구성들에 대해서 제어할 수 있다.

하부구조 서비스(Infrastructure as a Service)(IaaS): 소비자에게 제공되는 서비스는 처리, 스토리지, 네트워크, 및 기타 기본 컴퓨팅 자원들을 제공하여 주는 것이며, 여기서 소비자는 임의의 소프트웨어를 배치 및 실행할 수 있고, 이 소프트웨어에는 운영 체제들과 애플리케이션들이 포함될 수 있다. 소비자는 하부 클라우드 하부구조를 관리하거나 제어하지 않지만, 운영 체제들, 스토리지, 배치된 애플리케이션들, 및 가능한 경우 선택된 네트워킹 컴포넌트들의 제한적인 제어(예를 들어, 호스트 방화벽들)에 대하여 제어할 수 있다.

[0096] 배치 모델들(Deployment Models)은 다음과 같다:

사설 클라우드(Private cloud): 클라우드 하부구조는 오직 한 조직(an organization)을 위해서 운영되고, 그 조직 또는 제3자에 의해 관리될 수 있으며 옥내(on-premises) 또는 옥외(off-premises)에 위치할 수 있다.

커뮤니티 클라우드(Community cloud): 클라우드 하부구조는 여러 조직들에 의해 공유되고 관심사(예를 들어, 선교, 보안 요건, 정책, 및 규정 준수 심사)를 공유하는 특정 커뮤니티를 지원하며, 여러 조직들 또는 제3자에 의해 관리될 수 있으며 옥내(on-premises) 또는 옥외(off-premises)에 위치할 수 있다.

공공 클라우드(Public cloud): 클라우드 하부구조는 일반 대중 또는 대규모 산업 집단에서 이용할 수 있으며 클라우드 서비스를 판매하는 조직이 소유한다.

하이브리드 클라우드(Hybrid cloud): 클라우드 하부구조는 둘 또는 그 이상의 클라우드들(사설, 커뮤니티, 또는 공공)이 혼합된 구성이며, 이들은 고유한 주체들로 있지만 데이터 및 애플리케이션 이식가능성(portability)을 가능하게 해주는 표준화된 또는 소유권 있는 기술(예를 들어, 클라우드들 사이의 부하 균형을 위한 클라우드 버스팅(cloud bursting))에 의해 서로 결합되어 있다.

[0097] 클라우드 컴퓨팅 환경은 무국적(statelessness), 낮은 결합(low coupling), 모듈 방식(modularity), 및 의미적 상호운용성(semantic interoperability)에 집중하는 서비스를 지향한다. 클라우드 컴퓨팅의 중심에는 상호 연결된 노드들의 네트워크를 포함하는 하부구조가 있다.

[0098] 이제 도 9를 참조하면, 예시적인 클라우드 컴퓨팅 환경(50)이 도시된다. 도시된 바와 같이, 클라우드 컴퓨팅 환경(50)은 예를 들어 개인 휴대 정보 단말기(PDA) 또는 휴대폰(54A), 데스크탑 컴퓨터(54B), 랩탑 컴퓨터(54C), 및/또는 자동차용 컴퓨터 시스템(54N)과 통신할 수 있는 것과 같이, 클라우드 소비자가 사용하는 로컬 컴퓨팅 디바이스가 하나 또는 그 이상의 클라우드 컴퓨팅 노드들(10)을 포함한다. 노드들(10)은 서로 통신할 수 있다. 이들은 여기에 기술된 바와 같은 사설, 커뮤니티, 공공, 또는 하이브리드 클라우드들 또는 이들의 조합 등의 하나 또는 그 이상의 네트워크들에서 물리적으로 또는 가상으로 그룹화될 수 있다(도시되지 않음). 이것은 클라우드 소비자가 로컬 컴퓨팅 장치 상에 자원들을 유지할 필요가 없게 클라우드 컴퓨팅 환경(50)이 하부구조, 플랫폼들 및/또는 소프트웨어를 서비스로서 제공할 수 있게 해준다. 도 9에 도시된 컴퓨팅 장치들(54A-N)의 유형들은 단지 예시의 목적으로 기술한 것이며 컴퓨팅 노드들(10)과 클라우드 컴퓨팅 환경(50)은 모든 유형의 네트워크 및/또는 네트워크 주소지정가능 연결을 통해서 (예를 들어, 웹 브라우저를 사용하여) 모든 유형의 컴퓨터화된 디바이스와 통신할 수 있다는 것을 이해해야 한다.

[0099] 이제 도 10을 참조하면, 클라우드 컴퓨팅 환경(50) (도 9)에 의해 제공되는 일 세트의 기능별 추상화 층들이 도시된다. 도 10에 도시된 컴포넌트들, 층들, 및 기능들은 단지 예시의 목적이며 본 발명의 바람직한 실시 예들은 이것에 한정되지 않는다는 것을 미리 이해해야 한다. 도시된 바와 같이, 다음의 층들과 그에 대응하는 기능들이 제공된다:

[00100] 하드웨어 및 소프트웨어 층(60)은 하드웨어 및 소프트웨어 컴포넌트들을 포함한다. 하드웨어 컴포넌트들의 예들에는: 메인프레임들(61); RISC(Reduced Instruction Set Computer) 아키텍처 기반 서버들(62); 서버들(63); 블레이드 서버들(64); 스토리지 디바이스들(65); 그리고 네트워크 및 네트워킹 컴포넌트들(66)이 포함된다. 일부 실시 예들에서, 소프트웨어 컴포넌트들은 네트워크 애플리케이션 서버 소프트웨어(67) 및 데이터베이스 소프트웨어(68)를 포함한다.

[00101] 가상화 층(70)은 추상화 층을 제공하며 이로부터 다음의 가상 주체들의 예들이 제공될 수 있다: 가상 서버들(71); 가상 스토리지(72); 가상 사설 네트워크를 포함하는, 가상 네트워크들(73); 가상 애플리케이션들 및 운영 체제들(74); 및 가상 클라이언트들(75).

[00102] 한 예에서, 관리 층(80)은 아래에 기술하는 기능들을 제공한다. 자원 제공(Resource provisioning)(81)은 클라우드 컴퓨팅 환경 내에서 작업들을 수행하는 데 이용되는 컴퓨팅 자원들 및 기타 자원들의 동적 조달을 제공한다. 계측 및 가격 책정(Metering and Pricing)(82)은 자원들이 클라우드 컴퓨팅 환경 내에서 이용될 때 비용 추적, 및 이 자원들의 소비에 대한 요금 청구 또는 송장을 제공한다. 한 예에서, 이 자원들은 애플리케이션 소프트웨어 라이센스를 포함할 수 있다. 보안(Security)은 데이터 및 기타 자원들에 대한 보호뿐 아니라 클라우드 소비자들과 작업들에 대한 신원 확인을 제공한다. 사용자 포털(User portal)(83)은 소비자들 및 시스템 관리자들에게 클라우드 컴퓨팅 환경에 대한 액세스를 제공한다. 서비스 수준 관리(Service level management)(84)는 요구되는 서비스 수준이 충족되도록 클라우드 컴퓨팅 자원 할당 및 관리를 제공한다. 서비스 수준 협약서(SLA) 기획 및 충족(planning and fulfillment)(85)은 SLA에 부합하는 예상되는 미래 요건에 맞는 클라우드 컴퓨팅 자원들의 사전-배치(pre-arrangement) 및 조달(procurement)을 제공한다.

[00103] 워크로드 층(90)은 클라우드 컴퓨팅 환경이 이용될 수 있는 기능들의 예들을 제공한다. 이 층에서 제공될 수 있는 워크로드들과 기능들의 예들은 다음을 포함한다: 맵핑 및 네비게이션(91); 소프트웨어 개발 및 라이프사이클 관리(92); 가상 교실 교육 전달(93); 데이터 분석 처리(94); 트랜잭션 처리(95); 및 비-선형 성능 저하 예측(96).

[00104] 본 발명의 실시 예들은 통합의 모든 가능한 기술적 세부 수준에서 시스템, 방법, 및/또는 컴퓨터 프로그램 제품이 될 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독 가능 스토리지 매체(또는 매체)를 포함할 수 있으며, 이 매체 상에 프로세서가 본 발명의 실시 예들을 수행하도록 하는 컴퓨터 판독 가능 프로그램 명령들을 갖는다.

[00105] 상기 컴퓨터 판독 가능 스토리지 매체는 명령 실행 장치에 의해 사용될 명령들을 유지 및 저장할 수 있는 유형의(tangible) 디바이스일 수 있다. 상기 컴퓨터 판독 가능 스토리지 매체는, 예를 들면, 전자 스토리지 디바이스, 자기 스토리지 디바이스, 광 스토리지 디바이스, 전자기 스토리지 디바이스, 반도체 스토리지 디바이스, 또는 전술한 것들의 모든 적절한 조합일 수 있으며, 그러나 이에 한정되지는 않는다. 컴퓨터 판독 가능 스토리지 매체의 더 구체적인 예들의 비포괄적인 목록에는 다음이 포함될 수 있다: 휴대용 컴퓨터 디스켓, 하드 디스크, 랜덤 액세스 메모리(RAM), 판독-전용 메모리(ROM), 소거 및 프로그램가능 판독-전용 메모리(EPROM 또는 플래시 메모리), 정적 랜덤 액세스 메모리(SRAM), 휴대용 컴팩트 디스크 판독-전용 메모리(CD-ROM), 디지털 다용도 디스크(DVD), 메모리 스틱, 플로피 디스크, 천공-카드들 또는 명령들이 기록된 홈에 있는 융기된 구조들 같이 머신적으로 인코드 된 장치, 및 전술한 것들의 모든 적절한 조합. 본 명세서에서 사용될 때, 컴퓨터 판독 가능 스토리지 매체는 무선 전파들이나 다른 자유롭게 전파되는 전자기파들, 도파관이나 기타 전송 매체(예를 들어, 광섬유 케이블을 통해 전달되는 광 펄스들)를 통해 전파되는 전자기파들, 또는 선(wire)을 통해 전송되는 전기 신호들 같이 그 자체로 일시적인(transitory) 신호들로 해석되지는 않는다.

[00106] 본 명세서에 기술되는 컴퓨터 판독 가능 명령들은, 예를 들어, 인터넷, 근거리 통신망, 광역 통신망 및/또는 무선 네트워크 등의 통신망(네트워크)을 통해 컴퓨터 판독 가능 스토리지 매체로부터 각각 컴퓨팅/처리 디바이스들로 또는 외부 스토리지 디바이스로부터 외부 컴퓨터로 다운로드 될 수 있다. 상기 통신망은 구리 전송 케이블들, 광 전송 섬유들, 무선 전송, 라우터들, 방화벽들, 스위치들, 게이트웨이 컴퓨터들 및/또는 엣지 서버들을 포함할 수 있다. 각 컴퓨팅/처리 유닛 내 네트워크 어댑터 카드 또는 네트워크 인터페이스는 상기 통신망으로부터 컴퓨터 판독 가능 프로그램 명령들을 수신하고 그 컴퓨터 판독 가능 프로그램 명령들을 각각의 컴퓨팅/처리 디바이스 내의 컴퓨터 판독 가능 스토리지 매체에 저장하기 위해 전송한다.

[00107] 본 발명의 연산들을 실행하기 위한 컴퓨터 판독 가능 프로그램 명령들은 Smalltalk, C++ 또는 그와 유사 언어 등의 객체 지향 프로그래밍 언어와 "C" 프로그래밍 언어 또는 그와 유사한 프로그래밍 언어 등의 종래의 절차적 프로그래밍 언어들을 포함하여, 하나 또는 그 이상의 프로그래밍 언어들을 조합하여 작성된(written) 어셈블러 명령들, 명령-세트-아키텍처(ISA) 명령들, 머신 명령들, 머신 종속 명령들, 마이크로코드, 펌웨어 명령들, 상태-셋팅 데이터, 집적회로를 위한 구성 데이터, 또는 소스 코드나 목적 코드일 수 있다. 상기 컴퓨터 판독 가능 프로그램 명령들은 전적으로 사용자의 컴퓨터상에서, 부분적으로 사용자의 컴퓨터상에서, 독립형(stand-alone) 소프트웨어 패키지로서, 부분적으로 사용자의 컴퓨터상에서 그리고 부분적으로 원격 컴퓨터상에서 또는 전적으로 원격 컴퓨터나 서버상에서 실행될 수 있다. 위에서 마지막의 경우에, 원격 컴퓨터는 근거리 통신망(LAN) 또는 광역 통신망(WAN)을 포함한 모든 종류의 네트워크를 통해서 사용자의 컴퓨터에 접속될 수 있고, 또는 이 접속은 (예를 들어, 인터넷 서비스 제공자를 이용한 인터넷을 통해서) 외부 컴퓨터에 이루어질 수도 있다. 일부 실시 예들에서, 예를 들어 프로그램 가능 로직 회로, 필드-프로그램 가능 게이트 어레이들(FPGA), 또는 프로그램 가능 로직 어레이들(PLA)을 포함한 전자 회로는 본 발명의 실시 예들을 수행하기 위해 전자 회로를 맞춤화하도록 상기 컴퓨터 판독 가능 프로그램 명령들의 상태 정보를 활용하여 상기 컴퓨터 판독 가능 프로그램 명령들을 실행할 수 있다.￢￢￢

[00108] 본 발명의 특징들이 본 발명의 실시 예들에 따른 방법들, 장치들(시스템들), 및 컴퓨터 프로그램 제품들의 플로 차트 예시도들 및/또는 블록도들을 참조하여 기술된다. 플로 차트 예시도들 및/또는 블록도들의 각 블록과 플로 차트 예시도들 및/또는 블록도들 내 블록들의 조합들은 컴퓨터 판독 가능 프로그램 명령들에 의해 구현될 수 있다는 것을 이해할 수 있을 것이다.

[00109] 이들 컴퓨터 판독 가능 프로그램 명령들은 범용 컴퓨터, 특수목적용 컴퓨터, 또는 기타 프로그램가능 데이터 처리 유닛의 프로세서에 제공되어 머신(machine)을 생성하고, 그렇게 하여 그 명령들이 상기 컴퓨터 또는 기타 프로그램가능 데이터 처리 유닛의 프로세서를 통해서 실행되어, 상기 플로 차트 및/또는 블록도의 블록 또는 블록들에 명시된 기능들/동작들을 구현하기 위한 수단을 생성할 수 있다. 이들 컴퓨터 판독 가능 프로그램 명령들은 또한 컴퓨터 판독 가능 스토리지 매체에 저장될 수 있으며, 컴퓨터, 프로그램가능 데이터 처리 유닛 및/또는 기타 디바이스들에 지시하여 명령들이 저장된 상기 컴퓨터 판독 가능 스토리지 매체가 상기 플로 차트 및/또는 블록도의 블록 또는 블록들에 명시된 기능/동작의 특징들을 구현하는 명령들을 포함하는 제조품(an article of manufacture)을 포함하도록 특정한 방식으로 기능하게 할 수 있다.

[00110] 상기 컴퓨터 판독 가능 프로그램 명령들은 또한 컴퓨터, 기타 프로그램가능 데이터 처리 유닛, 또는 다른 디바이스에 로드 되어, 상기 컴퓨터, 기타 프로그램가능 장치 또는 다른 디바이스에서 일련의 동작 단계들이 수행되게 하여 컴퓨터 구현 프로세스를 생성하며, 그렇게 하여 상기 컴퓨터, 기타 프로그램가능 장치, 또는 다른 디바이스 상에서 실행되는 명령들이 플로 차트 및/또는 블록도의 블록 또는 블록들에 명시된 기능들/동작들을 구현할 수 있다.

[00111] 도면들 내 플로 차트 및 블록도들은 본 발명의 여러 실시 예들에 따른 시스템들, 방법들 및 컴퓨터 프로그램 제품들의 가능한 구현들의 아키텍처, 기능(functionality), 및 연산(operation)을 예시한다. 이와 관련하여, 상기 플로 차트 또는 블록도들 내 각 블록은 상기 명시된 로직 기능(들)을 구현하기 위한 하나 또는 그 이상의 실행 가능한 명령들을 포함한 모듈, 세그먼트 또는 명령들의 일부분을 나타낼 수 있다. 일부 다른 실시 예들에서, 상기 블록에 언급되는 기능들은 도면들에 언급된 순서와 다르게 일어날 수도 있다. 예를 들면, 연속으로 도시된 두 개의 블록들은 실제로는 사실상 동시에 실행될 수도 있고, 또는 이 두 블록들은 때때로 관련된 기능에 따라서는 역순으로 실행될 수도 있다. 블록도들 및/또는 플로 차트 예시도의 각 블록, 및 블록도들 및/또는 플로 차트 예시도 내 블록들의 조합들은 특수목적용 하드웨어 및 컴퓨터 명령들의 명시된 기능들 또는 동작들, 또는 이들의 조합들을 수행하는 특수목적용 하드웨어-기반 시스템들에 의해 구현될 수 있다는 것에 또한 주목해야 한다.

[00112] 프로세스 소프트웨어(예를 들어, 도 8의 명령들(860)에 저장된 명령들 중 어느 하나 및/또는 도 3-5 에 관하여 기술된 방법들 중 어느 하나 및/또는 도1-2 및/또는 6-7에서 논의된 기능들 중 어느 하나)는, CD, DVD 등과 같은 저장 매체의 로딩을 통해 클라이언트, 서버 및 프록시 컴퓨터들에 직접 수동으로 로드함으로써 배치될 수 있음이 이해되지만, 상기 프로세스 소프트웨어를 중앙 서버 또는 중앙 서버들 그룹으로 전송함으로써 상기 프로세스 소프트웨어는 또한 자동으로 또는 반자동으로 컴퓨터 시스템에 배치될 수 있다. 그런 다음, 상기 프로세스 소프트웨어는 상기 프로세스 소프트웨어를 실행할 클라이언트 컴퓨터로 다운로드 된다. 또는 상기 프로세스 소프트웨어는 이메일을 통해 클라이언트 시스템으로 직접 전송된다. 그런 다음, 상기 프로세스 소프트웨어는 프로세스 소프트웨어를 디렉토리로 분리하는 일련의 프로그램 명령을 실행함으로써 디렉토리로 분리되거나 디렉토리로 로드된다. 다른 대안은 프로세스 소프트웨어를 클라이언트 컴퓨터 하드 드라이브의 디렉토리로 직접 전송하는 것이다. 프록시 서버들이 있는 경우, 프로세스는 프록시 서버 코드를 선택하고 프록시 서버의 코드를 배치할 컴퓨터를 결정하여, 프록시 서버 코드를 전송한 다음 프록시 서버 코드를 프록시 컴퓨터에 설치한다. 상기 프로세스 소프트웨어는 상기 프록시 서버로 전송된 다음 상기 프록시 서버에 저장된다.

[00113] 본 발명의 실시 예들은 또한 클라이언트 기업, 비영리 조직, 정부 기관, 내부 조직 구조 등과의 서비스 계약의 일부로 전달될 수 있다. 이들 실시 예들은 수행할 컴퓨터 시스템을 구성하는 단계, 여기에 설명된 방법들의 일부 또는 전부를 구현하는 소프트웨어, 하드웨어 및 웹 서비스들을 배치하는 단계를 포함할 수 있다. 이들 실시 예들은 또한 클라이언트의 동작들을 분석하는 단계, 상기 분석에 응답하여 추천들을 생성하는 단계, 추천들의 서브세트들을 구현하는 시스템을 구축하는 단계, 시스템들을 기존 프로세스들 및 하부구조에 통합하는 단계, 시스템들의 사용을 측정하는 단계, 시스템들의 사용자들에게 비용을 할당하는 단계, 청구하는 단계, 인보이스 발행하는 단계(예: 인보이스를 생성하는 단계) 또는 시스템들의 사용에 대한 대금을 수령하는 단계를 포함할 수 있다.

[00114] 여기서 사용된 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 다양한 실시 예들을 한정하려는 의도가 아니다. 본 명세서에 사용된 바와 같이, 단수 형태 표현은 문맥이 명백하게 달리 나타내지 않는 한 복수 형태도 포함하는 것으로 의도된다. 본 명세서에서 사용될 때 "포함한다" 및/또는 "포함하는"이라는 용어는 언급된 특징들, 정수들, 단계들, 동작들, 엘리멘트들 및/또는 컴포넌트들의 존재를 지정하지만 하나 이상의 다른 특징들, 정수들, 단계들, 동작들, 엘리멘트들, 컴포넌트 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다는 것이 더 이해될 것이다. 다양한 실시 예들의 예시적인 실시 예들에 대한 이전의 상세한 설명에서, 본 명세서의 일부를 형성하는, 첨부 도면들(유사한 번호들은 유사한 엘리멘트들을 나타냄)을 참조하였고, 이 도면들은 다양한 실시예가 실시될 수 있는 특정 예시적인 실시 예들을 예시의 방식으로 도시되었다. 이들 실시 예들은 당업자가 실시예를 실시할 수 있도록 충분히 상세하게 설명되었지만, 다양한 실시 예들의 범위를 벗어나지 않고 다른 실시 예들 사용될 수 있고 논리적, 기계적, 전기적 및 기타 변경들이 이루어질 수 있다. 이전 설명에서, 다양한 실시 예들에 대한 완전한 이해를 제공하기 위해 다수의 특정 세부사항들이 설명되었다. 그러나 이러한 특정 세부사항들 없이 다양한 실시 예들가 실시될 수 있다. 다른 예들에서, 잘 알려진 회로, 구조 및 기술들은 실시 예들을 모호하게 하지 않기 위해 상세하게 도시되지 않았다.

[00115] 본 명세서 내에서 사용된 "실시예"라는 단어의 다른 예들은 반드시 동일한 실시예를 지칭하는 것은 아니지만, 그럴 수도 있다. 여기에 예시되거나 설명된 모든 데이터 및 데이터 구조는 예시일 뿐이며, 다른 실시 예들에서는 다른 양의 데이터, 데이터 유형들, 필드들, 필드들 수 및 유형들, 필드 이름들, 행들, 레코드들, 엔트리들 또는 데이터의 조직들이 사용될 수 있다. 또한 모든 데이터는 로직과 결합할 수 있어, 별도의 데이터 구조가 필요하지 않을 수 있다. 그러므로, 이전의 상세한 설명은 제한적인 의미로 받아들여져서는 안 된다.

[00116] 본 발명의 다양한 실시 예들의 설명들은 예시의 목적으로 제공되는 것이며, 개시된 실시 예들이 전부라거나 이들에 한정하려는 의도가 있는 것은 아니다. 많은 수정들 및 변형들이 설명된 실시 예들의 범위와 정신을 벗어남이 없이 이 기술 분야에서 통상의 지식을 가진 자에게는 명백할 것이다. 여기서 사용된 용어들은 실시 예들의 원리들, 실제 애플리케이션 또는 시장에서 발견된 기술들에 대한 기술적 개선을 가장 잘 설명하기 위해 또는 이 기술 분야에서 통상의 지식을 가진 자들이 여기서 개시된 실시 예들을 이해할 수 있도록 하기 위해 선택되었다.

[00117] 본 발명이 특정 실시예의 관점에서 설명되었지만, 그에 관한 변경들 및 수정들은 당업자에게 명백할 것으로 예상된다. 따라서, 다음 청구범위는 본 발명의 진정한 정신 및 범위에 속하는 모든 그러한 변경들 및 수정들을 포함하는 것으로 해석되도록 의도된다.

[00118] 본 발명의 개시에서 논의된 모든 이점들은 예시적인 이점들이고, 본 발명의 정신 및 범위 내에 남아 있으면서 논의된 이점들 전부를 실현하거나 또는 전혀 실현하지 않는 본 발명의 실시 예들도 존재할 수 있다.

[00119] 예들의의 비제한적인 목록은 본 발명의 일부 실시 예들을 보여주기 위해 이후에 제공된다. 예 1은 컴퓨터 구현 방법이다. 상기 방법은 고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계 - 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함한다

[00120] 예 2는 예 1의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 분류는 상기 새로운 데이터 샘플과 연관된 자산의 마모-관련 성능 저하 가능성(a likelihood of wear-related performance degradation of an asset)을 나타낸다.

[00121] 예 3은 예들 1 또는 2의 어느 하나의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 룩-백 윈도우는 각각의 개별 훈련 샘플에 포함할 순차적 이전 데이터 포인트들의 양(a quantity of sequentially previous data points)을 정의한다.

[00122] 예 4는 예들 1 내지 3의 어느 하나의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 예측 수평선은 미래의 미리 정의된 시간 량을 정의하고, 미래의 미리 정의된 시간 량의 각 데이터 포인트들의 각 라벨들은 상기 각 훈련 샘플들과 연관된다.

[00123] 예 5는 예들 1 내지 4의 어느 하나의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 각각의 훈련 샘플들은 K-평균 클러스터링을 사용하여 클러스터 된다.

[00124] 예 6은 예들 1 내지 5의 어느 하나의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 방법은 원격 데이터 처리 시스템으로부터 고장 예측 시스템으로 다운로드 된 소프트웨어에 따라 상기 고장 예측 시스템에 의해 수행된다. 선택적으로, 상기 방법은: 소프트웨어 사용량을 측정하는 단계; 및 상기 사용량을 측정하는 것에 기초하여 인보이스를 생성하는 단계를 더 포함한다.

[00125] 예 7은 시스템이다. 상기 시스템은 하나 혹은 그 이상의 프로세서들; 및 프로그램 명령들을 저장하는 하나 혹은 그 이상의 컴퓨터-판독 가능 스토리지 매체를 포함하고, 상기 프로그램 명령들은 상기 하나 혹은 그 이상의 프로세서들에 의해 실행될 때, 상기 하나 혹은 그 이상의 프로세서들이 방법을 수행하도록 구성되며, 상기 방법은: 고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계 - 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함한다.

[00126] 예 8은 예 7의 시스템을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 분류는 상기 새로운 데이터 샘플과 연관된 자산의 마모-관련 성능 저하 가능성(a likelihood of wear-related performance degradation of an asset)을 나타낸다.

[00127] 예 9는 예들 7 내지 8의 어느 하나의 시스템을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 룩-백 윈도우는 각각의 개별 훈련 샘플에 포함할 순차적 이전 데이터 포인트들의 양(a quantity of sequentially previous data points)을 정의한다.

[00128] 예 10은 예들 7 내지 9의 어느 하나의 시스템을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 예측 수평선은 미래의 미리 정의된 시간 량을 정의하고, 미래의 미리 정의된 시간 량의 각 데이터 포인트들의 각 라벨들은 상기 훈련 샘플들과 연관된다.

[00129] 예 11은 예들 7 내지 10의 어느 하나의 시스템을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 각각의 훈련 샘플들은 K-평균 클러스터링을 사용하여 클러스터 된다.

[00130] 예 12는 컴퓨터 프로그램 제품이다. 상기 컴퓨터 프로그램 제품은 하나 혹은 그 이상의 컴퓨터 판독 가능 스토리지 매체, 및 상기 하나 혹은 그 이상의 컴퓨터 판독 가능 스토리지 매체 상에 집합적으로 저장된 프로그램 명령들을 포함하고, 상기 프로그램 명령들은 하나 혹은 그 이상의 프로세서들이 방법을 수행하도록 구성된 명령들을 포함하며, 상기 방법은 고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계 - 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함한다.

[00131] 예 13은 예 12의 컴퓨터 프로그램 제품을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 분류는 상기 새로운 데이터 샘플과 연관된 자산의 마모-관련 성능 저하 가능성(a likelihood of wear-related performance degradation of an asset)을 나타낸다.

[00132] 예 14는 예들 12 내지 13의 어느 하나의 컴퓨터 프로그램 제품을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 룩-백 윈도우는 각각의 개별 훈련 샘플에 포함할 순차적 이전 데이터 포인트들의 양(a quantity of sequentially previous data points)을 정의한다.

[00133] 예 15는 예들 12 내지 14의 어느 하나의 컴퓨터 프로그램 제품을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 예측 수평선은 미래의 미리 정의된 시간 량을 정의하고, 미래의 미리 정의된 시간 량의 각 데이터 포인트들의 각 라벨들은 상기 훈련 샘플들과 연관된다.

[00134] 예 16은 예들 12 내지 15의 어느 하나의 컴퓨터 프로그램 제품을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 각각의 훈련 샘플들은 K-평균 클러스터링을 사용하여 클러스터 된다.

[00135] 예 17은 프로그래싱 캐비티 펌프들(PCP들)의 마모-관련 열화를 예측하기 위한 컴퓨터-구현 방법이고, 상기 방법은 PCP의 마모-관련 열화를 예측하도록 구성된 모델에 상기 PCP의 새로운 데이터 샘플을 입력하는 단계 - 상기 모델은 라벨 된 과거 PCP 데이터 세트(a labeled historical PCP dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및 상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함하고, 상기 분류는 PCP의 마모 관련 저하를 나타낸다.

[00136] 예 18은 프로그래싱 캐비티 펌프들(PCP들)의 마모-관련 열화를 예측하기 위한 컴퓨터 구현 방법이고, 상기 방법은 하나 혹은 그 이상의 PCP들과 연관된 과거 데이터의 이진 라벨링을 수행하여 라벨 된 과거 데이터를 생성하는 단계; 상기 라벨 된 과거 데이터의 각 데이터 포인트들에 룩-백 윈도우 및 예측 지평선을 적용함으로써 복수의 훈련 데이터 샘플들을 생성하는 단계; 상기 복수의 훈련 데이터 샘플들을 복수의 클러스터들로 클러스터 하는 단계; 상기 복수의 클러스터들의 각 클러스터들에 대한 클러스터 점수들을 계산하는 단계; PCP의 새로운 데이터 샘플을 상기 복수의 클러스터들 중 제1 클러스터에 할당하는 단계; 및 상기 제1 클러스터와 연관된 클러스터 점수들에 기초하여 상기 새로운 데이터 샘플에 분류를 할당하는 단계를 포함하고, 상기 분류는 PCP의 향후 마모-관련 열화의 가능성을 나타낸다.

[00137] 예 19는 예 18의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 라벨 된 과거 데이터는 알려진 펌프 교체 날짜 이전의 미리 결정된 기간 동안 결함이 있는 것으로 라벨 된다.

[00138] 예 20은 예들 18 내지 19의 어느 하나의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 라벨 된 과거 데이터는 펌프 속도 데이터, 펌프 토크 데이터, 케이싱 압력 데이터, 생산 속도 데이터, 및 유지보수 기록들(pump speed data, pump torque data, casing pressure data, production rate data, and maintenance records)을 포함한다.

[00139] 예 21은 예들 18 내지 20의 어느 하나의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 각각의 클러스터들에 대한 클러스터 점수들을 계산하는 단계는: 상기 제1 클러스터에 대한 정상 점수를 계산하는 단계 - 상기 정상 점수는 상기 제1 클러스터 내의 정상 상태와 연관된 훈련 데이터 샘플들의 제1 부분을 상기 복수의 훈련 데이터 샘플들 내의 정상 상태와 연관된 훈련 데이터 샘플들의 제2 부분에 의해 나눈 값임-; 및 상기 제1 클러스터에 대한 비정상 점수를 계산하는 단계 - 상기 비정상 점수는 상기 제1 클러스터 내의 열화된 상태와 연관된 훈련 데이터 샘플들의 제3 부분을 상기 복수의 훈련 데이터 샘플들의 열화된 상태와 연관된 훈련 데이터 샘플들의 제4 부분에 의해 나눈 값임 -를 더 포함한다.

[00140] 예 22는 예들 18 내지 21의 어느 하나의 방법을 포함하고, 선택적 특징들을 포함하거나 또는 배제한다. 이 예에서, 상기 방법은 상기 새로운 데이터 샘플에 대한 고장 신호(a failure signal)를 생성하는 단계를 더 포함하고, 상기 고장 신호는 미리 결정된 수의 이전 데이터 포인트들에 대해 상기 새로운 데이터 샘플에 대한 평균 비정상 점수를 더 포함한다. 선택적으로, 상기 고장 신호를 생성하는 단계는: 비정상 점수보다 큰 정상 점수를 갖는 상기 복수의 클러스터들의 클러스터들에 대한 평균 비정상 점수(a mean anomaly score)를 계산하는 단계; 상기 미리 결정된 수의 이전 데이터 포인트들 각각에 대해, 상기 평균 비정상 점수보다 큰 제1 클러스터의 비정상 점수를 갖는 데이터 포인트들에 1의 값을 연관시키는 단계, 및 상기 평균 비정상 점수보다 작은 제1 클러스터의 비정상 점수를 갖는 데이터 포인트들에 0의 값을 연관시키는 단계; 그리고 상기 미리 결정된 수의 이전 데이터 포인트들 각각과 연관된 1의 값들 및 0의 값들의 평균으로서 상기 고장 신호를 계산하는 단계를 더 포함한다.

Claims

컴퓨터-구현 방법에 있어서, 상기 방법은:
고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계 - 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및
상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함하는
방법.
제1항에 있어서, 상기 분류는 상기 새로운 데이터 샘플과 연관된 자산의 마모-관련 성능 저하 가능성(a likelihood of wear-related performance degradation of an asset)을 나타내는
방법.
제1항에 있어서, 상기 룩-백 윈도우는 각각의 개별 훈련 샘플에 포함할 순차적 이전 데이터 포인트들의 양(a quantity of sequentially previous data points)을 정의하는
방법.
제1항에 있어서, 상기 예측 수평선은 미래의 미리 정의된 시간 량을 정의하고, 미래의 미리 정의된 시간 량의 각 데이터 포인트들의 각 라벨들은 상기 훈련 샘플들과 연관되는
방법.
제1항에 있어서, 상기 각각의 훈련 샘플들은 K-평균 클러스터링을 사용하여 클러스터 되는
방법.
제1항에 있어서, 상기 방법은 원격 데이터 처리 시스템으로부터 고장 예측 시스템으로 다운로드 된 소프트웨어에 따라 상기 고장 예측 시스템에 의해 수행되는
방법.
제6항에 있어서, 상기 방법은:
소프트웨어 사용량을 측정하는 단계, 및
상기 사용량을 측정하는 것에 기초하여 인보이스를 생성하는 단계를 더 포함하는
방법.
제1항에 있어서, 상기 방법은 프로그래싱 캐비티 펌프들(progressing cavity pumps:PCPs)의 마모-관련 열화(wear-related deterioration)를 예측하기 위한 것이며, 상기 입력 단계는 PCP의 마모-관련 열화를 예측하도록 구성된 모델에 상기 PCP의 새로운 데이터 샘플을 입력하는 단계를 포함하고, 상기 모델은 라벨된 과거 PCP 데이터세트를 사용하여 훈련되며, 상기 출력 단계 동안 출력되는 분류는 상기 PCP의 마모-관련 열화를 나타내는
방법.
제8항에 있어서, 상기 방법은:
하나 혹은 그 이상의 PCP들과 관련된 과거 데이터의 이진 라벨링을 수행하여 라벨된 과거 데이터를 생성하는 단계를 포함하고, 상기 복수의 훈련 데이터 샘플들은 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)을 상기 라벨된 과거 데이터의 각각의 데이터 포인트들에 적용함으로써 생성되며, 상기 방법은:
상기 복수의 클러스터들의 각 클러스터들에 대해 계산된 클러스터 점수들을 계산하는 단계 - 상기 클러스터 점수들은 정상 점수 및 비정상 점수임-;
상기 PCP의 새로운 데이터 샘플을 상기 복수의 클러스터들 중 제1 클러스터에 할당하는 단계; 및
상기 제1 클러스터와 연관된 클러스터 점수들에 기초하여 상기 새로운 데이터 샘플에 분류를 할당하는 단계를 포함하는
방법.
제9항에 있어서, 상기 라벨된 과거 데이터는 알려진 펌프 교체 날짜 이전의 미리 결정된 기간 동안 결함이 있는 것(faulty)으로 라벨된
방법.
제9항에 있어서, 상기 라벨된 과거 데이터는 펌프 속도 데이터, 펌프 토크 데이터, 케이싱 압력 데이터, 생산 속도 데이터, 및 유지보수 기록들(comprises pump speed data, pump torque data, casing pressure data, production rate data, and maintenance records)을 포함하는
방법.
제9항에 있어서, 상기 각각의 클러스터들에 대한 클러스터 점수들을 계산하는 단계는:
상기 제1 클러스터에 대한 정상 점수를 계산하는 단계 - 상기 정상 점수는 상기 제1 클러스터 내의 정상 상태와 연관된 훈련 데이터 샘플들의 제1 부분을 상기 복수의 훈련 데이터 샘플들 내의 정상 상태와 연관된 훈련 데이터 샘플들의 제2 부분에 의해 나눈 값임-; 및
상기 제1 클러스터에 대한 비정상 점수를 계산하는 단계 - 상기 비정상 점수는 상기 제1 클러스터 내의 열화된 상태와 연관된 훈련 데이터 샘플들의 제3 부분을 상기 복수의 훈련 데이터 샘플들의 열화된 상태와 연관된 훈련 데이터 샘플들의 제4 부분에 의해 나눈 값임 -를 더 포함하는
방법.
제12항에 있어서, 상기 분류는 상기 제1 클러스터에 대한 정상 점수 또는 비정상 점수 중 더 큰 값에 기초하는
방법.
제9항에 있어서, 상기 방법은:
상기 새로운 데이터 샘플에 대한 고장 신호(a failure signal)를 생성하는 단계를 더 포함하고, 상기 고장 신호는 미리 결정된 수의 이전 데이터 포인트들에 대해 상기 새로운 데이터 샘플에 대한 평균 비정상 점수를 포함하는
방법.
제14항에 있어서, 상기 고장 신호를 생성하는 단계는:
비정상 점수보다 큰 정상 점수를 갖는 상기 복수의 클러스터들의 클러스터들에 대한 평균 비정상 점수(a mean anomaly score)를 계산하는 단계;
상기 미리 결정된 수의 이전 데이터 포인트들 각각에 대해, 상기 평균 비정상 점수보다 큰 제1 클러스터의 비정상 점수를 갖는 데이터 포인트들에 1의 값을 연관시키는 단계, 및 상기 평균 비정상 점수보다 작은 제1 클러스터의 비정상 점수를 갖는 데이터 포인트들에 0의 값을 연관시키는 단계; 그리고
상기 미리 결정된 수의 이전 데이터 포인트들 각각과 연관된 1의 값들 및 0의 값들의 평균으로서 상기 고장 신호를 계산하는 단계를 더 포함하는
방법.
시스템에 있어서, 상기 시스템은:
하나 혹은 그 이상의 프로세서들; 및
프로그램 명령들을 저장하는 하나 혹은 그 이상의 컴퓨터-판독 가능 스토리지 매체를 포함하고, 상기 프로그램 명령들은 상기 하나 혹은 그 이상의 프로세서들에 의해 실행될 때, 상기 하나 혹은 그 이상의 프로세서들이 방법을 수행하도록 구성되며, 상기 방법은:
고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계 - 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및
상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함하는
시스템.
제16항에 있어서, 상기 분류는 상기 새로운 데이터 샘플과 연관된 자산의 마모-관련 성능 저하 가능성(a likelihood of wear-related performance degradation of an asset)을 나타내는
시스템.
제16항에 있어서, 상기 룩-백 윈도우는 각각의 개별 훈련 샘플에 포함할 순차적 이전 데이터 포인트들의 양(a quantity of sequentially previous data points)을 정의하는
시스템.
제16항에 있어서, 상기 예측 수평선은 미래의 미리 정의된 시간 량을 정의하고, 미래의 미리 정의된 시간 량의 각 데이터 포인트들의 각 라벨들은 상기 훈련 샘플들과 연관되는
시스템.
제16항에 있어서, 상기 각각의 훈련 샘플들은 K-평균 클러스터링을 사용하여 클러스터 되는
시스템.
컴퓨터 프로그램 제품에 있어서, 상기 컴퓨터 프로그램 제품은 하나 혹은 그 이상의 컴퓨터 판독 가능 스토리지 매체, 및 상기 하나 혹은 그 이상의 컴퓨터 판독 가능 스토리지 매체 상에 집합적으로 저장된 프로그램 명령들을 포함하고, 상기 프로그램 명령들은 하나 혹은 그 이상의 프로세서들이 방법을 수행하도록 구성된 명령들을 포함하며, 상기 방법은:
고장 예측 모델(a failure prediction model)에 새로운 데이터 샘플을 입력하는 단계 - 상기 고장 예측 모델은 라벨 된 과거 데이터 세트(a labeled historical dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및
상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함하는
컴퓨터 프로그램 제품.
제21항에 있어서, 상기 분류는 상기 새로운 데이터 샘플과 연관된 자산의 마모-관련 성능 저하 가능성(a likelihood of wear-related performance degradation of an asset)을 나타내는
컴퓨터 프로그램 제품.
제21항에 있어서, 상기 룩-백 윈도우는 각각의 개별 훈련 샘플에 포함할 순차적 이전 데이터 포인트들의 양(a quantity of sequentially previous data points)을 정의하는
컴퓨터 프로그램 제품.
제21항에 있어서, 상기 예측 수평선은 미래의 미리 정의된 시간 량을 정의하고, 미래의 미리 정의된 시간 량의 각 데이터 포인트들의 각 라벨들은 상기 훈련 샘플들과 연관되는
컴퓨터 프로그램 제품.
제21항에 있어서, 상기 각각의 훈련 샘플들은 K-평균 클러스터링을 사용하여 클러스터 되는
컴퓨터 프로그램 제품.
프로그래싱 캐비티 펌프들(PCP들)의 마모-관련 열화를 예측하기 위한 컴퓨터-구현 방법에 있어서, 상기 방법은:
PCP의 마모-관련 열화를 예측하도록 구성된 모델에 상기 PCP의 새로운 데이터 샘플을 입력하는 단계 - 상기 모델은 라벨 된 과거 PCP 데이터 세트(a labeled historical PCP dataset)를 사용하여 훈련되고, 각각의 데이터 포인트들은 각각의 훈련 샘플을 생성하기 위해 룩-백 윈도우 및 예측 수평선(a look-back window and a prediction horizon)과 연관되며, 상기 각각의 훈련 샘플들은 복수의 클러스터들로 클러스터 되고, 상기 복수의 클러스터들은 각각 정상 점수 및 비정상 점수(a normalcy score and an anomaly score)와 연관됨-; 및
상기 새로운 데이터 샘플을 포함하는 복수의 클러스터들 중 제1 클러스터의 제1 비정상 점수를 상기 비정상 점수보다 큰 정상 점수를 갖는 복수의 클러스터들 중 클러스터들의 평균 비정상 점수와 비교하는 것에 기초하여 상기 새로운 데이터 샘플과 연관된 분류를 출력하는 단계를 포함하고, 상기 분류는 PCP의 마모 관련 저하를 나타내는
방법.
프로그래싱 캐비티 펌프들(PCP들)의 마모-관련 열화를 예측하기 위한 컴퓨터 구현 방법에 있어서, 상기 방법은:
하나 혹은 그 이상의 PCP들과 연관된 과거 데이터의 이진 라벨링을 수행하여 라벨 된 과거 데이터를 생성하는 단계;
상기 라벨 된 과거 데이터의 각 데이터 포인트들에 룩-백 윈도우 및 예측 지평선을 적용함으로써 복수의 훈련 데이터 샘플들을 생성하는 단계;
상기 복수의 훈련 데이터 샘플들을 복수의 클러스터들로 클러스터 하는 단계;
상기 복수의 클러스터들의 각 클러스터들에 대한 클러스터 점수들을 계산하는 단계;
PCP의 새로운 데이터 샘플을 상기 복수의 클러스터들 중 제1 클러스터에 할당하는 단계; 및
상기 제1 클러스터와 연관된 클러스터 점수들에 기초하여 상기 새로운 데이터 샘플에 분류를 할당하는 단계를 포함하고, 상기 분류는 PCP의 향후 마모-관련 열화의 가능성을 나타내는
방법.
제27항에 있어서, 상기 라벨 된 과거 데이터는 알려진 펌프 교체 날짜 이전의 미리 결정된 기간 동안 결함이 있는 것으로 라벨 되는
방법.
제27항에 있어서, 상기 라벨 된 과거 데이터는 펌프 속도 데이터, 펌프 토크 데이터, 케이싱 압력 데이터, 생산 속도 데이터, 및 유지보수 기록들을 포함하는
방법.
제27항에 있어서, 상기 각각의 클러스터들에 대한 클러스터 점수들을 계산하는 단계는:
상기 제1 클러스터에 대한 정상 점수를 계산하는 단계 - 상기 정상 점수는 상기 제1 클러스터 내의 정상 상태와 연관된 훈련 데이터 샘플들의 제1 부분을 상기 복수의 훈련 데이터 샘플들 내의 정상 상태와 연관된 훈련 데이터 샘플들의 제2 부분에 의해 나눈 값임-; 및
상기 제1 클러스터에 대한 비정상 점수를 계산하는 단계 - 상기 비정상 점수는 상기 제1 클러스터 내의 열화된 상태와 연관된 훈련 데이터 샘플들의 제3 부분을 상기 복수의 훈련 데이터 샘플들의 열화된 상태와 연관된 훈련 데이터 샘플들의 제4 부분에 의해 나눈 값임 -를 더 포함하는
방법.
제30항에 있어서, 상기 분류는 상기 제1 클러스터에 대한 정상 점수 또는 비정상 점수 중 더 큰 값에 기초하는
방법.
제27항에 있어서, 상기 방법은:
상기 새로운 데이터 샘플에 대한 고장 신호(a failure signal)를 생성하는 단계를 더 포함하고, 상기 고장 신호는 미리 결정된 수의 이전 데이터 포인트들에 대해 상기 새로운 데이터 샘플에 대한 평균 비정상 점수를 더 포함하는
방법.
제32항에 있어서, 상기 고장 신호를 생성하는 단계는:
비정상 점수보다 큰 정상 점수를 갖는 상기 복수의 클러스터들의 클러스터들에 대한 평균 비정상 점수(a mean anomaly score)를 계산하는 단계;
상기 미리 결정된 수의 이전 데이터 포인트들 각각에 대해, 상기 평균 비정상 점수보다 큰 제1 클러스터의 비정상 점수를 갖는 데이터 포인트들에 1의 값을 연관시키는 단계, 및 상기 평균 비정상 점수보다 작은 제1 클러스터의 비정상 점수를 갖는 데이터 포인트들에 0의 값을 연관시키는 단계; 그리고
상기 미리 결정된 수의 이전 데이터 포인트들 각각과 연관된 1의 값들 및 0의 값들의 평균으로서 상기 고장 신호를 계산하는 단계를 더 포함하는
방법.
컴퓨터 프로그램에 있어서, 상기 컴퓨터 프로그램은, 컴퓨터에서 실행될 때, 제1항 내지 제15항 및 제26항 내지 제33항 중 어느 한 항의 방법을 수행하도록 구성된 프로그램 코드 수단들을 포함하는
컴퓨터 프로그램.