KR101995042B1 - 감독 학습 방법론들을 활용하는 가스 터빈 고장 예측 - Google Patents

감독 학습 방법론들을 활용하는 가스 터빈 고장 예측 Download PDF

Info

Publication number
KR101995042B1
KR101995042B1 KR1020177009441A KR20177009441A KR101995042B1 KR 101995042 B1 KR101995042 B1 KR 101995042B1 KR 1020177009441 A KR1020177009441 A KR 1020177009441A KR 20177009441 A KR20177009441 A KR 20177009441A KR 101995042 B1 KR101995042 B1 KR 101995042B1
Authority
KR
South Korea
Prior art keywords
data
event
gas turbine
event data
sensor
Prior art date
Application number
KR1020177009441A
Other languages
English (en)
Other versions
KR20170055510A (ko
Inventor
신민 차이
아미트 챠크라보르티
매튜 에반스
시옹 테 고
차오 유안
Original Assignee
지멘스 에너지, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지멘스 에너지, 인코포레이티드 filed Critical 지멘스 에너지, 인코포레이티드
Publication of KR20170055510A publication Critical patent/KR20170055510A/ko
Application granted granted Critical
Publication of KR101995042B1 publication Critical patent/KR101995042B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • G06N5/047Pattern matching networks; Rete networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/0227Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
    • G05B23/0229Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions knowledge based, e.g. expert systems; genetic algorithms
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0283Predictive maintenance, e.g. involving the monitoring of a system and, based on the monitoring results, taking decisions on the maintenance schedule of the monitored system; Estimating remaining useful life [RUL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Automation & Control Theory (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

가스 터빈과 같은 기계류의 고장들을 예측하기 위한 시스템 및 방법이 제공된다. 시스템 및 방법은 컴퓨터-기반 시스템을 활용하여 이력 데이터에 주석을 달아 이전 고장 이벤트를 위치결정한다. 고장 이벤트 이전의 센서 판독들과 연관된 데이터에는 이 데이터가 고장과 연관될 가능성이 있음을 주의시키기 위한 주석이 달리며, 이 데이터는 정상 작동 조건 데이터와 비교된다. 정상 작동 데이터(네거티브 클래스, 과반수 그룹)에 대한 프리-이벤트 데이터(포지티브 클래스, 소스 그룹)의 위치를 학습하기 위해 패스트 박스 알고리즘이 사용된다. 정상 데이터에 대한 프리-이벤트 데이터의 구별 강도를 분석하기 위한 평가가 수행되며, 비교적 강한 차이가 발견되면, 연관된 프리-이벤트 데이터는 저장되며, 그리고 기계의 계속되는 성능을 모니터링하며, 그렇지 않으면 발생할 예상 밖의 고장일들의 가능성을 예측하기 위한 징후로서 사용된다.

Description

감독 학습 방법론들을 활용하는 가스 터빈 고장 예측{GAS TURBINE FAILURE PREDICTION UTILIZING SUPERVISED LEARNING METHODOLOGIES}
관련 출원들에 대한 상호 참조
본 출원은, 2014년 9월 10일자로 출원되었고 본원에 인용에 의해 통합된 미국 가출원 일련 번호 제 62/048,577호에 대한 우선권을 주장한다.
본 발명은 발전 네트워크(network)들에서 활용되는 가스 터빈(gas turbine)들에 대한 감독, 그리고 예방적 유지보수 작업들이 전개되도록 허용하는, 터빈의 선-결함 조건들을 인식하기 위한 방법론에 관한 것이다.
화석 연료들의 효율적인 사용은 안정된 전력 네트워크를 유지하는데 중요하다. 이러한 타입(type)의 연료를 전기 에너지(energy)로 변환시키는 특히 효율적인 수단은 가스 터빈이다. 가스 터빈 컴포넌트(component)들은 매우 높은 온도 환경에서 그리고 다양한 부하 조건들 하에서 작동한다. 열 피로 및 마모에 기인하는 부품들의 열화는 실제 관심사이다. 마모를 검출 및 제어하기 위해, 뿐만 아니라 마모된 부품들을 필요한 대로 수리 또는 교체하여 효율적인 작동을 계속해서 보장하기 위해, 유지보수가 수행된다.
유지보수 이벤트(event)들의 스케줄링(scheduling)에서 통계적 도움을 제공하기 위해 다양한 데이터(data)-주도 기술들이 개발되었지만(그리고 계속해서 개발될 것이지만), 개선을 위한 여지가 여전히 있다. 예컨대, 가스 터빈 고장들에 기인하는 예상 밖의 강제적인 정전들이 계속해서 발생한다. 터빈의 완전한 고장은 반드시 전기 생성의 정상 작동을 방해하는 셧다운(shutdown)을 야기하며, 계획된 유지보수 셧다운보다 더욱 값비싼 수리 이벤트를 야기할 가능성이 있다.
선행 기술에 남아 있는 요구들은 본 발명에 의해 다루어지며, 본 발명은 발전 네트워크들에서 활용되는 가스 터빈들에 대한 감독, 그리고 예방적 유지보수 작업들이 전개되도록 허용하며 예상 밖의 강제적인 터빈 셧다운의 가능성을 완화시키는, 터빈의 선-결함 조건들을 인식하기 위한 방법론에 관한 것이다.
본 발명에 따라, (센서(sensor) 판독들의 형태의) 특정 가스 터빈에 대한 데이터(data)의 시계열 세트(set)가 검토되며, 이 데이터의 시계열 세트에는, 잠재적인 고장이 발생했던 시간들/이벤트들을 표시하는 라벨(label)들을 포함하도록 주석이 달린다. 일정 시간 기간(예컨대, 3-5일)에 걸친 선택된 개수의 "프리-이벤트(pre-event)" 센서 판독들이 어셈블링되고(assembled), 알려져 있는 정상-상태의 정상 작동 센서 판독들과 비교되어, 터빈 고장(또는 검토되고 있는 임의의 다른 특정 "이벤트")의 발생을 예측하는 임의의 시그니처(signature)들이 프리-이벤트 데이터에 있는지가 결정된다. 즉, 며칠의 센서 판독들은 터빈 고장(또는 임의의 다른 이벤트)에 이르는 임의의 지각가능한 "징후들"이다. 프리-이벤트 데이터를 "정상 작동 상태" 데이터와 비교하고, 징후들이 인식될 수 있는지를 확인하기 위해, "패스트 박스" 알고리즘(fast boxes algorithm)(또는 다른 적절한 타입의 기계 학습 방법론)이 사용된다. 앞으로, 분석에서 발전되는 경계들 내에 속하는 센서 판독들은, 고장이 임박했을 수 있다는 경고들로서 사용된다.
본 발명의 바람직한 실시예에서, 총 개수의 가스 터빈 센서들의 서브세트(subset), 바람직하게는 가스 터빈 성능의 변화들에 매우 민감한 판독들을 갖는 센서들만이 분석에 포함된다. "프리-이벤트" 데이터 및 "정상 작동" 데이터 둘 모두의 수집되는 판독들이 불균형의 데이터 세트(즉, 관심대상 데이터가 데이터의 나머지에 대하여 매우 작은 집합임)를 형성하기 때문에, 데이터를 연구할 때 사용하기에 패스트 박스 알고리즘이 적합하다. 먼저, 프리-이벤트 데이터(포지티브 데이터 클래스(positive data class))가 비교적 적은 개수의 클러스터(cluster)들로 경계가 이루어지며, 이후, 더 많은 양의 정상 작동 데이터(네거티브(negative) 데이터 클래스)와 비교하여 평가되어, 네거티브 데이터 클래스로부터 포지티브 데이터 클래스를 구분하는 최적 경계 조건들(이 경우, "박스(box)들")이 확인된다. 일단 이들 두 개의 카테고리(category)들로 파티셔닝되면(partitioned), 프리-이벤트 데이터와 정상 작동 데이터 사이에 충분한 차이점이 있는지를 결정하기 위한 메트릭(metric)이 사용되며, 따라서 프리-이벤트 데이터는 앞으로 "징후" 표시자로서 사용될 수 있다.
가스 터빈 "고장" 이벤트 면에서 논의되지만, 본 발명의 방법론은, 가스 터빈 또는 다른 주요한 기계 컴포넌트(component)의 성능에서 원치 않는 인터럽션(interruption)을 유발하는 또 다른 타입의 이벤트를 연구하는 것에 적용가능하다.
본 발명의 특정 실시예는, 전력 플랜트(plant)에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법에 관한 것이며, 이 방법은, 연구되고 있는 가스 터빈의 인식된 고장 이벤트와 연관된 이력 시계열 데이터의 세트를 획득하는 단계 ―이력 데이터는 프리-이벤트 시간 기간으로서 정의된, 인식된 이벤트 이전의 시간 기간 동안 수집된 센서(sensor) 판독들의 세트를 포함함―; 분석될 센서들의 서브세트를 선택하며, 프리-이벤트 데이터의 세트를, 프리-이벤트 시간 기간 동안 수집된, 센서들의 선택된 서브세트로부터의 센서 판독들로서 정의하는 단계; 프리-이벤트 데이터를 정상 작동 데이터의 세트와 비교하는 단계; 프리-이벤트 데이터와 정상 작동 데이터 사이의 구별 레벨(level)을 확인하는 단계, 및 구별 레벨이 정해진 임계치 위라면, 프리-이벤트 데이터를, 연구되고 있는 가스 터빈의 장래 고장을 예측할 때 사용하기 위한 징후 패턴(pattern)으로서 식별하는 단계를 포함한다.
본 발명의 다른 실시예에서, 비-일시적 컴퓨터(computer)-사용가능 매체는 위에서 설명된 방법을 수행하기 위해 프로세서(processor)에 의한 실행을 위한 컴퓨터 판독가능 명령들을 저장하고 있다.
본 발명의 다른, 그리고 추가적인 양상들 및 특징들은 하기의 논의 과정 동안 그리고 첨부된 도면들에 대한 참조에 의해 명백할 것이다.
이제, 도면들을 참조하면,
도 1은 터빈의 성능을 측정하기 위해 사용되는 센서들의 포함을 표시하며, 본 발명에 따라 형성된 예시적 성능 예측기 컴포넌트를 또한 예시하는, 예시적 가스 터빈 전력 플랜트의 간략한 다이어그램(diagram)이다.
도 2는 본 발명에 따른 가스 터빈 고장을 예측하기 위한 감독 학습 접근법의 흐름도이다.
도 3은 본 발명에 따라 패스트 박스 알고리즘에 의해 수행되는 바와 같은, 프리-이벤트 데이터를 클러스터링(clustering)하는 단계를 예시하는 상태 공간 다이어그램이다.
도 4는 도 3의 다이어그램에서 위치결정된, 클러스터링된 프리-이벤트 데이터와 함께 정상 작동 데이터를 포함하는 상태 공간 다이어그램이다.
도 5는 데이터 위치 학습에서 사용되는 패스트 박스 알고리즘에 대한 챌린지 프로세스(challenge process)의 포함을 예시하는 흐름도이다.
도 6은 챌린지 프로세스와 연관된 평가 결과들의 수신기 작동 특성 곡선들(ROC;receiver operating characteristic curves)에 대한 한 쌍의 플롯(plot)들을 포함한다.
도 1은 플랜트 전기 부하(3)에 공급하는 발전기(2)를 갖는 통상적인 가스 터빈 전력 플랜트(1)의 간략한 묘사이다. 발전기(2)는 가스 터빈 엔진(engine)(5)에 의해 전력을 공급받는 샤프트(shaft)(4)에 의해 구동된다. 가스 터빈 엔진(5) 자체는, 압축기(5.1), 연소 섹션(section)(5.2), 터빈(5.3), 및 아마도 조절가능한 주입구 베인(vane)들(5.4)의 세트를 포함하는 많은 개수의 별개의 컴포넌트들로 구성된다. 연료는 밸브(valve)(6)를 통해 연소 섹션(5.2)에 공급된다. 가스 터빈 전력 플랜트(1)의 용인가능한 작동을 유지하기 위하여, 다양한 컴포넌트들의 작동을 모니터링하는데(monitor) 다수의 센서(sensor)들(7)이 사용되며, 이 센서들(7)은 측정된 센서 판독들을 별개의 제어 모듈(module)(8)에 전달한다. 제어 모듈(8)은 가스 터빈 전력 플랜트(1)와 공동-위치될 수 있거나, 또는 터빈 자체로부터 떨어져 있을 수 있다. 도 1의 다이어그램에서, 센서들(7)은 연소기 주입구 에어(air) 센서(7.1), 연소 온도 센서(7.2), 및 블레이드(blade) 경로 온도 센서(7.3)를 포함한다. 온도, 압력, 회전, 진동 등과 같은 조건들을 측정하여 가스 터빈의 성능을 모니터링하기 위해 사용되는 더 많은 개수의 센서들이 있다는 것이 이해되어야 한다. 실제, 정해진 가스 터빈 전력 플랜트와 함께 200개에 가까운 상이한 센서들이 활용될 수 있는 것이 가능하다.
제어 모듈(8)은 센서들(7)로부터 입력들을 수신하며, 기술분야에서 알려져 있는 바와 같이, 밸브들, 모터(motor)들, 및 액추에이터(actuator)들에 제어 신호들을 송신한다. 제어기는, 기술분야에서 알려져 있는 바와 같이, 연관된 하드웨어(hardware) 및 소프트웨어(software)와 함께, 하나 또는 그 초과의 위치들에서 하나 또는 그 초과의 프로세서들을 포함할 수 있다.
위에서 언급된 바와 같이, 가스 터빈 고장을 예측하는 문제에서 남아 있는 과제들 중 하나는 주석이 달린 데이터의 부족이다. 즉, 다양한 센서들로부터 수집되며 제어 모듈(8) 내에 저장되는 데이터를 검토함으로써, (심지어 기계가 가동중이며 어떤 방식으로 기능하고 있더라도) 기계가 정상적으로 작동하고 있는지 또는 아닌지를 알 수 없다. 다시 말해서, 결함이 기계의 작동중에 발생했을 수 있지만, 그 결함이 기계의 성능에서 어떤 종류의 "고장"으로서 자신을 나타내는데 약간의 시간이 걸릴 수 있다.
본 발명에 따라, 성능 예측기 시스템(system)(10)을 포함함으로써, 제어 모듈(8)의 능력들은 이 문제를 다루도록 확장될 수 있으며, 이 성능 예측기 시스템(10)은, 아래에서 상세히 논의되는 바와 같이, 수집된 센서 판독들을 분석하며, 특정 이벤트(이를테면, 터빈 고장)가 다음 수일 내에 발생할 가능성이 있음을 합리적으로 예측할 수 있는 센서 판독들의 임의의 점검 경고(tell-tale) 변화들을 찾기 위해 활용될 수 있다. 아래에서 상세히 논의될 바와 같이, 성능 예측기 시스템(10)은 모든 이력 센서 판독들(수년 거슬러 올라갈 수 있음)의 데이터베이스(database)(12)를 포함하며; 실제, 이 데이터베이스는 통상적인 제어 모듈(8)의 일부를 형성할 수 있다. 성능 예측기 시스템(10)은 메모리(memory)(16) 및 프로세서(18)를 갖는 프로세서 컴포넌트(14)를 포함하며, 이들 엘리먼트(element)들은, 센서 판독 데이터의 실제 평가를 수행하며, 장래 고장 이벤트가 이력 프리-이벤트 데이터에 의해 예측될 수 있는지를 결정하기 위해 사용된다. 그후에, 이 기준들을 충족시키는 "프리-이벤트" 데이터의 특정 세트의 형태를 취하는, 성능 컴포넌트(14)로부터의 출력이 터빈 고장 이전의 결함 조건들을 인식하기 위해 사용되며, 이후, 전력 플랜트 요원에 의한 계속되는 사용을 위해 징후 시그니처 데이터베이스(20)에 저장된다. 도 1에 도시된 성능 예측기 시스템(10)의 특정 아키텍처(architecture)는 단지 예시적인 것으로 간주되며, 하드웨어 및 소프트웨어 컴포넌트들의 다양한 다른 구성들이 아래에서 상세히 설명되는 본 발명의 방법을 수행하도록 구성될 수 있다.
본 발명의 방법론은, 연구되고 있는 특정 가스 터빈(또는 다른 기계류)과 연관된 이력 데이터를 연구함으로써 시작된다. "고장"(또는 어떤 다른 타입의 중대한 이벤트)이 발생한 가능한 시간들을 결정하기 위해, (센서 판독들의 형태의) 데이터가 연구된다. 이후, 인식된 이벤트 이전의 정해진 시간 기간에 대한 센서 데이터에는, 이 "프리-이벤트" 조건을 표시하도록 주석이 달린다. 데이터의 별개의 세트가 "정상 작동" 데이터로서 주석이 달리며, 여기서 이 데이터의 별개의 세트는 인식된 이벤트를 충분히 넘어서는 시간 기간으로부터 선택되며, 여기서 가스 터빈이 정상 방식으로 기능하고 있음이 안전하게 가정될 수 있다.
이후, 정상 작동(포스트-이벤트(post-event)) 데이터의 위치에 대한 프리-이벤트 데이터의 위치를 학습하기 위해 적절한 기계 학습 알고리즘(이를테면, "패스트 박스들")이 사용되며, 이는 프리-이벤트 데이터의 클러스터링된(clustered) 위치들 주위에 경계들을 생성한다. 용인가능한 방식으로 프리-이벤트 데이터를 포스트-이벤트와 구별하기 위해(이후, 이 프리-이벤트 데이터를 "징후"로서 식별하기 위함) 임의의 정량화가능한 경계들이 사용될 수 있다면, 이 프리-이벤트 데이터 패턴은 기계에 대한 잠재적인 트러블(trouble)의 표시자로서 앞으로 사용될 수 있다. 실제, 가스 터빈의 성능의 헬스(health)를 모니터링하고, 주요한 이벤트(이를테면, 터빈 고장)가 발생하기 이전 그 이벤트를 더욱 잘 예측하기 위해, 성능 예측기 시스템에 의해 수행되는 본 발명의 프로세스가 사용될 수 있다.
본 발명의 프로세스는, 도 2의 흐름도에 도시된 바와 같이, 먼저, 연구 하의 기계와 연관된 시계열 데이터(센서 판독들)의 정해진 세트에 주석을 닮으로써(단계(100)) 시작된다. 데이터는 특정 기계에 대한 이력 데이터의 세트이며, 시간상 수년 거슬러 올라갈 수 있다. 과거에 강제적인 셧다운(또는 연구되고 있는 다른 이벤트)이 발생했었고, 이력 데이터에 대한 초기 연구가 그러한 이벤트를 쉽게 인식할 것임이 가정된다. 그 지식에 기반하여, 인식된 이벤트 이전 며칠의 시간 기간을 커버링(covering)하는 데이터에는, 문제가 발생했음을 잠재적으로 표시하는 것으로서 이 데이터를 플래깅하도록(flag) 주석이 달린다. 일단 주석이 달리면, 명백한 이상점들, 뿐만 아니라 수행되고 있는 분석 타입을 간섭할 임의의 아티팩트(artifact)들을 제거하기 위해, 미가공 데이터가 클리닝된다(cleaned)(단계(110)). 아티팩트들은 이벤트 직전에 레코딩된(recorded) 데이터를 포함한다. 예컨대, 메인(main) 센서(MW) 판독의 급격한 감소(0으로 향함)가 있다면, 이는 기계가 고장이 나고 있다는 명확한 표시자이지만, 본 발명의 목적들에 대해 관심대상이 되는 "프리-페일(pre-failure)" 타입의 미묘한 데이터의 타입은 아니다. 실제, 기계의 성능을 개선시키기 위하여, MW 전력의 그러한 급격한 감소가 시작되기 이전에 데이터 패턴을 학습하는 것이 바람직하다. 데이터 불규칙성들에서 나타날 수 있는 이들 "징후들"은 성질상 더욱 암시적이며, 그러므로 파악하기가 더욱 어렵다.
다음 차례로, 분석 프로세스를 위한 센서들의 적절한 세트가 선택되며(단계(120)), 여기서 선택되는 세트는, 연구되고 있는 기계의 성능을 모니터링하기 위해 사용되고 있는 센서들의 전체 스위트(suite)의 서브세트이다. 위에서 언급된 바와 같이, 정해진 터빈은, 이 터빈의 성능의 다양한 양상들을 모니터링(예컨대, 생성되는 출력 전력, 다양한 위치들에서의 온도들, 압력들, 진동, 회전 등을 측정)하기 위해 사용되는 150개를 초과하는 상이한 센서들의 세트를 가질 수 있다. 이들 센서들 중 일부가 강한 구별적 힘을 갖는 데이터를 제공하는 반면에, 다른 센서들로부터의 데이터는 더욱 미묘하다. 본 발명의 목적들을 위한 최선의 센서들을 선택하기 위해, 연구 하에서 인식된 이벤트(예컨대, 터빈 고장)와 연관된 프리-이벤트 데이터와 포스트-이벤트 데이터 사이에서의 값의 변화들을 가장 강하게 나타내는 데이터를 갖는 센서들을 선택하는 것이 바람직하다.
센서 선택 프로세스에서 사용될 수 있는 하나의 도구는, 센서들 각각으로부터의 판독들의 "수신기 작동 특성 곡선 이하 면적"(AUROC;area under receiver operating characteristic curve) 플롯들에 대한 평가이다. AUROC는, 분류기가 무작위로 선택된 네거티브 예보다 무작위로 선택된 포지티브 예에 더 높은 점수를 할당할 확률로서 정의될 수 있다. 다른 말로 하면, ROC 플롯은, 참-포지티브 레이트(true-positive rate)(감도)와 거짓-포지티브 레이트(false-positive rate)(1-감도) 사이의 관계에 대한 그래프(graph)이다. 0.50의 ROC "이하 면적"은, 맞게 추측할 공산이 잘못 추측할 공산과 동일하다는 것을 의미한다. 추측이 ROC에 더 가깝게 매칭될수록(match), 이 면적은 1(분류와 실제 데이터 사이의 완벽한 매칭(matching)을 표시함)에 더욱 접근한다. 본 목적들을 위해, 프리-이벤트 데이터는 포지티브 예로서 정의되며, 포스트-이벤트(정상 작동 조건) 데이터는 네거티브 예로서 정의된다. 따라서, 각각의 센서의 프리-이벤트 데이터를 각각의 센서의 포스트-이벤트 데이터와 비교함으로써, AUROC에 대한 값이 각각의 센서에 대해 계산될 수 있으며, AUROC에 대한 값이 더 높을수록(제한치는 명백하게 1.0임), 센서의 성능이 더욱 구별적이다. 미리결정된 값(예컨대, 0.6)을 초과하는 AUROC를 갖는 센서들의 세트가, 본 발명의 프리-이벤트 데이터 학습 방법론에 적절한 것으로서 지정될 수 있다.
이후, 인식된 이벤트 이전 수일의 기간에 대해, 센서들의 선택된 세트에 대한 이력 프리-이벤트 센서 판독들(예컨대, 이벤트 이전 3일의 시간 기간과 연관된 데이터)이 어셈블링된다(assembled)(도 2의 흐름도에서 단계(130)). 데이터의 이러한 제 1 세트인 프리-이벤트 데이터는 "포지티브 클래스" 데이터로 또한 지칭되는데, 그 이유는 이 프리-이벤트 데이터가 본 발명의 예측적인 목적들을 위한 관심대상 데이터이기 때문이다. 데이터의 제 2 세트가 또한 어셈블링되며(assembled), 이 경우, 이 데이터의 제 2 세트는, 정상 작동 조건들과 연관되며, 가스 터빈이 정상적으로 기능하고 있는 것으로 알려졌을 때, 인식된 이벤트의 충분히 이후의 연장된 시간 기간 동안 수집된다. 데이터의 이러한 제 2 세트(포스트-이벤트 데이터)는 "네거티브 클래스" 데이터로 또한 지칭된다.
많은 다른 실세계 분류 문제들에 대해서와 같이, 포지티브 클래스와 연관된 데이터(프리-이벤트 데이터)는 나머지 데이터(포스트-이벤트 클래스, 또는 "네거티브 클래스" 데이터)보다 훨씬 더 적다. 더 큰 클래스의 "정상" 데이터에 대해 숙고하는 더욱 통상적인 알고리즘들과는 대조적으로, 아래에서 설명되는 "패스트 박스" 알고리즘과 같은 방법을 사용하여, 이러한 타입의 불균형의 데이터가 최선으로 분석된다.
패스트 박스 알고리즘(도 2에서 단계(140)로서 도시됨)은, 데이터의 정해진 세트를 분석할 때 "특성화, 이후, 구별" 접근법을 사용한다. 본 발명의 목적들에 따라, 이 접근법은, 먼저 프리-이벤트 데이터를 특성화하고 이후 이 데이터가 "정상" 포스트-이벤트 데이터와 얼마나 구별될 수 있는지(그러한 구별이 심지어 가능한지 또는 가능하지 않은지의 여부에 관한 초기 결정을 포함함)를 연구하는 형태를 취한다. 결과적으로, 프리-이벤트 데이터를 정상 센서 판독들과 구별하는 것이 가능하면, 가스 터빈 고장(또는 다른 주요한 이벤트)이 발생하기 충분히 이전에 "징후들"의 인식을 돕기 위해, 이 프리-이벤트 정보가 앞으로 사용될 수 있다는 것이 된다.
도 2의 흐름도에서 구체적으로 예시된 바와 같이, 패스트 박스 접근법의 제 1 단계(142)는 프리-이벤트 데이터를 K개의 클러스터들의 정해진 세트(여기서, K는 조절가능한 매개변수임)로 클러스터링하는(cluster) 것이다. 초기에, 이들 클러스터들에 대한 결정 경계들은 클러스터들 각각의 주위의 평행한 변들의 빽빽한 박스들로서 설정된다. 도 3은 이러한 초기 클러스터링 단계의 결과들을 예시하며, 이 결과들은, 플롯(즉, 특정 범위 내에 속하도록 정규화되는, 선택된 센서 판독들의 시계열 데이터)에서 "십자 기호들" 형태의 프리-이벤트 데이터, 및 각각의 클러스터 주위에 경계선을 형성하는 빽빽한 직사각형 박스들을 예시한다. 이 경우, 데이터의 다섯 개의 별개의 클러스터들이 생성된다.
클러스터들의 생성 이후, 도 4에 도시된 바와 같이, 포스트-이벤트(네거티브 클래스 데이터)가 분석에 도입된다. 이후, 이 다이어그램의 전체 공간이 검토되며(단계(144)), 위에서 정의된 박스 경계들에 가장 가까운 네거티브 클래스 데이터 지점들이 식별되며, 이 네거티브 클래스 데이터 지점들에는 학습 프로세스의 다음 차례의 단계에서 사용되는 추가적인 가중 팩터(factor)(c)가 주어지는데, 그 이유는 이들 네거티브 데이터 지점들이 다섯 개의 클러스터 박스들 각각의 경계들의 배치에 대해 더 커다란 영향력을 갖기 때문이다. 이 단계는 박스들 각각에 대해 동시에 수행되며, 따라서 전체 계산 시간이 최소화된다.
일단 네거티브 데이터 지점 가중이 완료되면, 패스트 박스 알고리즘의 최종 단계(단계(146))가 수행된다. 이 단계는 "경계 확장" 단계로서 알려져 있으며, 여기서 각각의 박스의 각각의 경계(수직 및 수평 둘 모두)에 대해 일차원 분류기가 식별되고, 그리고 특정 네거티브 데이터 지점들에 대한 가중치로서 c, 그리고 박스를 확장시키는 경향이 있는 규칙화 매개변수로서 β을 사용하여, 경계들을 최선으로 정의하기 위한 수치 계산 세트가 수행된다. 일반적으로, 이 경계 확장 프로세스, 뿐만 아니라 패스트 박스 알고리즘과 연관된 상세한 수학은, S. Goh 등에 의해 "Boxed Drawings with Learning for Imbalanced Data"로 명명되었고 제20차 ACM SIGKDD 지식 발견 및 데이터 마이닝(KDD;Knowledge Discovery and Data Mining) 회의(2014년)의 회보에서 언급된 레퍼런스(reference)에서 발견될 수 있으며, 이는 이로써 인용에 의해 그 전체가 통합된다. 경계 확장 프로세스에 대한 설명은 본원에서 부록으로서 또한 포함된다.
따라서, 패스트 박스 알고리즘의 출력으로서 정의된 최종 경계들은 "정상" 작동 조건 데이터(포스트-이벤트, 네거티브 클래스 데이터)와 가스 터빈 고장(또는 어떤 이벤트가 연구되고 있든)의 시작을 표시할 수 있는 데이터 사이의 경계들로서 간주된다. 즉, 패스트 박스 알고리즘은 프리-이벤트 데이터의 경계들을 학습했다. 이 정보를 성공적으로 사용하여 잠재적인 고장 이벤트들을 앞으로 예측하기 위하여, 프로세스의 다음 차례의 단계(도 2의 흐름도에서 단계(150)로서 도시됨)는, 패스트 박스 알고리즘의 결과들을 분석하여 프리-이벤트 데이터와 포스트-이벤트 데이터 사이에 충분한 구별 레벨(level)이 있는지를 결정하는 것이다.
위에서 설명된 패스트 박스 알고리즘-기반 데이터 위치 학습 프로세스가 각각의 선택된 센서와 연관된 데이터에 별개로 적용된다는 것이 이해되어야 한다. 즉, 각각의 센서에 대해 한 번씩, 알고리즘이 데이터의 많은 세트들에 적용된다. 그 결과, 선택된 센서들 중 단지 몇 개의 센서들만이 실제로, 자신의 프리-이벤트 데이터를 자신의 포스트-이벤트 데이터와 충분히 구별하는 결과들을 생성하는 것이 가능하다.
불균형의 데이터 학습에서는, 이 결정을 하기 위해 "정확성"과 같은 통상적인 메트릭(metric)들이 사용될 수 없는데, 그 이유는 이들 통상적인 메트릭들은 "과반수 클래스"(여기서, 네거티브 클래스) 데이터에 대한 피트(fit)를 결정하는 것에 초점을 맞추기 때문이다. 그에 반해서, 본 발명에 따른 기계 학습의 목적은 고전적인 메트릭들에서는 무시될 수 있는, 프리-이벤트(소수 클래스) 데이터의 속성들을 인식하는 것이다. 따라서, 프리-이벤트 데이터가 포스트-이벤트 데이터와 얼마나 잘 구별될 수 있는지에 대한 대안적인 척도(measure)들 중 하나는 "ROC 곡선의 볼록 껍질 이하 면적(area under convex hull of the ROC curve)" 또는 AUH를 활용한다. AUH를 컴퓨팅하기(compute) 위해, 가중치 매개변수(c)의 다양한 값들에 대한 분류기들이 컴퓨팅되는데, 그 이유는 c가 포지티브 및 네거티브 클래스들의 상대적 중요도를 제어하는 것으로 알려져 있기 때문이다. c의 각각의 설정은 참 및 거짓 포지티브들의 카운트(count)를 갖는 ROC 곡선 상의 단일 지점에 대응한다. ROC 곡선 상의 지점들에 의해 형성된 AUH가 컴퓨팅되며, 이후, 그 결과를 네거티브 예들과 포지티브 예들의 곱(product)으로 나눔으로써 정규화된다. 따라서, 최선의 가능한 결과는 1.0의 AUH이다.
본 발명의 목적들을 위해, 적어도 0.5의 AUH 값이 바람직하며, 여기서 값이 더 높을수록, 프리-이벤트 데이터의 패턴이 학습되고 두 개의 클래스들 사이의 차이들이 식별될 수 있다는 표시가 더 크다. 따라서, 데이터의 이들 두 개의 클래스들 사이의 차이들을 학습하는 능력은 전력 플랜트 오퍼레이터(operator)가, 개연성 있는 가스 터빈 고장의 징후들을 인식하고, 그에 따라, 스케줄링되는 유지보수를 계획하도록 허용한다.
실험적인 테스트(test) 결과들
데이터 패턴들을 인식하고 가스 터빈 고장 이벤트들을 예측하는 본 발명의 방법론의 능력을 평가하기 위하여, 알려져 있는 가스 터빈으로부터의 데이터의 세트가 연구되었다. 2009년 내지 2013년의 시간 기간으로부터의 이력 데이터가 연구에 이용가능했다.
"고장" 이벤트를 평가하는 목적을 위해, 메인 표시자는 MW(megawatt) 센서인 것으로 가정되었다. 명백하게, 이 센서가 "제로(zero)"(0)의 판독을 갖는다면, 그것은 기계가 작동하고 있지 않으며 고장이 발생했음을 표시한다. 본 발명의 목적들을 위해, 20%의 임계치가 이 센서 데이터와 연관되도록 선택되었는데, 이는 공칭 값의 20% 미만인 임의의 MW 판독들이 "이상점들"로서 제거되었음을 의미한다.
아티팩트들 면에서, 이벤트 이후 15일 내의 데이터가 또한 제거되었다(그 이유는 기계의 재시작이 연장된 시간 기간 동안 불안정한 센서 판독들을 생성하는 것으로 여겨지기 때문이다). 일부 겹치는 이벤트들이 미가공 데이터에서 또한 발견되었다(즉, 일부 이벤트들은 하나보다 더 많은 개수의 센서에 의해 레코딩되었다(recorded)). 중복 정보를 제거하기 위해, 데이터는 "클리닝되었다(cleaned)". 연구되고 있는 데이터의 세트에 대해, 하기의 표에 포함된 바와 같은, 분석에 이용가능한 인식된 이벤트들의 목록이 식별되었다:
Figure 112017033991793-pct00001
표 Ⅰ
단계(120)(도 2 참조)와 연관되어 위에서 논의된 AUROC 프로시저(procedure)들을 사용하여, 프리-이벤트 데이터를 생성하기 위해 71개의 센서들의 세트가 사용되도록 선택되었다. 하기의 목록은 (선택된 71개 중에서) 최고 AUROC 값들을 갖는 20개의 센서들을 식별한다:
Figure 112017033991793-pct00002
표 Ⅱ
결정된 이 세트에 대해, 선택된 이벤트 날짜 이전 3일에 대한 데이터가 "소수 클래스" 데이터 또는 프리-이벤트 데이터로서 정의된 채로 어셈블링되었다. 이후, "과반수 클래스" 데이터(즉, 정상 터빈 작동 조건들과 연관된 센서 판독들)가 정의되었다. 위에서 논의된 바와 같이, 터빈 재시작 직후의 시간 기간으로부터의 센서 판독들은 불안정할 수 있으며, 따라서 데이터는 아티팩트로서 간주되고, "과반수 클래스"에서 사용되지 않는다. 예컨대, 이벤트 날짜 이후 15일의 기간에 대한 센서 판독들은 무시될 수 있다. 이벤트 날짜 이후 20-25일로부터의 데이터가 "과반수 클래스" 데이터로서 정의된다.
이후, 포스트-이벤트 데이터에 대한 프리-이벤트 데이터의 위치를 학습하기 위해 패스트 박스 알고리즘이 적용되었으며, 따라서 이 프리-이벤트 데이터를 정상 데이터와 구별하고 그에 따라 잠재적인 가스 터빈 고장 이벤트를 예측하는 것이 앞으로 가능한지를 알기 위한 결정이 이루어질 수 있다. 패스트 박스 알고리즘은, 도 2의 흐름도의 단계(142)와 연관되어 위에서 설명된 바와 같이, (도 1에 도시된 엘리먼트(element)(18)와 같은 프로세서를 사용하여) 프리-이벤트 데이터를 클러스터링하여 이러한 소수 클래스 데이터의 K개의 클러스터들의 세트를 생성함으로써 시작된다.
이 특정 경우, 패스트 박스 알고리즘에서 사용될 클러스터들의 개수(K)는 1 내지 4의 값들의 범위에 있도록 선택되었다. 또한, 확장 매개변수 β가 이 동일한 값 범위에 있도록 선택되었으며, 네거티브 데이터에 대한 가중치(c)는 0.1 내지 1.0의 범위에 있도록 선택되었다. 알고리즘은 열 개의 상이한 매개변수 세트들
Figure 112017033991793-pct00003
을 사용하여 데이터에 적용되었으며, 단계들(144 및 146)에서 개설된 바와 같은 단계들은 "이벤트 이전 3일" 연구 및 "이벤트 이전 5일" 연구 둘 모두에 대한 결과들을 생성하도록 수행되었다. 이후, 본 발명의 목적들을 위해, 소수 클래스 데이터에 존재하는 임의의 이벤트 표시자들이 있는지, 즉, 프리-이벤트 데이터 중 임의의 프리-이벤트 데이터가 정상 작동 데이터와 구별될 수 있는지 또는 아닌지의 여부를 알기 위해, AUH 척도를 사용하여 수행되는 결과 분석이 수행되었다. 부가적으로, 본 발명의 프로세스의 정확성을 연구하기 위하여, "a" 및 "f"로서 식별된 두 개의 이벤트들이 테스트 데이터로서 무작위로 선택되었으며, 표 Ⅰ에서 열거된 네 개의 나머지 이벤트들이 트레이닝(training) 데이터로서 사용되었다.
초기 조건들의 열 개의 세트들 각각에 대한 AUH 값들이 아래에서 나타난다:
3일 프리-이벤트 결과들:
Figure 112017033991793-pct00004
트레이닝 평균: 0.9389 (표준 편차 0.0297)
테스팅(Testing) 평균: 0.9201 (표준 편차 0.0306)
5일 프리-이벤트 결과들:
Figure 112017033991793-pct00005
트레이닝 평균: 0.8861 (표준 편차 0.0247)
테스팅 평균: 0.6981 (표준 편차 0.0414)
따라서, 이들 결과들은, 0.5를 초과하는 AUH 값을 생성하는 것의 면에서, 데이터에 주석을 다는 단계 및 데이터를 분석하기 위해 패스트 박스 알고리즘을 사용하는 단계가, 기계 학습 방법론으로 하여금, 기계의 궁극적인 고장을 유도할 수 있는 가스 터빈 결함들의 그러한 "징후들"을 신뢰성 있게 예측하기 위해 활용되도록 허용한다는 것을 나타낸다. 본 발명의 방법론이 개별 단위로 각각의 별개의 가스 터빈에 적용된다는 점을 고려하면, 센서 판독들에 대한 그 기계의 고유 이력을 사용하여, 본 발명의 방법론은 유리하게, 그 기계의 성능에 영향을 끼치는 가장 적절한 프리-이벤트 데이터를 학습한다. 다시, 도 1의 시스템 다이어그램을 참조하면, 임박한 고장의 확실한 징후로서 간주되는 임의의 특정 프리-이벤트 데이터 패턴은, 그 기계에 대한 전력 플랜트 요원의 모니터링(monitoring)시 이 전력 플랜트 요원에 의한 사용을 위해, 징후 시그니처 데이터베이스(20)에 저장된다.
이들 패스트 박스 예측 결과들을 입증하는 목적들을 위해, 데이터 분류를 위한 통상적인 방법이 "챌린저(challenger)"로서 형성될 수 있다. 이것은 도 5의 흐름도에 도시되며, 여기서 프리-이벤트 데이터 및 포스트-이벤트 데이터를 검토 및 비교하기 위해 챌린저 프로세스(200)가 패스트 박스 알고리즘과 동시에 사용된다. 이 경우, 이벤트 이전 데이터 및 이벤트 이후 데이터가 분석을 위해 클린(clean) 세트로부터 얻어진다. 특히, 주성분분석(PCA;principal component analysis)이 단계(210)에서 수행되며, 미가공 센서 데이터로부터 특징들을 추출하기 위해 사용된다. 예시적 프로세스에서, 첫 번째 아홉(9) 개의 주성분들이 하기의 로지스틱(logistic) 회귀분석 프로세스(단계(220))에서 사용하기 위해 선택되었다. 단계(300)의 결과 비교 프로세스에서, 패스트 박스 결과들과 비교하여 챌린저 모델(model)을 평가하기 위해, 적합도 테스트 및 개별 계수들이 사용되었다.
두 개의 접근법들을 비교할 때, 로지스틱 회귀분석으로부터의 결과들은 이러한 선행 기술이 패스트 박스 접근법보다 나은 게 없다는 것을 나타낸다. 실제, 로지스틱 회귀분석은, 테스팅(testing) 데이터에서 프리-이벤트를 구별할 때 패스트 박스들보다 더 나쁘다. 도 6(a) 및 도 6(b)에 도시된 차트(chart)들은, 트레이닝 이벤트들 및 테스팅 이벤트들의 세트에 대한, 챌린저 접근법과 연관된 ROC 곡선들을 각각 도시한다. 도시된 바와 같이, 도 6(a)의 생성에서 사용된 트레이닝 이벤트들은 약 0.79783의 AUROC 값을 보인다. 테스팅 데이터에 대한 AUROC 값은 약 0.64900인 것으로 나타난다. 그에 비해서, 패스트 박스 접근법을 사용하여 획득된 AUROC 값들은 트레이닝 데이터의 경우 0.8861 내지 0.9389에 있었으며, 그리고 0.6981 내지 0.9201의 범위에 있었다. 명확하게, 본 발명의 패스트 박스 접근법이 더 나은 예측기 결과를 산출한다.
위에서 설명된 방법은 위에서 설명된 바와 같이 컴퓨터(computer)에 의해 실행되는 프로그램 모듈(program module)들에 의해 구현될 수 있다. 일반적으로, 프로그램 모듈들은 특정 작업들을 수행하거나 또는 특정 추상 데이터 타입들을 구현하는 루틴(routine)들, 오브젝트(object)들, 컴포넌트들, 데이터 구조들 등을 포함한다. 본원에서 사용된 "프로그램"이란 용어는 단일 프로그램 모듈, 또는 일제히 동작하는 다수의 프로그램 모듈들을 함축할 수 있다. 본 개시내용은 퍼스널 컴퓨터(PC;personal computer)들, 핸드헬드 디바이스(hand-held device)들, 멀티-프로세서 시스템들, 마이크로프로세서-기반 프로그래머블 컨슈머 전자장치(microprocessor-based programmable consumer electronics), 네트워크(network) PC들, 미니-컴퓨터(mini-computer)들, 메인프레임(mainframe) 컴퓨터들 등을 포함하는 다양한 타입들의 컴퓨터들 상에 구현될 수 있다. 본 개시내용은 분산 컴퓨팅(computing) 환경들에서 또한 사용될 수 있으며, 여기서 작업들은 통신 네트워크를 통해 연결되는 원격 프로세싱(processing) 디바이스들에 의해 수행된다. 분산 컴퓨팅 환경에서, 모듈들은 로컬(local) 및 원격 메모리(memory) 저장 디바이스들 둘 모두에 위치될 수 있다.
위의 방법론을 구현하기 위한 예시적 프로세싱 모듈은 별개의 메모리에 저장되거나 또는 하드와이어링될(hardwired) 수 있으며, 이 예시적 프로세싱 모듈은 컴퓨터 판독가능 매체, 이를테면 ROM 또는 다른 타입의 하드 자기 드라이브(hard magnetic drive), 광학 스토리지(storage), 테이프(tape) 또는 플래시(flash) 메모리로부터 프로세서 또는 복수의 프로세서들의 메인 메모리로 판독된다. 메모리 매체에 저장된 프로그램의 경우, 모듈의 명령들의 시퀀스(sequence)들의 실행은 프로세서로 하여금 본원에 설명된 프로세스 단계들을 수행하게 한다. 본 개시내용의 실시예들은 하드웨어 및 소프트웨어의 임의의 특정 조합으로 제한되지 않으며, 전술한 내용을 구현하기 위해 요구되는 컴퓨터 프로그램 코드(code)는 기술분야의 당업자에 의해 개발될 수 있다.
본원에 사용된 "컴퓨터-판독가능 매체"란 용어는 명령들을 하나 또는 그 초과의 프로세서들에 제공하거나 또는 제공하는 것에 참여하는 임의의 유형의 기계-인코딩된(encoded) 매체를 지칭한다. 예컨대, 컴퓨터-판독가능 매체는 하나 또는 그 초과의 광학 또는 자기 메모리 디스크(disk)들, 플래시 드라이브들 및 카드(card)들, 판독-전용 메모리 또는 통상적으로 메인 메모리를 구성하는 랜덤 액세스(random access) 메모리, 이를테면 DRAM일 수 있다. 그러한 매체는 유형이 아닌 전파 신호들을 제외한다. 캐싱된(cached) 정보는 컴퓨터-판독가능 매체 상에 저장되는 것으로 간주된다. 컴퓨터-판독가능 매체의 공통 방편들은 기술분야에서 잘 알려져 있으며, 여기서 상세히 설명될 필요가 없다.
전술한 상세한 설명은 모든 각각의 측면에서 실례적이고 예시적이지만 제한적이지 않은 것으로서 이해되어야 하며, 본원의 개시내용의 범위는 설명으로부터 결정되는 것이 아니라, 특허법에 의해 허가된 전폭에 따라 해석되는 청구항들로부터 결정되어야 한다. 본 개시내용의 범위 및 사상으로부터 벗어나지 않고, 다양한 수정들이 기술분야의 당업자들에 의해 구현될 것임이 이해되어야 한다.
부록: 패스트 박스 알고리즘에서의 경계 확장
입력: 박스들(클러스터들)의 개수 K, 트레이드오프(tradeoff)들 c 및 β, 그리고 데이터세트(dataset)
Figure 112017033991793-pct00006
출력: 박스들의 경계들(프리-이벤트 데이터의 제한치들을 정의함)인
Figure 112017033991793-pct00007
Figure 112017033991793-pct00008
, 여기서 "l"은 하부 경계를 표기하고, "u"는 상부 경계를 표기하고, 첨자 "f"는 최종 경계를 표기하고, 첨자 "j"는 j번째 차원을 표기하며, 첨자 "k"는 k번째 박스를 표기한다.
1. -1과 +1 사이에 있도록 센서 판독 데이터를 정규화한다.
2. 소수(프리-이벤트) 데이터를 K개의 클러스터들로 클러스터링한다.
3. 시작 경계들
Figure 112017033991793-pct00009
Figure 112017033991793-pct00010
(첨자 "s"는 시작 경계를 표기함)을 컴퓨팅(computing)함으로써, 각각의 클러스터에 대한 박스를 에워싸는 최소치를 구성한다.
4. 하기에 기반하여 로컬 분류기들
Figure 112017033991793-pct00011
Figure 112017033991793-pct00012
에 대한 데이터를 구성한다:
Figure 112017033991793-pct00013
여기서, p는 (j 이외의) 추가적인 차원들을 표기한다
5.
Figure 112017033991793-pct00014
로서 표기되며 하기와 같이 정의되는, 단계 4의 분류기들에 대한 "규칙화된" 지수 손실들을 컴퓨팅한다.
Figure 112017033991793-pct00015
Figure 112017033991793-pct00016
여기서, 첨자 "+"는 클러스터 내의 프리-이벤트 데이터 지점들을 표기하고, 첨자 "-"는 클러스터 밖의 모든 데이터 지점들을 표기하고,
Figure 112017033991793-pct00017
은 k번째 클러스터 내의 프리-이벤트 데이터 지점들의 세트이며,
Figure 112017033991793-pct00018
은 k번째 클러스터 밖의 모든 데이터 지점들의 세트이다
6. 하기에 기반하여
Figure 112017033991793-pct00019
Figure 112017033991793-pct00020
을 컴퓨팅한다:
Figure 112017033991793-pct00021
7. 하기에 기반하여 경계 확장을 수행한다:
Figure 112017033991793-pct00022
여기서, 첨자 "f"는 최종 경계를 표기하며,
Figure 112017033991793-pct00023
는 작은 수이다.
8. 센서 판독 데이터를 다시 의미 있는 값 범위로 리스케일링(rescaling)함으로써, 비-정규화한다.

Claims (20)

  1. 전력 플랜트(plant)(1)에서 가스 터빈(gas turbine)의 고장 이벤트(event)들을 예측하기 위한 방법으로서,
    연구되고 있는 가스 터빈(5)의 인식된 고장 이벤트와 연관된 이력 데이터(data)의 세트(set)를 획득(100)하는 단계 ―상기 이력 데이터는 프리-이벤트(pre-event) 시간 기간으로서 정의된, 인식된 이벤트 이전의 시간 기간 동안 수집된 센서(sensor) 판독들의 세트를 포함함―;
    분석될 센서들(7)의 서브세트(subset)를 선택(120)하는 단계, 및 프리-이벤트 데이터를, 상기 프리-이벤트 시간 기간 동안 수집된, 센서들(7)의 선택된 서브세트로부터의 센서 판독들로서 정의하는 단계;
    상기 프리-이벤트 데이터를 정상 작동 데이터와 비교(130)하는 단계;
    상기 프리-이벤트 데이터와 상기 정상 작동 데이터 사이의 구별 레벨(level)을 확인하는 단계; 및
    상기 구별 레벨이 정해진 임계치 위라면, 상기 프리-이벤트 데이터를, 연구되고 있는 상기 가스 터빈(5)의 장래 고장을 예측할 때 사용하기 위한 징후 패턴(pattern)으로서 식별하는 단계
    를 포함하고,
    상기 센서들(7)의 서브세트를 선택(120)하는 단계는,
    각각의 센서(7)에 대해, 프리-이벤트 데이터를 정상 작동 데이터와 비교하여 수신기 작동 곡선 이하 면적(AUROC;area-under-receiver-operating-curve) 값을 계산하는 단계;
    연구되고 있는 상기 가스 터빈(5)의 고장들을 예측하기 위한 임계치 AUROC 값을 정의하는 단계; 및
    정의된 임계치를 초과하는 AUROC 값을 갖는 각각의 센서(7)를 선택하는 단계
    를 포함하는,
    전력 플랜트에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법.
  2. 제 1 항에 있어서,
    상기 이력 데이터의 세트를 획득(100)하는 단계는, 이력 센서 판독 데이터에 주석을 달고, 상기 이력 데이터의 세트의 타임 라인(time line)을 따라 상기 인식된 고장 이벤트를 위치결정하기 위해, 주석이 달린 데이터를 검색하는 단계
    를 포함하는,
    전력 플랜트에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법.
  3. 제 1 항에 있어서,
    상기 이력 데이터의 세트를 획득(100)하는 단계는, 센서 판독들의 세트로부터 이상점들 및 아티팩트(artifact)들을 제거하기 위해 상기 이력 데이터의 세트를 클리닝(cleaning)(110)하는 단계를 더 포함하는,
    전력 플랜트에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법.
  4. 삭제
  5. 제 1 항에 있어서,
    상기 프리-이벤트 데이터를 상기 정상 작동 데이터와 비교(130)하는 단계는,
    각각의 선택된 센서(7)에 대해, 정상 이벤트에 대한 상기 프리-이벤트 데이터의 위치를 학습하기 위해 패스트 박스 알고리즘(fast boxes algorithm)을 활용(140)하여, 상기 프리-이벤트 데이터를 미리결정된 개수의 직사각형 박스들로 클러스터링(clustering)하는 단계; 및
    상기 직사각형 박스들의 에지(edge)들의 세트를, 상기 정상 작동 데이터로부터 상기 프리-이벤트 데이터를 분리하는 경계들의 세트로서 정의하는 단계
    를 포함하는,
    전력 플랜트에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법.
  6. 제 5 항에 있어서,
    비교하는 단계에서 사용(140)되는 상기 패스트 박스 알고리즘은,
    상기 프리-이벤트 데이터를 상태 공간에서의 K개의 박스들의 세트로 클러스터링(142)하는 단계 ―각각의 박스는 평행한 축들의 쌍들로서 형성된 에지들을 갖는 직사각형에 의해 정의됨―;
    정상 이벤트 데이터를 상기 상태 공간에 도입(144)하고, 미리결정된 가중치(c)를 상기 박스들의 에지들에 가장 가까운 모든 정상 이벤트 데이터 지점들에 할당하는 단계; 및
    프리-이벤트 데이터의 클러스터(cluster)와 정상 작동 데이터의 클러스터 사이의 경계들을 정의하는 박스 에지들의 최종 세트를 생성하기 위한 최적 확장을 획득하기 위해, c의 네거티브(negative) 가중치를 적용하여, 각각의 박스의 경계들을 β의 팩터(factor)에 의해 확장(146)하는 단계
    를 포함하는,
    전력 플랜트에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법.
  7. 제 6 항에 있어서,
    K는 1 내지 4의 범위로부터 선택되고, β는 1 내지 4의 범위로부터 선택되며, c는 0.1 내지 1.0의 범위로부터 선택되는,
    전력 플랜트에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법.
  8. 제 6 항에 있어서,
    상기 구별 레벨을 확인하는 단계는,
    임계치 구별 레벨을 정의하는 단계; 및
    박스 에지 경계들의 상기 최종 세트가 상기 임계치 구별 레벨을 초과하는지를 결정하기 위한 메트릭(metric)을 상기 상태 공간에 적용(150)하는 단계
    를 포함하는,
    전력 플랜트에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법.
  9. 제 8 항에 있어서,
    적용되는 메트릭은 "껍질 볼록 ROC 이하 면적"(AUH;area under hull convex ROC)인,
    전력 플랜트에서 가스 터빈의 고장 이벤트들을 예측하기 위한 방법.
  10. 가스 터빈(5)의 고장 이벤트들을 예측하기 위한 시스템(system)(10)으로서,
    이력 센서 판독들의 데이터베이스(database)(12);
    상기 이력 센서 판독들의 데이터베이스(12)와 통신하는 성능 예측기 컴포넌트(component)(14); 및
    상기 성능 예측기 컴포넌트(14)에 의해 식별되는 징후 패턴들을 저장하기 위한 데이터베이스(20)
    를 포함하며,
    상기 성능 예측기 컴포넌트(14)는 프로그램(program) 저장 디바이스(device)(16) 및 프로세서(processor)(18)를 포함하고, 상기 프로그램 저장 디바이스(16)는,
    연구되고 있는 가스 터빈(5)의 인식된 고장 이벤트와 연관된 이력 데이터의 세트를 리트리빙(retrieving)(100)하는 단계 ―상기 이력 데이터는 이력 센서 판독 데이터의 상기 데이터베이스(12)에 저장된 센서 판독들의 세트를 포함함―;
    분석될 센서들(7)의 서브세트(subset)를 선택(120)하며, 프리-이벤트 데이터를, 프리-이벤트 시간 기간 동안 수집된, 센서들(7)의 선택된 서브세트로부터의 센서 판독들로서 정의하는 단계;
    상기 프리-이벤트 데이터를 정상 작동 데이터와 비교(130)하는 단계;
    상기 프리-이벤트 데이터와 상기 정상 작동 데이터 사이의 구별 레벨(level)을 확인하는 단계; 및
    상기 구별 레벨이 정해진 임계치 위라면, 상기 프리-이벤트 데이터를, 연구되고 있는 상기 가스 터빈(5)의 장래 고장을 예측할 때 사용하기 위한 상기 징후 패턴으로서 식별하는 단계
    의 방법 단계들을 수행하기 위해 상기 프로세서(18)에 의해 실행가능한 프로그램 명령들의 세트를 고정된 유형의 매체에 구현하고,
    상기 센서들(7)의 서브세트를 선택(120)하는 단계는,
    각각의 센서(7)에 대해, 프리-이벤트 데이터를 정상 작동 데이터와 비교하여 수신기 작동 곡선 이하 면적(AUROC) 값을 계산하는 단계;
    연구되고 있는 상기 가스 터빈(5)의 고장들을 예측하기 위한 임계치 AUROC 값을 정의하는 단계; 및
    정의된 임계치를 초과하는 AUROC 값을 갖는 각각의 센서(7)를 선택하는 단계
    를 포함하는,
    가스 터빈의 고장 이벤트들을 예측하기 위한 시스템.
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
KR1020177009441A 2014-09-10 2015-09-03 감독 학습 방법론들을 활용하는 가스 터빈 고장 예측 KR101995042B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462048577P 2014-09-10 2014-09-10
US62/048,577 2014-09-10
PCT/US2015/048285 WO2016040085A1 (en) 2014-09-10 2015-09-03 Gas turbine failure prediction utilizing supervised learning methodologies

Publications (2)

Publication Number Publication Date
KR20170055510A KR20170055510A (ko) 2017-05-19
KR101995042B1 true KR101995042B1 (ko) 2019-07-01

Family

ID=54148622

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177009441A KR101995042B1 (ko) 2014-09-10 2015-09-03 감독 학습 방법론들을 활용하는 가스 터빈 고장 예측

Country Status (5)

Country Link
US (1) US20170308801A1 (ko)
EP (1) EP3191905B1 (ko)
KR (1) KR101995042B1 (ko)
CN (1) CN107111309B (ko)
WO (1) WO2016040085A1 (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170303014A1 (en) * 2016-04-18 2017-10-19 Karim Ghessassi System for providing functionality based on sensor data
US10223175B2 (en) * 2016-10-10 2019-03-05 International Business Machines Corporation Modifying a device based on an annotated time series of sensor readings
GB201621631D0 (en) * 2016-12-19 2017-02-01 Palantir Technologies Inc Predictive modelling
US10805324B2 (en) * 2017-01-03 2020-10-13 General Electric Company Cluster-based decision boundaries for threat detection in industrial asset control system
US10697318B2 (en) * 2017-01-12 2020-06-30 General Electric Company Efficiency maps for tracking component degradation
US11396825B2 (en) * 2017-08-14 2022-07-26 General Electric Company Turbine diagnostic feature selection system
US11016957B2 (en) * 2018-02-28 2021-05-25 Microsoft Technology Licensing, Llc Sensor data based query results
US10810513B2 (en) * 2018-10-25 2020-10-20 The Boeing Company Iterative clustering for machine learning model building
KR20200057815A (ko) 2018-11-13 2020-05-27 한국전력공사 가스터빈 이상 예측 방법 및 이를 이용한 가스터빈 이상 예측 장치
CN109885951A (zh) * 2019-02-28 2019-06-14 中科云创(厦门)科技有限公司 设备故障诊断方法及装置
US11817212B2 (en) * 2019-06-26 2023-11-14 Roche Diagnostics Operations, Inc. Maintenance method for a laboratory system
US11868932B2 (en) * 2020-09-30 2024-01-09 International Business Machines Corporation Real-time opportunity discovery for productivity enhancement
EP3995920A1 (en) * 2020-11-10 2022-05-11 ABB Schweiz AG Event analytics in modular industrial plants
EP4109189A1 (en) * 2021-06-23 2022-12-28 Covestro Deutschland AG Method for selecting a time-series data stream in a production plant
WO2023102630A1 (pt) * 2021-12-09 2023-06-15 Companhia Paulista De Força E Luz Método para identificação de anomalias e predição de falhas, e, meio de armazenamento legível por processador
EP4202780A1 (en) * 2021-12-22 2023-06-28 Siemens Aktiengesellschaft Box-based detection and representation of decision regions of ai based classification algorithms
CN114841295B (zh) * 2022-07-04 2022-09-13 矿冶科技集团有限公司 工业过程故障检测方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120316835A1 (en) * 2010-01-14 2012-12-13 Shunji Maeda Anomaly detection method and anomaly detection system

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6355347A (ja) * 1986-08-23 1988-03-09 Daihatsu Motor Co Ltd 圧力検出系統の故障診断方法
US6139468A (en) * 1999-04-15 2000-10-31 Ford Motor Company Electronically actuated transmission range control system
CN1125241C (zh) * 1999-12-03 2003-10-22 日产自动车株式会社 内燃机的进气量控制装置和控制方法
DE10033183C2 (de) * 2000-07-07 2002-08-08 Max Planck Gesellschaft Verfahren und Vorrichtung zur Verarbeitung und Vorhersage von Strömungsparametern turbulenter Medien
EP1771005B1 (en) * 2004-02-03 2012-02-29 Panasonic Corporation Detection range adjustment device
US6973396B1 (en) * 2004-05-28 2005-12-06 General Electric Company Method for developing a unified quality assessment and providing an automated fault diagnostic tool for turbine machine systems and the like
US7536851B2 (en) * 2005-03-10 2009-05-26 Gm Global Technology Operations, Inc. Catalyst condition monitor based on differential area under the oxygen sensors curve algorithm
CN101458259A (zh) * 2007-12-14 2009-06-17 西北工业大学 支持故障预测的传感器设置方法
JP5431235B2 (ja) * 2009-08-28 2014-03-05 株式会社日立製作所 設備状態監視方法およびその装置
EP2385367B1 (en) * 2010-05-05 2017-06-28 Siemens Aktiengesellschaft Arrangement to detect a fault electrical connection
EP2469041A1 (en) * 2010-12-22 2012-06-27 Siemens Aktiengesellschaft Method of detecting a predetermined condition in a gas turbine and failure detection system for a gas turbine
CN102789545B (zh) * 2012-07-12 2015-08-19 哈尔滨工业大学 基于退化模型匹配的涡轮发动机剩余寿命的预测方法
CN103481943B (zh) * 2013-09-30 2016-01-13 北京航空航天大学 一种用于自行式液压载重车液压转向系统的故障诊断系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120316835A1 (en) * 2010-01-14 2012-12-13 Shunji Maeda Anomaly detection method and anomaly detection system

Also Published As

Publication number Publication date
EP3191905B1 (en) 2019-05-15
CN107111309A (zh) 2017-08-29
WO2016040085A1 (en) 2016-03-17
US20170308801A1 (en) 2017-10-26
CN107111309B (zh) 2020-05-19
KR20170055510A (ko) 2017-05-19
EP3191905A1 (en) 2017-07-19

Similar Documents

Publication Publication Date Title
KR101995042B1 (ko) 감독 학습 방법론들을 활용하는 가스 터빈 고장 예측
KR101955305B1 (ko) 희소 코딩 방법론을 활용한 가스 터빈 센서 고장 검출
US20220147672A1 (en) Method and system for adaptive learning of models for manufacturing systems
US7062370B2 (en) Model-based detection, diagnosis of turbine engine faults
EP3055747B1 (en) Correlation and annotation of time series data sequences to extracted or existing discrete data
EP3105644B1 (en) Method of identifying anomalies
JP5427107B2 (ja) 監視診断装置および監視診断方法
JP6411769B2 (ja) 状態監視装置
JP5331774B2 (ja) 設備状態監視方法およびその装置並びに設備状態監視用プログラム
JP2015088154A (ja) ヘルスマネージメントシステム及びヘルスマネージメント方法
Ochella et al. Adopting machine learning and condition monitoring PF curves in determining and prioritizing high-value assets for life extension
Steurtewagen et al. Adding interpretability to predictive maintenance by machine learning on sensor data
JP6714498B2 (ja) 設備診断装置及び設備診断方法
JP2017010232A (ja) プラント診断装置及びプラント診断方法
JP2021022290A (ja) 制御状態監視システムおよびプログラム
Gkerekos et al. Ship machinery condition monitoring using vibration data through supervised learning
US11339763B2 (en) Method for windmill farm monitoring
Ferraz et al. Turbo machinery failure prognostics
EP4254430A1 (en) Device and method for tracking basis of abnormal state determination by using neural network model
Qosim et al. Fault Detection System Using Machine Learning on Synthesis Loop Ammonia Plant
WO2006107295A1 (en) Model-based detection, diagnosis of turbine engine faults
JP2019200557A (ja) 異常診断装置、異常診断方法及び異常診断プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant