KR20210078256A

KR20210078256A - 이상진단 장치 및 이상진단 모델을 최적화하기 위한 방법

Info

Publication number: KR20210078256A
Application number: KR1020190170104A
Authority: KR
Inventors: 김동수
Original assignee: 엘지전자 주식회사
Priority date: 2019-12-18
Filing date: 2019-12-18
Publication date: 2021-06-28

Abstract

본 개시는 기기에 대한 이상진단 장치로서, 기존 훈련 데이터, 기기가 동작하는 동안 수집되는 현장 데이터 및 기기에 대한 제 1 이상진단 모델을 저장하는 메모리, 메모리에 연결되는 하나 이상의 프로세서, 및 제 1 이상진단 모델을 이용하여 상기 기기의 오류를 예측하는 이상진단 모듈을 포함하고, 프로세서는, 제 1 이상진단 모델의 예측 능력이 일정치 미만으로 평가되는 것에 기초하여 제 1 이상진단 모델의 기존 훈련 데이터와 현장에서 수집된 현장 데이터의 유사성을 판단하고, 기존 훈련 데이터와 현장 데이터의 유사성이 기준치 이하인 것에 따라 제 1 이상진단 모델의 재학습을 위한 입력인자를 선택하고, 기존 훈련 데이터 및 상기 현장 데이터에서 선택된 입력인자를 이용하여 제 1 이상진단 모델을 재학습함으로써 제 2 이상진단 모델을 생성하도록 구성될 수 있다.

Description

이상진단 장치 및 이상진단 모델을 최적화하기 위한 방법{FAULT DIAGNOSIS DEVICE AND METHOD FOR OPTIMIZING FAULT DIAGNOSIS MODEL}

본 발명은 이상진단 장치 및 이상진단 모델을 최적화하기 위한 방법에 관한 것으로, 보다 구체적으로는, 이상진단 모델의 예측 능력이 저하되는 경우, 훈련 데이터를 변경하거나 모델의 구조를 변경하여 이상진단 모델을 재학습하여 이상진단 능력을 향상시키는 방법 및 장치에 관한 것이다.

기기는 사용 환경에서 동작 중 이상 또는 오류를 일으키는 경우가 발생한다. 이러한 이상 또는 오류가 발생하기 전에는 특정한 징후들이 나타날 수 있고, 이러한 징후들을 미리 감지하게 되면 기기가 동작 중에 오류를 일으켜 많은 문제를 발생시키는 것을 막을 수 있다.

기기에 대한 이상진단 모델은 기기에서 발생하는 파라미터들 중 일부를 모니터링하며 이상이 발생할 것을 예측할 수 있고, 이러한 예측에 따라 자체적으로 이상 발생을 방지하는 처방을 수행하거나, 이상 발생의 가능성을 사용자에게 알려 사용자로 하여금 사전에 조치를 취하도록 할 수 있게 한다.

이러한 이상진단 모델은 제조 단계에서 테스트를 통해 생성되어 기기에 탑재되어 사용되나, 사용 환경은 테스트 환경과 상이하여 이상진단 모델의 예측 성능이 낮을 수 있다.

이와 관련하여, 한국특허공개공보 제2016-0015240호는 베어링 고장 진단 방법에 관한 것으로, 사전에 학습되지 않은 새로운 상태가 추가되어도 적응적으로 재학습을 수행하여 진단 성능을 높이고, 클러스터링 기술을 사용하여 고장상태를 정확히 진단할 수 있는 기술을 개시하고 있다.

또한, 한국특허공개공보 제2016-0117713호는 딥러닝을 통한 자동차 상태 진단 방법에 관한 것으로, 소음, 진동 등의 센서를 통해 자동차에 대한 자료를 수집하고, 센서로부터 수집된 자료를 통해 특성치를 파악하여, 이를 이용하여 자동차 상태 진단 방식을 재학습하여 진단의 정확성을 높이는 방법을 개시하고 있다.

또한, 일본특허등록공보 제5,846,553호는 인식기 생성 방법 및 인식 장치에 관한 것으로, Adjusted-SOINN에 포함되는 노드와 신규 입력 데이터와의 유사도를 산출하고 유사도에 따라 입력 데이터의 특성을 식별하고, 계산된 유사도가 임계값을 넘기면 네트워크에 새로운 노드로 추가하는 기술을 개시하고 있다.

다만, 센서 등을 통해 확보한 신규 데이터를 통해 진단 모델을 재학습하더라도 진단 모델의 성능이 저하될 수 있으며, 진단 모델을 훈련시키는 인자들에 대한 평가 없는 지속적인 재학습은 비효율적이며 효과가 없을 수 있다.

이에 따라, 현장 데이터를 이용하여 진단 모델을 보다 효과적이고 효율적으로 재학습시키고, 현장에 최적화된 진단 모델을 생성할 수 있는 방법 및 장치에 대한 필요가 있다.

한편, 전술한 선행기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.

본 개시의 실시예는 종래 기술에서 현장 환경에서 나오는 데이터와 모델을 학습시킨 다양한 환경에서 수집된 데이터가 상이함으로 인해 이상진단 모델의 예측 능력이 낮아지는 문제점을 해결하기 위한 것이다.

또한, 본 개시의 실시예는 종래 기술에서 현장에서는 중요하지 않은 입력인자 데이터로 이상진단 모델을 학습함으로써 이상진단 모델의 예측 성능이 저하되는 문제점을 해결하기 위한 것이다.

또한, 본 개시의 실시예는 종래 기술에서는 현장 환경이 변화함에 따라 기존 이상진단 모델이 부적합해질 수 있는 문제점을 해결하기 위한 것이다.

또한, 본 개시의 실시예는 종래 기술에서는 동일한 종류의 에러로 분류되는 경우에도 사이클 데이터의 변화는 현장의 환경에 따라 상이할 수 있다는 점을 이상진단 모델 업데이트시 반영하지 못한다는 문제점을 해결하기 위한 것이다.

본 개시의 실시예에 따른 기기에 대한 이상진단 모델을 최적화하기 위한 장치 및 방법은 기존 이상진단 모델을 훈련하는데 사용된 입력인자들 중 기기가 설치된 환경에 적합하지 않은 입력인자들은 제외시키고, 현장에 적합한 입력인자들을 신규로 추가함으로써, 현장에 최적화된 이상진단 모델을 생성하는 장치 및 방법을 제공할 수 있다.

또한, 본 개시의 실시예에 따른 기기에 대한 이상진단 모델을 최적화하기 위한 장치 및 방법은 기기의 사용처에서의 환경 및 목적의 변화에 따라 적합한 훈련 데이터 및 적합한 모델 구조로 이상진단 모델을 재학습함으로써, 현장에 최적화된 이상진단 모델을 생성하는 장치 및 방법을 제공할 수 있다.

또한, 본 개시의 실시예에 따른 기기에 대한 이상진단 모델을 최적화하기 위한 장치 및 방법은 이상진단 모델을 재학습하기 위해 입력인자를 변경하는 경우 기존 훈련 데이터와 현장 데이터의 입력인자들 사이의 상관도 분석을 통해 현장에 최적화된 입력인자들을 선택하는 장치 및 방법을 제공할 수 있다.

본 개시의 실시예에 따른 기기에 대한 이상진단 장치는, 기존 훈련 데이터, 상기 기기가 동작하는 동안 수집되는 현장 데이터 및 상기 기기에 대한 제 1 이상진단 모델을 저장하는 메모리, 메모리에 연결되는 하나 이상의 프로세서, 및 제 1 이상진단 모델을 이용하여 상기 기기의 오류를 예측하는 이상진단 모듈을 포함할 수 있다.

여기서, 프로세서는, 제 1 이상진단 모델의 예측 능력이 일정치 미만으로 평가되는 것에 기초하여 제 1 이상진단 모델의 기존 훈련 데이터와 현장에서 수집된 현장 데이터의 유사성을 판단하고, 기존 훈련 데이터와 현장 데이터의 유사성이 기준치 이하인 것에 따라 제 1 이상진단 모델의 재학습을 위한 입력인자를 선택하고, 기존 훈련 데이터 및 현장 데이터에서 선택된 입력인자를 이용하여 제 1 이상진단 모델을 재학습함으로써 제 2 이상진단 모델을 생성하도록 구성될 수 있다.

또한, 제 1 이상진단 모델의 예측 능력은, 기기에 대해 제 1 이상진단 모델이 발생 예측을 하지 않았지만 기기의 오류가 발생하는 경우들과, 제 1 이상진단 모델이 발생 예측을 했지만 기기에 오류가 발생하지 않은 경우들에 기초하여 평가될 수 있다.

또한, 프로세서는, 유사성을 판단하는데 있어서, 기존 훈련 데이터와 상기 현장 데이터를 통합하여 각 입력인자별로 클러스터링하고, 클러스터링하는 단계에서 산출된 각각의 클러스터에서 기존 훈련 데이터의 비율과 현장 데이터의 비율을 산출하고, 각각의 클러스터에서 기존 훈련 데이터의 비율과 현장 데이터의 비율의 차이를 계산하고, 기존 훈련 데이터의 비율과 현장 데이터의 비율의 차이가 일정 값 이상인 클러스터의 입력인자는 기존 훈련 데이터와 현장 데이터의 유사성이 낮은 것으로 선정하는 동작을 수행하도록 추가로 구성될 수 있다.

또한, 프로세서는, 유사성을 판단하는데 있어서, 기존 훈련 데이터와 상기 현장 데이터를 동일 종류의 오류에 대한 기존 훈련 데이터와 현장 데이터로 분류하고, 동일 종류의 오류에 대해 분류된 기존 훈련 데이터와 현장 데이터의 입력인자 별 차이의 평균 및 표준편차를 계산하고, 차이의 평균 및 표준편차에 기초하여 기존 훈련 데이터와 현장 데이터의 유사성을 판단하는 동작을 수행하도록 추가로 구성될 수 있다.

또한, 프로세서는, 기존 훈련 데이터와 상기 현장 데이터의 유사성이 기준치 초과인 것에 따라 제 1 이상진단 모델의 구조를 변경하고, 변경된 제 1 이상진단 모델을 현장 데이터 및 기존 훈련 데이터를 이용하여 재학습함으로써 제 3 이상진단 모델을 생성하도록 추가로 구성될 수 있다.

여기서, 제 1 이상진단 모델의 구조를 변경하는 것은 은닉층의 수, 가중치 값 및 바이어스 값 중 적어도 하나를 변경하는 것을 포함할 수 있다.

또한, 프로세서는, 제 3 이상진단 모델을 생성한 이후에, 제 3 이상진단 모델의 예측 능력을 평가하고, 제 3 이상진단 모델의 예측 능력이 일정치 미만으로 평가되는 것에 기초하여 기존 훈련 데이터와 현장 데이터 중 훈련에 사용될 입력인자를 변경하고, 기존 훈련 데이터와 상기 현장 데이터에서 변경된 입력인자들로 상기 제 3 이상 진단 모델을 재학습하여 제 4 이상 진단 모델을 생성하는 동작을 수행하도록 추가로 구성될 수 있다.

또한, 프로세서는, 제 1 이상진단 모델의 재학습을 위한 입력인자를 선택하는 것에 있어서, 기존 훈련 데이터와 현장 데이터 모두에 존재하는 입력인자들에 대하여 기존 훈련 데이터와 상기 현장 데이터 간의 상관도를 입력인자별로 계산하는 제 1 동작, 제 1 동작의 결과 상관도가 낮은 순서대로 일정 수의 입력인자를 기존 훈련 데이터와 현장 데이터에서 제외하는 제 2 동작을 수행하도록 추가로 구성될 수 있다.

또한, 프로세서는, 제 2 동작을 수행한 이후, 현장 데이터 중 제외된 입력인자와 현장 데이터 중 기존 훈련 데이터에는 없는 입력인자들 사이의 상관도를 계산하는 제 3 동작, 제 2 동작의 결과 상관도가 높은 순서대로 일정 수의 입력인자를 제외하는 제 4 동작, 현장 데이터 중, 기존 훈련 데이터와 현장 데이터 모두에 존재하는 입력인자들 중 제 2 동작에서 제외된 입력인자를 뺀 나머지 입력인자들과 현장 데이터 중 기존 훈련 데이터에 없는 입력인자들과의 상관도를 계산하는 제 5 동작, 및 제 5 동작의 결과 상관도가 낮은 순서대로 일정 수의 입력인자를 제외하는 제 6 동작을 수행하도록 추가로 구성될 수 있다.

여기서, 제 1 이상진단 모델은 초기 이상진단 모델을 기기가 설치된 현장의 데이터를 이용하여 재학습시킨 신경망 모델일 수 있다.

본 개시의 실시예에 따른 기기에 대한 이상진단 모델을 최적화하는 방법은, 제 1 이상진단 모델의 예측 능력을 평가하는 단계, 제 1 이상진단 모델의 예측 능력이 일정치 미만으로 평가되는 것에 기초하여 제 1 이상진단 모델의 기존 훈련 데이터와 현장에서 수집된 현장 데이터의 유사성을 판단하는 단계, 기존 훈련 데이터와 현장 데이터의 유사성이 기준치 이하인 것에 따라 제 1 이상진단 모델의 재학습을 위한 입력인자를 선택하고, 기존 훈련 데이터 및 상기 현장 데이터에서 선택된 입력인자를 이용하여 제 1 이상진단 모델을 재학습함으로써 제 2 이상진단 모델을 생성하는 단계를 포함할 수 있다.

한편, 본 개시의 실시예에 따른 이상진단 모델을 최적화하기 위한 컴퓨터 판독 가능 기록매체는 상술된 방법 중 어느 하나의 방법을 실행시키기 위한 컴퓨터 프로그램이 저장된 컴퓨터로 판독 가능한 기록매체일 수 있다.

전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.

본 개시의 실시예에 따른 기기에 대한 이상진단 모델 최적화 장치 및 방법은 현장에 적합한 모델의 입력인자를 기기가 현장에서 재선택할 수 있도록 함으로써, 현장에 최적화된 이상진단 모델을 제공할 수 있다.

또한, 본 개시의 실시예에 따른 기기에 대한 이상진단 모델 최적화 장치 및 방법은 현장에 적합한 모델의 구조를 기기가 현장에서 구성하여 재학습할 수 있도록 함으로써, 현장에 최적화된 이상진단 모델을 제공할 수 있다.

또한, 본 개시의 실시예에 따른 기기에 대한 이상진단 모델 최적화 장치 및 방법은 이상진단 모델의 성능이 저하되는 경우, 이를 자동 감지하여 이상진단 모델이 현장에 최적화될 수 있도록 한다.

또한, 본 개시의 실시예에 따른 기기에 대한 이상진단 모델 최적화 장치 및 방법은 현장 데이터를 통해 재학습된 이상진단 모델의 예측 정확도 또는 성능이 기존 모델보다 지속적으로 저조할 때 모델 구조를 변경하거나 입력인자를 변경시켜 현장에 최적화된 이상진단 모델로 업그레이드할 수 있도록 한다.

또한, 본 개시의 실시예에 따른 기기에 대한 이상진단 모델 최적화 장치 및 방법은 현장 데이터와 기존 훈련 데이터 사이의 유사성을 비교하여 보다 효율적이고 효과적으로 이상진단 모델을 업그레이드하기 위한 입력인자를 선택할 수 있게 한다.

또한, 본 개시의 실시예에 따른 기기에 대한 이상진단 모델 최적화 장치 및 방법은 기 설정된 입력인자 데이터만 가지고 있는 상황에서도 직/간접적인 방식으로 입력인자를 선택하여 모델의 현장 최적화를 가속화시킬 수 있다.

또한, 본 개시의 실시예에 따른 기기에 대한 이상진단 모델 최적화 장치 및 방법은 재선택되는 입력인자 데이터의 총량과 기존 입력인자 데이터의 총량의 비율을 고려하여 압축기 이상확률을 예측함으로써, 보다 정확한 이상진단이 이루어지도록 한다.

본 개시의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

도 1은 본 개시의 실시예에 따른 이상진단 장치가 동작하는 환경을 설명하기 위한 도면이다
도 2는 본 개시의 실시예에 따른 이상진단 장치를 포함한 기기에서 오류가 발생하게 되는 서로 다른 과정을 설명하기 위한 도면이다.
도 3은 본 개시의 실시예에 따른 이상진단 모델을 훈련하기 위해 사용된 기존 훈련 데이터와 현장 데이터의 유사성을 평가하는 방법을 설명하기 위한 도면이다.
도 4는 본 개시의 실시예에 따른 이상진단 모델을 훈련하기 위해 사용된 기존 훈련 데이터와 현장 데이터의 유사성을 평가하는 다른 방법을 설명하기 위한 도면이다.
도 5는 본 개시의 실시예에 따른 이상진단 모델 최적화 방법에서 입력인자를 변경하는 과정을 설명하기 위한 도면이다.
도 6은 본 개시의 실시예에 따른 이상진단 모델을 최적화하는 방법을 설명하기 위한 순서도이다.
도 7은 본 개시의 실시예에 따른 이상진단 모델에 대해 기존 입력인자와 신규 입력인자의 데이터 양을 고려하여 재학습을 수행하는 과정을 설명하기 위한 도면이다.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 설명되는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 아래에서 제시되는 실시 예들로 한정되는 것이 아니라, 서로 다른 다양한 형태로 구현될 수 있고, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 아래에 제시되는 실시 예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

본 출원에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

이하, 본 개시에 따른 실시 예들을 첨부된 도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.

본 개시의 실시예에 따른 기기에 대한 이상진단 모델 최적화 방법 및 이상진단 장치는 다양한 기기들에 대해 적용될 수 있으나, 이하에서는 설명의 편의를 위해 공기 조화기에 대해 이상진단 모델이 적용되는 경우를 예로 하여 설명을 진행한다.

도 1은 본 개시의 실시예에 따른 이상진단 장치가 동작하는 환경을 설명하기 위한 도면이다.

본 개시의 실시예에 따른 공기 조화기에서 이상진단을 수행하기 위한 환경은 이상 진단 모델을 포함하는 공기 조화기(100), 서버 연산 시스템(200), 트레이닝 연산 시스템(300), 및 이들이 서로 통신할 수 있도록 하는 네트워크(400)를 포함할 수 있다. 여기서, 공기 조화기(100)는 자체적인 동작의 이상을 진단할 수 있으므로, 이상진단 장치라고 지칭될 수도 있다.

공기 조화기(100)는 사물 지능 통신(IoT(internet of things), IoE(internet of everything), IoST(internet of small things) 등을 지원할 수 있으며, M2M(machine to machine) 통신, D2D(device to device) 통신 등을 지원할 수 있다.

사용자 단말기(100)는 사물 인터넷을 위해 연결된 5G 환경에서 빅데이터, 인공지능(artificial intelligence, AI) 알고리즘 및/또는 기계학습(machine learning) 알고리즘을 이용하여 이미지 해상도 향상 방식을 결정할 수 있다.

공기 조화기(100)는 하나 이상의 프로세서들(110) 및 메모리(120)를 포함할 수 있다.

하나 이상의 프로세서들(110)은 데이터를 처리할 수 있는 모든 종류의 장치, 예를 들어 MCU를 포함할 수 있다. 여기서, '프로세서(processor)'는, 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다.

이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array), GPU(Graphics Processing Unit), NPU(Neural Network Processing Unit) 등의 처리 장치를 망라할 수 있으나, 본 개시의 범위가 이에 한정되는 것은 아니다.

메모리(120)는 RAM, ROM, EEPROM, EPROM, 플래시 메모리 디바이스들, 자기 디스크들, 등과 같은 하나 이상의 비-일시적(non-transitory) 저장 매체를 포함할 수 있다. 메모리(120)는 데이터(122) 및 프로세서들(110)에 의해 실행되었을 때 공기 조화기(100)로 하여금 동작들을 수행하도록 하는 인스트럭션들(124)을 저장할 수 있다.

또한, 메모리(120)는 기존 이상진단 모델을 훈련하는데 사용된 기존 훈련 데이터, 기기가 동작하는 동안 수집되는 현장 데이터 및 기기에 대한 이상진단 모델을 저장할 수 있다.

또한, 공기 조화기(100)는 이상진단 모델을 이용하여 기기의 오류를 예측하는 이상진단 모듈을 포함할 수 있다.

또한, 공기 조화기(100)는 사용자 인터페이스(140)를 포함해 사용자로부터 명령들을 입력 받을 수 있고, 출력 정보를 사용자에게 전달할 수도 있다. 사용자 인터페이스(140)는 키보드, 마우스, 터치 스크린, 마이크, 카메라 등의 다양한 입력 수단과 모니터, 스피커, 디스플레이 등의 다양한 출력 수단을 포함할 수 있다.

사용자는 사용자 인터페이스(140)를 통해 공기 조화기(100)에서 수행되는 동작들에 대해 선택할 수 있다. 예를 들어, 사용자는 리모컨, 버튼, 키보드, 터치 스크린 등을 통해 공기 조화기(100)가 동작하기 위한 조건을 설정할 수 있다.

일 실시예에서, 공기 조화기(100)의 이상진단 모델(130)은 또한 인공 지능 기술이 적용된 것일 수 있다. 예를 들어, 인공 지능 기술이 적용된 이상진단 모델(130)은 합성곱 신경망, 적대적 생성 신경망, 또는 다른 타입의 머신 러닝 모델들과 같은 다양한 학습 모델들을 이용할 수 있다.

여기서, 인공 지능(artificial intelligence, AI)은 인간의 지능으로 할 수 있는 사고, 학습, 자기계발 등을 컴퓨터가 할 수 있도록 하는 방법을 연구하는 컴퓨터 공학 및 정보기술의 한 분야로, 컴퓨터가 인간의 지능적인 행동을 모방할 수 있도록 하는 것을 의미한다.

또한, 인공지능은 그 자체로 존재하는 것이 아니라, 컴퓨터 과학의 다른 분야와 직간접으로 많은 관련을 맺고 있다. 특히 현대에는 정보기술의 여러 분야에서 인공지능적 요소를 도입하여, 그 분야의 문제 풀이에 활용하려는 시도가 매우 활발하게 이루어지고 있다.

머신 러닝(machine learning)은 인공지능의 한 분야로, 컴퓨터에 명시적인 프로그램 없이 배울 수 있는 능력을 부여하는 연구 분야이다.

구체적으로 머신 러닝은, 경험적 데이터를 기반으로 학습을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 연구하고 구축하는 기술이라 할 수 있다. 머신 러닝의 알고리즘들은 엄격하게 정해진 정적인 프로그램 명령들을 수행하는 것이라기보다, 입력 데이터를 기반으로 예측이나 결정을 이끌어내기 위해 특정한 모델을 구축하는 방식을 취한다.

용어 '머신 러닝'은 용어 '기계 학습'과 혼용되어 사용될 수 있다.

기계 학습에서 데이터를 어떻게 분류할 것인가를 놓고, 많은 기계 학습 알고리즘이 개발되었다. 의사결정나무(Decision Tree)나 베이지안 망(Bayesian network), 서포트벡터머신(SVM: support vector machine), 그리고 인공 신경망(ANN: Artificial Neural Network) 등이 대표적이다.

의사결정나무는 의사결정규칙(Decision Rule)을 나무구조로 도표화하여 분류와 예측을 수행하는 분석방법이다.

베이지안 망은 다수의 변수들 사이의 확률적 관계(조건부독립성: conditional independence)를 그래프 구조로 표현하는 모델이다. 베이지안 망은 비지도 학습(unsupervised learning)을 통한 데이터마이닝(data mining)에 적합하다.

서포트벡터머신은 패턴인식과 자료분석을 위한 지도 학습(supervised learning)의 모델이며, 주로 분류와 회귀분석을 위해 사용한다.

인공신경망은 생물학적 뉴런의 동작원리와 뉴런간의 연결 관계를 모델링한 것으로 노드(node) 또는 처리 요소(processing element)라고 하는 다수의 뉴런들이 레이어(layer) 구조의 형태로 연결된 정보처리 시스템이다.

인공 신경망은 기계 학습에서 사용되는 모델로써, 기계학습과 인지과학에서 생물학의 신경망(동물의 중추신경계 중 특히 뇌)에서 영감을 얻은 통계학적 학습 알고리즘이다.

구체적으로 인공신경망은 시냅스(synapse)의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜, 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다.

용어 인공신경망은 용어 뉴럴 네트워크(Neural Network)와 혼용되어 사용될 수 있다.

인공신경망은 복수의 레이어(layer)를 포함할 수 있고, 레이어들 각각은 복수의 뉴런(neuron)을 포함할 수 있다. 또한 인공신경망은 뉴런과 뉴런을 연결하는 시냅스를 포함할 수 있다.

인공 신경망은 일반적으로 다음의 세가지 인자, 즉 (1) 다른 레이어의 뉴런들 사이의 연결 패턴 (2) 연결의 가중치를 갱신하는 학습 과정 (3) 이전 레이어로부터 수신되는 입력에 대한 가중 합으로부터 출력값을 생성하는 활성화 함수에 의해 정의될 수 있다.

인공 신경망은, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network), MLP(Multilayer Perceptron), CNN(Convolutional Neural Network)와 같은 방식의 네트워크 모델들을 포함할 수 있으나, 이에 한정되지 않는다.

본 명세서에서 용어 '레이어'는 용어 '계층'과 혼용되어 사용될 수 있다.

인공신경망은 계층 수에 따라 단층 신경망(Single-Layer Neural Networks)과 다층 신경망(Multi-Layer Neural Networks)으로 구분된다.

일반적인 단층 신경망은, 입력층과 출력층으로 구성된다.

또한 일반적인 다층 신경망은 입력층(Input Layer)과 하나 이상의 은닉층(Hidden Layer), 출력층(Output Layer)으로 구성된다.

입력층은 외부의 자료들을 받아들이는 층으로서, 입력층의 뉴런 수는 입력되는 변수의 수와 동일하며, 은닉층은 입력층과 출력층 사이에 위치하며 입력층으로부터 신호를 받아 특성을 추출하여 출력층으로 전달한다. 출력층은 은닉층으로부터 신호를 받고, 수신한 신호에 기반한 출력 값을 출력한다. 뉴런간의 입력신호는 각각의 연결강도(가중치)와 곱해진 후 합산되며 이 합이 뉴런의 임계치보다 크면 뉴런이 활성화되어 활성화 함수를 통하여 획득한 출력값을 출력한다.

한편 입력층과 출력 층 사이에 복수의 은닉층을 포함하는 심층 신경망은, 기계 학습 기술의 한 종류인 딥 러닝을 구현하는 대표적인 인공 신경망일 수 있다.

한편 용어 '딥 러닝'은 용어 '심층 학습'과 혼용되어 사용될 수 있다.

인공 신경망은 훈련 데이터(training data)를 이용하여 학습(training)될 수 있다. 여기서 학습이란, 입력 데이터를 분류(classification)하거나 회귀분석(regression)하거나 군집화(clustering)하는 등의 목적을 달성하기 위하여, 학습 데이터를 이용하여 인공 신경망의 파라미터(parameter)를 결정하는 과정을 의미할 수 있다. 인공 신경망의 파라미터의 대표적인 예시로써, 시냅스에 부여되는 가중치(weight)나 뉴런에 적용되는 편향(bias)을 들 수 있다.

훈련 데이터에 의하여 학습된 인공 신경망은, 입력 데이터를 입력 데이터가 가지는 패턴에 따라 분류하거나 군집화 할 수 있다.

한편 훈련 데이터를 이용하여 학습된 인공 신경망을, 본 명세서에서는 학습 모델(a trained model)이라 명칭 할 수 있다.

다음은 인공 신경망의 학습 방식에 대하여 설명한다.

인공 신경망의 학습 방식은 크게, 지도 학습, 비 지도 학습, 준 지도 학습(Semi-Supervised Learning), 강화 학습(Reinforcement Learning)으로 분류될 수 있다.

지도 학습은 훈련 데이터로부터 하나의 함수를 유추해내기 위한 기계 학습의 한 방법이다.

그리고 이렇게 유추되는 함수 중, 연속적인 값을 출력하는 것을 회귀분석(Regression)이라 하고, 입력 벡터의 클래스(class)를 예측하여 출력하는 것을 분류(Classification)라고 할 수 있다.

지도 학습에서는, 훈련 데이터에 대한 레이블(label)이 주어진 상태에서 인공 신경망을 학습시킨다.

여기서 레이블이란, 훈련 데이터가 인공 신경망에 입력되는 경우 인공 신경망이 추론해 내야 하는 정답(또는 결과 값)을 의미할 수 있다.

본 명세서에서는 훈련 데이터가 입력되는 경우 인공 신경망이 추론해 내야 하는 정답(또는 결과값)을 레이블 또는 레이블링 데이터(labeling data)이라 명칭 한다.

또한 본 명세서에서는, 인공 신경망의 학습을 위하여 훈련 데이터에 레이블을 설정하는 것을, 훈련 데이터에 레이블링 데이터를 레이블링(labeling) 한다고 명칭 한다.

이 경우 훈련 데이터와 훈련 데이터에 대응하는 레이블)은 하나의 트레이닝 셋(training set)을 구성하고, 인공 신경망에는 트레이닝 셋의 형태로 입력될 수 있다.

한편 훈련 데이터는 복수의 특징(feature)을 나타내고, 훈련 데이터에 레이블이 레이블링 된다는 것은 훈련 데이터가 나타내는 특징에 레이블이 달린다는 것을 의미할 수 있다. 이 경우 훈련 데이터는 입력 객체의 특징을 벡터 형태로 나타낼 수 있다.

인공 신경망은 훈련 데이터와 레이블링 데이터를 이용하여, 훈련 데이터와 레이블링 데이터의 연관 관계에 대한 함수를 유추할 수 있다. 그리고, 인공 신경망에서 유추된 함수에 대한 평가를 통해 인공 신경망의 파라미터가 결정(최적화)될 수 있다.

비 지도 학습은 기계 학습의 일종으로, 훈련 데이터에 대한 레이블이 주어지지 않는다.

구체적으로, 비 지도 학습은, 훈련 데이터 및 훈련 데이터에 대응하는 레이블의 연관 관계 보다는, 훈련 데이터 자체에서 패턴을 찾아 분류하도록 인공 신경망을 학습시키는 학습 방법일 수 있다.

비 지도 학습의 예로는, 군집화 또는 독립 성분 분석(Independent Component Analysis)을 들 수 있다.

본 명세서에서 용어 '군집화'는 용어 '클러스터링'과 혼용되어 사용될 수 있다.

비지도 학습을 이용하는 인공 신경망의 일례로 생성적 적대 신경망(GAN: Generative Adversarial Network), 오토 인코더(AE: Autoencoder)를 들 수 있다.

생성적 적대 신경망이란, 생성기(generator)와 감별기(discriminator), 두 개의 서로 다른 인공지능이 경쟁하며 성능을 개선하는 머신 러닝 방법이다.

이 경우 생성기는 새로운 데이터를 창조하는 모형으로, 원본 데이터를 기반으로 새로운 데이터를 생성할 수 있다.

또한 감별기는 데이터의 패턴을 인식하는 모형으로, 입력된 데이터가 원본 데이터인지 또는 생성기에서 생성한 새로운 데이터인지 여부를 감별하는 역할을 수행할 수 있다.

그리고 생성기는 감별기를 속이지 못한 데이터를 입력 받아 학습하며, 감별기는 생성기로부터 속은 데이터를 입력 받아 학습할 수 있다. 이에 따라 생성기는 감별기를 최대한 잘 속이도록 진화할 수 있고, 감별기는 원본 데이터와 생성기에 의해 생성된 데이터를 잘 구분하도록 진화할 수 있다.

오토 인코더는 입력 자체를 출력으로 재현하는 것을 목표로 하는 신경망이다.

오토 인코더는 입력층, 적어도 하나의 은닉층 및 출력층을 포함한다.

이 경우 은닉 계층의 노드 수가 입력 계층의 노드 수보다 적으므로 데이터의 차원이 줄어들게 되며, 이에 따라 압축 또는 인코딩이 수행되게 된다.

또한 은닉 계층에서 출력한 데이터는 출력 계층으로 들어간다. 이 경우 출력 계층의 노드 수는 은닉 계층의 노드 수보다 많으므로, 데이터의 차원이 늘어나게 되며, 이에 따라 압축 해제 또는 디코딩이 수행되게 된다.

한편 오토 인코더는 학습을 통해 뉴런의 연결 강도를 조절함으로써 입력 데이터가 은닉층 데이터로 표현된다. 은닉층에서는 입력층보다 적은 수의 뉴런으로 정보를 표현하는데 입력 데이터를 출력으로 재현할 수 있다는 것은, 은닉층이 입력 데이터로부터 숨은 패턴을 발견하여 표현했다는 것을 의미할 수 있다.

준 지도 학습은 기계 학습의 일종으로, 레이블이 주어진 훈련 데이터와 레이블이 주어지지 않은 훈련 데이터를 모두 사용하는 학습 방법을 의미할 수 있다.

준 지도 학습의 기법 중 하나로, 레이블이 주어지지 않은 훈련 데이터의 레이블을 추론한 후 추론된 라벨을 이용하여 학습을 수행하는 기법이 있으며, 이러한 기법은 레이블링에 소요되는 비용이 큰 경우에 유용하게 사용될 수 있다.

강화 학습은, 에이전트(Agent)가 매 순간 어떤 행동을 해야 좋을지 판단할 수 있는 환경이 주어진다면, 데이터 없이 경험으로 가장 좋을 길을 찾을 수 있다는 이론이다.

강화 학습은 주로 마르코프 결정 과정(MDP: Markov Decision Process)에 의하여 수행될 수 있다.

마르코프 결정 과정을 설명하면, 첫 번째로 에이전트가 다음 행동을 하기 위해 필요한 정보들이 구성된 환경이 주어지며, 두 번째로 그 환경에서 에이전트가 어떻게 행동할지 정의하고, 세 번째로 에이전트가 무엇을 잘하면 보상(reward)를 주고 무엇을 못하면 벌점(penalty)을 줄지 정의하며, 네 번째로 미래의 보상이 최고점에 이를 때까지 반복 경험하여 최적의 정책(policy)을 도출하게 된다.

인공 신경망은 모델의 구성, 활성 함수(Activation Function), 손실 함수(Loss Function) 또는 비용 함수(Cost Function), 학습 알고리즘, 최적화 알고리즘 등에 의해 그 구조가 특정되며, 학습 전에 하이퍼파라미터(Hyperparameter)가 미리 설정되고, 이후에 학습을 통해 모델 파라미터(Model Parameter)가 설정되어 내용이 특정될 수 있다.

예컨대, 인공 신경망의 구조를 결정하는 요소에는 은닉층의 개수, 각 은닉층에 포함된 은닉 노드의 개수, 입력 특징 벡터(Input Feature Vector), 대상 특징 벡터(Target Feature Vector) 등이 포함될 수 있다.

하이퍼파라미터는 모델 파라미터의 초기값 등과 같이 학습을 위하여 초기에 설정하여야 하는 여러 파라미터들을 포함한다. 그리고, 모델 파라미터는 학습을 통하여 결정하고자 하는 여러 파라미터들을 포함한다.

예컨대, 하이퍼파라미터에는 노드 간 가중치 초기값, 노드 간 편향 초기값, 미니 배치(Mini-batch) 크기, 학습 반복 횟수, 학습률(Learning Rate) 등이 포함될 수 있다. 그리고, 모델 파라미터에는 노드 간 가중치, 노드 간 편향 등이 포함될 수 있다.

손실 함수는 인공 신경망의 학습 과정에서 최적의 모델 파라미터를 결정하기 위한 지표(기준)로 이용될 수 있다. 인공 신경망에서 학습은 손실 함수를 줄이기 위하여 모델 파라미터들을 조작하는 과정을 의미하며, 학습의 목적은 손실 함수를 최소화하는 모델 파라미터를 결정하는 것으로 볼 수 있다.

손실 함수는 주로 평균 제곱 오차(MSE: Mean Squared Error) 또는 교차 엔트로피 오차(CEE, Cross Entropy Error)를 사용할 수 있으며, 본 개시가 이에 한정되지는 않는다.

교차 엔트로피 오차는 정답 레이블이 원 핫 인코딩(one-hot encoding)된 경우에 사용될 수 있다. 원 핫 인코딩은 정답에 해당하는 뉴런에 대하여만 정답 레이블 값을 1로, 정답이 아닌 뉴런은 정답 레이블 값이 0으로 설정하는 인코딩 방법이다.

머신 러닝 또는 딥 러닝에서는 손실 함수를 최소화하기 위하여 학습 최적화 알고리즘을 이용할 수 있으며, 학습 최적화 알고리즘에는 경사 하강법(GD: Gradient Descent), 확률적 경사 하강법(SGD: Stochastic Gradient Descent), 모멘텀(Momentum), NAG(Nesterov Accelerate Gradient), Adagrad, AdaDelta, RMSProp, Adam, Nadam 등이 있다.

경사 하강법은 현재 상태에서 손실 함수의 기울기를 고려하여 손실 함수값을 줄이는 방향으로 모델 파라미터를 조정하는 기법이다.

모델 파라미터를 조정하는 방향은 스텝(step) 방향, 조정하는 크기는 스텝 사이즈(size)라고 칭한다.

이때, 스텝 사이즈는 학습률을 의미할 수 있다.

경사 하강법은 손실 함수를 각 모델 파라미터들로 편미분하여 기울기를 획득하고, 모델 파라미터들을 획득한 기울기 방향으로 학습률만큼 변경하여 갱신할 수 있다.

확률적 경사 하강법은 학습 데이터를 미니 배치로 나누고, 각 미니 배치마다 경사 하강법을 수행하여 경사 하강의 빈도를 높인 기법이다.

Adagrad, AdaDelta 및 RMSProp는 SGD에서 스텝 사이즈를 조절하여 최적화 정확도를 높이는 기법이다. SGD에서 모멘텀 및 NAG는 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다. Adam은 모멘텀과 RMSProp를 조합하여 스텝 사이즈와 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다. Nadam은 NAG와 RMSProp를 조합하여 스텝 사이즈와 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다.

인공 신경망의 학습 속도와 정확도는 인공 신경망의 구조와 학습 최적화 알고리즘의 종류뿐만 아니라, 하이퍼파라미터에 크게 좌우되는 특징이 있다. 따라서, 좋은 학습 모델을 획득하기 위하여는 적당한 인공 신경망의 구조와 학습 알고리즘을 결정하는 것뿐만 아니라, 적당한 하이퍼파라미터를 설정하는 것이 중요하다.

통상적으로 하이퍼파라미터는 실험적으로 다양한 값으로 설정해가며 인공 신경망을 학습시켜보고, 학습 결과 안정적인 학습 속도와 정확도를 제공하는 최적의 값으로 설정한다.

상술된 바와 같은 인공 지능 기술이 적용된 이상진단 모델(130)은 먼저 트레이닝 연산 시스템(300)에 의해 트레이닝 단계를 거쳐 생성될 수 있고, 서버 연산 시스템(200)에 저장되었다가 네트워크(400)를 통해 공기 조화기(100)로 전송된 것일 수 있다. 다른 예에서는, 이상진단 모델(130)은 제조시에 개발자들에 의해 수집된 다양한 환경의 훈련 데이터를 통해 학습된 초기 이상진단 모델로서 제품 제조 단계에서 공기 조화기(100)에 입력된 것일 수 있다.

이상진단 모델(130)은 기기의 이상을 예측 및 감지하는 신경망으로서, 기기의 동작 파라미터들이 입력되면 발생할 것으로 예상되는 오류의 종류 및/또는 오류의 발생 시점을 출력하도록 훈련된 신경망일 수 있다.

통상적으로 이상진단 모델(130)은 트레이닝 연산 시스템(300)에서 트레이닝 단계를 마치고 공기 조화기(100)에 저장되어 있을 수 있으나, 이상진단 모델(130)은 현장에 설치된 공기 조화기(100)에서 추가적으로 트레이닝을 거쳐 업데이트 또는 업그레이드 될 수도 있다.

먼저, 본 개시의 실시예에 따른 공기 조화기 압축기에 대한 이상진단 모델은 K-NN, K-Means, SVM과 같은 비지도 학습을 기반으로 생성될 수 있다.

이상진단을 위한 기존 훈련 데이터는 공조기 에러 번호 별로 데이터가 군집화되어 있으며 각 에러번호 별로 대표하는 데이터 헤드가 있다고 가정한다.

그러나 같은 에러번호라 할지라도 사이클 데이터는 설치 환경에 따라 다양하므로 서브 그룹으로도 나누어 데이터를 분류한다. 이러한 방법으로 생성된 이상진단 모델을 현장에 설치한 후 현장 데이터를 기반으로 재학습하면서 예측능력을 지속적으로/일정주기로 평가하며 현장데이터와 학습데이터의 유사성을 지속적으로 관찰할 수 있다.

이와 같은 방법으로 학습된 압축기 이상진단 모델은 같은 과정을 통해 진단 모델의 예측 성능 (정확도)가 지속적으로 낮을 경우 하기에서 설명되는 방식을 통해 이상진단 모델의 예측 성능을 향상시킬 수 있다.

한편, 공기 조화기(100)에 저장되는 이상진단 모델(130)은 트레이닝 연산 시스템(300)에서 생성된 이상진단 모델들 중 일부일 수 있으며, 필요에 따라, 새로운 이상진단 모델들이 트레이닝 연산 시스템(300)에서 생성되어 공기 조화기(100)로 전달될 수 있다.

다른 예로서, 이상진단 모델들은 공기 조화기(100)에 저장되는 대신 서버 연산 시스템(200)에 저장되고, 웹 서비스의 형태로 공기 조화기(100)에 필요한 기능을 제공할 수도 있다. 여기서, 서버 연산 시스템(200)은 공기 조화기(100)가 설치된 지역에 특화된 서버일 수 있다.

서버 연산 시스템(200)은 프로세서들(210) 및 메모리(220)를 포함하며, 일반적으로 공기 조화기(100)보다 큰 프로세싱 능력 및 큰 메모리 용량을 가질 수 있다. 따라서, 시스템 구현에 따라, 적용에 보다 많은 프로세싱 능력을 필요로 하는 이상진단 모델(230)은 서버 연산 시스템(200)에 저장되고, 적용에 보다 적은 프로세싱 능력을 필요로 하는 경량의 이상진단 모델(130)은 공기 조화기(100)에 저장되도록 구성될 수도 있다.

공기 조화기(100)는 제조시 제공된 초기 이상진단 모델(130)을 계속 사용하지 않고, 현장에서 수집되는 데이터에 따라 초기 이상진단 모델(130)을 재학습시켜 보다 현장에 적합한 이상진단 모델을 생성할 수 있다. 다만, 재학습을 통해 생성된 이상진단 모델의 예측 능력은 이하에서 설명되는 바에 따라 재평가될 필요가 있다.

트레이닝 연산 시스템(300)은 하나 이상의 프로세서들(310)과 메모리(320)를 포함할 수 있다. 또한, 트레이닝 연산 시스템(300)은 기계 학습 모델들을 트레이닝하기 위한 모델 트레이너(350) 및 트레이닝 데이터(360)를 포함할 수 있다.

트레이닝 연산 시스템(360)은 모델 트레이너(350)를 통해 트레이닝 데이터(360)에 기초하여 다수의 이미지 처리용 모델들을 생성할 수 있다.

도 2는 본 개시의 실시예에 따른 이상진단 장치를 포함한 기기에서 오류가 발생하게 되는 서로 다른 과정을 설명하기 위한 도면이다.

도 2(a) 및 도 2(b)의 그래프에서 x축은 시간(단위는 분), y축은 파라미터 값들이고, 각각의 선들은 공기 조화기가 동작할 때 감지되는 여러 파라미터들을 나타낼 수 있다.

도 2(a)는 제조시 테스트 환경에서 공기 조화기(100), 특별히 압축기에서 고장이 발생하게 되는 시점까지 각각의 파라미터들이 어떻게 변동되어왔는지를 보여준다.

도 2(b)는 공기 조화기(100)가 실제 현장에 설치된 이후에, 압축기에서 도 2(a)에서와 동일한 종류의 고장이 발생하게 되는 시점까지 각각의 파라미터들이 어떻게 변동되어왔는지를 보여준다.

도 2(a)에서는 점선으로 나타나는 파라미터 A가 고장발생 시점 약 30분 전에 급격히 상승했다가 하강하고 다시 상승하는 곡선을 그렸고, 도 2(b)에서는 실선으로 나타나는 파라미터 B가 고장발생 시점 약 27분 전에 급격히 하강하다가 고장발생시점 이전 12분 전에 급격히 상승하는 곡선을 그렸다.

즉, 환경과 사용조건의 변경에 따라서 동일한 종류의 에러가 발생할 때까지 사이클 데이터의 변화는 현장마다 다르므로, 이상진단 모델에서 어떤 입력인자에 가중치를 주고 에러 발생을 예측할 것인지는 현장마다 달라질 수 있다.

따라서, 다양한 환경마다 최적의 이상진단 모델을 생성하기 위해서는 공기 조화기 압축기에 대한 이상진단 모델의 입력인자를 변경하여 이상진단 모델을 최적화할 필요가 있다.

이에 따라, 본 개시에 따른 인공지능 기반 공기 조화기 압축기 이상진단 모델의 최적화 방법은 일정 주기마다 기존 모델이 현장 데이터를 이용해 재학습된 이상진단 모델의 예측 능력을 평가하는 단계, 모델의 예측 능력이 기존 모델의 예측능력에 비해 지속적으로 임계값보다 낮다고 판단되거나, 또는 지속적으로 감소할 경우 기존 모델을 학습시킨 데이터와 현장데이터의 유사성을 비교하는 단계, 두 데이터 세트의 유사성 비교 후 재학습에 이용할 데이터를 재선택할지 결정하는 단계, 재선택 결정 단계에 따라 재학습에 이용할 데이터를 선별하고 입력인자를 변경하는 단계, 입력인자를 변경하는 단계에서 변경된 입력인자를 이용하여 진단 모델을 재학습하는 단계를 포함할 수 있다.

여기서, 일정 주기 마다 재학습된 이상진단 모델의 예측 성능을 평가하는 것은 다음과 같이 이루어질 수 있다.

먼저, 초기 이상진단 모델을 보유하여 현장에 설치된 공기 조화기의 이상진단 장치는 일정 기간 동안 운영 후 수집된 현장 데이터에 기반하여 재학습될 수 있다.

이후에, 이상진단 장치의 프로세서는, 예를 들어, 주/월/분기/반기/년 단위로 현장 데이터로 재학습된 이상진단 모델의 예측 능력을 평가할 수 있다.

기존 모델의 예측 능력(예를 들어, 정확도 95%, 검출율 95% 등)과 비교했을 때 아래의 경우 중 하나 또는 그 이상의 현상이 발생하는지 여부를 확인할 수 있다.

1) 주요 예측 성능(예를 들어, 정확도, 검출율 등)의 저하 트렌드 발생 (점차적으로 정확도 및 검출율이 낮아짐).

2) 주요 예측 성능(예. 정확도, 검출율 등)이 임계값 (예를 들어, 정확도 90%) 이하로 낮아짐

3) 주요 예측 성능의 표준편차(또는 분산 등)가 임계값 이상(예를 들어, 예측 정확도 max-min이 20% 이상)

이러한 예측 성능은, 공기 조화기의 압축기에 대해 이상진단 모델이 발생 예측을 하지 않았지만 기기의 오류가 발생하는 경우들과, 발생하지 않는 경우들, 이상진단 모델이 발생 예측을 했지만 공기 조화기의 압축기에서 오류가 발생하지 않는 경우와 발생하는 경우들을 수집하여 계산할 수 있다.

위와 같이 사전에 정의된 이상진단 모델의 예측 능력 평가조건에 이상진단 장치의 상태가 부합될 경우(예측능력이 기준 미달인 경우), 이상진단 모델은 현장에 맞게 최적화될 필요가 있다.

본 개시에서는 압축기 이상진단 모델의 예측성능이 기대값보다 낮을 경우 원인 확인을 위해 이하에서와 같이 데이터 유사성을 검사하고 해결방법을 제안한다.

이상진단 모델의 예측 능력이 위에서 언급한 평가조건에 따라 기준 미달일 때 기존 이상진단 모델의 학습데이터에 현장의 특성이 반영이 되지 않았을 가능성이 존재한다.

이하에서는, 이를 해결하기 위해 기존 훈련 데이터와 현장 데이터 사이의 유사성을 평가하고 현장 입력인자 변경하는 방법을 설명한다.

도 3은 본 개시의 실시예에 따른 이상진단 모델을 훈련하기 위해 사용된 기존 훈련 데이터와 현장 데이터의 유사성을 평가하는 일 방법을 설명하기 위한 도면이다.

이상진단 장치의 프로세서는 기존 이상진단 모델의 예측 성능이 낮다고 평가되는 경우, 기존 훈련 데이터와 현장 데이터를 통합하여 각 입력인자 별로 클러스터링하여(예를 들어, K-Means를 이용) 분류할 수 있다.

이후에, 각 클러스터의 기존 훈련 데이터와 현장 데이터의 비율을 확인한 후 두 종류의 데이터가 섞인 정도, 즉 기존 훈련 데이터가 현장 데이터와 비슷한 정도를 수치적으로 계산한다.

먼저, 기존 훈련 데이터의 각 클러스터에 속한 비율과 현장데이터의 각 클러스터에 속한 비율을 구한 뒤 그 차이의 평균값이 임계값 이상일 경우 두 데이터의 유사성은 기준 이하로 정의할 수 있다.

예를 들어, 도 3(a)의 경우에는 클러스터별 기존 훈련 데이터 비율 및 현장 데이터 비율, 그리고 이들 간의 차이가 하기와 같이 정리될 수 있다.

[표 1]

여기서, 클러스터들에서의 기존 훈련 데이터 비율과 현장 데이터 비율의 차이의 평균 값은 약 5이다.

다른 경우로, 도 3(b)의 경우에는 클러스터별 기존 훈련 데이터 비율 및 현장 데이터 비율, 그리고 이들 간의 차이가 하기와 같이 정리될 수 있다.

[표 2]

여기서, 클러스터들에서의 기존 훈련 데이터 비율과 현장 데이터 비율의 차이의 평균 값은 약 34이다.

일 실시예에서, 이상진단 장치의 프로세서는 기존 훈련 데이터와 현장 데이터의 유사도 측정에 있어서, 클러스터 별 각 데이터 비율 차이를 구하여 평균값이 n이하일 때 유사도가 높다고 정의할 수 있다.

도 3(a) 및 (b)의 경우에 n=10 이라고 한다면 도 3(a)는 평균이 5, 도 3(b)의 평균이 34이므로 도 3(a)의 경우는 유사성이 높고 도 3(b)의 경우는 유사성이 낮다고 판단할 수 있다.

요약하면, 기존 훈련 데이터와 현장 데이터 사이의 유사성을 판단하기 위한 일 실시예에서, 이상진단 장치의 프로세서는 기존 훈련 데이터와 현장 데이터를 통합하여 각 입력인자별로 클러스터링하고, 클러스터링하는 단계에서 산출된 각각의 클러스터에서 기존 훈련 데이터의 비율과 현장 데이터의 비율을 산출하고, 각각의 클러스터에서 기존 훈련 데이터의 비율과 현장 데이터의 비율의 차이를 계산하고, 기존 훈련 데이터의 비율과 현장 데이터의 비율의 차이가 일정 값 이상인 클러스터의 입력인자는 기존 훈련 데이터와 현장 데이터의 유사성이 낮은 것으로 선정할 수 있다.

도 4는 본 개시의 실시예에 따른 이상진단 모델을 훈련하기 위해 사용된 기존 훈련 데이터와 현장 데이터의 유사성을 평가하는 다른 방법(통계적 유사도 계산)을 설명하기 위한 도면이다.

먼저, 이상진단 장치의 프로세서는 각 클러스터에 속한 기존 훈련 데이터와 현장 데이터를 태그(Life_Time, Error 번호) 값을 기준으로 분류할 수 있다. 분류는 평균값으로 할 수도 있고, 최빈도값으로 할 수도 있다. 만일 분류된 두 태그의 값의 차이가 임계값 이상일 경우 두 데이터의 유사성은 기준 이하로 정의될 수 있다.

예를 들어, 동일 Error 번호를 가지는 기존 훈련 데이터와 현장 데이터를 정리하면 도 4의 왼쪽 테이블과 같이 정리될 수 있다.

이상진단 장치의 프로세서는 분류된 기존 훈련 데이터에 대해서 입력인자 별(인자 A, 인자 B, 인자 C)로 차이의 평균, 표준편차, 분산 등을 계산할 수 있다.

계산된 평균, 표준 편차, 분산 값의 차이가 임계값 미만일 경우 두 데이터 세트의 유사성은 기준 이하로 진단될 수 있고, 이상진단 모델의 훈련을 위한 데이터의 입력인자가 다시 선택될 수 있다.

유사성이 기준 이상인 경우 두 데이터 세트의 유사성은 기준 이상으로 판단되고 먼저 이상진단 모델의 구조가 변경될 수 있다.

요약하면, 기존 훈련 데이터와 현장 데이터 사이의 유사성을 판단하기 위한 다른 실시예에서, 이상진단 장치의 프로세서는, 기존 훈련 데이터와 상기 현장 데이터를 동일 종류의 오류에 대한 기존 훈련 데이터와 현장 데이터로 분류하고, 동일 종류의 오류에 대해 분류된 기존 훈련 데이터와 현장 데이터의 입력인자 별 차이의 평균 및 표준편차를 계산하고, 차이의 평균 및 표준편차에 기초하여 기존 훈련 데이터와 현장 데이터의 유사성을 판단할 수 있다.

도 3 또는 도 4와 관련된 설명에서의 방식에 따라 기존 훈련 데이터와 현장 데이터 사이의 유사성이 결정되면, 이상진단 모델을 재학습하기 위한 프로세스가 진행될 수 있다.

도 5는 본 개시의 실시예에 따른 이상진단 모델 최적화 방법에서 입력인자를 변경하는 과정을 설명하기 위한 도면이다.

기존 훈련 데이터와 현장 데이터 사이의 유사성이 낮은 것으로 판단되면, 먼저 이상진단 모델의 재학습을 위한 입력인자에 대한 재검토가 필요하다.

즉, 기존 훈련 데이터에서 중요도 계산의 결과로 포함된 입력인자가 현장에서는 중요하지 않은 경우이므로, 입력인자를 다시 선정해야 한다. 그러나, 현장에서는 최초 이상진단 모델을 학습시킬 때 이용했던 입력인자 데이터만 갖고 있을 가능성이 높으므로 현장에서 얻을 수 있는 모든 입력인자 데이터가 기존 훈련 데이터에 포함되어 있지는 않을 수 있다.

그러므로, 현장에서 획득한 모든 입력인자 데이터 세트와 기존 입력인자 데이터 세트를 비교하여 입력인자를 선정해야 한다.

도 5의 왼쪽 테이블에서는 총 24개의 입력가능한 사이클 파라미터 중에서 물리적 해석과 상관도 분석에 따라 선택된 기존 훈련 데이터가 13개의 입력인자를 가지고 있다.

도 5의 오른쪽 테이블은 현장 데이터와 기존 훈련 데이터에 기초한 재검토를 통한 현장 데이터의 유사도 분석에 따라 기존 3개의 입력인자가 제외되고 2개의 신규 입력인자가 추가되는 것을 도시한다.

본 개시에서 새로운 입력인자를 선정하는 방법을 아래의 예시를 기반으로 설명한다. 예를 들어, 기존 훈련 데이터의 입력 인자는 a1, b1, c1 일 수 있고, 현장에서 수집 가능한 입력인자는 a2, b2, c2, d2, e2, f2일 수 있다.

여기서 a1과 a2는 같은 종류의 입력인자이나, a1은 기존 데이터, a2는 현장 데이터에서 얻은 입력인자 데이터이다.

1) 먼저, 기존 훈련 데이터의 입력인자들 중에서 제외해야할 입력인자를 선택하는 과정이 수행될 수 있다.

이상진단 장치의 프로세서는 기존 훈련 데이터와 현장 데이터 모두에 존재하는 입력인자들에 대하여 기존 훈련 데이터의 입력인자와 현장 데이터의 입력인자 사이의 유사도를 비교할 수 있다. 예를 들어, a1, b1, c1 각각과 a2, b2, c2 각각의 유사도를 비교할 수 있고, 여기서는, c가 가장 낮은 유사도를 가지는 입력인자로서 제외되었다고 하자.

2) 다음으로, 현장에서 수집 가능한 입력인자 중에서 제외해야 할 입력인자를 선택하는 첫 번째 과정이 수행될 수 있다.

먼저, 제외하기로 한 c2 데이터와 d2, e2, f2 데이터 사이의 상관도를 분석하여 가장 높은 상관도의 순서대로 기존에 설정된 숫자만큼의 입력인자를 선택하여 제외할 수 있다.

본 예시에서는 d2가 c2와 가장 높은 상관도를 가져서 제외되는 것으로 한다. 여기서, 상관도 분석은 피어슨 상관계수의 절대값을 이용할 수 있다.

3) 다음으로, 현장에서 수집 가능한 입력인자 중에서 제외해야 할 입력인자를 선택하는 두 번째 과정이 수행될 수 있다.

여기서는, 위의 과정 중에 제외된 c, d를 제외하고, 현장 입력인자 중 기존 훈련 데이터에 존재하는 입력인자인 a2, b2 와 기존 훈련 데이터에는 없는 입력인자인 d2, e2, f2 사이의 상관도를 분석하여 상관도가 가장 낮은 순서대로 기존에 설정된 숫자만큼의 입력인자를 선택하여 제외할 수 있다.

본 예시에서는 d2 및 e2 가 상관도가 가장 낮은 2개의 입력인자로 선택되어 제외되는 것으로 한다.

4) 마지막으로, 현장 데이터에서 위의 2)와 3)의 선택 결과의 합집합에 해당되는 인자를 제외하고 재학습용 입력인자로 추가할 수 있다. 본 예시에서는 최종적으로 c, d, e 입력인자를 제외하고, f 인자를 현장 재학습 및 예측에 추가하게 된다.

한편, 2)와 3)의 두 번의 확인과정은 기존 훈련 데이터에서는 비교 대상인 입력인자 자체가 없어 직접적인 데이터 유사도 분석이 불가능하므로, 간접적인 방법으로 입력인자의 중요도를 유추하는 과정이다.

위와 같은 방법으로 압축기 이상진단 모델을 재학습하기 위한 입력인자의 선택을 실시할 경우, 도 5와 같이 총 24개의 입력가능한 사이클 파라미터 중에서 물리적 해석과 상관도 분석에 따라 선택된 기존 훈련 데이터의 13개의 입력인자에 있어서, 현장 데이터의 유사도 분석에 따라 기존 3개가 제외되고 2개의 신규 입력인자가 추가될 수 있다.

도 6은 본 개시의 실시예에 따른 이상진단 모델을 최적화하는 방법을 설명하기 위한 순서도이다.

먼저, 공기 조화기(100)의 프로세서는 압축기에 대한 이상진단 모델의 현장 예측 능력을 평가한다(S110). 이상진단 모델의 예측 능력이 임계값 이상이라면 이상진단 모델이 유지될 수 있다.

그러나, 이상진단 모델의 예측 능력이 임계값 미만이라면(S120), 이상진단 모델의 기존 훈련 데이터와 현장에서 수집되는 현장 데이터의 유사도를 판단할 수 있다(S130).

데이터 유사도가 임계값 미만이라면, 기존 훈련 데이터와 현장 데이터 사이의 공통 입력인자들 사이의 상관도를 비교할 수 있다. 상관도 비교 결과에 따라 상관도가 낮은 기존 입력인자가 n개 결정되어 제외될 수 있다(S152).

이후에는 S152에서 제외되기로 한 입력인자와 현장에서만 가능한 입력인자들 사이의 상관도가 계산되고, 상관도가 높은 순서대로 입력인자가 m개 선택되어 제외될 수 있다(S154).

다음으로는 현장에서만 가능한 입력인자들 중 S152에서 제외된 인자 이외의 인자들 사이의 상관도를 분석하여 상관도 낮은 입력인자가 l개 선택될 수 있다(S156).

이후에 S154와 S156에서 선택된 인자가 적어도 하나 있다면(S160), S152, S154, S156에서 선택된 인자들을 입력인자에서 제외할 수 있다(S170).

S154와 S156에서 선택된 인자가 전혀 없다면, S154와 S156을 다시 반복할 수 있거나, S152에서 선택된 인자만을 입력인자에서 제외할 수 있다.

이후, 이상진단 장치의 프로세서는 선택된 입력인자에 대해서 현장 데이터를 수집하고(S180), 이러한 데이터를 이용하여 이상진단 모델을 재학습할 수 있다(S190).

이러한 프로세스를 거쳐 재학습된 이상진단 모델은 현장에 보다 적합하게 되어 향상된 예측 성능을 보일 수 있다.

한편, S130에서 데이터 유사도가 임계값 이상인 것으로 판단되면, 입력인자를 변경하는 대신 이상진단 모델의 구조를 변경할 수 있다. 여기서, 이상진단 모델의 구조 변경은 은닉층의 수, 가중치 값 및 바이어스 값 중 적어도 하나를 변경하는 것을 포함할 수 있다.

이상진단 모델의 구조를 변경하고, 재학습한 이후에는 재학습된 이상진단 모델의 예측 능력을 재평가할 수 있고, 예측 능력이 낮게 평가되는 경우에는 위에서 설명된 입력인자 재선택 프로세스가 수행될 수 있다.

도 7은 본 개시의 실시예에 따른 이상진단 모델에 대해 기존 입력인자와 신규 입력인자의 데이터 양을 고려하여 재학습을 수행하는 과정을 설명하기 위한 도면이다.

위에서 설명된 바와 같이 입력인자 변경을 통해 현장에서 이상진단을 수행하기 적합하지 않은 입력인자는 제외되고 현장에서 이상진단에 도움이 되는 신규 입력인자가 추가되어, 이상진단 모델을 재학습시키기 위한 데이터가 준비될 수 있다.

그러나, 현장에서는 장기간동안 데이터가 축적되지 않았을 경우 기존 입력인자에 대한 데이터의 총량이 신규 입력인자의 데이터의 총량보다 많을 가능성이 높다.

이러한 경우 데이터의 불균형으로 인해 신규 입력인자 데이터에 대한 편중이 커질 수 있다. 이런 경우를 대비하여 데이터 총량 비율에 따라 가중치를 주어 압축기 이상 여부를 판단할 수 있다.

K-NN같이 비지도학습 기반 압축기 이상진단 모델에서는 타겟 데이터 (신규 데이터)와 참조데이터 (학습 데이터)의 거리 (Euclidean distance)를 계산하여 정상/이상 확률을 계산한다.

이때, 신규 입력인자의 총량이 기존 입력인자 데이터의 총량보다 적을 경우 타겟 데이터와 참조 데이터 사이 거리의 분산이 클 가능성이 높으므로 신규 입력인자 데이터에 대해서는 K값을 감소시켜서(분산값을 감소시킴) 압축기 이상확률을 계산한다.

이때, K 값은 “현장데이터/기존데이터”의 비율로 정할 수 있다. 도 7은 기존 K값이 10이고 현장데이터와 기존데이터의 비율이 0.5일 때의 기존입력인자와 신규로 선택된 입력인자의 K-NN 알고리즘 실행 예시이다.

도 7에 도시된 바와 같이 데이터 양이 많은 기존 입력인자에 대해서는 K=10으로 하여 K-NN 알고리즘을 실행하고, 데이터 양이 많지 않은 신규 입력인자에 대해서는 K=5로 하여 K-NN 알고리즘을 수행할 수 있다.

일 실시예에서, 신규 입력인자에 대해서는 기존 입력인자에 대한 K 값에 “현자 데이터의 수/기존 훈련 데이터의 수”를 곱한 값을 K' 값으로 하여 K-NN 알고리즘을 수행할 수 있다.

즉, 새롭게 선택된 현장 입력인자 데이터와 기존 입력인자 데이터의 총량의 비율에 기반하여 이상진단 모델의 파라미터를 달리하여 압축기 이상확률을 예측하도록 할 수 있다.

이상 설명된 본 발명에 따른 실시 예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다.

한편, 상기 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.

본 발명의 명세서(특히 특허청구범위에서)에서 "상기"의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 본 발명에서 범위(range)를 기재한 경우 상기 범위에 속하는 개별적인 값을 적용한 발명을 포함하는 것으로서(이에 반하는 기재가 없다면), 발명의 상세한 설명에 상기 범위를 구성하는 각 개별적인 값을 기재한 것과 같다.

본 발명에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 발명이 한정되는 것은 아니다. 본 발명에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 발명을 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 발명의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시 예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims

기기에 대한 이상진단 장치로서,
기존 훈련 데이터, 상기 기기가 동작하는 동안 수집되는 현장 데이터 및 상기 기기에 대한 제 1 이상진단 모델을 저장하는 메모리;
상기 메모리에 연결되는 하나 이상의 프로세서; 및
상기 제 1 이상진단 모델을 이용하여 상기 기기의 오류를 예측하는 이상진단 모듈을 포함하고,
상기 프로세서는,
상기 제 1 이상진단 모델의 예측 능력이 일정치 미만으로 평가되는 것에 기초하여 상기 제 1 이상진단 모델의 기존 훈련 데이터와 현장에서 수집된 현장 데이터의 유사성을 판단하고,
상기 기존 훈련 데이터와 상기 현장 데이터의 유사성이 기준치 이하인 것에 따라 상기 제 1 이상진단 모델의 재학습을 위한 입력인자를 선택하고, 상기 기존 훈련 데이터 및 상기 현장 데이터에서 상기 선택된 입력인자를 이용하여 상기 제 1 이상진단 모델을 재학습함으로써 제 2 이상진단 모델을 생성하도록 구성되는,
이상진단 장치.
제 1 항에 있어서,
상기 제 1 이상진단 모델의 예측 능력은, 상기 기기에 대해 상기 제 1 이상진단 모델이 발생 예측을 하지 않았지만 상기 기기의 오류가 발생하는 경우들과, 상기 제 1 이상진단 모델이 발생 예측을 했지만 상기 기기에 오류가 발생하지 않은 경우들에 기초하여 평가되는,
이상진단 장치.
제 2 항에 있어서,
상기 프로세서는,
상기 유사성을 판단하는데 있어서,
상기 기존 훈련 데이터와 상기 현장 데이터를 통합하여 각 입력인자별로 클러스터링하고,
상기 클러스터링하는 단계에서 산출된 각각의 클러스터에서 기존 훈련 데이터의 비율과 현장 데이터의 비율을 산출하고,
각각의 클러스터에서 기존 훈련 데이터의 비율과 현장 데이터의 비율의 차이를 계산하고,
기존 훈련 데이터의 비율과 현장 데이터의 비율의 차이가 일정 값 이상인 클러스터의 입력인자는 기존 훈련 데이터와 현장 데이터의 유사성이 낮은 것으로 선정하는 동작을 수행하도록 추가로 구성되는,
이상진단 장치.
제 2 항에 있어서,
상기 프로세서는,
상기 유사성을 판단하는데 있어서,
상기 기존 훈련 데이터와 상기 현장 데이터를 동일 종류의 오류에 대한 기존 훈련 데이터와 현장 데이터로 분류하고,
동일 종류의 오류에 대해 분류된 기존 훈련 데이터와 현장 데이터의 입력인자 별 차이의 평균 및 표준편차를 계산하고,
상기 차이의 평균 및 표준편차에 기초하여 기존 훈련 데이터와 현장 데이터의 유사성을 판단하는 동작을 수행하도록 추가로 구성되는,
이상진단 장치.
제 1 항에 있어서,
상기 프로세서는,
상기 기존 훈련 데이터와 상기 현장 데이터의 유사성이 기준치 초과인 것에 따라 상기 제 1 이상진단 모델의 구조를 변경하고, 상기 변경된 제 1 이상진단 모델을 상기 현장 데이터 및 상기 기존 훈련 데이터를 이용하여 재학습함으로써 제 3 이상진단 모델을 생성하도록 추가로 구성되는,
이상진단 장치.
제 5 항에 있어서,
상기 제 1 이상진단 모델의 구조를 변경하는 것은 은닉층의 수, 가중치 값 및 바이어스 값 중 적어도 하나를 변경하는 것을 포함하는,
이상진단 장치.
제 5 항에 있어서,
상기 프로세서는,
상기 제 3 이상진단 모델을 생성한 이후에, 상기 제 3 이상진단 모델의 예측 능력을 평가하고,
상기 제 3 이상진단 모델의 예측 능력이 일정치 미만으로 평가되는 것에 기초하여 상기 기존 훈련 데이터와 상기 현장 데이터 중 훈련에 사용될 입력인자를 변경하고,
상기 기존 훈련 데이터와 상기 현장 데이터에서 상기 변경된 입력인자들로 상기 제 3 이상 진단 모델을 재학습하여 제 4 이상 진단 모델을 생성하는 동작을 수행하도록 추가로 구성되는,
이상진단 장치.
제 1 항에 있어서,
상기 프로세서는,
상기 제 1 이상진단 모델의 재학습을 위한 입력인자를 선택하는 것에 있어서,
상기 기존 훈련 데이터와 상기 현장 데이터 모두에 존재하는 입력인자들에 대하여 상기 기존 훈련 데이터와 상기 현장 데이터 간의 상관도를 입력인자별로 계산하는 제 1 동작,
상기 제 1 동작의 결과 상관도가 낮은 순서대로 일정 수의 입력인자를 상기 기존 훈련 데이터와 상기 현장 데이터에서 제외하는 제 2 동작을 수행하도록 추가로 구성되는,
이상진단 장치.
제 8 항에 있어서,
상기 프로세서는,
상기 제 2 동작을 수행한 이후, 상기 현장 데이터 중 제외된 입력인자와 상기 현장 데이터 중 상기 기존 훈련 데이터에는 없는 입력인자들 사이의 상관도를 계산하는 제 3 동작,
상기 제 2 동작의 결과 상관도가 높은 순서대로 일정 수의 입력인자를 제외하는 제 4 동작,
상기 현장 데이터 중, 상기 기존 훈련 데이터와 상기 현장 데이터 모두에 존재하는 입력인자들 중 상기 제 2 동작에서 제외된 입력인자를 뺀 나머지 입력인자들과 상기 현장 데이터 중 상기 기존 훈련 데이터에 없는 입력인자들과의 상관도를 계산하는 제 5 동작, 및
상기 제 5 동작의 결과 상관도가 낮은 순서대로 일정 수의 입력인자를 제외하는 제 6 동작을 수행하도록 추가로 구성되는,
이상진단 장치.
제 1 항에 있어서,
상기 제 1 이상진단 모델은 초기 이상진단 모델을 상기 기기가 설치된 현장의 데이터를 이용하여 재학습시킨 신경망 모델인,
이상진단 장치.
기기에 대한 이상진단 모델을 최적화하는 방법으로서,
제 1 이상진단 모델의 예측 능력을 평가하는 단계;
상기 제 1 이상진단 모델의 예측 능력이 일정치 미만으로 평가되는 것에 기초하여 상기 제 1 이상진단 모델의 기존 훈련 데이터와 현장에서 수집된 현장 데이터의 유사성을 판단하는 단계;
상기 기존 훈련 데이터와 상기 현장 데이터의 유사성이 기준치 이하인 것에 따라 상기 제 1 이상진단 모델의 재학습을 위한 입력인자를 선택하고, 상기 기존 훈련 데이터 및 상기 현장 데이터에서 상기 선택된 입력인자를 이용하여 상기 제 1 이상진단 모델을 재학습함으로써 제 2 이상진단 모델을 생성하는 단계를 포함하는,
이상진단 모델 최적화 방법.
제 11 항에 있어서,
상기 예측 능력을 평가하는 단계에서, 상기 예측 능력은, 상기 기기에 대해 상기 제 1 이상진단 모델이 발생 예측을 하지 않았지만 상기 기기의 오류가 발생하는 경우들과, 상기 제 1 이상진단 모델이 발생 예측을 했지만 상기 기기에 오류가 발생하지 않은 경우들에 기초하여 평가되는,
이상진단 모델 최적화 방법.
제 12 항에 있어서,
상기 유사성을 판단하는 단계는,
상기 기존 훈련 데이터와 상기 현장 데이터를 통합하여 각 입력인자별로 클러스터링하는 단계;
상기 클러스터링하는 단계에서 산출된 각각의 클러스터에서 기존 훈련 데이터의 비율과 현장 데이터의 비율을 산출하는 단계;
각각의 클러스터에서 기존 훈련 데이터의 비율과 현장 데이터의 비율의 차이를 계산하는 단계; 및
기존 훈련 데이터의 비율과 현장 데이터의 비율의 차이가 일정 값 이상인 클러스터의 입력인자는 기존 훈련 데이터와 현장 데이터의 유사성이 낮은 것으로 선정하는 단계를 포함하는,
이상진단 모델 최적화 방법.
제 12 항에 있어서,
상기 유사성을 판단하는 단계는,
상기 기존 훈련 데이터와 상기 현장 데이터를 동일 종류의 오류에 대한 기존 훈련 데이터와 현장 데이터로 분류하는 단계;
동일 종류의 오류에 대해 분류된 기존 훈련 데이터와 현장 데이터의 입력인자 별 차이의 평균 및 표준편차를 계산하는 단계; 및
상기 차이의 평균 및 표준편차에 기초하여 기존 훈련 데이터와 현장 데이터의 유사성을 판단하는 단계를 포함하는,
이상진단 모델 최적화 방법.
제 11 항에 있어서,
상기 기존 훈련 데이터와 상기 현장 데이터의 유사성이 기준치 초과인 것에 따라 상기 제 1 이상진단 모델의 구조를 변경하고, 상기 변경된 제 1 이상진단 모델을 상기 현장 데이터 및 상기 기존 훈련 데이터를 이용하여 재학습함으로써 제 3 이상진단 모델을 생성하는 단계를 더 포함하는,
이상진단 모델 최적화 방법.
제 15 항에 있어서,
상기 제 1 이상진단 모델의 구조를 변경하는 것은 은닉층의 수, 가중치 값 및 바이어스 값 중 적어도 하나를 변경하는 것을 포함하는,
이상진단 모델 최적화 방법.
제 15 항에 있어서,
상기 제 3 이상진단 모델을 생성하는 단계 이후에,
상기 제 3 이상진단 모델의 예측 능력을 평가하는 단계;
상기 제 3 이상진단 모델의 예측 능력이 일정치 미만으로 평가되는 것에 기초하여 상기 기존 훈련 데이터와 상기 현장 데이터 중 훈련에 사용될 입력인자를 변경하는 단계; 및
상기 기존 훈련 데이터와 상기 현장 데이터에서 상기 변경된 입력인자들로 상기 제 3 이상진단 모델을 재학습하여 제 4 이상 진단 모델을 생성하는 단계를 더 포함하는,
이상진단 모델 최적화 방법.
제 11 항에 있어서,
상기 제 1 이상진단 모델의 재학습을 위한 입력인자를 선택하는 것은,
상기 기존 훈련 데이터와 상기 현장 데이터 모두에 존재하는 입력인자들에 대하여 상기 기존 훈련 데이터와 상기 현장 데이터 간의 상관도를 입력인자별로 계산하는 제 1 단계;
상기 제 1 단계의 결과 상관도가 낮은 순서대로 일정 수의 입력인자를 상기 기존 훈련 데이터와 상기 현장 데이터에서 제외하는 제 2 단계;
상기 현장 데이터 중 제외된 입력인자와 상기 현장 데이터 중 상기 기존 훈련 데이터에는 없는 입력인자들 사이의 상관도를 계산하는 제 3 단계;
상기 제 2 단계의 결과 상관도가 높은 순서대로 일정 수의 입력인자를 제외하는 제 4 단계;
상기 현장 데이터 중, 상기 기존 훈련 데이터와 상기 현장 데이터 모두에 존재하는 입력인자들 중 상기 제 2 단계에서 제외된 입력인자를 뺀 나머지 입력인자들과 상기 현장 데이터 중 상기 기존 훈련 데이터에 없는 입력인자들과의 상관도를 계산하는 제 5 단계; 및
상기 제 5 단계의 결과 상관도가 낮은 순서대로 일정 수의 입력인자를 제외하는 제 6 단계를 포함하는,
이상진단 모델 최적화 방법.
제 11 항에 있어서,
상기 제 1 이상진단 모델은 초기 이상진단 모델을 상기 기기가 설치된 현장의 데이터를 이용하여 재학습시킨 신경망 모델인,
이상진단 모델 최적화 방법.
컴퓨터에 의해 실행될 때, 컴퓨터로 하여금 청구항 제 11 내지 19 항 중 어느 한 항의 방법을 실행하도록 구성된 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 기록매체.