WO2022203127A1

WO2022203127A1 - 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법 및 이를 위한 장치

Info

Publication number: WO2022203127A1
Application number: PCT/KR2021/009040
Authority: WO
Inventors: 박영현; 정종희
Original assignee: 에스케이플래닛 주식회사
Priority date: 2021-03-26
Filing date: 2021-07-14
Publication date: 2022-09-29
Also published as: US20230229918A1; KR20220134180A; CN116615724A

Abstract

본 발명의 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법은 탐지분류장치가 검사 대상으로부터 이상을 검출하기 위한 매개체에 대한 정보를 취득하는 단계와, 탐지분류장치가 매개체에 대한 정보로부터 복수의 특징 벡터를 포함하는 특징벡터행렬인 입력값을 생성하는 단계와, 탐지분류장치가 입력값에 대해 입력값을 모사하는 복원값을 생성하도록 학습된 탐지망을 통해 입력값을 모사하는 복원값을 도출하는 단계와, 탐지분류장치가 입력값과 복원값의 차이를 나타내는 복원 오차가 기 산출된 기준치 이상인지 여부를 판단하는 단계와, 탐지분류장치가 판단 결과, 복원오차가 기준치 미만이면, 입력값을 정상 데이터로 저장하는 단계를 포함한다.

Description

객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법 및 이를 위한 장치

본 발명은 신경망 모델에 대한 지속 학습을 위한 기술에 관한 것으로, 더욱 상세하게는, 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법 및 이를 위한 장치에 관한 것이다.

종래의 이상 탐지 또는 상태 분석 방법은 특정 환경에 대한 정상 범주의 데이터를 학습, 정상 범주에서 벗어나는 형태의 데이터가 입력되면 이상현상을 탐지 및 분석하는 형태로 구성 및 제공되어왔다. 해당 방법은 환경의 변화가 크게 발생하지 않는 상황에서는 한 번 학습된 후 이상 탐지 또는 상태 분류를 적절히 수행하지만 환경이 변할 경우 변화된 환경의 정상 범주 데이터를 이상 상황으로 오판하는 오류가 발생할 수 있다.

본 발명의 목적은 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법 및 이를 위한 장치를 제공함에 있다.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법은 탐지분류장치가 검사 대상으로부터 이상을 검출하기 위한 매개체에 대한 정보를 취득하는 단계와, 상기 탐지분류장치가 상기 소음으로부터 복수의 특징 벡터를 포함하는 특징벡터행렬인 입력값을 생성하는 단계와, 상기 탐지분류장치가 상기 입력값에 대해 입력값을 모사하는 복원값을 생성하도록 학습된 탐지망을 통해 상기 입력값을 모사하는 복원값을 도출하는 단계와, 상기 탐지분류장치가 상기 입력값과 상기 복원값의 차이를 나타내는 복원 오차가 기 산출된 기준치 이상인지 여부를 판단하는 단계와, 상기 탐지분류장치가 상기 판단 결과, 상기 복원오차가 상기 기준치 미만이면, 상기 입력값을 정상 데이터로 저장하는 단계를 포함한다.

상기 복원값을 도출하는 단계는 상기 탐지분류장치가 상기 입력값에 대해 상태 이상의 범주에 속할 확률을 산출하도록 학습된 분류망을 통해 상기 입력값이 상태 이상의 범주에 속할 확률을 나타내는 분류값을 산출하는 단계를 더 포함한다.

상기 방법은 상기 복원 오차가 기 산출된 기준치를 초과하는지 여부를 판단하는 단계 후, 상기 탐지분류장치가 상기 판단 결과, 상기 복원오차가 상기 기준치 이상이면, 상기 분류값이 기 설정된 임계치 이상인지 여부를 판별하는 단계와, 상기 탐지분류장치가 상기 판별 결과, 상기 분류값이 기 설정된 임계치 이상이면, 상기 탐지부가 상기 입력값을 범주 데이터로 저장하는 단계를 더 포함한다.

상기 방법은 상기 탐지분류장치가 모델 갱신이 요구되는 이벤트의 발생을 감지하는 단계와, 상기 탐지분류장치가 상기 이벤트의 발생을 감지함에 따라 기 설정된 수 이상의 정상 데이터가 저장되어 있으면, 상기 탐지망을 저장된 정상 데이터를 이용하여 학습시키거나, 기 설정된 수 이상의 범주 데이터가 저장되어 있으면, 상기 분류망을 저장된 범주 데이터를 이용하여 학습시키는 단계를 더 포함한다.

상기 학습시키는 단계는 상기 탐지분류장치가 탐지망을 초기화하는 단계와, 상기 탐지분류장치가 학습용 입력값으로 상기 저장된 정상 데이터를 상기 초기화된 탐지망에 입력하는 단계와, 상기 탐지분류장치가 상기 학습용 입력값으로부터 선택적으로 압축되거나, 압축되지 않은 잠재값을 산출하는 단계와, 상기 탐지분류장치가 상기 잠재값으로부터 상기 복원값을 산출하는 단계와, 상기 탐지분류장치가 상기 복원값과 학습용 입력값과의 차이인 손실을 산출하는 단계와, 상기 탐지분류장치가 상기 손실이 최소가 되도록 상기 탐지망의 파라미터를 갱신하는 최적화를 수행하는 단계를 포함한다.

상기 방법은 상기 학습시키는 단계 후, 상기 탐지분류장치가 수학식 θ=μ+(k×σ)에 따라 상기 기준치를 산출하는 단계를 더 포함하며, 상기 μ는 상기 탐지망의 학습에 사용된 복수의 학습용 입력값과 복수의 학습용 입력값에 대응하는 복수의 복원값 간의 평균제곱손실의 평균이고, 상기 σ는 상기 복수의 학습용 입력값과 상기 복수의 학습용 입력값에 대응하는 상기 복수의 복원값 간의 평균제곱손실의 표준 편차이고, 상기 k는 상기 표준편차에 대한 가중치인 것을 특징으로 한다.

상기 학습시키는 단계는 상기 탐지분류장치가 분류망을 초기화하는 단계와, 상기 탐지분류장치가 상기 저장된 범주 데이터의 범주에 해당하는 레이블을 설정함으로써 학습용 입력값을 마련하는 단계와 상기 탐지분류장치가 상기 학습용 입력값을 상기 초기화된 분류망에 입력하는 단계와 상기 탐지분류장치가 복수의 계층 간 가중치가 적용되는 연산을 수행하여 상기 학습용 입력값으로부터 분류값을 산출하는 단계와, 상기 탐지분류장치가 상기 분류값과 상기 레이블의 차이를 나타내는 분류 손실을 산출하는 단계와, 상기 학습부가 상기 분류 손실이 최소가 되도록 상기 분류망의 파라미터를 갱신하는 최적화를 수행하는 단계를 포함한다.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 장치는 검사 대상으로부터 이상을 검출하기 위한 매개체에 대한 정보로부터 복수의 특징 벡터를 포함하는 특징벡터행렬인 입력값을 생성하는 데이터처리부와, 상기 입력값에 대해 입력값을 모사하는 복원값을 생성하도록 학습된 탐지망을 통해 상기 입력값을 모사하는 복원값을 도출하고, 상기 입력값과 상기 복원값의 차이를 나타내는 복원 오차가 기 산출된 기준치 이상인지 여부를 판단하여 상기 복원오차가 상기 기준치 미만이면, 상기 입력값을 정상 데이터로 저장하는 탐지부를 포함한다.

상기 탐지부는 상기 입력값에 대해 상태 이상의 범주에 속할 확률을 산출하도록 학습된 분류망을 통해 상기 입력값이 상태 이상의 범주에 속할 확률을 나타내는 분류값을 산출하는 것을 특징으로 한다.

상기 탐지부는 상기 복원오차가 상기 기준치 이상이면, 상기 분류값이 기 설정된 임계치 이상인지 여부를 판별하고, 상기 분류값이 기 설정된 임계치 이상이면, 상기 입력값을 범주 데이터로 저장하는 것을 특징으로 한다.

상기 장치는 모델 갱신이 요구되는 이벤트의 발생을 감지하고, 상기 이벤트의 발생을 감지함에 따라 기 설정된 수 이상의 정상 데이터가 저장되어 있으면, 상기 탐지망을 저장된 정상 데이터를 이용하여 학습시키거나, 기 설정된 수 이상의 범주 데이터가 저장되어 있으면, 상기 분류망을 저장된 범주 데이터를 이용하여 학습시키는 학습부를 더 포함한다.

상기 학습부는 탐지망을 초기화하고, 학습용 입력값으로 상기 저장된 정상 데이터를 상기 초기화된 탐지망에 입력한 후, 상기 탐지망의 인코더가 상기 학습용 입력값으로부터 선택적으로 압축되거나, 압축되지 않은 잠재값을 산출하고, 상기 탐지망의 디코더가 상기 잠재값으로부터 상기 복원값을 산출하면, 상기 복원값과 학습용 입력값과의 차이인 손실을 산출하고, 상기 손실이 최소가 되도록 상기 탐지망의 파라미터를 갱신하는 최적화를 수행하는 것을 특징으로 한다.

상기 학습부는 수학식 θ=μ+(k×σ)에 따라 상기 기준치를 산출하고, 상기 μ는 상기 탐지망의 학습에 사용된 복수의 학습용 입력값과 복수의 학습용 입력값에 대응하는 복수의 복원값 간의 평균제곱손실의 평균이고, 상기 σ는 상기 복수의 학습용 입력값과 상기 복수의 학습용 입력값에 대응하는 상기 복수의 복원값 간의 평균제곱손실의 표준 편차이고, 상기 k는 상기 표준편차에 대한 가중치인 것을 특징으로 한다.

상기 학습부는 상기 분류망을 초기화하고, 상기 저장된 범주 데이터의 범주에 해당하는 레이블을 설정함으로써 학습용 입력값을 마련하고, 상기 학습용 입력값을 초기화된 분류망에 입력한 후, 상기 분류망이 복수의 계층 간 가중치가 적용되는 연산을 수행하여 상기 학습용 입력값으로부터 분류값을 산출하면, 상기 분류값과 상기 레이블의 차이를 나타내는 분류 손실을 산출하고, 상기 분류 손실이 최소가 되도록 상기 분류망의 파라미터를 갱신하는 최적화를 수행하는 것을 특징으로 한다.

상기 학습부는 인코더(Encoder), 디코더(Decoder)를 포함하는 오토인코더(Autoencoder) 모델, 인코더, 디코더, 분별자(Discriminator)를 각각 단일로 포함하는 적대적생성신경망(Generative Adversarial Network), 단일 또는 복수의 인코더, 디코더, 분별자를 선택적으로 포함하는 생성형 인공신경망 중 어느 하나를 포함하는 것을 특징으로 한다.

상기 학습부는 입력값과 복원값의 평균제곱 손실을 생성하거나, 복원 오차를 이용하고, 상기 분별자를 이용하는 경우, 실제 입력과 생성 입력에 대한 분별자 출력의 평균제곱 손실을 분별 오차로 이용하고, 사용자 입력이 입력된 경우, 복원 오차와 분별 오차를 상기 사용자 입력에 따라 설정하는 것을 특징으로 한다.

본 발명은 본 발명은 지속적으로 학습 데이터를 수집하고, 모델을 갱신함으로써 환경의 변화에도 적응적으로 상태 이상을 검출할 수 있다.

도 1은 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류를 위한 장치의 구성을 설명하기 위한 블록도이다.

도 2는 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류를 위한 장치의 세부적인 구성을 설명하기 위한 블록도이다.

도 3은 본 발명의 실시예에 따른 본 발명의 실시예에 따른 탐지망의 구성을 설명하기 위한 도면이다.

도 4는 본 발명의 실시예에 따른 본 발명의 실시예에 따른 분류망의 구성을 설명하기 위한 도면이다.

도 5는 본 발명의 일 실시예에 따른 입력값을 생성하는 방법을 설명하기 위한 흐름도이다.

도 6은 본 발명의 일 실시예에 따른 입력값을 생성하는 방법을 설명하기 위한 도면이다.

도 7은 본 발명의 실시예에 따른 객체 이상 탐지를 위한 탐지망에 대한 학습 방법을 설명하기 위한 흐름도이다.

도 8은 본 발명의 실시예에 따른 상태 분류를 위한 분류망에 대한 학습 방법을 설명하기 위한 흐름도이다.

도 9는 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법을 설명하기 위하 흐름도이다.

도 10은 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법을 설명하기 위한 흐름도이다.

본 발명의 과제 해결 수단의 특징 및 이점을 보다 명확히 하기 위하여, 첨부된 도면에 도시된 본 발명의 특정 실시 예를 참조하여 본 발명을 더 상세하게 설명한다.

다만, 하기의 설명 및 첨부된 도면에서 본 발명의 요지를 흐릴 수 있는 공지 기능 또는 구성에 대한 상세한 설명은 생략한다. 또한, 도면 전체에 걸쳐 동일한 구성 요소들은 가능한 한 동일한 도면 부호로 나타내고 있음에 유의하여야 한다.

이하의 설명 및 도면에서 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위한 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.

또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하기 위해 사용하는 것으로, 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 뿐, 상기 구성요소들을 한정하기 위해 사용되지 않는다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제2 구성요소는 제1 구성요소로 명명될 수 있고, 유사하게 제1 구성요소도 제2 구성요소로 명명될 수 있다.

더하여, 어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급할 경우, 이는 논리적 또는 물리적으로 연결되거나, 접속될 수 있음을 의미한다. 다시 말해, 구성요소가 다른 구성요소에 직접적으로 연결되거나 접속되어 있을 수 있지만, 중간에 다른 구성요소가 존재할 수도 있으며, 간접적으로 연결되거나 접속될 수도 있다고 이해되어야 할 것이다.

또한, 본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, 본 명세서에서 기술되는 "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

또한, 명세서에 기재된 "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.

또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사어는 본 발명을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.

아울러, 본 발명의 범위 내의 실시 예들은 컴퓨터 실행가능 명령어 또는 컴퓨터 판독가능 매체에 저장된 데이터 구조를 가지거나 전달하는 컴퓨터 판독가능 매체를 포함한다. 이러한 컴퓨터 판독가능 매체는, 범용 또는 특수 목적의 컴퓨터 시스템에 의해 액세스 가능한 임의의 이용 가능한 매체일 수 있다. 예로서, 이러한 컴퓨터 판독가능 매체는 RAM, ROM, EPROM, CD-ROM 또는 기타 광 디스크 저장장치, 자기 디스크 저장장치 또는 기타 자기 저장장치, 또는 컴퓨터 실행가능 명령어, 컴퓨터 판독가능 명령어 또는 데이터 구조의 형태로 된 소정의 프로그램 코드 수단을 저장하거나 전달하는 데에 이용될 수 있고, 범용 또는 특수 목적 컴퓨터 시스템에 의해 액세스 될 수 있는 임의의 기타 매체와 같은 물리적 저장 매체를 포함할 수 있지만, 이에 한정되지 않는다.

이하의 설명 및 특허 청구 범위에서, "네트워크"는 컴퓨터 시스템들 및/또는 모듈들 간의 전자 데이터를 전송할 수 있게 하는 하나 이상의 데이터 링크로서 정의된다. 정보가 네트워크 또는 다른 (유선, 무선, 또는 유선 또는 무선의 조합인) 통신 접속을 통하여 컴퓨터 시스템에 전송되거나 제공될 때, 이 접속은 컴퓨터-판독가능매체로서 이해될 수 있다. 컴퓨터 판독가능 명령어는, 예를 들면, 범용 컴퓨터 시스템 또는 특수 목적 컴퓨터 시스템이 특정 기능 또는 기능의 그룹을 수행하도록 하는 명령어 및 데이터를 포함한다. 컴퓨터 실행가능 명령어는, 예를 들면, 어셈블리어, 또는 심지어는 소스코드와 같은 이진, 중간 포맷 명령어일 수 있다.

아울러, 본 발명은 퍼스널 컴퓨터, 랩톱 컴퓨터, 핸드헬드 장치, 멀티프로세서 시스템, 마이크로프로세서-기반 또는 프로그램 가능한 가전제품(programmable consumer electronics), 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 모바일 전화, PDA, 페이저(pager) 등을 포함하는 다양한 유형의 컴퓨터 시스템 구성을 가지는 네트워크 컴퓨팅 환경에서 적용될 수 있다. 본 발명은 또한 네트워크를 통해 유선 데이터 링크, 무선 데이터 링크, 또는 유선 및 무선 데이터 링크의 조합으로 링크된 로컬 및 원격 컴퓨터 시스템 모두가 태스크를 수행하는 분산형 시스템 환경에서 실행될 수 있다. 분산형 시스템 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치에 위치될 수 있다.

먼저, 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류를 위한 장치에 대해서 설명하기로 한다. 도 1은 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류를 위한 장치의 구성을 설명하기 위한 블록도이다. 도 2는 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류를 위한 장치의 세부적인 구성을 설명하기 위한 블록도이다. 도 1을 참조하면, 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류를 위한 장치(10, 이하, 탐지분류장치로 축약함)는 오디오부(11), 입력부(12), 표시부(13), 저장부(14) 및 제어부(15)를 포함한다.

오디오부(11)는 본 발명의 실시예에 따른 이상을 검출하기 위한 매개체인 소리와 같은 오디오 신호를 수집하기 위한 마이크(MIK)를 포함한다. 즉, 오디오부(11)는 마이크(MIK)를 통해 입력되는 소리, 예컨대, 소음과 같은 오디오 신호를 제어부(15)로 전달한다. 또한, 오디오부(11)는 오디오 신호를 출력하기 위한 스피커(SPK)를 더 포함한다. 오디오부(11)는 제어부(15)의 제어에 따라 오디오 신호를 스피커(SPK)를 통해 출력할 수 있다. 한편 도면에서는 탐지분류장치(10)가 오디오부(11)만을 포함하는 것으로 도시되고 있으나, 탐지분류장치(10)는 오디오부(11)로 한정하지 않고 오디오부(11)뿐 만 아니라 각종 센서를 포함하는 측정부(미도시)를 포함할 수 있다. 즉 탐지분류장치(10)는 이미지센서, 미세먼지센서 등 다양한 센서를 포함하여 검사 대상으로부터 이상을 검출하기 위한 매개체를 소음에 한정하지 않고 이미지, 미세먼지 등으로 확장할 수 있다.

입력부(12)는 탐지분류장치(10)를 제어하기 위한 사용자의 키 조작을 입력 받고 입력 신호를 생성하여 제어부(15)로 전달한다. 입력부(12)는 전원 on/off를 위한 전원 키, 숫자 키, 방향키 중 어느 하나를 포함할 수 있으며, 탐지분류장치(10)의 일면에 소정의 기능키로 형성될 수 있다. 표시부(13)가 터치스크린으로 이루어진 경우, 입력부(12)의 각 종 키들의 기능이 표시부(13)에서 이루어질 수 있으며, 터치스크린만으로 모든 기능을 수행할 수 있는 경우, 입력부(12)는 생략될 수도 있다.

표시부(13)는 탐지분류장치(10)의 메뉴, 입력된 데이터, 기능 설정 정보 및 기타 다양한 정보를 사용자에게 시각적으로 제공한다. 표시부(13)는 탐지분류장치(10)의 부팅 화면, 대기 화면, 메뉴 화면 등의 각종 화면을 출력하는 기능을 수행한다. 이러한 표시부(13)는 액정표시장치(LCD, Liquid Crystal Display), 유기 발광 다이오드(OLED, Organic Light Emitting Diodes), 능동형 유기 발광 다이오드(AMOLED, Active Matrix Organic Light Emitting Diodes) 등으로 형성될 수 있다. 한편, 표시부(13)는 터치스크린으로 구현될 수 있다. 이러한 경우, 표시부(13)는 터치센서를 포함하며, 제어부(15)는 터치센서를 통해 사용자의 터치 입력을 감지할 수 있다. 터치센서는 정전용량 방식(capacitive overlay), 압력식, 저항막 방식(resistive overlay), 적외선 감지 방식(infrared beam) 등의 터치 감지 센서로 구성되거나, 압력 감지 센서(pressure sensor)로 구성될 수도 있다. 상기 센서들 이외에도 물체의 접촉 또는 압력을 감지할 수 있는 모든 종류의 센서 기기가 본 발명의 터치센서로 이용될 수 있다. 터치센서는 사용자의 터치 입력을 감지하고, 감지 신호를 발생시켜 제어부(15)로 전송한다. 이러한 감지 신호에는 사용자가 터치를 입력한 좌표 데이터가 포함될 수 있다. 사용자가 터치 위치 이동 동작을 입력한 경우에 터치센서는 터치 위치 이동 경로의 좌표 데이터를 포함한 감지 신호를 발생시켜 제어부(15)로 전송할 수 있다.

저장부(14)는 탐지분류장치(10)의 동작에 필요한 프로그램 및 데이터를 저장하는 역할을 수행하며, 프로그램 영역과 데이터 영역으로 구분될 수 있다. 프로그램 영역은 탐지분류장치(10)의 전반적인 동작을 제어하는 프로그램 및 탐지분류장치(10)를 부팅시키는 운영체제(OS, Operating System), 응용 프로그램 등을 저장할 수 있다. 데이터 영역은 탐지분류장치(10)의 사용에 따라 발생하는 데이터가 저장되는 영역이다. 또한, 저장부(14)는 탐지분류장치(10)의 동작에 따라 발생되는 각 종 데이터 등을 저장할 수 있다.

제어부(15)는 탐지분류장치(10)의 전반적인 동작 및 탐지분류장치(10)의 내부 블록들 간 신호 흐름을 제어하고, 데이터를 처리하는 데이터 처리 기능을 수행할 수 있다. 이러한 제어부(15)는 CPU(Central Processing Unit), APU(Application Processing Unit), APU(Accelerated Processing Unit), GPU(graphic processing unit), NPU(Neural Processing Unit) 등이 될 수 있다.

도 2를 참조하면, 제어부(15)는 학습부(100), 데이터처리부(200), 탐지부(300) 및 통지부(400)를 포함한다.

학습부(100)는 본 발명의 실시예에 따른 학습 모델(Deep Learning Model: DLM)인 탐지망(DN: Detection Network) 및 분류망(CN: Classification Network)을 학습(deep learning)시키기 위한 것이다. 학습이 완료된 탐지망(DN) 및 분류망(CN)은 탐지부(300)에 전달되고, 탐지부(300)에서 실행된다.

데이터처리부(200)는 오디오부(11)로부터 수신되는 소음으로부터 복수의 특징 벡터를 포함하는 특징벡터행렬인 입력값을 생성한다. 생성된 입력값은 탐지부(300)에 입력된다. 여기서 오디오부(11)를 포괄하는 측정부가 구비된 경우, 데이터처리부(200)는 측정부로부터 수신된 이상을 검출하기 위한 매개체에 대한 정보를 이용하여 특징벡터행령인 입력값을 생성할 수 있다.

탐지부(300)는 기본적으로, 학습이 완료된 탐지망(DN)을 이용하여 입력값으로 변환된 소음을 분석하여 해당 소음을 발산하는 검사 대상의 이상 여부를 탐지하기 위한 것이다. 특히, 탐지부(300)는 환경 변화에 따라 모델을 갱신할 때 사용하는 학습용 입력값으로 이용할 수 있도록 입력값에 대한 분석 결과에 따라 정상 상태를 나타내는 정상 데이터 혹은 이상 상태의 범주에 속하는 범주 데이터로 분류하여 해당 데이터를 저장부(14)에 저장할 수 있다.

통지부(400)는 탐지부(300)가 검사 대상의 이상을 탐지하면, 탐지된 이상 상태가 알려지도록 오디오부(11)의 스피커(SPK)를 통해 경고음을 출력하고, 표시부(13)를 통해 경고 메시지를 출력한다.

전술한 학습부(100), 데이터처리부(200), 탐지부(300) 및 통지부(400)를 포함하는 제어부(13)의 동작에 대해서는 아래에서 더 상세하게 설명될 것이다.

다음으로, 본 발명의 실시예에 따른 탐지망(DN)의 구성에 대해서 설명하기로 한다. 도 3은 본 발명의 실시예에 따른 본 발명의 실시예에 따른 탐지망의 구성을 설명하기 위한 도면이다. 도 3을 참조하면, 탐지망(DN)은 인코더(encoder: EN) 및 디코더(decoder: DE)를 포함한다.

이러한 인코더(EN) 및 디코더(DE)를 포함하는 탐지망(DN)은 복수의 계층을 포함하며, 복수의 계층은 복수의 연산을 포함한다. 또한, 복수의 계층 간은 가중치(w: weight)로 연결된다. 어느 하나의 계층의 연산 결과는 가중치가 적용되어 다음 계층 노드의 입력이 된다. 즉, 탐지망(DN)의 어느 한 계층은 이전 계층으로부터 가중치를 적용한 값을 입력 받고, 이에 대한 연산을 수행하고, 그 연산 결과를 다음 계층의 입력으로 전달한다.

인코더(EN)는 입력값(x)이 입력되면, 입력값(x)에 대해 선택적으로 차원을 축소하거나, 차원의 축소 없이 복수의 계층 간의 가중치가 적용되는 복수의 연산을 수행하여 잠재 벡터(Latent Vector)인 잠재값(z)을 산출하여 출력한다. 디코더(DE)는 잠재값(z)에 대해 선택적으로 차원을 축소하거나, 차원의 축소 없이 복수의 계층 간의 가중치가 적용되는 복수의 연산을 수행하여 복원값(x')을 생성한다. 즉, 입력값은 복수의 특징벡터를 포함하는 특징벡터행렬이며, 2차원(특징 벡터의 원소의 수 Ⅹ 특징 벡터의 수)의 데이터이다. 만약, 완전연결층과 같은 계층을 사용하는 경우, 2차원에서 1차원으로 차원이 축소될 수 있다. 하지만, 본 발명은 이러한 선택적으로 차원을 축소하거나, 차원의 축소 없이 입력값(x)으로부터 잠재값(z) 및 복원값(x')을 생성한다.

인코더(EN)는 확장층(Enlarge Layer: EL) 및 적어도 하나의 컨벌루션층(Convolution Layer: CL)을 포함한다. 인코더(EN)의 컨벌루션층(CL) 사이에 풀링층(Pooling Layer: PL)이 더 포함될 수 있다. 디코더(DE)는 적어도 하나의 컨벌루션층(Convolution Layer: CL)을 포함한다. 디코더(DE)의 컨벌루션층(CL) 사이에 풀링층(PL)이 더 포함될 수 있다.

확장층(EL)은 입력값(x)에 대해 선택적으로 차원을 축소하거나, 차원의 축소 없이 연산을 수행하기 위해 입력값 보다 확장된 크기의 특징 지도(feature map)를 생성한다. 컨벌루션층(CL)은 컨벌루션(Convolution) 연산 및 활성화함수에 의한 연산을 수행하여 특징 지도를 생성한다. 풀링층(PL)은 최대 풀링(Max Pooling) 연산을 수행하여 특징 지도를 생성한다.

인코더(EN)의 마지막 계층이 생성한 특징 지도가 잠재값(z)이며, 디코더(DE)의 마지막 계층이 생성한 특징 지도가 복원값(x')이 된다.

다음으로, 본 발명의 실시예에 따른 분류망(CN)의 구성에 대해서 설명하기로 한다. 도 4는 본 발명의 실시예에 따른 본 발명의 실시예에 따른 분류망의 구성을 설명하기 위한 도면이다.

도 4를 참조하면, 분류망(CN)은 입력층(input layer: IL), 교번으로 반복되는 적어도 한 쌍의 컨벌루션층(convolution layer: CL)과 풀링층(pooling layer: PL), 적어도 하나의 완전연결층(fully-connected layer: FL) 및 출력층(output layer: OL)을 포함할 수 있다. 도 4에 도시된 바와 같이, 본 발명의 일 실시예에 따른 심층신경망(400)은 순차로 입력층(IL), 제1 컨볼루션층(CL1), 제1 풀링층(PL1), 제2 컨볼루션층(CL2), 제2 풀링층(PL2), 완전연결층(FL) 및 출력층(OL)을 포함한다.

컨볼루션층(CL1, CL2) 및 풀링층(PL1, PL2)은 적어도 하나의 특징맵(FM: Feature Map)으로 구성된다. 특징맵(FM)은 이전 계층의 연산 결과에 대해 가중치(w)를 적용한 값을 입력 받고, 입력 받은 값에 대한 연산을 수행한 결과로 도출된다. 이러한 가중치(w)는 소정 크기의 가중치 행렬인 필터 혹은 커널(w)을 통해 적용될 수 있다.

입력층(IL)에 입력값(소정 크기의 행렬 혹은 벡터열)이 입력되면, 제1 컨볼루션층(CL1)은 입력층(IL)의 입력값에 대해 필터 혹은 커널(w)를 이용한 컨벌루션(convolution) 연산 및 활성화함수에 의한 연산을 수행하여 적어도 하나의 제1 특징맵(FM1)을 도출한다. 이어서, 제1 풀링층(PL1)은 컨볼루션층(CL)의 적어도 하나의 제1 특징맵(FM1)에 대해 필터 혹은 커널(w)을 이용한 풀링(pooling 또는 sub-sampling) 연산을 수행하여 적어도 하나의 제2 특징맵(FM2)을 도출한다. 이어서, 제2 컨볼루션층(CL2)은 제2 특징맵(FM2)에 대해 필터 혹은 커널(w)를 이용한 컨벌루션(convolution) 연산 및 활성화함수에 의한 연산을 수행하여 적어도 하나의 제3 특징맵(FM3)을 도출한다. 이어서, 제2 풀링층(PL2)은 제2 컨볼루션층(CL2)의 적어도 하나의 제3 특징맵(FM3)에 대해 필터 혹은 커널(w)을 이용한 풀링(pooling 또는 sub-sampling) 연산을 수행하여 적어도 하나의 제4 특징맵(FM4)을 도출한다.

완결연결층(FL)은 복수의 연산노드로 이루어진다. 완결연결층(FL)의 복수의 연산노드는 제2 풀링층(PL2)의 적어도 하나의 제4 특징맵(FM4)에 대해 활성화함수에 의한 연산을 통해 복수의 연산값을 산출한다.

출력층(OL)은 하나 이상의 출력노드를 포함한다. 완결연결층(FL)의 복수의 연산노드(f1 내지 fx) 각각은 가중치(w: weight)를 가지는 채널로 출력층(OL)의 출력노드와 연결된다. 다른 말로, 복수의 연산노드의 복수의 연산값은 가중치가 적용되어 출력노드에 입력된다. 이에 따라, 출력층(OL)의 출력노드는 완결연결층(FL)의 가중치가 적용되는 복수의 연산값에 대해 활성화함수에 의한 연산을 통해 분류값을 산출한다. 분류값은 입력값이 출력노드에 대응하는 범주에 속한 데이터일 확률을 나타낸다.

전술한 컨벌루션층(CL), 완결연결층(FL) 및 출력층(OL)에서 사용되는 활성화함수는 시그모이드(Sigmoid), 하이퍼볼릭탄젠트(tanh: Hyperbolic tangent), ELU(Exponential Linear Unit), ReLU(Rectified Linear Unit), Leakly ReLU, Maxout, Minout, Softmax 등을 예시할 수 있다. 컨벌루션층(CL), 완결연결층(FL) 및 출력층(OL)에 이러한 활성화함수 중 어느 하나를 선택하여 적용할 수 있다.

정리하면, 전술한 바와 같이, 분류망(CN)은 복수의 계층을 포함한다. 또한, 분류망(CN)의 복수의 계층은 복수의 연산을 포함한다. 복수의 계층 각각의 연산 결과는 가중치가 적용되어 다음 계층으로 전달된다. 이에 따라, 심층신경망(400)은 입력값에 대해 복수의 계층의 가중치가 적용되는 복수의 연산을 수행하여 분류값을 산출하고, 산출된 분류값을 출력할 수 있다.

다음으로, 본 발명의 실시예에 따른 입력값은 소음 등의 오디오 신호이다. 이러한 입력값은 오디오 신호 자체 혹은 오디오 신호에서 특징을 검출한 신호가 될 수 있으나, 이에 한정하지 않는다. 그러면, 예시적으로 입력값을 생성하는 방법에 대해서 설명하기로 한다. 도 5는 본 발명의 일 실시예에 따른 입력값을 생성하는 방법을 설명하기 위한 흐름도이다. 도 6은 본 발명의 일 실시예에 따른 입력값을 생성하는 방법을 설명하기 위한 도면이다.

도 5 및 도 6을 참조하면, 오디오부(11)는 S110 단계에서 마이크(MIC)를 통해 검사 대상으로부터 발생하는 소음을 취득하여 제어부(15)의 데이터처리부(200)에 제공한다. 여기서, 검사 대상으로부터 발생하는 소음은 차량의 엔진으로부터 발생하는 소음, 차량 주행 중 차량의 바퀴와 노면의 마찰에 의해 발생하는 소음, 공장의 생산 설비로부터 발생하는 소음, 가전 제품, 예컨대, 냉장고의 후면에서 발생하는 소음 등을 예시할 수 있다.

데이터처리부(200)는 S120 단계에서 오디오부(11)를 통해 지속적으로 입력되는 소음(n)에 대해 소정 시간 길이(t, 예컨대, 20~40ms)를 가지는 슬라이딩 윈도우(w)를 적용하여, 슬라이딩 윈도우(w) 단위로 멜 스케일(mel-scaled)에 따른 소음(n)의 강도와 주파수 분포를 나타내는 멜분광파형도(s: mel-spectrogram)를 추출한다.

그런 다음, 데이터처리부(200)는 S130 단계에서 추출된 멜분광파형도(s)에 대해 시간 평균을 산출하여 멜분광파형도(s)를 MFCC(Mel-Frequency Cepstral Coefficient)로 압축하여 특징 벡터(v)를 생성한다.

데이터처리부(200)는 S140 단계에서 소정 수의 특징 벡터(v)가 생성되어 특징벡터행렬을 구성할 수 있는지 여부를 판단한다. 예컨대, 특징벡터행렬은 3개의 특징 벡터(v)로 이루어진다고 가정한다.

S140 단계의 판단 결과, 소정 수의 특징 벡터(v)가 생성되지 않은 경우, 데이터처리부(200)는 S150 단계로 진행하여 버퍼에 생성된 특징벡터(v)를 입력한다. 여기서, 버퍼는 특징벡터행렬을 구성하는 특징벡터(v)의 수(예컨대, 3개)와 동일한 크기를 가진다. 이러한 버퍼는 큐(Queue) 형식의 버퍼이며, 가장 처음 입력된 특징벡터(v)가 가장 먼저 추출된다.

반면, S140 단계의 판단 결과, 소정 수의 특징 벡터(v)가 생성된 경우, 데이터처리부(200)는 S160 단계로 진행하여

생성된 소정 수의 특징 벡터(v)를 행렬 형식으로 결합하여 특징벡터행렬(M)을 생성한다. 예컨대, 도 5에 도시된 바와 같이, 순차로 3개의 특징 벡터, 즉, 제1, 제2 및 제3 특징벡터(v1, v2, v3)를 결합하여 제1 특징벡터행렬(M1)을 생성할 수 있다.

다음으로, 데이터처리부(200)는 S170 단계에서 버퍼에서 가장 처음 입력된 특징 벡터를 추출한다. 예컨대, 순차로 3개의 특징 벡터(v1, v2, v3)를 결합하여 제1 특징벡터행렬(M1)을 생성하였다면, 제1 특징벡터(v1)가 추출된다.

그런 다음, 전술한 S120 단계 내지 S160 단계를 반복한다. 이에 따라, 예컨대, 도 5에 도시된 바와 같이, 새로운 특징벡터, 즉, 제4 특징벡터(v4)가 생성되고, 3개의 특징벡터, 즉, 제2, 제3 및 제4 특징벡터(v2, v3, v4)를 결합하여 제2 특징벡터행렬(M2)을 생성할 수 있다.

데이터처리부(200)는 전술한 바와 같은 방법에 따라 생성된 특징벡터행렬(M)을 입력값(x)으로 탐지부(300)에 제공할 수 있다.

다음으로, 본 발명의 실시예에 따른 탐지망(DN) 및 분류망(CN)에 대한 학습 방법에 대해 설명하기로 한다. 먼저, 본 발명의 실시예에 따른 탐지망(DN)에 대한 학습 방법에 대해 설명하기로 한다. 도 7은 본 발명의 실시예에 따른 객체 이상 탐지를 위한 탐지망에 대한 학습 방법을 설명하기 위한 흐름도이다.

도 7을 참조하면, 학습부(100)는 S210 단계에서 탐지망(DN)을 초기화한다. 이때, 학습부(100)는 탐지망(DN)의 파라미터, 즉, 가중치(w)를 초기화한다. 초기화를 위해 Xavier 초기화기(initializer)를 사용할 수 있다.

초기화가 완료되면, 학습부(100)는 S220 단계에서 초기화된 탐지망(DN)에 학습을 위해 사용되는 입력값(x), 즉, 학습용 입력값(x)을 마련한다. 본 발명의 실시예에서 초기에 사용되는 학습용 입력값(x)은 검사 대상이 정상인 경우에 검사 대상에서 발생한 소음(n)으로부터 생성된 특징벡터행렬을 의미한다. 이러한 학습용 입력값(x)은 앞서, 도 5 및 도 6을 참조하여 설명된 입력값(x)을 생성하는 방법과 동일하다. 특히, S220 단계에서 환경의 변화에 따라 탐지망(DN)을 갱신할 때 사용되는 학습용 입력값(x)은 저장부(14)에 저장된 정상 데이터를 사용하며, 이러한 정상 데이터를 저장하는 방법에 대해서는 아래에서 더 상세하게 설명될 것이다.

다음으로, 학습부(100)는 S230 단계에서 초기화된 탐지망(DN)에 학습용 입력값(x)을 입력한다. 그러면, 탐지망(DN)은 S240 단계에서 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 학습용 입력값(x)을 모사하는 복원값(x')을 생성한다. 보다 자세히 설명하면, 탐지망(DN)의 인코더(EN)는 학습용 입력값(x)에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 선택적으로 차원을 축소하거나, 차원의 축소 없이 학습용 입력값(x)에 대한 잠재값(z)을 산출한다. 그리고 탐지망(DN)의 디코더(DE)는 인코더(EN)가 산출한 잠재값(z)에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 인코더(EN)에서 차원이 축소가 이루어진 경우 차원을 확장하고, 그렇지 않은 경우 차원의 확장 없이 복원값(x')을 산출한다.

그런 다음, 학습부(100)는 S250 단계에서 다음의 수학식 1에 따라 복원 손실을 산출한다.

수학식 1에서 E( )는 인코더(EN)의 연산을 나타내며, D( )는 디코더(DE)의 연산을 나타낸다. 수학식 1의 Ld는 복원 손실을 나타낸다. 손실 Ld는 학습용 입력값(x)과 복원값(x')의 차이를 나타낸다.

다음으로, 학습부(100)는 S260 단계에서 복원 손실이 최소화되도록 역전파(Back-propagation) 알고리즘을 통해 탐지망(DN)의 가중치(w)를 갱신하는 최적화를 수행한다.

전술한 S220 단계 내지 S260 단계는 서로 다른 복수의 학습용 입력값(x)을 이용하여 산출되는 복원 손실이 기 설정된 목표치 이하가 될 때까지 반복하여 가중치(w)가 갱신되도록 반복 수행될 수 있다. 이를 위하여, 학습부(100)는 S270 단계에서 복원 손실이 기 설정된 목표치 이하인지 여부를 판별하여 학습 완료 여부를 판단한다. 즉, 학습부(100)는 복원 손실이 기 설정된 목표치 이하인 경우, 학습이 충분히 이루어진 것으로 판단하여 학습 완료를 결정한다.

학습이 완료되면, 학습부(100)는 S280 단계에서 입력값(x)과 복원값(x')과의 차이의 복원 손실의 기준치를 산출한다. 이러한 기준치는 다음의 수학식 2에 따라 산출된다.

수학식 2에서, θ는 기준치를 나타낸다. 수학식 2에서, μ 및 σ 각각은 학습 절차에서 사용된, 즉, 탐지망(DN)의 학습에 사용된 복수의 학습용 입력값(x)과 복수의 학습용 입력값(x)에 대응하는 복수의 복원값(x') 간의 평균제곱손실(Mean Squared Error: MSE)의 평균 및 표준 편차를 나타낸다. 또한, k는 표준편차 σ에 대한 가중치이며, 1.5 내지 3을 적용할 수 있다. 따라서 학습부(100)는 학습이 종료되면, 기준치(θ)를 산출하여 저장부(14)에 저장한다.

상술된 바와 같이 탐지망(DN)을 구성하기 위해 학습부(100)는 인코더(Encoder), 디코더(Decoder)를 포함하는 오토인코더(Autoencoder) 모델을 구성하거나, 인코더, 디코더, 분별자(Discriminator)를 포함하는 적대적생성신경망(Generative Adversarial Network)를 구성하거나, 단일 또는 복수의 인코더, 디코더, 분별자를 선택적으로 포함하는 생성형 인공신경망을 구성한다. 여기서 생성형 인공신경망은 기본적으로 단일 인코더, 디코더, 분별자를 구성하고, 필요에 따라 인코더, 디코더, 분별자를 복수 형태로 구성할 수 있는 기능을 포함한다. 만약 복수의 인코더, 디코더, 분별자를 구성하는 경우, 각 모듈 간 파라미터 공유 기능을 선택적으로 이용할 수 있다.

예를 들어 학습부(100)는 기본적으로 입력값과 복원값의 평균제곱 손실을 생성하거나 복원 오차를 이용한다. 또한 분별자를 이용하는 경우, 학습부(100)는 기본적으로 실제 입력과 생성 입력에 대한 분별자 출력의 평균제곱 손실을 분별 오차로 이용하고, 필요시 복원 오차와 분별 오차를 사용자 입력에 따라 설정될 수 있다.

다음으로, 먼저, 본 발명의 실시예에 따른 분류망(CN)에 대한 학습 방법에 대해 설명하기로 한다. 도 8은 본 발명의 실시예에 따른 상태 분류를 위한 분류망에 대한 학습 방법을 설명하기 위한 흐름도이다.

도 8을 참조하면, 학습부(100)는 S310 단계에서 분류망(CN)을 초기화한다. 이때, 학습부(100)는 분류망(CN)의 파라미터, 즉, 가중치(w)를 초기화한다. 초기화를 위해 Xavier 초기화기(initializer)를 사용할 수 있다.

이어서, 학습부(100)는 S320 단계에서 레이블이 설정된 학습용 입력값을 마련한다. 학습용 입력값은 검사 대상에서 발생한 소음(n)으로부터 생성된 특징벡터행렬이며, 동시에, 그 범주가 알려진 것이다. 여기서, 해당 범주는 이상 상태인 것이 바람직하다. 정리하면, 분류망(CN)에 대한 학습용 입력값은 이상 상태인 검사 대상에서 발생한 소음(n)으로부터 생성된 특징벡터행렬이며, 그 범주, 예컨대, 이상 상태에 해당하는 레이블이 설정된 값이 될 수 있다. 특히, S320 단계에서 환경의 변화에 따라 분류망(CN)을 갱신할 때 사용되는 학습용 입력값은 저장부(14)에 저장된 범주 데이터가 될 수 있다. 이러한 범주 데이터를 저장하는 방법에 대해서는 아래에서 더 상세하게 설명될 것이다.

다음으로, 학습부(100)는 S330 단계에서 초기화된 분류망(CN)에 학습용 입력값을 입력한다. 그러면, 분류망(CN)은 S340 단계에서 학습용 입력값에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 분류값을 산출한다. 분류값은 학습용 입력값이 상태 이상의 범주에 속할 확률을 포함한다. 이어서, 학습부(100)는 S350 단계에서 다음의 수학식 3와 같은 손실 함수를 통해 분류 손실을 산출한다.

수학식 3에서, Lc은 손실(L2 Loss)을 의미한다. i는 학습 데이터에 대응하는 인덱스이다. f(xi)은 입력값(xi)에 따라 분류망(CN)이 산출한 출력값이고, yi는 기댓값을 나타내는 레이블이다. 즉, yi는 i번째 학습용 입력값(xi)에 대응하는 레이블이다. 또한, f(xi)은 i번째 학습용 입력값(xi)에 대해 분류망(CN)이 산출한 출력값이다.

이어서, 학습부(200)는 S360 단계에서 분류망(CN)기계학습모델(MLM)의 출력값과 레이블의 차이인 손실이 최소가 되도록 기계학습모델(MLM)의 가중치(w)를 수정하는 최적화를 수행한다. 이러한 최적화를 위해 역전파(Back-propagation) 알고리즘을 이용할 수 있다. 전술한 S320 단계 내지 S360 단계는 복수의 서로 다른 복수의 학습용 입력값을 이용하여 반복하여 수행된다. 이러한 반복은 평가 지표를 통해 정확도를 산출하고, 원하는 정확도에 도달할 때까지 이루어질 수 있다.

전술한 바와 같은 절차에 따라 탐지망(DN) 및 분류망(CN)에 대한 학습이 완료되면 탐지망(DN) 및 분류망(CN)을 이용하여 이상 여부를 탐지할 수 있다. 더욱이, 본 발명은 이러한 탐지 절차 중 학습용 입력값을 지속하여 저장할 수 있다. 이러한 방법에 대해서 설명하기로 한다. 도 9는 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법을 설명하기 위하 흐름도이다.

도 9를 참조하면, 오디오부(11)는 S410 단계에서 마이크(MIC)를 통해 검사 대상으로부터 발생하는 소음을 지속적으로 취득하여 제어부(15)의 데이터처리부(200)에 제공한다. 이에 따라, 데이터처리부(200)는 S420 단계에서 취득된 소음(n)으로부터 입력값(x)을 생성할 수 있다. 일례로, 도 5 및 도 6을 참조로 설명된 바와 같이, 데이터처리부(200)는 소음(n)에서 슬라이딩 윈도우(w) 단위로 순차로 복수의 멜분광파형도(s)를 추출하고, 추출된 멜분광파형도(s)을 MFCC로 압축하여 복수의 특징 벡터(v: v1, v2, v3, v4, …vj)를 생성한다. 그런 다음, 소정 수의 특징벡터(v)를 결합하여 특징벡터행렬을 구성함으로써 입력값(x)을 생성할 수 있다.

탐지부(300)는 S430 단계에서 입력값(x)을 탐지망(DN)에 입력한다. 그러면, S440 단계에서 탐지부(300)의 탐지망(DN)은 입력값(x)에 대해 복수의 계층 간 학습된 가중치가 적용된 복수의 연산에 따라 입력값(x)을 모사하는 복원값(x')을 생성한다. 즉, 인코더(EN)는 입력값(x)에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 입력값(x)으로부터 선택적으로 차원을 축소하거나, 차원의 축소 없이 잠재값(z)을 산출하고, 디코더(DE)는 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 인코더(EN)에서 차원의 축소가 이루어진 경우 차원을 확장하고, 그렇지 않은 경우 차원의 확장 없이 잠재값(z)으로부터 복원값(x')을 산출한다. 더욱이, 복원값의 산출과 동시에 S440 단계에서 탐지부(300)의 분류망(CN)은 입력값(xi)에 대해 복수의 계층 간 학습된 가중치가 적용된 복수의 연산을 수행하여 분류값 f(xi)을 산출할 수 있다.

탐지부(300)는 S450 단계에서 다음의 수학식 4에 따라 입력값(x)과 복원값(x')과의 차이를 나타내는 복원 오차가 전술한 수학식 2에 따라 결정되는 기준치(θ) 이상인지 여부를 판단한다.

수학식 4에서, θ는 기준치를 나타낸다. 또한, x는 입력값 그리고 x'는 복원값을 나타낸다.

S450 단계의 판단 결과, 복원 오차가 기준치(θ) 미만이면, 탐지부(300)는 S460 단계로 진행하여 입력값(x)이 정상 상태에서의 데이터인 정상 데이터인 것으로 판단하고, 입력값(x)을 정상 데이터로 저장한다. 이는 입력값(x)에 레이블로 정상 상태를 나타내는 레이블이 부여되어 저장되는 것을 의미한다.

반면, S450 단계의 판단 결과, 복원 오차가 기준치(θ) 이상이면, 탐지부(300)는 검사 대상에 검사 대상에 이상이 있는 것으로 판정하고, S470 단계에서 분류값이 기 설정된 임계치 이상인지 여부를 판별한다.

S470 단계의 판별 결과, 분류값이 임계치 이상이면, 탐지부(300)는 S480 단계에서 입력값을 범주 데이터인 것으로 판단하고, 입력값(x)을 이상 상태의 범주에 속하는 범주 데이터로 저장한다. 이는 입력값(x)에 레이블로 이상 상태를 나타내는 레이블이 부여되어 저장되는 것을 의미한다.

더욱이, 탐지부(300)가 검사 대상에 이상이 있는 것으로 판정함에 따라, 통지부(400)는 S490 단계에서 탐지된 이상 상태가 알려지도록 오디오부(11)를 통해 경고음을 출력하고, 표시부(13)를 통해 경고 메시지를 출력하는 이상 통지 프로세스를 수행할 수 있다.

전술한 바와 같이, 저장되는 정상 데이터 및 범주 데이터는 학습용 입력값으로 사용될 수 있다. 이에 따라, 본 발명은 도 9와 같은 이상 탐지 프로세스에 의해 저장되는 학습용 입력값을 이용하여 탐지망(DN) 및 분류망(CN)을 지속적으로 학습시킬 수 있다. 이러한 방법에 대해서 설명하기로 한다. 도 10은 본 발명의 실시예에 따른 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법을 설명하기 위한 흐름도이다.

도 10을 참조하면, 학습부(100)는 S510 단계에서 모델 갱신이 요구되는 이벤트의 발생을 감지할 수 있다. 이러한 이벤트는 갱신 주기가 도래하거나, 사용자의 입력에 의한 것이거나, 소정 수 이상의 학습용 입력값이 누적되어 저장된 상태를 의미한다.

이벤트를 감지함에 따라 학습부(100)는 S520 단계에서 기 설정된 수 이상의 정상 데이터가 저장되어 있는지 여부를 확인하고, S530 단계에서 기 설정된 수 이상의 범주 데이터가 저장되어 있는지 여부를 확인한다.

전술한 바와 같은 확인에 따라, 기 설정된 수 이상의 정상 데이터가 저장되어 있고, 기 설정된 수 이상의 범주 데이터가 저장되어 있으면, 학습부(100)는 S540 단계에서 저장된 정상 데이터 및 저장된 범주 데이터를 이용하여 탐지망(DN) 및 분류망(CN)을 학습시켜 모델을 갱신할 수 있다.

반면, 전술한 바와 같은 확인에 따라, 기 설정된 수 이상의 정상 데이터가 저장되어 있지 않거나, 기 설정된 수 이상의 범주 데이터가 저장되어 있지 않으면, 학습부(100)는 S550 단계에서 모델 갱신을 취소할 수 있다.

한편, 전술한 도 10을 참조로 하는 실시예에서는 탐지망(DN) 및 분류망(CN)을 함께 갱신하는 것으로 설명되었다. 하지만, 본 발명의 대안적인 실시예에 따르면, 전술한 바와 같은 확인에 따라, 기 설정된 수 이상의 정상 데이터가 저장되어 있다면, 학습부(100)는 저장된 정상 데이터를 이용하여 개별적으로 탐지망(DN)을 학습시킴으로써 개별적으로 모델을 갱신할 수 있다. 또한, 기 설정된 수 이상의 범주 데이터가 저장되어 있으면, 학습부(100)는 개별적으로 범주 데이터를 이용하여 분류망(CN)을 학습시켜 개별적으로 모델을 갱신할 수 있다.

이러한 본 발명은 변화하는 환경에 대응하여 주기적으로 모델을 갱신하는 형태이기 때문에 환경 변화에 대해 자동 또는 반자동으로 적응 및 대응할 수 있다. 더욱이, 환경 변화에 따라 데이터를 자동으로 수집하고, 라벨링하기 때문에 학습 데이터를 수집하는 비용의 절감된다.

본 발명의 실시 예에 따른 방법은 컴퓨터 프로그램 명령어와 데이터를 저장하기에 적합한 컴퓨터로 판독 가능한 매체의 형태로 제공될 수도 있다. 이러한, 컴퓨터가 읽을 수 있는 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있으며, 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM(Compact Disk Read Only Memory), DVD(Digital Video Disk)와 같은 광기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media) 및 롬(ROM, Read Only Memory), 램(RAM, Random Access Memory), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.

이상에서 설명한 바와 같이, 본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안 되며, 오히려 특정한 발명의 특정한 실시 형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다. 개별적인 실시 형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다. 반대로, 단일 실시 형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.

마찬가지로, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시 형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징 될 수 있다는 점을 이해하여야 한다.

본 명세서에서 설명한 주제의 특정한 실시 형태를 설명하였다. 기타의 실시형태들은 이하의 청구항의 범위 내에 속한다. 예컨대, 청구항에서 인용된 동작들은 상이한 순서로 수행되면서도 여전히 바람직한 결과를 성취할 수 있다. 일 예로서, 첨부 도면에 도시한 프로세스는 바람직한 결과를 얻기 위하여 반드시 그 특정한 도시된 순서나 순차적인 순서를 요구하지 않는다. 특정한 구현 예에서, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다.

본 기술한 설명은 본 발명의 최상의 모드를 제시하고 있으며, 본 발명을 설명하기 위하여, 그리고 당업자가 본 발명을 제작 및 이용할 수 있도록 하기 위한 예를 제공하고 있다. 이렇게 작성된 명세서는 그 제시된 구체적인 용어에 본 발명을 제한하는 것이 아니다. 따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 당업자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다.

따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.

본 발명은 객체 이상 탐지 및 상태 분류 모델의 지속적인 학습을 위한 방법 및 이를 위한 장치에 관한 것으로서, 본 발명은 지속적으로 학습 데이터를 수집하고, 모델을 갱신함으로써 환경의 변화에도 적응적으로 상태 이상을 검출할 수 있다. 따라서 본 발명은 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용가능성이 있다.

Claims

탐지분류장치가 검사 대상으로부터 이상을 검출하기 위한 매개체에 대한 정보를 취득하는 단계;

상기 탐지분류장치가 상기 매개체에 대한 정보로부터 복수의 특징 벡터를 포함하는 특징벡터행렬인 입력값을 생성하는 단계;

상기 탐지분류장치가 상기 입력값에 대해 입력값을 모사하는 복원값을 생성하도록 학습된 탐지망을 통해 상기 입력값을 모사하는 복원값을 도출하는 단계;

상기 탐지분류장치가 상기 입력값과 상기 복원값의 차이를 나타내는 복원 오차가 기 산출된 기준치 이상인지 여부를 판단하는 단계;

상기 탐지분류장치가 상기 판단 결과, 상기 복원오차가 상기 기준치 미만이면, 상기 입력값을 정상 데이터로 저장하는 단계;

를 포함하는 것을 특징으로 하는

지속적인 학습을 위한 방법.
제1항에 있어서,

상기 복원값을 도출하는 단계는

상기 탐지분류장치가 상기 입력값에 대해 상태 이상의 범주에 속할 확률을 산출하도록 학습된 분류망을 통해 상기 입력값이 상태 이상의 범주에 속할 확률을 나타내는 분류값을 산출하는 단계;

를 더 포함하는 것을 특징으로 하는

지속적인 학습을 위한 방법.
제2항에 있어서,

상기 복원 오차가 기 산출된 기준치를 초과하는지 여부를 판단하는 단계 후,

상기 탐지분류장치가 상기 판단 결과, 상기 복원오차가 상기 기준치 이상이면, 상기 분류값이 기 설정된 임계치 이상인지 여부를 판별하는 단계;

상기 탐지분류장치가 상기 판별 결과, 상기 분류값이 기 설정된 임계치 이상이면, 상기 탐지부가 상기 입력값을 범주 데이터로 저장하는 단계;

를 더 포함하는 것을 특징으로 하는

지속적인 학습을 위한 방법.
제3항에 있어서,

상기 탐지분류장치가 모델 갱신이 요구되는 이벤트의 발생을 감지하는 단계; 및

상기 탐지분류장치가 상기 이벤트의 발생을 감지함에 따라 기 설정된 수 이상의 정상 데이터가 저장되어 있으면, 상기 탐지망을 저장된 정상 데이터를 이용하여 학습시키거나, 기 설정된 수 이상의 범주 데이터가 저장되어 있으면, 상기 분류망을 저장된 범주 데이터를 이용하여 학습시키는 단계;

를 더 포함하는 것을 특징으로 하는

지속적인 학습을 위한 방법.
제4항에 있어서,

상기 학습시키는 단계는

상기 탐지분류장치가 탐지망을 초기화하는 단계;

상기 탐지분류장치가 학습용 입력값으로 상기 저장된 정상 데이터를 상기 초기화된 탐지망에 입력하는 단계;

상기 탐지분류장치가 상기 학습용 입력값으로부터 선택적으로 압축되거나, 압축되지 않은 잠재값을 산출하는 단계;

상기 탐지분류장치가 상기 잠재값으로부터 상기 복원값을 산출하는 단계;

상기 탐지분류장치가 상기 복원값과 학습용 입력값과의 차이인 손실을 산출하는 단계; 및

상기 탐지분류장치가 상기 손실이 최소가 되도록 상기 탐지망의 파라미터를 갱신하는 최적화를 수행하는 단계;

를 포함하는 것을 특징으로 하는

지속적인 학습을 위한 방법.
제5항에 있어서,

상기 학습시키는 단계 후,

상기 탐지분류장치가 수학식 θ=μ+(k×σ)에 따라 상기 기준치를 산출하는 단계;

를 더 포함하며,

상기 μ는 상기 탐지망의 학습에 사용된 복수의 학습용 입력값과 복수의 학습용 입력값에 대응하는 복수의 복원값 간의 평균제곱손실의 평균이고,

상기 σ는 상기 복수의 학습용 입력값과 상기 복수의 학습용 입력값에 대응하는 상기 복수의 복원값 간의 평균제곱손실의 표준 편차이고,

상기 k는 상기 표준편차에 대한 가중치인 것을 특징으로 하는

지속적인 학습을 위한 방법.
제4항에 있어서,

상기 학습시키는 단계는

상기 탐지분류장치가 분류망을 초기화하는 단계;

상기 탐지분류장치가 상기 저장된 범주 데이터의 범주에 해당하는 레이블을 설정함으로써 학습용 입력값을 마련하는 단계;

상기 탐지분류장치가 상기 학습용 입력값을 상기 초기화된 분류망에 입력하는 단계;

상기 탐지분류장치가 복수의 계층 간 가중치가 적용되는 연산을 수행하여 상기 학습용 입력값으로부터 분류값을 산출하는 단계;

상기 탐지분류장치가 상기 분류값과 상기 레이블의 차이를 나타내는 분류 손실을 산출하는 단계;

상기 탐지분류장치가 상기 분류 손실이 최소가 되도록 상기 분류망의 파라미터를 갱신하는 최적화를 수행하는 단계;

를 포함하는 것을 특징으로 하는

지속적인 학습을 위한 방법.
제1항 내지 제7항 중 어느 한 항의 상기 지속적인 학습을 위한 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
검사 대상으로부터 이상을 검출하기 위한 매개체에 대한 정보로부터 복수의 특징 벡터를 포함하는 특징벡터행렬인 입력값을 생성하는 데이터처리부; 및

상기 입력값에 대해 입력값을 모사하는 복원값을 생성하도록 학습된 탐지망을 통해 상기 입력값을 모사하는 복원값을 도출하고, 상기 입력값과 상기 복원값의 차이를 나타내는 복원 오차가 기 산출된 기준치 이상인지 여부를 판단하여 상기 복원오차가 상기 기준치 미만이면, 상기 입력값을 정상 데이터로 저장하는 탐지부;

를 포함하는 것을 특징으로 하는

지속적인 학습을 위한 장치.
제9항에 있어서,

상기 탐지부는

상기 입력값에 대해 상태 이상의 범주에 속할 확률을 산출하도록 학습된 분류망을 통해 상기 입력값이 상태 이상의 범주에 속할 확률을 나타내는 분류값을 산출하는 것을 특징으로 하는

지속적인 학습을 위한 장치.
제10항에 있어서,

상기 탐지부는

상기 복원오차가 상기 기준치 이상이면, 상기 분류값이 기 설정된 임계치 이상인지 여부를 판별하고, 상기 분류값이 기 설정된 임계치 이상이면, 상기 입력값을 범주 데이터로 저장하는 것을 특징으로 하는

지속적인 학습을 위한 장치.
제11항에 있어서,

모델 갱신이 요구되는 이벤트의 발생을 감지하고,

상기 이벤트의 발생을 감지함에 따라 기 설정된 수 이상의 정상 데이터가 저장되어 있으면, 상기 탐지망을 저장된 정상 데이터를 이용하여 학습시키거나, 기 설정된 수 이상의 범주 데이터가 저장되어 있으면, 상기 분류망을 저장된 범주 데이터를 이용하여 학습시키는 학습부;

를 더 포함하는 것을 특징으로 하는

지속적인 학습을 위한 장치.
제12항에 있어서,

상기 학습부는

탐지망을 초기화하고, 학습용 입력값으로 상기 저장된 정상 데이터를 상기 초기화된 탐지망에 입력한 후,

상기 탐지망의 인코더가 상기 학습용 입력값으로부터 선택적으로 압축되거나, 압축되지 않은 잠재값을 산출하고, 상기 탐지망의 디코더가 상기 잠재값으로부터 상기 복원값을 산출하면,

상기 복원값과 학습용 입력값과의 차이인 손실을 산출하고, 상기 손실이 최소가 되도록 상기 탐지망의 파라미터를 갱신하는 최적화를 수행하는

것을 특징으로 하는

지속적인 학습을 위한 장치.
제13항에 있어서,

상기 학습부는

수학식 θ=μ+(k×σ)에 따라 상기 기준치를 산출하고,

상기 μ는 상기 탐지망의 학습에 사용된 복수의 학습용 입력값과 복수의 학습용 입력값에 대응하는 복수의 복원값 간의 평균제곱손실의 평균이고,

상기 σ는 상기 복수의 학습용 입력값과 상기 복수의 학습용 입력값에 대응하는 상기 복수의 복원값 간의 평균제곱손실의 표준 편차이고,

상기 k는 상기 표준편차에 대한 가중치인 것을 특징으로 하는

지속적인 학습을 위한 장치.
제12항에 있어서,

상기 학습부는

상기 분류망을 초기화하고, 상기 저장된 범주 데이터의 범주에 해당하는 레이블을 설정함으로써 학습용 입력값을 마련하고, 상기 학습용 입력값을 초기화된 분류망에 입력한 후,

상기 분류망이 복수의 계층 간 가중치가 적용되는 연산을 수행하여 상기 학습용 입력값으로부터 분류값을 산출하면,

상기 분류값과 상기 레이블의 차이를 나타내는 분류 손실을 산출하고, 상기 분류 손실이 최소가 되도록 상기 분류망의 파라미터를 갱신하는 최적화를 수행하는 것을 특징으로 하는

지속적인 학습을 위한 장치.
제13항에 있어서,

상기 학습부는

인코더(Encoder), 디코더(Decoder)를 포함하는 오토인코더(Autoencoder) 모델,

인코더, 디코더, 분별자(Discriminator)를 각각 단일로 포함하는 적대적생성신경망(Generative Adversarial Network),

단일 또는 복수의 인코더, 디코더, 분별자를 선택적으로 포함하는 생성형 인공신경망 중 어느 하나를 포함하는 것을 특징으로 하는

지속적인 학습을 위한 장치.
제16항에 있어서,

상기 학습부는

입력값과 복원값의 평균제곱 손실을 생성하거나, 복원 오차를 이용하고,

상기 분별자를 이용하는 경우, 실제 입력과 생성 입력에 대한 분별자 출력의 평균제곱 손실을 분별 오차로 이용하고,

사용자 입력이 입력된 경우, 복원 오차와 분별 오차를 상기 사용자 입력에 따라 설정하는 것을 특징으로 하는

지속적인 학습을 위한 장치.