WO2022055099A1

WO2022055099A1 - 이상 탐지 방법 및 이를 위한 장치

Info

Publication number: WO2022055099A1
Application number: PCT/KR2021/008516
Authority: WO
Inventors: 김광민
Original assignee: 주식회사 뉴로클
Priority date: 2020-09-11
Filing date: 2021-07-05
Publication date: 2022-03-17
Also published as: KR102255833B1

Abstract

본 개시는 이상 탐지 방법 및 이를 위한 장치에 관한 것으로, 본 개시의 일 실시예에 따른 이상 탐지 방법은, 네트워크 함수를 통해 학습 데이터에 대응하는 제 1 임베디드 특징을 임베딩 공간(embedding space) 상에 매핑하는 학습을 수행하는 단계 - 상기 학습 데이터는 적어도 하나의 정상 데이터를 포함함 -; 입력 데이터를 학습된 상기 네트워크 함수에 입력하여 상기 입력 데이터에 대응하는 제 2 임베디드 특징을 상기 임베딩 공간에 매핑하는 단계; 상기 임베딩 공간에서 상기 제 2 임베디드 특징과 상기 제 2 임베디드 특징에 근접하는 적어도 하나의 상기 제 1 임베디드 특징 사이의 거리에 기초하여 이상 스코어를 산출하는 단계; 및 상기 이상 스코어에 기초하여, 상기 입력 데이터의 이상 여부를 판별하는 단계를 포함할 수 있다.

Description

이상 탐지 방법 및 이를 위한 장치

본 개시(disclosure)의 기술적 사상은 이상 탐지 방법 및 그 장치에 대한 것으로, 더욱 상세하게는 보조 데이터를 활용한 이상 탐지 방법 및 그 장치에 관한 것이다.

머신러닝(Machine Learning)은 AI의 한 분야로 데이터를 바탕으로 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야이며, 이미지 처리, 영상 인식, 음성 인식, 인터넷 검색 등의 다양한 분야의 핵심 기술로 예측(prediction) 및 이상 탐지(anomaly detection)에 탁월한 성과를 나타낸다.

이상 탐지란 데이터에서 예상과는 다른 패턴을 보이는 개체 또는 데이터를 찾는 것을 말하는 것으로, 종래의 머신러닝 기반의 이상 탐지 모델은 실제 데이터와 예측 데이터의 차이를 계산하고, 차이가 임계값 이상인 경우 이상이 있는 것으로 판단한다.

종래 머신러닝에 기반한 이상 탐지 방법들이 개시되어 왔으나, 기존 지도학습 기반의 이상 탐지 모델의 경우 데이터 수집 시, 데이터에 일일이 레이블링 작업을 하기는 쉽지 않았다.

또한, 데이터의 양이 극히 적은 이상 데이터를 학습함에 있어서 소량의 이상 데이터만으로 분류 성능을 높이기 어려워 정상 데이터 및 이상 데이터를 구분할 만큼 훈련하기 어렵다는 문제가 있었다.

본 개시의 기술적 사상에 따른 이상 탐지 방법 및 이를 위한 장치가 이루고자 하는 기술적 과제는, 정상 데이터와 보조 데이터를 함께 학습시킴으로써 이상 탐지의 성능을 높일 수 있는 이상 탐지 방법 및 장치를 제공하는 데에 있다.

본 개시의 기술적 사상에 따른 이상 탐지 방법 및 이를 위한 장치가 이루고자 하는 기술적 과제는 이상에서 언급한 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제는 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

본 개시의 기술적 사상에 의한 일 양태에 따르면, 이상 탐지 방법은 네트워크 함수를 통해 학습 데이터에 대응하는 제 1 임베디드 특징을 임베딩 공간(embedding space) 상에 매핑하는 학습을 수행하는 단계 - 상기 학습 데이터는 적어도 하나의 정상 데이터를 포함함 - ; 입력 데이터를 학습된 상기 네트워크 함수에 입력하여 상기 입력 데이터에 대응하는 제 2 임베디드 특징을 상기 임베딩 공간에 매핑하는 단계; 상기 임베딩 공간에서 상기 제 2 임베디드 특징과 상기 제 2 임베디드 특징에 근접하는 적어도 하나의 상기 제 1 임베디드 특징 사이의 거리에 기초하여 이상 스코어를 산출하는 단계; 및 상기 이상 스코어에 기초하여, 상기 입력 데이터의 이상 여부를 판별하는 단계를 포함할 수 있다.

예시적인 실시예에 따르면, 상기 학습 데이터는 적어도 하나의 보조 데이터를 더 포함하고, 상기 보조 데이터는 상기 정상 데이터와 중첩되지 않는 클래스를 가질 수 있다.

예시적인 실시예에 따르면, 상기 학습을 수행하는 단계에서, 상기 네트워크 함수는, 동일 클래스를 포함하는 상기 학습 데이터로부터 생성된 상기 제 1 임베디드 특징을 서로 가까운 위치에 매핑하고, 상이한 클래스를 포함하는 상기 학습 데이터로부터 생성된 상기 제 1 임베디드 특징을 서로 먼 위치에 매핑하도록 학습될 수 있다.

예시적인 실시예에 따르면, 상기 학습을 수행하는 단계에서, 상기 네트워크 함수는, Triplet loss, Max margin, NT-Xent 및 NT-Logistic 중 적어도 하나의 손실 함수(loss function)에 기초하여 학습을 수행할 수 있다.

예시적인 실시예에 따르면, 상기 이상 스코어를 산출하는 단계는, 상기 제 2 임베디드 특징에 근접하는 순위에 따라 적어도 하나의 상기 제 1 임베디드 특징을 검출하는 단계; 및 상기 제 2 임베디드 특징과 검출된 상기 제 1 임베디드 특징 사이의 거리의 합 또는 평균을 산출하는 단계를 포함할 수 있다.

예시적인 실시예에 따르면, 상기 이상 스코어를 산출하는 단계는, KNN(k nearest neighbor) 함수에 기초하여 상기 이상 스코어를 산출할 수 있다.

본 개시의 기술적 사상에 의한 따른 양태에 따르면, 이상 탐지 이상 탐지를 위한 프로그램을 저장하는 메모리; 및 상기 프로그램을 실행함으로써, 네트워크 함수를 통해 학습 데이터에 대응하는 제 1 임베디드 특징을 임베딩 공간(embedding space) 상에 매핑하는 학습을 수행하며, 입력 데이터를 학습된 상기 네트워크 함수에 입력하여 상기 입력 데이터에 대응하는 제 2 임베디드 특징을 상기 임베딩 공간에 매핑하며, 상기 임베딩 공간에서 상기 제 2 임베디드 특징과 상기 제 2 임베디드 특징에 근접하는 적어도 하나의 상기 제 1 임베디드 특징 사이의 거리에 기초하여 이상 스코어를 산출하고, 상기 이상 스코어에 기초하여, 상기 입력 데이터의 이상 여부를 판별하는 프로세서;를 포함하며, 상기 학습 데이터는 적어도 하나의 정상 데이터를 포함할 수 있다.

예시적인 실시예에 따르면, 상기 네트워크 함수는, 동일 클래스를 포함하는 상기 학습 데이터로부터 생성된 상기 제 1 임베디드 특징을 서로 가까운 위치에 매핑하고, 상이한 클래스를 포함하는 상기 학습 데이터로부터 생성된 상기 제 1 임베디드 특징을 서로 먼 위치에 매핑하도록 학습될 수 있다.

예시적인 실시예에 따르면, 상기 네트워크 함수는, Triplet loss, Max margin, NT-Xent 및 NT-Logistic 중 적어도 하나의 손실 함수(loss function)에 기초하여 학습을 수행할 수 있다.

예시적인 실시예에 따르면, 상기 프로세서는, 상기 제 2 임베디드 특징에 근접하는 순위에 따라 적어도 하나의 상기 제 1 임베디드 특징을 검출하고, 상기 제 2 임베디드 특징과 검출된 상기 제 1 임베디드 특징 사이의 거리의 합 또는 평균을 기초로 상기 이상 스코어를 산출할 수 있다.

예시적인 실시예에 따르면, 상기 프로세서는, KNN(k nearest neighbor) 함수에 기초하여 상기 이상 스코어를 산출할 수 있다.

본 개시의 기술적 사상에 의한 실시예들에 따른 이상 탐지 방법 및 이를 위한 장치에 따르면, 임베팅 공간에서 학습 데이터(즉, 정상 데이터)와 입력 데이터 간의 거리에 기초하여 입력 데이터의 이상 여부를 정확하게 탐지할 수 있다.

또한, 본 개시의 기술적 사상에 의한 실시예들에 따른 이상 탐지 방법 및 이를 위한 장치에 따르면, 다량의 보조 데이터를 정상 데이터와 함께 임베딩 학습함으로 인해, 보조 데이터와의 구별 가능한 특징도 같이 학습하게 되어 정상 데이터만 학습할 때보다 더 좋은 품질의 특징 추출기를 학습할 수 있으며, 이를 통해, 이상 감지의 정확성 및 효율을 증대시킬 수 있다.

본 개시의 기술적 사상에 따른 이상 탐지 방법 및 이를 위한 장치가 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

본 개시에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 간단한 설명이 제공된다.

도 1은 본 개시의 기술적 사상에 의한 일 실시예에 따른 이상 탐지 방법을 설명하기 위한 흐름도이다.

도 2는 본 개시의 기술적 사상에 의한 일 실시예에 따른 이상 탐지 방법에 있어서, 학습 데이터를 예시적으로 도시이다.

도 3 및 도 4는 본 개시의 기술적 사상에 의한 일 실시예에 따른 이상 탐지 방법에 있어서 학습 데이터를 통한 네트워크 함수의 학습 과정을 예시적으로 도시한다.

도 5 및 도 6은 본 개시의 기술적 사상에 의한 일 실시예에 따른 이상 탐지 장치에 있어서, 정상 데이터 및 이상 데이터를 구분하는 과정을 예시적으로 도시한다.

도 7은 본 개시의 기술적 사상에 의한 일 실시예에 따른 이상 탐지 방법에서 보조 데이터를 활용한 효과를 설명하기 위한 도면이다.

도 8은 본 개시의 기술적 사상에 의한 일 실시예에 따른 이상 탐지 장치의 구성을 간략히 도시한 블록도이다.

본 개시의 기술적 사상은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이를 상세히 설명하고자 한다. 그러나, 이는 본 개시의 기술적 사상을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 기술적 사상의 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

본 개시의 기술적 사상을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 개시의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.

또한, 본 개시에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.

또한, 본 개시에 기재된 "~부", "~기", "~자", "~모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 프로세서(Processor), 마이크로 프로세서(Micro Processer), 마이크로 컨트롤러(Micro Controller), CPU(Central Processing Unit), GPU(Graphics Processing Unit), APU(Accelerate Processor Unit), DSP(Digital Signal Processor), ASIC(Application Specific Integrated Circuit), FPGA(Field Programmable Gate Array) 등과 같은 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.

그리고 본 개시에서의 구성부들에 대한 구분은 각 구성부가 담당하는 주기능 별로 구분한 것에 불과함을 명확히 하고자 한다. 즉, 이하에서 설명할 2개 이상의 구성부가 하나의 구성부로 합쳐지거나 또는 하나의 구성부가 보다 세분화된 기능별로 2개 이상으로 분화되어 구비될 수도 있다. 그리고 이하에서 설명할 구성부 각각은 자신이 담당하는 주기능 이외에도 다른 구성부가 담당하는 기능 중 일부 또는 전부의 기능을 추가적으로 수행할 수도 있으며, 구성부 각각이 담당하는 주기능 중 일부 기능이 다른 구성부에 의해 전담되어 수행될 수도 있음은 물론이다.

이하, 본 개시의 실시예들을 차례로 상세히 설명한다.

본 명세서에 걸쳐, 네트워크 함수는 신경망 네트워크 및/또는 뉴럴 네트워크(neural network)와 동일한 의미로 사용될 수 있다. 여기서, 뉴럴 네트워크(신경망)는 일반적으로 노드라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있고, 이러한 노드들은 뉴런으로 지칭될 수 있다. 뉴럴 네트워크는 일반적으로 복수의 노드들을 포함하여 구성된다. 뉴럴 네트워크를 구성하는 노드들은 하나 이상의 링크에 의해 상호 연결될 수 있다.

뉴럴 네트워크를 구성하는 노드들 중 일부는 최초 입력 노드로부터의 거리들에 기초하여 하나의 레이어(layer)를 구성할 수 있다. 예를 들어, 최초 입력 노드로부터 거리가 n인 노드들의 집합은 n 레이어를 구성할 수 있다.

본 명세서에서 설명하는 뉴럴 네트워크는 입력 레이어와 출력 레이어 외에 복수의 히든 레이어를 포함하는 딥 뉴럴 네트워크(Deep Neural Network, DNN)를 포함할 수 있다.

본 개시의 기술적 사상에 의한 일 실시예에 따른 이상 탐지 방법(100)은 연산 능력을 구비한 개인용 컴퓨터(Personal Computer), 워크스테이션(work station), 서버용 컴퓨터 장치 등에서 수행되거나 이를 위한 별도의 장치에서 수행될 수 있다.

또한, 이상 탐지 방법(100)은 하나 이상의 연산 장치들에서 수행될 수도 있다. 예를 들어, 본 개시의 일 실시예에 따른 이상 탐지 방법 중 적어도 하나 이상의 단계들은 클라이언트 디바이스에서, 다른 단계들은 서버 디바이스에서 수행될 수 있다. 이러한 경우, 클라이언트 디바이스와 서버 디바이스는 네트워크로 연결되어 연산 결과를 송수신할 수 있다. 또는, 이상 탐지 방법(100)은 분산 컴퓨팅 기술에 의해 수행될 수도 있다.

S110 단계에서, 이상 탐지 장치는 네트워크 함수를 통해 임베딩 학습을 수행할 수 있다. 여기서 임베딩(embedding)은 고차원의 데이터를 저차원의 벡터로 변환하는 것을 지칭하며, 네트워크 함수는 입력된 데이터의 차원(dimension)을 변환하여 효율적인 임베디드 데이터(즉, 저차원의 벡터)를 찾기 위한 신경망 네트워크일 수 있다.

S110 단계에서, 네트워크 함수는 학습 데이터에 대응하는 제 1 임베딩 특징을 임베딩 공간(embedding space) 상에 매핑하는 학습을 수행할 수 있다. 학습 데이터들의 네이티브 공간(native space)으로부터 저차원의 임베딩 공간의 매핑이 학습되면, 임베딩 공간은 이하 상술되는 바와 같이, 임베디드 특징들의 근접성에 기반하여 입력 데이터의 이상 여부를 결정하는 데 사용될 수 있다.

일 실시예에서, 학습 데이터는 적어도 하나의 정상 데이터와 보조 데이터를 포함할 수 있다. 예를 들어, 도 2에서 도시되는 바와 같이, 정상 데이터 및 보조 데이터는 이미지 데이터일 수 있으며, 보조 데이터는 정상 데이터와 중첩되지 않는 클래스를 가질 수 있다.

본 개시의 기술적 사상에 의한 이상 탐지 방법에 따르면, 다량의 보조 데이터를 정상 데이터와 함께 학습함으로 인해, 보조 데이터와의 구별 가능한 특징도 같이 학습하게 되어 정상 데이터만 학습할 때보다 더 좋은 품질의 특징 추출기를 학습할 수 있게 된다.

S110 단계에서, 네트워크 함수는 동일 클래스를 포함하는 학습 데이터로부터 생성되는 상기 제 1 임베디드 특징을 서로 가까운 위치에 매핑하고, 상이한 클래스를 포함하는 학습 데이터로부터 생성되는 상기 제 1 임베디드 특징을 서로 먼 위치에 매핑하도록 학습될 수 있다. 이에 따라, 네트워크 함수는 정상 데이터를 임베딩 공간 상의 서로 근접한 위치에 매핑하고, 상이한 클래스를 가지는 보조 데이터를 정상 데이터와 먼 위치에 매핑할 수 있다.

일 실시예에서, 네트워크 함수는 Triplet loss(예를 들어, Semi-hard triplet loss 및/또는 Hard triplet loss), Max margin, NT-Xent 및 NT-Logistic 중 적어도 하나의 손실 함수(loss function)에 기초하여 학습을 수행하도록 구현될 수 있다.

일 실시예에서, 이상 탐지 방법(100)은 S110 단계 이전에, 학습 데이터를 준비하는 단계를 더 포함할 수 있다. 예를 들어, 이상 탐지 장치는 사용자에 의해 입력되거나, 네트워크 함수에 의해 정상이라고 판별된 적어도 하나의 정상 데이터와 사용자에 의해 입력되거나, 기 저장된 보조 데이터를 기초로 학습 데이터를 생성할 수 있다.

S120 단계에서, 이상 탐지 장치는 입력 데이터를 S110 단계를 통해 학습된 네트워크 함수에 입력하여 입력 데이터에 대응하는 제 2 임베디드 특징을 임베딩 공간에 매핑할 수 있다. 제 2 임베디드 특징은 제 1 임베디드 특징과 동일하게 입력 데이터를 저차원의 벡터로 변환한 것일 수 있다.

S130 단계에서, 이상 탐지 장치는 임베딩 공간에서 제 2 임베디드 특징과 제 2 임베디드 특징에 근접하는 적어도 하나의 제 1 임베디드 특징 사이의 거리에 기초하여 이상 스코어를 산출할 수 있다.

일 실시예에서, S130 단계는, 제 2 임베디드 특징에 근접하는 순위에 따라 적어도 하나의 상기 제 1 임베디드 특징을 검출하는 단계 및 제 2 임베디드 특징과 검출된 제 1 임베디드 특징 사이의 거리의 합 또는 평균을 산출하는 단계를 포함할 수 있다.

일 실시예에서, 이상 탐지 장치는 KNN(k nearest neighbor) 함수에 기초하여 이상 스코어를 산출할 수 있다. 즉, 예를 들어, 이상 탐지 장치는 KNN 함수를 통해 임베딩 공간에서 제 2 임베디드 특징의 위치를 기준으로 제 2 임베디드 특징 근접하는 순위에 따라 k개(적어도 하나)의 제 1 임베디드 특징을 검출하고, 제 2 임베디드 특징과 검출된 k개의 제 1 임베디드 특징 사이의 거리의 합 또는 평균을 기초로 이상 스코어를 산출할 수 있다.

S140 단계에서, 이상 탐지 장치는 산출된 이상 스코어에 기초하여 입력 데이터의 이상 여부를 판별할 수 있다. 즉, S110 단계를 통해, 학습 데이터에 포함된 정상 데이터들에 대응하는 제 1 임베디드 특징들은 임베딩 공간상에서 서로 근접하여 군집화되기 때문에, 이러한 제 1 임베디드 특징과 입력 데이터에 대응하는 제 2 임베디드 특징 간의 거리에 기초하여 이상 스코어가 임계값 이상인 경우, 입력 데이터를 이상 데이터로 판별할 수 있다.

여기서, 산출된 이상 스코어를 통해 입력 데이터의 정상 및 이상을 구분하는 임계값은 사용자가 최적의 임계치(threshold)를 찾아 이를 기준으로 이상 데이터를 탐지할 수 있다. 예를 들어, 복수의 검증 데이터를 학습된 네트워크 함수에 입력한 다음, 가장 높은 f1 score값을 가지게 되는 이상 스코어를 임계치로 설정할 수 있다.

먼저, 도 3을 참조하면, 복수의 정상 이미지(311, 312)와 보조 이미지(313)를 포함하는 학습 데이터(310)가 네트워크 함수(320)로 입력되어 임베딩 학습이 수행될 수 있다. 임베딩 학습에 따라, 학습 데이터에 대응하는 제 1 임베디드 특징이 출력되며, 이러한 제 1 임베디드 특징은 고차원의 이미지의 특징을 저차원의 벡터로 변환한 것일 수 있다.

도 4를 참조하면, 이러한 네트워크 함수의 학습은 Triplet loss 등의 손실 함수에 기반하여 수행될 수 있다. 이와 같이, Triplet loss 등의 손실 함수를 사용하여 학습을 진행하게 되면, 임베딩 공간에서 포지티브(positive) 샘플과 네거티브(negative) 샘플 간의 관계를 학습할 수 있다. 즉, 유사한 특징(또는, 동일 클래스)를 가지는 데이터를 임베딩 공간상에서 근접하게 위치시키고, 상이한 특징(또는, 다른 클래스)을 가지는 데이터를 임베딩 공간상에서 멀리 떨어지도록 위치시키도록 학습될 수 있다.

이러한 학습을 통해, 정상 이미지(또는, 정상 이미지에 대응하는 제 1 임베디드 특징들)은 임베딩 공간상에서 서로 근접 배치되어 군집화(clustering)될 수 있다.

먼저, 도 5 및 도 6을 참조하면, 입력 데이터(예를 들어, 정상인지 이상인지 판별되어야 하는 이미지)가 학습 데이터에 의해 임베딩 학습된 네트워크 함수에 입력되면, 입력 데이터에 대응하는 제 2 임베디드 특징이 저차원의 임베딩 공간 상의 일정한 위치로 매핑될 수 있다.

이때, 입력 데이터가 정상 이미지인 경우, 제 2 임베디드 특징은 네트워크 함수의 학습에 의해 임베딩 공간 상에 군집화된 정상 이미지의 제 1 임베디드 특징과 근접하여 위치하며, 입력 데이터가 이상 이미지인 경우, 제 2 임베디드 특징은 정상 이미지의 제 1 임베디드 특징과 멀리 이격하도록 위치될 수 있다. 이에 따라, 임베딩 공간에서 제 2 임베디드 특징과 근접하는 제 1 임베디드 특징 사이에 거리(즉, 거리의 합 또는 평균)에 따라, 입력 데이터의 이상 스코어를 산출할 수 있다.

예를 들어, 도 6에 도시되는 바와 같이, 임베딩 공간이 2차원 공간이라고 가정하고, 제 1 입력 데이터에 대응하는 제 2 임베디드 특징에 근접하는 3개의 제 1 임베디드 특징 사이의 거리가 각각 2.7, 2, 1 인 경우, 이상 스코어는 이들의 평균인 1.9로 산출될 수 있다. 또한, 제 2 입력 데이터에 대응하는 제 2 임베디드 특징에 근접하는 3개의 제 1 임베디드 특징 사이의 거리가 각각 8, 6, 7 인 경우, 이상 스코어는 이들의 평균인 6으로 산출될 수 있다.

이때, 이상 스코어의 임계값이 3이라면, 이상 감지 장치는 제 1 입력 데이터를 정상 이미지라고 판단하고, 제 2 입력 데이터를 이상 이미지라고 판단할 수 있다.

구체적으로, 도 7의 (a)는 정상 데이터만으로 네트워크 함수를 임베딩 학습시킨 경우의 임베딩 공간에서의 임베디드 특성의 분포를 도시하며, 도 7의 (b)는 정상 데이터와 보조 데이터를 활용하여 네트워크 함수를 임베딩 학습시킨 경우의 임베딩 공간에서의 임베디드 특성의 분포를 도시한다.

정상 데이터만으로 학습을 하게 되면, 먼저, 도 7의 (a)에 도시되는 바와 같이, 임베딩 공간에 매핑된 정상 데이터(710)의 군집도가 떨어지게 되는 반면, 보조 데이터(720)와 같이 학습시키는 경우에는, 도 7의 (b)에 도시되는 바와 같이, 임베딩 공간에 매핑된 정상 데이터(710)의 군집도를 보다 향상시킬 수 있다.

즉, 보조 데이터(720)를 같이 네트워크 함수를 학습시키면, 정상 데이터(710) 사이의 분산을 줄이는 방향으로 학습되며, 정상 데이터(710)를 식별하기 위한 차별적 특징을 보조 데이터(720)를 통해 더욱 풍부하게 학습하게 됨으로써, 이상 데이터의 판별 효율을 보다 향상시킬 수 있게 된다.

통신부(810)는 이상 여부를 판별하기 위한 입력 데이터를 수신할 수 있다. 통신부(810)는 유무선 통신부를 포함할 수 있다. 통신부(810)가 유선 통신부를 포함하는 경우, 통신부(810)는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 부가가치 통신망(Value Added Network; VAN), 이동 통신망(mobile radio communication network), 위성 통신망 및 이들의 상호 조합을 통하여 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 또한, 통신부(810)가 무선 통신부를 포함하는 경우, 통신부(810)는 셀룰러 통신, 무선랜(예를 들어, 와이-파이(Wi-Fi)) 등을 이용하여 무선으로 데이터 또는 신호를 송수신할 수 있다. 일 실시예에서, 통신부는 프로세서(840)의 제어에 의해 외부 장치 또는 외부 서버와 데이터(예를 들어, 이상 여부 판별을 위한 입력 데이터 등) 또는 신호를 송수신할 수 있다.

입력부(820)는 외부의 조작을 통해 다양한 사용자 명령을 수신할 수 있다. 이를 위해, 입력부(820)는 하나 이상의 입력 장치를 포함하거나 연결할 수 있다. 예를 들어, 입력부(820)는 키패드, 마우스 등 다양한 입력을 위한 인터페이스와 연결되어 사용자 명령을 수신할 수 있다. 이를 위해, 입력부(820)는 USB 포트 뿐만 아니라 선더볼트 등의 인터페이스를 포함할 수도 있다. 또한, 입력부(820)는 터치스크린, 버튼 등의 다양한 입력 장치를 포함하거나 이들과 결합하여 외부의 사용자 명령을 수신할 수 있다.

메모리(830)는 프로세서(840)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들을 임시 또는 영구 저장할 수 있다. 메모리(830)는 플래시 메모리(flash memory) 타입, 하드디스크(hard disk) 타입, 멀티미디어 카드 마이크로(multimedia card micro) 타입, 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM), SRAM, 롬(ROM), EEPROM, PROM, 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.

또한, 메모리(830)는 다양한 네트워크 함수 및 알고리즘을 저장할 수 있으며, 장치(800)를 구동하고 제어하기 위한 다양한 데이터, 프로그램(하나 이상이 인스트럭션들), 어플리케이션, 소프트웨어, 명령, 코드 등을 저장할 수 있다.

프로세서(840)는 장치(800)의 전반적인 동작을 제어할 수 있다. 프로세서(840)는 메모리(830)에 저장되는 하나 이상의 프로그램들을 실행할 수 있다. 프로세서(840)는 중앙 처리 장치(Central Processing Unit, CPU), 그래픽 처리 장치(Graphics Processing Unit, GPU) 또는 본 개시의 기술적 사상에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다.

일 실시예에서, 프로세서(840)는 네트워크 함수를 통해 학습 데이터에 대응하는 제 1 임베디드 특징을 임베딩 공간(embedding space) 상에 매핑하는 학습을 수행할 수 있다. 이때, 학습 데이터는 적어도 하나의 정상 데이터 및/또는 보조 데이터를 포함할 수 있다.

일 실시예에서, 프로세서(840)는 입력 데이터를 임베딩 학습된 네트워크 함수에 입력하여 상기 입력 데이터에 대응하는 제 2 임베디드 특징을 임베딩 공간에 매핑할 수 있다.

일 실시예에서, 프로세서(840)는 임베딩 공간에서 제 2 임베디드 특징과 제 2 임베디드 특징에 근접하는 적어도 하나의 제 1 임베디드 특징 사이의 거리에 기초하여 이상 스코어를 산출하고, 이상 스코어에 기초하여, 입력 데이터의 이상 여부를 판별할 수 있다.

일 실시예에서, 프로세서(840)는 임베딩 공간에서 제 2 임베디드 특징에 근접하는 순위에 따라 적어도 하나의 제 1 임베디드 특징을 검출하고, 제 2 임베디드 특징과 검출된 제 1 임베디드 특징 사이의 거리의 합 또는 평균을 기초로 상기 이상 스코어를 산출할 수 있다.

일 실시예에서, 프로세서(840)는 KNN(k nearest neighbor) 함수에 기초하여 입력 데이터의 이상 스코어를 산출할 수 있다.

일 실시예에 따른 이상 탐지 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 개시를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

또한, 개시된 실시예들에 따른 이상 탐지 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다.

컴퓨터 프로그램 제품은 S/W 프로그램, S/W 프로그램이 저장된 컴퓨터로 읽을 수 있는 저장 매체를 포함할 수 있다. 예를 들어, 컴퓨터 프로그램 제품은 전자 장치의 제조사 또는 전자 마켓(예, 구글 플레이 스토어, 앱 스토어)을 통해 전자적으로 배포되는 S/W 프로그램 형태의 상품(예, 다운로더블 앱)을 포함할 수 있다. 전자적 배포를 위하여, S/W 프로그램의 적어도 일부는 저장 매체에 저장되거나, 임시적으로 생성될 수 있다. 이 경우, 저장 매체는 제조사의 서버, 전자 마켓의 서버, 또는 SW 프로그램을 임시적으로 저장하는 중계 서버의 저장매체가 될 수 있다.

컴퓨터 프로그램 제품은, 서버 및 클라이언트 장치로 구성되는 시스템에서, 서버의 저장매체 또는 클라이언트 장치의 저장매체를 포함할 수 있다. 또는, 서버 또는 클라이언트 장치와 통신 연결되는 제 3 장치(예, 스마트폰)가 존재하는 경우, 컴퓨터 프로그램 제품은 제 3 장치의 저장매체를 포함할 수 있다. 또는, 컴퓨터 프로그램 제품은 서버로부터 클라이언트 장치 또는 제 3 장치로 전송되거나, 제 3 장치로부터 클라이언트 장치로 전송되는 S/W 프로그램 자체를 포함할 수 있다.

이 경우, 서버, 클라이언트 장치 및 제 3 장치 중 하나가 컴퓨터 프로그램 제품을 실행하여 개시된 실시예들에 따른 방법을 수행할 수 있다. 또는, 서버, 클라이언트 장치 및 제 3 장치 중 둘 이상이 컴퓨터 프로그램 제품을 실행하여 개시된 실시예들에 따른 방법을 분산하여 실시할 수 있다.

예를 들면, 서버(예로, 클라우드 서버 또는 인공 지능 서버 등)가 서버에 저장된 컴퓨터 프로그램 제품을 실행하여, 서버와 통신 연결된 클라이언트 장치가 개시된 실시예들에 따른 방법을 수행하도록 제어할 수 있다.

이상에서 실시예들에 대하여 상세하게 설명하였지만 본 개시의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 개시의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 개시의 권리범위에 속한다.

Claims

이상 탐지(anomaly detection) 방법에 있어서,

네트워크 함수를 통해 학습 데이터에 대응하는 제 1 임베디드 특징을 임베딩 공간(embedding space) 상에 매핑하는 학습을 수행하는 단계 - 상기 학습 데이터는 적어도 하나의 정상 데이터를 포함함 - ;

입력 데이터를 학습된 상기 네트워크 함수에 입력하여 상기 입력 데이터에 대응하는 제 2 임베디드 특징을 상기 임베딩 공간에 매핑하는 단계;

상기 임베딩 공간에서 상기 제 2 임베디드 특징과 상기 제 2 임베디드 특징에 근접하는 적어도 하나의 상기 제 1 임베디드 특징 사이의 거리에 기초하여 이상 스코어를 산출하는 단계; 및

상기 이상 스코어에 기초하여, 상기 입력 데이터의 이상 여부를 판별하는 단계를 포함하는, 이상 탐지 방법.
제 1 항에 있어서,

상기 학습 데이터는 적어도 하나의 보조 데이터를 더 포함하고,

상기 보조 데이터는 상기 정상 데이터와 중첩되지 않는 클래스를 가지는, 이상 탐지 방법.
제 1 항에 있어서,

상기 학습을 수행하는 단계에서,

상기 네트워크 함수는, 동일 클래스를 포함하는 상기 학습 데이터로부터 생성되는 상기 제 1 임베디드 특징을 서로 가까운 위치에 매핑하고, 상이한 클래스를 포함하는 상기 학습 데이터로부터 생성되는 상기 제 1 임베디드 특징을 서로 먼 위치에 매핑하도록 학습되는, 이상 탐지 방법.
제 3 항에 있어서,

상기 학습을 수행하는 단계에서,

상기 네트워크 함수는, Triplet loss, Max margin, NT-Xent 및 NT-Logistic 중 적어도 하나의 손실 함수(loss function)에 기초하여 학습을 수행하는, 이상 탐지 방법.
제 1 항에 있어서,

상기 이상 스코어를 산출하는 단계는,

상기 제 2 임베디드 특징에 근접하는 순위에 따라 적어도 하나의 상기 제 1 임베디드 특징을 검출하는 단계; 및

상기 제 2 임베디드 특징과 검출된 상기 제 1 임베디드 특징 사이의 거리의 합 또는 평균을 산출하는 단계를 포함하는, 이상 탐지 방법.
제 5 항에 있어서,

상기 이상 스코어를 산출하는 단계는,

KNN(k nearest neighbor) 함수에 기초하여 상기 이상 스코어를 산출하는, 이상 탐지 방법.
이상 탐지 장치에 있어서,

이상 탐지를 위한 프로그램을 저장하는 메모리; 및

상기 프로그램을 실행함으로써, 네트워크 함수를 통해 학습 데이터에 대응하는 제 1 임베디드 특징을 임베딩 공간(embedding space) 상에 매핑하는 학습을 수행하며, 입력 데이터를 학습된 상기 네트워크 함수에 입력하여 상기 입력 데이터에 대응하는 제 2 임베디드 특징을 상기 임베딩 공간에 매핑하며, 상기 임베딩 공간에서 상기 제 2 임베디드 특징과 상기 제 2 임베디드 특징에 근접하는 적어도 하나의 상기 제 1 임베디드 특징 사이의 거리에 기초하여 이상 스코어를 산출하고, 상기 이상 스코어에 기초하여, 상기 입력 데이터의 이상 여부를 판별하는 프로세서;를 포함하며,

상기 학습 데이터는 적어도 하나의 정상 데이터를 포함하는, 장치.
제 7 항에 있어서,

상기 학습 데이터는 적어도 하나의 보조 데이터를 더 포함하고,

상기 보조 데이터는 상기 정상 데이터와 중첩되지 않는 클래스를 가지는, 장치.
제 7 항에 있어서,

상기 네트워크 함수는, 동일 클래스를 포함하는 상기 학습 데이터로부터 생성되는 상기 제 1 임베디드 특징을 서로 가까운 위치에 매핑하고, 상이한 클래스를 포함하는 상기 학습 데이터로부터 생성되는 상기 제 1 임베디드 특징을 서로 먼 위치에 매핑하도록 학습되는, 장치.
제 9 항에 있어서,

상기 네트워크 함수는, Triplet loss, Max margin, NT-Xent 및 NT-Logistic 중 적어도 하나의 손실 함수(loss function)에 기초하여 학습을 수행하는, 장치.
제 7 항에 있어서,

상기 프로세서는, 상기 제 2 임베디드 특징에 근접하는 순위에 따라 적어도 하나의 상기 제 1 임베디드 특징을 검출하고, 상기 제 2 임베디드 특징과 검출된 상기 제 1 임베디드 특징 사이의 거리의 합 또는 평균을 기초로 상기 이상 스코어를 산출하는, 장치.
제 7 항에 있어서,

상기 프로세서는, KNN(k nearest neighbor) 함수에 기초하여 상기 이상 스코어를 산출하는, 장치.
제 1 항 내지 제 6 항 중 어느 한 항의 방법을 실행하기 위하여 기록 매체에 저장된 컴퓨터 프로그램.