KR20230032574A - 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램 - Google Patents

학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램 Download PDF

Info

Publication number
KR20230032574A
KR20230032574A KR1020210115558A KR20210115558A KR20230032574A KR 20230032574 A KR20230032574 A KR 20230032574A KR 1020210115558 A KR1020210115558 A KR 1020210115558A KR 20210115558 A KR20210115558 A KR 20210115558A KR 20230032574 A KR20230032574 A KR 20230032574A
Authority
KR
South Korea
Prior art keywords
feature
data
labeling
generating
area
Prior art date
Application number
KR1020210115558A
Other languages
English (en)
Inventor
임형우
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020210115558A priority Critical patent/KR20230032574A/ko
Publication of KR20230032574A publication Critical patent/KR20230032574A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치에 있어서, 설비의 사운드 데이터를 수집하는 데이터 수집부; 상기 사운드 데이터에서 상기 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드를 추출하는 특징 추출부; 상기 특징 밴드로부터 둘 이상의 특성 데이터를 추출하고, 상기 둘 이상의 특성 데이터를 포함하는 특징 벡터를 생성하고, 상기 특징 벡터의 특징 공간(Feature Space)에 분포된 특징값에 기초하여 특징맵을 생성하는 특징맵 생성부; 상기 특징맵에 기초하여 상기 설비별 군집화(Clustering)를 수행하고, 상기 군집화된 데이터에 기초하여 자동으로 라벨링을 수행하는 핵심영역과 관리자에 의하여 라벨링을 수행하는 관리영역으로 분류하는 영역 설정부; 상기 핵심영역에 대한 라벨링을 자동 수행하는 라벨링부를 포함한다.

Description

학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램{APPARATUS, METHOD AND COMPUTER PROGRAM FOR GENERATING TRAINING DATA AND AUTOMATICALLY LABELING TRAINING DATA}
본 발명은 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램에 관한 것이다.
공장 자동화의 안전 및 기계 고장에 대한 확률을 예측할 수 있는 예지정비(Predictive Maintenance) 기술은 데이터 기반의 모니터링 알고리즘을 만들어 기계의 이상 징후를 포착하고 설비의 상태를 정비하는 것이다.
일반적으로, 예지정비 기술은 센서 등을 이용하여 설비나 기계 시스템의 상태에 대한 데이터를 수집하고, 수집된 설비 데이터를 이용하여 설비나 기계 시스템을 모니터링하기 위한 기계 장애 예측 모델을 생성하여 이를 활용한다.
이때, 기계 장애 예측 모델을 생성하기 위해 사용되는 학습 데이터는 수집된 설비 데이터에 라벨을 달아 해당 데이터를 분류(라벨링, Labeling)하는 과정을 필요로 한다. 이러한 데이터 라벨링은 인공지능 알고리즘의 고도화를 위해 인공지능(AI, Artificial Intelligence)이 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업을 일컫는다.
예를 들어, 사진이나 동영상 등에 등장하는 동물, 사물 등의 객체에 라벨을 달아 인공지능에 주입하면 인공지능은 이를 바탕으로 데이터들을 학습하면서 해당 이미지 내의 객체들을 인식할 수 있게 된다. 이러한 데이터 라벨링 작업은 학습 모델의 성능에 큰 영향을 미친다. 즉, 정확하고 많은 양의 학습 데이터로 학습할수록 학습 모델의 성능을 향상시킬 수 있다.
그러나, 종래 기술에 따른 데이터 라벨링은 자동화되어 있지 않고, 관리자가 직접 수행하고 있다. 예를 들어, 관리자가 수기로 설비에 대한 정보(예: RPM 등)를 작성하고, 이를 기반으로 학습 모델 생성시, 수기로 작성된 설비에 대한 정보에 기초하여 데이터 라벨링을 수행하고 있다.
따라서, 데이터의 수가 많아질수록 데이터 라벨링 작업에 많은 시간과 비용을 필요로 하게 된다. 또한, 사람이 직접 작업하는 과정에서 오류가 발생할 가능성이 매우 높다.
한국공개특허공보 제10-2021-0004162호 (2021. 1. 13. 공개) 한국공개특허공보 제10-2020-0126951호 (2020. 11. 9. 공개)
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 학습 데이터에 대한 라벨링을 자동으로 수행하여 데이터 라벨링에 소요되는 시간과 비용을 효율적으로 단축시킬 수 있는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램을 제공하고자 한다.
또한, 수집된 데이터에 대하여 라벨링을 자동으로 수행할 수 있는 최적의 안정권 영역을 구분하여, 안정권 영역에 포함되는 영역은 자동으로 라벨링을 수행할 수 있고, 이외 영역은 관리자가 직접 라벨링을 수행하도록 함으로써, 데이터 라벨링 작업에 대한 효율성뿐만 아니라 정확도를 향상시킬 수 있는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램을 제공하고자 한다.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 수단으로서, 본 발명의 일 실시예는, 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치에 있어서, 설비의 사운드 데이터를 수집하는 데이터 수집부; 상기 사운드 데이터에서 상기 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드를 추출하는 특징 추출부; 상기 특징 밴드로부터 둘 이상의 특성 데이터를 추출하고, 상기 둘 이상의 특성 데이터를 포함하는 특징 벡터를 생성하고, 상기 특징 벡터의 특징 공간(Feature Space)에 분포된 특징값에 기초하여 특징맵을 생성하는 특징맵 생성부; 상기 특징맵에 기초하여 상기 설비별 군집화(Clustering)를 수행하고, 상기 군집화된 데이터에 기초하여 자동으로 라벨링을 수행하는 핵심영역과 관리자에 의하여 라벨링을 수행하는 관리영역으로 분류하는 영역 설정부; 상기 핵심영역에 대한 라벨링을 자동 수행하는 라벨링부를 포함하는, 학습 데이터 생성 장치를 제공 할 수 있다.
본 발명의 다른 실시예는, 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 방법에 있어서, 설비의 사운드 데이터를 수집하는 단계; 상기 사운드 데이터에서 상기 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드를 추출하는 단계; 상기 특징 밴드로부터 둘 이상의 특성 데이터를 추출하는 단계; 상기 둘 이상의 특성 데이터를 포함하는 특징 벡터를 생성하는 단계; 상기 특징 벡터의 특징 공간(Feature Space)에 분포된 특징값에 기초하여 특징맵을 생성하는 단계; 상기 특징맵에 기초하여 상기 설비별 군집화(Clustering)를 수행하는 단계; 상기 군집화된 데이터에 기초하여 자동으로 라벨링을 수행하는 핵심영역과 관리자에 의하여 라벨링을 수행하는 관리영역으로 분류하는 단계; 및 상기 핵심영역에 대한 라벨링을 자동 수행하는 단계를 포함하는, 학습 데이터 생성 방법을 제공할 수 있다.
본 발명의 또 다른 실시예는, 학습 데이터를 자동으로 라벨링하는 명령어들의 시퀀스를 포함하는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램에 있어서, 상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 설비의 사운드 데이터를 수집하고, 상기 사운드 데이터에서 상기 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드를 추출하고, 상기 특징 밴드로부터 둘 이상의 특성 데이터를 추출하고, 상기 둘 이상의 특성 데이터를 포함하는 특징 벡터를 생성하고, 상기 특징 벡터의 특징 공간(Feature Space)에 분포된 특징값에 기초하여 특징맵을 생성하고, 상기 특징맵에 기초하여 상기 설비별 군집화(Clustering)를 수행하고, 상기 군집화된 데이터에 기초하여 자동으로 라벨링을 수행하는 핵심영역과 관리자에 의하여 라벨링을 수행하는 관리영역으로 분류하고, 상기 핵심영역에 대한 라벨링을 자동 수행하도록 하는 명령어들의 시퀀스를 포함하는, 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램을 제공할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 수집된 설비 데이터로부터 설비의 특징을 포함하는 특징 영역을 추출할 수 있다. 추출된 특징 영역에 대하여 복수의 데이터 분석을 시행하여 데이터 라벨링을 자동으로 수행할 수 있는 최적의 안정권 영역을 구분함으로써, 보다 정확하게 데이터 라벨링을 자동으로 수행할 수 있는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램을 제공할 수 있다.
즉, 데이터 라벨링을 자동으로 수행할 수 있는 핵심영역과 관리자에 의하여 라벨링을 수행할 수 있는 관리영역을 구분함으로써, 다량의 학습 데이터에 대한 라벨링을 효율적이면서 정확하게 수행할 수 있는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램을 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 학습 데이터 생성 장치의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 학습 데이터를 생성하는 흐름을 설명하기 위한 예시적인 도면이다.
도 3은 본 발명의 일 실시예에 따른 사운드 데이터부터 특성 데이터를 추출하는 과정을 설명하기 위한 예시적인 도면이다.
도 4는 본 발명의 일 실시예에 따른 특징맵을 생성하는 과정을 설명하기 위한 예시적인 도면이다.
도 5는 본 발명의 일 실시예에 따른 핵심영역과 관리영역으로 분류하는 과정을 설명하기 위한 예시적인 도면이다.
도 6은 본 발명의 일 실시예에 따른 학습 데이터 생성 방법의 순서도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.
본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.
이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 학습 데이터 생성 장치의 구성도이고, 도 2는 본 발명의 일 실시예에 따른 학습 데이터를 생성하는 흐름을 설명하기 위한 예시적인 도면이다.
도 1을 참조하면, 학습 데이터 생성 장치(100)는 데이터 수집부(110), 특징 추출부(120), 특징맵 생성부(130), 영역 설정부(140) 및 라벨링부(150)를 포함할 수 있다. 다만 위 구성 요소들(110 내지 150)은 학습 데이터 생성 장치(100)에 의하여 제어될 수 있는 구성요소들을 예시적으로 도시한 것일 뿐이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 학습 데이터 생성 장치(100)는 수집된 설비 데이터에 대하여 라벨링을 자동으로 수행할 수 있는 최적의 안정권 영역을 구분하여, 안정권 영역에 포함되는 영역은 자동으로 라벨링을 수행할 수 있다.
예를 들어, 학습 데이터 생성 장치(100)는 수집된 데이터에 대하여 복수의 데이터 분석을 통해 설비별로 군집화하여, 제1 그룹(210) 및 제2 그룹(220)으로 클러스터링할 수 있다.
또한, 학습 데이터 생성 장치(100)는 제1 그룹(210)에 대하여 자동으로 라벨링을 수행할 수 있는 제1 핵심영역(211)을 분류하고, 제2 그룹(220)에 대하여 자동으로 라벨링을 수행할 수 있는 제2 핵심영역(221)을 분류할 수 있다. 이때, 학습 데이터 생성 장치(100)는 분류된 제1 핵심영역(211) 및 제2 핵심영역(221)에 대해서 자동 라벨링(230)을 수행할 수 있다.
한편, 학습 데이터 생성 장치(100)는 제1 그룹(210)에 대하여 관리자가 직접 라벨링을 수행할 수 있는 제1 관리영역(212)을 분류하고, 제2 그룹(220)에 대하여 관리자가 직접 라벨링을 수행할 수 있는 제2 관리영역(222)을 분류할 수 있다. 이때, 학습 데이터 생성 장치(100)는 분류된 제1 관리영역(212) 및 제2 관리영역(222)에 대해서는 관리자가 라벨링(240)을 수행하도록 할 수 있다.
따라서, 학습 데이터 생성 장치(100)는 수집된 설비 데이터에 대하여 자동으로 라벨링을 수행할 수 있는 영역을 구분하고, 해당 영역에 대하여는 자동으로 라벨링을 수행함으로써, 종래 기술에 따라 관리자가 직접 수행하여 많은 시간과 비용을 필요로 했던 데이터 라벨링 작업에 대한 효율성과 정확도를 향상시킬 수 있다.
이하, 학습 데이터 생성 장치(100)의 각 구성을 보다 상세히 살펴보도록 한다.
데이터 수집부(110)는 설비의 사운드 데이터를 수집할 수 있다. 예를 들어, 데이터 수집부(110)는 설비에 설치된 사운드 센서 등을 통해 해당 설비의 사운드 데이터를 획득할 수 있다. 데이터 수집부(110)는 기설정된 기간 동안 해당 설비의 사운드 데이터를 수집할 수 있다. 수집된 설비의 사운드 데이터는 전처리 과정을 거쳐 학습 데이터로 활용될 수 있다.
도 3은 본 발명의 일 실시예에 따른 사운드 데이터부터 특성 데이터를 추출하는 과정을 설명하기 위한 예시적인 도면이다. 도 3을 참조하면, 특징 추출부(120) 사운드 데이터(310)에서 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드(321)를 추출할 수 있다.
일반적으로, 각 설비마다 일정한 주파수 대역에서 해당 설비의 기계음 특성이 나타난다. 이러한, 설비의 기계음 특성은 주파수 대역의 변동이 많지 않고, 주요 대역에서 일정하게 나타난다. 따라서, 특징 추출부(120)는 수집된 설비의 사운드 데이터(310)를 주파수 스펙트로그램 이미지(320)로 변환시켜 설비 자체의 주파수 특성 및 설비에 포함된 각 부품의 주파수 특성이 포함된 특징 밴드(321)를 추출할 수 있다.
예를 들어, 특징 추출부(120)는 수집된 설비의 사운드 데이터(310)로부터 변환된 스펙트로그램 이미지(320)에서 해당 설비의 특징을 나타내는 주파수 대역을 추출할 수 있다. 특징 추출부(120)는 추출된 주파수 대역을 해당 설비의 특징영역이 포함된 특징 밴드(321)로 설정할 수 있다.
특징맵 생성부(130)는 사운드 데이터(310)로부터 특징 밴드(321)의 패턴, 주파수 분포 및 에너지 등의 특징을 분석하여 서로 다른 종류의 특징 벡터를 생성할 수 있다.
먼저, 특징맵 생성부(130)는 특징 밴드(321)로부터 둘 이상의 특성 데이터(330, 340, 350)를 추출할 수 있다. 도 3을 참조하면, 특징맵 생성부(130)는 특징 밴드(321)에 대하여 고속푸리에변환 분석(Fast Fourier Transform)을 수행할 수 있다. 예를 들어, 특징맵 생성부(130)는 고속푸리에변환 분석을 통해 특징 밴드(321)의 파형을 분석하고 관측할 수 있다. 특징맵 생성부(130)는 고속푸리에변환 분석에 대한 데이터로부터 둘 이상의 특성 데이터(330, 340, 350)에 포함되는 제1 특성 데이터(330)를 추출할 수 있다. 즉, 특징맵 생성부(130)는 고속푸리에변환 분석을 통해 특징 밴드(321)의 파형을 분석한 제1 특성 데이터(330)를 생성할 수 있다.
특징맵 생성부(130)는 특징 밴드(321)에 대하여 주파수 분산 분석을 수행할 수 있다. 예를 들어, 특징맵 생성부(130)는 주파수 분산 분석을 통해 특징 밴드(321)의 주파수 영역의 신호를 분석할 수 있다. 특징맵 생성부(130)는 주파수 분산 분석에 대한 데이터로부터 둘 이상의 특성 데이터(330, 340, 350)에 포함되는 제2 특성 데이터(340)를 추출할 수 있다. 특징맵 생성부(130)는 주파수 분산 분석을 통해 특징 밴드(321)의 주파수 영역의 신호를 분석한 제2 특성 데이터(340)를 생성할 수 있다.
특징맵 생성부(130)는 특징 밴드(321)에 기초하여 히트맵 데이터를 생성할 수 있다. 일반적으로, 특징 밴드(321)에는 설비별로 존재하는 에너지 패턴이 잘 표현되어 있다. 따라서, 특징맵 생성부(130)는 특징 밴드(321)에 표현되어 있는 에너지 패턴을 분석하기 위해 히트맵 데이터를 활용할 수 있다. 예를 들어, 특징맵 생성부(130)는 특징 밴드(321)의 패턴 변화(351)를 히트맵 형태로 변환시킬 수 있다. 특징맵 생성부(130)는 변환된 히트맵 데이터로부터 둘 이상의 특성 데이터(330, 340, 350)에 포함되는 제3 특성 데이터(350)를 추출할 수 있다. 특징맵 생성부(130)는 히트맵 데이터를 통해 특징 밴드(321)의 패턴 변화(351)를 분석한 제3 특성 데이터(350)를 생성할 수 있다.
특징맵 생성부(130)는 둘 이상의 특성 데이터(330, 340, 350)를 포함하는 특징 벡터를 생성할 수 있다. 예를 들어, 특징맵 생성부(130)는 제1 특성 데이터(330)로부터 제1 특징 벡터를 생성할 수 있고, 제2 특성 데이터(340)로부터 제2 특징 벡터를 생성할 수 있고, 제3 특성 데이터(350)로부터 제3 특징 벡터를 생성할 수 있다. 즉, 특징맵 생성부(130)는 특징 밴드(321)에 대하여 수행된 고속푸리에변환 분석을 통해 제1 특징 벡터를 생성할 수 있고, 주파수 분산 분석을 통해 제2 특징 벡터를 생성할 수 있고, 히트맵 데이터를 통해 제3 특징 벡터를 생성할 수 있다.
이와 같이, 본 발명에 따른 학습 데이터 생성 장치(100)는 수집된 설비의 사운드 데이터(310)에 대하여 다양한 분석을 수행하고, 서로 다른 종류의 특징 벡터를 추출하여 활용함으로써, 데이터 라벨링 작업에 대한 정확도를 향상시킬 수 있다.
도 4는 본 발명의 일 실시예에 따른 특징맵을 생성하는 과정을 설명하기 위한 예시적인 도면이다. 도 4를 참조하면, 특징맵 생성부(130)는 특징 벡터(410)의 특징 공간(Feature Space, 420)에 분포된 특징값에 기초하여 특징맵(450)을 생성할 수 있다.
먼저, 특징맵 생성부(130)는 특징 벡터(410)에 대한 군집화 알고리즘(Clustering Algorithm)을 적용하여 특징 분포맵(430)을 생성할 수 있다. 예를 들어, 특징맵 생성부(130)는 서로 다른 특징으로 이루어져 있는 제1 특징 벡터(411), 제2 특징 벡터(412) 및 제3 특징 벡터(413)를 통합하여 특징 분포맵(430)을 생성할 수 있다.
구체적으로, 특징맵 생성부(130)는 제1 특징 벡터(411), 제2 특징 벡터(412) 및 제3 특징 벡터(413)에 대하여 군집화 알고리즘을 적용할 수 있다. 여기서, 군집화 알고리즘은 K-평균 알고리즘(K-means clustering algorithm)일 수 있다. K-평균 알고리즘은 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작할 수 있다.
예를 들어, 특징맵 생성부(130)는 제1 특징 벡터(411), 제2 특징 벡터(412) 및 제3 특징 벡터(413)에 대하여 K-평균 알고리즘을 적용하여 같은 특징 공간 안에서 특징값을 군집화할 수 있다. 도 4를 참조하면, 특징맵 생성부(130)는 제1 특징 벡터(411), 제2 특징 벡터(412) 및 제3 특징 벡터(413)에 대하여 K-평균 알고리즘을 적용하여, 일 예로, 3개의 클러스터(421, 422, 423)를 생성할 수 있다. 특징맵 생성부(130)는 특징 공간 안에 분포된 특징값에 기초하여 특징 분포맵(430)을 생성할 수 있다.
특징맵 생성부(130)는 특징 분포맵(430)에 분포된 적어도 하나 이상의 특징값에 기초하여 혼합 특징 벡터(Mixed Feature Vector, 440)를 생성할 수 있다. 예를 들어, 특징맵 생성부(130)는 특징 분포맵(430) 내에 분포된 특징값들을 카운트하여 혼합 특징 벡터(440)를 생성할 수 있다.
특징맵 생성부(130)는 서로 다른 종류의 특징 벡터(411, 412, 413)들의 특징 공간 내에 분포하는 특성값에 기초한, 고차원의 특성 공간(High-dimensional Feature Space)에서 특징 벡터를 재정의함으로써, 특징값 간의 구분이 보다 명확하게 분류될 수 있는 혼합 특징 벡터(440)를 생성할 수 있다.
특징맵 생성부(130)는 혼합 특징 벡터(440)에 기초하여 특징맵(450)을 생성할 수 있다. 예를 들어, 특징맵 생성부(130)는 혼합 특징 벡터(440)를 모아 특징맵(450)을 생성할 수 있다. 본 발명에 따른 특징맵(450)은 서로 다른 종류의 특징 벡터(410)에 대한 평균화 과정을 거치고, 특징 분포맵(430)을 통해 다시 한번 전처리 과정을 거쳐 생성됨으로써, 서로 다른 특성을 가진 특징 벡터(410)를 효과적으로 통일화시킬 수 있다.
도 5는 본 발명의 일 실시예에 따른 핵심영역과 관리영역으로 분류하는 과정을 설명하기 위한 예시적인 도면이다. 도 5를 참조하면, 영역 설정부(140)는 특징맵에 기초하여 설비별 군집화(Clustering)를 수행할 수 있다. 예를 들어, 영역 설정부(140)는 군집화 알고리즘을 거쳐 생성된 특징맵을 기반으로 설비별 군집화를 수행할 수 있다.
본 발명에 따른 특징맵은 복수의 특성 데이터에 포함되어 있는 서로 다른 종류의 특징 벡터를 통합하는 전처리 과정을 이미 거쳤기 때문에, 설비별 특징이 보다 정확하게 군집될 수 있다. 따라서, 영역 설정부(140)는 특징맵에 기초하여 설비별 군집화를 더욱 효율적으로 수행할 수 있다.
예를 들어, 영역 설정부(140)는 특징맵에 기초하여, 일 예로, 제1 군집화 데이터(510) 및 제2 군집화 데이터(520)를 생성할 수 있다. 영역 설정부(140)는 군집화된 데이터(510, 520)에 기초하여 자동으로 라벨링을 수행하는 핵심영역(514, 522)과 관리자에 의하여 라벨링을 수행하는 관리영역(515, 523)으로 분류할 수 있다. 즉, 영역 설정부(140)는 군집화된 데이터(510, 520)에 기초하여 데이터 라벨링을 자동으로 수행할 수 있는 최적의 안정권을 구분하여, 핵심영역(514, 522)과 관리영역(515, 523)으로 분류할 수 있다.
먼저, 영역 설정부(140)는 군집화된 데이터(510, 520)의 중심점(511, 521)을 산출할 수 있다. 예를 들어, 영역 설정부(140)는 제1 군집화 데이터(510)의 제1 중심점(511)을 산출할 수 있고, 제2 군집화 데이터(520)의 제2 중심점(521)을 산출할 수 있다.
영역 설정부(140)는 제1 군집화 데이터(510)의 제1 중심점(511)을 기준으로 평균 거리의 제1 클러스터(512)를 생성할 수 있다. 여기서, 평균 거리는 관리자에 의해 미리 설정될 수 있다. 영역 설정부(140)는 제1 클러스터(512)의 기설정된 거리 내의 영역을 핵심영역(514)으로 재정의할 수 있다. 이때, 기설정된 거리는 제1 클러스터(512)의 제1 중심점(511)으로부터 예컨대 70%의 거리일 수 있다.
영역 설정부(140)는 제1 군집화 데이터(510)에서 제1 중심점(511)을 기준으로 제1 클러스터(512)의 70%의 거리 내에 해당하는 영역을 제1 핵심 데이터(513)로 판단할 수 있다. 여기에서 설명하는 실시예에 따른 기설정된 거리는, 70%에 한정되지 않으며, 관리자에 의해 다양하게 설정될 수 있다.
영역 설정부(140)는 제1 군집화 데이터(510)에서 제1 핵심 데이터(513)로 판단된 영역을 제1 핵심영역(514)으로 재정의할 수 있다. 즉, 영역 설정부(140)는 군집화된 데이터(510, 520)의 중심점(511, 521)으로부터 기설정된 거리 내의 영역을 핵심영역(514, 522)으로 설정할 수 있다.
도 5에 따르면, 영역 설정부(140)는 제1 군집화 데이터(510)의 제1 중심점(511)으로부터 제1 클러스터(512)의 70%의 거리 내에 해당하는 영역을 제1 핵심영역(514)으로 설정할 수 있고, 제2 군집화 데이터(520) 또한, 전술한 방법에 따라 제2 중심점(521)으로부터 70%의 거리 내에 해당하는 영역을 제2 핵심 영역(522)으로 설정할 수 있다.
영역 설정부(140)는 군집화된 데이터(510)의 중심점으로부터 기설정된 거리이외의 영역을 관리영역(515, 523)으로 설정할 수 있다. 도 5에 따르면, 영역 설정부(140)는 제1 군집화 데이터(510)의 제1 중심점(511)으로부터 제1 클러스터(512)의 70%의 거리 이외의 영역을 제1 관리 영역(515)으로 설정할 수 있고, 제2 군집화 데이터(520) 또한, 전술한 방법에 따라 제2 중심점(521)으로부터 70%의 거리 이외의 영역을 제2 관리 영역(523)으로 설정할 수 있다.
라벨링부(150)는 핵심영역(514, 522)에 대한 라벨링을 자동으로 수행할 수 있다. 예를 들어, 라벨링부(150)는 수집된 사운드 데이터에 대하여 설비별 특징을 추출하고, 추출된 설비별 특징을 포함하는 영역 중에서 핵심영역(514, 522)을 추출하여 라벨링을 자동으로 수행할 수 있다.
라벨링부(150)는 군집화된 데이터(510, 520)의 중심점(511, 521)으로부터 기설정된 거리 내의 영역에 대한 라벨링을 자동 수행할 수 있다. 예를 들어, 라벨링부(150)는 설비별 특징에 기초하여 군집화된 데이터(510, 520)의 중심점(511, 521)으로부터 기설정된 거리 내의 영역, 즉, 핵심영역(514, 522)으로 정의될 수 있는 영역에 대하여는 라벨링을 자동 수행할 수 있다.
이 때, 추출된 핵심영역(514, 522)은 사운드 데이터의 설비별 특징이 관리영역(515, 523)에 비하여 보다 정확하게 정의될 수 있는 영역으로, 본 발명에 따른 학습 데이터 생성 장치(100)는 해당 영역, 즉, 핵심영역(514, 522)에 대해서는 라벨링을 자동으로 수행하여 데이터 라벨링 작업에 대한 효율성을 향상시킬 수 있다.
따라서, 학습 데이터 생성 장치(100)는 종래의 관리자가 직접 수행하는 데이터 라벨링 작업에 소요되는 많은 시간과 비용을 절감할 수 있고, 관리자로 인한 오류 발생 또한 해결할 수 있다.
뿐만 아니라, 학습 데이터 생성 장치(100)는 예지정비 기술뿐만 아니라 학습 모델을 생성하기 위해 다량의 데이터 라벨링 작업이 필요한 다른 분야에도 확장하여 적용시킬 수 있다.
도 6은 본 발명의 일 실시예에 따른 학습 데이터 생성 방법의 순서도이다. 도 6에 도시된 학습 데이터 생성 방법은 도 1 내지 도 5에 도시된 실시예에 따라 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 5에 도시된 실시예에 따른 학습 데이터 생성 장치에서 학습 데이터를 자동으로 라벨링하는 방법에도 적용된다.
단계 S610에서 학습 데이터 생성 장치는 설비의 사운드 데이터를 수집할 수 있다.
단계 S620에서 학습 데이터 생성 장치는 사운드 데이터에서 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드를 추출할 수 있다.
단계 S630에서 학습 데이터 생성 장치는 특징 밴드로부터 둘 이상의 특성 데이터를 추출할 수 있다.
단계 S640에서 학습 데이터 생성 장치는 둘 이상의 특성 데이터를 포함하는 특징 벡터를 생성할 수 있다.
단계 S650에서 학습 데이터 생성 장치는 특징 벡터의 특징 공간(Feature Space)에 분포된 특징값에 기초하여 특징맵을 생성할 수 있다.
단계 S660에서 학습 데이터 생성 장치는 특징맵에 기초하여 상기 설비별 군집화(Clustering)를 수행할 수 있다.
단계 S670에서 학습 데이터 생성 장치는 군집화된 데이터에 기초하여 자동으로 라벨링을 수행하는 핵심영역과 관리자에 의하여 라벨링을 수행하는 관리영역으로 분류할 수 있다.
단계 S680에서 학습 데이터 생성 장치는 핵심영역에 대한 라벨링을 자동 수행할 수 있다.
상술한 설명에서, 단계 S610 내지 S680는 본 발명의 구현 예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다.
도 1 내지 도 6을 통해 설명된 학습 데이터 생성 장치에서 학습 데이터를 자동으로 라벨링하는 방법은 컴퓨터에 의해 실행되는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어들을 포함하는 기록 매체의 형태로도 구현될 수 있다. 또한, 도 1 내지 도 6을 통해 설명된 학습 데이터 생성 장치에서 학습 데이터를 자동으로 라벨링하는 방법은 컴퓨터에 의해 실행되는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램의 형태로도 구현될 수 있다.
컴퓨터 판독 가능 기록매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 기록매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 학습 데이터 생성 장치
110: 데이터 수집부
120: 특징 추출부
130: 특징맵 생성부
140: 영역 설정부
150: 라벨링부

Claims (19)

  1. 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치에 있어서,
    설비의 사운드 데이터를 수집하는 데이터 수집부;
    상기 사운드 데이터에서 상기 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드를 추출하는 특징 추출부;
    상기 특징 밴드로부터 둘 이상의 특성 데이터를 추출하고, 상기 둘 이상의 특성 데이터를 포함하는 특징 벡터를 생성하고, 상기 특징 벡터의 특징 공간(Feature Space)에 분포된 특징값에 기초하여 특징맵을 생성하는 특징맵 생성부;
    상기 특징맵에 기초하여 상기 설비별 군집화(Clustering)를 수행하고, 상기 군집화된 데이터에 기초하여 자동으로 라벨링을 수행하는 핵심영역과 관리자에 의하여 라벨링을 수행하는 관리영역으로 분류하는 영역 설정부;
    상기 핵심영역에 대한 라벨링을 자동 수행하는 라벨링부
    를 포함하는, 학습 데이터 생성 장치.
  2. 제 1 항에 있어서,
    상기 특징맵 생성부는,
    상기 특징 밴드에 대하여 고속푸리에변환(Fast Fourier Transform) 분석을 수행하고, 상기 고속푸리에변환 분석에 대한 데이터로부터 상기 둘 이상의 특성 데이터에 포함되는 제1 특성 데이터를 추출하는 것인, 학습 데이터 생성 장치.
  3. 제 2 항에 있어서,
    상기 특징맵 생성부는,
    상기 특징 밴드에 대하여 주파수 분산 분석을 수행하고, 상기 주파수 분산 분석에 대한 데이터로부터 상기 둘 이상의 특성 데이터에 포함되는 제2 특성 데이터를 추출하는 것인, 학습 데이터 생성 장치.
  4. 제 3 항에 있어서,
    상기 특징맵 생성부는,
    상기 특징 밴드에 기초하여 히트맵 데이터를 생성하고, 상기 히트맵 데이터로부터 상기 둘 이상의 특성 데이터에 포함되는 제3 특성 데이터를 추출하는 것인, 학습 데이터 생성 장치.
  5. 제 4 항에 있어서,
    상기 특징맵 생성부는,
    상기 특징 벡터에 대한 군집화 알고리즘(Clustering Algorithm)을 적용하여 특징 분포맵을 생성하는 것인, 학습 데이터 생성 장치.
  6. 제 5 항에 있어서,
    상기 특징맵 생성부는,
    상기 특징 분포맵에 분포된 적어도 하나 이상의 특징값에 기초하여 혼합 특징 벡터(Mixed Feature Vector)를 생성하고, 상기 혼합 특징 벡터에 기초하여 상기 특징맵을 생성하는 것인, 학습 데이터 생성 장치.
  7. 제 1 항에 있어서,
    상기 영역 설정부는,
    상기 군집화된 데이터의 중심점을 산출하고, 상기 군집화된 데이터의 중심점으로부터 기설정된 거리 내의 영역을 상기 핵심영역으로 설정하는 것인, 학습 데이터 생성 장치.
  8. 제 7 항에 있어서,
    상기 영역 설정부는,
    상기 군집화된 데이터의 중심점으로부터 상기 기설정된 거리 이외의 영역을 상기 관리영역으로 설정하는 것인, 학습 데이터 생성 장치.
  9. 제 1 항에 있어서,
    상기 라벨링부는,
    상기 군집화된 데이터의 중심점으로부터 기설정된 거리 내의 영역에 대한 라벨링을 자동 수행하는 것인, 학습 데이터 생성 장치.
  10. 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 방법에 있어서,
    설비의 사운드 데이터를 수집하는 단계;
    상기 사운드 데이터에서 상기 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드를 추출하는 단계;
    상기 특징 밴드로부터 둘 이상의 특성 데이터를 추출하는 단계;
    상기 둘 이상의 특성 데이터를 포함하는 특징 벡터를 생성하는 단계;
    상기 특징 벡터의 특징 공간(Feature Space)에 분포된 특징값에 기초하여 특징맵을 생성하는 단계;
    상기 특징맵에 기초하여 상기 설비별 군집화(Clustering)를 수행하는 단계;
    상기 군집화된 데이터에 기초하여 자동으로 라벨링을 수행하는 핵심영역과 관리자에 의하여 라벨링을 수행하는 관리영역으로 분류하는 단계; 및
    상기 핵심영역에 대한 라벨링을 자동 수행하는 단계
    를 포함하는, 학습 데이터 생성 방법.
  11. 제 10 항에 있어서,
    상기 특성 데이터를 추출하는 단계는,
    상기 특징 밴드에 대하여 고속푸리에변환(Fast Fourier Transform) 분석을 수행하는 단계; 및
    상기 고속푸리에변환 분석에 대한 데이터로부터 제1 특성 데이터를 추출하는 단계
    를 포함하는 것인, 학습 데이터 생성 방법.
  12. 제 11 항에 있어서,
    상기 특성 데이터를 추출하는 단계는,
    상기 특징 밴드에 대하여 주파수 분산 분석을 수행하는 단계;
    상기 주파수 분산 분석에 대한 데이터로부터 제2 특성 데이터를 추출하는 단계
    를 더 포함하는 것인, 학습 데이터 생성 방법.
  13. 제 12 항에 있어서,
    상기 특성 데이터를 추출하는 단계는,
    상기 특징 밴드에 기초하여 히트맵 데이터를 생성하는 단계; 및
    상기 히트맵 데이터로부터 제3 특성 데이터를 추출하는 단계
    를 더 포함하는 것인, 학습 데이터 생성 방법.
  14. 제 13 항에 있어서,
    상기 특징맵을 생성하는 단계는,
    상기 특징 벡터에 대한 군집화 알고리즘(Clustering Algorithm)을 적용하여 특징 분포맵을 생성하는 단계
    를 포함하는 것인, 학습 데이터 생성 방법.
  15. 제 14 항에 있어서,
    상기 특징맵을 생성하는 단계는,
    상기 특징 분포맵에 분포된 적어도 하나 이상의 특징값에 기초하여 혼합 특징 벡터(Mixed Feature Vector)를 생성하는 단계; 및
    상기 혼합 특징 벡터에 기초하여 상기 특징맵을 생성하는 단계
    를 더 포함하는 것인, 학습 데이터 생성 방법.
  16. 제 10 항에 있어서,
    상기 핵심영역과 상기 관리영역으로 분류하는 단계는,
    상기 군집화된 데이터의 중심점을 산출하는 단계; 및
    상기 군집화된 데이터의 중심점으로부터 기설정된 거리 내의 영역을 상기 핵심영역으로 설정하는 단계
    를 포함하는 것인, 학습 데이터 생성 방법.
  17. 제 16 항에 있어서,
    상기 핵심영역과 상기 관리영역으로 분류하는 단계는,
    상기 군집화된 데이터의 중심점으로부터 상기 기설정된 거리 이외의 영역을 상기 관리영역으로 설정하는 단계
    를 더 포함하는 것인, 학습 데이터 생성 방법.
  18. 제 10 항에 있어서,
    상기 라벨링을 자동 수행하는 단계는,
    상기 군집화된 데이터의 중심점으로부터 기설정된 거리 내의 영역에 대한 라벨링을 자동 수행하는 것인, 학습 데이터 생성 방법.
  19. 학습 데이터를 자동으로 라벨링하는 명령어들의 시퀀스를 포함하는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,
    설비의 사운드 데이터를 수집하고,
    상기 사운드 데이터에서 상기 설비의 특징을 나타내는 특징영역을 포함하는 특징 밴드를 추출하고,
    상기 특징 밴드로부터 둘 이상의 특성 데이터를 추출하고,
    상기 둘 이상의 특성 데이터를 포함하는 특징 벡터를 생성하고,
    상기 특징 벡터의 특징 공간(Feature Space)에 분포된 특징값에 기초하여 특징맵을 생성하고,
    상기 특징맵에 기초하여 상기 설비별 군집화(Clustering)를 수행하고,
    상기 군집화된 데이터에 기초하여 자동으로 라벨링을 수행하는 핵심영역과 관리자에 의하여 라벨링을 수행하는 관리영역으로 분류하고,
    상기 핵심영역에 대한 라벨링을 자동 수행하도록 하는 명령어들의 시퀀스를 포함하는, 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램.
KR1020210115558A 2021-08-31 2021-08-31 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램 KR20230032574A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210115558A KR20230032574A (ko) 2021-08-31 2021-08-31 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210115558A KR20230032574A (ko) 2021-08-31 2021-08-31 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램

Publications (1)

Publication Number Publication Date
KR20230032574A true KR20230032574A (ko) 2023-03-07

Family

ID=85513391

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210115558A KR20230032574A (ko) 2021-08-31 2021-08-31 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR20230032574A (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200126951A (ko) 2019-09-20 2020-11-09 휴멜로 주식회사 사운드 이벤트 탐지 모델 학습 방법
KR20210004162A (ko) 2019-07-03 2021-01-13 주식회사 현대아이티앤이 인공지능 머신러닝 학습을 위한 데이터셋 자동 생성 장치 및 sw와 그의 제어 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210004162A (ko) 2019-07-03 2021-01-13 주식회사 현대아이티앤이 인공지능 머신러닝 학습을 위한 데이터셋 자동 생성 장치 및 sw와 그의 제어 방법
KR20200126951A (ko) 2019-09-20 2020-11-09 휴멜로 주식회사 사운드 이벤트 탐지 모델 학습 방법

Similar Documents

Publication Publication Date Title
US8724904B2 (en) Anomaly detection in images and videos
Bodik et al. Fingerprinting the datacenter: automated classification of performance crises
US7533070B2 (en) Automatic fault classification for model-based process monitoring
US11667210B2 (en) Detection of electric vehicle charging at premise
KR101731626B1 (ko) 트리 기반 앙상블 분류기를 이용한 정보 예측 방법 및 시스템
Pavlovski et al. Hierarchical convolutional neural networks for event classification on PMU measurements
US11755448B2 (en) Event monitoring apparatus, method and program recording medium
US11593299B2 (en) Data analysis device, data analysis method and data analysis program
CN113435546A (zh) 基于区分置信度水平的可迁移图像识别方法及系统
US20230385699A1 (en) Data boundary deriving system and method
CN112966088B (zh) 未知意图的识别方法、装置、设备及存储介质
CN112418065A (zh) 设备运行状态识别方法、装置、设备及存储介质
US20230144809A1 (en) Model operation support system and method
JP2018503183A (ja) 神経言語挙動認識システム用の語彙解析器
CN112883990A (zh) 数据分类方法及装置、计算机存储介质、电子设备
CN113986643A (zh) 分析日志文件的方法、电子设备和计算机程序产品
CN117351271A (zh) 高压配电线路监控设备故障监测方法、系统及其存储介质
KR20210066534A (ko) 에너지 사용량 데이터의 비지도 학습 기반 부하 모니터링 방법
KR20210011822A (ko) 인공 지능 기반 비정상 로그를 탐지하는 방법 및 이를 구현하는 시스템
CN111767324B (zh) 一种智能关联的自适应数据分析方法及装置
CN113093695A (zh) 一种数据驱动的sdn控制器故障诊断系统
KR101741108B1 (ko) 시스템 결함 분석 장치, 방법 및 시스템 결함을 분석하기 위한 프로그램을 저장하는 저장매체
KR20230032574A (ko) 학습 데이터를 자동으로 라벨링하는 학습 데이터 생성 장치, 방법 및 컴퓨터 프로그램
Cupek et al. Improving KPI based performance analysis in discrete, multi-variant production
Wang et al. Fault diagnosis of gas regulator based on pca-lda-svm