KR20220104368A - 유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법 - Google Patents

유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법 Download PDF

Info

Publication number
KR20220104368A
KR20220104368A KR1020210006534A KR20210006534A KR20220104368A KR 20220104368 A KR20220104368 A KR 20220104368A KR 1020210006534 A KR1020210006534 A KR 1020210006534A KR 20210006534 A KR20210006534 A KR 20210006534A KR 20220104368 A KR20220104368 A KR 20220104368A
Authority
KR
South Korea
Prior art keywords
data
similarity
similarities
transfer learning
target data
Prior art date
Application number
KR1020210006534A
Other languages
English (en)
Inventor
양지훈
박채은
Original Assignee
서강대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서강대학교산학협력단 filed Critical 서강대학교산학협력단
Priority to KR1020210006534A priority Critical patent/KR20220104368A/ko
Publication of KR20220104368A publication Critical patent/KR20220104368A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 발명은 유사도 기반의 시계열 데이터 분류를 위한 전이 학습 방법에 관한 것이다. 상기 전이 학습 방법은, (a) 복수 개의 종류의 각 바탕 데이터들에 대한 분류 모델들을 생성하는 단계; (b) 복수 개의 유사도 측정법들을 이용하여, 목표 데이터와 각 바탕 데이터에 대한 복수 개의 유사도들을 측정하고, 상기 획득된 복수 개의 유사도들에 대한 가중치를 설정하고, 가중치 학습을 통해 최적의 가중치를 획득하고, 상기 가중치를 적용한 유사도들을 이용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하는 단계; (c) 목표 데이터와 가장 높은 유사도를 갖는 바탕 데이터를 검출하고, 상기 검출된 바탕 데이터에 대한 분류 모델을 이용하여 상기 목표 데이터에 대한 분류 모델을 생성하는 단계; 를 구비하여 시계열 데이터에 대한 분류 성능을 향상시킨 것을 특징으로 한다.

Description

유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법{Transfer learning method for time series data classification based on similarity}
본 발명은 전이 학습 방법에 관한 것으로서, 더욱 구체적으로는 복수 개의 유사도 측정법을 사용하여 복수 개의 유사도를 획득하고 복수 개의 유사도에 대한 가중치 학습을 통해 결정된 데이터를 이용함으로써, 분류 성능을 향상시키는 것을 특징으로 하는 시계열 데이터 분류를 위한 전이 학습에 관한 것이다.
심층 신경망은 복수 개의 은닉층들을 통해 모델을 구성하는 매개변수를 늘려 성능을 향상시키게 된다. 따라서, 심층 신경망은. 많은 매개 변수들을 학습시키기 위하여 많은 학습 데이터가 요구된다. 하지만, 양질의 데이터들을 다량 확보하는데 많은 비용과 시간이 소요되는 문제점이 있다.
일반적으로 학습 데이터의 양이 부족한 경우 데이터 증대(Data Augmentation)을 사용한다. 데이터 증대는 적은 양의 훈련 데이터에 인위적인 변화를 주어 새로운 훈련 데이터를 확보하는 방법이다. 하지만, 시계열 데이터(Time Series Data)에 대하여 데이터 증대를 적용하는 과정에서 데이터의 특성을 일반화시키는 문제가 발생한다.
시계열 데이터 분류(Time Series Classification)는 가능한 입력 공간에서 클래스 변수값, 즉 레이블(Lable)에 대한 확률 분포로 매핑하기 위하여 데이터 셋에서 분류자(Classifier)를 훈련하는 것이다. 기존의 시계열 데이터 분류를 위한 학습 기법으로는 DTW(Dynamic Time Warping)를 사용한 NN(Nearest Neighbor)이 있고, CNN(Convolution Neural Network) 기반의 알고리즘, RNN(Recurrent Neural Network) 기반의 알고리즘이 있다. 도 1은 심층 신경망을 이용한 시계열 데이터 분류 과정을 도시한 모식도이다.
시계열 데이터의 분류에 있어서, 심층 신경망 학습을 진행하는데 데이터의 양이 부족한 경우, 주로 전이 학습(Transfer Learning)을 사용한다. 전이 학습은 하나의 문제에 대해 학습된 모델이 다른 문제의 모델의 일부분으로 재사용되는 머신 러닝 접근 방식으로서, 전이 학습은 학습 데이터의 양이 부족할 때 다른 분야의 풍부한 데이터를 바탕으로 한 좋은 성능의 모델의 초기 계층을 사용하여 모델을 구축하는 것이다. 도 2는 전이 학습 구조를 도시한 모식도이다.
전이학습의 주요 학습 기법은 네 가지가 있다. 첫번째는, 조율이 잘 된 합성곱 신경망으로 미리 학습된 신경망 모델을 차용하여 마지막 Fully Connected Layer만 변경해 모델을 만들고, 새로운 과제의 분류를 적용하는 방식이다. 두번째로, 선행학습된 모델로 미리 학습된 모델의 가중치만 이용하여 모델의 구조는 같은 상태에서 적용하고자 하는 과제 모델에 가중치를 적용하는 방식이다. 세번째는 도메인 적응으로 풍부한 데이터를 바탕으로 훈련시 도메인 구분 부분은 적게 학습하여 목표 데이터를 분류하는 데 더 가중을 두는 방식이다. 마지막으로, 계층 재사용으로 기존 모델의 일부 계층을 가중치를 포함하여 그대로 재사용하여 데이터가 부족한 모델 구축에 활용하는 방식이다.
이에 본 발명은 시계열 데이터의 분류 성능을 향상시킬 수 있는 전이 학습 방법을 제안하고자 한다.
한국등록특허공보 제 10-2168496호 한국등록특허공보 제 10-2181261호
전술한 문제점을 해결하기 위하여 본 발명은 시계열 데이터에 대하여 복수 개의 측정 방식에 따라 유사도들을 측정하고, 유사도들에 대한 가중치 학습을 함으로써, 시계열 데이터 분류 성능을 향상시키도록 구성된 전이 학습 방법을 제공하는 것을 목적으로 한다.
전술한 기술적 과제를 달성하기 위한 본 발명의 특징에 따른 유사도 기반의 시계열 데이터 분류를 위한 전이 학습 방법에 있어서, (a) 복수 개의 종류의 바탕 데이터들에 대하여 합성곱 신경망(Convolution Neural Network)을 사용하여 학습하여 각 바탕 데이터들에 대한 분류 모델들을 생성하는 단계; (b) 사전 설정된 복수 개의 유사도 측정법들을 이용하여, 목표 데이터와 각 바탕 데이터에 대한 복수 개의 유사도들을 측정하고, 상기 복수 개의 유사도를 이용하여 목표 데이터와 각 바탕 데이터에 대한 최종 유사도를 획득하는 단계; (c) 각 바탕 데이터에 대하여 획득된 최종 유사도를 이용하여, 목표 데이터와 가장 높은 유사도를 갖는 바탕 데이터를 검출하고, 상기 검출된 바탕 데이터에 대한 분류 모델을 이용하여 상기 목표 데이터에 대한 분류 모델을 생성하는 단계; 를 구비하여 시계열 데이터에 대한 분류 성능을 향상시킨 것을 특징으로 한다.
전술한 특징에 따른 유사도 기반의 전이 학습 방법에 있어서, 상기 (b) 단계는, 목표 데이터와 바탕 데이터에 대하여, 사전 설정된 복수 개의 유사도 측정법들을 이용하여 복수 개의 유사도들을 측정하고, 상기 획득된 복수 개의 유사도들을 동률로 적용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하거나,
상기 획득된 복수 개의 유사도들에 대한 가중치를 설정하고, 상기 가중치에 대하여 역전파 학습시켜 최적의 가중치를 획득하고, 상기 학습에 의해 구한 가중치를 적용한 유사도들을 이용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하는 것이 바람직하다.
전술한 특징에 따른 유사도 기반의 전이 학습 방법에 있어서, 상기 (b) 단계의 복수 개의 유사도 측정법은, 동적 시간 워핑 방법, 공분산 행렬을 적용한 유클리드 거리 측정법, 행렬 윤곽 거리 측정법 중 적어도 둘 이상을 포함하는 것이 바람직하다.
전술한 특징에 따른 유사도 기반의 전이 학습 방법에 있어서, 상기 (b) 단계는, 유사도를 측정하기 전에, 데이터 값의 범위를 정규화시키고, 데이터 셋을 하나의 평균 데이터로 통합시켜 한 종류의 데이터 당 한가지의 시계열값이 존재하도록 하기 위하여, 평균 시퀀스에서 시퀀스 세트까지 제곱 거리의 합을 최소화시키는 것이 바람직하다.
도 6은 본 발명에 따른 방법을 검증하기 위하여 각 조건에 따른 시계열 분류 실험 방법을 도시한 도표이다. 본 발명에 따른 방법을 검증하기 위하여, 도 6과 같이, 기존의 방법 1인 데이터 유사성을 고려하지 않은 전이학습(Transfer Learning with random source data), 기존의 방법 2인 동적 시간 워핑 전이 학습(Transfer Learning with DTW), 본 발명의 제1 실시형태에 따른 복수 개의 데이터 유사도를 동률로 고려한 전이학습(Transfer Learning with Data Correlation), 본 발명의 제2 실시형태에 따른 데이터 유사도들의 가중치 비교를 통한 전이학습(Transfer Learning with Data Correlation Tuning)을 비교하였다.
전술한 조건에서, 시계열 데이터 분류를 위한 본 발명에 따른 방법의 성능을 입증하기 위하여 UCR archive 데이터 총 20가지를 사용하여 성능을 확인하였다.
도 7은 본 발명에 따른 유사도 가중치 학습 적용 시계열 데이터 분류의 평균 결과를 종래의 기술들과 비교한 결과를 도시한 도표이며, 도 8은 데이터 분류 성능을 비교한 그래프이다. 도 7 및 도 8을 참조하면, 시계열 데이터 분류에 사용한 데이터들에 대하여, 전술한 4가지 방법을 이용하여 각각 목표 데이터와 바탕 데이터의 유사도를 측정하고, 이들에 대한 예측 정확도를 사용하여 결과에 대한 정확도를 살펴보았다. 그 결과, 본 발명에 의하여, 복수 개의 데이터 유사도 측정 방법에 의한 데이터 유사도의 가중치 학습을 통해 결정하여 전이학습에 적용한 시계열 데이터 분류가 기존의 방법들에 비하여 가장 높은 분류 정확도를 보임을 확인할 수 있게 되었다.
전술한 바와 같이, 본 발명에 따른 유사도 기반의 전이 학습 방법은, 복수 개의 유사도들에 대한 가중치들의 학습을 통해 가중치를 결정하고, 이에 따른 유사도를 이용하여 사전 훈련용 데이터 및 사전 학습 모델을 결정하여 전이 학습함으로써, 시계열 데이터 분류에 대한 정확도를 향상시킬 수 있게 된다.
도 1은 심층 신경망을 이용한 시계열 데이터 분류 과정을 도시한 모식도이다.
도 2는 전이 학습 구조를 도시한 모식도이다.
도 3은 본 발명의 바람직한 실시예에 따른 시계열 데이터 분류를 위한 유사도 기반의 전이 학습 방법을 도시한 흐름도이며, 도 4는 19개의 바탕 데이터를 이용하여 예시적으로 구현한 전이 학습 모델을 도시한 모식도이다.
도 5는 본 발명의 바람직한 실시예에 따른 유사도 기반의 전이 학습 방법에 있어서, DBA 과정에 대한 알고리즘을 도시한 것이다.
도 6은 본 발명에 따른 방법을 검증하기 위하여 각 조건에 따른 시계열 분류 실험 방법을 도시한 도표이다.
도 7은 본 발명에 따른 유사도 가중치 학습 적용 시계열 데이터 분류의 평균 결과를 종래의 기술들과 비교한 결과를 도시한 도표이며, 도 8은 데이터 분류 성능을 비교한 그래프이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 시계열 데이터 분류를 위한 유사도 기반의 전이 학습 방법에 대하여 구체적으로 설명한다. 본 발명에 따른 유사도 기반의 전이 학습 방법은 컴퓨터 등의 시스템에서 실행되는 신경망 모델 및 소프트웨어로 구현될 수 있다.
도 3은 본 발명의 바람직한 실시예에 따른 시계열 데이터 분류를 위한 유사도 기반의 전이 학습 방법을 도시한 흐름도이며, 도 4는 19개의 바탕 데이터를 이용하여 예시적으로 구현한 전이 학습 모델을 도시한 모식도이다. 도 3 및 도 4를 참조하면, 본 발명에 따른 유사도 기반의 전이 학습 방법은, 먼저 목표 데이터와 복수 개의 종류의 바탕 데이터들을 각 입력받는다(단계 300). 상기 목표 데이터는 시계열 데이터인 것이 바람직하다.
복수 개의 종류의 바탕 데이터들에 대하여 합성곱 신경망(Convolution Neural Network)을 사용하여 학습하여, 각 바탕 데이터들에 대하여 분류 정확도가 높은 분류 모델들을 생성한다(단계 310). 각 바탕 데이터들과 해당 바탕 데이터에 대하여 생성된 분류 모델들을 일대일 대응시켜 인덱싱을 진행한다.
한편, 유사도를 측정하기 전에, 목표 데이터와 바탕 데이터들에 대하여 데이터 전처리를 하는 것이 바람직하다(단계 315). 데이터 전처리를 위하여, 데이터 값의 범위를 정규화시키고 데이터 셋을 하나의 평균 데이터로 통합하게 된다. 데이터들의 개수에는 차이가 존재하므로, 한 종류의 데이터 당 한가지의 시계열값이 존재하도록, DTW Barycenter 평균법(DTW Barycenter Averaging, DBA)를 적용한다.
DBA는 평균 시퀀스에서 시퀀스 세트까지 제곱 거리(DTW)의 합을 최소화하기 위하여 초기의 평균 시퀀스를 반복적으로 구체화하는 평균화 방법으로서, 평균 시퀀스에서 시퀀스 세트까지 제곱된 DTW 거리의 합을 최소화하는 것이다. 이 합계는 평균 시퀀스의 각 좌표와 이와 연관된 시퀀스의 좌표 사이의 단일 거리로 구성된다. 따라서, 평균 시퀀스의 한 좌표가 거리 제곱의 총합에 기여하는 것은 실제로 이 좌표와 DTW 계산 중에 연관된 시퀀스 좌표 사이의 유클리드 거리의 합이 된다. 시퀀스 중 하나의 좌표는 평균의 여러 좌표의 새로운 위치에 기여할 수 있다. 반대로, 평균의 모든 좌표는 각 시퀀스의 하나 이상의 좌표에서 기여한 내용으로 업데이트된다. 또한, 평균 시퀀스의 각 좌표에 대해 이부분의 합계를 최소화하는 것은 이 좌표 세트의 중심을 취함으로써 달성된다. 즉, 평균 시퀀스의 각 좌표를 시퀀스 집합의 관련 좌표의 중심으로 계산하는 것이다. 따라서, 각 좌표는 전체 그룹끼리의 제곱의 합을 최소화하기 위하여 전체 그룹끼리의 제곱의 합의 일부를 최소화한다. 모든 무게 중심이 계산되면 업데이트된 평균 시퀀스가 정의되는 것이다. 이런 반복에 의해 DBA는 두 단계로 작업된다.
1. 평균 시퀀스의 좌표와 시퀀스 세트의 좌표 간의 연관성을 찾기 위해 각 개별 시퀀스와 정제할 임시 평균 시퀀스 간의 DTW를 계산한다.
2. 평균 시퀀스의 각 좌표를 첫번째 단계에서 연관된 좌표의 중심으로 업데이트한다.
S = [S1,…, Sn]를 평균화할 시퀀스의 집합으로 정하고, C = < C1,…,CT>를 반복 i에서의 평균 시퀀스로, C' = < C1',…,CT'>를 우리가 좌표를 찾고자 하는 반복 i+1에서 C의 업데이트라고 가정하면, 평균 시퀀스의 각 좌표는 임의의 벡터 공간 E (일반적으로 유클리드 공간임)에서 정의된다. 평균 시퀀스의 각 좌표를 S 시퀀스의 하나 이상의 좌표에 연결하는 함수를 assoc라고 정한다. 이 함수는 C와 S의 각 시퀀스 사이의 DTW 계산 중에 연산된다. 평균 시퀀스 Ctu의 t번째 좌표는 아래의 수학식 1 및 수학식 2와 같이 정의된다.
Figure pat00001
Figure pat00002
도 5는 본 발명의 바람직한 실시예에 따른 유사도 기반의 전이 학습 방법에 있어서, DBA 과정에 대한 알고리즘을 도시한 것이다. 전술한 과정은 동적 시간 워핑을 이용하여 데이터 셋을 하나의 평균 데이터로 통합하는 과정이다.
다음, 사전 설정된 복수 개의 유사도 측정법들을 이용하여, 목표 데이터와 각 바탕 데이터에 대한 복수 개의 유사도들을 측정한다(단계 320). 시계열 데이터에 대한 유사도 측정법은, 동적 시간 워핑 방법, 공분산 행렬을 적용한 유클리드 거리 측정법, 행렬 윤곽 거리 측정법 중 적어도 둘 이상을 포함한다. 상기 동적 시간 워핑(Dynamic Time Warping; 'DTW')은 시계열 데이터 간 비교를 위해 최적의 인덱스 매칭을 추정하는 알고리즘이며, 상기 DTW는 특정 시간의 값이 존재할 때 자신과 같은 시간 인덱스를 가진 요소와의 비교뿐만 아니라 그 주변의 다른 시간대의 값과도 비교한다. 상기 공분산 행렬을 적용한 유클리드 거리 측정법은 데이터 값의 거리에 대한 상대적 측정을 제공하는 통계인 Mahalanobis 거리를 이용하는 것이며, Mahalanobis 거리는 두 가지의 데이터의 유사성을 식별하고 측정하는 데 사용되는데, 시계열 데이터의 상관 관계를 고려하고 척도 불변이라는 점에서 유클리드 거리와는 다르다. 상기 행렬 윤곽 거리 측정법은 일치하는 하위 시퀀스의 순서에 관계없이 유사한 하위 시퀀스를 많이 공유하는 경우, 두 시계열이 유사한 것으로 간주하는데, 여기서, 시계열 T는 실수값의 시퀀스이며, T의 하위 시퀀스 Ti,m은 위치 i에서 시작하는 길이 m의 T값의 연속 하위 집합이다. 상기 행렬 윤곽 거리 측정법은 사전 훈련 데이터가 되는 바탕 데이터의 모델 가중치를 학습한 다음에 목표 데이터를 사용하여 테스트 세트를 분류한다. 일반적으로 사용되는 5-폴드 교차 검증을 위해 목표 데이터를 훈련 데이터와 테스트 데이터로 분할하며, 목표 데이터의 훈련 데이터를 기반으로 예상되는 결과와 테스트 데이터를 기반으로 실제 결과를 모두 계산한다.
다음, 상기 복수 개의 유사도를 이용하여 목표 데이터와 각 바탕 데이터에 대한 최종 유사도를 획득한다(단계 330).
단계 330에 있어서, 최종 유사도를 획득하는 방법의 일례는, 상기 획득된 복수 개의 유사도들을 동률로 적용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하는 것이다. 최종 유사도를 획득하는 방법의 다른 예로는, 상기 획득된 복수 개의 유사도들에 대한 가중치를 설정하고, 상기 가중치를 적용한 유사도들을 이용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하는 것이다. 최종 유사도를 획득하는 방법의 또 다른 예로는, 상기 획득된 복수 개의 유사도들에 대한 가중치를 설정하고, 상기 가중치에 대하여 역전파 학습시켜 최적의 가중치를 획득하고, 상기 학습에 의해 구한 가중치를 적용한 유사도들을 이용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하는 것이다.
다음, 모든 바탕 데이터들의 최종 유사도들을 이용하여, 모든 바탕 데이터들 중에서 목표 데이터와 가장 높은 유사도를 갖는 바탕 데이터를 검출한다(단계 340). 다음, 상기 검출된 가장 높은 유사도를 갖는 바탕 데이터에 대한 분류 모델을 이용하여 상기 목표 데이터에 대한 분류 모델을 생성하고, 상기 분류 모델을 이용하여 목표 데이터에 대한 데이터 분류를 클래스별로 도출한다(단계 350).
전술한 구성을 갖는 본 발명에 따른 유사도 기반의 전이 학습 방법은 시계열 데이터에 대한 분류 성능을 향상시킬 수 있게 된다.
이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (7)

  1. (a) 복수 개의 종류의 바탕 데이터들에 대하여 학습하여 각 바탕 데이터들에 대한 분류 모델들을 생성하는 단계;
    (b) 사전 설정된 복수 개의 유사도 측정법들을 이용하여, 목표 데이터와 각 바탕 데이터에 대한 복수 개의 유사도들을 측정하고, 상기 복수 개의 유사도를 이용하여 목표 데이터와 각 바탕 데이터에 대한 최종 유사도를 획득하는 단계;
    (c) 각 바탕 데이터에 대하여 획득된 최종 유사도를 이용하여, 목표 데이터와 가장 높은 유사도를 갖는 바탕 데이터를 검출하고, 상기 검출된 바탕 데이터에 대한 분류 모델을 이용하여 상기 목표 데이터에 대한 분류 모델을 생성하는 단계;
    를 구비하여 시계열 데이터에 대한 분류 성능을 향상시킨 것을 특징으로 하는 유사도 기반의 전이 학습 방법.
  2. 제1항에 있어서, 상기 (a) 단계는,
    합성곱 신경망(Convolution Neural Network)을 사용하여 바탕 데이터들을 학습하여 분류 모델들을 생성하는 것을 특징으로 하는 유사도 기반의 전이 학습 방법.
  3. 제1항에 있어서, 상기 (b) 단계는
    목표 데이터와 바탕 데이터에 대하여, 사전 설정된 복수 개의 유사도 측정법들을 이용하여 복수 개의 유사도들을 측정하고, 상기 획득된 복수 개의 유사도들을 동률로 적용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하는 것을 특징으로 하는 유사도 기반의 전이 학습 방법.
  4. 제1항에 있어서, 상기 (b) 단계는
    목표 데이터와 바탕 데이터에 대하여, 사전 설정된 복수 개의 유사도 측정법들을 이용하여 복수 개의 유사도들을 측정하고, 상기 획득된 복수 개의 유사도들에 대한 가중치를 설정하고, 상기 가중치를 적용한 유사도들을 이용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하는 것을 특징으로 하는 유사도 기반의 전이 학습 방법.
  5. 제1항에 있어서, 상기 (b) 단계는
    목표 데이터와 바탕 데이터에 대하여, 사전 설정된 복수 개의 유사도 측정법들을 이용하여 복수 개의 유사도들을 측정하고, 상기 획득된 복수 개의 유사도들에 대한 가중치를 설정하고, 상기 가중치에 대하여 역전파 학습시켜 최적의 가중치를 획득하고, 상기 학습에 의해 구한 가중치를 적용한 유사도들을 이용하여 상기 목표 데이터와 바탕 데이터에 대한 최종 유사도를 획득하는 것을 특징으로 하는 유사도 기반의 전이 학습 방법.
  6. 제1항에 있어서, 상기 (b) 단계의 복수 개의 유사도 측정법은,
    동적 시간 워핑 방법, 공분산 행렬을 적용한 유클리드 거리 측정법, 행렬 윤곽 거리 측정법 중 적어도 둘 이상을 포함하는 것을 특징으로 하는 유사도 기반의 전이 학습 방법.
  7. 제1항에 있어서, 상기 (b) 단계는,
    유사도를 측정하기 전에, 데이터 값의 범위를 정규화시키고, 데이터 셋을 하나의 평균 데이터로 통합시켜 한 종류의 데이터 당 한가지의 시계열값이 존재하도록 하기 위하여, 평균 시퀀스에서 시퀀스 세트까지 제곱 거리의 합을 최소화시키는 것을 특징으로 하는 유사도 기반의 전이 학습 방법.
KR1020210006534A 2021-01-18 2021-01-18 유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법 KR20220104368A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210006534A KR20220104368A (ko) 2021-01-18 2021-01-18 유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210006534A KR20220104368A (ko) 2021-01-18 2021-01-18 유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법

Publications (1)

Publication Number Publication Date
KR20220104368A true KR20220104368A (ko) 2022-07-26

Family

ID=82609721

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210006534A KR20220104368A (ko) 2021-01-18 2021-01-18 유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법

Country Status (1)

Country Link
KR (1) KR20220104368A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649635A (zh) * 2024-01-30 2024-03-05 湖北经济学院 狭窄水道场景影消点检测方法、系统及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102168496B1 (ko) 2020-04-29 2020-10-22 주식회사 이글루시큐리티 전이 학습을 위한 환경분석 및 보정시스템과 그 방법
KR102181261B1 (ko) 2018-09-18 2020-11-20 인하대학교 산학협력단 소표본 의료 영상의 전이학습을 위한 중간 레벨 특징 추출 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102181261B1 (ko) 2018-09-18 2020-11-20 인하대학교 산학협력단 소표본 의료 영상의 전이학습을 위한 중간 레벨 특징 추출 방법 및 장치
KR102168496B1 (ko) 2020-04-29 2020-10-22 주식회사 이글루시큐리티 전이 학습을 위한 환경분석 및 보정시스템과 그 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649635A (zh) * 2024-01-30 2024-03-05 湖北经济学院 狭窄水道场景影消点检测方法、系统及存储介质
CN117649635B (zh) * 2024-01-30 2024-06-11 湖北经济学院 狭窄水道场景影消点检测方法、系统及存储介质

Similar Documents

Publication Publication Date Title
Firpi et al. Swarmed feature selection
US6532305B1 (en) Machine learning method
US20040002928A1 (en) Pattern recognition method for reducing classification errors
CN108877947B (zh) 基于迭代均值聚类的深度样本学习方法
US5384895A (en) Self-organizing neural network for classifying pattern signatures with `a posteriori` conditional class probability
CN109635140B (zh) 一种基于深度学习和密度峰值聚类的图像检索方法
CN109165672A (zh) 一种基于渐进式学习的集成分类方法
CN113380255B (zh) 一种基于迁移训练的声纹识别中毒样本生成方法
Hu et al. Clustering matrix sequences based on the iterative dynamic time deformation procedure
CN114387473A (zh) 一种基于基类样本特征合成的小样本图像分类方法
KR20220104368A (ko) 유사도를 기반으로 한 시계열 데이터 분류를 위한 전이 학습 방법
CN111239715B (zh) 一种联合灰色关联和神经网络的指纹定位方法
CN117641356A (zh) 基于行为偏离度的电力系统第三方智能终端持续认证方法
Dai et al. Clustering of DOA data in radar pulse based on SOFM and CDbw
CN107657223B (zh) 一种基于快速处理多距离度量学习的人脸认证方法
CN113593698B (zh) 一种基于图注意网络的中医证型识别方法
CN114185039A (zh) 雷达目标一维距离像智能识别方法
CN108805221A (zh) 手写数字识别方法及装置
CN112949599A (zh) 基于大数据的候选内容推送方法
Dai et al. Self-supervised pairing image clustering and its application in cyber manufacturing
Dong et al. Bridging Distribution Learning and Image Clustering in High-Dimensional Space
Zhao et al. A hybrid method for incomplete data imputation
CN111368665B (zh) 一种基于竞争与协作机制的高抗哄骗多模态身份验证方法
Volkova Template selection technique on object recognition
Moitra et al. Adversarial Detection without Model Information

Legal Events

Date Code Title Description
A201 Request for examination