KR20210145923A - 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법 - Google Patents

소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법 Download PDF

Info

Publication number
KR20210145923A
KR20210145923A KR1020200062746A KR20200062746A KR20210145923A KR 20210145923 A KR20210145923 A KR 20210145923A KR 1020200062746 A KR1020200062746 A KR 1020200062746A KR 20200062746 A KR20200062746 A KR 20200062746A KR 20210145923 A KR20210145923 A KR 20210145923A
Authority
KR
South Korea
Prior art keywords
data
learning
data set
model
small
Prior art date
Application number
KR1020200062746A
Other languages
English (en)
Other versions
KR102418596B1 (ko
Inventor
강대성
이준목
Original Assignee
동아대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동아대학교 산학협력단 filed Critical 동아대학교 산학협력단
Priority to KR1020200062746A priority Critical patent/KR102418596B1/ko
Publication of KR20210145923A publication Critical patent/KR20210145923A/ko
Application granted granted Critical
Publication of KR102418596B1 publication Critical patent/KR102418596B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 소규모 학습 데이터 셋을 기반으로 하는 딥러닝 시스템 및 이를 이용한 딥러닝 학습방법에 대한 것으로, 딥러닝 학습을 위한 데이터를 소규모 단위로 구분하고, 사전 검증작업을 거쳐 소규모의 학습을 위한 데이터의 딥러닝 학습에 대한 신뢰도를 높이며, 원시데이터의 반복적인 학습시간을 단축할 수 있도록 하는 것이다.
이를 위해, 딥러닝 모델 학습을 하기 위해 입력되는 학습 데이터 셋 중에서 클래스간 데이터 불균형이 존재하는지 여부를 검사하여 소규모 데이터 셋과 참조 데이터 셋으로 분규하고 분석하는 데이터 불균형 분석장치부(10), 소규모 학습 데이터 셋과 데이터 생성에 필요한 참조 데이터 셋을 이용하여 생성 데이터 셋과 합성 데이터 셋을 생성하고, 생성된 데이터가 실제로 존재하는지 여부를 판별하는 데이터 생성부(20), 데이터 유사도 군집 결과와 기존에 학습되어 있는 범용 딥러닝 모델을 이용하여 목표로 학습해야 할 최종 딥러닝 모델의 가중치와 하이퍼 파라미터의 초기화에 대한 내용을 전이 학습시키는 모델을 생성하는 모델초기화부(30), 소규모 데이터 셋을 통해 생성/검증된 학습 데이터 셋과 메타 러닝 모델을 통해 생성된 전이학습 최적 데이터를 이용하여 딥러닝 모델을 통상적인 학습 데이터 셋과 레이블링 정보를 통해 학습시키는 모델 학습부(40) 및 학습된 모델을 기반으로 분류 혹은 객체 검출과 같은 추론을 하는 모델 추론부(50)로 구성되는 기술을 제공한다.

Description

소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법{A DEEP-LEARNING SYSTEM BASED SMALL LEARNING DATA-SET AND METHOD OF DEEP-LEARNING USED IT}
본 발명은 소규모 학습 데이터 셋을 기반으로 하는 딥러닝 시스템 및 이를 이용한 딥러닝 학습방법에 대한 것으로, 소규모 데이터 셋을 통해서 학습 데이터 셋을 증강하여 충분한 양의 데이터 셋으로 학습한 수준의 딥러닝 모델의 정확도를 개선하고, 데이터 셋의 사전 검증작업을 거쳐 중복작업을 배제하여 딥러닝을 위한 원시데이터의 반복적인 학습시간을 단축할 수 있도록 하는 것이다.
일반적으로 딥러닝 학습의 경우 기계학습의 대표적인 기술로서, 반복학습을 통하여 원시데이터인 학습을 위한 데이터를 분석하는 것이다.
이와 같은 딥러닝 학습의 경우 많은 수의 원시데이터를 반복적으로 학습함으로써, 분석 정밀도가 높아지게 된다.
그러나, 이러한 기존의 딥러닝 학습의 경우 학습을 위한 데이터인 원시데이터의 수가 적은 소규모 데이터셋일 경우 그 분석 정밀도가 낮아져 신뢰도가 낮아지는 문제점이 있었다.
또한, 학습을 위한 원시데이터가 입력되면 처음부터 데이터를 학습하는 작업이 수행되기 때문에 동일 또는 유사한 상황이 또는 원시데이터 상에 이벤트가 발생할 경우 이를 반복작업을 통한 학습시에만 인식하고 분석할 수 있기 때문에 딥러닝 학습을 위한 초기작업시 소요되는 시간이 증가하게 된다.
이와 같은 문제점을 극복하기 위해 다양한 방법들이 제안되고 있는데, 그 중 대표적인 것으로는 대한민국 등록특허 제10-2019208호(딥 러닝 기반의 오류 분류 방법 및 장치, 이하 '선행기술'이라 함.)딥 러닝 기반의 오류 분류 방법 및 장치가 개시된다. 오류 분류 방법은 서로 다른 속성을 가지는 복수의 인식 모델들 각각에 동일한 데이터를 입력하는 단계; 상기 복수의 인식 모델들 각각을 통해 상기 데이터의 인식 결과를 추출하는 단계; 상기 복수의 인식 모델들 각각의 인식 결과들이 서로 동일한지 여부를 판단하는 단계; 및 상기 복수의 인식 모델들 각각의 인식 결과들에 대한 판단 결과에 기초하여 상기 데이터를 재검증할 필요가 없는 검증된 인식 결과 및 재검증할 필요가 있는 검증 안된 인식 결과로 분류하는 단계를 포함하는 기술을 개시하고 있다.
그러나, 상기 선행기술의 경우 학습된 복수의 인식 모델들을 반복적으로 생성하고 비교함으로써, 딥러닝 학습을 위한 학습결과에 대한 대용량의 데이터를 발생시키게 되며, 이를 처리하는데 많은 시간이 소요되는 문제가 있었다.
대한민국 등록특허 제10-2019208호(딥 러닝 기반의 오류 분류 방법 및 장치, 2019년 09월 02일 등록)
본 발명은 상기와 같은 문제점을 극복하기 위해, 딥러닝 학습 전 원시데이터를 소규모의 데이터 셋을 기반으로 하여, 사전 검증작업을 수행하고, 이에 따라 딥러닝을 위한 학습시간을 단축할 수 있도록 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법을 제공하는 것을 본 발명의 목적으로 한다.
본 발명의 목적을 달성하기 위한 소규모 학습 데이터 셋을 기반으로 하는 딥러닝 시스템은 딥러닝 모델 학습을 하기 위해 입력되는 학습 데이터 셋 중에서 클래스간 데이터 불균형이 존재하는지 여부를 검사하여 소규모 데이터 셋과 참조 데이터 셋으로 분류하고 분석하는 데이터 불균형 분석장치부(10); 소규모 학습 데이터 셋과 데이터 생성에 필요한 참조 데이터 셋을 이용하여 생성 데이터 셋과 합성 데이터 셋을 생성하고, 생성된 데이터가 실제로 학습데이터로 사용할 수 있는지 적합성을 판별하는 데이터 생성부(20); 데이터 유사도 군집 결과와 기존에 학습되어 있는 범용 딥러닝 모델을 이용하여 목표로 학습해야 할 최종 딥러닝 모델의 가중치 초기화와 하이퍼 파라미터의 자동 지정에 대한 내용을 전이 학습시키는 모델초기화부(30); 및 소규모 데이터 셋을 통해 생성/검증된 학습 데이터 셋과 메타 러닝 모델을 통해 생성된 전이학습 최적 데이터를 이용하여 딥러닝 모델을 학습시키는 모델 학습부(40); 학습된 모델을 기반으로 분류 혹은 객체 검출과 같은 추론을 하는 모델 추론부(50)로 구성되는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템을 제공하게 된다.
여기서, 상기 데이터 불균형 분석장치부(10)는 입력되는 학습 데이터를 분석하는 분석유니트(11)와 상기 분석유니트(11)에서 분석된 결과에 따라 소규모 데이터 셋과 참조 데이터 셋으로 분류 하는 분류유니트(12)로 구성되고, 상기 데이터 생성부(20)는 데이터를 생성하는 생성유니트(21), 소규모 학습데이터의 실제존재여부를 판단하는 검증유니트(22), 학습데이터 생성유니트(21)가 학습을 위한 데이터를 획득할 수 있도록 하는 생성네트워크관리유니트(23) 및 검증유니트(22)에서 데이터를 검증할 수 있도록 참조할 수 있는 데이터를 획득할 수 있도록 하는 검증네트워크관리유니트(24)로 구성된다.
또한, 상기 데이터 생성부(20)는 데이터의 진위여부를 판단하고 그 확률값을 찾을 수 있는 확률계산유니트가 더 포함되고, 상기 모델검증유니트(22)는 주어진 학습 데이터셋 사이의 유사도를 비교하여 각각을 클러스터링하고 클러스터된 비중을 기반으로 학습 데이터와 적용할 메타러닝 모델을 적용 가중치를 부여하는 유사도군집기를 더 포함하게 되며, 상기 유사도군집기는 데이터의 유사도를 판별함에 있어, 유클리디언 거리, 마할라노비스거리, 민코스키거리, 코사인 유사도와 같은 측정 알고리즘 중 어느 하나를 이용하는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템을 제공하게 된다.
또한, 본 발명에 따른 소규모 학습 데이터 셋 기반 딥러닝 시스템을 이용한 딥러닝 학습방법에 있어서는 학습 데이터 셋에서 데이터 불균형을 판단하는 단계(S10); 데이터 불균형 상황에서 소규모 학습 데이터 셋과 참조 데이터 셋으로 분리하는 단계(S20); 소규모 학습 데이터셋과 참조 데이터 셋을 입력받아 새로운 데이터 셋을 생성하는 단계(S30); 생성된 데이터와 소규모 학습 데이터와의 비교를 통해 가상으로 생성된 데이터 셋인지 판단하는 단계(S40); 검증 확률값이 0.5에 수렴함에 따라 생성 학습 데이터를 선택하는 단계(S50); 학습 데이터 셋에서 데이터 사이의 유사도를 측정하는 단계(S60); 유사도에 따라 데이터를 클러스터링 하는 단계(S70); 유사도 정보에 따라 기존 학습된 딥러닝 모델을 적용하는 단계(S80); 적용된 딥러닝 모델의 가중치와 하이퍼 파라미터를 지정하는 단계(S90); 및 생성된 학습 데이터 셋과 가중치, 하이퍼 파라미터 초기값을 지정하여 딥러닝 모델을 학습하는 단계(S100); 학습된 딥러닝 모델을 통하여 추론을 수행하는 단계(S110)로 구성되는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템을 이용한 딥러닝 학습방법을 제공함으로써, 본 발명의 또다른 목적을 보다 잘 달성할 수 있도록 하는 것이다.
본 발명 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법을 제공함으로써, 소규모 데이터 셋을 통해서도 충분한 양의 데이터 셋으로 학습한 수준의 딥러닝 모델의 높은 정확도를 가지는 효과가 있으며, 데이터 셋의 사전 검증작업을 수행하고, 중복작업을 배제하여 이에 따라 딥러닝을 위한 학습시간을 단축할 수 있도록 하는 효과가 있다.
도 1은 본 발명의 소규모 학습 데이터 셋 기반 딥러닝 시스템의 구성도이다.
도 2는 본 발명에 따른 데이터 생성부(20)의 세부 구성도이다.
도 3은 본 발명에 따른 딥러닝 학습방법에 대한 개요도이다.
도 4는 본 발명에 따른 불균형 분석장치부(10)의 동작을 설명하기 위한 예시도이다.
도 5는 본 발명에 따른 학습 데이터 생성유니트(21)의 동작을 설명하기 위한 예시도이다.
도 6은 본 발명에 따른 검증유니트(22)의 동작을 설명하기 위한 예시도이다.
도 7은 본 발명에 따른 유사도군집기의 동작을 설명하기 위한 예시도이다.
도 8은 본 발명에 따른 모델초기화부(30)의 동작을 설명하기 위한 예시도이다.
도 9는 본 발명에 따른 모델학습부(40)의 동작을 설명하기 위한 예시도이다.
이하에서 본 발명의 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법을 도면을 참조하여 상세하게 설명하도록 한다.
도 1은 본 발명의 소규모 학습 데이터 셋 기반 딥러닝 시스템의 구성도이고, 도 2는 본 발명에 따른 데이터 생성부(20)의 세부 구성도이다.
도 3은 본 발명에 따른 딥러닝 학습방법에 대한 개요도이고, 도 4는 본 발명에 따른 불균형 분석장치부(10)의 동작을 설명하기 위한 예시도이고, 도 5는 본 발명에 따른 학습 데이터 생성유니트(21)의 동작을 설명하기 위한 예시도이다고, 도 6은 본 발명에 따른 검증유니트(22)의 동작을 설명하기 위한 예시도이고, 도 7은 본 발명에 따른 유사도군집기의 동작을 설명하기 위한 예시도이고, 도 8은 본 발명에 따른 모델초기화부(30)의 동작을 설명하기 위한 예시도이며, 도 9는 본 발명에 따른 모델학습부(40)의 동작을 설명하기 위한 예시도이다.
도 1과 도 2 및 도 3 내지 도 9를 참조하여 상세하게 설명하면, 본 발명에 따른 소규모 학습 데이터 셋 기반 딥러닝 시스템은 딥러닝 모델 학습을 하기 위해 입력되는 학습 데이터 셋 중에서 클래스간 데이터 불균형이 존재하는지 여부를 검사하여 소규모 데이터 셋과 참조 데이터 셋으로 분규하고 분석하는 데이터 불균형 분석장치부(10), 소규모 학습 데이터 셋과 데이터 생성에 필요한 참조 데이터 셋을 이용하여 생성 데이터 셋과 합성 데이터 셋을 생성하고, 생성된 데이터가 실제로 존재하는지 여부를 판별하는 데이터 생성부(20), 데이터 유사도 군집 결과와 기존에 학습되어 있는 범용 딥러닝 모델을 이용하여 목표로 학습해야 할 최종 딥러닝 모델의 가중치와 하이퍼 파라미터의 초기화에 대한 내용을 전이 학습시키는 모델을 생성하는 모델초기화부(30), 소규모 데이터 셋을 통해 생성/검증된 학습 데이터 셋과 메타 러닝 모델을 통해 생성된 전이학습 최적 데이터를 이용하여 딥러닝 모델을 통상적인 학습 데이터 셋과 레이블링 정보를 통해 학습시키는 모델 학습부(40) 및 학습된 모델을 기반으로 분류 혹은 객체 검출과 같은 추론을 하는 모델 추론부(50)로 구성된다.
상기 데이터 불균형 분석장치부(10)는 딥러닝 모델 학습을 하기 위해 입력되는 학습 데이터 셋 중에서 클래스간 데이터 불균형이 존재하는지 여부를 검사하여 소규모 데이터 셋과 참조 데이터 셋으로 뷴류하고 분석하는 기능을 구현한다.
여기서, 상기 학습 데이터 셋 중 클래스간 데이터 불균형이라함은 딥러닝 모델 학습에 필요한 주어진 데이터 셋의 각 분류별 학습 데이터의 개수가 적절한지, 한쪽으로 치우쳐지지 않았는지, 절대적인 데이터 양은 적절한지 분석 및 분류를 시행하는 것이다.
예를 들어, 실내에서 일어난 화재를 판단하는 딥러닝 추론 모델을 개발할 때 필요한 학습 데이터 셋은 화재에 해당하는 데이터와 비화재에 해당하는 데이터로 구성되어 있다. 화재 검출 학습 데이터 셋은 n개의 화재 및 비화재 분류와 각 분류를 학습시킬 m개의 데이터로 이루어진 n*m 의 크기를 갖는다. 분류별로 학습 데이터의 개수가 적절한지를 평가하기 위해 0~n까지의 분류별로 고르게 m개의 데이터를 가지고 있는지 판단하는 것이 각 분류별 학습데이터 개수가 적절한지 평가하는 것이다. 또한, 고정된 특정 영역의 정보를 수집하는 CCTV 화면 내에서 화재를 판단할 수 있는 딥러닝 추론모델의 예에서는 화재가 발생하지 않은 일반적인 CCTV화면의 데이터와 화재가 발생한 상황의 데이터로 구성된 학습 데이터셋을 통해 모델을 학습시키게 된다. 이 상황에서 구성된 데이터 셋의 면면을 들여다보면 화재가 발생하지 않은 상황의 데이터의 양이 화재가 발생한 상황의 데이터의 양에 비해 월등히 많을 것이며 이를 데이터가 한쪽으로 치우쳐진 경우라고 할 수 있다. 마지막으로 절대적인 데이터의 양은 적절한지 평가하는 것은 n*m으로 이루어진 전체 데이터 셋이 일정한 데이터 셋 크기를 만족하는지 평가하여 학습 데이터 셋 크기 자체가 적절한지 분석하는 것이다.
보다 상세하게 설명하면, 학습을 위한 원시데이터가 소규모 데이터인지 구분하거나, 학습 시 참조할 수 있는 참조데이터인지를 구분하게 되는 것이다.
상기와 같은 데이터 불균형 분석장치부(10)는 입력되는 학습 데이터를 분석하는 분석유니트(11)와 상기 분석유니트(11)에서 분석된 결과에 따라 소규모 데이터 셋과 참조 데이터 셋으로 분류 하는 분류유니트(12)로 구성된다.
이때, 상기 참조 데이터 셋은 학습을 위해 획득된 하나의 데이터 셋 중 수집하기 용이한 경우나 데이터의 양이 적절하게 존재하는 경우가 될 수 있으며, 학습데이터를 분석하고 학습할 때 참조할 수 있는 데이터를 말하는 것이다.
여기에서 수집이 용이한 경우는 구글, Kaggle, Github 등의 오픈 데이터 셋 혹은 인터넷 쉐어, 수집 장치 등을 통해서 별다른 제약 없이 손쉽게 대량의 데이터를 수집이 가능한 경우를 의미한다. 예를 들어 범죄 행동을 검출하기 위해 방범용 CCTV를 이용하여 영상 데이터를 수집한다고 할 때, 범죄 행동이 발생하지 않은 일반적인 사람들의 행위에 대한 영상 데이터는 수집이 용이한 경우라고 할 수 있으며, 실제 강도, 상해, 폭력 등에 해당하는 영상 데이터는 수집이 어려운 경우라고 할 수 있다.
지정하거나, '화재상황'과 같이 노멀하지 않은 이벤트가 발생한 경우 이와 같은 정보가 포함된 경우가 될 수 있으며, 학습데이터를 분석할 때 참조할 수 있는 데이터를 말하는 것이다.
상기 데이터 생성부(20)는 불균형 분석장치부(10)에서 분류된 소규모 학습데이터 셋과 참조 데이터 셋을 기반으로 생성 데이터 셋과 합성 데이터 셋을 생성하고, 생성 데이터 셋과 합성 데이터 셋의 데이터가 실제로 존재하는지 여부를 판별하게 된다.
상기와 같은 데이터 생성부는 데이터를 생성하는 생성유니트(21), 소규모 학습데이터의 실제존재여부를 판단하는 검증유니트(22), 학습데이터 생성유니트(21)가 학습을 위한 데이터를 획득할 수 있도록 하는 생성네트워크관리유니트(23) 및 검증유니트(22)에서 데이터를 검증할 수 있도록 참조할 수 있는 데이터를 획득할 수 있도록 하는 검증네트워크관리유니트(24)로 구성된다.
또한, 상기 데이터 생성부(20)는 확률계산유니트(미도시)가 더 구비된다.
상기 학습데이터 생성유니트(21)에서 학습을 위한 소규모 데이터 셋을 지정하고, 새로운 데이터 합성에 필요한 베이스데이터에 사용할 참조 데이터 셋을 지정한 후, 두 데이터 셋의 특성을 모두 갖는 생성 데이터셋이 완성된다.
여기서, 상기 소규모 데이터 셋은 수집이 용이하지 않거나 데이터의 양이 적은 가공이 되지 않은 원시 데이터를 말하는 것이며, 참조 데이터 셋은 일반적으로 수집이 용이하거나 데이터 불균형 상황에서 충분한 양을 갖는 데이터를 말하는 것이다.
예를 들어, '건물 내 화재 사고'를 검출하기 위해서 딥러닝 모델을 학습하는 학습 데이터 셋이 주어진다면 실제 화재가 발생한 이미지와 관련된 데이터는 소규모 데이터 셋이며, 화재가 발생하지 않은 상황의 건물 내부 모습은 참조 데이터를 말하는 것이다.
상기와 같이 원시 데이터인 소규모 데이터 셋에 참조 데이터 셋의 특징정보인 이벤트 상황에 대한 정보를 오버래핑하거나 이미지 또는 영상일부를 원시 데이터인 소규모 데이터 셋에 포함하도록 한다.
상기 검증유니트(22)에서는 생성 또는 합성된 데이터 셋이 원래 주어진 학습 데이터 셋과 비교하여 가상으로 생성된 데이터 셋인지 아닌지를 판단하고 검증하는 것으로, 생성네트워크관리유니트(23)로부터 검증네트워크관리유니트(24)로부터 이송되어 입력되는 학습을 위한 소규모 데이터 셋과 참조 데이터셋을 기반으로 검증네트워크관리유니트(24)에 입력되는 데이터 셋의 종류 및 진위여부 즉, 생성 또는 합성되었는지의 여부를 판단하게 된다.
이때, 상기 확률계산유니트를 통하여 데이터의 진위여부를 판단하고 그 확률값을 찾게 되는 것이다.
여기서, 예를 들어, 확률값이 0에 수렴할 경우 확률계산유니트는 모든 데이터를 거짓 데이터로 판별하고, 확률값이 1에 수렴할 경우 확률 계산유니트는 모든 데이터를 참으로 판별하게 되는 것이다.
그러므로, 상기와 같은 확률값이 0.5에 수렵하게 하여 확률계산유니트가 실제 데이터와 생성된 데이터가 거짓인지 참인지를 판별이 곤란한 데이터로 인식할 때 생성 또는 합성 데이터 셋을 딥러닝 모델을 학습할 데이터 셋으로 선택하게 된다.
이때, 상기 확률계산유니트는 하기 [수학식 1]을 탑재하고 이를 이용하여 확률값을 산출하게 된다.
Figure pat00001
G : 생성유니트에 적용될 Generative Model
D : 검증유니트에 적용될 Discriminative Model
pz : z의 확률분포
z : 임의로 생성하는 노이즈 변수
x : 실제 데이터
Figure pat00002
: 실제 데이터 x를 D가 보고 실제 데이터라고 판단할 확률
또한 상기 모델검증유니트(22)는 주어진 학습 데이터 셋 사이의 유사도를 비교하여 각각을 클러스터링 클러스터된 비중을 기반으로 학습 데이터와 적용할 메타러닝 모델을 적용 가중치를 부여하는 유사도군집기(미도시)를 더 포함하게 된다.
이때, 데이터의 유사도는 유클리디언 거리, 마할라노비스거리, 민코스키거리, 코사인 유사도와 같은 측정 알고리즘을 이용하여 적용하게 된다.
상기 모델초기화부(30)는 소규모 데이터의 특징점을 클러스터링하고 이를 기존에 학습된 범용 딥러닝 모델과의 유사도를 측정하여 가장 비슷한 모델을 선정하여 딥러닝 모델 특성을 전이하며, 이를 통해서 최종 딥러닝 모델의 가중치 초기화와 하이퍼 파라미터들을 조기 지정하여 학습시간을 경감시킨다.
이는 학습을 위한 소규모 데이터의 특성에 따라 다양한 종류의 딥러닝 모델을 적용할 수 있도록 호환성을 높여주기 위한 것이다.
이때, 상기 모델초기화부(30)에는 메타러닝모델관리유니트(31)가 더 포함되는데, 상기 러닝모델은 데이터 유사도 군집 결과와 기존에 학습되어 있는 범용 딥러닝 모델을 이용하여 목표로 학습해야 할 최종 딥러닝 모델의 가중치와 하이퍼 파라미터의 초기화에 대한 내용을 전이 학습시키는 모델을 말하며, 범용 딥러닝 모델과 데이터 유사도 군집결과가 입력되면 가중치와 하이퍼 파라미터 초기값을 출력해주게 된다.
상기 모델 학습부(40)는 소규모 데이터 셋을 통해 생성/검증된 학습 데이터 셋과 메타 러닝 모델을 통해 생성된 전이학습 최적 데이터를 이용하여 딥러닝 모델을 통상적인 학습 데이터 셋과 레이블링 정보를 통해 학습시키는 모든 딥러닝 모델에 적용하게 된다.
상기 모델추론부(50)는 학습된 모델을 기반으로 분류 혹은 객체 검출과 같은 추론을 수행하게 된다.
상기와 같은 본 발명의 소규모 학습 데이터 셋 기반 딥러닝 시스템을 이용한 딥러닝 학습방법은 불균형 분석장치부(10)를 이용하여 딥러닝 모델 학습을 위해, 입력되는 학습 데이터 셋에서 데이터 불균형을 판단하는 단계(S10), 상기 불균형을 판단하는 단계(S10) 후 데이터 불균형 상황에서 소규모 학습 데이터 셋과 참조 데이터 셋으로 분리하는 단계(S20), 소규모 학습 데이터 셋과 참조 데이터 셋을 입력받아 데이터 생성부(20)를 통하여 새로운 데이터 셋을 생성하는 단계(S30), 상기 데이터 셋을 생성하는 단계(S30) 후 생성된 데이터와 소규모 학습 데이터와의 비교를 통해 가상으로 생성된 데이터 셋인지 판단하는 단계(S40), 데이터 생성부(20)의 확률계산유니트를 통하여 검증된 검증 확률값이 0.5에 수렴함에 따라 생성 학습데이터를 선택하는 단계(S50), 데이터 생성부(20)의 모델검증유니트(22)를 통하여 학습 데이터 셋에서 데이터 사이의 유사도를 측정하는 단계(S60), 유사도에 따라 데이터를 클러스터링 하는 단계(S70), 유사도 정보에 따라 기존 학습된 딥러닝 모델을 적용하는 단계(S80), 적용된 딥러닝 모델의 가중치와 하이퍼 파라미터를 지정하는 단계(S90), 생성된 학습 데이터 셋과 가중치, 하이퍼 파라미터 초기값을 지정하여 딥러닝 모델을 학습하는 단계(S100) 및 학습된 딥러닝 모델을 통해서 추론을 수행하는 단계(S110)로 구성된다.
상기와 같은 시스템 및 방법을 제공함으로써 본 발명의 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법을 제공할 수 있는 것이다.
10 : 데이터 불균형 분석장치부
20 : 데이터 생성부
30 : 모델 초기화부
40 : 모델 학습부

Claims (8)

  1. 소규모 학습 데이터 셋 기반 딥러닝 시스템에 있어서,
    딥러닝 모델 학습을 하기 위해 입력되는 학습 데이터 셋 중에서 클래스간 데이터 불균형이 존재하는지 여부를 검사하여 소규모 데이터 셋과 참조 데이터 셋으로 분규하고 분석하는 데이터 불균형 분석장치부(10);
    소규모 학습 데이터 셋과 데이터 생성에 필요한 참조 데이터 셋을 이용하여 생성 데이터 셋과 합성 데이터 셋을 생성하고, 생성된 데이터가 실제로 존재하는지 여부를 판별하는 데이터 생성부(20);
    데이터 유사도 군집 결과와 기존에 학습되어 있는 범용 딥러닝 모델을 이용하여 목표로 학습해야 할 최종 딥러닝 모델의 가중치와 하이퍼 파라미터의 초기화에 대한 내용을 전이 학습시키는 모델을 생성하는 모델초기화부(30);
    소규모 데이터 셋을 통해 생성/검증된 학습 데이터 셋과 메타 러닝 모델을 통해 생성된 전이학습 최적 데이터를 이용하여 딥러닝 모델을 통상적인 학습 데이터 셋과 레이블링 정보를 통해 학습시키는 모델 학습부(40); 및
    학습된 모델을 기반으로 분류 혹은 객체 검출과 같은 추론을 수행하는 모델추론부(50)로 구성되는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템.
  2. 제 1항에 있어서,
    상기 데이터 불균형 분석장치부(10)는 입력되는 학습 데이터를 분석하는 분석유니트(11)와 상기 분석유니트(11)에서 분석된 결과에 따라 소규모 데이터 셋과 참조 데이터 셋으로 분류 하는 분류유니트(12)로 구성되는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템.
  3. 제 1항에 있어서,
    상기 데이터 생성부(20)는 데이터를 생성하는 생성유니트(21), 소규모 학습 데이터의 실제존재여부를 판단하는 검증유니트(22), 학습 데이터 생성유니트(21)가 학습을 위한 데이터를 획득할 수 있도록 하는 생성네트워크관리유니트(23) 및 검증유니트(22)에서 데이터를 검증할 수 있도록 참조할 수 있는 데이터를 획득할 수 있도록 하는 검증네트워크관리유니트(24)로 구성되는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템.
  4. 제 3항에 있어서,
    상기 데이터 생성부(20)는 데이터의 진위여부를 판단하고 그 확률값을 찾을 수 있는 확률계산유니트가 더 포함되는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템.
  5. 제 4항에 있어서,
    상기 확률계산유니트는 하기 수학식 1을 탑재하고 이를 이용하여 확률값을 산출하는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템.

    [수학식 1]
    Figure pat00003


    G : 생성유니트에 적용될 Generative Model
    D : 검증유니트에 적용될 Discriminative Model
    pz : z의 확률분포
    z : 임의로 생성하는 노이즈 변수
    x : 실제 데이터
    Figure pat00004
    : 실제 데이터 x를 D가 보고 실제 데이터라고 판단할 확률
  6. 제 3항에 있어서,
    상기 모델검증유니트(22)는 주어진 학습 데이터 셋 사이의 유사도를 비교하여 각각을 클러스터링하고 클러스터된 비중을 기반으로 학습 데이터와 적용할 메타러닝 모델을 적용 가중치를 부여하는 유사도군집기를 더 포함하는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템.
  7. 제 6항에 있어서,
    상기 유사도군집기는 데이터의 유사도를 판별함에 있어, 유클리디언 거리, 마할라노비스거리, 민코스키거리, 코사인 유사도와 같은 측정 알고리즘 중 어느 하나를 이용하는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템.
  8. 소규모 학습 데이터 셋 기반 딥러닝 시스템을 이용한 딥러닝 학습방법에 있어서,
    불균형 분석장치부(10)를 이용하여 딥러닝 모델 학습을 위해, 입력되는 학습 데이터 셋에서 데이터 불균형을 판단하는 단계(S10);
    상기 불균형을 판단하는 단계(S10) 후 데이터 불균형 상황에서 소규모 학습 데이터 셋과 참조 데이터 셋으로 분리하는 단계(S20);
    소규모 학습 데이터 셋과 참조 데이터 셋을 입력받아 데이터 생성부(20)를 통하여 새로운 데이터 셋을 생성하는 단계(S30);
    상기 데이터 셋을 생성하는 단계(S30) 후 생성된 데이터와 소규모 학습 데이터와의 비교를 통해 가상으로 생성된 데이터 셋인지 판단하는 단계(S40);
    데이터 생성부(20)의 확률계산유니트를 통하여 검증된 검증 확률값이 0.5에 수렴함에 따라 생성 학습데이터를 선택하는 단계(S50);
    데이터 생성부(20)의 모델검증유니트(22)를 통하여 학습 데이터 셋에서 데이터 사이의 유사도를 측정하는 단계(S60);
    유사도에 따라 데이터를 클러스터링 하는 단계(S70);
    유사도 정보에 따라 기존 학습된 딥러닝 모델을 적용하는 단계(S80);
    적용된 딥러닝 모델의 가중치와 하이퍼 파라미터를 지정하는 단계(S90); 및 생성된 학습 데이터 셋과 가중치, 하이퍼 파라미터 초기값을 지정하여 딥러닝 모델을 학습하는 단계(S100); 및
    학습된 딥러닝 모델을 통해서 추론을 수행하는 단계(S110)로 구성되는 것을 특징으로 하는 소규모 학습 데이터 셋 기반 딥러닝 시스템을 이용한 딥러닝 학습방법.

KR1020200062746A 2020-05-26 2020-05-26 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법 KR102418596B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200062746A KR102418596B1 (ko) 2020-05-26 2020-05-26 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200062746A KR102418596B1 (ko) 2020-05-26 2020-05-26 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법

Publications (2)

Publication Number Publication Date
KR20210145923A true KR20210145923A (ko) 2021-12-03
KR102418596B1 KR102418596B1 (ko) 2022-07-06

Family

ID=78866783

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200062746A KR102418596B1 (ko) 2020-05-26 2020-05-26 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법

Country Status (1)

Country Link
KR (1) KR102418596B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114638336A (zh) * 2021-12-26 2022-06-17 海南大学 聚焦于陌生样本的不平衡学习
WO2023113507A1 (ko) * 2021-12-16 2023-06-22 한국과학기술원 기 학습된 딥러닝 모델의 재활용을 위한 메타 입력 방법 및 시스템과, 메타 입력을 통한 사용자 중심 추론 방법 및 시스템
KR20230095224A (ko) * 2021-12-22 2023-06-29 고려대학교 산학협력단 메타 학습을 통한 삼차원 사람 메쉬 복원 방법 및 장치
WO2023132384A1 (ko) * 2022-01-06 2023-07-13 엘지전자 주식회사 전이 학습 수행 방법, 통신 기기, 프로세싱 장치 및 저장 매체
KR102649303B1 (ko) * 2024-01-09 2024-03-20 국방과학연구소 전자 장치 및 그의 다중로봇 탐사영역 관리 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240041647A (ko) * 2022-09-23 2024-04-01 한국전자기술연구원 IoT 플랫폼에서 정책 리소스를 활용한 ML 데이터셋 관리 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102019208B1 (ko) 2019-01-29 2019-11-14 (주)그리드원 딥 러닝 기반의 오류 분류 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102019208B1 (ko) 2019-01-29 2019-11-14 (주)그리드원 딥 러닝 기반의 오류 분류 방법 및 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ARAM SONG ET AL: "Veranderingsdetectie van satellietbeelden met hoge resolutie met behulp van transfer learning en deep learning-netwerken", JOURNAL OF THE KOREAN SOCIETY OF SURVEYING, GEODESY, vol. 37, no. 3, 2019, pages 199 - 208 *
SON MIN JAE, JUNG SEUNG WON, HWANG EEN JUN: "A Deep Learning Based Over-Sampling Scheme for Imbalanced Data Classification", KIPS TRANSACTIONS ON SOFTWARE AND DATA ENGINEERING, vol. 8, no. 7, 7 August 2019 (2019-08-07), pages 311 - 316, XP055823196, ISSN: 2287-5905, DOI: 10.3745/KTSDE.2019.8.7.311 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023113507A1 (ko) * 2021-12-16 2023-06-22 한국과학기술원 기 학습된 딥러닝 모델의 재활용을 위한 메타 입력 방법 및 시스템과, 메타 입력을 통한 사용자 중심 추론 방법 및 시스템
KR20230095224A (ko) * 2021-12-22 2023-06-29 고려대학교 산학협력단 메타 학습을 통한 삼차원 사람 메쉬 복원 방법 및 장치
CN114638336A (zh) * 2021-12-26 2022-06-17 海南大学 聚焦于陌生样本的不平衡学习
CN114638336B (zh) * 2021-12-26 2023-09-22 海南大学 聚焦于陌生样本的不平衡学习
WO2023132384A1 (ko) * 2022-01-06 2023-07-13 엘지전자 주식회사 전이 학습 수행 방법, 통신 기기, 프로세싱 장치 및 저장 매체
KR102649303B1 (ko) * 2024-01-09 2024-03-20 국방과학연구소 전자 장치 및 그의 다중로봇 탐사영역 관리 방법

Also Published As

Publication number Publication date
KR102418596B1 (ko) 2022-07-06

Similar Documents

Publication Publication Date Title
KR102418596B1 (ko) 소규모 학습 데이터 셋 기반 딥러닝 시스템과 이를 이용한 딥러닝 학습방법
CN109154976A (zh) 通过机器学习训练对象分类器的系统和方法
US20100014755A1 (en) System and method for grid-based image segmentation and matching
CN112101426A (zh) 基于自编码器的无监督学习图像异常检测方法
CN111915437A (zh) 基于rnn的反洗钱模型的训练方法、装置、设备及介质
KR20200119391A (ko) 비디오 행동 인식 및 행동 구간 탐지 장치 및 방법
KR102488789B1 (ko) 인공지능 기반 단일 클래스 이상 탐지 모델을 이용한 예측 분류 방법, 장치 및 프로그램
CN112926522B (zh) 一种基于骨骼姿态与时空图卷积网络的行为识别方法
Vengatesan et al. Face recognition of identical twins based on support vector machine classifier
US7233692B2 (en) Method and computer program product for identifying output classes with multi-modal dispersion in feature space and incorporating multi-modal structure into a pattern recognition system
CN115277189B (zh) 基于生成式对抗网络的无监督式入侵流量检测识别方法
Siddalingappa et al. Anomaly detection on medical images using autoencoder and convolutional neural network
KR102230559B1 (ko) 데이터 프로그래밍에 기반한 레이블링 모델 생성 방법 및 장치
KR102342495B1 (ko) 데이터 프로그래밍에 기반한 레이블링 모델 생성 방법 및 장치
CN114943873A (zh) 一种工地人员异常行为分类方法及装置
KR20230060214A (ko) 인공지능 기반 영상 객체 추적 장치 및 방법
Arshad et al. Anomalous situations recognition in surveillance images using deep learning
Olga et al. Big data analysis methods based on machine learning to ensure information security
Bilski et al. Decision trees implementation in monitoring of elderly persons based on the depth sensors data
CN113722230A (zh) 针对模糊测试工具漏洞挖掘能力的集成化评估方法及装置
al Atrash et al. Detecting and Counting People's Faces in Images Using Convolutional Neural Networks
Miakshyn et al. Face Recognition Technology Improving Using Convolutional Neural Networks
Konate et al. A comparison of saliency methods for deep learning explainability
WO2022181303A1 (ja) アンサンブル学習システムおよびアンサンブル学習プログラム
CN114760484B (zh) 直播视频识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant