KR102079381B1 - 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기 - Google Patents

소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기 Download PDF

Info

Publication number
KR102079381B1
KR102079381B1 KR1020180015341A KR20180015341A KR102079381B1 KR 102079381 B1 KR102079381 B1 KR 102079381B1 KR 1020180015341 A KR1020180015341 A KR 1020180015341A KR 20180015341 A KR20180015341 A KR 20180015341A KR 102079381 B1 KR102079381 B1 KR 102079381B1
Authority
KR
South Korea
Prior art keywords
random forest
class
student
teacher
applying
Prior art date
Application number
KR1020180015341A
Other languages
English (en)
Other versions
KR20190095847A (ko
Inventor
고병철
남재열
정미라
김상준
Original Assignee
계명대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 계명대학교 산학협력단 filed Critical 계명대학교 산학협력단
Priority to KR1020180015341A priority Critical patent/KR102079381B1/ko
Publication of KR20190095847A publication Critical patent/KR20190095847A/ko
Application granted granted Critical
Publication of KR102079381B1 publication Critical patent/KR102079381B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06K9/6267

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에 관한 것으로서, 보다 구체적으로는 랜덤 포레스트 분류 방법으로서, (1) 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 단계; (2) 상기 단계 (1)에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 단계; (3) 상기 단계 (2)에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 단계; 및 (4) 상기 단계 (3)에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 단계를 포함하는 것을 그 구성상의 특징으로 한다.
또한, 본 발명은 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기에 관한 것으로서, 보다 구체적으로는 랜덤 포레스트 분류 방법을 이용한 분류기로서, (1) 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 Teacher 랜덤 포레스트 학습 모듈; (2) 상기 Teacher 랜덤 포레스트 학습 모듈에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 클래스 확률값 추출 모듈; (3) 상기 클래스 확률값 추출 모듈에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 Student 랜덤 포레스트 학습 모듈; 및 (4) 상기 Student 랜덤 포레스트 학습 모듈에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 분류 모듈을 포함하는 것을 그 구성상의 특징으로 한다.
본 발명에서 제안하고 있는 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기에 따르면, 기존의 랜덤 포레스트 학습 방법을 이용하여 Teacher 랜덤 포레스트를 학습시키고, 이렇게 학습시켜진 Teacher 랜덤 포레스트를 이용하여 Student 랜덤 포레스트를 위한 데이터 세트를 구성하는 각각의 클래스의 확률값을 추출한 후, 이렇게 각각의 클래스의 확률값이 추출된 데이터 세트를 이용하여 Student 랜덤 포레스트를 학습시킴으로써, 랜덤 포레스트의 성능은 유지하면서도 랜덤 포레스트의 트리의 수를 줄여 처리 시간 및 메모리양을 대폭 줄일 수 있다.

Description

소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기{A METHOD OF LIGHT WEIGHTED RANDOM FOREST CLASSIFICATION USING A SOFT TARGET LEARNING METHOD AND THE CLASSIFIER USING IT}
본 발명은 랜덤 포레스트 분류 방법 및 분류기에 관한 것으로서, 보다 구체적으로는 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 분류기에 관한 것이다.
기계 학습(Machine Learning)에서의 랜덤 포레스트(Random Forest)는 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종으로서, 훈련 과정에서 구성한 다수의 결정 트리로부터 부류(분류) 또는 평균 예측치(회귀 분석)를 출력함으로써 동작한다. 랜덤 포레스트는 여러 개의 결정 트리들을 임의적으로 학습하는 방식의 앙상블 방법이다. 랜덤 포레스트 방법은 크게 다수의 결정 트리를 구성하는 학습 단계와, 입력 벡터가 들어왔을 때 분류하거나 예측하는 테스트 단계로 구성되어 있다. 랜덤 포레스트는 검출, 분류, 그리고 회귀 등 다양한 애플리케이션으로 활용되고 있다. 도 1은 일반적인 랜덤 포레스트 분류 방법의 플로차트를 도시한 도면이다.
랜덤 포레스트의 가장 핵심적인 특징은 임의성(randomness)에 의해 서로 조금씩 다른 특성을 갖는 트리들로 구성된다는 점이다. 이 특징은 각각의 트리들의 예측(prediction)들이 비상관화(decorrelation) 되게 하며, 결과적으로 일반화(generalization) 성능을 향상시킨다. 또한, 임의화(randomization)는 포레스트가 노이즈가 포함된 데이터에 대해서도 강인하게 만들어 준다. 임의화는 각각의 트리들의 훈련 과정에서 진행되며, 가장 널리 쓰이는 두 가지 방법으로는 임의 학습 데이터 추출 방법을 이용한 앙상블 학습법인 배깅(bagging)과 임의 노드 최적화(randomized node optimization)가 있다. 이 두 가지 방법은 서로 동시에 사용되어 임의화 특성을 더욱 증진시킬 수 있다.
랜덤 포레스트에서 가장 큰 영향을 미치는 매개변수들은 포레스트의 크기(트리의 개수)와 최대 허용 깊이 등이다. 이 중, 포레스트의 크기(트리의 개수)는, 총 포레스트를 몇 개의 트리로 구성할지를 결정하는 매개변수이다. 포레스트의 크기가 작으면, 즉 트리의 개수가 적으면 트리들을 구성하고 테스트하는데 걸리는 시간이 짧은 대신, 일반화 능력이 떨어져 임의의 입력 데이터 포인트에 대해 틀린 결과를 내놓을 확률이 높다. 반면에, 포레스트의 크기가 크면, 즉 트리의 개수가 많으면 높은 성능을 보장하지만, 훈련과 테스트 시간이 길어지고 메모리양이 증가하는 단점이 있다. 따라서, 높은 성능은 보장하면서도, 처리 시간 및 메모리양을 줄일 수 있는 개선된 랜덤 포레스트 방법을 개발할 필요성이 있다.
랜덤 포레스트 분류 방법과 관련된 선행특허로서는, 특허 제10-1237089호(발명의 명칭: 랜덤 포레스트 분류 기법을 이용한 산불연기 감지 방법)와 특허 제10-1697183호(발명의 명칭: 인공위성 영상과 랜덤포레스트 분류기 결합을 이용한 자동 하천 검출 시스템 및 방법) 등이 있다.
본 발명은 기존에 제안된 방법들의 상기와 같은 문제점들을 해결하기 위해 제안된 것으로서, 기존의 랜덤 포레스트 학습 방법을 이용하여 Teacher 랜덤 포레스트를 학습시키고, 이렇게 학습시켜진 Teacher 랜덤 포레스트를 이용하여 Student 랜덤 포레스트를 위한 데이터 세트를 구성하는 각각의 클래스의 확률값을 추출한 후, 이렇게 각각의 클래스의 확률값이 추출된 데이터 세트를 이용하여 Student 랜덤 포레스트를 학습시킴으로써, 랜덤 포레스트의 성능은 유지하면서도 랜덤 포레스트의 트리의 수를 줄여 처리 시간 및 메모리양을 대폭 줄일 수 있는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기를 제공하는 것을 그 목적으로 한다.
상기한 목적을 달성하기 위한 본 발명의 특징에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법은,
랜덤 포레스트 분류 방법으로서,
(1) 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 단계;
(2) 상기 단계 (1)에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 단계;
(3) 상기 단계 (2)에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 단계; 및
(4) 상기 단계 (3)에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 단계를 포함하는 것을 그 구성상의 특징으로 한다.
바람직하게는, 상기 Student 랜덤 포레스트는,
상기 Teacher 랜덤 포레스트의 트리의 수보다 작은 값의 트리의 수를 가질 수 있다.
바람직하게는, 상기 단계 (1)에서,
상기 데이트 세트 A는 클래스 레이블이 포함될 수 있다.
바람직하게는, 상기 단계 (2)에서,
상기 데이트 세트 B는 클래스 레이블이 포함되지 않을 수 있다.
바람직하게는, 상기 단계 (3)은,
(3-1) 상기 단계 (2)에서 각각의 클래스의 확률값이 추출된 데이터 세트 B에서, 임의의 데이터를 선택하여 서브 세트를 구성하는 단계;
(3-2) 상기 단계 (3-1)에서 구성된 서브 세트에 대하여, 각각의 내부 노드는 특징 벡터 x에서 파라미터 θi를 무작위로 선택하고, 그 중에서 가장 높은 성능을 갖는 분할 함수 f와 θ를 결정한 후, f(θ, x)를 사용하여 트리를 left(Sl), right(Sr)로 분할하는 과정을, 최대 허용 깊이까지 반복하여 트리를 생성하는 단계; 및
(3-3) 상기 단계 (3-2)에서 생성된 트리에 대하여, 평가 기준을 만족하는 트리를 찾는 과정을, 트리의 개수까지 반복하여 수행하는 단계를 포함할 수 있다.
더욱 바람직하게는, 상기 단계 (3-2)에서,
성능 평가 기준은, 상기 Teacher 랜덤 포레스트에 의해 추출된 클래스 확률 값을 이용하여 계산되는, 분할 함수 f에 대한 엔트로피 값을 이용할 수 있다.
더욱더 바람직하게는, 상기 단계 (3-2)에서,
상기 성능 평가 기준은, 다음 수학식을 이용할 수 있다.
Figure 112018013744642-pat00001
상기 수학식에서, ΔE는 엔트로피의 합, Sn은 n번째 노드에 도달하는 데이터의 집합, Sl, Sr은 각각 n번째 노드에서 왼쪽 혹은 오른쪽의 자식 노드로 들어가는 데이터의 집합, |·|은 데이터 집합에 속한 데이터의 개수를 나타내며, E(S)는 다음 수학식으로 계산될 수 있다.
Figure 112018013744642-pat00002
상기 수학식에서, P(Ci)는 각각의 클래스에 대한 확률 질량 함수를 나타낸다.
더욱 바람직하게는, 상기 단계 (3-3)에서,
상기 성능 평가 기준은, 상기 Teacher 랜덤 포레스트와 상기 Student 랜덤 포레스트에 의해 각각 추출된 클래스 확률값의 교차-엔트로피(cross-entropy)를 이용할 수 있다.
더욱더 바람직하게는, 상기 단계 (3-3)에서,
상기 성능 평가 기준은, 다음 수학식을 이용할 수 있다.
Figure 112018013744642-pat00003
상기 수학식에서, PT(Ci|x(n)), PS(Ci|x(n))는 각각 상기 Teacher 랜덤 포레스트와 상기 Student 랜덤 포레스트 대한, 특징 벡터 x(n)에서의 각각의 클래스에 대한 확률 질량 함수를 나타낸다.
더 더욱 바람직하게는, 상기 단계 (3-3)에서,
상기 계산된 교차-엔트로피(cross-entropy)가 미리 지정된 임계값보다 작을 경우 해당 트리를 사용하되, 그렇지 않을 경우 트리를 재생성할 수 있다.
또한, 상기한 목적을 달성하기 위한 본 발명의 특징에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기는,
랜덤 포레스트 분류 방법을 이용한 분류기로서,
(1) 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 Teacher 랜덤 포레스트 학습 모듈;
(2) 상기 Teacher 랜덤 포레스트 학습 모듈에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 클래스 확률값 추출 모듈;
(3) 상기 클래스 확률값 추출 모듈에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 Student 랜덤 포레스트 학습 모듈; 및
(4) 상기 Student 랜덤 포레스트 학습 모듈에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 분류 모듈을 포함하는 것을 그 구성상의 특징으로 한다.
바람직하게는, 상기 Student 랜덤 포레스트는,
상기 Teacher 랜덤 포레스트의 트리의 수보다 작은 값의 트리의 수를 가질 수 있다.
바람직하게는,
상기 데이트 세트 A는 클래스 레이블이 포함될 수 있다.
바람직하게는,
상기 데이트 세트 B는 클래스 레이블이 포함되지 않을 수 있다.
바람직하게는, 상기 Student 랜덤 포레스트 학습 모듈은,
(3-1) 상기 단계 (2)에서 각각의 클래스의 확률값이 추출된 데이터 세트 B에서, 임의의 데이터를 선택하여 서브 세트를 구성하는 단계;
(3-2) 상기 단계 (3-1)에서 구성된 서브 세트에 대하여, 각각의 내부 노드는 특징 벡터 x에서 파라미터 θi를 무작위로 선택하고, 그 중에서 가장 높은 성능을 갖는 분할 함수 f와 θ를 결정한 후, f(θ, x)를 사용하여 트리를 left(Sl), right(Sr)로 분할하는 과정을, 최대 허용 깊이까지 반복하여 트리를 생성하는 단계; 및
(3-3) 상기 단계 (3-2)에서 생성된 트리에 대하여, 평가 기준을 만족하는 트리를 찾는 과정을, 트리의 개수까지 반복하여 수행하는 단계를 포함하여, Student 랜덤 포레스트를 학습시킬 수 있다.
더욱 바람직하게는, 상기 단계 (3-2)에서,
성능 평가 기준은, 상기 Teacher 랜덤 포레스트에 의해 추출된 클래스 확률 값을 이용하여 계산되는, 분할 함수 f에 대한 엔트로피 값을 이용할 수 있다.
더욱더 바람직하게는, 상기 단계 (3-2)에서,
상기 성능 평가 기준은, 다음 수학식을 이용할 수 있다.
Figure 112018013744642-pat00004
상기 수학식에서, ΔE는 엔트로피의 합, Sn은 n번째 노드에 도달하는 데이터의 집합, Sl, Sr은 각각 n번째 노드에서 왼쪽 혹은 오른쪽의 자식 노드로 들어가는 데이터의 집합, |·|은 데이터 집합에 속한 데이터의 개수를 나타내며, E(S)는 다음 수학식으로 계산될 수 있다.
Figure 112018013744642-pat00005
상기 수학식에서, P(Ci)는 각각의 클래스에 대한 확률 질량 함수를 나타낸다.
더욱 바람직하게는, 상기 단계 (3-3)에서,
상기 성능 평가 기준은, 상기 Teacher 랜덤 포레스트와 상기 Student 랜덤 포레스트에 의해 각각 추출된 클래스 확률값의 교차-엔트로피(cross-entropy)를 이용할 수 있다.
더욱더 바람직하게는, 상기 단계 (3-3)에서,
상기 성능 평가 기준은, 다음 수학식을 이용할 수 있다.
Figure 112018013744642-pat00006
상기 수학식에서, PT(Ci|x(n)), PS(Ci|x(n))는 각각 상기 Teacher 랜덤 포레스트와 상기 Student 랜덤 포레스트 대한, 특징 벡터 x(n)에서의 각각의 클래스에 대한 확률 질량 함수를 나타낸다.
더 더욱 바람직하게는, 상기 단계 (3-3)에서,
상기 계산된 교차-엔트로피(cross-entropy)가 미리 지정된 임계값보다 작을 경우 해당 트리를 사용하되, 그렇지 않을 경우 트리를 재생성할 수 있다.
본 발명에서 제안하고 있는 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기에 따르면, 기존의 랜덤 포레스트 학습 방법을 이용하여 Teacher 랜덤 포레스트를 학습시키고, 이렇게 학습시켜진 Teacher 랜덤 포레스트를 이용하여 Student 랜덤 포레스트를 위한 데이터 세트를 구성하는 각각의 클래스의 확률값을 추출한 후, 이렇게 각각의 클래스의 확률값이 추출된 데이터 세트를 이용하여 Student 랜덤 포레스트를 학습시킴으로써, 랜덤 포레스트의 성능은 유지하면서도 랜덤 포레스트의 트리의 수를 줄여 처리 시간 및 메모리양을 대폭 줄일 수 있다.
도 1은 일반적인 랜덤 포레스트 분류 방법의 플로차트를 도시한 도면.
도 2는 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법의 구성을 도시한 도면.
도 3은 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에서, Student 랜덤 포레스트를 학습시키는 단계 S300의 세부구성을 도시한 도면.
도 4는, 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 알고리즘으로 구현한 것을 나타내는 도면.
도 5 및 도 6은 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에 대한 전체적인 과정을 그림으로 표현한 것으로서, 도 5는 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에서, Teacher 랜덤 포레스트의 학습 과정을 그림으로 표현한 도면이며, 도 6은 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에서, Student 랜덤 포레스트의 학습 과정을 그림으로 표현한 도면.
도 7은, 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기의 구성을 도시한 도면.
이하, 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 바람직한 실시예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시예를 상세하게 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 또한, 유사한 기능 및 작용을 하는 부분에 대해서는 도면 전체에 걸쳐 동일한 부호를 사용한다.
덧붙여, 명세서 전체에서, 어떤 부분이 다른 부분과 ‘연결’ 되어 있다고 할 때, 이는 ‘직접적으로 연결’ 되어 있는 경우뿐만 아니라, 그 중간에 다른 소자를 사이에 두고 ‘간접적으로 연결’ 되어 있는 경우도 포함한다. 또한, 어떤 구성요소를 ‘포함’ 한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다.
도 2는 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법의 구성을 도시한 도면이다. 도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법은, 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 단계(S100); 단계 S100에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 단계(S200); 단계 S200에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 단계(S300); 및 단계 S300에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 단계(S400)를 포함하여 구성될 수 있다.
이때, Student 랜덤 포레스트는, Teacher 랜덤 포레스트의 트리의 수보다 작은 값의 트리의 수를 가지도록 함으로써, 랜덤 포레스트의 경량화를 달성할 수 있다. 또한, 단계 S100에서 Teacher 랜덤 포레스트를 학습시키는데 사용되는 데이터 세트 A는 클래스 레이블이 포함되도록 설정하고, 단계 S200 및 단계 S300에서 Student 랜덤 포레스트를 학습시키는데 사용되는 데이터 세트 B는 클래스 레이블이 포함되지 않도록 설정할 수 있다.
단계 S100에서는, 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시킨다. 본 단계에서는, 기존의 랜덤 포레스트 학습 방법을 적용함으로써, 종래와 동일한 방식의 랜덤 포레스트가 적용된 일반적인 랜덤 포레스트를 얻게 된다. 본 단계는 사전 처리가 가능한 학습 단계로서, 실질적인 분류 단계의 처리 시간과 무관하므로, 기존의 랜덤 포레스트 학습 방법을 적용한, 충분한 트리의 수를 갖는 랜덤 포레스트를 생성하는 것이 바람직하다. 한편, 데이터 세트 A는, 앞서 언급한 바와 같이, 클래스 레이블이 포함되도록 설정할 수 있다.
단계 S200에서는, 단계 S100에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출한다. 본 단계에서는, 충분한 트리의 수를 갖도록 생성된 Teacher 랜덤 포레스트를 이용하여, 실질적인 분류 단계에서 사용될 Student 랜덤 포레스트를 학습시키는데 사용될 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하게 된다. 데이터 세트 B는, 앞서 언급한 바와 같이, 클래스 레이블이 포함되지 않도록 설정되며, 그 결과 각각의 클래스의 확률값이 추출될 수 있다.
단계 S300에서는, 단계 S200에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시킨다. 본 단계에서는, Teacher 랜덤 포레스트를 이용하여 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키게 된다.
도 3은 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에서, Student 랜덤 포레스트를 학습시키는 단계 S300의 세부구성을 도시한 도면이다. 도 3에 도시된 바와 같이, 단계 S300은, 단계 S200에서 각각의 클래스의 확률값이 추출된 데이터 세트 B에서, 임의의 데이터를 선택하여 서브 세트를 구성하는 단계(S310); 단계 S310에서 구성된 서브 세트에 대하여, 각각의 내부 노드는 특징 벡터 x에서 파라미터 θi를 무작위로 선택하고, 그 중에서 가장 높은 성능을 갖는 분할 함수 f와 θ를 결정한 후, f(θ, x)를 사용하여 트리를 left(Sl), right(Sr)로 분할하는 과정을, 최대 허용 깊이까지 반복하여 트리를 생성하는 단계(S320); 및 단계 S320에서 생성된 트리에 대하여, 평가 기준을 만족하는 트리를 찾는 과정을, 트리의 개수까지 반복하여 수행하는 단계(S330)를 포함하여 구성될 수 있다.
단계 S320에서는, 성능 평가 기준으로서, Teacher 랜덤 포레스트에 의해 추출된 클래스 확률 값을 이용하여 계산되는, 분할 함수 f에 대한 엔트로피 값을 이용할 수 있으며, 이는 다음 수학식 1과 같이 계산될 수 있다.
Figure 112018013744642-pat00007
상기 수학식 1에서, ΔE는 엔트로피의 합, Sn은 n번째 노드에 도달하는 데이터의 집합, Sl, Sr은 각각 n번째 노드에서 왼쪽 혹은 오른쪽의 자식 노드로 들어가는 데이터의 집합, |·|은 데이터 집합에 속한 데이터의 개수를 각각 나타내며, E(S)는 다음 수학식 2와 같이 계산될 수 있다.
Figure 112018013744642-pat00008
상기 수학식 2에서, P(Ci)는 각각의 클래스에 대한 확률 질량 함수를 나타낸다. 여기서, 확률 질량 함수(probability mass function, pmf)는, 이산 확률 변수에서 특정 값에 대한 확률을 나타내는 함수로서, 연속 확률 변수에서의 확률 밀도 함수와 대응된다.
단계 S330에서는, 성능 평가 기준으로서, Teacher 랜덤 포레스트와 Student 랜덤 포레스트에 의해 각각 추출된 클래스 확률값의 교차-엔트로피(cross-entropy)를 이용할 수 있으며, 이는 다음 수학식 3과 같이 계산될 수 있다.
Figure 112018013744642-pat00009
상기 수학식 3에서, PT(Ci|x(n)), PS(Ci|x(n))는 각각 Teacher 랜덤 포레스트와 Student 랜덤 포레스트 대한, 특징 벡터 x(n)에서의 각각의 클래스에 대한 확률 질량 함수를 나타낸다.
단계 S330에서는, 이렇게 수학식 3을 통해 계산된 교차-엔트로피(cross-entropy)가 미리 지정된 임계값보다 작을 경우 해당 트리를 사용하되, 그렇지 않을 경우 트리를 재생성할 수 있다.
도 4는, 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 알고리즘으로 구현한 것을 나타내는 도면이다. 도 4를 통해, 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 어떠한 방식으로 알고리즘으로 구현할 수 있는지 확인할 수 있다.
도 5 및 도 6은 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에 대한 전체적인 과정을 그림으로 표현한 것으로서, 도 5는 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에서, Teacher 랜덤 포레스트의 학습 과정을 그림으로 표현한 도면이며, 도 6은 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에서, Student 랜덤 포레스트의 학습 과정을 그림으로 표현한 도면이다.
도 7은, 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기(10)의 구성을 도시한 도면이다. 도 7에 도시된 바와 같이, 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기(10)는, 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 Teacher 랜덤 포레스트 학습 모듈(100); Teacher 랜덤 포레스트 학습 모듈(100)에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 클래스 확률값 추출 모듈(200); 클래스 확률값 추출 모듈(200)에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 Student 랜덤 포레스트 학습 모듈(300); 및 Student 랜덤 포레스트 학습 모듈(300)에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 분류 모듈(400)을 포함하여 구성될 수 있다.
본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기를 구성하는 각각의 구성요소들, 즉 Teacher 랜덤 포레스트 학습 모듈(100), 클래스 확률값 추출 모듈(200), Student 랜덤 포레스트 학습 모듈(300), 및 분류 모듈(400)의 구체적인 역할 및 구성에 대해서는, 도 2 내지 도 6을 통해 이루어진, 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법에 대한 설명에서 충분히 확인할 수 있으므로, 상세한 설명은 생략하도록 한다.
상술한 바와 같이, 본 발명에서 제안하고 있는 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기에 따르면, 기존의 랜덤 포레스트 학습 방법을 이용하여 Teacher 랜덤 포레스트를 학습시키고, 이렇게 학습시켜진 Teacher 랜덤 포레스트를 이용하여 Student 랜덤 포레스트를 위한 데이터 세트를 구성하는 각각의 클래스의 확률값을 추출한 후, 이렇게 각각의 클래스의 확률값이 추출된 데이터 세트를 이용하여 Student 랜덤 포레스트를 학습시킴으로써, 랜덤 포레스트의 성능은 유지하면서도 랜덤 포레스트의 트리의 수를 줄여 처리 시간 및 메모리양을 대폭 줄일 수 있다.
이상 설명한 본 발명은 본 발명이 속한 기술분야에서 통상의 지식을 가진 자에 의하여 다양한 변형이나 응용이 가능하며, 본 발명에 따른 기술적 사상의 범위는 아래의 특허청구범위에 의하여 정해져야 할 것이다.
10: 본 발명의 일실시예에 따른 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기
100: Teacher 랜덤 포레스트 학습 모듈
200: 클래스 확률값 추출 모듈
300: Student 랜덤 포레스트 학습 모듈
400: 분류 모듈
S100: 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 단계
S200: 단계 S100에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 단계
S300: 단계 S200에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 단계
S310: 단계 S200에서 각각의 클래스의 확률값이 추출된 데이터 세트 B에서, 임의의 데이터를 선택하여 서브 세트를 구성하는 단계
S320: 단계 S310에서 구성된 서브 세트에 대하여, 각각의 내부 노드는 특징 벡터 x에서 파라미터 θi를 무작위로 선택하고, 그 중에서 가장 높은 성능을 갖는 분할 함수 f와 θ를 결정한 후, f(θ, x)를 사용하여 트리를 left(Sl), right(Sr)로 분할하는 과정을, 최대 허용 깊이까지 반복하여 트리를 생성하는 단계
S330: 단계 S320에서 생성된 트리에 대하여, 평가 기준을 만족하는 트리를 찾는 과정을, 트리의 개수까지 반복하여 수행하는 단계
S400: 단계 S300에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 단계

Claims (20)

  1. 랜덤 포레스트 분류 방법으로서,
    (1) Teacher 랜덤 포레스트 학습 모듈이, 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 단계;
    (2) 클래스 확률값 추출 모듈이, 상기 단계 (1)에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 단계;
    (3) Student 랜덤 포레스트 학습 모듈이, 상기 단계 (2)에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 단계; 및
    (4) 분류 모듈이, 상기 단계 (3)에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 단계를 포함하며,
    상기 단계 (3)은,
    (3-1) 상기 단계 (2)에서 각각의 클래스의 확률값이 추출된 데이터 세트 B에서, 임의의 데이터를 선택하여 서브 세트를 구성하는 단계;
    (3-2) 상기 단계 (3-1)에서 구성된 서브 세트에 대하여, 각각의 내부 노드는 특징 벡터 x에서 파라미터 θi를 무작위로 선택하고, 그 중에서 가장 높은 성능을 갖는 분할 함수 f와 θ를 결정한 후, f(θ, x)를 사용하여 트리를 left(Sl), right(Sr)로 분할하는 과정을, 최대 허용 깊이까지 반복하여 트리를 생성하는 단계; 및
    (3-3) 상기 단계 (3-2)에서 생성된 트리에 대하여, 평가 기준을 만족하는 트리를 찾는 과정을, 트리의 개수까지 반복하여 수행하는 단계를 포함하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
  2. 제1항에 있어서, 상기 Student 랜덤 포레스트는,
    상기 Teacher 랜덤 포레스트의 트리의 수보다 작은 값의 트리의 수를 갖는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
  3. 제1항에 있어서, 상기 단계 (1)에서,
    상기 데이트 세트 A는 클래스 레이블이 포함되는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
  4. 제1항에 있어서, 상기 단계 (2)에서,
    상기 데이터 세트 B는 클래스 레이블이 포함되지 않는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
  5. 삭제
  6. 제1항에 있어서, 상기 단계 (3-2)에서,
    상기 성능의 평가 기준은, 상기 Teacher 랜덤 포레스트에 의해 추출된 클래스 확률 값을 이용하여 계산되는, 분할 함수 f에 대한 엔트로피 값을 이용하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
  7. 제6항에 있어서, 상기 단계 (3-2)에서,
    상기 성능의 평가 기준은, 다음 수학식을 이용하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
    Figure 112020500496011-pat00010

    상기 수학식에서, ΔE는 엔트로피의 합, Sn은 n번째 노드에 도달하는 데이터의 집합, Sl, Sr은 각각 n번째 노드에서 왼쪽 혹은 오른쪽의 자식 노드로 들어가는 데이터의 집합, |·|은 데이터 집합에 속한 데이터의 개수를 나타내며, E(S)는 다음 수학식으로 계산됨.
    Figure 112020500496011-pat00011

    상기 수학식에서, P(Ci)는 각각의 클래스에 대한 확률 질량 함수를 나타냄.
  8. 제1항에 있어서, 상기 단계 (3-3)에서,
    상기 성능의 평가 기준은, 상기 Teacher 랜덤 포레스트와 상기 Student 랜덤 포레스트에 의해 각각 추출된 클래스 확률값의 교차-엔트로피(cross-entropy)를 이용하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
  9. 제8항에 있어서, 상기 단계 (3-3)에서,
    상기 성능의 평가 기준은, 다음 수학식을 이용하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
    Figure 112020500496011-pat00012

    상기 수학식에서, PT(Ci|x(n)), PS(Ci|x(n))는 각각 상기 Teacher 랜덤 포레스트와 상기 Student 랜덤 포레스트 대한, 특징 벡터 x(n)에서의 각각의 클래스에 대한 확률 질량 함수를 나타냄.
  10. 제9항에 있어서, 상기 단계 (3-3)에서,
    상기 계산된 교차-엔트로피(cross-entropy)가 미리 지정된 임계값보다 작을 경우 해당 트리를 사용하되, 그렇지 않을 경우 트리를 재생성하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법.
  11. 랜덤 포레스트 분류 방법을 이용한 분류기로서,
    (1) 데이트 세트 A를 이용하여, 기존의 랜덤 포레스트 학습 방법을 적용하여 Teacher 랜덤 포레스트를 학습시키는 Teacher 랜덤 포레스트 학습 모듈;
    (2) 상기 Teacher 랜덤 포레스트 학습 모듈에서 학습시켜진 Teacher 랜덤 포레스트를 이용하여, Student 랜덤 포레스트를 위한 데이터 세트 B를 구성하는 각각의 클래스의 확률값을 추출하는 클래스 확률값 추출 모듈;
    (3) 상기 클래스 확률값 추출 모듈에서 각각의 클래스의 확률값이 추출된 데이터 세트 B를 이용하여, Student 랜덤 포레스트를 학습시키는 Student 랜덤 포레스트 학습 모듈; 및
    (4) 상기 Student 랜덤 포레스트 학습 모듈에서 학습시켜진 Student 랜덤 포레스트를 이용하여 분류를 수행하는 분류 모듈을 포함하며,
    상기 Student 랜덤 포레스트 학습 모듈은,
    (3-1) 상기 클래스 확률값 추출 모듈에서 각각의 클래스의 확률값이 추출된 데이터 세트 B에서, 임의의 데이터를 선택하여 서브 세트를 구성하는 단계;
    (3-2) 상기 단계 (3-1)에서 구성된 서브 세트에 대하여, 각각의 내부 노드는 특징 벡터 x에서 파라미터 θi를 무작위로 선택하고, 그 중에서 가장 높은 성능을 갖는 분할 함수 f와 θ를 결정한 후, f(θ, x)를 사용하여 트리를 left(Sl), right(Sr)로 분할하는 과정을, 최대 허용 깊이까지 반복하여 트리를 생성하는 단계; 및
    (3-3) 상기 단계(3-2)에서 생성된 트리에 대하여, 평가 기준을 만족하는 트리를 찾는 과정을, 트리의 개수까지 반복하여 수행하는 단계를 포함하여, Student 랜덤 포레스트를 학습시키는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
  12. 제11항에 있어서, 상기 Student 랜덤 포레스트는,
    상기 Teacher 랜덤 포레스트의 트리의 수보다 작은 값의 트리의 수를 갖는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
  13. 제11항에 있어서,
    상기 데이트 세트 A는 클래스 레이블이 포함되는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
  14. 제11항에 있어서,
    상기 데이터 세트 B는 클래스 레이블이 포함되지 않는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
  15. 삭제
  16. 제11항에 있어서, 상기 단계 (3-2)에서,
    상기 성능의 평가 기준은, 상기 Teacher 랜덤 포레스트에 의해 추출된 클래스 확률 값을 이용하여 계산되는, 분할 함수 f에 대한 엔트로피 값을 이용하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
  17. 제16항에 있어서, 상기 단계 (3-2)에서,
    상기 성능의 평가 기준은, 다음 수학식을 이용하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
    Figure 112020500496011-pat00013

    상기 수학식에서, ΔE는 엔트로피의 합, Sn은 n번째 노드에 도달하는 데이터의 집합, Sl, Sr은 각각 n번째 노드에서 왼쪽 혹은 오른쪽의 자식 노드로 들어가는 데이터의 집합, |·|은 데이터 집합에 속한 데이터의 개수를 나타내며, E(S)는 다음 수학식으로 계산됨.
    Figure 112020500496011-pat00014

    상기 수학식에서, P(Ci)는 각각의 클래스에 대한 확률 질량 함수를 나타냄.
  18. 제11항에 있어서, 상기 단계 (3-3)에서,
    상기 성능의 평가 기준은, 상기 Teacher 랜덤 포레스트와 상기 Student 랜덤 포레스트에 의해 각각 추출된 클래스 확률값의 교차-엔트로피(cross-entropy)를 이용하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
  19. 제18항에 있어서, 상기 단계 (3-3)에서,
    상기 성능의 평가 기준은, 다음 수학식을 이용하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
    Figure 112020500496011-pat00015

    상기 수학식에서, PT(Ci|x(n)), PS(Ci|x(n))는 각각 상기 Teacher 랜덤 포레스트와 상기 Student 랜덤 포레스트 대한, 특징 벡터 x(n)에서의 각각의 클래스에 대한 확률 질량 함수를 나타냄.
  20. 제19항에 있어서, 상기 단계 (3-3)에서,
    상기 계산된 교차-엔트로피(cross-entropy)가 미리 지정된 임계값보다 작을 경우 해당 트리를 사용하되, 그렇지 않을 경우 트리를 재생성하는 것을 특징으로 하는, 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법을 이용한 분류기.
KR1020180015341A 2018-02-07 2018-02-07 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기 KR102079381B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180015341A KR102079381B1 (ko) 2018-02-07 2018-02-07 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180015341A KR102079381B1 (ko) 2018-02-07 2018-02-07 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기

Publications (2)

Publication Number Publication Date
KR20190095847A KR20190095847A (ko) 2019-08-16
KR102079381B1 true KR102079381B1 (ko) 2020-04-07

Family

ID=67806825

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180015341A KR102079381B1 (ko) 2018-02-07 2018-02-07 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기

Country Status (1)

Country Link
KR (1) KR102079381B1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101584091B1 (ko) * 2013-08-30 2016-01-12 계명대학교 산학협력단 공유 지역 특징을 이용한 다시점 객체 검출 방법
KR101697183B1 (ko) * 2015-01-29 2017-01-17 계명대학교 산학협력단 인공위성 영상과 랜덤포레스트 분류기 결합을 이용한 자동 하천 검출 시스템 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Nicolas Papernot, Martin Abadi, Úlfar Erlingsson, Ian Goodfellow, Kunal Talwar. Semi-supervised Knowledge Transfer for Deep Learning from Private Training Data. ICLR 2017. 2017.03.03.*
김상준,허두영,정미라,고병철,남재열. 소프트 타겟 학습 기법을 활용한 랜덤 포레스트 경량화와 이를 이용한 보행자 검출. 한국정보과학회. 학술발표논문집 2017.12. 811-813. 출처: http://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE07322307*

Also Published As

Publication number Publication date
KR20190095847A (ko) 2019-08-16

Similar Documents

Publication Publication Date Title
CN109637546B (zh) 知识蒸馏方法和装置
KR102593440B1 (ko) 멀티미디어 데이터의 캡셔닝 정보를 생성하는 방법, 장치, 디바이스 및 매체
KR102276339B1 (ko) Cnn의 근사화를 위한 학습 장치 및 방법
US20210011989A1 (en) Generating a Challenge-Response For Authentication Using Relations Among Objects
GB2618917A (en) Method for few-shot unsupervised image-to-image translation
Ovando et al. A history and evaluation of catch‐only stock assessment models
US10614207B1 (en) Generating captcha images using variations of the same object
Mu et al. Shaping visual representations with language for few-shot classification
CN106250931A (zh) 一种基于随机卷积神经网络的高分辨率图像场景分类方法
KR102011788B1 (ko) 계층적 시각 특징을 이용한 시각 질의 응답 장치 및 방법
Pasquini et al. Reducing bias in modeling real-world password strength via deep learning and dynamic dictionaries
Chiaroni et al. Learning with a generative adversarial network from a positive unlabeled dataset for image classification
JP2021018588A5 (ko)
Mannocci et al. Machine learning to detect bycatch risk: Novel application to echosounder buoys data in tuna purse seine fisheries
CN109886333A (zh) 一种基于高维空间采样的数据增强方法
KR102036182B1 (ko) 소프트 타겟 학습 기법에 의해 경량화된 랜덤 포레스트 분류 방법을 이용한 보행자 검출 방법 및 시스템
Reddy et al. Pragmatic image compression for human-in-the-loop decision-making
Shenkman et al. Do you see what I see? Capabilities and limits of automated multimedia content analysis
KR102079381B1 (ko) 소프트 타겟 학습 방법을 적용하여 경량화된 랜덤 포레스트 분류 방법 및 이를 이용한 분류기
CN114116995A (zh) 基于增强图神经网络的会话推荐方法、系统及介质
Norman et al. Can CNN‐based species classification generalise across variation in habitat within a camera trap survey?
US11379725B2 (en) Projectile extrapolation and sequence synthesis from video using convolution
Srinivasan et al. Black-box decision based adversarial attack with symmetric α-stable distribution
Leshem Improvement of adaboost algorithm by using random forests as weak learner and using this algorithm as statistics machine learning for traffic flow prediction. Research proposal for a Ph. D
KR102569016B1 (ko) 자동 학습 기반의 데이터 라벨링 방법, 장치 및 컴퓨터 판독가능 저장 매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant