KR102276339B1

KR102276339B1 - Ｃｎｎ의 근사화를 위한 학습 장치 및 방법

Info

Publication number: KR102276339B1
Application number: KR1020140175946A
Authority: KR
Inventors: 박형민
Original assignee: 삼성전자주식회사
Priority date: 2014-12-09
Filing date: 2014-12-09
Publication date: 2021-07-12
Also published as: US20160162782A1; KR20160069834A; US10452979B2

Abstract

CNN의 근사화를 위한 학습 장치 및 방법이 개시된다. 일 양상에 따른, 다수의 컨볼루션 레이어를 포함하는 CNN(Convolutional Neural Network)의 근사화를 위한 학습 방법은, 다수의 컨볼루션 레이어 중 하나를 낮은 계수 근사법(Low Rank Approximation)을 이용하여 근사화하는 단계와, 근사화된 컨볼루션 레이어의 출력 복원 필터의 개수를 근사화에 따른 출력 복원 필터의 개수보다 작은 범위 내에서 변경하는 단계와, 근사화 결과 및 출력 복원 필터의 개수 변경 결과를 기반으로 CNN의 구조를 변경하는 단계와, 변경된 CNN을 학습시키는 단계를 포함할 수 있다.

Description

ＣＮＮ의 근사화를 위한 학습 장치 및 방법{Apparatus and method for training convolutional neural network for approximation of convolutional neural network}

기계 학습(machine learning) 기술에 관한 것으로, 특히, CNN의 근사화를 위한 학습 장치 및 방법에 관한 것이다.

최근 딥러닝(deep learning)이라는 기술이 다양한 분야에서 각광받고 있고, 특히 객체 인식(object recognition) 분야에서는 딥러닝의 일종인 CNN(convolutional neural network)이라는 기술이 각광받고 있다.

CNN은 사람이 물체를 인식할 때 물체의 기본적인 특징들을 추출한 다음 뇌 속에서 복잡한 계산을 거쳐 그 결과를 기반으로 물체를 인식한다는 가정을 기반으로 만들어진 사람의 뇌 기능을 모사한 모델이다. CNN에서는 기본적으로 컨볼루션(convolution) 연산을 통해 영상의 특징을 추출하기 위한 다양한 필터와 비선형적인 특성을 더하기 위한 풀링(pooling) 또는 비선형 활성화(non-linear activation) 함수 등이 함께 사용된다.

한편, CNN은 모델이 클수록 객체 인식의 정확도가 커진다. 따라서, 객체 인식 분야에서는 보통 필요 이상의 큰 모델을 사용하기 때문에, 실제로 영상에서 객체를 인식할 때는 시간이 오래 걸린다는 문제가 있다.

빠른 시간에 영상 데이터를 분류할 있도록 CNN을 근사화하기 위한 학습 장치 및 방법을 제공하는 것을 목적으로 한다.

일 양상에 따른, 다수의 컨볼루션 레이어를 포함하는 CNN(Convolutional Neural Network)의 근사화를 위한 학습 방법은, 다수의 컨볼루션 레이어 중 하나를 낮은 계수 근사법(Low Rank Approximation)을 이용하여 근사화하는 단계와, 근사화된 컨볼루션 레이어의 출력 복원 필터의 개수를 근사화에 따른 출력 복원 필터의 개수보다 작은 범위 내에서 변경하는 단계와, 근사화 결과 및 출력 복원 필터의 개수 변경 결과를 기반으로 CNN의 구조를 변경하는 단계와, 변경된 CNN을 학습시키는 단계를 포함할 수 있다.

학습 방법은, 학습시키는 단계 이후에, 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어 중 적어도 일부의 컨볼루션 레이어에 대하여 순차적으로 근사화하는 단계, 출력 복원 필터 개수를 변경하는 단계, CNN의 구조를 변경하는 단계, 및 학습시키는 단계를 반복 수행하는 단계를 더 포함할 수 있다.

학습 방법은, 학습시키는 단계 이후에, 학습된 CNN을 이용하여 영상 데이터를 분류하는 단계와, 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 출력 복원 필터 개수를 변경하는 단계, CNN의 구조를 변경하는 단계, 및 학습시키는 단계를 반복 수행하는 단계를 더 포함할 수 있다.

학습 방법은, 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어 중 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 단계를 더 포함하고, CNN의 구조를 변경하는 단계는, 적어도 일부의 컨볼루션 레이어의 구조 변경 결과를 더 기반으로 CNN의 구조를 변경할 수 있다.

적어도 일부의 컨볼루션 레이어의 구조를 변경하는 단계는, 적어도 일부의 컨볼루션 레이어의 컨볼루션 필터의 개수를 변경함으로써 적어도 일부의 컨볼루션 레이어의 구조를 변경할 수 있다.

학습 방법은, 학습시키는 단계 이후에, 학습된 CNN을 이용하여 영상 데이터를 분류하는 단계와, 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 단계, CNN의 구조를 변경하는 단계, 및 학습시키는 단계를 반복 수행하는 단계를 더 포함할 수 있다.

근사화하는 단계는, 다수의 컨볼루션 레이어 중 하나를 입력 변환 필터, 컨볼루션 필터, 및 출력 복원 필터로 근사화할 수 있다.

입력 변환 필터는 입력 데이터의 채널의 수를 줄이는 필터이고, 컨볼루션 필터는 채널 수가 줄어든 입력 데이터에 대해 컨볼루션 연산을 수행하는 필터이고, 출력 복원 필터는 컨볼루션 연산 결과를 컨볼루션 레이어와 동일한 채널 개수로 복원하는 필터일 수 있다.

다른 양상에 따른, 다수의 컨볼루션 레이어를 포함하는 CNN(Convolutional Neural Network)의 근사화를 위한 학습 장치는, 다수의 컨볼루션 레이어 중 하나를 낮은 계수 근사법(Low Rank Approximation)을 이용하여 근사화하는 근사화부와, 근사화된 컨볼루션 레이어의 출력 복원 필터의 개수를 근사화에 따른 출력 복원 필터의 개수보다 작은 범위 내에서 변경하는 필터 개수 변경부와, 근사화 결과 및 출력 복원 필터의 개수 변경 결과를 기반으로 CNN의 구조를 변경하고, 변경된 CNN을 학습시키는 학습부를 포함할 수 있다.

근사화부는, 변경된 CNN의 학습이 완료될 때마다 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어를 순차적으로 근사화할 수 있다.

학습 장치는, 학습된 CNN을 이용하여 영상 데이터를 분류하는 분류부를 더 포함하고, 변경부는, 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 출력 복원 필터의 개수를 재변경할 수 있다.

학습 장치는, 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어 중 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 레이어 구조 변경부를 더 포함하고, 학습부는, 적어도 일부의 컨볼루션 레이어의 구조 변경 결과를 더 기반으로 CNN의 구조를 변경할 수 있다.

레이어 구조 변경부는, 적어도 일부의 컨볼루션 레이어의 컨볼루션 필터의 개수를 변경함으로써 적어도 일부의 컨볼루션 레이어의 구조를 변경할 수 있다.

학습 장치는, 학습된 CNN을 이용하여 영상 데이터를 분류하는 분류부를 더 포함하고, 레이어 구조 변경부는, 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 적어도 일부의 컨볼루션 레이어의 구조를 재변경할 수 있다.

근사화부는, 다수의 컨볼루션 레이어 중 하나를 입력 변환 필터, 컨볼루션 필터, 및 출력 복원 필터로 근사화할 수 있다.

CNN을 다중 계층을 고려하여 근사화 및 학습시킴으로써 CNN을 통한 연산 속도를 증가시킬 수 있다.

도 1은 CNN(Convolutional Neural Network) 구조를 도시한 도면이다.
도 2는 CNN의 근사화를 위한 학습 장치의 일 실시예를 도시한 블록도이다.
도 3는 도 2의 근사화부(210)가 컨볼루션 레이어를 근사화한 예를 도시한 도면이다.
도 4a 내지 도 4d는 도 2의 학습 장치(200)의 동작을 설명하기 위한 예시도이다.
도 5는 CNN의 근사화를 위한 학습 방법의 일 실시예를 도시한 흐름도이다.
도 6은 CNN의 근사화를 위한 학습 방법의 다른 실시예를 도시한 흐름도이다.
도 7은 CNN의 근사화를 위한 학습 방법의 또 다른 실시예를 도시한 흐름도이다.

이하, 첨부된 도면을 참조하여 본 발명의 일 실시예를 상세하게 설명한다. 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로, 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.

도 1은 CNN(Convolutional Neural Network) 구조를 도시한 도면이다.

도 1을 참조하면, CNN은 입력 레이어(10), 히든 레이어(20) 및 출력 레이어(30)를 포함한다. 입력 레이어(10)는 입력 영상 데이터(50)를 입력 받는다. 히든 레이어(20)는 다수의 레이어(21, 22)로 구성되고, 각 레이어(21, 22)는 컨볼루션 레이어(23, 25) 및 서브 샘플링 레이어(24, 26)을 포함한다. 컨볼루션 레이어(23, 25)는 컨볼루션 필터를 이용하여 각 레이어(21, 22)에 입력된 영상 데이터(50, 52)에 컨볼루션 연산을 수행하고, 특징 지도(feature map)(51, 53)를 생성한다. 이때, 특징 지도는 입력 영상 데이터(50)의 다양한 특징이 표현된 영상 데이터를 의미한다. 서브 샘플링 레이어(24, 26)는 샘플링 또는 풀링(pooling)을 통해 특징 지도(51, 53)의 크기를 감소시킨다. 출력 레이어(30)는 특징 지도(54)에 표현된 다양한 특징을 조합하여 영상 데이터(50)의 클래스(class)를 분류한다. 이때, 출력 레이어(30)는 완전 연결 레이어(fully connected layer)로 구성될 수 있다.

일반적으로 CNN의 구조(예컨대, 히든 레이어의 수, 각 레이어에서의 필터의 수와 크기 등)는 미리 결정되며, 각 레이어에서의 필터(특히, 컨볼루션 필터)의 가중치 메트릭스(weight matrix)는 이미 어느 클래스에 속할지 정답이 알려진 데이터들을 이용하여 적절한 값으로 산정된다. 이와 같이 이미 정답이 알려진 데이터들을 '학습 데이터'라고 하고, 필터의 가중치 메트릭스를 결정하는 과정을 '학습'이라고 한다.

도 1에 도시된 예는, 4개의 컨볼루션 필터를 이용하여 4개의 특징 지도(51)를 생성하는 제1 컨볼루션 레이어(23), 및 6개의 컨볼루션 필터를 이용하여 6개의 특징 지도(53)를 생성하는 제2 컨볼루션 레이어(25)를 포함하는 CNN의 구조를 도시한 것이다. 이때, 4개의 특징 지도(51)는 4개의 채널을, 6개의 특징 지도(53)는 6개의 채널을 가진다고 한다.

도 2는 CNN의 근사화를 위한 학습 장치의 일 실시예를 도시한 블록도이다.

도 2를 참조하면, 학습 장치(200)는 근사화부(210), 필터 개수 변경부(220), 레이어 구조 변경부(230), 학습부(240), 및 분류부(250)를 포함할 수 있다.

근사화부(210)는 학습된 CNN의 컨볼루션 레이어를 낮은 계수 근사법을 이용하여 근사화할 수 있다. 예컨대, 근사화부(210)는 학습된 컨볼루션 레이어의 컨볼루션 필터(w)를 낮은 계수 근사법(Low Rank Approximation)을 이용하여 입력 변환 필터(α), 컨볼루션 필터(β) 및 출력 복원 필터(γ)로 근사화할 수 있다. 이때, 근사화부(210)는 외적 분해(outer product decomposition)를 이용하여 컨볼루션 필터(w)의 가중치 메트릭스를 입력 변환 필터(α)의 메트릭스, 컨볼루션 필터(β)의 메트릭스 및 출력 복원 필터(γ)의 메트릭스로 분리할 수 있다.

여기서, 입력 변환 필터(α)는 입력 영상 데이터의 채널 수를 줄이는 필터이고, 컨볼루션 필터(β)는 채널 수가 줄어든 입력 영상 데이터에 컨볼루션 연산을 수행하여 특징 지도를 생성하는 필터이다. 또한, 출력 복원 필터(γ)는 컨볼루션 필터(β)에서 생성된 특징 지도를 컨볼루션 필터(w)의 출력 영상 데이터의 채널 수와 동일한 채널 수로 복원하는 필터이다.

이때, 입력 변환 필터(α)의 개수 및 컨볼루션 필터(β)의 개수는 사용자에 의해 미리 결정될 수 있다.

필터 개수 변경부(220)는 출력 복원 필터(γ)의 개수를 근사화에 따른 출력 복원 필터(γ)의 개수보다 작은 범위 내에서 변경할 수 있다. 예컨대, 근사화된 컨볼루션 레이어가 6개의 출력 복원 필터(γ)를 포함한다고 가정하면, 필터 개수 변경부(220)는 출력 복원 필터(γ)의 개수를 1개 내지 5개 중 하나로 변경할 수 있다. 이때, 출력 복원 필터(γ)의 개수는 임의의 개수로 변경될 수도 있으며, 사용자의 입력에 따라 변경될 수도 있다.

레이어 구조 변경부(230)는 근사화된 컨볼루션 레이어 다음의 컨볼루션 레이어들(이하, 다음 컨볼루션 레이어)의 구조를 변경할 수 있다. 일 실시예에 따르면, 구조 변경부(250)는 다음 컨볼루션 레이어의 컨볼루션 필터 개수를 변경함으로써 다음 컨볼루션 레이어의 구조를 변경할 수 있다. 예컨대, CNN이 3개의 컨볼루션 레이어(제1 컨볼루션 레이어 내지 제3 컨볼루션 레이어)를 포함하고, 근사화부(210)에서 제1 컨볼루션 레이어를 근사화하였다고 가정하면, 레이어 구조 변경부(230)는 제2 컨볼루션 레이어 및 제3 컨볼루션 레이어 중 적어도 하나의 컨볼루션 필터의 개수를 변경하여 그 구조를 변경할 수 있다. 이때, 컨볼루션 필터의 개수는 임의의 개수로 변경될 수도 있으며, 사용자의 입력에 따라 변경될 수도 있다.

학습부(240)는 근사화부(210)의 근사화 결과, 필터 개수 변경부(220)의 출력 복원 필터(γ) 개수 변경 결과 및 레이어 구조 변경부(230)의 다음 컨볼루션 레이어의 구조 변경 결과를 기반으로 CNN의 구조를 변경하고, 학습 데이터를 이용하여 변경된 구조의 CNN을 학습시킬 수 있다. 이때, 학습부(240)는 입력 변환 필터(α)의 값 및 컨볼루션 필터(β)의 값을 고정시키고, 변경된 구조의 CNN을 학습시킬 수 있다.

컨볼루션 레이어의 근사화, 출력 복원 필터(γ)의 개수 변경, 및 다음 컨볼루션 레이어의 구조 변경으로 인하여 CNN의 구조가 변경되어, 기존의 학습 결과는 구조가 변경된 CNN에 적용될 수 없게 된다. 따라서, 변경된 구조의 CNN을 학습시키는 과정이 필요하며, 학습부(230)에서 이러한 기능을 수행한다.

일 실시예에 따르면, 학습부(230)는 오류 역전파(back propagation) 학습 방법을 이용하여 변경된 구조의 CNN을 학습시킬 수 있다.

일반적으로 오류 역전파 학습 방법은 주어진 데이터의 정답과 현재 모델의 예측 값과의 함수로 나타내어지는 손실함수(loss function)를 최소화하기 위해 최적화 기법 중의 하나인 기울기 하강(gradient descent) 방법을 효율적으로 구현하는 방법이다. 이때, 기울기 하강 방법은 변경 가능한 각각의 가중치들을 기준으로 편미분한 기울기 벡터(gradient vector)에 현재 가중치를 대입한 현 위치의 기울기에 어떤 정해진 수를 곱하여 빼는 과정을 여러 번 반복하여 최소값을 찾는 방법이다. 이러한 기울기 벡터를 구하는 방식이 오류 역전파 학습 방법이라 할 수 있다.

분류부(250)는 학습된 CNN을 이용하여 영상 데이터를 분류할 수 있다. 이때, 분류 결과는 영상 데이터가 속하는 클래스 및 분류 정확도를 포함할 수 있다.

일 실시예에 따르면, 필터 개수 변경부(220)는 분류부(250)의 분류 정확도가 설정된 기준을 만족하지 않는 경우, 출력 복원 필터(γ)의 개수를 근사화에 따른 출력 복원 필터(γ)의 개수보다 작은 범위 내에서 재변경할 수 있다. 이 경우, 학습부(240)는 재변경된 출력 복원 필터(γ) 개수를 기초로 CNN의 구조를 재변경하고, 재변경된 CNN을 학습시킬 수 있다. 즉, 일 실시예에 따른 학습 장치(200)는 출력 복원 필터(γ)의 개수를 조정함으로써 분류의 정확도가 높은 CNN의 구조를 찾는 것이 가능하다.

일 실시예에 따르면, 레이어 구조 변경부(230)는 분류부(250)의 분류 정확도가 설정된 기준을 만족하지 않는 경우, 다음 컨볼루션 레이어의 구조를 재변경할 수 있다. 이 경우, 학습부(240)는 구조가 재변경된 다음 컨볼루션 레이어를 기초로 CNN의 구조를 재변경하고, 재변경된 CNN을 학습시킬 수 있다. 즉, 일 실시예에 따른 학습 장치(200)는 다음 컨볼루션 레이어의 구조를 변경함으로써 분류의 정확도가 높은 CNN의 구조를 찾는 것이 가능하다.

한편, 필터 개수 변경부(220) 및 레이어 구조 변경부(240)는 사용자의 입력에 따라 출력 복원 필터(γ)의 개수 및 다음 컨볼루션 레이어의 구조를 각각 변경하는 것도 가능하다.

일 실시예에 따르면, 학습 장치(200)는 CNN의 모든 또는 일부 컨볼루션 레이어에 대하여 레이어의 순서에 따라 순차적으로 근사화, 출력 복원 필터(γ) 개수 변경, 다음 컨볼루션 레이어의 구조 변경 및 학습을 반복 수행할 수 있다. 자세하게는, 근사화부(210), 필터 개수 변경부(220), 레이어 구조 변경부(230) 및 학습부(240)는 CNN의 모든 또는 일부 컨볼루션 레이어에 대하여 순차적으로 근사화, 출력 복원 필터(γ) 개수 변경, 다음 컨볼루션 레이어의 구조 변경 및 학습을 반복 수행하도록 구현될 수 있다.

이에 대한 자세한 설명은 도 4a 내지 도 4d를 참조하여 후술하기로 한다.

도 3는 도 2의 근사화부(210)가 컨볼루션 레이어를 근사화한 예를 도시한 도면이다.

도 3를 참조하면, 4채널 입력 영상 데이터(310)를 입력 받아 6개의 컨볼루션 필터(w)(315)를 이용하여 6채널 출력 영상 데이터(320), 즉, 6개의 특징 지도를 출력하는 컨볼루션 레이어를 근사화 한다고 가정한다. 이때, 근사화부(210)는 낮은 계수 근사법(Low Rank Approximation)을 이용하여 6개의 컨볼루션 필터(w)(315)를 입력 영상 데이터(310)의 채널의 수를 4개에서 2개로 줄이는 입력 변환 필터(α)(325), 입력 변환 필터(α)(325)의 출력인 2채널 영상 데이터(330)에 컨볼루션 연산을 수행하는 2개의 컨볼루션 필터(β)(335), 및 컨볼루션 필터(β)(335)의 출력인 2채널 영상 데이터(340)를 근사화 전과 동일한 개수인 6개의 채널로 복원하는 출력 복원 필터(γ)(345)로 근사화할 수 있다. 이때, 근사화를 위한 입력 변환 필터(α)(325)의 개수 및 컨볼루션 필터(β)(335)의 개수는 사용자에 의해 미리 설정될 수 있다.

이하, 도 4a 내지 도 4d를 참조하여 학습 장치(200)의 동작을 상세하게 설명한다.

도 4a 내지 도 4d는 도 2의 학습 장치(200)의 동작을 설명하기 위한 예시도이다.

도 2 및 도 4a를 참조하면, 근사화부(210)는 CNN(410)의 제1 컨볼루션 레이어(411)를 낮은 계수 근사법을 이용하여 입력 변환 필터(α1)(421a), 2개의 컨볼루션 필터(β1)(421b) 및 출력 복원 필터(γ1)(421c)로 근사화한다. 이때, 컨볼루션 필터(β1)(421b)의 개수는 제1 컨볼루션 레이어(411)의 컨볼루션 필터의 개수보다 작은 범위 내에서 사용자에 의해 설정될 수 있다.

도 2, 도 4a 및 도 4b를 참조하면, 필터 개수 변경부(220)는 근사화된 제1 컨볼루션 레이어(421)의 출력 복원 필터(γ1)(421c)의 개수를 근사화 결과보다 작은 범위 내에서 변경한다. 예컨대, 근사화 결과 출력 복원 필터(γ1)(421c)의 개수가 5개이면, 필터 개수 변경부(220)는 출력 복원 필터(γ1)(421c)의 개수를 3개로 변경할 수 있다. 참조번호 421d는 개수가 변경된 출력 복원 필터(γ1')를 나타낸다.

레이어 구조 변경부(250)는 CNN(410)의 제2 컨볼루션 레이어(413) 및 제3 컨볼루션 레이어(415)의 구조를 변경한다. 도시된 예에서, 레이어 구조 변경부(250)는 제2 컨볼루션 레이어(413)의 컨볼루션 필터의 개수를 6개에서 3개로 변경하고, 제3 컨볼루션 레이어(415)의 컨볼루션 필터의 개수를 4개에서 3개로 변경한다. 참조번호 423은 변경된 제2 컨볼루션 레이어를, 참조번호 425는 변경된 제3 컨볼루션 레이어를 나타낸다.

학습부(230)는 입력 변환 필터(α1)(421a) 및 컨볼루션 필터(β1)(421b)를 고정시키고, 변경된 구조의 CNN(420)을 학습시킨다.

도 2 및 도 4c를 참조하면, 학습부(230)에서 변경된 CNN(420)의 학습이 완료되면, 근사화부(210)는 학습된 CNN(420)의 제2 컨볼루션 레이어(423)를 낮은 계수 근사법을 이용하여 입력 변환 필터(α2)(433a), 2개의 컨볼루션 필터(β2)(433b) 및 출력 복원 필터(γ2)(433c)로 근사화한다. 이때, 컨볼루션 필터(β2)(433b)의 개수는 제2 컨볼루션 레이어(423)의 컨볼루션 필터의 개수보다 작은 범위 내에서 사용자에 의해 설정될 수 있다.

도 2, 도 4c 및 도 4d를 참조하면, 필터 개수 변경부(220)는 근사화된 제2 컨볼루션 레이어(433)의 출력 복원 필터(γ2)(433c)의 개수를 근사화 결과보다 작은 범위 내에서 변경한다. 예컨대, 근사화 결과 출력 복원 필터(γ2)(433c)의 개수가 6개이면, 필터 개수 변경부(220)는 출력 복원 필터(γ2)(433c)의 개수를 4개로 변경할 수 있다. 참조번호 433d는 개수가 변경된 출력 복원 필터(γ2')를 나타낸다.

레이어 구조 변경부(250)는 CNN(420)의 제3 컨볼루션 레이어(425)의 구조를 변경한다. 도시된 예에서, 레이어 구조 변경부(250)는 제3 컨볼루션 레이어(425)의 컨볼루션 필터의 개수를 3개에서 1개로 변경한다.

학습부(230)는 제1 컨볼루션 레이어(422), 입력 변환 필터(α2)(433a) 및 컨볼루션 필터(β2)(433b)를 고정시키고, 변경된 구조의 CNN(430)을 학습시킨다.

도시된 예에서, 마지막 컨볼루션 레이어인 제3 컨볼루션 레이어(435)에 대해서는 근사화, 출력 복원 필터의 개수 변경, 및 학습 과정을 수행하지 않는 것으로 도시하고 있으나, 이에 한정되는 것은 아니다. 즉, 학습 장치(200)는 제3 컨볼루션 레이어(435)에 대해 근사화만 수행하는 것도 가능하고, 근사화, 출력 복원 필터의 개수 변경, 및 학습 과정을 모두 수행하는 것도 가능하다.

또한, 학습 장치(200)는 제1 컨볼루션 레이어에 대해서는 근사화, 출력 복원 필터의 개수 변경, 및 학습 과정을 수행하지 않고, 제2 컨볼루션 레이어 및 제3 컨볼루션 레이어에 대해서만 근사화, 출력 복원 필터의 개수 변경, 및 학습 과정을 수행하는 것도 가능하다.

또한, 학습 장치(200)는 제1 컨볼루션 레이어를 근사화한 후 CNN을 학습시키기 전에, 제2 컨볼루션 레이어 및 제3 컨볼루션 레이어의 구조를 변경하는 과정을 생략할 수도 있고, 제2 컨볼루션 레이어와 제3 컨볼루션 레이어 중 하나에 대해서만 그 구조를 변경하는 과정을 수행하는 것도 가능하다.

도 5는 CNN의 근사화를 위한 학습 방법의 일 실시예를 도시한 흐름도이다.

도 5를 참조하면, 일 실시예에 따른 학습 방법(500)은, 먼저, CNN의 컨볼루션 레이어를 낮은 계수 근사법을 이용하여 근사화한다(510).

예컨대, 학습 장치(200)는 컨볼루션 레이어의 컨볼루션 필터(w)를 낮은 계수 근사법(Low Rank Approximation)을 이용하여 입력 변환 필터(α), 컨볼루션 필터(β) 및 출력 복원 필터(γ)로 근사화할 수 있다. 여기서, 입력 변환 필터(α)는 입력 영상 데이터의 채널 수를 줄이는 필터이고, 컨볼루션 필터(β)는 채널 수가 줄어든 입력 영상 데이터에 컨볼루션 연산을 수행하여 특징 지도를 생성하는 필터이다. 또한, 출력 복원 필터(γ)는 컨볼루션 필터(β)에서 생성된 특징 지도를 컨볼루션 필터(w)의 출력 영상 데이터의 채널 수와 동일한 채널 수로 복원하는 필터이다.

그 후, 근사화된 컨볼루션 레이어의 출력 복원 필터(γ)의 개수를 근사화에 따른 출력 복원 필터(γ)의 개수보다 작은 범위 내에서 변경한다(520). 예컨대, 근사화된 컨볼루션 레이어가 6개의 출력 복원 필터(γ)를 포함한다고 가정하면, 학습 장치(200)는 출력 복원 필터(γ)의 개수를 1개 내지 5개 중 하나로 변경할 수 있다.

그 후, 근사화 결과 및 출력 복원 필터(γ)의 개수 변경 결과를 기반으로 CNN의 구조를 변경하고(530), 변경된 구조의 CNN을 학습시킨다(540). 예컨대, 학습 장치(200)는 변경된 구조의 CNN에서 입력 변환 필터(α)의 값 및 컨볼루션 필터(β)의 값을 고정시키고 변경된 구조의 CNN을 학습시킬 수 있다.

그 후, 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어가 존재하면(550), 단계 510으로 돌아가 다음 컨볼루션 레이어에 대하여 레이어의 순서에 따라 순차적으로 단계 510 내지 단계 540을 수행한다.

도 6은 CNN의 근사화를 위한 학습 방법의 다른 실시예를 도시한 흐름도이다.

도 6을 참조하면, 다른 실시예에 따른 학습 방법(600)은 도 5의 학습 방법(500)에 학습된 CNN을 이용하여 영상 데이터를 분류하는 단계(610) 및 분류 정확도가 설정된 기준을 만족하는지 여부를 판단하는 단계(610)를 더 포함할 수 있다.

학습 방법(600)은 단계 540에서 학습된 변경된 구조의 CNN을 이용하여 영상 데이터를 분류한다(610). 그 후, 분류의 정확도가 설정된 기준을 만족하는지 여부를 판단하고(620), 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 단계 520 내지 540을 다시 수행한다.

예컨대, 학습 장치(200)는 학습된 변경된 구조의 CNN을 이용하여 영상 데이터를 분류한다. 그 후, 학습 장치(200)는 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 출력 복원 필터(γ)의 개수를 근사화 결과보다 작은 범위 내에서 재변경하고, 이를 기반으로 CNN의 구조를 재변경하고 재변경된 CNN을 학습시킬 수 있다.

한편, 학습 방법(600)은 학습된 변경된 구조의 CNN을 이용한 분류의 정확도가 설정된 기준을 만족하는 경우(610), 단계 550을 수행한다.

도 7은 CNN의 근사화를 위한 학습 방법의 또 다른 실시예를 도시한 흐름도이다.

도 7을 참조하면, 또 다른 실시예에 따른 학습 방법(700)은 먼저, CNN의 컨볼루션 레이어를 낮은 계수 근사법을 이용하여 근사화한다(710).

예컨대, 학습 장치(200)는 컨볼루션 레이어의 컨볼루션 필터(w)를 낮은 계수 근사법(Low Rank Approximation)을 이용하여 입력 변환 필터(α), 컨볼루션 필터(β) 및 출력 복원 필터(γ)로 근사화할 수 있다. 이때, 입력 변환 필터(α)의 개수 및 컨볼루션 필터(β)의 개수는 사용자에 의해 미리 결정될 수 있다.

그 후, 근사화된 컨볼루션 레이어의 출력 복원 필터(γ)의 개수를 근사화에 따른 출력 복원 필터(γ)의 개수보다 작은 범위 내에서 변경한다(720). 예컨대, 근사화된 컨볼루션 레이어가 6개의 출력 복원 필터(γ)를 포함한다고 가정하면, 학습 장치(200)는 출력 복원 필터(γ)의 개수를 1개 내지 5개 중 하나로 변경할 수 있다.

그 후, 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어가 존재하는지 여부를 판단하고(730), 다음 컨볼루션 레이어가 존재하면, 다음 컨볼루션 레이어의 구조를 변경한다(740). 예컨대, 학습 장치(200)는 다음 컨볼루션 레이어의 컨볼루션 필터의 개수를 변경함으로써 다음 컨볼루션 레이어의 구조를 변경할 수 있다.

그 후, 근사화 결과, 출력 복원 필터(γ)의 개수 변경 결과 및 다음 컨볼루션 레이어의 구조 변경 결과를 기반으로 CNN의 구조를 변경하고(740), 변경된 구조의 CNN을 학습시킨다(750). 예컨대, 학습 장치(200)는 변경된 구조의 CNN에서 입력 변환 필터(α)의 값 및 컨볼루션 필터(β)의 값을 고정시키고 변경된 구조의 CNN을 학습시킬 수 있다.

그 후, 변경된 구조의 CNN을 학습 데이터를 이용하여 영상 데이터를 분류하고(770), 분류의 정확도가 설정된 기준을 만족하는지 여부를 판단한다(780).

판단 결과, 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 단계 740 내지 770을 다시 수행한다.

판단 결과, 분류의 정확도가 설정된 기준을 만족하는 경우, 단계 710으로 돌아가 다음 컨볼루션 레이어에 대해 근사화를 수행한다.

한편, 단계 730의 판단 결과, 다음 컨볼루션 레이어가 존재하지 않으면, 근사화 결과 및 출력 복원 필터의 개수 변경 결과를 기반으로 CNN의 구조를 변경하고(790), 변경된 구조의 CNN을 학습시킨다(800).

본 발명의 일 양상은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있다. 상기의 프로그램을 구현하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함할 수 있다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 디스크 등을 포함할 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드로 작성되고 실행될 수 있다.

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시 예에 한정되지 않고 특허 청구범위에 기재된 내용과 동등한 범위 내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.

200: 학습 장치
210: 근사화부
220: 필터 개수 변경부
230: 레이어 구조 변경구
240: 학습부
250: 분류부

Claims

다수의 컨볼루션 레이어를 포함하는 CNN(Convolutional Neural Network)의 근사화를 위한 학습 방법에 있어서,
상기 다수의 컨볼루션 레이어 중 하나를 낮은 계수 근사법(Low Rank Approximation)을 이용하여 근사화하는 단계;
근사화된 컨볼루션 레이어의 출력 복원 필터의 개수를 근사화에 따른 출력 복원 필터의 개수보다 작은 범위 내에서 변경하는 단계;
근사화 결과 및 출력 복원 필터의 개수 변경 결과를 기반으로 상기 CNN의 구조를 변경하는 단계; 및
상기 변경된 CNN을 학습시키는 단계; 를 포함하고,
상기 근사화하는 단계는,
상기 다수의 컨볼루션 레이어 중 하나를 입력 변환 필터, 컨볼루션 필터, 및 출력 복원 필터로 근사화하고,
상기 입력 변환 필터는 입력 데이터의 채널의 수를 줄이는 필터이고,
상기 컨볼루션 필터는 채널 수가 줄어든 입력 데이터에 대해 컨볼루션 연산을 수행하는 필터이고,
상기 출력 복원 필터는 컨볼루션 연산 결과를 상기 컨볼루션 레이어와 동일한 채널 개수로 복원하는 필터인 학습 방법.
제1항에 있어서,
상기 학습시키는 단계 이후에,
상기 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어 중 적어도 일부의 컨볼루션 레이어에 대하여 순차적으로 상기 근사화하는 단계, 상기 출력 복원 필터 개수를 변경하는 단계, 상기 CNN의 구조를 변경하는 단계, 및 상기 학습시키는 단계를 반복 수행하는 단계; 를 더 포함하는 학습 방법.
제1항에 있어서,
상기 학습시키는 단계 이후에,
상기 학습된 CNN을 이용하여 영상 데이터를 분류하는 단계; 및
상기 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 상기 출력 복원 필터 개수를 변경하는 단계, 상기 CNN의 구조를 변경하는 단계, 및 상기 학습시키는 단계를 반복 수행하는 단계; 를 더 포함하는 학습 방법.
제1항에 있어서,
상기 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어 중 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 단계; 더 포함하고,
상기 CNN의 구조를 변경하는 단계는,
상기 적어도 일부의 컨볼루션 레이어의 구조 변경 결과를 더 기반으로 상기 CNN의 구조를 변경하는 학습 방법.
제4항에 있어서,
상기 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 단계는,
상기 적어도 일부의 컨볼루션 레이어의 컨볼루션 필터의 개수를 변경함으로써 상기 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 학습 방법.
제4항에 있어서,
상기 학습시키는 단계 이후에,
상기 학습된 CNN을 이용하여 영상 데이터를 분류하는 단계; 및
상기 분류의 정확도가 설정된 기준을 만족하지 않는 경우, 상기 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 단계, 상기 CNN의 구조를 변경하는 단계, 및 상기 학습시키는 단계를 반복 수행하는 단계; 를 더 포함하는 학습 방법.
삭제
삭제
다수의 컨볼루션 레이어를 포함하는 CNN(Convolutional Neural Network)의 근사화를 위한 학습 장치에 있어서,
상기 다수의 컨볼루션 레이어 중 하나를 낮은 계수 근사법(Low Rank Approximation)을 이용하여 근사화하는 근사화부;
근사화된 컨볼루션 레이어의 출력 복원 필터의 개수를 근사화에 따른 출력 복원 필터의 개수보다 작은 범위 내에서 변경하는 필터 개수 변경부; 및
근사화 결과 및 출력 복원 필터의 개수 변경 결과를 기반으로 상기 CNN의 구조를 변경하고, 상기 변경된 CNN을 학습시키는 학습부; 를 포함하고,
상기 근사화부는,
상기 다수의 컨볼루션 레이어 중 하나를 입력 변환 필터, 컨볼루션 필터, 및 출력 복원 필터로 근사화하고,
상기 입력 변환 필터는 입력 데이터의 채널의 수를 줄이는 필터이고,
상기 컨볼루션 필터는 채널 수가 줄어든 입력 데이터에 대해 컨볼루션 연산을 수행하는 필터이고,
상기 출력 복원 필터는 컨볼루션 연산 결과를 상기 컨볼루션 레이어와 동일한 채널 개수로 복원하는 필터인 학습 장치.
제9항에 있어서,
상기 근사화부는,
상기 변경된 CNN의 학습이 완료될 때마다 상기 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어를 순차적으로 근사화하는 학습 장치.
제9항에 있어서,
상기 학습된 CNN을 이용하여 영상 데이터를 분류하는 분류부; 를 더 포함하고,
상기 변경부는,
분류의 정확도가 설정된 기준을 만족하지 않는 경우, 상기 출력 복원 필터의 개수를 재변경하는 학습 장치.
제9항에 있어서,
상기 근사화된 컨볼루션 레이어의 다음 컨볼루션 레이어 중 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 레이어 구조 변경부; 더 포함하고,
상기 학습부는,
상기 적어도 일부의 컨볼루션 레이어의 구조 변경 결과를 더 기반으로 상기 CNN의 구조를 변경하는 학습 장치.
제12항에 있어서,
상기 레이어 구조 변경부는,
상기 적어도 일부의 컨볼루션 레이어의 컨볼루션 필터의 개수를 변경함으로써 상기 적어도 일부의 컨볼루션 레이어의 구조를 변경하는 학습 장치.
제12항에 있어서,
상기 학습된 CNN을 이용하여 영상 데이터를 분류하는 분류부; 를 더 포함하고,
상기 레이어 구조 변경부는,
분류의 정확도가 설정된 기준을 만족하지 않는 경우, 상기 적어도 일부의 컨볼루션 레이어의 구조를 재변경하는 학습 장치.
삭제
삭제