KR102337383B1

KR102337383B1 - 하드웨어 최적화에 사용되는 1xK 또는 Kx1 컨벌루션 연산을 이용한 CNN을 학습하는 방법 및 학습 장치, 이를 이용한 테스트 방법 및 테스트 장치

Info

Publication number: KR102337383B1
Application number: KR1020190147089A
Authority: KR
Inventors: 김용중; 김인수; 김학경; 남운현; 부석훈; 성명철; 유우주; 정경중; 제홍모; 조호진
Original assignee: 주식회사 스트라드비젼
Priority date: 2019-01-23
Filing date: 2019-11-15
Publication date: 2021-12-10
Also published as: JP2020119535A; CN111476247B; US20200234135A1; EP3686794A1; JP6857369B2; KR20200091795A; CN111476247A; US11461653B2; EP3686794B1

Abstract

본 발명은 KPI(Key Performance Index, 핵심성과지표)를 충족하는 하드웨어 최적화에 사용되기 위해 제공되는 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN의 파라미터를 학습하는 방법에 있어서, 학습 장치가, (a) 리셰이핑 레이어(Reshaping Layer)로 하여금 트레이닝 이미지 또는 이를 가공한 특징 맵의 K개의 채널로 구성된 각각의 그룹 내의 특징을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 단계; 및 (b) 출력 레이어로 하여금 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하도록 하며, 로스 레이어로 하여금 출력 레이어로부터의 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 로스를 산출하도록 하는 단계;를 포함하는 것을 특징으로 한다.

Description

하드웨어 최적화에 사용되는 1xK 또는 Kx1 컨벌루션 연산을 이용한 CNN을 학습하는 방법 및 학습 장치, 이를 이용한 테스트 방법 및 테스트 장치{LEARNING METHOD AND LEARNING DEVICE FOR CNN USING 1xK OR Kx1 CONVOLUTION TO BE USED FOR HARDWARE OPTIMIZATION, AND TESTING METHOD AND TESTING DEVICE USING THE SAME}

본 발명은 하드웨어 최적화에 사용되는 1xK 또는 Kx1 컨벌루션 연산을 이용한 CNN의 파라미터를 학습하는 방법에 관한 것으로, 보다 상세하게는, 상기 1xK 컨벌루션 연산 또는 상기 Kx1 컨벌루션 연산을 이용하여 상기 CNN의 상기 파라미터를 학습하는 방법에 있어서, (a) 적어도 하나의 트레이닝 이미지가 획득되면, 학습 장치는, 리셰이핑 레이어(Reshaping Layer)로 하여금 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 단계; 및 (b) 상기 학습 장치는, 출력 레이어로 하여금 상기 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습하는 단계;를 포함하는 것을 특징으로 하는 학습 방법 및 학습 장치, 이를 이용한 테스트 방법 및 테스트 장치에 관한 것이다.

딥 컨벌루션 뉴럴 네트워크(Deep Convolutional Neural Network; Deep CNN)는 딥 러닝 분야에서 일어난 놀라운 발전의 핵심이다. CNN은 글자 인식 문제를 풀기 위해 90년대에 이미 사용되었지만, 현재처럼 널리 쓰이게 된 것은 최근의 연구 결과 덕분이다. 이러한 딥 CNN은 2012년 ImageNet 이미지 분류 시합에서 다른 경쟁자들을 이기고 우승을 차지했다. 그리고 나서 컨벌루션 뉴럴 네트워크는 기계 학습(Machine Learning) 분야에서 매우 유용한 툴이 되었다.

CNN은 이미지에서 특징을 추출하는 특징 추출기(Feature Extractor) 및 이미지 내의 객체를 검출하거나 특징 추출기가 추출한 특징을 참조하여 이미지를 인식하는 특징 분류기(Feature Classifier)를 포함한다.

그리고 CNN의 특징 추출기는 컨벌루션 레이어를 포함하며, 특징 분류기는 특징 추출기가 추출한 특징에 대하여 FC 연산(Fully Connected Operation)을 적용할 수 있는 적어도 하나의 FC 레이어를 포함할 수 있다.

컨벌루션 레이어는 CNN이 하는 거의 대부분의 연산에서 가장 중요한 부분을 차지한다.

컨벌루션 레이어는 근처 픽셀에 대한 정보를 더 이용하여 로컬 리셉티브 필드(Local Receptive Field)로부터 특징을 추출한다. 하지만 컨벌루션 레이어의 필터의 특성(Characteristic)은 선형적이므로 필터는 비선형의 특징을 잘 추출할 수 없다. 이 같은 문제를 해결하려면 특징 맵의 개수를 늘려야 하나, 그러면 연산량이 늘어나는 문제점이 있다.

따라서, 연산량을 최소화하기 위하여 특징 맵의 차원을 줄일 수 있는 1x1 컨벌루션 레이어가 사용되고 있다.

1x1 컨벌루션 레이어는 여러 개의 특징 맵으로부터 비슷한 성질을 갖는 것을 묶어낼 수 있고, 결과적으로 특징 맵의 숫자를 줄일 수 있으며, 연산량을 줄일 수 있게 된다.

또한 연산량이 줄어들게 되면, 뉴럴 네트워크가 더 깊어질 수 있는 여지가 생기게 된다.

또한, 1x1 컨벌루션 레이어는 이미지 세그멘테이션에 사용되거나 FC 레이어를 대체하여 특징 추출기 등에 사용되고 있다.

이때, 본 발명자는 1x1 컨벌루션 레이어의 컨벌루션 연산에 비해 좀 더 효율적으로 컨벌루션 연산량을 줄일 수 있도록 하는 CNN을 제안하고자 한다.

본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.

본 발명은 컨벌루션 연산량을 효율적으로 줄일 수 있도록 하는 CNN을 제공하는 것을 다른 목적으로 한다.

본 발명은 컨벌루션 연산을 통해 이미지 상의 특징을 보다 효과적으로 추출할 수 있도록 하는 CNN을 제공하는 것을 또 다른 목적으로 한다.

상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한, 본 발명의 특징적인 구성은 하기와 같다.

본 발명의 일 태양에 따르면, 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN의 파라미터를 학습하는 방법에 있어서, (a) 적어도 하나의 트레이닝 이미지가 획득되면, 학습 장치는, 리셰이핑 레이어(Reshaping Layer)로 하여금 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 단계; 및 (b) 상기 학습 장치는, 출력 레이어로 하여금 상기 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습하는 단계;를 포함하는 것을 특징으로 한다.

일 실시예에서, 상기 (a) 단계에서, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우, 상기 학습 장치는, 상기 리셰이핑 레이어로 하여금 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 상기 더미 채널을 포함하는 상기 채널의 개수가 K의 배수가 되도록 한 다음, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 상기 더미 채널을 포함하는 상기 모든 채널 중에서 각각의 대응되는 K개의 상기 채널로 구성된 각각의 상기 그룹 내의 상기 특징 각각을 컨캐터네이팅하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널 개수를 L이라 할 경우, 상기 (a) 단계에서, 상기 학습 장치는, 상기 리셰이핑 레이어로 하여금 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 리셰이핑된 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 후속 컨벌루션 레이어의 커널(Kernel) 개수를 M이라 할 경우, 상기 (a) 단계에서, 상기 학습 장치는, 상기 후속 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 조정 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널 개수를 L이라 할 경우, 상기 (a) 단계에서, 상기 학습 장치는, 상기 리셰이핑 레이어로 하여금 너비 WxK, 높이 H, 채널 CEIL(

일 실시예에서, 상기 후속 컨벌루션 레이어의 커널 개수를 M이라 할 경우, 상기 (a) 단계에서, 상기 학습 장치는, 상기 후속 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 조정 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널 개수를 L이라 할 경우, 상기 (a) 단계에서, 상기 학습 장치가, 상기 리셰이핑 레이어로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 리셰이핑된 특징 맵을 생성하도록 하거나, (ii) 너비 WxK, 높이 H, 채널 CEIL(

)인 상기 리셰이핑된 특징 맵을 생성하도록 하되, 상기 CEIL(

)번째 채널 상의 상기 리셰이핑된 특징 맵의 최종 부분(Final Part)의 사이즈가 너비 W, 높이 HxK인 사이즈가 되지 않을 경우, 상기 리셰이핑 레이어로 하여금 적어도 하나의 제로 패딩(Zero Padding)을 추가하도록 하여 상기 CEIL(

)번째 채널 상의 상기 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 W, 높이 HxK인 사이즈가 되도록 하거나, 상기 CEIL(

)번째 채널 상의 상기 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되지 않을 경우, 상기 리셰이핑 레이어로 하여금 적어도 하나의 제로 패딩을 추가하도록 하여 상기 CEIL(

)번째 채널 상의 상기 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되도록 하는 것을 특징으로 한다.

본 발명의 다른 태양에 따르면, 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 테스트하는 방법에 있어서, (a) 학습 장치가, (i) 리셰이핑 레이어(Reshaping Layer)로 하여금 적어도 하나의 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 학습용 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 학습용 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하고, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 학습용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 학습용 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하며, (ii) 출력 레이어로 하여금 상기 학습용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 학습용 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 학습용 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습한 상태에서, 적어도 하나의 테스트 이미지가 획득되면, 테스트 장치는, 상기 리셰이핑 레이어(Reshaping Layer)로 하여금 상기 테스트 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 테스트용 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 테스트용 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 상기 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 테스트용 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 단계; 및 (b) 상기 테스트 장치가, 상기 출력 레이어로 하여금 상기 테스트용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 테스트용 출력을 생성하도록 하는 단계;를 포함하는 것을 특징으로 한다.

일 실시예에서, 상기 (a) 단계에서, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우, 상기 테스트 장치는, 상기 리셰이핑 레이어로 하여금 상기 테스트 이미지 또는 이를 가공한 특징 맵의 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 상기 더미 채널을 포함하는 상기 채널의 개수가 K의 배수가 되도록 한 다음, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 상기 더미 채널을 포함하는 상기 모든 채널 중에서 각각의 대응되는 K개의 상기 채널로 구성된 각각의 상기 그룹 내의 상기 특징 각각을 컨캐터네이팅하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (a) 단계에서, 상기 테스트 장치는, 상기 리셰이핑 레이어로 하여금 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 테스트용 리셰이핑된 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 후속 컨벌루션 레이어의 커널(Kernel) 개수를 M이라 할 경우, 상기 (a) 단계에서, 상기 테스트 장치는, 상기 후속 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 테스트용 조정 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (a) 단계에서, 상기 테스트 장치는, 상기 리셰이핑 레이어로 하여금 너비 WxK, 높이 H, 채널 CEIL(

일 실시예에서, 상기 후속 컨벌루션 레이어의 커널 개수를 M이라 할 경우, 상기 (a) 단계에서, 상기 테스트 장치는, 상기 후속 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 테스트용 조정 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 테스트 이미지 또는 상기 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (a) 단계에서, 상기 테스트 장치가, 상기 리셰이핑 레이어로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 테스트용 리셰이핑된 특징 맵을 생성하도록 하거나, (ii) 너비 WxK, 높이 H, 채널 CEIL(

)인 상기 테스트용 리셰이핑된 특징 맵을 생성하도록 하되, 상기 CEIL(

)번째 채널 상의 상기 테스트용 리셰이핑된 특징 맵의 최종 부분(Final Part)의 사이즈가 너비 W, 높이 HxK인 사이즈가 되지 않을 경우, 상기 리셰이핑 레이어로 하여금 적어도 하나의 제로 패딩(Zero Padding)을 추가하도록 하여 상기 CEIL(

)번째 채널 상의 상기 테스트용 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 W, 높이 HxK인 사이즈가 되도록 하거나, 상기 CEIL(

)번째 채널 상의 상기 테스트용 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되지 않을 경우, 상기 리셰이핑 레이어로 하여금 적어도 하나의 제로 패딩을 추가하도록 하여 상기 CEIL(

)번째 채널 상의 상기 테스트용 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되도록 하는 것을 특징으로 한다.

본 발명의 또 다른 태양에 따르면, 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN의 파라미터를 학습하는 학습 장치에 있어서, 인스트럭션을 저장하는 적어도 하나의 메모리; 및 (I) 리셰이핑 레이어(Reshaping Layer)로 하여금 적어도 하나의 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 프로세스, 및 (II) 출력 레이어로 하여금 상기 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;를 포함하는 것을 특징으로 한다.

일 실시예에서, 상기 (I) 프로세스에서, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 상기 더미 채널을 포함하는 상기 채널의 개수가 K의 배수가 되도록 한 다음, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 상기 더미 채널을 포함하는 상기 모든 채널 중에서 각각의 대응되는 K개의 상기 채널로 구성된 각각의 상기 그룹 내의 상기 특징 각각을 컨캐터네이팅하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금 너비 W, 높이 HxK, 채널 CEIL(

일 실시예에서, 상기 후속 컨벌루션 레이어의 커널(Kernel) 개수를 M이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 후속 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 조정 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금 너비 WxK, 높이 H, 채널 CEIL(

일 실시예에서, 상기 후속 컨벌루션 레이어의 커널 개수를 M이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 후속 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 조정 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 리셰이핑된 특징 맵을 생성하도록 하거나, (ii) 너비 WxK, 높이 H, 채널

인 상기 리셰이핑된 특징 맵을 생성하도록 하되, 상기 CEIL(

)번째 채널 상의 상기 리셰이핑된 특징 맵의 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되지 않을 경우, 상기 리셰이핑 레이어로 하여금 적어도 하나의 제로 패딩을 추가하도록 하여 상기 CEIL(

본 발명의 또 다른 태양에 따르면, 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 테스트하는 테스트 장치에 있어서, 인스트럭션을 저장하는 적어도 하나의 메모리; 및 학습 장치는, (i) 리셰이핑 레이어(Reshaping Layer)로 하여금 적어도 하나의 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 학습용 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 학습용 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 학습용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 학습용 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하고, (ii) 출력 레이어로 하여금 상기 학습용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 학습용 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 학습용 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습한 상태에서, (I) 상기 리셰이핑 레이어(Reshaping Layer)로 하여금 적어도 하나의 테스트 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 테스트용 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 상기 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 테스트용 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 프로세스, 및 (II) 상기 출력 레이어로 하여금 상기 테스트용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 테스트용 출력을 생성하도록 하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;를 포함하는 것을 특징으로 한다.

일 실시예에서, 상기 (I) 프로세스에서, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금 상기 테스트 이미지 또는 이를 가공한 특징 맵의 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 상기 더미 채널을 포함하는 상기 채널의 개수가 K의 배수가 되도록 한 다음, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 상기 더미 채널을 포함하는 상기 모든 채널 중에서 각각의 대응되는 K개의 상기 채널로 구성된 각각의 상기 그룹 내의 상기 특징 각각을 컨캐터네이팅하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금 너비 W, 높이 HxK, 채널 CEIL(

일 실시예에서, 상기 후속 컨벌루션 레이어의 커널(Kernel) 개수를 M이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 후속 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 테스트용 조정 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금 너비 WxK, 높이 H, 채널

인 상기 테스트용 리셰이핑된 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 후속 컨벌루션 레이어의 커널 개수를 M이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 후속 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 테스트용 조정 특징 맵을 생성하도록 하는 것을 특징으로 한다.

일 실시예에서, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 상기 (I) 프로세스에서, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)번째 채널 상의 상기 테스트용 리셰이핑된 특징 맵의 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되지 않을 경우, 상기 리셰이핑 레이어로 하여금 적어도 하나의 제로 패딩을 추가하도록 하여 상기 CEIL(

이 외에도, 본 발명의 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체가 더 제공된다.

본 발명은 1xK 또는 Kx1 컨벌루션 연산을 이용해 CNN의 컨벌루션 연산량을 효율적으로 줄일 수 있는 효과가 있다.

또한, 본 발명은 1xK 또는 Kx1 컨벌루션 연산을 이용한 만큼 입력된 특징 맵 또는 이미지의 채널 개수를 증가시킬 수 있으므로 컨벌루션 연산을 통해 이미지 상의 특징을 효과적으로 추출할 수 있는 다른 효과가 있다.

본 발명의 실시예의 설명에 이용되기 위하여 첨부된 아래 도면들은 본 발명의 실시예들 중 단지 일부일 뿐이며, 본 발명이 속한 기술분야에서 통상의 지식을 가진 자(이하 "통상의 기술자")에게 있어서는 발명적 작업이 이루어짐 없이 이 도면들에 기초하여 다른 도면들이 얻어질 수 있다.
도 1은 본 발명의 일 실시예에 따른 1xK 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 학습하는 학습 장치를 개략적으로 도시한 것이고,
도 2는 본 발명의 일 실시예에 따른 1xK 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 학습하는 방법을 개략적으로 도시한 것이고,
도 3은 본 발명의 일 실시예에 따른 1xK 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 학습하기 위한 트레이닝 이미지 또는 이를 가공한 특징 맵을 개략적으로 도시한 것이고,
도 4a와 도 4b는 각각 본 발명의 일 실시예에 따른 (i) 트레이닝 이미지 또는 이를 가공한 특징 맵을 리셰이핑하여 생성된 리셰이핑된 특징 맵과 (ii) 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하여 생성된 조정 특징 맵을 개략적으로 도시한 것이고,
도 5a와 도 5b는 각각 본 발명의 일 실시예에 따른 (i) 트레이닝 이미지 또는 이를 가공한 특징 맵을 리셰이핑하여 생성된 리셰이핑된 특징 맵과 (ii) 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하여 생성된 조정 특징 맵을 개략적으로 도시한 것이고,
도 6은 본 발명의 일 실시예에 따른 1xK 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 테스트하는 테스트 장치를 개략적으로 도시한 것이고,
도 7은 본 발명의 일 실시예에 따른 1xK 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 테스트하는 방법을 개략적으로 도시한 것이다.

후술하는 본 발명에 대한 상세한 설명은, 본 발명의 목적들, 기술적 해법들 및 장점들을 분명하게 하기 위하여 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 통상의 기술자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다.

또한, 본 발명의 상세한 설명 및 청구항들에 걸쳐, "포함하다"라는 단어 및 그것의 변형은 다른 기술적 특징들, 부가물들, 구성요소들 또는 단계들을 제외하는 것으로 의도된 것이 아니다. 통상의 기술자에게 본 발명의 다른 목적들, 장점들 및 특성들이 일부는 본 설명서로부터, 그리고 일부는 본 발명의 실시로부터 드러날 것이다. 아래의 예시 및 도면은 실례로서 제공되며, 본 발명을 한정하는 것으로 의도된 것이 아니다.

더욱이 본 발명은 본 명세서에 표시된 실시예들의 모든 가능한 조합들을 망라한다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.

본 발명에서 언급하는 각종 이미지는 포장 또는 비포장 도로 관련 이미지를 포함할 수 있으며, 이 경우 도로 환경에서 등장할 수 있는 물체(가령, 자동차, 사람, 동물, 식물, 물건, 건물, 비행기나 드론과 같은 비행체, 기타 장애물)를 상정할 수 있을 것이나, 반드시 이에 한정되는 것은 아니며, 본 발명에서 언급하는 각종 이미지는 도로와 상관 없는 이미지(가령, 비포장도로, 골목길, 공터, 바다, 호수, 강, 산, 숲, 사막, 하늘, 실내와 관련된 이미지)일 수도 있으며, 이 경우, 비포장도로, 골목길, 공터, 바다, 호수, 강, 산, 숲, 사막, 하늘, 실내 환경에서 등장할 수 있는 물체(가령, 자동차, 사람, 동물, 식물, 물건, 건물, 비행기나 드론과 같은 비행체, 기타 장애물)를 상정할 수 있을 것이나, 반드시 이에 한정되는 것은 아니다.

이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른 1xK 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 학습하는 학습 장치를 개략적으로 도시한 것으로, 도 1을 참조하면, 학습 장치(100)는 통신부(110)와 프로세서(120)를 포함할 수 있다.

먼저, 통신부(110)는 적어도 하나의 트레이닝 이미지를 수신할 수 있다.

이때, 트레이닝 이미지는 데이터베이스(130)에 저장되어 있을 수 있으며, 데이터베이스(130)에는 트레이닝 이미지에 대응하여 적어도 하나의 객체 각각에 대한 클래스 정보의 적어도 하나의 GT(Ground Truth) 및 각각의 객체에 대한 위치 정보의 적어도 하나의 GT가 저장되어 있을 수 있다.

또한, 학습 장치는 다음의 프로세스를 수행하기 위한 컴퓨터 판독 가능한 인스트럭션(Instruction)을 저장할 수 있는 메모리(115)를 더 포함할 수 있다. 일 실시예에 따르면, 프로세서, 메모리, 매체 등은 통합 프로세서(Integrated Processor)로 통합될 수 있다.

다음으로, 프로세서(120)는 리셰이핑 레이어(Reshaping Layer)로 하여금 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 프로세스를 수행할 수 있다. 여기서, 상기 가공한 특징 맵은 (i) 트레이닝 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하는 방법, (ii) 상기 (i)의 방법의 결과에 대하여 후속 연산(예를 들면, 배치 노말라이제이션 연산, 액티베이션 연산, 풀링 연산 등)을 적용하는 방법 및 (iii) 상기 (ii)의 방법의 결과에 대하여 컨벌루션 연산을 추가로 적용하는 방법 중 적어도 하나에 의해 생성된 특징 맵이다. 그리고, 프로세서(120)는 출력 레이어로 하여금 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 출력을 생성하도록 하며, 로스 레이어로 하여금 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 로스를 백프로파게이션하여 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습하는 프로세스를 수행할 수 있다.

이때, 본 발명의 일 실시예에 따른 학습 장치(100)는 컴퓨팅 장치로서, 프로세서를 탑재하여 연산 능력을 갖춘 장치라면 얼마든지 본 발명에 따른 학습 장치(100)로서 채택될 수 있다. 또한, 도 1에서는 하나의 학습 장치(100)만을 나타내었으나, 이에 한정되지 않으며, 학습 장치는 복수 개로 나뉘어 역할을 수행할 수도 있다.

이와 같이 구성된 본 발명의 일 실시예에 따른 학습 장치(100)를 이용하여 1xK 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 학습하는 방법을 도 2를 참조하여 설명하면 다음과 같다.

먼저, 트레이닝 이미지가 입력되면, 학습 장치(100)가, 전처리(Pre-Processing) 레이어(121)로 하여금 트레이닝 이미지를 전처리하여 가공한 특징 맵을 생성하도록 할 수 있다.

이때, 전처리 레이어(121)는 컨벌루션 레이어, 배치 노말라이제이션 레이어, 액티베이션 레이어, 풀링 레이어 중 적어도 하나를 포함할 수 있으며, 가공한 특징 맵을 생성할 수 있다. 여기서, 상기 가공한 특징 맵은 (i) 트레이닝 이미지에 대하여 컨벌루션 연산을 적용하는 방법, (ii) 상기 (i)의 방법의 결과에 대하여 후속 연산(예를 들면, 배치 노말라이제이션 연산, 액티베이션 연산, 풀링 연산 등)을 적용하는 방법 및 (iii) 상기 (ii)의 방법의 결과에 대하여 컨벌루션 연산을 추가로 적용하는 방법 중 적어도 하나에 의해 생성된 특징 맵이다. 하지만, 전처리 레이어(121)는 이에 한정되지 않으며, 전처리 레이어(121)는 이미지 처리를 위한 CNN을 구성하는 각각의 레이어를 포함할 수 있다.

다음으로, 학습 장치(100)는 리셰이핑 레이어로 하여금 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 특징 각각을 2차원적으로 컨캐터네이팅하도록 하여 리셰이핑된 특징 맵을 생성하도록 할 수 있다. 이때, 학습 장치(100)는 전처리 레이어(121)로 하여금 트레이닝 이미지를 전처리하도록 하지 않고, 트레이닝 이미지를 직접적으로 리셰이핑 레이어(122)에 입력할 수도 있다.

이때, 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우, 학습 장치(100)는, 리셰이핑 레이어(122)로 하여금 각각의 픽셀에 대응하는 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 더미 채널을 포함하는 채널의 개수가 K의 배수가 되도록 한 다음, 트레이닝 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 더미 채널을 포함하는 모든 채널 중에서 각각의 대응되는 K개의 채널로 구성된 각각의 그룹 내의 특징 각각을 컨캐터네이팅하도록 할 수 있다.

즉, 트레이닝 이미지 또는 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 학습 장치(100)는 리셰이핑 레이어(122)로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)인 리셰이핑된 특징 맵을 생성하도록 하거나, (ii) 너비 WxK, 높이 H, 채널 CEIL(

)인 리셰이핑된 특징 맵을 생성하도록 할 수 있다.

번째 채널 상의 리셰이핑된 특징 맵의 최종 부분(Final Part)의 사이즈가 너비 W, 높이 HxK인 사이즈가 되지 않을 경우에는 학습 장치(100)는 리셰이핑 레이어(122)로 하여금 적어도 하나의 제로 패딩(Zero Padding)을 추가하도록 하여 CEIL(

)번째 채널 상의 리셰이핑된 특징 맵의 최종 부분의 사이즈가 너비 W, 높이 HxK인 사이즈가 되도록 하거나, CEIL(

)번째 채널 상의 리셰이핑된 특징 맵의 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되지 않을 경우에는 리셰이핑 레이어(122)로 하여금 적어도 하나의 제로 패딩을 추가하도록 하여 CEIL(

)번째 채널 상의 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되도록 할 수 있다.

일 예로, 도 3을 참조하면, 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 첫 번째 채널(C1) 상의 각각의 픽셀에 대응하는 각각의 특징은 각각 C1F11, …, C1F22, …, C1FWH와 같이 나타낼 수 있다. 그리고, 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 다른 채널(C2, C3, …, CL) 상의 각각의 픽셀에 대응하는 각각의 특징도 같은 방법으로 나타낼 수 있다.

그리고, 도 3와 도 4a를 참조하면, 도 3의 트레이닝 이미지 또는 이를 가공한 특징 맵(300) 상의 픽셀인 C1F11에 대응되는 K개의 채널의 특징인 C1F11, C2F11, …, CKF11을 컨캐터네이팅하고, 트레이닝 이미지 또는 이를 가공한 특징 맵(300) 상의 픽셀 C1F21에 대응되는 K개의 채널의 특징인 C1F21, C2F21, …, CKF21을 컨캐터네이팅하며, 트레이닝 이미지 또는 이를 가공한 특징 맵(300) 상의 픽셀 C1FWH에 대응되는 K개의 채널의 특징인 C1FWH, C2FWH, …, CKFWH를 컨캐터네이팅하는 것과 같다. 즉, 트레이닝 이미지 또는 이를 가공한 특징 맵(300) 상의 모든 픽셀에 대응하여 각각 K개의 채널의 특징을 컨캐터네이팅하여 리셰이핑된 특징 맵(400A)을 생성하게 된다.

이때, 리셰이핑된 특징 맵(400A)은 너비 W, 높이 HxK, 채널 CEIL(

)을 가지게 된다. 그리고, 리셰이핑된 특징 맵(400A)의 각각의 채널은 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 K개의 채널로 구성된 각각의 그룹에 대응될 수 있다. 즉, 리셰이핑된 특징 맵(400A)의 첫 번째 채널은 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 첫 번째 내지 K 번째 채널에 대응되고, 리셰이핑된 특징 맵(400A)의 두 번째 채널은 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 K+1 번째 채널 내지 2xK 번째 채널에 대응될 수 있다. 그리고, 리셰이핑된 특징 맵(400A)의 CEIL(

)번째 채널은 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 (CEIL(

)-1)xK+1번째 채널 내지 L 번째 채널에 대응될 수 있다.

다음으로, 학습 장치(100)는 후속 컨벌루션 레이어(123)로 하여금 리셰이핑된 특징 맵(400A)에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 볼륨이 조정된 조정 특징 맵(400B)을 생성하도록 할 수 있다.

일 예로, 도 4a와 도 4b를 참조하면, 도 4a의 리셰이핑된 특징 맵(400A) 상의 1xK 사이즈에 대응되는 C1F11, C2F11, …, CKF11에 대하여 1xK 컨벌루션 연산을 적용하여 C1F11' 픽셀의 특징을 생성하고, C1F22, C2F22, …, CKF22에 대하여 1xK 컨벌루션 연산을 적용하여 C1F22' 픽셀의 특징을 생성하며, C1FWH, C2FWH, …, CKFWH에 대하여 1xK 컨벌루션 연산을 적용하여 C1FWH' 픽셀의 특징을 생성하는 것과 같다. 이 때, 1xK 사이즈는 컨볼루션 레이어의 커널 사이즈일 수 있다. 그 결과, 도 4a의 리셰이핑된 특징 맵(400A)에 대하여 1xK 컨벌루션 연산을 적용하여 도 4b에서와 같이 너비 W, 높이 H인 조정 특징 맵(400B)을 생성하게 된다. 따라서, 도 3의 트레이닝 이미지 또는 이를 가공한 특징 맵(300)에 대하여 1x1 컨벌루션 연산을 적용하는 것에 비하여, 리셰이핑된 특징 맵(400A)을 생성하고 1xK 컨벌루션 연산을 수행함으로써 연산량을 1/K로 줄일 수 있게 되며, 그에 따라 컨벌루션 연산 속도를 K배 만큼 증가시킬 수 있게 된다. 이때, 조정 특징 맵(400B)의 채널의 개수는 1xK 컨벌루션 연산을 수행하는 후속 컨벌루션 레이어(123)의 커널 개수, 즉, 필터의 개수에 대응될 수 있다. 일 예로, 후속 컨벌루션 레이어(123)의 커널 개수를 M이라 할 경우, 조정 특징 맵(400B)의 채널은 M개가 될 수 있다.

한편, 상기에서는 1xK 컨벌루션 연산을 사용하는 방법을 설명하였으나, 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 K개의 채널의 특징을 너비 방향으로 컨캐터네이팅한 후, Kx1 컨벌루션 연산을 수행할 수도 있다.

그리고, 도 3와 도 5a를 참조하면, 도 3의 트레이닝 이미지 또는 이를 가공한 특징 맵(300) 상의 픽셀인 C1F11에 대응되는 K개의 채널의 특징인 C1F11, C2F11, …, CKF11을 너비 방향으로 컨캐터네이팅하고, 트레이닝 이미지 또는 이를 가공한 특징 맵(300) 상의 픽셀 C1F12에 대응되는 K개의 채널의 특징인 C1F12, C2F12, …, CKF12를 너비 방향으로 컨캐터네이팅하며, 트레이닝 이미지 또는 이를 가공한 특징 맵(300) 상의 픽셀 C1FWH에 대응되는 K개의 채널의 특징인 C1FWH, C2FWH, …, CKFWH를 너비 방향으로 컨캐터네이팅하는 것과 같다. 즉, 트레이닝 이미지 또는 이를 가공한 특징 맵(300) 상의 모든 픽셀에 대응하여 각각 K개의 채널의 특징을 너비 방향으로 컨캐터네이팅하여 리셰이핑된 특징 맵(500A)을 생성하게 된다.

이때, 리셰이핑된 특징 맵(500A)은 너비 WxK, 높이 H, 채널 CEIL(

)이 된다. 그리고, 리셰이핑된 특징 맵(500A)의 각각의 채널은 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 K개의 채널로 구성된 각각의 그룹에 대응될 수 있다. 즉, 리셰이핑된 특징 맵(500A)의 첫 번째 채널은 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 첫 번째 채널 내지 K 번째 채널에 대응되고, 리셰이핑된 특징 맵(500A)의 두 번째 채널은 트레이닝 이미지 또는 이를 가공한 특징 맵(300)의 K+1 번째 채널 내지 2xK 번째 채널에 대응될 수 있다. 그리고, 리셰이핑된 특징 맵(500A)의 CEIL(

)-1)xK+1 번째 채널 내지 L 번째 채널에 대응될 수 있다.

다음으로, 학습 장치(100)는 후속 컨벌루션 레이어(123)로 하여금 리셰이핑된 특징 맵(500A)에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨이 조정된 조정 특징 맵(500B)을 생성하도록 할 수 있다.

일 예로, 도 5a와 도 5b를 참조하면, 도 5a의 리셰이핑된 특징 맵의 Kx1 사이즈에 대응되는 C1F11, C2F11, …, CKF11에 대하여 Kx1 컨벌루션 연산을 적용하여 C1F11" 픽셀의 특징을 생성하고, C1F12, C2F12, …, CKF12에 대하여 Kx1 컨벌루션 연산을 적용하여 C1F12" 픽셀의 특징을 생성하며, C1FWH, C2FWH, …, CKFWH에 대하여 Kx1 컨벌루션 연산을 적용하여 C1FWH" 픽셀의 특징을 생성하는 것과 같다. 이때, Kx1 사이즈는 컨벌루션 레이어의 커널 사이즈일 수 있다. 그 결과, 도 5a의 리셰이핑된 특징 맵(500A)에 대하여 Kx1 컨벌루션 연산을 적용하여 도 5b에서와 같이 너비 W, 높이 H인 조정 특징 맵(500B)을 생성하게 된다.

다음으로, 학습 장치(100)는 후처리(Post-Processing) 레이어(124)로 하여금 후속 컨벌루션 레이어(123)로부터 출력되는 조정 특징 맵(500B)을 후처리하도록 할 수 있다. 이때, 후처리 레이어(124)는 컨벌루션 레이어, 배치 노말라이제이션 레이어, 액티베이션 레이어, 풀링 레이어, FC 레이어 중 적어도 하나를 포함할 수 있으며, 후속 컨벌루션 레이어(123)로부터 출력되는 조정 특징 맵(500B) 또는 이를 가공한 특징 맵의 분류된 특징을 나타내는 확률 정보를 생성할 수 있다. 하지만, 후처리 레이어(124)는 이에 한정되지 않으며, 후처리 레이어(124)는 이미지 처리를 위한 CNN을 구성하는 각각의 레이어를 포함할 수 있다.

다음으로, 학습 장치(100)는 출력 레이어(125)로 하여금 조정 특징 맵(500B) 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 출력을 생성하도록 하고, 로스 레이어(126)로 하여금 상기 출력과 이에 대응되는 GT를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 로스를 백프로파게이션하여 후속 컨벌루션 레이어의 파라미터를 적어도 일부 학습할 수 있다. 이때, 학습 장치(100)는 후처리 레이어(124)로 하여금 조정 특징 맵(500B)을 후처리하도록 하지 않고, 조정 특징 맵(500B)을 직접적으로 출력 레이어(122)에 입력할 수도 있다.

도 6은 본 발명의 일 실시예에 따른 1xK 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 테스트하는 테스트 장치를 개략적으로 도시한 것으로, 도 6을 참조하면, 테스트 장치(200)는 통신부(210)와 프로세서(220)를 포함할 수 있다.

또한, 테스트 장치는 다음의 프로세스를 수행하기 위한 컴퓨터 판독 가능한 인스트럭션(Instruction)을 저장할 수 있는 메모리(215)를 더 포함할 수 있다. 일 실시예에 따르면, 프로세서, 메모리, 매체 등은 통합 프로세서(Integrated Processor)로 통합될 수 있다.

먼저, 통신부(210)는 적어도 하나의 테스트 이미지를 획득하거나 타 장치로 하여금 획득하도록 지원할 수 있다.

이때, 본 발명의 일 실시예에 따른 1xK 또는 Kx1 컨벌루션 연산을 이용한 CNN은 도 2 내지 도 5b를 참조하여 설명한 학습 방법에 의해 학습이 된 상태일 수 있다.

참고로 이하의 설명에서 혼동을 피하기 위해 "학습용"이란 문구는 앞서 설명한 학습 프로세스와 관련된 용어에 대해 추가되고, "테스트용"이란 문구는 테스트 프로세스와 관련된 용어에 대해　추가된다.

즉, 적어도 하나의 트레이닝 이미지가 획득되면, 학습 장치가, (a) 리셰이핑 레이어(Reshaping Layer)로 하여금 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 학습용 특징 각각을 2차원적으로 컨캐터네이팅(Concatenating)하도록 하여 학습용 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하고, 후속(Subsequent) 컨벌루션 레이어로 하여금 학습용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 학습용 조정 특징 맵(Adjusted Feature Map)을 출력하도록 하는 프로세스를 수행한 상태일 수 있다. 여기서, 상기 학습용 가공한 특징 맵은 (i) 트레이닝 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하는 방법, (ii) 상기 (i)의 방법의 결과에 대하여 후속 연산(예를 들면, 배치 노말라이제이션 연산, 액티베이션 연산, 풀링 연산 등)을 적용하는 방법 및 (iii) 상기 (ii)의 방법의 결과에 대하여 컨벌루션 연산을 추가로 적용하는 방법 중 적어도 하나에 의해 생성된 특징 맵이다. 학습 장치가, (b) 출력 레이어로 하여금 학습용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 학습용 출력을 생성하도록 하며, 로스 레이어로 하여금 학습용 출력과 이에 대응되는 적어도 하나의 GT를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 로스를 백프로파게이션하여 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습하는 프로세스를 수행한 상태일 수 있다.

다음으로, 프로세서(220)는 리셰이핑 레이어로 하여금 테스트 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 테스트용 특징 각각을 2차원적으로 컨캐터네이팅하도록 하여 테스트용 리셰이핑된 특징 맵을 생성하도록 하며, 후속 컨벌루션 레이어로 하여금 테스트용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨이 조정된 테스트용 조정 특징 맵을 생성하도록 하는 프로세스를 수행할 수 있다. 여기서, 상기 테스트용 가공한 특징 맵은 (i) 테스트 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하는 방법, (ii) 상기 (i)의 방법의 결과에 대하여 후속 연산(예를 들면, 배치 노말라이제이션 연산, 액티베이션 연산, 풀링 연산 등)을 적용하는 방법 및 (iii) 상기 (ii)의 방법의 결과에 대하여 컨벌루션 연산을 추가로 적용하는 방법 중 적어도 하나에 의해 생성된 특징 맵이다. 그리고, 프로세서(220)는 출력 레이어로 하여금 테스트용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 테스트용 출력을 생성하도록 할 수 있다.

이때, 본 발명의 일 실시예에 따른 테스트 장치(200)는 컴퓨팅 장치로서, 프로세서를 탑재하여 연산 능력을 갖춘 장치라면 얼마든지 본 발명에 따른 테스트 장치(200)로서 채택될 수 있다. 또한, 도 6에서는 하나의 테스트 장치(200)만을 나타내었으나, 이에 한정되지 않으며, 테스트 장치는 복수 개로 나뉘어 역할을 수행할 수도 있다.

이와 같이 구성된 본 발명의 일 실시예에 따른 테스트 장치(200)를 이용하여 1xK 또는 Kx1 컨벌루션 연산을 이용한 CNN을 테스트하는 방법을 도 7을 참조하여 설명하면 다음과 같다. 이하의 설명에서, 도 1 내지 도 5b를 참조하여 설명한 학습 방법으로부터 용이하게 이해 가능한 부분에 대해서는 상세한 설명을 생략하기로 한다.

먼저, 도 1 내지 도 7을 참조하여 설명한 학습 방법에 의해 후속 컨벌루션 레이어(223)가 학습된 상태에서, 테스트 이미지가 입력되면, 테스트 장치(200)가, 전처리 레이어(221)로 하여금 테스트 이미지를 전처리하도록 하여 테스트용 가공한 특징 맵을 생성하도록 할 수 있다.

이때, 전처리 레이어(221)는 컨벌루션 레이어, 배치 노말라이제이션 레이어, 액티베이션 레이어, 풀링 레이어 중 적어도 하나를 포함할 수 있으며, 테스트 이미지에 대하여 컨벌루션 연산을 적용하여 테스트용 가공한 특징 맵을 생성할 수 있다. 여기서, 상기 테스트용 가공한 특징 맵은 (i) 테스트 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하는 방법, (ii) 상기 (i)의 방법의 결과에 대하여 후속 연산(예를 들면, 배치 노말라이제이션 연산, 액티베이션 연산, 풀링 연산 등)을 적용하는 방법 및 (iii) 상기 (ii)의 방법의 결과에 대하여 컨벌루션 연산을 추가로 적용하는 방법 중 적어도 하나에 의해 생성된 특징 맵이다. 하지만, 전처리 레이어(221)는 이에 한정되지 않으며, 전처리 레이어(221)는 이미지 처리를 위한 CNN을 구성하는 각각의 레이어를 포함할 수 있다.

다음으로, 테스트 장치(200)는 리셰이핑 레이어(222)로 하여금 테스트 이미지 또는 이를 가공한 특징 맵의 모든 채널 중에서 각각의 대응하는 K개의 채널로 구성된 각각의 그룹 내의 테스트용 특징 각각을 2차원적으로 컨캐터네이팅하도록 하여 테스트용 리셰이핑된 특징 맵을 생성하도록 할 수 있다. 여기서, 상기 테스트용 가공한 특징 맵은 (i) 테스트 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하는 방법, (ii) 상기 (i)의 방법의 결과에 대하여 후속 연산(예를 들면, 배치 노말라이제이션 연산, 액티베이션 연산, 풀링 연산 등)을 적용하는 방법 및 (iii) 상기 (ii)의 방법의 결과에 대하여 컨벌루션 연산을 추가로 적용하는 방법 중 적어도 하나에 의해 생성된 특징 맵이다. 이때, 테스트 장치(200)는 전처리 레이어(221)로 하여금 테스트 이미지를 전처리하도록 하지 않고, 테스트 이미지를 직접적으로 리셰이핑 레이어(222)에 입력할 수도 있다.

이때, 테스트 이미지 또는 이를 가공한 특징 맵의 채널의 개수가 K의 배수가 아닐 경우, 테스트 장치(200)는 리셰이핑 레이어(222)로 하여금 각각의 픽셀에 대응하는 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 더미 채널을 포함하는 채널의 개수가 K의 배수가 되도록 한 다음, 테스트 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 더미 채널을 포함하는 모든 채널 중에서 각각의 대응되는 K개의 채널로 구성된 각각의 그룹 내의 특징 각각을 컨캐터네이팅하도록 할 수 있다.

즉, 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우, 테스트 장치(200)는 리셰이핑 레이어(222)로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)인 테스트용 리셰이핑된 특징 맵을 생성하도록 하거나, (ii) 너비 WxK, 높이 H, 채널 CEIL(

)인 테스트용 리셰이핑된 특징 맵을 생성하도록 할 수 있다. 그리고, CEIL(

)번째 채널 상의 테스트용 리셰이핑된 특징 맵의 최종 부분의 사이즈가 너비 W, 높이 HxK인 사이즈가 되지 않을 경우에는 테스트 장치(200)는 리셰이핑 레이어로 하여금 적어도 하나의 제로 패딩을 추가하도록 하여 CEIL(

)번째 채널 상의 테스트용 리셰이핑된 특징 맵의 최종 부분의 사이즈가 너비 W, 높이 HxK인 사이즈가 되도록 하거나, CEIL(

)번째 채널 상의 테스트용 리셰이핑된 특징 맵의 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되지 않을 경우에는 테스트 장치(200)는 리셰이핑 레이어로 하여금 적어도 하나의 제로 패딩을 추가하도록 하여 CEIL(

)번째 채널 상의 리셰이핑된 특징 맵의 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되도록 할 수 있다.

이때, 테스트용 리셰이핑된 특징 맵은 너비 W, 높이 HxK, 채널 CEIL(

)이 된다. 그리고, 테스트용 리셰이핑된 특징 맵의 각각의 채널은 테스트 이미지 또는 이를 가공한 특징 맵의 K개의 채널로 구성된 각각의 그룹에 대응될 수 있다. 즉, 테스트용 리셰이핑된 특징 맵의 첫 번째 채널은 테스트 이미지 또는 이를 가공한 특징 맵의 첫 번째 채널 내지 K 번째 채널에 대응되고, 테스트용 리셰이핑된 특징 맵의 두 번째 채널은 테스트 이미지 또는 이를 가공한 특징 맵의 K+1 번째 채널 내지 2xK 번째 채널에 대응될 수 있다. 그리고, 테스트용 리셰이핑된 특징 맵의 CEIL(

) 번째 채널은 테스트 이미지 또는 이를 가공한 특징 맵의 (CEIL(

)-1)xK+1 번째 채널 내지 L 번째 채널에 대응될 수 있다.

이후, 테스트 장치(200)는 후속 컨벌루션 레이어(223)로 하여금 테스트용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하여 볼륨이 조정된 테스트용 조정 특징 맵을 생성하도록 할 수 있다. 이때, 테스트용 조정 특징 맵의 채널의 개수는 1xK 컨벌루션 연산을 수행하는 후속 컨벌루션 레이어(223)의 커널 개수, 즉, 필터의 개수에 대응될 수 있다. 일 예로, 후속 컨벌루션 레이어(223)의 커널 개수를 M이라 할 경우, 테스트용 조정 특징 맵의 채널은 M개가 될 수 있다.

한편, 상기에서는 1xK 컨벌루션 연산을 위한 방법을 설명하였으나, 테스트 이미지 또는 이를 가공한 특징 맵의 K개의 채널의 특징을 너비 방향으로 컨캐터네이팅한 후, Kx1 컨벌루션 연산을 수행할 수도 있다.

즉, 도 5a를 참조하여 설명한 바와 같이, 테스트용 리셰이핑된 특징 맵은 너비 WxK, 높이 H, 채널 CEIL(

)이 될 수 있다. 이때, 테스트용 리셰이핑된 특징 맵의 각각의 채널은 테스트 이미지 또는 이를 가공한 특징 맵의 K개의 채널로 구성된 각각의 그룹에 대응될 수 있다.

그리고, 테스트 장치(200)는 후속 컨벌루션 레이어(223)로 하여금 테스트용 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하여 볼륨이 조정된 테스트용 조정 특징 맵을 생성하도록 할 수 있다.

다음으로, 테스트 장치(100)는 후처리 레이어(224)로 하여금 후속 컨벌루션 레이어(223)로부터 출력되는 테스트용 조정 특징 맵을 후처리하도록 할 수 있다. 이때, 후처리 레이어(224)는 컨벌루션 레이어, 배치 노말라이제이션 레이어, 액티베이션 레이어, 풀링 레이어, FC 레이어 중 적어도 하나를 포함할 수 있으며, 후속 컨벌루션 레이어(223)로부터 출력되는 테스트용 조정 특징 맵 또는 이를 가공한 특징 맵의 분류된 특징을 나타내는 확률 정보를 생성할 수 있다. 하지만, 후처리 레이어(224)는 이에 한정되지 않으며, 이미지 처리를 위한 CNN을 구성하는 각각의 레이어를 포함할 수 있다.

다음으로, 테스트 장치(200)는 출력 레이어(225)로 하여금 테스트용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 테스트용 출력을 생성하도록 할 수 있다.

본 발명에 따른 방법은 KPI(Key Performance Index, 핵심성과지표)를 충족하는 하드웨어 최적화에 사용되기 위해 제공될 수 있다.

또한, 이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

100: 학습 장치,
200: 테스트 장치,
110, 210: 통신부,
120, 220: 프로세서,
130: 데이터베이스

Claims

1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN의 파라미터를 학습하는 방법에 있어서,
(a) 적어도 하나의 트레이닝 이미지가 획득되면, 학습 장치는, 리셰이핑 레이어(Reshaping Layer)로 하여금 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널을 K개의 채널별로 그룹하도록 하며, 각각의 그룹에서의 K개의 채널에서의 픽셀별 특징들을 각각의 하나의 채널에 컨캐터네이팅(Concatenating)하도록 하여 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 단계; 및
(b) 상기 학습 장치는, 출력 레이어로 하여금 상기 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습하는 단계;
를 포함하는 것을 특징으로 하는 학습 방법.

제 1 항에 있어서,
상기 (a) 단계에서,
상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우, 상기 학습 장치는, 상기 리셰이핑 레이어로 하여금 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 상기 더미 채널을 포함하는 상기 채널의 개수가 K의 배수가 되도록 한 다음, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 상기 더미 채널을 포함하는 상기 모든 채널 중에서 각각의 대응되는 K개의 상기 채널로 구성된 각각의 상기 그룹 내의 상기 특징 각각을 컨캐터네이팅하도록 하는 것을 특징으로 하는 학습 방법.

제 1 항에 있어서,
상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널 개수를 L이라 할 경우,
상기 (a) 단계에서,
상기 학습 장치는,
상기 리셰이핑 레이어로 하여금 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 리셰이핑된 특징 맵을 생성하도록 하는 것을 특징으로 하는 학습 방법.

제 3 항에 있어서,
상기 후속 컨벌루션 레이어의 커널(Kernel) 개수를 M이라 할 경우,
상기 (a) 단계에서,
상기 학습 장치는,
상기 후속 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 조정 특징 맵을 생성하도록 하는 것을 특징으로 하는 학습 방법.

제 1 항에 있어서,
상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널 개수를 L이라 할 경우,
상기 (a) 단계에서,
상기 학습 장치는,
상기 리셰이핑 레이어로 하여금 너비 WxK, 높이 H, 채널 CEIL(

제 5 항에 있어서,
상기 후속 컨벌루션 레이어의 커널 개수를 M이라 할 경우,
상기 (a) 단계에서,
상기 학습 장치는,
상기 후속 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 조정 특징 맵을 생성하도록 하는 것을 특징으로 하는 학습 방법.

제 1 항에 있어서,
상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널 개수를 L이라 할 경우,
상기 (a) 단계에서,
상기 학습 장치가,
상기 리셰이핑 레이어로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 리셰이핑된 특징 맵을 생성하도록 하되,
상기 CEIL(

)번째 채널 상의 상기 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되도록 하는 것을 특징으로 하는 학습 방법.

1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 테스트하는 방법에 있어서,
(a) 학습 장치가, (i) 리셰이핑 레이어(Reshaping Layer)로 하여금 적어도 하나의 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널을 K개의 채널별로 그룹하도록 하며, 각각의 그룹에서의 K개의 채널에서의 픽셀별 학습용 특징들을 각각의 하나의 채널에 컨캐터네이팅(Concatenating)하도록 하여 학습용 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하고, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 학습용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 학습용 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하며, (ii) 출력 레이어로 하여금 상기 학습용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 학습용 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 학습용 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습한 상태에서, 적어도 하나의 테스트 이미지가 획득되면, 테스트 장치는, 상기 리셰이핑 레이어(Reshaping Layer)로 하여금 상기 테스트 이미지 또는 이를 가공한 특징 맵의 모든 채널을 K개의 채널별로 그룹하도록 하며, 각각의 그룹에서의 K개의 채널에서의 픽셀별 테스트용 특징들을 각각의 하나의 채널에 컨캐터네이팅(Concatenating)하도록 하여 테스트용 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 상기 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 테스트용 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 단계; 및
(b) 상기 테스트 장치가, 상기 출력 레이어로 하여금 상기 테스트용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 테스트용 출력을 생성하도록 하는 단계;
를 포함하는 것을 특징으로 하는 테스트 방법.

제 8 항에 있어서,
상기 (a) 단계에서,
상기 테스트 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우, 상기 테스트 장치는, 상기 리셰이핑 레이어로 하여금 상기 테스트 이미지 또는 이를 가공한 특징 맵의 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 상기 더미 채널을 포함하는 상기 채널의 개수가 K의 배수가 되도록 한 다음, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 상기 더미 채널을 포함하는 상기 모든 채널 중에서 각각의 대응되는 K개의 상기 채널로 구성된 각각의 상기 그룹 내의 상기 특징 각각을 컨캐터네이팅하도록 하는 것을 특징으로 하는 테스트 방법.

제 8 항에 있어서,
상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (a) 단계에서,
상기 테스트 장치는,
상기 리셰이핑 레이어로 하여금 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 테스트용 리셰이핑된 특징 맵을 생성하도록 하는 것을 특징으로 하는 테스트 방법.

제 10 항에 있어서,
상기 후속 컨벌루션 레이어의 커널(Kernel) 개수를 M이라 할 경우,
상기 (a) 단계에서,
상기 테스트 장치는,
상기 후속 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 테스트용 조정 특징 맵을 생성하도록 하는 것을 특징으로 하는 테스트 방법.

제 10 항에 있어서,
상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (a) 단계에서,
상기 테스트 장치는,
상기 리셰이핑 레이어로 하여금 너비 WxK, 높이 H, 채널 CEIL(

제 12 항에 있어서,
상기 후속 컨벌루션 레이어의 커널 개수를 M이라 할 경우,
상기 (a) 단계에서,
상기 테스트 장치는,
상기 후속 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 테스트용 조정 특징 맵을 생성하도록 하는 것을 특징으로 하는 테스트 방법.

제 8 항에 있어서,
상기 테스트 이미지 또는 상기 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (a) 단계에서,
상기 테스트 장치가,
상기 리셰이핑 레이어로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)번째 채널 상의 상기 테스트용 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되도록 하는 것을 특징으로 하는 테스트 방법.

1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN의 파라미터를 학습하는 학습 장치에 있어서,
인스트럭션을 저장하는 적어도 하나의 메모리; 및
(I) 리셰이핑 레이어(Reshaping Layer)로 하여금 적어도 하나의 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널을 K개의 채널별로 그룹하도록 하며, 각각의 그룹에서의 K개의 채널에서의 픽셀별 특징들을 각각의 하나의 채널에 컨캐터네이팅(Concatenating)하도록 하여 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 프로세스, 및 (II) 출력 레이어로 하여금 상기 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;
를 포함하는 것을 특징으로 하는 학습 장치.

제 15 항에 있어서,
상기 (I) 프로세스에서,
상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우, 상기 프로세서는, 상기 리셰이핑 레이어로 하여금 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 상기 더미 채널을 포함하는 상기 채널의 개수가 K의 배수가 되도록 한 다음, 상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 상기 더미 채널을 포함하는 상기 모든 채널 중에서 각각의 대응되는 K개의 상기 채널로 구성된 각각의 상기 그룹 내의 상기 특징 각각을 컨캐터네이팅하도록 하는 것을 특징으로 하는 학습 장치.

제 15 항에 있어서,
상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는, 상기 리셰이핑 레이어로 하여금 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 리셰이핑된 특징 맵을 생성하도록 하는 것을 특징으로 하는 학습 장치.

제 17 항에 있어서,
상기 후속 컨벌루션 레이어의 커널(Kernel) 개수를 M이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는, 상기 후속 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 조정 특징 맵을 생성하도록 하는 것을 특징으로 하는 학습 장치.

제 15 항에 있어서,
상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는,
상기 리셰이핑 레이어로 하여금 너비 WxK, 높이 H, 채널 CEIL(

제 19 항에 있어서,
상기 후속 컨벌루션 레이어의 커널 개수를 M이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는,
상기 후속 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 조정 특징 맵을 생성하도록 하는 것을 특징으로 하는 학습 장치.

제 15 항에 있어서,
상기 트레이닝 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는,
상기 리셰이핑 레이어로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 리셰이핑된 특징 맵을 생성하도록 하되,
상기 CEIL(

)번째 채널 상의 상기 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되도록 하는 것을 특징으로 하는 학습 장치.

1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 이용하여 CNN을 테스트하는 테스트 장치에 있어서,
인스트럭션을 저장하는 적어도 하나의 메모리; 및
학습 장치는, (i) 리셰이핑 레이어(Reshaping Layer)로 하여금 적어도 하나의 트레이닝 이미지 또는 이를 가공한 특징 맵의 모든 채널을 K개의 채널별로 그룹하며, 각각의 그룹에서의 K개의 채널에서의 픽셀별 학습용 특징들을 각각의 하나의 채널에 컨캐터네이팅(Concatenating)하도록 하여 학습용 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 학습용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 학습용 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하고, (ii) 출력 레이어로 하여금 상기 학습용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 학습용 출력을 생성하도록 하며, 로스 레이어로 하여금 상기 학습용 출력과 이에 대응되는 적어도 하나의 GT(Ground Truth)를 참조하여 적어도 하나의 로스를 산출하도록 함으로써, 상기 로스를 백프로파게이션하여 상기 후속 컨벌루션 레이어의 적어도 일부 파라미터를 학습한 상태에서, (I) 상기 리셰이핑 레이어(Reshaping Layer)로 하여금 적어도 하나의 테스트 이미지 또는 이를 가공한 특징 맵의 모든 채널을 K개의 채널별로 그룹하도록 하며, 각각의 그룹에서의 K개의 채널에서의 픽셀별 테스트용 특징들을 각각의 하나의 채널에 컨캐터네이팅(Concatenating)하도록 하여 테스트용 리셰이핑된 특징 맵(Reshaped Feature Map)을 생성하도록 하며, 상기 후속(Subsequent) 컨벌루션 레이어로 하여금 상기 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산 또는 Kx1 컨벌루션 연산을 적용하도록 하여 볼륨(Volume)이 조정된 테스트용 조정 특징 맵(Adjusted Feature Map)을 생성하도록 하는 프로세스, 및 (II) 상기 출력 레이어로 하여금 상기 테스트용 조정 특징 맵 또는 이를 가공한 특징 맵 상의 특징을 참조하여 적어도 하나의 테스트용 출력을 생성하도록 하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;
를 포함하는 것을 특징으로 하는 테스트 장치.

제 22 항에 있어서,
상기 (I) 프로세스에서,
상기 테스트 이미지 또는 이를 가공한 특징 맵의 채널 개수가 K의 배수가 아닐 경우,
상기 프로세서는, 상기 리셰이핑 레이어로 하여금 상기 테스트 이미지 또는 이를 가공한 특징 맵의 채널에 적어도 하나의 더미 채널(Dummy Channel)을 추가하도록 하여 적어도 하나의 상기 더미 채널을 포함하는 상기 채널의 개수가 K의 배수가 되도록 한 다음, 상기 테스트 이미지 또는 이를 가공한 특징 맵의 적어도 하나의 상기 더미 채널을 포함하는 상기 모든 채널 중에서 각각의 대응되는 K개의 상기 채널로 구성된 각각의 상기 그룹 내의 상기 특징 각각을 컨캐터네이팅하도록 하는 것을 특징으로 하는 테스트 장치.

제 22 항에 있어서,
상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는,
상기 리셰이핑 레이어로 하여금 너비 W, 높이 HxK, 채널 CEIL(

)인 상기 테스트용 리셰이핑된 특징 맵을 생성하도록 하는 것을 특징으로 하는 테스트 장치.

제 24 항에 있어서,
상기 후속 컨벌루션 레이어의 커널(Kernel) 개수를 M이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는,
상기 후속 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 1xK 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 테스트용 조정 특징 맵을 생성하도록 하는 것을 특징으로 하는 테스트 장치.

제 24 항에 있어서,
상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는,
상기 리셰이핑 레이어로 하여금 너비 WxK, 높이 H, 채널 CEIL(

제 26 항에 있어서,
상기 후속 컨벌루션 레이어의 커널 개수를 M이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는,
상기 후속 컨벌루션 레이어로 하여금 상기 테스트용 리셰이핑된 특징 맵에 대하여 Kx1 컨벌루션 연산을 적용하도록 하여 너비 W, 높이 H, 채널 M인 WxHxM의 볼륨을 가지는 상기 테스트용 조정 특징 맵을 생성하도록 하는 것을 특징으로 하는 테스트 장치.

제 22 항에 있어서,
상기 테스트 이미지 또는 이를 가공한 특징 맵의 너비를 W, 높이를 H라 하고, 채널의 개수를 L이라 할 경우,
상기 (I) 프로세스에서,
상기 프로세서는,
상기 리셰이핑 레이어로 하여금, (i) 너비 W, 높이 HxK, 채널 CEIL(

)번째 채널 상의 상기 테스트용 리셰이핑된 특징 맵의 상기 최종 부분의 사이즈가 너비 WxK, 높이 H인 사이즈가 되도록 하는 것을 특징으로 하는 테스트 장치.