KR20200091782A - 군사적 목적, 드론 또는 로봇에 이용되기 위해, 하나 이상의 이전 배치를 추가적으로 참조하여 모바일 장치 또는 iot 장치에 적용 가능한 온라인 배치 노말라이제이션, 온-디바이스 학습, 및 연속학습을 수행하는 방법 및 장치 그리고 이를 이용한 테스팅 방법과 테스팅 장치 - Google Patents
군사적 목적, 드론 또는 로봇에 이용되기 위해, 하나 이상의 이전 배치를 추가적으로 참조하여 모바일 장치 또는 iot 장치에 적용 가능한 온라인 배치 노말라이제이션, 온-디바이스 학습, 및 연속학습을 수행하는 방법 및 장치 그리고 이를 이용한 테스팅 방법과 테스팅 장치 Download PDFInfo
- Publication number
- KR20200091782A KR20200091782A KR1020190119520A KR20190119520A KR20200091782A KR 20200091782 A KR20200091782 A KR 20200091782A KR 1020190119520 A KR1020190119520 A KR 1020190119520A KR 20190119520 A KR20190119520 A KR 20190119520A KR 20200091782 A KR20200091782 A KR 20200091782A
- Authority
- KR
- South Korea
- Prior art keywords
- batch
- feature map
- learning
- cnn
- test
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
IOT 장치, 모바일 장치 등에 적용 가능한 온라인 배치 노말라이제이션(online batch normalization), 온-디바이스 학습(on-device learning), 및 연속 학습(continual learning)을 위한 방법이 제공된다. 상기 방법은, (a) 컴퓨팅 장치가 컨벌루션 레이어로 하여금 제k 배치를 획득하도록 하고, 상기 제k 배치에 포함된 입력 이미지에 각각 컨벌루션 연산을 가하여 제k 배치용 특징 맵을 생성하도록 하는 단계; 및 (b) 컴퓨팅 장치가 배치 노말라이제이션 레이어로 하여금 k가 1인 경우에, 상기 제k 배치용 특징 맵을 참조하고, k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 제1 내지 제(k-1) 배치 중에서 선택된 이전 배치의 적어도 일부분에 포함되는 이전 특징 맵 및 상기 제k 배치용 특징 맵을 참조하여, 상기 제k 배치용 특징 맵의 조정 평균 및 조정 분산을 산출하도록 하고, 상기 제k 배치용 특징 맵에 배치 노말라이제이션 연산을 가하도록 하는 단계;를 포함한다. 또한, 상기 방법은 군사적 목적을 위해 또는 드론 및 로봇과 같은 다른 장치에 사용되기 위해 수행된다.
Description
본 발명은 군사적 목적 또는 드론이나 로봇과 같은 다른 장치에 이용되기 위해, 하나 이상의 이전 배치(Batch)를 추가적으로 참조하여 IOT 장치, 모바일 장치 등에 적용 가능한 온라인 배치 노말라이제이션(Normalization), 온-디바이스(on-device) 학습 또는 연속 학습(continual learning)하는 방법에 관한 것으로; 보다 상세하게는, 각각의 입력 이미지를 포함하는 각각의 배치 - 상기 배치는 제1 배치 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션하는 상기 방법에 있어서, (a) CNN의 컨벌루션 레이어로 하여금 (i) 제k 배치 - k는 1부터 m까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 배치에 포함된 상기 입력 이미지에 각각 컨벌루션 연산을 가하여 제k 배치용 특징 맵을 생성하도록 하는 단계; 및 (b) 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 배치 중에서 선택된 이전 배치의 적어도 일부분에 포함되는 이전 특징 맵 및 상기 제k 배치용 특징 맵을 참조하여, 상기 제k 배치용 특징 맵의 하나 이상의 조정 평균 및 하나 이상의 조정 분산을 산출하도록 하고, (II) 상기 조정 평균 및 상기 조정 분산을 참조하여 상기 제k 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 조정 특징 맵을 생성하도록 하는 단계;를 포함하는 방법 및 컴퓨팅 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치에 관한 것이다.
딥 컨벌루션 뉴럴 네트워크(Deep Convolutional Neural Network; Deep CNN)는 딥 러닝 분야에서 일어난 놀라운 발전의 핵심이다. CNN은 글자 인식 문제를 풀기 위해 90년대에 이미 사용되었지만, 현재처럼 널리 쓰이게 된 것은 최근의 연구 결과 덕분이다. 이러한 딥 CNN은 2012년 ImageNet 이미지 분류 시합에서 다른 경쟁자들을 이기고 우승을 차지했다. 그리고 나서 컨벌루션 뉴럴 네트워크는 기계 학습(Machine Learning) 분야에서 매우 유용한 툴이 되었다.
한편, 배치 노말라이제이션이란, 트레이닝 이미지를 포함하는 각 미니 배치의 각 채널마다 각각의 평균 및 각각의 분산을 이용하여 특징 맵을 정규화하는 방법이다. 배치 노말라이제이션은, 입력의 분포가 뉴럴 네트워크 내 각 레이어 마다 달라지는 내부 공변량 변화(Internal Covariate Shift)라는 바람직하지 않은 현상을 막기 위해 이용된다. 배치 노말라이제이션의 장점으로는 (i) 학습 속도의 가속화, (ii) 뉴럴 네트워크 내 전체 가중치가 고르게 학습되는 것 그리고 (iii) 특징을 증강시키는 것을 포함한다.
종래의 배치 노말라이제이션을 설명하기 위해 도 4를 참조하도록 한다.
도 4를 참조하면, 입력 이미지를 포함하는 m개의 배치가 존재한다면, 종래의 배치 노말라이제이션은 (i) 각 컨벌루션 블록의 컨벌루션 레이어로 하여금 제k 배치 - k는 1부터 m까지의 정수임 - 에 포함된 입력 이미지에 컨벌루션 연산을 가하여 제k 배치용 특징 맵을 생성하도록 하고, (ii) 각 컨벌루션 블록의 배치 노말라이제이션 레이어로 하여금 제k 배치용 특징 맵의 하나 이상의 평균 및 하나 이상의 분산을 생성하도록 하며, (iii) 각 컨벌루션 블록의 배치 노말라이제이션 레이어로 하여금 평균 및 분산이 각각 특정 제1 값 및 특정 제2 값이 되도록 제k 배치용 특징 맵을 정규화 하도록 한다. 즉, 특정 배치의 배치 노말라이제이션은 특정 배치용 특징 맵의 평균 및 분산만을 이용하여 수행된다.
각 배치의 사이즈가 너무 작게 설정되면, 각각의 배치용 특징 맵의 값이 정규분포를 따르지 않을 것이다. 따라서, 종래의 배치 노말라이제이션의 성능은 저하되며. 이는 종래 배치 노말라이제이션의 결정적 단점이다.
본 발명은 상술한 문제점을 해결하는 것을 목적으로 한다.
본 발명은 제k 배치의 사이즈가 작더라도 제1 내지 제(k-1) 배치 중 적어도 일부 배치에 포함되는 이전 특징 맵을 더 참조하여 제k 배치의 배치 노말라이제이션이 효과적으로 이루어지도록 하기 위한 방법을 제공하는 것을 다른 목적으로 한다.
본 발명은 각 배치에 대한 정보를 참조하여, 이전 배치 중에서 배치 노말라이제이션을 위해 이용될 특정 이전 배치를 선택하는 방법을 제공하는 것을 또 다른 목적으로 한다.
상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한 본 발명의 특징적인 구성은 하기와 같다.
본 발명의 일 태양에 따르면, 각각의 입력 이미지를 포함하는 각각의 배치(Batch) - 상기 배치는 제1 배치 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션(Normalization) 방법에 있어서, (a) 컴퓨팅 장치가, CNN의 컨벌루션 레이어로 하여금 (i) 제k 배치 - k는 1부터 m까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 배치에 포함된 상기 입력 이미지에 각각 컨벌루션 연산을 가하여 제k 배치용 특징 맵을 생성하도록 하는 단계; 및 (b) 상기 컴퓨팅 장치가, 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 배치 중에서 선택된 이전 배치의 적어도 일부분에 포함되는 이전 특징 맵 및 상기 제k 배치용 특징 맵을 참조하여, 상기 제k 배치용 특징 맵의 하나 이상의 조정 평균 및 하나 이상의 조정 분산을 산출하도록 하고, (II) 상기 조정 평균 및 상기 조정 분산을 참조하여 상기 제k 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 조정 특징 맵을 생성하도록 하는 단계;를 포함하는 배치 노말라이제이션 학습 방법이 제공된다.
일 실시예에서, (c) 상기 컴퓨팅 장치가, 상기 CNN의 액티베이션 레이어(Activation Layer)로 하여금 상기 조정 특징 맵에 비선형 연산을 가하여 재조정 특징 맵을 생성하도록 하는 단계;를 더 포함한다.
일 실시예에서, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 배치에 포함된 상기 입력 이미지에 연산을 가하여 상기 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 재조정 특징 맵을 생성하도록 하여 상기 재조정 특징 맵이 생성된다.
일 실시예에서, (d) 상기 컴퓨팅 장치가, 상기 CNN의 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 재조정 특징 맵에 출력 연산을 가하여 CNN 출력 값을 생성하도록 하는 단계; 및 (e) 상기 컴퓨팅 장치가, 로스 레이어로 하여금 상기 CNN 출력 값 및 이에 대응하는 GT(Ground Truth)를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션(backpropagation)하여 상기 CNN의 파라미터를 학습하도록 하는 단계;를 더 포함한다.
일 실시예에서, 상기 배치 노말라이제이션 연산은 상기 제k 배치용 특징 맵에 포함된 값들을 정규화하여 상기 조정 평균 및 상기 조정 분산이 각각 제1 값 및 제2 값을 갖도록 하는 연산이다.
일 실시예에서, 상기 (b) 단계에서, 상기 배치 노말라이제이션 레이어가, 상기 제 k 배치용 특징 맵의 분산을 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 조정 평균 및 상기 조정 분산을 생성하기 위해 선택되는 상기 이전 배치의 수를 결정한다.
일 실시예에서, 상기 제 k 배치용 특징 맵의 분산이 특정 임계치보다 작다면, 상기 배치 노말라이제이션 레이어가 (i) 상기 제k 배치용 특징 맵만을 참조하거나 (ii) 상기 제k 배치용 특징 맵 및 하나 이상의 특정 이전 배치용 특정 이전 특징 맵을 참조하여 상기 조정 평균 및 상기 조정 분산을 산출하되, 상기 특정 이전 배치는, (k-1)개에 대한 상기 특정 이전 배치의 개수의 비율이 특정 임계 비율 이하로 결정되도록 상기 제1 내지 상기 제(k-1) 배치 중에서 선택된다.
일 실시예에서, 상기 (b) 단계에서, 상기 배치 노말라이제이션 레이어는, 상기 제k 배치에 포함된 상기 입력 이미지의 개수를 참조하여, (k-1)개에 대한 특정 이전 배치의 개수의 비율을 결정하되, 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 상기 특정 이전 배치는 상기 제1 내지 상기 제(k-1) 배치 중에서 선택된다.
일 실시예에서, 상기 (b) 단계에서, 상기 배치 노말라이제이션 레이어는 (i) 제1 가중치가 할당된 상기 제k 배치용 특징 맵 및 (ii) 하나 이상의 제2 가중치가 할당된, 상기 제1 내지 상기 제(k-1) 이전 배치 중 적어도 일부 배치에 포함되는 상기 이전 특징 맵을 참조하여 상기 조정 평균 및 상기 조정 분산을 산출한다.
일 실시예에서, 상기 (b) 단계에서, 상기 배치 노말라이제이션 레이어가, 상기 제2 내지 상기 제(k-1) 배치의 각각의 조정 평균 및 각각의 조정 분산이 생성되는 동안 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 각각의 상기 이전 특징 맵이 이용되었던 횟수를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택한다.
일 실시예에서, 상기 (b) 단계에서, 상기 배치 노말라이제이션 레이어가 (i) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 평균이 제1 값을 참조로 결정되는 제1 특정 범위 내에 존재하는지 여부에 대한 정보, 또는 (ii) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 분산이 제2 값을 참조로 결정되는 제2 특정 범위 내에 존재하는지 여부에 대한 정보를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택한다.
일 실시예에서, 상기 (b) 단계에서, 상기 배치 노말라이제이션 레이어는 상기 배치 노말라이제이션 연산을 상기 제k 배치용 특징 맵에 적용한 후, 이에 선형 연산을 가하여 상기 제k 배치용 조정 특징 맵을 생성하되, 상기 선형 연산은 아래 수식을 따르며,
본 발명의 다른 태양에 따르면, 각각의 테스트 이미지를 포함하는 각각의 배치 - 상기 배치는 제1 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션 테스팅 방법에 있어서, (a) (1) 학습 장치가, CNN의 컨벌루션 레이어로 하여금 (i) 제k 학습용 배치 - k는 1부터 m'까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 학습용 배치에 포함된 트레이닝 이미지에 각각 컨벌루션 연산을 가하여 제k 학습용 배치용 특징 맵을 생성하도록 하고, (2) 상기 학습 장치가, 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 학습용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m'까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 학습용 배치 중에서 선택된 이전 학습용 배치의 적어도 일부분에 포함되는 이전 학습용 특징 맵 및 상기 제k 학습용 배치용 특징 맵을 참조하여, 상기 제k 학습용 배치용 특징 맵의 하나 이상의 학습용 조정 평균 및 하나 이상의 학습용 조정 분산을 산출하도록 하고, (II) 상기 학습용 조정 평균 및 상기 학습용 조정 분산을 참조하여 상기 제k 학습용 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 학습용 조정 특징 맵을 생성하도록 하며, (3) 상기 학습 장치가, 상기 CNN의 액티베이션 레이어로 하여금 상기 학습용 조정 특징 맵에 비선형 연산을 가하여 학습용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 학습용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 학습용 배치에 포함된 상기 트레이닝 이미지에 연산을 가하여 상기 학습용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 학습용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 학습용 재조정 특징 맵을 생성하도록 하여 상기 학습용 재조정 특징 맵이 생성되고, (4) 상기 학습 장치가, 상기 CNN의 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 학습용 재조정 특징 맵에 출력 연산을 가하여 학습용 CNN 출력 값을 생성하도록 하며, (5) 상기 학습 장치가, 상기 CNN의 로스 레이어로 하여금 상기 학습용 CNN 출력 값 및 이에 대응하는 GT(Ground Truth)를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션하여 상기 CNN의 파라미터를 학습한 상태에서, 테스팅 장치가 상기 CNN의 상기 컨벌루션 레이어로 하여금 (i) 제k 테스트용 배치 - k는 1부터 m까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 테스트용 배치에 각각 포함된 테스트 이미지에 컨벌루션 연산을 가하여 제k 테스트용 배치용 특징 맵을 생성하도록 하는 단계; (b) 상기 테스팅 장치가, 상기 CNN의 상기 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 테스트용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 테스트용 배치 중에서 선택된 이전 테스트용 배치의 적어도 일부분에 포함되는 이전 테스트용 특징 맵 및 상기 제k 테스트용 배치용 특징 맵을 참조하여, 상기 제k 테스트용 배치용 특징 맵의 하나 이상의 테스트용 조정 평균 및 하나 이상의 테스트용 조정 분산을 산출하도록 하고, (II) 상기 테스트용 조정 평균 및 상기 테스트용 조정 분산을 참조하여 상기 제k 테스트용 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 테스트용 조정 특징 맵을 생성하도록 하는 단계; (c) 상기 테스팅 장치가, 상기 CNN의 상기 액티베이션 레이어로 하여금 상기 테스트용 조정 특징 맵에 비선형 연산을 가하여 테스트용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 테스트용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 테스트용 배치에 포함된 상기 테스트 이미지에 연산을 가하여 상기 테스트용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 테스트용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 테스트용 재조정 특징 맵을 생성하도록 하여 상기 테스트용 재조정 특징 맵이 생성되는 단계; 및 (d) 상기 테스팅 장치가, 상기 CNN의 상기 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 테스트용 재조정 특징 맵에 출력 연산을 가하여 테스트용 CNN 출력 값을 생성하도록 하는 단계;를 포함하는 것을 특징으로 하는 테스팅 방법이 제공된다.
본 발명의 또 다른 태양에 따르면, 각각의 입력 이미지를 포함하는 각각의 배치(Batch) - 상기 배치는 제1 배치 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션 컴퓨팅 장치에 있어서, 인스트럭션을 저장하는 적어도 하나의 메모리; 및 (1) CNN의 컨벌루션 레이어로 하여금 제k 배치 - k는 1부터 m까지의 정수임 - 에 포함된 상기 입력 이미지에 각각 컨벌루션 연산을 가하여 제k 배치용 특징 맵을 생성하도록 하는 프로세스, 및 (2) 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 배치 중에서 선택된 이전 배치의 적어도 일부분에 포함되는 이전 특징 맵 및 상기 제k 배치용 특징 맵을 참조하여, 상기 제k 배치용 특징 맵의 하나 이상의 조정 평균 및 하나 이상의 조정 분산을 산출하도록 하고, (II) 상기 조정 평균 및 상기 조정 분산을 참조하여 상기 제k 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 조정 특징 맵을 생성하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;를 포함하는 것을 특징으로 하는 컴퓨팅 장치가 제공된다.
일 실시예에서, 상기 프로세서가, (3) 상기 CNN의 액티베이션 레이어로 하여금 상기 조정 특징 맵에 비선형 연산을 가하여 재조정 특징 맵을 생성하도록 하는 프로세스;를 더 수행한다.
일 실시예에서, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 배치에 포함된 상기 입력 이미지에 연산을 가하여 상기 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 재조정 특징 맵을 생성하도록 하여 상기 재조정 특징 맵이 생성된다.
일 실시예에서, 상기 프로세서가, (4) 상기 CNN의 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 재조정 특징 맵에 출력 연산을 가하여 CNN 출력 값을 생성하도록 하는 프로세스; 및 (5) 로스 레이어로 하여금 상기 CNN 출력 값 및 이에 대응하는 GT를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션하여 상기 CNN의 파라미터를 학습하도록 하는 프로세스;를 더 수행한다.
일 실시예에서, 상기 배치 노말라이제이션 연산은 상기 제k 배치용 특징 맵에 포함된 값들을 정규화하여 상기 조정 평균 및 상기 조정 분산이 각각 제1 값 및 제2 값을 갖도록 하는 연산이다.
일 실시예에서, 상기 (2) 프로세스에서, 상기 배치 노말라이제이션 레이어가, 상기 제 k 배치용 특징 맵의 분산을 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 조정 평균 및 상기 조정 분산을 생성하기 위해 선택되는 상기 이전 배치의 수를 결정한다.
일 실시예에서, 상기 제 k 배치용 특징 맵의 분산이 특정 임계치보다 작다면, 상기 배치 노말라이제이션 레이어가 (i) 상기 제k 배치용 특징 맵만을 참조하거나 (ii) 상기 제k 배치용 특징 맵 및 하나 이상의 특정 이전 배치용 특정 이전 특징 맵을 참조하여 상기 조정 평균 및 상기 조정 분산을 산출하되, 상기 특정 이전 배치는, (k-1)개에 대한 상기 특정 이전 배치의 개수의 비율이 특정 임계 비율 이하로 결정되도록 상기 제1 내지 상기 제(k-1) 배치 중에서 선택된다.
일 실시예에서, 상기 (2) 프로세스에서, 상기 배치 노말라이제이션 레이어는, 상기 제k 배치에 포함된 상기 입력 이미지의 개수를 참조하여, (k-1)개에 대한 특정 이전 배치의 개수의 비율을 결정하되, 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 상기 특정 이전 배치는 상기 제1 내지 상기 제(k-1) 배치 중에서 선택된다.
일 실시예에서, 상기 (2) 프로세스에서, 상기 배치 노말라이제이션 레이어는 (i) 제1 가중치가 할당된 상기 제k 배치용 특징 맵 및 (ii) 하나 이상의 제2 가중치가 할당된, 상기 제1 내지 상기 제(k-1) 이전 배치 중 적어도 일부 배치에 포함되는 상기 이전 특징 맵을 참조하여 상기 조정 평균 및 상기 조정 분산을 산출한다.
일 실시예에서, 상기 (2) 프로세스에서, 상기 배치 노말라이제이션 레이어가, 상기 제2 내지 상기 제(k-1) 배치의 각각의 조정 평균 및 각각의 조정 분산이 생성되는 동안 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 각각의 상기 이전 특징 맵이 이용되었던 횟수를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택한다.
일 실시예에서, 상기 (2) 프로세스에서, 상기 배치 노말라이제이션 레이어가 (i) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 평균이 제1 값을 참조로 결정되는 제1 특정 범위 내에 존재하는지 여부에 대한 정보, 또는 (ii) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 분산이 제2 값을 참조로 결정되는 제2 특정 범위 내에 존재하는지 여부에 대한 정보를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택한다.
일 실시예에서, 상기 (2) 프로세스에서, 상기 배치 노말라이제이션 레이어는 상기 배치 노말라이제이션 연산을 상기 제k 배치용 특징 맵에 적용한 후, 이에 선형 연산을 가하여 상기 제k 배치용 조정 특징 맵을 생성하되, 상기 선형 연산은 아래 수식을 따르며,
본 발명의 또 다른 태양에 따르면, 각각의 테스트 이미지를 포함하는 각각의 배치 - 상기 배치는 제1 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션 테스팅 장치에 있어서, 인스트럭션을 저장하는 적어도 하나의 메모리; 및 (1) 학습 장치가, CNN의 컨벌루션 레이어로 하여금 (i) 제k 학습용 배치 - k는 1부터 m'까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 학습용 배치에 포함된 트레이닝 이미지에 각각 컨벌루션 연산을 가하여 제k 학습용 배치용 특징 맵을 생성하도록 하고, (2) 상기 학습 장치가, 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 학습용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m'까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 학습용 배치 중에서 선택된 이전 학습용 배치의 적어도 일부분에 포함되는 이전 학습용 특징 맵 및 상기 제k 학습용 배치용 특징 맵을 참조하여, 상기 제k 학습용 배치용 특징 맵의 학습용 조정 평균 및 학습용 조정 분산을 산출하도록 하고, (II) 상기 학습용 조정 평균 및 상기 학습용 조정 분산을 참조하여 상기 제k 학습용 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 학습용 조정 특징 맵을 생성하도록 하며, (3) 상기 학습 장치가, 상기 CNN의 액티베이션 레이어로 하여금 상기 학습용 조정 특징 맵에 비선형 연산을 가하여 학습용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 학습용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 학습용 배치에 포함된 상기 트레이닝 이미지에 연산을 가하여 상기 학습용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 학습용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 학습용 재조정 특징 맵을 생성하도록 하여 상기 학습용 재조정 특징 맵이 생성되고, (4) 상기 학습 장치가, 상기 CNN의 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 학습용 재조정 특징 맵에 출력 연산을 가하여 학습용 CNN 출력 값을 생성하도록 하며, (5) 상기 학습 장치가, 상기 CNN의 로스 레이어로 하여금 상기 학습용 CNN 출력 값 및 이에 대응하는 GT(Ground Truth)를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션하여 상기 CNN의 파라미터를 학습한 상태에서, (A) 상기 CNN의 상기 컨벌루션 레이어로 하여금 상기 제k 테스트용 배치에 각각 포함된 테스트 이미지에 상기 컨벌루션 연산을 가하여 제k 테스트용 배치용 특징 맵을 생성하도록 하는 프로세스, (B) 상기 CNN의 상기 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 테스트용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 테스트용 배치 중에서 선택된 이전 테스트용 배치의 적어도 일부분에 포함되는 이전 테스트용 특징 맵 및 상기 제k 테스트용 배치용 특징 맵을 참조하여, 상기 제k 테스트용 배치용 특징 맵의 테스트용 조정 평균 및 테스트용 조정 분산을 산출하도록 하고, (II) 상기 테스트용 조정 평균 및 상기 테스트용 조정 분산을 참조하여 상기 제k 테스트용 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 테스트용 조정 특징 맵을 생성하도록 하는 프로세스, (C) 상기 CNN의 상기 액티베이션 레이어로 하여금 상기 테스트용 조정 특징 맵에 비선형 연산을 가하여 테스트용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 테스트용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 테스트용 배치에 포함된 상기 테스트 이미지에 상기 연산을 가하여 상기 테스트용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 테스트용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 테스트용 재조정 특징 맵을 생성하도록 하여 상기 테스트용 재조정 특징 맵이 생성되는 프로세스, 및 (D) 상기 CNN의 상기 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 테스트용 재조정 특징 맵에 출력 연산을 가하여 테스트용 CNN 출력 값을 생성하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;를 포함하는 것을 특징으로 하는 테스팅 장치가 제공된다.
본 발명에 의하면, 학습용 입력 이미지를 복수 개의 배치로 나누어 학습시킬 때, 각각의 배치의 사이즈가 작아도 최적화된 배치 노말라이제이션 결과를 얻을 수 있는 효과가 있다.
또한 본 발명에 의하면, 각각의 배치들에 대한 정보를 참조로 하여 각각의 배치들에 대응하는 피처 맵을 참조할지 여부를 결정함으로써 최적화된 배치 노말라이제이션 결과를 얻을 수 있는 효과가 있다.
본 발명의 실시예의 설명에 이용되기 위하여 첨부된 아래 도면들은 본 발명의 실시예들 중 단지 일부일 뿐이며, 본 발명이 속한 기술분야에서 통상의 지식을 가진 자(이하 "통상의 기술자")에게 있어서는 발명적 작업이 이루어짐 없이 이 도면들에 기초하여 다른 도면들이 얻어질 수 있다.
도 1은 본 발명에 따른 이전 배치를 추가적으로 참조하여 배치 노말라이제이션을 수행하는 컴퓨팅 장치의 구성을 도시한 것 이다.
도 2는 본 발명에 따른 CNN의 구성을 도시한 것 이다.
도 3은 본 발명의 일 실시예에 따른 배치 노말라이제이션의 프로세스를 도시한 것 이다.
도 4는 종래의 배치 노말라이제이션 프로세스를 도시한 것 이다.
도 1은 본 발명에 따른 이전 배치를 추가적으로 참조하여 배치 노말라이제이션을 수행하는 컴퓨팅 장치의 구성을 도시한 것 이다.
도 2는 본 발명에 따른 CNN의 구성을 도시한 것 이다.
도 3은 본 발명의 일 실시예에 따른 배치 노말라이제이션의 프로세스를 도시한 것 이다.
도 4는 종래의 배치 노말라이제이션 프로세스를 도시한 것 이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
또한, 본 발명의 상세한 설명 및 청구항들에 걸쳐, "포함하다"라는 단어 및 그것의 변형은 다른 기술적 특징들, 부가물들, 구성요소들 또는 단계들을 제외하는 것으로 의도된 것이 아니다. 통상의 기술자에게 본 발명의 다른 목적들, 장점들 및 특성들이 일부는 본 설명서로부터, 그리고 일부는 본 발명의 실시로부터 드러날 것이다. 아래의 예시 및 도면은 실례로서 제공되며, 본 발명을 한정하는 것으로 의도된 것이 아니다.
본 발명에서 언급하는 각종 이미지는 포장 또는 비포장 도로 관련 이미지를 포함할 수 있으며, 이 경우 도로 환경에서 등장할 수 있는 물체(가령, 자동차, 사람, 동물, 식물, 물건, 건물, 비행기나 드론과 같은 비행체, 기타 장애물)를 상정할 수 있을 것이나, 반드시 이에 한정되는 것은 아니며, 본 발명에서 언급하는 각종 이미지는 도로와 상관 없는 이미지(가령, 비포장도로, 골목길, 공터, 바다, 호수, 강, 산, 숲, 사막, 하늘, 실내와 관련된 이미지)일 수도 있으며, 이 경우, 비포장도로, 골목길, 공터, 바다, 호수, 강, 산, 숲, 사막, 하늘, 실내 환경에서 등장할 수 있는 물체(가령, 자동차, 사람, 동물, 식물, 물건, 건물, 비행기나 드론과 같은 비행체, 기타 장애물)를 상정할 수 있을 것이나, 반드시 이에 한정되는 것은 아니다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명에 따른 컴퓨팅 장치의 구성을 도시한 것이다.
도 1을 참조하면, 컴퓨팅 장치(100)는 CNN(200)을 포함할 수 있다. CNN(200)의 다양한 데이터 입출력 과정 및 연산 과정은 각각 통신부(110) 및 프로세서(120)에 의해 이루어질 수 있다. 다만, 도 1 에서는 상기 통신부(110) 및 상기 프로세서(120)의 구체적인 연결 관계를 생략하였다. 또한, 상기 학습 장치는 상술한 프로세스를 수행하기 위한 컴퓨터 판독 가능한 인스트럭션을 저장할 수 있는 메모리(115)를 더 포함할 수 있다. 일 예로, 프로세서, 메모리, 매체(medium) 등이 하나의 프로세서로 통합되어 기능할 수도 있다.
도 2는 본 발명에 따른 상기 CNN(200)의 구성을 도시한 것이다.
도 2를 참조하면, 상기 CNN(200)은 (i) 컨벌루션 레이어(211), 배치 노말라이제이션(batch normalization) 레이어(212) 및 액티베이션(activation) 레이어(213)를 포함하는 각 n 개의 컨벌루션 블록(210-1 내지 210-n), (ii) 출력 레이어(220) 및 (iii) 로스 레이어(230)를 포함한다.
따라서, 통신부(110)에 의해 입력 영상이 획득되면, 상기 입력 이미지는 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 연산되어 재조정 특징 맵이 생성되고, 상기 생성된 재조정 특징 맵은 상기 출력 레이어(220)에 전달된다.
구체적으로, 제1 컨벌루션 블록(210-1)을 예를 들어 설명하면, 상기 제1 컨벌루션 블록(210-1)에 포함된 상기 컨벌루션 레이어(211)는 상기 입력 이미지에 컨벌루션 연산을 가하여 특징 맵을 생성한다. 또한, 상기 배치 노말라이제이션 레이어(212)는 상기 컨벌루션 레이어(211)로부터 출력된 상기 특징 맵에 배치 노말라이제이션 연산을 가하여 조정 특징 맵을 생성한다. 그 후, 상기 액티베이션 레이어(213)는 상기 조정 특징 맵에 비선형 연산을 가하여 상기 재조정 특징 맵을 생성한다. 상기 배치 노말라이제이션 연산에 관해서는 추후 도 3을 참조하여 자세히 설명하도록 한다. 상기 액티베이션 레이어(213)에 의해 수행되는 상기 비선형 연산은 ReLU 연산일 수 있으나, 이에 한정되는 것은 아니다. 한편, 상기 액티베이션 레이어(213)가 필수적으로 요구되는 것은 아닐 수 있다.
상기 제1 컨벌루션 블록(210-1)에 의해 상기 제1 재조정 특징 맵이 생성된 후, 상기 제1 재조정 특징 맵은 제2 컨벌루션 블록(210-2)으로 전달되고, 상기 제1 컨벌루션 블록(210-1)과 같은 방식으로 상기 컨벌루션 연산, 상기 배치 노말라이제이션 연산 및 상기 비선형 연산이 상기 전달된 제1 재조정 특징 맵에 가해진다. 이러한 연산을 반복하여, 상기 제n 컨벌루션 블록(210-n)에 의해 최종적으로 제n 재조정 특징 맵이 생성된다.
이 후, 상기 출력 레이어(220)는 상기 제n 재조정 특징 맵에 출력 연산을 가하여 CNN 출력 값을 생성한다. 상기 출력 연산은 세그먼테이션, 클러스터링(Clustering), 객체 검출 등을 위한 연산이 될 수 있을 것이나, 이에 한정되는 것은 아니다. 상기 출력 레이어(220)에 의해 상기 CNN 출력 값이 생성된 후, 상기 로스 레이어(230)는 상기 CNN 출력 값 및 이에 대응하는 GT를 참조하여 로스를 생성한다. 상기 로스는 백프로퍼게이션(backpropagation)되어 상기 출력 레이어(220), 배치 노말라이제이션 레이어(212) 및 컨벌루션 레이어(211) 중 적어도 일부의 파라미터를 학습하는 데 이용된다.
상기 CNN(200)의 구성을 알아본 바, 구체적으로 상기 배치 노말라이제이션 연산이 어떻게 수행되는지를 이하 설명하도록 한다.
도 3은 본 발명의 일 실시예에 따른 상기 배치 노말라이제이션 연산을 도시한 것 이다.
도 3을 참조하면, 본 발명에 따른 상기 배치 노말라이제이션 연산은, (i) 각 컨벌루션 블록의 상기 컨벌루션 레이어(211)에서 상기 제k 배치에 포함된 상기 입력 이미지에 상기 컨벌루션 연산을 가하여 제k 배치용 특징 맵을 생성하고, (ii) (1) 상기 제k 배치용 특징 맵 및 추가적으로 (2) 제1 내지 제(k-1) 배치인 이전 배치용 이전 특징 맵을 참조하여 상기 제k 배치용 특징 맵의 하나 이상의 조정 평균 및 하나 이상의 조정 분산을 산출하고, (iii) 상기 조정 평균 및 상기 조정 분산이 각각 제1 값 및 제2 값이 되도록 상기 제 k 배치용 특징 맵을 정규화하기 위한 연산이다. 물론 k는 1인 경우에, 상기 제1 배치용 특징 맵을 정규화하기 위해서 상기 제1 배치용 특징 맵만 이용될 수 있다. 한편, 상기 조정 평균 및 상기 조정 분산은, 상기 특징 맵에 포함된 한 채널당 하나씩 생성될 수 있다.
기본적으로, 각 배치의 사이즈가 너무 작다면, 각 상기 배치용 특징 맵의 값이 정규분포를 따르는 것으로 가정할 수 없을 것이다. 하지만, 도 3에 도시된 것처럼, 본 발명에 따라 상기 배치 노말라이제이션 연산의 상기 이전 배치를 추가적으로 참조함으로써, 표본이 많아지므로 특징 맵이 정규분포 혹은 그에 대등한 분포를 따르는 것으로 가정할 수 있게 되는 바, 최적화된 배치 노말라이제이션 결과가 생성된다.
종래 기술과 대비되는 본 발명의 특징을 위에서 기술하였으며, 어떠한 방식으로 상기 이전 배치용 이전 특징 맵이 추가적으로 참조되는지에 대해 구체적으로 설명하도록 한다.
기본적으로, 상기 조정 평균 및 상기 조정 분산은 상기 이전 배치 및 상기 제k 배치를 동일하게 참조하여 생성된다. 예를 들어, 상기 제8 배치용 특징 맵에 가해지는 상기 배치 노말라이제이션 연산이 제1 내지 제7 배치용 모든 이전 특징 맵 및 제8 배치용 특징 맵을 참조하여 연산되는 경우 및 상기 제1 내지 상기 제8 배치 각각에 포함된 상기 입력 이미지 내 각각의 특정 픽셀에 대응하는 특징 값이 {1, 4, 5, 6, 3, 5, 7, 8}인 경우에(이 예시는 편의를 위해 한 배치당 하나의 특징 값이 존재하는 것으로 가정하였지만, 한 배치당 다 수의 특징 값이 존재할 수 있다), 상기 모든 이전 배치 및 상기 현재 배치 즉, 상기 제8 배치에 동일한 가중치가 할당되기 때문에, 상기 조정 평균은 4.875가 될 것이다.
다른 경우를 들면, 상기 조정 평균 및 상기 조정 분산은 각각 다른 가중치가 할당된 상기 이전 배치용 이전 특징 맵 및 상기 제k 배치용 특징 맵을 참조하여 생성된다. 위에서 언급한 예와 같은 상기 제1 내지 상기 제7 배치용 이전 특징 맵 및 상기 제8 배치용 특징 맵의 경우를 가정하면, 상기 제8 배치용 특징 맵이 가장 중요한 것으로 결정되어, 상기 배치 노말라이제이션 레이어(212)는 제1 가중치로서 2를 상기 제8 배치용 특징 맵에 할당하며, 오래된 상기 제1 배치용 특징 맵이 중요하지 않는것으로 결정되어, 상기 배치 노말라이제이션 레이어(212)는 제2 가중치로서 0.5를 상기 제1 배치용 특징 맵에 할당한다. 상기 가중치를 할당한 후, 상기 배치 노말라이제이션 레이어(212)는 상기 가중치가 할당된 특징 값의 합을 구한 후, 상기 합을 8.5(가중치를 고려한 값으로, 6 + 0.5 + 2로 계산된 것이다)로 나눈다. 이러한 경우에, 상기 조정 평균은 5.47이다. 이것은 상기 제8 배치에 대응하는 특징 값이 크게 반영되고 상기 제1 배치에 대응하는 특징 값이 적게 반영된 것을 나타낸다.
상기 예시에서, 상기 조정 평균의 예시만을 나타내었지만, 상기 조정 분산도 상기 예시와 같은 방식으로 가중치를 할당하여 생성될 수 있음은 자명하다.
도 3은 모든 이전 배치가 참조되어야 하는 것처럼 묘사되어 있으나, 이에 한정되지 않는다. 그러므로, 상기 이전 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 생성하기 위해 이용될 상기 특정 이전 배치를 선택하는 방법도 설명하고자 한다.
먼저, 상기 제k 배치용 특징 맵의 분산을 참조하여, 상기 배치 노말라이제이션 레이어(212)는 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 배치의 수를 결정한다. 즉, 상기 배치 노말라이제이션은 각 레이어의 입력의 불균형 분포를 방지하고자 하기 때문에, 상기 제k 배치용 특징 맵의 분산이 제1 특정 임계치보다 크면, 상기 배치 노말라이제이션 레이어(212)는 상기 제k 배치의 불균형을 줄이기 위해, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 생성하기 위해 이용될 특정 이전 배치를 많은 수로 선택한다. 반대로, 상기 분산이 제1 특정 임계치보다 작다면, 상기 배치 노말라이제이션 레이어(212)는 상기 제k 배치의 상기 불균형이 크지 않기 때문에, 적은 수의 특정 이전 배치를 선택한다.
그리고, 상기 제k 배치의 사이즈가 제2 특정 임계치보다 크다면, 상기 이전 배치를 더 참조하지 않아도 좋은 결과가 생성될 것이라고 예상할 수 있다. 즉, 상기 제k 배치 내에서 입력 이미지가 상기 제2 특정 임계치보다 충분히 많이 존재한다면, 큰 표본 사이즈 덕분에 각 상기 배치용 특징 맵이 정규 분포를 따를 것으로 가정할 수 있다. 그러므로, 상기 배치 노말라이제이션 레이어(212)는 적은 수의 상기 이전 배치를 참조하거나 상기 제k 배치만을 참조할 수 있게 된다. 반대로, 상기 제k 배치 내에서 입력 이미지가 상기 제2 특정 임계치보다 적게 존재한다면, 상기 표본 사이즈가 너무 작아서 상기 제k 배치용 특징 맵이 정규 분포를 따르기 위해서는 더 많은 배치가 요구된다. 그러므로, 이러한 경우에, 상기 배치 노말라이제이션 레이어(212)는 더 많은 특정 이전 배치를 참조한다.
또한, 상기 배치 노말라이제이션 레이어(212)는, 상기 제2 내지 상기 제(k-1) 배치의 각각의 조정 평균 및 각각의 조정 분산이 생성되는 동안 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 각각의 상기 이전 특징 맵이 이용되었던 횟수를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택한다. 예를 들어, 상기 배치 노말라이제이션 레이어(212)는 자주 이용된 배치를 선택하지 않거나 적게 이용된 배치를 선택한다. 이런식으로, 상기 배치 노말라이제이션 연산을 위해 이용될 상기 선택된 배치들은 다양해질 수 있다.
이와 달리, 상기 배치 노말라이제이션 레이어(212)가 (i) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 평균이 제1 값을 참조로 결정되는 제1 특정 범위 내에 존재하는지 여부에 대한 정보, 또는 (ii) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 분산이 제2 값을 참조로 결정되는 제2 특정 범위 내에 존재하는지 여부에 대한 정보를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택한다.
즉, 상기 배치 노말라이제이션은 상기 입력 이미지에 대응하는 상기 특징 맵이 덜 불균형하게 하기 때문에, 상기 조정 평균 및 상기 조정 분산을 생성하기 위해서 특정 이전 배치용 특정 이전 특징 맵이 선택되되, (i) 상기 제1 특정 범위 내의 평균을 갖는, 상기 특정 이전 배치용 특정 이전 특징 맵 또는 (ii) 상기 제2 특정 범위 내의 분산을 갖는, 상기 특정 이전 배치용 특정 이전 특징 맵이 선택된다. 이런식으로, 상기 입력 이미지의 불균형을 줄일 수 있다.
한편, 위에서 설명한 상기 배치 노말라이제이션 연산만을 가하여 상기 조정 특징 맵이 생성된다면, 상기 출력 레이어(220)에 입력되는 상기 조정 특징 맵의 선형 특성 때문에 상기 출력 레이어로부터 출력된 상기 CNN 출력 값은 제한적이 될 수 있다. 즉, 상기 조정 특징 맵의 값이 상기 제1 값에 근접하여, 상기 CNN 출력 값이 상기 제1 범위 근처의 특정 범위로 수렴될 수 있다. 그러므로, 상기 CNN 출력 값은 상기 선형 연산을 추가로 더 가하여 생성되는 상기 조정 특징 맵으로 최적화될 수 있다.
상기 선형 연산은 아래 수식을 따르며,
다음으로 테스트 장치로서 기능하는 본 발명의 구성이 설명된다.
각각의 테스트 이미지를 포함하는 각각의 배치 - 상기 배치는 제1 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션 테스팅 장치를 상정하면, 상기 테스팅 장치는 아래의 요소를 포함한다.
참고로, 아래의 설명에서 혼란을 피하기 위해, 상기 학습 프로세스와 관련된 용어에 "학습용"이라는 단어가 추가되었고 테스팅 프로세스와 관련된 용어에 "테스트용"이라는 단어가 추가되었다.
상기 테스팅 장치는 상기 통신부(110) 및 상기 프로세서(120)를 포함한다. (1) 상기 학습 장치가, 상기 CNN(200)의 상기 컨벌루션 레이어(211)로 하여금 (i) 제k 학습용 배치 - k는 1부터 m'까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 학습용 배치에 포함된 트레이닝 이미지에 각각 상기 컨벌루션 연산을 가하여 제k 학습용 배치용 특징 맵을 생성하도록 하고, (2) 상기 학습 장치가, 상기 CNN(200)의 상기 배치 노말라이제이션 레이어(212)로 하여금 (I) (i) k가 1인 경우에, 상기 제k 학습용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m'까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 학습용 배치 중에서 선택된 이전 학습용 배치의 적어도 일부분에 포함되는 이전 학습용 특징 맵 및 상기 제k 학습용 배치용 특징 맵을 참조하여, 상기 제k 학습용 배치용 특징 맵의 학습용 조정 평균 및 학습용 조정 분산을 산출하도록 하고, (II) 상기 학습용 조정 평균 및 상기 학습용 조정 분산을 참조하여 상기 제k 학습용 배치용 특징 맵에 상기 배치 노말라이제이션 연산을 가하여 학습용 조정 특징 맵을 생성하도록 하며, (3) 상기 학습 장치가, 상기 CNN(200)의 액티베이션 레이어(213)로 하여금 상기 학습용 조정 특징 맵에 상기 비선형 연산을 가하여 학습용 재조정 특징 맵을 생성하도록 하되, 상기 CNN(200)이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 학습용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 학습용 배치에 포함된 상기 트레이닝 이미지에 연산을 가하여 상기 학습용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 학습용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 학습용 재조정 특징 맵을 생성하도록 하여 상기 학습용 재조정 특징 맵이 생성되고, (4) 상기 학습 장치가, 상기 CNN(200)의 상기 출력 레이어(220)로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 학습용 재조정 특징 맵에 상기 출력 연산을 가하여 학습용 CNN 출력 값을 생성하도록 하며, (5) 상기 학습 장치가, 상기 CNN(200)의 상기 로스 레이어(230)로 하여금 상기 학습용 CNN 출력 값 및 이에 대응하는 GT(Ground Truth)를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션하여 상기 CNN(200)의 파라미터를 학습한 상태에서, 상기 통신부(110)는 상기 제k 테스트용 배치 - k는 1부터 m까지의 정수 - 를 획득한다.
그리고, 상기 테스팅 장치 내에 포함된 상기 프로세서(120)는 아래의 프로세스를 수행한다.
먼저, 상기 프로세서(120)는 상기 CNN(200)의 상기 컨벌루션 레이어(211)로 하여금 상기 제k 테스트용 배치에 각각 포함된 테스트 이미지에 상기 컨벌루션 연산을 가하여 제k 테스트용 배치용 특징 맵을 생성하도록 한다.
그리고, 상기 프로세서(120)는 상기 CNN(200)의 상기 배치 노말라이제이션 레이어(212)로 하여금 (I) (i) k가 1인 경우에, 상기 제k 테스트용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 테스트용 배치 중에서 선택된 이전 테스트용 배치의 적어도 일부분에 포함되는 이전 테스트용 특징 맵 및 상기 제k 테스트용 배치용 특징 맵을 참조하여, 상기 제k 테스트용 배치용 특징 맵의 하나 이상의 테스트용 조정 평균 및 테스트용 조정 분산을 산출하도록 하고, (II) 상기 테스트용 조정 평균 및 상기 테스트용 조정 분산을 참조하여 상기 제k 테스트용 배치용 특징 맵에 상기 배치 노말라이제이션 연산을 가하여 테스트용 조정 특징 맵을 생성하도록 한다.
이후, 상기 프로세서(120)는 상기 CNN(200)의 상기 액티베이션 레이어(213)로 하여금 상기 테스트용 조정 특징 맵에 상기 비선형 연산을 가하여 테스트용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 테스트용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 테스트용 배치에 포함된 상기 테스트 이미지에 상기 연산을 가하여 상기 테스트용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 상기 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 테스트용 재조정 특징 맵이 상기 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 테스트용 재조정 특징 맵을 생성하도록 하여 상기 테스트용 재조정 특징 맵이 생성된다.
마지막으로, 상기 프로세서가(120) 상기 CNN(200)의 상기 출력 레이어(220)로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 테스트용 재조정 특징 맵에 상기 출력 연산을 가하여 테스트용 CNN 출력 값을 생성하도록 한다.
상기 테스팅 프로세스에서, 상기 컨벌루션 레이어(211)가 상기 컨벌루션 연산을 상기 입력 이미지에 가하는 부분, 상기 배치 노말라이제이션 레이어(212)가 상기 특징 맵에 상기 배치 노말라이제이션 연산을 가하는 부분, 그리고 상기 액티베이션 레이어(213)가 상기 비선형 연산을 상기 특징 맵에 가하는 부분은 학습 단계와 유사하므로, 자세한 설명은 생략하도록 한다.
상기 테스팅 장치의 상기 구성을 상술한 바, 상기 컴퓨팅 장치와 상기 테스팅 장치의 관계를 도2를 다시 참조하여 설명하면 다음과 같다.
상기 컴퓨팅 장치가 상기 테스팅 장치로서 기능할 때는 상기 학습 프로세스가 끝난 상태이기 때문에, 로스를 생성하고 이를 백프로퍼게이션 하는 부분은 제외될 것이다. 그러므로, 상기 테스팅 장치로서 기능하는 본 발명의 구성은, 상기 로스를 생성하는 부분인 상기 로스 레이어(230)를 제외한 상기 컴퓨팅 장치의 구성과 같으므로, 상기 n개의 컨벌루션 블록으로부터 상기 출력 레이어(220)까지의 요소가 본 발명의 상기 테스팅 장치의 상기 구성이 될 것이다.
상술한 방법을 통한 온라인 배치 노말라이제이션, 온-디바이스(on-device) 학습, 또는 연속 학습(continual learning)은 모바일 장치, IOT 장치 등에 적용될 수 있다. 또한, 상기 방법은 군사적 목적을 위해 또는 드론이나 로봇과 같은 다른 장치에 사용되기 위해 수행될 수 있다.
본 발명 기술분야의 통상의 기술자에게 이해될 수 있는 바로서, 위에서 설명된 이미지, 예컨대 원본 이미지, 원본 레이블 및 추가 레이블과 같은 이미지 데이터의 송수신이 컴퓨팅 장치의 통신부들에 의하여 이루어질 수 있으며, 특징 맵과 연산을 수행하기 위한 데이터가 컴퓨팅 장치의 프로세서(및/또는 메모리)에 의하여 보유/유지될 수 있고, 컨벌루션 연산, 디컨벌루션 연산, 로스 값 연산 과정이 주로 컴퓨팅 장치의 프로세서에 의하여 수행될 수 있으나, 본 발명이 이에 한정되지는 않을 것이다.
이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.
Claims (26)
- 각각의 입력 이미지를 포함하는 각각의 배치(Batch) - 상기 배치는 제1 배치 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션(Normalization) 방법에 있어서,
(a) 컴퓨팅 장치가, CNN의 컨벌루션 레이어로 하여금 (i) 제k 배치 - k는 1부터 m까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 배치에 포함된 상기 입력 이미지에 각각 컨벌루션 연산을 가하여 제k 배치용 특징 맵을 생성하도록 하는 단계; 및
(b) 상기 컴퓨팅 장치가, 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 배치 중에서 선택된 이전 배치의 적어도 일부분에 포함되는 이전 특징 맵 및 상기 제k 배치용 특징 맵을 참조하여, 상기 제k 배치용 특징 맵의 하나 이상의 조정 평균 및 하나 이상의 조정 분산을 산출하도록 하고, (II) 상기 조정 평균 및 상기 조정 분산을 참조하여 상기 제k 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 조정 특징 맵을 생성하도록 하는 단계;
를 포함하는 배치 노말라이제이션 학습 방법. - 제 1항에 있어서,
(c) 상기 컴퓨팅 장치가, 상기 CNN의 액티베이션 레이어(Activation Layer)로 하여금 상기 조정 특징 맵에 비선형 연산을 가하여 재조정 특징 맵을 생성하도록 하는 단계;
를 더 포함하는 것을 특징으로 하는 학습 방법. - 제 2항에 있어서,
상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고,
상기 제k 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 배치에 포함된 상기 입력 이미지에 연산을 가하여 상기 재조정 특징 맵이 생성되되,
x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 재조정 특징 맵을 생성하도록 하여 상기 재조정 특징 맵이 생성되는 것을 특징으로 하는 학습 방법. - 제 3항에 있어서,
(d) 상기 컴퓨팅 장치가, 상기 CNN의 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 재조정 특징 맵에 출력 연산을 가하여 CNN 출력 값을 생성하도록 하는 단계; 및
(e) 상기 컴퓨팅 장치가, 로스 레이어로 하여금 상기 CNN 출력 값 및 이에 대응하는 GT(Ground Truth)를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션(backpropagation)하여 상기 CNN의 파라미터를 학습하도록 하는 단계;
를 더 포함하는 것을 특징으로 하는 학습 방법. - 제 1항에 있어서,
상기 배치 노말라이제이션 연산은 상기 제k 배치용 특징 맵에 포함된 값들을 정규화하여 상기 조정 평균 및 상기 조정 분산이 각각 제1 값 및 제2 값을 갖도록 하는 연산인 것을 특징으로 하는 학습 방법. - 제 1항에 있어서,
상기 (b) 단계에서,
상기 배치 노말라이제이션 레이어가, 상기 제 k 배치용 특징 맵의 분산을 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 조정 평균 및 상기 조정 분산을 생성하기 위해 선택되는 상기 이전 배치의 수를 결정하는 것을 특징으로 하는 학습 방법. - 제 1항에 있어서,
상기 제 k 배치용 특징 맵의 분산이 특정 임계치보다 작다면, 상기 배치 노말라이제이션 레이어가 (i) 상기 제k 배치용 특징 맵만을 참조하거나 (ii) 상기 제k 배치용 특징 맵 및 하나 이상의 특정 이전 배치용 특정 이전 특징 맵을 참조하여 상기 조정 평균 및 상기 조정 분산을 산출하되, 상기 특정 이전 배치는, (k-1)개에 대한 상기 특정 이전 배치의 개수의 비율이 특정 임계 비율 이하로 결정되도록 상기 제1 내지 상기 제(k-1) 배치 중에서 선택되는 것을 특징으로 하는 학습 방법. - 제 1항에 있어서,
상기 (b) 단계에서,
상기 배치 노말라이제이션 레이어는, 상기 제k 배치에 포함된 상기 입력 이미지의 개수를 참조하여, (k-1)개에 대한 특정 이전 배치의 개수의 비율을 결정하되, 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 상기 특정 이전 배치는 상기 제1 내지 상기 제(k-1) 배치 중에서 선택되는 것을 특징으로 하는 학습 방법. - 제 1항에 있어서,
상기 (b) 단계에서,
상기 배치 노말라이제이션 레이어는 (i) 제1 가중치가 할당된 상기 제k 배치용 특징 맵 및 (ii) 하나 이상의 제2 가중치가 할당된, 상기 제1 내지 상기 제(k-1) 이전 배치 중 적어도 일부 배치에 포함되는 상기 이전 특징 맵을 참조하여 상기 조정 평균 및 상기 조정 분산을 산출하는 것을 특징으로 하는 학습 방법. - 제 1항에 있어서,
상기 (b) 단계에서,
상기 배치 노말라이제이션 레이어가, 상기 제2 내지 상기 제(k-1) 배치의 각각의 조정 평균 및 각각의 조정 분산이 생성되는 동안 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 각각의 상기 이전 특징 맵이 이용되었던 횟수를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택하는 것을 특징으로 하는 학습 방법. - 제 1항에 있어서,
상기 (b) 단계에서,
상기 배치 노말라이제이션 레이어가 (i) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 평균이 제1 값을 참조로 결정되는 제1 특정 범위 내에 존재하는지 여부에 대한 정보, 또는 (ii) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 분산이 제2 값을 참조로 결정되는 제2 특정 범위 내에 존재하는지 여부에 대한 정보를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택하는 것을 특징으로 하는 학습 방법. - 각각의 테스트 이미지를 포함하는 각각의 배치 - 상기 배치는 제1 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션 테스팅 방법에 있어서,
(a) (1) 학습 장치가, CNN의 컨벌루션 레이어로 하여금 (i) 제k 학습용 배치 - k는 1부터 m'까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 학습용 배치에 포함된 트레이닝 이미지에 각각 컨벌루션 연산을 가하여 제k 학습용 배치용 특징 맵을 생성하도록 하고, (2) 상기 학습 장치가, 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 학습용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m'까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 학습용 배치 중에서 선택된 이전 학습용 배치의 적어도 일부분에 포함되는 이전 학습용 특징 맵 및 상기 제k 학습용 배치용 특징 맵을 참조하여, 상기 제k 학습용 배치용 특징 맵의 하나 이상의 학습용 조정 평균 및 하나 이상의 학습용 조정 분산을 산출하도록 하고, (II) 상기 학습용 조정 평균 및 상기 학습용 조정 분산을 참조하여 상기 제k 학습용 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 학습용 조정 특징 맵을 생성하도록 하며, (3) 상기 학습 장치가, 상기 CNN의 액티베이션 레이어로 하여금 상기 학습용 조정 특징 맵에 비선형 연산을 가하여 학습용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 학습용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 학습용 배치에 포함된 상기 트레이닝 이미지에 연산을 가하여 상기 학습용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 학습용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 학습용 재조정 특징 맵을 생성하도록 하여 상기 학습용 재조정 특징 맵이 생성되고, (4) 상기 학습 장치가, 상기 CNN의 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 학습용 재조정 특징 맵에 출력 연산을 가하여 학습용 CNN 출력 값을 생성하도록 하며, (5) 상기 학습 장치가, 상기 CNN의 로스 레이어로 하여금 상기 학습용 CNN 출력 값 및 이에 대응하는 GT(Ground Truth)를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션하여 상기 CNN의 파라미터를 학습한 상태에서, 테스팅 장치가 상기 CNN의 상기 컨벌루션 레이어로 하여금 (i) 제k 테스트용 배치 - k는 1부터 m까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 테스트용 배치에 각각 포함된 테스트 이미지에 컨벌루션 연산을 가하여 제k 테스트용 배치용 특징 맵을 생성하도록 하는 단계;
(b) 상기 테스팅 장치가, 상기 CNN의 상기 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 테스트용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 테스트용 배치 중에서 선택된 이전 테스트용 배치의 적어도 일부분에 포함되는 이전 테스트용 특징 맵 및 상기 제k 테스트용 배치용 특징 맵을 참조하여, 상기 제k 테스트용 배치용 특징 맵의 하나 이상의 테스트용 조정 평균 및 하나 이상의 테스트용 조정 분산을 산출하도록 하고, (II) 상기 테스트용 조정 평균 및 상기 테스트용 조정 분산을 참조하여 상기 제k 테스트용 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 테스트용 조정 특징 맵을 생성하도록 하는 단계;
(c) 상기 테스팅 장치가, 상기 CNN의 상기 액티베이션 레이어로 하여금 상기 테스트용 조정 특징 맵에 비선형 연산을 가하여 테스트용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 테스트용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 테스트용 배치에 포함된 상기 테스트 이미지에 연산을 가하여 상기 테스트용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 테스트용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 테스트용 재조정 특징 맵을 생성하도록 하여 상기 테스트용 재조정 특징 맵이 생성되는 단계; 및
(d) 상기 테스팅 장치가, 상기 CNN의 상기 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 테스트용 재조정 특징 맵에 출력 연산을 가하여 테스트용 CNN 출력 값을 생성하도록 하는 단계;
를 포함하는 것을 특징으로 하는 테스팅 방법. - 각각의 입력 이미지를 포함하는 각각의 배치(Batch) - 상기 배치는 제1 배치 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션 컴퓨팅 장치에 있어서,
인스트럭션을 저장하는 적어도 하나의 메모리; 및
(1) CNN의 컨벌루션 레이어로 하여금 제k 배치 - k는 1부터 m까지의 정수임 - 에 포함된 상기 입력 이미지에 각각 컨벌루션 연산을 가하여 제k 배치용 특징 맵을 생성하도록 하는 프로세스, 및 (2) 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 배치 중에서 선택된 이전 배치의 적어도 일부분에 포함되는 이전 특징 맵 및 상기 제k 배치용 특징 맵을 참조하여, 상기 제k 배치용 특징 맵의 하나 이상의 조정 평균 및 하나 이상의 조정 분산을 산출하도록 하고, (II) 상기 조정 평균 및 상기 조정 분산을 참조하여 상기 제k 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 조정 특징 맵을 생성하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;
를 포함하는 것을 특징으로 하는 컴퓨팅 장치. - 제 14항에 있어서,
상기 프로세서가, (3) 상기 CNN의 액티베이션 레이어로 하여금 상기 조정 특징 맵에 비선형 연산을 가하여 재조정 특징 맵을 생성하도록 하는 프로세스;
를 더 수행하는 것을 특징으로 하는 컴퓨팅 장치. - 제 15항에 있어서,
상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고,
상기 제k 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 배치에 포함된 상기 입력 이미지에 연산을 가하여 상기 재조정 특징 맵이 생성되되,
x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 재조정 특징 맵을 생성하도록 하여 상기 재조정 특징 맵이 생성되는 것을 특징으로 하는 컴퓨팅 장치. - 제 16항에 있어서,
상기 프로세서가,
(4) 상기 CNN의 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 재조정 특징 맵에 출력 연산을 가하여 CNN 출력 값을 생성하도록 하는 프로세스; 및
(5) 로스 레이어로 하여금 상기 CNN 출력 값 및 이에 대응하는 GT를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션하여 상기 CNN의 파라미터를 학습하도록 하는 프로세스;
를 더 수행하는 것을 특징으로 하는 컴퓨팅 장치. - 제 14항에 있어서,
상기 배치 노말라이제이션 연산은 상기 제k 배치용 특징 맵에 포함된 값들을 정규화하여 상기 조정 평균 및 상기 조정 분산이 각각 제1 값 및 제2 값을 갖도록 하는 연산인 것을 특징으로 하는 컴퓨팅 장치. - 제 14항에 있어서,
상기 (2) 프로세스에서,
상기 배치 노말라이제이션 레이어가, 상기 제 k 배치용 특징 맵의 분산을 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 조정 평균 및 상기 조정 분산을 생성하기 위해 선택되는 상기 이전 배치의 수를 결정하는 것을 특징으로 하는 컴퓨팅 장치. - 제 14항에 있어서,
상기 제 k 배치용 특징 맵의 분산이 특정 임계치보다 작다면, 상기 배치 노말라이제이션 레이어가 (i) 상기 제k 배치용 특징 맵만을 참조하거나 (ii) 상기 제k 배치용 특징 맵 및 하나 이상의 특정 이전 배치용 특정 이전 특징 맵을 참조하여 상기 조정 평균 및 상기 조정 분산을 산출하되, 상기 특정 이전 배치는, (k-1)개에 대한 상기 특정 이전 배치의 개수의 비율이 특정 임계 비율 이하로 결정되도록 상기 제1 내지 상기 제(k-1) 배치 중에서 선택되는 것을 특징으로 하는 컴퓨팅 장치. - 제 14항에 있어서,
상기 (2) 프로세스에서,
상기 배치 노말라이제이션 레이어는, 상기 제k 배치에 포함된 상기 입력 이미지의 개수를 참조하여, (k-1)개에 대한 특정 이전 배치의 개수의 비율을 결정하되, 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 상기 특정 이전 배치는 상기 제1 내지 상기 제(k-1) 배치 중에서 선택되는 것을 특징으로 하는 컴퓨팅 장치. - 제 14항에 있어서,
상기 (2) 프로세스에서,
상기 배치 노말라이제이션 레이어는 (i) 제1 가중치가 할당된 상기 제k 배치용 특징 맵 및 (ii) 하나 이상의 제2 가중치가 할당된, 상기 제1 내지 상기 제(k-1) 이전 배치 중 적어도 일부 배치에 포함되는 상기 이전 특징 맵을 참조하여 상기 조정 평균 및 상기 조정 분산을 산출하는 것을 특징으로 하는 컴퓨팅 장치. - 제 14항에 있어서,
상기 (2) 프로세스에서,
상기 배치 노말라이제이션 레이어가, 상기 제2 내지 상기 제(k-1) 배치의 각각의 조정 평균 및 각각의 조정 분산이 생성되는 동안 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 각각의 상기 이전 특징 맵이 이용되었던 횟수를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택하는 것을 특징으로 하는 컴퓨팅 장치. - 제 14항에 있어서,
상기 (2) 프로세스에서,
상기 배치 노말라이제이션 레이어가 (i) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 평균이 제1 값을 참조로 결정되는 제1 특정 범위 내에 존재하는지 여부에 대한 정보, 또는 (ii) 각각의 상기 제1 내지 상기 제(k-1) 배치에 대응하는 상기 이전 특징 맵의 각각의 분산이 제2 값을 참조로 결정되는 제2 특정 범위 내에 존재하는지 여부에 대한 정보를 참조하여, 상기 제1 내지 상기 제(k-1) 배치 중에서, 상기 제k 배치용 특징 맵의 상기 조정 평균 및 상기 조정 분산을 산출하기 위해 이용될 특정 이전 배치를 선택하는 것을 특징으로 하는 컴퓨팅 장치. - 각각의 테스트 이미지를 포함하는 각각의 배치 - 상기 배치는 제1 내지 제m 배치를 포함함 - 의 특징 값을 이용한 배치 노말라이제이션 테스팅 장치에 있어서,
인스트럭션을 저장하는 적어도 하나의 메모리; 및
(1) 학습 장치가, CNN의 컨벌루션 레이어로 하여금 (i) 제k 학습용 배치 - k는 1부터 m'까지의 정수임 - 를 획득하도록 하고, (ii) 상기 제k 학습용 배치에 포함된 트레이닝 이미지에 각각 컨벌루션 연산을 가하여 제k 학습용 배치용 특징 맵을 생성하도록 하고, (2) 상기 학습 장치가, 상기 CNN의 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 학습용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m'까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 학습용 배치 중에서 선택된 이전 학습용 배치의 적어도 일부분에 포함되는 이전 학습용 특징 맵 및 상기 제k 학습용 배치용 특징 맵을 참조하여, 상기 제k 학습용 배치용 특징 맵의 학습용 조정 평균 및 학습용 조정 분산을 산출하도록 하고, (II) 상기 학습용 조정 평균 및 상기 학습용 조정 분산을 참조하여 상기 제k 학습용 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 학습용 조정 특징 맵을 생성하도록 하며, (3) 상기 학습 장치가, 상기 CNN의 액티베이션 레이어로 하여금 상기 학습용 조정 특징 맵에 비선형 연산을 가하여 학습용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 학습용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 학습용 배치에 포함된 상기 트레이닝 이미지에 연산을 가하여 상기 학습용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 학습용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 학습용 재조정 특징 맵을 생성하도록 하여 상기 학습용 재조정 특징 맵이 생성되고, (4) 상기 학습 장치가, 상기 CNN의 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 학습용 재조정 특징 맵에 출력 연산을 가하여 학습용 CNN 출력 값을 생성하도록 하며, (5) 상기 학습 장치가, 상기 CNN의 로스 레이어로 하여금 상기 학습용 CNN 출력 값 및 이에 대응하는 GT(Ground Truth)를 참조하여 로스를 생성하도록 하고, 상기 로스를 백프로퍼게이션하여 상기 CNN의 파라미터를 학습한 상태에서, (A) 상기 CNN의 상기 컨벌루션 레이어로 하여금 상기 제k 테스트용 배치에 각각 포함된 테스트 이미지에 상기 컨벌루션 연산을 가하여 제k 테스트용 배치용 특징 맵을 생성하도록 하는 프로세스, (B) 상기 CNN의 상기 배치 노말라이제이션 레이어로 하여금 (I) (i) k가 1인 경우에, 상기 제k 테스트용 배치용 특징 맵을 참조하고, (ii) k는 2부터 m까지의 정수인 경우에, 이전에 생성되었던 상기 제1 내지 제(k-1) 테스트용 배치 중에서 선택된 이전 테스트용 배치의 적어도 일부분에 포함되는 이전 테스트용 특징 맵 및 상기 제k 테스트용 배치용 특징 맵을 참조하여, 상기 제k 테스트용 배치용 특징 맵의 테스트용 조정 평균 및 테스트용 조정 분산을 산출하도록 하고, (II) 상기 테스트용 조정 평균 및 상기 테스트용 조정 분산을 참조하여 상기 제k 테스트용 배치용 특징 맵에 배치 노말라이제이션 연산을 가하여 테스트용 조정 특징 맵을 생성하도록 하는 프로세스, (C) 상기 CNN의 상기 액티베이션 레이어로 하여금 상기 테스트용 조정 특징 맵에 비선형 연산을 가하여 테스트용 재조정 특징 맵을 생성하도록 하되, 상기 CNN이 상기 컨벌루션 레이어, 상기 배치 노말라이제이션 레이어 및 상기 액티베이션 레이어를 각각 포함하는 제1 내지 제n 컨벌루션 블록을 포함하고, 상기 제k 테스트용 배치가 획득되면, 상기 제1 내지 상기 제n 컨벌루션 블록을 통해 상기 제k 테스트용 배치에 포함된 상기 테스트 이미지에 상기 연산을 가하여 상기 테스트용 재조정 특징 맵이 생성되되, x가 2부터 n까지 정수이면, 제(x-1) 컨벌루션 블록으로부터 출력된 제(x-1) 테스트용 재조정 특징 맵이 제x 컨벌루션 블록에 입력되게 하고, 상기 제x 컨벌루션 블록으로 하여금 제x 테스트용 재조정 특징 맵을 생성하도록 하여 상기 테스트용 재조정 특징 맵이 생성되는 프로세스, 및 (D) 상기 CNN의 상기 출력 레이어로 하여금 상기 제n 컨벌루션 블록으로부터 출력된 제n 테스트용 재조정 특징 맵에 출력 연산을 가하여 테스트용 CNN 출력 값을 생성하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;
를 포함하는 것을 특징으로 하는 테스팅 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/255,446 US10325185B1 (en) | 2019-01-23 | 2019-01-23 | Method and device for online batch normalization, on-device learning, and continual learning applicable to mobile devices or IOT devices additionally referring to one or more previous batches to be used for military purpose, drone or robot, and testing method and testing device using the same |
US16/255,446 | 2019-01-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200091782A true KR20200091782A (ko) | 2020-07-31 |
KR102316593B1 KR102316593B1 (ko) | 2021-10-25 |
Family
ID=66826023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190119520A KR102316593B1 (ko) | 2019-01-23 | 2019-09-27 | 군사적 목적, 드론 또는 로봇에 이용되기 위해, 하나 이상의 이전 배치를 추가적으로 참조하여 모바일 장치 또는 iot 장치에 적용 가능한 온라인 배치 노말라이제이션, 온-디바이스 학습, 및 연속학습을 수행하는 방법 및 장치 그리고 이를 이용한 테스팅 방법과 테스팅 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10325185B1 (ko) |
EP (1) | EP3686810B1 (ko) |
JP (1) | JP6916549B2 (ko) |
KR (1) | KR102316593B1 (ko) |
CN (1) | CN111476082B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102209121B1 (ko) * | 2020-08-24 | 2021-01-28 | 클라우드브릭주식회사 | 딥러닝 머신의 신뢰도 판단 방법 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10387740B2 (en) * | 2016-10-10 | 2019-08-20 | Gyrfalcon Technology Inc. | Object detection and recognition apparatus based on CNN based integrated circuits |
US11631163B2 (en) * | 2020-02-11 | 2023-04-18 | Samsung Electronics Co., Ltd. | Mobile data augmentation engine for personalized on-device deep learning system |
CN117377984A (zh) * | 2021-09-01 | 2024-01-09 | 英特尔公司 | 用于视频理解应用中的深度学习的动态时间归一化 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170046616A1 (en) * | 2015-08-15 | 2017-02-16 | Salesforce.Com, Inc. | Three-dimensional (3d) convolution with 3d batch normalization |
JP2018508879A (ja) * | 2015-01-28 | 2018-03-29 | グーグル エルエルシー | バッチ正規化レイヤ |
WO2018148526A1 (en) * | 2017-02-10 | 2018-08-16 | Google Llc | Batch renormalization layers |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05346915A (ja) * | 1992-01-30 | 1993-12-27 | Ricoh Co Ltd | 学習機械並びにニューラルネットワークおよびデータ分析装置並びにデータ分析方法 |
US9418319B2 (en) * | 2014-11-21 | 2016-08-16 | Adobe Systems Incorporated | Object detection using cascaded convolutional neural networks |
US10410096B2 (en) * | 2015-07-09 | 2019-09-10 | Qualcomm Incorporated | Context-based priors for object detection in images |
WO2017031630A1 (zh) * | 2015-08-21 | 2017-03-02 | 中国科学院自动化研究所 | 基于参数量化的深度卷积神经网络的加速与压缩方法 |
US11074492B2 (en) * | 2015-10-07 | 2021-07-27 | Altera Corporation | Method and apparatus for performing different types of convolution operations with the same processing elements |
US20170124409A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Cascaded neural network with scale dependent pooling for object detection |
US9965719B2 (en) * | 2015-11-04 | 2018-05-08 | Nec Corporation | Subcategory-aware convolutional neural networks for object detection |
US9904874B2 (en) * | 2015-11-05 | 2018-02-27 | Microsoft Technology Licensing, Llc | Hardware-efficient deep convolutional neural networks |
US10002313B2 (en) * | 2015-12-15 | 2018-06-19 | Sighthound, Inc. | Deeply learned convolutional neural networks (CNNS) for object localization and classification |
US9858496B2 (en) * | 2016-01-20 | 2018-01-02 | Microsoft Technology Licensing, Llc | Object detection and classification in images |
WO2017139927A1 (en) * | 2016-02-17 | 2017-08-24 | Intel Corporation | Region proposal for image regions that include objects of interest using feature maps from multiple layers of a convolutional neural network model |
KR101899101B1 (ko) * | 2016-06-01 | 2018-09-14 | 서울대학교 산학협력단 | 인공 신경망 기반 예측 모델 생성 장치 및 방법 |
CN106097355A (zh) * | 2016-06-14 | 2016-11-09 | 山东大学 | 基于卷积神经网络的胃肠道肿瘤显微高光谱图像处理方法 |
US10354362B2 (en) * | 2016-09-08 | 2019-07-16 | Carnegie Mellon University | Methods and software for detecting objects in images using a multiscale fast region-based convolutional neural network |
US10387740B2 (en) * | 2016-10-10 | 2019-08-20 | Gyrfalcon Technology Inc. | Object detection and recognition apparatus based on CNN based integrated circuits |
US11321609B2 (en) * | 2016-10-19 | 2022-05-03 | Samsung Electronics Co., Ltd | Method and apparatus for neural network quantization |
US20180107926A1 (en) * | 2016-10-19 | 2018-04-19 | Samsung Electronics Co., Ltd. | Method and apparatus for neural network quantization |
US10198671B1 (en) * | 2016-11-10 | 2019-02-05 | Snap Inc. | Dense captioning with joint interference and visual context |
US11392825B2 (en) * | 2017-01-09 | 2022-07-19 | Samsung Electronics Co., Ltd. | Method and algorithm of recursive deep learning quantization for weight bit reduction |
US20180211403A1 (en) * | 2017-01-20 | 2018-07-26 | Ford Global Technologies, Llc | Recurrent Deep Convolutional Neural Network For Object Detection |
US10127495B1 (en) * | 2017-04-14 | 2018-11-13 | Rohan Bopardikar | Reducing the size of a neural network through reduction of the weight matrices |
EP3619651B1 (en) * | 2017-05-02 | 2024-03-27 | Kodak Alaris Inc. | System and method for batch-normalized recurrent highway networks |
US10474908B2 (en) * | 2017-07-06 | 2019-11-12 | GM Global Technology Operations LLC | Unified deep convolutional neural net for free-space estimation, object detection and object pose estimation |
US10728553B2 (en) * | 2017-07-11 | 2020-07-28 | Sony Corporation | Visual quality preserving quantization parameter prediction with deep neural network |
JP7149692B2 (ja) * | 2017-08-09 | 2022-10-07 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
KR20190034985A (ko) * | 2017-09-25 | 2019-04-03 | 삼성전자주식회사 | 인공 신경망의 양자화 방법 및 장치 |
-
2019
- 2019-01-23 US US16/255,446 patent/US10325185B1/en active Active
- 2019-09-27 KR KR1020190119520A patent/KR102316593B1/ko active IP Right Grant
- 2019-12-27 EP EP19219762.2A patent/EP3686810B1/en active Active
-
2020
- 2020-01-08 JP JP2020001764A patent/JP6916549B2/ja active Active
- 2020-01-20 CN CN202010063590.8A patent/CN111476082B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018508879A (ja) * | 2015-01-28 | 2018-03-29 | グーグル エルエルシー | バッチ正規化レイヤ |
US20170046616A1 (en) * | 2015-08-15 | 2017-02-16 | Salesforce.Com, Inc. | Three-dimensional (3d) convolution with 3d batch normalization |
WO2018148526A1 (en) * | 2017-02-10 | 2018-08-16 | Google Llc | Batch renormalization layers |
Non-Patent Citations (1)
Title |
---|
"Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift", http://arxiv.org/pdf/1502.03167v3.pdf, 2 March 2015* * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102209121B1 (ko) * | 2020-08-24 | 2021-01-28 | 클라우드브릭주식회사 | 딥러닝 머신의 신뢰도 판단 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP6916549B2 (ja) | 2021-08-11 |
EP3686810B1 (en) | 2024-06-19 |
US10325185B1 (en) | 2019-06-18 |
CN111476082B (zh) | 2023-07-04 |
KR102316593B1 (ko) | 2021-10-25 |
EP3686810C0 (en) | 2024-06-19 |
CN111476082A (zh) | 2020-07-31 |
EP3686810A1 (en) | 2020-07-29 |
JP2020119532A (ja) | 2020-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20200091782A (ko) | 군사적 목적, 드론 또는 로봇에 이용되기 위해, 하나 이상의 이전 배치를 추가적으로 참조하여 모바일 장치 또는 iot 장치에 적용 가능한 온라인 배치 노말라이제이션, 온-디바이스 학습, 및 연속학습을 수행하는 방법 및 장치 그리고 이를 이용한 테스팅 방법과 테스팅 장치 | |
CN110910395B (zh) | 图像编码方法和装置、利用它们的测试方法和测试装置 | |
KR102313133B1 (ko) | 컨벌루션 뉴럴 네트워크로부터 복수의 출력들의 앙상블을 이용하여 통합된 특징 맵을 제공하기 위한 방법 및 장치 | |
KR102337358B1 (ko) | 모바일 장치 또는 소형 네트워크에 적용 가능한 하드웨어를 최적화하는데 사용될 수 있는 roi를 풀링하기 위하여, 마스킹 파라미터를 이용하는 방법 및 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
KR20200027427A (ko) | 차선 후보 픽셀의 분류를 통해 차선을 검출하는 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
CN111008999A (zh) | 用包含跟踪网络的cnn跟踪对象的方法和使用该方法的装置 | |
KR20200047307A (ko) | 유용한 학습 데이터를 취사 선별하기 위한 cnn 기반 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
KR20200091319A (ko) | 레인 마스크(Lane Mask)를 사용하여 후처리 없이 입력 이미지에 포함된 하나 이상의 차선을 검출하는 방법 및 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
JP2020119533A (ja) | 自律走行自動車のレベル4を満たすために要求されるhdマップアップデートに利用される、少なくとも一つのアダプティブロス重み付け値マップを利用したアテンションドリブン・イメージセグメンテーション学習方法及び学習装置、そしてこれを利用したテスティング方法及びテスティング装置 | |
KR20200091323A (ko) | 핵심성과지표와 같은 사용자 요구 사항에 적합한 타겟 객체 예측 네트워크를 이용한, cnn 기반의 변동에 강인한 객체 검출기를 학습하는 방법 및 학습 장치, 및 이를 이용한 테스팅 방법 및 테스팅 장치 | |
JP6998067B2 (ja) | 適応的学習率でニューラルネットワークを学習する方法及び装置、これを利用したテスト方法及び装置 | |
KR102313604B1 (ko) | 멀티 피딩을 적용한 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
CN111488978B (zh) | 为了元学习用于调整残差网络的方法及装置 | |
KR20200095336A (ko) | 고 정밀도로 이미지를 분석하기 위한 딥 러닝 네트워크를 사용하기 위해 트레이닝 이미지를 오토 라벨링하는 오토 라벨링 장치의 하이퍼파라미터를 최적화하는 방법 및 이를 이용한 최적화 장치 | |
KR20200092840A (ko) | 에지 로스를 이용하여 보행자 이벤트, 자동차 이벤트, 폴링 이벤트, 폴른 이벤트를 포함한 이벤트를 검출하는데 있어 이용되는 세그먼테이션 성능 향상을 위한 학습 방법 및 학습 장치 그리고 이를 이용한 테스팅 방법 및 테스팅 장치 | |
KR20200027889A (ko) | CNN(Convolutional Neural Network)을 사용하여 차선을 검출하기 위한 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
KR20200027888A (ko) | 차선 모델을 이용하여 차선을 검출할 수 있는 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
KR20200091324A (ko) | 원거리 검출 또는 군사 목적을 위해, 이미지 컨캐터네이션을 이용한, cnn 기반의 하드웨어 최적화가 가능한 객체 검출기를 학습하는 방법 및 학습 장치, 이를 이용한 테스팅 방법 및 테스팅 장치 | |
EP3686807A2 (en) | Learning method and learning device for object detector to be used for surveillance based on convolutional neural network capable of converting modes according to scales of objects, and testing method and testing device using the same | |
KR20200091321A (ko) | 자율주행 차량 레벨4를 충족하기 위해 영역의 클래스에 따라 모드를 전환하기 위하여 그리드 생성기를 이용하는 뉴럴 네트워크 연산 방법 및 이를 이용한 장치 | |
KR20200091781A (ko) | 자율주행 자동차의 레벨 4를 충족시키기 위해 필요한 hd 지도와의 콜라보레이션을 지원하는 임베딩 로스 및 소프트맥스 로스를 이용하여 적어도 하나의 차선을 가지는 이미지를 세그멘테이션하는 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
KR102375278B1 (ko) | 사진 스타일 변환을 사용하여 런타임 입력 변환에 의해 실제 세계에서 사용되는 가상 세계에서 학습된 cnn을 허용하기 위한 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
JP2020119528A (ja) | モバイルデバイスまたは高精度の小型ネットワークに適用可能なハードウェアを最適化するために利用されるCNNパラメータ及び特徴値を量子化するために、重み量子化ロス値を利用してFL(Fractional Length)値を決定する方法及び装置{METHOD AND DEVICE FOR DETERMINING FL VALUE BY USING WEIGHTED QUANTIZATION LOSS VALUES TO THEREBY QUANTIZE CNN PARAMETERS AND FEATURE VALUES TO BE USED FOR OPTIMIZING HARDWARE APPLICABLE TO MOBILE DEVICES OR COMPACT NETWORKS WITH HIGH PRECISION} | |
KR102090539B1 (ko) | 신규한 가중치를 이용한 센터링 연산을 적용한 강화 학습 방법 및 장치 | |
KR20200031994A (ko) | Cnn 기반 차선 검출을 위한 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |