KR102252155B1

KR102252155B1 - 자율주행 자동차의 레벨 4를 충족시키기 위해 필요한 hd 지도와의 콜라보레이션을 지원하는 임베딩 로스 및 소프트맥스 로스를 이용하여 적어도 하나의 차선을 가지는 이미지를 세그멘테이션하는 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치

Info

Publication number: KR102252155B1
Application number: KR1020190119515A
Authority: KR
Inventors: 김용중; 김인수; 김학경; 남운현; 부석훈; 성명철; 유우주; 정경중; 제홍모; 조호진
Original assignee: 주식회사 스트라드비젼
Priority date: 2019-01-23
Filing date: 2019-09-27
Publication date: 2021-05-17
Also published as: CN111476811A; KR20200091781A; EP3686842A1; US10311578B1; JP6916548B2; JP2020119531A; CN111476811B; EP3686842B1

Abstract

자율주행 자동차의 레벨 4를 충족시키기 위해 필요한 HD 지도와의 콜라보레이션 지원에 사용되는 적어도 하나의 차선을 가지는 이미지를 세그멘테이션하는 학습 방법에 있어서, 학습 장치가, (a) 입력 이미지에 컨벌루션 연산 적용하도록 하여 특징 맵을 생성하고, 디컨벌루션 연산을 적용하도록 하여 입력 이미지 상의 각각의 픽셀에 대한 세그멘테이션 스코어를 생성하도록 하는 단계; (b) 소프트맥스 연산을 세그멘테이션 스코어에 적용하도록 하여 소프트맥스 스코어를 생성하도록 하는 단계; (c) (I) 소프트맥스 스코어에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적용하도록 하여 소프트맥스 로스와 임베딩 로스를 생성하도록 하되, 임베딩 로스는 차선 각각의 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 차선 각각의 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 하는 CNN 모듈을 학습하는데 사용되며, (II) 소프트맥스 및 임베딩 로스를 백프로파게이션 하는 단계;를 포함하는 것을 특징으로 하는 방법을 제공한다.

Description

자율주행 자동차의 레벨 4를 충족시키기 위해 필요한 HD 지도와의 콜라보레이션을 지원하는 임베딩 로스 및 소프트맥스 로스를 이용하여 적어도 하나의 차선을 가지는 이미지를 세그멘테이션하는 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치{LEARNING METHOD AND LEARNING DEVICE FOR SEGMENTING AN IMAGE HAVING ONE OR MORE LANES BY USING EMBEDDING LOSS TO SUPPORT COLLABORATION WITH HD MAPS REQUIRED TO SATISFY LEVEL 4 OF AUTONOMOUS VEHICLES AND SOFTMAX LOSS, AND TESTING METHOD AND TESTING DEVICE USING THE SAME}

본 발명은 자율주행 자동차의 레벨 4를 충족시키기 위해 필요한 HD 지도와의 콜라보레이션을 지원하는데 사용되는 적어도 하나의 차선을 가지는 이미지를 세그멘테이션하는 학습 방법에 관한 것으로, 보다 상세하게는, 상기 차선을 가지는 상기 입력 이미지를 세그멘테이션 하는 상기 학습 방법에 있어서, (a) 상기 입력 이미지가 획득되면, 학습 장치가, CNN(Convolutional Neural Network) 모듈로 하여금 상기 입력 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 특징 맵을 생성하고 상기 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 입력 이미지 상의 각각의 픽셀에 대한 각각의 세그멘테이션 스코어(Segmentation Score)를 생성하도록 하는 단계; (b) 상기 학습 장치가, 상기 CNN 모듈로 하여금, 상기 각각의 세그멘테이션 스코어에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 스코어를 생성하도록 하는 단계; (c) 상기 학습 장치가, 상기 CNN 모듈로 하여금, (I) (i) 상기 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 로스를 생성하도록 하고, (ii) 상기 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (II) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록 하는 단계;를 포함하는 것을 특징으로 하는 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치에 관한 것이다.

딥 컨벌루션 뉴럴 네트워크(Deep Convolutional Neural Network; Deep CNN)는 딥 러닝 분야에서 일어난 놀라운 발전의 핵심이다. CNN은 글자 인식 문제를 풀기 위해 90년대에 이미 사용되었지만, 현재처럼 널리 쓰이게 된 것은 최근의 연구 결과 덕분이다. 이러한 딥 CNN은 2012년 ImageNet 이미지 분류 시합에서 다른 경쟁자들을 이기고 우승을 차지했다. 그리고 나서 컨벌루션 뉴럴 네트워크는 기계 학습(Machine Learning) 분야에서 매우 유용한 툴이 되었다.

한편, 이미지 세그멘테이션(Image Segmentation)은 입력 이미지(트레이닝 이미지 또는 테스트 이미지)를 수신하여 라벨(Label) 이미지를 출력 이미지로 생성하는 방법이다. 최근 딥러닝(Deep Learning) 기술이 각광을 받으면서 이미지 세그멘테이션에도 딥러닝 기술을 많이 사용하는 추세다.

세그멘테이션이 수행될 때, 이미지 상의 각각의 클러스터 내에서 픽셀 수의 분포가 불균형하면, 픽셀 수가 작은 부분이 흐릿해지는 경우가 많다. 픽셀 수의 분포가 불균형한 대표적인 경우로 자율주행 자동차에서 사용되는 이미지가 있다. 이 경우, 특정 차선이 점선이거나 이미지 내에서 원거리 영역에 존재하면, 차선의 해당 부분의 픽셀 수가 적어 세그멘테이션 할 때, 픽셀 수가 적은 부분이 차선이 아닌 것으로 잘못 판단되는 문제점이 존재한다.

본 발명은 상술한 문제점을 해결하는 것을 목적으로 한다.

본 발명은 소프트맥스 로스와 임베딩 로스를 백프로파게이션하여, 픽셀 수가 적은 부분도 세그멘테이션 결과 상에서 진하게 출력되고, 서로 다른 차선을 구분하는 것이 더욱 용이하게 되도록 세그멘테이션 스코어를 출력하는 하는 것을 다른 목적으로 한다.

상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한 본 발명의 특징적인 구성은 하기와 같다.

본 발명의 일 태양에 따르면, 적어도 하나의 차선을 가진 입력 이미지를 세그멘테이션 하는 학습 방법에 있어서, (a) 상기 입력 이미지가 획득되면, 학습 장치가, CNN(Convolutional Neural Network) 모듈로 하여금 상기 입력 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 특징 맵을 생성하고 상기 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 입력 이미지 상의 각각의 픽셀에 대한 각각의 세그멘테이션 스코어(Segmentation Score)를 생성하도록 하는 단계; (b) 상기 학습 장치가, 상기 CNN 모듈로 하여금, 상기 각각의 세그멘테이션 스코어에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 스코어를 생성하도록 하는 단계; (c) 상기 학습 장치가, 상기 CNN 모듈로 하여금, (I) (i) 상기 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 로스를 생성하도록 하고, (ii) 상기 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (II) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록 하는 단계;를 포함하는 것을 특징으로 한다.

일 실시예에서,

상기 임베딩 로스 각각은 상기 수식을 통해 산출되고, 상기 입력 이미지가 상기 차선 및 적어도 하나의 배경 부분을 갖는 복수 개의 클러스터를 포함한다고 하면,

는 상기 입력 이미지 상의 상기 차선 및 상기 배경 부분을 포함하는 상기 클러스터의 개수,

는 각각의 상기 클러스터 안의 픽셀의 개수,

는 각각의 상기 클러스터에 포함된 픽셀 각각에 대응하는 소프트맥스 스코어의 각각의 평균,

는 각각의 상기 픽셀에 대응하는 상기 소프트맥스 스코어 및 각각의 상기 픽셀에 대응하는 상기

를 참조하여 산출된 분산 중 최대값,

는 서로 다른 클러스터에 대응하는

간의 차이 중 최소값을 의미하는 것을 특징으로 한다.

일 실시예에서, 각각의 상기 다항 로지스틱 로스는 다음의 수식을 이용해 산출되고,

이 때, s는 상기 입력 이미지 한 개에 포함되는 상기 픽셀의 개수, l은 제i 픽셀이 이에 대응하는 GT 라벨 상에서 어떤 클러스터에 속하는지를 나타내는 원핫인코딩(One-Hot-Encoding) 벡터, P(i)는 상기 픽셀 각각에 대응하는 각각의 소프트맥스 스코어를 의미하는 것을 특징으로 한다.

본 발명의 다른 태양에 따르면, 적어도 하나의 차선을 가진 테스트 이미지를 세그멘테이션 하는 테스트 방법에 있어서, (a) 학습 장치가, (1) CNN(Convolutional Neural Network) 모듈로 하여금 트레이닝 이미지 에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 학습용 특징 맵을 생성한 후, 상기 학습용 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 트레이닝 이미지 상의 각각의 픽셀에 대한 학습용 세그멘테이션 스코어(Segmentation Score) 각각을 생성하도록 하고; (2) 상기 CNN 모듈로 하여금 상기 학습용 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 학습용 소프트맥스 스코어 각각을 생성하도록 하고; (3) 상기 CNN 모듈로 하여금, (I) (i) 상기 학습용 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산 (Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 소프트맥스 로스 각각을 생성하도록 하고, (ii) 상기 학습용 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 학습용 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 학습용 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (II) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록; 한 상태에서, 상기 테스트 이미지가 획득되면, 테스트 장치가, 상기 CNN 모듈로 하여금 상기 테스트 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 테스트용 특징 맵을 생성한 후, 상기 테스트용 특징 맵에 대하여 디컨벌루션 연산을 적용하도록 하여 상기 테스트 이미지 상의 각각의 픽셀에 대한 테스트용 세그멘테이션 스코어 각각을 생성하도록 하는 단계; 및 (b) 상기 테스트 장치가, 상기 CNN 모듈로 하여금 상기 테스트용 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산을 적용하도록 하여 테스트용 소프트맥스 스코어 각각을 생성하도록 하는 단계;를 포함하는 것을 특징으로 한다.

본 발명의 또 다른 태양에 따르면, 적어도 하나의 차선을 가진 입력 이미지를 세그멘테이션 하는 학습 장치에 있어서, 인스트럭션을 저장하는 적어도 하나의 메모리; 및 (I) CNN(Convolutional Neural Network) 모듈로 하여금 상기 입력 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 특징 맵을 생성하고 상기 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 입력 이미지 상의 각각의 픽셀에 대한 각각의 세그멘테이션 스코어(Segmentation Score)를 생성하도록 하는 프로세스, (II) 상기 CNN 모듈로 하여금 상기 각각의 세그멘테이션 스코어에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 스코어를 생성하도록 하는 프로세스, (III) 상기 CNN 모듈로 하여금 (1) (i) 상기 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 로스를 생성하도록 하고, (ii) 상기 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (2) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;를 포함하는 것을 특징으로 한다.

일 실시예에서,

는 각각의 상기 클러스터 안의 픽셀의 개수,

를 참조하여 산출된 분산 중 최대값,

는 서로 다른 클러스터에 대응하는

간의 차이 중 최소값을 의미하는 것을 특징으로 한다.

본 발명의 또 다른 태양에 따르면, 적어도 하나의 차선을 가진 테스트 이미지를 세그멘테이션 하는 테스트 장치에 있어서, 인스트럭션을 저장하는 적어도 하나의 메모리; 및 학습 장치가, (1) CNN(Convolutional Neural Network) 모듈로 하여금 트레이닝 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 학습용 특징 맵을 생성한 후, 상기 학습용 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 트레이닝 이미지 상의 각각의 픽셀에 대한 학습용 세그멘테이션 스코어(Segmentation Score) 각각을 생성하도록 하고, (2) 상기 CNN 모듈로 하여금 상기 학습용 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 학습용 소프트맥스 스코어 각각을 생성하도록 하고, (3) 상기 CNN 모듈로 하여금, (3-1) (i) 상기 학습용 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 소프트맥스 로스 각각을 생성하도록 하고, (ii) 상기 학습용 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 학습용 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 학습용 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (3-2) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록 한 상태에서, (I) 상기 CNN 모듈로 하여금 상기 테스트 이미지에 대하여 컨벌루션 연산을 적용하도록 하여 테스트용 특징 맵을 생성한 후, 상기 테스트용 특징 맵에 대하여 디컨벌루션 연산을 적용하도록 하여 상기 테스트 이미지 상의 각각의 픽셀에 대한 테스트용 세그멘테이션 스코어 각각을 생성하도록 하는 프로세스, 및 (II) 상기 CNN 모듈로 하여금 상기 테스트용 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산을 적용하도록 하여 테스트용 소프트맥스 스코어 각각을 생성하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;를 포함하는 것을 특징으로 한다.

본 발명은, 동일한 차선에 속한 픽셀 사이의 세그멘테이션 스코어 간에 차이는 작게 하고 상이한 차선에 속한 픽셀 사이의 세그멘테이션 스코어 간에 차이는 크게 함으로써 최적화된 세그멘테이션 결과를 얻을 수 있는 효과가 있다.

본 발명의 실시예의 설명에 이용되기 위하여 첨부된 아래 도면들은 본 발명의 실시예들 중 단지 일부일 뿐이며, 본 발명이 속한 기술분야에서 통상의 지식을 가진 자(이하 "통상의 기술자")에게 있어서는 발명적 작업이 이루어짐 없이 이 도면들에 기초하여 다른 도면들이 얻어질 수 있다.
도 1은 본 발명에 따른 학습 장치를 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따라 임베딩 로스 값 및 소프트맥스 로스 값을 백프로파게이션하여 CNN(Convolutional Neural Network)을 학습하는 프로세스를 나타낸 도면이다.
도 3은 본 발명에 따른 클러스터 내의 픽셀 수가 불균형한 경우를 나타낸 도면이다.
도 4a는 종래 기술에 따라 도 3의 이미지가 세그멘테이션된 경우의 세그멘테이션 스코어를 나타낸 도면이다.
도 4b는 본 발명의 일 실시예에 따라 도 3의 이미지가 세그멘테이션된 경우의 세그멘테이션 스코어를 나타낸 도면이다.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.

또한, 본 발명의 상세한 설명 및 청구항들에 걸쳐, "포함하다"라는 단어 및 그것의 변형은 다른 기술적 특징들, 부가물들, 구성요소들 또는 단계들을 제외하는 것으로 의도된 것이 아니다. 통상의 기술자에게 본 발명의 다른 목적들, 장점들 및 특성들이 일부는 본 설명서로부터, 그리고 일부는 본 발명의 실시로부터 드러날 것이다. 아래의 예시 및 도면은 실례로서 제공되며, 본 발명을 한정하는 것으로 의도된 것이 아니다.

본 발명에서 언급하는 각종 이미지는 포장 또는 비포장 도로 관련 이미지를 포함할 수 있으며, 이 경우 도로 환경에서 등장할 수 있는 물체(가령, 자동차, 사람, 동물, 식물, 물건, 건물, 비행기나 드론과 같은 비행체, 기타 장애물)를 상정할 수 있을 것이나, 반드시 이에 한정되는 것은 아니며, 본 발명에서 언급하는 각종 이미지는 도로와 상관 없는 이미지(가령, 비포장도로, 골목길, 공터, 바다, 호수, 강, 산, 숲, 사막, 하늘, 실내와 관련된 이미지)일 수도 있으며, 이 경우, 비포장도로, 골목길, 공터, 바다, 호수, 강, 산, 숲, 사막, 하늘, 실내 환경에서 등장할 수 있는 물체(가령, 자동차, 사람, 동물, 식물, 물건, 건물, 비행기나 드론과 같은 비행체, 기타 장애물)를 상정할 수 있을 것이나, 반드시 이에 한정되는 것은 아니다.

이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.

도 1은 본 발명에 따른 학습 장치를 나타낸 도면이다.

도 1을 참조하면, 학습 장치(100)은 CNN 모듈(200)을 포함할 수 있다. 그리고 다양한 데이터는 통신부(110)에 의해 수신되거나 전송되며, 상기 CNN 모듈(200)의 다양한 프로세스는 프로세서(120)에 의해 이루어질 수 있다. 다만, 도 1에서는 통신부(110), 프로세서(120) 및 CNN 모듈(200)의 구체적인 연결 관계를 생략하였다. 또한, 학습 장치는 다음의 프로세스를 수행하기 위한 컴퓨터 판독 가능한 인스트럭션(Instruction)을 저장할 수 있는 메모리(115)를 더 포함할 수 있다. 일 실시예에 따르면, 프로세서, 메모리, 매체 등은 통합 프로세서(Integrated Processor)로 통합될 수 있다.

도 2는 본 발명에 따른 임베딩 로스 값 및 소프트맥스 로스 값을 백프로파게이션하여 CNN(Convolutional Neural Network)을 학습하는 프로세스를 나타낸 도면이다.

도 2를 참조하면, 통신부(110)를 통해 입력 이미지가 획득되면, CNN 모듈(200)은 기설정된 뉴럴 네트워크 연산을 통해 입력 이미지에 대한 세그멘테이션 스코어를 출력할 수 있다.

구체적으로, CNN 모듈(200)은 인코딩 레이어(210) 및 디코딩 레이어(220)를 포함할 수 있다. 인코딩 레이어(210)는 입력 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하여 적어도 하나의 인코디드 특징 맵을 생성하도록 하고, 디코딩 레이어(220)는 인코딩 레이어(210)에서 출력된 특정 인코디드 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하여 적어도 하나의 디코디드 특징 맵을 생성하도록 할 수 있다. 특정 특징 맵은 인코딩 레이어(210)에서 최종적으로 출력된 인코디드 특징 맵일 수 있으나 이에 한정되는 것은 아니다.

CNN 모듈(200)은 특정 디코디드 특징 맵이 세그멘테이션 스코어 각각을 포함할 수도 있고, 특정 디코디드 특징 맵에 대해 컨벌루션 연산을 적어도 한 번 적용한 결과가 세그멘테이션 스코어 각각을 포함할 수도 있다. 또한, 특정 디코디드 특징 맵은 디코딩 레이어(220)에서 최종적으로 출력된 디코디드 특징 맵일 수 있으나, 이에 한정되는 것은 아니다.

학습 장치(100)는, CNN 모듈로 하여금, 소프트맥스 레이어(230)에서, 출력된 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산을 적어도 한 번 적용하도록 하여, 세그멘테이션 스코어의 각각의 값이 0과 1 사이 범위의 값을 가지도록 노말라이징된 소프트맥스 스코어 각각을 생성하도록 할 수 있다.

소프트맥스 레이어(230)에서 소프트맥스 스코어 각각이 생성되면, 학습 장치(100)는 CNN 모듈(200)로 하여금, (i) 소프트맥스 스코어 각각에 대하여, 소프트맥스 스코어와 이에 대응하는 GT를 참조하여 소프트맥스 로스를 출력하기 위한 연산인, 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 로스를 생성하도록 하며, (ii) 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 각각의 임베딩 로스를 생성하되, 각각의 임베딩 로스는 CNN 모듈의 학습 프로세스를 수행하는 도중에 차선 각각의 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 차선 각각의 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 하는데 사용된다. 여기서, 픽셀 임베딩 연산과 다항 로지스틱 로스 연산에 대해 자세히 설명하기로 한다.

앞서 말했듯이, 픽셀 임베딩 연산은 차선 각각의 세그멘테이션 스코어의 각각의 평균 중 다른 차선 사이의 평균의 차이는 커지도록 하고 차선 각각의 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 하는 CNN 모듈을 학습하는데 사용되는 임베딩 로스 각각을 생성한다.

임베딩 로스 각각은 상기 수식을 이용해 산출된다. 각 문자가 의미하는 바를 설명하면, 입력 이미지가 차선 및 적어도 하나의 배경 등을 포함하는 복수 개의 클러스터를 포함한다고 할 때,

는 입력 이미지 상의 차선 및 배경 등을 포함하는 클러스터의 개수,

는 각각의 클러스터 안의 픽셀의 개수,

는 각각의 클러스터에 포함된 픽셀 각각에 대응하는 소프트맥스 스코어의 각각의 평균,

는 각각의 픽셀에 대응하는 소프트맥스 스코어 및 각각의 픽셀에 대응하는

를 참조하여 산출된 분산 중 최대값,

는 서로 다른 클러스터에 대응하는

간의 차이 중 최소값을 의미한다.

상기 수식에서,

부분은 분산에 관한 로스를 의미하고,

부분은 평균에 관한 로스를 의미한다. 분모의

은 노말라이제이션을 위한 것이다. 이때,

가

대신 사용되는데, 왜냐하면

로 나누면 임베딩 로스가 너무 커져 소프트맥스 로스와 균형이 맞지 않기 때문이다. 이러한 임베딩 로스는, 같은 차선 내의 픽셀에 대응하는 세그멘테이션 스코어 간의 분산을

이하의 값으로 줄이고, 서로 다른 차선 내의 픽셀의 평균 간의 차이를

이상의 값으로 늘릴 수 있다. 본 발명의 임베딩 로스는 상기 수식을 통해 연산될 수 있으나, 이에 한정되는 것은 아니다.

다음으로 다항 로지스틱 로스 연산에 대해 설명하면, 이는 소프트맥스 스코어 및 이에 대응하는 GT를 참조하여 소프트맥스 로스를 출력하는 연산이다.

상기 수식에 따라 다항 로지스틱 로스 각각이 산출될 수 있다. 이 때, s는 입력 이미지 한 개에 포함되는 픽셀의 개수, l은 제i 픽셀이 이에 대응하는 GT 라벨 상에서 어떤 클러스터에 속하는지를 나타내는 원핫인코딩(One-Hot-Encoding) 벡터, P(i)는 각각의 픽셀에 대응하는 각각의 소프트맥스 스코어를 의미한다.

여기서, 각각의 소프트맥스 스코어는 각각의 픽셀이 어느 클러스터에 속하는지를 벡터 내의 가장 큰 원소 값을 통해 가리키는데, (i) 원핫인코딩 벡터를 나타내는 1과 (ii) 소프트맥스 스코어에 로그를 씌운 벡터 사이에 벡터 내적(Vector Dot Product) 연산이 수행되는 것이다. 예를 들어, 2번째 차선에 포함되는 특정 픽셀의 소프트맥스 스코어가 (0.1, 0.8, 0.1) 및 l 벡터가 (0, 1, 0)으로 표현된다면, 특정 픽셀의 로스 값은

로 산출된다. 이러한 방식으로 계산된 픽셀 별 로스 값 각각이 합해진 후 픽셀 개수로 나누어져 소프트맥스 로스가 생성될 수 있다. 각각의 소프트맥스 로스는 상기 수식을 통해 산출될 수 있으나, 이에 한정되는 것은 아니다.

상기 로스 레이어(240)에서 출력된 각각의 소프트맥스 로스 및 각각의 임베딩 로스는 백프로파게이션을 통해 CNN 장치의 적어도 하나의 파라미터를 학습하는 데 사용된다.

이후로, CNN 모듈(200)의 학습 프로세스가 완료된 경우에 테스트 장치가 수행한 프로세스에 대해서는 도 2를 참조해 설명한다.

도 2를 참조하면, CNN 모듈(200)이 입력 이미지를 수신해 디코딩 레이어(220)의 출력으로 세그멘테이션 스코어 각각을 생성하고, 소프트맥스 레이어(230)에서 상기 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산을 적어도 한 번 적용한다. 테스트 프로세스에서는 상기 레이어의 파라미터가 모두 학습된 상태이므로, 로스를 구하는 과정과 백프로파게이션 과정은 생략된다.

도 3은 각각의 차선의 각각의 위치에 따라 각각의 차선 내의 픽셀 수의 분산 각각이 특정 임계치 이상인 이미지의 예시다.

도3을 참조하면, 도 3의 이미지 상에서 각각의 차선의 픽셀 수가 픽셀의 위치에 따라 불균형함을 알 수 있다. 즉, 근거리 영역에 위치한 각각의 차선은 각각의 차선에 픽셀이 많아 두껍게 보이지만, 원거리 영역에 위치한 각각의 차선의 픽셀은 각각의 차선에 픽셀이 적어 얇게 보인다. 그러므로 차선의 픽셀 수의 분산이 크게 나온다. 그런 이유로, 적어도 하나의 분산이 특정 임계치 이상인 경우, 본 발명에 따른 세그멘테이션 방법이 적용되어, 차선을 검출하는데 더 정확한 효과를 얻을 수 있을 것이다.

도 4a는 도 3이 종래의 기술에 따라 세그멘테이션된 이미지의 세그멘테이션 스코어를 나타낸 도면이고, 도 4b는 도 3이 본 발명의 예시에 따라 세그멘테이션된 이미지의 세그멘테이션 스코어를 나타낸 도면이다.

도 4a를 참조하면, 차선 픽셀이 상대적으로 적은 특정 영역의 세그멘테이션 스코어는 차선 픽셀이 상대적으로 많은 소정의 영역의 세그멘테이션 스코어와 크게 차이가 날 것이다. 이때, 특정 영역은 원거리에 위치한 차선 픽셀 또는 여러 이유로 인하여 상대적으로 적은 차선 픽셀을 포함할 수 있다. 그리고 소정의 영역은 근거리에 위치한 차선 픽셀 또는 여러 이유로 인하여 상대적으로 많은 차선 픽셀을 포함할 수 있다. 예를 들어, 도 4a의 가장 왼쪽 차선을 참고하면, 맨 위쪽 픽셀 수가 적은 차선의 세그멘테이션 스코어는 0.89이지만, 중간 부분과 가장 아래쪽 부분의 세그멘테이션 스코어는 각각 1.05, 1.12이다. 그러므로 가장 왼쪽 차선의 세그멘테이션 스코어 간에 큰 차이를 보인다. 도 4a의 제일 오른쪽 차선 역시 마찬가지로, 중간 부분과 가장 아래쪽 부분의 세그멘테이션 스코어가 각각 2.02, 2.09인데 비해 맨 위쪽 부분의 세그멘테이션 스코어는 1.72이다.

특정 영역에 차선 픽셀이 조금만 있는 경우에는 차선의 픽셀이 아닌 도로의 픽셀이 많다 보니 CNN모듈(200)이 특정 영역의 픽셀을 차선으로 판단할 개연성이 적다. 따라서 세그멘테이션 결과가 출력되었을 때 차선 픽셀이 적은 특정 영역이 흐릿하게 표현될 수 있다.

그에 반하여, 도 4b에서와 같이, 백프로파게이션을 통해 CNN 장치가 학습되었으므로, 가장 왼쪽 차선의 맨 위, 중간, 맨 아래의 세그멘테이션 스코어가 서로 비슷하게 산출될 수 있다. 비슷하게, 중간 차선의 위쪽 부분과 아래쪽 부분의 세그멘테이션 스코어도 서로 비슷하게 산출될 수 있다. 그리고 가장 오른쪽 차선의 맨 위, 중간, 맨 아래의 세그멘테이션 스코어도 서로 비슷하게 산출될 수 있다.

학습 방법 및 테스트 방법은 자율주행 자동차의 레벨 4를 충족시키기 위해 필요한 HD 지도와의 콜라보레이션을 지원하는데 사용될 수 있다.

본 발명 기술분야의 통상의 기술자에게 이해될 수 있는 바로서, 위에서 설명된 이미지, 예컨대 원본 이미지, 원본 레이블 및 추가 레이블과 같은 이미지 데이터의 송수신이 학습 장치 및 테스트 장치의 통신부들에 의하여 이루어질 수 있으며, 특징 맵과 연산을 수행하기 위한 데이터가 학습 장치 및 테스트 장치의 프로세서(및/또는 메모리)에 의하여 보유/유지될 수 있고, 컨벌루션 연산, 디컨벌루션 연산, 로스 값 연산 과정이 주로 학습 장치 및 테스트 장치의 프로세서에 의하여 수행될 수 있으나, 본 발명이 이에 한정되지는 않을 것이다.

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims

적어도 하나의 차선을 가진 입력 이미지를 세그멘테이션 하는 학습 방법에 있어서,
(a) 상기 입력 이미지가 획득되면, 학습 장치가, CNN(Convolutional Neural Network) 모듈로 하여금 상기 입력 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 특징 맵을 생성하고 상기 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 입력 이미지 상의 각각의 픽셀에 대한 각각의 세그멘테이션 스코어(Segmentation Score)를 생성하도록 하는 단계;
(b) 상기 학습 장치가, 상기 CNN 모듈로 하여금, 상기 각각의 세그멘테이션 스코어에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 스코어를 생성하도록 하는 단계;
(c) 상기 학습 장치가, 상기 CNN 모듈로 하여금, (I) (i) 상기 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 로스를 생성하도록 하고, (ii) 상기 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (II) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록 하는 단계;
를 포함하는 것을 특징으로 하는 방법.
제1 항에 있어서,

상기 임베딩 로스 각각은 상기 수식을 통해 산출되고,
상기 입력 이미지가 상기 차선 및 적어도 하나의 배경 부분을 갖는 복수 개의 클러스터를 포함한다고 하면,
는 상기 입력 이미지 상의 상기 차선 및 상기 배경 부분을 포함하는 상기 클러스터의 개수,
는 각각의 상기 클러스터 안의 픽셀의 개수,
는 각각의 상기 클러스터에 포함된 픽셀 각각에 대응하는 소프트맥스 스코어의 각각의 평균,
는 각각의 상기 픽셀에 대응하는 상기 소프트맥스 스코어 및 각각의 상기 픽셀에 대응하는 상기
를 참조하여 산출된 분산 중 최대값,
는 서로 다른 클러스터에 대응하는
간의 차이 중 최소값을 의미하는 것을 특징으로 하는 방법.
제 1 항에 있어서,
각각의 상기 다항 로지스틱 로스는 다음의 수식을 이용해 산출되고,

이 때, s는 상기 입력 이미지 한 개에 포함되는 상기 픽셀의 개수, l은 제i 픽셀이 이에 대응하는 GT 라벨 상에서 어떤 클러스터에 속하는지를 나타내는 원핫인코딩(One-Hot-Encoding) 벡터, P(i)는 상기 픽셀 각각에 대응하는 각각의 소프트맥스 스코어를 의미하는 것을 특징으로 하는 방법.
적어도 하나의 차선을 가진 테스트 이미지를 세그멘테이션 하는 테스트 방법에 있어서,
(a) 학습 장치가, (1) CNN(Convolutional Neural Network) 모듈로 하여금 트레이닝 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 학습용 특징 맵을 생성한 후, 상기 학습용 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 트레이닝 이미지 상의 각각의 픽셀에 대한 학습용 세그멘테이션 스코어(Segmentation Score) 각각을 생성하도록 하고; (2) 상기 CNN 모듈로 하여금 상기 학습용 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 학습용 소프트맥스 스코어 각각을 생성하도록 하고; (3) 상기 CNN 모듈로 하여금, (I) (i) 상기 학습용 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 소프트맥스 로스 각각을 생성하도록 하고, (ii) 상기 학습용 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 학습용 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 학습용 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (II) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록 한 상태에서, 상기 테스트 이미지가 획득되면, 테스트 장치가, 상기 CNN 모듈로 하여금 상기 테스트 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 테스트용 특징 맵을 생성한 후, 상기 테스트용 특징 맵에 대하여 디컨벌루션 연산을 적용하도록 하여 상기 테스트 이미지 상의 각각의 픽셀에 대한 테스트용 세그멘테이션 스코어 각각을 생성하도록 하는 단계; 및
(b) 상기 테스트 장치가, 상기 CNN 모듈로 하여금 상기 테스트용 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산을 적용하도록 하여 테스트용 소프트맥스 스코어 각각을 생성하도록 하는 단계;
를 포함하는 것을 특징으로 하는 방법.
적어도 하나의 차선을 가진 입력 이미지를 세그멘테이션 하는 학습 장치에 있어서,
인스트럭션을 저장하는 적어도 하나의 메모리; 및
(I) CNN(Convolutional Neural Network) 모듈로 하여금 상기 입력 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 특징 맵을 생성하고 상기 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 입력 이미지 상의 각각의 픽셀에 대한 각각의 세그멘테이션 스코어(Segmentation Score)를 생성하도록 하는 프로세스, (II) 상기 CNN 모듈로 하여금 상기 각각의 세그멘테이션 스코어에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 스코어를 생성하도록 하는 프로세스, (III) 상기 CNN 모듈로 하여금 (1) (i) 상기 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 각각의 소프트맥스 로스를 생성하도록 하고, (ii) 상기 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (2) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;
를 포함하는 것을 특징으로 하는 학습 장치.
제 5 항에 있어서,

상기 임베딩 로스 각각은 상기 수식을 통해 산출되고,
상기 입력 이미지가 상기 차선 및 적어도 하나의 배경 부분을 갖는 복수 개의 클러스터를 포함한다고 하면,
는 상기 입력 이미지 상의 상기 차선 및 상기 배경 부분을 포함하는 상기 클러스터의 개수,
는 각각의 상기 클러스터 안의 픽셀의 개수,
는 각각의 상기 클러스터에 포함된 픽셀 각각에 대응하는 소프트맥스 스코어의 각각의 평균,
는 각각의 상기 픽셀에 대응하는 상기 소프트맥스 스코어 및 각각의 상기 픽셀에 대응하는 상기
를 참조하여 산출된 분산 중 최대값,
는 서로 다른 클러스터에 대응하는
간의 차이 중 최소값을 의미하는 것을 특징으로 하는 학습 장치.
제 5항에 있어서,
각각의 상기 다항 로지스틱 로스는 다음의 수식을 이용해 산출되고,

이 때, s는 상기 입력 이미지 한 개에 포함되는 상기 픽셀의 개수, l은 제i 픽셀이 이에 대응하는 GT 라벨 상에서 어떤 클러스터에 속하는지를 나타내는 원핫인코딩(One-Hot-Encoding) 벡터, P(i)는 상기 픽셀 각각에 대응하는 각각의 소프트맥스 스코어를 의미하는 것을 특징으로 하는 학습 장치.
적어도 하나의 차선을 가진 테스트 이미지를 세그멘테이션 하는 테스트 장치에 있어서,
인스트럭션을 저장하는 적어도 하나의 메모리; 및
학습 장치가, (1) CNN(Convolutional Neural Network) 모듈로 하여금 트레이닝 이미지에 대하여 컨벌루션 연산을 적어도 한 번 적용하도록 하여 학습용 특징 맵을 생성한 후, 상기 학습용 특징 맵에 대하여 디컨벌루션 연산을 적어도 한 번 적용하도록 하여 상기 트레이닝 이미지 상의 각각의 픽셀에 대한 학습용 세그멘테이션 스코어(Segmentation Score) 각각을 생성하도록 하고, (2) 상기 CNN 모듈로 하여금 상기 학습용 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산(Softmax Operation)을 적어도 한 번 적용하도록 하여 학습용 소프트맥스 스코어 각각을 생성하도록 하고, (3) 상기 CNN 모듈로 하여금, (3-1) (i) 상기 학습용 소프트맥스 스코어 각각에 대하여 다항 로지스틱 로스 연산(Multinomial Logistic Loss Operation)을 적어도 한 번 적용하도록 하여 소프트맥스 로스 각각을 생성하도록 하고, (ii) 상기 학습용 소프트맥스 스코어 각각에 대하여 픽셀 임베딩 연산(Pixel Embedding Operation)을 적어도 한 번 적용하도록 하여, 상기 차선 각각의 상기 학습용 세그멘테이션 스코어의 각각의 평균 중 다른 차선 간의 평균의 차이는 커지도록 하고 상기 차선 각각의 상기 학습용 세그멘테이션 스코어의 분산 중 각각의 동일 차선 내부의 분산은 작아지도록 상기 CNN 모듈의 학습을 유도하는 각각의 임베딩 로스를 생성한 후, (3-2) 각각의 상기 소프트맥스 로스 및 각각의 상기 임베딩 로스를 이용한 백프로파게이션을 통해 상기 CNN 모듈의 적어도 하나의 파라미터를 학습하도록 한 상태에서, (I) 상기 CNN 모듈로 하여금 상기 테스트 이미지에 대하여 컨벌루션 연산을 적용하도록 하여 테스트용 특징 맵을 생성한 후, 상기 테스트용 특징 맵에 대하여 디컨벌루션 연산을 적용하도록 하여 상기 테스트 이미지 상의 각각의 픽셀에 대한 테스트용 세그멘테이션 스코어 각각을 생성하도록 하는 프로세스, 및 (II) 상기 CNN 모듈로 하여금 상기 테스트용 세그멘테이션 스코어 각각에 대하여 소프트맥스 연산을 적용하도록 하여 테스트용 소프트맥스 스코어 각각을 생성하도록 하는 프로세스를 수행하기 위한 상기 인스트럭션을 실행하도록 구성된 적어도 하나의 프로세서;
를 포함하는 것을 특징으로 하는 테스트 장치.