KR102263540B1

KR102263540B1 - 왜곡 영상 내에 gt 영역 설정 방법 및 장치

Info

Publication number: KR102263540B1
Application number: KR1020190119438A
Authority: KR
Inventors: 이준석; 전병찬; 하정목
Original assignee: (주)베이다스
Priority date: 2019-09-27
Filing date: 2019-09-27
Publication date: 2021-06-14
Also published as: KR20210037778A

Abstract

왜곡 영상 내에 오브젝트 검출을 위한 Ground Truth(GT) 영역을 설정하기 위해, 비-왜곡 영상 도메인에 대응하는 GT 정보를 수신하고, GT 정보에 대응하는 제1 영역을 비-왜곡 영상 도메인에 설정하며, 비-왜곡 영상 도메인에 기초하여 왜곡 영상 도메인을 생성하고, 제1 영역에 대응하는 왜곡 영상 도메인의 제2 영역을 포함하는 GT 영역을 왜곡 영상에 설정한다.

Description

왜곡 영상 내에 GT 영역 설정 방법 및 장치 {METHOD AND APPARATUS FOR SETTING GT REGION ON DISTORED IMAGE}

아래의 실시예들은 왜곡 영상 내에 GT 영역을 설정하는 기술에 관한 것으로, 특히 영상 내의 오브젝트를 검출하는 알고리즘을 훈련시키기 위해 이용되는 왜곡 영상 내에 GT 영역을 설정하는 기술에 관한 것이다.

이미지 촬영 및 처리 기술의 발달에 따라, 최근에 생산된 차량에는 카메라가 탑재되고, 차량의 주행을 보조하기 위한 시스템이 사용자 또는 차량에게 제공된다. 예를 들어, 카메라로 촬영된 영상을 이용하여 차량 주변의 오브젝트를 검출하고, 이에 기초하여 차량을 제어할 수 있다.

일 실시예는 비-왜곡 영상을 이용하여 왜곡 영상 내에 GT 영역을 설정할 수 있다.

다른 일 실시예는 비-왜곡 분할 영상을 이용하여 왜곡 분할 영상 내에 GT 영역을 설정할 수 있다.

일 측면에 따른, 전자 장치에 의해 수행되는, 왜곡 영상 내에 오브젝트 검출을 위한 Ground Truth(GT) 영역을 설정하는 방법은, 비-왜곡 영상 도메인에 대응하는 GT 정보를 수신하는 단계, 상기 GT 정보에 대응하는 제1 영역을 상기 비-왜곡 영상 도메인에 설정하는 단계, 상기 비-왜곡 영상 도메인에 기초하여 왜곡 영상 도메인을 생성하는 단계, 및 상기 제1 영역에 대응하는 상기 왜곡 영상 도메인의 제2 영역을 포함하는 GT 영역을 왜곡 영상에 설정하는 단계를 포함한다.

상기 GT 정보는 비-왜곡 영상 내의 타겟 오브젝트를 포함할 수 있는 영역의 좌측-상단 픽셀의 좌표 및 우측-하단 픽셀의 좌표를 포함할 수 있다.

상기 GT 정보에 대응하는 제1 영역을 상기 비-왜곡 영상 도메인에 설정하는 단계는, 상기 좌측-상단 픽셀 및 상기 우측-하단 픽셀에 기초하여 상기 제1 영역을 설정하는 단계를 포함할 수 있다.

상기 비-왜곡 영상 도메인에 기초하여 왜곡 영상 도메인을 생성하는 단계는, 상기 비-왜곡 영상 도메인에 f-theta 모델, equisolid 모델, 스테레오그래픽(stereographic) 모델, orthographic 모델, 다항(polynomial) 모델, 및 분할(division) 모델 중 적어도 하나를 적용함으로써 상기 왜곡 영상 도메인을 생성하는 단계를 포함할 수 있다.

상기 제1 영역에 대응하는 상기 왜곡 영상 도메인의 제2 영역을 포함하는 GT 영역을 왜곡 영상에 설정하는 단계는, 상기 제2 영역의 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀을 결정하는 단계, 상기 최상단 픽셀, 상기 최하단 픽셀, 상기 최좌측 픽셀 및 상기 최우측 픽셀에 기초하여 상기 GT 영역을 위한 제1 타겟 픽셀 및 제2 타겟 픽셀을 결정하는 단계, 및 상기 제1 타겟 픽셀 및 상기 제2 타겟 픽셀에 기초하여 상기 GT 영역을 설정하는 단계를 포함할 수 있다.

상기 제1 타겟 픽셀 및 상기 제2 타겟 픽셀에 기초하여 상기 GT 영역을 설정하는 단계는, 상기 제1 타겟 픽셀이 상기 GT 영역의 좌측-상단 픽셀이되고, 상기 제2 타겟 픽셀이 상기 GT 영역의 우측-하단 픽셀이 되도록 상기 GT 영역을 설정하는 단계를 포함할 수 있다.

상기 제1 타겟 픽셀 및 상기 제2 타겟 픽셀에 기초하여 상기 GT 영역을 설정하는 단계는, 상기 제1 타겟 픽셀이 상기 GT 영역의 좌측-하단 픽셀이되고, 상기 제2 타겟 픽셀이 상기 GT 영역의 우측-상단 픽셀이 되도록 상기 GT 영역을 설정하는 단계를 포함할 수 있다.

상기 GT 영역은 실시간으로 생성되는 왜곡 영상 내의 오브젝트를 검출하기 위한 알고리즘을 훈련시키기 위해 이용될 수 있다.

상기 왜곡 영상은 컬러 영상일 수 있다.

다른 일 측면에 따른, 왜곡 영상 내에 오브젝트 검출을 위한 Ground Truth(GT) 영역을 설정하는 방법을 수행하는 전자 장치는, 왜곡 영상 내에 오브젝트 검출을 위한 GT 영역을 설정하는 프로그램이 기록된 메모리, 및 상기 프로그램을 수행하는 프로세서를 포함하고, 상기 프로그램은, 비-왜곡 영상 도메인에 대응하는 GT 정보를 수신하는 단계, 상기 GT 정보에 대응하는 제1 영역을 상기 비-왜곡 영상 도메인에 설정하는 단계-, 상기 비-왜곡 영상 도메인에 기초하여 왜곡 영상 도메인을 생성하는 단계, 및 상기 제1 영역에 대응하는 상기 왜곡 영상 도메인의 제2 영역을 포함하는 GT 영역을 왜곡 영상에 설정하는 단계를 수행한다.

또 다른 일 측면에 따른, 전자 장치에 의해 수행되는, 왜곡 분할 영상 내에 오브젝트 검출을 위한 Ground Truth(GT) 영역을 설정하는 방법은, 영상 내의 오브젝트에 대한 클래스가 GT 정보로서 미리 라벨링된 비-왜곡 분할 영상을 수신하는 단계, 상기 비-왜곡 분할 영상에 기초하여 왜곡 분할 영상을 생성하는 단계, 및 상기 왜곡 분할 영상 내의 타겟 오브젝트의 타겟 클래스에 기초하여 상기 타겟 오브젝트에 대한 GT 영역을 상기 왜곡 분할 영상에 설정하는 단계를 포함할 수 있다.

상기 비-왜곡 분할 영상에 기초하여 왜곡 분할 영상을 생성하는 단계는, 상기 비-왜곡 영상에 f-theta 모델, equisolid 모델, 스테레오그래픽(stereographic) 모델, orthographic 모델, 다항(polynomial) 모델, 및 분할(division) 모델 중 적어도 하나를 적용함으로써 상기 왜곡 영상을 생성하는 단계를 포함할 수 있다.

상기 타겟 오브젝트에 대한 GT 영역을 상기 왜곡 분할 영상에 설정하는 단계는, 상기 타겟 클래스를 갖는 픽셀들 중 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀을 결정하는 단계, 상기 최상단 픽셀, 상기 최하단 픽셀, 상기 최좌측 픽셀 및 상기 최우측 픽셀에 기초하여 상기 GT 영역을 위한 제1 타겟 픽셀 및 제2 타겟 픽셀을 결정하는 단계, 및 상기 제1 타겟 픽셀 및 상기 제2 타겟 픽셀에 기초하여 상기 GT 영역을 설정하는 단계를 포함할 수 있다.

상기 비-왜곡 분할 영상은 영상 내의 오브젝트의 종류에 따라 오브젝트에 대한 클래스가 라벨링되는 의미론적 분할(semantic segmentation) 영상일 수 있다.

상기 비-왜곡 분할 영상은 영상 내의 개별 오브젝트에 대한 클래스가 라벨링되는 인스턴스 분할(instance segmentation) 영상일 수 있다.

또 다른 일 측면에 따른, 왜곡 분할 영상 내에 오브젝트 검출을 위한 Ground Truth(GT) 영역을 설정하는 방법을 수행하는 전자 장치는, 왜곡 영상 내에 오브젝트 검출을 위한 GT 영역을 설정하는 프로그램이 기록된 메모리, 및 상기 프로그램을 수행하는 프로세서를 포함하고, 상기 프로그램은, 영상 내의 오브젝트에 대한 클래스가 GT 정보로서 미리 라벨링된 비-왜곡 분할 영상을 수신하는 단계, 상기 비-왜곡 분할 영상에 기초하여 왜곡 분할 영상을 생성하는 단계, 및 상기 왜곡 분할 영상 내의 타겟 오브젝트의 타겟 클래스에 기초하여 상기 타겟 오브젝트에 대한 GT 영역을 상기 왜곡 분할 영상에 설정하는 단계를 수행할 수 있다.

비-왜곡 영상을 이용하여 왜곡 영상 내에 GT 영역이 설정될 수 있다.

비-왜곡 분할 영상을 이용하여 왜곡 분할 영상 내에 GT 영역이 설정될 수 있다.

도 1은 일 예에 따른 차량에 설치된 영상 장치 및 영상 장치에 의해 촬영되는 장면을 도시한다.
도 2 는 일 예에 따른 영상 장치에 의해 생성된 비-왜곡 영상을 도시한다.
도 3 는 일 예에 따른 비-왜곡 영상에 대응하는 왜곡 영상을 도시한다.
도 4는 일 예에 따른 비-왜곡 영상 내에 설정된 오브젝트 영역 및 이에 기초하여 설정되는 왜곡 영상 내에 설정된 오브젝트 영역을 도시한다.
도 5는 일 실시예에 따른 전자 장치의 구성도이다.
도 6은 일 실시예에 따른 왜곡 영상에 GT 영역을 설정하는 방법의 흐름도이다.
도 7은 일 예에 따른 비-왜곡 영상의 GT 정보를 도시한다.
도 8은 일 예에 따른 비-왜곡 영상 도메인에 설정된 제1 영역 및 왜곡 영상 도메인에 설정된 제2 영역을 도시한다.
도 9는 일 예에 따른 제2 영역에 기초하여 GT 영역을 왜곡 영상에 설정하는 방법의 흐름도이다.
도 10은 일 예에 따른 제2 영역에 기초하여 왜곡 영상 도메인에 설정된 GT 영역을 도시한다.
도 11은 일 예에 따른 왜곡 영상 및 왜곡 영상에 설정된 GT 영역을 도시한다.
도 12는 일 실시예에 따른 왜곡 분할 영상에 GT 영역을 설정하는 방법의 흐름도이다.
도 13은 일 예에 따른 비-왜곡 영상 및 이에 대응하는 비-왜곡 분할 영상을 도시한다.
도 14는 일 예에 따른 비-왜곡 분할 영상에 기초하여 생성되는 왜곡 분할 영상을 도시한다.
도 15은 일 예에 따른 왜곡 분할 영상의 타겟 클래스에 기초하여 왜곡 분할 영상에 GT 영역을 설정하는 방법의 흐름도이다.
도 16은 일 예에 따른 왜곡 분할 영상의 타겟 클래스에 기초하여 왜곡 분할 영상에 설정된 GT 영역을 도시한다.
도 17은 일 예에 다른 의미론적 분할 영상 및 인스턴스 분할 영상을 도시한다.

이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 실시예들에는 다양한 변경이 가해질 수 있어서 특허출원의 권리 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 실시예들에 대한 모든 변경, 균등물 내지 대체물이 권리 범위에 포함되는 것으로 이해되어야 한다.

실시예에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

도 1은 일 예에 따른 차량에 설치된 영상 장치 및 영상 장치에 의해 촬영되는 장면을 도시한다.

전자 장치의 연산 능력이 증가함에 따라, ADAS(Advanced Driver Assistance Systems)을 지원하는 차량(110)이 일반화되고 있다. ADAS는 운전자를 보조하기 위한 기능들을 운전자에게 제공할 수 있다. 예를 들어, 차선 유지 기능, 크루즈 기능 및 자동 운전 기능이 제공될 수 있다. 이러한, 기능들이 제공되기 위해 다양한 센서들이 사용될 수 있으나, 비교적 가격이 저렴한 영상 생성 장치(110)가 보편적으로 이용되고 있다.

전자 장치는 영상 생성 장치(112)에 의해 생성된 영상을 분석하여, 차량(110) 및 차량(110)의 주변 상황에 대해 판단할 수 있고, 이에 기초하여 ADAS를 운전자에게 제공할 수 있다. 예를 들어, 영상 생성 장치(112)는 차량(110)의 전방(120)을 촬영함으로써 영상을 생성할 수 있다. 필요에 따라 차량(110)에 부착되는 영상 생성 장치(112)는 복수 개일 수 있다.

도 2 는 일 예에 따른 영상 장치에 의해 생성된 비-왜곡 영상을 도시하고, 도 3 는 일 예에 따른 비-왜곡 영상에 대응하는 왜곡 영상을 도시한다.

영상 생성 장치(112)는 보다 넓은 장면을 촬영하기 위해 보통의 렌즈보다 시야 각이 더 큰 광각 렌즈 또는 시각이 180°를 넘는 초광각 렌즈인 어안 렌즈를 포함할 수 있다. 그러나, 광각 렌즈 또는 어안 렌즈를 이용하여 생성된 영상은 왜곡된 영상이므로 일반적인 처리 방법으로는 원하는 결과를 얻을 수 없다. 예를 들어, 비-왜곡 영상의 오브젝트를 검출하는 알고리즘으로는 왜곡 영상의 오브젝트를 정확하게 검출할 수 없다.

도 4는 일 예에 따른 비-왜곡 영상 내에 설정된 오브젝트 영역 및 이에 기초하여 설정되는 왜곡 영상 내에 설정된 오브젝트 영역을 도시한다.

영상 내에 오브젝트가 존재하는 영역이 정확하게 검출되어야만 차량의 제어를 위한 판단이 정확할 수 있지만, 왜곡 영상 내에 오브젝트가 존재하는 영역이 정확하게 검출되지 않은 경우 차량의 제어를 위한 판단이 정확하지 않을 수 있다.

일반적으로 이용되는 오브젝트 검출 알고리즘은 비-왜곡 영상(410)에 대해 이용되고, 왜곡 영상(420)에 대해서는 이용될 수 없다. 비-왜곡 영상(410)에 GT 정보로서 오브젝트의 두 개의 코너점들(412, 413)이 결정되거나 외부로부터 수신된 경우, 코너점들(412, 413)에 기초하여 오브젝트 영역(411)이 설정될 수 있다. 비-왜곡 영상(410)에 대응하는 왜곡 영상(420)에 코너점들(412, 413)에 대응하는 코너점들(422, 423)이 결정될 수 있다. 코너점들(422, 423)에 기초하여 설정되는 오브젝트 영역(421)은 실제의 오브젝트를 포함하지 못하므로, 오브젝트 영역(421)은 정확하지 않는다.

왜곡 영상에 대한 전용 오브젝트 검출 알고리즘을 훈련시키기 위해서는 왜곡 영상 및 왜곡 영상의 오브젝트 영역에 대한 GT(Ground Truth) 영역이 요구된다. 오브젝트 검출 알고리즘을 훈련시키기 위해서는 대량의 자료들이 요구되는데, 왜곡 영상의 오브젝트 영역에 대한 GT 영역을 수동으로 설정하는 방법으로는 상기의 자료들의 생성이 제한적이다.

아래에서는 도 5 내지 도 17을 참조하여, 전자 장치에 의해 수행되는 왜곡 영상에 오브젝트 영역에 대한 GT 영역을 설정하는 방법에 대해 상세히 설명된다.

도 5는 일 실시예에 따른 전자 장치의 구성도이다.

전자 장치(500)는 통신부(510), 프로세서(520), 및 메모리(530)를 포함한다. 도시되지 않았으나, 전자 장치(500)는 영상 생성 장치로서 카메라를 더 포함할 수 있다. 전자 장치(500)는 왜곡 영상에 대한 GT 영역을 설정할 수 있다.

일 측면에 따르면, 전자 장치(500)는 차량과 독립적인 서버일 수 있고, 서버는 왜곡 영상에 대한 GT 영역을 설정하고, 이를 이용하여 왜곡 영상 내의 오브젝트를 검출하는 알고리즘을 훈련시킬 수 있다.

다른 일 측면에 따르면, 전자 장치(500)는 차량 내에 포함될 수 있다. 예를 들어, 전자 장치(500)는 ECU(electronic control unit)와 같은 장치일 수 있다. 다른 예로, 전자 장치(500)는 ECU와 연결된 독립적인 장치일 수 있다.

통신부(510)는 프로세서(520), 및 메모리(530)와 연결되어 데이터를 송수신한다. 통신부(510)는 외부의 다른 장치와 연결되어 데이터를 송수신할 수 있다. 이하에서 "A"를 송수신한다라는 표현은 "A를 나타내는 정보(information) 또는 데이터"를 송수신하는 것을 나타낼 수 있다.

통신부(510)는 전자 장치(500) 내의 회로망(circuitry)으로 구현될 수 있다. 예를 들어, 통신부(510)는 내부 버스(internal bus) 및 외부 버스(external bus)를 포함할 수 있다. 다른 예로, 통신부(510)는 전자 장치(500)와 외부의 장치를 연결하는 요소일 수 있다. 통신부(510)는 인터페이스(interface)일 수 있다. 통신부(510)는 외부의 장치로부터 데이터를 수신하여, 프로세서(520) 및 메모리(530)에 데이터를 전송할 수 있다.

프로세서(520)는 통신부(510)가 수신한 데이터 및 메모리(530)에 저장된 데이터를 처리한다. "프로세서"는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다. 예를 들어, 하드웨어로 구현된 데이터 처리 장치는 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.

프로세서(520)는 메모리(예를 들어, 메모리(530))에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서(520)에 의해 유발된 인스트럭션들을 실행한다.

메모리(530)는 통신부(510)가 수신한 데이터 및 프로세서(520)가 처리한 데이터를 저장한다. 예를 들어, 메모리(530)는 프로그램(또는 어플리케이션, 소프트웨어)을 저장할 수 있다. 저장되는 프로그램은 왜곡 영상에 GT 영역을 설정할 수 있도록 코딩되어 프로세서(520)에 의해 실행 가능한 신텍스(syntax)들의 집합일 수 있다.

일 측면에 따르면, 메모리(530)는 하나 이상의 휘발성 메모리, 비휘발성 메모리 및 RAM(Random Access Memory), 플래시 메모리, 하드 디스크 드라이브 및 광학 디스크 드라이브를 포함할 수 있다.

메모리(530)는 전자 장치(500)를 동작 시키는 명령어 세트(예를 들어, 소프트웨어)를 저장한다. 전자 장치(500)를 동작 시키는 명령어 세트는 프로세서(520)에 의해 실행된다.

카메라는 장면을 촬영함으로써 이미지를 생성한다. 예를 들어, 카메라는 비-왜곡 영상을 촬영하기 위한 렌즈 및 왜곡 영상을 촬영하기 위한 렌즈를 포함할 수 있다.

통신부(510), 프로세서(520), 및 메모리(530)에 대해, 아래에서 도 6 내지 도 17을 참조하여 상세히 설명된다.

도 6은 일 실시예에 따른 왜곡 영상에 GT 영역을 설정하는 방법의 흐름도이다.

아래의 단계들(610 내지 640)은 도 5를 참조하여 전술된 전자 장치(500)에 의해 수행된다.

단계(610)에서, 전자 장치(500)는 비-왜곡 영상 또는 비-왜곡 영상 도메인에 대한 GT 정보를 수신한다. 비-왜곡 영상 도메인은 왜곡되지 않은 영상(즉, 비-왜곡 영상)과 사이즈가 동일하고, 픽셀 좌표들만으로 구성된 도메인일 수 있다. 즉, 비-왜곡 영상 도메인 내의 픽셀들은 픽셀 좌표 이외의 다른 정보들(예를 들어, 픽셀 값)은 갖지 않는다. 이에 반하여, 비-왜곡 영상은 실제의 촬영 영상으로서 영상 내의 각 픽셀들은 픽셀 값을 갖는다.

GT 정보를 생성하는 사용자는 적어도 하나의 오브젝트를 포함하는 비-왜곡 영상을 관찰하여 오브젝트에 대한 GT 정보를 생성할 수 있다. 비-왜곡 영상은 컬러 영상일 수 있다.

GT 정보가 나타내는 비-왜곡 영상 내의 영역은 비-왜곡 영상 내의 타겟 오브젝트를 포함할 수 있다. 예를 들어, GT 정보는 비-왜곡 영상 내의 타겟 오브젝트를 포함할 수 있는 영역의 좌측-상단 픽셀의 좌표 및 우측-하단 픽셀의 좌표를 포함할 수 있다. 다른 예로, GT 정보는 비-왜곡 영상 내의 타겟 오브젝트를 포함할 수 있는 영역의 우측-상단 픽셀의 좌표 및 좌측-하단 픽셀의 좌표를 포함할 수 있다. 즉, GT 정보는 영역을 특정 시킬 수 있는 적어도 두 개의 픽셀들의 좌표를 포함할 수 있다.

단계(620)에서, 전자 장치(500)는 GT 정보에 대응하는 제1 영역을 비-왜곡 영상 도메인에 상에 설정한다. 예를 들어, 제1 영역은 좌측-상단 픽셀 및 우측-하단 픽셀에 기초하여 설정되는 사각형의 형태일 수 있다. 제1 영역의 가장 자리에 위치하는 픽셀들이 가장 자리 픽셀들로 결정될 수 있다.

단계(630)에서, 전자 장치(500)는 비-왜곡 영상 도메인에 기초하여 왜곡 영상 도메인을 생성한다. 왜곡 영상 도메인을 생성하기 위한 렌즈의 초점 거리(focal length) 및 렌즈의 반경(radius) 등은, 실제로 사용될 렌즈(예를 들어, 어안 렌즈)에 대응하도록 미리 설정되어 있을 수 있다. 예를 들어, f-theta 모델, equisolid 모델, 스테레오그래픽(stereographic) 모델, orthographic 모델, 다항(polynomial) 모델, 및 분할(division) 모델 중 적어도 하나를 비-왜곡 영상 도메인에 적용함으로써 왜곡 영상 도메인을 생성할 수 있다.

제1 영역의 가장 자리 픽셀들에 대응하는 왜곡 영상 도메인 내의 픽셀들이 제2 영역의 가장 자리 픽셀들로 결정될 수 있다. 제2 영역의 가장 자리 픽셀들에 기초하여 왜곡 영상 도메인 상에 제2 영역이 설정될 수 있다.

다른 일 측면에 따르면, 제1 영역의 가장 자리 픽셀들만을 왜곡시킴으로써 왜곡 영상 도메인 내의 제2 영역의 가장 자리 픽셀들을 생성할 수 있다. 비-왜곡 영상의 전체 픽셀들이 아닌 일부의 픽셀들만을 처리함으로써 처리 속도를 향상시킬 수 있다.

단계(640)에서, 전자 장치(500)는 왜곡 영상 도메인의 제2 영역을 포함하는 GT 영역을 왜곡 영상에 설정한다. GT 영역은 왜곡 영상 내의 타겟 오브젝트를 포함하도록 설정될 수 있다.

왜곡 영상은 실제의 촬영 이미지인 비-왜곡 영상을 이용하여 생성될 수 있다. 왜곡 영상의 생성은 단계(640)가 수행되기 전에 미리 수행될 수 있다. 예를 들어, 단계(630)에서 설명된 방법을 이용하여 왜곡 영상이 생성될 수 있다. 비-왜곡 영상이 컬러 영상인 경우, 이에 기초하여 생성된 왜곡 영상도 컬러 영상이다.

일 측면에 따르면, 왜곡 영상에 설정된 GT 영역은 실시간으로 생성되는 왜곡 영상 내의 오브젝트를 검출하기 위한 알고리즘을 훈련시키기 위해 이용될 수 있다.

비-왜곡 영역에 GT 영역을 설정하는 방법에 대해, 아래에서 도 9 및 11을 참조하여 상세히 설명된다.

도 7은 일 예에 따른 비-왜곡 영상의 GT 정보를 도시한다.

비-왜곡 영상(710) 내의 오브젝트(712)에 대한 영역(714)이 설정될 수 있다. 영역(714)는 GT 정보에 기초하여 설정된 영역일 수 있다. 예를 들어, GT 정보로서 외부로부터 수신된 코너점들에 기초하여 영역(714)이 설정될 수 있다. 영역(714)의 가장 자리 픽셀들이 결정될 수 있다. 비-왜곡 영상(710) 내에 복수의 오브젝트들이 존재하는 경우, 복수의 오브젝트들 각각에 대한 영역(714)이 설정될 수 있다.

도 8은 일 예에 따른 비-왜곡 영상 도메인에 설정된 제1 영역 및 왜곡 영상 도메인에 설정된 제2 영역을 도시한다.

GT 정보에 기초하여 비-왜곡 영상 도메인(810) 상에 제1 영역(814)이 설정될 수 있다. 예를 들어, 도 7을 참조하여 전술된 영역(714)에 대응하도록 제1 영역(814)이 설정될 수 있다.

비-왜곡 영상 도메인(810)을 왜곡시킴으로써 왜곡 영상 도메인(820)이 생성될 수 있다. 상기의 왜곡에 의해 비-왜곡 영상 도메인(810)의 제1 영역(814)은 왜곡 영상 도메인(823)의 제2 영역(824)로 변환된다. 일 측면에 따르면, 처리 속도를 높이기 위해 제1 영역(814)의 가장 자리 픽셀들 만을 왜곡시킴으로써 제2 영역(824)이 생성될 수 있다.

도 9는 일 예에 따른 제2 영역에 기초하여 GT 영역을 왜곡 영상에 설정하는 방법의 흐름도이다.

일 측면에 따르면, 도 6을 참조하여 전술된 단계(640)는 아래의 단계들(910 내지 930)을 포함할 수 있다.

단계(910)에서, 전자 장치(500)는 제2 영역(824)의 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀을 결정한다. 예를 들어, 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀은 제2 영역(824)의 가장 자리 픽셀들 중 결정될 수 있다. 왜곡 영상 도메인에 대한 픽셀 좌표계가 설정된 경우, 픽셀 좌표계에 기초하여 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀이 결정될 수 있다.

단계(920)에서, 전자 장치(500)는 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀에 기초하여 제1 타겟 픽셀 및 제2 타겟 픽셀을 결정한다. 예를 들어, 최상단 픽셀의 좌표가 (a, b)이고, 최하단 픽셀의 좌표가 (c, d)이고, 최좌측 픽셀의 좌표가 (e, f)이고, 최우측 픽셀의 좌표가 (g, h)인 경우, 제1 타겟 픽셀의 좌표가 (e, b)로 결정되고, 제2 타겟 픽셀의 좌표가 (g, d)로 결정될 수 있다. 제1 픽셀은 GT 영역의 좌측-상단 픽셀이고, 제2 픽셀은 GT 영역의 우측-하단 픽셀이다. 다른 예로, 제1 타겟 픽셀의 좌표가 (g, b)로 결정되고, 제2 타겟 픽셀의 좌표가 (e, d)로 결정될 수 있다. 제1 픽셀은 GT 영역의 우측-상단 픽셀이고, 제2 픽셀은 GT 영역의 좌측-하단 픽셀이다.

단계(930)에서, 전자 장치(500)는 제1 타겟 픽셀 및 제2 타겟 픽셀에 기초하여 왜곡 영상에 GT 영역을 설정한다. 설정된 GT 영역은 제1 타겟 픽셀 및 제2 타겟 픽셀을 코너점으로하는 사각형일 수 있다.

도 10은 일 예에 따른 제2 영역에 기초하여 왜곡 영상 도메인에 설정된 GT 영역을 도시한다.

왜곡 영상 도메인(820)의 제2 영역(824)의 픽셀들 중 최상단 픽셀(1011), 최하단 픽셀(1012), 최좌측 픽셀(1013) 및 최우측 픽셀(1014)이 결정된다.

결정된 최상단 픽셀(1011), 최하단 픽셀(1012), 최좌측 픽셀(1013) 및 최우측 픽셀(1014)에 기초하여 두 개의 코너점들이 결정될 수 있다. 예를 들어, 두 개의 코너점들은 설정될 GT 영역(1020)의 좌측-상단 픽셀(1021) 및 우측-하단 픽셀(1022)일 수 있다. 다른 예로, 두 개의 코너점들은 설정될 GT 영역(1020)의 우측-상단 픽셀(1032) 및 좌측-하단 픽셀(1031)일 수 있다.

결정된 두 개의 코너점들에 기초하여 GT 영역(1020)이 설정될 수 있다. GT 영역(1020)은 사각형일 수 있다. GT 영역(1020)은 왜곡 영상의 오브젝트를 검출하는 알고리즘을 훈련하기 위해 이용될 수 있다. 예를 들어, GT 영역(1020)이 오브젝트 영역으로 라벨링될 수 있다.

도 11은 일 예에 따른 왜곡 영상 및 왜곡 영상에 설정된 GT 영역을 도시한다.

일 측면에 따르면, 왜곡 영상(1110)에 GT 영역(1020)를 설정하기 위해 왜곡 영상(1110)이 미리 생성될 수 있다. 예를 들어, 비-왜곡 영상(710)에 기초하여 왜곡 영상(1110)이 생성될 수 있다. 왜곡 영상(1110)은 단계(640)가 수행되지 전에 수행될 수 있다.

왜곡 영상(1110)을 생성하기 위한 렌즈의 초점 거리(focal length) 및 렌즈의 반경(radius) 등은, 실제로 사용될 렌즈(예를 들어, 어안 렌즈)에 대응하도록 미리 설정되어 있을 수 있다. 예를 들어, f-theta 모델, equisolid 모델, 스테레오그래픽(stereographic) 모델, orthographic 모델, 다항(polynomial) 모델, 및 분할(division) 모델 중 적어도 하나를 비-왜곡 영상(710)에 적용함으로써 왜곡 영상(1110)이 생성될 수 있다.

도 6 내지 도 11을 참조하여 비-왜곡 영상 도메인을 이용하여 왜곡 영상의 GT 영역을 설정하는 방법에 대해 상세히 설명되었으나, 아래에서 도 12 내지 17을 참조하여 분할 영상의 비-왜곡 영상을 이용하여 왜곡 영상의 GT 영역을 설정하는 방법에 대해 상세히 설명된다.

도 12는 일 실시예에 따른 왜곡 분할 영상에 GT 영역을 설정하는 방법의 흐름도이다.

일 측면에 따르면, 아래의 단계들(1210 내지 1230)은 도 5를 참조하여 전술된 전자 장치(500)에 의해 수행될 수 있다.

단계(1210)에서, 전자 장치(500)는 영상 내의 오브젝트에 대한 클래스가 GT 정보로서 미리 라벨링된 비-왜곡 분할 영상을 수신한다. 예를 들어, 비-왜곡 분할 영상은 영상 내의 오브젝트의 종류에 따라 오브젝트에 대한 클래스가 라벨링되는 의미론적 분할(semantic segmentation) 영상일 수 있다. 의미론적 분할 영상에 대해, 도 11을 참조하여 상세히 설명된다. 다른 예로, 상기 비-왜곡 분할 영상은 영상 내의 개별 오브젝트에 대한 클래스가 라벨링되는 인스턴스 분할(instance segmentation) 영상일 수 있다. 인스턴스 분할에 대해, 도 15를 참조하여 상세히 설명된다.

단계(1220)에서, 전자 장치(500)는 비-왜곡 분할 영상에 기초하여 왜곡 분할 영상을 생성한다. 왜곡 분할 영상을 생성하기 위한 렌즈의 초점 거리 및 렌즈의 반경 등은, 실제로 사용될 렌즈(예를 들어, 어안 렌즈)에 대응하도록 미리 설정되어 있을 수 있다. 예를 들어, f-theta 모델, equisolid 모델, 스테레오그래픽 모델, orthographic 모델, 다항 모델, 및 분할 모델 중 적어도 하나를 비-왜곡 분할 영상에 적용함으로써 왜곡 분할 영상을 생성할 수 있다.

단계(1230)에서, 전자 장치(500)는 왜곡 분할 영상 내의 타겟 오브젝트의 타겟 클래스에 기초하여 타겟 오브젝트에 대한 GT 영역을 왜곡 분할 영상에 설정한다. 타겟 오브젝트에 대한 GT 영역을 왜곡 분할 영상에 설정하는 방법에 대해, 아래에서 도 15 및 16을 참조하여 상세히 설명된다.

도 13은 일 예에 따른 비-왜곡 영상 및 이에 대응하는 비-왜곡 분할 영상을 도시한다.

비-왜곡 영상(1310)은 컬러 영상이고, 비-왜곡 분할 영상(1320)은 비-왜곡 영상(1310)에 대응하는 분할 영상일 수 있다. 도시된 비-왜곡 분할 영상(1320)은 의미론적 분할(semantic segmentation) 영상이나, 인스턴스 분할 영상이 비-왜곡 분할 영상으로서 이용될 수도 있다.

비-왜곡 분할 영상(1320)은 서로 다른 종류의 오브젝트들에게 서로 다른 클래스들(1321, 1322, 1323, 및 1324)이 라벨링될 수 있다. 예를 들어, 서로 다른 차량들인 오브젝트들인 경우에도 종류가 차량으로서 동일하므로 동일한 클래스가 라벨링될 수 있다.

도 14는 일 예에 따른 비-왜곡 분할 영상에 기초하여 생성되는 왜곡 분할 영상을 도시한다.

비-왜곡 분할 영상의 오브젝트의 각각의 픽셀에 대해 클래스가 미리 설정되어 있으므로, 비-왜곡 분할 영상에 기초하여 생성된 왜곡 분할 영상의 픽셀에도 클래스가 여전히 설정되어 있다.

도 15는 일 예에 따른 왜곡 분할 영상의 타겟 클래스에 기초하여 왜곡 분할 영상에 GT 영역을 설정하는 방법의 흐름도이다.

일 측면에 따른, 도 12를 참조하여 전술된 단계(1230)는 아래의 단계들(1510 내지 1530)을 포함할 수 있다.

단계(1510)에서, 전자 장치(500)는 타겟 클래스를 갖는 픽셀들 중 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀을 결정한다. 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀에 대해 아래에서 도 16을 참조하여 전술된다.

단계(1520)에서, 전자 장치(500)는 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀에 기초하여 제1 타겟 픽셀 및 제2 타겟 픽셀을 결정한다. 예를 들어, 최상단 픽셀의 좌표가 (a, b)이고, 최하단 픽셀의 좌표가 (c, d)이고, 최좌측 픽셀의 좌표가 (e, f)이고, 최우측 픽셀의 좌표가 (g, h)인 경우, 제1 타겟 픽셀의 좌표가 (e, b)로 결정되고, 제2 타겟 픽셀의 좌표가 (g, d)로 결정될 수 있다. 제1 픽셀은 GT 영역의 좌측-상단 픽셀이고, 제2 픽셀은 GT 영역의 우측-하단 픽셀이다. 다른 예로, 제1 타겟 픽셀의 좌표가 (g, b)로 결정되고, 제2 타겟 픽셀의 좌표가 (e, d)로 결정될 수 있다. 제1 픽셀은 GT 영역의 우측-상단 픽셀이고, 제2 픽셀은 GT 영역의 좌측-하단 픽셀이다.

단계(1530)에서, 전자 장치(500)는 제1 타겟 픽셀 및 제2 타겟 픽셀에 기초하여 왜곡 분할 영상에 GT 영역을 설정한다. 설정된 GT 영역은 제1 타겟 픽셀 및 제2 타겟 픽셀을 코너점으로하는 사각형일 수 있다.

도 16은 일 예에 따른 왜곡 분할 영상의 타겟 클래스에 기초하여 왜곡 분할 영상에 설정된 GT 영역을 도시한다.

타겟 클래스(예를 들어, 차량)를 갖는 픽셀들 중 최상단 픽셀(1611), 최하단 픽셀(1612), 최좌측 픽셀(1613) 및 최우측 픽셀(1614)이 결정된다.

최상단 픽셀(1611), 최하단 픽셀(1612), 최좌측 픽셀(1613) 및 최우측 픽셀(1614)에 기초하여 두 개의 타겟 픽셀들이 결정될 수 있다. 예를 들어, 설정될 GT 영역(1630)의 좌측-상단 픽셀(1621) 및 우측-하단 픽셀(1622)이 타겟 픽셀들로 결정될 수 있다. 다른 예로, 설정될 GT 영역(1630)의 우측-상단 픽셀(1624) 및 좌측-하단 픽셀(1623)이 타겟 픽셀들로 결정될 수 있다.

결정된 두 개의 타겟 픽셀들을 코너점으로하는 GT 영역(1630)이 설정될 수 있다. GT 영역(1630)은 사각형일 수 있다.

도 17은 일 예에 다른 의미론적 분할 영상 및 인스턴스 분할 영상을 도시한다.

의미론적 분할 영상(1710)은 서로 다른 오브젝트들이 영상 내에 존재하는 경우에도, 검출된 오브젝트들이 동일한 클래스(예를 들어, 차량)라면, 오브젝트들에게 모두 동일한 클래스가 설정 또는 라벨링된다.

인스턴스 분할 영상(1720)은 영상 내에 검출된 오브젝트들의 각각에게 서로 다른 클래스들을 설정한다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.

500: 전자 장치
510: 통신부
520: 프로세서
530: 메모리

Claims

삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
전자 장치에 의해 수행되는, 왜곡 분할 영상 내에 오브젝트 검출을 위한 Ground Truth(GT) 영역을 설정하는 방법은,
영상 내의 오브젝트에 대한 클래스가 GT 정보로서 미리 라벨링된 비-왜곡 분할 영상을 수신하는 단계 - 상기 오브젝트를 구성하는 픽셀들 각각에 상기 오브젝트의 종류에 따라 상기 오브젝트에 대한 제1 클래스 및 상기 영상 내의 개별 오브젝트에 대한 제2 클래스가 미리 라벨링됨 -;
상기 비-왜곡 분할 영상에 기초하여 왜곡 분할 영상을 생성하는 단계; 및
상기 왜곡 분할 영상 내의 타겟 오브젝트의 타겟 클래스에 기초하여 상기 타겟 오브젝트에 대한 GT 영역을 상기 왜곡 분할 영상에 설정하는 단계
를 포함하는,
왜곡 분할 영상 내에 GT 영역 설정 방법.
제12항에 있어서,
상기 비-왜곡 분할 영상에 기초하여 왜곡 분할 영상을 생성하는 단계는,
상기 비-왜곡 분할 영상에 f-theta 모델, equisolid 모델, 스테레오그래픽(stereographic) 모델, orthographic 모델, 다항(polynomial) 모델, 및 분할(division) 모델 중 적어도 하나를 적용함으로써 상기 왜곡 분할 영상을 생성하는 단계
를 포함하는,
왜곡 분할 영상 내에 GT 영역 설정 방법.
제12항에 있어서,
상기 타겟 오브젝트에 대한 GT 영역을 상기 왜곡 분할 영상에 설정하는 단계는,
상기 타겟 클래스를 갖는 픽셀들 중 최상단 픽셀, 최하단 픽셀, 최좌측 픽셀 및 최우측 픽셀을 결정하는 단계;
상기 최상단 픽셀, 상기 최하단 픽셀, 상기 최좌측 픽셀 및 상기 최우측 픽셀에 기초하여 상기 GT 영역을 위한 제1 타겟 픽셀 및 제2 타겟 픽셀을 결정하는 단계; 및
상기 제1 타겟 픽셀 및 상기 제2 타겟 픽셀에 기초하여 상기 GT 영역을 설정하는 단계
를 포함하는,
왜곡 분할 영상 내에 GT 영역 설정 방법.
제14항에 있어서,
상기 제1 타겟 픽셀 및 상기 제2 타겟 픽셀에 기초하여 상기 GT 영역을 설정하는 단계는,
상기 제1 타겟 픽셀이 상기 GT 영역의 좌측-상단 픽셀이되고, 상기 제2 타겟 픽셀이 상기 GT 영역의 우측-하단 픽셀이 되도록 상기 GT 영역을 설정하는 단계
를 포함하는,
왜곡 분할 영상 내에 GT 영역 설정 방법.
삭제
삭제
제12항 내지 제15항 중 어느 한 항의 방법을 수행하는 프로그램을 수록한 컴퓨터 판독 가능 기록 매체.
왜곡 분할 영상 내에 오브젝트 검출을 위한 Ground Truth(GT) 영역을 설정하는 방법을 수행하는 전자 장치는,
왜곡 영상 내에 오브젝트 검출을 위한 GT 영역을 설정하는 프로그램이 기록된 메모리; 및
상기 프로그램을 수행하는 프로세서
를 포함하고,
상기 프로그램은,
영상 내의 오브젝트에 대한 클래스가 GT 정보로서 미리 라벨링된 비-왜곡 분할 영상을 수신하는 단계 - 상기 오브젝트를 구성하는 픽셀들 각각에 상기 오브젝트의 종류에 따라 상기 오브젝트에 대한 제1 클래스 및 상기 영상 내의 개별 오브젝트에 대한 제2 클래스가 미리 라벨링됨 -;
상기 비-왜곡 분할 영상에 기초하여 왜곡 분할 영상을 생성하는 단계; 및
상기 왜곡 분할 영상 내의 타겟 오브젝트의 타겟 클래스에 기초하여 상기 타겟 오브젝트에 대한 GT 영역을 상기 왜곡 분할 영상에 설정하는 단계
를 수행하는,
전자 장치.