WO2021187793A1

WO2021187793A1 - 카메라와 레이더 센서 융합 기반 3차원 객체 검출을 위한 전자 장치 및 그의 동작 방법

Info

Publication number: WO2021187793A1
Application number: PCT/KR2021/002916
Authority: WO
Inventors: 금동석; 김영석
Original assignee: 한국과학기술원
Priority date: 2020-03-17
Filing date: 2021-03-09
Publication date: 2021-09-23
Also published as: US20210295090A1; DE102021106518A1; KR102168753B1; US11754701B2

Abstract

다양한 실시예들에 따른 전자 장치 및 그의 동작 방법은, 카메라 모듈과 레이더 센서 융합 기반 3차원 객체 검출을 위한 것으로, 카메라 모듈을 통해 획득되는 제 1 센싱 데이터로부터 추출되는 제 1 특징 맵에서 제 1 관심 영역을 추출하고, 레이더 센서를 통해 획득되는 제 2 센싱 데이터로부터 추출되는 제 2 특징 맵에서 제 2 관심 영역을 추출하고, 제 1 관심 영역과 제 2 관심 영역을 융합하여 제 3관심 영역을 생성하고, 제 3 관심 영역을 기반으로, 3차원 객체를 검출하도록 구성될 수 있다.

Description

카메라와 레이더 센서 융합 기반 3차원 객체 검출을 위한 전자 장치 및 그의 동작 방법

다양한 실시예들은 카메라와 레이더 센서 융합 기반 3차원 객체 검출을 위한 전자 장치 및 그의 동작 방법에 관한 것이다.

최근, 자율 주행 및 첨단 운전자 지원 시스템(advanced driver assistance systems; ADAS)와 같은 지능형 차량 기술에 대한 연구가 활발히 진행되고 있다. 특히, 주행 중 차량 주변의 장애물 및 환경 인식을 위한 객체 인식 기술의 중요성이 대두되고 있다. 그런데, 단일 센서를 이용한 객체 인식 기술은 센서의 태생적 한계를 극복할 수 없기 때문에 높은 정확도를 기대하기 어려우며, 센서의 고장 등에 대처하기 어려운 문제점이 있다. 이러한 문제점을 극복하기 위해, 이종의 센서들을 이용한 객체 인식 기술이 개발되고 있다. 이종의 센서들을 이용한 객체 인식 기술에 따르면, 객체 인식 기술의 정확도를 높이기 위해, 센서들을 각각 이용하여 검출된 결과들을 비교하여 오류를 제거한다. 그러나, 이는 각 센서의 한계를 극복하는 것에 대해 고려하고 있지 않으므로, 객체 인식 기술의 정확도 향상 폭이 작다.

다양한 실시예들은, 객체 인식 기술의 정확도를 향상시킬 수 있는 전자 장치 및 그의 동작 방법을 제공한다.

다양한 실시예들은, 이종의 센서들을 이용한 객체 인식 기술을 제공할 수 있는 전자 장치 및 그의 동작 방법을 제공한다.

다양한 실시예들은, 각 센서의 한계를 극복하면서, 객체 인식 기술의 정확도를 향상시킬 수 있는 전자 장치 및 그의 동작 방법을 제공한다.

다양한 실시예들은, 카메라 모듈과 레이더 센서 융합 기반 3차원 객체 검출을 위한 전자 장치 및 그의 동작 방법을 제공한다.

다양한 실시예들에 따른 전자 장치의 동작 방법은, 제 1 센싱 데이터로부터 추출되는 제 1 특징 맵에서 제 1 관심 영역을 추출하는 동작, 제 2 센싱 데이터로부터 추출되는 제 2 특징 맵에서 제 2 관심 영역을 추출하는 동작, 상기 제 1 관심 영역과 상기 제 2 관심 영역을 융합하여 제 3관심 영역을 생성하는 동작, 및 상기 제 3 관심 영역을 기반으로, 3차원 객체를 검출하는 동작을 포함할 수 있다.

다양한 실시예들에 따른 전자 장치는, 메모리, 및 상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성된 프로세서를 포함하고, 상기 프로세서는, 제 1 센싱 데이터로부터 추출되는 제 1 특징 맵에서 제 1 관심 영역을 추출하고, 제 2 센싱 데이터로부터 추출되는 제 2 특징 맵에서 제 2 관심 영역을 추출하고, 상기 제 1 관심 영역과 상기 제 2 관심 영역을 융합하여 제 3관심 영역을 생성하고, 상기 제 3 관심 영역을 기반으로, 3차원 객체를 검출하도록 구성될 수 있다.

다양한 실시예들에 따른 비-일시적(non-transitory) 컴퓨터-판독 가능(computer-readable) 저장(storage) 매체(medium)는, 제 1 센싱 데이터로부터 추출되는 제 1 특징 맵에서 제 1 관심 영역을 추출하는 동작, 제 2 센싱 데이터로부터 추출되는 제 2 특징 맵에서 제 2 관심 영역을 추출하는 동작, 상기 제 1 관심 영역과 상기 제 2 관심 영역을 융합하여 제 3관심 영역을 생성하는 동작, 및 상기 제 3 관심 영역을 기반으로, 3차원 객체를 검출하는 동작을 실행하기 위한 하나 이상의 프로그램들을 저장할 수 있다.

다양한 실시예들에 따르면, 전자 장치는 제 1 센싱 데이터로부터 추출된 제 1 관심 영역과 제 2 센싱 데이터로부터 추출된 제 2 관심 영역을 융합하고, 이를 기반으로 3차원 객체를 검출할 수 있다. 즉 전자 장치는 제 1 센싱 데이터와 제 2 센싱 데이터를 전체적으로 융합하지 않고, 제 1 센싱 데이터와 제 2 센싱 데이터에서 서로 대응하는 제 1 관심 영역과 제 2 관심 영역을 융합할 수 있다. 이를 통해, 제 1 센싱 데이터 또는 제 2 센싱 데이터 중 적어도 어느 하나의 한계가 극복될 수 있으며, 나아가 3차원 객체를 검출하는 데 있어서 낮은 계산량으로도 향상된 정확도를 나타낼 수 있다. 예를 들면, 제 1 센싱 데이터가 카메라 모듈로부터 획득되고, 제 2 센싱 데이터가 레이더 센서 또는 라이다 센서 중 적어도 어느 하나를 포함하는 센서 모듈로부터 획득되는, 카메라 모듈 또는 센서 모듈 중 적어도 어느 하나의 한계를 극복하면서, 3차원 객체를 검출하는 데 있어서의 정확도와 신뢰도가 향상될 수 있다. 이에 따라, 전자 장치를 구비하는 차량이 다양한 상황에 유연하게 대처할 수 있으므로, 차량에 대한 신뢰도 및 안정성이 향상될 수 있다.

도 1은 다양한 실시예들에 따른 전자 장치를 도시하는 도면이다.

도 2는 도 1의 프로세서를 도시하는 도면이다.

도 3, 도 4, 도 5 및 도 6은 다양한 실시예들에 따른 전자 장치의 동작 흐름을 설명하기 위한 도면이다.

도 7은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시하는 도면이다.

도 8은 도 7의 제 1 관심 영역 및 제 2 관심 영역 융합 동작을 도시하는 도면이다.

도 9는 다양한 실시예들에 따른 전자 장치의 동작 효과를 설명하기 위한 도면들이다.

이하, 본 문서의 다양한 실시예들이 첨부된 도면을 참조하여 설명된다.

도 1은 다양한 실시예들에 따른 전자 장치(100)를 도시하는 도면이다. 도 2는 도 1의 프로세서(180)를 도시하는 도면이다. 도 3, 도 4, 도 5 및 도 6은 다양한 실시예들에 따른 전자 장치(100)의 동작 흐름을 설명하기 위한 도면이다.

도 1을 참조하면, 다양한 실시예들에 따른 전자 장치(100)는 카메라 모듈(110), 센서 모듈(120), 통신 모듈(130), 입력 모듈(140), 출력 모듈(150), 구동 모듈(160), 메모리(170) 또는 프로세서(180) 중 적어도 어느 하나를 포함할 수 있다. 어떤 실시예에서는 전자 장치(100)의 구성 요소들 중 적어도 어느 하나가 생략되거나, 전자 장치(100)에 하나 이상의 다른 구성 요소들이 추가될 수 있다. 일 실시예에 따르면, 전자 장치(100)는 자율 주행 차량일 수 있다. 다른 실시예에 따르면, 전자 장치(100)는 차량에 장착되어, 자율 주행 차량을 구현할 수 있다. 또 다른 실시예에 따르면, 전자 장치(100)는 감시 시스템일 수 있다.

카메라 모듈(110)은 전자 장치(100)의 외부 영상을 촬영할 수 있다. 이 때 카메라 모듈(110)은 전자 장치(100)의 미리 정해진 위치에 설치되어, 외부 영상을 촬영할 수 있다. 그리고 카메라 모듈(110)은 전자 장치(100)의 외부 영상에 대한 영상 데이터를 생성할 수 있다. 예를 들면, 카메라 모듈(110)은 렌즈, 적어도 하나의 이미지 센서, 이미지 시그널 프로세서 또는 플래시 중 적어도 어느 하나를 포함할 수 있다. 일 예로, 카메라 모듈(110)은 RGB 카메라일 수 있다. 다른 예로, 카메라 모듈(110)은 적외선 카메라일 수 있다.

센서 모듈(120)은 전자 장치(100)의 상태 또는 전자 장치(100)의 외부 환경을 감지할 수 있다. 그리고 센서 모듈(120)은 전자 장치(100)의 상태 또는 전자 장치(100)의 외부 환경에 대한 센싱 데이터를 생성할 수 있다. 예를 들면, 센서 모듈(120)은 가속도 센서, 자이로스코프(gyroscope) 센서, 이미지 센서, 레이더(RADAR) 센서, 라이다(LiDAR) 센서 또는 초음파 센서 중 적어도 어느 하나를 포함할 수 있다.

통신 모듈(130)은 전자 장치(100)와 외부 장치(미도시) 간 통신을 지원할 수 있다. 이 때 통신 모듈(130)은 무선 통신 모듈 또는 유선 통신 모듈 중 적어도 어느 하나를 포함할 수 있다. 일 실시예에 따르면, 무선 통신 모듈은 원거리 통신 방식 또는 근거리 통신 방식 중 적어도 어느 하나를 지원할 수 있다. 근거리 통신 방식은, 예컨대 블루투스(Bluetooth), 와이파이 다이렉트(WiFi direct), 또는 적외선 통신(IrDA; infrared data association) 중 적어도 어느 하나를 포함할 수 있다 무선 통신 방식은 네트워크를 통해 원거리 통신 방식으로 통신할 수 있으며, 네트워크는, 예컨대 셀룰러 네트워크, 인터넷, 또는 LAN(local area network)이나 WAN(wide area network)과 같은 컴퓨터 네트워크 중 적어도 어느 하나를 포함할 수 있다. 다른 실시예에 따르면, 무선 통신 모듈은 GNSS(global navigation satellite system)와의 통신을 지원할 수 있다. 일 예로, GNSS는 GPS(global positioning system)를 포함할 수 있다.

입력 모듈(140)은 전자 장치(100)의 구성 요소들 중 적어도 어느 하나에 사용될 명령 또는 데이터를 전자 장치(100)의 외부로부터 수신할 수 있다. 예를 들면, 입력 모듈(140)은 마이크(microphone), 마우스 또는 키보드 중 적어도 어느 하나를 포함할 수 있다. 어떤 실시예에서, 입력 모듈은 터치를 감지하도록 설정된 터치 회로(touch circuitry) 또는 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 센서 회로 중 적어도 어느 하나를 포함할 수 있다.

출력 모듈(150)은 전자 장치(100)의 외부로 정보를 제공할 수 있다. 이 때 출력 모듈(150)은 표시 모듈 또는 오디오 모듈 중 적어도 어느 하나를 포함할 수 있다. 표시 모듈은 정보를 시각적으로 출력할 수 있다. 예를 들면, 표시 모듈은 디스플레이, 홀로그램 장치, 또는 프로젝터 중 적어도 어느 하나를 포함할 수 있다. 어떤 실시예에서, 표시 모듈은 입력 모듈(140)의 터치 회로 또는 센서 회로 중 적어도 어느 하나와 조립되어, 터치 스크린으로 구현될 수 있다. 오디오 모듈은 정보를 소리로 출력할 수 있다. 예를 들면, 오디오 모듈은 스피커 또는 리시버 중 적어도 어느 하나를 포함할 수 있다.

구동 모듈(160)은 전자 장치(100)의 동작을 위해 구동할 수 있다. 일 실시예에 따르면, 전자 장치(100)가 자율 주행 차량인 경우, 구동 모듈(160)은 각종 부품들을 포함할 수 있다. 다른 실시예에 따르면, 전자 장치(100)가 차량에 장착되어, 자율 주행 차량을 구현하는 경우, 구동 모듈(160)은 차량의 각종 부품들과 연결될 수 있다. 이를 통해, 구동 모듈(160)은 부품들 중 적어도 어느 하나를 제어하면서, 구동할 수 있다. 예를 들면, 부품들은 엔진 모듈, 가속 모듈, 브레이킹 모듈, 조향 모듈 또는 네비게이션 모듈 중 적어도 어느 하나를 포함할 수 있다.

메모리(170)는 전자 장치(100)의 구성 요소들 중 적어도 어느 하나에 의해 사용되는 프로그램 또는 데이터 중 적어도 어느 하나를 저장할 수 있다. 예를 들면, 메모리(170)는 휘발성 메모리 또는 비휘발성 메모리 중 적어도 어느 하나를 포함할 수 있다.

프로세서(180)는 메모리(170)의 프로그램을 실행하여, 전자 장치(100)의 구성 요소들 중 적어도 어느 하나를 제어할 수 있고, 데이터 처리 또는 연산을 수행할 수 있다. 프로세서(180)는 전자 장치(100)의 주변 환경에 대한 정보를 수집할 수 있다. 이 때 프로세서(180)는 제 1 센싱 데이터 및 제 2센싱 데이터를 획득할 수 있다. 프로세서(180)는 전자 장치(100)의 주변 환경에 대한 정보를 기반으로, 전자 장치(100)의 주변 환경에서의 3차원 객체를 인식할 수 있다. 이 때 프로세서(180)는 제 1 센싱 데이터 및 제 2 센싱 데이터를 기반으로, 3차원 객체를 검출할 수 있다. 이를 통해, 프로세서(180)는 전자 장치(100)의 주변 환경에서의 3차원 객체를 기반으로, 전자 장치(100)의 동작을 제어할 수 있다. 이를 위해, 프로세서(180)는 구동 모듈(160)을 제어할 수 있다. 예를 들면, 프로세서(180)는, 도 2에 도시된 바와 같이 제 1 특징 맵 추출 모듈(210), 제 2 특징 맵 추출 모듈(220), 관심 영역 추출 모듈(230), 관심 영역 융합 모듈(240) 및 3차원 객체 검출 모듈(250)을 포함할 수 있다.

프로세서(180)는 제 1 센싱 데이터(311)로부터 제 1 특징 맵(313)을 추출할 수 있다. 제 1 센싱 데이터(311)는 카메라 모듈(110)을 통해 획득되는 영상 데이터를 포함할 수 있다. 이 때 제 1 센싱 데이터(311)는 제 1 해상도 및 제 1 좌표계를 가지며, 제 1 특징 맵(313)도 제 1 해상도 및 제 1 좌표계를 가질 수 있다. 예를 들면, 제 1 특징 맵 추출 모듈(210)은, 도 3에 도시된 바와 같이 제 1 센싱 데이터(311)로부터 제 1 특징 맵(313)을 추출할 수 있다. 제 1 특징 맵 추출 모듈(210)은, 예컨대 콘볼루션 신경망(convolutional neural network; CNN) 또는 경사지향 히스토그램(histograms of oriented gradients; HOG) 중 적어도 어느 하나를 이용할 수 있다.

프로세서(180)는 제 2 센싱 데이터(321)로부터 제 2 특징 맵(323)을 추출할 수 있다. 제 2 센싱 데이터(321)는 센서 모듈(120)을 통해 획득되는 센싱 데이터를 포함할 수 있다. 예를 들면, 제 2 센싱 데이터(321)는 레이더 센서 또는 라이더 센서 중 적어도 어느 하나를 통해 획득되는 포인트 클라우드(point cloud) 데이터를 포함할 수 있다. 이 때 제 2 센싱 데이터(321)는 제 2 해상도 및 제 2 좌표계를 가지며, 제2 특징 맵(323)도 제 2 해상도 및 제 2 좌표계를 가질 수 있다. 예를 들면, 제 2 특징 맵 추출 모듈(220)은, 도 3에 도시된 바와 같이 제 2 센싱 데이터(321)로부터 제 2 특징 맵(323)을 추출할 수 있다. 제 2 특징 맵 추출 모듈(220)은, 예컨대 콘볼루션 신경망(CNN) 또는 경사지향 히스토그램(HOG) 중 적어도 어느 하나를 이용할 수 있다.

프로세서(180)는 제 1 특징 맵(313)과 제 2 특징 맵(323)에서 서로 대응하는 관심 영역(region of interest; RoI)(331, 333)들, 즉 제 1 관심 영역(331)과 제 2 관심 영역(333)을 각각 추출할 수 있다. 여기서, 제 1 관심 영역(331)과 제 2 관심 영역(333)은 동일한 사이즈로 이루어질 수 있다. 예를 들면, 관심 영역 추출 모듈(230)은, 도 3에 도시된 바와 같이 제 1특징 맵(313)에서 제 1 관심 영역(331)을 추출하고, 제 2 특징 맵(323)에서 제 2 관심 영역(333)을 추출할 수 있다. 관심 영역 추출 모듈(230)은, 도 3 또는 도 4에 도시된 바와 같이 투영 행렬(projection matrix)을 이용하여, 3차원 박스(3D box)(330)를 제 1 센싱 데이터(311)의 제 1 좌표계로 투영(projection)함으로써, 제 1 특허 맵(313)에서 제 1 관심 영역(331)을 추출할 수 있다. 이를 통해, 관심 영역 추출 모듈(230)은 제 1 센싱 데이터(311)의 제 1 좌표계와 관계 없이, 제 1 관심 영역(331)을 추출할 수 있다. 이와 마찬가지로, 관심 영역 추출 모듈(230)은, 도 3 또는 도 4에 도시된 바와 같이 투영 행렬을 이용하여, 3차원 박스(330)를 제 2 센싱 데이터(321)의 제 2 좌표계로 투영함으로써, 제 2 특허 맵(323)에서 제 2 관심 영역(333)을 추출할 수 있다. 이를 통해, 관심 영역 추출 모듈(230)은 제 2 센싱 데이터(321)의 제 2 좌표계와 관계 없이, 제 2 관심 영역(333)을 추출할 수 있다. 여기서, 관심 영역 추출 모듈(230)은, 하기 [수학식 1]과 같이 투영 행렬을 이용하여, 3차원 박스(330)를 제 1 센싱 데이터(311)의 제 1 좌표계 또는 제 2 센싱 데이터(321)의 제 2 좌표계로 투영할 수 있다.

프로세서(180)는 제 1 관심 영역(331)과 제 2 관심 영역(333)을 하나, 즉 제 3 관심 영역(340)으로 융합할 수 있다. 여기서, 제 3 관심 영역(340)은 제 1 관심 영역(331) 및 제 2 관심 영역(333)과 동일한 사이즈로 형성될 수 있다. 예를 들면, 관심 영역 융합 모듈(240)은, 도 3 또는 도 4에 도시된 바와 같이 제 1 관심 영역(331)과 제 2 관심 영역(333)을 융합하여, 제 3 관심 영역(340)을 생성할 수 있다. 관심 영역 융합 모듈(240)은, 예컨대 병합(concatenation) 연산, 합(addition) 연산 또는 평균(mean) 연산 중 적어도 어느 하나를 이용할 수 있다. 여기서, 관심 영역 융합 모듈(240)은, 하기 [수학식 2]와 같이 관심 영역(f ^Mi)(331, 333)들에 대한 가중치(w ^Mi)(531, 533)들을 각각 부여하고, 이를 기반으로 제 1 관심 영역(331)과 제 2 관심 영역(333)을 융합할 수 있다. 일 예로, 가중치(w ^Mi)(531, 533)들이 1이면, 관심 영역 융합 모듈(240)은 제 1 관심 영역(331)과 제 2 관심 영역(333)의 합으로 제 3 관심 영역(340)을 생성하고, 가중치(w ^Mi)(531, 533)들이 0.5이면, 관심 영역 융합 모듈(240)은 제 1 관심 영역(331)과 제 2 관심 영역(333)의 평균으로 제 3 관심 영역(340)을 생성할 수 있다. 다른 예로, 각 관심 영역(f ^Mi)(331, 333)의 데이터 상태가 좋을수록, 각 가중치가 1에 가깝게 부여되고, 각 관심 영역(f ^Mi)(331, 333)의 데이터 상태가 나쁠수록, 각 가중치가 0에 가깝게 부여될 수 있다.

일 실시예에 따르면, 관심 영역 융합 모듈(240)은, 도 5에 도시된 바와 같이 제 1 관심 영역(331)과 제 2 관심 영역(333)에 대한 제 1 가중치(531)와 제 2 가중치(533)를 기반으로, 제 1 관심 영역(331)과 제 2 관심 영역(333)으로부터 제 3 관심 영역(340)을 생성할 수 있다. 이를 위해, 제 1 관심 영역(331)과 제 2 관심 영역(333)에 대한 제 1 가중치(531)와 제 2 가중치(533)를 각각 계산할 수 있다. 여기서, 관심 영역 융합 모듈(240)은 예컨대 콘볼루션 신경망(CNN), 다층 퍼셉트론(MLP), 회귀 분석 또는 서포트 벡터 머신(SVM) 중 적어도 어느 하나를 통해, 제 1 관심 영역(331)과 제 2 관심 영역(333)의 병합으로부터 제 1 가중치(531)와 제 2 가중치(533)를 각각 계산할 수 있다. 일 예로, 제 1 관심 영역(331)의 데이터 상태가 나쁘면, 제 1 가중치(531)가 낮게 결정되고, 제 1 관심 영역(331)의 데이터 상태가 좋으면, 제 1 가중치(531)가 높게 결정될 수 있다. 이와 마찬가지로, 제 2 관심 영역(333)의 데이터 상태가 나쁘면, 제 2 가중치(533)가 낮게 결정되고, 제 2 관심 영역(333)의 데이터 상태가 좋으면, 제 2 가중치(533)가 높게 결정될 수 있다. 그리고, 관심 영역 융합 모듈(240)은, 제 1 관심 영역(331)에 제 1 가중치(531)를 곱하여, 제 1 가중 영역을 획득하고, 제 2 관심 영역(333)에 제 2 가중치(533)를 곱하여, 제 2 가중 영역을 획득할 수 있다. 이를 통해, 관심 영역 융합 모듈(240)은 제 1 가중 영역과 제 2 가중 영역의 합을 제 1 가중치(531)와 제 2 가중치(533)의 합으로 나눔으로써, 제 3 관심 영역(340)을 생성할 수 있다.

프로세서(180)는 제 3 관심 영역(340)을 기반으로, 3차원 객체(350)를 검출할 수 있다. 예를 들면, 3 차원 객체 검출 모듈(250)은, 도 3 또는 도 4에 도시된 바와 같이 제 3 관심 영역(340)을 기반으로, 3차원 객체(350)를 검출할 수 있다. 3 차원 객체 검출 모듈(250)은, 예컨대 콘볼루션 신경망(CNN), 다층 퍼셉트론(multi-layer perceptron; MLP), 회귀 분석(regression) 또는 서포트 벡터 머신(support vector machine; SVM) 중 적어도 어느 하나를 이용할 수 있다. 이 때 3차원 객체 검출 모듈(250)은 3차원 객체(350)에 대한 정보를 검출할 수 있다. 3차원 객체(350)에 대한 정보는, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률, 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 포함할 수 있다. 여기서, 3차원 객체 검출 모듈(250)은, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률을 검출할 수 있다. 그리고, 3차원 객체 검출 모듈(250)은, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률을 기반으로, 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 검출할 수 있다. 일 예로, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률이 미리 정해진 임계값을 초과하면, 3차원 객체 검출 모듈(250)이 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 검출할 수 있다.

이를 통해, 전자 장치(100)는 3차원 객체(350)에 대한 정보를 출력할 수 있다. 일 예로, 프로세서(180)는 출력 모듈(150)을 통해, 도 6의 (a) 또는 (b)에 도시된 바와 같이 제 1 센싱 데이터(311), 예컨대 영상 데이터에 3차원 객체(350)를 둘러싸는 3차원 셀(650)을 표시할 수 있다. 여기서, 3차원 셀(650)의 위치와 크기는 3차원 객체(350)의 위치와 크기를 각각 나타낼 수 있다. 다른 예로, 프로세서(180)는 통신 모듈(130)을 통해 3차원 객체(350)에 대한 정보를 외부 장치로 전송할 수 있다.

도 7은 다양한 실시예들에 따른 전자 장치(100)의 동작 방법을 도시하는 도면이다.

도 7을 참조하면, 전자 장치(100)는 710 동작에서 이종의 센싱 데이터(311, 321)를 기반으로, 제 1 특징 맵(313) 및 제 2 특징 맵(323)을 추출할 수 있다. 프로세서(180)는 제 1 센싱 데이터(311)와 제 2 센싱 데이터(321)를 획득할 수 있다. 제 1 센싱 데이터(311)는 카메라 모듈(110)을 통해 획득되는 영상 데이터를 포함할 수 있다. 이 때 제 1 센싱 데이터(311)는 제 1 해상도 및 제 1 좌표계를 가질 수 있다. 제 2 센싱 데이터(321)는 센서 모듈(120)을 통해 획득되는 센싱 데이터를 포함할 수 있다. 예를 들면, 제 2 센싱 데이터(321)는 레이더 센서 또는 라이더 센서 중 적어도 어느 하나를 통해 획득되는 포인트 클라우드(point cloud) 데이터를 포함할 수 있다. 이 때 제 2 센싱 데이터(321)는 제 2 해상도 및 제 2 좌표계를 가질 수 있다. 이 후, 프로세서(180)는 제 1 센싱 데이터(311)와 제 2 센싱 데이터(321)로부터 제 1 특징 맵(313)과 제 2 특징 맵(323)을 각각 추출할 수 있다. 예를 들면, 제 1 특징 맵 추출 모듈(210)은, 도 3에 도시된 바와 같이 제 1 센싱 데이터(311)로부터 제 1 특징 맵(313)을 추출하고, 제 2 특징 맵 추출 모듈(220)은, 도 3에 도시된 바와 같이 제 2 센싱 데이터(321)로부터 제 2 특징 맵(323)을 추출할 수 있다. 이 때 제 1 특징 맵(313)은 제 1 해상도 및 제 1 좌표계를 가지며, 제2 특징 맵(323)은 제 2 해상도 및 제 2 좌표계를 가질 수 있다. 제 1 특징 맵 추출 모듈(210) 및 제 2 특징 맵 추출 모듈(220)은, 예컨대 콘볼루션 신경망(CNN) 또는 경사지향 히스토그램(HOG) 중 적어도 어느 하나를 이용하여, 제 1 특징 맵(313) 및 제 2 특징 맵(323)을 각각 추출할 수 있다.

전자 장치(100)는 720 동작에서 제 1 특징 맵(313)과 제 2 특징 맵(323)에서 제 1 관심 영역(331) 및 제 2 관심 영역(333)을 각각 추출할 수 있다. 프로세서(180)는, 도 3에 도시된 바와 같이 제 1특징 맵(313)에서 제 1 관심 영역(331)을 추출하고, 제 2 특징 맵(323)에서 제 2 관심 영역(333)을 추출할 수 있다. 여기서, 제 1 관심 영역(331)과 제 2 관심 영역(333)은 동일한 사이즈로 이루어질 수 있다. 관심 영역 추출 모듈(230)은, 도 3 또는 도 4에 도시된 바와 같이 투영 행렬을 이용하여, 3차원 박스(330)를 제 1 센싱 데이터(311)의 제 1 좌표계로 투영함으로써, 제 1 특허 맵(313)에서 제 1 관심 영역(331)을 추출할 수 있다. 이를 통해, 관심 영역 추출 모듈(230)은 제 1 센싱 데이터(311)의 제 1 좌표계와 관계 없이, 제 1 관심 영역(331)을 추출할 수 있다. 이와 마찬가지로, 관심 영역 추출 모듈(230)은, 도 3 또는 도 4에 도시된 바와 같이 투영 행렬을 이용하여, 3차원 박스(330)를 제 2 센싱 데이터(321)의 제 2 좌표계로 투영함으로써, 제 2 특허 맵(323)에서 제 2 관심 영역(333)을 추출할 수 있다. 이를 통해, 관심 영역 추출 모듈(230)은 제 2 센싱 데이터(321)의 제 2 좌표계와 관계 없이, 제 2 관심 영역(333)을 추출할 수 있다.

전자 장치(100)는 730 동작에서 제 1 관심 영역(331) 및 제 2 관심 영역(333)을 융합할 수 있다. 프로세서(180)는 제 1 관심 영역(331)과 제 2 관심 영역(333)을 제 3 관심 영역(340)으로 융합할 수 있다. 여기서, 제 3 관심 영역(340)은 제 1 관심 영역(331) 및 제 2 관심 영역(333)과 동일한 사이즈로 형성될 수 있다. 예를 들면, 관심 영역 융합 모듈(240)은, 도 3 또는 도 4에 도시된 바와 같이 제 1 관심 영역(331)과 제 2 관심 영역(333)을 융합하여, 제 3 관심 영역(340)을 생성할 수 있다. 관심 영역 융합 모듈(240)은, 예컨대 병합 연산, 합 연산 또는 평균 연산 중 적어도 어느 하나를 이용할 수 있다. 일 실시예에 따르면, 관심 영역 융합 모듈(240)은, 제 1 관심 영역(331)과 제 2 관심 영역(333)에 제 1 가중치(351)와 제 2 가중치(353)를 각각 부여하고, 이를 기반으로 제 1 관심 영역(331)과 제 2 관심 영역(333)을 융합할 수 있다. 이에 대해, 도 8을 참조하여, 후술될 것이다.

도 8을 참조하면, 전자 장치(100)는 810 동작에서 제 1 관심 영역(331) 및 제 2 관심 영역(333)을 병합할 수 있다. 그리고, 전자 장치(100)는 820 동작에서 제 1 관심 영역(331)에 대한 제 1 가중치(531) 및 제 2 관심 영역(333)에 대한 제 2 가중치(533)를 계산할 수 있다. 프로세서(180)는 제 1 관심 영역(331)과 제 2 관심 영역(333)의 병합으로부터 제 1 가중치(531)와 제 2 가중치(533)를 각각 계산할 수 있다. 예를 들면, 관심 영역 융합 모듈(240)은 예컨대 콘볼루션 신경망(CNN), 다층 퍼셉트론(MLP), 회귀 분석 또는 서포트 벡터 머신(SVM) 중 적어도 어느 하나를 통해, 제 1 관심 영역(331)과 제 2 관심 영역(333)의 병합으로부터 제 1 가중치(531)와 제 2 가중치(533)를 각각 계산할 수 있다. 일 예로, 제 1 관심 영역(331)의 데이터 상태가 나쁘면, 제 1 가중치(531)가 낮게 결정되고, 제 1 관심 영역(331)의 데이터 상태가 좋으면, 제 1 가중치(531)가 높게 결정될 수 있다. 이와 마찬가지로, 제 2 관심 영역(333)의 데이터 상태가 나쁘면, 제 2 가중치(533)가 낮게 결정되고, 제 2 관심 영역(333)의 데이터 상태가 좋으면, 제 2 가중치(533)가 높게 결정될 수 있다.

전자 장치(100)는, 830 동작에서 제 1 가중치(531)가 곱해진 제 1 관심 영역(331)과 제 2 가중치(533)가 곱해진 제 2 관심 영역(333)의 합을 계산할 수 있다. 프로세서(180)는 제 1 관심 영역(331)에 제 1 가중치(531)를 곱하여, 제 1 가중 영역을 획득하고, 제 2 관심 영역(333)에 제 2 가중치(533)를 곱하여, 제 2 가중 영역을 획득할 수 있다. 그리고, 프로세서(180)는 제 1 가중 영역과 제 2가중 영역의 합을 계산할 수 있다.

전자 장치(100)는 840 동작에서 제 1 가중치(531)와 제 2 가중치(533)의 합을 기반으로, 제 1 관심 영역(331)과 제 2 관심 영역(333)의 평균을 계산할 수 있다. 프로세서(180)는 제 1 가중 영역과 제 2 가중 영역의 합을 제 1 가중치(531)와 제 2 가중치(533)의 합으로 나눌 수 있다. 이를 통해, 프로세서(180)는 제 3 관심 영역(340)을 생성할 수 있다. 이 후, 전자 장치(100)는 도 7로 리턴하여, 740 동작으로 진행할 수 있다.

다시 도 7을 참조하면, 전자 장치(100)는 740 동작에서 제 3 관심 영역(340)을 기반으로, 3차원 객체(350)를 검출할 수 있다. 프로세서(180)는, 도 3 또는 도 4에 도시된 바와 같이 제 3 관심 영역(340)을 기반으로, 3차원 객체(350)를 검출할 수 있다. 이 때 3차원 객체 검출 모듈(250)은 3차원 객체(350)에 대한 정보를 검출할 수 있다. 3 차원 객체 검출 모듈(250)은, 예컨대 콘볼루션 신경망(CNN), 다층 퍼셉트론(MLP), 회귀 분석 또는 서포트 벡터 머신(SVM) 중 적어도 어느 하나를 이용할 수 있다. 3차원 객체(350)에 대한 정보는, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률, 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 포함할 수 있다. 여기서, 3차원 객체 검출 모듈(250)은, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률을 검출할 수 있다. 그리고, 3차원 객체 검출 모듈(250)은, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률을 기반으로, 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 검출할 수 있다. 일 예로, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률이 미리 정해진 임계값을 초과하면, 3차원 객체 검출 모듈(250)이 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 검출할 수 있다.

다양한 실시예들에 따르면, 전자 장치(100)는 제 1 센싱 데이터(311) 로부터 추출된 제 1 관심 영역(331)과 제 2 센싱 데이터(321)로부터 추출된 제 2 관심 영역(333)을 융합하고, 이를 기반으로 3차원 객체(350)를 검출할 수 있다. 즉 전자 장치(100)는 제 1 센싱 데이터(311)와 제 2 센싱 데이터(321)를 전체적으로 융합하지 않고, 제 1 센싱 데이터(311)와 제 2 센싱 데이터(321)에서 서로 대응하는 제 1 관심 영역(331)과 제 2 관심 영역(333)을 융합할 수 있다. 이를 통해, 제 1 센싱 데이터(311) 또는 제 2 센싱 데이터(313) 중 적어도 어느 하나의 한계가 극복될 수 있으며, 나아가 3차원 객체(350)를 검출하는 데 있어서 낮은 계산량으로도 향상된 정확도를 나타낼 수 있다. 예를 들면, 제 1 센싱 데이터(311)가 카메라 모듈(110)로부터 획득되고, 제 2 센싱 데이터(321)가 레이더 센서 또는 라이다 센서 중 적어도 어느 하나를 포함하는 센서 모듈(120)로부터 획득되는, 카메라 모듈(110) 또는 센서 모듈(120) 중 적어도 어느 하나의 한계를 극복하면서, 3차원 객체(350)를 검출하는 데 있어서의 정확도와 신뢰도가 향상될 수 있다. 이에 따라, 전자 장치(100)를 구비하는 차량이 다양한 상황에 유연하게 대처할 수 있으므로, 차량에 대한 신뢰도 및 안정성이 향상될 수 있다. 도 9는 다양한 실시예들에 따른 전자 장치(100)의 동작 효과를 설명하기 위한 도면들이다.

도 9를 참조하면, 다양한 실시예들에 따른 전자 장치(100)의 정밀도 및 재현율은, 기존 단일 센서를 사용하는 기술들의 정밀도 및 재현율과 비교하여 우수하다. 즉 다양한 실시예들에 따른 전자 장치(100)는 카메라 모듈(110)과 센서 모듈(120)을 이용하여 동작함으로써, 기존의 기술들과 비교하여, 3차원 객체(350)를 검출하는 데 있어서의 정확도와 신뢰도가 향상될 수 있다.

다양한 실시예들에 따른 전자 장치(100)의 동작 방법은, 제 1 센싱 데이터(311)로부터 추출되는 제 1 특징 맵(313)에서 제 1 관심 영역(331)을 추출하는 동작, 제 2 센싱 데이터(321)로부터 추출되는 제 2 특징 맵(323)에서 제 2 관심 영역(333)을 추출하는 동작, 제 1 관심 영역(331)과 제 2 관심 영역(333)을 융합하여 제 3 관심 영역(340)을 생성하는 동작, 및 제 3 관심 영역(340)을 기반으로, 3차원 객체(350)를 검출하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 제 1 센싱 데이터(311)는 카메라 모듈로부터 획득되는 영상 데이터를 포함하고, 제 2 센싱 데이터(321)는 레이더 센서 또는 라이다 센서 중 적어도 어느 하나로부터 획득되는 포인트 클라우드 데이터를 포함할 수 있다.

다양한 실시예들에 따르면, 제 1 관심 영역(331)을 추출하는 동작은, 투영 행렬을 이용하여, 3차원 박스(330)를 제 1 센싱 데이터(311)의 제 1 좌표계로 투영함으로써, 제 1 특징 맵(313)에서 제 1 관심 영역(331)을 추출하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 제 2 관심 영역(333)을 추출하는 동작은, 투영 행렬을 이용하여, 3차원 박스(330)를 제 2 센싱 데이터(321)의 제 2좌표계로 투영함으로써, 제 2 특징 맵(323)에서 제 2 관심 영역(333)을 추출하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 제 3 관심 영역(340)을 생성하는 동작은, 제 1 관심 영역(331)과 제 2 관심 영역(333)에 대한 제 1 가중치(531)와 제 2 가중치(533)를 각각 계산하는 동작, 및 제 1 가중치(531)와 제 2 가중치(533)를 기반으로, 제 1 관심 영역(331)과 제 2 관심 영역(333)으로부터 제 3 관심 영역(340)을 생성하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 제 1 가중치(531)와 제 2 가중치(533)를 기반으로, 제 3 관심 영역(340)을 생성하는 동작은, 제 1 관심 영역(331)에 제 1 가중치(531)를 곱하여, 제 1 가중 영역을 획득하는 동작, 제 2 관심 영역(333)에 제 2 가중치(533)를 곱하여, 제 2가중 영역을 획득하는 동작, 및 제 1 가중 영역과 제 2 가중 영역의 합을 제 1 가중치(531)와 제 2 가중치(533)의 합으로 나눔으로써, 제 3 관심 영역(340)을 생성하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 제 1 가중치(531)와 제 2 가중치(533)를 계산하는 동작은, 예컨대 콘볼루션 신경망, 다층 퍼셉트론, 회귀 분석 또는 서포트 벡터 머신 중 적어도 어느 하나를 통해, 제 1 관심 영역(331)과 제 2 관심 영역(333)의 병합으로부터 제 1 가중치(531)와 제 2 가중치(533)를 각각 계산하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 3차원 객체(350)를 검출하는 동작은, 3차원 객체(350)에 대한 정보를 검출하는 동작을 포함하고, 3차원 객체(350)에 대한 정보는 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 포함할 수 있다.

다양한 실시예들에 따르면, 3차원 객체(350)를 검출하는 동작은, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률을 검출하는 동작, 및 확률을 기반으로, 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 검출하는 동작을 포함하고, 3차원 객체(350)에 대한 정보는 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률을 더 포함할 수 있다.

다양한 실시예들에 따른 전자 장치(100)는, 메모리(170), 및 메모리(170)와 연결되고, 메모리(170)에 저장된 적어도 하나의 명령을 실행하도록 구성된 프로세서(180)를 포함할 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 제 1 센싱 데이터(311)로부터 추출되는 제 1 특징 맵(313)에서 제 1 관심 영역(331)을 추출하고, 제 2 센싱 데이터(321)로부터 추출되는 제 2 특징 맵(323)에서 제 2 관심 영역(333)을 추출하고, 제 1 관심 영역(331)과 제 2 관심 영역(333)을 융합하여 제 3관심 영역을 생성하고, 제 3 관심 영역(340)을 기반으로, 3차원 객체(350)를 검출하도록 구성될 수 있다.

다양한 실시예들에 따르면, 전자 장치(100)는, 카메라 모듈(110), 및 레이더 센서 또는 라이다 센서 중 적어도 어느 하나를 포함하는 센서 모듈(120)을 더 포함할 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 카메라 모듈(110)을 통해, 제 1 센싱 데이터(311)를 획득하고, 센서 모듈(120)을 통해, 제2 센싱 데이터를 획득하도록 구성될 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 투영 행렬을 이용하여, 3차원 박스(330)를 제 1 센싱 데이터(311)의 제 1 좌표계로 투영함으로써, 제 1 특징 맵(313)에서 제 1 관심 영역(331)을 추출하도록 구성될 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 투영 행렬을 이용하여, 3차원 박스(330)를 제 2 센싱 데이터(321)의 제 2좌표계로 투영함으로써, 제 2 특징 맵(323)에서 제 2 관심 영역(333)을 추출하도록 구성될 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 제 1 관심 영역(331)과 제 2 관심 영역(333)에 대한 제 1 가중치(531)와 제 2 가중치(533)를 각각 계산하고, 제 1 가중치(531)와 제 2 가중치(533)를 기반으로, 제 1 관심 영역(331)과 제 2 관심 영역(333)으로부터 제 3 관심 영역(340)을 생성하도록 구성될 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 제 1 관심 영역(331)에 제 1 가중치(531)를 곱하여, 제 1 가중 영역을 획득하고, 제 2 관심 영역(333)에 제 2 가중치(533)를 곱하여, 제 2가중 영역을 획득하고, 제 1 가중 영역과 제 2 가중 영역의 합을 제 1 가중치(531)와 제 2 가중치(533)의 합으로 나눔으로써, 제 3 관심 영역(340)을 생성하도록 구성될 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 예컨대 콘볼루션 신경망, 다층 퍼셉트론, 회귀 분석 또는 서포트 벡터 머신 중 적어도 어느 하나를 통해, 제 1 관심 영역(331)과 제 2 관심 영역(333)의 병합으로부터 제 1 가중치(531)와 제 2 가중치(533)를 각각 계산하도록 구성될 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 3차원 객체(350)에 대한 정보를 검출하도록 구성되고, 3차원 객체(350)에 대한 정보는 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 포함할 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률을 검출하는 동작, 및 확률을 기반으로, 3차원 객체(350)의 위치, 크기 또는 방향 중 적어도 어느 하나를 검출하는 동작을 포함하고, 3차원 객체(350)에 대한 정보는 제 3 관심 영역(340)에 3차원 객체(350)가 존재할 확률을 더 포함할 수 있다.

본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(100))에 의해 읽을 수 있는 저장 매체(storage medium)(예: 메모리(170))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어로서 구현될 수 있다. 예를 들면, 기기의 프로세서(예: 프로세서(180))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.

다양한 실시예들에 따른 비-일시적 컴퓨터-판독 가능 저장 매체는, 제 1 센싱 데이터(311)로부터 추출되는 제 1 특징 맵(313)에서 제 1 관심 영역(331)을 추출하는 동작, 제 2 센싱 데이터(321)로부터 추출되는 제 2 특징 맵(323)에서 제 2 관심 영역(333)을 추출하는 동작, 제 1 관심 영역(331)과 제 2 관심 영역(333)을 융합하여 제 3 관심 영역(340)을 생성하는 동작, 및 제 3 관심 영역(340)을 기반으로, 3차원 객체(350)를 검출하는 동작을 실행하기 위한 하나 이상의 프로그램들을 저장할 수 있다.

본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 해당 실시 예의 다양한 변경, 균등물, 및/또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성 요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및/또는 B 중 적어도 하나", "A, B 또는 C" 또는 "A, B 및/또는 C 중 적어도 하나" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", "첫째" 또는 "둘째" 등의 표현들은 해당 구성 요소들을, 순서 또는 중요도에 상관없이 수식할 수 있고, 한 구성 요소를 다른 구성 요소와 구분하기 위해 사용될 뿐 해당 구성 요소들을 한정하지 않는다. 어떤(예: 제 1) 구성 요소가 다른(예: 제 2) 구성 요소에 "(기능적으로 또는 통신적으로) 연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성 요소가 상기 다른 구성 요소에 직접적으로 연결되거나, 다른 구성 요소(예: 제 3 구성 요소)를 통하여 연결될 수 있다.

본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구성된 유닛을 포함하며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 모듈은 ASIC(application-specific integrated circuit)으로 구성될 수 있다.

다양한 실시예들에 따르면, 기술한 구성 요소들의 각각의 구성 요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성 요소들 중 하나 이상의 구성 요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성 요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성 요소들(예: 모듈 또는 프로그램)은 하나의 구성 요소로 통합될 수 있다. 이런 경우, 통합된 구성 요소는 복수의 구성 요소들 각각의 구성 요소의 하나 이상의 기능들을 통합 이전에 복수의 구성 요소들 중 해당 구성 요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims

전자 장치의 동작 방법에 있어서,

제 1 센싱 데이터로부터 추출되는 제 1 특징 맵에서 제 1 관심 영역을 추출하는 동작;

제 2 센싱 데이터로부터 추출되는 제 2 특징 맵에서 상기 제 1 관심 영역에 대응하는 제 2 관심 영역을 추출하는 동작;

상기 제 1 관심 영역과 상기 제 2 관심 영역을 융합하여 제 3 관심 영역을 생성하는 동작; 및

상기 제 3 관심 영역을 기반으로, 3차원 객체를 검출하는 동작을 포함하는 방법.
제 1 항에 있어서,

상기 제 1 센싱 데이터는 카메라 모듈로부터 획득되는 영상 데이터를 포함하고,

상기 제 2 센싱 데이터는 레이더 센서 또는 라이다 센서 중 적어도 어느 하나로부터 획득되는 포인트 클라우드 데이터를 포함하고,

상기 제 1 관심 영역을 추출하는 동작은,

투영 행렬(projection matrix)을 이용하여, 미리 정해진 사이즈의 3차원 박스를 상기 제 1 센싱 데이터의 제 1 좌표계로 투영함으로써, 상기 제 1 특징 맵에서 상기 3차원 박스에 대응하여 상기 제 1 관심 영역을 추출하는 동작을 포함하고,

상기 제 2 관심 영역을 추출하는 동작은,

상기 투영 행렬을 이용하여, 상기 3차원 박스를 상기 제 2 센싱 데이터의 제 2 좌표계로 투영함으로써, 상기 제 2 특징 맵에서 상기 3차원 박스에 대응하여 상기 제 2 관심 영역을 추출하는 동작을 포함하는 방법.
제 2 항에 있어서,

상기 제 3 관심 영역을 생성하는 동작은,

상기 제 1 관심 영역과 상기 제 2 관심 영역에 대한 제 1 가중치와 제 2 가중치를 각각 계산하는 동작; 및

상기 제 1 가중치와 상기 제 2 가중치를 기반으로, 상기 제 1 관심 영역과 상기 제 2 관심 영역으로부터 상기 제 3 관심 영역을 생성하는 동작을 포함하는 방법.
제 3 항에 있어서,

상기 제 1 가중치와 상기 제 2 가중치를 기반으로, 상기 제 3 관심 영역을 생성하는 동작은,

상기 제 1 관심 영역에 상기 제 1 가중치를 곱하여, 제 1 가중 영역을 획득하는 동작;

상기 제 2 관심 영역에 상기 제 2 가중치를 곱하여, 제 2 가중 영역을 획득하는 동작; 및

상기 제 1 가중 영역과 상기 제 2 가중 영역의 합을 상기 제 1 가중치와 상기 제 2 가중치의 합으로 나눔으로써, 상기 제 3 관심 영역을 생성하는 동작을 포함하는 방법.
제 3 항에 있어서,

상기 제 1 가중치와 상기 제 2 가중치를 계산하는 동작은,

상기 제 1 관심 영역과 상기 제 2 관심 영역의 병합으로부터 상기 제 1 가중치와 상기 제 2 가중치를 각각 계산하는 동작을 포함하는 방법.
제 2 항에 있어서,

상기 3차원 객체를 검출하는 동작은,

상기 3차원 객체에 대한 정보를 검출하는 동작을 포함하고,

상기 정보는 상기 3차원 객체의 위치, 크기 또는 방향 중 적어도 어느 하나를 포함하는 방법.
제 6 항에 있어서,

상기 3차원 객체를 검출하는 동작은,

상기 제 3 관심 영역에 상기 3차원 객체가 존재할 확률을 검출하는 동작; 및

상기 확률을 기반으로, 상기 3차원 객체의 상기 위치, 크기 또는 방향 중 적어도 어느 하나를 검출하는 동작을 포함하고,

상기 정보는 상기 확률을 더 포함하는 방법.
전자 장치에 있어서,

메모리; 및

상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성된 프로세서를 포함하고,

상기 프로세서는,

제 1 센싱 데이터로부터 추출되는 제 1 특징 맵에서 제 1 관심 영역을 추출하고,

제 2 센싱 데이터로부터 추출되는 제 2 특징 맵에서 상기 제 1 관심 영역에 대응하는 제 2 관심 영역을 추출하고,

상기 제 1 관심 영역과 상기 제 2 관심 영역을 융합하여 제 3 관심 영역을 생성하고,

상기 제 3 관심 영역을 기반으로, 3차원 객체를 검출하도록 구성되는 장치.
제 8 항에 있어서,

상기 전자 장치는,

카메라 모듈; 및

레이더 센서 또는 라이다 센서 중 적어도 어느 하나를 포함하는 센서 모듈을 더 포함하고,

상기 프로세서는,

상기 카메라 모듈을 통해, 상기 제 1 센싱 데이터를 획득하고,

상기 센서 모듈을 통해, 상기 제 2 센싱 데이터를 획득하도록 구성되고,

상기 프로세서는,

투영 행렬을 이용하여, 미리 정해진 사이즈의 3차원 박스를 상기 제 1 센싱 데이터의 제 1 좌표계로 투영함으로써, 상기 제 1 특징 맵에서 상기 3차원 박스에 대응하여 상기 제 1 관심 영역을 추출하도록 구성되고,

상기 투영 행렬을 이용하여, 상기 3차원 박스를 상기 제 2 센싱 데이터의 제 2 좌표계로 투영함으로써, 상기 제 2 특징 맵에서 상기 3차원 박스에 대응하여 상기 제 2 관심 영역을 추출하도록 구성되는 장치.
제 9 항에 있어서,

상기 프로세서는,

상기 제 1 관심 영역과 상기 제 2 관심 영역에 대한 제 1 가중치와 제 2 가중치를 각각 계산하고,

상기 제 1 가중치와 상기 제 2 가중치를 기반으로, 상기 제 1 관심 영역과 상기 제 2 관심 영역으로부터 상기 제 3 관심 영역을 생성하도록 구성되는 장치.
제 10 항에 있어서,

상기 프로세서는,

상기 제 1 관심 영역에 상기 제 1 가중치를 곱하여, 제 1 가중 영역을 획득하고,

상기 제 2 관심 영역에 상기 제 2 가중치를 곱하여, 제 2가중 영역을 획득하고,

상기 제 1 가중 영역과 상기 제 2 가중 영역의 합을 상기 제 1 가중치와 상기 제 2 가중치의 합으로 나눔으로써, 상기 제 3 관심 영역을 생성하도록 구성되는 장치.
제 10 항에 있어서,

상기 프로세서는,

상기 제 1 관심 영역과 상기 제 2 관심 영역의 병합으로부터 상기 제 1 가중치와 상기 제 2 가중치를 각각 계산하도록 구성되는 장치.
제 9 항에 있어서,

상기 프로세서는,

상기 3차원 객체에 대한 정보를 검출하도록 구성되고,

상기 정보는 상기 3차원 객체의 위치, 크기 또는 방향 중 적어도 어느 하나를 포함하는 장치.
제 13 항에 있어서,

상기 프로세서는,

상기 제 3 관심 영역에 상기 3차원 객체가 존재할 확률을 검출하는 동작; 및

상기 확률을 기반으로, 상기 3차원 객체의 상기 위치, 크기 또는 방향 중 적어도 어느 하나를 검출하는 동작을 포함하고,

상기 정보는 상기 확률을 더 포함하는 장치.
비-일시적(non-transitory) 컴퓨터-판독 가능(computer-readable) 저장(storage) 매체(medium)에 있어서,

제 1 센싱 데이터로부터 추출되는 제 1 특징 맵에서 제 1 관심 영역을 추출하는 동작;

제 2 센싱 데이터로부터 추출되는 제 2 특징 맵에서 상기 제 1 관심 영역에 대응하는 제 2 관심 영역을 추출하는 동작;

상기 제 1 관심 영역과 상기 제 2 관심 영역을 융합하여 제 3 관심 영역을 생성하는 동작; 및

상기 제 3 관심 영역을 기반으로, 3차원 객체를 검출하는 동작을 실행하기 위한 하나 이상의 프로그램들을 저장하고,

상기 제 1 센싱 데이터는 카메라 모듈로부터 획득되는 영상 데이터를 포함하고,

상기 제 2 센싱 데이터는 레이더 센서 또는 라이다 센서 중 적어도 어느 하나로부터 획득되는 포인트 클라우드 데이터를 포함하고,

상기 제 1 관심 영역을 추출하는 동작은,

투영 행렬을 이용하여, 미리 정해진 사이즈의 3차원 박스를 상기 제 1 센싱 데이터의 제 1 좌표계로 투영함으로써, 상기 제 1 특징 맵에서 상기 3차원 박스에 대응하여 상기 제 1 관심 영역을 추출하는 동작을 포함하고,

상기 제 2 관심 영역을 추출하는 동작은,

상기 투영 행렬을 이용하여, 상기 3차원 박스를 상기 제 2 센싱 데이터의 제 2 좌표계로 투영함으로써, 상기 제 2 특징 맵에서 상기 3차원 박스에 대응하여 상기 제 2 관심 영역을 추출하는 동작을 포함하는 저장 매체.