WO2020045767A1

WO2020045767A1 - Lidar를 이용한 이미지 생성 방법 및 이를 위한 장치

Info

Publication number: WO2020045767A1
Application number: PCT/KR2019/000017
Authority: WO
Inventors: 김현구; 정호열; 유국열; 박주현
Original assignee: 영남대학교 산학협력단
Priority date: 2018-08-27
Filing date: 2019-01-02
Publication date: 2020-03-05
Also published as: KR102025113B1; US11609332B2; US20210333400A1

Abstract

라이다를 이용한 이미지 생성 방법 및 이를 위한 장치를 개시한다. 본 실시예의 일 측면에 의하면, 라이다를 이용해 컬러 이미지를 생성하는 방법은, 상기 라이다를 이용해 측정된 3차원 반사량 데이터를 2차원으로 투영하여 2차원 반사량 이미지로 재구성하는 과정, 및 상기 투영된 2차원 반사량 이미지를 FCN(Fully Convolutional Network)에 적용해 컬러 이미지를 생성하는 과정을 포함한다.

Description

LIDAR를 이용한 이미지 생성 방법 및 이를 위한 장치

본 발명은 LiDAR를 이용해 이미지를 생성하는 방법 및 그 장치에 관한 것이다.

이 부분에 기술된 내용은 단순히 본 발명에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.

LiDAR(Light Detection And Ranging, 이하 '라이다')는 물체와의 거리 및 상기 물체에서 반사된 정보를 측정하는데 이용된다. 즉, 물체에 빛을 쏘아 다시 수신하는데 걸린 시간을 이용해 상기 물체와의 거리를 측정하고, 이때 반사되어 돌아온 빛의 양도 측정한다. 카메라를 이용하는 경우 빛이나 그림자 등에 영향을 받아 이미지가 불명확할 수 있으나, 라이다를 이용하면 빛에 영향을 받지 않기 때문에 날씨 및 조도에 상관없이 일정한 성능의 데이터를 획득할 수 있다. 일예로 밤에 카메라를 이용해 획득한 이미지는 물체의 유무나 형상을 확인하기 어려우나, 라이다를 이용해 획득한 데이터는 물체의 유무 및 형상을 확인할 수 있다.

이러한 라이다는 3차원 GIS(Geographic Information System) 정보 구축에 이용되고 있으며, 라이다를 이용해 측정한 정보를 가시화하는 형태로 발전시켜 건설, 항공, 국방 등의 분야에도 응용되고 있다. 더 나아가 최근에는 자율주행자동차 및 이동로봇 등에 라이다를 적용하기 위해 개발 중에 있다.

그러나, 라이다를 이용해 획득한 이미지는 스파스(sparse)하기 때문에 물체를 식별하거나 검출하기에는 어려움이 있다. 이에 라이다는 카메라와 함께 물체를 식별하거나 검출하는데 이용되고 있다.

본 실시예는, 라이다를 이용해 이미지를 생성하는 방법 및 장치를 제공하는 데 주된 목적이 있다.

본 실시예의 일 측면에 의하면, 라이다를 이용해 컬러 이미지를 생성하는 방법은, 상기 라이다를 이용해 측정된 3차원 반사량 데이터를 2차원으로 투영하여 2차원 반사량 이미지로 재구성하는 과정, 및 상기 투영된 2차원 반사량 이미지를 딥 러닝 네트워크에 적용해 컬러 이미지를 생성하는 과정을 포함한다.

본 실시예의 다른 측면에 의하면, 라이다를 이용해 컬러 이미지를 생성하는 장치는, 상기 라이다를 이용해 측정된 3 차원 반사량 데이터를 2차원으로 투영하여 2차원 반사량 이미지로 재구성하는 라이다 투영 이미지 생성부, 및 상기 투영된 2차원 반사량 이미지를 딥 러닝 네트워크에 적용해 컬러 이미지를 생성하는 딥 러닝 네트워크를 이용한 이미지 생성부를 포함한다.

이상에서 설명한 바와 같이 본 실시예에 의하면, 밤에도 낮과 같은 이미지를 획득할 수 있으며, 또한 흐린 날에도 맑은 날과 같은 이미지를 획득할 수 있다. 본 발명을 자율주행자동차에 적용하는 경우 카메라를 이용하는 경우보다 주변 환경에 영향을 덜 받을 수 있다. 본 발명을 방범에 적용하는 경우 밤이나 흐린 날에도 선명한 이미지를 획득할 수 있다.

도 1은 본 개시에 따라 라이다를 이용해 이미지를 생성하는 장치의 구성도를 나타낸 도면,

도 2는 일예로 본 개시에 따라 생성되는 이미지를 순차적으로 나타낸 도면,

도 3은 본 개시의 일 실시예에 따라 딥 러닝 네트워크를 이용한 이미지 생성부에서 수행되는 학습과 추론 과정을 나타낸 도면,

도 4는 본 개시의 일 실시예에 따른 딥 러닝 네트워크의 구조를 나타낸 도면,

도 5는 본 개시에 따라 라이다를 이용해 이미지를 생성하는 방법의 순서도를 나타낸 도면이다.

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 명세서 전체에서, 어떤 부분이 어떤 구성요소를 '포함', '구비'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 '…부', '모듈' 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.

도 1은 본 개시에 따라 라이다를 이용해 이미지를 생성하는 장치의 구성도를 나타낸 도면이다.

본 개시에 따른 라이다를 이용해 이미지를 생성하는 장치는 라이다 데이터 획득부(110), 라이다 투영 이미지 생성부(120), 및 딥 러닝 네트워크를 이용한 이미지 생성부(130)로 구성될 수 있다.

도 1에서는 다수의 구성으로 나누어 설명하나 여러 개의 구성이 하나의 구성으로 통합되어 구현될 수 있으며 또는 하나의 구성이 여러 개의 구성으로 나누어 구현될 수도 있다.

라이다 데이터 획득부(110)는 라이다를 이용해 물체와의 거리 및 상기 물체로부터 반사되는 빛의 반사량을 측정한다. 이때 물체의 유무 및 물체와의 거리 때문에 라이다 데이터는 일반적으로 일정하지 못 할 뿐 아니라 조밀하지 못하다. 도 2의 (a)는 라이다 데이터 획득부(110)에 의해 획득된 데이터를 가시화한 일예를 나타낸 것이다.

라이다 투영 이미지 생성부(120)는 라이다 데이터 획득부(110)에 의해 획득된 3차원 좌표를 가진 반사량 데이터를 2차원 좌표로 투영한다. 상기 3차원 좌표를 가진 반사량 데이터는 점구름(point cloud)의 형태를 가질 수 있다. 이때 투영할 이미지의 시야각, 해상도, 틸트 각도, 높이 등이 고려될 수 있다. 3차원 좌표를 2차원 좌표로 투영하기 위해 투영 행렬을 이용할 수 있다. 일예로 아래의 [수학식 1]은 투영 행렬을 이용해 3차원 좌표를 2차원 좌표로 변환하는 수학식을 나타낸 것이다. 여기서, X, Y, Z는 변환할 3차원 좌표를 나타내며, u, v는 변환된 2차원 좌표를 나타낸다.

그 외에, s는 스케일 인자(scale factor), c_u, c_v는 카메라의 주점(principal point), f_u, f_v는 초점 거리(focal length),

∈R^3x3과

∈R^1x3는 라이다를 카메라의 위치로 변환하기 위한 회전 행렬과 변환 행렬을 의미한다. 도 2의 (b)는 라이다 데이터 획득부(110)에 의해 획득된 3차원 좌표를 가진 반사량 데이터를 2차원 좌표로 투영한 일예를 나타낸 것이다.

딥 러닝 네트워크를 이용한 이미지 생성부(130)는 라이다 투영 이미지 생성부(120)로부터 생성된 데이터, 즉, 2차원 좌표로 투영된 반사량 데이터를 학습된 딥 러닝 네트워크에 적용해 이미지를 생성한다. 상기 딥 러닝 네트워크를 이용해 생성하는 이미지는 흑백 또는 컬러 이미지일 수도 있다. 딥 러닝 네트워크를 이용한 이미지 생성부(130)는 이하에서 자세히 설명한다.

본 발명의 라이다를 이용한 이미지 생성 장치(도 1)에 포함된 각 구성들은 본 발명의 이해를 돕기 위해 기능별로 각 구성을 구분한 것이고, 실제로는 CPU, MPU,　GPU　또는 ECU와 같은 하나의 처리 장치 또는 여러 장치를 통해 구현될 수 있다. 　특히, 도 1의 딥 러닝 네트워크를 이용한 이미지 생성부(130)는 GPU를 사용하여 이루어질 수 있다. 즉, 컬러 이미지 생성은 다른 처리 장치로도 구현이 가능하나, 보다 고속으로의 처리를 위해　GPU를 이용하는 것이 바람직하다. 따라서, 도 1의 라이다 투영 이미지 생성부(120)와 딥러닝 네트워크를 이용한 이미지 생성부(130)는 라이다 데이터 획득부(110)와 일체로 구성될 수 있다.

도 3은 본 개시의 일 실시예에 따라 딥 러닝 네트워크를 이용한 이미지 생성부에서 수행되는 학습 및 추론 과정을 나타낸 도면이다.

구체적으로, 도 3은 컬러 이미지를 생성하기 위한 학습 및 추론 과정을 나타낸 도면이다.

먼저, 학습 과정에서 라이다 투영 이미지 생성부(120)에 의해 생성된 2차원 좌표로 투영된 반사량 이미지(310)는 딥 러닝 네트워크(320)에 입력되어 컬러 성분(330)이 출력된다. 선택적으로 3차원 좌표(또는 물체까지의 거리)도 함께 딥 러닝 네트워크(320)에 입력될 수 있다. 딥 러닝 네트워크(320)에 의해 출력되는 컬러 성분(330)은 원본 컬러 이미지(340)의 컬러 성분과 일치하도록 딥 러닝 네트워크(320)의 계수가 학습된다. 학습 과정에 이용되는 원본의 컬러 이미지(340)는 카메라에 의해 획득된 이미지일 수 있다. 또한, 원본의 컬러 이미지(340)는 상기 카메라에 의해 획득된 이미지에서 그림자가 삭제된 이미지일 수 있다. 본 개시에서 그림자가 없는 이미지를 이용하여 학습을 수행하는 것은 라이다는 그림자나 빛에 영향을 받지 않기 때문에 그림자가 발생하는 환경이나 야간에도 주간과 동일한 데이터를 얻을 수 있기 때문이다. 다시 말해 반사량 (또는, 반사율) 정보에는 그림자의 특징이 나타나지 않기 때문에 그림자가 없는 이미지를 이용해 학습을 수행하게 된다. 만약 그림자가 있는 이미지를 이용하여 학습한다면, 그림자에 의해 컬러 성분이 왜곡될 수 있다. 그 밖에도 이와 같이 그림자가 없는 이미지를 획득하는 것은 이동 로봇, 자동차 등의 자율 주행 알고리즘에 있어 매우 중요한 기술이며, 이에 대한 다양한 연구도 진행 중에 있다.

한편, 딥 러닝 네트워크(320)에서 활성 함수(activation function)로 tanh 함수를 사용하는 경우 출력되는 값은 -1에서 1 사이의 값을 갖게 된다. 이 경우 원본의 컬러 이미지(340)에서 추출된 컬러 성분은 딥 러닝 네트워크(320)에서 출력되는 컬러 성분(330)과 유효 범위가 일치하지 않기 때문에 원본의 컬러 이미지(340)에서 추출된 컬러 성분의 범위를 변환해야 한다(350). 또는 딥 러닝 네트워크(320)에서 출력되는 컬러 성분(330)을 원본의 컬러 이미지(340)에서 추출된 컬러 성분의 유효 범위 내에 포함되도록 변환해야 한다. 이하에서는 원본의 컬러 이미지(340)에서 추출된 컬러 성분의 범위를 변환하는 예로 설명한다. 컬러 성분은 R, G, B로 나타낼 수 있으며 일반적으로 이미지에서는 그 범위가 0에서 255사이의 값을 갖는다. 컬러 성분은 반드시 RGB로 변환되는 것은 아니며 다양한 컬러 성분인 Gray, YUV, YCbYr, CIE Lab 등으로도 변환될 수 있다. 그러나, 딥 러닝 네트워크(320)에 의해 출력된 컬러 성분(330)은 활성 함수에 의해 -1에서 1사이의 값을 갖기 때문에 원본의 컬러 이미지(340)에서 컬러 성분의 범위를 -1에서 1사이의 값을 갖도록 변환한다(350). 즉, 딥 러닝 네트워크의 활성 함수에 따라 변환되는 데이터의 범위도 변경되어야 한다.

이후 추론 과정에서는 라이다 투영 이미지 생성부(120)에 의해 생성된 2차원 좌표로 투영된 반사량 이미지가 딥 러닝 네트워크(320)에 입력되어 컬러 성분(330)이 출력된다. 학습 과정에서와 마찬가지로 선택적으로 3차원 좌표(또는 물체까지의 거리)도 함께 딥 러닝 네트워크(320)에 입력될 수 있다. 딥 러닝 네트워크(320)에서 출력된 컬러 성분(330)의 값은 -1에서 1 사이의 값을 갖기 때문에 0에서 255 사이의 값을 갖도록 변환된다(370). 상기 변환된 값을 이용해 컬러 이미지(360)를 생성한다.

도 4는 본 개시의 일 실시예에 따른 딥 러닝 네트워크의 구조를 나타낸 도면이다.

구체적으로, 도 4는 592 x 112 크기의 이미지를 일 예로 설명하고 있다. 따라서 이미지의 크기가 바뀌는 경우 컨볼루션 그룹의 개수나 샘플링의 횟수 등이 변경될 수 있다.

딥 러닝 네트워크의 입력은 2차원 좌표로 투영된 반사량 이미지가 될 수 있다. 이 때 반사량만을 입력으로 하는 경우에는 1 채널이 되고, 3차원 좌표(또는 물체까지의 거리)도 함께 입력되는 경우에는 2 채널이 될 수 있다. 딥 러닝 네트워크의 출력은 컬러 이미지의 성분을 나타내는 R, G, B로 3채널이 될 수 있다.

본 개시에 따른 딥 러닝 네트워크는 인코더부(410)와 디코더부(420)로 구성될 수 있다. 상기 딥 러닝 네트워크의 인코더부(410)와 디코더부(420)는 비대칭적으로 구성된 FCN(Fully Convolutional Network)이 될 수 있다.

인코더부(410)는 적어도 하나 이상의 컨볼루션 그룹과 서브 샘플링(sub-sampling)부로 구성될 수 있으며, 디코더부(420)도 적어도 하나 이상의 컨볼루션 그룹과 업 샘플링(up-sampling)부로 구성될 수 있다. 상기 컨볼루션 그룹은 적어도 하나 이상의 컨볼루션 블록으로 구성될 수 있다. 상기 컨볼루션 블록(convolution-K block)은 K개의 3x3 필터를 포함하는 컨볼루션 레이어, 배치 정규화(batch normalization) 레이어, 및 활성 함수 순으로 구성될 수 있다. 또한, 컨볼루션 레이어는 stride가 1, padding은 모두 동일하게 설정될 수 있으며, 디코딩부(420)의 마지막 컨볼루션 블록은 활성 함수로 tanh가 이용될 수 있다. 그 외의 모든 컨볼루션 블록의 활성 함수는 ReLU(Rectified Linear Unit)가 이용될 수 있다([수학식 2] 참조).

도 4에서는 인코더부(410)의 i 번째 컨볼루션 그룹을 구성하는 컨볼루션 블록의 반복 횟수는

, 디코더부(420)의 j 번째 컨볼루션 그룹을 구성하는 컨볼루션 블록의 반복 횟수는

로 나타내고 있으며, 상기 반복 횟수는 가변이 가능하다.

인코더부(410)의 컨볼루션 그룹을 구성하는 컨볼루션 블록의 총 개수

와 디코더부(420)의 컨볼루션 그룹을 구성하는 컨볼루션 블록의 총 개수는

로 디코더부(420)의 컨볼루션 블록의 총 개수가 인코더부(420)의 컨볼루션 블록의 총 개수보다 많게 설계(

)됨으로 인해 FCN의 인코더부(410)와 디코더부(420)는 비대칭적인 구조를 가질 수 있다.

인코더부(410)의 서브 샘플링 횟수는 2의 인수(factor)로 max-pooling이 적용될 수 있다. 디코더부(420)의 업 샘플링 횟수는 2의 인수(factor)로 un-pooling이 적용될 수 있다.

라이다를 이용해 물체까지의 거리 및 반사량을 측정한다(510). 일예로 상기 물체까지의 거리는 X, Y, Z 좌표 상의 거리가 각각 측정되어 3차원의 좌표로 표현될 수 있다.

상기 측정한 거리와 반사량을 이용해 3차원 반사량 데이터를 생성한다(520).

상기 생성된 3차원 반사량 데이터를 2차원 반사량 이미지로 투영한다(530). 일예로 투영 행렬을 이용하여 상기 생성된 3차원 반사량 데이터를 2차원 반사량 이미지로 변환할 수 있다.

상기 투영된 2차원 반사량 이미지를 딥 러닝 네트워크에 적용해 흑백 또는 컬러 이미지를 생성한다(540). 상기 딥 러닝 네트워크는 FCN이 될 수 있다. 이때 상기 투영된 2차원 반사량 이미지 외에 상기 측정한 거리 또는 3차원 좌표가 상기 FCN에 더 입력될 수 있다. 상기 FCN은 인코딩부와 디코딩부로 구성될 수 있으며, 상기 인코딩부와 상기 디코딩부는 비대칭적으로 구성될 수 있다. 상기 FCN은 그림자가 없는 이미지를 원본 이미지로 하여 학습될 수 있다.

도 5에서는 과정 510 내지 과정 540을 순차적으로 실행하는 것으로 기재하고 있으나, 이는 본 발명의 일 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것이다. 다시 말해, 본 발명의 일 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 일 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 도 5에 기재된 순서를 변경하여 실행하거나 과정 510 내지 과정 540 중 하나 이상의 과정을 병렬적으로 실행하는 것으로 다양하게 수정 및 변형하여 적용 가능할 것이므로, 도 5는 시계열적인 순서로 한정되는 것은 아니다.

한편, 도 5에 도시된 과정들은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 즉, 컴퓨터가 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

CROSS-REFERENCE TO RELATED APPLICATION

본 특허출원은, 본 명세서에 그 전체가 참고로서 포함되는, 2018년 08월 27일 한국에 출원한 특허출원번호 제10-2018-0100639호에 대해 우선권을 주장한다.

Claims

라이다를 이용해 컬러 이미지를 생성하는 방법에 있어서,

상기 라이다를 이용해 측정된 3차원 반사량 데이터를 2차원으로 투영하여 2차원 반사량 이미지로 재구성하는 과정, 및

상기 투영된 2차원 반사량 이미지를 딥 러닝(Deep Learning) 네트워크에 적용해 컬러 이미지를 생성하는 과정을 포함하는 이미지 생성 방법.
제1항에 있어서,

상기 딥 러닝 네트워크는 FCN(Fully Convolutional Network)임을 특징으로 하는 이미지 생성 방법.
제2항에 있어서,

상기 FCN은 인코딩 과정과 디코딩 과정을 포함하고,

상기 인코딩 과정과 상기 디코딩 과정은 서로 비대칭으로 수행됨을 특징으로 하는 이미지 생성 방법.
제2항에 있어서,

상기 FCN은 그림자가 없는 이미지를 원본 이미지로 하여 학습된 네트워크임을 특징으로 하는 이미지 생성 방법.
제2항에 있어서,

상기 투영된 2차원 반사량 이미지를 FCN에 적용해 컬러 이미지를 생성하는 과정은,

상기 투영된 2차원 반사량 이미지와 상기 측정한 거리를 상기 FCN에 적용해 컬러 이미지를 생성하는 과정임을 특징으로 하는 이미지 생성 방법.
제1항에 있어서,

상기 투영된 2차원 반사량 이미지는 0에서 1, 또는 -1에서 1 사이의 값으로 표현되고,

상기 컬러 이미지는 0에서 255 사이의 값으로 표현됨을 특징으로 하는 이미지 생성 방법.
라이다를 이용해 컬러 이미지를 생성하는 장치에 있어서,

상기 라이다를 이용해 측정된 3 차원 반사량 데이터를 2차원으로 투영하여 2차원 반사량 이미지로 재구성하는 라이다 투영 이미지 생성부, 및

상기 투영된 2차원 반사량 이미지를 딥 러닝(Deep Learning) 네트워크에 적용해 컬러 이미지를 생성하는 딥 러닝 네트워크를 이용한 이미지 생성부를 포함하는 이미지 생성 장치.
제7항에 있어서,

상기 딥 러닝 네트워크는 FCN(Fully Convolutional Network)임을 특징으로 하는 이미지 생성 장치.
제8항에 있어서,

상기 FCN은 인코딩부와 디코딩부를 포함하고,

상기 인코딩부와 상기 디코딩부는 서로 비대칭적으로 구성됨을 특징으로 하는 이미지 생성 장치.
제8항에 있어서,

상기 FCN은 그림자가 없는 이미지를 원본 이미지로 하여 학습된 네트워크임을 특징으로 하는 이미지 생성 장치.
제8항에 있어서,

상기 딥 러닝 네트워크를 이용한 이미지 생성부는,

상기 투영된 2차원 반사량 이미지와 상기 측정한 거리를 상기 FCN에 적용해 컬러 이미지를 생성함을 특징으로 하는 이미지 생성 장치.
제8항에 있어서,

상기 투영된 2차원 반사량 이미지는 0에서 1, 또는 -1에서 1 사이의 값으로 표현되고, 상기 컬러 이미지는 0에서 255 사이의 값으로 표현됨을 특징으로 하는 이미지 생성 장치.