KR102588954B1

KR102588954B1 - Lidar 시맨틱 네트워크를 사용한 지평면 추정

Info

Publication number: KR102588954B1
Application number: KR1020210011358A
Authority: KR
Inventors: 베니스 에린 베이론 리옹; 오스카 오로프 베이봄
Original assignee: 모셔널 에이디 엘엘씨
Priority date: 2020-10-09
Filing date: 2021-01-27
Publication date: 2023-10-13
Also published as: US20230205216A1; US11521394B2; US20220114764A1; GB202100473D0; KR20220047713A; CN114419331A; GB2599972A; DE102021108068A1

Abstract

LSN을 사용한 GPE를 위한 실시예가 개시된다. 일 실시예에서, 방법은: 환경에서 동작하는 차량의 깊이 센서로부터 포인트 클라우드를 획득하는 단계; 포인트 클라우드를 인코딩하는 단계; 인코딩된 포인트 클라우드를 입력으로서 갖는 딥 러닝 네트워크를 사용하여, 환경에서의 지평면을 추정하는 단계; 추정된 지평면의 운전 가능 영역에 기초하여 환경을 통과하는 경로를 계획하는 단계; 및 경로를 따라 차량을 동작시키는 단계를 포함한다. 딥 러닝 네트워크는 2차원(2D) 컨볼루션 백본, 대상체를 검출하기 위한 검출 헤드 및 지평면을 추정하기 위한 지평면 추정(GPE) 헤드를 포함한다. 일 실시예에서, 포인트 필라는 포인트 클라우드를 인코딩하는 데 사용된다.

Description

LIDAR 시맨틱 네트워크를 사용한 지평면 추정{GROUND PLANE ESTIMATION USING LIDAR SEMANTIC NETWORK}

이하의 설명은 일반적으로 자율 주행 차량(autonomous vehicle)의 루트 계획을 위한 지평면 추정(ground plane estimation)에 관한 것이다.

자율 주행 차량(AV)에 장착된 LiDAR(light detection and ranging) 센서는 AV를 둘러싸는 환경에 대한 상세한 이해를 제공하는 3차원(3D) 포인트 클라우드를 출력한다. 지평면 추정(GPE)은 자율 주행 차량에 대한 지평면의 높이를 측정하는 것이다. 정확한 GPE는 효율적인 융합 기반 자율 주행 운전에 기여한다. 그렇지만, 기존 인지 파이프라인은 통상적으로 전통적인 머신 러닝 기술을 사용하여 LiDAR 포인트를 전경(foreground) 또는 지면(ground)으로 분류한다.

LiDAR 시맨틱 네트워크(LiDAR semantic network; LSN)를 사용한 GPE를 위한 기술이 제공된다.

일 실시예에서, 방법은: 적어도 하나의 프로세서를 사용하여, 환경에서 동작하는 차량의 깊이 센서로부터 포인트 클라우드를 획득하는 단계; 적어도 하나의 프로세서를 사용하여, 포인트 클라우드를 인코딩하는 단계; 인코딩된 포인트 클라우드를 입력으로서 갖는 딥 러닝 네트워크를 사용하여, 환경에서의 지평면을 추정하는 단계; 추정된 지평면 및 환경의 맵을 사용하여, 환경에서의 운전 가능 영역을 결정하는 단계; 적어도 하나의 프로세서를 사용하여, 운전 가능 영역에 기초하여 환경을 통과하는 경로를 계획하는 단계; 및 차량의 제어 회로를 사용하여, 경로를 따라 차량을 동작시키는 단계를 포함한다.

일 실시예에서, 딥 러닝 네트워크는 2차원(2D) 컨볼루션 백본 및 지평면을 추정하기 위한 지평면 추정(GPE) 헤드를 포함하며, 본 방법은: 적어도 하나의 프로세서를 사용하여, 2D 컨볼루션 백본 네트워크의 복수의 스트라이드(stride)로부터 특징 맵을 획득하는 단계; 적어도 하나의 프로세서를 사용하여, 각각의 특징 맵을 원래의 특징 맵 크기로 업샘플링하는 단계; 및 적어도 하나의 프로세서 및 가중 합산을 사용하여, 업샘플링된 특징 맵들을 결합하여 지평면을 추정하는 출력 맵을 생성하는 단계를 추가로 포함한다.

일 실시예에서, 포인트 클라우드를 인코딩하는 단계는: 포인트 클라우드를 이미지 임베딩에서의 2D 필라(pillar)로 분할하는 단계; 각각의 필라에 대해, 일정 수의 샘플 포인트를 선택하는 단계; 선택된 샘플 포인트에 일정 수의 증강(augmentation)을 추가하는 단계; 및 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하여 필라에 대한 포인트 특징을 획득하는 단계; 포인트 특징을 그 각자의 필라 위치에 기초하여 포인트 특징 맵으로 렌더링하여 2D 포인트 특징 맵을 생성하는 단계; 2D 컨볼루션 백본을 사용하여, 2D 포인트 특징 맵을 프로세싱하여 상이한 스트라이드의 풍부한 특징 맵(rich feature map)을 획득하는 단계; 및 풍부한 특징 맵을 GPE 헤드에 전달하여 지평면을 추정하는 단계를 추가로 포함한다.

일 실시예에서, 이미지 임베딩은 조감도(bird's eye view; BEV) 이미지이다.

일 실시예에서, GPE 헤드는 하나 이상의 컨볼루션 계층을 포함한다.

일 실시예에서, 방법은: 적어도 하나의 프로세서를 사용하여, 환경에서 동작하는 깊이 센서에 의해 캡처된 포인트 클라우드를 획득하는 단계; 적어도 하나의 프로세서를 사용하여, 포인트 클라우드를 인코딩하는 단계; 및 인코딩된 포인트 클라우드를 입력으로서 갖는 딥 러닝 네트워크를 사용하여, 환경에서의 지평면을 추정하는 단계; 적어도 하나의 프로세서를 사용하여, 추정된 지평면을 그라운드 트루스 맵(ground truth map)과 비교하여 지평면 추정 손실을 결정하는 단계; 및 적어도 하나의 프로세서를 사용하여, 결정된 지평면 추정 손실에 기초하여 딥 러닝 네트워크의 파라미터를 업데이트하는 단계를 포함한다.

일 실시예에서, 추정된 지평면을 그라운드 트루스 맵과 비교하여 지평면 추정 손실을 추정하는 단계는 지평면 추정치와 그라운드 트루스 맵의 손실 함수를 최소화하는 단계를 추가로 포함한다.

일 실시예에서, 손실 함수는 smooth-1 회귀 손실(smooth-1 regression loss)이다.

일 실시예에서, 딥 러닝 네트워크는 지평면을 추정하기 위한 지평면 추정(GPE) 헤드에 커플링된 2D 컨볼루션 백본을 포함하며, 본 방법은: 적어도 하나의 프로세서를 사용하여, 2D 컨볼루션 백본의 복수의 스트라이드로부터 특징 맵을 획득하는 단계; 적어도 하나의 프로세서를 사용하여, 각각의 특징 맵을 원래의 특징 맵 크기로 업샘플링하는 단계; 및 적어도 하나의 프로세서 및 가중 합산을 사용하여, 업샘플링된 특징 맵들을 결합하여 지평면을 추정하는 출력 맵을 생성하는 단계를 추가로 포함한다.

일 실시예에서, 포인트 클라우드 데이터를 인코딩하는 단계는: 포인트 클라우드를 이미지 임베딩에서의 2D 필라로 분할하는 단계; 각각의 필라에 대해, 일정 수의 샘플 포인트를 선택하는 단계; 선택된 샘플 포인트에 일정 수의 증강을 추가하는 단계; 및 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하여 필라에 대한 포인트 특징을 획득하는 단계; 포인트 특징을 그 각자의 필라 위치에 기초하여 포인트 특징 맵으로 렌더링하여 2D 포인트 특징 맵을 생성하는 단계; 2D 컨볼루션 백본을 사용하여, 2D 포인트 특징 맵을 프로세싱하여 상이한 스트라이드의 풍부한 특징 맵을 획득하는 단계; 및 풍부한 특징 맵을 GPE 헤드에 전달하여 지평면을 추정하는 단계를 추가로 포함한다.

일 실시예에서, 차량은: 환경의 포인트 클라우드를 생성하도록 구성된 깊이 센서; 제어 회로; 및 깊이 센서로부터 포인트 클라우드를 획득하고; 포인트 클라우드를 인코딩하며; 인코딩된 포인트 클라우드를 입력으로서 갖는 딥 러닝 네트워크를 사용하여, 환경에서의 지평면을 추정하고; 추정된 지평면 및 환경의 맵을 사용하여, 환경에서의 운전 가능 영역을 결정하며; 운전 가능 영역에 기초하여 환경을 통과하는 경로를 계획하고; 제어 회로를 사용하여, 경로를 따라 차량을 동작시키도록 구성된 적어도 하나의 프로세서를 포함한다.

일 실시예에서, 딥 러닝 네트워크는: 복수의 스트라이드로부터 특징 맵을 생성하도록 구성된 2차원(2D) 컨볼루션 백본; 및 2D 컨볼루션 백본에 커플링된 지평면 추정(GPE) 헤드 - GPE 헤드는: 각각의 특징 맵을 원래의 특징 맵 크기로 업샘플링하고; 가중 합산으로, 업샘플링된 특징 맵들을 결합하여 지평면을 추정하는 출력 맵을 생성하도록 구성됨 - 를 추가로 포함한다.

일 실시예에서, 포인트 클라우드 데이터를 인코딩하는 것은: 포인트 클라우드를 이미지 임베딩에서의 2차원(2D) 필라로 분할하는 것; 각각의 필라에 대해, 일정 수의 샘플 포인트를 선택하는 것; 선택된 샘플 포인트에 일정 수의 증강을 추가하는 것; 및 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하여 필라에 대한 포인트 특징을 획득하는 것; 포인트 특징을 그 각자의 필라 위치에 기초하여 포인트 특징 맵으로 렌더링하여 2D 포인트 특징 맵을 생성하는 것; 2D 컨볼루션 백본을 사용하여, 2D 포인트 특징 맵을 프로세싱하여 상이한 스트라이드의 풍부한 특징 맵을 획득하는 것; 및 풍부한 특징 맵을 GPE 헤드에 전달하여 지평면을 추정하는 것을 추가로 포함한다.

일 실시예에서, 시스템은: 적어도 하나의 프로세서; 적어도 하나의 프로세서에 의해 실행될 때, 적어도 하나의 프로세서로 하여금 동작들을 수행하게 하는 명령어를 저장하는 메모리를 포함하며, 동작들은: 환경에서 동작하는 깊이 센서에 의해 캡처된 포인트 클라우드를 획득하는 동작; 포인트 클라우드를 인코딩하는 동작; 인코딩된 포인트 클라우드를 입력으로서 갖는 딥 러닝 네트워크를 사용하여, 환경에서의 지평면을 추정하는 동작; 추정된 지평면을 그라운드 트루스 맵과 비교하여 지평면 추정 손실을 결정하는 동작; 및 결정된 지평면 추정 손실에 기초하여 딥 러닝 네트워크의 파라미터를 업데이트하는 동작을 포함한다.

일 실시예에서, 추정된 지평면을 그라운드 트루스 맵과 비교하여 지평면 추정 손실을 추정하는 동작은 지평면 추정치와 그라운드 트루스 맵의 손실 함수를 최소화하는 동작을 추가로 포함한다.

일 실시예에서, 손실 함수는 smooth-1 회귀 손실이다.

일 실시예에서, 동작들은: 딥 러닝 네트워크를 사용하여, 복수의 스트라이드로부터 특징 맵을 획득하는 동작; 딥 러닝 네트워크를 사용하여, 각각의 특징 맵을 원래의 특징 맵 크기로 업샘플링하는 동작; 및 가중 합산을 사용하여, 업샘플링된 특징 맵들을 결합하여 지평면을 추정하는 출력 맵을 생성하는 동작을 추가로 포함한다.

일 실시예에서, 포인트 클라우드 데이터를 인코딩하는 동작은: 포인트 클라우드를 이미지 임베딩에서의 2차원(2D) 필라로 분할하는 동작; 각각의 필라에 대해, 일정 수의 샘플 포인트를 선택하는 동작; 선택된 샘플 포인트에 일정 수의 증강을 추가하는 동작; 및 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하여 필라에 대한 포인트 특징을 획득하는 동작; 포인트 특징을 그 각자의 필라 위치에 기초하여 포인트 특징 맵으로 렌더링하여 2D 포인트 특징 맵을 생성하는 동작; 딥 러닝 네트워크를 사용하여, 2D 포인트 특징 맵을 프로세싱하여 상이한 스트라이드의 풍부한 특징 맵을 획득하는 동작; 및 풍부한 특징 맵을 사용하여 지평면을 추정하는 동작을 추가로 포함한다.

일 실시예에서, 딥 러닝 네트워크는 하나 이상의 컨볼루션 계층을 포함한다.

개시된 실시예들 중 하나 이상은 다음과 같은 장점들 중 하나 이상을 제공한다.

이들 및 다른 양태, 특징, 및 구현예는 기능을 수행하기 위한 방법, 장치, 시스템, 컴포넌트, 프로그램 제품, 수단 또는 단계로서, 및 다른 방식으로 표현될 수 있다.

이들 및 다른 양태, 특징, 및 구현은 청구항을 포함하여, 이하의 설명으로부터 명백해질 것이다.

도 1은 하나 이상의 실시예에 따른, 자율 주행 능력(autonomous capability)을 갖는 자율 주행 차량(AV)의 예를 도시한다.
도 2는 하나 이상의 실시예에 따른, 예시적인 "클라우드" 컴퓨팅 환경을 예시한다.
도 3은 하나 이상의 실시예에 따른, 컴퓨터 시스템을 예시한다.
도 4는 하나 이상의 실시예에 따른, AV에 대한 예시적인 아키텍처를 도시한다.
도 5는 하나 이상의 실시예에 따른, LSN을 사용한 GPE를 위한 시스템의 블록 다이어그램이다.
도 6은 하나 이상의 실시예에 따른, 컨볼루션 백본에 커플링된 GPE 헤드의 블록 다이어그램이다.
도 7은 하나 이상의 실시예에 따른, LSN을 사용한 GPE에 기초한 루트 계획 프로세스의 흐름 다이어그램이다.
도 8은 하나 이상의 실시예에 따른, GPE를 위한 LSN을 트레이닝시키는 프로세스의 흐름 다이어그램이다.

설명을 위한 이하의 기술에서는, 본 발명에 대한 완전한 이해를 제공하기 위해 다수의 특정 세부 사항이 기재된다. 그렇지만, 본 발명이 이러한 특정 세부 사항 없이 실시될 수 있음이 명백할 것이다. 다른 경우에, 공지된 구조 및 디바이스는 본 발명을 불필요하게 모호하게 하는 것을 피하기 위하여 블록 다이어그램 형태로 도시된다.

도면에서, 설명을 용이하게 하기 위해, 디바이스, 모듈, 명령 블록 및 데이터 요소를 나타내는 것과 같은 개략적 요소의 특정 배열 또는 순서가 도시된다. 그렇지만, 본 기술 분야의 통상의 기술자라면, 도면에서의 개략적 요소의 특정 순서 또는 배열이 프로세싱의 특정한 순서 또는 시퀀스, 또는 프로세스의 분리가 요구됨을 암시한다는 것을 의미하지는 않는다는 점을 이해할 것이다. 게다가, 도면에 개략적 요소를 포함시키는 것은, 그러한 요소가 모든 실시예에서 요구됨을 암시한다는 것을 의미하지 않거나, 또는 그러한 요소에 의해 표현된 특징이 일부 실시예에서 포함되지 않을 수 있거나 다른 요소와 조합되지 않을 수 있음을 암시한다는 것을 의미하지 않는다.

또한, 도면에서, 2개 이상의 다른 개략적 요소 사이의 연결, 관계 또는 연관을 보여주기 위해 실선 또는 파선 또는 화살표와 같은 연결 요소가 사용되는 경우에, 임의의 그러한 연결 요소의 부재가 연결, 관계 또는 연관이 존재할 수 없다는 것을 암시하는 것을 의미하지 않는다. 환언하면, 요소들 사이의 일부 연결, 관계 또는 연관은 본 개시를 모호하게 하지 않기 위해 도면에 도시되어 있지 않다. 추가적으로, 예시를 용이하게 하기 위해, 요소들 사이의 다수의 연결, 관계 또는 연관을 나타내기 위해 단일의 연결 요소가 사용된다. 예를 들어, 연결 요소가 신호, 데이터 또는 명령어의 통신을 나타내는 경우에, 본 기술 분야의 통상의 기술자라면, 그러한 요소가, 통신을 수행하기 위해 필요할 수 있는, 하나 또는 다수의 신호 경로(예를 들면, 버스)를 나타낸다는 것을 이해할 것이다.

그 예가 첨부된 도면에 예시된 실시예가 이제 상세하게 언급될 것이다. 이하의 상세한 설명에서, 다양한 기술된 실시예에 대한 완전한 이해를 제공하기 위해 많은 특정 세부 사항이 기재된다. 그렇지만, 다양한 기술된 실시예가 이러한 특정 세부 사항 없이 실시될 수 있다는 것이 본 기술 분야의 통상의 기술자에게 명백할 것이다. 다른 경우에, 실시예의 양태를 불필요하게 모호하게 하지 않기 위해 공지된 방법, 절차, 컴포넌트, 회로, 및 네트워크는 상세히 기술되지 않았다.

서로 독립적으로 또는 다른 특징들의 임의의 조합과 함께 각각 사용될 수 있는 여러 특징이 이하에 기술된다. 그렇지만, 임의의 개별 특징은 위에서 논의된 문제들 중 임의의 것을 해결할 수 없거나 또는 위에서 논의된 문제들 중 단지 하나만을 해결할 수 있다. 위에서 논의된 문제들 중 일부가 본원에 기술된 특징들 중 임의의 것에 의해 완전히 해결되지는 않을 수 있다. 비록 여러 표제가 제공되어 있더라도, 특정 표제에 관련되지만 해당 표제를 갖는 섹션에서 발견되지는 않는 정보가 본 설명의 다른 곳에서 발견될 수도 있다. 실시예는 이하의 개요에 따라 본원에 기술된다:

1. 일반적 개관

2. 시스템 개관

3. 자율 주행 차량 아키텍처

4. LSN을 사용한 GPE

일반적 개관

LSN을 사용한 GPE를 위한 기술이 제공된다. 일 실시예에서, LSN은 먼저 3D 포인트 클라우드를 이미지 임베딩(예를 들면, 조감도(BEV) 이미지)에서의 2차원(2D) 필라로 분할하는 것에 의해 3D LiDAR 포인트 클라우드를 입력한다. 각각의 필라에 대해, 일정 수의 포인트 클라우드 샘플이 선택되고 신경 네트워크에 의해 프로세싱되어 포인트 특징을 획득한다. 포인트 특징은 그 각자의 필라 위치에 기초하여 2D 포인트 특징 맵을 생성하는 데 사용된다. 2D 포인트 특징 맵은 상이한 스트라이드의 풍부한 특징 맵을 생성하는 2D 컨볼루션 백본(예를 들면, 컨볼루션 신경 네트워크(CNN))에 전달된다. 이러한 풍부한 특징 맵은 2D 컨볼루션 백본에 커플링된 검출 헤드 및 GPE 헤드에 입력되며, 검출 헤드와 GPE 헤드는, 제각기, 대상체와 지평면을 추정하도록 구성된다. GPE 손실을 계산하기 위해 이러한 추정치가 그라운드 트루스 맵과 비교된다. GPE 손실은 LSN을 통해 역전파되어 LSN의 파라미터(예를 들면, 가중치(weight), 편향(bias))를 업데이트한다.

일 실시예에서, GPE 헤드는 완전 컨볼루션 신경 네트워크(fully convolutional neural network)이다. 상이한 스트라이드(예를 들면, 스트라이드 8, 스트라이드 16 및 스트라이드 32)에서의 컨볼루션 특징 맵이 2D 컨볼루션 백본으로부터 획득되고 GPE 헤드에 입력된다. 특징 맵은 원래의 특징 맵 크기를 획득하기 위해 디컨볼루션 계층(deconvolution layer)을 통해 업샘플링된다. 업샘플링된 맵이 가중 합산을 통해 결합되어, 지평면을 추정하는 최종 출력 맵을 획득한다. LSN을 트레이닝시키기 위해, 네트워크에 의해 예측된 출력 맵과 그라운드 트루스 맵 사이의 손실 함수(예를 들면, smooth-l1 회귀 손실)를 사용하여 GPE 손실이 최소화된다. 일 실시예에서, 전체 그라운드 트루스 맵에 대한 주석이 달린 지면 데이터가 이용 가능하지 않은 경우, 검출 헤드의 출력 맵에서의 주석이 달린 3D 경계 박스의 바닥면의 네 모서리가 그라운드 트루스 맵을 채우기 위해 그라운드 트루스 데이터로서 사용될 수 있다.

시스템 개관

도 1은 자율 주행 능력을 갖는 자율 주행 차량(100)의 일 예를 도시한다.

본원에서 사용되는 바와 같이, "자율 주행 능력"이라는 용어는, 완전한 자율 주행 차량, 고도의 자율 주행 차량, 및 조건부 자율 주행 차량을 제한 없이 포함하는, 실시간 인간 개입 없이 차량이 부분적으로 또는 완전하게 동작할 수 있게 하는 기능, 특징, 또는 설비를 지칭한다.

본원에서 사용되는 바와 같이, 자율 주행 차량(AV)은 자율 주행 능력을 갖는 차량이다.

본원에서 사용되는 바와 같이, "차량"은 상품 또는 사람의 운송 수단을 포함한다. 예를 들어, 자동차, 버스, 기차, 비행기, 드론, 트럭, 보트, 선박, 잠수함, 비행선 등. 무인 자동차는 차량의 예이다.

본원에서 사용되는 바와 같이, "궤적"은 제1 시공간적 위치로부터 제2 시공간적 위치로 AV를 동작시키는 경로 또는 루트를 지칭한다. 일 실시예에서, 제1 시공간적 위치는 초기 또는 시작 위치라고 지칭되고 제2 시공간적 위치는 목적지, 최종 위치, 목표, 목표 위치, 또는 목표 장소라고 지칭된다. 일부 예에서, 궤적은 하나 이상의 맵 세그먼트(예를 들면, 도로의 섹션)를 횡단하고, 각각의 세그먼트는 하나 이상의 블록(예를 들면, 차선 또는 교차로의 부분)으로 구성된다. 일 실시예에서, 시공간적 위치는 현실 세계 위치에 대응한다. 예를 들어, 시공간적 위치는 사람을 태우거나 내려주고 또는 상품을 싣거나 내리는 픽업(pick up) 위치 또는 드롭 오프(drop-off) 위치이다.

본원에서 사용되는 바와 같이, "센서(들)"는 센서를 둘러싸는 환경에 관한 정보를 검출하는 하나 이상의 하드웨어 컴포넌트를 포함한다. 하드웨어 컴포넌트들 중 일부는 감지 컴포넌트(예를 들면, 이미지 센서, 생체 측정 센서), 송신 및/또는 수신 컴포넌트(예를 들면, 레이저 또는 라디오 주파수 파 송신기 및 수신기), 아날로그 대 디지털 변환기와 같은 전자 컴포넌트, 데이터 저장 디바이스(예컨대, RAM 및/또는 비휘발성 스토리지), 소프트웨어 또는 펌웨어 컴포넌트, 및 ASIC(application-specific integrated circuit), 마이크로프로세서 및/또는 마이크로컨트롤러와 같은 데이터 프로세싱 컴포넌트를 포함할 수 있다.

본원에서 사용되는 바와 같이, "장면 묘사(scene description)"는 AV 차량 상의 하나 이상의 센서에 의해 검출되거나 AV 외부의 소스에 의해 제공되는 하나 이상의 분류된 또는 레이블링된 대상체를 포함하는 데이터 구조(예를 들면, 리스트) 또는 데이터 스트림이다.

본원에서 사용되는 바와 같이, "도로"는 차량에 의해 횡단될 수 있는 물리적 영역이고, 명명된 주요 도로(예를 들면, 도시 거리, 주간 프리웨이(interstate freeway) 등)에 대응할 수 있거나, 또는 명명되지 않은 주요 도로(예를 들면, 주택 또는 사무실 건물 내의 사유 도로, 주차장 섹션, 공터 섹션, 시골 지역의 비포장 경로 등)에 대응할 수 있다. 일부 차량(예를 들면, 4륜 구동 픽업 트럭, 스포츠 유틸리티 차량 등)은 차량 주행에 특히 적합하지 않은 다양한 물리적 영역을 횡단할 수 있기 때문에, "도로"는 임의의 지자체 또는 다른 정부 또는 행정처에 의해 주요 도로로서 공식적으로 규정되지 않은 물리적 영역일 수 있다.

본원에서 사용되는 바와 같이, "차선"은 차량에 의해 횡단될 수 있는 도로의 한 부분이고, 차선 마킹들 사이의 공간의 대부분 또는 전부에 대응할 수 있거나, 또는 차선 마킹들 사이의 공간의 단지 일부(예를 들면, 50% 미만)에 대응할 수 있다. 예를 들어, 멀리 이격된 차선 마킹을 갖는 도로는 차선 마킹들 사이에 둘 이상의 차량을 수용할 수 있어서, 하나의 차량이 차선 마킹을 횡단하지 않으면서 다른 차량을 추월할 수 있고, 따라서 차선 마킹들 사이의 공간보다 더 좁은 차선을 갖거나 차선 마킹들 사이에 2개의 차선을 갖는 것으로 해석될 수 있다. 차선은 차선 마킹의 부재 시에도 해석될 수 있다. 예를 들어, 차선은 환경의 물리적 특징, 예를 들어, 시골 지역에서의 주요 도로를 따라 있는 바위 및 나무에 기초하여 규정될 수 있다.

본원에서 사용되는 바와 같이, "머신 러닝 모델"은, 인공 신경 네트워크, 서포트 벡터 머신, 결정 트리, 회귀 분석, 베이지안 네트워크 및 유전자 알고리즘을 제한 없이 포함하여, 예측을 수행하기 위해 데이터에 대해 트레이닝된 임의의 모델을 포함한다.

본원에서 사용되는 바와 같이, "지평면"은 3D 포인트 클라우드 내의 다른 포인트로부터 세그먼트화되고 지면으로부터 반사된 펄스 광파를 나타내는 포인트 세트이다.

본원에서 사용되는 바와 같이, "추정된 지평면"은 차량에 대한 지평면의 높이의 측정치이다.

본원에서 사용되는 바와 같이, "운전 가능 영역"은, 예를 들어, 맵 데이터, 도로 조건 및 교통 법규를 사용하여 차량에 의해 운전 가능한 것으로 결정된 추정된 지평면의 부분이다.

"하나 이상"은 하나의 요소에 의해 수행되는 기능, 둘 이상의 요소에 의해, 예를 들어, 분산 방식으로, 수행되는 기능, 하나의 요소에 의해 수행되는 여러 기능, 여러 요소에 의해 수행되는 여러 기능, 또는 이들의 임의의 조합을 포함한다.

또한, 제1, 제2 등의 용어가, 일부 예에서, 다양한 요소를 기술하기 위해 본원에서 사용되고 있지만, 이러한 요소가 이러한 용어에 의해 제한되지 않아야 한다는 것이 이해될 것이다. 이러한 용어는 하나의 요소를 다른 요소와 구별하는 데만 사용된다. 예를 들어, 기술된 다양한 실시예의 범위를 벗어나지 않으면서, 제1 접촉은 제2 접촉이라고 지칭될 수 있고, 유사하게 제2 접촉은 제1 접촉이라고 지칭될 수 있다. 제1 접촉과 제2 접촉 둘 모두가 접촉이지만, 동일한 접촉은 아니다.

본원에 기술된 다양한 실시예의 설명에서 사용된 용어는 단지 특정한 실시예를 기술하기 위한 것이며, 제한하는 것으로 의도되지 않는다. 기술된 다양한 실시예 및 첨부된 청구항의 설명에서 사용되는 바와 같이, 단수형은, 문맥이 달리 명확히 표시하지 않는 한, 복수형을 포함하는 것으로 의도되어 있다. "및/또는"이라는 용어가, 본원에서 사용되는 바와 같이, 열거된 연관 항목들 중 하나 이상의 항목의 임의의 및 모든 가능한 조합을 지칭하고 포함한다는 것이 또한 이해될 것이다. 게다가, 용어 "포함한다" 및/또는 "포함하는"은 본 설명에서 사용될 때, 언급된 특징, 정수, 단계, 동작, 요소, 및/또는 컴포넌트의 존재를 명기하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 컴포넌트, 및/또는 그의 그룹의 존재 또는 추가를 배제하지 않는다는 것도 이해될 것이다.

본원에서 사용되는 바와 같이, "~ 경우"라는 용어는 선택적으로 문맥에 따라 "~할 때", 또는 "~시에" 또는 "결정에 응답하여" 또는 "검출에 응답하여"를 의미하는 것으로 해석된다. 마찬가지로, 문구 "~라고 결정된다면" 또는 "[언급된 조건 또는 이벤트]가 검출되는 경우"는 선택적으로 문맥에 따라, "결정할 시에" 또는 "결정에 응답하여" 또는 "[언급된 조건 또는 이벤트]의 검출 시에" 또는 "[언급된 조건 또는 이벤트]의 검출에 응답하여"를 의미하는 것으로 해석된다.

본원에서 사용되는 바와 같이, AV 시스템은 AV의 동작을 지원하는 하드웨어, 소프트웨어, 저장 데이터 및 실시간으로 생성된 데이터의 어레이와 함께 AV를 지칭한다. 일 실시예에서, AV 시스템은 AV 내에 포함된다. 일 실시예에서, AV 시스템은 여러 위치에 걸쳐 확산되어 있다. 예를 들어, AV 시스템의 소프트웨어 중 일부는 도 3과 관련하여 아래에서 기술되는 클라우드 컴퓨팅 환경(300)과 유사한 클라우드 컴퓨팅 환경 상에 구현된다.

일반적으로, 본원은 완전한 자율 주행 차량, 고도의 자율 주행 차량, 및 조건부 자율 주행 차량, 예를 들어, 각각 소위 레벨 5 차량, 레벨 4 차량 및 레벨 3 차량을 포함하는 하나 이상의 자율 주행 능력을 갖는 임의의 차량에 적용 가능한 기술을 개시한다(차량의 자율성의 레벨 분류에 대한 세부 사항은 본원에 그 전체가 참조로 포함된, SAE 국제 표준 J3016: 온로드 자동차 자동 운전 시스템에 관한 용어의 분류 및 정의(Taxonomy and Definitions for Terms Related to On-128-172020-02-28 Road Motor Vehicle Automated Driving Systems) 참조). 또한, 본원에서 개시된 기술은 부분적 자율 주행 차량 및 운전자 보조 차량, 예컨대, 소위 레벨 2 및 레벨 1 차량에도 적용 가능하다(SAE 국제 표준 J3016: 온로드 자동차 자동 운전 시스템에 관한 용어의 분류 및 정의 참조). 일 실시예에서, 레벨 1, 레벨 2, 레벨 3, 레벨 4 및 레벨 5 차량 시스템 중 하나 이상은 센서 입력의 프로세싱에 기초하여 특정의 동작 조건 하에서 특정의 차량 동작(예를 들면, 조향, 제동, 및 맵 사용)을 자동화할 수 있다. 본 문서에서 설명된 기술은, 완전한 자율 주행 차량으로부터 인간 운전 차량에 이르는, 임의의 레벨에 있는 차량에 혜택을 줄 수 있다.

도 1을 참조하면, AV 시스템(120)은, 대상체(예를 들면, 자연 장애물(191), 차량(193), 보행자(192), 자전거 타는 사람, 및 다른 장애물)을 피하고 도로 법규(예를 들면, 동작 규칙 또는 운전 선호사항)를 준수하면서, AV(100)를 궤적(198)을 따라 환경(190)을 통과하여 목적지(199)(때때로 최종 위치라고 지칭됨)로 동작시킨다.

일 실시예에서, AV 시스템(120)은 컴퓨터 프로세서(146)로부터 동작 커맨드를 수신하고 이에 따라 동작하도록 설비된 디바이스(101)를 포함한다. 일 실시예에서, 컴퓨팅 프로세서(146)는 도 3을 참조하여 아래에서 기술되는 프로세서(304)와 유사하다. 디바이스(101)의 예는 조향 컨트롤(102), 브레이크(103), 기어, 가속기 페달 또는 다른 가속 제어 메커니즘, 윈드실드 와이퍼, 사이드 도어 락, 윈도 컨트롤, 및 방향 지시등을 포함한다.

일 실시예에서, AV 시스템(120)은, AV의 위치, 선속도 및 선가속도, 각속도 및 각가속도, 및 헤딩(heading)(예를 들면, AV(100)의 선단의 배향)과 같은, AV(100)의 상태 또는 조건의 속성을 측정 또는 추론하기 위한 센서(121)를 포함한다. 센서(121)의 예는 GNSS, 차량 선가속도 및 각도 변화율(angular rate) 둘 모두를 측정하는 IMU(inertial measurement unit), 휠 슬립률(wheel slip ratio)을 측정 또는 추정하기 위한 휠 속력 센서, 휠 브레이크 압력 또는 제동 토크 센서, 엔진 토크 또는 휠 토크 센서, 그리고 조향각 및 각도 변화율 센서이다.

일 실시예에서, 센서(121)는 AV의 환경의 속성을 감지 또는 측정하기 위한 센서를 또한 포함한다. 예를 들어, 가시광, 적외선 또는 열(또는 둘 모두) 스펙트럼의 단안 또는 스테레오 비디오 카메라(122), LiDAR(123), RADAR, 초음파 센서, TOF(time-of-flight) 깊이 센서, 속력 센서, 온도 센서, 습도 센서, 및 강우 센서.

일 실시예에서, AV 시스템(120)은 컴퓨터 프로세서(146)와 연관된 머신 명령어 또는 센서(121)에 의해 수집된 데이터를 저장하기 위한 데이터 저장 유닛(142) 및 메모리(144)를 포함한다. 일 실시예에서, 데이터 저장 유닛(142)은 도 3과 관련하여 아래에서 기술되는 ROM(308) 또는 저장 디바이스(310)와 유사하다. 일 실시예에서, 메모리(144)는 아래에서 기술되는 메인 메모리(306)와 유사하다. 일 실시예에서, 데이터 저장 유닛(142) 및 메모리(144)는 환경(190)에 관한 과거 정보, 실시간 정보, 및/또는 예측 정보를 저장한다. 일 실시예에서, 저장된 정보는 맵, 운전 성능, 교통 혼잡 업데이트 또는 기상 조건을 포함한다. 일 실시예에서, 환경(190)에 관한 데이터는 원격에 위치된 데이터베이스(134)로부터 통신 채널을 통해 AV(100)에 송신된다.

일 실시예에서, AV 시스템(120)은 다른 차량의 상태 및 조건, 예컨대, 위치, 선속도와 각속도, 선가속도와 각가속도, 및 AV(100)를 향한 선형 헤딩(linear heading)과 각도 헤딩(angular heading)의 측정된 또는 추론된 속성을 통신하기 위한 통신 디바이스(140)를 포함한다. 이러한 디바이스는 V2V(Vehicle-to-Vehicle) 및 V2I(Vehicle-to-Infrastructure) 통신 디바이스 및 포인트-투-포인트(point-to-point) 또는 애드혹(ad hoc) 네트워크 또는 둘 모두를 통한 무선 통신을 위한 디바이스를 포함한다. 일 실시예에서, 통신 디바이스(140)는 (라디오 및 광학 통신을 포함하는) 전자기 스펙트럼 또는 다른 매체(예를 들면, 공기 및 음향 매체)를 통해 통신한다. V2V(Vehicle-to-Vehicle), V2I(Vehicle-to-Infrastructure) 통신(및 일부 실시예에서, 하나 이상의 다른 유형의 통신)의 조합이 때때로 V2X(Vehicle-to-Everything) 통신이라고 지칭된다. V2X 통신은 전형적으로, 자율 주행 차량과의 통신 및 자율 주행 차량들 사이의 통신을 위한 하나 이상의 통신 표준을 준수한다.

일 실시예에서, 통신 디바이스(140)는 통신 인터페이스를 포함한다. 예를 들어, 유선, 무선, WiMAX, Wi-Fi, 블루투스, 위성, 셀룰러, 광학, 근거리, 적외선, 또는 라디오 인터페이스. 통신 인터페이스는 원격에 위치된 데이터베이스(134)로부터 AV 시스템(120)으로 데이터를 송신한다. 일 실시예에서, 원격에 위치된 데이터베이스(134)는 도 2에 기술된 바와 같은 클라우드 컴퓨팅 환경(200)에 내장된다. 통신 인터페이스(140)는 센서(121)로부터 수집된 데이터 또는 AV(100)의 동작에 관련된 다른 데이터를 원격에 위치된 데이터베이스(134)에 송신한다. 일 실시예에서, 통신 인터페이스(140)는 원격 운영(teleoperation)에 관련되는 정보를 AV(100)에 송신한다. 일부 실시예에서, AV(100)는 다른 원격(예를 들면, "클라우드") 서버(136)와 통신한다.

일 실시예에서, 원격에 위치된 데이터베이스(134)는 또한 디지털 데이터를 저장 및 송신한다(예를 들면, 도로 및 거리 위치와 같은 데이터를 저장함). 그러한 데이터는 AV(100) 상의 메모리(144)에 저장되거나, 원격에 위치된 데이터베이스(134)로부터 통신 채널을 통해 AV(100)에 송신된다.

일 실시예에서, 원격에 위치된 데이터베이스(134)는 유사한 시각(time of day)에 궤적(198)을 따라 이전에 주행한 적이 있는 차량의 운전 속성(예를 들면, 속력 프로파일 및 가속도 프로파일)에 관한 과거 정보를 저장 및 송신한다. 일 구현예에서, 그러한 데이터는 AV(100) 상의 메모리(144)에 저장될 수 있거나, 원격에 위치된 데이터베이스(134)로부터 통신 채널을 통해 AV(100)에 송신될 수 있다.

AV(100) 상에 위치된 컴퓨팅 디바이스(146)는 실시간 센서 데이터 및 사전 정보(prior information) 둘 모두에 기초한 제어 액션을 알고리즘적으로 생성하여, AV 시스템(120)이 자율 주행 운전 능력을 실행할 수 있게 한다.

일 실시예에서, AV 시스템(120)은 AV(100)의 사용자(예를 들면, 탑승자 또는 원격 사용자)에게 정보 및 경고를 제공하고 그로부터 입력을 수신하기 위해 컴퓨팅 디바이스(146)에 커플링된 컴퓨터 주변기기(132)를 포함한다. 일 실시예에서, 주변기기(132)는 도 3을 참조하여 아래에서 논의되는 디스플레이(312), 입력 디바이스(314), 및 커서 컨트롤러(316)와 유사하다. 커플링은 무선 또는 유선이다. 인터페이스 디바이스들 중 임의의 둘 이상이 단일 디바이스에 통합될 수 있다.

예시적인 클라우드 컴퓨팅 환경

도 2는 예시적인 "클라우드" 컴퓨팅 환경을 예시한다. 클라우드 컴퓨팅은 구성 가능한 컴퓨팅 리소스(예를 들면, 네트워크, 네트워크 대역폭, 서버, 프로세싱, 메모리, 스토리지, 애플리케이션, 가상 머신, 및 서비스)의 공유 풀에 대한 편리한 온-디맨드 네트워크 액세스를 가능하게 하기 위한 서비스 전달(service delivery)의 일 모델이다. 전형적인 클라우드 컴퓨팅 시스템에서는, 하나 이상의 대규모 클라우드 데이터 센터가 클라우드에 의해 제공되는 서비스를 전달하는 데 사용되는 머신을 수용한다. 이제 도 2를 참조하면, 클라우드 컴퓨팅 환경(200)은 클라우드(202)를 통해 상호연결되는 클라우드 데이터 센터(204a, 204b, 및 204c)를 포함한다. 데이터 센터(204a, 204b, 및 204c)는 클라우드 컴퓨팅 서비스를 클라우드(202)에 연결된 컴퓨터 시스템(206a, 206b, 206c, 206d, 206e, 및 206f)에 제공한다.

클라우드 컴퓨팅 환경(200)은 하나 이상의 클라우드 데이터 센터를 포함한다. 일반적으로, 클라우드 데이터 센터, 예를 들어, 도 2에 도시된 클라우드 데이터 센터(204a)는 클라우드, 예를 들어, 도 2에 도시된 클라우드(202) 또는 클라우드의 특정 부분을 구성하는 서버의 물리적 배열체를 지칭한다. 예를 들어, 서버는 클라우드 데이터 센터 내에 룸, 그룹, 로우(row), 및 랙(rack)으로 물리적으로 배열된다. 클라우드 데이터 센터는 하나 이상의 서버 룸을 포함하는 하나 이상의 구역(zone)을 갖는다. 각각의 룸은 하나 이상의 서버 로우를 가지며, 각각의 로우는 하나 이상의 랙을 포함한다. 각각의 랙은 하나 이상의 개별 서버 노드를 포함한다. 일부 구현예에서, 구역, 룸, 랙, 및/또는 로우 내의 서버는, 전력 요건, 에너지 요건, 열적 요건, 가열 요건, 및/또는 다른 요건을 포함하는, 데이터 센터 설비의 물리적 인프라스트럭처 요건에 기초하여 그룹으로 배열된다. 일 실시예에서, 서버 노드는 도 3에서 기술된 컴퓨터 시스템과 유사하다. 데이터 센터(204a)는 다수의 랙을 통해 분산된 다수의 컴퓨팅 시스템을 갖는다.

클라우드(202)는 클라우드 데이터 센터(204a, 204b, 및 204c)를 상호연결시키고 클라우드 컴퓨팅 서비스에 대한 컴퓨팅 시스템(206a 내지 206f)의 액세스를 용이하게 하는 것을 돕는 네트워크 및 네트워킹 리소스(예를 들어, 네트워킹 장비, 노드, 라우터, 스위치, 및 네트워킹 케이블)와 함께 클라우드 데이터 센터(204a, 204b, 및 204c)를 포함한다. 일 실시예에서, 네트워크는 지상 또는 위성 연결을 사용하여 배포된 유선 또는 무선 링크를 사용하여 커플링된 하나 이상의 로컬 네트워크, 광역 네트워크, 또는 인터네트워크의 임의의 조합을 나타낸다. 네트워크를 거쳐 교환되는 데이터는, IP(Internet Protocol), MPLS(Multiprotocol Label Switching), ATM(Asynchronous Transfer Mode), 및 프레임 릴레이 등과 같은, 임의의 개수의 네트워크 계층 프로토콜을 사용하여 송신된다. 게다가, 네트워크가 다수의 서브 네트워크의 조합을 나타내는 실시예에서는, 기저 서브 네트워크(underlying sub-network) 각각에서 상이한 네트워크 계층 프로토콜이 사용된다. 일부 실시예에서, 네트워크는, 공중 인터넷과 같은, 하나 이상의 상호연결된 인터네트워크를 나타낸다.

컴퓨팅 시스템(206a 내지 206f) 또는 클라우드 컴퓨팅 서비스 소비자는 네트워크 링크 및 네트워크 어댑터를 통해 클라우드(202)에 연결된다. 일 실시예에서, 컴퓨팅 시스템(206a 내지 206f)은 다양한 컴퓨팅 디바이스, 예를 들어, 서버, 데스크톱, 랩톱, 태블릿, 스마트폰, IoT(Internet of Things) 디바이스, 자율 주행 차량(자동차, 드론, 셔틀, 기차, 버스 등을 포함함) 및 소비자 전자기기로서 구현된다. 일 실시예에서, 컴퓨팅 시스템(206a 내지 206f)은 다른 시스템 내에 또는 그 일부로서 구현된다.

예시적인 컴퓨터 시스템

도 3은 컴퓨터 시스템(300)을 예시한다. 일 구현예에서, 컴퓨터 시스템(300)은 특수 목적 컴퓨팅 디바이스이다. 특수 목적 컴퓨팅 디바이스는 기술을 수행하도록 고정-배선(hard-wired)되거나, 기술을 수행하도록 지속적으로 프로그래밍되는 하나 이상의 ASIC(application-specific integrated circuit) 또는 FPGA(field programmable gate array)와 같은 디지털 전자 디바이스를 포함하거나, 펌웨어, 메모리, 다른 스토리지 또는 조합 내의 프로그램 명령어에 따라 기술을 수행하도록 프로그래밍되는 하나 이상의 범용 하드웨어 프로세서를 포함할 수 있다. 그러한 특수 목적 컴퓨팅 디바이스는 또한 커스텀 고정 배선 로직, ASIC, 또는 FPGA를 커스텀 프로그래밍과 조합하여 기술을 실현할 수 있다. 다양한 실시예에서, 특수 목적 컴퓨팅 디바이스는 기술을 구현하기 위한 고정 배선 및/또는 프로그램 로직을 포함하는 데스크톱 컴퓨터 시스템, 휴대용 컴퓨터 시스템, 핸드헬드 디바이스, 네트워크 디바이스, 또는 임의의 다른 디바이스이다.

일 실시예에서, 컴퓨터 시스템(300)은 정보를 통신하기 위한 버스(302) 또는 다른 통신 메커니즘, 및 정보를 프로세싱하기 위해 버스(302)와 커플링된 하드웨어 프로세서(304)를 포함한다. 하드웨어 프로세서(304)는, 예를 들어, 범용 마이크로프로세서이다. 컴퓨터 시스템(300)은 프로세서(304)에 의해 실행될 명령어 및 정보를 저장하기 위해 버스(302)에 커플링된, RAM(random access memory) 또는 다른 동적 저장 디바이스와 같은, 메인 메모리(306)를 또한 포함한다. 일 구현예에서, 메인 메모리(306)는 프로세서(304)에 의해 실행될 명령어의 실행 동안 임시 변수 또는 다른 중간 정보를 저장하는 데 사용된다. 그러한 명령어는, 프로세서(304)에 의해 액세스 가능한 비-일시적 저장 매체에 저장되어 있을 때, 컴퓨터 시스템(300)을 명령어에 지정된 동작을 수행하도록 커스터마이징된 특수 목적 머신으로 만든다.

일 실시예에서, 컴퓨터 시스템(300)은, 프로세서(304)를 위한 정적 정보 및 명령어를 저장하기 위해 버스(302)에 커플링된 ROM(read only memory)(308) 또는 다른 정적 저장 디바이스를 추가로 포함한다. 자기 디스크, 광학 디스크, 솔리드 스테이트 드라이브, 또는 3차원 크로스 포인트 메모리와 같은, 저장 디바이스(310)가 제공되고 정보 및 명령어를 저장하기 위해 버스(302)에 커플링된다.

일 실시예에서, 컴퓨터 시스템(300)은 버스(302)를 통해, 정보를 컴퓨터 사용자에게 디스플레이하기 위한 CRT(cathode ray tube), LCD(liquid crystal display), 플라스마 디스플레이, LED(light emitting diode) 디스플레이, 또는 OLED(organic light emitting diode) 디스플레이와 같은 디스플레이(312)에 커플링된다. 알파벳과 숫자 키 및 다른 키를 포함하는 입력 디바이스(314)는 정보 및 커맨드 선택을 프로세서(304)에 통신하기 위해 버스(302)에 커플링된다. 다른 유형의 사용자 입력 디바이스는 방향 정보 및 커맨드 선택을 프로세서(304)에 통신하고 디스플레이(312) 상에서의 커서 움직임을 제어하기 위한, 마우스, 트랙볼, 터치식 디스플레이, 또는 커서 방향 키와 같은, 커서 컨트롤러(316)이다. 이러한 입력 디바이스는 전형적으로, 디바이스가 평면에서의 위치를 지정할 수 있게 하는 2개의 축, 즉 제1 축(예를 들면, x-축) 및 제2 축(예를 들면, y-축)에서의 2 자유도를 갖는다.

일 실시예에 따르면, 본원에서의 기술은 프로세서(304)가 메인 메모리(306)에 포함된 하나 이상의 명령어의 하나 이상의 시퀀스를 실행하는 것에 응답하여 컴퓨터 시스템(300)에 의해 수행된다. 그러한 명령어는, 저장 디바이스(310)와 같은, 다른 저장 매체로부터 메인 메모리(306) 내로 판독된다. 메인 메모리(306)에 포함된 명령어의 시퀀스의 실행은 프로세서(304)로 하여금 본원에서 기술된 프로세스 단계를 수행하게 한다. 대안적인 실시예에서는, 소프트웨어 명령어 대신에 또는 소프트웨어 명령어와 조합하여 고정 배선 회로가 사용된다.

"저장 매체"라는 용어는, 본 명세서에서 사용되는 바와 같이, 머신이 특정 방식으로 동작하게 하는 데이터 및/또는 명령어를 저장하는 임의의 비-일시적 매체를 지칭한다. 그러한 저장 매체는 비휘발성 매체 및/또는 휘발성 매체를 포함한다. 비휘발성 매체는, 예를 들어, 광학 디스크, 자기 디스크, 솔리드 스테이트 드라이브, 또는 3차원 크로스 포인트 메모리, 예컨대, 저장 디바이스(310)를 포함한다. 휘발성 매체는 동적 메모리, 예컨대, 메인 메모리(306)를 포함한다. 저장 매체의 일반적인 형태는, 예를 들어, 플로피 디스크, 플렉서블 디스크, 하드 디스크, 솔리드 스테이트 드라이브, 자기 테이프, 또는 임의의 다른 자기 데이터 저장 매체, CD-ROM, 임의의 다른 광학 데이터 저장 매체, 홀 패턴을 갖는 임의의 물리적 매체, RAM, PROM, 및 EPROM, FLASH-EPROM, NV-RAM, 또는 임의의 다른 메모리 칩, 또는 카트리지를 포함한다.

저장 매체는 송신 매체와 별개이지만 송신 매체와 함께 사용될 수 있다. 송신 매체는 저장 매체들 사이에서 정보를 전달하는 데 참여한다. 예를 들어, 송신 매체는 버스(302)를 포함하는 와이어를 포함하여, 동축 케이블, 구리 와이어 및 광섬유를 포함한다. 송신 매체는 또한, 라디오 파 및 적외선 데이터 통신 동안 생성되는 것과 같은, 광파 또는 음향파의 형태를 취할 수 있다.

일 실시예에서, 실행을 위해 하나 이상의 명령어의 하나 이상의 시퀀스를 프로세서(304)에 반송하는 데 다양한 형태의 매체가 관여된다. 예를 들어, 명령어는 초기에 원격 컴퓨터의 자기 디스크 또는 솔리드 스테이트 드라이브에 보유된다. 원격 컴퓨터는 동적 메모리에 명령어를 로딩하고 모뎀을 사용하여 전화선을 통해 명령어를 전송한다. 컴퓨터 시스템(300)에 로컬인 모뎀은 전화선 상으로 데이터를 수신하고 적외선 송신기를 사용하여 데이터를 적외선 신호로 변환한다. 적외선 검출기는 적외선 신호로 반송되는 데이터를 수신하고 적절한 회로는 데이터를 버스(302)에 배치한다. 버스(302)는 데이터를 메인 메모리(306)로 반송하고, 프로세서(304)는 메인 메모리로부터 명령어를 리트리빙(retrieving) 및 실행한다. 메인 메모리(306)에 의해 수신된 명령어는 프로세서(304)에 의해 실행되기 전이나 실행된 후에 선택적으로 저장 디바이스(310)에 저장될 수 있다.

컴퓨터 시스템(300)은 버스(302)에 커플링된 통신 인터페이스(318)를 또한 포함한다. 통신 인터페이스(318)는 로컬 네트워크(322)에 연결된 네트워크 링크(320)에 대한 양방향 데이터 통신(two-way data communication) 커플링을 제공한다. 예를 들어, 통신 인터페이스(318)는 ISDN(integrated service digital network) 카드, 케이블 모뎀, 위성 모뎀, 또는 대응하는 유형의 전화선에 데이터 통신 연결을 제공하기 위한 모뎀이다. 다른 예로서, 통신 인터페이스(318)는 호환 가능한 LAN(local area network)에 데이터 통신 연결을 제공하기 위한 LAN 카드이다. 일부 구현예에서는, 무선 링크도 구현된다. 임의의 그러한 구현예에서, 통신 인터페이스(318)는 다양한 유형의 정보를 나타내는 디지털 데이터 스트림을 반송하는 전기 신호, 전자기 신호, 또는 광학 신호를 전송 및 수신한다.

네트워크 링크(320)는 전형적으로 하나 이상의 네트워크를 통한 다른 데이터 디바이스로의 데이터 통신을 제공한다. 예를 들어, 네트워크 링크(320)는 로컬 네트워크(322)를 통해 호스트 컴퓨터(324)로의 연결 또는 ISP(Internet Service Provider)(326)에 의해 운영되는 클라우드 데이터 센터 또는 장비로의 연결을 제공한다. ISP(326)는 차례로 지금은 "인터넷(328)"이라고 통상적으로 지칭되는 월드-와이드 패킷 데이터 통신 네트워크(world-wide packet data communication network)를 통해 데이터 통신 서비스를 제공한다. 로컬 네트워크(322) 및 인터넷(328) 둘 모두는 디지털 데이터 스트림을 반송하는 전기 신호, 전자기 신호, 또는 광학 신호를 사용한다. 컴퓨터 시스템(300)으로 및 컴퓨터 시스템(200)으로부터 디지털 데이터를 반송하는, 다양한 네트워크를 통한 신호 및 통신 인터페이스(318)를 통한 네트워크 링크(320) 상의 신호는 송신 매체의 예시적인 형태이다. 일 실시예에서, 네트워크(320)는 위에서 기술된 클라우드(202) 또는 클라우드(202)의 일부를 포함한다.

컴퓨터 시스템(300)은 네트워크(들), 네트워크 링크(320), 및 통신 인터페이스(318)를 통해, 프로그램 코드를 포함하여, 메시지를 전송하고 데이터를 수신한다. 일 실시예에서, 컴퓨터 시스템(300)은 프로세싱하기 위한 코드를 수신한다. 수신된 코드는 수신될 때 프로세서(304)에 의해 실행되고 그리고/또는 추후의 실행을 위해 저장 디바이스(310) 또는 다른 비휘발성 스토리지에 저장된다.

예시적인 자율 주행 차량 아키텍처

도 4는 자율 주행 차량(예를 들면, 도 1에 도시된 AV(100))에 대한 예시적인 아키텍처(400)를 도시한다. 아키텍처(400)는 인지 모듈(402)(때때로 인지 회로라고 지칭됨), 계획 모듈(planning module)(404)(때때로 계획 회로라고 지칭됨), 제어 모듈(406)(때때로 제어 회로라고 지칭됨), 로컬화 모듈(localization module)(408)(때때로 로컬화 회로라고 지칭됨), 및 데이터베이스 모듈(410)(때때로 데이터베이스 회로라고 지칭됨)을 포함한다. 각각의 모듈은 AV(100)의 동작에서 소정의 역할을 한다. 모듈(402, 404, 406, 408, 및 410)은, 다 함께, 도 1에 도시된 AV 시스템(120)의 일부일 수 있다. 일부 실시예에서, 모듈(402, 404, 406, 408, 및 410) 중 임의의 모듈은 컴퓨터 소프트웨어(예를 들면, 컴퓨터 판독 가능 매체 상에 저장된 실행 가능 코드) 및 컴퓨터 하드웨어(예를 들면, 하나 이상의 마이크로프로세서, 마이크로컨트롤러, ASIC(application-specific integrated circuit), 하드웨어 메모리 디바이스, 다른 유형의 집적 회로, 다른 유형의 컴퓨터 하드웨어, 또는 이러한 것 중 임의의 것 또는 모든 것의 조합)의 조합이다.

사용 중에, 계획 모듈(404)은 목적지(412)를 나타내는 데이터를 수신하고 목적지(412)에 도달하기 위해(예를 들면, 도착하기 위해) AV(100)에 의해 주행될 수 있는 궤적(414)(때때로 루트라고 지칭됨)을 나타내는 데이터를 결정한다. 계획 모듈(404)이 궤적(414)을 나타내는 데이터를 결정하기 위해, 계획 모듈(404)은 인지 모듈(402), 로컬화 모듈(408), 및 데이터베이스 모듈(410)로부터 데이터를 수신한다.

인지 모듈(402)은, 예를 들면, 도 1에도 도시된 바와 같이, 하나 이상의 센서(121)를 사용하여 인근의 물리적 대상체를 식별한다. 대상체는 분류되고(예를 들면, 보행자, 자전거, 자동차, 교통 표지판 등과 같은 유형으로 그룹화되고), 분류된 대상체(416)를 포함하는 장면 묘사는 계획 모듈(404)에 제공된다.

계획 모듈(404)은 또한 로컬화 모듈(408)로부터 AV 위치(418)를 나타내는 데이터를 수신한다. 로컬화 모듈(408)은 위치를 계산하기 위해 센서(121)로부터의 데이터 및 데이터베이스 모듈(410)로부터의 데이터(예를 들면, 지리적 데이터)를 사용하여 AV 위치를 결정한다. 예를 들어, 로컬화 모듈(408)은 GNSS(Global Navigation Satellite System) 센서로부터의 데이터 및 지리적 데이터를 사용하여 AV의 경도 및 위도를 계산한다. 일 실시예에서, 로컬화 모듈(408)에 의해 사용되는 데이터는 도로 기하학적 속성의 고정밀 맵, 도로망 연결 속성을 기술하는 맵, 도로 물리적 속성(예컨대, 교통 속력, 교통량, 차량 교통 차선과 자전거 타는 사람 교통 차선의 개수, 차선 폭, 차선 교통 방향, 또는 차선 마커 유형 및 위치, 또는 그 조합)을 기술하는 맵, 및 도로 특징부, 예컨대, 횡단보도, 교통 표지판 또는 다양한 유형의 다른 주행 신호(travel signal)의 공간적 위치를 기술하는 맵을 포함한다.

제어 모듈(406)은 궤적(414)을 나타내는 데이터 및 AV 위치(418)를 나타내는 데이터를 수신하고, AV(100)로 하여금 목적지(412)를 향해 궤적(414)을 주행하게 할 방식으로 AV의 제어 기능(420a 내지 420c)(예를 들면, 조향, 스로틀링, 제동, 점화)을 동작시킨다. 예를 들어, 궤적(414)이 좌회전을 포함하는 경우, 제어 모듈(406)은, 조향 기능의 조향각이 AV(100)로 하여금 왼쪽으로 회전하게 하고 스로틀링 및 제동이 AV(100)로 하여금 이러한 회전이 이루어지기 전에 지나가는 보행자 또는 차량을 위해 일시정지 및 대기하게 하는 방식으로, 제어 기능(420a 내지 420c)을 동작시킬 것이다.

LSN을 사용한 예시적인 GPE

도 5는 하나 이상의 실시예에 따른, LSN을 사용한 GPE를 위한 시스템(500)의 블록 다이어그램이다. 시스템(500)은 인코더(502), 2D 컨볼루션 백본(503), 검출 헤드(504) 및 GPE 헤드(505)를 포함한다. 포인트 클라우드(501)(예를 들면, LiDAR에 의한 출력)는 인코더(502)에 입력된다. 일 실시예에서, 포인트 클라우드는 적층 필라 텐서(stacked pillar tensor)(507) 및 필라 인덱스 텐서(pillar index tensor)로 변환된다. 각각의 필라로부터의 샘플링된 포인트(508)는 거리 및 오프셋 측정치(x_c, y_c, z_c, x_p 및 y_p)로 증강(augment)/데코레이션(decorate)(509)되며, 여기서 c 아래 첨자는 샘플링된 포인트와 필라 내의 모든 포인트의 산술 평균 사이의 거리를 나타내고 p 아래 첨자는 필라 x, y 중심으로부터의 샘플링된 포인트의 오프셋을 나타낸다. 증강/데코레이션된 포인트는 포인트 네트워크(510)에 입력되며, 포인트 네트워크(510)는 희소 2차원(2D) 의사 이미지(포인트 특징 맵)(511)를 생성하는 데 사용될 수 있는 특징을 학습하기 위해 증강된 포인트를 사용한다. 포인트 특징 맵(511)은 2D 컨볼루션 백본(503)에 입력된다. 2D 컨볼루션 백본(503)에 의해 출력된 특징은 출력 이미지(506)에 투영되는 3차원(3D) 경계 박스를 검출하고 회귀(regress)하기 위해 검출 헤드(504)(예를 들면, 단일 샷 검출기(single shot detector; SSD))에 의해 사용된다. 카메라 뷰(513)는 투영된 GPE의 시각화이다. 인코더(502)에 관한 추가 세부사항은 (https://arxiv.org/abs/1812.05784)로부터 리트리빙된, Lang Alex H. et al. 2019. PointPillars: Fast Encoders for Object Detection from Point Clouds.arXiv:1812.05784[cs.LG]에서 찾아볼 수 있다.

일 실시예에서, 도 6을 참조하여 더 충분히 설명되는 바와 같이, 2D 컨볼루션 백본(503)은 포인트 특징 맵(511)을 GPE 헤드(505)에 제공하고, GPE 헤드(505)는 추정된 지평면(512)을 출력한다.

도 6은 하나 이상의 실시예에 따른, 2D 컨볼루션 백본(503)에 커플링된 GPE 헤드(505)의 블록 다이어그램이다. 일 실시예에서, GPE 헤드(505)는 CNN이다. 상이한 스트라이드(예를 들면, 스트라이드 8, 스트라이드 16 및 스트라이드 32)에서의 컨볼루션 특징 맵이 2D 컨볼루션 백본(503)으로부터 획득되고 GPE 헤드(505)에 입력된다. 특징 맵은 포인트 특징 맵(511)의 원래 크기로 업샘플링된 특징 맵을 획득하기 위해 디컨볼루션 계층을 통해 업샘플러(602)에 의해 업샘플링된다. 업샘플링된 맵(603)이 가중 합산(604)을 통해 결합되어, GPE인 최종 출력 맵(605)을 획득한다. AV 동작 동안, 출력 맵(605)은, 지평면 추정치 및 다른 데이터(예를 들면, 맵)에 기초하여 운전 가능 영역을 결정하고, AV를 위한 운전 가능 영역을 통한 경로를 계산하기 위해, AV의 지각 파이프라인 또는 루트 플래너에 의해 사용된다.

LSN(500)을 트레이닝시키기 위해, 출력 맵(605)(즉, GPE)과 그라운드 트루스 맵 사이의 손실 함수(예를 들면, smooth-l1 회귀 손실)를 사용하여 GPE 손실(606)이 최소화된다. LSN(500)의 파라미터(예를 들면, 가중치, 편향)를 업데이트하기 위해 GPE 손실(606)이 이어서 역전파된다. 일 실시예에서, 전체 그라운드 트루스 맵에 대한 주석이 달린 지면 데이터가 이용 가능하지 않은 경우, 출력 이미지(506)에서의 주석이 달린 3D 경계 박스의 바닥면의 네 모서리가 그라운드 트루스 맵에서의 누락된 주석이 달린 지면 데이터를 채우기 위해 그라운드 트루스 데이터로서 사용된다.

예시적인 프로세스

도 7은 하나 이상의 실시예에 따른, LSN을 사용한 GPE에 기초한 루트 계획 프로세스의 흐름 다이어그램이다. 프로세스(700)는, 예를 들어, 도 3을 참조하여 기술된 컴퓨터 시스템(300)에 의해 구현될 수 있다.

프로세스(700)는: 환경에서 동작하는 차량의 깊이 센서로부터 포인트 클라우드를 획득하는 단계(701); 포인트 클라우드를 인코딩하는 단계(702); 인코딩된 포인트 클라우드를 입력으로서 갖는 딥 러닝 네트워크를 사용하여, 환경에서의 지평면을 추정하는 단계(703); 추정된 지평면 및 환경의 맵을 사용하여, 환경에서의 운전 가능 영역을 결정하는 단계(704); 운전 가능 영역에 기초하여 환경을 통과하는 경로를 계획하는 단계(705); 및 차량의 제어 회로를 사용하여, 경로를 따라 차량을 동작시키는 단계(706)를 포함한다.

일 실시예에서, 도 5를 참조하여 설명된 바와 같이, 포인트 클라우드는 LiDAR 포인트 클라우드이고, 인코딩은 포인트 필라를 사용한다. 일 실시예에서, 딥 러닝 네트워크는 대상체 검출을 추정하기 위한 검출 헤드 및 GPE를 위한 GPE 헤드에 커플링된 2D 컨볼루션 백본(예를 들면, VGG, 잔차 신경 네트워크(residual neural network))을 포함한다.

도 8은 하나 이상의 실시예에 따른, GPE를 위한 LSN을 트레이닝시키는 프로세스의 흐름 다이어그램이다. 프로세스(800)는, 예를 들어, 도 3을 참조하여 기술된 컴퓨터 시스템(300)에 의해 구현될 수 있다.

프로세스(800)는: 환경에서 동작하는 깊이 센서에 의해 캡처된 포인트 클라우드 데이터를 획득하는 단계(801); 포인트 클라우드 데이터를 인코딩하는 단계(802); 인코딩된 포인트 클라우드 데이터를 입력으로서 갖는 딥 러닝 네트워크를 사용하여, 환경에서의 지평면을 추정하는 단계(803); 추정된 지평면을 그라운드 트루스 맵과 비교하여 GPE 손실을 결정하는 단계(804); 및 GPE 손실에 기초하여 딥 러닝 네트워크의 파라미터(예를 들면, 가중치, 편향)를 업데이트하는 단계(805)를 포함한다.

예를 들어, 딥 러닝 네트워크를 트레이닝시키기 위해, GPE와 그라운드 트루스 맵 사이의 손실 함수(예를 들면, smooth-l1 회귀 손실)를 사용하여 GPE 손실이 최소화된다. LSN(500)의 파라미터(예를 들면, 가중치, 편향)를 업데이트하기 위해 GPE 손실(606)이 이어서 역전파된다.

일 실시예에서, 전체 그라운드 트루스 맵에 대한 주석이 달린 지면 데이터가 이용 가능하지 않은 경우, 주석이 달린 3D 경계 박스의 바닥면의 네 모서리가 그라운드 트루스 맵에서의 누락된 주석이 달린 지면 데이터를 채우기 위해 그라운드 트루스 데이터로서 사용된다.

전술한 설명에서, 본 발명의 실시예는 구현마다 달라질 수 있는 다수의 특정 세부 사항을 참조하여 기술되었다. 따라서, 상세한 설명 및 도면은 제한적인 관점보다는 예시적인 관점에서 보아야 한다. 본 발명의 범위의 유일한 독점적인 지표, 및 출원인이 본 발명의 범위이도록 의도한 것은, 본 출원에서 특정 형태로 나오는 일련의 청구항의 문언적 등가 범위이며, 그러한 청구항이 나오는 특정 형태는 임의의 후속 보정을 포함한다. 그러한 청구항에 포함된 용어에 대한 본원에서 명시적으로 기재된 임의의 정의는 청구항에서 사용되는 그러한 용어의 의미를 결정한다. 그에 부가하여, 전술한 설명 및 이하의 청구항에서 "추가로 포함하는"이라는 용어가 사용될 때, 이 문구에 뒤따르는 것은 추가적인 단계 또는 엔티티, 또는 이전에 언급된 단계 또는 엔티티의 서브-단계/서브-엔티티일 수 있다.

Claims

방법에 있어서,
적어도 하나의 프로세서를 사용하여, 환경 내에서 동작하는 차량의 깊이 센서로부터 포인트 클라우드를 획득하는 단계;
상기 적어도 하나의 프로세서를 사용하여, 상기 포인트 클라우드를 인코딩하는 단계;
상기 인코딩된 포인트 클라우드를 입력으로서 갖는 딥 러닝 네트워크를 사용하여, 상기 환경 내에서의 지평면을 추정하는 단계 ― 상기 추정하는 단계는:
상기 적어도 하나의 프로세서를 사용하여, 입력으로서 상기 포인트 클라우드를 사용하여 상기 딥 러닝 네트워크의 복수의 스트라이드(stride)로부터 특징(feature) 맵을 획득하는 단계;
상기 적어도 하나의 프로세서를 사용하여, 각각의 특징 맵을 원래의 특징 맵 크기로 업샘플링하는 단계; 및
상기 지평면을 추정하는 출력 맵을 생성하기 위해, 상기 적어도 하나의 프로세서 및 가중 합산을 사용하여, 상기 업샘플링된 특징 맵을 결합하는 단계
를 포함함 ― ;
상기 추정된 지평면 및 상기 환경의 맵을 사용하여, 상기 환경 내에서의 운전 가능 영역을 결정하는 단계;
상기 적어도 하나의 프로세서를 사용하여, 상기 운전 가능 영역에 기초하여 상기 환경을 통과하는 경로를 계획하는 단계; 및
상기 차량의 제어 회로를 사용하여, 상기 경로를 따라 상기 차량을 동작시키는 단계
를 포함하는, 방법.
제1항에 있어서,
상기 딥 러닝 네트워크는, 상기 지평면을 추정하기 위한 지평면 추정(ground plane estimation; GPE) 헤드 및 2차원(2D) 컨볼루션 백본 네트워크를 포함하며, 상기 방법은,
상기 2D 컨볼루션 백본 네트워크의 복수의 스트라이드로부터 상기 특징 맵을 획득하고, 상기 2D 컨볼루션 백본 네트워크를 사용하여 상기 출력 맵을 생성하는 단계;
상기 출력 맵을 상기 GPE 헤드에 제공하는 단계; 및
상기 출력 맵을 사용하여, 상기 GPE 헤드에 의해 상기 지평면을 추정하는 단계
를 더 포함하는, 방법.
제2항에 있어서,
상기 포인트 클라우드를 인코딩하는 단계는:
상기 포인트 클라우드를 이미지 임베딩에서의 2D 필라(pillar)로 분할하는 단계;
각각의 필라에 대해,
일정 수의 샘플 포인트를 선택하는 단계;
상기 선택된 샘플 포인트에 일정 수의 증강(augmentation)을 추가하는 단계; 및
상기 필라에 대한 포인트 특징을 획득하기 위해, 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하는 단계;
2D 포인트 특징 맵을 생성하기 위해, 상기 포인트 특징을 그 각자의 필라 위치에 기초하여 포인트 특징 맵으로 렌더링하는 단계;
상이한 스트라이드의 풍부한 특징 맵(rich feature map)을 획득하기 위해, 상기 2D 컨볼루션 백본 네트워크를 사용하여, 상기 2D 포인트 특징 맵을 프로세싱하는 단계; 및
상기 지평면을 추정하기 위해, 상기 풍부한 특징 맵을 상기 GPE 헤드에 전달하는 단계
를 더 포함하는, 방법.
제3항에 있어서,
상기 이미지 임베딩은 조감도(bird's eye view; BEV) 이미지인, 방법.
제2항에 있어서,
상기 GPE 헤드는 하나 이상의 컨볼루션 계층을 포함하는, 방법.
방법에 있어서,
적어도 하나의 프로세서를 사용하여, 환경 내에서 동작하는 깊이 센서에 의해 캡처된 포인트 클라우드를 획득하는 단계;
상기 적어도 하나의 프로세서를 사용하여, 상기 포인트 클라우드를 인코딩하는 단계;
딥 러닝 네트워크를 사용하여, 상기 환경 내에서의 지평면을 추정하는 단계 ― 상기 추정하는 단계는:
상기 적어도 하나의 프로세서를 사용하여, 입력으로서 상기 포인트 클라우드를 사용하여 상기 딥 러닝 네트워크의 복수의 스트라이드로부터 특징 맵을 획득하는 단계;
상기 적어도 하나의 프로세서를 사용하여, 각각의 특징 맵을 원래의 특징 맵 크기로 업샘플링하는 단계; 및
상기 지평면을 추정하는 출력 맵을 생성하기 위해, 상기 적어도 하나의 프로세서 및 가중 합산을 사용하여, 상기 업샘플링된 특징 맵을 결합하는 단계
를 포함함 ― ;
지평면 추정 손실을 결정하기 위해, 상기 적어도 하나의 프로세서를 사용하여, 상기 추정된 지평면을 그라운드 트루스(ground truth) 맵과 비교하는 단계; 및
상기 적어도 하나의 프로세서를 사용하여, 상기 결정된 지평면 추정 손실에 기초하여 상기 딥 러닝 네트워크의 파라미터를 업데이트하는 단계
를 포함하는, 방법.
제6항에 있어서,
상기 지평면 추정 손실을 추정하기 위해, 상기 추정된 지평면을 그라운드 트루스 맵과 비교하는 단계는, 상기 지평면의 추정치와 상기 그라운드 트루스 맵의 손실 함수를 최소화하는 단계를 더 포함하는, 방법.
제7항에 있어서,
상기 손실 함수는 smooth-l1 회귀 손실인, 방법.
제6항에 있어서,
상기 딥 러닝 네트워크는, 상기 지평면을 추정하기 위한 지평면 추정(GPE) 헤드에 커플링된 2차원(2D) 컨볼루션 백본 네트워크를 포함하며, 상기 방법은,
상기 2D 컨볼루션 백본 네트워크의 복수의 스트라이드로부터 상기 특징 맵을 획득하고, 상기 2D 컨볼루션 백본 네트워크를 사용하여 상기 출력 맵을 생성하는 단계;
상기 출력 맵을 상기 GPE 헤드에 제공하는 단계; 및
상기 출력 맵을 사용하여, 상기 GPE 헤드에 의해 상기 지평면을 추정하는 단계
를 더 포함하는, 방법.
제9항에 있어서,
상기 포인트 클라우드를 인코딩하는 단계는:
상기 포인트 클라우드를 이미지 임베딩에서의 2D 필라로 분할하는 단계;
각각의 필라에 대해,
일정 수의 샘플 포인트를 선택하는 단계;
상기 선택된 샘플 포인트에 일정 수의 증강을 추가하는 단계; 및
상기 필라에 대한 포인트 특징을 획득하기 위해, 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하는 단계;
2D 포인트 특징 맵을 생성하기 위해, 상기 포인트 특징을 그 각자의 필라 위치에 기초하여 포인트 특징 맵으로 렌더링하는 단계;
상이한 스트라이드의 풍부한 특징 맵을 획득하기 위해, 상기 2D 컨볼루션 백본 네트워크를 사용하여, 상기 2D 포인트 특징 맵을 프로세싱하는 단계; 및
상기 지평면을 추정하기 위해, 상기 풍부한 특징 맵을 상기 GPE 헤드에 전달하는 단계
를 더 포함하는, 방법.
제9항에 있어서,
상기 GPE 헤드는 하나 이상의 컨볼루션 계층을 포함하는, 방법.
차량에 있어서,
환경의 포인트 클라우드를 생성하도록 구성된 깊이 센서;
제어 회로; 및
적어도 하나의 프로세서
를 포함하며, 상기 적어도 하나의 프로세서는:
상기 깊이 센서로부터 상기 포인트 클라우드를 획득하고;
상기 포인트 클라우드를 인코딩하고;
딥 러닝 네트워크를 사용하여, 상기 환경 내에서의 지평면을 추정하고 ― 상기 추정은:
상기 적어도 하나의 프로세서를 사용하여, 입력으로서 상기 포인트 클라우드를 사용하여 상기 딥 러닝 네트워크의 복수의 스트라이드로부터 특징 맵을 획득하는 것;
상기 적어도 하나의 프로세서를 사용하여, 각각의 특징 맵을 원래의 특징 맵 크기로 업샘플링하는 것; 및
상기 지평면을 추정하는 출력 맵을 생성하기 위해, 상기 적어도 하나의 프로세서 및 가중 합산을 사용하여, 상기 업샘플링된 특징 맵을 결합하는 것
을 포함함 ― ;
상기 추정된 지평면 및 상기 환경의 맵을 사용하여, 상기 환경 내에서의 운전 가능 영역을 결정하고;
상기 운전 가능 영역에 기초하여 상기 환경을 통과하는 경로를 계획하고;
상기 제어 회로를 사용하여, 상기 경로를 따라 상기 차량을 동작시키도록
구성되는, 차량.
제12항에 있어서,
상기 딥 러닝 네트워크는:
2차원(2D) 컨볼루션 백본 네트워크의 복수의 스트라이드로부터 상기 특징 맵을 생성하고 상기 출력 맵을 생성하도록 구성된 상기 2D 컨볼루션 백본 네트워크; 및
상기 2D 컨볼루션 백본 네트워크에 커플링된 지평면 추정(GPE) 헤드
를 더 포함하고, 상기 GPE 헤드는:
상기 2D 컨볼루션 백본 네트워크로부터 상기 출력 맵을 획득하고;
상기 출력 맵을 사용하여 상기 지평면을 추정하도록
구성되는, 차량.
제13항에 있어서,
상기 포인트 클라우드를 인코딩하는 것은:
상기 포인트 클라우드를 이미지 임베딩에서의 2차원(2D) 필라로 분할하는 것;
각각의 필라에 대해,
일정 수의 샘플 포인트를 선택하는 것;
상기 선택된 샘플 포인트에 일정 수의 증강을 추가하는 것;
상기 필라에 대한 포인트 특징을 획득하기 위해, 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하는 것;
2D 포인트 특징 맵을 생성하기 위해, 상기 포인트 특징을 그 각자의 필라 위치에 기초하여 포인트 특징 맵으로 렌더링하는 것;
상이한 스트라이드의 풍부한 특징 맵을 획득하기 위해, 상기 2D 컨볼루션 백본 네트워크를 사용하여, 상기 2D 포인트 특징 맵을 프로세싱하는 것; 및
상기 지평면을 추정하기 위해, 상기 풍부한 특징 맵을 상기 GPE 헤드에 전달하는 것
을 더 포함하는, 차량.
제13항에 있어서,
상기 GPE 헤드는 하나 이상의 컨볼루션 계층을 포함하는, 차량.
시스템에 있어서,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 동작들을 수행하게 하는 명령어를 저장한 메모리
를 포함하며, 상기 동작들은:
환경 내에서 동작하는 깊이 센서에 의해 캡처된 포인트 클라우드를 획득하는 동작;
상기 포인트 클라우드를 인코딩하는 동작;
딥 러닝 네트워크를 사용하여, 상기 환경 내에서의 지평면을 추정하는 동작 ― 상기 추정하는 동작은:
상기 적어도 하나의 프로세서를 사용하여, 입력으로서 상기 포인트 클라우드를 사용하여 상기 딥 러닝 네트워크의 복수의 스트라이드로부터 특징 맵을 획득하는 동작;
상기 적어도 하나의 프로세서를 사용하여, 각각의 특징 맵을 원래의 특징 맵 크기로 업샘플링하는 동작; 및
상기 지평면을 추정하는 출력 맵을 생성하기 위해, 상기 적어도 하나의 프로세서 및 가중 합산을 사용하여, 상기 업샘플링된 특징 맵을 결합하는 동작
을 포함함 ― ;
지평면 추정 손실을 결정하기 위해, 상기 추정된 지평면을 그라운드 트루스 맵과 비교하는 동작; 및
상기 결정된 지평면 추정 손실에 기초하여 상기 딥 러닝 네트워크의 파라미터를 업데이트하는 동작
을 포함하는, 시스템.
제16항에 있어서,
상기 지평면 추정 손실을 추정하기 위해, 상기 추정된 지평면을 그라운드 트루스 맵과 비교하는 동작은, 상기 지평면의 추정치와 상기 그라운드 트루스 맵의 손실 함수를 최소화하는 동작을 더 포함하는, 시스템.
제17항에 있어서,
상기 손실 함수는 smooth-l1 회귀 손실인, 시스템.
제16항에 있어서,
상기 포인트 클라우드를 인코딩하는 동작은:
상기 포인트 클라우드를 이미지 임베딩에서의 2차원(2D) 필라로 분할하는 동작;
각각의 필라에 대해,
일정 수의 샘플 포인트를 선택하는 동작;
상기 선택된 샘플 포인트에 일정 수의 증강을 추가하는 동작; 및
상기 필라에 대한 포인트 특징을 획득하기 위해, 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하는 동작;
2D 포인트 특징 맵을 생성하기 위해, 상기 포인트 특징을 그 각자의 필라 위치에 기초하여 포인트 특징 맵으로 렌더링하는 동작;
상이한 스트라이드의 풍부한 특징 맵을 획득하기 위해, 상기 딥 러닝 네트워크를 사용하여, 상기 2D 포인트 특징 맵을 프로세싱하는 동작; 및
상기 풍부한 특징 맵을 사용하여 상기 지평면을 추정하는 동작
을 더 포함하는, 시스템.
제16항에 있어서,
상기 딥 러닝 네트워크는 하나 이상의 컨볼루션 계층을 포함하는, 시스템.
방법에 있어서,
적어도 하나의 프로세서를 사용하여, 환경 내에서 동작하는 차량의 깊이 센서로부터 포인트 클라우드를 획득하는 단계;
상기 적어도 하나의 프로세서를 사용하여, 상기 포인트 클라우드를 인코딩하는 단계 ― 상기 인코딩하는 단계는:
이미지 임베딩에서 상기 포인트 클라우드를 복수의 서브세트로 분할하는 단계;
각각의 서브세트에 대해, 일정 수의 샘플 포인트를 선택하고, 적어도 선택된 상기 샘플 포인트에의 증강(augmentation) 추가에 기초하여 포인트 특징을 획득하는 단계;
상기 획득된 포인트 특징을 사용하여 포인트 특징 맵을 생성하는 단계
를 포함함 ― ;
딥 러닝 네트워크를 사용하여, 상기 환경 내에서의 지평면을 추정하는 단계 ― 상기 추정하는 단계는 상기 딥 러닝 네트워크로의 입력으로서 상기 포인트 특징 맵을 포함하는 상기 인코딩된 포인트 클라우드의 사용에 기초하고, 상기 추정하는 단계는:
상이한 스트라이드의 풍부한 특징 맵을 획득하기 위해, 상기 딥 러닝 네트워크의 제1 섹션을 사용하여, 상기 포인트 특징 맵을 프로세싱하는 단계; 및
상기 딥 러닝 네트워크의 제2 섹션 및 상기 풍부한 특징 맵을 사용하여 상기 환경 내에서의 상기 지평면을 추정하는 단계
를 포함함 ― ;
상기 추정된 지평면 및 상기 환경의 맵을 사용하여, 상기 환경 내에서의 운전 가능 영역을 결정하는 단계;
상기 적어도 하나의 프로세서를 사용하여, 상기 운전 가능 영역에 기초하여 상기 환경을 통과하는 경로를 계획하는 단계; 및
상기 차량의 제어 회로를 사용하여, 상기 경로를 따라 상기 차량을 동작시키는 단계
를 포함하는, 방법.
제21항에 있어서,
상기 포인트 클라우드의 서브세트는 2차원(2D) 필라이고, 상기 포인트 특징 맵을 생성하는 단계는:
상기 필라에 대한 개별 포인트 특징을 획득하기 위해, 포인트 네트워크를 사용하여, 각각의 필라를 프로세싱하는 단계; 및
2D 포인트 특징 맵을 생성하기 위해, 상기 포인트 특징을 그 각자의 필라 위치에 기초하여 상기 포인트 특징 맵으로 렌더링하는 단계
를 포함하는 것인, 방법.
제22항에 있어서,
상기 딥 러닝 네트워크의 상기 제1 섹션 및 상기 제2 섹션은 각각 2D 컨볼루션 백본 네트워크 및 지평면 추정(GPE) 헤드 네트워크를 포함하고, 상기 딥 러닝 네트워크를 사용하여 상기 환경 내에서의 지평면을 추정하는 단계는:
상기 2D 포인트 특징 맵을 사용하여, 상기 2D 컨볼루션 백본 네트워크의 복수의 스트라이드로부터 풍부한 특징 맵을 획득하는 단계;
상기 풍부한 특징 맵을 상기 GPE 헤드 네트워크에 전달하는 단계;
상기 GPE 헤드 네트워크를 사용하여, 각각의 풍부한 특징 맵을 원래의 특징 맵 크기로 업샘플링하는 단계;
상기 GPE 헤드 네트워크를 사용하여, 각각의 업샘플링된 특징 맵을 가중하는 단계; 및
상기 GPE 헤드 네트워크를 사용하여, 상기 지평면을 추정하는 출력 맵을 생성하기 위해 상기 가중된 특징 맵을 결합하는 단계
를 포함하는, 방법.