KR20240005944A

KR20240005944A - 박스 예측을 사용한 lidar 포인트 클라우드 세그먼트화 개선

Info

Publication number: KR20240005944A
Application number: KR1020237042644A
Authority: KR
Inventors: 루빙 조우; 시아올리 멩; 카란 라젠드라 셰티
Original assignee: 모셔널 에이디 엘엘씨
Priority date: 2021-05-10
Filing date: 2022-05-10
Publication date: 2024-01-12
Also published as: WO2022240882A1; EP4337510A1; US20220357453A1

Abstract

예시적인 방법에서, 인지 시스템은 복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신하고, 포인트들을 복수의 클러스터들로 클러스터링한다. 클러스터들은 대상체의 제1 부분을 나타내는 제1 클러스터, 및 대상체의 제2 부분을 나타내는 제2 클러스터를 포함한다. 또한, 인지 시스템은 적어도 제1 클러스터 및 제2 클러스터를 둘러싸는 제1 경계 박스를 생성하고, 적어도 제1 클러스터 및 제2 클러스터를 둘러싸는 제2 경계 박스를 생성한다. 인지 시스템은 제1 경계 박스 또는 제2 경계 박스 중 하나를 선택하고, 대상체를 나타내는 제2 데이터를 출력한다. 제2 데이터는 선택된 경계 박스의 표시 및 대상체의 표시를 포함한다.

Description

박스 예측을 사용한 LIDAR 포인트 클라우드 세그먼트화 개선

본 설명은 LiDAR(Light Detection and Ranging) 시스템을 사용하여 생성된 포인트 클라우드들과 같은 포인트 클라우드들을 세그먼트화하고 분류하는 것에 관한 것이다.

자율 주행 차량(autonomous vehicle; AV)은 LiDAR 시스템을 사용하여 AV의 환경 내의 대상체들의 위치들을 결정할 수 있다. 예를 들어, AV는 LiDAR 시스템을 사용하여 AV의 환경을 스캔하고, AV에 근접한 하나 이상의 대상체의 외부 표면들 상의 포인트들을 표시하는 포인트 클라우드를 생성할 수 있다. 또한, AV는 포인트들을 다수의 클러스터들로 세그먼트화할 수 있고, 여기서 각각의 클러스터는 환경 내의 상이한 각각의 대상체와 연관된다. 각각의 클러스터는 각각의 대상체의 특성들(예를 들어, 대상체의 유형, 대상체의 치수 등)을 결정하고, AV에 대한 대상체의 위치를 식별하고, 그리고/또는 AV에 관한 대상체의 미래 위치를 예측하기 위해 사용될 수 있다.

도 1은 자율 주행 능력을 갖는 AV의 예를 도시한다.
도 2는 예시적인 "클라우드" 컴퓨팅 환경을 도시한다.
도 3은 컴퓨터 시스템을 도시한다.
도 4는 AV를 위한 예시적인 아키텍처를 도시한다.
도 5는 인지 모듈에 의해 사용될 수 있는 입력들 및 출력들의 예를 도시한다.
도 6은 LiDAR 시스템의 예를 도시한다.
도 7은 동작 중인 LiDAR 시스템을 도시한다.
도 8은 LiDAR 시스템의 동작을 더 상세히 도시한다.
도 9는 계획 모듈의 입력들과 출력들 사이의 관계들의 블록도를 도시한다.
도 10은 경로 계획에 사용되는 방향 그래프를 도시한다.
도 11은 제어 모듈의 입력들 및 출력들의 블록도를 도시한다.
도 12는 제어기의 입력들, 출력들, 및 컴포넌트들의 블록도를 도시한다.
도 13은 포인트들을 클러스터들로 클러스터링하고 포인트들의 클러스터들 각각을 분류하기 위한 예시적인 클러스터 세그먼트화 및 분류 시스템을 도시한다.
도 14는 예시적인 신경망(1400)을 도시한다.
도 15a 내지 도 15c는 포인트 클라우드의 과도 세그먼트화(over-segmentation)를 정정하기 위한 예시적인 프로세스를 도시한다.
도 16a 내지 도 16c는 포인트 클라우드의 과소 세그먼트화(under-segmentation)를 정정하기 위한 예시적인 프로세스를 도시한다.
도 17a는 포인트 클라우드의 과도 세그먼트화를 정정하기 위한 예시적인 프로세스의 흐름도를 도시한다.
도 17b는 포인트 클라우드의 과소 세그먼트화를 정정하기 위한 예시적인 프로세스의 흐름도를 도시한다.

이하의 설명에서, 설명의 목적들을 위해, 본 발명의 철저한 이해를 제공하도록, 다수의 특정 세부사항이 제시된다. 그렇지만, 본 발명이 이러한 특정 세부 사항들이 없더라도 실시될 수 있음이 명백할 것이다. 다른 경우에, 잘 알려진 구조들 및 디바이스들은 본 발명을 불필요하게 모호하게 하는 것을 피하기 위하여 블록 다이어그램 형태로 도시되어 있다.

도면들에, 설명의 용이성을 위해, 디바이스들, 모듈들, 명령어 블록들 및 데이터 요소들을 나타내는 것들과 같은, 개략적인 요소들의 특정 배열들 또는 순서들이 도시되어 있다. 그렇지만, 본 기술 분야의 통상의 기술자라면, 도면들에서의 개략적인 요소들의 특정 순서 또는 배열이 프로세싱의 특정 순서 또는 시퀀스, 또는 프로세스들의 분리가 요구됨을 암시하는 것으로 의미되지 않는다는 점을 이해할 것이다. 게다가, 도면에 개략적인 요소를 포함시키는 것은, 그러한 요소가 모든 실시예들에서 요구됨을 암시하는 것으로 의미되지 않거나, 또는 그러한 요소에 의해 표현되는 특징들이 일부 실시예들에서 포함되지 않을 수 있거나 다른 요소들과 조합되지 않을 수 있음을 암시하는 것으로 의미되지 않는다.

게다가, 도면들에서, 2 개 이상의 다른 개략적인 요소 사이의 연결, 관계 또는 연관을 예시하기 위해 실선 또는 파선 또는 화살표와 같은 연결 요소들이 사용되는 경우에, 임의의 그러한 연결 요소들의 부재는 연결, 관계 또는 연관이 존재하지 않을 수 있음을 암시하는 것으로 의미되지 않는다. 환언하면, 요소들 사이의 일부 연결들, 관계들 또는 연관들은 본 개시를 모호하게 하지 않기 위해 도면들에 도시되어 있지 않다. 추가적으로, 예시의 용이성을 위해, 요소들 사이의 다수의 연결들, 관계들 또는 연관들을 나타내기 위해 단일의 연결 요소가 사용된다. 예를 들어, 연결 요소가 신호들, 데이터 또는 명령어들의 통신을 나타내는 경우에, 본 기술 분야의 통상의 기술자라면 그러한 요소가, 통신을 수행하기 위해 필요로 할 수 있는, 하나 또는 다수의 신호 경로(예를 들면, 버스)를 나타낸다는 것을 이해할 것이다.

이제, 실시예들이 상세하게 참조될 것이며, 그 실시예들의 예들이 첨부 도면들에 예시된다. 하기의 상세한 설명에서, 많은 구체적인 상세사항들이 다양하게 설명된 실시예들의 완전한 이해를 제공하기 위해 기재된다. 그렇지만, 다양한 기술된 실시예들이 이러한 특정 세부 사항들이 없더라도 실시될 수 있다는 것이 본 기술 분야의 통상의 기술자에게 명백할 것이다. 다른 경우에, 실시예들의 양태들을 불필요하게 모호하게 하지 않기 위해 잘 알려진 방법들, 절차들, 컴포넌트들, 회로들, 및 네트워크들은 상세하게 기술되지 않았다.

각각이 서로 독립적으로 또는 다른 특징들의 임의의 조합과 함께 사용될 수 있는 여러 특징들이 이하에서 기술된다. 그렇지만, 임의의 개별 특징은 위에서 논의된 문제들 중 어떤 것도 해결할 수 없거나 또는 위에서 논의된 문제들 중 하나만을 해결할 수 있다. 위에서 논의된 문제들 중 일부가 본원에 기술된 특징들 중 임의의 것에 의해 완전히 해결되지는 않을 수 있다. 비록 여러 표제들이 제공되어 있더라도, 특정 표제에 관련되지만 해당 표제를 갖는 섹션에서 발견되지는 않는 정보가 본 설명의 다른 곳에서 발견될 수도 있다. 실시예들은 이하의 개요에 따라 본원에 기술된다:

1. 일반적 개관

2. 시스템 개관

3. AV 아키텍처

4. AV 입력들

5. AV 계획

6. AV 제어

7. AV 클러스터 세그먼트화 및 분류 시스템

일반적 개관

LIDAR 시스템들은 환경에서 하나 이상의 대상체를 나타내는 포인트 클라우드들을 생성하는 데 사용될 수 있다. 예로서, AV는 AV 주위의 환경을 스캔하고 AV에 근접한 다른 차량들, 보행자들, 장애물들 등의 위치를 표시하는 포인트 클라우드들을 생성하는 LiDAR 시스템을 포함할 수 있다.

일부 경우들에서, 포인트 클라우드(또는 그 일부)는 단일 대상체가 다수의 포인트 클러스터들에 의해 잘못 나타내어지도록 "과도 세그먼트화"될 수 있다. 다른 경우들에서, 포인트 클라우드(또는 그 일부)는 다수의 대상체들이 포인트들의 단일 클러스터에 의해 잘못 나타내어지도록 “과소 세그먼트화”될 수 있다.

과도 세그먼트화를 감소시키기 위해, 포인트들의 각각의 클러스터에 대해, 경계 박스가 포인트들의 클러스터와 포인트들의 다른 인접한 클러스터를 둘러싸도록(enclose), (예를 들어, 머신 러닝을 사용하여) 경계 박스가 "예측"될 수 있다. 다수의 경계 박스들은 (예를 들어, 비-최대 억제를 사용하여) 함께 병합될 수 있고, 그에 따라 결과적인 박스는 동일한 대상체에 각각 대응하는 다수의 포인트 클러스터들을 둘러싼다.

과소 세그먼트화를 감소시키기 위해, 포인트들의 각각의 클러스터에 대해, 다수의 경계 박스들이 (예를 들어, 머신 러닝을 사용하여) 경계 박스들이 클러스터의 상이한 각각의 부분들을 둘러싸도록 “예측”될 수 있다. 경계 박스들 각각이 상이한 각각의 대상체에 대응하는 포인트들을 둘러싸도록 경계 박스들이 선택될 수 있다.

이러한 기법들의 이점들 중 일부는 센서 데이터(예를 들어, 포인트 클라우드와 연관된 LiDAR 데이터 등)에 기초하여 AV의 시스템(예를 들어, 인지 시스템 등)이 대상체들을 식별하는 정확도를 개선하는 것을 포함한다.

예를 들어, 과잉 세그먼트화의 경우, 본 명세서에서 설명되는 기법들 중 일부를 구현하지 않고서, 시스템(예를 들어, 인지 시스템)으로 송신되는 포인트 클라우드와 연관된 데이터를 생성하기 위해 LiDAR 시스템이 사용될 수 있다. 차례로, 시스템은 포인트 클라우드에 기초하여 단일 차량을 2개의 상이한 차량들로서 잘못 식별할 수 있다. 차량을 2개의 차량으로서 잘못 식별한 경우, 시스템은 AV가 2개의 추정된 차량들 사이에서 주행을 시도하게 할 궤적들을 생성할 수 있고, 궤적들(AV를 제어하기 위해 사용되는 경우)은 실제 차량과 충돌을 초래할 것이다.

다른 예로서, 과소 세그먼트화의 경우, 본 명세서에서 설명되는 기법들 중 일부를 구현하지 않고, 시스템(예를 들어, 인지 시스템)으로 송신되는 포인트 클라우드와 연관된 데이터를 생성하기 위해 LiDAR 시스템이 사용될 수 있다. 시스템에서, 차례로, 다수의 보행자들을 단일 보행자로서 잘못 식별할 수 있다. 보행자들을 단일 보행자로서 잘못 식별한 경우, 시스템은 보행자들이 서로 독립적으로 움직일 가능성을 고려하지 않는 궤적들을 생성할 수 있고, 궤적들(AV를 제어하기 위해 사용되는 경우)은 AV가 보행자들 중 하나 이상에 관하여ㅇ 의도하지 않은 방식으로 이동하게 할 수 있다.

본 출원에서 설명되는 기법들은 과도 세그먼트화 및 과소 세그먼트화의 가능성을 감소시킬 수 있다. 따라서, AV는 대상체들을 보다 정확하게 식별하고 자율 주행 동작들을 보다 안전하게 수행할 수 있다.

시스템 개관

도 1은 자율 주행 능력을 갖는 AV(100)의 예를 도시한다.

본원에서 사용되는 바와 같이, "자율 주행 능력"이라는 용어는, 완전 AV들, 고도 AV들, 및 조건부 AV들을 제한 없이 포함하는, 실시간 인간 개입 없이 차량이 부분적으로 또는 완전하게 작동할 수 있게 하는 기능, 특징, 또는 설비를 지칭한다.

본원에서 사용되는 바와 같이, AV는 자율 주행 능력을 갖는 차량이다.

본원에서 사용되는 바와 같이, "차량"은 상품 또는 사람의 운송 수단을 포함한다. 예를 들어, 자동차, 버스, 기차, 비행기, 드론, 트럭, 보트, 선박, 잠수함, 비행선 등. 무인 자동차는 차량의 일 예이다.

본원에서 사용되는 바와 같이, "궤적"은 제1 시공간적 위치로부터 제2 시공간적 위치로 AV를 내비게이팅하는 경로 또는 루트를 지칭한다. 일 실시예에서, 제1 시공간적 위치는 초기 또는 시작 위치라고 지칭되고 제2 시공간적 위치는 목적지, 최종 위치, 목표, 목표 위치, 또는 목표 장소라고 지칭된다. 일부 예들에서, 궤적은 하나 이상의 세그먼트(예를 들면, 도로 섹션)로 구성되고, 각각의 세그먼트는 하나 이상의 블록(예를 들면, 차선 또는 교차로의 부분)으로 구성된다. 일 실시예에서, 시공간적 위치들은 현실 세계 위치들에 대응한다. 예를 들어, 시공간적 위치들은 사람을 태우거나 내려주고 또는 상품을 싣거나 내리는 픽업(pick up) 위치 또는 하차(drop-off) 위치이다.

본원에서 사용되는 바와 같이, "센서(들)"는 센서를 둘러싸는 환경에 관한 정보를 검출하는 하나 이상의 하드웨어 컴포넌트를 포함한다. 하드웨어 컴포넌트들 중 일부는 감지 컴포넌트들(예를 들어, 이미지 센서들, 생체 측정 센서들), 송신 및/또는 수신 컴포넌트들(예를 들어, 레이저 또는 무선 주파수 파 송신기들 및 수신기들), 아날로그 대 디지털 변환기들과 같은 전자 컴포넌트들, 데이터 저장 디바이스(예를 들어, RAM 및/또는 비휘발성 스토리지), 소프트웨어 또는 펌웨어 컴포넌트들, 및 ASIC(application-specific integrated circuit), 마이크로프로세서 및/또는 마이크로제어기와 같은 데이터 프로세싱 컴포넌트들을 포함할 수 있다.

본원에서 사용되는 바와 같이, "장면 설명"은 AV 차량 상의 하나 이상의 센서에 의해 검출되거나 또는 AV 외부의 소스에 의해 제공되는 하나 이상의 분류되거나 라벨링된 대상체를 포함하는 데이터 구조(예를 들어, 리스트) 또는 데이터 스트림이다.

본원에서 사용되는 바와 같이, "도로"는 차량에 의해 횡단될 수 있는 물리적 영역이고, 명명된 주요 도로(예를 들면, 도시 거리, 주간 프리웨이(interstate freeway) 등)에 대응할 수 있거나, 또는 명명되지 않은 주요 도로(예를 들면, 주택 또는 사무실 건물에서의 사유 도로(driveway), 주차장의 섹션, 공터의 섹션, 시골 지역에의 비포장 경로 등)에 대응할 수 있다. 일부 차량들(예를 들면, 4륜 구동 픽업 트럭들, 스포츠 유틸리티 차량들 등)은 차량 주행에 특히 적합하지 않은 다양한 물리적 영역들을 횡단할 수 있기 때문에, "도로"는 임의의 지자체 또는 다른 정부 또는 행정처에 의해 주요 도로로서 공식적으로 규정되지 않은 물리적 영역일 수 있다.

본 명세서에서 사용되는 바와 같이, "차선"은 차량에 의해 횡단될 수 있는 도로의 일부이다. 차선은 때때로 차선 마킹들에 기초하여 식별된다. 예를 들어, 차선은 차선 마킹들 사이의 공간의 대부분 또는 전부에 대응할 수 있거나, 또는 차선 마킹들 사이의 공간의 단지 일부(예를 들면, 50% 미만)에 대응할 수 있다. 예를 들어, 멀리 이격된 차선 마킹들을 갖는 도로는 차선 마킹들 사이에 둘 이상의 차량을 수용할 수 있어서, 하나의 차량이 차선 마킹들을 횡단하지 않으면서 다른 차량을 추월할 수 있고, 따라서 차선 마킹들 사이의 공간보다 더 좁은 차선을 갖거나 차선 마킹들 사이에 2 개의 차선을 갖는 것으로 해석될 수 있다. 차선은 차선 마킹들의 부재 시에도 해석될 수 있다. 예를 들어, 차선은 환경의 물리적 특징물들, 예를 들면, 시골 지역에서의 주요 도로를 따라 있는 바위들 및 나무들 또는 미개발 지역에서 피해야 할 자연 방해물들에 기초하여 규정될 수 있다. 차선은 또한 차선 마킹들 또는 물리적 피처들과 독립적으로 해석될 수 있다. 예를 들어, 차선은 차선 경계들로서 해석될 피처들이 없는 영역 내의 장애물이 없는 임의의 경로에 기초하여 해석될 수 있다. 예시적인 시나리오에서, AV는 필드 또는 빈 로트의 장애물이 없는 부분을 통해 차선을 해석할 수 있다. 다른 예시적인 시나리오에서, AV는 차선 마킹이 없는 넓은(예를 들어, 2개 이상의 차선들을 위해 충분히 넓은) 도로를 통해 차선을 해석할 수 있다. 이 시나리오에서, AV는 차선에 관한 정보를 다른 AV들에게 전달할 수 있어, 다른 AV들은 자신들 간의 경로 계획을 조정하기 위해 동일한 차선 정보를 사용할 수 있다.

본 명세서에서 사용되는 바와 같이, "호모토피(homotopy)"는 AV가 특정 경로를 횡단하는 동안 부착할 수 있는 AV의 궤적에 대한 제약들의 세트의 서브세트를 의미한다.

본 명세서에서 사용되는 바와 같이, "실현 가능"은 AV가 목적지로 이동하는 동안 호모토피의 제약을 준수할 수 있는지 여부를 의미한다.

"하나 이상"은 하나의 요소에 의해 수행되는 기능, 둘 이상의 요소에 의해, 예를 들어, 분산 방식으로, 수행되는 기능, 하나의 요소에 의해 수행되는 여러 기능들, 여러 요소들에 의해 수행되는 여러 기능들, 또는 이들의 임의의 조합을 포함한다.

제1, 제2 등의 용어들이, 일부 경우에, 다양한 요소들을 기술하기 위해 본원에서 사용되고 있지만, 이러한 요소들이 이러한 용어들에 의해 제한되지 않아야 한다는 것이 또한 이해될 것이다. 이러한 용어들은 단지 하나의 요소를 다른 요소와 구별하기 위해서만 사용된다. 예를 들어, 다양한 기술된 실시예들의 범위를 벗어나지 않으면서, 제1 접촉은 제2 접촉이라고 지칭될 수 있고, 유사하게 제2 접촉은 제1 접촉이라고 지칭될 수 있다. 제1 접촉과 제2 접촉은 둘 모두 접촉이지만, 동일한 접촉은 아니다.

본원에 기술된 다양한 실시예들에 대한 설명에서 사용되는 전문용어는 단지 특정한 실시예들을 기술하기 위한 것이며, 제한하는 것으로 의도되지 않는다. 다양한 기술된 실시예들에 대한 설명 및 첨부된 청구항들에서 사용되는 바와 같이, 단수 형태들(“a,” “an” 및 “the”)은, 문맥이 달리 명확히 나타내지 않는 한, 복수 형태들도 포함하는 것으로 의도된다. "및/또는"이라는 용어가, 본원에서 사용되는 바와 같이, 연관된 열거된 항목들 중 하나 이상의 항목의 임의의 및 모든 가능한 조합들을 지칭하고 포괄한다는 것이 또한 이해될 것이다. "포함한다(includes)", 포함하는(including), 포함한다(comprises)" 및/또는 "포함하는(comprising)"이라는 용어들이, 본 설명에서 사용될 때, 언급된 특징들, 정수들, 단계들, 동작들, 요소들, 및/또는 컴포넌트들의 존재를 명시하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 컴포넌트, 및/또는 이들의 그룹들의 존재 또는 추가를 배제하지 않는다는 것이 추가로 이해될 것이다.

본원에서 사용되는 바와 같이, "~ 경우"라는 용어는, 선택적으로, 문맥에 따라 "~할 때", 또는 "~시에" 또는 "~라고 결정하는 것에 응답하여" 또는 "~을 검출하는 것에 응답하여"를 의미하는 것으로 해석된다. 마찬가지로, 문구 "~라고 결정되는 경우" 또는 "[언급된 조건 또는 이벤트]가 검출되는 경우"는, 선택적으로, 문맥에 따라, "~라고 결정할 시에" 또는 "~라고 결정하는 것에 응답하여" 또는 "[언급된 조건 또는 이벤트]를 검출할 시에" 또는 "[언급된 조건 또는 이벤트]를 검출하는 것에 응답하여"를 의미하는 것으로 해석된다.

본원에서 사용되는 바와 같이, AV 시스템은 AV의 작동을 지원하는 하드웨어, 소프트웨어, 저장된 데이터 및 실시간으로 생성되는 데이터의 어레이와 함께 AV를 지칭한다. 일 실시예에서, AV 시스템은 AV 내에 통합된다. 일 실시예에서, AV 시스템은 여러 위치들에 걸쳐 확산되어 있다. 예를 들어, AV 시스템의 소프트웨어 중 일부는 도 3과 관련하여 아래에서 기술되는 클라우드 컴퓨팅 환경(300)과 유사한 클라우드 컴퓨팅 환경에서 구현된다.

일반적으로, 본원은 완전 AV들, 고도 AV들, 및 조건부 AV들, 예컨대, 제각기, 소위 레벨 5 차량, 레벨 4 차량 및 레벨 3 차량을 포함하는 하나 이상의 자율 주행 능력을 갖는 임의의 차량에 적용 가능한 기술들을 개시한다(차량의 자율성의 레벨 분류에 대한 세부 사항은 그 전체가 참고로 포함되는, SAE 국제 표준 J3016: 온로드 자동차 자동 운전 시스템에 관한 용어의 분류 및 정의(Taxonomy and Definitions for Terms Related to On-128-172020-02-28 Road Motor Vehicle Automated Driving Systems) 참조). 본 문서에서 설명된 기술들은 또한 부분적 AV들 및 운전자 보조 차량, 예컨대, 소위 레벨 2 차량 및 레벨 1 차량에도 적용 가능하다(SAE 국제 표준 J3016: 온로드 자동차 자동 운전 시스템에 관한 용어의 분류 및 정의 참조). 일 실시예에서, 레벨 1, 레벨 2, 레벨 3, 레벨 4 및 레벨 5 차량 시스템들 중 하나 이상은 센서 입력들의 프로세싱에 기초하여 특정 작동 조건들 하에서 특정 차량 작동들(예를 들면, 조향, 제동, 및 맵 사용)을 자동화할 수 있다. 본 문서에서 설명된 기술들은, 완전 AV들로부터 인간 운전 차량에 이르는, 임의의 레벨들에 있는 차량들에 혜택을 줄 수 있다.

AV는 인간 운전자를 필요로 하는 차량들에 비해 장점을 갖는다. 하나의 이점은 안전성이다. 예를 들어, 2016년, 미국에서는 600만 개의 자동차 사고들, 240만 개의 부상들, 40,000개의 사망들, 및 1300만 개의 차량 충돌을 경험하였으며, 이는 9100억 달러 이상의 사회적 비용으로 추정된다. 차량들에 배치된 추가적인 안전 조치들로 인해, 1억 마일 주행당 미국 교통 사망 사고가 1965~2015년 약 6명에서 약 1명으로 감소되었다. 예를 들어, 충돌이 발생하려고 한다는 추가적인 0.5초의 경고는 전방-후방 충돌들의 60%를 완화시키는 것으로 여겨진다. 그러나, 수동 안전 피처들(예를 들어, 안전 벨트들, 에어백들)은 이 수를 개선하는 데 있어서 한계에 도달했을 가능성이 있다. 따라서, 차량의 자동화된 제어와 같은 능동적 안전 조치들이 이러한 통계들을 개선하기 위한 다음 단계일 가능성이 높다. 인간 운전자들은 충돌의 95 %에서 중요한 충돌 전 이벤트를 담당하는 것으로 여겨지기 때문에, 자동화된 운전 시스템들은 예를 들어, 인간보다 중요한 상황들을 더 잘 인식하고 회피하고; 인간보다 더 나은 결정들을 내리고, 교통법규들을 준수하고, 미래의 이벤트들을 더 잘 예측하고; 인간보다 차량을 더 잘 제어함으로써, 더 나은 안전 결과들을 달성할 가능성이 높다.

도 1을 참조하면, AV 시스템(120)은, 대상체들(예를 들면, 자연 장애물들(191), 차량들(193), 보행자들(192), 자전거 타는 사람들, 및 다른 장애물들)을 피하고 도로 규칙들(예를 들면, 운영 규칙들 또는 운전 선호사항들)을 준수하면서, AV(100)를 궤적(198)을 따라 환경(190)을 통해 목적지(199)(때때로 최종 위치라고 지칭됨)까지 작동시킨다.

일 실시예에서, AV 시스템(120)은 컴퓨터 프로세서들(146)로부터 작동 커맨드들을 수신하고 이에 따라 작동하도록 설비된 디바이스들(101)을 포함한다. 우리는 "동작 커맨드"라는 용어를 사용하여 차량이 작업(예를 들어, 운전 조작)을 수행하도록 하는 실행 가능한 명령어(또는 명령어들의 세트)를 의미한다. 동작 커맨드들은, 제한 없이, 차량이 전진 시작, 전진 정지, 후진 시작, 후진 정지, 가속, 감속, 좌회전 수행, 및 우회전 수행하기 위한 명령어들을 포함할 수 있다. 일 실시예에서, 컴퓨팅 프로세서들(146)은 도 3을 참조하여 아래에서 기술되는 프로세서(304)와 유사하다. 디바이스들(101)의 예들은 조향 컨트롤(102), 브레이크(103), 기어, 액셀러레이터 페달 또는 다른 가속 제어 메커니즘, 윈드실드 와이퍼, 사이드 도어 록, 윈도 컨트롤, 및 방향 지시등을 포함한다.

일 실시예에서, AV 시스템(120)은, AV의 위치, 선각속도 및 선각가속도, 및 헤딩(heading)(예를 들면, AV(100)의 선단의 배향)과 같은, AV(100)의 상태 또는 조건의 속성들을 측정 또는 추론하기 위한 센서들(121)을 포함한다. 센서들(121)의 예는 GPS, 차량 선가속도 및 각도 변화율(angular rate) 둘 모두를 측정하는 IMU(inertial measurement unit), 휠 슬립률(wheel slip ratio)을 측정 또는 추정하기 위한 휠 속력 센서, 휠 브레이크 압력 또는 제동 토크 센서, 엔진 토크 또는 휠 토크 센서, 그리고 조향각 및 각도 변화율 센서이다.

일 실시예에서, 센서들(121)은 AV의 환경의 속성들을 감지 또는 측정하기 위한 센서들을 또한 포함한다. 예를 들어, 가시 광, 적외선 또는 열(또는 둘 모두) 스펙트럼의 단안 또는 스테레오 비디오 카메라들(122), LiDAR(123), RADAR, 초음파 센서들, 비행 시간(time-of-flight, TOF) 깊이 센서들, 속력 센서들, 온도 센서들, 습도 센서들, 및 강수 센서들.

일 실시예에서, AV 시스템(120)은 컴퓨터 프로세서들(146)과 연관된 머신 명령어들 또는 센서들(121)에 의해 수집되는 데이터를 저장하기 위한 데이터 저장 유닛(142) 및 메모리(144)를 포함한다. 일 실시예에서, 데이터 저장 유닛(142)은 도 3과 관련하여 아래에서 기술되는 ROM(308) 또는 저장 디바이스(310)와 유사하다. 일 실시예에서, 메모리(144)는 아래에서 기술되는 메인 메모리(306)와 유사하다. 일 실시예에서, 데이터 저장 유닛(142) 및 메모리(144)는 환경(190)에 관한 과거 정보, 실시간 정보, 및/또는 예측 정보를 저장한다. 일 실시예에서, 저장된 정보는 맵들, 운전 수행, 교통 혼잡 업데이트들 또는 기상 조건들을 포함한다. 일 실시예에서, 환경(190)에 관련된 데이터는 원격에 위치하는 데이터베이스(134)로부터 통신 채널을 통해 AV(100)로 송신된다.

일 실시예에서, AV 시스템(120)은 다른 차량의 상태들 및 조건들, 예컨대, 위치, 선속도와 각속도, 선가속도와 각가속도, 및 AV(100)를 향한 선형 헤딩(linear heading)과 각도 헤딩(angular heading)의 측정된 또는 추론된 속성들을 통신하기 위한 통신 디바이스들(140)을 포함한다. 이러한 디바이스들은 V2V(Vehicle-to-Vehicle) 및 V2I(Vehicle-to-Infrastructure) 통신 디바이스들 및 포인트 투 포인트(point-to-point) 또는 애드혹(ad hoc) 네트워크들 또는 둘 모두를 통한 무선 통신을 위한 디바이스들을 포함한다. 일 실시예에서, 통신 디바이스들(140)은 (무선 및 광학 통신을 포함하는) 전자기 스펙트럼 또는 다른 매체(예를 들면, 공기 및 음향 매체)를 통해 통신한다. V2V(Vehicle-to-Vehicle), V2I(Vehicle-to-Infrastructure) 통신(및 일부 실시예들에서, 하나 이상의 다른 유형의 통신)의 조합이 때때로 V2X(Vehicle-to-Everything) 통신이라고 지칭된다. V2X 통신은 전형적으로, AV들과의 통신 및 AV들 간의 통신을 위한 하나 이상의 통신 표준을 준수한다.

일 실시예에서, 통신 디바이스들(140)은 통신 인터페이스들을 포함한다. 예를 들어, 유선, 무선, WiMAX, Wi-Fi, 블루투스, 위성, 셀룰러, 광학, 근거리(near field), 적외선, 또는 무선(radio) 인터페이스들. 통신 인터페이스들은 원격에 위치하는 데이터베이스(134)로부터 AV 시스템(120)으로 데이터를 송신한다. 일 실시예에서, 원격에 위치하는 데이터베이스(134)는 도 2에 기술된 바와 같은 클라우드 컴퓨팅 환경(200)에 내장되어 있다. 통신 인터페이스들(140)은 센서들(121)로부터 수집되는 데이터 또는 AV(100)의 작동에 관련된 다른 데이터를 원격에 위치하는 데이터베이스(134)로 송신한다. 일 실시예에서, 통신 인터페이스들(140)은 텔레오퍼레이션(teleoperation)에 관련되는 정보를 AV(100)로 송신한다. 일부 실시예들에서, AV(100)는 다른 원격(예를 들면, "클라우드") 서버들(136)과 통신한다.

일 실시예에서, 원격에 위치하는 데이터베이스(134)는 또한 디지털 데이터를 저장 및 송신한다(예를 들면, 도로 및 거리 위치들과 같은 데이터를 저장함). 그러한 데이터는 AV(100) 상의 메모리(144)에 저장되거나, 원격에 위치하는 데이터베이스(134)로부터 통신 채널을 통해 AV(100)로 송신된다.

일 실시예에서, 원격에 위치하는 데이터베이스(134)는 유사한 하루 중 시간(time of day)에 궤적(198)을 따라 이전에 주행했던 차량들의 운전 속성들(예를 들면, 속력 프로필 및 가속도 프로필)에 관한 과거 정보를 저장 및 송신한다. 일 구현예에서, 그러한 데이터는 AV(100) 상의 메모리(144)에 저장될 수 있거나, 또는 원격에 위치하는 데이터베이스(134)로부터 통신 채널을 통해 AV(100)로 송신될 수 있다.

AV(100) 상에 위치하는 컴퓨팅 디바이스들(146)은 실시간 센서 데이터 및 사전 정보(prior information) 둘 모두에 기초하여 제어 행동들을 알고리즘적으로 생성하여, AV 시스템(120)이 그의 자율 주행 운전 능력을 실행할 수 있게 한다.

일 실시예에서, AV 시스템(120)은 AV(100)의 사용자(예를 들면, 탑승자 또는 원격 사용자)에게 정보 및 경고들을 제공하고 그로부터 입력을 수신하기 위한, 컴퓨팅 디바이스들(146)에 결합된 컴퓨터 주변기기들(132)을 포함한다. 일 실시예에서, 주변기기들(132)은 도 3을 참조하여 아래에서 논의되는 디스플레이(312), 입력 디바이스(314), 및 커서 제어기(316)와 유사하다. 결합은 무선 또는 유선이다. 인터페이스 디바이스들 중 임의의 둘 이상이 단일 디바이스에 통합될 수 있다.

일 실시예에서, AV 시스템(120)은 예를 들어, 승객에 의해 지정되거나 승객과 연관된 프로파일에 저장된 승객의 프라이버시 레벨을 수신하고 시행한다. 승객의 프라이버시 레벨은 승객과 연관된 특정 정보(예를 들어, 승객 편의 데이터, 생체 데이터 등)가 사용되고, 승객 프로파일에 저장되고/저장되거나 클라우드 서버(136) 상에 저장되고 승객 프로파일과 연관되는 것이 어떻게 허용되는지를 결정한다. 일 실시예에서, 프라이버시 레벨은 승차가 완료되면 삭제되는, 승객과 연관된 특정 정보를 지정한다. 일 실시예에서, 프라이버시 레벨은 승객과 연관된 특정 정보를 지정하고, 정보에 액세스하도록 인가되는 하나 이상의 엔티티를 식별한다. 정보에 액세스하도록 인가된 특정 엔티티들의 예들은 다른 AV들, 제3자 AV 시스템들, 또는 정보에 잠재적으로 액세스할 수 있는 임의의 엔티티를 포함할 수 있다.

승객의 프라이버시 레벨은 하나 이상의 세분(granularity) 레벨로 지정될 수 있다. 일 실시예에서, 프라이버시 레벨은 저장 또는 공유될 특정 정보를 식별한다. 일 실시예에서, 프라이버시 레벨은 승객이 자신의 개인 정보 중 어느 것도 저장 또는 공유되지 않는다고 명시할 수 있도록 승객과 연관된 모든 정보에 적용된다. 특정 정보에 액세스하도록 허용되는 엔티티들의 사양은 또한 다양한 세분 레벨들로 지정될 수 있다. 특정 정보에 액세스하는 것이 허용되는 다양한 엔티티들의 세트들은, 예를 들어 다른 AV들, 클라우드 서버들(136), 특정 제3자 AV 시스템들 등을 포함할 수 있다.

일 실시예에서, AV 시스템(120) 또는 클라우드 서버(136)는 승객과 연관된 특정 정보가 AV(100) 또는 다른 엔티티에 의해 액세스될 수 있는지 여부를 결정한다. 예를 들어, 특정 시공간 위치와 관련된 승객 입력에 액세스하려고 시도하는 제3자 AV 시스템은, 예를 들어, AV 시스템(120) 또는 클라우드 서버(136)로부터 승객과 연관된 정보에 액세스하기 위한 인가를 획득해야 한다. 예를 들어, AV 시스템(120)은 승객의 지정된 프라이버시 레벨을 사용하여, 시공간 위치와 관련된 승객 입력이 제3자 AV 시스템, AV(100), 또는 다른 AV에 제시될 수 있는지 여부를 결정한다. 이는 승객의 프라이버시 레벨이 승객의 행동들에 관한 데이터 또는 승객과 연관된 다른 데이터를 수신하도록 허용되는 다른 엔티티를 지정할 수 있게 한다.

도 2는 예시적인 "클라우드" 컴퓨팅 환경을 예시한다. 클라우드 컴퓨팅은 구성 가능한 컴퓨팅 리소스들(예를 들면, 네트워크들, 네트워크 대역폭, 서버들, 프로세싱, 메모리, 스토리지, 애플리케이션들, 가상 머신들, 및 서비스들)의 공유 풀에 대한 편리한 온 디맨드 네트워크 액세스를 가능하게 하기 위한 서비스 전달(service delivery)의 일 모델이다. 전형적인 클라우드 컴퓨팅 시스템들에서는, 하나 이상의 대규모 클라우드 데이터 센터가 클라우드에 의해 제공되는 서비스들을 전달하는 데 사용되는 머신들을 수용한다. 이제 도 2를 참조하면, 클라우드 컴퓨팅 환경(200)은 클라우드(202)를 통해 상호연결되는 클라우드 데이터 센터들(204a, 204b 및 204c)을 포함한다. 데이터 센터들(204a, 204b 및 204c)은 클라우드 컴퓨팅 서비스들을 클라우드(202)에 연결된 컴퓨터 시스템들(206a, 206b, 206c, 206d, 206e 및 206f)에 제공한다.

클라우드 컴퓨팅 환경(200)은 하나 이상의 클라우드 데이터 센터를 포함한다. 일반적으로, 클라우드 데이터 센터, 예를 들어, 도 2에 도시된 클라우드 데이터 센터(204a)는 클라우드, 예를 들어, 도 2에 도시된 클라우드(202) 또는 클라우드의 특정 부분을 구성하는 서버들의 물리적 배열을 지칭한다. 예를 들어, 서버들은 클라우드 데이터 센터 내에 룸, 그룹, 로우(row), 및 랙(rack)으로 물리적으로 배열된다. 클라우드 데이터 센터는 하나 이상의 서버 룸을 포함하는 하나 이상의 구역(zone)을 갖는다. 각각의 룸은 하나 이상의 서버 로우를 가지며, 각각의 로우는 하나 이상의 랙을 포함한다. 각각의 랙은 하나 이상의 개별 서버 노드를 포함한다. 어떤 구현예에서, 구역, 룸, 랙, 및/또는 로우 내의 서버들은, 전력 요구사항, 에너지 요구사항, 열적 요구사항, 가열 요구사항, 및/또는 다른 요구사항들을 포함하는, 데이터 센터 설비의 물리적 인프라스트럭처 요구사항들에 기초하여 그룹들로 배열된다. 일 실시예에서, 서버 노드들은 도 3에서 기술된 컴퓨터 시스템과 유사하다. 데이터 센터(204a)는 많은 랙들을 통해 분산된 많은 컴퓨팅 시스템들을 갖는다.

클라우드(202)는 클라우드 데이터 센터들(204a, 204b, 및 204c)을 상호연결시키고 클라우드 컴퓨팅 서비스들에 대한 컴퓨팅 시스템들(206a 내지 206f)의 액세스를 용이하게 하는 것을 돕는 네트워크 및 네트워킹 리소스들(예를 들어, 네트워킹 장비, 노드들, 라우터들, 스위치들, 및 네트워킹 케이블들)과 함께 클라우드 데이터 센터들(204a, 204b 및 204c)을 포함한다. 일 실시예에서, 네트워크는 지상 또는 위성 연결들을 사용하여 배포된 유선 또는 무선 링크들을 사용하여 결합되는 하나 이상의 로컬 네트워크, 광역 네트워크, 또는 인터네트워크의 임의의 조합을 나타낸다. 네트워크를 통해 교환되는 데이터는, IP(Internet Protocol), MPLS(Multiprotocol Label Switching), ATM(Asynchronous Transfer Mode), 및 프레임 릴레이 등과 같은, 임의의 수의 네트워크 계층 프로토콜들을 사용하여 전송된다. 게다가, 네트워크가 다수의 서브 네트워크들의 조합을 나타내는 실시예들에서, 기저 서브 네트워크들(underlying sub-networks) 각각에서 상이한 네트워크 계층 프로토콜들이 사용된다. 일부 실시예들에서, 네트워크는, 공중 인터넷과 같은, 하나 이상의 상호연결된 인터네트워크를 나타낸다.

컴퓨팅 시스템들(206a 내지 206f) 또는 클라우드 컴퓨팅 서비스 소비자들은 네트워크 링크들 및 네트워크 어댑터들을 통해 클라우드(202)에 연결된다. 일 실시예에서, 컴퓨팅 시스템들(206a 내지 206f)은 다양한 컴퓨팅 디바이스들, 예를 들어, 서버, 데스크톱, 랩톱, 태블릿, 스마트폰, IoT(Internet of Things) 디바이스, AV들(자동차, 드론, 셔틀, 기차, 버스 등을 포함함) 및 소비자 전자기기로서 구현된다. 일 실시예에서, 컴퓨팅 시스템들(206a 내지 206f)은 다른 시스템들 내에 또는 그 일부로서 구현된다.

도 3은 컴퓨터 시스템(300)을 예시한다. 일 구현예에서, 컴퓨터 시스템(300)은 특수 목적 컴퓨팅 디바이스이다. 특수 목적 컴퓨팅 디바이스는 기술들을 수행하도록 고정 배선(hard-wired)되거나, 또는 기술들을 수행하도록 영속적으로 프로그래밍되어 있는 하나 이상의 ASIC(application-specific integrated circuit) 또는 FPGA(field programmable gate array)와 같은 디지털 전자 디바이스들을 포함하거나, 또는 펌웨어, 메모리, 다른 스토리지 또는 그 조합 내의 프로그램 명령어들에 따라 기술들을 수행하도록 프로그래밍되어 있는 하나 이상의 범용 하드웨어 프로세서를 포함할 수 있다. 그러한 특수 목적 컴퓨팅 디바이스들은 또한 커스텀 고정 배선 로직, ASIC들, 또는 FPGA들을 커스텀 프로그래밍과 조합하여 기술들을 달성할 수 있다. 다양한 실시예들에서, 특수 목적 컴퓨팅 디바이스들은 기술들을 구현하기 위한 고정 배선 및/또는 프로그램 로직을 포함하는 데스크톱 컴퓨터 시스템들, 휴대용 컴퓨터 시스템들, 핸드헬드 디바이스들, 네트워크 디바이스들, 또는 임의의 다른 디바이스이다.

일 실시예에서, 컴퓨터 시스템(300)은 정보를 통신하기 위한 버스(302) 또는 다른 통신 메커니즘, 및 정보를 프로세싱하기 위한, 버스(302)와 결합된 하드웨어 프로세서(304)를 포함한다. 하드웨어 프로세서(304)는, 예를 들어, 범용 마이크로프로세서이다. 컴퓨터 시스템(300)은 프로세서(304)에 의해 실행될 명령어들 및 정보를 저장하기 위한, 버스(302)에 결합된 메인 메모리(306), 예컨대, RAM(random access memory) 또는 다른 동적 저장 디바이스를 또한 포함한다. 일 구현예에서, 메인 메모리(306)는 프로세서(304)에 의해 실행될 명령어들의 실행 동안 임시 변수들 또는 다른 중간 정보를 저장하는 데 사용된다. 그러한 명령어들은, 프로세서(304)에 의해 액세스 가능한 비일시적 저장 매체에 저장되어 있을 때, 컴퓨터 시스템(300)을 명령어들에 지정된 동작들을 수행하도록 커스터마이징되는 특수 목적 머신으로 만든다.

일 실시예에서, 컴퓨터 시스템(300)은, 프로세서(304)에 대한 명령어들 및 정적 정보를 저장하기 위한, 버스(302)에 결합된 ROM(read only memory)(308) 또는 다른 정적 저장 디바이스를 더 포함한다. 정보 및 명령어들을 저장하기 위한, 자기 디스크, 광학 디스크, 솔리드 스테이트 드라이브, 또는 3차원 크로스 포인트 메모리와 같은, 저장 디바이스(310)가 제공되고 버스(302)에 결합된다.

일 실시예에서, 컴퓨터 시스템(300)은 정보를 컴퓨터 사용자에게 디스플레이하기 위한 CRT(cathode ray tube), LCD(liquid crystal display), 플라스마 디스플레이, LED(light emitting diode) 디스플레이, 또는 OLED(organic light emitting diode) 디스플레이와 같은 디스플레이(312)에 버스(302)를 통해 결합된다. 정보 및 커맨드 선택들을 프로세서(304)로 전달하기 위한 영숫자 키 및 다른 키를 포함하는 입력 디바이스(314)가 버스(302)에 결합된다. 다른 유형의 사용자 입력 디바이스는 방향 정보 및 커맨드 선택들을 프로세서(304)에 전달하고 디스플레이(312) 상에서의 커서 움직임을 제어하기 위한, 마우스, 트랙볼, 터치식 디스플레이, 또는 커서 방향 키들과 같은, 커서 제어기(316)이다. 이러한 입력 디바이스는 전형적으로, 디바이스가 평면에서의 위치들을 지정할 수 있게 하는 2 개의 축, 즉 제1 축(예를 들면, x 축) 및 제2 축(예를 들면, y 축)에서의 2 자유도를 갖는다.

일 실시예에 따르면, 본원에서의 기술들은 프로세서(304)가 메인 메모리(306)에 포함된 하나 이상의 명령어의 하나 이상의 시퀀스를 실행하는 것에 응답하여 컴퓨터 시스템(300)에 의해 수행된다. 그러한 명령어들은, 저장 디바이스(310)와 같은, 다른 저장 매체로부터 메인 메모리(306) 내로 판독된다. 메인 메모리(306)에 포함된 명령어 시퀀스들의 실행은 프로세서(304)로 하여금 본원에 기술된 프로세스 단계들을 수행하게 한다. 대안적인 실시예들에서, 소프트웨어 명령어들 대신에 또는 소프트웨어 명령어들과 조합하여 고정 배선 회로가 사용된다.

본원에서 사용되는 바와 같은 "저장 매체들"이라는 용어는 머신으로 하여금 특정 방식으로 동작하게 하는 명령어들 및/또는 데이터를 저장하는 임의의 비-일시적 매체들을 지칭한다. 그러한 저장 매체는 비휘발성 매체 및/또는 휘발성 매체를 포함한다. 비휘발성 매체는, 예를 들어, 광학 디스크, 자기 디스크, 솔리드 스테이트 드라이브, 또는 3차원 크로스 포인트 메모리, 예컨대, 저장 디바이스(310)를 포함한다. 휘발성 매체는 동적 메모리, 예컨대, 메인 메모리(306)를 포함한다. 통상적인 형태의 저장 매체는, 예를 들어, 플로피 디스크, 플렉서블 디스크, 하드 디스크, 솔리드 스테이트 드라이브, 자기 테이프, 또는 임의의 다른 자기 데이터 저장 매체, CD-ROM, 임의의 다른 광학 데이터 저장 매체, 홀 패턴들을 갖는 임의의 물리적 매체, RAM, PROM, 및 EPROM, FLASH-EPROM, NV-RAM, 또는 임의의 다른 메모리 칩, 또는 카트리지를 포함한다.

저장 매체들은 전송 매체들과 구별되지만 전송 매체들과 함께 사용될 수 있다. 송신 매체는 저장 매체들 사이에서 정보를 전달하는 데 참여한다. 예를 들어, 송신 매체는 버스(302)를 포함하는 전선들을 포함하여, 동축 케이블, 구리선 및 광섬유를 포함한다. 송신 매체는 또한, 전파(radio-wave) 및 적외선 데이터 통신 동안 생성되는 것과 같은, 광파 또는 음향파의 형태를 취할 수 있다.

일 실시예에서, 실행을 위해 하나 이상의 명령어의 하나 이상의 시퀀스를 프로세서(304)로 전달하는 데 다양한 형태의 매체가 관여된다. 예를 들어, 명령어들은 초기에 원격 컴퓨터의 자기 디스크 또는 솔리드 스테이트 드라이브에 보유된다. 원격 컴퓨터는 자신의 동적 메모리에 명령어들을 로드하고 모뎀을 사용하여 전화선을 통해 명령어들을 전송한다. 컴퓨터 시스템(300)에 로컬인 모뎀은 전화선을 통해 데이터를 수신하고 적외선 송신기를 사용하여 데이터를 적외선 신호로 변환한다. 적외선 검출기는 적외선 신호로 전달되는 데이터를 수신하고 적절한 회로는 데이터를 버스(302)에 배치한다. 버스(302)는 데이터를 메인 메모리(306)로 전달하고, 프로세서(304)는 메인 메모리로부터 명령어들을 검색하여 실행한다. 메인 메모리(306)에 의해 수신되는 명령어들은 프로세서(304)에 의해 실행되기 전이나 실행된 후에 선택적으로 저장 디바이스(310)에 저장될 수 있다.

컴퓨터 시스템(300)은 버스(302)에 결합된 통신 인터페이스(318)를 또한 포함한다. 통신 인터페이스(318)는 로컬 네트워크(322)에 연결되는 네트워크 링크(320)에 대한 양방향 데이터 통신(two-way data communication) 결합을 제공한다. 예를 들어, 통신 인터페이스(318)는 ISDN(integrated service digital network) 카드, 케이블 모뎀, 위성 모뎀, 또는 대응하는 유형의 전화선에 대한 데이터 통신 연결을 제공하는 모뎀이다. 다른 예로서, 통신 인터페이스(318)는 호환 가능한 LAN(local area network)에 대한 데이터 통신 연결을 제공하기 위한 LAN 카드이다. 일부 구현예들에서, 무선 링크들이 또한 구현된다. 임의의 그러한 구현예에서, 통신 인터페이스(318)는 다양한 유형의 정보를 나타내는 디지털 데이터 스트림을 전달하는 전기 신호, 전자기 신호, 또는 광학 신호를 전송 및 수신한다.

네트워크 링크(320)는 전형적으로 하나 이상의 네트워크를 통한 다른 데이터 디바이스들로의 데이터 통신을 제공한다. 예를 들어, 네트워크 링크(320)는 로컬 네트워크(322)를 통해 호스트 컴퓨터(324)에 대한 연결 또는 ISP(Internet Service Provider)(326)에 의해 운영되는 클라우드 데이터 센터 또는 장비에 대한 연결을 제공한다. ISP(326)는 차례로 지금은 "인터넷(328)"이라고 통상적으로 지칭되는 월드 와이드 패킷 데이터 통신 네트워크(world-wide packet data communication network)를 통해 데이터 통신 서비스들을 제공한다. 로컬 네트워크(322) 및 인터넷(328)는 둘 모두 디지털 데이터 스트림들을 전달하는 전기 신호, 전자기 신호, 또는 광학 신호를 사용한다. 컴퓨터 시스템(300)으로 그리고 컴퓨터 시스템(300)으로부터 디지털 데이터를 전달하는, 다양한 네트워크들을 통한 신호들 및 통신 인터페이스(318)를 통한 네트워크 링크(320) 상의 신호들은 송신 매체의 예시적인 형태들이다. 일 실시예에서, 네트워크(320)는 위에서 기술된 클라우드(202) 또는 클라우드(202)의 일부를 포함한다.

컴퓨터 시스템(300)은 네트워크(들), 네트워크 링크(320), 및 통신 인터페이스(318)를 통해 메시지들을 전송하고, 프로그램 코드를 포함한, 데이터를 수신한다. 일 실시예에서, 컴퓨터 시스템(300)은 프로세싱하기 위한 코드를 수신한다. 수신된 코드는 수신될 때 프로세서(304)에 의해 실행되고/되거나 추후 실행을 위해 저장 디바이스(310) 또는 다른 비휘발성 스토리지에 저장된다.

AV 아키텍처

도 4는 AV(예를 들면, 도 1에 도시된 AV(100))에 대한 예시적인 아키텍처(400)를 도시한다. 아키텍처(400)는 인지 모듈(402)(때때로 인지 회로라고 지칭됨), 계획 모듈(404)(때때로 계획 회로라고 지칭됨), 제어 시스템(406)(때때로 제어 회로라고 지칭됨), 로컬화 모듈(408)(때때로 로컬화 회로라고 지칭됨), 및 데이터베이스 모듈(410)(때때로 데이터베이스 회로라고 지칭됨)을 포함한다. 각각의 모듈은 AV(100)의 작동에서 소정의 역할을 한다. 다함께, 모듈들(402, 404, 406, 408, 및 410)은 도 1에 도시된 AV 시스템(120)의 일부일 수 있다. 일부 실시예들에서, 모듈들(402, 404, 406, 408, 및 410) 중 임의의 모듈은 컴퓨터 소프트웨어(예를 들면, 컴퓨터 판독 가능 매체 상에 저장된 실행 가능 코드) 및 컴퓨터 하드웨어(예를 들면, 하나 이상의 마이크로프로세서, 마이크로제어기, ASIC(application-specific integrated circuit), 하드웨어 메모리 디바이스, 다른 유형의 집적 회로, 다른 유형의 컴퓨터 하드웨어, 또는 이러한 것들 중 일부 또는 전부의 조합)의 조합이다. 모듈들(402, 404, 406, 408, 및 410) 각각은 때때로 프로세싱 회로(예를 들어, 컴퓨터 하드웨어, 컴퓨터 소프트웨어, 또는 이 둘의 조합)로 지칭된다. 모듈들(402, 404, 406, 408, 및 410) 중 임의의 것 또는 전부의 조합이 또한 프로세싱 회로의 예이다.

사용 중에, 계획 모듈(404)은 목적지(412)를 나타내는 데이터를 수신하고 목적지(412)에 도달(예를 들면, 도착)하기 위해 AV(100)에 의해 주행될 수 있는 궤적(414)(때때로 루트라고 지칭됨)을 나타내는 데이터를 결정한다. 계획 모듈(404)이 궤적(414)을 나타내는 데이터를 결정하기 위해, 계획 모듈(404)은 인지 모듈(402), 로컬화 모듈(408), 및 데이터베이스 모듈(410)로부터 데이터를 수신한다.

인지 모듈(402)은, 예를 들면, 도 1에 또한 도시된 바와 같이, 하나 이상의 센서(121)를 사용하여 인근의 물리적 대상체를 식별한다. 대상체들은 분류되고(예를 들면, 보행자, 자전거, 자동차, 교통 표지판 등과 같은 유형으로 그룹화되고), 분류된 대상체들(416)을 포함하는 장면 묘사는 계획 모듈(404)에 제공된다.

계획 모듈(404)은 또한 로컬화 모듈(408)로부터 AV 위치(418)를 나타내는 데이터를 수신한다. 로컬화 모듈(408)은 위치를 계산하기 위해 센서들(121)로부터의 데이터 및 데이터베이스 모듈(410)로부터의 데이터(예를 들면, 지리적 데이터)를 사용하여 AV 위치를 결정한다. 예를 들어, 로컬화 모듈(408)은 GNSS(Global Navigation Satellite System) 센서로부터의 데이터 및 지리적 데이터를 사용하여 AV의 경도 및 위도를 계산한다. 일 실시예에서, 로컬화 모듈(408)에 의해 사용되는 데이터는 도로 기하학적 속성들의 고정밀 맵, 도로 네트워크 연결 속성들을 기술하는 맵, 도로 물리적 속성들(예를 들어, 교통 속력, 교통량, 차량 교통 차선과 자전거 타는 사람 교통 차선의 수, 차선 폭, 차선 교통 방향, 또는 차선 마커 유형 및 위치, 또는 그 조합)을 기술하는 맵, 및 도로 특징물들, 예컨대, 횡단보도, 교통 표지판 또는 다양한 유형의 다른 주행 신호(travel signal)의 공간적 위치들을 기술하는 맵을 포함한다. 일 실시예에서, 고정밀 맵들은 저정밀 맵들에 자동 또는 수동 주석을 통해 데이터를 추가함으로써 구성된다.

제어 모듈(406)은 궤적(414)을 나타내는 데이터 및 AV 위치(418)를 나타내는 데이터를 수신하고, AV(100)로 하여금 목적지(412)까지 궤적(414)을 주행하게 할 방식으로 AV의 제어 기능들(420a 내지 420c)(예를 들면, 조향, 스로틀링, 제동, 점화 시스템)을 작동시킨다. 예를 들어, 궤적(414)이 좌회전을 포함하는 경우, 제어 모듈(406)은, 조향 기능의 조향각이 AV(100)로 하여금 좌회전하게 하고 스로틀링 및 제동이 AV(100)로 하여금 해당 회전이 이루어지기 전에 지나가는 보행자들 또는 차량들을 위해 일시정지 및 대기하게 하는 방식으로, 제어 기능들(420a 내지 420c)을 작동시킬 것이다.

AV 입력들

도 5는 인지 모듈(402)(도 4)에 의해 사용되는 입력들(502a-d)(예를 들어, 도 1에 도시된 센서(121)) 및 출력들(504a-d)(예를 들어, 센서 데이터)의 예를 도시한다. 하나의 입력(502a)은 LiDAR(Light Detection and Ranging) 시스템(예를 들어, 도 1에 도시된 LiDAR(123))이다. LIDAR는 광(예를 들어, 적외선 광과 같은 광의 버스트들)을 사용하여 자신의 가시선 내의 물리적 대상체들에 관한 데이터를 획득하는 기술이다. LiDAR 시스템은 출력(504a)으로서 LiDAR 데이터를 생성한다. 예를 들어, LiDAR 데이터는 환경(190)의 표현을 구성하는 데 사용되는 3D 또는 2D 포인트들(포인트 클라우드로도 알려짐)의 컬렉션들이다.

다른 입력(502b)은 RADAR 시스템이다. RADAR는 근처의 물리적 대상체에 관한 데이터를 획득하기 위해 전파를 사용하는 기술이다. RADAR는 LiDAR 시스템의 가시선 내에 있지 않은 대상체에 관한 데이터를 획득할 수 있다. RADAR 시스템은 출력(504b)으로서 RADAR 데이터를 생성한다. 예를 들어, RADAR 데이터는 환경(190)의 표현을 구성하기 위해 사용되는 하나 이상의 무선 주파수 전자기 신호이다.

다른 입력(502c)은 카메라 시스템이다. 카메라 시스템은 하나 이상의 카메라(예를 들어, 전하 결합 소자(charge-coupled device; CCD)와 같은 광 센서를 사용하는 디지털 카메라)를 사용하여 근처의 물리적 대상체들에 관한 정보를 획득한다. 카메라 시스템은 출력(504c)으로서 카메라 데이터를 생성한다. 카메라 데이터는 종종 이미지 데이터(예를 들어, RAW, JPEG, PNG 등과 같은 이미지 데이터 포맷의 데이터)의 형태를 취한다. 일부 예시들에서, 카메라 시스템은, 예를 들어, 입체(스테레오 비전)를 목적으로, 카메라 시스템이 깊이를 인지할 수 있게 하는 다수의 독립적인 카메라들을 갖는다. 카메라 시스템에 의해 인식되는 대상체들은 여기서 "근처"로 설명되지만, 이는 AV에 관한 것이다. 일부 실시예들에서, 카메라 시스템은 AV보다 멀리, 예를 들어 최대 1 킬로미터 이상 앞서 있는 대상체들을 "보도록" 구성된다. 따라서, 일부 실시예들에서, 카메라 시스템은 멀리 있는 대상체들을 인식하도록 최적화된 센서들 및 렌즈들과 같은 피처들을 갖는다.

다른 입력(502d)은 신호등 검출(traffic light detection; TLD) 시스템이다. TLD 시스템은 시각적 네비게이션 정보를 제공하는 신호등들, 거리 표지판들, 및 다른 물리적 대상체들에 관한 정보를 획득하기 위해 하나 이상의 카메라를 사용한다. TLD 시스템은 출력(504d)으로서 TLD 데이터를 생성한다. TLD 데이터는 종종 이미지 데이터(예를 들어, RAW, JPEG, PNG 등과 같은 이미지 데이터 포맷의 데이터)의 형태를 취한다. TLD 시스템은 시각적 항법 정보를 제공하는 가능한 한 많은 물리적 대상체들에 대한 정보를 얻기 위해 시야가 넓은 카메라(예를 들어, 광각 렌즈 또는 어안 렌즈를 사용)를 사용하여 AV(100)가 이들 대상체들에 의해 제공되는 모든 관련 내비게이션 정보에 접근할 수 있도록 한다는 점에서 카메라를 통합한 시스템과 상이하다. 예를 들어, TLD 시스템의 시야각은 약 120도 이상이다.

일부 실시예들에서, 출력들(504a-d)은 센서 융합 기법을 사용하여 결합된다. 따라서, 개별 출력들(504a-d)은 AV(100)의 다른 시스템들에 제공되거나(예를 들어, 도 4에 도시된 바와 같이 계획 모듈(404)에 제공됨), 결합된 출력은 단일 결합 출력 또는 동일한 유형(예를 들어, 동일한 결합 기법을 사용하거나 동일한 출력들을 결합하거나 또는 둘 모두) 또는 다른 유형 유형(예를 들어, 상이한 각각의 결합 기법들을 사용하거나 상이한 각각의 출력들을 결합하거나 또는 둘 모두)의 다수의 결합 출력들의 형태로, 다른 시스템들에 제공될 수 있다. 일부 실시예들에서, 초기 융합 기법이 사용된다. 초기 융합 기법은 하나 이상의 데이터 프로세싱 단계가 결합된 출력에 적용되기 전에 출력들을 결합하는 것을 특징으로 한다. 일부 실시예들에서, 후기 융합 기법이 사용된다. 후기 융합 기법은 하나 이상의 데이터 프로세싱 단계가 개별 출력들에 적용된 후에 출력들을 결합하는 것을 특징으로 한다.

도 6은 LiDAR 시스템(602)(예를 들어, 도 5에 도시된 입력(502a))의 예를 도시한다. LiDAR 시스템(602)은 발광 장치(606)(예를 들어, 레이저 송신기)로부터 광(604a-c)을 방출한다. LiDAR 시스템에 의해 방출되는 광은 일반적으로 가시 스펙트럼 내에 있지 않으며; 예를 들어, 적외선이 종종 사용된다. 방출된 광(604b) 중 일부는 물리적 대상체(608)(예를 들어, 차량)를 만나 LiDAR 시스템(602)으로 다시 반사된다. (LiDAR 시스템으로부터 방출된 광은 일반적으로 물리적 대상체들, 예를 들어, 고체 형태의 물리적 대상체들을 관통하지 않는다.) LiDAR 시스템(602)은 또한 반사된 광을 검출하는 하나 이상의 광 검출기(610)를 갖는다. 일 실시예에서, LiDAR 시스템과 연관된 하나 이상의 데이터 프로세싱 시스템은 LiDAR 시스템의 시야(614)를 나타내는 이미지(612)를 생성한다. 이미지(612)는 물리적 대상체(608)의 경계들(616)을 나타내는 정보를 포함한다. 이러한 방식으로, 이미지(612)는 AV 근처의 하나 이상의 물리적 대상체의 경계들(616)을 결정하는 데 사용된다.

도 7은 동작 중인 LiDAR 시스템(602)을 도시한다. 이 도면에 도시된 시나리오에서, AV(100)는 이미지(702)의 형태의 카메라 시스템 출력(504c) 및 LiDAR 데이터 포인트(704)의 형태의 LiDAR 시스템 출력(504a) 모두를 수신한다. 사용 시, AV(100)의 데이터 프로세싱 시스템들은 이미지(702)를 데이터 포인트(704)들과 비교한다. 특히, 이미지(702)에서 식별된 물리적 대상체(706)가 또한 데이터 포인트들(704) 사이에서 식별된다. 이러한 방식으로, AV(100)는 데이터 포인트들(704)의 윤곽 및 밀도에 기초하여 물리적 대상체의 경계들을 인식한다.

도 8은 LiDAR 시스템(602)의 동작을 추가로 상세히 도시한다. 위에서 설명된 바와 같이, AV(100)는 LiDAR 시스템(602)에 의해 검출된 데이터 포인트들의 특성들에 기초하여 물리적 대상체의 경계를 검출한다. 도 8에 도시된 바와 같이, 지면(802)와 같은 평평한 대상체는 LiDAR 시스템(602)으로부터 방출된 광(804a-d)을 일관된 방식으로 반사시킬 것이다. 달리 말하면, LiDAR 시스템(602)이 일정한 간격을 사용하여 광을 방출하기 때문에, 지면(802)은 동일한 일정한 간격을 두고 광을 LiDAR 시스템(602)에 다시 반사시킬 것이다. AV(100)가 지면(802) 위를 이동할 때, LiDAR 시스템(602)은 도로를 방해하는 것이 아무것도 없는 경우 다음 유효 지면 포인트(806)에 의해 반사된 광을 계속 검출할 것이다. 그러나, 대상체(808)가 도로를 막는 경우, LiDAR 시스템(602)에 의해 방출된 광(804e-f)은 예상되는 일관된 방식과 일치하지 않는 방식으로 포인트들(810a-b)로부터 반사될 것이다. 이 정보로부터, AV(100)는 대상체(808)가 존재한다고 결정할 수 있다.

경로 계획

도 9는 (예를 들어, 도 4에 도시된 바와 같이) 계획 모듈(404)의 입력들과 출력들 사이의 관계들의 블록도(900)를 도시한다. 일반적으로, 계획 모듈(404)의 출력은 시작 포인트(904)(예를 들어, 소스 위치 또는 초기 위치)로부터의 경로(902), 및 종료 포인트(906)(예를 들어, 목적지 또는 최종 위치)이다. 경로(902)는 일반적으로 하나 이상의 세그먼트에 의해 정의된다. 예를 들어, 세그먼트는 차도, 도로, 고속도로, 차도, 또는 자동차 주행에 적합한 다른 물리적 영역의 적어도 일부를 통해 주행될 거리이다. 일부 예들에서, 예를 들어, AV(100)가 4륜 구동(four-wheel-drive; 4WD) 또는 전륜 구동(all-wheel-drive; AWD) 자동차, SUV, 픽업 트럭 등과 같은 오프로드 가능 차량인 경우, 경로(902)는 비포장 경로들 또는 개방 필드들과 같은 "오프-로드" 세그먼트들을 포함한다.

경로(902)에 추가하여, 계획 모듈은 또한 차선 레벨 경로 계획 데이터(908)를 출력한다. 차선 레벨 경로 계획 데이터(908)는 특정 시간에 세그먼트의 조건들에 기초하여 루트(902)의 세그먼트들을 횡단하는 데 사용된다. 예를 들어, 경로(902)가 다중 차선 고속도로를 포함하는 경우, 차선 레벨 경로 계획 데이터(908)는 예를 들어, 출구에 접근하고 있는지, 하나 이상의 차선에 다른 차량들이 있는지 여부, 또는 수분 내에 달라지는 다른 요인들에 기초하여 AV(100)가 다수의 차선들 중에서 차선을 선택하는 데 사용할 수 있는 궤도 계획 데이터(910)를 포함한다. 마찬가지로, 일부 구현들에서, 차선 레벨 경로 계획 데이터(908)는 경로(902)의 세그먼트에 특유한 속도 제약들(912)을 포함한다. 예를 들어, 세그먼트가 보행자들 또는 예상치 못한 트래픽을 포함하는 경우, 속도 제약들(912)은 AV(100)를 예상 속도보다 느린 주행 속도, 예를 들어 세그먼트에 대한 속도 제한 데이터에 기초한 속도로 제한할 수 있다.

일 실시예에서, 계획 모듈(404)에 대한 입력들은 데이터베이스 데이터(914)(예를 들어, 도 4에 도시된 데이터베이스 모듈(410)로부터의), 현재 위치 데이터(916)(예를 들어, 도 4에 도시된 AV 위치(418)), 목적지 데이터(918)(예를 들어, 도 4에 도시된 목적지(412)에 대한), 및 대상체 데이터(920)(예를 들어, 도 4에 도시된 바와 같이 인지 모듈(402)에 의해 인식된 분류된 대상체들(416))를 포함한다. 일부 실시예들에서, 데이터베이스 데이터(914)는 "규칙서"로 또한 지칭되는, 계획에 사용되는 규칙들을 포함한다. 규칙들은, 공식적인 언어를 사용하여, 예를 들어 불(Boolean) 로직 또는 선형 시간적 로직(linear temporal logic; LTL)을 사용하여 지정된다. AV(100)에 의해 마주치는 임의의 주어진 상황에서, 규칙들 중 적어도 일부는 상황에 적용될 것이다. 규칙이 AV(100)에 이용가능한 정보, 예컨대 주변 환경에 관한 정보에 기초하여 충족되는 조건들을 갖는 경우, 규칙은 주어진 상황에 적용된다. 규칙들은 우선순위를 가질 수 있다. 예를 들어, “도로가 고속도로인 경우, 가장 좌측 차선으로 이동”이라고 말하는 규칙은 “출구가 1 마일 내에 접근하고 있는 경우, 가장 우측 차선으로 이동”보다 낮은 우선순위를 가질 수 있다.

도 10은 경로 계획에서, 예를 들어 계획 모듈(404)(도 4)에 의해 사용되는 방향 그래프(directed graph)(1000)를 도시한다. 일반적으로, 도 10에 도시된 것과 같은 방향 그래프(1000)는 임의의 시작점(1002)과 끝점(1004) 사이의 경로를 결정하는데 사용된다. 실제 관점에서, 시작 포인트(1002)와 종료 포인트(1004)를 분리하는 거리는 비교적 클 수 있거나(예를 들어, 두 개의 상이한 대도시 영역에서) 비교적 작을 수 있다(예를 들어, 도시 블록에 인접한 두 개의 교차로들 또는 다중 차선 도로의 두 개의 차선들).

일 실시예에서, 방향 그래프(1000)는 AV(100)에 의해 점유될 수 있는 시작 포인트(1002)와 종료 포인트(1004) 사이의 상이한 위치들을 나타내는 노드들(1006a-d)을 갖는다. 일부 예시들에서, 예를 들어, 시작 포인트(1002)와 종료 포인트(1004)가 상이한 대도시 영역들을 나타낼 때, 노드들(1006a-d)은 도로들의 세그먼트들을 나타낸다. 일부 예시들에서, 예를 들어, 시작 포인트(1002)와 종료 포인트(1004)가 동일한 도로 상의 상이한 위치들을 나타낼 때, 노드(1006a-d)는 그 도로 상의 상이한 위치들을 나타낸다. 이러한 방식으로, 방향 그래프(1000)는 다양한 세분 레벨에서의 정보를 포함한다. 일 실시예에서, 높은 세분도를 갖는 방향 그래프는 또한 더 큰 스케일을 갖는 다른 방향 그래프의 서브그래프이다. 예를 들어, 시작 포인트(1002)와 종료 포인트(1004)가 멀리 있는(예를 들어, 수 마일 떨어져 있음) 방향 그래프는 낮은 세분도로 대부분의 정보를 갖고 저장된 데이터에 기초지만, 또한, AV(100)의 시야 내의 물리적 위치들을 나타내는 그래프의 부분에 대한 일부 높은 세분 정보를 포함한다.

노드들(1006a-d)은 노드와 중첩될 수 없는 대상체들(1008a-b)과 구별된다. 일 실시예에서, 세분도가 낮을 때, 대상체(1008a-b)는 자동차에 의해 횡단될 수 없는 영역들, 예를 들어, 차도들 또는 도로들이 없는 영역들을 나타낸다. 세분도가 높을 때, 대상체들(1008a-b)은 AV(100)의 시야 내의 물리적 대상체들, 예를 들어, 다른 자동차들, 보행자들, 또는 AV(100)가 물리적 공간을 공유할 수 없는 다른 엔티티들을 나타낸다. 일 실시예에서, 대상체들(1008a-1008b)의 일부 또는 전부는 정적 대상체들(예를 들어, 가로등 또는 전신주와 같은 위치를 변경하지 않는 대상체) 또는 동적 대상체들(예를 들어, 보행자 또는 다른 자동차와 같은 위치를 변경할 수 있는 대상체)이다.

노드들(1006a-d)은 에지들(1010a-c)에 의해 연결된다. 2개의 노드들(1006a-b)이 에지(1010a)에 의해 연결되는 경우, AV(100)가 예를 들어, 다른 노드(1006b)에 도착하기 전에 중간 노드로 이동할 필요 없이 하나의 노드(1006a)와 다른 노드(1006b) 사이에서 주행하는 것이 가능하다. (즉, AV(100)는 각각의 노드들에 의해 표현되는 2개의 물리적 위치들 사이를 이동한다). 에지들(1010a-1010c)은 종종, AV(100)가 제1 노드로부터 제2 노드로, 또는 제2 노드로부터 제1 노드로 이동한다는 점에서 양방향성이다. 일 실시예에서, 에지들(1010a-1010c)은 AV(100)가 제1 노드로부터 제2 노드로 주행할 수 있지만, AV(100)는 제2 노드로부터 제1 노드로 주행할 수 없다는 점에서 단방향성이다. 에지들(1010a~1010c)은, 예를 들어, 일방향 차도, 차도, 도로, 또는 고속도로의 개별 차선들, 또는 법적 또는 지도 제약들로 인해 한 방향으로만 횡단될 수 있는 다른 피처들을 표현할 때 단방향성이다.

일 실시예에서, 계획 모듈(404)은 방향 그래프(1000)를 사용하여 시작 포인트(1002)와 종료 포인트(1004) 사이의 노드들과 에지들로 구성된 경로(1012)를 식별한다.

에지(1010a-c)는 연관된 비용(1014a-b)을 갖는다. 비용(1014a-b)은 AV(100)가 그 에지를 선택하는 경우 소모될 자원들을 나타내는 값이다. 전형적인 자원은 시간이다. 예를 들어, 하나의 에지(1010a)가 다른 에지(1010b)의 2배인 물리적 거리를 나타내는 경우, 제1 에지(1010a)의 연관된 비용(1014a)은 제2 에지(1010b)의 연관된 비용(1014b)의 2배일 수 있다. 시간에 영향을 미치는 다른 요인들은 예상 트래픽, 교차로의 수, 속도 제한 등을 포함한다. 다른 전형적인 자원은 연비이다. 2개의 에지들(1010a-b)은 동일한 물리적 거리를 나타낼 수 있지만, 하나의 에지(1010a)는 예를 들어, 도로 조건들, 예상 날씨 등으로 인해 다른 에지(1010b)보다 더 많은 연료를 필요로 할 수 있다.

계획 모듈(404)이 시작 포인트(1002)와 종료 포인트(1004) 사이의 경로(1012)를 식별할 때, 계획 모듈(404)은 일반적으로 비용, 예컨대 에지들의 개별 비용이 함께 합산될 때 최소 총 비용을 갖는 경로를 선택한다.

AV 제어

도 11은 제어 모듈(406)(예를 들어, 도 4에 도시된 바와 같은)의 입력들 및 출력들의 블록도(1100)를 도시한다. 제어 모듈은 예를 들어 프로세서(304)와 유사한 하나 이상의 프로세서(예를 들어, 마이크로프로세서들 또는 마이크로제어기들 또는 둘 모두와 같은 하나 이상의 컴퓨터 프로세서), 메인 메모리(306), ROM(308) 및 저장 디바이스(310)와 유사한 단기 및/또는 장기 데이터 저장 장치(예를 들어, 메모리 랜덤-액세스 메모리 또는 플래시 메모리 또는 둘 모두)를 포함하는 제어기(1102), 및 (예를 들어, 하나 이상의 프로세서에 의해) 명령어들이 실행될 때 제어기(1102)의 동작들을 수행하는 메모리에 저장된 명령어들에 따라 동작한다.

일 실시예에서, 제어기(1102)는 원하는 출력(1104)을 나타내는 데이터를 수신한다. 원하는 출력(1104)은 전형적으로 속도, 예를 들어 속도 및 헤딩을 포함한다. 원하는 출력(1104)은 예를 들어 계획 모듈(404)(예를 들어, 도 4에 도시된 바와 같은)으로부터 수신된 데이터에 기초할 수 있다. 원하는 출력(1104)에 따르면, 제어기(1102)는 스로틀 입력(1106) 및 조향 입력(1108)으로서 사용가능한 데이터를 생성한다. 스로틀 입력(1106)은 원하는 출력(1104)을 달성하기 위해, 예를 들면, 조향 페달에 관여하거나 또는 다른 스로틀 제어에 관여하는 것에 의해, AV(100)의 스로틀(예를 들면, 가속 제어)에 관여하는 정도를 나타낸다. 일부 예들에서, 스로틀 입력(1106)은 AV(100)의 브레이크(예를 들면, 감속 제어)에 관여하는 데 사용 가능한 데이터를 또한 포함한다. 조향 입력(1108)은 조향각, 예를 들면, AV의 조향 컨트롤(예를 들면, 조향 휠, 조향각 액추에이터, 또는 조향각을 제어하기 위한 다른 기능성)이 원하는 출력(1104)을 달성하도록 위치결정되어야 하는 각도를 나타낸다.

일 실시예에서, 제어기(1102)는 스로틀 및 조향에 제공되는 입력들을 조정하는데 사용되는 피드백을 수신한다. 예를 들어, AV(100)가 언덕과 같은 방해물(1110)과 조우하면, AV(100)의 측정된 속도(1112)는 원하는 출력 속도 아래로 낮아진다. 일 실시예에서, 임의의 측정된 출력(1114)이 제어기(1102)에 제공되어, 필요한 조정들이 예를 들어, 측정된 속도와 원하는 출력 사이의 차이(1113)에 기초하여 수행된다. 측정된 출력(1114)은 측정된 위치(1116), 측정된 속도(1118)(속도 및 헤딩을 포함함), 측정된 가속도(1120), 및 AV(100)의 센서들에 의해 측정 가능한 다른 출력들을 포함한다.

일 실시예에서, 방해물(1110)에 관한 정보는, 예를 들면, 카메라 또는 LiDAR 센서와 같은 센서에 의해 미리 검출되고, 예측 피드백 모듈(1122)에 제공된다. 예측 피드백 모듈(1122)은 이어서 정보를 제어기(1102)에 제공하며, 제어기(1102)는 이 정보를 사용하여 그에 따라 조정할 수 있다. 예를 들어, AV(100)의 센서들이 언덕을 검출하는(보는) 경우, 이 정보는 상당한 감속을 피하기 위해 적절한 시간에 스로틀에 관여할 준비를 하기 위해 제어기(1102)에 의해 사용될 수 있다.

도 12는 제어기(1102)의 입력들, 출력들, 및 컴포넌트들의 블록도(1200)를 도시한다. 제어기(1102)는 스로틀/브레이크 제어기(1204)의 동작에 영향을 미치는 속도 프로파일러(1202)를 갖는다. 예를 들어, 속도 프로파일러(1202)는 예를 들어, 제어기(1102)에 의해 수신되고 속도 프로파일러(1202)에 의해 프로세싱된 피드백에 따라, 스로틀/브레이크(1206)를 사용하여 가속에 관여하거나 감속에 관여하도록 스로틀/브레이크 제어기(1204)에 명령한다.

제어기(1102)는 또한 조향 제어기(1210)의 동작에 영향을 미치는 측방향 추적 제어기(1208)를 갖는다. 예를 들어, 측방향 추적 제어기(1208)는 예를 들어, 제어기(1102)에 의해 수신되고 측방향 추적 제어기(1208)에 의해 프로세싱된 피드백에 따라, 조향 각도 액추에이터(1212)의 위치를 조정하도록 조향 제어기(1210)에 명령한다.

제어기(1102)는 스로틀/브레이크(1206) 및 조향 각도 액추에이터(1212)를 어떻게 제어할지 결정하는 데 사용되는 여러 입력들을 수신한다. 계획 모듈(404)은 예를 들어, AV(100)가 동작을 시작할 때 헤딩을 선택하고 AV(100)가 교차로에 도달할 때 어느 도로 세그먼트를 횡단할지 결정하기 위해 제어기(1102)에 의해 사용되는 정보를 제공한다. 로컬화 모듈(408)은, 예를 들어, 스로틀/브레이크(1206) 및 조향각 액추에이터(1212)가 제어되고 있는 방식에 기초하여 예상되는 위치에 AV(100)가 있는지를 제어기(1102)가 결정할 수 있도록, AV(100)의 현재 위치를 기술하는 정보를 제어기(1102)에 제공한다. 일 실시예에서, 제어기(1102)는 다른 입력들(1214)로부터의 정보, 예컨대 데이터베이스, 컴퓨터 네트워크 등으로부터 수신된 정보를 수신한다.

AV 클러스터 세그먼트화 및 분류 시스템

본 명세서에서 설명되는 바와 같이(예를 들어, 도 4와 관련하여), AV는 AV의 환경에서 물리적 대상체들을 식별하고, AV에 대한 대상체의 위치들을 결정하고, 유형에 기초하여 대상체들을 분류하도록 구성되는 인지 모듈(402)을 포함할 수 있다. 또한, 인지 모듈(402)은 특정 목적지에 도달하기 위해 AV에 의해 주행될 수 있는 하나 이상의 궤적을 결정하기 위해 분류된 대상체들을 포함하는 장면 설명을 계획 모듈(404)에 제공할 수 있다.

일부 구현에서, 인지 모듈(402)은 대상체들을 식별하고, 이들 대상체들의 위치들을 결정하고, 하나 이상의 센서(121)에 의해 획득된 센서 데이터에 기초하여 이들 대상체들을 분류할 수 있다. 예를 들어, 위에서 설명된 바와 같이(예를 들어, 도 1 및 도 5 내지 도 7과 관련하여), AV는 광을 사용하여 자신의 가시선(ling of sight) 내의 대상체들에 관한 데이터를 획득하는 LiDAR 시스템(예를 들어, LiDAR 시스템(123, 502a, 및/또는 602))을 포함할 수 있으며, 환경의 표현을 구성하는 데 사용되는 3D 또는 2D 포인트들의 컬렉션들을 출력한다. 이러한 포인트들의 콜렉션들은 "포인트 클라우드들"로 지칭될 수 있다.

일부 구현들에서, 인지 모듈(402)은 포인트 클라우드를 다수의 클러스터들로 세그먼트화 할 수 있으며, 여기서 각각의 클러스터는 AV의 환경에서 상이한 각각의 대상체를 나타낸다. 이는, 예를 들어, 인지 모듈(402)이 대상체들 각각의 치수들, 위치, 및/또는 유형을 보다 정확하게 결정할 수 있게 하는 데 유익할 수 있다. 따라서, 계획 모듈(404)은 AV가 환경을 더 안전하고 더 효과적인 방식으로 내비게이팅할 수 있게 하는 궤적들을 결정할 수 있다.

일부 경우에, 인지 모듈(402)은 포인트 클라우드(또는 그 일부)를 "과도 세그먼트화"하여 단일 대상체가 다수의 포인트 클러스터들에 의해 잘못 나타내어질 수 있다. 다른 경우에, 인지 모듈(402)은 포인트 클라우드(또는 그 일부)를 "과소 세그먼트화"하여 다수의 대상체들이 단일 포인트 클러스터에 의해 잘못 나타내어질 수 있다.

과도 세그먼트화를 감소시키기 위해, 포인트들의 각각의 클러스터에 대해, 경계 박스가 포인트들의 클러스터와 포인트들의 다른 인접한 클러스터를 둘러싸도록, 인지 모듈(402)은 (예를 들어, 머신 러닝을 사용하여) 경계 박스를 "예측"할 수 있다. 다수의 경계 박스들은 (예를 들어, 비-최대 억제를 사용하여) 함께 병합될 수 있고, 그에 따라 결과적인 박스는 동일한 대상체에 각각 대응하는 다수의 포인트 클러스터들을 둘러싼다.

과소 세그먼트화를 감소시키기 위해, 포인트들의 각각의 클러스터에 대해, 경계 박스들이 클러스터의 상이한 각각의 부분들을 둘러싸도록 인지 모듈(402)은 (예를 들어, 머신 러닝을 사용하여) 다수의 경계 박스들을 “예측”할 수 있다. 경계 박스들 각각이 상이한 개개의 대상체에 대응하는 포인트들을 둘러싸도록 경계 박스들이 선택될 수 있다.

이러한 기법들은 인지 시스템(402)이 센서 데이터에 기초하여 대상체들을 식별하는 정확도를 향상시킬 수 있으며, AV가 보다 안전하고 효율적인 방식으로 자율 주행 동작들을 수행할 수 있도록 할 수 있다.

도 13은 포인트들을 클러스터들로 클러스터링하고 포인트들의 클러스터들 각각을 분류하기 위한 예시적인 클러스터 세그먼트화 및 분류 시스템(1302)을 도시한다. 일부 구현들에서, AV 클러스터 세그먼트화 및 분류 시스템(1302)은 AV(100)의 인지 모듈(402)에 포함될 수 있다.

클러스터 세그먼트화 및 분류 시스템(1302)은 클러스터 세그먼트화 모듈(1314), 클러스터 분류 네트워크(1306) 및 클러스터 정제 모듈(1310)을 포함한다. 클러스터 세그먼트화 및 분류 시스템(1302)(클러스터 세그먼트화 모듈(1314), 클러스터 분류 네트워크(1306) 및 클러스터 정제 모듈(1310)을 포함)은 적어도 부분적으로, 하나 이상의 컴퓨터 시스템(예를 들어, 도 1-3에 도시된 바와 같은 클라우드 서버(136), 컴퓨팅 환경(200), 및/또는 컴퓨터 시스템(300))을 사용하여 구현될 수 있다.

클러스터 세그먼트화 및 분류 시스템(1302)의 예시적인 동작 동안, 클러스터 세그먼트화 및 분류 시스템(1302)은 포인트 클라우드(1304)를 수신한다. 포인트 클라우드(1304)는 AV(100) 환경에서 하나 이상의 대상체를 나타내는 포인트들의 컬렉션을 포함한다. 예로서, 포인트 클라우드(1304) 내의 포인트들 각각은 AV(100)에 근접한 하나 이상의 대상체의 외부 표면들 상의 개개의 포인트를 표시할 수 있다. 일부 구현들에서, 포인트 클라우드(1304)는 (예를 들어, 데카르트 좌표계에 따른) 그 포인트들 각각의 위치뿐만 아니라 포인트들 각각에 관한 추가 정보(예를 들어, 포인트들 각각의 강도)를 포함할 수 있다.

일부 구현들에서, 포인트 클라우드(1304)는 적어도 부분적으로, LiDAR 시스템(예를 들어, LiDAR 시스템(123, 502a 및/또는 602))을 사용하여 생성될 수 있다. 예를 들어, 포인트 클라우드(1304)는 LiDAR 시스템(502a)에 의해 생성된 출력들(504a) 중 적어도 일부를 포함할 수 있다(예를 들어, 도 5 내지 도 7과 관련하여 설명된 바와 같이).

클러스터 세그먼트화 모듈(1314)은 포인트 클라우드(1304)를 수신하고, 포인트 클라우드(1304)를 포인트들의 하나 이상의 클러스터(1308)로 세그먼트화한다. 일부 구현들에서, 클러스터 세그먼트화 모듈(1314)은 그래프 기반 세그먼트화 기법을 사용하여 포인트 클라우드(1304)를 세그먼트화할 수 있다.

클러스터 분류 네트워크(1306)는 포인트들의 클러스터들(1316)을 수신하고, 포인트들의 클러스터들(1316)을 분류하고, 분류된 클러스터들(1308)을 출력한다. 예를 들어, 클러스터 분류 네트워크(1306)는 포인트들의 클러스터들(1316) 각각이 AV(100) 환경에서 상이한 개개의 대상체를 나타내는지 여부를 결정할 수 있다. 또한, 분류 네트워크(1306)는 대상체들 각각에 관한 추가 정보를 결정할 수 있다. 예를 들어, 포인트들의 클러스터들 각각에 대해, 분류 네트워크(1306)는 해당 클러스터에 의해 나타내어지는 대상체의 위치(예를 들어 절대 위치 또는 AV(100)에 상대적인 위치)와 대상체의 크기 및 형상을 결정할 수 있다. 또한, 포인트들의 클러스터들 각각에 대해, 분류 네트워크(1306)는 해당 클러스터에 의해 나타내어지는 대상체의 유형을 결정할 수 있다. 예를 들어, 포인트들의 클러스터들 각각에 대해, 분류 네트워크(1306)는 해당 클러스터에 의해 나타내어지는 대상체가 보행자, 자전거, 자동차, 교통 표지판, 장벽, 나무, 건물, 다리 또는 다른 유형의 대상체인지 여부를 결정할 수 있다. 또한, 포인트들의 클러스터들 각각에 대해, 분류 네트워크(1306)는 클러스터가 결정된 유형의 대상체를 나타낼 가능성을 나타내는 신뢰 메트릭을 결정할 수 있다.

일부 구현들에서, 클러스터 분류 네트워크(1306)는 포인트들의 클러스터들에 관한 정보를 수신하고 클러스터들의 특성들에 기초하여 클러스터들 각각을 분류하도록 구성된 신경망일 수 있다(그렇지 않으면 포함할 수 있다). 신경망(1400)의 단순화된 예가 도 14에 도시된다.

신경망(1400)은 상호연결부들(1404)에 의해 다른 노드와 상호연결된 여러 노드들(1402)(종종 "뉴런"이라고 함)을 포함한다. 또한, 노드들(1402)은 입력 계층(1406a), 숨겨진 계층(1406b) 및 출력 계층(1406c)을 포함하는 다수의 계층들에 따라 배열된다. 노드들(1402) 및 이들 사이의 상호연결부들(1404)의 배열은 입력 데이터(예를 들어, 입력 계층(1406a)의 노드들에 의해 수신된 것과 같은)의 대응하는 출력 데이터(예를 들어, 출력 계층(1406c)의 노드들에 의해 출력된 것과 같은)로의 수학적 변환을 나타낸다. 일부 구현들에서, 입력 데이터는 포인트 클라우드(1304)에 관한 데이터를 나타낼 수 있고, 출력 데이터는 입력 데이터에 기초하여 클러스터 분류 네트워크(1306)에 의해 생성된 하나 이상의 대응하는 분류된 클러스터(1308s)를 나타낼 수 있다.

입력 계층(1406a)의 노드들(1402)은 입력 값들을 수신하고 수신된 입력 값들을 신경망(1400)의 다음 계층의 개개의 노드들에 (예를 들어, 하나 이상의 개별 수치 값으로서 또는 하나 이상의 차원 및 하나 이상의 대응하는 값을 갖는 피처 벡터로서) 출력한다. 이 예에서, 신경망(1400)은 여러 입력들 i₁, i₂, i₃ 및 i₄를 포함하며, 이들 각각은 개개의 입력 값을 수신하고 수신된 값을 노드들 μ_x1, μ_x2 및 μ_x3 중 하나 이상에 출력한다(예를 들어, 상호연결부들(1404)로 표시됨).

숨겨진 계층(1406b)의 노드들은 (예를 들어, 입력 계층(1406a)의 노드들 또는 다른 숨겨진 계층들의 노드들로부터) 입력 값들을 수신하고, 수신된 값들에 특정 변환들을 적용하고, 변환된 값들을 신경망(1400)의 다음 계층의 개개의 노드들에 출력한다(예를 들어, 상호연결부들(1404)로 표시된 바와 같이). 노드들 각각의 출력은 하나 이상의 개별 수치 값 및/또는 하나 이상의 차원과 하나 이상의 대응하는 값을 갖는 하나 이상의 피처 벡터일 수 있다. 본 예에서, 신경망(1400)은 여러 노드들 μ_x1, μ_x2, μ_x3을 포함하며, 이들 각각은 노드들 i₁, i₂, i₃, i₄로부터 개개의 입력 값을 수신하고, 수신된 값들에 개개의 변환을 적용하며, 변환된 값들을 노드들 y₁ 및 y₂ 중 하나 이상에 출력한다.

일부 구현들에서, 숨겨진 계층(1406b)의 노드들은 하나 이상의 입력 값을 수신하고 수학적 전달 함수에 따라 하나 이상의 수신된 값을 변환할 수 있다. 예를 들어, 특정 전달 함수에서는 노드에 의해 수신된 값들이 입력 값들로서 사용될 수 있고, 전달 함수에 의해 출력된 값이 노드의 출력으로서 사용될 수 있다. 일부 구현들에서 전달 함수는 비선형 함수일 수 있다. 일부 구현들에서 전달 함수는 선형 함수일 수 있다.

일부 구현들에서, 전달 함수는 특정 입력에 다른 입력과 다르게 가중치를 부여할 수 있으므로 특정 입력이 다른 입력보다 노드의 출력에 더 큰 영향을 미칠 수 있다. 예를 들어, 일부 구현들에서, 전달 함수는 입력들 각각에 개개의 계수를 곱함으로써 입력들 각각에 가중치를 부여할 수 있다. 또한 일부 구현들에서는 전달 함수가 그 출력에 바이어스를 적용할 수 있다. 예를 들어, 일부 구현들에서 전달 함수는 특정 오프셋 값만큼 그 출력을 바이어스할 수 있다.

예를 들어, 특정 노드의 전달 함수는 다음과 같이 표현될 수 있다.

여기서 Weight_i는 입력 input_i에 적용되는 가중치이고, bias는 가중된 입력들의 합에 적용되는 바이어스 또는 오프셋 값이며, Y는 노드의 출력이다.

출력 계층(1406c)의 노드들은 (예를 들어, 숨겨진 계층(1406b)의 노드들로부터) 입력 값들을 수신하고 수신된 값들을 출력한다. 일부 구현들에서, 출력 계층(1406c)의 노드들은 또한 하나 이상의 입력 값을 수신하고 수학적 전달 함수에 따라 하나 이상의 수신된 값을 변환할 수 있다(예를 들어, 숨겨진 계층(1406b)의 노드들과 유사한 방식으로). 예를 들어, 특정 전달 함수에서는 노드에 의해 수신된 값들이 입력 값들로서 사용될 수 있고, 전달 함수에 의해 출력된 값이 노드의 출력으로서 사용될 수 있다. 일부 구현들에서 전달 함수는 비선형 함수일 수 있다. 일부 구현들에서 전달 함수는 선형 함수일 수 있다. 노드들 각각의 출력은 하나 이상의 개별 수치 값 및/또는 하나 이상의 차원과 하나 이상의 대응하는 값을 갖는 하나 이상의 피처 벡터일 수 있다.

일부 구현들에서, 출력 계층(1406c)의 노드들 중 적어도 하나는 포인트 클라우드(1304)의 하나 이상의 포인트 클러스터로의 세그먼트화를 나타낼 수 있다. 예를 들어, 출력 계층(1406c)의 노드들 중 적어도 하나는 AV(100) 환경의 특정 대상체에 대응하는 포인트 클라우드(1304)의 일부를 둘러싸는 경계를 나타낼 수 있다. 또한, 경계는 포인트 클라우드(1304)의 해당 부분을 포인트 클라우드(1304)의 다른 부분들(예를 들어, AV(100) 환경의 다른 대상체들을 나타내는 부분들)로부터 분리할 수 있다. 일부 구현들에서, 경계는 사변형(예를 들어, 직사각형 또는 정사각형)일 수 있고, 출력 계층(1406c)의 노드들 중 적어도 하나는 사변형의 꼭지점들 및/또는 가장자리들의 위치들을 나타낼 수 있다.

또한, 출력 계층(1406c)의 노드들 중 적어도 하나는 경계에 의해 둘러싸인 포인트 클라우드의 부분에 의해 나타내어지는 대상체 유형의 예측을 나타낼 수 있다. 예를 들어, 출력 계층(1406c)의 노드들 중 적어도 하나는 경계로 둘러싸인 포인트 클라우드의 부분이 자전거, 자동차, 교통 표지판, 장벽, 나무, 건물, 다리 또는 임의의 기타 유형의 대상체인 것으로 예측되는지 여부를 표시할 수 있다.

또한, 출력 계층(1406c)의 노드들 중 적어도 하나는 대상체 유형 예측과 연관된 신뢰 메트릭을 나타낼 수 있다. 예를 들어, 예측이 정확할 가능성이 높으면 신뢰 메트릭은 더 높은 값을 가질 수 있고, 예측이 정확할 가능성이 낮으면 신뢰 메트릭은 더 낮은 값을 가질 수 있다.

이 예에서, 신경망(1400)은 두 개의 출력 노드들 y_1 및 y_2를 포함하며, 이들 각각은 노드들 μ_x1, μ_x2 및 μ_x3로부터 개개의 입력 값을 수신하고, 수신된 값들에 개개의 변환을 적용하고, 변환된 값들을 신경망(1400)의 출력들로서 출력한다. 또한, 한 계층 내의 각각의 노드는 다음 계층 내의 모든 노드들에 연결된다(예를 들어, "완전히 연결된" 네트워크 형성).

도 14는 예시적인 노드들 및 이들 사이의 예시적인 상호연결들을 도시하지만, 이는 단지 예시일 뿐이다. 실제로 신경망은 임의의 배열에 따라 상호연결되는 임의의 개수의 노드들을 포함할 수 있다. 또한, 도 14는 단일의 숨겨진 계층(1406b)을 갖는 신경망(1400)을 도시하지만, 실제로 네트워크는 임의의 개수의 숨겨진 계층들(예를 들어, 1개, 2개, 3개, 4개 이상)을 포함하거나 전혀 포함하지 않을 수 있다. 또한, 신경망(1400)은 완전 연결 네트워크 또는 부분 연결 네트워크(예를 들어, 한 계층 내의 노드들 중 적어도 일부가 다음 계층 내의 노드들의 서브세트에만 연결되는 신경망)일 수 있다.

일부 구현들에서, 신경망(1400)은 포인트 클라우드들의 정확한 세그먼트화 및 분류에 도움이 될 수 있는 "지상 실측 정보(ground truth)" 예들을 제공하는 트레이닝 데이터에 기초하여 트레이닝될 수 있다. 예로서, 트레이닝 데이터는 예시적인 입력 데이터(예를 들어, 이전에 프로세싱된 포인트 클라우드들을 나타냄)와 예시적인 출력 데이터(예를 들어, 이러한 포인트 클라우드들의 개개의 분류된 클러스터들로의 정확한 세그먼트화 및 분류를 나타냄)를 포함할 수 있다. 노드들의 배열 및 노드들 사이의 상호연결들에 기초하여, 클러스터 세그먼트화 및 분류 시스템(1302)은 동일한 입력 데이터가 주어지면 신경망(1400)의 출력이 트레이닝 데이터의 출력 데이터와 일치하거나 그렇지 않으면 유사하게 되는 노드들 각각에 대한 전달 함수들을 식별할 수 있다. 일부 구현들에서, 클러스터 세그먼트화 및 분류 시스템(1302)은 전달 함수들 각각에 대한 특정 가중치들 또는 바이어스들을 선택할 수 있다. 일부 구현들에서 이는 반복적으로 수행될 수 있다(예를 들어, 연속적인 트레이닝 데이터 세트들 사용).

도 13을 다시 참조하면, 분류된 클러스터들(1308)은 클러스터 정제 모듈(1310)에 제공된다. 클러스터 정제 모듈(1310)은 분류된 클러스터들(1308) 각각을 프로세싱하고, 분류된 클러스터들(1308) 중 하나 이상을 수정하여 포인트 클라우드(1304)가 세그먼트화 및 분류되는 정확도를 개선한다. 클러스터 정제 모듈(1310)은 추가 프로세싱을 위해 수정된 클러스터(1312)를 출력한다. 일부 구현들에서, 수정된 클러스터들(1312)은 시간이 지남에 따라 AV(100) 환경에서 대상체들의 신원들 및 위치들을 추적하는 데 사용될 수 있다. 일부 구현들에서, 수정된 클러스터들(1312)은 계획 모듈(404)에 의한 하나 이상의 궤적의 생성을 돕기 위해 분류된 대상체들(416)을 결정하는 데 사용될 수 있다(예를 들어, 도 4를 참조하여 설명된 바와 같이).

일부 구현들에서, 클러스터 세분화 모듈(1310)은 분류된 클러스터들(1308)이 과도 세그먼트화된다고 결정할 수 있다. 예를 들어, 단일 대상체가 다수의 포인트 클러스터들에 의해 잘못 나타내어질 수 있다. 이 결정에 기초하여, 클러스터 정제 모듈(1310)은 예컨대, 2개 이상의 클러스터들을 단일 공통 클러스터로 병합함으로써 분류된 클러스터들(1308)를 수정할 수 있다.

일부 구현들에서, 클러스터 세분화 모듈(1310)은 분류된 클러스터들(1308)이 과소 세그먼트화된다고 결정할 수 있다. 예를 들어, 다수의 대상체들이 단일의 포인트 클러스터로 잘못 나타내어질 수 있다. 이러한 결정에 기초하여, 클러스터 정제 모듈(1310)은 예컨대, 단일 클러스터를 2개 이상의 클러스터들로 분할함으로써 분류된 클러스터들(1308)을 수정할 수 있다.

과도 세그먼트화를 줄이고 과소 세그먼트화를 줄이기 위한 예시적인 기법들이 아래에서 더 자세히 설명된다.

도 15a 내지 도 15c는 과도 세그먼트화를 정정하기 위한 예시적인 프로세스를 도시한다. 이 프로세스는 예를 들어 클러스터 세그먼트화 모듈(1314)의 출력을 수정하기 위해 클러스터 분류 네트워크(1306) 및 클러스터 정제 모듈(1310)에 의해 수행될 수 있다.

도 15a에 도시된 바와 같이, 포인트 클라우드(1500)는 초기에 두 세트의 포인트들(1502a 및 1502b)로 세그먼트화된다. 이 세그먼트화는 클러스터 세그먼트화 모듈(1314)의 출력일 수 있다. 예를 들어, 도 15a에 도시된 바와 같이, 클러스터 세그먼트화 모듈(1314)은 포인트 클라우드(1500)가 AV(100) 환경에서 2개의 상이한 대상체들을 나타내는 것을 초기에 예측할 수 있다. 또한, 클러스터 세그먼트화 모듈(1314)은 초기에 포인트의 제1 세트(1502a)(흰색 원으로 표시됨)가 이들 대상체들 중 하나에 대응하는 반면, 포인트 세트(1502b)(검은색 원으로 표시됨)는 다른 대상체에 대응한다고 예측할 수 있다.

클러스터 분류 네트워크는 클러스터 세그먼트화 모듈(1314)에 의해 출력되는 포인트 세트들(1502a 및 1502b) 각각을 분류한다. 예를 들어, 클러스터 분류 네트워크(1306)는 포인트 세트들(1502a 및 1502b) 각각에 의해 표현되는 대상체의 유형 및 예측과 연관된 신뢰 메트릭을 예측할 수 있다. 예를 들어, 이 예에서 클러스터 분류 네트워크(1306)는 제1 포인트 세트(1502a)가 0.75의 신뢰 메트릭으로 자동차를 나타낸다고 예측한다. 또한, 클러스터 분류 네트워크(1306)는제2 포인트 세트(1502b) 또한 0.95의 신뢰 메트릭으로 자동차를 나타낸다고 예측한다.

클러스터 정제 모듈(1310)은 포인트 클라우드(1500)를 분석하여 제1 포인트 세트(1502a)와 제2 포인트 세트(1502b)가 실제로 상이한 개개의 대상체들보다는 단일 공통 대상체에 대응하는지 여부를 결정한다.

예를 들어, 클러스터 정제 모듈(1310)은, 이것이 제1 포인트 세트(1502a) 및 제1 포인트 세트(1502a)와 공간적으로 인접한 하나 이상의 다른 포인트 세트의 적어도 일부를 둘러싸도록, 제1 포인트 세트(1502a)에 대한 제1 경계 박스(1504a)를 생성할 수 있다. 예를 들어, 포인트들이 서로 특정 공간 거리 내에 있는 경우(예를 들어, 특정 임계 거리 내에 있는 경우), 포인트 세트들은 서로 공간적으로 인접할 수 있다. 도 15b에 도시된 예에서, 제1 경계 박스(1504a)는 제1 포인트 세트(1502a)와 제2 포인트 세트(1502b) 모두를 둘러싸도록 생성된다.

또한, 클러스터 정제 모듈(1310)은, 이것이 제2 포인트 세트(1502b), 및 제2 포인트 세트(1502b)와 공간적으로 인접한 하나 이상의 포인트 세트의 적어도 일부(예를 들어, 제1 포인트 세트(1502a))를 둘러싸도록, 제2 포인트 세트(1502b)에 대한 제2 경계 박스(1504b)를 생성할 수 있다. 도 15b에 도시된 예에서, 제2 경계 박스(1504b)는 제2 포인트 세트(1502b)와 제1 포인트 세트(1502a) 모두를 둘러싸도록 생성된다.

일부 구현들에서, 경계 박스들(1504a, 1504b)은 사변형일 수 있다. 예를 들어, 경계 박스들(1504a, 1504b)은 직사각형들 또는 정사각형들일 수 있다.

클러스터 정제 모듈(1310)은 바운딩 박스들(1504a 및 1504b)을 분석하고 본딩 박스들(1504a 및 1504b)(및/또는 그 안에 포함된 포인트들)을 병합할지 여부를 결정한다. 일부 구현들에서, 이 결정은 NMS(Non-Maximal Suppression) 기법에 기초하여 수행될 수 있다. 예를 들어, 클러스터 정제 모듈(1310)은 경계 박스들(1504a 및 1504b)이 동일한 유형의 대상체를 나타내는 포인트들을 포함하는지 여부를 결정할 수 있다. 그렇다면, 더 높은 신뢰 메트릭과 연관되는 경계 박스가 선택될 수 있으며, 다른 경계 박스들은 삭제되거나 억제될 수 있다. 따라서 다수의 포인트 세트들이 (예를 들어, 단일 공통 경계 박스에 의해 둘러싸인) 단일 포인트 세트 또는 포인트 클러스터로 병합된다. 일부 구현들에서, 이 결정은 적어도 부분적으로, 신경망(예를 들어, 클러스터 분류 네트워크 및/또는 신경망(1400))을 사용하여 수행될 수 있다.

이 예에서, 클러스터 정제 모듈(1310)은 (예를 들어, 클러스터 분류 네트워크 및/또는 신경망(1400)을 사용하여) 0.75의 신뢰 메트릭으로 자동차를 나타내는 포인트들을 경계 박스(1504a)가 둘러싸는 것으로 결정한다. 또한, 클러스터 세분화 모듈(1310)은 (예를 들어, 클러스터 분류 네트워크 및/또는 신경망(1400)을 사용하여) 0.95의 신뢰 메트릭으로 자동차를 또한 나타내는 포인트들을 경계 박스(1504b)가 둘러싸는 것으로 결정한다.

이들 결정들에 기초하여, 클러스터 정제 모듈(1310)은 (예를 들어, 더 큰 신뢰 메트릭에 대응하는) 경계 박스(1504b)를 선택하고, 경계 박스(1504a)를 폐기하거나 억제할 수 있다(예를 들어, 도 15c에 도시된 바와 같이). 또한, 선택된 경계 박스(1504b)에 의해 둘러싸인 포인트들은 단일 세트의 포인트 클러스터(1502c)로 병합될 수 있고, 단일 공통 대상체(예를 들어, 다수의 상이한 자동차들이 아닌 단일 자동차)를 나타내는 데 사용될 수 있다.

선택된 경계 박스 및/또는 경계 박스에 의해 둘러싸인 포인트들에 관한 데이터는 추가 프로세싱을 위해 출력될 수 있다. 예를 들어, 선택된 경계 박스 및/또는 경계 박스에 의해 둘러싸인 포인트들에 관한 데이터는 시간이 지남에 따라 AV(100) 환경에서 대상체들의 신원과 위치를 추적하는 데 도움을 주기 위해 사용될 수 있다. 일부 구현들에서, 이 데이터는 계획 모듈(404)에 의한 하나 이상의 궤적의 생성을 돕기 위해 분류된 대상체들(416)을 결정하는 데 사용될 수 있다(예를 들어, 도 4를 참조하여 설명된 바와 같이).

예시적인 포인트 클라우드(1500)가 도 15a 내지 도 15c에 도시되어 있지만, 이 포인트 클라우드는 단지 단순화된 표현일 뿐이다. 실제로, 포인트 클라우드(1500)는 임의의 개수의 대상체들을 나타내는 임의의 개수의 포인트들을 포함할 수 있다. 또한, 도 15a 내지 도 15c에 도시된 프로세스는 포인트 클라우드(1500)에서 임의의 개수의 포인트 클러스터들의 과도 세그먼트화를 정정하기 위해 수행될 수 있다.

도 16a 내지 도 16c는 과소 세그먼트화를 정정하기 위한 예시적인 프로세스를 도시한다. 이 프로세스는 예를 들어 클러스터 세그먼트화 모듈(1314)의 출력을 수정하기 위해 클러스터 분류 네트워크(1306) 및 클러스터 정제 모듈(1310)에 의해 수행될 수 있다.

도 16a에 도시된 바와 같이, 포인트 클라우드(1600)는 초기에 단일 세트의 포인트들(1602)로 세그먼트화된다. 이 세그먼트화는 클러스터 세그먼트화 모듈(1314)의 출력일 수 있다.

예를 들어, 도 16a에 도시된 바와 같이, 클러스터 세그먼트화 모듈(1314)은 포인트 클라우드(1600)가 AV(100) 환경에서 단일 대상체를 나타내는 것을 초기에 예측할 수 있다. 또한, 클러스터 세그먼트화 모듈(1314)은 초기에 단일 포인트 세트(1602)(흰색 원으로 표시됨)가 해당 대상체에 대응한다고 예측할 수 있다.

클러스터 분류 네트워크는 클러스터 세그먼트화 모듈(1314)에 의해 출력되는 포인트 세트(1602)를 분류한다. 예로서, 클러스터 분류 네트워크(1306)는 포인트 세트(1602)에 의해 표현되는 대상체의 유형 및 예측과 연관된 신뢰 메트릭을 예측할 수 있다. 예를 들어, 이 예에서 클러스터 분류 네트워크(1306)는 포인트 세트(1602)가 0.75의 신뢰 메트릭으로 보행자를 나타낸다고 예측한다.

클러스터 세분화 모듈(1310)은 포인트 클라우드(1600)를 분석하여 포인트 세트(1602)가 실제로 단일 공통 대상체가 아닌 다수의 상이한 대상체들에 대응하는지 여부를 결정한다.

예를 들어, 클러스터 세분화 모듈(1310)은 그들이 포인트 세트(1602)의 상이한 개개의 부분들을 둘러싸도록 적어도 2개의 경계 박스들(1604a 및 1604b)을 생성할 수 있다. 일부 구현들에서, 경계 박스들(1604a, 1604b)은 사변형일 수 있다. 예를 들어, 경계 박스들(1604a, 1604b)은 직사각형들 또는 정사각형들일 수 있다.

경계 박스들(1604a 및 1604b) 각각에 대해, 클러스터 정제 모듈(1310)은 해당 경계 박스에 의해 둘러싸인 포인트들에 의해 표현되는 대상체의 유형 및 해당 결정과 연관된 신뢰 메트릭을 (예를 들어, 클러스터 분류 네트워크 및/또는 신경망(1400)을 사용하여) 결정할 수 있다. 경계 박스들(1604a 및 1604b) 모두에 대한 신뢰 메트릭들이 충분히 높은 경우(예를 들어, 두 신뢰 메트릭들이 임계값보다 큰 경우), 클러스터 정제 모듈(1310)은 경계 박스들(1604a 및 1604b)에 따라 포인트 세트(1602)를 2개의 상이한 포인트 세트들로 분할할 수 있다. 그렇지 않으면, 클러스터 정제 모듈(1310)은 포인트 세트(1602)를 포인트들의의 단일 세트 또는 포인트 클러스터로서 유지할 수 있다.

이 예에서, 클러스터 정제 모듈(1310)은 (예를 들어, 클러스터 분류 네트워크 및/또는 신경망(1400)을 사용하여) 0.80의 신뢰 메트릭으로 보행자를 나타내는 포인트들을 경계 박스(1604a)가 둘러싸는 것으로 결정한다. 또한, 클러스터 세분화 모듈(1310)은 (예를 들어, 클러스터 분류 네트워크 및/또는 신경망(1400)을 사용하여) 0.70의 신뢰 메트릭으로 보행자를 또한 나타내는 포인트들을 경계 박스(1604b)가 둘러싸는 것으로 결정한다. 또한, 클러스터 정제 모듈(1310)은 경계 박스들(1604a 및 1604b)에 대한 신뢰 메트릭이 모두 0.65의 분할 임계치를 초과한다고 결정한다.

이들 결정들에 기초하여, 클러스터 정제 모듈(1310)은 포인트 세트(1602)를 경계 박스(1604a)에 의해 둘러싸인 제1 포인트 세트(1606a)와 바운딩 박스(1604b)에 의해 둘러싸인 제2 포인트 세트(1606b)로 분할할 수 있다(예를 들어, 도 16c에 도시된 바와 같이). 제1 포인트 세트(1606a) 및 제2 포인트 세트(1606b)는 상이한 개개의 대상체들(예를 들어, 단일 공통 보행자가 아닌 다수의 보행자들)을 나타내는 데 사용될 수 있다.

경계 박스들 및/또는 경계 박스들에 의해 둘러싸인 포인트들에 관한 데이터는 추가 프로세싱을 위해 출력될 수 있다. 예를 들어, 경계 박스들 및/또는 경계 박스들에 의해 둘러싸인 포인트들에 관한 데이터는 AV(100)에 대한 하나 이상의 궤적을 결정하기 위해 계획 모듈(404)로 출력될 수 있다.

분할 임계값 예시가 위에 설명되어 있지만 이는 단지 예시일 뿐이다. 실제로 분할 임계값은 구현에 따라 달라질 수 있다. 일부 구현들에서, 분할 임계값은 경험적으로 선택될 수 있다(예를 들어, 과소 세그먼트화의 정확한 정정을 가능하게 하는 특정 신뢰 메트릭 값을 결정하기 위한 실험들을 수행함으로써).

예시적인 포인트 클라우드(1600)가 도 16a 내지 도 16c에 도시되어 있지만, 이 포인트 클라우드는 단지 단순화된 표현일 뿐이다. 실제로, 포인트 클라우드(1600)는 임의의 개수의 대상체들을 나타내는 임의의 개수의 포인트들을 포함할 수 있다. 또한, 도 16a 내지 도 16c에 도시된 프로세스는 포인트 클라우드(1600)에서 임의의 개수의 포인트 클러스터들의 과소 세그먼트화를 정정하기 위해 수행될 수 있다.

예시적인 프로세스들

도 17a는 포인트 클라우드의 세그먼트화를 개선하기 위한 예시적인 프로세스(1700)를 도시한다. 프로세스(1700)는 적어도 부분적으로, AV 클러스터 세그먼트화 및 분류 시스템(1302)(예를 들어, 도 13, 도 14, 도 15a 내지 도 15c 및 도 16a 내지 도 16c를 참조하여 설명된 바와 같이)을 포함하는 인지 모듈(402)을 사용하여 포인트 클라우드의 과도 세그먼트화를 정정하기 위해 수행될 수 있다.

프로세스(1700)에 따르면, 인지 모듈은 복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신한다(블록(1702)). 일부 구현들에서, 포인트들은 LiDAR 센서에 의해 생성될 수 있다. 예를 들어, 인지 모듈은 적어도 하나의 LiDAR 센서에 의해 생성된 복수의 포인트들 각각에 대응하는 측정들에 기초하여 제1 데이터를 수신할 수 있다.

인지 모듈은 포인트들을 복수의 클러스터들로 클러스터링한다(블록(1704)). 다수의 클러스터들이 동일한 대상체(예를 들어, 동일한 차량, 보행자, 장애물 등)의 상이한 개개의 부분들을 나타내도록 포인트들은 과도 세그먼트화될 수 있다. 예로서, 클러스터들은 대상체의 제1 부분을 나타내는 제1 클러스터, 및 대상체의 제2 부분을 나타내는 제2 클러스터를 포함할 수 있다. 예시적인 포인트 클러스터들이 도 15a를 참조하여 도시되고 설명된다.

일부 구현들에서, 포인트들은 클러스터 분류 네트워크(예를 들어, 도 13을 참조하여 설명된 클러스터 분류 네트워크(1306))를 사용하여 클러스터링될 수 있다. 예를 들어, 클러스터 분류 네트워크가 사용되어 클러스터들 각각에 대해, 해당 클러스터에 의해 나타내어지는 대상체의 유형을 예측할 수 있다. 예시적인 대상체 유형은 차량, 보행자, 장애물 또는 임의의 다른 대상체 유형을 포함한다. 또한, 클러스터 분류 네트워크가 사용되어 클러스터들 각각에 대해, 해당 클러스터가 예측된 유형의 대상체를 나타낼 가능성을 결정할 수 있다. 일부 구현들에서, 신뢰 메트릭을 사용하여 가능성이 나타내어질 수 있다.

인지 모듈은 적어도 제1 클러스터 및 제2 클러스터를 둘러싸는 제1 경계 박스를 생성한다(블록(1706)). 일부 구현들에서, 제1 클러스터는 제2 클러스터에 인접할 수 있다.

인지 모듈은 또한 적어도 제1 클러스터 및 제2 클러스터를 둘러싸는 제2 경계 박스를 생성한다(블록(1708)). 제1 경계 박스는 제2 경계 박스와 상이하다. 일부 구현들에서, 제1 경계 박스 및/또는 제2 경계 박스는 직사각형 또는 정사각형과 같은 사변형일 수 있다. 일부 구현들에서, 제1 클러스터는 제2 클러스터에 공간적으로 인접할 수 있다. 예시적인 경계 박스들이 도 15b를 참조하여 도시되고 설명된다.

인지 모듈은 제1 경계 박스 또는 제2 경계 박스 중 하나를 선택한다(블록(1710)). 경계 박스의 예시적인 선택이 도 15c를 참조하여 도시되고 설명된다.

일부 구현들에서, 비-최대 억제 기법에 기초하여 선택이 이루어질 수 있다. 예를 들어, 인지 모듈은 제1 클러스터가 제1 유형의 대상체(예를 들어, 차량, 보행자, 장애물 등)를 나타내는 것으로 예측할 수 있고, 제1 클러스터가 제1 유형의 대상체를 나타낼 제1 가능성을 결정할 수 있다. 또한, 인지 모듈은 제2 클러스터가 제2 유형의 대상체(예를 들어, 차량, 보행자, 장애물 등)를 나타내는 것으로 예측하고, 제2 클러스터가 제2 유형의 대상체를 나타낼 제2 가능성을 결정할 수 있다. 또한, 인지 모듈은 제1 유형의 대상체와 제2 유형의 대상체가 동일한 것으로 결정하고, 제1 가능성이 제2 가능성보다 높다고 결정할 수 있다. 이러한 결정들에 기초하여 인지 모듈은 제1 경계 박스를 선택할 수 있다.

인지 모듈은 대상체를 나타내는 제2 데이터를 출력한다(블록(1712)). 제2 데이터는 선택된 경계 박스의 표시 및 대상체의 표시를 포함한다. 일부 구현들에서, 제2 데이터는 대상체의 위치/이동을 추적하고 예측하는 데 사용될 수 있다. 예를 들어, 제2 데이터는 제2 데이터에 기초하여 차량에 대한 적어도 하나의 궤적을 결정하도록 구성되는 차량의 계획 회로부(예를 들어, 도 4를 참조하여 도시되고 설명된 계획 모듈(404))로 출력될 수 있다.

도 17b는 포인트 클라우드의 세그먼트화를 개선하기 위한 또 다른 예시적인 프로세스(1750)를 도시한다. 프로세스(1750)는 적어도 부분적으로, AV 클러스터 세그먼트화 및 분류 시스템(1302)(예를 들어, 도 13, 도 14, 도 15a 내지 도 15c 및 도 16a 내지 도 16c를 참조하여 설명된 바와 같이)을 포함하는 인지 모듈(402)을 사용하여 포인트 클라우드의 과소 세그먼트화를 정정하기 위해 수행될 수 있다.

프로세스(1750)에 따르면, 인지 모듈은 복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신한다(블록(1752)). 일부 구현들에서, 포인트들은 LiDAR 센서에 의해 생성될 수 있다. 예를 들어, 인지 모듈은 적어도 하나의 LiDAR 센서에 의해 생성된 복수의 포인트들 각각에 대응하는 측정들에 기초하여 제1 데이터를 수신할 수 있다.

인지 모듈은 포인트들을 복수의 클러스터들로 클러스터링한다(블록(1754)). 단일 클러스터가 다수의 상이한 대상체들을 나타내도록 포인트들은 과소 세그먼트화될 수 있다. 예를 들어, 클러스터들은 제1 대상체의 적어도 일부와 제2 대상체의 적어도 일부를 나타내는 1 클러스터를 포함할 수 있다. 예시적인 포인트 클러스터가 도 16a를 참조하여 도시되고 설명된다.

일부 구현들에서, 포인트들은 클러스터 분류 네트워크(예를 들어, 도 13을 참조하여 설명된 클러스터 분류 네트워크(1306))를 사용하여 클러스터링될 수 있다. 예를 들어, 클러스터 분류 네트워크는 제1 유형의 대상체와 제2 유형의 대상체를 결정할 수 있다. 또한, 클러스터 분류 네트워크는 제1 신뢰 메트릭 및 제2 신뢰 메트릭을 결정할 수 있다.

인지 모듈은 제1 클러스터의 제1 부분을 둘러싸는 제1 경계 박스를 생성한다(블록(1756)).

인지 모듈은 제1 클러스터의 제2 부분을 둘러싸는 제2 경계 박스를 생성한다(블록(1758)). 제1 클러스터의 제1 부분은 제1 클러스터의 제2 부분과 상이하다. 일부 구현들에서, 제1 경계 박스 및/또는 제2 경계 박스는 직사각형 또는 정사각형과 같은 사변형일 수 있다. 일부 구현들에서, 제1 경계 박스와 제2 경계 박스는 중첩되지 않는다. 일부 구현들에서, 제1 경계 박스는 제2 경계 박스에 공간적으로 인접할 수 있다. 예시적인 경계 박스들이 도 16b를 참조하여 도시되고 설명된다.

인지 모듈은 제1 경계 박스에 대한 제1 신뢰 메트릭을 결정한다(블록(1760)). 제1 신뢰 메트릭은 제1 경계 박스에 의해 둘러싸인 포인트들이 제1 유형의 대상체를 나타낼 가능성을 나타낸다. 일부 구현들에서, 제1 신뢰 메트릭은 클러스터 분류 네트워크에 의해 출력될 수 있다.

인지 모듈은 제2 경계 박스에 대한 제2 신뢰 메트릭을 결정한다(블록(1762)). 제2 신뢰 메트릭은 제2 경계 박스에 의해 둘러싸인 포인트들이 제2 유형의 대상체를 나타낼 가능성을 나타낸다. 일부 구현들에서, 제2 신뢰 메트릭은 또한 클러스터 분류 네트워크에 의해 출력될 수 있다.

제1 신뢰 메트릭 및 제2 신뢰 메트릭이 임계값을 초과하는 것에 응답하여, 인지 모듈은 제1 대상체를 나타내는 제2 데이터 및 제2 대상체를 나타내는 제3 데이터를 출력한다(블록(1764)). 제2 데이터는 제1 경계 박스의 표시 및 제1 유형의 대상체의 표시를 포함한다. 제3 데이터는 제2 경계 박스의 표시 및 제2 유형의 대상체의 표시를 포함한다.

일부 구현들에서, 임계값을 초과하는 제1 신뢰 메트릭 및 제2 신뢰 메트릭은 박스들 각각 내의 포인트들이 각각의 유형의 대상체를 나타낼 가능성이 충분히 높다는 것을 표시할 수 있다.

일부 구현들에서, 제1 신뢰 메트릭이 임계값보다 작은 것에 응답하여, 인지 모듈은 제1 클러스터와 제2 클러스터가 공통 대상체를 나타낸다고 결정할 수 있다. 이러한 결정에 기초하여, 인지 시스템은 공통 대상체를 나타내는 제4 데이터를 출력할 수 있다. 제4 데이터는 제1 클러스터의 제1 부분 및 제1 클러스터의 제2 부분을 둘러싸는 제3 경계 박스의 표시를 포함할 수 있다(예를 들어, 제1 클러스터를 둘러싸는 단일 경계 박스를 출력함). 또한, 제4 데이터는 제2 유형의 대상체의 표시를 포함할 수 있다. 일부 구현들에서, 제1 신뢰 메트릭이 임계값보다 작은 것은 박스들 중 하나 내의 포인트들이 각각의 유형의 대상체를 나타낼 가능성이 충분하지 않다는 것을 표시할 수 있다.

일부 구현들에서, 제2 데이터 및 제3 데이터는 2개 이상의 대상체의 위치 및/또는 이동을 추적하고 예측하는 데 사용될 수 있다. 예를 들어, 제2 데이터 및 제3 데이터는 제2 데이터 및 제3 데이터에 기초하여 차량에 대한 적어도 하나의 궤적을 결정하도록 구성되는 차량의 계획 회로부(예를 들어, 도 4를 참조하여 도시되고 설명된 계획 모듈(404))에 출력될 수 있다.

전술된 설명에서, 다수의 시예들은 구현마다 변화될 수 있는 다수의 특정 세부사항들을 참조하여 설명되었다. 따라서, 상세한 설명 및 도면들은 제한적인 의미보다는 예시적인 의미로 간주되어야 한다. 본 발명의 범위의 유일한 독점적인 지표, 및 출원인들이 본 발명의 범위이도록 의도한 것은, 본 출원에서 특정 형태로 나오는 일련의 청구항들의 문언적 등가 범위이며, 임의의 후속 보정을 포함한다. 그러한 청구항들에 포함된 용어들에 대한 본원에서 명시적으로 기재된 임의의 정의들은 청구항들에서 사용되는 그러한 용어들의 의미를 결정한다. 추가적으로, 전술한 설명 및 이하의 청구항들에서 "더 포함하는"이라는 용어가 사용될 때, 이 문구에 뒤따르는 것은 추가적인 단계 또는 엔티티, 또는 이전에 언급된 단계 또는 엔티티의 서브단계/서브엔티티일 수 있다.

Claims

방법에 있어서,
인지 시스템에 의해, 복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신하는 단계;
상기 인지 시스템에 의해, 상기 포인트들을 복수의 클러스터들로 클러스터링하는 단계 - 상기 클러스터들은 대상체의 제1 부분을 나타내는 제1 클러스터, 및 상기 대상체의 제2 부분을 나타내는 제2 클러스터를 포함함 - ;
상기 인지 시스템에 의해, 적어도 상기 제1 클러스터 및 상기 제2 클러스터를 둘러싸는 제1 경계 박스를 생성하는 단계;
상기 인지 시스템에 의해, 적어도 상기 제1 클러스터 및 상기 제2 클러스터를 둘러싸는(enclose) 제2 경계 박스를 생성하는 단계 - 상기 제1 경계 박스는 상기 제2 경계 박스와는 상이함 - ;
상기 인지 시스템에 의해, 상기 제1 경계 박스 또는 상기 제2 경계 박스 중 하나를 선택하는 단계; 및
상기 인지 시스템에 의해, 상기 대상체를 나타내는 제2 데이터를 출력하는 단계 - 상기 제2 데이터는 상기 선택된 경계 박스의 표시 및 상기 대상체의 표시를 포함함 -
를 포함하는, 방법.
제1항에 있어서,
상기 제1 경계 박스 및 상기 제2 경계 박스 중 적어도 하나는 사변형인 것인, 방법.
제1항에 있어서,
상기 포인트 클라우드를 나타내는 상기 제1 데이터를 수신하는 단계는:
적어도 하나의 LiDAR 센서에 의해 생성되는 상기 복수의 포인트들 각각에 대응하는 측정치들에 기초하여 상기 포인트 클라우드를 나타내는 상기 제1 데이터를 수신하는 단계
를 포함하는 것인, 방법.
제1항에 있어서,
상기 포인트들은 클러스터 분류 네트워크를 사용하여 상기 복수의 클러스터들로 클러스터링되는 것인, 방법.
제4항에 있어서,
상기 클러스터 분류 네트워크를 사용하여, 상기 클러스터들 각각에 대해, 해당 클러스터에 의해 나타내어지는 대상체의 유형을 예측하는 단계
를 더 포함하는, 방법.
제5항에 있어서,
상기 클러스터 분류 네트워크를 사용하여, 상기 클러스터들 각각에 대해, 해당 클러스터가 상기 예측된 유형의 대상체를 나타낼 가능성을 결정하는 단계
를 더 포함하는, 방법.
제1항에 있어서,
상기 제1 클러스터는 상기 제2 클러스터에 공간적으로 인접한 것인, 방법.
제1항에 있어서,
상기 제1 경계 박스 또는 상기 제2 경계 박스 중 하나를 선택하는 단계는:
상기 제1 클러스터가 제1 유형의 대상체를 나타낸다고 예측하는 단계; 및
상기 제1 클러스터가 상기 제1 유형의 대상체를 나타낼 제1 가능성을 결정하는 단계
를 포함하는 것인, 방법.
제8항에 있어서,
상기 제1 경계 박스 또는 상기 제2 경계 박스 중 하나를 선택하는 단계는:
상기 제2 클러스터가 제2 유형의 대상체를 나타낸다고 예측하는 단계; 및
상기 제2 클러스터가 상기 제2 유형의 대상체를 나타낼 제2 가능성을 결정하는 단계
를 포함하는 것인, 방법.
제9항에 있어서,
상기 제1 경계 박스 또는 상기 제2 경계 박스 중 하나를 선택하는 단계는:
상기 제1 유형의 대상체와 상기 제2 유형의 대상체가 동일하다고 결정하는 단계;
상기 제1 가능성이 상기 제2 가능성보다 높다고 결정하는 단계; 및
상기 제1 유형의 대상체와 상기 제2 유형의 대상체가 동일하다는 결정 및 상기 제1 가능성이 상기 제2 가능성보다 높다는 결정에 기초하여, 상기 제1 경계 박스를 선택하는 단계
를 포함하는 것인, 방법.
제1항에 있어서,
제2 데이터는 차량의 계획 회로부에 출력되고, 상기 계획 회로부는 상기 제2 데이터에 기초하여 상기 차량에 대한 적어도 하나의 궤적을 결정하도록 구성되는 것인, 방법.
시스템에 있어서,
적어도 하나의 프로세서; 및
명령어들을 저장한 적어도 하나의 비-일시적 컴퓨터 판독가능 매체
를 포함하며, 상기 명령어들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 동작들을 수행하게 하며, 상기 동작들은:
복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신하는 동작;
상기 포인트들을 복수의 클러스터들로 클러스터링하는 동작 - 상기 클러스터들은 대상체의 제1 부분을 나타내는 제1 클러스터, 및 상기 대상체의 제2 부분을 나타내는 제2 클러스터를 포함함 - ;
적어도 상기 제1 클러스터 및 상기 제2 클러스터를 둘러싸는 제1 경계 박스를 생성하는 동작;
적어도 상기 제1 클러스터 및 상기 제2 클러스터를 둘러싸는 제2 경계 박스를 생성하는 동작 - 상기 제1 경계 박스는 상기 제2 경계 박스와는 상이함 - ;
상기 제1 경계 박스 또는 상기 제2 경계 박스 중 하나를 선택하는 동작; 및
상기 대상체를 나타내는 제2 데이터를 출력하는 동작 - 상기 제2 데이터는 상기 선택된 경계 박스의 표시 및 상기 대상체의 표시를 포함함 -
을 포함하는 것인, 시스템.
명령어들을 저장한 적어도 하나의 비-일시적 컴퓨터 판독가능 매체에 있어서,
상기 명령어들은 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 동작들을 수행하게 하며, 상기 동작들은:
복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신하는 동작;
상기 포인트들을 복수의 클러스터들로 클러스터링하는 동작 - 상기 클러스터들은 대상체의 제1 부분을 나타내는 제1 클러스터, 및 상기 대상체의 제2 부분을 나타내는 제2 클러스터를 포함함 - ;
적어도 상기 제1 클러스터 및 상기 제2 클러스터를 둘러싸는 제1 경계 박스를 생성하는 동작;
적어도 상기 제1 클러스터 및 상기 제2 클러스터를 둘러싸는 제2 경계 박스를 생성하는 동작 - 상기 제1 경계 박스는 상기 제2 경계 박스와는 상이함 - ;
상기 제1 경계 박스 또는 상기 제2 경계 박스 중 하나를 선택하는 동작; 및
상기 대상체를 나타내는 제2 데이터를 출력하는 동작 - 상기 제2 데이터는 상기 선택된 경계 박스의 표시 및 상기 대상체의 표시를 포함함 -
을 포함하는 것인, 시스템.
방법에 있어서,
인지 시스템에 의해, 복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신하는 단계;
상기 인지 시스템에 의해, 상기 포인트들을 복수의 클러스터들로 클러스터링하는 단계 - 상기 클러스터들은 제1 대상체의 적어도 일부와 제2 대상체의 적어도 일부를 나타내는 제1 클러스터를 포함함 - ;
상기 인지 시스템에 의해, 상기 제1 클러스터의 제1 부분을 둘러싸는 제1 경계 박스를 생성하는 단계;
상기 인지 시스템에 의해, 상기 제1 클러스터의 제2 부분을 둘러싸는 제2 경계 박스를 생성하는 단계 - 상기 제1 클러스터의 제1 부분은 상기 제1 클러스터의 제2 부분과는 상이함 - ;
상기 인지 시스템에 의해, 상기 제1 경계 박스에 대한 제1 신뢰 메트릭을 결정하는 단계 - 상기 제1 신뢰 메트릭은 상기 제1 경계 박스에 의해 둘러싸인 상기 포인트들이 제1 유형의 대상체를 나타낼 가능성을 나타냄 - ;
상기 인지 시스템에 의해, 상기 제2 경계 박스에 대한 제2 신뢰 메트릭을 결정하는 단계 - 상기 제2 신뢰 메트릭은 상기 제2 경계 박스에 의해 둘러싸인 상기 포인트들이 제2 유형의 대상체를 나타낼 가능성을 나타냄 - ; 및
상기 제1 신뢰 메트릭 및 상기 제2 신뢰 메트릭이 임계값을 초과하는 것에 응답하여, 상기 인지 시스템에 의해, 상기 제1 대상체를 나타내는 제2 데이터 및 상기 제2 대상체를 나타내는 제3 데이터를 출력하는 단계 - 상기 제2 데이터는 상기 제1 경계 박스의 표시 및 상기 제1 유형의 대상체의 표시를 포함하고, 상기 제3 데이터는 상기 제2 경계 박스의 표시 및 상기 제2 유형의 대상체의 표시를 포함함 -
를 포함하는, 방법.
제14항에 있어서,
상기 제1 경계 박스 및 상기 제2 경계 박스 중 적어도 하나는 사변형인 것인, 방법.
제14항에 있어서,
상기 포인트 클라우드를 나타내는 상기 제1 데이터를 수신하는 단계는:
적어도 하나의 LiDAR 센서에 의해 생성되는 상기 복수의 포인트들 각각에 대응하는 측정들에 기초하여 상기 포인트 클라우드를 나타내는 상기 제1 데이터를 수신하는 단계
를 포함하는 것인, 방법.
제14항에 있어서,
상기 포인트들은 클러스터 분류 네트워크를 사용하여 상기 복수의 클러스터들로 클러스터링되는 것인, 방법.
제17항에 있어서,
상기 제1 유형의 대상체 및 상기 제2 유형의 대상체는 상기 클러스터 분류 네트워크에 의해 결정되는 것인, 방법.
제18항에 있어서,
상기 제1 신뢰 메트릭 및 상기 제2 신뢰 메트릭은 상기 클러스터 분류 네트워크에 의해 결정되는 것인, 방법.
제14항에 있어서,
상기 제1 경계 박스와 상기 제2 경계 박스는 중첩되지 않는 것인, 방법.
제14항에 있어서,
상기 제1 경계 박스는 상기 제2 경계 박스에 공간적으로 인접한 것인, 방법.
제14항에 있어서,
상기 제1 신뢰 메트릭이 상기 임계값보다 작은 것에 응답하여,
상기 제1 클러스터와 상기 제2 클러스터가 공통 대상체를 나타낸다고 결정하는 단계; 및
상기 인지 시스템에 의해, 상기 공통 대상체를 나타내는 제4 데이터를 출력하는 단계
를 포함하고, 상기 제4 데이터는:
상기 제1 클러스터의 제1 부분 및 상기 제1 클러스터의 제2 부분을 둘러싸는 제3 경계 박스의 표시, 및
상기 제2 유형의 대상체의 표시
를 포함하는 것인, 방법.
제14항에 있어서,
상기 제2 데이터 및 상기 제3 데이터는 차량의 계획 회로부에 출력되고, 상기 계획 회로부는 상기 제2 데이터 및 상기 제3 데이터에 기초하여 상기 차량에 대한 적어도 하나의 궤적을 결정하도록 구성되는 것인, 방법.
시스템에 있어서,
적어도 하나의 프로세서; 및
명령어들을 저장한 적어도 하나의 비-일시적 컴퓨터 판독가능 매체
를 포함하며, 상기 명령어들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 동작들을 수행하게 하며, 상기 동작들은:
복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신하는 동작;
상기 포인트들을 복수의 클러스터들로 클러스터링하는 동작 - 상기 클러스터들은 제1 대상체의 적어도 일부와 제2 대상체의 적어도 일부를 나타내는 제1 클러스터를 포함함 - ;
상기 제1 클러스터의 제1 부분을 둘러싸는 제1 경계 박스를 생성하는 동작;
상기 제1 클러스터의 제2 부분을 둘러싸는 제2 경계 박스를 생성하는 동작 - 상기 제1 클러스터의 제1 부분은 상기 제1 클러스터의 제2 부분과는 상이함 - ;
상기 제1 경계 박스에 대한 제1 신뢰 메트릭을 결정하는 동작 - 상기 제1 신뢰 메트릭은 상기 제1 경계 박스에 의해 둘러싸인 상기 포인트들이 제1 유형의 대상체를 나타낼 가능성을 나타냄 - ;
상기 제2 경계 박스에 대한 제2 신뢰 메트릭을 결정하는 동작 - 상기 제2 신뢰 메트릭은 상기 제2 경계 박스에 의해 둘러싸인 상기 포인트들이 제2 유형의 대상체를 나타낼 가능성을 나타냄 - ; 및
상기 제1 신뢰 메트릭 및 상기 제2 신뢰 메트릭이 임계값을 초과하는 것에 응답하여, 상기 제1 대상체를 나타내는 제2 데이터 및 상기 제2 대상체를 나타내는 제3 데이터를 출력하는 동작 - 상기 제2 데이터는 상기 제1 경계 박스의 표시 및 상기 제1 유형의 대상체의 표시를 포함하고, 상기 제3 데이터는 상기 제2 경계 박스의 표시 및 상기 제2 유형의 대상체의 표시를 포함함 -
을 포함하는 것인, 시스템.
명령어들을 저장한 적어도 하나의 비-일시적 컴퓨터 판독가능 매체에 있어서,
상기 명령어들은 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 동작들을 수행하게 하며, 상기 동작들은:
복수의 포인트들을 갖는 포인트 클라우드를 나타내는 제1 데이터를 수신하는 동작;
상기 포인트들을 복수의 클러스터들로 클러스터링하는 동작 - 상기 클러스터들은 제1 대상체의 적어도 일부와 제2 대상체의 적어도 일부를 나타내는 제1 클러스터를 포함함 - ;
상기 제1 클러스터의 제1 부분을 둘러싸는 제1 경계 박스를 생성하는 동작;
상기 제1 클러스터의 제2 부분을 둘러싸는 제2 경계 박스를 생성하는 동작 - 상기 제1 클러스터의 제1 부분은 상기 제1 클러스터의 제2 부분과는 상이함 - ;
상기 제1 경계 박스에 대한 제1 신뢰 메트릭을 결정하는 동작 - 상기 제1 신뢰 메트릭은 상기 제1 경계 박스에 의해 둘러싸인 상기 포인트들이 제1 유형의 대상체를 나타낼 가능성을 나타냄 - ;
상기 제2 경계 박스에 대한 제2 신뢰 메트릭을 결정하는 동작 - 상기 제2 신뢰 메트릭은 상기 제2 경계 박스에 의해 둘러싸인 상기 포인트들이 제2 유형의 대상체를 나타낼 가능성을 나타냄 - ; 및
상기 제1 신뢰 메트릭 및 상기 제2 신뢰 메트릭이 임계값을 초과하는 것에 응답하여, 상기 제1 대상체를 나타내는 제2 데이터 및 상기 제2 대상체를 나타내는 제3 데이터를 출력하는 동작 - 상기 제2 데이터는 상기 제1 경계 박스의 표시 및 상기 제1 유형의 대상체의 표시를 포함하고, 상기 제3 데이터는 상기 제2 경계 박스의 표시 및 상기 제2 유형의 대상체의 표시를 포함함 -
을 포함하는 것인, 적어도 하나의 비-일시적 컴퓨터 판독가능 매체.