KR20230037002A - 머신 러닝 기반의 포인트 클라우드 정렬 분류 - Google Patents

머신 러닝 기반의 포인트 클라우드 정렬 분류 Download PDF

Info

Publication number
KR20230037002A
KR20230037002A KR1020220113958A KR20220113958A KR20230037002A KR 20230037002 A KR20230037002 A KR 20230037002A KR 1020220113958 A KR1020220113958 A KR 1020220113958A KR 20220113958 A KR20220113958 A KR 20220113958A KR 20230037002 A KR20230037002 A KR 20230037002A
Authority
KR
South Korea
Prior art keywords
network
lidar point
point clouds
lidar
classifier
Prior art date
Application number
KR1020220113958A
Other languages
English (en)
Inventor
니콜 알렉산드라 카무스
세르지 아디프라자 위자자
타이고 마리아 보나니
베니스 에린 베일런 리옹
Original Assignee
모셔널 에이디 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모셔널 에이디 엘엘씨 filed Critical 모셔널 에이디 엘엘씨
Publication of KR20230037002A publication Critical patent/KR20230037002A/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/93Lidar systems specially adapted for specific applications for anti-collision purposes
    • G01S17/931Lidar systems specially adapted for specific applications for anti-collision purposes of land vehicles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/48Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
    • G01S7/497Means for monitoring or calibrating
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/86Combinations of lidar systems with systems other than lidar, radar or sonar, e.g. with direction finders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/89Lidar systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2420/00Indexing codes relating to the type of sensors based on the principle of their operation
    • B60W2420/40Photo, light or radio wave sensitive means, e.g. infrared sensors
    • B60W2420/408Radar; Laser, e.g. lidar
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/88Radar or analogous systems specially adapted for specific applications
    • G01S13/93Radar or analogous systems specially adapted for specific applications for anti-collision purposes
    • G01S13/931Radar or analogous systems specially adapted for specific applications for anti-collision purposes of land vehicles
    • G01S2013/9316Radar or analogous systems specially adapted for specific applications for anti-collision purposes of land vehicles combined with communication equipment with other vehicles or with base stations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/003Transmission of data between radar, sonar or lidar systems and remote stations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Electromagnetism (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

머신 러닝 기반의 포인트 클라우드 정렬 분류를 위한 방법, 시스템 및 컴퓨터 프로그램 제품이 제공된다. 예시적인 방법은, 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 단계; 적어도 하나의 분류기 네트워크를 사용하여 상기 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하는 단계; 상기 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득하는 단계; 상기 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 단계; 및 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것에 기초하여 제1 액션을 수행하는 단계를 포함한다.

Description

머신 러닝 기반의 포인트 클라우드 정렬 분류 {MACHINE LEARNING-BASED POINT CLOUD ALIGNMENT CLASSIFICATION}
관련 출원에 대한 상호참조
본 출원은, 2021년 9월 8일 출원된 “MACHINE LEARNING-BASED POINT CLOUD ALIGNMENT CLASSIFICATION”이란 명칭의 미국 가특허 출원 번호 제63/261014호의 이익을 주장하며, 이의 전체 내용은 참조에 의해 여기에 포함된다.
자율 주행 차량은 통상적으로 내비게이션에 사용하기 위해 맵의 세그먼트를 매핑하는 데 Lidar 이미징을 사용한다. 일반적으로, 포인트 클라우드 등록은 맵의 세그먼트를 매핑하기 위하여 동일 장면을 부분적으로 관찰하고 있는 두 개의(또는 그 이상의) 포인트 클라우드를 최대로 정렬하는 문제이다. 등록 알고리즘은 입력 포인트 클라우드를 최상으로 정렬하는 강체 변환(rigid transformation)을 반환하는 것을 목표로 한다. 데이터에 영향을 미치는 노이즈 및 문제의 확률적 속성으로 인해, 예컨대 기하학적 기술을 사용하는 등록 접근법은 최적의 솔루션으로 수렴하는 것이 보장되지 않는다. 최적이 아닌(non-optimal) 솔루션으로의 수렴은 매핑된 세그먼트에서 아티팩트(artifact)를 초래할 수 있다. 이러한 아티팩트의 비한정적인 예로는 이중 벽 또는 블러리(blurry) 영역을 포함할 수 있다. 매핑된 세그먼트에서의 아티팩트는 자율 차량 도메인에서 재구성의 일관성 및 재구성의 유용성을 감소시킬 수 있다.
매핑 파이프라인의 초기 단계에서 맵 아티팩트의 검출은 능률적이고 비용 효율적인 프로세스의 핵심이다. 보통 루프 내의 사람에 의한 육안 검사를 통해 오정렬이 검출된다. 일반적으로, 루프 내의 사람에 의한 육안 검사는, 비싸고(예컨대, 이 작업을 위해 사람을 훈련/고용하는데 자본 집약적임), 오류가 발생하기 쉽고(예컨대, 사람의 오류, 2D 공간에서 포인트 클라우드의 사람 감지에 의존), 일관성이 없으며(예컨대, 사람들 사이의 상이한 주관적 인식), 스케일링이 어려울 수 있다(예컨대, 도시 규모 또는 더 큰 맵에 적합하지 않음).
도 1은 자율 주행 시스템(autonomous system)의 하나 이상의 컴포넌트를 포함하는 차량이 구현될 수 있는 예시적인 환경이다.
도 2는 자율 주행 시스템을 포함하는 차량의 하나 이상의 시스템의 다이어그램이다.
도 3은 도 1 및 도 2의 하나 이상의 디바이스 및/또는 하나 이상의 시스템의 컴포넌트들의 다이어그램이다.
도 4a는 자율 주행 시스템의 특정 컴포넌트들의 다이어그램이다.
도 4b는 신경 네트워크의 구현의 다이어그램이다.
도 4c 및 도 4d는 CNN의 예시적인 작동을 예시하는 다이어그램이다.
도 5a는 포인트 클라우드 정렬 분류기 시스템의 예를 예시한 블록 다이어그램이다.
도 5b 및 도 5c는 포인트 클라우드 정렬 분류기 시스템의 예시적인 네트워크를 예시한 블록 다이어그램들이다.
도 6은 인지 시스템을 트레이닝하도록 하나 이상의 프로세서에 의해 구현된 루틴의 예를 예시한 흐름도이다.
도 7a 내지 도 7f는 정렬된 포인트 클라우드, 오정렬된 포인트 클라우드 및/또는 이의 분류를 예시하기 위한 포인트 클라우드를 예시한 다이어그램들이다.
이하의 설명에서는, 설명 목적으로 본 개시에 대한 완전한 이해를 제공하기 위해 다수의 특정 세부 사항들이 기재된다. 그렇지만, 본 개시에 의해 기술되는 실시예들이 이러한 특정 세부 사항들이 없더라도 실시될 수 있음이 명백할 것이다. 일부 경우에, 본 개시의 양태들을 불필요하게 모호하게 하는 것을 피하기 위해 잘 알려진 구조들 및 디바이스들은 블록 다이어그램 형태로 예시되어 있다.
시스템들, 디바이스들, 모듈들, 명령어 블록들, 데이터 요소들 등을 나타내는 것들과 같은, 개략적인 요소들의 특정 배열들 또는 순서들이 설명의 편의를 위해 도면들에 예시되어 있다. 그렇지만, 본 기술 분야의 통상의 기술자라면 도면들에서의 개략적인 요소들의 특정 순서 또는 배열이, 그러한 것으로 명시적으로 기술되지 않는 한, 프로세스들의 특정 프로세싱 순서 또는 시퀀스, 또는 프로세스들의 분리가 필요하다는 것을 암시하는 것으로 의미되지 않음을 이해할 것이다. 게다가, 도면에 개략적인 요소를 포함시키는 것은, 그러한 것으로 명시적으로 기술되지 않는 한 일부 실시예들에서, 그러한 요소가 모든 실시예들에서 필요하다는 것 또는 그러한 요소에 의해 표현되는 특징들이 다른 요소들에 포함되지 않을 수 있거나 다른 요소들과 결합되지 않을 수 있다는 것을 암시하는 것으로 의미되지 않는다.
게다가, 2 개 이상의 다른 개략적인 요소 사이의 연결, 관계 또는 연관을 예시하기 위해 실선 또는 파선 또는 화살표와 같은 연결 요소들이 도면들에서 사용되는 경우에, 임의의 그러한 연결 요소들의 부재는 연결, 관계 또는 연관이 존재할 수 없음을 암시하는 것으로 의미되지 않는다. 환언하면, 본 개시를 모호하게 하지 않기 위해 요소들 사이의 일부 연결들, 관계들 또는 연관들이 도면들에 예시되어 있지 않다. 추가적으로, 예시의 편의를 위해, 요소들 사이의 다수의 연결들, 관계들 또는 연관들을 나타내기 위해 단일의 연결 요소가 사용될 수 있다. 예를 들어, 연결 요소가 신호들, 데이터 또는 명령어들(예를 들면, "소프트웨어 명령어들")의 통신을 나타내는 경우에, 본 기술 분야의 통상의 기술자라면 그러한 요소가, 통신을 수행하기 위해 필요하게 될 수 있는, 하나 또는 다수의 신호 경로(예를 들면, 버스)를 나타낼 수 있다는 것을 이해할 것이다.
제1, 제2, 제3 등의 용어들이 다양한 컴포넌트들을 기술하는 데 사용되지만, 이러한 요소들이 이러한 용어들에 의해 제한되어서는 안된다. 제1, 제2, 제3 등의 용어들은 하나의 요소를 다른 요소와 구별하는 데만 사용된다. 예를 들어, 기술된 실시예들의 범위를 벗어나지 않으면서, 제1 접촉은 제2 접촉이라고 지칭될 수 있고, 유사하게 제2 접촉은 제1 접촉이라고 지칭될 수 있다. 제1 접촉과 제2 접촉 둘 모두가 접촉이지만, 동일한 접촉은 아니다.
본원에서의 다양한 기술된 실시예들에 대한 설명에서 사용되는 전문용어는 특정 실시예들을 기술하기 위해서만 포함되어 있으며, 제한하는 것으로 의도되지 않는다. 다양한 기술된 실시예들에 대한 설명 및 첨부된 청구항들에서 사용되는 바와 같이, 단수 형태들("a", "an" 및 "the")은 복수 형태들도 포함하는 것으로 의도되고, 문맥이 달리 명확히 나타내지 않는 한, "하나 이상" 또는 "적어도 하나"와 상호 교환 가능하게 사용될 수 있다. "및/또는"이라는 용어가, 본원에서 사용되는 바와 같이, 연관된 열거된 항목들 중 하나 이상의 항목의 일부 및 모든 가능한 조합을 지칭하고 포함한다는 것이 또한 이해될 것이다. "포함한다(includes)", 포함하는(including), 포함한다(comprises)" 및/또는 "포함하는(comprising)"이라는 용어들이, 본 설명에서 사용될 때, 언급된 특징들, 정수들, 단계들, 동작들, 요소들, 및/또는 컴포넌트들의 존재를 명시하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 컴포넌트, 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다는 것이 추가로 이해될 것이다.
본원에서 사용되는 바와 같이, "통신" 및 "통신하다"라는 용어들은 정보(또는, 예를 들어, 데이터, 신호들, 메시지들, 명령어들, 커맨드들 등에 의해 표현되는 정보)의 수신, 접수, 송신, 전달, 제공 등 중 적어도 하나를 지칭한다. 하나의 유닛(예를 들면, 디바이스, 시스템, 디바이스 또는 시스템의 컴포넌트, 이들의 조합들 등)이 다른 유닛과 통신한다는 것은 하나의 유닛이 직접 또는 간접적으로 다른 유닛으로부터 정보를 수신하고/하거나 다른 유닛으로 정보를 전송(예를 들면, 송신)할 수 있음을 의미한다. 이것은 본질적으로 유선 및/또는 무선인 직접 또는 간접 연결을 지칭할 수 있다. 추가적으로, 송신되는 정보가 제1 유닛과 제2 유닛 사이에서 수정, 프로세싱, 중계 및/또는 라우팅될 수 있을지라도 2 개의 유닛은 서로 통신하고 있을 수 있다. 예를 들어, 제1 유닛이 정보를 수동적으로 수신하고 정보를 제2 유닛으로 능동적으로 송신하지 않을지라도 제1 유닛은 제2 유닛과 통신하고 있을 수 있다. 다른 예로서, 적어도 하나의 중간 유닛(예를 들면, 제1 유닛과 제2 유닛 사이에 위치하는 제3 유닛)이 제1 유닛으로부터 수신되는 정보를 프로세싱하고 프로세싱된 정보를 제2 유닛으로 송신하는 경우 제1 유닛은 제2 유닛과 통신하고 있을 수 있다. 일부 실시예들에서, 메시지는 데이터를 포함하는 네트워크 패킷(예를 들면, 데이터 패킷 등)을 지칭할 수 있다.
본원에서 사용되는 바와 같이, "~ 경우"라는 용어는, 선택적으로, 문맥에 따라 "~할 때", 또는 "~시에" 또는 "~라고 결정하는 것에 응답하여", "~을 검출하는 것에 응답하여" 등을 의미하는 것으로 해석된다. 유사하게, 문구 "~라고 결정되는 경우" 또는 "[언급된 조건 또는 이벤트]가 검출되는 경우"는, 선택적으로, 문맥에 따라, "~라고 결정할 시에", "~라고 결정하는 것에 응답하여", "[언급된 조건 또는 이벤트]를 검출할 시에", "[언급된 조건 또는 이벤트]를 검출하는 것에 응답하여" 등을 의미하는 것으로 해석된다. 또한, 본원에서 사용되는 바와 같이, "갖는다"(has, have), "갖는(having)" 등의 용어들은 개방형(open-ended) 용어들인 것으로 의도된다. 게다가, 문구 "~에 기초하여"는, 달리 명시적으로 언급되지 않는 한, "~에 적어도 부분적으로 기초하여"를 의미하는 것으로 의도된다.
그 예가 첨부 도면에 예시된 실시예가 이제 상세하게 언급될 것이다. 이하의 상세한 설명에서, 다양한 기술된 실시예에 대한 완전한 이해를 제공하기 위해 많은 특정 세부 사항이 기재된다. 그렇지만, 다양한 기술된 실시예들이 이러한 특정 세부 사항들이 없더라도 실시될 수 있다는 것이 본 기술 분야의 통상의 기술자에게 명백할 것이다. 다른 경우에, 실시예의 양태를 불필요하게 모호하게 하지 않기 위해 공지된 방법, 절차, 컴포넌트, 회로, 및 네트워크는 상세히 기술되지 않았다.
일반적 개관
일부 양태 및/또는 실시예에서, 본원에 기술된 시스템, 방법 및 컴퓨터 프로그램 제품은 분류기(classifier) 시스템을 포함하고/하거나 구현한다. 비한정적인 예로서, 분류기 시스템은 한 쌍의 LiDAR 포인트 클라우드를 획득하고, 분류기 네트워크를 통해 LiDAR 포인트 클라우드 쌍을 프로세싱할 수 있다. 분류기 네트워크는 LiDAR 포인트 클라우드 쌍으로부터 특징(feature)을 추출하고, LiDAR 포인트 클라우드 쌍이 정렬되거나 오정렬되는 확률 점수를 계산할 수 있다.
본원에 기술된 시스템, 방법 및 컴퓨터 프로그램 제품의 구현으로 인해, 자율 주행 차량 또는 AV 시스템은 루프 아티팩트 검출에서 사람을 사용하는 것을 피할 수 있다. 따라서, 본 개시의 시스템은, 덜 비싸고(예컨대, 이 작업을 위한 사람의 훈련/고용에 자본 투자를 피함), 오류 발생 가능성이 적고(예컨대, 사람 오류를 피함, 2D/3D 공간에서의 포인트 클라우드의 픽셀 수준 감지를 가짐), 보다 일관적이며(예컨대, 사람들 사이의 상이한 주관적 인식을 피함), 계산 리소스를 이용해 스케일링할 수 있다(예컨대, 도시 규모 또는 더 큰 맵에 적합함).
이제 도 1을 참조하면, 자율 주행 시스템들을 포함하는 차량들은 물론 그렇지 않은 차량들이 작동되는 예시적인 환경(100)이 예시되어 있다. 예시된 바와 같이, 환경(100)은 차량들(102a 내지 102n), 대상체들(104a 내지 104n), 루트들(106a 내지 106n), 영역(108), 차량 대 인프라스트럭처(vehicle-to-infrastructure, V2I) 디바이스(110), 네트워크(112), 원격 자율 주행 차량(AV) 시스템(114), 플릿 관리 시스템(fleet management system)(116), 및 V2I 시스템(118)을 포함한다. 차량들(102a 내지 102n), 차량 대 인프라스트럭처(V2I) 디바이스(110), 네트워크(112), 자율 주행 차량(AV) 시스템(114), 플릿 관리 시스템(116), 및 V2I 시스템(118)은 유선 연결들, 무선 연결들, 또는 유선 또는 무선 연결들의 조합을 통해 상호연결한다(예를 들면, 통신 등을 위해 연결을 확립한다). 일부 실시예들에서, 대상체들(104a 내지 104n)은 유선 연결들, 무선 연결들 또는 유선 또는 무선 연결들의 조합을 통해 차량들(102a 내지 102n), 차량 대 인프라스트럭처(V2I) 디바이스(110), 네트워크(112), 자율 주행 차량(AV) 시스템(114), 플릿 관리 시스템(116), 및 V2I 시스템(118) 중 적어도 하나와 상호연결한다.
차량들(102a 내지 102n)(개별적으로 차량(102)이라고 지칭되고 집합적으로 차량들(102)이라고 지칭됨)은 상품 및/또는 사람을 운송하도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 실시예들에서, 차량들(102)은 네트워크(112)를 통해 V2I 디바이스(110), 원격 AV 시스템(114), 플릿 관리 시스템(116), 및/또는 V2I 시스템(118)과 통신하도록 구성된다. 일부 실시예들에서, 차량들(102)은 자동차들, 버스들, 트럭들, 기차들 등을 포함한다. 일부 실시예들에서, 차량들(102)은 본원에 기술된 차량들(200)(도 2 참조)과 동일하거나 유사하다. 일부 실시예들에서, 일단의 차량들(200) 중의 차량(200)은 자율 주행 플릿 관리자와 연관된다. 일부 실시예들에서, 차량들(102)은, 본원에 기술된 바와 같이, 각자의 루트들(106a 내지 106n)(개별적으로 루트(106)라고 지칭되고 집합적으로 루트들(106)이라고 지칭됨)을 따라 주행한다. 일부 실시예들에서, 하나 이상의 차량(102)은 자율 주행 시스템(예를 들면, 자율 주행 시스템(202)과 동일하거나 유사한 자율 주행 시스템)을 포함한다.
대상체들(104a 내지 104n)(개별적으로 대상체(104)라고 지칭되고 집합적으로 대상체들(104)이라고 지칭됨)은, 예를 들어, 적어도 하나의 차량, 적어도 하나의 보행자, 적어도 하나의 자전거 타는 사람, 적어도 하나의 구조물(예를 들면, 건물, 표지판, 소화전(fire hydrant) 등) 등을 포함한다. 각각의 대상체(104)는 정지해 있거나(예를 들면, 일정 시간 기간 동안 고정 위치에 위치하거나) 이동하고 있다(예를 들면, 속도를 가지며 적어도 하나의 궤적과 연관되어 있다). 일부 실시예들에서, 대상체들(104)은 영역(108) 내의 대응하는 위치들과 연관되어 있다.
루트들(106a 내지 106n)(개별적으로 루트(106)라고 지칭되고 집합적으로 루트들(106)이라고 지칭됨)은 각각 AV가 운행할 수 있는 상태들을 연결하는 행동들의 시퀀스(궤적이라고도 함)와 연관된다(예를 들면, 이를 규정한다). 각각의 루트(106)는 초기 상태(예를 들면, 제1 시공간적 위치, 속도 등에 대응하는 상태) 및 최종 목표 상태(예를 들면, 제1 시공간적 위치와 상이한 제2 시공간적 위치에 대응하는 상태) 또는 목표 영역(예를 들면, 허용 가능한 상태들(예를 들면, 종료 상태들(terminal states))의 부분 공간(subspace))에서 시작된다. 일부 실시예들에서, 제1 상태는 개인 또는 개인들이 AV에 의해 픽업(pick-up)되어야 하는 위치를 포함하고 제2 상태 또는 영역은 AV에 의해 픽업된 개인 또는 개인들이 하차(drop-off)해야 하는 위치 또는 위치들을 포함한다. 일부 실시예들에서, 루트들(106)은 복수의 허용 가능한 상태 시퀀스들(예를 들면, 복수의 시공간적 위치 시퀀스들)을 포함하며, 복수의 상태 시퀀스들은 복수의 궤적들과 연관된다(예를 들면, 이를 정의한다). 일 예에서, 루트들(106)은, 도로 교차로들에서의 회전 방향들을 지시하는 일련의 연결된 도로들과 같은, 상위 레벨 행동들 또는 부정확한 상태 위치들만을 포함한다. 추가적으로 또는 대안적으로, 루트들(106)은, 예를 들어, 특정 목표 차선들 또는 차선 영역들 내에서의 정확한 위치들 및 해당 위치들에서의 목표 속력과 같은, 보다 정확한 행동들 또는 상태들을 포함할 수 있다. 일 예에서, 루트들(106)은 중간 목표들에 도달하기 위해 제한된 룩어헤드 호라이즌(lookahead horizon)을 갖는 적어도 하나의 상위 레벨 행동 시퀀스를 따른 복수의 정확한 상태 시퀀스들을 포함하며, 여기서 제한된 호라이즌 상태 시퀀스들의 연속적인 반복들의 조합은 누적되어 복수의 궤적들에 대응하며 이 복수의 궤적들은 집합적으로 최종 목표 상태 또는 영역에서 종료하는 상위 레벨 루트를 형성한다.
영역(108)은 차량들(102)이 운행할 수 있는 물리적 영역(예를 들면, 지리적 영역)을 포함한다. 일 예에서, 영역(108)은 적어도 하나의 주(state)(예를 들면, 국가, 지방, 국가에 포함된 복수의 주들의 개개의 주 등), 주의 적어도 하나의 부분, 적어도 하나의 도시, 도시의 적어도 하나의 부분 등을 포함한다. 일부 실시예들에서, 영역(108)은 간선 도로, 주간 간선 도로, 공원 도로, 도시 거리 등과 같은 적어도 하나의 명명된 주요 도로(thoroughfare)(본원에서 "도로"라고 지칭됨)를 포함한다. 추가적으로 또는 대안적으로, 일부 예들에서, 영역(108)은 진입로, 주차장의 섹션, 공터 및/또는 미개발 부지의 섹션, 비포장 경로 등과 같은 적어도 하나의 명명되지 않은 도로를 포함한다. 일부 실시예들에서, 도로는 적어도 하나의 차선(예를 들면, 차량(102)에 의해 횡단될 수 있는 도로의 일 부분)을 포함한다. 일 예에서, 도로는 적어도 하나의 차선 마킹과 연관된(예를 들면, 이에 기초하여 식별되는) 적어도 하나의 차선을 포함한다.
차량 대 인프라스트럭처(V2I) 디바이스(110)(때때로 차량 대 인프라스트럭처(V2X) 디바이스라고 지칭됨)는 차량들(102) 및/또는 V2I 인프라스트럭처 시스템(118)과 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 실시예들에서, V2I 디바이스(110)는 네트워크(112)를 통해 차량들(102), 원격 AV 시스템(114), 플릿 관리 시스템(116), 및/또는 V2I 시스템(118)과 통신하도록 구성된다. 일부 실시예들에서, V2I 디바이스(110)는 RFID(radio frequency identification) 디바이스, 사이니지(signage), 카메라(예를 들면, 2차원(2D) 및/또는 3차원(3D) 카메라), 차선 마커, 가로등, 주차 미터기 등을 포함한다. 일부 실시예들에서, V2I 디바이스(110)는 차량들(102)과 직접 통신하도록 구성된다. 추가적으로 또는 대안적으로, 일부 실시예들에서, V2I 디바이스(110)는 V2I 시스템(118)을 통해 차량들(102), 원격 AV 시스템(114), 및/또는 플릿 관리 시스템(116)과 통신하도록 구성된다. 일부 실시예들에서, V2I 디바이스(110)는 네트워크(112)를 통해 V2I 시스템(118)과 통신하도록 구성된다.
네트워크(112)는 하나 이상의 유선 및/또는 무선 네트워크를 포함한다. 일 예에서, 네트워크(112)는 셀룰러 네트워크(예를 들면, LTE(long term evolution) 네트워크, 3G(third generation) 네트워크, 4G(fourth generation) 네트워크, 5G(fifth generation) 네트워크, CDMA( code division multiple access) 네트워크 등), PLMN(public land mobile network), LAN(local area network), WAN(wide area network), MAN(metropolitan area network), 전화 네트워크(예를 들면, PSTN(public switched telephone network)), 사설 네트워크, 애드혹 네트워크, 인트라넷, 인터넷, 광섬유 기반 네트워크, 클라우드 컴퓨팅 네트워크 등, 이러한 네트워크들의 일부 또는 전부의 조합 등을 포함한다.
원격 AV 시스템(114)은 네트워크(112)를 통해 차량들(102), V2I 디바이스(110), 네트워크(112), 플릿 관리 시스템(116), 및/또는 V2I 시스템(118)과 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 일 예에서, 원격 AV 시스템(114)은 서버, 서버들의 그룹, 및/또는 다른 유사한 디바이스들을 포함한다. 일부 실시예들에서, 원격 AV 시스템(114)은 플릿 관리 시스템(116)과 동일 위치에 배치된다(co-located). 일부 실시예들에서, 원격 AV 시스템(114)은 자율 주행 시스템, 자율 주행 차량 컴퓨터, 자율 주행 차량 컴퓨터에 의해 구현되는 소프트웨어 등을 포함한, 차량의 컴포넌트들 중 일부 또는 전부의 설치에 관여된다. 일부 실시예들에서, 원격 AV 시스템(114)은 차량의 수명 동안 그러한 컴포넌트들 및/또는 소프트웨어를 유지 관리(예를 들면, 업데이트 및/또는 교체)한다.
플릿 관리 시스템(116)은 차량들(102), V2I 디바이스(110), 원격 AV 시스템(114), 및/또는 V2I 인프라스트럭처 시스템(118)과 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 일 예에서, 플릿 관리 시스템(116)은 서버, 서버들의 그룹, 및/또는 다른 유사한 디바이스들을 포함한다. 일부 실시예들에서, 플릿 관리 시스템(116)은 라이드 셰어링(ridesharing) 회사(예를 들면, 다수의 차량들(예를 들면, 자율 주행 시스템들을 포함하는 차량들 및/또는 자율 주행 시스템들을 포함하지 않는 차량들)의 작동을 제어하는 조직 등)와 연관된다.
일부 실시예들에서, V2I 시스템(118)은 네트워크(112)를 통해 차량들(102), V2I 디바이스(110), 원격 AV 시스템(114), 및/또는 플릿 관리 시스템(116)과 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 예들에서, V2I 시스템(118)은 네트워크(112)와 상이한 연결을 통해 V2I 디바이스(110)와 통신하도록 구성된다. 일부 실시예들에서, V2I 시스템(118)은 서버, 서버들의 그룹, 및/또는 다른 유사한 디바이스들을 포함한다. 일부 실시예들에서, V2I 시스템(118)은 지자체 또는 사설 기관(예를 들면, V2I 디바이스(110) 등을 유지 관리하는 사설 기관)과 연관된다.
도 1에 예시된 요소들의 수 및 배열은 예로서 제공된다. 도 1에 예시된 것보다, 추가적인 요소들, 더 적은 요소들, 상이한 요소들 및/또는 상이하게 배열된 요소들이 있을 수 있다. 추가적으로 또는 대안적으로, 환경(100)의 적어도 하나의 요소는 도 1의 적어도 하나의 상이한 요소에 의해 수행되는 것으로 기술된 하나 이상의 기능을 수행할 수 있다. 추가적으로 또는 대안적으로, 환경(100)의 적어도 하나의 요소 세트는 환경(100)의 적어도 하나의 상이한 요소 세트에 의해 수행되는 것으로 기술된 하나 이상의 기능을 수행할 수 있다.
이제 도 2를 참조하면, 차량(200)은 자율 주행 시스템(202), 파워트레인 제어 시스템(204), 조향 제어 시스템(206), 및 브레이크 시스템(208)을 포함한다. 일부 실시예들에서, 차량(200)은 차량(102)(도 1 참조)과 동일하거나 유사하다. 일부 실시예들에서, 차량(102)은 자율 주행 능력을 갖는다(예를 들면, 완전 자율 주행 차량들(예를 들면, 인간 개입에 의존하지 않는 차량들), 고도 자율 주행 차량들(예를 들면, 특정 상황들에서 인간 개입에 의존하지 않는 차량들) 등을, 제한 없이, 포함한, 차량(200)이 인간 개입 없이 부분적으로 또는 완전히 작동될 수 있게 하는 적어도 하나의 기능, 특징, 디바이스 등을 구현한다). 완전 자율 주행 차량들 및 고도 자율 주행 차량들에 대한 상세한 설명에 대해서는, 그 전체가 참고로 포함되는, SAE International's standard J3016: Taxonomy and Definitions for Terms Related to On-Road Motor Vehicle Automated Driving Systems를 참조할 수 있다. 일부 실시예들에서, 차량(200)은 자율 주행 플릿 관리자 및/또는 라이드 셰어링 회사와 연관된다.
자율 주행 시스템(202)은 카메라들(202a), LiDAR 센서들(202b), 레이더 센서들(202c), 및 마이크로폰들(202d)과 같은 하나 이상의 디바이스들을 포함하는 센서 스위트(sensor suite)를 포함한다. 일부 실시예들에서, 자율 주행 시스템(202)은 보다 많거나 보다 적은 디바이스들 및/또는 상이한 디바이스들(예를 들면, 초음파 센서들, 관성 센서들, GPS 수신기들(아래에서 논의됨), 차량(200)이 주행한 거리의 표시와 연관된 데이터를 생성하는 주행 거리 측정 센서들 등)을 포함할 수 있다. 일부 실시예들에서, 자율 주행 시스템(202)은 자율 주행 시스템(202)에 포함된 하나 이상의 디바이스를 사용하여 본원에서 기술되는 환경(100)과 연관된 데이터를 생성한다. 자율 주행 시스템(202)의 하나 이상의 디바이스에 의해 생성되는 데이터는 차량(200)이 위치하는 환경(예를 들면, 환경(100))을 관측하기 위해 본원에 기술된 하나 이상의 시스템에 의해 사용될 수 있다. 일부 실시예들에서, 자율 주행 시스템(202)은 통신 디바이스(202e), 자율 주행 차량 컴퓨터(202f), 및 드라이브 바이 와이어(drive-by-wire, DBW) 시스템(202h)을 포함한다.
카메라들(202a)은 버스(예를 들면, 도 3의 버스(302)와 동일하거나 유사한 버스)를 통해 통신 디바이스(202e), 자율 주행 차량 컴퓨터(202f) 및/또는 안전 제어기(202g)와 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 카메라들(202a)은 물리적 대상체들(예를 들면, 자동차들, 버스들, 연석들, 사람들 등)을 포함하는 이미지들을 캡처하기 위한 적어도 하나의 카메라(예를 들면, CCD(charge-coupled device)와 같은 광 센서를 사용하는 디지털 카메라, 열 카메라, 적외선(IR) 카메라, 이벤트 카메라 등)를 포함한다. 일부 실시예들에서, 카메라(202a)는 카메라 데이터를 출력으로서 생성한다. 일부 예들에서, 카메라(202a)는 이미지와 연관된 이미지 데이터를 포함하는 카메라 데이터를 생성한다. 이 예에서, 이미지 데이터는 이미지에 대응하는 적어도 하나의 파라미터(예를 들면, 노출, 밝기 등과 같은 이미지 특성들, 이미지 타임스탬프 등)를 명시할 수 있다. 그러한 예에서, 이미지는 한 형식(예를 들면, RAW, JPEG, PNG 등)으로 되어 있을 수 있다. 일부 실시예들에서, 카메라(202a)는 입체시(stereopsis)(스테레오 비전(stereo vision))를 위해 이미지들을 캡처하도록 차량 상에 구성된(예를 들면, 차량 상에 위치된) 복수의 독립적인 카메라들을 포함한다. 일부 예들에서, 카메라(202a)는 복수의 카메라들을 포함하고, 이 복수의 카메라들은 이미지 데이터를 생성하고 이미지 데이터를 자율 주행 차량 컴퓨터(202f) 및/또는 플릿 관리 시스템(예를 들면, 도 1의 플릿 관리 시스템(116)과 동일하거나 유사한 플릿 관리 시스템)으로 전송한다. 그러한 예에서, 자율 주행 차량 컴퓨터(202f)는 적어도 2 개의 카메라로부터의 이미지 데이터에 기초하여 복수의 카메라들 중 적어도 2 개의 카메라의 시야 내의 하나 이상의 대상체까지의 깊이를 결정한다. 일부 실시예들에서, 카메라들(202a)은 카메라들(202a)로부터 일정 거리(예를 들면, 최대 100 미터, 최대 1 킬로미터 등) 내의 대상체들의 이미지들을 캡처하도록 구성된다. 그에 따라, 카메라들(202a)은 카메라들(202a)로부터 하나 이상의 거리에 있는 대상체들을 인지하도록 최적화된 센서들 및 렌즈들과 같은 특징부들을 포함한다.
일 실시예에서, 카메라(202a)는 시각적 내비게이션 정보를 제공하는 하나 이상의 교통 신호등, 거리 표지판 및/또는 다른 물리적 대상체와 연관된 하나 이상의 이미지를 캡처하도록 구성된 적어도 하나의 카메라를 포함한다. 일부 실시예들에서, 카메라(202a)는 하나 이상의 이미지와 연관된 교통 신호등 데이터(TLD 데이터)를 생성한다. 일부 예들에서, 카메라(202a)는 한 형식(예를 들면, RAW, JPEG, PNG 등)을 포함하는 하나 이상의 이미지와 연관된 TLD 데이터를 생성한다. 일부 실시예들에서, TLD 데이터를 생성하는 카메라(202a)는, 카메라(202a)가 가능한 한 많은 물리적 대상체들에 관한 이미지들을 생성하기 위해 넓은 시야를 갖는 하나 이상의 카메라(예를 들면, 광각 렌즈, 어안 렌즈, 대략 120도 이상의 시야각을 갖는 렌즈 등)를 포함할 수 있다는 점에서, 카메라들을 포함하는 본원에 기술된 다른 시스템들과 상이하다.
LiDAR(Laser Detection and Ranging) 센서들(202b)은 버스(예를 들면, 도 3의 버스(302)와 동일하거나 유사한 버스)를 통해 통신 디바이스(202e), 자율 주행 차량 컴퓨터(202f), 및/또는 안전 제어기(202g)와 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. LiDAR 센서들(202b)은 광 방출기(예를 들면, 레이저 송신기)로부터 광을 송신하도록 구성된 시스템을 포함한다. LiDAR 센서들(202b)에 의해 방출되는 광은 가시 스펙트럼 밖에 있는 광(예를 들면, 적외선 광 등)을 포함한다. 일부 실시예들에서, 작동 동안, LiDAR 센서들(202b)에 의해 방출되는 광은 물리적 대상체(예를 들면, 차량)와 조우하고 LiDAR 센서들(202b)로 다시 반사된다. 일부 실시예들에서, LiDAR 센서들(202b)에 의해 방출되는 광은 광이 조우하는 물리적 대상체들을 투과하지 않는다. LiDAR 센서들(202b)은 광 방출기로부터 방출된 광이 물리적 대상체와 조우한 후에 그 광을 검출하는 적어도 하나의 광 검출기를 또한 포함한다. 일부 실시예들에서, LiDAR 센서들(202b)과 연관된 적어도 하나의 데이터 프로세싱 시스템은 LiDAR 센서들(202b)의 시야에 포함된 대상체들을 나타내는 이미지(예를 들면, 포인트 클라우드, 결합된 포인트 클라우드(combined point cloud) 등)를 생성한다. 일부 예들에서, LiDAR 센서(202b)와 연관된 적어도 하나의 데이터 프로세싱 시스템은 물리적 대상체의 경계들, 물리적 대상체의 표면들(예를 들면, 표면들의 토폴로지) 등을 나타내는 이미지를 생성한다. 그러한 예에서, 이미지는 LiDAR 센서들(202b)의 시야 내의 물리적 대상체들의 경계들을 결정하는 데 사용된다.
레이더(radar, Radio Detection and Ranging) 센서들(202c)은 버스(예를 들면, 도 3의 버스(302)와 동일하거나 유사한 버스)를 통해 통신 디바이스(202e), 자율 주행 차량 컴퓨터(202f) 및/또는 안전 제어기(202g)와 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 레이더 센서들(202c)은 전파들을 (펄스형으로 또는 연속적으로) 송신하도록 구성된 시스템을 포함한다. 레이더 센서들(202c)에 의해 송신되는 전파들은 미리 결정된 스펙트럼 내에 있는 전파들을 포함한다. 일부 실시예들에서, 작동 동안, 레이더 센서들(202c)에 의해 송신되는 전파들은 물리적 대상체와 조우하고 레이더 센서들(202c)로 다시 반사된다. 일부 실시예들에서, 레이더 센서들(202c)에 의해 전송되는 전파들이 일부 대상체들에 의해 반사되지 않는다. 일부 실시예들에서, 레이더 센서들(202c)과 연관된 적어도 하나의 데이터 프로세싱 시스템은 레이더 센서들(202c)의 시야에 포함된 대상체들을 나타내는 신호들을 생성한다. 예를 들어, 레이더 센서(202c)와 연관된 적어도 하나의 데이터 프로세싱 시스템은 물리적 대상체의 경계들, 물리적 대상체의 표면들(예를 들면, 표면들의 토폴로지) 등을 나타내는 이미지를 생성한다. 일부 예들에서, 이미지는 레이더 센서들(202c)의 시야 내의 물리적 대상체들의 경계들을 결정하는 데 사용된다.
마이크로폰들(202d)은 버스(예를 들면, 도 3의 버스(302)와 동일하거나 유사한 버스)를 통해 통신 디바이스(202e), 자율 주행 차량 컴퓨터(202f) 및/또는 안전 제어기(202g)와 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 마이크로폰들(202d)은 오디오 신호들을 캡처하고 오디오 신호들과 연관된(예를 들면, 이를 나타내는) 데이터를 생성하는 하나 이상의 마이크로폰(예를 들면, 어레이 마이크로폰, 외부 마이크로폰 등)을 포함한다. 일부 예들에서, 마이크로폰들(202d)은 트랜스듀서 디바이스들 및/또는 유사 디바이스들을 포함한다. 일부 실시예들에서, 본원에 기술된 하나 이상의 시스템은 마이크로폰들(202d)에 의해 생성되는 데이터를 수신하고 데이터와 연관된 오디오 신호들에 기초하여 차량(200)에 상대적인 대상체의 위치(예를 들면, 거리 등)를 결정할 수 있다.
통신 디바이스(202e)는 카메라들(202a), LiDAR 센서들(202b), 레이더 센서들(202c), 마이크로폰들(202d), 자율 주행 차량 컴퓨터(202f), 안전 제어기(202g), 및/또는 DBW 시스템(202h)과 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 예를 들어, 통신 디바이스(202e)는 도 3의 통신 인터페이스(314)와 동일하거나 유사한 디바이스를 포함할 수 있다. 일부 실시예들에서, 통신 디바이스(202e)는 차량 대 차량(vehicle-to-vehicle, V2V) 통신 디바이스(예를 들면, 차량들 간의 데이터의 무선 통신을 가능하게 하는 디바이스)를 포함한다.
자율 주행 차량 컴퓨터(202f)는 카메라들(202a), LiDAR 센서들(202b), 레이더 센서들(202c), 마이크로폰들(202d), 통신 디바이스(202e), 안전 제어기(202g), 및/또는 DBW 시스템(202h)과 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 예들에서, 자율 주행 차량 컴퓨터(202f)는 클라이언트 디바이스, 모바일 디바이스(예를 들면, 셀룰러 전화, 태블릿 등), 서버(예를 들면, 하나 이상의 중앙 프로세싱 유닛, 그래픽 프로세싱 유닛 등을 포함하는 컴퓨팅 디바이스) 등과 같은 디바이스를 포함한다. 일부 실시예들에서, 자율 주행 차량 컴퓨터(202f)는 본원에 기술된 자율 주행 차량 컴퓨터(400)와 동일하거나 유사하다. 추가적으로 또는 대안적으로, 일부 실시예들에서, 자율 주행 차량 컴퓨터(202f)는 자율 주행 차량 시스템(예를 들면, 도 1의 원격 AV 시스템(114)과 동일하거나 유사한 자율 주행 차량 시스템), 플릿 관리 시스템(예를 들면, 도 1의 플릿 관리 시스템(116)과 동일하거나 유사한 플릿 관리 시스템), V2I 디바이스(예를 들면, 도 1의 V2I 디바이스(110)와 동일하거나 유사한 V2I 디바이스), 및/또는 V2I 시스템(예를 들면, 도 1의 V2I 시스템(118)과 동일하거나 유사한 V2I 시스템)과 통신하도록 구성된다.
안전 제어기(202g)는 카메라들(202a), LiDAR 센서들(202b), 레이더 센서들(202c), 마이크로폰들(202d), 통신 디바이스(202e), 자율 주행 차량 컴퓨터(202f), 및/또는 DBW 시스템(202h)과 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 예들에서, 안전 제어기(202g)는 차량(200)의 하나 이상의 디바이스(예를 들면, 파워트레인 제어 시스템(204), 조향 제어 시스템(206), 브레이크 시스템(208) 등)를 작동시키기 위한 제어 신호들을 생성 및/또는 송신하도록 구성된 하나 이상의 제어기(전기 제어기, 전기기계 제어기 등)를 포함한다. 일부 실시예들에서, 안전 제어기(202g)는 자율 주행 차량 컴퓨터(202f)에 의해 생성 및/또는 송신되는 제어 신호들보다 우선하는(예를 들면, 이를 무시하는) 제어 신호들을 생성하도록 구성된다.
DBW 시스템(202h)은 통신 디바이스(202e) 및/또는 자율 주행 차량 컴퓨터(202f)와 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 예들에서, DBW 시스템(202h)은 차량(200)의 하나 이상의 디바이스(예를 들면, 파워트레인 제어 시스템(204), 조향 제어 시스템(206), 브레이크 시스템(208) 등)를 작동시키기 위한 제어 신호들을 생성 및/또는 송신하도록 구성된 하나 이상의 제어기(예를 들면, 전기 제어기, 전기기계 제어기 등)를 포함한다. 추가적으로 또는 대안적으로, DBW 시스템(202h)의 하나 이상의 제어기는 차량(200)의 적어도 하나의 상이한 디바이스(예를 들면, 방향 지시등, 헤드라이트, 도어록, 윈도실드 와이퍼 등)를 작동시키기 위한 제어 신호들을 생성 및/또는 송신하도록 구성된다.
파워트레인 제어 시스템(204)은 DBW 시스템(202h)과 통신하도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 예들에서, 파워트레인 제어 시스템(204)은 적어도 하나의 제어기, 액추에이터 등을 포함한다. 일부 실시예들에서, 파워트레인 제어 시스템(204)은 DBW 시스템(202h)으로부터 제어 신호들을 수신하고, 파워트레인 제어 시스템(204)은 차량(200)이 전진하는 것을 시작하게 하고, 전진하는 것을 중지하게 하며, 후진하는 것을 시작하게 하고, 후진하는 것을 중지하게 하며, 한 방향으로 가속하게 하고, 한 방향으로 감속하게 하며, 좌회전을 수행하게 하고, 우회전을 수행하게 하는 등을 한다. 일 예에서, 파워트레인 제어 시스템(204)은 차량의 모터에 제공되는 에너지(예를 들면, 연료, 전기 등)가 증가하게 하거나, 동일하게 유지되게 하거나, 또는 감소하게 하여, 이에 의해 차량(200)의 적어도 하나의 바퀴가 회전하거나 회전하지 않게 한다.
조향 제어 시스템(206)은 차량(200)의 하나 이상의 바퀴를 회전시키도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 예들에서, 조향 제어 시스템(206)은 적어도 하나의 제어기, 액추에이터 등을 포함한다. 일부 실시예들에서, 조향 제어 시스템(206)은 차량(200)이 좌측 또는 우측으로 방향 전환하게 하기 위해 차량(200)의 전방 2 개의 바퀴 및/또는 후방 2 개의 바퀴가 좌측 또는 우측으로 회전하게 한다.
브레이크 시스템(208)은 차량(200)이 속력을 감소시키게 하고/하거나 정지해 있는 채로 유지하게 하기 위해 하나 이상의 브레이크를 작동시키도록 구성된 적어도 하나의 디바이스를 포함한다. 일부 예들에서, 브레이크 시스템(208)은 차량(200)의 대응하는 로터(rotor)에서 차량(200)의 하나 이상의 바퀴들과 연관된 하나 이상의 캘리퍼(caliper)가 닫히게 하도록 구성되는 적어도 하나의 제어기 및/또는 액추에이터를 포함한다. 추가적으로 또는 대안적으로, 일부 예들에서, 브레이크 시스템(208)은 자동 긴급 제동(automatic emergency braking, AEB) 시스템, 회생 제동 시스템 등을 포함한다.
일부 실시예들에서, 차량(200)은 차량(200)의 상태 또는 조건의 속성들을 측정 또는 추론하는 적어도 하나의 플랫폼 센서(명시적으로 예시되지 않음)를 포함한다. 일부 예들에서, 차량(200)은 GPS(global positioning system) 수신기, IMU(inertial measurement unit), 휠 속력 센서, 휠 브레이크 압력 센서, 휠 토크 센서, 엔진 토크 센서, 조향각 센서 등과 같은 플랫폼 센서들을 포함한다.
이제 도 3을 참조하면, 디바이스(300)의 개략 다이어그램이 예시되어 있다. 예시된 바와 같이, 디바이스(300)는 프로세서(304), 메모리(306), 저장 컴포넌트(308), 입력 인터페이스(310), 출력 인터페이스(312), 통신 인터페이스(314), 및 버스(302)를 포함한다. 일부 실시예들에서, 디바이스(300)는 차량들(102)의 적어도 하나의 디바이스(예를 들면, 차량들(102)의 시스템의 적어도 하나의 디바이스), 및/또는 네트워크(112)의 하나 이상의 디바이스(예를 들면, 네트워크(112)의 시스템의 하나 이상의 디바이스)에 대응한다. 일부 실시예들에서, 차량들(102)의 하나 이상의 디바이스(예를 들면, 차량들(102) 시스템의 하나 이상의 디바이스), 및/또는 네트워크(112)의 하나 이상의 디바이스(예를 들면, 네트워크(112)의 시스템의 하나 이상의 디바이스)는 적어도 하나의 디바이스(300) 및/또는 디바이스(300)의 적어도 하나의 컴포넌트를 포함한다. 도 3에 도시된 바와 같이, 디바이스(300)는 버스(302), 프로세서(304), 메모리(306), 저장 컴포넌트(308), 입력 인터페이스(310), 출력 인터페이스(312), 및 통신 인터페이스(314)를 포함한다.
버스(302)는 디바이스(300)의 컴포넌트들 간의 통신을 가능하게 하는 컴포넌트를 포함한다. 일부 경우에, 프로세서(304)는 적어도 하나의 기능을 수행하도록 프로그래밍될 수 있는, 프로세서(예를 들면, 중앙 프로세싱 유닛(CPU), 그래픽 프로세싱 유닛(GPU), 가속 프로세싱 유닛(APU) 등), 마이크로폰, 디지털 신호 프로세서(DSP), 및/또는 임의의 프로세싱 컴포넌트(예를 들면, FPGA(field-programmable gate array), ASIC(application specific integrated circuit) 등)를 포함한다. 메모리(306)는 프로세서(304)가 사용할 데이터 및/또는 명령어들을 저장하는, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 및/또는 다른 유형의 동적 및/또는 정적 저장 디바이스(예를 들면, 플래시 메모리, 자기 메모리, 광학 메모리 등)를 포함한다.
저장 컴포넌트(308)는 디바이스(300)의 작동 및 사용에 관련된 데이터 및/또는 소프트웨어를 저장한다. 일부 예들에서, 저장 컴포넌트(308)는 하드 디스크(예를 들면, 자기 디스크, 광학 디스크, 광자기 디스크, 솔리드 스테이트 디스크 등), CD(compact disc), DVD(digital versatile disc), 플로피 디스크, 카트리지, 자기 테이프, CD-ROM, RAM, PROM, EPROM, FLASH-EPROM, NV-RAM 및/또는 다른 유형의 컴퓨터 판독 가능 매체를, 대응하는 드라이브와 함께, 포함한다.
입력 인터페이스(310)는 디바이스(300)가, 예컨대, 사용자 입력(예를 들면, 터치스크린 디스플레이, 키보드, 키패드, 마우스, 버튼, 스위치, 마이크로폰, 카메라 등)을 통해, 정보를 수신할 수 있게 하는 컴포넌트를 포함한다. 추가적으로 또는 대안적으로, 일부 실시예들에서, 입력 인터페이스(310)는 정보를 감지하는 센서(예를 들면, GPS(global positioning system) 수신기, 가속도계, 자이로스코프, 액추에이터 등)를 포함한다. 출력 인터페이스(312)는 디바이스(300)로부터의 출력 정보를 제공하는 컴포넌트(예를 들면, 디스플레이, 스피커, 하나 이상의 발광 다이오드(LED) 등)를 포함한다.
일부 실시예들에서, 통신 인터페이스(314)는 디바이스(300)가 유선 연결, 무선 연결, 또는 유선 연결과 무선 연결의 조합을 통해 다른 디바이스들과 통신할 수 있게 하는 트랜시버 유사 컴포넌트(예를 들면, 트랜시버, 개별 수신기 및 송신기 등)를 포함한다. 일부 예들에서, 통신 인터페이스(314)는 디바이스(300)가 다른 디바이스로부터 정보를 수신하고/하거나 다른 디바이스에 정보를 제공할 수 있게 한다. 일부 예들에서, 통신 인터페이스(314)는 이더넷 인터페이스, 광학 인터페이스, 동축 인터페이스, 적외선 인터페이스, RF(radio frequency) 인터페이스, USB(universal serial bus) 인터페이스, Wi-Fi® 인터페이스, 셀룰러 네트워크 인터페이스 등을 포함한다.
일부 실시예들에서, 디바이스(300)는 본원에 기술된 하나 이상의 프로세스를 수행한다. 디바이스(300)는 프로세서(304)가, 메모리(305) 및/또는 저장 컴포넌트(308)와 같은, 컴퓨터 판독 가능 매체에 의해 저장된 소프트웨어 명령어들을 실행하는 것에 기초하여 이러한 프로세스들을 수행한다. 컴퓨터 판독 가능 매체(예를 들면, 비일시적 컴퓨터 판독 가능 매체)는 본원에서 비일시적 메모리 디바이스로서 정의된다. 비일시적 메모리 디바이스는 단일의 물리 저장 디바이스 내부에 위치한 메모리 공간 또는 다수의 물리 저장 디바이스들에 걸쳐 분산된 메모리 공간을 포함한다.
일부 실시예들에서, 소프트웨어 명령어들은 통신 인터페이스(314)를 통해 다른 컴퓨터 판독 가능 매체로부터 또는 다른 디바이스로부터 메모리(306) 및/또는 저장 컴포넌트(308)로 판독된다. 실행될 때, 메모리(306) 및/또는 저장 컴포넌트(308)에 저장된 소프트웨어 명령어들은 프로세서(304)로 하여금 본원에 기술된 하나 이상의 프로세스를 수행하게 한다. 추가적으로 또는 대안적으로, 고정 배선(hardwired) 회로는 본원에 기술된 하나 이상의 프로세스를 수행하기 위해 소프트웨어 명령어들 대신에 또는 소프트웨어 명령어들과 결합하여 사용된다. 따라서, 본원에 기술된 실시예들은, 달리 명시적으로 언급되지 않는 한, 하드웨어 회로와 소프트웨어의 임의의 특정 조합으로 제한되지 않는다.
메모리(306) 및/또는 저장 컴포넌트(308)는 데이터 스토리지 또는 적어도 하나의 데이터 구조(예를 들면, 데이터베이스 등)를 포함한다. 디바이스(300)는 데이터 스토리지 또는 메모리(306) 또는 저장 컴포넌트(308) 내의 적어도 하나의 데이터 구조로부터 정보를 수신하는 것, 그에 정보를 저장하는 것, 그에게로 정보를 통신하는 것, 또는 그에 저장된 정보를 검색하는 것을 할 수 있다. 일부 예들에서, 정보는 네트워크 데이터, 입력 데이터, 출력 데이터, 또는 이들의 임의의 조합을 포함한다.
일부 실시예들에서, 디바이스(300)는 메모리(306)에 그리고/또는 다른 디바이스(예를 들면, 디바이스(300)와 동일하거나 유사한 다른 디바이스)의 메모리에 저장된 소프트웨어 명령어들을 실행하도록 구성된다. 본원에서 사용되는 바와 같이, "모듈"이라는 용어는, 프로세서(304)에 의해 그리고/또는 다른 디바이스(예를 들면, 디바이스(300)와 동일하거나 유사한 다른 디바이스)의 프로세서에 의해 실행될 때, 디바이스(300)(예를 들면, 디바이스(300)의 적어도 하나의 컴포넌트)로 하여금 본원에 기술된 하나 이상의 프로세스를 수행하게 하는 메모리(306)에 그리고/또는 다른 디바이스의 메모리에 저장된 적어도 하나의 명령어를 지칭한다. 일부 실시예들에서, 모듈은 소프트웨어, 펌웨어, 하드웨어 등으로 구현된다.
도 3에 예시된 컴포넌트들의 수 및 배열은 예로서 제공된다. 일부 실시예들에서, 디바이스(300)는 도 3에 예시된 것보다, 추가적인 컴포넌트들, 더 적은 컴포넌트들, 상이한 컴포넌트들, 또는 상이하게 배열된 컴포넌트들을 포함할 수 있다. 추가적으로 또는 대안적으로, 디바이스(300)의 컴포넌트 세트(예를 들면, 하나 이상의 컴포넌트)는 디바이스(300)의 다른 컴포넌트 또는 다른 컴포넌트 세트에 의해 수행되는 것으로 기술된 하나 이상의 기능을 수행할 수 있다.
이제 도 4를 참조하면, 자율 주행 차량 컴퓨터(400)(때때로 "AV 스택"이라고 지칭됨)의 예시적인 블록 다이어그램이 예시되어 있다. 예시된 바와 같이, 자율 주행 차량 컴퓨터(400)는 인지 시스템(402)(때때로 인지 모듈이라고 지칭됨), 계획 시스템(404)(때때로 계획 모듈이라고 지칭됨), 로컬화 시스템(406)(때때로 로컬화 모듈이라고 지칭됨), 제어 시스템(408)(때때로 제어 모듈이라고 지칭됨) 및 데이터베이스(410)를 포함한다. 일부 실시예들에서, 인지 시스템(402), 계획 시스템(404), 로컬화 시스템(406), 제어 시스템(408) 및 데이터베이스(410)는 차량의 자율 주행 내비게이션 시스템(예를 들면, 차량(200)의 자율 주행 차량 컴퓨터(202f))에 포함되고/되거나 구현된다. 추가적으로 또는 대안적으로, 일부 실시예들에서, 인지 시스템(402), 계획 시스템(404), 로컬화 시스템(406), 제어 시스템(408), 및 데이터베이스(410)는 하나 이상의 독립형 시스템(예를 들면, 자율 주행 차량 컴퓨터(400) 등과 동일하거나 유사한 하나 이상의 시스템)에 포함된다. 일부 예들에서, 인지 시스템(402), 계획 시스템(404), 로컬화 시스템(406), 제어 시스템(408), 및 데이터베이스(410)는 본원에 기술된 바와 같이 차량 및/또는 적어도 하나의 원격 시스템에 위치하는 하나 이상의 독립형 시스템에 포함된다. 일부 실시예들에서, 자율 주행 차량 컴퓨터(400)에 포함된 시스템들 중 일부 및/또는 전부는 소프트웨어(예를 들면, 메모리에 저장된 소프트웨어 명령어들), 컴퓨터 하드웨어(예를 들면, 마이크로프로세서, 마이크로컨트롤러, ASIC(application-specific integrated circuit), FPGA(Field Programmable Gate Array) 등), 또는 컴퓨터 소프트웨어와 컴퓨터 하드웨어의 조합으로 구현된다. 일부 실시예들에서, 자율 주행 차량 컴퓨터(400)가 원격 시스템(예를 들면, 원격 AV 시스템(114)과 동일하거나 유사한 자율 주행 차량 시스템, 플릿 관리 시스템(116)과 동일하거나 유사한 플릿 관리 시스템, V2I 시스템(118)과 동일하거나 유사한 V2I 시스템 등)과 통신하도록 구성된다는 것이 또한 이해될 것이다.
일부 실시예들에서, 인지 시스템(402)은 환경에서의 적어도 하나의 물리적 대상체와 연관된 데이터(예를 들면, 적어도 하나의 물리적 대상체를 검출하기 위해 인지 시스템(402)에 의해 사용되는 데이터)를 수신하고 적어도 하나의 물리적 대상체를 분류한다. 일부 예들에서, 인지 시스템(402)은 적어도 하나의 카메라(예를 들면, 카메라들(202a))에 의해 캡처되는 이미지 데이터를 수신하고, 이미지는 적어도 하나의 카메라의 시야 내의 하나 이상의 물리적 대상체와 연관되어 있다(예를 들면, 이를 표현한다). 그러한 예에서, 인지 시스템(402)은 물리적 대상체들(예를 들면, 자전거들, 차량들, 교통 표지판들, 보행자들 등)의 하나 이상의 그룹화에 기초하여 적어도 하나의 물리적 대상체를 분류한다. 일부 실시예들에서, 인지 시스템(402)이 물리적 대상체들을 분류하는 것에 기초하여 인지 시스템(402)은 물리적 대상체들의 분류와 연관된 데이터를 계획 시스템(404)으로 송신한다.
일부 실시예들에서, 계획 시스템(404)은 목적지와 연관된 데이터를 수신하고 차량(예를 들면, 차량들(102))이 목적지를 향해 주행할 수 있는 적어도 하나의 루트(예를 들면, 루트들(106))와 연관된 데이터를 생성한다. 일부 실시예들에서, 계획 시스템(404)은 인지 시스템(402)으로부터의 데이터(예를 들면, 위에서 기술된, 물리적 대상체들의 분류와 연관된 데이터)를 주기적으로 또는 연속적으로 수신하고, 계획 시스템(404)은 인지 시스템(402)에 의해 생성되는 데이터에 기초하여 적어도 하나의 궤적을 업데이트하거나 적어도 하나의 상이한 궤적을 생성한다. 일부 실시예들에서, 계획 시스템(404)은 로컬화 시스템(406)으로부터 차량(예를 들면, 차량들(102))의 업데이트된 위치와 연관된 데이터를 수신하고, 계획 시스템(404)은 로컬화 시스템(406)에 의해 생성되는 데이터에 기초하여 적어도 하나의 궤적을 업데이트하거나 적어도 하나의 상이한 궤적을 생성한다.
일부 실시예들에서, 로컬화 시스템(406)은 한 영역에서의 차량(예를 들면, 차량들(102))의 한 위치와 연관된(예를 들면, 이를 나타내는) 데이터를 수신한다. 일부 예들에서, 로컬화 시스템(406)은 적어도 하나의 LiDAR 센서(예를 들면, LiDAR 센서들(202b))에 의해 생성되는 적어도 하나의 포인트 클라우드와 연관된 LiDAR 데이터를 수신한다. 특정 예들에서, 로컬화 시스템(406)은 다수의 LiDAR 센서들로부터의 적어도 하나의 포인트 클라우드와 연관된 데이터를 수신하고 로컬화 시스템(406)은 포인트 클라우드들 각각에 기초하여 결합된 포인트 클라우드를 생성한다. 이러한 예들에서, 로컬화 시스템(406)은 적어도 하나의 포인트 클라우드 또는 결합된 포인트 클라우드를 데이터베이스(410)에 저장되어 있는 해당 영역의 2차원(2D) 및/또는 3차원(3D) 맵과 비교한다. 로컬화 시스템(406)이 적어도 하나의 포인트 클라우드 또는 결합된 포인트 클라우드를 맵과 비교하는 것에 기초하여 로컬화 시스템(406)은 이어서 해당 영역에서의 차량의 위치를 결정한다. 일부 실시예들에서, 맵은 차량의 운행 이전에 생성되는 해당 영역의 결합된 포인트 클라우드를 포함한다. 일부 실시예들에서, 맵은, 제한 없이, 도로 기하학적 특성들의 고정밀 맵, 도로 네트워크 연결 특성들을 기술하는 맵, 도로 물리적 특성들(예컨대, 교통 속력, 교통량, 차량 교통 차선과 자전거 타는 사람 교통 차선의 수, 차선 폭, 차선 교통 방향, 또는 차선 마커 유형 및 위치, 또는 이들의 조합)을 기술하는 맵, 및 도로 특징부, 예컨대, 횡단보도, 교통 표지판 또는 다양한 유형의 다른 주행 신호들의 공간적 위치들을 기술하는 맵을 포함한다. 일부 실시예들에서, 맵은 인지 시스템에 의해 수신되는 데이터에 기초하여 실시간으로 생성된다.
다른 예에서, 로컬화 시스템(406)은 GPS(global positioning system) 수신기에 의해 생성되는 GNSS(Global Navigation Satellite System) 데이터를 수신한다. 일부 예들에서, 로컬화 시스템(406)은 해당 영역 내에서의 차량의 위치와 연관된 GNSS 데이터를 수신하고 로컬화 시스템(406)은 해당 영역 내에서의 차량의 위도 및 경도를 결정한다. 그러한 예에서, 로컬화 시스템(406)은 차량의 위도 및 경도에 기초하여 해당 영역에서의 차량의 위치를 결정한다. 일부 실시예들에서, 로컬화 시스템(406)은 차량의 위치와 연관된 데이터를 생성한다. 일부 예들에서, 로컬화 시스템(406)이 차량의 위치를 결정하는 것에 기초하여 로컬화 시스템(406)은 차량의 위치와 연관된 데이터를 생성한다. 그러한 예에서, 차량의 위치와 연관된 데이터는 차량의 위치에 대응하는 하나 이상의 시맨틱 특성과 연관된 데이터를 포함한다.
일부 실시예들에서, 제어 시스템(408)은 계획 시스템(404)으로부터 적어도 하나의 궤적과 연관된 데이터를 수신하고 제어 시스템(408)은 차량의 작동을 제어한다. 일부 예들에서, 제어 시스템(408)은 계획 시스템(404)으로부터 적어도 하나의 궤적과 연관된 데이터를 수신하고, 제어 시스템(408)은 파워트레인 제어 시스템(예를 들면, DBW 시스템(202h), 파워트레인 제어 시스템(204) 등), 조향 제어 시스템(예를 들면, 조향 제어 시스템(206)) 및/또는 브레이크 시스템(예를 들면, 브레이크 시스템(208))이 작동하게 하는 제어 신호들을 생성하여 송신하는 것에 의해 차량의 작동을 제어한다. 궤적이 좌회전을 포함하는 예에서, 제어 시스템(408)은 조향 제어 시스템(206)으로 하여금 차량(200)의 조향각을 조정하게 함으로써 차량(200)이 좌회전하게 하는 제어 신호를 송신한다. 추가적으로 또는 대안적으로, 제어 시스템(408)은 차량(200)의 다른 디바이스들(예를 들면, 헤드라이트, 방향 지시등, 도어록, 윈도실드 와이퍼 등)로 하여금 상태들을 변경하게 하는 제어 신호들을 생성하여 송신한다.
일부 실시예들에서, 인지 시스템(402), 계획 시스템(404), 로컬화 시스템(406), 및/또는 제어 시스템(408)은 적어도 하나의 머신 러닝 모델(예를 들면, 적어도 하나의 다층 퍼셉트론(MLP), 적어도 하나의 콘볼루션 신경 네트워크(CNN), 적어도 하나의 순환 신경 네트워크(RNN), 적어도 하나의 오토인코더, 적어도 하나의 트랜스포머(transformer) 등)을 구현한다. 일부 예들에서, 인지 시스템(402), 계획 시스템(404), 로컬화 시스템(406), 및/또는 제어 시스템(408)은 단독으로 또는 위에서 언급된 시스템들 중 하나 이상과 조합하여 적어도 하나의 머신 러닝 모델을 구현한다. 일부 예에서, 인지 시스템(402), 계획 시스템(404), 로컬화 시스템(406), 및/또는 제어 시스템(408)은 파이프라인(예를 들면, 환경에 위치한 하나 이상의 대상체를 식별하기 위한 파이프라인 등)의 일부로서 적어도 하나의 머신 러닝 모델을 구현한다. 머신 러닝 모델의 구현의 예는 도 4b 내지 도 4d와 관련하여 아래에 포함된다.
데이터베이스(410)는 인지 시스템(402), 계획 시스템(404), 로컬화 시스템(406) 및/또는 제어 시스템(408)으로 송신되며, 이들로부터 수신되고/되거나 이들에 의해 업데이트되는 데이터를 저장한다. 일부 예들에서, 데이터베이스(410)는 작동에 관련된 데이터 및/또는 소프트웨어를 저장하고 자율 주행 차량 컴퓨터(400)의 적어도 하나의 시스템을 사용하는 저장 컴포넌트(예를 들면, 도 3의 저장 컴포넌트(308)와 동일하거나 유사한 저장 컴포넌트)를 포함한다. 일부 실시예들에서, 데이터베이스(410)는 적어도 하나의 영역의 2D 및/또는 3D 맵과 연관된 데이터를 저장한다. 일부 예들에서, 데이터베이스(410)는 도시의 일 부분, 다수의 도시들의 다수의 부분들, 다수의 도시들, 카운티, 주, 국가(State)(예를 들면, 나라(country)) 등의 2D 및/또는 3D 맵과 연관된 데이터를 저장한다. 그러한 예에서, 차량(예를 들면, 차량들(102) 및/또는 차량(200)과 동일하거나 유사한 차량)은 하나 이상의 운전 가능한 영역(예를 들면, 단일 차선 도로, 다중 차선 도로, 간선도로, 시골 길(back road), 오프로드 트레일 등)을 따라 운전할 수 있고, 적어도 하나의 LiDAR 센서(예를 들면, LiDAR 센서들(202b)과 동일하거나 유사한 LiDAR 센서)로 하여금 적어도 하나의 LiDAR 센서의 시야에 포함된 대상체들을 나타내는 이미지와 연관된 데이터를 생성하게 할 수 있다.
일부 실시예들에서, 데이터베이스(410)는 복수의 디바이스들에 걸쳐 구현된다. 일부 예들에서, 데이터베이스(410)는 차량(예를 들면, 차량들(102) 및/또는 차량(200)과 동일하거나 유사한 차량), 자율 주행 차량 시스템(예를 들면, 원격 AV 시스템(114)과 동일하거나 유사한 자율 주행 차량 시스템), 플릿 관리 시스템(예를 들면, 도 1의 플릿 관리 시스템(116)과 동일하거나 유사한 플릿 관리 시스템), V2I 시스템(예를 들면, 도 1의 V2I 시스템(118)과 동일하거나 유사한 V2I 시스템) 등에 포함될 수 있다.
이제 도 4b를 참조하면, 머신 러닝 모델의 구현의 다이어그램이 예시되어 있다. 보다 구체적으로, 콘볼루션 신경 네트워크(convolutional neural network, CNN)(420)의 구현의 다이어그램이 예시되어 있다. 예시를 위해, CNN(420)에 대한 이하의 설명은 인지 시스템(402)에 의한 CNN(420)의 구현과 관련하여 이루어질 것이다. 그렇지만, 일부 예들에서 CNN(420)(예를 들면, CNN(420)의 하나 이상의 컴포넌트)이, 계획 시스템(404), 로컬화 시스템(406), 및/또는 제어 시스템(408)과 같은, 인지 시스템(402)과 상이하거나 이 이외의 다른 시스템들에 의해 구현된다는 것이 이해될 것이다. CNN(420)이 본원에 기술된 바와 같은 특정 특징들을 포함하지만, 이러한 특징들은 예시 목적으로 제공되며 본 개시를 제한하는 것으로 의도되지 않는다.
CNN(420)은 제1 콘볼루션 계층(422), 제2 콘볼루션 계층(424), 및 콘볼루션 계층(426)를 포함하는 복수의 콘볼루션 계층들을 포함한다. 일부 실시예들에서, CNN(420)은 서브샘플링 계층(428)(때때로 풀링 계층(pooling layer)이라고 지칭됨)을 포함한다. 일부 실시예들에서, 서브샘플링 계층(428) 및/또는 다른 서브샘플링 계층들은 업스트림 시스템의 차원보다 작은 차원(즉, 노드들의 양)을 갖는다. 서브샘플링 계층(428)이 업스트림 계층의 차원보다 작은 차원을 갖는 것에 의해, CNN(420)은 초기 입력 및/또는 업스트림 계층의 출력과 연관된 데이터의 양을 통합하여 이에 의해 CNN(420)이 다운스트림 콘볼루션 연산들을 수행하는 데 필요한 계산들의 양을 감소시킨다. 추가적으로 또는 대안적으로, (도 4c 및 도 4d와 관련하여 아래에서 기술되는 바와 같이) 서브샘플링 계층(428)이 적어도 하나의 서브샘플링 함수와 연관되는(예를 들면, 이를 수행하도록 구성되는) 것에 의해, CNN(420)은 초기 입력과 연관된 데이터의 양을 통합(consolidate)한다.
인지 시스템(402)이 제1 콘볼루션 계층(422), 제2 콘볼루션 계층(424), 및 콘볼루션 계층(426) 각각과 연관된 각자의 입력들 및/또는 출력들을 제공하여 각자의 출력들을 생성하는 것에 기초하여 인지 시스템(402)은 콘볼루션 연산들을 수행한다. 일부 예들에서, 인지 시스템(402)이 제1 콘볼루션 계층(422), 제2 콘볼루션 계층(424), 및 콘볼루션 계층(426)에 대한 입력으로서 데이터를 제공하는 것에 기초하여 인지 시스템(402)은 CNN(420)을 구현한다. 그러한 예에서, 인지 시스템(402)이 하나 이상의 상이한 시스템(예를 들면, 차량(102)과 동일하거나 유사한 차량의 하나 이상의 시스템), 원격 AV 시스템(114)과 동일하거나 유사한 원격 AV 시스템, 플릿 관리 시스템(116)과 동일하거나 유사한 플릿 관리 시스템, V2I 시스템(118)과 동일하거나 유사한 V2I 시스템 등으로부터 데이터를 수신하는 것에 기초하여, 인지 시스템(402)은 제1 콘볼루션 계층(422), 제2 콘볼루션 계층(424), 및 콘볼루션 계층(426)에 대한 입력으로서 데이터를 제공한다. 콘볼루션 연산들에 대한 상세한 설명은 도 4c와 관련하여 아래에 포함된다.
일부 실시예들에서, 인지 시스템(402)은 입력(초기 입력이라고 지칭됨)과 연관된 데이터를 제1 콘볼루션 계층(422)에 제공하고, 인지 시스템(402)은 제1 콘볼루션 계층(422)을 사용하여 출력과 연관된 데이터를 생성한다. 일부 실시예들에서, 인지 시스템(402)은 상이한 콘볼루션 계층에 대한 입력으로서 콘볼루션 계층에 의해 생성되는 출력을 제공한다. 예를 들어, 인지 시스템(402)은 서브샘플링 계층(428), 제2 콘볼루션 계층(424), 및/또는 콘볼루션 계층(426)에 대한 입력으로서 제1 콘볼루션 계층(422)의 출력을 제공한다. 그러한 예에서, 제1 콘볼루션 계층(422)은 업스트림 계층이라고 지칭되고, 서브샘플링 계층(428), 제2 콘볼루션 계층(424) 및/또는 콘볼루션 계층(426)은 다운스트림 계층들이라고 지칭된다. 유사하게, 일부 실시예들에서, 인지 시스템(402)은 서브샘플링 계층(428)의 출력을 제2 콘볼루션 계층(424) 및/또는 콘볼루션 계층(426)에 제공하고, 이 예에서, 서브샘플링 계층(428)은 업스트림 계층이라고 지칭될 것이며, 제2 콘볼루션 계층(424) 및/또는 콘볼루션 계층(426)은 다운스트림 계층들이라고 지칭될 것이다.
일부 실시예들에서, 인지 시스템(402)이 CNN(420)에 입력을 제공하기 전에 인지 시스템(402)은 CNN(420)에 제공되는 입력과 연관된 데이터를 프로세싱한다. 예를 들어, 인지 시스템(402)이 센서 데이터(예를 들면, 이미지 데이터, LiDAR 데이터, 레이더 데이터 등)를 정규화하는 것에 기초하여, 인지 시스템(402)은 CNN(420)에 제공되는 입력과 연관된 데이터를 프로세싱한다.
일부 실시예들에서, 인지 시스템(402)이 각각의 콘볼루션 계층과 연관된 콘볼루션 연산들을 수행하는 것에 기초하여, CNN(420)은 출력을 생성한다. 일부 예들에서, 인지 시스템(402)이 각각의 콘볼루션 계층과 연관된 콘볼루션 연산들을 수행하는 것 및 초기 데이터에 기초하여, CNN(420)은 출력을 생성한다. 일부 실시예들에서, 인지 시스템(402)은 출력을 생성하고 출력을 완전 연결 계층(430)으로서 제공한다. 일부 예들에서, 인지 시스템(402)은 콘볼루션 계층(426)의 출력을 완전 연결 계층(430)으로서 제공하고, 여기서 완전 연결 계층(430)은 F1, F2, ... FN이라고 지칭되는 복수의 특징 값들과 연관된 데이터를 포함한다. 이 예에서, 콘볼루션 계층(426)의 출력은 예측을 나타내는 복수의 출력 특징 값들과 연관된 데이터를 포함한다.
일부 실시예들에서, 인지 시스템(402)이 복수의 예측들 중에서 정확한 예측일 가능성이 가장 높은 것과 연관된 특징 값을 식별하는 것에 기초하여, 인지 시스템(402)은 복수의 예측들 중에서 예측을 식별한다. 예를 들어, 완전 연결 계층(430)이 특징 값들 F1, F2, ... FN을 포함하고, F1이 가장 큰 특징 값인 경우에, 인지 시스템(402)은 F1과 연관된 예측을 복수의 예측들 중에서 정확한 예측인 것으로 식별한다. 일부 실시예들에서, 인지 시스템(402)은 예측을 생성하도록 CNN(420)을 트레이닝시킨다. 일부 예들에서, 인지 시스템(402)이 예측과 연관된 트레이닝 데이터를 CNN(420)에 제공하는 것에 기초하여, 인지 시스템(402)은 예측을 생성하도록 CNN(420)을 트레이닝시킨다.
이제 도 4c 및 도 4d를 참조하면, 인지 시스템(402)에 의한 CNN(440)의 예시적인 작동의 다이어그램이 예시되어 있다. 일부 실시예들에서, CNN(440)(예를 들면, CNN(440)의 하나 이상의 컴포넌트)은 CNN(420)(예를 들면, CNN(420)의 하나 이상의 컴포넌트)(도 4b 참조)과 동일하거나 유사하다.
단계(450)에서, 인지 시스템(402)은 CNN(440)에 대한 입력으로서 이미지와 연관된 데이터를 제공한다(단계(450)). 예를 들어, 예시된 바와 같이, 인지 시스템(402)은 이미지와 연관된 데이터를 CNN(440)에 제공하고, 여기서 이미지는 2차원(2D) 어레이에 저장되는 값들로서 표현되는 그레이스케일 이미지이다. 일부 실시예들에서, 이미지와 연관된 데이터는 컬러 이미지와 연관된 데이터를 포함할 수 있고, 컬러 이미지는 3차원(3D) 어레이에 저장되는 값들로서 표현된다. 추가적으로 또는 대안적으로, 이미지와 연관된 데이터는 적외선 이미지, 레이더 이미지 등과 연관된 데이터를 포함할 수 있다.
단계(455)에서, CNN(440)은 제1 콘볼루션 함수를 수행한다. 예를 들어, CNN(440)이 이미지를 나타내는 값들을 제1 콘볼루션 계층(442)에 포함된 하나 이상의 뉴런(명시적으로 예시되지 않음)에 대한 입력으로서 제공하는 것에 기초하여, CNN(440)은 제1 콘볼루션 함수를 수행한다. 이 예에서, 이미지를 나타내는 값들은 이미지의 한 영역(때때로 수용 영역(receptive field)이라고 지칭됨)을 나타내는 값들에 대응할 수 있다. 일부 실시예들에서, 각각의 뉴런은 필터(명시적으로 예시되지 않음)와 연관된다. 필터(때때로 커널이라고 지칭됨)는 크기가 뉴런에 대한 입력으로서 제공되는 값들에 대응하는 값들의 어레이로서 표현될 수 있다. 일 예에서, 필터는 에지들(예를 들면, 수평 라인들, 수직 라인들, 직선 라인들 등)을 식별하도록 구성될 수 있다. 연속적인 콘볼루션 계층들에서, 뉴런들과 연관된 필터들은 연속적으로 보다 복잡한 패턴들(예를 들면, 호, 대상체 등)을 식별하도록 구성될 수 있다.
일부 실시예들에서, CNN(440)이 제1 콘볼루션 계층(442)에 포함된 하나 이상의 뉴런 각각에 대한 입력으로서 제공되는 값들을 하나 이상의 뉴런 각각에 대응하는 필터의 값들과 곱하는 것에 기초하여, CNN(440)은 제1 콘볼루션 함수를 수행한다. 예를 들어, CNN(440)은 제1 콘볼루션 계층(442)에 포함된 하나 이상의 뉴런 각각에 대한 입력으로서 제공되는 값들을 하나 이상의 뉴런 각각에 대응하는 필터의 값들과 곱하여 단일 값 또는 값들의 어레이를 출력으로서 생성할 수 있다. 일부 실시예들에서, 제1 콘볼루션 계층(442)의 뉴런들의 집합적 출력은 콘볼루션된 출력(convolved output)이라고 지칭된다. 일부 실시예들에서, 각각의 뉴런이 동일한 필터를 갖는 경우에, 콘볼루션된 출력은 특징 맵(feature map)이라고 지칭된다.
일부 실시예들에서, CNN(440)은 제1 콘볼루션 계층(442)의 각각의 뉴런의 출력들을 다운스트림 계층의 뉴런들에 제공한다. 명료함을 위해, 업스트림 계층은 데이터를 상이한 계층(다운스트림 계층이라고 지칭됨)으로 송신하는 계층일 수 있다. 예를 들어, CNN(440)은 제1 콘볼루션 계층(442)의 각각의 뉴런의 출력들을 서브샘플링 계층의 대응하는 뉴런들에 제공할 수 있다. 일 예에서, CNN(440)은 제1 콘볼루션 계층(442)의 각각의 뉴런의 출력들을 제1 서브샘플링 계층(444)의 대응하는 뉴런들에 제공한다. 일부 실시예들에서, CNN(440)은 다운스트림 계층의 각각의 뉴런에 제공되는 모든 값들의 집계들에 바이어스 값을 가산한다. 예를 들어, CNN(440)은 제1 서브샘플링 계층(444)의 각각의 뉴런에 제공되는 모든 값들의 집계들에 바이어스 값을 가산한다. 그러한 예에서, 각각의 뉴런에 제공되는 모든 값들의 집계들 및 제1 서브샘플링 계층(444)의 각각의 뉴런과 연관된 활성화 함수에 기초하여, CNN(440)은 제1 서브샘플링 계층(444)의 각각의 뉴런에 제공할 최종 값을 결정한다.
단계(460)에서, CNN(440)은 제1 서브샘플링 함수를 수행한다. 예를 들어, CNN(440)이 제1 콘볼루션 계층(442)에 의해 출력되는 값들을 제1 서브샘플링 계층(444)의 대응하는 뉴런들에 제공하는 것에 기초하여, CNN(440)은 제1 서브샘플링 함수를 수행할 수 있다. 일부 실시예들에서, CNN(440)은 집계 함수에 기초하여 제1 서브샘플링 함수를 수행한다. 일 예에서, CNN(440)이 주어진 뉴런에 제공되는 값들 중 최대 입력을 결정하는 것(맥스 풀링 함수(max pooling function)라고 지칭됨)에 기초하여, CNN(440)은 제1 서브샘플링 함수를 수행한다. 다른 예에서, CNN(440)이 주어진 뉴런에 제공되는 값들 중 평균 입력을 결정하는 것(평균 풀링 함수(average pooling function)라고 지칭됨)에 기초하여, CNN(440)은 제1 서브샘플링 함수를 수행한다. 일부 실시예들에서, CNN(440)이 제1 서브샘플링 계층(444)의 각각의 뉴런에 값들을 제공하는 것에 기초하여, CNN(440)은 출력을 생성하며, 이 출력은 때때로 서브샘플링된 콘볼루션된 출력(subsampled convolved output)이라고 지칭된다.
단계(465)에서, CNN(440)은 제2 콘볼루션 함수를 수행한다. 일부 실시예들에서, CNN(440)은 위에서 기술된, CNN(440)이 제1 콘볼루션 함수를 수행한 방식과 유사한 방식으로 제2 콘볼루션 함수를 수행한다. 일부 실시예들에서, CNN(440)이 제1 서브샘플링 계층(444)에 의해 출력되는 값들을 제2 콘볼루션 계층(446)에 포함된 하나 이상의 뉴런(명시적으로 예시되지 않음)에 대한 입력으로서 제공하는 것에 기초하여, CNN(440)은 제2 콘볼루션 함수를 수행한다. 일부 실시예들에서, 위에서 기술된 바와 같이, 제2 콘볼루션 계층(446)의 각각의 뉴런은 필터와 연관된다. 위에서 기술된 바와 같이, 제2 콘볼루션 계층(446)과 연관된 필터(들)는 제1 콘볼루션 계층(442)과 연관된 필터보다 복잡한 패턴들을 식별하도록 구성될 수 있다.
일부 실시예들에서, CNN(440)이 제2 콘볼루션 계층(446)에 포함된 하나 이상의 뉴런 각각에 대한 입력으로서 제공되는 값들을 하나 이상의 뉴런 각각에 대응하는 필터의 값들과 곱하는 것에 기초하여, CNN(440)은 제2 콘볼루션 함수를 수행한다. 예를 들어, CNN(440)은 제2 콘볼루션 계층(446)에 포함된 하나 이상의 뉴런 각각에 대한 입력으로서 제공되는 값들을 하나 이상의 뉴런 각각에 대응하는 필터의 값들과 곱하여 단일 값 또는 값들의 어레이를 출력으로서 생성할 수 있다.
일부 실시예들에서, CNN(440)은 제2 콘볼루션 계층(446)의 각각의 뉴런의 출력들을 다운스트림 계층의 뉴런들에 제공한다. 예를 들어, CNN(440)은 제1 콘볼루션 계층(442)의 각각의 뉴런의 출력들을 서브샘플링 계층의 대응하는 뉴런들에 제공할 수 있다. 일 예에서, CNN(440)은 제1 콘볼루션 계층(442)의 각각의 뉴런의 출력들을 제2 서브샘플링 계층(448)의 대응하는 뉴런들에 제공한다. 일부 실시예들에서, CNN(440)은 다운스트림 계층의 각각의 뉴런에 제공되는 모든 값들의 집계들에 바이어스 값을 가산한다. 예를 들어, CNN(440)은 제2 서브샘플링 계층(448)의 각각의 뉴런에 제공되는 모든 값들의 집계들에 바이어스 값을 가산한다. 그러한 예에서, 각각의 뉴런에 제공되는 모든 값들의 집계들 및 제2 서브샘플링 계층(448)의 각각의 뉴런과 연관된 활성화 함수에 기초하여, CNN(440)은 제2 서브샘플링 계층(448)의 각각의 뉴런에 제공할 최종 값을 결정한다.
단계(470)에서, CNN(440)은 제2 서브샘플링 함수를 수행한다. 예를 들어, CNN(440)이 제2 콘볼루션 계층(446)에 의해 출력되는 값들을 제2 서브샘플링 계층(448)의 대응하는 뉴런들에 제공하는 것에 기초하여, CNN(440)은 제2 서브샘플링 함수를 수행할 수 있다. 일부 실시예들에서, CNN(440)이 집계 함수를 사용하는 것에 기초하여, CNN(440)은 제2 서브샘플링 함수를 수행한다. 일 예에서, 위에서 기술된 바와 같이, CNN(440)이 주어진 뉴런에 제공되는 값들 중 최대 입력 또는 평균 입력을 결정하는 것에 기초하여, CNN(440)은 제1 서브샘플링 함수를 수행한다. 일부 실시예들에서, CNN(440)이 제2 서브샘플링 계층(448)의 각각의 뉴런에 값들을 제공하는 것에 기초하여, CNN(440)은 출력을 생성한다.
단계(475)에서, CNN(440)은 제2 서브샘플링 계층(448)의 각각의 뉴런의 출력을 완전 연결 계층들(449)에 제공한다. 예를 들어, CNN(440)은 제2 서브샘플링 계층(448)의 각각의 뉴런의 출력을 완전 연결 계층들(449)에 제공하여 완전 연결 계층들(449)이 출력을 생성하게 한다. 일부 실시예들에서, 완전 연결 계층들(449)은 예측(때때로 분류라고 지칭됨)과 연관된 출력을 생성하도록 구성된다. 예측은 CNN(440)에 대한 입력으로서 제공되는 이미지에 포함된 대상체가 대상체, 대상체 세트 등을 포함한다는 표시를 포함할 수 있다. 일부 실시예들에서, 인지 시스템(402)은, 본원에 기술된 바와 같이, 하나 이상의 동작들을 수행하고/하거나 예측과 연관된 데이터를 상이한 시스템에 제공한다.
분류기 시스템
도 5a는 적어도 2개의 포인트 클라우드를 정렬된 또는 오정렬된 것으로서 분류하기 위한 포인트 클라우드 정렬 분류기 시스템(500)(분류기 시스템(500)으로 지칭됨)의 예를 예시한 블록 다이어그램이다.
예를 들어, 도 7a 내지 도 7c로 가면, 도 7a 내지 도 7c는 정렬된 포인트 클라우드 쌍과 비교하여 오정렬된 포인트 클라우드 쌍에서의 아티팩트를 도시한다. 특히, 도 7a에서, 래스터 이미지(700A) 내의 아티팩트(702-708)는 특정 지역(locality)에 대한 오정렬된 포인트 클라우드를 나타낸다. 아티팩트(702-708)는 포인트 클라우드 등록 동안 최적이 아닌 솔루션(예컨대, 로컬 최소값)으로의 수렴으로 인해 생성될 수 있다. 포인트 클라우드 등록은 동일 지역을 부분적으로 관찰하고 있는 2개의(또는 그 이상의) 포인트 클라우드를 최대로 정렬하려고 시도할 수 있다. 일반적으로, 등록 알고리즘은 입력 포인트 클라우드를 최상으로 정렬하는 견고한 변환을 반환하는 것을 목표로 한다. 그러나, LiDAR 데이터에 영향을 미치는 노이즈 및 문제의 확률적 속성으로 인해, 어떠한 등록 접근법도 최적의 솔루션으로의 수렴이 보장되지 않는다. 도 7b에서, 래스터 이미지(700B) 내의 아티팩트(710 및 712)는 오정렬된 포인트 클라우드를 나타내는 반면에, 도 7c에서의 래스터 이미지(700C)는 동일 지역에 대한 정렬을 나타낼 수 있다. 분류기 시스템(500)은 루프 피드백에서 사람에 의존하는 일 없이 각각 정확하게 분류하는 것을 목표로 할 수 있다.
분류기 시스템(500)은 포인트 클라우드 등록 프로세스, 맵 보정 프로세스, 로컬라이제이션(localization) 프로세스 및/또는 캘리브레이션(calibration) 프로세스에서 사용될 수 있다. 분류기 시스템(500)은 컨텍스트에 따라, 인지 시스템(402), 로컬화 시스템(406), 원격 AV 시스템(114) 등 상에 그리고 일반적으로 포인트 클라우드 등록 프로세스, 맵 보정 프로세스, 로컬라이제이션 프로세스 및/또는 캘리브레이션 프로세스가 수행되는 곳에 호스팅될 수 있다. 분류기 시스템(500)은, 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B)(입력)를 프로세싱하여 포인트 클라우드 쌍(506)의 분류를 정렬된 또는 오정렬된 것(출력)으로서 출력하는 분류기 네트워크(504)를 포함할 수 있다.
일부 실시예에서, 분류기 시스템(500)은 머신 러닝 네트워크를 사용하여 포인트 클라우드를 오정렬된 또는 정렬된 것으로서 분류할 수 있다. 예를 들어, 분류기 시스템(500)은, 적어도 2개의 LiDAR 포인트 클라우드를 획득하고; 적어도 하나의 분류기 네트워크를 사용하여 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하고; 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득하고; 적어도 하나의 출력 데이터세트에 기초하여 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하고; 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것에 기초하여 제1 액션을 수행할 수 있다. 추가적으로 또는 대안으로서, 분류기 시스템(500)은, 제2의 적어도 2개의 LiDAR 포인트 클라우드를 획득하고; 적어도 하나의 분류기 네트워크를 사용하여 제2의 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하고; 적어도 하나의 분류기 네트워크로부터 제2의 적어도 하나의 출력 데이터세트를 획득하고; 제2의 적어도 하나의 출력 데이터세트에 기초하여 제2의 적어도 2개의 LiDAR 포인트 클라우드가 정렬됨을 결정하고; 제2의 적어도 2개의 LiDAR 포인트 클라우드가 정렬됨을 결정하는 것에 기초하여 제2 액션을 수행할 수 있다. 따라서, 일반적으로, 분류기 시스템(500)은 LiDAR 포인트 클라우드가 정렬되어 있는지 오정렬되어 있는지 결정하고 그 결정에 따라 액션을 수행할 수 있다.
입력
분류기 시스템(500)은 입력으로서 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B)를 획득할 수 있다. 일반적으로, 분류기 시스템(500)은 포인트 클라우드 등록 프로세스, 맵 보정 프로세스, 로컬라이제이션 프로세스 및/또는 캘리브레이션 프로세스의 일부로서 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B)를 획득할 수 있다. 예를 들어, 분류기 시스템(500)은, 맵의 지역을 매핑하기 위한 포인트 클라우드 등록 프로세스를 위해 제1의 복수의 LiDAR 포인트 클라우드로부터 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 것; 맵 보정 프로세스를 위해 차량(예컨대, 차량(200))에 탑재된 LiDAR 시스템(예컨대, LiDAR 센서(202b))으로부터 적어도 2개의 LiDAR 포인트 클라우드 중 제1 LiDAR 포인트 클라우드를 그리고 제2의 복수의 LiDAR 포인트 클라우드로부터 적어도 2개의 LiDAR 포인트 클라우드 중 제2 LiDAR 포인트 클라우드를 획득하는 것; 로컬라이제이션 프로세스를 위해 차량에 탑재된 LiDAR 시스템으로부터 제1 LiDAR 포인트 클라우드를 그리고 제3의 복수의 LiDAR 포인트 클라우드로부터 제2 LiDAR 포인트 클라우드를 획득하는 것; 또는 캘리브레이션 프로세스를 위해 차량에 탑재된 LiDAR 시스템으로부터 제1 LiDAR 포인트 클라우드를 그리고 제4의 복수의 LiDAR 포인트 클라우드로부터 제2 LiDAR 포인트 클라우드를 획득하는 것에 의해, 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B)(대안으로서 "적어도 2개의 LiDAR 포인트 클라우드"로 지칭됨)를 획득할 수 있다.
분류기 시스템(500)이 포인트 클라우드 등록 프로세스의 일부인 경우에, 분류기 시스템(500)은, 맵의 지역(예컨대, 매핑되지 않은 지역, 또는 리매핑을 필요로 하는 지역)을 선택하고; 제1의 복수의 LiDAR 포인트 클라우드로부터 그 지역 근처의(예컨대, 그 감지 범위 내의) 획득된 임의의 LiDAR 포인트 클라우드를 결정하고(예컨대, GPS 또는 기타 로컬화 결정에 기초하여); 임의의 LiDAR 포인트 클라우드의 세트로부터 적어도 2개의 LiDAR 포인트 클라우드를 선택할 수 있다(예컨대, 랜덤으로, 또는 중첩하는 포인트 클라우드 커버리지를 갖는 포인트 클라우드를 갖는 포인트 클라우드를 선택하기 위한 알고리즘에 의해). 제1의 복수의 LiDAR 포인트 클라우드는 포인트 클라우드 등록 프로세스 및/또는 매핑 프로세스에 사용되는 LiDAR 포인트 클라우드의 전부(또는 이의 서브세트, 예컨대 도시, 주, 국가 등 내에서)일 수 있다. 선택된 LiDAR 포인트 클라우드의 하나 또는 둘 다는 LiDAR 포인트 클라우드를 캡처한 LiDAR 센서의 상이한 위치 및/또는 배향을 설명하기 위해 각자의 LiDAR 포인트 클라우드를 정렬하도록 변환될 수 있다. 이 방식으로, LiDAR 포인트 클라우드 쌍은 지역의 매핑 프로세스를 돕기 위해 지역의 합성물을 생성하도록 선택될 수 있다. 그러나, 선택된 LiDAR 포인트 클라우드(변환될 수 있음)는 상기에 설명된 바와 같이 아티팩트를 포함할 수 있다. 따라서, 선택된 LiDAR 포인트 클라우드의 각각의 쌍(또는 이의 서브세트)은 선택된 LiDAR 포인트 클라우드가 정렬된 것인지 또는 오정렬된 것인지 결정하기 위해 분류기 시스템(500)을 통해 프로세싱될 수 있다. 이 방식으로, LiDAR 포인트 클라우드의 오정렬된 쌍은 등록 프로세스로부터 제거될 수 있으며, 그리하여 매핑 프로세스는 특정 시간에 지역의 현실과 관련하여 임계 레벨의 정확도 및 정밀도를 유지한다.
분류기 시스템(500)이 맵 보정 프로세스의 일부인 경우에, 분류기 시스템(500)은, 지역의 위치를 결정하고(예컨대, GPS 또는 기타 로컬화 결정); 제2의 복수의 LiDAR 포인트 클라우드로부터 그 지역 근처의(예컨대, 그 감지 범위 내의) 획득된 임의의 LiDAR 포인트 클라우드를 결정하고(예컨대, 제2의 복수의 LiDAR 포인트 클라우드의 GPS 또는 기타 로컬화 결정에 기초하여); 임의의 LiDAR 포인트 클라우드의 세트로부터 제2의 LiDAR 포인트 클라우드를 선택할 수 있다(예컨대, 랜덤으로, 또는 제1 LiDAR 포인트 클라우드와 중첩하는 포인트 클라우드 커버리지를 갖는 포인트 클라우드를 갖는 포인트 클라우드를 선택하기 위한 알고리즘에 의해). 제2의 복수의 LiDAR 포인트 클라우드는 로컬라이제이션 프로세스의 맵에 사용되는 LiDAR 포인트 클라우드의 전부(또는 이의 서브세트, 예컨대 도시, 주, 국가 등 내에서)일 수 있다. 제1 및 제2 LiDAR 포인트 클라우드의 하나 또는 둘 다는 LiDAR 포인트 클라우드를 캡처한 LiDAR 센서의 상이한 위치 및/또는 배향을 설명하기 위해 각자의 LiDAR 포인트 클라우드를 정렬하도록 변환될 수 있다. 이 방식으로, 현재 감지된 LiDAR 포인트 클라우드는 지역의 매핑 프로세스를 돕기 위해 기존의 LiDAR 포인트 클라우드를 확인하는 데 사용될 수 있다. 그러나, 제1 및 제2 LiDAR 포인트 클라우드(변환될 수 있음)는 상기에 설명된 바와 같이 아티팩트를 포함할 수 있다. 따라서, 제1 및 제2 LiDAR 포인트 클라우드의 각각의 쌍(또는 이의 서브세트)은 제1 및 제2 LiDAR 포인트 클라우드가 정렬된 것인지 또는 오정렬된 것인지 결정하기 위해 분류기 시스템(500)을 통해 프로세싱될 수 있다. 이 방식으로, LiDAR 포인트 클라우드의 정렬된 쌍은 범위 매핑된 지역을 확인하는 데 사용될 수 있고(예컨대, 환경은 동일하게 유지됨) 그리고/또는 LiDAR 포인트 클라우드의 오정렬된 쌍은 맵 보정 프로세스로부터 제거될 수 있으며, 그리하여 매핑 프로세스는 특정 시간에 지역의 현실과 관련하여 임계 레벨의 정확도 및 정밀도를 유지한다.
분류기 시스템(500)이 로컬라이제이션 프로세스의 일부인 경우에, 분류기 시스템(500)은, 지역의 위치를 결정하고(예컨대, GPS 또는 기타 로컬화 결정); 제3의 복수의 LiDAR 포인트 클라우드로부터 그 지역 근처의(예컨대, 그 감지 범위 내의) 획득된 임의의 LiDAR 포인트 클라우드를 결정하고(예컨대, 제3의 복수의 LiDAR 포인트 클라우드의 GPS 또는 기타 로컬화 결정에 기초하여); 임의의 LiDAR 포인트 클라우드의 세트로부터 제2 LiDAR 포인트 클라우드를 선택할 수 있다(예컨대, 랜덤으로, 또는 제1 LiDAR 포인트 클라우드와 중첩하는 포인트 클라우드 커버리지를 갖는 포인트 클라우드를 갖는 포인트 클라우드를 선택하기 위한 알고리즘에 의해). 제3의 복수의 LiDAR 포인트 클라우드는 로컬라이제이션 프로세스의 맵에 사용되는 LiDAR 포인트 클라우드의 전부(또는 이의 서브세트, 예컨대 도시, 주, 국가 등 내에서)일 수 있다. 제1 및 제2 LiDAR 포인트 클라우드의 하나 또는 둘 다는 LiDAR 포인트 클라우드를 캡처한 LiDAR 센서의 상이한 위치 및/또는 배향을 설명하기 위해 각자의 LiDAR 포인트 클라우드를 정렬하도록 변환될 수 있다. 이 방식으로, 현재 감지된 LiDAR 포인트 클라우드는 기존의 LiDAR 포인트 클라우드와 정렬하도록 사용될 수 있으며, 그에 의해 이전의 알려진 위치로부터 현재 위치로 변환(만약 있다면)을 역전함으로써 차량의 정확한 위치를 결정할 수 있다. 그러나, 제1 및 제2 LiDAR 포인트 클라우드(변환될 수 있음)는 상기에 설명된 바와 같이 아티팩트를 포함할 수 있다. 따라서, 제1 및 제2 LiDAR 포인트 클라우드의 각각의 쌍(또는 이의 서브세트)은 제1 및 제2 LiDAR 포인트 클라우드가 정렬된 것인지 또는 오정렬된 것인지 결정하기 위해 분류기 시스템(500)을 통해 프로세싱될 수 있다. 이 방식으로, LiDAR 포인트 클라우드의 정렬된 쌍은 차량의 위치를 결정하는 데 사용될 수 있고 그리고/또는 LiDAR 포인트 클라우드의 오정렬된 쌍은 불일치 가능성이 있는 것으로서 마킹될 수 있고(예컨대, 환경이 변했을 수 있음) 제2 LiDAR 포인트 클라우드는 로컬라이제이션 프로세스로부터 제거될 수 있으며, 그리하여 매핑 프로세스는 특정 시간에 지역의 현실과 관련하여 임계 레벨의 정확도 및 정밀도를 유지한다.
분류기 시스템(500)이 캘리브레이션 프로세스의 일부인 경우에, 분류기 시스템(500)은 적어도 하나의 캘리브레이션 테스트로부터 캘리브레이션 테스트를 결정하고(예컨대, GPS 또는 기타 로컬화 결정을 사용하여 차량(200)이 기지의 캘리브레이션 테스팅 사이트에 위치되어 있음을 결정함); 제4의 복수의 LiDAR 포인트 클라우드로부터(예컨대, 서버로부터 또는 메모리로부터) 캘리브레이션 테스트에 대응하는 특정 테스트 캘리브레이션 LiDAR를 제2 LiDAR 포인트 클라우드로서 획득할 수 있다. 제4의 복수의 LiDAR 포인트 클라우드는 LiDAR 센서(예컨대, LiDAR 센서(202a))를 캘리브레이션하는 데 사용되는 캘리브레이션 테스트 포인트 클라우드의 전부(또는 이의 서브세트, 예컨대 도시, 주, 국가 등 내에서)일 수 있다. 제1 및 제2 LiDAR 포인트 클라우드의 하나 또는 둘 다는 LiDAR 포인트 클라우드를 캡처한 LiDAR 센서의 상이한 위치 및/또는 배향을 설명하기 위해 각자의 LiDAR 포인트 클라우드를 정렬하도록 변환될 수 있다. 이 방식으로, 현재 감지된 LiDAR 포인트 클라우드는 기존의 LiDAR 포인트 클라우드를 갖는 LiDAR 센서(예컨대, LiDAR 센서(202b))를 캘리브레이션하는 데 사용될 수 있다. 그러나, 제1 및 제2 LiDAR 포인트 클라우드(변환될 수 있음)는 상기에 설명된 바와 같이 아티팩트를 포함할 수 있다. 따라서, 제1 및 제2 LiDAR 포인트 클라우드의 각각의 쌍(또는 이의 서브세트)은 제1 및 제2 LiDAR 포인트 클라우드가 정렬된 것인지 또는 오정렬된 것인지 결정하기 위해 분류기 시스템(500)을 통해 프로세싱될 수 있다. 이 방식으로, LiDAR 포인트 클라우드의 정렬된 쌍은 LiDAR 센서가 충분히 캘리브레이션됨을 나타내는 데 사용될 수 있고 그리고/또는 LiDAR 포인트 클라우드의 오정렬된 쌍은 LiDAR 센서를 캘리브레이션하고/하거나 부가의 캘리브레이션이 필요함을 나타내는 데 사용될 수 있다.
네트워크
분류기 네트워크(504)는 한 쌍의 포인트 클라우드(예컨대, 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B))로부터 특징을 추출하고 포인트 클라우드 쌍이 정렬 또는 오정렬되는 확률 점수를 계산할 수 있다. 분류기 네트워크(504)는 적어도 하나의 분류기 네트워크를 포함할 수 있다. 적어도 하나의 분류기 네트워크는: 필라(pillar) 기반의 네트워크 및/또는 커널 포인트 콘볼루션(kernel point convolution) 기반의 네트워크 중 적어도 하나를 포함할 수 있다. 일부 실시예에서, 분류기 네트워크는 필라 기반의 네트워크이다. 일부 실시예에서, 분류기 네트워크는 커널 포인트 콘볼루션 기반의 네트워크이다. 일부 실시예에서, 분류기 네트워크는 필라 기반의 네트워크와 커널 포인트 콘볼루션 기반의 네트워크 둘 다를 포함한다. 필라 기반의 네트워크 및 커널 포인트 콘볼루션 기반의 네트워크의 세부사항은 도 5b 및 도 5c에 관련하여 아래에 설명된다.
적어도 하나의 분류기 네트워크가 필라 기반의 네트워크와 커널 포인트 콘볼루션 기반의 네트워크 둘 다를 포함하는 경우에, 분류기 시스템(500)은 필라 기반의 네트워크와 커널 포인트 콘볼루션 기반의 네트워크 둘 다의 출력에 기초하여 적어도 2개의 LiDAR 포인트 클라우드가 정렬된 것인지 아니면 오정렬된 것인지 결정할 수 있다. 예를 들어, 분류기 시스템(500)은 더 높은 신뢰도(confidence) 값을 갖는 분류를 선택하고(출력 데이터세트(들)에서 출력된 경우); 둘 다의 출력이 분류에 동의하는 경우 분류를 결정하고; 그리고/또는 필라 기반의 네트워크와 커널 포인트 콘볼루션 기반의 네트워크 둘 다로부터 출력 데이터세트(들)를 융합(fuse)할 수 있다. 예를 들어, 출력 데이터세트(들)를 융합하기 위해, 분류기 시스템(500)은 각자의 미리 정의된 가중치로 출력 데이터세트(들)를 가중화하고, 각자의 신뢰도 값 등에 따라 가중치 출력 데이터세트(들)를 가중화할 수 있다. 따라서, 적어도 2개의 LiDAR 포인트 클라우드가 정렬된 것인지 아니면 오정렬된 것인지 결정하기 위해, 분류기 시스템(500)은 각각의 네트워크의 출력을 사용할 수 있다.
출력(들)
일반적으로, 분류기 네트워크(504)의 필라 기반의 네트워크 및 커널 포인트 콘볼루션 기반의 네트워크는 출력 데이터세트를 생성할 수 있다. 출력 데이터세트는 이진 분류(정렬 또는 오정렬), 확률 점수 및/또는 신뢰도 점수 등을 포함할 수 있다. 확률 점수가 출력인 경우, 분류기 시스템(500)은 확률 임계 조건에 기초하여 정렬 또는 오정렬의 이진 결정을 결정할 수 있다. 확률 임계 조건은, 확률 점수가 확률 임계치보다 크거나, 확률 임계치 이상이거나, 확률 임계치보다 작거나, 확률 임계치 이하인 경우, 정렬된 것으로 평가될 수 있고; 확률 임계 조건은, 확률 점수가 확률 임계치보다 크거나, 확률 임계치 이상이거나, 확률 임계치보다 작거나, 확률 임계치 이하인 경우, 오정렬된 것으로 평가될 수 있다.
상기 설명된 바와 같이, 분류기 시스템(500)은 포인트 클라우드 등록 프로세스, 맵 보정 프로세스, 로컬라이제이션 프로세스 및/또는 캘리브레이션 프로세스에서 사용될 수 있다. 분류기 시스템은 상기에 설명된 바와 같이 상이한 액션을 취할 수 있다(어느 프로세스에 사용되는지에 따라). 특히, 포인트 클라우드 등록 프로세스의 경우, 분류기 시스템(500)은 LiDAR 포인트 클라우드가 오정렬된 경우 제1 액션을 취하고 LiDAR 포인트 클라우드가 정렬된 경우 제2 액션을 취할 수 있다.
일부 실시예에서, 제1 액션은, 적어도 2개의 LiDAR 포인트 클라우드를 오정렬된 것으로 라벨링하고 그리고/또는 적어도 2개의 LiDAR 포인트 클라우드를 오정렬된 것으로서 라벨링하는 것에 기초하여 맵의 지역을 업데이트하는 것을 포함할 수 있다. 적어도 2개의 LiDAR 포인트 클라우드를 오정렬된 것으로서 라벨링하기 위해, 분류기 시스템(500)은 이 2개의 특정 LiDAR 포인트 클라우드가 오정렬됨을 나타내도록 제1의 복수의 LiDAR 포인트 클라우드를 업데이트할 수 있다. 맵의 지역을 업데이트하기 위해, 분류기 시스템(500)은 맵의 지역이 오정렬된 LiDAR 포인트 클라우드를 갖고/갖거나 예컨대 매핑 및/또는 로컬라이제이션 프로세스에 신뢰성있게 사용되기에 충분한 LiDAR 포인트 클라우드 데이터를 갖지 않음을 나타낼 수 있다.
일부 실시예에서,제2 액션은, 적어도 2개의 LiDAR 포인트 클라우드를 정렬된 것으로 라벨링하고 그리고/또는 제2의 적어도 2개의 LiDAR 포인트 클라우드를 정렬된 것으로서 라벨링하는 것에 기초하여 맵의 지역을 업데이트하는 것을 포함할 수 있다. 적어도 2개의 LiDAR 포인트 클라우드를 정렬된 것으로서 라벨링하기 위해, 분류기 시스템(500)은 이 2개의 특정 LiDAR 포인트 클라우드가 정렬됨을 나타내도록 제1의 복수의 LiDAR 포인트 클라우드를 업데이트할 수 있다. 맵의 지역을 업데이트하기 위해, 분류기 시스템(500)은 맵의 지역이 정렬된 LiDAR 포인트 클라우드를 갖고/갖거나 예컨대 매핑 및/또는 로컬라이제이션 프로세스에 신뢰성있게 사용되기에 충분한 LiDAR 포인트 클라우드 데이터를 가짐을 나타낼 수 있다.
분류기 시스템의 예시적인 네트워크
도 5b 및 도 5c는 포인트 클라우드 정렬 분류기 시스템(500)의 예시적인 네트워크를 예시한 블록 다이어그램들이다.
도 5b를 참조하면, 필라 기반의 네트워크(510)는 상기에 설명된 바와 같이 정렬 또는 오정렬의 분류를 출력하도록 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B)를 프로세싱할 수 있다. 필라 기반의 네트워크(510)는, 특징 네트워크(510A), 적어도 하나의 기능 네트워크(functional network)(510E, 510F, 510G) 및 완전 연결 계층(510H)을 포함할 수 있다.
특징 네트워크(510A)는 적어도 하나의 LiDAR 포인트 클라우드(예컨대, 소스 포인트 클라우드(502A), 타겟 포인트 클라우드(502B), 또는 둘 다)를 수신하고 적어도 하나의 특징 맵(510D)을 출력할 수 있다. 필라 기반의 네트워크(510)는 입력될 적어도 2개의 LiDAR 포인트 클라우드(독립적으로 프로세싱 포인트 클라우드로 지칭됨)의 각각에 대응하는 둘 이상의 특징 네트워크(510A)를 포함할 수 있다. 일반적으로, 특징 네트워크(510A)의 수는 입력될 LiDAR 포인트 클라우드의 예상 수에 대응할 수 있다. 도 5b에 도시된 경우에, 2개의 특징 네트워크(510A)가, 입력된 LiDAR 포인트 클라우드 각각에 대응하는 2개의 특징 맵(510D)을 생성하는 데 사용된다. 또한, 하나의 특징 네트워크(510A)만, 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하는 데 사용될 수 있다(병합(merged) 포인트 클라우드로서 프로세싱하는 것으로 지칭됨, 도 5c에 관련하여 아래에 설명됨). 도 5b에 도시된 바와 같이, 필라 기반의 네트워크(510)는 적어도, 제1 LiDAR 포인트 클라우드(502A)를 수신하며 제1 특징 맵(510D)을 출력하는 제1 특징 네트워크(510A), 및 제2 LiDAR 포인트 클라우드(502B)를 수신하며 제2 특징 맵(510D)을 출력하는 제2 특징 네트워크(510A)를 포함할 수 있다.
각각의 특징 네트워크(510A)는 필라 인코더(510B) 및 특징 백본(510C)을 포함할 수 있다. 필라 인코더(510B)는, 모든 목적을 위해 참조에 의해 여기에 포함된, "PointPillars: Fast Encoders for Object Detection from Point Clouds" in "Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)", arXiv:1812.05784v2 [cs.LG] 5 May 2019에 기재된 바와 같이, 적어도 하나의 LiDAR 포인트 클라우드를 수신하고 적어도 하나의 의사-이미지(pseudo-image)를 출력할 수 있다.
특징 백본(510C)은 적어도 하나의 의사-이미지를 수신하고 적어도 하나의 특징 맵(510D)을 출력할 수 있다. 특징 백본(510C)은 특징 추출 네트워크일 수 있다. 예를 들어, 특징 백본(510C)은 임의의 ResNet, VGG 등을 포함하는 콘볼루션 신경 네트워크 등일 수 있다.
적어도 하나의 기능 네트워크(510E, 510F, 510G)는 적어도 하나의 특징 맵(510D)을 수신하고 특징 벡터를 출력할 수 있다. 예를 들어, 적어도 하나의 기능 네트워크(510E, 510F, 510G)는 적어도 2개의 LiDAR 포인트 클라우드가 병합되는 경우 하나의 특징 맵을 수신할 수 있거나, 또는 적어도 하나의 기능 네트워크(510E, 510F, 510G)는 적어도 2개의 LiDAR 포인트 클라우드가 독립적으로 프로세싱되는 경우에 적어도 2개의 특징 맵을 수신할 수 있거나(도 5b에 도시된 바와 같이), 등등이 있다. 적어도 하나의 기능 네트워크는, 연결(concatenation) 네트워크(510E), 적어도 하나의 콘볼루션 네트워크(510F) 및/또는 플래튼(flatten) 네트워크(510G) 중 적어도 하나를 포함할 수 있다. 적어도 하나의 기능 네트워크는 적어도 2개의 LiDAR 포인트 클라우드가 병합 포인트 클라우드로서 프로세싱되는 경우에 연결 네트워크(510E)를 포함하지 않을 수 있다.
완전 연결 계층(510H)은 특징 벡터를 수신하고 분류 데이터세트를 출력할 수 있다. 분류 데이터세트는 필라 기반의 네트워크(510)에 대한 적어도 하나의 출력 데이터세트일 수 있고, 따라서 상기에 설명된 바와 같이 이진 분류(정렬 또는 오정렬), 확률 점수 및/또는 신뢰도 점수 등을 포함할 수 있다.
도 5c를 참조하면, 커널 포인트 콘볼루션 기반의 네트워크(520)는 상기에 설명된 바와 같이 정렬 또는 오정렬의 분류를 출력하도록 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B)를 프로세싱할 수 있다. 커널 포인트 콘볼루션 기반의 네트워크(520)는 커널 포인트 콘볼루션 기반의 인코더(520B), 집계 함수(520C) 및 완전 연결 계층(520D)을 포함할 수 있다.
커널 포인트 콘볼루션 기반의 인코더(520B)는 적어도 2개의 LiDAR 포인트 클라우드를 수신하고 복수의 특징 벡터를 출력할 수 있다. 예를 들어, 커널 포인트 콘볼루션 기반의 인코더(520B)는, 모든 목적을 위해 참조에 의해 여기에 포함된, "KPConv: Flexible and Deformable Convolution for Point Clouds" in "Proceedings of the IEEE International Conference on Computer Vision 2019" arXiv:1904.08889v2 [cs.CV] 19 Aug 2019에 기재된 바와 같이, 입력 포인트 클라우드에 기초하여 복수의 특징 벡터를 결정할 수 있다. 커널 포인트 콘볼루션 기반의 인코더(520B)는 입력으로서 병합 포인트 클라우드(520A)를 수신할 수 있다. 병합 포인트 클라우드(520A)는 커널 포인트 콘볼루션 기반의 인코더(520B)에 입력되기 전에 적어도 2개의 LiDAR 포인트 클라우드 각각의 포인트 [좌표 x, y, z 및 반사율 r]의 각각을 포함할 수 있다. 병합 포인트 클라우드(520A)는 적어도 2개의 LiDAR 포인트 클라우드 각각에 소스 라벨링될(source-labeled) 수 있다. 예를 들어, 각각의 포인트에는 포인트의 소스를 나타내는 이진 라벨로 라벨링될 수 있다.
일반적으로, 복수의 특징 벡터의 수는 미리 알려져 있지 않다. 예를 들어, 커널 포인트 콘볼루션 기반의 인코더(520B)는 기술적(descriptive) 특징(들)을 획득하도록 다운 샘플링 콘볼루션 연산의 시퀀스를 수행할 수 있다. 따라서, 집계 함수(520C)는 복수의 특징 벡터를 수신하고 복수의 특징 벡터를 단일 특징 벡터로 집계할 수 있다. 예를 들어, 집계 함수(520C)는, 최대 풀링 함수, 랜덤 초이스 함수, 전역 평균 함수, 평균 값 함수, 또는 비모수적 집계 함수 중의 하나일 수 있다.
완전 연결 계층(520D)은 단일 특징 벡터를 수신하고 분류 데이터세트를 출력할 수 있다. 분류 데이터세트는 커널 포인트 콘볼루션 기반의 네트워크(520)에 대한 적어도 하나의 출력 데이터세트일 수 있고, 따라서 상기에 설명된 바와 같이 이진 분류(정렬 또는 오정렬), 확률 점수 및/또는 신뢰도 점수 등을 포함할 수 있다.
정성적 결과
일반적으로, 본원에 개시된 분류기 네트워크(504)는 오정렬을 검출하기 위해 높은 수준의 정확도를 달성할 수 있다. 특히, 표 1은 분류기 네트워크(504)의 특정 타입에 대한 오정렬 검출 정확도를 나타낸다.
네트워크 타입 오정렬 검출 정확도
필라 기반의 네트워크 (510) 96.81 %
커널 포인트 콘볼루션 기반의 네트워크 (520) 99.78 %
필라 기반의 네트워크(510)의 경우, 오정렬 검출 정확도는 포인트 클라우드 쌍이 독립적으로 프로세싱되는 네트워크 버전을 사용하여 보고된다. 커널 포인트 콘볼루션 기반의 네트워크(520)의 경우, 오정렬 검출 정확도는, 포인트 클라우드 쌍이 병합된 다음 병합 포인트 클라우드로서 프로세싱되는 네트워크 버전을 사용하여 보고된다. 오정렬 검출 정확도는 트레이닝 프로세스의 상이한 스테이지들에 걸쳐 최대 검증 F1 점수로서 보고된다.
정성적 결과
도 7d 내지 도 7f로 가면, 분류기 네트워크(504)는 LiDAR 포인트 클라우드 쌍을 정확하게 분류할 수 있다. 예를 들어, 분류기 네트워크(504)는 광범위한 아티팩트(예컨대, 오정렬)를 갖는 LiDAR 포인트 클라우드 쌍을 분류할 수 있다.
예를 들어, 도 7d에서, 분류기 네트워크(504)는 아티팩트(718)와 같은 대규모 아티팩트로써 오정렬된 것으로서 LiDAR 포인트 클라우드 쌍(700D)을 정확하게 분류할 수 있다. 도 7e에서, 분류기 네트워크(504)는 LiDAR 포인트 클라우드 쌍(700E)을 정렬된 것으로서 정확하게 분류할 수 있다. 도 7f에서, 분류기 네트워크(504)는 아티팩트(720)와 같은 저규모 아티팩트로써 오정렬된 것으로서 LiDAR 포인트 클라우드 쌍(700F)을 정확하게 분류할 수 있다. 일반적으로, 저규모 아티팩트를 갖는 LiDAR 포인트 클라우드 쌍을 분류하는 것은 사람 작업자에게는 더 어려운 일이다.
분류기 네트워크의 트레이닝
일반적으로, 분류기 네트워크(504)는 지도 학습, 비지도 학습, 반지도 학습 등을 포함하는 다양한 기술을 사용하여 트레이닝될 수 있다. 예를 들어, 분류기 네트워크(504)는 분류기 네트워크(504)를 조정하도록 피드백을 제공하는 적합한 손실 함수로 LiDAR 포인트 클라우드의 오정렬 및 정렬된 쌍의 라벨링된 세트를 포함하는 트레이닝 데이터에 대해 트레이닝될 수 있다. 트레이닝 데이터는 루프 내의 사람에 의해 식별된 대로 이전에 식별된 LiDAR 포인트 클라우드의 오정렬 및 정렬된 쌍일 수 있다. 대안으로서 또는 추가적으로, 트레이닝 데이터는 LiDAR 포인트 클라우드의 라벨링되지 않은/새로운 쌍에 대해 분류기 네트워크(504)에 의해 출력된 분류에 관련하여 사람이 피드백을 제공함에 따라 오정렬 및 정렬된 쌍의 추가적인 라벨링된 세트를 포함할 수 있다.
일부 경우에, 트레이닝 데이터는 정렬된 LiDAR 포인트 클라우드 쌍으로부터 생성된 오정렬된 LiDAR 포인트 클라우드 쌍을 포함할 수 있다. 정렬된 LiDAR 포인트 클라우드 쌍은 실세계 데이터 수집으로부터 획득되고 루프 내의 사람에 의해 라벨링될 수 있다. 일부 경우에, 트레이닝 데이터는 동일한 수의 정렬 및 오정렬된 쌍을 가질 수 있다. 일부 경우에, 트레이닝 데이터는 동일하지 않은 수의 정렬 및 오정렬된 쌍을 가질 수 있다. 예를 들어, 트레이닝 데이터는 수천 내지 수만 쌍의 LiDAR 포인트 클라우드를 포함할 수 있다. 또한, 트레이닝 데이터는 검증, 트레이닝 및 테스트를 위해 LiDAR 포인트 클라우드 쌍의 상이한 세트들로 분할될 수 있다. LiDAR 포인트 클라우드 쌍의 세트 각각에서, 한 부분은 정렬된 데이터세트에 할당될 수 있고 또다른 부분은 오정렬된 데이터세트에 할당될 수 있다.
LiDAR 포인트 클라우드의 정렬된 쌍으로부터 LiDAR 포인트 클라우드의 오정렬된 쌍을 생성하기 위해, 컴퓨터 시스템(예컨대, 분류기 시스템(500))은 오정렬 변환을 생성하고 오정렬된 데이터세트의 LiDAR 포인트 클라우드에 오정렬 변환을 적용할 수 있다. 예를 들어, LiDAR 포인트 클라우드의 각 쌍에 대하여, 오정렬 변환은 LiDAR 포인트 클라우드 쌍의 하나의 LiDAR 포인트 클라우드에 적용될 수 있다. 오정렬 변환은 강체(rigid-body) 변환일 수 있다. 오정렬 변환을 생성하기 위해, 컴퓨터 시스템은
Figure pat00001
로써 병진 및 회전 성분에 대하여 0-중심 정규 분포(
Figure pat00002
)로부터 오정렬 변환을 구축할 수 있으며, 여기서
Figure pat00003
는 병진 이동이고
Figure pat00004
는 회전이다. 일부 경우에,
Figure pat00005
각각의 크기는 관찰된 오정렬에 따라 미리 결정될 수 있다. 예를 들어, 0-중심 정규 분포는 식 (1)을 고수할 수 있다.
Figure pat00006
예를 들어, 컴퓨터 시스템은 p의 임의 확률에 따라 정규 분포로부터의 성분을 샘플링할 수 있다. 확률 p는 예컨대 0.5로 설정될 수 있지만, 당해 기술분야에서의 숙련자라면 확률 p가 상이한 확률로 설정될 수 있다는 것을 알 것이다.
일부 경우에, 오정렬 변환은 각각의 트레이닝 시대(epoch)에 대하여 리샘플링될 수 있다. 따라서, 트레이닝 동안 반복적으로 트레이닝 데이터의 확률적 변형을 효과적으로 생성함으로써, 그에 따라 트레이닝 데이터의 다양성을 증가시킨다.
일부 경우에, 예컨대 검증 트레이닝 세트의 경우, 사용자는 일반적으로 발생하는 오정렬된 매핑 아티팩트를 재생성하는 트레이닝 데이터에 대한 오정렬 변환을 생성할 수 있다. 일부 경우에,
Figure pat00007
각각의 크기는 사용자가 생성한 오정렬 변환에 따라 설정될 수 있다.
분류기 시스템의 예시적인 흐름도
도 6은 인지 시스템(402)에서 포인트 클라우드를 분류하기 위해 하나 이상의 프로세서에 의해 구현되는 루틴(600)의 예를 예시한 흐름도이다. 도 6에 예시된 흐름도는 단지 예시를 위한 목적으로 제공된다. 도 6에 예시된 루틴(600)의 단계들의 하나 이상은 제거될 수 있거나 단계들의 순서가 바뀔 수 있다는 것을 이해할 것이다. 또한, 명확한 예를 예시하기 위한 목적으로 하나 이상의 특정 시스템 컴포넌트는 데이터 플로우 단계들 각각 동안 다양한 동작을 수행하는 맥락에서 기재된다. 그러나, 시스템 컴포넌트들에 걸쳐 프로세싱 단계들의 다른 시스템 배열 및 분포가 사용될 수 있다.
블록 602에서, 분류기 시스템(500)은 적어도 2개의 LiDAR 포인트 클라우드를 획득할 수 있다. 예를 들어, 분류기 시스템(500)은 상기에 설명된 바와 같이 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B)를 획득할 수 있다.
블록 604에서, 분류기 시스템(500)은 적어도 하나의 분류기 네트워크를 통해 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱할 수 있다. 예를 들어, 분류기 시스템(500)은 상기에 설명된 바와 같이 필라 기반의 네트워크(510) 또는 커널 포인트 콘볼루션 기반의 인코더(520B) 중 하나 또는 둘 다를 통해 소스 포인트 클라우드(502A) 및 타겟 포인트 클라우드(502B)를 프로세싱할 수 있다.
블록 606에서, 분류기 시스템(500)은 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득할 수 있다. 예를 들어, 분류기 시스템(500)은 상기에 설명된 바와 같이 필라 기반의 네트워크(510) 또는 커널 포인트 콘볼루션 기반의 인코더(520B) 중 하나 또는 둘 다로부터 분류 데이터세트를 획득할 수 있다.
블록 608에서, 분류기 시스템(500)은 적어도 하나의 출력 데이터세트에 기초하여 적어도 2개의 LiDAR 포인트 클라우드가 정렬되는지 아니면 오정렬되는지 결정할 수 있다. 예를 들어, 상기에 설명된 바와 같이, 분류기 시스템(500)은 필라 기반의 네트워크(510) 또는 커널 포인트 콘볼루션 기반의 네트워크(520) 중 하나 또는 둘 다로부터의 분류 데이터세트로부터 이진 분류(들)(정렬 또는 오정렬) 또는 확률 점수 및/또는 신뢰도 점수를 추출하고, 이진 분류(들) 또는 확률 점수(들)에 관련한 확률 임계 조건에 따라 적어도 2개의 LiDAR 포인트 클라우드가 정렬되어 있는지 아니면 오정렬되어 있는지 결정할 수 있다.
블록 610에서, 분류기 시스템(500)은 적어도 2개의 LiDAR 포인트 클라우드가 정렬되어 있다는 결정에 기초하여 제1 액션을 또는 적어도 2개의 LiDAR 포인트 클라우드가 오정렬되어 있다는 결정에 기초하여 제2 액션을 수행할 수 있다. 예를 들어, 분류기 시스템(500)은 상기에 설명된 바와 같이 제1 액션 또는 제2 액션을 수행할 수 있다.
항목 1. 방법에 있어서, 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 단계; 적어도 하나의 분류기 네트워크를 사용하여 상기 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하는 단계; 상기 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득하는 단계; 상기 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 단계; 및 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것에 기초하여 제1 액션을 수행하는 단계를 포함하는, 방법.
항목 2. 항목 1에 있어서, 상기 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 단계는: 맵의 지역을 매핑하기 위한 포인트 클라우드 등록 프로세스를 위해 제1의 복수의 LiDAR 포인트 클라우드로부터 상기 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 단계; 맵 보정 프로세스를 위해 차량에 탑재된 LiDAR 시스템으로부터 상기 적어도 2개의 LiDAR 포인트 클라우드 중 제1 LiDAR 포인트 클라우드를 그리고 제2의 복수의 LiDAR 포인트 클라우드로부터 상기 적어도 2개의 LiDAR 포인트 클라우드 중 제2 LiDAR 포인트 클라우드를 획득하는 단계; 로컬라이제이션 프로세스를 위해 차량에 탑재된 LiDAR 시스템으로부터 제1 LiDAR 포인트 클라우드를 그리고 제3의 복수의 LiDAR 포인트 클라우드로부터 제2 LiDAR 포인트 클라우드를 획득하는 단계; 또는 캘리브레이션 프로세스를 위해 차량에 탑재된 LiDAR 시스템으로부터 제1 LiDAR 포인트 클라우드를 그리고 제4의 복수의 LiDAR 포인트 클라우드로부터 제2 LiDAR 포인트 클라우드를 획득하는 단계를 포함하는 것인, 방법.
항목 3. 항목 1 또는 2에 있어서, 상기 적어도 하나의 분류기 네트워크는, 필라 기반의 네트워크 또는 커널 포인트 콘볼루션 기반의 네트워크 중 적어도 하나를 포함하는 것인, 방법.
항목 4. 항목 1 내지 3 중 어느 하나에 있어서, 상기 적어도 하나의 분류기 네트워크는 필라 기반의 네트워크 및 커널 포인트 콘볼루션 기반의 네트워크를 포함하고, 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 단계는: 상기 필라 기반의 네트워크 및 상기 커널 포인트 콘볼루션 기반의 네트워크로부터의 상기 적어도 하나의 출력 데이터세트를 융합하는 단계; 및 상기 융합된 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 단계를 포함하는 것인, 방법.
항목 5. 항목 1 내지 4 중 어느 하나에 있어서, 상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 필라 기반의 네트워크이고, 상기 필라 기반의 네트워크는: 적어도 하나의 LiDAR 포인트 클라우드를 수신하고 적어도 하나의 특징 맵을 출력하는 특징 네트워크, 상기 적어도 하나의 특징 맵을 수신하고 특징 벡터를 출력하는 적어도 하나의 기능 네트워크, 및 상기 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 - 을 포함하는 것인, 방법.
항목 6. 항목 5에 있어서, 상기 특징 네트워크는: 상기 적어도 하나의 LiDAR 포인트 클라우드를 수신하고 적어도 하나의 의사 이미지를 출력하는 필라 인코더, 및 상기 적어도 하나의 의사 이미지를 수신하고 상기 적어도 하나의 특징 맵을 출력하는 특징 백본을 포함하는 것인, 방법.
항목 7. 항목 5에 있어서, 상기 적어도 하나의 기능 네트워크는: 연결 네트워크, 적어도 하나의 콘볼루션 네트워크, 또는 플래튼 네트워크 중 적어도 하나를 포함하는 것인, 방법.
항목 8. 항목 1 내지 4 중 어느 하나에 있어서, 상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 필라 기반의 네트워크이고, 상기 필라 기반의 네트워크는: 제1 LiDAR 포인트 클라우드를 수신하고 제1 특징 맵을 출력하는 제1 특징 네트워크, 제2 LiDAR 포인트 클라우드를 수신하고 제2 특징 맵을 출력하는 제2 특징 네트워크, 상기 제1 특징 맵 및 상기 제2 특징 맵을 수신하고 특징 벡터를 출력하는 적어도 하나의 기능 네트워크, 및 상기 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 - 을 포함하는 것인, 방법.
항목 9. 항목 1 내지 4 중 어느 하나에 있어서, 상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 커널 포인트 콘볼루션 기반의 네트워크이고, 상기 커널 포인트 콘볼루션 기반의 네트워크는: 상기 적어도 2개의 LiDAR 포인트 클라우드를 수신하고 복수의 특징 벡터를 출력하는 커널 포인트 콘볼루션 기반의 인코더, 상기 복수의 특징 벡터를 수신하고 상기 복수의 특징 벡터를 단일 특징 벡터로 집계하는 집계 함수, 및 상기 단일 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 - 을 포함하는 것인, 방법.
항목 10. 항목 9에 있어서, 상기 적어도 2개의 LiDAR 포인트 클라우드는 상기 커널 포인트 콘볼루션 기반의 인코더에 입력되기 전에 병합 포인트 클라우드를 형성하도록 병합되는 것인, 방법.
항목 11. 항목 10에 있어서, 상기 병합 포인트 클라우드는 상기 적어도 2개의 LiDAR 포인트 클라우드 각각에 소스 라벨링되는 것인, 방법.
항목 12. 항목 9에 있어서, 상기 집계 함수는 최대 풀링 함수, 랜덤 초이스 함수, 전역 평균 함수, 평균 값 함수, 또는 비모수적 집계 함수를 포함하는 것인, 방법.
항목 13. 항목 1 내지 12 중 어느 하나에 있어서, 제2의 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 단계; 상기 적어도 하나의 분류기 네트워크를 사용하여 상기 제2의 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하는 단계; 상기 적어도 하나의 분류기 네트워크로부터 제2의 적어도 하나의 출력 데이터세트를 획득하는 단계; 상기 제2의 적어도 하나의 출력 데이터세트에 기초하여 상기 제2의 적어도 2개의 LiDAR 포인트 클라우드가 정렬됨을 결정하는 단계; 및 상기 제2의 적어도 2개의 LiDAR 포인트 클라우드가 정렬됨을 결정하는 것에 기초하여 제2 액션을 수행하는 단계를 더 포함하고, 상기 제2 액션을 수행하는 단계는: 상기 제2의 적어도 2개의 LiDAR 포인트 클라우드를 정렬된 것으로서 라벨링하는 단계, 및/또는 상기 제2의 적어도 2개의 LiDAR 포인트 클라우드를 정렬된 것으로서 라벨링하는 것에 기초하여 맵의 지역을 업데이트하는 단계를 포함하는 것인, 방법.
항목 14. 항목 1 내지 13 중 어느 하나에 있어서, 상기 제1 액션은: 상기 적어도 2개의 LiDAR 포인트 클라우드를 오정렬된 것으로서 라벨링하는 단계, 및/또는 상기 적어도 2개의 LiDAR 포인트 클라우드를 오정렬된 것으로서 라벨링하는 것에 기초하여 맵의 지역을 업데이트하는 단계를 포함하는 것인, 방법.
항목 15. 시스템에 있어서, 적어도 하나의 프로세서; 및 명령어들을 저장한 적어도 하나의 비일시적 저장 매체를 포함하고, 상기 명령어들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금: 적어도 2개의 LiDAR 포인트 클라우드를 획득하고; 적어도 하나의 분류기 네트워크를 사용하여 상기 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하고; 상기 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득하고; 상기 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하고; 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것에 기초하여 제1 액션을 수행하게 하는 것인, 시스템.
항목 16. 항목 15에 있어서, 상기 적어도 하나의 분류기 네트워크는, 필라 기반의 네트워크 또는 커널 포인트 콘볼루션 기반의 네트워크 중 적어도 하나를 포함하는 것인, 시스템.
항목 17. 항목 15 또는 16에 있어서, 상기 적어도 하나의 분류기 네트워크는 필라 기반의 네트워크 및 커널 포인트 콘볼루션 기반의 네트워크를 포함하고, 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것은: 상기 필라 기반의 네트워크 및 상기 커널 포인트 콘볼루션 기반의 네트워크로부터의 상기 적어도 하나의 출력 데이터세트를 융합하고; 상기 융합된 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것을 포함하는 것인, 시스템.
항목 18. 항목 15 내지 17 중 어느 하나에 있어서, 상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 필라 기반의 네트워크이고, 상기 필라 기반의 네트워크는: 적어도 하나의 LiDAR 포인트 클라우드를 수신하고 적어도 하나의 특징 맵을 출력하는 특징 네트워크, 상기 적어도 하나의 특징 맵을 수신하고 특징 벡터를 출력하는 적어도 하나의 기능 네트워크, 및 상기 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 - 을 포함하는 것인, 시스템.
항목 19. 항목 15 내지 17 중 어느 하나에 있어서, 상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 커널 포인트 콘볼루션 기반의 네트워크이고, 상기 커널 포인트 콘볼루션 기반의 네트워크는: 상기 적어도 2개의 LiDAR 포인트 클라우드를 수신하고 복수의 특징 벡터를 출력하는 커널 포인트 콘볼루션 기반의 인코더, 상기 복수의 특징 벡터를 수신하고 상기 복수의 특징 벡터를 단일 특징 벡터로 집계하는 집계 함수, 및 상기 단일 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 - 을 포함하는 것인, 시스템.
항목 20. 명령어들을 저장한 적어도 하나의 비일시적 저장 매체에 있어서, 상기 명령어들은 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금: 적어도 2개의 LiDAR 포인트 클라우드를 획득하고; 적어도 하나의 분류기 네트워크를 사용하여 상기 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하고; 상기 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득하고; 상기 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하고; 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것에 기초하여 제1 액션을 수행하게 하는 것인, 적어도 하나의 비일시적 저장 매체.
전술한 설명에서, 본 개시의 양태들 및 실시예들은 구현마다 달라질 수 있는 다수의 특정 세부 사항들을 참조하여 기술되었다. 그에 따라, 설명 및 도면들은 제한적인 의미가 아니라 예시적인 의미로 간주되어야 한다. 본 발명의 범위의 유일한 독점적인 지표, 및 출원인이 본 발명의 범위이도록 의도한 것은, 본 출원에서 특정 형태로 나오는 일련의 청구항의 문언적 등가 범위이며, 임의의 후속 보정을 포함한다. 그러한 청구항에 포함된 용어에 대한 본원에서 명시적으로 기재된 임의의 정의는 청구항에서 사용되는 그러한 용어의 의미를 결정한다. 추가적으로, 전술한 설명 및 이하의 청구항에서 "추가로 포함하는"이라는 용어가 사용될 때, 이 문구에 뒤따르는 것은 추가적인 단계 또는 엔티티, 또는 이전에 언급된 단계 또는 엔티티의 서브-단계/서브-엔티티일 수 있다.

Claims (20)

  1. 방법에 있어서,
    적어도 2개의 LiDAR(light detection and ranging) 포인트 클라우드를 획득하는 단계;
    적어도 하나의 분류기 네트워크(classifier network)를 사용하여 상기 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하는 단계;
    상기 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득하는 단계;
    상기 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨(misaligned)을 결정하는 단계; 및
    상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것에 기초하여 제1 액션을 수행하는 단계
    를 포함하는, 방법.
  2. 청구항 1에 있어서,
    상기 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 단계는:
    맵의 지역(locality)을 매핑하기 위한 포인트 클라우드 등록 프로세스를 위해 제1의 복수의 LiDAR 포인트 클라우드로부터 상기 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 단계;
    맵 보정 프로세스를 위해 차량에 탑재된 LiDAR 시스템으로부터 상기 적어도 2개의 LiDAR 포인트 클라우드 중 제1 LiDAR 포인트 클라우드를 그리고 제2의 복수의 LiDAR 포인트 클라우드로부터 상기 적어도 2개의 LiDAR 포인트 클라우드 중 제2 LiDAR 포인트 클라우드를 획득하는 단계;
    로컬라이제이션(localization) 프로세스를 위해 차량에 탑재된 LiDAR 시스템으로부터 제1 LiDAR 포인트 클라우드를 그리고 제3의 복수의 LiDAR 포인트 클라우드로부터 제2 LiDAR 포인트 클라우드를 획득하는 단계; 또는
    캘리브레이션(calibration) 프로세스를 위해 차량에 탑재된 LiDAR 시스템으로부터 제1 LiDAR 포인트 클라우드를 그리고 제4의 복수의 LiDAR 포인트 클라우드로부터 제2 LiDAR 포인트 클라우드를 획득하는 단계
    를 포함하는 것인, 방법.
  3. 청구항 1 또는 청구항 2에 있어서,
    상기 적어도 하나의 분류기 네트워크는, 필라(pillar) 기반의 네트워크 또는 커널 포인트 콘볼루션(kernel point convolution) 기반의 네트워크 중 적어도 하나를 포함하는 것인, 방법.
  4. 청구항 1 또는 청구항 2에 있어서,
    상기 적어도 하나의 분류기 네트워크는 필라 기반의 네트워크 및 커널 포인트 콘볼루션 기반의 네트워크를 포함하고, 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 단계는:
    상기 필라 기반의 네트워크 및 상기 커널 포인트 콘볼루션 기반의 네트워크로부터의 상기 적어도 하나의 출력 데이터세트를 융합하는(fuse) 단계; 및
    상기 융합된 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 단계
    를 포함하는 것인, 방법.
  5. 청구항 1 또는 청구항 2에 있어서,
    상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 필라 기반의 네트워크이고, 상기 필라 기반의 네트워크는:
    적어도 하나의 LiDAR 포인트 클라우드를 수신하고 적어도 하나의 특징(feature) 맵을 출력하는 특징 네트워크,
    상기 적어도 하나의 특징 맵을 수신하고 특징 벡터를 출력하는 적어도 하나의 기능 네트워크, 및
    상기 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 -
    을 포함하는 것인, 방법.
  6. 청구항 5에 있어서,
    상기 특징 네트워크는:
    상기 적어도 하나의 LiDAR 포인트 클라우드를 수신하고 적어도 하나의 의사 이미지(pseudo-image)를 출력하는 필라 인코더, 및
    상기 적어도 하나의 의사 이미지를 수신하고 상기 적어도 하나의 특징 맵을 출력하는 특징 백본
    을 포함하는 것인, 방법.
  7. 청구항 5에 있어서,
    상기 적어도 하나의 기능 네트워크는:
    연결(concatenation) 네트워크, 적어도 하나의 콘볼루션 네트워크, 또는 플래튼(flatten) 네트워크
    중 적어도 하나를 포함하는 것인, 방법.
  8. 청구항 1 또는 청구항 2에 있어서,
    상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 필라 기반의 네트워크이고, 상기 필라 기반의 네트워크는:
    제1 LiDAR 포인트 클라우드를 수신하고 제1 특징 맵을 출력하는 제1 특징 네트워크,
    제2 LiDAR 포인트 클라우드를 수신하고 제2 특징 맵을 출력하는 제2 특징 네트워크,
    상기 제1 특징 맵 및 상기 제2 특징 맵을 수신하고 특징 벡터를 출력하는 적어도 하나의 기능 네트워크, 및
    상기 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 -
    을 포함하는 것인, 방법.
  9. 청구항 1 또는 청구항 2에 있어서,
    상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 커널 포인트 콘볼루션 기반의 네트워크이고, 상기 커널 포인트 콘볼루션 기반의 네트워크는:
    상기 적어도 2개의 LiDAR 포인트 클라우드를 수신하고 복수의 특징 벡터를 출력하는 커널 포인트 콘볼루션 기반의 인코더,
    상기 복수의 특징 벡터를 수신하고 상기 복수의 특징 벡터를 단일 특징 벡터로 집계하는(aggregate) 집계 함수, 및
    상기 단일 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 -
    을 포함하는 것인, 방법.
  10. 청구항 9에 있어서,
    상기 적어도 2개의 LiDAR 포인트 클라우드는 상기 커널 포인트 콘볼루션 기반의 인코더에 입력되기 전에 병합 포인트 클라우드를 형성하도록 병합되는 것인, 방법.
  11. 청구항 10에 있어서,
    상기 병합 포인트 클라우드는 상기 적어도 2개의 LiDAR 포인트 클라우드 각각에 소스 라벨링되는 것인, 방법.
  12. 청구항 9에 있어서,
    상기 집계 함수는 최대 풀링 함수, 랜덤 초이스 함수, 전역 평균 함수, 평균 값 함수, 또는 비모수적 집계 함수를 포함하는 것인, 방법.
  13. 청구항 1 또는 청구항 2에 있어서,
    제2의 적어도 2개의 LiDAR 포인트 클라우드를 획득하는 단계;
    상기 적어도 하나의 분류기 네트워크를 사용하여 상기 제2의 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하는 단계;
    상기 적어도 하나의 분류기 네트워크로부터 제2의 적어도 하나의 출력 데이터세트를 획득하는 단계;
    상기 제2의 적어도 하나의 출력 데이터세트에 기초하여 상기 제2의 적어도 2개의 LiDAR 포인트 클라우드가 정렬됨을 결정하는 단계; 및
    상기 제2의 적어도 2개의 LiDAR 포인트 클라우드가 정렬됨을 결정하는 것에 기초하여 제2 액션을 수행하는 단계
    를 더 포함하고,
    상기 제2 액션을 수행하는 단계는:
    상기 제2의 적어도 2개의 LiDAR 포인트 클라우드를 정렬된 것으로서 라벨링하는 단계, 또는
    상기 제2의 적어도 2개의 LiDAR 포인트 클라우드를 정렬된 것으로서 라벨링하는 것에 기초하여 맵의 지역을 업데이트하는 단계
    중 적어도 하나를 포함하는 것인, 방법.
  14. 청구항 1 또는 청구항 2에 있어서,
    상기 제1 액션을 수행하는 단계는:
    상기 적어도 2개의 LiDAR 포인트 클라우드를 오정렬된 것으로서 라벨링하는 단계, 또는
    상기 적어도 2개의 LiDAR 포인트 클라우드를 오정렬된 것으로서 라벨링하는 것에 기초하여 맵의 지역을 업데이트하는 단계
    중 적어도 하나를 포함하는 것인, 방법.
  15. 시스템에 있어서,
    적어도 하나의 프로세서; 및
    명령어들을 저장한 적어도 하나의 비일시적 저장 매체
    를 포함하고,
    상기 명령어들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금:
    적어도 2개의 LiDAR 포인트 클라우드를 획득하고;
    적어도 하나의 분류기 네트워크를 사용하여 상기 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하고;
    상기 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득하고;
    상기 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하고;
    상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것에 기초하여 제1 액션을 수행하게 하는 것인, 시스템.
  16. 청구항 15에 있어서,
    상기 적어도 하나의 분류기 네트워크는, 필라 기반의 네트워크 또는 커널 포인트 콘볼루션 기반의 네트워크 중 적어도 하나를 포함하는 것인, 시스템.
  17. 청구항 15 또는 청구항 16에 있어서,
    상기 적어도 하나의 분류기 네트워크는 필라 기반의 네트워크 및 커널 포인트 콘볼루션 기반의 네트워크를 포함하고, 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것은:
    상기 필라 기반의 네트워크 및 상기 커널 포인트 콘볼루션 기반의 네트워크로부터의 상기 적어도 하나의 출력 데이터세트를 융합하고;
    상기 융합된 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것
    을 포함하는 것인, 시스템.
  18. 청구항 15 또는 청구항 16에 있어서,
    상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 필라 기반의 네트워크이고, 상기 필라 기반의 네트워크는:
    적어도 하나의 LiDAR 포인트 클라우드를 수신하고 적어도 하나의 특징 맵을 출력하는 특징 네트워크,
    상기 적어도 하나의 특징 맵을 수신하고 특징 벡터를 출력하는 적어도 하나의 기능 네트워크, 및
    상기 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 -
    을 포함하는 것인, 시스템.
  19. 청구항 15 또는 청구항 16에 있어서,
    상기 적어도 하나의 분류기 네트워크의 제1 분류기 네트워크는 커널 포인트 콘볼루션 기반의 네트워크이고, 상기 커널 포인트 콘볼루션 기반의 네트워크는:
    상기 적어도 2개의 LiDAR 포인트 클라우드를 수신하고 복수의 특징 벡터를 출력하는 커널 포인트 콘볼루션 기반의 인코더,
    상기 복수의 특징 벡터를 수신하고 상기 복수의 특징 벡터를 단일 특징 벡터로 집계하는 집계 함수, 및
    상기 단일 특징 벡터를 수신하고 분류 데이터세트를 출력하는 완전 연결 계층 - 상기 적어도 하나의 출력 데이터세트는 상기 분류 데이터세트를 포함함 -
    을 포함하는 것인, 시스템.
  20. 명령어들을 저장한 적어도 하나의 비일시적 저장 매체에 있어서,
    상기 명령어들은 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금:
    적어도 2개의 LiDAR 포인트 클라우드를 획득하고;
    적어도 하나의 분류기 네트워크를 사용하여 상기 적어도 2개의 LiDAR 포인트 클라우드를 프로세싱하고;
    상기 적어도 하나의 분류기 네트워크로부터 적어도 하나의 출력 데이터세트를 획득하고;
    상기 적어도 하나의 출력 데이터세트에 기초하여 상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하고;
    상기 적어도 2개의 LiDAR 포인트 클라우드가 오정렬됨을 결정하는 것에 기초하여 제1 액션을 수행하게 하는 것인, 적어도 하나의 비일시적 저장 매체.
KR1020220113958A 2021-09-08 2022-09-08 머신 러닝 기반의 포인트 클라우드 정렬 분류 KR20230037002A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163261014P 2021-09-08 2021-09-08
US63/261,014 2021-09-08
US17/744,052 US20230074860A1 (en) 2021-09-08 2022-05-13 Machine learning-based point cloud alignment classification
US17/744,052 2022-05-13

Publications (1)

Publication Number Publication Date
KR20230037002A true KR20230037002A (ko) 2023-03-15

Family

ID=83933331

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220113958A KR20230037002A (ko) 2021-09-08 2022-09-08 머신 러닝 기반의 포인트 클라우드 정렬 분류

Country Status (5)

Country Link
US (1) US20230074860A1 (ko)
KR (1) KR20230037002A (ko)
CN (1) CN115797679A (ko)
DE (1) DE102022122456A1 (ko)
GB (1) GB2612878A (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240054660A1 (en) * 2022-08-11 2024-02-15 Motional Ad Llc Point cloud alignment systems for generating high definition maps for vehicle navigation
CN117368876B (zh) * 2023-10-18 2024-03-29 广州易而达科技股份有限公司 一种人体检测方法、装置、设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9760996B2 (en) * 2015-08-11 2017-09-12 Nokia Technologies Oy Non-rigid registration for large-scale space-time 3D point cloud alignment
EP3324209A1 (en) * 2016-11-18 2018-05-23 Dibotics Methods and systems for vehicle environment map generation and updating
CN113096167A (zh) * 2019-12-23 2021-07-09 阿里巴巴集团控股有限公司 一种点云对齐方法、装置和设备
GB2614379A (en) * 2020-01-03 2023-07-05 Mobileye Vision Technologies Ltd Systems and methods for vehicle navigation

Also Published As

Publication number Publication date
DE102022122456A1 (de) 2023-03-09
CN115797679A (zh) 2023-03-14
US20230074860A1 (en) 2023-03-09
GB2612878A8 (en) 2023-11-22
GB202212956D0 (en) 2022-10-19
GB2612878A (en) 2023-05-17

Similar Documents

Publication Publication Date Title
KR102628736B1 (ko) 딥 러닝 기반 카메라 교정
US11527085B1 (en) Multi-modal segmentation network for enhanced semantic labeling in mapping
KR20230037002A (ko) 머신 러닝 기반의 포인트 클라우드 정렬 분류
US20230360379A1 (en) Track segment cleaning of tracked objects
KR20230023530A (ko) 신뢰할 수 없는 맵 주석 입력들을 사용하는 센서 데이터의 시맨틱 주석 달기
KR20230120974A (ko) 레이더를 사용하여 로컬화 및 차선 검출을 위한 연석 기반의 특징 추출
US20240054661A1 (en) Point cloud alignment systems for generating high definition maps for vehicle navigation
WO2023249857A1 (en) Semi-closed loop rollouts for data augmentation
US20230109909A1 (en) Object detection using radar and lidar fusion
US20230159033A1 (en) High fidelity data-driven multi-modal simulation
KR20230042430A (ko) 자율 주행 차량에 대한 안전이 중요한 시나리오의 식별을 위한 학습
US11727671B1 (en) Efficient and optimal feature extraction from observations
US11643108B1 (en) Generating corrected future maneuver parameters in a planner
US20230169780A1 (en) Automatically detecting traffic signals using sensor data
US20230237679A1 (en) Aligning geodata graph over electronic maps
US20240127603A1 (en) Unified framework and tooling for lane boundary annotation
WO2024086056A1 (en) Identifying new classes of objects in environments of vehicles
WO2023146788A1 (en) Semantic annotation of sensor data with overlapping physical features
WO2024030384A1 (en) Object orientation determination from map and group parameters
WO2023146801A1 (en) Correcting multi-zone motion blur