KR20220083533A - LiDAR 정보와 카메라 정보의 병합 - Google Patents

LiDAR 정보와 카메라 정보의 병합 Download PDF

Info

Publication number
KR20220083533A
KR20220083533A KR1020210005172A KR20210005172A KR20220083533A KR 20220083533 A KR20220083533 A KR 20220083533A KR 1020210005172 A KR1020210005172 A KR 1020210005172A KR 20210005172 A KR20210005172 A KR 20210005172A KR 20220083533 A KR20220083533 A KR 20220083533A
Authority
KR
South Korea
Prior art keywords
information
vehicle
lidar
camera
processor
Prior art date
Application number
KR1020210005172A
Other languages
English (en)
Other versions
KR102476931B1 (ko
Inventor
종호 이
Original Assignee
모셔널 에이디 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모셔널 에이디 엘엘씨 filed Critical 모셔널 에이디 엘엘씨
Publication of KR20220083533A publication Critical patent/KR20220083533A/ko
Priority to KR1020220165571A priority Critical patent/KR20220167263A/ko
Application granted granted Critical
Publication of KR102476931B1 publication Critical patent/KR102476931B1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0015Planning or execution of driving tasks specially adapted for safety
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/93Lidar systems specially adapted for specific applications for anti-collision purposes
    • G01S17/931Lidar systems specially adapted for specific applications for anti-collision purposes of land vehicles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/02Systems using the reflection of electromagnetic waves other than radio waves
    • G01S17/06Systems determining position data of a target
    • G01S17/08Systems determining position data of a target for measuring distance only
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/02Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/09Taking automatic action to avoid collision, e.g. braking and steering
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/095Predicting travel path or likelihood of collision
    • B60W30/0956Predicting travel path or likelihood of collision the prediction being responsive to traffic or environmental parameters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/02Systems using the reflection of electromagnetic waves other than radio waves
    • G01S17/06Systems determining position data of a target
    • G01S17/42Simultaneous measurement of distance and other co-ordinates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/86Combinations of lidar systems with systems other than lidar, radar or sonar, e.g. with direction finders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/87Combinations of systems using electromagnetic waves other than radio waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/89Lidar systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/89Lidar systems specially adapted for specific applications for mapping or imaging
    • G01S17/8943D imaging with simultaneous measurement of time-of-flight at a 2D array of receiver pixels, e.g. time-of-flight cameras or flash lidar
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/48Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
    • G01S7/4802Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/803Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/584Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/57Mechanical or electrical details of cameras or camera modules specially adapted for being embedded in other devices
    • H04N5/2257
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0002Automatic control, details of type of controller or control system architecture
    • B60W2050/0004In digital systems, e.g. discrete-time systems involving sampling
    • B60W2050/0005Processor details or data handling, e.g. memory registers or chip architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0043Signal treatments, identification of variables or parameters, parameter estimation or state estimation
    • B60W2050/0052Filtering, filters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2420/00Indexing codes relating to the type of sensors based on the principle of their operation
    • B60W2420/40Photo or light sensitive means, e.g. infrared sensors
    • B60W2420/403Image sensing, e.g. optical camera
    • B60W2420/408
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2420/00Indexing codes relating to the type of sensors based on the principle of their operation
    • B60W2420/42Image sensing, e.g. optical camera
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2420/00Indexing codes relating to the type of sensors based on the principle of their operation
    • B60W2420/52Radar, Lidar
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/40Dynamic objects, e.g. animals, windblown objects
    • B60W2554/404Characteristics
    • B60W2554/4041Position
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2555/00Input parameters relating to exterior conditions, not covered by groups B60W2552/00, B60W2554/00
    • B60W2555/60Traffic rules, e.g. speed limits or right of way

Abstract

무엇보다도, 자율적인 주석 달기를 위해 LiDAR 정보와 카메라 정보를 병합하기 위한 기술이 설명되어 있다. 이 기술은 전자기 방사선을 검출하도록 구성된 적어도 하나의 LiDAR 디바이스; 차량에 근접한 대상체의 카메라 정보를 생성하도록 구성된 적어도 하나의 카메라; 컴퓨터 실행 가능 명령어를 저장하는 적어도 하나의 컴퓨터 판독 가능 매체; 적어도 하나의 LiDAR 디바이스 및 적어도 하나의 카메라에 통신 가능하게 결합된 적어도 하나의 프로세서 및 적어도 하나의 프로세서에 통신 가능하게 결합된 제어 회로 - 제어 회로는 대상체의 위치에 기초하여 차량을 동작시키도록 구성됨 - 를 포함하는 차량을 포함한다.

Description

LiDAR 정보와 카메라 정보의 병합{MERGING LiDAR INFORMATION AND CAMERA INFORMATION}
본 설명은 LiDAR 정보와 카메라 정보를 병합하는 것에 관한 것이다.
세그먼트화 및 주석 달기(annotation)가 환경과 연관된 정보에 의해 표현되는 환경의 영역 - 환경의 영역은 특정 특징부 또는 대상체와 연관됨 - 을 식별하기 위한 프로세스에 수반될 수 있다. 예를 들어, 차량에 의해 나중에 사용하기 위해 환경의 이미지를 세그먼트화하고 이에 주석을 달 때, 교통 신호등, 정지 표지판, 차량, 및 보행자와 같은 특정 특징부를 식별하기 위해 이미지가 분석될 수 있다. 식별된 특징부에 기초하여 이미지에 주석을 달거나 레이블링할 수 있다. 그렇지만, 특히 환경이 복잡할 때, 환경의 특정 영역을 식별하기 위한 프로세스에서 인간 개입이 수반될 수 있으며, 이는 주석 달기 작업에 상당한 시간과 비용을 추가할 수 있다.
도 1은 자율 주행 능력(autonomous capability)을 갖는 자율 주행 차량(autonomous vehicle)의 예를 도시한다.
도 2는 예시적인 "클라우드" 컴퓨팅 환경을 도시한다.
도 3는 컴퓨터 시스템을 도시한다.
도 4는 자율 주행 차량에 대한 예시적인 아키텍처를 도시한다.
도 5는 인지 모듈에 의해 사용될 수 있는 입력 및 출력의 예를 도시한다.
도 6은 LiDAR 시스템의 예를 도시한다.
도 7은 동작 중인 LiDAR 시스템을 도시한다.
도 8은 LiDAR 시스템의 동작을 추가적으로 상세하게 도시한다.
도 9는 계획 모듈의 입력과 출력 사이의 관계의 블록 다이어그램을 도시한다.
도 10은 경로 계획에서 사용되는 방향 그래프(directed graph)를 도시한다.
도 11은 제어 모듈의 입력 및 출력의 블록 다이어그램을 도시한다.
도 12는 제어기의 입력, 출력, 및 컴포넌트의 블록 다이어그램을 도시한다.
도 13a 및 도 13b는 LiDAR 센서를 갖는 차량 및 LiDAR 센서를 사용하여 생성된 LiDAR 정보를 도시한다.
도 14a 및 도 14b는 카메라를 갖는 차량 및 카메라를 사용하여 생성된 카메라 정보를 도시한다.
도 15a 내지 도 15d는 LiDAR 정보를 획득하는 것과 카메라로부터 카메라 정보를 획득하는 것 사이의 타이밍 시퀀스를 도시한다.
도 16a는 LiDAR 정보와 카메라 정보 간의 병합 프로세스를 예시한다.
도 16b는 LiDAR 정보와 카메라 정보를 사용하는 합성 이미지를 도시한다.
도 16c는 교통 신호등과 연관된 LiDAR 정보의 LiDAR 포인트를 도시한다.
도 16d는 LiDAR 포인트와 연관된 LiDAR 정보를 도시한다.
도 17a 내지 도 17f는 LiDAR 정보와 카메라 정보를 사용하는 360도 합성 이미지를 도시한다.
도 18은 병합 프로세스의 블록 다이어그램을 도시한다.
도 19a 및 도 19b는 주석이 달린 교통 신호등 맵을 도시한다.
도 20은 병합 프로세스에 대한 플로차트이다.
설명을 위한 이하의 기술에서는, 본 발명에 대한 완전한 이해를 제공하기 위해 다수의 특정한 세부 사항이 기재된다. 그렇지만, 본 발명이 이러한 특정 세부 사항 없이 실시될 수 있음이 명백할 것이다. 다른 경우에, 공지된 구조 및 디바이스는 본 발명을 불필요하게 모호하게 하는 것을 피하기 위하여 블록 다이어그램 형태로 도시된다.
도면에서, 설명을 용이하게 하기 위해, 디바이스, 모듈, 명령 블록 및 데이터 요소를 나타내는 것과 같은 개략적 요소의 특정 배열 또는 순서가 도시된다. 그렇지만, 본 기술 분야의 통상의 기술자라면, 도면에서의 개략적 요소의 특정 순서 또는 배열이 프로세싱의 특정한 순서 또는 시퀀스, 또는 프로세스의 분리가 요구됨을 암시한다는 것을 의미하지는 않는다는 점을 이해할 것이다. 게다가, 도면에 개략적 요소를 포함시키는 것은, 그러한 요소가 모든 실시예에서 요구됨을 암시한다는 것을 의미하지 않거나, 또는 그러한 요소에 의해 표현된 특징이 일부 실시예에서 포함되지 않을 수 있거나 다른 요소와 조합되지 않을 수 있음을 암시한다는 것을 의미하지 않는다.
또한, 도면에서, 2개 이상의 다른 개략적 요소 사이의 연결, 관계 또는 연관을 보여주기 위해 실선 또는 파선 또는 화살표와 같은 연결 요소가 사용되는 경우에, 임의의 그러한 연결 요소의 부재가 연결, 관계 또는 연관이 존재할 수 없다는 것을 암시하는 것을 의미하지 않는다. 환언하면, 요소들 사이의 일부 연결, 관계 또는 연관은 본 개시를 모호하게 하지 않기 위해 도면에 도시되어 있지 않다. 추가적으로, 예시를 용이하게 하기 위해, 요소들 사이의 다수의 연결, 관계 또는 연관을 나타내기 위해 단일의 연결 요소가 사용된다. 예를 들어, 연결 요소가 신호, 데이터 또는 명령의 통신을 나타내는 경우에, 본 기술 분야의 통상의 기술자라면, 그러한 요소가, 통신을 수행하기 위해 필요할 수 있는, 하나 또는 다수의 신호 경로(예를 들면, 버스)를 나타낸다는 것을 이해할 것이다.
그 예가 첨부된 도면에 예시된 실시예가 이제 상세하게 언급될 것이다. 이하의 상세한 설명에서, 다양한 기술된 실시예에 대한 완전한 이해를 제공하기 위해 많은 특정 세부 사항이 기재된다. 그렇지만, 다양한 기술된 실시예가 이러한 특정 세부 사항 없이 실시될 수 있다는 것이 본 기술 분야의 통상의 기술자에게 명백할 것이다. 다른 경우에, 실시예의 양태를 불필요하게 모호하게 하지 않기 위해 공지된 방법, 절차, 컴포넌트, 회로, 및 네트워크는 상세히 기술되지 않았다.
서로 독립적으로 또는 다른 특징들의 임의의 조합과 함께 각각 사용될 수 있는 여러 특징이 이하에 기술된다. 그렇지만, 임의의 개별 특징은 위에서 논의된 문제들 중 임의의 것을 해결할 수 없거나 또는 위에서 논의된 문제들 중 단지 하나만을 해결할 수 있다. 위에서 논의된 문제들 중 일부가 본원에 기술된 특징들 중 임의의 것에 의해 완전히 해결되지는 않을 수 있다. 비록 여러 표제가 제공되어 있더라도, 특정 표제에 관련되지만 해당 표제를 갖는 섹션에서 발견되지는 않는 정보가 본 설명의 다른 곳에서 발견될 수도 있다. 실시예는 이하의 개요에 따라 본원에 기술된다:
1. 일반적 개관
2. 시스템 개관
3. 자율 주행 차량 아키텍처
4. 자율 주행 차량 입력
5. 자율 주행 차량 계획
6. 자율 주행 차량 제어
7. LiDAR 정보와 카메라 정보의 병합
일반적 개관
주석 시스템은 카메라로부터 대상체까지의 거리와 대상체의 기하학적 특징 둘 모두를 결정하기 위해 카메라에 의해 캡처된 카메라 정보(예를 들면, 차량 상의 카메라로부터의 이미지)에 LiDAR 정보를 매핑하는 데 사용될 수 있다. 이 정보는 대상체의 물리적 위치 및 배향과 함께 높은 신뢰도로 대상체(특히 고정된 대상체)의 정체(identity)를 결정하기 위해 (예를 들면, 차량의 적어도 하나의 시스템에 의해) 나중에 사용될 수 있다.
예를 들어, 이 정보는 교통 신호등과 같은 대상체가 차량으로부터 2.5m 떨어져 있고 다가오는 교통을 향해 배향되어 있다고 결정하기 위해 나중에 사용될 수 있다. 차량이 교통 신호등 아래를 지나갈 때 차량은 그러면 교통 신호등을 제 시간에 추적할 수 있고, 따라서 교통 신호등의 실시간 정보를 제공할 수 있다. 게다가, 다른 차량에 의해 액세스 가능한 월드 맵에 교통 신호등에 대한 정보를 저장하는 것에 의해, 각각의 차량은 대상체의 위치와 배향을 수신할 수 있는 것은 물론 변경이 필요한지(예를 들면, 대상체의 위치 또는 배향이 변했는지)를 확인 및/또는 업데이트할 수 있다. 예를 들어, 월드 맵이 차량이 교통 신호등에 접근하고 있음을 나타낼 때, 카메라는 교통 신호등이 예견되는 차량 전방의 영역에 초점을 맞추고 교통 신호등의 교통 신호를 결정할 준비를 할 수 있다.
LiDAR 정보와 카메라 정보의 조합을 사용하여 교통 신호등의 위치와 배향을 자율적으로 검출하는 것에 의해, 인간 주석 달기에 대한 의존도(reliance)가 줄어든다. 게다가, 결합된 접근법은 LiDAR 정보 또는 카메라 정보 중 어느 하나를 독립적으로 사용하는 것보다 훨씬 더 높은 정확도를 결과한다. 결합된 접근법은 또한 새로운 장비를 필요로 하지 않고 차량 상의 기존의 카메라와 LiDAR 센서를 활용한다. 게다가, 차량의 주행 속력을 고려함으로써, 본 시스템은 LiDAR 시스템과 카메라 시스템 간의 시야 차이를 보상할 수 있다.
시스템 개관
도 1은 자율 주행 능력을 갖는 자율 주행 차량(100)의 일 예를 도시한다.
본원에서 사용되는 바와 같이, "자율 주행 능력"이라는 용어는, 완전한 자율 주행 차량, 고도의 자율 주행 차량, 및 조건부 자율 주행 차량을 제한 없이 포함하는, 실시간 인간 개입 없이 차량이 부분적으로 또는 완전하게 동작할 수 있게 하는 기능, 특징, 또는 설비를 지칭한다.
본원에서 사용되는 바와 같이, 자율 주행 차량(AV)은 자율 주행 능력을 갖는 차량이다.
본원에서 사용되는 바와 같이, "차량"은 상품 또는 사람의 운송 수단을 포함한다. 예를 들어, 자동차, 버스, 기차, 비행기, 드론, 트럭, 보트, 선박, 잠수함, 비행선 등. 무인 자동차는 차량의 예이다.
본원에서 사용되는 바와 같이, "궤적"은 AV를 제1 시공간적 위치로부터 제2 시공간적 위치로 운행시키는 경로 또는 루트를 지칭한다. 일 실시예에서, 제1 시공간적 위치는 초기 또는 시작 위치라고 지칭되고 제2 시공간적 위치는 목적지, 최종 위치, 목표, 목표 위치, 또는 목표 장소라고 지칭된다. 일부 예에서, 궤적은 하나 이상의 세그먼트(예를 들면, 도로의 섹션)로 구성되고, 각각의 세그먼트는 하나 이상의 블록(예를 들면, 차선 또는 교차로의 부분)으로 구성된다. 일 실시예에서, 시공간적 위치는 현실 세계 위치에 대응한다. 예를 들어, 시공간적 위치는 사람을 태우거나 내려주고 또는 상품을 싣거나 내리는 픽업(pick up) 위치 또는 드롭 오프(drop-off) 위치이다.
본원에서 사용되는 바와 같이, "센서(들)"는 센서를 둘러싸는 환경에 관한 정보를 검출하는 하나 이상의 하드웨어 컴포넌트를 포함한다. 하드웨어 컴포넌트들 중 일부는 감지 컴포넌트(예를 들면, 이미지 센서, 생체 측정 센서), 송신 및/또는 수신 컴포넌트(예를 들면, 레이저 또는 라디오 주파수 파 송신기 및 수신기), 아날로그 대 디지털 변환기와 같은 전자 컴포넌트, 데이터 저장 디바이스(예컨대, RAM 및/또는 비휘발성 스토리지), 소프트웨어 또는 펌웨어 컴포넌트, 및 ASIC(application-specific integrated circuit), 마이크로프로세서 및/또는 마이크로컨트롤러와 같은 데이터 프로세싱 컴포넌트를 포함할 수 있다.
본원에서 사용되는 바와 같이, "장면 묘사(scene description)"는 AV 차량 상의 하나 이상의 센서에 의해 검출되거나 AV 외부의 소스에 의해 제공되는 하나 이상의 분류된 또는 레이블링된 대상체를 포함하는 데이터 구조(예를 들면, 리스트) 또는 데이터 스트림이다.
본원에서 사용되는 바와 같이, "도로"는 차량에 의해 횡단될 수 있는 물리적 영역이고, 명명된 주요 도로(예를 들면, 도시 거리, 주간 프리웨이(interstate freeway) 등)에 대응할 수 있거나, 또는 명명되지 않은 주요 도로(예를 들면, 주택 또는 사무실 건물 내의 사유 도로, 주차장 섹션, 공터 섹션, 시골 지역의 비포장 경로 등)에 대응할 수 있다. 일부 차량(예를 들면, 4륜 구동 픽업 트럭, 스포츠 유틸리티 차량 등)은 차량 주행에 특히 적합하지 않은 다양한 물리적 영역을 횡단할 수 있기 때문에, "도로"는 임의의 지자체 또는 다른 정부 또는 행정처에 의해 주요 도로로서 공식적으로 규정되지 않은 물리적 영역일 수 있다.
본원에서 사용되는 바와 같이, "차선"은 차량에 의해 횡단될 수 있는 도로의 일 부분이다. 차선은 때때로 차선 마킹(lane marking)에 기초하여 식별된다. 예를 들어, 차선은 차선 마킹 사이의 공간의 대부분 또는 전부에 대응할 수 있거나, 또는 차선 마킹 사이의 공간의 단지 일부(예를 들면, 50% 미만)에 대응할 수 있다. 예를 들어, 멀리 이격된 차선 마킹을 갖는 도로는 차선 마킹들 사이에 둘 이상의 차량을 수용할 수 있어서, 하나의 차량이 차선 마킹을 횡단하지 않으면서 다른 차량을 추월할 수 있고, 따라서 차선 마킹들 사이의 공간보다 더 좁은 차선을 갖거나 차선 마킹들 사이에 2개의 차선을 갖는 것으로 해석될 수 있다. 차선은 차선 마킹의 부재 시에도 해석될 수 있다. 예를 들어, 차선은 환경의 물리적 특징부, 예를 들면, 시골 지역에서의 주요 도로를 따라 있는 바위 및 나무 또는, 예를 들면, 미개발 지역에서의 피할 자연 장애물에 기초하여 규정될 수 있다. 차선은 또한 차선 마킹 또는 물리적 특징부와 무관하게 해석될 수 있다. 예를 들어, 차선은 차선 경계로서 해석될 특징부가 달리 없는 영역에서 장애물이 없는 임의의 경로에 기초하여 해석될 수 있다. 예시적인 시나리오에서, AV는 들판 또는 공터의 장애물 없는 부분을 통해 차선을 해석할 수 있다. 다른 예시적인 시나리오에서, AV는 차선 마킹을 갖지 않는 넓은(예를 들면, 2개 이상의 차선을 위해 충분히 넓은) 도로를 통해 차선을 해석할 수 있다. 이 시나리오에서, AV는 차선에 관한 정보를 다른 AV에 통신할 수 있어서, 다른 AV가 동일한 차선 정보를 사용하여 그 자신들 간에 경로 계획을 조정할 수 있다.
"OTA(over-the-air) 클라이언트"라는 용어는 임의의 AV, 또는 AV에 내장되거나, AV에 결합되거나, 또는 AV와 통신하는 임의의 전자 디바이스(예를 들면, 컴퓨터, 컨트롤러, IoT 디바이스, 전자 제어 유닛(ECU))를 포함한다.
"OTA(over-the-air) 업데이트"라는 용어는, 셀룰러 모바일 통신(예를 들면, 2G, 3G, 4G, 5G), 라디오 무선 영역 네트워크(예를 들면, WiFi) 및/또는 위성 인터넷을 포함하지만 이에 제한되지 않는, 독점적인 및/또는 표준화된 무선 통신 기술을 사용하여 OTA 클라이언트에 전달되는 소프트웨어, 펌웨어, 데이터 또는 구성 설정, 또는 이들의 임의의 조합에 대한 임의의 업데이트, 변경, 삭제, 또는 추가를 의미한다.
"에지 노드"라는 용어는 AV와 통신하기 위한 포털을 제공하고 OTA 업데이트를 스케줄링하여 OTA 클라이언트에 전달하기 위해 다른 에지 노드 및 클라우드 기반 컴퓨팅 플랫폼과 통신할 수 있는 네트워크에 결합된 하나 이상의 에지 디바이스를 의미한다.
"에지 디바이스"라는 용어는 에지 노드를 구현하고 기업 또는 서비스 제공자(예를 들면, VERIZON, AT&T) 코어 네트워크에 물리적 무선 액세스 포인트(AP)를 제공하는 디바이스를 의미한다. 에지 디바이스의 예는 컴퓨터, 제어기, 송신기, 라우터, 라우팅 스위치, IAD(integrated access device), 멀티플렉서, MAN(metropolitan area network) 및 WAN(wide area network) 액세스 디바이스를 포함하지만, 이에 제한되지 않는다.
"하나 이상"은 하나의 요소에 의해 수행되는 기능, 둘 이상의 요소에 의해, 예를 들어, 분산 방식으로, 수행되는 기능, 하나의 요소에 의해 수행되는 여러 기능, 여러 요소에 의해 수행되는 여러 기능, 또는 이들의 임의의 조합을 포함한다.
또한, 제1, 제2 등의 용어가, 일부 예에서, 다양한 요소를 기술하기 위해 본원에서 사용되고 있지만, 이러한 요소가 이러한 용어에 의해 제한되지 않아야 한다는 것이 이해될 것이다. 이러한 용어는 하나의 요소를 다른 요소와 구별하는 데만 사용된다. 예를 들어, 기술된 다양한 실시예의 범위를 벗어나지 않으면서, 제1 접촉은 제2 접촉이라고 지칭될 수 있고, 유사하게 제2 접촉은 제1 접촉이라고 지칭될 수 있다. 제1 접촉과 제2 접촉 둘 모두가 접촉이지만, 동일한 접촉은 아니다.
본원에 기술된 다양한 실시예의 설명에서 사용된 용어는 단지 특정한 실시예를 기술하기 위한 것이며, 제한하는 것으로 의도되지 않는다. 기술된 다양한 실시예 및 첨부된 청구항의 설명에서 사용되는 바와 같이, 단수형은, 문맥이 달리 명확히 표시하지 않는 한, 복수형을 포함하는 것으로 의도되어 있다. "및/또는"이라는 용어가, 본원에서 사용되는 바와 같이, 열거된 연관 항목들 중 하나 이상의 항목의 임의의 및 모든 가능한 조합을 지칭하고 포함한다는 것이 또한 이해될 것이다. 게다가, "포함한다" 및/또는 "포함하는"이라는 용어가, 본 설명에서 사용될 때, 언급된 특징, 정수, 단계, 동작, 요소, 및/또는 컴포넌트의 존재를 명기하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 컴포넌트, 및/또는 그의 그룹의 존재 또는 추가를 배제하지 않는다는 것이 이해될 것이다.
본원에서 사용되는 바와 같이, "~ 경우"라는 용어는 선택적으로 문맥에 따라 "~할 때", 또는 "~시에" 또는 "결정에 응답하여" 또는 "검출에 응답하여"를 의미하는 것으로 해석된다. 마찬가지로, 문구 "~라고 결정된다면" 또는 "[언급된 조건 또는 이벤트]가 검출되는 경우"는 선택적으로 문맥에 따라, "결정할 시에" 또는 "결정에 응답하여" 또는 "[언급된 조건 또는 이벤트]의 검출 시에" 또는 "[언급된 조건 또는 이벤트]의 검출에 응답하여"를 의미하는 것으로 해석된다.
본원에서 사용되는 바와 같이, AV 시스템은 AV의 동작을 지원하는 하드웨어, 소프트웨어, 저장 데이터 및 실시간으로 생성된 데이터의 어레이와 함께 AV를 지칭한다. 일 실시예에서, AV 시스템은 AV 내에 포함된다. 일 실시예에서, AV 시스템은 여러 위치에 걸쳐 확산되어 있다. 예를 들어, AV 시스템의 소프트웨어 중 일부는 도 3와 관련하여 아래에서 기술되는 클라우드 컴퓨팅 환경(300)과 유사한 클라우드 컴퓨팅 환경 상에 구현된다.
일반적으로, 본원은 완전한 자율 주행 차량, 고도의 자율 주행 차량, 및 조건부 자율 주행 차량, 예를 들어, 각각 소위 레벨 5 차량, 레벨 4 차량 및 레벨 3 차량을 포함하는 하나 이상의 자율 주행 능력을 갖는 임의의 차량에 적용 가능한 기술을 개시한다(차량의 자율성의 레벨 분류에 대한 세부 사항은 본원에 그 전체가 참조로 포함된, SAE 국제 표준 J3016: 온로드 자동차 자동 운전 시스템에 관한 용어의 분류 및 정의(Taxonomy and Definitions for Terms Related to On-128-172020-02-28 Road Motor Vehicle Automated Driving Systems) 참조). 또한, 본원에서 개시된 기술은 부분적 자율 주행 차량 및 운전자 보조 차량, 예컨대, 소위 레벨 2 및 레벨 1 차량에도 적용 가능하다(SAE 국제 표준 J3016: 온로드 자동차 자동 운전 시스템에 관한 용어의 분류 및 정의 참조). 일 실시예에서, 레벨 1, 레벨 2, 레벨 3, 레벨 4 및 레벨 5 차량 시스템 중 하나 이상은 센서 입력의 프로세싱에 기초하여 특정의 동작 조건 하에서 특정의 차량 동작(예를 들면, 조향, 제동, 및 맵 사용)을 자동화할 수 있다. 본 문서에서 설명된 기술은, 완전한 자율 주행 차량으로부터 인간 운전 차량에 이르는, 임의의 레벨에 있는 차량에 혜택을 줄 수 있다.
자율 주행 차량은 사람 운전자를 필요로 하는 차량보다 장점이 있다. 한 가지 장점은 안전성이다. 예를 들어, 2016년에, 미국은 9100억 달러의 사회적 비용으로 추정되는 600만 건의 자동차 사고, 240만 건의 부상, 4만 명의 사망자, 및 1300만 건의 차량 충돌을 경험했다. 1억 마일 주행당 미국 교통 사망자수는, 부분적으로 차량에 설치된 추가적인 안전 대책으로 인해, 1965년과 2015년 사이에 약 6명으로부터 1명으로 줄었다. 예를 들어, 충돌이 발생할 것이라는 추가적인 0.5초의 경고는 전후 충돌의 60%를 완화시키는 것으로 여겨진다. 그렇지만, 수동적 안전 특징부(예를 들면, 안전 벨트, 에어백)는 이 수치를 개선시키는 데 한계에 도달했을 것이다. 따라서 차량의 자동 제어와 같은, 능동적 안전 대책이 이러한 통계치를 개선시키는 데 유망한 다음 단계이다. 인간 운전자가 충돌의 95%에서 중요한 충돌전 사건에 책임있는 것으로 여겨지기 때문에, 자동 운전 시스템은, 예를 들어, 중요한 상황을 인간보다 잘 신뢰성 있게 인식하고 피하는 것에 의해; 더 나은 의사 결정을 하고, 교통 법규를 준수하며, 미래의 사건을 인간보다 더 잘 예측하는 것에 의해; 그리고 차량을 인간보다 더 잘 신뢰성 있게 제어하는 것에 의해 더 나은 안전성 결과를 달성할 수 있다.
도 1을 참조하면, AV 시스템(120)은, 대상체(예를 들면, 자연 장애물(191), 차량(193), 보행자(192), 자전거 타는 사람, 및 다른 장애물)을 피하고 도로 법규(예를 들면, 동작 규칙 또는 운전 선호사항)를 준수하면서, AV(100)를 궤적(198)을 따라 환경(190)을 통과하여 목적지(199)(때때로 최종 위치라고 지칭됨)로 동작시킨다.
일 실시예에서, AV 시스템(120)은 컴퓨터 프로세서(146)로부터 동작 커맨드를 수신하고 이에 따라 동작하도록 설비된 디바이스(101)를 포함한다. 차량이 액션(예를 들면, 운전 기동)을 수행하게 하는 실행가능 명령(또는 명령 세트)을 의미하기 위해 용어 "동작 커맨드"를 사용한다. 동작 커맨드는, 제한 없이, 차량이 전진을 시작하고, 전진을 중지하며, 후진을 시작하고, 후진을 중지하며, 가속하고, 감속하며, 좌회전을 수행하고, 우회전을 수행하기 위한 명령을 포함할 수 있다. 일 실시예에서, 컴퓨팅 프로세서(146)는 도 3을 참조하여 아래에서 기술되는 프로세서(304)와 유사하다. 디바이스(101)의 예는 조향 컨트롤(102), 브레이크(103), 기어, 가속기 페달 또는 다른 가속 제어 메커니즘, 윈드실드 와이퍼, 사이드 도어 락, 윈도 컨트롤, 및 방향 지시등을 포함한다.
일 실시예에서, AV 시스템(120)은 AV의 위치, 선속도와 각속도 및 선가속도와 각가속도, 및 헤딩(heading)(예를 들면, AV(100)의 선단의 배향)와 같은 AV(100)의 상태 또는 조건의 속성을 측정 또는 추론하기 위한 센서(121)를 포함한다. 센서(121)의 예는 GPS, 차량 선가속도 및 각도 변화율(angular rate) 둘 모두를 측정하는 IMU(inertial measurement unit), 휠 슬립률(wheel slip ratio)을 측정 또는 추정하기 위한 휠 속력 센서, 휠 브레이크 압력 또는 제동 토크 센서, 엔진 토크 또는 휠 토크 센서, 그리고 조향각 및 각도 변화율 센서이다.
일 실시예에서, 센서(121)는 AV의 환경의 속성을 감지 또는 측정하기 위한 센서를 또한 포함한다. 예를 들어, 가시광, 적외선 또는 열(또는 둘 모두) 스펙트럼의 단안 또는 스테레오 비디오 카메라(122), LiDAR(123), RADAR, 초음파 센서, TOF(time-of-flight) 깊이 센서, 속력 센서, 온도 센서, 습도 센서, 및 강우 센서.
일 실시예에서, AV 시스템(120)은 컴퓨터 프로세서(146)와 연관된 머신 명령 또는 센서(121)에 의해 수집된 데이터를 저장하기 위한 데이터 저장 유닛(142) 및 메모리(144)를 포함한다. 일 실시예에서, AV 시스템(120)은 도 13a 및 도 14a와 관련하여 아래에서 설명되는 이미지 병합 시스템을 포함한다. 일 실시예에서, 데이터 저장 유닛(142)은 도 3과 관련하여 아래에서 기술되는 ROM(308) 또는 저장 디바이스(310)와 유사하다. 일 실시예에서, 메모리(144)는 아래에서 기술되는 메인 메모리(306)와 유사하다. 일 실시예에서, 데이터 저장 유닛(142) 및 메모리(144)는 환경(190)에 관한 과거 정보, 실시간 정보, 및/또는 예측 정보를 저장한다. 일 실시예에서, 저장된 정보는 맵, 운전 성능, 교통 혼잡 업데이트 또는 기상 조건을 포함한다. 일 실시예에서, 환경(190)에 관한 데이터는 원격에 위치된 데이터베이스(134)로부터 통신 채널을 통해 AV(100)에 송신된다.
일 실시예에서, AV 시스템(120)은 다른 차량의 상태 및 조건, 예컨대, 위치, 선속도와 각속도, 선가속도와 각가속도, 및 AV(100)를 향한 선형 헤딩(linear heading)과 각도 헤딩(angular heading)의 측정된 또는 추론된 속성을 통신하기 위한 통신 디바이스(140)를 포함한다. 이러한 디바이스는 V2V(Vehicle-to-Vehicle) 및 V2I(Vehicle-to-Infrastructure) 통신 디바이스 및 포인트-투-포인트(point-to-point) 또는 애드혹(ad hoc) 네트워크 또는 둘 모두를 통한 무선 통신을 위한 디바이스를 포함한다. 일 실시예에서, 통신 디바이스(140)는 (라디오 및 광학 통신을 포함하는) 전자기 스펙트럼 또는 다른 매체(예를 들면, 공기 및 음향 매체)를 통해 통신한다. V2V(Vehicle-to-Vehicle), V2I(Vehicle-to-Infrastructure) 통신(및 일부 실시예에서, 하나 이상의 다른 유형의 통신)의 조합이 때때로 V2X(Vehicle-to-Everything) 통신이라고 지칭된다. V2X 통신은 전형적으로, 자율 주행 차량과의 통신 및 자율 주행 차량들 사이의 통신을 위한 하나 이상의 통신 표준을 준수한다.
일 실시예에서, 통신 디바이스(140)는 통신 인터페이스를 포함한다. 예를 들어, 유선, 무선, WiMAX, Wi-Fi, 블루투스, 위성, 셀룰러, 광학, 근거리, 적외선, 또는 라디오 인터페이스. 통신 인터페이스는 원격에 위치된 데이터베이스(134)로부터 AV 시스템(120)으로 데이터를 송신한다. 일 실시예에서, 원격에 위치된 데이터베이스(134)는 도 2에 기술된 바와 같은 클라우드 컴퓨팅 환경(200)에 내장된다. 통신 인터페이스(140)는 센서(121)로부터 수집된 데이터 또는 AV(100)의 동작에 관련된 다른 데이터를 원격에 위치된 데이터베이스(134)에 송신한다. 일 실시예에서, 통신 인터페이스(140)는 원격 운영(teleoperation)에 관련되는 정보를 AV(100)에 송신한다. 일부 실시예에서, AV(100)는 다른 원격(예를 들면, "클라우드") 서버(136)와 통신한다.
일 실시예에서, 원격에 위치된 데이터베이스(134)는 또한 디지털 데이터를 저장 및 송신한다(예를 들면, 도로 및 거리 위치와 같은 데이터를 저장함). 그러한 데이터는 AV(100) 상의 메모리(144)에 저장되거나, 원격에 위치된 데이터베이스(134)로부터 통신 채널을 통해 AV(100)에 송신된다.
일 실시예에서, 원격에 위치된 데이터베이스(134)는 유사한 시각(time of day)에 궤적(198)을 따라 이전에 주행한 적이 있는 차량의 운전 속성(예를 들면, 속력 프로파일 및 가속도 프로파일)에 관한 과거 정보를 저장 및 송신한다. 일 구현예에서, 그러한 데이터는 AV(100) 상의 메모리(144)에 저장될 수 있거나, 원격에 위치된 데이터베이스(134)로부터 통신 채널을 통해 AV(100)에 송신될 수 있다.
AV(100) 상에 위치된 컴퓨팅 디바이스(146)는 실시간 센서 데이터 및 사전 정보(prior information) 둘 모두에 기초한 제어 액션을 알고리즘적으로 생성하여, AV 시스템(120)이 자율 주행 운전 능력을 실행할 수 있게 한다.
일 실시예에서, AV 시스템(120)은 AV(100)의 사용자(예를 들면, 탑승자 또는 원격 사용자)에게 정보 및 경고를 제공하고 그로부터 입력을 수신하기 위해 컴퓨팅 디바이스(146)에 결합된 컴퓨터 주변기기(132)를 포함한다. 일 실시예에서, 주변기기(132)는 도 3을 참조하여 아래에서 논의되는 디스플레이(312), 입력 디바이스(314), 및 커서 컨트롤러(316)와 유사하다. 결합은 무선 또는 유선이다. 인터페이스 디바이스들 중 임의의 둘 이상이 단일 디바이스에 통합될 수 있다.
일 실시예에서, AV 시스템(120)은, 예를 들어, 승객에 의해 지정되거나 승객과 연관된 프로파일에 저장된, 승객의 프라이버시 레벨을 수신하고 시행한다. 승객의 프라이버시 레벨은 승객과 연관된 특정 정보(예를 들면, 승객 편의 데이터, 생체 측정 데이터 등)가 사용되도록, 승객 프로파일에 저장되도록, 그리고/또는 클라우드 서버(136)에 저장되어 승객 프로파일과 연관되도록 할 수 있는 방법을 결정한다. 일 실시예에서, 프라이버시 레벨은 일단 라이드(ride)가 완료되면 삭제되는 승객과 연관된 특정 정보를 지정한다. 일 실시예에서, 프라이버시 레벨은 승객과 연관된 특정 정보를 지정하고 정보에 액세스하도록 인가된 하나 이상의 엔티티를 식별해준다. 정보에 액세스하도록 인가되어 있는 지정된 엔티티의 예는 다른 AV, 서드파티 AV 시스템, 또는 정보에 잠재적으로 액세스할 수 있는 임의의 엔티티를 포함할 수 있다.
승객의 프라이버시 레벨은 하나 이상의 입도 레벨로 지정될 수 있다. 일 실시예에서, 프라이버시 레벨은 저장 또는 공유될 특정 정보를 식별해준다. 일 실시예에서, 승객이 자신의 개인 정보가 저장 또는 공유되지 않게 지정할 수 있도록 승객과 연관된 모든 정보에 프라이버시 레벨이 적용된다. 특정 정보에 액세스하도록 허용된 엔티티의 지정은 다양한 입도 레벨로 지정될 수 있다. 특정 정보에 액세스하도록 허용되는 다양한 엔티티 세트는, 예를 들어, 다른 AV, 클라우드 서버(136), 특정 서드파티 AV 시스템 등을 포함할 수 있다.
일 실시예에서, AV 시스템(120) 또는 클라우드 서버(136)는 승객과 연관된 특정 정보가 AV(100) 또는 다른 엔티티에 의해 액세스될 수 있는지를 결정한다. 예를 들어, 특정 시공간적 위치에 관련된 승객 입력에 액세스하려고 시도하는 서드파티 AV 시스템은 승객과 연관된 정보에 액세스하기 위해, 예를 들어, AV 시스템(120) 또는 클라우드 서버(136)로부터 인가를 획득해야 한다. 예를 들어, AV 시스템(120)은 시공간적 위치에 관련된 승객 입력이 서드파티 AV 시스템, AV(100), 또는 다른 AV에 제공될 수 있는지 여부를 결정하기 위해 승객의 지정된 프라이버시 레벨을 사용한다. 이것은 승객의 프라이버시 레벨이 어느 다른 엔티티가 승객의 액션에 관한 데이터 또는 승객과 연관된 다른 데이터를 수신하도록 허용되는지를 지정할 수 있게 한다.
도 2는 예시적인 "클라우드" 컴퓨팅 환경을 예시한다. 클라우드 컴퓨팅은 구성 가능한 컴퓨팅 리소스(예를 들면, 네트워크, 네트워크 대역폭, 서버, 프로세싱, 메모리, 스토리지, 애플리케이션, 가상 머신, 및 서비스)의 공유 풀에 대한 편리한 온-디맨드 네트워크 액세스를 가능하게 하기 위한 서비스 전달(service delivery)의 일 모델이다. 전형적인 클라우드 컴퓨팅 시스템에서는, 하나 이상의 대규모 클라우드 데이터 센터가 클라우드에 의해 제공되는 서비스를 전달하는 데 사용되는 머신을 수용한다. 이제 도 2를 참조하면, 클라우드 컴퓨팅 환경(200)은 클라우드(202)를 통해 상호연결되는 클라우드 데이터 센터(204a, 204b, 및 204c)를 포함한다. 데이터 센터(204a, 204b, 및 204c)는 클라우드 컴퓨팅 서비스를 클라우드(202)에 연결된 컴퓨터 시스템(206a, 206b, 206c, 206d, 206e, 및 206f)에 제공한다.
클라우드 컴퓨팅 환경(200)은 하나 이상의 클라우드 데이터 센터를 포함한다. 일반적으로, 클라우드 데이터 센터, 예를 들어, 도 2에 도시된 클라우드 데이터 센터(204a)는 클라우드, 예를 들어, 도 2에 도시된 클라우드(202) 또는 클라우드의 특정 부분을 구성하는 서버의 물리적 배열체를 지칭한다. 예를 들어, 서버는 클라우드 데이터 센터 내에 룸, 그룹, 로우(row), 및 랙(rack)으로 물리적으로 배열된다. 클라우드 데이터 센터는 하나 이상의 서버 룸을 포함하는 하나 이상의 구역(zone)을 갖는다. 각각의 룸은 하나 이상의 서버 로우를 가지며, 각각의 로우는 하나 이상의 랙을 포함한다. 각각의 랙은 하나 이상의 개별 서버 노드를 포함한다. 일부 구현예에서, 구역, 룸, 랙, 및/또는 로우 내의 서버는, 전력 요건, 에너지 요건, 열적 요건, 가열 요건, 및/또는 다른 요건을 포함하는, 데이터 센터 설비의 물리적 인프라스트럭처 요건에 기초하여 그룹으로 배열된다. 일 실시예에서, 서버 노드는 도 3에서 기술된 컴퓨터 시스템과 유사하다. 데이터 센터(204a)는 다수의 랙을 통해 분산된 다수의 컴퓨팅 시스템을 갖는다.
클라우드(202)는 클라우드 데이터 센터(204a, 204b, 및 204c)를 상호연결시키고 클라우드 컴퓨팅 서비스에 대한 컴퓨팅 시스템(206a 내지 206f)의 액세스를 용이하게 하는 것을 돕는 네트워크 및 네트워킹 리소스(예를 들어, 네트워킹 장비, 노드, 라우터, 스위치, 및 네트워킹 케이블)와 함께 클라우드 데이터 센터(204a, 204b, 및 204c)를 포함한다. 일 실시예에서, 네트워크는 지상 또는 위성 연결을 사용하여 배포된 유선 또는 무선 링크를 사용하여 결합된 하나 이상의 로컬 네트워크, 광역 네트워크, 또는 인터네트워크의 임의의 조합을 나타낸다. 네트워크를 거쳐 교환되는 데이터는, IP(Internet Protocol), MPLS(Multiprotocol Label Switching), ATM(Asynchronous Transfer Mode), 및 프레임 릴레이 등과 같은, 임의의 개수의 네트워크 계층 프로토콜을 사용하여 송신된다. 게다가, 네트워크가 다수의 서브 네트워크의 조합을 나타내는 실시예에서는, 기저 서브 네트워크(underlying sub-network) 각각에서 상이한 네트워크 계층 프로토콜이 사용된다. 일부 실시예에서, 네트워크는, 공중 인터넷과 같은, 하나 이상의 상호연결된 인터네트워크를 나타낸다.
컴퓨팅 시스템(206a 내지 206f) 또는 클라우드 컴퓨팅 서비스 소비자는 네트워크 링크 및 네트워크 어댑터를 통해 클라우드(202)에 연결된다. 일 실시예에서, 컴퓨팅 시스템(206a 내지 206f)은 다양한 컴퓨팅 디바이스, 예를 들어, 서버, 데스크톱, 랩톱, 태블릿, 스마트폰, IoT(Internet of Things) 디바이스, 자율 주행 차량(자동차, 드론, 셔틀, 기차, 버스 등을 포함함) 및 소비자 전자기기로서 구현된다. 일 실시예에서, 컴퓨팅 시스템(206a 내지 206f)은 다른 시스템 내에 또는 그 일부로서 구현된다.
도 3은 컴퓨터 시스템(300)을 예시한다. 일 구현예에서, 컴퓨터 시스템(300)은 특수 목적 컴퓨팅 디바이스이다. 특수 목적 컴퓨팅 디바이스는 기술을 수행하도록 고정-배선(hard-wired)되거나, 기술을 수행하도록 지속적으로 프로그래밍되는 하나 이상의 ASIC(application-specific integrated circuit) 또는 FPGA(field programmable gate array)와 같은 디지털 전자 디바이스를 포함하거나, 펌웨어, 메모리, 다른 스토리지 또는 조합 내의 프로그램 명령에 따라 기술을 수행하도록 프로그래밍되는 하나 이상의 범용 하드웨어 프로세서를 포함할 수 있다. 그러한 특수 목적 컴퓨팅 디바이스는 또한 커스텀 고정 배선 로직, ASIC, 또는 FPGA를 커스텀 프로그래밍과 조합하여 기술을 실현할 수 있다. 다양한 실시예에서, 특수 목적 컴퓨팅 디바이스는 기술을 구현하기 위한 고정 배선 및/또는 프로그램 로직을 포함하는 데스크톱 컴퓨터 시스템, 휴대용 컴퓨터 시스템, 핸드헬드 디바이스, 네트워크 디바이스, 또는 임의의 다른 디바이스이다.
일 실시예에서, 컴퓨터 시스템(300)은 정보를 통신하기 위한 버스(302) 또는 다른 통신 메커니즘, 및 정보를 프로세싱하기 위해 버스(302)와 결합된 하드웨어 프로세서(304)를 포함한다. 하드웨어 프로세서(304)는, 예를 들어, 범용 마이크로프로세서이다. 컴퓨터 시스템(300)은 프로세서(304)에 의해 실행될 명령 및 정보를 저장하기 위해 버스(302)에 결합된, RAM(random access memory) 또는 다른 동적 저장 디바이스와 같은, 메인 메모리(306)를 또한 포함한다. 일 구현예에서, 메인 메모리(306)는 프로세서(304)에 의해 실행될 명령의 실행 동안 임시 변수 또는 다른 중간 정보를 저장하는 데 사용된다. 그러한 명령은, 프로세서(304)에 의해 액세스 가능한 비-일시적 저장 매체에 저장되어 있을 때, 컴퓨터 시스템(300)을 명령에 지정된 동작을 수행하도록 커스터마이징된 특수 목적 머신으로 만든다.
일 실시예에서, 컴퓨터 시스템(300)은, 프로세서(304)를 위한 정적 정보 및 명령을 저장하기 위해 버스(302)에 결합된 ROM(read only memory)(308) 또는 다른 정적 저장 디바이스를 추가로 포함한다. 자기 디스크, 광학 디스크, 솔리드 스테이트 드라이브, 또는 3차원 크로스 포인트 메모리와 같은, 저장 디바이스(310)가 제공되고 정보 및 명령을 저장하기 위해 버스(302)에 결합된다.
일 실시예에서, 컴퓨터 시스템(300)은 버스(302)를 통해, 정보를 컴퓨터 사용자에게 디스플레이하기 위한 CRT(cathode ray tube), LCD(liquid crystal display), 플라스마 디스플레이, LED(light emitting diode) 디스플레이, 또는 OLED(organic light emitting diode) 디스플레이와 같은 디스플레이(312)에 결합된다. 문자 숫자식 키 및 다른 키를 포함하는 입력 디바이스(314)는 정보 및 커맨드 선택을 프로세서(304)에 통신하기 위해 버스(302)에 결합된다. 다른 유형의 사용자 입력 디바이스는 방향 정보 및 커맨드 선택을 프로세서(304)에 통신하고 디스플레이(312) 상에서의 커서 움직임을 제어하기 위한, 마우스, 트랙볼, 터치식 디스플레이, 또는 커서 방향 키와 같은, 커서 컨트롤러(316)이다. 이러한 입력 디바이스는 전형적으로, 디바이스가 평면에서의 위치를 지정할 수 있게 하는 2개의 축, 즉 제1 축(예를 들면, x-축) 및 제2 축(예를 들면, y-축)에서의 2 자유도를 갖는다.
일 실시예에 따르면, 본원에서의 기술은 프로세서(304)가 메인 메모리(306)에 포함된 하나 이상의 명령의 하나 이상의 시퀀스를 실행하는 것에 응답하여 컴퓨터 시스템(300)에 의해 수행된다. 그러한 명령은, 저장 디바이스(310)와 같은, 다른 저장 매체로부터 메인 메모리(306) 내로 판독된다. 메인 메모리(306)에 포함된 명령의 시퀀스의 실행은 프로세서(304)로 하여금 본원에서 기술된 프로세스 단계를 수행하게 한다. 대안적인 실시예에서는, 소프트웨어 명령 대신에 또는 소프트웨어 명령과 조합하여 고정 배선 회로가 사용된다.
"저장 매체"라는 용어는, 본 명세서에서 사용되는 바와 같이, 머신이 특정 방식으로 동작하게 하는 데이터 및/또는 명령을 저장하는 임의의 비-일시적 매체를 지칭한다. 그러한 저장 매체는 비휘발성 매체 및/또는 휘발성 매체를 포함한다. 비휘발성 매체는, 예를 들어, 광학 디스크, 자기 디스크, 솔리드 스테이트 드라이브, 또는 3차원 크로스 포인트 메모리, 예컨대, 저장 디바이스(310)를 포함한다. 휘발성 매체는 동적 메모리, 예컨대, 메인 메모리(306)를 포함한다. 저장 매체의 일반적인 형태는, 예를 들어, 플로피 디스크, 플렉서블 디스크, 하드 디스크, 솔리드 스테이트 드라이브, 자기 테이프, 또는 임의의 다른 자기 데이터 저장 매체, CD-ROM, 임의의 다른 광학 데이터 저장 매체, 홀 패턴을 갖는 임의의 물리적 매체, RAM, PROM, 및 EPROM, FLASH-EPROM, NV-RAM, 또는 임의의 다른 메모리 칩, 또는 카트리지를 포함한다.
저장 매체는 송신 매체와 별개이지만 송신 매체와 함께 사용될 수 있다. 송신 매체는 저장 매체들 사이에서 정보를 전달하는 데 참여한다. 예를 들어, 송신 매체는 버스(302)를 포함하는 와이어를 포함하여, 동축 케이블, 구리 와이어 및 광섬유를 포함한다. 송신 매체는 또한, 라디오 파 및 적외선 데이터 통신 동안 생성되는 것과 같은, 광파 또는 음향파의 형태를 취할 수 있다.
일 실시예에서, 실행을 위해 하나 이상의 명령의 하나 이상의 시퀀스를 프로세서(304)에 반송하는 데 다양한 형태의 매체가 관여된다. 예를 들어, 명령은 초기에 원격 컴퓨터의 자기 디스크 또는 솔리드 스테이트 드라이브에 보유된다. 원격 컴퓨터는 동적 메모리에 명령을 로딩하고 모뎀을 사용하여 전화선을 통해 명령을 전송한다. 컴퓨터 시스템(300)에 로컬인 모뎀은 전화선 상으로 데이터를 수신하고 적외선 송신기를 사용하여 데이터를 적외선 신호로 변환한다. 적외선 검출기는 적외선 신호로 반송되는 데이터를 수신하고 적절한 회로는 데이터를 버스(302)에 배치한다. 버스(302)는 데이터를 메인 메모리(306)로 반송하고, 프로세서(304)는 메인 메모리로부터 명령을 검색 및 실행한다. 메인 메모리(306)에 의해 수신된 명령은 프로세서(304)에 의해 실행되기 전이나 실행된 후에 선택적으로 저장 디바이스(310)에 저장될 수 있다.
컴퓨터 시스템(300)은 버스(302)에 결합된 통신 인터페이스(318)를 또한 포함한다. 통신 인터페이스(318)는 로컬 네트워크(322)에 연결된 네트워크 링크(320)에 대한 양방향 데이터 통신(two-way data communication) 결합을 제공한다. 예를 들어, 통신 인터페이스(318)는 ISDN(integrated service digital network) 카드, 케이블 모뎀, 위성 모뎀, 또는 대응하는 유형의 전화선에 데이터 통신 연결을 제공하기 위한 모뎀이다. 다른 예로서, 통신 인터페이스(318)는 호환 가능한 LAN(local area network)에 데이터 통신 연결을 제공하기 위한 LAN 카드이다. 일부 구현예에서는, 무선 링크도 구현된다. 임의의 그러한 구현예에서, 통신 인터페이스(318)는 다양한 유형의 정보를 나타내는 디지털 데이터 스트림을 반송하는 전기 신호, 전자기 신호, 또는 광학 신호를 전송 및 수신한다.
네트워크 링크(320)는 전형적으로 하나 이상의 네트워크를 통한 다른 데이터 디바이스로의 데이터 통신을 제공한다. 예를 들어, 네트워크 링크(320)는 로컬 네트워크(322)를 통해 호스트 컴퓨터(324)로의 연결 또는 ISP(Internet Service Provider)(326)에 의해 운영되는 클라우드 데이터 센터 또는 장비로의 연결을 제공한다. ISP(326)는 차례로 지금은 "인터넷(328)"이라고 통상적으로 지칭되는 월드-와이드 패킷 데이터 통신 네트워크(world-wide packet data communication network)를 통해 데이터 통신 서비스를 제공한다. 로컬 네트워크(322) 및 인터넷(328) 둘 모두는 디지털 데이터 스트림을 반송하는 전기 신호, 전자기 신호, 또는 광학 신호를 사용한다. 컴퓨터 시스템(300)으로 및 컴퓨터 시스템(200)으로부터 디지털 데이터를 반송하는, 다양한 네트워크를 통한 신호 및 통신 인터페이스(318)를 통한 네트워크 링크(320) 상의 신호는 송신 매체의 예시적인 형태이다. 일 실시예에서, 네트워크(320)는 위에서 기술된 클라우드(202) 또는 클라우드(202)의 일부를 포함한다.
컴퓨터 시스템(300)은 네트워크(들), 네트워크 링크(320), 및 통신 인터페이스(318)를 통해, 프로그램 코드를 포함하여, 메시지를 전송하고 데이터를 수신한다. 일 실시예에서, 컴퓨터 시스템(300)은 프로세싱하기 위한 코드를 수신한다. 수신된 코드는 수신될 때 프로세서(304)에 의해 실행되고 그리고/또는 추후의 실행을 위해 저장 디바이스(310) 또는 다른 비휘발성 스토리지에 저장된다.
자율 주행 차량 아키텍처
도 4는 자율 주행 차량(예를 들면, 도 1에 도시된 AV(100))에 대한 예시적인 아키텍처(400)를 도시한다. 아키텍처(400)는 인지 모듈(402)(때때로 인지 회로라고 지칭됨), 계획 모듈(planning module)(404)(때때로 계획 회로라고 지칭됨), 제어 모듈(406)(때때로 제어 회로라고 지칭됨), 로컬화 모듈(localization module)(408)(때때로 로컬화 회로라고 지칭됨), 및 데이터베이스 모듈(410)(때때로 데이터베이스 회로라고 지칭됨)을 포함한다. 각각의 모듈은 AV(100)의 동작에서 소정의 역할을 한다. 다함께, 모듈(402, 404, 406, 408, 및 410)은 도 1에 도시된 AV 시스템(120)의 일부일 수 있다. 일부 실시예에서, 모듈(402, 404, 406, 408, 및 410) 중 임의의 모듈은 컴퓨터 소프트웨어(예를 들면, 컴퓨터 판독 가능 매체 상에 저장된 실행 가능 코드) 및 컴퓨터 하드웨어(예를 들면, 하나 이상의 마이크로프로세서, 마이크로컨트롤러, ASIC(application-specific integrated circuit), 하드웨어 메모리 디바이스, 다른 유형의 집적 회로, 다른 유형의 컴퓨터 하드웨어, 또는 이러한 것 중 임의의 것 또는 모든 것의 조합)의 조합이다. 모듈(402, 404, 406, 408, 및 410)의 각각의 모듈은 때때로 프로세싱 회로(예를 들면, 컴퓨터 하드웨어, 컴퓨터 소프트웨어, 또는 이 둘의 조합)라고 지칭된다. 모듈(402, 404, 406, 408, 및 410) 중 임의의 것 또는 모든 것의 조합은 또한 프로세싱 회로의 일 예이다.
사용 중에, 계획 모듈(404)은 목적지(412)를 나타내는 데이터를 수신하고 목적지(412)에 도달하기 위해(예를 들면, 도착하기 위해) AV(100)에 의해 주행될 수 있는 궤적(414)(때때로 루트라고 지칭됨)을 나타내는 데이터를 결정한다. 계획 모듈(404)이 궤적(414)을 나타내는 데이터를 결정하기 위해, 계획 모듈(404)은 인지 모듈(402), 로컬화 모듈(408), 및 데이터베이스 모듈(410)로부터 데이터를 수신한다.
인지 모듈(402)은, 예를 들면, 도 1에도 도시된 바와 같이, 하나 이상의 센서(121)를 사용하여 인근의 물리적 대상체를 식별한다. 인지 모듈(402)은 이전에 설명된 세그먼트화 및 주석 달기 프로세스를 포함한다. 대상체는 분류되고(예를 들면, 보행자, 자전거, 자동차, 교통 표지판 등과 같은 유형으로 그룹화되고), 분류된 대상체(416)를 포함하는 장면 묘사는 계획 모듈(404)에 제공된다.
계획 모듈(404)은 또한 로컬화 모듈(408)로부터 AV 위치(418)를 나타내는 데이터를 수신한다. 로컬화 모듈(408)은 위치를 계산하기 위해 센서(121)로부터의 데이터 및 데이터베이스 모듈(410)로부터의 데이터(예를 들면, 지리적 데이터)를 사용하여 AV 위치를 결정한다. 예를 들어, 로컬화 모듈(408)은 GNSS(Global Navigation Satellite System) 센서로부터의 데이터 및 지리적 데이터를 사용하여 AV의 경도 및 위도를 계산한다. 일 실시예에서, 로컬화 모듈(408)에 의해 사용되는 데이터는 도로 기하학적 속성의 고정밀 맵, 도로망 연결 속성을 기술하는 맵, 도로 물리적 속성(예컨대, 교통 속력, 교통량, 차량 교통 차선과 자전거 타는 사람 교통 차선의 개수, 차선 폭, 차선 교통 방향, 또는 차선 마커 유형 및 위치, 또는 그 조합)을 기술하는 맵, 및 도로 특징부, 예컨대, 횡단보도, 교통 표지판 또는 다양한 유형의 다른 주행 신호(travel signal)의 공간적 위치를 기술하는 맵을 포함한다. 일 실시예에서, 고정밀 맵은 자동 또는 수동 주석 달기를 통해 저정밀 맵에 데이터를 추가함으로써 구성된다.
제어 모듈(406)은 궤적(414)을 나타내는 데이터 및 AV 위치(418)를 나타내는 데이터를 수신하고, AV(100)로 하여금 목적지(412)를 향해 궤적(414)을 주행하게 할 방식으로 AV의 제어 기능(420a 내지 420c)(예를 들면, 조향, 스로틀링, 제동, 점화)을 동작시킨다. 예를 들어, 궤적(414)이 좌회전을 포함하는 경우, 제어 모듈(406)은, 조향 기능의 조향각이 AV(100)로 하여금 왼쪽으로 회전하게 하고 스로틀링 및 제동이 AV(100)로 하여금 이러한 회전이 이루어지기 전에 지나가는 보행자 또는 차량을 위해 일시정지 및 대기하게 하는 방식으로, 제어 기능(420a 내지 420c)을 동작시킬 것이다.
자율 주행 차량 입력
도 5는 인지 모듈(402)(도 4)에 의해 사용되는 입력(502a 내지 502d)(예를 들면, 도 1에 도시된 센서(121)) 및 출력(504a 내지 504d)(예를 들면, 센서 데이터)의 예를 도시한다. 하나의 입력(502a)은 LiDAR(Light Detection and Ranging) 시스템(예를 들면, 도 1에 도시된 LiDAR(123))로부터 수신된 데이터를 포함한다. LiDAR는 그의 가시선에 있는 물리적 대상체에 관한 데이터를 획득하기 위해 전자기 방사선(예를 들면, 적외선 광과 같은 광 또는 광의 버스트)을 사용하는 기술이다. LiDAR 시스템은 출력(504a)으로서 LiDAR 데이터를 생성한다. 예를 들어, LiDAR 데이터는 환경(190)의 표현을 구성하는 데 사용되는 3D 또는 2D 포인트의 집합체(포인트 클러스터라고도 알려져 있음)이다.
일부 실시예에서, LiDAR 시스템은 회전 거울에 의해 반사되는 적어도 하나의 레이저 거리 측정기(laser range finder)를 포함한다. 회전 거울은 전형적으로 AV에 고정되어 있는 LiDAR 시스템의 방위각(azimuth)을 따라 회전하도록 구성된다. 이러한 방식으로, 회전 거울이 회전되어 방위각을 따라 포인트들의 집합체를 생성하는데, 이는 때때로 환경(190)의 LiDAR 스캔이라고 지칭된다. 일부 실시예에서, 회전 미러는 LiDAR 시스템 주위의 환경(190)의 360° 시야를 표현하는 LiDAR 스캔을 생성하기 위해 피칭(pitching)할 수 있다. 이러한 방식으로, LiDAR 스캔은 환경(190)에서의 지점과 연관된 거리와 LiDAR 시스템의 극좌표(예를 들면, 방위각(azimuth angle) 및 피치각(pitch angle)) 간의 일대일 매핑을 나타낸다. 일부 실시예에서, 환경(190)에서의 포인트 클러스터와 연관된 거리의 앙상블 평균(ensemble average)을 생성하기 위해 인지 모듈(402)에 의해 여러 번의 LiDAR 스캔이 진행된다. 예를 들어, 일부 실시예에서, 5회의 LiDAR 스캔이 연속적으로 수행되고 포인트 클러스터와 연관된 거리가 평균화된다. 일부 실시예에서, 더 많은 포인트 클러스터를 사용하여 환경(190)을 표현하기 위해, 5회의 LiDAR 스캔이 연속적으로 수행되고 포인트 클러스터와 연관된 거리가 LiDAR 데이터에 연결(concatenate)된다(즉, 환경(190)의 LiDAR 데이터 표현은 단지 한 번의 LiDAR 스캔보다 두 번 이상 LiDAR 스캔의 경우 "더 완전(full)"하거나 "더 조밀(dense)"하다). 여기에서는 5회의 LiDAR 스캔이 예로서 사용되지만, 5회보다 많거나 적은 스캔이 연속적으로 수행될 수 있다. 일부 실시예에서, LiDAR 스캔은 인지 모듈(402)에 의해 지속적으로 수행되고 분석된다.
다른 입력(502b)은 RADAR 시스템이다. RADAR는 인근의 물리적 대상체에 관한 데이터를 획득하기 위해 라디오 파를 사용하는 기술이다. RADAR는 LiDAR 시스템의 시선 내에 있지 않은 대상체에 관한 데이터를 획득할 수 있다. RADAR 시스템(502b)은 출력(504b)으로서 RADAR 데이터를 생성한다. 예를 들어, RADAR 데이터는 환경(190)의 표현을 구성하는 데 사용되는 하나 이상의 라디오 주파수 전자기 신호이다.
다른 입력(502c)은 카메라 시스템이다. 카메라 시스템은 인근의 물리적 대상체에 관한 정보를 획득하기 위해 하나 이상의 카메라(예를 들면, CCD(charge-coupled device)와 같은 광 센서를 사용하는 디지털 카메라)를 사용한다. 카메라 시스템은 출력(504c)으로서 카메라 데이터를 생성한다. 카메라 데이터는 종종 이미지 데이터(예를 들면, RAW, JPEG, PNG 등과 같은 이미지 데이터 포맷의 데이터)의 형태를 취한다. 일부 예에서, 카메라 시스템은, 카메라 시스템이 깊이를 인지할 수 있게 하는, 예를 들어, 입체시(stereopsis)(스테레오 비전)를 위한, 다수의 독립적인 카메라를 갖는다. 비록 카메라 시스템에 의해 인지되는 대상체가 여기서 "인근"으로 기술되지만, 이것은 AV에 상대적인 것이다. 사용 중에, 카메라 시스템은 멀리 있는, 예를 들어, AV 전방으로 최대 1 킬로미터 이상에 있는 대상체를 "보도록" 구성될 수 있다. 따라서, 카메라 시스템은 멀리 떨어져 있는 대상체를 인지하도록 최적화되어 있는 센서 및 렌즈와 같은 특징부를 가질 수 있다.
다른 입력(502d)은 TLD(traffic light detection) 시스템이다. TLD 시스템은 하나 이상의 카메라를 사용하여, 시각적 운행 정보를 제공하는 교통 신호등, 거리 표지판, 및 다른 물리적 대상체에 관한 정보를 획득한다. TLD 시스템은 출력(504d)으로서 TLD 데이터를 생성한다. TLD 데이터는 종종 이미지 데이터(예를 들면, RAW, JPEG, PNG 등과 같은 이미지 데이터 포맷의 데이터)의 형태를 취한다. TLD 시스템은, 시각적 운행 정보를 제공하는 가능한 한 많은 물리적 대상체에 관한 정보를 획득하기 위해 TLD 시스템이 넓은 시야를 갖는 카메라(예를 들면, 광각 렌즈 또는 어안 렌즈를 사용함)를 사용하여, AV(100)가 이러한 대상체에 의해 제공되는 모든 관련 운행 정보에 액세스한다는 점에서, 카메라를 포함하는 시스템과 상이하다. 예를 들어, TLD 시스템의 시야각은 약 120도 이상일 수 있다.
일부 실시예에서, 출력(504a 내지 504d)은 센서 융합 기술을 사용하여 결합된다. 따라서, 개별 출력(504a 내지 504d) 중 어느 하나가 AV(100)의 다른 시스템에 제공되거나(예를 들면, 도 4에 도시된 바와 같은 계획 모듈(404)에 제공되거나), 또는 결합된 출력이 동일한 유형(동일한 결합 기술을 사용하는 것 또는 동일한 출력을 결합하는 것 또는 둘 모두)의 단일 결합 출력 또는 다중 결합 출력의 형태 또는 상이한 유형(예를 들면, 상이한 각자의 결합 기술을 사용하는 것 또는 상이한 각자의 출력을 결합하는 것 또는 둘 모두)의 단일 결합 출력 또는 다중 결합 출력의 형태 중 어느 하나로 다른 시스템에 제공될 수 있다. 일부 실시예에서, 조기 융합(early fusion) 기술이 사용된다. 조기 융합 기술은 하나 이상의 데이터 프로세싱 단계가 결합된 출력에 적용되기 전에 출력을 결합하는 것을 특징으로 한다. 일부 실시예에서, 늦은 융합(late fusion) 기술이 사용된다. 늦은 융합 기술은 하나 이상의 데이터 프로세싱 단계가 개별 출력에 적용된 후에 출력을 결합하는 것을 특징으로 한다.
도 6은 LiDAR 시스템(602)(예를 들면, 도 5에 도시된 입력(502a))의 예를 도시한다. LiDAR 시스템(602)은 광 방출기(606)(예를 들면, 레이저 송신기)로부터 광(604a 내지 604c)을 방출한다. LiDAR 시스템에 의해 방출되는 광은 전형적으로 가시 스펙트럼에 있지 않으며; 예를 들어, 적외선 광이 종종 사용된다. 방출되는 광(604b)의 일부는 물리적 대상체(608)(예를 들면, 차량)와 조우하고, LiDAR 시스템(602)으로 다시 반사된다. (LiDAR 시스템으로부터 방출되는 광은 전형적으로 물리적 대상체, 예를 들면, 고체 형태의 물리적 대상체를 관통하지 않는다). LiDAR 시스템(602)은 또한 반사된 광을 검출하는 하나 이상의 광 검출기(610)를 갖는다. 일 실시예에서, LiDAR 시스템과 연관된 하나 이상의 데이터 프로세싱 시스템은 LiDAR 시스템의 시야(614)를 나타내는 이미지(612)를 생성한다. 이미지(612)는 물리적 대상체(608)의 경계(616)를 나타내는 정보를 포함한다. 이러한 방식으로, 이미지(612)는 AV 인근의 하나 이상의 물리적 대상체의 경계(616)를 결정하는 데 사용된다.
도 7은 동작 중인 LiDAR 시스템(602)을 도시한다. 이 도면에 도시된 시나리오에서, AV(100)는 이미지(702) 형태의 카메라 시스템 출력(504c) 및 LiDAR 데이터 포인트(704) 형태의 LiDAR 시스템 출력(504a) 둘 모두를 수신한다. 사용 중에, AV(100)의 데이터 프로세싱 시스템은 이미지(702)를 데이터 포인트(704)와 비교한다. 특히, 이미지(702)에서 식별된 물리적 대상체(706)가 데이터 포인트(704) 중에서도 식별된다. 이러한 방식으로, AV(100)는 데이터 포인트(704)의 윤곽 및 밀도에 기초하여 물리적 대상체의 경계를 인지한다.
도 8은 LiDAR 시스템(602)의 동작을 추가적으로 상세하게 도시한다. 위에서 기술된 바와 같이, AV(100)는 LiDAR 시스템(602)에 의해 검출되는 데이터 포인트의 특성에 기초하여 물리적 대상체의 경계를 검출한다. 도 8에 도시된 바와 같이, 지면(802)과 같은 평평한 대상체는 LiDAR 시스템(602)으로부터 방출되는 광(804a 내지 804d)을 일관된 방식으로 반사할 것이다. 달리 말하면, LiDAR 시스템(602)이 일관된 간격을 사용하여 광을 방출하기 때문에, 지면(802)은 광을 동일한 일관된 간격으로 다시 LiDAR 시스템(602)으로 반사할 것이다. AV(100)가 지면(802) 위를 주행함에 따라, LiDAR 시스템(602)은 도로를 방해하는 것이 아무 것도 없는 경우 다음 유효 지면 포인트(806)에 의해 반사되는 광을 계속 검출할 것이다. 그렇지만, 대상체(808)가 도로를 방해하는 경우, LiDAR 시스템(602)에 의해 방출되는 광(804e 및 804f)은 예상되는 일관된 방식과 부합하지 않는 방식으로 포인트(810a 및 810b)로부터 반사될 것이다. 이 정보로부터, AV(100)는 대상체(808)가 존재한다고 결정할 수 있다.
경로 계획
도 9는 (예를 들면, 도 4에 도시된 바와 같은) 계획 모듈(404)의 입력과 출력 사이의 관계의 블록 다이어그램(900)을 도시한다. 일반적으로, 계획 모듈(404)의 출력은 시작 포인트(904)(예를 들면, 소스 위치 또는 초기 위치)로부터 종료 포인트(906)(예를 들면, 목적지 또는 최종 위치)까지의 루트(902)이다. 루트(902)는 전형적으로 하나 이상의 세그먼트에 의해 정의된다. 예를 들어, 세그먼트는 거리, 도로, 간선도로, 사유 도로, 또는 자동차 주행에 적절한 다른 물리적 영역의 적어도 일 부분에 걸쳐 주행되는 거리이다. 일부 예에서, 예를 들어, AV(100)가 4륜 구동(4WD) 또는 상시 4륜구동(AWD) 자동차, SUV, 픽업 트럭 등과 같은 오프-로드 주행 가능 차량인 경우, 루트(902)는 비포장 경로 또는 탁트인 들판과 같은 "오프-로드" 세그먼트를 포함한다.
루트(902)에 추가하여, 계획 모듈은 차선 레벨 루트 계획 데이터(908)도 출력한다. 차선 레벨 루트 계획 데이터(908)는 특정한 시간에서의 세그먼트의 조건에 기초하여 루트(902)의 세그먼트를 횡단하는 데 사용된다. 예를 들어, 루트(902)가 다중 차선 간선도로를 포함하는 경우, 차선 레벨 루트 계획 데이터(908)는, 예를 들어, 출구가 다가오고 있는지, 차선 중 하나 이상이 다른 차량을 갖는지, 또는 수 분 이하 동안에 걸쳐 변화되는 다른 인자에 기초하여, AV(100)가 다중 차선 중 한 차선을 선택하는 데 사용할 수 있는 궤적 계획 데이터(910)를 포함한다. 유사하게, 일부 구현예에서, 차선 레벨 루트 계획 데이터(908)는 루트(902)의 세그먼트에 특정적인 속력 제약(912)을 포함한다. 예를 들어, 세그먼트가 보행자 또는 예상치 못한 교통상황(traffic)을 포함하는 경우, 속력 제약(912)은 AV(100)를 예상된 속력보다 더 느린 주행 속력, 예를 들면, 세그먼트에 대한 속력 제한 데이터에 기초한 속력으로 제한할 수 있다.
일 실시예에서, 계획 모듈(404)에의 입력은 (예를 들면, 도 4에 도시된 데이터베이스 모듈(410)로부터의) 데이터베이스 데이터(914), 현재 위치 데이터(916)(예를 들면, 도 4에 도시된 AV 위치(418)), (예를 들면, 도 4에 도시된 목적지(412)에 대한) 목적지 데이터(918), 및 대상체 데이터(920)(예를 들면, 도 4에 도시된 인지 모듈(402)에 의해 인지되는 분류된 대상체(416))를 포함한다. 일 실시예에서, 데이터베이스 데이터(914)는 계획에 사용되는 규칙을 포함한다. 규칙은 형식 언어를 사용하여, 예를 들어, 불리언 로직을 사용하여 규정된다. AV(100)가 조우하는 임의의 주어진 상황에서, 규칙들 중 적어도 일부는 해당 상황에 적용될 것이다. 규칙이 AV(100)에 이용 가능한 정보, 예를 들면, 주위 환경에 관한 정보에 기초하여 충족되는 조건을 갖는 경우, 규칙이 주어진 상황에 적용된다. 규칙은 우선순위를 가질 수 있다. 예를 들어, "도로가 프리웨이인 경우, 최좌측 차선으로 이동하라"로 되어 있는 규칙은, 출구가 1마일 내로 다가오고 있는 경우, 최우측 차선으로 이동하라"는 것보다 더 낮은 우선순위를 가질 수 있다.
도 10은, 예를 들어, 계획 모듈(404)(도 4)에 의해 경로 계획에 사용되는 방향 그래프(1000)를 도시한다. 일반적으로, 도 10에 도시된 것과 같은 방향 그래프(1000)는 임의의 시작 포인트(1002)와 종료 포인트(1004) 사이의 경로를 결정하는 데 사용된다. 현실 세계에서는, 시작 포인트(1002)와 종료 포인트(1004)를 분리시키는 거리는 상대적으로 클 수 있거나(예를 들면, 2개의 상이한 대도시 지역 내) 또는 상대적으로 작을 수 있다(예를 들면, 도시 블록과 맞닿아 있는 2개의 교차로 또는 다중 차선 도로의 2개의 차선).
일 실시예에서, 방향 그래프(1000)는 AV(100)에 의해 점유될 수 있는 시작 포인트(1002)와 종료 포인트(1004) 사이의 상이한 위치를 나타내는 노드(1006a 내지 1006d)를 갖는다. 일부 예에서, 예를 들면, 시작 포인트(1002)와 종료 포인트(1004)가 상이한 대도시 지역을 나타낼 때, 노드(1006a 내지 1006d)는 도로의 세그먼트를 나타낸다. 일부 예에서, 예를 들면, 시작 포인트(1002)와 종료 포인트(1004)가 동일한 도로 상의 상이한 위치를 나타낼 때, 노드(1006a 내지 1006d)는 해당 도로 상의 상이한 위치를 나타낸다. 이러한 방식으로, 방향 그래프(1000)는 다양한 레벨의 입도(granularity)로 정보를 포함한다. 일 실시예에서, 높은 입도를 갖는 방향 그래프는 또한 더 큰 스케일을 갖는 다른 방향 그래프의 서브그래프(subgraph)이다. 예를 들어, 시작 포인트(1002)와 종료 포인트(1004)가 멀리 떨어져 있는(예를 들면, 수 마일(many miles) 떨어져 있는) 방향 그래프는 그의 정보 대부분이 낮은 입도이고 저장된 데이터에 기초하지만, AV(100)의 시야 내의 물리적 위치를 나타내는 그래프의 부분에 대한 일부 높은 입도 정보도 포함한다.
노드(1006a 내지 1006d)는 노드와 오버랩될 수 없는 대상체(1008a 및 1008b)와 별개이다. 일 실시예에서, 입도가 낮을 때, 대상체(1008a 및 1008b)는 자동차에 의해 횡단될 수 없는 영역, 예를 들면, 거리 또는 도로가 없는 구역을 나타낸다. 입도가 높을 때, 대상체(1008a 및 1008b)는 AV(100)의 시야 내의 물리적 대상체, 예를 들면, 다른 자동차, 보행자, 또는 AV(100)와 물리적 공간을 공유할 수 없는 다른 엔티티를 나타낸다. 일 실시예에서, 대상체(1008a 및 1008b)의 일부 또는 전부는 정적 대상체(예를 들면, 가로등 또는 전신주와 같은 위치를 변경하지 않는 대상체) 또는 동적 대상체(예를 들면, 보행자 또는 다른 자동차와 같은 위치를 변경할 수 있는 대상체)이다.
노드(1006a 내지 1006d)는 에지(1010a 내지 1010c)에 의해 연결된다. 2개의 노드(1006a 및 1006b)가 에지(1010a)에 의해 연결되는 경우, AV(100)가, 예를 들면, 다른 노드(1006b)에 도착하기 전에 중간 노드로 주행할 필요 없이, 하나의 노드(1006a)와 다른 노드(1006b) 사이에서 주행하는 것이 가능하다. (노드들 사이에서 주행하는 AV(100)를 언급할 때, AV(100)가 각자의 노드에 의해 표현되는 2개의 물리적 위치 사이에서 주행한다는 것을 의미한다.) 에지(1010a 내지 1010c)는, AV(100)가 제1 노드로부터 제2 노드로, 또는 제2 노드로부터 제1 노드로 주행한다는 의미에서 종종 양방향성이다. 일 실시예에서, 에지(1010a 내지 1010c)는, AV(100)가 제1 노드로부터 제2 노드로 주행할 수 있지만, AV(100)가 제2 노드로부터 제1 노드로 주행할 수 없다는 의미에서 단방향성이다. 에지(1010a 내지 1010c)는, 예를 들어, 일방통행로, 거리, 도로, 또는 간선도로의 개별 차선, 또는 법적 또는 물리적 제약으로 인해 일 방향으로만 횡단될 수 있는 다른 특징부를 나타낼 때, 단방향성이다.
일 실시예에서, 계획 모듈(404)은 방향 그래프(1000)를 사용하여 시작 포인트(1002)와 종료 포인트(1004) 사이의 노드 및 에지로 이루어진 경로(1012)를 식별한다.
에지(1010a 내지 1010c)는 연관된 비용(1014a 및 1014b)을 갖는다. 비용(1014a 및 1014b)은 AV(100)가 해당 에지를 선택하는 경우 소비될 리소스를 나타내는 값이다. 전형적인 리소스는 시간이다. 예를 들어, 하나의 에지(1010a)가 다른 에지(1010b)의 물리적 거리의 2배인 물리적 거리를 나타내는 경우, 제1 에지(1010a)의 연관된 비용(1014a)은 제2 에지(1010b)의 연관된 비용(1014b)의 2배일 수 있다. 시간에 영향을 미치는 다른 인자는 예상된 교통상황, 교차로의 개수, 속력 제한 등을 포함한다. 다른 전형적인 리소스는 연비이다. 2개의 에지(1010a 및 1010b)는 동일한 물리적 거리를 나타낼 수 있지만, 예를 들면, 도로 조건, 예상된 날씨 등으로 인해, 하나의 에지(1010a)는 다른 에지(1010b)보다 더 많은 연료를 필요로 할 수 있다.
계획 모듈(404)이 시작 포인트(1002)와 종료 포인트(1004) 사이의 경로(1012)를 식별할 때, 계획 모듈(404)은 전형적으로, 비용에 최적화된 경로, 예를 들면, 에지의 개별 비용이 함께 가산될 때 가장 적은 전체 비용을 갖는 경로를 선택한다.
자율 주행 차량 제어
도 11은 (예를 들면, 도 4에 도시된 바와 같은) 제어 모듈(406)의 입력 및 출력의 블록 다이어그램(1100)을 도시한다. 제어 모듈은, 예를 들어, 프로세서(304)와 유사한 하나 이상의 프로세서(예를 들면, 마이크로프로세서 또는 마이크로컨트롤러 또는 둘 모두와 같은 하나 이상의 컴퓨터 프로세서), 메인 메모리(306)와 유사한 단기 및/또는 장기 데이터 스토리지(예를 들면, 메모리 랜덤 액세스 메모리 또는 플래시 메모리 또는 둘 모두), ROM(308), 및 저장 디바이스(310)를 포함하는 제어기(1102), 및 메모리 내에 저장된 명령에 따라 동작하는데, 상기 명령은 명령이 (예를 들면, 하나 이상의 프로세서에 의해) 실행될 때 제어기(1102)의 동작을 수행한다.
일 실시예에서, 제어기(1102)는 원하는 출력(1104)을 나타내는 데이터를 수신한다. 원하는 출력(1104)은 전형적으로 속도, 예를 들어, 속력 및 헤딩을 포함한다. 원하는 출력(1104)은, 예를 들어, (예를 들면, 도 4에 도시된 바와 같은) 계획 모듈(404)로부터 수신되는 데이터에 기초할 수 있다. 원하는 출력(1104)에 따라, 제어기(1102)는 스로틀 입력(1106) 및 조향 입력(1108)으로서 사용 가능한 데이터를 생성한다. 스로틀 입력(1106)은 원하는 출력(1104)을 달성하기 위해, 예를 들면, 조향 페달에 관여하거나 또는 다른 스로틀 제어에 관여함으로써, AV(100)의 스로틀(예를 들면, 가속 제어)에 관여하는 정도를 나타낸다. 일부 예에서, 스로틀 입력(1106)은 AV(100)의 브레이크(예를 들면, 감속 제어)에 관여하는 데 사용 가능한 데이터를 또한 포함한다. 조향 입력(1108)은 조향각, 예를 들면, AV의 조향 컨트롤(예를 들면, 조향 휠, 조향각 액추에이터, 또는 조향각을 제어하기 위한 다른 기능성)이 원하는 출력(1104)을 달성하도록 위치설정되어야 하는 각도를 나타낸다.
일 실시예에서, 제어기(1102)는 스로틀 및 조향에 제공되는 입력을 조정하는 데 사용되는 피드백을 수신한다. 예를 들어, AV(100)가 언덕과 같은 방해물(1110)과 조우하면, AV(100)의 측정된 속력(1112)은 원하는 출력 속력 아래로 낮아진다. 일 실시예에서, 임의의 측정된 출력(1114)은, 예를 들어, 측정된 속력과 원하는 출력 사이의 차분(1113)에 기초하여, 필요한 조정이 수행되도록 제어기(1102)에 제공된다. 측정된 출력(1114)은 측정된 위치(1116), 측정된 속도(1118)(속력 및 헤딩을 포함), 측정된 가속도(1120), 및 AV(100)의 센서에 의해 측정 가능한 다른 출력을 포함한다.
일 실시예에서, 방해물(1110)에 관한 정보는, 예를 들면, 카메라 또는 LiDAR 센서와 같은 센서에 의해 미리 검출되고, 예측 피드백 모듈(1122)에 제공된다. 이후, 예측 피드백 모듈(1122)은 정보를 제어기(1102)에 제공하며, 제어기(1102)는 이 정보를 사용하여 그에 따라 조정할 수 있다. 예를 들어, AV(100)의 센서가 언덕을 검출한("본") 경우, 이 정보는 상당한 감속을 방지하도록 적절한 시간에 스로틀에 관여할 준비를 하기 위해 제어기(1102)에 의해 사용될 수 있다.
도 12는 제어기(1102)의 입력, 출력, 및 컴포넌트의 블록 다이어그램(1200)을 도시한다. 제어기(1102)는 스로틀/브레이크 제어기(1204)의 동작에 영향을 미치는 속력 프로파일러(1202)를 갖는다. 예를 들어, 속력 프로파일러(1202)는, 예를 들면, 제어기(1102)에 의해 수신되고 속력 프로파일러(1202)에 의해 프로세싱되는 피드백에 따라 스로틀/브레이크(1206)를 사용하여 가속에 관여하거나 감속에 관여하도록 스로틀/브레이크 제어기(1204)에 명령한다.
제어기(1102)는 또한 조향 제어기(1210)의 동작에 영향을 미치는 측방향 추적 제어기(1208)를 갖는다. 예를 들어, 측방향 추적 제어기(1208)는, 예를 들면, 제어기(1102)에 의해 수신되고 측방향 추적 제어기(1208)에 의해 프로세싱되는 피드백에 따라 조향각 액추에이터(1212)의 위치를 조정하도록 조향 제어기(1210)에 명령한다.
제어기(1102)는 스로틀/브레이크(1206) 및 조향각 액추에이터(1212)를 제어하는 방법을 결정하는 데 사용되는 여러 입력을 수신한다. 계획 모듈(404)은, 예를 들어, AV(100)가 동작을 시작할 때 헤딩을 선택하기 위해 그리고 AV(100)가 교차로에 도달할 때 어느 도로 세그먼트를 횡단할지를 결정하기 위해, 제어기(1102)에 의해 사용되는 정보를 제공한다. 로컬화 모듈(408)은, 예를 들어, 스로틀/브레이크(1206) 및 조향각 액추에이터(1212)가 제어되고 있는 방식에 기초하여 예상되는 위치에 AV(100)가 있는지를 제어기(1102)가 결정할 수 있도록, AV(100)의 현재 위치를 기술하는 정보를 제어기(1102)에 제공한다. 일 실시예에서, 제어기(1102)는 다른 입력(1214)으로부터의 정보, 예를 들어, 데이터베이스, 컴퓨터 네트워크 등으로부터 수신된 정보를 수신한다.
LiDAR 정보와 카메라 정보의 병합
도 13a에 도시된 바와 같이, 차량(1302)은 LiDAR 시스템(1304)을 포함한다. 일부 실시예에서, 차량(1302)의 LiDAR 시스템(1304)은 AV(100)의 LiDAR 시스템(602)과 동일하거나 유사하다. 일부 실시예에서, 차량(1302)의 동작과 관련하여 설명된 기능들 중 하나 이상은 차량(1302)의 이미지 병합 시스템(1350)의 적어도 하나의 프로세서에 의해 (예를 들면, 부분적으로, 완전히 등) 수행된다. 일부 실시예에서, 적어도 하나의 프로세서는 AV(100)의 컴퓨팅 디바이스(146)와 동일하거나 유사하다. 추가적으로 또는 대안적으로, 차량(1302)의 동작과 관련하여 설명된 기능들 중 하나 이상은 원격 서버의 프로세서에 의해 (예를 들면, 완전히, 부분적으로 등) 수행된다. 일부 실시예에서, 원격 서버는 클라우드 서버(136)와 동일하거나 유사하다. 일부 실시예에서, 원격 서버는 클라우드 컴퓨팅 환경(200)과 동일하거나 유사하다.
적어도 하나의 LiDAR 시스템(1304)은 LiDAR 시스템(1304)의 시야(1306) 내에서 광의 형태로 전자기 복사를 방출한다. 이어서 광은 대상체(1300)(예를 들면, 교통 신호등)에서 반사되고, LiDAR 시스템(1304)에 의해 수신된다. 이러한 방식으로, LiDAR 시스템(1304)은 차량(1302)에 근접한(예를 들면, 1 미터, 2 미터 또는 다른 거리) 대상체(1300)로부터 반사된 전자기 방사선을 검출하고, 검출된 전자기 방사선에 기초하여 LiDAR 정보를 생성한다. LiDAR 시스템(1304)은 차량(1302)의 이미지 병합 시스템(1350)과 통신하고, LiDAR 정보는 프로세싱을 위해 이미지 병합 시스템(1350)으로 송신된다(예를 들면, LiDAR 정보를 나타내는 신호가 LiDAR 시스템(1304)으로부터 이미지 병합 시스템(1350)의 적어도 하나의 프로세서에 의해 수신된다). 이러한 방식으로, 이미지 병합 시스템(1350)은 수신된 LiDAR 정보를 분석하여 차량(1302)에 근접한 대상체(1300)를 검출한다. 일부 경우에, LiDAR 시스템(1304)이 반사된 광을 수신하는 것에 기초하여 LiDAR 시스템(1304)은 포인트 클라우드와 연관된 LiDAR 정보를 생성한다. 일부 경우에, LiDAR 시스템(1304)은 포인트 클라우드와 연관된 LiDAR 정보를 차량(1302)의 이미지 병합 시스템(1350)으로 송신한다. 이미지 병합 시스템(1350)은 수신된 LiDAR 정보에 기초하여 (예를 들면, 도 13b에 도시된 바와 같은) LiDAR 이미지를 생성한다.
도 13b는 (i) 2D 차원 좌표 프레임에서 차량(1302)을 기준으로 한 LiDAR 정보의 각각의 LiDAR 포인트의 헤딩(예를 들면, LiDAR 시스템(1304)의 피치 및 요) 및 ii) 각각의 LiDAR 포인트의 상대 강도(relative intensity)로서 차량(1302)으로부터의 각각의 LiDAR 포인트의 거리를 표현하는 LiDAR 이미지(1320)의 예이다. 상대 강도는 음영 스케일(shading scale)을 사용하여 표현된다. 예를 들어, LiDAR 시스템(1304)(및 차량(1302))에 가장 가까운 대상체는 제1 음영(shade)(1308)을 사용하여 보여지고, 가장 먼 대상체는 제2 음영(1310)을 사용하여 보여지며, 이 2개의 거리 사이의 대상체는 보간된 음영을 사용하여 보여진다. 음영 없음을 갖는 LiDAR 이미지(1320)의 부분(1312)은 광의 어떠한 유의한(substantial) 반사도 수신하지 않았다.
일부 실시예에서, LiDAR 시스템(1304)은 송신된 광에 대한 수신된 광의 신호 비가 임계 값보다 크거나 같을 때 LiDAR 포인트의 반사가 유의하다고 결정한다. 추가적으로 또는 대안적으로, 일부 실시예에서, LiDAR 시스템(1304)은 신호 비가 임계 값보다 작거나 같을 때 LiDAR 포인트의 반사가 유의하지 않다고 결정한다. 일부 예에서, LiDAR 시스템(1304)이 단위 파워(unit power)를 갖는 광을 송신하고 송신된 광의 단위 파워의 100 만분의 1 미만의 광을 수신할 때, 수신된 반사는 유의하지 않은 것으로 간주된다(예를 들면, 수식 10log10(수신된 신호/송신된 신호)을 사용하여 -60dB 미만). LIDAR 정보 없음과 연관된 LiDAR 이미지(1320)의 부분(1312)은 임계 값 미만이다.
일부 실시예에서, 임계 값은 변하는 잡음 플로어(noise floor) 또는 LiDAR 시스템(1304)(예를 들면, 전자 잡음, 아날로그-디지털 변환, RF 간섭 등)을 수용하도록 변화된다. 신호대 잡음비(SNR)는 잡음 플로어에 기초한다. 일부 예에서, 전자 잡음이 (예를 들면, 접지 문제로 인해) 너무 커서 LiDAR 시스템(1304)이 수신된 신호(따라서 수신된 LiDAR 정보)를 전자 잡음과 구별할 수 없다. 그 결과, 이 경우에, 임계치가 전자 잡음에 기초하여 전자 잡음 이상으로 증가된다.
일부 실시예에서, 임계 값은 (예를 들면, 차량(1302)이 환경을 통해 이동할 때) LiDAR 시스템(1304)의 변하는 환경을 수용하도록 변화된다. 일부 예에서, 환경(1302)은 광을 잘 반사하지 않는 구조물(예를 들면, 비반사 구조물, 구조물이 전혀 없음 등)을 포함하고, 그 결과, 유의한 신호가 LiDAR 시스템(1304)에 의해 수신되지 않는다. 이 경우에, 구조물이 LiDAR 시스템(1304)에 의해 더 잘 분해되도록 임계치가 증가된다.
도 13b는 교차로에 있는 수평 기둥에 장착된 교통 신호등을 표현하는 2개의 영역(1314, 1316)을 도시한다. 교통 신호등은 LiDAR 정보의 복수의 LiDAR 포인트를 사용하여 분해된다. 이 시나리오에서, 하나 이상의 LiDAR 포인트의 집합체는 LiDAR 포인트 클러스터로서 표현된다. 일부 실시예에서, LiDAR 포인트 클러스터는 차량(1302)을 기준으로 한 각각의 각자의 LiDAR 포인트의 헤딩(예를 들면, 피치 및 요) 및 차량(1302)으로부터 각각의 각자의 LiDAR 포인트까지의 거리에 기초하여 이미지 병합 시스템(1350)에 의해 결정된다. 일부 예에서, 이미지 병합 시스템(1350)은 대상체의 4개의 LiDAR 포인트 클러스터(예를 들면, 영역(1314) 내의 2개의 교통 신호등 및 영역(1316) 내의 2개의 교통 신호등)가 LiDAR 정보에 존재한다고 결정한다.
차량(1302)의 이미지 병합 시스템(1350)은 차량(1302)으로부터 LiDAR 정보의 LiDAR 포인트 클러스터 각각까지의 헤딩 및 거리를 결정한다. 일부 예에서, 배향은 헤딩 및 거리 정보에 기초하여 결정된다. 일부 예에서, 배향은 대상체가 향하고 있는 방향을 나타낸다. 예를 들어, 교통 신호등의 교통 신호(예를 들면, 적색 신호등, 황색 신호등, 녹색 신호등 등)는 교통 신호등이 향하고 있는 방향으로(예를 들면, 다가오는 차량을 향해) 지향된다. 다른 예로서, 정지 표지판은 표면에 수직인 방향으로(예를 들면, 다가오는 차량을 향해) 보이도록 의도된 신호 또는 메시지를 갖는 표면을 포함한다. 이 시나리오에서, 배향은 신호 또는 메시지를 갖는 표면의 평면에 수직인 방향을 나타낸다. 일부 예에서, 각각의 각자의 LiDAR 포인트의 헤딩, 거리, 및 배향의 평균 값은 LiDAR 포인트 클러스터의 헤딩, 거리, 및 배향을 결정하기 위해 이미지 병합 시스템(1350)에 의해 사용된다. 일부 예에서, 이러한 헤딩 및 배향의 평균 값은 LiDAR 시스템(1304)으로부터 대상체의 표면의 하나 이상의 부분까지의 거리를 포함한다.
이러한 방식으로, LiDAR 포인트의 위치(예를 들면, 헤딩 및 거리)는 복수의 대상체(예를 들면, 사람, 쓰레기통, 표지판 등) 중 하나 이상이 차량(1302)의 환경 내의 특정 위치에 존재한다는 것을 나타낸다. 예를 들어, 도 13a에 도시된 바와 같은 교통 신호등(1300)의 경우에, 차량(1302)의 이미지 병합 시스템(1350)은 수신된 LiDAR 정보를 프로세싱하여 차량(1302)과 교통 신호등의 하나의 또는 각자의 표면 사이의 복수의 거리를 결정한다.
도 14a는 차량(1302)에 장착된 적어도 하나의 카메라 시스템(1322)을 도시한다. 일부 실시예에서, 카메라 시스템(1322)은 AV(100)의 카메라 시스템(122)과 동일하거나 유사하다. 카메라 시스템(1322)은 차량(1302)의 이미지 병합 시스템(1350)과 통신하고, 카메라 정보인 정보를 프로세싱을 위해 적어도 하나의 프로세서로 송신된다(예를 들면, 카메라 정보를 나타내는 신호가 카메라 시스템(1322)으로부터 이미지 병합 시스템(1350)의 적어도 하나의 프로세서에 의해 수신된다). 이러한 방식으로, 이미지 병합 시스템(1350)은 수신된 카메라 정보를 분석하여 시야(1324) 내에서 차량(1302)에 근접한 대상체(1300)를 검출한다(예를 들면, 도시된 예에서, 카메라 시스템(1322)은 도 13a에 도시된 동일한 대상체(1300)의 이미지를 캡처한다). 이미지 병합 시스템(1350)은 수신된 카메라 정보에 기초하여 (예를 들면, 도 14b에 도시된 바와 같은) 카메라 이미지를 생성한다.
도 14b는 세그먼트화 프로세스가 이미지 내의 하나 이상의 교통 신호등을 식별한 후의 카메라 시스템(1322)의 전형적인 출력 이미지(1330)를 도시한다. 교통 신호등은 이미지(1330) 내의 영역(1326, 1328)과 연관(예를 들면, 이에 의해 표현)된다. 예를 들어, 차량(1302)의 이미지 병합 시스템(1350)은 (예를 들면, 에지 검출, 색상 변화, 윤곽선 구배 등을 사용하여) 이미지(1330)를 분석하여 기하학적 특징(예를 들면, 표면, 에지, 정점 등)을 결정하고 후속적으로 (예를 들면, 인지 모듈의 주석 달기 프로세스를 통해) 이러한 기하학적 특징에 대한 지식에 기초하여 어느 대상체(1300)가 교통 신호등인지를 결정한다.
본 명세서의 중요한 양태는, 이미지 병합 시스템(1350)에 의해, LiDAR 시스템(1304)으로부터의 LiDAR 정보와 카메라 시스템(1322)으로부터의 카메라 정보를 병합하는 것에 관한 것이다. 이것은 이미지 병합 시스템(1350)이 차량(1302)이 특히 관심을 갖는 대상체의 배향, 헤딩, 및/또는 위치를, LiDAR 정보 또는 카메라 정보 중 어느 하나만을 사용하여 이러한 동일한 파라미터를 결정하는 것과 비교하여 증가된 정확도로, 결정할 수 있게 한다. 이러한 방식으로, 이미지 병합 시스템(1350)은 이미지 정보(예를 들면, 도 14b)에 표현된 기하학적 특징을 LiDAR 정보(예를 들면, 도 13b)로부터의 LiDAR 포인트 및/또는 LiDAR 포인트 클러스터와 연관시킨다.
일 실시예에서, 차량(1302)의 이미지 병합 시스템(1350)은 LiDAR 정보 및 카메라 정보에 기초하여 검출된 대상체(1300)를 식별한다. 일부 예에서, 식별은 검출된 대상체(1300)를 교통 신호등과 연관시킨다.
일 실시예에서, LiDAR 정보, 카메라 정보, 및/또는 병합된 이미지는 대상체의 분류 정보를 결정하기 위해 차량(1302)의 이미지 병합 시스템(1350)에 의해 사용된다. 분류 정보는 이전에 설명된 바와 같이 LiDAR 정보 및 카메라 정보 내의 대상체의 관심 레벨을 나타낸다. 일부 예에서, 주석 달기 및 세그먼트화 프로세스는 분류 정보를 결정하고, 프로세싱을 위해 분류 정보를 이미지 병합 시스템(1350)으로 송신한다.
일부 예에서, 분류는 환경에서 움직이는 대상체(예를 들면, 차량, 흔들리는 나무, 보행자 등) 또는 환경에서 움직이지 않은 대상체(예를 들면, 교통 신호등, 교통 표지판[정지 표지판, 양보 표지판, 속력 제한 표지판], 횡단보도 등)를 나타낸다. 일 실시예에서, 움직이는 대상체는 일정 시간 기간 동안 획득된 카메라 정보 및 획득된 LiDAR 정보에 기초하여 차량(1302)의 이미지 병합 시스템(1350)에 의해 검출된다(예를 들면, 시간 경과에 따른 대상체의 위치 변화를 결정하기 위해 카메라 정보 및 LiDAR 정보가 여러 번 획득된다). 이 시나리오에서, 일부 예에서, 이미지 병합 시스템(1350)은 대상체가 2초 동안 차량(1302)을 향해 0.1m 이동했다고 결정한다. 일부 예에서, 움직이는 대상체가 주석 달기 및 분류 프로세스의 식별을 추적하는 것에 기초하여 검출된다(예를 들면, 주석 달기 프로세스는 자동차 번호판, 대상체의 에지, 헤드 라이트 등과 같은 대상체의 특징을 사용하여 대상체가 차량이라고 결정한다).
일 실시예에서, 분류 프로세스는 대상체를 하나 이상의 카테고리로 그룹화한다(예를 들면, 카테고리 1은 교통 신호등이고, 카테고리 2는 교통 표지판이며, 카테고리 3은 그 밖의 모든 것이다). 예를 들어, 차량(1302)이 카테고리 1에서 전방에 있는 여러 대상체를 인식하게 되는 경우, 이는 교통 신호등이 차량(1302)에게 출발(go), 양보, 또는 정지하라고 신호하는지를 결정하기 위해 교통 신호등으로부터 방출되는 광의 색상 및 위치를 결정하는 프로세스를 트리거한다. 일 실시예에서, 교통 신호등의 방향 표시기(예를 들면, 녹색 왼쪽 화살표)는 교통 신호등에 의해 방출되는 광의 특징을 분석함으로써 검출 가능하다. 검출된 대상체가 교통 신호등인 시나리오에서, 일부 예에서, 이미지 병합 시스템(1350)은 교통 신호등이 황색이고 차량(1302)으로부터 500m 떨어져 있는 경우 차량의 궤적에 대한 변경이 필요하지 않다(예를 들면, 아직 속력을 줄일 필요가 없음)고 결정한다. 다른 한편으로, 일부 예에서, 이미지 병합 시스템(1350)은 교통 신호등이 적색이고 차량(1302)으로부터 20m 떨어져 있는 경우 차량(1302)이 즉각 정지할 수 있게 하기 위해 차량에게 궤적에 대한 업데이트를 수행하도록 지시한다.
일부 예에서, 차량의 이미지 병합 시스템(1350)은 차량(1302)으로부터 대상체까지의 거리(예를 들면, LiDAR 정보를 사용하여 이미지 병합 시스템(1350)에 의해 결정됨) 및 차량(1302)의 현재 속도에 기초하여 이용 가능한 반응 시간을 결정한다. 이러한 방식으로, 이용 가능한 반응 시간은 검출된 대상체에 반응하기 위해 얼마만큼의 시간이 이용 가능한지를 나타낸다. 일부 예에서, 차량(1302)의 궤적이 이용 가능한 반응 시간에 기초하여 업데이트된다(예를 들면, 좌회전 차선에서 정지하기에 충분한 시간이 없는 경우, 차선을 전환하고 교차로를 통해 직진한다).
일 실시예에서, 차량(1302)이 카테고리 2에서 전방에 있는 여러 대상체를 인식하게 되는 경우, 차량(1302)의 이미지 병합 시스템(1350)은 교통 표지판이 무엇을 나타내거나 의미하는지를 결정한다(또는 결정하게 한다). 이 시나리오에서, 이미지 병합 시스템(1350)은 표지판으로부터의 단어 및/또는 표현을 해석한다. 일부 예에서, 교통 표지판은 보행자 횡단보도 표지판이고 표지판의 특징(예를 들면, 표지판의 형상)을 추출하고 주석 달기 프로세스를 통해 이미지 프로세싱을 수행하는 것에 의해 검출된다(예를 들면, 수신된 카메라 정보, LiDAR 정보, 및/또는 병합된 정보가 횡단보도 표시기의 기지의 이미지와 비교된다).
일 실시예에서, 차량(1302)의 이미지 병합 시스템(1350)은 대상체의 분류에 기초하여 경계 레벨(alert level)을 확립한다. 일부 예에서, 경계 레벨은 수신된 주석 정보에 기초한다. 일부 예에서, 차량(1302)의 이미지 병합 시스템(1350)은 차량(1302)을 구역 내의 보행자에 대해 높은 경계 상태(예를 들면, 정상보다 더 높음)에 들어가게 한다. 일부 예에서, 이미지 병합 시스템(1350)은 높은 경계 상태에 있는 것에 응답하여 속력을 줄이도록 차량(1302)을 제어한다. 일부 예에서, 이미지 병합 시스템(1350)은 이러한 제어 신호를 차량(1302)을 제어하기 위한 별도의 차량 제어로 송신한다.
일 실시예에서, 차량(1302)의 이미지 병합 시스템(1350)은 차량(1302)이 우선 통행권을 갖는지 여부를 나타내는 양보 레벨을 확립한다. 일부 예에서, 이미지 병합 시스템(1350)이 다가오는 교통 표지가 양보 표지판이라고 결정하는 경우, 이미지 병합 시스템(1350)은 양보 레벨을 확립하고 다른 차량에 양보하도록 차량(1302)을 제어한다. 일부 예에서, 이미지 병합 시스템(1350)은 제어 신호를 차량(1302)을 제어하기 위한 별도의 차량 제어로 송신한다.
일부 예에서, 교통 표지판은 그와 연관된 지시(예를 들면, 스쿨 존 표지판은 차량(1302)으로 하여금 속력을 줄이게 하고, 정지 표지판은 차량(1302)으로 하여금 정지하게 하는 것 등)를 가지며, 이 지시는 차량의 이미지 병합 시스템(1350)에 의해 수신되고, 해석되며, 차량(1302)의 동작을 제어하는 데 사용된다. 일부 예에서, 교통 표지판의 지시는 룩업 테이블 또는 데이터베이스를 통해 이미지 병합 시스템(1350)에 의해 수행된다. 일부 예에서, 지시는 맵으로부터 이미지 병합 시스템(1350)에 의해 검색된다.
일 실시예에서, 임시 구별(temporary distinction)이 분류 정보에 포함된다. 임시 구별은 임시 대상체(temporary object)를 나타낸다. 일부 예에서, 이미지 병합 시스템(1350)은 차량을 신중히 제어하기 위해 임시 구별을 사용한다. 예를 들어, 공사 구역의 경우에, 차량은 속력을 줄인다. 일부 예에서, 임시 구별은 대상체 분류에 기초한다(예를 들면, 대상체가 카테고리 1 및/또는 카테고리 2를 사용하여 분류되는 경우에만 임시 구별을 적용함).
일부 예에서, 차량(1302)의 이미지 병합 시스템(1350)은 카테고리 2에서의 교통 표지판이 교통 표지판의 움직임(예를 들면, 작업자가 표지판을 흔들거나 표지판을 뒤집을 때, 표지판이 움직이는 공사 차량에 부착되어 있을 때 등)에 기초하여 임시적이라고 결정한다. 일부 예에서, 이미지 병합 시스템(1350)은 (예를 들면, 교통 표지판과 지면 사이의 견고한 연결(기둥)의 존재에 기초하여 교통 표지판이 지면에 견고하게 연결되어 있다고 결정하는 것에 의해) 교통 표지판이 움직이지 않아야 한다고 추론하고, 움직임의 결정은 임시 구별을 결과한다. 일부 예에서, 이미지 병합 시스템(1350)은 서버, 데이터베이스, 맵으로부터 또는 교통 표지판 자체로부터(예를 들면, 교통 표지판으로부터의 브로드캐스팅 무선 신호를 통해) 교통 표지판이 영구적인 구조물이라는 표시를 수신하는 것에 기초하여 교통 표지판이 움직이지 않아야 한다고 추론한다.
일부 실시예에서, 차량(1302)의 이미지 병합 시스템(1350)은 카메라 시스템(1322)에 의한 카메라 정보의 획득과 LiDAR 시스템(1304)에 의한 LiDAR 정보의 획득 사이의 타이밍 차이를 고려한다. 일부 예에서, 이미지 병합 시스템(1350)은 타이밍 차이에 기초하여 LiDAR 정보와 카메라 정보의 병합 프로세스를 결정한다. 타이밍 차이에 관련된 측면은 아래의 도 15a 내지 도 15d와 관련하여 추가로 설명된다.
도 15a 내지 도 15d는 LiDAR 시스템(1304)으로부터 LiDAR 정보를 획득하는 것과 카메라(1322)로부터 카메라 정보를 획득하는 것 사이에 발생하는 단계들의 타이밍 시퀀스를 도시한다.
도 15a는 차량(1302)의 LiDAR 시스템(1304)의 시야(1402) 내의 교통 신호등(1300)을 도시한다. 일부 예에서, 시야(1402)는 LiDAR 시스템(1304)에 의해 어느 대상체가 검출 가능한지에 대한 개요를 나타낸다. 일 실시예에서, LiDAR 시스템(1304)은 공중에 있는(예를 들면, 지면 위의) 대상체보다 환경의 지면에 있는 대상체에 중점을 두기 위해 아래쪽으로 피칭된다. LiDAR 시스템(1304)은 교통 신호등(1300)의 LiDAR 정보를 획득하고, LiDAR 정보는 차량(1302)의 이미지 병합 시스템(1350)으로 송신된다.
도 15b는 차량(1302)의 카메라 시스템(1322)의 시야(1404)를 도시한다. LiDAR 시스템(1304)과 카메라 시스템(1322)이 전형적으로 상이한 광학 구성을 갖기 때문에 시야(1402)가 전형적으로 시야(1404)와 상이하다. 특정 시점에서, 차량(1302)의 프로세서는 LiDAR 시스템(1304) 및 카메라 시스템(1322)에게 차량(1302)의 환경에 관한 정보를 획득하도록 지시한다. 도 15a 및 도 15b에 도시된 바와 같이, LiDAR 시스템(1304)과 카메라 시스템(1322)이 동시에 정보를 획득하는 경우, LiDAR 시스템(1304)의 시야(1402)가 교통 신호등(1300)을 포함하지만 카메라 시스템(1322)의 시야(1404)가 교통 신호등(1300)을 포함하지 않는 시나리오가 존재할 수 있다. 이러한 맥락에서, 시야(1404)는 검출 가능한 대상체가 초점 내에 있고 임계 개수의 픽셀(예를 들면, 적어도 100개의 픽셀)로 분해 가능한 영역을 나타낸다.
도 15c는 차량(1302)이 도 15a 및 도 15b에 도시된 것보다 교통 신호등(1300)에 더 가까이 이동한 상황을 도시한다. 이 시나리오에서, 교통 신호등(1300)의 적어도 일 부분이 LiDAR 시스템(1304)의 시야(1402) 밖에 있기 때문에 LiDAR 시스템(1304)은 교통 신호등(1300)을 완전히 분해할 수는 없다.
도 15d는 차량(1302)의 이미지 병합 시스템(1350)이 LiDAR 시스템(1304)에게 먼저(예를 들면, 카메라 시스템(1322)보다 앞서) LiDAR 정보를 획득하도록 지시하는 합성물을 도시한다. 이것은 도 15d의 상태 A에 표현되어 있다. 이어서, 차량(1302)의 이미지 병합 시스템(1350)은 일정 시간이 경과한 후에 카메라 시스템(1322)에게 카메라 정보를 획득하도록 지시한다. 이것은 도 15d의 상태 B에 도시되어 있다. 이러한 방식으로, LiDAR 시스템(1304)으로부터의 LiDAR 정보의 획득과 카메라(1322)로부터의 카메라 정보의 획득은 LiDAR 시스템(1304)과 카메라 시스템(1322) 사이의 시야 차이를 고려하기 위해 시간적으로 오프셋된다. 도 15d에 도시된 시나리오에서, 상태 A에서 LiDAR 정보가 LiDAR 시스템(1304)으로부터 획득되고, 약 2초 후에, 상태 B에서 카메라 정보가 카메라 시스템(1322)으로부터 획득된다.
일부 예에서, 차량(1302)의 이미지 병합 시스템(1350)은, LiDAR 정보로부터, 교통 신호등이 10미터 떨어져 있지만 카메라 시스템(1322)으로부터 수신된 카메라 정보가 교통 신호등을 분해하기에 불충분하다고 결정한다. 이 시나리오에서, 아마도 카메라 정보의 몇 픽셀만이 교통 신호등을 나타낸다. 일부 예에서, 카메라 정보의 픽셀의 10% 미만이 교통 신호등의 특징을 나타내고, 교통 신호등을 분해하기에 불충분한 것으로 간주된다.
일 실시예에서, LiDAR 정보는 2회 이상의 스캔(예를 들면, 2회 내지 20회의 LiDAR 스캔, 예컨대, 10회의 LiDAR 스캔)으로부터의 정보를 포함한다. 일 실시예에서, LiDAR 정보의 획득과 카메라 정보의 획득 사이의 시간 지연은 차량(1302)의 주행 시간에 기초한다. 일부 예에서, 주행 시간은, 이미지 병합 시스템(1350)에 의해, LiDAR 정보를 획득할 때의 차량(1302)의 위치와 카메라 정보를 획득할 때의 차량(1302)의 위치 사이의 위치 차이에 기초하여 추정된다. 일부 예에서, 주행 시간은, 이미지 병합 시스템(1350)에 의해, 차량(1302)의 속도에 기초하여 추정된다.
일부 실시예에서, 차량(1302)의 이미지 병합 시스템(1350)은 교통 신호등(1300)의 특징을 나타내는 픽셀의 개수에 기초하여 정확도를 결정한다. 일부 시나리오에서, 차량(1302)의 이미지 병합 시스템(1350)은 교통 신호등(1300)의 특징을 나타내는 픽셀의 개수가 임계 값을 초과하는 것에 기초하여 정확도를 결정한다(예를 들면, 100개의 픽셀은 양호한 정확도와 연관되고, 10개의 픽셀은 열악한 정확도와 연관된다). 이러한 예에서, 정확도는 대상체(1300)와 연관된(예를 들면, 대상체를 분해하기 위해 사용되는) 픽셀의 개수에 기초한다.
일부 예에서, 정확도는 차량(1302)과 교통 신호등(1300) 사이의 거리에 기초한다(예를 들면, 차량(1302)의 이미지 병합 시스템(1350)은 교통 신호등(1300)까지의 물리적 거리에 기초하여 정확도를 결정한다). 일부 예에서, 차량(1302)이 교통 신호등(1300)에 더 가까이 이동함에 따라(예를 들면, 2초가 경과한 후에), 카메라 정보가 재획득되고 2초 전의 이미지 정보와 비교하여 더 많은(예를 들면, 수백개의) 픽셀이 교통 신호등(1300)과 연관된다.
일부 예에서, 이미지 병합 시스템(1350)은 정확도 및/또는 외부 서버, 데이터베이스, 또는 맵으로부터의 정보에 기초하여 신뢰도를 결정한다. 예를 들어, 일부 경우에, 이미지 병합 시스템(1350)이 교통 신호등이 접근하고 있다는 표시를 서버, 데이터베이스, 또는 맵으로부터 수신할 때, 이미지 병합 시스템(1350)은 검출된 대상체의 정확도가 (예를 들면, 픽셀의 개수 등에 기초한) 임계 값 초과인지를 결정한다. 검출된 대상체의 정확도가 임계 값 초과인 경우에, 높은 신뢰도가 검출된 대상체와 연관된다. 다른 한편으로, 검출된 대상체의 정확도가 임계 값 미만인 경우에, 낮은 신뢰도가 검출된 대상체와 연관된다. 이러한 경우에, 신뢰도는 차량(1302)이 전방에 있는 대상체(1300)가 실제로 교통 신호등이라고 얼마나 확신하는지를 나타낸다. 일부 예에서, 차량(1302)의 궤적 및/또는 차량(1302)의 경로 계획은 신뢰도에 기초한다. 일부 예에서, 차량(1302)은 신뢰도가 낮을 때(예를 들면, 5% 미만일 때) 검출된 대상체를 무시한다. 일부 예에서, 차량(1302)은 신뢰도가 낮을 때 대상체의 존재를 확인하기 위해 추가적인 리소스(승객 확인, 외부 맵 정보 등)를 사용한다.
일부 실시예에서, 차량의 이미지 병합 시스템(1350)은 카메라 시스템(1322)의 줌 기능(zoom feature)(예를 들면, 광학 줌 또는 디지털 줌)을 제어하여 대상체(1300)를 줌인한다. 일부 경우에, 줌 기능을 제어하는 것은 정확도 및/또는 신뢰도에 기초한다. 예를 들어, 정확도(또는 신뢰도, 또는 정확도와 신뢰도 둘 모두)가 임계치 미만일 때, 이미지 병합 시스템(1350)은 재검토(second look)가 정당화된다고 결정하고, 2X 배율로 광학적으로 줌인하도록 카메라 시스템(1322)(또는 제2 카메라 시스템)의 줌 기능을 제어(또는 그에 지시)한다. 일부 예에서, 차량의 이미지 병합 시스템(1350)은 카메라 정보(또는 병합된 정보)에 기초하여 검출된 대상체의 구역으로 패닝(pan)하도록 카메라 시스템(1322)을 제어(또는 그에 지시)한다. 일단 카메라 시스템(1322)이 준비(줌잉(zoom) 및/또는 패닝)되면, 카메라 시스템(1322)은 제2 카메라 정보를 생성하고 제2 카메라 정보를 차량의 이미지 병합 시스템(1350)으로 송신한다. 이미지 병합 시스템(1350)은 제1 카메라 정보와 유사하게 제2 카메라 정보를 분석한다. 일부 실시예에서, 제2 카메라 시스템이 제2 카메라 정보를 획득하는 데 사용된다.
유사하게, 일부 실시예에서, 제2 LiDAR 시스템이 제2 LiDAR 정보를 획득하는 데 사용된다. 예를 들어, 정확도(또는 신뢰도, 또는 정확도와 신뢰도 둘 모두)가 임계치 미만일 때, 이미지 병합 시스템(1350)은 재검토가 정당화된다고 결정하고, 2X 배율로 광학적으로 줌인하도록 LiDAR 시스템(1304)(또는 제2 LIDAR 시스템)의 줌 기능을 제어(또는 그에 지시)한다. 일부 예에서, 차량의 이미지 병합 시스템(1350)은 LiDAR 정보(또는 병합된 정보)에 기초하여 검출된 대상체의 구역으로 패닝하도록 LiDAR 시스템(1304)을 제어(또는 그에 지시)한다. 일단 LiDAR 시스템(1304)이 준비(줌잉 및/또는 패닝)되면, LiDAR 시스템(1304)은 제2 LiDAR 정보를 생성하고 제2 LiDAR 정보를 차량의 이미지 병합 시스템(1350)으로 송신한다. 이미지 병합 시스템(1350)은 제1 LiDAR 정보와 유사하게 제2 LiDAR 정보를 분석한다.
일 실시예에서, LiDAR 정보는 일정 시간 기간(예를 들면, 최대 10초) 동안 지속적으로 획득되고 차량(1302)의 메모리 버퍼 내에 저장된다. 일부 실시예에서, LiDAR 정보는, 차량(1302)의 이미지 병합 시스템(1350)에 의해, 프로세싱을 위해 메모리 버퍼로부터 검색된다.
일단 차량(1302)의 이미지 병합 시스템(1350)이 (예를 들면, 획득에 의해 또는 버퍼에 의해) 차량(1302)의 환경을 나타내는 LiDAR 정보 및 카메라 정보에 액세스하면, 이미지 병합 시스템(1350)은 병합 프로세스를 시작한다. 이미지 병합 시스템(1350)은 환경에 대한 차량의 이해를 개선시키기 위해 LiDAR 정보의 적어도 하나의 부분을 카메라 정보의 적어도 하나의 픽셀과 연관시킨다. 전형적으로, 카메라 정보의 적어도 하나의 픽셀은 특히 관심을 갖는 대상체(예를 들면, 정지 표지판, 교통 신호등, 차량 등)를 나타낸다.
도 15d에 도시된 예를 다시 참조하면, 이 시나리오에서, 카메라 시스템(1322)과 연관된 카메라 정보는, 차량(1302)의 이미지 병합 시스템(1350)에 의해, 2초 전의 대응하는 LiDAR 정보와 병합된다. 다른 예에서, LiDAR 정보의 획득과 카메라 정보의 획득이 동시에 발생한다.
병합 프로세스를 통해, 이미지 병합 시스템(1350)은 LiDAR 시스템(1304)과 카메라 시스템(1322)의 각자의 시야를 서로 동기화시킨다. 일부 예에서, 이미지 병합 시스템(1350)은 동기화를 결정하기 위해 카메라 정보의 이미지 특징(예를 들면, 에지, 표면(face), 색상 등)을 이전에 획득된 LiDAR 정보와 비교한다.
도 16a는 LiDAR 시스템(1304)으로부터의 LiDAR 정보와 카메라 시스템(1322)으로부터의 카메라 정보의 병합 프로세스의 예시이다. 이전에 기술된 바와 같이, 이미지 병합 시스템(1350)은 LiDAR 정보의 적어도 하나의 부분을 카메라 정보의 적어도 하나의 픽셀과 연관시킨다. 일부 예에서, 차량(1302)의 이미지 병합 시스템(1350)은 LiDAR 시스템(1304)과 카메라 시스템(1322) 사이의 상대 거리에 기초하여 LiDAR 정보를 카메라 정보와 병합한다. 일부 예에서, 차량(1302)의 이미지 병합 시스템(1350)은 카메라 시스템(1322)의 시야에 대한 LiDAR 시스템(1304)의 시야의 비에 기초하여 LiDAR 정보를 카메라 정보와 병합한다.
일 실시예에서, 이미지 병합 시스템(1350)은 LiDAR 정보 및 카메라 정보 둘 모두에 표현된 특징에 기초하여 LiDAR 정보와 카메라 정보의 각자의 특징 사이의 정렬을 결정한다. 일부 예에서, 선명한 에지(sharp edge)와 같은 특징 구배(feature gradient)는 LiDAR 정보 및 카메라 정보 둘 모두에서 구별 가능하고, LiDAR 정보를 카메라 정보에 병합하기 위해 이미지 병합 시스템(1350)에 의해 사용된다. 이 시나리오에서, 카메라 정보에서의 에지는 LiDAR 정보에서의 구배와 정렬된다.
일부 실시예에서, 이미지 병합 시스템(1350)은 모든 LiDAR 정보를 카메라 정보와 병합한다. 일부 실시예에서, 이미지 병합 시스템(1350)은 LiDAR 정보의 부분을 카메라 정보와 병합한다. 예를 들어, 이미지 병합 시스템(1350)은 LiDAR 정보로부터 특히 관심을 갖는 영역을 선택하고, 이러한 영역을 카메라 정보와 병합하며, LiDAR 정보의 나머지 부분을 폐기한다. 위의 도 13b와 관련하여 설명된 바와 같이, 일부 예에서, 특히 관심을 갖는 LiDAR 정보의 영역은 LiDAR 포인트 클러스터이다. 하나 이상의 LiDAR 포인트 클러스터가 LiDAR 정보 내에 존재하고, 차량(1302)의 이미지 병합 시스템(1350)에 의해 결정된다.
일부 실시예에서, 이미지 병합 시스템(1350)은 LiDAR 정보 내의 각각의 LiDAR 포인트 클러스터에 대한 매핑을 결정한다. 일부 예에서, 병합 프로세스는 각각의 LiDAR 포인트 클러스터에 대해 독립적으로 수행된다. 이 시나리오에서, 이미지 병합 시스템(1350)은 각자의 LiDAR 포인트 클러스터와 카메라 정보의 하나 이상의 픽셀 사이의 최적합 매핑(best fit mapping)을 나타내는 매핑을 결정한다. 이러한 방식으로, 이미지 병합 시스템(1350)은 카메라 정보의 하나 이상의 픽셀의 대상체 정보를 LiDAR 정보의 LiDAR 포인트 클러스터와 연관시킨다. LiDAR 정보와 카메라 정보의 병합은 이미지 병합 시스템(1350)이 병합된 정보의 영역을 질의하고 각자의 LiDAR 정보 및 카메라 정보를 검색할 수 있게 한다. 일 예로서, 이미지 병합 시스템(1350)이 병합된 LiDAR 정보와 카메라 정보 내의 영역의 상태 또는 속성(예를 들면, 색상, 강도, 위치 등)에 관해 조사할 때, 이미지 병합 시스템(1350)은 영역 내의 LiDAR 포인트와 연관된 LiDAR 정보(예컨대, 거리 정보, LiDAR 획득의 시간 등) 및 카메라 정보(예컨대, 색상, 강도, 2D 위치 등) 둘 모두와 연관된 정보를 수신한다. 예를 들어, 검출된 대상체가 교통 신호등인 시나리오에서, 이미지 병합 시스템(1350)은 어느 교통 지시(예를 들면, 녹색-출발, 황색-양보, 및 적색-정지)가 교통 신호등에 의해 지시되고 있는지를 추론하기 위해 병합된 정보와 연관된 픽셀의 색상에 대해 조사한다. 이 경우에, 색상 및 강도 정보는 병합된 정보의 카메라 정보 부분으로부터 검색되고, 배향 및 거리 정보는 병합된 정보의 LiDAR 정보 부분으로부터 검색된다. 일부 예에서, 이미지 병합 시스템(1350)이 강도가 임계치 초과라고 결정할 때, 이미지 병합 시스템(1350)은 교통 지시에 응답하도록 차량을 제어한다.
도 16b는 LiDAR 시스템(1304)으로부터의 LiDAR 정보(도 16b에서 도트를 사용하여 표현됨)가 카메라 시스템(1322)으로부터의 카메라 정보(도 16b에서 라인을 사용하여 표현됨)와 병합되어 있는 합성 이미지를 도시한다. 상세하게는, 도 16b는 환경 내의 물리적 대상체(예를 들면, 건물의 에지, 교통 신호등 등)가 카메라 정보와 LiDAR 정보 둘 모두와 연관되어 있음을 보여준다.
도 16b에 도시된 예에서, 영역(1502) 내의 한 쌍의 교통 신호등(1504)은 카메라 정보와 LiDAR 정보 둘 모두와 연관되어 있다. 교통 신호등(1504)의 경계 박스 또는 에지는 굵게 표시된 윤곽선으로 도시되어 있다. 일부 예에서, 이미지 병합 시스템(1350)은 세그먼트화 및 주석 달기 프로세스로부터 경계 박스 정보를 결정하거나 수신한다. 일부 예에서, 차량(1302)의 세그먼트화 및 주석 달기 프로세스는 카메라 정보에 표현된 관심 대상체(예를 들면, 교통 신호등(1502), 정지 표지판, 보행자 등)를 식별하고, 이러한 대상체를 나타내는 카메라 정보의 하나 이상의 픽셀을 경계 박스와 연관시킨다. 일부 예에서, 경계 박스는 LiDAR 정보를 고려하지 않고 카메라 정보에 기초하여 결정된다. 일부 예에서, 경계 박스는 관심 대상체(예를 들면, 관심 대상체의 분류)에 기초하여 결정된다. 예를 들어, 일부 경우에, 세그먼트화 및 주석 달기 프로세스는 모든 검출된 대상체에 대한 경계 박스를 결정하지만, 이미지 병합 시스템(1350)은 특정 카테고리 내의 모든 검출된 대상체를 필터링(무시)한다(예를 들면, 카테고리 3과 연관된 모든 경계 박스 등을 무시함).
일 실시예에서, 이미지 병합 시스템(1350)은 경계 박스 내에(예를 들면, 에지에 의해 정의된 경계 내에) 위치된 LiDAR 정보를 결정한다. 일부 예에서, 이미지 병합 시스템(1350)은 경계 박스 내의 LiDAR 정보와 연관된 평균 거리에 기초하여 차량(1302)으로부터 교통 신호등(1502)까지의 거리를 결정한다.
일 실시예에서, 이미지 병합 시스템(1350)은 경계 박스에 의해 캡슐화된 병합된 LiDAR 정보를 사용하여 차량(1302)으로부터 대상체까지의 환경에서의 거리를 결정한다. 일부 예에서, 거리는 제어 목적으로 그리고 맵 주석 달기를 위해 차량(1302)의 이미지 병합 시스템(1350)에 의해 사용된다. 일부 예에서, 이미지 병합 시스템(1350)은 결정된 거리에 응답하여 병합된 LiDAR 정보와 카메라 정보를 사용하여 차량(1302)을 제어한다.
일부 예에서, 교통 신호등이 특정 위치에 존재한다는 것을 나타내기 위해, 각각의 교통 신호등을 환경 내에서의 위치와 연관시키는 것에 의해, 맵 내에서의 대상체의 위치에 주석이 달린다. 일부 예에서, 맵은 글로벌 맵(global map)이다. 일 실시예에서, 맵은 환경 내에서의 교통 신호등의 위치를 예견하기 위해 다른 차량에 의해 사용된다. 일부 예에서, 대상체의 위치는 차량(1302)의 위치(예를 들면, GPS 센서에 의해 수신됨, 로컬화 시스템 또는 모듈에 의해 결정됨, 및/또는 기타), 카메라 시스템(1322)의 위치, 배향 및 시야, 그리고 LiDAR 시스템(1304)의 위치, 배향 및 시야에 기초하여 차량(1302)의 이미지 병합 시스템(1350)에 의해 결정된다.
일 실시예에서, 이미지 병합 시스템(1350)은 대상체의 인스턴스 식별자(id)를 결정한다. 대상체의 인스턴스 식별자는 환경에 걸쳐 대상체를 추적하는 데 사용된다. 일부 예에서, 인스턴스 식별자는 추적 목적을 위한 고유 번호이다.
예를 들어, 차량(1302)이 새로운(예를 들면, 이전에 관측되지 않은) 교통 신호등을 식별할 때, 차량(1302)의 이미지 병합 시스템(1350)은 새로운 교통 신호등의 위치 정보와 함께 새로운 교통 신호등을 카테고리 1에 할당한다. 차량(1302)이 환경을 통해 이동함에 따라, 차량의 이미지 병합 시스템(1350)은 대상체를 지속적으로 관측하고, 인스턴스 식별자에 기초하여 어느 대상체가 동일한 것이고 어떤 대상체가 새로운 것인지를 검증한다. 일 시나리오에서, 차량(1302)이 코너를 돌고 전방에서 새로운 교통 신호등을 관측한다. 후속적으로, 이미지 병합 시스템(1350)은 이것을 결정하고, 이를 새로운 인스턴스 식별자에 할당한다(예를 들면, 인스턴스 식별자와 연관된 숫자가 증분됨).
일 실시예에서, 인스턴스 식별자는 신뢰도에 기초한다. 예를 들어, 차량(1302)이 대상체에 점점 더 가까워짐에 따라, 이미지 병합 시스템(1350)은 (예를 들면, 차량(1302)의 센서를 통해 이용 가능한 대상체의 LiDAR 정보 및 카메라 정보가 더 많이 있다는 결정에 기초하여) 대상체가 실제로 교통 신호등라는 것을 더 높은 신뢰도로 결정한다.
일 실시예에서, 이미지 병합 시스템(1350)은 대상체의 위치 정보를 지속적으로 업데이트한다. 예를 들어, 차량(1302)으로부터 10 미터 떨어져 있는 대상체와 연관된 추정된 위치(예를 들면, 미리 생성된 3D 맵을 기준으로 한 대상체의 위치, 구역 내의 하나 이상의 건물을 기준으로 한 대상체의 위치 등)는 전형적으로 단지 1 미터 떨어져 있을 때의 추정된 위치 정보보다 덜 정확할 것이다. 이러한 방식으로, 이미지 병합 시스템(1350)은 가장 높은 신뢰도를 갖는 위치 정보를 유지한다. 일부 예에서, 이 위치 정보는 차량(1302)의 메모리, 또는 원격 데이터베이스 또는 맵 내에 저장된다.
일 실시예에서, 이미지 병합 시스템(1350)은 시간 경과에 따라 분류를 업데이트한다. 일부 예에서, 이미지 병합 시스템(1350)은 대상체의 분류를 (예를 들면, 카테고리 3으로부터 카테고리 2로) 업데이트한다. 예를 들어, 일 시나리오에서, 멀리 떨어진 시점에서, 차량(1302)의 이미지 병합 시스템(1350)은 보행자가 앞에 있다고 결정하고, 연관된 병합된 LiDAR 정보를 카테고리 3에 할당하지만, 차량(1302)이 접근함에 따라, 이미지 병합 시스템(1350)은 보행자 분류가 잘못되었고 대상체가 실제로 정지 표지판임을 인식하고 분류 정보를 카테고리 2로 업데이트한다.
일 실시예에서, 이미지 병합 시스템(1350)은 후속하는 병합된 LiDAR 정보와 카메라 정보에 기초하여 인스턴스 식별자를 업데이트한다. 일부 예에서, 차량(1302)의 이미지 병합 시스템(1350)은 단일 교통 신호등이 전방에 있다고 결정하지만, 차량(1302)이 접근함에 따라, 이미지 병합 시스템(1350)은 교통 신호등이 실제로는 2개의 교통 신호등임을 인식한다. 이러한 시나리오에서, 이미지 병합 시스템(1350)은 대상체가 다수의 대상체로 분할되었는지 여부를 지속적으로 결정한다. 여기서, 이미지 병합 시스템(1350)에 의해 원래 단일 인스턴스 식별자에 할당되었던 교통 신호등은 2개의 교통 신호등으로 분할되고, 각각의 교통 신호등은 차량(1302)의 이미지 병합 시스템(1350)에 의해 고유 인스턴스 식별자를 할당받는다. 이러한 방식으로, 대상체의 인스턴스 식별자가 업데이트 가능하다.
일 실시예에서, 이미지 병합 시스템(1350)은 대상체의 배향(예를 들면, 대상체의 지시가 향하고 있는 방향을 나타내는 배향)을 결정한다. 일부 예에서, 차량(1302)의 차선 이외의 차선을 조준하고 있는 전방의 교통 신호등(예를 들면, 교통 신호등의 교통 지시가 차량(1302)으로 지향되지 않음)은 차량(1302)의 경로에 조준되어 있지 않음에도 불구하고 맵을 업데이트하는 데 사용된다. 환언하면, 일부 경우에, 교통 신호등이 차량(1302)의 경로에 있는지 여부에 관계없이 맵에서 교통 신호등의 존재 및 배향이 업데이트된다.
일 실시예에서, 배향을 결정하는 것은 대상체 자체의 특징(예를 들면, 에지, 색상, 비율 등)에 기초한다. 일 실시예에서, 이미지 병합 시스템(1350)은 배향에 기초하여 방향을 결정한다. 일부 예에서, 정지 표지판 표면의 에지는 정지 표지판의 표면에 수직인 방향을 추론하는 데 사용된다(예를 들면, 표면을 나타내는 LiDAR 포인트 클러스터가 걸쳐 있는 표면의 벡터 외적을 계산하는 것에 의해 추론됨). 다른 예에서, 교통 신호등의 에지는 교통 신호등의 방향을 추론하는 데(예를 들면, 교통 신호, 따라서 교통 지시가 어디로 지향되어 있는지를 나타내는 데) 사용된다. 일부 예에서, 이미지 병합 시스템(1350)은 검출된 대상체의 배향에 기초하여 차량을 제어한다. 예를 들어, 이미지 병합 시스템(1350)이 (예를 들면, 검출된 대상체가 지향되어 있는 방향과 차량의 주행 방향 사이의 벡터 내적이 임계치 초과일 때를 결정하는 것에 의해) 교통 신호등의 방향이 차량을 향해 지향되어 있다고 결정하는 경우, 차량은 교통 신호의 교통 지시에 응답하도록 제어된다. 다른 경우에, 이미지 병합 시스템(1350)이 (예를 들면, 검출된 대상체가 지향되어 있는 방향과 차량의 주행 방향 사이의 벡터 내적이 임계치 미만일 때를 결정하는 것에 의해) 교통 신호등의 방향이 차량을 향해 지향되어 있지 않다고 결정할 때, 차량의 제어기는 교통 신호등의 교통 지시에 응답하지 않는다.
일 실시예에서, 차량(1302)의 이미지 병합 시스템(1350)은 차량(1302)이 대상체의 환경을 횡단할 때 대상체의 3D 표현을 구축한다. 일 실시예에서, 3D 표현은 대상체의 배향을 결정하는 데 사용된다.
도 16c는 경계 박스(도시되지 않음)에 의해 캡슐화된 LiDAR 정보를 보여준다. 모든 LiDAR 정보를 보여주는 도 13b에 도시된 LiDAR 이미지(1320)와 대조적으로, 도 16c는 하나 이상의 경계 박스에 의해 캡슐화된 LiDAR 정보를 보여준다. 이러한 방식으로, 하나 이상의 경계 박스는 LiDAR 정보의 필터로서 역할하며, 하나 이상의 경계 박스 내의 LiDAR 정보만이 이러한 필터링 프로세스 이후에 존속한다.
도 16d는 도 16c의 교통 신호등 중 하나와 연관된 LiDAR 정보의 상세도를 도시한다. 상세하게는, 도 16d는 교통 신호등을 나타내는 LiDAR 포인트 클러스터와 연관된 각각의 LiDAR 포인트 및 각각의 LiDAR 포인트에 대한 각자의 속성을 보여준다.
차량(1302)의 이미지 병합 시스템(1350)은 병합된 LiDAR 정보와 카메라 정보에 기초하여 각자의 속성을 결정한다. 도시된 예에서, 위치 정보(예를 들면, x, y, z), 분류 정보(예를 들면, “class” 파라미터), 및 인스턴스 정보(예를 들면, "instance_id” 파라미터)를 포함하도록 이미지 병합 시스템(1350)에 의해 각각의 LiDAR 포인트에 주석이 달린다. 일부 예에서, 다른 정보(예를 들면, 물리적 속성(예를 들면, 색상, 크기 등), 상태(예를 들면, 임시(temporary), 마지막 관측(last observed) 등) 등)를 사용하여 각각의 LiDAR 포인트에 주석이 달린다.
도 17a 내지 도 17f는 차량(1302) 주위의 360도 뷰를 나타내는 LiDAR 정보와 카메라 정보를 사용하여 병합 프로세스가 수행되는 실시예를 예시한다. 차량(1302)의 이미지 병합 시스템(1350)은 LiDAR 정보와 카메라 정보의 병합을 나타내는 합성 표현(1600)을 형성한다. 이 예에서, 카메라 정보는 차량(1302)의 카메라 시스템(1322)으로부터 획득된 6개의 카메라 이미지를 나타낸다. 이 예에서, 도 17b는 차량(1302) 바로 앞의 환경을 나타내고, 도 17e는 차량(1302) 바로 뒤의 환경을 나타내며, 도 17a는 차량(1302)의 좌측 전방의 환경을 나타내고, 도 17c는 차량(1302)의 우측 전방의 환경을 나타내며, 도 17d는 차량(1302)의 우측 후방의 환경을 나타내고, 도 17f는 차량(1302)의 좌측 후방의 환경을 나타낸다. 합성 표현(1600)은 차량(1302) 주위의 전체 360도 뷰를 정의한다. 차량의 이미지 병합 시스템(1350)은 전체 360도 뷰에 걸쳐 있는 LiDAR 정보와 카메라 정보를 병합한다. 이러한 방식으로, 차량(1302)의 이미지 병합 시스템(1350)은 차량(1302)의 360도 뷰 주위의 각각의 각자의 대상체의 거리를 결정한다.
도 18은 LiDAR 정보와 카메라 정보를 병합하는 이미지 병합 프로세스(1700)의 일 실시예의 플로차트이다. 이미지 병합 프로세스(1700)는 차량(1302)의 이미지 병합 시스템(1350)의 적어도 하나의 프로세서 또는 원격 서버(예를 들면, 클라우드 서버(136) 또는 클라우드 컴퓨팅 환경(200))의 적어도 하나의 프로세서를 사용하여 구현 가능하다. 이미지 병합 프로세스(1700)가 특정 정보 흐름을 예시하지만, LiDAR 정보와 카메라 정보를 병합하는 실시예가 특정 정보 흐름으로 제한되지 않는다.
적어도 하나의 카메라(1322)는 카메라 정보(1702)를 획득하는 데 사용된다. 일부 예에서, 카메라 정보(1702)는 차량(1302) 주위의 360도 뷰를 나타낸다.
적어도 하나의 LiDAR 시스템(1304)은 LiDAR 정보(1704)를 획득하는 데 사용된다. 일부 예에서, 차량의 이미지 병합 시스템(1350)은 LiDAR 정보(1704)와 함께 차량(1302)의 차량 위치 및 배향 정보(1712)를 수신한다.
적어도 하나의 카메라(1322) 및 LiDAR 시스템(1304)로부터의 LiDAR 정보가 병합 프로세스(1706)에서 사용된다. 환언하면, 이미지 병합 시스템(1350)이 병합 프로세스(1706)의 프로세스를 구현할 때 적어도 하나의 카메라(1322) 및 LiDAR 시스템(1304)으로부터의 LiDAR 정보가 이미지 병합 시스템(1350)에 의해 수신된다.
병합 프로세스(1706)를 수행하는 동안, 이미지 병합 시스템(1350)은 LiDAR 정보와 카메라 정보의 최적합 병합을 결정하고, LiDAR 정보 및 카메라 정보에 기초하여 병합된 정보를 생성한다.
프로세스(1700)는 세그먼트화, 주석 달기, 및 분류 프로세스(1708)를 포함한다. 도시된 예에서, 병합 프로세스(1706)로부터의 병합된 정보는 세그먼트화, 주석 달기, 및 분류 프로세스(1708)에 의해 사용된다. 그렇지만, 일부 예에서, 세그먼트화, 주석 달기, 및 분류 프로세스(1708)는 병합 프로세스(1706) 이전에(예를 들면, 카메라 정보 또는 LiDAR 정보 중 어느 하나만을 사용하여) 수행된다.
도시된 예에서, 이미지 병합 시스템(1350)은 세그먼트화, 주석 달기, 및 분류 프로세스(1708)를 구현하는 동안 대상체를 3개의 카테고리(카테고리 1은 교통 신호등이고, 카테고리 2는 교통 표지판이며, 카테고리 3은 그 밖의 모든 것임)와 연관시킨다. 카테고리 정보는 각각의 대상체와 연관된 분류 정보에 포함된다. 이러한 방식으로, 각각의 대상체는 분류 정보를 포함한다. 일부 예에서, 인스턴스 식별자는 세그먼트화, 주석 달기, 및 분류 프로세스(1708)의 일부로서 할당되고 분류 정보에 포함된다.
일 실시예에서, 대상체 질의 프로세스(1708)가 프로세스(1700)에 포함된다. 대상체 질의 프로세스(1708)를 수행하는 동안, 이미지 병합 시스템(1350)은 차량(1302)의 액션을 결정하기 위해 각각의 카테고리에서의 각각의 인스턴스 식별자에 대해 반복(예를 들면, 루핑(loop))한다. 일부 예에서, 이미지 병합 시스템(1350)은 대상체 정보(예를 들면, 카테고리, 인스턴스 식별자, 위치 및 배향)로 맵(1710)을 업데이트한다. 일부 예에서, 이 맵은 다른 차량에 의해 질의되고, 다른 차량의 각자의 프로세서는 다가오는 교통 신호등 또는 교통 표지판을 예견할 때를 결정하기 위해 이 맵을 사용한다.
일 실시예에서, 이미지 병합 시스템(1350)은 또한 대상체와 연관된 정보를 서버(예컨대, 서버(1714)) 또는 데이터베이스(예컨대, 데이터베이스(1716))에 저장할지 여부를 결정한다. 일 실시예에서, 이미지 병합 시스템(1350)은 대상체와 연관된 정보를 서버 또는 데이터베이스에 저장한다. 유사하게, 일 실시예에서, 이미지 병합 시스템(1350)은 서버, 데이터베이스 또는 맵으로부터 대상체 정보를 검색하고, 그에 따라 대상체 정보를 업데이트하며, 대상체 정보를 다시 서버, 데이터베이스 또는 맵으로 전송한다.
도 19a 및 도 19b는 글로벌 맵(1710)의 세부 사항을 보여준다. 맵(1710)은 환경의 도로를 포함한다. 맵(1710)은 수평축의 X 좌표와 수직축의 Y 좌표로 도시되어 있다. Z 좌표는 간결함을 위해 도시되어 있지 않지만, 일부 실시예에서, 지면으로부터의(또는 해수면 위로의) 대상체의 높이를 나타내기 위해 글로벌 맵(1710)에 저장된 정보에 포함된다. 도 19b에 도시된 예에서, 글로벌 맵(1710)은 영역(1802) 내의 5개의 대상체의 위치를 포함한다. 5개의 대상체는 글로벌 맵(1710)에 저장된다. 이미지 병합 시스템(1350)이 맵(1710)으로부터 대상체 정보를 검색할 때, 5개의 대상체에 관한 정보가 이미지 병합 시스템(1350)으로 송신된다.
일 실시예에서, 차량(1302)의 이미지 병합 시스템(1350)이 전방의 교통 신호등을 식별한 후에, 이미지 병합 시스템(1350)은 교통 신호등의 위치를 글로벌 맵(1710)에서의 대상체의 알려진 인스턴스와 비교한다. 예를 들어, 글로벌 맵(1710)이 전방의 특정 위치에 교통 신호등을 나타내는 경우, 차량(1302)의 이미지 병합 시스템(1350)은 교통 신호등의 인스턴스 식별자를 채택하고 글로벌 맵(1710)으로부터 교통 신호등의 연관된 정보를 다운로드한다. 예를 들어, 일부 경우에, 맵에 포함된 대상체의 위치 정보가 차량(1302)의 이미지 병합 시스템(1350)에 의해 추정된 현재 위치보다 더 정확하다. 다른 예에서, 대상체가 대상체의 배향을 결정하기에는 차량(1302)으로부터 너무 멀리 떨어져 있으며, 따라서 대상체의 배향이 그 대신에 글로벌 맵(1710)으로부터 다운로드되고 대상체의 배향으로서 이미지 병합 시스템(1350)에 의해 채택된다. 이러한 방식으로, 차량의 이미지 병합 시스템(1350)에 의해 적어도 한 번 관측된 카테고리 1 및 카테고리 2에서의 모든 대상체의 위치 및 배향의 현재의 최신 추정치로 글로벌 맵(1710)에 주석이 달린다.
일 실시예에서, 대상체가 관찰된 횟수가 또한 글로벌 맵(1710)에 저장된다. 일부 예에서, 대상체가 관찰된 횟수는 대상체가 존재할 확률을 나타낸다. 예를 들어, 일부 경우에, 대상체가 하루에 적어도 한 번 관측되는 경우, 대상체는 대상체가 존재할 높은 확률과 연관된다. 다른 한편으로, 일부 경우에, 대상체가 1 년에 한 번(예를 들면, 일주일에 한 번, 한 달에 한 번 등) 미만으로 관측되는 경우, 대상체는 대상체가 존재할 낮은 확률과 연관된다. 일부 예에서, 대상체가 제거되거나 이동된 경우, 맵이 그에 따라 업데이트된다. 일 실시예에서, 대상체는 글로벌 맵(1710)에 남아 있지만, (예를 들면, 대상체와 연관된 모순되는 정보가 있을 때) 차량의 이미지 병합 시스템(1350)이 대상체를 검출하지 않은 적어도 하나의 경우가 존재하기 때문에 대상체는 대상체가 존재하지 않을 수 있다는 것을 나타내는 정보와 연관된다. 일 실시예에서, 이 정보와 연관된 날짜 및 시간이 글로벌 맵(1710)에 저장된다. 일부 예에서, 날짜와 시간 정보는 정보 신뢰성의 표시를 이미지 병합 시스템(1350)에 제공하는 데 사용된다. 일부 예에서, 새로 식별된 대상체(예를 들면, 2 일 전에 관측됨)는 1 년 전에 마지막으로 관측된 대상체보다 더 신뢰할 수 있는 것으로 간주된다.
일 실시예에서, 이 정보는 글로벌 맵(1710)의 일부이고 루트 계획 프로세스에서 사용된다. 일부 예에서, 루트 플래너가 경로를 따라 10개의 교통 신호등이 존재한다는 표시를 수신하는 경우, 루트 플래너는 연료 및/또는 에너지 효율 이유로 및/또는 주행 시간 고려사항을 위해 차량(1302)을 재라우팅한다. 일 실시예에서, 특정 루트를 따라 글로벌 맵(1710)에서 식별된 대상체의 개수에 기초하여 승객 편의가 고려된다. 일부 예에서, 10개의 정지 표지판을 갖는 루트는 (거리상으로 및/또는 시간상으로) 더 길지만 더 적은 정류장을 포함하는 루트(예를 들면, 간선도로 주행)보다 멀미를 하는 승객에게 덜 편안하다.
도 20은 LiDAR 정보와 카메라 정보의 이미지 병합 프로세스(1900)의 플로차트이다.
이미지 병합 프로세스(1900)는 자외선, 적외선, 또는 레이저 스펙트럼에서의 전자기 방사선(예를 들면, 광), 또는 임의의 다른 종류의 전자기 방사선을 검출하도록 구성된 적어도 하나의 LiDAR 디바이스(예컨대, LiDAR 디바이스 또는 LiDAR 시스템(1304))를 갖는 차량의 이미지 병합 시스템(예컨대, 차량(1302)의 이미지 병합 시스템(1350))의 적어도 하나의 프로세서에 의해 수행된다. 차량은 카메라의 시야에서 차량에 근접한 대상체의 카메라 정보를 생성하도록 구성된 적어도 하나의 카메라(예컨대, 카메라(1322))를 포함한다. 차량은 이미지 병합 프로세스(1900)의 동작/단계를 구현하도록 구성된 적어도 하나의 프로세서를 포함한다. 적어도 하나의 프로세서는 이미지 병합 시스템의 동작/단계의 일부 또는 전부를 수행한다.
이미지 병합 시스템은 적어도 하나의 LiDAR 디바이스로부터 LiDAR 정보를 수신한다(1902). 일부 예에서, LiDAR 정보는 차량 주위의 360도 방위각을 커버한다. 일 실시예에서, LiDAR 정보는 LiDAR 시스템(1304)을 사용한 여러 번의 LiDAR 스캔을 포함하고 이미지 병합 시스템에 의해 실시간으로 수신된다.
이미지 병합 시스템은 적어도 하나의 카메라로부터의 카메라 정보에 기초하여 차량에 근접한 대상체의 대상체 정보를 수신한다(1904). 일 실시예에서, 대상체 정보는 대상체를 나타내는 카메라 정보의 적어도 하나의 픽셀을 포함한다. 일 실시예에서, 대상체 정보는 대상체의 분류를 나타내는 카테고리화 정보를 포함한다. 일 실시예에서, 이미지 병합 시스템은 카메라 정보를 수신한다.
일부 예에서, 카테고리화 정보는 픽셀을 대상체와 연관시킨다. 예를 들어, 이미지의 적어도 하나의 픽셀이 교통 신호등을 나타내는 것으로 결정되는 경우, 이 연관은 카테고리화 정보에 포함된다. 일 실시예에서, 세그먼트화 및 주석 달기 프로세스는 이미지의 어느 픽셀이 대상체에 대응하는지(예를 들면, 제1 픽셀 세트는 교통 신호등에 대응하고, 제2 픽셀 세트는 보행자에 대응하는 등)를 결정한다.
일 실시예에서, 분류는 이러한 대상체에 대한 카테고리를 나타낸다(예를 들면, 카테고리 1은 교통 신호등이고, 카테고리 2는 교통 표지판이며, 카테고리 3은 그 밖의 모든 것임). 더 넓은 맥락에서, 카테고리는 하나 이상의 공통 특징을 갖는 대상체의 그룹화이다. 예를 들어, 일 실시예에서, 카테고리 1 및 카테고리 2는 모든 교통 지시(예를 들면, 정지 표지판, 양보 표지판, 스쿨 존 표지판, 교통 신호등, 속력 제한 표지판, 합류 차선 표지판 등)을 포함하고, 카테고리 3은 교통 지시가 아닌 모든 것(예를 들면, 나무, 건물, 차량, 주차 미터기(parking meter) 등)을 포함한다. 이러한 맥락에서, 공통된 특징은 교통 지시이다. 일반적으로, 일부 예에서, 교통 지시는 환경을 통해 운행하기 위해 사용되는 차량에 의해 수신되는 임의의 명시적 지시를 지칭한다(예를 들면, 정지 표지판은 정지하라는 명시적인 교통 지시를 포함하고, 양보 표지판은 다른 차량에 양보하라는 명시적 지시를 포함하며, 속력 제한 표지판은 명시된 속력 제한을 초과하지 말라는 명시적인 지시를 포함하는 등).
일 실시예에서, 이미지 병합 시스템은 대상체의 카테고리화 정보가 교통 지시와 연관되는지를 결정한다(1906). 일부 예에서, 차량의 동작은 교통 지시가 차량 전방에 있는지 여부에 기초한다(예를 들면, 정지 신호등에서 정지, 스쿨 존에서 서행 등). 일부 예에서, 교통 지시는 교통 신호등 또는 교통 표지판이다. 일 실시예에서, 이미지 병합 시스템은 병합된 정보에 기초하여 교통 지시의 교통 신호를 결정한다. 일부 예에서, 이미지 병합 시스템은 병합된 정보에서의 적어도 하나의 픽셀의 색상에 기초하여 교통 신호등의 신호를 추론한다(예를 들면, 적색, 황색, 또는 녹색은, 제각기, 정지, 양보 및 출발을 의미한다). 일 실시예에서, 이미지 병합 시스템은 대상체로부터 방출된 광의 피크 광 강도의 위치에 기초하여 교통 신호를 추론한다(예를 들면, 대상체의 상단 근처에서 밝은 광이 방출되는 경우, 이는 정지 지시를 나타내는 것으로 추론된다).
일 실시예에서, 차량의 제어 회로는 교통 지시의 교통 신호에 기초하여 차량을 동작하도록 추가로 구성된다.
대상체의 카테고리화 정보가 교통 지시와 연관되어 있다는 결정에 따라, 이미지 병합 시스템은 수신된 LiDAR 정보의 적어도 하나의 부분을 수신된 대상체 정보와 연관된 적어도 하나의 픽셀과 병합하여 대상체를 나타내는 병합된 정보를 생성한다(1908). 일 실시예에서, 이미지 병합 시스템은 카테고리화 정보에 기초하여 병합된 정보를 필터링한다. 일 실시예에서, 수신된 LiDAR 정보의 적어도 하나의 부분을 수신된 대상체 정보와 연관된 적어도 하나의 픽셀과 병합하는 것은 카메라 정보의 경계 박스 내에 복수의 LiDAR 포인트를 병합하는 것을 포함한다.
이미지 병합 시스템은 대상체를 나타내는 병합된 정보에 기초하여 차량을 기준으로 한 대상체의 위치를 결정한다(1910). 일 실시예에서, 이미지 병합 시스템은 병합된 정보에 기초하여 대상체의 배향을 결정한다.
일 실시예에서, 이미지 병합 시스템은 대상체의 위치에 기초하여 차량을 동작시킨다(1912). 일 실시예에서, 이미지 병합 시스템은 차량의 별도의 제어기로 하여금 대상체의 위치에 기초하여 차량을 동작시키게 한다. 일부 예에서, 이미지 병합 시스템은 적색 교통 신호(예를 들면, 정지 신호)를 갖는 교통 신호등이 접근하고 있음을 차량 제어기에 통지하고, 이에 응답하여, 차량은 대상체보다 앞서(예를 들면, 대상체로부터의 일정 거리 내에) 차량을 정지시키도록 제어된다.
일 실시예에서, 이미지 병합 시스템은 병합된 정보에 기초하여 대상체에 인스턴스 식별자를 할당한다(예를 들면, 대상체 #1, 대상체 #2 등). 일 실시예에서, 이미지 병합 시스템은 대상체가 인스턴스 식별자와 이미 연관되어 있다고 결정한다. 일 실시예에서, 이미지 병합 시스템이 대상체가 인스턴스 식별자와 연관되어 있지 않다고 결정하는 경우, 이미지 병합 시스템은 대상체에 인스턴스 식별자를 할당한다.
일 실시예에서, 이미지 병합 시스템은 병합된 정보에 기초하여 대상체가 2개의 구별되는 대상체를 나타내는지를 결정한다. 대상체가 2개의 구별되는 대상체를 나타낸다고 결정하는 것에 따라, 이미지 병합 시스템은 2개의 구별되는 대상체 각각에 고유한 인스턴스 식별자를 할당한다.
일 실시예에서, 이미지 병합 시스템은 병합된 정보에 기초하여 대상체의 정확도를 결정한다.
일 실시예에서, 이미지 병합 시스템은 병합된 정보에 기초하여 맵에 주석을 단다. 일 실시예에서, 맵에 주석을 다는 것은 대상체의 위치, 대상체의 분류 정보, 대상체의 인스턴스 식별자, 및/또는 대상체를 관측한 날짜를 맵을 호스팅하는 데이터베이스로 송신하는 것을 포함한다. 일 실시예에서, 이미지 병합 시스템은 병합된 정보에 기초하여 맵 상의 대상체의 기존의 인스턴스를 업데이트한다. 일 실시예에서, 이미지 병합 시스템은 대상체의 위치 또는 배향이 변하는 때를 결정하고, 대상체와 연관된 위치 및/또는 배향 정보를 맵으로부터 제거한다. 일부 예에서, 차량이 환경의 특정 구역으로 돌아올 때, 이미지 병합 시스템은 이전에 검출된 교통 신호등이 더 이상 존재하지 않는다고 결정한다. 일부 경우에, 이미지 병합 시스템은 맵 또는 데이터베이스로부터 교통 신호등을 삭제하라는 명령을 송신한다.
일 실시예에서, 이미지 병합 시스템은 병합된 정보에 기초하여 대상체의 적어도 하나의 기하학적 특징을 결정한다. 일 실시예에서, 대상체의 적어도 하나의 기하학적 특징을 결정하는 것은 대상체의 적어도 하나의 에지 및 대상체의 적어도 하나의 표면을 결정하는 것을 포함한다. 일 실시예에서, 대상체의 적어도 하나의 기하학적 특징을 결정하는 것은 대상체의 크기를 결정하는 것을 포함한다. 일부 예에서, 대상체의 에지를 결정하기 위해 병합된 정보에 대해 에지 검출이 수행되고, 에지의 배향이 대상체의 배향을 추론하는 데 사용된다.
일 실시예에서, 적어도 하나의 LiDAR 디바이스가 LiDAR 정보를 획득하는 것과 동시에 적어도 하나의 카메라가 카메라 정보를 획득한다. 일 실시예에서, 적어도 하나의 LiDAR 디바이스가 LiDAR 정보를 획득한 후에 적어도 하나의 카메라가 카메라 정보를 획득한다. 일 실시예에서, 적어도 하나의 카메라가 카메라 정보를 획득하는 때와 적어도 하나의 LiDAR 디바이스가 LiDAR 정보를 획득하는 때 사이의 타이밍 차이는 차량의 속도에 기초한다.
일 실시예에서, 이미지 병합 시스템은 적어도 하나의 LiDAR 디바이스로부터 업데이트된 LiDAR 정보를 수신한다. 예를 들어, 일 실시예에서, 이전에 검출된 대상체의 위치를 확인하거나 재평가하기 위해, 업데이트된 LiDAR 정보가 생성된다. 일 실시예에서, 업데이트된 LiDAR 정보를 획득하는 것은 이전 LiDAR 정보가 업데이트된 LiDAR 정보와 연관된 LiDAR 포인트의 개수보다 더 적은 LiDAR 포인트를 사용하여 획득되었을 때 수행된다. 일부 예에서, 교통 지시가 있을 가능성이 있는 환경의 구역(예를 들면, 차량 위, 인도 등)에서 분해능을 증가시키기 위해 LiDAR 정보가 재차 획득된다. 일 실시예에서, 업데이트된 LiDAR 정보를 획득하는 것은 업데이트된 LiDAR 정보와 연관된 업데이트된 시야에 비해 LiDAR 시스템의 전체 시야보다 더 작은 시야(예를 들면, 차량 주위의 360도 시야보다 더 작은 시야)를 사용하여 이전 LiDAR 정보가 획득되었을 때 수행된다.
일 실시예에서, 업데이트된 LiDAR 정보는 이전에 검출된 대상체에 기초하여 획득된다. 일부 예에서, 이전에 검출된 대상체는 이전 LiDAR 정보 및 이전에 병합된 정보에 기초하여 검출되었다. 일부 예에서, 업데이트된 LiDAR 정보는 이전에 병합된 정보로부터 대상체의 정확도가 임계 정확도 미만일 때 획득된다.
일 실시예에서, 이미지 병합 시스템은 차량의 적어도 하나의 센서로부터 차량 위치 정보를 수신하며, 여기서 차량 위치 정보는 차량의 위도와 경도를 포함한다. 이 실시예에서, 대상체의 위도와 경도는 차량의 위도와 경도에 기초하여 결정된다. 예를 들어, 차량의 현재 위치를 사용하여, 이미지 병합 시스템은 대상체의 글로벌 좌표(global coordinate)로 된 위치를 결정하고 위치를 맵, 데이터베이스 또는 서버에 기록한다.
전술한 설명에서, 본 발명의 실시예는 구현마다 달라질 수 있는 다수의 특정 세부 사항을 참조하여 기술되었다. 따라서, 상세한 설명 및 도면은 제한적인 관점보다는 예시적인 관점에서 보아야 한다. 본 발명의 범위의 유일한 독점적인 지표, 및 출원인이 본 발명의 범위이도록 의도한 것은, 본 출원에서 특정 형태로 나오는 일련의 청구항의 문언적 등가 범위이며, 그러한 청구항이 나오는 특정 형태는 임의의 후속 보정을 포함한다. 그러한 청구항에 포함된 용어에 대한 본원에서 명시적으로 기재된 임의의 정의는 청구항에서 사용되는 그러한 용어의 의미를 결정한다. 추가적으로, 전술한 설명 및 이하의 청구항에서 "추가로 포함하는"이라는 용어가 사용될 때, 이 문구에 뒤따르는 것은 추가적인 단계 또는 엔티티, 또는 이전에 언급된 단계 또는 엔티티의 서브-단계/서브-엔티티일 수 있다.

Claims (22)

  1. 차량으로서,
    상기 차량에 근접한 대상체로부터 반사된 전자기 방사선을 검출하고 상기 검출된 전자기 방사선에 기초하여 LiDAR 정보를 생성하도록 구성된 적어도 하나의 LiDAR 디바이스;
    적어도 하나의 카메라의 시야에서 상기 차량에 근접한 상기 대상체의 이미지를 나타내는 카메라 정보를 생성하도록 구성된 상기 적어도 하나의 카메라;
    컴퓨터 실행 가능 명령어를 저장하는 적어도 하나의 컴퓨터 판독 가능 매체;
    상기 적어도 하나의 LiDAR 디바이스 및 상기 적어도 하나의 카메라에 통신 가능하게 결합된 적어도 하나의 프로세서 - 상기 적어도 하나의 프로세서는 상기 컴퓨터 실행 가능 명령어를 실행하도록 구성되고, 상기 실행은:
    상기 적어도 하나의 LiDAR 디바이스로부터 LiDAR 정보를 수신하는 동작;
    상기 적어도 하나의 카메라로부터의 카메라 정보에 기초하여 상기 차량에 근접한 대상체의 대상체 정보를 수신하는 동작 - 상기 대상체 정보는 상기 대상체를 나타내는 상기 카메라 정보의 적어도 하나의 픽셀을 포함하고 상기 대상체 정보는 상기 대상체의 분류를 나타내는 카테고리화 정보를 포함함 -;
    상기 수신된 LiDAR 정보의 적어도 하나의 부분을 상기 수신된 대상체 정보와 연관된 적어도 하나의 픽셀과 병합하여 상기 대상체를 나타내는 병합된 정보를 생성하는 동작;
    상기 대상체를 나타내는 상기 병합된 정보에 기초하여 상기 차량을 기준으로 한 상기 대상체의 위치를 결정하는 동작
    을 포함하는 동작들을 수행함 -; 및
    상기 적어도 하나의 프로세서에 통신 가능하게 결합된 제어 회로 - 상기 제어 회로는 상기 차량을 기준으로 한 상기 대상체의 상기 위치에 기초하여 상기 차량을 동작시키도록 구성됨 -
    를 포함하는, 차량.
  2. 제1항에 있어서, 상기 적어도 하나의 프로세서는 상기 카테고리화 정보에 기초하여 상기 병합된 정보를 필터링하는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  3. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 프로세서는 상기 병합된 정보에 기초하여 상기 대상체의 배향을 결정하는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  4. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 프로세서는 상기 대상체의 상기 카테고리화 정보가 교통 지시와 연관되는지를 결정하는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  5. 제4항에 있어서, 상기 교통 지시는 교통 신호등 또는 교통 표지판인 것인, 차량.
  6. 제4항에 있어서, 상기 적어도 하나의 프로세서는 상기 병합된 정보에 기초하여 상기 교통 지시의 교통 신호를 결정하는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  7. 제6항에 있어서, 상기 제어 회로는 상기 교통 지시의 상기 교통 신호에 기초하여 상기 차량을 동작시키도록 추가로 구성되는 것인, 차량.
  8. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 프로세서는 상기 병합된 정보에 기초하여 상기 대상체에 인스턴스 식별자를 할당하는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  9. 제8항에 있어서, 상기 적어도 하나의 프로세서는:
    상기 병합된 정보에 기초하여 상기 대상체가 2개의 구별되는 대상체들을 나타내는지를 결정하는 동작; 및
    상기 대상체가 2개의 구별되는 대상체들을 나타낸다고 결정하는 것에 따라, 상기 2개의 구별되는 대상체들 각각에 고유한 인스턴스 식별자를 할당하는 동작
    을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  10. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 프로세서는 상기 병합된 정보에 기초하여 상기 대상체의 정확도를 결정하는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  11. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 프로세서는 상기 병합된 정보에 기초하여 맵에 주석을 다는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  12. 제11항에 있어서, 맵에 주석을 다는 동작은 상기 대상체의 상기 위치, 상기 대상체의 상기 분류 정보, 상기 대상체의 인스턴스 식별자, 및 상기 대상체를 관측한 날짜를 상기 맵을 호스팅하는 데이터베이스로 송신하는 동작을 포함하는 것인, 차량.
  13. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 프로세서는 상기 병합된 정보에 기초하여 맵 상의 상기 대상체의 기존의 인스턴스를 업데이트하는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  14. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 프로세서는 상기 병합된 정보에 기초하여 상기 대상체의 적어도 하나의 기하학적 특징을 결정하는 동작을 포함하는 동작들을 수행하도록 추가로 구성되는 것인, 차량.
  15. 제14항에 있어서, 상기 대상체의 상기 적어도 하나의 기하학적 특징을 결정하는 동작은 상기 대상체의 적어도 하나의 에지 및 상기 대상체의 적어도 하나의 표면을 결정하는 동작을 포함하는 것인, 차량.
  16. 제14항에 있어서, 상기 대상체의 상기 적어도 하나의 기하학적 특징을 결정하는 동작은 상기 대상체의 크기를 결정하는 동작을 포함하는 것인, 차량.
  17. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 LiDAR 디바이스가 상기 LiDAR 정보를 획득하는 것과 동시에 상기 적어도 하나의 카메라가 상기 카메라 정보를 획득하는 것인, 차량.
  18. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 LiDAR 디바이스가 상기 LiDAR 정보를 획득한 후에 상기 적어도 하나의 카메라가 상기 카메라 정보를 획득하는 것인, 차량.
  19. 제18항에 있어서, 상기 적어도 하나의 카메라가 상기 카메라 정보를 획득하는 때와 상기 적어도 하나의 LiDAR 디바이스가 상기 LiDAR 정보를 획득하는 때 사이의 타이밍 차이는 상기 차량의 속도에 기초하는 것인, 차량.
  20. 제1항 또는 제2항에 있어서, 상기 수신된 LiDAR 정보의 상기 적어도 하나의 부분을 상기 수신된 대상체 정보와 연관된 상기 적어도 하나의 픽셀과 병합하는 것은 상기 카메라 정보의 경계 박스 내에 복수의 LiDAR 포인트들을 병합하는 것을 포함하는 것인, 차량.
  21. 방법으로서,
    차량의 적어도 하나의 LiDAR 디바이스로부터 LiDAR 정보를 수신하는 단계;
    적어도 하나의 카메라로부터의 카메라 정보에 기초하여 상기 차량에 근접한 대상체의 대상체 정보를 수신하는 단계 - 상기 대상체 정보는 상기 대상체를 나타내는 상기 카메라 정보의 적어도 하나의 픽셀을 포함하고 상기 대상체 정보는 상기 대상체의 분류를 나타내는 카테고리화 정보를 포함함 -;
    상기 대상체의 상기 카테고리화 정보가 교통 지시와 연관되는지를 결정하는 단계; 및
    상기 대상체의 상기 카테고리화 정보가 상기 교통 지시와 연관되어 있다고 결정하는 것에 따라:
    상기 수신된 LiDAR 정보의 적어도 하나의 부분을 상기 수신된 대상체 정보와 연관된 적어도 하나의 픽셀과 병합하여 상기 대상체를 나타내는 병합된 정보를 생성하는 단계;
    상기 대상체를 나타내는 상기 병합된 정보에 기초하여 상기 차량을 기준으로 한 상기 대상체의 위치를 결정하는 단계; 및
    상기 대상체의 상기 위치에 기초하여 상기 차량을 동작시키는 단계
    를 포함하는, 방법.
  22. 제1 디바이스의 적어도 하나의 프로세서에 의해 실행하기 위한 적어도 하나의 프로그램을 포함하는 컴퓨터 판독 가능 비-일시적 저장 매체로서, 상기 적어도 하나의 프로그램은, 적어도 하나의 프로세서에 의해 실행될 때, 상기 제1 디바이스로 하여금 제21항의 방법을 수행하게 하는 명령어를 포함하는, 컴퓨터 판독 가능 비-일시적 저장 매체.
KR1020210005172A 2020-12-10 2021-01-14 LiDAR 정보와 카메라 정보의 병합 KR102476931B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220165571A KR20220167263A (ko) 2020-12-10 2022-12-01 LiDAR 정보와 카메라 정보의 병합

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/118,466 US20220185324A1 (en) 2020-12-10 2020-12-10 Merging LiDAR Information and Camera Information
US17/118,466 2020-12-10

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020220165571A Division KR20220167263A (ko) 2020-12-10 2022-12-01 LiDAR 정보와 카메라 정보의 병합

Publications (2)

Publication Number Publication Date
KR20220083533A true KR20220083533A (ko) 2022-06-20
KR102476931B1 KR102476931B1 (ko) 2022-12-13

Family

ID=74566601

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020210005172A KR102476931B1 (ko) 2020-12-10 2021-01-14 LiDAR 정보와 카메라 정보의 병합
KR1020220165571A KR20220167263A (ko) 2020-12-10 2022-12-01 LiDAR 정보와 카메라 정보의 병합

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020220165571A KR20220167263A (ko) 2020-12-10 2022-12-01 LiDAR 정보와 카메라 정보의 병합

Country Status (5)

Country Link
US (1) US20220185324A1 (ko)
KR (2) KR102476931B1 (ko)
CN (1) CN114627451A (ko)
DE (1) DE102021131820A1 (ko)
GB (1) GB2601837A (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230050467A1 (en) * 2021-08-11 2023-02-16 Gm Cruise Holdings Llc Ground height-map based elevation de-noising
US20230169780A1 (en) * 2021-12-01 2023-06-01 Motional Ad Llc Automatically detecting traffic signals using sensor data
US11842551B1 (en) * 2023-02-07 2023-12-12 DCX Innovations sp. z.o.o. System and methods for automatically detecting objects of interest and determining their geographic positions

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180190046A1 (en) * 2015-11-04 2018-07-05 Zoox, Inc. Calibration for autonomous vehicle operation
KR20180086632A (ko) * 2017-01-23 2018-08-01 한국전자통신연구원 자율주행 차량의 행동 결정 장치 및 방법
US20190138822A1 (en) * 2017-08-25 2019-05-09 Beijing Didi Infinity Technology And Development Co., Ltd. Methods and systems for detecting environmental information of a vehicle
JP2019159380A (ja) * 2018-03-07 2019-09-19 株式会社デンソー 物体検知装置、物体検知方法およびプログラム
KR20200115705A (ko) * 2019-03-08 2020-10-08 현대모비스 주식회사 자율주행용 클래스 레이블링 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10305861A1 (de) * 2003-02-13 2004-08-26 Adam Opel Ag Vorrichtung eines Kraftfahrzeuges zur räumlichen Erfassung einer Szene innerhalb und/oder außerhalb des Kraftfahrzeuges
US8751154B2 (en) * 2008-04-24 2014-06-10 GM Global Technology Operations LLC Enhanced clear path detection in the presence of traffic infrastructure indicator
US10699142B2 (en) * 2017-04-20 2020-06-30 GM Global Technology Operations LLC Systems and methods for traffic signal light detection
JP6984215B2 (ja) * 2017-08-02 2021-12-17 ソニーグループ株式会社 信号処理装置、および信号処理方法、プログラム、並びに移動体
CN111133447B (zh) * 2018-02-18 2024-03-19 辉达公司 适于自主驾驶的对象检测和检测置信度的方法和系统
US10140855B1 (en) * 2018-08-24 2018-11-27 Iteris, Inc. Enhanced traffic detection by fusing multiple sensor data
KR20200065945A (ko) * 2018-11-30 2020-06-09 주식회사 메디트 라이다 데이터와 카메라 객체 인식 데이터를 결합한 정지 신호 발생 방법
KR102195040B1 (ko) * 2019-06-27 2020-12-28 주식회사 모빌테크 이동식 도면화 시스템 및 모노카메라를 이용한 도로 표지 정보 수집 방법
US11348332B2 (en) * 2019-09-25 2022-05-31 Toyota Research Institute, Inc. Object location analysis
US11885886B2 (en) * 2020-10-23 2024-01-30 Ford Global Technologies, Llc Systems and methods for camera-LiDAR fused object detection with LiDAR-to-image detection matching
US20220156576A1 (en) * 2020-11-13 2022-05-19 Amir RASOULI Methods and systems for predicting dynamic object behavior
US20220165304A1 (en) * 2020-11-24 2022-05-26 Nvidia Corporation Trigger-responsive clip extraction based on remote analysis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180190046A1 (en) * 2015-11-04 2018-07-05 Zoox, Inc. Calibration for autonomous vehicle operation
KR20180086632A (ko) * 2017-01-23 2018-08-01 한국전자통신연구원 자율주행 차량의 행동 결정 장치 및 방법
US20190138822A1 (en) * 2017-08-25 2019-05-09 Beijing Didi Infinity Technology And Development Co., Ltd. Methods and systems for detecting environmental information of a vehicle
JP2019159380A (ja) * 2018-03-07 2019-09-19 株式会社デンソー 物体検知装置、物体検知方法およびプログラム
KR20200115705A (ko) * 2019-03-08 2020-10-08 현대모비스 주식회사 자율주행용 클래스 레이블링 장치

Also Published As

Publication number Publication date
US20220185324A1 (en) 2022-06-16
KR20220167263A (ko) 2022-12-20
GB2601837A (en) 2022-06-15
CN114627451A (zh) 2022-06-14
KR102476931B1 (ko) 2022-12-13
DE102021131820A1 (de) 2022-06-15
GB202100131D0 (en) 2021-02-17

Similar Documents

Publication Publication Date Title
CN111915917B (zh) 计算机实现的方法、存储介质和运载工具
CN111664854B (zh) 物体位置指示器系统和方法
KR20210112293A (ko) 주석 달기를 위한 데이터 샘플의 자동 선택
KR20200141477A (ko) 다수의 lidar 디바이스로부터의 데이터의 병합
KR102505717B1 (ko) 교통 신호등 추정
KR102476931B1 (ko) LiDAR 정보와 카메라 정보의 병합
KR20210013594A (ko) 이동식 센서를 사용하여 차량 동작을 개선시키기 위한 시스템 및 방법
KR102555318B1 (ko) 조건부 움직임 예측
KR102639008B1 (ko) 도로 특징부에 대한 폐색 표현을 구현하기 위한 시스템 및 방법
KR20220147006A (ko) 동적 상태를 사용한 자율 주행 차량의 궤적의 계획
KR102461986B1 (ko) 도로 표면 조건 기반 의사 결정 및 예측
KR20210089588A (ko) 신호등 검출을 위한 시스템들 및 방법들
KR20210149624A (ko) Lidar를 사용한 배경 특징부 식별
KR20220042038A (ko) 교정 정보를 사용한 av 경로 계획
KR20230035440A (ko) 교통 신호등 추정
KR20230093184A (ko) 제약으로서의 차선 커넥터
KR102601860B1 (ko) 운전 데이터 기반 공간 계획
KR20230004215A (ko) 셀 분해를 통해 c-슬라이스들을 연결시키는 것에 의한 빠른 충돌 없는 경로 생성
KR102663570B1 (ko) 차량의 궤적을 계획 및 업데이트하기 위한 시스템 및 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant