CN116229407A - 用于运载工具的方法、运载工具和存储介质 - Google Patents
用于运载工具的方法、运载工具和存储介质 Download PDFInfo
- Publication number
- CN116229407A CN116229407A CN202210153218.5A CN202210153218A CN116229407A CN 116229407 A CN116229407 A CN 116229407A CN 202210153218 A CN202210153218 A CN 202210153218A CN 116229407 A CN116229407 A CN 116229407A
- Authority
- CN
- China
- Prior art keywords
- map
- sub
- vehicle
- segmentation mask
- drivable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000011218 segmentation Effects 0.000 claims abstract description 91
- 238000001914 filtration Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000010801 machine learning Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 abstract description 15
- 238000009499 grossing Methods 0.000 abstract description 10
- 238000004891 communication Methods 0.000 description 36
- 230000008569 process Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 7
- 230000000306 recurrent effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000013500 data storage Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 241000282412 Homo Species 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 235000004522 Pentaglottis sempervirens Nutrition 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000001444 catalytic combustion detection Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005237 high-frequency sound signal Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/38—Electronic maps specially adapted for navigation; Updating thereof
- G01C21/3804—Creation or updating of map data
- G01C21/3807—Creation or updating of map data characterised by the type of data
- G01C21/3815—Road data
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3626—Details of the output of route guidance instructions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/10—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 by using measurements of speed or acceleration
- G01C21/12—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 by using measurements of speed or acceleration executed aboard the object being navigated; Dead reckoning
- G01C21/16—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 by using measurements of speed or acceleration executed aboard the object being navigated; Dead reckoning by integrating acceleration or speed, i.e. inertial navigation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/3407—Route searching; Route guidance specially adapted for specific applications
- G01C21/343—Calculating itineraries, i.e. routes leading from a starting point to a series of categorical destinations using a global route restraint, round trips, touristic trips
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/38—Electronic maps specially adapted for navigation; Updating thereof
- G01C21/3804—Creation or updating of map data
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/38—Electronic maps specially adapted for navigation; Updating thereof
- G01C21/3804—Creation or updating of map data
- G01C21/3859—Differential updating map data
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/38—Electronic maps specially adapted for navigation; Updating thereof
- G01C21/3863—Structures of map data
- G01C21/387—Organisation of map data, e.g. version management or database structures
- G01C21/3878—Hierarchical structures, e.g. layering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/38—Electronic maps specially adapted for navigation; Updating thereof
- G01C21/3885—Transmission of map data to client devices; Reception of map data by client devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/09626—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages where the origin of the information is within the own vehicle, e.g. a local storage device, digital map
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/0967—Systems involving transmission of highway information, e.g. weather, speed limits
- G08G1/096708—Systems involving transmission of highway information, e.g. weather, speed limits where the received information might be used to generate an automatic action on the vehicle control
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/0967—Systems involving transmission of highway information, e.g. weather, speed limits
- G08G1/096766—Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission
- G08G1/096775—Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission where the origin of the information is a central station
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/0967—Systems involving transmission of highway information, e.g. weather, speed limits
- G08G1/096766—Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission
- G08G1/096791—Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission where the origin of the information is another vehicle
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
- G08G1/165—Anti-collision systems for passive traffic, e.g. including static obstacles, trees
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
- G08G1/166—Anti-collision systems for active traffic, e.g. moving vehicles, pedestrians, bikes
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2556/00—Input parameters relating to data
- B60W2556/40—High definition maps
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0268—Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means
- G05D1/0274—Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means using mapping information stored in a memory device
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/20—Control system inputs
- G05D1/24—Arrangements for determining position or orientation
- G05D1/246—Arrangements for determining position or orientation using environment maps, e.g. simultaneous localisation and mapping [SLAM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Atmospheric Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Transportation (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Mechanical Engineering (AREA)
- Traffic Control Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及用于运载工具的方法、运载工具和存储介质。提供了用于可驾驶道路段的自动标注的技术,包括但不限于:接收传感器数据、生成地图、将地图划分为不相交的子地图、推断子地图分割掩模、构造所推断的分割掩模、对所推断的分割掩模进行滤波,平滑经滤波的分割掩模,规划针对运载工具的路径并控制运载工具。
Description
技术领域
本说明书涉及二维和/或三维地图中所包括的可驾驶道路段的标注。
背景技术
当自主运载工具从当前地点导航到目的地时,其可以使用预先生成的地图。通常基于用户输入来标注这些预先生成的地图,以识别可驾驶道路段。在生成这样的地图所需的时间以及计算和财务资源两者方面,这是耗时的处理,并且需要大量的资源。
发明内容
根据本发明的一方面,用于运载工具的方法,包括:使用处理电路获得表示环境的地图,其中所述地图包括至少一个地图层;使用所述处理电路来将所述至少一个地图层划分为多个子地图;使用所述处理电路和机器学习模型来推断与至少一个子地图相对应的子地图分割掩模,其中所述子地图将所述子地图的像素识别为与可驾驶道路段相对应;使用所述处理电路,基于所述子地图分割掩模来构造指示在所述至少一个地图层上的所述可驾驶道路段的所推断的分割掩模;使用所述处理电路来对所述所推断的分割掩模进行滤波,以生成经滤波的分割掩模,其中所述滤波是基于所述可驾驶道路段与被对象占据的区域相对应的可能性;以及使用所述处理电路,基于至少一个标准来平滑所述经滤波的分割掩模,以生成具有至少一个连续的所述可驾驶道路段的经平滑的分割掩模。
根据本发明的另一方面,一种运载工具,包括:至少一个处理器;以及至少一个存储器,其上存储有指令,所述指令当由所述至少一个处理执行时,使所述至少一个处理器进行上述方法。
一种非暂时性计算机可读存储介质,包括用于由第一装置的至少一个处理器执行的至少一个程序,所述至少一个程序包括指令,所述指令当由所述至少一个处理器执行时使所述第一装置进行上述方法。
附图说明
图1示出具有自主能力的自主运载工具(AV)的示例。
图2示出示例“云”计算环境。
图3示出计算机系统。
图4示出用于AV的示例架构。
图5示出可由感知系统使用的输入和输出的示例。
图6示出示例道路标注系统的框图。
图7示出图6所示的道路标注系统中所使用的示例推断系统的输入、输出和组件的框图。
图8示出占据地图、子地图和滑动窗口之间的关系的图示。
图9示出自动标注可驾驶道路段的示例处理的流程图。
具体实施方式
在以下描述中,为了解释的目的,阐述了许多具体细节,以便提供对本公开的透彻理解。然而,本公开可以在没有这些具体细节的情况下实施将是明显的。在其他实例中,众所周知的构造和装置是以框图形式示出的,以避免不必要地使本公开模糊。
在附图中,为了便于描述,示出示意要素(诸如表示装置、模块、系统、指令块和数据要素的那些要素)的具体排列或次序。然而,本领域技术人员应当理解,附图中示意要素的具体次序或排列并不意在意味着要求特定的处理次序或序列、或处理过程的分离。此外,在附图中包含示意要素并不意在意味着在所有实施例中都需要这种要素,也不意在意味着由这种要素表示的特征不能包括在一些实施例中或不能在一些实施例中与其他要素结合。
此外,在附图中,连接要素、诸如实线或虚线或箭头用于例示两个或更多个其他示意要素之间的连接、关系或关联,没有任意此类连接要素并不意在意味着不能存在连接、关系或关联。换句话说,一些要素之间的连接、关系或关联未在附图中示出,以便不使本公开内容模糊。此外,为了便于例示,使用单个连接要素来表示要素之间的多个连接、关系或关联。例如,如果连接要素表示信号、数据或指令的通信,本领域技术人员应理解,这种要素表示影响通信可能需要的一个或多于一个信号路径(例如,总线)。
现在将详细参考实施例,其示例在附图中例示出。在以下的详细描述中,阐述了许多具体细节,以便提供对所描述的各种实施例的透彻理解。然而,对于本领域的普通技术人员来说将明显的是,可以在没有这些具体细节的情况下实施所描述的各种实施例。在其他情况下,没有详细描述众所周知的方法、程序、组件、电路和网络,以便不会不必要地使实施例的方面模糊。
下面描述的若干特征各自可以彼此独立地使用,也可以与其他特征的任意组合一起使用。然而,任意个别特征可能不能解决以上所讨论的任意问题,或者只能解决以上所讨论的问题之一。以上所讨论的一些问题可能不能通过本文所描述的任意一个特征得到充分解决。虽然提供了标题,但在本说明书的其他地方也可以找到与具体标题有关但在具有该标题的部分中未找到的信息。本文根据以下概要描述实施例:
1.总体概述
2.系统概述
3.自主运载工具架构
4.自主运载工具输入
5.自主运载工具规划
6.自主运载工具控制
7.可驾驶道路段的自动标注
总体概述
本技术能够实现可驾驶道路段的自动标注。在示例中,在诸如融合地图(mergedmap)等的鸟瞰图数据中识别可驾驶道路段。接收指示运载工具周围环境的传感器数据的多级标注系统基于传感器数据来生成表示周围环境的地图。将地图层划分为子地图,并且针对各个子地图推断指示子地图上的可驾驶道路段的子地图分割掩模(segmentationmask)。基于子地图分割掩模,来构造指示基于地图的所有可驾驶道路段的所推断的分割掩模。基于阈值对所推断的分割掩模进行滤波以生成经滤波的分割掩模,并且基于至少一个标准对经滤波的分割掩模进行平滑以生成具有至少一个连续可驾驶道路段的经平滑的分割掩模。
所公开系统的一些优点包括以下几点。该系统比手动标注更高效地标注可驾驶道路段,并且减少了所需的计算资源和时间。在输出的可驾驶道路段连续的同时,产生的标注也更准确。例如,与环境相关联的传感器数据最终在地图中呈现为可驾驶道路段,从而利用可驾驶道路段改进地图和其他数据表示。本技术还提高了能够根据本文所述的具有可驾驶道路段的地图和其他数据表示进行操作的自主运载工具的效率。
系统概述
图1示出具有自主能力的AV 100的示例。
如本文所使用的,术语“自主能力”是指一种功能、特征或设施,该功能、特征或设施使运载工具能够部分地或完全地操作,而无需实时的人类干预,包括但不限于完全AV、高度AV和有条件AV。
如本文所使用的,自主运载工具(AV)是一种具有自主能力的运载工具。
如本文所使用的,“运载工具”包括货物或人员的运输方式。例如,小汽车、公共汽车、火车、飞机、无人机、卡车、船只、舰艇、潜水器、飞船等。无人驾驶的小汽车是运载工具的示例。
如本文所使用的,“轨迹”是指将AV从第一时空地点导航到第二时空地点的路径或路线。在实施例中,第一时空地点被称为初始地点或起始地点,第二时空地点被称为目的地、最终地点、目标、目标位置或目标地点。在一些示例中,轨迹由一个或多于一个路段(例如,道路的数段)组成,并且各路段由一个或多于一个块(例如,车道或交叉口的一部分)组成。在实施例中,时空地点对应于真实世界地点。例如,时空地点是上车或下车地点,以使人员或货物上车或下车。
如本文所使用的,“(一个或多于一个)传感器”包括一个或多于一个硬件组件,用于检测与传感器周围环境有关的信息。一些硬件组件可包括感测组件(例如,图像传感器、生物特征传感器)、传输和/或接收组件(例如,激光或射频波发射器和接收器)、电子组件(诸如,模数转换器)、数据存储装置(诸如,RAM和/或非易失性存储器)、软件或固件组件和数据处理组件(诸如,专用集成电路)、微处理器和/或微控制器。
如本文所使用的,“场景描述”是一种数据结构(例如,列表)或数据流,其包括由AV运载工具上的一个或多于一个传感器检测到的一个或多于一个分类或标记的对象,或由AV外部的源提供的一个或多于一个分类或标记的对象。
如本文所使用的,“道路”是一个可以被运载工具穿过的物理区域,并且可以对应于已命名的通道(例如,城市街道、州际高速公路等)或可对应于未命名的通道(例如,房屋或办公楼内的行车道、停车场的一段、空置停车场的一段、乡村区域的污物通道等)。因为有些运载工具(例如,四轮驱动的小卡车、越野车等)能够穿过各种不特别适合运载工具行驶的物理区域,因此“道路”可以是任意市政当局或其他政府或行政机构没有正式定义为一条通道的物理区域。
如本文所使用的,“车道”是道路的可被运载工具穿越的部分。有时基于车道标记来识别车道。例如,车道可对应于车道标记之间的大部分或全部空间,或仅对应于车道标记之间的部分空间(例如,小于50%)。例如,具有相距很远的车道标记的道路可能在标记之间容纳两个或两个以上的运载工具,使得一个运载工具可以在不穿过车道标记的情况下超过另一个运载工具,因此可被解释为车道比车道标记之间的空间窄,或车道标记之间有两个车道。在没有车道标记的情况下,也可以对车道进行解释。例如,可以基于环境的物理特征(例如,农村地区的岩石和沿着大道的树木、或者例如在欠发达地区应避免的自然障碍物)来定义车道。也可以独立于车道标记或物理特征来解释车道。例如,可以基于原本缺少将会被解释为车道边界的特征的在区域中无障碍物的任意路径来解释车道。在示例情景中,AV可以解释通过田野或空地的无障碍物部分的车道。在另一示例情景中,AV可以解释通过不具有车道标记的宽(例如,足够两个或更多个车道宽)道路的车道。在该情景中,AV可以将与车道有关的信息通信至其他AV,使得其他AV可以使用相同的车道信息来协调AV之间的路径规划。
“一个或多于一个”包括由一个要素执行的功能、由多个要素例如以分布式的方式执行的功能、由一个要素执行的若干功能、由若干要素执行的若干功能、或上述的任意组合。
还将理解的是,尽管在一些实例中,术语“第一”、“第二”等在本文中是用来描述各种要素的,但这些要素不应受到这些术语的限制。这些术语仅用于区分一个要素与另一个要素。例如,在未背离各种所描述的实施例的范围的情况下,第一触点可被称为第二触点,并且类似地,第二触点可被称为第一触点。第一触点和第二触点两者都是触点,但它们不是相同触点。
在本文所描述的各种实施例的说明书中使用的术语仅用于描述特定实施例的目的,而不是意在限制。如在所描述的各种实施例的说明书和所附权利要求书中所使用的,单数形式“a”、“an”和“the”也意在包括复数形式,除非上下文另有明确说明。还将理解的是,如本文所使用的“和/或”是指并且涵盖一个或多于一个相关清单项目的任意和所有可能的组合。还将理解的是,当在本说明书中使用术语“包括”、“包含”、“具备”和/或“具有”时,具体说明存在所陈述的特征、整数、步骤、操作、要素和/或组件,但并不排除存在或添加一个或多于一个其他特征、整数、步骤、操作、要素、组件、和/或其群组。
如本文所使用的,取决于上下文,术语“如果”可选地被理解为意指“当”或“在当时”或“响应于确定为”或“响应于检测到”。类似地,取决于上下文,短语“如果已确定”或“如果[所陈述的条件或事件]已被检测到”可选地被理解为意指“在确定时”或“响应于确定为“或”在检测到[所陈述的条件或事件]时”或“响应于检测到[所陈述的条件或事件]”。
如本文所使用的,AV系统是指AV以及支持AV操作的硬件、软件、存储的数据和实时生成的数据的阵列。在实施例中,AV系统并入在AV内。在实施例中,AV系统跨若干地点分布。例如,AV系统的一些软件是在类似于下面关于图2描述的云计算环境200的云计算环境上实现的。
一般而言,本文件描述了适用于任意具有一种或多种自主能力的运载工具的技术,包括完全AV、高度AV和有条件AV,诸如分别为所谓的第5级、第4级和第3级运载工具(见SAE国际标准J3016:道路上机动车自动驾驶系统相关术语的分类和定义,通过引用将其全部内容并入本文件,用于了解运载工具自主权等级的更多详细信息)。本文件所描述的技术也适用于部分AV和驾驶员辅助运载工具,诸如所谓的第2级和第1级运载工具(见SAE国际标准J3016:道路上机动车自动驾驶系统相关术语的分类和定义)。在实施例中,一个或多于一个第1级、第2级、第3级、第4级和第5级运载工具系统可基于对传感器输入的处理,在某些操作条件下自动执行某些运载工具操作(例如,转向、制动和使用地图)。本文件中所描述的技术可以使从完全AV到人类操作的运载工具范围内的任意级别的运载工具受益。
AV与需要人类驾驶员的运载工具相比存在优势。一个优势是安全性。例如,在2016年,美国经历了1300万起汽车事故、240万人受伤、40000人死亡和600万辆运载工具碰撞事故,估计社会成本为9100亿美元多。从1965年到2015年,每行驶1亿英里的美国交通事故死亡人数已从约6人减少到约1人,部分是由于运载工具中所部署的附加安全措施。例如,认为与将发生碰撞有关的额外半秒的警告减轻了60%的前后碰撞。然而,被动安全特征(例如,安全带、安全气囊)在改进该数字方面有可能已达到它们的极限。因而,诸如运载工具的自动控制等的主动安全措施是改进这些统计数据的可能的下一步。由于在95%的碰撞中认为人类驾驶员是造成严重碰撞前事件的原因,因此自动驾驶系统例如通过以下操作,有可能实现更好的安全结果:比人类更好地可靠地识别和避免紧急情况;做出比人类更好的决策,比人类更好地遵守交通法规,并且比人类更好地预测将来事件;并且比人类更好地可靠地控制运载工具。
参考图1,AV系统120使运载工具100沿着轨迹198操作,穿过环境190至目的地199(有时称为最终地点),同时避开对象(例如,自然障碍物191、运载工具193、行人192、骑车者和其他障碍物)和遵守道路规则(例如,操作规则或驾驶偏好)。
在实施例中,AV系统120包括用于从计算机处理器146接收操作命令并对其进行操作的装置101。使用术语“操作命令”来表示使得运载工具进行动作(例如,驾驶机动动作)的可执行指令(或指令集)。操作命令可以非限制性地包括用于使运载工具开始向前移动、停止向前移动、开始向后移动、停止向后移动、加速、减速、进行左转和进行右转的指令。在实施例中,计算处理器146与下面参考图3描述的处理器304相似。装置101的示例包括转向控制器102、制动器103、挡位、加速踏板或其他加速控制机构、挡风玻璃雨刮器、侧门锁、窗控器和转向指示器。
在实施例中,AV系统120包括用于测量或推断运载工具100的状态或条件的属性的传感器121,这些属性诸如是AV的位置、线速度和角速度及线加速度和角加速度、以及航向(例如,运载工具100的前端的方向)。传感器121的示例是GPS、测量运载工具线加速度和角速率两者的惯性测量单元(IMU)、用于测量或估计轮滑移率的轮速率传感器、轮制动压力或制动扭矩传感器、引擎扭矩或轮扭矩传感器以及转向角度和角速率传感器。
在实施例中,传感器121还包括用于感测或测量AV的环境的属性的传感器。例如,可见光、红外或热(或两者兼有)光谱的单目或立体摄像机122,LiDAR 123,RADAR,超声波传感器,飞行时间(TOF)深度传感器,速率传感器,温度传感器,湿度传感器和降水传感器。
在实施例中,AV系统120包括数据存储单元142和存储器144,用于存储与计算机处理器146相关联的机器指令或由传感器121收集的数据。在实施例中,数据存储单元142与以下关于图3描述的ROM 308或存储装置310类似。在实施例中,存储器144与下面描述的主存储器306类似。在实施例中,数据存储单元142和存储器144存储有关环境190的历史、实时和/或预测性信息。在实施例中,存储的信息包括地图、驾驶性能、交通拥堵更新或天气条件。在实施例中,与环境190有关的数据从远程数据库134经由通信信道传输到运载工具100。
在实施例中,AV系统120包括通信装置140,用于将对其他运载工具的状态和条件(诸如位置、线速度和角速度、线加速度和角加速度、以及线航向和角航向)测量或推断的属性通信到运载工具100。这些装置包括运载工具到运载工具(V2V)和运载工具到基础设施(V2I)通信装置以及用于通过点对点或自组织(ad hoc)网络或两者进行无线通信的装置。在实施例中,通信装置140跨电磁频谱(包括无线电和光通信)或其他介质(例如,空气和声介质)进行通信。运载工具对运载工具(V2V)、运载工具对基础设施(V2I)通信(以及在一些实施例中为一种或多种其他类型的通信)的组合有时被称为运载工具对所有事物(V2X)通信。V2X通信通常符合一个或多于一个通信标准,用于与AV进行的、在AV之间进行的、在AV之中进行的通信。
在实施例中,通信装置140包括通信接口。例如,有线、无线、WiMAX、Wi-Fi、蓝牙、卫星、蜂窝、光、近场、红外或无线电接口。通信接口将数据从远程数据库134传输到AV系统120。在实施例中,远程数据库134嵌入在如图2中所描述的云计算环境200中。通信装置140将从传感器121收集的数据或与运载工具100操作有关的其他数据传输到远程数据库134。在实施例中,通信装置140向运载工具100传输与遥操作有关的信息。在一些实施例中,运载工具100与其他远程(例如,“云”)服务器136通信。
在实施例中,远程数据库134还存储和传输数字数据(例如,存储诸如道路和街道地点的数据)。这些数据存储在运载工具100上的存储器144中,或者经由通信信道从远程数据库134传输到运载工具100。
在实施例中,远程数据库134存储和传输与以前在一天中类似时间沿着轨迹198行驶的运载工具的驾驶属性有关的历史信息(例如,速率和加速度分布)。在一个实现中,这种数据可以存储在运载工具100上的存储器144中,或者经由通信信道从远程数据库134传输到运载工具100。
位于运载工具100上的计算机处理器146基于实时传感器数据和先验信息两者以算法方式生成控制动作,允许AV系统120执行其自主驾驶能力。
在实施例中,AV系统120包括耦接到计算机处理器146的计算机外围设备132,用于向运载工具100的用户(例如,乘员或远程用户)提供信息和提醒并接收来自该用户的输入。在实施例中,外围设备132类似于下面参考图3讨论的显示器312、输入装置314和光标控制器316。耦接是无线的或有线的。任意两个或更多个的接口装置可以集成到单个装置中。
在实施例中,AV系统120接收并强制执行例如由乘员指定的或者存储在与乘员相关联的简档中的乘员的隐私级别。乘员的隐私级别确定了如何许可使用存储在乘员简档中的以及/或者存储在云服务器136上且与乘员简档相关联的、与乘员相关联的特定信息(例如,乘员舒适度数据、生物测量数据等)。在实施例中,隐私级别指定了一旦搭乘完成则被删除的与乘员相关联的特定信息。在实施例中,隐私级别指定了与乘员相关联的特定信息,并且标识被授权访问该信息的一个或多于一个实体。被授权访问信息的所指定的实体的示例可以包括其他AV、第三方AV系统、或者可以潜在地访问该信息的任意实体。
可以在一个或多于一个粒度级别指定乘员的隐私级别。在实施例中,隐私级别标识要存储或共享的特定信息。在实施例中,隐私级别适用于与乘员相关联的所有信息,使得乘员可以指定不存储或共享他们的个人信息。被许可访问特定信息的实体的指定也可以在各种粒度级别指定。被许可访问特定信息的各种实体集例如可以包括其他AV、云服务器136、特定第三方AV系统等。
在实施例中,AV系统120或云服务器136确定AV 100或另一实体是否可访问与乘员相关联的某些信息。例如,试图访问与特定时空地点有关的乘员输入的第三方AV系统必须例如从AV系统120或云服务器136获得授权,以访问与乘员相关联的信息。例如,AV系统120使用乘员的指定隐私级别来确定是否可以将与时空地点有关的乘员输入呈现给第三方AV系统、AV 100或另一AV。这使得乘员的隐私级别能够指定允许哪些其他实体接收与乘员的动作有关的数据或与乘员相关联的其他数据。
图2示出示例“云”计算环境。云计算是一种服务交付模式,用于使得能够方便、按需地在网络上访问可配置计算资源(例如网络、网络带宽、服务器、处理、内存、存储、应用程序、虚拟机和服务)的共享池。在典型的云计算系统中,一个或多于一个大型云数据中心容纳用于交付云所提供的服务的机器。现在参考图2,云计算环境200包括通过云202互连的云数据中心204a、204b和204c。数据中心204a、204b和204c为连接到云202的计算机系统206a、206b、206c、206d、206e和206f提供云计算服务。
云计算环境200包括一个或多于一个云数据中心。一般而言,云数据中心(例如图2中所示的云数据中心204a)是指构成云(例如图2中所示的云202或云的特定部分)的服务器的物理排列。例如,服务器在云数据中心中物理排列成房间、组、行和机架。云数据中心有一个或多于一个区域,其中包括一个或多于一个服务器房间。每个房间有一行或多行服务器,并且各个行包括一个或多于一个机架。各个机架包括一个或多于一个单独的服务器节点。在一些实现中,区域、房间、机架和/或行中的服务器基于数据中心设施的物理基础设施要求(包括电力、能源、热力、热源和/或其他要求)被排列成若干组。在实施例中,服务器节点类似于图3中描述的计算机系统。数据中心204a具有许多分布在多个机架上的计算系统。
云202包括云数据中心204a、204b和204c以及用于连接云数据中心204a、204b和204c并有助于促进计算系统206a-f对云计算服务的访问的网络和网络资源(例如,网络设备、节点、路由器、交换机和网络电缆)。在实施例中,该网络表示一个或多于一个本地网络、广域网或通过使用地面或卫星连接部署的有线或无线链路耦接的网际网络的任意组合。通过网络交换的数据使用多种网络层协议(诸如,因特网协议(IP)、多协议标签交换(MPLS)、异步传输模式(ATM)、帧中继(Frame Relay)等)进行传输。此外,在网络表示多个子网络的组合的实施例中,在每个底层子网络上使用不同的网络层协议。在一些实施例中,网络表示一个或多于一个互连网际网络(诸如公共因特网等)。
计算系统206a-f或云计算服务消费者通过网络链路和网络适配器连接到云202。在实施例中,计算系统206a-f被实现为各种计算装置,例如服务器、台式机、膝上型计算机、平板电脑、智能手机、物联网(IoT)装置、AV(包括小汽车、无人机、航天飞机、火车、公共汽车等)和消费电子产品。在实施例中,计算系统206a-f在其他系统中实现或作为其他系统的一部分实现。
图3示出计算机系统300。在实现中,计算机系统300是一种专用计算装置。专用计算装置被硬连线以执行这些技术,或包括诸如一个或多于一个专用集成电路(ASIC)或现场可编程门阵列(FPGA)的被持久编程为执行上述技术的数字电子装置,或可包括一个或多于一个通用硬件处理器,这些硬件处理器经编程以根据固件、存储器、其他存储器、或者组合中的程序指令执行这些技术。这种专用的计算装置还可以将定制的硬线逻辑、ASIC或FPGA与定制的编程相结合来完成这些技术。在各种实施例中,专用计算装置是台式计算机系统、便携式计算机系统、手持装置、网络装置或包含硬线和/或程序逻辑以实现这些技术的任意其他装置。
在实施例中,计算机系统300包括总线302或用于传达信息的其他通信机制、以及与总线302耦接以处理信息的处理器304。处理器304是例如通用微处理器。计算机系统300还包括主存储器306,诸如随机存取存储器(RAM)或其他动态存储装置,该主存储器306耦接到总线302以存储信息和指令,该信息和指令由处理器304执行。在一个实现中,主存储器306用于在执行要由处理器304执行的指令期间存储临时变量或其他中间信息。当这些指令存储在处理器304可访问的非暂时性存储介质中时,使计算机系统300变成一个专用机器,该机器被定制以执行指令中指定的操作。
在实施例中,计算机系统300还包括只读存储器(ROM)308或耦接到总线302的其他静态存储装置,用于存储处理器304的静态信息和指令。提供诸如磁盘、光盘、固态驱动器或三维交叉点存储器的存储装置310,并且该存储装置310耦接到总线302以存储信息和指令。
在实施例中,计算机系统300经由总线302耦接到诸如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、发光二极管(LED)显示器或用于向计算机用户显示信息的有机发光二极管(OLED)显示器的显示器312。包括字母数字键和其他键的输入装置314耦接到总线302,用于向处理器304通信信息和命令选择。另一种类型的用户输入装置是光标控制器316,诸如鼠标、轨迹球、触控显示器或光标方向键,用于将方向信息和命令选择通信到处理器304,并用于控制光标在显示器312上的移动。这种输入装置通常具有两个轴(第一轴(例如,x轴)和第二轴(例如,y轴))上的两个自由度,这两个轴允许装置指定平面上的位置。
根据一个实施例,本文的技术由计算机系统300响应于处理器304执行主存储器306中包含的一个或多于一个指令的一个或多于一个序列而执行。这些指令从诸如存储装置310的另一存储介质读入主存储器306。执行主存储器306中包含的指令序列使处理器304执行本文所描述的过程步骤。在替代实施例中,使用硬连线电路代替或与软件指令结合使用。
如本文所使用的术语“存储介质”是指存储数据和/或指令的任意非暂时性介质,这些数据和/或指令使机器以特定方式操作。这种存储介质包括非易失性介质和/或易失性介质。非易失性介质例如包括诸如存储装置310的光盘、磁盘、固态驱动器或三维交叉点存储器。易失性介质包括动态存储器,诸如主存储器306。存储介质的常见形式包括例如软盘、软磁盘、硬盘、固态驱动器、磁带或任意其他磁数据存储介质、CD-ROM、任意其他光数据存储介质、任意具有孔型的物理介质、RAM、PROM和EPROM、FLASH-EPROM、NV-RAM、或任意其他存储芯片或存储盒。
存储介质有别于传输介质,但可以与传输介质相结合使用。传输介质参与存储介质之间的信息传送。例如,传输介质包括同轴电缆、铜线和光纤,其包括具备总线302的电线。传输介质也可以采取声波或光波的形式,诸如在无线电波和红外数据通信过程中产生的声波或光波。
在实施例中,各种形式的介质涉及将一个或多于一个指令的一个或多于一个序列承载到处理器304以供执行。例如,这些指令最初是在远程计算机的磁盘或固态驱动器上执行的。远程计算机将指令加载到其动态存储器中,并使用调制解调器通过电话线路发送指令。计算机系统300的本地调制解调器接收电话线路上的数据,并使用红外发射器将数据转换为红外信号。红外检测器接收红外信号中承载的数据,并且适当的电路将数据放置在总线302上。总线302将数据承载到主存储器306,处理器304从主存储器306检索并执行指令。主存储器306接收的指令可以可选地在处理器304执行之前或之后存储在存储装置310上。
计算机系统300还包括耦接到总线302的通信接口318。通信接口318提供耦接到连接至本地网络322的网络链路320的双向数据通信。例如,通信接口318是综合业务数字网(ISDN)卡、电缆调制解调器、卫星调制解调器或用以提供与相应类型电话线路的数据通信连接的调制解调器。作为另一示例,通信接口318是局域网(LAN)卡,用于提供与兼容LAN的数据通信连接。在一些实现中,无线链路也被实现。在任意这种实现中,通信接口318发送和接收承载表示各种类型的信息的数字数据流的电、电磁或光信号。
网络链路320通常通过一个或多于一个网络向其他数据装置提供数据通信。例如,网络链路320通过本地网络322提供与主计算机324或与由因特网服务提供商(ISP)326运营的云数据中心或设备的连接。ISP 326又通过现在通常称为“因特网”328的世界范围分组数据通信网络来提供数据通信服务。本地网络322和因特网328两者都使用承载数字数据流的电、电磁或光信号。通过各种网络的信号以及网络链路320上并通过通信接口318的信号是传输介质的示例形式,其中这些信号承载了进出计算机系统300的数字数据。在实施例中,网络320包含上述云202或云202的一部分。
计算机系统300通过(一个或多于一个)网络、网络链路320和通信接口318发送消息和接收包括程序代码的数据。在实施例中,计算机系统300接收用于处理的代码。接收到的代码在接收到时由处理器304执行,和/或存储在存储装置310中,或存储在其他非易失性存储装置中以便以后执行。
自主运载工具架构
图4示出用于AV(例如,图1所示的运载工具100)的示例架构400。架构400包括感知系统402(有时称为感知电路)、规划系统404(有时称为规划电路)、控制系统406(有时称为控制电路)、定位系统408(有时称为定位电路)和数据库系统410(有时称为数据库电路)。各系统在运载工具100的操作中发挥作用。共同地,系统402、404、406、408和410可以是图1所示的AV系统120的一部分。在一些实施例中,系统402、404、406、408和410中的任意系统是计算机软件(例如,计算机可读介质上所存储的可执行代码)和计算机硬件(例如,一个或多于一个微处理器、微控制器、专用集成电路[ASIC]、硬件存储器装置、其他类型的集成电路、其他类型的计算机硬件、或者这些硬件中的任意或所有的组合)的组合。系统402、404、406、408和410各自有时被称为处理电路(例如,计算机硬件、计算机软件、或者这两者的组合)。系统402、404、406、408和410中的任意或全部的组合也是处理电路的示例。
在使用中,规划系统404接收表示目的地412的数据,并且确定表示运载工具100为了到达(例如,抵达)目的地412而可以行驶的轨迹414(有时称为路线)的数据。为了使规划系统404确定表示轨迹414的数据,规划系统404从感知系统402、定位系统408和数据库系统410接收数据。
感知系统402使用例如也如图1所示的一个或多于一个传感器121来识别附近的物理对象。将对象分类(例如,分组成诸如行人、自行车、汽车、交通标志等的类型),并且将包括经分类的对象416的场景描述提供至规划系统404。
规划系统404还从定位系统408接收表示AV位置418的数据。定位系统408通过使用来自传感器121的数据和来自数据库系统410的数据(例如,地理数据)以计算位置来确定AV位置。例如,定位系统408使用来自GNSS(全球导航卫星系统)传感器的数据和地理数据来计算AV的经度和纬度。在实施例中,定位系统408所使用的数据包括具有行车道几何属性的高精度地图、描述道路网络连接属性的地图、描述行车道物理属性(诸如交通速率、交通量、运载工具和自行车车道的数量、车道宽度、车道交通方向、或车道标记类型和地点,或者它们的组合)的地图、以及描述道路特征(诸如十字路口、交通标志或各种类型的其他行驶信号等)的空间地点的地图。在实施例中,高精度地图是通过将数据经由自动或手动注释添加到低精度地图所构建的。
控制系统406接收表示轨迹414的数据和表示AV位置418的数据,并且以将使得运载工具100行驶轨迹414到达目的地412的方式来操作AV的控制功能420a~420c(例如,转向、油门、制动、点火)。例如,如果轨迹414包括左转,则控制系统406将以如下方式操作控制功能420a~420c:转向功能的转向角度将使得运载工具100左转,并且油门和制动将使得运载工具100在进行转弯之前暂停并等待经过的行人或运载工具。
自主运载工具输入
图5示出感知系统402(图4)所使用的输入502a-502d(例如,图1中所示的传感器121)和输出504a-504d(例如,传感器数据)的示例。一个输入502a是LiDAR(光检测和测距)系统(例如,图1所示的LiDAR 123)。LiDAR是使用光(例如,诸如红外光等的一道光)来获得与其视线中的物理对象有关的数据的技术。LiDAR系统产生LiDAR数据作为输出504a。例如,LiDAR数据是用于构造环境190的表示的3D或2D点(也称为点云)的集合。
另一输入502b是RADAR(雷达)系统。RADAR是使用无线电波来获得与附近的物理对象有关的数据的技术。RADAR可以获得与不在LiDAR系统的视线内的对象有关的数据。RADAR系统产生RADAR数据作为输出504b。例如,RADAR数据是用于构造环境190的表示的一个或多于一个射频电磁信号。
另一输入502c是照相机系统。照相机系统使用一个或多于一个照相机(例如,使用诸如电荷耦接器件[CCD]等的光传感器的数字照相机)来获取与附近的物理对象有关的信息。照相机系统产生照相机数据作为输出504c。照相机数据通常采用图像数据(例如,诸如RAW、JPEG、PNG等的图像数据格式的数据)的形式。在一些示例中,照相机系统具有例如为了立体影像(立体视觉)的目的的多个独立照相机,这使得照相机系统能够感知深度。尽管照相机系统所感知的对象在这里被描述为“附近”,但这是相对于AV而言的。在一些实施例中,照相机系统被配置为“看见”远处的(例如,AV前方的远至1公里或更远的)对象。因此,在一些实施例中,照相机系统具有为了感知遥远的对象而优化的诸如传感器和镜头等的特征。
另一输入502d是交通灯检测(TLD)系统。TLD系统使用一个或多于一个照相机来获得与交通灯、街道标志和提供视觉导航信息的其他物理对象有关的信息。TLD系统产生TLD数据作为输出504d。TLD数据经常采用图像数据(例如,诸如RAW、JPEG、PNG等的图像数据格式的数据)的形式。TLD系统与包含照相机的系统的不同之处在于:TLD系统使用具有宽视场(例如,使用广角镜头或鱼眼镜头)的照相机,以获得与尽可能多的提供视觉导航信息的物理对象有关的信息,使得运载工具100能够访问这些对象所提供的所有相关导航信息。例如,TLD系统的视角为约120度或更大。
在一些实施例中,使用传感器融合技术来组合输出504a-504d。因而,将个体输出504a-504d提供至运载工具100的其他系统(例如,提供至如图4所示的规划系统404),或者可以采用相同类型的单个组合输出或多个组合输出(例如,使用相同组合技术或组合相同输出或者这两者)或不同类型的单个组合输出或多个组合输出(例如,使用不同的各个组合技术或组合不同的各个输出或者这两者)的形式,将组合输出提供至其他系统。在一些实施例中,使用早期融合技术。早期融合技术的特征在于:在将一个或多于一个数据处理步骤应用到组合输出之前,将输出组合。在一些实施例中,使用后期融合技术。后期融合技术的特征在于:在将一个或多于一个数据处理步骤应用到个体输出之后,将输出组合。
可驾驶道路段的自动标注
图6示出示例道路标注系统600的框图。在实施例中,道路标注系统600是图4所示的处理电路的一部分。在实施例中,道路标注系统600是图2所示的云202的一部分。通常,道路标注系统600通过将地图数据的部分标记为与环境的可驾驶区域相对应来标注地图数据。可驾驶区域是运载工具可穿过的环境的部分(例如,物理区域)。例如,可驾驶区域是与已命名的通道(例如,城市街道、州际高速公路等)相对应的道路。在示例中,可驾驶区域是与未命名的通道(例如,房屋或办公楼内的行车道、停车场的一段、空置停车场的一段、乡村区域的污物通道等)相对应的道路。为便于描述,可驾驶区域被称为可驾驶道路。然而,本技术不限于特定的道路类型,任意道路都可以根据本技术进行标记。在示例中,标签将区域标识为可驾驶道路段的部分或不可驾驶道路段的部分。在实施例中,道路标注系统600是AV(诸如图1所示的AV 100等)上的独立系统。在实施例中,道路标注系统600是图3所示的处理器304的一部分。在实施例中,道路标注系统600是图2所示的云202中的远程处理器的一部分。
道路标注系统600将AV的传感器602所输出的传感器数据604作为输入。在实施例中,传感器602包括如图5所示的至少一个LiDAR 502a、至少一个RADAR 502b或至少一个照相机502c。相应地,在实施例中,传感器数据604包括点云形式的LiDAR数据504a、一个或多于一个射频电磁信号形式的RADAR数据504b和图像数据形式的照相机数据504c中的至少一个。在实施例中,使用其他传感器和来自传感器的相应数据。例如,使用能够发射和接收高频声音信号的超声装置。超声装置生成用作道路标注系统600的输入的声音数据。
地图构造器606使用传感器数据604来生成表示AV(例如,图1的AV 100)的周围环境的地图。通常,地图构造器606生成至少一个语义地图层。在实施例中,各个层包括表征相应物理区域的信息。例如,语义地图层包括表征可驾驶区域、行人区域、停车区域、自行车车道和高占据率运载工具区域等的信息。对于传统数据,手动标注区域以指示来表征物理区域。在实施例中,本技术实现语义地图层的自动标注。如本文所述的语义地图层的自动标注增加了可用的所准确标记的地图的数量。为了便于描述,本技术被描述为具有可驾驶区域的地图的自动标注。然而,本技术可以利用其他数据标注地图,并且可驾驶区域用于示例性目的。
在实施例中,地图是占据地图608。占据地图(也称为占据栅格)是基于环境中对象的存在的环境表示。在实施例中,占据地图608是二维(2D)地图,其中占据地图608的各个单元表示AV周围环境中的离散化空间(例如,均匀划分的2D块)。将空间离散为单元通常基于预定义的占据地图大小(例如,预定义的宽度和长度)。分配给占据地图608的各个单元的值表示与单元相对应的空间被对象(例如,行人和/或运载工具等)遮挡或占据的可能性。在实施例中,占据地图608中针对给定单元的更高值指示空闲空间或者既不被对象占据也未相对于AV上的传感器602的视图被遮挡的空间的更低概率。当用作图像时,占据地图608使空闲空间显示为更亮区域(例如,具有更高像素值的区域),而被占据的空间显示为更暗区域(例如,具有更低像素值的区域)。例如,如果与占据地图608中的像素相对应的空间相对于AV是不可见的(例如当该空间位于遮挡AV上的传感器602的视图的建筑物后面时),则该像素被分配为0。在这样的示例中,占据地图608是像素值范围为0至255的8位灰度图像,其中像素值0表示黑色或最暗强度像素。
推断系统610将占据地图608作为输入,推断系统610生成指示可驾驶道路段的地点的所推断的分割掩模612。在示例中,所推断的分割掩模612是确定为可驾驶的一个或多于一个道路段。如关于图7所述,通过机器学习算法来生成所推断的分割掩模。通常,推断系统610包括机器学习算法,诸如人工神经网络(例如,诸如U-Net等的卷积神经网络)等。在一些示例中,道路标注系统600使用机器学习算法来确定来自输入占据地图608的给定像素与可驾驶道路段相对应,并且生成作为分类为可驾驶区域的像素集的所推断的分割掩模612。通常,为了进行预测,推断系统610对占据地图608的被称为子地图的小片进行操作。下面参考图7得出与推断系统610以及对子地图进行的操作的进一步细节。还可以使用其他图,包括但不限于强度图、纹理(法线)图以及由一个或多于一个其他机器学习模型(诸如图像分割网络或点云分割网络等)输出的地图。
所推断的分割掩模612包含一个或多于一个可驾驶区域的标识,该标识由推断系统610基于占据地图608来输出。在实施例中,所推断的分割掩模612是与占据地图608具有相同大小(例如,相同尺寸)的地图。在实施例中,所推断的分割掩模612是包含两个标签(例如,0和1,其中0指示非可驾驶道路段,1指示可驾驶道路段)的2D二值化地图(binary map)。例如,所推断的分割掩模612是图像形式的2D二值化地图,其中,如果推断系统610预测占据地图608的相应像素为可驾驶道路段,则所推断的分割掩模612的像素被分配为1,以及如果推断系统610预测占据地图608的相应像素不是可驾驶道路段的部分,则该像素被分配为0。在另一实施例中,使用另一布尔值来区分所推断的分割掩模612中的可驾驶道路段和非可驾驶道路段。为简单起见,以下讨论将值1分配给可驾驶道路段,将标签0分配给非可驾驶(例如,不可驾驶)道路段。
在实施例中,所推断的分割掩模612被提供为滤波系统614的输入。滤波系统614基于阈值对所推断的分割掩模612进行滤波以生成经滤波的分割掩模616。通常,滤波系统614重新标记所推断的分割掩模612的一些像素。在实施例中,滤波系统614重新标记所推断的分割掩模612的假阳性(false positives)(例如,应该标记为0但被标记为1的像素),以生成经滤波的分割掩模616。重新标记增大了经滤波的分割掩模616中的标签的准确性。下面参考图7得出关于假阳性的进一步细节。
滤波系统614基于阈值来重新标记假阳性。在实施例中,阈值是与相应占据地图608中的占据可能性相关联的值。例如,在实施例中,阈值是预定义的数值,诸如0.1等。在本示例中,如果分配给占据地图的单元的值大于/小于该值,则然后与像素/单元相关联的标签将被重新标记。在示例中,重新标记是指将当前标签更改为不同的标签。在实施例中,阈值是动态确定的值,诸如相应占据地图608中的可能性值的第1四分位数。
如果所推断的分割掩模612包括位于与相应占据地图608中的可能性低的空闲空间相关联的区域(例如,运载工具上的传感器范围以外的区域)中的可驾驶道路段,则所标记的可驾驶道路段可能被错误标记或者可能是AV不关注的。在相应占据地图608中具有低于阈值的可能性值的所标记的可驾驶道路段被视为假阳性,并且被重新标记为不是可驾驶道路段。例如,如果所推断的分割掩模612的像素标记为1(例如,可驾驶道路段的部分),但是占据地图608中的相应像素具有不满足阈值的像素值,则标记为1的像素位于运载工具未充分探索的区域中,并且被认为是假阳性。滤波系统614将像素重新标记为0(例如,不是可驾驶道路段的部分)。在另一示例中,所推断的分割掩模612使得与远离运载工具且运载工具看不见的区域(例如,在相应占据地图608中具有0值像素的区域)相对应的像素被标记为1(例如,可驾驶道路段的部分)。滤波之后,得到的经滤波的分割掩模616将这些像素重新标记为0。在示例中,重新标记的分割掩模是经滤波的分割掩模616。由于校正和重新标记假阳性,因此经滤波的分割掩模616比所推断的分割掩模612更准确。
在实施例中,提供经滤波的分割掩模616作为平滑系统618的输入。平滑系统618基于一些标准和标准集来平滑经滤波的分割掩模616,以生成包含至少一个连续可驾驶道路段的输出分割掩模620。在实施例中,因为假设为AV在连接的道路段上行驶,所以标准是由所有所识别的可驾驶道路段的轮廓包围的最大区域。AV不太关注未连接到AV正在行驶的道路段的道路段(例如,跨河流的道路段和/或限制区域后面的道路段等),因此该道路段被忽略。
例如,经滤波的分割掩模616可以包含伪影阳性标签(例如,在运载工具无法导航的诸如公园和/或广场等的区域中标记为1的像素)。通常,伪影是环境中不存在可驾驶区域的、被标记为可驾驶区域的地图地点。在实施例中,平滑系统618确定经滤波的分割掩模616上标记为1的一个或多于一个像素(即,所有标记的道路段)的轮廓。在实施例中,平滑系统618基于至少一个标准来去除路段。在此示例中,由于AV在连接的道路段上行驶,因此可驾驶区域基于所有所识别的可驾驶道路段的轮廓所包围的最大区域进行限制。另外,如果路段满足地点标准(诸如未连接到AV正在行驶的道路段、位于跨河流或闭塞处、或者是限制区域后面的道路段),则该路段将从分割掩模中去除。在实施例中,该路段被重新标记为非可驾驶道路段。在实施例中,使用边缘检测进行轮廓确定。
平滑系统618通过将所识别的可驾驶道路段与标准进行比较,来去除噪声或伪影阳性标签。在实施例中,平滑系统618仅将具有最大区域的连续路段保持为可驾驶道路段,并将所有其他路段重新标记为不可驾驶道路段(例如,将较小路段中的所有像素重新标记为0)。在平滑之后,平滑系统618生成连续的输出分割掩模620。产生的输出分割掩模620包含至少一个连续可驾驶道路的标签。
在实施例中,所输出的分割掩模620作为输入提供给规划针对运载工具的路径或动作的规划器622。在实施例中,规划器622是规划电路404的部分。
图7是在图6所示的道路标注系统600中使用的示例推断系统610的框图。示例推断系统610的输入是所输入的占据地图608。将输入占据地图608提供给地图分割系统702。在实施例中,地图分割系统702将输入占据地图608划分为占据地图608的一个或多于一个子地图704。在示例中,子地图所表示的物理区域与占据地图608所表示的物理区域的至少一部分相对应。在实施例中,子地图704是不相交的,或者没有重叠区域。在实施例中,子地图704具有重叠区域。在实施例中,子地图704具有相同的大小(例如,相同的尺寸)。在实施例中,子地图具有不同的大小。
预测系统706将子地图704作为输入,并生成预测区域708,也称为子地图分割掩模。预测区域708包含指示可驾驶道路段是否在子地图704中的标签。在实施例中,预测系统706是机器学习算法。在这样的实施例中,预测系统706是人工神经网络。下面的讨论假设预测系统706是人工神经网络。然而,预测系统706可以是任意合适的机器学习模型。
在实施例中,预测系统706是包含至少一个卷积层的卷积神经网络。例如,预测系统706基于通常用于生物医学图像分割但可用于一般分割任务的U-Net。卷积层是神经网络中对层的输入进行卷积的层。卷积是卷积内核(例如,5x5的矩阵等)与输入张量进行卷积以产生新的张量的操作。在实施例中,预测系统706是卷积层替换全连接层的全卷积神经网络。
在实施例中,预测系统706是包含至少一个递归层的递归神经网络。递归层是具有内部存储器的神经网络层。只要有新的输入,存储器就会更新。使用当前输入和内部存储器两者来计算递归层的输出。
在实施例中,预测区域708是与其相对应的子地图704具有相同大小的二值化分割掩模(例如,2D二值化地图)。针对各个子地图,预测系统706为子地图的各个像素确定标签1(例如,其是可驾驶道路段的部分)或标签0(例如,其不是可驾驶道路段的部分)。标签形成相应的预测区域708。
将输入占据地图608划分为更小的子地图704通常减少示例推断系统610所需的计算时间和计算资源量。因为用于评估若干小尺寸子地图704的参数数量显著低于用于评估大尺寸的输入占据地图608的参数数量,由于预测系统706包含与输入的大小成比例(通常为指数)的多个参数,因此评估多个小尺寸子地图704通常比评估大尺寸的输入占据地图608更快。
在实施例中,在预测系统706的训练期间,到预测系统706的预测系统706输入大部分是作为训练样本的正样本。正样本指的是带有被明确地识别为可驾驶区域的路段的样本子地图。相反,负样本指的是具有很少或没有可驾驶道路段的采样子地图。传统上,为了训练诸如预测系统706等的神经网络,所需的训练样本是包含大致相等数量的正样本和负样本的平衡集。有目的地使用大部分正样本作为训练样本几乎是训练预测系统706所需的训练样本数量的一半。更少的训练样本还减少训练预测系统706所需的时间。此外,使用大部分正样本作为训练样本增强了预测系统706标记可驾驶道路段的能力。在实施例中,由图6所示的滤波系统614来纠正假阳性。
在实施例中,在预测系统706的训练期间,用于训练预测系统706的损失函数是二值(binary)交叉熵损失,也称为sigmoid交叉熵损失。在实施例中,用于训练预测系统706的损失函数是二值交叉熵损失和其他损失函数的组合。
在实施例中,在预测系统706的训练期间,经由反向传播来更新预测系统706中的权重,使得由预测系统706生成的预测区域708中的输出标签收敛于地面真值数据中的标签。在实施例中,地面真值数据是由专家手动标记的标签组成的2D二值化地图。下面参考图8得出与更新预测系统706的权重有关的更多细节。
在预测系统706的操作期间,预测系统706将一个或多于一个子地图704作为输入,并且并行或串行地为各个子地图704生成预测区域708。在这样的实施例中,构造了包含两个或多于两个相邻子地图704的部分的滑动窗口(例如,方形或矩形框)。根据地面真值数据中的相应片来评估来自滑动窗口所限定的区域的(例如,在两个或多于两个相应的预测区域708中的)输出标签。从滑动窗口所限定的区域(或该区域的一部分)输出标签以收敛于地面真值数据(或其相应部分),以生成预测区域708。在实施例中,经由反向传播来更新预测系统706中的权重,使得来自预测系统706的输出标签收敛于地面真值数据中的标签。下面参考图8得出与更新预测系统706的权重有关的更多细节。
滑动窗口确保产生的预测是一致的。换句话说,滑动窗口确保在可驾驶道路段内,非可驾驶道路段没有大的孔洞。如果滑动窗口中有可驾驶道路段,则将连续的标签分配给相应的输出。换句话说,所预测的道路段在相应的预测区域708中是连续的。
在实施例中,预测系统706包括递归神经网络,其在不使用滑动窗口的情况下学习相邻或相关联的子地图704之间的空间关系并且对可驾驶道路段进行连续的预测。在递归神经网络中,不需要滑动窗口来实施可驾驶道路段的连续标记。
然而,卷积神经网络的训练和评估要比递归神经网络快得多。滑动窗口确保在基于卷积神经网络的预测系统706中的连续标记可驾驶道路段。此外,输入到基于卷积神经网络的预测系统706的子地图704应当具有相同的大小。虽然包含重叠的子地图704可允许递归神经网络更快地学习子地图之间的空间关系,但滑动窗口可增强在跨不相交的子地图704的预测区域708中的一致性。另外,由于不相交的子地图704通常比包含重叠的子地图704具有更小的尺寸,因此不相交的子地图704是卷积神经网络的优选输入。
在下面的讨论中,我们假设预测系统706基于卷积神经网络,所输入的子地图704是不相交的,并且在使用预测系统706生成预测区域708时使用滑动窗口。
在实施例中,滑动窗口在输入占据地图608上水平或垂直滑动。滑动窗口的移动允许预测系统706在输入占据地图608上标记可驾驶道路段,这些道路段由若干不相交的子地图704分区为不相交的部分。下面参考图8得出关于子地图704、滑动窗口以及滑动窗口确保产生的预测是一致的原因的更多细节。
组合系统710将预测区域708作为输入,并生成所推断的分割掩模612。组合系统根据输入占据地图608中的相应子地图704的地点来排列预测区域708。在实施例中,所推断的分割掩模612具有与输入占据地图608相同的大小和尺寸。
图8是在训练基于卷积神经网络的预测系统706期间的占据地图608、子地图704和滑动窗口800的图示。图8中示出示例占据地图608的部分。在实施例中,占据地图608被划分为若干大小相等且不相交的子地图704。一些示例子地图704显示为以虚线为边界,诸如子地图A 802、子地图B 804和子地图C 806等。在实施例中,由实线限定的滑动窗口800(包括滑动窗口位置A 808和滑动窗口位置B 810)跨子地图A 802、B 804和C 806移动到多个地点。滑动窗口位置A 808包含子地图A 802和子地图B 804的不相交部分,而滑动窗口位置B810包含子地图B 804和子地图C 806的不相交部分。在实施例中,滑动窗口位置A 808和滑动窗口位置B 810是不相交的或不重叠的。
在实施例中,子地图A 802、子地图B 804和子地图C 806是预测系统706的输入。子地图A 802、B 804或C 806中的各个都具有由预测系统706生成的相应的输出预测区域708(图中未示出)。针对给定的子地图A 802、B 804或C 806,当预测当前区域是可驾驶区域或不是可驾驶区域时,在反向传播期间仅考虑输出预测区域708的由滑动窗口800所覆盖的相应部分。例如,针对子地图A 802的预测区域708,仅考虑子地图A 802和滑动窗口位置A 808之间的交集(intersection)。对照着地面真值中的标签,评估交集(靠近预测区域708的边界)中的输出标签。根据所使用的损失函数传播输出标签和地面真值之间的差的梯度,以经由反向传播来更新预测系统706中的权重。在反向传播中,仅更新与预测系统706中的交集相关联的权重,而保持其他权重不变。因为需要更少的权重更新并且与预测区域708的边界相关联的权重发生更多更新,所以在反向传播期间更新所选择的权重使得由预测系统706生成的不相交的预测区域708中的标签能够更快地收敛。
来自相邻子地图(例如,子地图804)的预测区域708的输出标签在类似处理中收敛到地面真值。来自子地图802和子地图804的输出标签指示由地面真值数据指示的连续可驾驶道路段。尽管分区的道路段位于不相交的子地图中,但滑动窗口允许预测系统706(特别是在预测区域708的边界周围)生成针对连续可驾驶道路段的连续标签。
在实施例中,在多次迭代中进行反向传播,使得输出标签收敛于地面真值标签。在反向传播之后,与子地图A 802、B 804或C 806相对应的输出预测区域708的并集指示连续可驾驶道路段。利用滑动窗口800的预测允许跨不相交的输出预测区域708的标签的一致性和连续性。
滑动窗口800沿着双头箭头指示的方向或背着双头箭头指示的方向水平地或垂直地移动到新地点。这确保滑动窗口800覆盖整个输入占据地图608。这允许甚至不相交的预测区域708(也称为子地图分割掩模)包含连续的标签。通过组合子地图分割掩模区域708而形成的推断分割掩模612结果输出包含了针对可驾驶道路段的连续标签。
图9示出用于自动标注运载工具的可驾驶道路段的处理900的流程图。在实施例中,运载工具是图1所示的AV 100。在实施例中,处理900由至少一个处理器(诸如图3所示的处理器304等)执行。在实施例中,处理900由图4所示的感知系统402、规划系统404、控制系统406和定位系统408中的至少一个执行。在实施例中,处理900由图2所示的云202中的至少一个远程处理器执行。
在框902,处理器接收指示运载工具周围的环境的传感器数据。在实施例中,传感器数据是如图6所示的从传感器602获得的传感器数据604。
在框904,处理器获得表示周围环境的地图。在实施例中,地图是如图6所示的占据地图608。
在框906,处理器将占据地图划分为子地图(例如,不相交的子地图)。在实施例中,子地图是如图7所示的子地图704。
在框908,针对各个子地图,处理器利用机器学习模型来推断指示子地图上的可驾驶道路段的子地图分割掩模。在实施例中,子地图分割掩模是如图7所示的从预测系统706生成的预测区域708。
在框910,处理器基于指示各个子地图上确定的可驾驶道路段的子地图分割掩模,构造指示地图上的所有可驾驶道路段的所推断的分割掩模。在实施例中,所推断的分割掩模是如图6和图7所示的所推断的分割掩模612。
在框912,处理器基于阈值来对所确定的可驾驶道路段的所推断的分割掩模进行滤波。在实施例中,所推断的分割掩模是如图6所示的所推断的分割掩模612。在实施例中,经滤波的分割掩模是如图6所示的经滤波的分割掩模616。在实施例中,阈值是根据图6描述的值。
在框914,处理器基于至少一个标准来平滑可驾驶道路段的经滤波的分割掩模,以生成连续的输出可驾驶道路段。在实施例中,经滤波的分割掩模是如图6所示的经滤波的分割掩模616。经平滑的分割掩模是如图6所示的输出分割掩模620。在实施例中,至少一个标准是根据图6描述的标准。
在框916,处理器基于可驾驶道路段的输出分割掩模来规划针对运载工具的路径以进行导航。在实施例中,处理器通过如图6所示的规划器622进行规划,规划器622是如图4所示的规划电路404的至少一部分。在实施例中,输出分割掩模是如图6所示的输出分割掩模620。
在框918,处理器基于规划的路径来控制运载工具。在实施例中,处理器包括如图4所示的控制电路406的至少一部分。
在先前描述中,已经参考许多具体细节描述了本发明的实施例,这些具体细节可因实现而不同。因此,说明书和附图应被视为说明性的,而非限制性意义的。本发明范围的唯一且排他的指示、以及申请人期望是本发明范围的内容是以发布权利要求书的具体形式从本申请发布的权利要求书的字面和等同范围,包括任何后续修正。本文中明确阐述的用于被包括在此类权利要求中的术语的任何定义应当以此类术语如在权利要求书中所使用的意义为准。另外,当在先前的说明书或所附权利要求书使用术语“还包括”时,该短语的下文可以是附加的步骤或实体、或先前所述的步骤或实体的子步骤/子实体。
Claims (9)
1.一种用于运载工具的方法,包括:
使用处理电路获得表示环境的地图,其中所述地图包括至少一个地图层;
使用所述处理电路来将所述至少一个地图层划分为多个子地图;
使用所述处理电路和机器学习模型来推断与至少一个子地图相对应的子地图分割掩模,其中所述子地图将所述子地图的像素识别为与可驾驶道路段相对应;
使用所述处理电路,基于所述子地图分割掩模来构造指示在所述至少一个地图层上的所述可驾驶道路段的所推断的分割掩模;
使用所述处理电路来对所述所推断的分割掩模进行滤波,以生成经滤波的分割掩模,其中所述滤波是基于所述可驾驶道路段与被对象占据的区域相对应的可能性;以及
使用所述处理电路,基于至少一个标准来平滑所述经滤波的分割掩模,以生成具有至少一个连续的所述可驾驶道路段的经平滑的分割掩模。
2.根据权利要求1所述的方法,还包括:
使用所述处理电路,基于所述经平滑的分割掩模来规划针对运载工具的路径,以在环境中导航;以及
使用所述处理电路,基于规划的路径来控制所述运载工具。
3.根据权利要求1或2所述的方法,其中,所述机器学习模型利用正样本进行训练,其中所述正样本包含所述可驾驶道路段的一部分。
4.根据权利要求1至3中任一项所述的方法,还包括通过以下方式将所述子地图的像素识别为与所述可驾驶道路段相对应:
使用所述处理电路,跨至少一个子地图分割掩模应用滑动窗口;以及
使用所述处理电路,针对所述至少一个子地图分割掩模,基于所述滑动窗口所限定的输出标签和地面真值数据,经由反向传播来更新卷积神经网络的权重。
5.根据权利要求1至4中任一项所述的方法,其中,所述神经网络具有至少部分包括二值交叉熵损失的损失函数。
6.根据权利要求1至5中任一项所述的方法,其中,所述可驾驶道路段与被对象占据的区域相对应的可能性是根据占据地图获得的。
7.根据权利要求1至6中任一项所述的方法,其中,所述至少一个标准至少包括由所确定的可驾驶道路段的轮廓包围的区域。
8.一种运载工具,包括:
至少一个处理器;以及
至少一个存储器,其上存储有指令,所述指令当由所述至少一个处理器执行时,使所述至少一个处理器进行根据权利要求1-7中任一项所述的方法。
9.一种非暂时性计算机可读存储介质,包括用于由第一装置的至少一个处理器执行的至少一个程序,所述至少一个程序包括指令,所述指令当由所述至少一个处理器执行时使所述第一装置进行根据权利要求1至7中任一项所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/539,413 | 2021-12-01 | ||
US17/539,413 US12123734B2 (en) | 2021-12-01 | Automatic annotation of drivable road segments |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116229407A true CN116229407A (zh) | 2023-06-06 |
Family
ID=86317191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210153218.5A Pending CN116229407A (zh) | 2021-12-01 | 2022-02-18 | 用于运载工具的方法、运载工具和存储介质 |
Country Status (4)
Country | Link |
---|---|
KR (1) | KR20230082520A (zh) |
CN (1) | CN116229407A (zh) |
DE (1) | DE102022103059A1 (zh) |
GB (1) | GB2613401A (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10762360B2 (en) * | 2018-11-19 | 2020-09-01 | Waymo Llc | Automatically detecting unmapped drivable road surfaces for autonomous vehicles |
US11244500B2 (en) * | 2019-12-31 | 2022-02-08 | Woven Planet North America, Inc. | Map feature extraction using overhead view images |
-
2022
- 2022-02-09 GB GB2201652.1A patent/GB2613401A/en active Pending
- 2022-02-09 DE DE102022103059.8A patent/DE102022103059A1/de active Pending
- 2022-02-09 KR KR1020220017062A patent/KR20230082520A/ko not_active Application Discontinuation
- 2022-02-18 CN CN202210153218.5A patent/CN116229407A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
DE102022103059A1 (de) | 2023-06-01 |
US20230168100A1 (en) | 2023-06-01 |
KR20230082520A (ko) | 2023-06-08 |
GB2613401A (en) | 2023-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11858508B2 (en) | Trajectory prediction from precomputed or dynamically generated bank of trajectories | |
CN113012187B (zh) | 用于运载工具的方法和前景提取系统以及存储介质 | |
US11814046B2 (en) | Estimating speed profiles | |
KR20210112293A (ko) | 주석 달기를 위한 데이터 샘플의 자동 선택 | |
US11577754B2 (en) | Autonomous vehicle operation using linear temporal logic | |
KR102518680B1 (ko) | 속력 프로파일 추정 | |
US20220122363A1 (en) | IDENTIFYING OBJECTS USING LiDAR | |
US11731653B2 (en) | Conditional motion predictions | |
US11887324B2 (en) | Cross-modality active learning for object detection | |
CN113970924A (zh) | 用于运载工具的方法和系统 | |
US20220357453A1 (en) | Lidar point cloud segmentation using box prediction | |
CN114812586A (zh) | 用于运载工具的系统、方法和存储介质 | |
US20230003533A1 (en) | Fast collision free path generation by connecting c-slices through cell decomposition | |
US12123734B2 (en) | Automatic annotation of drivable road segments | |
US20230168100A1 (en) | Automatic annotation of drivable road segments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |