CN117541464A - 一种全局初始化方法、系统、车辆、存储介质及设备 - Google Patents
一种全局初始化方法、系统、车辆、存储介质及设备 Download PDFInfo
- Publication number
- CN117541464A CN117541464A CN202210901703.6A CN202210901703A CN117541464A CN 117541464 A CN117541464 A CN 117541464A CN 202210901703 A CN202210901703 A CN 202210901703A CN 117541464 A CN117541464 A CN 117541464A
- Authority
- CN
- China
- Prior art keywords
- pose
- feature points
- dimensional feature
- error
- global initialization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011423 initialization method Methods 0.000 title claims abstract description 30
- 230000007613 environmental effect Effects 0.000 claims description 13
- 238000013136 deep learning model Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 abstract description 15
- 230000000007 visual effect Effects 0.000 abstract description 9
- 238000012545 processing Methods 0.000 abstract description 4
- 238000013135 deep learning Methods 0.000 abstract description 3
- 230000008859 change Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/42—Determining position
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/32—Indexing scheme for image data processing or generation, in general involving image mosaicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种全局初始化方法、系统、车辆、存储介质及设备,属于数据处理技术领域。该方法主要包括:车辆装载的多个相机实时拍摄到的图片进行图像拼接,获取全景拼接图;根据全景拼接图与预建立的全局初始化模型确定先验位姿;将在全景拼接图上提取2维特征点,与预建立的3维特征点地图进行匹配,获取匹配关系,并将3D特征点投影到2全景拼接图上,计算重投影误差;根据重投影误差对先验位姿进行优化,获取车辆的初始位姿。通过视觉特征点在地库中任意位置进行全局初始化,增加全局初始化的灵活性,由于基于深度学习的视觉特征点对环境变化鲁棒性强,使得本申请的技术方案不受环境影响,局限性低。
Description
技术领域
本申请涉及数据处理技术领域,特别涉及一种全局初始化方法、系统、车辆、存储介质及设备。
背景技术
全局初始化是在高精度地图中定位过程中的重要的组成部分,而在高精度地图中定位是自动驾驶中的重要部分;因此,全局初始化的位姿确定,为自动驾驶车辆的自动驾驶提供了场景感知、决策等基础的技术支持。为了完成精确定位,提高全局初始化的精度十分重要。
在现有技术中,多采用两种不同的技术方案进行全局初始化,其一为:通过预先设定特定的标志,通过该标志记性全局初始化;其二为:采用GPS(全球定位系统)的定位方案,通过建立一个GPS地图,实现全局初始化。
然而,对于方案一而言,由于特定标志固定,因此只能在固定的地点进行全局初始化无法在其他地方进行全局初始化,灵活性低;对于方案二,GPS应用于地库或高层中,往往精度受影响,因此GPS的局限性强,另外,在一些特殊环境下,例如雨天、阴天等时上述两种方案都会对点位的精度造成很大影响。
发明内容
针对现有技术存在的灵活性低、局限性强的问题,本申请主要提供一种全局初始化方法、系统、车辆、存储介质及设备。
第一方面,本申请实施例提供一种全局初始化方法,其包括:多个相机实时分别拍摄到的图片进行图像拼接,获取图片对应的全景拼接图,其中图片中的图像信息为同一楼层不同角度的环境信息,相机装载在车辆的周围;将全景拼接图输入预设的深度学习模型中,获取描述全景拼接图中环境的当前描述信息;在预建立的全局初始化模型中检索与当前描述信息相似的描述信息,将描述信息对应的位姿信息确定为车辆的先验位姿;在全景拼接图上提取2维特征点,对特征点与预建立的3维特征点地图进行匹配,获取匹配关系,并将3维特征点地图中的3维特征点投影到全景拼接图上,计算重投影误差,其中重投影误差包括距离误差与角度误差;以及根据重投影误差对先验位姿进行优化,获取车辆的初始位姿。本申请实施例的技术方案基于纯视觉的方式,通过基于深度学习的视觉特征点,在地库中任意位置进行全局初始化,增加全局初始化的灵活性,并且由于视觉特征点对环境变化鲁棒性极强,因此本申请的技术方案不受环境影响,局限性低。
可选地,在全景拼接图上提取2维特征点,对2维特征点与预建立的3维特征点地图进行匹配,获取匹配关系,包括:将全景拼接图映射到3维特征点地图中,将映射后全景拼接图覆盖的区域作为局部特征点地图;对局部特征点地图与2维特征点进行匹配,获取匹配关系。通过在3维特征点地图中筛选,与该全景拼接图对应的局部特征点地图,后续的步骤均利用局部特征点地图进行匹配,相较于利用完整的3维特征点地图进行匹配,极大的减少了系统的运算量,加快了全局初始化的速率。
可选地,对局部特征点地图与2维特征点进行匹配,包括:提取局部特征点地图中的3维特征点;提取全景拼接图中的2维特征点;将3维特征点投影到全景拼接图中,与2维特征点进行匹配;以及若匹配成功的特征点的数量大于或等于预设数量阈值,则判定全景拼接图与局部特征点地图匹配成功。
可选地,当图片中的图像信息对应的高度与3维空间的真实高度不一致时,预先建立以相机的焦点为中心的柱面坐标系;将图片分别映射到柱面坐标系下,获取图片分别对应的柱面图;在柱面图中提取2维特征点,对2维特征点与3维特征点地图进行匹配。由于柱面图在垂直水平面的方向为线性的,即在垂直方向上,特征物体的真实状态不会发生变化,而水平面上的变形对匹配而言影响较小;因此将图片转换为柱面图,避免后续匹配的精度受影响。
可选地,根据重投影误差对先验位姿进行优化,获取车辆的初始位姿,包括:若距离误差小于或等于预设的距离误差阈值,则将先验位姿作为初始位姿;若距离误差大于距离误差阈值,则根据重投影误差对先验位姿进行修正,获得初始位姿。
可选地,根据重投影误差对先验位姿进行优化,获取车辆的初始位姿,包括:若角度误差小于或等于预设的角度误差阈值,则将先验位姿作为初始位姿;若角度误差大于角度误差阈值,则根据重投影误差对先验位姿进行修正,获得初始位姿。
第二方面,本申请实施例提供一种全局初始化系统,其包括:图片拼接模块,用于多个相机实时分别拍摄到的图片进行图像拼接,获取图片对应的全景拼接图,其中图片中的图像信息为同一楼层不同角度的环境信息,相机装载在车辆的周围;特征提取模块,用于将全景拼接图输入预设的深度学习模型中,获取描述全景拼接图中环境的当前描述信息;先验位姿获取模块,用于在全局初始化模型中检索与当前描述信息相似的描述信息,将描述信息对应的位姿信息确定为车辆的先验位姿;误差获取模块,用于在全景拼接图上提取2维特征点,对特征点与预建立的3维特征点地图进行匹配,获取匹配关系,并将3维特征点地图中的3维特征点投影到全景拼接图上,计算重投影误差,其中重投影误差包括距离误差与角度误差;以及初始化模块,用于根据重投影误差对先验位姿进行优化,获取车辆的初始位姿。
第三方面,本申请实施例提供一种车辆,其特征在于,车辆包括上述方案中的全局初始化系统,其中全局初始化系统包括:图片拼接模块,用于多个相机实时分别拍摄到的图片进行图像拼接,获取图片对应的全景拼接图,其中图片中的图像信息为同一楼层不同角度的环境信息,相机装载在车辆的周围;特征提取模块,用于将全景拼接图输入预设的深度学习模型中,获取描述全景拼接图中环境的当前描述信息;先验位姿获取模块,用于在全局初始化模型中检索与当前描述信息相似的描述信息,将描述信息对应的位姿信息确定为车辆的先验位姿;误差获取模块,用于在全景拼接图上提取2维特征点,对特征点与预建立的3维特征点地图进行匹配,获取匹配关系,并将3维特征点地图中的3维特征点投影到全景拼接图上,计算重投影误差,其中重投影误差包括距离误差与角度误差;以及初始化模块,用于根据重投影误差对先验位姿进行优化,获取车辆的初始位姿。
第四方面,本申请实施例提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行上述方案中的全局初始化方法。
第五方面,本申请实施例提供一种计算机设备,其包括:至少一个处理器,所述处理器和存储器耦合,所述存储器存储有计算机指令,其特征在于,所述计算机指令被所述处理器执行时实现如权利要求1-6中任一项所述的全局初始化方法。
第六方面,本申请实施例提供一种计算机程序产品,其包含计算机指令,该计算机指令被操作以执行上述方案中的全局初始化方法。
对于以上第二方面至第六方面对应方案的有益效果,参照前述第一方面中方案的有益效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一种全局初始化方法的一个可选实施方式的示意图;
图2是本申请一种全局初始化系统的一个可选实施方式的示意图;
图3是本申请一种计算机设备的一个具体实施方式示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
全局初始化是在高精度地图中定位过程中的重要的组成部分,而在高精度地图中定位是自动驾驶中的重要部分;因此,全局初始化的位姿确定,为自动驾驶车辆的自动驾驶提供了场景感知、决策等基础的技术支持。为了完成精确定位,提高全局初始化的精度十分重要。
在现有技术中,多采用两种不同的技术方案进行全局初始化,其一为:通过预先设定特定的标志,通过该标志记性全局初始化;其二为:采用GPS的定位方案,通过建立一个GPS地图,实现全局初始化。
然而,对于方案一而言,由于特定标志固定,因此只能在固定的地点进行全局初始化无法在其他地方进行全局初始化,灵活性低;对于方案二,GPS应用于地库或高层中,往往精度受影响,因此GPS的局限性强,另外,在一些特殊环境下,例如雨天、阴天等时上述两种方案都会对点位的精度造成很大影响。
针对现有技术存在的灵活性低、局限性弱的问题,本申请主要提供一种全局初始化方法、系统、车辆、存储介质及设备。该主要方法包括:多个相机实时分别拍摄到的图片进行图像拼接,获取图片对应的全景拼接图,其中图片中的图像信息为同一楼层不同角度的环境信息,相机装载在车辆的周围;将全景拼接图输入预设的深度学习模型中,获取描述全景拼接图中环境的当前描述信息;在预建立的全局初始化模型中检索与当前描述信息相似的描述信息,将描述信息对应的位姿信息确定为车辆的先验位姿;在全景拼接图上提取2维特征点,对特征点与预建立的3D特征点地图进行匹配,获取匹配关系,并将3维特征点地图中的3维特征点投影到全景拼接图上,计算重投影误差,其中重投影误差包括距离误差与角度误差;以及根据重投影误差对先验位姿进行优化,获取车辆的初始位姿。
本申请的技术方案基于一种纯视觉的方式,通过基于深度学习的视觉特征点,在地库中任意位置进行全局初始化,增加全局初始化的灵活性,提高全局初始化的定位速度与精度,并且由于视觉特征点对环境变化鲁棒性极强,因此本申请的技术方案不受环境影响,局限性低。
下面,以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程,可能在其他某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1示出了本申请一种全局初始化方法的一个可选实施方式。
在图1所示的可选实施方式中,全局初始化方法主要包括步骤S101,多个相机实时分别拍摄到的图片进行图像拼接,获取图片对应的全景拼接图,其中图片中的图像信息为同一楼层不同角度的环境信息,相机装载在车辆的周围。
在该可选实施方式中,由于视觉的图片并不受环境、场景等外因的限制,GPS因受到高层的限制,使得在建立同一楼层的地图时,无法利用GPS获取精准的定位,因此采用利用视觉感知的相机建立该楼层的地图,以便进行定位;例如,在地下车库中对驶入车库的车辆进行实时定位时,在车辆周围安装相机,在进入车库时,各个相机实时拍摄图片;将图片进行编码,并在数据库中储存该图片对应的位姿信息,优选地相机可选用鱼眼相机。为后续的检索步骤提供基础;因此,在全局初始化的过程中,首先根据多个相机实时拍摄的图片,拼接获得全景拼接图。
在图1所示的可选实施方式中,全局初始化方法还包括步骤S102,将全景拼接图输入预设的深度学习模型中,获取描述全景拼接图中环境的当前描述信息。
在该可选实施方式中,将全景拼接图输入预设的深度学习模型中,由模型输出描述该全景拼接图各个特征物体的当前描述信息;例如,全景拼接图中的场景为正前方有两个对称站立的方形立柱,柱子的正上方,紧挨房顶的地方有两排红色的排水管,左前方有一条向左行驶的路,右后方45°的位置是个转角。其中,当前描述信息的生成为后续的检索提供必要的特征基础。
在图1所示的可选实施方式中,全局初始化方法还包括步骤S103,在预建立的全局初始化模型中检索与当前描述信息相似的描述信息,将描述信息对应的位姿信息确定为车辆的先验位姿。
在该可选实施方式中,由于预建立的全局初始化模型中已经存储了各个时刻分别对应的描述全景拼接图中环境的描述信息与该时刻下车辆的位姿信息;因此,根据当前时刻的全景拼接图对应的当前描述信息,在全局初始化模型中检索与当前描述信息相似的描述信息,将该描述信息所属类别的位姿信息确定为当前时刻下车辆的先验位姿,为后续获取准确的初始位姿提供基础。其中,在全局初始化模型中检索描述信息时的检索方式包括但不限于K近邻检索的方式、全连接的方式。
在图1所示的可选实施方式中,全局初始化方法还包括步骤S104,在全景拼接图上提取2维特征点,对特征点与预建立的3维特征点地图进行匹配,获取匹配关系,并将3维特征点地图中的3维特征点投影到全景拼接图上,计算重投影误差,其中重投影误差包括距离误差与角度误差。
在该可选实施例方式中,为了避免误初始化,在前述的先验位姿确定之后,利用预先生成的3维地库地图,对先验位姿进行修正,并且由于传统的重定位过程是根据空间的结构,将不同层级区分为一张张单独的2维地图,因此在通过跨层区域时,需要及时的切换2维地图;而切换地图往往会导致一些问题,例如在进入地下车库的过程中,需要先进入一段转弯坡道,而坡道就是一个典型的跨层,在转弯坡道的转弯处,一般分布有帮助转弯的凸面镜,当将凸面镜的边沿作为特征点时,若转弯坡道的转弯处非常多时,正好切换一张2维地图,而在匹配时,将上一张的凸面镜匹配到更换的2维地图中,使得出现定位错误,而此时用户不知道定位错误,本该在这个转弯完成之后向前直行,但是由于匹配错误,但是用户还认为需要继续转弯,因此相当于地图失效了,使得用户的体验降低。因此本申请直接利用3维地图做匹配避免了跨层定位出现的匹配错误的情况。
本申请的一个可选实施例中,在全景拼接图上提取2维特征点,对特征点与预建立的3维特征点地图中进行匹配,包括:将全景拼接图映射到3维特征点地图中,将映射后全景拼接图覆盖的区域作为局部特征点地图;将局部特征点地图与2维特征点进行匹配,获取匹配关系。
在该可选实施例中,首先利用全景拼接图在3维特征点地图中筛选,与该全景拼接图对应的局部特征点地图,后续的步骤均利用局部特征点地图进行匹配,相较于利用完整的3维特征点地图进行匹配,极大的减少了系统的运算量,加快了全局初始化的速率。
本申请的一个可选实施例中,将局部特征点地图与2维特征点进行匹配,包括:提取局部特征点地图中的3维特征点;提取全景拼接图中的2维特征点;将3维特征点投影到全景拼接图中,与2维特征点进行匹配;若匹配成功的特征点的数量大于或等于预设数量阈值,则判定全景拼接图与局部特征点地图匹配成功。
在该可选实施例中,分别提取局部特征点地图中的3维特征点与全景拼接图中的2维特征点,对比3维特征点与2维特征点分别对应描述信息的相似性,将相似性大于或等于预设相似阈值的描述信息分别对应的3维特征点与2维特征点确定为匹配成功的特征点。当匹配成功的特征点的数量大于或等于预设数量阈值,则判定全景拼接图与局部特征点地图匹配成功,获取该局部特征点地图对应车辆的位姿信息,为后续的优化提供基础。
在本申请的一个可选实例中,预先设置相似阈值,对3维特征点与2维特征点分别对应的描述信息进行对比,判断多个描述信息之间的相似性,将相似性大于预设相似阈值的描述信息对应3维特征点与2维特征点确定为匹配成功的特征点;例如,当预设相似阈值为99%时,将相似性大于99%的描述信息对应3维特征点与2维特征点确定为匹配成功的特征点,即匹配成功的特征点的描述信息的相似性均大于99%。
在本申请的一个可选实例中,预先设置数量阈值,其中预设数量阈值可根据局部特征点地图的3D特征点的数量和/或全景拼接图的2D特征点的数量确定;例如,当局部特征点地图的3D特征点为100个,全景拼接图的2D特征点为80个时,可以将预设数量阈值设置为60个;即当匹配成功的特征点的数量大于或等于60个时,则判定全景拼接图与局部特征点地图匹配成功。
本申请的一个可选实施例中,当图片中的图像信息对应的高度与3维空间的真实高度不一致时,预先建立以相机的焦点为中心的柱面坐标系;将图片分别映射到柱面坐标系下,获取图片分别对应的柱面图;在柱面图中提取2维特征点,对2维特征点与3维特征点地图进行匹配。
在该可选实施例中,例如利用鱼眼相机拍摄图片时,会将地下车库中的特征物体变形,从而使得后续匹配的准确率降低;本申请将拍摄的同一时刻的图片转换为柱面图,由于柱面图在垂直水平面的方向为线性的,即在垂直方向上,特征物体的真实状态不会发生变化,而水平面上的变形对匹配而言影响较小;因此将图转换为柱面图,避免后续匹配的精度受影响;其具体的实施步骤为:预先建立以车辆为中心的柱面坐标系,根据图片所在坐标系与柱面坐标系之间的转换关系,将图片的像素信息转化到柱面坐标系下,获取对应的柱面图。
在图1所示的可选实施方式中,全局初始化方法还包括步骤S105,根据重投影误差对先验位姿进行优化,获取车辆的初始位姿。
在该可选实施方式中,根据前述获取的重投影误差对先验位姿进行修正,获取准确的初始位姿,避免误初始化,提高全局初始化的准确率。
本申请的一个可选实施例中,根据重投影误差对先验位姿进行优化,获取车辆的初始位姿,包括:若距离误差小于或等于预设的距离误差阈值,则将先验位姿作为初始位姿;若距离误差大于距离误差阈值,则根据重投影误差对先验位姿进行修正,获得初始位姿。
在该可选实施例中,预先设置距离误差阈值,当距离误差小于或等于预设的距离误差阈值时,无需对先验位姿进行修正,将先验位姿直接作为初始位姿;当距离误差大于预设的距离误差阈值时,需对先验位姿进行修正,将修正后的先验位姿作为初始位姿。例如,预设的距离误差阈值为5CM时,当距离误差小于或等于5CM时,无需对先验位姿进行修正,将先验位姿直接作为初始位姿;当距离误差大于5CM时,需对先验位姿进行修正,将修正后的先验位姿作为初始位姿。
本申请的一个可选实施例中,根据重投影误差对先验位姿进行优化,获取车辆的初始位姿,包括:若角度误差小于或等于预设的角度误差阈值,则将先验位姿作为初始位姿;若角度误差大于角度误差阈值,则根据重投影误差对先验位姿进行修正,获得初始位姿。
在该可选实施例中,预先设置角度误差阈值,当角度误差小于或等于预设的角度误差阈值时,无需对先验位姿进行修正,将先验位姿直接作为初始位姿;当角度误差大于预设的角度误差阈值时,需对先验位姿进行修正,将修正后的先验位姿作为初始位姿。例如,预设的角度误差阈值为5°时,当角度误差小于或等于5°时,无需对先验位姿进行修正,将先验位姿直接作为初始位姿;当角度误差大于5°时,需对先验位姿进行修正,将修正后的先验位姿作为初始位姿。
在本申请的一个可选实例中,将预设的距离误差阈值与预设的角度误差阈值一并作为判断标准;在预设的距离误差阈值为5CM,预设的角度误差阈值为5°时,只有当距离误差小于或等于5CM,同时角度误差小于或等于5°时,才无需对先验位姿进行修正,将先验位姿直接作为初始位姿;当距离误差大于5CM和/或角度误差大于5°时,均需对先验位姿进行修正,将修正后的先验位姿作为初始位姿。
图2示出了本申请一种全局初始化系统的可选实施方式。
在图2所示的可选实施方式中,全局初始化系统主要包括:图片拼接模块,用于多个相机实时分别拍摄到的图片进行图像拼接,获取图片对应的全景拼接图,其中图片中的图像信息为同一楼层不同角度的环境信息;特征提取模块,用于将全景拼接图输入预设的深度学习模型中,获取描述全景拼接图中环境的当前描述信息;先验位姿获取模块,用于在全局初始化模型中检索与当前描述信息相似的描述信息,将描述信息对应的位姿信息确定为车辆所在车辆的先验位姿;误差获取模块,用于在全景拼接图上提取2维特征点,对特征点与预建立的3维特征点地图进行匹配,获取匹配关系,并将3维特征点地图中的3维特征点投影到全景拼接图上,计算重投影误差,其中重投影误差包括距离误差与角度误差;以及初始化模块,用于根据重投影误差对先验位姿进行优化,获取车辆的初始位姿。
本申请提供的全局初始化系统,可用于执行上述任一实施例描述的全局初始化方法,其实现原理和技术效果类似,在此不再赘述。
本申请采用的可选实施方式中,一种车辆,其包括上述方案中的全局初始化系统,其中全局初始化系统包括:图片拼接模块201,用于多个相机实时分别拍摄到的图片进行图像拼接,获取图片对应的全景拼接图,其中图片中的图像信息为同一楼层不同角度的环境信息,相机装载在车辆的周围;特征提取模块202,用于将全景拼接图输入预设的深度学习模型中,获取描述全景拼接图中环境的当前描述信息;先验位姿获取模块203,用于在全局初始化模型中检索与当前描述信息相似的描述信息,将描述信息对应的位姿信息确定为车辆的先验位姿;误差获取模块204,用于在全景拼接图上提取2维特征点,对特征点与预建立的3维特征点地图进行匹配,获取匹配关系,并将3维特征点地图中的3维特征点投影到全景拼接图上,计算重投影误差,其中重投影误差包括距离误差与角度误差;以及初始化模块205,用于根据重投影误差对先验位姿进行优化,获取车辆的初始位姿。
在本申请的一个具体实施例中,本申请一种全局初始化系统中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
本申请提供的车辆,可用于执行上述任一实施例描述的全局初始化方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的另一个可选实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行上述实施例中描述的全局初始化方法。
在本申请的一个可选实施方式中,如图3所示,一种计算机设备,其包括:至少一个处理器,处理器和存储器耦合,存储器存储有计算机指令,该计算机指令被处理器执行时实现上述任一方案中的全局初始化方法。
在本申请的另一个具体实施方式中,一种计算机程序产品,其包含计算机指令,该计算机指令被操作以执行上述任一方案中的全局初始化方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种全局初始化方法,其特征在于,包括:
对多个相机实时分别拍摄到的地图片进行图像拼接,获取所述图片对应的全景拼接图,其中所述图片中的图像信息为同一楼层不同角度的环境信息,所述相机装载在车辆的周围;
将所述全景拼接图输入预设的深度学习模型中,获取描述所述全景拼接图中环境的当前描述信息;
在预建立的全局初始化模型中检索与所述当前描述信息相似的描述信息,将所述描述信息对应的位姿信息确定为所述车辆的先验位姿;
在所述全景拼接图上提取2维特征点,对所述2维特征点与预建立的3维特征点地图进行匹配,获取匹配关系,并将所述3维特征点地图中的3维特征点投影到所述全景拼接图上,计算重投影误差,其中所述重投影误差包括距离误差与角度误差;
根据所述重投影误差对所述先验位姿进行优化,获取所述车辆的初始位姿。
2.根据权利要求1所述的全局初始化方法,其特征在于,所述在所述全景拼接图上提取2维特征点,对所述2维特征点与预建立的3维特征点地图进行匹配,获取匹配关系,包括:
将所述全景拼接图映射到所述3维特征点地图中,将映射后所述全景拼接图覆盖的区域作为局部特征点地图;
对所述局部特征点地图与所述2维特征点进行匹配,获取所述匹配关系。
3.根据权利要求2所述的全局初始化方法,其特征在于,所述对所述局部特征点地图与所述2维特征点进行匹配,包括:
提取所述局部特征点地图中的所述3维特征点;
提取所述全景拼接图中的所述2维特征点;
将所述3维特征点投影到所述全景拼接图中,与所述2维特征点进行匹配;以及
若匹配成功的特征点的数量大于或等于预设数量阈值,则判定所述全景拼接图与所述局部特征点地图匹配成功。
4.根据权利要求1所述的全局初始化方法,其特征在于,
当所述图片中的图像信息对应的高度与3维空间的真实高度不一致时,预先建立以所述相机的焦点为中心的柱面坐标系;
将所述图片分别映射到所述柱面坐标系下,获取所述图片分别对应的柱面图;
在所述柱面图中提取所述2维特征点,对所述2维特征点与所述3维特征点地图进行匹配。
5.根据权利要求1所述的全局初始化方法,其特征在于,所述根据所述重投影误差对所述先验位姿进行优化,获取所述车辆的初始位姿,包括:
若所述距离误差小于或等于预设的距离误差阈值,则将所述先验位姿作为所述初始位姿;
若所述距离误差大于所述距离误差阈值,则根据所述重投影误差对所述先验位姿进行修正,获得所述初始位姿。
6.根据权利要求1-5任一项所述的全局初始化方法,其特征在于,所述根据所述重投影误差对所述先验位姿进行优化,获取所述车辆的初始位姿,包括:
若所述角度误差小于或等于预设的角度误差阈值,则将所述先验位姿作为所述初始位姿;
若所述角度误差大于所述角度误差阈值,则根据所述重投影误差对所述先验位姿进行修正,获得所述初始位姿。
7.一种全局初始化系统,其特征在于,包括:
图片拼接模块,用于对多个相机实时分别拍摄到的图片进行图像拼接,获取所述图片对应的全景拼接图,其中所述图片中的图像信息为同一楼层不同角度的环境信息,所述相机装载在车辆的周围;
特征提取模块,用于将所述全景拼接图输入预设的深度学习模型中,获取描述所述全景拼接图中环境的当前描述信息;
先验位姿获取模块,用于在全局初始化模型中检索与所述当前描述信息相似的描述信息,将所述描述信息对应的位姿信息确定为所述车辆的先验位姿;
误差获取模块,用于在所述全景拼接图上提取2维特征点,对所述特征点与预建立的3维特征点地图进行匹配,获取匹配关系,并将所述3维特征点地图中的3维特征点投影到所述全景拼接图上,计算重投影误差,其中所述重投影误差包括距离误差与角度误差;以及
初始化模块,用于根据所述重投影误差对所述先验位姿进行优化,获取所述车辆的初始位姿。
8.一种车辆,其特征在于,所述车辆包括如权利要求7所述的全局初始化系统。
9.一种计算机可读存储介质,其存储有计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-6中任一项所述的全局初始化方法。
10.一种计算机设备,其特征在于,包括:
至少一个处理器,所述处理器和存储器耦合,所述存储器存储有计算机指令,其特征在于,所述计算机指令被所述处理器执行时实现如权利要求1-6中任一项所述的全局初始化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210901703.6A CN117541464A (zh) | 2022-07-28 | 2022-07-28 | 一种全局初始化方法、系统、车辆、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210901703.6A CN117541464A (zh) | 2022-07-28 | 2022-07-28 | 一种全局初始化方法、系统、车辆、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117541464A true CN117541464A (zh) | 2024-02-09 |
Family
ID=89781211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210901703.6A Pending CN117541464A (zh) | 2022-07-28 | 2022-07-28 | 一种全局初始化方法、系统、车辆、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117541464A (zh) |
-
2022
- 2022-07-28 CN CN202210901703.6A patent/CN117541464A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021233029A1 (en) | Simultaneous localization and mapping method, device, system and storage medium | |
CN111179358B (zh) | 标定方法、装置、设备及存储介质 | |
CN111561923B (zh) | 基于多传感器融合的slam制图方法、系统 | |
CN112667837A (zh) | 图像数据自动标注方法及装置 | |
CN107167826B (zh) | 一种自动驾驶中基于可变网格的图像特征检测的车辆纵向定位系统及方法 | |
CN112348885B (zh) | 视觉特征库的构建方法、视觉定位方法、装置和存储介质 | |
CN113447923A (zh) | 目标检测方法、装置、系统、电子设备及存储介质 | |
CN113506342B (zh) | 一种基于多相机全景视觉的slam全向回环校正方法 | |
CN112198878B (zh) | 一种即时地图构建方法、装置、机器人及存储介质 | |
WO2018142533A1 (ja) | 位置姿勢推定装置および位置姿勢推定方法 | |
CN114037762B (zh) | 基于图像与高精度地图配准的实时高精度定位方法 | |
WO2024221946A1 (zh) | 一种基于语义分割的无人机图像地理配准方法及相关设备 | |
CN114863096B (zh) | 室内停车场的语义地图构建及定位方法和装置 | |
CN113836251B (zh) | 一种认知地图构建方法、装置、设备及介质 | |
CN114842446A (zh) | 车位检测方法、装置及计算机存储介质 | |
CN116817887B (zh) | 语义视觉slam地图构建方法、电子设备及存储介质 | |
CN115267722A (zh) | 一种角点提取方法、装置及存储介质 | |
CN115984417A (zh) | 一种语义建图方法、装置及存储介质 | |
JP6304815B2 (ja) | 画像処理装置ならびにその画像特徴検出方法、プログラムおよび装置 | |
CN111194015A (zh) | 基于建筑物的室外定位方法、装置及移动设备 | |
CN117541464A (zh) | 一种全局初始化方法、系统、车辆、存储介质及设备 | |
CN116168357A (zh) | 一种智能车的前景目标机器视觉提取系统及方法 | |
CN111508067B (zh) | 一种基于垂直平面和垂直线的轻量级室内建模方法 | |
CN110930455B (zh) | 定位方法、装置、终端设备及存储介质 | |
CN109919998B (zh) | 卫星姿态确定方法、装置和终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |