CN117629229A - 一种视觉定位方法、装置、车辆、介质及设备 - Google Patents
一种视觉定位方法、装置、车辆、介质及设备 Download PDFInfo
- Publication number
- CN117629229A CN117629229A CN202210967205.1A CN202210967205A CN117629229A CN 117629229 A CN117629229 A CN 117629229A CN 202210967205 A CN202210967205 A CN 202210967205A CN 117629229 A CN117629229 A CN 117629229A
- Authority
- CN
- China
- Prior art keywords
- line segment
- dimensional
- dimensional line
- map
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000007 visual effect Effects 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000005070 sampling Methods 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 21
- 238000003062 neural network model Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000005520 cutting process Methods 0.000 claims description 8
- 230000004807 localization Effects 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开了一种视觉定位方法、装置、车辆、介质及设备,属于数据处理技术领域。该方法主要包括:对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段;将二维线段与预建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,其中三维线段中包括三维线段的空间信息与特征信息;将三维线段投影到图片中,根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段;根据像素重合线段与二维线段之间的距离,确定车辆对应的位姿信息。对线特征进行视觉定位,降低了对单方面的依赖性,提高了方案的鲁棒性。
Description
技术领域
本申请涉及数据处理技术领域,特别涉及一种视觉定位方法、装置、车辆、介质及设备。
背景技术
视觉定位是一种新型的定位技术,通过图像采集设备(如手机、鱼眼相机等)采集环境图像,配合图像算法和数学推理来实时计算与更新当前位姿,具有高速、高精度、易使用等优点,已广泛应用于AR(AugmentedReality,增强现实)、室内导航等场景下。
在现有技术中,在进行视觉定位时,通常需要对图像进行特征提取与特征匹配,以计算位姿。可见,其定位结果极大地依赖于图像中的特征质量。然而,当视觉环境出现弱纹理的情况时,将影响所提取的图像特征质量,导致定位漂移甚至定位失败。
发明内容
针对现有技术存在的问题,本申请主要提供一种视觉定位方法、装置、车辆、介质及设备。
第一方面,本申请实施例提供一种视觉定位方法,其包括:对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段,其中二维线段中包括地图特征所处环境的特征信息;将二维线段与预建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,其中三维线段中包括三维线段对应地图特征所述环境的特征信息与三维信息;根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段;根据投影线段与二维线段之间的距离,确定车辆对应的位姿信息。本申请实施例的技术方案通过提供一种基于图像与三维点云结合的方式,对线特征进行视觉定位,降低了对单方面的依赖性,提高了方案的鲁棒性。特别是降低了对图像中特征质量的依赖,即使在弱纹理环境下,也能够通过三维点云保证视觉定位结果的准确性,从而解决弱纹理环境下的视觉定位问题。另外,线特征的提取与匹配处理所需的计算量较低,有利于提高响应速度与视觉定位的实时性。再一方面,本方案基于普通的相机即可实现,无需增加辅助传感器,具有较低的实现成本。
可选地,根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段,还包括:判断投影线段的像素信息和二维线段的像素信息的数量;若数量不一致,则对三维线段进行裁剪,并重新投影获取投影线段。
可选地,根据像素重合线段与二维线段之间的距离,确定车辆对应的位姿信息,包括:分别计算像素重合线段的端点与二维线段的端点之间的垂直距离;当垂直距离小于或等于预设垂直阈值时,将车辆当前的位姿信息作为车辆对应的位姿信息;当垂直距离大于预设垂直阈值时,对车辆当前的位姿信息进行调整,将调整后的位姿信息确定为车辆对应的位姿信息。
可选地,将二维线段与预建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,包括:将二维线段与线特征地图中的线段输入预设的图神经网络模型,将与二维线段的特征信息相似度大于预设相似阈值的特征信息对应的线段作为三维线段。在本方案中基于特征信息的方式匹配二维线段与三维线段,使得匹配的精度提高,进而提高后续定位的精度。
可选地,将二维线段与预建立的线特征地图进行线段匹配,还包括:对线特征地图中的每一线段与二维线段分别采集预设采集数量的采样点,将采样点输入预设的图神经网络模型,利用动态规划算法将得分大于预设得分阈值的采样点进行匹配;当两条线段上相互匹配的采样点的数量大于预设匹配数量时,判定两条线段匹配成功。
可选地,将二维线段与预建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,还包括:将线特征地图中的线段投影到图片中,利用欧式距离计算获取三维线段。本方案中基于欧氏距离的方式计算两条线段之间的实际距离,对二维线段与三维线段进行匹配,使得匹配的精度提高,进而提高后续定位的精度。
第二方面,本申请实施例提供一种视觉定位装置,其包括:二维线段提取模块,其对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段,其中二维线段中包括地图特征所处环境的特征信息;线段匹配模块,其将二维与预线段建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,其中三维线段中包括三维线段对应地图特征所述环境的特征信息与三维信息;像素重合线段获取模块,其将三维线段投影到所述图片中,根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段;定位模块,其根据投影线段与二维线段之间的距离,确定车辆对应的位姿信息。
第三方面,本申请实施例提供一种车辆,其包括视觉定位装置,其中视觉定位装置包括:二维线段提取模块,其对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段,其中二维线段中包括地图特征所处环境的特征信息;线段匹配模块,其将二维与预线段建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,其中三维线段中包括三维线段对应地图特征所述环境的特征信息与三维信息;像素重合线段获取模块,其将三维线段投影到所述图片中,根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段;定位模块,其根据投影线段与二维线段之间的距离,确定车辆对应的位姿信息。
第四方面,本申请实施例提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行方案一中的视觉定位方法。
第五方面,本申请实施例提供一种计算机设备,其包括:至少一个处理器,处理器和存储器耦合,存储器存储有计算机指令,其特征在于,计算机指令以执行方案一中的视觉定位方法。
第六方面,本申请实施例提供一种计算机程序产品,其包含计算机指令,该计算机指令被操作以执行上述方案中的视觉定位方法。
对于以上第二方面至第六方面对应方案的有益效果,参照前述第一方面中方案的有益效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一种视觉定位方法的一个可选实施方式的示意图;
图2示出了本申请一种视觉定位方法中线段匹配的一个可选实例;
图3示出了本申请一种视觉定位方法中确定投影线段的一个可选实例;
图4示出了本申请一种视觉定位方法中垂直距离计算的一个可选实例;
图5是本申请一种视觉定位装置的一个可选实施方式的示意图;
图6是本申请一种计算机设备的一个具体实施方式示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
视觉定位是一种新型的定位技术,通过图像采集设备(如手机、鱼眼相机等)采集环境图像,配合图像算法和数学推理来实时计算与更新当前位姿,具有高速、高精度、易使用等优点,已广泛应用于AR(AugmentedReality,增强现实)、室内导航等场景下。
在现有技术中,在进行视觉定位时,通常需要对图像进行特征提取与特征匹配,以计算位姿。可见,其定位结果极大地依赖于图像中的特征质量。然而,当视觉环境出现弱纹理的情况时,将影响所提取的图像特征质量,导致定位漂移甚至定位失败。
针对现有技术存在的问题,本申请主要提供一种视觉定位方法、装置、车辆、介质及设备。该视觉定位方法包括:对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段,其中二维线段中包括地图特征所处环境的特征信息;将二维线段与预建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,其中三维线段中包括三维线段对应地图特征所述环境的特征信息与三维信息;将三维线段投影到图片中,根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段;根据投影线段与二维线段之间的距离,确定车辆对应的位姿信息。
通过提供一种基于图像与三维点云结合的方式,对线特征进行视觉定位,降低了对单方面的依赖性,提高了方案的鲁棒性。特别是降低了对图像中特征质量的依赖,即使在弱纹理环境下,也能够通过三维点云保证视觉定位结果的准确性,从而解决弱纹理环境下的视觉定位问题。另外,线特征的提取与匹配处理所需的计算量较低,有利于提高响应速度与视觉定位的实时性。再一方面,本方案基于普通的相机即可实现,无需增加辅助传感器,具有较低的实现成本。
下面,以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程,可能在其他某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1示出了本申请一种视觉定位方法的一个可选实施方式。
在图1所示的可选实施方式中,视觉定位方法还包括步骤S101,对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段,其中所述二维线段中包括所述地图特征所处环境的特征信息。
在该可选实施方式中,在图片中对地图特征进行线段提取,获得地图特征对应的二维线段;其中地图特征包括但不限于车道线、地面的指示箭头、道沿、道路旁的立柱、灯牌,二维线段中包括该地图特征所处环境的特征信息。本方案从二维图像中提取地图特征对应线段的过程,相较于直接利用三维点云提取线段的方式,大大降低线段提取的复杂度,使得系统的运算效率提高,消耗的内存减小。
需要说明的是本方案所述的相机包括但不限于鱼眼相机、针孔相机。
在本申请的一个可选实例中,当选用鱼眼相机作为本方案中的相机时,需将鱼眼相机拍摄的鱼眼图转换到预建立的针孔坐标系下,获取鱼眼图对应的针孔图,其中真空图作为本方案前述的图片。
在该可选实例中,车辆在行驶过程中通过自身装载的鱼眼相机拍摄多当前车辆周围的环境图像,获得环境图像对应的鱼眼图,根据鱼眼相机与针孔相机之间的转换的相机外参,将鱼眼图转换到针孔相机对应预建立的针孔坐标系下,获取环境图像对应的针孔图;由于鱼眼相机拍摄的地图特征会出现扭曲现象,例如,用鱼眼相机拍摄立柱,在鱼眼图中出现的立柱不是直线而是扭曲的曲线,非常不利于后续线段的提取,使得提取的精度降低,因此,将鱼眼图转换为针孔图,避免立柱扭曲的现象,使得提取出的线段为直线,保证线段提取的精度。
在图1所示的可选实施方式中,视觉定位方法还包括步骤S102,将二维线段与预建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,其中三维线段中包括该三维线段对应地图特征所处环境的特征信息与三维信息。
在该可选实施方式中,预建立的线特征地图为基于图像与三维点云相结合的方式建立的包括当前车辆周围环境的地图;因此,在线特征地图中检索该二维线段相匹配的三维线段,以获取该二维线段对应地图特征的3维信息,为后续的定位提供基础。
在本申请的一个可选实施例中,将二维线段与预建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,进一步包括:将二维线段与线特征地图中的线段输入预设的图神经网络模型,将与二维线段的特征信息相似度大于预设相似阈值的特征信息对应的线段作为三维线段。
在该可选实施例中,将二维线段与线特征地图中的所有线段均输入图神经网络模型中,在模型中检索与二维线段相似的三维线段,其中模型检索的方式为,根据二维线段的特征信息,检索与该特征信息相似的线特征地图中的线段的特征信息,将与二维线段的特征信息相似度大于预设相似阈值的特征信息对应的线段作为该二维线段对应的三维线段,即该二维线段与该三维线段相匹配;优选地,预设相似阈值可以设置为95%。在本方案中基于特征信息的方式匹配二维线段与三维线段,使得匹配的精度提高,进而提高后续定位的精度。需要说明的是,本方案中提供的预设相似阈值的值为最优值,在实际应用中,可根据用户需求的定位精度进行相应的调节,本方案不做具体的限制。
在本申请的一个可选实施例中,将二维线段与预建立的线特征地图进行线段匹配,还包括:对线特征地图中的每一线段与二维线段分别采集预设采集数量的采样点,将采样点输入预设的图神经网络模型,利用动态规划算法将得分大于预设得分阈值的采样点进行匹配;当两条线段上相互匹配的采样点的数量大于预设匹配数量时,判定两条线段匹配成功。
在该可选实施例中,在二维线段中采集预设采集数量的采样点,对线特征地图中的每一地图特征对应的线段分别采集同样预设采集数量的采样点,其中采样点中包括该采样点所处环境的特征信息与该采样点所在线段的线段信息,将上述采样点均输入图神经网络模型中,在模型中检索与二维线段相似的三维线段,其中模型检索的方式为,根据二维线段上采样点的特征信息,检索与该采样点特征信息分别相似的线特征地图中线段上采样点的特征信息,计算二维线段上采样点与线特征地图中线段上采样点之间的相似度得分,将得分大于预设得分阈值的特征信息对应的采样点作为该二维线段上采样点对应的线特征地图中的采样点,根据二维线段上采样点对应的线特征地图中的采样点所对应的线段信息,当预设匹配数量的二维线段上采样点对应的线特征地图中的采样点所对应的线段信息均为同一线段时,将该线段作为与二维线段相似的三维线段,即该二维线段与该三维线段相匹配;优选地,预设匹配数量根据预设采样数量设定。在本方案中基于特征信息的方式匹配二维线段与三维线段,使得匹配的精度提高,进而提高后续定位的精度。
需要说明的是,本方案中对预设采样数量与预设匹配数量的值不做具体的限制;只需保证预设匹配数量与预设采样数量之间的比例不小于60%即可。
图2示出了本申请一种视觉定位方法中线段匹配的一个可选实例。
在图2所示的实例中,预设采样数量设置为5个,预设匹配数量设置为3个,在二维线段中采集5个采样点即图2(a)中所示的P1、P2、P3、P4、P5分别对应的采样点,对线特征地图中的每一地图特征对应的线段分别采集5个采样点,图2中的P’1、P’2、P’3、P’4、P’5分别对应的采样点即为线特征地图中某一线段上的5个采样点,其中采样点中包括该采样点所处环境的特征信息与该采样点所在线段的线段信息,将上述采样点均输入图神经网络模型中,在模型中检索与二维线段相似的三维线段,其中模型检索的方式为,根据二维线段上采样点的特征信息,检索与该采样点特征信息分别相似的线特征地图中线段上采样点的特征信息,计算二维线段上采样点与线特征地图中线段上采样点之间的相似度得分,将得分大于或等于0.8分阈值的特征信息对应的采样点作为该二维线段上采样点对应的线特征地图中的采样点,根据二维线段上采样点对应的线特征地图中的采样点所对应的线段信息,当存在至少3个二维线段上采样点对应的线特征地图中的采样点所对应的线段信息均为同一线段时,将该线段作为与二维线段相似的三维线段,即该二维线段与该三维线段相匹配。
在图2(b)所示的匹配结果中,与P1点匹配度最高的是P’3点,其得分为0.8;与P2点匹配度最高的是P’3点,其得分为0.8;与P3点匹配度最高的是P’4点,其得分为1.4;与P4点匹配度最高的是P’4点,其得分为1.4;与P5点匹配度最高的是P’5点,其得分为2.1;因此,P1点与P’3点匹配或P2点与P’3点匹配、P3点与P’4点匹配或P4点与P’4点匹配、P5点与P’5点匹配,得出结论,存在3个线特征地图中的采样点与该二维线段上的采样点匹配,其分别是P’3点、P’4点以及P’5点,并且P’3点、P’4点以及P’5点均属于同一线段,因此该线段即为二维线段对应的三维线段。
在本申请的一个可选实施例中,将二维线段与预建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,还包括:将线特征地图中的线段投影到图片中,利用欧式距离计算获取三维线段。
在该可选实施例中,将线特征地图中特征地图对应的线段分别投影到二维线段所在的图片中,获取特征地图对应的线段分别对应的投影线段,基于2维空间,计算二维线段分别与投影线段之间的实际距离,将实际距离小于或等于预设距离阈值的投影线段对应线段作为该二维线段对应的三维线段。优选地,预设距离阈值可以设置为1米。本方案中基于欧氏距离的方式计算两条线段之间的实际距离,对二维线段与三维线段进行匹配,使得匹配的精度提高,进而提高后续定位的精度。
在图1所示的可选实施方式中,视觉定位方法还包括步骤S103,将三维线段投影到图片中,根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段。
在该可选实施方式中,将三维线段投影到图片中,根据投影后三维线段的像素信息,将该像素信息拼接成的线段作为该三维线段的投影线段;在上述过程中,只保留视线范围内的三维线段作为投影线段,减小内存消耗,加快后续视觉定位效率,提高视觉定位的精度。
在本申请的一个可选实施例中,根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段,还包括:判断投影线段的像素信息和二维线段的像素信息的数量;若数量不一致,则对三维线段进行裁剪,并重新投影获取投影线段。
在该可选实施例中,分别计算投影后的三维线段在图片中所占像素的数量与二维线段在图片中所占像素的数量,当两者数量一致时,表示为该三维线段完全处于视线范围内,即保留的投影线段即为整段三维线段的投影线段;当两者数量不一致时,表示为,该三维线段只存在一部分处于视线范围内,即保留的投影线段为在视线范围内的三维线段,因此将视线范围之外的线段进行裁剪,只保留在视线范围内的三维线段,使得投影线段返投回三维空间时,在三维空间中对应的线段与裁剪后的三维线段长度一致。
图3示出了本申请一种视觉定位方法中确定投影线段的一个可选实例。
在图3所示的实例中,其中图3中的线段P’1P’2为前述的三维线段,中间的方框为针孔图,方框中的线段P1P2表示为前述三维线段投影后的投影线段二维线段。图3(a)表示为三维线段完全处于视线范围内的情况,此时,将线段P’1P’2投影到针孔图中时,三维线段全部投影到针孔图中,因此该三维线段即为投影线段返投回三维空间时,在三维空间中对应的线段;图3(b)表示为三维线段的一端不在视线范围内的情况,此时,将线段P’1P’2投影到针孔图中时,三维线段只有一部分投影到针孔图中,另一端超出视线范围,因此将超出视线范围部分的三维线段进行裁剪,使得投影线段返投回三维空间时,在三维空间中对应的线段与剩余部分长度一致;图3(c)表示为三维线段的两端均不在视线范围内的情况,此时,将线段P’1P’2投影到针孔图中时,三维线段对应的投影线段只有中间部分投影到针孔图中,两端均超出视线范围,因此将超出视线范围部分的三维线段进行裁剪,使得投影线段返投回三维空间时,在三维空间中对应的线段与剩余部分长度一致。
在本申请的一个可选实例中,裁剪的过程为对三维线段进行裁剪,裁剪后将剩余的经裁剪线段重新投影到针孔图中,与二维线段进行对比,以保证裁剪的精度;其中,与二维线段进行对比的具体过程为:将经裁剪线段投影到针孔图中,对比投影后经裁剪线段在针孔图中所占用像素的数量与二维线段在针孔图中所占用像素的数量,当两者数量一致时,将该经裁剪线段判定为目标三维线段;当两者数量不一致时,对该经裁剪线段进行重新裁剪,直至裁剪后的三维线段与二维线段在针孔图中所占用像素的数量一致,获取目标三维线段。
在图1所示的可选实施方式中,视觉定位方法还包括步骤S104,根据投影线段与二维线段之间的距离,确定车辆对应的位姿信息。
在该可选实施方式中,计算投影线段与二维线段之间的距离,通过该距离确定车辆当前的位姿信息是否需要调整,以获取准确的车辆对应的位姿信息,提高定位精度。
在本申请的一个可选实施例中,根据像素重合线段与二维线段之间的距离,获取车辆对应的位姿信息,进一步包括:分别计算投影线段的端点与二维线段的端点之间的垂直距离;当垂直距离小于或等于预设垂直阈值时,将车辆当前的位姿信息作为车辆对应的位姿信息;当垂直距离大于预设垂直阈值时,对车辆当前的位姿信息进行调整,将调整后的位姿信息确定为车辆对应的位姿信息。
在该可选实施例中,计算投影线段的端点与二维线段的端点之间的垂直距离,当垂直距离小于或等于预设垂直阈值时,表示车辆当前的位姿信息精度很高,无需进行调整,将其作为车辆对应的位姿信息即可;当垂直距离大于预设垂直阈值时,表示车辆当前的位姿信息精度低,需进行调整,将调整后垂直距离小于或等于预设垂直阈值的车辆的位姿信息作为车辆对应的位姿信息。
图4示出了本申请一种视觉定位方法中垂直距离计算的一个可选实例。
图4所示的线段P’1P’2为前述的投影线段,线段P1P2表示为前述的二维线段;在垂直距离计算过程中,分别计算端点P1与端点P’1之间的垂直距离,端点P2与端点P’2之间的垂直距离,当前述的两个垂直距离均小于或等于预设垂直阈值时,将自动驾驶车辆当前的位姿信息作为自动驾驶车辆对应的位姿信息。
图5示出了本申请一种视觉定位装置的可选实施方式。
在图5所示的可选实施方式中,视觉定位装置主要包括:二维线段提取模块501,其对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段,其中二维线段中包括地图特征所处环境的特征信息;线段匹配模块502,其将二维与预线段建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,其中三维线段中包括该三维线段对应地图特征所处环境的特征信息特征信息与三维信息;像素重合线段获取模块503,其将三维线段投影到图片中,根据三维线段在图片中的像素信息,获取三维线段在图片中的投影线段;定位模块504,其根据像素重合线段与二维线段之间的距离,确定车辆对应的位姿信息。
在本申请的一个可选实施例中,本申请一种视觉定位装置中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
本申请提供的视觉定位装置,可用于执行上述任一实施例描述的视觉定位方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的另一个可选实施方式中,本申请提供一种车辆,其包括视觉定位装置,其中视觉定位装置包括:;二维线段提取模块,其对根据车辆配置的相机采集的图片进行线段提取,获取地图特征对应的二维线段;线段匹配模块,其将二维与预线段建立的线特征地图进行线段匹配,获取二维线段对应的三维线段,其中三维线段中包括三维线段的空间信息与特征信息;像素重合线段获取模块,其将三维线段投影到图片中,根据三维线段在图片中的像素信息,获取三维线段对应的像素重合线段;定位模块,其根据像素重合线段与二维线段之间的距离,获取车辆对应的位姿信息。
本申请提供的地图制作系统,可用于执行上述任一实施例描述的视觉定位方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的另一个可选实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行上述实施例中描述的视觉定位方法。
在本申请的一个可选实施方式中,如图6所示,一种计算机设备,其包括:至少一个处理器,处理器和存储器耦合,存储器存储有计算机指令,该计算机指令被处理器执行时实现上述任一方案中的视觉定位方法。
在本申请的另一个具体实施方式中,一种计算机程序产品,其包含计算机指令,该计算机指令被操作以执行上述任一方案中的视觉定位方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种视觉定位方法,其特征在于,包括:
对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段,其中所述二维线段中包括所述地图特征所处环境的特征信息;
将所述二维线段与预建立的线特征地图进行线段匹配,获取所述二维线段对应的三维线段,其中所述三维线段中包括所述三维线段对应地图特征所述环境的特征信息与三维信息;
将所述三维线段投影到所述图片中,根据所述三维线段在所述图片中的像素信息,获取所述三维线段在所述图片中的投影线段;
根据所述投影线段与所述二维线段之间的距离,确定所述车辆对应的位姿信息。
2.根据权利要求1所述的视觉定位方法,其特征在于,所述根据所述三维线段在所述图片中的像素信息,获取所述三维线段在所述图片中的投影线段,还包括:
判断所述投影线段的像素信息和所述二维线段的像素信息的数量;
若所述数量不一致,则对所述三维线段进行裁剪,并重新投影获取所述投影线段。
3.根据权利要求1所述的视觉定位方法,其特征在于,所述根据所述像素重合线段与所述二维线段之间的距离,确定所述车辆对应的位姿信息,包括:
分别计算所述像素重合线段的端点与所述二维线段的端点之间的垂直距离;
当所述垂直距离小于或等于预设垂直阈值时,将所述车辆当前的位姿信息作为所述车辆对应的位姿信息;
当所述垂直距离大于所述预设垂直阈值时,对所述车辆当前的位姿信息进行调整,将调整后的所述位姿信息确定为所述车辆对应的位姿信息。
4.根据权利要求1所述的视觉定位方法,其特征在于,所述将所述二维线段与预建立的线特征地图进行线段匹配,获取所述二维线段对应的三维线段,包括:
将所述二维线段与所述线特征地图中的线段输入预设的图神经网络模型,将与所述二维线段的特征信息相似度大于预设相似阈值的特征信息对应的线段作为所述三维线段。
5.根据权利要求1所述的视觉定位方法,其特征在于,所述将所述二维线段与预建立的线特征地图进行线段匹配,还包括:
对所述线特征地图中的每一线段与所述二维线段分别采集预设采集数量的采样点,将所述采样点输入预设的图神经网络模型,利用动态规划算法将得分大于预设得分阈值的采样点进行匹配;
当两条线段上相互匹配的采样点的数量大于预设匹配数量时,判定所述两条线段匹配成功。
6.根据权利要求1所述的视觉定位方法,其特征在于,所述将所述二维线段与预建立的线特征地图进行线段匹配,获取所述二维线段对应的三维线段,还包括:
将所述线特征地图中的线段投影到所述图片中,利用欧式距离计算获取所述三维线段。
7.一种视觉定位装置,其特征在于,包括:
二维线段提取模块,其对根据车辆配置的相机拍摄的图片进行线段提取,获取地图特征对应的二维线段,其中所述二维线段中包括所述地图特征所处环境的特征信息;
线段匹配模块,其将所述二维线段与预建立的线特征地图进行线段匹配,获取所述二维线段对应的三维线段,其中所述三维线段中包括所述三维线段对应地图特征所述环境的特征信息与三维信息;
像素重合线段获取模块,其将所述三维线段投影到所述图片中,根据所述三维线段在所述图片中的像素信息,获取所述三维线段在所述图片中的投影线段;
定位模块,其根据所述投影线段与所述二维线段之间的距离,确定所述车辆对应的位姿信息。
8.一种车辆,其特征在于,所述车俩包括如权利要求7所述的视觉定位装置。
9.一种计算机可读存储介质,其存储有计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-6中任一项所述的视觉定位方法。
10.一种计算机设备,其特征在于,包括:
至少一个处理器,所述处理器和存储器耦合,所述存储器存储有计算机指令,其特征在于,所述计算机指令被所述处理器执行时实现如权利要求1-6任一项所述的视觉定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210967205.1A CN117629229A (zh) | 2022-08-12 | 2022-08-12 | 一种视觉定位方法、装置、车辆、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210967205.1A CN117629229A (zh) | 2022-08-12 | 2022-08-12 | 一种视觉定位方法、装置、车辆、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117629229A true CN117629229A (zh) | 2024-03-01 |
Family
ID=90022124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210967205.1A Pending CN117629229A (zh) | 2022-08-12 | 2022-08-12 | 一种视觉定位方法、装置、车辆、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117629229A (zh) |
-
2022
- 2022-08-12 CN CN202210967205.1A patent/CN117629229A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110568447B (zh) | 视觉定位的方法、装置及计算机可读介质 | |
CN113592989B (zh) | 一种三维场景的重建系统、方法、设备及存储介质 | |
CN109425348B (zh) | 一种同时定位与建图的方法和装置 | |
CN110335317B (zh) | 基于终端设备定位的图像处理方法、装置、设备和介质 | |
CN112785625B (zh) | 目标跟踪方法、装置、电子设备及存储介质 | |
WO2021051344A1 (zh) | 高精度地图中车道线的确定方法和装置 | |
CN109711321B (zh) | 一种结构自适应的宽基线影像视角不变直线特征匹配方法 | |
CN110926478B (zh) | 一种ar导航路线纠偏方法、系统及计算机可读存储介质 | |
CN113255578B (zh) | 交通标识的识别方法及装置、电子设备和存储介质 | |
CN112348885A (zh) | 视觉特征库的构建方法、视觉定位方法、装置和存储介质 | |
CN111928842B (zh) | 一种基于单目视觉实现slam定位的方法及相关装置 | |
CN113945937A (zh) | 精度检测方法、装置及存储介质 | |
CN114387199A (zh) | 图像标注方法及装置 | |
CN115493612A (zh) | 一种基于视觉slam的车辆定位方法及装置 | |
CN115619871A (zh) | 一种车辆定位方法、装置、设备及存储介质 | |
CN113592015B (zh) | 定位以及训练特征匹配网络的方法和装置 | |
CN113887391A (zh) | 用于识别路面标识的方法、装置以及自动驾驶车辆 | |
CN112598714A (zh) | 一种基于视频帧单应性变换的静止目标跟踪方法 | |
CN116977671A (zh) | 基于图像空间定位的目标跟踪方法、装置、设备及存储介质 | |
CN117629229A (zh) | 一种视觉定位方法、装置、车辆、介质及设备 | |
CN115661444A (zh) | 图像处理方法、装置、设备、存储介质及产品 | |
CN114898321A (zh) | 道路可行驶区域检测方法、装置、设备、介质及系统 | |
CN113378864A (zh) | 一种锚框参数的确定方法、装置、设备及可读存储介质 | |
CN117201708B (zh) | 带有位置信息的无人机视频拼接方法、装置、设备及介质 | |
CN112801077B (zh) | 用于自动驾驶车辆的slam初始化的方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |