CN115393821A - 一种目标检测方法和装置 - Google Patents
一种目标检测方法和装置 Download PDFInfo
- Publication number
- CN115393821A CN115393821A CN202110575924.4A CN202110575924A CN115393821A CN 115393821 A CN115393821 A CN 115393821A CN 202110575924 A CN202110575924 A CN 202110575924A CN 115393821 A CN115393821 A CN 115393821A
- Authority
- CN
- China
- Prior art keywords
- line segment
- image
- rod
- shaped object
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开了一种目标检测方法和装置,涉及智能驾驶和自动驾驶技术领域,能够提高杆的位置检测精度,从而提高车辆的定位精度。该方法包括:获得图像;提取该图像中的特征信息,该特征信息用于指示该图像中的杆状对象的关键点和第一斜率,或者该特征信息用于指示该杆状对象的第一端点和第二端点,或者该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点;根据该特征信息确定该杆状对象在该图像中的位置。
Description
技术领域
本申请涉及智能驾驶和自动驾驶技术领域,尤其涉及一种目标检测方法和装置。
背景技术
随着社会的发展和科技的进步,智能汽车正在逐步进入人们的日常生活。在智能驾驶和自动驾驶的场景中,杆如路灯杆、交通标牌杆、交通灯杆、龙门架杆、电线杆等,作为道路交通的基本设施随处可见,并且杆一旦安装完成,其变动的频率较低,因此,杆经常作为车辆自定位的参照物。示例的,车辆可以通过车载摄像头采集环境图像,并检测环境图像中的杆状对象,将检测到的杆状对象与高精度地图上预先存储的杆状对象进行位置匹配,从而对该车辆的位置进行定位。也就是说,杆状对象的位置检测精度越高,车辆的定位精度越高。
因此,如何提高图像中杆状对象的位置检测精度,从而提高车辆的定位精度成为业内亟待解决的技术问题。
发明内容
本申请提供了一种目标检测方法和装置,能够提高图像中杆状对象的位置检测精度,从而提高车辆的定位精度。为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种目标检测方法,该方法可以包括:获得图像;提取该图像中的特征信息,该特征信息用于指示该图像中的杆状对象的关键点和第一斜率,或者该特征信息用于指示该杆状对象的第一端点和第二端点,或者该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点;根据该特征信息确定该杆状对象在该图像中的位置。
本申请提供的目标检测方法通过提取图像中杆状对象的特征信息,并基于特征信息确定杆状对象在图像中的位置,能够精确表示杆状对象的位置,从而提高杆状对象的位置检测精度。
此外,由于基于本申请提供的目标检测方法确定的杆状对象的位置的精度较高,因此,基于该杆状对象的位置进行车辆定位的精度较高。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,该根据该特征信息确定该杆状对象在该图像中的位置,包括:根据该关键点和该第一斜率,确定该图像中的第一线段;根据该第一端点和第二端点,确定该图像中的第二线段;确定该第一线段和第二线段相交,且该第一线段和第二线段之间的夹角小于第一阈值;根据该第一线段和该第二线段确定第三线段,该第三线段用于指示该杆状对象在该图像中的位置。
也就是说,可以基于第一线段和第二线段,验证该第一线段和该第二线段是否属于该杆状对象;若该第一线段和该第二线段属于该杆状对象,则基于该第一线段和该第二线段确定第三线段。
采用本申请提供的目标检测方法,通过两种方式得到用于表示同一杆状对象的两个线段,并基于这两个线段对杆的位置进行验证,能够提高杆状对象的位置检测精度。
在一种可能的实现方式中,该根据该第一线段和该第二线段确定第三线段,包括:该第三线段为该第一线段;或者,该第三线段为该第二线段;或者,该第三线段为根据该第一线段和该第二线段生成的线段。
采用本申请提供的目标检测方法,通过第三线段表示杆状对象相比于现有技术中通过检测框表示杆状对象,准确度更高。此外,通过对第一线段和第二线段进行融合处理后生成的第三线段表示该杆状对象,可以进一步提高杆检测的精度。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,该根据该特征信息确定该杆状对象在该图像中的位置,包括:根据该关键点和该第一斜率,确定该图像中的第一线段;确定该第一端点和第二端点到该第一线段的距离小于第二阈值;根据该第一线段确定第三线段,该第三线段用于指示该杆状对象在该图像中的位置。
采用本申请提供的目标检测方法,通过两种方式得到用于表示同一杆状对象的两个线段,并基于这两个线段对杆的位置进行验证,能够提高杆状对象的位置检测精度。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点和第一斜率时,该根据该特征信息确定该杆状对象在该图像中的位置,包括:在该图像中确定通过该关键点且斜率为该第一斜率的第一线段,该第一线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,当该特征信息用于指示该杆状对象的第一端点和第二端点时,该根据该特征信息确定该杆状对象在该图像中的位置,包括:在该图像中确定端点为该第一端点和该第二端点的第二线段,该第二线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,在该获得图像后,该方法还包括:提取该图像中的多个位置点,该多个位置点用于指示该杆状对象;获得该多个位置点中每个位置点的第一置信度,该第一置信度用于指示该位置点为该杆状对象上的关键点的概率;该提取该图像中的特征信息,包括:根据该第一置信度从该多个位置点中选择该关键点。
在一种可能的实现方式中,该获得图像后,该方法还包括:提取该图像中的多个位置点,该多个位置点用于指示该杆状对象;获得该多个位置点中每个位置点的第二置信度,该第二置信度用于指示该位置点为该杆状对象的端点的概率;该提取该图像中的特征信息,包括:根据该第二置信度从该多个位置点中选择该第一端点和该第二端点。
具体地,可以将该图像输入特征提取模型,以使该特征提取模型提取该图像中包括的每个对象的特征图和该每个对象的第三置信度,该第三置信度用于指示对象为杆的概率,该特征图包括对象上的多个位置点。当检测出某一个或某几个对象的第三置信度较高或超过预设的第一阈值时,则预测该第三置信度较高或该第三置信度超过阈值的特征图(即第一特征图)对应的对象为杆状对象。将第一特征图输入输入端点检测模型,以输出该多个位置点中的每个位置点的第二置信度;将该多个位置点中第二置信度最高、且间距最远的两个位置点确定为该第一端点和该第二端点。
第二方面,本申请还提供一种目标检测装置,该装置可以包括:获得单元,该获得单元用于获得图像;提取单元,该提取单元用于提取该图像中的特征信息,该特征信息用于指示该图像中的杆状对象的关键点和第一斜率,或者该特征信息用于指示该杆状对象的第一端点和第二端点,或者该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点;确定单元,该确定单元用于根据该特征信息确定该杆状对象在该图像中的位置。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,该确定单元具体用于:根据该关键点和该第一斜率,确定该图像中的第一线段;根据该第一端点和第二端点,确定该图像中的第二线段;确定该第一线段和第二线段相交,且该第一线段和第二线段之间的夹角小于第一阈值;根据该第一线段和该第二线段确定第三线段,该第三线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,该第三线段为该第一线段;或者,该第三线段为该第二线段;或者,该第三线段为根据该第一线段和该第二线段生成的线段。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,该确定单元具体用于:根据该关键点和该第一斜率,确定该图像中的第一线段;确定该第一端点和第二端点到该第一线段的距离小于第二阈值;根据该第一线段确定第三线段,该第三线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点和第一斜率时,该确定单元具体用于:在该图像中确定通过该关键点且斜率为该第一斜率的第一线段,该第一线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,当该特征信息用于指示该杆状对象的第一端点和第二端点时,该确定单元具体用于:在该图像中确定端点为该第一端点和该第二端点的第二线段,该第二线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,该提取单元还用于提取该图像中的多个位置点,该多个位置点用于指示该杆状对象;该获得单元还用于获得该多个位置点中每个位置点的第一置信度,该第一置信度用于指示该位置点为该杆状对象上的关键点的概率;该提取单元具体用于根据该第一置信度从该多个位置点中选择该关键点。
在一种可能的实现方式中,该提取单元还用于提取该图像中的多个位置点,该多个位置点用于指示该杆状对象;该获得单元还用于获得该多个位置点中每个位置点的第二置信度,该第二置信度用于指示该位置点为该杆状对象的端点的概率;该提取单元具体用于根据该第二置信度从该多个位置点中选择该第一端点和该第二端点。
第三方面,本申请还提供一种目标检测装置,该装置可以包括存储器和处理器,该存储器存储计算机程序指令,该处理器运行该计算机程序指令以执行上述第一方面或其任意可能的实现方式中所述的操作。
可选地,该目标检测装置可以为芯片或集成电路。
第四方面,本申请还提供一种终端,该终端可以包括上述第二方面或其任意可能的实现方式中所述的目标检测装置;或者,该终端可以包括如上述第三方面或其任意可能的实现方式中所述的目标检测装置。
可选地,该终端可以为车辆。
第五方面,本申请还提供一种计算机可读存储介质,其特征在于,用于存储计算机程序,该计算机程序被处理器运行时,实现上述第一方面及其任意可能的实现方式中所述的方法。
第六方面,本申请还提供一种计算机程序产品,其特征在于,当该计算机程序产品在处理器上运行时,实现上述第一方面及其任意可能的实现方式中所述的方法。
本申请提供的目标检测装置、计算机存储介质、计算机程序产品、芯片和终端均用于执行上文所提供的目标检测方法,因此,其所能达到的有益效果可参考上文所提供的目标检测方法中的有益效果,此处不再赘述。
附图说明
图1为本申请实施例提供的杆的示意图;
图2为本申请实施例提供的车辆100的示意图;
图3为本申请实施例提供的图像A的示意图;
图4为现有的目标检测结果的示意图;
图5为本申请实施例提供的目标检测方法200的流程示意图;
图6为本申请实施例提供的目标检测过程的示意图;
图7为本申请实施例提供的另一目标检测过程的示意图;
图8为本申请实施例提供的又一目标检测过程的示意图;
图9为本申请实施例提供的又一目标检测过程的示意图;
图10为本申请实施例提供的又一目标检测过程的示意图;
图11为本申请实施例提供的又一目标检测过程的示意图;
图12为本申请实施例提供的又一目标检测过程的示意图;
图13为本申请实施例提供的目标检测结果的示意图;
图14为本申请实施例提供的目标检测装置300的示意性框图;
图15为本申请实施例提供的目标检测装置400的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或装置没有限定于已列出的步骤或单元,而是可选的还包括其他没有列出的步骤或单元,或可选的还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
需要说明的是,本申请实施例的描述中,“示例的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
首先,对本申请中的部分用语进行解释说明。
1.杆
杆,也称杆状对象,在智能驾驶和自动驾驶的场景中,主要起标识的作用,可以用作车辆自定位的参照物。
示例的,图1示出了几种杆状对象的示意图,杆状对象可以为图1中的(a)示出的电线杆、图1中的(b)示出的路灯杆、图1中的(c)示出的交通灯杆、图1中的(d)示出的交通标牌杆、图1中的(e)示出的龙门架杆等。
由于杆一旦安装完成,其安装位置变动的频率较低,因此,杆状对象的检测主要检测的是其垂直于地面的部分。示例的,杆状对象垂直于地面的部分如图1中的(a)、(b)、(c)、(d)和(e)中的端点A与端点B之间的部分。
2.直线的表示
由几何原理可知,直线可以通过点斜式或两点式表示。
点斜式:即y-y0=k1(x-x0),其中,k1表示直线的斜率,(x0,y0)表示直线上任意一个点的坐标。
两点式:即(y-y1)/(y2-y1)=(x-x1)/(x2-x1),其中,(x1,y1)和(x2,y2)分别表示直线上任意两个点的坐标。
3.神经网络模型
神经网络模型本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,在收集好训练样本后,对神经网络模型加以训练,神经网络模型就具有输入输出对之间的映射能力。
4.损失函数(loss function)
损失函数是用来估量模型的预测值与真实值的不一致程度,它是一个非负实值函数。损失函数越小,模型的鲁棒性就越好。一个最佳化问题的目标是将损失函数最小化。一个目标函数通常为一个损失函数本身或者为其负值。当一个目标函数为损失函数的负值时,目标函数的值寻求最大化。
本申请所述的目标检测方法,可以适用于需要对图像中的杆状对象进行检测和识别的各种场景中。下面将以智能驾驶和自动驾驶场景中、对道路两侧的杆状对象检测为例,对本申请进行详细说明。
请参考图2,图2为本申请实施例中的车辆的结构示意图。
耦合到车辆100或包括在车辆100中的组件可以包括推进系统110、传感器系统120、控制系统130、外围设备140、电源101、计算装置107以及用户接口108。计算装置107包括处理器102、收发器103和存储器104。计算装置107以是车辆100的控制器或控制器的一部分。存储器104包括处理器102可以运行的指令106,并且还可以存储地图数据105。车辆100的组件可以被配置为以与彼此互连和/或与耦合到各系统的其它组件互连的方式工作。例如,电源101可以向车辆100的所有组件提供电力。计算装置107可以被配置为从推进系统110、传感器系统120、控制系统130和外围设备140接收数据并对它们进行控制。计算装置107可以被配置为在用户接口108上生成图像的显示并从用户接口108接收输入。
在一些可能的实施方式中,车辆100还可以包括更多、更少或不同的系统,并且每个系统可以包括更多、更少或不同的组件。此外,示出的系统和组件可以按任意种的方式进行组合或划分,本申请实施例对此不做具体限定。
下面,对上述各个系统进行说明。
上述推进系统110可以用于车辆100提供动力运动。仍参见图2所示,推进系统110可以包括引擎/发动机114、能量源113、传动装置(transmission)112和车轮/轮胎111。当然,推进系统110还可以额外地或可替换地包括除了图2所示出组件外的其它组件,本申请实施例对此不做具体限定。
传感器系统120可以包括用于感测关于车辆100所位于的环境的信息的若干个传感器。如图所示,传感器系统的传感器包括全球定位系统(global positioning system,GPS)模块126、惯性测量单元(inertial measurement unit,IMU)125、激光雷达传感器(light detection and ranging,LiDAR)124、视觉传感器(visual sensor)123、毫米波雷达传感器(millimeter-wave radar)122以及用于为修改传感器的位置和/或朝向的致动器121中的至少一个。传感器系统120也可以包括额外的传感器,包括例如监视车辆100的内部系统的传感器(例如,O2监视器、燃油量表、机油温度,等中的至少一个)。传感器系统120也可以包括其它传感器。
GPS模块126可以为用于估计车辆100的地理位置的任何传感器。为此,GPS模块126可能包括收发器,基于卫星定位数据,估计车辆100相对于地球的位置。在示例中,计算装置107可以用于结合地图数据105使用GPS模块126来估计车辆100可以在其上行驶的道路上的车道边界的位置。GPS模块126也可以采取其它形式。
IMU 125可以是用于基于惯性加速度及其任意组合来感测车辆100的位置和朝向变化。在一些示例中,传感器的组合可以包括例如加速度计和陀螺仪。传感器的其它组合也是可能的。
LiDAR 124可以被看作物体检测系统,该传感器使用光感测或检测车辆100所位于的环境中的物体。通常,LIDAR 124是可以通过利用光照射目标来测量到目标的距离或目标的其它属性的光学遥感技术。作为示例,LIDAR 124可以包括被配置为发射激光脉冲的激光源和/或激光扫描仪,和用于为接收激光脉冲的反射的检测器。例如,LIDAR 124可以包括由转镜反射的激光测距仪,并且以一维或二维围绕数字化场景扫描激光,从而以指定角度间隔采集距离测量值。在示例中,LIDAR 124可以包括诸如光源(例如,激光)、扫描仪和光学系统、光检测器和接收器电子器件之类的组件,以及位置和导航系统。LIDAR124通过扫描一个物体上反射回来的激光确定物体的距离,可以形成精度高达厘米级的三维(3dimensions,3D)环境图。
视觉传感器123可以用于获取车辆100所位于的环境的图像的任何摄像头(例如,静态摄像头、视频摄像头等)。为此,视觉传感器123可以被配置为检测可见光,或可以被配置为检测来自光谱的其它部分(如红外光或紫外光)的光。其它类型的视觉传感器也是可能的。视觉传感器123可以是二维检测器,或可具有三维空间范围的检测器。在一些可能的实施方式中,视觉传感器123例如可以是距离检测器,其被配置为生成指示从视觉传感器123到环境中的若干点的距离的二维图像。为此,视觉传感器123可使用一种或多种距离检测技术。例如,视觉传感器123可被配置为使用结构光技术,其中车辆100利用预定光图案,诸如栅格或棋盘格图案,对环境中的物体进行照射,并且使用视觉传感器123检测从物体的预定光图案的反射。基于反射的光图案中的畸变,车辆100可被配置为检测到物体上的点的距离。预定光图案可包括红外光或其它波长的光。
毫米波雷达传感器122通常指波长为1~10mm的物体检测传感器,频率大致范围是10GHz~200GHz。毫米波雷达测量值具备深度信息,可以提供目标的距离;其次,由于毫米波雷达有明显的多普勒效应,对速度非常敏感,可以直接获得目标的速度,通过检测其多普勒频移可将目标的速度提取出来。目前主流的两种车载毫米波雷达应用频段分别为24GHz和77GHz,前者波长约为1.25cm,主要用于短距离感知,如车身周围环境、盲点、泊车辅助、变道辅助等;后者波长约为4mm,用于中长距离测量,如自动跟车、自适应巡航(adaptive cruisecontrol,ACC)、紧急制动(autonomous emergency braking,AEB)等。
控制系统130可被配置为控制车辆100及其组件的操作。为此,控制系统130可包括转向单元136、油门135、制动单元134、传感器融合单元133、计算机视觉系统132、导航或路线控制(pathing)系统131。当然,控制系统130还可以额外地或可替换地包括除了图2所示出组件外的其它组件,本申请实施例对此不做具体限定。
外围设备140可被配置为允许车辆100与外部传感器、其它车辆和/或用户交互。为此,外围设备140可以包括例如无线通信系统144、触摸屏143、麦克风142和/或扬声器141。当然,外围设备140可以额外地或可替换地包括除了图2所示出组件外的其它组件,本申请实施例对此不做具体限定。
电源101可以被配置为向车辆100的一些或全部组件提供电力。为此,电源101可以包括例如可再充电锂离子或铅酸电池。在一些示例中,一个或多个电池组可被配置为提供电力。其它电源材料和配置也是可能的。在一些可能的实现方式中,电源101和能量源113可以一起实现。
包括在计算装置107中的处理器102可包括一个或多个通用处理器和/或一个或多个专用处理器(例如,图像处理器、数字信号处理器等)。就处理器102包括多于一个处理器而言,此时处理器可单独工作或组合工作。计算装置107可以实现基于通过用户接口108接收的输入控制车辆100的功能。
收发器103用于计算装置107与各个系统间的通信。
存储器104进一步可以包括一个或多个易失性存储组件和/或一个或多个非易失性存储组件,诸如光、磁和/或有机存储装置,并且存储器104可全部或部分与处理器102集成。存储器104可以包含可由处理器102运行的指令106(例如,程序逻辑),以运行各种车辆功能,包括本申请实施例中描述的功能或方法中的任何一个。
车辆100的组件可以被配置为以与在其各自的系统内部和/或外部的其它组件互连的方式工作。为此,车辆100的组件和系统可通过系统总线、网络和/或其它连接机制连接在一起。
在本申请实施例中,结合上述车辆100的结构,上述车辆在智能驾驶或自动驾驶模式的过程中,通常采用目标检测算法对道路上的杆状对象进行实时检测,以定位车辆的位置。例如,通过目标检测,可以实时获知车辆可视范围内所有杆状对象的位置,并与地图数据中预先存储的杆状对象进行匹配,以定位车辆的位置。
当采用目标检测算法进行目标检测时,计算装置通常将杆状对象的整体作为检测目标,以检测框的形式对该检测目标进行表示,这样对杆状对象的表示方式不准确,且由于车辆可视范围内的环境比较复杂,检测框中可能包含除检测目标外大量的无效背景,因此,杆状对象的位置检测精度较低,从而可能导致车辆的定位精度较低。
示例的,车辆的摄像装置获得如图3所示的图像A,计算装置以杆状对象整体作为检测目标进行目标检测,并得到如图4所示的检测结果,如图4所示,杆状对象通过检测框的形式被标注。然而,由于检测框中除了包括杆状对象,如路灯杆或龙门架杆之外,还包括很多无效背景,如道路两旁的树木、房子等对象,因此,杆状对象的位置检测精度较差,从而基于该检测框表示的检测结果进行车辆定位的精度较差。
为了解决上述问题,本申请实施例提供一种目标检测方法,该方法可以应用于目标检测装置。该目标检测装置可以为上述实施例中所述的计算装置或者计算装置中的一部分。
图5示出了本申请实施例提供的目标检测方法200的示意性流程图。如图5所示,该方法200可以包括如下步骤。
S201,获得图像。
可选地,可以利用摄像装置或者雷达探测装置获得该图像,本申请实施例不做限定。
这里的摄像装置可以为上述传感器系统中的视觉传感器,用于采集车体前方道路的图像。该图像中可以包括杆状对象,当然,还可以包括行人、车辆、路面、隔离栏等对象、人行道、行道树等物体,本申请实施例不做具体限定。
在实际应用中,摄像装置可以为单目摄像头,由单目摄像头在一个时刻拍摄一张待处理的图像。或者,摄像装置还可以包括多目摄像头,这些摄像头可以在物理上合设于一个摄像装置中,还可以在物理上分设于多个摄像装置中。通过多目摄像头在同一时刻拍摄多张图像,并可以根据这些图像进行处理,得到一张待识别的图像。当然,摄像装置还可以为其他情况,本申请实施例不做具体限定。
具体实现中,摄像装置可以实时地采集图像,或者可以周期性地采集图像。该周期如3s、5s、10s等。摄像装置还可以通过其他方式采集图像,本申请实施例不做具体限定。摄像装置采集到图像后,可以将图像传递给上述目标检测装置,此时,目标检测装置可以获得该图像。
这里的雷达探测装置可以为上述传感器系统中的毫米波雷达传感器,用于在该雷达探测装置的探测范围内发射探测信号,接收该探测信号的回波信号,并将该回波信号传递该上述目标检测装置,此时,目标检测装置可以基于该回波信号进行分析和计算得到点云图像,即得到该图像。
可选地,S201可以是在车辆启动后,或者车辆启动自动驾驶功能之后执行。
S202,提取该图像中的特征信息,该特征信息用于指示该图像中的杆状对象的关键点和第一斜率,或者该特征信息用于指示该杆状对象的第一端点和第二端点,或者该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点。
可选地,在S201之后,该方法还可以包括:提取该图像中的多个位置点,该多个位置点用于指示该杆状对象;获得该多个位置点中每个位置点的第一置信度,该第一置信度用于指示该位置点为该杆状对象上的关键点的概率;相应地,S202可以包括:根据该第一置信度从该多个位置点中选择该关键点。
示例的,该目标检测装置获得如图3中所示的图像A,对图像A中的对象进行特征提取,得到如图6中所示的多个特征图像(每个对象对应一个特征图)和该多个特征图中每个特征图像对应的第三置信度,该第三置信度用于指示对象为杆的概率。然后,将第三置信度大于0.5(如图6中的方框所示)的第一特征图像对应的对象确定为杆状对象。进一步地,以第三置信度为0.81的杆状对象的第一特征图像为例,对该第一特征图像进行关键点检测得到检测结果,该检测结果包括该杆状对象上包括的多个位置点(图7中仅以位置点P、位置点Q和位置点M为例进行说明)中每个位置点的第一置信度,该第一置信度用于指示该位置点属于关键点的概率。最后,根据图7可以得到,位置点P的置信度最大或大于预设的第二阈值(如0.95),因此,该目标检测装置可以将该位置点P确定为该杆状对象的关键点。
在一种可能的实现方式中,可以将该图像输入特征提取模型,以使该特征提取模型提取该图像中包括的每个对象的特征图和该每个对象的第三置信度,该第三置信度用于指示对象为杆的概率,该特征图包括对象上的多个位置点。当检测出某一个或某几个对象的第三置信度较高或超过预设的第一阈值时,则预测该第三置信度较高或该第三置信度超过阈值的特征图(即第一特征图)对应的对象为杆状对象。将第一特征图输入输入关键点检测模型,以输出该多个位置点中的每个位置点的第一置信度;将该多个位置点中第一置信度最高的位置点确定为该关键点。
可选地,该目标检测装置可以通过多种方式获得该特征提取模型。
在一种可能的实现方式中,该特征提取模型可以是预先配置在该目标检测装置中的。
在另一种可能的实现方式中,该特征提取模型可以是其它装置发送给该目标检测装置的。
在又一种可能的实现方式中,该特征提取模型可以是基于第一训练样本集和预设的第一损失函数,对第一神经网络训练得到的。
具体地,该第一训练样本集可以包括第一样本图像和对该第一样本图像的第一标注信息。这里的第一样本图像中包括至少一个对象,该至少一个对象包括杆状对象,该第一标注信息用于指示第一样本图像中包括的对象的类别。可选地,该至少一个对象还可以包括其他对象,本申请实施例不做具体限定。
将第一样本图像输入至已经进行参数设置的第一神经网络,得到第一随机输出信息,该第一随机输出信息包括第一样本图像中呈现的对象对应的类别以及呈现的对象对应的类别的置信度。
然后,利用第一损失函数计算第一随机输出信息与第一标注信息之间的偏差,基于该偏差,迭代调整第一神经网络的权重参数,从而得到上述特征提取模型。这里的第一损失函数可以包括但不限于:均方差函数、交叉熵函数、范数函数等。上述第一标注信息可以包括标注的置信度,这里的计算第一随机输出信息与第一标注信息之间的偏差,可以是指呈现的对象对应的类别的置信度与标注的置信度之间的偏差。
可选地,该目标检测装置可以通过多种方式获得该关键点检测模型。
在一种可能的实现方式中,该关键点检测模型可以是预先配置在该目标检测装置中的。
在另一种可能的实现方式中,该关键点检测模型可以是其它装置发送给该目标检测装置的。
在又一种可能的实现方式中,该关键点检测模型可以是基于第二训练样本集和预设的第二损失函数,对第二神经网络训练得到的。
具体地,该第二训练样本集可以包括第二样本图像和对该第二样本图像的第二标注信息。这里的第二样本图像中包括至少一个杆状对象,该第二标注信息用于指示第二样本图像中每个杆状对象的关键点的位置。
将第二样本图像输入至已经进行参数设置的第二神经网络,得到第二随机输出信息,该第二随机输出信息包括第二样本图像中每个位置点的第一置信度。
然后,利用第二损失函数计算第二随机输出信息与第二标注信息之间的偏差,基于该偏差,迭代调整第二神经网络的权重参数,从而得到上述关键点检测模型。这里的第二损失函数可以包括但不限于:交叉熵函数、均方差函数、范数函数等。上述第二标注信息可以包括标注的置信度,这里的计算第二随机输出信息与第二标注信息之间的偏差,可以是指呈现的每个位置点的置信度与标注的关键点的置信度之间的偏差。
需要说明的是,本申请中所述的神经网络可以包括卷积层、池化层、隐藏层、全连接层等。各层的数目可以根据所要识别的类别的数目、每一张图像中呈现的对象的类别数目以及图像的像素数目等确定。
可选地,该杆状对象上的关键点可以为中心点。
可选地,在S201之后,该方法还可以包括:提取该图像中的多个位置点,该多个位置点用于指示该杆状对象;获得该多个位置点中每个位置点的第二置信度,该第二置信度用于指示该位置点为该杆状对象的端点的概率;相应地,S202可以包括:根据该第二置信度从该多个位置点中选择该第一端点和该第二端点。具体实现过程可以参考上述图6和图7中介绍的确定关键点的过程,此处不再赘述。
需要说明的是,若该图像是利用摄像装置拍摄得到的,则上述位置点可以理解为图像中的像素点;或者,若该图像是利用雷达探测装置探测得到的,则上述位置点可以理解为点云中的点。
可选地,本申请中所述的位置点可以包括一个或多个像素点;或者可以包括一个或多个点云中的点。
S203,根据该特征信息确定该杆状对象在该图像中的位置。
下面将基于该特征信息包括的不同内容,分情况介绍该S203的过程。
情况1:该特征信息用于指示该图像中的杆状对象的关键点和第一斜率。
在一种可能的实现方式中,S203可以通过如下步骤实现:在该图像中确定通过该关键点且斜率为该第一斜率的第一线段,该第一线段用于指示该杆状对象在该图像中的位置。
示例的,以图7中关键点P的像素坐标为(x0,y0),位置点Q的像素坐标为(x1,y1)为例,该杆检测装置可以基于位置点P和位置点Q的像素坐标,确定该第一斜率k1=(y1-y0)/(x1-x0)。进一步地,如图8所示,该目标检测装置可以将通过该关键点P且斜率为该第一斜率的线段AB确定为该第一线段。
情况2:该特征信息用于指示该图像中的杆状对象的第一端点和第二端点。
在一种可能的实现方式中,S203可以通过如下步骤实现:在该图像中确定端点为该第一端点和该第二端点的第二线段,该第二线段用于指示该杆状对象在该图像中的位置。
示例的,如图9所示,以端点C的像素坐标为(x3,y3),端点D的像素坐标为(x4,y4)为例,该目标检测装置可以将端点为该第一端点和该第二端点的第二线段CD确定为该第二线段。
情况3:该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点。
在一种可能的实现方式中,S203可以通过如下步骤实现:根据该关键点和该第一斜率,确定该图像中的第一线段;根据该第一端点和第二端点,确定该图像中的第二线段;确定该第一线段和第二线段相交,且该第一线段和第二线段之间的夹角小于第一阈值;根据该第一线段和该第二线段确定第三线段,该第三线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,上述根据该关键点和该第一斜率,确定该图像中的第一线段,可以包括:在该图像中确定通过该关键点且斜率为该第一斜率的第一线段,该第一线段用于指示该杆状对象在该图像中的位置,具体确定过程可以参考情况1中的介绍,此处不再赘述。
在一种可能的实现方式中,上述根据该第一端点和第二端点,确定该图像中的第二线段,可以包括:在该图像中确定端点为该第一端点和该第二端点的第二线段,该第二线段用于指示该杆状对象在该图像中的位置,具体确定过程可以参考情况2中的介绍,此处不再赘述。
也就是说,可以基于第一线段和第二线段,验证该第一线段和该第二线段是否属于该杆状对象;若该第一线段和该第二线段属于该杆状对象,则基于该第一线段和该第二线段确定第三线段。
在一种可能的实现方式中,可以基于该第一线段和第二线段相交,且该第一线段和第二线段之间的夹角小于第一阈值,确定该第一线段和该第二线段属于该杆状对象。
示例的,如图10所示,以第一线段为AB,第二线段为CD为例,若AB和CD相交于点O,且AB与CD之间的夹角θ1小于预设的θ0(即第一阈值),则确定该第一线段和该第二线段属于该杆状对象。
可选地,上述根据该第一线段和该第二线段确定第三线段,可以包括:该第三线段为该第一线段;或者,该第三线段为该第二线段;或者,该第三线段为根据该第一线段和该第二线段生成的线段。
可选地,本申请对基于该第一线段和该第二线段生成该第三线段的方式不做限定。
示例的,如图11所示,该第三线段可以为AB、CD或EF。其中,EF与AB之间的夹角以及EF与CD之间的夹角均等于θ1/2。
在另一种可能的实现方式中,S203可以通过如下步骤实现:根据该关键点和该第一斜率,确定该图像中的第一线段;确定该第一端点和第二端点到该第一线段的距离小于第二阈值;根据该第一线段确定第三线段,该第三线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,上述根据该关键点和该第一斜率,确定该图像中的第一线段,可以包括:在该图像中确定通过该关键点且斜率为该第一斜率的第一线段,该第一线段用于指示该杆状对象在该图像中的位置,具体确定过程可以参考情况1中的介绍,此处不再赘述。
也就是说,可以基于第一端点和第二端点,验证该第一线段是否属于该杆状对象;若该第一线段属于该杆状对象,则将该第一线段确定为第三线段。
具体地,可以基于该第一端点与该第一线段之间的距离以及该第二端点与该第一线段之间的距离均小于第二阈值,确定该第一线段属于该杆状对象。
示例的,如图12所示,以第一线段为AB,第一端点为点C,第二端点为点D为例,若点C与AB之间的距离为d1,点D与AB之间的距离为d2,且d1和d2均小于预设的d0(即第二阈值),确定该第一线段属于该杆状对象。
可选地,在S203中,该杆状对象在该图像中的位置可以通过多种方式指示,本申请不做具体限定。
在一种可能的实现方式中,在203可以包括:可以根据该特征信息确定位置信息,该位置信息用于指示该杆状对象在该图像中的位置。示例的,该位置信息可以包括该杆状对象中每个位置点在该图像中的像素坐标。
通过上述S201~S203对如图3所示的图像A进行目标检测后,可以得到如图13所示的检测结果,其中,图像A中的每个杆状对象的位置均通过第三线段表示。这样相比于图4中所示的通过现有技术中的目标检测方法得到的检测结果来讲,杆状对象的表示更精准,位置检测精度更高,
可选地,在S203之后,该方法还可以包括:基于该图像中检测得到的杆状对象与地图数据中预先存储的杆状对象进行位置匹配,以定位车辆的位置。由于采用本申请实施例提供的目标检测方法得到的杆状对象的位置的精度较高,因此,基于该位置检测结果进行车辆定位的精度较高。
上面结合图3、图5至图13介绍了本申请实施例提供的目标检测方法,下面将进一步介绍本申请实施例提供的目标检测装置。
图14示出了本申请实施例提供的目标检测装置300的示意性框图。如图14所示,该装置300可以包括获得单元301、提取单元302和确定单元303。该获得单元301用于获得图像;该提取单元302用于提取该图像中的特征信息,该特征信息用于指示该图像中的杆状对象的关键点和第一斜率,或者该特征信息用于指示该杆状对象的第一端点和第二端点,或者该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点;该确定单元303用于根据该特征信息确定该杆状对象在该图像中的位置。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,该确定单元303具体用于根据该关键点和该第一斜率,确定该图像中的第一线段;根据该第一端点和第二端点,确定该图像中的第二线段;确定该第一线段和第二线段相交,且该第一线段和第二线段之间的夹角小于第一阈值;根据该第一线段和该第二线段确定第三线段,该第三线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,该第三线段为该第一线段;或者,该第三线段为该第二线段;或者,该第三线段为根据该第一线段和该第二线段生成的线段。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,该确定单元303具体用于:根据该关键点和该第一斜率,确定该图像中的第一线段;确定该第一端点和第二端点到该第一线段的距离小于第二阈值;根据该第一线段确定第三线段,该第三线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,当该特征信息用于指示该图像中的杆状对象的关键点和第一斜率时,该确定单元303具体用于:在该图像中确定通过该关键点且斜率为该第一斜率的第一线段,该第一线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,当该特征信息用于指示该杆状对象的第一端点和第二端点时,该确定单元303具体用于:在该图像中确定端点为该第一端点和该第二端点的第二线段,该第二线段用于指示该杆状对象在该图像中的位置。
在一种可能的实现方式中,该提取单元301还用于提取该图像中的多个位置点,该多个位置点用于指示该杆状对象;该获得单元302还用于获得该多个位置点中每个位置点的第一置信度,该第一置信度用于指示该位置点为该杆状对象上的关键点的概率;该提取单元301具体用于根据该第一置信度从该多个位置点中选择该关键点。
在一种可能的实现方式中,该提取单元301还用于提取该图像中的多个位置点,该多个位置点用于指示该杆状对象;该获得单元302还用于获得该多个位置点中每个位置点的第二置信度,该第二置信度用于指示该位置点为该杆状对象的端点的概率;该提取单元301具体用于根据该第二置信度从该多个位置点中选择该第一端点和该第二端点。
需要说明的是,上述装置之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。在一个可选例子中,装置300可以具体为上述方法200实施例中的目标检测装置,装置300可以用于执行上述方法200实施例中与目标检测装置对应的各个流程和/或步骤,为避免重复,在此不再赘述。
图14所示实施例中的各个单元中的一个或多个可以通过软件、硬件、固件或其结合实现。所述软件或固件包括但不限于计算机程序指令或代码,并可以被硬件处理器所执行。所述硬件包括但不限于各类集成电路,如中央处理单元(CPU,Central ProcessingUnit)、数字信号处理器(DSP,Digital Signal Processor)、现场可编程门阵列(FPGA,Field Programmable Gate Array)或专用集成电路(ASIC,Application SpecificIntegrated Circuit)。
图15示出了本申请实施例提供的目标检测装置400的示意性框图。装置400可以包括处理器401和通信接口402,处理器401和通信接口402耦合。
通信接口402,用于向处理器401输入信息,和/或从处理器401输出信息;处理器401运行计算机程序或指令,以使目标检测装置400实现上述方法200实施例所描述的目标检测方法。
本申请实施例中的处理器401包括但不限于中央处理单元(Central ProcessingUnit,CPU)、通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)、分立门或者晶体管逻辑器件或分立硬件组件等。通用处理器可以是微处理器、微控制器或者是任何常规的处理器等。
例如,处理器401用于通过通信接口402获得图像;提取所述图像中的特征信息,所述特征信息用于指示所述图像中的杆状对象的关键点和第一斜率,或者所述特征信息用于指示所述杆状对象的第一端点和第二端点,或者所述特征信息用于指示所述图像中的杆状对象的关键点、第一斜率、第一端点和第二端点;根据所述特征信息确定所述杆状对象在所述图像中的位置。在一个可选例子中,本领域技术人员可以理解,装置400可以具体为上述方法200实施例中的目标检测装置,装置400可以用于执行上述方法200实施例中与目标检测装置对应的各个流程和/或步骤,为避免重复,在此不再赘述。
可选地,装置400还可以包括存储器403。
存储器403可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。
具体地,存储器403用于存储目标检测装置的程序代码和指令。可选地,存储器403还用于存储处理器401执行上述方法200实施例过程中获得的数据,如通过通信接口402获得的图像。
可选地,存储器403可以为单独的器件或集成在处理器401中。
需要说明的是,图15仅仅示出了装置400的简化设计。在实际应用中,装置400还可以分别包含必要的其他元件,包含但不限于任意数量的通信接口、处理器、控制器、存储器等,而所有可以实现本申请的装置400都在本申请的保护范围之内。
在一种可能的设计中,装置400可以为芯片。可选地,该芯片还可以包括一个或多个存储器,用于存储计算机执行指令,当该芯片装置运行时,处理器可执行存储器存储的计算机执行指令,以使芯片执行上述目标检测方法。
可选地,该芯片装置可以为实现相关功能的现场可编程门阵列,专用集成芯片,系统芯片,中央处理器,网络处理器,数字信号处理电路,微控制器,还可以采用可编程控制器或其他集成芯片。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当该计算机指令在计算机上运行时,实现上述方法实施例描述的目标检测方法。
本申请实施例还提供一种计算机程序产品,当该计算机程序产品在处理器上运行时,实现上述方法实施例描述的目标检测方法。
本申请实施例提供的目标检测装置、计算机可读存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的目标检测方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (19)
1.一种目标检测方法,其特征在于,包括:
获得图像;
提取所述图像中的特征信息,所述特征信息用于指示所述图像中的杆状对象的关键点和第一斜率,或者所述特征信息用于指示所述杆状对象的第一端点和第二端点,或者所述特征信息用于指示所述图像中的杆状对象的关键点、第一斜率、第一端点和第二端点;
根据所述特征信息确定所述杆状对象在所述图像中的位置。
2.根据权利要求1所述的方法,其特征在于,当所述特征信息用于指示所述图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,所述根据所述特征信息确定所述杆状对象在所述图像中的位置,包括:
根据所述关键点和所述第一斜率,确定所述图像中的第一线段;
根据所述第一端点和第二端点,确定所述图像中的第二线段;
确定所述第一线段和第二线段相交,且所述第一线段和第二线段之间的夹角小于第一阈值;
根据所述第一线段和所述第二线段确定第三线段,所述第三线段用于指示所述杆状对象在所述图像中的位置。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一线段和所述第二线段确定第三线段,包括:
所述第三线段为所述第一线段;或者,
所述第三线段为所述第二线段;或者,
所述第三线段为根据所述第一线段和所述第二线段生成的线段。
4.根据权利要求1所述的方法,其特征在于,当所述特征信息用于指示所述图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,所述根据所述特征信息确定所述杆状对象在所述图像中的位置,包括:
根据所述关键点和所述第一斜率,确定所述图像中的第一线段;
确定所述第一端点和第二端点到所述第一线段的距离小于第二阈值;
根据所述第一线段确定第三线段,所述第三线段用于指示所述杆状对象在所述图像中的位置。
5.根据权利要求1所述的方法,其特征在于,当所述特征信息用于指示所述图像中的杆状对象的关键点和第一斜率时,所述根据所述特征信息确定所述杆状对象在所述图像中的位置,包括:
在所述图像中确定通过所述关键点且斜率为所述第一斜率的第一线段,所述第一线段用于指示所述杆状对象在所述图像中的位置。
6.根据权利要求1所述的方法,其特征在于,当所述特征信息用于指示所述杆状对象的第一端点和第二端点时,所述根据所述特征信息确定所述杆状对象在所述图像中的位置,包括:
在所述图像中确定端点为所述第一端点和所述第二端点的第二线段,所述第二线段用于指示所述杆状对象在所述图像中的位置。
7.根据权利要求1-6任一项所述的方法,其特征在于,在所述获得图像后,所述方法还包括:
提取所述图像中的多个位置点,所述多个位置点用于指示所述杆状对象;
获得所述多个位置点中每个位置点的第一置信度,所述第一置信度用于指示所述位置点为所述杆状对象上的关键点的概率;
所述提取所述图像中的特征信息,包括:
根据所述第一置信度从所述多个位置点中选择所述关键点。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述获得图像后,所述方法还包括:
提取所述图像中的多个位置点,所述多个位置点用于指示所述杆状对象;
获得所述多个位置点中每个位置点的第二置信度,所述第二置信度用于指示所述位置点为所述杆状对象的端点的概率;
所述提取所述图像中的特征信息,包括:
根据所述第二置信度从所述多个位置点中选择所述第一端点和所述第二端点。
9.一种目标检测装置,其特征在于,包括:
获得单元,所述获得单元用于获得图像;
提取单元,所述提取单元用于提取所述图像中的特征信息,所述特征信息用于指示所述图像中的杆状对象的关键点和第一斜率,或者所述特征信息用于指示所述杆状对象的第一端点和第二端点,或者所述特征信息用于指示所述图像中的杆状对象的关键点、第一斜率、第一端点和第二端点;
确定单元,所述确定单元用于根据所述特征信息确定所述杆状对象在所述图像中的位置。
10.根据权利要求9所述的装置,其特征在于,当所述特征信息用于指示所述图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,所述确定单元具体用于:
根据所述关键点和所述第一斜率,确定所述图像中的第一线段;
根据所述第一端点和第二端点,确定所述图像中的第二线段;
确定所述第一线段和第二线段相交,且所述第一线段和第二线段之间的夹角小于第一阈值;
根据所述第一线段和所述第二线段确定第三线段,所述第三线段用于指示所述杆状对象在所述图像中的位置。
11.根据权利要求10所述的装置,其特征在于:
所述第三线段为所述第一线段;或者,
所述第三线段为所述第二线段;或者,
所述第三线段为根据所述第一线段和所述第二线段生成的线段。
12.根据权利要求9所述的装置,其特征在于,当所述特征信息用于指示所述图像中的杆状对象的关键点、第一斜率、第一端点和第二端点时,所述确定单元具体用于:
根据所述关键点和所述第一斜率,确定所述图像中的第一线段;
确定所述第一端点和第二端点到所述第一线段的距离小于第二阈值;
根据所述第一线段确定第三线段,所述第三线段用于指示所述杆状对象在所述图像中的位置。
13.根据权利要求9所述的装置,其特征在于,当所述特征信息用于指示所述图像中的杆状对象的关键点和第一斜率时,所述确定单元具体用于:
在所述图像中确定通过所述关键点且斜率为所述第一斜率的第一线段,所述第一线段用于指示所述杆状对象在所述图像中的位置。
14.根据权利要求9所述的装置,其特征在于,当所述特征信息用于指示所述杆状对象的第一端点和第二端点时,所述确定单元具体用于:
在所述图像中确定端点为所述第一端点和所述第二端点的第二线段,所述第二线段用于指示所述杆状对象在所述图像中的位置。
15.根据权利要求9-14任一项所述的装置,其特征在于:
所述提取单元还用于提取所述图像中的多个位置点,所述多个位置点用于指示所述杆状对象;
所述获得单元还用于获得所述多个位置点中每个位置点的第一置信度,所述第一置信度用于指示所述位置点为所述杆状对象上的关键点的概率;
所述提取单元具体用于根据所述第一置信度从所述多个位置点中选择所述关键点。
16.根据权利要求9-15任一项所述的装置,其特征在于:
所述提取单元还用于提取所述图像中的多个位置点,所述多个位置点用于指示所述杆状对象;
所述获得单元还用于获得所述多个位置点中每个位置点的第二置信度,所述第二置信度用于指示所述位置点为所述杆状对象的端点的概率;
所述提取单元具体用于根据所述第二置信度从所述多个位置点中选择所述第一端点和所述第二端点。
17.一种目标检测装置,其特征在于,包括存储器和处理器,所述存储器存储计算机程序指令,所述处理器运行所述计算机程序指令以执行权利要求1-8任一项所述的操作。
18.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序被处理器运行时,实现如权利要求1-8任一项所述的方法。
19.一种计算机程序产品,其特征在于,当所述计算机程序产品在处理器上运行时,实现如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110575924.4A CN115393821A (zh) | 2021-05-25 | 2021-05-25 | 一种目标检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110575924.4A CN115393821A (zh) | 2021-05-25 | 2021-05-25 | 一种目标检测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115393821A true CN115393821A (zh) | 2022-11-25 |
Family
ID=84114640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110575924.4A Pending CN115393821A (zh) | 2021-05-25 | 2021-05-25 | 一种目标检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115393821A (zh) |
-
2021
- 2021-05-25 CN CN202110575924.4A patent/CN115393821A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7297017B2 (ja) | オンボードセンサの外部パラメータを較正する方法及び装置、並びに関連する車両 | |
CN110832275B (zh) | 基于双目图像更新高分辨率地图的系统和方法 | |
CN108762245B (zh) | 数据融合方法以及相关设备 | |
WO2021227645A1 (zh) | 目标检测方法和装置 | |
CN112665556B (zh) | 使用被动和主动测量生成场景的三维地图 | |
US9298992B2 (en) | Geographic feature-based localization with feature weighting | |
US11971274B2 (en) | Method, apparatus, computer program, and computer-readable recording medium for producing high-definition map | |
CN111192295B (zh) | 目标检测与跟踪方法、设备和计算机可读存储介质 | |
Brenner | Extraction of features from mobile laser scanning data for future driver assistance systems | |
CN110945379A (zh) | 从地图数据、激光和相机确定偏航误差 | |
WO2020259284A1 (zh) | 一种障碍物检测方法及装置 | |
CN110567465B (zh) | 使用精度规范定位车辆的系统和方法 | |
WO2024012211A1 (zh) | 自动驾驶环境感知方法、介质及车辆 | |
KR101700764B1 (ko) | 자율 이동 방법 및 그 장치 | |
US10249056B2 (en) | Vehicle position estimation system | |
WO2019188704A1 (ja) | 自己位置推定装置、自己位置推定方法、プログラム及び記憶媒体 | |
CN116430404A (zh) | 相对位置的确定方法和装置、存储介质及电子装置 | |
CN115718304A (zh) | 目标对象检测方法、装置、车辆及存储介质 | |
CN115393821A (zh) | 一种目标检测方法和装置 | |
CN112946587B (zh) | 通信方法和装置 | |
CN109964132B (zh) | 用于在运动物体上配置传感器的方法、设备和系统 | |
CN215495425U (zh) | 复眼摄像系统及使用复眼摄像系统的车辆 | |
CN113822932B (zh) | 设备定位方法、装置、非易失性存储介质及处理器 | |
TWM618998U (zh) | 複眼攝像系統及使用複眼攝像系統的車輛 | |
Cho et al. | Object Classification of Laser Scanner by Using Recurrent Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |