CN114821511B - 杆体检测方法、装置、车辆、存储介质及芯片 - Google Patents
杆体检测方法、装置、车辆、存储介质及芯片 Download PDFInfo
- Publication number
- CN114821511B CN114821511B CN202210702950.3A CN202210702950A CN114821511B CN 114821511 B CN114821511 B CN 114821511B CN 202210702950 A CN202210702950 A CN 202210702950A CN 114821511 B CN114821511 B CN 114821511B
- Authority
- CN
- China
- Prior art keywords
- sample
- coordinates
- point
- central
- control point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 87
- 230000006870 function Effects 0.000 claims abstract description 54
- 230000015654 memory Effects 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 230000008447 perception Effects 0.000 abstract description 8
- 230000000694 effects Effects 0.000 abstract description 4
- 238000012360 testing method Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 22
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000005291 magnetic effect Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000010267 cellular communication Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000000446 fuel Substances 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000002485 combustion reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- SAZUGELZHZOXHB-UHFFFAOYSA-N acecarbromal Chemical compound CCC(Br)(CC)C(=O)NC(=O)NC(C)=O SAZUGELZHZOXHB-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 230000000979 retarding effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Processing (AREA)
Abstract
本公开涉及自动驾驶领域中的一种杆体检测方法、装置、车辆、存储介质及芯片,包括:获取待检测图像;将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果。这样,对于任意畸变量的杆体对象,均可以保留杆体的畸变信息,从而准确得出贴合实际杆体对象的检测结果,进而提高感知杆体位置的准确性,提升校验全图畸变矫正的效果。
Description
技术领域
本公开涉及自动驾驶技术领域,尤其涉及杆体检测方法、装置、车辆、存储介质及芯片。
背景技术
杆体检测算法是车辆自动驾驶在视觉感知辅助定位中的关键算法,用于对道路两侧的杆体对象(比如电线杆、路灯杆、广告牌杆等)定位,进而可以根据定位后的杆体对象辅助自驾车辆进行地图构建和车辆定位。通常道路两侧的杆体对象均垂直于地面的直线段,但由于车载摄像头成像会因视角较大产生畸变,导致杆体对象呈曲线段,并且越靠近图像边缘,畸变效应越明显,杆体弯曲越严重,导致无法准确地进行建图和定位。
相关场景中,通过定位杆体对象的两个端点位置,将两个端点用直线段连接,用该直线段表示杆体对象。然而,针对畸变较小的杆体对象效果较好,针对畸变较大的杆体对象,直线段无法准确贴合杆体对象,导致检测结果与实际杆体对象的位置存在偏差,丧失畸变信息。
发明内容
为克服相关技术中存在的问题,本公开提供一种杆体检测方法、装置、车辆、存储介质及芯片。
根据本公开实施例的第一方面,提供一种杆体检测方法,包括:
获取待检测图像;
将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;
根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果。
根据本公开实施例的第二方面,提供一种杆体检测装置,包括:
获取模块,被配置为获取待检测图像;
输入模块,被配置为将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;
执行模块,被配置为根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果。
根据本公开实施例的第三方面,提供一种车辆,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待检测图像;
将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;
根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现第一方面中任一项所述方法的步骤。
根据本公开实施例的第五方面,提供一种芯片,包括处理器和接口;所述处理器用于读取指令以执行第一方面中任一项所述的方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过获取待检测图像;将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果。这样,对于任意畸变量的杆体对象,均可以保留杆体的畸变信息,从而准确得出贴合实际杆体对象的检测结果,进而提高感知杆体位置的准确性,提升校验全图畸变矫正的效果,从而提升车辆自动驾驶中,视觉感知定位的能力。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种杆体检测方法的流程图。
图2是根据一示例性实施例示出的一种杆体检测模型训练方法的流程图。
图3是根据一示例性实施例示出的一种杆体检测装置的框图。
图4是根据一示例性实施例示出的一种应用杆体检测方法的装置的框图。
图5是一示例性实施例示出的一种车辆的功能框图示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
图1是根据一示例性实施例示出的一种杆体检测方法的流程图,如图1所示,该方法用于自动驾驶控制终端中,包括以下步骤。
在步骤S11中,获取待检测图像。
本公开实施例中,通过车载摄像头实时获取道路两侧的图像,并将获取的图像作为待检测图像。其中,该车载摄像头获取的图像存在图像畸变,并且与靠近摄像头成像边缘的对象,存在的畸变越大。
在步骤S12中,将待检测图像输入到杆体检测模型中,得到杆体检测模型输出的杆体控制点的坐标。
其中,杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的。
本公开实施例中,杆体检测模型首先预测出一个控制点,再根据该控制点的坐标以及坐标偏移计算出其他多个控制点的坐标,从而得到输出的多个杆体控制点的坐标。例如,先预测出中心控制点的坐标,再根据中心控制点的坐标和坐标偏移,计算出其他多个控制点的坐标,得到杆体控制点坐标的集合。
在本公开实施例中,杆体检测模型对输入的待检测图像进行图像特征提取,进而确定出任意杆体控制点,并根据该杆体控制点确定待检测图像中是否存在杆体对象。例如,确定该杆体控制点的置信度,若置信度高于预设的置信度阈值,则确定待检测图像中存在杆体对象,若置信度小于等于预设的置信度阈值,则确定待检测图像中不存在杆体对象。
示例地,杆体检测模型确定出杆体中心控制点,并确定该杆体中心控制点的置信度,若置信度高于预设的置信度阈值,则确定待检测图像中存在杆体对象,若置信度小于等于预设的置信度阈值,则确定待检测图像中不存在杆体对象。
其中,可以根据杆体控制点相对于杆体中心控制点的距离,设置不同的权重值,根据权重值和杆体中心控制点预设的置信度阈值,求乘积得到针对任意杆体控制点的置信度阈值。
进一步地,在确定待检测图像中存在杆体对象的情况下,根据该杆体控制点在热图上的坐标偏移计算出预测控制点的坐标,进而根据预测控制点的坐标计算出其他预测控制点的坐标。例如,根据杆体控制点的坐标在热图上的坐标偏移,确定预测中心控制点的坐标,进而根据相对于预测中心控制点的坐标偏移,计算出其他预测控制点的坐标,并将所有预测控制点的坐标作为杆体控制点的坐标。
在步骤S13中,根据杆体控制点的坐标以及预设的贝塞尔曲线公式,得到待检测图像的杆体检测结果。
本公开实施例中,基于预设的贝塞尔曲线公式,可以利用插值的方法,在相邻的杆体控制点之间线性插值出预测杆体坐标点,进而根据预测杆体坐标点确定贝塞尔曲线,得到待检测图像的杆体检测结果。
示例地,预设的贝塞尔曲线公式B(t)可以为:
其中,t为贝塞尔曲线上点的比例系数,n为贝塞尔曲线的曲线阶数,bi为第i个预测控制点的坐标。
可选地,在步骤S13中,所述根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果,包括:
根据所述杆体控制点的数量,确定所述预设的贝塞尔曲线公式的曲线阶数以及所述预设的贝塞尔曲线公式中的伯恩斯坦多项式,得到目标贝塞尔曲线公式;
示例地,将杆体控制点的数量作为预设的贝塞尔曲线公式的曲线阶数,进而可以确定出伯恩斯坦多项式中与曲线阶数相关式子。例如,若杆体控制点的数量为5,则贝塞尔曲线公式的曲线阶数,进而可以确定出目标贝塞尔曲线公式B(t)为:
将所述杆体控制点的坐标分别代入所述目标贝塞尔曲线公式中,并以相邻两个杆体控制点为目标构建控制点连线。
本公开实施例中,将所述杆体控制点的坐标分别代入目标贝塞尔曲线公式中,可以得到杆体控制点的位置。
在所述控制点连线上,通过逐渐增大所述目标贝塞尔曲线公式的比例系数,绘制出目标贝塞尔曲线。
将所述目标贝塞尔曲线作为所述待检测图像的杆体检测结果。
以杆体控制点的数量为5进行示例性说明,将相邻的杆体控制点连接,得到线段P0,1,线段P1,2,线段P2,3,线段P3,4,并在每一线段上,根据目标贝塞尔曲线公式的比例系数t的取值,确定线段上的绘制点,并将绘制点顺次进行连接,得到新的线段,根据比例系数的取值,在新的线段上确定新的绘制点,依次进行下去,直到绘制点的个数为1无法继续连线构成线段;重复执行增大比例系数的取值的步骤,并在每一次增大比例系数后,重复执行在每一线段上,根据目标贝塞尔曲线公式的比例系数t的取值,确定线段上的绘制点,到直到绘制点的个数为1无法继续连线构成线段的步骤,绘制出目标贝塞尔曲线。
在计算时长以及计算能力有限的情况下,可以按照预设比例系数取值,对比例系数进行赋值,得到贝塞尔曲线上部分点,并将得到的点顺次连接,从而得到用于表征杆体对象的中轴线的曲线;而在计算时长以及计算能力允许的情况下,通过使比例系数t从0变到1,得到贝塞尔曲线上所有的点,从而得到用于表征杆体对象的中轴线的曲线。
本公开实施例中,目标贝塞尔曲线可以准确地用于表示杆体对象的中轴线。进而在车辆自动驾驶过程中,可以根据该目标贝塞尔曲线进行车辆定位和行驶环境建模。
在上述实施例的基础上,图2是根据一示例性实施例示出的一种杆体检测模型训练方法的流程图,参阅图2所示,所述方法包括以下步骤。
在步骤S21中,获取针对样本图像中样本控制点进行坐标标注后的标注样本图像,其中,所述样本控制点是沿所述样本图像中样本杆体的中心轴线做轴线等分得到的。
本公开实施例中,可以通过自动标注或者人工标注的方式,对样本图像中样本控制点进行坐标标注。标注的方式可以为:首先选取样本杆体的轴心轴线的两个端点,按照预设杆体控制点的数量,在两个端点之间,沿中心轴线进行等分插值。例如,预设杆体控制点的数量为5,则在两个端点之间,沿中心轴线等分选取3个样本控制点,将样本杆件的轴心轴线等分为4段。
在步骤S22中,将所述标注样本图像输入至初始网络模型中,得到所述初始网络模型输出的所述样本杆体的预测控制点的坐标。
其中,初始网络模型包括骨干网络和头部网络。标注样本图像在进行灰度处理等预处理后,被传输到骨干网络,经过特征提取和特征融合后,传输给头部网络,头部网络预测出样本杆体的预测控制点的坐标。
在步骤S23中,根据所述样本控制点的坐标以及所述预测控制点的坐标,确定联合损失函数。
可选地,所述根据所述样本控制点的坐标以及所述预测控制点的坐标,确定联合损失函数,包括:
根据所述预测控制点的坐标确定预测中心控制点的坐标。
其中,预测中心控制点为整个样本杆件的预测控制点坐标处于中间位置的,例如,计算横坐标的平均值,以及纵坐标的平均值,得到参考中心控制点,将坐标距离参考中心控制点最近的预测控制点作为预测中心控制点,或者,将样本杆体上,将距离参考中心控制点最近的点作为预测中心控制点。
可选地,在所述预测控制点的数量为奇数的情况下,将坐标处于中间位置的预测控制点的坐标作为所述预测中心控制点的坐标。
以预测控制点的数量为5个为例进行说明,第三个预测控制点为坐标处于中间位置的预测控制点,因此,将第三个预测控制点的坐标作为预测中心控制点的坐标。
在所述预测控制点的数量为偶数的情况下,将坐标处于中间位置的两个预测控制点作为目标预测控制点,在所述初始样本图像中样本杆体上构建所述预测中心控制点,得到所述预测中心控制点的坐标,其中,所述预测中心控制点到两个所述目标预测控制点的距离相等。
以预测控制点的数量为4个为例进行说明,第二个预测控制点和第三个预测控制点为坐标处于中间位置的两个预测控制点,则在初始样本图像中样本杆体上,构建预测中心控制点,该预测中心控制点到第二个预测控制点的距离等于到第三个预测控制点的距离。并确定构建的预测中心控制点的坐标。
从所述样本控制点中,确定与所述预测中心控制点对应的样本中心控制点和样本非中心控制点。
同理,采用确定预测中心控制点的方式,从样本控制点中确定样本中心控制点,并将除样本中心控制点外的其他样本控制点作为样本非中心控制点。
确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失和中心点坐标偏移损失。
可选地,所述确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失,包括:
根据所述预测中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测中心控制点的坐标的置信度概率;
基于预设的聚焦损失公式,根据所述置信度概率,确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失。
其中,中心点置信度损失Lossscore可以为:
在其中一个实施方式中,α取值为0.25,γ取值为2。
可选地,所述确定所述预测中心控制点相对所述样本中心控制点的中心点坐标偏移损失,包括:
根据所述预测中心控制点的坐标以及所述样本中心控制点的坐标,计算所述预测中心控制点与所述样本中心控制点的欧式距离,得到所述预测中心控制点相对所述样本中心控制点的中心点坐标偏移损失。
根据所述预测控制点的坐标、所述样本非中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测控制点中除所述预测中心控制点外的其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失;
其中,中心点坐标偏移损失lossoffsetcenter可以表示为:
非中心点坐标偏移损失lossoffsetother可以表示为:
xi表示第i个样本非中心控制点的坐标在x方向上,相对样本中心控制点的偏移,yi表示第i个样本非中心控制点的坐标在y方向上,相对样本中心控制点的偏移。表示第i个预测控制点中除预测中心控制点外的其他预测控制点的坐标在x方向上,相对预测中心控制点的偏移,表示第i个预测控制点中除预测中心控制点外的其他预测控制点的坐标在y方向上,相对预测中心控制点的偏移。
根据所述中心点置信度损失、所述中心点坐标偏移损失以及所述非中心点坐标偏移损失,确定所述联合损失函数。
可选地,所述根据所述中心点置信度损失、所述中心点坐标偏移损失以及所述非中心点坐标偏移损失,确定所述联合损失函数,包括:
根据所述中心点置信度损失与所述中心点坐标偏移损失的量级关系,确定所述中心点坐标偏移损失的第一权重。
例如,在中心点置信度损失为小于1的正小数,而中心点坐标偏移损失为大于10的数时,中心点置信度损失与中心点坐标偏移损失不在同一数量级,可以通过第一权重将中心点坐标偏移损失的数量级进行转化,以使得中心点置信度损失与中心点坐标偏移损失在同一数量级上。
根据所述中心点置信度损失与所述非中心点坐标偏移损失的量级关系,确定所述非中心点坐标偏移损失的第二权重。
同理,在中心点置信度损失为小于1的正小数,而非中心点坐标偏移损失为大于1的数时,中心点置信度损失与非中心点坐标偏移损失不在同一数量级,可以通过第二权重将非中心点坐标偏移损失的数量级进行转化,以使得中心点置信度损失与非中心点坐标偏移损失在同一数量级上。
上述第一权重和第二权重用于分别将中心点坐标偏移损失的数量级转化至中心点置信度损失的数量级上和将非中心点坐标偏移损失的数量级转化至中心点置信度损失的数量级上。以保证计算得到的联合损失函数处于合理范围内。
根据所述中心点置信度损失、所述中心点坐标偏移损失、所述第一权重、所述第二权重以及所述非中心点坐标偏移损失,确定所述联合损失函数。
其中,联合损失函数的表达式可以为:
可选地,所述根据所述预测控制点的坐标、所述样本非中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测控制点中除所述预测中心控制点外的其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失,包括:
计算所述预测控制点中除所述预测中心控制点外的其他预测控制点的坐标相对所述预测中心控制点的坐标的预测中心点偏移坐标。
以预测控制点的数量为5为例进行说明,预测中心控制点为第三个预测控制点,则计算其他4个预测控制点相对第三个预测控制点的坐标的偏移坐标。即用其他4个预测控制点的坐标分别在x方向和y方向上,减去第三个预测控制点的坐标,得到对应的预测中心点偏移坐标。
确定所述样本非中心控制点中与各所述其他预测控制点对应的目标样本控制点。
计算所述目标样本控制点的坐标相对于所述样本中心控制点的坐标的标注中心点偏移坐标。
同理,用目标样本控制点的坐标分别在x方向和y方向上,减去样本中心控制点的坐标,得到对应的标注中心点偏移坐标。
计算各所述预测中心点偏移坐标与对应的所述标注中心点偏移坐标的欧氏距离,得到所述其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失。
本公开实施例中,通过上述公式L计算非中心点坐标偏移损失。
在步骤S24中,根据所述联合损失函数更新所述初始网络模型的损失函数,得到所述杆体检测模型。
通过联合损失函数对初始网络模型的损失函数进行更新,可以使得初始网络模型预测杆体对象的控制点的准确性更高,从而提高杆体检测的准确性。
基于相同的构思,本公开还提供一种杆体检测装置,用于执行上述方法实施例提供的杆体检测方法的部分或全部步骤,该装置300可以以软件、硬件或者两者相结合的方式实现杆体检测方法。图3是根据一示例性实施例示出的一种杆体检测装置的框图,参见图3所示,所述装置300包括:获取模块310、输入模块320和执行模块330。
其中,获取模块310被配置为获取待检测图像;
输入模块320被配置为将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;
执行模块330被配置为根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果。
可选地,所述输入模块320包括:
获取子模块,被配置为获取针对样本图像中样本控制点进行坐标标注后的标注样本图像,其中,所述样本控制点是沿所述样本图像中样本杆体的中心轴线做轴线等分得到的;
输入子模块,被配置为将所述标注样本图像输入至初始网络模型中,得到所述初始网络模型输出的所述样本杆体的预测控制点的坐标;
确定子模块,被配置为根据所述样本控制点的坐标以及所述预测控制点的坐标,确定联合损失函数;
更新子模块,被配置为根据所述联合损失函数更新所述初始网络模型的损失函数,得到所述杆体检测模型。
可选地,所述确定子模块,被配置为:
根据所述预测控制点的坐标确定预测中心控制点的坐标;
从所述样本控制点中,确定与所述预测中心控制点对应的样本中心控制点和样本非中心控制点;
确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失和中心点坐标偏移损失;
根据所述预测控制点的坐标、所述样本非中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测控制点中除所述预测中心控制点外的其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失;
根据所述中心点置信度损失、所述中心点坐标偏移损失以及所述非中心点坐标偏移损失,确定所述联合损失函数。
可选地,所述确定子模块,被配置为:
根据所述中心点置信度损失与所述中心点坐标偏移损失的量级关系,确定所述中心点坐标偏移损失的第一权重;
根据所述中心点置信度损失与所述非中心点坐标偏移损失的量级关系,确定所述非中心点坐标偏移损失的第二权重;
根据所述中心点置信度损失、所述中心点坐标偏移损失、所述第一权重、所述第二权重以及所述非中心点坐标偏移损失,确定所述联合损失函数。
可选地,所述确定子模块,被配置为:
根据所述预测中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测中心控制点的坐标的置信度概率;
基于预设的聚焦损失公式,根据所述置信度概率,确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失。
可选地,所述确定子模块,被配置为根据所述预测中心控制点的坐标以及所述样本中心控制点的坐标,计算所述预测中心控制点与所述样本中心控制点的欧式距离,得到所述预测中心控制点相对所述样本中心控制点的中心点坐标偏移损失。
可选地,所述确定子模块,被配置为:
计算所述预测控制点中除所述预测中心控制点外的其他预测控制点的坐标相对所述预测中心控制点的坐标的预测中心点偏移坐标;
确定所述样本非中心控制点中与各所述其他预测控制点对应的目标样本控制点;
计算所述目标样本控制点的坐标相对于所述样本中心控制点的坐标的标注中心点偏移坐标;
计算各所述预测中心点偏移坐标与对应的所述标注中心点偏移坐标的欧氏距离,得到所述其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失。
可选地,所述确定子模块,被配置为:
在所述预测控制点的数量为奇数的情况下,将坐标处于中间位置的预测控制点的坐标作为所述预测中心控制点的坐标;或者,
在所述预测控制点的数量为偶数的情况下,将坐标处于中间位置的两个预测控制点作为目标预测控制点,在所述初始样本图像中样本杆体上构建所述预测中心控制点,得到所述预测中心控制点的坐标,其中,所述预测中心控制点到两个所述目标预测控制点的距离相等。
可选地,执行模块,被配置为:
根据所述杆体控制点的数量,确定所述预设的贝塞尔曲线公式的曲线阶数以及所述预设的贝塞尔曲线公式中的伯恩斯坦多项式,得到目标贝塞尔曲线公式;
将所述杆体控制点的坐标分别代入所述目标贝塞尔曲线公式中,并以相邻两个杆体控制点为目标构建控制点连线;
在所述控制点连线上,通过逐渐增大所述目标贝塞尔曲线公式的比例系数,绘制出目标贝塞尔曲线;
将所述目标贝塞尔曲线作为所述待检测图像的杆体检测结果。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
此外值得说明的是,为描述的方便和简洁,说明书中所描述的实施例均属于优选实施例,其所涉及的部分并不一定是本发明所必须的,例如,输入模块320和执行模块330,在具体实施时可以是相互独立的装置也可以是同一个装置,本公开对此不作限定。
根据本公开实施例还提供一种车辆,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待检测图像;
将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;
根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果。
根据本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现前述中任一项所述方法的步骤。
根据本公开实施例还提供一种芯片,包括处理器和接口;所述处理器用于读取指令以执行前述中任一项所述的方法。
图4是根据一示例性实施例示出的一种应用杆体检测方法的装置400的框图。例如,装置400可以是车道偏移系统的控制器、自动驾驶系统的控制器、车辆防撞系统的控制器等。
参照图4,装置400可以包括以下一个或多个组件:处理组件402,第一存储器404,电力组件406,多媒体组件408,音频组件410,输入/输出接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个第一处理器420来执行指令,以完成上述杆体检测方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
第一存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。第一存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件406为装置400的各种组件提供电力。电力组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在第一存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
输入/输出接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到装置400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G或4G或5G,或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述杆体检测方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的第一存储器404,上述指令可由装置400的第一处理器420执行以完成上述杆体检测方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
上述装置除了可以是独立的电子设备外,也可是独立电子设备的一部分,例如在一种实施例中,该装置可以是集成电路(Integrated Circuit,IC)或芯片,其中该集成电路可以是一个IC,也可以是多个IC的集合;该芯片可以包括但不限于以下种类:GPU(GraphicsProcessing Unit,图形处理器)、CPU(Central Processing Unit,中央处理器)、FPGA(Field Programmable Gate Array,可编程逻辑阵列)、DSP(Digital Signal Processor,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、SOC(System on Chip,SoC,片上系统或系统级芯片)等。上述的集成电路或芯片中可以用于执行可执行指令(或代码),以实现上述的杆体检测方法。其中该可执行指令可以存储在该集成电路或芯片中,也可以从其他的装置或设备获取,例如该集成电路或芯片中包括处理器、存储器,以及用于与其他的装置通信的接口。该可执行指令可以存储于该存储器中,当该可执行指令被处理器执行时实现上述的杆体检测方法;或者,该集成电路或芯片可以通过该接口接收可执行指令并传输给该处理器执行,以实现上述的杆体检测方法。
参阅图5,图5是一示例性实施例示出的一种车辆500的功能框图示意图。车辆500可以被配置为完全或部分自动驾驶模式。例如,车辆500可以通过感知系统520获取其周围的环境信息,并基于对周边环境信息的分析得到自动驾驶策略以实现完全自动驾驶,或者将分析结果呈现给用户以实现部分自动驾驶。
车辆500可包括各种子系统,例如,信息娱乐系统510、感知系统520、决策控制系统530、驱动系统540以及计算平台550。可选的,车辆500可包括更多或更少的子系统,并且每个子系统都可包括多个部件。另外,车辆500的每个子系统和部件可以通过有线或者无线的方式实现互连。
在一些实施例中,信息娱乐系统510可以包括通信系统511,娱乐系统512以及导航系统513。
通信系统511可以包括无线通信系统,无线通信系统可以直接地或者经由通信网络来与一个或多个设备无线通信。例如,无线通信系统可使用3G蜂窝通信,例如CDMA、EVD0、GSM/GPRS,或者4G蜂窝通信,例如LTE。或者5G蜂窝通信。无线通信系统可利用WiFi与无线局域网(wireless local area network,WLAN)通信。在一些实施例中,无线通信系统可利用红外链路、蓝牙或ZigBee与设备直接通信。其他无线协议,例如各种车辆通信系统,例如,无线通信系统可包括一个或多个专用短程通信(dedicated short range communications,DSRC)设备,这些设备可包括车辆和/或路边台站之间的公共和/或私有数据通信。
娱乐系统512可以包括显示设备,麦克风和音响,用户可以基于娱乐系统在车内收听广播,播放音乐;或者将手机和车辆联通,在显示设备上实现手机的投屏,显示设备可以为触控式,用户可以通过触摸屏幕进行操作。
在一些情况下,可以通过麦克风获取用户的语音信号,并依据对用户的语音信号的分析实现用户对车辆500的某些控制,例如调节车内温度等。在另一些情况下,可以通过音响向用户播放音乐。
导航系统513可以包括由地图供应商所提供的地图服务,从而为车辆500提供行驶路线的导航,导航系统513可以和车辆的全球定位系统521、惯性测量单元522配合使用。地图供应商所提供的地图服务可以为二维地图,也可以是高精地图。
感知系统520可包括感测关于车辆500周边的环境的信息的若干种传感器。例如,感知系统520可包括全球定位系统521(全球定位系统可以是GPS系统,也可以是北斗系统或者其他定位系统)、惯性测量单元(inertial measurement unit,IMU)522、激光雷达523、毫米波雷达524、超声雷达525以及摄像装置526。感知系统520还可包括被监视车辆500的内部系统的传感器(例如,车内空气质量监测器、燃油量表、机油温度表等)。来自这些传感器中的一个或多个的传感器数据可用于检测对象及其相应特性(位置、形状、方向、速度等)。这种检测和识别是车辆500的安全操作的关键功能。
全球定位系统521用于估计车辆500的地理位置。
惯性测量单元522用于基于惯性加速度来感测车辆500的位姿变化。在一些实施例中,惯性测量单元522可以是加速度计和陀螺仪的组合。
激光雷达523利用激光来感测车辆500所位于的环境中的物体。在一些实施例中,激光雷达523可包括一个或多个激光源、激光扫描器以及一个或多个检测器,以及其他系统组件。
毫米波雷达524利用无线电信号来感测车辆500的周边环境内的物体。在一些实施例中,除了感测物体以外,毫米波雷达524还可用于感测物体的速度和/或前进方向。
超声雷达525可以利用超声波信号来感测车辆500周围的物体。
摄像装置526用于捕捉车辆500的周边环境的图像信息。摄像装置526可以包括单目相机、双目相机、结构光相机以及全景相机等,摄像装置526获取的图像信息可以包括静态图像,也可以包括视频流信息。
决策控制系统530包括基于感知系统520所获取的信息进行分析决策的计算系统531,决策控制系统530还包括对车辆500的动力系统进行控制的整车控制器532,以及用于控制车辆500的转向系统533、油门534和制动系统535。
计算系统531可以操作来处理和分析由感知系统520所获取的各种信息以便识别车辆500周边环境中的目标、物体和/或特征。目标可以包括行人或者动物,物体和/或特征可包括交通信号、道路边界和障碍物。计算系统531可使用物体识别算法、运动中恢复结构(Structure from Motion,SFM)算法、视频跟踪等技术。在一些实施例中,计算系统531可以用于为环境绘制地图、跟踪物体、估计物体的速度等等。计算系统531可以将所获取的各种信息进行分析并得出对车辆的控制策略。
整车控制器532可以用于对车辆的动力电池和引擎541进行协调控制,以提升车辆500的动力性能。
转向系统533可操作来调整车辆500的前进方向。例如在一个实施例中可以为方向盘系统。
油门534用于控制引擎541的操作速度并进而控制车辆500的速度。
制动系统535用于控制车辆500减速。制动系统535可使用摩擦力来减慢车轮544。在一些实施例中,制动系统535可将车轮544的动能转换为电流。制动系统535也可采取其他形式来减慢车轮544转速从而控制车辆500的速度。
驱动系统540可包括为车辆500提供动力运动的组件。在一个实施例中,驱动系统540可包括引擎541、能量源542、传动系统543和车轮544。引擎541可以是内燃机、电动机、空气压缩引擎或其他类型的引擎组合,例如汽油发动机和电动机组成的混动引擎,内燃引擎和空气压缩引擎组成的混动引擎。引擎541将能量源542转换成机械能量。
能量源542的示例包括汽油、柴油、其他基于石油的燃料、丙烷、其他基于压缩气体的燃料、乙醇、太阳能电池板、电池和其他电力来源。能量源542也可以为车辆500的其他系统提供能量。
传动系统543可以将来自引擎541的机械动力传送到车轮544。传动系统543可包括变速箱、差速器和驱动轴。在一个实施例中,传动系统543还可以包括其他器件,比如离合器。其中,驱动轴可包括可耦合到一个或多个车轮544的一个或多个轴。
车辆500的部分或所有功能受计算平台550控制。计算平台550可包括至少一个第二处理器551,第二处理器551可以执行存储在例如第二存储器552这样的非暂态计算机可读介质中的指令553。在一些实施例中,计算平台550还可以是采用分布式方式控制车辆500的个体组件或子系统的多个计算设备。
第二处理器551可以是任何常规的处理器,诸如商业可获得的CPU。可替换地,第二处理器551还可以包括诸如图像处理器(Graphic Process Unit,GPU),现场可编程门阵列(Field Programmable Gate Array,FPGA)、片上系统(System on Chip,SOC)、专用集成芯片(Application Specific Integrated Circuit,ASIC)或它们的组合。尽管图5功能性地图示了处理器、存储器、和在相同块中的计算机的其它元件,但是本领域的普通技术人员应该理解该处理器、计算机、或存储器实际上可以包括可以或者可以不存储在相同的物理外壳内的多个处理器、计算机、或存储器。例如,存储器可以是硬盘驱动器或位于不同于计算机的外壳内的其它存储介质。因此,对处理器或计算机的引用将被理解为包括对可以或者可以不并行操作的处理器或计算机或存储器的集合的引用。不同于使用单一的处理器来执行此处所描述的步骤,诸如转向组件和减速组件的一些组件每个都可以具有其自己的处理器,处理器只执行与特定于组件的功能相关的计算。
在本公开实施方式中,第二处理器551可以执行上述的杆体检测方法。
在此处所描述的各个方面中,第二处理器551可以位于远离该车辆并且与该车辆进行无线通信。在其它方面中,此处所描述的过程中的一些在布置于车辆内的处理器上执行而其它则由远程处理器执行,包括采取执行单一操纵的必要步骤。
在一些实施例中,第二存储器552可包含指令553(例如,程序逻辑),指令553可被第二处理器551执行来执行车辆500的各种功能。第二存储器552也可包含额外的指令,包括向信息娱乐系统510、感知系统520、决策控制系统530、驱动系统540中的一个或多个发送数据、从其接收数据、与其交互和/或对其进行控制的指令。
除了指令553以外,第二存储器552还可存储数据,例如道路地图、路线信息,车辆的位置、方向、速度以及其它这样的车辆数据,以及其他信息。这种信息可在车辆500在自主、半自主和/或手动模式中操作期间被车辆500和计算平台550使用。
计算平台550可基于从各种子系统(例如,驱动系统540、感知系统520和决策控制系统530)接收的输入来控制车辆500的功能。例如,计算平台550可利用来自决策控制系统530的输入以便控制转向系统533来避免由感知系统520检测到的障碍物。在一些实施例中,计算平台550可操作来对车辆500及其子系统的许多方面提供控制。
可选地,上述这些组件中的一个或多个可与车辆500分开安装或关联。例如,第二存储器552可以部分或完全地与车辆500分开存在。上述组件可以按有线和/或无线方式来通信地耦合在一起。
可选地,上述组件只是一个示例,实际应用中,上述各个模块中的组件有可能根据实际需要增添或者删除,图5不应理解为对本公开实施例的限制。
在道路行进的自动驾驶汽车,如上面的车辆500,可以识别其周围环境内的物体以确定对当前速度的调整。物体可以是其它车辆、交通控制设备、或者其它类型的物体。在一些示例中,可以独立地考虑每个识别的物体,并且基于物体的各自的特性,诸如它的当前速度、加速度、与车辆的间距等,可以用来确定自动驾驶汽车所要调整的速度。
可选地,车辆500或者与车辆500相关联的感知和计算设备(例如计算系统531、计算平台550)可以基于所识别的物体的特性和周围环境的状态(例如,交通、雨、道路上的冰、等等)来预测识别的物体的行为。可选地,每一个所识别的物体都依赖于彼此的行为,因此还可以将所识别的所有物体全部一起考虑来预测单个识别的物体的行为。车辆500能够基于预测的识别的物体的行为来调整它的速度。换句话说,自动驾驶汽车能够基于所预测的物体的行为来确定车辆将需要调整到(例如,加速、减速、或者停止)何种稳定状态。在这个过程中,也可以考虑其它因素来确定车辆500的速度,诸如,车辆500在行驶的道路中的横向位置、道路的曲率、静态和动态物体的接近度等等。
除了提供调整自动驾驶汽车的速度的指令之外,计算设备还可以提供修改车辆500的转向角的指令,以使得自动驾驶汽车遵循给定的轨迹和/或维持与自动驾驶汽车附近的物体(例如,道路上的相邻车道中的车辆)的安全横向和纵向距离。
上述车辆500可以为各种类型的行驶工具,例如,轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、娱乐车、火车等等,本公开实施例不做特别的限定。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的杆体检测方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (11)
1.一种杆体检测方法,其特征在于,包括:
获取待检测图像;
将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;
根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果;
其中,所述杆体检测模型是通过如下方式训练得到的:
获取针对样本图像中样本控制点进行坐标标注后的标注样本图像,其中,所述样本控制点是沿所述样本图像中样本杆体的中心轴线做轴线等分得到的;
将所述标注样本图像输入至初始网络模型中,得到所述初始网络模型输出的所述样本杆体的预测控制点的坐标;
根据所述预测控制点的坐标确定预测中心控制点的坐标,所述预测中心控制点为整个样本杆件中坐标处于中间位置的控制点;
从所述样本控制点中,确定与所述预测中心控制点对应的样本中心控制点和样本非中心控制点;
确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失和中心点坐标偏移损失;
根据所述预测控制点的坐标、所述样本非中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测控制点中除所述预测中心控制点外的其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失;
根据所述中心点置信度损失、所述中心点坐标偏移损失以及所述非中心点坐标偏移损失,确定所述联合损失函数;
根据所述联合损失函数更新所述初始网络模型的损失函数,得到所述杆体检测模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述中心点置信度损失、所述中心点坐标偏移损失以及所述非中心点坐标偏移损失,确定所述联合损失函数,包括:
根据所述中心点置信度损失与所述中心点坐标偏移损失的量级关系,确定所述中心点坐标偏移损失的第一权重;
根据所述中心点置信度损失与所述非中心点坐标偏移损失的量级关系,确定所述非中心点坐标偏移损失的第二权重;
根据所述中心点置信度损失、所述中心点坐标偏移损失、所述第一权重、所述第二权重以及所述非中心点坐标偏移损失,确定所述联合损失函数。
3.根据权利要求1所述的方法,其特征在于,所述确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失,包括:
根据所述预测中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测中心控制点的坐标的置信度概率;
基于预设的聚焦损失公式,根据所述置信度概率,确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失。
4.根据权利要求1所述的方法,其特征在于,所述确定所述预测中心控制点相对所述样本中心控制点的中心点坐标偏移损失,包括:
根据所述预测中心控制点的坐标以及所述样本中心控制点的坐标,计算所述预测中心控制点与所述样本中心控制点的欧式距离,得到所述预测中心控制点相对所述样本中心控制点的中心点坐标偏移损失。
5.根据权利要求1所述的方法,其特征在于,所述根据所述预测控制点的坐标、所述样本非中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测控制点中除所述预测中心控制点外的其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失,包括:
计算所述预测控制点中除所述预测中心控制点外的其他预测控制点的坐标相对所述预测中心控制点的坐标的预测中心点偏移坐标;
确定所述样本非中心控制点中与各所述其他预测控制点对应的目标样本控制点;
计算所述目标样本控制点的坐标相对于所述样本中心控制点的坐标的标注中心点偏移坐标;
计算各所述预测中心点偏移坐标与对应的所述标注中心点偏移坐标的欧氏距离,得到所述其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失。
6.根据权利要求1所述的方法,其特征在于,所述根据所述预测控制点的坐标确定预测中心控制点的坐标,包括:
在所述预测控制点的数量为奇数的情况下,将坐标处于中间位置的预测控制点的坐标作为所述预测中心控制点的坐标;或者,
在所述预测控制点的数量为偶数的情况下,将坐标处于中间位置的两个预测控制点作为目标预测控制点,在初始样本图像中样本杆体上构建所述预测中心控制点,得到所述预测中心控制点的坐标,其中,所述预测中心控制点到两个所述目标预测控制点的距离相等。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果,包括:
根据所述杆体控制点的数量,确定所述预设的贝塞尔曲线公式的曲线阶数以及所述预设的贝塞尔曲线公式中的伯恩斯坦多项式,得到目标贝塞尔曲线公式;
将所述杆体控制点的坐标分别代入所述目标贝塞尔曲线公式中,并以相邻两个杆体控制点为目标构建控制点连线;
在所述控制点连线上,通过逐渐增大所述目标贝塞尔曲线公式的比例系数,绘制出目标贝塞尔曲线;
将所述目标贝塞尔曲线作为所述待检测图像的杆体检测结果。
8.一种杆体检测装置,其特征在于,包括:
获取模块,被配置为获取待检测图像;
输入模块,被配置为将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;
执行模块,被配置为根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果;
其中,所述杆体检测模型是通过如下方式训练得到的:
获取针对样本图像中样本控制点进行坐标标注后的标注样本图像,其中,所述样本控制点是沿所述样本图像中样本杆体的中心轴线做轴线等分得到的;
将所述标注样本图像输入至初始网络模型中,得到所述初始网络模型输出的所述样本杆体的预测控制点的坐标;
根据所述预测控制点的坐标确定预测中心控制点的坐标,所述预测中心控制点为整个样本杆件中坐标处于中间位置的控制点;
从所述样本控制点中,确定与所述预测中心控制点对应的样本中心控制点和样本非中心控制点;
确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失和中心点坐标偏移损失;
根据所述预测控制点的坐标、所述样本非中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测控制点中除所述预测中心控制点外的其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失;
根据所述中心点置信度损失、所述中心点坐标偏移损失以及所述非中心点坐标偏移损失,确定所述联合损失函数;
根据所述联合损失函数更新所述初始网络模型的损失函数,得到所述杆体检测模型。
9.一种车辆,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待检测图像;
将所述待检测图像输入到杆体检测模型中,得到所述杆体检测模型输出的杆体控制点的坐标,其中,所述杆体检测模型是通过标注样本图像中样本控制点的坐标和预测控制点的坐标确定的联合损失函数更新初始网络模型的损失函数后得到的;
根据所述杆体控制点的坐标以及预设的贝塞尔曲线公式,得到所述待检测图像的杆体检测结果;
其中,所述杆体检测模型是通过如下方式训练得到的:
获取针对样本图像中样本控制点进行坐标标注后的标注样本图像,其中,所述样本控制点是沿所述样本图像中样本杆体的中心轴线做轴线等分得到的;
将所述标注样本图像输入至初始网络模型中,得到所述初始网络模型输出的所述样本杆体的预测控制点的坐标;
根据所述预测控制点的坐标确定预测中心控制点的坐标,所述预测中心控制点为整个样本杆件中坐标处于中间位置的控制点;
从所述样本控制点中,确定与所述预测中心控制点对应的样本中心控制点和样本非中心控制点;
确定所述预测中心控制点相对所述样本中心控制点的中心点置信度损失和中心点坐标偏移损失;
根据所述预测控制点的坐标、所述样本非中心控制点的坐标以及所述样本中心控制点的坐标,确定所述预测控制点中除所述预测中心控制点外的其他预测控制点相对所述预测中心控制点的非中心点坐标偏移损失;
根据所述中心点置信度损失、所述中心点坐标偏移损失以及所述非中心点坐标偏移损失,确定所述联合损失函数;
根据所述联合损失函数更新所述初始网络模型的损失函数,得到所述杆体检测模型。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
11.一种芯片,其特征在于,包括处理器和接口;所述处理器用于读取指令以执行权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210702950.3A CN114821511B (zh) | 2022-06-21 | 2022-06-21 | 杆体检测方法、装置、车辆、存储介质及芯片 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210702950.3A CN114821511B (zh) | 2022-06-21 | 2022-06-21 | 杆体检测方法、装置、车辆、存储介质及芯片 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114821511A CN114821511A (zh) | 2022-07-29 |
CN114821511B true CN114821511B (zh) | 2022-09-23 |
Family
ID=82521139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210702950.3A Active CN114821511B (zh) | 2022-06-21 | 2022-06-21 | 杆体检测方法、装置、车辆、存储介质及芯片 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114821511B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102998684A (zh) * | 2012-11-21 | 2013-03-27 | 厦门雅迅网络股份有限公司 | 一种基于贝塞尔曲线的终端定位轨迹拟合方法 |
CN112488128A (zh) * | 2020-12-10 | 2021-03-12 | 武汉大学 | 一种基于贝塞尔曲线的任意畸变图像线段检测方法 |
CN112818873A (zh) * | 2021-02-04 | 2021-05-18 | 苏州魔视智能科技有限公司 | 车道线检测方法、系统及电子设备 |
WO2021197341A1 (zh) * | 2020-04-03 | 2021-10-07 | 速度时空信息科技股份有限公司 | 一种基于单目影像的道路标志标线的更新方法 |
-
2022
- 2022-06-21 CN CN202210702950.3A patent/CN114821511B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102998684A (zh) * | 2012-11-21 | 2013-03-27 | 厦门雅迅网络股份有限公司 | 一种基于贝塞尔曲线的终端定位轨迹拟合方法 |
WO2021197341A1 (zh) * | 2020-04-03 | 2021-10-07 | 速度时空信息科技股份有限公司 | 一种基于单目影像的道路标志标线的更新方法 |
CN112488128A (zh) * | 2020-12-10 | 2021-03-12 | 武汉大学 | 一种基于贝塞尔曲线的任意畸变图像线段检测方法 |
CN112818873A (zh) * | 2021-02-04 | 2021-05-18 | 苏州魔视智能科技有限公司 | 车道线检测方法、系统及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114821511A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114882464B (zh) | 多任务模型训练方法、多任务处理方法、装置及车辆 | |
US20240017719A1 (en) | Mapping method and apparatus, vehicle, readable storage medium, and chip | |
CN114935334B (zh) | 车道拓扑关系的构建方法、装置、车辆、介质及芯片 | |
CN114537450A (zh) | 车辆控制方法、装置、介质、芯片、电子设备及车辆 | |
CN115164910B (zh) | 行驶路径生成方法、装置、车辆、存储介质及芯片 | |
CN114771539B (zh) | 车辆变道决策方法、装置、存储介质及车辆 | |
CN115170630B (zh) | 地图生成方法、装置、电子设备、车辆和存储介质 | |
CN114842455B (zh) | 障碍物检测方法、装置、设备、介质、芯片及车辆 | |
CN115407344B (zh) | 栅格地图创建方法、装置、车辆及可读存储介质 | |
CN115223122A (zh) | 物体的三维信息确定方法、装置、车辆与存储介质 | |
CN114821511B (zh) | 杆体检测方法、装置、车辆、存储介质及芯片 | |
CN114973178A (zh) | 模型训练方法、物体识别方法、装置、车辆及存储介质 | |
CN114987549A (zh) | 车辆控制方法、装置、存储介质及车辆 | |
CN114880408A (zh) | 场景构建方法、装置、介质以及芯片 | |
CN114862931A (zh) | 深度距离确定方法、装置、车辆、存储介质与芯片 | |
CN115205848A (zh) | 目标检测方法、装置、车辆、存储介质及芯片 | |
CN115535004B (zh) | 距离生成方法、装置、存储介质及车辆 | |
CN114789723B (zh) | 车辆行驶控制方法、装置、车辆、存储介质及芯片 | |
CN114842454B (zh) | 障碍物检测方法、装置、设备、存储介质、芯片及车辆 | |
CN114822216B (zh) | 生成车位地图的方法、装置、车辆、存储介质及芯片 | |
CN115221260B (zh) | 数据处理方法、装置、车辆及存储介质 | |
CN115115822B (zh) | 车端图像处理方法、装置、车辆、存储介质及芯片 | |
CN115082886B (zh) | 目标检测的方法、装置、存储介质、芯片及车辆 | |
CN114771514B (zh) | 车辆行驶控制方法、装置、设备、介质、芯片及车辆 | |
CN114954528A (zh) | 车辆控制方法、装置、车辆、存储介质及芯片 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |