CN112132013B - 一种车辆关键点检测方法 - Google Patents

一种车辆关键点检测方法 Download PDF

Info

Publication number
CN112132013B
CN112132013B CN202011002420.5A CN202011002420A CN112132013B CN 112132013 B CN112132013 B CN 112132013B CN 202011002420 A CN202011002420 A CN 202011002420A CN 112132013 B CN112132013 B CN 112132013B
Authority
CN
China
Prior art keywords
key point
point detection
vehicle
key
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011002420.5A
Other languages
English (en)
Other versions
CN112132013A (zh
Inventor
王子磊
杨丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202011002420.5A priority Critical patent/CN112132013B/zh
Publication of CN112132013A publication Critical patent/CN112132013A/zh
Application granted granted Critical
Publication of CN112132013B publication Critical patent/CN112132013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/584Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种车辆关键点检测方法及系统,所述方法包括图像预处理、车辆关键点标记、车辆关键点检测网络构建、车辆关键点检测网络训练与使用,本发明将车辆的关键点分为简单关键点和困难关键点,先检测简单关键点,后检测困难关键点。为了更加精准定位车辆的困难关键点,充分地利用浅层特征与深层特征的信息,本发明采用自下而上的方式进行特征融合。最后,为了对定位偏差较大的关键点进行校正,使关键点的检测效果更加精准,本发明还增加了关键点偏移预测分支来预测关键点到车辆中心点的偏移。

Description

一种车辆关键点检测方法
技术领域
本发明涉及计算机视觉和智能交通技术领域,特别涉及一种车辆关键点检测方法。
背景技术
随着深度学习的快速发展,智能交通体系也得到了快速的发展,而车辆关键点检测技术在智能交通体系中发挥着基础而重要的作用。如车辆3D shape估计需要先准确检测出车辆的2D关键点再进行shape估计。车辆重识别可以根据车辆关键点对每辆车赋予一个ID。车辆方向识别根据车辆关键点的相对位置判断车辆的行驶方向。目前主流的目标检测也利用到了车辆关键点检测技术,不同于以往的直接检测,它们利用检测出的关键点来构成目标的矩形框,跟传统检测方法相比能能够达到更好的检测效果。
车辆关键点检测的主要任务是给定一个车辆实例图片,定位出预先定义的关键点在图片中的位置。当前的车辆关键点检测方法主要是利用人体姿态估计的方法直接检测,但是车辆关键点跟人体关键点存在一定的差距,人体关键点充满灵活性,车辆关键点相比人体关键点更加固定。此外,车辆关键点比人体关键点的遮挡情况更加严重,主要原因有:1)摄像机只能照到物体的一边(左边或右边,前面或后面),导致无论是什么姿态的车辆都会有自身遮挡,正常姿态的一辆车中大约有一半的关键点是处于不可见的状态,这相对于人体关键点遮挡来说是很严重的遮挡问题。2)一幅图片中可能包含多辆车,他们彼此相互遮挡,这是一种更复杂的遮挡情况,跟人体姿态估计中遮挡问题类似。3)数据集中包含大量车辆的一部分车身处于画面外,也给车辆关键点检测带来了难度。除了上述遮挡问题外,车辆关键点检测还面临着光照、复杂背景等问题,使得车辆关键点检测技术成为计算机视觉领域一个值得挑战的任务,因此需要设计一个专门用来检测车辆关键点的方法。
现有的技术只有人体姿态估计方法,如MaskRCNN(文献《Mask R-CNN for ObjectDetection and Segmentation》提出先检测物体的矩形框,再用矩形框提取特征上对应位置上的特征来检测关键点。尽管已经取得了很大的进步,但是仍然存在很多具有挑战性的情况,如关键点被遮挡,关键点不可见以及背景拥挤,无法很好地定位。本发明融合了更丰富的上下文信息,对于推断关键点的位置发挥了重要的作用,并且针对检测难度特别大的关键点,本发明使用关键点偏移来约束关键点的预测。
MSPN(文献《Rethinkingon Multi-Stage Networks for HumanPoseEstimation》)提出一个多级网络,将前阶段的信息传播到后阶段与后阶段特征进行融合。本发明提出的方法不用级联多个模块就能准确高效的定位关键点。
还有方法比如文献《Does Learning Specific Features for Related PartsHelp Human Pose Estimation?》提出将关键点分组,先共享参数,再分别预测每组的关键点,网络分别预测每组关键点消除了关键点之间的消极影响,但是同时关键点之间的积极影响也削弱了,对于关键点的定位其他关键点的信息是非常重要的,本发明虽然将关键点进行分组,但是每组之间并不是完全独立的,比如困难关键点是在简单关键点检测的基础上检测的,且困难关键点并不是简单关键点以外的关键点,它包括全部关键点中的检测困难的关键点。
在人工预先定义关键点方面,像车辆重识别等任务只需检测出车辆的可见关键点,对于车辆的结构信息不能很好的表征,本发明考虑到车辆是一个刚体,具有很强的结构性,并且为了给后续3D shape估计等任务提供足够信息,定义车辆的关键点为12个,包括前后四个车轮的中心点、前后四个车灯的中心点和车顶四个角点。本方法考虑到由于遮挡等问题,每个关键点的检测难度不一样,将车辆关键点分为两类,一类是简单关键点,另一类是困难关键点。本方法遵循由易到难的准则,先检测简单关键点,再检测困难关键点,并且在困难关键点检测阶段添加特征融合模块和辅助任务,对于车辆关键点的检测特别是困难关键点的检测具有很好的效果,同时最小化其运营成本。
总之,目前现有背景技术的技术不足总结为以下几点:现有技术一般是同时检测所有的车辆关键点,没有考虑到不同关键点差异,并且现有技术一般是级联多个类似encoder-decoder的结构,网络规模较大,检测速度会因此降低;现有技术的特征融合一般是同一阶段的特征自上而下融合或不同阶段同一level特征融合,而没有考虑到浅层特征对定位的作用;现有技术没有针对检测误差特别大的困难关键点做更多的处理,使遮挡或不可见的关键点检测效果还不是很理想。
发明内容
本发明所解决的技术问题:为了解决现有车辆关键点检测技术的实时性受限、精度有待提高、鲁棒性不好等问题,本发明公开了一种车辆关键点检测方法。首先,本发明将车辆的关键点分为简单关键点和困难关键点,先检测简单关键点,后检测困难关键点;其次,为了更加精准定位车辆的困难关键点,充分地利用浅层特征的空间信息和深层特征的语义信息,本发明采用自下而上的特征融合方式融合浅层特征。最后,为了对定位偏差较大的关键点进行校正,使关键点的检测效果更加精准,本发明在网络上增加了一个偏移预测分支来预测关键点到车辆中心点的偏移。
本发明所采用的技术方案:
本发明提供了一种车辆关键点检测方法,包括以下步骤:
步骤1)图像预处理,获取车辆实例图像,并对所述实例图像进行预处理,每张所述实例图像包含单个车辆;
步骤2)车辆关键点标记,对已预处理的实例图像标记车辆N个关键点,得到实例图像对应的关键点标记信息,所述关键点标记信息包括关键点标签与关键点位置,所述关键点标签包括可见与不可见,定义简单关键点与困难关键点,所述简单关键点为可见的若干关键点,所述困难关键点为根据基于预测误差的设定条件所筛选的若干关键点;
步骤3)车辆关键点检测网络构建,所述关键点检测网络包括特征提取模块、简单关键点检测模块和困难关键点模块,其中所述特征提取模块用于提取不同分辨率的K个特征图,所述简单关键点检测模块用于预测简单关键点位置,所述困难关键点检测模块用于对K个特征图进行特征融合并预测关键点位置与关键点到车辆中心的偏移量,所述困难关键点检测模块包括特征融合子模块、关键点检测分支与关键点偏移预测分支;
步骤4)车辆关键点检测网络训练,定义所述关键点检测网络的损失函数,使用已预处理的实例图像与对应的关键点标记信息对所述关键点检测网络的参数进行训练,得到已训练的车辆关键点检测网络;
步骤5)车辆关键点检测网络使用,对待检测图像进行预处理,并输入已训练的车辆关键点检测网络进行检测,最后输出待检测图像的关键点检测结果,所述关键点检测结果包括所述检测网络中所述困难关键点检测模块所预测的关键点位置与关键点到车辆中心的偏移量。
进一步地,所述步骤2)中,所述关键点分为3组,分别为4个车轮关键点、4个车灯关键点与4个车顶关键点,所述困难关键点为选择每组关键点中预测误差最大的2个关键点所组成的6个关键点。
进一步地,所述步骤3)中,所述特征提取模块的结构包括1个ResNet与K个1×1卷积层,ResNet接收预处理后的实例图像,提取不同分辨率的K个特征图,对每个特征图使用1个1×1卷积层进行卷积操作使K个特征图的通道数相同,并发送至所述简单关键点检测模块。
进一步地,所述步骤3)中,所述简单关键点检测模块的结构包括K个1×1卷积层与K个输出层,所述简单关键点检测模块接收K个特征图并发送至所述困难检测点模块中的特征融合子模块,同时对每个特征图使用1个1×1卷积层进行卷积操作生成对应的热图,并发送至对应的输出层输出,进而得到K个热图,所述热图的通道数等于关键点数N且每个通道代表对应的关键点的预测概率分布。
进一步地,所述步骤3)中,所述困难关键点检测模块中,所述特征融合子模块接收K个特征图进行特征融合得到融合特征图,并将融合特征图分别发送至关键点检测分支与关键点偏移预测分支,所述关键点检测分支与所述关键点偏移预测分支并行,所述关键点检测分支预测关键点位置并输出,所述关键点偏移预测分支预测关键点到车辆中心的偏移量并输出。
所述特征融合子模块的结构包括K个采样层、一个由浅层特征图到深层特征图的信息传播路径与一个concat层,所述特征融合子模块接收所述简单关键点检测模块所发送的K个特征图后,首先通过K个采样层进行上采样操作将K个特征图处理为相同的分辨率,然后通过所述信息传播路径生成生成K个对应的中间融合特征图,然后通过concat层对K个中间融合特征图进行concat操作生成1个融合特征图,并通过一个bottleneck模块将通道数减小为K分之一,最后分别发送至所述关键点预测分支与关键点偏移预测分支。
进一步地,所述步骤3)中,所述关键点检测分支的结构包括2个3×3卷积层和一个输出层,第1个3×3卷积层对所接收的特征图进行卷积操作分辨率和通道数保持不变,第2个3×3卷积对第1个3×3卷积层的结果进行卷积操作生成对应的热图,所述热图的通道数等于关键点数N且每个通道代表对应的关键点的预测概率分布。
进一步地,所述步骤3)中,所述关键点偏移预测分支的结构2个3×3卷积层和一个输出层,第1个3×3卷积层对所接收的特征图进行卷积操作分辨率和通道数保持不变,第2个3×3卷积对第1个3×3卷积层的结果进行卷积操作生成对应的预测结果,所述预测结果包括对应的关键点到车辆中的x偏移量与y偏移量。
进一步地,所述步骤3)中,所述由浅层特征图到深层特征图的信息传播路径为依次将K个特征图中的浅层特征图与相邻的深层特征图进行concat操作后生成1个中间融合特征图,连接一个1×1卷积层进行卷积操作使中间融合特征图的通道数减半,然后将所述中间融合特征图与下一个深层特征图进行concat操作并进行卷积操作再生成1个中间融合特征图,迭代进行直到最后K个特征图融合完成生成K个对应的中间融合特征图发送并至concat层。
进一步地,所述步骤4)中,所述关键点检测网络的损失函数
loss=loss1+loss2+loss3,
其中,loss1为表示所述简单关键点检测模块针对简单关键点位置所预测生成的热图与真实关键点标签的高斯热图之间误差的L2损失函数,loss2为表示所述困难关键点检测模块针对困难关键点位置所预测生成的热图与真实关键点标签的高斯热图之间误差的L2损失函数,loss3为表示所述困难关键点检测模块针对困难关键点偏移的预测结果与真实关键点偏移之间误差的smooth L1损失函数。
另外,本发明还对应提供了一种车辆关键点检测系统,所述系统包括图像预处理模块、关键点检测模块与结果输出模块;所述图像预处理模块,用于输入和预处理包含单个车辆的待检测图像并进行预处理,得到已预处理的图像,并发送至所述车辆关键点检测模块;所述车辆关键点检测模块用于检测图像上的关键点,并将关键点检测结果发送至结果输出模块,所述车辆关键点检测模块包括已训练的车辆关键点检测网络,所述关键点检测网络包括特征提取模块、简单关键点检测模块和困难关键点模块,其中所述特征提取模块用于提取不同分辨率的K个特征图,所述简单关键点检测模块用于预测简单关键点位置,所述困难关键点检测模块用于对K个特征图进行特征融合并预测关键点位置与关键点到车辆中心的偏移量,所述困难关键点检测模块包括特征融合子模块、关键点检测分支与关键点偏移预测分支;所述结果输出模块,用于输出呈现关键点检测结果,所述关键点检测结果为图像中所预测的关键点位置与关键点到车辆中心的偏移量。
本发明相较于现有技术所具备的技术优点:
本发明针对车辆遮挡情况严重、场景复杂等问题公开了一种专门用于车辆关键点检测的方法,相较于现有技术的缺点不足而言具有以下多个技术优点:
(1)本发明将车辆关键点分为简单关键点和困难关键点,网络级联了两级检测模块,即简单关键点检测模块和困难关键点检测模块,网络结构简单,网络的检测速度也是可观的,因此本发明在实现精度的同时兼顾了速度,实现了一个简单有效的车辆关键点检测网络;
(2)本发明提出了自下而上的特征融合,构建了一个从浅层到深层信息传播路径,使得深层的信息得到丰富,浅层特征的空间信息使得整个车辆关键点的定位更加精准;
(3)本发明提出了关键点偏移预测分支,对预测偏差大的关键点具有明显的矫正作用,在复杂场景下,本发明具有很好的鲁棒性,特别是对于遮挡的关键点具有明显的效果提升,能够很好地应用于智能交通领域。
附图说明
图1车辆关键点检测总体处理流程图;
图2车辆关键点标记,浅色为可见关键点,深色为不可见关键点;
图3车辆关键点检测网络的结构图;
图4车辆关键点检测结果示意图;
图5简单关键点检测模块效果示意图;
图6困难关键点检测模块效果示意图。
具体实施方式
以下部分将结合附图以及具体的工作流程来进一步说明本发明的具体实施方式。
为了解决遮挡、复杂背景等问题,本发明提供了一种基于深度学习的车辆关键点检测方法,包括车辆关键点标记、车辆关键点检测网络、检测网络的模型训练与使用。
实施例的总体处理流程如图1所示,首先获取单个车辆实例图像,然后将总体流程分为训练过程和使用过程,在训练过程中将图像进行预处理后定义车辆关键点,然后搭建车辆关键点检测网络并训练网络。使用过程预处理单个车辆实例后使用训练过程得到的车辆关键点检测网络直接得到最后的检测结果。
车辆实例图像,作为示例,本发明采用的数据集是来自CMU的carfusion数据集,该数据集包括53000张图片,共100000个车辆实例,每辆车标注了14个关键点和每辆车定位的矩形框,关键点除标注了坐标外还标注了它是否可见(0表示不在图片内,1表示不可见,2表示可见),其中在数据集中第14个关键点的标注全为0,第9个关键点标注不明确,因此,本发明在训练过程和使用过程中虽然都是预测14个关键点,实际上真正有检测效果的只有前后四个车灯、车灯四个角点和四个车轮中心点共12个关键点。
数据集中每张图片中可能包含多辆车,为了获取单个车辆实例,本发明用每辆车标注的矩形框将车辆剪裁出来,大小为256×196,其中剪裁方式为仿射变换,仿射变换可使剪裁出来的车辆不变形,不影响后面的车辆检测。
图像预处理,将得到的单个车辆实例图像归一化处理,并使用在线随机增强的方式进行数据增强,增强方式包括水平翻转和随机旋转。
车辆关键点标记根据车辆关键点的检测难度将车辆关键点分为简单关键点和困难关键点,使检测网络能够由易到难学习,克服一些关键点难以检测的问题,其中简单关键点为可见关键点,如图2中浅色关键点。将所有车辆关键点划分为三组关键点,分别是车轮关键点G1、车灯关键点G2和车顶关键点G3,分别取三组关键点中预测误差最大的两个关键点组成困难关键点,共六个困难关键,所有关键点中的可见关键点为简单关键点。
车辆关键点检测网络如图3所示,由特征提取模块、简单关键点检测模块和困难关键点模块构成。
1)特征提取模块是指从输入图像提取多分辨率特征,为关键点检测提供足够的上下文信息。作为示例本发明将resnet作为特征提取模块,输入图像通过特征提取模块后获得4个不同分辨率的特征图,对四个特征图进行通道处理,即通过一个1×1卷积将特征的通道数变成256,最后得到图2中的f0,f1,f2,f3,分辨率分别为8×6,16×12,32×24,64×48。
2)简单关键点检测模块利用特征提取模块所提取的特征来预测简单关键点,在特征提取模块提取的f0,f1,f2,f3特征上分别预测所有的简单关键点。具体地,在每个特征上通过一个1×1卷积生成一个14(每辆车的关键点个数)通道的特征(热图),一个通道对应一个关键点,每个通道上的每个位置数值代表该关键点位于该位置的概率,生成的热图如图5所示。
3)困难关键点检测主要包括自下而上特征融合模块和多任务学习两部分:
a)自下而上特征融合利用浅层特征的空间信息来丰富深层信息,以提高困难关键点的检测精度。具体地,将简单关键点检测模块的4个特征上采样到一样的分辨率后构建一个由浅到深的信息传播路径,如图2所示,将浅层特征F3和深层特征F2 concat后连接一个1×1卷积使通道减半,再将此特征与下一个深层特征F1 concat后连接一个1×1卷积使通道减半,以此方式融合直到4个特征全部融合完成,最后将融合完成的特征concat成一个特征用于后续困难关键点检测,concat后的特征通道为原先的四倍,分辨率不变。然后用一个bottleneck模块来实现将通道数减小为原来的四分之一,即通道数变成256。
多任务学习是在特征融合完成之后,指在预测困难关键点时并行连接一个关键点偏移预测分,以提高困难关键点检测精度。具体地,先在自下而上特征融合模块得到的特征图上进行关键点检测和关键点偏移预测,关键点位置检测网络分支如图3所示,结构上连接两个3×3卷积,特征通过第一个卷积后通道数和分辨率均保持不变,第二个卷积生成最后的14通道的热图,其中一个通道对应一个关键点,每个通道上的每个位置的数值代表该关键点位于该位置的概率,生成的热图如图6所示,关键点偏移分支是指预测每个关键点到车辆中心的偏移矢量,其中车辆中心定义为车辆关键点最左边、最右边、最上边和最下边四个关键点形成的矩形框的中心点,每个关键点到中心点的偏移定义为中心点坐标减去关键点坐标的二维矢量。网络结构上关键点偏移分支也是连接两个3×3卷积,特征通过第一个卷积后通道数和分辨率均保持不变,第二个卷积生成最后的2通道特征,其中两个通道分别代表x和y,关键点i对应的(x,y)为以关键点i的groundtruth作为索引在两个通道上对应的值。
网络模型训练,首先在简单关键点检测模块的特征图f0,f1,f2,f3上分别预测一个关键点热图,遵循由粗到细的准则,f0,f1,f2,f3对应的真实标签的kernel size分别为7,9,11,15,其中真实标签为以关键点为中心点生成的高斯热图,将四张热图与其对应的真实标签对比形成中间监督,其中只对可见关键点的loss进行回传,其次在困难关键点检测模块的关键点检测分支,如简单关键点检测模块所示计算预测的热图与标签的高斯热图的误差,根据车辆关键点的定义选取每组关键点中loss最大的2个关键点进行学习,使网络注重学习各组中误差较大的困难关键点。在偏移预测分支中,计算每个关键点的预测偏移矢量与真实标签的误差。训练过程loss主要由三部分构成,即loss=loss1+loss2+loss3。loss1为L2 loss,是简单关键点检测部分的损失,loss2也为L2 loss,是困难关键点检测部分的损失,loss3为Smooth l1 loss,是关键点偏移预测部分的损失。
车辆关键点预测,使用过程将单个车辆实例经过归一化的预处理后输入由训练阶段得到的网络模型,简单关键点检测模块不再进行关键点预测而是直接在困难关键点模块的关键点检测分支得到所有关键点的热图,一个通道对应一个关键点,最后每个关键点对应的热图上响应最大的点的索引即为该关键点的位置。最后检测结果如图4所示,图4中的车辆包括正常视角的车辆、截断的车辆和被遮挡的车辆,对于正常视角的车辆本发明能准确的定位车辆关键点,对于截断和被遮挡的两类检测难度比较大的车辆,本发明虽然能提高检测精度,但是相比正常视角车辆的检测效果还需设计更有效的方法来结合更多的上下文信息以提高它们的检测效果。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。

Claims (8)

1.一种车辆关键点检测方法,其特征在于,所述方法包括以下步骤:
步骤1)图像预处理,获取车辆实例图像,并对所述实例图像进行预处理,每张所述实例图像包含单个车辆;
步骤2)车辆关键点标记,对已预处理的实例图像标记车辆N个关键点,得到实例图像对应的关键点标记信息,所述关键点标记信息包括关键点标签与关键点位置,所述关键点标签包括可见与不可见,定义简单关键点与困难关键点,所述简单关键点为可见的若干关键点,所述困难关键点为根据基于预测误差的设定条件所筛选的若干关键点;
步骤3)车辆关键点检测网络构建,所述关键点检测网络包括特征提取模块、简单关键点检测模块和困难关键点检测模块,其中所述特征提取模块用于提取不同分辨率的K个特征图,所述简单关键点检测模块用于预测简单关键点位置,所述困难关键点检测模块用于对K个特征图进行特征融合并预测关键点位置与关键点到车辆中心的偏移量,所述困难关键点检测模块包括特征融合子模块、关键点检测分支与关键点偏移预测分支;
步骤4)车辆关键点检测网络训练,定义所述关键点检测网络的损失函数,使用已预处理的实例图像与对应的关键点标记信息对所述关键点检测网络的参数进行训练,得到已训练的车辆关键点检测网络;
步骤5)车辆关键点检测网络使用,对待检测图像进行预处理,并输入已训练的车辆关键点检测网络进行检测,最后输出待检测图像的关键点检测结果,所述关键点检测结果包括所述检测网络中所述困难关键点检测模块所预测的关键点位置与关键点到车辆中心的偏移量。
2.根据权利要求1中所述的一种车辆关键点检测方法,其特征在于,所述步骤2)中,所述关键点分为3组,分别为4个车轮关键点、4个车灯关键点与4个车顶关键点,所述困难关键点为选择每组关键点中预测误差最大的2个关键点所组成的6个关键点。
3.根据权利要求1或2中所述的一种车辆关键点检测方法,其特征在于,所述步骤3)中,所述特征提取模块的结构包括1个ResNet与K个1×1卷积层,ResNet接收预处理后的实例图像,提取不同分辨率的K个特征图,对每个特征图使用1个1×1卷积层进行卷积操作使K个特征图的通道数相同,并发送至所述简单关键点检测模块。
4.根据权利要求3中所述的一种车辆关键点检测方法,其特征在于,所述步骤3)中,所述简单关键点检测模块的结构包括K个1×1卷积层与K个输出层,所述简单关键点检测模块接收K个特征图并发送至所述困难关键点 检测模块中的特征融合子模块,同时对每个特征图使用1个1×1卷积层进行卷积操作生成对应的热图,并发送至对应的输出层输出,进而得到K个热图,所述热图的通道数等于关键点数N且每个通道代表对应的关键点的预测概率分布。
5.根据权利要求4中所述的一种车辆关键点检测方法,其特征在于,所述步骤3)中,所述困难关键点检测模块中,所述特征融合子模块接收K个特征图进行特征融合得到融合特征图,并将融合特征图分别发送至关键点检测分支与关键点偏移预测分支,所述关键点检测分支与所述关键点偏移预测分支并行,所述关键点检测分支预测关键点位置并输出,所述关键点偏移预测分支预测关键点到车辆中心的偏移量并输出;
所述特征融合子模块的结构包括K个采样层、一个由浅层特征图到深层特征图的信息传播路径与一个concat层,所述特征融合子模块接收所述简单关键点检测模块所发送的K个特征图后,首先通过K个采样层进行上采样操作将K个特征图处理为相同的分辨率,然后通过所述信息传播路径生成K个对应的中间融合特征图,然后通过concat层对K个中间融合特征图进行concat操作生成1个融合特征图,并通过一个bottleneck模块将通道数减小为K分之一,最后分别发送至所述关键点预测分支与关键点偏移预测分支;
所述关键点检测分支的结构包括2个3×3卷积层和一个输出层,第1个3×3卷积层对所接收的特征图进行卷积操作分辨率和通道数保持不变,第2个3×3卷积对第1个3×3卷积层的结果进行卷积操作生成对应的热图,所述热图的通道数等于关键点数N且每个通道代表对应的关键点的预测概率分布;
所述关键点偏移预测分支的结构2个3×3卷积层和一个输出层,第1个3×3卷积层对所接收的特征图进行卷积操作分辨率和通道数保持不变,第2个3×3卷积对第1个3×3卷积层的结果进行卷积操作生成对应的预测结果,所述预测结果包括对应的关键点到车辆中的x偏移量与y偏移量。
6.根据权利要求5中所述的一种车辆关键点检测方法,其特征在于,所述步骤3)中,所述由浅层特征图到深层特征图的信息传播路径为依次将K个特征图中的浅层特征图与相邻的深层特征图进行concat操作后生成1个中间融合特征图,连接一个1×1卷积层进行卷积操作使中间融合特征图的通道数减半,然后将所述中间融合特征图与下一个深层特征图进行concat操作并进行卷积操作再生成1个中间融合特征图,迭代进行直到最后K个特征图融合完成生成K个对应的中间融合特征图发送并至concat层。
7.根据权利要求1所述的一种车辆关键点检测方法,其特征在于,所述步骤4)中,所述关键点检测网络的损失函数:
loss=loss1+loss2+loss3,
其中,loss1为表示所述简单关键点检测模块针对简单关键点位置所预测生成的热图与真实关键点标签的高斯热图之间误差的L2损失函数,loss2为表示所述困难关键点检测模块针对困难关键点位置所预测生成的热图与真实关键点标签的高斯热图之间误差的L2损失函数,loss3为表示所述困难关键点检测模块针对困难关键点偏移的预测结果与真实关键点偏移之间误差的smooth L1损失函数。
8.一种车辆关键点检测系统,其特征在于,所述系统包括图像预处理模块、关键点检测模块与结果输出模块;
所述图像预处理模块,用于输入和预处理包含单个车辆的待检测图像并进行预处理,得到已预处理的图像,并发送至所述车辆关键点检测模块;
所述车辆关键点检测模块用于检测图像上的关键点,并将关键点检测结果发送至结果输出模块,所述车辆关键点检测模块包括已训练的车辆关键点检测网络,所述关键点检测网络包括特征提取模块、简单关键点检测模块和困难关键点模块,其中所述特征提取模块用于提取不同分辨率的K个特征图,所述简单关键点检测模块用于预测简单关键点位置,所述困难关键点检测模块用于对K个特征图进行特征融合并预测关键点位置与关键点到车辆中心的偏移量,所述困难关键点检测模块包括特征融合子模块、关键点检测分支与关键点偏移预测分支;
所述结果输出模块,用于输出呈现关键点检测结果,所述关键点检测结果为图像中所预测的关键点位置与关键点到车辆中心的偏移量。
CN202011002420.5A 2020-09-22 2020-09-22 一种车辆关键点检测方法 Active CN112132013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011002420.5A CN112132013B (zh) 2020-09-22 2020-09-22 一种车辆关键点检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011002420.5A CN112132013B (zh) 2020-09-22 2020-09-22 一种车辆关键点检测方法

Publications (2)

Publication Number Publication Date
CN112132013A CN112132013A (zh) 2020-12-25
CN112132013B true CN112132013B (zh) 2022-07-15

Family

ID=73842315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011002420.5A Active CN112132013B (zh) 2020-09-22 2020-09-22 一种车辆关键点检测方法

Country Status (1)

Country Link
CN (1) CN112132013B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112991452A (zh) * 2021-03-31 2021-06-18 杭州健培科技有限公司 基于椎体中心点的端到端椎体关键点定位测量方法及装置
CN116385829B (zh) * 2023-04-07 2024-02-06 北京百度网讯科技有限公司 姿态描述信息生成方法、模型的训练方法和装置
CN117456511A (zh) * 2023-12-25 2024-01-26 安徽蔚来智驾科技有限公司 车灯识别方法、存储介质及智能设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784350A (zh) * 2018-12-29 2019-05-21 天津大学 结合空洞卷积与级联金字塔网络的服饰关键点定位方法
CN110276316A (zh) * 2019-06-26 2019-09-24 电子科技大学 一种基于深度学习的人体关键点检测方法
CN110490256A (zh) * 2019-08-20 2019-11-22 中国计量大学 一种基于关键点热图的车辆检测方法
CN111523486A (zh) * 2020-04-24 2020-08-11 重庆理工大学 一种基于改进CenterNet的机械臂抓取检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10723022B2 (en) * 2016-09-16 2020-07-28 Carbon Robotics, Inc. System and calibration, registration, and training methods

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784350A (zh) * 2018-12-29 2019-05-21 天津大学 结合空洞卷积与级联金字塔网络的服饰关键点定位方法
CN110276316A (zh) * 2019-06-26 2019-09-24 电子科技大学 一种基于深度学习的人体关键点检测方法
CN110490256A (zh) * 2019-08-20 2019-11-22 中国计量大学 一种基于关键点热图的车辆检测方法
CN111523486A (zh) * 2020-04-24 2020-08-11 重庆理工大学 一种基于改进CenterNet的机械臂抓取检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cascaded Pyramid Network for Multi-Person Pose Estimation;Yilun Chen等;《arXiv》;20180408;第1-10页 *
基于级联卷积神经网络的服饰关键点定位算法;李 锵等;《天津大学学报(自然科学与工程技术版)》;20200331;第53卷(第3期);第229-236页 *

Also Published As

Publication number Publication date
CN112132013A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN112132013B (zh) 一种车辆关键点检测方法
CN108830171B (zh) 一种基于深度学习的智能物流仓库引导线视觉检测方法
CN110659664B (zh) 一种基于ssd的高精度识别小物体的方法
Wu et al. Multi-modal 3D object detection by 2D-guided precision anchor proposal and multi-layer fusion
CN112633220B (zh) 一种基于双向序列化建模的人体姿态估计方法
CN113076891B (zh) 基于改进高分辨率网络的人体姿态预测方法及系统
CN117037119A (zh) 基于改进YOLOv8的道路目标检测方法及系统
CN109657538B (zh) 基于上下文信息指导的场景分割方法和系统
CN112990065A (zh) 一种基于优化的YOLOv5模型的车辆分类检测方法
CN112767478B (zh) 一种基于表观指导的六自由度位姿估计方法
Farag A lightweight vehicle detection and tracking technique for advanced driving assistance systems
CN113095152A (zh) 一种基于回归的车道线检测方法及系统
Zou et al. Hft: Lifting perspective representations via hybrid feature transformation
Li et al. Enhancing 3-D LiDAR point clouds with event-based camera
CN115238758A (zh) 一种基于点云特征增强的多任务三维目标检测方法
CN112101113B (zh) 一种轻量化的无人机图像小目标检测方法
CN114119749A (zh) 一种基于密集关联的单目3d车辆检测方法
Luo et al. AD-RoadNet: an auxiliary-decoding road extraction network improving connectivity while preserving multiscale road details
CN110738123B (zh) 识别密集陈列商品的方法及其装置
CN116630917A (zh) 一种车道线检测方法
CN116912485A (zh) 一种基于热感图像和可见光图像特征融合的场景语义分割方法
CN116596966A (zh) 一种基于注意力和特征融合的分割与跟踪方法
CN114693951A (zh) 一种基于全局上下文信息探索的rgb-d显著性目标检测方法
CN114708321A (zh) 一种基于语义的相机位姿估计方法及系统
CN113780189A (zh) 一种基于U-Net改进的车道线检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant