CN115272992B - 一种车辆姿态估计方法 - Google Patents
一种车辆姿态估计方法 Download PDFInfo
- Publication number
- CN115272992B CN115272992B CN202211204054.0A CN202211204054A CN115272992B CN 115272992 B CN115272992 B CN 115272992B CN 202211204054 A CN202211204054 A CN 202211204054A CN 115272992 B CN115272992 B CN 115272992B
- Authority
- CN
- China
- Prior art keywords
- vehicle
- convolution
- feature
- attitude estimation
- key point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000001514 detection method Methods 0.000 claims abstract description 31
- 238000002372 labelling Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000005728 strengthening Methods 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 abstract description 3
- 230000036544 posture Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明属于车辆姿态估计技术领域,涉及一种车辆姿态估计方法,使用卷积神经网络生成高质量的候选框,并采用可变形卷积增强了网络聚合多尺度空间信息的能力,构建了一个高效简洁的车辆关键点检测头,能够为图像中每个车辆动态地生成一组权重,并将权重作用与特征图,并经过关键点对齐得到最终的关键点坐标,检测时间短,高效的实现车辆关键点检测,并用于实际车辆姿态估计任务中。
Description
技术领域
本发明属于车辆姿态估计技术领域,涉及一种车辆姿态估计方法,特别是一种基于动态车辆实例感知卷积且检测时间恒定的车辆姿态估计方法,以满足智慧交通和自动驾驶系统中利用车辆关键点获取车辆姿态的需求。
背景技术
随着人工智能、物联网等技术的迅速发展,智慧交通和自动驾驶成为了近年来的研究热点,而车辆姿态估计技术在其中扮演了重要角色,车辆姿态估计可以提供车辆的几何和运动信息,可用于车辆自动避障、快速捕捉车辆违法违章信息等任务,车辆姿态估计旨在定位出车辆的关键点位置,其面临的一个挑战是获得车辆的姿态和形状,这通常需要高精度的传感器来实现,受限于传感器较高的成本,导致车辆关键点检测技术难以大规模普及,因此,通过常规摄像头进行车辆的姿态估计具备较高的实用价值。
姿态估计任务的关键点都是通过人为设计一些具有语义信息的特征点,随着深度学习技术的发展,基于深度学习的姿态估计算法的表现优于传统的计算机视觉方法,常见的姿态估计任务有人体姿态估计、人脸姿态估计、手势姿态估计等,处理这些任务的方法通常分为两类,自上而下和自下而上两种,因此,车辆姿态估计方法也分为自上而下和自下而上两种,其中自上而下的车辆姿态估计算法使用车辆目标检测器从输入数据中获取一组边界框(每个框对应一个车辆实例),然后对每个车辆的框应用单车辆姿态估计算法以获取多车辆姿态,与自上而下的方法不同,自下而上的方法先定位所有的车辆关键点,然后进行分组后处理。
现实驾驶场景中,需要自动识别所驾驶车周围车辆的行驶状态,因此车辆姿态估计方法在实际应用过程中可以通过所驾驶车辆所搭载的摄像头拍摄周围车辆图像,然后根据对图像的识别结果确定周围车辆的行驶状态,现有的姿态估计方法主要有以下几个缺点:(1)自上而下的姿态估计方法需要对输入图像裁剪单个车辆的感兴趣区域,由于感兴趣区域单独传递,导致卷积参数不能共享,因此这种方法的推理时间受限于图片中车辆数量;(2)自下而上的姿态估计方法首先检测出所有车辆的关键点,然后使用分组后处理来获取每个车辆的整体结果,由于对关键点分组的步骤通常是启发式的,并且会涉及较多的超参数,导致处理过程非常复杂,检测时间较长。
由此可见,针对现实驾驶场景,现有的姿态估计方法检测时间受限于车辆的数量,急需更有效的方法来缩短检测时间。
发明内容
本发明的目的在于克服现有技术存在的不足,设计提供一种车辆姿态估计方法,解决现有姿态估计方法的检测时间较长的问题,并用于实际车辆姿态估计任务中,高效地检测车辆姿态。
为实现上述目的,本发明实现车辆姿态估计的具体过程为:
(1)数据集构建:收集交通监控、停车场中含有多种车辆的图像,构建车辆数据集,并在每个车辆上定义78个关键点,标注车辆的边界框,即车辆最小外接矩形,将数据集划分为训练集、验证集和测试集;
(2)主干网络卷积特征提取:先对图像的尺寸和数值范围进行初始化处理,再将处理后的图像输入到主干网络的第三阶段到第五阶段(C3-C5)中进行卷积特征提取得到特征图;
(3)特征金字塔网络特征提取:将步骤(2)得到的特征图输入特征金字塔网络提取特征得到多尺度车辆卷积特征图集合;
(4)生成车辆候选框:根据步骤(3)得到的多尺度车辆卷积特征图集合,使用车辆目标检测框分支完成目标框类别分类和位置回归的任务,其中分类为是否是车辆,位置信息为车牌的四个顶点坐标;
(5)动态关键点检测:根据步骤(4)得到的特征图集合,以条件卷积为主,构建动态关键点检测头,先对输入的特征图进行计算得出加权卷积核,再对其执行卷积操作,每个卷积核只进行一次计算,应用在不同特征图上的不同位置进行计算得出加权卷积核,每个卷积核只计算一次,应用在不同图像上的不同位置,通过输入计算卷积核参数使卷积具有动态特性;
(6)特征对齐的精细化关键点生成:使用特征金字塔中的特征图P3来生成热图,特
征金字塔的P3输出通道为2,设预测了从位置到最近的正确标注关键点
的偏移量,对于某一个关键点,如果热图上的最大值在处,则车辆关键点在原始图像中
最终坐标为;
(7)输出结果:对于图像中的每一个车辆,输出其在图像中的坐标,通过后续处理将关键点标注在原始图像中。
作为本发明的进一步技术方案,步骤(2)所述主干网络使用ResNet-50作为特征提取网络,其中主干网络的第三阶段(C3)和第四阶段的卷积(C4)采用可变形卷积进行升级。
作为本发明的进一步技术方案,步骤(3)所述特征金字塔网络提取特征的具体过程为:特征图金字塔网络P3~P5以主干网络C3~C5的输出特征图为输入,P6和P7依次通过应用一个卷积后生成,首先所有卷积层的特征图被对齐到统一维度,然后,统一维度的特征图在FPN中通过自上而下和自下而上的路径进行融合,特征金字塔网络是针对ResNet-50里面形成的多尺度特征进行强化利用获得表达力更强包含多尺度车辆信息的多尺度车辆卷积特征图集合。
作为本发明的进一步技术方案,步骤(4)使用车辆目标检测框分支完成目标框类别分类和位置回归的任务时,将特征图上的像素视为训练样本,正确标注框中的像素被视为正样本,将其中的四个偏移量回归到正确标注边界框的四个边界;否则,像素被视为负样本。
作为本发明的进一步技术方案,步骤(5)的过程描述为:
其中GAP是全局平均池化操作,R表示全连接层,Sigmoid为激活函数,对每个实例
产生权重的是一个单一的卷积层,其卷积核大小为,该层的输出等于关键点头中权重的个数,关键点部分有3个卷积层,其卷积核大小为,对于图像中每个车辆,动态的生
成一个关键点检测头。
与现有技术相比,本发明使用卷积神经网络生成高质量的候选框,并采用可变形卷积增强了网络聚合多尺度空间信息的能力,构建了一个高效简洁的车辆关键点检测头,能够为图像中每个车辆动态地生成一组权重,并将权重作用与特征图,并经过关键点对齐得到最终的关键点坐标,检测时间短,高效的实现车辆关键点检测,并用于实际车辆姿态估计任务中。
附图说明
图1为本发明所采用的网络结构框架示意图。
图2为本发明所述车辆姿态估计的流程框图。
图3为本发明提供的车辆关键点标注的一个示例。
图4为本发明提供的车辆关键点标注的另一个示例。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
实施例:
如图1和图2所示,本实施例提供了一种车辆姿态估计方法,通过卷积神经网络生成高质量的候选框,并采用可变形卷积增强了网络聚合多尺度空间信息的能力,具体实施包括如下步骤:
(1)数据集构建:
为了更好地实现车辆姿态估计,首先需要一个数据众多、标注详细的数据集,在一种可能的实施方式中,数据集可以是采用现有的数据集,也可以是从各类渠道收集图像并标注制作的,以本实施例公开的具体执行方案为例,通过收集交通监控、停车场监控等现实场景中含有的多种车辆的图像,构建车辆数据集,在每个车辆上定义关键点,以轿车为例,共定义78个关键点,如图3和4所示,主要定义具有很强局部纹理特征信息的点,如多选择车辆上的角点定义(车灯的4个角点、前后挡风玻璃的4个角点等),标注车辆的边界框,即车辆最小外接矩形,将数据集划分为训练集、验证集和测试集;
(2)主干网络卷积特征提取:
先对图片的尺寸和数值范围行初始化处理,然后将处理后的图像输入到主干网络(C3-C5)中进行卷积特征提取,其中主干网络使用ResNet-50作为特征提取网络。由于传统的卷积具有固定尺寸、固定形状,而车辆特征复杂,用已知的卷积去处理未知复杂的特征,具有很大的局限性,为适应复杂的车辆特征,便于后续检测,采用可变形卷积对主干网络第三阶段(C3)和第四阶段的卷积(C4)进行升级;
(3)特征金字塔网络特征提取:
以步骤(2)输出的特征图为输入,通过特征金字塔网络提取特征,特征金字塔网络如图1所示,其中,特征图金字塔网络P3~P5以主干网络C3~C5的输出特征图为输入,P6和P7依次通过应用一个卷积后生成,首先,所有卷积层的特征图被对齐到统一维度,然后,特征图在FPN中通过自上而下和自下而上的路径进行融合,其中,(P3~P5)形式上有:
(P6,P7)形式上有:
(4)生成车辆候选框:
根据步骤(3)得到的多尺度车辆卷积特征图集合,使用车辆目标检测框分支完成目标框类别分类和位置回归的任务,这一步将输入特征图上的像素视为训练样本,类似于语义分割。正确标注框中的像素被视为正样本,将其中的四个偏移量回归到正确标注边界框的四个边界;否则,像素被视为负样本,分类为是否是车辆,位置信息为车牌的四个顶点坐标;
(5)动态关键点检测:
根据步骤(4)得到的特征图集合,以条件卷积为主,构建动态关键点检测头,先对输入的特征图进行计算得出加权卷积核,再对其执行卷积操作,每个卷积核只进行一次计算,应用在不同特征图上的不同位置进行计算得出加权卷积核,每个卷积核只计算一次,应用在不同图像上的不同位置,通过输入计算卷积核参数使卷积具有动态特性,描述为:
其中GAP是全局平均池化操作,R表示全连接层,Sigmoid为激活函数,对每个实例
产生权重的是一个单一的卷积层,其卷积核大小为,该层的输出等于关键点头中权重的个数,关键点部分有3个卷积层,其卷积核大小为,较少的参数使关键点检测头变
的非常紧凑;对于图像中每个车辆,网络都会动态的生成一个关键点检测头,由于条件卷积
具有较强的表达能力,这使得关键点检测头十分简单且高效,无论图像中有多少车辆,模型
的推理时间基本是不变的;
(6)特征对齐的精细化关键点生成:
使用特征金字塔中的特征图P3(F)来生成热图,因此热图的分辨率是输入图像分
辨率的,而关键点检测需要较高的定位精度,的分辨率不足以进行关键点检测,在以往的工
作中,通常采用反卷积等上采样操作,这会带来较高的计算量,因此本实施例引入一个基于
回归的关键点对齐模块解决上述问题,特征金字塔的P3输出通道为2,设 预
测了从位置到最近的正确标注关键点的偏移量,对于某一个关键点,如果热图上的最
大值在处,则车辆关键点在原始图像中最终坐标为;
(7)输出结果:
对于图像中的每一个车辆,输出其在图像中的坐标,通过后处理操作,将关键点标注在原始图像中。
本文中未详细描述的网络结构和算法均为本领域已有技术。
需要注意的是,公布实施示例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (5)
1.一种车辆姿态估计方法,其特征在于,具体过程为:
(1)数据集构建:收集交通监控、停车场中含有多种车辆的图像,构建车辆数据集,并在每个车辆上定义78个关键点,标注车辆的边界框,即车辆最小外接矩形,将数据集划分为训练集、验证集和测试集;
(2)主干网络卷积特征提取:先对图像的尺寸和数值范围进行初始化处理,再将处理后的图像输入到主干网络的C3-C5中进行卷积特征提取得到特征图;
(3)特征金字塔网络特征提取:将步骤(2)得到的特征图输入特征金字塔网络提取特征得到多尺度车辆卷积特征图集合;
(4)生成车辆候选框:根据步骤(3)得到的多尺度车辆卷积特征图集合,使用车辆目标检测框分支完成目标框类别分类和位置回归的任务,其中分类为是否是车辆,位置信息为车牌的四个顶点坐标;
(5)动态关键点检测:根据步骤(4)得到的特征图集合,以条件卷积为主,构建动态关键点检测头,先对输入的特征图进行计算得出加权卷积核,再对其执行卷积操作,每个卷积核只进行一次计算,应用在不同特征图上的不同位置进行计算得出加权卷积核,每个卷积核只计算一次,应用在不同图像上的不同位置,通过输入计算卷积核参数使卷积具有动态特性;
(6)特征对齐的精细化关键点生成:使用特征金字塔中的特征图P3来生成热图,特征金
字塔的P3输出通道为2,设预测了从位置到最近的正确标注关键点的偏
移量,对于某一个关键点,如果热图上的最大值在处,则车辆关键点在原始图像中最终
坐标为;
(7)输出结果:对于图像中的每一个车辆,输出其在图像中的坐标,通过后续处理将关键点标注在原始图像中。
2.根据权利要求1所述车辆姿态估计方法,其特征在于,步骤(2)所述主干网络使用ResNet-50作为特征提取网络,其中主干网络C3和C4的卷积采用可变形卷积进行升级。
3.根据权利要求2所述车辆姿态估计方法,其特征在于,所述特征金字塔网络提取特征的具体过程为:特征图金字塔网络P3~P5以主干网络C3~C5的输出特征图为输入,P6和P7依次通过应用一个卷积后生成,首先所有卷积层的特征图被对齐到统一维度,然后,统一维度的特征图在FPN中通过自上而下和自下而上的路径进行融合,特征金字塔网络是针对ResNet-50里面形成的多尺度特征进行强化利用获得表达力更强包含多尺度车辆信息的多尺度车辆卷积特征图集合。
4.根据权利要求3所述车辆姿态估计方法,其特征在于,步骤(4)使用车辆目标检测框分支完成目标框类别分类和位置回归的任务时,将特征图上的像素视为训练样本,正确标注框中的像素被视为正样本,将其中的四个偏移量回归到正确标注边界框的四个边界;否则,像素被视为负样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211204054.0A CN115272992B (zh) | 2022-09-30 | 2022-09-30 | 一种车辆姿态估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211204054.0A CN115272992B (zh) | 2022-09-30 | 2022-09-30 | 一种车辆姿态估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115272992A CN115272992A (zh) | 2022-11-01 |
CN115272992B true CN115272992B (zh) | 2023-01-03 |
Family
ID=83758029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211204054.0A Active CN115272992B (zh) | 2022-09-30 | 2022-09-30 | 一种车辆姿态估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115272992B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149590A (zh) * | 2020-09-28 | 2020-12-29 | 河南威虎智能科技有限公司 | 一种手部关键点检测方法 |
CN112686097A (zh) * | 2020-12-10 | 2021-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种人体图像关键点姿态估计方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10885659B2 (en) * | 2018-01-15 | 2021-01-05 | Samsung Electronics Co., Ltd. | Object pose estimating method and apparatus |
CN110717527B (zh) * | 2019-09-24 | 2023-06-27 | 东南大学 | 结合空洞空间金字塔结构的目标检测模型确定方法 |
CN111160085A (zh) * | 2019-11-19 | 2020-05-15 | 天津中科智能识别产业技术研究院有限公司 | 一种人体图像关键点姿态估计方法 |
CN111191622B (zh) * | 2020-01-03 | 2023-05-26 | 华南师范大学 | 基于热力图和偏移向量的姿态识别方法、系统及存储介质 |
US11600017B2 (en) * | 2020-04-29 | 2023-03-07 | Naver Corporation | Adversarial scene adaptation for camera pose regression |
CN112348035B (zh) * | 2020-11-11 | 2024-05-24 | 东软睿驰汽车技术(沈阳)有限公司 | 车辆关键点检测方法、装置及电子设备 |
CN112967339B (zh) * | 2020-12-28 | 2023-07-25 | 北京市商汤科技开发有限公司 | 一种车辆位姿的确定方法、车辆控制方法及装置、车辆 |
CN113255589B (zh) * | 2021-06-25 | 2021-10-15 | 北京电信易通信息技术股份有限公司 | 一种基于多卷积融合网络的目标检测方法及系统 |
CN114067282B (zh) * | 2021-11-04 | 2024-05-07 | 北京智芯原动科技有限公司 | 一种端到端的车辆位姿检测方法及装置 |
CN114241456A (zh) * | 2021-12-20 | 2022-03-25 | 东南大学 | 一种利用特征自适应加权的安全驾驶监测方法 |
CN114842085B (zh) * | 2022-07-05 | 2022-09-16 | 松立控股集团股份有限公司 | 一种全场景车辆姿态估计方法 |
-
2022
- 2022-09-30 CN CN202211204054.0A patent/CN115272992B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149590A (zh) * | 2020-09-28 | 2020-12-29 | 河南威虎智能科技有限公司 | 一种手部关键点检测方法 |
CN112686097A (zh) * | 2020-12-10 | 2021-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种人体图像关键点姿态估计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115272992A (zh) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107563372B (zh) | 一种基于深度学习ssd框架的车牌定位方法 | |
WO2020244653A1 (zh) | 物体识别方法及装置 | |
CN110059558B (zh) | 一种基于改进ssd网络的果园障碍物实时检测方法 | |
WO2021218786A1 (zh) | 一种数据处理系统、物体检测方法及其装置 | |
CN111104903B (zh) | 一种深度感知交通场景多目标检测方法和系统 | |
CN108062525B (zh) | 一种基于手部区域预测的深度学习手部检测方法 | |
Hoang et al. | Enhanced detection and recognition of road markings based on adaptive region of interest and deep learning | |
CN108171112A (zh) | 基于卷积神经网络的车辆识别与跟踪方法 | |
CN107545263B (zh) | 一种物体检测方法及装置 | |
CN111160249A (zh) | 基于跨尺度特征融合的光学遥感图像多类目标检测方法 | |
Zhou et al. | YOLO-CIR: The network based on YOLO and ConvNeXt for infrared object detection | |
CN111553414A (zh) | 一种基于改进Faster R-CNN的车内遗失物体检测方法 | |
CN111428664A (zh) | 一种基于人工智能深度学习技术的计算机视觉的实时多人姿态估计方法 | |
Ling et al. | Optimization of autonomous driving image detection based on RFAConv and triplet attention | |
CN115620393A (zh) | 一种面向自动驾驶的细粒度行人行为识别方法及系统 | |
CN114140672A (zh) | 一种应用于雨雪天气场景下多传感器数据融合的目标检测网络系统及方法 | |
Khellal et al. | Pedestrian classification and detection in far infrared images | |
CN110909656B (zh) | 一种雷达与摄像机融合的行人检测方法和系统 | |
Muthalagu et al. | Vehicle lane markings segmentation and keypoint determination using deep convolutional neural networks | |
Esfahani et al. | DeepDSAIR: Deep 6-DOF camera relocalization using deblurred semantic-aware image representation for large-scale outdoor environments | |
Shustanov et al. | A Method for Traffic Sign Recognition with CNN using GPU. | |
Nakamura et al. | Few-shot adaptive object detection with cross-domain cutmix | |
CN117911827A (zh) | 多模态目标检测方法、装置、设备及存储介质 | |
Zhang et al. | Depth Monocular Estimation with Attention-based Encoder-Decoder Network from Single Image | |
CN117115616A (zh) | 一种基于卷积神经网络的实时低照度图像目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |