CN114898306A - 一种检测目标朝向的方法、装置及电子设备 - Google Patents
一种检测目标朝向的方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114898306A CN114898306A CN202210807161.6A CN202210807161A CN114898306A CN 114898306 A CN114898306 A CN 114898306A CN 202210807161 A CN202210807161 A CN 202210807161A CN 114898306 A CN114898306 A CN 114898306A
- Authority
- CN
- China
- Prior art keywords
- target
- orientation
- detected
- image
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000001514 detection method Methods 0.000 claims abstract description 279
- 239000013598 vector Substances 0.000 claims abstract description 276
- 238000012549 training Methods 0.000 claims description 281
- 230000006870 function Effects 0.000 claims description 115
- 230000004927 fusion Effects 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种检测目标朝向的方法、装置及电子设备,用以提升道路中车辆朝向检测结果的准确性。该方法包括:获取待检测图像,并将所述待检测图像输入目标朝向检测模型;通过所述目标朝向检测模型对所述待检测图像进行目标检测,并确定检测出的目标对应的目标向量;其中,所述目标向量基于所述检测出的目标的姿态信息确定,所述目标朝向检测模型包括所述检测出的目标的特征与目标区域的特征之间的对应关系,所述目标区域为所述检测出的目标在所述待检测图像中所在的区域;基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息。
Description
技术领域
本申请涉及智能驾驶技术领域,尤其涉及一种检测目标朝向的方法、装置及电子设备。
背景技术
随着人工智能相关技术的成熟,现已将人工智能引入多个道路管理项目之中,以便加强道路管理。上述道路管理项目包括,车辆检测,车辆轨迹检测,车辆朝向检测等等。其中,车辆朝向检测作为基础检测项目之一,有助于车辆轨迹检测的执行,预测道路拥堵情况或拥堵位置等。
目前,基于车辆朝向检测的人工智能算法主要有两种。第一种是通过检测网络检测车辆的位置信息,并基于该位置信息将包含车辆的区域从采集图像中提取,并送入分类网络进行处理,以确定朝向。第二种是通过采集图像推测车轮贴地点等关键点的信息,基于关键点确定车辆朝向。
上述第一种算法问题在于对于检测网络以及分类网络性能要求较高,由于网络复杂容易出现训练效果不佳,导致检测结果不准确的问题。而上述第二种算法由于需要提取包括车轮贴地点等关键点的信息,容易出现关键点提取错误,导致检测结果不准确的问题。
发明内容
本申请提供了一种检测目标朝向的方法、装置及电子设备,用以提升道路中车辆朝向检测结果的准确性。
第一方面,本申请提供一种检测目标朝向的方法,包括:
获取待检测图像,并将所述待检测图像输入目标朝向检测模型;
通过所述目标朝向检测模型对所述待检测图像进行目标检测,并确定检测出的目标对应的目标向量;其中,所述目标向量基于所述检测出的目标的姿态信息确定,所述目标朝向检测模型包括所述检测出的目标的特征与目标区域特征之间的对应关系,所述目标区域为所述检测出的目标在所述待检测图像中所在的区域;
基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息。
上述申请实施例中,通过目标朝向检测模型,确定待检测图像中的目标,以及与目标对应的目标向量,并基于该目标向量确定目标的朝向信息,因而只需基于目标的姿态信息确定目标向量,就可确定朝向,避免了提取目标的贴地点信息,以预测目标朝向,因而不仅达到了提高检测目标朝向的速率的目的,还有效提高了检测目标朝向的准确性。该方法尤其适用于道路检测中车辆的朝向检测,即将目标设置为车辆,使得目标朝向检测模型只需根据图像中采集到的车辆信息(部分或全部)确定对应于车辆的目标向量,进而根据该目标向量确定车辆朝向,有效避免了需提取车轮贴地点信息,但由于采集图像信息中未显示车轮信息,导致车辆朝向检测结果不准确的问题。
一种可能的实施方式,所述基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息,包括:
确定所述目标向量与所述图像坐标系中预设坐标轴的夹角为所述倾斜参数;
响应于所述倾斜参数大于参数阈值,确定所述目标朝向为第一朝向类型;响应于所述倾斜参数小于或等于参数阈值,确定所述目标朝向为第二朝向类型:其中:
所述第一朝向类型所对应的所述目标朝向,相对于所述第二朝向类型所对应的目标朝向。
一种可能的实施方式,所述通过所述目标朝向检测模型对所述待检测图像进行目标检测,并确定检测出的目标对应的目标向量,包括:
提取所述待检测图像的第一特征信息;其中,所述第一特征信息包括所述待检测图像的浅层特征和深层特征,所述浅层特征指示所述目标区域的局部特征,所述深层特征包括所述目标区域的整体特征;
融合所述第一特征信息中的所述浅层特征和所述深层特征,得到对应于所述待检测图像的第一融合信息;
基于所述第一融合信息,确定所述检测出的目标,以及所述目标向量。
一种可能的实施方式,所述目标朝向检测模型通过如下方式训练得到:
获取第一训练图像集;其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量;
将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标,及对应于所述第一检测目标的第一检测向量;
确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差;
基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型。
一种可能的实施方式,所述确定所述检测出的目标的朝向信息之后,还包括:
基于所述图像坐标系,确定所述检测出的目标在所述待检测图像中的图像位置信息;
基于所述图像位置信息和采集所述待检测图像的图像采集设备的图像采集参数,确定所述图像采集设备的转换参数;其中,所述转换参数包括所述图像位置信息,以及由所述图像位置信息经像素坐标系转换所得的像素位置信息;
基于所述转换参数,确定所述检测出的目标在物理坐标系中的物理位置信息。
第二方面,本申请提供一种确定目标朝向检测模型的方法,包括:
获取第一训练图像集;其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量;
将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标及对应于所述第一检测目标的第一检测向量;
确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差;
基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型;其中,所述目标朝向检测模型用于确定待检测图像中的待测目标以及所述待测目标的朝向信息。
一种可能的实施方式,所述得到训练后的目标朝向检测模型之后,还包括:
将待检测图像输入所述目标朝向检测模型,确定所述待检测图像中的待测目标以及与所述待测目标对应的目标向量;
确定所述目标向量与图像坐标系中设置坐标轴之间的夹角是否大于参考角;若是,则确定所述目标朝向为第一朝向类型;若否,则确定所述目标朝向为第二朝向类型;其中,所述第一朝向类型指示的所述目标朝向相对于所述第二朝向类型指示的所述目标朝向,所述图像坐标系与所述待检测图像关联。
一种可能的实施方式,所述将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标及对应于所述第一检测目标的第一检测向量,包括:
提取所述第一训练图像中的训练特征信息;其中,所述训练特征信息包括所述第一训练图像的浅层特征和深层特征;
融合所述训练特征信息中的深层特征和浅层特征,得到对应于所述第一训练图像的训练融合信息;
基于所述第一标签中第一预设目标的预设位置信息和所述训练融合信息,确定所述第一检测目标和所述第一检测向量。
一种可能的实施方式,所述基于所述第一标签中第一预设目标的预设位置信息和所述训练融合信息,确定所述第一检测目标和所述第一检测向量,包括:
基于所述训练融合信息和所述预设位置信息,在所述第一训练图像中确定候选目标,以及所述候选目标所对应的候选向量;
基于所述候选目标的置信度,将所述置信度最高的所述候选目标作为第一检测目标;其中,所述候选目标的置信度为,利用所述目标朝向训练模型预测所述候选目标为第一检测目标的可能性;
确定所述置信度最高的所述候选目标所对应的候选向量为所述第一检测向量。
一种可能的实施方式,所述确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差,包括:
利用交叉熵损失函数确定所述第一误差,并利用朝向向量损失函数,确定所述第二误差;
则所述基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型,包括:
将所述交叉熵损失函数和第一设置系数的乘积与所述朝向向量损失函数和第二设置系数的乘积叠加,得到总损失函数;
基于所述总损失函数,调整所述目标朝向训练模型的参数,直到所述总损失函数的值位于设定范围,得到所述目标朝向检测模型。
一种可能的实施方式,所述朝向向量损失函数为:
一种可能的实施方式,所述获取第一图像训练集之后,还包括:
针对至少一张所述第一训练图像和所述第一标签做数据增强处理,得到第二训练图像,以及与所述第二训练图像对应的第二标签;所述第二标签包括所述第二训练图像中第二预设目标对应的第二预设向量;
组合所述第二训练图像,所述第二标签和所述第一训练图像集,得到第二训练图像集。
第三方面,本申请提供一种检测目标朝向的装置,包括:
图像单元:用于获取待检测图像,并将所述待检测图像输入目标朝向检测模型;
向量单元:用于通过所述目标朝向检测模型对所述待检测模型进行目标检测,并确定检测出的目标对应的目标向量;其中,所述目标向量基于所述检测出的目标的姿态信息确定,所述目标朝向检测模型包括所述检测出的目标的特征与目标区域之间的对应关系,所述目标区域为所述检测出的目标在所述待检测图像中所在的区域;
朝向单元:用于基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息。
一种可能的实施方式,所述朝向单元具体用于确定所述目标向量与所述图像坐标系中预设坐标轴的夹角为所述倾斜参数;响应于所述倾斜参数大于参数阈值,确定所述目标朝向为第一朝向类型;响应于所述倾斜参数小于或等于参数阈值,确定所述目标朝向为第二朝向类型:其中:所述第一朝向类型所对应的所述目标朝向,相对于所述第二朝向类型所对应的目标朝向。
一种可能的实施方式,所述向量单元具体用于提取所述待检测图像的第一特征信息;其中,所述第一特征信息包括所述待检测图像的浅层特征和深层特征,所述浅层特征指示所述目标区域的局部特征,所述深层特征包括所述目标区域的整体特征;融合所述第一特征信息中的所述浅层特征和所述深层特征,得到对应于所述待检测图像的第一融合信息;基于所述第一融合信息,确定所述检测出的目标,以及所述目标向量。
一种可能的实施方式,所述装置还包括训练单元,具体用于获取第一训练图像集;其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量;将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标,及对应于所述第一检测目标的第一检测向量;确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差;基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型。
一种可能的实施方式,所述装置还包括定位单元,具体用于基于所述图像坐标系,确定所述检测出的目标在所述待检测图像中的图像位置信息;基于所述图像位置信息和采集所述待检测图像的图像采集设备的图像采集参数,确定所述图像采集设备的转换参数;其中,所述转换参数包括所述图像位置信息,以及由所述图像位置信息经像素坐标系转换所得的像素位置信息;基于所述转换参数,确定所述检测出的目标在物理坐标系中的物理位置信息。
第四方面,本申请提供一种检测目标朝向的装置,包括:
标签单元:用于获取第一训练图像集;其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量;
输入单元:用于将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标及对应于所述第一检测目标的第一检测向量;
误差单元:用于确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差;
调整单元:用于基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到目标朝向检测模型;其中,所述目标朝向检测模型用于确定待检测图像中的待测目标以及所述待测目标的朝向信息。
一种可能的实施方式,所述装置还包括检测单元,具体用于将待检测图像输入所述目标朝向检测模型,确定所述待检测图像中的待测目标以及与所述待测目标对应的目标向量;确定所述目标向量与图像坐标系中设置坐标轴之间的夹角是否大于参考角;若是,则确定所述目标朝向为第一朝向类型;若否,则确定所述目标朝向为第二朝向类型;其中,所述第一朝向类型指示的所述目标朝向相对于所述第二朝向类型指示的所述目标朝向,所述图像坐标系与所述待检测图像关联。
一种可能的实施方式,所述输入单元具体用于提取所述第一训练图像中的训练特征信息;其中,所述训练特征信息包括所述第一训练图像的浅层特征和深层特征;融合所述训练特征信息中的深层特征和浅层特征,得到对应于所述第一训练图像的训练融合信息;基于所述第一标签中第一预设目标的预设位置信息和所述训练融合信息,确定所述第一检测目标和所述第一检测向量。
一种可能的实施方式,所述输入单元还用于基于所述训练融合信息和所述预设位置信息,在所述第一训练图像中确定候选目标,以及所述候选目标所对应的候选向量;基于所述候选目标的置信度,将所述置信度最高的所述候选目标作为第一检测目标;其中,所述候选目标的置信度为,利用所述目标朝向训练模型预测所述候选目标为第一检测目标的可能性;确定所述置信度最高的所述候选目标所对应的候选向量为所述第一检测向量。
一种可能的实施方式,所述误差单元具体用于利用交叉熵损失函数确定所述第一误差,并利用朝向向量损失函数,确定所述第二误差;
则所述调整单元具体用于将所述交叉熵损失函数和第一设置系数的乘积与所述朝向向量损失函数和第二设置系数的乘积叠加,得到总损失函数;基于所述总损失函数,调整所述目标朝向训练模型的参数,直到所述总损失函数的值位于设定范围,得到所述目标朝向检测模型。
一种可能的实施方式,所述朝向向量损失函数为:
一种可能的实施方式,所述装置还包括数据增强单元,具体用于针对至少一张所述第一训练图像和所述第一标签做数据增强处理,得到第二训练图像,以及与所述第二训练图像对应的第二标签;所述第二标签包括所述第二训练图像中第二预设目标对应的第二预设向量;组合所述第二训练图像,所述第二标签和所述第一训练图像集,得到第二训练图像集。
第五方面,本申请提供一种可读存储介质,包括,
存储器,
所述存储器用于存储指令,当所述指令被处理器执行时,使得包括所述可读存储介质的装置完成如第一方面、第二方面及任一种可能的实施方式所述的方法。
第六方面,本申请提供一种电子设备,包括:
存储器,用于存放计算机程序;
处理器,用于执行所述存储器上所存放的计算机程序时,以实现如第一方面、第二方面及任一种可能的实施方式所述的方法。
附图说明
图1为本申请实施例所提供的一种检测目标朝向的方法的流程示意图;
图2为本申请实施例所提供的目标朝向检测模型的结构示意图;
图3为本申请实施例所提供的第一预设向量的示意图;
图4为本申请实施例所提供的一种确定目标朝向检测模型的方法的流程示意图;
图5为本申请实施例所提供的总损失函数的结构示意图;
图6为本申请实施例提供的一种检测目标朝向的装置的结构示意图;
图7为本申请实施例提供的一种确定目标朝向检测模型的装置的结构示意图;
图8为本申请实施例提供的一种检测目标朝向的电子设备的结构示意图。
具体实施方式
针对现有技术中道路中车辆朝向的检测结果不准确的问题,本申请提出一种检测目标朝向的方法:将待检测图像输入朝向检测模型,通过朝向检测模型确定待检测图像中的目标,以及指示该目标姿态信息的向量,并基于该向量确定目标在预设坐标系中的倾斜参数,确定目标的朝向信息。
需要说明的是,当上述目标为机动车辆时,可使用上述检测目标朝向的方法:通过在目标朝向检测模型中直接检测出待检测图像中的车辆,及指示该车辆姿态信息的目标向量,基于该目标向量在图像坐标系中的倾斜参数,即可确定车辆的朝向信息。该方法尤其适用于道路拥挤路段,采集图像中车辆众多,且多辆车辆由于被旁边的车辆遮挡,导致采集图像中仅显现部分车辆信息。针对该道路拥挤场景,通过本申请实施例中所提供的检测目标朝向的方法,可在采集图像中识别出多个车辆,并针对前述部分车辆信息进行处理以确定识别出的多个车辆的朝向。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请的技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参考图1,本申请提出一种检测目标朝向的方法,用以提升道路车辆朝向检测结果的准确性,该方法具体包括以下实现步骤:
步骤101:获取待检测图像,并将所述待检测图像输入目标朝向检测模型。
具体地,本申请实施例提供的朝向检测模型为单阶段检测模型:在一个模型中完成候选区域的选定,及预测目标位置和类别。此处类别指示目标种类。例如,将目标设置为机动车辆,则类别数量为1,类别标签可以是机动车辆。将目标设置为机动车辆和行人,则类别数量为2,类别标签可以是机动车辆、行人。在单阶段模型中候选区域数量为1,不再进行候选区域的选定。图2为本申请实施例提供的目标朝向检测模型的结构示意图。如图2所示,主干网络基于CSPNET(Cross Stage Partial Network,跨阶段局部网络)设置,其中可包括对应不同的参数的卷积层(conv),与之相应的不同参数下的瓶颈网络(即跨阶段局部瓶颈模块,BottleneckCSP)和快速空间金字塔池化模块(Spatial Pyramid Pooling-Fast,SPPF)。瓶颈模块可基于FPN(Feature Pyramid Networks,特征金字塔网络)+PAN(PixelAggregation Network,像素聚合网络)设置,其中可包括基于通道数设置的拼接层、上采样层、卷积层、跨阶段局部瓶颈模块。检测头模块主要基于设定数量(图2中的设定数量为3)的特征尺度上的训练图像,输出结果。上述主干网络还可以基于BIFPN网络(BidirectionalFeature Pyramid Network, 加权双向特征金字塔网络),EfficientLite网络(即轻量网络)、PP-PicoDet 网络设置。
上述待检测模型可通过以下方式训练得到:
首先,获取第一训练图像集。其中,第一训练图像集包括一训练图像与第一标签的一一对应关系,第一标签包括第一训练图像中第一预设目标对应的第一预设向量。然后,将第一训练图像集输入目标朝向训练模型,以得到第一检测目标,及对应于第一检测目标的第一检测向量。接着就可将上述目标朝向训练模型所确定的第一检测目标、第一检测向量对比第一标签中的相关信息进行学习。也就是说,在朝向训练模型确定第一检测向量和第一检测目标后,可确定第一检测目标与第一预设目标之间的第一误差,及第一检测向量与第一预设向量之间的第二误差。其中,第一误差可以是朝向训练目标所确定的第一检测目标的位置信息(例如,第一检测目标的中心点坐标、第一检测目标的高度、宽度)与第一标签中第一预设目标相应的位置信息之间的偏移量。确定第一误差、第二误差之后,就可基于第一误差、第二误差调整目标朝向训练模型的参数,直到第一误差小于第一阈值,且第二误差小于第二阈值,即可得到训练后的目标朝向检测模型。
上述基于第一误差和第二误差调整目标朝向训练模型参数的过程实际上是,目标朝向训练模型根据第一误差、第二误差确定自身误差,调整参数向第一标签信息看齐,优化自身参数,从而提升检测到的第一检测目标,及第一检测向量准确性的过程。
需要说明的是,为减小朝向训练模型计算量,促使朝向训练模型快速收敛,本申请实施例中设置第一检测向量、第一预设向量为单位向量。
进一步地,可设置损失函数确定第一误差、第二误差,并基于损失函数调整目标朝向训练模型的参数,以进行训练。本申请实施例中,设置交叉熵损失函数确定第一误差,设置朝向向量损失函数确定第二误差。以下针对交叉熵损失函数和朝向向量损失函数进行描述:
本申请实施例设置交叉熵损失函数包括:类别损失函数、IoU损失函数、对象损失函数。其中,类别损失函数用于朝向训练模型识别出预设目标类别的第一检测目标。例如,预设目标类别为机动车辆,则目标朝向检测模型仅针对机动车辆作为第一检测目标进行学习,而将其它(干扰)目标(例如,行人、树木)作为背景。IoU损失函数可用于朝向训练模型基于自身识别出的第一检测目标所在检测区域,以及第一标签中第一预设目标所在的预设区域之间的交并比,学习识别第一检测目标的形状。对象损失函数用于朝向训练模型区别同一预设目标类别下的不同第一检测目标。例如,预设目标类别为机动车辆,则对象损失函数可用于朝向训练模型区别不同的机动车辆。具体地,可结合正样本、负样本,使用对象损失函数训练朝向训练模型。
同时,本申请实施例设置朝向向量损失函数确定第二误差。朝向向量损失函数的公式如下:
对于第一检测向量来说,该预设位置可以是对应于第一检测向量的单位检测向量的末端。对于第一预设向量来说,该预设位置可以是对应于第一预设向量的单位预设向量的末端,此时需对上述朝向向量损失函数正则化,以使单位预设向量和单位检测向量的起点重合后,单位预设向量的末端和单位检测向量末端都位于单位圆上,则朝向向量损失函数为:
将上述损失函数与各自的平衡系数相乘后叠加,即可得到总损失函数。该总损失函数可以通过下式确定:
其中,Lall为总损失函数,l1,l2,l3,l4分别为IoU损失函数(lCloU),类别损失函数(lcls),对象损失函数(lobj)和正则化后的朝向向量损失函数(Lorb)的平衡系数。通过总损失函数调整朝向训练模型的参数,直到总损失函数的值位于设定范围(即收敛),则确定目标朝向训练模型的检测效果达到预期标准,得到训练后的朝向检测模型。
步骤102:通过对所述目标朝向检测模型对所述待检测图像进行目标检测,并确定检测出的目标对应的目标向量。
其中,所述目标向量基于前述检测出的目标的姿态信息确定。目标朝向检测模型包括上述检测出的目标的特征与目标区域特征之间的对应关系,所述目标区域为所述检测出的目标在所述待检测图像中所在的区域。
具体地,基于上述目标朝向检测模型的结构,即可检测出待检测图像中的目标,以及与目标对应的目标向量,以下做具体解释:
首先,基于上述主干网络。提取待检测图像的第一特征信息。其中,第一特征信息包括待检测图像的浅层特征和深层特征。该浅层特征指示上述目标区域(即检测出的目标在待检测图像中所在的区域)的局部特征。该浅层特征可包括检测出的目标的轮廓、棱角、纹理等细粒度信息。深层特征包括目标区域的整体特征,即检测出的目标在待检测图像中所在区域像素点的抽象语义特征。深层特征可包括待检测图像中任一像素点,尤其是检测出的目标所在区域的任一像素点与周围相邻的像素点共同构成的粗粒度的语义信息。
然后,上述主干网络将第一特征信息输入瓶颈模块。基于瓶颈模块,融合待检测图像中第一特征信息中的浅层特征和深层特征,得到对应于待检测图像的第一融合信息。该第一融合信息包括上述目标区域特征。
最后,瓶颈模块将第一融合信息输入检测头模块。检测头模块就可基于第一融合信息,确定对应的检测出的目标,以及目标向量。
针对目标向量,目标朝向检测模型可基于目标向量的横向分量和纵向分量确定/表示。当目标向量为单位向量时,其横向分量dx和纵向分量dy之间存在以下关系:dx2+dy2=1。
步骤103:基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息。
具体地,上述检测图像关联的图像坐标系可以统一设置于待检测图像左上角。其中,y轴垂直于待检测图像中地面且指向地面;x轴与地面平行指向待检测图像右侧。
本申请实施例中设置上述图像坐标系中的x轴为预设坐标轴。因此,可确定目标向
量与图像坐标系中x轴(即预设坐标轴)的夹角为倾斜参数。基于该倾斜参数与参数阈值之
间的大小关系,可确定目标朝向。即,响应于倾斜参数大于参数阈值,确定目标朝向为第一
朝向类型。响应于倾斜参数小于或等于参数阈值,确定目标朝向为第二朝向类型。上述第一
朝向类型和第二朝向类型可不同。进一步地,第一朝向类型所指示的目标朝向可以是,相对
于第二朝向类型所指示的目标朝向。例如,第一朝向类型(相对于图像采集设备的采集角度
来说)为超前,则第二朝向类型可以是朝后。图3为申请实施例所提供的目标向量与预设坐
标轴间夹角的示意图。请参考图3,以下针对前述倾斜参数,即夹角的确定进行描述:
首先,为减小目标朝向模型的计算量,可以设置目标向量为单位向量。然后,就可确定该目标向量与预设坐标轴的夹角。
其中,dy为目标向量在预设坐标系中的纵向分量,dx为目标向量在预设坐标系中的横向分量。
在确定朝向信息以后,还可进一步基于小孔成像原理,结合图像采集设备的转换参数确定检测出的目标的位置,以下进行具体描述:
首先,可基于图像坐标系,确定检测出的目标在待检测图形中的图像位置信息。然后,基于图像位置信息和采集待检测图像的图像采集设备(例如,相机,和/或摄像机)的图像采集参数,确定图像采集设备的转换参数。其中,图像采集参数包括,图像采集设备采集待检测图像时的焦距、分辨率等参数。转换参数包括图像位置信息,以及由图像位置信息经像素坐标系转换所得的像素位置信息。最后,基于转换参数,就可确定检测出的目标在物理坐标系中的物理位置信息。该物理位置信息可以由三维坐标表示。
基于上述步骤101-103所述的检测目标朝向的方法,可通过(单阶段的)目标朝向检测模型,高效且准确地确定目标向量,并基于目标确定相应目标的朝向。并且,由于目标向量可以有多个,多个目标向量互相平行,所以本申请实施例所提供的方法所适用的场景对于采集图像,即待检测图像的要求较低:采集图像(待检测图像)中的目标不需体现目标的全貌。即便是采集图像中目标只体现局部信息,目标检测模型也可根据该局部信息识别出对应的目标,及相应的目标向量。
例如,目标为机动车辆,当道路出现拥堵,针对位于路边的图像采集设备所采集的采集图像使用目标朝向检测模型确定采集图像中的机动车辆的朝向。由于道路拥堵,车辆较多,因而有多辆机动车辆因被相邻的车辆遮挡而仅显现部分信息于采集图像之中,此时,目标朝向检测模型在识别这些机动车辆后,提取这些机动车辆的姿态信息,仍然可根据姿态信息确定目标向量。由此可见,本申请实施例所提供的方法相较于提取车轮贴地点信息判断车辆朝向的方法,适用场景更多,且在多机动车辆场景中能准确确定机动车辆,或其它类型的车辆的朝向。
进一步地,请参考图4,本申请实施例提供一种确定目标朝向检测模型的方法,用于检测待检测图像中待测目标及与待测目标对应的目标向量,以提高确定待检测图像中目标的朝向信息的准确率。
步骤401:获取第一训练图像集。
其中,第一训练图像集包括第一训练图像与第一标签的一一对应关系,第一标签包括第一训练图像中第一预设目标对应的第一预设向量。
具体地,第一训练图像集中,任一训练图像都对应于一个第一标签,该第一标签中可包括多个第一预设向量,该多个预设向量分别对应于前述任一训练图像中的多个第一预设目标,用于指示相应的第一预设目标的朝向。
进一步地,该第一预设向量可通过第一预设向量上,预设位置点的横纵分量(dx,dy)表示。其中,dx和dy之间的关系是:dx2+dy2=1。
因而该预设位置可以是第一预设向量上横坐标、纵坐标平方和为1的坐标点。即对应于图像坐标系,以第一预设向量起点作为原点,以该原点为圆心确定单位圆,第一预设向量与该单位圆的交点位置即为预设位置。
请继续参考图3,该第一预设向量由(0,0)指向(dx,dy)。根据该第一预设向量就可确定目标的朝向角θ,进而确定目标的朝向。实际上,第一预设向量可位于第一预设目标所在区域的任意位置,同时任一第一预设目标可对应于多个第一预设向量,这些第一预设向量之间互相平行。
进一步地,第一标签中还可包括第一预设目标的位置信息(例如,第一预设目标区域所在的中心点坐标,该目标区域的宽、高)。
在确定第一训练图像集以后,可进一步通过丰富样本数据,增强目标朝向训练模型的鲁棒性。具体地,首先,针对至少一张第一训练图像和第一标签做数据增强处理,得到第二训练图像,以及对应于第二训练图像的第二标签。其中,第二标签包括第二训练图像中第二预设目标的对应的第二预设向量。然后就可将第二训练图像、第二标签以及第一训练图像集组合,得到第二训练图像集。上述第二训练图像集中,任一预设目标(第一预设目标或第二预设目标)都对应于一个标签(第一标签或第二标签),该标签包括指示前述预设目标朝向的预设向量,位置坐标等信息。其中,第一预设向量指示第一训练图像上预设目标的朝向,当第一训练图像经数据增强处理得到第二训练图像后,相应地,第一预设目标同时转换为第二预设目标。
也就是说,当上述数据增强处理为翻转时,则针对任一第一训练图像及第一预设向量同时做翻转(例如,翻转180度)的处理,所得到的第二训练图像和第二预设向量。当上述数据增强处理为马赛克(Mosaic)时,则针对多张第一训练图像进行随机裁剪后拼接,得到的第二训练图像和第二预设向量。当上述数据增强处理为裁剪时,则可针对任一第一训练图像,随机的裁剪部分区域,并将该裁剪区域填充0像素值,得到的第二训练图像和第二预设向量。上述数据增强处理可以是翻转、马赛克(Mosaic)、裁剪中的任意组合。
在得到第二训练图像集之后,也可输入目标朝向训练模型,由于目标朝向训练模型所学习的训练数据更为丰富,因而结合第二训练图像集,可取得更为稳定、准确的训练结果。
步骤402:将第一训练图像集输入目标朝向训练模型,得到第一检测目标及对应于第一检测目标的第一检测向量。
具体地,请继续参考图2,目标朝向训练模型的结构与图2所示的目标朝向检测模型结构一致。目标朝向训练模型由以下三部分组成:主干网络,瓶颈(Neck)模块、检测头(head)模块。主干网络基于CSPNET(Cross Stage Partial Network,跨阶段局部网络)设置,其中包括对应不同的参数的卷积层(conv)和与之相应的不同参数下的瓶颈网络。瓶颈模块可基于FPN(Feature Pyramid Networks,特征金字塔网络)+PAN(Pixel AggregationNetwork,像素聚合网络)设置,检测头模块主要基于设定数量(图3中的设定数量为3)的特征尺度上的训练图像,输出结果。上述主干网络还可以基于BIFPN网络(BidirectionalFeature Pyramid Network, 加权双向特征金字塔网络),EfficientLite网络(即轻量网络)、PP-PicoDet 网络设置。
请继续参考图2,检测头模块中na表示针对第一训练图像上每个特征点所使用的锚框数量,每个锚框的长宽比不同,每个锚框的具体尺寸可根据前述特征尺度确定。本申请实施例中设置三种特征尺度,分别为原图的1/8,1/16,1/32。检测头模块中的nc表示预测的类别。检测头模块中的5指示每个锚框所要确定/学习预设目标的信息数量,本申请实施例中设置5表示需要学习以下5个目标信息:第一预设目标的位置坐标(横坐标、纵坐标),第一预设目标在图像中的长度、宽度,以及当前锚框对应像素点是否存在目标。
进一步地,本申请实施例基于上述目标朝向训练模型,确定以检测目标及第一检测向量的方法如下:首先,利用其中的主干网络提取第一训练图像中的特征信息。其中,特征信息包括第一训练图像的浅层特征和深层特征。上述浅层特征可以是第一训练图像中第一预设目标的轮廓、棱角、纹理等细粒度信息。深层特征可以是第一训练图像中任一像素点,尤其是第一预设目标所在区域的任一像素点与周围相邻的像素点共同构成的粗粒度的语义信息。然后,使用目标朝向训练模型中的瓶颈模块将第一训练图像的深层特征和浅层特征融合,得到对应于第一训练图像的融合信息。接着就可利用检测头模块处理该融合信息,以确定第一检测目标以及第一检测向量。该第一检测向量指示第一检测目标的朝向。
进一步地,在检测头模块中确定第一检测目标以及第一检测向量时,结合第一标签中第一预设目标的预设位置信息进行确定。以下做具体描述:
首先,基于融合信息和预设位置信息,在所述第一训练图像中确定候选目标。上述融合信息包括第一训练图像中每一个像素点(即特征点)的信息。因而本申请实施例中的检测头模块,可通过不同长宽比(本申请实施例中设置3种不同长宽比)的锚框,在每个特征点上确定当前锚框(不同长宽比的锚框)与第一预设目标的偏移。即第一训练图像的每个特征点上,使用不同长宽比的锚框确定该特征点是否为第一预设目标所在区域的特征点,以及该特征点与第一标签中第一预设目标位置坐标之间的偏移量。一般地,该位置坐标为第一预设目标的中心点坐标。因此,上述偏移量实际上是指锚框中心点(即对应于第一训练图像上特征点的映射坐标)与第一预设目标的中心点坐标间的偏移量。此处锚框作为先验框,可通过对第一标签聚类等无监督学习获得。
基于上述方法,结合多个特征尺寸(例如,原图1/8 ,1/16,1/32)下的第一训练图像,就可确定任一锚框中心点与第一训练图像中第一预设目标中心坐标的偏移量,以及第一标签中第一预设目标位置的高度、宽度(w,h)相对于该任一锚框的缩放系数。进一步地,就可基于目标朝向训练模型结合偏移量以及缩放系数下的锚框的长宽比,学习识别第一标签所对应的第一检测目标以及第一检测向量,进而可确定第一训练图像中的候选目标,该候选目标的位置信息,置信度,以及与候选目标对应的候选向量。其中,置信度为利用目标朝向训练模型所预测的当前候选目标为第一预设目标的可能性。然后,将置信度最高的候选目标就可作为第一检测目标。相应地,该置信度最高的候选目标的位置信息(即位置坐标)和候选向量作为第一检测目标的位置信息和第一检测向量。也就是说,目标朝向训练模型通过学习锚框与第一预设目标位置信息之间的偏移量,学习第一预设目标的位置信息(即第一预设目标的中心点坐标,第一预设目标所在区域的宽、高),进而达到确定第一检测目标的目的;同时,通过学习第一检测目标区域上特征点和特征点之间的关系,确定第一检测目标的第一检测向量。
进一步地,在基于锚框确定第一检测目标时还可引入正样本、负样本匹配机制。即确定包括第一检测目标的锚框中与第一预设目标所在区域之间的交并比,当交并比大于样本阈值时,确定为正样本;当交并比小于样本阈值时,确定为负样本。
进一步地,对于第一训练图像中包括多个第一检测目标的情况,还需进一步针对候选目标进行筛选,以使得目标朝向训练模型删除无用数据,即排除干扰目标以及干扰向量对于目标朝向训练模型学习效果的影响。本申请实施例中基于非极大值抑制法进一步确定第一训练图像中的所有第一检测目标:首先,根据置信度阈值,删除置信度低于置信度阈值的候选目标。然后,计算剩余每一个候选目标与第一检测目标所在区域的交并比(IoU,Intersection over Union)。当IoU大于重叠阈值时,则确定相应的候选目标为第一检测目标,则删除该候选目标。进而在候选目标中筛选出与第一检测目标非同一预设目标的待选目标。接着确定置信度最高的待选目标为第一预设目标,重复前述确定交并比的步骤进行筛选,就可确定第一训练图像上的多个第一预设目标。
上述基于非极大值抑制法筛选第一检测目标的方法,同样适用于排除任一第一预设目标附近多个干扰目标,该干扰目标实际上对应于该任一检测目标,限于目标朝向检测模型的误差等因素所得。
需要说明的是,如图2所示的检测头模块中nc指示目标类别的数量。因此,当目标只有机动车辆时, nc值为1。当目标种类增加,例如,机动车辆、行人,则需调整nc值为2,使得目标朝向训练模型可学习识别不同目标的特征,即学习在多个目标中识别出机动车辆和行人,以及机动车辆和行人的位置等信息。
步骤403:确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差。
为了目标朝向训练模型更快更好的进行学习,可在检测头模块中设置损失函数,使得目标朝向训练模型所确定的第一检测目标趋近于第一预设目标,同时第一检测向量与第一预设向量逐渐平行,并趋于重叠。
本申请实施例设置交叉熵损失函数确定第一检测目标与第一预设目标之间的第一误差。具体地,该交叉熵损失函数包括类别损失函数,IoU损失函数,对象损失函数。类别损失函数用于监督目标朝向训练模型在第一训练图像中,相较于其它目标学习识别第一预设目标。例如,第一预设目标为机动车辆,则目标朝向训练模型可基于类别损失函数,在第一训练图像中识别机动车辆,排除行人、宠物等干扰目标。对象损失函数(即置信度损失函数)可用于监督目标朝向训练模型识别不同第一预设目标,即监督目标朝向训练模型所确定的候选目标置信度的准确性,例如,在道路拥挤车道识别出不同的机动车辆。上述类别损失函数和对象损失函数都可基于BCE Loss(Binary CrossEntropyLoss,二分类损失函数)设置。其中类别损失函数为:
其中,Lcls为BCE损失函数,σ(xi)表示目标朝向训练模型确定的分类结果,该分类结果可以是,是/否为机动车辆,yi为类别标签,xi指示相应像素点上的特征值。
上述IoU损失函数用于监督目标朝向训练模型基于第一检测目标与第一预设目标之间的IoU,学习第一预设目标的形状和标签。例如,针对标签为机动车辆的第一预设目标的学习,通过IoU损失函数,目标朝向训练模型就可在学习机动车辆所在区域每一像素点的特征,每一像素点与周围像素点构成的局部特征,整体特征的同时,还关注于机动车辆形状的一致性学习。上述IoU损失函数公式为:
其中,LCIoU为IoU损失函数,IoU为第一检测目标与第一预设目标的交并比,表示第一检测目标和第一预设目标在欧式空间中的距离,c为第一检测目标与
第一预设目标之间的对角线距离,c指示第一检测目标与第一预设目标组成的最小闭包区
域的对角线距离,用于防止IoU损失函数太大导致不容易收敛的情况出现,α为预设权重系
数。
进一步地,为提升目标朝向训练模型所得第一检测向量的准确性,本申请实施例还进一步设置朝向向量损失函数,用于监督目标朝向训练模型对于第一预设向量的学习,即监督目标朝向训练模型所确定的第一检测向量的准确性。该朝向向量的损失函数如下:
其中,C为常数值,;Lvector为所述朝向向量损失函数;w,ε分别为
第一预设超参、第二预设超参。x为所述第一检测向量预设位置与所述第一预设向量所述预
设位置的距离,即第一检测向量上横纵坐标平方和为1的点与第一预设向量上横纵坐标平
方和为1的点之间的距离。
上述朝向向量损失函数为分段函数,因而可使得目标朝向训练模型可在随着第一检测向量与第一预测向量之间差值的减小,进行更为精细化的学习,从而使得目标朝向训练模型对于第一预设向量的学习效果更好,进而得到的第一检测向量更为准确。同时,由于初始阶段并不如后阶段所做的精细化的学习,即通过设置朝向向量损失函数为分段函数,为目标朝向训练模型的不同阶段设置不同阶段的学习目标,因而使得目标朝向训练模型学习效率(即训练效率)更高,即朝向向量损失可快速收敛。
进一步地,结合步骤401所述的,第一标签中第一预设向量位于单位圆。因此,为了保证确定第一预设向量的任一端点位于单位圆上,需针对上述朝向向量损失函数进行正则化,则正则化的朝向向量损失函数为:
基于上述正则化后的朝向向量损失函数,可使得目标朝向训练模型所学习的第一预设向量总是为第一预设目标所在区域内的单位圆上的第一预设向量,进而得到的第一检测向量靠近于第一预设向量,因而也在前述单位圆上,从而避免了第一检测向量在未接收约束的情况下太大,导致出现模型计算量太大的情况。
因此,通过确定上述交叉熵损失,即类别损失,IoU损失,分类损失就可确定第一误差,通过确定上述朝向向量损失函数,就可确定第二误差;优选地,第二误差通过正则化后的朝向向量损失函数确定。
步骤404:基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型。
其中,目标朝向检测模型用于确定待检测图像中的待测目标以及待测目标的朝向信息,因而目标朝向检测模型包括上述待测目标的特征与目标区域特征之间的对应关系,目标区域为上述待测目标在待检测图像中所在的区域。
具体地,第一误差、第二误差可通过以下公式确定:
其中,Lall为将第一误差和第二误差叠加所确定的总损失函数,l1,l2,l3,l4分别为IoU损失函数(lCloU),类别损失函数(lcls),对象损失函数(lobj)和正则化后的朝向向量损失函数(Lorb)的平衡系数。该总损失函数用于监督目标朝向训练模型所确定的第一检测目标和第一检测向量的准确性。该总损失函数的结构可参考图5。基于上述总损失函数,调整目标朝向训练模型的参数,直到总损失函数的值位于设定范围(即收敛),则确定目标朝向训练模型的检测效果达到预期标准,将该目标朝向训练模型作为目标朝向检测模型。
在得到目标朝向检测模型之后,可利用该目标朝向检测模型确定待检测图像中的
待测目标,以及与待测目标对应的目标向量。该目标向量可由待测目标的姿态信息确定。然
后,就可确定该目标向量与图像坐标系中设置坐标轴之间的夹角。具体地,当设置坐标轴为
与待检测图像关联的图像坐标系的x轴时,该夹角可基于以下公式确定:
其中,dy为目标向量的纵向分量,dx为目标向量的横向分量。
最后,确定上述夹角是否大于参考角。若是,则确定目标朝向为第一朝向类型,若否,则确定目标朝向为第二朝向类型。上述第一朝向类型指示的目标朝向相对于第二朝向类型指示的目标朝向。例如,第一朝向类型指示待测目标相对于图像采集设备的目标朝向为超前,则第二朝向类型可以指示待测目标相对于图像采集设备的目标朝向为朝后。
在确定待测目标的朝向以后,还可进一步地根据待测目标的位置信息,结合图像采集设备(例如,相机)的内外参数(即图像采集设备的转换参数),确定待测目标在物理坐标系中的物理坐标,从而确定待测目标在物理坐标系中的位置,从而实现针对待检测图像中的待测目标进行定位的目的。
基于步骤401-404,本申请实施例将包括训练图像,及与训练图像对应的标签作为训练图像集,输入目标朝向训练模型进行训练,使得目标朝向训练模型学习识别训练图像中的目标以及相应的标签,即用于确定待测目标朝向的目标向量。在针对目标朝向模型进行训练得到目标检测模型的过程中,通过目标朝向训练模型所检测出的检测目标与训练图像集中的预设目标之间的第一误差,以及目标擦烘箱训练模型所确定的检测向量与上述标签中对应于前述预设目标的预设向量之间的第二误差,调整目标朝向训练模型的参数,以得到目标朝向检测模型,确保目标朝向检测模型检测结果的准确性,进而可使用目标朝向检测模型直接通过确定待测目标的朝向角,确定待测目标的目标朝向。
基于同一发明构思,本申请实施例中提供一种检测目标朝向的装置,该装置与前述图1所示检测目标朝向的方法对应,该装置的具体实施方式可参见前述方法实施例部分的描述,重复之处不再赘述,参见图6,该装置包括:
图像单元601:用于获取待检测图像,并将所述待检测图像输入目标朝向检测模型。
向量单元602:用于通过所述目标朝向检测模型对所述待检测模型进行目标检测,并确定检测出的目标对应的目标向量;其中,所述目标向量基于所述检测出的目标的姿态信息确定,所述目标朝向检测模型包括所述检测出的目标的特征与目标区域之间的对应关系,所述目标区域为所述检测出的目标在所述待检测图像中所在的区域。
向量单元602具体用于提取所述待检测图像的第一特征信息;其中,所述第一特征信息包括所述待检测图像的浅层特征和深层特征,所述浅层特征指示所述目标区域的局部特征,所述深层特征包括所述目标区域的整体特征;融合所述第一特征信息中的所述浅层特征和所述深层特征,得到对应于所述待检测图像的第一融合信息;基于所述第一融合信息,确定所述检测出的目标,以及所述目标向量。
朝向单元603:用于基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息。
朝向单元603具体用于确定所述目标向量与所述图像坐标系中预设坐标轴的夹角为所述倾斜参数;响应于所述倾斜参数大于参数阈值,确定所述目标朝向为第一朝向类型;响应于所述倾斜参数小于或等于参数阈值,确定所述目标朝向为第二朝向类型;其中,所述第一朝向类型所指示的目标朝向,相对于所述第二朝向类型所对应的目标朝向。
所述检测目标朝向的装置还包括训练单元,具体用于获取第一训练图像集;其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量;将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标,及对应于所述第一检测目标的第一检测向量;确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差;基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型。
所述检测目标朝向的装置还包括定位单元,具体用于基于所述图像坐标系,确定所述检测出的目标在所述待检测图像中的图像位置信息;基于所述图像位置信息和采集所述待检测图像的图像采集设备的图像采集参数,确定所述图像采集设备的转换参数;其中,所述转换参数包括所述图像位置信息,以及由所述图像位置信息经像素坐标系转换所得的像素位置信息;基于所述转换参数,确定所述检测出的目标在物理坐标系中的物理位置信息。
进一步地,本申请实施例中提供一种检测目标朝向的装置,该装置与前述图4所示检测目标朝向的方法对应,该装置的具体实施方式可参见前述方法实施例部分的描述,重复之处不再赘述,参见图7,该装置包括:
标签单元701:用于获取第一训练图像集。
其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量。
所述检测目标朝向的装置还包括增强单元。具体用于针对至少一张所述第一训练图像和所述第一标签做数据增强处理,得到第二训练图像,以及与所述第二训练图像对应的第二标签;所述第二标签包括所述第二训练图像中第二预设目标对应的第二预设向量;组合所述第二训练图像,所述第二标签和所述第一训练图像集,得到第二训练图像集。
输入单元702:用于将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标及对应于所述第一检测目标的第一检测向量。
输入单元702具体用于提取所述第一训练图像中的训练特征信息;其中,所述训练特征信息包括所述第一训练图像的浅层特征和深层特征;融合所述训练特征信息中的深层特征和浅层特征,得到对应于所述第一训练图像的训练融合信息;基于所述第一标签中第一预设目标的预设位置信息和所述训练融合信息,确定所述第一检测目标和所述第一检测向量。
输入单元702还用于基于所述训练融合信息和所述预设位置信息,在所述第一训练图像中确定候选目标,以及所述候选目标所对应的候选向量;基于所述候选目标的置信度,将所述置信度最高的所述候选目标作为第一检测目标;其中,所述候选目标的置信度为,利用所述目标朝向训练模型预测所述候选目标为第一检测目标的可能性;确定所述置信度最高的所述候选目标所对应的候选向量为所述第一检测向量。
误差单元703:用于确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差。
调整单元704:用于基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型;其中,所述目标朝向检测模型用于确定待检测图像中的待测目标以及所述待测目标的朝向信息。
误差单元703具体用于利用交叉熵损失函数确定所述第一误差,并利用朝向向量损失函数,确定所述第二误差;其中,所述朝向向量损失函数为分段损失函数;
则调整单元704具体用于将所述交叉熵损失函数和第一设置系数的乘积与所述朝向向量损失函数和第二设置系数的乘积叠加,得到总损失函数;基于所述总损失函数,调整所述目标朝向训练模型的参数,直到所述总损失函数的值位于设定范围,得到所述目标朝向检测模型。
上述朝向向量损失函数为:
所述检测目标朝向的装置还包括检测单元,具体用于将待检测图像输入所述目标朝向检测模型,确定所述待检测图像中的待测目标以及与所述待测目标对应的目标向量;确定所述目标向量与图像坐标系中设置坐标轴之间的夹角是否大于参考角;若是,则确定所述目标朝向为第一朝向类型;若否,则确定所述目标朝向为第二朝向类型;其中,所述第一朝向类型指示的所述目标朝向相对于所述第二朝向类型指示的所述目标朝向,所述图像坐标系与所述待检测图像关联。
所述检测目标朝向的装置还包括数据增强单元,具体用于针对至少一张所述第一训练图像和所述第一标签做数据增强处理,得到第二训练图像,以及与所述第二训练图像对应的第二标签;所述第二标签包括所述第二训练图像中第二预设目标对应的第二预设向量;组合所述第二训练图像,所述第二标签和所述第一训练图像集,得到第二训练图像集。
基于同一发明构思,本申请实施例还提供一种可读存储介质,包括:
存储器,
所述存储器用于存储指令,当所述指令被处理器执行时,使得包括所述可读存储介质的装置完成如上所述的检测目标朝向的方法。
基于与上述检测目标朝向的方法相同的发明构思,本申请实施例中还提供了一种电子设备,所述电子设备可以实现前述一种检测目标朝向的方法的功能,请参考图8,所述电子设备包括:
至少一个处理器801,以及与至少一个处理器801连接的存储器802,本申请实施例中不限定处理器801与存储器802之间的具体连接介质,图6中是以处理器801和存储器802之间通过总线800连接为例。总线800在图8中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线800可以分为地址总线、数据总线、控制总线等,为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。或者,处理器801也可以称为控制器,对于名称不做限制。
在本申请实施例中,存储器802存储有可被至少一个处理器801执行的指令,至少一个处理器801通过执行存储器802存储的指令,可以执行前文论述检测目标朝向的方法。处理器801可以实现图6-图7所示的装置中各个模块的功能。
其中,处理器801是该装置的控制中心,可以利用各种接口和线路连接整个该控制设备的各个部分,通过运行或执行存储在存储器802内的指令以及调用存储在存储器802内的数据,该装置的各种功能和处理数据,从而对该装置进行整体监控。
在一种可能的设计中,处理器801可包括一个或多个处理单元,处理器801可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器801中。在一些实施例中,处理器801和存储器802可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器801可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的检测目标朝向的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器802作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器802可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等。存储器802是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器802还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
通过对处理器801进行设计编程,可以将前述实施例中介绍的检测目标朝向的方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行图1、图4所示的方法的步骤。如何对处理器801进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:通用串行总线闪存盘(Universal Serial Bus flash disk)、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (16)
1.一种检测目标朝向的方法,其特征在于,包括:
获取待检测图像,并将所述待检测图像输入目标朝向检测模型;
通过所述目标朝向检测模型对所述待检测图像进行目标检测,并确定检测出的目标对应的目标向量;其中,所述目标向量基于所述检测出的目标的姿态信息确定,所述目标朝向检测模型包括所述检测出的目标的特征与目标区域的特征之间的对应关系,所述目标区域为所述检测出的目标在所述待检测图像中所在的区域;
基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息。
2.如权利要求1所述的方法,其特征在于,所述基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息,包括:
确定所述目标向量与所述图像坐标系中预设坐标轴的夹角为所述倾斜参数;
响应于所述倾斜参数大于参数阈值,确定所述目标朝向为第一朝向类型;响应于所述倾斜参数小于或等于参数阈值,确定所述目标朝向为第二朝向类型:其中:
所述第一朝向类型所对应的所述目标朝向,相对于所述第二朝向类型所指示的目标朝向。
3.如权利要求1所述的方法,其特征在于,所述通过所述目标朝向检测模型对所述待检测图像进行目标检测,并确定检测出的目标对应的目标向量,包括:
提取所述待检测图像的第一特征信息;其中,所述第一特征信息包括所述待检测图像的浅层特征和深层特征,所述浅层特征指示所述目标区域的局部特征,所述深层特征包括所述目标区域的整体特征;
融合所述第一特征信息中的所述浅层特征和所述深层特征,得到对应于所述待检测图像的第一融合信息;
基于所述第一融合信息,确定所述检测出的目标,以及所述目标向量。
4.如权利要求1-3任一项所述的方法,其特征在于,所述目标朝向检测模型通过如下方式训练得到:
获取第一训练图像集;其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量;
将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标,及对应于所述第一检测目标的第一检测向量;
确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差;
基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型。
5.如权利要求4所述的方法,其特征在于,所述确定所述检测出的目标的朝向信息之后,还包括:
基于所述图像坐标系,确定所述检测出的目标在所述待检测图像中的图像位置信息;
基于所述图像位置信息和采集所述待检测图像的图像采集设备的图像采集参数,确定所述图像采集设备的转换参数;其中,所述转换参数包括所述图像位置信息,以及由所述图像位置信息经像素坐标系转换所得的像素位置信息;
基于所述转换参数,确定所述检测出的目标在物理坐标系中的物理位置信息。
6.一种确定目标朝向检测模型的方法,其特征在于,包括:
获取第一训练图像集;其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量;
将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标及对应于所述第一检测目标的第一检测向量;
确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差;
基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型;其中,所述目标朝向检测模型用于确定待检测图像中的待测目标以及所述待测目标的朝向信息。
7.如权利要求6所述的方法,其特征在于,所述得到训练后的目标朝向检测模型之后,还包括:
将待检测图像输入所述目标朝向检测模型,确定所述待检测图像中的待测目标以及与所述待测目标对应的目标向量;
确定所述目标向量与图像坐标系中设置坐标轴之间的夹角是否大于参考角;若是,则确定所述目标朝向为第一朝向类型;若否,则确定所述目标朝向为第二朝向类型;其中,所述第一朝向类型指示的所述目标朝向相对于所述第二朝向类型指示的所述目标朝向,所述图像坐标系与所述待检测图像关联。
8.如权利要求6所述的方法,其特征在于,所述将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标及对应于所述第一检测目标的第一检测向量,包括:
提取所述第一训练图像中的训练特征信息;其中,所述训练特征信息包括所述第一训练图像的浅层特征和深层特征;
融合所述训练特征信息中的深层特征和浅层特征,得到对应于所述第一训练图像的训练融合信息;
基于所述第一标签中第一预设目标的预设位置信息和所述训练融合信息,确定所述第一检测目标和所述第一检测向量。
9.如权利要求6-8任一项所述的方法,其特征在于,所述基于所述第一标签中第一预设目标的预设位置信息和所述训练融合信息,确定所述第一检测目标和所述第一检测向量,包括:
基于所述训练融合信息和所述预设位置信息,在所述第一训练图像中确定候选目标,以及所述候选目标所对应的候选向量;
基于所述候选目标的置信度,将所述置信度最高的所述候选目标作为第一检测目标;其中,所述候选目标的置信度为,利用所述目标朝向训练模型预测所述候选目标为第一检测目标的可能性;
确定所述置信度最高的所述候选目标所对应的候选向量为所述第一检测向量。
10.如权利要求6所述的方法,其特征在于,所述确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差,包括:
利用交叉熵损失函数确定所述第一误差,并利用朝向向量损失函数,确定所述第二误差;
则所述基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到训练后的目标朝向检测模型,包括:
将所述交叉熵损失函数和第一设置系数的乘积与所述朝向向量损失函数和第二设置系数的乘积叠加,得到总损失函数;
基于所述总损失函数,调整所述目标朝向训练模型的参数,直到所述总损失函数的值位于设定范围,得到所述目标朝向检测模型。
12.如权利要求6所述的方法,其特征在于,所述获取第一图像训练集之后,还包括:
针对至少一张所述第一训练图像和所述第一标签做数据增强处理,得到第二训练图像,以及与所述第二训练图像对应的第二标签;所述第二标签包括所述第二训练图像中第二预设目标对应的第二预设向量;
组合所述第二训练图像,所述第二标签和所述第一训练图像集,得到第二训练图像集。
13.一种检测目标朝向的装置,其特征在于,包括:
图像单元:用于获取待检测图像,并将所述待检测图像输入目标朝向检测模型;
向量单元:用于通过所述目标朝向检测模型对所述待检测模型进行目标检测,并确定检测出的目标对应的目标向量;其中,所述目标向量基于所述检测出的目标的姿态信息确定,所述目标朝向检测模型包括所述检测出的目标的特征与目标区域之间的对应关系,所述目标区域为所述检测出的目标在所述待检测图像中所在的区域;
朝向单元:用于基于所述目标向量在所述待检测图像关联的图像坐标系中的倾斜参数,确定所述检测出的目标的朝向信息。
14.一种检测目标朝向的装置,其特征在于,包括:
标签单元:用于获取第一训练图像集;其中,所述第一训练图像集包括第一训练图像与第一标签的一一对应关系,所述第一标签包括所述第一训练图像中第一预设目标对应的第一预设向量;
输入单元:用于将所述第一训练图像集输入目标朝向训练模型,得到第一检测目标及对应于所述第一检测目标的第一检测向量;
误差单元:用于确定所述第一检测目标与所述第一预设目标之间的第一误差,及所述第一检测向量与所述第一预设向量之间的第二误差;
调整单元:用于基于所述第一误差和所述第二误差,调整所述目标朝向训练模型的参数,直到所述第一误差小于第一阈值,且所述第二误差小于第二阈值,得到目标朝向检测模型;其中,所述目标朝向检测模型用于确定待检测图像中的待测目标以及所述待测目标的朝向信息。
15.一种可读存储介质,其特征在于,包括,
存储器,
所述存储器用于存储指令,当所述指令被处理器执行时,使得包括所述可读存储介质的装置完成如权利要求 1-12中任一项所述的方法。
16.一种电子设备,其特征在于,包括:
存储器,用于存放计算机程序;
处理器,用于执行所述存储器上所存放的计算机程序时,以实现如权利要求1-12中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210807161.6A CN114898306B (zh) | 2022-07-11 | 2022-07-11 | 一种检测目标朝向的方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210807161.6A CN114898306B (zh) | 2022-07-11 | 2022-07-11 | 一种检测目标朝向的方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114898306A true CN114898306A (zh) | 2022-08-12 |
CN114898306B CN114898306B (zh) | 2022-10-28 |
Family
ID=82730282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210807161.6A Active CN114898306B (zh) | 2022-07-11 | 2022-07-11 | 一种检测目标朝向的方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114898306B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115631464A (zh) * | 2022-11-17 | 2023-01-20 | 北京航空航天大学 | 面向大时空目标关联的行人立体表示方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232317A (zh) * | 2020-12-14 | 2021-01-15 | 智道网联科技(北京)有限公司 | 用于目标朝向识别的目标检测方法及装置、设备及介质 |
CN113177503A (zh) * | 2021-05-13 | 2021-07-27 | 中国人民解放军陆军炮兵防空兵学院 | 基于yolov5的任意朝向目标十二参数检测方法 |
CN113643355A (zh) * | 2020-04-24 | 2021-11-12 | 广州汽车集团股份有限公司 | 一种目标车辆位置和朝向的检测方法、系统及存储介质 |
US20220016998A1 (en) * | 2018-11-06 | 2022-01-20 | Nissan Motor Co., Ltd. | Occupant posture control method and occupant posture control device |
EP4012653A1 (en) * | 2020-12-09 | 2022-06-15 | Toyota Jidosha Kabushiki Kaisha | Depth-map prediction method; computer program, readable medium, system and mobile machine for implementing the method |
-
2022
- 2022-07-11 CN CN202210807161.6A patent/CN114898306B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220016998A1 (en) * | 2018-11-06 | 2022-01-20 | Nissan Motor Co., Ltd. | Occupant posture control method and occupant posture control device |
CN113643355A (zh) * | 2020-04-24 | 2021-11-12 | 广州汽车集团股份有限公司 | 一种目标车辆位置和朝向的检测方法、系统及存储介质 |
EP4012653A1 (en) * | 2020-12-09 | 2022-06-15 | Toyota Jidosha Kabushiki Kaisha | Depth-map prediction method; computer program, readable medium, system and mobile machine for implementing the method |
CN112232317A (zh) * | 2020-12-14 | 2021-01-15 | 智道网联科技(北京)有限公司 | 用于目标朝向识别的目标检测方法及装置、设备及介质 |
CN113177503A (zh) * | 2021-05-13 | 2021-07-27 | 中国人民解放军陆军炮兵防空兵学院 | 基于yolov5的任意朝向目标十二参数检测方法 |
Non-Patent Citations (2)
Title |
---|
HAOYUAN GUO等: "A Rotational Libra R-CNN Method for Ship Detection", 《IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING》 * |
张富凯等: "基于改进YOLOv3的快速车辆检测方法", 《计算机工程与应用》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115631464A (zh) * | 2022-11-17 | 2023-01-20 | 北京航空航天大学 | 面向大时空目标关联的行人立体表示方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114898306B (zh) | 2022-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111027493B (zh) | 一种基于深度学习多网络软融合的行人检测方法 | |
CN108388879B (zh) | 目标的检测方法、装置和存储介质 | |
CN113468967B (zh) | 基于注意力机制的车道线检测方法、装置、设备及介质 | |
KR101848019B1 (ko) | 차량 영역 검출을 통한 차량 번호판 검출 방법 및 장치 | |
CN112287860B (zh) | 物体识别模型的训练方法及装置、物体识别方法及系统 | |
US8773535B2 (en) | Adaptation for clear path detection using reliable local model updating | |
CN110378837B (zh) | 基于鱼眼摄像头的目标检测方法、装置和存储介质 | |
US10685212B2 (en) | Three dimensional (3d) object detection | |
CN108009543A (zh) | 一种车牌识别方法及装置 | |
CN108805016B (zh) | 一种头肩区域检测方法及装置 | |
CN111178245A (zh) | 车道线检测方法、装置、计算机设备和存储介质 | |
CN112507862B (zh) | 基于多任务卷积神经网络的车辆朝向检测方法及系统 | |
US8681222B2 (en) | Adaptation for clear path detection with additional classifiers | |
CN105046278B (zh) | 基于Haar特征的Adaboost检测算法的优化方法 | |
CN112287859A (zh) | 物体识别方法、装置和系统,计算机可读存储介质 | |
US20070223785A1 (en) | Image processor and method | |
CN112395962A (zh) | 数据增广方法及装置、物体识别方法及系统 | |
CN115147328A (zh) | 三维目标检测方法及装置 | |
CN114898306B (zh) | 一种检测目标朝向的方法、装置及电子设备 | |
CN115620022A (zh) | 一种对象检测方法、装置、设备及存储介质 | |
CN111062347A (zh) | 一种自动驾驶中交通要素分割方法、电子设备及存储介质 | |
CN116778262B (zh) | 一种基于虚拟点云的三维目标检测方法和系统 | |
CN111144361A (zh) | 一种基于二值化cgan网络的公路车道检测方法 | |
Tourani et al. | Challenges of video-based vehicle detection and tracking in intelligent transportation systems | |
CN114332814A (zh) | 一种停车框识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |