CN112101183A - 车辆识别方法及装置、电子设备及存储介质 - Google Patents

车辆识别方法及装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112101183A
CN112101183A CN202010947349.1A CN202010947349A CN112101183A CN 112101183 A CN112101183 A CN 112101183A CN 202010947349 A CN202010947349 A CN 202010947349A CN 112101183 A CN112101183 A CN 112101183A
Authority
CN
China
Prior art keywords
feature data
loss
feature
image
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010947349.1A
Other languages
English (en)
Other versions
CN112101183B (zh
Inventor
何智群
武伟
朱铖恺
闫俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sensetime Technology Co Ltd
Original Assignee
Shenzhen Sensetime Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sensetime Technology Co Ltd filed Critical Shenzhen Sensetime Technology Co Ltd
Priority to CN202010947349.1A priority Critical patent/CN112101183B/zh
Priority to CN202111056820.9A priority patent/CN113780165A/zh
Publication of CN112101183A publication Critical patent/CN112101183A/zh
Priority to PCT/CN2020/140315 priority patent/WO2022052375A1/zh
Priority to KR1020217042600A priority patent/KR20220035335A/ko
Priority to JP2021575043A priority patent/JP2023501028A/ja
Priority to TW110126129A priority patent/TW202221567A/zh
Application granted granted Critical
Publication of CN112101183B publication Critical patent/CN112101183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请公开了一种车辆识别方法及装置、电子设备及存储介质。该方法包括:获取包含第一待识别车辆的待处理图像;对所述待处理图像进行第一特征提取处理,得到包括所述第一待识别车辆的局部特征信息的第一特征数据;对所述待处理图像进行第二特征提取处理,得到包括所述第一待识别车辆的全局特征信息的第二特征数据;对所述第一特征数据和所述第二特征数据进行融合处理,得到所述第一待识别车辆的第三特征数据;所述第三特征数据用于获得所述第一待识别车辆的识别结果。

Description

车辆识别方法及装置、电子设备及存储介质
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种车辆识别方法及装置、电子设备及存储介质。
背景技术
随着现代社会车辆数量越来越多,各种交通问题接踵而至。在这种情况下,车辆重识别逐渐被人广泛研究。车辆识别是指确定两张图像中的车辆是否为同一辆车。
目前的车辆识别方法通过分别从两张图像中提取出车辆的特征,得到两个车辆特征数据,并通过对两个车辆特征数据进行比对确定两张图像中的车辆是否是同一辆车。但通过目前的车辆识别方法提取得到的车辆特征数据所包括的信息的准确度不高。
发明内容
本申请提供一种车辆识别方法及装置、电子设备及存储介质。
第一方面,提供了一种车辆识别方法,所述方法包括:
获取包含第一待识别车辆的待处理图像;
对所述待处理图像进行第一特征提取处理,得到包括所述第一待识别车辆的局部特征信息的第一特征数据;
对所述待处理图像进行第二特征提取处理,得到包括所述第一待识别车辆的全局特征信息的第二特征数据;
对所述第一特征数据和所述第二特征数据进行融合处理,得到所述第一待识别车辆的第三特征数据;所述第三特征数据用于获得所述第一待识别车辆的识别结果。
结合本申请任一实施方式,所述局部特征信息包括关键点特征信息,所述第一特征数据包括所述待识别车辆的至少一个关键点的特征信息。
结合本申请任一实施方式,所述局部特征信息还包括局部像素点区域特征信息,所述第一特征数据还包括所述待识别车辆的至少一个局部像素点区域的特征信息。
结合本申请任一实施方式,所述对所述待处理图像进行第一特征提取处理,得到包括所述第一待识别车辆的局部特征信息的第一特征数据,包括:
对所述待处理图像进行第三特征提取处理,得到第四特征数据;所述第四特征数据包括所述第一待识别车辆的至少一个关键点的特征信息;
对所述待处理图像进行第四特征提取处理,得到第五特征数据;所述第五特征数据包括所述第一待识别车辆的至少一个局部像素点区域的特征信息;所述局部像素点区域属于所述第一待识别车辆所覆盖的像素点区域,且所述局部像素点区域的面积小于所述第一待识别车辆所覆盖的像素点区域的面积;
对所述第四特征数据和第五特征数据进行融合处理,得到所述第一特征数据。
结合本申请任一实施方式,所述对所述待处理图像进行第三特征提取处理,得到第四特征数据,包括:
对所述待处理图像进行第五特征提取处理,得到至少一个第六特征数据;所述第六特征数据包括所述关键点的特征信息,且任意两个所述第六特征数据所包括的特征信息属于不同的所述关键点;
从所述至少一个第六特征数据中选取包括信息量最多的k个特征数据,得到k个第七特征数据;所述k为不小于1的整数;
依据所述k个第七特征数据得到所述第四特征数据。
结合本申请任一实施方式,所述对所述待处理图像进行第五特征提取处理,得到至少一个第六特征数据,包括:
对所述待处理图像进行第六特征提取处理,得到至少一张第一热力图;所述第一热力图包括所述关键点在所述待处理图像中的位置信息,且任意两张所述第一热力图所包括的信息属于不同的所述关键点;
对所述待处理图像进行第七特征提取处理,得到所述待处理图像的第一特征图像;所述第一特征图像包括所述待处理图像中的关键点的特征信息;
分别确定每张所述第一热力图与所述第一特征图像之间的点积,得到所述至少一个第六特征数据。
结合本申请任一实施方式,所述从所述至少一个第六特征数据中选取包括信息量最多的k个特征数据,得到k个第七特征数据,包括:
对所述至少一个第六特征数据中的特征数据分别进行池化处理,得到至少一个第八特征数据;
依据所述至少一个第八特征数据所包括的信息量,得到至少一个第一概率;所述第一概率用于表征所述第六特征数据所包括的信息量;所述第一概率与所述第六特征数据一一对应;
在所述第一概率与所述第六特征数据所包括的信息量呈正相关的情况下,选取最大的k个所述第一概率所对应的所述第六特征数据,作为所述k个第七特征数据;或,
在所述第一概率与所述第六特征数据所包括的信息量呈负相关的情况下,选取最小的k个所述第一概率所对应的所述第六特征数据,作为所述k个第七特征数据。
结合本申请任一实施方式,所述对所述待处理图像进行第四特征提取处理,得到第五特征数据,包括:
对所述待处理图像进行第十特征提取处理,得到至少一个第九特征数据;所述第九特征数据包括所述关键点的特征信息,且任意两个所述第九特征数据所包括的特征信息属于不同的所述局部像素点区域;
从所述至少两个第九特征数据中选取包含信息量最多的m个特征数据,得到m个第十特征数据;所述m为不小于1的整数;
依据所述m个第十特征数据得到所述第五特征数据。
结合本申请任一实施方式,所述对所述待处理图像进行第十特征提取处理,得到至少一个第九特征数据,包括:
对所述待处理图像进行第十一特征提取处理,得到所述至少一张第二热力图;所述第二热力图包括所述局部像素点区域在所述待处理图像中的位置信息,且任意两张所述第二热力图所包括的信息属于不同的所述局部像素点区域;
对所述待处理图像进行第十二特征提取处理,得到所述待处理图像的第二特征图像;所述第二特征图像包括所述待处理图像中的局部像素点区域的特征信息;
分别确定每张所述第二热力图与所述第二特征图像之间的点积,得到所述至少一个第九特征数据。
结合本申请任一实施方式,所述从所述至少两个第九特征数据中选取包含信息量最多的m个特征数据,得到m个第十特征数据,包括:
对所述第九特征数据中的特征数据分别进行池化处理,得到至少一个第十一特征数据;
依据所述至少一个第十一特征数据所包括的信息量,得到至少一个第二概率;所述第二概率用于表征所述第九特征数据中包括的信息量;所述第二概率与所述第九特征数据一一对应;
在所述第二概率与所述第九特征数据所包括的信息量呈正相关的情况下,选取最大的m个所述第二概率所对应的所述第九特征数据,作为所述m个第十特征数据;或,
在所述第二概率与所述第九特征数据所包括的信息量呈负相关的情况下,选取最小的m个所述第二概率所对应的所述第九特征数据,作为所述m个第十特征数据。
结合本申请任一实施方式,所述至少一个局部像素点区域包括:第一像素点区域和第二像素点区域,所述第九特征数据的数量和所述m均大于1,所述m个第十特征数据包括:第十二特征数据和第十三特征数据,所述第十二特征数据包括所述第一像素点区域的特征信息,所述第十三特征数据包括所述第二像素点区域的特征信息;
所述依据所述m个第十特征数据得到所述第五特征数据,包括:
依据所述第十二特征数据所包括的信息量得到第一权重,依据所述第十三特征数据所包括的信息量得到第二权重;所述第一权重与所述第十二特征数据所包括的信息量呈正相关,所述第二权重与所述第十三特征数据所包括的信息量呈正相关;
依据所述第一权重和所述第二权重,对所述第十二特征数据和所述第十三特征数据进行加权融合,得到所述第五特征数据。
结合本申请任一实施方式,所述车辆识别方法应用于车辆识别网络,所述车辆识别网络的训练方法包括:
获取包含第二待识别车辆的训练图像和待训练网络;
使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的全局特征信息的第十四特征数据和包括所述第二待识别车辆的关键点特征信息的第十五特征数据;
依据所述第十四特征数据和所述训练图像的标签,得到第一全局损失;
依据所述第十五特征数据和所述标签,得到第一关键点损失;
依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失;
基于所述总损失调整所述待训练网络的参数,得到所述车辆识别网络。
结合本申请任一实施方式,在所述依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失之前,所述方法还包括:
使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的局部像素点区域的特征信息的第十六特征数据;
依据所述第十六特征数据和所述标签,得到第一局部像素点区域损失;
所述依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失,包括:
依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失。
结合本申请任一实施方式,所述使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的关键点特征信息的第十五特征数据,包括:
使用所述待训练网络对所述训练图像进行处理,得到至少一个第十七特征数据;所述第十七特征数据包括所述第二待识别车辆的关键点特征信息,且任意两个所述第十七特征数据所包括的特征信息属于不同的所述关键点;
从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到s个第十八特征数据;所述s为不小于1的整数;
对所述s个第十八特征数据进行融合处理,得到所述第十五特征数据。
结合本申请任一实施方式,在所述依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失之前,所述方法还包括:
依据所述s个第十八特征数据,得到所述第二待识别车辆的s个第一识别结果;
分别依据所述s个第一识别结果与所述标签之间的差异,得到关键点类别损失;
所述依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失,包括:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失。
结合本申请任一实施方式,所述从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到s个第十八特征数据,包括:
依据所包括的信息量对所述至少一个第十七特征数据进行排序,得到第一顺序;所述第一顺序为所包括的信息量从大到小的顺序,所述第一顺序或为所包括的信息量从小到大的顺序;
依据所述第一顺序从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到所述s个第十八特征数据;
在所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失之前,所述方法还包括:
依据所对应的所述关键点类别损失对所述s个第一识别结果进行排序,得到第二顺序;所述第二顺序为所述关键点类别损失从大到小的顺序,所述第二顺序或为所述关键点类别损失从小到大的顺序;
依据所述第一顺序和所述第二顺序之间的差异,得到关键点排序损失;
所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失,包括:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失。
结合本申请任一实施方式,所述使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的局部像素点区域的特征信息的第十六特征数据,包括:
使用所述待训练网络对所述训练图像进行处理,得到至少一个第十九特征数据;所述第十九特征数据包括所述局部像素点区域的特征信息,且任意两个所述第十九特征数据所包括的特征信息属于不同的所述局部像素点区域;
从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到p个第二十特征数据;所述p为不小于1的整数;
对所述p个第二十特征数据进行融合处理,得到所述第十六特征数据。
结合本申请任一实施方式,在依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失之前,所述方法还包括:
依据所述p个第二十特征数据,得到所述第二待识别车辆的p个第二识别结果;
分别依据所述p个第二识别结果与所述标签之间的差异,得到局部像素点区域类别损失;
所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失,包括:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失。
结合本申请任一实施方式,所述从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到p个第二十特征数据,包括:
依据所包括的信息量对所述至少一个第十九特征数据进行排序,得到第三顺序;所述第三顺序为所包括的信息量从大到小的顺序,所述第三顺序或为所包括的信息量从小到大的顺序;
依据所述第三顺序从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到所述p个第二十特征数据;
在所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失之前,所述方法还包括:
依据所对应的所述局部像素点区域类别损失对所述p个第二识别结果进行排序,得到第四顺序;所述第四顺序为所述局部像素点区域类别损失从大到小的顺序,所述第四顺序或为所述局部像素点区域类别损失从小到大的顺序;
依据所述第三顺序和所述第四顺序之间的差异,得到局部像素点区域排序损失;
所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失,包括:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失、所述局部像素点区域类别损失和所述局部像素点区域排序损失,得到所述总损失。
结合本申请任一实施方式,所述第一全局损失包括全局焦点损失;所述依据所述第十四特征数据和所述训练图像的标签,得到第一全局损失,包括:
依据所述第十四特征数据,得到所述第二待识别车辆的第三识别结果;
依据所述第三识别结果和所述标签,得到所述第三识别结果的焦点损失,作为所述全局焦点损失。
结合本申请任一实施方式,所述训练图像属于训练图像集;所述训练图像集还包括所述训练图像的第一正样本图像和所述训练图像的第一负样本图像;所述第一全局损失还包括全局三元组损失;所述方法还包括:
使用所述待训练网络对所述第一正样本图像进行特征提取处理,得到所述第一正样本图像的特征数据;
使用所述待训练网络对所述第一负样本图像进行特征提取处理,得到所述第一负样本图像的特征数据;
依据所述第十二特征数据、所述第一正样本图像的特征数据和所述第一负样本图像的特征数据,得到所述全局三元组损失。
第二方面,提供了一种车辆识别装置,所述装置包括:
获取单元,用于获取包含第一待识别车辆的待处理图像;
第一处理单元,用于对所述待处理图像进行第一特征提取处理,得到包括所述第一待识别车辆的局部特征信息的第一特征数据;
第二处理单元,用于对所述待处理图像进行第二特征提取处理,得到包括所述第一待识别车辆的全局特征信息的第二特征数据;
融合处理单元,用于对所述第一特征数据和所述第二特征数据进行融合处理,得到所述第一待识别车辆的第三特征数据;所述第三特征数据用于获得所述第一待识别车辆的识别结果。
结合本申请任一实施方式,所述局部特征信息包括关键点特征信息,所述第一特征数据包括所述待识别车辆的至少一个关键点的特征信息。
结合本申请任一实施方式,所述局部特征信息还包括局部像素点区域特征信息,所述第一特征数据还包括所述待识别车辆的至少一个局部像素点区域的特征信息。
结合本申请任一实施方式,所述第一处理单元用于:
对所述待处理图像进行第三特征提取处理,得到第四特征数据;所述第四特征数据包括所述第一待识别车辆的至少一个关键点的特征信息;
对所述待处理图像进行第四特征提取处理,得到第五特征数据;所述第五特征数据包括所述第一待识别车辆的至少一个局部像素点区域的特征信息;所述局部像素点区域属于所述第一待识别车辆所覆盖的像素点区域,且所述局部像素点区域的面积小于所述第一待识别车辆所覆盖的像素点区域的面积;
对所述第四特征数据和第五特征数据进行融合处理,得到所述第一特征数据。
结合本申请任一实施方式,所述第一处理单元用于:
对所述待处理图像进行第五特征提取处理,得到至少一个第六特征数据;所述第六特征数据包括所述关键点的特征信息,且任意两个所述第六特征数据所包括的特征信息属于不同的所述关键点;
从所述至少一个第六特征数据中选取包括信息量最多的k个特征数据,得到k个第七特征数据;所述k为不小于1的整数;
依据所述k个第七特征数据得到所述第四特征数据。
结合本申请任一实施方式,所述第一处理单元用于:
对所述待处理图像进行第六特征提取处理,得到至少一张第一热力图;所述第一热力图包括所述关键点在所述待处理图像中的位置信息,且任意两张所述第一热力图所包括的信息属于不同的所述关键点;
对所述待处理图像进行第七特征提取处理,得到所述待处理图像的第一特征图像;所述第一特征图像包括所述待处理图像中的关键点的特征信息;
分别确定每张所述第一热力图与所述第一特征图像之间的点积,得到所述至少一个第六特征数据。
结合本申请任一实施方式,所述第一处理单元用于:
对所述至少一个第六特征数据中的特征数据分别进行池化处理,得到至少一个第八特征数据;
依据所述至少一个第八特征数据所包括的信息量,得到至少一个第一概率;所述第一概率用于表征所述第六特征数据所包括的信息量;所述第一概率与所述第六特征数据一一对应;
在所述第一概率与所述第六特征数据所包括的信息量呈正相关的情况下,选取最大的k个所述第一概率所对应的所述第六特征数据,作为所述k个第七特征数据;或,
在所述第一概率与所述第六特征数据所包括的信息量呈负相关的情况下,选取最小的k个所述第一概率所对应的所述第六特征数据,作为所述k个第七特征数据。
结合本申请任一实施方式,所述第一处理单元用于:
对所述待处理图像进行第十特征提取处理,得到至少一个第九特征数据;所述第九特征数据包括所述关键点的特征信息,且任意两个所述第九特征数据所包括的特征信息属于不同的所述局部像素点区域;
从所述至少两个第九特征数据中选取包含信息量最多的m个特征数据,得到m个第十特征数据;所述m为不小于1的整数;
依据所述m个第十特征数据得到所述第五特征数据。
结合本申请任一实施方式,所述第一处理单元用于:
对所述待处理图像进行第十一特征提取处理,得到所述至少一张第二热力图;所述第二热力图包括所述局部像素点区域在所述待处理图像中的位置信息,且任意两张所述第二热力图所包括的信息属于不同的所述局部像素点区域;
对所述待处理图像进行第十二特征提取处理,得到所述待处理图像的第二特征图像;所述第二特征图像包括所述待处理图像中的局部像素点区域的特征信息;
分别确定每张所述第二热力图与所述第二特征图像之间的点积,得到所述至少一个第九特征数据。
结合本申请任一实施方式,所述第一处理单元用于:
对所述第九特征数据中的特征数据分别进行池化处理,得到至少一个第十一特征数据;
依据所述至少一个第十一特征数据所包括的信息量,得到至少一个第二概率;所述第二概率用于表征所述第九特征数据中包括的信息量;所述第二概率与所述第九特征数据一一对应;
在所述第二概率与所述第九特征数据所包括的信息量呈正相关的情况下,选取最大的m个所述第二概率所对应的所述第九特征数据,作为所述m个第十特征数据;或,
在所述第二概率与所述第九特征数据所包括的信息量呈负相关的情况下,选取最小的m个所述第二概率所对应的所述第九特征数据,作为所述m个第十特征数据。
结合本申请任一实施方式,所述至少一个局部像素点区域包括:第一像素点区域和第二像素点区域,所述第九特征数据的数量和所述m均大于1,所述m个第十特征数据包括:第十二特征数据和第十三特征数据,所述第十二特征数据包括所述第一像素点区域的特征信息,所述第十三特征数据包括所述第二像素点区域的特征信息;
所述第一处理单元用于:
依据所述第十二特征数据所包括的信息量得到第一权重,依据所述第十三特征数据所包括的信息量得到第二权重;所述第一权重与所述第十二特征数据所包括的信息量呈正相关,所述第二权重与所述第十三特征数据所包括的信息量呈正相关;
依据所述第一权重和所述第二权重,对所述第十二特征数据和所述第十三特征数据进行加权融合,得到所述第五特征数据。
结合本申请任一实施方式,所述车辆识别装置执行的车辆识别方法应用于车辆识别网络,所述获取单元,还用于获取包含第二待识别车辆的训练图像和待训练网络;
所述第一处理单元,还用于使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的全局特征信息的第十四特征数据和包括所述第二待识别车辆的关键点特征信息的第十五特征数据;
所述车辆识别装置还包括:
第三处理单元,用于依据所述第十四特征数据和所述训练图像的标签,得到第一全局损失;
所述第三处理单元,还用于依据所述第十五特征数据和所述标签,得到第一关键点损失;
所述第三处理单元,还用于依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失;
第四处理单元,用于基于所述总损失调整所述待训练网络的参数,得到所述车辆识别网络。
结合本申请任一实施方式,所述第一处理单元,还用于在所述依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失之前,使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的局部像素点区域的特征信息的第十六特征数据;
所述第三处理单元,还用于依据所述第十六特征数据和所述标签,得到第一局部像素点区域损失;
所述第三处理单元,还用于:依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失。
结合本申请任一实施方式,所述第一处理单元,用于:
使用所述待训练网络对所述训练图像进行处理,得到至少一个第十七特征数据;所述第十七特征数据包括所述第二待识别车辆的关键点特征信息,且任意两个所述第十七特征数据所包括的特征信息属于不同的所述关键点;
从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到s个第十八特征数据;所述s为不小于1的整数;
对所述s个第十八特征数据进行融合处理,得到所述第十五特征数据。
结合本申请任一实施方式,所述第三处理单元,还用于在所述依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失之前,依据所述s个第十八特征数据,得到所述第二待识别车辆的s个第一识别结果;
分别依据所述s个第一识别结果与所述标签之间的差异,得到关键点类别损失;
所述第四处理单元,用于:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失。
结合本申请任一实施方式,所述第一处理单元,用于:
依据所包括的信息量对所述至少一个第十七特征数据进行排序,得到第一顺序;所述第一顺序为所包括的信息量从大到小的顺序,所述第一顺序或为所包括的信息量从小到大的顺序;
依据所述第一顺序从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到所述s个第十八特征数据;
所述第三处理单元,用于在所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失之前,依据所对应的所述关键点类别损失对所述s个第一识别结果进行排序,得到第二顺序;所述第二顺序为所述关键点类别损失从大到小的顺序,所述第二顺序或为所述关键点类别损失从小到大的顺序;
依据所述第一顺序和所述第二顺序之间的差异,得到关键点排序损失;
所述第四处理单元,用于:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失。
结合本申请任一实施方式,所述第一处理单元,用于:
使用所述待训练网络对所述训练图像进行处理,得到至少一个第十九特征数据;所述第十九特征数据包括所述局部像素点区域的特征信息,且任意两个所述第十九特征数据所包括的特征信息属于不同的所述局部像素点区域;
从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到p个第二十特征数据;所述p为不小于1的整数;
对所述p个第二十特征数据进行融合处理,得到所述第十六特征数据。
结合本申请任一实施方式,所述第三处理单元,用于在依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失之前,依据所述p个第二十特征数据,得到所述第二待识别车辆的p个第二识别结果;
分别依据所述p个第二识别结果与所述标签之间的差异,得到局部像素点区域类别损失;
所述第四处理单元,用于:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失。
结合本申请任一实施方式,所述第一处理单元,用于:
依据所包括的信息量对所述至少一个第十九特征数据进行排序,得到第三顺序;所述第三顺序为所包括的信息量从大到小的顺序,所述第三顺序或为所包括的信息量从小到大的顺序;
依据所述第三顺序从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到所述p个第二十特征数据;
所述第三处理单元,用于在所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失之前,依据所对应的所述局部像素点区域类别损失对所述p个第二识别结果进行排序,得到第四顺序;所述第四顺序为所述局部像素点区域类别损失从大到小的顺序,所述第四顺序或为所述局部像素点区域类别损失从小到大的顺序;
依据所述第三顺序和所述第四顺序之间的差异,得到局部像素点区域排序损失;
所述第四处理单元,用于:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失、所述局部像素点区域类别损失和所述局部像素点区域排序损失,得到所述总损失。
结合本申请任一实施方式,所述第一全局损失包括全局焦点损失;所述第三处理单元,用于:
依据所述第十四特征数据,得到所述第二待识别车辆的第三识别结果;
依据所述第三识别结果和所述标签,得到所述第三识别结果的焦点损失,作为所述全局焦点损失。
结合本申请任一实施方式,所述训练图像属于训练图像集;所述训练图像集还包括所述训练图像的第一正样本图像和所述训练图像的第一负样本图像;所述第一全局损失还包括全局三元组损失;
所述第三处理单元,还用于:
使用所述待训练网络对所述第一正样本图像进行特征提取处理,得到所述第一正样本图像的特征数据;
使用所述待训练网络对所述第一负样本图像进行特征提取处理,得到所述第一负样本图像的特征数据;
依据所述第十二特征数据、所述第一正样本图像的特征数据和所述第一负样本图像的特征数据,得到所述全局三元组损失。
第三方面,提供了一种电子设备,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
第四方面,提供了一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,使所述处理器执行如上述第一方面及其任意一种可能实现的方式的方法。
第六方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或指令,在所述计算机程序或指令在计算机上运行的情况下,使得所述计算机执行上述第一方面及其任一种可能的实现方式的方法。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
图1为本申请实施例提供的一种车辆识别方法的流程示意图;
图2为本申请实施例提供的一种关键点示意图;
图3为本申请实施例提供的一种局部像素点区域示意图;
图4为本申请实施例提供的一种车辆识别网络的结构示意图;
图5为本申请实施例提供的一种特征提取模块的结构示意图;
图6为本申请实施例提供的一种关键点和局部像素点区域生成模块的结构示意图;
图7为本申请实施例提供的一种联合训练模块的结构示意图;
图8为本申请实施例提供的一种第一演员-评论家的结构示意图;
图9为本申请实施例提供的一种第一打分子模块的结构示意图;
图10为本申请实施例提供的一种第二演员-评论家模块的结构示意图;
图11为本申请实施例提供的一种第二打分子模块的结构示意图;
图12为本申请实施例提供的一种车辆识别装置的结构示意图;
图13为本申请实施例提供的一种车辆识别装置的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了增强工作、生活或者社会环境中的安全性,在各个区域场所内均安装有监控设备。随着人们生活水平的提高,道路上的车辆越来越多,交通事故也越来越多,如何有效的通过监控设备采集的视频流确定车辆(下文将称为目标车辆)的行踪具有重要意义。例如,在追捕肇事逃逸车辆时,使用车辆识别方法对不同摄像头采集到的图像进行处理,可确定肇事逃逸车辆的行踪。
目前的车辆识别方法通过提取出图像中的待确认车辆的整体外观特征信息得到待确认车辆特征,并将待确认车辆的车辆特征与包括目标车辆的整体外观特征信息的目标车辆特征进行比对,得到目标车辆与待确认车辆之间的相似度,其中,整体外观特征包括:车型、颜色。在相似度超过相似度阈值的情况下,确定待确认车辆与目标车辆为同一辆车。
由于仅通过整体外观特征信息判断两辆车是否为同一辆车会带来很大的误差,而通过目前的车辆识别方法从图像中提取出的车辆特征仅包括整体外观特征信息,目前的车辆识别方法的识别准确度低。基于此,本申请实施例提供了一种车辆识别方法,可丰富车辆特征所包括的信息。下面结合本申请实施例中的附图对本申请实施例进行描述。
本申请实施例的执行主体为车辆识别装置。可选的车辆识别装置可以是以下中的一种:手机、服务器、计算机、平板电脑、可穿戴设备。请参阅图1,图1是本申请实施例提供的一种车辆识别方法的流程示意图。
101、获取包含第一待识别车辆的待处理图像。
本申请实施例中,待处理图像包括第一待识别车辆。在一种获取待处理图像的实现方式中,车辆识别装置接收用户通过输入组件输入的待处理图像。上述输入组件包括:键盘、鼠标、触控屏、触控板和音频输入器等。
在另一种获取待处理图像的实现方式中,车辆识别装置接收数据终端发送的待处理图像。上述数据终端可以是以下任意一种:手机、计算机、平板电脑、服务器。
在又一种获取待处理图像的实现方式中,车辆识别装置接收监控摄像头发送的待处理图像。可选的,该监控摄像头部署于道路(包括:高速公路、快速公路、城市公路)。
102、对上述待处理图像进行第一特征提取处理,得到包括上述第一待识别车辆的局部特征信息的第一特征数据。
本申请实施例中,局部特征信息包括车辆的细节特征信息,如:车灯的特征信息、车标的特征信息、车窗的特征信息。
车辆识别装置通过对待处理图像进行第一特征提取处理,可从待处理图像中提取出第一待识别车辆的局部特征信息,得到第一特征数据。
在一种可能实现的方式中,第一特征提取处理可通过第一卷积神经网络实现。通过将带有标注信息的图像作为训练数据,对卷积神经网络进行训练,使训练得到的第一卷积神经网络可完成对待处理图像的第一特征提取处理。训练数据的标注信息可以为图像中的车辆的细节特征信息(如车灯的类型、车标的类别、车窗的类别)。在使用训练数据对卷积神经网络进行训练的过程中,卷积神经网络从训练数据中提取出包括车辆的细节特征信息的特征数据,并依据提取出的特征数据得到车辆细节信息,作为训练结果。使用训练数据的标签监督训练结果可完成卷积神经网络的训练,得到第一卷积神经网络。这样,车辆识别装置可使用第一卷积神经网络对待处理图像进行处理,得到提取出第一待识别车辆的细节特征信息,得到第一特征数据。
在另一种可能实现的方式中,车辆识别装置使用第一卷积核对待处理图像进行卷积处理,提取出待处理图像的包含车辆的细节特征信息的语义信息,得到第一特征数据。
103、对上述待处理图像进行第二特征提取处理,得到包括上述第一待识别车辆的全局特征信息的第二特征数据。
本申请实施例中,车辆的全局特征信息包括车辆的整体外观特征信息。车辆识别装置通过对待处理图像进行第二特征提取处理,可从待处理图像中提取出第一待识别车辆的全局特征信息,得到第二特征数据。
在一种可能实现的方式中,第二特征提取处理可通过第二卷积神经网络实现。通过将带有标注信息的图像作为训练数据,对卷积神经网络进行训练,使训练得到的第二卷积神经网络可完成对待处理图像的第二特征提取处理。训练数据的标注信息可以为图像中的车辆的整体外观特征信息(如车型、车身颜色)。在使用训练数据对卷积神经网络进行训练的过程中,卷积神经网络从训练数据中提取出包括车辆的整体外观特征信息的特征数据,并依据提取出的特征数据得到车辆整体外观信息,作为训练结果。使用训练数据的标签监督训练结果可完成卷积神经网络的训练,得到第二卷积神经网络。这样,车辆识别装置可使用第二卷积神经网络对待处理图像进行处理,得到提取出第一待识别车辆的整体外观特征信息,得到第二特征数据。
在另一种可能实现的方式中,车辆识别装置使用第二卷积核对待处理图像进行卷积处理,提取出待处理图像的包含车辆的整体外观特征信息的语义信息,得到第二特征数据。其中,第一卷积核的参数与第二卷积核的参数不同。
104、对上述第一特征数据和上述第二特征数据进行融合处理,得到上述第一待识别车辆的第三特征数据。
本申请实施例中,第三特征数据用于获得第一待识别车辆的识别结果,其中,识别结果包括第一待识别车辆的身份。例如,车辆识别装置可进一步依据第三特征数据,确定待识别车辆为车辆a。又例如,车辆识别装置将第三特征数据与车辆特征数据库中的特征数据进行比对,确定车辆特征数据库中的目标车辆特征数据与第三特征数据之间的相似度超过相似度阈值。再基于目标车辆特征数据所对应的车辆为车辆b,车辆识别装置可确定第三特征数据所对应的车辆为车辆b,即依据第三特征数据确定的第一待识别车辆的识别结果为车辆b。
车辆识别装置通过对第一特征数据和第二特征数据进行融合处理,可得到既包括第一待识别车辆的全局特征信息又包括第一待识别车辆的局部特征信息的第三特征数据。将第三特征数据作为第一待识别车辆的特征数据,可丰富第一待识别车辆的特征数据所包括的信息。
作为一种可选的实施方式,上述局部特征信息包括关键点特征信息。关键点特征信息包括关键点在待处理图像中的位置、关键点的语义信息。例如,图2所示的关键点6为左前轮胎关键点,关键点6的语义信息包括左前轮胎的信息(如轮胎规格、轮毂尺寸、轮胎品牌)。图2所示的关键点23为后车牌关键点,关键点23的语义信息包括后车牌的信息(如车牌号)。
可选的,本申请实施例中,车辆的关键点的标注方式如图2所示。应理解,图2所示的车型仅为示例,在实际应用中,可依据图2所示的关键点标注方式对任意车型(如泥头车、公交车、卡车)的车辆进行标注。
在一种可能实现的方式中,车辆识别装置通过对待处理图像进行第一特征提取处理,得到包括第一待识别车辆的关键点特征信息的第一特征数据。以图2所示的关键点为例,第一特征数据可包括待识别车辆的左前轮胎关键点的特征信息和后车牌关键点的特征信息。
作为一种可选的实施方式,局部特征信息不仅包括关键点特征信息还包括局部像素点区域特征信息。本申请实施例中,局部像素点区域属于第一待识别车辆所覆盖的像素点区域,且局部像素点区域的面积小于第一待识别车辆所覆盖的像素点区域的面积。例如,在图3中,右侧局部像素点区域包含第一待识别车辆的右侧区域,车头像素点区域包含第一待识别车辆的车头区域。
局部像素点区域特征信息包括局部像素点区域的语义信息。例如,在局部像素点区域包括前车灯所覆盖的像素点区域的情况下,局部像素点区域的语义信息包括:前车灯的型号;在局部像素点区域包括车窗所覆盖的像素点区域的情况下,局部像素点区域的语义信息包括:车窗的类别、透过车窗所能观察到的车内的物件;在局部像素点区域包括前挡风玻璃所覆盖的像素点区域的情况下,局部像素点区域的语义信息包括:前挡风玻璃的类别、透过前挡风玻璃所能观察到的车内的物件、前挡风玻璃上的年检标、年检标在前挡风玻璃上的位置。
在局部特征信息车辆识别装置在执行步骤102的过程中执行以下步骤:
1、对上述待处理图像进行第三特征提取处理,得到第四特征数据。
本申请实施例中,第四特征数据包括第一待识别车辆的至少一个关键点的特征信息。车辆识别装置通过对待处理图像进行第三特征提取处理,可从待处理图像中提取出第一待识别车辆的至少一个关键点的特征信息,得到第四特征数据。
在一种可能实现的方式中,第三特征提取处理可通过第三卷积神经网络实现。通过将带有标注信息的图像作为训练数据,对卷积神经网络进行训练,使训练得到的第三卷积神经网络可完成对待处理图像的第三特征提取处理。训练数据的标注信息可以为图像中的车辆的关键点特征信息(如关键点的位置、关键点的语义信息)。在使用训练数据对卷积神经网络进行训练的过程中,卷积神经网络从训练数据中提取出包括车辆的关键点特征信息的特征数据,并依据提取出的特征数据得到关键点特征信息,作为训练结果。使用训练数据的标签监督训练结果可完成卷积神经网络的训练,得到第三卷积神经网络。这样,车辆识别装置可使用第三卷积神经网络对待处理图像进行处理,得到提取出第一待识别车辆的关键点特征信息,得到第四特征数据。
在另一种可能实现的方式中,车辆识别装置使用第三卷积核对待处理图像进行卷积处理,提取出待处理图像的包含车辆的整体外观特征信息的语义信息,得到第四特征数据。其中,第三卷积核的参数与第一卷积核的参数不同,第三卷积核的参数与第二卷积核的参数也不同。
2、对上述待处理图像进行第四特征提取处理,得到第五特征数据。
本申请实施例中,第五特征数据包括第一待识别车辆的至少一个局部像素点区域的特征信息。
在一种可能实现的方式中,第四特征提取处理可通过第四卷积神经网络实现。通过将带有标注信息的图像作为训练数据,对卷积神经网络进行训练,使训练得到的第四卷积神经网络可完成对待处理图像的第四特征提取处理。训练数据的标注信息可以为图像中的车辆的局部像素点区域的特征信息。在使用训练数据对卷积神经网络进行训练的过程中,卷积神经网络从训练数据中提取出包括车辆的局部像素点区域的特征信息的特征数据,并依据提取出的特征数据得到局部像素点区域的特征信息,作为训练结果。使用训练数据的标签监督训练结果可完成卷积神经网络的训练,得到第四卷积神经网络。这样,车辆识别装置可使用第四卷积神经网络对待处理图像进行处理,得到提取出第一待识别车辆的局部像素点区域的特征信息,得到第五特征数据。
在另一种可能实现的方式中,车辆识别装置使用第四卷积核对待处理图像进行卷积处理,提取出待处理图像的第一待识别车辆的局部像素点区域的特征信息,得到第五特征数据。其中,第四卷积核的参数与第一卷积核的参数、第二卷积核的参数、第三卷积核的参数均不同。
3、对上述第四特征数据和第五特征数据进行融合处理,得到上述第一特征数据。
由于局部像素点区域的特征信息包含局部像素点区域的语义信息,而在图像中相邻像素点之间存在相关性(此处的相关性包括语义相关性),通过将局部像素点区域的语义信息与关键点特征信息融合,可丰富车辆的细节特征信息。
车辆识别装置通过对第四特征数据和第五特征数据进行融合处理,将第一待识别车辆的关键点特征信息与第一待识别车辆的局部像素点区域的特征信息融合,丰富第一待识别车辆的细节特征信息,得到第一特征数据。
作为一种可选的实施方式,车辆识别装置在执行步骤1的过程中执行以下步骤:
4、对上述待处理图像进行第五特征提取处理,得到至少一个第六特征数据。
本申请实施例中,第六特征数据包括第一待识别车辆的关键点特征信息,且任意两个第六特征数据所包括的特征信息属于不同的关键点。例如,第一待识别车辆包含左后视镜关键点和右尾灯关键点。至少一个第六特征数据包括:特征数据1和特征数据2,其中,特征数据1包括左后视镜关键点的特征信息,特征数据2包括右尾灯关键点的特征信息。
在一种可能实现的方式中,车辆识别装置通过对待处理图像进行第五特征提取处理,提取出第一待识别车辆的关键点特征信息,得到通道数不小于1的第一中间特征数据,其中,第一中间特征数据中每个通道的数据均包括第一待识别车辆的关键点特征信息,且任意两个通道的数据所包括的信息属于不同的关键点。车辆识别装置可将第一中间特征数据中一个通道数据作为一个第六特征数据。
5、从上述至少一个第六特征数据中选取包括信息量最多的k个特征数据,得到k个第七特征数据。
由于不同的第六特征数据所包括的信息量不同,为减小后续处理的数据处理量,车辆识别装置可从至少一个第六特征数据中选取包括信息量最多的k个特征数据(即k个第七特征数据)用于后续处理,其中,k为不小于1的整数。
6、依据上述k个第七特征数据得到上述第四特征数据。
在k=1的情况下,通过执行步骤5可得到1个第七特征数据,此时,车辆识别装置可将第七特征数据作为第四特征数据,即第四特征数据中包括一个关键点的特征信息。
在k大于1的情况下,通过执行步骤5可得到至少两个第七特征数据,此时,车辆识别装置可对至少两个第七特征数据进行融合处理,得到第四特征数据。
例如,至少两个第七特征数据包括:第七特征数据1、第七特征数据2、第七特征数据3,其中,第七特征数据1包括左前车灯关键点的特征信息,第七特征数据2包括左后车灯关键点的特征信息,第七特征数据3包括左后视镜关键点的特征信息。车辆识别装置可通过对第七特征数据1和第七特征数据2进行融合处理,可得到第四特征数据。此时第四特征数据包括左前车灯关键点的特征信息和左后车灯关键点的特征信息。车辆识别装置也可通过对第七特征数据1、第七特征数据2和第七特征数据3进行融合处理,可得到第四特征数据。此时第四特征数据包括左前车灯关键点的特征信息、左后车灯关键点的特征信息和左后视镜关键点的特征信息。
作为一种可选的实施方式,车辆识别装置在执行步骤4的过程中执行以下步骤:
7、对上述待处理图像进行第六特征提取处理,得到至少一张第一热力图。
本申请实施例中,第一热力图包括关键点在待处理图像中的位置信息,且任意两张第一热力图所包括的信息属于不同的关键点。例如,第一待识别车辆的关键点包括左后视镜关键点和右尾灯关键点。至少一张第一热力图包括:第一热力图1和第一热力图2,其中,第一热力图1包括左后视镜关键点在待处理图像中的位置信息,第一热力图2包括右尾灯关键点在待处理图像中的位置信息。
将两张图像中处于相同位置的像素点称为互为同位点。例如,像素点A在第一热力图1中的位置与像素点B在第一热力图像2中的位置相同,则像素点A为第一热力图中与像素点B互为同为点的像素点,像素点B为待处理图像中与像素点A互为同位点的像素点。
在一种可能实现的方式中,第一热力图的尺寸与待处理图像的尺寸相同。第一热力图中像素点的像素值表征,待处理图像中与该像素点互为同位点的像素点所在位置存在关键点的置信度。例如,第一热力图1中的像素点A与待处理图像中的像素点B互为同位点。若第一热力图1包括左前车灯关键点在待处理图像中的位置信息、像素点A的像素值为0.7,则在像素点B处存在左前车灯的置信度为0.7。
本申请实施例中,第六特征提取处理可以是卷积处理,也可以是池化处理,还可以是卷积处理和池化处理的结合,本申请对此不做限定。
在一种可能实现的方式中,第六特征提取处理可通过第五卷积神经网络实现。通过将带有标注信息的图像作为训练数据,对卷积神经网络进行训练,使训练得到的第五卷积神经网络可完成对待处理图像的第六特征提取处理。训练数据的标注信息可以为关键点在图像中的位置。在使用训练数据对卷积神经网络进行训练的过程中,卷积神经网络从训练数据中提取出包括关键点的位置信息的特征数据,并依据提取出的特征数据得到图像中关键点的位置,作为训练结果。使用训练数据的标签监督训练结果可完成卷积神经网络的训练,得到第五卷积神经网络。这样,车辆识别装置可使用第五卷积神经网络对待处理图像进行处理,得到提取出第一待识别车辆的关键点的位置信息,得到第一热力图。
8、对上述待处理图像进行第七特征提取处理,得到上述待处理图像的第一特征图像。
待处理图像中每个像素点均包括语义信息,而语义信息内包含关键点特征信息,通过对待处理图像进行第七特征提取处理,可提取出每个像素点包括关键点特征信息,得到第一特征图像。
应理解,第一特征图像不仅包括像素点的关键点特征信息,还包括像素点之间的相对位置信息。而第四特征数据所包括的信息中不包含像素点之间的相对位置信息。
9、分别确定每张上述第一热力图与上述第一特征图像之间的点积,得到上述至少一个第六特征数据。
将第一热力图所包括的位置信息所属的关键点称为第一热力图的关键点,例如,第一热力图1包括左前车灯关键点的位置信息,即第一热力图1所包括的信息属于左前车灯关键点,此时,第一热力图1的关键点为左前车灯关键点。
本申请实施例中,待处理图像的尺寸、第一热力图的尺寸、第一特征图像的尺寸均相同。例如,待处理图像的长为50、宽为30,则第一热力图的长和第一特征图像的长均为50、第一热力图的宽和第一特征图像的宽均为30。
本申请实施例中,点积指智能乘积(element-wise)。通过确定第一特征图像与第一热力图之间的点积,可从第一特征图像中提取出第一热力图的关键点的特征信息,得到第六特征数据。
可选的,在确定第一特征图像与第一热力图之间的点积之前,车辆识别装置可对第一特征图像中的像素值进行归一化处理,得到归一化后的第一热力图,例如,将不小于0.6的像素值调整为1,将小于0.6的像素值调整为0.3。车辆识别装置通过确定归一化后的第一热力图与第一特征图像之间的点积,可提取出第一热力图的关键点的特征信息,得到第六特征数据。
作为一种可选的实施方式,车辆识别装置在执行步骤5的过程中执行以下步骤:
10、对上述至少一个第六特征数据中的特征数据分别进行池化处理,得到至少一个第八特征数据。
车辆识别装置通过对一个第六特征数据进行池化处理,可减小第六特征数据中的数据量,得到一个第八特征数据。这样,在后续处理中对第八特征数据进行处理,可减小车辆识别装置的数据处理量。
车辆识别装置通过对至少一个第六特征数据中的特征数据分别进行池化处理,得到至少一个第八特征数据。例如,至少一个第六特征数据包括:第六特征数据1、第六特征数据2、第六特征数据3。车辆识别装置通过对第六特征数据1进行池化处理得到第八特征数据1、通过对第六特征数据2进行池化处理得到第八特征数据2,此时,至少一个第八特征数据包括第八特征数据1和第八特征数据2。车辆识别装置通过对第六特征数据1进行池化处理得到第八特征数据1、通过对第六特征数据2进行池化处理得到第八特征数据2、通过对第六特征数据3进行池化处理得到第八特征数据3,此时,至少一个第八特征数据包括第八特征数据1、第八特征数据2、第八特征数据3。
可选的,步骤10中的池化处理为全局平均池化处理。
11、依据上述至少一个第八特征数据所包括的信息量,得到至少一个第一概率。
本申请实施例中,第一概率用于表征与第一概率所对应的第六特征数据所包括的信息量。例如(例1),至少一个第八特征数据包括第八特征数据1,至少一个第一概率包括第一概率1,且第一概率1依据第八特征数据1所包括的信息量得到,第八特征数据1通过对第六特征数据1进行池化处理得到。则第一概率1用于表征第六特征数据1所包括的信息量。
可选的,第一概率与第六特征数据所包括的信息量之间具有相关性。例如,在第一概率与第六特征数据所包括的信息量呈正相关的情况下,在例1中,第一概率1越大表征第六特征数据1所包括的信息量越大;在第一概率与第六特征数据所包括的信息量呈负相关的情况下,在例1中,第一概率1越大表征第六特征数据1所包括的信息量越小。
由于第八特征数据依据第六特征数据得到,第八特征数据所包括的信息量与第六特征数据所包括的信息量呈正相关。因此,车辆识别装置可依据第八特征数据所包括的信息量,得到第一概率。
在一种可能实现的方式中,车辆识别装置将第八特征数据输入至softmax函数,可得到第一概率。
车辆识别装置依据一个第八特征数据所包括的信息量可得到一个第一概率,依据至少一个第八特征数据所包括的信息量可得到至少一个第一概率。例如,至少一个第八特征数据包括第八特征数据1和第八特征数据2。车辆识别装置依据第八特征数据1所包括的信息量得到第一概率1,此时,至少一个第一概率包括第一概率1。车辆识别装置依据第八特征数据1所包括的信息量得到第一概率1、依据第八特征数据2所包括的信息量得到第一概率2,此时,至少一个第一概率包括第一概率1和第一概率2。
在第一概率与第六特征数据所包括的信息量呈正相关的情况下,车辆识别装置执行步骤12;在第一概率与第六特征数据所包括的信息量呈负相关的情况下,车辆识别装置执行步骤13。
12、选取最大的k个第一概率所对应的上述第六特征数据,作为上述k个第七特征数据。
13、选取最小的k个第一概率所对应的上述第六特征数据,作为上述k个第七特征数据。
作为一种可选的实施方式,由于一个第七特征数据包括一个关键点的特征信息,在至少一个关键点中关键点的数量超过1的情况下,第七特征数据的数量超过1。而不同的第七特征数据所包括的信息量不同。为提升第一待识别车辆的关键点特征信息的准确度,车辆识别装置可依据第七特征数据所包括的信息量分别确定每个第七特征数据的权重,并依据第七特征数据的权重对至少一个第七特征数据进行加权融合,得到第四特征数据。
作为一种可选的实施方式,车辆识别装置在执行步骤2的过程中执行以下步骤:
14、对上述待处理图像进行第十特征提取处理,得到至少一个第九特征数据。
本申请实施例中,第九特征数据包括第一待识别车辆的关键点特征信息,且任意两个第九特征数据所包括的特征信息属于不同的局部像素点区域。例如,第一待识别车辆包含局部像素点区域1和局部像素点区域2,其中,局部像素点区域1包括前挡风玻璃所覆盖的像素点区域,局部像素点区域2包括左侧玻璃所覆盖的像素点区域。至少一个第九特征数据包括:特征数据1和特征数据2,其中,特征数据1包括局部像素点区域1的特征信息,特征数据2包括局部像素点区域2的特征信息。
在一种可能实现的方式中,车辆识别装置通过对待处理图像进行第十特征提取处理,提取出第一待识别车辆的关键点特征信息,得到通道数不小于1的第四中间特征数据,其中,第四中间特征数据中每个通道的数据均包括第一待识别车辆的局部像素点区域的特征信息,且任意两个通道的数据所包括的信息属于不同的局部像素点区域。车辆识别装置可将第四中间特征数据中一个通道数据作为一个第九特征数据。
15、从上述至少两个第九特征数据中选取包含信息量最多的m个特征数据,得到m个第十特征数据。
由于不同的第九特征数据所包括的信息量不同,为减小后续处理的数据处理量,车辆识别装置可从至少一个第九特征数据中选取包括信息量最多的m个特征数据(即m个第十特征数据)用于后续处理,其中,m为不小于1的整数。
16、依据上述m个第十特征数据得到上述第五特征数据。
在k=1的情况下,通过执行步骤17可得到1个第十特征数据,此时,车辆识别装置可将第十特征数据作为第五特征数据,即第五特征数据中包括一个关键点的特征信息。
在k大于1的情况下,通过执行步骤5可得到至少两个第十特征数据,此时,车辆识别装置可对至少两个第十特征数据进行融合处理,得到第五特征数据。
例如,至少两个第十特征数据包括:第十特征数据1、第十特征数据2、第十特征数据3,其中,第十特征数据1包括车头所覆盖的像素点区域的特征信息,第十特征数据2包括右前挡风玻璃所覆盖的像素点区域的特征信息,第十特征数据3包括左轮胎所覆盖的像素点区域的特征信息。车辆识别装置可通过对第十特征数据1和第十特征数据2进行融合处理,可得到第五特征数据。此时第五特征数据包括车头所覆盖的像素点区域的特征信息和右前挡风玻璃所覆盖的像素点区域的特征信息。车辆识别装置也可通过对第十特征数据1、第十特征数据2和第十特征数据3进行融合处理,可得到第五特征数据。此时第五特征数据包括车头所覆盖的像素点区域的特征信息、右前挡风玻璃所覆盖的像素点区域的特征信息和左轮胎所覆盖的像素点区域的特征信息。
作为一种可选的实施方式,车辆识别装置在执行步骤14的过程中执行以下步骤:
17、对上述待处理图像进行第十一特征提取处理,得到上述至少一张第二热力图。
本申请实施例中,第二热力图包括关键点在待处理图像中的位置信息,且任意两张第二热力图所包括的信息属于不同的局部像素点区域。例如,第一待识别车辆的局部像素点区域包括前挡风玻璃区域和车头区域。至少一张第二热力图包括:第二热力图1和第二热力图2,其中,第二热力图1包括前挡风玻璃区域在待处理图像中的位置信息,第二热力图2包括局部像素点区域在待处理图像中的位置信息。
将两张图像中处于相同位置的像素点称为互为同位点。例如,像素点A在第二热力图1中的位置与像素点B在第二热力图像2中的位置相同,则像素点A为第二热力图中与像素点B互为同为点的像素点,像素点B为待处理图像中与像素点A互为同位点的像素点。
在一种可能实现的方式中,第二热力图的尺寸与待处理图像的尺寸相同。第二热力图中像素点的像素值表征,待处理图像中与该像素点互为同位点的像素点所在位置属于局部像素点区域的置信度。例如,第二热力图1中的像素点A与待处理图像中的像素点B互为同位点。若第二热力图1包括车头区域在待处理图像中的位置信息、像素点A的像素值为0.7,则像素点B属于与车头区域的置信度为0.7。
本申请实施例中,第十一特征提取处理可以是卷积处理,也可以是池化处理,还可以是卷积处理和池化处理的结合,本申请对此不做限定。
在一种可能实现的方式中,第十一特征提取处理可通过第六卷积神经网络实现。通过将带有标注信息的图像作为训练数据,对卷积神经网络进行训练,使训练得到的第六卷积神经网络可完成对待处理图像的第十一特征提取处理。训练数据的标注信息可以为局部像素点区域在图像中的位置。在使用训练数据对卷积神经网络进行训练的过程中,卷积神经网络从训练数据中提取出包括局部像素点区域的位置信息的特征数据,并依据提取出的特征数据得到图像中局部像素点区域的位置,作为训练结果。使用训练数据的标签监督训练结果可完成卷积神经网络的训练,得到第六卷积神经网络。这样,车辆识别装置可使用第六卷积神经网络对待处理图像进行处理,得到提取出第一待识别车辆的关键点的位置信息,得到第二热力图。
18、对上述待处理图像进行第十二特征提取处理,得到上述待处理图像的第二特征图像。
待处理图像中每个像素点均包括语义信息,通过对待处理图像进行第七特征提取处理,可提取出每个像素点的语义信息,得到第二特征图像。
应理解,第二特征图像不仅包括像素点的语义信息,还包括像素点之间的相对位置信息。而第五特征数据所包括的信息中不包含像素点之间的相对位置信息。
可选的,第一特征图像与第二特征图像可以相同,此时,第一特征图像和第二特征图像均包括待处理图像中每个像素点的语义信息。
19、分别确定每张上述第二热力图与上述第二特征图像之间的点积,得到上述至少一个第九特征数据。
将第二热力图所包括的位置信息所属的局部像素点区域称为第二热力图的局部像素点区域,例如,第二热力图1包括前挡风玻璃区域的位置信息,即第二热力图1所包括的信息属于前挡风玻璃区域,此时,第二热力图1的局部像素点区域为前挡风区域。
本申请实施例中,待处理图像的尺寸、第二热力图的尺寸、第二特征图像的尺寸均相同。例如,待处理图像的长为50、宽为30,则第二热力图的长和第二特征图像的长均为50、第二热力图的宽和第二特征图像的宽均为30。
通过确定第二特征图像与第二热力图之间的点积,可从第二特征图像中提取出的第二热力图的局部像素点区域的特征信息,得到第九特征数据。
可选的,在确定第二特征图像与第二热力图之间的点积之前,车辆识别装置可对第二特征图像中的像素值进行归一化处理,得到归一化后的第二热力图,例如,将超过0.7的像素值调整为1,将未超过0.7的像素值调整为0。车辆识别装置通过确定归一化后的第二热力图与第二特征图像之间的点积,可提取出第二热力图的关键点的特征信息,得到第九特征数据。
作为一种可选的实施方式,车辆识别装置在执行步骤15的过程中执行以下步骤:
20、对上述第九特征数据中的特征数据分别进行池化处理,得到至少一个第十一特征数据。
车辆识别装置通过对一个第九特征数据进行池化处理,可减小第九特征数据中的数据量,得到一个第十一特征数据。这样,在后续处理中对第十一特征数据进行处理,可减小车辆识别装置的数据处理量。
车辆识别装置通过对至少一个第九特征数据中的特征数据分别进行池化处理,得到至少一个第十一特征数据。例如,至少一个第九特征数据包括:第九特征数据1、第九特征数据2、第九特征数据3。车辆识别装置通过对第九特征数据1进行池化处理得到第十一特征数据1、通过对第九特征数据2进行池化处理得到第十一特征数据2,此时,至少一个第十一特征数据包括第十一特征数据1和第十一特征数据2。车辆识别装置通过对第九特征数据1进行池化处理得到第十一特征数据1、通过对第九特征数据2进行池化处理得到第十一特征数据2、通过对第九特征数据3进行池化处理得到第十一特征数据3,此时,至少一个第十一特征数据包括第十一特征数据1、第十一特征数据2、第十一特征数据3。
可选的,步骤20中的池化处理为全局平均池化处理。
21、依据上述至少一个第十一特征数据所包括的信息量,得到至少一个第二概率。
本申请实施例中,第二概率用于表征与第二概率所对应的第九特征数据所包括的信息量。例如(例2),至少一个第十一特征数据包括第十一特征数据1,至少一个第二概率包括第二概率1,且第二概率1依据第十一特征数据1所包括的信息量得到,第十一特征数据1通过对第九特征数据1进行池化处理得到。则第二概率1用于表征第九特征数据1所包括的信息量。
可选的,第二概率与第九特征数据所包括的信息量之间具有相关性。例如,在第二概率与第九特征数据所包括的信息量呈正相关的情况下,在例2中,第二概率1越大表征第九特征数据1所包括的信息量越大;在第二概率与第九特征数据所包括的信息量呈负相关的情况下,在例2中,第二概率1越大表征第九特征数据1所包括的信息量越小。
由于第十一特征数据依据第九特征数据得到,第十一特征数据所包括的信息量与第九特征数据所包括的信息量呈正相关。因此,车辆识别装置可依据第十一特征数据所包括的信息量,得到第二概率。
在一种可能实现的方式中,车辆识别装置将第十一特征数据输入至softmax函数,可得到第二概率。
车辆识别装置依据一个第十一特征数据所包括的信息量可得到一个第二概率,依据至少一个第十一特征数据所包括的信息量可得到至少一个第二概率。例如,至少一个第十一特征数据包括第十一特征数据1和第十一特征数据2。车辆识别装置依据第十一特征数据1所包括的信息量得到第二概率1,此时,至少一个第二概率包括第二概率1。车辆识别装置依据第十一特征数据1所包括的信息量得到第二概率1、依据第十一特征数据2所包括的信息量得到第二概率2,此时,至少一个第二概率包括第二概率1和第二概率2。
在第二概率与第九特征数据所包括的信息量呈正相关的情况下,车辆识别装置执行步骤22;在第二概率与第九特征数据所包括的信息量呈负相关的情况下,车辆识别装置执行步骤23。
22、选取最大的m个第二概率所对应的上述第九特征数据,作为上述m个第十特征数据。
23、选取最小的m个第二概率所对应的上述第九特征数据,得到作为上述m个第十特征数据。
作为一种可选的实施方式,由于一个第十特征数据包括一个局部像素点区域的特征信息,在至少一个局部像素点区域中局部像素点区域的数量超过1的情况下,第十特征数据的数量超过1。而不同的第十特征数据所包括的信息量不同。为提升第一待识别车辆的局部像素点区域特征信息的准确度,车辆识别装置可依据第十特征数据所包括的信息量分别确定每个第十特征数据的权重,并依据第十特征数据的权重对至少一个第十特征数据进行加权融合,得到第五特征数据。
在一种可能实现的方式中,至少一个局部像素点区域包括第一局部像素点区域和第二局部像素点区域,第九特征数据的数量和m均大于1。车辆识别装置从至少两个第九特征数据中选取包括信息量最多的m个特征数据,得到包括第一局部像素点区域的特征信息的第十二特征数据和包括第二局部像素点区域的特征信息的第十三特征数据。车辆识别装置在执行步骤18的过程中执行以下步骤:
24、依据上述第十二特征数据所包括的信息量得到第一权重,依据上述第十三特征数据所包括的信息量得到第二权重。
本申请实施例中,第一权重与第十二特征数据所包括的信息量呈正相关,第二权重与第十三特征数据所包括的信息量呈正相关。
25、依据上述第一权重和上述第二权重,对上述第十二特征数据和上述第十三特征数据进行加权融合,得到上述第五特征数据。
车辆识别装置依据第一权重和第二权重对第九特征数据和第十特征数据进行加权融合,得到包括第一待识别车辆的局部像素点区域特征信息的第四特征数据,可提升第一待识别车辆的局部像素点区域特征信息的准确度。
在一种可能实现的实现方式中,车辆识别装置依据第一权重和第二权重,对第十二特征数据与第十三特征数据进行加权求和得到第五特征数据。例如,假设第一权重为w3,第二权重为w4,第十二特征数据为n4,第十三特征数据为n5,第五特征数据为n6,w3、w4、n4、n5、n6满足下式:n6=w3×n4+w4×n5+d,其中,d为实数。可选的,d=0。
在另一种可能实现的方式中,车辆识别装置将第一权重与第十二特征数据相乘得到第五中间特征数据、将第二权重与第十三特征数据相乘得到第六中间特征数据,对第五中间特征数据与第六中间特征数据进行融合处理得到第五特征数据。
本申请实施例还提供了一种车辆识别网络,可用于实现前文所公开的技术方案。请参阅图4,图4为本申请实施例提供的一种车辆识别网络的结构示意图。如图4所示,车辆识别网络包括:特征提取模块、关键点和局部像素点区域生成模块、联合训练模块。经特征提取模块对待处理图像进行处理,得到待处理图像的第三特征图像。经关键点和局部像素点区域生成模块对待处理图像进行处理,得到至少一张第一热力图和至少一张第二热力图。将第三特征图、至少一张第一热力图和至少一张第二热力图像输入至联合训练模块,得到第三特征数据。
具体的,图5所示为特征提取模块的结构示意图。如图5所示,特征提取模块包括三层依次串联的卷积层。可选的,在特征提取模块中,第一层卷积层为ResNet50中的conv2_x,第二层卷积层为ResNet50中的conv3_x,第三层卷积层为ResNet50中的conv4_x。
图6所示为关键点和局部像素点区域生成模块的结构示意图。如图6所示,关键点和局部像素点区域生成模块包括四层依次串联的卷积层。可选的,在关键点和局部像素点区域生成模块中,第一层卷积层为ResNet50中的conv2_x,第二层卷积层为ResNet50中的conv3_x,第三层卷积层为ResNet50中的conv4_x,第四层卷积层为ResNet50中的conv5_x。
图7所示为联合训练模块的结构示意图。如图7所示,经联合训练模块的第一层卷积层对第三特征图像进行处理,得到第一通用特征图像。经第一降维层对第一通用特征图像进行通道维度上的降维得到第一特征图像。经第一演员-评论家模块对第一特征图像和至少一张第一热力图进行处理,得到k个第一评论家特征数据。依次经第一池化层和第一归一化层分别对k个第一评论家特征数据进行处理,得到k个第七特征数据。
经联合训练模块的第一层卷积层对第三特征图像进行处理,得到第二通用特征图像。经第二降维层对第二通用特征图像进行通道维度上的降维得到第二特征图像。经第二演员-评论家模块对第二特征图像和至少一张第二热力图进行处理,得到m个第二评论家特征数据。依次经第二池化层和第二归一化层分别对m个第二评论家特征数据进行处理,得到m个第十特征数据。
依次经联合训练模块的第二层卷积层、第三层降维层、第三层池化层、第三归一化层对第三特征图像进行处理,得到第二特征数据。
可选的,在联合训练模块中,第一层卷积层和第二层卷积层均为ResNet50中的conv5_x。可选的,第一降维层、第二降维层、第三降维层中均包含一个尺寸为1*1的卷积核。
请参阅图8,图8所示为第一演员-评论家模块的结构示意图。第一演员-评论家模块的输入为至少一张第一热力图和第一特征图像。第一演员-评论家模块分别确定每张第一热力图与第一特征图像之间的点积,得到至少一个第六特征数据。经第一打分子模块对一个第六特征数据进行处理,可得到与该第六特征数据对应的第一概率。从至少一个第六特征数据中选取最大的k个第一概率对应的第六特征数据得到k个第一演员特征数据,或从至少一个第六特征数据中选取最小的k个第一概率对应的第六特征数据得到k个第一演员特征数据。分别对k个第一演员特征数据进行归一化处理,得到k个第一评论家特征数据。
请参阅图9,图9所示为第一打分子模块的结构示意图。在第一打分子模块中,第六特征数据依次经过第一归一化层、池化层、全连接层,得到第八特征数据,经softmax层对第八特征数据进行处理,得到第一概率。
请参阅图10,图10所示为第二演员-评论家模块的结构示意图。第二演员-评论家模块的输入为至少一张第二热力图和第三特征图像。第二演员-评论家模块分别确定每张第二热力图与第三特征图像之间的点积,得到至少一个第九特征数据。经第二打分子模块对一个第九特征数据进行处理,可得到与该第九特征数据对应的第二概率。从至少一个第九特征数据中选取最大的m个第二概率对应的第九特征数据得到m个第二演员特征数据,或从至少一个第九特征数据中选取最小的m个第二概率对应的第九特征数据得到m个第二演员特征数据。分别对m个第二演员特征数据进行归一化处理,得到m个第二评论家特征数据。
请参阅图11,图11所示为第二打分子模块的结构示意图。在第二打分子模块中,第九特征数据依次经过第二归一化层、池化层、全连接层,得到第十一特征数据,经softmax层对第八特征数据进行处理,得到第二概率。
在使用图4所示的车辆识别网络提取图像中的车辆的特征数据之前,需对车辆识别网络进行训练。为此,本申请还提供了一种车辆识别网络的训练方法。该训练方法可包括以下步骤:
26、获取包含第二待识别车辆的训练图像和待训练网络。
本申请实施例中,训练图像包括第一待识别车辆。在一种获取训练图像的实现方式中,车辆识别装置接收用户通过输入组件输入的训练图像。上述输入组件包括:键盘、鼠标、触控屏、触控板和音频输入器等。
在另一种获取训练图像的实现方式中,车辆识别装置接收训练数据终端发送的训练图像。上述训练数据终端可以是以下任意一种:手机、计算机、平板电脑、服务器。
本申请实施例中,待训练网络的具体结构请参见图4。在一种获取待训练网络的实现方式中,车辆识别装置接收用户通过输入组件输入的待训练网络。上述输入组件包括:键盘、鼠标、触控屏、触控板和音频输入器等。
在另一种获取待训练网络的实现方式中,车辆识别装置接收训练数据终端发送的待训练网络。上述训练数据终端可以是以下任意一种:手机、计算机、平板电脑、服务器。
27、使用上述待训练网络对上述训练图像进行处理,得到包括上述第二待识别车辆的全局特征信息的第十四特征数据和包括上述第二待识别车辆的关键点特征信息的第十五特征数据。
本申请实施例中,第二待识别车辆的全局特征信息包括第二待识别车辆的整体外观特征信息。
28、依据上述第十四特征数据和上述训练图像的标签,得到第一全局损失。
本申请实施例中,训练图像的标签包括第二待识别车辆的类别信息。例如,在所有训练数据中总共包含车辆1和车辆2。在第二待识别车辆的类别信息为车辆1的情况下,表明第二待识别车辆为车辆1。
在一种可能实现的方式中,车辆识别装置依据第十四特征数据可得到第二待识别车辆的类别(下文将称为全局类别),依据全局类别和标签所包括的类别信息之间的差异可得到第一全局损失。
29、依据上述第十五特征数据和上述标签,得到第一关键点损失。
在一种可能实现的方式中,车辆识别装置依据第十五特征数据可得到第二待识别车辆的类别(下文将称为关键点类别),依据关键点类别和标签所包括的类别信息之间的差异可得到第一关键点损失。
30、依据上述第一全局损失和上述第一关键点损失,得到上述待训练网络的总损失。
假设第一全局损失为G1,第一关键点损失为p1,总损失为Lt,在一种可能实现的方式中,G1、p1、Lt满足下式:
Lt=G1+p1+c1…公式(1)
其中,c1为实数。可选的,c1=0。
在另一种可能实现的方式中,G1、p1、Lt满足下式:
Lt=α1×(G1+p1)…公式(2)
其中,α1为实数。可选的,α1=1。
在又一种可能实现的方式中,G1、p1、Lt满足下式:
Lt=α1×(G1+p1)+1…公式(3)
其中,α1、c1均为实数。可选的,c1=0,α1=1。
31、基于上述总损失调整上述待训练网络的参数,得到上述车辆识别网络。
车辆识别装置依据总损失调整待训练网络的参数,直至总损失小于收敛阈值,得到车辆识别网络。
由于总损失中包含第一全局损失和第一关键点损失,基于总损失调整待训练网络的参数得到车辆识别网络,可使用车辆识别网络对待处理图像进行处理得到第一待识别车辆的全局特征信息和关键点特征信息。
作为一种可选的实施方式,在执行步骤30之前,车辆识别装置还执行以下步骤:
32、使用上述待训练网络对上述训练图像进行处理,得到包括上述第二待识别车辆的局部像素点区域的特征信息的第十六特征数据。
33、依据上述第十六特征数据和上述标签,得到第一局部像素点区域损失。
在一种可能实现的方式中,车辆识别装置依据第十六特征数据可得到第二待识别车辆的类别(下文将称为局部像素点区域类别),依据局部像素点区域类别和标签所包括的类别信息之间的差异可得到第一局部像素点区域损失。
在得到第一局部像素点区域损失后,车辆识别装置在执行步骤30的过程中执行以下步骤:
34、依据上述第一全局损失、上述第一关键点损失和上述第一局部像素点区域损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,总损失为Lt,在一种可能实现的方式中,G1、p1、r1、Lt满足下式:
Lt=G1+p1+r1+c2…公式(4)
其中,c2为实数。可选的,c2=0。
在另一种可能实现的方式中,G1、p1、r1、Lt满足下式:
Lt=α2×(G1+p1+r1)…公式(5)
其中,α2为实数。可选的,α2=1。
在又一种可能实现的方式中,G1、p1、r1、Lt满足下式:
Lt=α2×(G1+p1+r1)+2…公式(6)
其中,α2、c2均为实数。可选的,c2=0,α2=1。
由于总损失中包含第一全局损失、第一关键点损失和第一局部像素点区域损失,基于总损失调整待训练网络的参数得到车辆识别网络,可使用车辆识别网络对待处理图像进行处理得到第一待识别车辆的全局特征信息、关键点特征信息和局部像素点区域特征信息。
作为一种可选的实施方式,车辆识别装置在执行步骤27的过程中执行以下步骤:
35、使用上述待训练网络对上述训练图像进行处理,得到至少一个第十七特征数据。
本申请实施例中,第十七特征数据包括第二待识别车辆的关键点特征信息,且任意两个第十七特征数据所包括的特征信息属于不同的关键点。
36、从上述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到s个第十八特征数据,其中,s为不小于1的整数。
37、对上述s个第十八特征数据进行融合处理,得到上述第十五特征数据。
在对待训练网络的训练过程中,对s个第十八特征数据进行融合处理得到第十五特征数据,可在使用车辆识别网络对待处理图像进行处理过程,依据k个第七特征数据得到第四特征数据。
作为一种可选的实施方式,在得到s个第十八特征数据后,在执行步骤34之前,车辆识别装置还执行以下步骤:
38、依据上述s个第十八特征数据,得到上述第二待识别车辆的s个第一识别结果。
本申请实施例中,第一识别结果包括第二待识别车辆的类别信息。车辆识别装置依据一个第十八特征数据,可得到一个第一识别结果。依据s个第十八特征数据,可得到第二待识别车辆的s个第一识别结果。
39、分别依据上述s个第一识别结果与上述标签之间的差异,得到关键点类别损失。
在一种可能实现的方式中,车辆识别装置依据一个第一识别结果和标签可得到一个第一识别差异,依据s个第一识别结果和标签可得到s个第一识别差异。车辆识别装置通过确定s个第一识别差异的和,得到关键点类别损失。
在得到关键点类别损失之后,车辆识别装置在执行步骤34的过程中执行以下步骤:
40、依据上述第一全局损失、上述第一关键点损失、上述第一局部像素点区域损失和上述关键点类别损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,关键点类别损失为p2,总损失为Lt,在一种可能实现的方式中,G1、p1、p2、r1、Lt满足下式:
Lt=G1+p1+p2+r1+c3…公式(7)
其中,c3为实数。可选的,c3=0。
在另一种可能实现的方式中,G1、p1、p2、r1、Lt满足下式:
Lt=α3×(G1+p1+p2+r1)…公式(8)
其中,α3为实数。可选的,α3=1。
在又一种可能实现的方式中,G1、p1、p2、r1、Lt满足下式:
Lt=α3×(G1+p1+p2+r1)+3…公式(9)
其中,α3、c3均为实数。可选的,c3=0,α3=1。
由于总损失中包含关键点类别损失,可在使用车辆识别网络对待处理图像进行处理的过程中,依据k个第七特征数据得到的第四特征数据。
作为一种可选的实施方式,车辆识别装置在执行步骤36的过程中执行以下步骤:
41、依据所包括的信息量对上述至少一个第十七特征数据进行排序,得到第一顺序。
本申请实施例中,第一顺序为所包括的信息量从大到小的顺序,第一顺序或为所包括的信息量从小到大的顺序。
42、依据上述第一顺序从上述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到上述s个第十八特征数据。
在第一顺序为所包括的信息量从大到小的顺序的情况下,车辆识别装置选取第一顺序中的前s个特征数据作为s个第十八特征数据;在第一顺序为所包括的信息量从小到大的顺序的情况下,车辆识别装置选取第一顺序中的后s个特征数据作为s个第十八特征数据。
在得到第一顺序的情况下,车辆识别装置在执行步骤40之前还执行以下步骤:
43、依据所对应的上述关键点类别损失对上述s个第一识别结果进行排序,得到第二顺序。
本申请实施例中,在第一顺序为所包括的信息量从大到小的顺序的情况下,第二顺序为关键点类别损失从小到大的顺序。即关键点类别损失越小,第一识别结果在第二顺序中的排名越高。
在第一顺序为所包括的信息量从小到大的顺序的情况下,第二顺序为关键点类别损失从大到小的顺序。即关键点类别损失越大,第一识别结果在第二顺序中的排名越高。
44、依据上述第一顺序和上述第二顺序之间的差异,得到关键点排序损失。
在得到关键点排序损失后,车辆识别装置在执行步骤40的过程中执行以下步骤:
45、依据上述第一全局损失、上述第一关键点损失、上述第一局部像素点区域损失、上述关键点类别损失和上述关键点排序损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,关键点类别损失为p2,关键点排序损失为p3,总损失为Lt,在一种可能实现的方式中,G1、p1、p2、p3、r1、Lt满足下式:
Lt=G1+p1+p2+p3+r1+c4…公式(10)
其中,c4为实数。可选的,c4=0。
在另一种可能实现的方式中,G1、p1、p2、p3、r1、Lt满足下式:
Lt=α4×(G1+p1+p2+p3+r1)…公式(11)
其中,α4为实数。可选的,α4=1。
在又一种可能实现的方式中,G1、p1、p2、p3、r1、Lt满足下式:
Lt=α4×(G1+p1+p2+p3+r1)+4…公式(12)
其中,α4、c4均为实数。可选的,c4=0,α4=1。
在对待训练网络的训练过程中,在总损失中加入关键点类别损失,可提高s个第十八特征数据的准确度,进而提高第十五特征数据所包括的信息的准确度。这样,在使用车辆识别网络对待处理图像进行处理的过程中,可提高k个第七特征数据的准确度,进而提高第四特征数据所包括的信息的准确度。
作为一种可选的实施方式,车辆识别装置在执行步骤32的过程中执行以下步骤:
46、使用上述待训练网络对上述训练图像进行处理,得到至少一个第十九特征数据。
本申请实施例中,第十九特征数据包括第二待识别车辆的局部像素点区域特征信息,且任意两个第十九特征数据所包括的特征信息属于不同的局部像素点区域。
47、从上述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到p个第二十特征数据,其中,p为不小于1的整数。
48、对上述p个第二十特征数据进行融合处理,得到上述第十六特征数据。
在对待训练网络的训练过程中,对p个第二十特征数据进行融合处理得到第十六特征数据,可在使用车辆识别网络对待处理图像进行处理过程,依据m个第十特征数据得到第五特征数据。
作为一种可选的实施方式,在得到p个第二十特征数据后,在执行步骤45之前,车辆识别装置还执行以下步骤:
49、依据上述p个第二十特征数据,得到上述第二待识别车辆的p个第二识别结果。
本申请实施例中,第二识别结果包括第二待识别车辆的类别信息。车辆识别装置依据一个第二十特征数据,可得到一个第二识别结果。依据p个第十八特征数据,可得到第二待识别车辆的p个第二识别结果。
50、分别依据上述p个第二识别结果与上述标签之间的差异,得到局部像素点区域类别损失。
在一种可能实现的方式中,车辆识别装置依据一个第二识别结果和标签可得到一个第二识别差异,依据p个第二识别结果和标签可得到p个第二识别差异。车辆识别装置通过确定p个第二识别差异的和,得到局部像素点区域类别损失。
在得到局部像素点区域类别损失之后,车辆识别装置在执行步骤45的过程中执行以下步骤:
51、依据上述第一全局损失、上述第一关键点损失、上述第一局部像素点区域损失、上述关键点类别损失、上述关键点排序损失和上述局部像素点区域类别损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,关键点类别损失为p2,关键点排序损失为p3,局部像素点区域类别损失为r2,总损失为Lt,在一种可能实现的方式中,G1、p1、p2、p3、r1、r2、Lt满足下式:
Lt=G1+p1+p2+p3+r1+r2+c5…公式(13)
其中,c5为实数。可选的,c5=0。
在另一种可能实现的方式中,G1、p1、p2、p3、r1、r2、Lt满足下式:
Lt=α5×(G1+p1+p2+p3+r1+r2)…公式(14)
其中,α5为实数。可选的,α5=1。
在又一种可能实现的方式中,G1、p1、p2、p3、r1、r2、Lt满足下式:
Lt=α5×(G1+p1+p2+p3+r1+r2)+c5…公式(15)
其中,α5、c5均为实数。可选的,c5=0,α5=1。
由于总损失中包含局部像素点区域类别损失,可在使用车辆识别网络对待处理图像进行处理的过程中,依据m个第十特征数据得到的第五特征数据。
作为一种可选的实施方式,车辆识别装置在执行步骤47的过程中执行以下步骤:
52、依据所包括的信息量对上述至少一个第十九特征数据进行排序,得到第三顺序。
本申请实施例中,第三顺序为所包括的信息量从大到小的顺序,第三顺序或为所包括的信息量从小到大的顺序。
53、依据上述第三顺序从上述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到上述p个第二十特征数据。
在第三顺序为所包括的信息量从大到小的顺序的情况下,车辆识别装置选取第三顺序中的前p个特征数据作为p个第二十特征数据;在第三顺序为所包括的信息量从小到大的顺序的情况下,车辆识别装置选取第三顺序中的后p个特征数据作为p个第二十特征数据。
在得到第三顺序的情况下,车辆识别装置在执行步骤51之前还执行以下步骤:
54、依据所对应的上述局部像素点区域类别损失对上述p个第二识别结果进行排序,得到第四顺序。
本申请实施例中,在第三顺序为所包括的信息量从大到小的顺序的情况下,第四顺序为局部像素点区域类别损失从小到大的顺序。即局部像素点区域类别损失越小,第二识别结果在第四顺序中的排名越高。
在第三顺序为所包括的信息量从小到大的顺序的情况下,第四顺序为局部像素点区域类别损失从大到小的顺序。即局部像素点区域类别损失越大,第二识别结果在第四顺序中的排名越高。
55、依据上述第三顺序和上述第四顺序之间的差异,得到局部像素点区域排序损失。
在得到局部像素点区域排序损失后,车辆识别装置在执行步骤51的过程中执行以下步骤:
56、依据上述第一全局损失、上述第一关键点损失、上述第一局部像素点区域损失、上述关键点类别损失、上述关键点排序损失、上述局部像素点区域类别损失和上述局部像素点区域排序损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,关键点类别损失为p2,关键点排序损失为p3,局部像素点区域类别损失为r2,局部像素点区域排序损失为r3,总损失为Lt,在一种可能实现的方式中,G1、p1、p2、p3、r1、r2、r3、Lt满足下式:
Lt=G1+p1+p2+p3+r1+r2+r3+c6…公式(16)
其中,c6为实数。可选的,c6=0。
在另一种可能实现的方式中,G1、p1、p2、p3、r1、r2、r3、Lt满足下式:
Lt=α6×(G1+p1+p2+p3+t1+r2+r3)…公式(17)
其中,α6为实数。可选的,α6=1。
在又一种可能实现的方式中,G1、p1、p2、p3、r1、r2、r3、Lt满足下式:
Lt=α6×(G1+p1+p2+p3+r1+r2+r3)+c6…公式(18)
其中,α6、c6均为实数。可选的,c6=0,α6=1。
在对待训练网络的训练过程中,在总损失中加入局部像素点区域类别损失,可提高p个第二十特征数据的准确度,进而提高第十六特征数据所包括的信息的准确度。这样,在使用车辆识别网络对待处理图像进行处理的过程中,可提高k个第七特征数据的准确度,进而提高第四特征数据所包括的信息的准确度。
作为一种可选的实施方式,第一全局损失包括全局焦点损失,车辆识别装置在执行步骤28的过程中执行以下步骤:
57、依据上述第十四特征数据,得到上述第二待识别车辆的第三识别结果。
本申请实施例中,第三识别结果包括第二待识别车辆的类别信息。车辆识别装置依据第十四特征数据,可确定第二待识别车辆的类别,进而得到第三识别结果。
58、依据上述第三识别结果和上述标签,得到上述第三识别结果的焦点损失,作为上述全局焦点损失。
假设第三识别结果的焦点损失为LF1,则LF1满足下式:
Figure BDA0002675768000000251
其中,B为训练图像的数量,βn为正数,γ为非负数,un为第三识别结果中与标签的类别对应的概率。可选的,βn=2,γ=2。
例如,训练图像包括图像a,使用待训练网络对图像a进行处理得到第三识别结果1。若图像a的标签所包括的类别为车辆1(即图像a的标签为车辆1)。在第三识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.9、图像a中的第二待识别车辆为车辆2的概率为0.1。假设βn=2,γ=2,此时,LF1=-2×(1-0.9)2×log0.9。
又例如,训练图像包括图像a和图像b,使用待训练网络对图像a进行处理得到第三识别结果1,使用待训练网络对图像b进行处理得到第三识别结果2。若图像a的标签所包括的类别为车辆1(即图像a的标签为车辆1),图像b的标签所包括的类别为车辆2(即图像a的标签为车辆2)。在第三识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.3、图像a中的第二待识别车辆为车辆2的概率为0.7。在第三识别结果2中,图像b中的第二待识别车辆为车辆1的概率为0.2、图像b中的第二待识别车辆为车辆2的概率为0.8。假设βn=2,γ=2,此时,LF1=-2×(1-0.3)2×log0.3-2×(1-0.8)2×log0.8。
将最大概率处于第一概率阈值至第二概率阈值之间的第三识别结果所对应的图像称为第一容易样本,将训练图像中除第一容易样本之外的图像称为第一难样本。例如,假设第一概率阈值为0.4,第二概率阈值为0.7。在训练过程中,待训练网络通过对图像a进行处理得到第三识别结果1。
若在第三识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.8,图像a中第二待识别车辆为车辆2的概率为0.2。由于第三识别结果1的最大概率为0.8,该最大概率大于第二概率阈值,图像a为第一容易样本。
若在第三识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.5,图像a中第二待识别车辆为车辆2的概率为0.5。由于第三识别结果1的最大概率为0.5,该最大概率阈值大于第一概率阈值,且该最大概率小于第二阈值,图像a为第一难样本。
在训练过程中,通过计算第三识别结果的焦点损失得到关键点焦点损失,进而确定总损失,可提升对待训练网络的训练效果。
作为一种可选的实施方式,训练图像属于训练图像集,训练图像集还包括训练图像的第一正样本图像和训练图像的第一负样本图像,第一全局损失还包括全局三元组损失。车辆识别装置在执行步骤28的过程中还执行以下步骤:
59、使用上述待训练网络对上述第一正样本图像进行特征提取处理,得到上述第一正样本图像的特征数据。
本申请实施例中,第一正样本图像的标签所包括类别信息与训练图像的标签所包括的类别信息相同,第一负样本图像的标签所包括类别信息与训练图像的标签所包括的类别信息不同。
第一正样本图像的特征数据包括第一正样本图像的语义信息,该语义信息可用于识别第一正样本图像中的第二待识别车辆的类别。
60、使用上述待训练网络对上述第一负样本图像进行特征提取处理,得到上述第一负样本图像的特征数据。
第一负样本图像的特征数据包括第一正样本图像的语义信息,该语义信息可用于识别第一负样本图像中的第二待识别车辆的类别。
61、依据上述第十二特征数据、上述第一正样本图像的特征数据和上述第一负样本图像的特征数据,得到上述全局三元组损失。
车辆识别装置计算第十二特征数据与第一正样本图像的特征数据之间的相似度得到第一正相似度、计算第十二特征数据与第一负样本图像的特征数据之间的相似度得到第一负相似度。
假设第十二特征数据为xa,第一正相似度为s1,第一负相似度为s2,全局三元组损失为LT1,则LT1、s1、s2、xa满足下式:
LT1=[v1+s1-s2]…公式(20)
其中,v1为实数。可选的,v1=1
可选的,第一正相似度为第十二特征数据与第一正样本图像的特征数据之间的第二范数。第一负相似度为第十二特征数据与第一负样本图像的特征数据之间的第二范数。
可选的,在训练图像集包括除训练图像、第一正样本图像、第一负样本图像之外的图像的情况下,车辆识别装置可将训练图像集中训练图像之外的图像分为正样本图像集和负样本图像集。正样本图像集中的图像的标签所包括的类别信息与训练图像的标签所包括的类别信息相同,负样本图像集中的图像的标签所包括的类别信息与训练图像的标签所包括的类别信息不同。
车辆识别装置对正样本图像集中的图像进行特征提取处理得到正样本特征数据集、对负样本图像集中的图像进行特征提取处理得到负样本特征数据集。车辆识别装置计算第十二特征数据与正样本特征数据集中的特征数据之间的相似度得到第一正相似度集、计算第十二特征数据与负样本特征数据集中的特征数据之间的相似度得到第一负相似度集。将第一正相似度集中的最小值称为第一类内最小相似度,将第一负相似度集中的最大值称为第一类外最大相似度。
假设第十二特征数据为xa,第一类内最小相似度为maxd(xa,xp),第一类外最大相似度为mind(xa,xn),全局三元组损失为LT1,则LT1、maxd(xa,xp)、mind(xa,xn)、xa满足下式:
LT1=[v1+maxd(xa,xp)-mind(xa,xn)]…公式(21)
其中,v1为实数。可选的,v1=1
可选的,第十二特征数据与第一正样本特征数据集中的特征数据之间的相似度为,第十二特征数据与第一正样本特征数据集中的特征数据之间的第二范数。第十二特征数据与第一负样本特征数据集中的特征数据之间的相似度为,第十二特征数据与第一负样本特征数据集中的特征数据之间的第二范数。
在训练过程中,全局三元组损失可提升待训练网络基于第十二特征数据得到的第二待识别车辆的识别结果的准确度,从而提升车辆识别网络对第一待识别车辆的分类准确度。
应理解,在第一全局损失包括全局焦点损失和全局三元组损失的情况下,第一全局损失可以为全局焦点损失和全局三元组损失的和。
作为一种可选的实施方式,在执行步骤56之前,车辆识别装置还执行以下步骤:
62、依据上述第十五特征数据,得到上述第二待识别车辆的第四识别结果。
本申请实施例中,第四识别结果包括第二待识别车辆的类别信息。车辆识别装置依据第十五特征数据,可确定第二待识别车辆的类别,进而得到第四识别结果。
63、依据上述第四识别结果和上述标签,得到上述第四识别结果的焦点损失,作为关键点焦点损失。
假设第四识别结果的焦点损失为LF2,则LF2满足下式:
Figure BDA0002675768000000271
其中,B为训练图像的数量,βn为正数,γ为非负数,um为第四识别结果中与标签的类别对应的概率。可选的,βn=2,γ=2。
例如,训练图像包括图像a,使用待训练网络对图像a进行处理得到第四识别结果1。若图像a的标签所包括的类别为车辆1(即图像a的标签为车辆1)。在第四识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.9、图像a中的第二待识别车辆为车辆2的概率为0.1。假设βn=2,γ=2,此时,LF2=-2×(1-0.9)2×log0.9。
又例如,训练图像包括图像a和图像b,使用待训练网络对图像a进行处理得到第四识别结果1,使用待训练网络对图像b进行处理得到第四识别结果2。若图像a的标签所包括的类别为车辆1(即图像a的标签为车辆1),图像b的标签所包括的类别为车辆2(即图像a的标签为车辆2)。在第四识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.3、图像a中的第二待识别车辆为车辆2的概率为0.7。在第四识别结果2中,图像b中的第二待识别车辆为车辆1的概率为0.2、图像b中的第二待识别车辆为车辆2的概率为0.8。假设βn=2,γ=2,此时,LF2=-2×(1-0.3)2×log0.3-2×(1-0.8)2×log0.8。
在得到关键点焦点损失后,车辆识别装置在执行步骤58的过程中执行以下步骤:
64、依据上述第一全局损失、上述第一关键点损失、上述第一局部像素点区域损失、上述关键点类别损失、上述关键点排序损失、上述局部像素点区域类别损失、上述关键点焦点损失和上述局部像素点区域排序损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,关键点类别损失为p2,关键点排序损失为p3,局部像素点区域类别损失为r2,局部像素点区域排序损失为r3,关键点焦点损失为p4,总损失为Lt,在一种可能实现的方式中,G1、p1、p2、p3、p4、r1、r2、r3、Lt满足下式:
Lt=G1+p1+p2+p3+p4+r1+r2+r3+c7…公式(23)
其中,c7为实数。可选的,c7=0。
在另一种可能实现的方式中,G1、p1、p2、p3、p4、r1、r2、r3、Lt满足下式:
Lt=α7×(G1+p1+p2+p3+p4+r1+r2+r3)…公式(24)
其中,α7为实数。可选的,α7=1。
在又一种可能实现的方式中,G1、p1、p2、p3、p4、r1、r2、r3、Lt满足下式:
Lt=α7×(G1+p1+p2+p3+p4+r1+r2+r3)+c7…公式(25)
其中,α7、c7均为实数。可选的,c7=0,α7=1。
将最大概率处于第三概率阈值至第四概率阈值之间的第四识别结果所对应的图像称为第二容易样本,将训练图像中除第二容易样本之外的图像称为第二难样本。例如,假设第三概率阈值为0.4,第四概率阈值为0.7。在训练过程中,待训练网络通过对图像a进行处理得到第四识别结果1。
若在第四识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.8,图像a中第二待识别车辆为车辆2的概率为0.2。由于第四识别结果1的最大概率为0.8,该最大概率大于第四阈值,图像a为第二容易样本。
若在第四识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.5,图像a中第二待识别车辆为车辆2的概率为0.5。由于第四识别结果1的最大概率为0.5,该最大概率大于第三概率阈值,且该最大概率小于第四概率阈值,图像a为第二难样本。
在训练过程中,通过计算第四识别结果的焦点损失得到局部像素点区域焦点损失,并在总损失中增加局部像素点区域损失,可提升对待训练网络的训练效果。
作为一种可选的实施方式,在执行步骤63之前,车辆识别装置还执行以下步骤:
65、依据上述第十五特征数据、上述第一正样本图像的特征数据和上述第一负样本图像的特征数据,得到关键点三元组损失。
车辆识别装置计算第十五特征数据与第一正样本图像的特征数据之间的相似度得到第二正相似度、计算第十五特征数据与第一负样本图像的特征数据之间的相似度得到第二负相似度。
假设第十五特征数据为xb,第二正相似度为s3,第二负相似度为s4,关键点三元组损失为LT2,则LT2、s3、s4、xb满足下式:
LT2=[v2+s3-s4]…公式(26)
其中,v2为实数。可选的,v2=1。
可选的,第二正相似度为第十五特征数据与第一正样本图像的特征数据之间的第二范数。第二负相似度为第十五特征数据与第一负样本图像的特征数据之间的第二范数。
车辆识别装置对正样本图像集中的图像进行特征提取处理得到正样本特征数据集、对负样本图像集中的图像进行特征提取处理得到负样本特征数据集。车辆识别装置计算第十五特征数据与正样本特征数据集中的特征数据之间的相似度得到第二正相似度集、计算第十五特征数据与负样本特征数据集中的特征数据之间的相似度得到第二负相似度集。将第二正相似度集中的最小值称为第二类内最小相似度,将第二负相似度集中的最大值称为第二类外最大相似度。
假设第十五特征数据为xb,第二类内最小相似度为maxd(xb,xp),第二类外最大相似度为mind(xb,xn),关键点三元组损失为LT2,则LT2、maxd(xb,xp)、mind(xb,xn)、xb满足下式:
LT2=[v2+maxd(xb,xp)-mind(xb,xn)]…公式(27)
其中,v2为实数。可选的,v2=1。
可选的,第十五特征数据与正样本特征数据集中的特征数据之间的相似度为,第十五特征数据与正样本特征数据集中的特征数据之间的第二范数。第十五特征数据与负样本特征数据集中的特征数据之间的相似度为,第十五特征数据与负样本特征数据集中的特征数据之间的第二范数。
在得到关键点焦点损失后,车辆识别装置在执行步骤63的过程中执行以下步骤:
66、依据上述第一全局损失、上述第一关键点损失、上述第一局部像素点区域损失、上述关键点类别损失、上述关键点排序损失、上述局部像素点区域类别损失、上述关键点焦点损失、上述关键点三元组损失和上述局部像素点区域排序损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,关键点类别损失为p2,关键点排序损失为p3,局部像素点区域类别损失为r2,局部像素点区域排序损失为r3,关键点焦点损失为p4,关键点三元组损失为p5,总损失为Lt,在一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、Lt满足下式:
Lt=G1+p1+p2+p3+p4+p5+r1+r2+r3+c8…公式(28)
其中,c8为实数。可选的,c8=0。
在另一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、Lt满足下式:
Lt=α8×(G1+p1+p2+p3+p4+p5+r1+r2+r3)…公式(29)
其中,α8为实数。可选的,α8=1。
在又一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、Lt满足下式:
Lt=α8×(G1+p1+p2+p3+p4+p5+r1+r2+r3)+8…公式(30)
其中,α8、c8均为实数。可选的,c8=0,α8=1。
在训练过程中,关键点三元组损失可提升待训练网络基于第十五特征数据得到的第二待识别车辆的识别结果的准确度,从而提升车辆识别网络对第一待识别车辆的分类准确度。
作为一种可选的实施方式,在执行步骤66之前,车辆识别装置还执行以下步骤:
67、依据上述第十六特征数据,得到上述第二待识别车辆的第五识别结果。
本申请实施例中,第五识别结果包括第二待识别车辆的类别信息。车辆识别装置依据第十六特征数据,可确定第二待识别车辆的类别,进而得到第五识别结果。
68、依据上述第五识别结果和上述标签,得到上述第五识别结果的焦点损失,作为局部像素点区域焦点损失。
假设第五识别结果的焦点损失为LF3,则LF3满足下式:
Figure BDA0002675768000000291
其中,B为训练图像的数量,βn为正数,γ为非负数,uk为第五识别结果中与标签的类别对应的概率。可选的,βn=2,γ=2。
例如,训练图像包括图像a,使用待训练网络对图像a进行处理得到第五识别结果1。若图像a的标签所包括的类别为车辆1(即图像a的标签为车辆1)。在第五识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.9、图像a中的第二待识别车辆为车辆2的概率为0.1。假设βn=2,γ=2,此时,LF3=-2×(1-0.9)2×log0.9。
又例如,训练图像包括图像a和图像b,使用待训练网络对图像a进行处理得到第五识别结果1,使用待训练网络对图像b进行处理得到第五识别结果2。若图像a的标签所包括的类别为车辆1(即图像a的标签为车辆1),图像b的标签所包括的类别为车辆2(即图像a的标签为车辆2)。在第五识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.3、图像a中的第二待识别车辆为车辆2的概率为0.7。在第五识别结果2中,图像b中的第二待识别车辆为车辆1的概率为0.2、图像b中的第二待识别车辆为车辆2的概率为0.8。假设βn=2,γ=2,此时,LF3=-2×(1-0.3)2×log0.3-2×(1-0.8)2×log0.8。
在得到局部像素点区域焦点损失后,车辆识别装置在执行步骤66的过程中执行以下步骤:
69、依据上述第一全局损失、上述第一关键点损失、上述第一局部像素点区域损失、上述关键点类别损失、上述关键点排序损失、上述局部像素点区域类别损失、上述关键点焦点损失、上述关键点三元组损失、上述局部像素点区域焦点损失和上述局部像素点区域排序损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,关键点类别损失为p2,关键点排序损失为p3,局部像素点区域类别损失为r2,局部像素点区域排序损失为r3,局部像素点区域焦点损失为r4,关键点焦点损失为p4,关键点三元组损失为p5,总损失为Lt,在一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、r4、Lt满足下式:
Lt=G1+p1+p2+p3+p4+p5+r1+r2+r3+r4+c9…公式(32)
其中,c9为实数。可选的,c9=0。
在另一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、r4、Lt满足下式:
Lt=α9×(G1+p1+p2+p3+p4+p5+r1+r2+r3+r4)…公式(33)
其中,α9为实数。可选的,α9=1。
在又一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、r4、Lt满足下式:
Lt=α9×(G1+p1+p2+p3+p4+p5+r1+r2+r3+r4)+9…公式(34)
其中,α9、c9均为实数。可选的,c9=0,α9=1。
将最大概率处于第五概率阈值至第六概率阈值之间的第五识别结果所对应的图像称为第三容易样本,将训练图像中除第三容易样本之外的图像称为第三难样本。例如,假设第五概率阈值为0.4,第六概率阈值为0.7。在训练过程中,待训练网络通过对图像a进行处理得到第五识别结果1。
若在第五识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.8,图像a中第二待识别车辆为车辆2的概率为0.2。由于第五识别结果1的最大概率为0.8,该最大概率大于第六概率阈值,图像a为第三容易样本。
若在第五识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.5,图像a中第二待识别车辆为车辆2的概率为0.5。由于第五识别结果1的最大概率为0.5,该最大概率阈值大于第五概率阈值,且该最大概率小于第六阈值,图像a为第三难样本。
在训练过程中,通过计算第五识别结果的焦点损失得到局部像素点区域焦点损失,进而确定总损失,可提升对第三难样本的训练效果,进而提升对待训练网络的训练效果。
作为一种可选的实施方式,在执行步骤69之前,车辆识别装置还执行以下步骤:
70、依据上述第十六特征数据、上述第一正样本图像的特征数据和上述第一负样本图像的特征数据,得到局部像素点区域三元组损失。
车辆识别装置计算第十六特征数据与第一正样本图像的特征数据之间的相似度得到第三正相似度、计算第十六特征数据与第一负样本图像的特征数据之间的相似度得到第三负相似度。
假设第十六特征数据为xc,第三正相似度为s5,第三负相似度为s6,局部像素点区域三元组损失为LT3,则LT3、s5、s6、xc满足下式:
LT3=[v3+s5-s6]…公式(35)
其中,v3为实数。可选的,v3=1。
可选的,第三正相似度为第十六特征数据与第一正样本图像的特征数据之间的第二范数。第三负相似度为第十六特征数据与第一负样本图像的特征数据之间的第二范数。
车辆识别装置计算第十六特征数据与正样本特征数据集中的特征数据之间的相似度得到第三正相似度集、计算第十六特征数据与负样本特征数据集中的特征数据之间的相似度得到第三负相似度集。将第三正相似度集中的最小值称为第三类内最小相似度,将第三负相似度集中的最大值称为第三类外最大相似度。
假设第十六特征数据为xc,第三类内最小相似度为maxd(xc,xp),第三类外最大相似度为mind(xc,xn),局部像素点区域三元组损失为LT3,则LT3、maxd(xc,xp)、mind(xc,xn)、xc满足下式:
LT3=[v3+maxd(xc,xp)-mind(xc,xn)]…公式(36)
其中,v3为实数。可选的,v3=1。
可选的,第十六特征数据与正样本特征数据集中的特征数据之间的相似度为,第十六特征数据与正样本特征数据集中的特征数据之间的第二范数。第十六特征数据与负样本特征数据集中的特征数据之间的相似度为,第十六特征数据与负样本特征数据集中的特征数据之间的第二范数。
在得到局部像素点区域焦点损失后,车辆识别装置在执行步骤69的过程中执行以下步骤:
71、依据上述第一全局损失、上述第一关键点损失、上述第一局部像素点区域损失、上述关键点类别损失、上述关键点排序损失、上述局部像素点区域类别损失、上述关键点焦点损失、上述关键点三元组损失、上述局部像素点区域焦点损失、上述局部像素点三元组损失和上述局部像素点区域排序损失,得到上述总损失。
假设第一全局损失为G1,第一关键点损失为p1,第一局部像素点区域损失为r1,关键点类别损失为p2,关键点排序损失为p3,局部像素点区域类别损失为r2,局部像素点区域排序损失为r3,局部像素点区域焦点损失为r4,局部像素点区域三元损失为r5,关键点焦点损失为p4,关键点三元组损失为p5,总损失为Lt,在一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、r4、r5、Lt满足下式:
Lt=G1+p1+p2+p3+p4+p5+r1+r2+r3+r4+r5+c10…公式(37)
其中,c10为实数。可选的,c10=0。
在另一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、r4、r5、Lt满足下式:
Lt=α10×(G1+p1+p2+p3+p4+p5+r1+r2+r3+r4+r5)…公式(38)
其中,α10为实数。可选的,α10=1。
在又一种可能实现的方式中,G1、p1、p2、p3、p4、p5、r1、r2、r3、r4、r5、Lt满足下式:
Lt=α10×(G1+p1+p2+p3+p4+p5+r1+r2+r3+r4+r5)+c10…公式(39)
其中,α10、c10均为实数。可选的,c10=0,α10=1。
将最大概率处于第五概率阈值至第六概率阈值之间的第五识别结果所对应的图像称为第三容易样本,将训练图像中除第三容易样本之外的图像称为第三难样本。例如,假设第五概率阈值为0.4,第六概率阈值为0.7。在训练过程中,待训练网络通过对图像a进行处理得到第五识别结果1。
若在第五识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.8,图像a中第二待识别车辆为车辆2的概率为0.2。由于第五识别结果1的最大概率为0.8,该最大概率大于第六概率阈值,图像a为第三容易样本。
若在第五识别结果1中,图像a中的第二待识别车辆为车辆1的概率为0.5,图像a中第二待识别车辆为车辆2的概率为0.5。由于第五识别结果1的最大概率为0.5,该最大概率阈值大于第五概率阈值,且该最大概率小于第六阈值,图像a为第三难样本。
在训练过程中,局部像素点区域三元组损失可提升待训练网络基于第十六特征数据得到的第二待识别车辆的识别结果的准确度,从而提升车辆识别网络对第一待识别车辆的分类准确度。
作为一种可选的实施方式,车辆识别装置获取生成数据集,并使用生成数据集对关键点和局部像素点区域生成模块进行训练。
本申请实施例中,生成数据集包括至少一张热力图训练图像,且每张热力图训练图像的标签包括关键点标签热力图和局部像素点区域标签热力图。其中,关键点标签热力图包括热力图训练图像中关键点的位置信息,局部像素点区域标签热力图包括热力图训练图像中局部像素点区域的位置信息。
基于本申请实施例提供的技术的方案,本申请实施例还提供了一种可能的应用场景。随着公共场所内摄像头数量的快速增长,如何有效的通过海量视频流确定肇事逃逸车辆的行踪具有重要的意义。
A地方发生交通事故,且肇事车辆逃逸。通过A事故现场的监控摄像头采集到了肇事逃逸车辆的图像。警方可将肇事逃逸车辆的图像输入至车辆识别装置。
车辆识别装置使用本申请实施例提供的技术方案,从肇事逃逸车辆的图像中提取出肇事逃逸车辆的特征数据。
车辆识别装置可与多个监控摄像头相连,不同的监控摄像头安装在不同位置,且车辆识别装置可从每个监控摄像头获取实时采集的视频流。车辆识别装置使用本申请实施例提供的技术方案,从视频流中的图像中提取出视频流中的车辆的特征数据,得到特征数据库。
车辆识别装置将肇事逃逸车辆的特征数据与特征数据库中的特征数据进行比对,得到与肇事逃逸车辆的特征数据匹配的特征数据,作为目标特征数据。确定与目标特征数据对应的图像为包含肇事逃逸车辆的图像,进而可依据包含肇事逃逸车辆的图像确定肇事逃逸车辆的行踪。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参阅图12,图12为本申请实施例提供的一种车辆识别装置1的结构示意图,该车辆识别装置1包括:获取单元11、第一处理单元12、第二处理单元13、融合处理单元14、第三处理单元15、第四处理单元16,其中:
获取单元11,用于获取包含第一待识别车辆的待处理图像;
第一处理单元12,用于对所述待处理图像进行第一特征提取处理,得到包括所述第一待识别车辆的局部特征信息的第一特征数据;
第二处理单元13,用于对所述待处理图像进行第二特征提取处理,得到包括所述第一待识别车辆的全局特征信息的第二特征数据;
融合处理单元14,用于对所述第一特征数据和所述第二特征数据进行融合处理,得到所述第一待识别车辆的第三特征数据;所述第三特征数据用于获得所述第一待识别车辆的识别结果。
结合本申请任一实施方式,所述局部特征信息包括关键点特征信息,所述第一特征数据包括所述待识别车辆的至少一个关键点的特征信息。
结合本申请任一实施方式,所述局部特征信息还包括局部像素点区域特征信息,所述第一特征数据还包括所述待识别车辆的至少一个局部像素点区域的特征信息。
结合本申请任一实施方式,所述第一处理单元12用于:
对所述待处理图像进行第三特征提取处理,得到第四特征数据;所述第四特征数据包括所述第一待识别车辆的至少一个关键点的特征信息;
对所述待处理图像进行第四特征提取处理,得到第五特征数据;所述第五特征数据包括所述第一待识别车辆的至少一个局部像素点区域的特征信息;所述局部像素点区域属于所述第一待识别车辆所覆盖的像素点区域,且所述局部像素点区域的面积小于所述第一待识别车辆所覆盖的像素点区域的面积;
对所述第四特征数据和第五特征数据进行融合处理,得到所述第一特征数据。
结合本申请任一实施方式,所述第一处理单元12用于:
对所述待处理图像进行第五特征提取处理,得到至少一个第六特征数据;所述第六特征数据包括所述关键点的特征信息,且任意两个所述第六特征数据所包括的特征信息属于不同的所述关键点;
从所述至少一个第六特征数据中选取包括信息量最多的k个特征数据,得到k个第七特征数据;所述k为不小于1的整数;
依据所述k个第七特征数据得到所述第四特征数据。
结合本申请任一实施方式,所述第一处理单元12用于:
对所述待处理图像进行第六特征提取处理,得到至少一张第一热力图;所述第一热力图包括所述关键点在所述待处理图像中的位置信息,且任意两张所述第一热力图所包括的信息属于不同的所述关键点;
对所述待处理图像进行第七特征提取处理,得到所述待处理图像的第一特征图像;所述第一特征图像包括所述待处理图像中的关键点的特征信息;
分别确定每张所述第一热力图与所述第一特征图像之间的点积,得到所述至少一个第六特征数据。
结合本申请任一实施方式,所述第一处理单元12用于:
对所述至少一个第六特征数据中的特征数据分别进行池化处理,得到至少一个第八特征数据;
依据所述至少一个第八特征数据所包括的信息量,得到至少一个第一概率;所述第一概率用于表征所述第六特征数据所包括的信息量;所述第一概率与所述第六特征数据一一对应;
在所述第一概率与所述第六特征数据所包括的信息量呈正相关的情况下,选取最大的k个所述第一概率所对应的所述第六特征数据,作为所述k个第七特征数据;或,
在所述第一概率与所述第六特征数据所包括的信息量呈负相关的情况下,选取最小的k个所述第一概率所对应的所述第六特征数据,作为所述k个第七特征数据。
结合本申请任一实施方式,所述第一处理单元12用于:
对所述待处理图像进行第十特征提取处理,得到至少一个第九特征数据;所述第九特征数据包括所述关键点的特征信息,且任意两个所述第九特征数据所包括的特征信息属于不同的所述局部像素点区域;
从所述至少两个第九特征数据中选取包含信息量最多的m个特征数据,得到m个第十特征数据;所述m为不小于1的整数;
依据所述m个第十特征数据得到所述第五特征数据。
结合本申请任一实施方式,所述第一处理单元12用于:
对所述待处理图像进行第十一特征提取处理,得到所述至少一张第二热力图;所述第二热力图包括所述局部像素点区域在所述待处理图像中的位置信息,且任意两张所述第二热力图所包括的信息属于不同的所述局部像素点区域;
对所述待处理图像进行第十二特征提取处理,得到所述待处理图像的第二特征图像;所述第二特征图像包括所述待处理图像中的局部像素点区域的特征信息;
分别确定每张所述第二热力图与所述第二特征图像之间的点积,得到所述至少一个第九特征数据。
结合本申请任一实施方式,所述第一处理单元12用于:
对所述第九特征数据中的特征数据分别进行池化处理,得到至少一个第十一特征数据;
依据所述至少一个第十一特征数据所包括的信息量,得到至少一个第二概率;所述第二概率用于表征所述第九特征数据中包括的信息量;所述第二概率与所述第九特征数据一一对应;
在所述第二概率与所述第九特征数据所包括的信息量呈正相关的情况下,选取最大的m个所述第二概率所对应的所述第九特征数据,作为所述m个第十特征数据;或,
在所述第二概率与所述第九特征数据所包括的信息量呈负相关的情况下,选取最小的m个所述第二概率所对应的所述第九特征数据,作为所述m个第十特征数据。
结合本申请任一实施方式,所述至少一个局部像素点区域包括:第一像素点区域和第二像素点区域,所述第九特征数据的数量和所述m均大于1,所述m个第十特征数据包括:第十二特征数据和第十三特征数据,所述第十二特征数据包括所述第一像素点区域的特征信息,所述第十三特征数据包括所述第二像素点区域的特征信息;
所述第一处理单元12用于:
依据所述第十二特征数据所包括的信息量得到第一权重,依据所述第十三特征数据所包括的信息量得到第二权重;所述第一权重与所述第十二特征数据所包括的信息量呈正相关,所述第二权重与所述第十三特征数据所包括的信息量呈正相关;
依据所述第一权重和所述第二权重,对所述第十二特征数据和所述第十三特征数据进行加权融合,得到所述第五特征数据。
结合本申请任一实施方式,所述车辆识别装置执行的车辆识别方法应用于车辆识别网络,所述获取单元,还用于获取包含第二待识别车辆的训练图像和待训练网络;
所述第一处理单元12,还用于使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的全局特征信息的第十四特征数据和包括所述第二待识别车辆的关键点特征信息的第十五特征数据;
第三处理单元15,用于依据所述第十四特征数据和所述训练图像的标签,得到第一全局损失;
所述第三处理单元15,还用于依据所述第十五特征数据和所述标签,得到第一关键点损失;
所述第三处理单元15,还用于依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失;
第四处理单元16,用于基于所述总损失调整所述待训练网络的参数,得到所述车辆识别网络。
结合本申请任一实施方式,所述第一处理单元12,还用于在所述依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失之前,使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的局部像素点区域的特征信息的第十六特征数据;
所述第三处理单元15,还用于依据所述第十六特征数据和所述标签,得到第一局部像素点区域损失;
所述第三处理单元15,还用于:依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失。
结合本申请任一实施方式,所述第一处理单元12,用于:
使用所述待训练网络对所述训练图像进行处理,得到至少一个第十七特征数据;所述第十七特征数据包括所述第二待识别车辆的关键点特征信息,且任意两个所述第十七特征数据所包括的特征信息属于不同的所述关键点;
从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到s个第十八特征数据;所述s为不小于1的整数;
对所述s个第十八特征数据进行融合处理,得到所述第十五特征数据。
结合本申请任一实施方式,所述第三处理单元,还用于在所述依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失之前,依据所述s个第十八特征数据,得到所述第二待识别车辆的s个第一识别结果;
分别依据所述s个第一识别结果与所述标签之间的差异,得到关键点类别损失;
所述第四处理单元16,用于:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失。
结合本申请任一实施方式,所述第一处理单元12,用于:
依据所包括的信息量对所述至少一个第十七特征数据进行排序,得到第一顺序;所述第一顺序为所包括的信息量从大到小的顺序,所述第一顺序或为所包括的信息量从小到大的顺序;
依据所述第一顺序从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到所述s个第十八特征数据;
所述第三处理单元15,用于在所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失之前,依据所对应的所述关键点类别损失对所述s个第一识别结果进行排序,得到第二顺序;所述第二顺序为所述关键点类别损失从大到小的顺序,所述第二顺序或为所述关键点类别损失从小到大的顺序;
依据所述第一顺序和所述第二顺序之间的差异,得到关键点排序损失;
所述第四处理单元16,用于:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失。
结合本申请任一实施方式,所述第一处理单元12,用于:
使用所述待训练网络对所述训练图像进行处理,得到至少一个第十九特征数据;所述第十九特征数据包括所述局部像素点区域的特征信息,且任意两个所述第十九特征数据所包括的特征信息属于不同的所述局部像素点区域;
从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到p个第二十特征数据;所述p为不小于1的整数;
对所述p个第二十特征数据进行融合处理,得到所述第十六特征数据。
结合本申请任一实施方式,所述第三处理单元15,用于在依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失之前,依据所述p个第二十特征数据,得到所述第二待识别车辆的p个第二识别结果;
分别依据所述p个第二识别结果与所述标签之间的差异,得到局部像素点区域类别损失;
所述第四处理单元16,用于:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失。
结合本申请任一实施方式,所述第一处理单元12,用于:
依据所包括的信息量对所述至少一个第十九特征数据进行排序,得到第三顺序;所述第三顺序为所包括的信息量从大到小的顺序,所述第三顺序或为所包括的信息量从小到大的顺序;
依据所述第三顺序从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到所述p个第二十特征数据;
所述第三处理单元15,用于在所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失之前,依据所对应的所述局部像素点区域类别损失对所述p个第二识别结果进行排序,得到第四顺序;所述第四顺序为所述局部像素点区域类别损失从大到小的顺序,所述第四顺序或为所述局部像素点区域类别损失从小到大的顺序;
依据所述第三顺序和所述第四顺序之间的差异,得到局部像素点区域排序损失;
所述第四处理单元16,用于:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失、所述局部像素点区域类别损失和所述局部像素点区域排序损失,得到所述总损失。
结合本申请任一实施方式,所述第一全局损失包括全局焦点损失;所述第三处理单元15,用于:
依据所述第十四特征数据,得到所述第二待识别车辆的第三识别结果;
依据所述第三识别结果和所述标签,得到所述第三识别结果的焦点损失,作为所述全局焦点损失。
结合本申请任一实施方式,所述训练图像属于训练图像集;所述训练图像集还包括所述训练图像的第一正样本图像和所述训练图像的第一负样本图像;所述第一全局损失还包括全局三元组损失;
所述第三处理单元15,还用于:
使用所述待训练网络对所述第一正样本图像进行特征提取处理,得到所述第一正样本图像的特征数据;
使用所述待训练网络对所述第一负样本图像进行特征提取处理,得到所述第一负样本图像的特征数据;
依据所述第十二特征数据、所述第一正样本图像的特征数据和所述第一负样本图像的特征数据,得到所述全局三元组损失。
本实施例中,车辆识别装置通过对第一特征数据和第二特征数据进行融合处理,可得到既包括第一待识别车辆的全局特征信息又包括第一待识别车辆的局部特征信息的第三特征数据。将第三特征数据作为第一待识别车辆的特征数据,可丰富第一待识别车辆的特征数据所包括的信息。
在一些实施例中,本申请实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
图13为本申请实施例提供的一种车辆识别装置的硬件结构示意图。该车辆识别装置2包括处理器21,存储器22,输入装置23,输出装置24。该处理器21、存储器22、输入装置23和输出装置24通过连接器相耦合,该连接器包括各类接口、传输线或总线等等,本申请实施例对此不作限定。应当理解,本申请的各个实施例中,耦合是指通过特定方式的相互联系,包括直接相连或者通过其他设备间接相连,例如可以通过各类接口、传输线、总线等相连。
处理器21可以是一个或多个图形处理器(graphics processing unit,GPU),在处理器21是一个GPU的情况下,该GPU可以是单核GPU,也可以是多核GPU。可选的,处理器21可以是多个GPU构成的处理器组,多个处理器之间通过一个或多个总线彼此耦合。可选的,该处理器还可以为其他类型的处理器等等,本申请实施例不作限定。
存储器22可用于存储计算机程序指令,以及用于执行本申请方案的程序代码在内的各类计算机程序代码。可选地,存储器包括但不限于是随机存储记忆体(random accessmemory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasableprogrammable read only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器用于相关指令及数据。
输入装置23用于输入数据和/或信号,以及输出装置24用于输出数据和/或信号。输入装置23和输出装置24可以是独立的器件,也可以是一个整体的器件。
可理解,本申请实施例中,存储器22不仅可用于存储相关指令,还可用于存储相关数据,如该存储器22可用于存储通过输入装置23获取的待处理图像,又或者该存储器22还可用于存储通过处理器21得到的第三特征数据等等,本申请实施例对于该存储器中具体所存储的数据不作限定。
可以理解的是,图13仅仅示出了一种车辆识别装置的简化设计。在实际应用中,车辆识别装置还可以分别包含必要的其他元件,包含但不限于任意数量的输入/输出装置、处理器、存储器等,而所有可以实现本申请实施例的车辆识别装置都在本申请的保护范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。所属领域的技术人员还可以清楚地了解到,本申请各个实施例描述各有侧重,为描述的方便和简洁,相同或类似的部分在不同实施例中可能没有赘述,因此,在某一实施例未描述或未详细描述的部分可以参见其他实施例的记载。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriberline,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digital versatiledisc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-only memory,ROM)或随机存储存储器(random access memory,RAM)、磁碟或者光盘等各种可存储程序代码的介质。

Claims (24)

1.一种车辆识别方法,其特征在于,所述方法包括:
获取包含第一待识别车辆的待处理图像;
对所述待处理图像进行第一特征提取处理,得到包括所述第一待识别车辆的局部特征信息的第一特征数据;
对所述待处理图像进行第二特征提取处理,得到包括所述第一待识别车辆的全局特征信息的第二特征数据;
对所述第一特征数据和所述第二特征数据进行融合处理,得到所述第一待识别车辆的第三特征数据;所述第三特征数据用于获得所述第一待识别车辆的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述局部特征信息包括关键点特征信息,所述第一特征数据包括所述待识别车辆的至少一个关键点的特征信息。
3.根据权利要求2所述的方法,其特征在于,所述局部特征信息还包括局部像素点区域特征信息,所述第一特征数据还包括所述待识别车辆的至少一个局部像素点区域的特征信息。
4.根据权利要求3所述的方法,其特征在于,所述对所述待处理图像进行第一特征提取处理,得到包括所述第一待识别车辆的局部特征信息的第一特征数据,包括:
对所述待处理图像进行第三特征提取处理,得到第四特征数据;所述第四特征数据包括所述第一待识别车辆的至少一个关键点的特征信息;
对所述待处理图像进行第四特征提取处理,得到第五特征数据;所述第五特征数据包括所述第一待识别车辆的至少一个局部像素点区域的特征信息;所述局部像素点区域属于所述第一待识别车辆所覆盖的像素点区域,且所述局部像素点区域的面积小于所述第一待识别车辆所覆盖的像素点区域的面积;
对所述第四特征数据和第五特征数据进行融合处理,得到所述第一特征数据。
5.根据权利要求4所述的方法,其特征在于,所述对所述待处理图像进行第三特征提取处理,得到第四特征数据,包括:
对所述待处理图像进行第五特征提取处理,得到至少一个第六特征数据;所述第六特征数据包括所述关键点的特征信息,且任意两个所述第六特征数据所包括的特征信息属于不同的所述关键点;
从所述至少一个第六特征数据中选取包括信息量最多的k个特征数据,得到k个第七特征数据;所述k为不小于1的整数;
依据所述k个第七特征数据得到所述第四特征数据。
6.根据权利要求5所述的方法,其特征在于,所述对所述待处理图像进行第五特征提取处理,得到至少一个第六特征数据,包括:
对所述待处理图像进行第六特征提取处理,得到至少一张第一热力图;所述第一热力图包括所述关键点在所述待处理图像中的位置信息,且任意两张所述第一热力图所包括的信息属于不同的所述关键点;
对所述待处理图像进行第七特征提取处理,得到所述待处理图像的第一特征图像;所述第一特征图像包括所述待处理图像中的关键点的特征信息;
分别确定每张所述第一热力图与所述第一特征图像之间的点积,得到所述至少一个第六特征数据。
7.根据权利要求5或6所述的方法,其特征在于,所述从所述至少一个第六特征数据中选取包括信息量最多的k个特征数据,得到k个第七特征数据,包括:
对所述至少一个第六特征数据中的特征数据分别进行池化处理,得到至少一个第八特征数据;
依据所述至少一个第八特征数据所包括的信息量,得到至少一个第一概率;所述第一概率用于表征所述第六特征数据所包括的信息量;所述第一概率与所述第六特征数据一一对应;
在所述第一概率与所述第六特征数据所包括的信息量呈正相关的情况下,选取最大的k个所述第一概率所对应的所述第六特征数据,作为所述k个第七特征数据;或,
在所述第一概率与所述第六特征数据所包括的信息量呈负相关的情况下,选取最小的k个所述第一概率所对应的所述第六特征数据,作为所述k个第七特征数据。
8.根据权利要求3至7中任意一项所述的方法,其特征在于,所述对所述待处理图像进行第四特征提取处理,得到第五特征数据,包括:
对所述待处理图像进行第十特征提取处理,得到至少一个第九特征数据;所述第九特征数据包括所述关键点的特征信息,且任意两个所述第九特征数据所包括的特征信息属于不同的所述局部像素点区域;
从所述至少两个第九特征数据中选取包含信息量最多的m个特征数据,得到m个第十特征数据;所述m为不小于1的整数;
依据所述m个第十特征数据得到所述第五特征数据。
9.根据权利要求8所述的方法,其特征在于,所述对所述待处理图像进行第十特征提取处理,得到至少一个第九特征数据,包括:
对所述待处理图像进行第十一特征提取处理,得到所述至少一张第二热力图;所述第二热力图包括所述局部像素点区域在所述待处理图像中的位置信息,且任意两张所述第二热力图所包括的信息属于不同的所述局部像素点区域;
对所述待处理图像进行第十二特征提取处理,得到所述待处理图像的第二特征图像;所述第二特征图像包括所述待处理图像中的局部像素点区域的特征信息;
分别确定每张所述第二热力图与所述第二特征图像之间的点积,得到所述至少一个第九特征数据。
10.根据权利要求8或9所述的方法,其特征在于,所述从所述至少两个第九特征数据中选取包含信息量最多的m个特征数据,得到m个第十特征数据,包括:
对所述第九特征数据中的特征数据分别进行池化处理,得到至少一个第十一特征数据;
依据所述至少一个第十一特征数据所包括的信息量,得到至少一个第二概率;所述第二概率用于表征所述第九特征数据中包括的信息量;所述第二概率与所述第九特征数据一一对应;
在所述第二概率与所述第九特征数据所包括的信息量呈正相关的情况下,选取最大的m个所述第二概率所对应的所述第九特征数据,作为所述m个第十特征数据;或,
在所述第二概率与所述第九特征数据所包括的信息量呈负相关的情况下,选取最小的m个所述第二概率所对应的所述第九特征数据,作为所述m个第十特征数据。
11.根据权利要求8至10中任意一项所述的方法,其特征在于,所述至少一个局部像素点区域包括:第一像素点区域和第二像素点区域,所述第九特征数据的数量和所述m均大于1,所述m个第十特征数据包括:第十二特征数据和第十三特征数据,所述第十二特征数据包括所述第一像素点区域的特征信息,所述第十三特征数据包括所述第二像素点区域的特征信息;
所述依据所述m个第十特征数据得到所述第五特征数据,包括:
依据所述第十二特征数据所包括的信息量得到第一权重,依据所述第十三特征数据所包括的信息量得到第二权重;所述第一权重与所述第十二特征数据所包括的信息量呈正相关,所述第二权重与所述第十三特征数据所包括的信息量呈正相关;
依据所述第一权重和所述第二权重,对所述第十二特征数据和所述第十三特征数据进行加权融合,得到所述第五特征数据。
12.根据权利要求1至11中任意一项所述的方法,其特征在于,所述车辆识别方法应用于车辆识别网络,所述车辆识别网络的训练方法包括:
获取包含第二待识别车辆的训练图像和待训练网络;
使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的全局特征信息的第十四特征数据和包括所述第二待识别车辆的关键点特征信息的第十五特征数据;
依据所述第十四特征数据和所述训练图像的标签,得到第一全局损失;
依据所述第十五特征数据和所述标签,得到第一关键点损失;
依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失;
基于所述总损失调整所述待训练网络的参数,得到所述车辆识别网络。
13.根据权利要求12所述的方法,其特征在于,在所述依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失之前,所述方法还包括:
使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的局部像素点区域的特征信息的第十六特征数据;
依据所述第十六特征数据和所述标签,得到第一局部像素点区域损失;
所述依据所述第一全局损失和所述第一关键点损失,得到所述待训练网络的总损失,包括:
依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失。
14.根据权利要求13所述的方法,其特征在于,所述使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的关键点特征信息的第十五特征数据,包括:
使用所述待训练网络对所述训练图像进行处理,得到至少一个第十七特征数据;所述第十七特征数据包括所述第二待识别车辆的关键点特征信息,且任意两个所述第十七特征数据所包括的特征信息属于不同的所述关键点;
从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到s个第十八特征数据;所述s为不小于1的整数;
对所述s个第十八特征数据进行融合处理,得到所述第十五特征数据。
15.根据权利要求14所述的方法,其特征在于,在所述依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失之前,所述方法还包括:
依据所述s个第十八特征数据,得到所述第二待识别车辆的s个第一识别结果;
分别依据所述s个第一识别结果与所述标签之间的差异,得到关键点类别损失;
所述依据所述第一全局损失、所述第一关键点损失和所述第一局部像素点区域损失,得到所述总损失,包括:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失。
16.根据权利要求14或15所述的方法,其特征在于,所述从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到s个第十八特征数据,包括:
依据所包括的信息量对所述至少一个第十七特征数据进行排序,得到第一顺序;所述第一顺序为所包括的信息量从大到小的顺序,所述第一顺序或为所包括的信息量从小到大的顺序;
依据所述第一顺序从所述至少一个第十七特征数据中选取包括信息量最多的s个特征数据,得到所述s个第十八特征数据;
在所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失之前,所述方法还包括:
依据所对应的所述关键点类别损失对所述s个第一识别结果进行排序,得到第二顺序;所述第二顺序为所述关键点类别损失从大到小的顺序,所述第二顺序或为所述关键点类别损失从小到大的顺序;
依据所述第一顺序和所述第二顺序之间的差异,得到关键点排序损失;
所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失和所述关键点类别损失,得到所述总损失,包括:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失。
17.根据权利要求16所述的方法,其特征在于,所述使用所述待训练网络对所述训练图像进行处理,得到包括所述第二待识别车辆的局部像素点区域的特征信息的第十六特征数据,包括:
使用所述待训练网络对所述训练图像进行处理,得到至少一个第十九特征数据;所述第十九特征数据包括所述局部像素点区域的特征信息,且任意两个所述第十九特征数据所包括的特征信息属于不同的所述局部像素点区域;
从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到p个第二十特征数据;所述p为不小于1的整数;
对所述p个第二十特征数据进行融合处理,得到所述第十六特征数据。
18.根据权利要求17所述的方法,其特征在于,在依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失之前,所述方法还包括:
依据所述p个第二十特征数据,得到所述第二待识别车辆的p个第二识别结果;
分别依据所述p个第二识别结果与所述标签之间的差异,得到局部像素点区域类别损失;
所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失和所述关键点排序损失,得到所述总损失,包括:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失。
19.根据权利要求17或18所述的方法,其特征在于,所述从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到p个第二十特征数据,包括:
依据所包括的信息量对所述至少一个第十九特征数据进行排序,得到第三顺序;所述第三顺序为所包括的信息量从大到小的顺序,所述第三顺序或为所包括的信息量从小到大的顺序;
依据所述第三顺序从所述至少一个第十九特征数据中选取包括信息量最多的p个特征数据,得到所述p个第二十特征数据;
在所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失之前,所述方法还包括:
依据所对应的所述局部像素点区域类别损失对所述p个第二识别结果进行排序,得到第四顺序;所述第四顺序为所述局部像素点区域类别损失从大到小的顺序,所述第四顺序或为所述局部像素点区域类别损失从小到大的顺序;
依据所述第三顺序和所述第四顺序之间的差异,得到局部像素点区域排序损失;
所述依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失和所述局部像素点区域类别损失,得到所述总损失,包括:
依据所述第一全局损失、所述第一关键点损失、所述第一局部像素点区域损失、所述关键点类别损失、所述关键点排序损失、所述局部像素点区域类别损失和所述局部像素点区域排序损失,得到所述总损失。
20.根据权利要求12至19中任意一项所述的方法,其特征在于,所述第一全局损失包括全局焦点损失;所述依据所述第十四特征数据和所述训练图像的标签,得到第一全局损失,包括:
依据所述第十四特征数据,得到所述第二待识别车辆的第三识别结果;
依据所述第三识别结果和所述标签,得到所述第三识别结果的焦点损失,作为所述全局焦点损失。
21.根据权利要求20所述的方法,其特征在于,所述训练图像属于训练图像集;所述训练图像集还包括所述训练图像的第一正样本图像和所述训练图像的第一负样本图像;所述第一全局损失还包括全局三元组损失;所述方法还包括:
使用所述待训练网络对所述第一正样本图像进行特征提取处理,得到所述第一正样本图像的特征数据;
使用所述待训练网络对所述第一负样本图像进行特征提取处理,得到所述第一负样本图像的特征数据;
依据所述第十二特征数据、所述第一正样本图像的特征数据和所述第一负样本图像的特征数据,得到所述全局三元组损失。
22.一种车辆识别装置,其特征在于,所述装置包括:
获取单元,用于获取包含第一待识别车辆的待处理图像;
第一处理单元,用于对所述待处理图像进行第一特征提取处理,得到包括所述第一待识别车辆的局部特征信息的第一特征数据;
第二处理单元,用于对所述待处理图像进行第二特征提取处理,得到包括所述第一待识别车辆的全局特征信息的第二特征数据;
融合处理单元,用于对所述第一特征数据和所述第二特征数据进行融合处理,得到所述第一待识别车辆的第三特征数据;所述第三特征数据用于获得所述第一待识别车辆的识别结果。
23.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如权利要求1至21中任一项所述的方法。
24.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,使所述处理器执行权利要求1至21中任意一项所述的方法。
CN202010947349.1A 2020-09-10 2020-09-10 车辆识别方法及装置、电子设备及存储介质 Active CN112101183B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN202010947349.1A CN112101183B (zh) 2020-09-10 2020-09-10 车辆识别方法及装置、电子设备及存储介质
CN202111056820.9A CN113780165A (zh) 2020-09-10 2020-09-10 车辆识别方法及装置、电子设备及存储介质
PCT/CN2020/140315 WO2022052375A1 (zh) 2020-09-10 2020-12-28 车辆识别方法及装置、电子设备及存储介质
KR1020217042600A KR20220035335A (ko) 2020-09-10 2020-12-28 차량 식별 방법 및 장치, 전자 기기 및 저장 매체
JP2021575043A JP2023501028A (ja) 2020-09-10 2020-12-28 車両識別方法及び装置、電子デバイス及び記憶媒体
TW110126129A TW202221567A (zh) 2020-09-10 2021-07-15 車輛識別方法、電子設備及電腦可讀儲存介質

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010947349.1A CN112101183B (zh) 2020-09-10 2020-09-10 车辆识别方法及装置、电子设备及存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202111056820.9A Division CN113780165A (zh) 2020-09-10 2020-09-10 车辆识别方法及装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112101183A true CN112101183A (zh) 2020-12-18
CN112101183B CN112101183B (zh) 2021-08-24

Family

ID=73752542

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010947349.1A Active CN112101183B (zh) 2020-09-10 2020-09-10 车辆识别方法及装置、电子设备及存储介质
CN202111056820.9A Withdrawn CN113780165A (zh) 2020-09-10 2020-09-10 车辆识别方法及装置、电子设备及存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202111056820.9A Withdrawn CN113780165A (zh) 2020-09-10 2020-09-10 车辆识别方法及装置、电子设备及存储介质

Country Status (5)

Country Link
JP (1) JP2023501028A (zh)
KR (1) KR20220035335A (zh)
CN (2) CN112101183B (zh)
TW (1) TW202221567A (zh)
WO (1) WO2022052375A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569912A (zh) * 2021-06-28 2021-10-29 北京百度网讯科技有限公司 车辆识别方法、装置、电子设备及存储介质
WO2022052375A1 (zh) * 2020-09-10 2022-03-17 深圳市商汤科技有限公司 车辆识别方法及装置、电子设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117455957B (zh) * 2023-12-25 2024-04-02 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于深度学习的车辆轨迹定位追踪方法及系统

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913405A (zh) * 2016-04-05 2016-08-31 智车优行科技(北京)有限公司 用于呈现图像细节的处理方法、装置及车辆
CN108229468A (zh) * 2017-06-28 2018-06-29 北京市商汤科技开发有限公司 车辆外观特征识别及车辆检索方法、装置、存储介质、电子设备
CN108229353A (zh) * 2017-12-21 2018-06-29 深圳市商汤科技有限公司 人体图像的分类方法和装置、电子设备、存储介质、程序
CN108319907A (zh) * 2018-01-26 2018-07-24 腾讯科技(深圳)有限公司 一种车辆识别方法、装置和存储介质
US20180260974A1 (en) * 2017-03-09 2018-09-13 Hewlett Packard Enterprise Development Lp Color recognition through learned color clusters
CN108564119A (zh) * 2018-04-04 2018-09-21 华中科技大学 一种任意姿态行人图片生成方法
CN108960140A (zh) * 2018-07-04 2018-12-07 国家新闻出版广电总局广播科学研究院 基于多区域特征提取和融合的行人再识别方法
CN109063768A (zh) * 2018-08-01 2018-12-21 北京旷视科技有限公司 车辆重识别方法、装置及系统
CN109685023A (zh) * 2018-12-27 2019-04-26 深圳开立生物医疗科技股份有限公司 一种超声图像的面部关键点检测方法及相关装置
CN110348463A (zh) * 2019-07-16 2019-10-18 北京百度网讯科技有限公司 用于识别车辆的方法和装置
CN110689481A (zh) * 2019-01-17 2020-01-14 成都通甲优博科技有限责任公司 车辆种类识别方法及装置
CN111126379A (zh) * 2019-11-22 2020-05-08 苏州浪潮智能科技有限公司 一种目标检测方法与装置
CN111199550A (zh) * 2020-04-09 2020-05-26 腾讯科技(深圳)有限公司 图像分割网络的训练方法、分割方法、装置和存储介质
CN111274954A (zh) * 2020-01-20 2020-06-12 河北工业大学 基于改进姿态估计算法的嵌入式平台实时跌倒检测方法
CN111311532A (zh) * 2020-03-26 2020-06-19 深圳市商汤科技有限公司 图像处理方法及装置、电子设备、存储介质
CN111340701A (zh) * 2020-02-24 2020-06-26 南京航空航天大学 一种基于聚类法筛选匹配点的电路板图像拼接方法
CN111339846A (zh) * 2020-02-12 2020-06-26 深圳市商汤科技有限公司 图像识别方法及装置、电子设备和存储介质
CN111401265A (zh) * 2020-03-19 2020-07-10 重庆紫光华山智安科技有限公司 行人重识别方法、装置、电子设备和计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9773186B2 (en) * 2013-03-15 2017-09-26 Mitek Systems, Inc. Methods for mobile image capture of vehicle identification numbers in a non-document
CN107862340A (zh) * 2017-11-16 2018-03-30 深圳市华尊科技股份有限公司 一种车型识别方法及装置
CN110533119B (zh) * 2019-09-04 2022-12-27 北京迈格威科技有限公司 标识识别方法及其模型的训练方法、装置及电子系统
CN112101183B (zh) * 2020-09-10 2021-08-24 深圳市商汤科技有限公司 车辆识别方法及装置、电子设备及存储介质

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913405A (zh) * 2016-04-05 2016-08-31 智车优行科技(北京)有限公司 用于呈现图像细节的处理方法、装置及车辆
US20180260974A1 (en) * 2017-03-09 2018-09-13 Hewlett Packard Enterprise Development Lp Color recognition through learned color clusters
CN108229468A (zh) * 2017-06-28 2018-06-29 北京市商汤科技开发有限公司 车辆外观特征识别及车辆检索方法、装置、存储介质、电子设备
CN108229353A (zh) * 2017-12-21 2018-06-29 深圳市商汤科技有限公司 人体图像的分类方法和装置、电子设备、存储介质、程序
CN108319907A (zh) * 2018-01-26 2018-07-24 腾讯科技(深圳)有限公司 一种车辆识别方法、装置和存储介质
CN108564119A (zh) * 2018-04-04 2018-09-21 华中科技大学 一种任意姿态行人图片生成方法
CN108960140A (zh) * 2018-07-04 2018-12-07 国家新闻出版广电总局广播科学研究院 基于多区域特征提取和融合的行人再识别方法
CN109063768A (zh) * 2018-08-01 2018-12-21 北京旷视科技有限公司 车辆重识别方法、装置及系统
CN109685023A (zh) * 2018-12-27 2019-04-26 深圳开立生物医疗科技股份有限公司 一种超声图像的面部关键点检测方法及相关装置
CN110689481A (zh) * 2019-01-17 2020-01-14 成都通甲优博科技有限责任公司 车辆种类识别方法及装置
CN110348463A (zh) * 2019-07-16 2019-10-18 北京百度网讯科技有限公司 用于识别车辆的方法和装置
CN111126379A (zh) * 2019-11-22 2020-05-08 苏州浪潮智能科技有限公司 一种目标检测方法与装置
CN111274954A (zh) * 2020-01-20 2020-06-12 河北工业大学 基于改进姿态估计算法的嵌入式平台实时跌倒检测方法
CN111339846A (zh) * 2020-02-12 2020-06-26 深圳市商汤科技有限公司 图像识别方法及装置、电子设备和存储介质
CN111340701A (zh) * 2020-02-24 2020-06-26 南京航空航天大学 一种基于聚类法筛选匹配点的电路板图像拼接方法
CN111401265A (zh) * 2020-03-19 2020-07-10 重庆紫光华山智安科技有限公司 行人重识别方法、装置、电子设备和计算机可读存储介质
CN111311532A (zh) * 2020-03-26 2020-06-19 深圳市商汤科技有限公司 图像处理方法及装置、电子设备、存储介质
CN111199550A (zh) * 2020-04-09 2020-05-26 腾讯科技(深圳)有限公司 图像分割网络的训练方法、分割方法、装置和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XING ZHAO LEE等: "Global and Local Deep Feature Representation Fusion for Vehicle Re-Identification", 《2019 IEEE VISUAL COMMUNICATIONS AND IMAGE PROCESSING (VCIP)》 *
黄俊洁等: "基于全局和局部卷积特征融合的车辆目标检测", 《西南科技大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022052375A1 (zh) * 2020-09-10 2022-03-17 深圳市商汤科技有限公司 车辆识别方法及装置、电子设备及存储介质
CN113569912A (zh) * 2021-06-28 2021-10-29 北京百度网讯科技有限公司 车辆识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
KR20220035335A (ko) 2022-03-22
TW202221567A (zh) 2022-06-01
CN113780165A (zh) 2021-12-10
CN112101183B (zh) 2021-08-24
JP2023501028A (ja) 2023-01-18
WO2022052375A1 (zh) 2022-03-17

Similar Documents

Publication Publication Date Title
CN112101183B (zh) 车辆识别方法及装置、电子设备及存储介质
CN107292291B (zh) 一种车辆识别方法和系统
CN111598124B (zh) 图像处理及装置、处理器、电子设备、存储介质
EP3807837A1 (en) Vehicle re-identification techniques using neural networks for image analysis, viewpoint-aware pattern recognition, and generation of multi-view vehicle representations
CN111126224A (zh) 车辆检测方法及分类识别模型训练方法
CN109034086B (zh) 车辆重识别方法、装置及系统
US10445602B2 (en) Apparatus and method for recognizing traffic signs
CN104200228B (zh) 一种安全带识别方法与系统
CN108764096B (zh) 一种行人重识别系统和方法
CN110598560A (zh) 基于神经网络增强的夜间监控识别方法和系统
CN108830254B (zh) 一种基于数据均衡策略和密集注意网络的细粒度车型检测与识别方法
CN111783654B (zh) 车辆重识别方法、装置及电子设备
CN110909598A (zh) 一种基于深度学习的非机动车道交通违法行驶识别方法
CN110826415A (zh) 一种场景图像中车辆的重识别方法及设备
CN117197763A (zh) 基于交叉注意引导特征对齐网络的道路裂缝检测方法和系统
CN110135428B (zh) 图像分割处理方法和装置
CN115100469A (zh) 一种基于分割算法的目标属性识别方法、训练方法和装置
CN110659631B (zh) 车牌识别方法和终端设备
CN114037886A (zh) 图像识别方法、装置、电子设备和可读存储介质
CN113705566A (zh) 车辆识别方法及装置、电子设备及计算机可读存储介质
CN111709377A (zh) 特征提取方法、目标重识别方法、装置及电子设备
CN108985197B (zh) 基于多算法融合的出租车驾驶员吸烟行为的自动检测方法
CN114882469A (zh) 一种基于dl-ssd模型的交通标志检测方法及系统
CN114332798A (zh) 网约车环境信息的处理方法及相关装置
CN114724128A (zh) 一种车牌识别方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40033688

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant