CN111178370A - 车辆检索方法及相关装置 - Google Patents

车辆检索方法及相关装置 Download PDF

Info

Publication number
CN111178370A
CN111178370A CN201911295915.9A CN201911295915A CN111178370A CN 111178370 A CN111178370 A CN 111178370A CN 201911295915 A CN201911295915 A CN 201911295915A CN 111178370 A CN111178370 A CN 111178370A
Authority
CN
China
Prior art keywords
target
full
image
feature
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911295915.9A
Other languages
English (en)
Other versions
CN111178370B (zh
Inventor
吴伟华
陈微
康春生
张鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN HARZONE TECHNOLOGY CO LTD
Original Assignee
SHENZHEN HARZONE TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN HARZONE TECHNOLOGY CO LTD filed Critical SHENZHEN HARZONE TECHNOLOGY CO LTD
Priority to CN201911295915.9A priority Critical patent/CN111178370B/zh
Publication of CN111178370A publication Critical patent/CN111178370A/zh
Application granted granted Critical
Publication of CN111178370B publication Critical patent/CN111178370B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请实施例公开了一种车辆检索方法及相关装置,方法包括:获取目标车辆图像,目标车辆图像中包括目标车辆;通过注意力优化模块对目标车辆图像的局部区域进行定位,得到多个局部细节区域;对多个局部细节区域进行处理,得到结构特征图像和细节特征图像;将结构特征图像输入到Teacher‑Net,得到第一中间结果,并将第一中间结果输入到第一全连接层,得到第一全连接特征;将细节特征图像输入到Student‑Net,得到第二中间结果,并将第二中间结果输入到第二全连接层,得到第二全连接特征;通过第一全连接特征和第二全连接特征构造Teacher‑Net的目标分类损失函数;将第一全连接特征输入到目标分类损失函数,得到目标检索结果。采用本申请实施例能够提升车辆检索精度。

Description

车辆检索方法及相关装置
技术领域
本申请涉及图像处理技术领域,具体涉及一种车辆检索方法及相关装置。
背景技术
随着社会的发展,城市汽车数量不断攀升,由此带来的交通和环境问题也日渐加剧。为了应对这些问题,智能交通系统已成为城市发展的重点研究对象。而在智能交通系统中,对于车辆的检索,已经被证明是一项关键技术,在处理包括套牌车、故意遮挡车牌和追踪肇事逃逸等等交通问题上有着得天独厚的优势,对于智能交通系统的建设具有重要的意义,因此,如何提升车辆检索精度的问题亟待解决。
发明内容
本申请实施例提供了一种车辆检索方法及相关装置,可以提升行车辆检索精度。
第一方面,本申请实施例提供一种车辆检索方法,应用于电子设备,所述方法包括:
获取目标车辆图像,所述目标车辆图像中包括目标车辆;
通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域;
对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像;
将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一全连接层,得到第一全连接特征;
将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二全连接层,得到第二全连接特征;
通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数;
将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
第二方面,本申请实施例提供了一种车辆检索装置,应用于电子设备,所述装置包括:获取单元、定位单元、处理单元、第一输入单元、第二输入单元、构造单元和检索单元,其中,
所述获取单元,用于获取目标车辆图像,所述目标车辆图像中包括目标车辆;
所述定位单元,用于通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域;
所述处理单元,用于对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像;
所述第一输入单元,用于将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一全连接层,得到第一全连接特征;
所述第二输入单元,用于将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二全连接层,得到第二全连接特征;
所述构造单元,用于通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数;
所述检索单元,用于将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,本申请实施例中所描述的车辆检索方法及相关装置,应用于电子设备,获取目标车辆图像,目标车辆图像中包括目标车辆,通过注意力优化模块对目标车辆图像的局部区域进行定位,得到多个局部细节区域,对多个局部细节区域进行处理,得到结构特征图像和细节特征图像,将结构特征图像输入到Teacher-Net,得到第一中间结果,并将第一中间结果输入到第一全连接层,得到第一全连接特征,将细节特征图像输入到Student-Net,得到第二中间结果,并将第二中间结果输入到第二全连接层,得到第二全连接特征,通过第一全连接特征和第二全连接特征构造Teacher-Net的目标分类损失函数,将第一全连接特征输入到目标分类损失函数,得到目标检索结果,如此,通过注意力优化模块,对局部特征进行定位和采样,构造结构特征图像和细节特征图,并同时对这些特征进行蒸馏,以优化主网络对细节特征的学习,从而提高检索的准确率。为了进一步提高模型的泛化能力,在数据预处理阶段我们对数据进行了相应的增强处理。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本申请实施例提供的一种车辆检索方法的流程示意图;
图1B是本申请实施例提供的一种注意力优化模块的结构示意图;
图1C是本申请实施例提供的另一种车辆检索方法的流程示意图;
图2是本申请实施例提供的另一种车辆检索方法的流程示意图;
图3是本申请实施例提供的另一种电子设备的结构示意图;
图4是本申请实施例提供的一种车辆检索装置的功能单元组成框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所描述电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、行车记录仪、交通指挥平台、服务器、笔记本电脑、移动互联网设备(MID,Mobile Internet Devices)或穿戴式设备(如智能手表、蓝牙耳机)等,上述仅是举例,而非穷举,包含但不限于上述电子设备,电子设备还可以为视频矩阵,在此不做限定。
下面对本申请实施例进行详细介绍。
相关技术中,传统的车辆检索方法主要采用手工设计特征,这类特征属于低级特征,在处理车辆检索问题上存在较大的局限性。而深度学习在提取高层语义特征方面有其先天优势,能够针对特定任务从大数据中学习到有效的特征表示。但大多基于深度学习的车辆检索都只考虑了车辆的全局特征,而忽视了局部特征的重要性。由于不同类别的车辆在形态、结构上具有一致性,尤其是同品牌的车型之间的差异性甚至更小,误检索的概率就越高。因此,在车辆检索问题上,相比于形态、轮廓等特征,细节纹理特征则起到了主导作用。
为了解决上述问题,本申请实施例提供一种车辆检索方法,应用于电子设备,包括如下步骤:
获取目标车辆图像,所述目标车辆图像中包括目标车辆;
通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域;
对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像;
将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一全连接层,得到第一全连接特征;
将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二全连接层,得到第二全连接特征;
通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数;
将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
如此,通过注意力优化模块,对局部特征进行定位和采样,构造结构特征图像和细节特征图,并同时对这些特征进行蒸馏,以优化主网络对细节特征的学习,从而提高检索的准确率。为了进一步提高模型的泛化能力,在数据预处理阶段我们对数据进行了相应的增强处理。
请参阅图1A,图1A是本申请实施例提供的一种车辆检索方法的流程示意图,应用于电子设备,如图所示,本车辆检索方法包括:
101、获取目标车辆图像,所述目标车辆图像中包括目标车辆。
其中,目标车辆图像可以为包括目标车辆的图像,或者,目标车辆图像可以为仅包括目标车辆的图像。
在一个可能的示例中,上述步骤101,获取目标车辆图像,包括如下步骤:
11、获取目标环境参数;
12、按照预设的环境参数与拍摄参数之间的映射关系,确定所述目标环境参数对应的目标拍摄参数;
13、依据所述目标拍摄参数对所述目标车辆进行拍摄,得到第一图像;
14、对所述第一图像进行图像分割,得到所述目标车辆图像。
其中,本申请实施例中,环境参数可以为以下至少一种:环境光亮度、天气、温度、湿度、地理位置和磁场干扰强度等等,在此不做限定,拍摄参数可以为以下至少一种:感光度ISO、曝光时长、白平衡参数、拍摄模式、色温等等,在此不做限定。其中,环境参数可以由环境传感器进行采集,环境传感器可以为以下至少一种:环境光传感器、气象传感器、温度传感器、湿度传感器、定位传感器和磁场检测传感器等等,在此不做限定。电子设备中可以预先存储预设的环境参数与拍摄参数之间的映射关系。
具体实现中,电子设备可以获取目标环境参数,并且按照预设的环境参数与拍摄参数之间的映射关系,确定目标环境参数对应的目标拍摄参数,进而,可以依据目标拍摄参数对目标车辆进行拍摄,得到第一图像,对第一图像进行图像分割,得到目标车辆图像,如此,不仅可以得到与环境相宜的拍摄图像,还能够基于此,提取仅包含目标车辆的图像,有助于提升后续车辆检索精度。
在上述步骤13-步骤14之间,还可以包括如下步骤:
A1、确定所述第一图像的图像质量评价值;
A2、在所述图像质量评价值低于预设阈值时,对所述第一图像进行图像增强处理;
上述步骤14,对所述第一图像进行图像分割,得到所述目标车辆图像,具体为:
对图像增强处理后的所述第一图像进行图像分割,得到所述目标车辆图像。
其中,具体实现中,可以采用至少一个图像质量评价指标对图像进行图像质量评价,图像质量评价指标可以为以下至少一种:平均亮度、清晰度、信息熵等等,在此不做限定。图像增强算法可以为以下至少一种:小波变换、图像锐化、灰度拉伸、直方图均衡化等等,在此不做限定。
具体实现中,电子设备可以确定第一图像的图像质量评价值,并且在图像质量评价值低于预设阈值时,对第一图像进行图像增强处理,并对图像增强处理后的所述第一图像进行图像分割,得到所述目标车辆图像,反之,在图像质量评价值大于或等于预设阈值时,则直接对该第一图像进行图像分割,得到目标车辆图像,如此,可以提升图像分割精度,便于后续车辆检索。
进一步地,在一个可能的示例中,上述步骤A2,对所述第一图像进行图像增强处理,可以包括如下步骤:
A21、将所述第一图像划分为多个区域;
A22、确定所述多个区域中每一区域的清晰度值,得到多个清晰度值;
A23、从所述多个清晰度值中选取低于预设清晰度值的清晰度值,并获取其对应的区域,得到至少一个目标区域;
A24、确定所述至少一个目标区域中每一区域对应的特征点分布密度,得到至少一个特征点分布密度;
A25、确定所述至少一个特征点分布密度对应的特征点分布密度等级,得到至少一个特征点密度分布等级;
A26、按照预设的特征点分布密度等级与图像增强算法之间的映射关系,确定所述至少一个特征点密度分布等级对应的目标图像增强算法;
A27、按照所述至少一个特征点密度分布等级对应的目标图像增强算法对相应的目标区域进行图像增强处理,得到图像增强处理后的所述第一图像。
其中,上述预设清晰度值可以由用户自行设置或者系统默认。电子设备中可以预先存储预设的特征点分布密度等级与图像增强算法之间的映射关系,图像增强算法可以为以下至少一种:小波变换、图像锐化、灰度拉伸、直方图均衡化等等,在此不做限定。
具体实现中,电子设备可以将第一图像划分为多个区域,每一区域面积相同或者不同,还可以确定多个区域中每一区域的清晰度值,得到多个清晰度值,并从多个清晰度值中选取低于预设清晰度值的清晰度值,并获取其对应的区域,得到至少一个目标区域,进一步地,确定至少一个目标区域中每一区域对应的特征点分布密度,得到至少一个特征点分布密度,每一区域对应一个特征点分布密度,特征点分布密度=一个区域的特征点总数量/区域面积。电子设备中还可以预先存储确定特征点分布密度与特征点分布密度等级之间的映射关系,进而,依据该映射关系可以确定至少一个特征点分布密度中每一特征点分布密度对应的特征点分布密度等级,得到至少一个特征点密度分布等级。
进一步地,电子设备可以按照预设的特征点分布密度等级与图像增强算法之间的映射关系,确定至少一个特征点密度分布等级对应的目标图像增强算法,并且按照至少一个特征点密度分布等级中每一特征点密度分布等级对应的目标图像增强算法对相应的目标区域进行图像增强处理,得到图像增强处理后的第一图像,如此,可以防止图像质量好的区域过增强,并且图像质量不同区域有可能图像质量不一,如此,可以针对性实施图像增强,更加有助于提升图像质量。
102、通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域。
其中,具体实现中,电子设备可以将目标车辆图像输入到注意力优化模块中进行局部区域定位,可以得到多个局部细节区域。
本申请实施例中,注意力优化模块(attention refinement module,ARM)的具体结构如图1B所示,可见,ARM模块可以主要由全局池化global pool、1*1卷积、归一化层batch norm、激活函数sigmoid和乘法器mul组成,ARM模块借助全局平均池化捕获全局语境并计算注意力向量以指导特征学习。
具体地,给定目标车辆图像I,可以经过一系列的卷积、池化和激活之后,得到的输出特征图的尺寸为c×h×w,其中,c,h和w分别表示通道数、高度和宽度。将特征表示为c×hw的矩阵,即,V∈Rc×hw,注意力优化模块函数可表示为:
Pm(V):=(VVT)V
其中,Vi表示通道之间的空间关系。具体来说,Vi是特征图的第i个通道,VVT i,j表示通道i和j之间的空间关系。为了提高特征图的一致性和鲁棒性,通过对VVT i,j和V进行点积,从而,可以得到局部特征图,即局部细节区域。
103、对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像。
其中,电子设备可以通过多个局部细节特征进行处理,得到目标车辆的整体轮廓对应的结构特征图像以及代表细节的细节特征图像。
在一个可能的示例中,上述步骤103,对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像,可以包括如下步骤:
31、对所述多个局部细节区域中每一局部细节区域进行求平均运算;
32、对求平均运算后的所述多个局部细节区域进行采样,得到所述结构特征图像;
33、对所述多个局部细节区域中每一局部细节区域进行权重分析,得到多个权重;
34、从所述多个权重中选取大于预设权值的权重,得到至少一个目标权重,并获取所述至少一个目标权重对应的目标局部细节区域;
35、对所述目标局部细节区域进行采样,得到所述细节特征图像。
其中,上述预设权值可以由用户自行设置或者系统默认。
具体实现中,电子设备可以对多个局部细节区域中每一局部细节区域进行求平均运算,并对求平均运算后的多个局部细节区域进行采样,得到结构特征图像,如此,可以实现轮廓提取,进进一步地,对多个局部细节区域中每一局部细节区域进行权重分析,得到多个权重,权重值大,则细节重要性高,权重值小,则细节重要性低,从多个权重中选取大于预设权值的权重,得到至少一个目标权重,并获取至少一个目标权重对应的目标局部细节区域,对目标局部细节区域进行采样,得到细节特征图像。
具体地,电子设备可以对局部细节区域进行不同策略的非均匀采样,以分别得到保留结构特征图像和保留细节特征图像。其中,保留的结构特征图像,其包含了所有的重要细节。与原图相比,去除了没有细粒度细节的区域,而保留细节特征的细节特征图像则集中在单个细节区域上,可以提取出更细粒度的细节特征。
Is=S(I,A(P)),Id=S(I,W(P))
其中,P是局部细节区域,S(·)表示非均匀采样函数,A(·)表示对局部细节区域求平均,而W(·)表示从局部细节区域中选择权重相对较大的。
104、将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一全连接层,得到第一全连接特征。
其中,电子设备可以将结构特征图像输入到Teacher-Net,得到第一中间结果,并将第一中间结果输入到第一全连接层,得到第一全连接特征。
105、将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二全连接层,得到第二全连接特征,如此,能够实现对结构特征进行提取,得到更细节信息。
本申请实施例中,Student-Net和Teacher-Net,相当于学生和教师之间的关系,即Teacher-Net训练好了,然后,教Student-Net怎么去训练,基于此,在执行步骤101之前,可以预先构造Student-Net和Teacher-Net。将细节特征图像输入到Student-Net,得到第二中间结果,并将第二中间结果输入到第二全连接层,得到第二全连接特征,如此,可以实现更加精细细节信息提取,有助于通过其结果优化Teacher-Net的结果。
在一个可能的示例中,上述步骤104,将所述第一中间结果输入到第一全连接层,得到第一全连接特征,可以按照如下方式实施:
将所述第一中间结果输入到第一卷积层,再将所述第一卷积层的输出作为所述第一全连接层的输入,得到所述第一全连接特征;
在一个可能的示例中,上述步骤105,将所述第二中间结果输入到第二全连接层,得到第二全连接特征,可以按照如下方式实施:
将所述第二中间结果输入到第二卷积层,再将所述第二卷积层的输出作为所述第二全连接层的输入,得到所述第二全连接特征;
其中,所述第一卷积层和所述第二卷积层共享卷积参数。
具体实现中,卷积参数可以为以下至少一种:卷积核大小、卷积层数等等,在此不做限定,卷积参数对于Student-Net和Teacher-Net是共享的,这在蒸馏中有着非常重要的作用。
106、通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数。
其中,具体实现中,Teacher-Net的目标分类损失函数,能够实现分类功能,其融入了Teacher-Net以及Student-Net的优势,能够实现深度挖掘细节特征,有助于提升检索精度。
在一个可能的示例中,上述步骤106,通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数,可以包括如下步骤:
61、获取目标温度参数;
62、依据所述目标温度参数将所述第一全连接特征转化为第一概率向量;
63、依据所述目标温度参数将所述第二全连接特征转化为第二概率向量;
64、依据所述第一概率向量和所述第二概率向量确定所述Teacher-Net的交叉熵;
65、依据预设分类损失函数和所述交叉熵确定所述Teacher-Net的目标分类损失函数。
具体实现中,目标温度参数可以由用户自行设置或者系统默认。预设分类损失函数可以预先设置或者系统默认。具体地,电子设备可以获取目标温度参数,并依据目标温度参数将第一全连接特征转化为第一概率向量,以及依据目标温度参数将第二全连接特征转化为第二概率向量,依据第一概率向量和第二概率向量确定Teacher-Net的目标交叉熵,进而,依据预设分类损失函数和目标交叉熵确定所述Teacher-Net的目标分类损失函数,软目标交叉熵的目的是为细粒度的细节提炼出学习的特征,并将这些信息传递到Teacher-Net,有助于实现提取更深层次的细节特征。
进一步地,可以通过将结构特征图像和细节特征图像分别输入到Teacher-Net和Student-Net中,以此来获得全连接层(FC)的输出。FC输出分别表示为第一全连接层特征fs和第二全连接特征fd
进一步地,通过softmax分类器可以将第一全连接特征fs和第二全连接特征fd分别转换为概率向量,即第一概率向量qs和第二概率向量qd,概率向量用于表示每个类的预测概率。
Figure BDA0002320532080000111
其中,T是一个温度参数,在知识提取中,T的值很重要,因为它可以在类上产生软概率分布。同理,也可以通过上述类似公式将第二全连特征转化为第二概率向量。
进一步地,其中Teacher-Net的目标交叉熵为:
Figure BDA0002320532080000112
其中,i=1,2,3,…,N,N表示类别数。
最后,可以通过以下方式来驱动主网的目标功能:
L(Is)=Lcls(qs,y)+λLsoft(qs,qd)
其中,Lcls表示预设分类损失函数,y是一个热向量,其表示分类标签,而λ表示Teacher-Net的目标交叉熵的权重。软目标交叉熵的目的是为细粒度的细节提炼出学习的特征,并将这些信息传递到Teacher-Net。
107、将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
其中,具体实现中,电子设备可以将第一全连接特征输入到目标分类损失函数,得到目标检索结果,具体地,可以将Teacher-Net网络的全连接层特征作为车辆检索的特征,并对其特征进行编码,以提高检索速度,将其输入到目标分类损失函数,得到初步运算结果,并采用汉明距离计算初步运算结果之间的相似度,对相似度进行排序输出,得到目标检索结果。目标检索结果包括以下至少一种信息:车辆类型、车辆型号、车辆颜色、车辆唯一标识信息(车牌号码、车架号、预留手机号等等)等等,在此不做限定。
本申请实施例中,如图1C所示,可以针对目标车辆图像,首先实现局部特征定位和采样,具体地,通过注意力优化模块,对局部区域进行定位,得到若干个局部细节区域。对全部局部细节区域求平均,然后再进行采样,得到保留结构特征的图像,并作为Teacher-Net的输入;同时,对全部局部细节区域的权重分析,选取权重较高的区域进行采样,得到保留细节特征的图像,并作为Student-Net训练的输入;其次,训练模型,上述步骤基础上,对保留结构特征的图像和保留细节特征的图像分别进行训练,并最终通过蒸馏的方式,将Student-Net学习到的细粒度特征提取到Teacher-Net中,以优化Teacher-Net的细节特征,最后,将Teacher-Net网络的全连接层特征作为车辆检索的特征,并对其特征进行编码,以提高检索速度。采用汉明距离计算之间的相似度,对相似度进行排序输出,得到最终检索结果。
可以看出,本申请实施例中所描述的车辆检索方法,应用于电子设备,获取目标车辆图像,目标车辆图像中包括目标车辆,通过注意力优化模块对目标车辆图像的局部区域进行定位,得到多个局部细节区域,对多个局部细节区域进行处理,得到结构特征图像和细节特征图像,将结构特征图像输入到Teacher-Net,得到第一中间结果,并将第一中间结果输入到第一全连接层,得到第一全连接特征,将细节特征图像输入到Student-Net,得到第二中间结果,并将第二中间结果输入到第二全连接层,得到第二全连接特征,通过第一全连接特征和第二全连接特征构造Teacher-Net的目标分类损失函数,将第一全连接特征输入到目标分类损失函数,得到目标检索结果,如此,通过注意力优化模块,对局部特征进行定位和采样,构造结构特征图像和细节特征图,并同时对这些特征进行蒸馏,以优化主网络对细节特征的学习,从而提高检索的准确率。为了进一步提高模型的泛化能力,在数据预处理阶段我们对数据进行了相应的增强处理。
与上述图1A所示的实施例一致地,请参阅图2,图2是本申请实施例提供的一种车辆检索方法的流程示意图,应用于电子设备,如图所示,本车辆检索方法包括:
201、获取目标车辆图像,所述目标车辆图像中包括目标车辆。
202、通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域。
203、对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像。
204、将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一卷积层,再将所述第一卷积层的输出作为所述第一全连接层的输入,得到第一全连接特征。
205、将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二卷积层,再将所述第二卷积层的输出作为所述第二全连接层的输入,得到第二全连接特征,其中,所述第一卷积层和所述第二卷积层共享卷积参数。
206、通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数。
207、将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
其中,上述步骤201-步骤207的具体描述可以参照上述图1A所描述的车辆检索方法的相应步骤,在此不再赘述。
可以看出,本申请实施例中所描述的车辆检索方法,通过注意力优化模块,对局部特征进行定位和采样,构造结构特征图像和细节特征图,并同时对这些特征进行蒸馏,以优化主网络对细节特征的学习,从而提高检索的准确率。为了进一步提高模型的泛化能力,在数据预处理阶段我们对数据进行了相应的增强处理。
与上述实施例一致地,请参阅图3,图3是本申请实施例提供的一种电子设备的结构示意图,如图所示,该电子设备包括处理器、存储器、通信接口以及一个或多个程序,应用于电子设备,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,本申请实施例中,上述程序包括用于执行以下步骤的指令:
获取目标车辆图像,所述目标车辆图像中包括目标车辆;
通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域;
对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像;
将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一全连接层,得到第一全连接特征;
将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二全连接层,得到第二全连接特征;
通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数;
将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
可以看出,本申请实施例中所描述的电子设备,获取目标车辆图像,目标车辆图像中包括目标车辆,通过注意力优化模块对目标车辆图像的局部区域进行定位,得到多个局部细节区域,对多个局部细节区域进行处理,得到结构特征图像和细节特征图像,将结构特征图像输入到Teacher-Net,得到第一中间结果,并将第一中间结果输入到第一全连接层,得到第一全连接特征,将细节特征图像输入到Student-Net,得到第二中间结果,并将第二中间结果输入到第二全连接层,得到第二全连接特征,通过第一全连接特征和第二全连接特征构造Teacher-Net的目标分类损失函数,将第一全连接特征输入到目标分类损失函数,得到目标检索结果,如此,如此,通过注意力优化模块,对局部特征进行定位和采样,构造结构特征图像和细节特征图,并同时对这些特征进行蒸馏,以优化主网络对细节特征的学习,从而提高检索的准确率。为了进一步提高模型的泛化能力,在数据预处理阶段我们对数据进行了相应的增强处理。
在一个可能的示例中,在所述对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像方面,上述程序包括用于执行以下步骤的指令:
对所述多个局部细节区域中每一局部细节区域进行求平均运算;
对求平均运算后的所述多个局部细节区域进行采样,得到所述结构特征图像;
对所述多个局部细节区域中每一局部细节区域进行权重分析,得到多个权重;
从所述多个权重中选取大于预设权值的权重,得到至少一个目标权重,并获取所述至少一个目标权重对应的目标局部细节区域;
对所述目标局部细节区域进行采样,得到所述细节特征图像。
在一个可能的示例中,在所述通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数方面,上述程序包括用于执行以下步骤的指令:
获取目标温度参数;
依据所述目标温度参数将所述第一全连接特征转化为第一概率向量;
依据所述目标温度参数将所述第二全连接特征转化为第二概率向量;
依据所述第一概率向量和所述第二概率向量确定所述Teacher-Net的目标交叉熵;
依据预设分类损失函数和所述目标交叉熵确定所述Teacher-Net的目标分类损失函数。
在一个可能的示例中,在所述将所述第一中间结果输入到第一全连接层,得到第一全连接特征方面,上述程序包括用于执行以下步骤的指令:
将所述第一中间结果输入到第一卷积层,再将所述第一卷积层的输出作为所述第一全连接层的输入,得到所述第一全连接特征;
在所述将所述第二中间结果输入到第二全连接层,得到第二全连接特征方面,上述程序包括用于执行以下步骤的指令:
将所述第二中间结果输入到第二卷积层,再将所述第二卷积层的输出作为所述第二全连接层的输入,得到所述第二全连接特征;
其中,所述第一卷积层和所述第二卷积层共享卷积参数。
在一个可能的示例中,在所述获取目标车辆图像方面,上述程序包括用于执行以下步骤的指令:
获取目标环境参数;
按照预设的环境参数与拍摄参数之间的映射关系,确定所述目标环境参数对应的目标拍摄参数;
依据所述目标拍摄参数对所述目标车辆进行拍摄,得到第一图像;
对所述第一图像进行图像分割,得到所述目标车辆图像。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图4是本申请实施例中所涉及的车辆检索装置400的功能单元组成框图。该车辆检索装置400,应用于电子设备,所述方法包括:获取单元401、定位单元402、处理单元403、第一输入单元404、第二输入单元405、构造单元406和检索单元407,具体如下:
所述获取单元401,用于获取目标车辆图像,所述目标车辆图像中包括目标车辆;
所述定位单元402,用于通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域;
所述处理单元403,用于对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像;
所述第一输入单元404,用于将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一全连接层,得到第一全连接特征;
所述第二输入单元405,用于将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二全连接层,得到第二全连接特征;
所述构造单元406,用于通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数;
所述检索单元407,用于将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
可以看出,本申请实施例中所描述的车辆检索装置,应用于电子设备,获取目标车辆图像,目标车辆图像中包括目标车辆,通过注意力优化模块对目标车辆图像的局部区域进行定位,得到多个局部细节区域,对多个局部细节区域进行处理,得到结构特征图像和细节特征图像,将结构特征图像输入到Teacher-Net,得到第一中间结果,并将第一中间结果输入到第一全连接层,得到第一全连接特征,将细节特征图像输入到Student-Net,得到第二中间结果,并将第二中间结果输入到第二全连接层,得到第二全连接特征,通过第一全连接特征和第二全连接特征构造Teacher-Net的目标分类损失函数,将第一全连接特征输入到目标分类损失函数,得到目标检索结果,如此,如此,通过注意力优化模块,对局部特征进行定位和采样,构造结构特征图像和细节特征图,并同时对这些特征进行蒸馏,以优化主网络对细节特征的学习,从而提高检索的准确率。为了进一步提高模型的泛化能力,在数据预处理阶段我们对数据进行了相应的增强处理。
在一个可能的示例中,在所述对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像方面,所述处理单元403具体用于:
对所述多个局部细节区域中每一局部细节区域进行求平均运算;
对求平均运算后的所述多个局部细节区域进行采样,得到所述结构特征图像;
对所述多个局部细节区域中每一局部细节区域进行权重分析,得到多个权重;
从所述多个权重中选取大于预设权值的权重,得到至少一个目标权重,并获取所述至少一个目标权重对应的目标局部细节区域;
对所述目标局部细节区域进行采样,得到所述细节特征图像。
在一个可能的示例中,在所述通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数方面,所述构造单元406具体用于:
获取目标温度参数;
依据所述目标温度参数将所述第一全连接特征转化为第一概率向量;
依据所述目标温度参数将所述第二全连接特征转化为第二概率向量;
依据所述第一概率向量和所述第二概率向量确定所述Teacher-Net的目标交叉熵;
依据预设分类损失函数和所述目标交叉熵确定所述Teacher-Net的目标分类损失函数。
在一个可能的示例中,在所述将所述第一中间结果输入到第一全连接层,得到第一全连接特征方面,所述第一输入单元404具体用于:
将所述第一中间结果输入到第一卷积层,再将所述第一卷积层的输出作为所述第一全连接层的输入,得到所述第一全连接特征;
在所述将所述第二中间结果输入到第二全连接层,得到第二全连接特征方面,所述第二输入单元405具体用于:
将所述第二中间结果输入到第二卷积层,再将所述第二卷积层的输出作为所述第二全连接层的输入,得到所述第二全连接特征;
其中,所述第一卷积层和所述第二卷积层共享卷积参数。
在一个可能的示例中,在所述获取目标车辆图像方面,所述获取单元401具体用于:
获取目标环境参数;
按照预设的环境参数与拍摄参数之间的映射关系,确定所述目标环境参数对应的目标拍摄参数;
依据所述目标拍摄参数对所述目标车辆进行拍摄,得到第一图像;
对所述第一图像进行图像分割,得到所述目标车辆图像。
可以理解的是,本实施例的车辆检索装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种车辆检索方法,其特征在于,应用于电子设备,所述方法包括:
获取目标车辆图像,所述目标车辆图像中包括目标车辆;
通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域;
对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像;
将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一全连接层,得到第一全连接特征;
将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二全连接层,得到第二全连接特征;
通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数;
将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像,包括:
对所述多个局部细节区域中每一局部细节区域进行求平均运算;
对求平均运算后的所述多个局部细节区域进行采样,得到所述结构特征图像;
对所述多个局部细节区域中每一局部细节区域进行权重分析,得到多个权重;
从所述多个权重中选取大于预设权值的权重,得到至少一个目标权重,并获取所述至少一个目标权重对应的目标局部细节区域;
对所述目标局部细节区域进行采样,得到所述细节特征图像。
3.根据权利要求1或2所述的方法,其特征在于,所述通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数,包括:
获取目标温度参数;
依据所述目标温度参数将所述第一全连接特征转化为第一概率向量;
依据所述目标温度参数将所述第二全连接特征转化为第二概率向量;
依据所述第一概率向量和所述第二概率向量确定所述Teacher-Net的目标交叉熵;
依据预设分类损失函数和所述目标交叉熵确定所述Teacher-Net的目标分类损失函数。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述第一中间结果输入到第一全连接层,得到第一全连接特征,包括:
将所述第一中间结果输入到第一卷积层,再将所述第一卷积层的输出作为所述第一全连接层的输入,得到所述第一全连接特征;
所述将所述第二中间结果输入到第二全连接层,得到第二全连接特征,包括:
将所述第二中间结果输入到第二卷积层,再将所述第二卷积层的输出作为所述第二全连接层的输入,得到所述第二全连接特征;
其中,所述第一卷积层和所述第二卷积层共享卷积参数。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取目标车辆图像,包括:
获取目标环境参数;
按照预设的环境参数与拍摄参数之间的映射关系,确定所述目标环境参数对应的目标拍摄参数;
依据所述目标拍摄参数对所述目标车辆进行拍摄,得到第一图像;
对所述第一图像进行图像分割,得到所述目标车辆图像。
6.一种车辆检索装置,其特征在于,应用于电子设备,所述装置包括:获取单元、定位单元、处理单元、第一输入单元、第二输入单元、构造单元和检索单元,其中,
所述获取单元,用于获取目标车辆图像,所述目标车辆图像中包括目标车辆;
所述定位单元,用于通过注意力优化模块对所述目标车辆图像的局部区域进行定位,得到多个局部细节区域;
所述处理单元,用于对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像;
所述第一输入单元,用于将所述结构特征图像输入到Teacher-Net,得到第一中间结果,并将所述第一中间结果输入到第一全连接层,得到第一全连接特征;
所述第二输入单元,用于将所述细节特征图像输入到Student-Net,得到第二中间结果,并将所述第二中间结果输入到第二全连接层,得到第二全连接特征;
所述构造单元,用于通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数;
所述检索单元,用于将所述第一全连接特征输入到所述目标分类损失函数,得到目标检索结果。
7.根据权利要求6所述的装置,其特征在于,在所述对所述多个局部细节区域进行处理,得到结构特征图像和细节特征图像方面,所述处理单元具体用于:
对所述多个局部细节区域中每一局部细节区域进行求平均运算;
对求平均运算后的所述多个局部细节区域进行采样,得到所述结构特征图像;
对所述多个局部细节区域中每一局部细节区域进行权重分析,得到多个权重;
从所述多个权重中选取大于预设权值的权重,得到至少一个目标权重,并获取所述至少一个目标权重对应的目标局部细节区域;
对所述目标局部细节区域进行采样,得到所述细节特征图像。
8.根据权利要求6或7所述的装置,其特征在于,在所述通过所述第一全连接特征和所述第二全连接特征构造所述Teacher-Net的目标分类损失函数方面,所述构造单元具体用于:
获取目标温度参数;
依据所述目标温度参数将所述第一全连接特征转化为第一概率向量;
依据所述目标温度参数将所述第二全连接特征转化为第二概率向量;
依据所述第一概率向量和所述第二概率向量确定所述Teacher-Net的目标交叉熵;
依据预设分类损失函数和所述目标交叉熵确定所述Teacher-Net的目标分类损失函数。
9.一种电子设备,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-5任一项所述的方法。
CN201911295915.9A 2019-12-16 2019-12-16 车辆检索方法及相关装置 Active CN111178370B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911295915.9A CN111178370B (zh) 2019-12-16 2019-12-16 车辆检索方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911295915.9A CN111178370B (zh) 2019-12-16 2019-12-16 车辆检索方法及相关装置

Publications (2)

Publication Number Publication Date
CN111178370A true CN111178370A (zh) 2020-05-19
CN111178370B CN111178370B (zh) 2023-10-17

Family

ID=70652036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911295915.9A Active CN111178370B (zh) 2019-12-16 2019-12-16 车辆检索方法及相关装置

Country Status (1)

Country Link
CN (1) CN111178370B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580643A (zh) * 2020-12-09 2021-03-30 浙江智慧视频安防创新中心有限公司 一种基于深度学习的车牌识别方法、装置及存储介质
CN113379627A (zh) * 2021-06-07 2021-09-10 北京百度网讯科技有限公司 图像增强模型的训练方法和对图像进行增强的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664893A (zh) * 2018-04-03 2018-10-16 福州海景科技开发有限公司 一种人脸检测方法及存储介质
US20190114692A1 (en) * 2017-10-16 2019-04-18 Allstate Insurance Company Geotagging Location Data
CN110516583A (zh) * 2019-08-21 2019-11-29 中科视语(北京)科技有限公司 一种车辆重识别方法、系统、设备及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190114692A1 (en) * 2017-10-16 2019-04-18 Allstate Insurance Company Geotagging Location Data
CN108664893A (zh) * 2018-04-03 2018-10-16 福州海景科技开发有限公司 一种人脸检测方法及存储介质
CN110516583A (zh) * 2019-08-21 2019-11-29 中科视语(北京)科技有限公司 一种车辆重识别方法、系统、设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580643A (zh) * 2020-12-09 2021-03-30 浙江智慧视频安防创新中心有限公司 一种基于深度学习的车牌识别方法、装置及存储介质
CN113379627A (zh) * 2021-06-07 2021-09-10 北京百度网讯科技有限公司 图像增强模型的训练方法和对图像进行增强的方法
CN113379627B (zh) * 2021-06-07 2023-06-27 北京百度网讯科技有限公司 图像增强模型的训练方法和对图像进行增强的方法

Also Published As

Publication number Publication date
CN111178370B (zh) 2023-10-17

Similar Documents

Publication Publication Date Title
CN111126258B (zh) 图像识别方法及相关装置
Xie et al. Multilevel cloud detection in remote sensing images based on deep learning
CN107679250B (zh) 一种基于深度自编码卷积神经网络的多任务分层图像检索方法
CN110458107B (zh) 用于图像识别的方法和装置
EP3757905A1 (en) Deep neural network training method and apparatus
CN111178183B (zh) 人脸检测方法及相关装置
CN108108657A (zh) 一种基于多任务深度学习的修正局部敏感哈希车辆检索方法
CN111680176A (zh) 基于注意力与双向特征融合的遥感图像检索方法及系统
CN112016467B (zh) 交通标志识别模型训练方法、识别方法、系统、设备及介质
CN111274926B (zh) 图像数据筛选方法、装置、计算机设备和存储介质
CN113807399A (zh) 一种神经网络训练方法、检测方法以及装置
CN111310770B (zh) 目标检测方法和装置
CN111931764A (zh) 一种目标检测方法、目标检测框架及相关设备
CN113255915A (zh) 基于结构化实例图的知识蒸馏方法、装置、设备和介质
CN113516227B (zh) 一种基于联邦学习的神经网络训练方法及设备
CN114550053A (zh) 一种交通事故定责方法、装置、计算机设备及存储介质
CN114037640A (zh) 图像生成方法及装置
CN109982088B (zh) 图像处理方法及装置
CN111178370B (zh) 车辆检索方法及相关装置
CN110334628B (zh) 一种基于结构化随机森林的室外单目图像深度估计方法
CN111709377B (zh) 特征提取方法、目标重识别方法、装置及电子设备
CN111178181B (zh) 交通场景分割方法及相关装置
CN116151323A (zh) 模型生成方法、装置、电子设备及存储介质
CN114092818B (zh) 语义分割方法、装置、电子设备及存储介质
CN117011566A (zh) 一种目标检测方法、检测模型训练方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant