CN113313079A - 一种车辆属性识别模型的训练方法、系统及相关设备 - Google Patents

一种车辆属性识别模型的训练方法、系统及相关设备 Download PDF

Info

Publication number
CN113313079A
CN113313079A CN202110808544.0A CN202110808544A CN113313079A CN 113313079 A CN113313079 A CN 113313079A CN 202110808544 A CN202110808544 A CN 202110808544A CN 113313079 A CN113313079 A CN 113313079A
Authority
CN
China
Prior art keywords
layer
attribute
vehicle
feature vector
loss function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110808544.0A
Other languages
English (en)
Other versions
CN113313079B (zh
Inventor
王嫄
温刚
李超彦
杨巨成
闫潇宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Anruan Huishi Technology Co ltd
Shenzhen Anruan Technology Co Ltd
Original Assignee
Shenzhen Anruan Huishi Technology Co ltd
Shenzhen Anruan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Anruan Huishi Technology Co ltd, Shenzhen Anruan Technology Co Ltd filed Critical Shenzhen Anruan Huishi Technology Co ltd
Priority to CN202110808544.0A priority Critical patent/CN113313079B/zh
Publication of CN113313079A publication Critical patent/CN113313079A/zh
Application granted granted Critical
Publication of CN113313079B publication Critical patent/CN113313079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明适用于计算机视觉应用领域,提供了一种车辆属性识别模型的训练方法、系统及相关设备,所述方法具体包括:获取图片,并标记属性标签;构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型;将图片输入模型,通过卷积层组得到第一特征向量;将第一特征向量输入随机失活层,得到第二特征向量,同时,将图片通过所述属性分类层分类得到分类图片集合;将第二特征向量输入全连接层,得到第三特征向量;将第三特征向量和分类图片集合作为损失函数层的输入计算损失函数值,并进行参数优化,从而完成迭代;重复完成至少20次迭代,得到最终的模型。本发明利用多标签方法提升了车辆属性识别模型的识别精度。

Description

一种车辆属性识别模型的训练方法、系统及相关设备
技术领域
本发明属于计算机视觉应用领域,尤其涉及一种车辆属性识别模型的训练方法、系统及相关设备。
背景技术
计算机视觉是使用计算机或者其他处理设备对生物视觉的一种模拟,这项研究的主要任务是通过计算机对采集到的图片或者视频数据进行处理,并从中提取到必要的视觉信息,在人工智能技术得到发展的当下,计算机视觉的研究也越来越深入。在智能监控领域,车辆属性识别是尤为重要的技术,在多角度、目标复杂以及低亮度环境下进行的车辆属性识别更是技术上的难点。
目前已有的车辆属性识别系统中,有采用多个神经网络模型分别对待检测目标中行人和车辆的属性进行分类和识别的方案,但是这种方案很难进行实际场景的部署,原因是多神经网络模型以及其部署需要的硬件受限于成本,且难以维护;此外,还有对车辆属性及驾驶员相关信息进行提取,以车身表面作为车辆的唯一标识符的识别方法,这种方法也存在局限性。
发明内容
本发明实施例提供一种车辆属性识别模型的训练方法、系统及相关设备,旨在解决车辆属性识别模型过于复杂,且无法检测车辆的多种属性的问题。
第一方面,本发明实施例提供一种车辆属性识别模型的训练方法,所述方法包括以下步骤:
获取具有车辆特征的图片,并将所述图片中出现的多种车辆属性分别标记为属性标签;
构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型;
将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量;
将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合;
将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量;
将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程;
重复以上步骤,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型。
更进一步地,所述构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型的步骤具体包括以下子步骤:
搭建卷积层组,所述卷积层组有5层卷积层,第一层、第二层卷积层包括两组3×3的卷积核和一个池化操作,其余卷积层采用三组3×3的卷积核和一个池化操作,其中,第五层卷积层的最后一组3×3卷积核为全局卷积,对应的池化操作为全局均值池化;
在所述卷积层组后设置所述随机失活层,用以对所述卷积层组的输出进行随机采样更新;
在所述随机失活层的同一逻辑层次上设置所述属性分类层;
在所述随机失活层后设置所述全连接层,其中,所述全连接层包括多个全连接块,每一个所述全连接块分别对应一个所述属性标签;
在所述属性分类层和所述全连接层之后的一个逻辑层次上设置所述损失函数层,其中,所述损失函数层包括多个损失函数块,每一个所述损失函数块分别对应一个所述属性标签,至此完成所述车辆属性识别模型的构建。
更进一步地,将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量的步骤具体包括以下子步骤:
所述卷积层组的前两层卷积层依次对所述图片进行子采样操作,以增强所述图片中的所述车辆特征的特征表达;
所述卷积层组的后三层卷积层再依次对前两层卷积层处理后的所述图片进行子采样操作,在再次增强所述图片中的所述车辆特征的特征表达的同时,加深所述车辆属性识别模型的深度,最后所述卷积层组通过所述全局均值池化以获得所述车辆特征的向量数据,所述向量数据作为所述第一特征向量。
更进一步地,将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合的步骤具体包括以下子步骤:
所述随机失活层对所述第一特征向量进行随机采样更新,防止出现过拟合向量,并输出所述第二特征向量;
所述属性分类层将所述图片按照所述属性标签进行分类,得到具有多类图片的所述分类图片集合;其中,将所述图片中具有多种属性标签的同一张图片定义为多标图片,所述分类图片集合中的每一类图片中均包含所述多标图片。
更进一步地,将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量的步骤具体包括:
将所述第二特征向量输入所述全连接层,其中,所述全连接层包括多个全连接块,每一个所述全连接块对应一种所述属性标签,所述第二特征向量经过所述全连接块进行处理,得到根据所述属性标签分类的所述第三特征向量。
更进一步地,将所述第三特征向量和所述分类图片集合共同作为损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程的步骤具体包括以下步骤:
将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,其中,所述损失函数层包括多个损失函数块,每一个所述损失函数块对应一种所述属性标签,共同输入到所述损失函数块的所述第三特征向量和所述分类图片集合所对应的所述属性标签相同;
所述损失函数块根据所述第三特征向量和所述分类图片集合计算损失值,并将所述损失值加权求和得到加权损失值;
所述损失函数层将所述加权损失值在所述车辆属性识别模型中反向传播,以进行参数优化,从而完成一次迭代过程。
更进一步地,所述重复以上步骤,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型的步骤具体包括:
经过所述损失函数层的所述反向传播后,利用未经过所述卷积层组处理的所述图片再次输入到所述车辆属性识别模型中进行训练,直至完成下一次所述反向传播,并重复所述迭代过程至少20次,将完成了至少20次所述迭代过程的所述车辆属性识别模型作为最终完成训练后的所述车辆属性识别模型。
第二方面,本发明实施例还提供一种车辆属性识别模型的训练系统,所述训练系统包括图片获取模块、模型构建模块、卷积模块、特征采样模块、全连接模块、损失模块和迭代控制模块,其中:
所述图片获取模块用于获取具有车辆特征的图片,并将所述图片中出现的多种车辆属性分别标记为属性标签;
所述模型构建模块用于构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型;
所述卷积模块用于将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量;
所述特征采样模块用于将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合;
所述全连接模块用于将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量;
所述损失模块用于将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程;
所述迭代控制模块用于控制上述模块重复所述迭代过程,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型。
第三方面,本发明实施例还提供一种计算机设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述实施例中任一项所述的车辆属性识别模型的训练方法中的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中任一项所述的车辆属性识别模型的训练方法中的步骤。
本发明所达到的有益效果,由于采用了多标签的车辆属性识别模型,所以能够在识别过程中减少图像环境的干扰、提取到更加丰富的车辆特征,同时,相较于其他车辆属性识别采用了更轻度的模型结构,所以能够加快模型的识别速度及精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的车辆属性识别模型的训练方法的流程框图;
图2是本发明实施例提供的车辆属性识别模型的训练方法中步骤S102的子流程框图;
图3是本发明实施例提供的车辆属性识别模型的训练方法中步骤S103的子流程框图;
图4是本发明实施例提供的车辆属性识别模型的训练方法中步骤S104的子流程框图;
图5是本发明实施例提供的车辆属性识别模型的训练方法中步骤S106的子流程框图;
图6是本发明实施例提供的车辆属性识别模型的训练系统的结构框图;
图7是本发明实施例提供的计算机设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参见图1,图1是本发明实施例提供的车辆属性识别模型的训练方法的流程框图,所述训练方法的步骤具体包括以下步骤:
S101,获取具有车辆特征的图片,并将所述图片出现的多种车辆属性分别标记为属性标签。
在本发明实施例中,所述图片是在现实车辆卡口场景中采集的车辆图片,每张所述图片上有一个占据最大表现比例的目标车辆,同时,在每张所述图片中出现的目标车辆还具有多种车辆特征,所述车辆特征是现实生活中车辆所共有的、具有普遍性的属性,比如车辆的车身颜色、车辆的车牌种类、车辆的品牌等。具体的,本发明实施例所选用的所述车辆属性与所述车辆特征相对应,包括车辆品牌、车辆颜色、车辆年检标记,所述车辆属性在所述图片中标注为属性标签,比如,在获取到的所述图片中,选取具有以上所述车辆属性的其中153000张图片作为训练车辆属性识别模型时使用的测试集,再选取另外17000张图片作为测试车辆属性识别模型时使用的测试集。需要说明的是,选用何种所述车辆属性进行所述属性标签的标记,以及选用多少数量的所述图片对所述车辆属性识别模型进行训练和测试,可根据实际需要进行选择,对于以上条件,本发明不做限制。
S102,构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型。
请参见图2,图2是本发明实施例提供的车辆属性识别模型的训练方法中步骤S102的子流程框图,其具体包括以下子步骤:
S1021,搭建卷积层组,所述卷积层组有5层卷积层,第一层、第二层卷积层包括两组3×3的卷积核和一个池化操作,其余卷积层采用三组3×3的卷积核和一个池化操作,其中,第五层卷积层的最后一组3×3卷积核为全局卷积,对应的池化操作为全局均值池化。
所述卷积层组中的每一层卷积层均包括卷积核,根据逻辑层次的不同,卷积核的数目也不同,在本发明实施例中,所述卷积层组的5层卷积层依次为第一层卷积层、第二层卷积层、第三层卷积层、第四层卷积层及第五层卷积层,第一层、第二层卷积层均包括两组3×3的所述卷积核,所述卷积核通过卷积运算来提取作为输入的图片的特征,在所述卷积核后还设有一个池化操作,用于融合提取到的特征,所述卷积层组的第三层卷积层、第四层卷积层、第五层卷积层均包括三组3×3的所述卷积核,其中,第三卷积层、第四层卷积层的卷积核后也设置有一个池化操作,但第五层卷积层的池化操作是独立的全局均值池化操作,并且所述全局均值池化操作的前一个所述卷积核为全局卷积。
S1022,在所述卷积层组后设置所述随机失活层,用以对所述卷积层组的输出进行随机采样更新。
所述随机失活层是使用dropout(随机失活)方法的层,所述随机失活层利用dropout方法对所述卷积层组的输出作随机采样更新,避免出现过拟合现象。
S1023,在所述随机失活层的同一逻辑层次上设置所述属性分类层。
所述属性分类层不直接与所述卷积层组形成顺序逻辑关系,而是部署在与所述随机失活层处于同一层次的逻辑位置,所述属性分类层对输入的数据进行分类,生成根据所述属性标签的类型异同的多个分类图片集。
S1024,在所述随机失活层后设置所述全连接层,其中,所述全连接层包括多个全连接块,每一个所述全连接块分别对应一个所述属性标签。
所述全连接层包括多个全连接块,在本发明实施例中,对应三个所述属性标签,所述全连接层包括车辆品牌全连接块、车辆颜色全连接块、车辆年检标记全连接块,各个所述全连接块相互独立,且单独与所述随机失活层形成顺序连接关系。
S1025,在所述属性分类层和所述全连接层之后的一个逻辑层次上设置所述损失函数层,其中,所述损失函数层包括多个损失函数块,每一个所述损失函数块分别对应一个所述属性标签,至此完成所述车辆属性识别模型的构建。
所述损失函数层包括多个损失函数块,在本发明实施例中,对应三个所述属性标签,所述全连接层包括品牌损失函数块、颜色损失函数块、年检标记损失函数块,各个所述损失函数块相互独立,且单独与所述全连接层和所述属性分类层的输出形成顺序连接关系,至此,完成所述车辆属性识别模型的构建。
S103,将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量。
请参见图3,图3是本发明实施例提供的车辆属性识别模型的训练方法中步骤S103的子流程框图,其具体包括以下子步骤:
S1031,所述卷积层组的前两层卷积层依次对所述图片进行子采样操作,以增强所述图片中的所述车辆特征的特征表达。
具体的,所述卷积层组的前两层卷积层均只包含两组3×3的所述卷积核和一个所述池化操作,经过两组所述卷积核对所述图片进行子采样,主要目的是提取基本的车辆特征,在本发明实施例中,所述车辆特征具体为车辆品牌、车辆颜色、车辆年检标记,并通过所述池化操作进行处理,以在保留所述车辆特征的同时减少所述车辆属性识别模型的参数和复杂度,并扩大感受野,所述感受野是指一个卷积核在一张图片中进行卷积运算的范围。
S1032,所述卷积层组的后三层卷积层再依次对前两层卷积层处理后的所述图片进行子采样操作,在再次增强所述图片中的所述车辆特征的特征表达的同时,加深所述车辆属性识别模型的深度,最后所述卷积层组通过所述全局均值池化以获得所述车辆特征的向量数据,所述向量数据作为所述第一特征向量。
所述卷积层组的后三层卷积层中,各层的卷积核相比前两层卷积层中各层的卷积核多出一组,目的是加深所述车辆属性识别模型的网络深度,并且,所述卷积层组的最后一层还由所述全局卷积核和所述全局均值池化操作对所述图片进行最后处理,从所述图片中将提取出来的所述车辆特征汇集形成一个向量数据,将所述向量数据作为第一特征向量并输出。
S104,将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合。
请参见图4,图4是本发明实施例提供的车辆属性识别模型的训练方法中步骤S104的子流程框图,其具体包括以下步骤:
S104a,所述随机失活层对所述第一特征向量进行随机采样更新,防止出现过拟合向量,并输出所述第二特征向量。
所述随机失活层集成了所述dropout方法,具体的,所述第一特征向量是所述图片经过特征提取和融合的输出,因此所述第一特征向量有可能在所述车辆属性识别模型中出现过拟合现象,即,在特征提取和融合的过程中,图片的部分特征被过度提取,导致最终的特征不能完整地体现原始图片的特征,也就是存在误差,所述dropout方法对所述第一特征向量进行处理,主要是对所述第一特征向量中的向量值随机进行忽略计算,并随机采样和更新向量值,使所述第一特征向量中的所述过拟合向量减少,提高所述车辆属性识别模型的鲁棒性,并将处理过的所述第一特征向量作为所述第二特征向量进行输出。
S104b,所述属性分类层将所述图片按照所述属性标签进行分类,得到具有多类图片的所述分类图片集合;其中,将所述图片中具有多种所述属性标签的同一张图片定义为多标图片,所述分类图片集合中的每一类图片中均包含所述多标图片。
具体的,所述图片中包含所述属性标签,并且所述图片中的每一张图片都至少包含一种所述属性标签,所述属性分类层根据所述图片中的所述属性标签,将其分为具有多类图片的所述分类图片集合,所述分类图片集合在本发明实施例中包括车辆品牌图片集合、车辆颜色图片集合、车辆年检标记图片集合,在分类的过程中,由于所述图片中的属性标签有多种,将这些具有多种属性标签对图片定义为多标图片,因此根据所述多标图片所包含的所述属性标签的数量,在每一个所述分类图片集合中会有相同的所述多标图片。
S105,将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量。
具体的,所述全连接层包括多个全连接块,每一个所述全连接块对应一种所述属性标签,所述第二特征向量经过所述全连接块进行处理,得到根据所述属性标签分类的所述第三特征向量。
在本发明实施例中,所述全连接层中包括车辆品牌全连接块、车辆颜色全连接块、车辆年检标记全连接块,所述全连接层的主要作用为:将所述第二特征向量根据所述属性标签分类,并分别对应所述属性标签的所述全连接块输出所述第三特征向量。具体的,所述全连接层中的所述全连接块用于将所述车辆属性识别模型的所述卷积层组处理得到的所述车辆特征映射到标记空间中,在本发明实施例中,各个所述全连接块对应的特征映射为预设的所述属性标签,所述第二特征向量经过所述全连接块处理后,对应的所述属性标签在标记空间中的表达效果会被提高,从而实现根据所述属性标签进行分类的结果,即得到所述第三特征向量。
S106,将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程。
请参见图5,图5是本发明实施例提供的车辆属性识别模型的训练方法中步骤S106的子流程框图,该步骤具体包括以下子步骤:
S1061,将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,其中,所述损失函数层包括多个损失函数块,每一个所述损失函数块对应一种所述属性标签,共同输入到所述损失函数块的所述第三特征向量和所述分类图片集合所对应的所述属性标签相同。
所述损失函数块具体使用的损失函数为softmax,在上述步骤S105中,所述第三特征向量中包括根据所述属性标签进行分类得到的不同图片,比如车辆品牌图片、车辆颜色图片、车辆年检标记图片等;且所述分类图片集合中也包括根据所述属性标签进行分类得到的所述车辆品牌图片集合、所述车辆颜色图片集合、所述车辆年检标记图片集合。本步骤中将同一所述属性标签的所述第三特征向量和所述分类图片集合作为同属一个所述属性标签的所述损失函数块的输入数据。
S1062,所述损失函数块根据所述第三特征向量和所述分类图片集合计算损失值,并将所述损失值加权求和得到加权损失值。
所述损失函数块以同时具有其中一种所述属性标签的所述第三特征向量和所述分类图片为输入,得到针对不同所述属性标签的损失函数值,根据不同的所述属性标签得到不同的计算结果。在本发明实施例中,所述损失函数值分别包括根据所述车辆品牌、所述车辆颜色、所述车辆年检标记进行计算得到的三个计算结果,将三个计算结果分别进行权重赋值,并一起进行加权求和,得到一个所述加权损失值。
S1063,所述损失函数层将所述加权损失值在所述车辆属性识别模型中反向传播,以进行参数优化,从而完成一次迭代过程。
所述损失函数层得到所述加权损失值以后,将所述加权损失值在所述车辆属性识别模型中反向传播以优化模型参数,反向传播后,从而完成一次所述车辆属性识别模型的所述迭代过程。
S107,重复以上S101-S106的步骤,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型。
具体的,利用未经过所述卷积层组处理的所述图片再次输入到所述车辆属性识别模型中进行训练,直至完成下一次所述反向传播,并重复所述迭代过程至少20次,将完成了至少20次所述迭代过程的所述车辆属性识别模型作为最终完成训练后的所述车辆属性识别模型。
与现有技术相比,本发明实施例提供的车辆属性识别模型的训练方法,由于在数据选取时使用了多标签标记,且在车辆属性识别模型中加入了利用已提取到特征与原本数据一同进行全连接的设计,使得通过分别设计的损失函数对不同特征的损失结果进行反向传播,从而提升了车辆属性识别模型对于多标签的识别精度,并且减少了车辆属性识别模块的模型参数,提升了识别速度。
本发明实施例还提供一种车辆属性识别模型的训练系统,请参见图6,图6是本发明实施例提供的车辆属性识别模型的训练系统结构示意图,所述训练系统600包括图片获取模块601、模型构建模块602、卷积模块603、特征采样模块604、全连接模块605、损失模块606和迭代控制模块607,其中:
所述图片获取模块601用于获取具有车辆特征的图片,并将所述图片中出现的多种车辆属性分别标记为属性标签;
所述模型构建模块602用于构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型;
所述卷积模块603用于将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量;
所述特征采样模块604用于将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合;
所述全连接模块605用于将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量;
所述损失模块606用于将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程;
所述迭代控制模块607用于控制上述模块重复所述迭代过程,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型。
本发明实施例还提供一种计算机设备,请参见图7,图7是本发明实施例提供的计算机设备示意图,所述计算机设备700包括:存储器702、处理器701及存储在所述存储器702上并可在所述处理器701上运行的计算机程序。
处理器701调用存储器702存储的计算机程序,执行本发明实施例提供的车辆属性识别模型的训练方法中的步骤,请结合图1,具体包括:
S101,获取具有车辆特征的图片,并将所述图片中出现的多种车辆属性分别标记为属性标签;
S102,构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型;
S103,将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量;
S104,将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合;
S105,将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量;
S106,将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程;
S107,重复以上S101至S106的步骤,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型。
更进一步地,所述构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型的步骤具体包括以下子步骤:
搭建卷积层组,所述卷积层组有5层卷积层,第一层、第二层卷积层包括两组3×3的卷积核和一个池化操作,其余卷积层采用三组3×3的卷积核和一个池化操作,其中,第五层卷积层的最后一组3×3卷积核为全局卷积,对应的池化操作为全局均值池化;
在所述卷积层组后设置所述随机失活层,用以对所述卷积层组的输出进行随机采样更新,避免出现过拟合现象;
在所述随机失活层的同一逻辑层次上设置所述属性分类层;
在所述随机失活层后设置所述全连接层,其中,所述全连接层包括多个全连接块,每一个所述全连接块分别对应一个所述属性标签;
在所述属性分类层和所述全连接层之后的一个逻辑层次上设置所述损失函数层,其中,所述损失函数层包括多个损失函数块,每一个所述损失函数块分别对应一个所述属性标签,至此完成所述车辆属性识别模型的构建。
更进一步地,将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量的步骤具体包括以下子步骤:
所述卷积层组的前两层卷积层依次对所述图片进行子采样操作,增强所述图片中的所述车辆特征的特征表达;
所述卷积层组的后三层卷积层再依次对前两层卷积层处理后的所述图片进行子采样操作,在再次增强所述图片中的所述车辆特征的特征表达的同时加深所述车辆属性识别模型的深度,最后所述卷积层组通过所述全局均值池化以获得所述图片的特征点,所述特征点作为所述第一特征向量。
更进一步地,将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合的步骤具体包括以下子步骤:
所述随机失活层对所述第一特征向量进行随机采样更新,防止出现过拟合向量,并输出所述第二特征向量;
所述属性分类层将所述图片按照所述属性标签进行分类,得到具有多类图片的所述分类图片集合;其中,将所述图片中具有多种属性标签的同一张图片定义为多标图片,所述分类图片集合中的每一类图片中均包含所述多标图片。
更进一步地,将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量的步骤具体包括:
将所述第二特征向量输入所述全连接层,其中,所述全连接层包括多个全连接块,每一个所述全连接块对应一种所述属性标签,所述第二特征向量经过所述全连接块进行处理,得到根据所述属性标签分类的所述第三特征向量。
更进一步地,将所述第三特征向量和所述分类图片集合共同作为损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程的步骤具体包括以下步骤:
将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,其中,所述损失函数层包括多个损失函数块,每一个所述损失函数块对应一种所述属性标签,共同输入到所述损失函数块的所述第三特征向量和所述分类图片集合所对应的所述属性标签相同;
所述损失函数块根据所述第三特征向量和所述分类图片集合计算损失值,并将所述损失值加权求和得到加权损失值;
所述损失函数层将所述加权损失值在所述车辆属性识别模型中反向传播,以进行参数优化,从而完成一次迭代过程。
更进一步地,所述重复以上步骤,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型的步骤具体包括:
经过所述损失函数层的所述反向传播后,利用未经过所述卷积层组处理的所述图片再次输入到所述车辆属性识别模型中进行训练,直至完成下一次所述反向传播,并重复所述迭代过程至少20次,将完成了至少20次所述迭代过程的所述车辆属性识别模型作为最终完成训练后的所述车辆属性识别模型。
本发明实施例提供的计算机设备700可用于实现本发明实施例提供的车辆属性识别模型的训练方法中的步骤,解决的技术问题和达到的技术效果也相同,参上述车辆属性识别模型的训练方法的描述,在此不再赘述。
本发明实施例还提供一种计算机存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现本发明实施例提供的车辆属性识别模型的训练方法中的各个过程及步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,简称RAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,所揭露的仅为本发明较佳实施例而已,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式用等同变化,均属于本发明的保护之内。

Claims (10)

1.一种车辆属性识别模型的训练方法,其特征在于,所述方法包括以下步骤:
获取具有车辆特征的图片,并将所述图片中出现的多种车辆属性分别标记为属性标签;
构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型;
将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量;
将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合;
将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量;
将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程;
重复以上步骤,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型。
2.如权利要求1所述的车辆属性识别模型的训练方法,其特征在于,所述构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型的步骤具体包括以下子步骤:
搭建卷积层组,所述卷积层组有5层卷积层,第一层、第二层卷积层包括两组3×3的卷积核和一个池化操作,其余卷积层采用三组3×3的卷积核和一个池化操作,其中,第五层卷积层的最后一组3×3卷积核为全局卷积,对应的池化操作为全局均值池化;
在所述卷积层组后设置所述随机失活层,用以对所述卷积层组的输出进行随机采样更新;
在所述随机失活层的同一逻辑层次上设置所述属性分类层;
在所述随机失活层后设置所述全连接层,其中,所述全连接层包括多个全连接块,每一个所述全连接块分别对应一个所述属性标签;
在所述属性分类层和所述全连接层之后的一个逻辑层次上设置所述损失函数层,其中,所述损失函数层包括多个损失函数块,每一个所述损失函数块分别对应一个所述属性标签,至此完成所述车辆属性识别模型的构建。
3.如权利要求2所述的车辆属性识别模型的训练方法,其特征在于,将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量的步骤具体包括以下子步骤:
所述卷积层组的前两层卷积层依次对所述图片进行子采样操作,以增强所述图片中的所述车辆特征的特征表达;
所述卷积层组的后三层卷积层再依次对前两层卷积层处理后的所述图片进行子采样操作,在再次增强所述图片中的所述车辆特征的特征表达的同时,加深所述车辆属性识别模型的深度,最后所述卷积层组通过所述全局均值池化以获得所述车辆特征的向量数据,所述向量数据作为所述第一特征向量。
4.如权利要求1所述的车辆属性识别模型的训练方法,其特征在于,将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合的步骤具体包括以下子步骤:
所述随机失活层对所述第一特征向量进行随机采样更新,防止出现过拟合向量,并输出所述第二特征向量;
所述属性分类层将所述图片按照所述属性标签进行分类,得到具有多类图片的所述分类图片集合;其中,将所述图片中具有多种所述属性标签的同一张图片定义为多标图片,所述分类图片集合中的每一类图片中均包含所述多标图片。
5.如权利要求1所述的车辆属性识别模型的训练方法,其特征在于,将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量的步骤具体包括:
将所述第二特征向量输入所述全连接层,其中,所述全连接层包括多个全连接块,每一个所述全连接块对应一种所述属性标签,所述第二特征向量经过所述全连接块进行处理,得到根据所述属性标签分类的所述第三特征向量。
6.如权利要求1所述的车辆属性识别模型的训练方法,其特征在于,将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程的步骤具体包括以下子步骤:
将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,其中,所述损失函数层包括多个损失函数块,每一个所述损失函数块对应一种所述属性标签,共同输入到所述损失函数块的所述第三特征向量和所述分类图片集合所对应的所述属性标签相同;
所述损失函数块根据所述第三特征向量和所述分类图片集合计算损失值,并将所述损失值加权求和得到加权损失值;
所述损失函数层将所述加权损失值在所述车辆属性识别模型中反向传播,以进行参数优化,从而完成一次迭代过程。
7.如权利要求6所述的车辆属性识别模型的训练方法,其特征在于,所述重复以上步骤,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型的步骤具体包括:
经过所述损失函数层的所述反向传播后,利用未经过所述卷积层组处理的所述图片再次输入到所述车辆属性识别模型中进行训练,直至完成下一次所述反向传播,并重复所述迭代过程至少20次,将完成了至少20次所述迭代过程的所述车辆属性识别模型作为最终完成训练后的所述车辆属性识别模型。
8.一种车辆属性识别模型的训练系统,其特征在于,所述训练系统包括图片获取模块、模型构建模块、卷积模块、特征采样模块、全连接模块、损失模块和迭代控制模块,其中:
所述图片获取模块用于获取具有车辆特征的图片,并将所述图片中出现的多种车辆属性分别标记为属性标签;
所述模型构建模块用于构建包括卷积层组、随机失活层、属性分类层、全连接层和损失函数层的车辆属性识别模型;
所述卷积模块用于将所述图片输入所述车辆属性识别模型,通过所述卷积层组对所述图片进行处理,得到第一特征向量;
所述特征采样模块用于将所述第一特征向量输入所述随机失活层进行处理,得到第二特征向量,同时,所述属性分类层将所述图片按照所述属性标签进行分类,得到分类图片集合;
所述全连接模块用于将所述第二特征向量输入所述全连接层进行分类处理,得到第三特征向量;
所述损失模块用于将所述第三特征向量和所述分类图片集合共同作为所述损失函数层的输入,分别计算对应所述属性标签的损失函数值,并根据所述损失函数值对所述车辆属性识别模型进行参数优化,从而完成一次迭代过程;
所述迭代控制模块用于控制上述模块重复所述迭代过程,以完成至少20次所述迭代过程,得到最终完成训练后的所述车辆属性识别模型。
9.一种计算机设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的车辆属性识别模型的训练方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的车辆属性识别模型的训练方法中的步骤。
CN202110808544.0A 2021-07-16 2021-07-16 一种车辆属性识别模型的训练方法、系统及相关设备 Active CN113313079B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110808544.0A CN113313079B (zh) 2021-07-16 2021-07-16 一种车辆属性识别模型的训练方法、系统及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110808544.0A CN113313079B (zh) 2021-07-16 2021-07-16 一种车辆属性识别模型的训练方法、系统及相关设备

Publications (2)

Publication Number Publication Date
CN113313079A true CN113313079A (zh) 2021-08-27
CN113313079B CN113313079B (zh) 2021-11-12

Family

ID=77381717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110808544.0A Active CN113313079B (zh) 2021-07-16 2021-07-16 一种车辆属性识别模型的训练方法、系统及相关设备

Country Status (1)

Country Link
CN (1) CN113313079B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171112A (zh) * 2017-12-01 2018-06-15 西安电子科技大学 基于卷积神经网络的车辆识别与跟踪方法
CN109145759A (zh) * 2018-07-25 2019-01-04 腾讯科技(深圳)有限公司 车辆属性识别方法、装置、服务器及存储介质
CN109325547A (zh) * 2018-10-23 2019-02-12 苏州科达科技股份有限公司 非机动车图像多标签分类方法、系统、设备及存储介质
CN110209857A (zh) * 2019-05-23 2019-09-06 厦门市美亚柏科信息股份有限公司 基于神经网络结构搜索的车辆多属性识别方法、装置、介质
US10614310B2 (en) * 2018-03-22 2020-04-07 Viisights Solutions Ltd. Behavior recognition
CN111275061A (zh) * 2018-12-04 2020-06-12 北京嘀嘀无限科技发展有限公司 车辆属性识别方法及其模型训练方法、装置和电子设备
US10692242B1 (en) * 2019-05-02 2020-06-23 Capital One Services, Llc Vehicle analysis platform
CN111767954A (zh) * 2020-06-30 2020-10-13 苏州科达科技股份有限公司 车辆细粒度识别模型生成方法、系统、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171112A (zh) * 2017-12-01 2018-06-15 西安电子科技大学 基于卷积神经网络的车辆识别与跟踪方法
US10614310B2 (en) * 2018-03-22 2020-04-07 Viisights Solutions Ltd. Behavior recognition
CN109145759A (zh) * 2018-07-25 2019-01-04 腾讯科技(深圳)有限公司 车辆属性识别方法、装置、服务器及存储介质
CN109325547A (zh) * 2018-10-23 2019-02-12 苏州科达科技股份有限公司 非机动车图像多标签分类方法、系统、设备及存储介质
CN111275061A (zh) * 2018-12-04 2020-06-12 北京嘀嘀无限科技发展有限公司 车辆属性识别方法及其模型训练方法、装置和电子设备
US10692242B1 (en) * 2019-05-02 2020-06-23 Capital One Services, Llc Vehicle analysis platform
CN110209857A (zh) * 2019-05-23 2019-09-06 厦门市美亚柏科信息股份有限公司 基于神经网络结构搜索的车辆多属性识别方法、装置、介质
CN111767954A (zh) * 2020-06-30 2020-10-13 苏州科达科技股份有限公司 车辆细粒度识别模型生成方法、系统、设备及存储介质

Also Published As

Publication number Publication date
CN113313079B (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
CN109584248B (zh) 基于特征融合和稠密连接网络的红外面目标实例分割方法
CN110188635B (zh) 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法
CN108764292B (zh) 基于弱监督信息的深度学习图像目标映射及定位方法
CN112434721A (zh) 一种基于小样本学习的图像分类方法、系统、存储介质及终端
CN109978893A (zh) 图像语义分割网络的训练方法、装置、设备及存储介质
CN109325547A (zh) 非机动车图像多标签分类方法、系统、设备及存储介质
CN112906720B (zh) 基于图注意力网络的多标签图像识别方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN110728295B (zh) 半监督式的地貌分类模型训练和地貌图构建方法
CN110222718B (zh) 图像处理的方法及装置
CN112116599A (zh) 基于弱监督学习的痰涂片结核杆菌语义分割方法及系统
CN113095370A (zh) 图像识别方法、装置、电子设备及存储介质
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN112364974B (zh) 一种基于激活函数改进的YOLOv3算法
CN112132145A (zh) 一种基于模型扩展卷积神经网络的图像分类方法及系统
CN113269224A (zh) 一种场景图像分类方法、系统及存储介质
CN113326826A (zh) 网络模型的训练方法、装置、电子设备及存储介质
CN114463837A (zh) 基于自适应时空卷积网络的人体行为识别方法及系统
CN111027472A (zh) 一种基于视频光流和图像空间特征权重融合的视频识别方法
CN112528058B (zh) 基于图像属性主动学习的细粒度图像分类方法
CN112418256A (zh) 分类、模型训练、信息搜索方法、系统及设备
CN114565092A (zh) 一种神经网络结构确定方法及其装置
CN112183303A (zh) 变电设备图像分类方法、装置、计算机设备和介质
CN111783688A (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN113313079B (zh) 一种车辆属性识别模型的训练方法、系统及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PP01 Preservation of patent right

Effective date of registration: 20240109

Granted publication date: 20211112

PP01 Preservation of patent right