WO2020083073A1

WO2020083073A1 - 非机动车图像多标签分类方法、系统、设备及存储介质

Info

Publication number: WO2020083073A1
Application number: PCT/CN2019/111320
Authority: WO
Inventors: 谢晓汶; 陈燕娟; 黑光月; 周延培; 陈曲; 周峰; 孙新; 章勇; 曹李军; 陈卫东
Original assignee: 苏州科达科技股份有限公司
Priority date: 2018-10-23
Filing date: 2019-10-15
Publication date: 2020-04-30
Also published as: CN109325547A

Abstract

本申请提供了一种非机动车图像多标签分类方法、系统、设备及存储介质，所述非机动车图像的标签包括多个属性的分类结果，所述方法包括如下步骤：将测试的非机动车图像输入训练好的分类网络模型中，所述分类网络模型包括特征提取层和与所述属性一一对应的多个分类单元；所述分类网络模型的特征提取层提取测试图像中的特征；所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果；将各个属性的分类结果合并，作为测试的非机动车图像的标签。本申请采用了一个分类网络模型即可以实现非机动车多属性分类，训练方便，分类精度高。

Description

非机动车图像多标签分类方法、系统、设备及存储介质

技术领域

本申请涉及图像处理技术领域，尤其涉及一种非机动车图像多标签分类方法、系统、设备及存储介质。

背景技术

卷积神经网络作为深度学习的代表方法，能够自动学习图像特征提取，在大部分的计算机视觉任务中都有很好的效果。但在某些领域的应用中，如非机动车图像领域，往往需要获得目标图像的多个属性下类别标签的输出。常规做法可以使用多个多分类的网络来完成多个类别标签的图像识别，但这种方法会导致算法耗时随着应用中分类属性的规模而线性增加，效率很低。

发明内容

针对现有技术中的问题，本申请的目的在于提供一种非机动车图像多标签分类方法、系统、设备及存储介质，采用一个分类网络模型即可以实现非机动车多属性分类，训练方便，分类精度高。

本申请实施例提供一种非机动车图像多标签分类方法，所述非机动车图像的标签包括多个属性的分类结果，所述方法包括如下步骤：

将测试的非机动车图像输入训练好的分类网络模型中，所述分类网络模型包括特征提取层和与所述属性一一对应的多个分类单元；

所述分类网络模型的特征提取层提取测试的非机动车图像中的特征；

所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果；

将各个属性的分类结果合并，作为测试的非机动车图像的标签。

可选地，所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果，包括如下步骤：

所述分类网络模型的多个分类单元分别计算所述测试的非机动车图像属于所对应的属性中各个类别的概率，选择概率最大的类别作为所对应的属性的分类结果。

可选地，所述特征提取层包括至少一卷积层和至少一池化层，所述分类单元为softmax层。

可选地，所述特征提取层和分类单元之间还设置有第一全连接层和多个分支全连接层，所述多个分支全连接层与所述分类单元一一对应，所述特征提取层的输出通过所述第一全连接层后连接至所述多个分支全连接层，各个所述分支全连接层的输出连接至所对应的分类单元。

可选地，所述第一全连接层的输出通过一dropout层输入一第二全连接层，所述第二全连接层通过一dropout层连接至所述多个分支全连接层。

可选地，所述分类网络模型采用如下步骤进行训练：

构建包括特征提取层和多个分类单元的分类网络模型，所述分类单元与非机动车图像的属性一一对应；

获取训练集，所述训练集包括训练图像数据和与各个训练图像所对应的标签数据，所述标签数据包括图像路径和训练图像在各个属性中的类别；

将所述训练集输入所述分类网络模型进行迭代训练，将各个分类单元的损失值加权求和作为分类网络的损失，迭代训练至模型收敛；

保存训练完成的分类网络模型。

可选地，所述构建包括特征提取层和多个分类单元的分类网络模型之后，还包括如下步骤：

获取ImageNet公开数据集上训练好的权值文件对构建的分类网络模型的特征提取层和第一全连接层进行初始化；

对构建的分类网络模型的多个分支全连接层和多个分类单元进行随机初始化。

可选地，所述将所述训练集输入所述分类网络模型进行迭代训练，包括如下步骤：

设定训练所述分类网络模型的批尺寸、初始学习率和最大迭代次数；

采用所述训练集迭代训练所述分类网络模型，每迭代训练i次后学习率乘以k值，作为后续迭代训练的学习率，其中，i为预设调整学习率的周期次数，k为预设的学习率调整系数，且k<1；

训练到达最大迭代次数后，判断所述分类网络模型的损失值是否小于预设阈值；

如果是，则迭代训练完成；

否则，继续采用所述训练集迭代训练所述分类网络模型，至所述分类网络模型的损失值小于预设阈值。

本申请实施例还提供一种非机动车图像多标签分类系统，应用于所述的非机动车图像多标签分类方法，所述系统包括：

图像输入模块，用于将测试的非机动车图像输入训练好的分类网络模型中，所述分类网络模型包括特征提取层和与所述属性一一对应的多个分类单元；

特征提取模块，用于采用所述分类网络模型的特征提取层提取测试的非机动车图像中的特征；

图像分类模块，用于采用所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果；

结果输出模块，用于将各个属性的分类结果合并，作为所述测试的非机动车图像的标签。

本申请实施例还提供一种非机动车图像多标签分类设备，包括：

处理器；

存储器，其中存储有所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行所述的非机动车图像多标签分类方法的步骤。

本申请实施例还提供一种计算机可读存储介质，用于存储程序，所述程序被执行时实现所述的非机动车图像多标签分类方法的步骤。

本申请所提供的非机动车图像多标签分类方法、系统、设备及存储介质具有下列优点：

本申请通过深度学习提取特征和多个分类单元结合，采用一个分类网络模型即可以实现非机动车多属性分类，训练方便，分类精度高，从而解决了现有技术中多个采用多个图像分类模型的步骤繁琐、效率低下的问题。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显。

图1是本申请一实施例的非机动车图像多标签分类方法的流程图；

图2是本申请一实施例的训练集的非机动车图像的标注样式示例图；

图3是本申请一实施例的分类网络模型的结构示意图；

图4是本申请一实施例的非机动车图像多标签分类系统的结构示意图；

图5是本申请一实施例的非机动车图像多标签分类设备的结构示意图；

图6是本申请一实施例的计算机存储介质的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的实施方式；相反，提供这些实施方式使得本申请将全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构，因而将省略对它们的重复描述。

如图1所示，本申请实施例提供一种非机动车图像多标签分类方法，所述非机动车图像的标签包括多个属性的分类结果，所述方法包括如下步骤：

S100：将测试的非机动车图像输入训练好的分类网络模型中，所述分类网络模型包括特征提取层和与所述属性一一对应的多个分类单元；

S200：所述分类网络模型的特征提取层提取测试的非机动车图像中的特征；

S300：所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果；

S400：将各个属性的分类结果合并，作为测试的非机动车图像的标签。

各个属性可以是预设的彼此间不存在互斥关系的属性，例如多个属性可以包括动力类型、适用性别、车辆用途、是否有遮阳伞等等，对应地，在动力类型属性下面，非机动车可以分为电动车、摩托车、自行车等，适用性别可以分为男性车、女性车，车辆用途可以分为外卖车、快递车、非工作用车等，是否有遮阳伞可以分为有遮阳伞和无遮阳伞，一辆非机动车的标签可以是多个属性的分类结果的组合，例如一辆非机动车的标签可以是电动车、女性车、非工作用车、有遮阳伞。

因此，本申请通过深度学习提取特征和多个分类单元结合，采用一个分类网络模型即可以实现非机动车多属性分类，训练方便，分类精度高。

在该实施例中，所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果，包括如下步骤：

所述分类网络模型的多个分类单元分别计算所述测试的非机动车图像属于所对应的属性中各个类别的概率，选择概率最大的类别作为所对应的属性的分类结果。其中，分类单元可以采用softmax层，训练好的softmax层中输入由特征提取层提取的特征向量，输出的结果为一个T*1的向量，T的值对应该属性下类别的个数，而T*1的向量中每一个数值表示的是特征属于该属性下一个类别的概率，选择概率最大的类别作为该分类单元的分类结果，该选择的类别即为测试的非机动车图像在该属性下最可能属于的类别，从而可以准确得到测试的非机动车图像准确性最高的分类结果。

在该实施例中，所述特征提取层包括至少一卷积层和至少一池化层，所述分类单元为softmax层。所述特征提取层和分类单元之间还设置有第一全连接层和多个分支全连接层，所述多个分支全连接层与所述分类单元一一对应，所述特征提取层的输出通过所述第一全连接层后连接至所述多个分支全连接层，各个所述分支全连接层的输出连接至所对应的分类单元。进一步地，所述第一全连接层的输出可以通过一dropout层输入一第二全连接层，所述第二全连接层通过一dropout层连接至所述多个分支全连接层。卷积神经网络中每层卷积层由若干卷积单元组成，每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网路能从低级特征中迭代提取更复杂的特征。池化层也叫取样层，紧跟在卷积层之后，同样由多个特征面组成，它的每一个特征面对应于其上一层的一个特征面，不会改变特征面的个数。池化层旨在通过降低特征面的分辨率来获得具有空间不变性的特征。池化层起到二次提取特征的作用，它的每个神经元对局部接受域进行池化操作。常用的池化方法有最大池化即取局部接受域中值最大的点、均值池化即对局部接受域中的所有值求均值、随机池化等，本实例主要采用最大池化方法。

因此，卷积层和池化层的合理配合可以更好地提取测试的非机动车图像的特征，以进一步提高分类单元进行分类的准确性。下面在图2和图3中示出的具体实例中将进一步介绍各个层的具体应用。

在该实施例中，所述分类网络模型采用如下步骤进行训练：

获取训练集，所述训练集包括训练图像数据和与各个训练图像所对应的标签数据，所述标签数据包括图像路径和训练图像在各个属性中的类别；训练图像数据可以是实现采集好的已经进行了分类并且知道分类结果的非机动车图像，根据已知的分类结果为各个训练的非机动车图像增加标签，并将训练的非机动车图像和标签一起加入训练集中，以对分类网络模型进行训练；

将所述训练集输入所述分类网络模型进行迭代训练，将各个分类单元的损失值加权求和作为分类网络的损失，迭代训练至模型收敛；由于损失是考虑到各个分类单元的损失值的，在迭代过程中，总损失值的不断减小，也就同时优化提高了各个属性对应的分类单元的识别准确率；

保存训练完成的分类网络模型，收敛后的分类网络模型即可以用于本申请的测试的非机动车图像的分类识别，并且在使用中可以选择识别准确的非机动车图像新加入到训练集中，不断丰富训练集，并且定期重新训练分类网络模型，不断优化分类网络模型的识别效果，以在使用过程中不断提高模型识别的准确率。

在该实施例中，所述构建包括特征提取层和多个分类单元的分类网络模型之后，还包括如下步骤：

获取ImageNet公开数据集上训练好的权值文件对构建的分类网络模型的特征提取层和第一全连接层进行初始化；由于ImageNet已经有了比较成熟的卷积层、池化层和全连接层的权值文件，该实施例可以直接将其用来对本申请的分类网络模型进行初始化，可以大大节省分类网络模型训练的时间；

对构建的分类网络模型的多个分支全连接层和多个分类单元进行随机初始化，随机初始化可以采用正态分布对权值进行初始化，但本申请不限于此。

在该实施例中，所述将所述训练集输入所述分类网络模型进行迭代训练，包括如下步骤：

在训练模型的过程中，为了平衡模型的训练速度和损失而选择了相对合适的学习率，但是训练集的损失可能下降到一定程度就不再下降，此时通过适当降低学习率可以进一步减小损失，但是学习率的下降会延长训练所需的时间。因此，该实施例采用学习率逐步衰减的方法，在训练时间和降低损失之间寻找新的平衡，并且通过设定最大迭代次数适当控制训练时间；

如果是，则说明分类网络模型已经达到收敛，迭代训练完成；

否则，继续采用所述训练集迭代训练所述分类网络模型，至所述分类网络模型的损失值小于预设阈值，即训练至分类网络模型收敛为止。

下面结合图2和图3，以一个具体实例来进一步介绍本申请的非机动车图像多标签分类方法。在该具体实例中，所述非机动车图像多标签分类包括如下步骤：

步骤一：非机动车多标签数据集整理，步骤一即对应于上述的分类网络模型的训练过程中获取训练集的步骤；具体步骤一的过程如下：

步骤1.1：从现实场景中获得大量训练的非机动车图像，为图像编号；

步骤1.2：对图像的标注信息进行设计，按多个属性进行划分，分别用一位数字的标注位来表示，每组属性包含多种属性，分别用1～N的数字来表示。标注格式为：[图像路径][特征1的属性类别代码][特征2的属性类别代码]...，例如图2所示，包含非机动车图像的五种属性标注信息的标注方法；

步骤1.3：用以上所述标注方法对所有非机动车图像进行标注，对标签信息和图像信息分别整理成对应的数据集。数据集均为LMDB格式。

步骤二：非机动车多标签分类网络模型构建，构建的分类网络模型如图3所示，步骤二中对于上述实施例中采用的五个卷积层、三个池化层和全连接层的构建方式进行了具体介绍，具体模型的构建过程如下：

步骤2.1：训练时网络由输入层、五个卷积层、三个池化层、2+N个全连接层、N个softmax层组成，其中N的值为所确定的非机动车属性数。步骤2.2：data输入层后接第一卷积层和Relu激活函数，并在Relu激活函数后接第一批规范化处理层，在此后面接第一个池化层用最大值池化；

步骤2.3：池化后接第二卷积层，第二卷积后加Relu激活函数，并在激活函数后接第二批规范化处理层，规范化处理后接第二池化层，第二池化层采用最大值池化；

在深度神经网络中，通常使用一种叫修正线性单元(Rectified linear unit，Relu)作为神经元的激活函数。通过ReLU实现稀疏后的模型能够更好地挖掘相关特征，拟合训练数据。

步骤2.4：第二池化层后连续接三个卷积层，排列顺序为第三卷积层、Relu激活函数、第四卷积层、Relu激活函数、第五卷积层、Relu激活函数；

步骤2.5：在上一步之后接第三池化层，池化后接第一全连接层，并在第一全连接层后接Relu激活函数和dropout层，然后接第二全连接层，第一全连接层和第二全连接层设置相同；全连接层的每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起来。

步骤2.6：在第二全连接层后接N个分支全连接层，分别为分支全连接层1、分支全连接层2……分支全连接层n，每个分支全连接层后再接一个对应的softmax层，作为对应的分类单元，分类单元的输出作为最终的每类图像特征的属性类别输出，分别为分类单元1、分类单元2……分类单元n。

在本申请中，经多个卷积层和池化层后，连接着2个全连接层以及N个分支全连接层。全连接层中的每个神经元与其前一层的所有神经元进行全连接。全连接层可以整合卷积层或者池化层中具有类别区分性的局部信息。为了提升卷积神经网络的网络性能，全连接层每个神经元的激励函数采用ReLU函数。各个分支全连接层的输出值被传递给一个softmax层进行分类。Softmax层的算法可以理解为归一化，如目前图片分类有x种，那经过softmax层的输出就是一个x维的向量。向量中的第一个值就是当前图片属于第一类的概率值，向量中的第二个值就是当前图片属于第二类的概率值…这x维的向量之和为1。

步骤三：非机动车多标签分类网络训练，步骤三对应于上述的分类网络模型的训练中将所述训练集输入所述分类网络模型进行迭代训练的步骤，训练过程中将各个分类单元的损失值加权求和作为分类网络的损失，迭代训练至模型收敛，具体步骤三的过程如下：

步骤3.1：根据步骤一中整理的LMDB数据集，先计算训练数据集的均值文件，保存为.binaryproto文件的格式,并在训练网络中指定二进制均值文件的位置；

步骤3.2：采用finetune的训练方式，使用在ImageNet公开数据集上训练好的权值文件对当前网络进行部分层权值进行初始化，并对其他层进行随机初始化的方式，如上所述，在该实例中，使用在ImageNet公开数据集上训练好的权值文件对卷积层、池化层、第一全连接层和第二全连接层初始化，而对分支全连接层和分类单元进行随机初始化，随机初始化可以采用正态分布对权值进行初始化，但本申请不限于此；

步骤3.3：在设定训练所述分类网络模型的批尺寸、初始学习率和最大迭代次数时，设定批尺寸batch_size为32，初始学习率为0.001，最大迭代次数为200000次，采用step的方式在训练过程中进行学习率修改，每迭代1000次后学习率乘以0.9，采用随机梯度下降算法训练数据，设定每迭代10000次保存一次网络模型；随机梯度下降算法可以加快更新各个层的权值文件和偏置数据，这里的随机是指每次迭代过程中，样本都要被随机打乱，打乱可以有效减小样本之间造成的参数更新抵消问题。在最基本的随机梯度下降算法中，参数每一步通过减去它的梯度来更新，对于大规模的机器学习任务，随机梯度下降算法表现的性能十分可观。

训练时，向初始化的网络中输入训练样本和标签，计算各输入softmax层的损失值加权和作为最终的损失，每个softmax层的权重为1/N，但本申请不以此为限，具体权重值的分配可以根据需要进行设置。通过不断的前向传播和反向传播两个步骤，反复训练使得在训练过程中损失不断降低，直到达到最大的迭代次数；

每次训练完成之后，将保存的网络模型作为下一次迭代训练的预训练模型，避免在训练过程中出现模型数据的丢失，继续训练，训练达到最大的迭代次数之后，判断损失是否达到预设阈值以下，如果是，则结束训练，否则继续训练直到损失达到预设阈值以下，训练收敛则结束训练。

步骤四：非机动车多标签图像分类，步骤一和步骤三都是非机动车多标签图像的分类网络模型的准备过程，而步骤四即对应于上述步骤S100～步骤S400，即采用训练好的分类网络模型对图像进行分类的步骤，具体地，步骤四的过程如下：

步骤4.1：将预处理好的测试数据送入训练好的分类网络模型，提取非机动车图像特征，即对应于步骤S100和S200；

步骤4.2：将提取到的非机动车图像特征送入softmax层，输出N个特征属于特定属性中各个类别的概率，取每个属性中最大概率的类别作为该属性的分类结果，将N组识别的分类结果合并为最终的输出类别列表，即对应于步骤S300和S400。

由于本申请采用的分类网络模型的结构，可以一次性得到非机动车图像在多个属性下的分类结果，并且无需针对每个属性单独构建分类模型，因此经过上述的步骤操作，即可实现非机动车图像的快速多标签分类。

图像输入模块M100，用于将测试的非机动车图像输入训练好的分类网络模型中，所述分类网络模型包括特征提取层和与所述属性一一对应的多个分类单元；

特征提取模块M200，用于采用所述分类网络模型的特征提取层提取测试图像中的特征；

图像分类模块M300，用于采用所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果；

结果输出模块M400，用于将各个属性的分类结果合并，作为所述测试的非机动车图像的标签。

因此，本申请通过特征提取模块M200中深度学习的特征提取层和图像分类模块M300中多个分类单元结合，采用一个分类网络模型即可以实现非机动车多属性分类，训练方便，分类精度高。

本申请实施例还提供一种非机动车图像多标签分类设备，包括处理器；存储器，其中存储有所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行所述的非机动车图像多标签分类方法的步骤。

所属技术领域的技术人员能够理解，本申请的各个方面可以实现为系统、方法或程序产品。因此，本申请的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

下面参照图5来描述根据本申请的这种实施方式的电子设备600。图5显示的电子设备600仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示，电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于：至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元610执行，使得所述处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本申请各种示例性实施方式的步骤。例如，所述处理单元610可以执行如图1中所示的步骤。

所述存储单元620可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202，还可以进一步包括只读存储单元(ROM)6203。

所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204，这样的程序模块6205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备600交互的设备通信，和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且，电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备600使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

本申请实施例还提供一种计算机可读存储介质，用于存储程序，所述程序被执行时实现所述的非机动车图像多标签分类方法的步骤。在一些可能的实施方式中，本申请的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本申请各种示例性实施方式的步骤。

参考图6所示，描述了根据本申请的实施方式的用于实现上述方法的程序产品800，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本申请的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

综上所述，与现有技术相比，本申请所提供的非机动车图像多标签分类方法、系统、设备及存储介质具有下列优点：

以上内容是结合具体的优选实施方式对本申请所作的进一步详细说明，不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本申请的保护范围。

Claims

一种非机动车图像多标签分类方法，其特征在于，所述非机动车图像的标签包括多个属性的分类结果，所述方法包括如下步骤：

将测试的非机动车图像输入训练好的分类网络模型中，所述分类网络模型包括特征提取层和与所述属性一一对应的多个分类单元；

所述分类网络模型的特征提取层提取测试的非机动车图像中的特征；

所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果；

将各个属性的分类结果合并，作为测试的非机动车图像的标签。
根据权利要求1所述的非机动车图像多标签分类方法，其特征在于，所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果，包括如下步骤：

所述分类网络模型的多个分类单元分别计算所述测试的非机动车图像属于所对应的属性中各个类别的概率，选择概率最大的类别作为所对应的属性的分类结果。
根据权利要求1所述的非机动车图像多标签分类方法，其特征在于，所述特征提取层包括至少一卷积层和至少一池化层，所述分类单元为softmax层。
根据权利要求1所述的非机动车图像多标签分类方法，其特征在于，所述特征提取层和分类单元之间还设置有第一全连接层和多个分支全连接层，所述多个分支全连接层与所述分类单元一一对应，所述特征提取层的输出通过所述第一全连接层后连接至所述多个分支全连接层，各个所述分支全连接层的输出连接至所对应的分类单元。
根据权利要求4所述的非机动车图像多标签分类方法，其特征在于，所述第一全连接层的输出通过一dropout层输入一第二全连接层，所述第二全连接层通过一dropout层连接至所述多个分支全连接层。
根据权利要求4所述的非机动车图像多标签分类方法，其特征在于，所述分类网络模型采用如下步骤进行训练：

构建包括特征提取层和多个分类单元的分类网络模型，所述分类单元与非机动车图像的属性一一对应；

获取训练集，所述训练集包括训练图像数据和与各个训练图像所对应的标签数据，所述标签数据包括图像路径和训练图像在各个属性中的类别；

将所述训练集输入所述分类网络模型进行迭代训练，将各个分类单元的损失值加权求和作为分类网络的损失，迭代训练至模型收敛；

保存训练完成的分类网络模型。
根据权利要求6所述的非机动车图像多标签分类方法，其特征在于，所述构建包括特征提取层和多个分类单元的分类网络模型之后，还包括如下步骤：

获取ImageNet公开数据集上训练好的权值文件对构建的分类网络模型的特征提取层和第一全连接层进行初始化；

对构建的分类网络模型的多个分支全连接层和多个分类单元进行随机初始化。
根据权利要求7所述的非机动车图像多标签分类方法，其特征在于，所述将所述训练集输入所述分类网络模型进行迭代训练，包括如下步骤：

设定训练所述分类网络模型的批尺寸、初始学习率和最大迭代次数；

采用所述训练集迭代训练所述分类网络模型，每迭代训练i次后学习率乘以k值，作为后续迭代训练的学习率，其中，i为预设调整学习率的周期次数，k为预设的学习率调整系数，且k<1；

训练到达最大迭代次数后，判断所述分类网络模型的损失值是否小于预设阈值；

如果是，则迭代训练完成；

否则，继续采用所述训练集迭代训练所述分类网络模型，至所述分类网络模型的损失值小于预设阈值。
一种非机动车图像多标签分类系统，其特征在于，应用于权利要求1至8中任一项所述的非机动车图像多标签分类方法，所述系统包括：

图像输入模块，用于将测试的非机动车图像输入训练好的分类网络模型中，所述分类网络模型包括特征提取层和与所述属性一一对应的多个分类单元；

特征提取模块，用于采用所述分类网络模型的特征提取层提取测试的非机动车图像中的特征；

图像分类模块，用于采用所述分类网络模型的多个分类单元分别根据提取的特征计算各个属性的分类结果；

结果输出模块，用于将各个属性的分类结果合并，作为所述测试的非机动车图像的标签。
一种非机动车图像多标签分类设备，其特征在于，包括：

处理器；

存储器，其中存储有所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至8中任一项所述的非机动车图像多标签分类方法的步骤。
一种计算机可读存储介质，用于存储程序，其特征在于，所述程序被执行时实现权利要求1至8中任一项所述的非机动车图像多标签分类方法的步骤。