CN112418360A

CN112418360A - 卷积神经网络的训练方法、行人属性识别方法及相关设备

Info

Publication number: CN112418360A
Application number: CN202110083391.8A
Authority: CN
Inventors: 闫潇宁; 陈晓艳; 郑双午
Original assignee: Shenzhen Anruan Technology Co Ltd
Current assignee: Shenzhen Anruan Technology Co Ltd
Priority date: 2021-01-21
Filing date: 2021-01-21
Publication date: 2021-02-26
Anticipated expiration: 2041-01-21
Also published as: CN112418360B

Abstract

本发明涉及图像识别技术领域，提供一卷积神经网络的训练方法、行人属性识别方法及相关设备，所述训练方法包括：采集行人属性数据集；构建卷积神经网络，所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构；将所述行人属性图像进行标准卷积，处理后得到的行人属性特征图输入到所述特征降维结构进行特征降维训练；将训练输出的所述行人属性降维特征图输入到所述通道混合结构进行各通道间维度的融合；将所述行人属性通道融合特征图输入到所述特征分类结构，通过所述特征分类结构进行特征拆分，以得到目标卷积神经网络模型。本发明能够提高行人属性识别的准确率，且自身参数量小，运行速度快。

Description

卷积神经网络的训练方法、行人属性识别方法及相关设备

技术领域

本发明涉及图像识别技术领域，尤其涉及一种卷积神经网络的训练方法、行人属性识别方法及相关设备。

背景技术

近年来，行人属性识别在多个领域中越来越得到广泛的应用，准确、高效的行人属性识别结果在协助执法人员侦破案件、改进人机交互体验等方面有重要的辅助作用。

在基于卷积神经网络的多类别识别中，如何提高各个类别间有用信息的高效共享、降低无效信息的干扰始终是一个有待解决的技术问题。通常而言，在标准卷积中，卷积核与图像像素值的矩阵运算是在各个通道上同时进行的，但是在采用分组卷积后，各通道上的卷积核与图像像素值的矩阵运算则在各自通道上进行，即各通道间的信息交流是阻塞的，这将有利于维持某种行人属性的特征。但是通道间信息持续的阻塞将会对最终用于判别各类属性信息的总特征产生不利影响，会对多类别行人属性的识别结果的准确度造成影响。可见，现有技术中存在识别结果的准确率低的问题。

发明内容

本发明实施例提供一种卷积神经网络的训练方法，能够提高属性识别结果的准确度，并降低构建模型参数，提高模型的运行速度。

第一方面，本发明实施例提供一种卷积神经网络的训练方法，所述方法包括以下步骤：

采集行人属性数据集，所述行人属性数据集中包括行人属性图像；

构建卷积神经网络，所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构；

将所述行人属性数据集中的所述行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到所述特征降维结构进行特征降维训练，以输出行人属性降维特征图；

将所述行人属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合，输出行人属性通道融合特征图；

将所述行人属性通道融合特征图输入到所述特征分类结构，通过所述特征分类结构进行特征拆分，以得到目标卷积神经网络模型。

第二方面，本发明实施例提供一种行人属性识别方法，包括步骤：

获取待检测数据，所述待检测数据包括行人属性数据；

将所述待检测数据中的所述行人属性数据输入到任一实施例中所述的目标卷积神经网络模型进行行人属性识别；

将行人属性识别结果进行输出。

第三方面，本发明实施例提供一种卷积神经网络的训练装置，包括：

采集模块，用于采集行人属性数据集，所述行人属性数据集中包括行人属性图像；

构建模块，用于构建卷积神经网络，所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构；

特征降维模块，用于将所述行人属性数据集中的所述行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到所述特征降维结构进行特征降维训练，以输出行人属性降维特征图；

通道融合模块，用于将所述行人属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合，输出行人属性通道融合特征图；

特征分类模块，用于将所述行人属性通道融合特征图输入到所述特征分类结构，通过所述特征分类结构进行特征拆分，以得到目标卷积神经网络模型。

第四方面，本发明实施例提供一种行人属性识别装置，包括：

获取模块，用于获取待检测数据，所述待检测数据包括行人属性数据；

识别模块，用于将所述待检测数据中的所述行人属性数据输入到任一实施例中所述的目标卷积神经网络模型进行行人属性识别；

输出模块，用于将行人属性识别结果进行输出。

第五方面，本发明实施例提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述实施例提供的卷积神经网络的训练方法中的步骤。

第六方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述任一实施例提供的卷积神经网络的训练方法中的步骤。

在本发明实施例中，通过采集行人属性数据集，所述行人属性数据集中包括行人属性图像；构建卷积神经网络，所述卷积神经网络包括特征降维结构、通道混合结构及特征分类结构；将所述行人属性数据集中的所述行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到所述特征降维结构进行特征降维训练，以输出行人属性降维特征图；将所述行人属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合，输出行人属性通道融合特征图；将所述行人属性通道融合特征图输入到所述特征分类结构，通过所述特征分类结构进行特征拆分，以得到目标卷积神经网络模型。由于本发明构建的卷积神经网络包括特征降维结构、通道混合结构及特征分类结构，通过三个层次分别对卷积神经网络进行训练之后得到的目标卷积神经网络模型能够提高行人属性识别的准确率；同时构建的卷积神经网络网络结构自身的参数量小，能够提高运行速度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种卷积神经网络的训练方法的流程图；

图2是本发明实施例提供的另一种卷积神经网络的训练方法的流程图；

图2a是本发明实施例提供的采集行人属性数据集的流程图；

图2b是本发明实施例提供的特征降维结构处理的流程图；

图3是本发明实施例提供的另一种卷积神经网络的训练方法的流程图；

图3a是本发明实施例提供的通道混合结构处理的流程图；

图3b是本发明实施例提供的特征分类结构处理的流程图；

图4是本发明实施例提供的一种卷积神经网络的训练装置的结构示意图；

图5是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图；

图6是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图；

图7是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图；

图8是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图；

图9是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图；

图10是本发明实施例提供的一种行人属性识别方法的流程图；

图11是本发明实施例提供的一种行人属性识别装置的结构示意图；

图12是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的说明书和权利要求书及附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

如图1所示，图1是本发明实施例提供的一种卷积神经网络的训练方法的流程图，该卷积神经网络的训练方法包括以下步骤：

101、采集行人属性数据集，行人属性数据集中包括行人属性图像。

在本实施例中，所提供的卷积神经网络的训练方法可以是多类别行人属性识别，且可以运用在案件侦查、人员检测、人机交互体验等场景中。针对使用卷积神经网络方法构建多任务分类模型，均可以使用本发明提供的卷积神经网络的训练方法。上述卷积神经网络的训练方法运行于其上的电子设备可以通过有线连接方式或者无线连接方式进行网络连接，实现对行人属性数据的采集以及通信传输。上述无线连接方式可以包括但不限于3G/4G连接、WiFi（Wireless-Fidelity）连接、蓝牙连接、WiMAX（Worldwide Interoperabilityfor Microwave Access）连接、Zigbee（低功耗局域网协议，又称紫峰协议）连接、UWB(ultra wideband )连接、以及其他现在已知或将来开发的无线连接方式。

其中，行人属性数据集中，包括有多种类型的行人属性数据，例如：胡子、眉毛、眼睛、瞳孔等。采集方式可以是通过摄像头进行视频录制，对视频数据进行视频帧图像进行提取，也可以是使用已经离线获取到的行人属性图像，还可以是实时采集。采集到的行人属性数据集中可以包括多种类型的数据集，也即是可以对不同类型的数据进行分别存储，便于区分识别。

102、构建卷积神经网络，卷积神经网络包括特征降维结构、通道混合结构及特征分类结构。

其中，卷积神经网络(Convolutional Neural Network，CNN)是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。由于CNN避免了对图像的复杂前期预处理，可以直接输入原始图像，因此特别是在模式分类识别等领域有着广泛的运用。

在构建卷积神经网络时，可以包括构建三个部分：分别为特征降维结构、通道混合结构及特征分类结构。其中，上述的特征降维结构可以用于提升特征的通道；上述通道混合结构可以用于进行各通道间特征信息的融合；上述特征分类结构可以用于按通道维度对融合后得到的结果进行拆分。

103、将行人属性数据集中的行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到特征降维结构进行特征降维训练，以输出行人属性降维特征图。

其中，上述的标准卷积可以是一层卷积核为3×3的卷积，在进行特征降维处理前进行一次标准卷积可以提升输入图像（行人属性图像）的通道数。对输入图像进行卷积核为3×3的标准卷积后，可以输出行人属性特征图到特征降维结构中进行特征降维处理。特征降维结构包括有多个层次，并且在进行特征降维处理的过程中，需要反复多次执行，例如：执行3次。上一次特征降维结构的输出可以作为下一次特征降维结构的输入。经过多次特征降维操作后，最终可以输出行人属性降维特征图，且输出后的行人属性降维特征图的通道数得到了提升，例如：将行人属性降维特征图的特征维度由1×1的标准卷积经48通道提升为96通道。

104、将行人属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合，输出行人属性通道融合特征图。

其中，完成通道提升后，可以将行人属性降维特征图继续输入到通道混合结构中。此时，通道混合结构可以将已提升通道的行人属性降维特征图进行各通道间特征信息的融合。上述的通道融合结构同样可以包括多个层次，且进行多次的通道融合结构处理，在本实施例中，通道融合结构设置有3次，即通过通道混合结构对行人属性降维特征图进行3次各通道间维度的融合。此时输出的行人属性通道融合特征图中的每个通道中融合了其他各个通道中的特征信息。

具体的，上述通道混合结构中采用的通道混合算法原理为：假设输入m组特征，每组特征的通道数为n，先将每组特征reshape（重组）为m×n的特征图F1，特征图F1的每行特征对应原始m组特征中的某一组，然后对特征图F1进行转置运算，得到特征图F2，则在特征图F2中的每列对应原始m组特征中的某一组，最后对特征图F2重新按行拆分为m组，该m组中的特征向量就包括了原始输入的m组中每组的特征信息，从而实现各通道之间的特征融合。

105、将行人属性通道融合特征图输入到特征分类结构，通过特征分类结构进行特征拆分，以得到目标卷积神经网络模型。

其中，上述的特征分类结构可以实现对特征进行拆分，将拆分后得到的结果分配到各属性任务中，并根据各属性任务设置特征分类结构中的全连接层的分类器。其属性任务可以是用于对接收到的结果进行分类识别所创建的任务。其中，特征分类结构可以包括有多个层次，每个层次执行不同的功能。在特征分类结构中的全连接层的每一个结点都与上一层的所有结点相连，用来把前边提取到的特征属性综合起来。在CNN 结构中，经多个卷积层和池化层后，连接着1个或1个以上的全连接层。全连接层中的每个神经元与其前一层的所有神经元进行全连接。全连接层可以整合卷积层或者池化层中具有类别区分性的特征属性。为了提升 CNN 网络性能，全连接层每个神经元的激励函数可以采用 ReLU 函数。全连接层的最后一层输出值被传递给一个输出，该输出值也即是上述行人属性类别预测的值，且可以采用 softmax 逻辑回归(softmax regression)进行分类，当然还可以是其他分类方式。多个全连接层可以标识序号进行区分，例如：将全连接层标记为全连接层1、全连接层2，…，全连接层n。

在本发明实施例中，通过采集行人属性数据集，行人属性数据集中包括行人属性图像；构建卷积神经网络，卷积神经网络包括特征降维结构、通道混合结构及特征分类结构；将行人属性数据集中的行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到特征降维结构进行特征降维训练，以输出行人属性降维特征图；将行人属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合，输出行人属性通道融合特征图；将行人属性通道融合特征图输入到特征分类结构，通过特征分类结构进行特征拆分，以得到目标卷积神经网络模型。由于本发明构建的卷积神经网络包括特征降维结构、通道混合结构及特征分类结构，通过三个层次分别对卷积神经网络进行训练之后得到的目标卷积神经网络模型能够提高行人属性识别的准确率；同时构建的卷积神经网络网络结构自身的参数量小，能够提高运行速度。

如图2所示，图2是本发明实施例提供的另一种卷积神经网络的训练方法的流程图，具体包括以下步骤：

201、采集行人属性数据集，行人属性数据集中包括行人属性图像。

其中，可以通过图像采集设备采集行人数据，然后提取出行人的行人属性图像对应的行人属性数据，将所采集到多个人的行人属性数据进行分类集合，以生成行人属性数据集。

可选的，参照图2a所示，步骤201具体可以包括：

通过图像采集设备获取视频数据，并对视频数据进行视频帧抽取。

其中，图像采集设备可以是摄像头，或者是带有摄像头的相机等等可以实现图像采集的电子设备。上述的视频数据中可以包括有行人、道路等图像数据。视频由一帧一帧的图像组成，因此可以采取视频帧抽取的方式实现对需要抓取的图像数据进行抓取。

识别视频帧中的行人，并对行人的行人属性图像进行标记，行人属性图像包括行人属性图像。

其中，抽取出视频帧后，可以对视频帧进行识别，检测出视频帧中的行人。该行人可以是上层锁定的需要标记的行人。同时会对视频帧中该行人的行人属性进行标记，具体的，可以是对行人属性中的行人属性进行标记（标记需要的行人属性），例如：对头发、衣服、裤子、配饰、携带物品的颜色、款式等属性进行标记。标记可以是机器自动标记，也可以是标记人员进行标记。

对已标记的行人属性图像进行划分，得到行人属性数据集。

其中，完成标记之后，可以将不同类型的行人属性数据进行分类，将每一类的行人属性数据作为一个类，这样便会得到多个类，将所有类汇集起来便得到上述的行人属性数据集。且在行人属性数据集中，可以将其不同的类划分为训练集、验证集以及测试集。在本实施例的CNN模型中，将行人属性数据极划分训练集、验证集和测试集，可以实现在训练集上训练模型，在验证集上评估模型，且考虑到需要对CNN模型的层数、每层的神经元个数进行参数设置，当一旦找到的最佳的参数，就可以在测试集上最后测试一次，测试集上的误差作为泛化误差的近似，使CNN模型具有更强的识别能力。

202、构建卷积神经网络，卷积神经网络包括特征降维结构、通道混合结构及特征分类结构。

203、将行人属性数据集中的行人属性图像进行标准化处理。

其中，进行标准化处理可以包括对行人属性图像的大小进行标准处理，在本实施例中，上述输入到特征降维结构中的行人属性图像的大小需要标准化为112×112，也即是图像的分辨率大小。

204、将标准化处理后的行人属性图像通过预设的第一标准卷积层进行标准卷积计算，得到行人属性特征图。

其中，得到112×112的行人属性图像后，将其经过一层卷积核为3×3的标准卷积运算，以提升其通道数。上述第一标准卷积层输出的通道数可以为特征降维结构中第一层的第一分组卷积层的分组数的整数倍。经过第一标准卷积层进行通道提升后，输出的特征图为上述的行人属性特征图。在本实施例中，以12为例，经过上述第一标准卷积层进行标准卷积后输出行人属性特征图为12通道，且分辨率为112×112。

205、将行人属性特征图输入到特征降维结构进行多次特征降维训练，以输出行人属性降维特征图。

在本实施例中，上述特征降维结构可以包括3层，进行多次特征降维训练也即是进行3次特征降维训练。上一层的输出作为下一层的输入，完成3层特征降维之后输出行人属性降维特征图到通道融合结构中作为输入。

可选的，参考图2b所示，特征降维结构包括第一分组卷积层、第二标准卷积层与第一平均池化层，上述步骤205具体包括：

将行人属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练；重复执行将行人属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练的步骤，直到输出行人属性降维特征图。

其中，上述特征降维结构包括第一分组卷积层、1×1的第二标准卷积层及第一平均池化层。重复执行3次将行人属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练之后，便可以输出上述行人属性降维特征图。其中，行人属性特征图作为1×1的第二标准卷积层的输入图像，进行卷积操作后可以用于提升输入图像的特征维度，且每次输出的特征维度数设为24、48、96，且第二标准卷积层输出的通道数为特征降维结构中第一分组卷积层的分组数的整数倍，因此每次分组数为12，24，48。输出的行人属性降维特征图的特征维度由1×1的标准卷积经48通道提升为96通道，每个通道上的特征图的分辨率是14×14，也即是行人属性降维特征图输出为96×14×14。

206、将行人属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合，输出行人属性通道融合特征图。

207、将行人属性通道融合特征图输入到特征分类结构，通过特征分类结构进行特征拆分，以得到目标卷积神经网络模型。

在本实施例中，对输入的行人属性图像的大小进行标准化处理后经过一层卷积核为3×3的第一标准卷积层可以提升通道数；并且经过多次的特征降维结构处理后实现了通道提升。此外，在特征降维结构中构建第一分组卷积层、1×1的第二标准卷积层及第一平均池化层，通过第一分组卷积层可以控制多个属性任务自身特征的独立性，并且使用1×1的卷积核可以控制信息间的共享。

如图3所示，图3是本发明实施例提供的另一种卷积神经网络的训练方法的流程图，具体包括以下步骤：

301、采集行人属性数据集，行人属性数据集中包括行人属性图像。

302、构建卷积神经网络，卷积神经网络包括特征降维结构、通道混合结构及特征分类结构。

303、将行人属性数据集中的行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到特征降维结构进行特征降维训练，以输出行人属性降维特征图。

304、通道混合结构包括多层第二分组卷积层以及通道混合层，将行人属性降维特征图依次输入到多层第二分组卷积层，以依次提取行人属性降维特征图的行人属性特征，通过通道混合层对行人属性特征进行各通道间维度的融合。

在本实施例中，参考图3a所示，通道混合结构共设置有3组，在每一组通道混合结构中构建有2层第二分组卷积层以及1层通道混合层，2组第二分组卷积层对应的分组数一致，均设置为12组。上述行人属性降维特征图输出为96×14×14作为通道混合结构的输入图像，且首先输入到通道混合结构的第一层的第二分组卷积层，第一层的第二分组卷积层的输出作为第二层的第二分组卷积层的输入，通过2层分组卷积可以用于提取各组组内的特征信息，且这些特征信息可以是没有组间信息共享的信息。上述的第二层的第二分组卷积层的输出作为通道混合层的输入，可以对相对独立的各组信息进行通道维度上的混合，以实现通道间的信息共享。此外，为了避免在训练过程中出现梯度消失的问题，在通道混合结构中可以设置有残差支路。

305、重复执行将行人属性降维特征图依次输入到多层第二分组卷积层，以依次提取行人属性降维特征图的行人属性特征，通过通道混合层对行人属性特征进行各通道间维度的融合的步骤，直到输出行人属性通道融合特征图。

其中，第一层通道混合层的输出作为第二组通道混合结构中的第一层的第二分组卷积层的输出，依次执行，直到完成3组通道混合结构的训练，最后输出行人属性通道融合特征图。

306、特征分类结构还包括第三分组卷积层、第二平均池化层以及全连接层，将行人属性通道融合特征图输入到第二平均池化层，降低行人属性通道融合特征图的分辨率。

其中，参考图3b所示，特征分类结构还包括第三分组卷积层、第二平均池化层以及全连接层。行人属性通道融合特征图作为第二平均池化层的输入图像，通过第二平均池化层处理以降低其分辨率。

307、将降低分辨率后的行人属性通道融合特征图输入第三分组卷积层进行分组卷积处理，重新将通道间维度融合后的行人属性通道融合特征图拆分给多个属性识别任务。

308、根据多个属性识别任务设置全连接层的分类器，以得到目标卷积神经网络模型。

其中，行人属性通道融合特征图依次输入到平均池化层、分组卷积层进行卷积处理后，得到行人属性通道融合特征图，并将其拆分给每个属性识别任务，最后针对各个属性识别任务设置全连接层的分类器后，得到识别准确率更高的目标卷积神经网络模型。目标卷积神经网络模型以实现行人属性类别预测，经过数据测试，在自行构建的7类行人属性的测试集上，可以实现92%的平均识别准确率。

在本发明实施例中，通过在通道混合结构中设置两层分组卷积层以及通道混合层，对行人属性降维特征图中的各特征进行融合，实现行人属性信息间的共享。此外，在特征分类结构中还构建第三分组卷积层、第二平均池化层，通过第二平均池化层降低行人属性通道融合特征图的分辨率，输入到第三分组卷积层，重新将通道间维度融合后的行人属性通道融合特征图拆分并分配给多个属性识别任务，有利于把融合各属性的行人属性特征重新分配给每个具体的属性任务以支持全连接层的分类器完成最后的决策分类，使得多类属性的提取更加细化的特征以支持各属性任务的判别。且得到的目标卷积神经网络模型可以提高属性识别的准确率，同时构建的卷积神经网络的网络结构自身的参数量小，运行速度快。

如图4所示，图4是本发明实施例提供的一种卷积神经网络的训练装置的结构示意图，卷积神经网络的训练装置400包括：

采集模块401，用于采集行人属性数据集，行人属性数据集中包括行人属性图像；

构建模块402，用于构建卷积神经网络，卷积神经网络包括特征降维结构、通道混合结构及特征分类结构；

特征降维模块403，用于将行人属性数据集中的行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到特征降维结构进行特征降维训练，以输出行人属性降维特征图；

通道融合模块404，用于将行人属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合，输出行人属性通道融合特征图；

特征分类模块405，用于将行人属性通道融合特征图输入到特征分类结构，通过特征分类结构进行特征拆分，以得到目标卷积神经网络模型。

可选的，如图5所示，图5是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图，采集模块401包括：

获取单元4011，用于通过图像采集设备获取视频数据，并对视频数据进行视频帧抽取；

标记单元4012，用于识别视频帧中的行人，并对行人的行人属性图像进行标记，行人属性图像包括行人属性图像；

划分单元4013，用于对已标记的行人属性图像进行划分，得到行人属性数据集。

可选的，如图6所示，图6是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图，特征降维模块403包括：

标准化处理单元4031，用于将行人属性数据集中的行人属性图像进行标准化处理；

通道卷积单元4032，用于将标准化处理后的行人属性图像通过预设的第一标准卷积层进行标准卷积计算，得到行人属性特征图；

降维训练单元4033，用于将行人属性特征图输入到特征降维结构进行多次特征降维训练，以输出行人属性降维特征图。

可选的，特征降维结构包括第一分组卷积层、第二标准卷积层与第一平均池化层，如图7所示，图7是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图，降维训练单元4033包括：

降维训练子单元40331，用于将行人属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练；

重复降维子单元40332，用于重复执行将行人属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练的步骤，直到输出行人属性降维特征图。

可选的，通道混合结构包括多层第二分组卷积层以及通道混合层，如图8所示，图8是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图，通道融合模块404包括：

提取单元4041，用于将行人属性降维特征图依次输入到多层第二分组卷积层，以依次提取行人属性降维特征图的行人属性特征，通过通道混合层对行人属性特征进行各通道间维度的融合，其中，多层第二分组卷积层对应的分组数一致；

重复融合单元4042，用于重复执行将行人属性降维特征图依次输入到多层第二分组卷积层，以依次提取行人属性降维特征图的行人属性特征，通过通道混合层对行人属性特征进行各通道间维度的融合的步骤，直到输出行人属性通道融合特征图。

可选的，特征分类结构还包括第三分组卷积层、第二平均池化层以及全连接层，如图9所示，图9是本发明实施例提供的另一种卷积神经网络的训练装置的结构示意图，特征分类模块405包括：

分辨率处理单元4051，用于将行人属性通道融合特征图输入到第二平均池化层，降低行人属性通道融合特征图的分辨率；

分配单元4052，用于将降低分辨率后的行人属性通道融合特征图输入第三分组卷积层进行分组卷积处理，重新将通道间维度融合后的行人属性通道融合特征图拆分给多个属性识别任务；

设置单元4053，用于根据多个属性识别任务设置全连接层的分类器，以得到目标卷积神经网络模型。

本发明实施例提供的一种卷积神经网络的训练装置能够实现卷积神经网络的训练方法实施例中的各个实施方式，以及相应有益效果，为避免重复，这里不再赘述。

如图10所示，图10为本实施例提供的一种行人属性识别方法的流程图，一种行人属性识别方法，包括步骤：

1001、获取待检测数据，待检测数据包括行人属性数据。

其中，上述的待检测数据可以是通过摄像头采集到的行人数据，也可以是上层输入的行人数据，行人数据中的行人属性数据可以包括但不限于鞋子、衣服、裤子、配饰、携带物品等的款式、颜色等。

1002、将待检测数据中的行人属性数据输入到上述任一实施例中的目标卷积神经网络模型进行行人属性识别。

其中，目标卷积神经网络模型为已经训练完成的具有高识别率的模型，将待检测数据输入到上述任一实施例中的目标卷积神经网络模型进行行人属性识别，可以对待检测数据的行人属性数据进行细致的分析，判断出对应待检测数据的行人是否为需要查找的行人。

1003、将行人属性识别结果进行输出。

其中，将行人属性识别结果输出后，便可以判断出对应待检测数据的行人是否为需要查找的目标行人。

本发明实施例提供的一种行人属性识别方法能够运用上述提供的一种卷积神经网络的训练方法，且能够实现卷积神经网络的训练方法实施例中的各个实施方式以及相应有益效果，为避免重复，这里不再赘述。

如图11所示，图11为本实施例提供的一种行人属性识别装置的流程图，一种行人属性识别装置1100，包括：

获取模块1101，用于获取待检测数据，待检测数据包括行人属性数据；

识别模块1102，用于将待检测数据中的行人属性数据输入到任一实施例中的目标卷积神经网络模型进行行人属性识别；

输出模块1103，用于将行人属性识别结果进行输出。

如图12所示，图12是本发明实施例提供的一种电子设备的结构示意图，该电子设备1200包括：处理器1201、存储器1202、网络接口1203及存储在存储器1202上并可在处理器1201上运行的计算机程序，处理器1201执行计算机程序时实现实施例提供的卷积神经网络的训练方法中的步骤。

具体的，处理器1201用于执行以下步骤：

采集行人属性数据集，行人属性数据集中包括行人属性图像；

构建卷积神经网络，卷积神经网络包括特征降维结构、通道混合结构及特征分类结构；

将行人属性数据集中的行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到特征降维结构进行特征降维训练，以输出行人属性降维特征图；

将行人属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合，输出行人属性通道融合特征图；

将行人属性通道融合特征图输入到特征分类结构，通过特征分类结构进行特征拆分，以得到目标卷积神经网络模型。

可选的，处理器1201执行的采集行人属性数据集，行人属性数据集中包括行人属性图像的步骤包括：

通过图像采集设备获取视频数据，并对视频数据进行视频帧抽取；

识别视频帧中的行人，并对行人的行人属性图像进行标记，行人属性图像包括行人属性图像；

对已标记的行人属性图像进行划分，得到行人属性数据集。

可选的，处理器1201执行的将行人属性数据集中的行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到特征降维结构进行特征降维训练的步骤包括：

将行人属性数据集中的行人属性图像进行标准化处理；

将标准化处理后的行人属性图像通过预设的第一标准卷积层进行标准卷积计算，得到行人属性特征图；

将行人属性特征图输入到特征降维结构进行多次特征降维训练，以输出行人属性降维特征图。

可选的，特征降维结构包括第一分组卷积层、第二标准卷积层与第一平均池化层，处理器1201执行的将行人属性特征图输入到特征降维结构进行多次特征降维训练的步骤包括：

将行人属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练；

重复执行将行人属性特征图依次输入到第一分组卷积层、第二标准卷积层及第一平均池化层进行特征降维训练的步骤，直到输出行人属性降维特征图。

可选的，通道混合结构包括多层第二分组卷积层以及通道混合层，处理器1201执行的将行人属性降维特征图输入到已构建的通道混合结构进行各通道间维度的融合的步骤包括：

将行人属性降维特征图依次输入到多层第二分组卷积层，以依次提取行人属性降维特征图的行人属性特征，通过通道混合层对行人属性特征进行各通道间维度的融合，其中，多层第二分组卷积层对应的分组数一致；

重复执行将行人属性降维特征图依次输入到多层第二分组卷积层，以依次提取行人属性降维特征图的行人属性特征，通过通道混合层对行人属性特征进行各通道间维度的融合的步骤，直到输出行人属性通道融合特征图。

可选的，特征分类结构还包括第三分组卷积层、第二平均池化层以及全连接层，处理器1201执行的将行人属性通道融合特征图输入到特征分类结构，通过特征分类结构进行特征拆分，以得到目标卷积神经网络模型的步骤包括：

将行人属性通道融合特征图输入到第二平均池化层，降低行人属性通道融合特征图的分辨率；

将降低分辨率后的行人属性通道融合特征图输入第三分组卷积层进行分组卷积处理，重新将通道间维度融合后的行人属性通道融合特征图拆分给多个属性识别任务；

根据多个属性识别任务设置全连接层的分类器，以得到目标卷积神经网络模型。

本发明实施例提供的电子设备1200能够实现卷积神经网络的训练方法实施例中的各个实施方式，以及相应有益效果，为避免重复，这里不再赘述。

需要指出的是，图中仅示出了具有组件的1201-1203，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的电子设备1200是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

存储器1202至少包括一种类型的可读存储介质，可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器（例如，SD或DX存储器等）、随机访问存储器（RAM）、静态随机访问存储器（SRAM）、只读存储器（ROM）、电可擦除可编程只读存储器（EEPROM）、可编程只读存储器（PROM）、磁性存储器、磁盘、光盘等。在一些实施例中，存储器1202可以是电子设备1200的内部存储单元，例如该电子设备1200的硬盘或内存。在另一些实施例中，存储器1202也可以是电子设备1200的外部存储设备，例如该电子设备1200上配备的插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（Secure Digital, SD）卡，闪存卡（Flash Card）等。当然，存储器1202还可以既包括电子设备1200的内部存储单元也包括其外部存储设备。本实施例中，存储器1202通常用于存储安装于电子设备1200的操作系统和各类应用软件，例如卷积神经网络的训练方法的程序代码等。此外，存储器1202还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器1201在一些实施例中可以是中央处理器（Central Processing Unit，CPU）、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器1201通常用于控制电子设备1200的总体操作。本实施例中，处理器1201用于运行存储器1202中存储的程序代码或者处理数据，例如运行卷积神经网络的训练方法的程序代码。

网络接口1203可包括无线网络接口或有线网络接口，该网络接口1203通常用于在电子设备1200与其他电子设备之间建立通信连接。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器1201执行时实现实施例提供的卷积神经网络的训练方法中的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现实施例卷积神经网络的训练方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如各方法的实施例的流程。其中，存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory，ROM）或随机存取存储器（Random AccessMemory，简称RAM）等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种卷积神经网络的训练方法，其特征在于，包括以下步骤：

2.如权利要求1所述的卷积神经网络的训练方法，其特征在于，所述采集行人属性数据集的步骤包括：

通过图像采集设备获取视频数据，并对所述视频数据进行视频帧抽取；

识别所述视频帧中的行人，并对行人的所述行人属性图像进行标记；

对已标记的所述行人属性图像进行划分，得到所述行人属性数据集。

3.如权利要求1所述的卷积神经网络的训练方法，其特征在于，所述将所述行人属性数据集中的所述行人属性图像进行标准卷积，并将标准卷积处理后得到的行人属性特征图输入到所述特征降维结构进行特征降维训练的步骤包括：

将所述行人属性数据集中的所述行人属性图像进行标准化处理；

将标准化处理后的所述行人属性图像通过预设的第一标准卷积层进行标准卷积计算，得到所述行人属性特征图；

将所述行人属性特征图输入到所述特征降维结构进行多次特征降维训练，以输出所述行人属性降维特征图。

4.如权利要求3所述的卷积神经网络的训练方法，其特征在于，所述特征降维结构包括第一分组卷积层、第二标准卷积层与第一平均池化层，所述将所述行人属性特征图输入到所述特征降维结构进行多次特征降维训练的步骤包括：

将所述行人属性特征图依次输入到所述第一分组卷积层、所述第二标准卷积层及所述第一平均池化层进行特征降维训练；

重复执行所述将所述行人属性特征图依次输入到所述第一分组卷积层、所述第二标准卷积层及所述第一平均池化层进行特征降维训练的步骤，直到输出所述行人属性降维特征图。

5.如权利要求1所述的卷积神经网络的训练方法，其特征在于，所述通道混合结构包括多层第二分组卷积层以及通道混合层，所述将所述行人属性降维特征图输入到已构建的所述通道混合结构进行各通道间维度的融合的步骤包括：

将所述行人属性降维特征图依次输入到多层所述第二分组卷积层，以依次提取所述行人属性降维特征图的行人属性特征，通过所述通道混合层对所述行人属性特征进行各通道间维度的融合，其中，多层所述第二分组卷积层对应的分组数一致；

重复执行所述将所述行人属性降维特征图依次输入到多层所述第二分组卷积层，以依次提取所述行人属性降维特征图的行人属性特征，通过所述通道混合层对所述行人属性特征进行各通道间维度的融合的步骤，直到输出所述行人属性通道融合特征图。

6.如权利要求1所述的卷积神经网络的训练方法，其特征在于，所述特征分类结构还包括第三分组卷积层、第二平均池化层以及全连接层，所述将所述行人属性通道融合特征图输入到所述特征分类结构，通过所述特征分类结构进行特征拆分，以得到目标卷积神经网络模型的步骤包括：

将所述行人属性通道融合特征图输入到所述第二平均池化层，降低所述行人属性通道融合特征图的分辨率；

将降低分辨率后的所述行人属性通道融合特征图输入所述第三分组卷积层进行分组卷积处理，重新将通道间维度融合后的行人属性通道融合特征图拆分给多个属性识别任务；

根据所述多个属性识别任务设置所述全连接层的分类器，以得到所述目标卷积神经网络模型。

7.一种行人属性识别方法，其特征在于，包括步骤：

获取待检测数据，所述待检测数据包括行人属性数据；

将所述待检测数据中的所述行人属性数据输入到如权利要求1-6任一项所述的目标卷积神经网络模型进行行人属性识别；

将行人属性识别结果进行输出。

8.一种卷积神经网络的训练装置，其特征在于，包括：

9.一种行人属性识别装置，其特征在于，包括：

识别模块，用于将所述待检测数据中的所述行人属性数据输入到如权利要求1-6任一项所述的目标卷积神经网络模型进行行人属性识别；

输出模块，用于将行人属性识别结果进行输出。

10.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的卷积神经网络的训练方法中的步骤。