WO2019228089A1

WO2019228089A1 - 人体属性识别方法、装置、设备及介质

Info

Publication number: WO2019228089A1
Application number: PCT/CN2019/082977
Authority: WO
Inventors: 杨思骞; 李季檩; 吴永坚; 晏轶超; 贺珂珂; 葛彦昊; 黄飞跃; 汪铖杰
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-05-30
Filing date: 2019-04-17
Publication date: 2019-12-05
Also published as: CN108921022A; US11275932B2; US20200356767A1

Abstract

一种人体属性识别方法、装置、设备及介质，应用于图像识别技术领域。该方法由计算设备执行，包括：确定监控图像中的人体区域图像（201）；将人体区域图像输入多属性卷积神经网络模型，得到人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率（202）；其中，多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的；基于人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定人体区域图像中的各个人体属性的属性值（203）。

Description

人体属性识别方法、装置、设备及介质

本申请要求于2018年05月30日提交中国专利局、申请号为201810541546.6、发明名称为“一种人体属性识别方法、装置、设备及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像识别技术领域，尤其涉及一种人体属性识别方法、装置、设备及介质。

背景

人体属性识别是对人物的性别、年龄、衣物的类型和颜色等的识别，被广泛应用于危险行为预警、交通违章监控、工业安防和自动售货机、自动柜员机(Automatic Teller Machine，ATM)、商场和车站等公共场所的目标人物锁定等领域。

虽然，目前的人体属性识别技术已经取得了很大的成就，但是，大多数的人体属性识别技术都是针对单一的人体属性进行识别，无法同时识别多个人体属性。

技术内容

本申请实例提供了一种人体属性识别方法、装置、设备及介质。

本申请实例提供的具体技术方案如下：

本申请实例提供了一种人体属性识别方法，由计算设备执行，包括：

确定图像中的人体区域图像；

将人体区域图像输入多属性卷积神经网络模型，得到人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率；其中，多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的；

基于人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定人体区域图像中的各个人体属性的属性值。

本申请实例还提供了一种人体属性识别装置，包括：

确定单元，用于确定图像中的人体区域图像；

获取单元，用于将人体区域图像输入多属性卷积神经网络模型，得到人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率；其中，多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的；

识别单元，用于基于人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定人体区域图像中的各个人体属性的属性值。

本申请实例还提供了一种人体属性识别设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述指令可以使所述处理器：

确定图像中的人体区域图像；

将所述人体区域图像输入多属性卷积神经网络模型，得到所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率；其中，所述多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的；

基于所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定所述人体区域图像中的各个人体属性的属性值。

本申请实例还提供了一种存储介质，存有处理器可执行指令，所述指令由一个或一个以上处理器执行时，实现上述人体属性识别方法的步骤。

附图简要说明

图1A为本申请实例提供的多属性卷积神经网络模型的训练方法的流程示意图；

图1B为采用本申请实例提供的多属性卷积神经网络模型识别人体属性时的输入输出与采用多属性多模型方式识别人体属性时的输入输出的对比图；

图2为本申请实例提供的人体属性识别方法的流程示意图；

图3为以“交通违章监控”为具体应用场景时，本申请实例提供的人体属性识别方法的流程示意图；

图4为本申请实例提供的人体属性识别装置的功能结构示意图；

图5为本申请实例提供的人体属性识别设备的硬件结构示意图。

实施方式

在实际应用中，通常是根据多个人体属性来锁定目标人物，可见，精确地识别出多个人体属性的属性值，对于目标人物的锁定来说尤为重要。目前，主要采用多属性多模型的方式来识别各个人体属性，具体的，针对每一个人体属性分别建立属性识别模型，即一个人体属性对应一个属性识别模型，这样，在视频监控过程中，可以实时采集监控图像并检测监控图像中的人体区域图像，从而通过建立的各个属性识别模型，分别对人体区域图像中的各个人体属性进行识别，进而达到多属性识别的目的。然而，在具体实践过程中，本申请的发明人发现，虽然这种多属性多模型的方式在一定程度上能够实现多属性识别，但是，需要针对每一个人体属性分别建立一个属性识别模型，预处理操作较为繁琐，而且，在多属性识别过程中，需要利用预先建立的各个属性识别模型分别对相应的人体属性进行识别，无法实现对多个人体属性的同时识别，识别效率较低。

为此，本申请的发明人想到，利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练，以此来建立一个多属性卷积神经网络模型，这样，在视频监控过程中，就可以实时采集监控图像，并在检测到监控图像中的人体区域图像时，通过多属性卷积神经网络模型同时对人体区域图像中的各个人体属性进行识别，从而实现了多个人体属性同时识别的功能，有效地提高了多个人体属性的识别效率。

值得说的是，本申请实例提供的人体属性识别方法可以应用于多种视频监控场景，比如，危险行为监控、交通违章监控、工业安防监控和自动售货机、ATM、商场和车站等公共场所的监控等，需要注意的是，上述提及的应用场景仅是为了便于理解本申请的精神和原理而示出，本申请实例在此方面不受任何限制。相反，本申请实例可以应用于适用的任何场景。例如，可以应用于商场、门店等线下零售场景，识别入店及路过客群的属性信息，收集消费者画像，从而辅助精准营销、个性化推荐、门店选址、流行趋势分析等应用。又例如，可以应用于楼宇、户外等广告的智能化升级，采集人体信息，分析人群属性，定向投放广告物料，从而提升用户体验和商业效率。

在简单的介绍了本申请实例提供的人体属性识别方法和该人体属性识别方法的应用场景之后，接下来，结合本申请实例中的附图，对本申请实例提供的人体属性识别方法进行清楚、完整地描述，显然，所描述的实例仅仅是本申请一部分实例，并不是全部的实例。基于本申请中的实例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实例，都属于本申请保护的范围。

为了便于理解本申请，首先对本申请实例中涉及的部分技术用语进行说明。

1、人体属性，为能够同时被计算机和人感知的人体视觉特征，比如，性别、年龄、上衣纹理、上衣颜色、袖子类型、下衣纹理、下衣颜色、下衣长短、下衣类型等。

2、人体属性的属性值，为赋予人体属性的值，比如，人体属性—性别的属性值为男、女，人体属性—年龄的属性值为婴儿、儿童、青年、中年、老年等，人体属性—上衣纹理的属性值为纯色、横条纹、竖条纹、格子、大色块等，人体属性—上衣颜色的属性值为红、黄、蓝、黑、混色等。

3、属性识别模型，为能够同时识别出多个人体属性的属性值的模型，本申请实例以属性识别模型是多属性卷积神经网络模型为例进行说明。

4、多属性卷积神经网络模型，为利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的、能够同时识别出多个人体属性的属性识别模型。

5、多属性卷积神经网络，为深度学习的前馈神经网络，包括数据输入层、卷积计算层、激励层和全连接层，或者，包括数据输入层、卷积计算层、激励层和全局平均池化层。

其次，基于本申请实例提供的人体属性识别方法采用的是多属性卷积神经网络模型，而该多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的，所以，接下来，对本申请示例性实施方式的多属性卷积神经网络模型的训练方法进行说明。参阅图1A所示，多属性卷积神经网络模型的训练方法的流程如下：

步骤101：采集训练图像。具体的，可以直接从存储的监控视频中直接截取监控图像作为训练图像。

步骤102：定义各个人体属性以及各个人体属性对应的属性值。

例如：将人体属性定义为性别、年龄、人脸朝向、上衣纹理、上衣颜色、袖子类型、包型、下衣颜色、下衣长短、下衣类型。

将人体属性—性别的属性值定义为男、女，人体属性—年龄的属性值定义为儿童、青年、中年、老年；将人体属性—人脸朝向的属性值定义为正向、背向；将人体属性—上衣纹理的属性值定义为纯色、格子、大色块；将人体属性—上衣颜色的属性值定义为红、黄、绿、蓝、黑、灰白；将人体属性—袖子类型的属性值定义为长袖、短袖；将人体属性—包型的属性值定义为双肩包、斜挎包、手拎包、无包；将人体属性—下衣颜色的属性值定义为纯色、格子、大色块；将人体属性—上衣颜色的属性值定义为黑、灰白、彩色；将人体属性—下衣长短的属性值定义为长、短；将人体属性—上衣颜色的属性值定义为黑、灰白、彩色；将人体属性—下衣类型的属性值定义为裤子、裙子，等等，具体如表1所示：

表1.

步骤103：根据各个人体属性的属性值，确定人体属性向量。

例如：根据上述表1中的各个人体属性的属性值，可以确定出一个1×30的人体属性向量，即人体属性向量＝(性别男，性别女，儿童，青年，中年，老年，人脸正向，人脸背向，上衣纹理纯色，上衣纹理格子，上衣纹理大色块，上衣红色，上衣黄色，上衣绿色，上衣颜色，上衣黑色，上衣灰白色，上衣长袖，上衣短袖，双肩包，斜挎包，手拎包，无包，下衣黑色，下衣灰白色，下衣彩色，下衣长，下衣短，下衣裤子，下衣裙子)。

在一些实例中，还可以对上述每一个属性的属性值进行二分并赋值，例如，是否是男，是男则赋1，不是男则赋0，无法识别，则赋99；同理，是否是绿，是绿则赋1，不是绿则赋0，无法识别，则赋99；依次类推，可以得到其他属性的赋值，进而得到一个1×30的人体属性向量。例如，对训练图像或测试图像进行上述处理，可以分别得到如下向量：

Image_1 1 0 1…0 1

Image_2 0 1 99...1 0

...

Image_i 1 0 99...0 1

...

Image_n 1 0 0...0 1

其中，Imgae_i表示图片i的相对路径，0和1表示对应二分属性值，99 表示无法识别。

步骤104：将训练图像和人体属性向量输入多属性卷积神经网络的数据输入层。

步骤105：多属性卷积神经网络的数据输入层对训练图像进行去均值、归一化、主成分分析(Principal Component Analysis，PCV)和白化等预处理。

步骤106：多属性卷积神经网络的卷积计算层对数据输入层输出的训练图像进行特征提取，得到训练图像对应的各个特征矩阵。

步骤107：多属性卷积神经网络的激励层对卷积计算层输出的各个特征矩阵进行非线性映射处理，从而将各个特征矩阵中的特征值映射到一定范围内。具体的，在进行非线性映射时，可以采用但不限于Sigmoid函数、Tanh函数(双曲正切函数)、ReLU(Rectified Linear Unit，线性整流单元)函数等作为激励函数。在一些实例中，可以采用ReLU函数作为激励函数，对卷积计算层输出的各个特征矩阵进行非线性映射处理。

步骤108：多属性卷积神经网络的全连接层或者全局平均池化层根据激励层输出的各个特征矩阵，得到训练图像中的各个人体属性对应于预先定义的每一个属性值的概率。

下面仅以通过多属性卷积神经网络的全连接层确定训练图像中的各个人体属性对应于预先定义的每一个属性值的概率为例进行说明，具体的，可以采用但不限于以下方式：设置一个偏置量以及为各个人体属性分别设置一个权重矩阵，并根据激励层输出的各个特征矩阵以及预先设置的偏置量和各个权重矩阵，确定训练图像中的各个人体属性对应于预先定义的每一个属性值的概率。

步骤109：基于训练图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定训练图像中的各个人体属性的预测属性值，并根据训练图像中的各个人体属性的预测属性值，组成训练图像的预测属性值向量。

具体的，在基于训练图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定训练图像中的各个人体属性的预测属性值时，可以采用但不限于以下方式：针对训练图像中的每一个人体属性，从该人体属性对应于预先定义的每一个属性值的概率中，选取对应的概率最大的属性值作为该人体属性的预测属性值。

步骤110：确定全连接层或者全局平均池化层输出的预测属性值向量中的各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度。

在一些实例中，在确定各个人体属性的预测属性值与真实属性值之间的差异度时，可以采用但不限于如下述公式(1)所示的交叉熵损失函数来确定：

其中，在上述公式(1)中，L表示交叉熵损失函数的值，即差异度，n表示训练图像的个数，x表示第x个训练图像，m表示预先定义的人体属性的个数，y _i和a _i分别表示第i个人体属性的真实属性值和预测属性值。

步骤111：根据确定出的差异度，调整训练过程中使用的各层网络参数。其中，各层网络参数包括但不限于：各卷积计算层的内核参数和初始偏置矩阵、各激励层的参数、各全连接层或者全局平均池化层的参数等。

步骤112：利用调整网络参数后的多属性卷积神经网络对后续的训练图片进行多属性识别训练，如此循环往复，直至各个人体属性的预测属性值与真实属性值之间的差异度不大于预设阈值为止。

此时，多属性卷积神经网络对应的各层网络参数均为最优值，至此，多属性卷积神经网络模型的训练过程结束，并得到了各层网络参数均为最优值的多属性卷积神经网络模型。

值得说的是，在多属性卷积神经网络模型的整个训练过程中，没有使用池化层对特征数据进行压缩，尽可能地避免了由于使用池化层对特征数据进行压缩导致整个多属性卷积神经网络模型的表达能力较差的问题，有效地提高了人体属性识别的精确度。

此外，当增加新人体属性和/或为原人体属性增加新属性值时，可以按照设定比例选取新训练图像和原训练图像为训练图像，并利用多属性卷积神经网络对这些训练图像进行多属性识别训练，得到增加有新人体属性和/或新属性值的多属性卷积神经网络模型。这样，采用在新训练图像中增加原训练图像的方法，来增加新人体属性和/或新属性值的训练图像的数量，可以有效地避免由于新训练图像的数量较少导致训练结果不准确的问题，间接地提高了多属性卷积神经网络模型识别人体属性的精确度。

参阅图1B所示，为采用本申请实例提供的多属性卷积神经网络模型识别人体属性时的输入输出与采用多属性多模型方式识别人体属性时的输入输出的对比图，相对于多属性多模型的人体属性识别方式，本申请实例提供的多属性卷积神经网络模型能够同时识别出多个人体属性，不仅解决了多属性多模型的人体属性识别方式存在的无法同时识别多个人体属性的问题，还尽可能地提高了多个人体属性的识别效率。

在建立了多属性卷积神经网络模型之后，即可利用该多属性卷积神经网络模型同时对多个人体属性进行识别，具体的，参阅图2所示，本申请示例性实施方式的人体属性识别方法的流程如下，该方法可以由人体属性识别设备执行：

步骤201：确定监控图像中的人体区域图像。

步骤202：将人体区域图像输入多属性卷积神经网络模型，得到人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率。

其中，多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的，具体的，多属性卷积神经网络模型的训练方法与上述描述的训练方法相同，在此不再赘述。

步骤203：基于人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定人体区域图像中的各个人体属性的属性值。

具体的，可以针对人体区域图像中的每一个人体属性，从该人体属性对应于预先定义的每一个属性值的概率中，选取对应的概率最大的属性值作为该人体属性的属性值。

通过上述图2所示的方案，可以在检测到监控图像中的人体区域图像时，通过多属性卷积神经网络模型同时对人体区域图像中的各个人体属性进行识别，从而实现了多个人体属性同时识别的功能，有效地提高了多个人体属性的识别效率。

下面以“交通违章监控”为具体应用场景，对本申请示例性实施方式的人体属性识别方法进行说明，具体的，参阅图3所示，本申请示例性实施方式的人体属性识别方法的流程如下：

步骤301：从摄像头采集到的监控视频中截取监控图像。

步骤302：确定监控图像中的人体区域图像。

步骤303：将人体区域图像输入多属性卷积神经网络模型，得到人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，并基于人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定人体区域图像中的各个人体属性的属性值。

针对人体区域图像中的每一个人体属性，从该人体属性对应于预先定义的每一个属性值的概率中，选取对应的概率最大的属性值作为该人体属性的属性值，从而获得人体区域图像中的各个人体属性的属性值。

步骤304：根据人体区域图像中的各个人体属性的属性值，锁定监控图像中的目标人物，并在监控图像上标注该目标人物的各个人体属性的属性值和交通违章行为等信息。

在一些实例中，可以在确定该目标人物确实有交通违章行为时，在违章处理下拉框中选取确认违章，并根据识别出的该目标人物的各个人体属性的属性值和交通违章行为，生成交通违章记录，以及在监控图像上标注该目标人物的各个人体属性的属性值和交通违章行为等信息，当然，在针对该目标人物的交通违章行为调派相关人出警后，还可以在违章处理下拉框中选取已出警，从而结束此次交通违章行为的处理；而在确定该目标人物确实没有交通违章行为时，可以在违章处理下拉框中选取忽略违章，并结束此次交通违章行为的处理，此时，不会生成交通违章记录。

基于上述实例，本申请实例提供了一种人体属性识别装置，参阅图4所示，该人体属性识别装置至少包括：

确定单元401，用于确定监控图像中的人体区域图像；

获取单元402，用于将人体区域图像输入多属性卷积神经网络模型，得到人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率；其中，多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的；

识别单元403，用于基于人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定人体区域图像中的各个人体属性的属性值。

在一些实例中，该人体属性识别装置还包括：

训练单元404，用于根据预先定义的各个人体属性的属性值，并依次通过多属性卷积神经网络的数据输入层、卷积计算层、激励层和全连接层，对预先获得的训练图像进行多属性识别训练，得到多属性卷积神经网络模型；或者，根据预先定义的各个人体属性的属性值，并依次通过多属性卷积神经网络的数据输入层、卷积计算层、激励层和全局平均池化层，对预先获得的训练图像进行多属性识别训练，得到多属性卷积神经网络模型。

在一些实例中，该人体属性识别装置还包括：

调节单元405，用于确定多属性卷积神经网络模型输出的训练图像的各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度，并根据差异度，其中，所述预测属性值是基于训练图像中的各个人体属性对应于预先定义的每一个属性值的概率确定的；调整多属性卷积神经网络模型对应的各层网络参数。

在一些实例中，在确定多属性卷积神经网络模型输出的训练图像的各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度时，调节单元405具体用于：

利用交叉熵损失函数，确定各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度。

在一些实例中，训练单元404还用于：

当增加新人体属性和/或为原人体属性增加新属性值时，按照设定比例选取新训练图像和原训练图像为训练图像；

利用多属性卷积神经网络对训练图像进行多属性识别训练，得到增加有新人体属性和/或新属性值的多属性卷积神经网络模型。

在一些实例中，在基于人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定人体区域图像中的各个人体属性的属性值时，识别单元403具体用于：

针对人体区域图像中的每一个人体属性，从人体属性对应于预先定义的每一个属性值的概率中，选取对应的概率最大的属性值作为人体属性的属性值。

需要说明的是，由于上述人体属性识别装置解决技术问题的原理与上述人体属性识别方法相似，因此，上述人体属性识别装置的实施可以参见上述人体属性识别方法的实施，重复之处不再赘述。

综上所述，本申请实例所示的方案，所述人体属性识别装置可以在检测到监控图像中的人体区域图像时，通过多属性卷积神经网络模型同时对人体区域图像中的各个人体属性进行识别，从而实现了多个人体属性同时识别的功能，有效地提高了多个人体属性的识别效率。

此外，本申请实例还提供了一种人体属性识别设备，参阅图5所示，该人体属性识别设备至少包括：存储器501、处理器502和存储在存储器502上的计算机程序，处理器502执行该计算机程序时实现上述人体属性识别方法的步骤。

在一些实例中，该人体属性识别设备还可以包括输入装置503和输出装置504等。输入装置503可以包括触控笔、键盘、鼠标、触摸屏等；输出装置504可以包括显示设备，如液晶显示器(Liquid Crystal Display，LCD)、阴极射线管(Cathode Ray Tube，CRT)，触摸屏等。

本申请实例中不限定存储器501，处理器502、输入装置503和输出装置504之间的具体连接介质。本申请实例在图5中以存储器501，处理器502、输入装置503和输出装置504之间通过总线505连接，总线505在图5中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。其中，总线505可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

综上所述，本申请实例所示的方案，所述人体属性识别设备可以在检测到监控图像中的人体区域图像时，通过多属性卷积神经网络模型同时对人体区域图像中的各个人体属性进行识别，从而实现了多个人体属性同时识别的功能，有效地提高了多个人体属性的识别效率。

接下来，对本申请示例性实施方式的非易失性计算机可读存储介质进行介绍。本申请实例提供了一种非易失性计算机可读存储介质，该非易失性计算机可读存储介质存储有计算机可执行指令，该可执行程序被处理器执行实现上述人体属性识别方法的步骤。具体地，该可执行程序可以内置在人体属性识别设备中，这样，人体属性识别设备就可以通过执行内置的可执行程序实现上述人体属性识别方法的步骤，当然，该可执行程序也可以作为一个应用软件下载并安装到人体属性识别设备上，这样，人体属性识别设备就可以通过下载并安装的可执行程序实现上述人体属性识别方法的步骤。

此外，本申请实例提供的人体属性识别方法还可以实现为一种程序产品，该程序产品包括程序代码，当该程序产品可以在移动终端上运行时，该程序代码用于使人体属性识别设备执行上述人体属性识别方法的步骤。

在一些实例中，本申请实例提供的程序产品可以采用一个或多个可读介质的任意组合，其中，可读介质可以是可读信号介质或者可读存储介质，而可读存储介质可以是但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合，具体地，可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

在一些实例中，本申请实例提供的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，还可以在计算设备上运行。然而，本申请实例提供的程序产品不限于此，在本申请实例中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络连接到用户计算设备，诸如通过局域网(LAN)或广域网(WAN)连接到用户计算设备；或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本申请方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本申请的实例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实例、完全软件实例、或结合软件和硬件方面的实例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请实例进行各种改动和变型而不脱离本申请实例的精神和范围。这样，倘若本申请实例的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种人体属性识别方法，由人体属性识别设备执行，包括：

确定图像中的人体区域图像；

将所述人体区域图像输入多属性卷积神经网络模型，得到所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率；其中，所述多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的；

基于所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定所述人体区域图像中的各个人体属性的属性值。
如权利要求1所述的人体属性识别方法，其中，所述确定图像中的人体区域图像，包括：

确定监控图像中的人体区域图像。
如权利要求2所述的人体属性识别方法，其中，利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到所述多属性卷积神经网络模型，包括：

根据预先定义的各个人体属性的属性值，并依次通过所述多属性卷积神经网络的数据输入层、卷积计算层、激励层和全连接层，对预先获得的训练图像进行多属性识别训练，得到所述多属性卷积神经网络模型；或者，

根据预先定义的各个人体属性的属性值，并依次通过所述多属性卷积神经网络的数据输入层、卷积计算层、激励层和全局平均池化层，对预先获得的训练图像进行多属性识别训练，得到所述多属性卷积神经网络模型。
如权利要求3所述的人体属性识别方法，还包括：

确定所述多属性卷积神经网络模型输出的所述训练图像的各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度；其中，所述预测属性值是基于训练图像中的各个人体属性对应于预先定义的每一个属性值的概率确定的；

根据所述差异度，调整所述多属性卷积神经网络模型对应的各层网络参数。
如权利要求4所述的人体属性识别方法，其中，确定所述多属性卷积神经网络模型输出的所述训练图像的各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度，包括：

利用交叉熵损失函数，确定各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度。
如权利要求3-5任一项所述的人体属性识别方法，还包括：

当增加新人体属性和/或为原人体属性增加新属性值时，按照设定比例选取新训练图像和原训练图像为训练图像；

利用所述多属性卷积神经网络对所述训练图像进行多属性识别训练，得到增加有新人体属性和/或新属性值的多属性卷积神经网络模型。
如权利要求1所述的人体属性识别方法，其中，基于所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定所述人体区域图像中的各个人体属性的属性值，包括：

针对所述人体区域图像中的每一个人体属性，从所述人体属性对应于预先定义的每一个属性值的概率中，选取对应的概率最大的属性值作为所述人体属性的属性值。
一种人体属性识别装置，包括：

确定单元，用于确定图像中的人体区域图像；

获取单元，用于将所述人体区域图像输入多属性卷积神经网络模型，得到所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率；其中，所述多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的；

识别单元，用于基于所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定所述人体区域图像中的各个人体属性的属性值。
如权利要求8所述的人体属性识别装置，其中，所述确定单元，具体用于：

确定监控图像中的人体区域图像。
如权利要求9所述的人体属性识别装置，还包括：

训练单元，用于根据预先定义的各个人体属性的属性值，并依次通过所述多属性卷积神经网络的数据输入层、卷积计算层、激励层和全连接层，对预先获得的训练图像进行多属性识别训练，得到所述多属性卷积神经网络模型；或者，根据预先定义的各个人体属性的属性值，并依次通过所述多属性卷积神经网络的数据输入层、卷积计算层、激励层和全局平均池化层，对预先获得的训练图像进行多属性识别训练，得到所述多属性卷积神经网络模型。
如权利要求9所述的人体属性识别装置，还包括：

调节单元，用于确定所述多属性卷积神经网络模型输出的所述训练图像的各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度，其中，所述预测属性值是基于训练图像中的各个人体属性对应于预先定义的每一个属性值的概率确定的；并根据所述差异度，调整所述多属性卷积神经网络模型对应的各层网络参数。
如权利要求11所述的人体属性识别装置，其中，在确定所述多属性卷积神经网络模型输出的所述训练图像的各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度时，所述调节单元具体用于：

利用交叉熵损失函数，确定各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度。
如权利要求10-12任一项所述的人体属性识别装置，其中，所述训练单元还用于：

当增加新人体属性和/或为原人体属性增加新属性值时，按照设定比例选取新训练图像和原训练图像为训练图像；

利用所述多属性卷积神经网络对所述训练图像进行多属性识别训练，得到增加有新人体属性和/或新属性值的多属性卷积神经网络模型。
如权利要求8所述的人体属性识别装置，其中，在基于所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定所述人体区域图像中的各个人体属性的属性值时，所述识别单元具体用于：

针对所述人体区域图像中的每一个人体属性，从所述人体属性对应于预先定义的每一个属性值的概率中，选取对应的概率最大的属性值作为所述人体属性的属性值。
一种人体属性识别设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述指令可以使所述处理器：

确定图像中的人体区域图像；

将所述人体区域图像输入多属性卷积神经网络模型，得到所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率；其中，所述多属性卷积神经网络模型是利用多属性卷积神经网络对预先获得的训练图像进行多属性识别训练得到的；

基于所述人体区域图像中的各个人体属性对应于预先定义的每一个属性值的概率，确定所述人体区域图像中的各个人体属性的属性值。
如权利要求15所述的人体属性识别设备，其中，所述计算机可读指令可以使所述处理器：

确定监控图像中的人体区域图像。
如权利要求16所述的人体属性识别设备，其中，所述计算机可读指令可以使所述处理器：

根据预先定义的各个人体属性的属性值，并依次通过所述多属性卷积神经网络的数据输入层、卷积计算层、激励层和全连接层，对预先获得的训练图像进行多属性识别训练，得到所述多属性卷积神经网络模型；或者，

根据预先定义的各个人体属性的属性值，并依次通过所述多属性卷积神经网络的数据输入层、卷积计算层、激励层和全局平均池化层，对预先获得的训练图像进行多属性识别训练，得到所述多属性卷积神经网络模型。
如权利要求17所述的人体属性识别设备，其中，所述计算机可读指令可以使所述处理器：

确定所述多属性卷积神经网络模型输出的所述训练图像的各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度；其中，所述预测属性值是基于训练图像中的各个人体属性对应于预先定义的每一个属性值的概率确定的；

根据所述差异度，调整所述多属性卷积神经网络模型对应的各层网络参数。
如权利要求18所述的人体属性识别设备，其中，所述计算机可读指令可以使所述处理器：

利用交叉熵损失函数，确定各个人体属性的预测属性值与预先定义的各个人体属性的真实属性值之间的差异度。
如权利要求17-19任一项所述的人体属性识别设备，其中，所述计算机可读指令可以使所述处理器：

当增加新人体属性和/或为原人体属性增加新属性值时，按照设定比例选取新训练图像和原训练图像为训练图像；

利用所述多属性卷积神经网络对所述训练图像进行多属性识别训练，得到增加有新人体属性和/或新属性值的多属性卷积神经网络模型。
如权利要求15所述的人体属性识别设备，其中，所述计算机可读指令可以使所述处理器：

针对所述人体区域图像中的每一个人体属性，从所述人体属性对应于预先定义的每一个属性值的概率中，选取对应的概率最大的属性值作为所述人体属性的属性值。
一种存储介质，存有处理器可执行指令，所述指令由一个或一个以上处理器执行时，实现如权利要求1-7任一项所述的人体属性识别方法。