CN111783870B

CN111783870B - 人体属性的识别方法、装置、设备及存储介质

Info

Publication number: CN111783870B
Application number: CN202010605388.3A
Authority: CN
Inventors: 刘绍腾; 袁宇辰
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-06-29
Filing date: 2020-06-29
Publication date: 2023-09-01
Anticipated expiration: 2040-06-29
Also published as: CN111783870A

Abstract

本申请公开了人体属性的识别方法、装置、设备及存储介质，涉及人工智能的深度学习、图像识别以及云计算领域，具体实现方案为：利用无标注的第一行人样本图像对所述无监督特征学习模型进行训练，并根据训练完毕的无监督特征学习模型构建人体属性识别模型，利用有标注的第二行人样本图像人体属性识别模型进行训练，将待识别图像输入训练完毕的人体属性识别模型以获得人体属性识别结果的技术方案，与现有技术相比，由于在构建人体属性识别模型的过程中利用了无监督特征学习模型以及无标注的样本图像，其使得人体属性识别模型的训练样本图像得到扩充，从而使得人体属性模型可对于多样化和高复杂程度的人体属性进行准确识别。

Description

人体属性的识别方法、装置、设备及存储介质

技术领域

本申请实施例涉及人工智能的深度学习、图像识别以及云计算领域，尤其涉及一种人体属性的识别方法、装置、设备及存储介质。

背景技术

随着科技的发展，基于图像处理技术识别图像中的人体被广泛适用于各个领域。利用人体属性识别模型进行识别是实现人体识别的一种可实现方式。

在现有技术中，为了保证人体属性识别模型的识别准确性和识别范围，针对每一类型对人体属性均需要采用大量有标注的样本图像，对人体属性识别模型进行训练。

但是，由于人体属性的多样化和复杂程度，在标注样本图像时，很难将人体属性类型进行穷尽的标注，且针对每一类型的人体属性均需要标注大量样本图像，其标注难度较大，训练效果不佳，这也使得人体属性模型在识别人体属性时，识别结果准确性不高的问题。

发明内容

本申请提供了一种人体属性的识别方法、装置、设备及存储介质。

本申请的第一方面提供了一种人体属性的识别方法，包括：

获得第一行人样本图像和第二行人样本图像；其中，所述第一行人样本图像为无标注的样本图像，所述第二行人样本图像为标注的样本图像；

将第一行人样本图像输入无监督特征学习模型，以对所述无监督特征学习模型进行训练，获得训练完毕的无监督特征学习模型；

根据所述训练完毕的无监督特征学习模型构建人体属性识别模型中的特征提取层，并利用第二行人样本图像对于所述人体属性识别模型进行训练，获得训练完毕的人体属性识别模型；

将待识别图像输入至所述训练完毕的人体属性识别模型，获得待识别图像的人体属性识别结果。

本申请的第二方面提供了一种人体属性的识别装置，包括：

图像获取模块，用于获得第一行人样本图像和第二行人样本图像；其中，所述第一行人样本图像为无标注的样本图像，所述第二行人样本图像为标注的样本图像；

第一处理模块，用于将第一行人样本图像输入无监督特征学习模型，以对所述无监督特征学习模型进行训练，获得训练完毕的无监督特征学习模型；

第二处理模块，用于根据所述训练完毕的无监督特征学习模型构建人体属性识别模型中的特征提取层，并利用第二行人样本图像对于所述人体属性识别模型进行训练，获得训练完毕的人体属性识别模型；还用于将待识别图像输入至所述训练完毕的人体属性识别模型，获得待识别图像的人体属性识别结果。

本申请的第三方面提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面中任一项所述的方法。

本申请的第四方面提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行第一方面任一项所述的方法。

本申请提供的人体属性的识别方法、装置、设备及存储介质，通过采用利用无标注的第一行人样本图像对所述无监督特征学习模型进行训练，并根据训练完毕的无监督特征学习模型构建人体属性识别模型，利用有标注的第二行人样本图像人体属性识别模型进行训练，将待识别图像输入训练完毕的人体属性识别模型以获得人体属性识别结果的技术方案，与现有技术相比，由于在构建人体属性识别模型的过程中利用了无监督特征学习模型以及无标注的样本图像，其使得人体属性识别模型的训练样本图像得到扩充，从而使得人体属性模型可对于多样化和高复杂程度的人体属性进行准确识别。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是本申请实施例的人体属性的识别方法的场景图；

图2是本申请提供的一种人体属性的识别方法的流程示意图；

图3为本申请实施例提供的一种无监督特征学习模型的模型架构示意图；

图4为本申请实施例提供的一种人体属性识别模型的模型架构示意图；

图5为本申请实施例提供的一种人体属性识别的界面示意图；

图6为本申请提供的一种人体属性的识别装置的结构示意图

图7是用来实现本申请实施例人体属性的识别方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

为了清楚理解本申请的技术方案，首先对现有技术的方案进行详细介绍。

随着科技的发展，基于图像处理技术识别图像中的人体被广泛适用于各个领域。举例来说，在监控安防领域，通过利用图像处理技术可对于监控视频图像中的行人的信息进行识别和分析，以便于相关人员利用识别和分析的结果，维护公共治安。

利用人体属性识别模型对于图像中的人体属性进行识别是其中一种可实现方式。在现有技术中，为了保证人体属性识别模型的识别准确性和识别范围，针对每一类型对人体属性均需要采用大量有标注的样本图像，对人体属性识别模型进行训练。

但是，由于人体属性的多样化和复杂程度，在标注样本图像时，很难将人体属性类型进行穷尽的标注，且针对每一类型的人体属性均需要标注大量样本图像，其标注难度较大，训练效果不佳，这也使得人体属性模型在识别人体属性时，识别结果准确性不高的问题。针对这样的问题，发明人在研究中发现，通过利用无标注的第一行人样本图像可对所述无监督特征学习模型进行训练，再根据训练完毕的无监督特征学习模型构建人体属性识别模型，并利用有标注的第二行人样本图像对其进行训练以得到训练后的人体属性识别模型，通过这样的方式使得在对于人体属性识别模型的训练过程中，不仅使得人体属性模型可对于有标注的样本图像进行有效学习，还可充分利用无标注的样本图像参与到对习样本图像的数量和范围，从而使得人体属性模型可对于多样化和高复杂程度的人体属性进行准确识别。

下面对本申请实施例提供的应用场景进行介绍。

本申请提供了一种人体属性的识别方法、装置、设备及存储介质，应用于计算机技术中的人工智能技术，以实现对于图像中的人体属性进行准确识别。

图1是可以实现本申请实施例的人体属性的识别方法的场景图，如图1所示，本申请实施例提供的人体属性的识别方法对应的应用场景中包括：前端的终端1以及服务器2。

其中，各前端的终端1具体可为可用于采集图像或拍摄视频等具体视频图像采集功能的硬件设备，其包括但不限于监控摄像头、照相机、具备摄像功能的智能手机、具备摄像功能的平板电脑等。通过网络，终端1可将采集得到的图像或视频等发送至服务器2，以供其按照预设的处理逻辑进行相应处理。

而服务器2具体可为硬件服务器，或承载云端服务器的硬件载体。当各终端1将采集得到的图像或视频发送至服务器2时，服务器2中承载的人体属性的识别装置将调用训练完毕的人体属性识别模型对图像或视频中的待识别的图像进行识别处理，得到待识别图像的人体属性识别结果。

以下将参照附图来具体描述本申请的实施例。

实施例一

图2是本申请提供的一种人体属性的识别方法的流程示意图，如图2所示的，本申请实施例的执行主体为人体属性的识别装置，该人体属性的识别装置将承载于前述的服务器中。

本实施例提供的人体属性的识别方法包括以下几个步骤。

步骤101、获得第一行人样本图像和第二行人样本图像；其中，所述第一行人样本图像为无标注的样本图像，所述第二行人样本图像为标注的样本图像。

步骤102、将第一行人样本图像输入无监督特征学习模型，以对所述无监督特征学习模型进行训练，获得训练完毕的无监督特征学习模型。

步骤103、根据所述训练完毕的无监督特征学习模型构建人体属性识别模型中的特征提取层，并利用第二行人样本图像对于所述人体属性识别模型进行训练，获得训练完毕的人体属性识别模型。

步骤104、将待识别图像输入至所述训练完毕的人体属性识别模型，获得待识别图像的人体属性识别结果。

本实施例中，行人样本图像是指预先采集获得的包括有行人图像的样本图像。需要说明的是，其采集获得的渠道可为多种，其包括但不限于从已有视频中截取获得，利用互联网资源获得、拍摄采集获得等等。

需要说明的是，由于本申请实施例涉及的为对于图像中人体属性的识别，无论采用什么样的获得方式，其样本图像中均应包括有行人图像。

基于预先采集获得的包括有行人图像的样本图像，可对其图像中的部分图像进行标注处理，标注后的行人样本图像将作为本实施例中的第二行人样本图像，而未标注的行人样本图像将作为本实施例中的第一行人样本你图像。其中，对于进行标注的部分图像来说，其可为从获取的全部行人样本图像中随机选取获得的，也可以为按照预设筛选规则筛选获得的，本实施例对此不进行限制。

此外，对于第一行人样本图像和第二行人样本图像来说，其在被输入至相应模型以进行模型训练之前，还应对其图像进行预处理，以保证以能够符合用于训练的图像要求。

具体来说，对所述第一行人样本图像，和/或，第二行人样本图像的预处理包括尺度缩放处理、像素值归一化处理、均值处理以及方差处理。

其中，尺度缩放处理可为将图像在尺度维度上进行缩放，以使得缩放后的图像的尺度维度为224*224；均值处理可为将图像的RGB像素值进行以(0.485,0.456,0.406)为均值的像素处理；方差处理可为将图像的RGB像素值进行以(0.229,0.224,0.225)为方差值的像素处理。

换句话说，通过对于第一行人样本图像进行预处理，以利用预处理后的第一行人样本图像对所述无监督特征学习模型进行训练；和/或，对于第二行人样本图像进行预处理，以利用预处理后的第二行人样本图像对所述人体属性识别模型进行训练，从而完成了对于图像的预处理。

随后，识别装置会将无标注的第一行人样本图像输入预先构建的无监督特征学习模型中，以对该模型进行有效训练，得到训练完毕的无监督特征学习模型。其中，对于无监督特征学习模型来说，模型结构可采用基于对比损失的无监督学习模型，当然也可采用其他类型的机器学习模型。

具体的，在本步骤中，由于第一行人样本图像中仅包括有行人图像，而不包括对于行人图像中的行人进行人体属性标注处理而得到的标注信息，因此，在构建模型以及对模型进行训练时，也将采用无监督算法的方式进行，以保证无监督特征学习模型能够被无标注的第一行人样本图像训练，以得到训练后的无监督特征学习模型。

再后，识别装置会根据所述训练完毕的无监督特征学习模型构建人体属性识别模型中的特征提取层。然后，利用前述获得有标注的第二行人样本图像采用有监督算法对于所述人体属性识别模型进行训练，获得训练完毕的人体属性识别模型。

也就是说，与前述的无监督特征识别模型的训练方式不同的是，对于人体属性识别模型来说，其将基于有监督的算法进行模型训练。其中，在构建该人体属性识别模型时，前述的无监督特征学习模型将被用于人体属性识别模型的特征提取层。此外，在对于人体属性识别模型进行训练时，为了保证其能够实现对于人体属性的识别，以确定出图像中行人的人体属性类别以及相应的概率，本实施例中将会利用有标注的第二行人样本图像对于人体属性识别模型进行训练，以得到可对于待识别图像进行人体属性识别，并输出人体属性识别结果的训练完毕的人体属性识别模型。

在上述过程中，需要说明的是，对于人体属性识别模型来说，其中的特征提取层是基于无监督特征学习模型建立的，也就是说，对于训练完毕的人体属性识别模型的特征提取层来说，其经过了两次不同的训练过程，其一为利用无标注的第一行人样本图像进行无监督训练，其二为利用有标注的第二行人样本图像进行有监督训练。通过两种训练方式而得到的训练完毕的人体属性识别模型的特征提取层，其相对于现有技术中的人体属性识别模型来说，能够从图像中提取更为多样化的特征信息，从而能够为后续基于特征信息进行识别的处理提供良好的支持。

因此，本实施例提供的人体属性的识别方法与现有技术相比，由于在构建人体属性识别模型的过程中利用了无监督特征学习模型以及无标注的行人样本图像，其使得用于训练人体属性识别模型的训练样本图像在数量上得到了扩充，也使得人体属性模型可对于多样化和高复杂程度的人体属性对应的图像进行有效的特征提取，提高了对于这类图像的人体属性识别的识别准确率。

在上述实施例的基础上，为了进一步说明本申请对于无监督特征学习模型的训练过程，上述实施例中的步骤102具体可采用如下方式：

步骤1021、对所述第一行人样本图像进行随机数据增强处理，获得第一增强样本图像和第二增强样本图像。

步骤1022、利用所述第一增强样本图像和第二增强样本图像采用基于对比损失的无监督算法，对所述无监督特征学习模型进行训练，获得训练完毕的无监督特征学习模型。

为了更好的说明本实施例中对于无监督特征学习模型的训练过程，图3为本申请实施例提供的一种无监督特征学习模型的模型架构示意图，如图3所示的。

在该无监督特征学习模型中，包括有编码层、动量编码层、队列层以及损失函数层。其中的，编码层和动量编码层将通过动量的方式保持同步；其中的队列层可为大小是65536的向量队列；其中的损失函数层则可采用InfoNCE实现。

具体的，在步骤1021中，识别装置首先会对第一行人样本图像进行随机数据增强处理，获得第一增强样本图像x_query和第二增强样本图像x_key。

其中，对于随机数据增强处理来说，其包括多种处理方式，如随机裁切处理、随机颜色变换处理以及随机高斯模糊处理等。在本实施例中，为了保证无监督特征学习模型具有较好的训练效果，需要对于第一行人样本图像分别进行两次随机数据增强处理，获得第一增强样本图像和第二增强样本图像，其中的每一次随机数据增强处理均应包括前述的多种处理方式。

在步骤1021中，识别装置将利用所述第一增强样本图像x_query和第二增强样本图像x_key采用基于对比损失的无监督算法，对所述无监督特征学习模型进行训练，获得训练完毕的无监督特征学习模型。

其中的基于对比损失的无监督算法一般包括正向推理过程、反向传播的权重更新过程。

具体来说，如图3所示的，正向推理过程中：

识别装置首先会对第一行人图像进行两次相对独立的随机数据增强处理，以得到第一增强样本图像x_query和第二增强样本图像x_key，需要说明的是，该第一增强样本图像x_query和第二增强样本图像x_key为不同的增强样本图像。

然后，识别装置会将所述第一增强样本图像第一增强样本图像x_query输入至编码层，输出第一增强样本向量q；以及，识别装置还会同步或异步的将第二增强样本图像x_key输入至动量编码层Momentum Encoder，输出第二增强样本向量k。

其中的q和k的编码大小均可为2048。

然后，识别装置将由第一增强样本向量q和第二增强样本向量k构成的正样本对、以及由第一增强样本向量q和队列层Key Queue中各历史增强样本向量构成的负样本对，输入至所述损失函数层的InfoNCE损失函数。而损失函数层的InfoNCE损失函数将基于输入的正样本对和负样本对进行损失计算，并根据损失计算的结果确定该损失函数层是否收敛。

需要说明的是，一般来说，当损失函数层达到收敛时，模型训练完毕；反之，当损失函数层未收敛，模型还需进一步训练。

也就是说，当所述损失函数层未收敛时，将进行反向传播的权重更新过程。此时，识别装置将利用反向传播的方式对所述无监督特征学习模型中的编码层Encoder的梯度和/或权重等参数进行更新，并采用动量更新的方式对所述动量编码层Momentum Encoder的梯度和/或权重等参进行相应更新。

如上所述的，由于损失函数层未收敛，模型还需继续训练，此时，识别模型将选取下一第一行人样本图像，以按照前述的方式进行处理，激活的下一第一增强样本图像和相应的第二增强样本图像，以对于更新后的无监督特征学习模型在此进行训练，直至所述无监督特征学习模型的损失函数层收敛，得到训练完毕的无监督特征学习模型。

在可选实施方式中，为了保证训练的有效性，还可将所述第二增强样本向量k存入队列层Key Queue，以作为队列层Key Queue中的历史增强样本向量。

通过上述实施例，识别装置将获得训练完毕的无监督特征学习模型，由于其采用了无监督算法的训练方式，其对于无标注的图像中的特征具有较好的特征提取效果。

在上述实施例的基础上，为了进一步说明本申请对于人体属性识别模型的训练过程，上述实施例中的步骤103中的根据所述训练完毕的无监督特征学习模型构建人体属性识别模型中的特征提取层，具体理解为：

识别装置会将训练完毕的无监督特征学习模型中的编码层Encoder的结构以及相关参数进行保留，并在该结构和参数的基础上，搭建人体属性识别模型中的其他层，如全连接层以及分类层，以得到图4所示的人体属性识别模型的模型架构示意图。其中，全连接层和分类层的数量应与人体属性识别的目标类型数量相同。

具体来说，如图4所示的，在对于人体属性识别模型进行训练的处理过程中，可包括：

识别装置首先会利用特征提取层提对第二行人样本图像中的样本图像进行特征提取，获得第二行人样本图像的人体属性特征。然后，将由利用各全连接层和各分类层分别对人体属性特征依次进行处理，生成人体属性识别结果。其中该人体属性识别结果应包括有识别得到的人体属性以及其概率。再后，识别装置会确定输入的第二行人样本图像的人体属性标签和人体属性识别结果之间的交叉熵。其中，人体属性标签是通过标注获得的。

识别装置会对交叉熵是否收敛进行判定，其中，其收敛与否将决定该人体属性识别模型是否完成训练。具体的，当所述交叉熵未收敛时，识别装置会利用反向传播的方式对人体属性识别模型中的分类层、全连接层以及特征提取层依次进行更新。其中的更新包括但不限于权重更新、梯度更新等。

最后，完成本次更新后，识别装置还将选取下一第二行人样本图像，以采用上述类似的方式对更新后的人体属性识别模型进行再次训练，直至人体属性识别模型的交叉熵收敛，得到训练完毕的人体属性识别模型。

其中，由于特征提取层是基于无监督特征学习模型中的编码层构建的，其在对人体属性模型进行训练之前，已具备一定的特征提取功能。因此，在识别装置对人体属性模型进行反向传播的更新时，特征提取层的学习率小于所述全连接层的学习率。

通过上述实施例，识别装置将获得完成训练的人体属性识别模型。

图5为本申请实施例提供的一种人体属性识别的界面示意图，如图5所示的，通过利用服务器中识别装置所承载的人体属性识别模型，被输入的待识别图像将会输出相应的人体属性识别结果，在人体属性识别结果中包括有人体属性标签和相应的概率值。

本申请提供的人体属性的识别方法，通过采用利用无标注的第一行人样本图像对所述无监督特征学习模型进行训练，并根据训练完毕的无监督特征学习模型构建人体属性识别模型，利用有标注的第二行人样本图像人体属性识别模型进行训练，将待识别图像输入训练完毕的人体属性识别模型以获得人体属性识别结果的技术方案，与现有技术相比，由于在构建人体属性识别模型的过程中利用了无监督特征学习模型以及无标注的样本图像，其使得人体属性识别模型的训练样本图像得到扩充，从而使得人体属性模型可对于多样化和高复杂程度的人体属性进行准确识别。

实施例二

图6为本申请提供的一种人体属性的识别装置的结构示意图。如图6所示的，该人体属性的识别装置包括：图像获取模块10、第一处理模块20以及第二处理模块30；

图像获取模块10，用于获得第一行人样本图像和第二行人样本图像；其中，所述第一行人样本图像为无标注的样本图像，所述第二行人样本图像为标注的样本图像；

第一处理模块20，用于将第一行人样本图像输入无监督特征学习模型，以对所述无监督特征学习模型进行训练，获得训练完毕的无监督特征学习模型；

第二处理模块30，用于根据所述训练完毕的无监督特征学习模型构建人体属性识别模型中的特征提取层，并利用第二行人样本图像对于所述人体属性识别模型进行训练，获得训练完毕的人体属性识别模型；还用于将待识别图像输入至所述训练完毕的人体属性识别模型，获得待识别图像的人体属性识别结果。

在可选的实施例中，所述第一处理模块20具体用于：

对所述第一行人样本图像进行随机数据增强处理，获得第一增强样本图像和第二增强样本图像；利用所述第一增强样本图像和第二增强样本图像采用基于对比损失的无监督算法，对所述无监督特征学习模型进行训练，获得训练完毕的无监督特征学习模型。

在可选的实施例中，所述无监督特征学习模型包括编码层、动量编码层、队列层以及损失函数层；

其中，所述第一处理模块20具体用于：

将所述第一增强样本图像输入至所述编码层，输出第一增强样本向量；将所述第二增强样本图像输入至所述动量编码层，输出第二增强样本向量；将由所述第一增强样本向量和所述第二增强样本向量构成的正样本对、以及由第一增强样本向量和所述队列层中各历史增强样本向量构成的负样本对，输入至所述损失函数层；当所述损失函数层未收敛时，利用反向传播的方式对所述无监督特征学习模型中的编码层进行更新，并采用动量更新的方式对所述动量编码层进行更新；选取下一第一增强样本图像和相应的第二增强样本图像，以对于更新后的无监督特征学习模型进行训练，直至所述无监督特征学习模型的损失函数层收敛，得到训练完毕的无监督特征学习模型。

在可选的实施例中，所述第二处理模块30在将由所述第一增强样本向量和所述第二增强样本向量构成的正样本对、以及由第一增强样本向量和所述队列层中各历史增强样本向量构成的负样本对，输入至所述损失函数层之后，还用于：

将所述第二增强样本向量存入所述队列层，以作为所述队列层中的历史增强样本向量。

在可选的实施例中，所述图像获取模块10具体用于对所述第一行人样本图像分别进行两次随机数据增强处理，获得第一增强样本图像和第二增强样本图像；其中，每一次随机数据增强处理包括随机裁切处理、随机颜色变换处理以及随机高斯模糊处理。

在可选的实施例中，第二处理模块30具体用于利用所述训练完毕的无监督特征学习模型中的编码层构成所述人体属性识别模型的特征提取层。

在可选的实施例中，所述人体属性识别模型包括特征提取层、全连接层以及分类层；所属第二行人样本图像包括样本图像和对应的人体属性标签；

其中，第二处理模块30具体用于：

利用特征提取层提对所述第二行人样本图像中的样本图像进行特征提取，获得第二行人样本图像的人体属性特征；利用全连接层和分类层对人体属性特征依次进行处理，生成人体属性识别结果；确定第二行人样本图像的人体属性标签和人体属性识别结果之间的交叉熵；当所述交叉熵未收敛，利用反向传播的方式对所述人体属性识别模型中的分类层、全连接层以及特征提取层依次进行更新；选取下一第二行人样本图像，对更新后的人体属性识别模型进行训练，直至所述人体属性识别模型的交叉熵收敛，得到训练完毕的人体属性识别模型。

在可选的实施例中，在对人体属性模型进行反向传播的更新时，所述特征提取层的学习率小于所述全连接层的。

本申请提供的识别装置可以执前述所示方法实施例的技术方案，其实现原理和技术效果前述方法实施例类似，在此不再一一赘述。

本申请提供的人体属性的识别装置，通过采用利用无标注的第一行人样本图像对所述无监督特征学习模型进行训练，并根据训练完毕的无监督特征学习模型构建人体属性识别模型，利用有标注的第二行人样本图像人体属性识别模型进行训练，将待识别图像输入训练完毕的人体属性识别模型以获得人体属性识别结果的技术方案，与现有技术相比，由于在构建人体属性识别模型的过程中利用了无监督特征学习模型以及无标注的样本图像，其使得人体属性识别模型的训练样本图像得到扩充，从而使得人体属性模型可对于多样化和高复杂程度的人体属性进行准确识别。

实施例三

根据本申请的实施例，本申请还提供了一种电子设备以及一种可读存储介质。

如图7所示，是根据本申请实施例的人体属性的识别方法的电子设备的框图。电子设备旨在各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图7所示，该电子设备包括：一个或多个处理器1001、存储器1002，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器1001为例。

存储器1002即为本申请所提供的非瞬时计算机可读存储介质。其中，存储器存储有可由至少一个处理器执行的指令，以使至少一个处理器执行本申请所提供的人体属性的识别方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的人体属性的识别方法。

存储器1002作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的人体属性的识别方法对应的程序指令/模块(例如，附图7所示的环境数据获取模块801，特征数据提取模块802，初始危险值预测模块803，最终危险值计算模块804及区域计算模块805)。处理器1001通过运行存储在存储器1002中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的人体属性的识别方法。

存储器1002可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据图7的电子设备的使用所创建的数据等。此外，存储器1002可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器1002可选包括相对于处理器1001远程设置的存储器，这些远程存储器可以通过网络连接至图7的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

图7的电子设备还可以包括：输入装置1003和输出装置1004。处理器1001、存储器1002、输入装置1003和输出装置1004可以通过总线或者其他方式连接，图7中以通过总线连接为例。

输入装置1003可接收输入的语音、数字或字符信息，以及产生与图7的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1004可以包括语音播放设备、显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种人体属性的识别方法，包括：

对所述第一行人样本图像进行随机数据增强处理，获得第一增强样本图像和第二增强样本图像；

将所述第一增强样本图像输入至编码层，输出第一增强样本向量；

将所述第二增强样本图像输入至动量编码层，输出第二增强样本向量；

将由所述第一增强样本向量和所述第二增强样本向量构成的正样本对、以及由第一增强样本向量和队列层中各历史增强样本向量构成的负样本对，输入至损失函数层；

当所述损失函数层未收敛时，利用反向传播的方式对无监督特征学习模型中的编码层进行更新，并采用动量更新的方式对所述动量编码层进行更新；

选取下一第一增强样本图像和相应的第二增强样本图像，以对于更新后的无监督特征学习模型进行训练，直至所述无监督特征学习模型的损失函数层收敛，得到训练完毕的无监督特征学习模型，所述无监督特征学习模型包括所述编码层、所述动量编码层、所述队列层以及所述损失函数层；

2.根据权利要求1所述的人体属性的识别方法，其中，将由所述第一增强样本向量和所述第二增强样本向量构成的正样本对、以及由第一增强样本向量和所述队列层中各历史增强样本向量构成的负样本对，输入至所述损失函数层之后，还包括：

3.根据权利要求1所述的人体属性的识别方法，其中，所述对所述第一行人样本图像进行随机数据增强处理，获得第一增强样本图像和第二增强样本图像，包括：

对所述第一行人样本图像分别进行两次随机数据增强处理，获得第一增强样本图像和第二增强样本图像；

其中，每一次随机数据增强处理包括随机裁切处理、随机颜色变换处理以及随机高斯模糊处理。

4.根据权利要求1-3任一项所述的人体属性的识别方法，其中，所述根据所述训练完毕的无监督特征学习模型构建人体属性识别模型中的特征提取层，包括：

利用所述训练完毕的无监督特征学习模型中的编码层构成所述人体属性识别模型的特征提取层。

5.根据权利要求1所述的人体属性的识别方法，所述人体属性识别模型包括特征提取层、全连接层以及分类层；所述第二行人样本图像包括样本图像和对应的人体属性标签；

其中，所述利用第二行人样本图像对于所述人体属性识别模型进行训练，获得训练完毕的人体属性识别模型，包括：

利用特征提取层提对所述第二行人样本图像中的样本图像进行特征提取，获得第二行人样本图像的人体属性特征；

利用全连接层和分类层对人体属性特征依次进行处理，生成人体属性识别结果；

确定第二行人样本图像的人体属性标签和人体属性识别结果之间的交叉熵；

当所述交叉熵未收敛，利用反向传播的方式对所述人体属性识别模型中的分类层、全连接层以及特征提取层依次进行更新；

选取下一第二行人样本图像，对更新后的人体属性识别模型进行训练，直至所述人体属性识别模型的交叉熵收敛，得到训练完毕的人体属性识别模型。

6.根据权利要求5所述的人体属性的识别方法，在对人体属性模型进行反向传播的更新时，所述特征提取层的学习率小于所述全连接层的学习率。

7.根据权利要求1所述的人体属性的识别方法，还包括：

对于第一行人样本图像进行预处理，以利用预处理后的第一行人样本图像对所述无监督特征学习模型进行训练；

和/或，对于第二行人样本图像进行预处理，以利用预处理后的第二行人样本图像对所述人体属性识别模型进行训练；

其中，对所述第一行人样本图像，和/或，第二行人样本图像的预处理包括尺度缩放处理、像素值归一化处理、均值处理以及方差处理。

8.一种人体属性的识别装置，包括：

第二处理模块，用于根据所述训练完毕的无监督特征学习模型构建人体属性识别模型中的特征提取层，并利用第二行人样本图像对于所述人体属性识别模型进行训练，获得训练完毕的人体属性识别模型；还用于将待识别图像输入至所述训练完毕的人体属性识别模型，获得待识别图像的人体属性识别结果；

其中，所述第一处理模块具体用于：

对所述第一行人样本图像进行随机数据增强处理，获得第一增强样本图像和第二增强样本图像；利用所述第一增强样本图像和第二增强样本图像采用基于对比损失的无监督算法，对所述无监督特征学习模型进行训练，获得训练完毕的无监督特征学习模型；

所述无监督特征学习模型包括编码层、动量编码层、队列层以及损失函数层；

其中，所述第一处理模块具体用于：

9.根据权利要求8所述的人体属性的识别装置，其中，所述第二处理模块在将由所述第一增强样本向量和所述第二增强样本向量构成的正样本对、以及由第一增强样本向量和所述队列层中各历史增强样本向量构成的负样本对，输入至所述损失函数层之后，还用于：

10.根据权利要求8所述的人体属性的识别装置，其中，所述图像获取模块具体用于对所述第一行人样本图像分别进行两次随机数据增强处理，获得第一增强样本图像和第二增强样本图像；其中，每一次随机数据增强处理包括随机裁切处理、随机颜色变换处理以及随机高斯模糊处理。

11.根据权利要求8-10任一项所述的人体属性的识别装置，其中，第二处理模块具体用于利用所述训练完毕的无监督特征学习模型中的编码层构成所述人体属性识别模型的特征提取层。

12.根据权利要求8所述的人体属性的识别装置，所述人体属性识别模型包括特征提取层、全连接层以及分类层；所属第二行人样本图像包括样本图像和对应的人体属性标签；

其中，第二处理模块具体用于：

13.根据权利要求12所述的人体属性的识别装置，在对人体属性模型进行反向传播的更新时，所述特征提取层的学习率小于所述全连接层的学习率。

14.根据权利要求8所述的人体属性的识别装置，所述图像获取模块还用于：

对于第一行人样本图像进行预处理，和/或，对于第二行人样本图像进行预处理；

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。