CN111783754B

CN111783754B - 基于部位上下文的人体属性图像分类方法、系统和装置

Info

Publication number: CN111783754B
Application number: CN202010918876.XA
Authority: CN
Inventors: 陈盈盈; 张小梅; 王金桥; 唐明
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2020-09-04
Filing date: 2020-09-04
Publication date: 2020-12-08
Anticipated expiration: 2040-09-04
Also published as: CN111783754A

Abstract

本发明属于计算机视觉领域，具体涉及了一种基于部位上下文的人体属性图像分类方法、系统和装置，旨在解决现有的人体分类方法忽略了人体属性之间的关系而未考虑人体内在层次结构信息导致分类精确度不足的问题。本发明包括：通过人体属性图像分类模型获取人体属性分类预测图；人体属性图像分类模型先通过特征提取网络提取待测试图像的原始特征图，再基于原始特征图通过属性分类解析网络获取高阶特征图，通过关系聚合网络和关系离散网络分别提取合适的上下文信息，将原始特征图和合适的上下文信息融合后生成人体属性分类预测图。本发明解决了如何从复杂北京中，对不同的属性产生合适的上下文特征的问题，提高了人体图像识别的精确度。

Description

基于部位上下文的人体属性图像分类方法、系统和装置

技术领域

本发明属于计算机视觉领域，具体涉及了一种基于部位上下文的人体属性图像分类方法、系统和装置。

背景技术

人体属性分类是计算机视觉中的热门研究课题之一，也是基于视觉的模式识别应用的一个重要研究方向。它需要将图像中人的各个属性（性别、年龄、衣服类型等）分类出来，从而为针对人的应用提供更加详细的先验信息，比如：行人重识别，行人检索以及视频监控等。由于自然场景中人体不同部位大小和形状的多样化，图片模糊以及光照差异大等问题，人体属性分类方法需要具有良好的区分人体前景和场景中的背景以及准确分类各个属性的能力。而传统的手工设计，基于全局或者局部的特征在人体属性分类这个问题上很难做到较好的效果。而当前基于深度学习的人体属性分类方法大多采用多尺度特征融合或者使用注意力机制来解决自然场景中人体部位大小和形状多样化问题。这些方法忽略了人体属性之间的关系进而失去获得人体内在层次结构信息，影响方法的识别性能。

发明内容

为了解决现有技术中的上述问题，即现有的人体分类方法忽略了人体属性之间的关系而未考虑人体内在层次结构信息导致分类精确度不足的问题，本发明提供了一种基于部位上下文的人体属性图像分类方法，所述方法包括：

步骤S10，获取待测试图像作为当前帧；

步骤S20，基于所述当前帧，通过训练好的人体属性图像分类模型获取人体属性分类预测图；

其中，所述人体属性图像分类模型，包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络，并基于训练图像以及端到端的有监督训练，通过随机梯度下降算法更新网络参数，反复迭代至损失函数收敛，获得训练好的人体属性图像分类模型；

所述属性分类解析网络，为串联的卷积层，包括设定数量的降维卷积层和设定数量的用于降低特征大小的卷积层；

所述关系聚合网络，基于图卷积网络和聚合动态卷积神经网络构建，所述图卷积网络以人体属性作为图卷积的节点，属性之间的连接关系作为图卷积的边，图卷积之间的连接矩阵根据部位之间语义关系进行更新；所述聚合动态卷积神经网络以将图卷积网络的输出重排成一组卷积核大小的第一卷积核作为卷积核；

所述关系离散网络，基于属性相似离散网络和离散动态卷积神经网络，所述离散动态卷积网络以将所述相似离散网络的输出重排成一组卷积核大小的第二卷积核作为卷积核。

进一步地，所述人体属性图像分类网络，其训练方法包括：

步骤A100，从带有分类标签的人体属性图像数据集中提取第s帧作为训练帧；

步骤A200，基于所述训练帧，通过所述特征提取网络获取原始特征图；

步骤A300，基于所述原始特征图，通过所述属性分类解析网络获取每个部位的高阶特征图

；其中，R 表示人体的一个部位，N是人体属性的类别，D是人体属性的维度；

步骤A400，通过所述关系聚合网络获取自适应全局上下文信息；基于所述原始特征图和高阶特征图，通过所述关系离散网络获取显著局部上下文信息；

步骤A500，融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息生成人体属性训练分类预测图；

步骤A600，基于所述人体属性训练分类预测图与对应的分类标签计算所述人体属性图像分类网络的全局损失函数，若所述全局损失函数值不低于预设的阈值，则通过随机梯度下降法调节更新所述人体属性图像分类网络的参数，令

并跳转至步骤 A100，直至全局损失函数小于预设的阈值，获得训练好的人体属性图像分类模型。

进一步地，所述图卷积之间的连接矩阵为：

其中，

为图卷积之间的连接矩阵，

为两个人体部位的语义关系；

其中，

是人体的一个部位，

是与部位

直接相连的部位，

,m是与部位

直接相连部位的个数，D是人体属性的维度，R表示人体的一个部位，i、j表示部位的标号。

进一步地，“基于所述原始特征图和高阶特征图，通过所述关系聚合网络获取自适应全局上下文信息”，其方法为：

步骤A411，基于所述高阶特征图更新所述图卷积之间的连接矩阵

获得更新后的连接矩阵：

其中，

为设定的单位矩阵；它的作用是为了在每次更新的时候，加上本身的特征。

步骤A412，将所述高阶特征图输入具有所述更新后的连接矩阵

的图卷积网络，获得图卷积网络的输出参数H：

其中，

为激活函数，P为高阶特征图，W为可学习的权重参数，

；

步骤A413，将所述图卷积网络的输出参数H进行特征变换，重排成一组卷积核的大小，生成第一卷积核；

步骤A414，所述聚合动态卷积结构以第一卷积核作为卷积核，生成第一卷积核参数

；

步骤A415，基于所述原始特征图和第一卷积核参数

，生成自适应全局上下文信息。

“基于所述原始特征图和高阶特征图，通过所述关系离散网络获取显著局部上下文信息”，其方法为：

步骤A421，计算人体属性的一个类别和其他所有类别的相似度

：

其中，

，

，

，

越小表示两个类别越相似；

步骤A422，将所述高阶特征图P的每个特征

与相似度

作乘法运算得到特征相似度

，再将对应的特征

加入到特征相似度

中生成相似度离散

：

基于所述相似度离散

生成相似离散网络的输出参数B：

其中，N是人体属性的类别；

步骤A423，将所述相似离散结构的输出参数B进行特征变换，重排成一组卷积核的大小，生成第二卷积核；

步骤A424，所述离散动态卷积结构以第二卷积核作为卷积核，生成第二卷积核参数

；

步骤425，基于所述原始特征图和第二卷积核参数

，生成显著局部上下文信息。

进一步地，“融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息”，其方法包括合并、累加、取均值、卷积网络和多层感知机。

本发明的另一方面，提出了一种基于部位上下文的人体属性图像分类系统，所述系统包括：图像获取模块、分类预测模块和存储模块；

所述图像获取模块，用于获取待测试图像作为当前帧；

所述分类预测模块，用于基于所述当前帧，通过训练好的人体属性图像分类模型获取人体属性分类预测图；

所述存储模块，用于存储人体属性分类数据集；

所述关系聚合网络，基于图卷积网络和聚合动态卷积神经网络构建，所述图卷积网络以人体属性作为图卷积的节点，属性之间的连接关系作为图卷积的边，图卷积之间的连接矩阵根据部位之间语义关系进行更新；所述聚合动态卷积神经网络以图卷积网络的输出作为卷积核；

所述关系离散网络，基于属性相似离散网络和离散动态卷积神经网络，所述离散动态卷积网络以所述相似离散网络的输出作为卷积核。

本发明的第三方面，提出了一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于部位上下文的人体属性图像分类方法。

本发明的第四方面，提出了一种处理装置，包括处理器、存储装置；所述处理器，适于执行各条程序；所述存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述的基于部位上下文的人体属性图像分类方法。

本发明的有益效果：

（1）本发明基于部位上下文的人体属性图像分类方法，针对不同大小的人体各个部位，可以产生合适的上下文信息，获取合适的特征，提高了人体属性分类对各个属性分类的精确度，并且扩大了人体属性图像分类方法的适用范围。解决了如何从复杂背景中，对不同的属性产生合适的上下文特征。

（2）本发明基于部位上下文的人体属性图像分类方法，通过从原始特征图中获取高阶特征图，可以获得部位更好的语义表达，用来提取全局上下文和局部上下文可以提高分类预测结果的精确度。

（3）本发明基于部位上下文的人体属性图像分类方法，通过关系聚合网络的图卷积网络对高阶特征图进行全局上下文信息的提取，可以探索到人体部位之间的语义关系，利用这种关系可以获得属性的全局上下文，图像分类的过程中考虑人体的全局上下文提高了分类预测结果的精确度。

（4）本发明基于部位上下文的人体属性图像分类方法，通过关系离散网络对高阶特征图进行局部显著上下文的提取，可以减少部位之间的相互干扰，能够获得有区分性和代表性的局部上下文，提高了分类预测结果的精确度。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本发明基于部位上下文的人体属性图像分类方法第一实施例的流程示意图；

图2是本发明基于部位上下文的人体属性图像分类方法第一实施例中基于部位上下文的人体图像分类模型总体结构示意图；

图3是本发明基于部位上下文的人体属性图像分类方法的关系聚合网络中图卷积网络的结构示意图；

图4是本发明基于部位上下文的人体属性图像分类方法的关系离散网络中的属性离散网络的原理示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本发明提供一种基于部位上下文的人体属性图像分类方法，本方法包括：

步骤S10，获取待测试图像作为当前帧；

为了更清晰地对本发明基于部位上下文的人体属性图像分类方法进行说明，下面结合图1对本发明方法实施例中各步骤展开详述。

本发明一种实施例的基于部位上下文的人体属性图像分类方法，包括步骤S10-步骤S20，各步骤详细描述如下：

步骤S10，获取待测试图像作为当前帧；

如图2所示，所述人体属性图像分类模型，包括特征提取网络、属性分类解析网络、关系聚合网络和关系离散网络，并基于训练图像以及端到端的有监督训练，通过随机梯度下降算法更新网络参数，反复迭代至损失函数收敛，获得训练好的人体属性图像分类模型；

优选的，所述降为卷积层通常可以采用卷积核为

的卷积层。

所述属性分类解析网络应用几个连续的卷积从原始特征图中提取高阶特征图。

首先通过降维卷积层来降低特征的通道数，使其降维到与要识别的属性类别数一致，使其可以通过训练过程学习到与属性类别对应的特征。然后通过用于降低特征大小的卷积层来降低特征的大小以降低计算量，通过这种方法得到属性的高阶语义特征。

如图3所示，属性分类解析网络的输出作为关系聚合网络的输入，根据人体特有的连接方式，我们建立图卷积来建模人体的空间关系和部位之间的语义关系。使用这种方法可以获得属性的全局信息。

在一些优选的实施方式中，所述图卷积之间的连接矩阵如公式（1）所示：

（1）

其中，

为图卷积之间的连接矩阵，

为两个人体部位的语义关系如公式（2）所示；

（2）

其中，

是人体的一个部位，

是与部位

直接相连的部位，

,m是与部位

所述关系离散网络，无特定的网络结构，凡是用本发明的提取显著局部上下文信息并与自适应全局上下文信息结合的方法均应视作本发明要求保护的范围。

在一些优选的实施方式中，所述人体属性图像分类网络，其训练方法包括：

；其中，R表示人体的一个部位，N是人体属性的类别，D是人体属性的维度；

在一些优选的实施方式中，“基于所述原始特征图和高阶特征图，通过所述关系聚合网络获取自适应全局上下文信息”，其方法为：

获得更新后的连接矩阵如公式（3）所示：

（3）

其中，

为人为调整的单位矩阵；它的作用是为了在每次更新的时候，加上本身的特征。

步骤A412，将所述高阶特征图输入具有所述更新后的连接矩阵

的图卷积网络，获得图卷积网络的输出参数H如公式（4）所示：

（4）

其中，

为激活函数，P为高阶特征图，W为可学习的权重参数，

；

步骤A415，基于所述原始特征图和第一卷积核参数

，生成自适应全局上下文信息。

作用方式可以选取但不局限于卷积操作，然后得到自适应全局上下文信息。

在本实施例中，全局上下文特征对于属性分类非常重要，但是它可以带来一些冗余信息或者干扰信息。因为使用全局特征来识别比较相似的属性是比较困难的。因此，我们采用了关系离散网络来获取具有代表性的局部上下文特征。

在一些优选的实施方式中，“基于所述原始特征图和高阶特征图，通过所述关系离散网络获取显著局部上下文信息”，其方法为：

如图4所示，将关系离散操作应用于高级特征图，即高级特征图中每个部位特征图和其余的全部部位特征图进行相减得到部位之间的语义相似度，关系离散网络的目标是使具有同种标签的特征尽可能的近，不同标签的特征尽可能的远。首先计算一个类别和其他所有类别的相似度离散，。然后这个类别特征乘上这个相似度，我们就可以把相似的特征拉大，同时，我们把这个特征也加入到这个里面，进而凸显这个类别的特征，得到相似度离散。然后我们把所有的部位的这个结合到一起，形成一组参数；将语义相似度作为动态卷积的卷积核，作用在原始特征图上，削弱部位特征图之间的相似程度，生成显著局部上下文信息。

具体步骤详述如下：

步骤A421，计算人体属性的一个类别和其他所有类别的相似度

如公式（5）所示：

（5）

其中，

，

，

，

越小表示两个类别越相似；

步骤A422，将所述高阶特征图P的每个特征

与相似度

作乘法运算得到特征相似度

，再将对应的特征

加入到特征相似度

中生成相似度离散

如公式（6）所示：

（6）

基于所述相似度离散

生成相似离散网络的输出参数B如公式（7）所示：

（7）

其中，N是人体属性的类别；

我们将关系离散网络得到的输出作为动态卷积的卷积核，可以使卷积更加专注具有局部特点表达的一些特征，因此可以生成具有代表性的局部特征。

；步骤A425，基于所述原始特征图和第二卷积核参数

，生成显著局部上下文信息。

在本实施例中，关系离散网络仅使用人体属性分类的标签作为监督，在训练的过程中不适用任何额外的监督信息；

同时，由于图卷积的各个节点对应于不同的属性，因此对于属性分类解析网络我们在训练阶段采用了标签进行监督，指导网络生成对应的高级属性图。

在一些优选的实施方式中，“融合所述原始特征图、自适应全局上下文信息和显著局部上下文信息”，其方法包括合并、累加、取均值、卷积网络和多层感知机。

融合方法包括但不限于上述方法，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

步骤A600，基于所述人体属性训练分类预测图与对应的分类标签计算所述人体属性图像分类网络的全局损失函数，若所述全局损失函数值不低于预设的阈值，则通过随机梯度下降法调节更新所述人体属性图像分类网络的参数，令s=s+1并跳转至步骤A100，直至全局损失函数小于预设的阈值，获得训练好的人体属性图像分类模型。

本发明第二实施例的基于部位上下文的人体属性图像分类系统，所述系统包括：图像获取模块、分类预测模块和存储模块；

所述图像获取模块，用于获取待测试图像作为当前帧；

所述存储模块，用于存储人体属性分类数据集；

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，上述实施例提供的基于部位上下文的人体属性图像分类系统，仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块来完成，即将本发明实施例中的模块或者步骤再分解或者组合，例如，上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称，仅仅是为了区分各个模块或者步骤，不视为对本发明的不当限定。

本发明第三实施例的一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于部位上下文的人体属性图像分类方法。

本发明第四实施例的一种处理装置，包括处理器、存储装置；处理器，适于执行各条程序；存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述的基于部位上下文的人体属性图像分类方法。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的存储装置、处理装置的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域技术人员应该能够意识到，结合本文中所公开的实施例描述的各示例的模块、方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，软件模块、方法步骤对应的程序可以置于随机存储器（RAM）、内存、只读存储器（ROM）、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

术语“第一”、 “第二”等是用于区别类似的对象，而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种基于部位上下文的人体属性图像分类方法，其特征在于，所述方法包括：

步骤S10，获取待测试图像作为当前帧；

所述人体属性图像分类模型，其训练方法包括：

步骤A600，基于所述人体属性训练分类预测图与对应的分类标签计算所述人体属性图像分类模型的全局损失函数，若所述全局损失函数值不低于预设的阈值，则通过随机梯度下降法调节更新所述人体属性图像分类模型的参数，令s=s+1并跳转至步骤A100，直至全局损失函数小于预设的阈值，获得训练好的人体属性图像分类模型；

所述关系离散网络，基于属性相似离散网络和离散动态卷积神经网络，所述离散动态卷积网络以将所述属性相似离散网络的输出重排成一组卷积核大小的第二卷积核作为卷积核。

2.根据权利要求1所述的基于部位上下文的人体属性图像分类方法，其特征在于，所述图卷积之间的连接矩阵为：