CN108446625A

CN108446625A - 基于图模型的图片重要行人检测方法

Info

Publication number: CN108446625A
Application number: CN201810216972.2A
Authority: CN
Inventors: 郑伟诗; 唐永毅; 李伟宏
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2018-03-16
Filing date: 2018-03-16
Publication date: 2018-08-24

Abstract

本发明公开了一种基于图模型的图片重要行人检测方法，包括下述步骤：S1、给定一张包含多行人的图片，对图片中行人进行检测与行人重要特征提取；S2、对于图片检测到行人，通过关系函数基于不同的特征构建混合关系图；S3、提出基于图模型的重要行人检测算法PersonRank，通过提出的PersonRank算法对混合关系图中的行人的重要程度进行排序；S4、对重要行人特征进行分析，并使用空间特征、动作特征、外观特征以及注意力特征来对行人进行表征。本发明利用不同的特征，对图片中检测出来的行人构建混合关系图来模型图片中行人之间的关系。通过改进著名排序算法PageRank使之能够用于对多层混合关系图中的行人的重要程度进行排序，最终检测到图片中最重要的行人。

Description

基于图模型的图片重要行人检测方法

技术领域

本发明涉及行人检测的技术领域，尤其是涉及一种基于图模型的图片重要行人检测方法。

背景技术

图片重要行人检测，即从群体合照图片中，检测最重要的人。这项技术有望用于图像理解等众多计算机视觉领域，包括在给图片生成描述文字问题上可以更加突出图片中心人物、在行人检索搜索领域中提升搜索质量、在图片或视频中事件的识别与领域中更加突出重要人物对事件识别与检测的相关性从而提升识别与检测的效果等。

现有的图片重要人脸检测主要有以下两类：

1)基于行人对排序：为了自动检测图片中重要的行人，最直接的方式就是对图片中的行人两两形成行人对，在对行人对的重要程度关系进行预测。因此，Vip:Findingimportant people in images中提出了使用回归模型来推断图片两个不同人之间的重要程度关系，通过这样的行人对的重要程度关系，推断出图片中最重要的人脸。

2)基于感知器排序：图片或者视频中最重要的人对于视频中的事件的识别与检测有非常大的作用。Detecting events and key actors in multi-person videos提出，对篮球赛中不同的球员进行动作特征以及外观特征提取，通过感知器对不同球员的重要程度进行计算，从而提升对篮球比赛中事件的识别与检测的准确率。

已有的重要人脸检测算法尚存在很多不足。Vip:Finding important people inimages中提出通过提取行人人脸的空间特征以及显著特征，并通过对行人对进行排序进而对行人重要程度进行排序。该方法在对行人重要程度排序时，忽略了其他人的重要程度以及行人间关系对重要程度的影响。与此同时，该方法也忽略了上下文信息、动作信息、外观信息以及注意力信息对于重要行人检测的作用。Detecting events and key actors inmulti-person videos中则基于每个行人的特征，提出使用感知器直接对行人重要程度进行计算。这忽略了行人之间关系对重要程度分析的作用。此外，该方法也忽略了空间信息以及关注力信息的作用。

发明内容

本发明的主要目的在于克服现有技术的缺点与不足，提供一种基于图模型的图片重要行人检测方法，本发明利用不同的特征，对图片中检测出来的行人构建混合关系图来模型图片中行人之间的关系，通过改进著名排序算法PageRank使之能够用于对多层混合关系图中的行人的重要程度进行排序，最终检测到图片中最重要的行人。

为了达到上述目的，本发明采用以下技术发明：

本发明基于图模型的图片重要行人检测方法，包括下述步骤：

S1、给定一张包含多行人的图片，对图片中行人进行检测与行人重要特征提取；

S2、对于图片检测到行人，通过关系函数基于不同的特征构建混合关系图，在混合关系图中，检测到的行人为图的结点，关系函数则用以构造图中结点间的相互联系的有向边；

S3、提出基于图模型的重要行人检测算法PersonRank，通过提出的PersonRank算法对混合关系图中的行人的重要程度进行排序；

S4、对重要行人特征进行分析，并使用空间特征、动作特征、外观特征以及注意力特征来对行人进行表征。

作为优选的技术方案，步骤S1包括下述步骤：

将图像输入人脸检测器或者行人检测器中提取图片中人脸或行人的检测框其中为p_i检测框,其中为是行人p_i在图片中的位置，是p_i在图片中被检测到的框的宽度跟高度，基于行人检测框提取四种行人重要特征：(a)空间特征(b)动作特征(c)外观特征(d)注意力特征

作为优选的技术方案，所述空间特征：使用行人的显著特征；使用行人在图片中位置信息；使用行人在图片中每个位置中的密度；

所述动作特征：使用在动作识别数据库UCF101上预训练的ResNet提取2048维度特征；

所述外观特征：使用在图片分类数据库ImageNet上预训练的ResNet提取2048维度特征；

所述注意力特征则是用来估计p_i在3D空间中人脸看的方向。

作为优选的技术方案，在3D空间中，p_i的人脸的角度总共有3个成分：[roll，pitch，yaw]，使用水平方向来估计p_i在3D空间中人脸看的方向，则因此，中，为yaw角的水平分量，为yaw角的深度分量。

作为优选的技术方案，在步骤S2中，设计关系函数以构造不同的混合关系图：

(a)空间以及动作关系函数：

(b)外观函数：

(c)注意力函数：

作为优选的技术方案，在步骤S3具体为：

基于以及不同的特征以及关系函数，构造混合关系图其中ε＝ε^p∪εr,

其中为行人结点，包括了行人以及区域，ε为行人间的有向边，ε^p为双向变，ε^r为单向超边，G为边的权重；

然后定义图中每一位行人的重要程度为：

其中N为图片中行人总数，α为0.85，为结点p_j的出度总和。

作为优选的技术方案，步骤S4具体为：

对于4种不同的特征以及4种不同的关系函数，有4层混合关系图，并分别得到为p_i在四种图中的重要程度，则定义最终的重要程度为：

并定义融合关系函数

通过融合关系函数，构建融合混合关系图，并通过与在单一混合关系图对行人重要程度排序的PersonRank一样，分析融合混合关系图。

作为优选的技术方案，所有的参数均采用SVM优化。

本发明与现有技术相比，具有如下优点和有益效果：

1.本发明通过关系函数构建混合关系图，能够很好的模拟图片中行人间的相互关系，这种结构能够更加有效的表征行人在图片中的重要程度。

2.本发明提出的PersonRank能够从混合关系图中对行人的重要程度进行分析，PersonRank算法在分析图片中行人的重要程度的时候，能够考虑当前行人的重要程度，同时也考虑到其他人的重要程度以及他们跟当前行人的关系。

3.本发明能够基于多层混合关系图进行行人重要程度分析。

附图说明

图1是本发明重要行人检测方法总体框架图；

图2(a)在Multi-scene Important People Image Dataset上的结果；

图2(b)为在NCAA Basketball Image Dataset上的结果。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例

本发明基于图模型的图片重要行人检测方法，目的是输入一张群体合照的图片，通过检测行人并通过提出的重要行人检测算法对每个检测到的行人进行排序，找到最重要的行人。

如图1所示，本发明通过人脸检测器检测图片中所有的行人，通过构建不同的行人关系图(行人与行人之间)以及行人关系超图(区域与行人之间)，最终组成混合关系图(Hybrid-Interaction Graph)。最终通过PersonRank模型基于最终组成混合关系图(Hybrid-Interaction Graph)分析行人的重要程度，并最终检测到图片中的重要行人。本发明的重要行人检测方法具体包括下述内容：

1)图片中行人检测与行人重要特征提取

给定一张包含多行人的图片，本发明首先将图像输入人脸检测器或者行人检测器中提取图片中人脸或行人的检测框其中为p_i检测框,其中为是行人p_i在图片中的位置，是p_i在图片中被检测到的框的宽度跟高度。基于行人检测框本发明提取四种行人重要特征：(a)空间特征(b)动作特征(c)外观特征(d)注意力特征

其中空间特征：使用行人的显著特征(使用检测框大小、Sobel滤波器提取锐利度等信息)；使用行人在图片中位置信息；使用行人在图片中每个位置中的密度。

动作特征：使用在知名动作识别数据库UCF101上预训练的ResNet提取2048维度特征。

外观特征：使用在知名图片分类数据库ImageNet上预训练的ResNet提取2048维度特征。

注意力特征则是用来估计p_i在3D空间中人脸看的方向，其中在3D空间中，p_i的人脸的角度总共有3个成分：[roll，pitch，yaw]，本发明中只需要用到水平方向来估计p_i在3D空间中人脸看的方向，则因此，中，为yaw角的水平分量，为yaw角的深度分量。

2)构建混合关系图：对于图片检测到行人，本发明通过关系函数基于不同的特征构建混合关系图。建混合关系图中，检测到的行人为图的结点，关系函数则用以构造图中结点间的相互联系的有向边。本发明对图片构造混合关系图有利于模拟行人在事件中人与人之间的关系，从而使提出的模型能够更加准确有效的利用已有信息对行人在图片中的重要程度进行分析。

构建混合关系图具体如下：

基于检测的行人以及行人重要特征，我们设计四种关系函数以构造不同的混合关系图：

(a)空间以及动作关系函数：

(b)外观函数：

(c)注意力函数：

3)提出基于图模型的重要行人检测算法PersonRank。本发明提出对于图片中检测到的行人构建混合关系图(Hybrid-Interaction Graph)，进而通过提出的PersonRank算法对混合关系图中的行人的重要程度进行排序。本发明在分析图片中行人的重要程度的时候，能够考虑当前行人的重要程度，同时也考虑到其他人的重要程度以及他们跟当前行人的关系。

基于以及不同的特征以及关系函数，构造混合关系图其中ε＝ε^p∪ε^r,

然后定义图中每一位行人的重要程度为：

其中N为图片中行人总数，α为0.85，为结点p_i的出度总和。

4)重要行人特征：图片中重要行人检测是一个复杂的问题，对图片中行人的重要程度的分析与行人在文章中的上下文信息、动作信息、外观信息与注意力信息相关。因此，本文提出使用空间特征、动作特征、外观特征以及注意力特征来对行人进行表征。

并定义融合关系函数

进一步的，本发明的所有参数都是用SVM优化求得。

本发明在Multi-Scene Important People Image Dataset以及NCAA ImportantPeople Image Dataset重要行人检测库上进行了重要人脸检测实验，实验结果表明，本发明的重要行人检测结果明显超过现有最好算法，模拟结果如图2(a)、图2(b)所示,图2(a)在Multi-scene Important People Image Dataset上的结果，图2(b)为在NCAA BasketballImage Dataset上的结果。以上本发明的检测结果皆比现今最好算法(VIP)高超过15％的准确率。

本发明的基础在于对图片中人物关系进行建模，基于提出的行人重要特征，通过关系函数构建混合关系图，通过提出的PersonRank算法基于多层混合关系图对行人的重要程度进行分析。因此任何基于本发明提出的图片重要行人检测模型进行图片关键行人检测的应用技术都包含在本发明之内，如图像关键行人检测、重要目标检测等。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，除了上述说明的全局-局部多模态手势方式，其他的利用本文提出的基于骨骼点对RGB图、深度图和光流图的局部数据表达的构造也在本专利保护范围之内；同时，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.基于图模型的图片重要行人检测方法，其特征在于，包括下述步骤：

2.根据权利要求1所述基于图模型的图片重要行人检测方法，其特征在于，步骤S1包括下述步骤：

3.根据权利要求2所述基于图模型的图片重要行人检测方法，其特征在于，

所述空间特征：使用行人的显著特征；使用行人在图片中位置信息；使用行人在图片中每个位置中的密度；

所述注意力特征则是用来估计p_i在3D空间中人脸看的方向。

4.根据权利要求3所述基于图模型的图片重要行人检测方法，其特征在于，在3D空间中，p_i的人脸的角度总共有3个成分：[roll，pitch，yaw]，使用水平方向来估计p_i在3D空间中人脸看的方向，则因此，中，为yaw角的水平分量，为yaw角的深度分量。

5.根据权利要求1所述基于图模型的图片重要行人检测方法，其特征在于，在步骤S2中，设计关系函数以构造不同的混合关系图：

(a)空间以及动作关系函数：

(b)外观函数：

(c)注意力函数：

6.根据权利要求1所述基于图模型的图片重要行人检测方法，其特征在于，在步骤S3具体为：

然后定义图中每一位行人的重要程度为：

其中N为图片中行人总数，α为0.85，为结点p_j的出度总和。

7.根据权利要求1所述基于图模型的图片重要行人检测方法，其特征在于，步骤S4具体为：

并定义融合关系函数

8.根据权利要求1-7中任一项所述基于图模型的图片重要行人检测方法，其特征在于，所有的参数均采用SVM优化。