CN110852172B

CN110852172B - 一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法

Info

Publication number: CN110852172B
Application number: CN201910978164.4A
Authority: CN
Inventors: 杨静; 宁子鑫
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2019-10-15
Filing date: 2019-10-15
Publication date: 2020-09-22
Anticipated expiration: 2039-10-15
Also published as: CN110852172A

Abstract

本发明公开了一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法，包括如下步骤：收集包含人的单张图片集和包含场景的单张图片集；把人的图片采用PS技术或深度学习模型提出，并且拼贴到包含场景的单张图片之中；采用Cycle Gan利用真实场景图片作为对抗数据集把拼贴得到的图片进行真实化处理；最终循环多次得到人群计数所需的图片数据集。本发明只需要选择对应的场景库和人群库，即可相应的生产大量自带标注数据的数据集。相对于其他方法工作量少而精炼，更加简单。

Description

一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法

技术领域

本发明涉及计算机视觉中人群计数领域，尤其涉及一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法。

背景技术

人群密度估计是当前计算机视觉领域的研究热点之一，具有非常广泛的应用，目前通过监控视频实现人群密度估计和准确人群计数是一个至关重要的任务，深度学习是一个由多个处理层组成的计算模型，它不需要人工标注各种特征，可以通过学习获得数据的多抽象层表示。

但是深度学习模型对数据的依赖性非常强，在数据集过小的情况下不能取得非常好的效果，目前在人群计数领域的数据集存在过小的问题。在现有的方法中，通常采用分割图片的方式或采用游戏模拟截图的方式。

发明内容

本发明的目的是提出一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法，该方法通过自动将包含人的图片拼贴到场景图片上，形成丰富多样的图片数据集，在真实性上采用Cycle Gan的方式形成靠近真实场景的图片。

实现本发明目的的具体技术方案是：

一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法，特点是该方法包括以下具体步骤：

步骤1：收集包含人的单张图片集及包含场景的单张图片集；

步骤2：将包含人的单张图片集中的多张图片采用普通图像提取算法或深度学习模型提取出，然后构建子场景判别网络即SDN；使用SDN在场景图片中选取拼贴位置进行拼贴；

步骤3：采用CycleGan，利用真实场景图片作为对抗数据集把拼贴得到的图片进行真实化处理；最终得到所述扩充人群计数数据集；其中：

所述构建子场景判别网络即SDN，是根据图片像素大小，动态的将图片平均划分为多张子图片，然后构建多层卷积网络，利用space-365这一公开数据集进行训练的网络，该网络能够判断子图片是否符合拼贴逻辑的场景图片。

所述符合拼贴逻辑是指不能在海水、天空、树木、车辆、设备或建筑的场景进行拼贴。

本发明所述步骤1中，收集包含人的单张图片，采用python爬虫技术从百度图片或者其它图片库中爬取，场景图片也通过相同的方式选取大型人口聚集区域图片。

本发明的有益效果在于：

本发明方法具有易行性，随着深度模型的越来越大，所需要的训练数据集也会越来越多。但是传统的数据集需要人工的标注，在密集场景下这一任务非常的艰难，而本发明只需要选择对应的场景库和人群库，即可相应的生产大量自带标注数据的数据集。相对于其他方法本方法工作量少而精炼，更加简单。

附图说明

图1为本发明的流程图；

图 2为本发明实施例的流程示意图。

具体实施方式

结合以下具体实施例和附图，对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等，除以下专门提及的内容之外，均为本领域的普遍知识和公知常识，本发明没有特别限制内容。

实施例

参阅图2，本实施例具体操作按下述步骤进行：

（1）、人的图片库和场景图片库的抓取和预处理

从公开图片网站上抓取对应的图片信息，并且筛选出其中不是人或者场景的无效图片。并且利用数字图像处理中边缘提取算法，或是利用深度学习模型，在复杂的情况下也可以利用PS等工具，最终得到单独包含人的图片。

同样，场景图片也可以在专门的网站上抓取。则本步骤可以得到场景和人群两个不同的图片数据集。

（2）、人物图片和场景图片的拼贴

主要内容是将人物图片符合逻辑的贴在场景图上，包含两点，一是场景中不同存在不符合的拼贴位置，比如天空，海水等等。二是在人数多的情况下，会存在摄影上称为透视的效果，既在图片中远处的人会比较小，而近处的人会显得比较大。

a)问题1：贴图位置符合场景中逻辑

采用子场景判别网络（SDN），对图片中区域进行识别，选取其中符合逻辑的区域进行拼贴。该网络的基本架构是VGG-16，在最初十层使用膨胀卷积获取图片中的特征，在其中另设一支引入了整张图片的上下文信息，最后利用一个全连接层输出。在预处理阶段将场景图片按照所拼贴的人物图片的大小进行均匀划分，输入划分后的图片。其创新点在于利用整张图片的场景信息作为额外输入，然后采用Attention机制对划分后的每一块子图片做指引可以得到更为准确的可用子场景。因为所需要拼贴的只有人，所以只需要利用SDN识别所划分出的子图片的场景上下文，然后采用space 365预训练好的模型，对子图片场景上下文进行分类。在其中预设陆地、广场等多个人可以站立的场景作为目标场景，通过训练好的模型来识别哪些是可以拼贴的。最终选取最有可能的位置进行拼贴。

b)问题2：贴图的透视效果

首先检测出图片的透视点的位置，即可按照从透视点由小到大拼贴图即可。找出透视点的位置可以先使用Canny边缘检测器提取亚像素精度的直线段。然后通过基础的级联霍夫变换。从线段中判断可能的透视点候选。当然这个效果可以从当前最新的研究进展中获得提升。

（3）、Cycle Gan图片真实化

利用Cycle Gan的方式将拼接的图片进行真实化，在图片拼接的过程中会存在透视，边缘粗糙等问题，将其与真实图片对抗生成后实际使用。

本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下，本领域技术人员能够想到的变化和优点都被包括在本发明中，并且以所附的权利要求书为保护范围。

Claims

1.一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法，其特征在于，该方法包括以下具体步骤：

步骤1：收集包含人的单张图片集及包含场景的单张图片集；

步骤3：采用Cycle Gan，利用真实场景图片作为对抗数据集把拼贴得到的图片进行真实化处理；最终得到所述扩充人群计数数据集；其中：

所述构建子场景判别网络即SDN，该网络的基本架构是VGG-16，在最初十层使用膨胀卷积获取图片中的特征，在其中另设一支引入了整张图片的上下文信息，最后利用一个全连接层输出；在预处理阶段将场景图片按照所拼贴的人物图片的大小进行均匀划分，输入划分后的图片；利用SDN识别所划分出的子图片的场景上下文，然后采用space 365预训练好的模型，对子图片场景上下文进行分类；该网络能够判断子图片是否符合拼贴逻辑的场景图片；

所述符合拼贴逻辑是指不能在海水、天空、树木、车辆、设备或建筑的场景进行拼贴；

步骤1所述收集包含人的单张图片集及包含场景的单张图片集，采用python爬虫技术从百度图片或者图片库中爬取。