CN108985331A

CN108985331A - 一种基于对抗生成网络的目标计数方法

Info

Publication number: CN108985331A
Application number: CN201810610806.0A
Authority: CN
Inventors: 郭东岩; 王俊; 崔滢; 王振华; 张剑华; 陈胜勇
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2018-06-14
Filing date: 2018-06-14
Publication date: 2018-12-11

Abstract

一种基于对抗生成网络的目标计数方法，模型训练过程的步骤如下：步骤1.1：图片预处理，随机提取原图中若干图像块并缩放为相同大小；步骤1.2：设计鉴别模型，采用卷积神经网络计算图片置信度；步骤1.3：生成模型的设计，同样采用卷积神经网络生成所需密度图；步骤1.4：对抗生成网络的训练，设置两个损失函数L_D和L_G，采用Adam方法分别优化鉴别模型和生成模型；模型使用过程的步骤如下：步骤2.1：密度图的生成，根据训练模型使用生成模型生成密度图步骤2.2：目标计数，根据公式(5)计算目标数量Num。本发明网络架构采用生成模型与鉴别模型以博弈的方式相互优化，从而获得精度较高的密度图。

Description

一种基于对抗生成网络的目标计数方法

技术领域

本发明涉及深度学习、目标计数等领域，设计出的网络主要用于生成实现目标计数所需的密度图。

背景技术

机器学习是一门多领域交叉学科，涉及概率论、统计学等多门学科。通过模拟人类的学习行为使计算机能够不断进行自我完善，最终达到比较好的性能，深度学习作为机器学习方法中的一种，其强大的学习能力解决了许多问题，得到了学者们广泛的认可。

目标计数可以应用于生活工作的很多方面，例如交通部门对车流量的监控，社交场所的人流量统计等等。现在有很多基于计算机视觉的方法来实现目标计数，但精度仍有待提高，尤其是在复杂环境下，如目标存在互相遮挡，粘连，部分可见等情况下的精确计数仍是一个难题。因此急需一种适用于复杂环境并且拥有较高的精度的目标计数方法，以便在现实场景中更好的运用计算机视觉来实现目标计数。

要设计出这样的一个方法，关键是设计一个学习能力较强的网络，能够准确识别场景中的目标，从而提升目标计数的准确率。

发明内容

为了克服复杂环境下精确计数的问题，本发明提出一种基于对抗生成网络的网络架构，该网络架构采用生成模型与鉴别模型以博弈的方式相互优化，从而获得精度较高的密度图。

本发明解决其技术问题所采用的技术方案是：

一种基于对抗生成网络的目标计数方法，所述方法包括模型训练过程和模型使用过程；

模型训练过程的步骤如下：

步骤1.1：图片预处理，随机提取原图中若干图像块并缩放为相同大小；

步骤1.2：设计鉴别模型，采用卷积神经网络计算图片置信度；

步骤1.3：生成模型的设计，同样采用卷积神经网络生成所需密度图；

步骤1.4：对抗生成网络的训练，设置两个损失函数L_D和L_G，采用Adam方法分别优化鉴别模型和生成模型；

模型使用过程的步骤如下：

步骤2.1：密度图的生成，根据训练模型使用生成模型生成密度图

步骤2.2：目标计数，根据公式(1)计算目标数量Num：

其中p为各像素值。

进一步，所述步骤1.1中，记一个训练集序列为(S₀,S₁,S₂,……,S_m)，以S₀为例，在S₀中取n个图像块(P₁,P₂,P₃,……,P_n)，取1-2个效果最好，将(S₀,P₁,P₂,P₃,……,P_n)缩放成相同的大小，作为生成模型输入。

再进一步，所述步骤1.2中，鉴别模型共有5层，前4层为卷积层，卷积核大小均为5×5，步长为2，输出通道分别为64，128，256，512，其中第一层后接激活函数为lrelu，2-4层先经batch normalization后再接lrelu激活函数，最后一层为全连接层，最终通过sigmoid函数输出表示输入图片来自真实数据库的概率值。

所述步骤1.3中，生成模型共有9层，前五层为卷积层，前两层的卷积核为7×7，输出32个通道，并各后接一个最大池化层，第三层的卷积核为5×5，输出32个通道，并后接一个最大池化层，后两层的卷积核为1×1，第四层输出1000个通道，第五层输出400个通道，然后将各个图像块的卷积层输出组合后输入四层全连接层，前两个全连接层输出512个通道，第8层全连接层输出为324个通道，并resize为18×18大小。

所述步骤1.4中，设置两个损失函数L_D和L_G，其中L_D为鉴别模型的损失函数，L_G为生成模型的损失函数，过程如下：

步骤1.4.1：对于生成模型，将(S₀,P₁,P₂,P₃,……,P_n)输入生成模型中，得到预测的密度图

步骤1.4.2：其次，由于经过池化使得图片缩小，因此要将密度图缩放为原图大小，并通过下式(2)进行归一化；

其中p表示像素点；

步骤1.4.3：对于鉴别模型，我们将以原密度图为输入得到的概率值记为D(X)，将以生成模型生成的图像作为输入得到的概率值记为

步骤1.4.4：将训练集图片随机打乱并依次输入网络中，采用Adam优化方法间隔训练鉴别模型和生成模型，其中训练生成模型时为防止改变鉴别模型参数，鉴别部分通过参数共享的方式沿用鉴别模型参数，设置迭代次数，鉴别模型与生成模型损失函数分别如下式(3)(4)，迭代结束后保存最终生成的模型数据；

其中E表示求均值，优化参数使L_D达到最大值，使L_G达到最大值。

本发明的技术构思为：所述基于对抗生成网络的目标计数方法采用生成模型获取密度图，同时相对一般的生成模型，以对抗的方式进行训练可以使生成模型能够达到更好的效果，使输出的密度图更准确，同时提升网络的通用性，在复杂环境中目标之间存在遮挡、粘连等情况时也能达到较高的精度。

本发明的有益效果主要表现在：可以获得精度更高，通用性更好的密度图，使网络在计数目标存在相互遮挡、粘连等情况下的计数也更准确。

附图说明

图1为本发明的网络的生成模型。

图2为本发明的网络的鉴别模型。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1和图2，一种基于对抗生成网络的目标计数方法，所述方法包括模型训练过程和模型使用过程；

模型训练过程的步骤如下：

模型使用过程的步骤如下：

步骤2.2：目标计数，根据公式(1)计算目标数量Num：

其中p为各像素值。

其中p表示像素点；

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims

1.一种基于对抗生成网络的目标计数方法，其特征在于，所述方法包括模型训练过程和模型使用过程；

模型训练过程的步骤如下：

模型使用过程的步骤如下：

步骤2.2：目标计数，根据公式(1)计算目标数量Num：

其中p为各像素值。

2.如权利要求1所述的基于对抗生成网络的目标计数方法，其特征在于，所述步骤1.1中，记一个训练集序列为(S₀，S₁，S₂，......，S_m)，以S₀为例，在S₀中取n个图像块(P₁，P₂，P₃，......，P_n)，取1-2个效果最好，将(S₀，P₁，P₂，P₃，......，P_n)缩放成相同的大小，作为生成模型输入。

3.如权利要求1或2所述的基于对抗生成网络的目标计数方法，其特征在于，所述步骤1.2中，鉴别模型共有5层，前4层为卷积层，卷积核大小均为5×5，步长为2，输出通道分别为64，128，256，512，其中第一层后接激活函数为lrelu，2-4层先经batch normalization后再接lrelu激活函数，最后一层为全连接层，最终通过sigmoid函数输出表示输入图片来自真实数据库的概率值。

4.如权利要求1或2所述的基于对抗生成网络的目标计数方法，其特征在于，所述步骤1.3中，生成模型共有9层，前五层为卷积层，前两层的卷积核为7×7，输出32个通道，并各后接一个最大池化层，第三层的卷积核为5×5，输出32个通道，并后接一个最大池化层，后两层的卷积核为1×1，第四层输出1000个通道，第五层输出400个通道，然后将各个图像块的卷积层输出组合后输入四层全连接层，前两个全连接层输出512个通道，第8层全连接层输出为324个通道，并resize为18×18大小。

5.如权利要求1或2所述的基于对抗生成网络的目标计数方法，其特征在于，所述步骤1.4中，设置两个损失函数L_D和L_G，其中L_D为鉴别模型的损失函数，L_G为生成模型的损失函数，过程如下：

步骤1.4.1：对于生成模型，将(S₀，P₁，P₂，P₃，......，P_n)输入生成模型中，得到预测的密度图

其中p表示像素点；