CN110879982B

CN110879982B - 一种人群计数系统及方法

Info

Publication number: CN110879982B
Application number: CN201911122534.0A
Authority: CN
Inventors: 张莉; 陆金刚; 王邦军; 周伟达
Original assignee: Suzhou University
Current assignee: Suzhou University
Priority date: 2019-11-15
Filing date: 2019-11-15
Publication date: 2023-06-20
Anticipated expiration: 2039-11-15
Also published as: CN110879982A

Abstract

本发明公开了一种人群计数系统及方法，该系统包括图像预处理模块、模型训练模块及人群计数预测模块，其中：所述图像预处理模块，用于：获取训练集中每个训练样本的人群密度图及人数类别；其中，所述训练样本为人群图像；所述模型训练模块，用于：利用所述训练集中的每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别训练预先创建的神经网络，得到对应的预测模型；其中，所述神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器；所述人群计数预测模块，用于：利用所述预测模型预测待测样本的人群密度图；其中，所述待测样本为人群图像。从而能够准确预估不同密集度的人群图像的密度图。

Description

一种人群计数系统及方法

技术领域

本发明涉及计算机视觉技术领域，更具体地说，涉及一种人群计数系统及方法。

背景技术

随着踩踏事件的频繁发生，为了人群控制和公众安全，准确地估计来自图像(或视频)的人群的人数已经成为计算机视觉技术越来越重要的应用。计算机视觉技术中的人群计数任务是自动计算图像(或视频)中的人数。为了在诸如公众集会和体育赛事等许多场景中帮助控制人群和公共安全，准确的人群计数显得越来越重要。

传统的密集人群计数方法包括两种：基于检测的方法和基于回归的方法。但是基于检测的方法会受到人群遮挡的影响，而基于回归的方法往往会受到视角和尺度急剧变化的影响。针对以上两种传统方法的不足，基于深度学习卷积神经网络的方法被用于密集人群图像的估计中。目前主流的估计方法采用了密度图的思想，即设计一个神经网络，网络的输入为原始图像，而输出为人群的密度图。然而，该方法在不同密集度的人群图像上的效果存在很大的区别，也即无法准确的预估不同密集度的人群图像的密度图。

发明内容

本发明的目的是提供一种人群计数系统及方法，能够准确预估不同密集度的人群图像的密度图。

为了实现上述目的，本发明提供如下技术方案：

一种人群计数系统，包括图像预处理模块、模型训练模块及人群计数预测模块，其中：

所述图像预处理模块，用于：获取训练集中每个训练样本的人群密度图及人数类别；其中，所述训练样本为人群图像；

所述模型训练模块，用于：利用所述训练集中的每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别训练预先创建的神经网络，得到对应的预测模型；其中，所述神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器；

所述人群计数预测模块，用于：利用所述预测模型预测待测样本的人群密度图；其中，所述待测样本为人群图像。

优选的，所述神经网络的损失函数L包括所述人数分类器对应的交叉熵损失函数L_C和所述多尺度卷积神经网络对应的2范数损失函数L_d，所述交叉熵损失函数L_C、所述2范围损失函数L_d及所述神经网络的损失函数L分别如下所示：

L＝λL_C+L_d；

其中，N为训练样本的数量，Θ为所述神经网络学习的参数，X_i为第i个训练样本，F_C(X_i,Θ)为对应X_i所述人数分类器的输出，yⁱ为X_i的人数类别，M为人数类别的总数，F_d(X_i,Θ)为对应X_i所述多尺度卷积神经网络的输出，D_i为X_i的人群密度图，λ＞0为调和参数。

优选的，所述多尺度卷积神经网络包括以VGG16网络框架为主干的第一卷积层至第四卷积层，所述人数分类器包括对所述第四卷积层输出的特征图的大小进行调整的SPP模块及位于所述SPP模块之后、用于实现人数类别预测的三个全连接层。

优选的，所述图像预处理模块包括图像预处理单元，所述图像预处理单元用于：确定每个所述训练样本的初始密度图为零矩阵，将高斯滤波器和所述初始密度图在每个所述训练样本对应的人头坐标点图中每个人头中心坐标处相加，得到每个所述训练样本对应的人群密度图；其中，所述人头坐标点图为表示对应训练样本中的各个像素是否存在人头的图像。

优选的，所述人群计数预测模块还用于：将所述预测模型输出的与所述待测样本对应的人群密度图中所有像素值进行求和，确定求和得到的值为所述待测样本的预测人数。

优选的，所述人群计数预测模块还用于：基于所述人群密度图对所述待测样本中包含的各个人头进行标示，并将标示完成的所述待测样本及预测人数进行显示。

优选的，所述人群计数预测模块还用于：将所述待测样本、所述待测样本的人群密度图及所述待测样本的预测人数发送至指定的终端。

一种人群计数方法，包括：

利用预先训练得到的预测模型预测待测样本的人群密度图；其中，所述待测样本为人群图像；

其中，预先训练所述待测模型的过程包括：

获取训练集中每个训练样本的人群密度图及人数类别；其中，所述训练样本为人群图像；

利用所述训练集中的每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别训练预先创建的神经网络，得到所述预测模型；其中，所述神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器。

本发明提供的一种人群计数系统及方法，该系统包括图像预处理模块、模型训练模块及人群计数预测模块，其中：所述图像预处理模块，用于：获取训练集中每个训练样本的人群密度图及人数类别；其中，所述训练样本为人群图像；所述模型训练模块，用于：利用所述训练集中的每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别训练预先创建的神经网络，得到对应的预测模型；其中，所述神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器；所述人群计数预测模块，用于：利用所述预测模型预测待测样本的人群密度图；其中，所述待测样本为人群图像。本申请公开的技术特征中，利用训练集中每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别实现神经网络的训练，得到对应的预测模型，进而利用该预测模型实现人群密度图的预测；对应的，神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器。可见，本申请在多尺度卷积神经网络的基础上增加了一个人数分类器得到对应的神经网络，进而对该神经网络进行相应训练得到实现人群密度图预测的预测模型，其中人数分类器实现的人数类别预测即为对应人群图像的密集度的预测，从而通过人群图像的密集度的预测实现人群图像的先验特征的获取，使得神经网络能够适应不同密集度的人群图像，能够准确预估不同密集度的人群图像的密度图。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种人群计数系统的结构示意图；

图2为本发明实施例提供的一种人群计数系统中分类多尺度卷积神经网络的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，其示出了本发明实施例提供的一种人群计数系统的结构示意图，该人群计数系统可以包括图像预处理模块11、模型训练模块12及人群计数预测模块13，其中：

图像预处理模块11，用于：获取训练集中每个训练样本的人群密度图及人数类别；其中，训练样本为人群图像；

模型训练模块12，用于：利用训练集中的每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别训练预先创建的神经网络，得到对应的预测模型；其中，神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器；

人群计数预测模块13，用于：利用预测模型预测待测样本的人群密度图；其中，待测样本为人群图像。

其中，人群图像为包含有人群的图像或视频，人群图像的人群密度图为表示人群图像中包含的人群密度的图像，人数类别为人群图像中包含的人数所属的类别，具体来说，不同人数类别的人数不同，分类标准可以为将人数平均分成M类，假设最大人数为max，最少人数为min，则可以分类为(max-min)/M。神经网络中包含的多尺度卷积神经网络(SaCNN)可以与现有技术中对应概念的含义相同，具体来说，多尺度卷积神经网络以VGG16网络框架为主干，并且在此基础上引入了多尺度的思想，即将分辨率相同、尺度不同的特征图在通道数上进行串联，从而有效提高了人数密度图预测的准确性。而人数分类器则为在多尺度卷积神经网络中加入的能够预测人群图像中人数所属人数类别的模块，从而得到包含多尺度卷积神经网络和人数分类器的神经网络(分类多尺度卷积神经网络，CSaCNN)，作为本实施例中用于实现人群密度图预测的模型。

本实施例中的人群计数系统具体工作过程可以包括：图像预处理模块获取训练集中每个训练样本的人群密度图及人数类别；模型训练模块利用训练集中的每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别训练预先创建的神经网络，得到对应的预测模型；人群计数预测模块利用预测模型预测待测样本的人群密度图。

本申请公开的技术特征中，利用训练集中每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别实现神经网络的训练，得到对应的预测模型，进而利用该预测模型实现人群密度图的预测；对应的，神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器。可见，本申请在多尺度卷积神经网络的基础上增加了一个人数分类器得到对应的神经网络，进而对该神经网络进行相应训练得到实现人群密度图预测的预测模型，其中人数分类器实现的人数类别预测即为对应人群图像的密集度的预测，从而通过人群图像的密集度的预测实现人群图像的先验特征的获取，使得神经网络能够适应不同密集度的人群图像，能够准确预估不同密集度的人群图像的密度图。

本发明实施例提供的一种人群计数系统，神经网络的损失函数L可以包括人数分类器对应的交叉熵损失函数L_C和多尺度卷积神经网络对应的2范数损失函数L_d，交叉熵损失函数L_C、2范围损失函数L_d及神经网络的损失函数L分别如下所示：

L＝λL_C+L_d；

其中，N为训练样本的数量，Θ为神经网络学习的参数，X_i为第i个训练样本，F_C(X_i,Θ)为对应X_i人数分类器的输出，yⁱ为X_i的人数类别，M为人数类别的总数，F_d(X_i,Θ)为对应X_i多尺度卷积神经网络的输出，D_i为X_i的人群密度图，λ＞0为调和参数。

本实施例中基于损失函数实现神经网络训练过程中的反向传播，其中，反向传播与现有技术中对应概念的含义相同，具体来说，反向传播算法主要由两个环节(激励传播、权重更新)反复循环迭代，直到神经网络对输入的响应达到预定的目标范围为止。具体来说，反向传播算法的学习过程由正向传播过程和反向传播过程组成；在正向传播过程中，输入信息通过输入层经隐含层，逐层处理并传向输出层，如果在输出层得不到期望的输出值，则取输出与期望的误差的平方和作为目标函数，转入反向传播，逐层求出目标函数对各神经元权值的偏导数，构成目标函数对权值向量的梯量，作为修改权值的依据，神经网络的学习在权值修改过程中完成；输出与期望的误差达到所期望值时，神经网络的学习结束。本实施例的神经网络中在反向传播过程中需要修改的权值即为Θ，Θ是神经网络中学习的参数，或者说是神经网络中学习的所有参数(包括多尺度卷积神经网络和人数分类器中包含的需要学习的各项参数)的集合，通常主要包括神经网络中卷积层和池化层等的权值。需要说明的是，损失函数是用来计算神经网络预测结果和真实值之间的相似度的一种函数，本实施例中将上述人数分类器对应的交叉熵损失函数L_C和多尺度卷积神经网络对应的2范数损失函数L_d均作为损失函数L的组成部分，进而在反向传播过程中基于人数分类器对应的交叉熵损失函数L_C和多尺度卷积神经网络对应的2范数损失函数L_d进行相应参数的调整，从而可以将人数分类器和多尺度卷积神经网络这两部分的参数结合起来互相调整，保证了学习神经网络得到的预测模型能够实现人群图像中人数类别的准确预测，也即适应不同人数类别的人群图像，以准确实现不同人数类别的人群图像的人群密度图的预测。

本发明实施例提供的一种人群计数系统，多尺度卷积神经网络包括以VGG16网络框架为主干的第一卷积层至第四卷积层，人数分类器包括对第四卷积层输出的特征图的大小进行调整的SPP模块及位于SPP模块之后、用于实现人数类别预测的三个全连接层。

需要说明的是，本实施例提供的分类多尺度卷积神经网络的结构示意图可以如图2所示；其中，分类多尺度卷积神经网络以SaCNN为基础，第一卷积层Conv1至第四卷积层Conv4以VGG16网络框架为主干；第五卷积层Conv5和第六卷积层Conv6之间选用3*3区域、步长为1的最大池化，来保持池化前后的特征图大小不变，便于将两次卷积之后的特征图在通道数上串联起来；在第五卷积层Conv5之后，使用一个反卷积层DeConv对之前的特征图进行上采样，进而和第三卷积层Conv3得到的特征图在通道数上串联起来；除此之外，所有的池化层都采用32*32区域，步长为2的最大池化，激活函数都采用ReLU函数；最后经过一个卷积核大小为1*1的卷积层Conv8将其映射为估计的人群密度图作为输出；Conv7及Conv8分别表示第七卷积层及第八卷积层。在第四卷积层Conv4之后添加一个人数分类器的分支，该分支将Conv4之后的特征图通过一个SPP模块将大小调整到32*32，再通过三个全连接层(FC1至FC3)将图像根据人数分为M类(其中，人数分类器前面的卷积层都用来提取人群图像的特征，然后经过全连接层进行分类，最后得到一个M维的向量，每一维对应每一类，假设M为10，人数分类器最后得到的向量为10维(0,1,0,0,0,0,0,0,0,0)，即属于第二类)，其中，SPP模块旁标注的32*32表示SPP模块中卷积核大小，FC1、FC2及FC3旁标注的512、256、10一一对应的标识FC1、FC2及FC3中神经元个数；3*3@64表示对应卷积层中卷积核大小为3*3、卷积核个数为64，3*3@128、3*3@256、3*3@512、1*1@1同理；MP：2*2表示池化层窗口大小为2*2，MP：3*3同理；S＝2表示池化步长为2，S＝1同理。

人数分类器这部分主要作用是获得了人群图像的先验特征，将人群图像的密集度考虑在内，提高了预测模型在不同密集度上的效果。具体来说，通过损失函数将人群图像的人数类别应用到人群图像的人群密度估计上，这样相当于获得了人群图像的先验特征，然后将先验特征结合到最后的损失函数中，经过反向传播，参数实现多次的调整，使得最后学习到的预测模型越发的适应不同密集度的人群图像(其中，损失函数均在预测模型的最后进行，即在FC3和Conv9的后面进行)。并且实验证明，这种结构的神经网络具有较高的人群密度的准确性。

本发明实施例提供的一种人群计数系统，图像预处理模块可以包括图像预处理单元，图像预处理单元用于：确定每个训练样本的初始密度图为零矩阵，将高斯滤波器和初始密度图在每个训练样本对应的人头坐标点图中每个人头中心坐标处相加，得到每个训练样本对应的人群密度图；其中，人头坐标点图为表示对应训练样本中的各个像素是否存在人头的图像。

本实施例中对训练样本处理的第一步，就是通过一个高斯滤波器得到训练样本的ground-truth密度图(人群密度图)。具体来说，训练集可以表示为

其中，X_i为训练集第i个训练样本，大小为m*n，Y_i为第i个训练样本对应的人头坐标点图(人头坐标点图是一种0-1图，即将对应训练样本中的人头以坐标的形式呈现，人头坐标点图中有人头的坐标像素值为1，无人头的坐标像素值为0)，大小同样为m*n，N为训练集中训练样本的总数。先定义每个训练样本的初始密度图M，M初始为零矩阵，再将一个高斯滤波器G和初始密度图M在对应训练样本的人头坐标点图中每个人头中心坐标(人头中心坐标即为人头坐标点图对应位置的坐标，假设一个人头占了9个像素点，则人头中心坐标指的就是这9个像素点中心的像素点，即第二行第二列的像素点)(x,y)处相加，得到对应训练样本的ground-truth密度图M'(人群密度图)。可以假设高斯滤波器G大小为k*k，则将高斯滤波器G和以人头中心坐标为中心，半径为(k-1)/2的k*k大小的区域对应位置分别进行像素值相加，得到密度图M'；由于原始定义的密度图M是一个零矩阵，高斯滤波器是一个元素之和为1的方阵，将这个方阵按照人头中心坐标加到M上，这样M中的像素值就会改变，最终计算得到M'，M'的元素之和就等于对应人群图像中的人数。训练集/>

经过高斯滤波器滤波，可以产生一个新的训练集/>

从而通过这种方式有效快速的得到每个训练样本的人群密度图，进而保证模型训练的效率。

本发明实施例提供的一种人群计数系统，人群计数预测模块还可以用于：将预测模型输出的与待测样本对应的人群密度图中所有像素值进行求和，确定求和得到的值为待测样本的预测人数。

向预测模型输入一张待测图像T，得到待测图像的估计的人群密度图

对估计得到的人群密度图/>

所有像素值求和，即可得到待测图像中估计的人数为/>

从而通过这种方式可以快速方便的获取到待测图像中包含的人数，提高了人数预测的效率。

本发明实施例提供的一种人群计数系统，人群计数预测模块还可以用于：基于人群密度图对待测样本中包含的各个人头进行标示，并将标示完成的待测样本及预测人数进行显示。

确定出人群密度图后，可以利用人群密度图及高斯滤波器按照上述得到训练样本的人群密度图的反过程得到待测样本的人头坐标点图，进而在待测样本上按照待测样本与人头坐标点图中各像素之间的对应关系确定出待测样本上人头的位置，并进行对应的标示，可以是将人头的位置圈出或者用突出色显示或者其他根据实际需要设定的标示方法，进而将标示完成的待测样本及预测人数进行显示，从而使得外界人员不仅可以直接获知到待测样本中包含的人数，还可以直接获知待测样本中各人头的位置，便于外界人员对于待测样本的分析等工作。

本发明实施例提供的一种人群计数系统，人群计数预测模块还可以用于：将待测样本、待测样本的人群密度图及待测样本的预测人数发送至指定的终端。

为了方便外界人员可以远程获知到待测样本包含的人群情况，本实施例中可以将待测样本、待测样本的人群密度图及待测样本的预测人数均发送至需要获知人群情况的外界人员对应的终端上，从而便于外界人员远程实现相应的信息获取及分析等工作。

本发明在密集人群数据集Shanghaitech数据集上进行了测试，该数据集一共包含1198张标注的图像，以及330165个人头中心标注。该数据集包含两部分：Part_A和Part_B。Part_A有482张随机从网上爬取的人群图像，300张用于训练，182张用于测试。Part_B有716张在上海街头拍取的人群图像，400张用于训练，316张用于测试。

输入Shanghaitech数据集Part_B的训练集

X_i为训练集第i张人群图像，大小为768*1024，Y_i为第i张人群图像对应的人头坐标点图，大小同样为768*1024，N为训练集中人群图像的总数。

训练集

经过高斯滤波器滤波，可以产生一个新的训练集

采用分类多尺度卷积神经网络在新的训练集

上训练如图2所示的神经网络。其中，M＝10，λ＝0.0001。

输入一张测试图像T，用训练得到的预测模型进行预测，得到T的估计人群密度图

对估计得到的人群密度图/>

所有像素值求和，得到估计的人数为/>

本申请在多尺度卷积神经网络的基础上，增加了人数分类器，对人群图像进行更精确的人数估计，可以称之为分类多尺度卷积神经网络。本申请神经网络与多尺度卷积神经网络在相同的数据集上做人群计数比较。从表1可以发现，本发明提出的神经网络的计数结果的平均完全误差(MAE)和均方误差(MSE)都比多尺度卷积神经网络的计数结果小，获得了更好的性能。

表1人群计数结果的对比

本发明实施例还提供了一种人群计数方法，可以包括：

利用预先训练得到的预测模型预测待测样本的人群密度图；其中，待测样本为人群图像；

预先训练待测模型的过程包括：

获取训练集中每个训练样本的人群密度图及人数类别；其中，训练样本为人群图像；

利用训练集中的每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别训练预先创建的神经网络，得到预测模型；其中，神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器。

本发明实施例提供的一种人群计数方法，获取训练集中每个训练样本的人群密度图，包括：

确定每个训练样本的初始密度图为零矩阵，将高斯滤波器和初始密度图在每个训练样本对应的人头坐标点图中每个人头中心坐标处相加，得到每个训练样本对应的人群密度图；其中，人头坐标点图为表示对应训练样本中的各个像素是否存在人头的图像。

本发明实施例提供的一种人群计数方法，利用预先训练得到的预测模型预测待测样本的人群密度图之后，还包括：

将预测模型输出的与待测样本对应的人群密度图中所有像素值进行求和，确定求和得到的值为待测样本的预测人数。

本发明实施例提供的一种人群计数方法，确定求和得到的值为待测样本的预测人数之后，还包括：

基于人群密度图对待测样本中包含的各个人头进行标示，并将标示完成的待测样本及预测人数进行显示。

将待测样本、待测样本的人群密度图及待测样本的预测人数发送至指定的终端。

需要说明的是，本发明实施例提供的一种人群计数方法中相关部分的说明请参见本发明实施例提供的一种人群计数系统中对应部分的详细说明，在此不再赘述。另外本发明实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种人群计数系统，其特征在于，包括图像预处理模块、模型训练模块及人群计数预测模块，其中：

所述人群计数预测模块，用于：利用所述预测模型预测待测样本的人群密度图；其中，所述待测样本为人群图像；

其中，所述多尺度卷积神经网络包括以VGG16网络框架为主干的第一卷积层至第四卷积层，所述人数分类器包括对所述第四卷积层输出的特征图的大小进行调整的SPP模块及位于所述SPP模块之后、用于实现人数类别预测的三个全连接层。

2.根据权利要求1所述的系统，其特征在于，所述神经网络的损失函数L包括所述人数分类器对应的交叉熵损失函数L_C和所述多尺度卷积神经网络对应的2范数损失函数L_d，所述交叉熵损失函数L_C、所述2范数损失函数L_d及所述神经网络的损失函数L分别如下所示：

L＝λL_C+L_d；

其中，N为训练样本的数量，Θ为所述神经网络学习的参数，X_i为第i个训练样本，F_C(X_i,Θ)为对应X_i所述人数分类器的输出，yⁱ为X_i的人数类别，M为人数类别的总数，F_d(X_i,Θ)为对应X_i所述多尺度卷积神经网络的输出，D_i为X_i的人群密度图，λ>0为调和参数。

3.根据权利要求1所述的系统，其特征在于，所述图像预处理模块包括图像预处理单元，所述图像预处理单元用于：确定每个所述训练样本的初始密度图为零矩阵，将高斯滤波器和所述初始密度图在每个所述训练样本对应的人头坐标点图中每个人头中心坐标处相加，得到每个所述训练样本对应的人群密度图；其中，所述人头坐标点图为表示对应训练样本中的各个像素是否存在人头的图像。

4.根据权利要求3所述的系统，其特征在于，所述人群计数预测模块还用于：将所述预测模型输出的与所述待测样本对应的人群密度图中所有像素值进行求和，确定求和得到的值为所述待测样本的预测人数。

5.根据权利要求4所述的系统，其特征在于，所述人群计数预测模块还用于：基于所述人群密度图对所述待测样本中包含的各个人头进行标示，并将标示完成的所述待测样本及预测人数进行显示。

6.根据权利要求5所述的系统，其特征在于，所述人群计数预测模块还用于：将所述待测样本、所述待测样本的人群密度图及所述待测样本的预测人数发送至指定的终端。

7.一种人群计数方法，其特征在于，包括：

其中，预先训练所述预测模型的过程包括：

利用所述训练集中的每个训练样本、每个训练样本的人群密度图及每个训练样本的人数类别训练预先创建的神经网络，得到所述预测模型；其中，所述神经网络包括实现人群计数预测的多尺度卷积神经网络及用于实现人数类别预测的人数分类器；