CN105528589B - 基于多列卷积神经网络的单张图像人群计数算法 - Google Patents

基于多列卷积神经网络的单张图像人群计数算法 Download PDF

Info

Publication number
CN105528589B
CN105528589B CN201511030645.0A CN201511030645A CN105528589B CN 105528589 B CN105528589 B CN 105528589B CN 201511030645 A CN201511030645 A CN 201511030645A CN 105528589 B CN105528589 B CN 105528589B
Authority
CN
China
Prior art keywords
convolutional neural
neural networks
multiple row
network
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201511030645.0A
Other languages
English (en)
Other versions
CN105528589A (zh
Inventor
高盛华
张营营
马毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201511030645.0A priority Critical patent/CN105528589B/zh
Publication of CN105528589A publication Critical patent/CN105528589A/zh
Application granted granted Critical
Publication of CN105528589B publication Critical patent/CN105528589B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion

Abstract

本发明提供了一种基于多列卷积神经网络的单张图像人群计数算法,其中的多列卷积神经网络有三个子网络,每个子网络用到卷积核的大小不同,每个子网络的输入为同一张图像,在经过四次卷积和两次池化后,三个子网络输出的特征图在“通道”维度上链接在一起,再用一个1×1的核卷积得到人群的密度图。本发明得到的人群密度优于现有算法。

Description

基于多列卷积神经网络的单张图像人群计数算法
技术领域
本发明涉及一种依据单张图像进行精确的人群计数或者人群密度估计的算法。
背景技术
现有人群计数算法存在对图像分割技术依赖性比较大、计数规模较小、输入图片大小固定等诸多限制,很多算法对于人数变化很大,或者背景复杂的图像的计数精度很低。如今,室外广场、街道基本都配备了摄像头,但是人群信息处理还没有得到有效应用,因此精确的人群计数或者人群密度估计算法对于监控中人群异常事件检测具有重要意义。
发明内容
本发明的目的是提供一种依据单张图像进行精确的人群计数或者人群密度估计的算法。
为了达到上述目的,本发明的技术方案是提供了一种基于多列卷积神经网络的单张图像人群计数算法,包括以下步骤:
建立多列卷积神经网络,利用样本集对该多列卷积神经网络进行训练,得到待学习参数Θ的估计,使得通过该多列卷积神经网络得到的样本集中任意输入图像x的人群密度估计图F(x;Θ)与该输入图像x的实际人群密度图M(x)间的欧式距离最小,其特征在于:
所述多列卷积神经网络包括子网络一、子网络二、子网络三,同一张输入图像x输入子网络一、子网络二、子网络三后均经过四次卷积和两次池化得到三组不同的特征图,子网络一的卷积的卷积核大小为N1×N1,子网络二的卷积的卷积核大小为N2×N2,子网络三的卷积的卷积核大小为N3×N3,N1>N2>N3,三组特征图在通道维度上链接在一起,再用一个1×1的核卷积得到人群的估计密度图,该多列卷积神经网络的损失函数是多列卷积神经网络的第i幅输入图像xi的人群密度估计图F(xi;Θ)和多列卷积神经网络的第i幅输入图像xi的实际人群密度图M(xi)之间的欧氏距离L(Θ),式中,N为输入多列卷积神经网络的图像数量,为多列卷积神经网络的参数设定一个初始值后,根据实际的标准密度图算出输入图片的损失:L(Θ),然后在每一次优化迭代中更新整个网络的参数Θ,直到损失值收敛到一个较小的值。
优选地,采用随机梯度下降法在每一次优化迭代中更新整个网络的参数Θ。
优选地,输入图像x对应的实际人群密度图M(x)表示为:)式中,N为图像中的人数,表示输入图像x中每个像素的位置,xi为第i个人头在输入图像x中的位置,δ(·)为单位冲击函数,*为卷积操作,为标准差为σi的高斯核。
本发明在三个公共数据集上以及一个发明人自己提出的数据集上与其他方法进行了比较,公共数据集包括UCF_CC_50,UCSD和WorldExpo。各个数据集的信息如下表所示:
上表中,Num为图像数量,Max、Min分别表示图像中出现的最大人数和最小人数,Ave表示图像的平均人数,Total是数据集中所有的人数。
发明采用平均绝对误差(MAE):和均方误差(MSE):(N为图片数量,zi为第i幅图像中实际的人头数,为第i幅图像通过本发明提供的网络输出的人头数)来衡量算法的准确性。在UCF_CC_50数据集上,本发明方法与现有技术的对比,如下表所示(MCNN为本发明的算法):
在UCSD数据集上,本发明方法与现有技术的对比,如下表所示:
在WorldExpo数据集上,本发明方法与现有技术对比,如下表所示:
在发明人自己的数据集上,本发明方法与现有技术的对比,如下表所示:
附图说明
图1为本发明中的多列卷积神经网络的网络结构,图中,Conv代表卷积操作,Conv后的数字代表卷积核的大小,Pooling代表最大池化操作,Pooling后的数字代表池化区域的大小,Merged feature maps为各组特征图按“通道”维度链接起来总的特征图;
图2a)及图2c)为输入图像,图2b)为图2a)对应的实际人群密度图,图2d)为图2c)对应的实际人群密度图;
图3a)为输入图像,图3b)为图3a)对应的实际人群密度图,图3c)为通过本发明估算到的图3a)的人群密度图;
图3d)为输入图像,图3e)为图3d)对应的实际人群密度图,图3f)为通过本发明估算到的图3d)的人群密度图。
具体实施方式
为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。
本发明需要解决给定一张人群图像或者视频中的一帧,然后估计该图像各个区域人群的密度以及总人数。
已知输入图像可以表示为m×n的矩阵:x∈Rm×n,则该输入图像x所对应的实际人群密度可以表示为:式中:N为图像中的人数,表示图像中每个像素的位置,xi为第i个人头在图像中的位置,δ(·)为单位冲击函数,*为卷积操作,为标准差为σi的高斯核。基于多列卷积神经网络的单张图像人群计数算法的目标是学习一个由输入图像x到该图像中的人群密度(如图2a)至图d)所示)的映射函数F:F:x→F(x)≈M(x),式中,F(x)为估计人群密度图。为了学习F,需要解决如下问题:
式中,F(x;Θ)为估计人群密度图,Θ为待学习参数。一般来说,F是一个复杂非线性的映射。
在本发明中,利用如图1所示的多列卷积神经网络来学习非线性函数F。其结构如图1所示。多列卷积神经网络有三个子网络,每个子网络用到卷积核的大小不同。第一个子网络用到的卷积核的大小为7×7,第二个子网络用到的卷积核的大小为5×5,第三个子网络用到的卷积核的大小为7×7。同一张输入图像Input image输入三个子网络后先经过三次不同的卷积。输入图像Input image在第一个子网络内先经过一次卷积核大小为9×9的卷积后再进行三次卷积和两次池化,三次卷积的卷积核大小均为7×7;输入图像Inputimage在第二个子网络内先经过一次卷积核大小为7×7的卷积后再进行三次卷积和两次池化,三次卷积的卷积核大小均为5×5;输入图像Input image在第三个子网络内先经过一次卷积核大小为5×5的卷积后再进行三次卷积和两次池化,三次卷积的卷积核大小均为3×3。图像在三个子网络中经过四次卷积和两次池化后,输出三张特征图。三个子网络的池化区域大小均为2×2。三张特征图在“通道”维度上链接在一起,形成总特征图Mergedfeature maps,随后再用一个卷积核大小为1×1的卷积得到人群的密度估计图Densitymap。图1中,每个子网络每一层左上角的数字表示通道数,例如对于第一个子网络而言,其第一层的通道数为16。
上述多列卷积神经网络的损失函数是估计密度图和实际密度图之间的欧氏距离:式中,F(Xi;Θ)为多列卷积神经网络的第i幅输入图像xi的人群密度估计图,Xi为第i幅输入图像的图像矩阵,Θ为待学习参数,N为输入图像的总数量,M(xi)为多列卷积神经网络的第i幅输入图像xi的实际人群密度图。首先给网络中的参数设定一个初始值(卷积层的核用标准差为0.01的高斯核初始化,偏置初始化为0),给定初始值之后,根据实际的标准密度图算出输入图片的损失:L(Θ)。然后采用随机梯度下降法在每一次优化迭代中更新整个网络的参数:L(Θ),直到损失值收敛到一个较小的值。

Claims (3)

1.一种基于多列卷积神经网络的单张图像人群计数算法,包括以下步骤:
建立多列卷积神经网络,利用样本集对该多列卷积神经网络进行训练,得到待学习参数Θ的估计,使得通过该多列卷积神经网络得到的样本集中任意输入图像x的人群密度估计图F(x;Θ)与该输入图像x的实际人群密度图M(x)间的欧式距离最小,其特征在于:
所述多列卷积神经网络包括子网络一、子网络二、子网络三,同一张输入图像x输入子网络一、子网络二、子网络三后均经过四次卷积和两次池化得到三组不同的特征图,子网络一的卷积的卷积核大小为N1×N1,子网络二的卷积的卷积核大小为N2×N2,子网络三的卷积的卷积核大小为N3×N3,N1>N2>N3,三组特征图在通道维度上链接在一起,再用一个1×1的核卷积得到人群的估计密度图,该多列卷积神经网络的损失函数是多列卷积神经网络的第i幅输入图像xi的人群密度估计图F(xi;Θ)和多列卷积神经网络的第i幅输入图像xi的实际人群密度图M(xi)之间的欧氏距离L(Θ),式中,N为输入多列卷积神经网络的图像数量,为多列卷积神经网络的参数设定一个初始值后,根据实际的标准密度图算出输入图片的损失:L(Θ),然后在每一次优化迭代中更新整个网络的参数Θ,直到损失值收敛到一个较小的值。
2.如权利要求1所述的一种基于多列卷积神经网络的单张图像人群计数算法,其特征在于:采用随机梯度下降法在每一次优化迭代中更新整个网络的参数Θ。
3.如权利要求1所述的一种基于多列卷积神经网络的单张图像人群计数算法,其特征在于:输入图像x对应的实际人群密度图M(x)表示为:式中,N为图像中的人数,表示输入图像x中每个像素的位置,xi为第i个人头在输入图像x中的位置,δ(·)为单位冲击函数,*为卷积操作,为标准差为σi的高斯核。
CN201511030645.0A 2015-12-31 2015-12-31 基于多列卷积神经网络的单张图像人群计数算法 Active CN105528589B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511030645.0A CN105528589B (zh) 2015-12-31 2015-12-31 基于多列卷积神经网络的单张图像人群计数算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511030645.0A CN105528589B (zh) 2015-12-31 2015-12-31 基于多列卷积神经网络的单张图像人群计数算法

Publications (2)

Publication Number Publication Date
CN105528589A CN105528589A (zh) 2016-04-27
CN105528589B true CN105528589B (zh) 2019-01-01

Family

ID=55770803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511030645.0A Active CN105528589B (zh) 2015-12-31 2015-12-31 基于多列卷积神经网络的单张图像人群计数算法

Country Status (1)

Country Link
CN (1) CN105528589B (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326937B (zh) * 2016-08-31 2019-08-09 郑州金惠计算机系统工程有限公司 基于卷积神经网络的人群密度分布估计方法
CN106778502B (zh) * 2016-11-21 2020-09-22 华南理工大学 一种基于深度残差网络的人群计数方法
CN106776842B (zh) * 2016-11-28 2021-03-19 腾讯科技(上海)有限公司 多媒体数据检测方法及装置
CN108960404B (zh) * 2017-05-22 2021-02-02 浙江宇视科技有限公司 一种基于图像的人群计数方法及设备
CN107657226B (zh) * 2017-09-22 2020-12-29 电子科技大学 一种基于深度学习的人数估计方法
CN107742099A (zh) * 2017-09-30 2018-02-27 四川云图睿视科技有限公司 一种基于全卷积网络的人群密度估计、人数统计的方法
CN107679503A (zh) * 2017-10-12 2018-02-09 中科视拓(北京)科技有限公司 一种基于深度学习的人群计数算法
CN107862382A (zh) * 2017-10-16 2018-03-30 深圳市中钞信达金融科技有限公司 人流量统计方法及装置
CN107862261A (zh) * 2017-10-25 2018-03-30 天津大学 基于多尺度卷积神经网络的图像人群计数方法
CN109902697B (zh) * 2017-12-07 2022-10-28 展讯通信(天津)有限公司 多目标检测方法、装置及移动终端
CN108549835A (zh) * 2018-03-08 2018-09-18 深圳市深网视界科技有限公司 人群计数及其模型构建的方法、终端设备及存储介质
CN108596054A (zh) * 2018-04-10 2018-09-28 上海工程技术大学 一种基于多尺度全卷积网络特征融合的人群计数方法
CN108647637B (zh) * 2018-05-09 2020-06-30 广州飞宇智能科技有限公司 一种基于人群识别的视频采集分析装置和方法
CN108875587A (zh) * 2018-05-24 2018-11-23 北京飞搜科技有限公司 目标分布检测方法及设备
CN108875674B (zh) * 2018-06-29 2021-11-16 东南大学 一种基于多列融合卷积神经网络的驾驶员行为识别方法
CN109166100A (zh) * 2018-07-24 2019-01-08 中南大学 基于卷积神经网络的多任务学习细胞计数方法
CN109271960B (zh) * 2018-10-08 2020-09-04 燕山大学 一种基于卷积神经网络的人数统计方法
CN109408655A (zh) * 2018-10-19 2019-03-01 中国石油大学(华东) 结合带孔卷积与多尺度感知网络的手绘草图检索方法
CN109543695B (zh) * 2018-10-26 2023-01-06 复旦大学 基于多尺度深度学习的泛密度人群计数方法
CN109447008B (zh) * 2018-11-02 2022-02-15 中山大学 基于注意力机制和可变形卷积神经网络的人群分析方法
CN110163060B (zh) * 2018-11-07 2022-12-23 腾讯科技(深圳)有限公司 图像中人群密度的确定方法及电子设备
CN109492615B (zh) * 2018-11-29 2021-03-26 中山大学 基于cnn低层语义特征密度图的人群密度估计方法
CN109614941B (zh) * 2018-12-14 2023-02-03 中山大学 一种基于卷积神经网络模型的嵌入式人群密度估计方法
CN109948553B (zh) * 2019-03-20 2020-07-24 北京航空航天大学 一种多尺度密集人群计数方法
CN110188776A (zh) * 2019-05-30 2019-08-30 京东方科技集团股份有限公司 图像处理方法及装置、神经网络的训练方法、存储介质
CN110866453B (zh) * 2019-10-22 2023-05-02 同济大学 基于卷积神经网络的实时人群稳定状态识别方法及装置
CN110991225A (zh) * 2019-10-22 2020-04-10 同济大学 基于多列卷积神经网络的人群计数与密度估计方法及装置
CN111091068B (zh) * 2019-11-26 2021-07-20 重庆紫光华山智安科技有限公司 一种密度估计模型训练方法、装置、存储介质及电子设备
US11393182B2 (en) 2020-05-29 2022-07-19 X Development Llc Data band selection using machine learning
CN111832413B (zh) * 2020-06-09 2021-04-02 天津大学 基于时空多尺度网络的人流密度图估计、定位和跟踪方法
US11651602B1 (en) 2020-09-30 2023-05-16 X Development Llc Machine learning classification based on separate processing of multiple views
CN113128116B (zh) 2021-04-20 2023-09-26 上海科技大学 可用于轻量级神经网络的纯整型量化方法
CN113326925B (zh) * 2021-06-22 2023-11-28 华南农业大学 基于密度图回归的卷积神经网络的花量统计方法、系统、设备及介质
CN113468995A (zh) * 2021-06-22 2021-10-01 之江实验室 一种基于密度等级感知的人群计数方法
CN113392817A (zh) * 2021-08-16 2021-09-14 成都信息工程大学 一种基于多列卷积神经网络的车辆密度估计的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077613A (zh) * 2014-07-16 2014-10-01 电子科技大学 一种基于级联多级卷积神经网络的人群密度估计方法
CN104166861A (zh) * 2014-08-11 2014-11-26 叶茂 一种行人检测方法
CN104992223A (zh) * 2015-06-12 2015-10-21 安徽大学 基于深度学习的密集人数估计方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8195598B2 (en) * 2007-11-16 2012-06-05 Agilence, Inc. Method of and system for hierarchical human/crowd behavior detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077613A (zh) * 2014-07-16 2014-10-01 电子科技大学 一种基于级联多级卷积神经网络的人群密度估计方法
CN104166861A (zh) * 2014-08-11 2014-11-26 叶茂 一种行人检测方法
CN104992223A (zh) * 2015-06-12 2015-10-21 安徽大学 基于深度学习的密集人数估计方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Cross-scene crowd counting via deep convolutional neural networks;Cong Zhang等;《2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)》;20150612;第833-841页

Also Published As

Publication number Publication date
CN105528589A (zh) 2016-04-27

Similar Documents

Publication Publication Date Title
CN105528589B (zh) 基于多列卷积神经网络的单张图像人群计数算法
CN109101930B (zh) 一种人群计数方法及系统
CN104881681B (zh) 基于混合图模型的图像序列类别标注方法
CN108921822A (zh) 基于卷积神经网络的图像目标计数方法
CN107103613B (zh) 一种三维手势姿态估计方法
WO2021057027A1 (zh) 人体检测方法、装置、计算机设备及存储介质
CN108681692B (zh) 一种基于深度学习的遥感图像内新增建筑识别方法
CN108960404B (zh) 一种基于图像的人群计数方法及设备
CN107330453B (zh) 基于分步识别和融合关键部位检测的色情图像识别方法
CN104392228B (zh) 基于条件随机场模型的无人机图像目标类检测方法
WO2019210555A1 (zh) 一种基于深度神经网络的人数统计方法及装置、存储介质
CN108549891A (zh) 基于背景与目标先验的多尺度扩散显著目标检测方法
CN107679503A (zh) 一种基于深度学习的人群计数算法
CN109360171A (zh) 一种基于神经网络的视频图像实时去模糊方法
CN107862261A (zh) 基于多尺度卷积神经网络的图像人群计数方法
CN108510535A (zh) 一种基于深度预测和增强子网络的高质量深度估计方法
CN107563446A (zh) 一种微操作系统目标检测方法
CN110674704A (zh) 一种基于多尺度扩张卷积网络的人群密度估计方法及装置
CN105279769B (zh) 一种联合多特征的层次粒子滤波跟踪方法
CN108960069A (zh) 一种用于单阶段物体检测器的增强上下文的方法
CN107146229B (zh) 基于元胞自动机模型的结肠息肉图像分割方法
CN110728324A (zh) 基于深度复值全卷积神经网络的极化sar图像分类方法
CN109035292A (zh) 基于深度学习的运动目标检测方法及装置
CN106780546A (zh) 基于卷积神经网络的运动模糊编码点的身份识别方法
CN109859101A (zh) 农作物冠层热红外图像识别方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant