CN108563975A - 一种基于深度学习的高密度人群人数估计方法 - Google Patents

一种基于深度学习的高密度人群人数估计方法 Download PDF

Info

Publication number
CN108563975A
CN108563975A CN201710800943.6A CN201710800943A CN108563975A CN 108563975 A CN108563975 A CN 108563975A CN 201710800943 A CN201710800943 A CN 201710800943A CN 108563975 A CN108563975 A CN 108563975A
Authority
CN
China
Prior art keywords
image
heating power
crowd
model
head
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710800943.6A
Other languages
English (en)
Other versions
CN108563975B (zh
Inventor
厉紫阳
沈徐兰
冯卢梦
周红晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Handing You Yu Internet Ltd By Share Ltd
Original Assignee
Handing You Yu Internet Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Handing You Yu Internet Ltd By Share Ltd filed Critical Handing You Yu Internet Ltd By Share Ltd
Publication of CN108563975A publication Critical patent/CN108563975A/zh
Application granted granted Critical
Publication of CN108563975B publication Critical patent/CN108563975B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30242Counting objects in image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的高密度人群人数估计方法。本发明用混合高斯模型的方法提取视频的前景和背景图像,并进行预处理操作;采集热成像图,使用热成像仪获取该前景图像所对应的RGB热力图像。然后提取该热力图像中所有R通道的值,生成一个热力矩阵;采集灰度图像;训练一个卷积神经网络模型;用训练之后的人群估算模型对步骤4中的人口热力矩阵进行测试,得出模型反馈的结果,最终得出估算的人群数量。本发明综合考虑了人数较少场景和人数较多场景,设计出了使用热力图和灰度图生成热度矢量矩阵,并根据训练好的卷积神经网络模型代入计算,最终估计出人群人数的方法。本发明在各种场景中均具有比较高的估计精度。

Description

一种基于深度学习的高密度人群人数估计方法
技术领域
本发明属于视频人群分析领域,具体涉及一种基于深度学习的高密度人群人数估计方法。
背景技术
人群密度是人群拥塞场景的一项重要参数,也是衡量拥塞场景的可控性和安全性的重要指标。人群密度可以用来预测潜在的风险和阻止突发的灾难性事件。最常规的人群密度统计基于人工统计,效率低下。现在国内外已有的人群人数估计算法主要是基于像素、基于纹理和基于特征点。但是基于像素特征点的方法不适用于人数密集的场景图像,而基于纹理的方法又不适用于人数稀疏的场景,有些方法结合这两者进行分步处理,但是效果仍然太差,误差严重。
发明内容
本发明针对现有技术的不足,提供了一种基于深度学习的高密度人群人数估计方法。
本发明方法具体包括以下步骤:
步骤1、采集视频:
1-1.用混合高斯模型的方法提取视频的前景图像。
1-2.对提取的前景图像进行预处理操作,包括中值滤波去噪、形态学等。
步骤2、采集热成像图:
2-1.使用热成像仪获取该前景图像所对应的RGB热力图像。
2-2.提取该热力图像中所有R通道的值,生成一个热力矩阵;
步骤3、采集灰度图像,采用方法如下:
基于步骤1中获得的前景图像,对原图像中对应前景区域采用较为成熟的基于HaarLike特征的Adaboost分类器算法,对头部进行检测。
3-1.设置头部识别器的识别范围。
本发明中使用的识别器的原始尺寸为10*10。在检测过程中通过逐级放大识别器以实现不同尺寸头部检测(检测头部尺寸范围为10*10- 28*28)。
3-2.图像预处理。
将图像转换为灰度图像。
3-3.进行头部检测。
为了能够检测不同尺度的头部,将分类器以设定的比例逐级放大后遍历检测区域。用放大后的分类器以步长2在检测区域图像中遍历检测。将图像中检测到的头部区域内的像素标记为255,身体其余部分像素标记为0。将处理后的前景图像与混合高斯模型中提取的背景图像做背景差,提取出背景差后的前景图像。将图像中检测到的头部区域内的像素标记为255,身体其余部分像素标记为0。这样我们就得到了仅含有头部图像的二值化灰度图。
步骤4、将步骤3获取的灰度图像转化为二值化灰度矩阵,并且将所有值为255的像素点全部替换为热力矩阵中所对应的值,生成一个人口热度矩阵。
步骤5、训练一个卷积神经网络模型:图像中区域所能容纳的最大人数为N。根据步骤2、3和4构建众多带有人工标注的人数标签的人口热度矩阵,并且按照如下公式重置标签值:
tag_ratio=tag_nums/N
式中,tag_nums代表该人口热度矩阵所对应的人数,N代表该拍摄区域所能容纳的总人数。而tag_ratio则代表这个人口热度矩阵的当前标签,是一个浮点数类型,其范围区间为[0,1]。
在caffe框架下用卷积神经网络模型对这些带有标签的人口热度矩阵数据集进行回归训练,并且选取一个拟合度较高的模型作为人群估算模型(Model)。
步骤6、用训练之后的人群估算模型对步骤4中的人口热力矩阵进行测试,得出模型反馈的结果,最终得出估算的人群数量。
本发明的有益效果:
本发明针对传统的一些人群估算方法所存在的一些缺陷,综合考虑了人数较少场景和人数较多场景,设计出了使用热力图和灰度图生成热度矢量矩阵,并根据训练好的卷积神经网络模型代入计算,最终估计出人群人数的方法。本发明在各种场景中均具有比较高的估计精度。
附图说明
图1为本发明方法流程图。
具体实施方式
以下结合附图对本发明作进一步说明。
如图1所示,本发明人群人数估计方法,包括以下步骤:
1、采集视频,用混合高斯模型的方法提取视频的前景和背景图像。然后对提取的前图像进行预处理操作,包括中值滤波去噪、形态学等。
2、采集热成像图,使用热成像仪获取该前景图像所对应的RGB热力图像。然后提取该热力图像中所有R通道的值,生成一个热力矩阵。使用热力矩阵目的是对于不同区域的不同人群密度需要区别对待,而这边R通道的值正好完美的代表了这个因素。
3、采集灰度图像,采用方法如下:
基于1中获得的前景图像,对原图像中对应前景区域采用较为成熟的基于HaarLike特征的Adaboost分类器算法,对人的头部进行检测。
首先分类器设置。载入分类器,本发明中使用的分类器的原始尺寸为 10*10。在检测过程中通过逐级放大分类器实现不同尺寸头部检测(检测头部尺寸范围为10*10-28*28)。
然后图像预处理。将图像转换为灰度图像。
最后进行头部检测:为了能够检测不同尺度的头部,将分类器以设定的比例逐级放大后遍历检测区域。用放大后的分类器以步长2在检测区域图像中遍历检测。将图像中检测到的头部区域内的像素标记为255,身体其余部分像素标记为0。将处理后的前景图像与混合高斯模型中提取的背景图像做背景差,提取出背景差后的前景图像。将图像中检测到的头部区域内的像素标记为255,身体其余部分像素标记为0。这样我们就得到了仅含有头部图像的二值化灰度图。
4、将3中的灰度图像转化为二值化灰度矩阵(元素值为0或者255),并且将所有的值为255的像素点全部替换为热力矩阵中所对应的值,生成一个人口热度矩阵。
5、使用Caffe框架来训练一个卷积神经网络模型:图像中区域所能容纳的最大人数为N。按照之前2,3,4步骤我们可以构建一万个带有人工标注的人数标签的人口热度矩阵,并且我们按照如下公式重置标签值:
tag_ratio=tag_nums/N
式中,tag_nums代表该热度矩阵所对用的人数,N代表该拍摄区域所能容纳的总人数。而tag_ratio则代表这个人口热度矩阵的当前标签,是一个浮点数类型,其范围区间为[0,1]。
之后我们将该带有标签的人口热度矩阵数据集按照4:1的比例划分为8000 张训练集和2000张测试集,然后在caffe框架下用卷积神经网络架构对其进行回归训练。Caffe架构下内置的EuclideanLossLayer可以直接用来进行回归校验。当迭代次数达到一定数量级之后,模型会趋于拟合。我们选取一个拟合度较高的模型作为我们的人群估算模型(Model)。
6、用训练之后高拟合度模型对4步骤中的人口热力矩阵进行测试,我们可以得出模型反馈的结果tag_ratio,然后我们使用N*tag_ratio便可以得出估算的人群数量。
通过以上步骤可以得出较为准确的人群人数。

Claims (1)

1.一种基于深度学习的高密度人群人数估计方法,其特征在于包括如下步骤:
步骤1、采集视频:
1-1.用混合高斯模型的方法提取视频的前景图像;
1-2.对提取的前景图像进行预处理操作,包括中值滤波去噪、形态学等;
步骤2、采集热成像图:
2-1.使用热成像仪获取该前景图像所对应的RGB热力图像;
2-2.提取该热力图像中所有R通道的值,生成一个热力矩阵;
步骤3、采集灰度图像,采用方法如下:
基于步骤1中获得的前景图像,对原图像中对应前景区域采用较为成熟的基于HaarLike特征的Adaboost分类器算法,对头部进行检测;
3-1.设置头部识别器的识别范围;
使用的识别器的原始尺寸为10*10;在检测过程中通过逐级放大识别器以实现不同尺寸头部检测,检测头部尺寸范围为10*10-28*28;
3-2.图像预处理;
将图像转换为灰度图像;
3-3.进行头部检测;
为了能够检测不同尺度的头部,将分类器以设定的比例逐级放大后遍历检测区域;用放大后的分类器以步长2在检测区域图像中遍历检测;将图像中检测到的头部区域内的像素标记为255,身体其余部分像素标记为0;将处理后的前景图像与混合高斯模型中提取的背景图像做背景差,提取出背景差后的前景图像;将图像中检测到的头部区域内的像素标记为255,身体其余部分像素标记为0;从而得到了仅含有头部图像的二值化灰度图;
步骤4、将步骤3获取的灰度图像转化为二值化灰度矩阵,并且将所有值为255的像素点全部替换为热力矩阵中所对应的值,生成一个人口热度矩阵;
步骤5、训练一个卷积神经网络模型:
图像中区域所能容纳的最大人数为N;根据步骤2、3和4构建众多带有确定人口数量的人口热度矩阵,并且按照如下公式重置标签值:
tag_ratio=tag_nums/N
式中,tag_nums代表该人口热度矩阵所对应的人数,N代表该拍摄区域所能容纳的总人数;而tag_ratio则代表这个人口热度矩阵的当前标签,是一个浮点数类型,其范围区间为[0,1];
在caffe框架下用卷积神经网络模型对这些带有标签的人口热度矩阵数据集进行回归训练,并且选取一个拟合度较高的模型作为人群估算模型;
步骤6、用训练之后的人群估算模型对步骤4中的人口热力矩阵进行测试,得出模型反馈的结果,最终得出估算的人群数量。
CN201710800943.6A 2017-07-31 2017-09-07 一种基于深度学习的高密度人群人数估计方法 Active CN108563975B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2017106389572 2017-07-31
CN201710638957 2017-07-31

Publications (2)

Publication Number Publication Date
CN108563975A true CN108563975A (zh) 2018-09-21
CN108563975B CN108563975B (zh) 2021-06-25

Family

ID=63529221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710800943.6A Active CN108563975B (zh) 2017-07-31 2017-09-07 一种基于深度学习的高密度人群人数估计方法

Country Status (1)

Country Link
CN (1) CN108563975B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961060A (zh) * 2019-04-11 2019-07-02 北京百度网讯科技有限公司 用于生成人群密度信息的方法和装置
CN110674729A (zh) * 2019-09-20 2020-01-10 澳门理工学院 基于热能估算的人数识别方法、计算机装置及计算机可读存储介质
CN110705394A (zh) * 2019-09-18 2020-01-17 广东外语外贸大学南国商学院 一种基于卷积神经网络的景区人群行为分析方法
CN111091516A (zh) * 2019-12-24 2020-05-01 广州柏视医疗科技有限公司 一种基于人工智能的抗散射光栅方法及装置
CN111860392A (zh) * 2020-07-28 2020-10-30 珠海安联锐视科技股份有限公司 基于目标检测和前景检测热力图统计方法
CN111933274A (zh) * 2020-07-15 2020-11-13 平安科技(深圳)有限公司 疾病分类诊断方法、装置、电子设备及存储介质
CN114255203A (zh) * 2020-09-22 2022-03-29 中国农业大学 一种鱼苗数量估计方法及系统
CN115083112A (zh) * 2022-08-22 2022-09-20 枫树谷(成都)科技有限责任公司 一种智能预警应急管理系统及其部署方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070031005A1 (en) * 2000-09-06 2007-02-08 Nikos Paragios Real-time crowd density estimation from video
CN102982341A (zh) * 2012-11-01 2013-03-20 南京师范大学 一种可跨摄像机的自适应人群密度估计方法
CN105447458A (zh) * 2015-11-17 2016-03-30 深圳市商汤科技有限公司 一种大规模人群视频分析系统和方法
CN105574501A (zh) * 2015-12-15 2016-05-11 上海微桥电子科技有限公司 一种人流视频侦测分析系统
CN106205126A (zh) * 2016-08-12 2016-12-07 北京航空航天大学 基于卷积神经网络的大规模交通网络拥堵预测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070031005A1 (en) * 2000-09-06 2007-02-08 Nikos Paragios Real-time crowd density estimation from video
CN102982341A (zh) * 2012-11-01 2013-03-20 南京师范大学 一种可跨摄像机的自适应人群密度估计方法
CN105447458A (zh) * 2015-11-17 2016-03-30 深圳市商汤科技有限公司 一种大规模人群视频分析系统和方法
CN105574501A (zh) * 2015-12-15 2016-05-11 上海微桥电子科技有限公司 一种人流视频侦测分析系统
CN106205126A (zh) * 2016-08-12 2016-12-07 北京航空航天大学 基于卷积神经网络的大规模交通网络拥堵预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐清: "《基于模糊神经网络的大场景人群密度估计方法》", 《计算机应用研究》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961060A (zh) * 2019-04-11 2019-07-02 北京百度网讯科技有限公司 用于生成人群密度信息的方法和装置
CN110705394A (zh) * 2019-09-18 2020-01-17 广东外语外贸大学南国商学院 一种基于卷积神经网络的景区人群行为分析方法
CN110705394B (zh) * 2019-09-18 2022-11-18 广东外语外贸大学南国商学院 一种基于卷积神经网络的景区人群行为分析方法
CN110674729A (zh) * 2019-09-20 2020-01-10 澳门理工学院 基于热能估算的人数识别方法、计算机装置及计算机可读存储介质
CN111091516A (zh) * 2019-12-24 2020-05-01 广州柏视医疗科技有限公司 一种基于人工智能的抗散射光栅方法及装置
CN111933274A (zh) * 2020-07-15 2020-11-13 平安科技(深圳)有限公司 疾病分类诊断方法、装置、电子设备及存储介质
CN111860392A (zh) * 2020-07-28 2020-10-30 珠海安联锐视科技股份有限公司 基于目标检测和前景检测热力图统计方法
CN111860392B (zh) * 2020-07-28 2021-04-20 珠海安联锐视科技股份有限公司 基于目标检测和前景检测热力图统计方法
CN114255203A (zh) * 2020-09-22 2022-03-29 中国农业大学 一种鱼苗数量估计方法及系统
CN114255203B (zh) * 2020-09-22 2024-04-09 中国农业大学 一种鱼苗数量估计方法及系统
CN115083112A (zh) * 2022-08-22 2022-09-20 枫树谷(成都)科技有限责任公司 一种智能预警应急管理系统及其部署方法

Also Published As

Publication number Publication date
CN108563975B (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN108563975A (zh) 一种基于深度学习的高密度人群人数估计方法
CN105809693B (zh) 基于深度神经网络的sar图像配准方法
CN110929566B (zh) 基于可见光和近红外双目摄像头的人脸活体检测方法
CN104992223B (zh) 基于深度学习的密集人数估计方法
CN111738942A (zh) 一种融合特征金字塔的生成对抗网络图像去雾方法
CN105404894B (zh) 无人机用目标追踪方法及其装置
CN110378232B (zh) 改进的ssd双网络的考场考生位置快速检测方法
CN104834915B (zh) 一种复杂云天背景下小红外目标检测方法
CN111242123A (zh) 一种基于红外图像的电力设备故障诊断方法
CN110349117A (zh) 一种红外图像与可见光图像融合方法、装置及存储介质
Kipli et al. Performance of Levenberg-Marquardt backpropagation for full reference hybrid image quality metrics
CN103729462B (zh) 一种基于稀疏表示处理遮挡的行人检索方法
CN105574515A (zh) 一种无重叠视域下的行人再识别方法
CN108428231A (zh) 一种基于随机森林的多参数零件表面粗糙度学习方法
CN102567738B (zh) 基于高斯分布的色情视频快速检测方法
CN106951863B (zh) 一种基于随机森林的变电站设备红外图像变化检测方法
CN110503623A (zh) 一种基于卷积神经网络的识别输电线路上鸟巢缺陷的方法
CN108900864A (zh) 基于运动轨迹的全参考视频质量评价方法
CN108830856A (zh) 一种基于时间序列sd-oct视网膜图像的ga自动分割方法
CN104268888A (zh) 一种图像模糊检测方法
Sarino et al. Classification of coffee bean degree of roast using image processing and neural network
CN108764264A (zh) 烟雾检测方法、烟雾检测系统及计算机装置
Zhang et al. Multispectral heterogeneity detection based on frame accumulation and deep learning
CN105139373B (zh) 基于独立子空间分析的无参考图像质量客观评价方法
CN104050678A (zh) 水下监测彩色图像质量测量方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 1101, South Building, Handing International Building, No. 5 Yongfuqiao Road, Xiacheng District, Hangzhou City, Zhejiang Province

Applicant after: Handing you Yu Internet Limited by Share Ltd

Address before: 310027 Room 1119, Yuantong Building, 511 Yan'an Road, Hangzhou City, Zhejiang Province

Applicant before: Handing you Yu Internet Limited by Share Ltd

CB02 Change of applicant information
CB02 Change of applicant information

Address after: Floor 17, building 6, jinjingwan business operation center, Pingtan Comprehensive Experimental Zone, Fuzhou City, Fujian Province 350400

Applicant after: Straits innovation Internet Co.,Ltd.

Address before: Room 1101, South Building, Handing International Building, No. 5 Yongfuqiao Road, Xiacheng District, Hangzhou City, Zhejiang Province

Applicant before: HAKIM UNIQUE INTERNET Co.,Ltd.

GR01 Patent grant
GR01 Patent grant