CN109948553B - 一种多尺度密集人群计数方法 - Google Patents

一种多尺度密集人群计数方法 Download PDF

Info

Publication number
CN109948553B
CN109948553B CN201910214205.2A CN201910214205A CN109948553B CN 109948553 B CN109948553 B CN 109948553B CN 201910214205 A CN201910214205 A CN 201910214205A CN 109948553 B CN109948553 B CN 109948553B
Authority
CN
China
Prior art keywords
crowd
convolution
feature
feature map
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910214205.2A
Other languages
English (en)
Other versions
CN109948553A (zh
Inventor
曹先彬
罗晓燕
张安然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201910214205.2A priority Critical patent/CN109948553B/zh
Publication of CN109948553A publication Critical patent/CN109948553A/zh
Application granted granted Critical
Publication of CN109948553B publication Critical patent/CN109948553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种多尺度密集人群计数方法,属于航空监视领域。首先采集密集场景的数据,标记人群图像并进行预处理作为训练图片,然后训练图片分别依次通过卷积操作和多级池化模块得到各图片对应的融合多尺度信息的特征图。使用卷积核为1×1步长为1的卷积层分别对每张特征图进行定位信息加强,得到各自对应的定位信息加强的特征图。将每张定位信息加强的特征图重复使用卷积操作和多级池化模块后进行融合,再次定位信息加强,获得最终的特征图,进行解码,使用双线性插值法逐步恢复空间分辨率,得到各自最终的人群密度图。利用每张人群密度图中的像素值进行积分求和,得到最终的人数。本发明提高了计数精度,对监控场景有更好的认知能力。

Description

一种多尺度密集人群计数方法
技术领域
本发明属于航空监视领域,具体是一种多尺度密集人群计数方法。
背景技术
随着世界人口的指数增长和由此产生的城市化,导致近年来人群聚集更加频繁,在这种情况下,为了更好的管理人口、保障人口的安全,必须分析人群行为。密集人群计数是指计算拥挤场景中的人数,是将一个输入的人流图像映射到相应的密度图上,它对于在拥挤的场景中建立更高层次的认知能力至关重要。
然而,由于密集人群场景中人群密度高,由此造成了严重的遮挡以及目标尺度不一致的问题。人工的密集人群计数方法费时费力。因此,有人提出,通过无人机实现基于空基的自主监视,通过空基视角俯拍的图像来分析密集人群场景中的人群密度。
无人机可通过携带的摄像头采集人群的图像数据,并运用计算机视觉的技术进行智能分析与处理,从而统计场景人群数量与其密度分布,对于安全监测、突发情况预警以及情报分析等多类任务均有不可估量的作用。
由于无人机拍摄角度和飞行高度不同,采集的密集人群的图片数据具有多尺度和多视角问题,造成计数困难。
发明内容
本发明提出一种多尺度密集人群计数方法,解决多尺度问题的同时能对人群位置进行更精确地定位,从而实现效果良好的空基人群计数与密度估计;对于安全监测、突发情况预警以及情报分析等应用有重大意义。
具体步骤包括:
步骤一、无人机采集密集场景的数据,标记人群图像并进行预处理作为训练图片。
数据包括人群和周边场景;将图片中的人群分割出来作为图像数据。
通过预处理对原始的图像数据集进行人工扩充,具体包括旋转变换和随机裁剪。
旋转变换是:依次对每张原始图像,随机旋转一定角度,同时保留旋转前和旋转后的图片,将原始数据集扩大2倍。
随机裁剪是:对旋转变换后的图片数据,每张都进行随机裁剪,将裁剪后的所有图片作为训练图片。
步骤二、针对每张训练图片,分别依次通过卷积操作和多级池化模块逐步降低空间分辨率,得到各图片对应的融合多尺度信息的特征图。
首先,将当前的训练图片分别输入3个不同卷积核中,得到各自对应的卷积特征图;
三个卷积核的大小分别为:3×3,5×5,7×7。
然后,针对不同的卷积特征图,采用不同的池化尺度进行池化;
针对3×3的卷积核,池化后的尺寸为原特征图的1/2;针对5×5的卷积核,池化后的尺寸为原特征图的1/4,针对7×7的卷积核,池化后的尺寸为原特征图的1/8。
进一步,将尺寸为1/4和1/8的特征图分别使用双线性插值的方法扩大成原特征图的1/2尺度;
最后,使用通道拼接法对上述三个均为1/2尺度的特征图进行特征融合,得到当前训练图片对应的融合多尺度信息的特征图。
步骤三、使用卷积核大小为1×1步长为1的卷积层分别对每张融合多尺度信息的特征图进行定位信息加强,得到各自对应的定位信息加强的特征图。
步骤四、返回步骤二,将每张定位信息加强的特征图重复使用卷积操作和多级池化模块后进行融合,再次定位信息加强,获得最终的特征图。
本发明共进行三轮卷积操作和多级池化模块后的融合,以及再次定位信息加强;每进行一轮,特征图变为原图像尺寸的1/2,三轮操作后,每张最终特征图变为原图像尺寸的1/8。
步骤五、对每张最终的特征图分别进行解码,使用双线性插值法逐步恢复空间分辨率,得到各自最终的人群密度图。
具体为:针对当前特征图尺寸仅为输入图像的1/8,使用双线性插值法对特征图的分辨率进行进一步的恢复,得到与原始图像尺寸相同的人群密度图。
步骤六、针对每张与原始图像尺寸相同的人群密度图,利用每张人群密度图中的像素值进行积分求和,得到最终的人数。
本发明的优点在于:
1)、一种多尺度密集人群计数方法,解决了密集人群图片数据的多尺度多视角问题,提高了计数精度。
2)、一种多尺度密集人群计数方法,使用密度图的人群计数方式,对监控场景有更好的认知能力。
3)、一种多尺度密集人群计数方法,使用卷积神经网络,相比较传统方法更加高效。
附图说明
图1为本发明一种多尺度密集人群计数方法的流程图;
图2为本发明得到融合多尺度信息的特征图的原理图。
具体实施方式
为了使本发明能够更加清楚地理解其技术原理,下面结合附图具体、详细地阐述本发明实施例。
现有技术中,由于无人机拍摄角度和飞行高度不同,采集的密集人群的图片数据具有多尺度和多视角问题,造成计数困难。本发明提供了一种多尺度密集人群计数方法,可用于飞行器飞行过程中场景的人群计数,对后续的安全监测、人群管理以及情报分析等任务有重大意义。
首先,标记空基监视的密集人群图像,进行预处理得到训练图片;然后使用多级池化模块降低空间分辨率,得到融合多尺度信息的特征图;再使用固定大小的卷积核对其进行定位信息加强;接着重复使用多级池化模块和固定大小的卷积核操作,获得最终的特征图;最后对每张最终的特征图分别进行解码,使用双线性插值法逐步恢复空间分辨率,得到最终的人群密度图,从而进一步对密集人数进行统计。
如图1所示,具体步骤如下:
步骤一、无人机采集密集场景的数据,标记人群图像并进行预处理作为训练图片。
无人机采集的密集场景的数据通常包括人群和周边场景;为了更好地让网络提取人群信息,首先将图片中的人群分割出来作为训练和测试数据,取80%做训练集,20%做测试集。
对于无人机数据收集的图片具有多尺度和多视角,首先对数据进行预处理,通过预处理对原始的图像数据集进行人工扩充,使训练网络时有更好的效果。
具体包括旋转变换和随机裁剪:
旋转变换是:依次对每张原始图像,随机旋转一定角度,如对图像进行10度顺时针的旋转,同时保留旋转前和旋转后的图片,将原始数据集扩大2倍。数据增强使模型能识别多个角度的图片,增强了模型的能力,减小了模型对图片角度的敏感程度。
随机裁剪是:对旋转变换后的图片数据,每张都进行随机裁剪,将裁剪后的所有图片作为训练图片,增强了数据的多样性。
步骤二、针对每张训练图片,分别依次通过卷积操作和多级池化模块逐步降低空间分辨率,得到各图片对应的融合多尺度信息的特征图。
原理如图2所示,首先,将当前的训练图片分别输入3个不同卷积核中,得到各自对应的卷积特征图;
三个卷积核的大小分别为:3×3,5×5,7×7。
然后,针对不同的卷积特征图,采用不同的池化尺度进行池化;
池化层具有很强的对特征图特征的总结和抽象的能力,多级池化模块采用的是针对不同卷积核的特征图,采用不同的池化尺度,针对3×3的卷积核,池化后的尺寸为原特征图的1/2;针对5×5的卷积核,池化后的尺寸为原特征图的1/4,针对7×7的卷积核,池化后的尺寸为原特征图的1/8。
进一步,将尺寸为1/4和1/8的特征图分别使用双线性插值的方法扩大成原特征图的1/2尺度;
最后,使用通道拼接法对上述三个均为1/2尺度的特征图进行特征融合,得到当前训练图片对应的融合多尺度信息的特征图。
步骤三、使用卷积核大小为1×1步长为1的卷积层分别对每张池化后融合多尺度信息的特征图进行定位信息加强,得到各自对应的定位信息加强的特征图。
1×1的卷积核使用像素级的卷积操作加强了像素点位置的定位信息,最终得到和输入特征图相同尺寸的输出特征图。
步骤四、返回步骤二,将每张定位信息加强的特征图重复使用卷积操作和多级池化模块后进行融合,再次定位信息加强,获得最终的特征图。
本发明共进行三轮卷积操作和多级池化模块后的融合,以及再次定位信息加强;每进行一轮,特征图变为原图像尺寸的1/2,三轮操作后,每张最终特征图变为原图像尺寸的1/8。
步骤五、对每张最终的特征图分别进行解码,使用双线性插值法逐步恢复空间分辨率,得到各自最终的人群密度图。
具体为:针对当前特征图尺寸仅为输入图像的1/8,使用双线性插值法对特征图的分辨率进行进一步的恢复,得到与原始图像尺寸相同的人群密度图。
步骤六、针对每张与原始图像尺寸相同的人群密度图,利用每张人群密度图中的像素值进行积分求和,得到最终的人数。

Claims (1)

1.一种多尺度密集人群计数方法,其特征在于,具体步骤包括:
步骤一、无人机采集密集场景的数据,标记人群图像并进行预处理作为训练图片;
所述的数据包括人群和周边场景;将图片中的人群分割出来作为图像数据;
通过预处理对原始的图像数据集进行人工扩充,具体包括旋转变换和随机裁剪;
旋转变换是:依次对每张原始图像,随机旋转一定角度,同时保留旋转前和旋转后的图片,将原始数据集扩大2倍;
随机裁剪是:对旋转变换后的图片数据,每张都进行随机裁剪,将裁剪后的所有图片作为训练图片;
步骤二、针对每张训练图片,分别依次通过卷积操作和多级池化模块逐步降低空间分辨率,得到各图片对应的融合多尺度信息的特征图;
首先,将当前的训练图片分别输入3个不同卷积核中,得到各自对应的卷积特征图;
三个卷积核的大小分别为:3×3,5×5,7×7;
然后,针对不同的卷积特征图,采用不同的池化尺度进行池化;
针对3×3的卷积核,池化后的尺寸为原特征图的1/2;针对5×5的卷积核,池化后的尺寸为原特征图的1/4,针对7×7的卷积核,池化后的尺寸为原特征图的1/8;
进一步,将尺寸为1/4和1/8的特征图分别使用双线性插值的方法扩大成原特征图的1/2尺度;
最后,使用通道拼接法对上述三个均为1/2尺度的特征图进行特征融合,得到当前训练图片对应的融合多尺度信息的特征图;
步骤三、使用卷积核大小为1×1步长为1的卷积层分别对每张融合多尺度信息的特征图进行定位信息加强,得到各自对应的定位信息加强的特征图;
步骤四、返回步骤二,将每张定位信息加强的特征图重复使用卷积操作和多级池化模块后进行融合,再次定位信息加强,获得最终的特征图;
具体为:进行三轮卷积操作和多级池化模块后的融合,以及再次定位信息加强;每进行一轮,特征图变为原图像尺寸的1/2,三轮操作后,每张最终特征图变为原图像尺寸的1/8;
步骤五、对每张最终的特征图分别进行解码,使用双线性插值法逐步恢复空间分辨率,得到各自最终的人群密度图;
针对当前特征图尺寸仅为输入图像的1/8,使用双线性插值法对特征图的分辨率进行进一步的恢复,得到与原始图像尺寸相同的人群密度图;
步骤六、针对每张与原始图像尺寸相同的人群密度图,利用每张人群密度图中的像素值进行积分求和,得到最终的人数。
CN201910214205.2A 2019-03-20 2019-03-20 一种多尺度密集人群计数方法 Active CN109948553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910214205.2A CN109948553B (zh) 2019-03-20 2019-03-20 一种多尺度密集人群计数方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910214205.2A CN109948553B (zh) 2019-03-20 2019-03-20 一种多尺度密集人群计数方法

Publications (2)

Publication Number Publication Date
CN109948553A CN109948553A (zh) 2019-06-28
CN109948553B true CN109948553B (zh) 2020-07-24

Family

ID=67010346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910214205.2A Active CN109948553B (zh) 2019-03-20 2019-03-20 一种多尺度密集人群计数方法

Country Status (1)

Country Link
CN (1) CN109948553B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110825904B (zh) * 2019-10-24 2022-05-06 腾讯科技(深圳)有限公司 一种图像匹配方法、装置、电子设备和存储介质
CN110837786B (zh) * 2019-10-30 2022-07-08 汇纳科技股份有限公司 基于空间通道的密度图产生方法、装置、电子终端及介质
CN110941999B (zh) * 2019-11-12 2023-02-17 通号通信信息集团有限公司 一种人群计数系统中自适应计算高斯核大小的方法
CN111274900B (zh) * 2020-01-15 2021-01-01 北京航空航天大学 一种基于底层特征提取的空基人群计数方法
CN111429466A (zh) * 2020-03-19 2020-07-17 北京航空航天大学 一种基于多尺度信息融合网络的空基人群计数与密度估计方法
CN111428809B (zh) * 2020-04-02 2023-07-28 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于空间信息融合与卷积神经网络的人群计数方法
CN111488827A (zh) * 2020-04-10 2020-08-04 山东师范大学 一种基于多尺度特征信息的人群计数方法及系统
CN111666830A (zh) * 2020-05-18 2020-09-15 华东师范大学 一种密集人群计数检测框架
CN112991274B (zh) * 2021-02-19 2023-06-30 平安科技(深圳)有限公司 一种人群计数方法、装置、计算机设备及存储介质
CN113011329B (zh) * 2021-03-19 2024-03-12 陕西科技大学 一种基于多尺度特征金字塔网络及密集人群计数方法
CN113221971B (zh) * 2021-04-25 2022-12-27 山东师范大学 一种基于前后特征融合的多尺度人群计数方法及系统
CN113536972B (zh) * 2021-06-28 2023-01-31 华东师范大学 一种基于目标域伪标签的自监督跨域人群计数方法
CN114399728B (zh) * 2021-12-17 2023-12-05 燕山大学 一种雾天场景人群计数方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018157171A2 (en) * 2017-02-27 2018-08-30 Juno Therapeutics, Inc. Compositions, articles of manufacture and methods related to dosing in cell therapy
CN109344736A (zh) * 2018-09-12 2019-02-15 苏州大学 一种基于联合学习的静态图像人群计数方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002335610C1 (en) * 2001-01-29 2008-09-25 Hemogenix, Inc. High-throughput stem cell assay of hematopoietic stem and progenitor cell proliferation
US8094067B2 (en) * 2008-08-12 2012-01-10 Broadcom Corporation Method and system for determining a position of a mobile communication device
CN105528589B (zh) * 2015-12-31 2019-01-01 上海科技大学 基于多列卷积神经网络的单张图像人群计数算法
CN107301387A (zh) * 2017-06-16 2017-10-27 华南理工大学 一种基于深度学习的图像高密度人群计数方法
CN107742099A (zh) * 2017-09-30 2018-02-27 四川云图睿视科技有限公司 一种基于全卷积网络的人群密度估计、人数统计的方法
CN107967451B (zh) * 2017-11-23 2021-04-27 常州大学 一种对静止图像进行人群计数的方法
CN108510504B (zh) * 2018-03-22 2020-09-22 北京航空航天大学 图像分割方法和装置
CN109241895B (zh) * 2018-08-28 2021-06-04 北京航空航天大学 密集人群计数方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018157171A2 (en) * 2017-02-27 2018-08-30 Juno Therapeutics, Inc. Compositions, articles of manufacture and methods related to dosing in cell therapy
CN109344736A (zh) * 2018-09-12 2019-02-15 苏州大学 一种基于联合学习的静态图像人群计数方法

Also Published As

Publication number Publication date
CN109948553A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109948553B (zh) 一种多尺度密集人群计数方法
CN112001339A (zh) 一种基于YOLO v4的行人社交距离实时监测方法
CN108596108B (zh) 基于三元组语义关系学习的航拍遥感图像变化检测方法
CN111832413B (zh) 基于时空多尺度网络的人流密度图估计、定位和跟踪方法
CN110781836A (zh) 人体识别方法、装置、计算机设备及存储介质
EP1462994B1 (en) Method and system for identifying objects in an image
Ringwald et al. UAV-Net: A fast aerial vehicle detector for mobile platforms
CN110659391A (zh) 一种视频侦查方法及装置
CN109859246B (zh) 一种结合相关滤波与视觉显著性的低空慢速无人机跟踪方法
CN109919223B (zh) 基于深度神经网络的目标检测方法及装置
CN112668522B (zh) 一种人体关键点与人体掩码联合检测网络及方法
CN116258817B (zh) 一种基于多视图三维重建的自动驾驶数字孪生场景构建方法和系统
CN115841649A (zh) 一种用于城市复杂场景的多尺度人数统计方法
CN112784724A (zh) 一种车辆变道检测方法、装置、设备及存储介质
CN113139489A (zh) 基于背景提取和多尺度融合网络的人群计数方法及系统
CN111723773A (zh) 遗留物检测方法、装置、电子设备及可读存储介质
CN111445442B (zh) 基于神经网络的人群计数方法、装置、服务器及存储介质
Ghahremannezhad et al. A new adaptive bidirectional region-of-interest detection method for intelligent traffic video analysis
CN111768429A (zh) 一种基于卡尔曼滤波和行人重识别算法的隧道环境下行人目标跟踪方法
CN112907972B (zh) 基于无人机的道路车流量检测方法、系统及计算机可读存储介质
CN111027440A (zh) 一种基于神经网络的人群异常行为检测装置和检测方法
CN111951260B (zh) 基于部分特征融合卷积神经网络实时目标计数系统及方法
CN114169425A (zh) 训练目标跟踪模型和目标跟踪的方法和装置
CN113052139A (zh) 一种基于深度学习双流网络的攀爬行为检测方法及系统
Pillai et al. Fine-Tuned EfficientNetB4 Transfer Learning Model for Weather Classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant