CN110084155A - 一种密集人数计数的方法、装置、设备以及存储介质 - Google Patents

一种密集人数计数的方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN110084155A
CN110084155A CN201910294403.4A CN201910294403A CN110084155A CN 110084155 A CN110084155 A CN 110084155A CN 201910294403 A CN201910294403 A CN 201910294403A CN 110084155 A CN110084155 A CN 110084155A
Authority
CN
China
Prior art keywords
image
neural networks
convolutional neural
residual
crowd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910294403.4A
Other languages
English (en)
Other versions
CN110084155B (zh
Inventor
张莉
陆金刚
王邦军
周伟达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201910294403.4A priority Critical patent/CN110084155B/zh
Publication of CN110084155A publication Critical patent/CN110084155A/zh
Application granted granted Critical
Publication of CN110084155B publication Critical patent/CN110084155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种密集人群计数的方法、装置、设备以及计算机可读存储介质,包括:将待测试图像输入预先完成训练的目标残差多尺度卷积神经网络,其中,所述目标残差多尺度卷积神经网络中的两个预选卷积层之间设有残差单元;利用所述目标残差多尺度卷积神经网络对所述待测试图像进行处理,得到所述待测试图像的估计密度图并输出;依据所述目标估计密度图,确定所述待测试图像中的人数。本发明所提供的方法、装置、设备以及计算机可读存储介质,利用残差单元有效解决了网络的退化问题,从而有效降低了密级人群计数的误差。

Description

一种密集人数计数的方法、装置、设备以及存储介质
技术领域
本发明涉及图像处理技术领域,特别是涉及一种密级人数计数的 方法、装置、设备以及计算机可读存储介质。
背景技术
计算机视觉中的人群计数任务就是自动估算图像或视频中的人 数。为了在诸如公众集会和体育赛事等许多场景中帮助控制人群数量 和公共安全,准确的人群计数显得越来越重要。传统的密集人群计数 方法包括两种:基于检测的方法和基于回归的方法。但是基于检测的 方法会受到人群遮挡的影响,而基于回归的方法往往会受到视角和尺 度急剧变化的影响。针对以上两种传统方法的不足,基于深度学习卷 积神经网络的方法被用于密集人群图像的估计中。
目前主流的估计方法采用了密度图的思想,即设计一个神经网 络,网络的输入为原始图像,而输出为人群的密度图。这类方法对密 集人群图像处理的第一步,就是要通过一个高斯滤波器,根据图像的 真实值ground-truth得到图像对应的密度图。Zhang等人在“Crowd counting via scale-adaptive convolutional neural network”中提出了一个多尺度卷积神经网络(SaCNN)。多尺度卷积神经网络以VGG16网络 框架为主干,并且在此基础上,引入了多尺度的思想,即将分辨率相 同、尺度不同的特征图在通道数上进行串联。该方法明显改善了以上 两种传统方法的问题。然而,由于网络层数偏多,在训练时可能会引起退化问题,即在反向传播时会出现梯度消失或者爆炸,进而导致效 果不佳。
综上所述可以看出,如何使多层数的卷积神经网络在训练时不引 起退化问题是目前有待解决的问题。
发明内容
本发明的目的是提供一种密集人群计数的方法、装置、设备以及 计算机可读存储介质,以便解决现有技术中多层数的卷积神经网络在 训练时会引起退化问题的问题。
为解决上述技术问题,本发明提供一种密集人群计数的方法,包 括:将待测试图像输入预先完成训练的目标残差多尺度卷积神经网络, 其中,所述目标残差多尺度卷积神经网络中的两个预选卷积层之间设 有残差单元;利用所述目标残差多尺度卷积神经网络对所述待测试图 像进行处理,得到所述待测试图像的估计密度图并输出;依据所述目 标估计密度图,确定所述待测试图像中的人数。
优选地,还包括:
获取预先构建的人群图像数据集,其中,所述人群图像数据集包 括i张人群图像,与每张人群图像分别对应的人头坐标点图;
利用高斯滤波器对所述每张人群图像进行滤波处理后,利用所述 每张人群图像的初始化为零矩阵的密度图和所述每张人群图像的人头 中心坐标,确定所述每张人群图像的真实密度图;
利用所述每张人群图像和所述每张人群图像的人的真实密度图, 构建目标训练集;
在多尺度卷积神经网络的两个预设卷积层之间添加所述残差单 元,得到初始残差多尺度卷积神经网络模型;
利用所述目标训练集对所述初始残差多尺度卷积神经网络模型 进行训练,得到完成训练后的目标残差多尺度卷积神经网络。
优选地,所述在多尺度卷积神经网络的两个预设卷积层之间添加 所述残差单元,得到初始残差多尺度卷积神经网络模型包括:
在所述多尺度卷积神经网络的第五卷积层和第六卷积层之间添 加一个所述残差单元,得到初始残差尺度卷积神经网络。
优选地,所述初始残差尺度卷积神经网络的网络结构包括:
第一卷积层,第二卷积层,第三卷积层,第四卷积层,第五卷积 层,第六卷积层,反卷积层,第七卷积层,第八卷积层和第九卷积层;
其中,所述第一卷积层、所述第二卷积层、所述第三卷积层和所 述第四卷积层均采用VGG16网络结构;
所述第一卷积层至所述第五卷积层之间均采用2×2区域,步长为2的最大池化,激活函数采用ReLU函数;
所述第五卷积层和所述第六卷积层之间采用3×3区域,步长为1 的最大池化;
所述第五卷积层输出的特征图和所述第六卷积层输出的特征图 在通道上串联;
所述第五卷积层和所述第六卷积层之间设有所述残差单元;
所述第四卷积层输出的特征图和所述反卷积层采用得到的特征 图在通道上串联;
所述第九卷积层的卷积核为1×1,并将所述第九卷积层输出的特 征图作为所述初始残差尺度卷积神经网络的网络输出。
优选地,所述依据所述目标估计密度图,确定所述待测试图像中 的人数包括:
根据所述目标估计密度图中所有像素值的和,确定所述待测试图 像中的人数。
本发明还提供了一种密集人群计数的装置,包括:
输入模块,用于将待测试图像输入预先完成训练的目标残差多尺 度卷积神经网络,其中,所述目标残差多尺度卷积神经网络中的两个 预选卷积层之间设有残差单元;
输出模块,利用所述目标残差多尺度卷积神经网络对所述待测试 图像进行处理,得到所述待测试图像的估计密度图并输出;
确定模块,用于依据所述目标估计密度图,确定所述待测试图像 中的人数。
优选地,还包括:训练模块,用于获取预先构建的人群图像数据 集,其中,所述人群图像数据集包括i张人群图像,与每张人群图像 分别对应的人头坐标点图;
利用高斯滤波器对所述每张人群图像进行滤波处理后,利用所述 每张人群图像的初始化为零矩阵的密度图和所述每张人群图像的人头 中心坐标,确定所述每张人群图像的真实密度图;
利用所述每张人群图像和所述每张人群图像的人的真实密度图, 构建目标训练集;
在多尺度卷积神经网络的两个预设卷积层之间添加所述残差单 元,得到初始残差多尺度卷积神经网络模型;
利用所述目标训练集对所述初始残差多尺度卷积神经网络模型 进行训练,得到完成训练后的目标残差多尺度卷积神经网络。
优选地,所述确定模块具体用于:
根据所述目标估计密度图中所有像素值的和,确定所述待测试图 像中的人数。
本发明还提供了一种密集人群计数的设备,包括:
存储器,用于存储计算机程序;处理器,用于执行所述计算机程 序时实现上述一种密集人群计数的方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储 介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述 一种密集人群计数的方法的步骤。
本发明所提供的密集人群计数的方法,将待测试图像输入至预先 完成训练的目标残差多尺度卷积神经网络中,利用所述目标残差多尺 度卷积神经网络对所述待测试图像进行处理,得到所述待测试图像的 目标估计密度图,并将所述目标估计密度图输出。根据所述目标估计 密度图,确定所述待测试图像中的人数。本发明所提供的目标残差多 尺度卷积神经网络中存在最优化网络层和冗余层,通过残差单元使冗 余层网络恒等映射上一层的输入,从而使有冗余层的网络效果和没有 冗余层的网络效果相同,有效解决了网络的退化问题,从而有效降低 了密级人群计数的误差。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将 对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易 见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普 通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附 图获得其他的附图。
图1为本发明所提供的密集人群计数的方法的第一种具体实施例 的流程图;
图2为本发明所提供的密集人群计数的方法的第二种具体实施例 的流程图;
图3为残差单元的结构示意图;
图4为本发明所提供的初始残差多尺度卷积神经网络的网络结构 示意图;
图5为本发明实施例提供的一种密集人群计数的装置的结构框 图。
具体实施方式
本发明的核心是提供一种密集人群计数的方法、装置、设备以及 计算机可读存储介质,利用残差单元有效解决了网络的退化问题,从 而提高了密级人群计数的准确性。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图 和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施 例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中 的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得 的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的密集人群计数的方法的第一 种具体实施例的流程图;具体操作步骤如下:
步骤S101:将待测试图像输入预先完成训练的目标残差多尺度卷 积神经网络,其中,所述目标残差多尺度卷积神经网络中的两个预选 卷积层之间设有残差单元;
对所述目标残差多尺度卷积神经网络的训练过程包括:
获取预先采集的人群图像数据集其中,Xi为所述人 群图像数据集的大小为m*n的第i张图像,Yi为所述第i张图像对应的 大小为m*n的人头坐标点图,N为所述人群图像数据集中图像总数。
利用高斯滤波器G对所述人群图像数据集中的每幅 图像Xi进行滤波处理后,利用所述每幅图像Xi的初始化为零矩阵的密 度图Mi和人头中心坐标,确定所述每幅图像Xi的真实密度图M'i。当所 述高斯滤波器的大小为k×k,k一般为奇数,将所述高斯滤波器G和 初始化为零矩阵的密度图Mi在以人头坐标为中心的k×k的区域直接 按像素值相加,这样得到真实密度图M'i
利用所述每幅图像Xi的真实密度图M'i,构建目标训练集 在多尺度卷积神经网络的两个预设卷积层之间添加所 述残差单元,得到初始残差多尺度卷积神经网络模型。利用所述目标 训练集对所述初始残差多尺度卷积神经网络模型进行训 练,得到完成训练后的目标残差多尺度卷积神经网络。
在本实施例中,对所述初始残差多尺度卷积神经网络模型进行训 练时,可以设定训练轮数,例如2000轮,轮数运行结束则认为训练结 束。
步骤S102:利用所述目标残差多尺度卷积神经网络对所述待测试 图像进行处理,得到所述待测试图像的估计密度图并输出;
步骤S103:依据所述目标估计密度图,确定所述待测试图像中的 人数。
本实施例所提供的密集人群计数的方法,改进了现有技术中密级 人群计数网络层数过多,在训练时会引起退化问题的缺点;提出基于 残差多尺度卷积神经网络的密集人群计数方法,有效解决了网络的退 化问题,从而有效提高了密级人群计数的准确率。
基于上述实施例,在本实施例中,在多尺度卷积神经网络的第五 卷积层和第六卷积层之间添加一个所述残差单元,得到初始残差尺度 卷积神经网络。对所述初始残差尺度卷积神经网络进行训练后得到目 标残差尺度卷积神经网络,从而利用所述目标残差尺度卷积神经网络 确认待检测图像的估计密度图。
图2为本发明所提供的密集人群计数的方法的第二种具体实施例 的流程图;
步骤S201:将待测试图像输入至目标残差多尺度卷积神经网络, 其中,所述目标残差多尺度卷积神经网络是对预先构建的初始残差多 尺度卷积神经网络进行训练得到的;所述初始残差多尺度卷积神经网 络是在多尺度卷积神经网络的第五卷积层和第六卷积层之间添加一个 残差单元得到的;
所述残差单元的结构图如图3所示。所述初始残差多尺度卷积 神经网络(RMsCNN)的网络结构如图4所示,包括第一卷积层,第 二卷积层,第三卷积层,第四卷积层,第五卷积层,第六卷积层,反 卷积层,第七卷积层,第八卷积层和第九卷积层。其中,所述第一卷 积层、所述第二卷积层、所述第三卷积层和所述第四卷积层均采用 VGG16网络结构;所述第一卷积层至所述第五卷积层之间均采用2× 2区域,步长为2的最大池化,激活函数采用ReLU函数;所述第五 卷积层和所述第六卷积层之间采用3×3区域,步长为1的最大池化; 所述第五卷积层输出的特征图和所述第六卷积层输出的特征图在通道 上串联;所述第五卷积层和所述第六卷积层之间设有所述残差单元; 所述第四卷积层输出的特征图和所述反卷积层采用得到的特征图在通 道上串联;所述第九卷积层的卷积核为1×1,并将所述第九卷积层输 出的特征图作为所述初始残差尺度卷积神经网络的网络输出。
在本实施例中对所述初始残差多尺度卷积神经网络进行训练时, 可以选用Shanghai tech数据集作为人群图像数据集。所述Shanghai tech数据集一共包含1198张标注的图像以及330165个人头中心标注。 所述Shanghai tech数据集被划分为两个部分的数据集。其中,第一部 分包括:482张随机从网上爬取的图像,其中300张用于训练,182 张用于测试。第二部分包括:716张在上海街头拍取的图像,其中400 张用于训练,316张用于测试。在本实施例中,可以所述Shanghai tech 数据集的第二部分设定为训练集其中,Xi为训练集第i 张图像,大小为768×1024,Yi为第i张训练图像对应的人头坐标点图, 大小同样为768×1024,400为训练集中图像总数。
步骤S202:利用所述目标残差多尺度卷积神经网络对所述待测试 图像进行处理,得到所述待测试图像的估计密度图并输出;
步骤S203:根据所述目标估计密度图中所有像素值的和,确定所 述待测试图像中的人数。
将所述待测试图像T输入至所述目标残差多尺度卷积神经网络,得到所述待 测试图像T的估计密度图后,计算所述估计密度图中所有像素值的和,得 到所述待测试图像中的人数
通过本实施例所提供的目标残差多尺度卷积神经网络,增加了残 差单元,用以解决网络的退化问题。将所述目标残差多尺度卷积神经 网络(RMsCNN)与多尺度卷积神经网络(SaCNN)在相同的数据集 上做人群计数比较,从表1可以得到,本实施例所提供的目标残差多 尺度卷积神经网络的计数结果的平均完全误差(MAE)和均方误差 (MSE)都比多尺度卷积神经网络的计数结果小,获得了更好的性能。
表-1人群计数结果的对比
请参考图5,图5为本发明实施例提供的一种密集人群计数的装 置的结构框图;具体装置可以包括:
输入模块100,用于将待测试图像输入预先完成训练的目标残差 多尺度卷积神经网络,其中,所述目标残差多尺度卷积神经网络中的 两个预选卷积层之间设有残差单元;
输出模块200,利用所述目标残差多尺度卷积神经网络对所述待 测试图像进行处理,得到所述待测试图像的估计密度图并输出;
确定模块300,用于依据所述目标估计密度图,确定所述待测试 图像中的人数。
本实施例的密集人群计数的装置用于实现前述的密集人群计数 的方法,因此密集人群计数的装置中的具体实施方式可见前文中的密 集人群计数的方法的实施例部分,例如,输入模块100,输出模块200, 确定模块300,分别用于实现上述密集人群计数的方法中步骤S101, S102和S103,所以,其具体实施方式可以参照相应的各个部分实施 例的描述,在此不再赘述。
本发明具体实施例还提供了一种密集人群计数的设备,包括:存 储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实 现上述一种密集人群计数的方法的步骤。
本发明具体实施例还提供了一种计算机可读存储介质,所述计算 机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行 时实现上述一种密集人群计数的方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说 明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分 互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的 方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述 的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者 的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明 中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟 以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束 条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所 描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接 用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块 可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程 ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的密集人群计数的方法、装置、设备以及计 算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明 的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解 本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术 人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干 改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种密集人群计数的方法,其特征在于,包括:
将待测试图像输入预先完成训练的目标残差多尺度卷积神经网络,其中,所述目标残差多尺度卷积神经网络中的两个预选卷积层之间设有残差单元;
利用所述目标残差多尺度卷积神经网络对所述待测试图像进行处理,得到所述待测试图像的估计密度图并输出;
依据所述目标估计密度图,确定所述待测试图像中的人数。
2.如权利要求1所述的方法,其特征在于,还包括:
获取预先构建的人群图像数据集,其中,所述人群图像数据集包括i张人群图像,与每张人群图像分别对应的人头坐标点图;
利用高斯滤波器对所述每张人群图像进行滤波处理后,利用所述每张人群图像的初始化为零矩阵的密度图和所述每张人群图像的人头中心坐标,确定所述每张人群图像的真实密度图;
利用所述每张人群图像和所述每张人群图像的人的真实密度图,构建目标训练集;
在多尺度卷积神经网络的两个预设卷积层之间添加所述残差单元,得到初始残差多尺度卷积神经网络模型;
利用所述目标训练集对所述初始残差多尺度卷积神经网络模型进行训练,得到完成训练后的目标残差多尺度卷积神经网络。
3.如权利要求2所述的方法,其特征在于,所述在多尺度卷积神经网络的两个预设卷积层之间添加所述残差单元,得到初始残差多尺度卷积神经网络模型包括:
在所述多尺度卷积神经网络的第五卷积层和第六卷积层之间添加一个所述残差单元,得到初始残差尺度卷积神经网络。
4.如权利要求3所述的方法,其特征在于,所述初始残差尺度卷积神经网络的网络结构包括:
第一卷积层,第二卷积层,第三卷积层,第四卷积层,第五卷积层,第六卷积层,反卷积层,第七卷积层,第八卷积层和第九卷积层;
其中,所述第一卷积层、所述第二卷积层、所述第三卷积层和所述第四卷积层均采用VGG16网络结构;
所述第一卷积层至所述第五卷积层之间均采用2×2区域,步长为2的最大池化,激活函数采用ReLU函数;
所述第五卷积层和所述第六卷积层之间采用3×3区域,步长为1的最大池化;
所述第五卷积层输出的特征图和所述第六卷积层输出的特征图在通道上串联;
所述第五卷积层和所述第六卷积层之间设有所述残差单元;
所述第四卷积层输出的特征图和所述反卷积层采用得到的特征图在通道上串联;
所述第九卷积层的卷积核为1×1,并将所述第九卷积层输出的特征图作为所述初始残差尺度卷积神经网络的网络输出。
5.如权利要求1至4任一项所述的方法,其特征在于,所述依据所述目标估计密度图,确定所述待测试图像中的人数包括:
根据所述目标估计密度图中所有像素值的和,确定所述待测试图像中的人数。
6.一种密集人群计数的装置,其特征在于,包括:
输入模块,用于将待测试图像输入预先完成训练的目标残差多尺度卷积神经网络,其中,所述目标残差多尺度卷积神经网络中的两个预选卷积层之间设有残差单元;
输出模块,利用所述目标残差多尺度卷积神经网络对所述待测试图像进行处理,得到所述待测试图像的估计密度图并输出;
确定模块,用于依据所述目标估计密度图,确定所述待测试图像中的人数。
7.如权利要求6所述的装置,其特征在于,还包括:
训练模块,用于获取预先构建的人群图像数据集,其中,所述人群图像数据集包括i张人群图像,与每张人群图像分别对应的人头坐标点图;
利用高斯滤波器对所述每张人群图像进行滤波处理后,利用所述每张人群图像的初始化为零矩阵的密度图和所述每张人群图像的人头中心坐标,确定所述每张人群图像的真实密度图;
利用所述每张人群图像和所述每张人群图像的人的真实密度图,构建目标训练集;
在多尺度卷积神经网络的两个预设卷积层之间添加所述残差单元,得到初始残差多尺度卷积神经网络模型;
利用所述目标训练集对所述初始残差多尺度卷积神经网络模型进行训练,得到完成训练后的目标残差多尺度卷积神经网络。
8.如权利要求6所述的装置,其特征在于,所述确定模块具体用于:
根据所述目标估计密度图中所有像素值的和,确定所述待测试图像中的人数。
9.一种密集人群计数的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述一种密集人群计数的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述一种密集人群计数的方法的步骤。
CN201910294403.4A 2019-04-12 2019-04-12 一种密集人数计数的方法、装置、设备以及存储介质 Active CN110084155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910294403.4A CN110084155B (zh) 2019-04-12 2019-04-12 一种密集人数计数的方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910294403.4A CN110084155B (zh) 2019-04-12 2019-04-12 一种密集人数计数的方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN110084155A true CN110084155A (zh) 2019-08-02
CN110084155B CN110084155B (zh) 2022-04-12

Family

ID=67414973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910294403.4A Active CN110084155B (zh) 2019-04-12 2019-04-12 一种密集人数计数的方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN110084155B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781845A (zh) * 2019-10-29 2020-02-11 北京迈格威科技有限公司 基于图像统计目标对象的方法、装置和电子系统
CN110874573A (zh) * 2019-10-30 2020-03-10 汇纳科技股份有限公司 基于残差运算的密度图产生方法、装置、电子终端及介质
CN110991375A (zh) * 2019-12-10 2020-04-10 北京航空航天大学 一种群体行为分析方法及装置
CN111598778A (zh) * 2020-05-13 2020-08-28 云南电网有限责任公司电力科学研究院 一种绝缘子图像超分辨率重建方法
CN111723742A (zh) * 2020-06-19 2020-09-29 苏州大学 一种人群密度分析方法、系统、装置及计算机可读存储介质
CN113468931A (zh) * 2020-03-31 2021-10-01 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101930A (zh) * 2018-08-18 2018-12-28 华中科技大学 一种人群计数方法及系统
CN109241895A (zh) * 2018-08-28 2019-01-18 北京航空航天大学 密集人群计数方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101930A (zh) * 2018-08-18 2018-12-28 华中科技大学 一种人群计数方法及系统
CN109241895A (zh) * 2018-08-28 2019-01-18 北京航空航天大学 密集人群计数方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LU ZHANG 等: "Crowd counting via scale-adaptive convolutional neural network", 《2018 IEEE WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION》 *
XINGHAO DING 等: "A DEEPLY-RECURSIVE CONVOLUTIONAL NETWORK FOR CROWD COUNTING", 《ARXIV:1805.05633V1 [CS.CV]》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781845A (zh) * 2019-10-29 2020-02-11 北京迈格威科技有限公司 基于图像统计目标对象的方法、装置和电子系统
CN110781845B (zh) * 2019-10-29 2023-04-07 北京迈格威科技有限公司 基于图像统计目标对象的方法、装置和电子系统
CN110874573A (zh) * 2019-10-30 2020-03-10 汇纳科技股份有限公司 基于残差运算的密度图产生方法、装置、电子终端及介质
CN110874573B (zh) * 2019-10-30 2022-05-13 汇纳科技股份有限公司 基于残差运算的密度图产生方法、装置、电子终端及介质
CN110991375A (zh) * 2019-12-10 2020-04-10 北京航空航天大学 一种群体行为分析方法及装置
CN113468931A (zh) * 2020-03-31 2021-10-01 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及存储介质
CN113468931B (zh) * 2020-03-31 2022-04-29 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及存储介质
CN111598778A (zh) * 2020-05-13 2020-08-28 云南电网有限责任公司电力科学研究院 一种绝缘子图像超分辨率重建方法
CN111598778B (zh) * 2020-05-13 2023-11-21 云南电网有限责任公司电力科学研究院 一种绝缘子图像超分辨率重建方法
CN111723742A (zh) * 2020-06-19 2020-09-29 苏州大学 一种人群密度分析方法、系统、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN110084155B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN110084155A (zh) 一种密集人数计数的方法、装置、设备以及存储介质
CN109858461A (zh) 一种密集人群计数的方法、装置、设备以及存储介质
CN104363986B (zh) 一种图像处理方法和设备
Fang et al. Bottom-up saliency detection model based on human visual sensitivity and amplitude spectrum
EP3719708A1 (en) Model test method and device
CN110415170A (zh) 一种基于多尺度注意力卷积神经网络的图像超分辨率方法
CN106682734A (zh) 一种提升卷积神经网络泛化能力的方法及装置
CN108960230A (zh) 基于旋转矩形框的轻量化目标识别方法及装置
CN109598234A (zh) 关键点检测方法和装置
CN111340077B (zh) 基于注意力机制的视差图获取方法和装置
WO2021003936A1 (zh) 图像分割方法、电子设备和计算机可读存储介质
CN111860398A (zh) 遥感图像目标检测方法、系统及终端设备
CN103578093A (zh) 图像配准方法、装置及增强现实系统
CN107564063A (zh) 一种基于卷积神经网络的虚拟物显示方法及装置
CN111914726B (zh) 基于多通道自适应注意力机制的行人检测方法
CN108596070A (zh) 人物识别方法、装置、存储介质、程序产品和电子设备
CN109815931A (zh) 一种视频物体识别的方法、装置、设备以及存储介质
CN110096993A (zh) 双目立体视觉的目标检测设备及方法
CN109872362A (zh) 一种目标检测方法及装置
CN110059607A (zh) 活体多重检测方法、装置、计算机设备及存储介质
CN107707899A (zh) 包含运动目标的多视角图像处理方法、装置及电子设备
CN110502697A (zh) 一种目标用户识别方法、装置及电子设备
CN110533608A (zh) 图像条带噪声抑制方法及其装置、电子设备、存储介质
CN109993701A (zh) 一种基于金字塔结构的深度图超分辨率重建的方法
CN110135428A (zh) 图像分割处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant