CN109543510A - 人流密度估计方法、装置和电子设备 - Google Patents
人流密度估计方法、装置和电子设备 Download PDFInfo
- Publication number
- CN109543510A CN109543510A CN201811167767.8A CN201811167767A CN109543510A CN 109543510 A CN109543510 A CN 109543510A CN 201811167767 A CN201811167767 A CN 201811167767A CN 109543510 A CN109543510 A CN 109543510A
- Authority
- CN
- China
- Prior art keywords
- picture
- people
- stream
- density
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000012549 training Methods 0.000 claims description 107
- 239000011159 matrix material Substances 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 45
- 238000010438 heat treatment Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 31
- 230000000644 propagated effect Effects 0.000 claims description 14
- 238000011478 gradient descent method Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000013461 design Methods 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000007 visual effect Effects 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical compound C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
- G06V10/14—Optical characteristics of the device performing the acquisition or on the illumination arrangements
- G06V10/143—Sensing or illuminating at different wavelengths
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种人流密度估计方法、装置和电子设备。其中,人流密度估计方法包括:获取待估计的图片;将图片输入至预先获得的人流密度估计模型中,获得图片的热力图;根据热力图,获得图片中的人流密度。通过预先训练的人流密度估计模型,可以获得待估计的图片对应的热力图。从而根据热力图可以获得图片中的人流密度,降低了人工成本,提升了处理效率、准确性和实时性。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种人流密度估计方法、装置和电子设备。
背景技术
随着互联网和人工智能技术的不断发展,越来越多的领域开始涉及自动化计算与分析。其中,监控安防领域是最为重要的场景之一。对于一些人流密度大的区域,如机场、车站、广场、公园等,常因为人群过于密集而存在发生踩踏事件的隐患。对这些区域进行实时人数的统计,可以有效避免此类事件的发生。
在对上述场景中的人群进行实时监控时,通常以高空摄像为主。高空拍摄视角相比于一般低空视角,高空视角存在人体只能看到头顶、易于与其他物体混淆等特点。
目前的统计方法大部分还处于人眼计数的方式。通过对高空拍摄图像人工计数,导致人工成本高、人流密度准确性和效率较低。
发明内容
本发明实施例提供一种人流密度估计方法、装置和电子设备,降低了人工成本,提升了处理效率、准确性和实时性。
第一方面,本发明实施例提供一种人流密度估计方法,包括:
获取待估计的图片;
将所述图片输入至预先获得的人流密度估计模型中,获得所述图片的热力图;
根据所述热力图,获得所述图片中的人流密度。
在一种可能的设计中,所述获取待估计的图片,包括:
获取待处理图片;
将所述待处理图片缩放至预设尺寸,以及将所述待处理图片中的每个像素点减去预设RGB值,获得所述待估计的图片。
在一种可能的设计中,所述根据所述热力图,获得所述图片中的人流密度,包括:
将所述热力图中的热力值求和,获得所述热力图的热力值总和;
将所述热力值总和,确定为所述人流密度。
在一种可能的设计中,所述方法还包括:
获取训练图片;
根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型。
在一种可能的设计中,所述根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型,包括:
获取所述训练图片中的每个人头位置;
针对每个人头位置,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和;
根据训练图片及所述求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得所述人流密度估计模型。
在一种可能的设计中,所述针对每个人头位置,采用预设高斯核函数进行模糊处理,包括:
根据该训练图片的尺寸,建立预设矩阵,所述预设矩阵的行数等于该训练图片的宽度,所述预设矩阵的列数等于该训练图片的长度;所述预设矩阵中的所有元素为第一预设值;
根据每个人头位置,将所述预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值;
以第二预设值为中心,采用预设高斯核函数进行模糊处理。
第二方面,本发明实施例提供一种人流密度估计装置,包括:
获取模块,用于获取待估计的图片;
处理模块,用于将所述图片输入至预先获得的人流密度估计模型中,获得所述图片的热力图;以及根据所述热力图,获得所述图片中的人流密度。
在一种可能的设计中,所述获取模块,具体用于:
获取待处理图片;
将所述待处理图片缩放至预设尺寸,以及将所述待处理图片中的每个像素点减去预设RGB值,获得所述待估计的图片。
在一种可能的设计中,所述处理模块,具体用于:
将所述热力图中的热力值求和,获得所述热力图的热力值总和;
将所述热力值总和,确定为所述人流密度。
在一种可能的设计中,所述装置还包括:训练模块;
所述训练模块,用于获取训练图片,以及根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型。
在一种可能的设计中,所述训练模块,具体用于:
获取所述训练图片中的每个人头位置;
针对每个人头位置,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和;
根据训练图片及所述求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得所述人流密度估计模型。
在一种可能的设计中,所述训练模块,具体用于:
根据该训练图片的尺寸,建立预设矩阵,所述预设矩阵的行数等于该训练图片的宽度,所述预设矩阵的列数等于该训练图片的长度;所述预设矩阵中的所有元素为第一预设值;
根据每个人头位置,将所述预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值;
以第二预设值为中心,采用预设高斯核函数进行模糊处理。
第三方面,本发明实施例提供一种电子设备,包括:存储器和处理器;
所述存储器,用于存储程序代码;
所述处理器,用于调用所述存储器中存储的所述代码,执行:
获取待估计的图片;
将所述图片输入至预先获得的人流密度估计模型中,获得所述图片的热力图;
根据所述热力图,获得所述图片中的人流密度。
在一种可能的设计中,所述处理器,具体用于:
获取待处理图片;
将所述待处理图片缩放至预设尺寸,以及将所述待处理图片中的每个像素点减去预设RGB值,获得所述待估计的图片。
在一种可能的设计中,所述处理器,具体用于:
将所述热力图中的热力值求和,获得所述热力图的热力值总和;
将所述热力值总和,确定为所述人流密度。
在一种可能的设计中,所述处理器,还用于:
获取训练图片;
根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型。
在一种可能的设计中,所述处理器,具体用于:
获取所述训练图片中的每个人头位置;
针对每个人头位置,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和;
根据训练图片及所述求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得所述人流密度估计模型。
在一种可能的设计中,所述处理器,具体用于:
根据该训练图片的尺寸,建立预设矩阵,所述预设矩阵的行数等于该训练图片的宽度,所述预设矩阵的列数等于该训练图片的长度;所述预设矩阵中的所有元素为第一预设值;
根据每个人头位置,将所述预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值;
以第二预设值为中心,采用预设高斯核函数进行模糊处理。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包含至少一段代码,所述至少一段代码可由计算机执行,以控制所述计算机执行如第一方面本发明实施例所述的人流密度估计方法。
第五方面,本发明实施例提供一种计算机程序,当所述计算机程序被计算机执行时,用于实现第一方面本发明实施例所述的人流密度估计方法。
本发明实施例提供一种人流密度估计方法、装置和电子设备,包括:获取待估计的图片;将图片输入至预先获得的人流密度估计模型中,获得图片的热力图;根据热力图,获得图片中的人流密度。本发明实施例提供的人流密度估计方法,基于深度学习算法,通过预先训练的人流密度估计模型,可以获得待估计的图片对应的热力图。从而根据热力图可以获得图片中的人流密度。降低了人工成本,提升了处理效率、准确性和实时性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的人流密度估计方法的流程图;
图2为本发明实施例提供的待估计的图片的示意图;
图3为本发明实施例提供的训练图片的示意图;
图4为本发明实施例提供的人流密度估计装置的结构示意图;
图5为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的人流密度估计方法的流程图。本实施例提供的人流密度估计方法,执行主体可以为人流密度估计装置或者电子设备。如图1所示,本实施例提供的人流密度估计方法,可以包括:
S101、获取待估计的图片。
其中,待估计的图片中包括需要估计人流密度的人群。
可选的,待估计的图片可以为拍摄设备在高空视角对密集人群进行拍摄获得的图片。
示例性的,图2为本发明实施例提供的待估计的图片的示意图。如图2所示,通过高空视角获取的图片中,密集人群中通常只能看到人的头顶。并且,目标小,难以辨别。
需要说明的是,本实施例对于图片的类型不做限定。
例如,待估计的图片可以为拍照设备按照一定的拍摄帧率进行拍摄后实时获得的图片。又例如,待估计的图片可以为摄像设备对密集人群进行视频拍摄后,从视频文件中提取的一帧图像。
例如,待估计的图片可以为彩色图片、黑白图片,RGB图片,等等。
需要说明的是,本实施例对于拍摄设备的类型不做限定。例如,照相机、摄像机,等等。
S102、将图片输入至预先获得的人流密度估计模型中,获得图片的热力图。
具体的,可以预先训练人流密度估计模型。人流密度估计模型的输入为图片,输出为图片对应的热力图。人流密度估计模型用于获取图片对应的热力图。在本实施例中,热力图与待估计的图片尺寸可以相同,用于根据人流密度大小渲染地图颜色,从而反映出人体所在的区域。
需要说明的是,本实施例对于人流密度估计模型的类型不做限定。例如,可以为神经网络模型、机器学习算法模型,等。
需要说明的是,当待估计的图片的类型不同时,人流密度估计模型可以不同。只要在训练人流密度估计模型时,输入图片的类型与待估计的图片的类型相同即可。例如,当待估计的图片为RGB图片时,其对应的人流密度估计模型在训练时,需要以RGB图片作为输入。
可选的,热力图中的热力值可以反映出是否为人体的概率。本实施例对于热力值的取值范围不做限定。
可选的,热力值越大,表示为人体的概率越大。或者,热力值越小,表示为人体的概率越大。
可选的,热力值的取值范围可以为(0,1)。
可选的,当热力值的取值范围大于1时,可以对热力值进行归一化处理。例如,热力值为5,热力值的最大值为100。则归一化后,热力值的取值可以为0.05。
需要说明的是,本实施例对于热力值的大小与渲染颜色之间的对应关系不做限定。例如,热力值越大,表示为人体的概率越大,对应的颜色越亮。那么,热力图中越高亮的区域可以理解为包含人体的概率越高。可选的,热力图中的高亮区域可以为连续区域。
可选的,人流密度估计模型可以以人的头部为目标对象。因此,与待估计的图片对应的热力图,可以反映出人群的头部范围。
还以上面示例说明。热力图中的高亮区域可以集中在人群的头部范围。
S103、根据热力图,获得图片中的人流密度。
可见,本实施例提供的人流密度估计方法,通过预先训练的人流密度估计模型,可以获得待估计的图片对应的热力图。从而根据热力图可以获得图片中的人流密度。相比于通过人工方式计数获取人流密度,本实施例提供的人流密度估计方法降低了人工成本,提升了处理效率、准确性和实时性。有利于实时防止密集人群的拥挤、踩踏等危险的发生。而且,本实施例提供的人流密度估计方法,基于深度学习算法,通过预设的人流密度估计模型获取热力图。在热力图中不需要识别每个人体占用的区域,简化了人流密度估计的难度。
可选的,S101中,获取待估计的图片,可以包括:
获取待处理图片。
将待处理图片缩放至预设尺寸,以及将待处理图片中的每个像素点减去预设RGB值,获得待估计的图片。
在该种实现方式中,待估计的图片为具有统一尺寸的图片。通过设置待估计的图片为固定尺寸,简化了数据处理难度,提升了数据处理效率。
在该种实现方式中,通过将待处理图片中的每个像素点减去预设RGB值,提升了待估计的图片的鲁棒性。
需要说明的是,本实施例对于预设尺寸、预设RGB值的具体取值不做限定,根据需要进行设置。
例如,预设尺寸可以为960*540。预设RGB值可以为[104,117,123]。
其中,待处理图片的类型可以参见对待估计图片的描述,原理相似,此处不再赘述。
可选的,S103中,根据热力图,获得图片中的人流密度,可以包括:
将热力图中的热力值求和,获得热力图的热力值总和。
将热力值总和,确定为人流密度。
具体的,热力值的取值范围可以为(0,1)。其中,热力值越大,表示为人体的概率越大。通过对输出的热力图进行二维求和,可以将热力值的总和确定为待估计的图片中的总人数。
可见,基于深度学习算法获得待估计的图片对应的热力图后,通过对热力图进行二维求和可以确定待估计的图片中的总人数,定量的获得人流密度值,进一步提升了对人流密度估计的准确性。
可选的,本实施例提供的人流密度估计方法,还可以包括:
获取训练图片。
根据训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得人流密度估计模型。
其中,梯度下降算法(Gradient Descent Optimization,DGO)是神经网络模型训练最常用的优化算法。梯度下降算法的原理为:目标函数J(θ)关于参数θ的梯度将是目标函数上升最快的方向。对于最小化优化问题,只需要将参数沿着梯度相反的方向前进一个步长,就可以实现目标函数的下降。这个步长又称为学习速率。
反向传播算法是神经网络中常用的算法,其主要思想是将网络最后输出的结果计算其误差,并且将误差反向逐级传下去。方向传播运用的是链式求导的基本思想(隐函数求导)。
可选的,根据训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得人流密度估计模型,可以包括:
获取训练图片中的每个人头位置。
针对每个人头位置,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和。
根据训练图片及求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得人流密度估计模型。
可选的,针对每个人头位置,采用预设高斯核函数进行模糊处理,可以包括:
根据该训练图片的尺寸,建立预设矩阵,预设矩阵的行数等于该训练图片的宽度,预设矩阵的列数等于该训练图片的长度。预设矩阵中的所有元素为第一预设值。
根据每个人头位置,将预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值。
以第二预设值为中心,采用预设高斯核函数进行模糊处理。
需要说明的是,本实施例对于第一预设值、第二预设值的具体取值不做限定。
下面通过具体示例进行说明。
示例性的,图3为本发明实施例提供的训练图片的示意图。如图3所示,训练图片中包括6个人。示例性的,第一预设值可以为0,第二预设值可以为1。
根据训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得人流密度估计模型,可以包括:
步骤1、获取训练图片中的每个人头位置。
步骤2、根据该训练图片的尺寸,建立预设矩阵。
其中,预设矩阵的行数等于该训练图片的宽度,预设矩阵的列数等于该训练图片的长度。预设矩阵中的所有元素的取值为0。
步骤3、根据每个人头位置,将预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值。
具体的,对图3所示的训练图片进行标注。具体标注方式为对图中每个人头位置进行打点,打点位置依次标记为位置31~位置36。并记录所有打点的xy坐标。对经过标注的训练图片,将预设矩阵中与位置31~位置36对应的元素的取值由0变更为1。
可选的,打点位置可以为人头区域中的任一位置。
可选的,打点位置可以为人头的中心位置。
由于人头占用的区域中,人头中心点的位置更易于反映出是否为人体。因此,通过将打点位置设置为人头的中心位置,提升了模型训练的准确性。
步骤4、以第二预设值为中心,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和。
具体的,以位置31~位置36的打点为中心,使用预设高斯核函数进行模糊。可选的,高斯核函数定义如下:
上式中,x表示打点在训练图片中的位置。i表示打点的标识。δ表示跳变函数,即,只在x处为1,其他所有位置都为0。xi表示标注答案中对应于i这个标识的打点的位置。σi表示对应于当前打点的高斯核参数。β,di为另外的两个参数。其中,di表示根据K最近邻(k-NearestNeighbor,kNN)算法计算出的当前xi距离最近的k个近邻其他打点位置的最近距离。可选的,β=0.3,k=3。Gσi(x)表示应用了σi的二维高斯函数。F(x)表示经过高斯核模糊后的当前δ函数(ground truth mask)。
将所有i对应的经过高斯核模糊后的ground truth mask进行求和累加,可以获得训练图片总的ground truth mask,用作后续的训练步骤。
步骤5、根据训练图片及求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得人流密度估计模型。
具体的,输入训练图片和求和值ground truth mask,利用反向梯度传播训练方法,输出训练图片的热力图,获得人流密度估计模型。
需要说明的是,训练图片的类型和后续待估计的图片的类型一直即可。训练图片的类型可以参见待估计的图片的类型的描述,原理相似,此处不再赘述。
本实施例提供一种人流密度估计方法,包括:获取待估计的图片,将图片输入至预先获得的人流密度估计模型中,获得图片的热力图,根据热力图,获得图片中的人流密度。本实施例提供的人流密度估计方法,通过预先训练的人流密度估计模型,可以获得待估计的图片对应的热力图。从而根据热力图可以获得图片中的人流密度。降低了人工成本,提升了处理效率、准确性和实时性。有利于实时防止密集人群的拥挤、踩踏等危险的发生。
图4为本发明实施例提供的人流密度估计装置的结构示意图。如图4所示,本实施例提供的人流密度估计装置,用于执行图1-图3所示实施例提供的人流密度估计方法。如图4所示,本实施例的人流密度估计装置可以包括:获取模块41和处理模块42。可选地,本实施例的人流密度估计装置还可以包括:训练模块43。
获取模块41,用于获取待估计的图片;
处理模块42,用于将所述图片输入至预先获得的人流密度估计模型中,获得所述图片的热力图;以及根据所述热力图,获得所述图片中的人流密度。
在一些实施例中,所述获取模块41,具体用于:
获取待处理图片;
将所述待处理图片缩放至预设尺寸,以及将所述待处理图片中的每个像素点减去预设RGB值,获得所述待估计的图片。
在一些实施例中,所述处理模块42,具体用于:
将所述热力图中的热力值求和,获得所述热力图的热力值总和;
将所述热力值总和,确定为所述人流密度。
在一些实施例中,本实施例的装置还包括:训练模块43;
所述训练模块43,用于获取训练图片,以及根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型。
在一些实施例中,所述训练模块43,具体用于:
获取所述训练图片中的每个人头位置;
针对每个人头位置,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和;
根据训练图片及所述求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得所述人流密度估计模型。
在一些实施例中,所述训练模块43,具体用于:
根据该训练图片的尺寸,建立预设矩阵,所述预设矩阵的行数等于该训练图片的宽度,所述预设矩阵的列数等于该训练图片的长度;所述预设矩阵中的所有元素为第一预设值;
根据每个人头位置,将所述预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值;
以第二预设值为中心,采用预设高斯核函数进行模糊处理。
本实施例提供的人流密度统计装置,可以用于执行图1-图3所示实施例提供的人流密度估计方法,其实现原理和技术效果类似,此处不再赘述。
图5为本发明实施例提供的电子设备的结构示意图。如图5所示,本实施例提供的电子设备,用于执行图1-图3所示实施例提供的人流密度估计方法。如图5所示,本实施例的电子设备可以包括:存储器52和处理器51;存储器52和处理器51可以通信连接。
所述存储器52,用于存储程序代码;
所述处理器51,用于调用所述存储器52中存储的所述代码,执行:
获取待估计的图片;
将所述图片输入至预先获得的人流密度估计模型中,获得所述图片的热力图;
根据所述热力图,获得所述图片中的人流密度。
在一些实施例中,所述处理器51,具体用于:
获取待处理图片;
将所述待处理图片缩放至预设尺寸,以及将所述待处理图片中的每个像素点减去预设RGB值,获得所述待估计的图片。
在一些实施例中,所述处理器51,具体用于:
将所述热力图中的热力值求和,获得所述热力图的热力值总和;
将所述热力值总和,确定为所述人流密度。
在一些实施例中,所述处理器51,还用于:
获取训练图片;
根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型。
在一些实施例中,所述处理器51,具体用于:
获取所述训练图片中的每个人头位置;
针对每个人头位置,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和;
根据训练图片及所述求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得所述人流密度估计模型。
在一些实施例中,所述处理器51,具体用于:
根据该训练图片的尺寸,建立预设矩阵,所述预设矩阵的行数等于该训练图片的宽度,所述预设矩阵的列数等于该训练图片的长度;所述预设矩阵中的所有元素为第一预设值;
根据每个人头位置,将所述预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值;
以第二预设值为中心,采用预设高斯核函数进行模糊处理。
本实施例提供的电子设备,可以用于执行图1-图3所示实施例提供的人流密度估计方法,其实现原理和技术效果类似,此处不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,确定模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。
Claims (14)
1.一种人流密度估计方法,其特征在于,包括:
获取待估计的图片;
将所述图片输入至预先获得的人流密度估计模型中,获得所述图片的热力图;
根据所述热力图,获得所述图片中的人流密度。
2.根据权利要求1所述的方法,其特征在于,获取待估计的图片,包括:
获取待处理图片;
将所述待处理图片缩放至预设尺寸,以及将所述待处理图片中的每个像素点减去预设RGB值,获得所述待估计的图片。
3.根据权利要求1所述的方法,其特征在于,所述根据所述热力图,获得所述图片中的人流密度,包括:
将所述热力图中的热力值求和,获得所述热力图的热力值总和;
将所述热力值总和,确定为所述人流密度。
4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:
获取训练图片;
根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型,包括:
获取所述训练图片中的每个人头位置;
针对每个人头位置,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和;
根据训练图片及所述求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得所述人流密度估计模型。
6.根据权利要求5所述的方法,其特征在于,所述针对每个人头位置,采用预设高斯核函数进行模糊处理,包括:
根据该训练图片的尺寸,建立预设矩阵,所述预设矩阵的行数等于该训练图片的宽度,所述预设矩阵的列数等于该训练图片的长度;所述预设矩阵中的所有元素为第一预设值;
根据每个人头位置,将所述预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值;
以第二预设值为中心,采用预设高斯核函数进行模糊处理。
7.一种人流密度估计装置,其特征在于,包括:
获取模块,用于获取待估计的图片;
处理模块,用于将所述图片输入至预先获得的人流密度估计模型中,获得所述图片的热力图;以及根据所述热力图,获得所述图片中的人流密度。
8.一种电子设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序代码;
所述处理器,用于调用所述存储器中存储的所述代码,执行:
获取待估计的图片;
将所述图片输入至预先获得的人流密度估计模型中,获得所述图片的热力图;
根据所述热力图,获得所述图片中的人流密度。
9.根据权利要求8所述的电子设备,其特征在于,所述处理器,具体用于:
获取待处理图片;
将所述待处理图片缩放至预设尺寸,以及将所述待处理图片中的每个像素点减去预设RGB值,获得所述待估计的图片。
10.根据权利要求8所述的电子设备,其特征在于,所述处理器,具体用于:
将所述热力图中的热力值求和,获得所述热力图的热力值总和;
将所述热力值总和,确定为所述人流密度。
11.根据权利要求8-10任一项所述的电子设备,其特征在于,所述处理器,还用于:
获取训练图片;
根据所述训练图片以及基于梯度下降法的反向梯度传播训练方法,训练获得所述人流密度估计模型。
12.根据权利要求11所述的电子设备,其特征在于,所述处理器,具体用于:
获取所述训练图片中的每个人头位置;
针对每个人头位置,采用预设高斯核函数进行模糊处理,并将所有模糊处理后获得的值求和;
根据训练图片及所述求和值作为输入、该训练图片的热力图作为输出,采用反向梯度传播训练方法,获得所述人流密度估计模型。
13.根据权利要求12所述的电子设备,其特征在于,所述处理器,具体用于:
根据该训练图片的尺寸,建立预设矩阵,所述预设矩阵的行数等于该训练图片的宽度,所述预设矩阵的列数等于该训练图片的长度;所述预设矩阵中的所有元素为第一预设值;
根据每个人头位置,将所述预设矩阵中与该人头位置对应的一个元素由第一预设值变更为第二预设值;
以第二预设值为中心,采用预设高斯核函数进行模糊处理。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包含至少一段代码,所述至少一段代码可由计算机执行,以控制所述计算机执行如权利要求1-6任一项所述的人流密度估计方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811167767.8A CN109543510A (zh) | 2018-10-08 | 2018-10-08 | 人流密度估计方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811167767.8A CN109543510A (zh) | 2018-10-08 | 2018-10-08 | 人流密度估计方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109543510A true CN109543510A (zh) | 2019-03-29 |
Family
ID=65843458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811167767.8A Pending CN109543510A (zh) | 2018-10-08 | 2018-10-08 | 人流密度估计方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109543510A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245579A (zh) * | 2019-05-24 | 2019-09-17 | 北京百度网讯科技有限公司 | 人流密度预测方法及装置、计算机设备及可读介质 |
CN111027387A (zh) * | 2019-11-11 | 2020-04-17 | 北京百度网讯科技有限公司 | 人数评估及评估模型获取方法、装置及存储介质 |
CN111710009A (zh) * | 2020-05-29 | 2020-09-25 | 北京百度网讯科技有限公司 | 人流密度的生成方法、装置、电子设备以及存储介质 |
CN111710008A (zh) * | 2020-05-29 | 2020-09-25 | 北京百度网讯科技有限公司 | 人流密度的生成方法、装置、电子设备以及存储介质 |
CN112101195A (zh) * | 2020-09-14 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 人群密度预估方法、装置、计算机设备和存储介质 |
CN114564549A (zh) * | 2022-02-14 | 2022-05-31 | 北京世纪高通科技有限公司 | 区域的热力图的生成方法、装置、设备及存储介质 |
CN114596537A (zh) * | 2022-05-10 | 2022-06-07 | 深圳市海清视讯科技有限公司 | 区域人流数据确定方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447458A (zh) * | 2015-11-17 | 2016-03-30 | 深圳市商汤科技有限公司 | 一种大规模人群视频分析系统和方法 |
CN105488149A (zh) * | 2015-11-26 | 2016-04-13 | 上海晶赞科技发展有限公司 | 一种数据处理方法及装置 |
CN106407466A (zh) * | 2016-10-17 | 2017-02-15 | 山东浪潮商用系统有限公司 | 一种基于人流量的税务大厅热力图显示方法 |
CN106874324A (zh) * | 2016-06-28 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种用颜色显示数据信息关联关系的方法及装置 |
CN107301387A (zh) * | 2017-06-16 | 2017-10-27 | 华南理工大学 | 一种基于深度学习的图像高密度人群计数方法 |
CN107506692A (zh) * | 2017-07-21 | 2017-12-22 | 天津大学 | 一种基于深度学习的密集人群计数与人员分布估计方法 |
-
2018
- 2018-10-08 CN CN201811167767.8A patent/CN109543510A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447458A (zh) * | 2015-11-17 | 2016-03-30 | 深圳市商汤科技有限公司 | 一种大规模人群视频分析系统和方法 |
CN105488149A (zh) * | 2015-11-26 | 2016-04-13 | 上海晶赞科技发展有限公司 | 一种数据处理方法及装置 |
CN106874324A (zh) * | 2016-06-28 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种用颜色显示数据信息关联关系的方法及装置 |
CN106407466A (zh) * | 2016-10-17 | 2017-02-15 | 山东浪潮商用系统有限公司 | 一种基于人流量的税务大厅热力图显示方法 |
CN107301387A (zh) * | 2017-06-16 | 2017-10-27 | 华南理工大学 | 一种基于深度学习的图像高密度人群计数方法 |
CN107506692A (zh) * | 2017-07-21 | 2017-12-22 | 天津大学 | 一种基于深度学习的密集人群计数与人员分布估计方法 |
Non-Patent Citations (2)
Title |
---|
FENG XIONG,ET AL.: "《Spatiotemporal Modeling for Crowd Counting in Videos》", 《ARXIV:1707.07890V1》 * |
YINGYING ZHANG ET AL: "《Single-Image Crowd Counting via Multi-Column Convolutional Neural Network》", 《IN PROCEEDINGS OF THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245579A (zh) * | 2019-05-24 | 2019-09-17 | 北京百度网讯科技有限公司 | 人流密度预测方法及装置、计算机设备及可读介质 |
CN110245579B (zh) * | 2019-05-24 | 2021-10-26 | 北京百度网讯科技有限公司 | 人流密度预测方法及装置、计算机设备及可读介质 |
CN111027387A (zh) * | 2019-11-11 | 2020-04-17 | 北京百度网讯科技有限公司 | 人数评估及评估模型获取方法、装置及存储介质 |
CN111027387B (zh) * | 2019-11-11 | 2023-09-26 | 北京百度网讯科技有限公司 | 人数评估及评估模型获取方法、装置及存储介质 |
CN111710009A (zh) * | 2020-05-29 | 2020-09-25 | 北京百度网讯科技有限公司 | 人流密度的生成方法、装置、电子设备以及存储介质 |
CN111710008A (zh) * | 2020-05-29 | 2020-09-25 | 北京百度网讯科技有限公司 | 人流密度的生成方法、装置、电子设备以及存储介质 |
CN111710009B (zh) * | 2020-05-29 | 2023-06-23 | 北京百度网讯科技有限公司 | 人流密度的生成方法、装置、电子设备以及存储介质 |
CN112101195A (zh) * | 2020-09-14 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 人群密度预估方法、装置、计算机设备和存储介质 |
CN112101195B (zh) * | 2020-09-14 | 2024-04-26 | 腾讯科技(深圳)有限公司 | 人群密度预估方法、装置、计算机设备和存储介质 |
CN114564549A (zh) * | 2022-02-14 | 2022-05-31 | 北京世纪高通科技有限公司 | 区域的热力图的生成方法、装置、设备及存储介质 |
CN114596537A (zh) * | 2022-05-10 | 2022-06-07 | 深圳市海清视讯科技有限公司 | 区域人流数据确定方法、装置、设备及存储介质 |
CN114596537B (zh) * | 2022-05-10 | 2022-08-05 | 深圳市海清视讯科技有限公司 | 区域人流数据确定方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543510A (zh) | 人流密度估计方法、装置和电子设备 | |
US11734851B2 (en) | Face key point detection method and apparatus, storage medium, and electronic device | |
CN108140130B (zh) | 图像处理方法及非暂时性计算机可读介质 | |
US20200005530A1 (en) | Systems and Methods for Authenticating a User According to a Hand of the User Moving in a Three-Dimensional (3D) Space | |
US9945660B2 (en) | Systems and methods of locating a control object appendage in three dimensional (3D) space | |
CN106951870B (zh) | 主动视觉注意的监控视频显著事件智能检测预警方法 | |
US20150215590A1 (en) | Image demosaicing | |
JP7443002B2 (ja) | 画像解析装置、画像解析方法、及びプログラム | |
CN110879982B (zh) | 一种人群计数系统及方法 | |
CN111192226B (zh) | 一种图像融合去噪方法及装置、系统 | |
CN103793922B (zh) | 一种特定姿态实时检测方法 | |
CN110245579A (zh) | 人流密度预测方法及装置、计算机设备及可读介质 | |
CN116309781B (zh) | 一种基于跨模态融合的水下视觉目标测距方法及装置 | |
CN108647587A (zh) | 人数统计方法、装置、终端及存储介质 | |
CN110910416A (zh) | 运动障碍物跟踪方法、装置及终端设备 | |
CN114549445A (zh) | 图像检测及相关模型的训练方法、相关装置、设备和介质 | |
CN112990232A (zh) | 面向多种高空作业施工现场的安全带佩戴识别与检测方法 | |
CN115457364A (zh) | 一种目标检测知识蒸馏方法、装置、终端设备和存储介质 | |
CN114037087B (zh) | 模型训练方法及装置、深度预测方法及装置、设备和介质 | |
CN111784658A (zh) | 一种用于人脸图像的质量分析方法和系统 | |
CN111444555A (zh) | 一种测温信息显示方法、装置及终端设备 | |
Yin et al. | Depth maps restoration for human using RealSense | |
CN111369494B (zh) | 冬小麦穗密度检测方法及装置 | |
CN111753775A (zh) | 鱼的生长评估方法、装置、设备及存储介质 | |
CN111127355A (zh) | 一种对缺损光流图进行精细补全的方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190329 |
|
RJ01 | Rejection of invention patent application after publication |