CN109241895A - 密集人群计数方法及装置 - Google Patents
密集人群计数方法及装置 Download PDFInfo
- Publication number
- CN109241895A CN109241895A CN201810986919.0A CN201810986919A CN109241895A CN 109241895 A CN109241895 A CN 109241895A CN 201810986919 A CN201810986919 A CN 201810986919A CN 109241895 A CN109241895 A CN 109241895A
- Authority
- CN
- China
- Prior art keywords
- image
- detected
- module
- input
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 25
- 230000004927 fusion Effects 0.000 claims description 37
- 230000015654 memory Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 239000011800 void material Substances 0.000 claims description 5
- 230000001537 neural effect Effects 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 8
- 230000008569 process Effects 0.000 abstract description 8
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 20
- 230000000694 effects Effects 0.000 description 14
- 238000012360 testing method Methods 0.000 description 5
- 241000208340 Araliaceae Species 0.000 description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 235000008434 ginseng Nutrition 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000003475 lamination Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Abstract
本发明提供一种密集人群计数方法及装置,通过获取包含人像的待检测图像,将待检测图像输入到卷积神经网络模型中,得到待检测图像的人群密度图,根据人群密度图确定待检测图像中的人像数量。上述过程充分提取待检测图像中的特征信息,实现效果良好的人群计数与密度估计,为后续的安全监测、人群管控等应用带来极大的便利。
Description
技术领域
本发明涉及航空监视技术领域,尤其涉及一种密集人群计数方法及装置。
背景技术
随着近年来国家对低空领域使用的不断开放,无人机经常被用来执行辅助灾情巡查、特殊场景监视等任务。而在这些任务中,对于人群信息的统计与分析是其中最为重要的环节之一,在很多场景尤其是人群密集的场景下,统计场景人群数量与其密度分布对于安全监测、突发情况预警以及情报分析等多类任务均有不可估量的作用。
在大多数需要进行人群计数和密度估计的场景下,人群的密集度均较高,也就造成了严重的遮挡、目标尺度不一致的问题。早期的方法一般使用基于检测和回归的方法统计场景中人的总数。但由于密集人群遮挡严重、目标尺寸相差较大,基于检测的方法效果较差;而直接回归场景中人的数目从获取一个目标函数的角度来讲使问题的输入域和输出域相差很大,也就导致了目标函数更难以拟合,也无法达到较好的效果。近年来,基于密度图的方法成为了人群计数的主流,此类方法既可以简化任务的目标函数,也可以在统计人群总数的基础上得到信息更加充足的人群密度分布,为后续的其他应用提供更大的帮助。
生成密度图的方法有很多,近年来效果较好的方法大部分为基于多路卷积的方法,使用多路具有不同大小卷积核的卷积神经网络提取原始图像中的多尺度信息,之后将得到的多组特征图进行融合,得到最终的密度图,在一定程度上解决了人群计数中最为棘手的多尺度问题。但此类方法由于使用多路不同的卷积神经网络,多路分支的参数及其提取的特征均存在大量冗余,同时由于参数量巨大,为了控制参数导致网络较浅,每一路分支网络都无法充分地提取相应的信息,在一定程度上限制了其效果。
发明内容
本发明提供一种密集人群计数方法及装置,避免了现有技术中大量参数冗余的问题,能够充分提取待检测图像中的特征信息,提高了人群计数与密度估计的良好效果。
本发明第一方面提供一种密集人群计数方法,包括:
获取待检测图像,所述待检测图像中包括人像;
将所述待检测图像输入到卷积神经网络模型中,得到所述待检测图像的人群密度图;
根据所述人群密度图确定所述待检测图像中的人像数量。
在一种可能的实现方式中,所述卷积神经网络模型包括依次连接的卷积模块、残差融合模块、池化模块以及子像素模块。
在一种可能的实现方式中,所述将所述待检测图像输入到卷积神经网络模型中,得到所述待检测图像的人群密度图,包括:
将所述待检测图像输入到所述卷积模块,对所述待检测图像进行预处理,得到第一特征图像;
将所述第一特征图像输入到所述残差融合模块,对所述第一特征图像进行第一次多尺度特征提取与融合,得到第二特征图像;
将所述第二特征图像输入到所述池化模块,对所述第二特征图像进行第二次多尺度特征提取与融合,得到第三特征图像;
将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到人群密度图。
在一种可能的实现方式中,所述将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到人群密度图,包括:
将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到第四特征图像;
对所述第四特征图像进行卷积,并采用双线性差值法得到人群密度图。
在一种可能的实现方式中,所述根据所述人群密度图确定所述待检测图像中的人像数量,包括:
对所述人群密度图进行积分求和得到所述待检测图像中的人像数量。
在一种可能的实现方式中,所述残差融合模块包括四个嵌套空洞卷积层,所述嵌套空洞卷积层包括空洞系数分别为1、2、4的空洞卷积核。
在一种可能的实现方式中,所述池化模块包括四个平均池化层。
本发明第二方面提供一种密集人群计数装置,包括:
获取模块,用于获取待检测图像,所述待检测图像中包括人像;
处理模块,用于将所述待检测图像输入到卷积神经网络模型中,得到所述待检测图像的人群密度图;
确定模块,用于根据所述人群密度图确定所述待检测图像中的人像数量。
本发明第三方面提供一种密集人群计数装置,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如本发明第一方面任一项所述的方法。
本发明第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明第一方面任一项所述的方法。
本发明实施例提供的密集人群计数方法及装置,通过获取包含人像的待检测图像,将待检测图像输入到卷积神经网络模型中,得到待检测图像的人群密度图,根据人群密度图确定待检测图像中的人像数量。上述过程充分提取待检测图像中的特征信息,实现效果良好的人群计数与密度估计,为后续的安全监测、人群管控等应用带来极大的便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的密集人群计数方法的流程示意图;
图2为本发明一实施例提供的卷积神经网络模型的结构示意图;
图3为本发明另一实施例提供的密集人群计数方法的流程示意图;
图4为本发明一实施例提供的残差融合模块的结构示意图;
图5为本发明一实施例提供的嵌套空洞卷积层的结构示意图;
图6为本发明一实施例提供的池化模块的结构示意图;
图7为本发明实施例提供的空洞参数分别为1、2、4的卷积核的结构示意图;
图8为本发明一实施例提供的子像素模块的示意图;
图9为本发明一实施例提供的密集人群计数装置的结构示意图;
图10为本发明一实施例提供的密集人群计数装置的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,本文中使用的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明的说明书中通篇提到的“一实施例”或“另一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一实施例中”或“本实施例中”未必一定指相同的实施例。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明提供一种密集人群计数方法及装置,基于单通道网络的多尺度信息融合的方法实现密集人群计数,即在单通道网络中实现多尺度信息的提取和融合,避免了大量参数的冗余,且能够充分地提取相关信息,实现效果良好的空集人群计数与密度估计。
为了使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明进行详细说明。
图1为本发明一实施例提供的密集人群计数方法的流程示意图,该方法可以由任意执行密集人群计数方法的装置来执行,该装置可以通过软件和/或硬件实现。
如图1所示,本实施例提供的密集人群计数方法包括以下步骤:
S101、获取待检测图像,待检测图像中包括人像;
在本实施例中,图像采集装置采集不同测试场景中的待检测图像,将待检测图像发送给密集人群计数装置。其中,图像采集装置为飞行器上的航拍装置,飞行器包括但不限于无人机、飞机、直升机。测试场景包括人群密集的测试场景,也包括人群稀疏的测试场景,只要测试场景图中存在人像即可,对此本实施例不作具体限定。
举例来说,通过无人机航拍天安门广场上空的待检测图像,该待检测图像中包括一定数量的人像,人像在图像中的大小不同,且存在相互叠加的情况。
S102、将待检测图像输入到卷积神经网络模型中,得到待检测图像的人群密度图;
在本实施例中,密集人群计数装置中设置有卷积神经网络模型,该卷积神经网络模型用于对输入的待检测图像进行一系列图像处理后得到待检测图像的人群密度图。
图2为本发明一实施例提供的卷积神经网络模型的结构示意图,如图2所示,本实施例的卷积神经网络模型包括:
依次连接的卷积模块、残差融合模块、池化模块以及子像素模块。
其中,卷积模块,用于对待检测图像进行预处理,初步降低待检测图像的空间分辨率。
残差模块,用于对预处理之后的待检测图像进行多尺度特征提取和融合,实现提取待检测图像中不同感受野的特征信息,并将其结合到一起,得到融合有多尺度信息的特征图。
池化模块,用于对残差模块输出的特征图作进一步特征提取和融合,得到与输入的待检测图像尺寸相同的特征图。
子像素模块,用于对池化模块输出的特征图进行解码,得到人群密度图信息,部分恢复特征图的空间分辨率。
密集人群计数装置根据子像素模块输出的人群密度图信息,确定出待检测图像的人群密度图。
S103、根据人群密度图确定待检测图像中的人像数量。
在本实施例中,密集人群计数装置根据上述步骤中确定的人群密度图,对人群密度图进行积分求和,得到待检测图像中的人像数量。
本发明实施例提供的密集人群计数方法,通过获取包含人像的待检测图像,将待检测图像输入到卷积神经网络模型中,得到待检测图像的人群密度图,根据人群密度图确定待检测图像中的人像数量。通过上述方法,充分提取待检测图像中的特征信息,实现效果良好的人群计数与密度估计,为后续的安全监测、人群管控等应用带来极大的便利。
在上述实施例的基础上,本实施例提供的密集人群计数方法对如何获取待检测图像的人群密度图作出详细说明,下面结合附图对本实施例提供的密集人群计数方法进行说明。
图3为本发明另一实施例提供的密集人群计数方法的流程示意图,图4为本发明一实施例提供的残差融合模块的结构示意图,图5为本发明一实施例提供的嵌套空洞卷积层的结构示意图,图6为本发明一实施例提供的池化模块的结构示意图。
如图3所示,本实施例提供的密集人群计数方法包括以下步骤:
S301、获取待检测图像,待检测图像中包括人像;
本实施例的S301与上述实施例的S101的实现原理和技术效果相同,具体可参见上述实施例,此处不再赘述。
S302、将待检测图像输入到卷积模块,对待检测图像进行预处理,得到第一特征图像;
在本实施例中,密集人群计数装置将待检测图像输入到卷积模块中,该卷积模块采用卷积核大小为7×7,步长为2的卷积层,对待检测图像进行初步的特征提取,初步降低待检测图像的空间分辨率。
举例来说,若输入的待检测图像的空间分辨率为512×512×3,经卷积模块初步处理后的第一特征图像的空间分辨率为256×256×64。即RGB三通道的输入图像,经初步处理后特征图像的通道数变为64,相当于64张256×256的特征图像,每张特征图像中包含不同的特征信息。
S303、将第一特征图像输入到残差融合模块,对第一特征图像进行第一次多尺度特征提取与融合,得到第二特征图像;
在人群计数问题中,由于待检测图像中每一个人像的尺寸并不统一,近距离的人像较大,远距离的人像十分微小,造成对待检测图像中人群数目的统计困难,因此对待检测图像中目标人像的多尺度信息提取至关重要。
在本实施例中,残差融合模块包括四个嵌套空洞卷积层,所述嵌套空洞卷积层包括空洞系数分别为1、2、4的空洞卷积核。残差融合模块的具体结构参见图4,嵌套空洞卷积层的具体结构参见图5。
如图4所示,本实施例提供的残差融合模块包括四个嵌套空洞卷积层。具体来说,前两个嵌套空洞卷积层之后添加第一次残差连接,即将1×1卷积后的特征图与经过前两个嵌套空洞卷积层的特征图进行第一次求和操作;随后通过后两个嵌套空洞卷积层,并添加第二次残差连接,即将1×1卷积后的特征图与经过后两个嵌套空洞卷积层的特征图进行第二次求和操作,得到最终的第二特征图像。上述过程为经过一个残差融合模块的处理过程。
本实施例的残差融合模块具体包括:一个第一残差融合模块以及三个第二残差融合模块。第一特征图像通过第一残差融合模块后,依次经过三个第二残差融合模块。上述连接结构促进梯度反向传播,并减小信息传递过程中的丢失。
其中,第一残差融合模块中的所有卷积层不会对特征图的尺寸产生影响,也就是说图像尺寸不变;
第二残差融合模块中的前两个嵌套空洞卷积层和第一次残差连接中的1×1卷积层会对图像进行下采样和增加通道数的处理,剩余的卷积层不会对特征图的尺寸产生影响。例如,第二残差融合模块的输入特征图的尺寸为256×256×64,经过前两个嵌套空洞卷积层和第一次残差连接后的特征图的尺寸为128×128×128,再经过后两个嵌套空洞卷积层和第二次残差连接后的特征图的尺寸仍为128×128×128。
综合上述第一残差融合模块以及第二残差融合模块,假设输入到残差融合模块的第一特征图像的尺寸为256×256×64,经过第一残差融合模块后的特征图尺寸保持不变,依次经过后三个第二残差融合模块的特征图尺寸分别为128×128×128,64×64×256,32×32×512。
在上述特征图处理过程中,为了进一步缩小特征图尺寸并提取更大范围的特征,后三个第二残差融合模块的前两个嵌套空洞卷积层对图像进行下采样,同时增加其通道数,避免了特征信息的大量流失;同时为了保证残差连接的可行性,后三个第二残差融合模块的第一次残差连接中的1×1卷积层对图像进行相同的下采样和增加通道数的处理,保证了特征图尺寸的一致性。
如图5所示,本实施例的嵌套空洞卷积层具体包括空洞系数分别为1、2、4的卷积核,其中每个空洞卷积核的大小为3×3,且三个空洞卷积核并联设置,随后通过拼接、批量归一化层以及ReLU非线性激活层,输出处理后的特征图。
空洞卷积是在保证参数量不变的情况下,将普通卷积的卷积核进行扩张得到的,即在卷积核中心、四角与四边中心处保持原值,其余部分均为0。空洞卷积通过调整其参数,在参数量不变的同时可随意增大卷积的感受野,从而得以提取不同大小的区域的特征。示例性的,图7为本发明实施例提供的空洞参数分别为1、2、4的卷积核的结构示意图,图中黑点区域代表卷积核中有参数的部分,其他区域代表卷积核中的“空洞”。
本实施例通过三种不同的卷积核可在同一卷积层中提取三种不同大小感受野的信息,即三种不同尺度的特征,其参数和计算量与普通的卷积层相同。
S304、将第二特征图像输入到池化模块,对第二特征图像进行第二次多尺度特征提取与融合,得到第三特征图像;
如图6所示,本实施例中的池化模块包括四个平均池化层,其中每个平均池化层采用不同尺寸的池化核,且四个平均池化层并联设置,随后经过拼接、1×1卷积,输出处理后的第三特征图像。
本实施例的池化模块通过设置核的大小对相应尺寸感受野的信息进行提取和抽象。普通的池化模块中池化核的尺寸是固定的,只能池化固定尺寸的感受野的信息,这在目标尺寸变化很大的情况下对模型的性能帮助很小。
本实施例采用多尺度的池化模块,分别使用四种不同尺寸的池化层对特征图进行池化,以提取并抽象多种尺寸的感受野的信息,再将四种池化层的结果通过拼接结合到一起,使用卷积核尺寸为1的卷积层对其进行融合与降维。即实现了进一步的多尺度特征提取与融合。
举例来说,池化核的尺寸分别为原特征图的1/2,1/4,1/8,1/16,以尺寸为32×32×512的特征图为例,其池化核的尺寸应分别为16×16,8×8,4×4,2×2。
S305、将第三特征图像输入到子像素模块,对第三特征图像进行解码,得到人群密度图;
具体的,将第三特征图像输入到子像素模块,对第三特征图像进行解码,得到第四特征图像;对第四特征图像进行卷积,并采用双线性差值法得到人群密度图。
可采用1×1卷积层整合第四特征图像,采用双线性差值法完全恢复其空间分辨率,得到与原图相同大小的单通道人群密度图。
本实施例的子像素模块通过将通道维度的信息转换到空间维度上,用某一像素点多通道的拼接代替原像素点,实现了在不引入任何参数的情况下对特征图进行解码,增大了空间维度尺寸,减小了通道维度尺寸。经过子像素模块,高维特征图内的信息被基本解码为生成密度图所需的信息,特征图分辨率扩大了4倍。
举例来说,图8为本发明一实施例提供的子像素模块的示意图,如图8所示,第三特征图像中的某一像素点4个通道的值分别为p1,1,1,p1,1,2,p1,1,3,p1,1,4,子像素模块将该像素点后3个通道的值p1,1,2,p1,1,3,p1,1,4填入到第一通道特征图的第一像素点p1,1,1与其他像素点之间,生成一个2×2的特征图。将第三特征图像中的每个像素点均进行上述操作后,得到扩张后的特征图,其空间分辨率变为原来的2倍,且通道数变为原来的1/4。
S306、根据人群密度图确定待检测图像中的人像数量。
本实施例的S306与上述实施例的S103的实现原理和技术效果相同,具体可参见上述实施例,此处不再赘述。
生成人群密度图的方法有很多,近年来效果较好的方法大部分为基于多路卷积的方法,使用多路具有不同大小卷积核的卷积神经网络提取原始图像中的多尺度信息,之后将得到的多组特征图进行融合,得到最终的密度图,在一定程度上解决了人群计数中最为棘手的多尺度问题。但此类方法由于使用多路不同的卷积神经网络,多路分支的参数及其提取的特征均存在大量冗余,同时由于参数量巨大,为了控制参数导致卷积神经网络较浅,每一路分支的卷积神经网络都无法充分地提取相应的特征信息,在一定程度上限制了其效果。
本发明实施例提供的密集人群计数方法,通过获取包含人像的待检测图像,带检测图像依次经过卷积神经网路模型中的卷积模块、四个残差融合模块、池化模块以及子像素模块,再经过1×1卷积,并采用双线性差值法得到最终的人群密度图,根据人群密度图确定待检测图像中的人像数量。通过上述方法,充分提取待检测图像中的特征信息,实现效果良好的人群计数与密度估计,为后续的安全监测、人群管控等应用带来极大的便利。
图9为本发明一实施例提供的密集人群计数装置的结构示意图,如图9所示,本实施例提供的密集人群计数装置90,包括:
获取模块91,用于获取待检测图像,所述待检测图像中包括人像;
处理模块92,用于将所述待检测图像输入到卷积神经网络模型中,得到所述待检测图像的人群密度图;
确定模块93,用于根据所述人群密度图确定所述待检测图像中的人像数量。
在一种可能的实现方式中,所述卷积神经网络模型包括依次连接的卷积模块、残差融合模块、池化模块以及子像素模块。
在一种可能的实现方式中,所述处理模块92,具体用于:
将所述待检测图像输入到所述卷积模块,对所述待检测图像进行预处理,得到第一特征图像;
将所述第一特征图像输入到所述残差融合模块,对所述第一特征图像进行第一次多尺度特征提取与融合,得到第二特征图像;
将所述第二特征图像输入到所述池化模块,对所述第二特征图像进行第二次多尺度特征提取与融合,得到第三特征图像;
将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到人群密度图。
在一种可能的实现方式中,所述将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到人群密度图,包括:
将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到第四特征图像;
对所述第四特征图像进行卷积,并采用双线性差值法得到人群密度图。
在一种可能的实现方式中,所述根据所述人群密度图确定所述待检测图像中的人像数量,包括:
对所述人群密度图进行积分求和得到所述待检测图像中的人像数量。
在一种可能的实现方式中,所述残差融合模块包括四个嵌套空洞卷积层,所述嵌套空洞卷积层包括空洞系数分别为1、2、4的空洞卷积核。
在一种可能的实现方式中,所述池化模块包括四个平均池化层。
本实施例提供的密集人群计数装置,可以执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图10为本发明一实施例提供的密集人群计数装置的硬件结构示意图,如图10所示,本实施例提供的密集人群计数装置包括:
存储器1011;
处理器1012;以及
计算机程序;
其中,计算机程序存储在存储器1011中,并被配置为由处理器1012执行以实现如前述任一项方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
可选的,存储器1011既可以是独立的,也可以跟处理器1012集成在一起。
当存储器1011是独立于处理器1012之外的器件时,密集人群计数装置还包括:
总线1013,用于连接存储器1011和处理器1012。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器1012执行以实现如上方法实施例中密集人群计数装置所执行的各个步骤。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种密集人群计数方法,其特征在于,包括:
获取待检测图像,所述待检测图像中包括人像;
将所述待检测图像输入到卷积神经网络模型中,得到所述待检测图像的人群密度图;
根据所述人群密度图确定所述待检测图像中的人像数量。
2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络模型包括依次连接的卷积模块、残差融合模块、池化模块以及子像素模块。
3.根据权利要求2所述的方法,其特征在于,所述将所述待检测图像输入到卷积神经网络模型中,得到所述待检测图像的人群密度图,包括:
将所述待检测图像输入到所述卷积模块,对所述待检测图像进行预处理,得到第一特征图像;
将所述第一特征图像输入到所述残差融合模块,对所述第一特征图像进行第一次多尺度特征提取与融合,得到第二特征图像;
将所述第二特征图像输入到所述池化模块,对所述第二特征图像进行第二次多尺度特征提取与融合,得到第三特征图像;
将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到人群密度图。
4.根据权利要求3所述的方法,其特征在于,所述将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到人群密度图,包括:
将所述第三特征图像输入到所述子像素模块,对所述第三特征图像进行解码,得到第四特征图像;
对所述第四特征图像进行卷积,并采用双线性差值法得到人群密度图。
5.根据权利要求1所述的方法,其特征在于,所述根据所述人群密度图确定所述待检测图像中的人像数量,包括:
对所述人群密度图进行积分求和得到所述待检测图像中的人像数量。
6.根据权利要求2所述的方法,其特征在于,所述残差融合模块包括四个嵌套空洞卷积层,所述嵌套空洞卷积层包括空洞系数分别为1、2、4的空洞卷积核。
7.根据权利要求2所述的方法,其特征在于,所述池化模块包括四个平均池化层。
8.一种密集人群计数装置,其特征在于,包括:
获取模块,用于获取待检测图像,所述待检测图像中包括人像;
处理模块,用于将所述待检测图像输入到卷积神经网络模型中,得到所述待检测图像的人群密度图;
确定模块,用于根据所述人群密度图确定所述待检测图像中的人像数量。
9.一种密集人群计数装置,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-7任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810986919.0A CN109241895B (zh) | 2018-08-28 | 2018-08-28 | 密集人群计数方法及装置 |
US16/261,428 US11126862B2 (en) | 2018-08-28 | 2019-01-29 | Dense crowd counting method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810986919.0A CN109241895B (zh) | 2018-08-28 | 2018-08-28 | 密集人群计数方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109241895A true CN109241895A (zh) | 2019-01-18 |
CN109241895B CN109241895B (zh) | 2021-06-04 |
Family
ID=65068660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810986919.0A Active CN109241895B (zh) | 2018-08-28 | 2018-08-28 | 密集人群计数方法及装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11126862B2 (zh) |
CN (1) | CN109241895B (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829926A (zh) * | 2019-01-30 | 2019-05-31 | 杭州鸿泉物联网技术股份有限公司 | 道路场景语义分割方法及装置 |
CN109934148A (zh) * | 2019-03-06 | 2019-06-25 | 华瑞新智科技(北京)有限公司 | 一种基于无人机的实时人群计数方法、装置及无人机 |
CN109948553A (zh) * | 2019-03-20 | 2019-06-28 | 北京航空航天大学 | 一种多尺度密集人群计数方法 |
CN110020606A (zh) * | 2019-03-13 | 2019-07-16 | 北京工业大学 | 一种基于多尺度卷积神经网络的人群密度估计方法 |
CN110084155A (zh) * | 2019-04-12 | 2019-08-02 | 苏州大学 | 一种密集人数计数的方法、装置、设备以及存储介质 |
CN110705340A (zh) * | 2019-08-12 | 2020-01-17 | 广东石油化工学院 | 一种基于注意力神经网络场的人群计数方法 |
CN110781845A (zh) * | 2019-10-29 | 2020-02-11 | 北京迈格威科技有限公司 | 基于图像统计目标对象的方法、装置和电子系统 |
CN110853025A (zh) * | 2019-11-15 | 2020-02-28 | 苏州大学 | 基于多列残差空洞卷积神经网络的人群密度预测方法 |
CN110930384A (zh) * | 2019-11-20 | 2020-03-27 | 山东师范大学 | 基于密度信息的人群计数方法、装置、设备以及介质 |
CN110956122A (zh) * | 2019-11-27 | 2020-04-03 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备、存储介质 |
CN110991252A (zh) * | 2019-11-07 | 2020-04-10 | 郑州大学 | 一种不均衡场景中人群分布与计数的检测方法 |
CN111144377A (zh) * | 2019-12-31 | 2020-05-12 | 北京理工大学 | 一种基于人群计数算法的密集区域预警方法 |
CN111274900A (zh) * | 2020-01-15 | 2020-06-12 | 北京航空航天大学 | 一种基于底层特征提取的空基人群计数方法 |
CN111507183A (zh) * | 2020-03-11 | 2020-08-07 | 杭州电子科技大学 | 一种基于多尺度密度图融合空洞卷积的人群计数方法 |
CN111814589A (zh) * | 2020-06-18 | 2020-10-23 | 浙江大华技术股份有限公司 | 部位识别方法以及相关设备、装置 |
CN112200201A (zh) * | 2020-10-13 | 2021-01-08 | 上海商汤智能科技有限公司 | 一种目标检测方法及装置、电子设备和存储介质 |
CN112419262A (zh) * | 2020-11-19 | 2021-02-26 | 上海联影智能医疗科技有限公司 | 骨髓涂片显微图像分析方法、装置、电子设备及存储介质 |
CN112541891A (zh) * | 2020-12-08 | 2021-03-23 | 山东师范大学 | 一种基于空洞卷积高分辨率网络的人群计数方法及系统 |
CN112633299A (zh) * | 2020-12-30 | 2021-04-09 | 深圳市优必选科技股份有限公司 | 一种目标检测方法、网络、装置、终端设备及存储介质 |
CN112632601A (zh) * | 2020-12-16 | 2021-04-09 | 苏州玖合智能科技有限公司 | 面向地铁车厢场景的人群计数方法 |
CN113191301A (zh) * | 2021-05-14 | 2021-07-30 | 上海交通大学 | 融合时序和空间信息的视频密集人群计数方法及系统 |
CN113343790A (zh) * | 2021-05-21 | 2021-09-03 | 中车唐山机车车辆有限公司 | 一种交通枢纽的客流统计方法、装置及存储介质 |
CN113807334A (zh) * | 2021-11-22 | 2021-12-17 | 成都航空职业技术学院 | 一种基于残差网络的多尺度特征融合的人群密度估计方法 |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11030724B2 (en) | 2018-09-13 | 2021-06-08 | Samsung Electronics Co., Ltd. | Method and apparatus for restoring image |
US11048948B2 (en) * | 2019-06-10 | 2021-06-29 | City University Of Hong Kong | System and method for counting objects |
KR20190099155A (ko) * | 2019-08-06 | 2019-08-26 | 엘지전자 주식회사 | 사람수 카운팅 장치 및 사람수 카운팅 방법 |
CN113378608B (zh) * | 2020-03-10 | 2024-04-19 | 顺丰科技有限公司 | 人群计数方法、装置、设备及存储介质 |
CN113468931B (zh) * | 2020-03-31 | 2022-04-29 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN111523555A (zh) * | 2020-04-24 | 2020-08-11 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111626134B (zh) * | 2020-04-28 | 2023-04-21 | 上海交通大学 | 一种基于隐密度分布的密集人群计数方法、系统及终端 |
CN111563447B (zh) * | 2020-04-30 | 2022-07-22 | 南京邮电大学 | 一种基于密度图的人群密度分析与检测定位方法 |
CN111709290B (zh) * | 2020-05-18 | 2023-07-14 | 杭州电子科技大学 | 基于编解码-跳跃连接尺度金字塔网络的人群计数方法 |
CN111582251B (zh) * | 2020-06-15 | 2021-04-02 | 江苏航天大为科技股份有限公司 | 基于卷积神经网络的城市轨道交通乘客拥挤程度检测方法 |
CN112102176A (zh) * | 2020-07-27 | 2020-12-18 | 中山大学 | 基于多尺度密集混合注意力神经网络的图像去雨方法 |
CN111985357A (zh) * | 2020-08-03 | 2020-11-24 | 北京海益同展信息科技有限公司 | 一种目标对象检测方法、装置、电子设备及存储介质 |
CN111862223B (zh) * | 2020-08-05 | 2022-03-22 | 西安交通大学 | 一种电子元件的视觉计数及定位方法 |
CN112001274B (zh) * | 2020-08-06 | 2023-11-17 | 腾讯科技(深圳)有限公司 | 人群密度确定方法、装置、存储介质和处理器 |
CN111950443B (zh) * | 2020-08-10 | 2023-12-29 | 北京师范大学珠海分校 | 一种多尺度卷积神经网络的密集人群计数方法 |
CN112084868B (zh) * | 2020-08-10 | 2022-12-23 | 北京航空航天大学 | 一种基于注意力机制的遥感图像中目标计数方法 |
CN112396000B (zh) * | 2020-11-19 | 2023-09-05 | 中山大学 | 一种多模态密集预测的深度信息传输模型的构建方法 |
CN112633089B (zh) * | 2020-12-11 | 2024-01-09 | 深圳市爱培科技术股份有限公司 | 一种视频行人重识别方法、智能终端及存储介质 |
CN112989916A (zh) * | 2020-12-17 | 2021-06-18 | 北京航空航天大学 | 一种结合密度估计与目标检测的人群计数方法 |
CN112784685B (zh) * | 2020-12-28 | 2022-08-26 | 山东师范大学 | 基于多尺度引导注意力机制网络的人群计数方法及系统 |
CN112668537A (zh) * | 2021-01-06 | 2021-04-16 | 北京理工大学 | 一种基于多尺度跳跃连接的群体计数方法 |
CN112766123B (zh) * | 2021-01-11 | 2022-07-22 | 山东师范大学 | 一种基于纵横交叉注意力网络的人群计数方法及系统 |
CN112800930A (zh) * | 2021-01-25 | 2021-05-14 | 北京市商汤科技开发有限公司 | 非机动车计数方法、装置、设备及存储介质 |
CN112597985B (zh) * | 2021-03-04 | 2021-07-02 | 成都西交智汇大数据科技有限公司 | 一种基于多尺度特征融合的人群计数方法 |
CN112818945A (zh) * | 2021-03-08 | 2021-05-18 | 北方工业大学 | 适用于地铁车站人群计数的卷积网络构建方法 |
CN113158780B (zh) * | 2021-03-09 | 2023-10-27 | 中国科学院深圳先进技术研究院 | 区域人群密度估计方法、电子设备及存储介质 |
CN112651390B (zh) * | 2021-03-11 | 2021-09-10 | 江苏金智教育信息股份有限公司 | 一种基于卷积神经网络的图片人头计数的方法和装置 |
CN113192006A (zh) * | 2021-04-06 | 2021-07-30 | 山东师范大学 | 一种基于双模态网络的人群计数方法及系统 |
CN112801063B (zh) * | 2021-04-12 | 2021-07-20 | 广东众聚人工智能科技有限公司 | 神经网络系统和基于神经网络系统的图像人群计数方法 |
CN113516029B (zh) * | 2021-04-28 | 2023-11-07 | 上海科技大学 | 基于部分标注的图像人群计数方法、装置、介质及终端 |
CN113486815B (zh) * | 2021-07-09 | 2022-10-21 | 山东力聚机器人科技股份有限公司 | 一种行人重识别系统和方法、计算机设备及存储介质 |
CN113591667B (zh) * | 2021-07-26 | 2024-03-26 | 公安部第一研究所 | 一种基于人头检测的密集人群检测方法 |
CN113538400B (zh) * | 2021-07-29 | 2022-08-26 | 燕山大学 | 一种跨模态人群计数方法及系统 |
CN113642455A (zh) * | 2021-08-11 | 2021-11-12 | 云从科技集团股份有限公司 | 行人数量确定方法、装置以及计算机可读存储介质 |
CN114120361B (zh) * | 2021-11-19 | 2023-06-02 | 西南交通大学 | 一种基于编解码结构的人群计数定位方法 |
CN114399728B (zh) * | 2021-12-17 | 2023-12-05 | 燕山大学 | 一种雾天场景人群计数方法 |
CN114494999B (zh) * | 2022-01-18 | 2022-11-15 | 西南交通大学 | 一种双分支联合型目标密集预测方法及系统 |
CN116363598A (zh) * | 2023-05-29 | 2023-06-30 | 深圳市捷易科技有限公司 | 人群拥挤预警方法、装置、电子设备及可读存储介质 |
CN117253184A (zh) * | 2023-08-25 | 2023-12-19 | 燕山大学 | 一种雾先验频域注意表征引导的雾天图像人群计数方法 |
CN117115723B (zh) * | 2023-10-23 | 2024-01-23 | 四川泓宝润业工程技术有限公司 | 一种消防设施计数方法、装置、存储介质及电子设备 |
CN117315428B (zh) * | 2023-10-30 | 2024-04-05 | 燕山大学 | 一种跨模态特征对齐融合的人群计数系统及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778502A (zh) * | 2016-11-21 | 2017-05-31 | 华南理工大学 | 一种基于深度残差网络的人群计数方法 |
CN107967451A (zh) * | 2017-11-23 | 2018-04-27 | 常州大学 | 一种利用多尺度多任务卷积神经网络对静止图像进行人群计数的方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI438728B (zh) * | 2012-04-25 | 2014-05-21 | Hon Hai Prec Ind Co Ltd | 交通流量管控系統及方法 |
CN107566781B (zh) * | 2016-06-30 | 2019-06-21 | 北京旷视科技有限公司 | 视频监控方法和视频监控设备 |
JP6942488B2 (ja) * | 2017-03-03 | 2021-09-29 | キヤノン株式会社 | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
JP6914699B2 (ja) * | 2017-04-04 | 2021-08-04 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
US10810723B2 (en) * | 2017-11-15 | 2020-10-20 | NEC Laboratories Europe GmbH | System and method for single image object density estimation |
US10841723B2 (en) * | 2018-07-02 | 2020-11-17 | Harman International Industries, Incorporated | Dynamic sweet spot calibration |
US10453197B1 (en) * | 2019-02-18 | 2019-10-22 | Inception Institute of Artificial Intelligence, Ltd. | Object counting and instance segmentation using neural network architectures with image-level supervision |
-
2018
- 2018-08-28 CN CN201810986919.0A patent/CN109241895B/zh active Active
-
2019
- 2019-01-29 US US16/261,428 patent/US11126862B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778502A (zh) * | 2016-11-21 | 2017-05-31 | 华南理工大学 | 一种基于深度残差网络的人群计数方法 |
CN107967451A (zh) * | 2017-11-23 | 2018-04-27 | 常州大学 | 一种利用多尺度多任务卷积神经网络对静止图像进行人群计数的方法 |
Non-Patent Citations (2)
Title |
---|
袁烨等: "基于卷积神经网络的人群计数研究", 《成组技术与生产现代化》 * |
陈思秦: "基于全卷积神经网络的人群计数", 《电子设计工程》 * |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829926A (zh) * | 2019-01-30 | 2019-05-31 | 杭州鸿泉物联网技术股份有限公司 | 道路场景语义分割方法及装置 |
CN109934148A (zh) * | 2019-03-06 | 2019-06-25 | 华瑞新智科技(北京)有限公司 | 一种基于无人机的实时人群计数方法、装置及无人机 |
CN110020606B (zh) * | 2019-03-13 | 2021-03-30 | 北京工业大学 | 一种基于多尺度卷积神经网络的人群密度估计方法 |
CN110020606A (zh) * | 2019-03-13 | 2019-07-16 | 北京工业大学 | 一种基于多尺度卷积神经网络的人群密度估计方法 |
CN109948553A (zh) * | 2019-03-20 | 2019-06-28 | 北京航空航天大学 | 一种多尺度密集人群计数方法 |
CN110084155A (zh) * | 2019-04-12 | 2019-08-02 | 苏州大学 | 一种密集人数计数的方法、装置、设备以及存储介质 |
CN110084155B (zh) * | 2019-04-12 | 2022-04-12 | 苏州大学 | 一种密集人数计数的方法、装置、设备以及存储介质 |
CN110705340B (zh) * | 2019-08-12 | 2023-12-26 | 广东石油化工学院 | 一种基于注意力神经网络场的人群计数方法 |
CN110705340A (zh) * | 2019-08-12 | 2020-01-17 | 广东石油化工学院 | 一种基于注意力神经网络场的人群计数方法 |
CN110781845B (zh) * | 2019-10-29 | 2023-04-07 | 北京迈格威科技有限公司 | 基于图像统计目标对象的方法、装置和电子系统 |
CN110781845A (zh) * | 2019-10-29 | 2020-02-11 | 北京迈格威科技有限公司 | 基于图像统计目标对象的方法、装置和电子系统 |
CN110991252A (zh) * | 2019-11-07 | 2020-04-10 | 郑州大学 | 一种不均衡场景中人群分布与计数的检测方法 |
CN110991252B (zh) * | 2019-11-07 | 2023-07-21 | 郑州大学 | 一种不均衡场景中人群分布与计数的检测方法 |
CN110853025A (zh) * | 2019-11-15 | 2020-02-28 | 苏州大学 | 基于多列残差空洞卷积神经网络的人群密度预测方法 |
CN110930384A (zh) * | 2019-11-20 | 2020-03-27 | 山东师范大学 | 基于密度信息的人群计数方法、装置、设备以及介质 |
TWI752466B (zh) * | 2019-11-27 | 2022-01-11 | 大陸商深圳市商湯科技有限公司 | 影像處理方法、處理器、電子設備、儲存媒介 |
WO2021103187A1 (zh) * | 2019-11-27 | 2021-06-03 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备、存储介质 |
CN110956122B (zh) * | 2019-11-27 | 2022-08-02 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备、存储介质 |
JP2022516398A (ja) * | 2019-11-27 | 2022-02-28 | 深▲セン▼市商▲湯▼科技有限公司 | 画像処理方法及び画像処理装置、プロセッサ、電子機器並びに記憶媒体 |
CN110956122A (zh) * | 2019-11-27 | 2020-04-03 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备、存储介质 |
CN111144377B (zh) * | 2019-12-31 | 2023-05-16 | 北京理工大学 | 一种基于人群计数算法的密集区域预警方法 |
CN111144377A (zh) * | 2019-12-31 | 2020-05-12 | 北京理工大学 | 一种基于人群计数算法的密集区域预警方法 |
CN111274900B (zh) * | 2020-01-15 | 2021-01-01 | 北京航空航天大学 | 一种基于底层特征提取的空基人群计数方法 |
CN111274900A (zh) * | 2020-01-15 | 2020-06-12 | 北京航空航天大学 | 一种基于底层特征提取的空基人群计数方法 |
CN111507183A (zh) * | 2020-03-11 | 2020-08-07 | 杭州电子科技大学 | 一种基于多尺度密度图融合空洞卷积的人群计数方法 |
CN111507183B (zh) * | 2020-03-11 | 2021-02-02 | 杭州电子科技大学 | 一种基于多尺度密度图融合空洞卷积的人群计数方法 |
CN111814589A (zh) * | 2020-06-18 | 2020-10-23 | 浙江大华技术股份有限公司 | 部位识别方法以及相关设备、装置 |
CN112200201A (zh) * | 2020-10-13 | 2021-01-08 | 上海商汤智能科技有限公司 | 一种目标检测方法及装置、电子设备和存储介质 |
CN112419262A (zh) * | 2020-11-19 | 2021-02-26 | 上海联影智能医疗科技有限公司 | 骨髓涂片显微图像分析方法、装置、电子设备及存储介质 |
CN112541891A (zh) * | 2020-12-08 | 2021-03-23 | 山东师范大学 | 一种基于空洞卷积高分辨率网络的人群计数方法及系统 |
CN112632601A (zh) * | 2020-12-16 | 2021-04-09 | 苏州玖合智能科技有限公司 | 面向地铁车厢场景的人群计数方法 |
CN112632601B (zh) * | 2020-12-16 | 2024-03-12 | 苏州玖合智能科技有限公司 | 面向地铁车厢场景的人群计数方法 |
CN112633299A (zh) * | 2020-12-30 | 2021-04-09 | 深圳市优必选科技股份有限公司 | 一种目标检测方法、网络、装置、终端设备及存储介质 |
CN112633299B (zh) * | 2020-12-30 | 2024-01-16 | 深圳市优必选科技股份有限公司 | 一种目标检测方法、网络、装置、终端设备及存储介质 |
CN113191301A (zh) * | 2021-05-14 | 2021-07-30 | 上海交通大学 | 融合时序和空间信息的视频密集人群计数方法及系统 |
CN113343790A (zh) * | 2021-05-21 | 2021-09-03 | 中车唐山机车车辆有限公司 | 一种交通枢纽的客流统计方法、装置及存储介质 |
CN113807334B (zh) * | 2021-11-22 | 2022-02-18 | 成都航空职业技术学院 | 一种基于残差网络的多尺度特征融合的人群密度估计方法 |
CN113807334A (zh) * | 2021-11-22 | 2021-12-17 | 成都航空职业技术学院 | 一种基于残差网络的多尺度特征融合的人群密度估计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109241895B (zh) | 2021-06-04 |
US20200074186A1 (en) | 2020-03-05 |
US11126862B2 (en) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241895A (zh) | 密集人群计数方法及装置 | |
CN108710830B (zh) | 一种结合密集连接注意力金字塔残差网络和等距限制的人体3d姿势估计方法 | |
CN109522874B (zh) | 人体动作识别方法、装置、终端设备及存储介质 | |
CN113033570B (zh) | 一种改进空洞卷积和多层次特征信息融合的图像语义分割方法 | |
CN110674704A (zh) | 一种基于多尺度扩张卷积网络的人群密度估计方法及装置 | |
CN107239786A (zh) | 一种字符识别方法和装置 | |
CN114359851A (zh) | 无人驾驶目标检测方法、装置、设备及介质 | |
CN108961180A (zh) | 红外图像增强方法及系统 | |
US20230298314A1 (en) | Image clustering method and apparatus, computer device, and storage medium | |
CN116597326A (zh) | 一种基于改进YOLOv7算法的无人机航拍小目标检测方法 | |
CN111951260B (zh) | 基于部分特征融合卷积神经网络实时目标计数系统及方法 | |
CN115984949B (zh) | 一种带有注意力机制的低质量人脸图像识别方法及设备 | |
CN113496138A (zh) | 稠密点云数据的生成方法、装置、计算机设备及存储介质 | |
CN116310323A (zh) | 一种飞机目标实例分割方法、系统和可读存储介质 | |
CN112861697B (zh) | 基于图片自对称性人群计数网络的人群计数方法及装置 | |
CN116071279A (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN114022458A (zh) | 骨架检测方法、装置、电子设备和计算机可读存储介质 | |
CN112001479B (zh) | 基于深度学习模型的处理方法、系统及电子设备 | |
CN114638866A (zh) | 一种基于局部特征学习的点云配准方法及系统 | |
CN114821216A (zh) | 图片去网纹神经网络模型建模、使用方法及相关设备 | |
CN113723411A (zh) | 一种用于遥感图像语义分割的特征提取方法和分割系统 | |
Ulyanov et al. | The investigation of the using the cyclic generative-competitive neural networks for image stylization | |
CN115761552B (zh) | 面向无人机机载平台的目标检测方法、设备及介质 | |
CN114882449B (zh) | 一种基于Car-Det网络模型的车辆检测方法及装置 | |
CN117274608B (zh) | 基于空间细节感知和注意力引导的遥感图像语义分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |