CN114898301A - 基于检测和分割的人群密度统计方法、装置、设备及介质 - Google Patents

基于检测和分割的人群密度统计方法、装置、设备及介质 Download PDF

Info

Publication number
CN114898301A
CN114898301A CN202210645973.5A CN202210645973A CN114898301A CN 114898301 A CN114898301 A CN 114898301A CN 202210645973 A CN202210645973 A CN 202210645973A CN 114898301 A CN114898301 A CN 114898301A
Authority
CN
China
Prior art keywords
processing
characteristic
feature
detection
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210645973.5A
Other languages
English (en)
Inventor
赵静
林亚龙
虞赛君
洪挺屹
刘强
马迪迪
李进
王婧雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Rail Transit Group Co ltd
Original Assignee
Hefei Rail Transit Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Rail Transit Group Co ltd filed Critical Hefei Rail Transit Group Co ltd
Priority to CN202210645973.5A priority Critical patent/CN114898301A/zh
Publication of CN114898301A publication Critical patent/CN114898301A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种基于检测和分割的人群密度统计方法、装置、设备及介质,方法包括:获取图像数据;对图像数据进行处理,以得到样本图;将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图;根据人群密度图计算出人群数量。本发明基于SwinTransformer目标检测网络进行特征提取,并基于提取的特征进行人群概率密度图预测,增加了目标检测的监督信息,提升模型的预测效果。通过多尺度特征融合可以很好的兼容不同大小尺寸的人体信息。通过增加注意力机制加深模型对人群密度,方便模型更容易剔除背景干扰因素。

Description

基于检测和分割的人群密度统计方法、装置、设备及介质
技术领域
本发明涉及数据统计技术领域,更具体地说是一种基于检测和分割的人群密度统计方法、装置、设备及介质。
背景技术
随着社会的发展,人群计数或者统计是目前工业界和学界的一个研究热点和难点,其在实际生活中有重要应用价值。针对人群密度的统计目前有以下几种方式。
第一种是通过基于空洞卷积与原始卷积进行不同感受野信息的特征融合,以及不同感受野信息的特征融合,以及融合不同分辨率下特征图不同的层级语义信息,从而生产具有更高质量的人群密度图。该专利使用了大量的空洞卷积,这样对图片特征中的连续性信息有所损失,对于密度统计有很大的影响,同时忽略了人群密度近大远小的空间信息。
第二种是通过使用AlexNet网络将人群图片数据集分为密度与稀疏两类,并对两类图像密度特征的不同将其送入对应的特征提取网络。对于密度图像采用注意力机制的方法进行人员密度统计,对于稀疏的人群密度采用空洞卷积的方式进行人员密度统计。该专利首先需要对图片人员密度进行分析需要判断图片中的人员密度是稀疏还是密集,在针对其进行密度分析。该专利无法直接进行人群密度判断,需要对其进行密度稀疏及密集先进行判断,才能进行判断,网络臃肿,无法适应不同程度的人员密度分类。
第三种是基于卷积神经网络进行人群密及数量估计方法,该方法仅仅通过卷积神经网络没有采用多尺度的方法,无法兼容不同尺度大小目标的特征信息,模型预测效果差,识别结果不精准。
第四种是通过目标检测网络来检测人头数,根据人头数来判断人群密度。该方法基于目标价检测人头来判断人群密度对于人体遮挡以及人头遮挡会有漏检的情况,同时对于远处密集的小目标检测召回率低凑儿最终会导致人群密度评估不准的情况。
发明内容
本发明的目的在于克服现有技术的不足,提供基于检测和分割的人群密度统计方法、装置、设备及介质,能够增加目标检测的监督信息,提升模型的预测效果,且能兼容不同大小尺寸的人体信息,以及方便模型更容易剔除背景干扰因素。
为实现上述目的,本发明采用以下技术方案:
第一方面,基于检测和分割的人群密度统计方法,包括:
获取图像数据;
对图像数据进行处理,以得到样本图;
将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图;
根据人群密度图计算出人群数量。
其进一步技术方案为:所述将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图,所述人群密度统计模型的处理方法包括:
将样本图输入到SwinTransformer模型中对人头数据进行目标检测,以得到第一检测特征、第二检测特征、第三检测特征以及第四检测特征;
对第一检测特征、第二检测特征、第三检测特征以及第四检测特征输入可变形卷积块处理,以得到第一处理特征、第二处理特征、第三处理特征以及第四处理特征;
对第四处理特征进行转置卷积处理后再进行上采样处理,以得到第五处理特征;
对第三处理特征进行反池化上采样处理,以得到第六处理特征;
对第二处理特征进行卷积处理,以得到第七处理特征;
将样本图输入到卷积残差网络处理,以得到第八处理特征;
将第八处理特征、第七处理特征、第六处理特征、第五处理特征以及第一处理特征进行concate合并,以得到第一合并特征;
将第一合并特征输入到PPM模型处理,以得到第九处理特征;
将第一处理特征、第二处理特征、第三处理特征以及第四处理特征输入到CBAM注意力机制模型处理,以得到第十处理特征、第十一处理特征、第十二处理特征、第十三处理特征;
将第十处理特征和第九处理特征输入到FAM模型处理,以得到第十四处理特征;
将第十四处理特征与第十一处理特征输入到FAM模型处理,以得到第十五处理特征;
将第十五处理特征与第十二处理特征输入到FAM模型处理,以得到第十六处理特征;
对第十六处理特征输入到上采样块进行三次上采样处理,以得到第一次采样特征、第二次采样特征和第三次采样特征;
将第三次采样特征通过sigmoid函数进行归一化处理,以得到人群密度图。
其进一步技术方案为:所述对第一检测特征、第二检测特征、第三检测特征以及第四检测特征输入可变形卷积块处理,以得到第一处理特征、第二处理特征、第三处理特征以及第四处理特征,所述可变形卷积块分别由可变形卷积,relu激活函数以及BatchNormaliization构成。
其进一步技术方案为:所述将样本图输入到卷积残差网络处理,以得到第八处理特征,所述卷积残差网络分别由残差卷积和mish激活函数构成。
其进一步技术方案为:所述将第一合并特征输入到PPM模型处理,以得到第九处理特征,包括:
将第一合并特征分别通过多尺度特征金字塔进行下采样池化,以得到多个下采样池化特征;
分别对多个下采样池化特征进行卷积上采样处理,以得到多个卷积上采样特征;
对多个卷积上采样特征进行合并后再进行卷积处理,以得到第九处理特征。
其进一步技术方案为:所述将第一处理特征、第二处理特征、第三处理特征以及第四处理特征输入到CBAM注意力机制模型处理,以得到第十处理特征、第十一处理特征、第十二处理特征、第十三处理特征,所述CBAM注意力机制模型由通道注意力机制和空间注意力机制构成。
其进一步技术方案为:所述对第十六处理特征输入到上采样块进行三次上采样处理,以得到第一次采样特征、第二次采样特征和第三次采样特征,所述上采样块由反卷积和relu激活函数构成。
第二方面,基于检测和分割的人群密度统计装置,包括获取单元、处理单元、预测单元以及计算单元;
所述获取单元,用于获取图像数据;
所述处理单元,用于对图像数据进行处理,以得到样本图;
所述预测单元,用于将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图;
所述计算单元,用于根据人群密度图计算出人群数量。
第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的基于检测和分割的人群密度统计方法步骤。
第四方面,一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,使得所述处理器执行如上述的基于检测和分割的人群密度统计方法方法步骤。
本发明与现有技术相比的有益效果是:本发明基于SwinTransformer目标检测网络进行特征提取,并基于提取的特征进行人群概率密度图预测,增加了目标检测的监督信息,提升模型的预测效果。通过多尺度特征融合可以很好的兼容不同大小尺寸的人体信息。通过增加注意力机制加深模型对人群密度,方便模型更容易剔除背景干扰因素。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明技术手段,可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征及优点能够更明显易懂,以下特举较佳实施例,详细说明如下。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明具体实施例提供的基于检测和分割的人群密度统计方法的应用场景示意图;
图2为本发明具体实施例提供的基于检测和分割的人群密度统计方法的流程图;
图3为本发明具体实施例提供的基于检测和分割的人群密度统计方装置的示意性框图;
图4为本发明具体实施例提供一种计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明具体实施例提供的基于检测和分割的人群密度统计方法的应用场景示意图;图2为本发明具体实施例提供的基于检测和分割的人群密度统计方法的流程图,该基于检测和分割的人群密度统计方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,基于检测和分割的人群密度统计方法,包括以下步骤:S10-S40。
S10、获取图像数据。
在本实施例中,通过地铁车厢内的监控设备收集车厢内人群的视频数据(即图像数据),监控设备采用市面上常见的即可,本申请对此不做限定。为了收集每节车厢的视频数据,可在每节车厢内均安装监控设备,每节车厢安装的监控设备所采集到的视频数据可通过有线或者无线的方式汇总到地铁的数据后台中,通过访问数据后台便可查询每节车厢的视频数据情况。
S20、对图像数据进行处理,以得到样本图。
在一实施例中,步骤S20具体包括以下步骤:S201-S202。
S201、对图像数据进行切分,以得到切分图像数据。
在本实施例中,由于地铁需要停靠在不同的站点,所以,每节车厢在每个站点的停靠后上车或下车的情况基本上会发生变化的,因此,可以按照每节车厢对应的每个站点的方式来对图像数据进行切分,便可得到每节车厢对应到每个站点的切分图像数据。
S202、从切分图像数据中选取一帧图片作为样本图。
在本实施例中,由于切分图像数据中包括了多帧图片,因此可从切分图像数据中选取一帧图片作为样本图Iimage进行人头概率预测。
S30、将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图。
在一实施例中,人群密度统计模型的处理方法具体包括以下步骤:S301-S315。
S301、将样本图输入到SwinTransformer模型中对人头数据进行目标检测,以得到第一检测特征、第二检测特征、第三检测特征以及第四检测特征。
在本实施例中,将样本图Iimage输入到SwinTransformer模型中对人头数据进行目标检测,这里的SwinTransformer的Stage总共有4个,这样分别得到特征ST1、特征ST2、特征ST3和特征ST4
人头数据是指图中人体头部的数据。
SwinTransformerr是一个层级结构,类似fpn,抽取不同层次的视觉特征,使其更适合分割检测等任务。
Swin Transformer的整体结构,类似卷积的层级结构,分辨率每层变成一半,而通道数变成两倍。首先Patch Partition,就是VIT中等分成小块的操作;然后分成4个stage,每个stage中包括两个部分,分别是patch Merging(第一个块是线性层)和SwinTransformer Block。patch Merging是一个类似于池化的操作,池化会损失信息,patchMerging不会。
基于SwinTransformer目标检测网络进行特征提取,并基于提取的特征进行人群概率密度图预测,增加了目标检测的监督信息,提升模型的预测效果。
S302、对第一检测特征、第二检测特征、第三检测特征以及第四检测特征输入可变形卷积块处理,以得到第一处理特征、第二处理特征、第三处理特征以及第四处理特征。
在本实施例中,将特征ST1、特征ST2、特征ST3和特征ST4输入到可变形卷积块处理,得到特征T1、特征T2、特征T3和特征T4
可变形卷积块分别由可变形卷积,relu激活函数以及BatchNormaliization构成。
S303、对第四处理特征进行转置卷积处理后再进行上采样处理,以得到第五处理特征。
在本实施例中,对特征T4进行转置卷积处理后进行上采样得到特征C4
S304、对第三处理特征进行反池化上采样处理,以得到第六处理特征。
在本实施例中,对特征T3进行反池化上采样处理,得到特征C3
S305、对第二处理特征进行卷积处理,以得到第七处理特征。
在本实施例中,对于特征T2进行卷积处理,得到特征C2
S306、将样本图输入到卷积残差网络处理,以得到第八处理特征。
在本实施例中,将样本图Iimage输入到卷积残差网络处理,得到特征CR1
卷积残差网络分别由残差卷积和mish激活函数构成。
S307、将第八处理特征、第七处理特征、第六处理特征、第五处理特征以及第一处理特征进行concate合并,以得到第一合并特征。
在本实施例中,将特征CR1、特征C4、特征C3、特征C2以及特征T1进行concate合并得到,得到特征CT。
S308、将第一合并特征输入到PPM模型处理,以得到第九处理特征。
在本实施例中,将特征CT输入到PPM(Pyramid Pooling module)模型处理,得到特征T0
ppm是以一种特殊的池化模型。通过由多到少的池化,可以有效增大感受野,增大全局信息的利用效率。
在一实施例中,步骤S308具体包括以下步骤:S3081-S3083。
S3081、将第一合并特征分别通过多尺度特征金字塔进行下采样池化,以得到多个下采样池化特征。
S3082、分别对多个下采样池化特征进行卷积上采样处理,以得到多个卷积上采样特征。
S3083、对多个卷积上采样特征进行合并后再进行卷积处理,以得到第九处理特征。
在本实施例中,将特征CT通过通过不同尺度金字塔进行下采样池化,再分别进行卷积上采样以及合并后,再进行卷积处理得到特征T0
S309、将第一处理特征、第二处理特征、第三处理特征以及第四处理特征输入到CBAM注意力机制模型处理,以得到第十处理特征、第十一处理特征、第十二处理特征、第十三处理特征。
在本实施例中,将特征T1、特征T2、特征T3和特征T4输入到CBAM注意力机制模型得到特征TCM1、特征TCM2、特征TCM3和特征TCM4
CBAM注意力机制模型由通道注意力机制和空间注意力机制构成。
通过增加注意力机制加深模型对人群密度,方便模型更容易剔除背景干扰因素。
S310、将第十处理特征和第九处理特征输入到FAM模型处理,以得到第十四处理特征。
在本实施例中,将特征TCM1以及特征T0输入到FAM(Flow Align Moudle)模型得到特征FAM2
FAM为模型相邻阶段语义特征流,将语义特征信息传播到高分辨率的空间信息上,使得特征即含有语义信息也同时包含空间信息。
S311、将第十四处理特征与第十一处理特征输入到FAM模型处理,以得到第十五处理特征。
在本实施例中,将特征TCM2与特征FAM2输入到FAM模型中得到特征FAM3
S312、将第十五处理特征与第十二处理特征输入到FAM模型处理,以得到第十六处理特征。
在本实施例中,将特征TCM3与特征FAM3输入到FAM模型中得到特征FAM4
S314、对第十六处理特征输入到上采样块进行三次上采样处理,以得到第一次采样特征、第二次采样特征和第三次采样特征。
在本实施例中,对特征FAM4输入到上采样块进行上采样,上采样块由反卷积和relu激活函数构成。经过3次上采样分别得到特征Fc1、特征Fc2和特征Fc3。其中,特征的大小保持与样本图的大小一致。
S315、将第三次采样特征通过sigmoid函数进行归一化处理,以得到人群密度图。
在本实施例中,通过sigmoid函数将特征Fc3归一化处理得到输出的人群密度图Fout。通过设定人群密度图Fout的每个像素值在0到1之间,即为人头的概率。
S40、根据人群密度图计算出人群数量。
在本实施例中,通过人群密度图Fout上每个像素的概率密度进行累加求和后取整,即得到画面内的人群数量。
另外,人群密度统计模型所使用到的损失函数为目标检测函数、人群密度分割函数和总损失函数,其中,目标检测函数则是基于SwinTransformer输出的特征ST1、特征ST2、特征ST3以及特征ST4进行目标检测,这里的损失包含三个损失,分别是:分类损失函数、回归损失函数和giou损失函数,即Lossod=Lossclassification+Lossregression+Lossgiou
人群密度分割函数是使用L2损失函数,损失函数如下:
Figure BDA0003684112850000101
B为batch size,
Figure BDA0003684112850000102
表示的是人群密度标注图,
Figure BDA0003684112850000103
表示的是人群密度预测图。将Fc2,Fc3通过插值resize将该特征放到大与原图大小一致以及1x1卷积使其通道数为1,经过sigmoid函数归一化之后再分别计算各自与真实人群密度标签图的损失函数,这样做为了更好的加快模型训练速度,同时也计算Fout与真实人群密度标签图的损失函数分别得到Losscrowd density-1,Losscrowd density-2以及Losscrowd density-3,总人群密度损失为Losscrowd density-total=Losscrowd density-1+Losscrowd density-2+Losscrowd density-3
总损失函数为:
Losstotal=αLossod+βLosscrowd density
其中,α为0.2,β为0.8。
对于模型的评估函数分别为MAE评估函数以及RMSE评估函数。
Figure BDA0003684112850000111
Figure BDA0003684112850000112
其中,Ci以及
Figure BDA0003684112850000113
分别代表着真实的人群数量,
Figure BDA0003684112850000114
表示的是预测的人群数量。
本发明基于SwinTransformer目标检测网络进行特征提取,并基于提取的特征进行人群概率密度图预测,增加了目标检测的监督信息,提升模型的预测效果。通过多尺度特征融合可以很好的兼容不同大小尺寸的人体信息。通过增加注意力机制加深模型对人群密度,方便模型更容易剔除背景干扰因素。
图3是本发明实施例提供的基于检测和分割的人群密度统计装置100的示意性框图。对应于上述的基于检测和分割的人群密度统计方法,本发明具体实施例还提供了基于检测和分割的人群密度统计装置100。该基于检测和分割的人群密度统计装置100包括用于执行上述基于检测和分割的人群密度统计方法的单元和模块,该装置可以被配置于服务器中。
如图3所述,基于检测和分割的人群密度统计装置100,包括获取单元110、处理单元120、预测单元130以及计算单元140。
获取单元110,用于获取图像数据。
在本实施例中,通过地铁车厢内的监控设备收集车厢内人群的视频数据(即图像数据),监控设备采用市面上常见的即可,本申请对此不做限定。为了收集每节车厢的视频数据,可在每节车厢内均安装监控设备,每节车厢安装的监控设备所采集到的视频数据可通过有线或者无线的方式汇总到地铁的数据后台中,通过访问数据后台便可查询每节车厢的视频数据情况。
处理单元120,用于对图像数据进行处理,以得到样本图。
在一实施例中,处理单元120包括切分模块和选取模块。
切分模块,用于对图像数据进行切分,以得到切分图像数据。
在本实施例中,由于地铁需要停靠在不同的站点,所以,每节车厢在每个站点的停靠后上车或下车的情况基本上会发生变化的,因此,可以按照每节车厢对应的每个站点的方式来对图像数据进行切分,便可得到每节车厢对应到每个站点的切分图像数据。
选取模块,用于从切分图像数据中选取一帧图片作为样本图。
在本实施例中,由于切分图像数据中包括了多帧图片,因此可从切分图像数据中选取一帧图片作为样本图Iimage进行人头概率预测。
预测单元130,用于将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图。
在一实施例中,预测单元130包括检测模块、第一处理模块、第二处理模块、第三处理模块、第四处理模块、第五处理模块、合并模块、第六处理模块、第七处理模块、第八处理模块、第九处理模块、第十处理模块、第十一处理模块以及第十二处理模块。
检测模块,用于将样本图输入到SwinTransformer模型中对人头数据进行目标检测,以得到第一检测特征、第二检测特征、第三检测特征以及第四检测特征。
在本实施例中,将样本图Iimage输入到SwinTransformer模型中对人头数据进行目标检测,这里的SwinTransformer的Stage总共有4个,这样分别得到特征ST1、特征ST2、特征ST3和特征ST4
人头数据是指图中人体头部的数据。
SwinTransformerr是一个层级结构,类似fpn,抽取不同层次的视觉特征,使其更适合分割检测等任务。
Swin Transformer的整体结构,类似卷积的层级结构,分辨率每层变成一半,而通道数变成两倍。首先Patch Partition,就是VIT中等分成小块的操作;然后分成4个stage,每个stage中包括两个部分,分别是patch Merging(第一个块是线性层)和SwinTransformer Block。patch Merging是一个类似于池化的操作,池化会损失信息,patchMerging不会。
基于SwinTransformer目标检测网络进行特征提取,并基于提取的特征进行人群概率密度图预测,增加了目标检测的监督信息,提升模型的预测效果。
第一处理模块,用于对第一检测特征、第二检测特征、第三检测特征以及第四检测特征输入可变形卷积块处理,以得到第一处理特征、第二处理特征、第三处理特征以及第四处理特征。
在本实施例中,将特征ST1、特征ST2、特征ST3和特征ST4输入到可变形卷积块处理,得到特征T1、特征T2、特征T3和特征T4
可变形卷积块分别由可变形卷积,relu激活函数以及BatchNormaliization构成。
第二处理模块,用于对第四处理特征进行转置卷积处理后再进行上采样处理,以得到第五处理特征。
在本实施例中,对特征T4进行转置卷积处理后进行上采样得到特征C4
第三处理模块,用于对第三处理特征进行反池化上采样处理,以得到第六处理特征。
在本实施例中,对特征T3进行反池化上采样处理,得到特征C3
第四处理模块,用于对第二处理特征进行卷积处理,以得到第七处理特征。
在本实施例中,对于特征T2进行卷积处理,得到特征C2
第五处理模块,用于将样本图输入到卷积残差网络处理,以得到第八处理特征。
在本实施例中,将样本图Iimage输入到卷积残差网络处理,得到特征CR1
卷积残差网络分别由残差卷积和mish激活函数构成。
合并模块,用于将第八处理特征、第七处理特征、第六处理特征、第五处理特征以及第一处理特征进行concate合并,以得到第一合并特征。
在本实施例中,将特征CR1、特征C4、特征C3、特征C2以及特征T1进行concate合并得到,得到特征CT。
第六处理模块,用于将第一合并特征输入到PPM模型处理,以得到第九处理特征。
在本实施例中,将特征CT输入到PPM(Pyramid Pooling module)模型处理,得到特征T0
ppm是以一种特殊的池化模型。通过由多到少的池化,可以有效增大感受野,增大全局信息的利用效率。
在一实施例中,第六处理模块包括第一处理子模块、第二处理子模块和第三处理子模块。
第一处理子模块,用于将第一合并特征分别通过多尺度特征金字塔进行下采样池化,以得到多个下采样池化特征。
第二处理子模块,用于分别对多个下采样池化特征进行卷积上采样处理,以得到多个卷积上采样特征。
第三处理子模块,用于对多个卷积上采样特征进行合并后再进行卷积处理,以得到第九处理特征。
在本实施例中,将特征CT通过通过不同尺度金字塔进行下采样池化,再分别进行卷积上采样以及合并后,再进行卷积处理得到特征T0
第七处理模块,用于将第一处理特征、第二处理特征、第三处理特征以及第四处理特征输入到CBAM注意力机制模型处理,以得到第十处理特征、第十一处理特征、第十二处理特征、第十三处理特征。
在本实施例中,将特征T1、特征T2、特征T3和特征T4输入到CBAM注意力机制模型得到特征TCM1、特征TCM2、特征TCM3和特征TCM4
CBAM注意力机制模型由通道注意力机制和空间注意力机制构成。
通过增加注意力机制加深模型对人群密度,方便模型更容易剔除背景干扰因素。
第八处理模块,用于将第十处理特征和第九处理特征输入到FAM模型处理,以得到第十四处理特征。
在本实施例中,将特征TCM1以及特征T0输入到FAM(FlowAlign Moudle)模型得到特征FAM2
FAM为模型相邻阶段语义特征流,将语义特征信息传播到高分辨率的空间信息上,使得特征即含有语义信息也同时包含空间信息。
第九处理模块,用于将第十四处理特征与第十一处理特征输入到FAM模型处理,以得到第十五处理特征。
在本实施例中,将特征TCM2与特征FAM2输入到FAM模型中得到特征FAM3
第十处理模块,用于将第十五处理特征与第十二处理特征输入到FAM模型处理,以得到第十六处理特征。
在本实施例中,将特征TCM3与特征FAM3输入到FAM模型中得到特征FAM4
第十一处理模块,用于对第十六处理特征输入到上采样块进行三次上采样处理,以得到第一次采样特征、第二次采样特征和第三次采样特征。
在本实施例中,对特征FAM4输入到上采样块进行上采样,上采样块由反卷积和relu激活函数构成。经过3次上采样分别得到特征Fc1、特征Fc2和特征Fc3。其中,特征的大小保持与样本图的大小一致。
第十二处理模块,用于将第三次采样特征通过sigmoid函数进行归一化处理,以得到人群密度图。
在本实施例中,通过sigmoid函数将特征Fc3归一化处理得到输出的人群密度图Fout。通过设定人群密度图Fout的每个像素值在0到1之间,即为人头的概率。
计算单元140,用于根据人群密度图计算出人群数量。
在本实施例中,通过人群密度图Fout上每个像素的概率密度进行累加求和后取整,即得到画面内的人群数量。
另外,人群密度统计模型所使用到的损失函数为目标检测函数、人群密度分割函数和总损失函数,其中,目标检测函数则是基于SwinTransformer输出的特征ST1、特征ST2、特征ST3以及特征ST4进行目标检测,这里的损失包含三个损失,分别是:分类损失函数、回归损失函数和giou损失函数,即Lossod=Lossclassification+Lossregression+Lossgiou
人群密度分割函数是使用L2损失函数,损失函数如下:
Figure BDA0003684112850000161
B为batch size,
Figure BDA0003684112850000162
表示的是人群密度标注图,
Figure BDA0003684112850000163
表示的是人群密度预测图。将Fc2,Fc3通过插值resize将该特征放到大与原图大小一致以及1x1卷积使其通道数为1,经过sigmoid函数归一化之后再分别计算各自与真实人群密度标签的损失函数,这样做为了更好的加快模型训练速度,同时也计算Fout与真实人群密度标签图的损失函数分别得到Losscrowd density-1,Losscrowd density-2以及Losscrowd density-3,总人群密度损失为Losscrowd density-total=Losscrowd density-1+Losscrowd density-2+Losscrowd density-3
总损失函数为:
Losstotal=αLossod+βLosscrowd density
其中,α为0.2,β为0.8。
对于模型的评估函数分别为MAE评估函数以及RMSE评估函数。
Figure BDA0003684112850000164
Figure BDA0003684112850000165
其中,Ci以及
Figure BDA0003684112850000166
分别代表着真实的人群数量,
Figure BDA0003684112850000167
表示的是预测的人群数量。
本发明基于SwinTransformer目标检测网络进行特征提取,并基于提取的特征进行人群概率密度图预测,增加了目标检测的监督信息,提升模型的预测效果。通过多尺度特征融合可以很好的兼容不同大小尺寸的人体信息。通过增加注意力机制加深模型对人群密度,方便模型更容易剔除背景干扰因素。
上述基于检测和分割的人群密度统计装置可以实现为计算机程序的形式,该计算机程序可以在如图4所示的计算机设备上运行。
请参阅图4,图4是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
如图4所示,该计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述的基于检测和分割的人群密度统计方法步骤。
该计算机设备700可以是终端或服务器。该计算机设备700包括通过系统总线710连接的处理器720、存储器和网络接口750,其中,存储器可以包括非易失性存储介质730和内存储器740。
该非易失性存储介质730可存储操作系统731和计算机程序732。该计算机程序732被执行时,可使得处理器720执行任意一种基于检测和分割的人群密度统计方法。
该处理器720用于提供计算和控制能力,支撑整个计算机设备700的运行。
该内存储器740为非易失性存储介质730中的计算机程序732的运行提供环境,该计算机程序732被处理器720执行时,可使得处理器720执行任意一种基于检测和分割的人群密度统计方法。
该网络接口750用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备700的限定,具体的计算机设备700可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。其中,所述处理器720用于运行存储在存储器中的程序代码,以实现以下步骤:
获取图像数据;
对图像数据进行处理,以得到样本图;
将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图;
根据人群密度图计算出人群数量。
在一实施例中:所述将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图,所述人群密度统计模型的处理方法包括:
将样本图输入到SwinTransformer模型中对人头数据进行目标检测,以得到第一检测特征、第二检测特征、第三检测特征以及第四检测特征;
对第一检测特征、第二检测特征、第三检测特征以及第四检测特征输入可变形卷积块处理,以得到第一处理特征、第二处理特征、第三处理特征以及第四处理特征;
对第四处理特征进行转置卷积处理后再进行上采样处理,以得到第五处理特征;
对第三处理特征进行反池化上采样处理,以得到第六处理特征;
对第二处理特征进行卷积处理,以得到第七处理特征;
将样本图输入到卷积残差网络处理,以得到第八处理特征;
将第八处理特征、第七处理特征、第六处理特征、第五处理特征以及第一处理特征进行concate合并,以得到第一合并特征;
将第一合并特征输入到PPM模型处理,以得到第九处理特征;
将第一处理特征、第二处理特征、第三处理特征以及第四处理特征输入到CBAM注意力机制模型处理,以得到第十处理特征、第十一处理特征、第十二处理特征、第十三处理特征;
将第十处理特征和第九处理特征输入到FAM模型处理,以得到第十四处理特征;
将第十四处理特征与第十一处理特征输入到FAM模型处理,以得到第十五处理特征;
将第十五处理特征与第十二处理特征输入到FAM模型处理,以得到第十六处理特征;
对第十六处理特征输入到上采样块进行三次上采样处理,以得到第一次采样特征、第二次采样特征和第三次采样特征;
将第三次采样特征通过sigmoid函数进行归一化处理,以得到人群密度图。
在一实施例中:所述对第一检测特征、第二检测特征、第三检测特征以及第四检测特征输入可变形卷积块处理,以得到第一处理特征、第二处理特征、第三处理特征以及第四处理特征,所述可变形卷积块分别由可变形卷积,relu激活函数以及BatchNormaliization构成。
在一实施例中:所述将样本图输入到卷积残差网络处理,以得到第八处理特征,所述卷积残差网络分别由残差卷积和mish激活函数构成。
在一实施例中:所述将第一合并特征输入到PPM模型处理,以得到第九处理特征,包括:
将第一合并特征分别通过多尺度特征金字塔进行下采样池化,以得到多个下采样池化特征;
分别对多个下采样池化特征进行卷积上采样处理,以得到多个卷积上采样特征;
对多个卷积上采样特征进行合并后再进行卷积处理,以得到第九处理特征。
在一实施例中:所述将第一处理特征、第二处理特征、第三处理特征以及第四处理特征输入到CBAM注意力机制模型处理,以得到第十处理特征、第十一处理特征、第十二处理特征、第十三处理特征,所述CBAM注意力机制模型由通道注意力机制和空间注意力机制构成。
在一实施例中:所述对第十六处理特征输入到上采样块进行三次上采样处理,以得到第一次采样特征、第二次采样特征和第三次采样特征,所述上采样块由反卷积和relu激活函数构成。
应当理解,在本申请实施例中,处理器720可以是中央处理单元(CentralProcessing Unit,CPU),该处理器720还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域技术人员可以理解,图4中示出的计算机设备700结构并不构成对计算机设备700的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在本发明的另一实施例中提供了一种计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例公开的基于检测和分割的人群密度统计方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.基于检测和分割的人群密度统计方法,其特征在于,包括:
获取图像数据;
对图像数据进行处理,以得到样本图;
将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图;
根据人群密度图计算出人群数量。
2.根据权利要求1所述的基于检测和分割的人群密度统计方法,其特征在于,所述将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图,所述人群密度统计模型的处理方法包括:
将样本图输入到SwinTransformer模型中对人头数据进行目标检测,以得到第一检测特征、第二检测特征、第三检测特征以及第四检测特征;
对第一检测特征、第二检测特征、第三检测特征以及第四检测特征输入可变形卷积块处理,以得到第一处理特征、第二处理特征、第三处理特征以及第四处理特征;
对第四处理特征进行转置卷积处理后再进行上采样处理,以得到第五处理特征;
对第三处理特征进行反池化上采样处理,以得到第六处理特征;
对第二处理特征进行卷积处理,以得到第七处理特征;
将样本图输入到卷积残差网络处理,以得到第八处理特征;
将第八处理特征、第七处理特征、第六处理特征、第五处理特征以及第一处理特征进行concate合并,以得到第一合并特征;
将第一合并特征输入到PPM模型处理,以得到第九处理特征;
将第一处理特征、第二处理特征、第三处理特征以及第四处理特征输入到CBAM注意力机制模型处理,以得到第十处理特征、第十一处理特征、第十二处理特征、第十三处理特征;
将第十处理特征和第九处理特征输入到FAM模型处理,以得到第十四处理特征;
将第十四处理特征与第十一处理特征输入到FAM模型处理,以得到第十五处理特征;
将第十五处理特征与第十二处理特征输入到FAM模型处理,以得到第十六处理特征;
对第十六处理特征输入到上采样块进行三次上采样处理,以得到第一次采样特征、第二次采样特征和第三次采样特征;
将第三次采样特征通过sigmoid函数进行归一化处理,以得到人群密度图。
3.根据权利要求2所述的基于检测和分割的人群密度统计方法,其特征在于,所述对第一检测特征、第二检测特征、第三检测特征以及第四检测特征输入可变形卷积块处理,以得到第一处理特征、第二处理特征、第三处理特征以及第四处理特征,所述可变形卷积块分别由可变形卷积,relu激活函数以及BatchNormaliization构成。
4.根据权利要求2所述的基于检测和分割的人群密度统计方法,其特征在于,所述将样本图输入到卷积残差网络处理,以得到第八处理特征,所述卷积残差网络分别由残差卷积和mish激活函数构成。
5.根据权利要求2所述的基于检测和分割的人群密度统计方法,其特征在于,所述将第一合并特征输入到PPM模型处理,以得到第九处理特征,包括:
将第一合并特征分别通过多尺度特征金字塔进行下采样池化,以得到多个下采样池化特征;
分别对多个下采样池化特征进行卷积上采样处理,以得到多个卷积上采样特征;
对多个卷积上采样特征进行合并后再进行卷积处理,以得到第九处理特征。
6.根据权利要求2所述的基于检测和分割的人群密度统计方法,其特征在于,所述将第一处理特征、第二处理特征、第三处理特征以及第四处理特征输入到CBAM注意力机制模型处理,以得到第十处理特征、第十一处理特征、第十二处理特征、第十三处理特征,所述CBAM注意力机制模型由通道注意力机制和空间注意力机制构成。
7.根据权利要求2所述的基于检测和分割的人群密度统计方法,其特征在于,所述对第十六处理特征输入到上采样块进行三次上采样处理,以得到第一次采样特征、第二次采样特征和第三次采样特征,所述上采样块由反卷积和relu激活函数构成。
8.基于检测和分割的人群密度统计装置,其特征在于,包括获取单元、处理单元、预测单元以及计算单元;
所述获取单元,用于获取图像数据;
所述处理单元,用于对图像数据进行处理,以得到样本图;
所述预测单元,用于将样本图输入到人群密度统计模型中进行人群概率预测,以得到人群密度图;
所述计算单元,用于根据人群密度图计算出人群数量。
9.一种计算机设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~7中任意一项所述的基于检测和分割的人群密度统计方法步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,使得所述处理器执行如权利要求1~7任意一项所述的基于检测和分割的人群密度统计方法方法步骤。
CN202210645973.5A 2022-06-08 2022-06-08 基于检测和分割的人群密度统计方法、装置、设备及介质 Pending CN114898301A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210645973.5A CN114898301A (zh) 2022-06-08 2022-06-08 基于检测和分割的人群密度统计方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210645973.5A CN114898301A (zh) 2022-06-08 2022-06-08 基于检测和分割的人群密度统计方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114898301A true CN114898301A (zh) 2022-08-12

Family

ID=82729077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210645973.5A Pending CN114898301A (zh) 2022-06-08 2022-06-08 基于检测和分割的人群密度统计方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114898301A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118003961A (zh) * 2024-01-16 2024-05-10 江西驴充充充电技术有限公司 智能充电桩集群控制系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118003961A (zh) * 2024-01-16 2024-05-10 江西驴充充充电技术有限公司 智能充电桩集群控制系统及方法

Similar Documents

Publication Publication Date Title
CN111681273B (zh) 图像分割方法、装置、电子设备及可读存储介质
CN110781756A (zh) 基于遥感图像的城市道路提取方法及装置
CN111369565B (zh) 一种基于图卷积网络的数字病理图像的分割与分类方法
CN109961446B (zh) Ct/mr三维图像分割处理方法、装置、设备及介质
CN111369581A (zh) 图像处理方法、装置、设备及存储介质
CN112465060A (zh) 图像中目标物检测方法、装置、电子设备及可读存储介质
CN110942071A (zh) 一种基于车牌分类和lstm的车牌识别方法
EP4432215A1 (en) Image processing method and device
CN112752158B (zh) 一种视频展示的方法、装置、电子设备及存储介质
CN110781980B (zh) 目标检测模型的训练方法、目标检测方法及装置
CN114972378A (zh) 一种基于掩码注意力机制的脑肿瘤mri图像分割方法
CN114299284A (zh) 分割模型的训练方法、使用方法、装置、设备及介质
CN114529462A (zh) 一种基于改进YOLO V3-Tiny的毫米波图像目标检测方法及系统
CN113496208A (zh) 视频的场景分类方法及装置、存储介质、终端
CN114898301A (zh) 基于检测和分割的人群密度统计方法、装置、设备及介质
Venkatesvara Rao et al. Real-time video object detection and classification using hybrid texture feature extraction
CN111445388A (zh) 一种图像超分辨重建模型训练方法、船只跟踪方法及装置
CN112966687B (zh) 图像分割模型训练方法、装置及通信设备
CN116051811B (zh) 区域识别方法、装置、计算机设备及计算机可读存储介质
CN116188938A (zh) 目标对象的确定方法、装置、存储介质及电子装置
CN114820576A (zh) 乳腺特征提取、检测模型的训练方法、装置
CN111311603B (zh) 用于输出目标物体数目信息的方法和装置
CN114419086A (zh) 边缘提取方法、装置、电子设备及存储介质
CN117376977B (zh) 一种手机5g无线信号测试系统、方法、设备及介质
CN114820850B (zh) 基于注意力机制的图像稀疏重建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination