CN113947732A - 基于强化学习图像亮度调节的空中视角人群计数方法 - Google Patents

基于强化学习图像亮度调节的空中视角人群计数方法 Download PDF

Info

Publication number
CN113947732A
CN113947732A CN202111570830.4A CN202111570830A CN113947732A CN 113947732 A CN113947732 A CN 113947732A CN 202111570830 A CN202111570830 A CN 202111570830A CN 113947732 A CN113947732 A CN 113947732A
Authority
CN
China
Prior art keywords
image
image block
model
resolution
counting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111570830.4A
Other languages
English (en)
Other versions
CN113947732B (zh
Inventor
周家柳
罗喜伶
王珺珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Innovation Research Institute of Beihang University
Original Assignee
Hangzhou Innovation Research Institute of Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Innovation Research Institute of Beihang University filed Critical Hangzhou Innovation Research Institute of Beihang University
Priority to CN202111570830.4A priority Critical patent/CN113947732B/zh
Publication of CN113947732A publication Critical patent/CN113947732A/zh
Application granted granted Critical
Publication of CN113947732B publication Critical patent/CN113947732B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于强化学习图像亮度调节的空中视角人群计数方法,首先获取经标注的训练集,对其预处理,得到原始分辨率图像块和低分辨率图像块的标注数据集;基于得到的数据集训练得到原始人群计数模型和粗糙人群计数模型;然后构建并训练强化策略网络模型。工作时,对于待处理的无人机实时图像,利用训练得到的强化策略网络模型选取对应分辨率的图像块并进行亮度值的调整,根据选择结果调取对应的人群计数模型得到各图像块的人群计数结果,综合得到整张图像的人群计数结果。本发明不仅能够在只有空中视觉信息的条件下实现人群计数,还能够基于训练的强化学习模型对原始模型进行加速。

Description

基于强化学习图像亮度调节的空中视角人群计数方法
技术领域
本发明属于图像识别计数技术领域,具体涉及一种基于强化学习图像亮度调节的空中视角人群计数方法。
背景技术
当前随着城市化进程的加快以及国际通信的兴起,人群聚集频率越来越高,因此存在大量的安全隐患。在城市地区和大型活动中,人群监控变得非常重要,无人机目前广泛用于人群监控区域,以提高人群数量及动态方面的安全性。无人机具有部署方便快捷、成本低、效率高等优点,但是与常规的基于摄像头的人群计数场景相比,基于空中视角在人群计数场景中的使用存在一些挑战,例如实时性要求、有限的内存和电池资源以及鸟瞰图。
CN202110658605.X公开了一种基于空中视角的跨场景视频人群理解双通道网络方法,其通过建立双通道人群计数网络模型,以及通过双路径流的RGB图像充分利用帧间信息和输入对鸟瞰人群下分析人与背景的关系,判断人群数量,属于图像识别计数技术领域,但主要研究的是空间上下文信息以及光流和帧差信息,未对空中视角的单张图像的人群计数方法进行深入研究。
发明内容
为了考虑空中视角人群计数具有较高的实时性需求,本发明提供一种基于强化学习图像亮度调节的空中视角人群计数方法,该方法不仅能基于图像信息对切割好的图像块作出使用原始分辨率还是降低分辨率的选择,而且能够对图像块进行亮度调节操作,然后对图像块处理后使用相对应的人群计数模型得到结果。
本发明的技术方案如下:
本发明首先提供了一种基于强化学习图像亮度调节的空中视角人群计数方法,其包括如下步骤:
1)获取已经进行标注的无人机人群计数数据集,对于其中的空中视角人群图像和标注进行图像块切割和降低分辨率预处理,得到原始分辨率图像块的数据集和低分辨率图像块的数据集;
2)分别用原始分辨率图像块的数据集和低分辨率图像块的数据集训练机器学习人群计数模型,得到原始人群计数模型和粗糙人群计数模型;
3)构建和训练强化策略网络模型,所述强化策略网络模型的输出为是否使用低分辨率图像块,以及低分辨率图像块需要增减的亮度值;
4)对于待处理的无人机实时图像,进行图像块切割和降低分辨率预处理,利用步骤3)训练得到的强化策略网络模型选取对应分辨率的图像块并进行亮度值的调整,其中将选择原始分辨率的每个图像块,使用步骤2)已经训练好的原始人群计数模型得到该图像块的人群计数结果;将选择低分辨率的每个图像块,使用步骤2)已经训练好的粗糙人群计数模型得到该图像块的人群计数结果,最终得到整张图像的人群计数结果。
作为本发明的优选方案,步骤1)中所述的对于其中的空中视角人群图像和标注进行图像块切割和降低分辨率预处理,包括如下步骤:
1.1)将空中视角人群图像均分为n2个图像块,得到原始分辨率图像块,并将每张图像对应的真值标注映射到切割后的图像块上,得到原始分辨率图像块的标注,即每个图像块可以得到对应的一个标注文件;原始分辨率图像块和其标注构成原始分辨率图像块的数据集;其中n为大于等于2的整数;
1.2)对原始分辨率图像块的数据集,做降低分辨率处理,得到低分辨率图像块的数据集。
作为本发明的优选方案,所述步骤1.2)中,降低分辨率的倍数由预先设定。
作为本发明的优选方案,所述步骤1.2)中,所述低分辨率图像块的数据集包括低分辨率图像块及其标注,其中,低分辨率图像块的标注通过将每张图像对应的真值标注映射到切割后的低分辨率图像块上得到,每个低分辨图像块对应的一个标注文件。
作为本发明的优选方案,所述步骤3)中的强化策略网络模型得到的结果为每个图像块的选择结果和每个图像块需要调整的亮度值;
对于数据集中的每个图像,以HR表示原始分辨率版本,以LR表示低分辨率版本,每 个原始分辨率图像或低分辨率图像均由n2个相等大小的非重叠图像块组成,第i个图像块 表示为
Figure 403272DEST_PATH_IMAGE002
Figure 453267DEST_PATH_IMAGE003
强化策略网络模型通过观察每个图像,输出一个二元数组
Figure 522854DEST_PATH_IMAGE004
,其中
Figure 782934DEST_PATH_IMAGE005
表示模型倾向于选取HR的第i个图像块
Figure 772668DEST_PATH_IMAGE002
Figure 801804DEST_PATH_IMAGE006
表示模型倾向于选取LR的第i个 图像块
Figure 714396DEST_PATH_IMAGE003
同时,强化策略网络模型通过观察每个图像,输出
Figure 461773DEST_PATH_IMAGE008
Figure 750803DEST_PATH_IMAGE010
表示将第i个图像块
Figure 634445DEST_PATH_IMAGE002
Figure 983518DEST_PATH_IMAGE003
的图像转换成HSV图像,将V通道的值进行增减的值;图像转换 成HSV图像并将V通道的值进行增减后转换回RGB图像。
作为本发明的优选方案,强化策略网络模型选择HR图像块则使用原始人群计数模型进行人群计数,选择LR图像块则使用粗糙人群计数模型进行人群计数;各图像块的计数结果之和即为输入图像经估算的人群计数结果;
利用经标注的训练集对强化策略网络模型进行训练,强化策略网络模型的奖励函数包括精度部分和时间成本部分;奖励函数促使模型在考虑精度要求的同时选择更少的HR图像块以节约计算成本。
作为本发明的优选方案,所述的将V通道的值进行增减为:对每个图像块中的像素 点进行相同的亮度调整,
Figure 218190DEST_PATH_IMAGE011
为正则增加亮度,负则降低亮度。
与现有技术相比,本发明采用了强化策略网络与人群计数卷积神经网络相结合的网络设计结构,因此改进了现有技术中的人群计数模型;通过强化学习的训练手段,在低分辨率图像块中增减亮度的手段,提升了方法的准确率和推理速度,从而能够实现在只有空中视觉信息的条件下快速有效的人群计数。
附图说明
图1为实施例中示例的本发明方法的流程框图。
具体实施方式
下面结合具体实施方式对本发明做进一步阐述和说明。本发明中各个实施方式的技术特征在没有相互冲突的前提下,均可进行相应组合。
本方法的整体流程如图1所示,为了便于说明,本发明的实施例均以将图像均匀切分为9个图像块、降低分辨率的倍数为16倍进行说明,需要注意的是,以上设置仅是为了便于说明,并不构成对本发明的限制。事实上,图像可以切分为n2个图像块,n为大于2的整数,降低分辨率的倍数也可以根据实际情况进行调整。
在本实施例中,所采用的技术方案是:基于已经进行标注过的空中视角的人群计数数据集,按照约4:1的比例分成训练集与测试集;对于训练集中的图像和标注,通过数据处理方法,将图像均分为9个图像块,并将标注作对应的处理(将每张图像对应的真值标注映射到切割后的图像块上,即每个图像块可以得到对应的一个标注文件),得到原始分辨率图像块的数据集;基于原始分辨率图像块的数据集,做降低分辨率的处理(降低16倍),并对标注也作出对应的处理(将每张图像对应的真值标注映射到切割后的低分辨率图像块上,即每个低分辨图像块也可以得到对应的一个标注文件),得到低分辨率图像块的标注数据集;基于两个不同分辨率的数据集,训练机器学习人群计数模型,得到原始人群计数模型和粗糙人群计数模型;通过两个不同的人群计数模型可以得到训练数据集的结果。采用强化学习的训练手段,训练得到一个强化策略网络模型,该模型的输出为是否使用低分辨率图像块,以及需要增减的亮度值;综合基于强化策略网络模型、原始人群计数模型与粗糙人群计数模型,得到整张图像的人群计数结果;基于图像更高的准确率和倾向于更多的低分辨率图像被使用这样的奖励机制,反馈到强化策略网络,直到奖励最大化。本发明可以在保障计数准确率的前提下,提升运行速度,实现空中视角人群计数的实时性能。
本方法中的两个人群计数模型(原始人群计数模型和粗糙人群计数模型)是两个基于密度估计的人群计数神经网络算法。人群计数旨在计算拥挤场景中的人数,而密度估计旨在将输入人群图像映射到相应的密度图,密度图则表示图像中每个像素的人数。
通常来说,更深更大的神经网络能够带来更高的算法性能,但是随之而来的是计算成本的增加。因此,本发明可以选取强大且轻量的神经网络算法来完成密度图估计这个任务,这里以DM-count算法(Boyu Wang, Huidong Liu, Dimitris Samaras, and MinhHoai. Distribution matching for crowd counting. arXiv preprint arXiv:2009.13077, 2020. 2, 3)为例,该算法将人群计数视为分布匹配问题,并提出新的损失函数,结合简单的人群计数神经网络从输入图像到生成密度估计图。整体损失函数可以写为:
Figure 543867DEST_PATH_IMAGE012
其中,
Figure 547595DEST_PATH_IMAGE014
表示预测的人群计数与真值之间的差,
Figure 801990DEST_PATH_IMAGE015
表示从预测计数 的概率分布转换成真值的代价(OT为Optimal Transport,用于测量预测密度图与真值之间 的相似性),
Figure 258379DEST_PATH_IMAGE016
用于增加训练过程的稳定性。具体的释义这里不做详细说明,可参考 论文。
以DM-count为例,作为人群计数模型的基础算法,主要有几点原因:它是目前最先进的人群计数算法之一;与其他非常大型的神经网络算法不同,DM-count基于简单的多层卷积神经神经网络,非常省时;另外,DM-count没有使用会损害模型泛华边界的高斯平滑滤波器。除了DM-count以外,这里的人群计数模型可以使用不同的算法,本发明的基于强化学习的强化策略网络能够在算法原有的基础上对算法性能有所提升。
本实施例分别用原始分辨率图像块的数据集和低分辨率图像块的数据集训练机器学习人群计数模型,得到原始人群计数模型和粗糙人群计数模型。
强化学习是在环境中作出随机选择,并学习在所有候选中选择最佳选项以实现预设目标。策略网络是一个简单的神经网络,可以通过给定的输入给出确定的输出。
本实施例的强化策略网络模型包含2个部分,首先是卷积层,其次是池化层,池化层的最后总共得到18个数值。
在本发明的强化策略网络模型中,有两组不同的状态:
Figure 889212DEST_PATH_IMAGE018
Figure 950709DEST_PATH_IMAGE019
。对于数据集中的 每个图像,本发明准备了两个不同的版本,原始分辨率版本(用HR表示)和低分辨率版本(用 LR表示)。 每个原始分辨率图像或低分辨率图像由9个相等大小的非重叠图像块组成,第i 个图像块
Figure 766218DEST_PATH_IMAGE020
可以表示为
Figure 585269DEST_PATH_IMAGE002
Figure 878847DEST_PATH_IMAGE003
,光亮调整值
Figure 231069DEST_PATH_IMAGE021
表示每个图像块 中的每个像素点调整的亮度值,正的则增加亮度,负的则降低亮度。预测值
Figure 217480DEST_PATH_IMAGE023
表示各图像块中的预测得到的人数。
(1)强化策略网络模型通过观察输入图像,输出一个二元数组
Figure 523827DEST_PATH_IMAGE004
,当
Figure 824358DEST_PATH_IMAGE005
的时候表示模型倾向于选取HR图像块的第i个图像块
Figure 391606DEST_PATH_IMAGE002
,当
Figure 424284DEST_PATH_IMAGE006
的时候表示模型 倾向于选取LR图像块的第i个图像块
Figure 342562DEST_PATH_IMAGE003
。因此,存在一个映射:从LR图像块到
Figure 853308DEST_PATH_IMAGE025
(2)同样的,模型通过观察输入图像,输出
Figure 540642DEST_PATH_IMAGE008
Figure 508335DEST_PATH_IMAGE010
表示第i 个图像块
Figure 648330DEST_PATH_IMAGE002
Figure 228347DEST_PATH_IMAGE003
的图像转换成HSV图像,将V通道的值进行增减(这里需要说明,一般V通道 的取值范围在0~1之间,但由于opencv库的关系,V通道的取值范围为0~255,如果增减后的 数值小于0,则直接取0,大于255则取255),通过增减后再将HSV图像转换回原图像进行后续 处理。因此,存在一个映射:从LR图像块到
Figure 770187DEST_PATH_IMAGE026
(3)模型根据第(1)(2)步的结果跑相应的人群计数算法(选择HR图像块则使用原 始人群计数模型,选择LR图像块则使用粗糙人群计数模型),模型会选择输出
Figure 144667DEST_PATH_IMAGE028
,其 中
Figure 771958DEST_PATH_IMAGE030
表示
Figure 624507DEST_PATH_IMAGE002
Figure 286433DEST_PATH_IMAGE003
通过人群计数算法估计的得到的计数。
总体目标J可以定义为最大化期望效用R,可以表示为:
Figure 160428DEST_PATH_IMAGE031
,奖励机制的函数的直觉是对LR图像块进行亮度调节的方法,以选择更少的HR图像块,因为 这样可以节约计算成本,从而减少推理的时间,保障更好的实时性能。但是,还是需要关注 整体的算法性能,因此在奖励函数中需要加入性能指标。
在本发明的一个具体实施例中,奖励函数R包含两个部分,第一部分表示精度部分,第二部分表示运行的时间成本。其中公式中的数字9表示本发明将图像切分为9个图像块。
Figure 275014DEST_PATH_IMAGE032
Figure 931255DEST_PATH_IMAGE033
Figure 447687DEST_PATH_IMAGE034
其中,
Figure 163970DEST_PATH_IMAGE036
表示预测的误差值,
Figure 969115DEST_PATH_IMAGE037
表示估计的时间成本。
Figure 225784DEST_PATH_IMAGE039
表示 原始人群计数模型得到的预测结果,
Figure DEST_PATH_IMAGE041
表示粗糙人群计数模型得到的预测结果。
Figure 331143DEST_PATH_IMAGE042
Figure DEST_PATH_IMAGE043
Figure DEST_PATH_IMAGE045
表示三个超参数,在训练的过程中需要进行人为的设置及调整,其中
Figure 920125DEST_PATH_IMAGE043
值对于模型最终选 择更多的LR图像块还是HR图像块的影响较大。
Figure 743725DEST_PATH_IMAGE046
表示一组蒙特卡洛采样生成的二进制数,
Figure DEST_PATH_IMAGE047
表示一张图像中使用HR图像块的数量。
以下结合仿真结果对本发明的效果作进一步说明。
本发明的仿真实验基于公开的空中视角人群计数数据集VisDrone(DroneCrowd)数据集,带有标注标签和无人机收集的高清RGB图像。因测试需要,将数据集中带有标注的数据按sequence分为:1980张图像作为训练集和480张图像作为测试集。
本发明的仿真实验的硬件测试平台是: linux服务器(CPU:Intel(R) Xeon(R)Gold 5218 CPU @ 2.30GHz -16 cores,GPU:NVIDIA Quadro V100)。
仿真实验1:
本发明的仿真实验1用于证明亮度对不同分辨率图像进行人群计数的准确率存在一定影响。
测试集共480张图像,按照本发明的方法每张图像分为9张不重叠的图像块,图像块总数为4320。将4320张图像块的原始分辨率图像块(HR)在原始人群计数模型中运行,并且跟标注的真值进行对比得到error值,再将4320张图像块处理后变成低分辨率图像块(LR)在粗糙人群计数模型中运行,并且跟标注的真值经过处理后(对应到低分辨率图像像素点中)对比得到error值。
通过比较error值,按照比例2:8分为LR更优、效果差不多以及HR更优三种类型的图像块,比较每类图像块的亮度均值,结果见下表1。
表1
Figure 538506DEST_PATH_IMAGE048
表中,LR更优的图像块是指使用低分辨率图像块通过粗糙人群计数模型得到的精度优于使用原始分辨率图像块经过原始人群计数模型得到的结果,且在LR更优的结果中根据error的差值在数值上按照2:8取,将差值较大的20%的图像块定义为LR更优的图像块,剩余的80%定义为效果差不多类型的图像块。同理,HR更优指的是原始分辨率图像块表现更好。
根据仿真实验表格中的实验结果,证明亮度值对于图像块选择原始还是低分辨率在精度上的表现是有影响的。
仿真实验2:
首先在没有加入强化推荐网络的仅有人群计数模型下进行测试,得到如下表2所示基准,评价指标:平均绝对误差(MAE),每秒处理帧数(FPS):
表2
Figure 967213DEST_PATH_IMAGE050
其次在加入强化推荐网络的进行整个模型的推理测试,得到如下表3所示结果,评价指标:平均绝对误差(MAE),每秒处理帧数(FPS),通过参数调整可以得到不同的使用低分辨率图像块(LR)的比例:
表3
Figure 25299DEST_PATH_IMAGE052
仿真实验2的结果表明,基于强化学习图像亮度调节的空中视角人群计数方法不仅能够提高人群计数方法的速度,并且比原始分辨率图像进行检测的准确率更高。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

Claims (9)

1.基于强化学习图像亮度调节的空中视角人群计数方法,其特征在于包括如下步骤:
1)获取已经进行标注的无人机人群计数数据集,对于其中的空中视角人群图像和标注进行图像块切割和降低分辨率预处理,得到原始分辨率图像块的数据集和低分辨率图像块的数据集;
2)分别用原始分辨率图像块的数据集和低分辨率图像块的数据集训练机器学习人群计数模型,得到原始人群计数模型和粗糙人群计数模型;
3)构建和训练强化策略网络模型,所述强化策略网络模型的输出为是否使用低分辨率图像块,以及低分辨率图像块需要增减的亮度值;
4)对于待处理的无人机实时图像,进行图像块切割和降低分辨率预处理,利用步骤3)训练得到的强化策略网络模型选取对应分辨率的图像块并进行亮度值的调整,其中将选择原始分辨率的每个图像块,使用步骤2)已经训练好的原始人群计数模型得到该图像块的人群计数结果;将选择低分辨率的每个图像块,使用步骤2)已经训练好的粗糙人群计数模型得到该图像块的人群计数结果,最终得到整张图像的人群计数结果。
2.根据权利要求1所述的基于强化学习图像亮度调节的空中视角人群计数方法,其特征在于,步骤1)中所述的对于其中的空中视角人群图像和标注进行图像块切割和降低分辨率预处理,包括如下步骤:
1.1)将空中视角人群图像均分为n2个图像块,得到原始分辨率图像块,并将每张图像对应的真值标注映射到切割后的图像块上,得到原始分辨率图像块的标注,即每个图像块可以得到对应的一个标注文件;原始分辨率图像块和其标注构成原始分辨率图像块的数据集;其中n为大于等于2的整数;
1.2)对原始分辨率图像块的数据集,做降低分辨率处理,得到低分辨率图像块的数据集。
3.根据权利要求2所述的基于强化学习图像亮度调节的空中视角人群计数方法,其特征在于,所述步骤1.2)中,降低分辨率的倍数由预先设定。
4.根据权利要求2所述的基于强化学习图像亮度调节的空中视角人群计数方法,其特征在于,所述步骤1.2)中,所述低分辨率图像块的数据集包括低分辨率图像块及其标注,其中,低分辨率图像块的标注通过将每张图像对应的真值标注映射到切割后的低分辨率图像块上得到,每个低分辨图像块对应的一个标注文件。
5.根据权利要求1所述的基于强化学习图像亮度调节的空中视角人群计数方法,其特征在于,所述步骤3)中的强化策略网络模型得到的结果为每个图像块的选择结果和每个图像块需要调整的亮度值;
对于数据集中的每个图像,以HR表示原始分辨率版本,以LR表示低分辨率版本,每个原 始分辨率图像或低分辨率图像均由n2个相等大小的非重叠图像块组成,第i个图像块表示 为
Figure 103599DEST_PATH_IMAGE001
Figure 495397DEST_PATH_IMAGE002
强化策略网络模型通过观察每个图像,输出一个二元数组
Figure 336314DEST_PATH_IMAGE003
,其中
Figure 813563DEST_PATH_IMAGE004
表示 模型倾向于选取HR的第i个图像块
Figure 398128DEST_PATH_IMAGE001
Figure 644433DEST_PATH_IMAGE005
表示模型倾向于选取LR的第i个图像块
Figure 656251DEST_PATH_IMAGE002
同时,强化策略网络模型通过观察每个图像,输出
Figure 847893DEST_PATH_IMAGE006
Figure 236149DEST_PATH_IMAGE007
表示将第i 个图像块
Figure 336960DEST_PATH_IMAGE001
Figure 519680DEST_PATH_IMAGE002
的图像转换成HSV图像,将V通道的值进行增减的值;图像转换成HSV图像 并将V通道的值进行增减后转换回RGB图像。
6.根据权利要求5所述的基于强化学习图像亮度调节的空中视角人群计数方法,其特征在于,强化策略网络模型选择HR图像块则使用原始人群计数模型进行人群计数,选择LR图像块则使用粗糙人群计数模型进行人群计数;各图像块的计数结果之和即为输入图像经估算的人群计数结果;
利用经标注的训练集对强化策略网络模型进行训练,强化策略网络模型的奖励函数包括精度部分和时间成本部分;奖励函数促使模型在考虑精度要求的同时选择更少的HR图像块以节约计算成本。
7.根据权利要求6所述的基于强化学习图像亮度调节的空中视角人群计数方法,其特征在于,强化策略网络模型的奖励函数R示为:
Figure 971521DEST_PATH_IMAGE008
其中,
Figure 101151DEST_PATH_IMAGE009
表示预测的误差值,
Figure 181102DEST_PATH_IMAGE010
表示估计的时间成本;
Figure 675669DEST_PATH_IMAGE011
表示原始人群 计数模型得到的预测结果,
Figure 473860DEST_PATH_IMAGE012
表示粗糙人群计数模型得到的预测结果,
Figure 577820DEST_PATH_IMAGE013
为超参数。
8.根据权利要求7所述的基于强化学习图像亮度调节的空中视角人群计数方法,其特征在于,
Figure 512278DEST_PATH_IMAGE014
Figure 177746DEST_PATH_IMAGE015
Figure 463234DEST_PATH_IMAGE017
Figure 872350DEST_PATH_IMAGE018
表示超参数,在训练的过程中需要进行设置及调整,
Figure 926893DEST_PATH_IMAGE019
表示一组蒙特卡洛采样生 成的二进制数,
Figure 763262DEST_PATH_IMAGE020
表示一张图像中使用HR图像块的数量。
9.根据权利要求5所述的基于强化学习图像亮度调节的空中视角人群计数方法,其特 征在于,所述的将V通道的值进行增减为:对每个图像块中的像素点进行相同的亮度调整,
Figure 270467DEST_PATH_IMAGE022
为正则增加亮度,负则降低亮度。
CN202111570830.4A 2021-12-21 2021-12-21 基于强化学习图像亮度调节的空中视角人群计数方法 Active CN113947732B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111570830.4A CN113947732B (zh) 2021-12-21 2021-12-21 基于强化学习图像亮度调节的空中视角人群计数方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111570830.4A CN113947732B (zh) 2021-12-21 2021-12-21 基于强化学习图像亮度调节的空中视角人群计数方法

Publications (2)

Publication Number Publication Date
CN113947732A true CN113947732A (zh) 2022-01-18
CN113947732B CN113947732B (zh) 2022-05-31

Family

ID=79339458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111570830.4A Active CN113947732B (zh) 2021-12-21 2021-12-21 基于强化学习图像亮度调节的空中视角人群计数方法

Country Status (1)

Country Link
CN (1) CN113947732B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114005075A (zh) * 2021-12-30 2022-02-01 深圳佑驾创新科技有限公司 一种光流估算模型的构建方法、装置及光流估算方法
CN116859755A (zh) * 2023-08-29 2023-10-10 南京邮电大学 无人车驾驶控制的最小化协方差强化学习训练加速方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105898216A (zh) * 2016-04-14 2016-08-24 武汉科技大学 一种利用无人机进行的人数计数方法
CN110879982A (zh) * 2019-11-15 2020-03-13 苏州大学 一种人群计数系统及方法
CN113205078A (zh) * 2021-05-31 2021-08-03 上海应用技术大学 基于多分支递进强化注意力人群计数方法
US20210240601A1 (en) * 2020-01-31 2021-08-05 Raytheon Company System and method for fuzzing test orchestration using reinforcement learning
CN113269131A (zh) * 2021-06-15 2021-08-17 广东蓝鲲海洋科技有限公司 一种基于空中视角的跨场景视频人群理解双通道网络方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105898216A (zh) * 2016-04-14 2016-08-24 武汉科技大学 一种利用无人机进行的人数计数方法
CN110879982A (zh) * 2019-11-15 2020-03-13 苏州大学 一种人群计数系统及方法
US20210240601A1 (en) * 2020-01-31 2021-08-05 Raytheon Company System and method for fuzzing test orchestration using reinforcement learning
CN113205078A (zh) * 2021-05-31 2021-08-03 上海应用技术大学 基于多分支递进强化注意力人群计数方法
CN113269131A (zh) * 2021-06-15 2021-08-17 广东蓝鲲海洋科技有限公司 一种基于空中视角的跨场景视频人群理解双通道网络方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114005075A (zh) * 2021-12-30 2022-02-01 深圳佑驾创新科技有限公司 一种光流估算模型的构建方法、装置及光流估算方法
CN114005075B (zh) * 2021-12-30 2022-04-05 深圳佑驾创新科技有限公司 一种光流估算模型的构建方法、装置及光流估算方法
CN116859755A (zh) * 2023-08-29 2023-10-10 南京邮电大学 无人车驾驶控制的最小化协方差强化学习训练加速方法
CN116859755B (zh) * 2023-08-29 2023-12-08 南京邮电大学 无人车驾驶控制的最小化协方差强化学习训练加速方法

Also Published As

Publication number Publication date
CN113947732B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
Fan et al. Research on black spot identification of safety in urban traffic accidents based on machine learning method
CN109886121B (zh) 一种遮挡鲁棒的人脸关键点定位方法
US10535141B2 (en) Differentiable jaccard loss approximation for training an artificial neural network
CN107729819B (zh) 一种基于稀疏全卷积神经网络的人脸标注方法
CN112150821B (zh) 轻量化车辆检测模型构建方法、系统及装置
CN113947732B (zh) 基于强化学习图像亮度调节的空中视角人群计数方法
CN111325152A (zh) 一种基于深度学习的交通标志识别方法
CN113421269A (zh) 一种基于双分支深度卷积神经网络的实时语义分割方法
CN111046962A (zh) 基于稀疏注意力的卷积神经网络模型的特征可视化方法及系统
CN106157330B (zh) 一种基于目标联合外观模型的视觉跟踪方法
CN110580499B (zh) 基于众包重复标签的深度学习目标检测方法及系统
CN113628211B (zh) 参数预测推荐方法、设备及计算机可读存储介质
US20230298314A1 (en) Image clustering method and apparatus, computer device, and storage medium
CN116721414A (zh) 一种医学图像细胞分割与跟踪方法
Li et al. L-fcn: A lightweight fully convolutional network for biomedical semantic segmentation
Minary et al. Face pixel detection using evidential calibration and fusion
CN110503049B (zh) 基于生成对抗网络的卫星视频车辆数目估计方法
Li et al. Object detection for uav images based on improved yolov6
WO2024160219A1 (zh) 一种模型量化方法及其装置
CN110827327B (zh) 一种基于融合的长期目标跟踪方法
Aldhaheri et al. MACC Net: Multi-task attention crowd counting network
CN111882053A (zh) 一种基于拼接卷积的神经网络模型压缩方法
WO2024099026A1 (zh) 图像处理方法、装置、设备、存储介质及程序产品
Zhu et al. PODB: A learning-based polarimetric object detection benchmark for road scenes in adverse weather conditions
CN117315752A (zh) 人脸情绪识别网络模型的训练方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant