CN111291657B

CN111291657B - 一种基于难例挖掘的人群计数模型训练方法及应用

Info

Publication number: CN111291657B
Application number: CN202010071274.5A
Authority: CN
Inventors: 陈启军; 张会; 王香伟; 刘成菊
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2020-01-21
Filing date: 2020-01-21
Publication date: 2022-09-16
Anticipated expiration: 2040-01-21
Also published as: CN111291657A

Abstract

本发明涉及一种基于难例挖掘的人群计数模型训练方法及应用，所述训练方法包括以下步骤：1)获取训练样本集，对训练样本集中的每个样本赋予初始选择概率；2)基于当前选择概率选取所述训练样本集中的部分样本形成训练集，对人群计数模型进行第一阶段训练，以剩余部分样本作为测试集，获得对应的相对误差；3)将所述相对误差大于一设定阈值的样本定为难例，对各所述难例的相对误差进行归一化处理，将归一化结果作为下一轮训练过程中对应样本的选择概率；4)基于加入难例挖掘的训练样本集对人群计数模型进行第二阶段训练；5)重复步骤2)‑4)，直至满足误差要求。与现有技术相比，本发明具有提高人群计数精度等优点。

Description

一种基于难例挖掘的人群计数模型训练方法及应用

技术领域

本发明涉及机器人视觉领域，尤其是涉及一种基于难例挖掘的人群计数模型训练方法及应用。

背景技术

人群计数在智能安防，城市规划等方面有些重要意义，进行人群监控能够有效避免踩踏事件的发生，同时根据历史人流量和人群分布调整城市基础设施建设和城市布局。

现有的人群计数技术主要有以下几种：

1.基于目标检测的方法：包括基于整体的检测和基于部分身体的检测——通过对图像上每个行人或人头进行定位与识别，再根据结果统计人数。优点在于可以做到检测准确的行人或者人头位置，但缺点在于对高密度的人群图像来说，其检测效果差，难处理人群之间严重的遮挡问题。

2.基于回归的方法：即人群数目估计，没有精确定位行人位置，而是对大概的人群数目给出个估计值，MCNN和CSRNet是较有代表性的深度学习人群计数算法，是基于密度图的回归算法。最常见的人群计数网络架构，如MCNN和CSRNet未加入难例挖掘思想：MCNN是采用三并行网络结构，使用融合可以获得比单一网络更好的性能；CSRNet是采用基于VGG16的前10层网络加入了膨胀卷积获得了比并行的MCNN网络更好的效果。但是这两个主流的网络架构都未加入难例挖掘思想，没有针对误差较大的网络进行针对性训练，弥补短板缺陷，使得在遮挡严重，光线模糊等图像上表现较差。

发明内容

本发明的目的在于克服上述现有技术存在的缺陷而提供一种提高人群计数精度的基于难例挖掘的人群计数模型训练方法及应用，克服了人群计数中严重遮挡等问题。

本发明的目的可以通过以下技术方案来实现：

一种基于难例挖掘的人群计数模型训练方法，包括以下步骤：

1)获取训练样本集，对训练样本集中的每个样本赋予初始选择概率；

2)基于当前选择概率选取所述训练样本集中的部分样本形成训练集，对人群计数模型进行第一阶段训练，以剩余部分样本作为测试集，获得对应的相对误差；

3)将所述相对误差大于一设定阈值的样本定为难例，对各所述难例的相对误差进行归一化处理，将归一化结果作为下一轮训练过程中对应样本的选择概率；

4)基于加入难例挖掘的训练样本集对人群计数模型进行第二阶段训练；

5)重复步骤2)-4)，直至满足误差要求。

进一步地，所述人群计数模型基于MCNN或CSRNet构建。

进一步地，所述相对误差包括平均绝对误差、均方误差或均方根误差。

进一步地，所述步骤2)中，记录每一图像的绝对路径或相对路径。

进一步地，所述步骤2)中，第一阶段训练的结束条件为损失函数趋于收敛。

进一步地，所述步骤3)中，归一化处理具体是：将相对误差取绝对值后归一化成区间(0,1)的值。

本发明还提供一种人群计数方法，采用如所述的基于难例挖掘的人群计数模型训练方法获得最终人群计数模型，基于所述最终人群计数模型进行人群计数。

进一步地，基于所述最终人群计数模型获得密度图，对所述密度图进行卷积处理，获得人群计数结果。

与现有技术相比，本发明具有如下有益效果：

1、常见的人群计数深度网络是随机抽取训练样本，即无论人群图像的误差如何都以一样的概率被选到来参与下一轮的网络训练，难以达到有针对性的训练网络，提高精度。本发明将难例挖掘用在人群计数的深度网络中，提高了整个网络的短板，总体提高人群计数的精度。

2、本发明将难例挖掘加入人群计数后可以有针对性的挑选要参与训练的图像，使误差较大的图像能够以较高的概率被选中参与训练，而误差较小的图像能够以较低的概率被选中参与训练，从而提高有效训练样本，提升精度。

3、本发明具有易移植特性，在已存的人群计数网络中都可以采用类似的思想加入难例挖掘，只需要在算法中每一轮的训练结束后加入精度测试，将样本进行排序。

附图说明

图1为本发明的流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

实施例1

如图1所示，本实施例提供一种基于难例挖掘的人群计数模型训练方法，包括以下步骤：

1)获取训练样本集，随机选择样本作为训练样本。

2)基于当前选择概率选取所述训练样本集中的部分样本形成训练集，对人群计数模型进行第一阶段训练，使损失函数趋于收敛，以剩余部分样本作为测试集，获得对应的相对误差。

本实施例的人群计数基础网络选用CSRNet，按照一般人群计数深度网络的方法进行训练，第一阶段训练的epoch选取为50。

对当前的人群计数模型进行测试，按照相对误差大小进行排序，并附加对应的图像路径。测试时采用的相对误差可以是任意的误差表达方程，如平均绝对误差(MeanAbsolute Error)、均方误差(Mean Square Error)、均方根误差(Root Mean SquareError)等。第一阶段训练后得到的误差仅仅是每个样本之间的相对误差，并不代表没个图像的绝对误差。本实施例中，相对误差选用平均绝对误差MAE，按照从大到小顺序排列生成MAE_list.txt表格。

3)将所述MAE_llist.txt中相对误差大于一设定阈值的样本定为难例，对各所述难例的相对误差进行归一化处理，具体是将相对误差取绝对值后归一化成区间(0,1)的值，将归一化结果作为下一轮训练过程中对应样本的选择概率。

4)基于加入难例挖掘的训练样本集对人群计数模型进行第二阶段训练。该阶段的训练代数随着训练图像的数量、大小、batch_size的不同而改变，具体根据网络收敛情况决定。本实施例中，每当epoch能被10整除时，进行测试后，更新MAE_list.txt，并继续参与下一epoch训练。

5)重复步骤2)-4)，直至满足误差要求或者达到预定训练epoch，如400。

上述训练过程是一个循环训练，循环测试的网络，每隔一定epoch不断更新网络的训练图像集。

实施例2

本实施例提供一种人群计数方法，采用如实施例1所述的基于难例挖掘的人群计数模型训练方法获得最终人群计数模型，基于所述最终人群计数模型获得密度图，对所述密度图进行卷积处理，获得人群计数结果。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由本发明所确定的保护范围内。

Claims

1.一种人群计数方法，其特征在于，采用基于难例挖掘的人群计数模型训练方法获得最终人群计数模型，基于所述最终人群计数模型获得密度图，对所述密度图进行卷积处理，获得人群计数结果；

所述基于难例挖掘的人群计数模型训练方法包括以下步骤：

1）获取训练样本集，对训练样本集中的每个样本赋予初始选择概率；

2）基于当前选择概率选取所述训练样本集中的部分样本形成训练集，对人群计数模型进行第一阶段训练，以剩余部分样本作为测试集，获得对应的相对误差；

3）将所述相对误差大于一设定阈值的样本定为难例，对各所述难例的相对误差进行归一化处理，将归一化结果作为下一轮训练过程中对应样本的选择概率，归一化处理具体是：将相对误差取绝对值后归一化成区间（0,1）的值；

4）基于加入难例挖掘的训练样本集对人群计数模型进行第二阶段训练；

5）重复步骤2）-4），直至满足误差要求；

所述步骤2）中，记录每一图像的绝对路径或相对路径，第一阶段训练的结束条件为损失函数趋于收敛。

2.根据权利要求1所述的人群计数方法，其特征在于，所述人群计数模型基于MCNN或CSRNet构建。