CN115331175A

CN115331175A - 基于自适应集成模型的区域人数统计方法和系统

Info

Publication number: CN115331175A
Application number: CN202211016480.1A
Authority: CN
Inventors: 梁秉豪; 袁明明; 王凯; 李知澳; 王涛
Original assignee: Inspur Communication Information System Co Ltd
Current assignee: Inspur Communication Information System Co Ltd
Priority date: 2022-08-24
Filing date: 2022-08-24
Publication date: 2022-11-11

Abstract

本发明公开了基于自适应集成模型的区域人数统计方法和系统，属于人工智能技术领域，本发明要解决的技术问题为现有技术识别难以适配不同的拍摄角度和距离场景下的区域人数统计，采用的技术方案为：该方法具体如下：通过城市公共区域的摄像头获取视频数据，从视频数据中获取抽帧后的图像，通过人体特征检测算法得到图像中的人体目标数量和位置信息；根据人体目标数量和位置信息判断是否出现人体目标；将人体目标高宽比AR与阈值AR_th进行对比；根据平均目标大小

计算拍摄距离量化系数DR；根据所有的头部位置信息、人体特征位置信息、人体骨骼位置信息和脸部骨骼位置信息，并基于加权非极大值抑制算法获取区域人数信息和位置信息。

Description

基于自适应集成模型的区域人数统计方法和系统

技术领域

本发明涉及人工智能技术领域，具体地说是一种基于自适应集成模型的区域人数统计方法和系统。

背景技术

随着逐步放开了对人口流动的控制，城市化进程不断加快，沿海发达城市的人口密度不断提升。出于传染病防控和预防社会治安问题，目前已经在城市道路和重点场所安装了大量的摄像头，用于对特定区域的人员和行为进行实时检测，以便快速定位特殊人员。

针对上述问题，需要利用城市公共区域的摄像头查看视频数据，基于智能视频分析，对划定区域内的人员数量进行统计，当检测到有区域人数超过设定阈值时自动抓拍并产生报警，减少人力监管的成本。

现有技术主要分为两类，具体如下：

一类是基于红外热成像原理的人数统计，采用实例分割技术分析热成像图像中出现的活体数量，此方法只适用于地铁、商场和写字楼入口等场景，设备成本较高，同时在开放区域由于人员距离较远容易导致漏统计。

另一类是基于可见光成像原理的人数统计，通过神经网络算法对人数进行统计，该方法准确率较高，但是难以适配不同的拍摄角度和距离。

发明内容

本发明的技术任务是提供一种基于自适应集成模型的区域人数统计方法和系统，来解决现有技术识别难以适配不同的拍摄角度和距离场景下的区域人数统计的问题。

本发明的技术任务是按以下方式实现的，一种基于自适应集成模型的区域人数统计方法，该方法具体如下：

通过城市公共区域的摄像头获取视频数据，从视频数据中获取抽帧后的图像，通过人体特征检测算法得到图像中的人体目标数量和位置信息；

根据人体目标数量和位置信息判断是否出现人体目标：

若出现人体目标，则计算人体目标平均高宽比AR；

若未出现人体目标，则调用脸部特征检测算法获取脸部骨骼位置信息；

将人体目标高宽比AR与阈值AR_th进行对比：

当AR<AR_th时，则对应的城市公共区域的摄像头为高空俯拍摄像头，并调用头部特征检测算法获取头部位置信息；

当AR>AR_th时，则对应的城市公共区域的摄像头不是高空俯拍摄像头，并计算平均目标大小

根据平均目标大小

计算拍摄距离量化系数DR；具体情况如下：

当DR<DR_min时，则判定为近距离拍摄，并调用脸部特征检测算法和骨骼关键点检测算法获取脸部骨骼位置信息和人体骨骼位置信息；

当DR_min<DR<DR_max时，则判定为中距离拍摄，调用骨骼关键点检测算法和人体特征检测算法获取人体骨骼位置信息和人体特征位置信息；

当DR>DR_max时，则判定为远距离拍摄，调用人体特征检测算法和头部特征检测算法获取人体特征位置信息和头部位置信息；

其中，DR_min和DR_max分别为拍摄距离阈值，根据历史经验最优值为DR_min＝0.5，DR_max＝2，根据数据集实际情况调整；

根据所有的头部位置信息、人体特征位置信息、人体骨骼位置信息和脸部骨骼位置信息，并基于加权非极大值抑制算法获取区域人数信息和位置信息。

作为优选，人体目标平均高宽比AR的计算公式如下：

其中，N表示识别到的人体目标数量；X_B1,i,X_B2,i,Y_B1,i,Y_B2,i表示第i个人体目标的四个坐标位置；

平均目标大小

的计算公式如下：

其中，N表示识别到的人体目标数量；X_B1,i,X_B2,i,Y_B1,i,Y_B2,i表示第i个人体目标的四个坐标位置；W表示图像宽度；H表示图像高度；

拍摄距离量化系数DR计算公式如下：

其中，S_st表示目标大小的标准值，自行设定或者以数据集中全部人体目标计算得到的

作为S_st。

更优地，所述头部特征检测算法采用单阶段目标检测中的YOLO系列算法，通过头部特征检测算法训练数据集进行模型训练，训练后得到的模型检测出图像中所有头部外接矩形的二维坐标(X_H1,i,X_H2,i,Y_H1,i,Y_H2,i)和置信度C_Hi；

在构建头部特征检测算法训练数据集时，采用高空摄像头俯拍得到的图像数据，高空摄像头俯拍得到的图像数据包括若干人体头部目标。

更优地，所述脸部特征检测算法采用MTCNN算法，通过网络开源的人脸特征数据集进行模型训练，训练后得到的模型检测出图像中所有人脸外接矩形的二维坐标(X_F1,i,X_F2,i,Y_F1,i,Y_F2,i)和置信度C_Fi；

骨骼关键点检测算法采用OpenPose算法，通过网络开源的骨骼关键点数据集进行模型训练，训练后得到的模型检测图像中所有人体骨骼外接矩形的二维坐标(X_S1,i,X_S2,i,Y_S1,i,Y_S2,i)和置信度C_Si。

更优地，所述人体特征检测算法采用单阶段目标检测中的YOLO系列算法，通过自建的人体特征检测算法训练数据集进行模型训练，训练后得到的模型检测出图像中所有人体目标的外接矩形的二维坐标(X_B1,i,X_B2,i,Y_B1,i,Y_B2,i)和置信度C_Bi；

在构建人体特征检测算法训练数据集时，采用多种拍摄角度和距离的混合图像数据集，混合图像数据集包括俯拍头部目标、正拍人脸目标以及各种距离的人体全身和半身目标。

更优地，所述加权非极大值抑制算法引入了权重参数对目标候选框的置信度进行修正，修正置信度具体如下

C'_Fi＝W_CF×C_Fi；

C'_Si＝W_CS×C_Si；

C'_Bi＝W_CB×C_Bi；

C'_Hi＝W_CH×C_Hi；

其中，W_CF，W_CS，W_CB及W_CH分别为脸部特征检测算法的权重、骨骼关键点检测算法的权重、人体特征检测算法的权重以及头部特征检测算法的权重；

脸部特征检测算法的权重W_CF、骨骼关键点检测算法的权重W_CS、人体特征检测算法的权重W_CB以及头部特征检测算法的权重W_CH的计算方式如下：

加权非极大值抑制算法具体实现方式如下：

(1)、构建初始化候选框集合H，初始化候选框集合H包含全部N个候选框；

(2)、构建一个存放最优框的集合M并初始化为空集；

(3)、搜索所有候选框，找到修正置信度最高的一个候选框m，从初始化候选框集合H移到最优框的集合M，遍历初始化候选框集合H中所有的候选框，计算与修正置信度最高候选框m的交幷比IoU，判断是否超过阈值：

若超过阈值，则认为对应的候选框与修正置信度最高候选框m重叠，将该候选框从初始化候选框集合H中去除；

(4)重复步骤(3)，直到初始化候选框集合H为空集,初始化候选框集合H中的候选框即为最终返回的目标。

一种基于自适应集成模型的区域人数统计系统，该系统包括，

视频抽帧模块，用于通过城市公共区域的摄像头获取视频数据，从视频数据中获取抽帧后的图像，通过人体特征检测算法得到图像中的人体目标数量和位置信息；

人体目标判断模块，用于根据人体目标数量和位置信息判断是否出现人体目标：

若出现人体目标，则计算人体目标平均高宽比AR；

阈值对比模块，用于将人体目标高宽比AR与阈值AR_th进行对比：

拍摄距离判定模块，用于根据平均目标大小

计算拍摄距离量化系数DR；具体情况如下：

其中，DR_min和DR_max分别为拍摄距离阈值，最优值为DR_min＝0.5，DR_max＝2，根据数据集实际情况调整；

区域人数和位置信息获取模块，用于根据所有的头部位置信息、人体特征位置信息、人体骨骼位置信息和脸部骨骼位置信息，并基于加权非极大值抑制算法获取区域人数信息和位置信息。

作为优选，人体目标平均高宽比AR的计算公式如下：

平均目标大小

的计算公式如下：

拍摄距离量化系数DR计算公式如下：

作为S_st。

在构建头部特征检测算法训练数据集时，采用高空摄像头俯拍得到的图像数据，高空摄像头俯拍得到的图像数据包括若干人体头部目标；

所述脸部特征检测算法采用MTCNN算法，通过网络开源的人脸特征数据集进行模型训练，训练后得到的模型检测出图像中所有人脸外接矩形的二维坐标(X_F1,i,X_F2,i,Y_F1,i,Y_F2,i)和置信度C_Fi；

所述骨骼关键点检测算法采用OpenPose算法，通过网络开源的骨骼关键点数据集进行模型训练，训练后得到的模型检测图像中所有人体骨骼外接矩形的二维坐标(X_S1,i,X_S2,i,Y_S1,i,Y_S2,i)和置信度C_Si；

所述人体特征检测算法采用单阶段目标检测中的YOLO系列算法，通过自建的人体特征检测算法训练数据集进行模型训练，训练后得到的模型检测出图像中所有人体目标的外接矩形的二维坐标(X_B1,i,X_B2,i,Y_B1,i,Y_B2,i)和置信度C_Bi；

在构建人体特征检测算法训练数据集时，采用多种拍摄角度和距离的混合图像数据集，混合图像数据集包括俯拍头部目标、正拍人脸目标以及各种距离的人体全身和半身目标；

所述加权非极大值抑制算法引入了权重参数对目标候选框的置信度进行修正，修正置信度具体如下：

C'_Fi＝W_CF×C_Fi；

C'_Si＝W_CS×C_Si；

C'_Bi＝W_CB×C_Bi；

C'_Hi＝W_CH×C_Hi；

加权非极大值抑制算法具体实现方式如下：

(2)、构建一个存放最优框的集合M并初始化为空集；

一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序可被处理器执行以实现如上述的基于自适应集成模型的区域人数统计方法。

本发明的基于自适应集成模型的区域人数统计方法和系统具有以下优点：

(一)本发明通过采用人体特征检测算法，可以计算摄像头的拍摄角度和拍摄距离，根据拍摄角度和距离进行模型融合，所得到的集成模型兼容性更好，在准确率方面更具优势；

(二)本发明采用加权非极大值抑制的方法进行模型集成，解决单一模型容易受到拍摄角度和距离变化导致性能不稳定的问题，可以满足多种场景下的区域人数统计需求；

(三)本发明解决了单一算法模型无法适配不同角度和不同拍摄距离的问题，通过模型集成提升了系统的鲁棒性，集成后的算法模型在识别准确率上大大优于单一模型。

附图说明

下面结合附图对本发明进一步说明。

附图1为基于自适应集成模型的区域人数统计方法的流程框图；

附图2为基于自适应集成模型的区域人数统计的结构框图。

具体实施方式

参照说明书附图和具体实施例对本发明的基于自适应集成模型的区域人数统计方法和系统作以下详细地说明。

实施例1：

如附图1所示，本实施例提供了一种基于自适应集成模型的区域人数统计方法，该方法具体如下：

S1、通过城市公共区域的摄像头获取视频数据，从视频数据中获取抽帧后的图像，通过人体特征检测算法得到图像中的人体目标数量和位置信息；

S2、根据人体目标数量和位置信息判断是否出现人体目标：

①、若出现人体目标，则执行步骤S3；

②、若未出现人体目标，则调用脸部特征检测算法获取脸部骨骼位置信息；

S3、计算人体目标平均高宽比AR，并通过人体目标高宽比AR推断拍摄角度；

S4、将人体目标高宽比AR与阈值AR_th进行对比：

S5、根据平均目标大小

计算拍摄距离量化系数DR；具体情况如下：

S6、根据所有的头部位置信息、人体特征位置信息、人体骨骼位置信息和脸部骨骼位置信息，并基于加权非极大值抑制算法获取区域人数信息和位置信息。

本实施例步骤S3中的人体目标平均高宽比AR的计算公式如下：

本实施例步骤S4中的平均目标大小

的计算公式如下：

本实施例步骤S5中的拍摄距离量化系数DR计算公式如下：

作为S_st。

本实施例中的头部特征检测算法采用单阶段目标检测中的YOLO系列算法，通过头部特征检测算法训练数据集进行模型训练，训练后得到的模型检测出图像中所有头部外接矩形的二维坐标(X_H1,i,X_H2,i,Y_H1,i,Y_H2,i)和置信度C_Hi；

本实施例中的脸部特征检测算法采用MTCNN算法，通过网络开源的人脸特征数据集进行模型训练，训练后得到的模型检测出图像中所有人脸外接矩形的二维坐标(X_F1,i,X_F2,i,Y_F1,i,Y_F2,i)和置信度C_Fi；

本实施例中的骨骼关键点检测算法采用OpenPose算法，通过网络开源的骨骼关键点数据集进行模型训练，训练后得到的模型检测图像中所有人体骨骼外接矩形的二维坐标(X_S1,i,X_S2,i,Y_S1,i,Y_S2,i)和置信度C_Si。

本实施例中的人体特征检测算法采用单阶段目标检测中的YOLO系列算法，通过自建的人体特征检测算法训练数据集进行模型训练，训练后得到的模型检测出图像中所有人体目标的外接矩形的二维坐标(X_B1,i,X_B2,i,Y_B1,i,Y_B2,i)和置信度C_Bi；

本实施例中的加权非极大值抑制算法引入了权重参数对目标候选框的置信度进行修正，修正置信度具体如下

C'_Fi＝W_CF×C_Fi；

C'_Si＝W_CS×C_Si；

C'_Bi＝W_CB×C_Bi；

C'_Hi＝W_CH×C_Hi；

本实施例中的加权非极大值抑制算法具体实现方式如下：

(2)、构建一个存放最优框的集合M并初始化为空集；

实施例2：

如附图2所示，本实施例提供了一种基于自适应集成模型的区域人数统计系统，该系统包括，

若出现人体目标，则计算人体目标平均高宽比AR；

拍摄距离判定模块，用于根据平均目标大小

计算拍摄距离量化系数DR；具体情况如下：

本实施例中的人体目标平均高宽比AR的计算公式如下：

本实施例中的平均目标大小

的计算公式如下：

本实施例中的拍摄距离量化系数DR计算公式如下：

作为S_st。

本实施例中的骨骼关键点检测算法采用OpenPose算法，通过网络开源的骨骼关键点数据集进行模型训练，训练后得到的模型检测图像中所有人体骨骼外接矩形的二维坐标(X_S1,i,X_S2,i,Y_S1,i,Y_S2,i)和置信度C_Si；

本实施例中的加权非极大值抑制算法引入了权重参数对目标候选框的置信度进行修正，修正置信度具体如下：

C'_Fi＝W_CF×C_Fi；

C'_Si＝W_CS×C_Si；

C'_Bi＝W_CB×C_Bi；

C'_Hi＝W_CH×C_Hi；

本实施例中的加权非极大值抑制算法具体实现方式如下：

(2)、构建一个存放最优框的集合M并初始化为空集；

实施例3：

本实施例还提供了一种计算机可读存储介质，其中存储有多条指令，指令由处理器加载，使处理器执行本发明任一实施例中的基于自适应集成模型的区域人数统计方法。具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。

在这种情况下，从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RYM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上下载程序代码。

此外，应该清楚的是，不仅可以通过执行计算机所读出的程序代码，而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作，从而实现上述实施例中任意一项实施例的功能。

此外，可以理解的是，将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中，随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作，从而实现上述实施例中任一实施例的功能。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于自适应集成模型的区域人数统计方法，其特征在于，该方法具体如下：

根据人体目标数量和位置信息判断是否出现人体目标：

若出现人体目标，则计算人体目标平均高宽比AR；

将人体目标高宽比AR与阈值AR_th进行对比：

根据平均目标大小

计算拍摄距离量化系数DR；具体情况如下：

2.根据权利要求1所述的基于自适应集成模型的区域人数统计方法，其特征在于，人体目标平均高宽比AR的计算公式如下：

平均目标大小

的计算公式如下：

拍摄距离量化系数DR计算公式如下：

作为S_st。

3.根据权利要求1或2所述的基于自适应集成模型的区域人数统计方法，其特征在于，所述头部特征检测算法采用单阶段目标检测中的YOLO系列算法，通过头部特征检测算法训练数据集进行模型训练，训练后得到的模型检测出图像中所有头部外接矩形的二维坐标(X_H1,i,X_H2,i,Y_H1,i,Y_H2,i)和置信度C_Hi；

4.根据权利要求3所述的基于自适应集成模型的区域人数统计方法，其特征在于，所述脸部特征检测算法采用MTCNN算法，通过网络开源的人脸特征数据集进行模型训练，训练后得到的模型检测出图像中所有人脸外接矩形的二维坐标(X_F1,i,X_F2,i,Y_F1,i,Y_F2,i)和置信度C_Fi；

5.根据权利要求4所述的基于自适应集成模型的区域人数统计方法，其特征在于，所述人体特征检测算法采用单阶段目标检测中的YOLO系列算法，通过自建的人体特征检测算法训练数据集进行模型训练，训练后得到的模型检测出图像中所有人体目标的外接矩形的二维坐标(X_B1,i,X_B2,i,Y_B1,i,Y_B2,i)和置信度C_Bi；

6.根据权利要求5所述的基于自适应集成模型的区域人数统计方法，其特征在于，所述加权非极大值抑制算法引入了权重参数对目标候选框的置信度进行修正，修正置信度具体如下

C′_Fi＝W_CF×C_Fi；

C′_si＝W_CS×C_Si；

C′_Bi＝W_CB×C_Bi；

C′_Hi＝W_CH×C_Hi；

加权非极大值抑制算法具体实现方式如下：

(2)、构建一个存放最优框的集合M并初始化为空集；

7.一种基于自适应集成模型的区域人数统计系统，其特征在于，该系统包括，

若出现人体目标，则计算人体目标平均高宽比AR；

拍摄距离判定模块，用于根据平均目标大小

计算拍摄距离量化系数DR；具体情况如下：

DR_min和DR_max分别为拍摄距离阈值，最优值为DR_min＝0.5，DR_max＝2，根据数据集实际情况调整；

8.根据权利要求7所述的基于自适应集成模型的区域人数统计系统，其特征在于，人体目标平均高宽比AR的计算公式如下：

平均目标大小

的计算公式如下：

拍摄距离量化系数DR计算公式如下：

作为S_st。

9.根据权利要求7或8所述的基于自适应集成模型的区域人数统计系统，其特征在于，所述头部特征检测算法采用单阶段目标检测中的YOLO系列算法，通过头部特征检测算法训练数据集进行模型训练，训练后得到的模型检测出图像中所有头部外接矩形的二维坐标(X_H1,i,X_H2,i,Y_H1,i,Y_H2,i)和置信度C_Hi；

C′_Fi＝W_CF×C_Fi；

C′_si＝W_CS×C_Si；

C′_Bi＝W_CB×C_Bi；

C′_Hi＝W_CH×C_Hi；

加权非极大值抑制算法具体实现方式如下：

(2)、构建一个存放最优框的集合M并初始化为空集；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序可被处理器执行以实现如权利要求1至6中任一项所述的基于自适应集成模型的区域人数统计方法。