CN113496175A

CN113496175A - 一种人形上半身检测分块设计方法

Info

Publication number: CN113496175A
Application number: CN202010264080.7A
Authority: CN
Inventors: 于晓静
Original assignee: Beijing Ingenic Semiconductor Co Ltd
Current assignee: Beijing Ingenic Semiconductor Co Ltd
Priority date: 2020-04-07
Filing date: 2020-04-07
Publication date: 2021-10-12

Abstract

本发明提供一种人形上半身检测分块设计方法，所述方法包括以下步骤：S1，级联卷积网络对图像进行图像金字塔构建，以M*N为输入分辨率，以scale为i的缩放系数进行构造图像金字塔，金字塔图像列表计算公式为：input_w*i的n次方，input_h*i的n次方；S2，以16+3的设计理念进行分块优化，其中，16指的是图像宽的方向分为四块，高的方向分为四块，3是指的金字塔列表里的最后三个，且16块的分块标准按以下公式计算：(INPUT_W‑WLEN_W)/INC_W+1＝FN_W(1)(INPUT_H‑WLEN_H)/INC_H+1＝FN_H(2)；其中，INPUT_W/INPUT_H为输入图像的宽/高；WLEN_W/WLEN_H为分块的宽/高长度；INC_W/INC_H为块移；FN_W/FN_H是我们在横向/纵向要分的块数。本发明改变传统方案都是基于全帧去检测的方法，单纯依靠CPU工作却能够降低CPU负载，提升用户体验。

Description

一种人形上半身检测分块设计方法

技术领域

本发明涉及神经网络领域，特别涉及一种人形上半身检测分块设计方法。

背景技术

人工智能领域中神经网络技术日益发展迅猛。其中MTCNN技术也是近年来较为流行的技术之一。MTCNN，Multi-task convolutional neural network(多任务卷积神经网络)，将人脸区域检测与人脸关键点检测放在了一起，总体可分为P-Net、R-Net、和O-Net三层网络结构。用于人脸检测任务的多任务神经网络模型，该模型主要采用了三个级联的网络，采用候选框加分类器的思想，进行快速高效的人脸检测。这三个级联的网络分别是快速生成候选窗口的P-Net、进行高精度候选窗口过滤选择的R-Net和生成最终边界框与人脸关键点的O-Net。

但是，在现有技术中，也存在如下缺点：传统方案都是基于全帧去检测，当前深度学习算法如果不依赖GPU或NPU等硬件加速处理器在嵌入式平台上纯粹靠CPU运行会非常吃力，客户体验也会非常不好，CPU占用率居高不下，落地困难。

此外，现有技术中常用的技术术语包括：

级联卷积网络：就是设计N阶网络，由粗到精对任务进行处理。

图像金字塔：就是将图像按一定尺度进行变换，以适应对不同大小的人脸进行检测。

最小检测大小：如果检测目标宽高小于最小检测大小，模型没有检测能力。

发明内容

为了解决上述问题，本发明的目的在于：改变传统方案都是基于全帧去检测的方法，单纯依靠CPU工作却能够降低CPU负载，提升用户体验。

具体地，本发明提供一种人形上半身检测分块设计方法，所述方法包括以下步骤：

S1，级联卷积网络对图像进行图像金字塔构建，以M*N为输入分辨率，以scale为i的缩放系数进行构造图像金字塔，金字塔图像列表计算公式为：input_w*i的n次方，input_h*i的n次方；

S2，以16+3的设计理念进行分块优化，其中，16指的是图像宽的方向分为四块，高的方向分为四块，3是指的金字塔列表里的最后三个，且16块的分块标准按以下公式计算：

(INPUT_W-WLEN_W)/INC_W+1＝FN_W (1)

(INPUT_H-WLEN_H)/INC_H+1＝FN_H (2)

其中，

INPUT_W/INPUT_H为输入图像的宽/高；

WLEN_W/WLEN_H为分块的宽/高长度；

INC_W/INC_H为块移；

FN_W/FN_H是在横向/纵向要分的块数。

所述步骤S1中,所述的以M*N为输入分辨率，M＝640，N＝360；所述的i＝0.6。

所述步骤S1中，人形检测最小检测大小为40，输入分辨率640*360对应的列表为(640，360)，(384，216)，(230，130)，(138，78)，(83，47)，因为47再以0.6的比例缩放已经小于最小检测大小，所以(83，47)作为最后一个金字塔图像。

所述的步骤S2中，所述的块移的计算通过以下公式计算：

MIN_OBJECT_SIZE为最小检测物体大小

INC_W＝(INPUT_W–MIN_OBJECT_SIZE)/FN_W (3)

MIN_OBJECT_SIZE，其保证跨越两块之间的最小物体不漏检。

所述的以M*N为输入分辨率，M＝640，N＝360；所述的i＝0.6，则

INPUT_W＝640

FN_W＝4

根据公式(3)

INC_W＝(640–40)/4＝150

根据公式(1)

WLEN_W＝190。

所述的WLEN_W为190，取图像金字塔的最后三个(230，130)，(138，78)，(83，47)作为16+3的设计理念的后面的3。

同理：

INPUT_H＝360

FN_H＝4

根据公式(3)

INC_H＝(360–40)/4＝80

根据公式(1)

WLEN_H＝120。

由此，本申请的优势在于：

1采用分块设计的方法，会大大提升用户体验，把每帧所需要的算力平摊到多帧，大大降低CPU负载；

2本发明的分块设计方法，充分考虑到了大小目标的检测范围，与整帧检测效果没有差异。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1是本发明方法的示意流程图。

具体实施方式

为了能够更清楚地理解本发明的技术内容及优点，现结合附图对本发明进行进一步的详细说明。

如图1所示，本发明涉及一种人形上半身检测分块设计方法，所述方法包括以下步骤：

S1，级联卷积网络对图像进行图像金字塔构建，项目以M*N为输入分辨率，以scale为i的缩放系数进行构造图像金字塔，金字塔图像列表计算公式为：input_w*i的n次方，input_h*i的n次方；

(INPUT_W-WLEN_W)/INC_W+1＝FN_W (1)

(INPUT_H-WLEN_H)/INC_H+1＝FN_H (2)

其中，

INPUT_W/INPUT_H为输入图像的宽/高；

WLEN_W/WLEN_H为分块的宽/高长度；

INC_W/INC_H为块移；

FN_W/FN_H是我们在横向/纵向要分的块数。

所述的步骤S2中，所述的块移的计算通过以下公式计算：

MIN_OBJECT_SIZE为最小检测物体大小

INC_W＝(INPUT_W–MIN_OBJECT_SIZE)/FN_W (3)

MIN_OBJECT_SIZE，其保证跨越两块之间的最小物体不漏检。

具体地，可以按照以下描述方式解释本申请：

1级联卷积网络需要对图像进行图像金字塔构建，项目以640*360为输入分辨率，以scale为0.6的缩放系数进行构造图像金字塔，金字塔图像列表计算公式为(input_w*0.6的n次方，input_h*0.6的n次方)；

以人形检测最小检测大小为40为例，640*360对应的列表为(640，360)，(384，216)，(230，130)，(138，78)，(83，47)，因为47再以0.6的比例缩放已经小于最小检测大小，所以(83，47)为最后一个金字塔图像；

2分块设计：

因为640*360的大分辨率图计算量占整体计算量的70％以上，所以重点对640*360进行分块优化；

16+3的设计理念：16指的是图像宽的方向分为四块，高的方向分为四块，3是指的金字塔列表里的最后三个。

16块的分块标准以以下公式计算：

(INPUT_W-WLEN_W)/INC_W+1＝FN_W (1)

(INPUT_H-WLEN_H)/INC_H+1＝FN_H (2)

INPUT_W/INPUT_H为输入图像的宽和高

WLEN_W/WLEN_H为分块的宽和高长度

INC_W/INC_H为块移

FN_W/FN_H是在横向和纵向要分的块数

块移的计算通过以下公式计算：

MIN_OBJECT_SIZE为最小检测物体大小

INC_W＝(INPUT_W–MIN_OBJECT_SIZE)/FN_W (3)

尤为重要的是MIN_OBJECT_SIZE，其保证跨越两块之间的最小物体不漏检；

以640*360为例：

INPUT_W＝640

FN_W＝4

根据公式(3)

INC_W＝(640–40)/4＝150

根据公式(1)

WLEN_W＝190

此例中WLEN_W为190，取金字塔的最后三个(230，130)，(138，78)，(83，47)作为16+3后面的3的设计理念，对于跨越两块的大目标有检测能力并且计算量很小。

同理：

INPUT_H＝360

FN_H＝4

INC_H＝(360–40)/4＝80

WLEN_H＝120。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种人形上半身检测分块设计方法，其特征在于，所述方法包括以下步骤：

S2，以16+3的设计理念进行分块优化，其中，16指的是图像宽的方向分为四块，高的方向分为四块，3是指的图像金字塔列表里的最后三个，且16块的分块标准按以下公式计算：

(INPUT_W-WLEN_W)/INC_W+1＝FN_W (1)

(INPUT_H-WLEN_H)/INC_H+1＝FN_H (2)

其中，

INPUT_W/INPUT_H为输入图像的宽/高；

WLEN_W/WLEN_H为分块的宽/高长度；

INC_W/INC_H为块移；

FN_W/FN_H是在横向/纵向要分的块数。

2.根据权利要求1所述的一种人形上半身检测分块设计方法，其特征在于，所述步骤S1中,所述的以M*N为输入分辨率，M＝640，N＝360；所述的i＝0.6。

3.根据权利要求2所述的一种人形上半身检测分块设计方法，其特征在于，所述步骤S1中，人形检测最小检测大小为40，输入分辨率640*360对应的列表为(640，360)，(384，216)，(230，130)，(138，78)，(83，47)，因为47再以0.6的比例缩放已经小于最小检测大小，所以(83，47)作为最后一个金字塔图像。

4.根据权利要求1所述的一种人形上半身检测分块设计方法，其特征在于，所述的步骤S2中，所述的块移的计算通过以下公式计算：

MIN_OBJECT_SIZE为最小检测物体大小

INC_W＝(INPUT_W–MIN_OBJECT_SIZE)/FN_W (3)

MIN_OBJECT_SIZE，其保证跨越两块之间的最小物体不漏检。

5.根据权利要求4所述的一种人形上半身检测分块设计方法，其特征在于，所述的以M*N为输入分辨率，M＝640，N＝360；所述的i＝0.6，则INPUT_W＝640

FN_W＝4

根据公式(3)

INC_W＝(640–40)/4＝150

根据公式(1)

WLEN_W＝190。

6.根据权利要求5所述的一种人形上半身检测分块设计方法，其特征在于，所述的WLEN_W为190，取图像金字塔的最后三个(230，130)，(138，78)，(83，47)作为16+3的设计理念的后面的3。

7.根据权利要求5所述的一种人形上半身检测分块设计方法，其特征在于，进一步同理：

INPUT_H＝360

FN_H＝4

根据公式(3)

INC_H＝(360–40)/4＝80

根据公式(1)

WLEN_H＝120。