WO2021042867A1

WO2021042867A1 - 一种实现人脸检测的方法和装置

Info

Publication number: WO2021042867A1
Application number: PCT/CN2020/101092
Authority: WO
Inventors: 刘若鹏; 栾琳; 季春霖; 杨亮
Original assignee: 西安光启未来技术研究院
Priority date: 2019-09-06
Filing date: 2020-07-09
Publication date: 2021-03-11
Also published as: CN112464692A

Abstract

本发明实施例公开了一种实现人脸检测的方法和装置，包括：当第一图像的分辨率大于人脸检测模型的分辨率时，将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像；其中，N为大于1的整数；对于每一个所述第二图像，获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息；将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。

Description

一种实现人脸检测的方法和装置

技术领域

本发明实施例涉及但不限于人脸检测技术和监控领域，尤指一种实现人脸检测的方法和装置。

背景技术

安防监控行业发展经历了从模拟到数字图像，再到数字高清图像演变。市场上通用监控摄像头的分辨率各种各样，有D1、720P、1080P、600万像素、4K、8K等等。近几年随着人类检测技术、人脸识别技术的兴起，无论是在头端做边缘计算还是在后端平台部署人脸检测与识别，都必然会涉及到人脸检测模型的分辨率的适配问题。

当前主流做人脸检测与识别的厂家只支持1080P并向下兼容，但是行业对摄像头的分辨率要求越来越高，如600万像素、4K等是发展趋势。在摄像头的分辨率越来越高的同时，如果人脸检测模型的分辨率小于图像的分辨率则无法对图像进行人脸检测。

发明内容

本发明实施例提供了一种实现人脸检测的方法和装置，能够在人脸检测模型的分辨率小于图像的分辨率的情况下实现对图像的人脸检测。

本发明实施例提供了一种实现人脸检测的方法，包括：

当第一图像的分辨率大于人脸检测模型的分辨率时，将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像；其中，N为大于1的整数；

对于每一个所述第二图像，获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息；

将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。

在本发明实施例中，所述将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上：

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时，将所述第一图像拆分成N1个所述第二图像；其中，N1为大于1的整数；

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1，且小于或等于N2时，将所述第一图像拆分成N2个所述第二图像；N2为大于N1的整数。

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时，将所述第一图像拆分成N1个分辨率相等的所述第二图像；

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1，且小于或等于N2时，将所述第一图像拆分成N2个分辨率相等的所述第二图像。

在本发明实施例中，所述N2为所述N1的平方。

在本发明实施例中，所述N1为4，所述N2为16。

在本发明实施例中，当所述N2为所述N1的平方时，所述将第一图像拆分成N2个所述第二图像包括：

将所述第一图像拆分成N1个第三图像；

将每一个所述第三图像拆分成N1个第一图像。

在本发明实施例中，N个所述第二图像的分辨率相等。

在本发明实施例中，所述将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息包括：

根据所述第一坐标系和所述第二坐标系之间的转换关系将所述第一坐标信息转换为所述第二坐标信息。

本发明实施例提供了一种实现人脸检测的装置，包括处理器和计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令被所述处理器执行时，实现上述任一种实现人脸检测的方法。

本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一种实现人脸检测的方法的步骤。

本发明实施例包括：当第一图像的分辨率大于人脸检测模型的分辨率时，将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像；其中，N为大于1的整数；对于每一个所述第二图像，获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息；将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。本发明实施例采用分辨率小于第一图像的人脸检测模型实现了对第一图像的人脸检测，无需更换更复杂的人脸检测模型来实现人脸检测，从而降低了软件开发难度，并且，不需要对硬件进行升级。

本发明实施例的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明实施例而了解。本发明实施例的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明实施例技术方案的进一步理解，并且构成说明书的一部分，与本发明实施例的实施例一起用于解释本发明实施例的技术方案，并不构成对本发明实施例技术方案的限制。

图1为本发明一个实施例提出的实现人脸检测的方法的流程图；

图2为本发明实施例中将第一图像四等分时建立的第一坐标系和第二坐标系的示意图；

图3为本发明实施例中将第一图像16等分时建立的第一坐标系和第二坐标系的示意图；

图4为本发明另一个实施例提出的实现人脸检测的装置的结构组成示意图。

具体实施方式

下文中将结合附图对本发明实施例进行详细说明。需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

参见图1，本发明一个实施例提出了一种实现人脸检测的方法，包括：

步骤100、当第一图像的分辨率大于人脸检测模型的分辨率时，将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像；其中，N为大于1的整数。

在本发明实施例中，人脸检测模型的分辨率是指人脸检测模型所能检测的图像的最大分辨率。

在本发明实施例中，第一图像可以是预先存储的图像，也可以是连续视频流中的图像。当第一图像为连续视频流中的图像时，第一图像映射在嵌入式系统的内存中，可以在内存中根据地址将第一图像拆分成N个第二图像。

在本发明实施例中，N个第二图像的分辨率可以相等，也可以不相等。

在一个示例性实例中，将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上：

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1，且小于或等于N2时，将所述第一图像拆分成N2个所述第二图像；其中，N2为大于N1的整数；

在一个示例性实例中，N2为N1的平方。

在一个示例性实例中，N1为4，所述N2为16。当然，N1和N2的取值不仅仅局限于4和16，其他的取值均在本发明实施例的保护范围内。

需要说明的是，当N2为N1的平方时，在将第一图像拆分成N2个第二图像时，可以直接拆分成N2个第二图像；也可以先将第一图像拆分成N1个第三图像，再将每一个第三图像拆分成N1个第二图像。

其中，N1个第三图像的分辨率可以相等，也可以不相等。

本发明实施例对第一图像的拆分方式不仅仅局限于上述所列出的方式，具体的拆分方式不用于限定本发明实施例的保护范围。

步骤101、对于每一个所述第二图像，获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息；将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。

在本发明实施例中，采用人脸检测模型对所述第二图像进行人脸检测得到所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息。

在本发明实施例中，人脸在所述第二图像对应的第二坐标系中的第一坐标信息是指人脸所在的矩形框在所述第二图像对应的第二坐标系中的第一坐标信息，人脸在所述第一图像对应的第一坐标系中的第二坐标信息同样是指人脸所在的矩形框在所述第一图像对应的第一坐标系中的第二坐标信息。

在本发明实施例中，将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息包括：

在一个示例性实例中，第一坐标系和第二坐标系之间的转换关系可以根据第一坐标系和第二坐标系之间的平移关系，以及第一坐标系和第二坐标系之间的旋转关系来确定。

平移关系可以根据第一坐标系的坐标原点和第二坐标系的坐标原点来确定，旋转关系可以根据第一坐标系的x轴和第二坐标系的x轴的方向、以及第一坐标系的y轴和第二坐标系的y轴的方向来确定。

例如，如图2所示，当将第一图像拆分成4个分辨率相等的第二图像，即将第一图像P拆分成第二图像P1、第二图像P2、第二图像P3和第二图像P4时，假设，第一坐标系为XOY，第二图像P1对应的第二坐标系为X ₁O ₁Y ₁，第二图像P2对应的第二坐标系为X ₂O ₂Y ₂，第二图像P3对应的第二坐标系为X ₃O ₃Y ₃，第二图像P4对应的第二坐标系为X ₄O ₄Y ₄；

假设，第一图像的分辨率为(n×a)×(n×c)，人脸检测模型的分辨率为a×c，那么，第二图像的分辨率为

其中，第一坐标系的坐标原点为第一图像P的左下角，x轴方向平行于第一图像P的第一方向，y轴方向平行于第一图像P的第二方向；

第二图像P1对应的第二坐标系的坐标原点为第二图像P1的左下角，x轴方向平行于第二图像P1的第一方向，y轴方向平行于第二图像P1的第二方向；

第二图像P2对应的第二坐标系的坐标原点为第二图像P2的左下角，x轴方向平行于第二图像P2的第一方向，y轴方向平行于第二图像P2的第二方向；

第二图像P3对应的第二坐标系的坐标原点为第二图像P3的左下角，x轴方向平行于第二图像P3的第一方向，y轴方向平行于第二图像P3的第二方向；

第二图像P4对应的第二坐标系的坐标原点为第二图像P4的左下角，x轴方向平行于第二图像P4的第一方向，y轴方向平行于第二图像P4的第二方向。

那么，由于第一坐标系和第二坐标系的x轴方向为平行关系，第一坐标系和第二坐标系的y轴方向也为平行关系，因此，第一坐标系和第二坐标系之间的转换关系仅与第一坐标系和第二坐标系之间的平移关系有关。从图2可以看出，第一坐标系和第二图像P1对应的第二坐标系的转换关系为：

第一坐标系和第二图像P2对应的第二坐标系的转换关系为：X＝X ₂，

第一坐标系和第二图像P3对应的第二坐标系的转换关系为：X＝X ₃，Y＝Y ₃；第一坐标系和第二图像P4对应的第二坐标系的转换关系为：

Y＝Y ₄；

其中，(X，Y)为第二图像P1或第二图像P2或第二图像P3或第二图像P4上某一点在第一图像P对应的第一坐标系中的坐标，(X ₁，Y ₁)为第二图像P1上某一点在第二图像P1对应的第二坐标系中的坐标，(X ₂，Y ₂)为第二图像P2上某一点在第二图像P2对应的第二坐标系中的坐标，(X ₃，Y ₃)为第二图像P3上某一点在第二图像P3对应的第二坐标系中的坐标，(X ₄，Y ₄)为第二图像P4上某一点在第二图像P4对应的第二坐标系中的坐标。

又如，如图3所示，当将第一图像拆分成16个分辨率相等的第二图像，即将第一图像P拆分成第二图像P11、第二图像P12、第二图像P13、第二图像P14、第二图像P21、第二图像P22、第二图像P23、第二图像P24、第二图像P31、第二图像P32、第二图像P33、第二图像P34、第二图像P41、第二图像P42、第二图像P43、第二图像P44、时，假设，第一坐标系为XOY，第二图像P11对应的第二坐标系为X ₁₁O ₁₁Y ₁₁，第二图像P12对应的第二坐标系为X ₁₂O ₁₂Y ₁₂，第二图像P13对应的第二坐标系为X ₁₃O ₁₃Y ₁₃，第二图像P14对应的第二坐标系为X ₁₄O ₁₄Y ₁₄；第二图像P21对应的第二坐标系为X ₂₁O ₂₁Y ₂₁，第二图像P22对应的第二坐标系为X ₂₂O ₂₂Y ₂₂，第二图像P23对应的第二坐标系为X ₂₃O ₂₃Y ₂₃，第二图像P24对应的第二坐标系为X ₂₄O ₂₄Y ₂₄；第二图像P31对应的第二坐标系为X ₃₁O ₃₁Y ₃₁，第二图像P32对应的第二坐标系为X ₃₂O ₃₂Y ₃₂，第二图像P33对应的第二坐标系为X ₃₃O ₃₃Y ₃₃，第二图像P34对应的第二坐标系为X ₃₄O ₃₄Y ₃₄；第二图像P41对应的第二坐标系为X ₄₁O ₄₁Y ₄₁，第二图像P42对应的第二坐标系为X ₄₂O ₄₂Y ₄₂，第二图像P43对应的第二坐标系为X ₄₃O ₄₃Y ₄₃，第二图像P44对应的第二坐标系为X ₄₄O ₄₄Y ₄₄；

第二图像P11对应的第二坐标系的坐标原点为第二图像P11的左下角，x轴方向平行于第二图像P11的第一方向，y轴方向平行于第二图像P11的第二方向；

第二图像P12对应的第二坐标系的坐标原点为第二图像P12的左下角，x轴方向平行于第二图像P12的第一方向，y轴方向平行于第二图像P12的第二方向；

第二图像P13对应的第二坐标系的坐标原点为第二图像P13的左下角，x轴方向平行于第二图像P13的第一方向，y轴方向平行于第二图像P3的第二方向；

第二图像P14对应的第二坐标系的坐标原点为第二图像P14的左下角，x轴方向平行于第二图像P14的第一方向，y轴方向平行于第二图像P14的第二方向；

以此类推，第二图像(P21、P22、P23、P24、P31、P32、P33、P34、P41、P42、P43、P44)分别对应的第二坐标系的坐标原点、x轴方向和y轴方向采用相同的方式确定。

那么，由于第一坐标系和第二坐标系的x轴方向为平行关系，第一坐标系和第二坐标系的y轴方向也为平行关系，因此，第一坐标系和第二坐标系之间的转换关系仅与第一坐标系和第二坐标系之间的平移关系有关。从图3可以看出，

第一坐标系和第二图像P11对应的第二坐标系的转换关系为：

第一坐标系和第二图像P12对应的第二坐标系的转换关系为：

第一坐标系和第二图像P13对应的第二坐标系的转换关系为：

第一坐标系和第二图像P14对应的第二坐标系的转换关系为：

第一坐标系和第二图像P21对应的第二坐标系的转换关系为：

第一坐标系和第二图像P22对应的第二坐标系的转换关系为：X＝X ₂，

第一坐标系和第二图像P23对应的第二坐标系的转换关系为：X＝X ₃，

第一坐标系和第二图像P24对应的第二坐标系的转换关系为：

第一坐标系和第二图像P31对应的第二坐标系的转换关系为：

第一坐标系和第二图像P32对应的第二坐标系的转换关系为：

第一坐标系和第二图像P33对应的第二坐标系的转换关系为：

Y＝Y ₃；第一坐标系和第二图像P34对应的第二坐标系的转换关系为：

Y＝Y ₄；

第一坐标系和第二图像P41对应的第二坐标系的转换关系为：

第一坐标系和第二图像P42对应的第二坐标系的转换关系为：X＝X ₂，

第一坐标系和第二图像P43对应的第二坐标系的转换关系为：X＝X ₃，Y＝Y ₃；第一坐标系和第二图像P44对应的第二坐标系的转换关系为：

Y＝Y ₄；

其中，(X，Y)为第二图像P1或第二图像P2或第二图像P3或第二图像P4上某一点在第一图像P对应的第一坐标系中的坐标，(X ₁₁，Y ₁₁)为第二图像P1上某一点在第二图像P1对应的第二坐标系中的坐标，(X ₁₂，Y ₁₂) 为第二图像P2上某一点在第二图像P2对应的第二坐标系中的坐标，(X ₁₃，Y ₁₃)为第二图像P3上某一点在第二图像P3对应的第二坐标系中的坐标，(X ₁₄，Y ₁₄)为第二图像P4上某一点在第二图像P4对应的第二坐标系中的坐标。

当然，第一坐标系和第二坐标系之间的转换关系不仅仅局限于这种转换关系，第一坐标系和第二坐标系之间的转换关系取决于第一坐标系和第二坐标系的建立方式，具体的转换关系不用于限定本发明实施例的保护范围。

本发明实施例采用所能检测的图像的最大分辨率小于第一图像的人脸检测模型实现了对第一图像的人脸检测，无需更换更复杂的人脸检测模型来实现人脸检测，从而降低了软件开发难度，并且，不需要对硬件进行升级。

实施例一

假设监控摄像机头端为4K像素的摄像机且头端的硬件支持人工智能(AI，Artificial Intelligence)计算，已有的人脸检测模型中需要输入分辨率小于或等于1080P(即1920×1080)的图像，那么要实现分辨率为4K(即3840×2160)视频流的第一图像的人脸检测，可以采用以下方式实现：

1)由于n＝2，因此，将第一图像四等分成第二图像P1、第二图像P2、第二图像P3、第二图像P4；

2)如图2所示，为第一图像建立第一坐标系，分别为第二图像P1、第二图像P2、第二图像P3、第二图像P4建立对应的第二坐标系；

3)令a＝1920，c＝1080；n＝2；那么，

A.第二图像P1对应的第二坐标系X ₁O ₁Y ₁与第一坐标系XOY之间的转换关系为：X＝X ₁+1920；Y＝Y ₁+1080；

B.第二图像P2对应的第二坐标系X ₂O ₂Y ₂与第一坐标系XOY之间的转换关系为：X＝X ₂；Y＝Y ₂+1080；

C.第二图像P3对应的第二坐标系X ₃O ₃Y ₃与第一坐标系XOY之间的转换关系为：X＝X ₃；Y＝Y ₃；

D.第二图像P4对应的第二坐标系X ₄O ₄Y ₄与第一坐标系XOY之间的转换关系为：X＝X ₄+1920；Y＝Y ₄；

4)将四等分后的第二图像P1、第二图像P2、第二图像P3、第二图像P4逐一送至分辨率为1920×1080人脸检测模型做人脸检测，输出基于各自第二坐标系的人脸的第一坐标。

5)根据步骤3)的第一坐标系和第二坐标系之间的转换关系，分别把基于第二图像P1、第二图像P2、第二图像P3、第二图像P4各自的第二坐标系的人脸的第一坐标转换成对应在第一图像P的第一坐标系XOY中的第二坐标。

6)每帧图像按上述方法实现人脸检测并打框，那么就实现了分辨率为4K的摄像头连续实时视频流里的人脸检测功能。

实施例二

假设监控摄像机头端为500万像素(3072×1728)摄像机且头端硬件支持AI计算，已有的人脸检测模型中需要输入分辨率小于或等于1080P(即1920×1080)的图像，那么要实现分辨率为500万像素的视频流的人脸检测，可以采用以下方式实现：

1)由于n＝1.6，因此，将第一图像四等分成第二图像P1、第二图像P2、第二图像P3、第二图像P4；

3)令a＝1920，c＝1080；n＝1.6；那么，

4)将四等分后的第二图像P1、第二图像P2、第二图像P3、第二图像P4 逐一送至分辨率为1920×1080人脸检测模型做人脸检测，输出基于各自第二坐标系的人脸的第一坐标。

6)每帧图像按上述方法实现人脸检测并打框，那么就实现了分辨率为500万像素的摄像头连续实时视频流里的人脸检测功能。

实施例三

假设监控摄像机头端为8K像素(7680×4320)摄像机且头端硬件支持AI计算，已有的人脸检测模型中需要输入分辨率小于或等于1080P(即1920×1080)的图像，那么要实现分辨率为8K像素的视频流的人脸检测可以采用以下方式实现：

1)，由于n＞2，将第一图像四等分成第三图像P1、第三图像P2、第三图像P3、第三图像P4后单幅第三图像的分辨率仍然大于1920×1080，因此，应当采用更多等分的方法，本例采用16等分，即将第三图像P1四等分成第二图像P11、第二图像P12、第二图像P13、第二图像P14，将第三图像P2四等分成第二图像P21、第二图像P22、第二图像P23、第二图像P24，将第三图像P3四等分成第二图像P31、第二图像P32、第二图像P33、第二图像P34，将第三图像P4四等分成第二图像P41、第二图像P42、第二图像P43、第二图像P44后单幅第二图像的分辨率为1920×1080，符合小于人脸检测模型的分辨率的要求；

2)如图3所示，为第一图像建立第一坐标系XOY，为第三图像P1建立第三坐标系X ₁O ₁Y ₁，为第三图像P2建立第三坐标系X ₂O ₂Y ₂，为第三图像P3建立第三坐标系X ₃O ₃Y ₃，为第三图像P4建立第三坐标系X ₄O ₄Y ₄，为第二图像P11建立第二坐标系X ₁₁O ₁₁Y ₁₁，为第二图像P12建立第二坐标系X ₁₂O ₁₂Y ₁₂，为第二图像P13建立第二坐标系X ₁₃O ₁₃Y ₁₃，为第二图像P14建立第二坐标系X ₁₄O ₁₄Y ₁₄，为第二图像P21建立第二坐标系X ₂₁O ₂₁Y ₂₁，为第二图像P22建立第二坐标系X ₂₂O ₂₂Y ₂₂，为第二图像P23建立第二坐标系X ₂₃O ₂₃Y ₂₃，为第二图像P24建立第二坐标系X ₂₄O ₂₄Y ₂₄，为第二图像P31建立第二坐标系X ₃₁O ₃₁Y ₃₁，为第二图像P32建立第二坐标系X ₃₂O ₃₂Y ₃₂，为第二图像P33建立第二坐标系X ₃₃O ₃₃Y ₃₃，为第二图像P34建立第二坐标系X ₃₄O ₃₄Y ₃₄，为第二图像P41建立第二坐标系X ₄₁O ₄₁Y ₄₁，为第二图像P42建立第二坐标系X ₄₂O ₄₂Y ₄₂，为第二图像P43建立第二坐标系X ₄₃O ₄₃Y ₄₃，为第二图像P44建立第二坐标系X ₄₄O ₄₄Y ₄₄；

3)令a＝1920，c＝1080；n＝2；那么，对于第三图像P1，

A.第二图像P11对应的第二坐标系X ₁₁O ₁₁Y ₁₁与第三坐标系X ₁O ₁Y ₁之间的转换关系为：X ₁＝X ₁₁+1920；Y ₁＝Y ₁₁+1080；

B.第二图像P12对应的第二坐标系X ₁₂O ₁₂Y ₁₂与第三坐标系X ₁O ₁Y ₁之间的转换关系为：X ₁＝X ₁₂；Y ₁＝Y ₁₂+1080；

C.第二图像P13对应的第二坐标系X ₁₃O ₁₃Y ₁₃与第三坐标系X ₁O ₁Y ₁之间的转换关系为：X＝X ₃；Y＝Y ₃；

D.第二图像P14对应的第二坐标系X ₁₄O ₁₄Y ₁₄与第三坐标系X ₁O ₁Y ₁之间的转换关系为：X ₁＝X ₁₄+1920；Y ₁＝Y ₁₄；

4)将四等分后的第二图像P11、第二图像P12、第二图像P13、第二图像P14逐一送至分辨率为1920×1080人脸检测模型做人脸检测，输出基于各自第二坐标系的人脸的第一坐标；

5)根据步骤3)的第二坐标系和第三坐标系之间的转换关系，分别把基于第二图像P11、第二图像P12、第二图像P13、第二图像P14各自的第二坐标系的人脸的第一坐标转换成对应在第三图像P1的第三坐标系X ₁O ₁Y ₁中的第三坐标；

6)对于第三图像P2、第三图像P3、第四图像P4同样采用步骤3)到步骤5)的方式得出对应的人脸在对应的第三坐标系中的第三坐标；

7)将人脸在对应的第三坐标系中的第三坐标转换为人脸在第一坐标系中的第二坐标

8)每帧图像按上述方法实现人脸检测并打框，那么就实现了分辨率为8K的摄像头连续实时视频流里的人脸检测功能。

本发明另一个实施例提出了一种实现人脸检测的装置，包括处理器和计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令被所述处理器执行时，实现上述任一种实现人脸检测的方法。

本发明另一个实施例提出了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一种实现人脸检测的方法的步骤。

参见图4，本发明另一个实施例提出了一种实现人脸检测的装置，包括：

图像拆分模块401，用于当第一图像的分辨率大于人脸检测模型的分辨率时，将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像；其中，N为大于1的整数；

人脸检测模块402，用于对于每一个所述第二图像，获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息；将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。

在一个示例性实例中，图像拆分模块401具体用于采用以下任意一个或一个以上方式实现将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像：

在一个示例性实例中，N2为N1的平方。

需要说明的是，当N2为N1的平方时，图像拆分模块401在将第一图像拆分成N2个第二图像时，可以直接拆分成N2个第二图像；也可以先将第一图像拆分成N1个第三图像，再将每一个第三图像拆分成N1个第二图像。

其中，N1个第三图像的分辨率可以相等，也可以不相等。

在本发明实施例中，人脸检测模块402采用人脸检测模型对所述第二图像进行人脸检测得到所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息。

在本发明实施例中，人脸检测模块402具体用于采用以下方式实现所述将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息：

Y＝Y ₄；

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

虽然本发明实施例所揭露的实施方式如上，但所述的内容仅为便于理解本发明实施例而采用的实施方式，并非用以限定本发明实施例。任何本发明实施例所属领域内的技术人员，在不脱离本发明实施例所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本发明实施例的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

一种实现人脸检测的方法，包括：

当第一图像的分辨率大于人脸检测模型的分辨率时，将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像；其中，N为大于1的整数；

对于每一个所述第二图像，获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息；

将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。
根据权利要求1所述的方法，其特征在于，其中，所述将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上：

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时，将所述第一图像拆分成N1个所述第二图像；其中，N1为大于1的整数；

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1，且小于或等于N2时，将所述第一图像拆分成N2个所述第二图像；N2为大于N1的整数。
根据权利要求1所述的方法，其特征在于，其中，所述将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上：

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时，将所述第一图像拆分成N1个分辨率相等的所述第二图像；

当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1，且小于或等于N2时，将所述第一图像拆分成N2个分辨率相等的所述第二图像。
根据权利要求2或3所述的方法，其特征在于，其中，所述N2为所述N1的平方。
根据权利要求2或3所述的方法，其特征在于，其中，所述N1为4，所述N2为16。
根据权利要求2所述的方法，其特征在于，其中，当所述N2为所述N1的平方时，所述将第一图像拆分成N2个所述第二图像包括：

将所述第一图像拆分成N1个第三图像；

将每一个所述第三图像拆分成N1个第一图像。
根据权利要求1所述的方法，其特征在于，其中，N个所述第二图像的分辨率相等。
根据权利要求1所述的方法，其特征在于，所述将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息包括：

根据所述第一坐标系和所述第二坐标系之间的转换关系将所述第一坐标信息转换为所述第二坐标信息。
一种实现人脸检测的装置，包括处理器和计算机可读存储介质，所述计算机可读存储介质中存储有指令，其特征在于，当所述指令被所述处理器执行时，实现如权利要求1～8任一项所述的实现人脸检测的方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1～8任一项所述的实现人脸检测的方法的步骤。