CN112464692A - 一种实现人脸检测的方法和装置 - Google Patents

一种实现人脸检测的方法和装置 Download PDF

Info

Publication number
CN112464692A
CN112464692A CN201910842231.XA CN201910842231A CN112464692A CN 112464692 A CN112464692 A CN 112464692A CN 201910842231 A CN201910842231 A CN 201910842231A CN 112464692 A CN112464692 A CN 112464692A
Authority
CN
China
Prior art keywords
image
coordinate system
resolution
face detection
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910842231.XA
Other languages
English (en)
Inventor
刘若鹏
栾琳
季春霖
杨亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Guangqi Intelligent Technology Co ltd
Original Assignee
Xi'an Guangqi Future Technology Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Guangqi Future Technology Research Institute filed Critical Xi'an Guangqi Future Technology Research Institute
Priority to CN201910842231.XA priority Critical patent/CN112464692A/zh
Priority to PCT/CN2020/101092 priority patent/WO2021042867A1/zh
Publication of CN112464692A publication Critical patent/CN112464692A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种实现人脸检测的方法和装置,包括:当第一图像的分辨率大于人脸检测模型的分辨率时,将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像;其中,N为大于1的整数;对于每一个所述第二图像,获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息;将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。

Description

一种实现人脸检测的方法和装置
技术领域
本发明实施例涉及但不限于人脸检测技术和监控领域,尤指一种实现人脸检测的方法和装置。
背景技术
安防监控行业发展经历了从模拟到数字图像,再到数字高清图像演变。市场上通用监控摄像头的分辨率各种各样,有D1、720P、1080P、600万像素、4K、8K等等。近几年随着人类检测技术、人脸识别技术的兴起,无论是在头端做边缘计算还是在后端平台部署人脸检测与识别,都必然会涉及到人脸检测模型的分辨率的适配问题。
当前主流做人脸检测与识别的厂家只支持1080P并向下兼容,但是行业对摄像头的分辨率要求越来越高,如600万像素、4K等是发展趋势。在摄像头的分辨率越来越高的同时,如果人脸检测模型的分辨率小于图像的分辨率则无法对图像进行人脸检测。
发明内容
本发明实施例提供了一种实现人脸检测的方法和装置,能够在人脸检测模型的分辨率小于图像的分辨率的情况下实现对图像的人脸检测。
本发明实施例提供了一种实现人脸检测的方法,包括:
当第一图像的分辨率大于人脸检测模型的分辨率时,将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像;其中,N为大于1的整数;
对于每一个所述第二图像,获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息;
将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。
在本发明实施例中,所述将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上:
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时,将所述第一图像拆分成N1个所述第二图像;其中,N1为大于1的整数;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1,且小于或等于N2时,将所述第一图像拆分成N2个所述第二图像;N2为大于N1的整数。
在本发明实施例中,所述将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上:
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时,将所述第一图像拆分成N1个分辨率相等的所述第二图像;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1,且小于或等于N2时,将所述第一图像拆分成N2个分辨率相等的所述第二图像。
在本发明实施例中,所述N2为所述N1的平方。
在本发明实施例中,所述N1为4,所述N2为16。
在本发明实施例中,当所述N2为所述N1的平方时,所述将第一图像拆分成N2个所述第二图像包括:
将所述第一图像拆分成N1个第三图像;
将每一个所述第三图像拆分成N1个第一图像。
在本发明实施例中,N个所述第二图像的分辨率相等。
在本发明实施例中,所述将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息包括:
根据所述第一坐标系和所述第二坐标系之间的转换关系将所述第一坐标信息转换为所述第二坐标信息。
本发明实施例提供了一种实现人脸检测的装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任一种实现人脸检测的方法。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种实现人脸检测的方法的步骤。
本发明实施例包括:当第一图像的分辨率大于人脸检测模型的分辨率时,将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像;其中,N为大于1的整数;对于每一个所述第二图像,获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息;将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。本发明实施例采用分辨率小于第一图像的人脸检测模型实现了对第一图像的人脸检测,无需更换更复杂的人脸检测模型来实现人脸检测,从而降低了软件开发难度,并且,不需要对硬件进行升级。
本发明实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例而了解。本发明实施例的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明实施例技术方案的进一步理解,并且构成说明书的一部分,与本发明实施例的实施例一起用于解释本发明实施例的技术方案,并不构成对本发明实施例技术方案的限制。
图1为本发明一个实施例提出的实现人脸检测的方法的流程图;
图2为本发明实施例中将第一图像四等分时建立的第一坐标系和第二坐标系的示意图;
图3为本发明实施例中将第一图像16等分时建立的第一坐标系和第二坐标系的示意图;
图4为本发明另一个实施例提出的实现人脸检测的装置的结构组成示意图。
具体实施方式
下文中将结合附图对本发明实施例进行详细说明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
参见图1,本发明一个实施例提出了一种实现人脸检测的方法,包括:
步骤100、当第一图像的分辨率大于人脸检测模型的分辨率时,将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像;其中,N为大于1的整数。
在本发明实施例中,人脸检测模型的分辨率是指人脸检测模型所能检测的图像的最大分辨率。
在本发明实施例中,第一图像可以是预先存储的图像,也可以是连续视频流中的图像。当第一图像为连续视频流中的图像时,第一图像映射在嵌入式系统的内存中,可以在内存中根据地址将第一图像拆分成N个第二图像。
在本发明实施例中,N个第二图像的分辨率可以相等,也可以不相等。
在一个示例性实例中,将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上:
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时,将所述第一图像拆分成N1个所述第二图像;其中,N1为大于1的整数;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1,且小于或等于N2时,将所述第一图像拆分成N2个所述第二图像;其中,N2为大于N1的整数;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时,将所述第一图像拆分成N1个分辨率相等的所述第二图像;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1,且小于或等于N2时,将所述第一图像拆分成N2个分辨率相等的所述第二图像。
在一个示例性实例中,N2为N1的平方。
在一个示例性实例中,N1为4,所述N2为16。当然,N1和N2的取值不仅仅局限于4和16,其他的取值均在本发明实施例的保护范围内。
需要说明的是,当N2为N1的平方时,在将第一图像拆分成N2个第二图像时,可以直接拆分成N2个第二图像;也可以先将第一图像拆分成N1个第三图像,再将每一个第三图像拆分成N1个第二图像。
其中,N1个第三图像的分辨率可以相等,也可以不相等。
本发明实施例对第一图像的拆分方式不仅仅局限于上述所列出的方式,具体的拆分方式不用于限定本发明实施例的保护范围。
步骤101、对于每一个所述第二图像,获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息;将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。
在本发明实施例中,采用人脸检测模型对所述第二图像进行人脸检测得到所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息。
在本发明实施例中,人脸在所述第二图像对应的第二坐标系中的第一坐标信息是指人脸所在的矩形框在所述第二图像对应的第二坐标系中的第一坐标信息,人脸在所述第一图像对应的第一坐标系中的第二坐标信息同样是指人脸所在的矩形框在所述第一图像对应的第一坐标系中的第二坐标信息。
在本发明实施例中,将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息包括:
根据所述第一坐标系和所述第二坐标系之间的转换关系将所述第一坐标信息转换为所述第二坐标信息。
在一个示例性实例中,第一坐标系和第二坐标系之间的转换关系可以根据第一坐标系和第二坐标系之间的平移关系,以及第一坐标系和第二坐标系之间的旋转关系来确定。
平移关系可以根据第一坐标系的坐标原点和第二坐标系的坐标原点来确定,旋转关系可以根据第一坐标系的x轴和第二坐标系的x轴的方向、以及第一坐标系的y轴和第二坐标系的y轴的方向来确定。
例如,如图2所示,当将第一图像拆分成4个分辨率相等的第二图像,即将第一图像P拆分成第二图像P1、第二图像P2、第二图像P3和第二图像P4时,假设,第一坐标系为XOY,第二图像P1对应的第二坐标系为X1O1Y1,第二图像P2对应的第二坐标系为X2O2Y2,第二图像P3对应的第二坐标系为X3O3Y3,第二图像P4对应的第二坐标系为X4O4Y4
假设,第一图像的分辨率为(n×a)×(n×c),人脸检测模型的分辨率为a×c,那么,第二图像的分辨率为
Figure BDA0002194084720000061
其中,第一坐标系的坐标原点为第一图像P的左下角,x轴方向平行于第一图像P的第一方向,y轴方向平行于第一图像P的第二方向;
第二图像P1对应的第二坐标系的坐标原点为第二图像P1的左下角,x轴方向平行于第二图像P1的第一方向,y轴方向平行于第二图像P1的第二方向;
第二图像P2对应的第二坐标系的坐标原点为第二图像P2的左下角,x轴方向平行于第二图像P2的第一方向,y轴方向平行于第二图像P2的第二方向;
第二图像P3对应的第二坐标系的坐标原点为第二图像P3的左下角,x轴方向平行于第二图像P3的第一方向,y轴方向平行于第二图像P3的第二方向;
第二图像P4对应的第二坐标系的坐标原点为第二图像P4的左下角,x轴方向平行于第二图像P4的第一方向,y轴方向平行于第二图像P4的第二方向。
那么,由于第一坐标系和第二坐标系的x轴方向为平行关系,第一坐标系和第二坐标系的y轴方向也为平行关系,因此,第一坐标系和第二坐标系之间的转换关系仅与第一坐标系和第二坐标系之间的平移关系有关。从图2可以看出,第一坐标系和第二图像P1对应的第二坐标系的转换关系为:
Figure BDA0002194084720000071
第一坐标系和第二图像P2对应的第二坐标系的转换关系为:X=X2
Figure BDA0002194084720000072
第一坐标系和第二图像P3对应的第二坐标系的转换关系为:X=X3,Y=Y3;第一坐标系和第二图像P4对应的第二坐标系的转换关系为:
Figure BDA0002194084720000073
Y=Y4
其中,(X,Y)为第二图像P1或第二图像P2或第二图像P3或第二图像P4上某一点在第一图像P对应的第一坐标系中的坐标,(X1,Y1)为第二图像P1上某一点在第二图像P1对应的第二坐标系中的坐标,(X2,Y2)为第二图像P2上某一点在第二图像P2对应的第二坐标系中的坐标,(X3,Y3)为第二图像P3上某一点在第二图像P3对应的第二坐标系中的坐标,(X4,Y4)为第二图像P4上某一点在第二图像P4对应的第二坐标系中的坐标。
又如,如图3所示,当将第一图像拆分成16个分辨率相等的第二图像,即将第一图像P拆分成第二图像P11、第二图像P12、第二图像P13、第二图像P14、第二图像P21、第二图像P22、第二图像P23、第二图像P24、第二图像P31、第二图像P32、第二图像P33、第二图像P34、第二图像P41、第二图像P42、第二图像P43、第二图像P44、时,假设,第一坐标系为XOY,第二图像P11对应的第二坐标系为X11O11Y11,第二图像P12对应的第二坐标系为X12O12Y12,第二图像P13对应的第二坐标系为X13O13Y13,第二图像P14对应的第二坐标系为X14O14Y14;第二图像P21对应的第二坐标系为X21O21Y21,第二图像P22对应的第二坐标系为X22O22Y22,第二图像P23对应的第二坐标系为X23O23Y23,第二图像P24对应的第二坐标系为X24O24Y24;第二图像P31对应的第二坐标系为X31O31Y31,第二图像P32对应的第二坐标系为X32O32Y32,第二图像P33对应的第二坐标系为X33O33Y33,第二图像P34对应的第二坐标系为X34O34Y34;第二图像P41对应的第二坐标系为X41O41Y41,第二图像P42对应的第二坐标系为X42O42Y42,第二图像P43对应的第二坐标系为X43O43Y43,第二图像P44对应的第二坐标系为X44O44Y44
假设,第一图像的分辨率为(n×a)×(n×c),人脸检测模型的分辨率为a×c,那么,第二图像的分辨率为
Figure BDA0002194084720000081
其中,第一坐标系的坐标原点为第一图像P的左下角,x轴方向平行于第一图像P的第一方向,y轴方向平行于第一图像P的第二方向;
第二图像P11对应的第二坐标系的坐标原点为第二图像P11的左下角,x轴方向平行于第二图像P11的第一方向,y轴方向平行于第二图像P11的第二方向;
第二图像P12对应的第二坐标系的坐标原点为第二图像P12的左下角,x轴方向平行于第二图像P12的第一方向,y轴方向平行于第二图像P12的第二方向;
第二图像P13对应的第二坐标系的坐标原点为第二图像P13的左下角,x轴方向平行于第二图像P13的第一方向,y轴方向平行于第二图像P3的第二方向;
第二图像P14对应的第二坐标系的坐标原点为第二图像P14的左下角,x轴方向平行于第二图像P14的第一方向,y轴方向平行于第二图像P14的第二方向;
以此类推,第二图像(P21、P22、P23、P24、P31、P32、P33、P34、P41、P42、P43、P44)分别对应的第二坐标系的坐标原点、x轴方向和y轴方向采用相同的方式确定。
那么,由于第一坐标系和第二坐标系的x轴方向为平行关系,第一坐标系和第二坐标系的y轴方向也为平行关系,因此,第一坐标系和第二坐标系之间的转换关系仅与第一坐标系和第二坐标系之间的平移关系有关。从图3可以看出,
第一坐标系和第二图像P11对应的第二坐标系的转换关系为:
Figure BDA0002194084720000091
第一坐标系和第二图像P12对应的第二坐标系的转换关系为:
Figure BDA0002194084720000092
第一坐标系和第二图像P13对应的第二坐标系的转换关系为:
Figure BDA0002194084720000093
第一坐标系和第二图像P14对应的第二坐标系的转换关系为:
Figure BDA0002194084720000094
第一坐标系和第二图像P21对应的第二坐标系的转换关系为:
Figure BDA0002194084720000095
第一坐标系和第二图像P22对应的第二坐标系的转换关系为:X=X2
Figure BDA0002194084720000096
第一坐标系和第二图像P23对应的第二坐标系的转换关系为:X=X3
Figure BDA0002194084720000097
第一坐标系和第二图像P24对应的第二坐标系的转换关系为:
Figure BDA0002194084720000098
第一坐标系和第二图像P31对应的第二坐标系的转换关系为:
Figure BDA0002194084720000099
第一坐标系和第二图像P32对应的第二坐标系的转换关系为:
Figure BDA00021940847200000910
第一坐标系和第二图像P33对应的第二坐标系的转换关系为:
Figure BDA00021940847200000911
Y=Y3;第一坐标系和第二图像P34对应的第二坐标系的转换关系为:
Figure BDA00021940847200000912
Y=Y4
第一坐标系和第二图像P41对应的第二坐标系的转换关系为:
Figure BDA00021940847200000913
第一坐标系和第二图像P42对应的第二坐标系的转换关系为:X=X2
Figure BDA00021940847200000914
第一坐标系和第二图像P43对应的第二坐标系的转换关系为:X=X3,Y=Y3;第一坐标系和第二图像P44对应的第二坐标系的转换关系为:
Figure BDA00021940847200000915
Y=Y4
其中,(X,Y)为第二图像P1或第二图像P2或第二图像P3或第二图像P4上某一点在第一图像P对应的第一坐标系中的坐标,(X11,Y11)为第二图像P1上某一点在第二图像P1对应的第二坐标系中的坐标,(X12,Y12)为第二图像P2上某一点在第二图像P2对应的第二坐标系中的坐标,(X13,Y13)为第二图像P3上某一点在第二图像P3对应的第二坐标系中的坐标,(X14,Y14)为第二图像P4上某一点在第二图像P4对应的第二坐标系中的坐标。
当然,第一坐标系和第二坐标系之间的转换关系不仅仅局限于这种转换关系,第一坐标系和第二坐标系之间的转换关系取决于第一坐标系和第二坐标系的建立方式,具体的转换关系不用于限定本发明实施例的保护范围。
本发明实施例采用所能检测的图像的最大分辨率小于第一图像的人脸检测模型实现了对第一图像的人脸检测,无需更换更复杂的人脸检测模型来实现人脸检测,从而降低了软件开发难度,并且,不需要对硬件进行升级。
实施例一
假设监控摄像机头端为4K像素的摄像机且头端的硬件支持人工智能(AI,Artificial Intelligence)计算,已有的人脸检测模型中需要输入分辨率小于或等于1080P(即1920×1080)的图像,那么要实现分辨率为4K(即3840×2160)视频流的第一图像的人脸检测,可以采用以下方式实现:
1)由于n=2,因此,将第一图像四等分成第二图像P1、第二图像P2、第二图像P3、第二图像P4;
2)如图2所示,为第一图像建立第一坐标系,分别为第二图像P1、第二图像P2、第二图像P3、第二图像P4建立对应的第二坐标系;
3)令a=1920,c=1080;n=2;那么,
A.第二图像P1对应的第二坐标系X1O1Y1与第一坐标系XOY之间的转换关系为:X=X1+1920;Y=Y1+1080;
B.第二图像P2对应的第二坐标系X2O2Y2与第一坐标系XOY之间的转换关系为:X=X2;Y=Y2+1080;
C.第二图像P3对应的第二坐标系X3O3Y3与第一坐标系XOY之间的转换关系为:X=X3;Y=Y3
D.第二图像P4对应的第二坐标系X4O4Y4与第一坐标系XOY之间的转换关系为:X=X4+1920;Y=Y4
4)将四等分后的第二图像P1、第二图像P2、第二图像P3、第二图像P4逐一送至分辨率为1920×1080人脸检测模型做人脸检测,输出基于各自第二坐标系的人脸的第一坐标。
5)根据步骤3)的第一坐标系和第二坐标系之间的转换关系,分别把基于第二图像P1、第二图像P2、第二图像P3、第二图像P4各自的第二坐标系的人脸的第一坐标转换成对应在第一图像P的第一坐标系XOY中的第二坐标。
6)每帧图像按上述方法实现人脸检测并打框,那么就实现了分辨率为4K的摄像头连续实时视频流里的人脸检测功能。
实施例二
假设监控摄像机头端为500万像素(3072×1728)摄像机且头端硬件支持AI计算,已有的人脸检测模型中需要输入分辨率小于或等于1080P(即1920×1080)的图像,那么要实现分辨率为500万像素的视频流的人脸检测,可以采用以下方式实现:
1)由于n=1.6,因此,将第一图像四等分成第二图像P1、第二图像P2、第二图像P3、第二图像P4;
2)如图2所示,为第一图像建立第一坐标系,分别为第二图像P1、第二图像P2、第二图像P3、第二图像P4建立对应的第二坐标系;
3)令a=1920,c=1080;n=1.6;那么,
A.第二图像P1对应的第二坐标系X1O1Y1与第一坐标系XOY之间的转换关系为:X=X1+1920;Y=Y1+1080;
B.第二图像P2对应的第二坐标系X2O2Y2与第一坐标系XOY之间的转换关系为:X=X2;Y=Y2+1080;
C.第二图像P3对应的第二坐标系X3O3Y3与第一坐标系XOY之间的转换关系为:X=X3;Y=Y3
D.第二图像P4对应的第二坐标系X4O4Y4与第一坐标系XOY之间的转换关系为:X=X4+1920;Y=Y4
4)将四等分后的第二图像P1、第二图像P2、第二图像P3、第二图像P4逐一送至分辨率为1920×1080人脸检测模型做人脸检测,输出基于各自第二坐标系的人脸的第一坐标。
5)根据步骤3)的第一坐标系和第二坐标系之间的转换关系,分别把基于第二图像P1、第二图像P2、第二图像P3、第二图像P4各自的第二坐标系的人脸的第一坐标转换成对应在第一图像P的第一坐标系XOY中的第二坐标。
6)每帧图像按上述方法实现人脸检测并打框,那么就实现了分辨率为500万像素的摄像头连续实时视频流里的人脸检测功能。
实施例三
假设监控摄像机头端为8K像素(7680×4320)摄像机且头端硬件支持AI计算,已有的人脸检测模型中需要输入分辨率小于或等于1080P(即1920×1080)的图像,那么要实现分辨率为8K像素的视频流的人脸检测可以采用以下方式实现:
1),由于n>2,将第一图像四等分成第三图像P1、第三图像P2、第三图像P3、第三图像P4后单幅第三图像的分辨率仍然大于1920×1080,因此,应当采用更多等分的方法,本例采用16等分,即将第三图像P1四等分成第二图像P11、第二图像P12、第二图像P13、第二图像P14,将第三图像P2四等分成第二图像P21、第二图像P22、第二图像P23、第二图像P24,将第三图像P3四等分成第二图像P31、第二图像P32、第二图像P33、第二图像P34,将第三图像P4四等分成第二图像P41、第二图像P42、第二图像P43、第二图像P44后单幅第二图像的分辨率为1920×1080,符合小于人脸检测模型的分辨率的要求;
2)如图3所示,为第一图像建立第一坐标系XOY,为第三图像P1建立第三坐标系X1O1Y1,为第三图像P2建立第三坐标系X2O2Y2,为第三图像P3建立第三坐标系X3O3Y3,为第三图像P4建立第三坐标系X4O4Y4,为第二图像P11建立第二坐标系X11O11Y11,为第二图像P12建立第二坐标系X12O12Y12,为第二图像P13建立第二坐标系X13O13Y13,为第二图像P14建立第二坐标系X14O14Y14,为第二图像P21建立第二坐标系X21O21Y21,为第二图像P22建立第二坐标系X22O22Y22,为第二图像P23建立第二坐标系X23O23Y23,为第二图像P24建立第二坐标系X24O24Y24,为第二图像P31建立第二坐标系X31O31Y31,为第二图像P32建立第二坐标系X32O32Y32,为第二图像P33建立第二坐标系X33O33Y33,为第二图像P34建立第二坐标系X34O34Y34,为第二图像P41建立第二坐标系X41O41Y41,为第二图像P42建立第二坐标系X42O42Y42,为第二图像P43建立第二坐标系X43O43Y43,为第二图像P44建立第二坐标系X44O44Y44
3)令a=1920,c=1080;n=2;那么,对于第三图像P1,
A.第二图像P11对应的第二坐标系X11O11Y11与第三坐标系X1O1Y1之间的转换关系为:X1=X11+1920;Y1=Y11+1080;
B.第二图像P12对应的第二坐标系X12O12Y12与第三坐标系X1O1Y1之间的转换关系为:X1=X12;Y1=Y12+1080;
C.第二图像P13对应的第二坐标系X13O13Y13与第三坐标系X1O1Y1之间的转换关系为:X=X3;Y=Y3
D.第二图像P14对应的第二坐标系X14O14Y14与第三坐标系X1O1Y1之间的转换关系为:X1=X14+1920;Y1=Y14
4)将四等分后的第二图像P11、第二图像P12、第二图像P13、第二图像P14逐一送至分辨率为1920×1080人脸检测模型做人脸检测,输出基于各自第二坐标系的人脸的第一坐标;
5)根据步骤3)的第二坐标系和第三坐标系之间的转换关系,分别把基于第二图像P11、第二图像P12、第二图像P13、第二图像P14各自的第二坐标系的人脸的第一坐标转换成对应在第三图像P1的第三坐标系X1O1Y1中的第三坐标;
6)对于第三图像P2、第三图像P3、第四图像P4同样采用步骤3)到步骤5)的方式得出对应的人脸在对应的第三坐标系中的第三坐标;
7)将人脸在对应的第三坐标系中的第三坐标转换为人脸在第一坐标系中的第二坐标
8)每帧图像按上述方法实现人脸检测并打框,那么就实现了分辨率为8K的摄像头连续实时视频流里的人脸检测功能。
本发明另一个实施例提出了一种实现人脸检测的装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任一种实现人脸检测的方法。
本发明另一个实施例提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种实现人脸检测的方法的步骤。
参见图4,本发明另一个实施例提出了一种实现人脸检测的装置,包括:
图像拆分模块401,用于当第一图像的分辨率大于人脸检测模型的分辨率时,将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像;其中,N为大于1的整数;
人脸检测模块402,用于对于每一个所述第二图像,获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息;将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。
在本发明实施例中,人脸检测模型的分辨率是指人脸检测模型所能检测的图像的最大分辨率。
在本发明实施例中,第一图像可以是预先存储的图像,也可以是连续视频流中的图像。当第一图像为连续视频流中的图像时,第一图像映射在嵌入式系统的内存中,可以在内存中根据地址将第一图像拆分成N个第二图像。
在本发明实施例中,N个第二图像的分辨率可以相等,也可以不相等。
在一个示例性实例中,图像拆分模块401具体用于采用以下任意一个或一个以上方式实现将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像:
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时,将所述第一图像拆分成N1个所述第二图像;其中,N1为大于1的整数;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1,且小于或等于N2时,将所述第一图像拆分成N2个所述第二图像;其中,N2为大于N1的整数;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时,将所述第一图像拆分成N1个分辨率相等的所述第二图像;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1,且小于或等于N2时,将所述第一图像拆分成N2个分辨率相等的所述第二图像。
在一个示例性实例中,N2为N1的平方。
在一个示例性实例中,N1为4,所述N2为16。当然,N1和N2的取值不仅仅局限于4和16,其他的取值均在本发明实施例的保护范围内。
需要说明的是,当N2为N1的平方时,图像拆分模块401在将第一图像拆分成N2个第二图像时,可以直接拆分成N2个第二图像;也可以先将第一图像拆分成N1个第三图像,再将每一个第三图像拆分成N1个第二图像。
其中,N1个第三图像的分辨率可以相等,也可以不相等。
本发明实施例对第一图像的拆分方式不仅仅局限于上述所列出的方式,具体的拆分方式不用于限定本发明实施例的保护范围。
在本发明实施例中,人脸检测模块402采用人脸检测模型对所述第二图像进行人脸检测得到所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息。
在本发明实施例中,人脸在所述第二图像对应的第二坐标系中的第一坐标信息是指人脸所在的矩形框在所述第二图像对应的第二坐标系中的第一坐标信息,人脸在所述第一图像对应的第一坐标系中的第二坐标信息同样是指人脸所在的矩形框在所述第一图像对应的第一坐标系中的第二坐标信息。
在本发明实施例中,人脸检测模块402具体用于采用以下方式实现所述将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息:
根据所述第一坐标系和所述第二坐标系之间的转换关系将所述第一坐标信息转换为所述第二坐标信息。
在一个示例性实例中,第一坐标系和第二坐标系之间的转换关系可以根据第一坐标系和第二坐标系之间的平移关系,以及第一坐标系和第二坐标系之间的旋转关系来确定。
平移关系可以根据第一坐标系的坐标原点和第二坐标系的坐标原点来确定,旋转关系可以根据第一坐标系的x轴和第二坐标系的x轴的方向、以及第一坐标系的y轴和第二坐标系的y轴的方向来确定。
例如,如图2所示,当将第一图像拆分成4个分辨率相等的第二图像,即将第一图像P拆分成第二图像P1、第二图像P2、第二图像P3和第二图像P4时,假设,第一坐标系为XOY,第二图像P1对应的第二坐标系为X1O1Y1,第二图像P2对应的第二坐标系为X2O2Y2,第二图像P3对应的第二坐标系为X3O3Y3,第二图像P4对应的第二坐标系为X4O4Y4
假设,第一图像的分辨率为(n×a)×(n×c),人脸检测模型的分辨率为a×c,那么,第二图像的分辨率为
Figure BDA0002194084720000161
其中,第一坐标系的坐标原点为第一图像P的左下角,x轴方向平行于第一图像P的第一方向,y轴方向平行于第一图像P的第二方向;
第二图像P1对应的第二坐标系的坐标原点为第二图像P1的左下角,x轴方向平行于第二图像P1的第一方向,y轴方向平行于第二图像P1的第二方向;
第二图像P2对应的第二坐标系的坐标原点为第二图像P2的左下角,x轴方向平行于第二图像P2的第一方向,y轴方向平行于第二图像P2的第二方向;
第二图像P3对应的第二坐标系的坐标原点为第二图像P3的左下角,x轴方向平行于第二图像P3的第一方向,y轴方向平行于第二图像P3的第二方向;
第二图像P4对应的第二坐标系的坐标原点为第二图像P4的左下角,x轴方向平行于第二图像P4的第一方向,y轴方向平行于第二图像P4的第二方向。
那么,由于第一坐标系和第二坐标系的x轴方向为平行关系,第一坐标系和第二坐标系的y轴方向也为平行关系,因此,第一坐标系和第二坐标系之间的转换关系仅与第一坐标系和第二坐标系之间的平移关系有关。从图2可以看出,第一坐标系和第二图像P1对应的第二坐标系的转换关系为:
Figure BDA0002194084720000171
第一坐标系和第二图像P2对应的第二坐标系的转换关系为:X=X2
Figure BDA0002194084720000172
第一坐标系和第二图像P3对应的第二坐标系的转换关系为:X=X3,Y=Y3;第一坐标系和第二图像P4对应的第二坐标系的转换关系为:
Figure BDA0002194084720000173
Y=Y4
其中,(X,Y)为第二图像P1或第二图像P2或第二图像P3或第二图像P4上某一点在第一图像P对应的第一坐标系中的坐标,(X1,Y1)为第二图像P1上某一点在第二图像P1对应的第二坐标系中的坐标,(X2,Y2)为第二图像P2上某一点在第二图像P2对应的第二坐标系中的坐标,(X3,Y3)为第二图像P3上某一点在第二图像P3对应的第二坐标系中的坐标,(X4,Y4)为第二图像P4上某一点在第二图像P4对应的第二坐标系中的坐标。
当然,第一坐标系和第二坐标系之间的转换关系不仅仅局限于这种转换关系,第一坐标系和第二坐标系之间的转换关系取决于第一坐标系和第二坐标系的建立方式,具体的转换关系不用于限定本发明实施例的保护范围。
本发明实施例采用所能检测的图像的最大分辨率小于第一图像的人脸检测模型实现了对第一图像的人脸检测,无需更换更复杂的人脸检测模型来实现人脸检测,从而降低了软件开发难度,并且,不需要对硬件进行升级。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
虽然本发明实施例所揭露的实施方式如上,但所述的内容仅为便于理解本发明实施例而采用的实施方式,并非用以限定本发明实施例。任何本发明实施例所属领域内的技术人员,在不脱离本发明实施例所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明实施例的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种实现人脸检测的方法,包括:
当第一图像的分辨率大于人脸检测模型的分辨率时,将所述第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像;其中,N为大于1的整数;
对于每一个所述第二图像,获得所述第二图像中的人脸在所述第二图像对应的第二坐标系中的第一坐标信息;
将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息。
2.根据权利要求1所述的方法,其特征在于,其中,所述将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上:
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时,将所述第一图像拆分成N1个所述第二图像;其中,N1为大于1的整数;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1,且小于或等于N2时,将所述第一图像拆分成N2个所述第二图像;N2为大于N1的整数。
3.根据权利要求1所述的方法,其特征在于,其中,所述将第一图像拆分成N个分辨率小于或等于所述人脸检测模型的分辨率的第二图像包括以下任意一个或一个以上:
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值小于或等于N1时,将所述第一图像拆分成N1个分辨率相等的所述第二图像;
当所述第一图像的分辨率和所述人脸检测模型的分辨率的比值大于或等于N1,且小于或等于N2时,将所述第一图像拆分成N2个分辨率相等的所述第二图像。
4.根据权利要求2或3所述的方法,其特征在于,其中,所述N2为所述N1的平方。
5.根据权利要求2或3所述的方法,其特征在于,其中,所述N1为4,所述N2为16。
6.根据权利要求2所述的方法,其特征在于,其中,当所述N2为所述N1的平方时,所述将第一图像拆分成N2个所述第二图像包括:
将所述第一图像拆分成N1个第三图像;
将每一个所述第三图像拆分成N1个第一图像。
7.根据权利要求1所述的方法,其特征在于,其中,N个所述第二图像的分辨率相等。
8.根据权利要求1所述的方法,其特征在于,所述将得到的第一坐标信息转换为所述第二图像中的人脸在所述第一图像对应的第一坐标系中的第二坐标信息包括:
根据所述第一坐标系和所述第二坐标系之间的转换关系将所述第一坐标信息转换为所述第二坐标信息。
9.一种实现人脸检测的装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现如权利要求1~8任一项所述的实现人脸检测的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~8任一项所述的实现人脸检测的方法的步骤。
CN201910842231.XA 2019-09-06 2019-09-06 一种实现人脸检测的方法和装置 Pending CN112464692A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910842231.XA CN112464692A (zh) 2019-09-06 2019-09-06 一种实现人脸检测的方法和装置
PCT/CN2020/101092 WO2021042867A1 (zh) 2019-09-06 2020-07-09 一种实现人脸检测的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910842231.XA CN112464692A (zh) 2019-09-06 2019-09-06 一种实现人脸检测的方法和装置

Publications (1)

Publication Number Publication Date
CN112464692A true CN112464692A (zh) 2021-03-09

Family

ID=74807115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910842231.XA Pending CN112464692A (zh) 2019-09-06 2019-09-06 一种实现人脸检测的方法和装置

Country Status (2)

Country Link
CN (1) CN112464692A (zh)
WO (1) WO2021042867A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101648208B1 (ko) * 2015-09-08 2016-08-12 김동기 고해상도 영상을 이용한 객체 인식 및 추적 방법 및 장치
CN110033475B (zh) * 2019-03-29 2020-12-15 北京航空航天大学 一种高分辨率纹理生成的航拍图运动物体检测与消除方法
CN109858472B (zh) * 2019-04-09 2023-08-04 武汉领普科技有限公司 一种嵌入式实时人形检测方法和装置
CN110866476B (zh) * 2019-11-06 2023-09-01 南京信息职业技术学院 一种基于自动标注和迁移学习的密集堆垛目标检测方法

Also Published As

Publication number Publication date
WO2021042867A1 (zh) 2021-03-11

Similar Documents

Publication Publication Date Title
US10861133B1 (en) Super-resolution video reconstruction method, device, apparatus and computer-readable storage medium
WO2021179820A1 (zh) 图像处理方法、装置、存储介质及电子设备
US11663691B2 (en) Method and apparatus for restoring image
US20220222776A1 (en) Multi-Stage Multi-Reference Bootstrapping for Video Super-Resolution
CN110008806B (zh) 信息处理装置、学习处理方法、学习装置及物体识别装置
EP2950298A1 (en) Display signal input device, display signal input method, and display system
JP2015060012A (ja) 画像処理システム、画像処理装置、画像処理方法および画像処理プログラム、ならびに、表示システム
CN105611213A (zh) 一种图像处理方法、播放方法及相关的装置和系统
CN109643528B (zh) 信息处理装置、信息处理方法和程序
CN106339194B (zh) 一种用于多设备之间的显示效果的动态调整方法及系统
CN102236790B (zh) 一种图像处理方法和设备
WO2019179342A1 (zh) 图像处理方法、图像处理装置、图像处理系统及介质
US8160394B2 (en) Real-time capture and transformation of hemispherical video images to images in rectilinear coordinates
WO2023024421A1 (zh) 多路图像拼接方法、系统、可读存储介质、及无人车
JP2022002376A (ja) 画像処理装置、画像処理方法およびプログラム
CN114723615A (zh) 结合灰度图像与彩色图像以在车中创建高分辨率覆盖图像
JP2010182305A (ja) 画像処理方法、画像処理装置およびコンピューター読み取り可能な媒体
CN116760937B (zh) 一种基于多机位的视频拼接方法、装置、设备及存储介质
KR20210127591A (ko) 이미지 처리 장치 및 그 방법
CN112464692A (zh) 一种实现人脸检测的方法和装置
CN108271009A (zh) 超高亮度和超高分辨率投影的装置及其投影方法
US20210304352A1 (en) Multi-view consistency regularization for semantic interpretation of equal-rectangular panoramas
US11758101B2 (en) Restoration of the FOV of images for stereoscopic rendering
EP2438572A1 (en) Generating images with different fields of view
CN112507903A (zh) 假脸检测方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221209

Address after: 710000 second floor, building B3, yunhuigu, No. 156, Tiangu 8th Road, software new town, high tech Zone, Xi'an, Shaanxi

Applicant after: Xi'an Guangqi Intelligent Technology Co.,Ltd.

Address before: Second floor, B3, yunhuigu, 156 Tiangu 8th Road, software new town, Xi'an City, Shaanxi Province 710000

Applicant before: Xi'an Guangqi Future Technology Research Institute

TA01 Transfer of patent application right