CN106803284B

CN106803284B - 构建脸部的三维图像的方法及装置

Info

Publication number: CN106803284B
Application number: CN201710020345.7A
Authority: CN
Inventors: 范浩强
Original assignee: Beijing Kuangshi Technology Co Ltd; Beijing Megvii Technology Co Ltd
Current assignee: Beijing Kuangshi Technology Co Ltd; Beijing Megvii Technology Co Ltd
Priority date: 2017-01-11
Filing date: 2017-01-11
Publication date: 2021-03-23
Anticipated expiration: 2037-01-11
Also published as: CN106803284A

Abstract

本发明实施例提供了一种构建脸部的三维图像的方法，包括：检测人脸图像中的人脸区域，其中所述人脸图像是由图像采集装置所获取的；确定所述人脸区域中的第一区域；将所述第一区域映射到投影仪的对应的第二区域；将所述投影仪在所述第二区域发出的结构光的亮度降低至亮度阈值以下；根据所述投影仪发出的结构光，构建所述人脸区域中除所述第一区域之外的其他区域的三维图像。可见，本发明实施例中，能够避免或减少投影仪的第二区域发出可见光，该第二区域与人脸区域中的两眼所在的区域对应，因而可以避免在人脸三维扫描过程中投影仪发出的可见光对人眼造成伤害。

Description

构建脸部的三维图像的方法及装置

技术领域

本发明涉及图像识别领域，更具体地涉及一种构建脸部的三维图像的方法及装置。

背景技术

三维扫描是集光、机、电和计算机技术于一体的高新技术，主要用于对物体空间外形和结构及色彩进行扫描，以获得物体表面的空间坐标。它的重要意义在于能够将实物的立体信息转换为计算机能直接处理的数字信号，为实物数字化提供了相当方便快捷的手段。

结构光方法因其非接触、使用方便，且具有可靠性高、速度快、精度高等优点，在进行三维人脸扫描时是一种常见的方法。将可见光作为结构光方法的光源，不仅使用方便，并且在扫描的精度上会有显著的优势。然而，在现有方案中，使用可见光进行人脸扫描时会给被测用户带来不适感，用户体验较差，同时存在人眼安全方面的隐患。

发明内容

考虑到上述问题而提出了本发明。本发明提供了一种构建脸部的三维图像的方法，通过该方法，投影仪发出的结构光可以避开人眼区域，从而保证了对人眼的安全性。

根据本发明的第一方面，提供了一种构建脸部的三维图像的方法，包括：

检测人脸图像中的人脸区域，其中所述人脸图像是由图像采集装置所获取的；

确定所述人脸区域中的第一区域；

将所述第一区域映射到投影仪的对应的第二区域；

将所述投影仪在所述第二区域发出的结构光的亮度降低至亮度阈值以下；

根据所述投影仪发出的结构光，构建所述人脸区域中除所述第一区域之外的其他区域的三维图像。

示例性地，所述确定所述人脸区域中的第一区域，包括：寻找所述人脸区域中的人眼区域，并将所述人眼区域确定为所述第一区域。

示例性地，在所述确定所述人脸区域中的第一区域之前，还包括：

确定所述人脸区域的大小大于或等于大小阈值。

示例性地，所述确定人脸区域中的第一区域，包括：

根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，确定所述第一区域在下一帧中的位置。

示例性地，所述根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，确定所述第一区域在下一帧中的位置，包括：

根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，确定所述第一区域从前一帧至当前帧的平移和旋转；

根据所述第一区域从前一帧至当前帧的平移和旋转，确定所述第一区域从当前帧到下一帧的平移和旋转；

根据所述第一区域从当前帧到下一帧的平移和旋转以及所述第一区域在当前帧中的位置，确定所述第一区域在下一帧的位置。

示例性地，所述将所述第一区域映射到投影仪的对应的第二区域，包括：

确定所述第一区域在所述图像采集装置的第一坐标系中的二维坐标；

将所述第一区域在所述第一坐标系中的二维坐标映射到三维空间，得到所述第一区域的三维坐标；

将所述第一区域在三维空间中的三维坐标映射到所述投影仪的第二坐标系，得到所述第一区域在所述第二坐标系中的二维坐标；

根据所述第一区域在所述第二坐标系中的二维坐标，确定所述第二区域。

示例性地，所述方法还包括：

根据红外投影仪发出的红外光，构建所述第一区域的三维图像；

其中，所述人脸区域中除所述第一区域之外的其他区域的三维图像与所述第一区域的三维图像一起构成所述人脸区域的三维图像。

示例性地，所述方法还包括：

根据所述人脸区域中除所述第一区域之外的其他区域的三维图像，采用预先训练好的神经网络，构建所述第一区域的三维图像；

示例性地，所述投影仪发出的结构光为可见光。

根据本发明的第二方面，提供了一种构建脸部的三维图像的装置，包括：

检测模块，用于检测人脸图像中的人脸区域，其中所述人脸图像是由图像采集装置所获取的；

确定模块，用于确定所述检测模块检测到的所述人脸区域中的第一区域；

映射模块，用于将所述确定模块确定的所述第一区域映射到投影仪的对应的第二区域；

调节模块，用于将所述投影仪在所述第二区域发出的结构光的亮度降低至亮度阈值以下；

构建模块，用于根据所述投影仪发出的结构光，构建所述人脸区域中除所述第一区域之外的其他区域的三维图像。

示例性地，所述确定模块，具体用于：寻找所述人脸区域中的人眼区域，并将所述人眼区域确定为所述第一区域。

示例性地，所述确定模块，还用于：确定所述人脸区域的大小大于或等于大小阈值。

示例性地，所述确定模块，具体用于：根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，确定所述第一区域在下一帧中的位置。

示例性地，所述确定模块，具体用于：

示例性地，所述映射模块，具体用于：

示例性地，所述构建模块，还用于：根据红外投影仪发出的红外光，构建所述第一区域的三维图像；

示例性地，所述构建模块，还用于：根据所述人脸区域中除所述第一区域之外的其他区域的三维图像，采用预先训练好的神经网络，构建所述第一区域的三维图像；

示例性地，所述投影仪发出的结构光为可见光。

第二方面所述的该装置能够用于实现前述第一方面的构建脸部的三维图像的方法。

根据本发明的第三方面，提供了一种计算机芯片，该计算机芯片包括处理器和存储器。所述存储器存储有指令代码，所述处理器用于执行所述指令代码，且当所述处理器执行指令代码时，能够实现前述第一方面所述的构建脸部的三维图像的方法。

可见，本发明实施例中，能够避免或减少投影仪的第二区域发出可见光，该第二区域与人脸区域中的两眼所在的区域对应，因而可以避免在人脸三维扫描过程中投影仪发出的可见光对人眼造成伤害。

附图说明

通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1是本发明实施例的电子设备的一个示意性框图；

图2是本发明实施例的构建脸部的三维图像的方法的一个示意性流程图；

图3是本发明实施例的构建脸部的三维图像的装置的一个示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。

本发明实施例可以应用于电子设备，图1所示为本发明实施例的电子设备的一个示意性框图。图1所示的电子设备10包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108、图像传感器110以及一个或多个非图像传感器114，这些组件通过总线系统112和/或其它形式互连。应当注意，图1所示的电子设备10的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以包括CPU 1021和GPU 1022或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，例如现场可编程门阵列(Field－Programmable GateArray，FPGA)或进阶精简指令集机器(Advanced RISC(Reduced Instruction SetComputer)Machine，ARM)等，并且处理器102可以控制所述电子设备10中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器1041和/或非易失性存储器1042。所述易失性存储器1041例如可以包括随机存取存储器(Random Access Memory，RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器1042例如可以包括只读存储器(Read-Only Memory，ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现各种期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

所述图像传感器110可以拍摄用户期望的图像(例如照片、视频等)，并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。

当注意，图1所示的电子设备10的组件和结构只是示例性的，尽管图1示出的电子设备10包括多个不同的装置，但是根据需要，其中的一些装置可以不是必须的，其中的一些装置的数量可以更多等等，本发明对此不限定。

在使用结构光方法进行三维扫描时，可以构建物体的三维图像。以三维重建人脸为例，可以使用结构光方法构建人脸的三维图像。其中，可以由投影仪发出结构光，并由图像采集装置采集在结构光照射下的人脸的二维图像，然后由处理器等基于该二维图像合成人脸的三维图像。

投影仪可以是具有投影功能的装置，也可以为集成在其他装置中的具有投影功能的组件，示例性地，投影仪可以是数字光处理(Digital Light Processing，DLP)投影仪。

DLP投影仪可以发出一帧或多帧的结构光。例如，可以用4帧相移(phaseshifting)的方法发出条纹状结构光。该4帧的条纹状结构光的相对亮度可以表示为：

其中，I表示相对亮度，L表示结构光的图案的周期，x表示横坐标，t表示帧数(t＝0,1,2,3)。这里的x是投影仪坐标系下的横坐标值。

投影仪开启之后，图像采集装置可以采集带有结构光图案的图像(即，二维图像)。示例性地，图像采集装置可以是照相机或摄像机等。

在图像采集装置采集到带有结构光图案的图像后，可以在这些图像的基础上构建脸部的三维图像。

假设图像采集装置在t＝0,1,2,3时采集到的图像分别为A0，A1，A2和A3。可以计算反射率图像A和相位图像P。反射率图像A为：

相位图像P为P＝arctan(S/C)。其中，C和S为差图像，C＝A0-A2或C＝A2-A0，S＝A3-A1或S＝A1-A3。

如果某个像素点(假设为像素点M)上的反射率图像A大于或等于预设的阈值，则可以根据以下的方法进行三维重建：

a)根据相位图像确定该像素点(假设为像素点M)的三维深度值Z：

Z＝-F×B/(P-ref)

其中，B表示图像采集装置与投影仪之间的距离，F表示图像采集装置的焦距与传感器像素尺寸的比值，ref表示预先校准的基准相位图像。

b)根据小孔成像原理，基于Z确定该像素点(假设为像素点M)的三维坐标X和Y。

X＝x/F×(-Z)，Y＝y/F×(-Z)。

其中，x和y表示该像素点(假设为像素点M)在二维图像中的横、纵坐标。具体地，x和y是该像素点(假设为像素点M)在图像采集装置的二维坐标系下的坐标值。

这样，通过a)和b)便可以构建该像素点(假设为像素点M)的三维坐标X、Y和Z，从而完成对该像素点(假设为像素点M)的三维重建。

如果某个像素点(假设为像素点N)上的反射率图像A小于预设的阈值，则说明该像素点(假设为像素点N)的三维重建信息是缺失的，此时可以找到距离该像素点(假设为像素点N)最近的、三维重建信息不缺失的像素点(假设为像素点M)，并将该找到的像素点(假设为像素点M)的三维深度值作为该像素点(假设为像素点N)的三维深度值Z，进而可以依据上述的b)基于Z确定该像素点(假设为像素点N)的三维坐标X和Y。

这样，便可以构建图像中的每一个像素点的三维坐标X、Y和Z，从而完成三维重建。其中三维坐标X、Y和Z以图像采集装置为参考原点。

通过上述描述可见，利用投影仪和图像采集装置，可以实现三维重建，例如可以构建脸部的三维图像。。

图2是本发明实施例的构建脸部的三维图像的方法的一个示意性流程图。图2所示的方法包括：

S101，检测人脸图像中的人脸区域，其中所述人脸图像是由图像采集装置所获取的。

示例性地，可以通过图像采集装置采集人脸图像，并基于所述人脸图像检测人脸区域。其中，图像采集装置所采集的人脸图像为二维图像。本实施例中，图像采集装置采集到的人脸图像可以为一个，也可以为多个。

示例性地，图像采集装置可以为图1中所示的图像传感器110；示例性地，图像采集装置为相机。

示例性地，可以通过运行人脸检测器，从而检测到人脸图像中的人脸区域。例如，人脸检测器可以为预先训练好的卷积神经网络(Convolutional Neural Network，CNN)人脸检测器。

可选地，可以在反射率图像上，运行人脸检测器，从而找到人脸区域。其中，关于反射率图像的描述如前所述，这里不再赘述。

S102，确定所述人脸区域中的第一区域。

其中，所述人脸区域中的第一区域可以是人脸区域中两眼所在的区域。

可选地，作为一个实施例，S102可以包括：寻找所述人脸区域中的人眼区域，并将所述人眼区域确定为所述第一区域。

示例性地，可以在反射率图像上运行人脸关键点检测器，通过检测到的人脸关键点确定人眼区域。该人眼区域可以以距离上、下眼皮边缘0.5厘米(cm)为界。

可选地，在S102中，还可以进一步确定第一区域在三维空间中的三维坐标。

示例性地，在确定所述人脸区域中的第一区域之前，还可以包括：确定所述人脸区域的大小大于或等于大小阈值。也就是说，在确定所述人脸区域的大小大于或等于大小阈值时，执行S102。

示例性地，如果投影仪处于关闭状态(如DLP投影仪未开启)且所述人脸区域的大小大于或等于预设的人脸大小阈值，则计算所述第一区域中的两瞳孔之间的间距。进一步地，可以根据两瞳孔之间的间距以及估计出的所述两眼的深度值，确定两眼在三维空间中的水平值和竖直值。

其中，两瞳孔之间的间距可以简称为瞳孔间距或瞳间距或瞳距，是指：两眼平视前方时，左、右瞳孔点之间的直线距离；两眼的深度值是指两眼与图像采集装置之间的直线距离。

示例性地，可以根据第一区域中的两瞳孔之间的间距以及三维空间中两眼的间距，确定第一区域中的像素点在二维空间中的水平值x和竖直值y。其中，二维空间为图像采集装置所在的坐标系的二维空间。其中，三维空间中两眼的间距可以为参考值，例如6.5厘米(cm)。

示例性地，可以假设图像采集装置进行图像采集时，在三维空间中人眼区域的深度值为定值Z0，也就是说，可以假设图像采集时三维空间中人眼区域内的任意位置点与图像采集装置之间的直线距离均为Z0，人眼区域的深度值Z0可以根据三维空间中两眼的间距参考值进行估算。

进一步地，可以根据第一区域中的像素点在图像采集装置所在的坐标系的二维空间中的水平值x和竖直值y、以及人眼区域的深度值(Z0)，确定第一区域中的像素点在三维空间中的三维坐标。具体地，可以根据前述b)部分的描述进行计算得到第一区域中的像素点在三维空间中的水平值X和竖直值Y。这里不再一一罗列。

应理解，如果投影仪处于关闭状态(如DLP投影仪未开启)且所述人脸区域的大小小于预设的人脸大小阈值，说明此时人脸离图像采集装置过远，所以此时没有构建该人脸的三维图像的必要，也就是说此时无需开启投影仪。

可选地，作为另一个实施例，S102可以包括：预测在下一帧所述人脸区域中的第一区域。具体地，可以根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，确定所述第一区域在下一帧中的位置。

示例性地，可以包括：

假设，前一帧为第t-1帧，当前帧为第t帧，下一帧为第t+1帧。假设将第一区域从前一帧至当前帧的平移表示为R，将第一区域从前一帧至当前帧的旋转表示为T。其中，R＝(Rx，Ry，Rz)，T＝(Tx，Ty，Tz)。

可选地，根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，确定所述第一区域从前一帧至当前帧的平移和旋转，可以包括：根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，使用迭代最近点(iterative closestpoint)算法进行对齐，从而确定第一区域从前一帧至当前帧的平移R和旋转T。

其中，第一区域在前一帧中的位置可以是指：在第t-1帧，第一区域在三维空间中的三维坐标。第一区域在当前帧中的位置可以是指：在第t帧，第一区域在三维空间中的三维坐标。

可选地，假设将第一区域从当前帧至下一帧的平移表示为R’，将第一区域从当前帧至下一帧的旋转表示为T’。那么根据所述第一区域从前一帧至当前帧的平移和旋转，确定所述第一区域从当前帧到下一帧的平移和旋转，可以包括：确定第一区域从当前帧至下一帧的平移R’＝k×R，确定第一区域从当前帧至下一帧的旋转T’＝k×T。其中，R表示第一区域从前一帧至当前帧的平移，T表示第一区域从前一帧至当前帧的旋转，k为预先确定的补偿系数。示例性地，k可以通过建模运算提前确定或者可以在实践中通过实验效果提前确定。

假设第一区域从当前帧至下一帧具有平移R’和旋转T’，那么，便可以基于第一区域在当前帧中的位置，确定第一区域在下一帧中的位置。也就是说，能够基于第t-1帧和第t帧第一区域在三维空间中的三维坐标，预测在第t+1帧的所述人脸区域中的第一区域在三维空间中的三维坐标，在实际应用场景下，随着t值的不断变化，不断获得当前帧至下一帧的平移量和旋转量，从而不断修正下一帧中第一区域在三维空间中的三维坐标。

在上述第一区域的预测过程中引入一个预设值k，系统通过分析前一帧和当前帧，基于预设值k进行简单运算即可预测下一帧第一区域在三维空间中的三维坐标，可见，通过上述方法进行运动补偿预测，能够减少计算和控制造成的延迟，降低结构光进入人眼的概率。

S103，将所述第一区域映射到投影仪的对应的第二区域。

示例性地，S103可以包括：

将所述第一区域在三维空间中的三维坐标映射到所述投影仪的第二坐标系，得到所述第一区域在第二坐标系中的二维坐标；

根据所述第一区域在第二坐标系中的二维坐标，确定所述第二区域。

其中，第一坐标系和第二坐标系为二维空间中的坐标系。

示例性地，如果在S102中已经得到第一区域在三维空间中的三维坐标，那么S103可以包括：将所述第一区域在三维空间中的三维坐标映射到所述投影仪所在的第二坐标系，得到所述第一区域在所述第二坐标系中的二维坐标；根据所述第一区域在所述第二坐标系中的二维坐标，确定所述第二区域。

S104，将所述投影仪在所述第二区域发出的结构光的亮度降低至亮度阈值以下。

示例性地，投影仪可以将第二区域内的结构光图案关闭或减弱。

举例来说，可以采用如下公式I'(x,y)＝I(x,y)×m(x,y)，确定投影仪发出的结构光。

其中，

x，y分别表示在投影仪所在的坐标系中的横坐标和纵坐标。

假设坐标点(x，y)位于投影仪的第二区域，可以确定m(x,y)等于0，或m(x,y)为大于0且小于1的数，例如m(x,y)＝0.2。举例来说，如果亮度阈值为I(x,y)×0.5，则可以确定m(x,y)为小于0.5的正数。

假设坐标点(x，y)位于投影仪的第二区域之外的区域，即坐标点(x，y)不在第二区域，则可以确定m(x,y)等于1。

由于第二区域发出的结构光在人脸区域上的投射区域为第一区域，即人眼区域，因此，将投影仪在第二区域发出的结构光的亮度降低至亮度阈值以下意味着投射在人眼区域的结构光的亮度降低至亮度阈值以下，其中，亮度阈值可以为人眼的视觉亮度感应值或能够对人眼造成不适的亮度值，此时，由于结构光在人眼区域的亮度低于亮度阈值，因而可以减少结构光给目标用户带来的眼部不适感。

S105，根据所述投影仪发出的结构光，构建所述人脸区域中除所述第一区域之外的其他区域的三维图像。

其中，根据所述投影仪发出的结构光构建所述人脸区域中除所述第一区域之外的其他区域的三维图像包括：采集在所述投影仪发出的结构光照射下的二维人脸图像，基于该二维人脸图像构建所述人脸区域中除所述第一区域之外的其他区域的三维图像。

由于在S104中投影仪将第二区域内的结构光图案关闭或减弱，而第二区域是从第一区域映射所得到的，因此投影仪发出的结构光不会照射到或仅少量能够照射到人脸区域中的第一区域，从而在S105中所得到的三维图像是人脸区域中除所述第一区域之外的其他区域的三维图像。

本发明实施例中，投影仪发出的结构光可以为可见光，这样能够在避免伤害人眼，提升用户使用体验的前提下，保证构建的人脸三维图像的精度。

另外，由于在S105中所得到的三维图像中，人脸区域中的第一区域的三维重建信息是缺失的，因此可以对该第一区域的三维信息进行补全。

示例性地，可以根据红外投影仪发出的红外光，构建所述第一区域的三维图像。这样，S105得到的所述人脸区域中除所述第一区域之外的其他区域的三维图像与这里的所述第一区域的三维图像一起构成所述人脸区域的三维图像。由于红外光对人眼的刺激较小，当第一区域为人眼区域时，将红外光投射在目标用户的人眼区域，目标用户并不会产生明显的不适感，从而实现在获得人眼区域三维图像的同时，降低或避免对目标用户眼部的刺激。

具体地，可以将第一区域映射到红外投影仪对应的第三区域；并根据红外投影仪在第三区域发出的结构光构建所述第一区域的三维图像。其中，红外投影仪在第三区域发出的结构光为红外光。

示例性地，可以根据所述人脸区域中除所述第一区域之外的其他区域的三维图像，采用预先训练好的神经网络，构建所述第一区域的三维图像。这样，S105得到的所述人脸区域中除所述第一区域之外的其他区域的三维图像与这里的所述第一区域的三维图像一起构成所述人脸区域的三维图像。

其中，预先训练好的神经网络可以为预先训练好的去噪自编码(DenoisingAutoencoder)系统。

具体地，可以将人脸区域中除第一区域之外的其他区域的Z图像作为输入，使用预先训练好的去噪自编码系统，得到第一区域中的每个像素点的深度值Z，并利用上述b)部分的方法得到第一区域中的每个像素点的水平值X和竖直值Y。从而实现对第一区域的三维重建，得到第一区域的三维图像。

由此可见，本发明实施例中，能够避免或减少投影仪的第二区域发出可见光，该第二区域与人脸区域中的两眼所在的区域对应，因而可以避免在人脸三维扫描过程中投影仪发出的可见光对人眼造成伤害。

图3是本发明实施例的构建脸部的三维图像的装置的一个示意性框图。图3所示的装置30包括：检测模块301、确定模块302、映射模块303、调节模块304和构建模块305。

检测模块301，用于检测人脸图像中的人脸区域，其中所述人脸图像是由图像采集装置所获取的；

确定模块302，用于确定所述检测模块301检测到的所述人脸区域中的第一区域；

映射模块303，用于将所述确定模块302确定的所述第一区域映射到投影仪的对应的第二区域；

调节模块304，用于将所述投影仪在所述第二区域发出的结构光的亮度降低至亮度阈值以下；

构建模块305，用于根据所述投影仪发出的结构光，构建所述人脸区域中除所述第一区域之外的其他区域的三维图像。

示例性地，所述确定模块302，具体用于：寻找所述人脸区域中的人眼区域，并将所述人眼区域确定为所述第一区域。

示例性地，所述确定模块302，还用于：确定所述人脸区域的大小大于或等于大小阈值。

示例性地，所述确定模块302，具体用于：根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，确定所述第一区域在下一帧中的位置。

示例性地，所述确定模块302，具体用于：

示例性地，所述映射模块303，具体用于：

示例性地，所述构建模块305，还用于：根据红外投影仪发出的红外光，构建所述第一区域的三维图像。其中，所述人脸区域中除所述第一区域之外的其他区域的三维图像与所述第一区域的三维图像一起构成所述人脸区域的三维图像。

举例来说，映射模块303可以将第一区域映射到红外投影仪对应的第三区域。构建模块305可以根据红外投影仪在第三区域发出的红外光构建所述第一区域的三维图像。

示例性地，所述构建模块305，还用于：根据所述人脸区域中除所述第一区域之外的其他区域的三维图像，采用预先训练好的神经网络，构建所述第一区域的三维图像。其中，所述人脸区域中除所述第一区域之外的其他区域的三维图像与所述第一区域的三维图像一起构成所述人脸区域的三维图像。

示例性地，所述投影仪发出的结构光为可见光。

图3所示的装置30能够用于实现前述图2所示的构建脸部的三维图像的方法。

另外，本发明实施例还提供了另一种构建脸部的三维图像的装置，该装置可以包括处理器和存储器，其中，存储器用于存储指令代码，处理器执行该指令代码时，可以实现前述图2所示的构建脸部的三维图像的方法。

另外，本发明实施例还提供了一种电子设备，该电子设备可以包括图3所示的装置30。该电子设备可以实现前述图2示的构建脸部的三维图像的方法。

示例性地，该电子设备可以包括图像采集装置和投影仪。或者，示例性地，该电子设备可以包括图像采集装置，且该电子设备可以通过总线等方式与投影仪进行通信。

尽管这里已经参考附图描述了示例实施例，应理解上述示例实施例仅仅是示例性的，并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个设备，或一些特征可以忽略，或不执行。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该本发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如相应的权利要求书所反映的那样，其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域的技术人员可以理解，除了特征之间相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的物品分析设备中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述，仅为本发明的具体实施方式或对具体实施方式的说明，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种构建脸部的三维图像的方法，其特征在于，包括：

确定所述人脸区域中的第一区域；

将所述第一区域映射到投影仪的对应的第二区域；

根据所述投影仪发出的结构光，构建所述人脸区域中除所述第一区域之外的其他区域的三维图像；

其中，所述人脸区域中除所述第一区域之外的其他区域的三维图像与所述第一区域的三维图像一起构成所述人脸区域的三维图像，

其中，所述将所述第一区域映射到投影仪的对应的第二区域，包括：

2.如权利要求1所述的方法，其特征在于，所述确定所述人脸区域中的第一区域，包括：

寻找所述人脸区域中的人眼区域，并将所述人眼区域确定为所述第一区域。

3.如权利要求2所述的方法，其特征在于，在所述确定所述人脸区域中的第一区域之前，还包括：

确定所述人脸区域的大小大于或等于大小阈值。

4.如权利要求1所述的方法，其特征在于，所述确定人脸区域中的第一区域，包括：

5.如权利要求4所述的方法，其特征在于，所述根据所述第一区域在前一帧中的位置和所述第一区域在当前帧中的位置，确定所述第一区域在下一帧中的位置，包括：

6.如权利要求1至5任一项所述的方法，其特征在于，所述投影仪发出的结构光为可见光。

7.一种构建脸部的三维图像的装置，其特征在于，包括：

构建模块，用于根据所述投影仪发出的结构光，构建所述人脸区域中除所述第一区域之外的其他区域的三维图像，还用于根据所述人脸区域中除所述第一区域之外的其他区域的三维图像，采用预先训练好的神经网络，构建所述第一区域的三维图像；

其中，所述映射模块，具体用于：

8.如权利要求7所述的装置，其特征在于，所述确定模块，具体用于：

9.如权利要求8所述的装置，其特征在于，所述确定模块，还用于：

确定所述人脸区域的大小大于或等于大小阈值。

10.如权利要求7所述的装置，其特征在于，所述确定模块，具体用于：

11.如权利要求10所述的装置，其特征在于，所述确定模块，具体用于：

12.如权利要求7至11任一项所述的装置，其特征在于，所述投影仪发出的结构光为可见光。