CN109063584B

CN109063584B - 基于级联回归的面部特征点定位方法、装置、设备及介质

Info

Publication number: CN109063584B
Application number: CN201810755420.9A
Authority: CN
Inventors: 朱美芦; 石大明
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2018-07-11
Filing date: 2018-07-11
Publication date: 2022-02-22
Anticipated expiration: 2038-07-11
Also published as: CN109063584A

Abstract

本发明适用计算机技术领域，提供了一种基于级联回归的面部特征点定位方法、装置、设备及介质，该方法包括：通过训练好的级联回归模型中的多尺度卷积神经网络，预测待定位人脸图像的特征点位置集合并提取该图像的全局特征，根据该全局特征通过级联回归模型中的每个精化层对待定位人脸图像的特征点位置集合进行修正，根据修正后的特征点位置集合确定待定位人脸图像上所有特征点的最终位置，其中，级联回归模型是通过基于雅克比矩阵的深度优化策略训练得到的，每个精化层包括局部特征提取器、特征融合器和回归器，从而在面部特征点定位过程中提高了图像纹理信息的利用效果和模型训练效果，进而提高了面部特征点定位的精度和准确度。

Description

基于级联回归的面部特征点定位方法、装置、设备及介质

技术领域

本发明属于图像处理技术领域，尤其涉及一种基于级联回归的面部特征点定位方法、装置、设备及介质。

背景技术

面部特征点定位是基于人脸图像进行人脸动画生成的重要一环，通常先由一种可靠快速的人脸检测算法给出人脸区域作为输入，再对该人脸区域内的一组预定义的面部特征点进行定位，如眉毛、眼瞳、鼻尖、嘴角等。目前，面部特征点定位方法主要分为两类模型：以经典算法主动表观模型为代表的生成模型，以及近几年兴起的以级联回归方法(例如监督下降法)为代表的判别模型。生成模型在对无控制条件下获取的人脸进行特征点定位时往往失效，而判别模型无论是定位速度还是鲁棒性上展现出明显的优势，相关理论技术也有发展。

然而，目前用于面部特征点定位的级联回归方法还存在以下问题：(1)在级联结构中人脸图像全局和局部的纹理信息并没有得到很好的利用；(2)用于面部特征点定位的级联回归模型无法进行端对端的学习；(3)级联回归中每个回归器的优化是相互独立的；(4)对人脸特征点进行定位的精度还有待提高。

发明内容

本发明的目的在于提供一种基于级联回归的面部特征点定位方法、装置、设备及存储介质，旨在解决由于现有技术中基于级联回归的面部特征点定位方法无法较好地利用人脸图像的纹理信息、且模型训练效果不佳，导致面部特征点定位精度不高且效果不佳的问题。

一方面，本发明提供了一种基于级联回归的面部特征点定位方法，所述方法包括下述步骤：

当接收到面部特征点定位请求时，获取所述面部特征点定位请求中的待定位人脸图像；

通过预先训练好的级联回归模型中的多尺度卷积神经网络，预测所述待定位人脸图像的特征点位置集合并提取所述待定位人脸图像的全局特征，所述级联回归模型是通过预设的、基于雅克比矩阵的深度优化策略训练得到的；

根据所述待定位人脸图像的全局特征，通过所述级联回归模型中的每个精化层对所述待定位人脸图像的特征点位置集合进行修正，所述每个精化层包括局部特征提取器、特征融合器以及回归器；

根据修正后的、所述待定位人脸图像的特征点位置集合，确定所述待定位人脸图像上所有特征点的最终位置。

另一方面，本发明提供了一种基于级联回归的面部特征点定位装置，所述装置包括：

待定位图像获取单元，用于当接收到面部特征点定位请求时，获取所述面部特征点定位请求中的待定位人脸图像；

特征点信息提取单元，用于通过预先训练好的级联回归模型中的多尺度卷积神经网络，预测所述待定位人脸图像的特征点位置集合并提取所述待定位人脸图像的全局特征，所述级联回归模型是通过预设的、基于雅克比矩阵的深度优化策略训练得到的；

特征点位置修正单元，用于根据所述待定位人脸图像的全局特征，通过所述级联回归模型中的每个精化层对所述待定位人脸图像的特征点位置集合进行修正，所述每个精化层包括局部特征提取器、特征融合器以及回归器；以及

特征位置确定单元，用于根据修正后的、所述待定位人脸图像的特征点位置集合，确定所述待定位人脸图像上所有特征点的最终位置。

另一方面，本发明还提供了一种图像处理设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述基于级联回归的面部特征点定位方法所述的步骤。

另一方面，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述基于级联回归的面部特征点定位方法所述的步骤。

本发明通过训练好的级联回归模型中的多尺度卷积神经网络，预测待定位人脸图像的特征点位置集合并提取该图像的全局特征，根据该全局特征通过级联回归模型中的每个精化层对特征点位置集合进行修正，根据修正后的特征点位置集合确定待定位人脸图像上所有特征点的最终位置，其中，级联回归模型是通过基于雅克比矩阵的深度优化策略训练得到的，每个精化层包括局部特征点提取器、特征融合器和回归器，从而通过全局特征和精化层中的局部的特征提取器、特征融合期提高了图像纹理信息的利用效果，通过基于雅克比矩阵的深度优化策略提高了级联回归模型的训练效果，进而有效地提高了面部特征点定位的精度和准确度。

附图说明

图1是本发明实施例一提供的基于级联回归的面部特征点定位方法的实现流程图；

图2是本发明实施例一提供的基于级联回归的面部特征点定位方法中多尺度卷积神经网络的结构示例图；

图3是本发明实施例二提供的基于级联回归的面部特征点定位装置的结构示意图；

图4是本发明实施例二提供的基于级联回归的面部特征点定位装置的优选结构示意图；以及

图5是本发明实施例三提供的图像处理设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述：

实施例一：

图1示出了本发明实施例一提供的基于级联回归的面部特征点定位方法的实现流程，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

在步骤S101中，当接收到面部特征点定位请求时，获取面部特征点定位请求中的待定位人脸图像。

本发明实施例适用于面部特征点定位平台或系统。获取面部特征点定位请求的待定位人脸图像，后续对该待定位人脸图像进行面部特征点定位。

在步骤S102中，通过预先训练好的级联回归模型中的多尺度卷积神经网络，预测待定位人脸图像的特征点位置集合并提取待定位人脸图像的全局特征，级联回归模型是通过预设的、基于雅克比矩阵的深度优化策略训练得到的。

在本发明实施例中，预先通过基于雅克比矩阵的深度优化策略对级联回归模型进行训练，获得训练好的级联回归模型。在获得待定位人脸图像后，可通过级联回归模型中的多尺度卷积神经网络，预测待定位人脸图像的特征点位置集合，同时提取待定位人脸图像的全局特征。其中，特征点位置集合由每个预设特征点的位置信息(特征点在待定位人脸图像上的横纵坐标)构成。

优选地，多尺度卷积神经网络由多个网络分支组成，每个网络分支的第一层卷积层采用不同大小的卷积核，通过每个网络分支提取待定位人脸图像上不同尺度的面部特征，将所有尺度的面部特征连接成一个特征向量，再将该特征向量输入多尺度卷积神经网络的全连接层中，将第一个全连接层的输出设置为待定位人脸图像的特征点位置集合，将最后一个全连接层的输出设置为待定位人脸图像的全局特征，从而有效地提高了待定位人脸图像上纹理信息的利用效果，进而提高了特征点位置集合的预测效果和全局特征的提取效果。

优选地，在将待定位人脸图像输入到多尺度卷积神经网络之前，检测出待定位人脸图像对应的人脸框，按照人脸框对待定位人脸图像进行裁剪，将裁剪得到的人脸框内的图像输入多尺度卷积神经网络中，从而通过对待定位人脸图像进行处理，有效地提高特征点位置集合的预测效果和全局特征的提取效果。

作为示例地，图2为多尺度卷积神经网络的结构示例图，在图2中，多尺度卷积神经网络一共有3个网络分支、3个卷积层和3个全连接层，每个网络分支的第一个卷积层分别采用了3×3、5×5和7×7大小的卷积核，人脸图像上的方框为人脸框，将人脸框内的图像输入到多尺度卷积神经网络中。

在步骤S103中，根据待定位人脸图像的全局特征，通过级联回归模型中的每个精化层对待定位人脸图像的特征点位置集合进行修正，每个精化层包括局部特征提取器、特征融合器以及回归器。

在本发明实施例中，在获得待定位人脸图像的特征点位置集合和全局特征后，通过级联回归模型中的每个精化层依次对待定位人脸图像的特征点位置集合进行修正，获得经过最后一个精化层修正的特征点位置集合。

优选地，通过每个精化层依次对特征点位置集合进行修正的过程，通过下述步骤实现：

(1)根据待定位人脸图像的特征点位置集合，通过级联回归模型中当前精化层内的局部特征提取器提取待定位人脸图像的局部特征。

进一步优选地，在通过局部特征提取器提取待定位人脸图像的局部特征时，对以特征点坐标集合中特征点位置为中心的局部图像块，进行方向梯度直方图特征(HOG，Histogram ofOriented Gradient)提取，将每个局部图像块的HOG特征连接成一个特征向量，得到待定位人脸图像对应的局部特征，从而提高了待定位人脸图像上局部特征的提取效果。

(2)通过当前精化层内的特征融合器将待定位人脸图像的局部特征和待定位人脸图像的全局特征进行融合。

在本发明实施例中，将待定位人脸图像的局部特征和全局特征一起输入到特征融合器中，由特征融合器将这两个特征融合为一个特征，使得融合后的特征不仅具有待定位人脸图像的局部纹理特征，还具有全局纹理特征，从而有效地提高待定位人脸图像上纹理信息的利用效果。

进一步优选地，特征融合器为前馈神经网络，对特征融合器的参数进行L₁正则化约束，使得特征融合器的参数具有稀疏性，实现特征融合器对全局特征和局部特征进行特征选择的作用，从而有效地提高特征融合器的特征融合效果。

(3)将融合后的特征输入当前精化层内的回归器中，生成待定位人脸图像对应的特征点位置偏移量。

在本发明实施例中，将融合后的特征输入回归器中，由回归器预测得到待定位人脸图像对应的特征点位置偏移量，其中，特征点位置偏移量包括每个特征点位置对应的偏移量。

进一步优选地，回归器为前馈神经网络，对回归器的参数进行L₂正则化约束，从而有效地提高回归器对特征点位置偏移量进行预测的准确度。

(4)根据特征点位置偏移量对待定位人脸图像的特征点位置集合进行修正，获得经过当前精化层修正的特征点位置集合。

在本发明实施例中，由待定位人脸图像的特征点位置集合加上特征点位置偏移量，即可得到的修正后的特征点位置集合。

(5)当当前精化层不是级联回归模型中最后一个精化层时，将级联回归模型中的下一精化层设置为当前精化层，并跳转至通过级联回归模型中当前精化层内的局部特征提取器提取待定位人脸图像的局部特征的步骤。

在本发明实施例中，当当前精化层不是最后一个精化层时，还需要通过下一精化层对特征点位置集合进行修正，直至级联回归模型中的最后一个精化层完成对特征点位置集合的修正。

进一步优选地，通过级联回归模型中的局部特征提取器、特征融合器和回归器，对待定位人脸图像的特征点位置集合进行修正的过程，表示为下述公式：

其中，I表示待定位人脸图像，s_k-1、s_k分别表示经过第k-1、k个精化层修正后的特征点位置集合，Γ(·)表示局部特征提取器，

为通过第k个精化层中的局部特征提取器提取得到的、待定位人脸图像的局部特征，Φ^global为待定位人脸图像的全局特征，

分别表示第k个精化层中的特征融合器和回归器，

分别表示

的参数矩阵。

在步骤S104中，根据修正后的、待定位人脸图像的特征点位置集合，确定待定位人脸图像上所有特征点的最终位置。

在本发明实施例中，获取经过级联回归模型中所有精化层修正后的、待定位人脸图像的特征点位置集合，该特征点位置集合中每个特征点的位置，即待定位人脸图像上所有特征点的最终位置，从而完成对待定位人脸图像的面部特征点定位。

在本发明实施例中，接收到面部特征点定位请求之前，通过基于雅克比矩阵的深度优化策略对级联回归模型进行训练，从而实现级联回归模型端对端的训练，解决级联回归中每个回归器的训练相互独立的问题。优选地，对级联回归模型进行训练的过程，通过下述步骤实现：

(1)获取预先采集的训练图像集，训练图像集包括人脸训练图像和每幅人脸训练图像对应的特征点最佳位置集合。

在本发明实施例中，人脸训练图像上预先标记出了每个特征点的准确位置，人脸训练图像上所有特征点的准确位置构成该人脸训练图像对应的特征点最佳位置，以用于后续对级联回归模型进行有监督训练。

(2)通过级联回归模型中的多尺度卷积神经网络，预测人脸训练图像的特征点位置集合并提取人脸训练图像的全局特征。

在本发明实施例中，通过多尺度卷积神经网络对人脸训练图像进行处理的过程，可参照步骤S102，在此不再赘述。

(3)根据人脸训练图像的全局特征，通过级联回归模型中的每个精化层对人脸训练图像的特征点位置集合进行修正。

在本发明实施例中，通过每个精化层对人脸训练图像的特征点位置集合进行修正的过程，可参照步骤S103，在此不再赘述。

(4)根据人脸训练图像的特征点最佳位置集合、修正后的特征点位置集合和基于雅克比矩阵的深度优化策略，对级联回归模型进行训练，获得训练好的级联回归模型。

在本发明实施例中，在获得经过级联回归模型中所有精化层修正的、人脸训练图像的特征点位置集合后，根据该特征点位置集合和人脸训练图像的特征点最佳位置集合，计算级联回归模型的定位误差，其中，定位误差可为修正后的特征点位置集合与特征点最佳位置集合之间的均方误差。

在本发明实施例中，通过将定位误差从级联回归模型的最后一个精化层传递至第一个精化层，实现级联回归模型端到端的训练。要使不同回归器之间能够进行误差传递，需要求出每个精化层中的特征融合器

关于经上一个精化层修正后的特征点位置集合s_k-1的一阶导数，该一阶导数求解的关键问题在于求出每个精化层中局部特征提取器Γ(·)关于经上一个精化层修正后的特征点位置集合s_k-1的一阶导数，即雅克比矩阵，由于Γ(·)是不可导的，可通过数值近似的方式求解Γ(·)关于s_k-1的雅克比矩阵。在得到雅克比矩阵后，通过雅克比矩阵将定位误差从级联回归模型的最后一个精化层传递至第一个精化层，实现级联回归模型有监督的、端对端的训练过程。

优选地，由于s_k-1中各个特征点的位置是关于横纵坐标x、y的，所以Γ(·)关于s_k-1的雅克比矩阵表示为：

L为特征点的总数目。

其中，Γ(·)关于x、y的一阶导数可通过数值近似得到：

其中，I在这里表示人脸训练图像，

w为人脸训练图像上人脸框的宽度。

在本发明实施例中，通过训练好的级联回归模型中的多尺度卷积神经网络，预测待定位人脸图像的特征点位置集合并提取该图像的全局特征，根据该全局特征通过级联回归模型中的每个精化层对特征点位置集合进行修正，每个精化层包括局部特征点提取器、特征融合器和回归器，根据修正后的特征点位置集合确定待定位人脸图像上所有特征点的最终位置，其中，级联回归模型是通过基于雅克比矩阵的深度优化策略训练得到的，从而提高了图像纹理信息的利用效果和级联回归模型的训练效果，进而提高了面部特征点定位的精度和准确度。

实施例二：

图3示出了本发明实施例二提供的基于级联回归的面部特征点定位装置的结构，为了便于说明，仅示出了与本发明实施例相关的部分，其中包括：

待定位图像获取单元31，用于当接收到面部特征点定位请求时，获取面部特征点定位请求中的待定位人脸图像。

特征点信息提取单元32，用于通过预先训练好的级联回归模型中的多尺度卷积神经网络，预测待定位人脸图像的特征点位置集合并提取待定位人脸图像的全局特征，级联回归模型是通过预设的、基于雅克比矩阵的深度优化策略训练得到的。

特征点位置修正单元33，用于根据待定位人脸图像的全局特征，通过级联回归模型中的每个精化层对待定位人脸图像的特征点位置集合进行修正，每个精化层包括局部特征提取器、特征融合器以及回归器。

特征位置确定单元34，用于根据修正后的、待定位人脸图像的特征点位置集合，确定待定位人脸图像上所有特征点的最终位置。

优选地，如图4所示，特征点信息提取单元32包括：

多尺度特征提取单元421，用于通过多尺度卷积神经网络提取待定位人脸图像上不同尺度的面部特征，多尺度卷积神经网络中不同网络分支的第一层卷积层采用不同大小的卷积核；

面部特征处理单元422，用于将所有面部特征连接成对应的特征向量，将特征向量输入多尺度卷积神经网络中的全连接层中，获取多尺度卷积神经网络中第一个全连接层的输出和最后一个全连接层的输出；以及

全连接层输出设置单元423，用于将第一个全连接层的输出设置为待定位人脸图像的全局特征，将最后一个全连接层的输出设置为待定位人脸图像的特征点位置集合。

在本发明实施例中，多尺度卷积神经网络由多个网络分支组成，每个网络分支的第一层卷积层采用不同大小的卷积核，通过每个网络分支提取待定位人脸图像上不同尺度的面部特征，将所有尺度的面部特征连接成一个特征向量，再将该特征向量输入多尺度卷积神经网络的全连接层中，将第一个全连接层的输出设置为待定位人脸图像的特征点位置集合，将最后一个全连接层的输出设置为待定位人脸图像的全局特征，从而有效地提高了待定位人脸图像上纹理信息的利用效果，进而提高了特征点位置集合的预测效果和全局特征的提取效果。

优选地，特征点位置修正单元33包括：

局部特征提取单元431，用于根据待定位人脸图像的特征点位置集合，通过级联回归模型中当前精化层内的局部特征提取器提取待定位人脸图像的局部特征。

进一步优选地，在通过局部特征提取器提取待定位人脸图像的局部特征时，对以特征点坐标集合中特征点位置为中心的局部图像块，进行HOG特征提取，将每个局部图像块的HOG特征连接成一个特征向量，得到待定位人脸图像对应的局部特征，从而提高了待定位人脸图像上局部特征的提取效果。

特征融合单元432，用于通过当前精化层内的特征融合器将待定位人脸图像的局部特征和待定位人脸图像的全局特征进行融合。

位置偏移确定单元433，用于将融合后的特征输入当前精化层内的回归器中，生成待定位人脸图像对应的特征点位置偏移量。

位置修正单元434，用于根据特征点位置偏移量对待定位人脸图像的特征点位置集合进行修正，获得经过当前精化层修正的特征点位置集合。

精化层设置单元435，用于当当前精化层不是级联回归模型中最后一个精化层时，将级联回归模型中的下一精化层设置为当前精化层，并触发局部特征提取单元431执行通过级联回归模型中当前精化层内的局部特征提取器提取待定位人脸图像的局部特征的步骤。

分别表示第k个精化层中的特征融合器和回归器，

分别表示

的参数矩阵。

L为特征点的总数目。

其中，Γ(·)关于x、y的一阶导数可通过数值近似得到：

其中，I在这里表示人脸训练图像，

w为人脸训练图像上人脸框的宽度。

在本发明实施例中，基于级联回归的面部特征点定位装置的各单元可由相应的硬件或软件单元实现，各单元可以为独立的软、硬件单元，也可以集成为一个软、硬件单元，在此不用以限制本发明。

实施例三：

图5示出了本发明实施例三提供的图像处理设备的结构，为了便于说明，仅示出了与本发明实施例相关的部分。

本发明实施例的图像处理设备5包括处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52。该处理器50执行计算机程序52时实现上述方法实施例中的步骤，例如图1所示的步骤S101至S104。或者，处理器50执行计算机程序52时实现上述装置实施例中各单元的功能，例如图3所示单元31至34的功能。

实施例四：

在本发明实施例中，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法实施例中的步骤，例如，图1所示的步骤S101至S104。或者，该计算机程序被处理器执行时实现上述装置实施例中各单元的功能，例如图3所示单元31至34的功能。

本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质，例如，ROM/RAM、磁盘、光盘、闪存等存储器。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于级联回归的面部特征点定位方法，其特征在于，所述方法包括下述步骤：

根据修正后的、所述待定位人脸图像的特征点位置集合，确定所述待定位人脸图像上所有特征点的最终位置；

通过所述级联回归模型中的每个精化层对所述待定位人脸图像的特征点位置集合进行修正的步骤，包括：

根据所述待定位人脸图像的特征点位置集合，通过所述级联回归模型中当前精化层内的局部特征提取器提取所述待定位人脸图像的局部特征；

通过所述当前精化层内的特征融合器将所述待定位人脸图像的局部特征和所述待定位人脸图像的全局特征进行融合；

将所述融合后的特征输入所述当前精化层内的回归器中，生成所述待定位人脸图像对应的特征点位置偏移量；

根据所述特征点位置偏移量对所述待定位人脸图像的特征点位置集合进行修正，获得经过所述当前精化层修正的特征点位置集合；

当所述当前精化层不是所述级联回归模型中最后一个精化层时，将所述级联回归模型中的下一精化层设置为所述当前精化层，并跳转至通过所述级联回归模型中当前精化层内的局部特征提取器提取所述待定位人脸图像的局部特征的步骤。

2.如权利要求1所述的方法，其特征在于，预测所述待定位人脸图像的特征点位置集合并提取所述待定位人脸图像的全局特征的步骤，包括：

通过所述多尺度卷积神经网络提取所述待定位人脸图像上不同尺度的面部特征，所述多尺度卷积神经网络中不同网络分支的第一层卷积层采用不同大小的卷积核；

将所述所有面部特征连接成对应的特征向量，将所述特征向量输入所述多尺度卷积神经网络中的全连接层中，获取所述多尺度卷积神经网络中第一个全连接层的输出和最后一个全连接层的输出；

将所述第一个全连接层的输出设置为所述待定位人脸图像的全局特征，将所述最后一个全连接层的输出设置为所述待定位人脸图像的特征点位置集合。

3.如权利要求1所述的方法，其特征在于，获取所述面部特征点定位请求中的待定位人脸图像的步骤之前，所述方法还包括：

获取预先采集的训练图像集，所述训练图像集包括人脸训练图像和每幅人脸训练图像对应的特征点最佳位置集合；

通过所述级联回归模型中的多尺度卷积神经网络，预测所述人脸训练图像的特征点位置集合并提取所述人脸训练图像的全局特征；

根据所述人脸训练图像的全局特征，通过所述级联回归模型中的每个精化层对所述人脸训练图像的特征点位置集合进行修正；

根据所述人脸训练图像的特征点最佳位置集合、修正后的特征点位置集合和所述基于雅克比矩阵的深度优化策略，对所述级联回归模型进行训练，获得训练好的所述级联回归模型。

4.如权利要求3所述的方法，其特征在于，对所述级联回归模型进行训练的步骤，包括：

根据所述人脸训练图像的特征点最佳位置集合和修正后的所述人脸训练图像的特征点位置集合，计算所述级联回归模型的定位误差；

计算所述每个精化层的局部特征提取器与经过上一个精化层修正的、所述人脸训练图像的特征点位置集合之间的雅可比矩阵；

根据所述雅可比矩阵和所述定位误差在所述级联回归模型的每个精化层之间进行误差传导，对所述级联回归模型进行训练。

5.一种基于级联回归的面部特征点定位装置，其特征在于，所述装置包括：

特征位置确定单元，用于根据修正后的、所述待定位人脸图像的特征点位置集合，确定所述待定位人脸图像上所有特征点的最终位置；

所述特征点位置修正单元包括：

局部特征提取单元，用于根据所述待定位人脸图像的特征点位置集合，通过所述级联回归模型中当前精化层内的局部特征提取器提取所述待定位人脸图像的局部特征；

特征融合单元，用于通过所述当前精化层内的特征融合器将所述待定位人脸图像的局部特征和所述待定位人脸图像的全局特征进行融合；

位置偏移确定单元，用于将所述融合后的特征输入所述当前精化层内的回归器中，生成所述待定位人脸图像对应的特征点位置偏移量；

位置修正单元，用于根据所述特征点位置偏移量对所述待定位人脸图像的特征点位置集合进行修正，获得经过所述当前精化层修正的特征点位置集合；以及

精化层设置单元，用于当所述当前精化层不是所述级联回归模型中最后一个精化层时，将所述级联回归模型中的下一精化层设置为所述当前精化层，并触发所述局部特征提取单元执行通过所述级联回归模型中当前精化层内的局部特征提取器提取所述待定位人脸图像的局部特征的步骤。

6.如权利要求5所述的装置，其特征在于，所述特征点信息提取单元包括：

多尺度特征提取单元，用于通过所述多尺度卷积神经网络提取所述待定位人脸图像上不同尺度的面部特征，所述多尺度卷积神经网络中不同网络分支的第一层卷积层采用不同大小的卷积核；

面部特征处理单元，用于将所述所有面部特征连接成对应的特征向量，将所述特征向量输入所述多尺度卷积神经网络中的全连接层中，获取所述多尺度卷积神经网络中第一个全连接层的输出和最后一个全连接层的输出；以及

全连接层输出设置单元，用于将所述第一个全连接层的输出设置为所述待定位人脸图像的全局特征，将所述最后一个全连接层的输出设置为所述待定位人脸图像的特征点位置集合。

7.一种图像处理设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。

8.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。