CN104715227A

CN104715227A - 人脸关键点的定位方法和装置

Info

Publication number: CN104715227A
Application number: CN201310684862.6A
Authority: CN
Inventors: 沈晓璐; 冯雪涛; 汪彪; 韩宰俊
Original assignee: Beijing Samsung Telecommunications Technology Research Co Ltd; Samsung Electronics Co Ltd
Current assignee: Beijing Samsung Telecommunications Technology Research Co Ltd; Samsung Electronics Co Ltd
Priority date: 2013-12-13
Filing date: 2013-12-13
Publication date: 2015-06-17
Anticipated expiration: 2033-12-13
Also published as: US20160283820A1; KR102068249B1; KR20160111376A; WO2015088179A1; US10002308B2; CN104715227B

Abstract

提供了一种人脸关键点的定位方法和装置。定位方法包括：使用基于多个类型的训练集训练得到的多个人脸定位模型对输入图像中的人脸进行定位，以得到与各个人脸定位模型对应的多个定位结果；使用训练的评价模型对所述多个定位结果进行评价以选出最优的定位结果，其中，定位结果包括人脸图像的多个关键点位置，评价模型由针对所述多个关键点位置训练的分类器组成。

Description

人脸关键点的定位方法和装置

技术领域

本发明涉及人脸识别技术领域，更具体地，涉及一种通过采用多个人脸定位模型来对人脸关键点进行定位的方法和装置。

背景技术

人脸关键点定位技术的目的是在输入的人脸图片上，以人脸检测给出的初始位置为基础，获取一系列关键点（眼角、嘴角、鼻尖等）的几何位置。该技术在人脸识别、照片美化、人脸动画等相关应用中起到核心作用，直接影响其效果。人脸受到姿态、表情、光照、性别、年龄、种族等因素影响，其外观变化多样，使得定位的稳定性受到严重影响。

现有技术主要使用三类方法来解决人脸关键点定位中的多样性问题：

1)三维方法：创建一个三维模型用于定位。由于三维信息不受姿态和光照影响，这可以提高了在不同姿态光照下的稳定性。

2)局部方法：使用关键点附近的小区域为特征，逐个定位每个关键点。小区域在上述因素影响下变化较小，能在一定范围内提高定位的稳定性。

3)分姿态方法：首先判断姿态，而后施用不同定位模型进行定位。针对一种姿态的定位模型稳定性较高。

然而，以上的人脸关键点定位技术也存在一定的不足。具体地，三维方法需要额外的硬件(例如，需要两个照相机来产生三维图像)或人工输入来获取用户的三维模型，这造成硬件成本的增加。

局部方法缺乏全局约束，因此当人脸检测给出的初始关键点位置偏差较大时，容易出现错误。即使在局部方法中添加一个全局约束，该全局约束同样受到人脸多样性的影响。

分姿态方法不能处理除姿态之外的变化因素，如果对所有可能的变化因素逐个分别处理，则需要的定位模型数量过多，使得系统所占空间过大，执行定位时速度降低。

因此，需要一种新型的人脸关键点定位方法和系统，能够在不增加硬件成本的情况下，充分考虑人脸多样性，实现对人脸关键点的快速、自适应性定位。

发明内容

本发明使用多个定位模型对人脸图片进行关键点定位，然后利用一个评价模型选出最优的定位结果。此外，根据最优的定位结果，本发明还可以对已有的定位模型进行更新，或者增添新的定位模型，同时可以对评价模型进行更新，从而实现自适应的人脸关键点定位。

另外，本发明利用不同模型定位不同类型人脸上的关键点，提高了定位的稳定性。定位模型可针对用户输入进行调整，有效控制系统规模，节省执行时间。

本发明的一方面提供一种用于人脸关键点位置的定位方法，包括：使用基于多个类型的训练集训练得到的多个人脸定位模型对输入图像中的人脸进行定位，以得到与各个人脸定位模型对应的多个定位结果；使用训练的评价模型对所述多个定位结果进行评价以选出最优的定位结果，其中，定位结果包括人脸图像的多个关键点位置，评价模型由针对所述多个关键点位置训练的分类器组成。

根据本发明的一方面，所述多个人脸定位模型分别与所述多个训练集的类型一一对应。

根据本发明的一方面，所述定位方法还包括：确定所述最优的定位结果的评价是否超过预定阈值；如果确定所述最优的定位结果的评价超过预定阈值，则基于最优的定位结果更新评价模型。

根据本发明的一方面，基于最优的定位结果更新评价模型的步骤包括：基于所述最优的定位结果的关键点位置在输入图像中生成预定数量的正样本图像块和负样本图像块，然后使用生成的正样本图像块和负样本图像块来更新评价模型。

根据本发明的一方面，所述定位方法还包括：确定所述最优的定位结果的类型是否属于所述多个定位模型之一；如果确定所述最优的定位结果的类型属于所述多个定位模型之一，则将与所述最优的定位结果对应的输入图像加入对应的训练集，以重新训练与该训练集对应的定位模型；如果确定所述最优的定位结果的类型不属于所述多个定位模型之一，则将与所述最优的定位结果对应的输入图像作为样本来创建与所述最优的定位结果的类型对应的新的训练集。

根据本发明的一方面，所述定位方法还包括：如果所述新的训练集中的样本数量超过预定值，则基于所述新的训练集训练新的定位模型，从而增加定位模型的数量。

根据本发明的另一方面，提供了一种用于人脸关键点定位的装置，包括：关键点定位单元，使用基于多个类型的训练集训练得到的多个人脸定位模型对输入图像中的人脸进行定位，以得到与各个人脸定位模型对应的多个定位结果；评价单元，使用基于训练集训练的评价模型对所述多个定位结果进行评价以选出最优的定位结果，其中，定位结果包括人脸图像的多个关键点位置，评价模型由针对所述多个关键点位置训练的分类器组成。

根据本发明的另一方面，所述多个人脸定位模型分别与所述多个训练集的类型一一对应。

根据本发明的另一方面，所述装置还包括：更新单元，确定所述最优的定位结果的评价是否超过预定阈值，如果确定所述最优的定位结果的评价超过预定阈值，则基于最优的定位结果更新评价模型和/或定位模型。

根据本发明的另一方面，更新单元基于所述最优的定位结果的关键点位置在输入图像中生成预定数量的正样本图像块和负样本图像块，然后使用生成的正样本图像块和负样本图像块来训练更新评价模型。

根据本发明的另一方面，更新单元确定所述最优的定位结果的类型是否属于所述多个定位模型之一，如果确定所述最优的定位结果的类型属于所述多个定位模型之一，则将与所述最优的定位结果对应的输入图像加入对应的训练集，以重新训练与该训练集对应的定位模型；如果更新单元确定所述最优的定位结果的类型不属于所述多个定位模型之一，则将与所述最优的定位结果对应的输入图像作为样本来创建与所述最优的定位结果的类型对应的新的训练集。

根据本发明的另一方面，如果更新单元确定所述新的训练集中的样本数量超过预定值，则基于所述新的训练集训练新的定位模型，从而增加定位模型的数量。

附图说明

通过下面结合附图进行的描述，本发明的上述和其他目的和特点将会变得更加清楚，其中：

图1是示出根据本发明实施例的人脸关键点定位方法的流程图；

图2是示出根据本发明实施例的人脸关键点定位方法中使用的训练集的分类的示意图；

图3示出根据本发明实施例的人脸关键点定位方法所使用的平均关键点位置和定位结果的示意图；

图4是示出根据本发明实施例的人脸关键点定位方法所使用的分类器的正样本图像块和负样本图像块的示意图；

图5是示出根据本发明实施例的人脸关键点定位装置的框图；

图6是示出根据本发明另一实施例的人脸关键点定位装置的框图。

图7示出使用现有技术的人脸关键点定位方法和根据本发明实施例的人脸关键点定位方法在相同时间内对人脸关键点进行检测的结果。

具体实施方式

下面提供参照附图进行的描述以有助于全面理解如权利要求及其等同物所限定的本发明的示例性实施例。在所述描述中，除非明确指明，否则相同的变量具有相同的定义。所述描述包括各种详细的细节以有助于理解，而这些描述将被认为仅为示例性的。因此，本领域的普通技术人员将意识到在不脱离本发明的范围和精神的情况下可做出在此描述的各种改变和变型。另外，为了清晰和简洁，可省略对公知功能和构造的描述。

图1是示出根据本发明实施例的人脸关键点定位方法的流程图。

首先，在步骤S101，使用训练的多个定位模型在输入的人脸图像上得到多个定位结果。每一个定位结果都包括多个人脸关键点位置。例如，人脸关键点的位置可包括眼角、眉毛的末端、嘴角、鼻尖的位置。

这里，假设采用了K（K≥1）个定位模型A₁～A_k。这K个定位模型的集合被表示为A。将输入的人脸图像与K个定位模型对齐，用（x,y）表示像素在图像上的位置，从而得到的K个定位结果，分别表示为s₁,s₂,…,s_K，每个定位结果s中具有L个人脸关键点位置，因此，s可表示为：

s={x₁,y₁,x₂,y₂,…,x_L,y_L}；

根据本发明，可通过在训练集C(C₁～C_K)上训练得到定位模型A。每一个训练集C_k是具有大量人脸图片样本的集合，训练集C_k中的每一张人脸图片样本I_i上人工标定了L个关键点位置，

即，s_i={x_i1,y_i1,x_i2,y_i2,…,x_iL,y_iL,}；

这里，训练集C1～CK中的人脸图片样本可根据姿态、表情、年龄、人种、身份等因素被分类为不同类型。这样，可以根据不同的类型来训练得到定位模型A。如图2所示，一般类型的下面可以划分出戴滑雪眼镜的类型、黑人类型、亚洲女性类型，而黑人类型下可进一步划分出身份为“Kobe”这一特定的类型。这样，根据本发明的定位模型可根据不同类型的训练集中的人脸图像来训练得到包括多个定位模型A₁～A_K。

在训练定位模型A时，首先统计训练集C中全部样本关键点位置的平均值s⁰，称为平均关键点位置。|C|表示训练集C中样本的数量，则可通过以下的公式来得到平均关键点位置s⁰：

s^{0} = \frac{1}{| C |} \underset{S_{i} &Element; C}{Σ} S_{i}

对于训练集C中每一张人脸图片样本I_i，将平均关键点位置s⁰放置在图像中间，然后提取平均关键点位置s⁰的各个关键点位置的尺度不变特征变换(SIFT)特征，将提取的SIFT特征拼接成特征向量f_i。这样，可以根据训练集C中的全部样本图片建立一个回归模型，使得

f_i·A=s_i-s⁰

在以上等式中的A即表示从训练集C中训练得到的定位模型。

接下来，对于一张输入的待定位的人脸图像，首先将平均关键点位置s⁰放置在该输入图像的中间，然后提取s⁰各个关键点位置的SIFT特征拼接得到特征向量f。这样，可通过以下等式得到包括K个定位结果的定位结果集合s：

s=s⁰+f·A

通过以上方式，即可从训练的多个定位模型得到关于输入图像的关键点位置的多个定位结果。

图3示出了根据本发明实施例的人脸关键点定位方法所使用的平均关键点位置和定位结果的示意图。如图3所示，左边的图表示的是训练集C的全部样本图片的关键点位置的平均值s⁰。其中的叉号表示各个关键点。图3的右边的图示出的是定位结果。在定位结果中，关键点的位置与图片中人脸关键点的实际位置重合。

接下来，在步骤S103，对得到的多个定位结果进行评价，以从中选择出最优的定位结果。在本发明中，可使用训练的针对关键点的分类器来对多个定位结果进行评价，从而得到最优的定位结果。

具体地，如上所述，训练集C中的人脸图片样本I_i上通过人工标定了L个关键点的位置s_i={x_i1,y_i1,x_i2,y_i2,…,x_iL,y_iL,}。可针对每一个关键点训练一个Boost分类器，从而可得到L个分类器h₁,h₂,…h_L。这L个分类器可形成评价模型E。

在训练分类器时，可使用训练集C的人脸图像中距离关键点位置较近的图像块(例如，图像块的中心位置与关键点位置的距离在第一预定距离以内)作为正样本，并使用距离关键点位置较远(例如，图像块的中心位置与关键点位置的距离超过第二预定距离)的图像块作为负样本来训练关键点分类器。

图4是示出根据本发明实施例的人脸关键点定位方法所使用的分类器的正样本和负样本的示意图。如图4所示，针对左眼的左眼角的关键点的分类器，图4中左边的图中由方框所表示的图像块可用作训练分类器的正样本，而图4中右边的图中的方框所表示的图像块可用作训练分类器的负样本。具体地，每一个关键点分类器h_j可包括一系列选择器h^sel。例如，每个选择器h^sel可选择一弱Haar分类器h^w来评价输入的图像块。这样每个关键点的分类器的输出为所有的选择器的加权和：

h_{j} (x) = \underset{n}{Σ} α_{n} h_{n}^{sel} (x)

这里，α_n表示加权值，x表示图像块。利用训练集C中的正样本图像块和负样本图像块来训练分类器，从而得到可用于对关键点位置评分的分类器。在对步骤S101得到的关键点定位结果s_i进行评价时，将以各个关键点位置(x_j,y_j)为中心的预定大小的图像块分别输入到对应的关键点分类器h_j，从而得到一个评分h_j(x_j,y_j)。由此可得到全部关键点分类器针对此关键点定位结果的s_j评分，然后得到该定位结果的平均评分：

score (s_{k}) = \frac{1}{L} Σ_{j = 1}^{L} h_{j} (x_{kj}, y_{kj})

这样，可以得到K个定位结果s₁,s₂,…,s_K中的每个定位结果的评分，并从中选择最优的定位结果s^*，即，评分最高的定位结果，作为最终的人脸关键点位置的定位结果。

应理解，以上只是对定位结果进行评分的一种示例。可采用任何其它的现有的评分技术来对定位模型得到的定位结果进行评分。

根据本发明的优选实施例，在得到最优的定位结果之后，还可包括更新评价模型和定位模型的步骤。

继续参照图1，如果在步骤S105确定在步骤S103得到的最优定位结果s^*的评分超过预定阈值T，则在步骤S107，利用该定位结果更新评价模型和/或定位模型。

具体地，在更新评价模型时，可将与定位结果s^*对应的输入图像加入到训练集C中，利用定位结果s^*的L个关键点位置生成预定数量的正样本图像块和负样本图像块，然后利用生成的正样本图像块和负样本图像块来训练L个关键点的分类器h₁,h₂,…h_L，从而可更新评价模型E。例如，根据本发明的实施例，可使用在线AdaBoost方法来训练关键点分类器h₁,h₂,…h_L。

另外，在更新定位模型时，当在步骤S105确定存在评分超过预定阈值的新的定位结果s*时，确定与定位结果s*对应的定位模型的类型。具体地，可基于与定位结果s*对应的SIFT特征向量f，利用在线K均值方法查找s*所属的类型。如果确定s*属于当前已有的K个定位模型中的某一类A_k，则将其加入与A_k对应的训练集C_k，并基于前面所述的训练定位模型的方法重新训练定位模型A_k，从而更新定位模型A_k。

如果确定s*不属于当前已有的K类的定位模型中的某一类，则新建一个对应的训练集C_K+1。当新增训练集C_K+1中的样本数量超过一门限时，使用其训练新的定位模型A_K+1。这样，可从原有的K个定位模型增加到K+1个定位模型，在增加定位模型之后，定位结果从原来的K个增加为K+1个

具体地，在训练集C中新增样本s*后，可根据以下的方式来更新相应的定位模型A。

以下，用F来表示为训练集C中的样本图片的全部样本特征向量f组成的矩阵，F的第i行表示第i个样本的特征向量；用S表示训练集C中全部样本的人工标定的关键点位置组成的矩阵，S的第i行表示第i个样本的关键点位置；用S⁰表示训练集C中全部样本的平均关键点位置组成的矩阵，S⁰的第i行表示第i个样本的平均关键点位置。则在更新之前的原有定位模型A满足以下等式：

F·A=S-S⁰

这样，可以通过最小二乘方式求解A：

A=(F^TF)^-1·F·(S-S⁰)

其中协方差矩阵：

Cov_xx=F^TF，Cov_xy=F(S-S⁰)

Cov_xx和Cov_xy的第m行第n列的元素可以表示为：

{Cov}_{xx} (m, n) = \underset{S_{i} &Element; C}{Σ} f_{im} f_{in} (m, n),

{Cov}_{xy} (m, n) = \underset{S_{i} &Element; C}{Σ} f_{im} (s_{in} - s_{in}^{0})

其中f_im表示训练集C中第i样本的特征向量的第m维的值；s_in表示训练集C中第i样本的人工标定的关键点位置的第n维的值；表示训练集C中第i个样本的平均关键点位置的第n维的值。

当新增样本s^*时，可如以下的等式所示更新协方差矩阵的元素：

{Cov}_{xx} (m, n) = \underset{S_{i} &Element; C}{Σ} f_{im} f_{in} + f_{m}^{*} f_{n}^{*},

{Cov}_{xx} (m, n) = \underset{S_{i} &Element; C}{Σ} f_{im} (s_{in} - s_{in}^{0}) + f_{m}^{*} (s_{n}^{*} - s_{n}^{* 0})

其中，表示新增样本的特征向量的第m维的值；表示新增样本的人工标定的关键点的第n维的值；表示新增样本的平均关键点位置的第n维的值。

下面将参照图5来说明根据本发明实施例的人脸关键点定位装置500。

如图5所示，人脸关键点定位装置500包括关键点定位单元510和评价单元520。

关键点定位单元510使用基于多个类型的训练集训练得到的多个人脸定位模型对输入图像中的人脸进行定位，以得到与各个人脸定位模型对应的多个定位结果。多个人脸定位模型中的每一个分别与训练集中的不同类型的训练集对应。具体地，训练人脸定位模型的方式已经参照上述的说明进行了描述，因此将不再重复。

评价单元520使用训练的评价模型对关键点定位单元510得到的所述多个定位结果进行评价以选出最优的定位结果。具体地，评价单元520使用的评价模型由针对人脸图像中的多个关键点训练的分类器组成，每个关键点的分类器可对关键点定位结果中的对应的关键点位置进行评分。在训练分类器时，可使用训练集的人脸图像中距离关键点位置较近的图像块(例如，图像块的中心位置与关键点位置的距离在第一预定距离以内)作为正样本，并使用距离关键点位置较远(例如，图像块的中心位置与关键点位置的距离超过第二预定距离)的图像块作为负样本来训练关键点分类器。

图6是示出根据本发明第二实施例的人脸关键点定位装置600的示意图。如图6所示，人脸关键点定位装置600可包括：关键点定位单元610、评价单元620和更新单元630。

关键点定位单元610和评价单元620执行的操作与图5的关键点定位单元510和评价单元520的操作相同，因此将不再重复。

更新单元630可基于评价单元620得到的最优的定位结果来更新评价单元620所使用的评价模型。

具体地，如果更新单元630确定评价单元620得到的最优的定位结果的评分超过预定阈值，则基于该最优的定位结果来更新评价模型。具体地，在更新评价模型时，更新单元630可将与最优的定位结果对应的输入图像加入到训练集中，根据该最优的定位结果的多个关键点位置生成预定数量的正样本图像块和负样本图像块，然后利用生成的正样本图像块和负样本图像块来训练评价模型中的分类器，从而更新评价模型。

更新单元630还可基于评价单元620得到的最优的定位结果来更新关键点定位单元610所使用的定位模型。

具体地，当评价单元620确定存在评分超过预定阈值的新的定位结果s*时，更新单元630确定与定位结果s*对应的定位模型。更新单元630可基于SIFT特征向量f，利用在线K均值方法查找s*所属的类型。如果确定s*属于当前已有的K个定位模型中的某一个A_k，则将其加入与该定位模型A_k对应的训练集C_k，并基于前面所述的训练定位模型的方法更新定位模型A_k。

如果确定s*不属于当前已有的K类的定位模型中的某一类，则更新单元630新建一个对应的训练集C_K+1。当新增的训练集C_K+1中的样本数量超过预定值时，更新单元630使用该新的训练集来训练新的定位模型A_K+1。上面已经具体地示出了使用新的定位结果更新定位模型A的方式，因此，在这里将不再详细描述。

应理解，本发明的关键点定位装置的各个单元可以进一步划分为更多的单元或者合并为更少的单元。

本发明的人脸关键点定位方法使用多个定位模型，能够在姿态、表情、光照等因素影响下获得稳定的定位结果。此外，本发明还能够从多个定位结果中选择出最优定位结果，同时输出一个描述定位可信度的评分，该评分在后续环节（例如人脸认证）中可以被有效利用。本发明的定位模型和评价模型都可以根据输入在线更新，使得各个模型最大程度适应用户使用习惯，在保证效果的同时节省计算时间和存储空间。

图7中显示了三组使用现有技术的人脸关键点定位方法和本发明实施例的人脸关键点定位方法在相同时间内对人脸关键点进行检测的结果。其中，每组左侧的两幅图都是使用现有技术完成的定位结果，右侧的两幅图是使用本发明方法完成的定位结果。通过图7的结果可以确定，在相同的操作时间内，本发明的方法能够更准确地完成人脸关键点定位。因此，本发明的人脸关键点定位方法和装置更为稳定和高效。

根据本发明的方法可被记录在包括执行由计算机实现的各种操作的程序指令的计算机可读介质中。介质也可以只包括程序指令或者包括与程序指令相结合的数据文件、数据结构等。计算机可读介质的例子包括磁介质(例如硬盘、软盘和磁带)；光学介质(例如CD-ROM和DVD)；磁光介质(例如，光盘)；以及特别配制用于存储并执行程序指令的硬件装置(例如，只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。介质也可以是包括传输规定程序指令、数据结构等的信号的载波的传输介质(例如光学线或金属线、波导等)。程序指令的例子包括例如由编译器产生的机器码和包含可使用解释器由计算机执行的高级代码的文件。

尽管已经参照本发明的示例性实施例具体显示和描述了本发明，但是本领域的技术人员应该理解，在不脱离由权利要求限定的本发明的精神和范围的情况下，可以对其进行形式和细节上的各种改变。

Claims

1.一种用于人脸关键点位置的定位方法，包括：

使用基于多个类型的训练集训练得到的多个人脸定位模型对输入图像中的人脸进行定位，以得到与各个人脸定位模型对应的多个定位结果；

使用训练的评价模型对所述多个定位结果进行评价以选出最优的定位结果，

其中，定位结果包括人脸图像的多个关键点位置，评价模型由针对所述多个关键点位置训练的分类器组成。

2.如权利要求1所述的定位方法，其中，所述多个人脸定位模型分别与所述多个训练集的类型一一对应。

3.如权利要求1所述的定位方法，还包括：

确定所述最优的定位结果的评价是否超过预定阈值；

如果确定所述最优的定位结果的评价超过预定阈值，则基于最优的定位结果更新评价模型和/或定位模型。

4.如权利要求3所述的定位方法，其中，基于最优的定位结果更新评价模型的步骤包括：

基于所述最优的定位结果的关键点位置在输入图像中生成预定数量的正样本图像块和负样本图像块，然后使用生成的正样本图像块和负样本图像块来训练并更新评价模型。

5.如权利要求3或4所述的定位方法，其中，基于最优的定位结果更新定位模型的步骤包括：

确定所述最优的定位结果的类型是否属于所述多个定位模型之一；

如果确定所述最优的定位结果的类型属于所述多个定位模型之一，则将与所述最优的定位结果对应的输入图像加入对应的训练集，以重新训练与该训练集对应的定位模型；

如果确定所述最优的定位结果的类型不属于所述多个定位模型之一，则将与所述最优的定位结果对应的输入图像作为样本来创建与所述最优的定位结果的类型对应的新的训练集。

6.如权利要求5所述的定位方法，还包括：

如果所述新的训练集中的样本数量超过预定值，则基于所述新的训练集训练新的定位模型，从而增加定位模型的数量。

7.一种用于人脸关键点定位的装置，包括：

关键点定位单元，使用基于多个类型的训练集训练得到的多个人脸定位模型对输入图像中的人脸进行定位，以得到与各个人脸定位模型对应的多个定位结果；

评价单元，使用基于训练集训练的评价模型对所述多个定位结果进行评价以选出最优的定位结果，

8.如权利要求7所述的装置，其中，所述多个人脸定位模型分别与所述多个训练集的类型一一对应。

9.如权利要求7所述的装置，还包括：

更新单元，确定所述最优的定位结果的评价是否超过预定阈值，如果确定所述最优的定位结果的评价超过预定阈值，则基于最优的定位结果更新评价模型和/或定位模型。

10.如权利要求9所述的装置，其中，更新单元基于所述最优的定位结果的关键点位置在输入图像中生成预定数量的正样本图像块和负样本图像块，然后使用生成的正样本图像块和负样本图像块来训练并更新评价模型。

11.如权利要求9或10所述的装置，其中，更新单元确定所述最优的定位结果的类型是否属于所述多个定位模型之一，如果确定所述最优的定位结果的类型属于所述多个定位模型之一，则将与所述最优的定位结果对应的输入图像加入对应的训练集，以重新训练与该训练集对应的定位模型；

如果更新单元确定所述最优的定位结果的类型不属于所述多个定位模型之一，则将与所述最优的定位结果对应的输入图像作为样本来创建与所述最优的定位结果的类型对应的新的训练集。

12.如权利要求11所述的装置，其中，如果更新单元确定所述新的训练集中的样本数量超过预定值，则基于所述新的训练集训练新的定位模型，从而增加定位模型的数量。