CN103294716A

CN103294716A - 用于分类器的在线半监督学习方法和装置及处理设备

Info

Publication number: CN103294716A
Application number: CN2012100495378A
Authority: CN
Inventors: 姜涌; 江龙; 胥立丰
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2012-02-29
Filing date: 2012-02-29
Publication date: 2013-09-11
Anticipated expiration: 2032-02-29
Also published as: JP2013182621A; JP5570629B2; US9147169B2; CN103294716B; US20130223727A1

Abstract

本发明涉及用于分类器的在线半监督学习方法和装置及处理设备。公开了一种用于分类器的在线半监督学习的方法，所述分类器使用多个现有的支撑向量，所述方法包括：候选样本选择步骤，使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本；新支撑向量选择步骤，使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量；支撑向量替换步骤，通过所述新的支撑向量替换分类器的一些支撑向量；以及权重更新步骤，更新分类器中所有支撑向量的权重。

Description

用于分类器的在线半监督学习方法和装置及处理设备

技术领域

本发明涉及机器学习和模式识别，具体来说，涉及用于分类器的在线半监督学习方法和装置。

背景技术

在对象检测和跟踪领域，在过去的几十年中广泛地采用单类分类方法。如在Moya，M.and Hush，D.(1996).“Network constraints andmulti-objective optimization for one-class classification”.NeuralNetworks，9(3)：463-474.doi：10.1016/0893-6080(95)00120-4中所述，在单类分类方法中，通过根据仅仅包含一类对象的训练集合进行学习，而尝试将该类对象与所有其它可能的对象区分开。

支撑向量数据描述(support vector data description，SVDD)法是用于单类分类方法的有效的核心方法。如D.Tax and R.Duin，“Support vector domain description”.Pattern Recognit.Lett.，vol.20，pp.1191-1199，November1999中所述，SVDD法旨在找到一个最小体积的球面(也称为最小球面)，使得所有或者大部分目标训练样本被该球面所包围。在图1中示出了SVDD法的示意图。在所述最小球面上的点称为支撑向量(support vector)，其用于表征包围训练样本的最小球面。

由于SVDD法良好的学习能力和归纳性能，近来SVDD法已在多种应用中成功使用。SVDD法的性能和精度依赖于代表性的训练样本数据集的可获得性。但是，在例如视频监测、图像检索的一些在线应用中，由于在初始状态下没有足够的训练样本，因此SVDD法可能失败。

为了解决上述问题，在本技术领域中引入了在线学习技术。在在线学习技术中，首先通过一个或几个样本学习一个分类器，然后伴随着系统的执行过程更新该分类器。因为在线学习技术具有极好的自适应性并且该技术只需要有限的存储器容量，因此其获得了巨大的成功。在线SVDD法和增量SVDD法是目前广泛地应用于实时对象检测的两种技术，这两种方法均为基于支撑向量法的在线学习方法。

在D.M.J.Tax and P.Laskov，“Online SVM learning：fromclassification to data description and back，”In C.et al.Molina，editor，Proc.NNSP，2003，pp.499-508中对在线SVDD法进行了描述。图2(a)示出了在线SVDD法的简要流程图。首先，获取原有的基于SVDD的分类器以及新添加的标记样本，即正样本。所谓的正样本是指判断为属于要分的类的样本。然后，通过分类器计算各个样本的相关性。接着，从针对原有分类器的先前训练样本集中选择最不相关的样本。接着，基于新添加的正样本增加新样本并去除最不相关的样本。最后，使用保留的样本以及新样本对分类器进行重新学习。

图2(b)示出了在线SVDD法的示意图。从图2(b)中可以看出，在分类器的更新过程中，原有样本集中的样本被新增加的样本所替代，并且关于分类器的超球面在更新过程中不断增大。

在Xiaopeng Hua，Shifei Ding，“Incremental Learning Algorithmfor Support Vector Data Description”，JOURNAL OF SOFTWARE，VOL.6，NO.7，JULY 2011中对增量SVDD法进行了描述，其中在新的样本增加到训练样本集之后通过分析支撑向量集的可能的变化对分类器进行SVDD增量学习。图3(a)示出了增量SVDD法的简要流程图。首先，获取原有的基于SVDD的分类器以及新添加的标记样本，即正样本。然后，将原有的训练样本集划分为支撑向量集以及非支撑向量集。接着，验证是否存在位于原有分类器的超球面之外的新增加的样本；如果存在，则将这些样本添加到训练样本集中。接下来，在非支撑向量集中寻找最可能成为新的支撑向量的样本。最后，使用原有分类器的超球面之外的新增加的样本、在非支撑向量集中最可能成为新的支撑向量的样本以及支撑向量集对分类器进行重新学习。

图3(b)示出了增量SVDD法的示意图。从图3(b)中可以看出，在分类器的更新过程中，基于原有分类器的超球面之外的新增加的样本、在非支撑向量集中最可能成为新的支撑向量的样本以及原有支撑向量集更新分类器，并且关于分类器的超球面在更新过程中不断增大。

从图2(a)和图2(b)中可以看出：当训练样本的多样性小时，通过学习获得的超球面较小，即当分类器通过较小的训练样本集进行训练时，通过学习获得的分类器的阈值较小。当训练样本的多样性增加时，通过学习获得的超球面扩大，即当新样本增加时，通过学习获得的分类器的阈值增大。

也就是说，随着训练样本数量的增加，用于分类器的超球面将不断扩大，因此通过学习获得的分类器将是不稳定的。另外，如果新添加的样本是错误标记的样本(这种情况通常在分类器的自动判定过程中发生)，通过学习获得的分类器的性能将越来越差。因此，在线SVDD法和增量SVDD法需要样本预先被正确地标记(正或负)，以便相对于较长的运行时间保持分类器的性能稳定。

因此，需要提出一种新的技术来解决上述现有技术中的任何问题。

发明内容

在本发明中，提供了一种基于支撑向量的新颖的用于分类器的在线半监督学习方法和装置，从而成功地解决了上述问题。

根据本发明的第一方面，提供了一种用于分类器的在线半监督学习的方法，所述分类器使用多个现有的支撑向量，所述方法包括：候选样本选择步骤，使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本；新支撑向量选择步骤，使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量；支撑向量替换步骤，通过所述新的支撑向量替换分类器的一些支撑向量；以及权重更新步骤，更新分类器中所有支撑向量的权重。

根据本发明的另一方面，提供了一种用于分类器的在线半监督学习的装置，所述分类器使用多个现有的支撑向量，所述装置包括：候选样本选择单元，使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本；新支撑向量选择单元，使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量；支撑向量替换单元，通过所述新的支撑向量替换分类器的一些支撑向量；以及权重更新单元，更新分类器中所有支撑向量的权重。

根据本发明的又一方面，提供了一种处理设备，所述处理设备包括分类器，所述分类器使用多个现有的支撑向量，所述处理设备包括：接收单元，接收新添加的未标记样本；候选样本选择单元，使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本；新支撑向量选择单元，使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量；支撑向量替换单元，通过所述新的支撑向量替换分类器的一些支撑向量；以及权重更新单元，更新分类器中所有支撑向量的权重。

根据本发明的又一方面，提供一种用户注册对象检测方法，包括：接收要检测的对象；调用分类器，所述分类器包括根据用户注册对象产生的多个现有的支撑向量；基于分类器识别所述要检测的对象；以及使用根据上述用于分类器的半监督学习方法更新分类器。

根据本发明的又一方面，提供一种用户注册对象检测系统，包括：对象接收单元，接收要检测的对象；对象识别单元，基于分类器识别所述要检测的对象，所述分类器包括根据用户注册对象产生的多个现有的支撑向量；以及上述用于分类器的在线半监督学习的装置，其用于更新分类器。

本发明的一个优点在于：通过本发明，可以解决现有技术中分类器性能不稳定的问题，并且可以实现快速的计算。

本发明的另一优点在于：通过本发明，利用不断地添加未标记样本，可以改进通过学习而获得的分类器的性能。通过本发明，不仅确保了学习的准确性，而且减少了空间和时间的复杂性。

本发明的又一优点在于：通过本发明能够将虚检率稳定地控制在较低的水平，而且避免分类器陷入过训练。

此外，通过本发明，分类器能够进行快速的学习和更新，从而能够成为用于跟踪数字产品的解决方案。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

构成说明书的一部分的附图描述了本发明的实施例，并且连同说明书一起用于解释本发明的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本发明，其中：

图1是示出现有技术中的SVDD法的示意图。

图2是示出现有技术中的在线SVDD法的示意图，其中(a)为在线SVDD法的示意流程图，(b)为在线SVDD法的原理示意图。

图3是示出现有技术中的增量SVDD法的示意图，其中(a)为增量SVDD法的示意流程图，(b)为增量SVDD法的原理示意图。

图4示出了根据本发明的用于分类器的在线半监督学习方法的原理图。

图5示出了根据本发明的实施方式用于分类器的在线半监督学习方法的总体流程图。

图6示出了根据本发明的实施方式的用于选择候选样本的处理的详细流程图。

图7示出了根据本发明的实施方式，在计算任意样本到支撑向量的中心时f_min、

f_max的关系图。

图8示出了根据本发明的实施方式的用于阈值设置的原理图。

图9示出了根据本发明的实施方式的用于选择新支撑向量的处理的详细流程图。

图10示出了根据本发明的实施方式的用于更新支撑向量的处理的详细流程图。

图11示出了根据本发明的实施方式的用于分类器的在线半监督学习的装置的功能框图。

图12示出了根据本发明的实施方式的处理设备的功能框图。

图13示出了根据本发明的实施方式的用户注册对象检测方法的流程图。

图14示出了根据本发明的实施方式的用户注册对象检测系统的功能框图。

图15是示出能够实施本发明的实施方式的计算机系统的硬件配置的框图。

图16示出了对于三段视频，根据本发明的方法、在线SVDD法和增量SVDD法的检测率和虚检率的比较图表。

图17示出根据本发明的方法以及其它三种现有技术方法在跟踪应用中的平均错误率的图表。

图18示出了根据本发明的方法以及其它三种现有技术方法在跟踪应用中的示例结果。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本发明旨在提供一种用于分类器的在线半监督学习方法。与现有技术中的方法不同，本发明所针对的样本是未标记的，即未确定为正样本的样本。

图4示出了根据本发明的实施方式的用于分类器的在线半监督学习方法的原理图。如图4所示，图4中的内圆(即，最小的圆)示出了现有的分类器的用于分类的初始的超球面。该初始超球面是根据原有的样本生成的，并且原有的支撑向量限定其边界。通过该初始超球面可以区分支撑向量和非支撑向量。图4中的外圆(即最大的圆)为所有样本所处的最大可能空间的最大超球面。在本发明中，希望在初始超球面和最大超球面之间确定一个判定超球面，使得任意正样本落在所述判定超球面内的概率稳定。通过对任意正样本落在所述判定超球面内的概率进行设定，可以改变该判定超球面的大小。通过该判定超球面，可以确定所添加的未标记样本是否为正样本。

如图4中所示，当新添加的未标记样本落在最大超球面与判定超球面之间时，判定该样本不是正样本，并且保持当前的分类器不变。当新添加的未标记样本落在初始超球面之内时，判定这些样本是正样本，但它们不会改变现有的支撑向量集，并且保持当前的分类器不变。当新添加的未标记样本位于初始超球面和判定超球面之间时，判定这些样本是正样本，并且它们将改变现有的支撑向量集。

换言之，在根据本发明的用于分类器的在线半监督学习方法中，仅仅使用本位于初始超球面和判定超球面之间的样本来更新现有的分类器。通过本发明的方法，可以解决现有技术中分类器性能不稳定的问题，并且可以实现快速的计算。利用不断地添加未标记样本，可以改进通过学习而获得的分类器的性能。通过本发明，不仅确保了学习的准确性，而且减少了空间和时间的复杂性。

图5示出了根据本发明的实施方式的用于分类器的在线半监督学习方法的总体流程图。如图5所示，希望通过新添加的未标记样本对现有的分类器进行学习，以获得新的分类器。首先在步骤10中，使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本。

图6示出了根据本发明的实施方式的用于选择候选样本的处理的详细流程图。首先，在步骤110中，估计任意样本与所有支撑向量的中心的最大距离，即根据现有分类器的支撑向量(特征空间中的支撑向量)生成可能的最大超球面。

采用如前所述的支撑向量数据描述(SVDD)算法生成可能的最大超球面，即确定相对于超球面的中心a的最大半径R_max。绝大部分或者所有训练样本都被包括在该最大超球面中。利用下面的公式(1)构建该超球面：

minR²+C∑_iξ_i 条件是||x_i-a||²≤R²+ξ_i且ξ_i≥0 (1)

其中，x_i为支撑向量，C是惩罚因子，ξ_i是松弛误差。

对公式(1)应用拉哥朗日(Lagrangian)乘子，可以得到下面的对偶问题：

min∑_i，jα_iα_jK(x_i·x_j)-∑_iα_iK(x_i·x_i)条件是0≤α_i≤C且∑_iα_i＝1 (2)

其中，K(·)是核函数，而且该函数值为非负。在本文中，核函数K(·)被选择为针对特征空间中的任意归一化特征向量z是恒定的，即K(z，z)是固定的。

在一个实施例中，可以选择直方图交叉核(HIK)函数(例如参见A simple guide to libHIK.http://c2inet.sce.ntu.edu.sg/Jianxin/projects/libHIK/libHIK_v2.pdf)：

K_{HI} (T, Q) = Σ_{i = 1}^{N} \min (T_{i}, Q_{i}) - - - (3)

其中，T和Q是两个特征的直方图，N是直方图维数。

需要注意的是，尽管在本实施例中以公式(3)给出的HIK函数为例进行了说明，但是本领域技术人员应当理解，还可以选择其它核函数，例如Hellinger’s核函数和Jensen-Shannon核函数。

求解公式(2)的对偶优化问题，可以得到支撑向量x_i∈SVs和对应的权重α_i。

利用上述SVDD方法求得的支撑向量x_i和权重α_i，我们就可以计算最大超球面半径R_max。对于给定的未标记样本，根据其生成归一化的特征向量z，其到超球面中心的距离计算如下：

f (z) = R_{z}^{2} = K (z, z) - 2 \underset{x_{i} &Element; SVs}{Σ} α_{i} K (x_{i}, z) + \underset{x_{i} &Element; SVs}{Σ} \underset{x_{j} &Element; SVs}{Σ} α_{i} α_{j} K (x_{i}, x_{j}) - - - (4)

如果

则特征向量z就位于该超球面内，并被分类为目标对象类。因此，将超球面半径的平方，即R²，定义为分类器阈值。

根据公式(4)，对于基于未标记的样本生成的特征向量z，可以计算其与超球面的中心的距离。该距离小于或等于超球面的半径，即

f (z) = {R_{z}}^{2} = K (z, z) - 2 \underset{x_{i} &Element; SVs}{Σ} α_{i} K (x_{i}, z) + \underset{x_{i} &Element; SVs}{Σ} \underset{x_{j} &Element; SVs}{Σ} α_{i} α_{j} K (x_{i}, x_{j}) \leq R^{2} - - - (4 a)

在这里，我们并不是要找出支撑向量的中心的位置，而仅仅是要确定未标记样本的特征向量到该中心的距离。

为了求解最大超球面半径R_max，根据上面的公式(4)，我们得到：

f_{\max} = R_{\max}^{2} = \max (f (z))

(5)

= K (z, z) - 2 \min (\underset{x_{i} &Element; SVs}{Σ} a_{i} K (x_{i}, z)) + \underset{x_{i} &Element; SVs}{Σ} \underset{x_{j} &Element; SVs}{Σ} a_{i} a_{j} K (x_{i}, x_{j})

如前所述，针对任意归一化特征向量z，K(z，z)是固定的。在根据公式(2)计算得出支撑向量x_i∈SVs和对应的权重α_i的情况下，

是固定值。因此，求解f_max的关键在于求得

的最小值。如前所述，核函数K(·)非负，因而

故而，公式(5)简化为：

f_{\max} = R_{\max}^{2} = K (z, z) + \underset{x_{i} &Element; SVs}{Σ} \underset{x_{j} &Element; SVs}{Σ} α_{i} α_{j} K (x_{i}, x_{j}) - - - (6)

至此，上述公式(6)确定了最大超球面的半径R_max。由于K(·)是核函数，并且向量z已经被归一化，因此对于任意的z，K(z，z)都是固定的。如果所有的支撑向量都是固定的，则

也是固定的。因此，在支撑向量确定的情况下，对于任意的z，f_max都是固定的。

接着，参照图6中的步骤120，估计任意样本与所述中心的最小距离，即生成可能的最小超球面(确定最小距离f_min)。

根据上述公式(4)，最小距离f_min表示如下：

f_{\min} = R_{\min}^{2} = \min (f (z)) = K (z, z) - 2 \max (\underset{x_{i} &Element; SVs}{Σ} a_{i} K (x_{i}, z)) + \underset{x_{i} &Element; SVs}{Σ} \underset{x_{j} &Element; SVs}{Σ} a_{i} a_{j} K (x_{i}, x_{j})

= K (z, z) - 2 \min (\underset{x_{i} &Element; SVs}{Σ} a_{i} K (x_{i}, z)) + \underset{x_{i} &Element; SVs}{Σ} \underset{x_{j} &Element; SVs}{Σ} a_{i} a_{j} K (x_{i}, x_{j})

= f_{\max} - 2 \max (\underset{x_{i} &Element; SVs}{Σ} α_{i} K (x_{i}, z)) - - - (7)

如前所述，在所有支撑向量确定的情况下，针对任何归一化特征向量z，f_max是固定的。因此，求解f_min就转变为求解

的最大值。根据核函数的定义可知，

必然是一个特定值，但不会是正无穷大。

在本例中，选择HIK函数进行描述。为了加速计算，我们定义一个查找表lut：

lut = \underset{x_{i} &Element; SVs}{Σ} α_{i} K (x_{i}, z) = Σ_{j = 1}^{N} (Σ_{i = 1}^{M} α_{i} \min (x_{ij}, z_{j})) \leq Σ_{j = 1}^{N} Σ_{i = 1}^{M} α_{i} x_{ij} - - - (8)

其中，x_ij∈X_i，X_i∈SVs，M是支撑向量的个数，而N是特征向量的维数。

如上述(8)可知，

但是max(lut)不总是等于

下面将详细说明。当max(lut)可以取到

时，意味着在最小超球面内只有一个特征向量。这种情况下，我们将该特征向量确定为超球面的中心，并确定

图7示出了根据本发明的实施方式，在计算任意样本到支撑向量的中心中f_min、

f_max的关系图。参照图7，在最小超球面中的特征向量不是唯一的时，

在这种情况下，需要估计f_min，即，估计max(lut)。

在HIK核函数的示例中，针对第j维，定义如下：

H_{j} = Σ_{i = 1}^{M} α_{i} \min (x_{ij}, z_{j}), j = 1,2,3 . . . . . . N - - - (9)

定义H_j的平均值为

根据公式(8)，

因此，针对N维特征向量z_j来说，估计lut的最大值等同于估计lut的在N个维度上的平均值的最大值，即估计

下面采用统计学上的样本估计理论来估计

的范围。

根据中心极限定律，

在样本空间中的分布满足正态分布。因此，概率Φ_z是累积分布，具体地如下：

Φ_{z} = \frac{(Σ_{j = 1}^{N} H_{j}) / N}{(Σ_{j = 1}^{N} \max (H_{j})) / N} = \frac{Σ_{j = 1}^{N} Σ_{i = 1}^{M} α_{i} \min (x_{ij}, z_{j})}{Σ_{j = 1}^{N} Σ_{i = 1}^{M} α_{i} x_{ij}} - - - (10)

根据中心极限定律，

\max (lut) = N \max (\overset{&OverBar;}{h}) = N (μ + λ_{z} σ_{e}) - - - (11)

根据标准误

和

以及概率Φ_z，利用标准正态累积分布函数的查找表，可以求得λ_z，由此确定

的范围在[μ-λ_zσ_e，μ+λ_zσ_e]之间，最后可以确定

最后，将公式(11)的结果代入公式(7)中，我们可以估计得到f_min。

接下来，返回到图6，在步骤130中，利用在步骤120中计算的f_min和在步骤110中计算的f_max，生成判定超球面。

图8示出了根据本发明的实施方式的用于阈值设置的原理图。参见图8，在步骤410中，计算最大超球面的面积：

{πR}_{\max}^{2} = πK (z, z) + π \underset{x_{i} &Element; SVs}{Σ} \underset{x_{j} &Element; SVs}{Σ} a_{i} a_{j} K (x_{i}, x_{j}) - - - (12)

f(z)在[f_min，f_max]范围内是大体相同类型的分布。下面，假定参数P，即描述判定超球面与最大超球面的表面积之比的预定值，利用在步骤20中计算的R_min和在步骤10中计算的R_max，来生成判定超球面的半径R_T。参数P定义如下：

P＝(f_T(z)-f_min)/(f_max-f_min) (13)

根据公式(13)，可以确定判定超球面的半径R_T为：

f_{T} (z) = {Pf}_{\max} + (1 - P) f_{\min}

&DoubleRightArrow; {πR}_{T}^{2} = P {πR}_{\max}^{2} + (1 - P) {πR}_{\min}^{2} - - - (14)

&DoubleRightArrow; R_{T}^{2} = {PR}_{maz}^{2} + (1 - P) R_{\min}^{2}

根据上述公式(14)，我们针对一个特征向量z估计了一个适当的阈值，即f_T(z)。最后，针对所有的支撑向量X_i∈SVs来估计f_T：

f_{T} = Σ_{i = 1}^{M} α_{i} f_{T} (X_{i}) - - - (15)

f_T即为经训练分类器的阈值，无论训练样本有多少或怎样，都能够通过参数P将分类器的虚检率控制在稳定的水平下，即任何正特征向量落在所生成的判定超球面内的概率固定。即，通过参数P可以控制分类器的性能。

然后，如图6的步骤140所示，根据在图6的步骤130中所设置的阈值判断新添加的未标记样本是否为候选样本。对于新添加的未标记样本，可以从中提取归一化的特征向量z。通过前述公式(4)计算该特征向量z到现有分类器的支撑向量的中心的距离。将该距离与在图6的步骤130中所设置的阈值进行比较。

如果样本的特征向量z到中心的距离小于该阈值，则将该样本确定为候选样本；如果样本的特征向量z到中心的距离大于等于该阈值，则不将该样本确定为候选样本。

返回参看图5，在图5的步骤20，使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量。图9示出了根据本发明的用于选择新支撑向量的处理的详细流程图。

首先，在步骤210，根据原有分类器的多个现有的支撑向量绘制边界超球面。对于已知的分类器，最优解a*＝[a₁，a₂，…a_l]使得每个用于训练的支撑向量x_i满足如下的KKT(Karush-Kuhn-Tucker)条件：

\{\begin{matrix} a_{i} = 0 &DoubleRightArrow; d_{i}^{2} \leq R^{2} \\ 0 < a_{i} < C &DoubleRightArrow; d_{i}^{2} = R^{2} \\ a_{i} = C &DoubleRightArrow; d_{i}^{2} &GreaterEqual; R^{2} \end{matrix} - - - (16)

其中

是从x_i到支撑向量的中心的距离。因此通过支撑向量得到的边界超球面是具有半径R²的超球面。KKT条件为本领域技术人员所公知，因此不对其进行详细介绍。

接下来，在步骤220，根据步骤210中所得到的边界超球面确定所述候选样本是否为新的支撑向量。根据上述KKT条件，可以将候选样本，即目标训练数据分为三类：

1)在球面内的a_i＝0的数据点；

2)在球面边界上的0＜a_i＜C的数据点；

3)a_i＝C的落在球面之外并且具有非零ξ_i的数据点。

如图4所示，在最小超球面之内的候选样本将不会改变先前的特征向量集，并且保持原因的分类器不变。在边界超球面和关于阈值的判定超球面之间的候选样本将改变原有的支撑向量集。因此，如果候选样本在边界超球面之外，则将该候选样本选择为新的支撑向量。

返回参看图5，在图5的步骤30，通过所述新的支撑向量替换分类器的一些支撑向量。图10示出了根据本发明的用于更新支撑向量的处理的详细流程图。

在图10的步骤310中，将根据公式(4)计算每一个支撑向量到全部原有支撑向量中心的距离。所得到的结果是V＝(d₁，d₂，…d_n)。其中，d为距离，n为支撑向量的个数。

在步骤320中，对V＝(d₁，d₂，…d_n)中的距离d进行升序排序，得到V′＝(d₁′，d₂′，…d_n′)，其中d₁′是最近的距离，d_n′是最远的距离。然后，用新的支撑向量替换具有最近距离的向量，并保持支撑向量数恒定。例如，如果有三个新的支撑向量，则替换具有最近距离的三个原有的支撑向量。通过图10的操作，可以得到一组新的支撑向量。

返回参看图5，在图5的步骤40，更新分类器中所有支撑向量的权重。在John C.Platt，Sequential Minimal Optimization：A FastAlgorithm for Training Support Vector Machines.http://research.microsoft.com/pubs/69644/tr-98-14.pdf中公开了一种用于训练支撑向量机器的快速算法，即顺序最小优化(SMO)法。在Chih-Chung Chang and Chih-Jen Lin，LIBSVM：a library for supportvector machines，2001.Software available athttp://csie.ntu.edu.tw/～cjlin/libsvm中公开了用于支撑向量机器的库LIBSVM。SMO法将较大的二次编程(QP)优化问题分解成一系列最小可能的QP问题。这些小QP问题通过分析解决，这样避免了使用耗时的数字QP优化作为内部循环。LIBSVM是用于SVM的库，它是当前使用最为广泛的SVM软件之一。上述文献的全部内容通过引用包含于本文中。使用SMO法，利用LIBSVM库可以更新分类器中所有支撑向量的权重，即对分类器进行重新学习。

图11示出了根据本发明的实施方式的用于分类器的在线半监督学习的装置1000的功能框图。该装置1000的功能模块可以由实现本发明原理的硬件、软件或硬件和软件的结合来实现。本领域技术人员可以理解的是图11中所描述的功能模块可以组合起来或者划分成子模块，从而实现上述发明的原理。因此，本文的描述可以支持对本文描述的功能模块的任何可能的组合、或者划分、或者更进一步的限定。

如图11所示，根据一种实施方式，用于分类器的在线半监督学习的装置1000可包括：候选样本选择单元1100、新支撑向量选择单元1200、支撑向量替换单元1300以及权重更新单元1400。候选样本选择单元1100使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本。新支撑向量选择单元1200使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量。支撑向量替换单元1300通过所述新的支撑向量替换分类器的一些支撑向量。权重更新单元1400更新分类器中所有支撑向量的权重。

根据另一种实施方式，所述候选样本选择单元1100还可以包括：第一估计单元1110、1120、设置单元1130和第一确定单元1140。第一估计单元1110估计任意样本与所有支撑向量的中心的最大距离。第二估计单元1120估计任意样本与所述中心的最小距离。设置单元1130在所述最大距离和最小距离之间设置用以判定新添加的未标记样本是否为正样本的阈值。第一确定单元1140根据所述阈值确定新添加的未标记样本是否为候选样本。

优选地，所述阈值被设置成使得任意正样本落在所述阈值之内的概率固定。

根据另一种实施方式，所述新支撑向量选择单元1200还可以包括：绘制单元1220和第二确定单元1230。绘制单元1220根据所述多个现有的支撑向量绘制边界超球面。第二确定单元1230确定所述候选样本是否为新的支撑向量，其中如果候选样本在边界超球面之外，则将该候选样本选择为新的支撑向量；以及如果候选样本在边界超球面之内，则不将该候选样本选择为新的支撑向量。

根据另一种实施方式，所述支撑向量替换单元1300还可以包括：计算单元1310和替换单元1320。计算单元1310计算每一个支撑向量到所述中心的距离。替换单元1320用新的支撑向量替换具有最近距离的支持向量，并保持支撑向量数恒定。

优选地，在所述第一估计单元中使用支撑向量数据描述(SVDD)算法。

优选地，在所述第一估计单元和所述第二估计单元中使用核函数K(·)，其中所述核函数被选择成使得对于任意的归一化的向量z，K(z，z)都是恒定的。

优选地，所述核函数K(·)包括直方图交叉核(HIK)。

图12示出了根据本发明的实施方式的处理设备2000的功能框图。该处理设备2000的功能模块可以由实现本发明原理的硬件、软件或硬件和软件的结合来实现。本领域技术人员可以理解的是图12中所描述的功能模块可以组合起来或者划分成子模块，从而实现上述发明的原理。因此，本文的描述可以支持对本文描述的功能模块的任何可能的组合、或者划分、或者更进一步的限定。

如图12所示，根据一种实施方式，所述处理设备2000可包括：分类器2100、接收单元2200、候选样本选择单元1100、新支撑向量选择单元1200、支撑向量替换单元1300以及权重更新单元1400。所述分类器2100使用多个现有的支撑向量。接收单元2200接收新添加的未标记样本。候选样本选择单元1100使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本。新支撑向量选择单元1200使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量。支撑向量替换单元1300通过所述新的支撑向量替换分类器的一些支撑向量。权重更新单元1400更新分类器中所有支撑向量的权重。

优选地，所述核函数K(·)包括直方图交叉核(HIK)。

图13示出了根据本发明的实施方式的用户注册对象检测方法的流程图。如图13所示，在步骤3100接收要检测的对象。例如，所述要检测的对象可以是图像或视频。在步骤3200，调用现有的分类器，所述分类器包括根据用户注册的对象产生的多个现有的支撑向量。在步骤3300，基于分类器识别所述要检测的对象。基于分类器识别要检测的对象的处理是本领域技术人员所公知的，在此不再赘述。在步骤3400，使用根据本发明原理的用于分类器的半监督学习方法更新分类器。这样，在下次有新的对象输入时，可以使用更新后的分类器进行检测。

图14示出了根据本发明的实施方式的用户注册对象检测系统的功能框图。在图14中，用户注册对象检测系统4000，包括：对象接收单元4100、对象识别单元4200以及根据本发明原理的用于分类器的在线半监督学习的装置1000。对象接收单元4100接收要检测的对象。例如，所述要检测的对象可以是图像或视频。对象识别单元4200基于分类器识别所述要检测的对象，所述分类器包括根据用户注册的对象产生的多个现有的支撑向量。基于分类器识别要检测的对象的处理是本领域技术人员所公知的，在此不再赘述。根据本发明原理的用于分类器的在线半监督学习的装置1000更新分类器。这样，在下次有新的对象输入时，可以使用更新后的分类器进行检测。

图15是示出能够实施本发明的实施例的计算机系统5000的硬件配置的框图。

如图15中所示，计算机系统包括计算机5110。计算机5110包括经由系统总线5121连接的处理单元5120、系统存储器5130、固定非易失性存储器接口5140、可移动非易失性存储器接口5150、用户输入接口5160、网络接口5170、视频接口5190和输出外围接口5195。

系统存储器5130包括ROM(只读存储器)5131和RAM(随机存取存储器)5132。BIOS(基本输入输出系统)5133驻留在ROM 5131中。操作系统5134、应用程序5135、其它程序模块5136和某些程序数据5137驻留在RAM 5132中。

诸如硬盘之类的固定非易失性存储器5141连接到固定非易失性存储器接口5140。固定非易失性存储器5141例如可以存储操作系统5144、应用程序5145、其它程序模块5146和某些程序数据5147。

诸如软盘驱动器5151和CD-ROM驱动器5155之类的可移动非易失性存储器连接到可移动非易失性存储器接口5150。例如，软盘5152可以被插入到软盘驱动器5151中，以及CD(光盘)5156可以被插入到CD-ROM驱动器5155中。

诸如麦克风5161和键盘5162之类的输入设备被连接到用户输入接口5160。

计算机5110可以通过网络接口5170连接到远程计算机5180。例如，网络接口5170可以经由局域网5171连接到远程计算机5180。或者，网络接口5170可以连接到调制解调器(调制器-解调器)5172，以及调制解调器5172经由广域网5173连接到远程计算机5180。

远程计算机5180可以包括诸如硬盘之类的存储器5181，其存储远程应用程序5185。

视频接口5190连接到监视器5191。

输出外围接口5195连接到打印机5196和扬声器5197。

图15所示的计算机系统仅仅是说明性的并且决不意图对本发明、其应用或用途进行任何限制。

图15所示的计算机系统可以被实施于任何实施例，可作为独立计算机，或者也可作为设备中的处理系统，可以移除一个或更多个不必要的组件，也可以向其添加一个或更多个附加的组件。

下面给出通过利用根据本发明的原理的用于分类器的在线半监督学习方法与现有技术中的其它方法进行的试验对比的示例。特别指出，此处给出的示例仅仅是例示性的，用于示出本发明的有益效果，而绝非限制性的。

将根据本发明的在线半监督学习方法用于用户注册对象检测(UROD)系统中。由用户给出对于特定对象的一次拍摄样本。通过该给定样本获得用于检测用户注册对象的基于SVDD的分类器。在图像上设定窗口(窗口可具有不同的缩放比例)，并且在图像上滑动窗口，从而将每个这样的局部窗口分类为包含目标或背景。然而，使用检测到的对象更新分类器。用于图像区域描述的特征是颜色和局部三重图案(LTP)。然后通过更新后的检测器检测下一帧图像。

表1示出了进行试验的硬件和软件配置。

表1

评估例1

随机选择了包括不同动物的8种视频。这些视频是有手持式照相机所拍摄的。由于离焦或运动，这些视频中的很多帧是模糊的，而且视角的变化和目标的形变都非常大。此外，照明还频繁地变化。在评估中，评价标准选择PASCAL标准。PASCAL标准在M.Everingham，A.Zisserman，C.K.I.Williams，and L.Gool，“The PASCAL VisualObject Classes Challenge 2006(VOC2006)Results，”http://www.pascal-network.org/challenges/VOC/voc2006/results.pdf中描述。该文献的全部内容通过引用包含于此。当标记区域与检测区域的交集/标记区域与检测区域的并集＞T时，检测区域被认定为争取的检测区域，即检测区域为正样本。在本评估例中，将T选为0.5。将根据本发明的方法与在线SVDD法和增量SVDD法进行比较。比较结果在表2中示出。

UROD系统	总帧数	帧中的目标数	检测率	虚检率	速度(fps)
						在线SVDD	8827	4741	0.65	0.125	3.67
增量SVDD	8827	4741	0.90	0.109	2.52
						本发明	8827	4741	0.90	0.005	3.02

表2

如表2所示，当根据本发明的在线半监督检测法用于对象检测时，可以相对于在线SVDD法和增量SVDD法大大地降低虚检率，并且检测率高于在线SVDD法，且与增量SVDD法相当。此外，根据本发明的在线半监督检测法的检测速度要高于在线SVDD法。

评估例2

选择三段视频进行评估试验，在每段视频中具有一个对象。对于每个对象的视频，仅仅提供一个样本，并且针对该样本使用立体变换模拟出50个样本，使用这些样本进行训练。分别利用根据本发明的在线半监督检测法、在线SVDD法和增量SVDD法进行检测试验。在检测每一帧的对象后，计算所有帧的检测率和虚检率(FPPI)。

图16示出了对于三段视频，根据本发明的方法、在线SVDD法和增量SVDD法的检测率和虚检率的比较图表。在图16中，1指示根据本发明的在线半监督检测法，2指示在线SVDD法，3指示增量SVDD法。

从图16中可以看出，当新样本持续添加时，根据本发明的在线半监督检测法能够将检测率稳定地保持在较高的水平，并将虚检率稳定地保持在低水平。在线SVDD法和增量SVDD法无法将虚检率稳定地保持在较低的水平。

评估例3

下面研究根据本发明的方法在对象跟踪领域的应用。

在S.Stalder，H.Grabner，and L.Van Gool.Beyondsemi-supervised tracking.ICCV Workshop，2009中公开了超越半激励(beyond semi-boost)法，在A.Saffari，etc.On-line random forests.In Proc.On-line Learning for Computer Vision Workshop，2009中公开了在线随机森林(online Random Forest)法，在B.Babenko，M.H.Yang and S.Belongie.Visual Tracking with Online Multiple InstanceLearning.In CVPR，2009中公开了在线多实例学习(onelineMulti-Instance Learning)法。在本技术领域中，上述三种方法被用于对象跟踪中。在评估例3中，在对象跟踪方面，将根据本发明的方法与上述三种方法进行比较。

选取包括不同种类的动物的10个视频。这些视频是通过手持式摄像机拍摄的。由于这些视频中的很多帧因为离焦或运动而模糊，观察点的变化以及变形都非常多并且发生得很快，因此这些视频很难用于跟踪。

对于使用本发明的方法以及上述三种方法的系统，我们指定在第一帧中对象的大小和位置，并且截取该图像区域作为用于本发明的分类器的初始教导样本。

图17示出根据本发明的方法以及其它三种现有技术方法在跟踪应用中的平均错误率。所谓平均错误率是指在总帧数中累积的错误帧的比率。图18示出了根据本发明的方法以及其它三种现有技术方法在跟踪应用中示例结果。在图18中的方框即为在该帧所得到的跟踪对象。在图17和图18中，1指示根据本发明的方法的结果，2指示超越半激励法的结果，3指示在线随机森林法的结果，4指示在线多实例学习法的结果。

从图17和图18中可以看出，根据本发明的方法在跟踪性能方面优于其它在线跟踪方法，其可以解决跟踪中的漂移问题。

表3示出了根据本发明的方法与上述三种方法的计算时间的比较。

方法	初始化	更新	检测或跟踪
				本发明	0.15s	0.1s	0.2s/帧
超越半激励法	2s	0.3s	0.06s/帧
				在线随机森林法	0.03s	0.2s	0.2s/帧
在线多实例学习法	0.35s	0.2s	0.15s/帧

表3

从表3可以看出，通过根据本发明的方法进行检测、学习和更新的速度足以满足在线应用的要求。

可能以许多方式来实现本发明的方法和系统。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明，本发明的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本发明实施为记录在记录介质中的程序，这些程序包括用于实现根据本发明的方法的机器可读指令。因而，本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。

虽然已经通过示例对本发明的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本发明的范围。本领域的技术人员应该理解，可在不脱离本发明的范围和精神的情况下，对以上实施例进行修改。本发明的范围由所附权利要求来限定。

Claims

1.一种用于分类器的在线半监督学习的方法，所述分类器使用多个现有的支撑向量，所述方法包括：

候选样本选择步骤，使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本；

新支撑向量选择步骤，使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量；

支撑向量替换步骤，通过所述新的支撑向量替换分类器的一些支撑向量；以及

权重更新步骤，更新分类器中所有支撑向量的权重。

2.根据权利要求1所述的方法，其中所述候选样本选择步骤还包括：

估计任意样本与所有支撑向量的中心的最大距离；

估计任意样本与所述中心的最小距离；

在所述最大距离和最小距离之间设置用以判定新添加的未标记样本是否为正样本的阈值；以及

根据所述阈值确定新添加的未标记样本是否为候选样本。

3.根据权利要求1或2所述的方法，所述阈值被设置成使得任意正样本落在所述阈值之内的概率固定。

4.根据权利要求1或2所述的方法，所述新支撑向量选择步骤还包括：

根据所述多个现有的支撑向量绘制边界超球面；以及

确定所述候选样本是否为新的支撑向量，其中如果候选样本在边界超球面之外，则将该候选样本选择为新的支撑向量；以及如果候选样本在边界超球面之内，则不将该候选样本选择为新的支撑向量。

5.根据权利要求2所述的方法，其中所述支撑向量替换步骤还包括：

计算每一个支撑向量到所述中心的距离；以及

用新的支撑向量替换具有最近距离的支持向量，并保持支撑向量数恒定。

6.根据权利要求2所述的方法，其中在估计所述最大距离时使用支撑向量数据描述(SVDD)算法。

7.根据权利要求2所述的方法，其中在估计所述最大距离和所述最小距离时使用核函数K(·)，其中所述核函数被选择成使得对于任意的归一化的向量z，K(z，z)都是恒定的。

8.根据权利要求7所述的方法，其中所述核函数K(·)包括直方图交叉核(HIK)。

9.一种用于分类器的在线半监督学习的装置，所述分类器使用多个现有的支撑向量，所述装置包括：

候选样本选择单元，使用所述多个现有的支撑向量从新添加的未标记样本中选择候选样本；

新支撑向量选择单元，使用所述多个现有的支撑向量从所述候选样本中选择新的支撑向量；

支撑向量替换单元，通过所述新的支撑向量替换分类器的一些支撑向量；以及

权重更新单元，更新分类器中所有支撑向量的权重。

10.根据权利要求9所述的装置，其中所述候选样本选择单元还包括：

第一估计单元，估计任意样本与所有支撑向量的中心的最大距离；

第二估计单元，估计任意样本与所述中心的最小距离；

设置单元，在所述最大距离和最小距离之间设置用以判定新添加的未标记样本是否为正样本的阈值；以及

第一确定单元，根据所述阈值确定新添加的未标记样本是否为候选样本。

11.根据权利要求9或10所述的装置，所述阈值被设置成使得任意正样本落在所述阈值之内的概率固定。

12.根据权利要求9或10所述的装置，所述新支撑向量选择单元还包括：

绘制单元，根据所述多个现有的支撑向量绘制边界超球面；以及

第二确定单元，确定所述候选样本是否为新的支撑向量，其中如果候选样本在边界超球面之外，则将该候选样本选择为新的支撑向量；以及如果候选样本在边界超球面之内，则不将该候选样本选择为新的支撑向量。

13.根据权利要求10所述的装置，其中所述支撑向量替换单元还包括：

计算单元，计算每一个支撑向量到所述中心的距离；以及

替换单元，用新的支撑向量替换具有最近距离的支持向量，并保持支撑向量数恒定。

14.根据权利要求10所述的装置，其中在所述第一估计单元中使用支撑向量数据描述(SVDD)算法。

15.根据权利要求10所述的装置，其中在所述第一估计单元和所述第二估计单元中使用核函数K(·)，其中所述核函数被选择成使得对于任意的归一化的向量z，K(z，z)都是恒定的。

16.根据权利要求15所述的装置，其中所述核函数K(·)包括直方图交叉核(HIK)。

17.一种处理设备，所述处理设备包括分类器，所述分类器使用多个现有的支撑向量，所述处理设备包括：

接收单元，接收新添加的未标记样本；

权重更新单元，更新分类器中所有支撑向量的权重。

18.根据权利要求17所述的处理设备，其中所述候选样本选择单元还包括：

第二估计单元，估计任意样本与所述中心的最小距离；

19.根据权利要求18所述的处理设备，所述阈值被设置成使得任意正样本落在所述阈值之内的概率固定。

20.根据权利要求17或18所述的处理设备，所述新支撑向量选择单元还包括：

21.根据权利要求17或18所述的处理设备，其中所述支撑向量替换单元还包括：

计算单元，计算每一个支撑向量到所述中心的距离；以及

22.根据权利要求17或18所述的处理设备，其中在所述第一估计单元中使用支撑向量数据描述(SVDD)算法。

23.根据权利要求17或18所述的处理设备，其中在所述第一估计单元和所述第二估计单元中使用核函数K(·)，其中所述核函数被选择成使得对于任意的归一化的向量z，K(z，z)都是恒定的。

24.根据权利要求23所述的处理设备，其中所述核函数K(·)包括直方图交叉核(HIK)。

25.一种用户注册对象检测方法，包括：

接收要检测的对象；

调用分类器，所述分类器包括根据用户注册对象产生的多个现有的支撑向量；

基于分类器识别所述要检测的对象；以及

使用根据权利要求1-8中任一项所述的方法更新分类器。

26.如权利要求25所述的方法，其中所述要检测的对象是图像或视频。

27.一种用户注册对象检测系统，包括：

对象接收单元，接收要检测的对象；

对象识别单元，基于分类器识别所述要检测的对象，所述分类器包括根据用户注册对象产生的多个现有的支撑向量；以及

根据权利要求9-16中的任一项的用于分类器的在线半监督学习的装置，其用于更新分类器。

28.根据权利要求27所述的方法，其中所述要检测的对象是图像或视频。