WO2016033965A1

WO2016033965A1 - 图像分类器的生成方法、图像分类方法和装置

Info

Publication number: WO2016033965A1
Application number: PCT/CN2015/075781
Authority: WO
Inventors: 谢清鹏
Original assignee: 华为技术有限公司
Priority date: 2014-09-05
Filing date: 2015-04-02
Publication date: 2016-03-10
Also published as: CN105389583A

Abstract

一种图像分类器的生成方法和装置，该方法包括：获取训练样本集，训练样本集包括N个图像样本，N个图像样本属于K个类别，N、K为正整数，N大于K；获取每一个图像样本的特征向量，其中，特征向量包括图像样本的隐变量；基于N个图像样本的隐变量，通过多元逻辑回归模型，训练K个类别的分类器。通过多元逻辑回归模型，以最大似然的形式同时训练K个类别的分类器，也就是说，多元逻辑回归模型的使用保留了K个类别的分类器之间的相互关联，与LVSM将物体分类领域的K类分类问题转换成相互孤立的多个二类问题的方式相比，训练结果更加准确。

Description

图像分类器的生成方法、图像分类方法和装置

本申请要求于2014年09月05日提交中国专利局、申请号为201410453884.6、发明名称为“图像分类器的生成方法、图像分类方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及图像分类领域，并且更具体地，涉及一种图像分类器的生成方法、图像分类方法和装置。

背景技术

隐变量指不能直接被观测到，却在实际应用中起到重要作用的综合性变量，如空间关系、数据结构、内联状态等。隐变量广泛应用于机器视觉、自然语言处理、语音识别和公众健康等领域。实验证明，处理图像、语音等对象时，隐变量的引入能捕获更多的有用信息，与仅使用显变量的方式相比，处理效果显著提高。

早期的隐变量模型多为生成模型(generative models)，如隐马尔可夫模型(Hidden Markov Model，HMM)、高斯混合模型(Gaussian Mixture Model，GMM)等。近期更多的研究者试图探寻判别模型(discriminative models)中引入隐变量的可能性。典型的例子如条件随机场(Conditional Random Field，CRF)、隐变量支持向量机(Latent Support Vector Machine，LSVM)等，这些模型在各自领域均取得了一定成果。值得一提的是，LSVM配合局部可变形模型(Deformable Part-based Model，DPM)，即DPM-LSVM，在机器视觉中的物体检测领域已成为近年来较为成功的算法。DPM用于描述检测类别物体的特征，它由三部分组成：一个主体滤波器(root filter)，多个局部滤波器(part filters)，以及每个局部对应的形变惩罚(deformable costs)。主体部分用于描述物体的大体轮廓，局部部分用于描述检测物体的细节特征，形变惩罚用于保证每个局部相对于主体的位置不能有过大的偏移。在物体检测过程中，局部相对于主体的位置可以在一定范围内变化，可看作隐变量，采用LSVM进行训练。

LSVM的目标函数形式与原始的SVM相似，如(1)所示：

其中，β是分类器的模型参数，y_i表示训练样本x_i的标签，s(x_i,β)表示样本x_i的分数，这个分数是在所有可能局部相对位置(即隐变量取值范围)中最优的分数，该分数满足式(2)：

式(2)中，z为隐变量，f为特征提取方法，f(x_i,z)为样本x_i的特征向量，如DPM中使用框架梯度直方图特征。

可以证明LSVM的目标函数(式(1))具有半凹性，即固定正样本的隐变量取值时，目标函数是凹的。因此，LSVM的求解可使用坐标梯度下降(Coordinate Gradient Descent)，即首先固定分类器的模型参数，求得正样本隐变量取值，再固定正样本隐变量取值，求最优模型参数和负样本隐变量取值，如此迭代直至收敛。

LSVM与SVM一样，主要适用于物体检测领域。当推广到物体分类领域时，LSVM的处理方式是将物体分类领域中的多类问题转化成物体检测领域的二类问题。采用此种处理方式，会使得用于物体分类的多个分类器的训练过程彼此孤立。实际中，多种物体类别之间可能存在一定的关联性，比如，将建筑物分成多类建筑风格，待分类图片中的建筑物可能同时具有两种或两种以上建筑风格的特征。因此，将多个分类器的训练过程转化成彼此孤立、非此即彼的多个二类问题，会导致分类结果不准确。

发明内容

本发明实施例提供一种图像分类器的生成方法和装置，以提高分类结果的准确性。

第一方面，提供一种图像分类器的生成方法，包括：获取训练样本集，所述训练样本集包括N个图像样本，所述N个图像样本属于K个类别，N、K为正整数，N大于K；获取每一个所述图像样本的特征向量，其中，所述特征向量包括图像样本的隐变量；基于所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器。

结合第一方面，在第一方面的一种实现方式中，所述K个类别的分类器分别包括K个模型参数，所述基于所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器，包括：获取所述K个模型参数的初始值；获取所述N个图像样本的隐变量的初始值；基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述N个图像样本隐变量的初始值包括：正图像样本隐变量的初始值和负图像样本隐变量的初始值，所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值，包括：基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，当所述K个模型参数的当前值满足预设的收敛条件时，将所述K个模型参数的当前值确定为所述K个模型参数的目标值，当所述K个模型参数的当前值不满足所述收敛条件时，基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，并利用所述正图像样本隐变量的当前值更新所述正图像样本隐变量的初始值，重复执行本步骤直到所述K个模型参数的当前值满足所述收敛条件。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，包括：基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，并利用所述负图像样本隐变量的迭代值更新所述负图像样本隐变量的初始值，当所述K个模型参数的迭代值满足预设的迭代停止条件时，将所述K个模型参数的迭代值确定为所述K个模型参数的当前值，否则，重复执行本步骤直到所述K个模型参数的当前值满足所述迭代停止条件。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，包括：根据公式

确定所述K个模型参数的迭代值，其中，

x_i表示所述N个图像样本中的第i样本，β_l表示所述K个模型参数中的第l个模型参数，θ表示所述K个模型参数组成的K维变量，

表示x_i的类别对应的模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述根据公式

确定所述K个模型参数的迭代值，包括：根据公式

确定β_k对应的梯度，其中，

表示l(θ)关于β_k的偏导函数，β_k表示所述K个模型参数中的第k个模型参数，z_i(β_k)表示模型参数为β_k时x_i的隐变量的初始值，f(x_i,z_i(β_k))表示隐变量z取值z_i(β_k)时x_i的特征向量；基于所述β_k对应的梯度，以l(θ)为目标函数，采用梯度上升算法，确定所述β_k的迭代值。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述迭代停止条件为所述目标函数值l(θ)的变化小于预设阈值；或者，所述迭代停止条件为迭代次数达到预设次数。

确定所述K个模型参数的迭代值，包括：根据公式

并行计算所述K个模型参数的迭代值，其中，l_LC(θ)是对l(θ)中的对数取凹上界转化而来的，

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，包括：根据公式

确定所述负图像样本隐变量的迭代值，其中，x_i表示所述N个图像样本中的第i样本，β_t表示所述K个模型参数中的第t个模型参数，且

表示x_i类别对应的模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，

表示模型参数为β_t时x_i隐变量的迭代值，i为1至N中的任意整数，t为1至K中的任意整数。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，包括：根据公式

确定所述正图像样本隐变量的当前值，其中，x_i表示所述N个图像样本中的第i样本，

表示模型参数为

时x_i隐变量的当前值，i为1至N中的任意整数。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于每一个所述模型参数的初始值，确定每一个所述图像样本的隐变量的初始值，包括：根据公式

确定每一个所述图像样本的隐变量的初始值，其中，x_i表示所述N个图像样本中的第i样本，β_k表示所述K个模型参数中的第k个模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，

表示模型参数为β_k时x_i隐变量z的初始值，i为1至N中的任意整数，k为1至K中的任意整数。

第二方面，提供一种图像分类方法，包括：获取待分类图像的特征向量；基于所述待分类图像的特征向量，利用K个分类器，确定所述待分类图像的类别，其中，所述K个分类器是利用第一方面或第一方面的任意一种实现方式训练出的K个分类器；根据公式

确定所述待分类图像在所述K个类别下的概率，其中，

x表示所述待分类图像，β_k表示所述K个分类器中第k个分类器的模型参数，f(x,z)表示x的特征向量，Z(x)表示x的隐变量z的取值范围，k为1至K中的任意整数。

第三方面，提供一种图像分类器的生成装置，包括：第一获取单元，用于获取训练样本集，所述训练样本集包括N个图像样本，所述N个图像样本属于K个类别，N、K为正整数，N大于K；第二获取单元，用于获取所述第一获取单元获取的每一个所述图像样本的特征向量，其中，所述特征向量包括图像样本的隐变量；训练单元，用于基于所述第二获取单元获取的所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器。

结合第二方面，在第二方面的一种实现方式中，所述K个类别的分类器分别包括K个模型参数，所述训练单元具体用于获取所述K个模型参数的初始值；获取所述N个图像样本的隐变量的初始值；基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值。

结合第三方面，在第三方面的一种实现方式中，所述N个图像样本隐变量的初始值包括：正图像样本隐变量的初始值和负图像样本隐变量的初始值，所述训练单元具体用于基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，当所述K个模型参数的当前值满足预设的收敛条件时，将所述K个模型参数的当前值确定为所述K个模型参数的目标值，当所述K个模型参数的当前值不满足所述收敛条件时，基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，并利用所述正图像样本隐变量的当前值更新所述正图像样本隐变量的初始值，重复执行本步骤直到所述K个模型参数的当前值满足所述收敛条件。

结合第三方面或其上述实现方式的任一种，在第三方面的另一种实现方式中，所述训练单元具体用于基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，并利用所述负图像样本隐变量的迭代值更新所述负图像样本隐变量的初始值，当所述K个模型参数的迭代值满足预设的迭代停止条件时，将所述K个模型参数的迭代值确定为所述K个模型参数的当前值，否则，重复执行本步骤直到所述K个模型参数的当前值满足所述迭代停止条件。

结合第三方面或其上述实现方式的任一种，在第三方面的另一种实现方式中，所述训练单元具体用于根据公式

确定所述K个模型参数的迭代值，其中，

确定β_k对应的梯度，其中，

结合第三方面或其上述实现方式的任一种，在第三方面的另一种实现方式中，所述迭代停止条件为所述目标函数值l(θ)的变化小于预设阈值；或者，所述迭代停止条件为迭代次数达到预设次数。

表示模型参数为

时x_i隐变量的当前值，i为1至N中的任意整数。

第四方面，提供一种图像分类装置，包括：第一获取单元，用于获取待分类图像的特征向量；第一确定单元，用于基于所述待分类图像的特征向量，利用K个分类器，确定所述待分类图像的类别，其中，所述K个分类器是利用第三方面或第三方面的任意一种实现方式训练出的K个分类器；第二确定单元，用于根据公式

确定所述待分类图像在所述K个类别下的概率，其中，

本发明实施例中，通过多元逻辑回归模型，以最大似然的形式同时训练K个分类器，也就是说，多元逻辑回归模型的使用保留了K个类别的分类器之间的相互关联，与LVSM将物体分类领域的K类分类问题转换成相互孤立的多个二类问题的方式相比，训练结果更加准确。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的图像分类器的生成方法的示意性流程图。

图2是利用本发明实施例训练出的分类器参数对图像分类的示例图。

图3是利用本发明实施例训练出的分类器参数对图像分类的示例图。

图4是本发明实施例的图像分类器的生成装置的示意性结构图。

图5是本发明实施例的图像分类器的生成装置的示意性结构图。

图6是本发明实施例的图像分类方法的示意性流程图。

图7是本发明实施例的图像分类装置的示意性框图。

图8是本发明实施例的图像分类装置的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

图1是本发明实施例的图像分类器的生成方法的示意性流程图。图1的方法包括：

110、获取训练样本集，训练样本集包括N个图像样本，N个图像样本属于K个类别，N、K为正整数，N大于K。

例如，训练样本集合D＝{(x₁,y₁),...,(x_N,y_N)}，共包含N个图像样本，其中，y_i为图像样本x_i的标签，用于指示x_i的类别，该类别为上述K个类别之一。

120、获取每一个图像样本的特征向量，其中，特征向量包括图像样本的隐变量。

应理解，图像特征和隐变量可以根据应用场景或实际需要选取。例如，图像特征可以选取(或定义为)方向梯度直方图(Histogram of Oriented Gradient,HOG)，局部二值模式(Local Binary Patterns，LBP)，或Haar等；隐变量可以选取(或定义为)物体在图像中的位置，图像中局部和主体间的相对位置，或物体的子类别等。基于上述选取的图像特征和隐变量，获取每一个图像样本的特征向量，此时，获取的每个图像的特征向量并非一个固定值，会随着隐变量的变化而变化，假设图像x_i的隐变量为z，提取出的特征向量可通过f(x，z)表示。

130、基于N个图像样本的隐变量，通过多元逻辑回归模型，训练K个类别的分类器。

可选地，作为一个实施例，步骤130可包括：获取K个模型参数的初始值；获取N个图像样本的隐变量的初始值；基于N个图像样本的特征向量，以及N个图像样本隐变量的初始值，通过多元逻辑回归模型，训练K个类别的分类器，以确定K个模型参数的目标值。

需要说明的是，一个图像样本的隐变量可包括K个初始值，也就是说，一个图像样本的隐变量在一个模型参数的初始值下会有一个对应的初始值。通过步骤130，可获取N*K个隐变量的初始值。

可选地，作为一个实施例，上述N个图像样本隐变量的初始值包括：正图像样本隐变量的初始值和负图像样本隐变量的初始值，上述基于N个图像样本的特征向量，以及N个图像样本的初始值，通过多元逻辑回归模型，训练K个类别的分类器，以确定K个模型参数的目标值，可包括：基于N个图像样本的特征向量，以及N个图像样本的隐变量的初始值，通过多元逻辑回归模型，训练K个类别的分类器，以确定K个模型参数的当前值，当K个模型参数的当前值满足预设的收敛条件时，将K个模型参数的当前值确定为K个模型参数的目标值，当K个模型参数的当前值不满足该收敛条件时，基于N个图像样本的特征向量，以及K个模型参数的当前值，确定正图像样本隐变量的当前值，并利用正图像样本隐变量的当前值更新该正图像样本隐变量的初始值，重复执行本步骤直到K个模型参数的当前值满足收敛条件。

具体而言，一个图像样本的隐变量在不同模型参数下可具有不同的初始值，也就是说一个图像样本的隐变量可包括K个初始值，上述N个图像样本隐变量的初始值可包括：K*N个初始值。一个图像样本在该图像样本类别对应的模型参数下为正样本，上述正图像样本隐变量的初始值共包括N个初始值，分别是N个图像样本在各自类别对应的模型参数下的初始值。K*N个初始值中，除去上述正图像隐变量初始值之外剩余的K*(N-1)个初始值均为负图像样本隐变量的初始值。

可以证明，当正图像样本隐变量初始值固定时，多元逻辑回归模型具有凹性，可以通过梯度上升的方式求解。

可选地，作为一个实施例，上述基于N个图像样本的特征向量，以及N个图像样本的隐变量的初始值，通过多元逻辑回归模型，训练K个类别的分类器，以确定K个模型参数的当前值可包括：基于N个图像样本的特征向量，以及N个图像样本隐变量的初始值，通过多元逻辑回归模型，训练K个类别的分类器，以确定K个模型参数的迭代值，基于N个图像样本的特征向量，以及K个模型参数的迭代值，确定负图像样本隐变量的迭代值，并利用负图像样本隐变量的迭代值更新负图像样本隐变量的初始值，当K个模型参数的迭代值满足预设的迭代停止条件时，将K个模型参数的迭代值确定为K个模型参数的当前值，否则，重复执行本步骤直到K个模型参数的当前值满足迭代停止条件。

本发明实施例中，在固定正样本隐变量取值的情况下，通过不断更新负样本隐变量的取值达到优化K个模型参数的目的，进一步提高了分类结果的准确性。

可选地，作为一个实施例，上述基于N个图像样本的特征向量，以及N个图像样本隐变量的初始值，通过多元逻辑回归模型，训练K个类别的分类器，以确定K个模型参数的迭代值可包括：根据公式

确定K个模型参数的迭代值，其中，

x_i表示N个图像样本中的第i样本，β_l表示K个模型参数中的第l个模型参数，θ表示K个模型参数组成的K维变量，

可选地，作为一个实施例，上述根据公式

确定K个模型参数的迭代值，可包括：根据公式

确定β_k对应的梯度，其中，

表示l(θ)关于β_k的偏导函数，β_k表示K个模型参数中的第k个模型参数，z_i(β_k)表示模型参数为β_k时x_i的隐变量的初始值，f(x_i,z_i(β_k))表示隐变量z取值z_i(β_k)时x_i的特征向量；基于β_k对应的梯度，以l(θ)为目标函数，采用梯度上升算法，确定β_k的迭代值。

可选地，作为一个实施例，上述迭代停止条件为目标函数值l(θ)的变化小于预设阈值；或者，迭代停止条件为迭代次数达到预设次数。

可选地，作为一个实施例，上述根据公式

确定K个模型参数的迭代值，可包括：根据公式

并行计算K个模型参数的迭代值，其中，l_LC(θ)是对l(θ)中的对数取凹上界转化而来的，

上述目标函数l(θ)存在对数加和函数，因此，无法分解成K类子问题叠加的形式，也就无法采用并行或分布式计算对寻优过程进行加速。

本发明实施例中，利用对数具有凹性(Log-concavity)，采用对数凹上界(Log-concavity Bound)将目标函数l(θ)转化为K类子问题加和的形式，从而可以实现并行计算，加速了算法的收敛。

具体而言，对数凹上界的形式为：

利用该式就可以将l(θ)转化为：

采用上式作为目标函数，利用梯度上升法求解时，分类器参数的梯度的形式如下：

其中，辅助参数a_i取值为：

可选地，作为一个实施例，上述基于N个图像样本的特征向量，以及K个模型参数的迭代值，确定负图像样本隐变量的迭代值可包括：根据公式

确定负图像样本隐变量的迭代值，其中，x_i表示N个图像样本中的第i样本，β_t表示K个模型参数中的第t个模型参数，且

可选地，作为一个实施例，上述基于N个图像样本的特征向量，以及K个图像样本的当前值，确定正图像样本隐变量的当前值可包括：根据公式

确定正图像样本隐变量的当前值，其中，x_i表示N个图像样本中的第i样本，

表示模型参数为

时x_i隐变量的当前值，i为1至N中的任意整数。

可选地，作为一个实施例，上述基于每一个模型参数的初始值，确定每一个图像样本的隐变量的初始值可包括：根据公式

确定每一个图像样本的隐变量的初始值，其中，x_i表示N个图像样本中的第i样本，β_k表示K个模型参数中的第k个模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，

下面将结合具体的例子，详细描述本发明实施例。应注意，这些例子只是为了帮助本领域技术人员更好地理解本发明实施例，而非限制本发明实施例的范围。

实施例1：

输入：训练样本集{(x₁,y₁),…,(x_N,y_N)},初始全部隐变量取值。

输出：分类器参数θ，θ＝{β₁,...,β_K}。

For outerLoop:＝1 to numOuterLoop

//求解辅助目标函数l(θ,{Z_p})，其中Z_p代表正样本隐变量取值。

//内循环。

While(目标函数与上一轮相比的变化>阈值)//判断是否收敛

//更新分类器的参数

for k:＝1 to K

用

计算第k类分类器参数对应的梯度。

end for

//更新分类器的参数。

使用以上计算的梯度值利用梯度上升算法更新所有类别的分类器参数；

//更新负样本隐变量取值。

for i:＝1 to N and k:＝1 to K and y_i≠k

利用

计算各样本x_i隐变量取值。

end for

end for while

//更新正样本隐变量取值。

for i:＝1 to N

利用

计算各样本x_i隐变量取值。

end for

实施例2：

输入：训练样本集{(x₁,y₁),…,(x_N,y_N)},初始隐变量取值{h}。

输出：分类器参数θ。

//外循环

For outerLoop:＝1 to numOuterLoop

//内循环

for innerLoop:＝1 to numInnerLoop

//更新分类器的参数

for k:＝1 to K

用

计算第k类分类器参数对应的梯度。

end for

//更新分类器参数

使用以上计算的梯度值利用梯度上升算法更新所有类别的分类器参数

//更新负样本隐变量取值

for i:＝1 to N and k:＝1 to K and y_i≠k

利用

计算各样本x_i隐变量取值。

end for

//更新正样本隐变量取值

for i:＝1 to N

利用

计算各样本x_i隐变量取值。

end for

具体实现中，常数numOuterLoop和numInnerLoop的取值与应用场景有较大关系，如在数字识别(digit recognition)中，由于样本数量多，特征维度小，可以设numOuterLoop＝50，numInnerLoop＝1。

在更复杂的实例中，如样本数量小，特征维度高，可设numOuterLoop＝5,numInnerLoop＝1000。

下面给出训练出的分类器参数对图像分类的结果。需要说明的是，在下面的描述中，本发明实施例的分类器训练方式称为：隐变量多元逻辑回归(Multinomial Latent Logistic Regression，MLLR)。

图2是利用本发明实施例训练出的分类器参数对图像分类的示例图。图2的例子中以哺乳动物分类为研究对象，共包含6类哺乳动物，每类约50张图片。实验中取50％图片作为训练，另50％图像作为测试。图像特征方面使用HOG特征，隐变量为待检测物体在图片中的位置，并规定物体所在框的大小要在总图片大小的30％以上。线性SVM、LSVM和MLLR，测试结果如下：

表1哺乳动物分类实验分类结果

分类方法	线性SVM	LSVM	MLLR
分类方法	线性SVM	LSVM	MLLR	准确率(％)	64.23	69.59	73.31

测试结果表明，MLLR的准确率超过LSVM，并且LSVM和MLLR两种隐变量方式训练出的分类器的效果均优于传统线性SVM方法。

图2中，第一列为线性SVM训练出的分类器示意图(采用HOG特征)，第二列为MLLR训练出的分类器示意图。图2内小图片中的矩形框为MLLR检测出的物体位置。

图3是利用本发明实施例训练出的分类器参数对图像分类的示例图。图3以体育人物动作为研究对象，共包括6类动作(板球击球、板球投球、排球扣球、门球击球、网球正手和网球发球)。图像特征仍使用HOG，隐变量模型使用DPM，即物体位置和局部主体相对位置均作为隐变量。结果显示分类准确率MLLR(78.3％)超过LSVM(74.4％)。图3中，第一列为图片中的主体模型示意图，第二列为图片中的局部模型示意图，图3内小图片中深色矩形框代表主体位置，浅色矩形框代表局部位置。应理解，在本发明的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

上文中结合图1至图3，详细描述了根据本发明实施例的图像分类器的生成方法，下面将结合图4至图5，描述根据本发明实施例的图像分类器的生成装置。

应理解，根据本发明实施例的图像分类器的生成装置能够实现图1中的各个步骤，为了简洁，在此不再赘述。

图4是本发明实施例的图像分类器的生成装置的示意性结构图。图4的装置400包括：

第一获取单元410，用于获取训练样本集，所述训练样本集包括N个图像样本，所述N个图像样本属于K个类别，N、K为正整数，N大于K；

第二获取单元420，用于获取所述第一获取单元410获取的每一个所述图像样本的特征向量，其中，所述特征向量包括图像样本的隐变量；

训练单元430，用于基于所述第二获取单元420获取的所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器。

可选地，作为一个实施例，所述K个类别的分类器分别包括K个模型参数，所述训练单元430具体用于获取所述K个模型参数的初始值；基于每一个所述模型参数的初始值，确定每一个所述图像样本的隐变量的初始值；基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值。

可选地，作为一个实施例，所述N个图像样本隐变量的初始值包括：正图像样本隐变量的初始值和负图像样本隐变量的初始值，所述训练单元430具体用于基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，当所述K个模型参数的当前值满足预设的收敛条件时，将所述K个模型参数的当前值确定为所述K个模型参数的目标值，当所述K个模型参数的当前值不满足所述收敛条件时，基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，并利用所述正图像样本隐变量的当前值更新所述正图像样本隐变量的初始值，重复执行本步骤直到所述K个模型参数的当前值满足所述收敛条件。

可选地，作为一个实施例，所述训练单元430具体用于基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，并利用所述负图像样本隐变量的迭代值更新所述负图像样本隐变量的初始值，当所述K个模型参数的迭代值满足预设的迭代停止条件时，将所述K个模型参数的迭代值确定为所述K个模型参数的当前值，否则，重复执行本步骤直到所述K个模型参数的当前值满足所述迭代停止条件。

可选地，作为一个实施例，所述训练单元430具体用于根据公式

确定所述K个模型参数的迭代值，其中，

确定β_k对应的梯度，其中，

可选地，作为一个实施例，所述迭代停止条件为所述目标函数值l(θ)的变化小于预设阈值；或者，所述迭代停止条件为迭代次数达到预设次数。

表示模型参数为

时x_i隐变量的当前值，i为1至N中的任意整数。

图5是本发明实施例的图像分类器的生成装置的示意性结构图。图5的装置500包括：

存储器510，用于存储程序；

处理器520，用于执行所述程序，当所述程序被执行时，所述处理器520具体用于获取训练样本集，所述训练样本集包括N个图像样本，所述N个图像样本属于K个类别，N、K为正整数，N大于K；获取每一个所述图像样本的特征向量，其中，所述特征向量包括图像样本的隐变量；基于所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器。

可选地，作为一个实施例，所述K个类别的分类器分别包括K个模型参数，所述处理器520具体用于获取所述K个模型参数的初始值；基于每一个所述模型参数的初始值，确定每一个所述图像样本的隐变量的初始值；基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值。

可选地，作为一个实施例，所述N个图像样本隐变量的初始值包括：正图像样本隐变量的初始值和负图像样本隐变量的初始值，所述处理器520具体用于基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，当所述K个模型参数的当前值满足预设的收敛条件时，将所述K个模型参数的当前值确定为所述K个模型参数的目标值，当所述K个模型参数的当前值不满足所述收敛条件时，基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，并利用所述正图像样本隐变量的当前值更新所述正图像样本隐变量的初始值，重复执行本步骤直到所述K个模型参数的当前值满足所述收敛条件。

可选地，作为一个实施例，所述处理器520具体用于基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，并利用所述负图像样本隐变量的迭代值更新所述负图像样本隐变量的初始值，当所述K个模型参数的迭代值满足预设的迭代停止条件时，将所述K个模型参数的迭代值确定为所述K个模型参数的当前值，否则，重复执行本步骤直到所述K个模型参数的当前值满足所述迭代停止条件。

可选地，作为一个实施例，所述处理器520具体用于根据公式

确定所述K个模型参数的迭代值，其中，

可选地，作为一个实施例，所述处理器520具体用于根据公式

确定β_k对应的梯度，其中，

可选地，作为一个实施例，所述处理器520具体用于根据公式

可选地，作为一个实施例，所述处理器520具体用于根据公式

表示模型参数为

时x_i隐变量的当前值，i为1至N中的任意整数。

可选地，作为一个实施例，所述处理器520具体用于根据公式

图6是本发明实施例的图像分类方法的示意性流程图。图6的方法中，可利用图1方法训练出的K个分类器对图像进行分类，图6方法包括：

610、获取待分类图像的特征向量；

620、基于待分类图像的特征向量，利用K个分类器，确定待分类图像的类别；

630、根据公式

确定待分类图像在K个类别下的概率，其中，

x表示待分类图像，β_k表示K个分类器中第k个分类器的模型参数，f(x,z)表示x的特征向量，Z(x)表示x的隐变量z的取值范围，k为1至K中的任意整数。

现有的LSVM的分类结果仅给出待分类图像属于哪一类，但是实际情况中，不同类型之间可能存在一定的联系，某一图像并非绝对属于哪一类。例如，可以将建筑物的风格进行分类，包括现代风格，中世纪风格等，图像中某一建筑物风格可能既采用了一些现代风格，也采用了一部分中世纪风格，此时，现有LSVM的分类结果仅会显示待分类图像中的建筑物归为哪种建筑风格，显然不够准确。本实施例中，除了给出待分类图像所属的类别，还给出了该图片在各类别中的概率，与现有技术相比，引入图像分类结果的概率解释使得图像分类结果的描述更加准确。

图7是本发明实施例的图像分类的装置的示意性框图。图7中的装置700可利用图4的装置400训练出的K个分类器对图像进行分类，装置700包括：

第一获取单元710，用于获取待分类图像的特征向量；

第一确定单元720，用于基于待分类图像的特征向量，利用K个分类器，确定待分类图像的类别；

第二确定单元730，用于根据公式

确定待分类图像在K个类别下的概率，其中，

图8是本发明实施例的图像分类的装置的示意性框图。图8中的图像分类装置800可利用图5的装置500训练出的K个分类器对图像进行分类，图8方法包括：

存储器810，用于存储程序；

处理器820，用于执行程序，当所述程序被执行时，所述程序用于获取待分类图像的特征向量；基于待分类图像的特征向量，利用K个分类器，确定待分类图像的类别；根据公式

确定待分类图像在K 个类别下的概率，其中，

应理解，在本发明实施例中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

一种图像分类器的生成方法，其特征在于，包括：

获取训练样本集，所述训练样本集包括N个图像样本，所述N个图像样本属于K个类别，N、K为正整数，N大于K；

获取每一个所述图像样本的特征向量，其中，所述特征向量包括图像样本的隐变量；

基于所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器。
如权利要求1所述的方法，其特征在于，所述K个类别的分类器分别包括K个模型参数，

所述基于所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器，包括：

获取所述K个模型参数的初始值；

获取所述N个图像样本的隐变量的初始值；

基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值。
如权利要求2所述的方法，其特征在于，所述N个图像样本隐变量的初始值包括：正图像样本隐变量的初始值和负图像样本隐变量的初始值，

所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值，包括：

基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，

当所述K个模型参数的当前值满足预设的收敛条件时，将所述K个模型参数的当前值确定为所述K个模型参数的目标值，

当所述K个模型参数的当前值不满足所述收敛条件时，基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，并利用所述正图像样本隐变量的当前值更新所述正图像样本隐变量的初始值，重复执行本步骤直到所述K个模型参数的当前值满足所述收敛条件。
如权利要求3所述的方法，其特征在于，所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，包括：

基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，

基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，并利用所述负图像样本隐变量的迭代值更新所述负图像样本隐变量的初始值，

当所述K个模型参数的迭代值满足预设的迭代停止条件时，将所述K个模型参数的迭代值确定为所述K个模型参数的当前值，

否则，重复执行本步骤直到所述K个模型参数的当前值满足所述迭代停止条件。
如权利要求4所述的方法，其特征在于，所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，包括：

根据公式
确定所述K个模型参数的迭代值，其中，
x_i表示所述N个图像样本中的第i样本，β_l表示所述K个模型参数中的第l个模型参数，θ表示所述K个模型参数组成的K维变量，β_y
表示x_i的类别对应的模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量。
如权利要求5所述的方法，其特征在于，所述根据公式
确定所述K个模型参数的迭代值，包括：

根据公式
确定β_k对应的梯度，其中，

表示l(θ)关于β_k的偏导函数，β_k表示所述K个模型参数中的第k个模型参数，z_i(β_k)表示模型参数为β_k时x_i的隐变量的初始值，f(x_i,z_i(β_k))表示隐变量z取值z_i(β_k)时x_i的特征向量；

基于所述β_k对应的梯度，以l(θ)为目标函数，采用梯度上升算法，确定所述β_k的迭代值。
如权利要求6所述的方法，其特征在于，

所述迭代停止条件为所述目标函数值l(θ)的变化小于预设阈值；或者，

所述迭代停止条件为迭代次数达到预设次数。
如权利要求5所述的方法，其特征在于，所述根据公式
确定所述K个模型参数的迭代值，包括：

根据公式
并行计算所述K个模型参数的迭代值，其中，l_LC(θ)是对l(θ)中的对数取凹上界转化而来的，
如权利要求4-8中任一项所述的方法，其特征在于，所述基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，包括：

根据公式
确定所述负图像样本隐变量的迭代值，其中，x_i表示所述N个图像样本中的第i样本，β_t表示所述K个模型参数中的第t个模型参数，且

表示x_i类别对应的模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，
表示模型参数为β_t时x_i隐变量的迭代值，i为1至N中的任意整数，t为1至K中的任意整数。
如权利要求3-9中任一项所述的方法，其特征在于，所述基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，包括：

根据公式
确定所述正图像样本隐变量的当前值，其中，x_i表示所述N个图像样本中的第i样本，
表示x_i类别对应的模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，
表示模型参数为
时x_i隐变量的当前值，i为1至N中的任意整数。
如权利要求2-10中任一项所述的方法，其特征在于，所述获取所述N个图像样本的隐变量的初始值，包括：

根据公式
确定每一个所述图像样本的隐变量的初始值，其中，x_i表示所述N个图像样本中的第i样本，β_k表示所述K个模型参数中的第k个模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，
表示模型参数为β_k时x_i隐变量z的初始值，i为1至N中的任意整数，k为1至K中的任意整数。
一种图像分类方法，其特征在于，包括：

获取待分类图像的特征向量；

基于所述待分类图像的特征向量，利用K个分类器，确定所述待分类图像的类别，其中，所述K个分类器是利用权利要求1至权利要求11中任一项所述的方法训练出的K个分类器；

根据公式
确定所述待分类图像在所述K个类别下的概率，其中，
x表示所述待分类图像，β_k表示所述K个分类器中第k个分类器的模型参数，f(x,z)表示x的特征向量，Z(x)表示x的隐变量z的取值范围，k为1至K中的任意整数。
一种图像分类器的生成装置，其特征在于，包括：

第一获取单元，用于获取训练样本集，所述训练样本集包括N个图像样本，所述N个图像样本属于K个类别，N、K为正整数，N大于K；

第二获取单元，用于获取所述第一获取单元获取的每一个所述图像样本的特征向量，其中，所述特征向量包括图像样本的隐变量；

训练单元，用于基于所述第二获取单元获取的所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器。
如权利要求13所述的装置，其特征在于，所述K个类别的分类器分别包括K个模型参数，所述训练单元具体用于获取所述K个模型参数的初始值；获取所述N个图像样本的隐变量的初始值；基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值。
如权利要求14所述的装置，其特征在于，所述N个图像样本隐变量的初始值包括：正图像样本隐变量的初始值和负图像样本隐变量的初始值，所述训练单元具体用于基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，当所述K个模型参数的当前值满足预设的收敛条件时，将所述K个模型参数的当前值确定为所述K个模型参数的目标值，当所述K个模型参数的当前值不满足所述收敛条件时，基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，并利用所述正图像样本隐变量的当前值更新所述正图像样本隐变量的初始值，重复执行本步骤直到所述K个模型参数的当前值满足所述收敛条件。
如权利要求15所述的装置，其特征在于，所述训练单元具体用于基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，并利用所述负图像样本隐变量的迭代值更新所述负图像样本隐变量的初始值，当所述K个模型参数的迭代值满足预设的迭代停止条件时，将所述K个模型参数的迭代值确定为所述K个模型参数的当前值，否则，重复执行本步骤直到所述K个模型参数的当前值满足所述迭代停止条件。
如权利要求16所述的装置，其特征在于，所述训练单元具体用于根据公式
确定所述K个模型参数的迭代值，其中，
x_i表示所述N个图像样本中的第i样本，β_l表示所述K个模型参数中的第l个模型参数，θ表示所述K个模型参数组成的K维变量，
表示x_i的类别对应的模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量。
如权利要求17所述的装置，其特征在于，所述训练单元具体用于根据公式
确定β_k对应的梯度，其中，

表示l(θ)关于β_k的偏导函数，β_k表示所述K个模型参数中的第k个模型参数，z_i(β_k)表示模型参数为β_k时x_i的隐变量的初始值，f(x_i,z_i(β_k))表示隐变量z取值z_i(β_k)时x_i的特征向量；基于所述β_k对应的梯度，以l(θ)为目标函数，采用梯度上升算法，确定所述β_k的迭代值。
如权利要求18所述的装置，其特征在于，所述迭代停止条件为所述目标函数值l(θ)的变化小于预设阈值；或者，所述迭代停止条件为迭代次数达到预设次数。
如权利要求17所述的装置，其特征在于，所述训练单元具体用于根据公式
并行计算所述K个模型参数的迭代值，其中，l_LC(θ)是对l(θ)中的对数取凹上界转化而来的，
如权利要求16-20中任一项所述的装置，其特征在于，所述训练单元具体用于根据公式
确定所述负图像样本隐变量的迭代值，其中，x_i表示所述N个图像样本中的第i样本，β_t表示所述K个模型参数中的第t个模型参数，且

表示x_i类别对应的模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，
表示模型参数为β_t时x_i隐变量的迭代值，i为1至N中的任意整数，t为1至K中的任意整数。
如权利要求15-21中任一项所述的装置，其特征在于，所述训练单元具体用于根据公式
确定所述正图像样本隐变量的当前值，其中，x_i表示所述N个图像样本中的第i样本，
表示x_i类别对应的模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，
表示模型参数为
时x_i隐变量的当前值，i为1至N中的任意整数。
如权利要求14-22中任一项所述的装置，其特征在于，所述训练单元具体用于根据公式
确定每一个所述图像样本的隐变量的初始值，其中，x_i表示所述N个图像样本中的第i样本，β_k表示所述K个模型参数中的第k个模型参数，Z(x_i)表示x_i的隐变量z的取值范围，f(x_i,z)表示x_i的特征向量，
表示模型参数为β_k时x_i隐变量z的初始值，i为1至N中的任意整数，k为1至K中的任意整数。
一种图像分类装置，其特征在于，包括：

第一获取单元，用于获取待分类图像的特征向量；

第一确定单元，用于基于所述待分类图像的特征向量，利用K个分类器，确定所述待分类图像的类别，其中，所述K个分类器是利用权利要求13至权利要求23中任一项所述的装置训练出的K个分类器；

第二确定单元，用于根据公式
确定所述待分类图像在所述K个类别下的概率，其中，
x表示所述待分类图像，β_k表示所述K个分类器中第k个分类器的模型参数，f(x,z)表示x的特征向量，Z(x)表示x的隐变量z的取值范围，k为1至K中的任意整数。