CN105069133B

CN105069133B - 一种基于未标记数据的数字图像分类方法

Info

Publication number: CN105069133B
Application number: CN201510506268.7A
Authority: CN
Inventors: 张敏灵; 吴磊
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2015-08-18
Filing date: 2015-08-18
Publication date: 2018-09-14
Anticipated expiration: 2035-08-18
Also published as: CN105069133A

Abstract

本发明提供了一种基于未标记数据的数字图像分类方法。该方法包括以下步骤：（1）用户从包含已分类图像与未分类图像的多标记图像库中选择查询图像，包括相关图像和不相关图像；（2）在选取的已分类数字图像上使用已有的分类方法学习得到一个初始分类模型；（3）在所有查询图像上使用本发明提出的分类方法对初始分类模型进行学习优化得到一个最终分类模型；（4）基于最终分类模型对数字图像存储设备中待分类图像进行分类，并返回分类结果；（5）如果用户对分类结果满意，则执行步骤6，否则从多标记图像库中选择更多的查询图像进行反馈，执行步骤2；（6）结束。该方法能够有效利用大量未分类图像对数字图像的所有可能类别进行分类。

Description

一种基于未标记数据的数字图像分类方法

技术领域

本发明涉及一种数字图像分类装置，特别涉及一种适用于已分类图像非常有限的数字图像分类方法。

背景技术

随着互联网的快速发展以及计算机的广泛普及，数字图像的获取也变得越来越容易。因此，可用的数字图像正快速地增长并且在越来越多的行业中得到应用。图像分类技术是一种辅助用户高效地获取期望图像的方法，同时也是很多与图像相关的人机交互系统取得成功的基础，如检索系统、推荐系统等。该方法通过用户提交给分类装置的查询图像，快速、准确地将图像库中的未分类图像进行分类，以方便用户获取期望的图像。一种有效的图像分类策略是将分类过程看作一个学习过程，利用用户提交的查询图像作为学习所需的样本，使用机器学习技术学习得到一个分类模型，从而实现对数字图像的分类。

已有的数字图像包括已分类和未分类两种。为保证分类效果，目前的图像分类技术需要用户提交大量的已分类数字图像。然而在现实情况中，对图像进行分类费时费力，导致已分类的数字图像很难获得，但未分类图像却容易获取。同时，真实世界中的数字图像可能同时具有多个类别。例如，一幅自然图像可能同时具有沙滩、大海、落日等多个类别；一篇文档可能被同时分类为经济、政治等。已有的数字图像分类技术不能有效地利用未分类图像中包含的信息，并且假设每幅图像仅有一个类别，故不能有效地进行图像分类。

发明内容

本发明的主要目的是针对目前的数字图像分类技术需要大量已分类图像且只能将图像分为一个类别的问题，提出一种能够有效利用大量未分类图像对数字图像的所有可能类别进行分类的方法。该方法利用未分类图像优化建立在有限已分类图像上的模型，提高数字图像分类装置的性能。

为利用未分类数字图像且对数字图像的所有可能类别进行分类，本发明将机器学习领域中的半监督学习框架与多标记学习技术相结合，进而提出一种数字图像分类方法：该方法包括以下步骤：(1)用户从包含已分类图像与未分类图像的多标记图像库中选择查询图像，包括相关图像和不相关图像；(2)在选取的已分类数字图像上使用已有的分类方法学习得到一个初始分类模型；(3)在所有查询图像上使用本发明提出的分类方法对初始分类模型进行学习优化得到一个最终分类模型；(4)基于最终分类模型对数字图像存储设备中待分类图像进行分类，并返回分类结果；(5)如果用户对分类结果满意，则执行步骤6，否则从多标记图像库中选择更多的查询图像进行反馈，执行步骤2；(6)结束。

下面将结合附图对最佳实施例进行详细说明。

附图说明

图1是数字图像分类装置的工作流程图

图2是本发明方法的流程图

图3是本发明学习初始分类模型的流程图

图4是本发明学习最终分类模型的流程图

具体实施方式

如图1所示，数字图像存储设备中存放了待分类的数字图像，此外还存在一个多标记数字图像库，该图像库中含有一些已分类数字图像与大量未分类数字图像，每个数字图像均具有多种可能的类别，且已分类数字图像均对应了一组人工标注的概念标记。用户从多标记数字图像库中选取L幅已分类查询图像和U幅未分类查询图像提交给数字图像分类装置，其中一些为其感兴趣的相关图像而另外一些为其不感兴趣的非相关图像。可以使用数字图像处理教科书中的多种经典方法生成适当的图像特征，如颜色、纹理、形状等。由此，每幅图像可由一个特征向量进行表示。在得到图像特征后，在已分类数字图像上采用已有的分类方法学习得到一个初始分类模型，然后使用本发明提出的分类方法在所有查询图像上优化初始分类模型，得到最终分类模型。基于最终分类模型对数字图像存储设备中的待分类图像进行分类，如图1所示。如果用户对所得结果不满意，可以从多标记数字图像库中选取更多的查询图像反馈给数字图像分类装置。

本发明涉及的方法如图2所示。值得注意的是，本发明中提出的图像分类方法由Q个线性模型组成。步骤10是起始动作。假设用户提交的查询图像对应于集合，其中S_L与S_U分别为已分类图像集合与未分类图像集合，图像x_i的所有可能类别由一组概念标记集合表示(Q为所有可能的概念标记个数)。步骤11在已分类图像S_L上使用已有分类方法学习得到初始分类模型，其详细说明如图3所示。接下来步骤12在所有查询图像S上使用本发明提出的分类方法优化步骤11中学得的初始分类模型，得到最终分类模型，其详细说明如图4所示。步骤13利用训练得到的最终分类模型，对数字图像存储设备中的待分类图像进行分类。在输出分类结果后，分类装置即进入步骤14所示的结束状态。

图3给出了图2中步骤11的详细描述，具体说明了如何利用已有分类方法在已分类图像上学习初始分类模型。图3中的步骤1100是起始状态。步骤1101至1105构成了一个循环体，循环的每一轮中生成与第q类对应的初始分类模型其中，步骤1103首先构造与第q类别l_q对应的二类训练集如果标记l_q为已分类图像集合中某个图像的相关标记，则该图像在中为正类样本，否则为负类样本。步骤1104利用二类支持向量机算法在集合上学习得到对应于第q个类别l_q的初始分类模型不难看出在每个类别的初始分类模型的训练过程中并没有使用未分类图像所包含的信息。步骤1106是结束状态。

具体来说，本发明中提出的分类方法通过多轮迭代的方式优化以下目标函数，从而得到最终分类模型：

其中，根据上一轮迭代对未分类图像的分类结果，令t＝<w_v，x_j>+b_v，方程(1)中的函数有如下两种定义方式：

图4给出了图2中步骤12的详细描述，具体说明了如何利用本发明提出的分类方法在所有的查询图像上优化步骤11中得到的初始分类模型，以得到最终分类模型(w_q，b_q)(1≤q≤Q)。图4中的步骤1200是起始状态。步骤1201中定义了迭代轮次变量t，并初始化为1。步骤1202到步骤1211构成了一个循环体，每一次循环对应一轮迭代优化。步骤1203到步骤1208也构成了一个循环体，循环的每一轮中生成第t轮迭代下第q个类别对应的分类模型具体来说，在步骤1204成立的条件下，装置在步骤1205计算集合中的图像在第t-1轮次迭代分类模型下的中间结果然后在步骤1206中判断中间结果的符号并根据所判断的符号决定将哪个方程带入方程(1)，以便于将方程(1)转换成在步骤1207中解决标准二次规划(QP)问题。当步骤1202不成立或步骤1210成立，即迭代次数超过最大迭代次数T或方程(1)收敛，装置跳转到结束状态，即步骤1212。

本发明给出了一种用于已分类图像非常有限的数字图像的分类方法，该方法通过定义自己独有的目标函数，利用大量的未分类图像优化在非常有限的已分类图像上学得的初始分类模型，有效地提高图像分类的效果。

熟知本领域的人士将理解，虽然这里为例便于解释已描述了具体实施例，但是可在不背离本发明精神和范围的情况下作出各种改变。因此，除了所附权利要求之外不能用于限制本发明。

Claims

1.一种基于未标记数据的数字图像分类方法，该方法包括以下步骤：

(1)用户从包含已分类图像与未分类图像的多标记图像库中选择查询图像，包括相关图像和不相关图像；

(2)在选取的已分类数字图像上使用已有的分类方法学习得到一个初始分类模型；

步骤(2)中首先对初始分类模型进行学习，具体包括：

所述图像分类方法由Q个线性模型组成，设用户提交的查询图像对应于集合S＝S_L∪S_U＝{(x_i，Y_i)|1≤i≤L}∪(x_j|L+1≤j≤L+U}，其中S_L与S_U分别为已分类图像集合与未分类图像集合，图像x_i的所有可能类别由一组概念标记集合表示，其中，Q为所有可能的概念标记个数；步骤(2)具体过程如下：

●对于每一个类别q(1≤q≤Q)，执行以下循环体：

a)构建为标记l_q的二类训练集，若l_q∈Y_i，则φ(Y_i，l_q)＝+1，否则为-1；

b)利用二类支持向量机算法在上学习得到初始分类模型

(3)在所有查询图像上对初始分类模型进行学习优化得到一个最终分类模型；

(4)基于最终分类模型对数字图像存储设备中待分类图像进行分类，并返回分类结果；

(5)如果用户对分类结果满意，则执行步骤(6)，否则从多标记图像库中选择更多的查询图像进行反馈，执行步骤(2)；

(6)结束。

2.根据权利要求1 所述的基于未标记数据的数字图像分类方法，其中，步骤(3)中对初始分类模型进行学习之后得到最终分类模型，具体包括以下步骤：

●设定最大迭代轮数T；

●对于每一轮迭代t(1≤t≤T)，执行以下循环体：

■对于每一个类别q(1≤q≤Q)，执行以下循环体：

a)计算其中L+1≤j≤L+U；

b)若则将Eq.(2)带入Eq.(1)；反之将Eq.(3)带入Eq.(1)；

c)使用标准QP方法优化Eq.(1)，可得

■将带入Eq.(1)，结果记为a；将带入Eq.(1)，结果记为b；

■若a＝b，则跳出循环体；

上述Eq.(1)，Eq.(2)以及Eq.(3)分别为：

subject to：<ω_m-ω_n，x_i>+b_m-b_n≥1-ξ_imn

。