CN107491788A

CN107491788A - 一种基于字典学习的零样本分类方法

Info

Publication number: CN107491788A
Application number: CN201710722442.0A
Authority: CN
Inventors: 于云龙; 冀中; 庞彦伟
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2017-08-21
Filing date: 2017-08-21
Publication date: 2017-12-19

Abstract

一种基于字典学习的零样本分类方法，包括：建立适用于零样本学习的字典学习模型；利用字典学习模型学习字典矩阵D和转移矩阵P；利用学习到的字典矩阵D和转移矩阵P实现零样本分类。本发明的一种基于字典学习的零样本分类方法，首先将类别语义特征映射到一个能保持语义判别信息的隐空间中，并结合字典学习的方法利用隐空间的特征对原始的视觉特征进行重构。

Description

一种基于字典学习的零样本分类方法

技术领域

本发明涉及一种零样本分类方法。特别是涉及一种将类别的语义信息映射到一个更具有判别性的隐空间中，并结合字典学习提高模型的可预测性的基于字典学习的零样本分类方法。

背景技术

与传统的分类不同，零样本分类是对训练时未出现过的类别的样本进行分类。显然，利用传统的单模态分类方法不能解决零样本分类问题。为了解决这一问题，研究者们利用语义特征挖掘训练类别和未训练类别之间的关系，从而实现对测试样本的分类。在类别的语义特征空间，类和类之间的语义关系可以利用语义特征来衡量。由于表示类别的语义特征无法直接获得，只能利用某种辅助语义特征近似表示。当前用于表示类别的语义特征主要有属性特征和文本特征两种，然后建立视觉特征和语义特征之间的映射关系。但是属性或者词向量这些语义信息之间存在一定的冗余信息，所以利用别语义这些语义信息作为特征会降低模型的判别性。

当前的零样本分类方法主要分为两种：一种是在训练时利用训练样本学习一个映射矩阵，将底层的视觉特征映射到类别语义空间中，或者将样本视觉特征和样本的类别语义特征映射到一个公共的隐空间中，然后在测试时利用映射矩阵将测试样本映射到类别的语义空间或者公共的隐空间中，计算测试样本与所有未训练类别的相似度，并利用最近邻方法对测试样本进行分类；另一种方法是利用训练样本学习一个兼容矩阵，通过兼容矩阵可以计算底层的视觉特征和类别语义特征之间的相似度，对于测试样本，利用学习到的兼容矩阵计算测试样本与所有未训练类别之间的相似度，然后利用分类器对测试样本的类别进行预测。

发明内容

本发明所要解决的技术问题是，提供一种能够实现不同模态的特征到类别空间之间转移的基于字典学习的零样本分类方法。

本发明所采用的技术方案是：一种基于字典学习的零样本分类方法，包括如下步骤：

1)建立适用于零样本学习的字典学习模型：

其中，N表示训练样本的个数，表示第i个样本的视觉特征，d_x是样本的视觉特征的维度；D为需要学习的字典矩阵；表示N个样本在隐空间中的嵌入特征，c_i为x_i在隐空间中的嵌入特征；P为转移矩阵；表示N个样本所对应的类别语义特征，表示第i个样本所对应的类别语义特征，d_y是类别相应语义特征的维度；λ表示权重系数；||·||_F表示Frobenius范数；

2)利用字典学习模型学习字典矩阵D和转移矩阵P；

3)利用学习到的字典矩阵D和转移矩阵P实现零样本分类。

步骤2)所述的学习字典矩阵D和转移矩阵P包括：

(1)首先：初始化字典矩阵D和转移矩阵P，对隐空间中的嵌入特征C进行更新：优化问题变为公式：

所述公式是一个最小二乘优化问题，所以得到嵌入特征C的显式表示：

C＝(D^TD+λI)^-1(λPY+D^TX) (3)

(2)固定字典矩阵D和嵌入特征C，对转移矩阵P进行更新：

得到转移矩阵P的显式表示：

P^*＝λCY(λYY^T+τI)^-1 (5)

(3)固定嵌入特征C和转移矩阵P，对字典矩阵D进行更新：

对字典矩阵D的优化目标函数通过交替方向乘子法进行优化；

(4)重复第(1)步～第(3)步直到收敛为止。

第(4)步所述收敛的条件为：两次相邻迭代的变化之差小于设定的阈值。

步骤3)所述的零样本分类是采用如下公式进行：

其中，x_t为测试样本，是m个测试类别的类别语义特征。

本发明的一种基于字典学习的零样本分类方法，首先将类别语义特征映射到一个能保持语义判别信息的隐空间中，并结合字典学习的方法利用隐空间的特征对原始的视觉特征进行重构。其优势主要体现在：

1、新颖性:首次将稀疏字典学习的思想应用到零样本分类中，利用类别语义特征所对应的隐空间特征，对原始的视觉特征进行重构，并提出一种联合优化的方法，能够更好地挖掘不同模态之间的语义判别信息。

2、有效性：与传统的字典学习方法不同，本发明所提的算法不需要传统字典学习模型中的稀疏约束，将稀疏约束转换为一种线性描述，显著提高了训练效率，但同时能够保持字典学习中的可预测性。

3、实用性：本发明简单高效，可以应用在多模态检索，数据挖掘，零样本分类等相关领域。

附图说明

图1是本发明一种基于字典学习的零样本分类方法的流程图。

具体实施方式

下面结合实施例和附图对本发明的一种基于字典学习的零样本分类方法做出详细说明。

本发明的一种基于字典学习的零样本分类方法，是针对零样本分类中利用类别语义特征表达能力差的问题提出的一种将字典学习用于零样本分类的基本框架，其目的是为了提高类别语义信息的判别性，提出将类别语义的语义信息映射到一个能保持语义的隐空间中；并结合字典学习以提高模型的可预测性。并提出了一种联合优化的方法以平衡模型的判别性和可预测性，提高了字典学习的训练效率。

如图1所示，本发明的一种基于字典学习的零样本分类方法，在训练阶段，输入训练样本的视觉特征和类别语义辅助信息，利用所提出的模型，学习一个用于重构视觉特征的字典矩阵和一个能将类别的语义信息映射到更具有判别性的隐空间中的转移矩阵；在测试阶段，给定自m个未训练过的类别的M个测试样本,首先利用学习到的转移矩阵将m个未训练类别的类别语义特征映射到隐空间中，得到m个未训练类别的隐空间特征c_v,v∈{1,2,...,m}，然后利用学习到的字典矩阵D对未训练类别所对应的隐空间特征进行重构。对于测试样本x_t，计算测试样本x_t与m未训练类别的重构特征的相似度，并利用最近邻方法对测试样本的类别进行预测。

本发明的一种基于字典学习的零样本分类方法，具体包括如下步骤：

1)建立适用于零样本学习的字典学习模型：

2)利用字典学习模型学习字典矩阵D和转移矩阵P；所述的学习字典矩阵D和转移矩阵P包括：

C＝(D^TD+λI)^-1(λPY+D^TX) (3)

(2)固定字典矩阵D和嵌入特征C，对转移矩阵P进行更新：

得到转移矩阵P的显式表示：

P^*＝λCY(λYY^T+τI)^-1 (5)

(3)固定嵌入特征C和转移矩阵P，对字典矩阵D进行更新：

对字典矩阵D的优化目标函数通过交替方向乘子法进行优化；

(4)重复第(1)步～第(3)步直到收敛为止。所述收敛的条件为：两次相邻迭代的变化之差小于设定的阈值。

3)利用学习到的字典矩阵D和转移矩阵P实现零样本分类。所述的零样本分类是采用如下公式进行：

其中，x_t为测试样本，是m个测试类别的类别语义特征。

Claims

1.一种基于字典学习的零样本分类方法，其特征在于，包括如下步骤：

1)建立适用于零样本学习的字典学习模型：

<mrow> <mtable> <mtr> <mtd> <mrow> <munder> <mi>min</mi> <mrow> <mi>D</mi> <mo>,</mo> <mi>P</mi> <mo>,</mo> <mi>C</mi> </mrow> </munder> <mo>|</mo> <mo>|</mo> <mi>X</mi> <mo>-</mo> <mi>D</mi> <mi>C</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&lambda;</mi> <mo>|</mo> <mo>|</mo> <mi>P</mi> <mi>Y</mi> <mo>-</mo> <mi>C</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <msup> <mi>P</mi> <mi>T</mi> </msup> <mi>P</mi> <mo>=</mo> <mi>I</mi> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>&le;</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

2)利用字典学习模型学习字典矩阵D和转移矩阵P；

3)利用学习到的字典矩阵D和转移矩阵P实现零样本分类。

2.根据权利要求1所述的一种基于字典学习的零样本分类方法，其特征在于，步骤2)所述的学习字典矩阵D和转移矩阵P包括：

<mrow> <msup> <mi>C</mi> <mo>*</mo> </msup> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mi>C</mi> </munder> <mo>|</mo> <mo>|</mo> <mi>X</mi> <mo>-</mo> <mi>D</mi> <mi>C</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&lambda;</mi> <mo>|</mo> <mo>|</mo> <mi>P</mi> <mi>Y</mi> <mo>-</mo> <mi>C</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

C＝(D^TD+λI)^-1(λPY+D^TX) (3)

(2)固定字典矩阵D和嵌入特征C，对转移矩阵P进行更新：

<mrow> <mtable> <mtr> <mtd> <mrow> <msup> <mi>P</mi> <mo>*</mo> </msup> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mi>P</mi> </munder> <mi>&lambda;</mi> <mo>|</mo> <mo>|</mo> <mi>P</mi> <mi>Y</mi> <mo>-</mo> <mi>C</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <msup> <mi>P</mi> <mi>T</mi> </msup> <mi>P</mi> <mo>=</mo> <mi>I</mi> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

得到转移矩阵P的显式表示：

P^*＝λCY(λYY^T+τI)^-1 (5)

(3)固定嵌入特征C和转移矩阵P，对字典矩阵D进行更新：

对字典矩阵D的优化目标函数通过交替方向乘子法进行优化；

(4)重复第(1)步～第(3)步直到收敛为止。

3.根据权利要求2所述的一种基于字典学习的零样本分类方法，其特征在于，第(4)步所述收敛的条件为：两次相邻迭代的变化之差小于设定的阈值。

4.根据权利要求1所述的一种基于字典学习的零样本分类方法，其特征在于，步骤3)所述的零样本分类是采用如下公式进行：

其中，x_t为测试样本，是m个测试类别的类别语义特征。