CN112364895A

CN112364895A - 一种基于属性继承的图卷积网络零样本学习方法

Info

Publication number: CN112364895A
Application number: CN202011147909.1A
Authority: CN
Inventors: 冀中; 穆丽富; 庞彦伟
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2020-10-23
Filing date: 2020-10-23
Publication date: 2021-02-12
Anticipated expiration: 2040-10-23
Also published as: CN112364895B

Abstract

本发明属于机器学习的技术领域，具体涉及一种基于属性继承的图卷积网络零样本学习方法，包括运用CNN网络提取样本图像的特征，将训练样本输入到GCN网络G_f(X)中，运用注意力机制A构建子类的语义表达，训练GCN网络G_s(X_s)，将测试样本先后输入到训练好的GCN网络G_f(X)和G_s(X_s)中，逐级地对测试样本进行分类，最终输出测试样本的子类标签。本发明使用属性特征构建语义空间，利用属性继承的图卷积网络方法学习关注样本层级之间的关系，更加全面地学习类间与类内的异同信息，从而更充分地考虑了样本层级间的异同，及充分地利用了所有样本之间的信息。

Description

一种基于属性继承的图卷积网络零样本学习方法

技术领域

本发明属于机器学习的技术领域，具体涉及一种基于属性继承的图卷积网络零样本学习方法。

背景技术

近几年，深度学习在大规模的数据集的分类任务上取得了重大进展。但是，传统的深度学习还面临了一个很重要的问题：需要大量的带有标签的训练数据，同时，对训练数据进行标注不仅需要花费大量的人力物力财力，而且在许多情况下几乎难以获得，比如濒危动物的图像。对此，学者们从人类学习新事物的过程上得到启发：仅仅使用少量样本，甚至在不使用样本的情况下就可以识别出从未见过的新事物，也就是零样本学习。零样本学习通过对可见类的学习，利用语义特征，识别未见类。也就是说，语义特征是可见类和未见类之间联系的桥梁，一般可以是属性特征，也可以是词向量。

然而，发明人发现了现有的图卷积网络零样本学习方法大多数都是直接对最基本的样本层级实现特征的学习，使用可见类的样本来学习特征，测试时根据距离度量为测试样本贴上标签，并且，此类方法的问题是没有充分考虑事物层级之间的关系，即类似于对生物的划分级别分为界、门、纲、目、科、属、种，从而忽略了级别与级别之间有一定的联系、级别之内也有一定的联系。

为此，亟需提出一种新型的零样本学习方法以解决上述问题。

发明内容

本发明的目的在于：针对现有技术的不足，提供一种基于属性继承的图卷积网络零样本学习方法，使用属性特征构建语义空间，能够利用属性继承的图卷积网络方法学习关注样本层级之间的关系，能够更全面地学习类间与类内的异同信息，从而更充分地考虑了样本层级间的异同，及充分地利用了所有样本之间的信息。

为了实现上述目的，本发明采用如下技术方案：

一种基于属性继承的图卷积网络零样本学习方法，包括以下步骤：

S1、选取样本图像，运用CNN网络提取所述样本图像的特征，获得所述样本图像的真实分类权重W_i，将语义特征

作为训练样本输入到包含a个父类的GCN网络G_f(X)中，其中，a<n，x_i表示所述训练样本中的第i个样本的语义词嵌入，并对所述G_f(X)进行训练，将一个n维的语义特征映射到一个a维的类标签上；

S2、运用注意力机制A构建子类的语义表达X_s＝A(X)，训练由a个父类扩展得到b个子类的GCN网络G_s(X_s)，a≤b<n，将一个n维的语义特征映射到一个b维的类标签上；

S3、选取测试样本，将所述测试样本的语义特征X_u先输入到训练好的所述G_f(X)中，判断所述测试样本的父类标签，再将所述测试样本输入到训练好的所述G_s(X_s)中，逐级地对所述测试样本进行分类，最终输出所述测试样本的子类标签。

进一步地，所述S1中对所述G_f(X)进行训练的过程包括：

构建所述训练样本中的可见类样本的父类标签f_m的计算公式：

其中，1<m<n，m表示可见类样本的数量，y_1i∈{1,…,a}表示父类标签，预测出所述训练样本中的n-m个剩余样本的标签

进一步地，所述S1还包括：构建m个所述可见类样本在所述G_f(X)中训练的损失参数I₁，令

得到在真实分类权重W_i的约束下对分类器的权重

的预测，所述

表示预测的分类器的权重。

进一步地，所述S2中构建子类的语义表达的过程包括：在子类的语义特征上，通过所述注意力机制A强调与父类不同的语义特征，并保留与父类相同的语义特征，从而形成属性继承的语义特征。

进一步地，所述S2中训练含有b个子类的GCN网络G_s(X_s)的过程包括：将子类的语义特征

输入到所述G_s(X_s)中；构建所述训练样本中的可见类样本的子类标签s_m的计算公式：

其中，1<m<n，m表示可见类样本的数量，y_2i∈{1,…,b}表示子类标签，预测最终子类的标签

进一步地，所述S2还包括：构建m个所述可见类样本在所述G_s(X_s)中训练的损失参数I₂，令

得到在真实分类权重W_i的约束下对分类器的权重

的预测。

进一步地，所述S3还包括通过

判断所述测试样本的父类标签，通过

最终输出所述测试样本的子类标签。

本发明的有益效果在于：1)本发明克服了现有的样本层级之间关系挖掘不足的技术问题，能够按照类别进行逐级训练和测试，并利用属性继承的图卷积网络进行零样本学习，解决了跨模态的零样本分类问题；2)本发明在测试时，先用预先训练好的网络提取特征，再用分类器在提取出的特征上做分类操作，与现存的图卷积网络方法相比，本发明设计的基于属性继承的分类性能得到显著提高，从而增强了零样本学习方法的有效性；3)本发明结构精简，相比于其他性能接近的零样本方法的训练参数更少，从而显著地提高了运行的高效性。

附图说明

图1为本发明的流程图。

图2为本发明的通过分类器输出类别的示意图。

图3为本发明中的从父类中扩展子类语义特征的网络的示意图。

具体实施方式

如在说明书及权利要求当中使用了某些词汇来指称特定组件，本领域技术人员应可理解，制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式，而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语，故应解释成“包含但不限定于”。“大致”是指在可接受的误差范围内，本领域技术人员能够在一定误差范围内解决技术问题，基本达到技术效果。

在本发明的描述中，需要理解的是，术语“上”、“下”、“前”、“后”、“左”、“右”、水平”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

以下结合附图1～3和具体实施例对本发明作进一步详细说明，但不作为对本发明的限定。

S1、选取样本图像，运用CNN网络提取样本图像的特征，获得样本图像的真实分类权重W_i，将语义特征

作为训练样本输入到包含a个父类的GCN网络G_f(X)中，其中，a<n，x_i表示训练样本中的第i个样本的语义词嵌入，并对G_f(X)进行训练，将一个n维的语义特征映射到一个a维的类标签上；

其中，对G_f(X)进行训练的过程包括：

构建训练样本中的可见类样本的父类标签f_m的计算公式：

1<m<n，m表示可见类样本的数量，y_1i∈{1,…,a}表示父类标签，预测出训练样本中的n-m个剩余样本的标签

并构建m个可见类样本在G_f(X)中训练的损失参数I₁，令

得到在真实分类权重W_i的约束下对分类器的权重

的预测，

表示预测的分类器的权重，如图2所示，语义词经过图神经网络和分类器的筛选识别后输出类别。

S2、在子类的语义特征上，通过注意力机制A强调与父类不同的语义特征，并保留与父类相同的语义特征，从而形成属性继承的语义特征，运用注意力机制A构建子类的语义表达X_s＝A(X)，训练由a个父类扩展得到b个子类的GCN网络G_s(X_s)，a≤b<n，将一个n维的语义特征映射到一个b维的类标签上；

其中，G_s(X_s)表示利用注意力机制A从a个父类中扩展出的b个子类的图神经网络，S2中训练含有b个子类的GCN网络G_s(X_s)的过程包括：将子类的语义特征

输入到G_s(X_s)中；

构建训练样本中的可见类样本的子类标签s_m的计算公式：

构建m个可见类样本在G_s(X_s)中训练的损失参数I₂，令

得到在真实分类权重W_i的约束下对分类器的权重

的预测。

S3、选取测试样本，将测试样本的语义特征X_u先输入到训练好的G_f(X)中，通过

判断测试样本的父类标签，再将测试样本输入到训练好的G_s(X_s)中，逐级地对测试样本进行分类，通过

最终输出测试样本的子类标签。

在上述步骤中，还可以以视觉特征和语义特征代表来自两个不同模态的特征，令集合

代表n个样本，其中x_i代表第i个样本的语义词嵌入，y_1i∈{1,…,a}代表父类标签，y_2i∈{1,…,b}代表其子类标签，并且，前m个样本来自可见类，剩余的n-m个样本没有类标签，而上述基于属性继承的图卷积网络零样本学习方法的步骤的目的就是用词嵌入和图中的关系确定剩余样本的类标签。

同时，与传统卷积不同，图神经网络的卷积(GCN网络)操作通过每个点与其近邻点之间的邻接矩阵来定义，每一层的卷积操作如下：

其中，

是图的归一化的n×n维的邻接矩阵，X′是来自前一层的n×k维的输入特征矩阵，W是k×c维的权重矩阵。第一层的输入是类别机器及其对应的语义嵌入向量

而且，在父类图神经网络G_f(X)中最后一层的输出维度为a，在子类图神经网络G_s(X_s)中最后一层的输出维度为b。

如图3所示，在对样本进行训练时，先在较高级别类的语义特征开始操作，比如说：猫科动物吻部短，眼睛大而圆，有胡须。其下一级别的类在继承该级别特征的基础上，进一步通过注意力机制A强调本级别所具有的特征，同时不丢掉继承来的特征，比如说：老虎属于猫科动物，除了继承吻部短，眼睛大而圆，有胡须的特征之外，它还有额外的特征：脑门上有“王”字。如此，一级一级地继承并表示特征，并构成特征空间。之后，在测试时，根据语义特征通过训练好的网络识别测试样本属于哪一较高级别类，再在下一级别的类上进行识别，直到最低级别类。

显然，本发明能够利用图卷积神经网络逐级提取图像视觉特征，能够利用类别的属性特征作为类别语义特征，不仅逐级并继承地提取数据特征，还逐级地对测试样本进行分类，从而很好地利用了属性继承的图卷积网络方法学习关注了样本层级之间的关系，并更加全面地学习了类间与类内的异同信息。

根据上述说明书的揭示和教导，本发明所属领域的技术人员还能够对上述实施方式进行变更和修改。因此，本发明并不局限于上述的具体实施方式，凡是本领域技术人员在本发明的基础上所作出的任何显而易见的改进、替换或变型均属于本发明的保护范围。此外，尽管本说明书中使用了一些特定的术语，但这些术语只是为了方便说明，并不对本发明构成任何限制。