CN109583506A

CN109583506A - 一种基于参数迁移学习的无监督图像识别方法

Info

Publication number: CN109583506A
Application number: CN201811489723.7A
Authority: CN
Inventors: 杨春玲; 陈宇; 张岩; 李雨泽; 朱敏
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2018-12-06
Filing date: 2018-12-06
Publication date: 2019-04-05
Anticipated expiration: 2038-12-06
Also published as: CN109583506B

Abstract

一种基于参数迁移学习的无监督图像识别方法，它属于图像识别技术领域。本发明解决了传统无监督图像识别方法存在的需要的无标签样本数量大，以及大量的无标签样本导致的训练时间长的问题。本发明直接对识别模型的参数进行迁移学习，只需要辅助领域的有标签样本和少量应用领域的无标签样本，即可对识别模型进行训练，本发明的方法克服了传统无监督图像识别方法的需要无标签样本数量大的问题，降低了对标签样本的依赖，解决了无监督识别问题，提高了模型的学习效率，更适用于数据规模较大的应用场景。本发明可以应用于图像识别技术领域。

Description

一种基于参数迁移学习的无监督图像识别方法

技术领域

本发明属于图像识别技术领域，具体涉及一种无监督图像识别方法。

背景技术

图像识别，是一种从静态图像或动态视频中检测出感兴趣目标的技术。有效的图像识别方法是实现目标跟踪、场景解析、环境感知等智能识别任务的前提和基础。在实际生活中，图像识别技术有十分广泛的应用，如自动驾驶领域的行人/车辆检测技术、安防领域的人脸识别技术等，都是以图像识别为基础而实现的。

目前的图像识别技术大多是基于机器学习理论设计实现的，主要方法是从应用场景中采集含有类别标签的图像样本，对识别模型进行训练，使模型从样本中学习到有用的特征，并能够依据这些特征进行识别。但是，当应用领域无法采集到足够的标签样本时，基于机器学习的图像识别方法将无法进行训练。这是无监督图像识别所面临的主要问题。目前的主要解决方案是利用迁移学习，使用含有大量标签样本的辅助领域和只含有无标签样本的应用领域同时训练识别模型，将模型从辅助领域学习到的知识迁移到应用领域，以提高模型的识别效果。然而，这一方法要求应用领域能够提供的无标签样本的数量较大，且模型的训练时间与样本数量直接相关，大量的无标签样本导致训练时间较长。

发明内容

本发明的目的是为解决传统无监督图像识别方法存在的需要的无标签样本数量大，以及大量的无标签样本导致的训练时间长的问题。

本发明为解决上述技术问题采取的技术方案是：

本发明的一个方案，一种基于参数迁移学习的无监督图像识别方法，该方法包括以下步骤：

步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集X_s；从应用领域采集无类别标签的图像，构成应用域图像集X_t；

步骤二、构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为N_s，应用域网络记为N_t；

步骤三、利用辅助域图像集X_s训练辅助域网络N_s，辅助域网络N_s的所有层的学习率l_r均设置为非零值；

使用交叉熵e来度量预测误差：

e＝-y_rs×logy_ps

其中，y_rs为待测试图像的真实类别，y_ps为辅助域网络N_s的预测输出；

直至预测误差不再减小时停止训练，得到训练好的辅助域网络N_s；

步骤四、依次将辅助域图像集X_s和应用域图像集X_t输入到训练好的辅助域网络N_s中，分别得到两个图像集在辅助域网络N_s每一层的输出特征集合和其中：k＝1,2,…,n，n为辅助域网络N_s的总层数，为辅助域图像集X_s在辅助域网络N_s每一层的输出特征集合，为应用域图像集X_t在辅助域网络N_s每一层的输出特征集合；

步骤五、利用最大均值差异方法度量辅助域图像集X_s和应用域图像集X_t在辅助域网络N_s的每一层输出特征的相似度d_sim；并筛选出最低的相似度对应的层，记录最低的相似度对应层的序号l_sim；

步骤六、将训练好的辅助域网络N_s中所有层的参数对应地复制到应用域网络N_t中后，将应用域网络N_t的第l_sim层的学习率设为非零值、除第l_sim层外的其他所有层的学习率均设为零值；

利用应用域图像集X_t训练应用域网络N_t，训练过程中分别提取出辅助域网络N_s和应用域网络N_t的第l_sim层的参数矩阵，并对提取出的参数矩阵进行PCA降维，且训练时保持辅助域网络N_s第l_sim层的降维后参数矩阵与应用域网络N_t第l_sim层的降维后参数矩阵的距离最小；直至应用域网络N_t的输出信息熵不再减小时停止训练，得到训练好的应用域网络N_t；

步骤七、利用训练好的应用域网络N_t对应用领域的图像进行识别，得到识别结果。

本发明的另一个方案，步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集X_s；从应用领域采集无类别标签的图像，构成应用域图像集X_t；

步骤三、利用辅助域图像集X_s训练辅助域网络N_s，辅助域网络N_s的所有层的学习率lr均设置为非零值；(在本设计中l_r＝0.001)，训练目标是使N_s的预测误差最小；

使用交叉熵e来度量预测误差：

e＝-y_rs×logy_ps

步骤四、依次将辅助图像集X_s和应用图像集X_t输入到训练好的辅助域网络N_s中，分别得到两个图像集在辅助域网络N_s每一层的输出特征集合和其中：k＝1,2,…,n，n为辅助域网络N_s的总层数，为辅助域图像集X_s在辅助域网络N_s每一层的输出特征集合，为应用域图像集X_t在辅助域网络N_s每一层的输出特征集合；

步骤五、利用最大均值差异方法度量辅助图像集X_s和应用图像集X_t在辅助域网络N_s的每一层输出特征的相似度d_sim，设置相似度阈值δ，筛选出相似度低于相似度阈值δ的所有层，并将筛选出的所有层的序号记录下来；

步骤六、将训练好的辅助域网络N_s中所有层的参数对应地复制到应用域网络N_t中后，将步骤五筛选出的应用域网络N_t中的所有层的学习率设为非零值、应用域网络N_t中的其他层的学习率均设为零值；

利用应用域图像集X_t训练应用域网络N_t，训练过程中分别提取出辅助域网络N_s和应用域网络N_t中低于相似度阈值δ的所有层的参数矩阵，对提取出的每组参数矩阵进行PCA降维，得到降维后的参数矩阵；训练过程中，利用欧式距离度量每组降维后的参数矩阵的差异，且训练时始终保持各组降维后参数矩阵之间的距离之和最小；

直至应用域网络N_t的输出信息熵不再减小时停止训练，得到训练好的应用域网络N_t；

本发明的有益效果是：本发明提出了一种基于参数迁移学习的无监督图像识别方法，本发明直接对识别模型的参数进行迁移学习，只需要辅助领域的有标签样本和少量应用领域的无标签样本，即可对识别模型进行训练，本发明的方法克服了传统无监督图像识别方法的需要无标签样本数量大的问题，降低了对标签样本的依赖，解决了无监督识别问题，而且本发明方法的训练时间可以减少60％以上，提高了模型的学习效率，更适用于数据规模较大的应用场景。

附图说明

图1是本发明的一种基于参数迁移学习的无监督图像识别方法的流程框图；

图2是本发明所使用的卷积神经网络的结构图。

具体实施方式

具体实施方式一：如图1所示，本实施方式所述的一种基于参数迁移学习的无监督图像识别方法，该方法包括以下步骤：

步骤一、从辅助领域采集含有类别标签的图像，构成辅助域图像集X_s；从应用领域采集无类别标签的图像，构成应用域图像集X_t；所述应用领域是指本发明方法可以应用到的各个领域，所述辅助领域是指样本内容与所要应用到的领域相似，且包含大量标签的领域；

步骤三、利用辅助域图像集X_s训练辅助域网络N_s，辅助域网络N_s的所有层的学习率l_r均设置为非零值；(在本设计中l_r＝0.001)，训练目标是使N_s的预测误差最小；

使用交叉熵e来度量预测误差：

e＝-y_rs×logy_ps

利用应用域图像集X_t训练应用域网络N_t，训练过程中分别提取出辅助域网络N_s和应用域网络N_t的第l_sim层的参数矩阵，并对提取出的参数矩阵进行PCA(PrincipalComponent Analysis，PCA)降维，且训练时保持辅助域网络N_s第l_sim层的降维后参数矩阵与应用域网络N_t第l_sim层的降维后参数矩阵的距离最小；直至应用域网络N_t的输出信息熵不再减小时停止训练，得到训练好的应用域网络N_t；

具体实施方式二：本实施方式与具体实施方式一不同的是：所述步骤一的具体过程为：

从辅助领域采集含有类别标签的图像，构成辅助域图像集X_s；从应用领域采集无类别标签的图像，构成应用域图像集X_t；其中：应用域图像集X_t中图像样本数量为辅助域图像集X_s中图像样本数量的十分之一；

将辅助域图像集X_s与应用域图像集X_t中的所有图像缩放到相同的尺寸。

具体实施方式三：本实施方式与具体实施方式一不同的是：所述步骤二的具体过程为：

构建两个结构相同的卷积神经网络，将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络，其中：辅助域网络记为N_s，应用域网络记为N_t；

如图2所示，每个卷积神经网络包括五层卷积层conv1～conv5和三层全连接层fc1～fc3，其中：全连接层的位于卷积层之后；

在全连接层之后为图像分类器，图像分类器共有C个分支，其中：C代表能够识别的图像类别总数；且图像分类器第i个分支的输出y_i表示为：

其中：p(x_i)为像素矩阵x_i的输出概率，p(x_j)为像素矩阵x_j的输出概率。

具体实施方式四：本实施方式与具体实施方式一不同的是：所述步骤五的具体过程为：利用最大均值差异方法度量辅助图像集X_s和应用图像集X_t在辅助域网络N_s的每一层输出特征的相似度d_sim：

其中：m_s和m_t分别为辅助域图像集和应用域图像集中图像样本总数，k(x_i,x_j)为高斯核函数；x_i和x_j分别为第i个图像和第j个图像的像素矩阵；

并筛选出最低的相似度对应的层，记录最低的相似度对应的层的序号l_sim。

具体实施方式五：本实施方式与具体实施方式一不同的是：所述步骤六的具体过程为：

将训练好的辅助域网络N_s中所有层的参数对应地复制到应用域网络N_t中后，将应用域网络N_t的第l_sim层的学习率设为非零值、除第l_sim层外的其他所有层的学习率均设为零值；

利用应用域图像集X_t训练应用域网络N_t，训练过程中分别提取出辅助域网络N_s的第l_sim层的参数矩阵W_s和应用域网络N_t的第l_sim层的参数矩阵W_t，对辅助域网络N_s的第l_sim层的参数矩阵W_s进行PCA降维得到降维后的参数矩阵W′_s，对应用域网络N_t的第l_sim层的参数矩阵W_t进行PCA降维得到降维后的参数矩阵W′_t；

训练过程中，利用欧式距离度量参数矩阵W′_s和参数矩阵W′_t之间的差异，使参数矩阵W′_s和参数矩阵W′_t之间的距离始终保持最小，即始终保持最小，其中：代表2范数；

当应用域网络N_t的输出信息熵不再减小时停止训练，得到训练好的应用域网络N_t；应用域网络N_t的输出信息熵的表达式为：

e₁＝-y_pt×logy_pt

其中：e₁代表应用域网络N_t的输出信息熵，y_pt代表应用域网络N_t的预测输出。

优选地，具体实施方式一可以用实施方式六的操作代替，以获得更好的效果：

具体实施方式六：本实施方式所述的一种基于参数迁移学习的无监督图像识别方法，该方法包括以下步骤：

使用交叉熵e来度量预测误差：

e＝-y_rs×logy_ps

利用应用域图像集X_t训练应用域网络N_t，训练过程中分别提取出辅助域网络N_s和应用域网络N_t中低于相似度阈值δ的所有层的参数矩阵(提取出的层是成组的，即每组层中的一个对应于辅助域网络N_s的层，另一个对应于应用域网络N_t的层)，对提取出的每组参数矩阵进行PCA降维，得到降维后的参数矩阵；训练过程中，利用欧式距离度量每组降维后的参数矩阵的差异，且训练时始终保持各组降维后参数矩阵之间的距离之和最小；

具体实施方式七：本实施方式与具体实施方式六不同的是：所述步骤一的具体过程为：

具体实施方式八：本实施方式与具体实施方式六不同的是：所述步骤二的具体过程为：

在全连接层之后为图像分类器，图像分离器共有C个分支，其中：C代表能够识别的图像类别总数；且图像分类器第i个分支的输出y_i表示为：

具体实施方式九：本实施方式与具体实施方式六不同的是：所述步骤五的具体过程为：利用最大均值差异方法度量辅助图像集X_s和应用图像集X_t在辅助域网络N_s的每一层输出特征的相似度d_sim：

设置相似度阈值δ，筛选出相似度低于相似度阈值δ的所有层，并将筛选出的所有层的序号记录下来。

具体实施方式十：本实施方式与具体实施方式六不同的是：所述步骤六的具体过程为：

将训练好的辅助域网络N_s中所有层的参数对应地复制到应用域网络N_t中后，将步骤五筛选出的应用域网络N_t中的所有层的学习率设为非零值、应用域网络N_t中的其他层的学习率均设为零值；

利用应用域图像集X_t训练应用域网络N_t，训练过程中分别提取出辅助域网络N_s和应用域网络N_t中低于相似度阈值δ的所有层的参数矩阵，对提取出的每组参数矩阵进行PCA降维，得到降维后的参数矩阵；训练过程中，利用欧式距离度量每组降维后参数矩阵的差异，且训练时始终保持各组降维后参数矩阵之间的距离之和最小，即始终保持最小，其中：l为低于相似度阈值的层的组数，k为低于相似度阈值的第k组层；

e₁＝-y_pt×logy_pt

本发明的上述算例仅为详细地说明本发明的计算模型和计算流程，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims

1.一种基于参数迁移学习的无监督图像识别方法，其特征在于，该方法包括以下步骤：

使用交叉熵e来度量预测误差：

e＝-y_rs×logy_ps

2.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤一的具体过程为：

3.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤二的具体过程为：

每个卷积神经网络包括五层卷积层和三层全连接层，其中：全连接层的位于卷积层之后；

4.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤五的具体过程为：利用最大均值差异方法度量辅助图像集X_s和应用图像集X_t在辅助域网络N_s的每一层输出特征的相似度d_sim：

5.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤六的具体过程为：

利用应用域图像集X_t训练应用域网络N_t，训练过程中分别提取出辅助域网络N_s的第l_sim层的参数矩阵W_s和应用域网络N_t的第l_sim层的参数矩阵W_t，对辅助域网络N_s的第l_sim层的参数矩阵W_s进行PCA降维得到降维后的参数矩阵W_s′，对应用域网络N_t的第l_sim层的参数矩阵W_t进行PCA降维得到降维后的参数矩阵W_t′；

训练过程中，利用欧式距离度量参数矩阵W_s′和参数矩阵W_t′之间的差异，使参数矩阵W_s′和参数矩阵W_t′之间的距离始终保持最小，即始终保持最小，其中：代表2范数；

e₁＝-y_pt×logy_pt

6.一种基于参数迁移学习的无监督图像识别方法，其特征在于，该方法包括以下步骤：

步骤三、利用辅助域图像集X_s训练辅助域网络N_s，辅助域网络N_s的所有层的学习率lr均设置为非零值；

使用交叉熵e来度量预测误差：

e＝-y_rs×logy_ps

7.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤一的具体过程为：

8.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤二的具体过程为：

9.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤五的具体过程为：利用最大均值差异方法度量辅助图像集X_s和应用图像集X_t在辅助域网络N_s的每一层输出特征的相似度d_sim：

10.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法，其特征在于，所述步骤六的具体过程为：

e₁＝-y_pt×logy_pt