CN109583506A - 一种基于参数迁移学习的无监督图像识别方法 - Google Patents

一种基于参数迁移学习的无监督图像识别方法 Download PDF

Info

Publication number
CN109583506A
CN109583506A CN201811489723.7A CN201811489723A CN109583506A CN 109583506 A CN109583506 A CN 109583506A CN 201811489723 A CN201811489723 A CN 201811489723A CN 109583506 A CN109583506 A CN 109583506A
Authority
CN
China
Prior art keywords
domain network
image
auxiliary
application domain
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811489723.7A
Other languages
English (en)
Other versions
CN109583506B (zh
Inventor
杨春玲
陈宇
张岩
李雨泽
朱敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201811489723.7A priority Critical patent/CN109583506B/zh
Publication of CN109583506A publication Critical patent/CN109583506A/zh
Application granted granted Critical
Publication of CN109583506B publication Critical patent/CN109583506B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

一种基于参数迁移学习的无监督图像识别方法,它属于图像识别技术领域。本发明解决了传统无监督图像识别方法存在的需要的无标签样本数量大,以及大量的无标签样本导致的训练时间长的问题。本发明直接对识别模型的参数进行迁移学习,只需要辅助领域的有标签样本和少量应用领域的无标签样本,即可对识别模型进行训练,本发明的方法克服了传统无监督图像识别方法的需要无标签样本数量大的问题,降低了对标签样本的依赖,解决了无监督识别问题,提高了模型的学习效率,更适用于数据规模较大的应用场景。本发明可以应用于图像识别技术领域。

Description

一种基于参数迁移学习的无监督图像识别方法
技术领域
本发明属于图像识别技术领域,具体涉及一种无监督图像识别方法。
背景技术
图像识别,是一种从静态图像或动态视频中检测出感兴趣目标的技术。有效的图像识别方法是实现目标跟踪、场景解析、环境感知等智能识别任务的前提和基础。在实际生活中,图像识别技术有十分广泛的应用,如自动驾驶领域的行人/车辆检测技术、安防领域的人脸识别技术等,都是以图像识别为基础而实现的。
目前的图像识别技术大多是基于机器学习理论设计实现的,主要方法是从应用场景中采集含有类别标签的图像样本,对识别模型进行训练,使模型从样本中学习到有用的特征,并能够依据这些特征进行识别。但是,当应用领域无法采集到足够的标签样本时,基于机器学习的图像识别方法将无法进行训练。这是无监督图像识别所面临的主要问题。目前的主要解决方案是利用迁移学习,使用含有大量标签样本的辅助领域和只含有无标签样本的应用领域同时训练识别模型,将模型从辅助领域学习到的知识迁移到应用领域,以提高模型的识别效果。然而,这一方法要求应用领域能够提供的无标签样本的数量较大,且模型的训练时间与样本数量直接相关,大量的无标签样本导致训练时间较长。
发明内容
本发明的目的是为解决传统无监督图像识别方法存在的需要的无标签样本数量大,以及大量的无标签样本导致的训练时间长的问题。
本发明为解决上述技术问题采取的技术方案是:
本发明的一个方案,一种基于参数迁移学习的无监督图像识别方法,该方法包括以下步骤:
步骤一、从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt
步骤二、构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
步骤三、利用辅助域图像集Xs训练辅助域网络Ns,辅助域网络Ns的所有层的学习率lr均设置为非零值;
使用交叉熵e来度量预测误差:
e=-yrs×logyps
其中,yrs为待测试图像的真实类别,yps为辅助域网络Ns的预测输出;
直至预测误差不再减小时停止训练,得到训练好的辅助域网络Ns
步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中,分别得到两个图像集在辅助域网络Ns每一层的输出特征集合其中:k=1,2,…,n,n为辅助域网络Ns的总层数,为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合,为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合;
步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim;并筛选出最低的相似度对应的层,记录最低的相似度对应层的序号lsim
步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns和应用域网络Nt的第lsim层的参数矩阵,并对提取出的参数矩阵进行PCA降维,且训练时保持辅助域网络Ns第lsim层的降维后参数矩阵与应用域网络Nt第lsim层的降维后参数矩阵的距离最小;直至应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt
步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别,得到识别结果。
本发明的另一个方案,步骤一、从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt
步骤二、构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
步骤三、利用辅助域图像集Xs训练辅助域网络Ns,辅助域网络Ns的所有层的学习率lr均设置为非零值;(在本设计中lr=0.001),训练目标是使Ns的预测误差最小;
使用交叉熵e来度量预测误差:
e=-yrs×logyps
其中,yrs为待测试图像的真实类别,yps为辅助域网络Ns的预测输出;
直至预测误差不再减小时停止训练,得到训练好的辅助域网络Ns
步骤四、依次将辅助图像集Xs和应用图像集Xt输入到训练好的辅助域网络Ns中,分别得到两个图像集在辅助域网络Ns每一层的输出特征集合其中:k=1,2,…,n,n为辅助域网络Ns的总层数,为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合,为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合;
步骤五、利用最大均值差异方法度量辅助图像集Xs和应用图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim,设置相似度阈值δ,筛选出相似度低于相似度阈值δ的所有层,并将筛选出的所有层的序号记录下来;
步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵,对提取出的每组参数矩阵进行PCA降维,得到降维后的参数矩阵;训练过程中,利用欧式距离度量每组降维后的参数矩阵的差异,且训练时始终保持各组降维后参数矩阵之间的距离之和最小;
直至应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt
步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别,得到识别结果。
本发明的有益效果是:本发明提出了一种基于参数迁移学习的无监督图像识别方法,本发明直接对识别模型的参数进行迁移学习,只需要辅助领域的有标签样本和少量应用领域的无标签样本,即可对识别模型进行训练,本发明的方法克服了传统无监督图像识别方法的需要无标签样本数量大的问题,降低了对标签样本的依赖,解决了无监督识别问题,而且本发明方法的训练时间可以减少60%以上,提高了模型的学习效率,更适用于数据规模较大的应用场景。
附图说明
图1是本发明的一种基于参数迁移学习的无监督图像识别方法的流程框图;
图2是本发明所使用的卷积神经网络的结构图。
具体实施方式
具体实施方式一:如图1所示,本实施方式所述的一种基于参数迁移学习的无监督图像识别方法,该方法包括以下步骤:
步骤一、从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt;所述应用领域是指本发明方法可以应用到的各个领域,所述辅助领域是指样本内容与所要应用到的领域相似,且包含大量标签的领域;
步骤二、构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
步骤三、利用辅助域图像集Xs训练辅助域网络Ns,辅助域网络Ns的所有层的学习率lr均设置为非零值;(在本设计中lr=0.001),训练目标是使Ns的预测误差最小;
使用交叉熵e来度量预测误差:
e=-yrs×logyps
其中,yrs为待测试图像的真实类别,yps为辅助域网络Ns的预测输出;
直至预测误差不再减小时停止训练,得到训练好的辅助域网络Ns
步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中,分别得到两个图像集在辅助域网络Ns每一层的输出特征集合其中:k=1,2,…,n,n为辅助域网络Ns的总层数,为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合,为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合;
步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim;并筛选出最低的相似度对应的层,记录最低的相似度对应层的序号lsim
步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns和应用域网络Nt的第lsim层的参数矩阵,并对提取出的参数矩阵进行PCA(PrincipalComponent Analysis,PCA)降维,且训练时保持辅助域网络Ns第lsim层的降维后参数矩阵与应用域网络Nt第lsim层的降维后参数矩阵的距离最小;直至应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt
步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别,得到识别结果。
具体实施方式二:本实施方式与具体实施方式一不同的是:所述步骤一的具体过程为:
从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt;其中:应用域图像集Xt中图像样本数量为辅助域图像集Xs中图像样本数量的十分之一;
将辅助域图像集Xs与应用域图像集Xt中的所有图像缩放到相同的尺寸。
具体实施方式三:本实施方式与具体实施方式一不同的是:所述步骤二的具体过程为:
构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
如图2所示,每个卷积神经网络包括五层卷积层conv1~conv5和三层全连接层fc1~fc3,其中:全连接层的位于卷积层之后;
在全连接层之后为图像分类器,图像分类器共有C个分支,其中:C代表能够识别的图像类别总数;且图像分类器第i个分支的输出yi表示为:
其中:p(xi)为像素矩阵xi的输出概率,p(xj)为像素矩阵xj的输出概率。
具体实施方式四:本实施方式与具体实施方式一不同的是:所述步骤五的具体过程为:利用最大均值差异方法度量辅助图像集Xs和应用图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim
其中:ms和mt分别为辅助域图像集和应用域图像集中图像样本总数,k(xi,xj)为高斯核函数;xi和xj分别为第i个图像和第j个图像的像素矩阵;
并筛选出最低的相似度对应的层,记录最低的相似度对应的层的序号lsim
具体实施方式五:本实施方式与具体实施方式一不同的是:所述步骤六的具体过程为:
将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns的第lsim层的参数矩阵Ws和应用域网络Nt的第lsim层的参数矩阵Wt,对辅助域网络Ns的第lsim层的参数矩阵Ws进行PCA降维得到降维后的参数矩阵W′s,对应用域网络Nt的第lsim层的参数矩阵Wt进行PCA降维得到降维后的参数矩阵W′t
训练过程中,利用欧式距离度量参数矩阵W′s和参数矩阵W′t之间的差异,使参数矩阵W′s和参数矩阵W′t之间的距离始终保持最小,即始终保持最小,其中:代表2范数;
当应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt;应用域网络Nt的输出信息熵的表达式为:
e1=-ypt×logypt
其中:e1代表应用域网络Nt的输出信息熵,ypt代表应用域网络Nt的预测输出。
优选地,具体实施方式一可以用实施方式六的操作代替,以获得更好的效果:
具体实施方式六:本实施方式所述的一种基于参数迁移学习的无监督图像识别方法,该方法包括以下步骤:
步骤一、从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt
步骤二、构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
步骤三、利用辅助域图像集Xs训练辅助域网络Ns,辅助域网络Ns的所有层的学习率lr均设置为非零值;(在本设计中lr=0.001),训练目标是使Ns的预测误差最小;
使用交叉熵e来度量预测误差:
e=-yrs×logyps
其中,yrs为待测试图像的真实类别,yps为辅助域网络Ns的预测输出;
直至预测误差不再减小时停止训练,得到训练好的辅助域网络Ns
步骤四、依次将辅助图像集Xs和应用图像集Xt输入到训练好的辅助域网络Ns中,分别得到两个图像集在辅助域网络Ns每一层的输出特征集合其中:k=1,2,…,n,n为辅助域网络Ns的总层数,为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合,为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合;
步骤五、利用最大均值差异方法度量辅助图像集Xs和应用图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim,设置相似度阈值δ,筛选出相似度低于相似度阈值δ的所有层,并将筛选出的所有层的序号记录下来;
步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵(提取出的层是成组的,即每组层中的一个对应于辅助域网络Ns的层,另一个对应于应用域网络Nt的层),对提取出的每组参数矩阵进行PCA降维,得到降维后的参数矩阵;训练过程中,利用欧式距离度量每组降维后的参数矩阵的差异,且训练时始终保持各组降维后参数矩阵之间的距离之和最小;
直至应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt
步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别,得到识别结果。
具体实施方式七:本实施方式与具体实施方式六不同的是:所述步骤一的具体过程为:
从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt;其中:应用域图像集Xt中图像样本数量为辅助域图像集Xs中图像样本数量的十分之一;
将辅助域图像集Xs与应用域图像集Xt中的所有图像缩放到相同的尺寸。
具体实施方式八:本实施方式与具体实施方式六不同的是:所述步骤二的具体过程为:
构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
如图2所示,每个卷积神经网络包括五层卷积层conv1~conv5和三层全连接层fc1~fc3,其中:全连接层的位于卷积层之后;
在全连接层之后为图像分类器,图像分离器共有C个分支,其中:C代表能够识别的图像类别总数;且图像分类器第i个分支的输出yi表示为:
其中:p(xi)为像素矩阵xi的输出概率,p(xj)为像素矩阵xj的输出概率。
具体实施方式九:本实施方式与具体实施方式六不同的是:所述步骤五的具体过程为:利用最大均值差异方法度量辅助图像集Xs和应用图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim
其中:ms和mt分别为辅助域图像集和应用域图像集中图像样本总数,k(xi,xj)为高斯核函数;xi和xj分别为第i个图像和第j个图像的像素矩阵;
设置相似度阈值δ,筛选出相似度低于相似度阈值δ的所有层,并将筛选出的所有层的序号记录下来。
具体实施方式十:本实施方式与具体实施方式六不同的是:所述步骤六的具体过程为:
将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵,对提取出的每组参数矩阵进行PCA降维,得到降维后的参数矩阵;训练过程中,利用欧式距离度量每组降维后参数矩阵的差异,且训练时始终保持各组降维后参数矩阵之间的距离之和最小,即始终保持最小,其中:l为低于相似度阈值的层的组数,k为低于相似度阈值的第k组层;
当应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt;应用域网络Nt的输出信息熵的表达式为:
e1=-ypt×logypt
其中:e1代表应用域网络Nt的输出信息熵,ypt代表应用域网络Nt的预测输出。
本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (10)

1.一种基于参数迁移学习的无监督图像识别方法,其特征在于,该方法包括以下步骤:
步骤一、从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt
步骤二、构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
步骤三、利用辅助域图像集Xs训练辅助域网络Ns,辅助域网络Ns的所有层的学习率lr均设置为非零值;
使用交叉熵e来度量预测误差:
e=-yrs×logyps
其中,yrs为待测试图像的真实类别,yps为辅助域网络Ns的预测输出;
直至预测误差不再减小时停止训练,得到训练好的辅助域网络Ns
步骤四、依次将辅助域图像集Xs和应用域图像集Xt输入到训练好的辅助域网络Ns中,分别得到两个图像集在辅助域网络Ns每一层的输出特征集合其中:k=1,2,…,n,n为辅助域网络Ns的总层数,为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合,为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合;
步骤五、利用最大均值差异方法度量辅助域图像集Xs和应用域图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim;并筛选出最低的相似度对应的层,记录最低的相似度对应层的序号lsim
步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns和应用域网络Nt的第lsim层的参数矩阵,并对提取出的参数矩阵进行PCA降维,且训练时保持辅助域网络Ns第lsim层的降维后参数矩阵与应用域网络Nt第lsim层的降维后参数矩阵的距离最小;直至应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt
步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别,得到识别结果。
2.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法,其特征在于,所述步骤一的具体过程为:
从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt;其中:应用域图像集Xt中图像样本数量为辅助域图像集Xs中图像样本数量的十分之一;
将辅助域图像集Xs与应用域图像集Xt中的所有图像缩放到相同的尺寸。
3.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法,其特征在于,所述步骤二的具体过程为:
构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
每个卷积神经网络包括五层卷积层和三层全连接层,其中:全连接层的位于卷积层之后;
在全连接层之后为图像分类器,图像分类器共有C个分支,其中:C代表能够识别的图像类别总数;且图像分类器第i个分支的输出yi表示为:
其中:p(xi)为像素矩阵xi的输出概率,p(xj)为像素矩阵xj的输出概率。
4.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法,其特征在于,所述步骤五的具体过程为:利用最大均值差异方法度量辅助图像集Xs和应用图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim
其中:ms和mt分别为辅助域图像集和应用域图像集中图像样本总数,k(xi,xj)为高斯核函数;xi和xj分别为第i个图像和第j个图像的像素矩阵;
并筛选出最低的相似度对应的层,记录最低的相似度对应的层的序号lsim
5.根据权利要求1所述的一种基于参数迁移学习的无监督图像识别方法,其特征在于,所述步骤六的具体过程为:
将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将应用域网络Nt的第lsim层的学习率设为非零值、除第lsim层外的其他所有层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns的第lsim层的参数矩阵Ws和应用域网络Nt的第lsim层的参数矩阵Wt,对辅助域网络Ns的第lsim层的参数矩阵Ws进行PCA降维得到降维后的参数矩阵Ws′,对应用域网络Nt的第lsim层的参数矩阵Wt进行PCA降维得到降维后的参数矩阵Wt′;
训练过程中,利用欧式距离度量参数矩阵Ws′和参数矩阵Wt′之间的差异,使参数矩阵Ws′和参数矩阵Wt′之间的距离始终保持最小,即始终保持最小,其中:代表2范数;
当应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt;应用域网络Nt的输出信息熵的表达式为:
e1=-ypt×logypt
其中:e1代表应用域网络Nt的输出信息熵,ypt代表应用域网络Nt的预测输出。
6.一种基于参数迁移学习的无监督图像识别方法,其特征在于,该方法包括以下步骤:
步骤一、从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt
步骤二、构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
步骤三、利用辅助域图像集Xs训练辅助域网络Ns,辅助域网络Ns的所有层的学习率lr均设置为非零值;
使用交叉熵e来度量预测误差:
e=-yrs×logyps
其中,yrs为待测试图像的真实类别,yps为辅助域网络Ns的预测输出;
直至预测误差不再减小时停止训练,得到训练好的辅助域网络Ns
步骤四、依次将辅助图像集Xs和应用图像集Xt输入到训练好的辅助域网络Ns中,分别得到两个图像集在辅助域网络Ns每一层的输出特征集合其中:k=1,2,…,n,n为辅助域网络Ns的总层数,为辅助域图像集Xs在辅助域网络Ns每一层的输出特征集合,为应用域图像集Xt在辅助域网络Ns每一层的输出特征集合;
步骤五、利用最大均值差异方法度量辅助图像集Xs和应用图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim,设置相似度阈值δ,筛选出相似度低于相似度阈值δ的所有层,并将筛选出的所有层的序号记录下来;
步骤六、将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵,对提取出的每组参数矩阵进行PCA降维,得到降维后的参数矩阵;训练过程中,利用欧式距离度量每组降维后的参数矩阵的差异,且训练时始终保持各组降维后参数矩阵之间的距离之和最小;
直至应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt
步骤七、利用训练好的应用域网络Nt对应用领域的图像进行识别,得到识别结果。
7.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法,其特征在于,所述步骤一的具体过程为:
从辅助领域采集含有类别标签的图像,构成辅助域图像集Xs;从应用领域采集无类别标签的图像,构成应用域图像集Xt;其中:应用域图像集Xt中图像样本数量为辅助域图像集Xs中图像样本数量的十分之一;
将辅助域图像集Xs与应用域图像集Xt中的所有图像缩放到相同的尺寸。
8.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法,其特征在于,所述步骤二的具体过程为:
构建两个结构相同的卷积神经网络,将两个结构相同的卷积神经网络分别作为辅助域网络和应用域网络,其中:辅助域网络记为Ns,应用域网络记为Nt
每个卷积神经网络包括五层卷积层和三层全连接层,其中:全连接层的位于卷积层之后;
在全连接层之后为图像分类器,图像分离器共有C个分支,其中:C代表能够识别的图像类别总数;且图像分类器第i个分支的输出yi表示为:
其中:p(xi)为像素矩阵xi的输出概率,p(xj)为像素矩阵xj的输出概率。
9.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法,其特征在于,所述步骤五的具体过程为:利用最大均值差异方法度量辅助图像集Xs和应用图像集Xt在辅助域网络Ns的每一层输出特征的相似度dsim
其中:ms和mt分别为辅助域图像集和应用域图像集中图像样本总数,k(xi,xj)为高斯核函数;xi和xj分别为第i个图像和第j个图像的像素矩阵;
设置相似度阈值δ,筛选出相似度低于相似度阈值δ的所有层,并将筛选出的所有层的序号记录下来。
10.根据权利要求6所述的一种基于参数迁移学习的无监督图像识别方法,其特征在于,所述步骤六的具体过程为:
将训练好的辅助域网络Ns中所有层的参数对应地复制到应用域网络Nt中后,将步骤五筛选出的应用域网络Nt中的所有层的学习率设为非零值、应用域网络Nt中的其他层的学习率均设为零值;
利用应用域图像集Xt训练应用域网络Nt,训练过程中分别提取出辅助域网络Ns和应用域网络Nt中低于相似度阈值δ的所有层的参数矩阵,对提取出的每组参数矩阵进行PCA降维,得到降维后的参数矩阵;训练过程中,利用欧式距离度量每组降维后参数矩阵的差异,且训练时始终保持各组降维后参数矩阵之间的距离之和最小,即始终保持最小,其中:l为低于相似度阈值的层的组数,k为低于相似度阈值的第k组层;
当应用域网络Nt的输出信息熵不再减小时停止训练,得到训练好的应用域网络Nt;应用域网络Nt的输出信息熵的表达式为:
e1=-ypt×logypt
其中:e1代表应用域网络Nt的输出信息熵,ypt代表应用域网络Nt的预测输出。
CN201811489723.7A 2018-12-06 2018-12-06 一种基于参数迁移学习的无监督图像识别方法 Expired - Fee Related CN109583506B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811489723.7A CN109583506B (zh) 2018-12-06 2018-12-06 一种基于参数迁移学习的无监督图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811489723.7A CN109583506B (zh) 2018-12-06 2018-12-06 一种基于参数迁移学习的无监督图像识别方法

Publications (2)

Publication Number Publication Date
CN109583506A true CN109583506A (zh) 2019-04-05
CN109583506B CN109583506B (zh) 2020-06-09

Family

ID=65927372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811489723.7A Expired - Fee Related CN109583506B (zh) 2018-12-06 2018-12-06 一种基于参数迁移学习的无监督图像识别方法

Country Status (1)

Country Link
CN (1) CN109583506B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275120A (zh) * 2020-01-22 2020-06-12 支付宝(杭州)信息技术有限公司 图像识别模型的训练方法及装置、图像识别方法及装置
CN111898663A (zh) * 2020-07-20 2020-11-06 武汉大学 一种基于迁移学习的跨模态遥感图像的匹配方法
CN113065662A (zh) * 2020-01-02 2021-07-02 阿里巴巴集团控股有限公司 数据处理方法、自学习系统及电子设备
CN113450825A (zh) * 2020-03-27 2021-09-28 百度在线网络技术(北京)有限公司 一种音频检测方法、装置、设备和介质
CN114783072A (zh) * 2022-03-17 2022-07-22 哈尔滨工业大学(威海) 一种基于远域迁移学习的图像识别方法
CN115375963A (zh) * 2022-07-27 2022-11-22 中关村科学城城市大脑股份有限公司 基于多级标签的图像识别模型训练方法、装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408469A (zh) * 2014-11-28 2015-03-11 武汉大学 基于图像深度学习的烟火识别方法及系统
US20170228619A1 (en) * 2016-02-05 2017-08-10 International Business Machines Corporation Tagging Similar Images Using Neural Network
CN107909101A (zh) * 2017-11-10 2018-04-13 清华大学 基于卷积神经网络的半监督迁移学习字符识别方法及系统
CN108197643A (zh) * 2017-12-27 2018-06-22 佛山科学技术学院 一种基于无监督聚类和度量学习的迁移学习方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408469A (zh) * 2014-11-28 2015-03-11 武汉大学 基于图像深度学习的烟火识别方法及系统
US20170228619A1 (en) * 2016-02-05 2017-08-10 International Business Machines Corporation Tagging Similar Images Using Neural Network
CN107909101A (zh) * 2017-11-10 2018-04-13 清华大学 基于卷积神经网络的半监督迁移学习字符识别方法及系统
CN108197643A (zh) * 2017-12-27 2018-06-22 佛山科学技术学院 一种基于无监督聚类和度量学习的迁移学习方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒋涛: "深度学习在医学图像分析中的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065662A (zh) * 2020-01-02 2021-07-02 阿里巴巴集团控股有限公司 数据处理方法、自学习系统及电子设备
CN111275120A (zh) * 2020-01-22 2020-06-12 支付宝(杭州)信息技术有限公司 图像识别模型的训练方法及装置、图像识别方法及装置
CN113450825A (zh) * 2020-03-27 2021-09-28 百度在线网络技术(北京)有限公司 一种音频检测方法、装置、设备和介质
CN113450825B (zh) * 2020-03-27 2022-06-28 百度在线网络技术(北京)有限公司 一种音频检测方法、装置、设备和介质
CN111898663A (zh) * 2020-07-20 2020-11-06 武汉大学 一种基于迁移学习的跨模态遥感图像的匹配方法
CN114783072A (zh) * 2022-03-17 2022-07-22 哈尔滨工业大学(威海) 一种基于远域迁移学习的图像识别方法
CN114783072B (zh) * 2022-03-17 2022-12-30 哈尔滨工业大学(威海) 一种基于远域迁移学习的图像识别方法
CN115375963A (zh) * 2022-07-27 2022-11-22 中关村科学城城市大脑股份有限公司 基于多级标签的图像识别模型训练方法、装置

Also Published As

Publication number Publication date
CN109583506B (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
CN109583506A (zh) 一种基于参数迁移学习的无监督图像识别方法
CN110414368B (zh) 一种基于知识蒸馏的无监督行人重识别方法
CN111967294B (zh) 一种无监督域自适应的行人重识别方法
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN107506740B (zh) 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法
CN110717526B (zh) 一种基于图卷积网络的无监督迁移学习方法
CN111814661B (zh) 基于残差-循环神经网络的人体行为识别方法
CN107316007B (zh) 一种基于深度学习的监控图像多类物体检测与识别方法
CN109344736B (zh) 一种基于联合学习的静态图像人群计数方法
CN108021947B (zh) 一种基于视觉的分层极限学习机目标识别方法
CN109214441A (zh) 一种细粒度车型识别系统及方法
CN111985581B (zh) 一种基于样本级注意力网络的少样本学习方法
CN109255284B (zh) 一种基于运动轨迹的3d卷积神经网络的行为识别方法
CN111382727B (zh) 一种基于深度学习的犬脸识别方法
CN110717493B (zh) 一种基于深度学习的含堆叠字符的车牌识别方法
CN112381248A (zh) 一种基于深度特征聚类和lstm的配电网故障诊断方法
WO2023284070A1 (zh) 基于位姿自监督对抗生成网络的弱配对图像风格迁移方法
CN105574489A (zh) 基于层次级联的暴力群体行为检测方法
CN104376611A (zh) 一种基于人脸识别的下井考勤方法及其装置
CN116416478B (zh) 一种基于图结构数据特征的生物信息学分类模型
CN117237559B (zh) 面向数字孪生城市的三维模型数据智能分析方法及系统
CN110874576A (zh) 一种基于典型相关分析融合特征的行人再识别方法
Zheng et al. Learning from the web: Webly supervised meta-learning for masked face recognition
CN114511532A (zh) 基于特征引导的通道蒸馏的太阳能电池表面缺陷检测方法
CN110909645B (zh) 一种基于半监督流形嵌入的人群计数方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200609

Termination date: 20201206