CN110705591A - 一种基于最优子空间学习的异构迁移学习方法 - Google Patents

一种基于最优子空间学习的异构迁移学习方法 Download PDF

Info

Publication number
CN110705591A
CN110705591A CN201910825981.6A CN201910825981A CN110705591A CN 110705591 A CN110705591 A CN 110705591A CN 201910825981 A CN201910825981 A CN 201910825981A CN 110705591 A CN110705591 A CN 110705591A
Authority
CN
China
Prior art keywords
data
model
target domain
learning
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910825981.6A
Other languages
English (en)
Inventor
吴庆耀
闫玉光
毕朝阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Publication of CN110705591A publication Critical patent/CN110705591A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于最优子空间的异构迁移学习方法。所述方法包括:从数据库中取出用于异构迁移学习的源域和目标域数据;基于典型关联分析和多分类损失函数构建模型,使得目标函数表现为既能找出两个域最关联的特征映射子空间,又能使该特征空间中的特征具有强分类能力;对目标函数进行等价转化,以简化模型;对简化后的模型进行处理,使用交替方向乘子法将整个模型的优化问题分为三个子问题,求解得到三个子问题中参数变量的更新解;最后对整个问题进行迭代更新以收敛到最优。该方法较好的结合了知识迁移能力以及模型分类能力两个特点,并能较好的用于困难的异构迁移学习场景,在实际场景的应用中有很强的分类学习和数据标注能力。

Description

一种基于最优子空间学习的异构迁移学习方法
技术领域
本发明涉及异构迁移学习和半监督迁移学习领域,具体涉及一种基于最优子空间学习的异构迁移学习方法。
背景技术
近年来,人工智能技术迅猛发展,在多种实地应用场景下起到了很强的作用。人工智能技术的核心是其算法的学习以及预测。然而,随着实际应用场景的多样性和复杂性的增加。传统人工智能算法的短板越来越突出。这主要是由于传统人工智能算法是假设所学习的数据是服从同一分布的,只有服从这样的假设才能够表现出良好的结果。然而,实际应用中由于不同时间不同地域等各种原因造成数据往往是不完全服从同一分布的,这就需要迁移学习技术把学习到的知识从源域应用到目标域。一类比较困难且很有价值的实际问题是源域和目标域不仅分布有差异,且其数据的特征也不相同,这就是异构的迁移学习问题。目前有不少的研究者关注到这个问题,但有效解决该问题的方法非常有限。比如文字与图片两种数据,其特征不同即表现形式不同,但他们的实际意义可能相同,如何学习到一个领域的知识并能够去对另外一个领域的数据进行预测,具有极强的研究价值和实际意义。
发明内容
本发明的目的是提供一种基于最优子空间学习的异构迁移学习方法,克服现有技术存在的不足。
本发明的目的可以采取以下技术方案实现。
一种基于最优子空间学习的异构迁移学习方法,包括以下步骤:
S1:从数据库中获取用于迁移学习的源域和目标域数据,并基于典型关联分析方法(CCA)构建目标函数为最优子空间与分类学习相结合的模型;
S2:将已得到的模型进行合理地等价转化,使问题求解得到简化,并初始化模型参数,设定惩罚系数、平衡系数超参数;
S3:根据提出的模型得到目标域中未标记数据的假类标,并对模型的参数进行迭代优化以更新模型与假类标;
S4:重复步骤S2中的算法直到算法收敛,得到最终的模型,使用最终的模型对所有未标记的目标域数据进行预测。
作为一种具体的实施方案,步骤S1中,所述获取数据及构建模型的步骤为:
S11:从数据库中取出数据,分为源域和目标域数据,其中源域数据
Figure BDA0002189090280000021
表示为:
Figure BDA0002189090280000022
此处S代表源域,nS为数据个数,yS,i∈{1,...,K}为类别空间,数据维度为dS;目标域数据仅有少量有类别标记,其中已标记的数据表示为
Figure BDA0002189090280000023
L代表目标域的有标记样本空间,nL为该空间数据个数,yL,i∈{1,...,K}为类别空间;未标记数据表示为
Figure BDA0002189090280000024
U代表目标域的无标记样本空间,nU为该空间数据个数;目标域数据维度均为dT,两个域的类别空间一致,即两个域数据所属的可能类别相同;
S12:基于典型关联分析方法,找出两个域最关联的特征映射子空间,即从源域和目标域中分别选出n个数据映射到领域共享空间dC中,使得两个域的数据相关性最大,典型关联分析方法的目标函数表示为:
其中XS和XT分别为在源域
Figure BDA0002189090280000027
和有标注目标域中取得的样本矩阵,维度分别为dS×n和dT×n,I为单位矩阵,P和Q分别为源域数据和目标域数据的特征映射矩阵,由于优化问题常表示为最小化,典型关联分析方法的目标函数可转化为:
Figure BDA0002189090280000029
Figure BDA00021890902800000210
其中
Figure BDA00021890902800000211
指矩阵的Frobenius范数的平方。
S13:利用步骤S12中获得的映射矩阵P,将已标记的目标数据的特征进行维度扩充。对于第i个有标注目标域数据样本xL,i,用上标~表示其维度扩充后的数据形式,即
Figure BDA00021890902800000212
Figure BDA00021890902800000213
维度为dC+dT,利用扩充后的数据构建相应的交叉熵损失模型,其损失为:
Figure BDA0002189090280000031
其中K是类别总数,wk与wyL,i是模型参数。
类似地,可以将无标记的目标域数据也进行维度扩充
Figure BDA0002189090280000032
扩充后的未标注目标域数据可以通过上述交叉熵损失模型进行获得预测类标
Figure BDA0002189090280000034
同样地,利用该模型获得无标记目标域样本的损失:
Figure BDA0002189090280000035
S14:将典型关联分析方法的目标函数与所求得的交叉熵分类损失函数加权相加,使得模型学习到的特征映射子空间能够实现两个域最相关且在目标域上分类能力最强的目标,
Figure BDA0002189090280000036
Figure BDA0002189090280000037
这里w是分类模型的参数,C为惩罚系数,γ为平衡系数,是人为设定的超参数。
得到的目标函数存在非凸优化和正交约束,不能直接求解,需进行合理等价转化。
作为一种具体的实施方案,步骤S2中,所述合理转化模型的方法为:
S21:分别求得源域和目标域数据矩阵的奇异值分解矩阵,求解公式如下:
Figure BDA0002189090280000038
Figure BDA0002189090280000039
其中,随有标注目标域样本矩阵的分解,UT,1对应非零奇异值的左奇异向量、UT,2为对应零奇异值的左奇异向量,ΣT是非零奇异值、VT是右奇异向量;US,1
Figure BDA00021890902800000310
ΣS分别为源域样本的的左、右奇异向量和奇异值。
S22:使两个分解后的右奇异矩阵相乘并对所得到的矩阵进行奇异值分解,求解公式如下:
Figure BDA00021890902800000311
其中Z1
Figure BDA00021890902800000312
Σ分别是相乘矩阵做奇异值分解得到的左、右奇异向量和奇异值。
S23:将S12步骤中通过最小化目标函数获得的两个特征映射矩阵P、Q用奇异值分解后的矩阵进行表示:
P=ATΘ+BTΦT
Q=ASΘ+BSΦS
其中有
Figure BDA0002189090280000041
Figure BDA0002189090280000042
其中:为MATLAB风格的切片,Θ为正交矩阵,ΦS和ΦT为任意矩阵;
Figure BDA0002189090280000043
分别为ΣT、ΣS的逆矩阵。
S24:由P和Q得到的等价变换可以得到模型目标函数的合理转化为
s.t.ΘTΘ=I
作为一种具体的实施方案,其特征在于步骤S3中,所述迭代优化方法如下:
S31:将模型的目标函数进行预处理,构建一个矩阵其中
Figure BDA0002189090280000046
目标函数等价为
Figure BDA0002189090280000047
Figure BDA0002189090280000048
S32:使用交替方向乘子法(ADMM)进行处理,增广拉格朗日乘子式为
其中Δ是对偶向量,ρ是惩罚系数;
S33:ADMM的更新分为三个子问题,分别为三组参数向量的更新
Figure BDA00021890902800000410
Figure BDA00021890902800000411
Figure BDA00021890902800000412
其中子问题(1)可以用拟牛顿法LBFGS及MATLAB中的minfunc工具包进行求解,子问题(3)可直接求解,子问题(2)的求解用SVD分解得到UΣVT=Θ+Δ,将SVD分解得到的左右奇异向量相乘UVT即为子问题(2)的解。
本发明从数据库中取出用于异构迁移学习的源域和目标域数据,其中目标域数据仅有少量样本被标记。基于典型关联分析和多分类损失函数构建模型,使得目标函数表现为既能找出两个域最关联的特征映射子空间,又能使该特征空间中的特征具有强分类能力。由于目标函数非常复杂难以优化,对其进行等价转化,以简化模型。对简化后的模型进行处理,使用交替方向乘子法将整个模型的优化问题分为三个子问题,分别用拟牛顿法、奇异值分解方法等逐一求解得到三个子问题中参数变量的更新解。最后对整个问题进行迭代更新以收敛到最优。该方法较好的结合了知识迁移能力以及模型分类能力两个特点,并能较好的用于困难的异构迁移学习场景,在实际场景的应用中有很强的分类学习和数据标注能力。
与现有技术相比,本发明具有如下优点和技术效果:
本发明是利用典型关联分析的思想,选出源域和目标域之间最关联的映射特征扩充到目标域数据上,并把关联性目标和分类辨别性目标结合起来,能够对异构的源域和目标域起到迁移知识的同时,提升目标分类学习准确率的的作用。
附图说明
图1为本发明实施例的一种基于最优子空间学习的异构迁移学习方法的流程图。
图2为本发明实施例的构建模型的流程图。
图3为本发明实施例中发明方法和常见分类及迁移分类学习方法的性能比对图。
具体实施方式
下面结合实施例及附图对本发明做进一步详细的描述,但本发明的实施方式不限于此。
如图1所示,本实施例是一种基于最优子空间学习的异构迁移学习,利用源域图片对目标域图片进行分类的方法,本实施例包括以下步骤:
S1:从数据库中获取用于迁移学习的源域和目标域数据,并基于典型关联分析方法构建目标函数为最优子空间与分类学习相结合的模型,在本实施例中,源域样本和目标域样本都是图像数据。图片本身并不可以直接应用于算法学习之中,首先需要对这些样本进行特征的提取。源域样本数量足够,可以使用模型学习的方式自动得到便于分类的图像特征,本实施例中使用DeCAF神经网络进行学习提取;目标域样本的数量不足,不能训练出好的特征提取器,只能采用人工特征提取模式。本例中使用加速稳健特征(SURF)方法提取目标域图像的特征;如图2所示,本实施例1中的源域和目标域数据虽然均为图片,但是由于特征提取方法不同,它们的特征空间也不同,因此两个域是异构的。
S2:将已得到的模型进行合理地等价转化,使问题求解得到简化,并初始化模型参数,设定惩罚系数、平衡系数超参数;
S3:根据提出的模型得到目标域中未标记数据的假类标,并对模型的参数进行迭代优化以更新模型与假类标;
S4:重复步骤S2中的算法直到算法收敛,得到最终的模型,使用最终的模型对所有未标记的目标域数据进行预测。
如图2所示,所述获取源域和目标域数据及构建模型的步骤为:
S11:从数据库中取出数据,分为源域和目标域数据,其中源域数据
Figure BDA0002189090280000061
表示为:
Figure BDA0002189090280000062
此处S代表源域,在本实施例中,源域是有标注的图片,nS为数据个数,yS,i∈{1,...,K}为类别空间,经过DeCAF神经网络模型特征提取后,源域样本的数据维度为dS;目标域数字图片仅有少量有类别标记,其中已标记的数据表示为
Figure BDA0002189090280000063
L代表目标域的有标记样本空间,nL为该空间数据个数,yL,i∈{1,...,K}为类别空间;未标记的图片表示为
Figure BDA0002189090280000064
U代表目标域的无标记样本空间,nU为该空间数据个数;目标域采用加速稳健特征SURF进行特征提取,数据维度均为dT,两个域的类别空间一致,即两个域数据所属的可能类别相同;
S12:基于典型关联分析方法,找出两个域最关联的特征映射子空间,即从源域和目标域中分别选出n个数据映射到领域共享空间dC中,使得两个域的数据相关性最大,典型关联分析方法的目标函数表示为:
Figure BDA0002189090280000065
Figure BDA0002189090280000066
其中XS和XT分别为在源域
Figure BDA0002189090280000067
和有标注目标域
Figure BDA0002189090280000068
中取得的样本矩阵,维度分别为dS×n和dT×n,I为单位矩阵,P和Q分别为源域数据和目标域数据的特征映射矩阵,由于优化问题常表示为最小化,典型关联分析方法的目标函数可转化为:
Figure BDA0002189090280000072
其中
Figure BDA0002189090280000073
指矩阵的Frobenius范数的平方。
S13:利用步骤S12中获得的映射矩阵P,将已标记的目标数据的特征进行维度扩充。对于第i个有标注目标域图片数据样本xL,i,用上标~表示其维度扩充后的数据形式,即
Figure BDA0002189090280000074
Figure BDA0002189090280000075
维度为dC+dT,利用扩充后的数据构建相应的交叉熵损失模型,其损失为:
Figure BDA0002189090280000076
其中K是类别总数,wk与wyL,i是模型参数。
类似地,可以将无标记的目标域数据也进行维度扩充
Figure BDA0002189090280000077
扩充后的未标注目标域数据
Figure BDA0002189090280000078
可以通过上述交叉熵损失模型进行获得预测类标
Figure BDA0002189090280000079
同样地,利用该模型获得无标记目标域样本的损失:
Figure BDA00021890902800000710
S14:将典型关联分析方法的目标函数与所求得的交叉熵分类损失函数加权相加,使得模型学习到的特征映射子空间能够实现两个域最相关且在目标域上分类能力最强的目标,
Figure BDA00021890902800000711
Figure BDA00021890902800000712
这里w是分类模型的参数,C为惩罚系数,γ为平衡系数,是人为设定的超参数。
得到的目标函数存在非凸优化和正交约束,不能直接求解,需进行合理等价转化。
所述合理转化模型的具体方法为:
S21:分别求得源域和目标域数据矩阵的奇异值分解矩阵,求解公式如下:
Figure BDA0002189090280000081
Figure BDA0002189090280000082
其中,随有标注目标域样本矩阵的分解,UT,1对应非零奇异值的左奇异向量、UT,2为对应零奇异值的左奇异向量,ΣT是非零奇异值、VT是右奇异向量;US,1
Figure BDA0002189090280000083
ΣS分别为源域样本的的左、右奇异向量和奇异值。
S22:使两个分解后的右奇异矩阵相乘并对所得到的矩阵进行奇异值分解,求解公式如下:
Figure BDA0002189090280000084
其中Z1
Figure BDA0002189090280000085
Σ分别是相乘矩阵做奇异值分解得到的左、右奇异向量和奇异值。
S23:将S12步骤中通过最小化目标函数获得的两个特征映射矩阵P、Q用奇异值分解后的矩阵进行表示:
P=ATΘ+BTΦT
Q=ASΘ+BSΦS
其中有
Figure BDA0002189090280000086
Figure BDA0002189090280000087
其中:为MATLAB风格的切片,Θ为正交矩阵,ΦS和ΦT为任意矩阵;分别为ΣT、ΣS的逆矩阵。
S24:由P和Q得到的等价变换可以得到模型目标函数的合理转化为
Figure BDA0002189090280000089
s.t.ΘTΘ=I
所述迭代优化方法如下:
S31:将模型的目标函数进行预处理,构建一个矩阵
Figure BDA00021890902800000810
其中
Figure BDA00021890902800000811
目标函数等价为
Figure BDA0002189090280000091
Figure BDA0002189090280000092
S32:使用交替方向乘子法(ADMM)进行处理,增广拉格朗日乘子式为
Figure BDA0002189090280000093
其中Δ是对偶向量,ρ是惩罚系数;
S33:ADMM的更新分为三个子问题,分别为三组参数向量的更新
Figure BDA0002189090280000094
Figure BDA0002189090280000095
Figure BDA0002189090280000096
其中子问题(1)可以用拟牛顿法LBFGS及MATLAB中的minfunc工具包进行求解,子问题(3)可直接求解,子问题(2)的求解用SVD分解得到UΣVT=Θ+Δ,将SVD分解得到的左右奇异向量相乘UVT即为子问题(2)的解。
通过对上述优化方法进行迭代更新至收敛,模型能成功学习到从源域图片到目标域图片的特征映射子空间。该空间包含两个域最相关且在目标域上分类能力最强的目标,因此该模型能够对目标域未标注图片进行分类。如图3所示,在目标域只有三个有标注样本的前提下,采用标注样本直接学习分类器(图3中SVM分类器、Softmax分类器),准确率较低。采用本专利所提出方法,利用异构源域信息辅助目标域图片分类,相对其他常用迁移学习方法(典型关联分析CCA+Softmax、半监督异构特征增强算法SHFA与跨域地标选择算法CDLS),也能得到较高的平均准确率提升。因此,本发明能够有效利用源域的图片及其标注信息,将知识迁移到目标领域当中,以获得更好的分类实效。
以上所述,仅为本发明优选的实施例,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明所公开的范围内,根据本发明的技术方法及其发明专利构思加以等同替换或改变,都属于本发明的保护范围。

Claims (6)

1.一种基于最优子空间学习的异构迁移学习方法,其特征在于包括以下步骤:
S1:从数据库中获取用于迁移学习的源域和目标域数据,并基于典型关联分析方法构建目标函数为最优子空间与分类学习相结合的模型;
S2:将已得到的模型进行合理地等价转化,使问题求解得到简化,并初始化模型参数,设定惩罚系数、平衡系数超参数;
S3:根据提出的模型得到目标域中未标记数据的假类标,并对模型的参数进行迭代优化以更新模型与假类标;
S4:重复步骤S2中直到算法收敛,得到最终的模型,使用最终的模型对所有未标记的目标域数据进行预测。
2.根据权利要求1所述的一种基于最优子空间学习的异构迁移学习方法,其特征在于:步骤S1中,所述获取源域和目标域数据及构建模型的步骤为:
S11:从数据库中取出数据,分为源域和目标域数据,其中源域数据表示为:
Figure FDA0002189090270000012
此处S代表源域,nS为数据个数,yS,i∈{1,...,K}为类别空间,数据维度为dS;目标域数据仅有少量有类别标记,其中已标记的数据表示为
Figure FDA0002189090270000013
L代表目标域的有标记样本空间,nL为该空间数据个数,yL,i∈{1,...,K}为类别空间;未标记数据表示为
Figure FDA0002189090270000014
U代表目标域的无标记样本空间,nU为该空间数据个数;目标域数据维度均为dT,两个域的类别空间一致,即两个域数据所属的可能类别相同;
S12:基于典型关联分析方法,找出两个域最关联的特征映射子空间,即从源域和目标域中分别选出n个数据映射到领域共享空间dC中,使得两个域的数据相关性最大,典型关联分析方法的目标函数表示为:
Figure FDA0002189090270000015
Figure FDA0002189090270000016
其中XS和XT分别为在源域χS和有标注目标域χL中取得的样本矩阵,维度分别为dS×n和dT×n,I为单位矩阵,P和Q分别为源域数据和目标域数据的特征映射矩阵,由于优化问题常表示为最小化,典型关联分析方法的目标函数可转化为:
Figure FDA0002189090270000022
其中
Figure FDA0002189090270000023
指矩阵的Frobenius范数的平方。
S13:利用步骤S12中获得的映射矩阵P,将已标记的目标数据的特征进行维度扩充。对于第i个有标注目标域数据样本xL,i,用上标~表示其维度扩充后的数据形式,即
Figure FDA0002189090270000024
Figure FDA0002189090270000025
维度为dC+dT,利用扩充后的数据构建相应的交叉熵损失模型,其损失为:
其中K是类别总数,wk与wyL,i是模型参数;
因此,可将无标记的目标域数据也进行维度扩充
Figure FDA0002189090270000027
扩充后的未标注目标域数据
Figure FDA0002189090270000028
可以通过上述交叉熵损失模型进行获得预测类标
Figure FDA0002189090270000029
同样地,利用该模型获得无标记目标域样本的损失:
Figure FDA00021890902700000210
S14:将典型关联分析方法的目标函数与所求得的交叉熵分类损失函数加权相加,使得模型学习到的特征映射子空间能够实现两个域最相关且在目标域上分类能力最强的目标,
Figure FDA00021890902700000211
Figure FDA00021890902700000212
这里w是分类模型的参数,C为惩罚系数,γ为平衡系数,是人为设定的超参数;
得到的目标函数存在非凸优化和正交约束,不能直接求解,需进行合理等价转化。
3.根据权利要求1所述的一种基于最优子空间学习的异构迁移学习方法,其特征在于:步骤S2中,所述合理转化模型的具体方法为:
S21:分别求得源域和目标域数据矩阵的奇异值分解矩阵,求解公式如下:
Figure FDA0002189090270000031
Figure FDA0002189090270000032
其中,随有标注目标域样本矩阵的分解,UT,1对应非零奇异值的左奇异向量、UT,2为对应零奇异值的左奇异向量,ΣT是非零奇异值、VT是右奇异向量;US,1
Figure FDA0002189090270000033
ΣS分别为源域样本的的左、右奇异向量和奇异值;
S22:使两个分解后的右奇异矩阵相乘并对所得到的矩阵进行奇异值分解,求解公式如下:
Figure FDA0002189090270000034
其中Z1
Figure FDA0002189090270000035
Σ分别是相乘矩阵做奇异值分解得到的左、右奇异向量和奇异值;
S23:将S12步骤中通过最小化目标函数获得的两个特征映射矩阵P、Q用奇异值分解后的矩阵进行表示:
P=ATΘ+BTΦT
Q=ASΘ+BSΦS
其中有
Figure FDA0002189090270000037
其中:为MATLAB风格的切片,Θ为正交矩阵,ΦS和ΦT为任意矩阵;
Figure FDA0002189090270000038
分别为ΣT、ΣS的逆矩阵;
S24:由P和Q得到的等价变换可以得到模型目标函数的合理转化为
s.t.ΘTΘ=I
4.根据权利要求1所述的一种基于最优子空间学习的异构迁移学习方法,其特征在于:步骤S3中,所述迭代优化方法如下:
S31:将模型的目标函数进行预处理,构建一个矩阵
Figure FDA00021890902700000310
其中
Figure FDA00021890902700000311
目标函数等价为
Figure FDA0002189090270000041
Figure FDA0002189090270000042
S32:使用交替方向乘子法(ADMM)进行处理,增广拉格朗日乘子式为
其中Δ是对偶向量,ρ是惩罚系数;
S33:ADMM的更新分为三个子问题,分别为三组参数向量的更新
Figure FDA0002189090270000044
Figure FDA0002189090270000045
Figure FDA0002189090270000046
其中子问题(1)可以用拟牛顿法LBFGS及MATLAB中的minfunc工具包进行求解,子问题(3)可直接求解,子问题(2)的求解用SVD分解得到UΣVT=Θ+Δ,将SVD分解得到的左右奇异向量相乘UVT即为子问题(2)的解。
5.根据权利要求1所述的一种基于最优子空间学习的异构迁移学习方法,其特征在于:所述源域数据包括数字图像。
6.根据权利要求1所述的一种基于最优子空间学习的异构迁移学习方法,其特征在于:步骤S11中,获取源域数据
Figure FDA0002189090270000047
和目标域数据
Figure FDA0002189090270000048
Figure FDA0002189090270000049
的具体方法是特征提取法。对于不同形式的数据,特征提取法可以是:对文本数据,使用循环神经网络进行特征提取;对图像数据,使用卷积神经网络进行提取。特征提取应以网络的全连接层为特征提取层。
CN201910825981.6A 2019-03-09 2019-09-03 一种基于最优子空间学习的异构迁移学习方法 Pending CN110705591A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019101775344 2019-03-09
CN201910177534 2019-03-09

Publications (1)

Publication Number Publication Date
CN110705591A true CN110705591A (zh) 2020-01-17

Family

ID=69193311

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910825981.6A Pending CN110705591A (zh) 2019-03-09 2019-09-03 一种基于最优子空间学习的异构迁移学习方法

Country Status (1)

Country Link
CN (1) CN110705591A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401454A (zh) * 2020-03-19 2020-07-10 创新奇智(重庆)科技有限公司 一种基于迁移学习的少样本目标识别方法
CN111723857A (zh) * 2020-06-17 2020-09-29 中南大学 一种流程生产装备运行状态的智能监测方法与系统
CN111723823A (zh) * 2020-06-24 2020-09-29 河南科技学院 一种基于第三方迁移学习的水下目标检测方法
CN112181951A (zh) * 2020-10-20 2021-01-05 新华三大数据技术有限公司 一种异构数据库数据迁移方法、装置及设备
CN113132931A (zh) * 2021-04-16 2021-07-16 电子科技大学 一种基于参数预测的深度迁移室内定位方法
CN114255374A (zh) * 2022-02-28 2022-03-29 南京明博互联网安全创新研究院有限公司 一种针对软间隔支持向量机的量子方法
CN114972118A (zh) * 2022-06-30 2022-08-30 抖音视界(北京)有限公司 检查图像的降噪方法、装置、可读介质和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150234779A1 (en) * 2014-02-20 2015-08-20 Mitsubishi Electric Research Laboratories, Inc. Method for Solving Quadratic Programs for Convex Sets with Linear Equalities by an Alternating Direction Method of Multipliers with Optimized Step Sizes
CN107679580A (zh) * 2017-10-21 2018-02-09 桂林电子科技大学 一种基于多模态深度潜在关联的异构迁移图像情感极性分析方法
CN107909101A (zh) * 2017-11-10 2018-04-13 清华大学 基于卷积神经网络的半监督迁移学习字符识别方法及系统
CN107958286A (zh) * 2017-11-23 2018-04-24 清华大学 一种领域适应性网络的深度迁移学习方法
CN108460134A (zh) * 2018-03-06 2018-08-28 云南大学 基于多源域集成迁移学习的文本主题分类模型及分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150234779A1 (en) * 2014-02-20 2015-08-20 Mitsubishi Electric Research Laboratories, Inc. Method for Solving Quadratic Programs for Convex Sets with Linear Equalities by an Alternating Direction Method of Multipliers with Optimized Step Sizes
CN107679580A (zh) * 2017-10-21 2018-02-09 桂林电子科技大学 一种基于多模态深度潜在关联的异构迁移图像情感极性分析方法
CN107909101A (zh) * 2017-11-10 2018-04-13 清华大学 基于卷积神经网络的半监督迁移学习字符识别方法及系统
CN107958286A (zh) * 2017-11-23 2018-04-24 清华大学 一种领域适应性网络的深度迁移学习方法
CN108460134A (zh) * 2018-03-06 2018-08-28 云南大学 基于多源域集成迁移学习的文本主题分类模型及分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUGUANG YAN ET AL.: ""Learning Discriminative Correlation Subspace for Heterogeneous Domain Adaptation"", 《PROCEEDINGS OF THE TWENTY-SIXTH INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401454A (zh) * 2020-03-19 2020-07-10 创新奇智(重庆)科技有限公司 一种基于迁移学习的少样本目标识别方法
CN111723857A (zh) * 2020-06-17 2020-09-29 中南大学 一种流程生产装备运行状态的智能监测方法与系统
CN111723823A (zh) * 2020-06-24 2020-09-29 河南科技学院 一种基于第三方迁移学习的水下目标检测方法
CN112181951A (zh) * 2020-10-20 2021-01-05 新华三大数据技术有限公司 一种异构数据库数据迁移方法、装置及设备
CN112181951B (zh) * 2020-10-20 2022-03-25 新华三大数据技术有限公司 一种异构数据库数据迁移方法、装置及设备
CN113132931A (zh) * 2021-04-16 2021-07-16 电子科技大学 一种基于参数预测的深度迁移室内定位方法
CN113132931B (zh) * 2021-04-16 2022-01-28 电子科技大学 一种基于参数预测的深度迁移室内定位方法
CN114255374A (zh) * 2022-02-28 2022-03-29 南京明博互联网安全创新研究院有限公司 一种针对软间隔支持向量机的量子方法
CN114255374B (zh) * 2022-02-28 2022-05-20 南京明博互联网安全创新研究院有限公司 一种针对软间隔支持向量机的量子方法
CN114972118A (zh) * 2022-06-30 2022-08-30 抖音视界(北京)有限公司 检查图像的降噪方法、装置、可读介质和电子设备

Similar Documents

Publication Publication Date Title
CN110705591A (zh) 一种基于最优子空间学习的异构迁移学习方法
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN108256561B (zh) 一种基于对抗学习的多源域适应迁移方法及系统
Li et al. Classification of high-spatial-resolution remote sensing scenes method using transfer learning and deep convolutional neural network
CN109255364B (zh) 一种基于深度卷积生成对抗网络的场景识别方法
CN111881714B (zh) 一种无监督跨域行人再识别方法
CN107194336B (zh) 基于半监督深度距离度量网络的极化sar图像分类方法
CN111783831B (zh) 基于多源多标签共享子空间学习的复杂图像精确分类方法
CN110033007B (zh) 基于深度姿态预估和多特征融合的行人衣着属性识别方法
CN113076994B (zh) 一种开集域自适应图像分类方法及系统
CN108629783B (zh) 基于图像特征密度峰值搜索的图像分割方法、系统及介质
CN108537168B (zh) 基于迁移学习技术的面部表情识别方法
CN110443257B (zh) 一种基于主动学习的显著性检测方法
CN111401426B (zh) 基于伪标签学习的小样本高光谱图像分类方法
CN112861929B (zh) 一种基于半监督加权迁移判别分析的图像分类方法
CN112085055A (zh) 一种基于迁移模型雅克比阵特征向量扰动的黑盒攻击方法
CN111126464A (zh) 一种基于无监督域对抗领域适应的图像分类方法
Jiang et al. Supervised Gaussian process latent variable model for hyperspectral image classification
CN113705709A (zh) 一种改进的半监督图像分类方法、设备及存储介质
Kim et al. A shape preserving approach for salient object detection using convolutional neural networks
CN110135435A (zh) 一种基于广度学习系统的显著性检测方法及装置
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
CN113989556A (zh) 一种小样本医学影像分类方法和系统
CN112528077A (zh) 基于视频嵌入的视频人脸检索方法及系统
CN116883751A (zh) 基于原型网络对比学习的无监督领域自适应图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200117