CN110414545A

CN110414545A - 基于改进的核极限学习机和gan的自适应学习方法

Info

Publication number: CN110414545A
Application number: CN201910043961.3A
Authority: CN
Inventors: 何春梅; 康红宇; 徐繁华
Original assignee: Xiangtan University
Current assignee: Xiangtan University
Priority date: 2019-01-17
Filing date: 2019-01-17
Publication date: 2019-11-05
Anticipated expiration: 2039-01-17
Also published as: CN110414545B

Abstract

本发明提出了一种基于改进的核极限学习机和GAN的自适应学习方法，属于域自适应技术领域。其首先通过基于改进的核极限学习机预训练一个分类器C，然后根据传统极限学习机得到源域和目标域特征映射，结合GAN自适应学习以最小化源域映射和目标域特征映射距离，使得源分类模型C可以直接应用于目标映射，能对来自不同领域没有标注的数据进行分类，从而消除学习单独的目标分类器的需要，提高了分类器的复用性，有效增强模型对新环境的适应性，并且还解决了现有KELM中逆矩阵不存在的情况下无法求解β值的问题，同时因无需调整惩罚系数C，进一步减少了优化网络的时间。

Description

基于改进的核极限学习机和GAN的自适应学习方法

技术领域

本发明属于域自适应技术领域，涉及一种核极限学习机和GAN 的自适应学习的方法。

背景技术

机器学习是如今智能时代的一个重要研究方向，它的研究成果被广泛的应用到各个领域，在人们的日常生活中占据着越来越重要的地位。但是目前的机器学习模型只处理训练数据和测试数据来自相同分布的情况，因此从训练数据中训练出的模型能直接应用于测试数据，在实际应用中，这种情况经常是不成立的[1]。另外，我们正处于一个大数据时代，每天各行各业，生活社交中都产生着大量的图像，文本，语音等数据。机器学习依赖这些数据来训练和更新模型，使得模型的性能越来越好。然而，数据虽多，但大都处于没有标注的原始形态。数据的标注不仅非常耗时并且十分昂贵。因此，如何利用相关领域标注好的数据使机器学习具有领域间自适应学习的能力，能充分利用其它相关领域知识，而不是一定总要获得足量的同领域标记数据来进行模式训练是近年来研究的热点[2]。域自适应学习对于该问题的解决具有突出贡献，其主要应用与源域和目标域的任务相同，但数据不同且相关的情况。这类学习的核心任务是解决两个域数据的差异问题，是迁移学习[3]的一个子类。

最近域自适应方法一般可以分为基于MMD的自适应方法和基于对抗性的自适应方法，其共同的最终目标是最小化源和目标分布之间的差异。对抗性学习方法是一种很有前途的训练鲁棒深网络的方法，可以在不同的领域产生复杂的样本[4]。域对抗性学习过程是一个两人博弈，其中第一个参与者是训练域鉴别器D以区分源域和目标域的，第二个参与者是同时训练能生成混淆域判别器的特征表示F[5]。通过博弈，域鉴别器D愈来愈精明，同时最小化两个域的距离。

2004年，黄广斌教授(新加坡南阳理工大学)等人[6]提出的一种无需迭代计算、执行速度快、泛化能力强的前馈神经网络，即极速学习机。不同于其他神经网络，极速学习机通过随机生成输入层权重和偏置值，直接求解出输出权重的最小二乘解，同时得到最终的训练模型。为进一步增强ELM的泛化能力和稳定性，Huang提出将核函数引入到ELM中，提出了KELM算法[7]，利用Mercer’s条件构造核矩阵替代HH^T。在KELM中，不需要知道隐含层特征映射h(x)，也不需要设定隐含层神经元数量，因而具有比ELM更好的泛化能力和稳定性,但会出现逆矩阵不存在的极端情况并且还需调整惩罚系数C。于是何春梅等于提出了基于共轭梯度算法的线性KELM网络，新算法无需计算逆矩阵，极大地提高了网络训练速度，并且节省了内存空间的占用。同时还可以在求解β中避免出现中逆矩阵不存在的极端情况，也无需调整惩罚系数C，从而进一步减少了优化网络的时间[8]。

基于改进的核极限学习机和GAN的自适应学习方法将基于共轭梯度算法的线性KELM网络和对抗性的自适应方法有效的结合在一起，继承了KELM在效率方面上的优势，同时对于实际应用中存在的样本难以获得标签，训练模型只能应用于特定任务等问题，提供了一种解决方案，增强了算法的推广能力，提高其实用性。

[1]Chen Y,Song S,Li S,et al.Domain Space Transfer Extreme LearningMachine for Domain Adaptation[J].IEEE Transactions on Cybernetics,2018:1-14.

[2]May M.Life science technologies:Big biological impacts from bigdata[J].Science，2014，344(6189)：1298-1300.

[3]Pan S J,Yang Q.A Survey on Transfer Learning[J].IEEE Transactionson Knowledge&Data Engineering,2010, 22(10):1345-1359.

[4]Tzeng E,Hoffman J,Saenko K,et al.Adversarial Discriminative DomainAdaptation[J].2017.

[5]Mingsheng Long，Zhangjie Cao，Jianmin Wang，Michael I.Jordan.Conditional Adversarial Domain Adaptation.arXiv preprint arXiv: 1705.10667，2018.12

[6]Huang G B,Zhu Q Y,Siew C K.Extreme learning machine:a new learningsche-me of feedforward neural networks[J].Proc.int.joint Conf.neural Netw,2004,2:985-990vol.2.

[7]Huang G B,Ding X,Zhou H.Optimization method based extreme learningmachine for classification.[J].Neurocomputing,2010, 74(1-3):155-163.

[8]Chunmei He,Fanhua Xu，Yaqi Liu,Jinhua Zheng。Fast Kernel ExtremeLearning Machine based on Conjugate Gradient. Network-Computation In NeuralSystems,2019,1，DOI： 10.1080/0954898X.2018.1562247.

发明内容

本发明的目的是提供一种基于改进的核极限学习机和GAN的自适应学习方法，解决了现有KELM中逆矩阵不存在的极端情况下无法求解β值、需调整惩罚系数C，网络运行时间长、不能对来自不同领域未带标注的数据进行分类等问题。

本发明所采用的技术方案是

基于改进的核极限学习机和GAN的自适应学习方法，其特征在于首先基于改进的核极限学习机利用源域数据预训练一个分类器C，避免了在现有KELM中逆矩阵不存在的极端情况下无法求解β值、也无需调整惩罚系数C，从而进一步减少了优化网络的时间，然后根据传统极限学习机得到源域和目标域特征映射，最后结合GAN的自适应学习使得源分类模型C可以直接应用于目标映射，从而消除学习单独的目标分类器的需要。

本发明的有益效果是

1.新算法现有KELM相比，无需计算逆矩阵，极大地提高了网络训练速度，并且节省了内存空间的占用。

2.避免了现有KELM中逆矩阵不存在的极端情况无法求解β值。

3.无需调整惩罚系数C，从而进一步减少了优化网络的时间。

4.能利用带标签的源域数据训练出的基于共轭梯度算法的线性KELM预测相关未知领域数据的标签，提高分类器的复用性，有效增强模型对新环境的适应性，提高其实用性。

附图说明

图1是本发明方法的网络框架图；

图2是ELM图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

如图2本发明方法的网络框架图所示：

第一部分：

步骤一、随机生成输入权值w_i和b_i,通过

分别得到源域S和目标域T隐含层特征映射(如图2所示隐含层)H(X_S)和H(X_T)

步骤二、利用GAN自适应使源和目标映射分布之间的距离最小化:固定源域映射H(X_S),使源域映射H(X_S)和目标域数据映射H(X_T)与判别器D进行对抗训练。

步骤三、使用训练好的目标域映射和共轭梯度算法的线性KELM对目标域数据进测试

t_T＝F(X_T)＝H(X_T)β_KELM (4)

共轭梯度KELM：

输入：训练集P＝{(x_S,t_S)|x_S∈Rⁿ,t_S∈R^m}，线性核函数K(u,v)＝u·v，共轭梯度法精度ε，共轭梯度法迭代步长k。

输出：单隐含层前馈网络输出权值β_KLM。

算法步骤：

第1步：根据线性核函数K(u,v)＝u·v,构建核矩阵其中X_S＝[x₁ ^T,x₂ ^T,…,x_n ^T]^T

第2步：用共轭梯度法在方程Ω_ELMβ_KLM＝T上计算输出权重β_KLM。

Claims

1.基于改进的核极限学习机和GAN的自适应学习方法，其特征在于首先基于改进的核极限学习机利用源域数据预训练一个分类器C，然后根据传统极限学习机得到源域和目标域特征映射，最后结合GAN的自适应学习最小化源域映射和目标域特征映射距离使得源分类模型C可以直接应用于目标映射，从而消除学习单独的目标分类器的需要，至少还包括以下步骤，

步骤一、基于改进的核极限学习机利用源域数据预训练一个分类器C：

1)构建核矩阵Ω_ELM，

2)用共轭梯度法在方程Ω_ELMβ_KELM＝T上计算输出权重β_KELM；

步骤二、根据传统极限学习机得到源域和目标域特征映射：

1)随机生成输入权值w_i和b_i，

2)得到源域S极限学习机隐含层映射H(X_s)，

3)得到目标域T极限学习机隐含层映射H(X_T)；

步骤三、结合GAN的自适应学习最小化源域映射和目标域特征映射距离使得源分类模型C可以直接应用于目标映射，从而消除学习单独的目标分类器的需要：

1)固定源域映射H(X_s)，

2)源域映射H(X_s)和目标域数据映射H(X_T)与判别器D进行对抗训练，得到最优化的鉴别器D和H(X_T)，

3)使用训练好的目标域映射和共轭梯度算法的线性KELM对目标域数据进分类。

2.根据权利要求1所述的基于改进的核极限学习机和GAN的自适应学习方法，其特征在于基于改进的核极限学习机利用源域数据预训练一个分类器C，至少还包括以下步骤，

已知源域数据集合X_S＝[x₁,x₂…,x_n]∈Rⁿ和标签t_S

步骤一、构建核矩阵Ω_ELM：

1)采用线性核函数:

K(u,v)＝u·v (1)

2)利用Mercer’s条件构造核矩阵替代HH^T：

所以Ω_ELM＝X_SX_S ^T，其中X_S＝[x₁,x₂…,x_n]；

步骤二、用共轭梯度法在方程Ω_ELMβ_KELM＝T上计算输出权重β_KELM：

共轭梯度法是求解正定系数矩阵线性方程组(式(3))的一种迭代方法，而求解方程组(3)可以看成是求二次函数(式(4))的极小点，可以用共轭梯度法来求；共轭梯度法的基本思想是取当前点的负梯度方向和前面搜索方向进行共轭化，从而产生当前点的搜索方向，

A·x＝b (3)

算法描述如下：

第1步输入数据A、b,置初始值x⁽⁰⁾＝0，r⁽⁰⁾＝b-Ax⁽⁰⁾，d⁽⁰⁾＝r⁽⁰⁾，精度要求ε和迭代次数k＝0，

第2步计算r^(k+1)＝r^(k)-α_kAd^(k)，

第3步若‖x^(k+1)-x^(k)‖<ε或k＝n-1，则停止计算(x^(k+1)作为方程组的解)；否则，计算

d^(k+1)＝r^(k+1)+θ_k+1d^(k)

第4步置k＝k+1，转第2步；

因为共轭梯度法针对的是正定系数矩阵，而本方法采用线性核函数来构建的核矩阵Ω_ELM＝X_SX_S ^T是实对称矩阵，即为正定系数矩阵，从而输出权值公式改为：

β_KELM＝(Ω_ELM)^-1T (5)

即：Ω_ELMβ_KELM＝T(6)

采用共轭梯度法来求解式(6)，计算输出权重β_KELM。

3.根据权利要求1所述的基于改进的核极限学习机和GAN的自适应学习方法，其特征在于根据传统极限学习机得到源域和目标域特征映射，至少还包括，

已知源域数据集合X_S＝[x₁,x₂…,x_n]∈Rⁿ和标签集合t_S，目标域数据集合X_T＝[x₁,x₂…,x_m]∈R^m,没有标签，

步骤一、随机生成输入权值w_i和b_i：

w_i＝[w_i1,w_i2,…,w_in]^T是第i个隐层单元的输入权重，b_i是第i个隐层单元的偏置；

步骤二、得到源域S极限学习机隐含层映射H(X_S):

其中X_S ^T·w_i表示w_i和X_S ^T的内积；

步骤三、得到目标域T极限学习机隐含层映射H(X_T)：

其中X_T ^T·w_i表示w_i和X_T ^T的内积。

4.根据权利要求1所述的基于改进的核极限学习机和GAN的自适应学习方法，其特征在于结合GAN的自适应学习最小化源域映射和目标域特征映射距离使得源分类模型C可以直接应用于目标映射，从而消除学习单独的目标分类器的需要，至少还包括，

步骤一、固定源域映射H(X_s)，

步骤二、源域映射H(X_s)和目标域数据映射H(X_T)与判别器D进行对抗训练，得到最优化的鉴别器D和H(X_T)：

对于鉴别器D，我们希望它能尽量分辨出特征来自源域还是目标域，因此对于源于数据，我们希望鉴别器判定为真，即D(H(X_S))的理想结果是1；对于目标域数据，我们希望鉴别器判定为假，即D(H(X_T))的理想结果是0；通过最小化可以得到训练更新鉴别器D，用于分类出特征来自源域还是目标域；得到D后，通过最小化训练H(X_T)，以混淆D，通过这种对抗训练，最终鉴别器愈加聪明，很难被欺骗，同时训练出的H(X_T)也与H(X_s)接近，这时，源分类模型C可以直接应用于目标映射H(X_T)。

步骤三、使用训练好的目标域映射和共轭梯度算法的线性KELM对目标域数据进分类：

t_T＝F(X_T)＝H(X_T)β_KELM (9)

其中t_T为目标输出值，即预测的目标域标签；H(X_T)为最终得到的目标域映射；β_KELM为利用源域数据预训练好的共轭梯度算法的线性KELM权重参数。