CN110569985A

CN110569985A - 基于在线和离线决策集成学习的在线异构迁移学习的方法

Info

Publication number: CN110569985A
Application number: CN201910820027.8A
Authority: CN
Inventors: 吴庆耀; 闫玉光; 谭明奎; 毕朝阳
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2019-03-09
Filing date: 2019-08-31
Publication date: 2019-12-13

Abstract

本发明公开了基于在线和离线决策集成学习的在线异构迁移学习的方法。所述方法包括：初始化离线和在线决策模型的相关参数。对于在线每次得到的新目标数据，结合已有的源域数据和关联源域和目标域数据的共现数据，分别计算源域数据和共现数据、目标域数据和共现数据的皮尔森相关系数，以此得到异构的源域数据和目标域数据的相似性；然后对于每次迭代的目标域数据，选取与其最相似的k个源域数据，基于它们构建对目标数据的离线决策模型；而在线模型只用依次得到的目标数据构建简单的线性决策模型。最后对在线和离线模型进行组合，通过预测目标数据计算损失函数更新决策模型，并对每次得到的在线目标数据循环上述做法。本发明能够很好的对动态在线的数据进行预测。

Description

基于在线和离线决策集成学习的在线异构迁移学习的方法

技术领域

本发明涉及机器学习及数据挖掘领域,具体涉及基于在线和离线决策集成学习的在线异构迁移学习的方法

背景技术

随着计算能力、大数据持续快速增长人工智能领域的创新与应用不断涌现，深度神经网络已经在人工智能领域更受到越来越多的关注。而深度神经网络在实际应用中需要大量训练数据，这也是深度神经网络的一大难题。迁移学习希望能够将人类的迁移学习的方式应用到机器学习与数据挖掘的领域中，从而能够从源域的海量数据和分类器中获得知识，提升目标域的分类器的性能。根据源域和目标域特征空间的关系，迁移学习可以分为同构迁移学习和异构迁移学习两大类。源域和目标域的特征空间相同的视为同构迁移学习，反之为异构迁移学习。

异构迁移学习主要研究源域和目标域数据特征空间不同的问题情景。目前的异构迁移学习方法，主要是假设所有目标域的训练样本都被提前给出，而没有有效结合在线方式获取数据，因而对在线异构的迁移学习问题还存在很多研究的方面。本发明将提出利用在线和离线决策集成学习的方法来实现在线异构迁移学习的任务。

发明内容

本发明的目的是提供基于在线和离线决策集成学习的在线异构迁移学习的方法，克服现有技术存在的不足。

本发明的目的可以采取以下技术方案实现。

基于在线和离线决策集成学习的在线异构迁移学习的方法，包括如下步骤：

S1：初始化在线的决策模型、离线的决策模型以及集成学习模型的模型参数；

S2：对在线得到的第i个新目标域数据x_i建立在线和离线的组合决策模型计算预测值

S3：利用计算得到的预测值更新在线目标决策模型h(·)；

S4：更新所述相关参数得到调整后的集成学习模型；

S5：重复步骤S2-S4直到参数收敛，得到训练好的集成学习模型。

集成学习模型最终由在线决策模型h(·)、离线决策模型h^s(·)和组合控制参数θ^s、θ^t组成。后述公式(1)(2)(3)将分别给出在线决策模型、离线决策模型和组合集成学习模型的模型函数。

作为一种具体的实施方案，步骤S1中，所述的初始化数据包括以下步骤：

S11：在线的决策模型h(x)定义为线性分类器：

h(x)＝w^Tx (1)

其中，w在开始学习前需要进行初始化，其初始化参数w₁定义为：

w₁＝0

S12：对集成学习模型(由离线决策模型、在线决策模型和各自的权重参数组合而成)的初始权重进行带约束的随机初始化：

其中分别对应离线决策模型和在线决策模型在组合时的权重。

作为一种具体的实施方案，步骤S2中，所述计算预测值的具体方法为：

S21：得到有类标(有人工标注的真实数据类别)的源域数据和目标域数据两种异构的数据有共现数据相关联；；这里使用上标s代表源域，上标t代表源域，上标c代表共现数据，n为样本总数，x代表样本特征，y代表样本类别，u代表共现数据中属于源域特征的部分，v代表代表共现数据中属于目标域特征的部分。

S22：分别计算第l个源域数据与第j个共现数据的皮尔森相关系数以及第i个目标域数据与第j个共现数据的皮尔森相关系数

其中，下标p表示向量的第p个元素，d是向量的维数，表示某个向量*元素的平均值，在上式中*可以是x、u或者v。ε是一个很小的常量(例如：1^-10)。

S23：以共现数据与源域数据的相关系数和共现数据与目标域数据的相关系数为桥梁，计算源域数据和目标域数据的相似性

n^c为共现数据的样本总数

S24：找到与目标域数据最相似的k个源域数据，按以下公式加权求和得出离线的决策模型

其中集合N包含了与目标数据最相似的k个源域数据，下标τ代表集合N中的第τ个样本。

S25：组合在线和离线的决策模型，获得集成学习模型，并对目标域数据的类标进行预测：

其中φ()为对两个决策模型的映射函数，具体为：

这里z可以是或者

作为一种具体的实施方案，步骤S3中，所述决策函数更新方法，具体如下：

S31：计算hinge损失函数

S32：计算更新步长这里c是人工经验设定的超参数，用于防止更新步长过大导致模型不收敛。

S33：更新决策函数的参数值：

w_i+1＝w_i+τ_iy_ix_i

作为一种具体的实施方案，步骤S4中，所述集成学习模型的参数更新方法具体如下：

S41：更新权重参数和参数公式如下：

其中β∈(0,1)，ψ是控制参数更新速率的函数，具体为：

S42：把更新后的权重参数标准化，获得集成学习模型更新后的组合参数和

具体的，本发明包括：初始化离线和在线决策模型的相关参数。对于在线每次得到的新目标数据，结合已有的源域数据和关联着源域和目标域数据的共现数据(即图1中的离线的辅助数据)，分别计算源域数据和共现数据、目标域数据和共现数据的皮尔森相关系数，以此得到异构的源域数据和目标域数据的相似性。然后对于每次迭代的目标域数据，选取与其最相似的k个源域数据，基于它们构建对目标数据的离线决策模型；而在线模型只用依次得到的目标数据构建简单的线性决策模型。最后对在线和离线模型进行组合，通过预测目标数据计算损失函数更新决策模型，并对每次得到的在线目标数据循环上述做法。

本发明通过利用易得的离线数据和共现数据，能够很好的对动态在线的数据进行预测。本发明利用共现数据关联了离线的源域数据对实时的在线目标域数据构建离线决策模型，并与线性的简单在线决策模型进行集成学习，从而实现对异构数据进行良好预测的效果。

附图说明

图1为本发明实施例1的一种基于在线和离线决策集成学习的在线异构迁移学习的方法的流程图。

图2为本发明实施例1的迭代中构建组合决策模型的流程图。

图3为本发明实施例1中所述共现数据的样例示意图。

图4为本发明实施例1中源域文本数据和目标域图像数据通过共现数据联系的示意图。

图5为本发明实施例1中，给定不同数量的目标域训练样本时，利用本方法得到的模型与其他方法得到的分类模型，进行图像类别预测时的分类误差对比折线图。

具体实施方式

下面结合实施例及附图对本发明做进一步详细的描述，但本发明的实施方式不限于此。需指出的是，以下若有未特别详细说明之过程或符号，均是本领域技术人员可参照现有技术理解或实现的。

实施例1：

本实施例实现了一种基于在线和离线决策集成学习的在线异构迁移学习的方法。在本实施例中，源域数据是有标签的文本数据(例如：一段对小鸟特征进行描述的文章)，目标域数据是一张没有标签的图像数据(例如：某个物体的图像)，共现数据(离线的辅助数据)是图片以及对该图片的描述，即同时包含源域和目标域的特征。本实施例中以文本数据为源域，图像数据为目标域，因此两者的特征是在不同的特征空间的，即异构的。为了方便模型对各种特征进行处理，需要先行对源域数据和目标域数据进行特征提取，数据特征的具体提取方法应使用神经网络。对于文本数据，可以用循环神经网络(RNN)或者长短时记忆网络(LSTM)进行提取，对于图像数据可以使用卷积神经网络(CNN)进行提取。如图1所示，本实施例1包括以下步骤：

S3：利用计算得到的预测值更新在线目标决策模型h(·)；

S4：更新所述相关参数得到调整后的集成学习模型；

所述的初始化数据包括以下步骤：

S11：在线的决策模型h(x)定义为线性分类器，给定提取好特征的源域(文本)数据，在线决策模型的函数为：

h(x)＝w^Tx (1)

w₁＝0

如图2所示，实施例1中所述用组合模型计算预测值的具体步骤为：

S21：从数据库中获取有类标(有人工标注的真实数据类别)的源域数据和目标域数据两种异构的数据有共现数据相关联；这里使用上标s代表源域，上标t代表源域，上标c代表共现数据，n为样本总数，x代表样本特征，y代表样本类别，u代表共现数据中属于源域特征的部分，v代表代表共现数据中属于目标域特征的部分。

n^c为共现数据的样本总数。如图3所示，通过与共现数据的皮尔森相关系数的作用，源域(文本)数据和目标域(图像)数据得到相关性联系。可以利用共现数据作为桥梁达到源域数据向目标域数据的知识迁移效果。

其中集合N包含了与目标域数据最相似的k个源域数据，下标τ代表集合N中的第τ个样本。

其中φ()为对两个决策模型的映射函数，具体为：

这里z可以是或者

所述决策函数更新方法，具体如下：

S31：计算hinge损失函数

S33：更新决策函数的参数值：

w_i+1＝w_i+τ_iy_ix_i

所述相关参数更新方法具体如下：

S41：更新权重参数和参数公式如下：

其中β∈(0,1)，ψ是控制参数更新速率的函数，具体为：

通过上述方法，迭代更新模型参数直到模型收敛。可以令在文本领域的、关于某种类别的描述性知识直接用于对图像领域的该物体的识别之中，达到迁移学习的效果。如图5所示，给定少量目标域训练数据，本发明的方法比通用方法(如PA方法)能获得较大的识别错误率降低；在给定较多的训练数据的前提下，本发明能够获得最优的迁移识别效果。

上述实例利用了图像与文本的共现数据，关联了离线的文本数据对实时的在线图像数据构建离线决策模型，并与线性的简单在线决策模型进行集成学习，从而实现对异构数据进行良好预测的效果。该实施例说明了本方法能够有效地将源域知识传递到目标域的分类识别当中，使得人类的迁移学习的方式可以应用于机器学习和数据挖掘领域。

以上所述，仅为本发明专利优选的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方法及其发明专利构思加以等同替换或改变，都属于本发明专利的保护范围。

Claims

1.基于在线和离线决策集成学习的在线异构迁移学习的方法，其特征在于，所述方法包括以下步骤：

S3：利用计算得到的预测值更新在线目标决策模型h(·)；

S4：更新所述相关参数得到调整后的集成学习模型；

2.根据权利要求1所述的基于在线和离线集成学习的在线异构迁移学习的方法，其特征在于，所述步骤S1中，所述初始化方法如下：

S11：在线的决策模型的初始参数初始化为0；

S12：由源域的离线决策模型和目标域的在线决策模型组合的初始权重进行随机初始化。

3.根据权利要求1所述的基于在线和离线集成学习的在线异构迁移学习的方法，其特征在于，所述步骤S2中，所述计算预测值的具体方法为：

S21：得到有类标(有人工标注的真实数据类别)的源域数据和目标域数据两种异构的数据有共现数据相关联；这里使用上标s代表源域，上标t代表源域，上标c代表共现数据，n为样本总数，x代表样本特征，y代表样本类别，u代表共现数据中属于源域特征的部分，v代表代表共现数据中属于目标域特征的部分。

S22：分别计算源域数据和目标域数据与共现数据的皮尔森相关系数；目标域数据可以是与源域不同来源的数据，如文本数据。

S23：以共现数据与源域数据的相关系数和共现数据与目标域数据的相关系数为桥梁，计算源域同数据和目标域数据的相似性；

S24：找到与目标域数据x_i最相似的k个源域数据，按照加权求和得出离线的决策模型，k为源域数据中于目标域数据x_i最相似的数据的个数；

S25：组合在线和离线的决策模型，对目标域数据x_i进行预测。

4.根据权利要求1所属的一种基于在线和离线集成学习的在线异构迁移学习的方法，其特征在于，所述步骤S3中，所述更新在线目标决策模型的方法如下：

根据S25的预测结果与目标域数据类标计算hinge损失并更新在线决策模型权重以及集成学习模型中组合控制参数的权重。

5.根据权利要求1所属的一种基于在线和离线集成学习的在线异构迁移学习的方法，其特征在于，所述源域数据为图像数据；所述目标域数据是文本数据；所述共现数据为两个数据域的结合，即文本与图像数据共同出现的数据，其特点是每个共现数据中文本与图像的意义是紧密关联或者一致的。