CN110569985A - 基于在线和离线决策集成学习的在线异构迁移学习的方法 - Google Patents
基于在线和离线决策集成学习的在线异构迁移学习的方法 Download PDFInfo
- Publication number
- CN110569985A CN110569985A CN201910820027.8A CN201910820027A CN110569985A CN 110569985 A CN110569985 A CN 110569985A CN 201910820027 A CN201910820027 A CN 201910820027A CN 110569985 A CN110569985 A CN 110569985A
- Authority
- CN
- China
- Prior art keywords
- data
- online
- model
- offline
- domain data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于在线和离线决策集成学习的在线异构迁移学习的方法。所述方法包括:初始化离线和在线决策模型的相关参数。对于在线每次得到的新目标数据,结合已有的源域数据和关联源域和目标域数据的共现数据,分别计算源域数据和共现数据、目标域数据和共现数据的皮尔森相关系数,以此得到异构的源域数据和目标域数据的相似性;然后对于每次迭代的目标域数据,选取与其最相似的k个源域数据,基于它们构建对目标数据的离线决策模型;而在线模型只用依次得到的目标数据构建简单的线性决策模型。最后对在线和离线模型进行组合,通过预测目标数据计算损失函数更新决策模型,并对每次得到的在线目标数据循环上述做法。本发明能够很好的对动态在线的数据进行预测。
Description
技术领域
本发明涉及机器学习及数据挖掘领域,具体涉及基于在线和离线决策集成学习的在线异构迁移学习的方法
背景技术
随着计算能力、大数据持续快速增长人工智能领域的创新与应用不断涌现,深度神经网络已经在人工智能领域更受到越来越多的关注。而深度神经网络在实际应用中需要大量训练数据,这也是深度神经网络的一大难题。迁移学习希望能够将人类的迁移学习的方式应用到机器学习与数据挖掘的领域中,从而能够从源域的海量数据和分类器中获得知识,提升目标域的分类器的性能。根据源域和目标域特征空间的关系,迁移学习可以分为同构迁移学习和异构迁移学习两大类。源域和目标域的特征空间相同的视为同构迁移学习,反之为异构迁移学习。
异构迁移学习主要研究源域和目标域数据特征空间不同的问题情景。目前的异构迁移学习方法,主要是假设所有目标域的训练样本都被提前给出,而没有有效结合在线方式获取数据,因而对在线异构的迁移学习问题还存在很多研究的方面。本发明将提出利用在线和离线决策集成学习的方法来实现在线异构迁移学习的任务。
发明内容
本发明的目的是提供基于在线和离线决策集成学习的在线异构迁移学习的方法,克服现有技术存在的不足。
本发明的目的可以采取以下技术方案实现。
基于在线和离线决策集成学习的在线异构迁移学习的方法,包括如下步骤:
S1:初始化在线的决策模型、离线的决策模型以及集成学习模型的模型参数;
S2:对在线得到的第i个新目标域数据xi建立在线和离线的组合决策模型计算预测值
S3:利用计算得到的预测值更新在线目标决策模型h(·);
S4:更新所述相关参数得到调整后的集成学习模型;
S5:重复步骤S2-S4直到参数收敛,得到训练好的集成学习模型。
集成学习模型最终由在线决策模型h(·)、离线决策模型hs(·)和组合控制参数θs、θt组成。后述公式(1)(2)(3)将分别给出在线决策模型、离线决策模型和组合集成学习模型的模型函数。
作为一种具体的实施方案,步骤S1中,所述的初始化数据包括以下步骤:
S11:在线的决策模型h(x)定义为线性分类器:
h(x)=wTx (1)
其中,w在开始学习前需要进行初始化,其初始化参数w1定义为:
w1=0
S12:对集成学习模型(由离线决策模型、在线决策模型和各自的权重参数组合而成)的初始权重进行带约束的随机初始化:
其中分别对应离线决策模型和在线决策模型在组合时的权重。
作为一种具体的实施方案,步骤S2中,所述计算预测值的具体方法为:
S21:得到有类标(有人工标注的真实数据类别)的源域数据和目标域数据两种异构的数据有共现数据相关联;;这里使用上标s代表源域,上标t代表源域,上标c代表共现数据,n为样本总数,x代表样本特征,y代表样本类别,u代表共现数据中属于源域特征的部分,v代表代表共现数据中属于目标域特征的部分。
S22:分别计算第l个源域数据与第j个共现数据的皮尔森相关系数以及第i个目标域数据与第j个共现数据的皮尔森相关系数
其中,下标p表示向量的第p个元素,d是向量的维数,表示某个向量*元素的平均值,在上式中*可以是x、u或者v。ε是一个很小的常量(例如:1-10)。
S23:以共现数据与源域数据的相关系数和共现数据与目标域数据的相关系数为桥梁,计算源域数据和目标域数据的相似性
nc为共现数据的样本总数
S24:找到与目标域数据最相似的k个源域数据,按以下公式加权求和得出离线的决策模型
其中集合N包含了与目标数据最相似的k个源域数据,下标τ代表集合N中的第τ个样本。
S25:组合在线和离线的决策模型,获得集成学习模型,并对目标域数据的类标进行预测:
其中φ()为对两个决策模型的映射函数,具体为:
这里z可以是或者
作为一种具体的实施方案,步骤S3中,所述决策函数更新方法,具体如下:
S31:计算hinge损失函数
S32:计算更新步长这里c是人工经验设定的超参数,用于防止更新步长过大导致模型不收敛。
S33:更新决策函数的参数值:
wi+1=wi+τiyixi
作为一种具体的实施方案,步骤S4中,所述集成学习模型的参数更新方法具体如下:
S41:更新权重参数和参数公式如下:
其中β∈(0,1),ψ是控制参数更新速率的函数,具体为:
S42:把更新后的权重参数标准化,获得集成学习模型更新后的组合参数和
具体的,本发明包括:初始化离线和在线决策模型的相关参数。对于在线每次得到的新目标数据,结合已有的源域数据和关联着源域和目标域数据的共现数据(即图1中的离线的辅助数据),分别计算源域数据和共现数据、目标域数据和共现数据的皮尔森相关系数,以此得到异构的源域数据和目标域数据的相似性。然后对于每次迭代的目标域数据,选取与其最相似的k个源域数据,基于它们构建对目标数据的离线决策模型;而在线模型只用依次得到的目标数据构建简单的线性决策模型。最后对在线和离线模型进行组合,通过预测目标数据计算损失函数更新决策模型,并对每次得到的在线目标数据循环上述做法。
本发明通过利用易得的离线数据和共现数据,能够很好的对动态在线的数据进行预测。本发明利用共现数据关联了离线的源域数据对实时的在线目标域数据构建离线决策模型,并与线性的简单在线决策模型进行集成学习,从而实现对异构数据进行良好预测的效果。
附图说明
图1为本发明实施例1的一种基于在线和离线决策集成学习的在线异构迁移学习的方法的流程图。
图2为本发明实施例1的迭代中构建组合决策模型的流程图。
图3为本发明实施例1中所述共现数据的样例示意图。
图4为本发明实施例1中源域文本数据和目标域图像数据通过共现数据联系的示意图。
图5为本发明实施例1中,给定不同数量的目标域训练样本时,利用本方法得到的模型与其他方法得到的分类模型,进行图像类别预测时的分类误差对比折线图。
具体实施方式
下面结合实施例及附图对本发明做进一步详细的描述,但本发明的实施方式不限于此。需指出的是,以下若有未特别详细说明之过程或符号,均是本领域技术人员可参照现有技术理解或实现的。
实施例1:
本实施例实现了一种基于在线和离线决策集成学习的在线异构迁移学习的方法。在本实施例中,源域数据是有标签的文本数据(例如:一段对小鸟特征进行描述的文章),目标域数据是一张没有标签的图像数据(例如:某个物体的图像),共现数据(离线的辅助数据)是图片以及对该图片的描述,即同时包含源域和目标域的特征。本实施例中以文本数据为源域,图像数据为目标域,因此两者的特征是在不同的特征空间的,即异构的。为了方便模型对各种特征进行处理,需要先行对源域数据和目标域数据进行特征提取,数据特征的具体提取方法应使用神经网络。对于文本数据,可以用循环神经网络(RNN)或者长短时记忆网络(LSTM)进行提取,对于图像数据可以使用卷积神经网络(CNN)进行提取。如图1所示,本实施例1包括以下步骤:
S1:初始化在线的决策模型、离线的决策模型以及集成学习模型的模型参数;
S2:对在线得到的第i个新目标域数据xi建立在线和离线的组合决策模型计算预测值
S3:利用计算得到的预测值更新在线目标决策模型h(·);
S4:更新所述相关参数得到调整后的集成学习模型;
S5:重复步骤S2-S4直到参数收敛,得到训练好的集成学习模型。
集成学习模型最终由在线决策模型h(·)、离线决策模型hs(·)和组合控制参数θs、θt组成。后述公式(1)(2)(3)将分别给出在线决策模型、离线决策模型和组合集成学习模型的模型函数。
所述的初始化数据包括以下步骤:
S11:在线的决策模型h(x)定义为线性分类器,给定提取好特征的源域(文本)数据,在线决策模型的函数为:
h(x)=wTx (1)
其中,w在开始学习前需要进行初始化,其初始化参数w1定义为:
w1=0
S12:对集成学习模型(由离线决策模型、在线决策模型和各自的权重参数组合而成)的初始权重进行带约束的随机初始化:
其中分别对应离线决策模型和在线决策模型在组合时的权重。
如图2所示,实施例1中所述用组合模型计算预测值的具体步骤为:
S21:从数据库中获取有类标(有人工标注的真实数据类别)的源域数据和目标域数据两种异构的数据有共现数据相关联;这里使用上标s代表源域,上标t代表源域,上标c代表共现数据,n为样本总数,x代表样本特征,y代表样本类别,u代表共现数据中属于源域特征的部分,v代表代表共现数据中属于目标域特征的部分。
S22:分别计算第l个源域数据与第j个共现数据的皮尔森相关系数以及第i个目标域数据与第j个共现数据的皮尔森相关系数
其中,下标p表示向量的第p个元素,d是向量的维数,表示某个向量*元素的平均值,在上式中*可以是x、u或者v。ε是一个很小的常量(例如:1-10)。
S23:以共现数据与源域数据的相关系数和共现数据与目标域数据的相关系数为桥梁,计算源域数据和目标域数据的相似性
nc为共现数据的样本总数。如图3所示,通过与共现数据的皮尔森相关系数的作用,源域(文本)数据和目标域(图像)数据得到相关性联系。可以利用共现数据作为桥梁达到源域数据向目标域数据的知识迁移效果。
S24:找到与目标域数据最相似的k个源域数据,按以下公式加权求和得出离线的决策模型
其中集合N包含了与目标域数据最相似的k个源域数据,下标τ代表集合N中的第τ个样本。
S25:组合在线和离线的决策模型,获得集成学习模型,并对目标域数据的类标进行预测:
其中φ()为对两个决策模型的映射函数,具体为:
这里z可以是或者
所述决策函数更新方法,具体如下:
S31:计算hinge损失函数
S32:计算更新步长这里c是人工经验设定的超参数,用于防止更新步长过大导致模型不收敛。
S33:更新决策函数的参数值:
wi+1=wi+τiyixi
所述相关参数更新方法具体如下:
S41:更新权重参数和参数公式如下:
其中β∈(0,1),ψ是控制参数更新速率的函数,具体为:
S42:把更新后的权重参数标准化,获得集成学习模型更新后的组合参数和
通过上述方法,迭代更新模型参数直到模型收敛。可以令在文本领域的、关于某种类别的描述性知识直接用于对图像领域的该物体的识别之中,达到迁移学习的效果。如图5所示,给定少量目标域训练数据,本发明的方法比通用方法(如PA方法)能获得较大的识别错误率降低;在给定较多的训练数据的前提下,本发明能够获得最优的迁移识别效果。
上述实例利用了图像与文本的共现数据,关联了离线的文本数据对实时的在线图像数据构建离线决策模型,并与线性的简单在线决策模型进行集成学习,从而实现对异构数据进行良好预测的效果。该实施例说明了本方法能够有效地将源域知识传递到目标域的分类识别当中,使得人类的迁移学习的方式可以应用于机器学习和数据挖掘领域。
以上所述,仅为本发明专利优选的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方法及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。
Claims (5)
1.基于在线和离线决策集成学习的在线异构迁移学习的方法,其特征在于,所述方法包括以下步骤:
S1:初始化在线的决策模型、离线的决策模型以及集成学习模型的模型参数;
S2:对在线得到的第i个新目标域数据xi建立在线和离线的组合决策模型计算预测值
S3:利用计算得到的预测值更新在线目标决策模型h(·);
S4:更新所述相关参数得到调整后的集成学习模型;
S5:重复步骤S2-S4直到参数收敛,得到训练好的集成学习模型。
集成学习模型最终由在线决策模型h(·)、离线决策模型hs(·)和组合控制参数θs、θt组成。后述公式(1)(2)(3)将分别给出在线决策模型、离线决策模型和组合集成学习模型的模型函数。
2.根据权利要求1所述的基于在线和离线集成学习的在线异构迁移学习的方法,其特征在于,所述步骤S1中,所述初始化方法如下:
S11:在线的决策模型的初始参数初始化为0;
S12:由源域的离线决策模型和目标域的在线决策模型组合的初始权重进行随机初始化。
3.根据权利要求1所述的基于在线和离线集成学习的在线异构迁移学习的方法,其特征在于,所述步骤S2中,所述计算预测值的具体方法为:
S21:得到有类标(有人工标注的真实数据类别)的源域数据和目标域数据两种异构的数据有共现数据相关联;这里使用上标s代表源域,上标t代表源域,上标c代表共现数据,n为样本总数,x代表样本特征,y代表样本类别,u代表共现数据中属于源域特征的部分,v代表代表共现数据中属于目标域特征的部分。
S22:分别计算源域数据和目标域数据与共现数据的皮尔森相关系数;目标域数据可以是与源域不同来源的数据,如文本数据。
S23:以共现数据与源域数据的相关系数和共现数据与目标域数据的相关系数为桥梁,计算源域同数据和目标域数据的相似性;
S24:找到与目标域数据xi最相似的k个源域数据,按照加权求和得出离线的决策模型,k为源域数据中于目标域数据xi最相似的数据的个数;
S25:组合在线和离线的决策模型,对目标域数据xi进行预测。
4.根据权利要求1所属的一种基于在线和离线集成学习的在线异构迁移学习的方法,其特征在于,所述步骤S3中,所述更新在线目标决策模型的方法如下:
根据S25的预测结果与目标域数据类标计算hinge损失并更新在线决策模型权重以及集成学习模型中组合控制参数的权重。
5.根据权利要求1所属的一种基于在线和离线集成学习的在线异构迁移学习的方法,其特征在于,所述源域数据为图像数据;所述目标域数据是文本数据;所述共现数据为两个数据域的结合,即文本与图像数据共同出现的数据,其特点是每个共现数据中文本与图像的意义是紧密关联或者一致的。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019101775880 | 2019-03-09 | ||
CN201910177588 | 2019-03-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110569985A true CN110569985A (zh) | 2019-12-13 |
Family
ID=68777149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910820027.8A Pending CN110569985A (zh) | 2019-03-09 | 2019-08-31 | 基于在线和离线决策集成学习的在线异构迁移学习的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110569985A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395986A (zh) * | 2020-11-17 | 2021-02-23 | 广州像素数据技术股份有限公司 | 一种新场景快速迁移且防遗忘的人脸识别方法 |
CN115689062A (zh) * | 2022-12-30 | 2023-02-03 | 浙江工业大学 | 一种基于快速在线迁移神经网络的光伏输出功率预测方法 |
JP7323669B1 (ja) | 2022-04-01 | 2023-08-08 | ソフトバンク株式会社 | オントロジー生成方法及び学習方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103364A (zh) * | 2017-03-28 | 2017-08-29 | 上海大学 | 一种基于多源域的任务拆分迁移学习预测方法 |
CN108256561A (zh) * | 2017-12-29 | 2018-07-06 | 中山大学 | 一种基于对抗学习的多源域适应迁移方法及系统 |
-
2019
- 2019-08-31 CN CN201910820027.8A patent/CN110569985A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103364A (zh) * | 2017-03-28 | 2017-08-29 | 上海大学 | 一种基于多源域的任务拆分迁移学习预测方法 |
CN108256561A (zh) * | 2017-12-29 | 2018-07-06 | 中山大学 | 一种基于对抗学习的多源域适应迁移方法及系统 |
Non-Patent Citations (1)
Title |
---|
YUGUANG YAN ET AL: "Online Heterogeneous Transfer by Hedge Ensemble of Offline and Online Decisions", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395986A (zh) * | 2020-11-17 | 2021-02-23 | 广州像素数据技术股份有限公司 | 一种新场景快速迁移且防遗忘的人脸识别方法 |
CN112395986B (zh) * | 2020-11-17 | 2024-04-26 | 广州像素数据技术股份有限公司 | 一种新场景快速迁移且防遗忘的人脸识别方法 |
JP7323669B1 (ja) | 2022-04-01 | 2023-08-08 | ソフトバンク株式会社 | オントロジー生成方法及び学習方法 |
CN115689062A (zh) * | 2022-12-30 | 2023-02-03 | 浙江工业大学 | 一种基于快速在线迁移神经网络的光伏输出功率预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232480B (zh) | 利用变分的正则化流实现的项目推荐方法及模型训练方法 | |
CN109308318B (zh) | 跨领域文本情感分类模型的训练方法、装置、设备及介质 | |
Qu et al. | Product-based neural networks for user response prediction | |
Gao et al. | Deep gate recurrent neural network | |
CN110363282B (zh) | 一种基于图卷积网络的网络节点标签主动学习方法和系统 | |
CN109635204A (zh) | 基于协同过滤和长短记忆网络的在线推荐系统 | |
CN110674323B (zh) | 基于虚拟标签回归的无监督跨模态哈希检索方法及系统 | |
CN111581520B (zh) | 基于会话中物品重要性的物品推荐方法和系统 | |
CN110569985A (zh) | 基于在线和离线决策集成学习的在线异构迁移学习的方法 | |
CN114492574A (zh) | 基于高斯均匀混合模型的伪标签损失无监督对抗域适应图片分类方法 | |
Jia et al. | A semi-supervised online sequential extreme learning machine method | |
Zhang et al. | Mitigating uncertainty in document classification | |
Kirsal Ever et al. | Comparison of machine learning techniques for prediction problems | |
JP7342242B2 (ja) | 学習を転移させるための学習のためのフレームワーク | |
CN115658864A (zh) | 一种基于图神经网络和兴趣注意力网络的会话推荐方法 | |
CN108153912A (zh) | 一种基于知识表示学习的协同矩阵分解方法 | |
Abou Baker et al. | Transfer learning-based method for automated e-waste recycling in smart cities | |
Jiang et al. | Boosting facial expression recognition by a semi-supervised progressive teacher | |
CN110543566B (zh) | 一种基于自注意力近邻关系编码的意图分类方法 | |
Lee et al. | Learning in the wild: When, how, and what to learn for on-device dataset adaptation | |
Camargo et al. | An incremental learning approach to prediction models of SEIRD variables in the context of the COVID-19 pandemic | |
Wang et al. | Dendritic neuron model trained by biogeography-based optimization for crude oil price forecasting | |
CN114782752A (zh) | 基于自训练的小样本图像集成分类方法及装置 | |
CN117408735A (zh) | 一种基于物联网的客户管理方法及系统 | |
CN116910571A (zh) | 一种基于原型对比学习的开集域适应方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |