CN111382846B - 基于迁移学习的训练神经网络模型的方法和装置 - Google Patents

基于迁移学习的训练神经网络模型的方法和装置 Download PDF

Info

Publication number
CN111382846B
CN111382846B CN202010466496.7A CN202010466496A CN111382846B CN 111382846 B CN111382846 B CN 111382846B CN 202010466496 A CN202010466496 A CN 202010466496A CN 111382846 B CN111382846 B CN 111382846B
Authority
CN
China
Prior art keywords
layer
neural network
network model
output
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010466496.7A
Other languages
English (en)
Other versions
CN111382846A (zh
Inventor
张雅淋
李龙飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010466496.7A priority Critical patent/CN111382846B/zh
Publication of CN111382846A publication Critical patent/CN111382846A/zh
Application granted granted Critical
Publication of CN111382846B publication Critical patent/CN111382846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例提供一种基于迁移学习的训练神经网络模型的方法和装置,方法包括:第一神经网络模型包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,第一融合层接收第一私有层的输出和第一共享层的输出,得到第一融合结果和第二融合结果,将第一融合结果输出给第二私有层,将第二融合结果输出给第二共享层;第二神经网络模型包括第三私有层、第四私有层、第一共享层、第二共享层和第二融合层,第二融合层接收第三私有层的输出和第一共享层的输出,得到第三融合结果和第四融合结果,将第三融合结果输出给第四私有层,将第四融合结果输出给第二共享层。能够提升模型的泛化性。

Description

基于迁移学习的训练神经网络模型的方法和装置
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于迁移学习的训练神经网络模型的方法和装置。
背景技术
监督学习是机器学习的一个研究领域,通过给定的训练样本训练神经网络模型,利用训练后的神经网络模型来对待测样本进行预测,通常地,监督学习的训练样本包括样本标签,样本标签可以有多种形式,例如样本标签为正样本或负样本。
对于目标领域的预测任务,如果目标领域的训练样本充足,则可以直接基于目标领域的训练样本训练神经网络模型;如果目标领域的训练样本不足,则可以基于迁移学习训练神经网络模型,也就是说,通过利用数据相对丰富的源领域的训练样本或模型信息等,帮助构建针对目标领域的神经网络模型,从而使得模型能够在目标领域的未见数据上有好的表现。
现有技术中,在基于迁移学习训练神经网络模型时,不能灵活的适应不同场景的迁移学习诉求,泛化性不佳。
因此,希望能有改进的方案,在基于迁移学习训练神经网络模型时,能够提升模型的泛化性。
发明内容
本说明书一个或多个实施例描述了一种基于迁移学习的训练神经网络模型的方法和装置,能够提升模型的泛化性。
第一方面,提供了一种基于迁移学习的训练神经网络模型的方法,方法包括:
获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;
将所述第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;
将所述第二样本输入第二神经网络模型,得到第二预测结果,基于所述第二预测结果与所述第二样本标签之间的差异,训练所述第二神经网络模型;其中,所述第二神经网络模型至少包括第三私有层、第四私有层、所述第一共享层、所述第二共享层和第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层;
所述源领域对应于第一类用户,所述第一类用户使用过目标业务;所述目标领域对应于第二类用户,所述第二类用户未使用过所述目标业务;所述第一神经网络模型用于针对所述第一类用户进行预测;所述第二神经网络模型用于针对所述第二类用户进行预测。
在一种可能的实施方式中,所述第一私有层和所述第一共享层接收所述第一样本作为其输入。
在一种可能的实施方式中,所述第三私有层和所述第一共享层接收所述第二样本作为其输入。
在一种可能的实施方式中,所述第一神经网络模型还包括第五私有层,所述第五私有层接收所述第二私有层的输出和所述第二共享层的输出作为其输入,所述第五私有层的输出作为所述第一神经网络模型的输出结果。
在一种可能的实施方式中,所述第二神经网络模型还包括第六私有层,所述第六私有层接收所述第四私有层的输出和所述第二共享层的输出作为其输入,所述第六私有层的输出作为所述第二神经网络模型的输出结果。
在一种可能的实施方式中,所述方法还包括:
将所述源领域的第一待测样本输入训练后的所述第一神经网络模型,得到所述第一待测样本的预测结果。
在一种可能的实施方式中,所述方法还包括:
将所述目标领域的第二待测样本输入训练后的所述第二神经网络模型,得到所述第二待测样本的预测结果。
在一种可能的实施方式中,所述第一神经网络模型用于预测所述第一类用户是否使用所述目标业务;所述第二神经网络模型用于预测所述第二类用户是否使用所述目标业务。
进一步地,所述第一样本和/或所述第二样本包括:用户的属性特征的特征值和可选权益的属性特征的特征值;所述可选权益为备选权益集合中的一项或多项权益。
进一步地,所述方法还包括:
从所述备选权益集合包括的各项权益中选取一项或多项权益,以形成多组可选权益;
根据目标用户的属性特征的特征值和每组可选权益中的各项权益分别对应的属性特征的特征值,确定目标用户对应于每组可选权益的样本;
将所述目标用户对应于每组可选权益的样本输入训练后的所述第一神经网络模型或所述第二神经网络模型,得到所述目标用户对应于每组可选权益的预测结果;
根据所述目标用户对应于每组可选权益的预测结果,从所述多组可选权益中选择向所述目标用户发放的一组可选权益。
第二方面,提供了一种基于迁移学习的训练神经网络模型的装置,装置包括:
获取单元,用于获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;
第一训练单元,用于将所述获取单元获取的第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述获取单元获取的第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;
第二训练单元,用于将所述获取单元获取的第二样本输入第二神经网络模型,得到第二预测结果,基于所述第二预测结果与所述获取单元获取的第二样本标签之间的差异,训练所述第二神经网络模型;其中,所述第二神经网络模型至少包括第三私有层、第四私有层、所述第一共享层、所述第二共享层和第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层;
所述源领域对应于第一类用户,所述第一类用户使用过目标业务;所述目标领域对应于第二类用户,所述第二类用户未使用过所述目标业务;所述第一神经网络模型用于针对所述第一类用户进行预测;所述第二神经网络模型用于针对所述第二类用户进行预测。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,在基于迁移学习训练神经网络模型时,由于源领域的第一神经网络模型,不仅包括第一私有层、第二私有层、第一共享层、第二共享层,还包括第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;也就是说,通过调整第一融合层的参数可以改变第一融合结果和第二融合结果,以参数的形式自动学习信息的融合,对不同的场景有更好的适应度;目标领域的第二神经网络模型,不仅包括第三私有层、第四私有层、所述第一共享层、所述第二共享层,还包括第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层。也就是说,通过调整第二融合层的参数可以改变第三融合结果和第四融合结果,以参数的形式自动学习信息的融合,对不同的场景有更好的适应度;综上,第一神经网络模型和第二神经网络模型中分别具有融合层,可以灵活的学习层与层之间不同层信息传递的量,能够提升模型的泛化性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的基于迁移学习的训练神经网络模型的方法流程图;
图3示出根据一个实施例的迁移学习的模型整体框架示意图;
图4示出根据一个实施例的第一私有层的网络结构示意图;
图5示出根据一个实施例的基于迁移学习的训练神经网络模型的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及基于迁移学习的训练神经网络模型的方法。参照图1,源领域的训练样本数量充足,因此可以直接利用源领域的训练样本训练第一神经网络模型,然后由训练后的第一神经网络模型执行源领域的预测任务。目标领域的训练样本数量不足,如果直接利用目标领域的训练样本训练第二神经网络模型,然后由训练后的第二神经网络模型执行目标领域的预测任务,则该第二神经网络模型的预测效果不佳;本说明书实施例中,基于迁移学习的方式,利用源领域的训练样本辅助第二神经网络模型的训练,其中,第一神经网络模型和第二神经网络模型具有共享参数,先利用源领域的训练样本训练第一神经网络模型,得到上述共享参数的初步训练结果,再利用目标领域的训练样本训练第二神经网络模型,得到上述共享参数的最终训练结果,通过上述共享参数将源领域的信息传递到了第二神经网络模型,辅助第二神经网络模型的训练,由此训练后的第二神经网络模型可以用于目标领域的预测任务,并且取得很好的预测效果。
本说明书实施例中,对于源领域和目标领域不做具体限定,可以为任意两个相关的领域,例如,源领域对应于第一类用户,目标领域对应于第二类用户;或者,源领域对应于第一类物品,目标领域对应于第二类物品,等等。
图2示出根据一个实施例的基于迁移学习的训练神经网络模型的方法流程图,该方法可以基于图1所示的实施场景。如图2所示,该实施例中基于迁移学习的训练神经网络模型的方法包括以下步骤:步骤21,获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;步骤22,将所述第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;步骤23,将所述第二样本输入第二神经网络模型,得到第二预测结果,基于所述第二预测结果与所述第二样本标签之间的差异,训练所述第二神经网络模型;其中,所述第二神经网络模型至少包括第三私有层、第四私有层、所述第一共享层、所述第二共享层和第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层。下面描述以上各个步骤的具体执行方式。
首先在步骤21,获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签。可以理解的是,源领域和目标领域可以为任意两个相关的领域,源领域的训练样本数量充足,目标领域的训练样本数量不足。
本说明书实施例中,所述源领域对应于第一类用户,所述第一类用户使用过目标业务;所述目标领域对应于第二类用户,所述第二类用户未使用过所述目标业务;所述第一神经网络模型用于针对所述第一类用户进行预测;所述第二神经网络模型用于针对所述第二类用户进行预测。
其中,第一神经网络模型具体可以针对所述第一类用户进行多种预测,相应地,第二神经网络模型具体可以针对所述第二类用户进行多种预测,例如,所述第一类用户或所述第二类用户是否具有金融风险的风险预测、所述第一类用户或所述第二类用户是否会点击或购买目标产品的产品推荐预测等。
在一个示例中,所述第一神经网络模型用于预测所述第一类用户是否使用所述目标业务;所述第二神经网络模型用于预测所述第二类用户是否使用所述目标业务。
其中,上述目标业务可以但不限于为互联网金融业务,例如,支付宝的花呗、借呗、备用金业务等。通俗地讲,上述第一类用户可以称为目标业务的老用户,上述第二类用户可以称为目标业务的新用户,新用户和老用户对不同权益的感兴趣程度有所区别,因此建立两个不同的模型,分别用于预测老用户是否使用所述目标业务,新用户是否使用所述目标业务。
进一步地,所述第一样本和/或所述第二样本包括:用户的属性特征的特征值和可选权益的属性特征的特征值;所述可选权益为备选权益集合中的一项或多项权益。
本说明书实施例中,上述权益可以但不限于包括优惠券、代金券、积分等,在用户使用目标业务时,不同用户可能面对不同的推荐的权益,这些推荐的权益就是上述可选权益,备选权益集合中包括的权益项目较多,而向用户推荐的权益通常项目较少,例如备选权益集合中包括10项权益,而向用户推荐的权益项目为3项,可选权益通常会影响用户是否使用目标业务,作为预测用户是否使用目标业务的依据。
在一个示例中,第一样本和第二样本均可以基于历史的曝光和点击数据来获得。
然后在步骤22,将所述第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层。可以理解的是,第一私有层、第二私有层属于第一神经网络模型独有的层,第一共享层、第二共享层属于第一神经网络模型和第二神经网络模型共有的层,第一融合层用于第一神经网络模型不同层之间的信息传递。
在一个示例中,所述第一私有层和所述第一共享层接收所述第一样本作为其输入。
该示例中,所述第一私有层和所述第一共享层作为第一神经网络模型的第一层。
在一个示例中,所述第一神经网络模型还包括第五私有层,所述第五私有层接收所述第二私有层的输出和所述第二共享层的输出作为其输入,所述第五私有层的输出作为所述第一神经网络模型的输出结果。
该示例中,所述第五私有层作为第一神经网络模型的最后一层。
可以理解的是,本说明书实施例对于第一神经网络模型的层数不做限制,基于第一神经网络模型的基本结构可以衍生出多种可能的模型结构。
最后在步骤23,将所述第二样本输入第二神经网络模型,得到第二预测结果,基于所述第二预测结果与所述第二样本标签之间的差异,训练所述第二神经网络模型;其中,所述第二神经网络模型至少包括第三私有层、第四私有层、所述第一共享层、所述第二共享层和第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层。可以理解的是,第三私有层、第四私有层属于第二神经网络模型独有的层,第一共享层、第二共享层属于第一神经网络模型和第二神经网络模型共有的层,第二融合层用于第二神经网络模型不同层之间的信息传递。
在一个示例中,所述第三私有层和所述第一共享层接收所述第二样本作为其输入。
该示例中,所述第三私有层和所述第一共享层作为第二神经网络模型的第一层。
在一个示例中,所述第二神经网络模型还包括第六私有层,所述第六私有层接收所述第四私有层的输出和所述第二共享层的输出作为其输入,所述第六私有层的输出作为所述第二神经网络模型的输出结果。
该示例中,所述第六私有层作为第二神经网络模型的最后一层。
可以理解的是,本说明书实施例对于第二神经网络模型的层数不做限制,基于第二神经网络模型的基本结构可以衍生出多种可能的模型结构。
在一个示例中,所述方法还包括:
将所述源领域的第一待测样本输入训练后的所述第一神经网络模型,得到所述第一待测样本的预测结果。
在一个示例中,所述方法还包括:
将所述目标领域的第二待测样本输入训练后的所述第二神经网络模型,得到所述第二待测样本的预测结果。
进一步地,所述方法还包括:
从所述备选权益集合包括的各项权益中选取一项或多项权益,以形成多组可选权益;
根据目标用户的属性特征的特征值和每组可选权益中的各项权益分别对应的属性特征的特征值,确定目标用户对应于每组可选权益的样本;
将所述目标用户对应于每组可选权益的样本输入训练后的所述第一神经网络模型或所述第二神经网络模型,得到所述目标用户对应于每组可选权益的预测结果;
根据所述目标用户对应于每组可选权益的预测结果,从所述多组可选权益中选择向所述目标用户发放的一组可选权益。
可以理解的是,若所述目标用户为前述第一类用户,则将所述目标用户对应于每组可选权益的样本输入训练后的所述第一神经网络模型;若所述目标用户为前述第二类用户,则将所述目标用户对应于每组可选权益的样本输入训练后的所述第二神经网络模型。
图3示出根据一个实施例的迁移学习的模型整体框架示意图。参照图3,Xs相当于前述第一样本的样本输入,Ys相当于前述第一样本标签,A1相当于前述第一私有层,A2相当于前述第二私有层,C1相当于前述第一共享层,C2相当于前述第二共享层,W0相当于前述第一融合层,A3相当于前述第五私有层,A1、A2、A3、C1、C2、W0构成前述第一神经网络模型;Xt相当于前述第二样本的样本输入,Yt相当于前述第二样本标签,B1相当于前述第三私有层,B2相当于前述第四私有层,W1相当于前述第二融合层,B3相当于前述第六私有层,B1、B2、B3、C1、C2、W1构成前述第二神经网络模型。
其中,各框格(即层)表示不同的网络结构;箭头表示数据的流通方向;本说明书实施例中,对于各层内部的网络结构不做限定,每层还可以包括一个或多个子层,例如,前述提到的第一私有层A1或第一共享层C1等均可以包括多个子层。以第一私有层为例,图4示出根据一个实施例的第一私有层的网络结构示意图。参照图4,第一私有层A1包括A11、A12、A13三个子层,第一私有层A1的网络结构可以但不限于为深度神经网络(deep neuralnetworks,DNN)的网络结构。
通过图3可以形式化的看出:源领域的样本输入Xs,经过了私有层(A1、A2、A3)和共享层(C1、C2),并最终产生其输出结果,通过和其标签Ys的比较可以计算损失函数的值,来进行网络权重的更新,以达到使样本的预测打分尽量接近Ys的目的;类似的,目标领域的样本输入Xt,经过了私有层(B1、B2、B3)和共享层(C1、C2),并最终产生其输出结果,通过和其标签Yt的比较可以计算损失函数的值,来进行网络权重的更新,以达到使样本的预测打分尽量接近Yt的目的。
本说明书实施例中,(C1、C2)为共享层,因源领域和目标领域的数据均会经过这一部分的网络结构,而源领域的信息正是通过这一部分传递给了目标领域,做到了知识迁移的目的;称(A1、A2、A3)和(B1、B2、B3)为源领域和目标领域各自独有的私有层,因只有源领域或目标领域的数据会流经相应层的网络。
需要说明的是,图3中的第一层(A1 B1 C1)到第二层(A2 B2 C2)之间的传递分别涉及到一个信息的融合层(W0、W1),使得网络中信息在不同层传递时,能做到更好的信息融合。
作为示例,模型的训练可以遵循如下的流程:
原始的特征,在Xs和Xt经过特征变换。例如原始特征是维度为10000的高维稀疏特征,通常会变换为维度较小(如128维)的向量表示;
变换后的特征将按照图3中箭头的方向,分别进入对应的层进行计算。例如图中的三层分别为包含64、32、2个节点的神经网络层(并伴有对应的激活函数如ReLU等),则A1、B1、C1将输出维度为64的向量,A2、B2、C2将输出维度为32的向量,A3、B3将输出维度为2的向量,A3和B3的2维输出就表示模型预测样本是0和1的概率,将其和样本标签Ys和Yt进行计算损失函数(如cross-entropy loss)的值,利用反向传播的算法,可以更新网络结构,来进行网络参数的计算。
对于W0和W1的层,以W0为例,接收A1和C1的输出作为其输入,对二者进行融合后分别输出到A2和C2。A1代表的是领域独有的信息,C1代表的是领域共享的信息,通常地,不同层之间的信息传递往往是只包含领域共享的信息,或者领域共享的信息和领域独享的信息各自沿各自的方向进行信息传递,并不会存在交叉,本说明书实施例与通常地信息传递方式不同,其信息传递可以通过公式表示为:
A2=W000*A1+ W010*C1
C2=W001*A1+ W011*C1
其中,W000是一个数值,表示从A1流入到A2的信息的量,W010表示C1流入到A2的信息的量,W001和 W011与之类似。这里的W的具体值,是模型的一个重要的参数,也就意味着,会在训练的过程中自动的学习A1、C1分别流入多少信息到A2、C2。
本说明书实施例中,通过设置不同的W的值,可以退化为常见的迁移学习框架,是对其他的模型的进一步泛化,并引入更多的不同的可能性的变化。而以参数的形式来自动学习的信息的融合,相比固定的信息传递方式,对不同的场景有更好地适应度。
通过本说明书实施例提供的方法,在基于迁移学习训练神经网络模型时,由于源领域的第一神经网络模型,不仅包括第一私有层、第二私有层、第一共享层、第二共享层,还包括第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;也就是说,通过调整第一融合层的参数可以改变第一融合结果和第二融合结果,以参数的形式自动学习信息的融合,对不同的场景有更好的适应度;目标领域的第二神经网络模型,不仅包括第三私有层、第四私有层、所述第一共享层、所述第二共享层,还包括第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层。也就是说,通过调整第二融合层的参数可以改变第三融合结果和第四融合结果,以参数的形式自动学习信息的融合,对不同的场景有更好的适应度;综上,第一神经网络模型和第二神经网络模型中分别具有融合层,可以灵活的学习层与层之间不同层信息传递的量,能够提升模型的泛化性。
根据另一方面的实施例,还提供一种基于迁移学习的训练神经网络模型的装置,该装置用于执行本说明书实施例提供的基于迁移学习的训练神经网络模型的方法。图5示出根据一个实施例的基于迁移学习的训练神经网络模型的装置的示意性框图。如图5所示,该装置500包括:
获取单元51,用于获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;
第一训练单元52,用于将所述获取单元51获取的第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述获取单元51获取的第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;
第二训练单元53,用于将所述获取单元51获取的第二样本输入第二神经网络模型,得到第二预测结果,基于所述第二预测结果与所述获取单元51获取的第二样本标签之间的差异,训练所述第二神经网络模型;其中,所述第二神经网络模型至少包括第三私有层、第四私有层、所述第一共享层、所述第二共享层和第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层;
所述源领域对应于第一类用户,所述第一类用户使用过目标业务;所述目标领域对应于第二类用户,所述第二类用户未使用过所述目标业务;所述第一神经网络模型用于针对所述第一类用户进行预测;所述第二神经网络模型用于针对所述第二类用户进行预测。
可选地,作为一个实施例,所述第一私有层和所述第一共享层接收所述第一样本作为其输入。
可选地,作为一个实施例,所述第三私有层和所述第一共享层接收所述第二样本作为其输入。
可选地,作为一个实施例,所述第一神经网络模型还包括第五私有层,所述第五私有层接收所述第二私有层的输出和所述第二共享层的输出作为其输入,所述第五私有层的输出作为所述第一神经网络模型的输出结果。
可选地,作为一个实施例,所述第二神经网络模型还包括第六私有层,所述第六私有层接收所述第四私有层的输出和所述第二共享层的输出作为其输入,所述第六私有层的输出作为所述第二神经网络模型的输出结果。
可选地,作为一个实施例,所述装置还包括:
第一预测单元,用于将所述源领域的第一待测样本输入所述第一训练单元52训练后的所述第一神经网络模型,得到所述第一待测样本的预测结果。
可选地,作为一个实施例,所述装置还包括:
第二预测单元,用于将所述目标领域的第二待测样本输入所述第二训练单元53训练后的所述第二神经网络模型,得到所述第二待测样本的预测结果。
可选地,作为一个实施例,所述第一神经网络模型用于预测所述第一类用户是否使用所述目标业务;所述第二神经网络模型用于预测所述第二类用户是否使用所述目标业务。
进一步地,所述第一样本和/或所述第二样本包括:用户的属性特征的特征值和可选权益的属性特征的特征值;所述可选权益为备选权益集合中的一项或多项权益。
进一步地,所述装置还包括:
分组单元,用于从所述备选权益集合包括的各项权益中选取一项或多项权益,以形成多组可选权益;
确定单元,用于根据目标用户的属性特征的特征值和所述分组单元得到的每组可选权益中的各项权益分别对应的属性特征的特征值,确定目标用户对应于每组可选权益的样本;
第三预测单元,用于将所述确定单元确定的目标用户对应于每组可选权益的样本输入训练后的所述第一神经网络模型或所述第二神经网络模型,得到所述目标用户对应于每组可选权益的预测结果;
选择单元,用于根据所述第三预测单元得到的目标用户对应于每组可选权益的预测结果,从所述分组单元得到的多组可选权益中选择向所述目标用户发放的一组可选权益。
通过本说明书实施例提供的装置,在基于迁移学习训练神经网络模型时,由于源领域的第一神经网络模型,不仅包括第一私有层、第二私有层、第一共享层、第二共享层,还包括第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层;也就是说,通过调整第一融合层的参数可以改变第一融合结果和第二融合结果,以参数的形式自动学习信息的融合,对不同的场景有更好的适应度;目标领域的第二神经网络模型,不仅包括第三私有层、第四私有层、所述第一共享层、所述第二共享层,还包括第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层。也就是说,通过调整第二融合层的参数可以改变第三融合结果和第四融合结果,以参数的形式自动学习信息的融合,对不同的场景有更好的适应度;综上,第一神经网络模型和第二神经网络模型中分别具有融合层,可以灵活的学习层与层之间不同层信息传递的量,能够提升模型的泛化性。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (14)

1.一种基于迁移学习的训练神经网络模型的方法,所述方法包括:
获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;
将所述第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层,所述第二私有层的输出和所述第二共享层的输出用于确定所述第一神经网络模型的输出结果;
将所述第二样本输入第二神经网络模型,得到第二预测结果,基于所述第二预测结果与所述第二样本标签之间的差异,训练所述第二神经网络模型;其中,所述第二神经网络模型至少包括第三私有层、第四私有层、所述第一共享层、所述第二共享层和第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层,所述第四私有层的输出和所述第二共享层的输出用于确定所述第二神经网络模型的输出结果;
所述源领域对应于第一类用户,所述第一类用户使用过目标业务;所述目标领域对应于第二类用户,所述第二类用户未使用过所述目标业务;所述第一神经网络模型用于针对所述第一类用户进行预测;所述第二神经网络模型用于针对所述第二类用户进行预测;
所述第一私有层和所述第一共享层接收所述第一样本作为其输入;
所述第三私有层和所述第一共享层接收所述第二样本作为其输入;
所述第一神经网络模型用于预测所述第一类用户是否使用所述目标业务;所述第二神经网络模型用于预测所述第二类用户是否使用所述目标业务;
所述第一样本和/或所述第二样本包括:用户的属性特征的特征值和可选权益的属性特征的特征值;所述可选权益为备选权益集合中的一项或多项权益。
2.如权利要求1所述的方法,其中,所述第一神经网络模型还包括第五私有层,所述第五私有层接收所述第二私有层的输出和所述第二共享层的输出作为其输入,所述第五私有层的输出作为所述第一神经网络模型的输出结果。
3.如权利要求1所述的方法,其中,所述第二神经网络模型还包括第六私有层,所述第六私有层接收所述第四私有层的输出和所述第二共享层的输出作为其输入,所述第六私有层的输出作为所述第二神经网络模型的输出结果。
4.如权利要求1所述的方法,其中,所述方法还包括:
将所述源领域的第一待测样本输入训练后的所述第一神经网络模型,得到所述第一待测样本的预测结果。
5.如权利要求1所述的方法,其中,所述方法还包括:
将所述目标领域的第二待测样本输入训练后的所述第二神经网络模型,得到所述第二待测样本的预测结果。
6.如权利要求1所述的方法,其中,所述方法还包括:
从所述备选权益集合包括的各项权益中选取一项或多项权益,以形成多组可选权益;
根据目标用户的属性特征的特征值和每组可选权益中的各项权益分别对应的属性特征的特征值,确定目标用户对应于每组可选权益的样本;
将所述目标用户对应于每组可选权益的样本输入训练后的所述第一神经网络模型或所述第二神经网络模型,得到所述目标用户对应于每组可选权益的预测结果;
根据所述目标用户对应于每组可选权益的预测结果,从所述多组可选权益中选择向所述目标用户发放的一组可选权益。
7.一种基于迁移学习的训练神经网络模型的装置,所述装置包括:
获取单元,用于获取源领域的第一样本,以及目标领域的第二样本,所述第一样本包括第一样本标签,所述第二样本包括第二样本标签;
第一训练单元,用于将所述获取单元获取的第一样本输入第一神经网络模型,得到第一预测结果,基于所述第一预测结果与所述获取单元获取的第一样本标签之间的差异,训练所述第一神经网络模型;其中,所述第一神经网络模型至少包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,所述第一融合层接收所述第一私有层的输出和所述第一共享层的输出作为其输入,分别得到第一融合结果和第二融合结果,将所述第一融合结果输出给所述第二私有层,将所述第二融合结果输出给所述第二共享层,所述第二私有层的输出和所述第二共享层的输出用于确定所述第一神经网络模型的输出结果;
第二训练单元,用于将所述获取单元获取的第二样本输入第二神经网络模型,得到第二预测结果,基于所述第二预测结果与所述获取单元获取的第二样本标签之间的差异,训练所述第二神经网络模型;其中,所述第二神经网络模型至少包括第三私有层、第四私有层、所述第一共享层、所述第二共享层和第二融合层,所述第二融合层接收所述第三私有层的输出和所述第一共享层的输出作为其输入,分别得到第三融合结果和第四融合结果,将所述第三融合结果输出给所述第四私有层,将所述第四融合结果输出给所述第二共享层,所述第四私有层的输出和所述第二共享层的输出用于确定所述第二神经网络模型的输出结果;
所述源领域对应于第一类用户,所述第一类用户使用过目标业务;所述目标领域对应于第二类用户,所述第二类用户未使用过所述目标业务;所述第一神经网络模型用于针对所述第一类用户进行预测;所述第二神经网络模型用于针对所述第二类用户进行预测;
所述第一私有层和所述第一共享层接收所述第一样本作为其输入;
所述第三私有层和所述第一共享层接收所述第二样本作为其输入;
所述第一神经网络模型用于预测所述第一类用户是否使用所述目标业务;所述第二神经网络模型用于预测所述第二类用户是否使用所述目标业务;
所述第一样本和/或所述第二样本包括:用户的属性特征的特征值和可选权益的属性特征的特征值;所述可选权益为备选权益集合中的一项或多项权益。
8.如权利要求7所述的装置,其中,所述第一神经网络模型还包括第五私有层,所述第五私有层接收所述第二私有层的输出和所述第二共享层的输出作为其输入,所述第五私有层的输出作为所述第一神经网络模型的输出结果。
9.如权利要求7所述的装置,其中,所述第二神经网络模型还包括第六私有层,所述第六私有层接收所述第四私有层的输出和所述第二共享层的输出作为其输入,所述第六私有层的输出作为所述第二神经网络模型的输出结果。
10.如权利要求7所述的装置,其中,所述装置还包括:
第一预测单元,用于将所述源领域的第一待测样本输入所述第一训练单元训练后的所述第一神经网络模型,得到所述第一待测样本的预测结果。
11.如权利要求7所述的装置,其中,所述装置还包括:
第二预测单元,用于将所述目标领域的第二待测样本输入所述第二训练单元训练后的所述第二神经网络模型,得到所述第二待测样本的预测结果。
12.如权利要求7所述的装置,其中,所述装置还包括:
分组单元,用于从所述备选权益集合包括的各项权益中选取一项或多项权益,以形成多组可选权益;
确定单元,用于根据目标用户的属性特征的特征值和所述分组单元得到的每组可选权益中的各项权益分别对应的属性特征的特征值,确定目标用户对应于每组可选权益的样本;
第三预测单元,用于将所述确定单元确定的目标用户对应于每组可选权益的样本输入训练后的所述第一神经网络模型或所述第二神经网络模型,得到所述目标用户对应于每组可选权益的预测结果;
选择单元,用于根据所述第三预测单元得到的目标用户对应于每组可选权益的预测结果,从所述分组单元得到的多组可选权益中选择向所述目标用户发放的一组可选权益。
13.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-6中任一项的所述的方法。
14.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-6中任一项的所述的方法。
CN202010466496.7A 2020-05-28 2020-05-28 基于迁移学习的训练神经网络模型的方法和装置 Active CN111382846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010466496.7A CN111382846B (zh) 2020-05-28 2020-05-28 基于迁移学习的训练神经网络模型的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010466496.7A CN111382846B (zh) 2020-05-28 2020-05-28 基于迁移学习的训练神经网络模型的方法和装置

Publications (2)

Publication Number Publication Date
CN111382846A CN111382846A (zh) 2020-07-07
CN111382846B true CN111382846B (zh) 2020-09-01

Family

ID=71216034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010466496.7A Active CN111382846B (zh) 2020-05-28 2020-05-28 基于迁移学习的训练神经网络模型的方法和装置

Country Status (1)

Country Link
CN (1) CN111382846B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949752B (zh) * 2021-03-25 2022-09-06 支付宝(杭州)信息技术有限公司 业务预测系统的训练方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190392815A1 (en) * 2018-06-22 2019-12-26 Genesys Telecommunications Laboratories, Inc. System and method for f0 transfer learning for improving f0 prediction with deep neural network models
CN111046275A (zh) * 2019-11-19 2020-04-21 腾讯科技(深圳)有限公司 基于人工智能的用户标签确定方法及装置、存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705406B (zh) * 2019-09-20 2022-11-15 五邑大学 基于对抗迁移学习的人脸美丽预测方法及装置
CN110913207B (zh) * 2019-12-03 2021-07-13 华南理工大学 一种基于多任务深度学习的视频传输质量评价方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190392815A1 (en) * 2018-06-22 2019-12-26 Genesys Telecommunications Laboratories, Inc. System and method for f0 transfer learning for improving f0 prediction with deep neural network models
CN111046275A (zh) * 2019-11-19 2020-04-21 腾讯科技(深圳)有限公司 基于人工智能的用户标签确定方法及装置、存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multi-Modal Weights Sharing and Hierarchical Feature Fusion for RGBD Salient Object Detection;Fen Xiao 等;《IEEE Access》;20200204;第26602-26611页 *
基于不同超声成像的甲状腺结节良恶性判别;武宽 等;《计算机应用》;20200110;第77-82页 *

Also Published As

Publication number Publication date
CN111382846A (zh) 2020-07-07

Similar Documents

Publication Publication Date Title
CN111523044B (zh) 用于推荐目标对象的方法、计算设备和计算机存储介质
Cabrerizo et al. A method based on PSO and granular computing of linguistic information to solve group decision making problems defined in heterogeneous contexts
CN112136143A (zh) 使用神经网络的时间序列数据依赖的动态发现
Pozna et al. New results in modelling derived from Bayesian filtering
US20200342953A1 (en) Target molecule-ligand binding mode prediction combining deep learning-based informatics with molecular docking
Hartmann et al. The next evolution of MDE: a seamless integration of machine learning into domain modeling
Chang et al. IoT big-data centred knowledge granule analytic and cluster framework for BI applications: a case base analysis
Kukreja Hybrid fuzzy AHP–TOPSIS approach to prioritizing solutions for inverse reinforcement learning
CN112528110A (zh) 确定实体业务属性的方法及装置
CN110689110B (zh) 处理交互事件的方法及装置
Köfinger et al. Empirical optimization of molecular simulation force fields by Bayesian inference
Liu et al. Multi-task recommendations with reinforcement learning
CN115270001A (zh) 基于云端协同学习的隐私保护推荐方法及系统
CN111382846B (zh) 基于迁移学习的训练神经网络模型的方法和装置
Sun et al. A novel belief rule base expert system with interval-valued references
Botteghi et al. Deep kernel learning of dynamical models from high-dimensional noisy data
Regis Surrogate-assisted particle swarm with local search for expensive constrained optimization
CN113761388A (zh) 一种推荐方法、装置、电子设备及存储介质
CN112102015B (zh) 物品推荐方法、元网络处理方法、装置、存储介质和设备
Hou et al. A deep reinforcement learning real-time recommendation model based on long and short-term preference
WO2024051707A1 (zh) 训练推荐模型的方法、推荐资源的方法及其装置
KR102536063B1 (ko) 인공지능 기반 기업용 매출 및 매입 정산 솔루션 제공 방법, 장치 및 시스템
CN114792173B (zh) 预测模型训练方法和装置
CN115600009A (zh) 一种考虑用户未来偏好的基于深度强化学习的推荐方法
Liu et al. Construction of an IoT customer operation analysis system based on big data analysis and human-centered artificial intelligence for web 4.0

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40032835

Country of ref document: HK