CN111931045B - 一种基于元学习的异质信息网络冷启动推荐方法及装置 - Google Patents

一种基于元学习的异质信息网络冷启动推荐方法及装置 Download PDF

Info

Publication number
CN111931045B
CN111931045B CN202010748668.XA CN202010748668A CN111931045B CN 111931045 B CN111931045 B CN 111931045B CN 202010748668 A CN202010748668 A CN 202010748668A CN 111931045 B CN111931045 B CN 111931045B
Authority
CN
China
Prior art keywords
node
sample
feature vector
vector corresponding
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010748668.XA
Other languages
English (en)
Other versions
CN111931045A (zh
Inventor
石川
陆元福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202010748668.XA priority Critical patent/CN111931045B/zh
Publication of CN111931045A publication Critical patent/CN111931045A/zh
Application granted granted Critical
Publication of CN111931045B publication Critical patent/CN111931045B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐方法及装置,其中方法包括:获取第一节点信息以及各第二节点信息,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量;将第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合上下文语义得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量;计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度;基于各相似度,确定向第一节点推荐的目标第二节点。本发明实施例,能够提高异质信息网络冷启动推荐结果的准确度。

Description

一种基于元学习的异质信息网络冷启动推荐方法及装置
技术领域
本发明涉及数据处理技术领域,特别是涉及一种基于元学习的异质信息网络冷启动推荐方法及装置。
背景技术
随着科技的发展,推荐系统已经在各种线上服务中得以广泛开发部署,例如电子商务平台和新闻平台等,推荐系统可以为用户解决信息过载的问题。作为推荐系统的核心,对信息的协同过滤旨在根据交互历史记录来估算节点信息之间交互的可能性,例如,根据用户过去的购买和点击等历史操作记录来估算用户购买某一商品的可能性。但实际中,新用户或新商品的交互数据往往是非常稀疏的,导致冷启动场景的出现。
异质信息网络可以定义为一个包含多种类型节点和边的图,节点集合表示为V,边集合表示为E,异质信息网络的图表示可以为G=(V,E,O,R),其中,边表示节点与节点之间的关系,在图G中,每个节点关联一个类型映射函数
Figure BDA0002609282690000011
每个边关联一个类型映射函数
Figure BDA0002609282690000012
表示节点类型集合,R表示边类型集合,当|O|+|R|>2时,图G为异质信息网络。如图1所示,图1为以电影推荐系统构建的一个异质信息网络,在该异质信息网络中包含用户、电影、演员以及导演四种类型的节点,以及各节点之间的边。
以节点类型分别为用户和商品为例,在给定异质信息网G=(V,E,O,R)中,VU,VI∈V分别定义为用户集合和商品集合。给定用户和商品间的评分集合
Figure BDA0002609282690000013
ru,i表示用户u对商品i的评分,<u,i>表示用户u和商品i之间的关系,如果用户u是一个仅有少量评分的新用户,即
Figure BDA0002609282690000014
是很小的,则称为用户冷启动,u′表示一个新用户。相似的,如果商品i是一个新商品,即为商品冷启动;如果用户u和商品i都是新加入的,那么即为用户商品冷启动。
现有为解决异质信息网络冷启动问题,在异质信息网络中进行冷启动推荐的方法为:融合额外信息以增加不同节点的表示信息,该额外信息为异质信息网络中每一节点对应的除已有信息之外的信息,使用融合额外信息后的节点表示信息完成冷启动推荐,节点表示信息可以使用向量表示。以节点类型分别为用户和商品为例,可以将用户或者商品相关的内容作为额外信息,例如,用户的额外信息可以包括:用户自身的年龄、性别,以及该用户是否购买过商品,或已购买商品的信息等;商品的额外信息可以包括:商品自身的属性信息,以及购买过该商品的用户信息等。具体的冷启动推荐方法可以为:获取不同节点的额外信息,并得到融合额外信息后的每一节点的表示信息,然后,针对第一节点,计算该第一节点的表示信息与第二节点的表示信息之间的相似度,向第一节点推荐相似度大于设定阈值的第二节点。其中,第一节点为待推荐节点,第二节点为推荐节点。
然而,实际应用中,考虑到信息的安全性,获取不同节点的额外信息比较困难,且获取的额外信息准确度不能保证,使得异质信息网络冷启动推荐结果不准确。
发明内容
本发明实施例的目的在于提供一种基于元学习的异质信息网络冷启动推荐方法及装置,以提高异质信息网络冷启动推荐结果的准确度。具体技术方案如下:
第一方面,本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐方法,所述方法包括:
获取第一节点信息以及各第二节点信息,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量;其中,所述第一节点信息为异质信息网络中已有的用于表示所述第一节点特征的信息,所述第二节点信息为所述异质信息网络中已有的用于表示所述第二节点特征的信息,所述第一节点为待接收推荐结果的节点,所述第二节点为候选推荐结果;
将所述第一节点对应的第一特征向量和各所述第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合上下文语义得到所述第一节点对应的第二特征向量和各所述第二节点各自对应的第二特征向量;其中,所述预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,所述语义增强模型是根据所述样本节点在异质信息网络中的上下文语义构建的;
计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度;
基于各所述相似度,确定向所述第一节点推荐的目标第二节点。
可选地,所述基于各所述相似度,确定向所述第一节点推荐的目标第二节点,包括:
按照从大到小的顺序对各所述相似度进行排序,得到相似度序列;
将所述相似度序列中前预设数量个相似度对应的第二节点,作为各目标第二节点;
向所述第一节点推荐各所述目标第二节点。
可选地,所述元学习模型的训练过程,包括:
构建初始元学习模型;
基于预先构建的样本节点对应的语义增强模型,得到第一样本节点对应的第一特征向量,以及第二样本节点对应的第一特征向量;
将所述第一样本节点对应的第一特征向量,所述第二样本节点对应的第一特征向量,以及是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签,输入所述初始元学习模型,通过聚合上下文语义得到所述第一样本节点对应的第二特征向量,以及所述第二样本节点对应的第二特征向量;
针对每一第一样本节点,计算该第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度;
基于所述第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度,以及所述是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签,计算损失函数;
对损失函数进行最小化处理,得到最小化损失函数;
根据最小化损失函数,更新所述初始元学习模型中各部分参数,训练得到所述元学习模型。
可选地,所述损失函数的表达式为:
Figure BDA0002609282690000041
其中,
Figure BDA0002609282690000042
表示第一样本节点u的损失函数,
Figure BDA0002609282690000043
表示向第一样本节点u推荐第二样本节点i的第二样本节点集合,rui表示是否向第一样本节点u推荐第二样本节点i的真值标签,
Figure BDA0002609282690000044
表示向第一样本节点推荐第二样本节点的第二样本节点集合,
Figure BDA0002609282690000045
表示第一样本节点u对应的第二特征向量与第二样本节点i对应的第二特征向量之间的相似度。
可选地,预先构建的第一样本节点对应的语义增强模型表示为
Figure BDA0002609282690000046
Figure BDA0002609282690000047
其中,
Figure BDA0002609282690000048
Figure BDA0002609282690000049
表示第一样本节点u对应的语义增强支撑集,
Figure BDA00026092826900000410
表示第一样本节点u对应的语义增强查询集,
Figure BDA00026092826900000411
表示向第一样本节点u推荐的第二样本节点集合,
Figure BDA00026092826900000412
表示第一样本节点u基于元路径集合
Figure BDA00026092826900000413
的语义上下文,
Figure BDA00026092826900000414
表示没有向第一样本节点u推荐过的第二样本节点集合,
Figure BDA00026092826900000415
表示第一样本节点u基于元路径集合
Figure BDA00026092826900000416
的语义上下文,所述语义增强支撑集和所述语义增强查询集中的第二样本节点集合是互斥的。
可选地,使用如下表达式计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度:
Figure BDA00026092826900000417
其中,
Figure BDA00026092826900000418
表示第一节点u对应的第二特征向量与第二节点i对应的第二特征向量之间的相似度,MLP表示一个两层的多层感知器,
Figure BDA00026092826900000419
表示拼接操作,xu表示第一节点u对应的第二特征向量,ei表示第二节点i对应的第二特征向量,hω表示相似度计算函数,ω表示先验参数。
第二方面,本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐装置,所述装置包括:
第一获得模块,用于获取第一节点信息以及各第二节点信息,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量;其中,所述第一节点信息为异质信息网络中已有的用于表示所述第一节点特征的信息,所述第二节点信息为所述异质信息网络中已有的用于表示所述第二节点特征的信息,所述第一节点为待接收推荐结果的节点,所述第二节点为候选推荐结果;
第二获得模块,用于将所述第一节点对应的第一特征向量和各所述第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合上下文语义得到所述第一节点对应的第二特征向量和各所述第二节点各自对应的第二特征向量;其中,所述预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,所述语义增强模型是根据所述样本节点在异质信息网络中的上下文语义构建的;
第一计算模块,用于计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度;
推荐模块,用于基于各所述相似度,确定向所述第一节点推荐的目标第二节点。
可选地,所述推荐模块包括:
排序子模块,用于按照从大到小的顺序对各所述相似度进行排序,得到相似度序列;
确定子模块,用于将所述相似度序列中前预设数量个相似度对应的第二节点,作为各目标第二节点;
推荐子模块,用于向所述第一节点推荐各所述目标第二节点。
可选地,所述装置还包括:
构建模块,用于构建初始元学习模型;
第三获得模块,用于基于预先构建的样本节点对应的语义增强模型,得到第一样本节点对应的第一特征向量,以及第二样本节点对应的第一特征向量;
第四获得模块,用于将所述第一样本节点对应的第一特征向量,所述第二样本节点对应的第一特征向量,以及是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签,输入所述初始元学习模型,通过聚合上下文语义得到所述第一样本节点对应的第二特征向量,以及所述第二样本节点对应的第二特征向量;
第二计算模块,用于针对每一第一样本节点,计算该第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度;
第三计算模块,用于基于所述第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度,以及所述是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签,计算损失函数;
第五获得模块,用于对损失函数进行最小化处理,得到最小化损失函数;
训练模块,用于根据最小化损失函数,更新所述初始元学习模型中各部分参数,训练得到所述元学习模型。
可选地,所述损失函数的表达式为:
Figure BDA0002609282690000061
其中,
Figure BDA0002609282690000062
表示第一样本节点u的损失函数,
Figure BDA0002609282690000063
表示向第一样本节点u推荐第二样本节点i的第二样本节点集合,rui表示是否向第一样本节点u推荐第二样本节点i的真值标签,
Figure BDA0002609282690000064
表示向第一样本节点推荐第二样本节点的第二样本节点集合,
Figure BDA0002609282690000065
表示第一样本节点u对应的第二特征向量与第二样本节点i对应的第二特征向量之间的相似度。
可选地,预先构建的第一样本节点对应的语义增强模型表示为
Figure BDA0002609282690000066
Figure BDA0002609282690000067
其中,
Figure BDA0002609282690000068
Figure BDA00026092826900000614
表示第一样本节点u对应的语义增强支撑集,
Figure BDA0002609282690000069
表示第一样本节点u对应的语义增强查询集,
Figure BDA00026092826900000610
表示向第一样本节点u推荐的第二样本节点集合,
Figure BDA00026092826900000611
表示第一样本节点u基于元路径集合
Figure BDA00026092826900000612
的语义上下文,
Figure BDA00026092826900000613
表示没有向第一样本节点u推荐过的第二样本节点集合,
Figure BDA0002609282690000071
表示第一样本节点u基于元路径集合
Figure BDA0002609282690000072
的语义上下文,所述语义增强支撑集和所述语义增强查询集中的第二样本节点集合是互斥的。
可选地,使用如下表达式计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度:
Figure BDA0002609282690000073
其中,
Figure BDA0002609282690000074
表示第一节点u对应的第二特征向量与第二节点i对应的第二特征向量之间的相似度,MLP表示一个两层的多层感知器,
Figure BDA0002609282690000075
表示拼接操作,xu表示第一节点u对应的第二特征向量,ei表示第二节点i对应的第二特征向量,hω表示相似度计算函数,ω表示先验参数。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面所述的一种基于元学习的异质信息网络冷启动推荐方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的一种基于元学习的异质信息网络冷启动推荐方法的步骤。
本发明实施例有益效果:
本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法及装置,由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义,进而提高元学习模型训练的准确度,且不需要获取节点的额外信息,能够提高异质信息网络冷启动推荐结果的准确度。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为一种以电影推荐系统构建的异质信息网络示意图;
图2为本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法的流程示意图;
图3为本发明实施例提供的一种确定推荐结果的实施方式流程图;
图4为本发明实施例提供的一种元学习模型训练实施方式流程图;
图5为本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐装置的结构示意图;
图6为本发明实施例提供的一种确定推荐结果装置的结构示意图;
图7为本发明实施例提供的一种元学习模型训练装置的结构示意图;
图8为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有使用融合额外信息增加节点表示信息的方式对异质信息网络进行冷启动的方法中,获取不同节点额外信息比较困难,且获取的额外信息准确度不能保证,使得异质信息网络冷启动推荐结果不准确的问题,本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐方法,该方法包括:
获取第一节点信息以及各第二节点信息,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量;其中,第一节点信息为异质信息网络中已有的用于表示第一节点特征的信息,第二节点信息为异质信息网络中已有的用于表示第二节点特征的信息,第一节点为待接收推荐结果的节点,第二节点为候选推荐结果;
将第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合上下文语义得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量;其中,预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,语义增强模型是根据样本节点在异质信息网络中的上下文语义构建的;
计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度;
基于各相似度,确定向第一节点推荐的目标第二节点。
本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法,由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义,进而提高元学习模型训练的准确度,且不需要获取节点的额外信息,能够提高异质信息网络冷启动推荐结果的准确度。
下面进行具体说明,如图2所示,图2为本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法流程示意图,该方法可以包括:
S101,获取第一节点信息以及各第二节点信息,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量。
本发明实施例以异质信息网络冷启动时如何向一个第一节点确定推荐的至少一个第二节点为例进行说明,实际应用中第一节点的数量可以有多个,向每个第一节点确定推荐的至少一个第二节点的实施过程均可参照本发明实施例的推荐过程。
在异质信息网络冷启动时,可以获取异质信息网络中第一节点信息以及各第二节点信息,其中,第一节点信息可以为异质信息网络中已有的用于表示第一节点特征的信息,第二节点信息可以为异质信息网络中已有的用于表示第二节点特征的信息,第一节点与第二节点的类型可以不同,第一节点为待接收推荐结果的节点,第二节点为候选推荐结果。
示例性的,以异质信息网络中节点类型分别为用户和商品为例,第一节点可以为用户,第二节点可以为商品,第一节点信息可以是用户在异质信息网络中注册时的用户账号、用户密码、用户标识等基本信息,第二节点信息可以是商品在异质信息网络中注册时的商品标识、商品名称、商品类型等基本信息,在异质信息网络冷启动时,可以向作为第一节点的用户推荐作为商品的第二节点。
在获取异质信息网络中第一节点信息以及各第二节点信息之后,可以使用Embedding初始化查表的方式,对所获取的第一节点信息以及各第二节点信息进行格式转换,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量。示例性的,第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量可以使用数字等表示。
S102,将第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合上下文语义得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量。
将得到的第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合异质信息网络中分别与第一节点和各第二节点相关的上下文语义,得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量。
其中,预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,语义增强模型是根据样本节点在异质信息网络中的上下文语义构建的。
示例性的,是否向第一样本节点推荐第二样本节点所对应的真值标签可以使用1或0表示,例如,向第一样本节点推荐第二样本节点,可以使用标签1表示,没有向第一样本节点推荐第二样本节点,可以使用标签0表示。
S103,计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度。
在得到聚合上下文语义的第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量后,计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度。具体的,可以使用如下表达式计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度:
Figure BDA0002609282690000111
其中,
Figure BDA0002609282690000112
表示第一节点u对应的第二特征向量与第二节点i对应的第二特征向量之间的相似度,MLP表示一个两层的多层感知器,
Figure BDA0002609282690000113
表示拼接操作,xu表示第一节点u对应的第二特征向量,ei表示第二节点i对应的第二特征向量,hω表示相似度计算函数,ω表示先验参数。
S104,基于各相似度,确定向第一节点推荐的目标第二节点。
在计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度后,可以根据计算得到的相似度,确定向第一节点推荐的目标第二节点。示例性的,可以设定一个阈值,当相似度大于该设定的阈值时,将相似度大于阈值对应的第二节点确定为目标第二节点,然后,向第一节点推荐目标第二节点。具体阈值的取值,本领域技术人员可根据实际需求进行设定。
本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法,由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义,进而提高元学习模型训练的准确度,且不需要获取节点的额外信息,能够提高异质信息网络冷启动推荐结果的准确度。
作为本发明实施例一种可选的实施方式,如图3所示,针对上述步骤S104,本发明实施例提供的一种确定推荐结果的实施方式,该实施方式可以包括:
S1041,按照从大到小的顺序对各相似度进行排序,得到相似度序列。
S1042,将相似度序列中前预设数量个相似度对应的第二节点,作为各目标第二节点。
S1043,向第一节点推荐各目标第二节点。
将计算得到的第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度,按照从大到小的顺序进行排序,得到相似度序列。进而,将相似度序列中前预设数量个相似度对应的第二节点,确定为目标第二节点,向第一节点推荐各目标第二节点。具体预设数量的个数,本领域技术人员可根据实际需求进行设定。
本发明实施例中,可以将与第一节点对应的第二特征向量相似度比较大对应的预设数量个第二节点确定为目标第二节点,进而向第一节点推荐各目标第二节点,以提高异质信息网络冷启动推荐结果的准确度。
作为本发明实施例一种可选的实施方式,如图4所示,元学习模型的训练过程,可以包括:
S201,构建初始元学习模型。
作为本发明实施例一种可选的实施方式,所构建的初始元学习模型可以包括上下文语义聚合模块,相似度预测模块。上下文语义聚合模块可以对输入模型的各样本节点对应的第一特征向量聚合上下文语义,得到各样本节点对应的第二特征向量;相似度预测模块可以对第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度进行预测。
S202,基于预先构建的样本节点对应的语义增强模型,得到第一样本节点对应的第一特征向量,以及第二样本节点对应的第一特征向量。
本发明实施例中,可以预先构建样本节点对应的语义增强模型,该语义增强模型是根据样本节点在异质信息网络中的上下文语义构建的,不同类型的样本节点对应的语义增强模型架构相同,构建过程一致。
以第一样本节点对应的语义增强模型为例进行说明,预先构建的第一样本节点对应的语义增强模型可以表示为
Figure BDA0002609282690000131
其中,
Figure BDA0002609282690000132
Figure BDA0002609282690000133
Figure BDA0002609282690000134
表示第一样本节点u对应的语义增强支撑集,
Figure BDA0002609282690000135
表示第一样本节点u对应的语义增强查询集,
Figure BDA0002609282690000136
表示向第一样本节点u推荐的第二样本节点集合,
Figure BDA0002609282690000137
表示第一样本节点u基于元路径集合
Figure BDA0002609282690000138
的语义上下文,
Figure BDA0002609282690000139
表示没有向第一样本节点u推荐过的第二样本节点集合,
Figure BDA00026092826900001310
表示第一样本节点u基于元路径集合
Figure BDA00026092826900001311
的语义上下文,语义增强支撑集和语义增强查询集中的第二样本节点集合是互斥的。
其中,元路径是定义在异质信息网络中连接两类节点的一条路径。例如,给定异质信息网络G,长为l的元路径可以定义为一条复合关系,表示为:
Figure BDA00026092826900001312
其中,P表示元路径的复合关系,ol表示第l个节点类型,rl表示第l个边类型,ol∈O且rl∈R。如果两个节点间只有一种类型关系,可以将上述复合关系简写为P=o1o2…ol+1
示例性的,以第一样本节点为用户,第二样本节点为商品为例,对语义增强支撑集
Figure BDA00026092826900001313
的构建进行如下介绍:
对于冷启动场景下的新用户,用户u评分过(或向用户推荐过)的商品集合
Figure BDA0002609282690000141
通常是很小的,即一个新用户往往发表很少的评分评论。对于元训练的任务,通过采样用户u评分过的少量商品作为支撑集
Figure BDA0002609282690000142
以此模拟新用户。
给定元路径集合
Figure BDA0002609282690000143
其中每条长为l的路径
Figure BDA0002609282690000144
由用户-商品类型节点开始,并以商品类型节点结束。例如,在图1所示异质信息网络中,路径长度l=3,则元路径集合为
Figure BDA0002609282690000145
其中,U表示用户,M表示电影,A表示演员,D表示导演。对于每个用户-商品交互<u,i>,定义元路径p限定下的语义上下文如下:
Figure BDA0002609282690000146
其中,
Figure BDA0002609282690000147
表示用户u与商品i在元路径p限定下的语义上下文,j表示基于用户u与商品i的交互信息u-i,沿元路径p可达的商品j。
示例性的,限定于元路径UMAM,用户2表示为u2与电影2表示为m2交互<u2,m2>的语义上下文可以为{m2,m3,…}。m3表示电影3,由于在每个样本节点对应的语义增强模型中用户u可能会和多个商品交互,故定义语义增强模型
Figure BDA0002609282690000148
在元路径p限定下的语义上下文表示为:
Figure BDA0002609282690000149
然后,统计元路径集合
Figure BDA00026092826900001410
中的所有路径,语义增强模型
Figure BDA00026092826900001411
的语义上下文
Figure BDA00026092826900001412
可以定义为:
Figure BDA00026092826900001413
其中,
Figure BDA00026092826900001414
表示用户u基于元路径p1的语义上下文。本质上,
Figure BDA00026092826900001415
是商品的集合,集合中是用户u通过所有其评分过的商品并沿着元路径可达的商品,融合了多方面的语义上下文信息。如图1所示,沿着元路径UMAM,用户u2的可达商品为:{m2,m3},表示了用户u2曾经评分过的同一演员出演的电影。也就是说,由元路径UMAM限定的语义上下文融合了同一演员出演的信息作为用户的偏好学习。
语义增强查询集
Figure BDA0002609282690000151
的构建与语义增强支撑集
Figure BDA0002609282690000152
的构建过程类似,本发明实施例在此不再赘述,
Figure BDA0002609282690000153
包含用户u没有评分过的商品,在语义增强模型中语义增强支撑集和语义增强查询集中的第二样本节点集合是互斥的。
示例性的,构建的样本节点对应的语义增强模型中各样本节点对应的信息可以使用矩阵或列表的形式表示,然后,可以选取不同的样本节点,一并提取该样本节点相关的信息,进而使用Embedding初始化查表的方式,对提取的样本节点信息进行格式转换,得到第一样本节点对应的第一特征向量,以及第二样本节点对应的第一特征向量。
参见图4,S203,将第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签,输入初始元学习模型,通过聚合上下文语义得到第一样本节点对应的第二特征向量,以及第二样本节点对应的第二特征向量。
示例性的,得到的第一样本节点对应的第二特征向量可以表示为:
xu=gφ(u,Cu)=σ(MEAN({Wej+b:j∈Cu}))
其中,xu表示第一样本节点u对应的第二特征向量,gφ表示上下文语义聚合函数,Cu表示第一样本节点u通过直接交互或元路径关联的第二样本节点集合,MEAN表示均值池化操作,σ为激活函数,例如可以是LeaklyReLU函数,ej表示第二样本节点j对应的第二特征向量,W表示元学习模型的待学习参数矩阵,b表示元学习模型的待学习参数向量。
S204,针对每一第一样本节点,计算该第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度。
具体计算第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度,可参见上文计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度的过程。
S205,基于第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度,以及是否向第一样本节点推荐第二样本节点所对应的真值标签,计算损失函数。
作为本发明实施例一种可选的实施方式,损失函数的表达式可以为:
Figure BDA0002609282690000161
其中,
Figure BDA0002609282690000162
表示第一样本节点u的损失函数,
Figure BDA0002609282690000163
表示向第一样本节点u推荐第二样本节点i的第二样本节点集合,rui表示是否向第一样本节点u推荐第二样本节点i的真值标签,
Figure BDA0002609282690000164
表示向第一样本节点推荐第二样本节点的第二样本节点集合,
Figure BDA0002609282690000165
表示第一样本节点u对应的第二特征向量与第二样本节点i对应的第二特征向量之间的相似度。
S206,对损失函数进行最小化处理,得到最小化损失函数。
示例性的,对损失函数进行最小化处理的实施过程可以如下:
给定元路径
Figure BDA0002609282690000166
第一样本节点u的在语义空间P内的可以表示为:
Figure BDA0002609282690000167
其中,
Figure BDA0002609282690000168
表示第一样本节点u在元路径p下对应的第二特征向量,
Figure BDA0002609282690000169
表示第一样本节点u在元路径p下的语义上下文。
在p语义空间内,进一步计算语义增强支撑集上的损失函数表示为:
Figure BDA0002609282690000171
其中,
Figure BDA0002609282690000172
表示第一样本节点u对应语义增强模型
Figure BDA0002609282690000173
的损失函数,ω表示先验参数,
Figure BDA0002609282690000174
表示向第一样本节点u推荐的第二样本节点集合,rui表示是否向第一样本节点u推荐第二样本节点i的真值标签,
Figure BDA0002609282690000175
表示在元路径p限定下的语义空间内第一样本节点u对应的第二特征向量,与第二样本节点i对应的第二特征向量之间的相似度。
然后,对于语义增强模型
Figure BDA0002609282690000176
在p限定的语义空间中,经过一次梯度下降,得到语义先验
Figure BDA0002609282690000177
可以表示为:
Figure BDA0002609282690000178
其中,
Figure BDA0002609282690000179
表示第一样本节点u在p语义空间内的语义先验,φ表示元学习模型参数集合,α表示语义级学习率。
语义先验
Figure BDA00026092826900001710
进一步可以更新第一样本节点u在p语义空间内的表示向量,得到
Figure BDA00026092826900001711
其中,
Figure BDA00026092826900001712
表示第一样本节点u在语义增强支撑集上的向量表示,S表示语义增强支撑集,
Figure BDA00026092826900001713
表示基于语义先验
Figure BDA00026092826900001714
的上下文语义聚合函数。
然后,将先验参数ω转换到p语义空间,得到:
Figure BDA00026092826900001715
其中,ωp表示p语义空间内的先验参数,⊙表示矩阵逐元素乘法,κ(·)表示转换函数,可以由一个全连接层实现。
再经过一次梯度下降,得到:
Figure BDA0002609282690000181
其中,
Figure BDA0002609282690000182
表示第一样本节点u在p语义空间内的先验参数,β表示任务级学习率。
进一步,将在p语义空间内得到的
Figure BDA0002609282690000183
Figure BDA0002609282690000184
确定为:
Figure BDA0002609282690000185
表示全局先验,通过反向传播的方式对损失函数进行最小化处理,最小化损失函数表示为:
Figure BDA0002609282690000186
其中,
Figure BDA0002609282690000187
表示所有训练样本节点对应的语义增强模型集合,ωu和xu分别可以表示为:
Figure BDA0002609282690000188
其中,ωu表示第一样本节点u的先验参数,
Figure BDA0002609282690000189
表示在p语义空间内的权重,xu表示第一样本节点u的第二特征向量,
Figure BDA00026092826900001810
表示第一样本节点u在语义增强查询集上的向量表示。
优化全局先验θ,使得利用优化后的参数
Figure BDA00026092826900001811
的每个元训练语义增强模型,在语义增强查询集上的损失是最小化的。
参见图4,S207,根据最小化损失函数,更新初始元学习模型中各部分参数,训练得到元学习模型。
相应于上述方法实施例,本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐装置,如图5所示,该装置可以包括:
第一获得模块301,用于获取第一节点信息以及各第二节点信息,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量;其中,第一节点信息为异质信息网络中已有的用于表示第一节点特征的信息,第二节点信息为异质信息网络中已有的用于表示第二节点特征的信息,第一节点为待接收推荐结果的节点,第二节点为候选推荐结果。
第二获得模块302,用于将第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合上下文语义得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量;其中,预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,语义增强模型是根据样本节点在异质信息网络中的上下文语义构建的。
第一计算模块303,用于计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度。
推荐模块304,用于基于各相似度,确定向第一节点推荐的目标第二节点。
本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐装置,由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义,进而提高元学习模型训练的准确度,且不需要获取节点的额外信息,能够提高异质信息网络冷启动推荐结果的准确度。
需要说明的是,本发明实施例的装置是与图2所示的一种基于元学习的异质信息网络冷启动推荐方法对应的装置,图2所示的一种基于元学习的异质信息网络冷启动推荐方法的所有实施例均适用于该装置,且均能达到相同的有益效果。
可选地,如图6所示,上述推荐模块304,可以包括:
排序子模块3041,用于按照从大到小的顺序对各相似度进行排序,得到相似度序列。
确定子模块3042,用于将相似度序列中前预设数量个相似度对应的第二节点,作为各目标第二节点。
推荐子模块3043,用于向第一节点推荐各目标第二节点。
可选地,如图7所示,上述装置还可以包括:
构建模块401,用于构建初始元学习模型。
第三获得模块402,用于基于预先构建的样本节点对应的语义增强模型,得到第一样本节点对应的第一特征向量,以及第二样本节点对应的第一特征向量。
第四获得模块403,用于将第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签,输入初始元学习模型,通过聚合上下文语义得到第一样本节点对应的第二特征向量,以及第二样本节点对应的第二特征向量。
第二计算模块404,用于针对每一第一样本节点,计算该第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度。
第三计算模块405,用于基于第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度,以及是否向第一样本节点推荐第二样本节点所对应的真值标签,计算损失函数。
第五获得模块406,用于对损失函数进行最小化处理,得到最小化损失函数。
训练模块407,用于根据最小化损失函数,更新初始元学习模型中各部分参数,训练得到元学习模型。
可选地,上述损失函数的表达式可以为:
Figure BDA0002609282690000211
其中,
Figure BDA0002609282690000212
表示第一样本节点u的损失函数,
Figure BDA0002609282690000213
表示向第一样本节点u推荐第二样本节点i的第二样本节点集合,rui表示是否向第一样本节点u推荐第二样本节点i的真值标签,
Figure BDA0002609282690000214
表示向第一样本节点推荐第二样本节点的第二样本节点集合,
Figure BDA0002609282690000215
表示第一样本节点u对应的第二特征向量与第二样本节点i对应的第二特征向量之间的相似度。
可选地,预先构建的第一样本节点对应的语义增强模型可以表示为
Figure BDA0002609282690000216
其中,
Figure BDA0002609282690000217
Figure BDA0002609282690000218
表示第一样本节点u对应的语义增强支撑集,
Figure BDA0002609282690000219
表示第一样本节点u对应的语义增强查询集,
Figure BDA00026092826900002110
表示向第一样本节点u推荐的第二样本节点集合,
Figure BDA00026092826900002111
表示第一样本节点u基于元路径集合
Figure BDA00026092826900002112
的语义上下文,
Figure BDA00026092826900002113
表示没有向第一样本节点u推荐过的第二样本节点集合,
Figure BDA00026092826900002114
表示第一样本节点u基于元路径集合
Figure BDA00026092826900002115
的语义上下文,语义增强支撑集和语义增强查询集中的第二样本节点集合是互斥的。
可选地,可以使用如下表达式计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度:
Figure BDA00026092826900002116
其中,
Figure BDA00026092826900002117
表示第一节点u对应的第二特征向量与第二节点i对应的第二特征向量之间的相似度,MLP表示一个两层的多层感知器,
Figure BDA00026092826900002118
表示拼接操作,xu表示第一节点u对应的第二特征向量,ei表示第二节点i对应的第二特征向量,hω表示相似度计算函数,ω表示先验参数。
本发明实施例还提供了一种电子设备,如图8所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现本发明实施例所提供的一种基于元学习的异质信息网络冷启动推荐方法的步骤。
本发明实施例提供的一种电子设备,由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义,进而提高元学习模型训练的准确度,且不需要获取节点的额外信息,能够提高异质信息网络冷启动推荐结果的准确度。
上述电子设备提到的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processing,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一一种基于元学习的异质信息网络冷启动推荐方法的步骤,以达到相同的有益效果。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一一种基于元学习的异质信息网络冷启动推荐方法的步骤,以达到相同的有益效果。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、DSL(Digital Subscriber Line,数字用户线))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD(Digital Versatile Disc,数字多功能光盘))、或者半导体介质(例如SSD(Solid StateDisk,固态硬盘))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置/电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (9)

1.一种基于元学习的异质信息网络冷启动推荐方法,其特征在于,所述方法包括:
获取第一节点信息以及各第二节点信息,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量;其中,所述第一节点信息为异质信息网络中已有的用于表示所述第一节点的特征的信息,所述第二节点信息为所述异质信息网络中已有的用于表示所述第二节点的特征的信息,所述第一节点为待接收推荐结果的节点,所述第二节点为候选推荐节点;所述第一节点为用户,所述第二节点为商品,所述第一节点信息包括:用户在异质信息网络中注册时的用户账号、用户密码、用户标识,所述第二节点信息包括:商品在异质信息网络中注册时的商品标识、商品名称、商品类型;
将所述第一节点对应的第一特征向量和各所述第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合上下文语义得到所述第一节点对应的第二特征向量和各所述第二节点各自对应的第二特征向量;其中,所述预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,所述语义增强模型是根据所述样本节点在异质信息网络中的上下文语义构建的;所述第一样本节点为样本用户,所述第二样本节点为样本商品;
计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度;
基于各所述相似度,确定向所述第一节点推荐的目标第二节点;
其中,预先构建的第一样本节点对应的语义增强模型表示为
Figure FDA0003801553830000011
其中,
Figure FDA0003801553830000012
Figure FDA0003801553830000013
表示第一样本节点u对应的语义增强支撑集,
Figure FDA0003801553830000014
表示第一样本节点u对应的语义增强查询集,
Figure FDA0003801553830000015
表示向第一样本节点u推荐的第二样本节点集合,
Figure FDA0003801553830000016
表示语义增强支撑集中第一样本节点u基于元路径集合
Figure FDA0003801553830000017
的语义上下文,
Figure FDA0003801553830000018
表示没有向第一样本节点u推荐过的第二样本节点集合,
Figure FDA0003801553830000019
表示语义增强查询集中第一样本节点u基于元路径集合
Figure FDA00038015538300000110
的语义上下文,所述语义增强支撑集和所述语义增强查询集中的第二样本节点集合是互斥的。
2.根据权利要求1所述的方法,其特征在于,所述基于各所述相似度,确定向所述第一节点推荐的目标第二节点,包括:
按照从大到小的顺序对各所述相似度进行排序,得到相似度序列;
将所述相似度序列中前预设数量个相似度对应的第二节点,作为各目标第二节点;
向所述第一节点推荐各所述目标第二节点。
3.根据权利要求1所述的方法,其特征在于,所述元学习模型的训练过程,包括:
构建初始元学习模型;
基于预先构建的样本节点对应的语义增强模型,得到第一样本节点对应的第一特征向量,以及第二样本节点对应的第一特征向量;
将所述第一样本节点对应的第一特征向量,所述第二样本节点对应的第一特征向量,以及是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签,输入所述初始元学习模型,通过聚合上下文语义得到所述第一样本节点对应的第二特征向量,以及所述第二样本节点对应的第二特征向量;
针对每一第一样本节点,计算该第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度;
基于所述第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度,以及所述是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签,计算损失函数;
对损失函数进行最小化处理,得到最小化损失函数;
根据最小化损失函数,更新所述初始元学习模型中各部分参数,训练得到所述元学习模型。
4.根据权利要求3所述的方法,其特征在于,所述损失函数的表达式为:
Figure FDA0003801553830000031
其中,
Figure FDA0003801553830000032
表示第一样本节点u的损失函数,
Figure FDA0003801553830000033
表示向第一样本节点u推荐第二样本节点i的第二样本节点集合,rui表示是否向第一样本节点u推荐第二样本节点i的真值标签,
Figure FDA0003801553830000034
表示向第一样本节点推荐第二样本节点的第二样本节点集合,
Figure FDA0003801553830000035
表示第一样本节点u对应的第二特征向量与第二样本节点i对应的第二特征向量之间的相似度。
5.根据权利要求1所述的方法,其特征在于,使用如下表达式计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度:
Figure FDA0003801553830000036
其中,
Figure FDA0003801553830000037
表示第一节点u对应的第二特征向量与第二节点i对应的第二特征向量之间的相似度,MLP表示一个两层的多层感知器,
Figure FDA0003801553830000038
表示拼接操作,xu表示第一节点u对应的第二特征向量,ei表示第二节点i对应的第二特征向量,hω表示相似度计算函数,ω表示先验参数。
6.一种基于元学习的异质信息网络冷启动推荐装置,其特征在于,所述装置包括:
第一获得模块,用于获取第一节点信息以及各第二节点信息,得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量;其中,所述第一节点信息为异质信息网络中已有的用于表示所述第一节点的特征的信息,所述第二节点信息为所述异质信息网络中已有的用于表示所述第二节点的特征的信息,所述第一节点为待接收推荐结果的节点,所述第二节点为候选推荐节点;所述第一节点为用户,所述第二节点为商品,所述第一节点信息包括:用户在异质信息网络中注册时的用户账号、用户密码、用户标识,所述第二节点信息包括:商品在异质信息网络中注册时的商品标识、商品名称、商品类型;
第二获得模块,用于将所述第一节点对应的第一特征向量和各所述第二节点各自对应的第一特征向量,分别输入预先训练好的元学习模型中,通过聚合上下文语义得到所述第一节点对应的第二特征向量和各所述第二节点各自对应的第二特征向量;其中,所述预先训练好的元学习模型是根据第一样本节点对应的第一特征向量,第二样本节点对应的第一特征向量,以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的,每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的,所述语义增强模型是根据所述样本节点在异质信息网络中的上下文语义构建的;所述第一样本节点为样本用户,所述第二样本节点为样本商品;
第一计算模块,用于计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度;
推荐模块,用于基于各所述相似度,确定向所述第一节点推荐的目标第二节点;
其中,预先构建的第一样本节点对应的语义增强模型表示为
Figure FDA0003801553830000041
其中,
Figure FDA0003801553830000042
Figure FDA0003801553830000043
表示第一样本节点u对应的语义增强支撑集,
Figure FDA0003801553830000044
表示第一样本节点u对应的语义增强查询集,
Figure FDA0003801553830000045
表示向第一样本节点u推荐的第二样本节点集合,
Figure FDA0003801553830000046
表示语义增强支撑集中第一样本节点u基于元路径集合
Figure FDA0003801553830000047
的语义上下文,
Figure FDA0003801553830000048
表示没有向第一样本节点u推荐过的第二样本节点集合,
Figure FDA0003801553830000049
表示语义增强查询集中第一样本节点u基于元路径集合
Figure FDA00038015538300000410
的语义上下文,所述语义增强支撑集和所述语义增强查询集中的第二样本节点集合是互斥的。
7.根据权利要求6所述的装置,其特征在于,所述推荐模块包括:
排序子模块,用于按照从大到小的顺序对各所述相似度进行排序,得到相似度序列;
确定子模块,用于将所述相似度序列中前预设数量个相似度对应的第二节点,作为各目标第二节点;
推荐子模块,用于向所述第一节点推荐各所述目标第二节点。
8.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
CN202010748668.XA 2020-07-30 2020-07-30 一种基于元学习的异质信息网络冷启动推荐方法及装置 Active CN111931045B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010748668.XA CN111931045B (zh) 2020-07-30 2020-07-30 一种基于元学习的异质信息网络冷启动推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010748668.XA CN111931045B (zh) 2020-07-30 2020-07-30 一种基于元学习的异质信息网络冷启动推荐方法及装置

Publications (2)

Publication Number Publication Date
CN111931045A CN111931045A (zh) 2020-11-13
CN111931045B true CN111931045B (zh) 2022-11-25

Family

ID=73315866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010748668.XA Active CN111931045B (zh) 2020-07-30 2020-07-30 一种基于元学习的异质信息网络冷启动推荐方法及装置

Country Status (1)

Country Link
CN (1) CN111931045B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417319B (zh) * 2020-11-24 2022-11-18 清华大学 基于难度采样元学习的地点推荐方法及装置
CN112507224B (zh) * 2020-12-11 2021-09-28 南京大学 基于异质网络表示学习的人机物融合系统服务推荐方法
CN112541806B (zh) * 2020-12-18 2024-08-09 北京航天云路有限公司 一种基于异质信息网络的推荐方法及装置
CN113343094A (zh) * 2021-06-21 2021-09-03 安徽农业大学 一种信息增强的缓解推荐用户冷启动问题的元学习方法
CN115047894B (zh) * 2022-04-14 2023-09-15 中国民用航空总局第二研究所 一种无人机轨迹测算方法、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017147157A1 (en) * 2016-02-23 2017-08-31 Linkedin Corporation Graph framework using heterogeneous social networks
CN107944629A (zh) * 2017-11-30 2018-04-20 北京邮电大学 一种基于异质信息网络表示的推荐方法及装置
WO2018131259A1 (ja) * 2017-01-11 2018-07-19 パナソニックIpマネジメント株式会社 文章評価装置、及び文章評価方法
CN108985830A (zh) * 2018-07-05 2018-12-11 北京邮电大学 基于异质信息网络的推荐评分方法、装置
CN109002488A (zh) * 2018-06-26 2018-12-14 北京邮电大学 一种基于元路径上下文的推荐模型训练方法及装置
CN110059262A (zh) * 2019-04-19 2019-07-26 武汉大学 一种基于混合神经网络的项目推荐模型的构建方法及装置、项目推荐方法
CN110570226A (zh) * 2019-07-10 2019-12-13 杭州电子科技大学 一种联合主题模型和异质信息网络的评分预测方法
CN111310045A (zh) * 2020-02-16 2020-06-19 重庆邮电大学 一种基于元路径的网络嵌入的电影推荐方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017147157A1 (en) * 2016-02-23 2017-08-31 Linkedin Corporation Graph framework using heterogeneous social networks
WO2018131259A1 (ja) * 2017-01-11 2018-07-19 パナソニックIpマネジメント株式会社 文章評価装置、及び文章評価方法
CN107944629A (zh) * 2017-11-30 2018-04-20 北京邮电大学 一种基于异质信息网络表示的推荐方法及装置
CN109002488A (zh) * 2018-06-26 2018-12-14 北京邮电大学 一种基于元路径上下文的推荐模型训练方法及装置
CN108985830A (zh) * 2018-07-05 2018-12-11 北京邮电大学 基于异质信息网络的推荐评分方法、装置
CN110059262A (zh) * 2019-04-19 2019-07-26 武汉大学 一种基于混合神经网络的项目推荐模型的构建方法及装置、项目推荐方法
CN110570226A (zh) * 2019-07-10 2019-12-13 杭州电子科技大学 一种联合主题模型和异质信息网络的评分预测方法
CN111310045A (zh) * 2020-02-16 2020-06-19 重庆邮电大学 一种基于元路径的网络嵌入的电影推荐方法

Also Published As

Publication number Publication date
CN111931045A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN111931045B (zh) 一种基于元学习的异质信息网络冷启动推荐方法及装置
Gao et al. A survey of graph neural networks for recommender systems: Challenges, methods, and directions
CN112182412B (zh) 用于推荐体检项目的方法、计算设备和计算机存储介质
CN109829116B (zh) 一种内容推荐方法、装置、服务器及计算机可读存储介质
US10366092B2 (en) Search relevance
WO2019190924A1 (en) Dynamic predictive similarity grouping based on vectorization of merchant data
EP2932400A2 (en) Action broker
CN107241914B (zh) 用于搜索查询重写的系统和方法
US20140279189A1 (en) Method and system for monitoring and recommending relevant products
CN107507041A (zh) 用户模型的构建方法和构建装置
CN116601626A (zh) 个人知识图谱构建方法、装置及相关设备
CN109726331A (zh) 对象偏好预测的方法、装置和计算机可读介质
CN112836126A (zh) 基于知识图谱的推荐方法、装置、电子设备及存储介质
CN112950321A (zh) 一种物品推荐方法和装置
US11461824B2 (en) Systems and methods of product recommendation and integrated language modelling
KR102466020B1 (ko) 인공지능 기반 명품 정보 및 셀러의 자동 매칭 방법, 장치 및 시스템
Zheng et al. Incorporating price into recommendation with graph convolutional networks
CN112287225B (zh) 一种对象推荐方法及装置
CN117573973A (zh) 资源推荐方法、装置、电子设备以及存储介质
KR102372432B1 (ko) 클릭 및 노출 정보를 활용한 추천 콘텐츠 제공 방법, 장치 및 시스템
US20230235495A1 (en) Usage dependent user prompting
JP6700146B2 (ja) 評価値に基づいて推奨するコンテンツを決定するシステム
JP2023170924A (ja) 情報処理方法、情報処理装置およびプログラム
Gupta et al. A novel recommendation system comprising WNMF with graph-based static and temporal similarity estimators
CN113297471A (zh) 生成数据对象标签、数据对象搜索方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant