CN111931045B

CN111931045B - 一种基于元学习的异质信息网络冷启动推荐方法及装置

Info

Publication number: CN111931045B
Application number: CN202010748668.XA
Authority: CN
Inventors: 石川; 陆元福
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2022-11-25
Anticipated expiration: 2040-07-30
Also published as: CN111931045A

Abstract

本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐方法及装置，其中方法包括：获取第一节点信息以及各第二节点信息，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量；将第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合上下文语义得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量；计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度；基于各相似度，确定向第一节点推荐的目标第二节点。本发明实施例，能够提高异质信息网络冷启动推荐结果的准确度。

Description

一种基于元学习的异质信息网络冷启动推荐方法及装置

技术领域

本发明涉及数据处理技术领域，特别是涉及一种基于元学习的异质信息网络冷启动推荐方法及装置。

背景技术

随着科技的发展，推荐系统已经在各种线上服务中得以广泛开发部署，例如电子商务平台和新闻平台等，推荐系统可以为用户解决信息过载的问题。作为推荐系统的核心，对信息的协同过滤旨在根据交互历史记录来估算节点信息之间交互的可能性，例如，根据用户过去的购买和点击等历史操作记录来估算用户购买某一商品的可能性。但实际中，新用户或新商品的交互数据往往是非常稀疏的，导致冷启动场景的出现。

异质信息网络可以定义为一个包含多种类型节点和边的图，节点集合表示为V，边集合表示为E，异质信息网络的图表示可以为G＝(V,E,O,R)，其中，边表示节点与节点之间的关系，在图G中，每个节点关联一个类型映射函数

每个边关联一个类型映射函数

表示节点类型集合，R表示边类型集合，当|O|+|R|>2时，图G为异质信息网络。如图1所示，图1为以电影推荐系统构建的一个异质信息网络，在该异质信息网络中包含用户、电影、演员以及导演四种类型的节点，以及各节点之间的边。

以节点类型分别为用户和商品为例，在给定异质信息网G＝(V,E,O,R)中，V_U，V_I∈V分别定义为用户集合和商品集合。给定用户和商品间的评分集合

r_u,i表示用户u对商品i的评分，<u,i>表示用户u和商品i之间的关系，如果用户u是一个仅有少量评分的新用户，即

是很小的，则称为用户冷启动，u′表示一个新用户。相似的，如果商品i是一个新商品，即为商品冷启动；如果用户u和商品i都是新加入的，那么即为用户商品冷启动。

现有为解决异质信息网络冷启动问题，在异质信息网络中进行冷启动推荐的方法为：融合额外信息以增加不同节点的表示信息，该额外信息为异质信息网络中每一节点对应的除已有信息之外的信息，使用融合额外信息后的节点表示信息完成冷启动推荐，节点表示信息可以使用向量表示。以节点类型分别为用户和商品为例，可以将用户或者商品相关的内容作为额外信息，例如，用户的额外信息可以包括：用户自身的年龄、性别，以及该用户是否购买过商品，或已购买商品的信息等；商品的额外信息可以包括：商品自身的属性信息，以及购买过该商品的用户信息等。具体的冷启动推荐方法可以为：获取不同节点的额外信息，并得到融合额外信息后的每一节点的表示信息，然后，针对第一节点，计算该第一节点的表示信息与第二节点的表示信息之间的相似度，向第一节点推荐相似度大于设定阈值的第二节点。其中，第一节点为待推荐节点，第二节点为推荐节点。

然而，实际应用中，考虑到信息的安全性，获取不同节点的额外信息比较困难，且获取的额外信息准确度不能保证，使得异质信息网络冷启动推荐结果不准确。

发明内容

本发明实施例的目的在于提供一种基于元学习的异质信息网络冷启动推荐方法及装置，以提高异质信息网络冷启动推荐结果的准确度。具体技术方案如下：

第一方面，本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐方法，所述方法包括：

获取第一节点信息以及各第二节点信息，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量；其中，所述第一节点信息为异质信息网络中已有的用于表示所述第一节点特征的信息，所述第二节点信息为所述异质信息网络中已有的用于表示所述第二节点特征的信息，所述第一节点为待接收推荐结果的节点，所述第二节点为候选推荐结果；

将所述第一节点对应的第一特征向量和各所述第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合上下文语义得到所述第一节点对应的第二特征向量和各所述第二节点各自对应的第二特征向量；其中，所述预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，所述语义增强模型是根据所述样本节点在异质信息网络中的上下文语义构建的；

计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度；

基于各所述相似度，确定向所述第一节点推荐的目标第二节点。

可选地，所述基于各所述相似度，确定向所述第一节点推荐的目标第二节点，包括：

按照从大到小的顺序对各所述相似度进行排序，得到相似度序列；

将所述相似度序列中前预设数量个相似度对应的第二节点，作为各目标第二节点；

向所述第一节点推荐各所述目标第二节点。

可选地，所述元学习模型的训练过程，包括：

构建初始元学习模型；

基于预先构建的样本节点对应的语义增强模型，得到第一样本节点对应的第一特征向量，以及第二样本节点对应的第一特征向量；

将所述第一样本节点对应的第一特征向量，所述第二样本节点对应的第一特征向量，以及是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签，输入所述初始元学习模型，通过聚合上下文语义得到所述第一样本节点对应的第二特征向量，以及所述第二样本节点对应的第二特征向量；

针对每一第一样本节点，计算该第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度；

基于所述第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度，以及所述是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签，计算损失函数；

对损失函数进行最小化处理，得到最小化损失函数；

根据最小化损失函数，更新所述初始元学习模型中各部分参数，训练得到所述元学习模型。

可选地，所述损失函数的表达式为：

其中，

表示第一样本节点u的损失函数，

表示向第一样本节点u推荐第二样本节点i的第二样本节点集合，r_ui表示是否向第一样本节点u推荐第二样本节点i的真值标签，

表示向第一样本节点推荐第二样本节点的第二样本节点集合，

表示第一样本节点u对应的第二特征向量与第二样本节点i对应的第二特征向量之间的相似度。

可选地，预先构建的第一样本节点对应的语义增强模型表示为

其中，

表示第一样本节点u对应的语义增强支撑集，

表示第一样本节点u对应的语义增强查询集，

表示向第一样本节点u推荐的第二样本节点集合，

表示第一样本节点u基于元路径集合

的语义上下文，

表示没有向第一样本节点u推荐过的第二样本节点集合，

表示第一样本节点u基于元路径集合

的语义上下文，所述语义增强支撑集和所述语义增强查询集中的第二样本节点集合是互斥的。

可选地，使用如下表达式计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度：

其中，

表示第一节点u对应的第二特征向量与第二节点i对应的第二特征向量之间的相似度，MLP表示一个两层的多层感知器，

表示拼接操作，x_u表示第一节点u对应的第二特征向量，e_i表示第二节点i对应的第二特征向量，h_ω表示相似度计算函数，ω表示先验参数。

第二方面，本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐装置，所述装置包括：

第一获得模块，用于获取第一节点信息以及各第二节点信息，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量；其中，所述第一节点信息为异质信息网络中已有的用于表示所述第一节点特征的信息，所述第二节点信息为所述异质信息网络中已有的用于表示所述第二节点特征的信息，所述第一节点为待接收推荐结果的节点，所述第二节点为候选推荐结果；

第二获得模块，用于将所述第一节点对应的第一特征向量和各所述第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合上下文语义得到所述第一节点对应的第二特征向量和各所述第二节点各自对应的第二特征向量；其中，所述预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，所述语义增强模型是根据所述样本节点在异质信息网络中的上下文语义构建的；

第一计算模块，用于计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度；

推荐模块，用于基于各所述相似度，确定向所述第一节点推荐的目标第二节点。

可选地，所述推荐模块包括：

排序子模块，用于按照从大到小的顺序对各所述相似度进行排序，得到相似度序列；

确定子模块，用于将所述相似度序列中前预设数量个相似度对应的第二节点，作为各目标第二节点；

推荐子模块，用于向所述第一节点推荐各所述目标第二节点。

可选地，所述装置还包括：

构建模块，用于构建初始元学习模型；

第三获得模块，用于基于预先构建的样本节点对应的语义增强模型，得到第一样本节点对应的第一特征向量，以及第二样本节点对应的第一特征向量；

第四获得模块，用于将所述第一样本节点对应的第一特征向量，所述第二样本节点对应的第一特征向量，以及是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签，输入所述初始元学习模型，通过聚合上下文语义得到所述第一样本节点对应的第二特征向量，以及所述第二样本节点对应的第二特征向量；

第二计算模块，用于针对每一第一样本节点，计算该第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度；

第三计算模块，用于基于所述第一样本节点对应的第二特征向量与所述第二样本节点对应的第二特征向量之间的相似度，以及所述是否向所述第一样本节点推荐所述第二样本节点所对应的真值标签，计算损失函数；

第五获得模块，用于对损失函数进行最小化处理，得到最小化损失函数；

训练模块，用于根据最小化损失函数，更新所述初始元学习模型中各部分参数，训练得到所述元学习模型。

可选地，所述损失函数的表达式为：

其中，

表示第一样本节点u的损失函数，

其中，

表示第一样本节点u对应的语义增强支撑集，

表示第一样本节点u对应的语义增强查询集，

表示向第一样本节点u推荐的第二样本节点集合，

表示第一样本节点u基于元路径集合

的语义上下文，

表示没有向第一样本节点u推荐过的第二样本节点集合，

表示第一样本节点u基于元路径集合

其中，

第三方面，本发明实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述第一方面所述的一种基于元学习的异质信息网络冷启动推荐方法的步骤。

第四方面，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面所述的一种基于元学习的异质信息网络冷启动推荐方法的步骤。

本发明实施例有益效果：

本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法及装置，由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义，进而提高元学习模型训练的准确度，且不需要获取节点的额外信息，能够提高异质信息网络冷启动推荐结果的准确度。

当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的实施例。

图1为一种以电影推荐系统构建的异质信息网络示意图；

图2为本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法的流程示意图；

图3为本发明实施例提供的一种确定推荐结果的实施方式流程图；

图4为本发明实施例提供的一种元学习模型训练实施方式流程图；

图5为本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐装置的结构示意图；

图6为本发明实施例提供的一种确定推荐结果装置的结构示意图；

图7为本发明实施例提供的一种元学习模型训练装置的结构示意图；

图8为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了解决现有使用融合额外信息增加节点表示信息的方式对异质信息网络进行冷启动的方法中，获取不同节点额外信息比较困难，且获取的额外信息准确度不能保证，使得异质信息网络冷启动推荐结果不准确的问题，本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐方法，该方法包括：

获取第一节点信息以及各第二节点信息，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量；其中，第一节点信息为异质信息网络中已有的用于表示第一节点特征的信息，第二节点信息为异质信息网络中已有的用于表示第二节点特征的信息，第一节点为待接收推荐结果的节点，第二节点为候选推荐结果；

将第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合上下文语义得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量；其中，预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，语义增强模型是根据样本节点在异质信息网络中的上下文语义构建的；

计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度；

基于各相似度，确定向第一节点推荐的目标第二节点。

本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法，由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义，进而提高元学习模型训练的准确度，且不需要获取节点的额外信息，能够提高异质信息网络冷启动推荐结果的准确度。

下面进行具体说明，如图2所示，图2为本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐方法流程示意图，该方法可以包括：

S101，获取第一节点信息以及各第二节点信息，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量。

本发明实施例以异质信息网络冷启动时如何向一个第一节点确定推荐的至少一个第二节点为例进行说明，实际应用中第一节点的数量可以有多个，向每个第一节点确定推荐的至少一个第二节点的实施过程均可参照本发明实施例的推荐过程。

在异质信息网络冷启动时，可以获取异质信息网络中第一节点信息以及各第二节点信息，其中，第一节点信息可以为异质信息网络中已有的用于表示第一节点特征的信息，第二节点信息可以为异质信息网络中已有的用于表示第二节点特征的信息，第一节点与第二节点的类型可以不同，第一节点为待接收推荐结果的节点，第二节点为候选推荐结果。

示例性的，以异质信息网络中节点类型分别为用户和商品为例，第一节点可以为用户，第二节点可以为商品，第一节点信息可以是用户在异质信息网络中注册时的用户账号、用户密码、用户标识等基本信息，第二节点信息可以是商品在异质信息网络中注册时的商品标识、商品名称、商品类型等基本信息，在异质信息网络冷启动时，可以向作为第一节点的用户推荐作为商品的第二节点。

在获取异质信息网络中第一节点信息以及各第二节点信息之后，可以使用Embedding初始化查表的方式，对所获取的第一节点信息以及各第二节点信息进行格式转换，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量。示例性的，第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量可以使用数字等表示。

S102，将第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合上下文语义得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量。

将得到的第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合异质信息网络中分别与第一节点和各第二节点相关的上下文语义，得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量。

其中，预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，语义增强模型是根据样本节点在异质信息网络中的上下文语义构建的。

示例性的，是否向第一样本节点推荐第二样本节点所对应的真值标签可以使用1或0表示，例如，向第一样本节点推荐第二样本节点，可以使用标签1表示，没有向第一样本节点推荐第二样本节点，可以使用标签0表示。

S103，计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度。

在得到聚合上下文语义的第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量后，计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度。具体的，可以使用如下表达式计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度：

其中，

S104，基于各相似度，确定向第一节点推荐的目标第二节点。

在计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度后，可以根据计算得到的相似度，确定向第一节点推荐的目标第二节点。示例性的，可以设定一个阈值，当相似度大于该设定的阈值时，将相似度大于阈值对应的第二节点确定为目标第二节点，然后，向第一节点推荐目标第二节点。具体阈值的取值，本领域技术人员可根据实际需求进行设定。

作为本发明实施例一种可选的实施方式，如图3所示，针对上述步骤S104，本发明实施例提供的一种确定推荐结果的实施方式，该实施方式可以包括：

S1041，按照从大到小的顺序对各相似度进行排序，得到相似度序列。

S1042，将相似度序列中前预设数量个相似度对应的第二节点，作为各目标第二节点。

S1043，向第一节点推荐各目标第二节点。

将计算得到的第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度，按照从大到小的顺序进行排序，得到相似度序列。进而，将相似度序列中前预设数量个相似度对应的第二节点，确定为目标第二节点，向第一节点推荐各目标第二节点。具体预设数量的个数，本领域技术人员可根据实际需求进行设定。

本发明实施例中，可以将与第一节点对应的第二特征向量相似度比较大对应的预设数量个第二节点确定为目标第二节点，进而向第一节点推荐各目标第二节点，以提高异质信息网络冷启动推荐结果的准确度。

作为本发明实施例一种可选的实施方式，如图4所示，元学习模型的训练过程，可以包括：

S201，构建初始元学习模型。

作为本发明实施例一种可选的实施方式，所构建的初始元学习模型可以包括上下文语义聚合模块，相似度预测模块。上下文语义聚合模块可以对输入模型的各样本节点对应的第一特征向量聚合上下文语义，得到各样本节点对应的第二特征向量；相似度预测模块可以对第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度进行预测。

S202，基于预先构建的样本节点对应的语义增强模型，得到第一样本节点对应的第一特征向量，以及第二样本节点对应的第一特征向量。

本发明实施例中，可以预先构建样本节点对应的语义增强模型，该语义增强模型是根据样本节点在异质信息网络中的上下文语义构建的，不同类型的样本节点对应的语义增强模型架构相同，构建过程一致。

以第一样本节点对应的语义增强模型为例进行说明，预先构建的第一样本节点对应的语义增强模型可以表示为

其中，

表示第一样本节点u对应的语义增强支撑集，

表示第一样本节点u对应的语义增强查询集，

表示向第一样本节点u推荐的第二样本节点集合，

表示第一样本节点u基于元路径集合

的语义上下文，

表示没有向第一样本节点u推荐过的第二样本节点集合，

表示第一样本节点u基于元路径集合

的语义上下文，语义增强支撑集和语义增强查询集中的第二样本节点集合是互斥的。

其中，元路径是定义在异质信息网络中连接两类节点的一条路径。例如，给定异质信息网络G，长为l的元路径可以定义为一条复合关系，表示为：

其中，P表示元路径的复合关系，o_l表示第l个节点类型，r_l表示第l个边类型，o_l∈O且r_l∈R。如果两个节点间只有一种类型关系，可以将上述复合关系简写为P＝o₁o₂…o_l+1。

示例性的，以第一样本节点为用户，第二样本节点为商品为例，对语义增强支撑集

的构建进行如下介绍：

对于冷启动场景下的新用户，用户u评分过(或向用户推荐过)的商品集合

通常是很小的，即一个新用户往往发表很少的评分评论。对于元训练的任务，通过采样用户u评分过的少量商品作为支撑集

以此模拟新用户。

给定元路径集合

其中每条长为l的路径

由用户-商品类型节点开始，并以商品类型节点结束。例如，在图1所示异质信息网络中，路径长度l＝3，则元路径集合为

其中，U表示用户，M表示电影，A表示演员，D表示导演。对于每个用户-商品交互<u,i>，定义元路径p限定下的语义上下文如下：

其中，

表示用户u与商品i在元路径p限定下的语义上下文，j表示基于用户u与商品i的交互信息u-i，沿元路径p可达的商品j。

示例性的，限定于元路径UMAM，用户2表示为u₂与电影2表示为m₂交互<u₂,m₂>的语义上下文可以为{m₂,m₃,…}。m₃表示电影3，由于在每个样本节点对应的语义增强模型中用户u可能会和多个商品交互，故定义语义增强模型

在元路径p限定下的语义上下文表示为：

然后，统计元路径集合

中的所有路径，语义增强模型

的语义上下文

可以定义为：

其中，

表示用户u基于元路径p₁的语义上下文。本质上，

是商品的集合，集合中是用户u通过所有其评分过的商品并沿着元路径可达的商品，融合了多方面的语义上下文信息。如图1所示，沿着元路径UMAM，用户u₂的可达商品为：{m₂,m₃}，表示了用户u₂曾经评分过的同一演员出演的电影。也就是说，由元路径UMAM限定的语义上下文融合了同一演员出演的信息作为用户的偏好学习。

语义增强查询集

的构建与语义增强支撑集

的构建过程类似，本发明实施例在此不再赘述，

包含用户u没有评分过的商品，在语义增强模型中语义增强支撑集和语义增强查询集中的第二样本节点集合是互斥的。

示例性的，构建的样本节点对应的语义增强模型中各样本节点对应的信息可以使用矩阵或列表的形式表示，然后，可以选取不同的样本节点，一并提取该样本节点相关的信息，进而使用Embedding初始化查表的方式，对提取的样本节点信息进行格式转换，得到第一样本节点对应的第一特征向量，以及第二样本节点对应的第一特征向量。

参见图4，S203，将第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签，输入初始元学习模型，通过聚合上下文语义得到第一样本节点对应的第二特征向量，以及第二样本节点对应的第二特征向量。

示例性的，得到的第一样本节点对应的第二特征向量可以表示为：

x_u＝g_φ(u,C_u)＝σ(MEAN({We_j+b:j∈C_u}))

其中，x_u表示第一样本节点u对应的第二特征向量，g_φ表示上下文语义聚合函数，C_u表示第一样本节点u通过直接交互或元路径关联的第二样本节点集合，MEAN表示均值池化操作，σ为激活函数，例如可以是LeaklyReLU函数，e_j表示第二样本节点j对应的第二特征向量，W表示元学习模型的待学习参数矩阵，b表示元学习模型的待学习参数向量。

S204，针对每一第一样本节点，计算该第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度。

具体计算第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度，可参见上文计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度的过程。

S205，基于第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度，以及是否向第一样本节点推荐第二样本节点所对应的真值标签，计算损失函数。

作为本发明实施例一种可选的实施方式，损失函数的表达式可以为：

其中，

表示第一样本节点u的损失函数，

S206，对损失函数进行最小化处理，得到最小化损失函数。

示例性的，对损失函数进行最小化处理的实施过程可以如下：

给定元路径

第一样本节点u的在语义空间P内的可以表示为：

其中，

表示第一样本节点u在元路径p下对应的第二特征向量，

表示第一样本节点u在元路径p下的语义上下文。

在p语义空间内，进一步计算语义增强支撑集上的损失函数表示为：

其中，

表示第一样本节点u对应语义增强模型

的损失函数，ω表示先验参数，

表示向第一样本节点u推荐的第二样本节点集合，r_ui表示是否向第一样本节点u推荐第二样本节点i的真值标签，

表示在元路径p限定下的语义空间内第一样本节点u对应的第二特征向量，与第二样本节点i对应的第二特征向量之间的相似度。

然后，对于语义增强模型

在p限定的语义空间中，经过一次梯度下降，得到语义先验

可以表示为：

其中，

表示第一样本节点u在p语义空间内的语义先验，φ表示元学习模型参数集合，α表示语义级学习率。

语义先验

进一步可以更新第一样本节点u在p语义空间内的表示向量，得到

其中，

表示第一样本节点u在语义增强支撑集上的向量表示，S表示语义增强支撑集，

表示基于语义先验

的上下文语义聚合函数。

然后，将先验参数ω转换到p语义空间，得到：

其中，ω^p表示p语义空间内的先验参数，⊙表示矩阵逐元素乘法，κ(·)表示转换函数，可以由一个全连接层实现。

再经过一次梯度下降，得到：

其中，

表示第一样本节点u在p语义空间内的先验参数，β表示任务级学习率。

进一步，将在p语义空间内得到的

和

确定为：

表示全局先验，通过反向传播的方式对损失函数进行最小化处理，最小化损失函数表示为：

其中，

表示所有训练样本节点对应的语义增强模型集合，ω_u和x_u分别可以表示为：

其中，ω_u表示第一样本节点u的先验参数，

表示在p语义空间内的权重，x_u表示第一样本节点u的第二特征向量，

表示第一样本节点u在语义增强查询集上的向量表示。

优化全局先验θ，使得利用优化后的参数

的每个元训练语义增强模型，在语义增强查询集上的损失是最小化的。

参见图4，S207，根据最小化损失函数，更新初始元学习模型中各部分参数，训练得到元学习模型。

相应于上述方法实施例，本发明实施例提供了一种基于元学习的异质信息网络冷启动推荐装置，如图5所示，该装置可以包括：

第一获得模块301，用于获取第一节点信息以及各第二节点信息，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量；其中，第一节点信息为异质信息网络中已有的用于表示第一节点特征的信息，第二节点信息为异质信息网络中已有的用于表示第二节点特征的信息，第一节点为待接收推荐结果的节点，第二节点为候选推荐结果。

第二获得模块302，用于将第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合上下文语义得到第一节点对应的第二特征向量和各第二节点各自对应的第二特征向量；其中，预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，语义增强模型是根据样本节点在异质信息网络中的上下文语义构建的。

第一计算模块303，用于计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度。

推荐模块304，用于基于各相似度，确定向第一节点推荐的目标第二节点。

本发明实施例提供的一种基于元学习的异质信息网络冷启动推荐装置，由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义，进而提高元学习模型训练的准确度，且不需要获取节点的额外信息，能够提高异质信息网络冷启动推荐结果的准确度。

需要说明的是，本发明实施例的装置是与图2所示的一种基于元学习的异质信息网络冷启动推荐方法对应的装置，图2所示的一种基于元学习的异质信息网络冷启动推荐方法的所有实施例均适用于该装置，且均能达到相同的有益效果。

可选地，如图6所示，上述推荐模块304，可以包括：

排序子模块3041，用于按照从大到小的顺序对各相似度进行排序，得到相似度序列。

确定子模块3042，用于将相似度序列中前预设数量个相似度对应的第二节点，作为各目标第二节点。

推荐子模块3043，用于向第一节点推荐各目标第二节点。

可选地，如图7所示，上述装置还可以包括：

构建模块401，用于构建初始元学习模型。

第三获得模块402，用于基于预先构建的样本节点对应的语义增强模型，得到第一样本节点对应的第一特征向量，以及第二样本节点对应的第一特征向量。

第四获得模块403，用于将第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签，输入初始元学习模型，通过聚合上下文语义得到第一样本节点对应的第二特征向量，以及第二样本节点对应的第二特征向量。

第二计算模块404，用于针对每一第一样本节点，计算该第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度。

第三计算模块405，用于基于第一样本节点对应的第二特征向量与第二样本节点对应的第二特征向量之间的相似度，以及是否向第一样本节点推荐第二样本节点所对应的真值标签，计算损失函数。

第五获得模块406，用于对损失函数进行最小化处理，得到最小化损失函数。

训练模块407，用于根据最小化损失函数，更新初始元学习模型中各部分参数，训练得到元学习模型。

可选地，上述损失函数的表达式可以为：

其中，

表示第一样本节点u的损失函数，

可选地，预先构建的第一样本节点对应的语义增强模型可以表示为

其中，

表示第一样本节点u对应的语义增强支撑集，

表示第一样本节点u对应的语义增强查询集，

表示向第一样本节点u推荐的第二样本节点集合，

表示第一样本节点u基于元路径集合

的语义上下文，

表示没有向第一样本节点u推荐过的第二样本节点集合，

表示第一样本节点u基于元路径集合

可选地，可以使用如下表达式计算第一节点对应的第二特征向量与各第二节点各自对应的第二特征向量之间的相似度：

其中，

本发明实施例还提供了一种电子设备，如图8所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信，存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现本发明实施例所提供的一种基于元学习的异质信息网络冷启动推荐方法的步骤。

本发明实施例提供的一种电子设备，由于语义增强模型是根据各样本节点在异质信息网络中的上下文语义构建的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，而预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，使得元学习模型在训练的过程中能够参考异质信息网络中各节点多方面的上下文语义，进而提高元学习模型训练的准确度，且不需要获取节点的额外信息，能够提高异质信息网络冷启动推荐结果的准确度。

上述电子设备提到的通信总线可以是PCI(Peripheral ComponentInterconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括RAM(Random Access Memory，随机存取存储器)，也可以包括NVM(Non-Volatile Memory，非易失性存储器)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括CPU(Central Processing Unit，中央处理器)、NP(Network Processor，网络处理器)等；还可以是DSP(Digital Signal Processing，数字信号处理器)、ASIC(Application Specific Integrated Circuit，专用集成电路)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一一种基于元学习的异质信息网络冷启动推荐方法的步骤，以达到相同的有益效果。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一一种基于元学习的异质信息网络冷启动推荐方法的步骤，以达到相同的有益效果。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、DSL(Digital Subscriber Line，数字用户线))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD(Digital Versatile Disc，数字多功能光盘))、或者半导体介质(例如SSD(Solid StateDisk，固态硬盘))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置/电子设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于元学习的异质信息网络冷启动推荐方法，其特征在于，所述方法包括：

获取第一节点信息以及各第二节点信息，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量；其中，所述第一节点信息为异质信息网络中已有的用于表示所述第一节点的特征的信息，所述第二节点信息为所述异质信息网络中已有的用于表示所述第二节点的特征的信息，所述第一节点为待接收推荐结果的节点，所述第二节点为候选推荐节点；所述第一节点为用户，所述第二节点为商品，所述第一节点信息包括：用户在异质信息网络中注册时的用户账号、用户密码、用户标识，所述第二节点信息包括：商品在异质信息网络中注册时的商品标识、商品名称、商品类型；

将所述第一节点对应的第一特征向量和各所述第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合上下文语义得到所述第一节点对应的第二特征向量和各所述第二节点各自对应的第二特征向量；其中，所述预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，所述语义增强模型是根据所述样本节点在异质信息网络中的上下文语义构建的；所述第一样本节点为样本用户，所述第二样本节点为样本商品；

基于各所述相似度，确定向所述第一节点推荐的目标第二节点；

其中，预先构建的第一样本节点对应的语义增强模型表示为

其中，

表示第一样本节点u对应的语义增强支撑集，

表示第一样本节点u对应的语义增强查询集，

表示向第一样本节点u推荐的第二样本节点集合，

表示语义增强支撑集中第一样本节点u基于元路径集合

的语义上下文，

表示没有向第一样本节点u推荐过的第二样本节点集合，

表示语义增强查询集中第一样本节点u基于元路径集合

2.根据权利要求1所述的方法，其特征在于，所述基于各所述相似度，确定向所述第一节点推荐的目标第二节点，包括：

向所述第一节点推荐各所述目标第二节点。

3.根据权利要求1所述的方法，其特征在于，所述元学习模型的训练过程，包括：

构建初始元学习模型；

对损失函数进行最小化处理，得到最小化损失函数；

4.根据权利要求3所述的方法，其特征在于，所述损失函数的表达式为：

其中，

表示第一样本节点u的损失函数，

5.根据权利要求1所述的方法，其特征在于，使用如下表达式计算所述第一节点对应的第二特征向量与各所述第二节点各自对应的第二特征向量之间的相似度：

其中，

6.一种基于元学习的异质信息网络冷启动推荐装置，其特征在于，所述装置包括：

第一获得模块，用于获取第一节点信息以及各第二节点信息，得到第一节点对应的第一特征向量和各第二节点各自对应的第一特征向量；其中，所述第一节点信息为异质信息网络中已有的用于表示所述第一节点的特征的信息，所述第二节点信息为所述异质信息网络中已有的用于表示所述第二节点的特征的信息，所述第一节点为待接收推荐结果的节点，所述第二节点为候选推荐节点；所述第一节点为用户，所述第二节点为商品，所述第一节点信息包括：用户在异质信息网络中注册时的用户账号、用户密码、用户标识，所述第二节点信息包括：商品在异质信息网络中注册时的商品标识、商品名称、商品类型；

第二获得模块，用于将所述第一节点对应的第一特征向量和各所述第二节点各自对应的第一特征向量，分别输入预先训练好的元学习模型中，通过聚合上下文语义得到所述第一节点对应的第二特征向量和各所述第二节点各自对应的第二特征向量；其中，所述预先训练好的元学习模型是根据第一样本节点对应的第一特征向量，第二样本节点对应的第一特征向量，以及是否向第一样本节点推荐第二样本节点所对应的真值标签训练得到的，每一样本节点对应的第一特征向量是基于预先构建的该样本节点对应的语义增强模型得到的，所述语义增强模型是根据所述样本节点在异质信息网络中的上下文语义构建的；所述第一样本节点为样本用户，所述第二样本节点为样本商品；

推荐模块，用于基于各所述相似度，确定向所述第一节点推荐的目标第二节点；

其中，预先构建的第一样本节点对应的语义增强模型表示为