CN111815396B - 基于元图的产品筛选方法、系统、设备及存储介质 - Google Patents

基于元图的产品筛选方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN111815396B
CN111815396B CN202010501385.5A CN202010501385A CN111815396B CN 111815396 B CN111815396 B CN 111815396B CN 202010501385 A CN202010501385 A CN 202010501385A CN 111815396 B CN111815396 B CN 111815396B
Authority
CN
China
Prior art keywords
metagraph
product
heterogeneous network
graph
product screening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010501385.5A
Other languages
English (en)
Other versions
CN111815396A (zh
Inventor
李勇
韩振宇
徐丰力
金德鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202010501385.5A priority Critical patent/CN111815396B/zh
Publication of CN111815396A publication Critical patent/CN111815396A/zh
Application granted granted Critical
Publication of CN111815396B publication Critical patent/CN111815396B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例涉及产品智能化推荐技术领域,公开了基于元图的产品筛选方法、系统、设备及存储介质。本发明实施例先获取异构网络信息;将异构网络信息输入至预设产品筛选模型,输出产品分值;基于产品分值确定待推荐产品对应的产品信息;其中,预设产品筛选模型用于通过元图处理异构网络信息。明显地,本发明实施例将应用异构网络信息来筛选待推荐产品,而非仅局限于用户与产品二者之间的交互,同时,还使用了元图过滤异构网络信息以辅助推荐行为,从而提升了推荐准确性,解决了推荐准确性较低的技术问题。此外,还可使用遗传算法框架,并同时结合预测操作与测试操作,以自动寻找更有利于产品推荐的元图。

Description

基于元图的产品筛选方法、系统、设备及存储介质
技术领域
本发明涉及商品智能化推荐技术领域,尤其涉及基于元图的产品筛选方法、系统、设备及存储介质。
背景技术
就推荐系统而言,推荐系统(Recommender Systems)作为一类信息过滤算法,旨在从海量物品中针对不同用户的特点或偏好推荐该用户感兴趣的物品,以节省用户的时间与精力快速寻找到所需要的内容。
推荐系统常应用于电商平台中,电商平台基于用户的历史购买与交互记录向用户推荐可能感兴趣的新产品,以促进用户消费。
常见的推荐系统将基于协同过滤(Collaborative Filtering)技术,但局限于用户与产品二者之间的交互,而不能有效利用更多辅助信息实现更精确的推荐。
可见,目前的推荐系统无法达到较高的推荐准确性。
发明内容
为了解决当前推荐系统推荐准确性较低的技术问题,本发明实施例提供基于元图的产品筛选方法、系统、设备及存储介质。
第一方面,本发明实施例提供一种基于元图的产品筛选方法,包括:
获取与当前用户对应的异构网络信息;
将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;
基于所述产品分值确定待推荐产品对应的产品信息;
其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。
第二方面,本发明实施例提供一种基于元图的产品筛选系统,包括:
信息获取模块,用于获取与当前用户对应的异构网络信息;
模型运行模块,用于将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;
产品推荐模块,用于基于所述产品分值确定待推荐产品对应的产品信息;
其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明第一方面提供的一种基于元图的产品筛选方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明第一方面提供的一种基于元图的产品筛选方法的步骤。
本发明实施例提供的基于元图的产品筛选方法、系统、设备及存储介质,先获取与当前用户对应的异构网络信息;将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;基于所述产品分值确定待推荐产品对应的产品信息;其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。明显地,本发明实施例将应用异构网络信息来筛选待推荐产品,而非仅局限于用户与产品二者之间的交互,同时,还使用了元图过滤异构网络信息以辅助推荐行为,从而提升了推荐准确性,解决了当前推荐系统推荐准确性较低的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于元图的产品筛选方法的流程图;
图2为本发明又一实施例提供的一种基于元图的产品筛选方法的流程图;
图3为本发明再一实施例提供的一种基于元图的产品筛选方法的流程图;
图4为本发明再一实施例提供的一类非法变异示例;
图5为本发明再一实施例提供的又一类非法变异示例;
图6为本发明再一实施例提供的再一类非法变异示例;
图7为本发明再一实施例提供的平均性能与时间之间的关系示例;
图8为本发明再一实施例提供的元图预测器在训练集上的表现示例;
图9为本发明再一实施例提供的元图预测器在测试集上的表现示例;
图10为本发明实施例提供的一种基于元图的产品筛选系统的结构示意图;
图11为本发明实施例提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种基于元图的产品筛选方法的流程图,如图1所示,该方法包括:
S1,获取与当前用户对应的异构网络信息。
可以理解的是,鉴于常见的推荐系统所使用到的输入数据仅局限于用户与产品二者之间的交互,而不能有效利用更多辅助信息实现更精确的推荐,从而导致了推荐准确性较低。
为了应对推荐准确性较低的技术问题,本实施例将使用推荐场景中更加复杂的关联信息,即与当前用户对应的异构网络信息,而非仅局限于用户与产品二者之间的交互。
其中,异构网络信息为异构信息网络(Heterogeneous Information Network)中的信息,异构信息网络常用于建模包含多种实体与多种关系的网络结构,异构信息网络还可以更好地刻画用户与用户、用户与产品、产品与产品乃至更复杂的结构性特征,更符合现实世界的客观规律。因此,适宜应用至推荐场景中。
其中,异构网络信息包括有当前用户的相关信息,比如,用户评论、用户职业等,此处对于异构网络信息的举例仅作解释之用,并不限定于此。
S2,将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值。
S3,基于所述产品分值确定待推荐产品对应的产品信息。
其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。
应当理解的是,为了减少过于复杂的结构即异构信息网络中带来的冗余信息,可使用元图(Meta-graph)过滤异构信息网络中的信息以辅助推荐。
其中,元图实质上是一类消息传递模板,是规定了从起始节点到终端节点的结构性特征,这一结构性特征可以异构图的形式表示,刻画了局部的语义信息。
比如,预设产品筛选模型中将包含有元图,通过特定元图可将异构网络信息以元图描述的节点模板进行重新编排,基于该节点模板对应的节点实例运行预设产品筛选模型即可输出各个产品的产品分值,从而达成了为当前用户推荐该待推荐产品的行为。
可见,元图可将复杂的异构网络简单化,以方便处理。
其中,用户职业、地点等属性信息在异构图网络中也将直接作为节点来使用。
具体而言,可设定一个分值范围,将产品分值落入该分值范围内的产品认定为待推荐产品,并将待推荐产品的产品信息推送给当前用户或者在显示界面进行显示,以完成产品的推荐行为。
其中,异构网络样本作为模型输入量为异构网络信息的样本数据。而且,在预设产品筛选模型的训练过程中,可不断利用遗传算法筛选出更好的元图。
此外,异构信息网络在训练过程与实际使用的时候是完全一致的。模型训练过程中可采用部分用户的购买记录进行训练,即用户-商品对。
更进一步地,该元图还可为元路径(Meta-path),元路径为元图的一种特例,其结构呈现为链状。
本发明实施例提供的基于元图的产品筛选方法,先获取与当前用户对应的异构网络信息;将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;基于所述产品分值确定待推荐产品对应的产品信息;其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。明显地,本发明实施例将应用异构网络信息来筛选待推荐产品,而非仅局限于用户与产品二者之间的交互,同时,还使用了元图过滤异构网络信息以辅助推荐行为,从而提升了推荐准确性,解决了当前推荐系统推荐准确性较低的技术问题。
图2为本发明又一实施例提供的一种基于元图的产品筛选方法的流程图,本发明又一实施例基于上述图1所示的实施例。
本实施例中,所述S1之前,具体包括:
S01,获取异构网络样本对应的元图样本。
可以理解的是,本实施例将提供一类预设产品筛选模型的构建方式,但不限于此。
具体地,本实施例将主要使用到遗传算法(Genetic Algorithm)框架,以自动寻找更有利于产品推荐的元图,进而提升推荐精准度。
比如,在获得一些异构网络样本后,可先初始化异构网络样本对应的元图样本,例如,可先随机生成该元图样本。就遗传算法框架而言,此处的元图样本对应于遗传算法框架下种群中的个体的基因。
当然,每一个个体可同时包含着多个基因。
S02,在遗传算法框架下对所述元图样本进行基因级操作,以获得新的元图集。
其中,元图样本可为多个。
接着,可对元图样本即基因进行变更,以产生新的基因,即可探索出更多可能的元图以用于推荐任务。
S03,基于元图分值对新的元图集进行筛选,以获得目标元图集。
可以理解的是,新的元图集中的每个元图均存在着对应的元图表现指标,元图表现指标可以分值的形式体现,即元图表现指标还可记为元图分值。
所以,可对新的元图集进行筛选,以筛选出元图分值处于一定元图分值范围内的元图来组成目标元图集。
其中,采用的元图分值范围可为数值较高的数值范围。
S04,基于所述目标元图集中的元图构建预设产品筛选模型。
最终,可基于筛选后的更有利于产品推荐的元图来搭建模型。
本发明实施例提供的基于元图的产品筛选方法,将使用遗传算法框架自动寻找更有利于产品推荐的元图,通过该元图搭建出的模型来进行产品筛选,可以提升产品推荐精准度。
进一步地,为了更好地将遗传算法框架迁移到自动化元图搜索问题中,可预先设计一种编码方式,以建立元图与基因的映射关系。
该面向元图基因的编码方式将把所有可能的元图编码到基因空间中,否则,在后续的优化过程中将无法覆盖全部搜索空间,使得部分元图无法被探索到。
具体地,可定义异构信息网络其中,/>表示节点集合,ε表示边集合,/>表示节点类型集合,/>表示边类型集合。
其中,对于异构信息网络而言,节点类型集合或边类型集合中的元素数量均大于1,即|ε|>1。
若给定一个特定的异构信息网络可定义元图其中,/>表示元图中的节点集合,ε*表示元图中的边集合。
对于元图中任意的节点v*,满足对于元图中任意的边e*,满足/>可见,元图中的节点与边均为实际异构网络中的节点类型或边类型,从而构成了一种消息传递模板。
此外,还可定义一个有序的节点列表Tm与一个邻接矩阵Am共同刻画元图对应的基因。
其中,节点列表Tm定义元图中的各个节点,邻接矩阵Am描述元图中各个节点之间的连接关系。Am的各行与各列对应于节点列表Tm所描述的元图节点,若存在连接则为1,若不存在连接则为0。
由于可见,元图本质上是一种异构图,而且,通过上述基因定义可以刻画全部元图。
进一步地,鉴于节点列表Tm有不同的选择与组合,同时,邻接矩阵Am中可能的连接数量庞大,均使得面向问题的搜索空间十分庞大。
为了使得元图搜索行为更为高效,本发明实施例可从元图基因的定义角度入手进行改进,以减小该搜索空间。
一类改进为,鉴于给定的异构网络并不是所有类型的节点都可以互相连接,例如,品类节点或产地节点刻画了产品的属性,只能与产品节点相连,而不能与用户节点相连。这些先验知识均可以用来减小搜索空间的大小。
具体地,可根据先验知识将节点列表Tm中不存在连接的节点对记录下来,并将邻接矩阵Am中对应行与对应列的交叉元素设置为-1。
利用这些先验知识,可以保证所有基因对应的元图均是符合场景要求的,同时,缩小了可能的问题搜索空间。
另一类改进为,鉴于推荐任务只关心元图所连接的目标用户与目标产品之间的交互,而不是元图上的整体结构,为此,可固定节点列表Tm前两个元素、邻接矩阵Am中的前两行与前两列分别为目标用户与目标商品。同时,可忽略元图中边的方向,即将邻接矩阵Am对角线下方的元素置为-1,形成上三角邻接矩阵。
明显地,通过上述两类改进,可在基因定义过程中引入了额外的先验信息以缩小元图搜索空间,提高了优化的效率。
在上述实施例的基础上,优选地,所述在遗传算法框架下对所述元图样本进行基因级操作,以获得新的元图集,具体包括:
在遗传算法框架下对所述元图样本中的节点数量、节点类型及节点回路进行变更,以获得新的元图集。
可以理解的是,就用于基因变更的基因级操作而言,存在多种类型。具体地,基因级操作包括变异操作与交叉互换操作。
就一类变异操作而言,对元图样本中的节点回路进行变更,以获得新的元图集。
比如,由于推荐任务关注目标节点之间的信息传递,若变异过程不改变目标节点之间的回路,则此变异对推荐的意义不大。所以,可对元图样本中的节点数量、节点类型及节点回路进行变更,以获得新的元图集。
此外,在每次变异操作后,将枚举出目标节点之间的所有节点回路,若变异操作增加了新的节点回路或者删除了原有环路,则停止变异操作;否则,继续变异操作直到检测到节点回路发生改变。
更进一步地,就另一类变异操作而言,为了确保变异操作后的基因在实际推荐场景中确实存在,则变异操作操作的基因位置可先排除掉-1位置的值。
其中,元图对应的基因可表示为一个矩阵或表格。行和列交叉的位置是1则表示这两个节点相连;是0,则表示不相连,但也有可能相连;是-1,则表示这两个节点不可能相连,比如用户与商品类别,从而减少了变异的可能空间,提高效率。
可见,通过在变异过程中引入基因编码过程中引入的先验知识,可避免产生不存在的连接,从而提高了搜索效率。
此外,在变异操作结束之后,可删除掉基因对应元图中的所有侧支。具体地,将删除掉目标用户与目标商品之外的一些额外连接,比如,由“职业-目标用户-用户好友-商品-商品类别-目标商品”构成的元图,“职业-目标用户”这条边就在“目标用户”与“目标商品”之外,是一个侧支。再比如,对于某个确定的用户而言,其职业是确定的,因此这条边无法提供有意义的信息,因此在元图模板中将这种侧支删除掉。
这是考虑到这些侧支节点无法提供对推荐有益的额外信息,为保证变异元图的简洁,所以,在操作结束后,可将其从元图中删去。
可见,本发明实施例提供的变异操作,提高了变异生成的新基因的质量;保证了大多数变异对推荐任务存在实质影响,从而减小了搜索空间,提高了搜索效率。
毕竟,变异过程会产生大量新基因,但并非所有基因均对推荐任务有实质意义。
进一步地,还可在遗传算法框架下对元图样本进行交叉互换操作,以获得新的元图集。
其中,交叉互换操作可以产生新的基因组合,以探索不同基因的共同作用。
可见,本发明实施例提供的交叉互换操作,将以一定概率将不同个体之间的基因进行交换,促进了个体间基因的流通,从而减小了优秀基因被掩盖的几率,有利于搜索到对推荐有意义的基因组合。
图3为本发明再一实施例提供的一种基于元图的产品筛选方法的流程图,本发明再一实施例基于上述图2所示的实施例。
本实施例中,所述S03,具体包括:
S031,对新的元图集进行预测操作,以得到预测表现指标。
S032,根据所述预测表现指标筛选出预测合格元图与预测不合格元图。
在具体实现中,就针对新的元图集的筛选操作而言,存在着预测操作与测试操作。
就预测操作而言,通过进行预测操作可先获得新的元图集中的每个元图的元图分值,预测操作生成的元图分值可记为预测表现指标。
可规定一预测分值范围,将元图分值处于预测分值范围内的元图记为预测合格元图,不处于预测分值范围内的元图记为预测不合格元图。
可见,新的元图集可划分为预测合格元图与预测不合格元图。
S033,对所述预测合格元图进行预设任务的测试操作,以得到与所述预测合格元图对应的任务表现指标。
就测试操作而言,可将预测合格元图在实际的推荐任务中进行测试,测试操作生成的元图分值可记为任务表现指标。
此外,预测合格元图通过筛选,还可划分为任务合格元图与任务不合格元图。
S034,将所述预测不合格元图的预测表现指标作为所述预测不合格元图的元图分值,将所述预测合格元图的任务表现指标作为所述预测合格元图的元图分值,基于元图分值对新的元图集进行筛选,以获得目标元图集。
可见,元图分值包括有预测表现指标与任务表现指标。预测不合格元图直接采用预测表现指标,预测合格元图不采用预测表现指标而采用任务表现指标。
进一步地,基于元图分值对新的元图集进行筛选的筛选过程可具体为,筛选出的元图集可重新送入遗传算法框架进行变异以生成新的元图,直到任务指标收敛,模型训练结束,将最终筛选出的元图集记为目标元图集。
本发明实施例提供的基于元图的产品筛选方法,为了进行元图筛选操作,将同时结合预测操作与测试操作,以筛选出更优秀的个体;同时,还可进一步地节省搜索时间。
在上述实施例的基础上,优选地,所述对新的元图集进行预测操作,以得到预测表现指标,具体包括:
确定新的元图集中的元图的第一节点表征向量;
对所述第一节点表征向量进行图卷积操作,以得到第一卷积表征向量;
对所述第一卷积表征向量进行激活操作,以得到预测表现指标。
可以理解的是,本实施例可给出一类预测操作的具体实施手段。
而且,可将本实施例描述的预测操作以元图预测器的形式来实现,而且,该元图预测器可采用单层图卷积网络构建得到。
具体地,个体中的每一个基因将被还原为元图m1,m2,…,mn,其中n为每个个体的基因总数。
接着,通过元图预测器确定新的元图集中的元图的第一节点表征向量。
具体地,元图的第一节点表征向量可记为该节点表征向量可通过对每类节点随机初始化得到。
然后,对个体中的每一个元图进行图卷积生成第一卷积表征向量vi,图卷积操作对应的公式如下,
其中,vi表示第一卷积表征向量,σ(·)表示Sigmoid函数,W表示可学习的线性变换矩阵,mean(·)表示平均聚合函数,xi表示第一节点表征向量,表示根据元图m搜索而连接到的目标节点i的邻居节点集合。
可以理解的是,上式对应于第一个元图的卷积过程,后续卷积过程中将基于各个节点上一步生成的第一卷积表征向量与新元图邻居集合进行,直到所有n个元图均经过卷积。
最后,可对各个节点的第一卷积表征向量vi进行激活操作,以得到预测表现指标。
具体地,可先将各个节点的第一卷积表征向量拼接起来并通过线性变换层映射为1维向量,再通过Sigmoid激活以输出预测值,具体公式如下,
其中,output表示预测表现指标,Wo表示可学习的线性变换矩阵,表示拼接操作,v1、v2及vt均对应于vi
进一步地,元图预测器可通过历史中各个个体在真实推荐系统中的表现作为训练集,采用均方误差损失函数进行训练。
在每代个体训练结束后,元图预测器均会重新训练以利用更多训练数据更好地预测新变异的个体表现,实现动态更新。
在上述实施例的基础上,优选地,所述对所述预测合格元图进行预设任务的测试操作,以得到与所述预测合格元图对应的任务表现指标,具体包括:
对所述预测合格元图进行广度优先搜索操作,以得到与所述预测合格元图对应的邻接矩阵;
基于所述邻接矩阵构建出初始产品筛选模型;
通过所述初始产品筛选模型进行预设任务的测试操作,以得到与所述预测合格元图对应的任务表现指标。
可以理解的是,本实施例可给出一类测试操作的具体实施手段。
具体地,为了将预测表现优秀的个体在实际推荐场景中进行验证或称之为测试,初始步骤可为元图搜索。
鉴于元图定义了异构信息网络中的消息传输模板,通过元图可以过滤出符合其语义的实际异构网络中的交互关系,而这一过程可通过元图搜索算法来实现。
其中,本实施例采用的元图搜索算法可为广度优先搜索算法,将搜索得到邻接关系即邻接矩阵。
进一步地,为了适应大规模异构信息网络,本发明可采用一些改进方法提升搜索效率。
比如,对于复杂的异构信息网络,元图对应的连接数量可能过于庞大,因此,可引入采样来控制搜索到链接的数量。
进一步地,为了保证采样过程的公平性,在搜索过程中可根据元图中各类节点的度定义搜索优先级,并优先在异构信息网络中搜索度最大的节点以随机采样,具体地,可优先对度较大的节点进行随机采样。
同时,还可将搜索历史保存,避免重复搜索。
可见,通过上述改进后的广度优先搜索可以提高搜索效率,同时控制了搜索到邻接矩阵的数量,为后续图卷积过程提供了良好的基础。
其中,一个邻接矩阵对应一个元图,可描述一个元图中节点的连接情况,而且,搜索得到的邻接矩阵是由该元图描述的关系在实际异构信息网络中对应的连接。
接着,在获得邻接矩阵后,可基于该邻接矩阵构建出初始产品筛选模型,通过该初始产品筛选模型进行测试操作。
其中,该初始产品筛选模型是基于邻接矩阵构建得到的,该初始产品筛选模型可在实际推荐任务中进行测试以评估个体表现。
本发明实施例提供的基于元图的产品筛选方法,通过使用改进后的广度优先搜索可以提高搜索效率,进而提高了测试效率。
在上述实施例的基础上,优选地,所述基于所述邻接矩阵构建出初始产品筛选模型,具体包括:
基于所述邻接矩阵进行图卷积操作,以得到第二卷积表征向量;
基于注意力机制将与图卷积网络分别对应的第二卷积表征向量进行拼接,以得到拼接后的向量;
对拼接后的向量进行映射,以得到映射向量;
对所述映射向量进行非线性激活,以得到查询向量;
根据所述查询向量分配与所述第二卷积表征向量对应的注意力权重;
根据所述注意力权重与所述第二卷积表征向量确定第二节点表征向量,以构建出初始产品筛选模型。
可以理解的是,本实施例可给出一类初始产品筛选模型的具体构建过程。
比如,可先根据个体中的元图m1,m2,…,mn搜索到的邻接矩阵a1,a2,…,an构建不同的用户-产品交互网络,并在每个网络上进行独立图卷积操作。
具体地,可针对节点i随机初始化出一个表征向量xi;之后,按照个体中的每一个元图的邻接矩阵进行图卷积操作,以生成第二卷积表征向量其中,j=1,2,…,n用于表示不同元图所对应的网络,Rd表示d维实数空间,即长度为d的由任意实数组成的向量,d为表征向量的维度。
其中,该图卷积操作对应的公式如下,
其中,σ(·)表示Sigmoid函数,Wj表示元图j对应的可学习的线性变换矩阵,mean(·)表示平均聚合函数,表示根据元图搜索出的邻接矩阵aj中目标节点i的邻居节点集合。
可见,由于元图所刻画的连接关系即邻接矩阵可以包含由元图所刻画的连接关系,还可以包含多跳之后的邻居,无需利用多层图卷积扩大感受野,因此,本发明直接利用单层图卷积网络实现信息的传递,提高了计算效率,减小计算量。
可见,本发明可通过单层图卷积网络进行信息传递。
接着,由于个体中包含多个元图,元图对应的多个图卷积网络会生成不同的卷积表征向量这些卷积表征向量刻画了同一个节点在不同视角下的特征。
为了将这些特征结合起来,本发明设计了基于注意力的表征聚合机制即上述注意力机制,动态地将不同的卷积表征向量融合起来用于推荐任务。
具体地,在获得生成第二卷积表征向量之后,该注意力机制将不同元图学习到的卷积表征向量先拼接起来,再映射到与原始表征向量维度相同的空间中,再通过非线性激活函数生成查询向量qi∈Rd,即
其中,f(·)表示非线性激活函数,比如,可为双曲正切激活函数(tanh);Wq∈Rd×nd表示将拼接后的n·d维表征向量映射回d维向量;及/>表示第二卷积表征向量。
接着,在获得查询向量qi后,可通过查询向量qi,为各个第二卷积表征向量vi动态分配注意力权重αi,分配公式如下,
αi=softmax(vi·qi)
其中,表示各个第二卷积表征向量对应的注意力权重;表示各个第二卷积表征向量所形成的数组;相应地,
其中,softmax(·)表示柔性最大值函数,对应每一个元素的输出值
接着,可根据动态生成的注意力权重αi,将不同元图对应的表征向量进行融合,以得到节点的最终表征yi,即第二节点表征向量,从而完成对于初始产品筛选模型的构建。
其中,第二节点表征向量的确定公式如下,
其中,第二节点表征向量不是指向元图中的节点,而是,实际网络中的节点,即真实的异构信息网络中的节点。初始产品筛选模型可为图卷积网络。
此外,在训练过程中还可根据这个初始产品筛选模型的表现筛选元图,同时,保留对应的模型参数;之后,再把对应的优秀元图和对应训练模型的参数直接使用,此时训练完毕的初始产品筛选模型即为上述的预设产品筛选模型。
可以理解的是,图卷积网络由用户节点与产品节点构成。
可见,图卷积网络是基于元图构建得到的。
可见,本发明实施例将先处理异构网络信息,以得到局部子结构即元图,再过滤一部分从而构建出图卷积网络。
此外,通过结合元图与图卷积网络,可以更好地利用异构信息网络中的结构信息。
本发明实施例提供的基于元图的产品筛选方法,通过直接利用单层图卷积网络实现信息的传递,提高了计算效率,减小计算量。此外,为了将这些特征结合起来,本发明还设计了基于注意力的表征聚合机制动态地将不同的卷积表征向量融合起来用于推荐任务。
更进一步地,在获得该图卷积网络之后,通过计算用户节点与产品节点最终表征向量的点积,并通过Sigmoid激活函数激活后即可得到用户购买该产品的概率,即
p(user,item)=σ(yuser·yitem),
其中,p(user,item)表示用户购买该产品的概率,user,item表示训练集中用户与产品的组合。
此外,在网络训练时,可对训练集中的每一个用户-产品对,通过产品出现的频率随机采样出一定数量的负样本一同训练。
将正样本与负样本打分一同送入基于最大边界的排序损失函数中,即
J=meanmax{0,p(user,neg)-p(user,pos)+Δ},
其中,J表示损失指标;meanmax{}表示先对{}中的两个值取最大,再进行平均,这个平均是对用户-正样本-负样本意义下取的平均;Δ表示预定义的边界,取值在0-1之间;user表示用户,pos表示用户交互过的产品,neg表示采样出的负样本产品;p(user,neg)表示用户购买该负样本产品的概率,p(user,pos)表示用户购买该用户交互过的产品的概率。
在网络训练结束后,固定模型参数在测试集上进行测试,并计算推荐任务指标作为个体在推荐任务上的表现。
通过上述过程,基于注意力机制的多视角图卷积神经网络即初始产品筛选模型将每个个体在实际推荐场景中进行了评估,完成推荐任务的同时也为元图筛选提供了更为可靠的依据。
在上述实施例的基础上,优选地,所述基于元图分值对新的元图集进行筛选,以获得目标元图集,具体包括:
根据元图分值对新的元图集进行剔除,以得到待填充元图集;
对所述待填充元图集中的元图进行复制操作,以得到目标元图集。
在具体实现中,可按照一定比例剔除掉元图分值处于末位的个体。通过该淘汰操作使得种群中剩余个体都包含有效果较好的基因,而表现不好的基因会随个体一同被删除掉,从而提升了整个种群的平均表现。
随后,为保证种群内个体数目的稳定,剩余个体可按照其表现采样生成复制以填补被淘汰的个体,即完成繁衍操作。
可见,通过繁衍操作即复制操作保证了优秀基因在新种群中有更大的出现概率。
经过不断的循环优化,即不断进行剔除与复制操作之后,可通过统计种群中各个基因的出现频率即可确定适应此推荐场景的元图,从而完成推荐行为。
进一步地,可提供一个本发明实施例的数据测试记录。
该数据测试记录具体为,若使用者希望在数据集Y上利用本发明所提出的方法自动设计元图并完成推荐任务,可首先对数据集情况进行简要描述。
具体地,数据集Y对应的平台为一个用户提供点评当地各类商户的平台,用户可以为到访的店铺打分并撰写评价,同时与其他用户互动形成社交联系。在数据集Y对应的异构图场景中,共有五种节点,包括用户(U)、商铺(B)、赞赏(O)、城市(I)以及类别(A)。这五类节点之间存在五种关系,节点数量与关系数量如下表1所示。
表1.节点状况表
关系(X-Y) X类节点数量 Y类节点数量 连接数量
用户-商铺(U-B) 16239 14284 198397
用户-用户(U-U) 16239 16239 158590
用户-赞赏(U-O) 16239 11 76875
商铺-城市(B-I) 14284 47 14267
商铺-类别(B-A) 14284 511 40009
其中,U表示用户、B表示商铺、O表示赞赏、I表示城市及A表示类别。比如,用户-商铺连接刻画描述了用户曾经造访过该商铺,是用户与商铺的历史交互。
在这一推荐场景中,推荐系统需要为用户推荐其可能感兴趣的新商铺,因此这一关系是场景Y中的主要关系,用户与商铺为元图中的两个目标节点。同时,不同用户之间存在好友关系与赞赏关系,这两者构成了用户社群联系。对于商铺节点,存在两种辅助信息即城市与商铺类别,描述商户所在的城市以及商铺的经营范畴。可以发现,由上述关系构建的异构信息网络十分复杂,采取手工方式定义元图指导信息传播十分困难。
为利用本发明提出的方法,首先需要对遗传算法框架的参数进行定义。在此实例中,设置每个种群包含20个个体,每个个体包含5个基因。在每代进化过程中,每个基因有0.4的概率发生变异,0.05的概率与其他个体的基因发生交叉互换,元图预测器预测结果表现不佳的40%个体将不会在实际推荐场景中评估,而在淘汰过程中将删除表现不佳的末40%个体。
接下来需要定义基因编码方法以建立元图与基因之间的联系。上述五种节点可形成10种无向连接,而只有其中5种是真实存在的。这部分知识构成了编码过程中的先验。
算法初始化过程将以用户-商铺直接连接对种群中共100个基因进行初始化,接着根据预设的概率进行变异操作与交叉互换操作。变异过程中可能会产生不合理的结果,如图4、图5及图6所示。
其中,图4中的变异生成了实际异构网络中不存在的连接,将用户与城市节点相连,因而违背了变异过程中的规则,可将此非法变异示例记为不合理连接示例;图5中的变异并没有改变两个目标节点之间的路径,因而也违背了变异过程中的规则,可将此非法变异示例记为恒定信息回路示例;图6中则引入了无额外信息的侧支,因为每个商铺均有对应的类别,不论是否显示定义在元图上其搜索得到的结果均不会变化,可将此非法变异示例记为侧支示例。
可见,通过避免这些不合理的变异,可以提高搜索效率。
将每个个体送入元图预测器进行评估,选取评估结果优秀的个体送入多视角图卷积在实际推荐任务中训练。在每代进化过程中,元图预测器均会加入新个体的实际表现重新训练。这些优秀个体将利用多块显卡在数据集Y中并行训练,在训练过程中每条正样本采样4个负样本;而在评估过程中每个正样本与100个负样本一起进行排序,计算命中率(HR,Hit Ratio)、平均倒数排名(MRR,Mean Reciprocal Rank)以及归一化折损累计增益(NDCG,Normalized Discounted Cumulative Gain)这三类指标,在计算这些指标时需要指定排序的范围。
具体地,可计算HR@3、MRR@10、NDCG@10、MRR@50及NDCG@50这五个指标,以完整衡量各个个体在精细排序与召回性能的表现。这些指标将作为个体在推荐任务中的表现被记录。
接下来,可通过淘汰操作与繁衍操作,构成新一代的种群,以进一步优化。
在图7中,记录了每代种群中个体的最优平均表现与时间的关系。具体地,对每代的20个个体记录平均NDCG@10作为指标,并记录从第一代开始所出现的最优平均表现绘制在图中。
可以看出,随着时间演进,种群中个体的平均表现显著提高,验证了本发明提出的自动化搜索元图方法的有效性。
同时,图中还对比了采用元图预测器与不采用元图预测器的表现。可以看出,利用元图预测器进行筛选的系统不仅在搜索的时间效率上有较大提升,同时也取得了更好的推荐效果。
为了进一步验证元图预测器的作用,在图8与图9中验证了元图预测器在训练集与测试集上的表现。
理想情况下,期望元图预测器的预测输出与真实标签相等,即符合图中直线所示的关系。但在实际应用中,只要元图预测的个体表现与真实表现的相对关系一致,即可顺利完成筛选优秀个体的任务。因此,更重要的指标是输出个体的排名与真实标签排名的差异。
进一步地,计算了斯皮尔曼相关系数刻画元图预测器的排序表现如表2所示,
表2.测试表现
训练集 测试集
0.5499 0.3426
明显地,训练集上的高相关性表明了元图预测器可以在一定程度上记忆不同个体的表现从而减少重复验证,同时,在测试集上元图预测器也具有一定的泛化能力,可以有效地对新个体的表现进行判别。
图10为本发明实施例提供的一种基于元图的产品筛选系统的结构示意图,如图10所示,该系统包括:信息获取模块301、模型运行模块302以及产品推荐模块303;
信息获取模块301,用于获取与当前用户对应的异构网络信息;
模型运行模块302,用于将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;
产品推荐模块303,用于基于所述产品分值确定待推荐产品对应的产品信息;
其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。
本发明实施例提供的基于元图的产品筛选系统,先获取与当前用户对应的异构网络信息;将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;基于所述产品分值确定待推荐产品对应的产品信息;其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。明显地,本发明实施例将应用异构网络信息来筛选待推荐产品,而非仅局限于用户与产品二者之间的交互,同时,还使用了元图过滤异构网络信息以辅助推荐行为,从而提升了推荐准确性,解决了当前推荐系统推荐准确性较低的技术问题。
本发明实施例提供的系统实施例是为了实现上述各方法实施例的,具体流程和详细内容请参照上述方法实施例,此处不再赘述。
图11为本发明实施例提供的一种电子设备的实体结构示意图,如图11所示,该电子设备可以包括:处理器(processor)401、通信接口(Communications Interface)402、存储器(memory)403和总线404,其中,处理器401,通信接口402,存储器403通过总线404完成相互间的通信。通信接口402可以用于电子设备的信息传输。处理器401可以调用存储器403中的逻辑指令,以执行包括如下的方法:
获取与当前用户对应的异构网络信息;
将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;
基于所述产品分值确定待推荐产品对应的产品信息;
其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。
此外,上述的存储器403中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明上述各方法实施例的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:
获取与当前用户对应的异构网络信息;
将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;
基于所述产品分值确定待推荐产品对应的产品信息;
其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种基于元图的产品筛选方法,其特征在于,包括:
获取与当前用户对应的异构网络信息;
将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;
基于所述产品分值确定待推荐产品对应的产品信息;
其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值;
其中,所述获取与当前用户对应的异构网络信息之前,具体包括:
获取异构网络样本对应的元图样本;
在遗传算法框架下对所述元图样本进行基因级操作,以获得新的元图集;
基于元图分值对新的元图集进行筛选,以获得目标元图集;
基于所述目标元图集中的元图构建预设产品筛选模型。
2.根据权利要求1所述的基于元图的产品筛选方法,其特征在于,所述在遗传算法框架下对所述元图样本进行基因级操作,以获得新的元图集,具体包括:
在遗传算法框架下对所述元图样本中的节点数量、节点类型及节点回路进行变更,以获得新的元图集。
3.根据权利要求1所述的基于元图的产品筛选方法,其特征在于,所述基于元图分值对新的元图集进行筛选,以获得目标元图集,具体包括:
对新的元图集进行预测操作,以得到预测表现指标;
根据所述预测表现指标筛选出预测合格元图与预测不合格元图;
对所述预测合格元图进行预设任务的测试操作,以得到与所述预测合格元图对应的任务表现指标;
将所述预测不合格元图的预测表现指标作为所述预测不合格元图的元图分值,将所述预测合格元图的任务表现指标作为所述预测合格元图的元图分值,基于元图分值对新的元图集进行筛选,以获得目标元图集。
4.根据权利要求3所述的基于元图的产品筛选方法,其特征在于,所述对新的元图集进行预测操作,以得到预测表现指标,具体包括:
确定新的元图集中的元图的第一节点表征向量;
对所述第一节点表征向量进行图卷积操作,以得到第一卷积表征向量;
对所述第一卷积表征向量进行激活操作,以得到预测表现指标。
5.根据权利要求3所述的基于元图的产品筛选方法,其特征在于,所述对所述预测合格元图进行预设任务的测试操作,以得到与所述预测合格元图对应的任务表现指标,具体包括:
对所述预测合格元图进行广度优先搜索操作,以得到与所述预测合格元图对应的邻接矩阵;
基于所述邻接矩阵构建出初始产品筛选模型;
通过所述初始产品筛选模型进行预设任务的测试操作,以得到与所述预测合格元图对应的任务表现指标。
6.根据权利要求5所述的基于元图的产品筛选方法,其特征在于,所述基于所述邻接矩阵构建出初始产品筛选模型,具体包括:
基于所述邻接矩阵进行图卷积操作,以得到第二卷积表征向量;
基于注意力机制将与图卷积网络分别对应的第二卷积表征向量进行拼接,以得到拼接后的向量;
对拼接后的向量进行映射,以得到映射向量;
对所述映射向量进行非线性激活,以得到查询向量;
根据所述查询向量分配与所述第二卷积表征向量对应的注意力权重;
根据所述注意力权重与所述第二卷积表征向量确定第二节点表征向量,以构建出初始产品筛选模型。
7.一种基于元图的产品筛选系统,其特征在于,包括:
信息获取模块,用于获取与当前用户对应的异构网络信息;
模型运行模块,用于将所述异构网络信息输入至预设产品筛选模型,得到所述预设产品筛选模型输出的与产品对应的产品分值;
产品推荐模块,用于基于所述产品分值确定待推荐产品对应的产品信息;
其中,所述预设产品筛选模型是基于异构网络样本训练得到的;所述预设产品筛选模型用于通过元图描述的节点模板处理所述异构网络信息,以输出产品分值;
其中,所述获取与当前用户对应的异构网络信息之前,具体包括:
获取异构网络样本对应的元图样本;
在遗传算法框架下对所述元图样本进行基因级操作,以获得新的元图集;
基于元图分值对新的元图集进行筛选,以获得目标元图集;
基于所述目标元图集中的元图构建预设产品筛选模型。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一项所述基于元图的产品筛选方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述基于元图的产品筛选方法的步骤。
CN202010501385.5A 2020-06-04 基于元图的产品筛选方法、系统、设备及存储介质 Active CN111815396B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010501385.5A CN111815396B (zh) 2020-06-04 基于元图的产品筛选方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010501385.5A CN111815396B (zh) 2020-06-04 基于元图的产品筛选方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111815396A CN111815396A (zh) 2020-10-23
CN111815396B true CN111815396B (zh) 2024-05-31

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017041541A1 (zh) * 2015-09-08 2017-03-16 北京邮电大学 推送推荐信息的方法、服务器及存储介质
CN107562795A (zh) * 2017-08-01 2018-01-09 广州市香港科大霍英东研究院 基于异构信息网络的推荐方法及装置
CN107577710A (zh) * 2017-08-01 2018-01-12 广州市香港科大霍英东研究院 基于异构信息网络的推荐方法及装置
CN109299373A (zh) * 2018-10-20 2019-02-01 上海交通大学 基于图卷积技术的推荐系统
CN110083696A (zh) * 2019-04-23 2019-08-02 安徽大学 基于元结构技术的全局引文推荐方法、推荐系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017041541A1 (zh) * 2015-09-08 2017-03-16 北京邮电大学 推送推荐信息的方法、服务器及存储介质
CN107562795A (zh) * 2017-08-01 2018-01-09 广州市香港科大霍英东研究院 基于异构信息网络的推荐方法及装置
CN107577710A (zh) * 2017-08-01 2018-01-12 广州市香港科大霍英东研究院 基于异构信息网络的推荐方法及装置
CN109299373A (zh) * 2018-10-20 2019-02-01 上海交通大学 基于图卷积技术的推荐系统
CN110083696A (zh) * 2019-04-23 2019-08-02 安徽大学 基于元结构技术的全局引文推荐方法、推荐系统

Similar Documents

Publication Publication Date Title
US11227190B1 (en) Graph neural network training methods and systems
CN111695719A (zh) 一种用户价值预测方法及系统
CN113987200B (zh) 神经网络结合知识图谱的推荐方法、系统、终端、介质
CN111695965B (zh) 基于图神经网络的产品筛选方法、系统及设备
US20140188994A1 (en) Social Neighborhood Determination
CN111985622A (zh) 一种图神经网络训练方法和系统
CN108182634A (zh) 一种借贷预测模型的训练方法、借贷预测方法和装置
CN112131480A (zh) 基于多层异质属性网络表征学习的个性化商品推荐方法及系统
US20220138502A1 (en) Graph neural network training methods and systems
CN113609345B (zh) 目标对象关联方法和装置、计算设备以及存储介质
CN115358809A (zh) 一种基于图对比学习的多意图推荐方法及装置
CN115221413B (zh) 一种基于交互式图注意力网络的序列推荐方法及系统
CN107274042A (zh) 一种业务参与对象的风险识别方法及装置
CN113191838A (zh) 一种基于异质图神经网络的购物推荐方法及系统
CN110674181B (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN113850654A (zh) 物品推荐模型的训练方法、物品筛选方法、装置和设备
CN113763095A (zh) 信息推荐方法、装置和模型训练方法、装置
CN111815396B (zh) 基于元图的产品筛选方法、系统、设备及存储介质
CN116204723A (zh) 一种基于动态超图表示学习的社交推荐方法
CN115344794A (zh) 一种基于知识图谱语义嵌入的旅游景点推荐方法
CN114417161B (zh) 基于异构图的虚拟物品时序推荐方法、装置、介质及设备
CN109886299A (zh) 一种用户画像方法、装置、可读存储介质及终端设备
CN115599990A (zh) 一种知识感知结合深度强化学习的跨域推荐方法及系统
CN113656589B (zh) 对象属性确定方法、装置、计算机设备及存储介质
CN115618098A (zh) 基于知识增强与空洞卷积的冷链物流推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant