CN113987338A - 一种基于标签的异质图推荐算法 - Google Patents
一种基于标签的异质图推荐算法 Download PDFInfo
- Publication number
- CN113987338A CN113987338A CN202111232670.2A CN202111232670A CN113987338A CN 113987338 A CN113987338 A CN 113987338A CN 202111232670 A CN202111232670 A CN 202111232670A CN 113987338 A CN113987338 A CN 113987338A
- Authority
- CN
- China
- Prior art keywords
- node
- attribute
- information
- heterogeneous
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于标签的异质图推荐算法。包括以下步骤:(1):构建异质图:构建用户‑物品、用户‑标签、物品‑标签三种异质关系图;(2):初始化:为图中每个节点关联一个嵌入表示,并进行初始化;将嵌入表示划分为多个分离的块,每个块对应一种属性;(3):异质图解耦层;步骤(4):高阶信息传播:将异质图解耦层堆叠L层,上一层的输出作为下一层的输入;步骤(5):模型训练:使用BPR方法进行模型训练;步骤(6):模型测试。本发明充分挖掘标签信息,减轻稀疏性,同时结合信息传播和邻域路由机制自动识别多属性问题,解耦用户的多种偏好和物品的多重特征,从而为模型提供可解释性,提高推荐模型的性能。
Description
技术领域
本发明属于信息处理领域,具体涉及一种基于标签的异质图推荐算法。
背景技术
随着信息时代的到来,信息过载越来越严重,推荐算法作为解决该问题的重要手段受到了广泛研究。其可以从海量的数据中找到满足用户个性化需求的数据,然后自动推荐给用户。已被广泛地应用到各种平台,如多媒体、网购等。其中大量研究使用用户与物品的交互得到用户和物品的表示,虽取得不错成绩,但容易遭受稀疏性问题,即交互的数据的占比很低,难以通过少量的信息学到准确的用户表示。因此,大量研究开始引入各种额外数据(文本、图片),如很多研究将标签作为一种元信息,通过神经网络得到用户和物品基于标签的表示,然后结合协同信号进行推荐。或者利用流行的图卷积模型,通过将标签加入协同图中,然后进行信息传播扩展节点的信息,用以减轻稀疏性问题。虽然一定程度上解决稀疏性问题,取得了不错性能。但这些模型无法为高性能提供可靠的解释,使之鲁棒性不强。
导致性能达不到最优的原因是:没有考虑到用户具有多重偏好、物品也具有多种属性的问题,将不同属性维度上的消息纠缠在一起。为了解耦交互背后的原因,有研究将解耦图模型引入该领域,旨在解耦交互背后的主要原因,进而解耦用户和物品的多重属性信息。但这种仅基于交互信息进行的解耦方法的推测性能无法达到最优。
发明内容
本发明为了同时解决稀疏性和图中节点的多重属性问题,提出了一种基于标签的解耦用户和物品的多重属性的推荐算法,同时引入标签扩展用户和物品的信息,使模型能够准确获得用户、物品在各属性上的信息,自动识别交互背后的主要原因,实现更好的推荐性能和可解释性。
实现本发明目的的技术解决方案为:一种基于标签的异质图推荐算法,包括以下步骤:
步骤(1):构建异质图:利用用户的标注历史,构建用户-物品、用户-标签、物品-标签三种异质关系图;
步骤(2):初始化:为图中每个节点关联一个嵌入表示,并进行初始化;将嵌入表示划分为多个分离的块,每个块对应一种属性;
步骤(3):异质图解耦层:1)由边两端的节点在各属性上的嵌入表示计算该边在各属性上的分布,将异质图划分为多个与各属性相关的异质子图;2)分别在各属性对应的异质子图上进行图卷积,扩展节点在该关系下各属性上的信息;
3)由各异质图上更新的属性信息,计算节点对属性的关注程度;4)将各属性上不同的异质信息进行融合,得到节点在该属性上的总体表示;5)重复以上步骤T次,使模型收敛,自动识别边在各属性上的分布和节点对各属性的重视程度;
步骤(4):高阶信息传播:将异质图解耦层堆叠L层,上一层的输出作为下一层的输入,节点的最终表示取所有层输出的平均,利用内积表示用户与物品的匹配程度;
步骤(5):模型训练:使用BPR方法进行模型训练,将用户交互过的物品视为正样本,未交互过的视为负样本,期望正样本的匹配分数大于负样本;
步骤(6):模型测试:根据训练后,使用以上模型得到用户和物品的嵌入表示,内积得到用户对所有物品的匹配分数,进行排序,选择分数最高的top-k个物品作为推荐,测试推荐的准确度。
本发明与现有技术相比,其显著优点在于:
(1)本发明引入标签信息,同时利用图卷积有效解决稀疏性问题和标签自身具有的多词同义等问题;
(2)利用邻域路由机制解耦节点的多重属性问题,同时得到节点对不同属性的注意力分数,为模型提供了可解释性,使模型鲁棒性更强,推荐准确度更高。
附图说明
图1是通过标注历史构建异质图和整体框架的示意图。
图2是可解释性异质图解耦层的模型结构图。
具体实施方式
下面结合附图对本发明作进一步详细描述。
如图1、2所示,一种基于标签的异质图推荐算法,具体步骤如下:
步骤(1)、先根据所有用户的标注历史构建异质图。具体为:一条标注记录可表示为α=<u,i,t>,表示用户u给物品i标记过标签t。由所有的标注历史,根据实体间的关系,可得到三个异质图,其中<u,i>表示用户u与用户i间存在交互关系,<u,t>表示用户u使用过标签t,<i,t>表示物品i被标签t标注过。
步骤(2)、初始化。为图中的每一个节点(用户、物品、标签)都关联一个d维的向量表示该节点的信息,并使用xavier进行随机初始化;然后将其划分为K个彼此独立的块,分别表示节点在各属性上的信息,可表示为e=(e1,e2,...,eK)。其中
步骤(3)、利用邻域路由机制自动识别边在各属性上的概率分布,和节点对各属性的重视程度,实现图的解耦,从而为模型提供可解释性。具体步骤如下:
步骤3-1:确定边在各属性上的概率分布:根据中心节点和邻域节点在不同属性上的信息,计算中心节点μ与其邻域节点ν在第j次迭代中在各属性上的亲近程度确定这条边是由何种属性导致的,进而得到边在各属性上的概率分布从而将图划为多个与属性相关的子图,公式如下:
步骤3-2:更新各异质图上各属性传播过来的信息。将各异质图划分为多个与属性相关的子图后,分别在子图上进行图卷积,接收邻域信息,扩展节点在该属性上的信息。采用目前最好的图卷积模型lightgcn,公式如下:
步骤3-3、更新各节点在各关系下对各属性关注度:得到节点在各种关系上各属性的信息后,对于不同的异质信息,节点对于其各种属性的关注程度不同,使用节点在该属性上的信息确定其对于各种属性的重视程度。计算公式如下:
步骤3-4:融合各属性在各异质图上的信息。将各种属性上从各种关系上传来的异质信息进行融合,得到节点在该属性上的完整信息表示。计算公式如下:
其中表示节点μ在第k的属性上扩展的邻域消息,表示历史交互μ-v在各属性上的分布,由此可知该交互形成的主要因素。表示节点μ对各属性的重视程度。进行推荐时,则可推荐在用户比较重视的属性上与用户该属性相关的物品。
步骤(4)、高阶信息传播:将节点的上一阶的邻域信息作为节点新的信息,继续执行以上图卷积,则可以接收到更高阶邻域传播过来的信息,公式可表示为:
其中f表示步骤(3)提出的图卷积层,堆叠L层,可以得到L阶邻域信息,融合各阶邻域传播过来的信息,即然后将所有属性拼接起来作为节点最终的嵌入表示,即eμ=eμ1||eμ2||...||eμK。对用户、物品、标签都执行上面操作。
loss=lossBPR+||Θ||2 (10)
其中Θ为本模型的参数。
步骤(6)、模型测试:训练好模型后,根据步骤(3)(4)可以得到所有用户和物品的嵌入表示,则用内积可得到用户对所有物品的偏好分数,对其进行排序,取分数最大的top-k个物品作为推荐物品。同时,得到边在各属性上的概率分布,和各节点对各属性的注意力分布。揭示各交互背后的主要关系,为模型提供可解释性。
Claims (7)
1.一种基于标签的异质图推荐算法,其特征在于,包括以下步骤:
步骤(1):构建异质图:利用用户的标注历史,构建用户-物品、用户-标签、物品-标签三种异质关系图;
步骤(2):初始化:为图中每个节点关联一个嵌入表示,并进行初始化;将嵌入表示划分为多个分离的块,每个块对应一种属性;
步骤(3):异质图解耦层:1)由边两端的节点在各属性上的嵌入表示计算该边在各属性上的分布,将异质图划分为多个与各属性相关的异质子图;2)分别在各属性对应的异质子图上进行图卷积,扩展节点在该关系下各属性上的信息;3)由各异质图上更新的属性信息,计算节点对属性的关注程度;4)将各属性上不同的异质信息进行融合,得到节点在该属性上的总体表示;5)重复以上步骤T次,使模型收敛,自动识别边在各属性上的分布和节点对各属性的重视程度;
步骤(4):高阶信息传播:将异质图解耦层堆叠L层,上一层的输出作为下一层的输入,节点的最终表示取所有层输出的平均,利用内积表示用户与物品的匹配程度;
步骤(5):模型训练:使用BPR方法进行模型训练,将用户交互过的物品视为正样本,未交互过的视为负样本,期望正样本的匹配分数大于负样本;
步骤(6):模型测试:根据训练后,使用以上模型得到用户和物品的嵌入表示,内积得到用户对所有物品的匹配分数,进行排序,选择分数最高的top-k个物品作为推荐,测试推荐的准确度。
2.根据权利要求1所述的算法,其特征在于,所述步骤(1)具体实现如下:利用用户的标注历史,构建用户-物品、用户-标签、物品-标签三种异质关系图具体为:一条标注记录可表示为α=<u,i,t>,表示用户u给物品i标记过标签t,由所有的标注历史,根据实体间的关系,可得到三个异质图,其中<u,i>表示用户u与用户i间存在交互关系,<u,t>表示用户u使用过标签t,<i,t>表示物品i被标签t标注过。
4.根据权利要求3所述的算法,其特征在于,所述步骤(3)具体分为以下步骤:
步骤(3-1):确定边在各属性上的概率分布:根据中心节点和邻域节点在不同属性上的信息,计算中心节点μ与其邻域节点ν在第j次迭代中在各属性上的亲近程度确定这条边是由何种属性导致的,进而得到边在各属性上的概率分布从而将图划为多个与属性相关的子图,公式如下:
步骤(3-2):更新各异质图上各属性传播过来的信息;将各异质图划分为多个与属性相关的子图后,分别在子图上进行图卷积,接收邻域信息,扩展节点在该属性上的信息;采用图卷积模型lightgcn,公式如下:
步骤(3-3):更新各节点在各关系下对各属性关注度:得到节点在各种关系上各属性的信息后,对于不同的异质信息,节点对于其各种属性的关注程度不同,使用节点在该属性上的信息确定其对于各种属性的重视程度;计算公式如下:
步骤(3-4):融合各属性在各异质图上的信息;将各种属性上从各种关系上传来的异质信息进行融合,得到节点在该属性上的完整信息表示;计算公式如下:
7.根据权利要求6所述的算法,其特征在于,所述步骤(6)具体实现如下:
训练好模型后,根据步骤(3)(4)可以得到所有用户和物品的嵌入表示,则用内积可得到用户对所有物品的偏好分数,对其进行排序,取分数最大的top-k个物品作为推荐物品;同时,得到边在各属性上的概率分布,和各节点对各属性的注意力分布;揭示各交互背后的主要关系,为模型提供可解释性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111232670.2A CN113987338A (zh) | 2021-10-22 | 2021-10-22 | 一种基于标签的异质图推荐算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111232670.2A CN113987338A (zh) | 2021-10-22 | 2021-10-22 | 一种基于标签的异质图推荐算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113987338A true CN113987338A (zh) | 2022-01-28 |
Family
ID=79740332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111232670.2A Pending CN113987338A (zh) | 2021-10-22 | 2021-10-22 | 一种基于标签的异质图推荐算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113987338A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821512A (zh) * | 2023-08-25 | 2023-09-29 | 深圳唯爱智云科技有限公司 | 推荐模型训练方法及装置、推荐方法及装置 |
-
2021
- 2021-10-22 CN CN202111232670.2A patent/CN113987338A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821512A (zh) * | 2023-08-25 | 2023-09-29 | 深圳唯爱智云科技有限公司 | 推荐模型训练方法及装置、推荐方法及装置 |
CN116821512B (zh) * | 2023-08-25 | 2024-02-20 | 深圳唯爱智云科技有限公司 | 推荐模型训练方法及装置、推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674407B (zh) | 基于图卷积神经网络的混合推荐方法 | |
CN112232925A (zh) | 一种融合知识图谱对商品进行个性化推荐的方法 | |
CN112214685A (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN109684538A (zh) | 一种基于用户个人特征的推荐方法及推荐系统 | |
CN107220365A (zh) | 基于协同过滤与关联规则并行处理的精准推荐系统及方法 | |
CN107239512B (zh) | 一种结合评论关系网络图的微博垃圾评论识别方法 | |
CN114065048A (zh) | 基于多异构图图神经网络的物品推荐方法 | |
Shafqat et al. | A hybrid GAN-based approach to solve imbalanced data problem in recommendation systems | |
CN115062732B (zh) | 基于大数据用户标签信息的资源共享合作推荐方法及系统 | |
CN111651678B (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN108563690A (zh) | 一种基于面向对象聚类的协同过滤推荐方法 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN115329215A (zh) | 异构网络中基于自适应动态知识图谱的推荐方法及系统 | |
CN115689672A (zh) | 聊天式商品导购方法及其装置、设备、介质 | |
CN117313841A (zh) | 一种基于深度迁移学习和图神经网络的知识增强方法 | |
CN113344648B (zh) | 一种基于机器学习的广告推荐方法及系统 | |
CN115238191A (zh) | 对象推荐方法以及装置 | |
CN114238758B (zh) | 一种基于多源跨界数据融合的用户画像预测方法 | |
Zhou et al. | Rank2vec: learning node embeddings with local structure and global ranking | |
CN114925268A (zh) | 基于图神经网络的推荐方法、系统、电子设备及计算机可读介质 | |
CN113987338A (zh) | 一种基于标签的异质图推荐算法 | |
CN112765490A (zh) | 一种基于知识图谱和图卷积网络的信息推荐方法及系统 | |
CN103034728B (zh) | 利用社会化网络学术资源交互平台进行信息交互的方法 | |
CN110674265B (zh) | 面向非结构化信息的特征判别与信息推荐系统 | |
CN116450938A (zh) | 一种基于图谱的工单推荐实现方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |