CN116204723A - 一种基于动态超图表示学习的社交推荐方法 - Google Patents

一种基于动态超图表示学习的社交推荐方法 Download PDF

Info

Publication number
CN116204723A
CN116204723A CN202310291550.2A CN202310291550A CN116204723A CN 116204723 A CN116204723 A CN 116204723A CN 202310291550 A CN202310291550 A CN 202310291550A CN 116204723 A CN116204723 A CN 116204723A
Authority
CN
China
Prior art keywords
user
hypergraph
embedding
item
social
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310291550.2A
Other languages
English (en)
Inventor
李明
丁爽爽
梁吉业
李朝
吴信东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Normal University CJNU
Original Assignee
Zhejiang Normal University CJNU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Normal University CJNU filed Critical Zhejiang Normal University CJNU
Priority to CN202310291550.2A priority Critical patent/CN116204723A/zh
Publication of CN116204723A publication Critical patent/CN116204723A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于动态超图表示学习的社交推荐方法,包括:获取多个超图,每个超图根据若干个用户和若干个项目在设定时间段内的关联关系确定;其中,用户和项目作为超图的节点,用户间的社交关系,以及用户与项目间的购买关系作为超图的超边;将多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入;根据用户嵌入和项目嵌入确定每一用户对每一项目的预测得分。本发明在社交推荐使时考虑了时间推移对用户与用户、用户与项目间的关系影响,根据用户嵌入和项目嵌入确定每一用户对每一项目的预测得分,可以确定每一用户对每一项目的喜欢程度,从而作出准确推荐,可广泛应用于社交推荐领域。

Description

一种基于动态超图表示学习的社交推荐方法
技术领域
本发明涉及社交推荐技术领域,尤其是一种基于动态超图表示学习的社交推荐方法。
背景技术
在线社交网络中用户和项目的交互存在图结构,且用户的历史行为反映了其个人偏好,这对社交推荐的数据分析来说具有重要价值。然而,传统的基于图神经网络的推荐系统尽管堆叠的多层图神经网络可以捕获节点之间多跳的高阶关系,但它们无法捕获具有特定基序的高阶关系。目前大多数推荐系统的方法,都是基于用户-用户图,项目-项目图,用户-项目关系图并行分析用户与项目的关系,这种传统的单一化做法无法区分不同时间段的重要性,从而阻碍了推荐信息的准确性。
因此,上述的技术问题亟待解决。
发明内容
有鉴于此,本发明实施例提供一种基于动态超图表示学习的社交推荐方法,以符合时间变换地对用户进行精准推荐。
本发明实施例的一方面提供了一种基于动态超图表示学习的社交推荐方法,包括:
获取多个超图,每个超图根据若干个用户和若干个项目在设定时间段内的关联关系确定;其中,用户和项目作为超图的节点,用户间的社交关系,以及用户与项目间的购买关系作为超图的超边;
将所述多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入;
根据所述用户嵌入和所述项目嵌入确定每一用户对每一项目的预测得分。
可选地,所述将所述多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入,包括:
将所述多个超图输入超图卷积神经网络并经过第一长短期记忆网络,得到第一用户嵌入与第一项目嵌入;
将所述多个超图输入注意力神经网络并经过第二长短期记忆网络,得到第二用户嵌入与第二项目嵌入。
可选地,所述将所述多个超图输入超图卷积神经网络并经过第一长短期记忆网络,得到第一用户嵌入与第一项目嵌入,包括:
利用所述超图卷积神经网络计算每一超图各顶点间的转移概率,以使每一顶点的嵌入在所述超图卷积神经网络的各层级间传递,并经过第一长短期记忆网络,得到第一用户嵌入与第一项目嵌入。
可选地,所述将所述多个超图输入注意力神经网络并经过第二长短期记忆网络,得到第二用户嵌入与第二项目嵌入,包括:
利用所述注意力神经网络中的注意力超边聚合模块,聚合有关超边的信息,生成超边嵌入;
利用所述注意力神经网络中的注意力顶点聚合模块,聚合有关顶点的信息,生成顶点嵌入;
将所述超边嵌入与所述顶点嵌入经过第二长短期记忆网络,得到第二用户嵌入与第二项目嵌入。
可选地,所述方法还包括:
确定每一用户对每一项目的实际得分;
根据所述预测得分、所述实际得分以及预设的目标函数重新确定每一用户对每一项目的预测得分。
可选地,所述根据所述预测得分、所述实际得分以及预设的目标函数重新确定每一用户对每一项目的预测得分,包括:
根据所述预测得分与所述实际得分间绝对误差的平均值,所述预测得分与所述实际得分间平方差的平均值的平方根,以及所述目标函数重新确定每一用户对每一项目的预测得分;
所述目标函数的表达式为
Figure BDA0004141669910000021
其中,τ表示成对训练数据,rui为用户u在项目i上的预测得分,Θ表示所有模型参数,σ(·)表示sigmoid函数,λ表示正则化参数。
可选地,所述超图的构建过程包括:
根据用户购买同一项目构建第一超图;
根据购买同一项目的用户集构建第二超图;
根据具备社交关系的用户购买同一项目构建第三超图;
根据不具备社交关系的用户购买同一项目构建第四超图;
根据用户间的社交关系构建第五超图。
本发明实施例的另一方面还提供了一种基于动态超图表示学习的社交推荐装置,包括:
超图获取单元,用于获取多个超图,每个超图根据若干个用户和若干个项目在设定时间段内的关联关系确定;其中,用户和项目作为超图的节点,用户间的社交关系,以及用户与项目间的购买关系作为超图的超边;
嵌入获取单元,用于将所述多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入;
推荐预测单元,用于根据所述用户嵌入和所述项目嵌入确定每一用户对每一项目的预测得分。
本发明实施例的另一方面还提供了一种电子设备,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现上述的方法。
本发明实施例的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现上述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的方法。
本发明获取多个设定时间段内对应的超图,并将多个超图分别输入超图卷积神经网络和注意力神经网络,在社交推荐使时考虑了时间推移对用户与用户、用户与项目间的关系影响,即用户的身份与兴趣和项目的吸引力可能会动态的发生变化,根据用户嵌入和项目嵌入确定每一用户对每一项目的预测得分,可以确定每一用户对每一项目的喜欢程度,从而作出推荐,本发明提高了社交推荐的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于动态超图表示学习的社交推荐方法的流程示意图;
图2为本发明实施例提供的一种基于动态超图表示学习的社交推荐方法的示例流程图;
图3为本发明实施例提供的各变量及其含义的说明图;
图4为本发明实施例提供的一种社交关系的示例图;
图5为本发明实施例提供的另一种社交关系的示例图;
图6为本发明实施例提供的一种社交推荐网络的图结构和超图;
图7为本发明实施例提供的一种用户项目超图结构示意图;
图8为本发明实施例提供的一种基于动态异质超图表示学习的社交推荐模型的结构图;
图9为本发明实施例提供的一种基于动态超图表示学习的社交推荐装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,本发明实施例提供了一种基于动态超图表示学习的社交推荐方法,具体包括以下步骤:
S100:获取多个超图,每个超图根据若干个用户和若干个项目在设定时间段内的关联关系确定;其中,用户和项目作为超图的节点,用户间的社交关系,以及用户与项目间的购买关系作为超图的超边。
具体的,多个超图的构建过程可以包括:
S1、根据用户购买同一项目构建第一超图。
S2、根据购买同一项目的用户集构建第二超图。
S3、根据具备社交关系的用户购买同一项目构建第三超图。
S4、根据不具备社交关系的用户购买同一项目构建第四超图。
S5、根据用户间的社交关系构建第五超图。
考虑到时间推移对用户与用户、用户与项目间的关系影响,本发明可以先确定一个设定的时间段,例如一个月或三个月,再对每个设定时间段内的用户和项目的关联关系构建上述的五个超图,进而获取连续多个设定时间段内的超图。
S110:将所述多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入。
具体的,得到用户嵌入和项目嵌入的过程可以包括:
S1、将所述多个超图输入超图卷积神经网络并经过第一长短期记忆网络,得到第一用户嵌入与第一项目嵌入。
具体的,利用所述超图卷积神经网络计算每一超图各顶点间的转移概率,以使每一顶点的嵌入在所述超图卷积神经网络的各层级间传递,并经过第一长短期记忆网络,得到第一用户嵌入与第一项目嵌入。
S2、将所述多个超图输入注意力神经网络并经过第二长短期记忆网络,得到第二用户嵌入与第二项目嵌入。
具体的,利用所述注意力神经网络中的注意力超边聚合模块,聚合有关超边的信息,生成超边嵌入;利用所述注意力神经网络中的注意力顶点聚合模块,聚合有关顶点的信息,生成顶点嵌入;将所述超边嵌入与所述顶点嵌入经过第二长短期记忆网络,得到第二用户嵌入与第二项目嵌入。
S120:根据所述用户嵌入和所述项目嵌入确定每一用户对每一项目的预测得分。
为了获得更优的预测推荐效果,本发明还可以包括:
S1、确定每一用户对每一项目的实际得分。
S2、根据所述预测得分、所述实际得分以及预设的目标函数重新确定每一用户对每一项目的预测得分。
具体的,根据所述预测得分与所述实际得分间绝对误差的平均值,所述预测得分与所述实际得分间平方差的平均值的平方根,以及所述目标函数重新确定每一用户对每一项目的预测得分。
所述目标函数的表达式为
Figure BDA0004141669910000051
其中,τ表示成对训练数据,rui为用户u在项目i上的预测得分,Θ表示所有模型参数,σ(·)表示sigmoid函数,λ表示正则化参数。
为了更详细描述本发明,接下来将以具体实例说明本发明的实际应用过程。
参照图2,本发明实施例提供了一种基于动态超图表示学习的社交推荐方法的示例流程图。参照图3,本发明实施例提供了以下过程使用的各变量及其含义的说明图。接下来将以7个部分介绍本发明实施例。
1.主要假设及问题描述。
项-项相似度、好友-用户和陌生人用户信息很难提取:两个朋友购买相同的物品,那么他们的关系比他们仅在社交上建立联系的关系更为重要。往往陌生人用户对同一产品的购买细节通常被忽略。如图4所示。
例如,如果两个朋友购买相同的物品,那么他们的关系比他们仅在社交上建立联系的关系更为重要。陌生人用户对同一产品的购买细节通常被忽略。图4证明了(A,B)和(D,F)具有很强的关系,由实线显示,因为它们具有社交联系并且也购买相同的产品,而(B,C),(D,E)和(E,F)只是由虚线显示的社交联系。相反,虚线显示的是(C,D),没有社交关系并购买相同物品的陌生人,往往C和D的购买细节通常被忽略。
用户的社交圈、兴趣和物品的吸引力可能发生变化:考虑到随着时间的推移,用户的兴趣和物品的吸引力可能会动态的发生变化,为了捕捉用户-项目之间这种关系,相应地描绘出随着时间的推移,用户的社交圈和项目的吸引力会发生动态的变化,从而导致用户与用户,用户与项目、项目与项目之间关系发生相应的变化,如图5所示。
图5展示了一个激励性的例子,即用户的兴趣和项目的吸引力可能会随着时间的推移而改变,并受其关系的影响。在用户方面,现实生活,用户A是的社交圈会随着自己的升学、就业、跳槽而发生变化。在项目方面,项目可能会向用户展示类似的模式。用户对物品的关注度力也会随着时间而改变,如世界杯期间,用户对足球的关注度就逐渐上升,而当世界杯的热潮过去,足球的热度也会慢慢的回归平静。因此,除了考虑项目之间的相关性外,还应考虑项目随时间的吸引力。总体而言,交互表示可以指用户的兴趣和项目的吸引力。关系影响是指用户的社交影响和项目的相关影响。
因此,本发明实施例的社交推荐问题可以定义为:给定观察到的包含用户-项目交互和社交关系的动态异质超图,推荐者应该预测用户在用户-项目交互中的未知交互。即未观察到的项目vj、用户ui的评级值得分或者未观察到的候选项目vj,用户ui将点击的概率。
2.异质超图的定义。
一个超图H=V,E,其中V={v1,v2,···vN}和E={e1,e2,···eM},其中V表示超图的节点集合,E表示超图的边的集合,也称为超边。超边是节点的非空子集,与图不同,它可以连接多个节点。用于表示超图的关联矩阵
Figure BDA0004141669910000061
其中N和M分别由一组节点和超边表示。如果一个节点连接并且存在于超边中,则Hi=1,否则为0。图6描绘了用于社交推荐网络的图结构和超图。在图6左的示例中,社交关系和用户-项目是两个基本图。用户-项目二分图表示用户ui购买了项目vj。社交关系图说明了社交连接用户之间的联系。邻接矩阵P和U分别描述了基本图,用户-项目关系和社交关系。Pij=1,如果Ui购买了物品Vh,否则为0;同样,Uih=1,如果Ui和Uh有社交联系,否则为0。在图6右中,关联矩阵H用于描述用户-用户和用户-项目之间的链接的超图。如果节点Hi存在于超边中,则关联矩阵的输入为1;否则为0。为了简单起见,图6右仅使用两种超边。超图中e1、e2和e3分别代表一组用户购买的物品v1、v2和v3。超图中e4,e5,e6,e7和e8说明了朋友用户的社交联系。超边缘连接了超图中的几个节点,从而改善了高阶相关性。然而,简单的图形不能描述用户和项目之间的高阶复杂的相互关系。
在图6左中,二部图显示了用户和项目之间的关系。同样地,社交关系表示用户-用户链接。这两个图都用相应的邻接矩阵表示。图6右中,在右侧的超图上都有相同的数据。超图中显示了8条超边线(e1-e8)、5个用户(u1-u5)和3个项目(v1-v3)。超边缘e1表示用户u1和u2获得了项目v1。超边缘e2表示用户u3和u4购买了项目v2。超边缘e3表示用户u4和u5购买了项目v3。超边缘e4证明了用户u1是u2、u3、u4和u5的伙伴。超边缘的e5展示了u2与用户u1和u3的友谊。超边e6表示用户u3是用户u1和u2的朋友。超边e7表示用户u4是用户u1的朋友,而超边e8表示用户u5是用户u1的朋友。
3.超图卷积网络。
在超图中,卷积网络运算是估计顶点之间的转移概率,以便每个顶点的嵌入可以在GNN中传输。超图卷积网络定义为:
(X)(l+1)=σ(D-1/2HL-1HTD-1/2(X)(l)P) (1)
在公式(1)中,σ(·)是一个非线性激活函数。H是超图关联矩阵,(X)()是第l层顶点特征的嵌入。
Figure BDA0004141669910000071
其中P可训练参数被视为第l层和l+1层之间的矩阵(权重),其中/>
Figure BDA0004141669910000072
输入顶点在第l层的特征和/>
Figure BDA0004141669910000073
输入顶点在第(l+1)层特征。(X)()是第l+1层的输出。D表示超图中的顶点和L超边的度矩阵。D和L都是对角线矩阵。
H定义了顶点到超边的消息传递路径,其中超边被认为是列,顶点是关联矩阵中的行。HT指定了超边缘消息传递路径的顶点,其中顶点将是列,超边缘将是HT中的行。
首先,通过HT采集顶点特征,构造超边缘特征。然后,通过聚合关联的超边缘特征,通过H获得增强的顶点特征。最后一步,执行P模型训练和σ(·)非线性激活函数。
综上,超图卷积网络运算可以管理高阶相关性。
4.动态异质超图的构建。
对于超图的特殊结构,本发明实施例首先统一了用户-项目二部图和社交网络,以更准确地描述用户和项目之间的高阶关系,然后构建了动态异质超图。超图包括项目节点、用户节点和超边。超边表示不同类型节点之间的高阶关系。在本发明实施例中,本发明实施例设计了五个主题,这些主题指导超图创建框架来定义用户项和用户-用户网络中的适当结构。图7显示了超图中的图案。图8显示了该社交推荐的动态异质超图神经网络框架模型。
主题的第一种形式是“用户购买的一组物品”,本发明实施例将这种类型命名为用户主题。这可以识别强大的用户联系,并有助于定位用户兴趣社区。第二类是“购买商品的用户集”;本发明实施例将其命名为商品主题。这种类型的主题根据用户购买来识别项目-项目相似性。“朋友买了一件物品”和“陌生人买了一件物品”分别是第三和第四主题类别。本发明实施例将第三和第四个主题类型分别称为朋友和陌生人主题。最后一类是“社交关系”。此主题标识用户的朋友列表,本发明实施例将此类型命名为社交主题。
现有的研究定义了2M+N-M-N-1条超边,但在本发明实施例中,本发明实施例描述了M+N+f+s条超边,其中M和N表示项目数量和用户数量。相比之下,f和s分别代表friend和stranger用户的群体。与现有的超图模型相比,大大降低了本发明实施例提出的超图模型的时间复杂度。
此外,基于本发明实施例提出的异质超图结构中超边缘的五个不同类别的定义,它有助于为感兴趣的社区确定最佳的用户-用户和项目-项目关注,并预测未来的行为。在此步骤中,还计算了第i个超边的权重。公式(2)根据第i个超边的度计算其权重。超边缘的程度是超边缘中包含的节点数。
Figure BDA0004141669910000081
/>
其中deg(ei)定义了第i个超边缘的程度,max(deg(ei))和min(deg(e))分别是所有超边缘的最小和最大程度。
为了学习用户和项目表示,本发明实施例使用分而治之的策略。从五个主题类别构建的超图可以划分为相同数量的超图,以说明如图5所示的高阶关系。这些超图由入射矩阵HUsers、HItems、HFriends、Hstr和HSocial表示。超图HUsers关联矩阵包含与“用户购买的物品集”相关的信息。在此超图中,用户是超边,所有项目都是节点。超图HItems关联矩阵包含与“购买物品的用户集合”相关的数据。该超图通过超级边缘表示项目,通过节点表示用户。超图HFriends关联矩阵包含了“朋友买了一件物品”的相关信息。在此超图中,超边表示项目,而节点表示社交链接的用户。超图Hstr关联矩阵包含与“没有社交联系但购买相同物品的用户”相关的信息。超图Hsocial关联矩阵提供了有关“社交链接用户”的信息。它列出了常见的熟人。
受光谱聚类的最新发展的启发,本发明实施例利用多层感知器(MLP)和softmax来计算用户或项目的超边缘分配。每个用户euk或项目eik表示对应超图关联矩阵H的kth
Huser=softmax(ReLU(EuserWuser,1)Wuser,2) (3)
Hitem=softmax(ReLU(EitemWitem,1)Witem,2) (4)
其中W是学习K超边的可训练权重矩阵。softmax用于概率地将一个节点分配给许多超边。所有五种类型的超图都使用相同的动态超图学习。学习超图后,如公式(1)中所述,使用光谱超图卷积。修改后的公式(5)至(9)对应于特定的超图来定义超图卷积:
Figure BDA0004141669910000091
Figure BDA0004141669910000092
Figure BDA0004141669910000093
Figure BDA0004141669910000094
Figure BDA0004141669910000095
从公式(5)到(9)获得超图特定的嵌入。学习在公式(5)中的特定超图Huser中编码的高阶信息的用户表示。矩阵乘法HuserXuser ()将消息从节点传播到超边,然后是Xuser的预乘法,以聚合超边信息并更新节点。
在本节中,本发明实施例学习了超图卷积如何帮助构造超图并捕获更高阶的信息,例如项目-项目相似性,朋友和陌生人用户,以及用户或项目沿着超边缘聚集在一起的各种方式。多个用户表示
Figure BDA0004141669910000096
和项目表示/>
Figure BDA0004141669910000097
是通过超图卷积的lth层获得的。在公式(10)和(11)中,可以通过连接来自每一层的表示来制定最终表示。
Figure BDA0004141669910000098
Figure BDA0004141669910000099
其中,||表示一个连接操作。
朋友、陌生人和社交超图卷积遵循相同的过程,它们的最终表示可以通过连接每一层的表示来组合。朋友、陌生人和社交是最后的代表,分别由Xfriend、Xstr和Xsocial表示。用户特性Xu是通过结合Xuser和Xsocial表示结果来创建的。类似地,项目聚合器Xi结合了Xitem、Xstr和Xfriend的结果来提供潜在的项目特性。
5.超图注意力网络。
本发明实施例采用超图注意力网络(HGAT)。HGAT包括两个主要组件:注意力超边缘聚合模块(AHA)和注意力顶点聚合模块(AVA)。AHA聚合有关超边的信息,而AVA聚合有关节点的信息。注意力网络接收所有五个子超图的节点嵌入矩阵和超边缘嵌入矩阵作为输入。
AVA通过聚合有关连接节点的信息来生成超边缘嵌入。本发明实施例使用可训练权重矩阵W来转换节点和超边缘特征。然后在公式(12)中计算节点i(vi)与超边j(ej)之间的系数矩阵。
Figure BDA0004141669910000101
其中a是共享注意力机制,Ni是连接到节点i的一组超边,W是线性变换权重矩阵。
包含“购买物品的用户集合”信息的超图Hitem用于学习精确的物品嵌入,节点表示vi(用户),超边代表ej(物品),而包含“用户购买的物品集”信息的超图Huser用于学习用户的嵌入向量。下一层用户的节点vi信息是从超边ej信息中获知的。通过使用非线性ReLU和softmax函数获得等式(12)中的注意力系数矩阵COE,其中coeij∈[0,1]。在公式(13)中计算系数矩阵。
COE=H·softmax(ReLU(VW)(EW)T) (13)
其中,H为超边缘关联矩阵(节点-超边缘关系矩阵),
Figure BDA0004141669910000102
为节点特征矩阵,
Figure BDA0004141669910000103
为超边缘特征矩阵。N和M分别表示节点数和超边数。在关联矩阵Huser中,项目是节点,用户的项目-用户矩阵被视为超边。最后,本发明实施例通过使用公式(13)中定义的系数矩阵COE来计算公式(14)中连接节点的加权和。
Efeatures=σ[(COE)TV] (14)
其中σ为激活函数。因此,通过使用公式(14),本发明实施例可以计算出Efeatures超边特征。例如在超图Huser和Hitem中,特性分别是用户Eu和项目Ei。相同的过程用于计算AHA模块的节点功能。使用公式(15)计算超边缘-顶点注意力系数矩阵。
COE=H·softmax(ReLU(EW)(VW)T) (15)
为了生成节点特征,本发明实施例可以应用公式(16)中的COE。
Efeatures=σ[(COE)TE] (16)
HGAT通过聚合连接的节点的特征来生成超边缘特征,这些特征也会考虑超边缘特征进行更新。HGAT可以使用这种节点-超边缘-节点转换方法有效地定义数据中的高阶关系。相同的方法用于获得所有五种类型的分裂超图的节点和超边缘特征。
超图注意力网络的主要目标是获得可以揭示超边之间关系的关联矩阵。人们关注一定数量的社交关系,不能有无穷无尽的社交联系。从社交推荐的角度来看,关注的一个基本模拟是,如果两个用户购买了相似的产品列表,则它们之间的关注度很高。否则,注意力就会低。
公式(17)计算超边ei与ej之间的注意力分数。
Figure BDA0004141669910000111
其中sim(·)根据公共节点计算超边ei和ej的相似度。注意力关系集中在用户的子集上,这也提高了建议框架的效率。
如果两个超边没有共享公共节点,则注意力将为0。另外,
Figure BDA0004141669910000112
和/>
Figure BDA0004141669910000113
并没有受到同样的关注。例如,用户,u1对用户u2也购买或喜欢的产品列表感兴趣,但用户u2无需分享此兴趣。因此,“注意力”识别用户兴趣组并估计项目-项目和用户-用户相似性。它计算用户-用户,项目-项目,用户-项目,朋友用户和陌生人用户的注意力。为了计算节点的注意力系数,本发明实施例应用公式(18):
vj=wT[sim(xi||yj)] (18)
w在公式(2)中定义,xi和yj是两个顶点,而||则作为向量级联算子。使用超边,可以通过用户和条目关注度获得超图信息。超图卷积可以与注意力矩阵一起使用,以学习逐层嵌入。利用超图卷积中使用的X(l)和P,超图注意力矩阵将梯度传播到入射矩阵。
本发明实施例主要研究高阶用户关系(用户-用户,陌生人用户和朋友用户)和用户-项目交互,以学习用户和项目嵌入向量。因此,注意力运算符用于聚合任何超边缘节点的信息,无论是用户(陌生人,朋友)还是项目。使用第l层,本发明实施例可以获得用户和项目潜在特征的向量。
6.用户表征和项目表征的聚合。
该框架的优势在于用户和项目以相同的方式聚合,但又是分开进行的。将超图卷积和超图注意力网络的结果先进行动态表示再结合,以识别潜在的用户和物品特征。超图卷积网络中的用户和项目表示为Xu和Xi,而注意力网络中最终用户和项目表示为Eu和Ei。为了捕获动态表示,本发明实施例将RNN用于序列建模,因为其具有良好的序列数据建模能力。具体而言,在公式(19)到(22)中,本发明实施例的方法中应用了长短期记忆(LSTM)网络:
Yu=LSTM(Xu) (19)
Yi=LSTM(Xi) (20)
Fu=LSTM(Eu) (21)
Fi=LSTM(Ei) (22)
在公式(23)到(24)中,Ou是最终的用户特征,Oi是最终的物品特征。
Figure BDA0004141669910000121
Figure BDA0004141669910000122
最后,在公式(25)中,本发明实施例使用内积来评估用户uj对预期物品ik的喜欢程度:
Figure BDA0004141669910000123
7.模型优化。
模型优化需要目标函数。本发明实施例采用成对的逻辑优化方法。它假定特定用户u比未观察到的项目i更喜欢观察到的项目j,因此观察到的项目i应该排名靠前。此外,作为损失函数,在公式(26)中,本发明实施例利用成对贝叶斯个性化排名:
Figure BDA0004141669910000124
其中,τ表示成对训练数据,rui为用户u在项目i上的预测得分,Θ表示所有模型参数,σ(·)表示sigmoid函数。为了避免过拟合,使用正则化参数λ。
最后,本发明实施例使用平均绝对误差(MAE)和均方根误差(RMSE)作为评级预测的度量,以评估上述模型的性能。MAE是预测值与实际值之间绝对误差的平均值,RMSE是预测值与实际值之间的平方差的平均值的平方根。
Figure BDA0004141669910000125
Figure BDA0004141669910000126
MAE和RMSE值越小,表明预测精度越高,推荐性能越好。
参照图9,本发明实施例提供了一种基于动态超图表示学习的社交推荐装置,包括:
超图获取单元,用于获取多个超图,每个超图根据若干个用户和若干个项目在设定时间段内的关联关系确定;其中,用户和项目作为超图的节点,用户间的社交关系,以及用户与项目间的购买关系作为超图的超边;
嵌入获取单元,用于将所述多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入;
推荐预测单元,用于根据所述用户嵌入和所述项目嵌入确定每一用户对每一项目的预测得分。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置)、便携式计算机盘盒(磁装置)、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编辑只读存储器(EPROM或闪速存储器)、光纤装置以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

Claims (10)

1.一种基于动态超图表示学习的社交推荐方法,其特征在于,包括:
获取多个超图,每个超图根据若干个用户和若干个项目在设定时间段内的关联关系确定;其中,用户和项目作为超图的节点,用户间的社交关系,以及用户与项目间的购买关系作为超图的超边;
将所述多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入;
根据所述用户嵌入和所述项目嵌入确定每一用户对每一项目的预测得分。
2.根据权利要求1所述的一种基于动态超图表示学习的社交推荐方法,其特征在于,所述将所述多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入,包括:
将所述多个超图输入超图卷积神经网络并经过第一长短期记忆网络,得到第一用户嵌入与第一项目嵌入;
将所述多个超图输入注意力神经网络并经过第二长短期记忆网络,得到第二用户嵌入与第二项目嵌入。
3.根据权利要求2所述的一种基于动态超图表示学习的社交推荐方法,其特征在于,所述将所述多个超图输入超图卷积神经网络并经过第一长短期记忆网络,得到第一用户嵌入与第一项目嵌入,包括:
利用所述超图卷积神经网络计算每一超图各顶点间的转移概率,以使每一顶点的嵌入在所述超图卷积神经网络的各层级间传递,并经过第一长短期记忆网络,得到第一用户嵌入与第一项目嵌入。
4.根据权利要求2所述的一种基于动态超图表示学习的社交推荐方法,其特征在于,所述将所述多个超图输入注意力神经网络并经过第二长短期记忆网络,得到第二用户嵌入与第二项目嵌入,包括:
利用所述注意力神经网络中的注意力超边聚合模块,聚合有关超边的信息,生成超边嵌入;
利用所述注意力神经网络中的注意力顶点聚合模块,聚合有关顶点的信息,生成顶点嵌入;
将所述超边嵌入与所述顶点嵌入经过第二长短期记忆网络,得到第二用户嵌入与第二项目嵌入。
5.根据权利要求1所述的一种基于动态超图表示学习的社交推荐方法,其特征在于,所述方法还包括:
确定每一用户对每一项目的实际得分;
根据所述预测得分、所述实际得分以及预设的目标函数重新确定每一用户对每一项目的预测得分。
6.根据权利要求1所述的一种基于动态超图表示学习的社交推荐方法,其特征在于,所述根据所述预测得分、所述实际得分以及预设的目标函数重新确定每一用户对每一项目的预测得分,包括:
根据所述预测得分与所述实际得分间绝对误差的平均值,所述预测得分与所述实际得分间平方差的平均值的平方根,以及所述目标函数重新确定每一用户对每一项目的预测得分;
所述目标函数的表达式为
Figure FDA0004141669870000021
其中,τ表示成对训练数据,rui为用户u在项目i上的预测得分,Θ表示所有模型参数,σ(·)表示sigmoid函数,λ表示正则化参数。
7.根据权利要求1至6任一项所述的一种基于动态超图表示学习的社交推荐方法,其特征在于,所述超图的构建过程包括:
根据用户购买同一项目构建第一超图;
根据购买同一项目的用户集构建第二超图;
根据具备社交关系的用户购买同一项目构建第三超图;
根据不具备社交关系的用户购买同一项目构建第四超图;
根据用户间的社交关系构建第五超图。
8.一种基于动态超图表示学习的社交推荐装置,其特征在于,包括:
超图获取单元,用于获取多个超图,每个超图根据若干个用户和若干个项目在设定时间段内的关联关系确定;其中,用户和项目作为超图的节点,用户间的社交关系,以及用户与项目间的购买关系作为超图的超边;
嵌入获取单元,用于将所述多个超图分别输入超图卷积神经网络和注意力神经网络,并经过长短期记忆网络,得到用户嵌入和项目嵌入;
推荐预测单元,用于根据所述用户嵌入和所述项目嵌入确定每一用户对每一项目的预测得分。
9.一种电子设备,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至7中任一项所述的方法。
CN202310291550.2A 2023-03-21 2023-03-21 一种基于动态超图表示学习的社交推荐方法 Pending CN116204723A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310291550.2A CN116204723A (zh) 2023-03-21 2023-03-21 一种基于动态超图表示学习的社交推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310291550.2A CN116204723A (zh) 2023-03-21 2023-03-21 一种基于动态超图表示学习的社交推荐方法

Publications (1)

Publication Number Publication Date
CN116204723A true CN116204723A (zh) 2023-06-02

Family

ID=86515808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310291550.2A Pending CN116204723A (zh) 2023-03-21 2023-03-21 一种基于动态超图表示学习的社交推荐方法

Country Status (1)

Country Link
CN (1) CN116204723A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541716A (zh) * 2023-07-06 2023-08-04 深圳须弥云图空间科技有限公司 基于序列图和超图的推荐模型训练方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541716A (zh) * 2023-07-06 2023-08-04 深圳须弥云图空间科技有限公司 基于序列图和超图的推荐模型训练方法及装置
CN116541716B (zh) * 2023-07-06 2024-04-16 深圳须弥云图空间科技有限公司 基于序列图和超图的推荐模型训练方法及装置

Similar Documents

Publication Publication Date Title
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN111611472A (zh) 一种基于图卷积神经网络的捆绑推荐方法及系统
CN113256367B (zh) 用户行为历史数据的商品推荐方法、系统、设备及介质
CN111127142A (zh) 一种基于广义神经注意力的物品推荐方法
CN115082142A (zh) 一种基于异构关系图神经网络的推荐方法、装置及介质
CN114036406A (zh) 一种基于图对比学习和社交网络增强的推荐方法及系统
KR102072820B1 (ko) 정책망 및 가치망을 이용한 온라인 쇼핑몰에서의 프로모션 이미지 수정 장치
CN114386513A (zh) 一种集成评论与评分的交互式评分预测方法及系统
Dunning Competing notions of search for home: behavioural economics and housing markets
Ahamed et al. A recommender system based on deep neural network and matrix factorization for collaborative filtering
CN116204723A (zh) 一种基于动态超图表示学习的社交推荐方法
CN115760271A (zh) 基于图神经网络的机电商品个性化推荐方法和系统
Sridhar et al. Content-Based Movie Recommendation System Using MBO with DBN.
KR102161294B1 (ko) 정책망 및 가치망을 이용한 온라인 쇼핑몰에서의 프로모션 성과 예측 및 추천 장치
KR20230069578A (ko) 그래프 신경망을 이용한 부호 인지 추천 장치 및 방법
CN113761388A (zh) 一种推荐方法、装置、电子设备及存储介质
CN113590976A (zh) 一种空间自适应图卷积网络的推荐方法
CN113763095A (zh) 信息推荐方法、装置和模型训练方法、装置
CN112559904A (zh) 一种基于门机制和多模态图网络的会话社交推荐方法
CN113449176A (zh) 基于知识图谱的推荐方法及装置
CN114519600A (zh) 一种融合相邻节点方差的图神经网络ctr预估算法
CN116764236A (zh) 游戏道具推荐方法、装置、计算机设备和存储介质
CN113379494B (zh) 基于异质社交关系的商品推荐方法、装置和电子设备
CN113888238B (zh) 一种广告点击率预测方法、装置及计算机设备
CN113592609B (zh) 一种利用时间因素的个性化服饰搭配推荐方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination