CN113704439B - 一种基于多来源信息异构图的会话推荐方法 - Google Patents

一种基于多来源信息异构图的会话推荐方法 Download PDF

Info

Publication number
CN113704439B
CN113704439B CN202111035961.2A CN202111035961A CN113704439B CN 113704439 B CN113704439 B CN 113704439B CN 202111035961 A CN202111035961 A CN 202111035961A CN 113704439 B CN113704439 B CN 113704439B
Authority
CN
China
Prior art keywords
session
current
neighbor
conversation
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111035961.2A
Other languages
English (en)
Other versions
CN113704439A (zh
Inventor
顾盼
顾建锦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhiduo Network Technology Co ltd
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN202111035961.2A priority Critical patent/CN113704439B/zh
Publication of CN113704439A publication Critical patent/CN113704439A/zh
Application granted granted Critical
Publication of CN113704439B publication Critical patent/CN113704439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多来源信息异构图的会话推荐方法。该方法根据匿名用户当前会话,对用户的兴趣进行建模,来推荐用户在下一步最可能感兴趣的物品。主要由四个部分组成:第一部分是计算当前会话和会话集合中的会话之间的相似度,召回相似的邻居会话集合,再对邻居会话集合中的物品转移进行整理和过滤,过滤掉出现次数较少的物品转移关系,再结合当前会话构建两种语义边的异构图;第二部分是采用多来源信息门机制在异构图中对节点的两种语义邻居节点信息进行选择和融合,得到当前会话中物品的向量表征;第三部分是对当前会话中的物品序列进行表征,得到当前用户兴趣表征;第四部分是根据用户兴趣表征,预测用户在下一步最可能感兴趣的物品。

Description

一种基于多来源信息异构图的会话推荐方法
技术领域
本发明属于互联网服务技术领域,尤其是涉及一种基于多来源信息异构图的会话推荐方法。
背景技术
会话(Session)是一个时间段内用户的交互行为,基于会话的推荐是基于当前会话推荐用户下一个点击的物品。在实际场景中,有些用户是匿名登录,无法获取该用户的历史交互行为数据以及用户详细信息。因此,只能基于该匿名用户的当前会话给用户推荐感兴趣的物品。传统的会话推荐方法有基于物品的协同过滤(Item-KNN)推荐方法,该方法通过计算候选集中的物品和当前会话中物品的相似度,来给用户推荐最相似的物品。近些年出现了基于会话的协同过滤方法(Session-KNN),该方法将会话作为一个整体,通过计算会话之间的相似度来推荐。协同过滤算法忽略了会话中的物品转移关系,因此近些年更多的会话推荐方法中采用循环神经网络(RNN)或者循环神经网络(RNN)的变种,来学习会话中的物品序列信息。而基于循环神经网络的方法只能学习到会话中紧邻着的上一个物品到下一个物品的转移关系,而忽视了在同一个会话中物品的上下文关系。因此中科院的学者在2019年提出把当前会话建立为一个图(Graph),来捕捉更当前会话中更丰富的物品转移关系,该方法名为用图神经网络进行会话推荐(SR-GNN)。但是该方法的图只是基于当前会话建立的,一个会话中物品的个数以及同一物品重复出现的次数都限制了该方法的效果。
因此,本方法提出一种基于多来源信息异构图的会话推荐方法。本方法基于当前会话,从最近会话序列中抽取较相似的邻居会话集合。然后,对邻居会话集合中的物品转移关系进行整理和过滤,过滤掉出现次数较少的物品转移关系,得到物品的普遍转移关系。再结合当前会话构建异构图。异构图中的节点是当前会话和邻居会话集合中出现的物品,而边有两种类型:一种边来源于当前会话中物品转移关系,也就是代表当前用户的兴趣转移。另外一种边是邻居会话中的转移关系,代表着物品的普遍转移规律。也就是这两种边的数据来源不同,代表的语义也不同。构建好异构图后,在异构图中进行节点的信息传递,得到物品表征。该异构图中两种语义的边数量差异较大,代表物品普遍转移关系的边的数量往往比代表当前会话中物品转移关系的数量多,这给图中的节点信息传递带来了困难。本方法采用多来源信息门机制来处理不同来源的信息传递,最终得到物品的向量表征。异构图中的多来源信息门机制既解决异构图中两种语义的不均衡分布,又能将两种语义信息融合到异构图中的物品节点内。最后再用循环神经网络对当前会话进行表征,得到用户的兴趣表征,并进行物品推荐。该方法通过构建异构图,充分地挖掘出物品之间的转移关系。
发明内容
本发明所要解决的技术问题是给定用户的当前会话,对用户的兴趣进行建模,来推荐用户在下一步最可能感兴趣的物品。在实际推荐场景中,往往会遇到匿名用户登录并浏览的行为。此时,用户的个人信息和用户历史浏览的记录都缺失,推荐方法只能基于当前会话进行推荐。因此,训练数据极为稀疏。为了缓解会话推荐过程中的数据稀疏问题,本方法通过会话相似度计算,召回系统中和当前会话相似的邻居会话。捕捉邻居会话和当前会话中物品转移关系,来提高推荐方法的表现。为此,本发明采用以下技术方案:
一种基于多来源信息异构图的会话推荐方法,包括以下步骤:
根据用户当前会话中的物品序列,召回邻居会话集合。本方法采用记忆矩阵M存储最近发生的会话。基于当前会话s={v1,v2,…,v|s|},从记忆矩阵M中找出最相似的k个会话作为当前会话s的邻居会话集合Ns。本方法通过计算当前会话和记忆矩阵M中的候选会话之间的cosine相似度,筛选出邻居会话集合Ns,相似度计算公式如下:
Figure BDA0003246971550000011
其中,sj是记忆矩阵M中存储的任一会话。
Figure BDA0003246971550000027
是会话s的二进制向量表示,如果一个物品出现在会话中,那么s中对应位置为1,否则为0。同理,
Figure BDA0003246971550000028
是会话sj的二进制向量表示。l(s)和l(sj)分别代表了会话s和sj的长度。对于记忆矩阵M中存储的所有会话,用公式sim(s,sj)计算出和当前会话s的cosine相似度,把相似度低于阈值simthre的会话过滤掉,再按照cosine相似度由高到低排序,找出前k个会话作为当前会话s的邻居会话集合Ns。simthre设置小数值,可以增加推荐物品的多样性,simthre设置大数值,可以过滤掉更多的噪音。
对邻居会话集合进行处理,并结合用户当前会话构建异构图。异构图G中的节点为当前会话s和邻居会话集合Ns中出现的物品集合的并集。异构图G中的边是无向边,且存在两种语义的边:一种边来源于当前会话中物品转移关系,代表当前用户的兴趣转移。另外一种边来源于邻居会话中的物品转移关系,代表着物品的普遍转移规律。这两种边的数据来源不同,因此代表的语义也不同。当前会话s={v1,v2,…,v|s|}中的(vj-1,vj)为异构图G的边,表示点击物品vj-1之后,点击物品vj。同理,邻居会话集合Ns中的会话中也可以构建出异构图G的另一种语义的边。先对邻居会话集合Ns中会话里出现的所有边的次数进行统计,过滤掉出现次数小于ε的边。出现次数小于ε的边被认为不能代表物品的普遍转移关系。此时,异构图G中存在两种来源的边,在异构图的表示中,边使用标志φ∈{inner,outer}进行区分,分别表示来源为当前会话内部(inner session)和邻居会话集合(也就是当前会话外部outer session),代表的语义分别是当前用户兴趣转移和普遍物品转移规律。
基于异构图,采用多来源信息门机制得到当前会话中的物品向量表征。异构图中代表当前用户兴趣转移和代表普遍物品转移规律的边分布非常不均(imbalanced)。因此传统的图神经网络方法,如:GraphSAGE等无法应用在该场景下。如果将传统的图神经网络方法直接应用在该场景下,代表当前用户兴趣转移的边的影响会覆盖代表普遍物品转移规律的边的影响。并且传统的图神经网络方法,没法对这两种语义的边进行区分处理。这里,采用基于多来源信息门机制来进行异构图中的节点信息更新。异构图中有两种语义的边存在,因此对于目标物品节点vi,存在两种语义邻居节。采用多来源信息门机制对目标物品节点vi的两种语义邻居节点进行选择和汇集到目标物品节点vi中。注意,这里的目标物品节点vi属于当前会话中出现的物品,也就是只需要对出现在当前会话中的物品节点进行向量更新。目标物品节点vi的最终向量表征xi更新公式如下:
Figure BDA0003246971550000021
Figure BDA0003246971550000022
Figure BDA0003246971550000023
Figure BDA0003246971550000024
Figure BDA0003246971550000025
Figure BDA0003246971550000026
其中,ci表示物品节点vi的下标,矩阵
Figure BDA0003246971550000029
存放所有物品的向量表征,所以通过
Figure BDA00032469715500000210
获得物品节点vi的向量表征vi
Figure BDA00032469715500000211
Figure BDA00032469715500000212
分别代表两种语义下的转换矩阵。将目标物品节点vi的两种语义下的邻居节点集合
Figure BDA00032469715500000213
Figure BDA00032469715500000214
分别汇聚成两种语义下的邻居信息向量
Figure BDA00032469715500000222
Figure BDA00032469715500000223
Figure BDA00032469715500000224
分别表示
Figure BDA00032469715500000215
集合和
Figure BDA00032469715500000216
集合的个数。然后用基于
Figure BDA00032469715500000220
和vi的多来源信息门机制得到门向量gi,门向量gi控制代表当前用户兴趣转移语义下的邻居信息向量
Figure BDA00032469715500000221
向量1-gi控制普遍物品转移语义下的邻居信息向量
Figure BDA00032469715500000217
得到
Figure BDA00032469715500000218
这里,
Figure BDA00032469715500000219
和Wg是转换矩阵,sigmoid是sigmoid函数。也就是,不同语义下的邻居节点信息的传递采用多来源信息门机制来控制,而多来源信息门机制的信息输入是不同语义下的邻居和目标节点本身。最后,
Figure BDA00032469715500000225
和目标节点的原来向量表征vi进行连接,并采用转换矩阵Wx转化成新的目标节点向量xi,这里||表示向量的连接操作。
根据用户当前会话中物品序列,获得用户兴趣表征。得到所有物品的向量表征之后,采用门控制循环神经网络(GRU)对用户当前会话s={v1,v2,…,v|s|}进行表征,得到会话表征,即用户当前兴趣表征:
zi=σ(Wxz·xi+Whz·hi-1)
ri=σ(Wxr·xi+Whr·hi-1)
Figure BDA0003246971550000031
Figure BDA0003246971550000032
其中,ri是重置门(resetgate),zi为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。
Figure BDA0003246971550000033
是当前记忆内容。xi是当前层的节点输入。Wxz、Whz、Wxr和Whr分别是控制更新门zi和重置门ri的参数。Wxh和Whh是控制前记忆内容
Figure BDA0003246971550000034
的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。门控制循环神经网络(GRU)的最后一个隐藏层的输出h|s|就是该会话表征,即用户当前兴趣表征p。
根据用户兴趣表征,推荐物品。将物品vj的向量vj乘以用户兴趣向量p,再应用softmax函数计算出物品vj的分数:
Figure BDA0003246971550000035
其中,p代表用户的兴趣向量,
Figure BDA00032469715500000311
代表物品vj成为下一个交互物品的可能性。同时根赫
Figure BDA0003246971550000036
的对数似然函数值,计算损失函数:
Figure BDA0003246971550000037
其中,yj代表vj的one-hot编码,
Figure BDA0003246971550000038
函数用梯度下降法来最优化。
本发明的有益技术效果如下:
(1)本发明基于当前会话,找出和当前会话相似的邻居会话集合。并从中挖掘出和当前会话中物品相关的普遍物品转移关系。在一定程度上缓解了数据的稀疏性,提升了推荐的准确度。
本发明基于当前会话中的物品转移关系和邻居会话中的物品普遍转移关系,构建出包含两种语义边的异构图。并在对图结构信息建模时,采用多来源信息门机构对两种语义信息进行控制。既解决异构图中两种语义的不均衡分布,又能将两种语义信息融合到异构图中的物品节点内。
附图说明
图1为本发明一种基于多来源信息异构图的会话推荐方法的流程示意图;
图2为本发明一种基于多来源信息异构图的会话推荐方法的模型框架图。
具体实施方式
为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种基于多来源信息异构图的会话推荐方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。
首先,需要对用到的变量和公式给出相关定义。
定义1.V:物品集合,且V={v1,v2,…,v|V|},|V|代表物品集合中物品的数量。
定义2.s:当前会话,会话是一个时间段里的物品集合s={v1,v2,…,v|s|},|s|代表会话中物品的数量。
定义3.S:系统中的会话集合,S={s1,s2,…,s|S|},|S|代表会话集合中会话的数量。
定义4.Ns:会话s的邻居会话集合。
定义5.G:基于用户当前会话s和邻居会话集合Ns,构造出的异构图。
定义6.
Figure BDA0003246971550000039
异构图G中第i个节点的在φ语义下的邻居节点,φ∈{inner,outer}。
定义7.
Figure BDA00032469715500000310
物品vj的向量表征。
定义8.P:当前会话的向量表征,也代表着用户兴趣向量表征。
结合以上变量定义,将最终的问题定义为:给定用户的当前会话s,会话推荐方法对用户的兴趣进行建模,来推荐用户在下一步最可能感兴趣的物品,物品是集合V的子集。
为此,本发明提出了一种基于多来源信息异构图的会话推荐方法。模型如图2所示,模型主要由四个模块组成。第一个模块是构建异构图,先计算当前会话和会话集合中的会话之间的相似度,召回相似的邻居会话集合。再对邻居会话集合中的物品转移关系进行整理和过滤,过滤掉出现次数较少的物品转移关系。然后结合当前会话构建异构图。异构图中的图节点是当前会话和邻居会话集合中出现的物品,而边有两种类型:一种边来源于当前会话中物品转移关系,也就是代表当前用户的兴趣转移。另外一种边是邻居会话中的转移关系,代表着物品的普遍转移规律。也就是这两种边的数据来源不同,因此代表的语义也不同。第二个模块是在异构图中进行节点的信息传递,从而得到物品表征。该异构图中的两种来源的边数量差异较大,代表物品普遍转移关系的边的数量往往比代表当前会话中物品转移关系的数量多,这给图中的节点信息传递带来了困难。本模块采用门机制来处理不同来源的信息传递,最终得到物品的向量表征。第三个模块是兴趣抽取模块,得到物品向量表征之后,本方法采用循环神经网络对当前会话中的物品序列进行表征,得到会话的向量表征,也就是当前用户的兴趣表征。最后一个模块是根据得到的用户兴趣表征进行物品推荐。
如图1所示,本发明的一个实施例包括如下步骤:
S100,根据用户当前会话中的物品序列,召回邻居会话集合。根据研究表明,最近发生的会话信息价值最高,比如电商场景中服饰、水果等都和时间有密切联系。本方法采用记忆矩阵M存储最近发生的会话,在本方法综合考虑算法效果和存储压力,设置记忆矩阵M存储的会话序列个数为10000。基于当前会话s={v1,v2,…,v|s|},从记忆矩阵M中找出最相似的k个会话作为当前会话s的邻居会话集合Ns。其中,k的取值为256。本方法通过计算当前会话和记忆矩阵M中的候选会话之间的cosine相似度,筛选出邻居会话集合Ns,相似度计算公式如下:
Figure BDA0003246971550000041
其中,sj是记忆矩阵M中存储的任一会话。
Figure BDA0003246971550000042
是会话s的二进制向量表示,如果一个物品出现在会话中,那么s中对应位置为1,否则为0。同理,
Figure BDA0003246971550000043
是会话sj的二进制向量表示。l(s)和l(sj)分别代表了会话s和sj的长度。对于记忆矩阵M中存储的所有会话,用公式sim(s,sj)计算出和当前会话s的cosine相似度,把相似度低于阈值simthre的会话过滤掉,再按照cosine相似度由高到低排序,找出前k个会话作为当前会话s的邻居会话集合Ns。simthre设置小数值,可以增加推荐物品的多样性,simthre设置大数值,可以过滤掉更多的噪音。这里,simthre设置为0.3,k设置为256。
S200,对邻居会话集合进行处理,并结合用户当前会话构建异构图。从上一步骤中,已经得到用户当前会话s的邻居会话集合Ns。异构图G中的节点为当前会话s和邻居会话集合Ns中出现的物品集合的并集。异构图G中的边是无向边,且存在两种语义的边:一种边来源于当前会话中物品转移关系,代表当前用户的兴趣转移。另外一种边来源于邻居会话中的物品转移关系,代表着物品的普遍转移规律。这两种边的数据来源不同,因此代表的语义也不同。当前会话s={v1,v2,…,v|s|}中的(vj-1,vj)为异构图G的边,表示点击物品vj-1之后,点击物品vj。同理,邻居会话集合Ns中的会话中也可以构建出异构图G的另一种语义的边。先对邻居会话集合Ns中的会话中出现的所有边出现的次数进行统计,过滤掉出现次数小于ε的边。出现次数小于ε的边被认为不能代表物品的普遍转移关系。这里ε设置为5。此时,异构图G中存在两种来源的边,在异构图的表示中,边使用标志φ∈{inner,outer}进行区分,分别表示来源为当前会话内部(inner session)和邻居会话集合(也就是当前会话外部outer session),代表的语义分别是当前用户兴趣转移和普遍物品转移规律。
S300,基于异构图,采用多来源信息的门机制得到当前会话中的物品向量表征。异构图中代表当前用户兴趣转移和代表普遍物品转移规律的边分布非常不均(imbalanced)。因此传统的图神经网络方法,如:GraphSAGE等无法应用在该场景下。如果将传统的图神经网络方法直接应用在该场景下,代表当前用户兴趣转移的边的影响会覆盖代表普遍物品转移规律的边的影响。并且传统的图神经网络方法,没法对这两种语义的边进行区分处理。这里,采用基于多来源信息的门机制来进行异构图中的节点信息更新。目标节点vi的最终向量表征聚集(aggregate)了两种语义边连接的邻居节点的信息,而两种语义的邻居节点的信息传递由多来源信息的门机制来控制。注意,这里的目标节点vi属于当前会话中出现的物品,也就是只需要对出现在当前会话中的物品节点进行向量更新。目标节点vi的最终向量表征xi更新公式如下:
Figure BDA0003246971550000051
Figure BDA0003246971550000052
Figure BDA0003246971550000053
Figure BDA0003246971550000054
Figure BDA0003246971550000055
Figure BDA0003246971550000056
其中,ci表示物品节点vi的下标,矩阵
Figure BDA00032469715500000511
存放所有物品的向量表征,所以通过
Figure BDA00032469715500000512
获得物品节点vi的向量表征vi
Figure BDA00032469715500000513
Figure BDA00032469715500000514
分别代表两种语义下的转换矩阵。将目标物品节点vi的两种语义下的邻居节点集合
Figure BDA00032469715500000515
Figure BDA00032469715500000516
分别汇聚成两种语义下的邻居信息向量
Figure BDA00032469715500000517
Figure BDA00032469715500000518
Figure BDA00032469715500000519
分别表示
Figure BDA00032469715500000520
集合和
Figure BDA00032469715500000521
集合的个数。然后用基于
Figure BDA00032469715500000522
和vi的多来源信息门机制得到门向量gi,门向量gi控制代表当前用户兴趣转移语义下的邻居信息向量
Figure BDA00032469715500000523
向量1-gi控制普遍物品转移语义下的邻居信息向量
Figure BDA00032469715500000526
得到
Figure BDA00032469715500000525
这里,
Figure BDA00032469715500000524
和Wa是转换矩阵,sigmoid是sigmoid函数。也就是,不同语义下的邻居节点信息的传递采用多来源信息门机制来控制,而多来源信息门机制的信息输入是不同语义下的邻居和目标节点本身。最后,
Figure BDA00032469715500000527
和目标节点的原来向量表征vi进行连接,并采用转换矩阵Wx转化成新的目标节点向量xi,这里||表示向量的连接操作。
S400,根据用户当前会话中物品序列,获得用户兴趣表征。得到所有物品的向量表征之后,采用门控制循环神经网络(GRU)对用户当前会话s={v1,v2,…,v|s|}进行表征,得到会话表征,即用户当前兴趣表征:
zi=σ(Wxz·xi+Whz·hi-1)
ri=σ(Wxr·xi+Whr·hi-1)
Figure BDA0003246971550000057
Figure BDA0003246971550000058
其中,ri是重置门(resetgate),zi为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。
Figure BDA00032469715500000529
是当前记忆内容。xi是当前层的节点输入。Wxz、Whz、Wxr和Whr分别是控制更新门zi和重置门ri的参数。Wxh和Whh是控制前记忆内容
Figure BDA00032469715500000528
的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。门控制循环神经网络(GRU)的最后一个隐藏层的输出h|s|就是该会话表征,即用户当前兴趣表征p。
S500,根据用户兴趣表征,推荐物品。将物品vj的向量vj乘以用户兴趣向量p,再应用soffmax函数计算出物品vj的分数:
Figure BDA0003246971550000059
其中,p代表用户的兴趣向量,
Figure BDA00032469715500000531
代表物品vj成为下一个交互物品的可能性。同时根据
Figure BDA00032469715500000530
的对数似然函数值,计算损失函数:
Figure BDA00032469715500000510
其中,yj代表vj的one-hot编码,
Figure BDA00032469715500000532
函数用梯度下降法来最优化。
上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (2)

1.一种基于多来源信息异构图的会话推荐方法,其特征在于:
根据用户当前会话中的物品序列,召回邻居会话集合;本方法采用记忆矩阵M存储最近发生的会话;基于当前会话s={v1,v2,…,v|s|},从记忆矩阵M中用cosine相似度找出最相似的k个会话作为当前会话s的邻居会话集合Ns,cosine相似度计算公式如下:
Figure FDA0003246971540000011
其中,sj是记忆矩阵M中存储的任一会话;
Figure FDA0003246971540000012
是会话s的二进制向量表示,如果一个物品出现在会话中,那么s中对应位置为1,否则为0;同理,
Figure FDA0003246971540000013
是会话sj的二进制向量表示;l(s)和l(sj)分别代表了会话s和sj的长度;对于记忆矩阵M中存储的所有会话,用公式sim(s,sj)计算出和当前会话s的cosine相似度,把相似度低于阈值simthre的会话过滤掉,再按照cosine相似度由高到低排序,找出前k个会话作为当前会话s的邻居会话集合Ns;simthre设置小数值,可以增加推荐物品的多样性,simthre设置大数值,可以过滤掉更多的噪音;
对邻居会话集合进行处理,并结合用户当前会话构建异构图;异构图G中的节点为当前会话s和邻居会话集合Ns中出现的物品集合的并集;异构图G中的边是无向边,且存在两种语义的边:一种边来源于当前会话中物品转移关系,代表当前用户的兴趣转移;另外一种边来源于邻居会话中的物品转移关系,代表着物品的普遍转移规律;这两种边的数据来源不同,因此代表的语义也不同;当前会话s={v1,v2,…,v|s|}中的(vj-1,vj)为异构图G的边,表示点击物品vj-1之后,点击物品vj;同理,邻居会话集合Ns中的会话中也可以构建出异构图G的另一种语义的边;先对邻居会话集合Ns中会话里出现的所有边的次数进行统计,过滤掉出现次数小于ε的边;出现次数小于ε的边被认为不能代表物品的普遍转移关系;此时,异构图G中存在两种来源的边,在异构图的表示中,边使用标志φ∈{inner,outer}进行区分,分别表示来源为当前会话内部和邻居会话集合,代表的语义分别是当前用户兴趣转移和普遍物品转移规律;
基于异构图,采用多来源信息门机制得到当前会话中的物品向量表征;异构图中有两种语义的边存在,因此对于目标物品节点vi,存在两种语义邻居节点;采用多来源信息门机制对目标物品节点vi的两种语义邻居节点进行选择和汇集到目标物品节点vi中;注意,这里的目标物品节点vi属于当前会话中出现的物品,也就是只需要对出现在当前会话中的物品节点进行向量更新;目标节点vi的最终向量表征xi更新公式如下:
Figure FDA0003246971540000014
Figure FDA0003246971540000015
Figure FDA0003246971540000016
Figure FDA0003246971540000017
Figure FDA0003246971540000018
Figure FDA0003246971540000019
其中,ci表示物品节点vi的下标,矩阵
Figure FDA00032469715400000110
存放所有物品的向量表征,所以通过
Figure FDA00032469715400000111
获得物品节点vi的向量表征vi
Figure FDA00032469715400000112
Figure FDA00032469715400000113
分别代表两种语义下的转换矩阵;将目标物品节点vi的两种语义下的邻居节点集合
Figure FDA00032469715400000114
Figure FDA00032469715400000115
分别汇聚成两种语义下的邻居信息向量
Figure FDA00032469715400000116
Figure FDA00032469715400000117
Figure FDA00032469715400000118
分别表示
Figure FDA00032469715400000119
集合和
Figure FDA00032469715400000120
集合的个数;然后用基于
Figure FDA00032469715400000121
和vi的多来源信息门机制得到门向量gi,门向量gi控制代表当前用户兴趣转移语义下的邻居信息向量
Figure FDA00032469715400000122
向量1-gi控制普遍物品转移语义下的邻居信息向量
Figure FDA00032469715400000123
得到
Figure FDA00032469715400000124
这里,
Figure FDA00032469715400000125
和Wg是转换矩阵,sigmoid是sigmoid函数;也就是,不同语义下的邻居节点信息的传递采用多来源信息门机制来控制,而多来源信息门机制的信息输入是不同语义下的邻居和目标节点本身;最后,
Figure FDA00032469715400000126
和目标节点的原来向量表征vi进行连接,并采用转换矩阵Wx转化成新的目标节点向量xi,这里||表示向量的连接操作;
根据用户当前会话中物品序列,获得用户兴趣表征;得到所有物品的向量表征之后,采用门控制循环神经网络(GRU)对用户当前会话s={v1,v2,…,v|s|}进行表征,得到会话表征,即用户当前兴趣表征p;
根据用户兴趣表征,推荐物品;将物品vj的向量vj乘以用户兴趣向量p,再应用softmax函数计算出物品vj的分数:
Figure FDA0003246971540000021
其中,p代表用户的兴趣向量,
Figure FDA0003246971540000022
代表物品vj成为下一个交互物品的可能性;同时根据
Figure FDA0003246971540000023
的对数似然函数值,计算损失函数:
Figure FDA0003246971540000024
其中,yj代表vj的one-hot编码,
Figure FDA0003246971540000025
函数用梯度下降法来最优化。
2.根据权利要求1所述的一种基于多来源信息异构图的会话推荐方法,其特征在于:所述门控制循环神经网络(GRU)为:
zi=σ(Wxz·xi+Whz·hi-1)
ri=σ(Wxr·xi+Whr·hi-1)
Figure FDA0003246971540000026
Figure FDA0003246971540000027
其中,ri是重置门,zi为更新门,这两个门控向量决定了哪些信息能作为门控循环单元的输出;
Figure FDA0003246971540000028
是当前记忆内容;xi是当前层的节点输入;Wxz、Whz、Wxr和Whr分别是控制更新门zi和重置门ri的参数;Wxh和Whh是控制前记忆内容
Figure FDA0003246971540000029
的参数;⊙是元素级别的矩阵相乘,σ是sigmoid函数;门控制循环神经网络(GRU)的最后一个隐藏层的输出h|s|就是该会话表征,即用户当前兴趣表征p。
CN202111035961.2A 2021-09-06 2021-09-06 一种基于多来源信息异构图的会话推荐方法 Active CN113704439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111035961.2A CN113704439B (zh) 2021-09-06 2021-09-06 一种基于多来源信息异构图的会话推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111035961.2A CN113704439B (zh) 2021-09-06 2021-09-06 一种基于多来源信息异构图的会话推荐方法

Publications (2)

Publication Number Publication Date
CN113704439A CN113704439A (zh) 2021-11-26
CN113704439B true CN113704439B (zh) 2022-02-22

Family

ID=78660120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111035961.2A Active CN113704439B (zh) 2021-09-06 2021-09-06 一种基于多来源信息异构图的会话推荐方法

Country Status (1)

Country Link
CN (1) CN113704439B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114036400B (zh) * 2021-12-07 2022-04-08 中国计量大学 一种基于超图的协同会话推荐方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008408A (zh) * 2019-04-12 2019-07-12 山东大学 一种会话推荐方法、系统、设备及介质
CN113222700A (zh) * 2021-05-17 2021-08-06 中国人民解放军国防科技大学 基于会话的推荐方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102387305B1 (ko) * 2017-11-17 2022-04-29 삼성전자주식회사 멀티모달 데이터 학습 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008408A (zh) * 2019-04-12 2019-07-12 山东大学 一种会话推荐方法、系统、设备及介质
CN113222700A (zh) * 2021-05-17 2021-08-06 中国人民解放军国防科技大学 基于会话的推荐方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Session-Based Customer Preference Learning;JENHUI CHEN等;《IEEE Access》;20190129;第7卷;第17750-17759页 *
基于门循环单元神经网络的中文分词法;李雪莲等;《厦门大学学报(自然科学版)》;20170331;第56卷(第2期);第237-243页 *

Also Published As

Publication number Publication date
CN113704439A (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN111523047B (zh) 基于图神经网络的多关系协同过滤算法
CN111310063B (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN106897404B (zh) 一种基于多gru层神经网络的推荐方法与系统
CN110910218B (zh) 一种基于深度学习的多行为迁移推荐方法
CN111881342A (zh) 一种基于图孪生网络的推荐方法
CN111932336A (zh) 一种基于长短期兴趣偏好的商品列表推荐方法
CN112967112B (zh) 一种自注意力机制和图神经网络的电商推荐方法
CN112950324B (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN110532471A (zh) 基于门控循环单元神经网络的主动学习协同过滤方法
CN112765461A (zh) 一种基于多兴趣胶囊网络的会话推荐方法
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN113704438B (zh) 一种基于分层注意力机制的异构图的会话推荐方法
CN112632296B (zh) 基于知识图谱具有可解释性的论文推荐方法及系统、终端
CN113918832A (zh) 基于社交关系的图卷积协同过滤推荐系统
CN111949885A (zh) 一种面向旅游景点的个性化推荐方法
CN113918833A (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN112396492A (zh) 基于图注意力网络和双向长短期记忆网络的会话推荐方法
CN112819575A (zh) 一种考虑重复购买行为的会话推荐方法
CN114896517A (zh) 一种商品推荐方法、系统、设备及存储介质
CN116071128A (zh) 一种基于多行为特征提取与自监督学习的多任务推荐方法
CN113704439B (zh) 一种基于多来源信息异构图的会话推荐方法
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
CN114169968A (zh) 一种融合用户兴趣状态的多粒度会话推荐方法
US20240037133A1 (en) Method and apparatus for recommending cold start object, computer device, and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231013

Address after: Room 407-10, floor 4, building 2, Haichuang science and technology center, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province, 311100

Patentee after: Zhejiang Zhiduo Network Technology Co.,Ltd.

Address before: 310018, No. 258, source street, Xiasha Higher Education Park, Hangzhou, Zhejiang

Patentee before: China Jiliang University