CN116467415A - 基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法 - Google Patents
基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法 Download PDFInfo
- Publication number
- CN116467415A CN116467415A CN202310433989.4A CN202310433989A CN116467415A CN 116467415 A CN116467415 A CN 116467415A CN 202310433989 A CN202310433989 A CN 202310433989A CN 116467415 A CN116467415 A CN 116467415A
- Authority
- CN
- China
- Prior art keywords
- session
- domain
- cross
- node
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000002457 bidirectional effect Effects 0.000 title claims abstract description 32
- 239000013598 vector Substances 0.000 claims abstract description 53
- 230000007246 mechanism Effects 0.000 claims abstract description 36
- 230000003993 interaction Effects 0.000 claims abstract description 33
- 238000010586 diagram Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims description 26
- 230000014509 gene expression Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 14
- 230000009471 action Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 7
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 238000012512 characterization method Methods 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 abstract description 3
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000002452 interceptive effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Computation (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Mathematics (AREA)
- Human Computer Interaction (AREA)
- Algebra (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法,包括以下步骤:一、分别获取A领域、B领域会话数据,根据每个领域中的会话数据建立对应的全局会话图;二、根据全局会话图,使用项目嵌入表示层分别计算各领域中节点向量表示;三、利用多通道语义模块层计算复杂跨域特征;四、采用增强门控机制对不同类型的节点向量表示进行自适应的结合;步骤五、为所有候选节点计算交互概率,并同时生成不同域下的推荐列表。本发明提高了各个领域会话表征的全面性;缓解了数据稀疏问题和双域会话推荐的时效性,大大提高了双向跨域会话推荐模型的泛化能力和推荐召回率,实现根据用户跨域交互行为解决用户商品需求的目的。
Description
技术领域
本发明属于双向跨域会话推荐技术领域,尤其涉及一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法。
背景技术
随着互联网和信息通信技术的不断发展以及移动设备的普及,推荐系统因具有在海量数据中精准链接信息与用户的强大功能,已经作为信息服务的主要工具。然而由于近年来随着互联网企业的快速发展,行业间的数据壁垒正在逐渐消失,基于单领域交互信息和用户偏好的会话推荐算法失效,而基于双向跨域序列化推荐算法的诞生,只需要根据用户在不同域会话中的交互行为记录同时分别预测用户在各个领域中真正感兴趣的项目,发挥了较高的应用价值。
图卷积神经网络(Graph Convolutional Network,GCN)因具有构建复杂交互模式的性能已经被广泛应用于多种类型的推荐算法中,如社交推荐、时空兴趣点推荐等推荐应用中不乏其身影。现有相关的研究成果大多数采用图结构的形式构建会话序列结构,并且展现出了良好的推荐性能。
西电的学者在2021年提出了一种基于多维度的双向注意力迁移网络,它首先采用结合图结构和循环神经网络的方法学习各个会话中的项目表示,然后利用基于注意力机制的映射建模方法提取用户在不同会话中的表示信息,虽然基于图结构的模型在双向跨域会话推荐领域表现出了不错的适应性,但该方法存在的问题是:1、现有双向跨域会话推荐方法无法同时建模交互项目间的空间中的结构关系和时间中的长距离依赖关系,在集中关注于交互项目间的空间结构关系时,对于会话序列自身固有的长距离依赖关系就不能很好的建模,2、因双向跨域会话推荐场景中存在较为复杂的语义特性,跨域特征交互复杂,而现有方法对特征交叉关系捕获不全,造成生成的会话表示仍然存在拟合性不强,使得不同域的会话推荐结果存在准确性差、泛化性弱的问题。造成会话推荐系统无法准确的为用户提供相应的推荐,降低了系统功能的同时也降低了用户对系统的满意程度。
发明内容
本发明提供一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法,针对现有双向跨域会话推荐方法无法同时建模交互项目间的空间中的结构关系和时间中的长距离依赖关系,生成的会话表示存在拟合性不强,使得不同域的会话推荐结果存在准确性差、泛化性弱的问题。
为达到本发明的目的,本发明提供的一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法,包括以下步骤:
步骤一、分别获取A领域、B领域会话数据,根据每个领域中的会话数据建立对应的全局会话图,获取图中所有节点的连接关系;
步骤二、根据全局会话图,使用项目嵌入表示层分别计算各领域中节点向量表示基于节点向量表示,根据当前用户会话数据分别得到A领域和B领域的会话局部偏好和全局偏好。所述项目嵌入表示层的建立过程是:首先采用图结构的方式构建会话中项目间的转移关系,其次基于消息传递机制,根据邻居节点特征表示进行节点特征聚合,随后将聚合形成后的节点表征作为transformer模型的输入;
步骤三、基于节点向量表示及A领域和B领域的会话局部偏好和全局偏好,利用多通道语义模块层计算复杂跨域特征,所述多通道语义模块层的建立过程是:根据同一用户在不同域中的交互记录,利用对比学习方法学习用户在跨域交互下的共性特征;采用互注意力机制学习双向跨域会话间的互增强特征,采用对抗机制得到双向跨域会话间的独有特征;
步骤四、基于节点向量表示及复杂跨域特征,采用增强门控机制对不同类型的节点向量表示进行自适应的结合,计算不同领域会话向量表示;
步骤五、为所有候选节点计算交互概率,并同时生成不同域下的推荐列表。
进一步的,上述步骤三的实施步骤如下:
(1)给定用户在领域A和领域B中的交互序列为和利用项目嵌入表示层分别建立领域A和领域B的节点最终向量表示和/>局部和全局偏好/>进而生成用户在不同领域中的会话表示/>和/>
(2)将输入至对比学习的框架中,提取出用户跨域不变特征表达,过程表示为:
其中|D|为训练样本数量,N为负例样本数量,sim(·)为相似性计算函数。
(3)将和/>输入至互注意力机制中,提取出用户双向跨域互增强特征表达,过程表示为:
(4)将局部和全局偏好输入至对抗机制中,提取出用户双向跨域独特特征表达,过程表示为:
其中d(·)和g(·)分别为会话生成器和领域鉴别器。
进一步的,上述步骤二的实施步骤如下:
(1)将会话图Gs=(Vs,Es)输入嵌入层,得到每个节点生成位置向量;
(2)将节点向量输入至多头注意力机制中,通过三次线性变化和缩放点积注意力计算该机制输出,过程表示为:
其中Hi为第h个头注意力所构建的节点表示向量,dh为缩放因子。Wi Q、Wi K、Wi V均为可训练的参数矩阵。
(3)在多头自注意力机制的输出后接入前馈神经网络,该网络通过线性和激活函数生成项目节点i的最终向量表示zi:
zi=max(0,HiW1+b1)W2+b2
其中max(·)是最大化操作,W1、W2、b1、b2均为可训练的参数矩阵。
(1)对于由节点向量组成的会话s,会话局部偏好sl和全局偏好sg表示分别为:
αi=softmax(qT·sigmoid(W3zk+W4zi))
进一步的,上述步骤四中,增强门控机制的过程表示为:
其中gA和gB分别是不同语义和不同领域下会话表示对应的权重,是双向跨域作用下会话在A领域中的向量表示,/>是双向跨域作用下会话在B领域中的向量表示, WA、WB均为可训练的参数矩阵。
进一步的,上述步骤五的计算过程如下:
其中prA,j是项目vj作为A领域会话s在下一时刻的交互的概率,prB,j是项目vj作为B领域会话s在下一时刻的交互的概率;
;模型训练过程采用交叉损失函数计算预测值与真值之间的距离,则对于A领域中的会话s,其损失值表示为:
同样地,对于A领域中的会话s,其损失值表示为:
结合共性特征和独特特征的提取,模型最终的损失函数为:
Loss=LA+LB+αLossCL+βLossGN
与现有技术相比,本发明的优点是:
1、本发明分别从空间、时间、双向协同等多个角度挖掘会话表示的语义信息,并通过同时建立双向跨域的共性特征、增强特征、独特特征。不仅有效建模了当前会话的多维动态偏好转移,同时将不同语义空间的会话信息进行深度捕获和融合,显著提高了各个领域会话表征的全面性。具体而言,本发明根据不同领域中的全局会话信息构建全局会话图,并利用项目嵌入表示层中的GCNsformer混合网络从空间结构信息和时间依赖关系的角度对项目进行编码,生成各个节点的最终向量表示;利用多通道语义模块层中的对比学习、互注意力机制、对抗机制得到双向跨域会话推荐场景中不同领域下的复杂特征交叉信息;采用增强门控机制得到不同领域下的会话最终表示,然后结合各个域中候选项目表示计算下一时刻用户可能与之产生交互的概率,并生成下一个交互项目的推荐信息,从而实现会话推荐效果。其中模型在训练过程中通过权值引入了不同跨域共性特征或独特特征作用下的推荐。
2、本发明以双向跨域会话推荐场景为目标,通过设计的项目嵌入表示层和多通道语义模块层,有效建模了动态偏好转移模式和引入了双向协同信息,缓解了会话推荐中的数据稀疏问题和双域会话推荐的时效性问题,大大提高了双向跨域会话推荐模型的泛化能力和推荐召回率,从而实现根据用户跨域交互行为解决用户商品需求的目的。
附图说明
图1为本发明连接矩阵A的示意图;
图2为本发明GCNsformer混合网络结构图;
图3为本发明方法流程图;
图4为本发明方法结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附和实施例对本发明作进一步地详细描述。显然,所描述的实施例仅是本发明一部分实施例,只用于说明本发明,但不用来限制本发明的范围。
本发明设计了一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法。本发明通过对双向跨域会话序列的时空建模和双向跨域的多通道语义信息的挖掘,使得最终的会话表示具有构建多维动态偏好转移模式和建立完整用户偏好表征的能力,以解决现有会话推荐仍然存在的推荐准确性差、模型泛化性弱的问题。具体实现上,通过GCNsformer混合网络学习各个域内交互项目嵌入表示;基于域内局部会话图结构和域间全局会话图结构,采用本文提出的多通道语义模块对双向跨域会话推荐场景中的共性特征、互增强特征、独有特征分别进行提取;最后基于门控机制,利用动态权重自适应分别对各个域中的会话特征进行整合会话,进而形成不同域下的最终会话表示。
参见图3和图4,本发明提供的一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法,包括以下步骤:
步骤一、分别获取A领域、B领域会话数据,根据每个领域中的会话数据建立对应的全局会话图,获取图中所有节点的连接关系:
面向双向跨域会话推荐场景,分别采用Vd={v1,v2,...,vm}表示单域会话中唯一的节点。给定用户交互记录,首先根据交互记录时序关系建立会话序列;然后对每个领域的会话信息,基于图论相关理论和域内所有用户交互记录,利用图结构构建域内全局会话图Gs=(Vs,Es),以表征交互项目间复杂的转化关系。参见图1,其中Vs表示全局会话图中的节点,Es表示全局会话图中的边,任意边(vi,vi+1)表示用户点击vi之后与vi+1进行了交互;最后根据全局会话图结构,构建连接矩阵A表征节点之间的连接关系。考虑到节点之间可能会出现多次连接,为了消除维度不一致的情况,对边权值采用归一化处理。
步骤二、根据全局会话图,使用项目嵌入表示层分别计算各领域中节点向量表示基于节点向量表示,根据当前用户会话数据分别得到A领域和B领域的会话局部偏好和全局偏好。所述项目嵌入表示层的建立过程是:首先采用图结构的方式构建会话中项目间的转移关系,其次基于消息传递机制,根据邻居节点特征表示进行节点特征聚合,随后将聚合形成后的节点表征作为transformer模型的输入;参见图2,具体的实施步骤如下:
(1)将会话图Gs=(Vs,Es)输入嵌入层,采用随机化嵌入的方式将节点特征以低维稠密向量ei=Embedding_layer(num_v,emb_dim)进行表示,其中num_v为全局会话图中节点数,emb_dim为节点特征向量的维度;
(2)在连接矩阵A作用下邻居节点与当前节点之间的l层信息传播过程表示为:其中N(vi)为vi节点及其l阶邻居节点集合,任意会话s中各个节点所对应的节点向量表示为/>
(3)对于会话s中的节点向量为了刻画项目之间的顺序关系,使用sin和cos函数的线性变换为每个节点生成位置向量,过程表示为:
其中p为会话中第i个项目的位置,d为项目向量维度,和/>分别表示节点的位置嵌入向量。
(4)将节点向量输入至多头注意力机制中,通过三次线性变化和缩放点积注意力计算该机制输出,过程表示为:
其中Hi为第h个头注意力所构建的节点表示向量,dh为缩放因子。Wi Q、Wi K、Wi V均为可训练的参数矩阵。
(5)为了增加GCNsformer混合网络的非线性,在多头自注意力机制的输出后接入前馈神经网络,该网络通过线性和激活函数生成项目节点i的最终向量表示zi:
zi=max(0,HiW1+b1)W2+b2
其中max(·)是最大化操作,W1、W2、b1、b2均为可训练的参数矩阵。
(6)对于由节点向量组成的会话s,会话局部偏好sl和全局偏好sg表示分别为:
αi=softmax(qT·sigmoid(W3zk+W4zi))
步骤三、基于节点向量表示及A领域和B领域的会话局部偏好和全局偏好,利用多通道语义模块层计算复杂跨域特征,其中重点是建立多通道语义模块层,所述多通道语义模块层的建立过程是:根据同一用户在不同域中的交互记录,利用对比学习方法学习用户在跨域交互下的共性特征;采用互注意力机制学习双向跨域会话间的互增强特征,采用对抗机制得到双向跨域会话间的独有特征,具体的实施步骤如下:
(1)给定用户在领域A和领域B中的交互序列为和利用项目嵌入表示层分别建立领域A和领域B的节点最终向量表示和/>局部和全局偏好/>进而生成用户在不同领域中的会话表示/>和/>
(2)为获取共性特征,将输入至对比学习的框架中,通过缩小用户在不同领域中的会话表示的差异,从而达到提取出用户跨域不变特征表达的目的,过程表示为:
其中|D|为训练样本数量,N为负例样本数量,sim(·)为相似性计算函数。
(3)为获取互增强特征,将和/>输入至互注意力机制中,通过建立不同域间交互项目间的相关性,从而达到提取出用户双向跨域互增强特征表达的目的,过程表示为:
(4)为获取独特特征,将局部和全局偏好输入至对抗机制中,通过分辨会话在当前域中的向量表示和跨域全局向量表示,从而达到提取出用户双向跨域独特特征表达的目的,过程表示为:
其中d(·)和g(·)分别为会话生成器和领域鉴别器。
步骤四、基于节点向量表示及复杂跨域特征,采用增强门控机制对不同类型的节点向量表示进行自适应的结合,计算不同领域会话向量表示,所述增强门控机制的过程表示为:
其中gA和gB分别是不同语义和不同领域下会话表示对应的权重,是双向跨域作用下会话在A领域中的向量表示,/>是双向跨域作用下会话在B领域中的向量表示, WA、WB均为可训练的参数矩阵。
步骤五、为所有候选节点计算交互概率,并同时生成不同域下的推荐列表:在各个领域中,对每个会话下一时刻可能交互项目的预测是通过计算会话表示与各个域中所有候选项目的概率分布实现的,具体计算过程如下:
其中prA,j是项目vj作为A领域会话s在下一时刻的交互的概率,prB,j是项目vj作为B领域会话s在下一时刻的交互的概率,然后分别对概率值按照从大到小进行排序,概率越大的项目越有可能被推荐。
由于会话推荐问题本质上属于分类任务,因此模型训练过程采用交叉损失函数计算预测值与真值之间的距离,则对于A领域中的会话s,其损失值表示为:
同样地,对于A领域中的会话s,其损失值表示为:
结合共性特征和独特特征的提取,模型最终的损失函数为:
Loss=LA+LB+αLossCL+βLossGN。
以上所述是对本发明的具体实施的说明,而非对本发明的限制。有关技术领域的技术人员在不脱离本发明的范围的情况下,还可以作出各种同等技术方案,因此所有同等的技术方案均应该归入本发明的专利保护范围。
Claims (5)
1.一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法,其特征在于:包括以下步骤:
步骤一、分别获取A领域、B领域会话数据,根据每个领域中的会话数据建立对应的全局会话图,获取图中所有节点的连接关系;
步骤二、根据全局会话图,使用项目嵌入表示层分别计算各领域中节点向量表示;基于节点向量表示,根据当前用户会话数据分别得到A领域和B领域的会话局部偏好和全局偏好,所述项目嵌入表示层的建立过程是:首先采用图结构的方式构建会话中项目间的转移关系,其次基于消息传递机制,根据邻居节点特征表示进行节点特征聚合,随后将聚合形成后的节点表征作为transformer模型的输入;
步骤三、基于节点向量表示及A领域和B领域的会话局部偏好和全局偏好,利用多通道语义模块层计算复杂跨域特征,所述多通道语义模块层的建立过程是:根据同一用户在不同域中的交互记录,利用对比学习方法学习用户在跨域交互下的共性特征;采用互注意力机制学习双向跨域会话间的互增强特征,采用对抗机制得到双向跨域会话间的独有特征;
步骤四、基于节点向量表示及复杂跨域特征,采用增强门控机制对不同类型的节点向量表示进行自适应的结合,计算不同领域会话向量表示;
步骤五、为所有候选节点计算交互概率,并同时生成不同域下的推荐列表。
2.根据权利要求1所述的一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法,其特征在于:所述步骤三的实施步骤如下:
(1)给定用户在领域A和领域B中的交互序列为和/>利用项目嵌入表示层分别建立领域A和领域B的节点最终向量表示/>和局部和全局偏好/>进而生成用户在不同领域中的会话表示和/>
(2)将输入至对比学习的框架中,提取出用户跨域不变特征表达,过程表示为:
其中|D|为训练样本数量,N为负例样本数量,sim(·)为相似性计算函数;
(3)将和/>输入至互注意力机制中,提取出用户双向跨域互增强特征表达,过程表示为:
(4)将局部和全局偏好输入至对抗机制中,提取出用户双向跨域独特特征表达,过程表示为:
其中d(·)和g(·)分别为会话生成器和领域鉴别器。
3.根据权利要求2所述的一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法,其特征在于:所述步骤二的实施步骤如下:
(1)将会话图Gs=(Vs,Es)输入嵌入层,得到每个节点生成位置向量;
(2)将节点向量输入至多头注意力机制中,通过三次线性变化和缩放点积注意力计算该机制输出,过程表示为:
其中Hi为第h个头注意力所构建的节点表示向量,dh为缩放因子。Wi Q、Wi K、Wi V均为可训练的参数矩阵;
(3)在多头自注意力机制的输出后接入前馈神经网络,该网络通过线性和激活函数生成项目节点i的最终向量表示zi:
zi=max(0,HiW1+b1)W2+b2
其中max(·)是最大化操作,W1、W2、b1、b2均为可训练的参数矩阵;
(4)对于由节点向量组成的会话s,会话局部偏好sl和全局偏好sg表示分别为:
αi=soft max(qT·sigmoid(W3zk+W4zi))
4.根据权利要求3所述的一种基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法,其特征在于:所述步骤四中,增强门控机制的过程表示为:
其中gA和gB分别是不同语义和不同领域下会话表示对应的权重,是双向跨域作用下会话在A领域中的向量表示,/>是双向跨域作用下会话在B领域中的向量表示,/> WA、WB均为可训练的参数矩阵。
5.根据权利要求1-4任意权利要求所述的一种基于多通道语义的双向跨域会话推荐方法,其特征在于:所述步骤五的计算过程如下:
其中prA,j是项目vj作为A领域会话s在下一时刻的交互的概率,prB,j是项目vj作为B领域会话s在下一时刻的交互的概率;
模型训练过程采用交叉损失函数计算预测值与真值之间的距离,则对于A领域中的会话s,其损失值表示为:
同样地,对于A领域中的会话s,其损失值表示为:
结合共性特征和独特特征的提取,模型最终的损失函数为:
Loss=LA+LB+αLossCL+βLossGN。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310433989.4A CN116467415A (zh) | 2023-04-21 | 2023-04-21 | 基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310433989.4A CN116467415A (zh) | 2023-04-21 | 2023-04-21 | 基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116467415A true CN116467415A (zh) | 2023-07-21 |
Family
ID=87176709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310433989.4A Pending CN116467415A (zh) | 2023-04-21 | 2023-04-21 | 基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116467415A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473457A (zh) * | 2023-12-25 | 2024-01-30 | 四川省大数据技术服务中心 | 基于数字化业务的大数据挖掘方法及系统 |
-
2023
- 2023-04-21 CN CN202310433989.4A patent/CN116467415A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473457A (zh) * | 2023-12-25 | 2024-01-30 | 四川省大数据技术服务中心 | 基于数字化业务的大数据挖掘方法及系统 |
CN117473457B (zh) * | 2023-12-25 | 2024-02-27 | 四川省大数据技术服务中心 | 基于数字化业务的大数据挖掘方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112464016B (zh) | 一种基于深度关系自注意力网络的场景图生成方法 | |
Li et al. | Cross-modal semantic communications | |
CN113486190A (zh) | 一种融合实体图像信息和实体类别信息的多模态知识表示方法 | |
CN114462520A (zh) | 一种基于流量分类的网络入侵检测方法 | |
Xu et al. | Domain disentangled generative adversarial network for zero-shot sketch-based 3d shape retrieval | |
CN116467415A (zh) | 基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法 | |
CN111324773A (zh) | 一种背景音乐构建方法、装置、电子设备和存储介质 | |
CN114564641A (zh) | 个性化多视图联邦推荐系统 | |
Zhang et al. | Joint intelligence ranking by federated multiplicative update | |
CN116204719A (zh) | 一种双曲空间下知识增强的多任务推荐方法 | |
CN116976505A (zh) | 基于信息共享的解耦注意网络的点击率预测方法 | |
CN116821291A (zh) | 基于知识图谱嵌入与语言模型交替学习的问答方法及系统 | |
CN113344648B (zh) | 一种基于机器学习的广告推荐方法及系统 | |
Liu et al. | A network intrusion detection method based on CNN and CBAM | |
CN117391816A (zh) | 一种异质图神经网络推荐方法、装置及设备 | |
Gao et al. | Generalized pyramid co-attention with learnable aggregation net for video question answering | |
CN113918711A (zh) | 一种基于多视图多层注意力的面向学术论文的分类方法 | |
CN116703553A (zh) | 金融反欺诈风险监控方法、系统及可读存储介质 | |
CN114840775A (zh) | 一种融合多空间特征的网络对齐模型及其应用 | |
CN114911967A (zh) | 一种基于自适应域增强的三维模型草图检索方法 | |
Wang et al. | Hierarchical multimodal fusion network with dynamic multi-task learning | |
CN114462707A (zh) | 一种基于特征深度融合的Web服务多维QoS联合预测方法 | |
CN113962748A (zh) | 基于元路径的全貌信息表示异质电商平台用户对齐方法 | |
Li et al. | An effective deep learning approach for personalized advertisement service recommend | |
Zhang et al. | SARC: Split-and-recombine networks for knowledge-based recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |