CN115169366A - 一种基于采样卷积和交互策略的会话推荐方法 - Google Patents

一种基于采样卷积和交互策略的会话推荐方法 Download PDF

Info

Publication number
CN115169366A
CN115169366A CN202210874268.2A CN202210874268A CN115169366A CN 115169366 A CN115169366 A CN 115169366A CN 202210874268 A CN202210874268 A CN 202210874268A CN 115169366 A CN115169366 A CN 115169366A
Authority
CN
China
Prior art keywords
sequence
conversation
user
subsequences
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210874268.2A
Other languages
English (en)
Inventor
郑海涛
王刘鄞
欧阳凯
许翔泓
夏树涛
肖喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen International Graduate School of Tsinghua University
Original Assignee
Shenzhen International Graduate School of Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen International Graduate School of Tsinghua University filed Critical Shenzhen International Graduate School of Tsinghua University
Priority to CN202210874268.2A priority Critical patent/CN115169366A/zh
Publication of CN115169366A publication Critical patent/CN115169366A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于采样卷积和交互策略的会话推荐方法,包括以下步骤:S1:输入会话序列;S2:通过基于采样卷积和交互策略的会话推荐模型捕获会话序列的时间信息,提取用户的潜在意图;S3:基于用户潜在意图评估每个候选项目的概率并进行推荐。本发明对用户行为之间的转换进行建模,并捕获行为序列的时间信息,以提取用户的潜在意图,从而做出更好的推荐。本发明所提出的方法性能优于目前最先进的方法,可以对用户行为之间的转换进行建模并捕捉行为序列的时间信息,产生更好的推荐。

Description

一种基于采样卷积和交互策略的会话推荐方法
技术领域
本发明涉及会话推荐领域,尤其是涉及一种基于采样卷积和交互策略的会话推荐方法。
背景技术
SR:基于会话的推荐(session-based recommendation)
SR旨在根据用户当前会话预测用户将点击的下一项。SR任务公式化定义如下:让I={i1,i2,...,iN}表示项目的集合,其中N是项的总数。每个会话都表示为按时间戳排序的列表s=[is,1,is,2,...,is,m],其中is,t∈s(1≤t≤m)表示会话s中用户的单击项。
SR任务是预测S的下一次单击iS,m+1。对于会话S,模型通过计算所有可能项目的概率
Figure BDA0003758309910000011
其中项目的推荐分数是向量
Figure BDA0003758309910000012
的对应元素。与
Figure BDA0003758309910000013
中top-K分数对应的项目将被推荐。
大多数传统的推荐系统(RS)方法都假设长期用户配置文件是可用的,但是,当用户未登录或保留个人信息时,它不适用信息保密。基于会话的推荐(SBR)旨在应对这一挑战.给定一个在短时间内记录时态行为(点击或购买)的匿名会话,SBR的任务是预测会话的下一项。
早期代表性研究尝试带来了K近邻(KNN)和马尔可夫链进入SBR。随后,随着深度学习的兴起,递归神经网络在建模序列数据方面显示出压倒性的优势,和GRU4REC(推荐系统行为序列建模)是第一个基于RNNs(递归神经网络)的SBR模型。接下来,基于卷积神经网络(CNN)的模型NextItNet提出使用时间卷积神经网络来捕获会话中的动态意图。将会话建模为单向序列被认为是基于RNNs和基于CNN的SBR模型成功的关键。然而,它们都忽略了序列的全局信息,过分强调了用户行为的相对顺序。然后,NARM首次提出将注意力机制与RNNs相结合来捕捉会话的主要目的。试图在以前的模型中用自我关注取代RNNs。它们都旨在使用注意机制来捕捉会话的全局信息,并减轻对行为相对顺序的关注。在此基础上,他们实现了可观的性能改进。然而,由于它们的叠加结构,它们要么仍然没有摆脱对用户行为相对顺序的依赖,要么由于过度依赖注意机制而忽略了对相邻项目之间的转换进行建模。
之后,研究人员引入图形神经网络(GNNs)将会话建模为图形,以捕捉项目转换。SR-GNN是第一个通过GNNs捕获项目转换的方法。FGNN将下一个项目推荐建模为图形预测问题。由于图具有包含丰富信息和模拟成对关系的能力,大多数基于GNNs的模型与以前的方法相比都有所改进。但是,在对项目转换进行建模时,它们忽略了捕捉全局信息和非成对关系。最近,最先进的S2-DNCH模型利用hypergraph(超图)捕获项目之间的高级和非成对关系,而不是成对项目过渡。此外,S2-DNCH是第一个采用自我监督学习(SSL)范式的SBR模型。然而,尽管超图结构考虑了更多的项目,便于捕捉全局信息。在对项之间的转换进行建模时,它的边是无向的,这使得模型失去了捕捉序列的时态信息的能力,造成推荐准确性不足。
发明内容
本发明的目的在于克服上述背景技术现有技术无法捕捉序列的时态信息,推荐准确性不足的缺点,提供一种基于采样卷积和交互策略的会话推荐方法。
为实现上述目的,本发明采用以下技术方案:
一种基于采样卷积和交互策略的会话推荐方法,包括以下步骤:
S1:输入会话序列;
S2:通过基于采样卷积和交互策略的会话推荐模型捕获会话序列的时间信息,提取用户的潜在意图;
S3:基于用户潜在意图评估每个候选项目的概率并进行推荐。
在一些实施例中,步骤S2中包括以下步骤:
S21:通过嵌入层将输入的会话序列转化为高维向量序列X;
S22:通过交互层应用拆分和交互学习来将所述高维向量序列X分解为两个增强的子特征;
S23:通过聚合层得到增强的序列表示;
S24:通过全连接层将所述增强的序列表示解码,解码后的输出表示用户的潜在意图。
在一些实施例中,步骤S22中包括以下步骤:
S221:将所述高维向量序列X拆分为两个子序列;
S222:使用两组不同的样本卷积层以交互式学习策略处理两个子序列,得到两个增强的子特征;
步骤S222中,通过使用卷积模块和交互式学习实现两个子特征之间的信息交换,所述交互式学习通过学习仿射变换的参数来实现信息交换以增强所述子特征的表示能力。
在一些实施例中,所述两个子序列分别是偶元素序列Xeven和奇元素序列Xodd
在一些实施例中,所述交互式学习过程包括:
A1:使用两个不同的一维卷积模块φ和ψ将所述两个子序列分别转换到隐藏状态,并将两个隐藏状态的子序列分别转换为exp格式,将其分别与所述子序列根据元素点乘进行交互,得到两个缩放特征;
A2:使用另外两个不同的一维卷积模块ρ和v将所述两个缩放特征分别转换为另外两个隐藏状态,然后分别在所述两个缩放特征中加减;
所述步骤A1由以下公式表示:
Figure BDA0003758309910000031
其中,⊙表示元素层面上的乘积;
所述步骤A2由以下公式表示:
Figure BDA0003758309910000032
在一些实施例中,所述步骤S23包括以下步骤:
S231:通过反转奇偶拆分操作重新排列所述两个增强的子特征,将其连接成一个新的序列表示Xnew
S232:通过残差连接将所述新的序列表示添加到所述高维向量序列X。
在一些实施例中,所述步骤S3包括以下步骤:
S31:连接最后一项嵌入项目xm以及步骤S2的输出Os,使用前馈神经网络来获得增强的表示O;
S32:计算每一个项目i成为会话中下一个的概率
Figure BDA0003758309910000033
S33:获得下一个项目的真实概率分布。
在一些实施例中,所述步骤S31中增强的表示O由以下公式计算:
O=f(W([Os||xm])+b,
其中,||表示串联操作,
Figure BDA0003758309910000034
是加权矩阵,Os代表用户的潜在意图,
Figure BDA0003758309910000035
是偏差向量,f(·)表示非线性激活函数SELU。
在一些实施例中,步骤S32中,项目i的最终概率
Figure BDA0003758309910000036
由以下公式计算:
Figure BDA0003758309910000037
Figure BDA0003758309910000038
Figure BDA0003758309910000039
其中xi是i的嵌入,L2Norm是L2的归一化函数,wk是归一化权重。
在一些实施例中,所述模型的损失函数为:
Figure BDA0003758309910000041
其中y是下一个项目的真实概率分布。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时能实现上述方法的步骤。
本发明具有如下有益效果:
本发明提出了一种基于采样卷积和交互策略的会话推荐方法,该方法对用户行为之间的转换进行建模,并捕获行为序列的时间信息,以提取用户的潜在意图,从而做出更好的推荐。本发明所提出的方法性能明显优于目前最先进的方法,可以对用户行为之间的转换进行建模并捕捉行为序列的时间信息,产生更好的推荐,并且与现有技术相比,本发明具有更高的效率。
附图说明
图1是本发明实施例中基于采样卷积和交互策略的会话推荐方法的流程图;
图2是本发明实施例中基于采样卷积和交互策略的会话推荐方法中所建模型的架构示意图。
具体实施方式
以下对本发明的实施方式做详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
本发明实施例提出了一种基于采样卷积和交互策略的会话推荐方法,其基本思想是对用户行为之间的转换进行建模,并捕获行为序列的时间信息,以提取用户的潜在意图,从而做出更好的推荐。从技术上讲,本实施例使用精心设计的交互式学习策略和时间信息建模组件来捕捉全局信息,同时关注相邻项目之间的过渡。并且基于这些特征获得用户潜在意图的表示,以预测用户将点击的下一个项目。
参考图1、图2,图1为本实施例中基于采样卷积和交互策略的会话推荐方法流程图,图2为本实施例中的采样卷积和交互策略的会话推荐模型的架构,该模型命名为SCIRec,本实施例的方法包括以下步骤:
S1:输入会话序列;
S2:通过基于采样卷积和交互策略的会话推荐模型捕获会话序列的时间信息,提取用户的潜在意图;
S21:通过嵌入层将输入的会话序列转化为高维向量序列X;
S22:通过交互层应用拆分和交互学习来将所述高维向量序列X分解为两个增强的子特征;
S221:将所述高维向量序列X拆分为两个子序列;
S222:使用两组不同的样本卷积层以交互式学习策略处理两个子序列,得到两个增强的子特征;
所述交互式学习过程包括:
A1:使用两个不同的一维卷积模块φ和ψ将所述两个子序列分别转换到隐藏状态,并将两个隐藏状态的子序列分别转换为exp格式,将其分别与所述子序列根据元素点乘进行交互,得到两个缩放特征;
A2:使用另外两个不同的一维卷积模块ρ和η将所述两个缩放特征分别转换为另外两个隐藏状态,然后分别在所述两个缩放特征中加减;
S23:通过聚合层得到增强的序列表示;
S231:通过反转奇偶拆分操作重新排列所述两个增强的子特征,将其连接成一个新的序列表示Xnew
S232:通过残差连接将所述新的序列表示添加到所述高维向量序列X。
S24:通过全连接层将所述增强的序列表示解码,解码后的输出表示用户的潜在意图。
S3:基于用户潜在意图评估每个候选项目的概率并进行推荐。
S31:连接最后一项嵌入项目xm以及步骤S2的输出Os,使用前馈神经网络来获得增强的表示O;
S32:计算每一个项目i成为会话中下一个的概率
Figure BDA0003758309910000052
S33:获得下一个项目的真实概率分布。
在用户意图建模的步骤中首先利用嵌入层将会话转换为高维向量,然后利用交互层和聚合层对行为间的转换进行建模,捕捉会话s中的用户潜在意图
在优化和推荐的步骤中基于用户潜在性的表示评估每个候选项目的概率。
具体地,
步骤S2中,S21:首先构造嵌入层来将输入会话s=[is,1,is,2,...,is,m]转化为高维向量X={x1,x2,...,xm}.每一项i∈s,隐藏的表示是
Figure BDA0003758309910000051
d是嵌入的大小。
S22:为了获取更细粒度的信息并关注相邻项之间的交互,本实施例设计了一个交互层,应用拆分和交互学习来分解高维向量X分为两个增强的子特征X′even和X′odd
S221:拆分,在SBR中,用户行为序列是用户潜在意图的载体,因此会话行为之间的转换和依赖关系至关重要。为了更好地提取转换信息,更容易对项目的依赖关系进行建模,本实施例采用拆分的方法对原始序列X即高维向量X进行拆分分成两个子序列分别是偶元素序列Xeven和奇元素序列Xodd。为了在信息中保留用户意图,本实施例保留了两个子序列用于特征提取,并且每个子序列与原始序列相比具有更粗的时间分辨率。然后,考虑两个子序列的异质性信息,本实施例使用两组不同的样本卷积层处理Xeven和Xodd
S222:交互学习,为了对用户行为之间的转换和依赖关系进行建模,并捕获行为序列的时间信息,本实施例使用了一些卷积模块和一种新的交互式学习策略来实现这两个子特征之间的信息交换。交互学习通过学习仿射变换的参数来实现信息交换,这可以极大地提高子特征的表示能力。这个互动学习过程包括两个部分:
A1:本实施例使用两个不同的一维卷积模块φ和ψ将两个子特征Xeven和Xodd分别转换到隐藏状态。然后本实施例将两个子序列转换为exp格式,并与Xeven和Xodd根据元素点乘进行交互:
Figure BDA0003758309910000061
Figure BDA0003758309910000062
⊙表示元素层面上的乘积,这一部分可以被视为对Xeven和Xodd执行缩放变换,其中缩放因子使用神经网络模块进行相互学习。
A2:本实施例使用另外两个不同的一维卷积模块ρ和η将两个缩放特征
Figure BDA0003758309910000063
Figure BDA0003758309910000064
转换为另外两个隐藏状态,然后在
Figure BDA0003758309910000065
Figure BDA0003758309910000066
中加减:
Figure BDA0003758309910000067
Figure BDA0003758309910000068
步骤S23中,S231:在聚合层中,本实施例通过反转奇偶拆分操作重新排列两个子特征X′even和X′odd的元素,并将它们连接成一个新的序列表示Xnew。;
S232:通过残差连接将新的序列表示添加到原始序列X。
S24:在全连接层中,使用全连接层将增强的序列表示解码为
Figure BDA0003758309910000069
它代表了用户的潜在意图:
Figure BDA00037583099100000610
其中
Figure BDA0003758309910000071
表示完全连接的层。
S3:根据上述输出评估候选项的概率:首先连接最后一项的嵌入xm以及输出Os然后使用前馈神经网络来获得增强的表示O:
O=f(W([Os||xm])+b,
其中||表示串联操作,
Figure BDA0003758309910000072
是加权矩阵,
Figure BDA0003758309910000073
是偏差向量,f(·)表示非线性激活函数SELU。然后,对于每一项i∈I,计算它成为会话中下一个的概率,如下所示:
Figure BDA0003758309910000074
Figure BDA0003758309910000075
其中xi是i的嵌入,L2Norm是L2的归一化函数,wk是归一化权重,
Figure BDA0003758309910000076
表示i的最终概率。本实施例模型的损失函数被定义为真值和预测的交叉熵:
Figure BDA0003758309910000077
其中y是下一个项目的真实概率分布,它是一个一位有效编码,进而根据得出的概率进行推荐。
本实施例提出了一个简洁有效的SBR模型SCIRec,它由一些样本卷积和一个交互式学习策略组成,以及基于采样卷积和交互策略的会话推荐方法。本实施例使用一些卷积模块和一种新颖的交互式学习策略来模拟用户行为之间的转换,并捕获行为序列的时间信息,以提取用户的潜在意图,从而做出更好的推荐。大量的实验表明,在真实的SBR数据集上,所提出的模型可以明显地优于最先进的模型。换句话说,SCIRec可以有效地捕获SBR中的时间和成对项目转换关系信息。
为了评估SCIRec的效率,本实施例将每个时期的训练时间和可训练参数与同一设备上最新的(SOTA)模型进行了比较。结果如表1所示,可以看到SCIRec远比最近的SOTA方法更有效,与基于CNN的方法NextItNet相比,本实施例提出的模型在天猫上实现了24.3倍的加速。与基于GNN的模型相比,SCIRec实现了3.1-51.7倍的加速比。基于这些实验结果,可以得出结论,SCIRec以更少的时间消耗明显地优于最近的SOTA模型,这证明了SCIRec的优越性。表1为天猫上每个方法的一代训练的训练时间,其中s、m和分别代表秒、分和小时。
表1
Figure BDA0003758309910000081
参考表2,表2为三个数据集上与基线的性能比较(%)。总体最佳结果在每个指标中以粗体显示,下划线是所有基线的最佳结果。
本实施例提出的方法在所有数据集上显示出明显的优势。与S2-DHCN相比,其在天猫数据集上的性能提升了10%-29.04%的MRR@10。SCIRec的优异性能表明,对用户行为之间的转换进行建模并捕捉行为序列的时间信息,可以产生更好的推荐,使用细胞神经网络和交互式学习策略来建模SBR中用户行为之间的转换和依赖是有效的。
表2
Figure BDA0003758309910000082
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容是结合具体/优选的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,其还可以对这些已描述的实施方式做出若干替代或变型,而这些替代或变型方式都应当视为属于本发明的保护范围。在本说明书的描述中,参考术语“一种实施例”、“一些实施例”、“优选实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。尽管已经详细描述了本发明的实施例及其优点,但应当理解,在不脱离专利申请的保护范围的情况下,可以在本文中进行各种改变、替换和变更。

Claims (11)

1.一种基于采样卷积和交互策略的会话推荐方法,其特征在于,包括以下步骤:
S1:输入会话序列;
S2:通过基于采样卷积和交互策略的会话推荐模型捕获会话序列的时间信息,提取用户的潜在意图;
S3:基于用户潜在意图评估每个候选项目的概率并进行推荐。
2.如权利要求1所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,步骤S2中包括以下步骤:
S21:通过嵌入层将输入的会话序列转化为高维向量序列X;
S22:通过交互层应用拆分和交互学习来将所述高维向量序列X分解为两个增强的子特征;
S23:通过聚合层得到增强的序列表示;
S24:通过全连接层将所述增强的序列表示解码,解码后的输出表示用户的潜在意图。
3.如权利要求2所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,步骤S22中包括以下步骤:
S221:将所述高维向量序列X拆分为两个子序列;
S222:使用两组不同的样本卷积层以交互式学习策略处理两个子序列,得到两个增强的子特征;
步骤S222中,通过使用卷积模块和交互式学习实现两个子特征之间的信息交换,所述交互式学习通过学习仿射变换的参数来实现信息交换以增强所述子特征的表示能力。
4.如权利要求3所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,所述两个子序列分别是偶元素序列Xeven和奇元素序列Xodd
5.如权利要求3所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,所述交互式学习过程包括:
A1:使用两个不同的一维卷积模块φ和ψ将所述两个子序列分别转换到隐藏状态,并将两个隐藏状态的子序列分别转换为exp格式,将其分别与所述子序列根据元素点乘进行交互,得到两个缩放特征;
A2:使用另外两个不同的一维卷积模块ρ和η将所述两个缩放特征分别转换为另外两个隐藏状态,然后分别在所述两个缩放特征中加减;
所述步骤A1由以下公式表示:
Figure FDA0003758309900000021
其中,⊙表示元素层面上的乘积;
所述步骤A2由以下公式表示:
Figure FDA0003758309900000022
6.如权利要求2所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,所述步骤S23包括以下步骤:
S231:通过反转奇偶拆分操作重新排列所述两个增强的子特征,将其连接成一个新的序列表示Xnew
S232:通过残差连接将所述新的序列表示添加到所述高维向量序列X。
7.如权利要求1所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,所述步骤S3包括以下步骤:
S31:连接最后一项嵌入项目xm以及步骤S2的输出Os,使用前馈神经网络来获得增强的表示O;
S32:计算每一个项目i成为会话中下一个的概率
Figure FDA0003758309900000023
S33:获得下一个项目的真实概率分布。
8.如权利要求7所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,所述步骤S31中增强的表示O由以下公式计算:
O=f(W([Os||xm])+b,
其中,||表示串联操作,
Figure FDA0003758309900000024
是加权矩阵,Os代表用户的潜在意图,
Figure FDA0003758309900000025
是偏差向量,f(·)表示非线性激活函数SELU。
9.如权利要求7所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,步骤S32中,项目i的最终概率
Figure FDA0003758309900000026
由以下公式计算:
Figure FDA0003758309900000027
Figure FDA0003758309900000028
Figure FDA0003758309900000029
其中xi是i的嵌入,L2Norm是L2的归一化函数,wk是归一化权重。
10.如权利要求1-9任一项所述的一种基于采样卷积和交互策略的会话推荐方法,其特征在于,所述模型的损失函数为:
Figure FDA0003758309900000031
其中y是下一个项目的真实概率分布。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时能实现权利要求1-10任一项所述的方法的步骤。
CN202210874268.2A 2022-07-21 2022-07-21 一种基于采样卷积和交互策略的会话推荐方法 Pending CN115169366A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210874268.2A CN115169366A (zh) 2022-07-21 2022-07-21 一种基于采样卷积和交互策略的会话推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210874268.2A CN115169366A (zh) 2022-07-21 2022-07-21 一种基于采样卷积和交互策略的会话推荐方法

Publications (1)

Publication Number Publication Date
CN115169366A true CN115169366A (zh) 2022-10-11

Family

ID=83496162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210874268.2A Pending CN115169366A (zh) 2022-07-21 2022-07-21 一种基于采样卷积和交互策略的会话推荐方法

Country Status (1)

Country Link
CN (1) CN115169366A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116401532A (zh) * 2023-06-07 2023-07-07 山东大学 一种电力系统受扰后频率失稳识别方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116401532A (zh) * 2023-06-07 2023-07-07 山东大学 一种电力系统受扰后频率失稳识别方法及系统
CN116401532B (zh) * 2023-06-07 2024-02-23 山东大学 一种电力系统受扰后频率失稳识别方法及系统

Similar Documents

Publication Publication Date Title
Xia et al. Self-supervised hypergraph convolutional networks for session-based recommendation
Yang et al. Focal attention for long-range interactions in vision transformers
Wang et al. Not all images are worth 16x16 words: Dynamic transformers for efficient image recognition
Li et al. Blueprint separable residual network for efficient image super-resolution
Yang et al. Focal self-attention for local-global interactions in vision transformers
Wang et al. Learning channel-wise interactions for binary convolutional neural networks
Creswell et al. Inverting the generator of a generative adversarial network
Li et al. Scconv: Spatial and channel reconstruction convolution for feature redundancy
Wang et al. Progressive Blockwise Knowledge Distillation for Neural Network Acceleration.
Zhang et al. Unsupervised representation learning from pre-trained diffusion probabilistic models
Fang et al. A new sequential image prediction method based on LSTM and DCGAN
Blanchet et al. Semi‐supervised Learning Based on Distributionally Robust Optimization
Gao et al. Temporal-attentive covariance pooling networks for video recognition
CN113222998B (zh) 基于自监督低秩网络的半监督图像语义分割方法及装置
CN114493014A (zh) 多元时间序列预测方法、系统及计算机产品、存储介质
Wang et al. Channel pruning via lookahead search guided reinforcement learning
Ignatiadis et al. Covariate-powered empirical Bayes estimation
Yuan et al. Spatio-temporal diffusion point processes
CN115169366A (zh) 一种基于采样卷积和交互策略的会话推荐方法
Li et al. Embedded stacked group sparse autoencoder ensemble with L1 regularization and manifold reduction
CN115062587B (zh) 一种基于周围信息的知识图谱嵌入及回复生成方法
CN113806554A (zh) 面向海量会议文本的知识图谱构建方法
Qin et al. Bifsmnv2: Pushing binary neural networks for keyword spotting to real-network performance
CN116415990A (zh) 一种基于云计算的自助数据分析方法、系统及存储介质
Luo et al. HySAGE: A hybrid static and adaptive graph embedding network for context-drifting recommendations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination