CN117473157A

CN117473157A - 一种基于个性化提示学习的序列推荐方法和装置

Info

Publication number: CN117473157A
Application number: CN202311441459.0A
Authority: CN
Inventors: 董辉; 齐盛
Original assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Current assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date: 2023-10-31
Filing date: 2023-10-31
Publication date: 2024-01-30

Abstract

本申请涉及序列推荐技术领域，提供了一种基于个性化提示学习的序列推荐方法和装置。该方法包括：获取用户数据集，用户数据集包括用户属性信息和用户行为序列；将用户属性信息和用户行为序列输入至序列推荐模型，获得用户增强特征向量；其中，序列推荐模型包括提示学习单元和对比学习单元；提示学习单元用于依据用户属性信息，获取用户属性特征向量；对比学习单元用于依据用户属性特征向量和用户行为序列，采用对比学习，获得用户增强特征向量；依据用户增强特征向量，获得序列推荐结果。本申请实施例将提示学习和对比学习增强与序列推荐模型结合，有效提升了推荐场景中冷启动时推荐效果。

Description

一种基于个性化提示学习的序列推荐方法和装置

技术领域

本申请涉及序列推荐技术领域，尤其涉及一种基于个性化提示学习的序列推荐方法和装置。

背景技术

推荐系统在当今生活扮演着不可或缺的作用，无论是网络购物、新闻阅读，还是视频观看等都有其身影。为了让推荐系统推的更准，首先要对物品和用户进行充分建模，通过复杂的手段将用户最有可能点击的物品优先推送给用户，以提升用户的满意度和整个系统的效率。。推荐模型的整体结构一般都是输入给模型一批用户特征和商品特征，对某一个特定商品进行判别用户是否会点击，购买该商品。该判别结果被作为模型的输出结果与真实的用户点击，购买结果进行损失函数计算，从而指导模型进行优化。推荐系统的冷启动通常分为新用户的冷启动和新内容的冷启动。

因此，如何给新加入的用户推荐可能感兴趣的物品，以及，如何将新上架的物品推荐给潜在的用户，即如何提供一种序列推荐模型，有效提升了模型在冷启动场景下的效果，是推荐系统中极具挑战的一个问题。

发明内容

有鉴于此，本申请实施例提供了一种基于个性化提示学习的序列推荐方法、装置、电子设备及计算机可读存储介质，以解决现有序列模型仅建模了整体序列，对于冷启动场景的建模效果不理想的问题。

本申请实施例的第一方面，提供了一种基于个性化提示学习的序列推荐方法，包括：

获取用户数据集，所述用户数据集包括用户属性信息和用户行为序列；

将所述用户属性信息和所述用户行为序列输入至序列推荐模型，获得用户增强特征向量；其中，所述序列推荐模型包括提示学习单元和对比学习单元；所述提示学习单元用于依据所述用户属性信息，获取用户属性特征向量；所述对比学习单元用于依据所述用户属性特征向量和所述用户行为序列，采用对比学习，获得所述用户增强特征向量；

依据所述用户增强特征向量，获得序列推荐结果。

本申请实施例的第二方面，提供了一种基于个性化提示学习的序列推荐装置，适用于第一方面所述的基于个性化提示学习的序列推荐方法，包括：

用户数据集获取模块，被配置为获取用户数据集，所述用户数据集包括用户属性信息和用户行为序列；

用户特征增强模块，被配置为将所述用户属性信息和所述用户行为序列输入至序列推荐模型，获得用户增强特征向量；其中，所述序列推荐模型包括提示学习单元和对比学习单元；所述提示学习单元用于依据所述用户属性信息，获取用户属性特征向量；所述对比学习单元用于依据所述用户属性特征向量和所述用户行为序列，采用对比学习，获得所述用户行为增强特征向量；

序列推荐结果输出模块，被配置为依据所述用户增强特征向量，获得序列推荐结果。

本申请实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，该处理器执行计算机程序时实现第一方面所述方法的步骤。

本申请实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现第一方面所述方法的步骤。

本申请实施例与现有技术相比存在的有益效果至少包括：本申请实施例通过获取用户数据集，用户数据集包括用户属性信息和用户行为序列；然后将用户属性信息和用户行为序列输入至序列推荐模型，获得用户增强特征向量，序列推荐模型包括提示学习单元和对比学习单元；提示学习单元用于依据用户属性信息，获取用户属性特征向量，对比学习单元用于依据用户属性特征向量和用户行为序列，采用对比学习，获得用户增强特征向量；最后，依据用户增强特征向量，获得序列推荐结果。本申请实施例将提示学习和对比学习增强与序列推荐模型结合，有效提升了推荐场景中冷启动时推荐效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本申请实施例提供的一种基于个性化提示学习的序列推荐方法的流程示意图之一；

图2是本申请实施例提供的一种基于个性化提示学习的序列推荐方法的流程示意图之二；

图3是本申请实施例提供的一种基于个性化提示学习的序列推荐方法的流程示意图之三；

图4是本申请实施例提供的一种基于个性化提示学习的序列推荐装置的结构示意图；

图5是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

下面将结合附图详细说明根据本申请实施例的一种基于个性化提示学习的序列推荐方法、装置、电子设备和存储介质。

如背景技术所述，推荐系统在当今生活扮演着不可或缺的作用，无论是网络购物、新闻阅读，还是视频观看等都有其身影。为了让推荐系统推的更准，首先要对物品和用户进行充分建模，通过复杂的手段将用户最有可能点击的物品优先推送给用户，以提升用户的满意度和整个系统的效率。推荐系统的冷启动通常分为新用户的冷启动和新内容的冷启动。

对于新用户，就是行为数量少或者正向行为少的用户。这部分用户通常缺少行为序列特征，所以只能用用户属性信息、外部信息来建模。但是老用户也有这部分信息，所以通常的做法是新老用户共用一个模型，新用户没有行为序列特征就不传进去这部分特征。共用一个模型的好外是:可以减少系统的复杂程度，同时老用户在用户属性部分的训练可以帮助用户模型学习的更好，给新用户也推荐的更好。而在新用户上通常策略也更谨慎一些，不做探索、投放等试探性的推荐，避免损伤用户体验。

对于新内容，其冷启动相对于新用户来说就需要单独处理了。新内容也可以传进去一些属性特征让模型来学习。但是模型学习后的结果怎么推荐给用户呢？通常，新内容是作为一路冷启动召回，首先就是要构建候选池，冷启动候选池通常是发表一定时长内，曝光量不到一定次数的内容。其中可以更细化对不同类别的内容设置不同的时效，比如新闻需要的冷启时效更强，知识类需要的冷启时效更低。通常可以分两步，第一步在一定时效内给所有内容都做一个小额保量。这里的召回当然也不是随机的，可以用一些通用的模型，比如dssm，以完播的样本作为正样本。第二步对于在第一步表现好的内容，加大冷启额度，进一步提高曝光。经过排序模型后，新内容的分数通常很低，这里需要专门对新内容的排序分数大额提权或者强插。

通常，推荐模型的整体结构一般都是输入给模型一批用户特征和商品特征，对某一个特定商品进行判别用户是否会点击，购买该商品。该判别结果被作为模型的输出结果与真实的用户点击，购买结果进行损失函数计算，从而指导模型进行优化。序列推荐在电商和新闻推荐中经常出现，通过对整个序列建模去预测下一个用户可能点击的物品。典型的有DIN(Deep Interest Network)，Bert4Rec等模型。但是上述序列模型建模了整体序列，但是对于冷启动场景的建模效果不理想。因此，如何给新加入的用户推荐可能感兴趣的物品，以及，如何将新上架的物品推荐给潜在的用户，是推荐系统中极具挑战的一个问题。本申请的目标是提出了一种序列推荐模型，有效提升了模型在冷启动场景下的效果。

本申请的基于个性化提示学习的序列推荐模型框架依托于构建上述序列推荐模型包括基于深度兴趣网络模型DIN或者深度兴趣进化网络模型DIEN或者行为序列Transformer模型BST中的任一种兴趣模型结构。在此基础上增加了用户个性化提示学习模块，用来解决用户冷启动的问题，增加了对比学习模块，用来解决推荐模型训练过程中的数据稀疏问题。为了能够对个性化提示进行更充分的训练，引入了对比学习。通过对个性化提示和用户行为进行增广，生成增广后的用户行为表示，从而构建有效的对比学习损失。因此，上述基于个性化提示学习的序列推荐模型，将提示学习与序列推荐模型结合，有效解决了推荐场景中冷启动的难题；通过引入对比学习增广，有效缓解了用户属性噪声，对用户的历史行为进行了数据增强，有效提升了推荐模型的准确性。

基于上述个性化提示学习的序列推荐模型，如图1所示为本申请的一种基于个性化提示学习的序列推荐方法流程图，上述方法包括：

S101：获取用户数据集，上述用户数据集包括用户属性信息和用户行为序列。

S102：将上述用户属性信息和上述用户行为序列输入至序列推荐模型，获得用户增强特征向量；其中，上述序列推荐模型包括提示学习单元和对比学习单元；上述提示学习单元用于依据上述用户属性信息，获取用户属性特征向量；上述对比学习单元用于依据上述用户属性特征向量和上述用户行为序列，采用对比学习，获得上述用户增强特征向量。

S103：依据上述用户增强特征向量，获得序列推荐结果。

在一些实施例中，用户属性信息包括年龄、性别、地址位置和/或操作终端。

在一些实施例中，上述提示学习单元用于依据上述用户属性信息，获取用户属性特征向量，如图2所示，包括：

S211：生成对应上述用户属性信息的用户属性信息提示模板。

S212：依据上述用户属性信息提示模板，生成用户属性信息提示语句。

S213：将上述用户属性信息提示语句输入至大语言模型，获得上述用户属性特征向量；上述大语言模型包括BERT或GPT3。

具体地，序列推荐模型的输入主要包括两个部分：用户基本属性信息和用户序列信息。在冷启动场景中，用户的浏览序列往往非常短，甚至没有，按照常规的方式进行模型训练和推理，由于数据的短缺，训练的模型不能兼顾新用户的体验。为了解决上述问题，考虑从用户基本属性出发，使用大语言模型，进行个性化提示学习，从而获得高质量的用户embedding表示。用户属性编码整理，提示词构造，输入大语言模型，获取用户基础向量。用户基本属性为：年龄，性别，职业，地理位置，手机设备等。在此基础上，我们对其进行提升词构造，如：“在电商推荐场景下，用户的基本信息如下<性别><年龄><职业>，请表达出其最佳的推荐语义向量”。然后输入经过大语料训练的模型，并从中提取出潜在的语义表征。

在一些实施例中，上述对比学习单元用于依据上述用户属性特征向量和上述用户行为序列，采用对比学习，获得上述用户增强特征向量，如图3所示，包括：

S311：获取对应于用户行为序列的上述用户行为序列特征向量。

S312：将上述用户属性特征向量中特定比例的用户属性元素随机替换为掩膜后，与上述用户属性特征向量进行对比学习，获得第一用户属性增强特征向量。

S313：将上述用户行为序列特征向量中特定比例的用户行为元素随机替换为掩膜后，与上述用户行为序列特征向量进行对比学习，获得第一用户行为增强特征向量。

S314：对上述第一用户属性增强特征向量和上述第一用户行为增强特征向量进行拼接，获得上述用户增强特征向量。

具体地，基于个性化提示学习之后，我们可以得到一个用户的基础向量，然后和用户的序列特征向量拼接起来，输入下游的模块中，进行CTR的预估，这是整个框架的流程。为了解决数据稀疏问题，我们创造性的在用户属性和用户序列建模中引入了对比学习，通过随机屏蔽掉某些序列item的方式，提高模型训练的鲁棒性。最后将本身模块的向量表达和对比学习模块的向量输出一起拼接送入后续的模块。

在一些实施例中，上述对比学习包括构建对比学习损失函数，上述对比学习损失函数用于最小化上述用户增强特征向量和上述用户行为序列特征向量之间的差异。

在一些实施例中，依据上述用户增强特征向量，获得序列推荐结果，包括将上述用户增强特征向量输入至点击率预估模型，获得序列推荐结果。

需要说明的是，点击率预估模型CTR是序列推荐系统中非常重要的一个环节,其预估效果会直接影响推荐系统的性能。点击率预估模型研究的问题是已知当前要推荐的用户、当前所处上下文、待计算的物品，通过模型计算出用户点击该物品概率，将待排序物品全部计算出预估点击率，再由高至低排序输出。以DIN模型为例，在获得用户增强特征向量后，会将该向量进一步与物品特征甚至是上下文特征等输入至DIN模型后续的Embeddinglayer、Pooling&Concat layer和多层感知机MLP，以便得到序列推荐结果。

在一些实施例中，构建上述序列推荐模型包括基于深度兴趣网络模型DIN或者深度兴趣进化网络模型DIEN或者行为序列Transformer模型BST中的任一种模型结构。

具体地，DIN模型是应用一个Attention机制来加大与目标物品相似的历史物品的权重，Atention没有位置的先后顺序，即打乱历史物品的顺序，并不影响最后的结果。由于点击率预估是在线广告以及电商的非常重要的业务，目前以embedding+MLP为主的深度学习方法也广为应用。在这些方法中，用户特征用固定长度的向量来表示，而已有的方法往往忽视获取用户历史行为中的兴趣多样性。DIN模型的基线模型结构主要包括三个模块：Embedding layer、Pooling&Concat layer和多层感知机MLP。其中，Embedding layer的作用是把高维稀疏的输入转成低维稠密向量，每个离散特征下面都会对应着一个embedding词典。Pooling&Concat layer中，podling层的作用是将用户的历史行为embedding这个最终变成一个定长的向量，因为每个用户历史买的商品数是不一样的，也就是每个用户multi-hot中1人人数不一致，这样经过embedding层，得到的用户历史行为embedding的人数不样多，也就是上面的embedding列表t不一样长，那么这样的话，每人用户的历史行为特征拼起来就不一样长了。而后面如果加全连接网络的话，我们知道，他需要定长的特征输入。Concat laver层的作用就是拼接了，就是把这所有的特征embedding向量，如果再有连续持征的话也算上，从特征维度拼接整合，作为MLP的输入。在这里就是将用户历史行为数据进行无差别拼接了，后面DIN的改进也是基于这部分进行的修改。

具体地，DIEN模型是DIN模型的改进版本。已经有的DIN模型，它强调用户兴趣是多样的，并使用基于注意力模型来捕获目标项目的相对兴趣。但是用户的兴趣是不断进化的，而DIN抽取的用户兴趣之间是独立无关联的，没有捕获到兴趣的动态进化性，但是在电商推荐的场景下，用户的兴趣是不断变化的，DIEN模型可以捕获与目标商品相关商品的兴趣发展路径，DIEN最大的特点是不但要找到用户的兴趣，还要抓住用户兴趣的进化过程。

本申请实施例通过获取用户数据集，用户数据集包括用户属性信息和用户行为序列；然后将用户属性信息和用户行为序列输入至序列推荐模型，获得用户增强特征向量，序列推荐模型包括提示学习单元和对比学习单元；提示学习单元用于依据用户属性信息，获取用户属性特征向量，对比学习单元用于依据用户属性特征向量和用户行为序列，采用对比学习，获得用户增强特征向量；最后，依据用户增强特征向量，获得序列推荐结果。本申请实施例将提示学习和对比学习增强与序列推荐模型结合，有效提升了推荐场景中冷启动时推荐效果。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图4是本申请实施例提供的一种基于个性化提示学习的序列推荐装置的示意图。如图4所示，适用于上述基于个性化提示学习的序列推荐方法，上述装置包括：

用户数据集获取模块401，能够获取用户数据集，上述用户数据集包括用户属性信息和用户行为序列；

用户特征增强模块402，能够将上述用户属性信息和上述用户行为序列输入至序列推荐模型，获得用户增强特征向量；其中，上述序列推荐模型包括提示学习单元和对比学习单元；上述提示学习单元用于依据上述用户属性信息，获取用户属性特征向量；上述对比学习单元用于依据上述用户属性特征向量和上述用户行为序列，采用对比学习，获得上述用户行为增强特征向量；

序列推荐结果输出模块403，能够依据上述用户增强特征向量，获得序列推荐结果。

应理解，本说明书实施例的一种基于个性化提示学习的序列推荐装置还可执行图1至图3中基于个性化提示学习的序列推荐装置执行的方法，并实现基于个性化提示学习的序列推荐装置在图1至图3所示实例的功能，在此不再赘述。同时，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

图5是本申请实施例提供的电子设备5的示意图。如图5所示，该实施例的电子设备5包括：处理器501、存储器502以及存储在该存储器502中并且可在处理器501上运行的计算机程序503。处理器501执行计算机程序503时实现上述各个方法实施例中的步骤。或者，处理器501执行计算机程序503时实现上述各装置实施例中各模块/单元的功能。

电子设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备5可以包括但不仅限于处理器501和存储器502。本领域技术人员可以理解，图5仅仅是电子设备5的示例，并不构成对电子设备5的限定，可以包括比图示更多或更少的部件，或者不同的部件。

存储器502可以是电子设备5的内部存储单元，例如，电子设备5的硬盘或内存。存储器502也可以是电子设备5的外部存储设备，例如，电子设备5上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。存储器502还可以既包括电子设备5的内部存储单元也包括外部存储设备。存储器502用于存储计算机程序以及电子设备所需的其它程序和数据。

处理器501可以是中央处理单元(Central Processing Unit，CPU)，也可以是其它通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器501从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成共享资源访问控制装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

获取用户数据集，上述用户数据集包括用户属性信息和用户行为序列；

将上述用户属性信息和上述用户行为序列输入至序列推荐模型，获得用户增强特征向量；其中，上述序列推荐模型包括提示学习单元和对比学习单元；上述提示学习单元用于依据上述用户属性信息，获取用户属性特征向量；上述对比学习单元用于依据上述用户属性特征向量和上述用户行为序列，采用对比学习，获得上述用户增强特征向量；

依据上述用户增强特征向量，获得序列推荐结果。

上述如本说明书图1至图3所示实施例揭示的基于个性化提示学习的序列推荐方法可以应用于处理器501中，或者由处理器501实现。处理器501可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以实现或者执行本说明书实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

当然，除了软件实现方式之外，本说明书实施例的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如，在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

本说明书实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1至图3所示实施例的基于个性化提示学习的序列推荐方法，并具体用于执行以下方法：

依据上述用户增强特征向量，获得序列推荐结果。

总之，以上该仅为本说明书的较佳实施例而已，并非用于限定本说明书的保护范围。凡在本说明书的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本说明书的保护范围之内。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种基于个性化提示学习的序列推荐方法，其特征在于，包括：

依据所述用户增强特征向量，获得序列推荐结果。

2.根据权利要求1所述的方法，其特征在于，用户属性信息包括年龄、性别、地址位置和/或操作终端。

3.根据权利要求2所述的方法，其特征在于，所述提示学习单元用于依据所述用户属性信息，获取用户属性特征向量，包括：

生成对应所述用户属性信息的用户属性信息提示模板；

依据所述用户属性信息提示模板，生成用户属性信息提示语句；

将所述用户属性信息提示语句输入至大语言模型，获得所述用户属性特征向量；所述大语言模型包括BERT或GPT3。

4.根据权利要求1所述的方法，其特征在于，所述对比学习单元用于依据所述用户属性特征向量和所述用户行为序列，采用对比学习，获得所述用户增强特征向量，包括：

获取对应于用户行为序列的所述用户行为序列特征向量；

将所述用户属性特征向量中特定比例的用户属性元素随机替换为掩膜后，与所述用户属性特征向量进行对比学习，获得第一用户属性增强特征向量；

将所述用户行为序列特征向量中特定比例的用户行为元素随机替换为掩膜后，与所述用户行为序列特征向量进行对比学习，获得第一用户行为增强特征向量；

对所述第一用户属性增强特征向量和所述第一用户行为增强特征向量进行拼接，获得所述用户增强特征向量。

5.根据权利要求4所述的方法，其特征在于，所述对比学习包括构建对比学习损失函数，所述对比学习损失函数用于最小化所述用户增强特征向量和所述用户行为序列特征向量之间的差异。

6.根据权利要求1所述的方法，其特征在于，依据所述用户增强特征向量，获得序列推荐结果，包括将所述用户增强特征向量输入至点击率预估模型，获得序列推荐结果。

7.根据权利要求1至6任一项所述的方法，其特征在于，构建所述序列推荐模型包括基于深度兴趣网络模型DIN或者深度兴趣进化网络模型DIEN或者行为序列Transformer模型BST中的任一种模型结构。

8.一种基于个性化提示学习的序列推荐装置，其特征在于，所述装置包括：

9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序，其特征在于，所述处理器在执行所述计算机程序时，实现如权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。