CN114780862A

CN114780862A - 一种用户兴趣向量提取方法、提取模型及计算机系统

Info

Publication number: CN114780862A
Application number: CN202210701107.3A
Authority: CN
Inventors: 刘文海; 于敬; 石京京; 王灿; 纪达麒; 陈运文
Original assignee: Daguan Data Chengdu Co ltd
Current assignee: Daguan Data Chengdu Co ltd
Priority date: 2022-06-21
Filing date: 2022-06-21
Publication date: 2022-07-22
Anticipated expiration: 2042-06-21
Also published as: CN114780862B

Abstract

本发明涉及到一种用户兴趣向量提取方法、提取模型及计算机系统，属于人工智能领域。基于用户双向反馈的用户兴趣向量提取方法包括有如下步骤：第一步，数据拿到；第二步，特征获得；第三步，模型构建；第四步，模型训练；第五步，模型应用；还涉及一种基于用户双向反馈的用户兴趣向量的提取模型，该提取模型包括有商品特征嵌入层、拼接层、激活网络、池化层和差值模块；还涉及一种计算机系统，该计算机系统中含有用户兴趣向量提取模型，该模型作为计算机程序运行，执行上述提取方法的步骤。本发明的方法充分利用用户双向反馈的数据，构建专门模型来实现用户兴趣向量的精准获取，用更精准的用户兴趣向量来表述用户的兴趣。

Description

一种用户兴趣向量提取方法、提取模型及计算机系统

技术领域

本发明涉及人工智能领域，具体涉及到一种基于用户双向反馈的用户兴趣提取方法、提取模型及计算机系统。

背景技术

在推荐排序算法发展的过程中,一些算法创造性的加入了用户行为序列,将用户行为序列作为排序模型的一个上下文特征,来预测用户对当前商品的点击概率，解决了用户兴趣多样性、用户兴趣随时间迁移的问题，在实际应用中也取得了明显的收益。

但是在已有的实际应用中，大多是从用户的已有行为中,获取用户的兴趣。比如DIN模型中,通过用户行为建模获取用户兴趣向量。但是，如果只使用正向行为进行建模，会将用户的兴趣过度集中在已有行为上，将用户兴趣‘窄化’而无法获得更好的泛化能力，在排序时也无法给用户足够的惊喜度。根据我们的理解，用户点击或购买某个商品，一定是对该商品具有的某个或某些特性感兴趣，但不应该使用当前商品的所有特征来完全代表用户的兴趣。如果能将用户的特征或者特性通过一些方式提取出来，可以更精准描述用户兴趣，且获得更好的泛化能力。

另外,对于常见的推荐系统而言，其曝光给用户的商品，本身经历过召回和排序的筛选，虽然没有点击，在很大程度上也是可以反映用户的兴趣点所在。但是目前在用户兴趣建模中，曝光给用户但是其没有点击称为负反馈行为，该负反馈行为很少看到有效的利用方式，这是对数据的极大浪费。另外，单单用户点击等操作行为预测的结果往往有偏差，影响其预测的精度。

发明内容

本发明的目的在于克服上述现有技术中存在的不足，提供一种基于用户双向反馈的用户兴趣提取方法、提取模型及计算机系统。本发明的方法、模型及系统要能够充分利用双向反馈数据来反映用户的兴趣，从而更为精准地描述用户兴趣，获得更好的泛化能力。

为了达到上述发明目的，本发明专利提供的技术方案如下：

本发明首先涉及一种用户兴趣向量提取方法，该方法包括有如下步骤：

第一步，数据拿到，将用户的行为数据和商品的信息数据输入，用户已经发生的行为包括正反馈行为和负反馈行为两种类型，正反馈行为包括用户对商品的浏览、加购物车、收藏或购买操作，负反馈行为是用户曝光了商品，但未对商品产生浏览、加购物车、收藏或购买操作，将用户过往已经接触到的商品结合对应的行为类型分为正反馈商品和负反馈商品，所述正反馈商品和负反馈商品均作为行为商品，将行为商品作为用户兴趣向量提取的基础数据，以用户曝光点击行为作为时间界限，将后续用户曝光且点击的商品作为正样本，用户曝光但未点击的商品作为负样本，正样本商品和负样本商品均作为候选商品，设置正样本商品对应标签1，负样本商品对应标签0，商品的信息数据包括商品的ID、类别、品牌和所属店铺；

第二步，特征获得，对于包括正反馈商品和负反馈商品的行为商品，分别依据商品的ID、类别、品牌和所属店铺进行multi_hot编码获得行为商品稀疏的特征向量，分别得到正反馈商品特征向量稀疏的和负反馈商品稀疏的特征向量，所述候选商品经过multi_hot编码得到候选商品稀疏的特征向量；

第三步，模型构建，该模型结构上包括有商品特征嵌入层、拼接层、激活网络、池化层和差值模块，所述商品特征嵌入层分别将行为商品稀疏的特征向量和候选商品稀疏的特征向量映射为稠密的特征向量，所述拼接层分别将正反馈商品和负反馈商品的ID、类别、品牌和所属店铺四个领域的特征拼接得到正反馈商品拼接向量和负反馈商品拼接向量，将候选商品ID、类别、品牌和所属店铺四个领域的特征拼接得到候选商品拼接向量，所述激活网络将正反馈商品拼接向量、负反馈商品拼接向量分别与候选商品拼接向量相关程度进行衡量处理，得到行为商品的关联度，该关联度即权重，将行为商品的拼接向量乘以行为商品拼接向量的权重，分别获得正反馈商品的加权向量和负反馈商品的加权向量，所述池化层将行为商品的加权向量相加并池化，分别得到商品的正向特征向量和商品的负向特征向量，差值模块将正向特征向量与负向特征向量求差值，该差值为用户兴趣向量；

第四步，模型训练，将第一步得到的样本数据输入至第三步的模型中进行模型训练，依据模型输出的用户兴趣向量进行数据调整，即通过反向传播进行模型参数的迭代，直至模型精度不再增加时停止迭代，得到收敛的模型，完成提取模型的训练；

第五步，模型应用，将新的用户行为数据输入到训练好的提取模型中，提取需要的用户兴趣向量。

在所述第一步中，正反馈行为需要根据规则进行筛选，将浏览行为作为有效数据类型的标准是：浏览时长大于20秒才作为有效的正反馈行为。

所述第一步中，需要提取当前样本发生之前的行为数据，正反馈商品和负反馈商品对应的行为时间需要在候选商品对应行为时间的时间之前，避免特征穿越。

在所述第三步中，利用multi_hot编码所得到的稀疏的特征向量，需要再输入一个embedding-layer，将其映射到稠密空间，分别得到行为商品稠密的特征向量和候选商品稠密的特征向量。

在所述第四步中，所述负样本和正样本分别选取80%作为训练集，20%作为测试集。

在所述第四步中，用来衡量在当前行为商品和候选商品之间的相关程度，使用两个商品向量余弦相似度计算，从而获得其权重。

本发明还涉及到一种用户兴趣向量的提取模型，该提取模型包括有商品特征嵌入层、拼接层、激活网络、池化层和差值模块；

所述商品特征嵌入层，将行为商品稀疏的特征向量映射到稠密空间获得正反馈商品和负反馈商品稠密的特征向量，并将候选商品稀疏的特征向量映射到稠密空间获得候选商品稠密的特征向量；

所述拼接层，将正反馈商品及负反馈商品中ID、类别、品牌和所属店铺四个领域特征的稠密向量进行拼接，得到正反馈商品拼接向量和负反馈商品拼接向量，并将候选商品的ID、类别、品牌和所属店铺四个领域的特征直接拼接得到候选商品拼接向量；

所述激活网络，接收输入的正反馈商品的拼接向量和负反馈商品的拼接向量以及候选商品的拼接向量，将正反馈商品拼接向量、负反馈商品拼接向量分别与候选商品拼接向量相关程度进行衡量，得到行为商品和候选商品的关联度，该关联度即为权重，将行为商品的拼接向量乘以行为商品的权重，分别获得正反馈商品的加权向量和负反馈商品的加权向量；

所述池化层，将正反馈商品的加权向量和负反馈商品的加权向量求和池化，分别得到商品的正向特征向量和负向特征向量；

所述差值模块，将商品的正向特征向量和商品的负向特征向量求差值，得到用户兴趣向量。

在上述发明和模型设计的基础上，本发明还涉及到一种计算机系统，该计算机系统中含有用户兴趣向量提取模型，该模型作为计算机程序运行，执行方法中描述的各个步骤。

基于上述技术方案，本发明一种基于用户双向反馈的用户兴趣提取方法、提取模型及计算机系统经过实践应用，取得了如下技术效果：

1.本发明的充分利用用户对商品的双向反馈行为，构建用户兴趣向量抽取模型，将用户的行为数据包括正反馈行为和负反馈行为两种类型，分别对两种数据进行训练、学习，从而获得收敛用户兴趣向量抽取模型，更精准的用户兴趣向量来表述用户的兴趣。

2.本发明利用正反馈行为和负反馈行为的差值向量作为用户兴趣向量，避免了单纯使用正反馈行为带来的兴趣窄化，获得更好的泛化效果。

3.本发明在构建正反馈商品特征时，增加了反馈类型的维度，捕捉到了不同行为所反应的用户兴趣向量的不同，从而获得更精准的用户兴趣向量。

附图说明

图1是本发明一种用户兴趣向量提取方法的实现流程示意图。

图2是本发明一种用户兴趣向量提取模型的模型结构结构示意图。

具体实施方式

下面我们结合附图和具体的实施例来对本发明一种基于用户双向反馈的用户兴趣向量的提取方法、提取模型及计算机系统做进一步的详细阐述，以求更为清楚明了地理解其结构组成和工作流程，但不能以此来限制本发明的保护范围。

本领域的技术人员都知晓，本发明专利申请当中利用用户双向反馈来获得用户兴趣向量的实现方式，可以是一个方法或计算机程序，也可以是一个模型系统或者计算机系统以及含有软硬件的计算机设备。故而本发明专利申请实现方式采取用户兴趣向量的提取方法、用户兴趣向量的提取模型以及含有上述提取模型程序来执行提取方法的计算机系统表述。

在常见的推荐系统中，其曝光给用户的商品本身经历过召回和排序的筛选，用户虽然没有进行点击操作，在很大程度上也是可以反映用户的兴趣点所在的。我们将作为曝光给用户进行过浏览、加入购物车、收藏以及购买行为成为正反馈行为，而将曝光给客户，但是客户却没有进行点击，我们称为负反馈行为。现有的用户兴趣提取模型中，一般都是利用的正反馈行为，负反馈行为很少存在有效的利用方式，这样就会造成数据利用的缺失，缺少负反馈行为的应用是对数据的极大浪费。

举例来说，在一些文本模型(word2vec)中可以获取词向量，词向量之间的运算也具有一定的意义，比如‘皇帝-国王=皇后-王后’。在实际用户正反馈、负反馈行为中，可能对应的商品本身差别就不大(类似皇帝和国王的关系),我们可以参考词向量之间的运算，将用户正向反馈行为和用户负向反馈行为相减，将它们的差值向量作为具有更好泛化能力的用户隐含兴趣向量。我们认为，对皇帝有正反馈、对国王有负反馈的用户A，和对皇后有正反馈、对王后有负反馈的用户B，用户A和用户B具有相同的兴趣特征。再比如,一个用户点击了‘运动裤’但是没有点击‘休闲裤’,另外一个用户点击了‘运动鞋’没有点击‘休闲鞋’,那我们可以认为这两个用户都更偏向于运动风格而不是休闲风格，他们具有相同的隐含兴趣向量,将‘运动裤’和’休闲裤‘之间的差值向量，作为用户的隐含兴趣向量，用于后续的建模。通过这样的方式，我们建立的用户兴趣模型不仅仅只捕捉到了‘运动裤’的兴趣,而且捕捉到了更具泛化能力的‘运动’兴趣。

基于上述分析，本发明首先涉及一种基于用户双向反馈的用户兴趣向量提取方法，如图1所示，该方法包括有如下步骤：

第一步，数据拿到，收集用户的行为数据和商品的信息数据，用户的行为数据包括正反馈行为和负反馈行为两种类型，正反馈行为包括用户的浏览、加购物车、点赞、收藏和购买行为的至少一种，负反馈行为是向用户曝光了商品，但用户并没有对商品产生任何正反馈行为，即不存在浏览、加购物车、点赞、收藏和购买行为任何一种行为。将用户过往已经接触到的商品即向用户曝光的商品，结合对应的用户行为类型分为正反馈商品和负反馈商品，将所述正反馈商品和负反馈商品均作为行为商品，将行为商品作为用户兴趣向量提取的基础数据，将用户尚未接触到的商品也即未向用户曝光的商品作为候选商品。以用户曝光点击行为作为时间界限，将后续用户曝光且点击的商品作为正样本，用户曝光但未点击的商品作为负样本，正样本商品和负样本商品均作为候选商品，设置正样本商品对应标签1，负样本商品对应标签0。在正样本和负样本数据中，各取80%做训练集，取20%做测试集，反馈行为需要根据规则进行筛选，例如将浏览行为作为有效数据类型的标准是：浏览时长大于20秒才作为有效的正反馈行为。商品的信息数据包括商品的ID、类别、品牌和所属店铺。

第二步，特征获得，对于包括正反馈商品和负反馈商品的行为商品，分别依据商品的ID、类别、品牌和所属店铺进行multi_hot编码获得行为商品稀疏的特征向量，分别得到正反馈商品稀疏的特征向量和负反馈商品稀疏的特征向量，所述候选商品经过multi_hot编码得到候选商品稀疏的特征向量。

第三步，模型构建，该模型结构上包括有商品特征嵌入层、拼接层、激活网络、池化层和差值模块，所述商品特征嵌入层分别将行为商品稀疏的特征向量和候选商品稀疏的特征向量映射为稠密的特征向量，所述拼接层分别将正反馈商品和负反馈商品的ID、类别、品牌和所属店铺四个领域的特征拼接得到正反馈商品拼接向量和负反馈商品拼接向量，将候选商品ID、类别、品牌和所属店铺四个领域的特征拼接得到候选商品拼接向量，所述激活网络将正反馈商品拼接向量、负反馈商品拼接向量分别与候选商品拼接向量相关程度进行衡量处理，得到行为商品的关联度，该关联度即权重，将行为商品的拼接向量乘以行为商品拼接向量的权重，分别获得正反馈商品的加权向量和负反馈商品的加权向量，所述池化层将行为商品的加权向量相加并池化，分别得到商品的正向特征向量和商品的负向特征向量，差值模块将商品的正向特征向量与商品的负向特征向量求差值，该差值为用户对于该商品的兴趣向量。在构建模型训练样本时，需要提取当前样本发生之前的行为数据，正反馈商品和负反馈商品对应的行为时间需要在候选商品对应行为时间的时间之前，避免特征穿越。在利用multi_hot编码得到稀疏的特征向量后，为了便于数据后续利用，还需要再将其输入到一个embedding-layer中，将其映射到稠密空间，得到稠密的特征向量，分别得到行为商品稠密的特征向量和候选商品稠密的特征向量，此处的embedding-layer作为模型的商品特征嵌入层。

第四步，模型训练，将第一步得到的用户行为数据和商品信息经过第二步编码得到特征向量以后，再分别输入至第三步的模型中，结合样本的标签，该标签为0或1，分别表示负样本和正样本，对于候选商品若有点击行为作为正样本，若无点击行为作为负样本，正样本表示实际场景下，用户点击了候选商品；负样本表示实际场景下，用户未点击候选商品。依据模型输出用户兴趣向量进行模型训练调整，通过反向传播对模型参数进行迭代，至模型精度不再增加时停止迭代，得到收敛的模型，完成训练。在模型训练时，需要不断尝试和调整，调整的参数就是weight和bias，简写为w和b，在深度学习时通过前向计算和反向传播，不断调整参数，来提取最优特征，以达到预测的目的。模型训练时损失函数使用二元交叉墒(BinaryCrossentropy)，优化器使用Adagrad，具体而言，模型使用二元交叉墒作为损失函数，函数定义如下：

其中，N表示样本数量，y⁽ⁱ⁾表示实际标签，y^{^(i)}表示预测标签，模型训练时采用的都是常规技术，不是本发明专利的创新点，此处不需要展开描述。

第五步，模型应用，将新的用户行为数据输入到训练好的提取模型中，提取需要的用户兴趣向量，作为精准地描述用户兴趣的标准。

在所述第四步中，衡量在当前行为商品和候选商品之间的相关程度时，使用两个商品向量余弦相似度计算，从而获得其权重。

作为本发明专利的核心之一，本发明构建了一种基于用户双向反馈的用户兴趣向量的提取模型，如图2所示，该提取模型包括有商品特征嵌入层、拼接层、激活网络、池化层和差值模块。

所述商品特征嵌入层embedding layer，根据用户的行为数据获得正反馈商品特征和负反馈商品特征，但是该特征向量是稀疏的，需要通过商品特征嵌入层将其映射到稠密空间获得稠密向量。因为商品的ID、类别、品牌、店铺本身是非常稀疏的,为了保证模型快速收敛,通过嵌入层将特征映射为稠密向量，另外，候选商品稀疏的特征向量也需要映射为稠密的特征向量。

所述拼接层concat layer，将正反馈商品及负反馈商品中ID、类别、品牌和所属店铺四个领域的特征的稠密向量进行拼接，得到正反馈商品拼接向量和负反馈商品拼接向量，并将候选商品的ID、类别、品牌和所属店铺四个领域的特征直接拼接得到候选商品拼接向量。商品的特征进行稠密化后,将各个特征的稠密向量拼接,得到商品的稠密拼接向量。

所述激活网络，将正反馈商品的拼接向量、负反馈商品的拼接向量和候选商品的拼接向量均输入到该激活网络中，将正反馈商品拼接向量、负反馈商品拼接向量分别与候选商品拼接向量相关程度进行衡量，得到行为商品和候选商品的关联度，该关联度即为权重，将行为商品的拼接向量乘以行为商品的权重，分别获得正反馈商品的加权向量和负反馈商品的加权向量；用来衡量在当前商品和候选商品之前的相关程度(Attention机制),可以使用两个商品向量余弦相似度来计算。Attention机制即注意力机制，在序列学习任务上具有巨大的提升作用。Attention机制本质上可以理解为一种加权求和机制（weight-sum）,让模型中更加有用的信息获得更大的权重，属于常规技术应用。具体在本发明中，通过将用户正/负反馈商品向量和候选商品向量进行相关度计算，得到各个正/负反馈商品向量在当前场景下的的权重，从而获得用户更多样性和更精准的表达。

所述池化层sum pooling layer，将权重和原始的商品拼接向量相乘得到的商品的加权特征向量求和并池化，分别得到商品的正向特征向量和负向特征向量，所述原始的商品拼接向量即正反馈商品的拼接向量和负反馈商品的拼接向量，也即行为商品的拼接向量。

所述差值模块，将正反馈的商品特征向量相加得到的正向特征向量，将负反馈的商品特征向量相加得到的负向特征向量相减，求其差值，差值模块将正向特征向量和负向特征向量的差值作为获得的用户兴趣向量。

在上述发明方法和模型设计的基础上，本发明还涉及到一种计算机系统。该计算机系统中含有用户兴趣向量提取模型，该模型作为计算机程序运行，执行基于用户双向反馈的用户兴趣向量提取方法中描述的各个步骤。

毫无疑问，以上只是本发明用户兴趣向量提取方法和提取模型中的一种实现方式，除此之外还可以有其他类似的实现方式和模型结构。总而言之，本发明的保护范围还包括其他对于本领域技术人员来说显而易见的变换和替代。

Claims

1.一种用户兴趣向量提取方法，其特征在于，该方法包括有如下步骤：

第二步，特征获得，对于包括正反馈商品和负反馈商品的行为商品，分别依据商品的ID、类别、品牌和所属店铺进行multi_hot编码获得行为商品稀疏的特征向量，分别得到正反馈商品稀疏的特征向量和负反馈商品稀疏的特征向量，所述候选商品经过multi_hot编码得到候选商品稀疏的特征向量；

第三步，模型构建，该模型结构上包括有商品特征嵌入层、拼接层、激活网络、池化层和差值模块，所述商品特征嵌入层分别将行为商品稀疏的特征向量和候选商品稀疏的特征向量映射为稠密的特征向量，所述拼接层分别将正反馈商品和负反馈商品的ID、类别、品牌和所属店铺四个领域的特征拼接得到正反馈商品拼接向量和负反馈商品拼接向量，将候选商品ID、类别、品牌和所属店铺四个领域的特征拼接得到候选商品拼接向量，所述激活网络将正反馈商品拼接向量、负反馈商品拼接向量分别与候选商品拼接向量相关程度进行衡量处理，得到行为商品的关联度，该关联度即权重，将行为商品的拼接向量乘以行为商品拼接向量的权重，分别获得正反馈商品的加权向量和负反馈商品的加权向量，所述池化层将行为商品的加权向量求和池化，分别得到商品的正向特征向量和商品的负向特征向量，差值模块将商品的正向特征向量与商品的负向特征向量求差值，该差值为用户兴趣向量；

第四步，模型训练，将第一步得到的样本数据经过第二步处理后，输入至第三步的模型中进行模型训练，依据模型输出的用户兴趣向量进行数据调整，即通过反向传播进行模型参数的迭代，直至模型精度不再增加时停止迭代，得到收敛的模型，完成提取模型的训练；

第五步，模型应用，将新的用户行为数据输入到训练好的提取模型中，提取所需要的用户兴趣向量。

2.根据权利要求1所述的一种用户兴趣向量提取方法，其特征在于，所述第一步中，所述正反馈行为需要根据规则进行筛选，将浏览行为作为有效数据类型的标准是：浏览时长大于20秒才作为有效的正反馈行为。

3.根据权利要求1所述的一种用户兴趣向量提取方法，其特征在于，所述第一步中，需要提取当前样本发生之前的行为数据时，正反馈商品和负反馈商品对应的行为时间需要在候选商品对应行为时间的时间之前，避免特征穿越。

4.根据权利要求1所述的一种用户兴趣向量提取方法，其特征在于，所述第三步中，在利用multi_hot编码得到稀疏的特征向量后，需要再输入一个embedding-layer，将其映射到稠密空间。

5.根据权利要求1所述的一种用户兴趣向量提取方法，其特征在于，所述第四步中，衡量在当前行为商品和候选商品之间的相关程度时，使用两个商品向量余弦相似度计算，从而获得其权重。

6.根据权利要求1所述的一种用户兴趣向量提取方法，其特征在于，所述第四步中，在所述负样本和正样本中，各自分别选取80%作为训练集，20%作为测试集。

7.一种用户兴趣向量的提取模型，其特征在于，该提取模型包括有商品特征嵌入层、拼接层、激活网络、池化层和差值模块；

所述拼接层，将正反馈商品和负反馈商品中ID、类别、品牌和所属店铺四个领域特征的稠密向量进行拼接，分别得到正反馈商品拼接向量和负反馈商品拼接向量，并将候选商品的ID、类别、品牌和所属店铺四个领域的稠密向量拼接得到候选商品拼接向量；

所述池化层，将正反馈商品的加权向量和负反馈商品的加权向量分别求和池化，分别得到商品的正向特征向量和负向特征向量；

8.一种计算机系统，其特征在于，该计算机系统中含有用户兴趣向量提取模型，该模型作为计算机程序运行，执行权利要求1所述方法的步骤。