CN113761002A

CN113761002A - 信息推送方法、装置、设备和计算机可读存储介质

Info

Publication number: CN113761002A
Application number: CN202110321436.0A
Authority: CN
Inventors: 张美娜
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2021-03-25
Filing date: 2021-03-25
Publication date: 2021-12-07

Abstract

本申请提供一种信息推送方法、装置、设备和计算机可读存储介质，其中，该方法包括：响应于用户的购物操作，获取用户实时行为序列特征和用户离线特征；将用户实时行为序列特征和用户离线特征输入至预设的离线模型计算得到用户向量；获取预设品牌向量库中与用户向量匹配的品牌向量，将品牌向量所表征的品牌商品的信息推送至用户。该技术方案中，通过用户实时行为序列特征确定用户存在有直接行为的品牌商品，再与用户离线特征结合得到用户向量，并根据用户向量来确定预设品牌向量库中与用户匹配的品牌商品，实现了对用户没有直接行为的预设品牌向量库中的品牌商品的用户偏好进行分析的目的，能够更加全面准确的得到用户的品牌偏好。

Description

信息推送方法、装置、设备和计算机可读存储介质

技术领域

本申请涉及数据处理技术领域，尤其涉及一种信息推送方法、装置、设备和计算机可读存储介质。

背景技术

随着互联网电商的发展，用户可以通过个人账号登录互联网购物平台进行相关购物操作，例如加入商品至购物车和下单购买等等，在用户进行相关购物操作的过程中还会进行商品的搜索以及浏览，从而产生对应的大数据信息，通过对这些大数据信息进行收集分析，即可确定用户的购物偏好。

现有的大数据分析方法主要是对用户的历史行为进行分析，如分析用户浏览、点击和加购等有直接行为的品牌商品，得出用户的购物偏好，这种分析方法只会对用户有直接行为的品牌商品进行分析，而不会分析用户没有直接行为的品牌商品，分析过程不够全面，使得最终得到的用户品牌偏好分析结果的准确度较差。

发明内容

本申请提供一种信息推送方法、装置、设备和计算机可读存储介质，用于解决现有用户品牌分析不够全面准确的问题。

第一方面，本申请实施例提供一种信息推送方法，包括：

响应于用户的购物操作，获取用户实时行为序列特征和用户离线特征，所述用户实时行为序列特征用于表征与用户存在实时交互行为的品牌商品，所述用户离线特征包括用户人口属性特征和用户历史行为序列特征；

将所述用户实时行为序列特征和所述用户离线特征输入至预设的离线模型计算得到用户向量，所述用户向量用于表征用户的购物偏好；

获取预设品牌向量库中与所述用户向量匹配的品牌向量，将所述品牌向量所表征的品牌商品的信息推送至用户。

在第一方面的一种可能设计中，所述响应于用户的购物操作，获取用户实时行为序列特征，包括：

读取用户的实时日志，根据所述实时日志获取用户与品牌商品的实时交互行为；

将所述实时交互行为解析转化为用户实时行为序列特征，存入至实时特征库；

读取所述实时特征库得到所述用户实时行为序列特征。

在第一方面的另一种可能设计中，所述将所述实时交互行为解析转化为用户实时行为序列特征，存入至实时特征库，包括：

获取存入至实时特征库中的用户实时行为序列特征的存储时长；

当所述存储时间达到预设时长时，将所述用户实时行为序列特征移除出所述实时特征库。

在第一方面的再一种可能设计中，所述预设的离线模型包括用户子模型，所述将所述用户实时行为序列特征和所述用户离线特征输入至预设的离线模型计算得到用户向量，包括：

获取用户人口属性特征和用户历史行为序列特征，所述用户人口属性特征包括用户性别、年龄、购买力、婚姻状况和地理位置中的至少一种，所述用户历史行为序列特征包括用户历史点击、关注、加购和下单的品牌商品中的至少一种；

根据所述用户子模型对用户人口属性特征进行降维得到用户属性向量；

根据所述用户子模型对用户历史行为序列特征进行降维得到用户历史行为向量；

获取所述用户属性向量与用户历史行为向量的交叉向量；

将所述用户属性向量、用户历史行为向量、交叉向量和所述用户实时行为序列特征输入至所述用户子模型计算得到用户向量。

在第一方面的又一种可能设计中，所述获取用户历史行为序列特征，包括：

获取用户实时行为序列特征，根据所述用户实时行为序列特征得到用户的历史行为序列特征。

在第一方面的又一种可能设计中，所述获取所述用户属性向量与用户历史行为向量的交叉向量，包括：

对所述用户属性向量和用户历史行为向量进行注意力加权操作，获取注意力加权操作结果作为所述交叉向量。

在第一方面的又一种可能设计中，所述将所述用户属性向量、用户历史行为向量、交叉向量和所述用户实时行为序列特征输入至所述用户子模型计算得到用户向量，包括：

将所述用户属性向量、用户历史行为向量和交叉向量进行特征拼接，得到拼接后的拼接向量；

根据所述用户实时行为序列特征和所述拼接向量计算得到满足预设维度和预设长度的用户向量，所述用户向量的维度与所述预设品牌向量库中的品牌向量的维度相同。

在第一方面的又一种可能设计中，所述预设的离线模块还包括品牌子模型，所述获取预设品牌向量库中与所述用户向量匹配的品牌向量之前，包括：

获取品牌特征，所述品牌特征包括品牌类目特征、品牌价位特征、品牌热度特征和品牌标识特征；

通过所述品牌子模型对所述品牌特征进行降维得到品牌向量；

将所述品牌向量存入至所述预设品牌向量库中。

在第一方面的又一种可能设计中，所述获取预设品牌向量库中与所述用户向量匹配的品牌向量，将所述品牌向量所表征的品牌商品的信息推送至用户，包括：

获取所述预设品牌向量库中的品牌向量与所述用户向量的相似距离；

根据所述相似距离确定与所述用户向量匹配的品牌向量；

将与所述用户向量匹配的品牌向量所表征的品牌商品的信息推送至用户。

在第一方面的又一种可能设计中，所述将所述品牌向量所表征的品牌商品的信息推送至用户，包括：

根据相似距离，对与所述用户向量匹配的各个品牌向量进行排序，各个品牌向量所表征的品牌商品的信息不同；

根据各个品牌向量的排列顺序，将预设数量的品牌向量所表征的品牌商品的信息推送至用户。

第二方面，本申请实施例提供一种信息推送装置，包括：

特征获取模块，用于响应于用户的购物操作，获取用户实时行为序列特征和用户离线特征，所述用户实时行为序列特征用于表征与用户存在实时交互行为的品牌商品，所述用户离线特征包括用户人口属性特征和用户历史行为序列特征；

向量获取模块，用于根据所述用户实时行为序列特征和所述用户离线特征得到用户向量，所述用户向量用于表征用户的购物偏好；

推送模块，用于获取预设品牌向量库中与所述用户向量匹配的品牌向量，将所述品牌向量所表征的品牌商品的信息推送至用户。

第三方面，本申请实施例提供一种信息推送设备，包括存储器和至少一个处理器；

所述存储器存储有计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行上述的方法。

第四方面，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机可读存储介质中存储有计算机指令，所述计算机指令被处理器执行时用于实现上述的方法。

本申请实施例提供的信息推送方法、装置、设备和计算机可读存储介质，通过用户实时行为序列特征确定用户存在有直接行为的品牌商品，再与用户离线特征结合得到用户向量，并根据用户向量来确定预设品牌向量库中与用户匹配的品牌商品，实现了对用户没有直接行为的预设品牌向量库中的品牌商品的用户偏好进行分析的目的，能够更加全面准确的得到用户的品牌偏好。

附图说明

图1为本申请实施例提供的信息推送方法的场景示意图；

图2为本申请实施例提供的信息推送方法实施例一的流程示意图；

图3为本申请实施例提供的预设的离线模型的结构示意图；

图4为本申请实施例提供的信息推送方法实施例二的流程示意图；

图5为本申请实施例提供的信息推送方法实施例三的流程示意图；

图6为本申请实施例提供的信息推送方法实施例四的流程示意图；

图7为本申请实施例提供的信息推送方法实施例五的流程示意图；

图8为本申请实施例提供的信息推送装置的结构示意图；

图9为本申请实施例提供的信息推送装置实施例二的结构示意图；

图10为本申请实施例提供的信息推送设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

随着互联网技术的发展，电子商务也在迅速的发展，用户可以通过移动终端或者计算机电脑等注册个人账号，并登录到网上购物平台进行购物操作来实现网上购物，具体的购物操作包括有浏览商品、搜索商品、点击商品、将商品加入购物车以及下单购买商品等等，这一系列的购物操作可以通过网上购物平台来记录，形成用户的购物数据，通过对这些购物数据进行分析即可实现用户对商品品牌/品类偏好的准确刻画，了解到每一个不同的用户的商品品牌/品类偏好能够使得网上购物平台来推荐一些用户偏好的商品品牌/品类给用户，促进用户的购买。

现有技术中，对用户偏好刻画主要采用的有两种方式，一种为离线计算方式，其依靠用户的历史行为，如用户的购买、点击、分享、加购等；从历史行为中做统计，提取特征，建立模型，离线模型可以是一些简单的逻辑(LR，Logistic Regression)分类模型、梯度提升(xgboost，Extreme Gradient Boosting)树模型等；也可以是一些较为复杂的深度模型，如循环神经网络(rnn，recurrent neural networks)、深度兴趣网络(din，Deep InterestNetwork)等，离线模型的主要缺点为时效性较低，通常为T+1，即用户当天的行为得到第二天才能获取到相应的行为日志，且该模型一般只能对用户有直接行为的品牌预测出一个偏好值。另一种为实时计算方式，实时计算具有较强的时效性，为了追求更好的时效性，往往模型的设计上就会相对简单，如直接采用简单的统计加权计算偏好，且实时模型受限于空间存储，会放弃一定的历史行为特征，简单的行为统计，无法准确刻画用户的行为变化。以上的这两种方式都只能对有行为的品牌计算出其相应的偏好值，而无法对用户没有直接行为的品牌提供一个偏好值，使得在对用户偏好刻画时容易存在不全面准确的问题，使得网上购物平台会反复的将用户浏览、点击和购买过的商品继续推荐给用户，对用户体验产生负面体验。

针对上述问题，本申请实施例提供了一种信息推送方法、装置、设备和计算机可读存储介质，其主要思路如下：将品牌特征进行向量化得到表征品牌商品的品牌向量并预先存储，后续在需要预测用户的实时品牌偏好时，先根据用户有直接行为的品牌商品，确定用户的品牌偏好，然后与预设品牌向量库中的品牌向量来进行匹配，确认用户与没有直接行为的品牌商品之间的品牌偏好，这样就能够预测出用户对没有直接行为的品牌商品的品牌偏好，后续可以将这些用户偏好的且没有直接行为的品牌商品推荐给用户，同时，预设品牌库可以通过离线模型先计算得到，通过将离线模型与实时预测相结合，实时的预测用户的品牌偏好，还能够解决单独使用离线模型进行预测时过程复杂和时效性差的问题。

图1为本申请实施例提供的一种信息推送方法的场景示意图，如图1所示，用户可以通过在移动终端11提供的网上购物平台进行购物操作，例如搜索商品、浏览商品、点击商品、将商品加入购物车和下单购买商品等等，后台的服务器12记录下用户的这些购物操作，形成该用户的购物数据，对这些购物数据进行分析即可刻画出用户偏好，并根据用户偏好，推送用户偏好的商品的信息至前端的网上购物平台，供用户查看，其中，商品的信息可以包括有商品的图像、说明、价格、促销活动和下单购买链接等等。

图2为本申请实施例提供的信息推送方法实施例一的流程示意图，如图2所示，该方法的执行主体可以是服务器或处理器，具体包括以下步骤：

S201、响应于用户的购物操作，获取用户实时行为序列特征和用户离线特征。

其中，用户实时行为序列特征用于表征与用户存在实时交互行为的品牌商品，用户离线特征包括用户人口属性特征和用户历史行为序列特征；示例性的，用户人口属性特征包括用户性别、年龄、购买力、婚姻状况和地理位置中的至少一种，用户历史行为序列特征包括用户历史点击、关注、加购和下单的品牌商品中的至少一种。

示例性的，实时交互行为可以是用户在某一个时间段中，用户点击、浏览、加购和下单行为，具体的，用户实时行为序列特征例如可以是在一个小时内用户点击的品牌商品的ID、用户浏览的品牌商品的ID、用户加购的品牌商品的ID和用户下单购买的品牌商品的ID，其中，不同的品牌商品对应有不同的ID。

在本申请实施例中，用户实时行为序列特征可以是低维的向量形式，将每一个用户对某个品牌商品的实时行为量化成一个向量即得到用户实时行为特征，然后用户不同的行为根据行为发生的时间可以进行排序，从而得到用户实时行为序列特征，通过排序得到的用户实时行为序列特征也能够表征出用户的行为先后顺序，能够更加准确的了解近期用户的行为和远期用户的行为，后续可以更加准确的刻画用户偏好。

示例性的，用户离线特征可以存储在离线数据库中，在需要时可以随时进行调用，而不需要通过实时的分析计算获得，降低在对用户品牌偏好进行预测时的性能负载需求。

示例性的，品牌商品具体可以是指一个品牌或者品类的商品，示例性的，品类的商品包括有休闲裤和牛仔裤等等，而品牌的商品则可以是某一个品牌下的上衣、裤子等商品，具体的，用户与品类为休闲裤的商品存在有实时交互行为，用户与品类为牛仔裤的商品存在有交互行为，又或者用户与某一个品牌下的商品存在有交互行为等等。

S202、将用户实时行为序列特征和用户离线特征输入至预设的离线模型计算得到用户向量。

其中，用户向量用于表征用户的购物偏好，在本申请实施例中，可以通过预设的离线模型来获取用户向量，示例性的，预设的离线模型可以是深层结构语义模型(DSSM，DeepStructured Semantic Models)，通过将用户实时行为序列特征和用户离线特征作为DSSM模型表示层的输入，即可计算得到用户向量，用户向量是一个具体化的数据，后续通过用户向量和预设品牌向量库中的品牌向量进行对比匹配，即可确定匹配的品牌向量。

具体的，DSSM模型包括有用户嵌入(embedding)子模型和品牌嵌入(embedding)子模型，通过将用户实时行为序列特征和用户离线特征输入至用户embedding子模型中，计算得到用户向量，而品牌embedding子模型则用于对品牌类目特征、品牌价位特征、品牌热度特征和品牌ID特征进行计算，得到表征品牌商品的品牌向量，并将其直接存储进远程数据服务(redis，Remote Dictionary Server)数据库中，作为预设品牌向量库，如此可以使得在对用户品牌偏好进行实时预测时，能够直接从redis数据库中进行调用，避免实时的计算过程。

示例性的，可以通过将用户实时行为序列特征和用户离线特征进行稠密化处理或者通过离线模型中的参数计算得到用户向量，离线模型具体可以参考DSSM模型现有的原理概述，在此不做详细的解释说明。

S203、获取预设品牌向量库中与用户向量匹配的品牌向量，将品牌向量所表征的品牌商品的信息推送至用户。

本申请实施例中，预设品牌向量库为通过预设的离线模型计算得到的，示例性的，以离线模型为DSSM为例，通过将品牌类目特征、品牌价位特征、品牌热度特征和品牌ID特征输入至DSSM模块的输入层，通过嵌入操作(embedding)之后，得到用于表示品牌类目特征的向量、用于表示品牌价位特征的向量、用于表示品牌热度特征的向量和用于表示品牌ID特征的向量，然后进行特征拼接，再输入至DSSM模型的表示层，通过表示层计算得到表征品牌商品的品牌向量，然后将每一个不同品牌商品的品牌向量存储在一起，得到预设品牌向量库。

示例性的，可以设置一个预设相似度，当用户向量与品牌向量的相似度达到预设相似度时，则表示该品牌向量与用户向量匹配，该品牌向量表征的品牌商品的信息将会被推送至用户，使得用户在移动终端提供的网上购物平台上可以看到推送信息。

本申请实施例通过用户实时行为序列特征确定用户存在有直接行为的品牌商品，再与用户离线特征结合得到用户向量，并根据用户向量来确定预设品牌向量库中与用户匹配的品牌商品，实现了对用户没有直接行为的预设品牌向量库中的品牌商品的用户偏好进行分析的目的，能够更加全面准确的得到用户的品牌偏好。

图3为本申请实施例提供的预设的离线模型的结构示意图，如图3所示，该离线模型具体为DSSM模型，其包括有输入层31、表示层32、匹配层33、品牌embedding子模型34和用户embedding子模型35。其中，用户embedding子模型35为用户相关的embedding描述，品牌embedding子模型34为品牌商品相关的embedding描述，在模型的实时预测中，由于用户的点击品牌是实时变动的，故用户相关的embedding可通过该DSSM模型实时算出，而品牌侧的embedding特征相对较为固定，可在该DSSM模型训练完成后，直接获取品牌侧的embedding信息，存储进入redis数据库，供实时计算用户的品牌偏好。

下面结合附图3对整个DSSM模型的数据处理过程进行说明，DSSM模型从下到上分为输入层31，表示层32，匹配层33三层结构。其中，DSSM模型中的用户embedding子模型35用于生成用户向量(user embedding)，具体的，通过在输入层31输入用户离线特征训练数据，用户离线特征包括用户人口属性特征和用户历史行为序列特征，将用户人口属性特征和用户历史行为序列特征均进行embedding降维到低维空间(64或者32维)，得到用户属性向量和用户历史行为向量，为更好地发掘用户属性和品牌的一些相关性，如年轻女性用户，对一些美妆品牌可能更感兴趣，可以将用户属性向量与用户历史行为向量做注意力加权操作，深入发掘用户与品牌的交叉特征，加权计算后的交叉特征作为交叉向量，该交叉向量与用户属性向量及用户历史行为向量做特征拼接后，输入到表示层32中的全连接层，最终输出用户向量。品牌embedding子模型34用于生成品牌向量(brand embedding)，具体的，分别将品牌商品的各类特征做embedding，并进行特征拼接后输入全连接层，得到每一个品牌商品对应的品牌向量。

其中，用户人口属性特征主要包括有性别、年龄、购买力、婚姻状况、地理位置等特征，用户历史行为序列特征主要包括有用户历史点击、关注、加购、下单的品牌ID行为序列特征。品牌商品的各类特征主要包括有品牌对应的品类特征，例如一级/二级/三级类目信息；品牌的价位特征，例如该品牌在其对应的三级类目中的商品的平均价格在该三级类所有商品价格的分位数大小；品牌的热度特征，例如该品牌历史下单、点击、关注的次数大小；品牌id类特征，例如华为的品牌id为9774。

DSSM模型中的表示层32接收到拼接后的拼接向量经过各自的两个全连接层后转化成了固定长度的向量，之后得到了维度相同的user embedding和brand embedding，相同维度的user embedding和brand embedding才能在匹配层进行运算。为了防止过拟合，在两层全连接层中可以做适当的dropout或者进行L2正则化调优。经过表示层32之后，DSSM模型的匹配层33将会得到user embedding和brand embedding，之后匹配层33可以利用cos函数来计算用户与品牌的一个相似距离，该相似距离输入sigmoid函数即可得到一个0～1之间的概率值，与真实的标签计算损失函数(logloss)，可用于判断DSSM模型训练是否收敛，当收敛时则表示DSSM模型完成训练优化。

可以理解，上述的离线模型需要通过相应的训练优化才可以使用，示例性的，训练优化主要包括有离线模型样本选择、离线特征提取和离线模型训练的步骤，其中，离线模型样本的选择可以取搜索下曝光有点击或者下单的用户-品牌对为正样本；取搜索下曝光无点击的用户-品牌对为负样本，推荐场景类似，可以取一次曝光中，有点击或者下单的对为正样本，曝光无点击的对为负样本，按照正负样本的比例1：5对负样本进行降采样，之后将所有的样本按比例划分4：1，其中4份用于模型训练，1份用于模型评估。

离线特征提取分为两部分：用户侧特征及品牌侧特征，用户侧的特征主要包括用户人口属性特征和用户历史行为序列特征。需要说明的是，在后续进行用户品牌偏好的实时预测时，用户的人口属性特征由于相对固定，可以先存储进入redis数据库；用户的历史行为序列特征将随着用户实时的购物操作发生动态的变化，可以取近200次有行为的品牌ID。品牌侧的特征主要包括(1)品牌对应的品类特征，一级/二级/三级类目信息；(2)品牌的价位特征，该品牌在其对应的三级类目中的商品的平均价格在该三级类所有商品价格的分位数大小；(3)品牌的热度特征，该品牌历史下单、点击、关注的次数大小。(4)品牌id类特征。需要说明的是，在完成模型训练后，品牌向量可以直接存储进redis数据库，在后续进行用户品牌偏好的实时预测时，品品牌向量可以直接从redis中获取。离线模型训练过程是基于dssm模型做模型的离线训练，在模型训练完成后，将用户embedding子模型35可以保存进模型库，用于后续进行用户品牌偏好的实时预测时对用户向量进行计算。

进一步的，当离线模型优化训练好之后，还可以对训练优化之后的离线模型进行效果评估，具体可以采用ROC曲线下的面积(AUC值，Area Under Curve)、f1值(F1 measure)综合来评价离线模型的效果，积累多次离线模型的评估结果，计算离线模型的平均指标，当离线模型的指标处于平均水平时，或高于平均水平时，可定时更新离线模型文件至模型库，若模型评价指标低于模型的平均水平时不更新，离线模型的训练与评估周期为天级别，即每日训练及评估模型效果。

在上述实施例的基础上，图4为本申请实施例提供的信息推送方法实施例二的流程示意图，如图4所示，上述步骤S201中“响应于用户的购物操作，获取用户实时行为序列特征”，具体可以通过如下步骤实现：

S401、读取用户的实时日志，根据实时日志获取用户与品牌商品的实时交互行为。

具体的，实时日志可以是用户在网上购物平台上进行相应的操作所产生的数据，示例性的，实时日志中可以包括有用户与商家的沟通消息和用户的购物操作等等。实时交互行为是指用户点击、浏览、加购和下单等行为。

S402、将实时交互行为解析转化为用户实时行为序列特征，存入至实时特征库。

具体的，用户的实时行为可以通过kafka(分布式日志系统)做数据下发，通过flink(框架和分布式处理引擎)实时计算框架做实时特征的解析，用户实时行为序列特征是指与用户存在有实时交互行为的品牌商品，例如用户与手机存在有实时交互行为，手机的品牌ID为4399，则用户实时行为序列特征表征的是品牌ID为4399的手机，示例性的，当用户与多个品牌商品存在有实时交互行为时，则可以根据不同的交互时间来确定先后顺序，得到对应的用户实时行为序列特征。

S403、读取实时特征库得到用户实时行为序列特征。

示例性的，当需要对某一个用户进行实时品牌偏好预测时，可以直接从用户实时特征库中提取该用户的用户实时行为序列特征，后续直接作为用户embedding子模型的输入，而不需要再根据用户的实时行为进行数据处理计算。

本申请实施例通过先读取用户的实时日志，得到实时交互行为来确定用户实时行为序列特征并存储在实时特征库中，这样就能够在预测用户实时品牌偏好的任务到来时，直接从实时特征库中提取该用户的用户实时行为序列特征，提高预测的效率，减少品牌偏好预测过程中的复杂运算。

可选的，在上述实施例的基础上，在一些实施例中，上述步骤S402可以通过如下步骤实现：获取存入至实时特征库中的用户实时行为序列特征的存储时长；当存储时间达到预设时长时，将用户实时行为序列特征移除出实时特征库。

示例性的，用户实时行为序列特征有时间先后顺序的，用户实时行为序列特征根据用户的实时交互行为发生的先后顺序进行排序，示例性的，预设时长可以是两天，用户在这两天内在网上购物平台与不同品牌商品之间存在有实时交互行为，根据实时交互行为发生的先后顺序，解析转化成不同的用户实时行为序列特征存储到实时特征库中，按照保存的时间先后顺序，将保存时间超过了两天的用户实时行为序列特征截取，移除出实时特征库。

本申请实施例通过将保存时长超过预设时长的用户实时行为序列移除出实时特征库，能够有效的捕捉到用户近期的品牌兴趣，防止异常刷单的用户，同时也能够降低实时特征库的存储资源的需求。

可选的，在上述实施例的基础上，图5为本申请实施例提供的信息推送方法实施例三的流程示意图，如图5所示，上述步骤S202具体可以通过如下步骤实现：

S501、获取用户人口属性特征和用户历史行为序列特征。

其中，用户人口属性特征包括用户性别、年龄、购买力、婚姻状况和地理位置中的至少一种，用户历史行为序列特征包括用户历史点击、关注、加购和下单的品牌商品中的至少一种。

S502、根据用户子模型对用户人口属性特征进行降维得到用户属性向量。

S503、根据用户子模型对用户历史行为序列特征进行降维得到用户历史行为向量。

S504、获取用户属性向量与用户历史行为向量的交叉向量。

S505、将用户属性向量、用户历史行为向量、交叉向量和用户实时行为序列特征输入至用户子模型计算得到用户向量。

具体的，预设的离线模型可以是上述的DSSM模型，当DSSM模型训练优化之后，通过将用户人口属性特征和用户历史行为序列特征输入至DSSM模型中的输入层31，通过embedding降维即可以得到用户属性向量和用户历史行为向量。需要说明的是，embedding降维就是用一个低维的向量表示一个品牌商品。

交叉向量的获取过程可以采用特征交叉的方式，将用户属性向量与用户历史行为向量进行特征交叉，即可得到交叉向量，示例性的，可以通过DSSM模型来实现特征交叉，具体的，DSSM模型计算得到的用户属性向量与用户历史行为向量再通过DSSM模型的输入层进行特征交叉，即可得到交叉向量。

示例性的，用户实时行为序列特征也可以输入至DSSM模型的输入层，通过embedding降维之后，输入至DSSM模型的表示层，然后DSSM模型的表示层再结合用户属性向量、用户历史行为向量和交叉向量计算得到用户向量。

本申请实施例通过用户人口属性特征、用户历史行为序列特征和用户实时行为序列特征来计算用户向量，后续通过用户向量预测用户的品牌偏好，在预测的过程中将用户有直接行为的品牌商品作为考虑因素，能够保证用户品牌偏好预测的全面性。

可选的，在上述实施例的基础上，在一些实施例中，用户历史行为序列特征是通过用户实时行为序列特征得到的。具体的，用户的历史行为序列会随着用户的实时交互行为发生动态的变化，示例性的，取用户近期200次有实时交互行为的品牌商品作为用户历史行为序列特征，当用户不断的进行实时交互行为时，则用户历史行为序列特征会不断的动态更新。

本申请实施例通过对用户历史行为序列特征进行动态的更新，能够更加准确的记录下用户近期的品牌商品兴趣，为后续用户实时品牌偏好的预测提供更加准确的数据支撑。

可选的，在上述实施例的基础上，在一些实施例中，上述步骤SS504具体可以通过如下步骤实现：对用户属性向量和用户历史行为向量进行注意力加权操作，获取注意力加权操作结果作为交叉向量。

示例性的，可以通过预设的注意力加权公式来对用户属性向量和用户历史行为向量进行注意力加权操作，得到注意力加权操作结果。

具体的，预设的注意力加权公式可以为：

上式中，v_A表示用户属性向量；e₁，e₂，..，e_H表示用户历史行为向量；v_U(A)表示交叉向量。a(e_j，v_A)即对每个用户历史行为向量的注意力加权操作，w_j即为相应的注意力权重。

进一步的，在一些实施例中，上述步骤S505具体可以通过如下步骤实现：将用户属性向量、用户历史行为向量和交叉向量进行特征拼接，得到拼接后的拼接向量；根据用户实时行为序列特征和拼接向量计算得到满足预设维度和预设长度的用户向量。

其中，用户向量的维度与预设品牌向量库中的品牌向量的维度相同。具体的，向量可以具有不同的维度和长度，用户向量的维度和长度需要保证与预设品牌库中品牌向量的维度和长度相同，特征拼接是指将各个不同的向量拼接在一起形成一个统一的向量，示例性的，以用户属性向量为111、用户历史行为向量为000、交叉向量为101为例，拼接之后得到的拼接向量为111000101。

示例性的，可以将用户实时行为序列特征进行embedding降维，得到用户实时行为序列特征向量，然后与拼接向量继续进行拼接，拼接之后的向量的维度和长度进行调整，满足预设维度和预设长度之后即输出得到用户向量。

本申请实施例通过对用户属性向量、用户历史行为向量和交叉向量进行特征拼接，最后计算得到满足预设维度和预设长度的用户向量，保证用户向量的维度和长度与品牌向量的维度和长度相同，方便后续与预设品牌库中的品牌向量进行快速匹配，确定用户向量与品牌向量的相似距离。

在上述实施例的基础上，在一些实施例中，上述的信息推送方法还包括步骤：获取品牌特征，并通过品牌子模型对品牌特征进行降维得到品牌向量，以及将品牌向量存入至预设品牌向量库中。

其中，品牌特征包括品牌类目特征、品牌价位特征、品牌热度特征和品牌标识特征。示例性的，预设的离线模型可以采用上述的DSSM模型，通过DSSM模型的输入层对品牌类目特征进行降维可以得到品牌类目向量，对品牌价位特征进行降维可以得到品牌价位向量，对品牌热度特征进行降维可以得到品牌热度向量，对品牌标识特征进行降维可以得到品牌标识向量，之后DSSM模式的输入层再对品牌类目向量、品牌价位向量、品牌热度向量和品牌标识向量进行特征拼接，拼接之后的向量作为品牌向量。

示例性的，预设品牌向量库可以是redis数据库，其中存储有表征各个品牌商品的品牌向量。

本申请实施例通过将品牌特征进行降维得到品牌向量，预先存储到预设品牌向量库中，在预设用户实时品牌偏好时能够直接调用，减少预设过程中的计算复杂度，提高预测过程的数据处理效率，从而可以达到实时预测的目的。

在上述实施例的基础上，图6为本申请实施例提供的信息推送方法实施例四的流程示意图，如图6所示，上述步骤S203具体可以通过如下步骤实现：

S601、获取预设品牌向量库中的品牌向量与用户向量的相似距离。

示例性的，可以通过COS函数等方法来计算得到品牌向量与用户向量的相似距离，预设品牌向量库中存储有表征各种不同品牌商品的品牌向量，通过将各个品牌向量与用户向量进行一一匹配，确定各个品牌向量与用户向量的相似距离。

S602、根据相似距离确定与用户向量匹配的品牌向量。

示例性的，可以预设距离阈值，当相似距离小于预设距离阈值时，则确定该品牌向量与用户向量匹配，并这些与用户向量匹配的品牌向量从预设品牌向量库中召回。

S603、将与用户向量匹配的品牌向量所表征的品牌商品的信息推送至用户。

具体的，品牌商品的信息包括有商品的图像、说明、价格、促销活动和下单购买链接等等，服务器可以将这些商品的信息发送到用户的移动终端所提供的网上购物平台上，由网上购物平台来显示出这些商品的信息，完成信息的推送以供用户查看。

本申请实施例通过计算品牌向量与用户向量的相似距离，并根据预设距离阈值来确定哪些品牌向量与用户的相似距离较小，从而能够实时的预测对于没有直接行为的品牌商品中，用户偏好的品牌商品，实时的将这些品牌商品的信息推送给用户，使得用户可以了解到更多的新鲜品牌商品，提高购买率。

进一步的，在上述实施例的基础上，在一些实施例中，上述步骤S203中“将品牌向量所表征的品牌商品的信息推送至用户”具体可以通过如下步骤实现：根据相似距离，对与用户向量匹配的各个品牌向量进行排序，根据各个品牌向量的排列顺序，将预设数量的品牌向量所表征的品牌商品的信息推送至用户。

其中，各个品牌向量所表征的品牌商品的信息不同，具体的，每一个品牌向量与用户向量之间的相似距离可能不同，例如有的品牌向量与用户向量之间的相似距离较小，而有的品牌向量与用户向量之间的相似度距离较大，由此可以根据相似距离的大小来依次对品牌向量进行排序，示例性的，按照相似距离从小到大的顺序，选择顺序在前十的品牌向量，将这十个品牌向量所表征的品牌商品的信息推送至用户。

本申请实施例通过对品牌向量进行排序，就可以确定哪些品牌商品是用户最偏好的，从而能够将一批与用户偏好非常接近的品牌商品推送给用户。

图7为本申请实施例提供的信息推送方法实施例五的流程示意图，如图7所示，其包括有步骤S71至步骤S77。步骤S71具体为通过离线日志获取离线样本和离线特征，离线特征包括有用户人口属性特征和用户历史行为序列特征，离线特征被存入到用户离线特征库，后续在步骤S75中可以调用离线特征来计算用户向量，离线日志与实时日志相对，离线日志为非实时的用户数据，例如用户过往时刻在网上购物平台所购买的商品以及与商家的信息交流等等。离线样本可以取搜索下曝光有点击或者下单的用户-品牌对为正样本；取搜索下曝光无点击对用户-品牌对为负样本。

在步骤S72中通过将离线样本和离线特征输入到离线模型中，完成对离线模型的训练，通过还可以从离线样本中选择一组样本数据来对离线模型训练之后的离线效果进行判定，确定训练优化的效果，其中，离线模块包括有用户子模块和品牌子模块，用户子模型可以存入到模型库中，在进行后续步骤S75时可以调用用户子模块来计算用户向量。

步骤S74则用于根据实时日志来将用户实时行为序列特征存入到实时特征库中。

步骤S75则用于计算用户向量，根据离线特征和实时特征库中的用户实时行为序列特征，并调用用户子模块来计算得到用户向量，最后步骤S76通过FAISS(为稠密向量提供高效相似度搜索和聚类的框架)召回预设品牌向量库中与用户向量匹配的品牌向量，根据召回的品牌向量确定用户的实时品牌偏好。

综上，本申请实施例通过实时日志确定与用户存在实时交互行为的品牌商品，然后结合用户人口属性特征以及用户历史行为序列特征，有预设的离线模型计算得到用户向量，通过确定用户向量与品牌向量之间的相似距离来预测用户的实时品牌偏好，实现了从一些用户无直接行为的品牌商品中预测用户的品牌偏好，预测更加的全面，后续将用户无直接行为的偏好的品牌商品的信息推送给用户，能够满足新鲜感，避免重复的推送一些用户浏览过的商品的信息，提高购买率。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图8为本申请实施例提供的信息推送装置的结构示意图，如图8所示，该信息推送装置80包括有特征获取模块801、向量获取模块802和推送模块803。其中，

特征获取模块801，用于响应于用户的购物操作，获取用户实时行为序列特征和用户离线特征。

向量获取模块802，用于将用户实时行为序列特征和用户离线特征输入至预设的离线模型计算得到用户向量。

推送模块803，用于获取预设品牌向量库中与用户向量匹配的品牌向量，将品牌向量所表征的品牌商品的信息推送至用户。

其中，用户实时行为序列特征用于表征与用户存在实时交互行为的品牌商品，用户离线特征包括用户人口属性特征和用户历史行为序列特征。

可选的，在一些实施例中，上述的特征获取模块801具体可以用于读取用户的实时日志，根据实时日志获取用户与品牌商品的实时交互行为，并将实时交互行为解析转化为用户实时行为序列特征，存入至实时特征库，以及读取实时特征库得到用户实时行为序列特征。

可选的，在一些实施例中，上述的特征获取模块801具体可以用于获取存入至实时特征库中的用户实时行为序列特征的存储时长，并当存储时间达到预设时长时，将用户实时行为序列特征移除出实时特征库。

可选的，在一些实施例中，上述的向量获取模块802具体可以用于获取用户人口属性特征和用户历史行为序列特征，并根据预设的离线模型对用户人口属性特征进行降维得到用户属性向量，以及根据预设的离线模型对用户历史行为序列特征进行降维得到用户历史行为向量，以及获取用户属性向量与用户历史行为向量的交叉向量，以及根据用户属性向量、用户历史行为向量、交叉向量和用户实时行为序列特征计算得到用户向量。

可选的，在一些实施例中，上述的向量获取模块802具体可以用于获取用户实时行为序列特征，根据用户实时行为序列特征得到用户历史行为序列特征。

可选的，在一些实施例中，上述的向量获取模块802具体可以用于对用户属性向量和用户历史行为向量进行注意力加权操作，获取注意力加权操作结果作为交叉向量。

可选的，在一些实施例中，上述的向量获取模块802具体可以用于将用户属性向量、用户历史行为向量和交叉向量进行特征拼接，得到拼接后的拼接向量，并根据用户实时行为序列特征和拼接向量计算得到满足预设维度和预设长度的用户向量，用户向量的维度与预设品牌向量库中的品牌向量的维度相同。

图9为本申请实施例提供的信息推送装置实施例二的结构示意图，如图9所示，上述的信息推送装置还可以包括向量库模块901，其中，向量库模块901用于获取品牌特征，品牌特征包括品牌类目特征、品牌价位特征、品牌热度特征和品牌标识特征，并通过预设的离线模型对品牌特征进行降维得到品牌向量，以及将品牌向量存入至预设品牌向量库中。

可选的，在一些实施例中，上述的推送模块803具体可以用于获取预设品牌向量库中的品牌向量与用户向量的相似距离，并根据相似距离确定与用户向量匹配的品牌向量，以及将与用户向量匹配的品牌向量所表征的品牌商品的信息推送至用户。

可选的，在一些实施例中，上述的推送模块803具体可以用于根据相似距离，对与用户向量匹配的各个品牌向量进行排序，各个品牌向量所表征的品牌商品的信息不同，并根据各个品牌向量的排列顺序，将预设数量的品牌向量所表征的品牌商品的信息推送至用户。

需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，推送模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上推送模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。

图10为本申请实施例提供的信息推送设备的结构示意图，如图10所示，其包括存储器1001和至少一个处理器1002；

存储器1001存储有计算机执行指令；

至少一个处理器1002执行存储器1001存储的计算机执行指令，使得至少一个处理器1002执行如上的方法。

可选的，存储器1001既可以是独立的，也可以跟处理器1002集成在一起，当存储器1001独立设置时，该信息推送设备还包括总线1003，用于连接存储器1001和处理器1002。

在一个实施例中，本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述的方法步骤。

本申请中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系；在公式中，字符“/”，表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，可以表示：a，b，c，a-b，a-c，b-c，或a-b-c，其中，a，b，c可以是单个，也可以是多个。

可以理解的是，在本申请实施例中涉及的各种数字编号仅为描述方便进行的区分，并不用来限制本申请的实施例的范围。在本申请的实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请的实施例的实施过程构成任何限定。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种信息推送方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述响应于用户的购物操作，获取用户实时行为序列特征，包括：

读取所述实时特征库得到所述用户实时行为序列特征。

3.根据权利要求2所述的方法，其特征在于，所述将所述实时交互行为解析转化为用户实时行为序列特征，存入至实时特征库，包括：

4.根据权利要求1所述的方法，其特征在于，所述预设的离线模型包括用户子模型，所述将所述用户实时行为序列特征和所述用户离线特征输入至预设的离线模型计算得到用户向量，包括：

获取所述用户属性向量与用户历史行为向量的交叉向量；

5.根据权利要求4所述的方法，其特征在于，所述获取用户历史行为序列特征，包括：

获取用户实时行为序列特征，根据所述用户实时行为序列特征得到用户历史行为序列特征。

6.根据权利要求4所述的方法，其特征在于，所述获取所述用户属性向量与用户历史行为向量的交叉向量，包括：

7.根据权利要求4所述的方法，其特征在于，所述将所述用户属性向量、用户历史行为向量、交叉向量和所述用户实时行为序列特征输入至所述用户子模型计算得到用户向量，包括：

8.根据权利要求1-7中任意一项所述的方法，其特征在于，所述预设的离线模块还包括品牌子模型，所述获取预设品牌向量库中与所述用户向量匹配的品牌向量之前，包括：

将所述品牌向量存入至所述预设品牌向量库中。

9.根据权利要求1-7中任意一项所述的方法，其特征在于，所述获取预设品牌向量库中与所述用户向量匹配的品牌向量，将所述品牌向量所表征的品牌商品的信息推送至用户，包括：

根据所述相似距离确定与所述用户向量匹配的品牌向量；

10.根据权利要求9所述的方法，其特征在于，所述将所述品牌向量所表征的品牌商品的信息推送至用户，包括：

11.一种信息推送装置，其特征在于，包括：

向量获取模块，用于将所述用户实时行为序列特征和所述用户离线特征输入至预设的离线模型计算得到用户向量，所述用户向量用于表征用户的购物偏好；

12.一种信息推送设备，其特征在于，包括存储器和至少一个处理器；

所述存储器存储有计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求1-10任一项所述的方法。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机可读存储介质中存储有计算机指令，所述计算机指令被处理器执行时用于实现权利要求1-10任一项所述的方法。