CN111898033A

CN111898033A - 内容推送方法、装置以及电子设备

Info

Publication number: CN111898033A
Application number: CN202010879414.1A
Authority: CN
Inventors: 刘曙铭
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd; Shenzhen Huantai Technology Co Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd; Shenzhen Huantai Technology Co Ltd
Priority date: 2020-08-27
Filing date: 2020-08-27
Publication date: 2020-11-06

Abstract

本申请实施例公开了一种内容推送方法、装置以及电子设备。方法包括：获取待推送用户的用户标识；获取第一嵌入向量，第一嵌入向量为用户标识所对应属性信息的序列嵌入向量；基于注意力机制、用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量；基于第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定候选内容是否与待推送用户匹配；若匹配，将候选内容推送给待推送用户。从而通过图嵌入向量获取到不同内容相互之间的一些特征，有利于为用户推送更为准确的内容。并且，因为是通过注意力机制来计算得到的表征用户兴趣的第二嵌入向量，从而使得该第二嵌入向量能够更有效的表达用户近期的兴趣。

Description

内容推送方法、装置以及电子设备

技术领域

本申请涉及计算机技术领域，更具体地，涉及一种内容推送方法、装置以及电子设备。

背景技术

在内容推送场景下，通常会预先给用户打上兴趣标签，构建用户和标签的关联，然后内容推送需求方根据实际的需求以及自身内容的特点选择对应的标签，构建内容和标签的关联，最后内容推送需求方通过选择标签来圈选人群从而最终实现内容推送。但是，在相关的基于标签的进行内容的推送方式中，同一标签对应的内容本身也是有一定差异的，造成推送给用户的内容不够准确，进而也会造成执行内容推送的服务器的处理资源以及造成推送渠道资源的浪费。

发明内容

鉴于上述问题，本申请提出了一种内容推送方法、装置以及电子设备，以改善上述问题。

第一方面，本申请提供了一种内容推送方法，应用于服务器，所述方法包括：获取待推送用户的用户标识；获取第一嵌入向量，所述第一嵌入向量为所述用户标识所对应属性信息的序列嵌入向量；基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，所述历史阅览内容的嵌入向量包括历史阅览内容的序列嵌入向量以及图嵌入向量，所述候选内容的嵌入向量包括候选内容的序列嵌入向量以及图嵌入向量；基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配；若匹配，将所述候选内容推送给所述待推送用户。

第二方面，本申请提供了一种内容推送装置，运行于服务器，所述装置包括：标识获取单元，用于获取待推送用户的用户标识；嵌入向量获取单元，用于获取第一嵌入向量，所述第一嵌入向量为所述用户标识所对应属性信息的序列嵌入向量；用户兴趣向量生成单元，用于基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，所述历史阅览内容的嵌入向量包括历史阅览内容的序列嵌入向量以及图嵌入向量，所述候选内容的嵌入向量包括候选内容的序列嵌入向量以及图嵌入向量；向量处理单元，用于基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配；推送单元，用于若匹配，将所述候选内容推送给所述待推送用户。

第三方面，本申请提供了一种电子设备，所述电子设备至少包括处理器、以及存储器；一个或多个程序被存储在所述存储器中并被配置为由所述处理器执行以实现上述方法。

第四方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码被处理器运行时执行上述方法。

本申请提供的一种内容推送方法、装置以及电子设备，在获取待推送用户的用户标识后，会获取该用户标识所对应属性信息的序列嵌入向量作为第一嵌入向量，然后基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，进而基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配。

从而通过在建立历史阅览内容以及候选内容的嵌入向量过程中，使得所建立的嵌入向量不仅仅会包括有序列嵌入向量，还会包括有图嵌入向量的方式，使得除了能够通过序列嵌入向量获取到内容本身属性方面的特征外，还可以通过图嵌入向量获取到不同内容相互之间的一些特征，进而有利于获取到内容所对应的更加全面的特征，有利于为用户推送更为准确的内容。并且，因为是通过注意力机制来计算得到的表征用户兴趣的第二嵌入向量，从而使得该第二嵌入向量能够更有效的表达用户近期的兴趣，也有利于后续更加准确的计算出候选内容是否与用户的近期兴趣匹配。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请一实施例提出的一种内容推送方法的流程图；

图2示出了本申请另一实施例提出的一种内容推送方法的流程图；

图3示出了本申请实施例中获取图嵌入向量的示意图；

图4示出了本申请实施例中通过附加信息生成新的内容的图嵌入向量的示意图；

图5示出了本申请实施中一种权重计算单元的结构示意图；

图6示出了本申请实施中一种多个历史推送内容的示意图；

图7示出了本申请实施中一种生成第二嵌入向量的流程图；

图8示出了本申请实施例提出的另一种内容推送装置的结构框图；

图9示出了本申请实施例提出的再一种内容推送装置的结构框图；

图10示出了本申请的用于执行根据本申请实施例的内容推送方法的另一种电子设备的结构框图；

图11是本申请实施例的用于保存或者携带实现根据本申请实施例的内容推送方法的程序代码的存储单元。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

随着移动网络的发展，更多的内容推送需求方会通过进行内容推送的方式来向用户推广自己的产品。在相关的推送方式中，通常会预先给用户打上兴趣标签，构建用户和标签的关联，然后内容推送需求方根据实际的需求以及自身内容的特点选择对应的标签，构建内容和标签的关联，最后内容推送需求方通过选择标签来圈选人群从而最终实现内容推送。例如，某个用户的标签对电子产品类的标签，而某个内容推送需求方自己需要推送的内容也是关于电子产品的，那么该内容推送需求方就会选择将自己需要推送的内容推送给标签为表征对电子产品感兴趣的用户。

但是，发明人在对该种相关的内容推送方式的研究中发现，在基于标签的内容推送方式中，即使对应于同一个标签的内容本身还是有一定的区别。若是完全按照标签来进行内容推送依然还是会存在推送不够准确的问题。例如，在内容的类型为广告的情况下，即使均是对应于电子产品这个标签的广告，也可能是属于耳机的广告，也可能是属于手机的广告。并且，发明人在对用户的兴趣研究中发现，用户的兴趣可能会随着时间变化。但是，相关的内容推送方式还无法及时有效的发现用户的兴趣变化而造成推送给用户的内容并不是用户当前感兴趣的内容。

再者，推送给用户的内容通常是由服务器来执行的，因为相关的推送方式无法准确的给用户推送感兴趣的内容，进而就会造成对于推送渠道资源的浪费。例如，推送过程中会占用一定的网络带宽，进而在推送的内容为用户不感兴趣的内容的情况下，使得该对于网络带宽的占用较为浪费。

因此，发明人在研究中发现上述问题后，提出了本申请中可以改善上述问题的内容推送方法、装置以及电子设备。在获取待推送用户的用户标识后，会获取该用户标识所对应属性信息的序列嵌入向量作为第一嵌入向量，然后基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，进而基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配。

在对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及一种应用环境进行介绍。

可选的，本申请实施例所提供的内容推送方法可以由服务器执行。其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。其中，在本申请实施例提供的内容推送方法由多个物理服务器构成的服务器集群或者分布式系统执行的情况下，内容推送方法中的不同步骤可以分别由不同的物理服务器执行，或者可以由基于分布式系统构建的服务器基于分布式的方式执行。

下面将结合附图具体描述本申请的各实施例。

请参阅图1，本申请实施例提供的一种内容推送方法，应用于服务器，所述方法包括：

S110：获取待推送用户的用户标识。

需要说明的是，在本申请实施例中待推送用户为确定的待进行内容推送的用户。在本实施例中，可以有多种的确定待推送用户的方式。

作为一种方式，可以获取商户端确定的用户作为待推送用户。需要说明的是，在本实施例中内容推送可以是由商户端发送的请求而触发的，在这种情况下，商户端可以选择具体将那些用户作为后续的内容推送目标人群，进而将该内容推送目标人群发送到服务器中，则服务器可以将该推送目标人群的用户作为商户端确定的用户。

作为另外一种方式，可以由服务器根据用户的行为来确定待推送用户。需要说明的是，可选的，对用户进行内容推送的目的更多在于期望能够给用户推送感兴趣的内容，进而触发用户有消费行为。在这种方式下，服务器可以检测用户在最近一段时间内的消费行为，对于消费频率较低的用户则可以通过进行内容推送的方式来促进其进行消费。那么可选的，服务器可以对用户的消费频率进行检测，将消息频率低于频率阈值的用户作为待推送用户。

在服务器中为了对每个用户进行区分，会给每个用户分配一个用于对用户进行唯一性标识的用户标识。示例性的，该用户标识可以为用户进行系统登录的帐号。该系统可以为运行于本实施例中服务器中的系统。

S120：获取第一嵌入向量，所述第一嵌入向量为所述用户标识所对应属性信息的序列嵌入向量。

需要说明的是，在本实施例中用户的属性信息可以包括有用户的年龄、性别以及职业等信息中的至少一个信息。在服务器中可以对每个用户的属性信息进行存储，并且为了便于服务器识别属性信息具体是属于哪个用户的，则会将用户的属性信息与用户标识对应进行存储。示例性的，服务器中可以基于数据表的形式对用户标识以及对应的属性信息进行存储，在这种方式下，服务器可以将用户标识作为查询关键字进而通过查表的方式来获取到用户标识对应的属性信息。

可选的，在用户的属性信息包括多个属性的情况下，在获取到用户标识对应的属性信息后，可以分别获取每个属性各自对应的序列嵌入向量，然后再将每个属性各自对应的序列嵌入向量组合得到用户标识所对应属性信息的序列嵌入向量(sequenceembedding)。示例性的，若待推送用户的用户标识对应的属性信息中包括有用户的年龄、性别以及职业，那么服务器可以针对年龄生成对应的序列嵌入向量，针对性别生成对应的序列嵌入向量，以及针对职业生成对应的序列嵌入向量，然后将针对年龄生成对应的序列嵌入向量、针对性别生成对应的序列嵌入向量以及针对职业生成对应的序列嵌入向量进行拼接得到用户标识所对应属性信息的序列嵌入向量，以作为第一嵌入向量。

可选的，可以基于word2vec的方式来获取到属性信息中每个属性对应的序列嵌入向量。

S130：基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，所述历史阅览内容的嵌入向量包括历史阅览内容的序列嵌入向量以及图嵌入向量，所述候选内容的嵌入向量包括候选内容的序列嵌入向量以及图嵌入向量。

需要说明的是，在本申请实施例中的嵌入向量会包括有序列嵌入向量以及图嵌入向量。如前述内容所示，序列嵌入向量可以为基于word2vec的方式来获取到的嵌入向量。在本实施例中，内容对应的序列嵌入向量为表征内容本身特征的嵌入向量，也就是说，在对当前内容进行对应的序列嵌入向量生成的时候，并不用考虑其他内容与当前内容之间的关系。

对应的，本实施例中的内容对应的图嵌入向量除了会表征内容本身的特征外，还会体现所对应内容与其他内容之间的关系，该关系可以为顺序关系。示例性的，用户在对内容的阅览是会有一定顺序关系的，例如，对于内容A、内容B以及内容C，那么用户可以是先阅览内容A，然后阅览内容B，再阅览内容C。也可以是，用户先阅览内容B，再阅览内容A，再阅览内容C。

从而通过将内容的序列嵌入向量和图嵌入向量组合得到内容对应的嵌入向量后，使得该包括有序列嵌入向量和图嵌入向量的嵌入向量能够更加全面的对内容进行表征，也使得在计算用户的第二嵌入向量的过程中，所计算得到的第二嵌入向量能够更为准确。

再者，需要说明的是，注意力机制(Attention Mechanism)是机器学习中的一种数据处理方法。在基于注意力机制进行计算的过程中，距离当前时刻越近的特征会更多的收到关注，进而使得距离当前时刻越近的特征会更大程度的影响最终的计算结果。可选的，用户标识对应的历史阅览内容会对应有历史阅览的时间，所以在基于注意力机制对计算得到第二嵌入向量的过程中，会检测用户标识对应的历史阅览内容中每个历史阅览内容的先后关系，进而使得距离当前时刻(开始进行计算的时刻)的历史阅览内容更大程度的影响最终计算得到的第二嵌入向量，也就使得最终所计算得到的第二嵌入向量可以更大程度的体现用户近期感兴趣的内容。

示例性的，用户可能在开始的时候是对汽车比较感兴趣，对于所推送的关于汽车的内容都会进行点击查阅，而在近期用户可能又会变得对电子产品感兴趣，更多是点击内容关于电子产品的推送内容进行阅览。在这种实例下，在进行第二嵌入向量的过程中，可能会使得内容为电子产品的历史阅览内容相比内容为汽车的历史阅览内容更大程度的影响第二嵌入向量的生成，以便所生成的第二嵌入向量能够体现用户近期是对电子产品干兴趣。

S140：基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配。

在本实施例中，在得到第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量后，可以将第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量输入到预先训练得到的神经网络模型中。需要说明的是，该训练得到的神经网络模型可以对输入的嵌入向量进行处理并对应输出结果。进而，服务器可以根据该输出结果来确定候选内容是否与所述待推送用户匹配。

S150：若匹配，将所述候选内容推送给所述待推送用户。

在识别到候选内容与待推送用于匹配后，则表征候选内容为用户感兴趣的内容，或者说是用户近期感兴趣的内容，进而服务器会将候选内容推送给所述待推送用户。

作为一种方式，在确定候选内容与待推送用户匹配时，可以实时的将候选内容发送给待推送用户，也可以根据具体设定的推送时刻进行推送。

可选的，若推送行为是由商户端发起的情况下，商户端可以配置具体的内容推送时刻，那么在确定待推送用户对应匹配的候选内容后，则可以按照商户端配置的内容推送时刻进行内容推送。

再者，可选的，用户可能自行配置接收推送内容的时间，在这种方式下在确定待推送用户对应匹配的候选内容后，可以根据待推送用户配置的接收推送内容的时间进行内容推送。可选的，若是在待推送用户A配置的接收推送内容的时间之前就已经确定了待推送用户A对应的候选内容，则会先将确定的候选内容进行存储，在等到满足待推送用户A配置的接收推送内容的时间时，再执行内容推送操作。

本实施例提供的一种内容推送方法，在获取待推送用户的用户标识后，会获取该用户标识所对应属性信息的序列嵌入向量作为第一嵌入向量，然后基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，进而基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配。

请参阅图2，本申请实施例提供的一种内容推送方法，应用于服务器，所述方法包括：

S210：获取待推送用户的用户标识。

S220：获取第一嵌入向量，所述第一嵌入向量为所述用户标识所对应属性信息的序列嵌入向量。

S230：基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，计算得到所述用户标识对应的历史阅览内容与候选内容之间的权重，所述历史阅览内容的嵌入向量包括历史阅览内容的序列嵌入向量以及图嵌入向量，所述候选内容的嵌入向量包括候选内容的序列嵌入向量以及图嵌入向量。

如前述内容所示，内容对应的序列嵌入向量为表征内容本身特征的嵌入向量。作为一种方式，对于每个内容而言可以对应有多种类型的特征，那么可以分别针对不同类型的特征分别生成向量后，再将不同类型的特征进行拼接得到内容对应的序列嵌入向量。可选的，可以将内容的特征分为稠密特征以及稀疏特征，那么在进行序列嵌入向量的生成过程中，可以先获取内容的稠密特征以及稀疏特征，所述内容为所述历史阅览内容或者所述候选内容；将所述稠密特征进行独热编码得到第一待拼接向量；获取所述稀疏特征对应的序列嵌入向量作为第二待拼接向量；将所述第一待拼接向量和所述第二待拼接向量进行拼接得到所述内容的序列嵌入向量。

可选的，稠密特征可以理解为种类比较少的特征，以内容为广告为例，比如广告类别，可能总共就几十或者上百种。而稀疏特征主要指种类非常多的特征，以内容为广告为例，比如广告id，每个广告都会有唯一的id，所以数量非常庞大，可能几十万甚至上百万。

作为一种生成图嵌入向量的方式，可以基于EGES模型来生成图嵌入向量，在这种方式中可以获取多个用户阅览各自所阅览的多个内容信息的阅览顺序；基于所述阅览顺序建立对应的有向有权图；基于所述有向有权图随机生成多个阅览序列；将所述多个阅览序列作为输入对待训练神经网络进行训练，得到训练完成的神经网络模型；基于所述训练完成的神经网络模型得到内容对应的图嵌入向量。

示例性的，还是以推送内容为广告为例，如图3所示，在a所示的步骤中可以获取用户U1所点击的广告序列D、A、B，用户U2所点击的广告序列B、E、D、E、F，以及用户U3点击广告序列为E、C、B、B、A。

对应于a步骤中获取用户U1、用户U2以及用户U3对应点击广告序列后，可以再通过步骤b生成对应的有向有权图，在该有向有权图中，箭头表征了用户点击广告的次序，例如，广告D与广告A之间有由广告D指向广告A的箭头，则表征有用户先点击广告D进行阅览之后点击广告A进行了阅览。再例如，在广告A和广告B之间既有由广告A指向广告B的箭头，也有由广告B指向广告A的箭头，则表征有用户先点击广告A进行阅览之后点击广告B进行了阅览，也有用户先点击广告B进行阅览之后点击广告A进行了阅览。

在生成b步骤中的有向有权图后，可以再基于随机游走的方式生成多个阅览序列。例如，图3中c步骤对应的从广告A到广告B，再由广告B到广告E，最后有广告E到广告F为一个阅览序列。其中，随机游走的概率可以基于下列公式计算得到：

其中，N₊(v_i)是有向有权图中所有和v_i节点邻接的出边的集合，其中，出边可以理解为由该v_i节点指向其他节点的边。M_ij是节点v_i到v_j边的权重。从公式中可以看出随机游走过程中会倾向于向权重更大的节点靠近。

在经过c步骤生成多个阅览序列后，可以将多个阅览序列作为训练样本放到Word2Vec中的Skip-Gram模型中去训练得每个广告对应的图嵌入向量。

在一些在内容投放场景中，内容告的变化非常频繁，不断会有新的内容出现。对于这些新的内容或者出现时间不长的内容，用户进行阅览的信息比较少，那么对于新的内容或者出现时间不长的内容很难得到有效的图嵌入向量。针对这个问题，本实施例中可以使用附加信息来快速的获取到新的内容或者出现时间不长的内容的图嵌入向量。

示例性的，再次以内容为广告为例，如下图4所示，图4中有a、b、c、d四个广告。每个广告会有自身的信息，该信息可以理解为广告的特征，例如广告的ID或者广告的内容，再或者广告的类别等。例如，其中的广告a对应有信息1、信息2以及信息3，广告b对应有信息2和信息3。经过统计用户点击广告的序列，可以得到用户先点击广告b然后再点击广告c的次数为10，所以广告b到广告c的边权重为10，依次类推。

当新的广告a出现时，由于没有用户点击广告a的信息，所以在图4中不会有广告a到其他广告的边信息。这时候如果想表征广告a的图嵌入向量就需要使用附加信息(sideinformation)。需要说明的是，虽然没有用户点击广告a的信息，但是广告本身会有广告id、广告文案、广告类别等信息，可以利用这些信息找到和广告a相似的其他广告，比如广告a和广告b的自身特征信息2和信息3是一样或者相似的，那么可以通过这些信息来补充广告a的图嵌入向量。进而可以将广告b的图嵌入向量作为广告a的图嵌入向量。从而通过这种方式，使得在有新的广告出现时，可以更加快速的获取到新的广告的图嵌入向量，以便可以更加及时的为用户推送合适的广告。

那么基于上述示例，可选的，若检测有还未被用户阅览的内容信息时，获取参考内容信息，所述参考内容信息为已经生成有图嵌入向量的内容信息；获取所述参考内容信息中的目标内容信息，所述目标内容信息为与所述还未被用户阅览的内容信息的属性相同的内容信息；将所述目标内容信息的图嵌入向量作为所述还未被用户阅览的内容信息的图嵌入向量。对应的，通过这种方式使得，在有新的内容出现时，可以更加快速的获取到新的内容的图嵌入向量，以便可以更加及时的为用户推送合适的内容，也同时与有利于将该新的内容推送给匹配的待推送用户。

需要说明的是，本实施例中可以基于DIN(Deep Interest Network)模型中的Activation Unit单元来计算用户标识对应的历史阅览内容与候选内容之间的权重的。示例性的，Activation Unit单元的结构可以如图5所示，Activation Unit单元包括有OutProduct层、Concat层、两层全连接层。其中，Out Product层用于计算向量之间的element-wise乘法。Concat层用于对输入到该层的向量进行拼接，并输出拼接后的向量，而拼接后的向量会依次经过两层的全连接层的处理得到权重。

S240：基于所述历史阅览内容的嵌入向量以及所述权重计算得到表征用户兴趣的第二嵌入向量。

S250：基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配。

S260：若匹配，将所述候选内容推送给所述待推送用户。

作为一种方式，所述基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配，包括：将所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量进行拼接，得到待处理嵌入向量；将所述待处理嵌入向量依次经过全连接层以及归一化层进行处理，以得到所述候选内容与所述待推送用户之间的匹配概率；若匹配概率大于指定阈值概率，确定所述候选内容与所述用户标识匹配。

作为一种方式，所述用户标识对应的历史阅览内容有多个，所述基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，计算得到所述用户标识对应的历史阅览内容与候选内容之间的权重，包括：基于注意力机制计算得到多个所述历史阅览内容各自与所述候选内容之间的权重；所述基于所述历史阅览内容的嵌入向量以及所述权重计算得到表征用户兴趣的第二嵌入向量，包括：将所述多个所述历史阅览内容各自与所述候选内容之间的权重，与所述多个所述历史阅览内容各自的嵌入向量进行加权求和，得到表征用户兴趣的第二嵌入向量。

示例性的，如图6所示，延时间轴用户先后点击了游戏类广告、理财广告、汽车类广告、游戏类广告以及游戏类广告，那么在计算权重的过程中，会分别计算图6中所示的多个广告各自与候选广告之间的权重，然后再将图6中每个广告与对应的权重相乘，再将多个乘积求和得到表征用户兴趣的第二嵌入向量。

下面再通过一个整体的示意图对有多个历史阅览内容的情况下如何计算得到第二嵌入向量进行说明。

如图7所示，多个历史阅览内容为图7中所示的内容1、内容2……内容n。可以将内容1、内容2……内容n分别与候选内容输入到权重计算单元中，以计算内容1、内容2……内容n分别对候选内容的权重，即分别计算内容1对候选内容的权重，计算内容2对候选内容的权重，直到计算内容n对候选内容的权重。然后，将内容1、内容2……内容n分别对候选内容的权重输入到用户兴趣向量计算单元进行加权计算得到表征用户兴趣的第二嵌入向量。示例性的，可以基于下列公式进行加权求和。该公式为：

在上述公式中，V_u(A)为计算得到的第二嵌入向量。v_A表征是候选内容。e₁为内容1，e₂为内容2，以此类推，e_H为内容n。其中，w_j表征历史阅览内容相对候选内容的权重。例如，w₁为e₁相对候选内容v_A的权重，w₂为e₂相对候选内容v_A的权重。

需要说明的是，本实施例提供的内容推送方法可以是针对单个候选内容进行的，那么在这种情况下，在执行S260之后，就可以针对下一个候选内容再次执行前述S210到S250的步骤，直到完成对所有的候选内容的判断。那么若不匹配，则不会将当前进行判断的候选内容推送给待推送用户。其中，对所有的候选内容的判断可以理解为判断所有的候选内容是否与待推送用户匹配。其中，所有的候选内容可以为存储的所有推送内容，也可以为从存储的所有推送内容中选择的部分推送内容。

本实施例提供的一种内容推送方法，从而通过在建立历史阅览内容以及候选内容的嵌入向量过程中，使得所建立的嵌入向量不仅仅会包括有序列嵌入向量，还会包括有图嵌入向量的方式，使得除了能够通过序列嵌入向量获取到内容本身属性方面的特征外，还可以通过图嵌入向量获取到不同内容相互之间的一些特征，进而有利于获取到内容所对应的更加全面的特征，有利于为用户推送更为准确的内容。并且，因为是通过注意力机制来计算得到的表征用户兴趣的第二嵌入向量，从而使得该第二嵌入向量能够更有效的表达用户近期的兴趣，也有利于后续更加准确的计算出候选内容是否与用户的近期兴趣匹配。并且，在本实施例中，是会基于注意力机制来计算用户标识对应的历史阅览内容与候选内容之间的权重，并且在基于注意力机制计算权重的过程中，基于用户最近阅览过的内容会相对有更高的权重，有利于将与用户最近阅览过的内容相同或者相近的候选内容识为与用户匹配，以便可以尽可能的为用户推送近期兴趣相关的内容。

请参阅图8，本申请实施例提供的一种内容推送装置300，运行于服务器，所述装置300包括：

标识获取单元310，用于获取待推送用户的用户标识。

嵌入向量获取单元320，用于获取第一嵌入向量，所述第一嵌入向量为所述用户标识所对应属性信息的序列嵌入向量。

用户兴趣向量生成单元330，用于基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，所述历史阅览内容的嵌入向量包括历史阅览内容的序列嵌入向量以及图嵌入向量，所述候选内容的嵌入向量包括候选内容的序列嵌入向量以及图嵌入向量。

作为一种方式，用户兴趣向量生成单元330，具体用于基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，计算得到所述用户标识对应的历史阅览内容与候选内容之间的权重；基于所述历史阅览内容的嵌入向量以及所述权重计算得到表征用户兴趣的第二嵌入向量。

可选的，所述用户标识对应的历史阅览内容有多个。对应的，用户兴趣向量生成单元330，具体用于基于注意力机制计算得到多个所述历史阅览内容各自与所述候选内容之间的权重；将所述多个所述历史阅览内容各自与所述候选内容之间的权重，与所述多个所述历史阅览内容各自的嵌入向量进行加权求和，得到表征用户兴趣的第二嵌入向量。

向量处理单元340，用于基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配。

作为一种方式，向量处理单元340，具体用于将所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量进行拼接，得到待处理嵌入向量；将所述待处理嵌入向量依次经过全连接层以及归一化层进行处理，以得到所述候选内容与所述待推送用户之间的匹配概率；若匹配概率大于指定阈值概率，确定所述候选内容与所述用户标识匹配。

推送单元350，用于若匹配，将所述候选内容推送给所述待推送用户。

可选的，如图9所示，所述装置还包括：序列嵌入向量生成单元360，用于获取内容的稠密特征以及稀疏特征，所述内容为所述历史阅览内容或者所述候选内容；将所述稠密特征进行独热编码得到第一待拼接向量；获取所述稀疏特征对应的序列嵌入向量作为第二待拼接向量；将所述第一待拼接向量和所述第二待拼接向量进行拼接得到所述内容的序列嵌入向量。

图嵌入向量生成单元370，用于获取多个用户阅览各自所阅览的多个内容信息的阅览顺序；基于所述阅览顺序建立对应的有向有权图；基于所述有向有权图随机生成多个阅览序列；将所述多个阅览序列作为输入对待训练神经网络进行训练，得到训练完成的神经网络模型；基于所述训练完成的神经网络模型得到内容对应的图嵌入向量。

图嵌入向量生成单元370，还用于若检测有还未被用户阅览的内容信息时，获取参考内容信息，所述参考内容信息为已经生成有图嵌入向量的内容信息；获取所述参考内容信息中的目标内容信息，所述目标内容信息为与所述还未被用户阅览的内容信息的属性相同的内容信息；将所述目标内容信息的图嵌入向量作为所述还未被用户阅览的内容信息的图嵌入向量。

本申请提供的一种内容推送装置，从而通过在建立历史阅览内容以及候选内容的嵌入向量过程中，使得所建立的嵌入向量不仅仅会包括有序列嵌入向量，还会包括有图嵌入向量的方式，使得除了能够通过序列嵌入向量获取到内容本身属性方面的特征外，还可以通过图嵌入向量获取到不同内容相互之间的一些特征，进而有利于获取到内容所对应的更加全面的特征，有利于为用户推送更为准确的内容。并且，因为是通过注意力机制来计算得到的表征用户兴趣的第二嵌入向量，从而使得该第二嵌入向量能够更有效的表达用户近期的兴趣，也有利于后续更加准确的计算出候选内容是否与用户的近期兴趣匹配。

需要说明的是，本申请中装置实施例与前述方法实施例是相互对应的，装置实施例中具体的原理可以参见前述方法实施例中的内容，此处不再赘述。

下面将结合图10对本申请提供的一种电子设备进行说明。

请参阅图10，基于上述的图片处理方法、装置，本申请实施例还提供的另一种可以执行前述图片处理方法的服务器100。服务器100包括相互耦合的一个或多个(图中仅示出一个)处理器102、存储器104以及网络模块106。其中，该存储器104中存储有可以执行前述实施例中内容的程序，而处理器102可以执行该存储器104中存储的程序。

其中，处理器102可以包括一个或者多个处理核。处理器102利用各种接口和线路连接整个服务器100内的各个部分，通过运行或执行存储在存储器104内的指令、程序、代码集或指令集，以及调用存储在存储器104内的数据，执行服务器100的各种功能和处理数据。可选地，处理器102可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(ProgrammableLogic Array，PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(CentralProcessing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器102中，单独通过一块通信芯片进行实现。

存储器104可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

所述网络模块106用于接收以及发送电磁波，实现电磁波与电信号的相互转换，从而与通讯网络或者其他设备进行通讯，例如和音频播放设备进行通讯。所述网络模块106可包括各种现有的用于执行这些功能的电路元件，例如，天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。所述网络模块106可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。例如，网络模块106可以与基站进行信息交互。

请参考图11，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质800包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。

综上所述，本申请提供的一种内容推送方法、装置以及电子设备，在获取待推送用户的用户标识后，会获取该用户标识所对应属性信息的序列嵌入向量作为第一嵌入向量，然后基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，进而基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配。

从而通过在建立历史阅览内容以及候选内容的嵌入向量过程中，使得所建立的嵌入向量不仅仅会包括有序列嵌入向量，还会包括有图嵌入向量的方式，使得除了能够通过序列嵌入向量获取到内容本身属性方面的特征外，还可以通过图嵌入向量获取到不同内容相互之间的一些特征，进而有利于获取到内容所对应的更加全面的特征，有利于为用户推送更为准确的内容。并且，因为是通过注意力机制来计算得到的表征用户兴趣的第二嵌入向量，从而使得该第二嵌入向量能够更有效的表达用户近期的兴趣，也有利于后续更加准确的计算出候选内容是否与用户的近期兴趣匹配。并且，在更加准确的计算出候选内容是否与用户的近期兴趣匹配的情况下，使得服务器在进行内容推送时所使用的处理资源，以及在进行推送时所占用的推送渠道资源都是得到有效利用的，进而避免了对服务器的处理资源以及推送渠道资源的浪费。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种内容推送方法，其特征在于，应用于服务器，所述方法包括：

获取待推送用户的用户标识；

获取第一嵌入向量，所述第一嵌入向量为所述用户标识所对应属性信息的序列嵌入向量；

基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，所述历史阅览内容的嵌入向量包括历史阅览内容的序列嵌入向量以及图嵌入向量，所述候选内容的嵌入向量包括候选内容的序列嵌入向量以及图嵌入向量；

基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配；

若匹配，将所述候选内容推送给所述待推送用户。

2.根据权利要求1所述的方法，其特征在于，所述基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，包括：

基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，计算得到所述用户标识对应的历史阅览内容与候选内容之间的权重；

基于所述历史阅览内容的嵌入向量以及所述权重计算得到表征用户兴趣的第二嵌入向量。

3.根据权利要求2所述的方法，其特征在于，所述用户标识对应的历史阅览内容有多个，所述基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，计算得到所述用户标识对应的历史阅览内容与候选内容之间的权重，包括：

基于注意力机制计算得到多个所述历史阅览内容各自与所述候选内容之间的权重；

所述基于所述历史阅览内容的嵌入向量以及所述权重计算得到表征用户兴趣的第二嵌入向量，包括：

将所述多个所述历史阅览内容各自与所述候选内容之间的权重，与所述多个所述历史阅览内容各自的嵌入向量进行加权求和，得到表征用户兴趣的第二嵌入向量。

4.根据权利要求1-3任一所述的方法，其特征在于，所述基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配，包括：

将所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量进行拼接，得到待处理嵌入向量；

将所述待处理嵌入向量依次经过全连接层以及归一化层进行处理，以得到所述候选内容与所述待推送用户之间的匹配概率；

若匹配概率大于指定阈值概率，确定所述候选内容与所述用户标识匹配。

5.根据权利要求1-3任一所述的方法，其特征在于，所述方法还包括：

获取内容的稠密特征以及稀疏特征，所述内容为所述历史阅览内容或者所述候选内容；

将所述稠密特征进行独热编码得到第一待拼接向量；

获取所述稀疏特征对应的序列嵌入向量作为第二待拼接向量；

将所述第一待拼接向量和所述第二待拼接向量进行拼接得到所述内容的序列嵌入向量。

6.根据权利要求1-3任一所述的方法，其特征在于，所述方法还包括：

获取多个用户阅览各自所阅览的多个内容信息的阅览顺序；

基于所述阅览顺序建立对应的有向有权图；

基于所述有向有权图随机生成多个阅览序列；

将所述多个阅览序列作为输入对待训练神经网络进行训练，得到训练完成的神经网络模型；

基于所述训练完成的神经网络模型得到内容对应的图嵌入向量。

7.根据权利要6所述的方法，其特征在于，所述方法还包括：

若检测有还未被用户阅览的内容信息时，获取参考内容信息，所述参考内容信息为已经生成有图嵌入向量的内容信息；

获取所述参考内容信息中的目标内容信息，所述目标内容信息为与所述还未被用户阅览的内容信息的属性相同的内容信息；

将所述目标内容信息的图嵌入向量作为所述还未被用户阅览的内容信息的图嵌入向量。

8.一种内容推送装置，其特征在于，运行于服务器，所述装置包括：

标识获取单元，用于获取待推送用户的用户标识；

嵌入向量获取单元，用于获取第一嵌入向量，所述第一嵌入向量为所述用户标识所对应属性信息的序列嵌入向量；

用户兴趣向量生成单元，用于基于注意力机制、所述用户标识对应的历史阅览内容的嵌入向量以及候选内容的嵌入向量，得到表征用户兴趣的第二嵌入向量，所述历史阅览内容的嵌入向量包括历史阅览内容的序列嵌入向量以及图嵌入向量，所述候选内容的嵌入向量包括候选内容的序列嵌入向量以及图嵌入向量；

向量处理单元，用于基于所述第一嵌入向量、第二嵌入向量以及候选内容的嵌入向量确定所述候选内容是否与所述待推送用户匹配；

推送单元，用于若匹配，将所述候选内容推送给所述待推送用户。

9.一种服务器，其特征在于，包括处理器以及存储器；一个或多个程序被存储在所述存储器中并被配置为由所述处理器执行以实现权利要求1-7任一所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码被处理器运行时执行权利要求1-7任一所述的方法。