WO2020114145A1

WO2020114145A1 - 内容推送方法及存储介质、计算机设备

Info

Publication number: WO2020114145A1
Application number: PCT/CN2019/113566
Authority: WO
Inventors: 聂照昌
Original assignee: 广州市百果园信息技术有限公司
Priority date: 2018-12-07
Filing date: 2019-10-28
Publication date: 2020-06-11
Also published as: CN109359247A; CN109359247B

Abstract

本申请提供一种内容推送方法及存储介质、计算机设备，所述方法包括：提取待推送内容的多个相关特征；将所述多个相关特征输入基于特征组合的点击率预估模型，得到所述待推送内容的预估点击率；其中，所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合，根据组合后的所述相关特征的关联性，确定出所述待推送内容的预估点击率；根据所述待推送内容的预估点击率，向用户推送内容。该方法可提高向用户推送内容的精准度。并且，该方法无需进行人工筛选组合特征，可减少人工量。

Description

内容推送方法及存储介质、计算机设备

本申请要求于2018年12月07日提交的申请号为201811497834.2、发明名称为“内容推送方法及存储介质、计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据处理技术领域，特别涉及一种内容推送方法及存储介质、计算机设备。

背景技术

随着互联网技术的快速发展，人类进入了大数据时代。这给互联网用户和互联网平台带来了新的挑战。对于用户而言，从大量信息中获取自己感兴趣的信息的难度逐渐增加。对于平台而言，如何给每位用户推荐个性化的信息/广告并以此获取收益也逐渐变成了平台的关键任务之一。因此，个性化推荐技术受到了越来越多的关注。点击率(Click-through Rate，CTR)预估是个性化推荐中的一项核心关键技术，通过机器学习方法建立模型，用于预测“如果给一位用户推荐某个信息/广告，该用户会点击的概率”。一个好的点击率预估模型可以大大提升互联网平台的收益。

业界CTR预估的场景中，采集的特征往往都是大规模离散稀疏化的。比如在淘宝的场景中，商品的数量成千上万，每一个商品会有对应的id，假设模型需要使用到商品某个特征，则需要用一个成千上万维的向量去表示商品的该特征。而CTR预估场景中特征之间可能存在比较强的相关性，比如衣服和性别，这两个特征明显存在一个很强的关联关系。当衣服具体表现为“裙子”，性别为“女”时，用户点击的概率会提高。目前在工业界，绝大多数推荐系统工程师需要挖掘出强相关的特征组合。但是挖掘有效的特征组合，需要大量的人工工作，也需要一定的跨领域知识，并且需要不断地尝试，对于推荐系统工程师来说是一个很繁重的任务。

发明内容

本申请提出一种内容推送方法及存储介质、计算机设备，实现自动化挖掘内容推送的关联特征以向用户进行内容推送，提高内容推送的精准度，并减少人工量。

本申请提供以下方案：

一种内容推送方法，包括：提取待推送内容的多个相关特征；将所述多个相关特征输入基于特征组合的点击率预估模型，得到所述待推送内容的预估点击率；其中，所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合，根据组合后的所述相关特征的关联性，确定出所述待推送内容的预估点击率；根据所述待推送内容的预估点击率，向用户推送内容。

在一实施例中，所述待推送内容包括待推送的短视频内容；所述提取待推送内容的多个相关特征，包括：提取所述待推送的短视频内容的多个用户特征以及多个短视频内容特征；所述将所述多个相关特征输入基于特征组合的点击率预估模型，得到所述待推送内容的预估点击率，包括：将所述多个用户特征以及所述多个短视频内容特征输入所述基于特征组合的点击率预估模型，得到所述待推送的短视频内容的预估点击率；所述根据所述待推送内容的预估点击率，向用户推送内容，包括：根据所述待推送的短视频内容的预估点击率，向用户推送短视频内容。

在一实施例中，所述基于特征组合的点击率预估模型包括：输入层，用于对所述多个相关特征进行独热编码，得到独热向量；逻辑回归组件，用于对所述输入层输出的所述独热向量进行逻辑回归运算，得到第一运算值；嵌套模块，用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征，得到低维度连续值向量；内积组件，用于将所述嵌套模块输出的所述低维度连续值向量进行向量内积，得到第二运算值；拼接模块，用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接，得到拼接向量；隐藏层模块，用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层，得到第三运算值；预估点击率运算模块，用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。

在一实施例中，所述根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率，包括：将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算，得到所述待推送内容的预估点击率。

在一实施例中，所述将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算，得到所述待推送内容的预估点击率，包括：获取所述第一运算值对应的第一权重、所述第二运算值对应的第二权重、所述第三运算值对应的第三权重；将所述第一运算值乘以所述第一权重，得到第一值；所述第二运算值乘以所述第二权重，得到第二值；所述第三运算值乘以所述第三权重，得到第三值；将所述第一值、所述第二值和所述第三值进行累加，得到所述待推送内容的预估点击率。

在一实施例中，所述将所述嵌套模块输出的所述低维度连续值向量进行向量内积，得到第二运算值，包括：获取每个低维度连续值向量对应的权重；将所述每个低维度连续值乘以对应的权重后进行所述向量内积，得到所述第二运算值。

在一实施例中，所述将所述嵌套模块输出的所述低维度连续值向量进行向量拼接，得到拼接向量，包括：获取所述低维度连续值向量对应的权重；将所述每个低维度连续值向量乘以对应的权重后，进行向量累加，得到所述拼接向量。

在一实施例中，所述基于特征组合的点击率预估模型包括：输入层，用于对所述多个相关特征进行独热编码，得到独热向量；逻辑回归组件，用于对所述输入层输出的所述独热向量进行逻辑回归运算，得到第一运算值；嵌套模块，用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征，得到低维度连续值向量；向量相乘组件，用于通过并行计算方式，采用矩阵乘法对所述嵌套模块输出的所述低维度连续值向量进行向量相乘，得到结果值向量；获取所述结果值向量上三角的值，将所述上三角的值进行累加，将累加结果值作为第二运算值；拼接模块，用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接，得到拼接向量；隐藏层模块，用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层，得到第三运算值；预估点击率运算模块，用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。

一种存储介质，其上存储有计算机程序；所述计算机程序适于由处理器加载并执行上述任一实施例所述的内容推送方法。

一种计算机设备，其包括：一个或多个处理器；存储器；一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个应用程序配置用于执行根据上述任一实施例所述的内容推送方法。

上述实施例提供的内容推送方法，提取待推送内容的多个相关特征，将该多个相关特征输入基于特征组合的点击率预估模型中，通过点击率预估模型将多个相关特征进行组合，并分析组合后的相关特征的关联性，根据关联性确定出待推送内容的预估点击率，从而可以根据多个待推送内容的预估点击率向用户推送内容。可以是，从多个待推送内容中筛选出预估点击率较高的推送内容，并向用户推送该部分的推送内容。因此，可提高向用户推送内容的精准度。并且，该方法无需进行人工筛选组合特征，可减少人工量。

本申请附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请提供的一种内容推送方法的一实施例中的方法流程图；

图2为本申请提供的一种内容推送方法的另一实施例中的方法流程图；

图3为本申请提供的基于特征组合的点击率预估模型的一实施例中的结构框图；

图4为本申请提供的基于特征组合的点击率预估模型的一具体实施例中的结构框图；

图5为本申请提供的向量相乘组件中两向量相乘的一实施例中的示意图；

图6为本申请提供的一种计算机设备的一实施例中的结构示意图。

具体实施方式

下面详细描述本申请的实施例，本申请实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能解释为对本申请的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式，这里使用的“第一”、“第二”仅用于区别同一技术特征，并不对该技术特征的顺序和数量等加以限定。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

本申请提供一种内容推送方法，用于根据用户对待推送内容的预估点击率，定向向用户推送相关内容，以提高推送内容的精准度。以下先对内容推送方法的相关背景进行先导性说明：

点击率预估：预测“如果向某位用户推荐某个信息/广告等内容时，该用户会点击推送内容”的概率。

特征组合：通过将单独的特征进行组合(相乘或求笛卡尔积等方式)而形成的合成特征。其中，特征组合有助于表示特征之间的非线性关系。

嵌套(embedding)：将高维度稀疏离散化的特征转换成低维度连续值特征的方法。

独热向量(one-hot vector)：只有一个值为1，其他值均为0的稀疏离散向量。

现有的点击率预估深度神经模型，在嵌套embedding时，针对一个输入的特征，只会生成一个低维度的连续值特征向量，以与其他特征做组合。假设已有特征1为衣服，特征2为性别，特征3为年龄。其中，衣服与年龄，衣服与性别的关联程度是不一样的。假设衣服对应的向量为(0.3,0.4)，性别对应的向量为(x1,y1)，性别对应的向量为(x2,y2)，用特征向量的点积作为特征组合的重要性的值，则衣服提供的权重都是0.5(即向量的模)，该值对于年龄和性别都是一样的。但显然，衣服与年龄的组合，和衣服与性别的组合，是完全不一样的两种方式。针对这个问题，本申请提出了一种新的点击率预估神经网络模型，以将特征进行交叉，深度挖掘交叉后特征之间的关联性，最终输出点击的概率值，根据该概率值判定用户点击商品概率。

在一实施例中，如图1所示，本申请提供内容推送方法，包括以下步骤：

S100，提取待推送内容的多个相关特征。

在本实施例中，服务器提取待推送内容的多个相关特征。其中。待推送内容可以是商品、广告、短视频等内容。多个相关特征可以包括待推送内容本身特性的内容特征以及与该待推送内容关联的非本身特性的特征。如，待推送内容为短视频内容时，其多个相关特征可包括观看短视频的用户特征以及短视频本身特征(如观看人数、点赞数、视频标签等)。

S200，将多个相关特征输入基于特征组合的点击率预估模型，得到待推送内容的预估点击率；其中，基于特征组合的点击率预估模型用于将多个相关特征进行组合，根据组合后的相关特征的关联性，确定出待推送内容的预估点击率。

在本实施例中，基于特征组合的点击率预估模型为用于将输入的多个特征进行特征组合，并分析组合后特征之间的关联性，根据特征的关联性确定出用户对待推送内容的预估点击率。服务器将待推送内容的多个相关特征输入该基于特征组合的点击率预估模型中，根据组合后特征的相关性得到待推送内容的预估点击率。

在一实施例中，如图3所示，基于特征组合的点击率预估模型包括：输入层10、逻辑回归组件20、嵌套模块30、内积组件40、拼接模块50、隐藏层模块60以及预估点击率运算模块70。

输入层10用于对多个相关特征进行独热编码，得到独热向量。具体地，输入层10接收多个相关特征，将该多个相关特征进行独热编码，得到多个独热向量。每个独热向量为向量内只有一个值为1，其他值均为0的稀疏离散向量。逻辑回归组件20用于对输入层10输出的独热向量进行逻辑回归运算，得到第一运算值。因此，可挖掘待推送内容的简单有效的独立特征。嵌套模块30用于将输入层10输出的独热向量的高维度稀疏离散化特征转换成低维度连续值特征，得到低维度连续值向量。其中，一个独热向量输入嵌套模块30后，得到多个低维度连续值向量。

内积组件40用于将嵌套模块30输出的低维度连续值向量进行向量内积，得到第二运算值。向量内积可看作本申请提供的特征组合的一种方式。此部分对低维度连续值向量进行向量内积，可直观地表示两个特征之间的组合关系。在一实施方式中，将嵌套模块输出的低维度连续值向量进行向量内积，得到第二运算值，包括：获取每个低维度连续值向量对应的权重；将每个低维度连续值乘以对应的权重后进行向量内积，得到第二运算值。在该实施方式中，每个低维度连续值向量均对应一个权重，并且该权重在模型训练过程中会自动更显。服务器每次获取更新后的每个低维度连续值向量对应的权重，将每个低维度连续值乘以对应的权重后进行向量内积，得到第二运算值。

拼接模块50用于将嵌套模块30输出的低维度连续值向量进行向量拼接，得到拼接向量。此处，向量拼接也可看成特征组合的方式。通过向量拼接之后，将结果输入多层的神经网络，可更进一步挖掘深度的特征组合关系。在一实施方式中，将嵌套模块输出的低维度连续值向量进行向量拼接，得到拼接向量，包括：获取低维度连续值向量对应的权重；将每个低维度连续值向量乘以对应的权重后，进行向量累加，得到拼接向量。在该实施方式中，每个低维度连续值向量均对应一个权重，并且该权重在模型训练过程中会自动更显。服务器每次获取更新后的每个低维度连续值向量对应的权重，将每个低维度连续值乘以对应的权重后进行向量累加，累加后得到拼接向量。

隐藏层模块60用于将拼接模块50输出的拼接向量输入深度神经网络隐藏层，得到第三运算值。此处，深度神经网络可以是Deep and Wide，FNN(Factorisation-machine supported Neural Networks)，PNN(Factorisation-machine supported Neural NetworksProduct-based Neural Networks)，DeepFM(Deep Factorisation-machine)等。预估点击率运算模块70用于根据逻辑回归组件20输出的第一运算值、内积组件40输出的第二运算值及隐藏层模块60输出的第三运算值计算出待推送内容的预估点击率。

进一步地，根据第一运算值、第二运算值及第三运算值计算出待推送内容的预估点击率，包括：将第一运算值、第二运算值及第三运算值拼接后进行归一化运算，得到待推送内容的预估点击率。此处所述的拼接，可以是将第一运算值、第二运算值及第三运算值进行累加。具体地，在一实施方式中，获取第一运算值对应的第一权重、第二运算值对应的第二权重、第三运算值对应的第三权重；将第一运算值乘以第一权重，得到第一值；第二运算值乘以第二权重，得到第二值；第三运算值乘以第三权重，得到第三值；将第一值、第二值和第三值进行累加，得到待推送内容的预估点击率。也即是，累加计算过程中，不同的运算值对应不同的权重。将运算值乘以其对应的权重之后，再进行累加，最终得到的累加结果值即为待推送内容的预估点击率。

以下基于上述基于特征组合的点击率预估模型给出一个具体实施例，以进一步说明该基于特征组合的点击率预估模型。具体参见图4所示：

参见图4，由底向上看模型的结构图：

最底部的是输入层100，原始输入的独热向量是多个离散化one-hot向量(独热向量)，实体点表示值为1，空心点都表示值为0。为了挖掘简单有效的独立特征，在模型中设计了一个logistics regression(LR)的组件200。

往上一层，对one-hot向量进行嵌套embedding，得到低维度连续值向量300。需要说明的是，每一个one-hot向量，会生成一组连续值特征向量，在与不同的特征做组合(此处指向量拼接或者向量内积)时，使用不同的特征向量。假设以衣服、年龄、性别为例，衣服会生成两个连续值特征向量(0.3,0.4)和(0.6,0.8)。衣服和年龄组合时，使用(0.3,0.4)，此时衣服的权重为0.5；衣服和性别组合时，使用(0.6,0.8)，此时衣服的权重为1.0。

服务器进一步对低维度连续值向量300进行向量内积400，具体为进行向量间的内积，以挖掘简单有效的特征组合方式。服务器还会对低维度连续值向量300进行向量拼接，将拼接结果输入到多层神经网络隐藏层(Hidden Layers)600中，进一步挖掘复杂的特征组合方式，提升模型的学习能力。最终，将LR 400的输出，向量内积400的输出，多层隐藏层(Hidden Layers)600的输出，拼接一起，做一个归一化运算700后输出对应的预估点击率。其中，向量内积和向量拼接都可以看成特征组合的方式。向量拼接之后将输入到多层的神经网络，可挖掘深度的特征组合关系，而向量内积可以很直观地表示两个特征之间的组合关系。

需要说明的是，如图4所示，带权重的边(附图中输入层100与RL 200的连接线、输入层100与低维度连续值向量300的连接线、低维度连续值向量300与向量内积400连接线、低维度连续值向量300与向量拼接500的连接线、向量拼接500与隐藏层(Hidden Layers)600的连接线以及RL 200、向量内积400、隐藏层(Hidden Layers)600分别与归一化运算700的连接线等)为神经网络的普遍的连接边(每条边的权重不一样，在模型训练的过程中，自动更新权重)。权重为1的边(RL 200、向量内积400、隐藏层(Hidden Layers)600分别与归一化运算700的连接线)不会更新，恒为1的边，具体可以体现为直接相加形式。带权重的边表示在运算之前，对应的向量或者值需乘以对应的权重后再进行后续的运算。

以下提供一个具体的应用场景，以说明上述基于特征组合的点击率预估模型的应用：

以电商为例，底部输入的one-hot向量可以包括用户的特征(比如年龄、性别、所在城市等)，商品的特征(商品类别、商品价格、商品历史购买量等)。将这些特征作为基于特征组合的点击率预估模型的输入，模型在训练过程中自动将用户特征与商品特征进行交叉，深度挖掘两者之间的关联性。最终，模型输出一个用户点击商品的概率值，也即是预估点击率值，根据该概率值来判定用户点击该商品的概率。

在一实施例中，服务器对基于特征组合的点击率预估模型进行优化，优化后的基于特征组合的点击率预估模型包括输入层10、逻辑回归组件20、嵌套模块30、拼接模块50、隐藏层模块60以及预估点击率运算模块70，并将原来的内积组件40进行优化修改。具体将内积组件40替换为向量相乘组件。向量相乘组件用于通过并行计算方式，采用矩阵乘法对二嵌套模块输出的低维度连续值进行向量相乘，得到结果值向量；获取结果值向量上三角的值，将上三角的值进行累加，将累加结果值作为第二运算值。具体地，参见图5所示，将向量间内积的操作，变成矩阵乘法，然后取上三角的方式获取上三角的三个值，将该三个值进行累加之后得到第二运算值。利用GPU自带的并行计算方式，可以大大减少模型的训练时间。

S300，根据待推送内容的预估点击率，向用户推送内容。

在本实施例中，服务器获取多个待推送内容的预估点击率，并根据每个待推送内容的预估点击率确定出向用户进行推送的推送内容。在一实施例中，步骤S300包括：获取多个待推送内容的预估点击率，根据每个待推送内容的预估点击率从高到低对待推送内容进行排序，获取排序靠前的预设数量的待推送内容，并向用户推送该预设数量的待推送内容。或者，获取预估点击率大于预设值的待推送内容，向用户推送该预估点击率大于预设值的待推送内容。

在一实施例中，如图2所示，待推送内容包括待推送的短视频内容。步骤S100，包括：

S110，提取待推送的短视频内容的多个用户特征以及多个短视频内容特征。

步骤S200，包括：

S210，将多个用户特征以及多个短视频内容特征输入基于特征组合的点击率预估模型，得到待推送的短视频内容的预估点击率。

步骤S300，包括：

S310，根据待推送的短视频内容的预估点击率，向用户推送短视频内容。

在该实施例中，待推送内容为待推送的短视频内容。服务器提取待推送的短视频内容的相关特征，如多个用户特征以及多个短视频内容特征。具体地，相关特征可包括目标用户的用户特征，如用户性别、用户年龄、用户职业以及用户常驻地等。相关特征还可包括短视频内容本身特征，如短视频内容的观看人数、点赞人数、视频标签等。将待推送的短视频内容的多个相关特征输入基于特征组合的点击率预估模型中，通过模型将多个用户特征以及多个短视频内容特征进行组合交叉，挖掘组合后相关特征的关联性，从而输出该待推送短视频内容的预估点击率值。最终，根据该预估点击率值向用户进行个性化推送短视频内容。

本申请还提供一种存储介质。该存储介质上存储有计算机程序；该计算机程序被处理器执行时，实现上述任一实施例提供的内容推送方法。该存储介质可以是存储器。例如，内存储器或外存储器，或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本申请所公开的存储介质包括但不限于这些类型的存储器。本申请所公开的存储器只作为例子而非作为限定。

本申请还提供一种计算机设备。一种计算机设备包括：一个或多个处理器；存储器；一个或多个应用程序。其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行，一个或多个应用程序配置用于执行上述任一实施例提供的内容推送方法。

图6为本申请一实施例中的计算机设备的结构示意图。本实施例提供的计算机设备可以是服务器、个人计算机以及网络设备。如图6所示，设备包括处理器603、存储器605、输入单元607以及显示单元609等器件。本领域技术人员可以理解，图6示出的设备结构器件并不构成对所有设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件。存储器605可用于存储应用程序601以及各功能模块，处理器603运行存储在存储器605的应用程序601，从而执行设备的各种功能应用以及数据处理。存储器可以是内存储器或外存储器，或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本申请所公开的存储器包括但不限于这些类型的存储器。本申请所公开的存储器只作为例子而非作为限定。

输入单元607用于接收信号的输入，以及接收用户输入的关键字。输入单元607可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作)，并根据预先设定的程序驱动相应的连接装置；其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元609可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元609可采用液晶显示器、有机发光二极管等形式。处理器603是计算机设备的控制中心，利用各种接口和线路连接整个电脑的各个部分，通过运行或执行存储在存储器605内的软件程序和/或模块，以及调用存储在存储器内的数据，执行各种功能和处理数据。

在一实施方式中，设备包括一个或多个处理器603，以及一个或多个存储器605，一个或多个应用程序601。其中一个或多个应用程序601被存储在存储器605中并被配置为由一个或多个处理器603执行，一个或多个应用程序601配置用于执行以上实施例提供的内容推送方法。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括存储器、磁盘或光盘等。

以上所述仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

应该理解的是，在本申请各实施例中的各功能单元可集成在一个处理模块中，也可以各个单元单独物理存在，也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

Claims

一种内容推送方法，其特征在于，包括：

提取待推送内容的多个相关特征；

将所述多个相关特征输入基于特征组合的点击率预估模型，得到所述待推送内容的预估点击率；其中，所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合，根据组合后的所述相关特征的关联性，确定出所述待推送内容的预估点击率；

根据所述待推送内容的预估点击率，向用户推送内容。
根据权利要求1所述的方法，其特征在于，所述待推送内容包括待推送的短视频内容；所述提取待推送内容的多个相关特征，包括：提取所述待推送的短视频内容的多个用户特征以及多个短视频内容特征；

所述将所述多个相关特征输入基于特征组合的点击率预估模型，得到所述待推送内容的预估点击率，包括：将所述多个用户特征以及所述多个短视频内容特征输入所述基于特征组合的点击率预估模型，得到所述待推送的短视频内容的预估点击率；

所述根据所述待推送内容的预估点击率，向用户推送内容，包括：根据所述待推送的短视频内容的预估点击率，向用户推送短视频内容。
根据权利要求1所述的方法，其特征在于，所述基于特征组合的点击率预估模型包括：

输入层，用于对所述多个相关特征进行独热编码，得到独热向量；

逻辑回归组件，用于对所述输入层输出的所述独热向量进行逻辑回归运算，得到第一运算值；

嵌套模块，用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征，得到低维度连续值向量；

内积组件，用于将所述嵌套模块输出的所述低维度连续值向量进行向量内积，得到第二运算值；

拼接模块，用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接，得到拼接向量；

隐藏层模块，用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层，得到第三运算值；

预估点击率运算模块，用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。
根据权利要求3所述的方法，其特征在于，所述根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率，包括：

将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算，得到所述待推送内容的预估点击率。
根据权利要求4所述的方法，其特征在于，所述将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算，得到所述待推送内容的预估点击率，包括：

获取所述第一运算值对应的第一权重、所述第二运算值对应的第二权重、所述第三运算值对应的第三权重；

将所述第一运算值乘以所述第一权重，得到第一值；所述第二运算值乘以所述第二权重，得到第二值；所述第三运算值乘以所述第三权重，得到第三值；

将所述第一值、所述第二值和所述第三值进行累加，得到所述待推送内容的预估点击率。
根据权利要求3所述的方法，其特征在于，所述将所述嵌套模块输出的所述低维度连续值向量进行向量内积，得到第二运算值，包括：

获取每个低维度连续值向量对应的权重；

将所述每个低维度连续值乘以对应的权重后进行所述向量内积，得到所述第二运算值。
根据权利要求3所述的方法，其特征在于，所述将所述嵌套模块输出的所述低维度连续值向量进行向量拼接，得到拼接向量，包括：

获取所述低维度连续值向量对应的权重；

将所述每个低维度连续值向量乘以对应的权重后，进行向量累加，得到所述拼接向量。
根据权利要求1所述的方法，其特征在于，所述基于特征组合的点击率预估模型包括：

输入层，用于对所述多个相关特征进行独热编码，得到独热向量；

逻辑回归组件，用于对所述输入层输出的所述独热向量进行逻辑回归运算，得到第一运算值；

嵌套模块，用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征，得到低维度连续值向量；

向量相乘组件，用于通过并行计算方式，采用矩阵乘法对所述嵌套模块输出的所述低维度连续值向量进行向量相乘，得到结果值向量；获取所述结果值向量上三角的值，将所述上三角的值进行累加，将累加结果值作为第二运算值；

拼接模块，用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接，得到拼接向量；

隐藏层模块，用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层，得到第三运算值；

预估点击率运算模块，用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。
一种存储介质，其特征在于，其上存储有计算机程序；所述计算机程序适于由处理器加载并执行上述权利要求1至8中任一项所述的内容推送方法。
一种计算机设备，其特征在于，其包括：

一个或多个处理器；

存储器；

一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个应用程序配置用于执行根据权利要求1至8任一项所述的内容推送方法。