CN109359247A - 内容推送方法及存储介质、计算机设备 - Google Patents

内容推送方法及存储介质、计算机设备 Download PDF

Info

Publication number
CN109359247A
CN109359247A CN201811497834.2A CN201811497834A CN109359247A CN 109359247 A CN109359247 A CN 109359247A CN 201811497834 A CN201811497834 A CN 201811497834A CN 109359247 A CN109359247 A CN 109359247A
Authority
CN
China
Prior art keywords
content
vector
pushed
clicking rate
operation values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811497834.2A
Other languages
English (en)
Other versions
CN109359247B (zh
Inventor
聂照昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bigo Technology Singapore Pte Ltd
Original Assignee
Guangzhou Baiguoyuan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baiguoyuan Information Technology Co Ltd filed Critical Guangzhou Baiguoyuan Information Technology Co Ltd
Priority to CN201811497834.2A priority Critical patent/CN109359247B/zh
Publication of CN109359247A publication Critical patent/CN109359247A/zh
Priority to PCT/CN2019/113566 priority patent/WO2020114145A1/zh
Application granted granted Critical
Publication of CN109359247B publication Critical patent/CN109359247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种内容推送方法及存储介质、计算机设备,所述方法包括:提取待推送内容的多个相关特征;将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率;其中,所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合,根据组合后的所述相关特征的关联性,确定出所述待推送内容的预估点击率;根据所述待推送内容的预估点击率,向用户推送内容。该方法可提高向用户推送内容的精准度。并且,该方法无需进行人工筛选组合特征,可减少人工量。

Description

内容推送方法及存储介质、计算机设备
技术领域
本发明涉及数据处理技术领域,具体而言,本发明涉及一种内容推送方法及存储介质、计算机设备。
背景技术
随着互联网技术的快速发展,人类进入了大数据时代。这给互联网用户和互联网平台带来了新的挑战。对于用户而言,从大量信息中获取自己感兴趣的信息的难度逐渐增加。对于平台而言,如何给每位用户推荐个性化的信息/广告并以此获取收益也逐渐变成了平台的关键任务之一。因此,个性化推荐技术受到了越来越多的关注。点击率(Click-through Rate,CTR)预估是个性化推荐中的一项核心关键技术,通过机器学习方法建立模型,用于预测“如果给一位用户推荐某个信息/广告,该用户会点击的概率”。一个好的点击率预估模型可以大大提升互联网平台的收益。
业界CTR预估的场景中,采集的特征往往都是大规模离散稀疏化的。比如在淘宝的场景中,商品的数量成千上万,每一个商品会有对应的id,假设模型需要使用到商品某个特征,则需要用一个成千上万维的向量去表示商品的该特征。而CTR预估场景中特征之间可能存在比较强的相关性,比如衣服和性别,这两个特征明显存在一个很强的关联关系。当衣服具体表现为“裙子”,性别为“女”时,用户点击的概率会提高。目前在工业界,绝大多数推荐系统工程师需要挖掘出强相关的特征组合。但是挖掘有效的特征组合,需要大量的人工工作,也需要一定的跨领域知识,并且需要不断地尝试,对于推荐系统工程师来说是一个很繁重的任务。
发明内容
本发明提出一种内容推送方法及存储介质、计算机设备,实现自动化挖掘内容推送的关联特征以向用户进行内容推送,提高内容推送的精准度,并减少人工量。
本发明提供以下方案:
一种内容推送方法,包括:提取待推送内容的多个相关特征;将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率;其中,所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合,根据组合后的所述相关特征的关联性,确定出所述待推送内容的预估点击率;根据所述待推送内容的预估点击率,向用户推送内容。
在一实施例中,所述待推送内容包括待推送的短视频内容;所述提取待推送内容的多个相关特征,包括:提取所述待推送的短视频内容的多个用户特征以及多个短视频内容特征;所述将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率,包括:将所述多个用户特征以及所述多个短视频内容特征输入所述基于特征组合的点击率预估模型,得到所述待推送的短视频内容的预估点击率;所述根据所述待推送内容的预估点击率,向用户推送内容,包括:根据所述待推送的短视频内容的预估点击率,向用户推送短视频内容。
在一实施例中,所述基于特征组合的点击率预估模型包括:输入层,用于对所述多个相关特征进行独热编码,得到独热向量;逻辑回归组件,用于对所述输入层输出的所述独热向量进行逻辑回归运算,得到第一运算值;嵌套模块,用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征,得到低维度连续值向量;内积组件,用于将所述嵌套模块输出的所述低维度连续值向量进行向量内积,得到第二运算值;拼接模块,用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量;隐藏层模块,用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层,得到第三运算值;预估点击率运算模块,用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。
在一实施例中,所述根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率,包括:将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率。
在一实施例中,所述将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率,包括:获取所述第一运算值对应的第一权重、所述第二运算值对应的第二权重、所述第三运算值对应的第三权重;将所述第一运算值乘以所述第一权重,得到第一值;所述第二运算值乘以所述第二权重,得到第二值;第三运算值乘以所述第三权重,得到第三值;将所述第一值、所述第二值和所述第三值进行累加,得到所述待推送内容的预估点击率。
在一实施例中,所述将所述嵌套模块输出的所述低维度连续值向量进行向量内积,得到第二运算值,包括:获取每个低维度连续值向量对应的权重;将所述每个低维度连续值乘以对应的权重后进行向量内积,得到所述第二运算值。
在一实施例中,所述将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量,包括:将所述低维度连续值向量对应的权重;将所述每个低维度连续值向量乘以对应的权重后,进行向量累加,得到所述拼接向量。
在一实施例中,所述基于特征组合的点击率预估模型包括:输入层,用于对所述多个相关特征进行独热编码,得到独热向量;逻辑回归组件,用于对所述输入层输出的所述独热向量进行逻辑回归运算,得到第一运算值;嵌套模块,用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征,得到低维度连续值向量;向量相乘组件,用于通过并行计算方式,采用矩阵乘法对所述二嵌套模块输出的低维度连续值进行向量相乘,得到结果值向量;获取所述结果值向量上三角的值,将所述上三角的值进行累加,将累加结果值作为第二运算值;拼接模块,用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量;隐藏层模块,用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层,得到第三运算值;预估点击率运算模块,用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。
一种存储介质,其上存储有计算机程序;所述计算机程序适于由处理器加载并执行上述任一实施例所述的内容推送方法。
一种计算机设备,其包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据上述任一实施例所述的内容推送方法。
上述实施例提供的内容推送方法,提取待推送内容的多个相关特征,将该多个相关特征输入基于特征组合的点击率预估模型中,通过点击率预估模型将多个相关特征进行组合,并分析组合后的相关特征的关联性,根据关联性确定出待推送内容的预估点击率,从而可以根据多个待推送内容的预估点击率向用户推送内容。可以是,从多个待推送内容中筛选出预估点击率较高的推送内容,并向用户推送该部分的推送内容。因此,可提高向用户推送内容的精准度。并且,该方法无需进行人工筛选组合特征,可减少人工量。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明提供的一种内容推送方法的一实施例中的方法流程图;
图2为本发明提供的一种内容推送方法的另一实施例中的方法流程图;
图3为本发明提供的基于特征组合的点击率预估模型的一实施例中的结构框图;
图4为本发明提供的基于特征组合的点击率预估模型的一具体实施例中的结构框图;
图5为本发明提供的向量相乘组件中两向量相乘的一实施例中的示意图;
图6为本发明提供的一种计算机设备的一实施例中的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式,这里使用的“第一”、“第二”仅用于区别同一技术特征,并不对该技术特征的顺序和数量等加以限定。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本发明提供一种内容推送方法,用于根据用户对待推送内容的预估点击率,定向向用户推送相关内容,以提高推送内容的精准度。以下先对内容推送方法的相关背景进行先导性说明:
点击率预估:预测“如果向某位用户推荐某个信息/广告等内容时,该用户会点击推送内容”的概率。
特征组合:通过将单独的特征进行组合(相乘或求笛卡尔积等方式)而形成的合成特征。其中,特征组合有助于表示特征之间的非线性关系。
嵌套(embedding):将高维度稀疏离散化的特征转换成低维度连续值特征的方法。
独热向量(one-hot vector):只有一个值为1,其他值均为0的稀疏离散向量。
现有的点击率预估深度神经模型,在嵌套embedding时,针对一个输入的特征,只会生成一个低维度的连续值特征向量,以与其他特征做组合。假设已有特征1为衣服,特征2为性别,特征3为年龄。其中,衣服与年龄,衣服与性别的关联程度是不一样的。假设衣服对应的向量为(0.3,0.4),性别对应的向量为(x1,y1),性别对应的向量为(x2,y2),用特征向量的点积作为特征组合的重要性的值,则衣服提供的权重都是0.5(即向量的模),该值对于年龄和性别都是一样的。但显然,衣服与年龄的组合,和衣服与性别的组合,是完全不一样的两种方式。针对这个问题,本发明提出了一种新的点击率预估神经网络模型,以将特征进行交叉,深度挖掘交叉后特征之间的关联性,最终输出点击的概率值,根据该概率值判定用户点击商品概率。
在一实施例中,如图1所示,本发明提供内容推送方法,包括以下步骤:
S100,提取待推送内容的多个相关特征。
在本实施例中,服务器提取待推送内容的多个相关特征。其中。待推送内容可以是商品、广告、短视频等内容。多个相关特征可以包括待推送内容本身特性的内容特征以及与该待推送内容关联的非本身特性的特征。如,待推送内容为短视频内容时,其多个相关特征可包括观看短视频的用户特征以及短视频本身特征(如观看人数、点赞数、视频标签等)。
S200,将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率;其中,所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合,根据组合后的所述相关特征的关联性,确定出所述待推送内容的预估点击率。
在本实施例中,所述基于特征组合的点击率预估模型为用于将输入的多个特征进行特征组合,并分析组合后特征之间的关联性,根据特征的关联性确定出用户对待推送内容的预估点击率。服务器将待推送内容的多个相关特征输入该基于特征组合的点击率预估模型中,根据组合后特征的相关性得到待推送内容的预估点击率。
在一实施例中,如图3所示,所述基于特征组合的点击率预估模型包括:输入层10、逻辑回归组件20、嵌套模块30、内积组件40、拼接模块50、隐藏层模块60以及预估点击率运算模块70。
输入层10用于对所述多个相关特征进行独热编码,得到独热向量。具体地,输入层10接收多个相关特征,将该多个相关特征进行独热编码,得到多个独热向量。每个独热向量为向量内只有一个值为1,其他值均为0的稀疏离散向量。逻辑回归组件20用于对输入层10输出的独热向量进行逻辑回归运算,得到第一运算值。因此,可挖掘待推送内容的简单有效的独立特征。嵌套模块30用于将输入层10输出的独热向量的高维度稀疏离散化特征转换成低维度连续值特征,得到低维度连续值向量。其中,一个独热向量输入嵌套模块30后,得到多个低维度连续值向量。
内积组件40用于将嵌套模块30输出的低维度连续值向量进行向量内积,得到第二运算值。向量内积可看作本发明所述的特征组合的一种方式。此部分对低维度连续值向量进行向量内积,可直观地表示两个特征之间的组合关系。在一实施方式中,所述将所述嵌套模块输出的所述低维度连续值向量进行向量内积,得到第二运算值,包括:获取每个低维度连续值向量对应的权重;将所述每个低维度连续值乘以对应的权重后进行向量内积,得到所述第二运算值。在该实施方式中,每个低维度连续值向量均对应一个权重,并且该权重在模型训练过程中会自动更显。服务器每次获取更新后的每个低维度连续值向量对应的权重,将每个低维度连续值乘以对应的权重后进行向量内积,得到第二运算值。
拼接模块50用于将嵌套模块30输出的低维度连续值向量进行向量拼接,得到拼接向量。此处,向量拼接也可看成特征组合的方式。通过向量拼接之后,将结果输入多层的神经网络,可更进一步挖掘深度的特征组合关系。在一实施方式中,所述将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量,包括:将所述低维度连续值向量对应的权重;将所述每个低维度连续值向量乘以对应的权重后,进行向量累加,得到所述拼接向量。在该实施方式中,每个低维度连续值向量均对应一个权重,并且该权重在模型训练过程中会自动更显。服务器每次获取更新后的每个低维度连续值向量对应的权重,将每个低维度连续值乘以对应的权重后进行向量累加,累加后得到所述拼接向量。
隐藏层模块60用于将拼接模块50输出的拼接向量输入深度神经网络隐藏层,得到第三运算值。此处,深度神经网络可以是Deep and Wide,FNN(Factorisation-machinesupported Neural Networks),PNN(Factorisation-machine supported NeuralNetworksProduct-based Neural Networks),DeepFM(Deep Factorisation-machine)等。预估点击率运算模块70用于根据逻辑回归组件20输出的第一运算值、内积组件40输出的第二运算值及隐藏层模块60输出的第三运算值计算出待推送内容的预估点击率。
进一步地,所述根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率,包括:将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率。此处所述的拼接,可以是将所述第一运算值、所述第二运算值及所述第三运算值进行累加。具体地,在一实施方式中,获取所述第一运算值对应的第一权重、所述第二运算值对应的第二权重、所述第三运算值对应的第三权重;将所述第一运算值乘以所述第一权重,得到第一值;所述第二运算值乘以所述第二权重,得到第二值;第三运算值乘以所述第三权重,得到第三值;将所述第一值、所述第二值和所述第三值进行累加,得到所述待推送内容的预估点击率。也即是,累加计算过程中,不同的运算值对应不同的权重。将运算值乘以其对应的权重之后,再进行累加,最终得到的累加结果值即为所述待推送内容的预估点击率。
以下基于上述基于特征组合的点击率预估模型给出一个具体实施例,以进一步说明该基于特征组合的点击率预估模型。具体参见图4所示:
参见图4,由底向上看模型的结构图:
最底部的是输入层100,原始输入的独热向量是多个离散化one-hot向量(独热向量),实体点表示值为1,空心点都表示值为0。为了挖掘简单有效的独立特征,在模型中设计了一个logistics regression(LR)的组件200。
往上一层,对one-hot向量进行嵌套embedding,得到低维度连续值向量300。需要说明的是,每一个one-hot向量,会生成一组连续值特征向量,在与不同的特征做组合(此处指向量拼接或者向量内积)时,使用不同的特征向量。假设以衣服、年龄、性别为例,衣服会生成两个连续值特征向量(0.3,0.4)和(0.6,0.8)。衣服和年龄组合时,使用(0.3,0.4),此时衣服的权重为0.5;衣服和性别组合时,使用(0.6,0.8),此时衣服的权重为1.0。
服务器进一步对低维度连续值向量300进行向量内积400,具体为进行向量间的内积,以挖掘简单有效的特征组合方式。服务器还会对低维度连续值向量300进行向量拼接,将拼接结果输入到多层神经网络隐藏层(Hidden Layers)600中,进一步挖掘复杂的特征组合方式,提升模型的学习能力。最终,将LR 400的输出,向量内积400的输出,多层隐藏层(Hidden Layers)600的输出,拼接一起,做一个归一化运算700后输出对应的预估点击率。其中,向量内积和向量拼接都可以看成特征组合的方式。向量拼接之后将输入到多层的神经网络,可挖掘深度的特征组合关系,而向量内积可以很直观地表示两个特征之间的组合关系。
需要说明的是,如图4所示,带权重的边(附图中输入层100与RL 200的连接线、输入层100与低维度连续值向量300的连接线、低维度连续值向量300与向量内积400连接线、低维度连续值向量300与向量拼接500的连接线、向量拼接500与隐藏层(Hidden Layers)600的连接线以及RL200、向量内积400、隐藏层(Hidden Layers)600分别与归一化运算700的连接线等)为神经网络的普遍的连接边(每条边的权重不一样,在模型训练的过程中,自动更新权重)。权重为1的边(RL 200、向量内积400、隐藏层(Hidden Layers)600分别与归一化运算700的连接线)不会更新,恒为1的边,具体可以体现为直接相加形式。带权重的边表示在运算之前,对应的向量或者值需乘以对应的权重后再进行后续的运算。
以下提供一个具体的应用场景,以说明上述基于特征组合的点击率预估模型的应用:
以电商为例,底部输入的one-hot向量可以包括用户的特征(比如年龄、性别、所在城市等),商品的特征(商品类别、商品价格、商品历史购买量等)。将这些特征作为基于特征组合的点击率预估模型的输入,模型在训练过程中自动将用户特征与商品特征进行交叉,深度挖掘两者之间的关联性。最终,模型输出一个用户点击商品的概率值,也即是预估点击率值,根据该概率值来判定用户点击该商品的概率。
在一实施例中,服务器对基于特征组合的点击率预估模型进行优化,优化后的基于特征组合的点击率预估模型包括输入层10、逻辑回归组件20、嵌套模块30、拼接模块50、隐藏层模块60以及预估点击率运算模块70,并将原来的内积组件40进行优化修改。具体将内积组件40替换为向量相乘组件。向量相乘组件用于通过并行计算方式,采用矩阵乘法对所述二嵌套模块输出的低维度连续值进行向量相乘,得到结果值向量;获取所述结果值向量上三角的值,将所述上三角的值进行累加,将累加结果值作为第二运算值。具体地,参见图5所示,将向量间内积的操作,变成矩阵乘法,然后取上三角的方式获取上三角的三个值,将该三个值进行累加之后得到所述第二运算值。利用GPU自带的并行计算方式,可以大大减少模型的训练时间。
S300,根据所述待推送内容的预估点击率,向用户推送内容。
在本实施例中,服务器获取多个待推送内容的预估点击率,并根据每个待推送内容的预估点击率确定出向用户进行推送的推送内容。在一实施例中,步骤S300包括:获取多个待推送内容的预估点击率,根据每个待推送内容的预估点击率从高到低对待推送内容进行排序,获取排序靠前的预设数量的待推送内容,并向用户推送该预设数量的待推送内容。或者,获取预估点击率大于预设值的待推送内容,向用户推送该预估点击率大于预设值的待推送内容。
上述实施例提供的内容推送方法,提取待推送内容的多个相关特征,将该多个相关特征输入基于特征组合的点击率预估模型中,通过点击率预估模型将多个相关特征进行组合,并分析组合后的相关特征的关联性,根据关联性确定出待推送内容的预估点击率,从而可以根据多个待推送内容的预估点击率向用户推送内容。可以是,从多个待推送内容中筛选出预估点击率较高的推送内容,并向用户推送该部分的推送内容。因此,可提高向用户推送内容的精准度。并且,该方法无需进行人工筛选组合特征,可减少人工量。
在一实施例中,如图2所示,所述待推送内容包括待推送的短视频内容。步骤S100,包括:
S110,提取所述待推送的短视频内容的多个用户特征以及多个短视频内容特征。
步骤S200,包括:
S210,将所述多个用户特征以及所述多个短视频内容特征输入所述基于特征组合的点击率预估模型,得到所述待推送的短视频内容的预估点击率。
步骤S300,包括:
S310,根据所述待推送的短视频内容的预估点击率,向用户推送短视频内容。
在该实施例中,待推送内容为待推送的短视频内容。服务器提取待推送的短视频内容的相关特征,如多个用户特征以及所述多个短视频内容特征。具体地,相关特征可包括目标用户的用户特征,如用户性别、用户年龄、用户职业以及用户常驻地等。相关特征还可包括短视频内容本身特征,如短视频内容的观看人数、点赞人数、视频标签等。将待推送的短视频内容的多个相关特征输入基于特征组合的点击率预估模型中,通过模型将多个用户特征以及多个短视频内容特征进行组合交叉,挖掘组合后相关特征的关联性,从而输出该待推送短视频内容的预估点击率值。最终,根据该预估点击率值向用户进行个性化推送短视频内容。
本发明还提供一种存储介质。该存储介质上存储有计算机程序;所述计算机程序被处理器执行时,实现上述任一实施例所述的内容推送方法。该存储介质可以是存储器。例如,内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储介质包括但不限于这些类型的存储器。本发明所公开的存储器只作为例子而非作为限定。
本发明还提供一种计算机设备。一种计算机设备包括:一个或多个处理器;存储器;一个或多个应用程序。其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述任一实施例所述的内容推送方法。
图6为本发明一实施例中的计算机设备的结构示意图。本实施例所述计算机设备可以是服务器、个人计算机以及网络设备。如图6所示,设备包括处理器603、存储器605、输入单元607以及显示单元609等器件。本领域技术人员可以理解,图6示出的设备结构器件并不构成对所有设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储器605可用于存储应用程序601以及各功能模块,处理器603运行存储在存储器605的应用程序601,从而执行设备的各种功能应用以及数据处理。存储器可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储器包括但不限于这些类型的存储器。本发明所公开的存储器只作为例子而非作为限定。
输入单元607用于接收信号的输入,以及接收用户输入的关键字。输入单元607可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元609可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元609可采用液晶显示器、有机发光二极管等形式。处理器603是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器605内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。
在一实施方式中,设备包括一个或多个处理器603,以及一个或多个存储器605,一个或多个应用程序601。其中所述一个或多个应用程序601被存储在存储器605中并被配置为由所述一个或多个处理器603执行,所述一个或多个应用程序601配置用于执行以上实施例所述的内容推送方法。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括存储器、磁盘或光盘等。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
应该理解的是,在本发明各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种内容推送方法,其特征在于,包括:
提取待推送内容的多个相关特征;
将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率;其中,所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合,根据组合后的所述相关特征的关联性,确定出所述待推送内容的预估点击率;
根据所述待推送内容的预估点击率,向用户推送内容。
2.根据权利要求1所述的方法,其特征在于,所述待推送内容包括待推送的短视频内容;所述提取待推送内容的多个相关特征,包括:提取所述待推送的短视频内容的多个用户特征以及多个短视频内容特征;
所述将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率,包括:将所述多个用户特征以及所述多个短视频内容特征输入所述基于特征组合的点击率预估模型,得到所述待推送的短视频内容的预估点击率;
所述根据所述待推送内容的预估点击率,向用户推送内容,包括:根据所述待推送的短视频内容的预估点击率,向用户推送短视频内容。
3.根据权利要求1所述的方法,其特征在于,所述基于特征组合的点击率预估模型包括:
输入层,用于对所述多个相关特征进行独热编码,得到独热向量;
逻辑回归组件,用于对所述输入层输出的所述独热向量进行逻辑回归运算,得到第一运算值;
嵌套模块,用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征,得到低维度连续值向量;
内积组件,用于将所述嵌套模块输出的所述低维度连续值向量进行向量内积,得到第二运算值;
拼接模块,用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量;
隐藏层模块,用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层,得到第三运算值;
预估点击率运算模块,用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率,包括:
将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率。
5.根据权利要求4所述的方法,其特征在于,所述将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率,包括:
获取所述第一运算值对应的第一权重、所述第二运算值对应的第二权重、所述第三运算值对应的第三权重;
将所述第一运算值乘以所述第一权重,得到第一值;所述第二运算值乘以所述第二权重,得到第二值;第三运算值乘以所述第三权重,得到第三值;
将所述第一值、所述第二值和所述第三值进行累加,得到所述待推送内容的预估点击率。
6.根据权利要求3所述的方法,其特征在于,所述将所述嵌套模块输出的所述低维度连续值向量进行向量内积,得到第二运算值,包括:
获取每个低维度连续值向量对应的权重;
将所述每个低维度连续值乘以对应的权重后进行向量内积,得到所述第二运算值。
7.根据权利要求3所述的方法,其特征在于,所述将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量,包括:
将所述低维度连续值向量对应的权重;
将所述每个低维度连续值向量乘以对应的权重后,进行向量累加,得到所述拼接向量。
8.根据权利要求1所述的方法,其特征在于,所述基于特征组合的点击率预估模型包括:
输入层,用于对所述多个相关特征进行独热编码,得到独热向量;
逻辑回归组件,用于对所述输入层输出的所述独热向量进行逻辑回归运算,得到第一运算值;
嵌套模块,用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征,得到低维度连续值向量;
向量相乘组件,用于通过并行计算方式,采用矩阵乘法对所述二嵌套模块输出的低维度连续值进行向量相乘,得到结果值向量;获取所述结果值向量上三角的值,将所述上三角的值进行累加,将累加结果值作为第二运算值;
拼接模块,用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量;
隐藏层模块,用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层,得到第三运算值;
预估点击率运算模块,用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。
9.一种存储介质,其特征在于,其上存储有计算机程序;所述计算机程序适于由处理器加载并执行上述权利要求1至8中任一项所述的内容推送方法。
10.一种计算机设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据权利要求1至8任一项所述的内容推送方法。
CN201811497834.2A 2018-12-07 2018-12-07 内容推送方法及存储介质、计算机设备 Active CN109359247B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811497834.2A CN109359247B (zh) 2018-12-07 2018-12-07 内容推送方法及存储介质、计算机设备
PCT/CN2019/113566 WO2020114145A1 (zh) 2018-12-07 2019-10-28 内容推送方法及存储介质、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811497834.2A CN109359247B (zh) 2018-12-07 2018-12-07 内容推送方法及存储介质、计算机设备

Publications (2)

Publication Number Publication Date
CN109359247A true CN109359247A (zh) 2019-02-19
CN109359247B CN109359247B (zh) 2021-07-06

Family

ID=65331724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811497834.2A Active CN109359247B (zh) 2018-12-07 2018-12-07 内容推送方法及存储介质、计算机设备

Country Status (2)

Country Link
CN (1) CN109359247B (zh)
WO (1) WO2020114145A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919670A (zh) * 2019-02-27 2019-06-21 重庆金窝窝网络科技有限公司 广告点击概率的预测方法、装置、服务器和存储介质
CN109948062A (zh) * 2019-03-29 2019-06-28 广州市百果园网络科技有限公司 一种目标匹配方法、装置、服务器、系统及存储介质
CN110442810A (zh) * 2019-08-08 2019-11-12 广州华建工智慧科技有限公司 一种基于DeepFM推荐算法的移动端BIM模型智能缓存方法
CN110502715A (zh) * 2019-08-28 2019-11-26 腾讯科技(深圳)有限公司 点击概率的预测方法及装置
WO2020114145A1 (zh) * 2018-12-07 2020-06-11 广州市百果园信息技术有限公司 内容推送方法及存储介质、计算机设备
CN111339433A (zh) * 2020-05-21 2020-06-26 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
WO2020168841A1 (zh) * 2019-02-21 2020-08-27 北京京东尚科信息技术有限公司 网络资源推送方法、装置及存储介质
CN111611488A (zh) * 2020-05-21 2020-09-01 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
CN111967599A (zh) * 2020-08-25 2020-11-20 百度在线网络技术(北京)有限公司 用于训练模型的方法、装置、电子设备及可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751376A (zh) * 2009-12-30 2010-06-23 中国人民解放军国防科学技术大学 利用cpu和gpu协同工作对三角线性方程组求解的加速方法
US20140196043A1 (en) * 2013-01-09 2014-07-10 Nvidia Corporation System and method for re-factorizing a square matrix into lower and upper triangular matrices on a parallel processor
CN105046515A (zh) * 2015-06-26 2015-11-11 深圳市腾讯计算机系统有限公司 广告排序方法及装置
CN105095625A (zh) * 2014-05-14 2015-11-25 阿里巴巴集团控股有限公司 点击率预估模型建立方法、装置及信息提供方法、系统
CN105701068A (zh) * 2016-02-19 2016-06-22 南京大学 基于分时复用技术的cholesky矩阵求逆系统
CN106339510A (zh) * 2016-10-28 2017-01-18 北京百度网讯科技有限公司 基于人工智能的点击预估方法及装置
CN107145518A (zh) * 2017-04-10 2017-09-08 同济大学 一种社交网络下基于深度学习的个性化推荐系统
CN107613022A (zh) * 2017-10-20 2018-01-19 广州优视网络科技有限公司 内容推送方法、装置及计算机设备
CN108053050A (zh) * 2017-11-14 2018-05-18 广州优视网络科技有限公司 点击率预估方法、装置、计算设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470027A (zh) * 2018-03-30 2018-08-31 广州优视网络科技有限公司 色情应用识别方法和装置、计算设备和存储介质
CN109359247B (zh) * 2018-12-07 2021-07-06 广州市百果园信息技术有限公司 内容推送方法及存储介质、计算机设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751376A (zh) * 2009-12-30 2010-06-23 中国人民解放军国防科学技术大学 利用cpu和gpu协同工作对三角线性方程组求解的加速方法
US20140196043A1 (en) * 2013-01-09 2014-07-10 Nvidia Corporation System and method for re-factorizing a square matrix into lower and upper triangular matrices on a parallel processor
CN105095625A (zh) * 2014-05-14 2015-11-25 阿里巴巴集团控股有限公司 点击率预估模型建立方法、装置及信息提供方法、系统
CN105046515A (zh) * 2015-06-26 2015-11-11 深圳市腾讯计算机系统有限公司 广告排序方法及装置
CN105701068A (zh) * 2016-02-19 2016-06-22 南京大学 基于分时复用技术的cholesky矩阵求逆系统
CN106339510A (zh) * 2016-10-28 2017-01-18 北京百度网讯科技有限公司 基于人工智能的点击预估方法及装置
CN107145518A (zh) * 2017-04-10 2017-09-08 同济大学 一种社交网络下基于深度学习的个性化推荐系统
CN107613022A (zh) * 2017-10-20 2018-01-19 广州优视网络科技有限公司 内容推送方法、装置及计算机设备
CN108053050A (zh) * 2017-11-14 2018-05-18 广州优视网络科技有限公司 点击率预估方法、装置、计算设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HUIFENG GUO 等: "DeepFM:AFactorization-Machine based Neural Network for CTR Prediction", 《HTTPS://ARXIV.ORG》 *
WEINAN ZHANG: "Deep Learning over Multi-field Categorical Data– A Case Study on User Response Prediction", 《HTTPS://ARXIV.ORG》 *
YANRU QU 等: "Product-based Neural Networks for User Response Prediction", 《2016 IEEE 16TH INTERNATIONAL CONFERENCE ON DATA MINING》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020114145A1 (zh) * 2018-12-07 2020-06-11 广州市百果园信息技术有限公司 内容推送方法及存储介质、计算机设备
WO2020168841A1 (zh) * 2019-02-21 2020-08-27 北京京东尚科信息技术有限公司 网络资源推送方法、装置及存储介质
US11483253B2 (en) 2019-02-21 2022-10-25 Beijing Jingdong Shangke Information Technology Co., Ltd. Network resource pushing method, device, and storage medium
CN109919670A (zh) * 2019-02-27 2019-06-21 重庆金窝窝网络科技有限公司 广告点击概率的预测方法、装置、服务器和存储介质
CN109948062A (zh) * 2019-03-29 2019-06-28 广州市百果园网络科技有限公司 一种目标匹配方法、装置、服务器、系统及存储介质
CN110442810A (zh) * 2019-08-08 2019-11-12 广州华建工智慧科技有限公司 一种基于DeepFM推荐算法的移动端BIM模型智能缓存方法
CN110502715A (zh) * 2019-08-28 2019-11-26 腾讯科技(深圳)有限公司 点击概率的预测方法及装置
CN110502715B (zh) * 2019-08-28 2023-07-14 腾讯科技(深圳)有限公司 点击概率的预测方法及装置
CN111611488A (zh) * 2020-05-21 2020-09-01 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
CN111611488B (zh) * 2020-05-21 2022-09-30 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
CN111339433A (zh) * 2020-05-21 2020-06-26 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
CN111967599A (zh) * 2020-08-25 2020-11-20 百度在线网络技术(北京)有限公司 用于训练模型的方法、装置、电子设备及可读存储介质
CN111967599B (zh) * 2020-08-25 2023-07-28 百度在线网络技术(北京)有限公司 用于训练模型的方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN109359247B (zh) 2021-07-06
WO2020114145A1 (zh) 2020-06-11

Similar Documents

Publication Publication Date Title
CN109359247A (zh) 内容推送方法及存储介质、计算机设备
US20220156302A1 (en) Implementing a graphical user interface to collect information from a user to identify a desired document based on dissimilarity and/or collective closeness to other identified documents
US10102277B2 (en) Bayesian visual interactive search
US20190392330A1 (en) System and method for generating aspect-enhanced explainable description-based recommendations
AU2016225947B2 (en) System and method for multimedia document summarization
EP3143523B1 (en) Visual interactive search
US9846836B2 (en) Modeling interestingness with deep neural networks
US20170039198A1 (en) Visual interactive search, scalable bandit-based visual interactive search and ranking for visual interactive search
KR20180091043A (ko) 사용자 포트레이트를 획득하는 방법 및 장치
US10606883B2 (en) Selection of initial document collection for visual interactive search
US20130241952A1 (en) Systems and methods for delivery techniques of contextualized services on mobile devices
US20120290974A1 (en) Systems and methods for providing a discover prompt to augmented content of a web page
US20160125028A1 (en) Systems and methods for query rewriting
US20160092771A1 (en) Analysis of social media messages
CN105512180B (zh) 一种搜索推荐方法及装置
US11074595B2 (en) Predicting brand personality using textual content
US11334750B2 (en) Using attributes for predicting imagery performance
CN110674620A (zh) 目标文案生成方法、装置、介质及电子设备
US11874893B2 (en) Modularizing and embedding supplemental textual and visual content in different environments
CN112650942A (zh) 产品推荐方法、装置、计算机系统和计算机可读存储介质
US20230384910A1 (en) Using Attributes for Font Recommendations
JP2022514156A (ja) 確率的アイテムマッチングおよび検索
CN114862480A (zh) 广告投放定向方法及其装置、设备、介质、产品
CN115618126A (zh) 搜索处理方法、系统、计算机可读存储介质及计算机设备
CN115221954A (zh) 用户画像方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220524

Address after: 31a, 15th floor, building 30, maple commercial city, bangrang Road, Brazil

Patentee after: Baiguoyuan Technology (Singapore) Co.,Ltd.

Address before: Building B-1, North District, Wanda Commercial Plaza, Wanbo business district, No. 79, Wanbo 2nd Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU BAIGUOYUAN INFORMATION TECHNOLOGY Co.,Ltd.