CN109819002A - 数据推送方法和装置、存储介质及电子装置 - Google Patents

数据推送方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN109819002A
CN109819002A CN201711174243.7A CN201711174243A CN109819002A CN 109819002 A CN109819002 A CN 109819002A CN 201711174243 A CN201711174243 A CN 201711174243A CN 109819002 A CN109819002 A CN 109819002A
Authority
CN
China
Prior art keywords
account
data
vector
weight
push
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711174243.7A
Other languages
English (en)
Other versions
CN109819002B (zh
Inventor
曾涛
范欣
许健
张伟
赵铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yayue Technology Co ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201711174243.7A priority Critical patent/CN109819002B/zh
Publication of CN109819002A publication Critical patent/CN109819002A/zh
Application granted granted Critical
Publication of CN109819002B publication Critical patent/CN109819002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据推送方法和装置、存储介质及电子装置。其中,该方法包括:获取使用第一账号的客户端发送的推送请求;响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据。本发明解决了现有数据推送方法存在的所推送数据的准确率较小的技术问题。

Description

数据推送方法和装置、存储介质及电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种数据推送方法和装置、存储介质及电子装置。
背景技术
为了方便用户浏览,在很多终端应用中提供了智能化数据推送方法,例如,常用的数据推送方法是采用协同过滤推送策略。具体的,从用户的离线操作日志中挖掘出该用户的行为数据,其中,目前主要使用的是行为数据中所包含的用户使用的账号和待推送数据的数据标识(如评论过的文章的标识,转发过的视频的标识等等),来分析该用户的浏览习惯。从而实现根据上述行为数据分析出该用户的浏览习惯,以便于为用户推送与浏览习惯匹配的数据。
然而,在采用上述方法确定所要推送的数据时,由于所使用的行为数据的特征较稀疏,使得分析得出的用户浏览习惯不够精准,从而导致为该用户所推送的数据的准确率也较小的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供一种数据推送方法和装置、存储介质及电子装置,以至少解决现有数据推送方法存在的所推送数据的准确率较小的技术问题。
根据本发明实施例的一个方面,提供了一种数据推送方法,包括:获取使用第一账号的客户端发送的推送请求;响应上述推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与上述第一账号匹配的账号特征向量,其中,上述对象特征向量根据上述候选对象数据中所包含的关键词的第一权重确定,上述账号特征向量根据被上述第一账号操作过的对象数据中所包含的关键词的第二权重确定;根据上述对象特征向量以及上述账号特征向量,从上述候选对象数据集合中确定出向上述客户端推送的目标对象数据。
根据本发明实施例的另一方面,还提供了一种数据推送装置,包括:第一获取单元,用于获取使用第一账号的客户端发送的推送请求;第二获取单元,用于响应上述推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与上述第一账号匹配的账号特征向量,其中,上述对象特征向量根据上述候选对象数据中所包含的关键词的第一权重确定,上述账号特征向量根据被上述第一账号操作过的对象数据中所包含的关键词的第二权重确定;第一确定单元,用于根据上述对象特征向量以及上述账号特征向量,从上述候选对象数据集合中确定出向上述客户端推送的目标对象数据。
可选地,上述第二获取单元包括:第二获取模块,用于依次获取上述候选对象数据集合中所包含的每一个上述候选对象数据中各个关键词的上述第一权重;第二处理模块,用于将上述候选对象数据中全部关键词的上述第一权重拼接,得到与上述候选对象数据匹配的数据权重向量;第三处理模块,用于将上述数据权重向量输入推送模型,输出得到上述候选对象数据的上述对象特征向量,其中,上述推送模型为利用多个有序样本对象通过机器训练得到。
可选地,上述第二获取模块包括:第三获取子模块通过以下步骤获取上述候选对象数据集合第i个上述候选对象数据中的第j个关键词的上述第一权重:将上述第j个关键词在上述候选对象数据集合中的出现频率及逆向文件频率二者之间的第二乘积,作为上述第一权重。
可选地,上述数据推送装置还包括:第三获取单元,用于在上述获取使用第一账号的客户端发送的推送请求之前,获取上述第一账号的操作记录及上下文信息;第二确定单元,用于根据上述操作记录及上述上下文信息确定上述候选对象数据集合。
根据本发明实施例的另一方面,还提供了一种存储介质,上述存储介质包括存储的程序,其中,上述程序运行时执行上述数据推送方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在上述存储器上并可在上述处理器上运行的计算机程序,其上述处理器通过上述计算机程序执行上述数据推送方法。
在本发明实施例中,在获取使用第一账号的客户端发送的推送请求之后,响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;根据上述对象特征向量以及上述账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据。也就是说,获取候选对象数据中所包含的关键词的第一权重,以确定与候选对象数据匹配的对象特征向量,并获取被第一账号操作过的对象数据中所包含的关键词的第二权重,以确定与第一账号匹配的账号特征向量。从而实现利用上述覆盖较多特征的账号特征向量和对象特征向量,来获取待推送的目标对象数据,以克服相关技术中仅利用账号和数据标识等较为稀疏的特征,导致所确定出的待推送的目标对象数据不够精准的问题,实现了提高了数据推送的准确性的技术效果,进而解决了现有数据推送方法存在的所推送数据的准确率较小的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的数据推送方法的应用场景示意图;
图2是根据本发明实施例的一种可选的数据推送方法的流程示意图;
图3是根据本发明实施例的另一种可选的数据推送方法的流程示意图;
图4是根据本发明实施例的又一种可选的数据推送方法的流程示意图;
图5是根据本发明实施例的又一种可选的数据推送方法的流程示意图;
图6是根据本发明实施例的一种可选的数据推送装置的结构示意图;
图7是根据本发明实施例的一种可选的电子装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本发明实施例中,提供了一种上述数据推送方法的实施例。作为一种可选的实施方式,该数据推送方法可以但不限于应用于如图1所示的应用环境中,用于执行步骤S102-S108,终端12安装有客户端,且终端12通过网络14与终端12上客户端对应的服务器16连接,终端12获取使用第一账号的客户端中的推送请求,终端12将该推送请求发送至服务器16;服务器16响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;然后服务器16根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出目标对象数据,向客户端12推送该目标对象数据。
可选地,在上述实施例中,可以是云服务器侧进行目标对象数据的确定,也可以是位于终端侧,也就是在客户端进行目标对象数据的确定,在确定目标对象数据后,向服务器发送目标对象数据获取请求以进行目标对象数据的获取,以上仅是一种示例,在此不做任何限定。
可选地,在本实施例中,上述终端可以包括但不限于以下至少之一:手机、平板电脑、笔记本电脑、台式PC机、数字电视及用于运行推送显示应用的硬件设备。上述网络可以包括但不限于以下至少之一:广域网、城域网、局域网。上述只是一种示例,本实施例对此不做任何限定。
需要说明的是,在本实施例中,获取使用第一账号的客户端发送的推送请求;响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据。
根据本发明实施例,提供了一种数据推送方法,如图2所示,该方法包括:
S202,获取使用第一账号的客户端发送的推送请求;
S204,响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;
S206,根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据。
需要说明的是,在本实施例中,各个候选对象是指数据库中的各类数据,例如接入新闻曝光数据、账号的行为数据(账号的历史浏览记录、评论、转发、点赞等操作记录等)、文章关键词tag数据(例如文章的标题、主题等)、相似文章数据等。基于上述示例进行说明,对象特征向量则是根据上述示例中的文章关键词tag数据的权重来确定的,而账号特征向量则是根据文章关键词tag数据的对象特征向量以及账号的行为数据的权重来确定的,以上仅是一种示例。而在具体的应用场景中,可以包含其他的对象数据的权重,例如时间数据的权重、新闻热度权重等等,具体可以根据实际经验进行设置。还需要说明的是,在目标对象数据的确定过程中,也可以不仅仅基于对象特征向量以及账号特征向量这两种向量,同样也可以根据实际经验进行设置,利用其它特征向量来共同来确定目标对象数据。
在本实施例中,上述数据显示方法可以但不限于应用于数据推送过程中,其中,上述数据推送方法可以包括但不限于应用于新闻应用、社交应用以及其他具备浏览功能的应用中,以实现根据账号的操作浏览记录来显示该账号感兴趣的目标对象。上述对象数据的数据类型可以包括但不限于:文字、图片、动画或视频以上的结合。例如,在文章列表中推送包含文字及图片(或动画)的文章,在视频列表中推送视频等等。上述账号的数据推送请求指令包括但不限于对浏览界面的刷新操作,使用第一账号再次登录、第一账号对相应的内容进行的评论及其他互动操作等等。例如,假设上述数据推送方法以数据为新闻内容为例进行说明,第一账号在客户端中登录后,在服务器获取到客户端发送的数据推送请求后,根据新闻关键词tag数据以及文章相似数据确定文章关键词tag数据的第一权重,基于预先通过机器训练好的推送模型与第一权重获取文章关键词的对象特征向量,然后根据第一权重以及账号的行为数据确定该账号偏好的关键词对应的账号特征向量,以上仅是一种示例,本实施例对此不做任何限定。
需要说明的是,在本实施例中,获取使用第一账号的客户端发送的推送请求;响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据。也就是说,获取候选对象数据中所包含的关键词的第一权重,以确定与候选对象数据匹配的对象特征向量,并获取被第一账号操作过的对象数据中所包含的关键词的第二权重,以确定与第一账号匹配的账号特征向量。从而实现利用上述覆盖较多特征的账号特征向量和对象特征向量,来获取待推送的目标对象数据,以克服相关技术中仅利用账号和数据标识等较为稀疏的特征,导致所确定出的待推送的目标对象数据不够精准的问题,实现了提高了数据推送的准确性的技术效果。进一步,利用过上述账号特征向量和对象特征向量还将覆盖操作频率较小的冷门对象数据,达到扩大推送范围的目的。此外,向量化处理还将减轻线上推送的资源消耗,提高确定所要推送的目标对象数据的效率。
可选地,在本实施例中,获取与第一账号匹配的账号特征向量包括但不限于:根据第二权重确定第一账号的初始账号权重向量;获取上一次为第一账号推送目标对象数据时所使用的历史账号权重向量;根据初始账号权重向量与历史账号权重向量确定第一账号当前的账号权重向量;将账号权重向量输入推送模型,输出得到账号特征向量,其中,推送模型为利用多个有序样本对象通过机器训练得到。
需要说明的是,上述推送模型可以但不限于为神经网络模型,例如,深度神经网络模型(Deep Neural Network,简称DNN),通过Tenorflow平台对上述DNN模型进行在线训练,以便于准确获取上述账号特征向量。
在具体的应用场景中,以在新闻客户端中推送新闻数据为例进行说明,如图3所示,在进行数据推送的过程中,可以获取账号当前登录客户端所使用的第一账号操作过(该操作可以包括但不限于浏览、评论、转发、点赞等操作)的新闻数据中所包含的关键词(也可称为tag),根据被操作过的新闻数据中关键词对应的第二权重获取第一账号的初始账号权重向量;然后获取上一次为第一账号推送的新闻数据时所使用的历史账号权重向量,然后根据初始账号权重向量以及历史账号权重向量确定第一账号当前的账号权重向量,然后将当前账号权重输入到预先通过机器训练得到的推送模型中,获取修正后的账号特征向量。
可选地,在本实施例中,根据第二权重确定第一账号的初始账号权重向量包括但不限于:将被第一账号操作过的对象数据中的全部关键词的第二权重拼接,得到初始账号权重向量。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,将第一账号登录客户端后执行操作后的新闻数据中的全部关键词的第二权重进行拼接,得到第一账号的初始账号权重向量。
可选地,在本实施例中,响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量包括但不限于:依次获取候选对象数据集合中所包含的每一个候选对象数据中各个关键词的第一权重;将候选对象数据中全部关键词的第一权重拼接,得到与候选对象数据匹配的数据权重向量;将数据权重向量输入推送模型,输出得到候选对象数据的对象特征向量,其中,推送模型为利用多个有序样本对象通过机器训练得到。
需要说明的是,上述推送模型可以但不限于为神经网络模型,例如,深度神经网络模型(Deep Neural Network,简称DNN),通过Tenorflow平台对上述DNN模型进行在线训练,以便于准确获取上述对象特征向量。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,依次获取候选对象数据集合中所包含的每一个候选新闻数据中各个关键词的第一权重,将候选新闻数据中全部关键词的第一权重拼接,得到与候选对象数据匹配的数据权重向量,例如,假设在候选对象数据集合中包含了10000篇新闻,其中,每篇新闻中关键词的数量都不相同,因此导致了第一权重的数量也不同。假设在第一篇新闻中具有5个关键词,则存在5个第一权重,得到该新闻数据的数据权重向量。将数据权重向量输入推送模型,输出得到候选新闻数据的对象特征向量。
需要说明的是,在本实施例中,上述候选对象数据中各个关键词的第一权重可以但不限于通过以下步骤获取:将第j个关键词在候选对象数据集合中的出现频率及二者之间的第二乘积,作为第一权重。其中,上述逆向文件频率(Inverse Document Frequency,简称idf)可以但不限于表示这个关键词在候选对象数据所属类目下的逆向文件频率。
可选地,在本实施例中,根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据包括但不限于:获取账号特征向量与对象特征向量之间的向量点积;对向量点积进行数值转换得到第一账号的推送指数;根据推送指数的排序结果确定目标对象数据。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,获取登录新闻客户端所使用的第一账号的账号特征向量与对象特征向量之间的向量点积,对该向量点积进行数值转换得到第一账号的,已获取第一账号对新闻的推送指数,该推送指数相当于该第一账号的偏好进行量化后的偏好分数,然后根据推送指数对候选对象数据中的新闻数据进行排序,来确定目标对象数据。例如上述数值转换的函数可以但不限于Sigmoid。需要说明的是,在本实施例中,可以但不限于选取排序后前N个对象数据作为要推送至客户端的目标对象数据,N的具体取值可以根据实际经验进行设置,在此不做任何限定。
可选地,在本实施例中,在获取使用第一账号的客户端发送的推送请求之前,还包括但不限于:获取第一账号的操作记录及上下文信息;根据操作记录及上下文信息确定候选对象数据集合。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,在获取到第一账号登录新闻客户端且需执行数据推送时,在该新闻客户端还未发出推送请求之前,可以先获取第一账号的操作记录以及上下文信息,其中操作记录包括阅读、评论、点赞、分享等操作,上下文信息包括上一次推送至该第一账号登录后已显示的新闻数据的上下文信息,根据操作记录以及上下文信息确定候选对象数据集合。
通过本申请提供的实施例,获取候选对象数据中所包含的关键词的第一权重,以确定与候选对象数据匹配的对象特征向量,并获取被第一账号操作过的对象数据中所包含的关键词的第二权重,以确定与第一账号匹配的账号特征向量。从而实现利用上述覆盖较多特征的账号特征向量和对象特征向量,来获取待推送的目标对象数据,以克服相关技术中仅利用账号和数据标识等较为稀疏的特征,导致所确定出的待推送的目标对象数据不够精准的问题,实现了提高了数据推送的准确性的技术效果。
作为一种可选的技术方案,获取与第一账号匹配的账号特征向量包括:
S1,根据第二权重确定第一账号的初始账号权重向量;
S2,获取上一次为第一账号推送目标对象数据时所使用的历史账号权重向量;
S3,根据初始账号权重向量与历史账号权重向量确定第一账号当前的账号权重向量;
S4,将账号权重向量输入推送模型,输出得到账号特征向量,其中,推送模型为利用多个有序样本对象通过机器训练得到。
在具体的应用场景中,以在新闻客户端中推送新闻数据为例进行说明,在进行数据推送的过程中,获取被第一账号操作过(该操作可以包括但不限于浏览、评论、转发、点赞等操作)的新闻数据中所包含的关键词,根据新闻数据关键词对应的第二权重获取第一账号的初始账号权重向量;然后获取上一次为第一账号推送的新闻数据时所使用的历史账号权重向量,然后根据初始账号权重向量以及历史账号权重向量确定第一账号当前的账号权重向量,然后将当前的账号权重向量输入到预先通过机器训练得到的推送模型中,以得到与该第一账号匹配的账号特征向量。
通过本实施例,根据第二权重确定第一账号的初始账号权重向量,获取上一次为第一账号推送目标对象数据时所使用的历史账号权重向量,根据初始账号权重向量与历史账号权重向量确定当前的账号权重向量,在输入到推送模型后输出得到账号特征向量,以实现结合用于标识账号喜好(或浏览喜好)的账号权重向量,来训练得到账号特征向量。从而实现利用账号特征向量所指示的多维特征来确定所要推送的目标对象数据,达到保证推送准确性的效果。
作为一种可选的技术方案,根据初始账号权重向量与历史账号权重向量确定第一账号的账号权重向量包括:
S1,获取与历史账号权重向量匹配的衰减系数和历史账号权重向量的第一乘积;
S2,获取第一乘积与初始账号权重向量二者的和,作为第一账号的账号权重向量。
在具体的应用场景中,通过下述公式获取第一账号的账号权重向量:
Vu=Vu-1*α+Vi (1)
其中,上述Vu为第一账号上一次推送时的历史账号权重向量,α为与该历史账号权重向量匹配的衰减系数,Vi为初始账号权重向量。其中,衰减系数可以但不限于与第一账号的推送次数相关。
通过本申请提供的实施例,根据初始账号权重向量与历史账号权重向量确定第一账号的账号权重向量,利用账号权重向量中所包含的用于指示账号浏览习惯的特征,来准确得到为第一账号所推送的目标对象数据;此外,向量化处理还将减轻线上推送的资源消耗,提高确定所要推送的目标对象数据的效率。
作为一种可选的技术方案,根据第二权重确定第一账号的初始账号权重向量包括:
S1,将被第一账号操作过的对象数据中的全部关键词的第二权重拼接,得到与初始账号权重向量。
需要说明的是,在本实施例中,上述初始账号权重向量中可以但不限于为被第一账号操作过的对象数据中的关键词的第二权重拼接得到。也就是说,在向量长度一定的情况下,根据关键词的权重确定初始账号权重向量中的非零值。例如,在输入推送模型的字长为M维的情况下,账号权重向量也对应为M维向量,用于得到账号权重向量的初始账号权重向量和历史账号权重向量也对应为M维向量。
其中,以初始账号权重向量为例,若被第一账号操作过的第j个对象数据中包含h个关键词,则第j个对象数据的M维初始账号权重向量中的非零值为h个。换言之,关键词数量不足M的可以用零填充。也就是说,账号权重向量中可以包含零,为了使权重分布更均匀,将上述账号权重向量输入到推送模型,以得到账号特征向量。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,将第一账号历史操作的新闻数据中的全部关键词的第二权重进行拼接,获取第一账号的初始账号权重向量。
通过本申请提供的实施例,将被第一账号操作过的对象数据中的全部关键词的第二权重拼接,得到与初始账号权重向量,以提高了推送数据的准确性。
作为一种可选的技术方案,响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量包括:
S1,依次获取候选对象数据集合中所包含的每一个候选对象数据中各个关键词的第一权重;
S2,将候选对象数据中全部关键词的第一权重拼接,得到与候选对象数据匹配的数据权重向量;
S3,将数据权重向量输入推送模型,输出得到候选对象数据的对象特征向量,其中,推送模型为利用多个有序样本对象通过机器训练得到。
例如,以第i个候选对象数据为例,若第i个候选对象数据中包含p个关键词,则第i个候选对象数据的W维向量中的非零值为p个。换言之,关键词数量不足W的可以用零填充。也就是说,数据权重向量中可以包含零,为了使权重分布更均匀,将上述数据权重向量输入到推送模型,以得到对象特征向量。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,依次获取候选对象数据集合中所包含的每一个候选新闻数据中各个关键词的第一权重,将候选新闻数据中全部关键词的第一权重拼接,得到与候选对象数据匹配的数据权重向量,例如,假设在候选对象数据集合中包含了10000篇新闻,其中,每篇新闻中关键词的数量都不相同,因此导致了第一权重的数量也不同。假设在第一篇新闻中具有5个关键词,则存在5个第一权重,得到该新闻数据的数据权重向量。将数据权重向量输入推送模型,输出得到候选新闻数据的对象特征向量。
通过本申请提供的实施例,获取候选对象数据集合中各个候选对象数据的对象特征向量,其中,对象特征向量将覆盖操作频率较小的冷门对象数据,不仅可以克服相关技术中仅利用账号和数据标识等较为稀疏的特征,导致所确定出的待推送的目标对象数据不够精准的问题,实现了提高了数据推送的准确性的技术效果,而且还将达到扩大推送范围的目的。
作为一种可选的技术方案,依次获取候选对象数据集合中所包含的每一个候选对象数据中各个关键词的第一权重包括但不限于:候选对象数据集合第i个候选对象数据中的第j个关键词的第一权重通过以下步骤获取:
S1,将第j个关键词在候选对象数据集合中的出现频率及逆向文件频率二者之间的第二乘积,作为第一权重。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,通过下述公式来获取候选对象数据集合中第i个候选对象数据中的第j个关键词的出现的频率:
其中,在上述公式(2)中,tfi,j表示第j个关键词在第i个候选新闻数据的新闻中出现的频率。count(i)为第i个候选新闻数据中的关键词总数,count(i,j)为第j个关键词在第i个候选新闻数据中的数量。
通过下述公式来获取候选对象数据集合中第i个候选对象数据中的第j个关键词该新闻所属类目下逆向文件频率:
其中,在上述公式(3)中,idfj为第j个关键词在该新闻所属类目下逆向文件频率,|D|表示该新闻所属类目下所有新闻的篇数,count(j)第j个关键词在该新闻所属类目下所有对象数据的个数。
通过下述公式以获取候选对象数据集合第i个候选对象数据中的第j个关键词的第一权重:
tfidfi,j=tfi,j*idfj (4)
其中,在上述公式(4)中,tfidfi,j为候选对象数据集合第i个候选对象数据中的第j个关键词的第一权重。
通过本申请提供的实施例,将第j个关键词在候选对象数据集合中的出现频率及逆向文件频率二者之间的第二乘积,作为第一权重,从而利用各个关键词的第一权重来进行拼接,以得到包含上述各个关键词的候选对象数据的数据权重向量,进而获取该候选对象数据的对象特征向量。也就是说,利用关键词在候选对象数据集合中的出现频率及逆向文件频率,将保证所获取的数据权重向量的准确性,进一步保证所推送的数据的准确性。
作为一种可选的技术方案,根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据包括:
S1,获取账号特征向量与对象特征向量之间的向量点积;
S2,对向量点积进行数值转换得到第一账号的推送指数;
S3,根据推送指数的排序结果确定目标对象数据。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,如图4所示,获取第一账号的账号特征向量与对象特征向量之间的向量点积,对该向量点积进行数值转换Sigmoid得到第一账号的,已获取第一账号对新闻的推送指数,该推送指数相当于该账号的偏好进行量化后的偏好分数,然后根据推送指数对候选对象数据中的新闻数据进行排序,来确定目标对象数据。例如上述数值转换的函数可以但不限于Sigmoid。需要说明的是,在本实施例中,可以但不限于选取排序后前N个对象数据作为要推送至客户端的目标对象数据,N的具体取值可以根据实际经验进行设置,在此不做任何限定。
通过本申请提供的实施例,通过获取对象特征向量与账号特征向量的向量点积,对向量点积进行数值转换得到第一账号的推送指数,根据推送指数的排序结果确定目标对象数据,通过提高了推送数据的准确性。
作为一种可选的技术方案,在获取使用第一账号的客户端发送的推送请求之前,还包括:
S1,获取第一账号的操作记录及上下文信息;
S2,根据操作记录及上下文信息确定候选对象数据集合。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,如图5所示步骤S502-S514,在获取到第一账号登录新闻客户端,或执行推送数据时,在该新闻客户端还未发出推送请求时,获取第一账号的操作记录以及上下文信息,其中操作记录包括阅读、评论、点赞、分享等操作,上下文信息包括上一次推送至该第一账号的新闻数据的上下文信息,根据操作记录以及上下文信息确定候选对象数据集合。
通过本实施例,获取第一账号的操作记录及上下文信息,根据操作记录及上下文信息确定候选对象数据集合,以保证用于获取待推送的目标对象数据的候选对象数据集合的准确性,进一步保证提高了数据推送的准确性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例,还提供了一种用于实施上述数据推送方法的数据推送装置,如图6所示,包括:
1)第一获取单元602,用于获取使用第一账号的客户端发送的推送请求;
2)第二获取单元604,用于响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;
3)第一确定单元606,用于根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据。
需要说明的是,在本实施例中,各个候选对象是指数据库中的各类数据,例如接入新闻曝光数据、账号的行为数据(账号的历史浏览记录、评论、转发、点赞等操作记录等)、文章关键词tag数据(例如文章的标题、主题等)、相似文章数据等。基于上述示例进行说明,对象特征向量则是根据上述示例中的文章关键词tag数据的权重来确定的,而账号特征向量则是根据文章关键词tag数据的对象特征向量以及账号的行为数据的权重来确定的,以上仅是一种示例。而在具体的应用场景中,可以包含其他的对象数据的权重,例如时间数据的权重、新闻热度权重等等,具体可以根据实际经验进行设置。还需要说明的是,在目标对象数据的确定过程中,也可以不仅仅基于对象特征向量以及账号特征向量这两种向量,同样也可以根据实际经验进行设置,利用其它特征向量来共同来确定目标对象数据。
在本实施例中,上述数据显示方法可以但不限于应用于数据推送过程中,其中,上述数据推送方法可以包括但不限于应用于新闻应用、社交应用以及其他具备浏览功能的应用中,以实现根据账号的操作浏览记录来显示该账号感兴趣的目标对象。上述对象数据的数据类型可以包括但不限于:文字、图片、动画或视频以上的结合。例如,在文章列表中推送包含文字及图片(或动画)的文章,在视频列表中推送视频等等。上述账号的数据推送请求指令包括但不限于对浏览界面的刷新操作,使用第一账号再次登录、第一账号对相应的内容进行的评论及其他互动操作等等。例如,假设上述数据推送方法以数据为新闻内容为例进行说明,第一账号在客户端中登录后,在服务器获取到客户端发送的数据推送请求后,根据新闻关键词tag数据以及文章相似数据确定文章关键词tag数据的第一权重,基于预先通过机器训练好的推送模型与第一权重获取文章关键词的对象特征向量,然后根据第一权重以及账号的行为数据确定该账号偏好的关键词对应的账号特征向量,以上仅是一种示例,本实施例对此不做任何限定。
需要说明的是,在本实施例中,获取使用第一账号的客户端发送的推送请求;响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据。也就是说,获取候选对象数据中所包含的关键词的第一权重,以确定与候选对象数据匹配的对象特征向量,并获取被第一账号操作过的对象数据中所包含的关键词的第二权重,以确定与第一账号匹配的账号特征向量。从而实现利用上述覆盖较多特征的账号特征向量和对象特征向量,来获取待推送的目标对象数据,以克服相关技术中仅利用账号和数据标识等较为稀疏的特征,导致所确定出的待推送的目标对象数据不够精准的问题,实现了提高了数据推送的准确性的技术效果。进一步,利用过上述账号特征向量和对象特征向量还将覆盖操作频率较小的冷门对象数据,达到扩大推送范围的目的。此外,向量化处理还将减轻线上推送的资源消耗,提高确定所要推送的目标对象数据的效率。
可选地,在本实施例中,获取与第一账号匹配的账号特征向量包括但不限于:根据第二权重确定第一账号的初始账号权重向量;获取上一次为第一账号推送目标对象数据时所使用的历史账号权重向量;根据初始账号权重向量与历史账号权重向量确定第一账号当前的账号权重向量;将账号权重向量输入推送模型,输出得到账号特征向量,其中,推送模型为利用多个有序样本对象通过机器训练得到。
需要说明的是,上述推送模型可以但不限于为神经网络模型,例如,深度神经网络模型(Deep Neural Network,简称DNN),通过Tenorflow平台对上述DNN模型进行在线训练,以便于准确获取上述账号特征向量。
在具体的应用场景中,以在新闻客户端中推送新闻数据为例进行说明,在进行数据推送的过程中,可以获取账号当前登录客户端所使用的第一账号操作过(该操作可以包括但不限于浏览、评论、转发、点赞等操作)的新闻数据中所包含的关键词(也可称为tag),根据被操作过的新闻数据中关键词对应的第二权重获取第一账号的初始账号权重向量;然后获取上一次为第一账号推送的新闻数据时所使用的历史账号权重向量,然后根据初始账号权重向量以及历史账号权重向量确定第一账号当前的账号权重向量,然后将当前账号权重输入到预先通过机器训练得到的推送模型中,获取修正后的账号特征向量。
可选地,在本实施例中,根据第二权重确定第一账号的初始账号权重向量包括但不限于:将被第一账号操作过的对象数据中的全部关键词的第二权重拼接,得到初始账号权重向量。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,将第一账号登录客户端后执行操作后的新闻数据中的全部关键词的第二权重进行拼接,得到第一账号的初始账号权重向量。
可选地,在本实施例中,响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量包括但不限于:依次获取候选对象数据集合中所包含的每一个候选对象数据中各个关键词的第一权重;将候选对象数据中全部关键词的第一权重拼接,得到与候选对象数据匹配的数据权重向量;将数据权重向量输入推送模型,输出得到候选对象数据的对象特征向量,其中,推送模型为利用多个有序样本对象通过机器训练得到。
需要说明的是,上述推送模型可以但不限于为神经网络模型,例如,深度神经网络模型(Deep Neural Network,简称DNN),通过Tenorflow平台对上述DNN模型进行在线训练,以便于准确获取上述对象特征向量。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,依次获取候选对象数据集合中所包含的每一个候选新闻数据中各个关键词的第一权重,将候选新闻数据中全部关键词的第一权重拼接,得到与候选对象数据匹配的数据权重向量,例如,假设在候选对象数据集合中包含了10000篇新闻,其中,每篇新闻中关键词的数量都不相同,因此导致了第一权重的数量也不同。假设在第一篇新闻中具有5个关键词,则存在5个第一权重,得到该新闻数据的数据权重向量。将数据权重向量输入推送模型,输出得到候选新闻数据的对象特征向量。
需要说明的是,在本实施例中,上述候选对象数据中各个关键词的第一权重可以但不限于通过以下步骤获取:将第j个关键词在候选对象数据集合中的出现频率及二者之间的第二乘积,作为第一权重。其中,上述逆向文件频率(Inverse Document Frequency,简称idf)可以但不限于表示这个关键词在候选对象数据所属类目下的逆向文件频率。
可选地,在本实施例中,根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据包括但不限于:获取账号特征向量与对象特征向量之间的向量点积;对向量点积进行数值转换得到第一账号的推送指数;根据推送指数的排序结果确定目标对象数据。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,获取登录新闻客户端所使用的第一账号的账号特征向量与对象特征向量之间的向量点积,对该向量点积进行数值转换得到第一账号的,已获取第一账号对新闻的推送指数,该推送指数相当于该第一账号的偏好进行量化后的偏好分数,然后根据推送指数对候选对象数据中的新闻数据进行排序,来确定目标对象数据。例如上述数值转换的函数可以但不限于Sigmoid。需要说明的是,在本实施例中,可以但不限于选取排序后前N个对象数据作为要推送至客户端的目标对象数据,N的具体取值可以根据实际经验进行设置,在此不做任何限定。
可选地,在本实施例中,在获取使用第一账号的客户端发送的推送请求之前,还包括但不限于:获取第一账号的操作记录及上下文信息;根据操作记录及上下文信息确定候选对象数据集合。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,在获取到第一账号登录新闻客户端且需执行数据推送时,在该新闻客户端还未发出推送请求之前,可以先获取第一账号的操作记录以及上下文信息,其中操作记录包括阅读、评论、点赞、分享等操作,上下文信息包括上一次推送至该第一账号登录后已显示的新闻数据的上下文信息,根据操作记录以及上下文信息确定候选对象数据集合。
通过本申请提供的实施例,获取候选对象数据中所包含的关键词的第一权重,以确定与候选对象数据匹配的对象特征向量,并获取被第一账号操作过的对象数据中所包含的关键词的第二权重,以确定与第一账号匹配的账号特征向量。从而实现利用上述覆盖较多特征的账号特征向量和对象特征向量,来获取待推送的目标对象数据,以克服相关技术中仅利用账号和数据标识等较为稀疏的特征,导致所确定出的待推送的目标对象数据不够精准的问题,实现了提高了数据推送的准确性的技术效果。
作为一种可选的技术方案,第二获取单元604包括:
1)第一确定模块,用于根据第二权重确定第一账号的初始账号权重向量;
2)第一获取模块,用于获取上一次为第一账号推送目标对象数据时所使用的历史账号权重向量;
3)第二确定模块,用于根据初始账号权重向量与历史账号权重向量确定第一账号当前的账号权重向量;
4)第一处理模块,用于将账号权重向量输入推送模型,输出得到账号特征向量,其中,推送模型为利用多个有序样本对象通过机器训练得到。
在具体的应用场景中,以在新闻客户端中推送新闻数据为例进行说明,如图3所示,在进行数据推送的过程中,获取被第一账号操作过(该操作可以包括但不限于浏览、评论、转发、点赞等操作)的新闻数据中所包含的关键词,根据新闻数据关键词对应的第二权重获取第一账号的初始账号权重向量;然后获取上一次为第一账号推送的新闻数据时所使用的历史账号权重向量,然后根据初始账号权重向量以及历史账号权重向量确定第一账号当前的账号权重向量,然后将当前的账号权重向量输入到预先通过机器训练得到的推送模型中,以得到与该第一账号匹配的账号特征向量。
通过本实施例,根据第二权重确定第一账号的初始账号权重向量,获取上一次为第一账号推送目标对象数据时所使用的历史账号权重向量,根据初始账号权重向量与历史账号权重向量确定当前的账号权重向量,在输入到推送模型后输出得到账号特征向量,以实现结合用于标识账号喜好(或浏览喜好)的账号权重向量,来训练得到账号特征向量。从而实现利用账号特征向量所指示的多维特征来确定所要推送的目标对象数据,达到保证推送准确性的效果。
作为一种可选的技术方案,第二确定模块包括:
1)第一获取子模块,用于获取与历史账号权重向量匹配的衰减系数和历史账号权重向量的第一乘积;
2)第二获取子模块,用于获取第一乘积与初始账号权重向量二者的和,作为第一账号的账号权重向量。
在具体的应用场景中,通过下述公式获取第一账号的账号权重向量:
Vu=Vu-1*α+Vi (5)
其中,上述Vu为第一账号上一次推送时的历史账号权重向量,α为与该历史账号权重向量匹配的衰减系数,Vi为初始账号权重向量。其中,衰减系数可以但不限于与第一账号的推送次数相关。
通过本申请提供的实施例,根据初始账号权重向量与历史账号权重向量确定第一账号的账号权重向量,利用账号权重向量中所包含的用于指示账号浏览习惯的特征,来准确得到为第一账号所推送的目标对象数据;此外,向量化处理还将减轻线上推送的资源消耗,提高确定所要推送的目标对象数据的效率。
作为一种可选的技术方案,第一确定模块包括:
1)处理子模块,用于将被第一账号操作过的对象数据中的全部关键词的第二权重拼接,得到与初始账号权重向量。
需要说明的是,在本实施例中,上述初始账号权重向量中可以但不限于为被第一账号操作过的对象数据中的关键词的第二权重拼接得到。也就是说,在向量长度一定的情况下,根据关键词的权重确定初始账号权重向量中的非零值。例如,在输入推送模型的字长为M维的情况下,账号权重向量也对应为M维向量,用于得到账号权重向量的初始账号权重向量和历史账号权重向量也对应为M维向量。
其中,以初始账号权重向量为例,若被第一账号操作过的第j个对象数据中包含h个关键词,则第j个对象数据的M维初始账号权重向量中的非零值为h个。换言之,关键词数量不足M的可以用零填充。也就是说,账号权重向量中可以包含零,为了使权重分布更均匀,将上述账号权重向量输入到推送模型,以得到账号特征向量。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,将第一账号历史操作的新闻数据中的全部关键词的第二权重进行拼接,获取第一账号的初始账号权重向量。
通过本申请提供的实施例,将被第一账号操作过的对象数据中的全部关键词的第二权重拼接,得到与初始账号权重向量,以提高了推送数据的准确性。
作为一种可选的技术方案,第二获取单元602包括:
1)第二获取模块,用于依次获取候选对象数据集合中所包含的每一个候选对象数据中各个关键词的第一权重;
2)第二处理模块,用于将候选对象数据中全部关键词的第一权重拼接,得到与候选对象数据匹配的数据权重向量;
3)第三处理模块,用于将数据权重向量输入推送模型,输出得到候选对象数据的对象特征向量,其中,推送模型为利用多个有序样本对象通过机器训练得到。
例如,以第i个候选对象数据为例,若第i个候选对象数据中包含p个关键词,则第i个候选对象数据的W维向量中的非零值为p个。换言之,关键词数量不足W的可以用零填充。也就是说,数据权重向量中可以包含零,为了使权重分布更均匀,将上述数据权重向量输入到推送模型,以得到对象特征向量。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,依次获取候选对象数据集合中所包含的每一个候选新闻数据中各个关键词的第一权重,将候选新闻数据中全部关键词的第一权重拼接,得到与候选对象数据匹配的数据权重向量,例如,假设在候选对象数据集合中包含了10000篇新闻,其中,每篇新闻中关键词的数量都不相同,因此导致了第一权重的数量也不同。假设在第一篇新闻中具有5个关键词,则存在5个第一权重,得到该新闻数据的数据权重向量。将数据权重向量输入推送模型,输出得到候选新闻数据的对象特征向量。
通过本申请提供的实施例,获取候选对象数据集合中各个候选对象数据的对象特征向量,其中,对象特征向量将覆盖操作频率较小的冷门对象数据,不仅可以克服相关技术中仅利用账号和数据标识等较为稀疏的特征,导致所确定出的待推送的目标对象数据不够精准的问题,实现了提高了数据推送的准确性的技术效果,而且还将达到扩大推送范围的目的。
作为一种可选的技术方案,第二获取模块包括:
1)第三获取子模块通过以下步骤获取候选对象数据集合第i个候选对象数据中的第j个关键词的第一权重:
2)将第j个关键词在候选对象数据集合中的出现频率及逆向文件频率二者之间的第二乘积,作为第一权重。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,通过下述公式来获取候选对象数据集合中第i个候选对象数据中的第j个关键词的出现的频率:
其中,在上述公式(6)中,tfi,j表示第j个关键词在第i个候选新闻数据的新闻中出现的频率。count(i)为第i个候选新闻数据中的关键词总数,count(i,j)为第j个关键词在第i个候选新闻数据中的数量。
通过下述公式来获取候选对象数据集合中第i个候选对象数据中的第j个关键词该新闻所属类目下逆向文件频率:
其中,在上述公式(7)中,idfj为第j个关键词在该新闻所属类目下逆向文件频率,|D|表示该新闻所属类目下所有新闻的篇数,count(j)第j个关键词在该新闻所属类目下所有对象数据的个数。
通过下述公式以获取候选对象数据集合第i个候选对象数据中的第j个关键词的第一权重:
tfidfi,j=tfi,j*idfj (8)
其中,在上述公式(8)中,tfidfi,j为候选对象数据集合第i个候选对象数据中的第j个关键词的第一权重。
通过本申请提供的实施例,将第j个关键词在候选对象数据集合中的出现频率及逆向文件频率二者之间的第二乘积,作为第一权重,从而利用各个关键词的第一权重来进行拼接,以得到包含上述各个关键词的候选对象数据的数据权重向量,进而获取该候选对象数据的对象特征向量。也就是说,利用关键词在候选对象数据集合中的出现频率及逆向文件频率,将保证所获取的数据权重向量的准确性,进一步保证所推送的数据的准确性。
作为一种可选的技术方案,第一确定单元606包括:
1)第三获取模块,用于获取账号特征向量与对象特征向量之间的向量点积;
2)第四处理模块,用于对向量点积进行数值转换得到第一账号的推送指数;
3)第三确定模块,用于根据推送指数的排序结果确定目标对象数据。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,如图4所示,获取第一账号的账号特征向量与对象特征向量之间的向量点积,对该向量点积进行数值转换Sigmoid得到第一账号的,已获取第一账号对新闻的推送指数,该推送指数相当于该账号的偏好进行量化后的偏好分数,然后根据推送指数对候选对象数据中的新闻数据进行排序,来确定目标对象数据。例如上述数值转换的函数可以但不限于Sigmoid。需要说明的是,在本实施例中,可以但不限于选取排序后前N个对象数据作为要推送至客户端的目标对象数据,N的具体取值可以根据实际经验进行设置,在此不做任何限定。
通过本申请提供的实施例,通过获取对象特征向量与账号特征向量的向量点积,对向量点积进行数值转换得到第一账号的推送指数,根据推送指数的排序结果确定目标对象数据,通过提高了推送数据的准确性。
作为一种可选的技术方案,所述数据推送装置还包括:
1)第三获取单元,用于在获取使用第一账号的客户端发送的推送请求之前,获取第一账号的操作记录及上下文信息;
2)第二确定单元,用于根据操作记录及上下文信息确定候选对象数据集合。
在具体的应用场景中,仍以在新闻客户端中推送新闻数据为例进行说明,如图5所示步骤S502-S514,在获取到第一账号登录新闻客户端,或执行推送数据时,在该新闻客户端还未发出推送请求时,获取第一账号的操作记录以及上下文信息,其中操作记录包括阅读、评论、点赞、分享等操作,上下文信息包括上一次推送至该第一账号的新闻数据的上下文信息,根据操作记录以及上下文信息确定候选对象数据集合。
通过本实施例,获取第一账号的操作记录及上下文信息,根据操作记录及上下文信息确定候选对象数据集合,以保证用于获取待推送的目标对象数据的候选对象数据集合的准确性,进一步保证提高了数据推送的准确性。
根据本发明实施例的又一个方面,还提供了一种用于实施上述数据推送方法的电子装置,如图7所示,该电子装置包括:一个或多个(图中仅示出一个)处理器702、存储器704、显示器706、用户接口708、传输装置710。其中,存储器704可用于存储软件程序以及模块,如本发明实施例中的数据推送方法和装置对应的程序指令/模块,处理器702通过运行存储在存储器704内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据推送方法。存储器704可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器704可进一步包括相对于处理器702远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置710用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置710包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置710为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器704用于存储待推送的目标对象数据和已获取的候选对象数据集合、以及用于控制实现推送的推送逻辑程序。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图7所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图7其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图7中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
根据本发明实施例的又一方面,本发明实施例还提供了一种存储介质,可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1,获取使用第一账号的客户端发送的推送请求;
S2,响应推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与第一账号匹配的账号特征向量,其中,对象特征向量根据候选对象数据中所包含的关键词的第一权重确定,账号特征向量根据被第一账号操作过的对象数据中所包含的关键词的第二权重确定;
S3,根据对象特征向量以及账号特征向量,从候选对象数据集合中确定出向客户端推送的目标对象数据。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种数据推送方法,其特征在于,包括:
获取使用第一账号的客户端发送的推送请求;
响应所述推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与所述第一账号匹配的账号特征向量,其中,所述对象特征向量根据所述候选对象数据中所包含的关键词的第一权重确定,所述账号特征向量根据被所述第一账号操作过的对象数据中所包含的关键词的第二权重确定;
根据所述对象特征向量以及所述账号特征向量,从所述候选对象数据集合中确定出向所述客户端推送的目标对象数据。
2.根据权利要求1所述的方法,其特征在于,获取与所述第一账号匹配的所述账号特征向量包括:
根据所述第二权重确定所述第一账号的初始账号权重向量;
获取上一次为所述第一账号推送所述目标对象数据时所使用的历史账号权重向量;
根据所述初始账号权重向量与所述历史账号权重向量确定所述第一账号当前的账号权重向量;
将所述账号权重向量输入推送模型,输出得到所述账号特征向量,其中,所述推送模型为利用多个有序样本对象通过机器训练得到。
3.根据权利要求2所述的方法,其特征在于,所述根据所述初始账号权重向量与所述历史账号权重向量确定所述第一账号的账号权重向量包括:
获取与所述历史账号权重向量匹配的衰减系数和所述历史账号权重向量的第一乘积;
获取所述第一乘积与所述初始账号权重向量二者的和,作为所述第一账号的所述账号权重向量。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第二权重确定所述第一账号的初始账号权重向量包括:
将被所述第一账号操作过的对象数据中的全部关键词的所述第二权重拼接,得到所述初始账号权重向量。
5.根据权利要求1所述的方法,其特征在于,所述响应所述推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量包括:
依次获取所述候选对象数据集合中所包含的每一个所述候选对象数据中各个关键词的所述第一权重;
将所述候选对象数据中全部关键词的所述第一权重拼接,得到与
所述候选对象数据匹配的数据权重向量;
将所述数据权重向量输入推送模型,输出得到所述候选对象数据的所述对象特征向量,其中,所述推送模型为利用多个有序样本对象通过机器训练得到。
6.根据权利要求5所述的方法,其特征在于,依次获取所述候选对象数据集合中所包含的每一个所述候选对象数据中各个关键词的所述第一权重包括:
所述候选对象数据集合第i个所述候选对象数据中的第j个关键词的所述第一权重通过以下步骤获取:
将所述第j个关键词在所述候选对象数据集合中的出现频率及逆向文件频率二者之间的第二乘积,作为所述第一权重。
7.根据权利要求1所述的方法,其特征在于,根据所述对象特征向量以及所述账号特征向量,从所述候选对象数据集合中确定出向所述客户端推送的目标对象数据包括:
获取所述账号特征向量与对象特征向量之间的向量点积;
对所述向量点积进行数值转换得到所述第一账号的推送指数;
根据所述推送指数的排序结果确定所述目标对象数据。
8.根据权利要求1所述的方法,其特征在于,在所述获取使用第一账号的客户端发送的推送请求之前,还包括:
获取所述第一账号的操作记录及上下文信息;
根据所述操作记录及所述上下文信息确定所述候选对象数据集合。
9.一种数据推送装置,其特征在于,包括:
第一获取单元,用于获取使用第一账号的客户端发送的推送请求;
第二获取单元,用于响应所述推送请求获取候选对象数据集合中各个候选对象数据的对象特征向量,以及与所述第一账号匹配的账号特征向量,其中,所述对象特征向量根据所述候选对象数据中所包含的关键词的第一权重确定,所述账号特征向量根据被所述第一账号操作过的对象数据中所包含的关键词的第二权重确定;
第一确定单元,用于根据所述对象特征向量以及所述账号特征向量,从所述候选对象数据集合中确定出向所述客户端推送的目标对象数据。
10.根据权利要求9所述的装置,其特征在于,所述第二获取单元包括:
第一确定模块,用于根据所述第二权重确定所述第一账号的初始账号权重向量;
第一获取模块,用于获取上一次为所述第一账号推送所述目标对象数据时所使用的历史账号权重向量;
第二确定模块,用于根据所述初始账号权重向量与所述历史账号权重向量确定所述第一账号当前的账号权重向量;
第一处理模块,用于将所述账号权重向量输入推送模型,输出得到所述账号特征向量,其中,所述推送模型为利用多个有序样本对象通过机器训练得到。
11.根据权利要求10所述的装置,其特征在于,其中,
所述第二确定模块包括:第一获取子模块,用于获取与所述历史账号权重向量匹配的衰减系数和所述历史账号权重向量的第一乘积;第二获取子模块,用于获取所述第一乘积与所述初始账号权重向量二者的和,作为所述第一账号的所述账号权重向量;
所述第一确定模块包括:处理子模块,用于将被所述第一账号操作过的对象数据中的全部关键词的所述第二权重拼接,得到与所述初始账号权重向量。
12.根据权利要求9所述的装置,其特征在于,所述第二获取单元包括:
第二获取模块,用于依次获取所述候选对象数据集合中所包含的每一个所述候选对象数据中各个关键词的所述第一权重;
第二处理模块,用于将所述候选对象数据中全部关键词的所述第一权重拼接,得到与所述候选对象数据匹配的数据权重向量;
第三处理模块,用于将所述数据权重向量输入推送模型,输出得到所述候选对象数据的所述对象特征向量,其中,所述推送模型为利用多个有序样本对象通过机器训练得到。
13.根据权利要求9所述的装置,其特征在于,所述第一确定单元包括:
第三获取模块,用于获取所述账号特征向量与对象特征向量之间的向量点积;
第四处理模块,用于对所述向量点积进行数值转换得到所述第一账号的推送指数;
第三确定模块,用于根据所述推送指数的排序结果确定所述目标对象数据。
14.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至8任一项中所述的方法。
15.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行所述权利要求1至8任一项中所述的方法。
CN201711174243.7A 2017-11-22 2017-11-22 数据推送方法和装置、存储介质及电子装置 Active CN109819002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711174243.7A CN109819002B (zh) 2017-11-22 2017-11-22 数据推送方法和装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711174243.7A CN109819002B (zh) 2017-11-22 2017-11-22 数据推送方法和装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN109819002A true CN109819002A (zh) 2019-05-28
CN109819002B CN109819002B (zh) 2021-06-08

Family

ID=66601244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711174243.7A Active CN109819002B (zh) 2017-11-22 2017-11-22 数据推送方法和装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN109819002B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110856003A (zh) * 2019-10-17 2020-02-28 网易(杭州)网络有限公司 直播列表的推送方法、装置、电子设备及存储介质
CN111177568A (zh) * 2020-01-02 2020-05-19 平安科技(深圳)有限公司 基于多源数据的对象推送方法、电子装置及存储介质
CN112449002A (zh) * 2020-10-19 2021-03-05 微民保险代理有限公司 一种待推送对象的推送方法、装置、设备及存储介质
US20220224765A1 (en) * 2019-05-23 2022-07-14 Beijing Wodong Tianjun Information Technology Co., Ltd Method and apparatus for pushing information

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778260A (zh) * 2014-03-03 2014-05-07 哈尔滨工业大学 一种个性化微博信息推荐系统和方法
CN104166668A (zh) * 2014-06-09 2014-11-26 南京邮电大学 基于folfm模型的新闻推荐系统及方法
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
US9424595B2 (en) * 2008-08-12 2016-08-23 Teaneck Enterprises, Llc Customized content delivery based on geographic area
CN106570003A (zh) * 2015-10-08 2017-04-19 腾讯科技(深圳)有限公司 数据推送方法及装置
CN107025310A (zh) * 2017-05-17 2017-08-08 长春嘉诚信息技术股份有限公司 一种自动实时新闻推荐方法
CN107038184A (zh) * 2016-10-14 2017-08-11 厦门大学 一种基于分层隐变量模型的新闻推荐方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424595B2 (en) * 2008-08-12 2016-08-23 Teaneck Enterprises, Llc Customized content delivery based on geographic area
CN103778260A (zh) * 2014-03-03 2014-05-07 哈尔滨工业大学 一种个性化微博信息推荐系统和方法
CN104166668A (zh) * 2014-06-09 2014-11-26 南京邮电大学 基于folfm模型的新闻推荐系统及方法
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
CN106570003A (zh) * 2015-10-08 2017-04-19 腾讯科技(深圳)有限公司 数据推送方法及装置
CN107038184A (zh) * 2016-10-14 2017-08-11 厦门大学 一种基于分层隐变量模型的新闻推荐方法
CN107025310A (zh) * 2017-05-17 2017-08-08 长春嘉诚信息技术股份有限公司 一种自动实时新闻推荐方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220224765A1 (en) * 2019-05-23 2022-07-14 Beijing Wodong Tianjun Information Technology Co., Ltd Method and apparatus for pushing information
US11962662B2 (en) * 2019-05-23 2024-04-16 Beijing Wodong Tianjun Information Technology Co., Ltd. Method and apparatus for pushing information
CN110856003A (zh) * 2019-10-17 2020-02-28 网易(杭州)网络有限公司 直播列表的推送方法、装置、电子设备及存储介质
CN111177568A (zh) * 2020-01-02 2020-05-19 平安科技(深圳)有限公司 基于多源数据的对象推送方法、电子装置及存储介质
CN111177568B (zh) * 2020-01-02 2020-08-21 平安科技(深圳)有限公司 基于多源数据的对象推送方法、电子装置及存储介质
CN112449002A (zh) * 2020-10-19 2021-03-05 微民保险代理有限公司 一种待推送对象的推送方法、装置、设备及存储介质
CN112449002B (zh) * 2020-10-19 2022-08-12 微民保险代理有限公司 一种待推送对象的推送方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109819002B (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN105446973B (zh) 社交网络中用户推荐模型的建立及应用方法和装置
CN111680219B (zh) 内容推荐方法、装置、设备及可读存储介质
CN111125422B (zh) 一种图像分类方法、装置、电子设备及存储介质
US9449271B2 (en) Classifying resources using a deep network
CN108345702A (zh) 实体推荐方法和装置
CN107577807B (zh) 用于推送信息的方法和装置
CN110909145B (zh) 针对多任务模型的训练方法及装置
CN109819002A (zh) 数据推送方法和装置、存储介质及电子装置
CN111914179B (zh) 基于语义的模糊搜索方法和装置、存储介质及电子设备
CN108665064A (zh) 神经网络模型训练、对象推荐方法及装置
CN109993583A (zh) 信息推送方法和装置、存储介质及电子装置
CN103136188A (zh) 用于网络浏览用户的情绪估计的方法和系统
US9268859B2 (en) Method and system for customizing a web site
CN103970791A (zh) 一种从视频库推荐视频的方法、装置
CN110413888A (zh) 一种书籍推荐方法及装置
CN108140055A (zh) 触发应用信息
CN107408122A (zh) 新鲜因特网内容的有效检索
CN110083774A (zh) 应用推荐列表的确定方法、装置、计算机设备及存储介质
CN111625715A (zh) 信息提取方法、装置、电子设备及存储介质
CN109255070A (zh) 推荐信息处理方法、装置、计算机设备及存储介质
CN111159242B (zh) 一种基于边缘计算的客户端重排序方法及系统
CN107562847A (zh) 信息处理方法及相关产品
CN108563648A (zh) 数据显示方法和装置、存储介质及电子装置
CN110516153B (zh) 视频的智能推送方法和装置、存储介质及电子装置
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221212

Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518100

Patentee after: Shenzhen Yayue Technology Co.,Ltd.

Address before: 518000 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 Floors

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.