CN112035736B - 信息推送方法、装置及服务器 - Google Patents

信息推送方法、装置及服务器 Download PDF

Info

Publication number
CN112035736B
CN112035736B CN202010758692.1A CN202010758692A CN112035736B CN 112035736 B CN112035736 B CN 112035736B CN 202010758692 A CN202010758692 A CN 202010758692A CN 112035736 B CN112035736 B CN 112035736B
Authority
CN
China
Prior art keywords
pushing
information
candidate
feature
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010758692.1A
Other languages
English (en)
Other versions
CN112035736A (zh
Inventor
熊菲
杨水石
王哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202010758692.1A priority Critical patent/CN112035736B/zh
Publication of CN112035736A publication Critical patent/CN112035736A/zh
Application granted granted Critical
Publication of CN112035736B publication Critical patent/CN112035736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开关于一种信息推送方法、装置及服务器,属于计算机应用技术领域。其中,该推送方法包括:获取候选推送对象及各候选推送对象的第一特征信息,其中,候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象;获取候选推送素材,并获取每个候选推送素材的第二特征信息;针对任一候选推送素材,将每个第一特征信息分别与任一候选推送素材的第二特征信息进行组合,生成任一候选推送素材的特征数据;根据任一候选推送素材的特征数据,从多个候选推送对象中获取任一候选推送素材对应的目标推送群体。由此,根据这种信息推送方法,能够根据对象特征和素材特征确定与候选推送素材相匹配的目标推送群体,提高了信息推送的准确性。

Description

信息推送方法、装置及服务器
技术领域
本公开涉及计算机应用技术领域,尤其涉及一种信息推送方法、装置及服务器。
背景技术
目前,随着互联网技术的发展,基于网络向用户推送信息具有覆盖范围大、即时性强等优点,得到了广泛应用,例如,可在网页、应用程序(Application,APP)等媒介上向用户推送信息。然而,该种信息推送方法存在推送准确性低、长期效果和实用性较差等问题。
发明内容
本公开提供一种信息推送方法、装置、服务器、存储介质,以至少解决相关技术中,推送准确性低、长期效果和实用性较差的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种信息推送方法,包括:获取候选推送对象及各所述候选推送对象的第一特征信息,其中,所述候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象;获取候选推送素材,并获取每个所述候选推送素材的第二特征信息;针对任一候选推送素材,将每个所述第一特征信息分别与所述任一候选推送素材的第二特征信息进行组合,生成所述任一候选推送素材的特征数据;根据所述任一候选推送素材的特征数据,从多个所述候选推送对象中获取所述任一候选推送素材对应的目标推送群体。
在本公开的一个实施例中,所述根据所述任一候选推送素材的特征数据,从多个所述候选推送对象中获取所述任一候选推送素材对应的目标推送群体,包括:将所述特征数据输入至目标模型,获取每个所述候选推送对象对于所述任一候选推送素材的反馈信息,所述反馈信息用于表示在将所述任一候选推送素材通过所述信息平台发送至所述候选推送对象所在的终端之后,所述候选推送对象执行交互操作的时长;以及根据各所述候选推送对象的反馈信息,从多个所述候选推送对象中确定出所述任一候选推送素材对应的所述目标推送群体。
在本公开的一个实施例中,所述获取候选推送对象,包括:获取在所述信息平台上已经被推送的已推送素材;获取所述已推送素材的注册信息,其中,所述注册信息中携带在所述已推送素材上进行注册的对象的标识信息;以及根据所述标识信息,获取所述进行注册的对象在所注册的所述已推送素材上执行交互操作的时长;以及选取在所注册的所述已推送素材上执行交互操作的时长大于所述第一预设时长的所述进行注册的对象作为所述候选推送对象。
在本公开的一个实施例中,在将所述特征数据输入至目标模型之前,所述方法还包括:获取样本推送素材及所述样本推送素材对应的样本推送对象;其中,所述样本推送对象为在所述信息平台上在对应的所述样本推送素材注册且执行交互操作的时长大于所述第一预设时长的对象;获取所述样本推送对象的第三特征信息,以及所述样本推送对象所注册的所述样本推送素材的第四特征信息;将所述第三特征信息与所述第四特征信息进行组合,生成模型训练数据;利用所述模型训练数据对初始模型进行训练,生成所述目标模型。
在本公开的一个实施例中,所述利用所述模型训练数据对初始模型进行训练,生成所述目标模型,包括:利用所述模型训练数据,分别对多个初始模型进行训练,获取多个候选模型;获取每个所述候选模型的模型的性能参数;以及根据所述模型的性能参数从所述多个候选模型中确定出所述目标模型。
在本公开的一个实施例中,在推送对象与推送素材的特征信息进行组合,包括:对每个推送对象和每个推送素材的特征信息进行特征分桶;对特征分桶结果进行编码,生成每个所述特征信息的特征向量;将所述推送对象的特征向量与所述推送素材的特征向量进行组合。
在本公开的一个实施例中,所述对每个推送对象和每个推送素材的特征信息进行特征分桶,包括:针对所述特征信息中的任一特征项,获取不同主体下所述特征项的取值,并根据所述特征项的取值,对所述特征项进行特征分桶,其中,所述主体为任意一个所述推送对象或者任意一个所述推送素材;
所述对特征分桶结果进行编码,生成每个所述特征信息的特征向量,包括:根据所述主体的所述特征项的取值和所述特征项的分桶结果,对所述主体的所述特征项进行编码以生成编码信息;以及利用所述主体所有的所述特征项的编码信息,生成所述主体的所述特征信息的特征向量。
在本公开的一个实施例中,所述根据所述主体的所述特征项的取值和所述特征项的分桶结果,对所述主体的所述特征项进行编码,包括:根据所述主体的所述特征项的取值,识别所述主体所属的目标分桶;配置所述目标分桶的编码值为有效编码值,剩余分桶的编码值为无效编码值,以生成所述主体的编码信息。
在本公开的一个实施例中,在进行特征分桶之前,所述方法还包括:识别所述特征信息中取值为空的特征项,对所述取值为空的特性项进行缺失值填充。
在本公开的一个实施例中,所述根据各所述候选推送对象的反馈信息,从多个所述候选推送对象中确定出所述任一候选推送素材对应的所述目标推送群体,包括:根据所述反馈信息,从多个所述候选推送对象中,选取出执行交互操作的时长大于或者等于预设时长阈值的所述候选推送对象,形成所述任一候选推送素材对应的所述目标推送群体;或者,根据所述反馈信息,对所述候选推送对象执行交互操作的时长进行排序,从多个所述候选推送对象中,按序筛选出所述任一候选推送素材对应的所述目标推送群体。
根据本公开实施例的第二方面,提供一种信息推送装置,包括:第一获取模块,被配置为执行获取候选推送对象及各所述候选推送对象的第一特征信息,其中,所述候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象;第二获取模块,被配置为执行获取候选推送素材,并获取每个所述候选推送素材的第二特征信息;组合模块,被配置为执行针对任一候选推送素材,将每个所述第一特征信息分别与所述任一候选推送素材的第二特征信息进行组合,生成所述任一候选推送素材的特征数据;以及第三获取模块,被配置为执行根据所述任一候选推送素材的特征数据,从多个所述候选推送对象中获取所述任一候选推送素材对应的目标推送群体。
在本公开的一个实施例中,所述第三获取模块,包括:反馈单元,被配置为执行将所述特征数据输入至目标模型,获取每个所述候选推送对象对于所述任一候选推送素材的反馈信息,所述反馈信息用于表示在将所述任一候选推送素材通过所述信息平台发送至所述候选推送对象所在的终端之后,所述候选推送对象执行交互操作的时长;以及第一确定单元,被配置为执行根据各所述候选推送对象的反馈信息,从多个所述候选推送对象中确定出所述任一候选推送素材对应的所述目标推送群体。
在本公开的一个实施例中,所述第一获取模块,包括:第一获取单元,被配置为执行获取在所述信息平台上已经被推送的已推送素材;第二获取单元,被配置为执行获取所述已推送素材的注册信息,其中,所述注册信息中携带在所述已推送素材上进行注册的对象的标识信息;第三获取单元,被配置为执行根据所述标识信息,获取所述进行注册的对象在所注册的所述已推送素材上执行交互操作的时长;以及选取单元,被配置为执行选取在所注册的所述已推送素材上执行交互操作的时长大于所述第一预设时长的所述进行注册的对象作为所述候选推送对象。
在本公开的一个实施例中,所述装置还包括:模型生成模块,所述模型生成模块,包括:第四获取单元,被配置为执行获取样本推送素材及所述样本推送素材对应的样本推送对象;其中,所述样本推送对象为在所述信息平台上在对应的所述样本推送素材注册且执行交互操作的时长大于所述第一预设时长的对象;第五获取单元,被配置为执行获取所述样本推送对象的第三特征信息,以及所述样本推送对象所注册的所述样本推送素材的第四特征信息;数据生成单元,被配置为执行将所述第三特征信息与所述第四特征信息进行组合,生成模型训练数据;以及训练单元,被配置为执行利用所述模型训练数据对初始模型进行训练,生成所述目标模型。
在本公开的一个实施例中,所述训练单元,包括:训练子单元,被配置为执行利用所述模型训练数据,分别对多个初始模型进行训练,获取多个候选模型;第六获取子单元,被配置为执行获取每个所述候选模型的模型的性能参数;以及第二确定子单元,被配置为执行根据所述模型的性能参数从所述多个候选模型中确定出所述目标模型。
在本公开的一个实施例中,所述组合模块,包括:特征分桶单元,被配置为执行对每个推送对象和每个推送素材的特征信息进行特征分桶;向量生成单元,被配置为执行对特征分桶结果进行编码,生成每个所述特征信息的特征向量;以及组合单元,被配置为执行将所述推送对象的特征向量与所述推送素材的特征向量进行组合。
在本公开的一个实施例中,所述特征分桶单元,包括:特征分桶子单元,被配置为执行针对所述特征信息中的任一特征项,获取不同主体下所述特征项的取值,并根据所述特征项的取值,对所述特征项进行特征分桶,其中,所述主体为任意一个所述推送对象或者任意一个所述推送素材;
所述向量生成单元,包括:编码子单元,被配置为执行根据所述主体的所述特征项的取值和所述特征项的分桶结果,对所述主体的所述特征项进行编码以生成编码信息;以及向量生成子单元,被配置为执行利用所述主体所有的所述特征项的编码信息,生成所述主体的所述特征信息的特征向量。
在本公开的一个实施例中,所述编码子单元,被配置为执行:识别根据所述主体的所述特征项的取值,识别所述主体所属的目标分桶;以及配置所述目标分桶的编码值为有效编码值,剩余分桶的编码值为无效编码值,以生成所述主体的编码信息。
在本公开的一个实施例中,所述组合模块,还包括:缺失填充单元,被配置为执行在进行特征分桶之前,识别所述特征信息中取值为空的特征项,对所述取值为空的特性项进行缺失值填充。
在本公开的一个实施例中,所述第一确定单元,包括:选取子单元,被配置为执行根据所述反馈信息,从多个所述候选推送对象中,选取出执行交互操作的时长大于或者等于预设时长阈值的所述候选推送对象,形成所述任一候选推送素材对应的所述目标推送群体;或者,排序子单元,被配置为执行根据所述反馈信息,对所述候选推送对象执行交互操作的时长进行排序,从多个所述候选推送对象中,按序筛选出所述任一候选推送素材对应的所述目标推送群体。
根据本公开实施例的第三方面,提供一种服务器,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如前所述的信息推送方法。
根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如前所述的信息推送方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序由服务器的处理器执行时,使得服务器能够执行如前所述的信息推送方法。
本公开的实施例提供的技术方案至少带来以下有益效果:能够将候选推送对象的第一特征信息和候选推送素材的第二特征信息进行组合,得到候选推送素材的特征数据,并根据候选推送素材的特征数据确定候选推送素材对应的目标推送群体,即可根据对象特征和素材特征从多个候选推送对象中确定与候选推送素材相匹配的目标推送群体,使得信息推送更贴近对象特征和素材特征,提高了信息推送的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种信息推送方法的流程图。
图2是根据一示例性实施例示出的一种信息推送方法的场景示意图。
图3是根据一示例性实施例示出的信息推送方法中获取目标推送群体的流程图。
图4是根据一示例性实施例示出的另一种信息推送方法的流程图。
图5是根据一示例性实施例示出的信息推送方法中在对每个候选推送对象和每个候选推送素材的特征信息进行特征分桶之前的流程图。
图6是根据一示例性实施例示出的信息推送方法中获取候选推送对象的流程图。
图7是根据一示例性实施例示出的信息推送方法中在将特征数据输入至目标模型之前的流程图。
图8是根据一示例性实施例示出的信息推送方法中利用模型训练数据对初始模型进行训练,生成目标模型的流程图。
图9是根据一示例性实施例示出的信息推送方法中训练后的Lasso Regression模型对应的ROC曲线的示意图。
图10是根据图9示出的训练后的Lasso Regression模型进行测试对应的ROC曲线的示意图。
图11是根据图9示出的训练后的Lasso Regression模型进行预测对应的正负样本数和第二概率的示意图。
图12是根据一示例性实施例示出的另一种信息推送方法的流程图。
图13是根据一示例性实施例示出的一种信息推送装置框图。
图14是根据一示例性实施例示出的另一种信息推送装置框图。
图15是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种信息推送方法的流程图,如图1所示,该信息推送方法用于服务器中,包括以下步骤。
在步骤S101中,获取候选推送对象及各候选推送对象的第一特征信息,其中,候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象。
需要说明的是,本公开的信息推送方法的执行主体为服务器。本公开实施例的信息推送方法可以由本公开实施例的信息推送装置执行,本公开实施例的信息推送装置可以配置在任意服务器中,以执行本公开实施例的信息推送方法。
本公开的实施例中,如图2所示,服务器可通过信息平台向对象推送素材。其中,信息平台包括但不限于由服务器提供服务的APP、网页或终端设备等平台,这里不做过多限定。素材包括但不限于APP、网页等。应说明的是,若信息平台为某短视频APP,上述素材的链接信息可以嵌入在短视频中进行推送,链接信息可包括APP的下载链接、网页链接等。
本公开的实施例中,候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象,表明候选推送对象为在信息平台上执行交互操作的时长较长的对象,这些对象在信息平台上的活跃度较高,看到推送信息的概率也较大,进而通过信息平台进行信息推送的效果也较好。其中,第一预设时长可根据实际情况进行标定,例如,可标定为6小时。
在具体实施中,若信息平台为某短视频APP,则在信息平台上执行交互操作的时长可包括在短视频APP上登录的时长、观看视频、观看直播的时长中的其中一个;若信息平台为某网页,则在信息平台上执行交互操作的时长可包括登录网页的时长。
本公开的实施例中,候选推送对象的第一特征信息包括但不限于对象的静态特征、社交特征、行为特征、兴趣特征等信息。
其中,静态特征信息包括但不限于对象的年龄、性别、地理位置、网络环境、对象在终端设备中安装的APP列表等信息;
社交特征信息包括但不限于对象在终端设备中的通讯联系人个数等信息。以信息平台为某短视频APP为例,社交特征信息还可包括对象在该短视频APP上的关注数、粉丝数等信息;
行为特征信息包括但不限于使用信息平台的次数、时长等信息。以信息平台为某短视频APP为例,行为特征信息包括但不限于对象在近七日的活跃天数,以及对象在近七日播放、评论、点赞、分享、收藏视频的累计次数,以及对象在近七日观看视频的累计时长,以及对象在近七日观看、点赞、打赏直播的累计次数,以及对象在近七日观看直播的累计时长,以及对象在近七日打赏直播的累计钱数等;
兴趣特征信息包括但不限于对象的长期兴趣标签、短期兴趣标签、以及每个兴趣标签的权重等信息。以信息平台为某短视频APP为例,可预先为每个视频预设一个兴趣标签,根据对象的历史观看视频的大数据分析结果,可确定对象的兴趣标签及其权重。
举例而言,可采用用户画像的方式获取候选推送对象的第一特征信息。可以理解的是,服务器可获取到用户的位置信息、通话记录、短信记录、无线应用通讯协议(WirelessApplication Protocol,WAP)访问记录以及漫游记录等数据中的至少一个,通过对上述数据的分析,可从中提取到用户的特征信息,并建立用户画像库。
在步骤S102中,获取候选推送素材,并获取每个候选推送素材的第二特征信息。
本公开的实施例中,候选推送素材可为多个,候选推送素材的第二特征信息包括但不限于素材的类型、价格、优惠信息等,这里不做过多限定。
在步骤S103中,针对任一候选推送素材,将每个第一特征信息分别与任一候选推送素材的第二特征信息进行组合,生成任一候选推送素材的特征数据。
举例而言,假设某一候选推送素材的第二特征信息为B,获取的第一特征信息分别为A1、A2、A3、A4,则可分别将第一特征信息A1、A2、A3、A4与第二特征信息B进行组合,生成的该候选推送素材的特征数据可包括A1B、A2B、A3B、A4B。
若信息平台为某短视频APP,获取的候选推送对象A的第一特征信息如表1所示,获取的候选推送素材B的第二特征信息如表2所示,则第一特征信息和第二特征信息进行组合之后的特征数据可为(26岁、男、北京、3天、游戏、游戏)的数据排列。
表1候选推送对象A的第一特征信息
候选推送对象 年龄 性别 所在城市 近七日的活跃天数 长期兴趣
A 26岁 北京 3天 游戏
表2候选推送素材B的第二特征信息
候选推送素材 类型
B 游戏
在步骤S104中,根据任一候选推送素材的特征数据,从多个候选推送对象中获取任一候选推送素材对应的目标推送群体。
本公开的实施例中,目标推送群体由至少一个候选推送对象组成,可根据任一候选推送素材的特征数据,从多个候选推送对象中确定与任一候选推送素材相匹配的候选推送对象,将其作为任一候选推送素材对应的目标推送群体。
在具体实施中,获取任一候选推送素材对应的目标推送群体之后,可将任一候选推送素材通过信息平台发送至其对应的目标推送群体所在的终端,以实现素材的推送。其中,终端包括但不限于手机、平板电脑等。
本公开的实施例提供的信息推送方法,能够将候选推送对象的第一特征信息和候选推送素材的第二特征信息进行组合,得到候选推送素材的特征数据,并根据候选推送素材的特征数据确定候选推送素材对应的目标推送群体,即可根据对象特征和素材特征从多个候选推送对象中确定与候选推送素材相匹配的目标推送群体,使得信息推送更贴近对象特征和素材特征,提高了信息推送的准确性。
在上述实施例的基础上,步骤S104中根据任一候选推送素材的特征数据,从多个候选推送对象中获取任一候选推送素材对应的目标推送群体,如图3所示,可包括:
在步骤S201中,将特征数据输入至目标模型,获取每个候选推送对象对于任一候选推送素材的反馈信息,反馈信息用于表示在将任一候选推送素材通过信息平台发送至候选推送对象所在的终端之后,候选推送对象执行交互操作的时长。
本公开的实施例中,目标模型可预先建立,并预先设置在服务器的存储空间中。
在具体实施中,若候选推送素材为某网页,则候选推送对象执行交互操作的时长可包括登录网页的时长;若候选推送素材为某APP,则候选推送对象执行交互操作的时长可包括该APP在终端的使用时长。
在步骤S202中,根据各候选推送对象的反馈信息,从多个候选推送对象中确定出任一候选推送素材对应的目标推送群体。
本公开的实施例中,若候选推送对象对于某个候选推送素材的反馈信息表示的执行交互操作的时长越长,说明该候选推送对象在该候选推送素材上的活跃度较高,候选推送素材的推送效果较好。
可选的,根据各候选推送对象的反馈信息,从多个候选推送对象中确定出任一候选推送素材对应的目标推送群体,可包括如下两种可能的实施方式:
方式1、根据反馈信息,从多个候选推送对象中,选取出执行交互操作的时长大于或者等于预设时长阈值的候选推送对象,形成任一候选推送素材对应的目标推送群体。
本公开的实施例中,可从多个候选推送对象中选取出执行交互操作的时长大于或者等于预设时长阈值的候选推送对象,即能够从多个候选推送对象中选取出执行交互操作的时长较长的候选推送对象,以形成任一候选推送素材对应的目标推送群体,相较于相关技术中大多根据用户在APP上激活或者交互操作时长等于一天的概率进行信息推送,该方法拓宽了交互操作的时长范围,能够从多个候选推送对象中选取在候选推送素材上执行交互操作时长较长的对象,有利于提高信息推送的长期效果。
可选的,预设时长阈值可根据实际情况进行标定,并预先设置在服务器的存储空间中。例如,预设时长阈值可标定为7天,且当预设时长阈值为7天时,此时的目标模型可称为7日交互目标模型。
方式2、根据反馈信息,对候选推送对象执行交互操作的时长进行排序,从多个候选推送对象中,按序筛选出任一候选推送素材对应的目标推送群体。
在具体实施中,可对候选推送对象执行交互操作的时长从大到小进行排序,并选择排序前N个的交互操作的时长的候选推送对象,形成任一候选推送素材对应的目标推送群体,该方法可从多个候选推送对象中选取在候选推送素材上执行交互操作时长较长的对象,有利于提高信息推送的长期效果。其中,N可根据实际情况进行标定,这里不作限定。
进一步地,还可从排序前N个的交互操作的时长的候选推送对象中筛选出交互操作的时长大于预设时长阈值的候选推送对象,形成任一候选推送素材对应的目标推送群体,该方法可从多个候选推送对象中选取在候选推送素材上执行交互操作时长较长,且时长大于预设时长阈值的对象,有利于提高信息推送的长期效果。
图4是根据一示例性实施例示出的另一种信息推送方法的流程图,如图4所示,该信息推送方法用于服务器中,包括以下步骤。
在步骤S301中,获取候选推送对象及各候选推送对象的第一特征信息,其中,候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象。
在步骤S302中,获取候选推送素材,并获取每个候选推送素材的第二特征信息。
上述步骤S301-S302的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
在步骤S303中,对每个候选推送对象和每个候选推送素材的特征信息进行特征分桶。
需要说明的是,对特征信息进行特征分桶,指的是预先为特征信息划分多个取值区间,根据特征信息的实际取值,将特征信息划分到其所属的取值区间内。可以理解的是,特征信息的类别不同,其对应的取值区间也可能不同。例如,特征信息为性别时,对应的取值区间有两个,分别为男、女,特征信息为年龄时,对应的取值区间可包括(16~20)岁、(21~25)岁、(26~30)岁等。
在本公开的一个实施例中,对每个候选推送对象和每个候选推送素材的特征信息进行特征分桶,可包括针对特征信息中的任一特征项,获取不同主体下特征项的取值,并根据特征项的取值,对特征项进行特征分桶,其中,主体为任意一个候选推送对象或者任意一个候选推送素材。其中,特征项指的是组成每个候选推送对象和每个候选推送素材的特征信息的任一项特征信息。例如,若获取的候选推送对象A的第一特征信息包括性别、年龄、关注数,则性别、年龄、关注数分别为候选推送对象A的一个特征项。
可以理解的是,该方法可获取不同主体下特征项的取值,从而获取该特征项的取值范围,进而可根据特征项的取值范围为特征项划分对应的取值区间,使得取值区间可覆盖该特征项的所有可能取值,保证每个主体的特征项都有对应的取值区间,保证了特征分桶的准确性。
可选的,对特征信息进行特征分桶时,可均匀地为特征信息划分多个取值区间,以保证分桶结果的均匀性。
举例而言,特征信息为年龄时,若获取的所有候选推送对象的年龄的取值范围为(21~40)岁,则年龄对应的取值区间可预先划分成(21~25)岁、(26~30)岁、(31~35)岁、(36~40)岁,若候选推送对象A的年龄为29岁,则可将候选推送对象A的年龄划分到(26~30)岁中,若候选推送对象B的年龄为32岁,则可将候选推送对象B的年龄划分到(31~35)岁中。
在步骤S304中,对特征分桶结果进行编码,生成每个特征信息的特征向量。
在本公开的一个实施例中,对特征分桶结果进行编码,生成每个特征信息的特征向量,可包括根据主体的特征项的取值和特征项的分桶结果,对主体的特征项进行编码以生成编码信息,以及利用主体所有的特征项的编码信息,生成主体的特征信息的特征向量。
其中,根据主体的特征项的取值和特征项的分桶结果,对主体的特征项进行编码,可包括根据主体的特征项的取值,识别主体所属的目标分桶,配置目标分桶的编码值为有效编码值,剩余分桶的编码值为无效编码值,以生成主体的编码信息。可选的,有效编码值、无效编码值均可根据实际情况进行标定,这里不做过多限定,并预先设置在服务器的存储空间中。例如,有效编码值可标定为1,无效编码值可标定为0。
可选的,可采用One-Hot编码(One-Hot-Encoding,独热编码)对特征分桶结果进行编码,以生成每个特征信息的特征向量。例如,特征信息为性别时,特征分桶结果及其编码可参照表3进行。
表3
特征信息为性别时,对应的取值区间有两个,分别为男、女。如表3所示,可预先划分成2个分桶,分别为“分桶1:男”、“分桶2:女”,并可根据候选推送对象的性别,识别其所属的取值区间对应的分桶。例如,若候选推送对象A的性别为男,则可识别目标分桶为“分桶1:男”,配置“分桶1:男”的编码值为1,“分桶2:女”的编码值为0,即其生成的性别的特征向量为(1,0);若候选推送对象B的性别为女,则可识别目标分桶为“分桶2:女”,配置“分桶1:男”的编码值为0,“分桶2:女”的编码值为1,即其生成的性别的特征向量为(0,1)。
例如,特征信息为年龄时,特征分桶结果及其编码可参照表4进行。
表4
特征信息为年龄时,假设获取的所有候选推送对象的年龄的取值范围为(21~40)岁,如表4所示,可预先划分成4个分桶,分别为“分桶1:(21~25)岁”、“分桶2:(26~30)岁”、“分桶3:(31~35)岁”、“分桶4:(36~40)岁”,并可根据候选推送对象的年龄,识别其所属的取值区间对应的分桶。例如,若候选推送对象A的年龄为29岁,则可识别目标分桶为“分桶2:(26~30)岁”,配置“分桶2:(26~30)岁”的编码值为1,剩余分桶的编码值为0,即其生成的年龄的特征向量为(0,1,0,0);若候选推送对象B的年龄为32岁,则可识别目标分桶为“分桶3:(31~35)岁”,配置“分桶3:(31~35)岁”的编码值为1,剩余分桶的编码值为0,即其生成的年龄的特征向量为(0,0,1,0)。
例如,特征信息为关注数时,特征分桶结果及其编码可参照表5进行。
特征信息为关注数时,假设获取的所有候选推送对象的关注数的取值范围为(1~200),如表5所示,可预先划分成5个分桶,分别为“分桶1:(1~40)”、“分桶2:(41~80)”、“分桶3:(81~120)”、“分桶4:(121~160)”、“分桶5:(161~200)”,并可根据候选推送对象的关注数,识别其所属的取值区间对应的分桶。例如,若候选推送对象A的关注数为88,则可识别目标分桶为“分桶3:(81~120)”,配置“分桶3:(81~120)”的编码值为1,剩余分桶的编码值为0,即其生成的关注数的特征向量为(0,0,1,0,0);若候选推送对象B的关注数为22,则可识别目标分桶为“分桶1:(1~40)”,配置“分桶1:(1~40)”的编码值为1,剩余分桶的编码值为0,即其生成的年龄的特征向量为(1,0,0,0,0)。
表5
例如,特征信息为素材的类型时,可以根据素材的类型进行分桶,比方,素材为APP、且特征信息为素材的类型时,特征分桶结果及其编码可参照表6进行。
表6
特征信息为素材的类型时,假设获取的所有候选推送素材的类型包括游戏、购物、音乐、视频、摄影、聊天,如表6所示,可预先划分成6个分桶,分别为“分桶1:游戏”、“分桶2:购物”、“分桶3:音乐”、“分桶4:视频”、“分桶5:摄影”、“分桶6:聊天”,并可根据候选推送素材的类型,识别其所属的类型对应的分桶。例如,若候选推送素材A为音乐类型的APP,则可识别目标分桶为“分桶3:音乐”,配置“分桶3:音乐”的编码值为1,剩余分桶的编码值为0,即其生成的类型的特征向量为(0,0,1,0,0,0);若候选推送对象B为聊天类型的APP,则可识别目标分桶为“分桶6:聊天”,配置“分桶6:聊天”的编码值为1,剩余分桶的编码值为0,即其生成的类型的特征向量为(0,0,0,0,0,1)。
在步骤S305中,将候选推送对象的特征向量与候选推送素材的特征向量进行组合,以生成候选推送素材的特征数据。
可选的,可将候选推送对象的特征向量与候选推送素材的特征向量相乘或者拼接等组合方式,以生成特征数据。
在步骤S306中,根据任一候选推送素材的特征数据,从多个候选推送对象中获取任一候选推送素材对应的目标推送群体。
上述步骤S306的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
本公开的实施例提供的信息推送方法,在获取到候选推送对象的第一特征信息和候选推送素材的第二特征信息之后,能够对上述特征信息进行特征分桶,并根据特征分桶结果进行编码,进而生成每个特征信息的特征向量,然后将候选推送对象的特征向量和候选推送素材的特征向量进行组合,以生成特征数据。
可选的,在步骤S303之前,即在对每个候选推送对象和每个候选推送素材的特征信息进行特征分桶之前,如图5所示,还包括:
在步骤S401中,识别特征信息中取值为空的特征项。
可以理解的是,获取候选推送对象的第一特征信息和候选推送素材的第二特征信息时,可能会出现特征项的取值为空的情况,若不对取值为空的特征项进行缺失值填充,就无法继续执行对该特征项进行特征分桶及其后续步骤,进而面临丢失大量特征信息的风险。为了有效利用特征信息,可在对特征信息进行特征分桶之前,识别特征信息中是否存在取值为空的特征项,并对取值为空的特征项进行缺失值填充。
在步骤S402中,对取值为空的特性项进行缺失值填充。
可选的,可将取值为空的特征项填充为0,或者可将其填充为该特征项的平均值,这里不做过多限定。例如,若候选推送对象A的年龄的取值为空,则可获取所有候选推送对象的年龄的取值,并根据所有候选推送对象的年龄的取值获取候选推送对象的年龄的平均值,假设候选推送对象的年龄的平均值为35岁,则可将候选推送对象A的年龄填充为35岁。
该方法通过对取值为空的特征项进行缺失值填充,能够保证所有特征项都有对应的取值,从而能够根据特征项的取值进行特征分桶。
在上述任一实施例的基础上,步骤S101中获取候选推送对象,如图6所示,还可包括:
在步骤S501中,获取在信息平台上已经被推送的已推送素材。
可以理解的是,服务器可在自身的存储空间中存储在信息平台上已经被推送的已推送素材。
在步骤S502中,获取已推送素材的注册信息,其中,注册信息中携带在已推送素材上进行注册的对象的标识信息。
本发明的实施例中,在向对象推送已推送素材之后,服务器可获取到已推送素材的注册信息,且在对象注册已推送素材的过程中,服务器可获取该对象的标识信息。其中,注册包括但不限于在素材上创建新账号。
其中,标识信息包括但不限于对象的账号、对象所登录的设备标识信息,所登录的设备可以为电脑、移动终端、平板电脑等。针对不同类型的登录设备,设备标识信息也不同,例如,设备标识信息可包括设备的网际互连协议(Internet Protocol,IP)地址、域名(Domain Name Server,DNS)地址、物理(Media Access Control,MAC)地址、国际移动设备识别码(International Mobile Equipment Identity,IMEI)等。
在步骤S503中,根据标识信息,获取进行注册的对象在所注册的已推送素材上执行交互操作的时长。
需要说明的是,获取执行交互操作的时长的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
在步骤S504中,选取在所注册的已推送素材上执行交互操作的时长大于第一预设时长的进行注册的对象作为候选推送对象。
本公开的实施例中,可选取在所注册的已推送素材上执行交互操作的时长大于第一预设时长的进行注册的对象作为候选推送对象,即能够从多个对象中选取出在已推送素材上注册,且执行交互操作的时长较长的对象,将其作为候选推送对象,这些对象在信息平台上的活跃度较高,看到推送信息的概率也较大,进而通过信息平台进行信息推送的效果也较好。
在上述任一实施例的基础上,步骤S201中在将特征数据输入至目标模型之前,如图7所示,可包括:
在步骤S601中,获取样本推送素材及样本推送素材对应的样本推送对象。其中,样本推送对象为在信息平台上在对应的样本推送素材注册且执行交互操作的时长大于第一预设时长的对象。
可以理解的是,为了模型训练的准确性,一般需要获取大量的样本推送素材对应的样本推送对象。
在步骤S602中,获取样本推送对象的第三特征信息,以及样本推送对象所注册的样本推送素材的第四特征信息。
上述步骤S601-S602的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
在步骤S603中,将第三特征信息与第四特征信息进行组合,生成模型训练数据。
需要说明的是,关于将第三特征信息与第四特征信息进行组合,生成模型训练数据的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
可选的,在将第三特征信息与第四特征信息进行组合之前,还可分别对第三特征信息、第四特征信息进行特征分桶、编码以生成特征向量,具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
在步骤S604中,利用模型训练数据对初始模型进行训练,生成目标模型。
本公开的实施例中,可在服务器的存储空间中预先设置初始模型,可利用所有的模型训练数据对初始模型进行训练,以生成目标模型。
举例而言,将模型训练数据输入到初始模型中,初始模型可输出每个样本推送对象对于任一样本推送素材的执行交互操作的时长,结合模型训练数据对应的实际执行交互操作的时长,可对初始模型的参数进行优化,从而实现对初始模型的训练。通过反复输入不同的模型训练数据,可实现初始模型中参数的不断优化,还可获取初始模型的评估指标,在训练结束时可根据评估指标确定目标模型。
由此,该方法能够将样本推送对象的第三特征信息和样本推送素材的第四特征信息进行组合,得到初始模型的模型训练数据,用于对初始模型进行训练,以生成目标模型。
在上述实施例的基础上,步骤S604中利用模型训练数据对初始模型进行训练,生成目标模型,如图8所示,可包括:
在步骤S701中,利用模型训练数据,分别对多个初始模型进行训练,获取多个候选模型。
本公开的实施例中,可在服务器的存储空间中预先设置多个初始模型,其中,初始模型可包括Logistic Regression(逻辑回归)模型、XGBoost(Extreme GradientBoosting,极致梯度提升)模型、Lasso Regression(套索回归)模型等,这里不一一赘述。可利用所有的模型训练数据,分别对多个初始模型进行训练,以生成多个候选模型。
在步骤S702中,获取每个候选模型的模型的性能参数。
本公开的实施例中,性能参数包括但不限于可表征模型的准确性、稳定性和运算速度的参数。
在具体实施中,性能参数可为模型预测正确大于预测错误的概率(以下简称为“第一概率”),例如,可获取候选模型对应的受试者工作特征曲线(Receiver OperatingCharacteristic Curve,简称“ROC曲线”),并获取ROC曲线的AUC(Area Under Curve)的值,用于表征该候选模型对应的第一概率。
在步骤S703中,根据模型的性能参数从多个候选模型中确定出目标模型。
在具体实施中,第一概率越高,说明模型预测正确大于预测错误的概率越高,即模型预测的准确性越好。
可选的,根据模型的性能参数从多个候选模型中确定出目标模型,可从多个候选模型中选择第一概率最大的候选模型,将其作为目标模型。由此,该方法能够从多个候选模型中选取第一概率最大的模型,该模型的预测准确性最好,有利于提高模型预测的准确性。
举例而言,可在服务器的存储空间中预先设置Logistic Regression模型、XGBoost模型、Lasso Regression模型,然后利用所有的模型训练数据,分别对上述模型进行训练,以生成多个候选模型,然后获取多个候选模型分别对应的ROC曲线的AUC值。
根据实际模型训练结果可知,训练后的Lasso Regression模型对应的AUC值最大,表明训练后的Lasso Regression模型的预测准确性最好,可将训练后的Lasso Regression模型作为目标模型,用于获取第一概率。如图9所示,训练后的Lasso Regression模型对应的AUC约为0.61,且还可对该训练后的Lasso Regression模型进行测试,以验证模型训练的效果,测试结果如图10所示,可知测试时该模型对应的AUC约为0.60,表明模型训练成功。
作为另一种可能的实施方式,步骤S201中将特征数据输入至目标模型之后,可获取每个候选推送对象对于任一候选推送素材的反馈信息,反馈信息还可用于表示在将任一候选推送素材通过信息平台发送至候选推送对象所在的终端之后,候选推送对象执行交互操作的时长大于或者等于预设时长阈值的第二概率。
进一步地,步骤S202中根据各候选推送对象的反馈信息,从多个候选推送对象中确定出任一候选推送素材对应的目标推送群体,可包括根据反馈信息,从多个候选推送对象中,选取出第二概率大于或者等于预设概率阈值的候选推送对象,形成任一候选推送素材对应的目标推送群体。
本公开的实施例中,第二概率越高,说明该候选推送对象执行交互操作的时长大于或者等于预设时长阈值的可能性越大,向该候选推送对象推送该候选推送素材的效果越好,信息推送的准确性也越高。其中,预设概率阈值可根据实际情况进行标定,并预先设置在服务器的存储空间中。
可选的,可将正负样本数相等的情况下的第二概率作为预设概率阈值。继续以图9、10为例,若采用训练后的Lasso Regression模型作为目标模型,其对应的正负样本数和第二概率如图11所示,可知当第二概率为0.52时,正负样本数相等,则可将预设概率阈值标定为0.52。
由此,该方法能够根据第二概率和预设概率阈值之间的大小关系,从多个候选推送对象中选取在候选推送素材上执行交互操作时长较长对应的概率较高的对象,有利于提高信息推送的长期效果。
图12是根据一示例性实施例示出的另一种信息推送方法的流程图。
在步骤S801中,获取模型训练数据。
在步骤S802中,获取多个初始模型。
在步骤S803中,确定目标模型。
在步骤S804中,获取特征数据。
在步骤S805中,得到反馈信息。
其中,步骤S801可包括步骤S8011-S8015。
在步骤S8011中,获取特征信息。
在步骤S8012中,缺失值填充。
在步骤S8013中,特征分桶。
在步骤S8014中,编码生成特征向量。
在步骤S8015中,组合。
上述步骤S801-S805、S8011-S8015的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
图13是根据一示例性实施例示出的一种信息推送装置框图。参照图13,该装置900包括第一获取模块91、第二获取模块92、组合模块93、第三获取模块94。
第一获取模块91被配置为执行获取候选推送对象及各所述候选推送对象的第一特征信息,其中,所述候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象。
第二获取模块92被配置为执行获取候选推送素材,并获取每个所述候选推送素材的第二特征信息。
组合模块93被配置为执行针对任一候选推送素材,将每个所述第一特征信息分别与所述任一候选推送素材的第二特征信息进行组合,生成所述任一候选推送素材的特征数据。
第三获取模块94被配置为执行根据所述任一候选推送素材的特征数据,从多个所述候选推送对象中获取所述任一候选推送素材对应的目标推送群体。
在本公开的一个实施例中,所述第三获取模块94包括反馈单元,被配置为执行将所述特征数据输入至目标模型,获取每个所述候选推送对象对于所述任一候选推送素材的反馈信息,所述反馈信息用于表示在将所述任一候选推送素材通过所述信息平台发送至所述候选推送对象所在的终端之后,所述候选推送对象执行交互操作的时长;以及第一确定单元,被配置为执行根据各所述候选推送对象的反馈信息,从多个所述候选推送对象中确定出所述任一候选推送素材对应的所述目标推送群体。
在本公开的一个实施例中,所述第一获取模块91包括第一获取单元,被配置为执行获取在所述信息平台上已经被推送的已推送素材;第二获取单元,被配置为执行获取所述已推送素材的注册信息,其中,所述注册信息中携带在所述已推送素材上进行注册的对象的标识信息;第三获取单元,被配置为执行根据所述标识信息,获取所述进行注册的对象在所注册的所述已推送素材上执行交互操作的时长;以及选取单元,被配置为执行选取在所注册的所述已推送素材上执行交互操作的时长大于所述第一预设时长的所述进行注册的对象作为所述候选推送对象。
在本公开的一个实施例中,参照图14,所述装置900还包括:模型生成模块95,所述模型生成模块95包括第四获取单元,被配置为执行获取样本推送素材及所述样本推送素材对应的样本推送对象;其中,所述样本推送对象为在所述信息平台上在对应的所述样本推送素材注册且执行交互操作的时长大于所述第一预设时长的对象;第五获取单元,被配置为执行获取所述样本推送对象的第三特征信息,以及所述样本推送对象所注册的所述样本推送素材的第四特征信息;数据生成单元,被配置为执行将所述第三特征信息与所述第四特征信息进行组合,生成模型训练数据;以及训练单元,被配置为执行利用所述模型训练数据对初始模型进行训练,生成所述目标模型。
在本公开的一个实施例中,所述训练单元包括训练子单元,被配置为执行利用所述模型训练数据,分别对多个初始模型进行训练,获取多个候选模型;第六获取子单元,被配置为执行获取每个所述候选模型的模型的性能参数;以及第二确定子单元,被配置为执行根据所述模型的性能参数从所述多个候选模型中确定出所述目标模型。
在本公开的一个实施例中,所述组合模块93包括特征分桶单元,被配置为执行对每个推送对象和每个推送素材的特征信息进行特征分桶;向量生成单元,被配置为执行对特征分桶结果进行编码,生成每个所述特征信息的特征向量;以及组合单元,被配置为执行将所述推送对象的特征向量与所述推送素材的特征向量进行组合。
在本公开的一个实施例中,所述特征分桶单元包括特征分桶子单元,被配置为执行针对所述特征信息中的任一特征项,获取不同主体下所述特征项的取值,并根据所述特征项的取值,对所述特征项进行特征分桶,其中,所述主体为任意一个所述推送对象或者任意一个所述推送素材;
所述向量生成单元包括编码子单元,被配置为执行根据所述主体的所述特征项的取值和所述特征项的分桶结果,对所述主体的所述特征项进行编码以生成编码信息;以及向量生成子单元,被配置为执行利用所述主体所有的所述特征项的编码信息,生成所述主体的所述特征信息的特征向量。
在本公开的一个实施例中,所述编码子单元被配置为执行识别根据所述主体的所述特征项的取值,识别所述主体所属的目标分桶;以及配置所述目标分桶的编码值为有效编码值,剩余分桶的编码值为无效编码值,以生成所述主体的编码信息。
在本公开的一个实施例中,所述组合模块93还包括缺失填充单元,被配置为执行在进行特征分桶之前,识别所述特征信息中取值为空的特征项,对所述取值为空的特性项进行缺失值填充。
在本公开的一个实施例中,所述第一确定单元包括选取子单元,被配置为执行根据所述反馈信息,从多个所述候选推送对象中,选取出执行交互操作的时长大于或者等于预设时长阈值的所述候选推送对象,形成所述任一候选推送素材对应的所述目标推送群体;或者,排序子单元,被配置为执行根据所述反馈信息,对所述候选推送对象执行交互操作的时长进行排序,从多个所述候选推送对象中,按序筛选出所述任一候选推送素材对应的所述目标推送群体。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开的实施例提供的信息推送装置,能够将候选推送对象的第一特征信息和候选推送素材的第二特征信息进行组合,得到候选推送素材的特征数据,并根据候选推送素材的特征数据确定候选推送素材对应的目标推送群体,即可根据对象特征和素材特征从多个候选推送对象中确定与候选推送素材相匹配的目标推送群体,使得信息推送更贴近对象特征和素材特征,提高了信息推送的准确性。
图15是根据一示例性实施例示出的一种用于信息推送的服务器1000的框图。
如图15所示,上述服务器1000包括:
存储器110及处理器120,连接不同组件(包括存储器210和处理器220)的总线130,存储器110存储有计算机程序,当处理器120执行所述程序时实现本公开实施例所述的信息推送方法。
总线130表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器1000典型地包括多种电子设备可读介质。这些介质可以是任何能够被服务器1000访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器110还可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)140和/或高速缓存存储器150。服务器1000可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统160可以用于读写不可移动的、非易失性磁介质(图15未显示,通常称为“硬盘驱动器”)。尽管图15中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线130相连。存储器110可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块170的程序/实用工具180,可以存储在例如存储器110中,这样的程序模块170包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块170通常执行本公开所描述的实施例中的功能和/或方法。
服务器1000也可以与一个或多个外部设备190(例如键盘、指向设备、显示器191等)通信,还可与一个或者多个使得用户能与该服务器1000交互的设备通信,和/或与使得该服务器1000能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口192进行。并且,服务器1000还可以通过网络适配器193与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器193通过总线130与服务器1000的其它模块通信。应当明白,尽管图中未示出,可以结合服务器1000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器120通过运行存储在存储器110中的程序,从而执行各种功能应用以及数据处理。
需要说明的是,本实施例的服务器的实施过程和技术原理参见前述对本公开实施例的信息推送方法的解释说明,此处不再赘述。
本公开实施例提供的服务器,可以执行如前所述的信息推送方法,能够将候选推送对象的第一特征信息和候选推送素材的第二特征信息进行组合,得到候选推送素材的特征数据,并根据候选推送素材的特征数据确定候选推送素材对应的目标推送群体,即可根据对象特征和素材特征从多个候选推送对象中确定与候选推送素材相匹配的目标推送群体,使得信息推送更贴近对象特征和素材特征,提高了信息推送的准确性。
为了实现上述实施例,本公开还提出一种存储介质。
其中,该存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如前所述的信息推送方法。
为了实现上述实施例,本公开还提供一种计算机程序产品,该计算机程序由服务器的处理器执行时,使得服务器能够执行如前所述的信息推送方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (18)

1.一种信息推送方法,其特征在于,包括:
获取候选推送对象及各所述候选推送对象的第一特征信息,其中,所述候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象;
获取候选推送素材,并获取每个所述候选推送素材的第二特征信息;
针对任一候选推送素材,将每个所述第一特征信息分别与所述任一候选推送素材的第二特征信息进行组合,生成所述任一候选推送素材的特征数据;
根据所述任一候选推送素材的特征数据,从多个所述候选推送对象中获取所述任一候选推送素材对应的目标推送群体;
其中,所述第一特征信息包括静态特征、社交特征、行为特征、兴趣特征;
其中,将推送对象与推送素材的特征信息进行组合,包括:
对每个推送对象和每个推送素材的特征信息进行特征分桶;
对特征分桶结果进行编码,生成每个所述特征信息的特征向量;
将所述推送对象的特征向量与所述推送素材的特征向量进行组合;
其中,在进行特征分桶之前,所述方法还包括:
识别所述特征信息中取值为空的特征项,对所述取值为空的特性项进行缺失值填充。
2.根据权利要求1所述的信息推送方法,其特征在于,所述根据所述任一候选推送素材的特征数据,从多个所述候选推送对象中获取所述任一候选推送素材对应的目标推送群体,包括:
将所述特征数据输入至目标模型,获取每个所述候选推送对象对于所述任一候选推送素材的反馈信息,所述反馈信息用于表示在将所述任一候选推送素材通过所述信息平台发送至所述候选推送对象所在的终端之后,所述候选推送对象执行交互操作的时长;以及
根据各所述候选推送对象的反馈信息,从多个所述候选推送对象中确定出所述任一候选推送素材对应的所述目标推送群体。
3.根据权利要求2所述的信息推送方法,其特征在于,所述获取候选推送对象,包括:
获取在所述信息平台上已经被推送的已推送素材;
获取所述已推送素材的注册信息,其中,所述注册信息中携带在所述已推送素材上进行注册的对象的标识信息;
根据所述标识信息,获取所述进行注册的对象在所注册的所述已推送素材上执行交互操作的时长;以及
选取在所注册的所述已推送素材上执行交互操作的时长大于所述第一预设时长的所述进行注册的对象作为所述候选推送对象。
4.根据权利要求2所述的信息推送方法,其特征在于,在将所述特征数据输入至目标模型之前,所述方法还包括:
获取样本推送素材及所述样本推送素材对应的样本推送对象;其中,所述样本推送对象为在所述信息平台上在对应的所述样本推送素材注册且执行交互操作的时长大于所述第一预设时长的对象;
获取所述样本推送对象的第三特征信息,以及所述样本推送对象所注册的所述样本推送素材的第四特征信息;
将所述第三特征信息与所述第四特征信息进行组合,生成模型训练数据;
利用所述模型训练数据对初始模型进行训练,生成所述目标模型。
5.根据权利要求4所述的信息推送方法,其特征在于,所述利用所述模型训练数据对初始模型进行训练,生成所述目标模型,包括:
利用所述模型训练数据,分别对多个初始模型进行训练,获取多个候选模型;
获取每个所述候选模型的模型的性能参数;以及
根据所述模型的性能参数从所述多个候选模型中确定出所述目标模型。
6.根据权利要求1所述的信息推送方法,其特征在于,所述对每个推送对象和每个推送素材的特征信息进行特征分桶,包括:
针对所述特征信息中的任一特征项,获取不同主体下所述特征项的取值,并根据所述特征项的取值,对所述特征项进行特征分桶,其中,所述主体为任意一个所述推送对象或者任意一个所述推送素材;
所述对特征分桶结果进行编码,生成每个所述特征信息的特征向量,包括:
根据所述主体的所述特征项的取值和所述特征项的分桶结果,对所述主体的所述特征项进行编码以生成编码信息;以及
利用所述主体所有的所述特征项的编码信息,生成所述主体的所述特征信息的特征向量。
7.根据权利要求6所述的信息推送方法,其特征在于,所述根据所述主体的所述特征项的取值和所述特征项的分桶结果,对所述主体的所述特征项进行编码,包括:
根据所述主体的所述特征项的取值,识别所述主体所属的目标分桶;
配置所述目标分桶的编码值为有效编码值,剩余分桶的编码值为无效编码值,以生成所述主体的编码信息。
8.根据权利要求2-5任一项所述的信息推送方法,其特征在于,所述根据各所述候选推送对象的反馈信息,从多个所述候选推送对象中确定出所述任一候选推送素材对应的所述目标推送群体,包括:
根据所述反馈信息,从多个所述候选推送对象中,选取出执行交互操作的时长大于或者等于预设时长阈值的所述候选推送对象,形成所述任一候选推送素材对应的所述目标推送群体;或者,
根据所述反馈信息,对所述候选推送对象执行交互操作的时长进行排序,从多个所述候选推送对象中,按序筛选出所述任一候选推送素材对应的所述目标推送群体。
9.一种信息推送装置,其特征在于,包括:
第一获取模块,被配置为执行获取候选推送对象及各所述候选推送对象的第一特征信息,其中,所述候选推送对象为在信息平台上执行交互操作的时长大于第一预设时长的对象;
第二获取模块,被配置为执行获取候选推送素材,并获取每个所述候选推送素材的第二特征信息;
组合模块,被配置为执行针对任一候选推送素材,将每个所述第一特征信息分别与所述任一候选推送素材的第二特征信息进行组合,生成所述任一候选推送素材的特征数据;以及
第三获取模块,被配置为执行根据所述任一候选推送素材的特征数据,从多个所述候选推送对象中获取所述任一候选推送素材对应的目标推送群体;
其中,所述第一特征信息包括静态特征、社交特征、行为特征、兴趣特征;
所述组合模块,包括:
特征分桶单元,被配置为执行对每个推送对象和每个推送素材的特征信息进行特征分桶;
向量生成单元,被配置为执行对特征分桶结果进行编码,生成每个所述特征信息的特征向量;以及
组合单元,被配置为执行将所述推送对象的特征向量与所述推送素材的特征向量进行组合;
所述组合模块,还包括:
缺失填充单元,被配置为执行在进行特征分桶之前,识别所述特征信息中取值为空的特征项,对所述取值为空的特性项进行缺失值填充。
10.根据权利要求9所述的信息推送装置,其特征在于,所述第三获取模块,包括:
反馈单元,被配置为执行将所述特征数据输入至目标模型,获取每个所述候选推送对象对于所述任一候选推送素材的反馈信息,所述反馈信息用于表示在将所述任一候选推送素材通过所述信息平台发送至所述候选推送对象所在的终端之后,所述候选推送对象执行交互操作的时长;以及
第一确定单元,被配置为执行根据各所述候选推送对象的反馈信息,从多个所述候选推送对象中确定出所述任一候选推送素材对应的所述目标推送群体。
11.根据权利要求10所述的信息推送装置,其特征在于,所述第一获取模块,包括:
第一获取单元,被配置为执行获取在所述信息平台上已经被推送的已推送素材;
第二获取单元,被配置为执行获取所述已推送素材的注册信息,其中,所述注册信息中携带在所述已推送素材上进行注册的对象的标识信息;
第三获取单元,被配置为执行根据所述标识信息,获取所述进行注册的对象在所注册的所述已推送素材上执行交互操作的时长;以及
选取单元,被配置为执行选取在所注册的所述已推送素材上执行交互操作的时长大于所述第一预设时长的所述进行注册的对象作为所述候选推送对象。
12.根据权利要求10所述的信息推送装置,其特征在于,所述装置还包括:模型生成模块,所述模型生成模块,包括:
第四获取单元,被配置为执行获取样本推送素材及所述样本推送素材对应的样本推送对象;其中,所述样本推送对象为在所述信息平台上在对应的所述样本推送素材注册且执行交互操作的时长大于所述第一预设时长的对象;
第五获取单元,被配置为执行获取所述样本推送对象的第三特征信息,以及所述样本推送对象所注册的所述样本推送素材的第四特征信息;
数据生成单元,被配置为执行将所述第三特征信息与所述第四特征信息进行组合,生成模型训练数据;以及
训练单元,被配置为执行利用所述模型训练数据对初始模型进行训练,生成所述目标模型。
13.根据权利要求12所述的信息推送装置,其特征在于,所述训练单元,包括:
训练子单元,被配置为执行利用所述模型训练数据,分别对多个初始模型进行训练,获取多个候选模型;
第六获取子单元,被配置为执行获取每个所述候选模型的模型的性能参数;以及
第二确定子单元,被配置为执行根据所述模型的性能参数从所述多个候选模型中确定出所述目标模型。
14.根据权利要求9所述的信息推送装置,其特征在于,所述特征分桶单元,包括:
特征分桶子单元,被配置为执行针对所述特征信息中的任一特征项,获取不同主体下所述特征项的取值,并根据所述特征项的取值,对所述特征项进行特征分桶,其中,所述主体为任意一个所述推送对象或者任意一个所述推送素材;
所述向量生成单元,包括:
编码子单元,被配置为执行根据所述主体的所述特征项的取值和所述特征项的分桶结果,对所述主体的所述特征项进行编码以生成编码信息;以及
向量生成子单元,被配置为执行利用所述主体所有的所述特征项的编码信息,生成所述主体的所述特征信息的特征向量。
15.根据权利要求14所述的信息推送装置,其特征在于,所述编码子单元,被配置为执行:
识别根据所述主体的所述特征项的取值,识别所述主体所属的目标分桶;以及
配置所述目标分桶的编码值为有效编码值,剩余分桶的编码值为无效编码值,以生成所述主体的编码信息。
16.根据权利要求10-13任一项所述的信息推送装置,其特征在于,所述第一确定单元,包括:
选取子单元,被配置为执行根据所述反馈信息,从多个所述候选推送对象中,选取出执行交互操作的时长大于或者等于预设时长阈值的所述候选推送对象,形成所述任一候选推送素材对应的所述目标推送群体;或者,
排序子单元,被配置为执行根据所述反馈信息,对所述候选推送对象执行交互操作的时长进行排序,从多个所述候选推送对象中,按序筛选出所述任一候选推送素材对应的所述目标推送群体。
17.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至8中任一项所述的信息推送方法。
18.一种存储介质,当所述存储介质中的指令服务器的处理器执行时,使得服务器能够执行如权利要求1至8中任一项所述的信息推送方法。
CN202010758692.1A 2020-07-31 2020-07-31 信息推送方法、装置及服务器 Active CN112035736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010758692.1A CN112035736B (zh) 2020-07-31 2020-07-31 信息推送方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010758692.1A CN112035736B (zh) 2020-07-31 2020-07-31 信息推送方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN112035736A CN112035736A (zh) 2020-12-04
CN112035736B true CN112035736B (zh) 2023-12-26

Family

ID=73583684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010758692.1A Active CN112035736B (zh) 2020-07-31 2020-07-31 信息推送方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN112035736B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114638629A (zh) * 2020-12-15 2022-06-17 支付宝(杭州)信息技术有限公司 信息推送的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007300611A (ja) * 2000-08-14 2007-11-15 Vesuvius Inc セルラー通信ネットワークの通信システム
CN108595492A (zh) * 2018-03-15 2018-09-28 腾讯科技(深圳)有限公司 内容的推送方法和装置、存储介质、电子装置
CN109522483A (zh) * 2018-11-14 2019-03-26 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN110162701A (zh) * 2019-05-10 2019-08-23 腾讯科技(深圳)有限公司 内容推送方法、装置、计算机设备和存储介质
CN110517082A (zh) * 2019-08-29 2019-11-29 深圳前海微众银行股份有限公司 广告推送方法、装置、设备及计算机可读存储介质
CN110781391A (zh) * 2019-10-22 2020-02-11 腾讯科技(深圳)有限公司 一种信息推荐方法、装置、设备及存储介质
CN111339434A (zh) * 2018-12-03 2020-06-26 阿里巴巴集团控股有限公司 信息推荐方法、装置、电子设备及计算机存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007300611A (ja) * 2000-08-14 2007-11-15 Vesuvius Inc セルラー通信ネットワークの通信システム
CN108595492A (zh) * 2018-03-15 2018-09-28 腾讯科技(深圳)有限公司 内容的推送方法和装置、存储介质、电子装置
CN109522483A (zh) * 2018-11-14 2019-03-26 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN111339434A (zh) * 2018-12-03 2020-06-26 阿里巴巴集团控股有限公司 信息推荐方法、装置、电子设备及计算机存储介质
CN110162701A (zh) * 2019-05-10 2019-08-23 腾讯科技(深圳)有限公司 内容推送方法、装置、计算机设备和存储介质
CN110517082A (zh) * 2019-08-29 2019-11-29 深圳前海微众银行股份有限公司 广告推送方法、装置、设备及计算机可读存储介质
CN110781391A (zh) * 2019-10-22 2020-02-11 腾讯科技(深圳)有限公司 一种信息推荐方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112035736A (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
WO2019242331A1 (zh) 用户行为预测方法及装置、行为预测模型训练方法及装置
CN108207119B (zh) 对损坏网络连接的基于机器学习的识别
CN110070140B (zh) 基于多类别信息的用户相似性确定方法及装置
CN108932646B (zh) 基于运营商的用户标签验证方法、装置和电子设备
CN105894028B (zh) 用户识别方法和装置
CN108304935A (zh) 机器学习模型训练方法、装置和计算机设备
JP2018077821A (ja) ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置
CN112070310A (zh) 基于人工智能的流失用户预测方法、装置及电子设备
CN112836128A (zh) 信息推荐方法、装置、设备和存储介质
CN112035736B (zh) 信息推送方法、装置及服务器
CN113641835B (zh) 多媒体资源推荐方法、装置、电子设备及介质
CN113256335B (zh) 数据筛选方法、多媒体数据的投放效果预测方法及装置
CN113190444B (zh) 一种测试方法、装置及存储介质
CN108921138B (zh) 用于生成信息的方法和装置
CN108665318B (zh) 有效用户标签筛选方法、装置、存储介质和计算机设备
CN112395499B (zh) 信息推荐方法及装置、电子设备、存储介质
CN113782093A (zh) 一种基因表达填充数据的获取方法及装置、存储介质
CN112465565A (zh) 一种基于机器学习的用户画像预测的方法及装置
CN114549849A (zh) 图像识别方法、装置、计算机设备和存储介质
CN113836390A (zh) 资源推荐方法、装置、计算机设备及存储介质
CN106815285A (zh) 基于视频网站的视频推荐的方法、装置及电子设备
CN114491093B (zh) 多媒体资源推荐、对象表征网络的生成方法及装置
CN110717817A (zh) 贷前审核方法及装置、电子设备和计算机可读存储介质
CN110035126A (zh) 一种文件处理方法、装置、计算设备及存储介质
CN110297989B (zh) 异常检测的测试方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant