CN113204577A - 信息推送方法、装置、电子设备和计算机可读介质 - Google Patents

信息推送方法、装置、电子设备和计算机可读介质 Download PDF

Info

Publication number
CN113204577A
CN113204577A CN202110406241.6A CN202110406241A CN113204577A CN 113204577 A CN113204577 A CN 113204577A CN 202110406241 A CN202110406241 A CN 202110406241A CN 113204577 A CN113204577 A CN 113204577A
Authority
CN
China
Prior art keywords
information
user
prediction
target user
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110406241.6A
Other languages
English (en)
Inventor
邓勇
王少帅
王厅玮
白冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110406241.6A priority Critical patent/CN113204577A/zh
Publication of CN113204577A publication Critical patent/CN113204577A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例公开了信息推送方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取目标用户信息集合;确定该目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合;基于该目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合;基于该第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,其中,预测结果用于表征目标用户信息对应的用户价值度;根据该第二预测结果集合,向该目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。该实施方式提高了向用户推送的信息和用户的匹配度,减少了非必要推送信息的传输,减少了网络传输资源的浪费。

Description

信息推送方法、装置、电子设备和计算机可读介质
技术领域
本公开的实施例涉及计算机技术领域,具体涉及信息推送方法、装置、电子设备和计算机可读介质。
背景技术
客户生命周期价值(CLV,Customer Lifetime Value)是用来衡量在一段时间段,用户价值度的一个指标。用户价值度可以通过设定时间段内用户的消费水平或资源消耗量等指标来衡量。通过确定用户的CLV,从而可以向用户推送与用户匹配的推送信息。目前,在预测用户的CLV时,通常采用方式为:通过传统的、单一的预测模型进行CLV预测。
然而,当采用上述方式时,经常会存在如下技术问题:
传统的预测模型对于不同的数据集的预测能力不尽相同,从而,导致难以准确地预测用户的CLV,进而,使得无法向用户推送与用户匹配的信息,最终,导致大量的网络传输资源的浪费。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了信息推送方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种信息推送方法,该方法包括:获取目标用户信息集合;确定上述目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合;基于上述目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合;基于上述第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,其中,预测结果用于表征目标用户信息对应的用户价值度;根据上述第二预测结果集合,向上述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。
可选地,上述根据上述第二预测结果集合,向上述目标用户信息集合中的目标用户信息对应的用户推送推荐信息,包括:根据上述第二预测结果集合,从上述目标用户信息集合筛选出满足筛选条件的目标用户信息作为候选用户信息,得到候选用户信息集合;向上述候选用户信息集合中的每个候选用户信息对应的目标终端推送推荐信息,其中,上述目标终端为登录有上述候选用户信息对应的用户的用户账号的终端。
可选地,上述向上述候选用户信息集合中的每个候选用户信息对应的目标终端推送推荐信息,包括:响应于确定上述目标终端开启信息通知模式,向上述目标终端推送推荐信息。
可选地,上述融合模型通过以下步骤训练:构建训练样本数据集合和全量用户数据集合,其中,上述训练样本数据集合包括:子预测模型训练样本集合和融合模型训练样本集合;基于上述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型;对上述全量用户数据集合进行分层处理,以生成用户分层信息集合;基于上述融合模型训练样本集合、上述用户分层信息集合和上述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型。
可选地,上述构建训练样本数据集合,包括:获取用户行为信息集合;对上述用户行为信息集合分别进行正采样处理和负采样处理,以生成正采样样本集合和负采样样本集合,其中,上述正采样样本集合和负采样样本集合中的样本量成预设比例;基于上述正采样样本集合和负采样样本集合中的每个样本,构建用户特征信息,以生成训练样本数据,得到上述训练样本数据集合。
可选地,上述基于上述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型,包括:确定上述子预测模型训练样本集合中每个子预测模型训练样本的特征信息,得到至少一个特征信息集合;对于上述至少一个特征信息集合中的特征信息集合,对上述多个初始子预测模型中对应该特征信息集合的初始子预测模型进行训练,以生成训练完成的子预测模型。
可选地,上述对上述全量用户数据集合进行分层处理,以生成用户分层信息集合,包括:根据预设的目标类别数目,对上述全量用户数据集合进行聚类处理,以生成聚类信息组集合;根据上述聚类信息组集合中各个聚类信息组的类中心的位置和类别覆盖范围,对上述聚类信息组集合中的聚类信息进行聚类处理,以生成上述用户分层信息集合。
可选地,上述基于上述融合模型训练样本集合、上述用户分层信息集合和上述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型,包括:将上述融合模型训练样本集合输入上述多个训练完成的子预测模型中的每个训练完成的子预测模型,以生成预测结果,得到预测结果集合;基于上述预测结果集合和上述用户分层信息集合,对上述初始融合模型进行融合模型训练,以生成上述融合模型。
可选地,上述子预测模型训练样本集合和上述融合模型训练样本集合通过以下步骤生成:对上述训练样本数据集合进行随机采样,以生成上述子预测模型训练样本集合和上述融合模型训练样本集合。
第二方面,本公开的一些实施例提供了一种信息推送装置,装置包括:获取单元,被配置成获取目标用户信息集合;确定单元,被配置成确定上述目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合;第一生成单元,被配置成基于上述目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合;第二生成单元,被配置成基于上述第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,其中,预测结果用于表征目标用户信息对应的用户价值度;推送单元,被配置成根据上述第二预测结果集合,向上述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。
可选地,上述推送单元被进一步配置成:根据上述第二预测结果集合,从上述目标用户信息集合筛选出满足筛选条件的目标用户信息作为候选用户信息,得到候选用户信息集合;向上述候选用户信息集合中的每个候选用户信息对应的目标终端推送推荐信息,其中,上述目标终端为登录有上述候选用户信息对应的用户的用户账号的终端。
可选地,上述推送单元被进一步配置成:响应于确定上述目标终端开启信息通知模式,向上述目标终端推送推荐信息。
可选地,上述融合模型通过以下步骤训练:构建训练样本数据集合和全量用户数据集合,其中,上述训练样本数据集合包括:子预测模型训练样本集合和融合模型训练样本集合;基于上述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型;对上述全量用户数据集合进行分层处理,以生成用户分层信息集合;基于上述融合模型训练样本集合、上述用户分层信息集合和上述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型。
可选地,上述构建训练样本数据集合,包括:获取用户行为信息集合;对上述用户行为信息集合分别进行正采样处理和负采样处理,以生成正采样样本集合和负采样样本集合,其中,上述正采样样本集合和负采样样本集合中的样本量成预设比例;基于上述正采样样本集合和负采样样本集合中的每个样本,构建用户特征信息,以生成训练样本数据,得到上述训练样本数据集合。
可选地,上述基于上述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型,包括:确定上述子预测模型训练样本集合中每个子预测模型训练样本的特征信息,得到至少一个特征信息集合;对于上述至少一个特征信息集合中的特征信息集合,对上述多个初始子预测模型中对应该特征信息集合的初始子预测模型进行训练,以生成训练完成的子预测模型。
可选地,上述对上述全量用户数据集合进行分层处理,以生成用户分层信息集合,包括:根据预设的目标类别数目,对上述全量用户数据集合进行聚类处理,以生成聚类信息组集合;根据上述聚类信息组集合中各个聚类信息组的类中心的位置和类别覆盖范围,对上述聚类信息组集合中的聚类信息进行聚类处理,以生成上述用户分层信息集合。
可选地,上述基于上述融合模型训练样本集合、上述用户分层信息集合和上述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型,包括:将上述融合模型训练样本集合输入上述多个训练完成的子预测模型中的每个训练完成的子预测模型,以生成预测结果,得到预测结果集合;基于上述预测结果集合和上述用户分层信息集合,对上述初始融合模型进行融合模型训练,以生成上述融合模型。
可选地,上述子预测模型训练样本集合和上述融合模型训练样本集合通过以下步骤生成:对上述训练样本数据集合进行随机采样,以生成上述子预测模型训练样本集合和上述融合模型训练样本集合。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的信息推送方法,提高了用户推送的信息与用户的匹配程度。同时减少了网络传输资源的浪费。具体来说,造成网络传输资源浪费的原因在于:传统的预测模型对于不同的数据集的预测能力不同,从而,导致难以准确地预测用户的CLV。基于此,本公开的一些实施例的信息推送方法,首先,获取目标用户信息集合。其次,确定上述目标用户信息集合中每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合。实际情况中,目标用户信息中往往包含较多目标用户对应的信息,例如,爱好,性别,身体质量指数,身高,体重和收入等信息。此类信息中的大部分特征信息对于预测用户的CLV作用较小。并且,过多的特征信息可能会导致预测模型训练时长增加。而且,可能也不会提高得到的预测模型的预测精度。其次,基于上述目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合。实际情况中,单一的、传统的预测模型对于不同数据集的预测能力不尽相同,因此,需要根据相同的数据集,通过多个不同的预测模型进行预测,依次根据得到的第一预测结果集合,确定多个子预测模型的预测能力。此外,基于上述第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合。实际情况中,通过融合模型,往往能够提高最终的预测结果的准确度,即提高用户的CLV预测的准确度。此外,根据长尾效应理论和二八定律,用户往往出现分层情况,即不同层级的用户往往具有不同的行为习惯。相同层级的用户往往具有相同的行为习惯,由于分层情况作为一种较为重要的特征,会影响用户分类以及CLV的准确度。因此,通过用户分层信息集合,可以进一步提升融合模型生成的第二预测结果的准确度。最后,根据上述第二预测结果,向上述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。通过此种方式能够大大的提高向用户推送的信息和用户的匹配度。从而,减少了非必要推送信息的传输,进而,减少了网络传输资源的浪费。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是本公开的一些实施例的信息推送方法的一个应用场景的示意图;
图2是根据本公开的信息推送方法的一些实施例的流程图;
图3是授权提示框的是示意图;
图4是根据本公开的信息推送方法的另一些实施例的流程图;
图5是第一子预测模型和第二子预测模型的网络结构的示意图;
图6是聚类处理的结果的示意图;
图7是聚类处理的结果的另一个示意图;
图8是根据本公开的信息推送装置的一些实施例的结构示意图;
图9是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
图1是本公开的一些实施例的信息推送方法的一个应用场景的示意图。
在图1的应用场景中,首先,计算设备101可以获取目标用户信息集合102(例如,目标用户信息可以是[用户编号:1004,用户性别:男,用户姓名:朱XX,用户年龄:34岁,用户身高:152厘米,用户体重:200斤,用户身体质量指数:43.3,用户家庭住址:XX市XX街道XX小区XX栋XX层XX户,用户职业:音效师,用户学历:硕士,用户收入:2万/月,购买次数:20次,浏览次数:32次,购买金额:5000元,点击次数:54次,收藏次数:0次,添加到购物车次数:20次,搜索次数:23次]);其次,计算设备101可以确定上述目标用户信息集合102中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合103(例如,目标用户特征信息可以是[用户编号:1004,用户性别:男,用户年龄:34岁,用户体重:200斤,用户职业:音效师,用户学历:硕士,用户收入:2万/月,购买次数:20次,浏览次数:32次,购买金额:5000元,点击次数:54次,收藏次数:0次,添加到购物车次数:20次,搜索次数:23次]);此外,计算设备101可以基于上述目标用户特征信息集合103和多个训练完成的子预测模型104,生成第一预测结果集合105(例如,第一预测结果可以是[用户编号:1004,用户价值度:0.4,置信度数值:0.98]);进一步,计算设备101可以基于上述第一预测结果集合105、用户分层信息集合106和融合模型107,生成第二预测结果集合108(例如,第二预测结果可以是[用户编号:1004,用户价值度:0.396,置信度数值:0.98]),其中,预测结果用于表征目标用户信息对应的用户价值度;最后,计算设备101可以根据上述第二预测结果集合108,向上述目标用户信息集合102中的目标用户信息对应的目标终端推送推荐信息。
需要说明的是,上述计算设备101可以是硬件,也可以是软件。当计算设备为硬件时,可以实现成多个服务器或终端设备组成的分布式集群,也可以实现成单个服务器或单个终端设备。当计算设备体现为软件时,可以安装在上述所列举的硬件设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的计算设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的计算设备。
继续参考图2,示出了根据本公开的信息推送方法的一些实施例的流程200。该信息推送方法,包括以下步骤:
步骤201,获取目标用户信息集合。
在一些实施例中,信息推送方法的执行主体(例如图1所示的计算设备101)可以对于上述目标用户信息集合中的每个目标用户信息,响应于接收到目标授权信号,通过有线连接或无线连接的方式获取上述目标用户信息。其中,上述目标用户信息集合中的目标用户信息可以包括:目标用户的身份信息和行为信息。上述行为信息可以表征目标用户在一段时间内的价值操作行为。上述目标授权信号可以是上述目标用户信息对应的目标用户,对目标控件执行目标操作产生的信号。上述目标控件可以包含于授权提示框中。上述授权提示框可以在目标终端设备显示。上述目标终端设备可以是登录上述用户对应账号的终端设备。例如,上述终端设备可以是“手机”,也可以是“电脑”。例如,上述目标操作可以是“点击操作”,也可以是“滑动操作”。上述目标控件可以是“确认按钮”。
作为示例,上述授权提示框可以如图3所示。上述授权提示框可以包括:提示信息显示部分301和控件302。其中,上述提示信息显示部分301可以用于显示提示信息。上述提示信息可以是“是否允许获取目标用户信息”。上述控件302可以是“确认按钮”,也可以是“取消按钮”。
作为又一示例,上述价值操作行为可以是收藏操作行为。上述价值操作行为也可以是购买操作行为。
作为再一示例,上述目标用户的身份信息可以包括:用户编号,用户性别,用户姓名,用户年龄,用户身高,用户体重,用户身体质量指数,用户家庭住址,用户职业,用户学历和用户收入等。上述目标用户的行为信息可以包括:购买次数,浏览次数,购买金额,点击次数,收藏次数,添加到购物车次数和搜索次数等。
步骤202,确定目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合。
在一些实施例中,上述执行主体可以确定目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合。其中,上述执行主体可以根据业务场景,从上述目标用户信息集合中的每个目标用户信息包括的身份信息和行为信息中选择特征信息,以生成目标用户特征信息,得到上述目标用户特征信息集合。
作为示例,上述业务场景可以是“对目标用户在未来一段时间内的购买金额的预测”。因此,可以从目标用户信息中选择,用户性别,用户年龄,用户职业,用户学历,用户收入,购买次数,浏览次数,购买金额,浏览次数,点击次数,添加到购物车次数和搜索次数,以生成用户特征信息。例如,用户特征信息可以是:[用户性别:“男”,用户年龄:24岁,用户职业:前端开发工程师,用户学历:硕士,用户收入:3万/月,购买次数:12次,浏览次数:223次,购买金额:3000元,点击次数:200次,添加到购物车次数:15次,搜索次数:30次]。
步骤203,基于目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合。
在一些实施例中,上述执行主体基于上述目标用户特征信息集合和上述多个训练完成的子预测模型,生成上述第一预测结果集合,可以包括以下步骤:
第一步,对上述目标用户特征信息集合中的每个目标用户特征信息进行编码处理,以生成编码处理后的目标用户特征信息,得到编码处理后的目标用户特征信息集合。
其中,上述编码处理可以是独热编码处理。
第二步,将上述编码处理后的目标用户特征信息集合输入上述多个训练完成的子预测模型中的每个子预测模型中,以生成第一预测结果,得到上述第一预测结果集合。
其中,上述子预测模型可以是但不限于以下任意一项:CNN(ConvolutionalNeural Networks,卷积神经网络)模型,RNN(Recurrent Neural Networks,循环神经网络)模型,XGBoost模型和RF(Random Forest,随机森林)模型。第一预测结果可以表征目标用户对应的用户价值度。上述用户价值度可以是客户生命周期价值(CLV,Customer LifecycleValue)。
作为示例,第一预测结果可以是[用户编号:1002,用户价值度:0.2,置信度数值:0.98]。其中,“0.2”可以表征目标用户的价值度。“0.98”可以表征置信度数值。
步骤204,基于第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合。
在一些实施例中,上述执行主体基于第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,可以包括以下步骤:
第一步,将上述第一预测结果集合中每个第一预测结果和对应的用户分层信息进行拼接,以生成候选信息,得到候选信息集合。
其中,上述用户分层信息可以表征目标用户的层级。上述用户分层信息可以包括:用户编号和用户层级值。
作为示例,上述用户层级信息可以是[用户编号:1002,用户层级值:1]。其中,“1”可以表示用户编号为“1002”的目标用户的层级为第一等级。上述用户层级还可以是“2”,也可以是“3”。“2”可以表示目标用户的层级为第二等级。“3”可以表示目标用户的层级为第三等级。
作为又一示例,候选信息集合可以是[用户编号:1002,用户价值度:0.2,置信度数值:0.98,用户层级值:1]。
第二步,对上述候选信息集合中的每个候选信息进行编码处理,以生成编码后的候选信息,得到编码后的候选信息集合。
其中,上述编码处理可以是独热编码处理。
第三步,将上述编码后的候选信息集合中的编码后的候选信息,输入上述融合模型,以生成第二预测结果,得到上述第二预测结果集合。
其中,上述第二预测结果集合第二预测结果表征目标用户的用户价值度。上述融合模型可以是但不限于以下任意一项:CNN(Convolutional Neural Networks,卷积神经网络)模型,RNN(Recurrent Neural Networks,循环神经网络)模型,XGBoost模型和RF(Random Forest)模型。
作为示例,第二预测结果可以是[用户编号:1002,用户价值度:0.3,置信度数值:0.99]。
步骤205,根据第二预测结果集合,向目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。
在一些实施例中,上述执行主体可以根据第二预测结果集合,向目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。其中,上述执行主体可以按照第二预测结果集合中第二预测结果包括的用户价值度,按照目标顺序,向目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。上述目标顺序可以是由大到小的顺序,也可是有小到大的顺序。上述推荐信息可以是物品推荐信息或活动推荐信息。例如,上述推荐信息也可以是优惠推荐信息。上述推荐信息也可以是物品对应的详细介绍信息。
本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的信息推送方法,提高了用户推送的信息与用户的匹配程度。同时减少了网络传输资源的浪费。具体来说,造成网络传输资源浪费的原因在于:传统的预测模型对于不同的数据集的预测能力不同,从而,导致难以准确地预测用户的CLV。基于此,本公开的一些实施例的信息推送方法,首先,获取目标用户信息集合。其次,确定上述目标用户信息集合中每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合。实际情况中,目标用户信息中往往包含较多目标用户对应的信息,例如,爱好,性别,身体质量指数,身高,体重和收入等信息。此类信息中的大部分特征信息对于预测用户的CLV作用较小。并且,过多的特征信息可能会导致预测模型训练时长增加。而且,可能也不会提高得到的预测模型的预测精度。其次,基于上述目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合。实际情况中,单一的、传统的预测模型对于不同数据集的预测能力不尽相同,因此,需要根据相同的数据集,通过多个不同的预测模型进行预测,依次根据得到的第一预测结果集合,确定多个子预测模型的预测能力。此外,基于上述第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合。实际情况中,通过融合模型,往往能够提高最终的预测结果的准确度,即提高用户的CLV预测的准确度。此外,根据长尾效应理论和二八定律,用户往往出现分层情况,即不同层级的用户往往具有不同的行为习惯。相同层级的用户往往具有相同的行为习惯,由于分层情况作为一种较为重要的特征,会影响用户分类以及CLV的准确度。因此,通过用户分层信息集合,可以进一步提升融合模型生成的第二预测结果的准确度。最后,根据上述第二预测结果,向上述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。通过此种方式能够大大的提高向用户推送的信息和用户的匹配度。从而,减少了非必要推送信息的传输,进而,减少了网络传输资源的浪费。
进一步参考图4,其示出了信息推送方法的另一些实施例的流程400。该信息推送方法的流程400,包括以下步骤:
步骤401,获取目标用户信息集合。
步骤402,确定目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合。
在一些实施例中,步骤401-步骤402的具体实现及其所带来的技术效果,可以参考图2对应的那些实施例中的步骤201-步骤202,在此不再赘述。
步骤403,基于目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合。
在一些实施例中,信息推送方法的执行主体(例如图1所示的计算设备101)基于目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合,可以包括以下步骤:
第一步,对上述目标用户特征信息集合中的每个目标用户特征信息进行向量化处理,以生成向量化处理后的目标用户特征信息,得到向量化处理后的目标用户特征信息集合。
第二步,将上述向量化处理后的目标用户特征信息集合输入至上述多个训练完成的子预测模型中的每个子预测模型中,以生成第一预测结果,得到上述第一预测结果集合。
其中,上述多个训练完成的子预测模型还可以包括:第一子预测模型和第二子预测模型。
作为示例,上述第一子预测模型和上述第二子预测模型的网络结构可以如图5所示。其中,上述网络结构包括:输入层501、嵌入层502、特征共享层503、拼接层504、第一全连接层505、第二全连接层506、第三全连接层507和输出层508。上述输入层501中输入的包括目标用户特征信息对应的连续特征和离散特征。上述嵌入层502(Embedding层)用于将高维度特征向量转换成低维特征向量。上述特征共享层503用于将嵌入层502输出的低维特征向量进行交叉处理,从而构建更加丰富的特征组合。上述拼接层504用于将特征共享层503输出的多个特征向量进行拼接,以生成特征矩阵。上述第一全连接层505的神经元数量可以是64。上述第二全连接层506的神经元数量可以是32。上述第三全连接层507的神经元数量可以是16。上述输出层508用于输出第一预测结果。上述第一子预测模型可以采用交叉熵损失函数。上述第二预测模型可以采用均方误差损失函数。
上述交叉熵损失函数如下:
Figure BDA0003022391260000141
其中,x表示预测值。μ表示log(x)的均值。σ表示log(x)的方差。LLognormal(x;μ;σ)表示上述交叉熵损失函数的损失值。
上述均方误差损失函数如下:
Figure BDA0003022391260000142
其中,n表示样本总量。i表示序号。f表示样本的预测值。t表示样本的真实值。fi表示第i个样本的预测值。ti表示第i个样本的真实值。MSE表示上述均方误差损失函数的损失值。
步骤404,基于第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合。
在一些实施例中,上述执行主体基于第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,可以包括以下步骤:
第一步,将上述第一预测结果集合中的每个第一预测结果和上述第一预测结果对应的用户分层信息进行拼接,以生成候选信息,得到候选信息集合。
第二步,对上述候选信息集合中的每个候选信息进行向量化处理,以生成向量化处理后的候选信息,得到向量化处理后的候选信息集合。
第三步,将上述向量化处理后的候选信息集合中的每个向量化处理后的候选信息输入上述融合模型,以生成第二预测结果,得到上述第二预测结果集合。
其中,上述融合模型通过以下步骤训练:
第一步,构建训练样本数据集合和全量用户数据集合。
其中,上述训练样本数据集合可以包括:子预测模型训练样本集合和融合模型训练样本集合。上述子预测模型训练样本集合中的子预测模型训练样本用于训练子预测模型。融合模型训练样本集合中的融合模型训练样本用于训练融合模型。
可选地,上述子预测模型训练样本集合和融合模型训练样本集合可以是通过对上述训练样本数据集合进行随机采样,以生成上述子预测模型训练样本集合和上述融合模型训练样本集合。
可选地,上述执行主体构建训练样本数据集合,可以包括以下子步骤:
第一子步骤,获取用户行为信息集合。
其中,上述用户行为信息集合中的用户行为信息可以包括静态特征和动态特征。其中静态特征可以表征用户的身份信息。动态特征可以表征用户的价值操作对应的数据。
作为示例,上述静态特征可以包括:用户性别,用户年龄,用户职业,用户住址,用户学历和用户收入等。上述动态特征可以包括:用户在一段时间内的购买次数,购买金额,浏览次数,点击次数,添加到购物车次数,搜索次数,价值操作状态和价值操作类型。
作为示例,上述价值操作类型可以是“1”。其中,操作类型“1”可以表征用户的价值操作是购买操作。上述价值操作状态可以是“执行成功”,也可以是“执行失败”。其中,“执行成功”可以表征用户购买成功。状态“执行失败”可以表征用户购买失败。
第二子步骤,对上述用户行为信息集合分别进行正采样处理和负采样处理,以生成正采样样本集合和负采样样本集合。
其中,上述正采样样本集合和负采样样本集合中的样本量成预设比例。上述预设比例可以是人工设置的。上述执行主体可以将上述用户行为信息集合中包括的状态为“执行成功”的用户行为信息确定为正采样样本。将上述用户行为信息集合中包括的状态为“执行失败”的用户行为信息确定为负采样样本。
第三子步骤,基于上述正采样样本集合和负采样样本集合中的每个样本,构建用户特征信息,以生成训练样本数据,得到上述训练样本数据集合。
其中,上述执行主体可以从上述正采样样本集合和上述负采样样本集合中随机选取样本,作为训练样本数据,得到上述训练样本数据集合。
第二步,基于上述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型。
其中,上述执行主体首先,可以将上述子预测模型训练样本集合中的每个子预测模型训练样本进行向量化处理,以生成向量化处理后的子预测模型训练样本,得到向量化处理后的子预测模型训练样本集合。其次,基于上述向量化处理后的子预测模型训练样本集合,对上述多个初始子预测模型中的每个初始子预测模型进行训练。
可选地,上述执行主体基于上述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型,可以包括以下子步骤:
第一子步骤,确定上述子预测模型训练样本集合中每个子预测模型训练样本的特征信息,得到至少一个特征信息集合。
其中,上述执行主体可以根据业务场景,确定上述子预测模型训练样本集合中每个子预测模型训练样本的特征信息,得到上述至少一个特征信息集合。
作为示例,上述业务场景可以是“预测用户在未来一段时间内的购买次数”。因此可以从上述子预测模型训练样本中选取包括的动态特征作为上述子预测模型训练样本的特征信息,得到特征信息集合。
第二子步骤,对于上述至少一个特征信息集合中的特征信息集合,对上述多个初始子预测模型中对应该特征信息集合的初始子预测模型进行训练,以生成训练完成的子预测模型。
其中,上述执行主体首先,可以将上述特征信息集合中的每个特征信息进行向量化处理,以生成向量化处理后的特征信息,得到向量化处理后的特征信息集合。其次,根据上述向量化处理后的特征信息集合,对上述多个初始子预测模型中中的每个初始子预测模型进行训练,以生成训练完成的子预测模型,得到多个训练完成的子预测模型。
第三步,对上述全量用户数据集合进行分层处理,以生成用户分层信息集合。
其中,上述全量用户数据集合可以表征所有注册的用户对应的用户数据。上述执行主体可以通过DBSCAN(基于密度的聚类算法)实现对上述全量用户数据集合进行分层处理,以生成上述用户分层信息集合。
可选地,上述执行主体对上述全量用户数据集合进行分层处理,以生成用户分层信息集合,可以包括以下子步骤:
第一子步骤,根据预设的目标类别数目,对上述全量用户数据集合进行聚类处理,以生成聚类信息组集合。
其中,上述执行主体可以根据预设的上述目标类别数目,通过聚类算法,对上述全量用户数据集合进行聚类处理,以生成聚类信息组集合。上述聚类算法可以是K-means算法。上述聚类算法也可以是KNN(K-NearestNeighbor,K最邻近算法)算法。
作为示例,上述预设的目标类别数目可以是6。如图6所示。其中,图6包括:聚类信息组集合中的聚类信息组的类中心601、上述聚类信息组集合中各个聚类信息对应的坐标点602和上述聚类信息组集合中的聚类信息组的类别覆盖范围603。
第二子步骤,根据上述聚类信息组集合中各个聚类信息组的类中心的位置和类别覆盖范围,对上述聚类信息组集合中的聚类信息进行聚类处理,以生成上述用户分层信息集合。
其中,上述执行主体可以根据上述聚类信息组集合中各个聚类信息组的类中心的位置和类别覆盖范围,通过上述聚类算法,对上述聚类信息组集合中的聚类信息进行聚类处理,以生成上述用户分层信息集合。上述类别覆盖范围可以表征囊括聚类信息组中各个聚类信息对应的坐标点的区域。
作为示例,如图7所示,其中,“区域A”中的各个坐标点602对应的聚类信息为同类别。“区域B”中的各个坐标点602对应的聚类信息为同类别。“区域C”中的各个坐标点602对应的聚类信息为同类别。
第四步,基于上述融合模型训练样本集合、上述用户分层信息集合和上述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型。
其中,上述执行主体首先,可以将上述融合模型训练样本集合中的每个融合模型训练样本和上述用户分层信息集合进行拼接,以生成拼接训练样本,得到拼接训练样本集合。其次,将上述拼接训练样本集合输入至上述多个训练完成的子预测模型中的每个子预测模型中,以生成预测信息,得到预测信息集合。最后,根据上述预测信息集合,对上述初始融合模型进行融合模型训练,以生成上述融合模型。上述初始融合模型可以是RF模型。
可选地,上述执行主体基于上述融合模型训练样本集合、上述用户分层信息集合和上述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型,可以包括以下子步骤:
第一子步骤,将上述融合模型训练样本集合输入上述多个训练完成的子预测模型中的每个训练完成的子预测模型,以生成预测结果,得到预测结果集合。
其中,上述执行主体可以将向量化处理后的融合模型训练样本集合输入至上述训练完成的子预测模型,以生成预测结果。
第二子步骤,基于上述预测结果集合和上述用户分层信息集合,对上述初始融合模型进行融合模型训练,以生成上述融合模型。
其中,上述执行主体首先,可以将上述预测结果集合中的每个预测结果和上述用户分层信息集合进行拼接,以生成拼接特征向量,得到拼接特征向量集合。然后,根据上述拼接特征向量集合对上述初始融合模型进行融合模型训练,以生成上述融合模型。
步骤405,根据第二预测结果集合,从目标用户信息集合筛选出满足筛选条件的目标用户信息作为候选用户信息,得到候选用户信息集合。
在一些实施例中,上述执行主体可以根据第二预测结果集合,从目标用户信息集合筛选出满足筛选条件的目标用户信息作为候选用户信息,得到候选用户信息集合。其中,上述筛选条件可以是:目标用户信息对应的第二预测结果包括的用户价值度大于预设阈值。
作为示例,上述预设阈值可以是0.7。第二预测结果可以是[用户编号:1004,用户价值度:0.8,置信度数值:0.99]。对应的目标用户信息可以是[用户编号:1004,用户性别:男,用户姓名:朱XX,用户年龄:34岁,用户身高:152厘米,用户体重:200斤,用户身体质量指数:43.3,用户家庭住址:XX市XX街道XX小区XX栋XX层XX户,用户职业:音效师,用户学历:硕士,用户收入:2万/月,购买次数:20次,浏览次数:32次,购买金额:5000元,点击次数:54次,收藏次数:0次,添加到购物车次数:20次,搜索次数:23次]。
步骤406,向候选用户信息集合中的每个候选用户信息对应的目标终端推送推荐信息。
在一些实施例中,上述执行主体可以向候选用户信息集合中的每个候选用户信息对应的目标终端推送推荐信息。其中,上述目标终端为登录有上述候选用户信息对应的用户的用户账号的终端。例如,上述目标终端可以是“手机”。上述目标终端也可以是“电脑”。
可选地,上述执行主体可以响应于确定上述目标终端开启了信息通知模式,向上述目标终端推送推荐信息。
其中,上述执行主体首先,可以获取上述目标终端的终端状态信息。然后,从上述终端状态信息中确定信息通知模式状态值。最后,根据上述信息通知模式状态值,确定上述目标终端是否开启了信息通知模式。
作为示例,上述终端状态信息可以是[终端编号:AXX102,终端状态:开机30小时,信息通知模式状态值:1]。其中,信息通知模式状态值为“1”可以表征终端编号为“AXX102”的终端开启了信息通知模式。
从图4可以看出,与图2对应的一些实施例的描述相比,本公开的一些实施例首先,增加了第一子预测模型和第二子预测模型。由于现有的预测模型,模型结构固定,同时现有的预测模型难以满足多种场景下的预测需求。因此引入了上述第一子预测模型和上述第二子预测模型。上述第一子预测模型和上述第二子预测模具有良好的性能、可拓展性。同时对于不同的场景,例如,“预测数据量大,预测精度高”和“预测数据量不大,预测精度高”等场景,都能保持较好的预测准确率。此外,为了避免侵犯用户隐私,上述执行主体仅在目标终端开启了信息通知模式时,再向上述目标终端推送信息。
进一步参考图8,作为对上述各图所示方法的实现,本公开提供了一种信息推送装置的一些实施例,这些装置实施例与图2所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图8所示,一些实施例的信息推送装置800包括:获取单元801、确定单元802、第一生成单元803、第二生成单元804和推送单元805。其中,接收单元801被配置成接收用户的网页浏览请求,其中,获取单元801,被配置成获取目标用户信息集合;确定单元802,被配置成确定上述目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合;第一生成单元803,被配置成基于上述目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合;第二生成单元804,被配置成基于上述第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,其中,预测结果用于表征目标用户信息对应的用户价值度;推送单元805,被配置成根据上述第二预测结果集合,向上述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。
在一些实施例的一些可选地实现方式中,上述推送单元被进一步配置成:根据上述第二预测结果集合,从上述目标用户信息集合筛选出满足筛选条件的目标用户信息作为候选用户信息,得到候选用户信息集合;向上述候选用户信息集合中的每个候选用户信息对应的目标终端推送推荐信息,其中,上述目标终端为登录有上述候选用户信息对应的用户的用户账号的终端。
在一些实施例的一些可选地实现方式中,上述推送单元被进一步配置成:响应于确定上述目标终端开启信息通知模式,向上述目标终端推送推荐信息。
在一些实施例的一些可选地实现方式中,上述融合模型通过以下步骤训练:
构建训练样本数据集合和全量用户数据集合,其中,上述训练样本数据集合包括:子预测模型训练样本集合和融合模型训练样本集合;基于上述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型;对上述全量用户数据集合进行分层处理,以生成用户分层信息集合;基于上述融合模型训练样本集合、上述用户分层信息集合和上述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型。
在一些实施例的一些可选地实现方式中,上述构建训练样本数据集合,包括:获取用户行为信息集合;对上述用户行为信息集合分别进行正采样处理和负采样处理,以生成正采样样本集合和负采样样本集合,其中,上述正采样样本集合和负采样样本集合中的样本量成预设比例;基于上述正采样样本集合和负采样样本集合中的每个样本,构建用户特征信息,以生成训练样本数据,得到上述训练样本数据集合。
在一些实施例的一些可选地实现方式中,上述基于上述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型,包括:确定上述子预测模型训练样本集合中每个子预测模型训练样本的特征信息,得到至少一个特征信息集合;对于上述至少一个特征信息集合中的特征信息集合,对上述多个初始子预测模型中对应该特征信息集合的初始子预测模型进行训练,以生成训练完成的子预测模型。
在一些实施例的一些可选地实现方式中,上述对上述全量用户数据集合进行分层处理,以生成用户分层信息集合,包括:根据预设的目标类别数目,对上述全量用户数据集合进行聚类处理,以生成聚类信息组集合;根据上述聚类信息组集合中各个聚类信息组的类中心的位置和类别覆盖范围,对上述聚类信息组集合中的聚类信息进行聚类处理,以生成上述用户分层信息集合。
在一些实施例的一些可选地实现方式中,上述基于上述融合模型训练样本集合、上述用户分层信息集合和上述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型,包括:将上述融合模型训练样本集合输入上述多个训练完成的子预测模型中的每个训练完成的子预测模型,以生成预测结果,得到预测结果集合;基于上述预测结果集合和上述用户分层信息集合,对上述初始融合模型进行融合模型训练,以生成上述融合模型。
在一些实施例的一些可选地实现方式中,上述子预测模型训练样本集合和上述融合模型训练样本集合通过以下步骤生成:对上述训练样本数据集合进行随机采样,以生成上述子预测模型训练样本集合和上述融合模型训练样本集合。
可以理解的是,该装置800中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置800及其中包含的单元,在此不再赘述。
下面参考图9,其示出了适于用来实现本公开的一些实施例的电子设备(如图1所示的计算设备101)900的结构示意图。图9示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图9所示,电子设备900可以包括处理装置(例如中央处理器、图形处理器等)901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储装置908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有电子设备900操作所需的各种程序和数据。处理装置901、ROM 902以及RAM903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
通常,以下装置可以连接至I/O接口905:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置906;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置907;包括例如磁带、硬盘等的存储装置908;以及通信装置909。通信装置909可以允许电子设备900与其他设备进行无线或有线通信以交换数据。虽然图9示出了具有各种装置的电子设备900,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图9中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置909从网络上被下载和安装,或者从存储装置908被安装,或者从ROM 902被安装。在该计算机程序被处理装置901执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取目标用户信息集合;确定上述目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合;基于上述目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合;基于上述第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,其中,预测结果用于表征目标用户信息对应的用户价值度;根据上述第二预测结果集合,向上述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、确定单元、第一生成单元、第二生成单元和推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取目标用户信息集合的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种信息推送方法,包括:
获取目标用户信息集合;
确定所述目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合;
基于所述目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合;
基于所述第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,其中,预测结果用于表征目标用户信息对应的用户价值度;
根据所述第二预测结果集合,向所述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。
2.根据权利要求1所述的方法,其中,所述根据所述第二预测结果集合,向所述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息,包括:
根据所述第二预测结果集合,从所述目标用户信息集合筛选出满足筛选条件的目标用户信息作为候选用户信息,得到候选用户信息集合;
向所述候选用户信息集合中的每个候选用户信息对应的目标终端推送推荐信息,其中,所述目标终端为登录有所述候选用户信息对应的用户的用户账号的终端。
3.根据权利要求2所述的方法,其中,所述向所述候选用户信息集合中的每个候选用户信息对应的目标终端推送推荐信息,包括:
响应于确定所述目标终端开启信息通知模式,向所述目标终端推送推荐信息。
4.根据权利要求1所述的方法,其中,所述融合模型通过以下步骤训练:
构建训练样本数据集合和全量用户数据集合,其中,所述训练样本数据集合包括:子预测模型训练样本集合和融合模型训练样本集合;
基于所述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型;
对所述全量用户数据集合进行分层处理,以生成用户分层信息集合;
基于所述融合模型训练样本集合、所述用户分层信息集合和所述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型。
5.根据权利要求4所述的方法,其中,所述构建训练样本数据集合,包括:
获取用户行为信息集合;
对所述用户行为信息集合分别进行正采样处理和负采样处理,以生成正采样样本集合和负采样样本集合,其中,所述正采样样本集合和负采样样本集合中的样本量成预设比例;
基于所述正采样样本集合和负采样样本集合中的每个样本,构建用户特征信息,以生成训练样本数据,得到所述训练样本数据集合。
6.根据权利要求4所述的方法,其中,所述基于所述子预测模型训练样本集合,对多个初始子预测模型进行训练,以生成多个训练完成的子预测模型,包括:
确定所述子预测模型训练样本集合中每个子预测模型训练样本的特征信息,得到至少一个特征信息集合;
对于所述至少一个特征信息集合中的特征信息集合,对所述多个初始子预测模型中对应该特征信息集合的初始子预测模型进行训练,以生成训练完成的子预测模型。
7.根据权利要求4所述的方法,其中,所述对所述全量用户数据集合进行分层处理,以生成用户分层信息集合,包括:
根据预设的目标类别数目,对所述全量用户数据集合进行聚类处理,以生成聚类信息组集合;
根据所述聚类信息组集合中各个聚类信息组的类中心的位置和类别覆盖范围,对所述聚类信息组集合中的聚类信息进行聚类处理,以生成所述用户分层信息集合。
8.根据权利要求4所述的方法,其中,所述基于所述融合模型训练样本集合、所述用户分层信息集合和所述多个训练完成的子预测模型,对初始融合模型进行融合模型训练,以生成融合模型,包括:
将所述融合模型训练样本集合输入所述多个训练完成的子预测模型中的每个训练完成的子预测模型,以生成预测结果,得到预测结果集合;
基于所述预测结果集合和所述用户分层信息集合,对所述初始融合模型进行融合模型训练,以生成所述融合模型。
9.根据权利要求4所述的方法,其中,所述子预测模型训练样本集合和所述融合模型训练样本集合通过以下步骤生成:
对所述训练样本数据集合进行随机采样,以生成所述子预测模型训练样本集合和所述融合模型训练样本集合。
10.一种信息推送装置,包括:
获取单元,被配置成获取目标用户信息集合;
确定单元,被配置成确定所述目标用户信息集合中的每个目标用户信息的目标用户特征信息,得到目标用户特征信息集合;
第一生成单元,被配置成基于所述目标用户特征信息集合和多个训练完成的子预测模型,生成第一预测结果集合;
第二生成单元,被配置成基于所述第一预测结果集合、用户分层信息集合和融合模型,生成第二预测结果集合,其中,预测结果用于表征目标用户信息对应的用户价值度;
推送单元,被配置成根据所述第二预测结果集合,向所述目标用户信息集合中的目标用户信息对应的目标终端推送推荐信息。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。
CN202110406241.6A 2021-04-15 2021-04-15 信息推送方法、装置、电子设备和计算机可读介质 Pending CN113204577A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110406241.6A CN113204577A (zh) 2021-04-15 2021-04-15 信息推送方法、装置、电子设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110406241.6A CN113204577A (zh) 2021-04-15 2021-04-15 信息推送方法、装置、电子设备和计算机可读介质

Publications (1)

Publication Number Publication Date
CN113204577A true CN113204577A (zh) 2021-08-03

Family

ID=77027058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110406241.6A Pending CN113204577A (zh) 2021-04-15 2021-04-15 信息推送方法、装置、电子设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN113204577A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114711790A (zh) * 2022-04-06 2022-07-08 复旦大学附属儿科医院 新生儿电惊厥类型确定方法、装置、设备和存储介质
CN115169852A (zh) * 2022-06-29 2022-10-11 朴道征信有限公司 信息发送方法、装置、电子设备、介质和计算机程序产品
CN116737917A (zh) * 2023-08-09 2023-09-12 中信证券股份有限公司 文本推荐信息生成方法、电子设备和计算机可读介质
CN116993396A (zh) * 2023-09-27 2023-11-03 北京北汽鹏龙汽车服务贸易股份有限公司 基于车辆用户标签的风险预警方法、计算机设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114711790A (zh) * 2022-04-06 2022-07-08 复旦大学附属儿科医院 新生儿电惊厥类型确定方法、装置、设备和存储介质
CN114711790B (zh) * 2022-04-06 2022-11-29 复旦大学附属儿科医院 新生儿电惊厥类型确定方法、装置、设备和存储介质
CN115169852A (zh) * 2022-06-29 2022-10-11 朴道征信有限公司 信息发送方法、装置、电子设备、介质和计算机程序产品
CN115169852B (zh) * 2022-06-29 2023-10-27 朴道征信有限公司 信息发送方法、装置、电子设备、介质和计算机程序产品
CN116737917A (zh) * 2023-08-09 2023-09-12 中信证券股份有限公司 文本推荐信息生成方法、电子设备和计算机可读介质
CN116737917B (zh) * 2023-08-09 2023-10-27 中信证券股份有限公司 文本推荐信息生成方法、电子设备和计算机可读介质
CN116993396A (zh) * 2023-09-27 2023-11-03 北京北汽鹏龙汽车服务贸易股份有限公司 基于车辆用户标签的风险预警方法、计算机设备
CN116993396B (zh) * 2023-09-27 2023-12-22 北京北汽鹏龙汽车服务贸易股份有限公司 基于车辆用户标签的风险预警方法、计算机设备

Similar Documents

Publication Publication Date Title
CN113204577A (zh) 信息推送方法、装置、电子设备和计算机可读介质
CN110688528B (zh) 生成视频的分类信息的方法、装置、电子设备和介质
CN111104599B (zh) 用于输出信息的方法和装置
CN114417174B (zh) 内容推荐方法、装置、设备及计算机存储介质
WO2022188534A1 (zh) 信息推送的方法和装置
CN113807926A (zh) 推荐信息生成方法、装置、电子设备和计算机可读介质
Xu et al. Towards machine-learning-driven effective mashup recommendations from big data in mobile networks and the Internet-of-Things
CN111353103A (zh) 用于确定用户社群信息的方法和装置
WO2022001887A1 (zh) 用于训练物品编码模型的方法和装置
US20230315990A1 (en) Text detection method and apparatus, electronic device, and storage medium
Xu et al. Predicting and recommending the next smartphone apps based on recurrent neural network
CN113256339A (zh) 资源投放的方法、装置、存储介质及电子设备
CN113591490A (zh) 信息处理方法、装置和电子设备
CN113766633A (zh) 数据处理方法、装置、电子设备以及存储介质
CN111382232A (zh) 问答信息处理方法、装置及计算机设备
Hao et al. Deep collaborative online learning resource recommendation based on attention mechanism
CN114926234A (zh) 物品信息推送方法、装置、电子设备和计算机可读介质
CN111582456B (zh) 用于生成网络模型信息的方法、装置、设备和介质
CN115482019A (zh) 一种活动关注度预测方法、装置、电子设备和存储介质
CN114970494A (zh) 一种评论生成方法、装置、电子设备和存储介质
CN111581455A (zh) 文本生成模型的生成方法、装置和电子设备
Jin [Retracted] A Self‐Adaptive Recommendation Method for Online Ideological and Political Teaching Resources Based on Deep Reinforcement Learning
CN113010784B (zh) 用于生成预测信息的方法、装置、电子设备和介质
CN116501993B (zh) 房源数据推荐方法及装置
CN115169321B (zh) 物流内容文本核对方法、装置、电子设备和计算机介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination