CN115713355B - 一种用户目标人群扩散方法、装置及存储介质 - Google Patents
一种用户目标人群扩散方法、装置及存储介质 Download PDFInfo
- Publication number
- CN115713355B CN115713355B CN202310024052.1A CN202310024052A CN115713355B CN 115713355 B CN115713355 B CN 115713355B CN 202310024052 A CN202310024052 A CN 202310024052A CN 115713355 B CN115713355 B CN 115713355B
- Authority
- CN
- China
- Prior art keywords
- target
- crowd
- user
- diffusion
- seed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种用户目标人群扩散方法、装置及存储介质,用户目标人群扩散方法包括:获取用户的历史数据,将用户划分为种子人群和非种子人群;选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量;计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。本发明具有多目标自适应扩散,适配复杂场景和控制计算成本,节约计算时间的有益效果。
Description
技术领域
本发明涉及人工智能技术领域,具体的涉及一种用户目标人群扩散方法、装置及存储介质。
背景技术
在较大型的营销活动中,运营人员需要基于已确定的少量种子人群,进行更大量相似人群的圈选,来达到精准营销目的。种子人群:代指企业经营中,发生了某些具体动作(如购买商品、参与活动等)的核心用户人群。例如:进行某商品推广时,需要选取目标人群发放优惠券,全量发放成本过高,随机发放转化率较低。业务人员会利用已有用户数据,圈选满足某些条件(如近期购买过类似商品或符合某些特征)的人群。但人工圈选人群量级较小,需要基于此人群包(也称种子人群),在非种子人群中(除种子人群外的全量用户)选取与种子人群相似的用户进行扩散。此时需要用到人群扩散方法,人群扩散是基于种子用户(人工挑选的人群包),通过一定的算法评估模型,找到更多拥有潜在关联性的相似人群的技术。
现有的人群扩散方法大致分为三类。
1.基于标签的人群扩散方法
通过对种子人群进行人工统计分析或模型分析,识别种子人群特征,如:性别男性、年龄20-26岁等特征占比较高,然后通过以上人群特征标签,圈选人群作为拓展人群,进行后续的营销活动。
该方法存在一定缺陷,首先强依赖于人群特征分析,分析过程费时费力且分析结论无法有效评估。其次基于分析结果进行标签圈选时,需要通过标签组合控制扩散人群数量,此过程不可控。如限制标签“性别男”后,人群数量超过预期扩散人群数量,限制标签组合“性别男,年龄20-26岁”后,人群数量可能又小于预期扩散人群数量。只能通过构建其他标签组合方式,或再次对人群抽样才能达到预期。整个过程人力成本高且准确率低。
2.基于分类模型的人群扩散方法
将人群扩散看作分类问题,种子人群为类别A,部分其他非种子人群为类别B,利用分类模型(逻辑回归、决策树等)进行训练。将生成的模型对全量非种子人群进行预测,此时得到的预测结果为每个用户为类别A的可能性(二分类问题,反之为类别B的可能性亦可)。最后通过将预测结果进行排序,得到可能性最大的N个用户作为扩散人群。
该方法存在一定缺陷,首先训练分类模型时,部分非种子人群的选取方式可能影响模型效果。由于种子人群往往是全量人群中很少的一部分,如千万用户中,可能只识别出几百或几千的种子人群。因此如何在控制正负样本比例的基础上,选取部分非种子人群十分复杂,模型效果难以得到保证。其次该方法只能在得到种子人群后进行启动样本选取、特征筛选、模型训练的一系列过程,整个过程耗时较长,业务人员使用时体验感较差,无法通过预训练的方式减少应用人群扩散功能的时间。
3.基于向量相似度的人群扩散方法
利用深度学习模型(如双塔模型)对每个用户进行向量化表示,通过种子人群包的N个用户向量与每个非种子用户的向量计算相似度,然后对非种子用户与种子人群包的相似度进行排序,最后得到指定数量的人群作为扩散用户。
但该方法也存在一定不足。首先在利用模型进行用户向量化表示时,往往通过选取单一目标(如点击、浏览、下单等)训练满足特定场景的模型。如广告宣传时业务人员希望通过人群扩散提高广告点击率,而商品促销活动中则希望提高转化率(商品下单数/商品点击数)。不同的人群扩散目标需要算法工程师训练不同的模型、扩散后的人群质量难以控制、人群扩散的逻辑难以解释导致需要大量的后续分析等等。其次在计算种子人群包与其他用户的相似度时,涉及如何对种子人群包进行向量化表示问题。种子人群包中的N个用户向量与非种子用户计算得到N个相似度,以往的方式选取N个相似度的平均值、最大值或最小值作为用户与人群包的相似度。但这种方法计算量大且无法准确量化相似度,易受到异常值影响。
有鉴于此,特提出本发明专利。
发明内容
针对上述相关技术的不足,本发明提出一种用户目标人群扩散方法,通过人工指导结合算法模型,找到营销活动转化率较高的目标人群,具体地,采用如下技术方案:
一种用户目标人群扩散方法,包括:
获取用户的历史数据,将用户划分为种子人群和非种子人群;
选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;
接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量;
计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。
作为本发明的可选实施方式,本发明的一种用户目标人群扩散方法中,所述选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型包括:
所述深度学习网络模型包括种子人群包向量单元和目标向量单元,将所述正样本数据输入种子人群包向量单元,将部分正样本数据和负样本数据输入目标向量单元进行深度学习训练,将种子人群包向量单元输出的种子人群包向量与目标向量单元输出的目标向量进行相似度计算,根据相似度计算结果反馈深度学习网络模型进行种子人群包向量单元和目标向量单元的参数优化。
作为本发明的可选实施方式,本发明的一种用户目标人群扩散方法中,所述将所述正样本数据输入种子人群包向量单元进行深度学习训练包括:
所述正样本的N个多维用户向量输入种子人群包向量单元;
针对N个多维用户向量进行聚类分析,得到k个聚类中心向量,所述聚类中心的个数k根据人群包人数N的数量分段式调整;
将k个聚类中心向量输入注意力单元,得到种子人群包的全局向量表示。
作为本发明的可选实施方式,本发明的一种用户目标人群扩散方法中,所述接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量包括:
接收用户上传的目标种子人群包,将目标种子人群包输入人群扩散模型中得到目标种子人群包向量;
接收用户配置的目标扩散人群的扩散条件,所述的扩散条件包括扩散人数、扩散限定条件及扩散目标,由用户全量数据库中提取满足扩散限定条件的目标用户构成目标扩散人群,获取目标扩散人群中各个目标扩散用户的目标扩散用户向量。
作为本发明的可选实施方式,本发明的一种用户目标人群扩散方法中,所述计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包括:
当所述扩散目标为单目标扩散时,计算目标扩散用户向量与种子人群包向量的单个相似度;
当所述扩散目标为多目标扩散时,分别计算每个目标扩散的相似度,将多个相似度进行加权平均计算得到多目标扩散相似度;
可选地,所述加权平均计算的加权权重通过用户配置,默认为等权重。
作为本发明的可选实施方式,本发明的一种用户目标人群扩散方法,包括:
将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量;
将各个用户的用户向量存入数据库,得到用户全量数据库;
所述获取目标扩散人群中各个目标扩散用户的目标扩散用户向量包括:
由所述用户全量数据库中提取满足扩散限定条件的目标用户的目标扩散用户向量。
作为本发明的可选实施方式,本发明的一种用户目标人群扩散方法中,所述将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量包括:
所述的深度学习网络模型为针对单目标扩散时获取用户向量的双塔模型;
所述双塔模型包括输入用户特征、输出用户向量的用户塔,和输入物品特征、输出物品向量的物品塔。
作为本发明的可选实施方式,本发明的一种用户目标人群扩散方法中,所述将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量包括:
所述的深度学习网络模型为针对多目标扩散时获取用户向量的多塔模型;
所述多塔模型包括输入用户特征、输出针对各个目标的用户目标向量的用户塔,和输入物品特征、输出物品向量的物品塔。
本发明同时提供一种用户目标人群扩散装置,包括种子人群包向量化表示模块和目标人群扩散模块;
所述种子人群包向量化表示模块包括:
获取单元,获取用户的历史数据,将用户划分为种子人群和非种子人群;
人群扩散模型训练单元,选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;
所述目标人群扩散模块接收用户配置的目标种子人群包,输入人群扩散模型中得到目标种子人群包向量,计算用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量,计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。
本发明还提供一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,
当所述计算机程序被所述处理器执行时,所述处理器执行所述的一种用户目标人群扩散方法。
本发明同时还提供一种计算机可读存储介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述的一种用户目标人群扩散方法。
与现有技术相比,本发明的有益效果:
本发明的一种用户目标人群扩散方法,将目标种子人群包通过训练得到的人群扩散模型进行向量化表示,通过计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包,有效解决了通过种子人群包中的N个用户向量与非种子用户计算相似度的方式存在的计算量大且无法准确量化相似度,易受到异常值影响的问题。
另外,本发明的用户目标人群扩散方法还具有如下有益效果:
1.多目标自适应扩散,适配复杂场景
多目标学习,提升用户向量化表示的效果,适配各种业务场景,提升人群扩散准确率。业务人员可根据营销活动的目标更加灵活的选择不同目标的扩散方向或自定义不同目标间的权重。同时引入基于注意力机制的人群扩散网络模型,自适应得到人群包向量化权重,提升人群包向量化表示的效果。提升精准营销的效果。
2.控制计算成本,节约计算时间
将神经网络升级为多目标学习架构,以更丰富的流量数据提升用户特征表达精准度的同时,生成多套特征表达,达到“一次训练,多向特征”的目的。相比传统的多个场景多套算法模型,该方案有效控制计算成本,节约计算时间。
附图说明
图1 本发明实施例一种用户目标人群扩散方法的流程图;
图2 本发明实施例人群扩散模型的网络结构图;
图3 本发明实施例双塔模型的网络结构图;
图4 本发明实施例多塔模型的网络结构图;
图5 本发明实施例一种用户目标人群扩散方法的完整流程图示例。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。
因此,以下对本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的部分实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征和技术方案可以相互组合。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,或者是本领域技术人员惯常理解的方位或位置关系,这类术语仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
参见图1所示,本实施例的一种用户目标人群扩散方法,包括:
获取用户的历史数据,将用户划分为种子人群和非种子人群;
选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;
接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量;
计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。
本实施例的一种用户目标人群扩散方法,将目标种子人群包通过训练得到的人群扩散模型进行向量化表示,通过计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包,有效解决了通过种子人群包中的N个用户向量与非种子用户计算相似度的方式存在的计算量大且无法准确量化相似度,易受到异常值影响的问题。
作为本实施例的可选实施方式,本实施例的人群扩散模型的网络结构图如图2所示,本实施例所述的一种用户目标人群扩散方法中,所述选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型包括:
所述深度学习网络模型包括种子人群包向量单元和目标向量单元,将所述正样本数据输入种子人群包向量单元,将部分正样本数据和负样本数据输入目标向量单元进行深度学习训练,将种子人群包向量单元输出的种子人群包向量与目标向量单元输出的目标向量进行相似度计算,根据相似度计算结果反馈深度学习网络模型进行种子人群包向量单元和目标向量单元的参数优化。
如图2所示的人群扩散模型的网络结构图,本实施例一种用户目标人群扩散方法,所述将所述正样本数据输入种子人群包向量单元进行深度学习训练包括:
所述正样本的N个多维用户向量输入种子人群包向量单元;
针对N个多维用户向量进行聚类分析,得到k个聚类中心向量,所述聚类中心的个数k根据人群包人数N的数量分段式调整,这一步的目的在于缩小种子人群包中向量的个数,加快计算速度,减少模型训练时间,同时保证较高的准确率;
将k个聚类中心向量输入注意力单元,得到种子人群包的全局向量表示,此处使用的注意力单元是基于深度学习中广泛使用的注意力机制原理,本实施例中使用的是乘法注意力机制,其他注意力机制即可。
本实施例的一种用户目标人群扩散方法针对N个多维用户向量进行聚类分析具体可采用K-Means聚类:一种无监督的聚类分析算法,基于点与点之间的距离的相似度来计算最佳类别归属,是聚类中常用的方法之一。算法步骤如下。
1.从样本中选择 K 个点作为初始质心(完全随机);
2.计算每个样本到各个质心的距离,将样本划分到距离最近的质心所对应的簇中;
3.计算每个簇内所有样本的均值,并使用该均值更新簇的质心;
4.重复步骤 2 与 3 ,直到达到以下条件之一:
(1)质心的位置变化小于指定的阈值(默认为 0.0001);
(2)达到最大迭代次数。
本实施例的一种用户目标人群扩散方法的注意力单元的注意力机制:一种深度学习机制,借鉴人类注意力思维方式,将有限的注意力资源集中在高价值信息上,常用于计算机视觉、自然语言处理等领域,从大量信息中提取对任务目标更为关键的的信息。乘法注意力如公式为。可以理解为给向量乘一个权重,使得其中重要的维度保留较多信息,不重要的维度保留较少的信息。
另外,本实施例在进行人群扩散模型训练时,可根据扩散目标间的相关性、计算资源选择多个目标的用户向量共同训练一个人群扩散模型,也可以对每个扩散目标的用户向量分别训练对应的人群扩散模型。
作为本实施例的可选实施方式,本实施例的一种用户目标人群扩散方法中,所述接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量包括:
接收用户上传的目标种子人群包,将目标种子人群包输入人群扩散模型中得到目标种子人群包向量;
接收用户配置的目标扩散人群的扩散条件,所述的扩散条件包括扩散人数、扩散限定条件(如只选择性别男)及扩散目标(单目标或多目标),由用户全量数据库中提取满足扩散限定条件的目标用户构成目标扩散人群,获取目标扩散人群中各个目标扩散用户的目标扩散用户向量。
本实施例的目标种子人群包由业务人员用户根据用户的历史活动行为数据(如浏览、加购物车、下单等)进行圈选得到。
进一步地,本实施例的一种用户目标人群扩散方法中,所述计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包括:
当所述扩散目标为单目标扩散时,计算目标扩散用户向量与种子人群包向量的单个相似度;
当所述扩散目标为多目标扩散时,分别计算每个目标扩散的相似度,将多个相似度进行加权平均计算得到多目标扩散相似度。
可选地,所述加权平均计算的加权权重通过用户配置,默认为等权重。
作为本实施例的可选实施方式,本实施例的一种用户目标人群扩散方法,包括:
将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量;
将各个用户的用户向量存入数据库,得到用户全量数据库;
所述获取目标扩散人群中各个目标扩散用户的目标扩散用户向量包括:
由所述用户全量数据库中提取满足扩散限定条件的目标用户的目标扩散用户向量。
进一步地,本实施例的一种用户目标人群扩散方法中,所述将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量包括:
所述的深度学习网络模型为针对单目标扩散时获取用户向量的双塔模型;
所述双塔模型包括输入用户特征、输出用户向量的用户塔,和输入物品特征、输出物品向量的物品塔。
参见图3所示为本实施例双塔模型的网络结构图。
本实施例的一种用户目标人群扩散方法中,所述将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量包括:
所述的深度学习网络模型为针对多目标扩散时获取用户向量的多塔模型;
所述多塔模型包括输入用户特征、输出针对各个目标的用户目标向量的用户塔,和输入物品特征、输出物品向量的物品塔。
参见图4所示为本实施例多塔模型的网络结构图。
另外,为了实现用户的多目标用户向量表示,除了上述的多塔模型之外,目前已有的其他多目标模型,如MMOE,也可以实现多目标用户向量表示。
本实施例的用户目标人群扩散方法,在针对用户进行向量化表示时,可以人工选择模型训练所使用的特征及相应数据源,同时可根据业务场景灵活配置训练目标,如点击、浏览、下单、好评等。深度学习网络模型根据人工配置,选取相应的网络结构搭建模型。选取单目标时,网络结构为双塔结构如图3所示,两侧分别为用户塔和物品塔。选取多目标时,网络结构为多塔结构如图4所示,左侧为对应的多个目标的用户塔,右侧为物品塔。
本实施例的用户目标人群扩散方法,利用训练好的算法模型进行“用户向量化”,输入每个用户的特征,得到全量用户不同目标下的用户向量,并存入用户全量数据库中。通过多目标模型得到的用户向量,在应用于不同目标的人群扩散时能够得到更好的扩散效果。
因此,参见图5所示,本实施例的用户目标人群扩散方法包括:
·用户向量化表示
第一步“人工配置”,可以人工选择模型训练所使用的特征及相应数据源,同时可根据业务场景灵活配置训练目标,如点击、浏览、下单、好评等。
第二步“模型训练”,算法模型根据人工配置,选取相应的网络结构搭建模型。选取单目标时,网络结构为双塔结构如图3所示,两侧分别为用户塔和物品塔。选取多目标时,网络结构为多塔结构如图4所示,左侧为对应的多个目标的用户塔,右侧为物品塔。
第三步“用户向量化”,利用训练好的算法模型,输入每个用户的特征,得到全量用户不同目标下的用户向量,并存入用户全量数据库中。通过多目标模型得到的用户向量,在应用于不同目标的人群扩散时能够得到更好的扩散效果。
·目标种子人群包向量化表示
第一步通过对历史数据中已有的种子人群和非种子人群的划分(基于历史活动或商品购买记录),选取正负样本。
第二步,训练人群扩散算法模型,网络结构如图2所示。左侧为种子人群包所含的N个多维的向量,右侧为目标用户向量。左侧的N个向量先进行k-means聚类分析,聚类中心个数k根据人群包人数N的数量分段式调整,这一步的目的在于缩小种子人群包中向量的个数,加快计算速度,减少模型训练时间,同时保证较高的准确率。将k个聚类中心向量输入注意力单元,得到种子人群包的全局向量表示。此处使用的注意力单元是基于深度学习中广泛使用的注意力机制原理,本方案中使用的是乘法注意力机制,其他注意力机制即可。该模块的算法模型可根据目标间的相关性、计算资源选择多个目标的用户向量共同训练一个扩散模型,也可以对每个目标的用户向量分别训练对应的扩散模型。
·人群扩散预测。
第一步由业务人员对人群扩散功能进行配置,如上传目标种子人群包、选取人群扩散人数、限定条件(如只选择性别男)、目标(单目标或多目标)。
第二步根据配置启动人群扩散预测,从用户全量数据库中提取满足限定条件的用户的向量,输入第二部分的人群扩散模型中得到目标种子人群包的向量化表示(单目标或多目标)。
第三步计算非种子用户向量与目标种子人群包向量的相似度,单目标时计算一个相似度,多目标时计算多个相似度并进行加权平均计算(权重通过用户配置,默认为等权重)。最后对相似度进行排序得到扩散后的人群包。
因此,本实施例形成了一整套用户目标人群扩散方法流程,适合企业级的复杂场景,关键点有二:
1.将多目标学习应用于人群扩散技术,通过灵活可配置的多目标训练多塔网络模型,以生成用户的多套特征表达,弥补了现有方案单一目标的人群扩散方法。
2.基于注意力机制搭建用于人群扩散的深度学习网络模型架构,得到更为合理的种子人群包向量表示。
本实施例的用户目标人群扩散方法具有如下有益效果:
1.多目标自适应扩散,适配复杂场景
多目标学习,提升用户向量化表示的效果,适配各种业务场景,提升人群扩散准确率。业务人员可根据营销活动的目标更加灵活的选择不同目标的扩散方向或自定义不同目标间的权重。同时引入基于注意力机制的人群扩散网络模型,自适应得到人群包向量化权重,提升人群包向量化表示的效果。提升精准营销的效果。
2.控制计算成本,节约计算时间
将神经网络升级为多目标学习架构,以更丰富的流量数据提升用户特征表达精准度的同时,生成多套特征表达,达到“一次训练,多向特征”的目的。相比传统的多个场景多套算法模型,该方案有效控制计算成本,节约计算时间。
本实施例同时提供一种用户目标人群扩散装置,包括种子人群包向量化表示模块和目标人群扩散模块;
所述种子人群包向量化表示模块包括:
获取单元,获取用户的历史数据,将用户划分为种子人群和非种子人群;
人群扩散模型训练单元,选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;
所述目标人群扩散模块接收用户配置的目标种子人群包,输入人群扩散模型中得到目标种子人群包向量,计算用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量,计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。
作为本实施例的可选实施方式,本实施例的一种用户目标人群扩散装置,所述人群扩散模型训练单元选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型包括:
所述深度学习网络模型包括种子人群包向量单元和目标向量单元,将所述正样本数据输入种子人群包向量单元,将部分正样本数据和负样本数据输入目标向量单元进行深度学习训练,将种子人群包向量单元输出的种子人群包向量与目标向量单元输出的目标向量进行相似度计算,根据相似度计算结果反馈深度学习网络模型进行种子人群包向量单元和目标向量单元的参数优化。
进一步地,所述将所述正样本数据输入种子人群包向量单元进行深度学习训练包括:
所述正样本的N个多维用户向量输入种子人群包向量单元;
针对N个多维用户向量进行聚类分析,得到k个聚类中心向量,所述聚类中心的个数k根据人群包人数N的数量分段式调整;
将k个聚类中心向量输入注意力单元,得到种子人群包的全局向量表示。
作为本实施例的可选实施方式,本实施例的一种用户目标人群扩散装置,所述目标人群扩散模块接收用户配置的目标种子人群包,输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量包括:
接收用户上传的目标种子人群包,将目标种子人群包输入人群扩散模型中得到目标种子人群包向量;
接收用户配置的目标扩散人群的扩散条件,所述的扩散条件包括扩散人数、扩散限定条件及扩散目标,由用户全量数据库中提取满足扩散限定条件的目标用户构成目标扩散人群,获取目标扩散人群中各个目标扩散用户的目标扩散用户向量。
进一步地,本实施例的一种用户目标人群扩散装置,所述目标人群扩散模块计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包括:
当所述扩散目标为单目标扩散时,计算目标扩散用户向量与种子人群包向量的单个相似度;
当所述扩散目标为多目标扩散时,分别计算每个目标扩散的相似度,将多个相似度进行加权平均计算得到多目标扩散相似度。
可选地,所述加权平均计算的加权权重通过用户配置,默认为等权重。
作为本实施例的可选实施方式,本实施例的一种用户目标人群扩散装置,包括用户向量化表示模块:
将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量;
将各个用户的用户向量存入数据库,得到用户全量数据库。
同时,本实施例所述目标人群扩散模块获取目标扩散人群中各个目标扩散用户的目标扩散用户向量包括:由所述用户全量数据库中提取满足扩散限定条件的目标用户的目标扩散用户向量。
本实施例的用户向量化表示模块将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量包括:
所述的深度学习网络模型为针对单目标扩散时获取用户向量的双塔模型;
所述双塔模型包括输入用户特征、输出用户向量的用户塔,和输入物品特征、输出物品向量的物品塔。
本实施例的用户向量化表示模块将当前全量用户中各个用户的用户特征分别输入用于计算用户向量的深度学习网络模型中,得到各个用户的用户向量包括:
所述的深度学习网络模型为针对多目标扩散时获取用户向量的多塔模型;
所述多塔模型包括输入用户特征、输出针对各个目标的用户目标向量的用户塔,和输入物品特征、输出物品向量的物品塔。
本实施例同时提供一种计算机可读存储介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现如所述的一种用户目标人群扩散方法。
本实施例所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读存储介质还可以是可读存储介质以外的任何可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
本实施例还提供了一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的一种用户目标人群扩散方法。
电子设备以通用计算设备的形式表现。其中处理器可以是一个,也可以是多个并且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的电子设备并不限于单一实体,也可以是多个实体设备的总和。
所述存储器存储有计算机可执行程序,通常是机器可读的代码。所述计算机可读程序可以被所述处理器执行,以使得电子设备能够执行本发明的方法,或者方法中的至少部分步骤。
所述存储器包括易失性存储器,例如随机存取存储单元(RAM)和/或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(ROM)。
应当理解,本发明的电子设备中还可以包括上述示例中未示出的元件或组件。例如,有些电子设备中还包括有显示屏等显示单元,有些电子设备还包括人机交互元件,例如按钮、键盘等。只要该电子设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的电子设备。
通过以上对实施方式的描述,本领域的技术人员易于理解,本发明可以由能够执行特定计算机程序的硬件来实现,例如本发明的系统,以及系统中包含的电子处理单元、服务器、客户端、手机、控制单元、处理器等。本发明也可以由执行本发明的方法的计算机软件来实现,例如由微处理器、电子控制单元,客户端、服务器端等执行的控制软件来实现。但需要说明的是,执行本发明的方法的计算机软件并不限于由一个或特定个的硬件实体中执行,其也可以是由不特定具体硬件的以分布式的方式来实现。对于计算机软件,软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中,也可以分布式存储于网络上,只要其能使得电子设备执行根据本发明的方法。
以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案,尽管本说明书参照上述的各个实施例对本发明已进行了详细的说明,但本发明不局限于上述具体实施方式,因此任何对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均涵盖在本发明的权利要求范围当中。
Claims (6)
1. 一种用户目标人群扩散方法,其特征在于,包括:
用户向量化表示
第一步,“人工配置”:人工选择模型训练所使用的特征及相应数据源,同时可根据业务场景灵活配置训练目标;
第二步,“模型训练”:算法模型根据人工配置,选取相应的网络结构搭建模型:所述的算法模型为针对单目标扩散时获取用户向量的双塔模型;所述双塔模型包括输入用户特征、输出用户向量的用户塔,和输入物品特征、输出物品向量的物品塔;
所述的算法模型为针对多目标扩散时获取用户向量的多塔模型;所述多塔模型包括输入用户特征、输出针对各个目标的用户目标向量的用户塔,和输入物品特征、输出物品向量的物品塔;
第三步,“用户向量化”:利用训练好的算法模型,输入每个用户的特征,得到全量用户不同目标下的用户向量,并存入用户全量数据库中;
目标种子人群包向量化表示
第一步,获取用户的历史数据,将用户划分为种子人群和非种子人群;
第二步,选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;
所述深度学习网络模型包括种子人群包向量单元和目标向量单元,将所述正样本数据输入种子人群包向量单元,将部分正样本数据和负样本数据输入目标向量单元进行深度学习训练,将种子人群包向量单元输出的种子人群包向量与目标向量单元输出的目标向量进行相似度计算,根据相似度计算结果反馈深度学习网络模型进行种子人群包向量单元和目标向量单元的参数优化;
所述正样本的N个多维用户向量输入种子人群包向量单元;
针对N个多维用户向量进行聚类分析,得到k个聚类中心向量,所述聚类中心的个数k根据人群包人数N的数量分段式调整;
将k个聚类中心向量输入注意力单元,得到种子人群包的全局向量表示;
人群扩散预测
第一步,由业务人员对人群扩散功能进行配置,配置目标种子人群包;
第二步,根据配置启动人群扩散预测,从用户全量数据库中提取满足限定条件的目标种子人群包的用户向量,输入人群扩散算法模型中得到目标种子人群包的向量化表示,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量;
第三步,计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包,单目标时计算一个相似度,多目标时计算多个相似度并进行加权平均计算。
2.根据权利要求1所述的一种用户目标人群扩散方法,其特征在于,接收用户配置的目标扩散人群的扩散条件,所述的扩散条件包括扩散人数、扩散限定条件及扩散目标,由用户全量数据库中提取满足扩散限定条件的目标用户构成目标扩散人群,获取目标扩散人群中各个目标扩散用户的目标扩散用户向量。
3.根据权利要求2所述的一种用户目标人群扩散方法,其特征在于,所述计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包括:
当所述扩散目标为单目标扩散时,计算目标扩散用户向量与种子人群包向量的单个相似度;
当所述扩散目标为多目标扩散时,分别计算每个目标扩散的相似度,将多个相似度进行加权平均计算得到多目标扩散相似度。
4.根据权利要求3所述的一种用户目标人群扩散方法,其特征在于,所述加权平均计算的加权权重通过用户配置,默认为等权重。
5.一种实现如权利要求1-4任意一项所述用户目标人群扩散方法的用户目标人群扩散装置,其特征在于,包括种子人群包向量化表示模块和目标人群扩散模块;
所述种子人群包向量化表示模块包括:
获取单元,获取用户的历史数据,将用户划分为种子人群和非种子人群;
人群扩散模型训练单元,选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;
所述目标人群扩散模块接收用户配置的目标种子人群包,输入人群扩散模型中得到目标种子人群包向量,计算用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量,计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。
6.一种计算机可读存储介质,存储有计算机可执行程序,其特征在于,所述计算机可执行程序被执行时,实现如权利要求1-4任意一项所述的一种用户目标人群扩散方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310024052.1A CN115713355B (zh) | 2023-01-09 | 2023-01-09 | 一种用户目标人群扩散方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310024052.1A CN115713355B (zh) | 2023-01-09 | 2023-01-09 | 一种用户目标人群扩散方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115713355A CN115713355A (zh) | 2023-02-24 |
CN115713355B true CN115713355B (zh) | 2023-05-26 |
Family
ID=85236202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310024052.1A Active CN115713355B (zh) | 2023-01-09 | 2023-01-09 | 一种用户目标人群扩散方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115713355B (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280670B (zh) * | 2017-01-06 | 2022-06-21 | 腾讯科技(深圳)有限公司 | 种子人群扩散方法、装置以及信息投放系统 |
CN110147882B (zh) * | 2018-09-03 | 2023-02-10 | 腾讯科技(深圳)有限公司 | 神经网络模型的训练方法、人群扩散方法、装置及设备 |
CN110162703B (zh) * | 2019-05-13 | 2024-08-20 | 深圳市雅阅科技有限公司 | 内容推荐方法、训练方法、装置、设备及存储介质 |
CN110738529A (zh) * | 2019-10-21 | 2020-01-31 | 秒针信息技术有限公司 | 用户扩散方法、装置、可读存储介质及电子设备 |
CN114048294B (zh) * | 2022-01-11 | 2022-04-08 | 智者四海(北京)技术有限公司 | 相似人群扩展模型训练方法、相似人群扩展方法和装置 |
-
2023
- 2023-01-09 CN CN202310024052.1A patent/CN115713355B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115713355A (zh) | 2023-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11574139B2 (en) | Information pushing method, storage medium and server | |
CN108320171B (zh) | 热销商品预测方法、系统及装置 | |
US20220172258A1 (en) | Artificial intelligence-based product design | |
CN112380449B (zh) | 信息推荐方法、模型训练方法及相关装置 | |
Saleh | Machine Learning Fundamentals: Use Python and scikit-learn to get up and running with the hottest developments in machine learning | |
CA3114298C (en) | Recommendation method and system and method and system for improving a machine learning system | |
CN110263979A (zh) | 基于强化学习模型预测样本标签的方法及装置 | |
Sun et al. | Research on customer lifetime value based on machine learning algorithms and customer relationship management analysis model | |
US20230351473A1 (en) | Apparatus and method for providing user's interior style analysis model on basis of sns text | |
CN115033801A (zh) | 物品推荐方法、模型训练方法及电子设备 | |
CN114219562A (zh) | 模型的训练方法、企业信用评估方法和装置、设备、介质 | |
Ranggadara et al. | Applying customer loyalty classification with RFM and Naïve Bayes for better decision making | |
Chang et al. | A novel approach to market segmentation selection using artificial intelligence techniques | |
CN109285034B (zh) | 一种向人群投放业务的方法和装置 | |
CN111461757A (zh) | 信息处理方法及装置、计算机存储介质、电子设备 | |
Vaganov et al. | Forecasting purchase categories with transition graphs using financial and social data | |
CN112966768A (zh) | 用户数据的分类方法、装置、设备和介质 | |
CN115713355B (zh) | 一种用户目标人群扩散方法、装置及存储介质 | |
CN111768218A (zh) | 用于处理用户交互信息的方法和装置 | |
Liu et al. | A machine learning approach to predict customer churn of a delivery platform | |
CN114298118B (zh) | 一种基于深度学习的数据处理方法、相关设备及存储介质 | |
CN114328992A (zh) | 多媒体信息推荐方法、装置、程序产品、设备以及介质 | |
Mootha et al. | A Stacking Ensemble of Multi Layer Perceptrons to Predict Online Shoppers' Purchasing Intention | |
Monir et al. | Multi dimensional Hidden markov model for credit scoring systems in Peer-To-Peer (P2P) lending | |
CN113496236A (zh) | 用户标签信息确定方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 1501, 15th Floor, Building 7, No.13 Huayuan Road, Haidian District, Beijing, 100088 Applicant after: Beijing Shushi yunchuang Technology Co.,Ltd. Address before: No. 805, Floor 8, Building A, Zhizhen Building, No. 7, Zhichun Road, Haidian District, Beijing, 100088 Applicant before: Beijing Shushi yunchuang Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |