CN112685639A - 活动推荐方法、装置、计算机设备和存储介质 - Google Patents
活动推荐方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112685639A CN112685639A CN202011621696.1A CN202011621696A CN112685639A CN 112685639 A CN112685639 A CN 112685639A CN 202011621696 A CN202011621696 A CN 202011621696A CN 112685639 A CN112685639 A CN 112685639A
- Authority
- CN
- China
- Prior art keywords
- user
- activity
- target user
- type
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000694 effects Effects 0.000 title claims abstract description 501
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 79
- 230000006399 behavior Effects 0.000 claims description 52
- 238000012549 training Methods 0.000 claims description 38
- 238000007477 logistic regression Methods 0.000 claims description 37
- 230000011218 segmentation Effects 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000001816 cooling Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 239000002699 waste material Substances 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种活动推荐方法、装置、计算机设备和存储介质。所述方法包括:获取待推荐活动的目标用户的用户信息,并根据目标用户的用户信息确定出目标用户的用户类型,用户类型为活跃用户类型、非活跃用户类型或新用户类型;通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表;选取推荐活动列表中的至少一个活动向目标用户推荐。采用本方法能够提高活动推荐的精准度,有效避免网络资源浪费。
Description
技术领域
本申请涉及智能推荐技术领域,特别是涉及一种活动推荐方法、装置、计算机设备和存储介质。
背景技术
近年来,随着互联网的飞速发展,用户可接触到的网上信息量大幅增加,然而用户用于浏览各类网站、APP的时间有限,可展示给用户的活动却太过冗余,使得用户在面对大量活动时需要浪费很多时间来进行筛选。为了解决这个问题,目前通常采用活动推荐方法从大量活动中选取出用户可能感兴趣的活动来向用户进行精准推荐。
现阶段使用较多的活动推荐方法主要是采用协同过滤算法或者基于规则策略来进行推荐。
协同过滤算法大体上分两种:一种是基于用户的协同过滤算法,主要是针对用户对活动的偏好行为进行统计计算,根据每个用户对所有营销活动的偏好行为,构建用户行为矩阵,每一条数据为一个偏好行为向量,利用相似度计算方法找到找出具有相似用户行为的用户客群,在该用户客群的用户之间交叉推荐偏好营销活动,这种方法可以实现跨领域推荐,但在实际应用场景中,很难真实计算出相似用户,所以准确率较低;另一种是基于活动的协同过滤算法,与前者相似,不过计算的主体是活动,计算活动之间的相似度,再根据用户的行为数据推荐用户还未点击过的活动,此算法能够得到一定时间范围内活动之间的相似度,比较准确和稳定,但是就其原理所述与活动推荐的实际场景而言,推荐相似活动往往导致推荐的范围太窄,推荐内容丰富度低,而且活动更新、修改等操作会对计算矩阵有严重影响,业务侧数据与后端数据库同步的时效性有待解决。上述两种方法都无法有效解决冷启动的问题,对无用户行为的用户较难给出合理的推荐列表。
基于规则的推荐算法是业务运营人员结合实际运营目标和平台用户行为情况,设定规则策略以针对用户群体进行推荐,这种方法取决于业务人员的经验和公司资源投入,主观性过强,推荐精准度差。
从服务器角度而言,活动推荐精准度差和丰富度低不仅会造成不必要的网站和APP页面位置的浪费,还必然会增加用户与服务器之间不必要的信息交互,从而给服务器增加了额外的负担,造成网络资源的浪费。
发明内容
基于此,有必要针对上述技术问题,提供一种覆盖面广且精准度高的活动推荐方法、装置、计算机设备和存储介质,能够有效避免网络资源浪费。
一种活动推荐方法,所述方法包括:
获取待推荐活动的目标用户的用户信息,并根据目标用户的用户信息确定出目标用户的用户类型,用户类型为活跃用户类型、非活跃用户类型或新用户类型;
通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表,在目标用户的用户类型为活跃用户类型时,使用的推荐算法为训练好的基于梯形提升树和逻辑回归的推荐模型,在目标用户的用户类型为非活跃用户类型时,使用的推荐算法为基于用户相似度的推荐算法,在目标用户的用户类型为新用户类型时,使用的推荐算法为基于活动热度的推荐算法;
选取推荐活动列表中的至少一个活动向目标用户推荐。
在其中一个实施例中,根据目标用户的用户信息确定出目标用户的用户类型,包括:
在确定用户信息包括用户属性数据和用户行为数据时,确定目标用户的用户类型为活跃用户类型;
在确定用户信息包括用户属性数据且不包括用户行为数据时,确定目标用户的用户类型为非活跃用户类型;
在确定用户信息既不包括用户属性数据又不包括用户行为数据时,确定目标用户的用户类型为新用户类型。
在其中一个实施例中,通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表,包括:
在目标用户的用户类型为活跃用户类型或新用户类型时,获取目标用户对应的候选活动集合,通过目标用户的用户类型对应的推荐算法从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到目标用户对应的推荐活动列表;
在目标用户的用户类型为非活跃用户类型时,获取当前的活跃用户集合中各活跃用户的用户属性数据,根据目标用户的用户属性数据和各活跃用户的用户属性数据计算得到目标用户与各活跃用户之间的相似度,获取与目标用户之间相似度最高的活跃用户对应的推荐活动列表,将该推荐活动列表作为目标用户对应的推荐活动列表,各活跃用户的用户类型为活跃用户类型。
在其中一个实施例中,通过目标用户的用户类型对应的推荐算法从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到目标用户对应的推荐活动列表,包括:
在目标用户的用户类型为活跃用户类型时,根据目标用户的用户行为数据计算得到目标用户对于各活动类别的偏好值,将目标用户对于各活动类别的偏好值作为目标用户的用户属性数据中的一项;
对目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据进行预处理;
将处理后的目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据输入训练好的基于梯形提升树和逻辑回归的推荐模型进行预测,选取出预测值大于预设阈值的各候选活动,根据预测值对各预测值大于预设阈值的候选活动进行排序,得到目标用户对应的推荐活动列表;
优选地,活动属性数据包括活动中文名称,对目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据进行预处理,包括:
对候选活动集合中各候选活动的活动中文名称进行分词处理,得到各候选活动的活动中文名称分词结果,通过word2vec模型对各活动中文名称分词结果进行数值型变换得到各候选活动的活动中文名称对应的数值型向量;以及,
对目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据中除活动中文名称以外的各项数据进行缺失值处理和向量化处理。
在其中一个实施例中,获取与目标用户之间相似度最高的活跃用户对应的推荐活动列表之前,包括:
获取与目标用户之间相似度最高的活跃用户对应的候选活动集合;
通过训练好的基于梯形提升树和逻辑回归的推荐模型从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到与目标用户之间相似度最高的活跃用户对应的推荐活动列表。
在其中一个实施例中,通过目标用户的用户类型对应的推荐算法从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到目标用户对应的推荐活动列表,包括:
在目标用户的用户类型为新用户类型时,获取候选活动集合中各候选活动在预设时间段内的活动热度数据;
通过牛顿冷却定律对各候选活动在预设时间段内的活动热度数据进行计算得到各候选活动的当前热度预测值,根据当前热度预测值选取出符合预设条件的候选活动;
根据当前热度预测值对各符合预设条件的候选活动进行排序,得到目标用户对应的推荐活动列表。
在其中一个实施例中,基于梯形提升树和逻辑回归的推荐模型为根据训练数据集进行训练而生成的,训练数据集包括多组训练数据组合以及每组训练数据组合对应的标签信息,每组训练数据组合包括预处理过的样本用户的用户属性数据以及样本活动的活动属性数据,样本用户的用户类型为活跃用户类型;
用户属性数据包括样本用户对于各活动类别的偏好值,偏好值为根据样本用户的用户行为数据计算得到的;
预处理过的活动属性数据包括样本活动的活动中文名称对应的数值型向量,样本活动的活动中文名称对应的数值型向量为对样本活动的活动中文名称分词处理后,再通过word2vec模型对活动中文名称分词结果进行变换得到的;
优选地,通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表之后,还包括:筛选出推荐活动列表中处于有效状态的各候选活动,根据处于有效状态的各候选活动得到目标用户对应的有效推荐活动列表;
选取推荐活动列表中的至少一个活动向目标用户推荐,包括:选取有效推荐活动列表中的至少一个活动向目标用户推荐。
一种活动推荐装置,所述装置包括:
第一获取模块,用于获取待推荐活动的目标用户的用户信息,并根据目标用户的用户信息确定出目标用户的用户类型,用户类型为活跃用户类型、非活跃用户类型或新用户类型;
第二获取模块,用于通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表,在目标用户的用户类型为活跃用户类型时,使用的推荐算法为训练好的基于梯形提升树和逻辑回归的推荐模型,在目标用户的用户类型为非活跃用户类型时,使用的推荐算法为基于用户相似度的推荐算法,在目标用户的用户类型为新用户类型时,使用的推荐算法为基于活动热度的推荐算法;
活动推荐模块,用于选取推荐活动列表中的至少一个活动向目标用户推荐。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该计算机程序时实现上述任一方法的实施例的步骤。
一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一方法的实施例的步骤。
在上述实施例中,服务器根据待推荐活动的目标用户的用户信息来确定出该目标用户的用户类型,然后通过用户类型对应的推荐算法获取该目标用户对应的推荐活动列表,并基于该推荐活动列表为该目标用户推荐活动,其中,不同用户类型的用户使用不同的推荐算法,使用训练好的基于梯度提升树和逻辑回归的推荐模型,有效地提高了推荐模型性能,并且使用了基于用户相似度的推荐算法以及基于活动热度的推荐算法对剩余用户进行了覆盖,使得每个用户都能够有适合的算法为其推荐活动,从而覆盖了活动推荐过程中的绝大部分情况,能够提高活动推荐的精准度和丰富度,避免网络资源的浪费。
附图说明
图1为一个实施例中活动推荐方法的应用环境图;
图2为一个实施例中活动推荐方法的流程示意图;
图3为一个实施例中活动推荐方法的工作架构示意图;
图4为一个实施例中基于梯度提升树和逻辑回归的推荐模型的架构图;
图5为一个实施例中活跃用户的推荐活动列表获取步骤的流程示意图;
图6为一个实施例中活动中文名称的处理步骤的流程示意图;
图7为一个实施例中非活跃用户的推荐活动列表获取步骤的流程示意图;
图8为一个实施例中新用户的推荐活动列表获取步骤的流程示意图;
图9为一个实施例中活动推荐装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例一
在本实施例中,本申请提供的活动推荐方法可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104获取待推荐活动的目标用户的用户信息,并根据该目标用户的用户信息确定出目标用户的用户类型,用户类型为活跃用户类型、非活跃用户类型或新用户类型;并通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表,再选取推荐活动列表中的至少一个活动向使用终端102浏览网页或APP页面的目标用户推荐。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本实施例提供的一种活动推荐方法包括如图2所示的步骤,以下以该方法应用于图1中的服务器为例进行说明。
步骤202,获取待推荐活动的目标用户的用户信息,并根据目标用户的用户信息确定出目标用户的用户类型,用户类型为活跃用户类型、非活跃用户类型或新用户类型。
其中,上述目标用户的数量为至少一个,该目标用户的用户信息包括用户标识信息(例如用户编号),在一种实施方式中,用户信息还可以包括用户类型信息,根据该用户类型信息可以直接确定出目标用户的用户类型,以便后续步骤中可以更快地确定用于获取该目标用户对应的推荐活动列表的推荐算法。
在另一种实施方式中,用户信息可以不直接包括用户类型信息,此时不是由用户类型信息来得出用户类型,而是根据用户信息所包含的信息内容或具体数据类型来确定出该目标用户的用户类型。例如:频繁访问网站/APP的用户一般被称为活跃用户,除了用户通常具备的用户属性数据,由于经常访问网站/APP,这些活跃用户必然会留下与推荐活动相关的行为数据;而较少访问或近期很长时间内没有访问网站/APP的非活跃用户则往往只具备用户属性数据,缺少用户行为数据;对于第一次访问网站/APP的新用户,其用户信息往往不够完善,可能既不包括用户属性数据也不包括用户行为数据。在实际应用中,目标用户属于哪种用户类型可根据实际需要设为定时更新。
在一个实施方式中,服务器可以根据目标用户的用户信息确定出目标用户的用户类型,包括以下步骤:
在确定用户信息包括用户属性数据和用户行为数据时,确定目标用户的用户类型为活跃用户类型;在确定用户信息包括用户属性数据且不包括用户行为数据时,确定目标用户的用户类型为非活跃用户类型;在确定用户信息既不包括用户属性数据又不包括用户行为数据时,确定目标用户的用户类型为新用户类型。
其中,用户属性数据可以有用户基础信息、用户价值属性信息和用户兴趣偏好信息等,用户行为数据可以有用户对营销活动的曝光数据、点击数据和浏览时长等。具体实施时,因为距离现在时间太久的数据缺少参考价值,用户行为数据一般选取目标用户在当前时间点之前一定时间段内的行为数据,比如1个月、3个月或1年等,也就是说,如果某个活跃用户在距今很长一段时间内都没有访问网站/APP,则该活跃用户可能会变得缺少用户行为数据,从而被判定为非活跃用户。
该实施例可以根据用户信息所包含的信息种类来确定目标用户的用户类型,由于随着时间推移,不同用户类型之间经常发生转化,比如新用户经常访问就会变成活跃用户,而且这种用户类型的转化与用户信息所包含的信息种类存在关联,因此根据用户信息所包含的信息种类来确定用户类型可以更及时地更新目标用户的用户类型,即在确定用户类型上具有更好的时效性,便于后续采用更合适的算法来获取目标用户对应的推荐活动列表,从而能够实现更精准地向用户进行活动推荐。
步骤204,通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表,在目标用户的用户类型为活跃用户类型时,使用的推荐算法为训练好的基于梯形提升树和逻辑回归的推荐模型,在目标用户的用户类型为非活跃用户类型时,使用的推荐算法为基于用户相似度的推荐算法,在目标用户的用户类型为新用户类型时,使用的推荐算法为基于活动热度的推荐算法。
其中,训练好的基于梯形提升树和逻辑回归的推荐模型也可写作GBDT+LR模型,其中,GBDT(Gradient Boosting Decision Tree)即梯形提升树模型,LR(LogisticRegression)是逻辑回归算法。
具体地,根据上述目标用户的用户类型选取该用户类型对应的推荐算法,再使用该用户类型对应的推荐算法获取该目标用户的推荐活动列表。
在一个实施方式中,通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表,包括以下步骤:
在目标用户的用户类型为活跃用户类型或新用户类型时,获取目标用户对应的候选活动集合,通过目标用户的用户类型对应的推荐算法从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到目标用户对应的推荐活动列表。
进一步地,在该目标用户的用户类型为活跃用户类型时,该目标用户的用户信息包括用户属性数据和用户行为数据,根据用户行为数据计算该目标用户对于各活动类别的偏好值,然后将该目标用户对于各活动类别的偏好值作为目标用户的用户属性数据中的一项,得到该目标用户的当前用户属性数据;再获取该目标用户对应的候选活动集合,将该目标用户的当前用户属性数据和该候选活动集合输入训练好的基于梯形提升树和逻辑回归的推荐模型,得到该目标用户的推荐活动列表。在该目标用户的用户类型为新用户类型时,获取该目标用户对应的候选活动集合,计算该候选活动集合中各候选活动的当前热度预测值,根据各候选活动的当前热度预测值进行排序,可以得到该目标用户对应的推荐活动列表。
在目标用户的用户类型为非活跃用户类型时,获取当前的活跃用户集合中各个活跃用户的用户属性数据,根据目标用户的用户属性数据和各个活跃用户的用户属性数据计算得到目标用户与各个活跃用户之间的相似度,获取与目标用户之间相似度最高的活跃用户对应的推荐活动列表,将该推荐活动列表作为目标用户对应的推荐活动列表,各个活跃用户的用户类型为活跃用户类型。具体地,可以利用欧氏距离、余弦距离等相似度计算方法根据该非活跃用户的用户属性数据来计算该目标用户和当前各个活跃用户之间的相似度。
其中,上述训练好的基于梯形提升树和逻辑回归的推荐模型为根据训练数据集进行训练而生成的,训练数据集包括多组训练数据组合以及每组训练数据组合对应的标签信息,每组训练数据组合包括预处理过的样本用户的用户属性数据以及样本活动的活动属性数据,样本用户的用户类型为活跃用户类型。用户属性数据包括样本用户对于各活动类别的偏好值,偏好值为根据样本用户的用户行为数据计算得到的。预处理过的活动属性数据包括样本活动的活动中文名称对应的数值型向量,样本活动的活动中文名称对应的数值型向量为对样本活动的活动中文名称分词处理后,再通过word2vec模型对活动中文名称分词结果进行变换得到的。
在一个实施方式中,活动推荐方法的工作架构示意图如图3所示,构建推荐模型的过程如下:
(1)活动内容提取
样本活动的活动属性数据主要包括活动编号、活动中文名称、活动所属业务线、活动目标、活动状态等信息,本实施例中主要对样本活动的活动中文名称进行处理。首先构建活动中文名称相应的词库,包括自定义词库和停止词词库,以金融类的活动为例,可以将业务部门提供的活动列表中的非常用但却出现多次的特定词语,如“任性贷”、“任性付”等添加进自定义词库,对使用频率高但是无代表意义的词语和常见标点符号,例如逗号、句号、冒号、数字、“的”、“们”、“也”等,添加到停止词词库;再使用jieba分词对活动中文名称处理,得到分隔开的词语序列,例如活动1对应的中文名称分词结果为[“银行”,“存款”],用此序列代替原活动中文名称,再使用word2vec模型对(1)中得到的中文名称分词结果进行数值型变换,得到一个数值型向量,从而实现了中文名称特征到数值型向量的转换。
(2)数据处理及特征工程
用户属性数据可以有用户基础信息、用户价值属性信息和用户兴趣偏好信息,用户行为数据可以包括用户对营销活动的曝光数据、点击数据、浏览时长和购买数据。其中,用户兴趣偏好信息为用户对于各活动类别的偏好值,根据该用户的用户行为数据可以计算得到该用户对于各活动类别的偏好值。
对样本用户的用户属性数据以及样本活动的活动属性数据进行预处理,也即对用户属性数据和活动属性数据中各项特征进行数据处理,例如:对上述各项特征分别进行缺失值统计,删除缺失率大于30%的特征,并利用平均值和众数按不同类型特征进行缺失值填充,再删除其中单值占比超过80%的特征;对填充完成的特征中的类别型特征使用StringToIndex函数转为数值型,再使用one-hot编码对其中的离散型特征进行特征变换。
(3)构建基于梯形提升树(GBDT)和逻辑回归(LR)的推荐模型
根据样本用户的用户行为数据,可以得到样本用户对某一活动的点击情况,根据下述预设指标对(2)中得到的数据打上标签。
其中,label为一条数据的标签,click为此条数据中用户对活动的点击情况,click=0为未点击,click=1为点击,duration为浏览时长,单位为秒。样本数据形式为“用户-活动-label”,其中用户部分为用户相关信息、活动部分为某一个活动及其相关信息(包含所有用户点击的活动和抽样的部分未点击活动),可以将“用户-活动”视为一个训练数据组合,则label为每组训练数据组合对应的标签信息,对样本数据进行抽样,得到正负样本基本相当的训练数据,按照8:2的比例从中抽取并形成训练数据集和测试数据集。在推荐模型训练期间,这里的活动采用jieba分词和word2vec模型来获取活动中文名称的数值型向量,将该数值型向量作为推荐模型的训练数据,从而能够在推荐活动预测阶段,出现训练时未有的活动名称时,本实施例也能够按照上述word2vec模型自动将新的活动中文名称转为数值型向量,避免了仅适用活动编号带来的预测错误及无法预测的情况。
构建GBDT模型,通过训练及调优,最终设置超参数最大深度为7、采用3折交叉验证的GBDT模型效果最佳,测试准确率最高,由于GBDT分类模型最终的叶子节点数据需要经过Softmax函数输出得到分类结果,所以将训练数据经过调完参的GBDT模型后,取出倒数第二层的输出数据,也就是叶子节点的输出数据,形成一个新的向量,将其作为新的特征加入到训练数据的原始特征中,再将这些组合特征共同放入LR模型中,训练得到最终的分类器,最终模型在测试集上的准确率为92.1%。基于梯度提升树和逻辑回归的推荐模型的架构图如图4所示。
传统方法一般采用对用户进行N个营销活动的多分类建模,但N分类模型的精确度比二分类模型的精确度低,所以本申请的实施例将N分类转为了二分类问题,大幅提高了模型的稳定性,而且GBDT算法可以从二叉树的角度对样本空间进行划分和组合,获得特征的高维度属性和非线性关系,具有很强的拟合能力和泛化能力,所以为了充分获取特征关系和提高模型性能,利用GBDT对特征进行提取,获取模型提取特征,并添加进原始特征,得到组合特征后再由LR模型训练得到上述训练号的基于梯度提升树和逻辑回归的推荐模型,该推荐模型的推荐精确度和丰富度更高。
步骤206,选取推荐活动列表中的至少一个活动向目标用户推荐。
其中,推荐活动列表可以包括多个活动,这些活动可按推荐优先度高低依次排序,此处的推荐优先度可以为活动被点击的预测概率,被点击的预测概率大的活动会被优先推荐给目标用户。实际应用场景下,当一个用户访问网页/APP时,被访问的页面可能存在多个用于展示推荐活动的展示位,因此每次向目标用户进行活动推荐时,可以选取多个活动分别在各个展示位进行显示以实现推荐。
待推荐的活动通常是设置有效期,比如圣诞节促销活动只限于圣诞节前后一段时期,为了进一步实现精准推荐,保证向目标用户推荐的活动均为有效活动,在一个实施方式中,通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表之后,还包括:筛选出推荐活动列表中处于有效状态的各候选活动,根据处于有效状态的各候选活动得到目标用户对应的有效推荐活动列表。此时,选取推荐活动列表中的至少一个活动向目标用户推荐,包括:选取有效推荐活动列表中的至少一个活动向目标用户推荐。
本申请实施例在金融类营销活动的弹窗、浮层和banner等推荐场景中都适用。在具体实施场景中,本实施例中的活动推荐方法还可以结合业务规则使用,例如大促期间需要优先推荐某活动、某活动只能在周一到周四推荐等业务规则。
上述活动推荐方法中,先根据待推荐活动的目标用户的用户信息确定用户类型,再通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表,其中,不同用户类型的用户使用不同的推荐算法,使用训练好的基于梯度提升树和逻辑回归的推荐模型,有效地提高了推荐模型性能,并且使用了基于用户相似度的推荐算法以及基于活动热度的推荐算法对剩余用户进行了覆盖,使得每个用户都能够有适合的算法为其推荐活动,从而覆盖了活动推荐过程中的绝大部分情况,能够提高活动推荐的精准度和丰富度,避免网络资源的浪费。
实施例二
如图5所示,上述实施例中通过目标用户的用户类型对应的推荐算法从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到目标用户对应的推荐活动列表的步骤,具体包括以下步骤:
步骤302,在目标用户的用户类型为活跃用户类型时,根据目标用户的用户行为数据计算得到目标用户对于各活动类别的偏好值,将目标用户对于各活动类别的偏好值作为目标用户的用户属性数据中的一项。
其中,目标用户的用户行为数据包括该目标用户对各项活动的点击信息、购买信息以及各项活动曝光给该目标用户的次数。
具体地,将点击的元素、购买的商品等信息进行分类,根据以下公式计算目标用户对某一活动类别的偏好程度,得到该活动类别的偏好值,具体公式如下所示;
其中,Scoreui为用户u对i活动类别的兴趣偏好分数,i活动类别可以为保险、理财、基金等,p为属于i活动类别的活动,c元素是属于i活动类别的p活动在向用户推荐时在页面上显示的页面元素,Expouc为c元素曝光给u用户的次数,Cliuc为u用户对c元素的点击次数,Buyup为u用户对p商品的购买次数。
步骤304,对目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据进行预处理。
在一个实施方式中,活动属性数据包括活动中文名称,对候选活动集合中各候选活动的活动属性数据进行预处理,主要为对候选活动集合中各候选活动的活动中文名称进行处理,如图6所示,步骤304可以包括以下步骤:
步骤402,对候选活动集合中各候选活动的活动中文名称进行分词处理,得到各候选活动的活动中文名称分词结果。
步骤404,通过word2vec模型对各活动中文名称分词结果进行数值型变换得到各候选活动的活动中文名称对应的数值型向量。
具体地,使用jieba中文分词的精确模式结合预设的停止词词库与自定义词库,对营销活动名称进行分词处理,得到每个活动的活动中文名称分词结果。上述预设的停止词词库与自定义词库可以使用与实施例一中相同的停止词词库与自定义词库。再通过word2vec模型对各活动中文名称分词结果进行数值型变换,可以得到各候选活动的活动中文名称对应的数值型向量。
步骤304还包括以下步骤:对目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据中除活动中文名称以外的各项数据进行缺失值处理和向量化处理。
具体地,首先对目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据中除活动中文名称以外的各项数据进行缺失率统计,对于缺失超过30%的数据项进行删除,统计每项数据的值分布情况,对于单值占比超过80%的数据项进行删除;针对不同数据项,使用平均数和众数对缺失值进行填充,以保证各项数据的数据集没有空值;其次,对上述各项数据中的离散型特征进行向量化,使用one-hot编码,将所有离散型变量转为向量格式,以便得到符合推荐模型入参格式要求的数据。
步骤306,将处理后的目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据输入训练好的基于梯形提升树和逻辑回归的推荐模型进行预测,选取出预测值大于预设阈值的各候选活动。
步骤308,根据预测值对各预测值大于预设阈值的候选活动进行排序,得到目标用户对应的推荐活动列表;
具体地,在训练好的基于梯形提升树和逻辑回归的推荐模型进行预测时,取逻辑回归模型预测得到的但未做二值处理的连续型数值,取预测值大于预设阈值,并按照用户维度分组对预测值降序排列,得到用户的营销活动推荐列表。本实施例中可以根据业务需要将预测阈值设为0.5或其他任意值。
在本实施例中提供的该活动推荐方法采用了训练好的基于梯形提升树和逻辑回归的推荐模型,该推荐模型能够利用梯形提升树模型本身优异的特征提取能力提取到训练数据的特征,再与原特征组合为新特征,利用逻辑回归模型训练,能够避免单纯的梯形提升树模型过拟合问题,提高推荐模型的泛化能力与精确度,得到更加精准和丰富的活动推荐结果;同时,能够利用jieba分词和word2vec模型将活动中文名称向量化以得到候选活动对应的数值型向量,使得即使出现训练时未有的活动名称,该基于梯形提升树和逻辑回归的推荐模型仍可根据输入的该数值型向量得到该候选活动的预测值,不会出现仅适用活动编号带来的预测错误及无法预测的情况。
实施例三
在上述的实施例一中,当目标用户为非活跃用户时,该目标用户的用户行为数据缺失,此时采用基于用户相似度的推荐算法,该推荐算法主要适用于具有用户属性数据但是缺少用户行为数据或者用户行为数据缺失严重的用户。如图7所示,获取非活跃用户对应的推荐活动列表包括:
步骤502,在目标用户的用户类型为非活跃用户类型时,获取当前的活跃用户集合中各活跃用户的用户属性数据,根据目标用户的用户属性数据和各活跃用户的用户属性数据计算得到目标用户与各活跃用户之间的相似度。
步骤504,获取与目标用户之间相似度最高的活跃用户对应的推荐活动列表,将该推荐活动列表作为目标用户对应的推荐活动列表,各活跃用户的用户类型为活跃用户类型。
具体地,计算无用户行为数据的目标用户的用户属性数据与各个活跃用户的用户属性数据之间的余弦相似度,计算公式如下所示:
其中,ui表示活跃用户的第i个用户特征,mi表示无行为数据用户(目标用户)的第i个用户特征,cosθ为目标用户m和用户u之间的相似度,该公式用来计算两个用户之间在用户属性维度的方面的相似度,两个用户越相似,cosθ的值就越接近1。在得到目标用户m与各个活跃用户的相似度以后,找到与目标用户最相似的用户,将此活跃用户由上述实施例中训练好的GBDT+LR模型得到的推荐结果赋给目标用户m。
具体地,步骤504包括:通过训练好的基于梯形提升树和逻辑回归的推荐模型从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到与目标用户之间相似度最高的活跃用户对应的推荐活动列表,上述计算的是余弦相似度,得到余弦值最大的用户即最相似用户,将最相似用户的推荐结果赋给用户行为数据缺失的用户,仅仅作为一种实施方式,具体实施时可以采用其他相似度计算方法,并不限于余弦相似度计算方法。步骤504的具体实施方式与实施例二中获取目标用户对应的推荐活动列表的步骤相同,在此不再赘述。
本实施例中提供的活动推荐方法,能够实现在用户具有用户属性数据但是缺少用户行为数据或者用户行为数据缺失严重的情况下,可以利用该用户的用户属性数据来计算该用户与现有的各个活跃用户之间的相似度,对这部分用户进行较为准确的推荐。
实施例四
已知实施例二中使用的推荐算法是基于活跃用户存在用户属性数据和用户行为数据的情况,实施例三中使用的推荐算法是基于用户存在用户属性数据的情况,而当用户是新用户,缺少用户属性数据和用户行为数据时,即冷启动时,使用基于热度的推荐算法对该类用户进行活动推荐。如图8所示,通过目标用户的用户类型对应的推荐算法从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到目标用户对应的推荐活动列表,包括以下步骤:
步骤602,在目标用户的用户类型为新用户类型时,获取候选活动集合中各候选活动在预设时间段内的活动热度数据。
其中,活动热度数据可以由候选活动在预设时间段内的点击数据和活动参与数据经过加权求和得到。具体地,分别提取候选活动集合中各候选活动在预设时间段内的点击数据和活动参与数据,进行加权求和,可以得到各候选活动的热度数据。进一步地,可以将预设时间段设为一周,这样避免计算量过大,同时也保证了用于预测的数据具有较好的时效性。
由于活动的热度数据也是符合自然界中的热度冷却定律的,本实施例可以利用牛顿冷却定律对前7天的数据计算得到当天的热度预测值。
步骤604,通过牛顿冷却定律对各候选活动在预设时间段内的活动热度数据进行计算得到各候选活动的当前热度预测值,根据当前热度预测值选取出符合预设条件的候选活动。计算公式如下所示:
其中,Scorei表示某项候选活动在第i天的热度值,ratio为冷却系数,inte为时间间隔系数,Score为由该项候选活动前D天的热度值得到的当天的热度预测值。具体实施时,可设置D为7,ratio为0.02,inte为24。
步骤606,根据当前热度预测值对各符合预设条件的候选活动进行排序,得到目标用户对应的推荐活动列表。
具体地,预设条件可以为预设的热度预测值范围,若某候选活动的当前热度预测值在该热度预测值范围内,则认为该候选活动符合预设条件。但实际实施时,也可以不设置热度预测值范围限制,而是将候选活动集合中所有候选活动都视为符合预设条件的候选活动,并按照步骤604得到的Score值对各候选活动进行降序排序,得到按照热度排序的推荐活动列表,进一步地,再按照各候选活动的状态,主要是有效性进行筛选,选取出处于有效状态的各候选活动从而得到目标用户对应的有效推荐活动列表,最后选取有效推荐活动列表中的至少一个活动向目标用户推荐。
在本实施例中提供的活动推荐方法,在用户是新用户,缺少用户属性数据和用户行为数据,即冷启动时,使用基于热度的推荐算法对该类用户进行活动推荐,本实施例中的技术方案能够在数据大范围缺失的情况下,利用活动本身的点击和参与情况,对活动进行热度的预测和排序,按照预测热度值对用户进行推荐。
应该理解的是,虽然图2-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例五
在本实施例中,如图9所示,提供了一种活动推荐装置,包括:第一获取模块110、第二获取模块120和活动推荐模块130,其中:
第一获取模块110,用于获取待推荐活动的目标用户的用户信息,并根据目标用户的用户信息确定出目标用户的用户类型,用户类型为活跃用户类型、非活跃用户类型或新用户类型;
第二获取模块120,用于通过用户类型对应的推荐算法获取目标用户对应的推荐活动列表,在目标用户的用户类型为活跃用户类型时,使用的推荐算法为训练好的基于梯形提升树和逻辑回归的推荐模型,在目标用户的用户类型为非活跃用户类型时,使用的推荐算法为基于用户相似度的推荐算法,在目标用户的用户类型为新用户类型时,使用的推荐算法为基于活动热度的推荐算法;
活动推荐模块130,用于选取推荐活动列表中的至少一个活动向目标用户推荐。
在一个实施方式中,第一获取模块110,用于在确定用户信息包括用户属性数据和用户行为数据时,确定目标用户的用户类型为活跃用户类型;在确定用户信息包括用户属性数据且不包括用户行为数据时,确定目标用户的用户类型为非活跃用户类型;在确定用户信息既不包括用户属性数据又不包括用户行为数据时,确定目标用户的用户类型为新用户类型。
在一个实施方式中,第二获取模块120,包括:
第一列表获取单元,用于在目标用户的用户类型为活跃用户类型或新用户类型时,获取目标用户对应的候选活动集合,通过目标用户的用户类型对应的推荐算法从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到目标用户对应的推荐活动列表;
第二列表获取单元,用于在目标用户的用户类型为非活跃用户类型时,获取当前的活跃用户集合中各活跃用户的用户属性数据,根据目标用户的用户属性数据和各活跃用户的用户属性数据计算得到目标用户与各活跃用户之间的相似度,获取与目标用户之间相似度最高的活跃用户对应的推荐活动列表,将该推荐活动列表作为目标用户对应的推荐活动列表,各活跃用户的用户类型为活跃用户类型。
在一个实施方式中,第一列表获取单元,用于在目标用户的用户类型为活跃用户类型时,根据目标用户的用户行为数据计算得到目标用户对于各活动类别的偏好值,将目标用户对于各活动类别的偏好值作为目标用户的用户属性数据中的一项;对目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据进行预处理;将处理后的目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据输入训练好的基于梯形提升树和逻辑回归的推荐模型进行预测,选取出预测值大于预设阈值的各候选活动,根据预测值对各预测值大于预设阈值的候选活动进行排序,得到目标用户对应的推荐活动列表;优选地,活动属性数据包括活动中文名称,第一列表获取单元,具体地用于对候选活动集合中各候选活动的活动中文名称进行分词处理,得到各候选活动的活动中文名称分词结果,通过word2vec模型对各活动中文名称分词结果进行数值型变换得到各候选活动的活动中文名称对应的数值型向量;以及,对目标用户的用户属性数据和候选活动集合中各候选活动的活动属性数据中除活动中文名称以外的各项数据进行缺失值处理和向量化处理。
在一个实施方式中,第二列表获取单元,还用于获取与目标用户之间相似度最高的活跃用户对应的候选活动集合;通过训练好的基于梯形提升树和逻辑回归的推荐模型从候选活动集合中选取出至少一个符合预设条件的候选活动,根据各符合预设条件的候选活动得到与目标用户之间相似度最高的活跃用户对应的推荐活动列表。
在一个实施方式中,第一列表获取单元,还用于在目标用户的用户类型为新用户类型时,获取候选活动集合中各候选活动在预设时间段内的活动热度数据;通过牛顿冷却定律对各候选活动在预设时间段内的活动热度数据进行计算得到各候选活动的当前热度预测值,根据当前热度预测值选取出符合预设条件的候选活动;根据当前热度预测值对各符合预设条件的候选活动进行排序,得到目标用户对应的推荐活动列表。
在一个实施方式中,基于梯形提升树和逻辑回归的推荐模型为根据训练数据集进行训练而生成的,训练数据集包括多组训练数据组合以及每组训练数据组合对应的标签信息,每组训练数据组合包括预处理过的样本用户的用户属性数据以及样本活动的活动属性数据,样本用户的用户类型为活跃用户类型;用户属性数据包括样本用户对于各活动类别的偏好值,偏好值为根据样本用户的用户行为数据计算得到的;预处理过的活动属性数据包括样本活动的活动中文名称对应的数值型向量,样本活动的活动中文名称对应的数值型向量为对样本活动的活动中文名称分词处理后,再通过word2vec模型对活动中文名称分词结果进行变换得到的。
在一个实施方式中,所述装置还包括:有效活动筛选模块,用于筛选出推荐活动列表中处于有效状态的各候选活动,根据处于有效状态的各候选活动得到目标用户对应的有效推荐活动列表;活动推荐模块130,具体用于选取有效推荐活动列表中的至少一个活动向目标用户推荐。
关于活动推荐装置的具体限定可以参见上文中对于活动推荐方法的限定,在此不再赘述。上述活动推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例六
在本实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现如上述实施例一至实施例四中所介绍的一种活动推荐方法的步骤。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
实施例七
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述实施例一至实施例四中所介绍的一种活动推荐方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种活动推荐方法,所述方法包括:
获取待推荐活动的目标用户的用户信息,并根据所述目标用户的用户信息确定出所述目标用户的用户类型,所述用户类型为活跃用户类型、非活跃用户类型或新用户类型;
通过所述用户类型对应的推荐算法获取所述目标用户对应的推荐活动列表,在所述目标用户的用户类型为活跃用户类型时,使用的推荐算法为训练好的基于梯形提升树和逻辑回归的推荐模型,在所述目标用户的用户类型为非活跃用户类型时,使用的推荐算法为基于用户相似度的推荐算法,在所述目标用户的用户类型为新用户类型时,使用的推荐算法为基于活动热度的推荐算法;
选取所述推荐活动列表中的至少一个活动向所述目标用户推荐。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户的用户信息确定出所述目标用户的用户类型,包括:
在确定所述用户信息包括用户属性数据和用户行为数据时,确定所述目标用户的用户类型为活跃用户类型;
在确定所述用户信息包括用户属性数据且不包括用户行为数据时,确定所述目标用户的用户类型为非活跃用户类型;
在确定所述用户信息既不包括用户属性数据又不包括用户行为数据时,确定所述目标用户的用户类型为新用户类型。
3.根据权利要求2所述的方法,其特征在于,所述通过所述用户类型对应的推荐算法获取所述目标用户对应的推荐活动列表,包括:
在所述目标用户的用户类型为活跃用户类型或新用户类型时,获取所述目标用户对应的候选活动集合,通过所述目标用户的用户类型对应的推荐算法从所述候选活动集合中选取出至少一个符合预设条件的候选活动,根据各所述符合预设条件的候选活动得到所述目标用户对应的推荐活动列表;
在所述目标用户的用户类型为非活跃用户类型时,获取当前的活跃用户集合中各活跃用户的用户属性数据,根据所述目标用户的用户属性数据和各所述活跃用户的用户属性数据计算得到所述目标用户与各所述活跃用户之间的相似度,获取与所述目标用户之间相似度最高的活跃用户对应的推荐活动列表,将该推荐活动列表作为所述目标用户对应的推荐活动列表,各所述活跃用户的用户类型为活跃用户类型。
4.根据权利要求3所述的方法,其特征在于,所述通过所述目标用户的用户类型对应的推荐算法从所述候选活动集合中选取出至少一个符合预设条件的候选活动,根据各所述符合预设条件的候选活动得到所述目标用户对应的推荐活动列表,包括:
在所述目标用户的用户类型为活跃用户类型时,根据所述目标用户的用户行为数据计算得到所述目标用户对于各活动类别的偏好值,将所述目标用户对于各活动类别的偏好值作为所述目标用户的用户属性数据中的一项;
对所述目标用户的用户属性数据和所述候选活动集合中各候选活动的活动属性数据进行预处理;
将处理后的所述目标用户的用户属性数据和所述候选活动集合中各候选活动的活动属性数据输入所述训练好的基于梯形提升树和逻辑回归的推荐模型进行预测,选取出预测值大于预设阈值的各候选活动,根据所述预测值对各所述预测值大于预设阈值的候选活动进行排序,得到所述目标用户对应的推荐活动列表;
优选地,所述活动属性数据包括活动中文名称,所述对所述目标用户的用户属性数据和所述候选活动集合中各候选活动的活动属性数据进行预处理,包括:
对所述候选活动集合中各候选活动的活动中文名称进行分词处理,得到各所述候选活动的活动中文名称分词结果,通过word2vec模型对各所述活动中文名称分词结果进行数值型变换得到各所述候选活动的活动中文名称对应的数值型向量;以及,
对所述目标用户的用户属性数据和所述候选活动集合中各候选活动的活动属性数据中除所述活动中文名称以外的各项数据进行缺失值处理和向量化处理。
5.根据权利要求3所述的方法,其特征在于,所述获取与所述目标用户之间相似度最高的活跃用户对应的推荐活动列表之前,包括:
获取与所述目标用户之间相似度最高的活跃用户对应的候选活动集合;
通过训练好的基于梯形提升树和逻辑回归的推荐模型从所述候选活动集合中选取出至少一个符合预设条件的候选活动,根据各所述符合预设条件的候选活动得到所述与所述目标用户之间相似度最高的活跃用户对应的推荐活动列表。
6.根据权利要求3所述的方法,其特征在于,所述通过所述目标用户的用户类型对应的推荐算法从所述候选活动集合中选取出至少一个符合预设条件的候选活动,根据各所述符合预设条件的候选活动得到所述目标用户对应的推荐活动列表,包括:
在所述目标用户的用户类型为新用户类型时,获取所述候选活动集合中各候选活动在预设时间段内的活动热度数据;
通过牛顿冷却定律对各所述候选活动在预设时间段内的活动热度数据进行计算得到各所述候选活动的当前热度预测值,根据所述当前热度预测值选取出符合预设条件的候选活动;
根据所述当前热度预测值对各所述符合预设条件的候选活动进行排序,得到所述目标用户对应的推荐活动列表。
7.根据权利要求1所述的方法,其特征在于,所述基于梯形提升树和逻辑回归的推荐模型为根据训练数据集进行训练而生成的,所述训练数据集包括多组训练数据组合以及每组所述训练数据组合对应的标签信息,每组所述训练数据组合包括预处理过的样本用户的用户属性数据以及样本活动的活动属性数据,所述样本用户的用户类型为活跃用户类型;
所述用户属性数据包括所述样本用户对于各活动类别的偏好值,所述偏好值为根据所述样本用户的用户行为数据计算得到的;
所述预处理过的活动属性数据包括所述样本活动的活动中文名称对应的数值型向量,所述样本活动的活动中文名称对应的数值型向量为对所述样本活动的活动中文名称分词处理后,再通过word2vec模型对所述活动中文名称分词结果进行变换得到的;
优选地,所述通过所述用户类型对应的推荐算法获取所述目标用户对应的推荐活动列表之后,还包括:筛选出所述推荐活动列表中处于有效状态的各候选活动,根据所述处于有效状态的各候选活动得到所述目标用户对应的有效推荐活动列表;
所述选取所述推荐活动列表中的至少一个活动向所述目标用户推荐,包括:选取所述有效推荐活动列表中的至少一个活动向所述目标用户推荐。
8.一种活动推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取待推荐活动的目标用户的用户信息,并根据所述目标用户的用户信息确定出所述目标用户的用户类型,所述用户类型为活跃用户类型、非活跃用户类型或新用户类型;
第二获取模块,用于通过所述用户类型对应的推荐算法获取所述目标用户对应的推荐活动列表,在所述目标用户的用户类型为活跃用户类型时,使用的推荐算法为训练好的基于梯形提升树和逻辑回归的推荐模型,在所述目标用户的用户类型为非活跃用户类型时,使用的推荐算法为基于用户相似度的推荐算法,在所述目标用户的用户类型为新用户类型时,使用的推荐算法为基于活动热度的推荐算法;
活动推荐模块,用于选取所述推荐活动列表中的至少一个活动向所述目标用户推荐。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011621696.1A CN112685639A (zh) | 2020-12-31 | 2020-12-31 | 活动推荐方法、装置、计算机设备和存储介质 |
CA3143808A CA3143808A1 (en) | 2020-12-31 | 2021-12-23 | Event promoting method, device, computer apparatus, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011621696.1A CN112685639A (zh) | 2020-12-31 | 2020-12-31 | 活动推荐方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112685639A true CN112685639A (zh) | 2021-04-20 |
Family
ID=75453824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011621696.1A Pending CN112685639A (zh) | 2020-12-31 | 2020-12-31 | 活动推荐方法、装置、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112685639A (zh) |
CA (1) | CA3143808A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034241A (zh) * | 2021-04-23 | 2021-06-25 | 中国平安人寿保险股份有限公司 | 一种产品信息推荐方法及计算机设备 |
CN113220749A (zh) * | 2021-05-25 | 2021-08-06 | 中国农业银行股份有限公司 | 业务数据的处理方法、装置和电子设备 |
CN116049573A (zh) * | 2023-03-28 | 2023-05-02 | 南京邮电大学 | 一种改进协同过滤的用户分级推荐方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532479A (zh) * | 2019-09-05 | 2019-12-03 | 北京思维造物信息科技股份有限公司 | 一种信息推荐方法、装置及设备 |
CN111159578A (zh) * | 2019-12-31 | 2020-05-15 | 第四范式(北京)技术有限公司 | 一种推荐对象的方法和系统 |
-
2020
- 2020-12-31 CN CN202011621696.1A patent/CN112685639A/zh active Pending
-
2021
- 2021-12-23 CA CA3143808A patent/CA3143808A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532479A (zh) * | 2019-09-05 | 2019-12-03 | 北京思维造物信息科技股份有限公司 | 一种信息推荐方法、装置及设备 |
CN111159578A (zh) * | 2019-12-31 | 2020-05-15 | 第四范式(北京)技术有限公司 | 一种推荐对象的方法和系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034241A (zh) * | 2021-04-23 | 2021-06-25 | 中国平安人寿保险股份有限公司 | 一种产品信息推荐方法及计算机设备 |
CN113034241B (zh) * | 2021-04-23 | 2024-06-11 | 中国平安人寿保险股份有限公司 | 一种产品信息推荐方法及计算机设备 |
CN113220749A (zh) * | 2021-05-25 | 2021-08-06 | 中国农业银行股份有限公司 | 业务数据的处理方法、装置和电子设备 |
CN113220749B (zh) * | 2021-05-25 | 2024-02-27 | 中国农业银行股份有限公司 | 业务数据的处理方法、装置和电子设备 |
CN116049573A (zh) * | 2023-03-28 | 2023-05-02 | 南京邮电大学 | 一种改进协同过滤的用户分级推荐方法 |
CN116049573B (zh) * | 2023-03-28 | 2023-09-01 | 南京邮电大学 | 一种改进协同过滤的用户分级推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CA3143808A1 (en) | 2022-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598206B (zh) | 文本语义识别方法、装置、计算机设备和存储介质 | |
CN108536800B (zh) | 文本分类方法、系统、计算机设备和存储介质 | |
CN112685639A (zh) | 活动推荐方法、装置、计算机设备和存储介质 | |
CN108520041B (zh) | 文本的行业分类方法、系统、计算机设备和存储介质 | |
CN114372573B (zh) | 用户画像信息识别方法、装置、计算机设备和存储介质 | |
CN110880006A (zh) | 用户分类方法、装置、计算机设备和存储介质 | |
WO2022127339A1 (zh) | 基于网站注册的用户画像生成方法、装置、设备和介质 | |
CN114371946B (zh) | 基于云计算和大数据的信息推送方法及信息推送服务器 | |
CN112801425B (zh) | 信息点击率的确定方法、装置、计算机设备和存储介质 | |
US20230342797A1 (en) | Object processing method based on time and value factors | |
CN112434216A (zh) | 一种投资项目的智能推介方法、装置、存储介质和计算机设备 | |
CN110321436A (zh) | 一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
CN116401379A (zh) | 金融产品数据推送方法、装置、设备及存储介质 | |
CN115080868A (zh) | 产品推送方法、装置、计算机设备、存储介质和程序产品 | |
CN114201652B (zh) | 一种基于标签分级的资讯召回排序方法、装置和设备 | |
CN115630221A (zh) | 终端应用界面展示数据处理方法、装置及计算机设备 | |
Song et al. | Incorporating research reports and market sentiment for stock excess return prediction: A case of mainland China | |
CN110598126A (zh) | 基于行为习惯的跨社交网络用户身份识别方法 | |
CN110389963A (zh) | 基于大数据的渠道效果识别方法、装置、设备和存储介质 | |
CN112685656A (zh) | 标签推荐方法及电子设备 | |
Yin et al. | Deep collaborative filtering: a recommendation method for crowdfunding project based on the integration of deep neural network and collaborative filtering | |
CN115080867B (zh) | 一种提案主题的推荐方法、装置、计算机设备和存储介质 | |
CN108920492B (zh) | 一种网页分类方法、系统、终端及存储介质 | |
CN116501957A (zh) | 用户标签画像处理方法、用户画像系统、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210420 |
|
RJ01 | Rejection of invention patent application after publication |