相似用户的挖掘方法及装置
技术领域
本说明书涉及信息挖掘技术领域,尤其涉及一种相似用户的挖掘方法及装置。
背景技术
线上产品售卖场景指的是在线通过对目标用户的广告触达达到促进销售的方案。在线上产品售卖场景中,通常会基于不同IOT(Internet of Things,物联网)产品的销售目标推荐不同的人群扩散方案。例如,保险售卖场景中对于不同险种,分别对其已有目标用户进行用户画像以及特征挖掘,从而找到相似的可能对不同险种感兴趣的目标用户。
发明内容
本说明书一个或多个实施例的目的是提供一种相似用户的挖掘方法及装置,用以实现准确高效地挖掘产品营销下的相似用户的目的。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
一方面,本说明书一个或多个实施例提供一种相似用户的挖掘方法,包括:
获取第一数据库中存储的与目标产品对应的用户行为信息;及,根据所述用户行为信息,确定与所述目标产品相关的基准用户及多个候选用户的用户信息;
从第二数据库中获取所述基准用户和各所述候选用户的特征信息;及,根据所述用户行为信息确定各所述候选用户针对所述目标产品的行为意图信息;
根据所述特征信息及所述行为意图信息,确定所述基准用户与各所述候选用户之间的匹配信息;
根据所述匹配信息,从所述多个候选用户中挖掘出满足预设匹配条件的目标用户。
在一个实施例中,所述针对所述目标产品的行为意图信息包括以下至少一项:
用户是否具有通过所述销售网页成功购买所述目标产品的购买行为信息;
用户是否具有浏览所述目标产品对应的销售网页、但重定向至其他网页的重定向行为信息;
用户是否具有成功购买由网络侧推送的、所述目标产品的相关产品的交叉行为信息。
在一个实施例中,所述匹配信息包括匹配值;
相应的,所述根据所述特征信息及所述行为意图信息,确定所述基准用户与各所述候选用户之间的匹配信息,包括:
按照预设的第一打分规则,为各所述候选用户的特征相关信息及所述行为意图信息进行打分,得到各所述候选用户分别对应的第一分值;其中,所述特征相关信息包括所述候选用户与所述基准用户之间的特征相似度和/或所述特征信息;
根据各所述候选用户分别对应的第一分值,确定所述基准用户与各所述候选用户之间的匹配值;
其中,所述第一打分规则包括:所述候选用户与所述基准用户之间的特征相似度和/或所述特征信息的特征浓度越高,对应的分值越高;及,所述行为意图信息与所述目标产品的匹配度越高,对应的分值越高。
在一个实施例中,所述根据所述特征信息及所述行为意图信息,确定所述基准用户与各所述候选用户之间的匹配信息,还包括:
确定所述基准用户的特征信息的特征浓度;
若所述特征浓度低于第一预设阈值,则根据所述基准用户及各所述候选用户的特征信息,并利用指定二分类模型对所述候选用户进行分类,得到分类结果;所述分类结果包括所述候选用户属于所述目标用户的概率;
按照预设的第二打分规则,为所述分类结果进行打分,得到各所述候选用户分别对应的第二分值;其中,所述第二打分规则包括:所述候选用户属于所述目标用户的概率越大,对应的分值越高;
相应的,所述根据各所述候选用户分别对应的第一分值,确定所述基准用户与各所述候选用户之间的匹配值,包括:
根据所述各所述候选用户分别对应的所述第一分值及所述第二分值,确定所述基准用户与各所述候选用户之间的匹配值。
在一个实施例中,所述根据各所述候选用户分别对应的所述第一分值及所述第二分值,确定所述基准用户与各所述候选用户之间的匹配值,包括:
确定所述第一分值及所述第二分值分别对应的权重;
根据所述第一分值及所述第二分值分别对应的权重,对所述第一分值及所述第二分值进行加权计算,得到所述候选用户对应的综合分值;
确定所述候选用户对应的所述综合分值为所述基准用户与所述候选用户之间的匹配值。
在一个实施例中,所述预设匹配条件包括所述基准用户与各所述候选用户之间的匹配值高于第二预设阈值。
在一个实施例中,所述从所述多个候选用户中挖掘出满足预设匹配条件的目标用户,包括:
从所述多个候选用户中挖掘出满足预设匹配条件、且符合所述目标产品对应的预设挖掘规则的目标用户;其中,所述预设挖掘规则包括所述候选用户的用户信息满足指定条件的规则。
另一方面,本说明书一个或多个实施例提供一种相似用户的挖掘装置,包括:
第一获取模块,用于获取第一数据库中存储的与目标产品对应的用户行为信息;及,根据所述用户行为信息,确定与所述目标产品相关的基准用户及多个候选用户的用户信息;
第二获取模块,用于从第二数据库中获取所述基准用户和各所述候选用户的特征信息;及,根据所述用户行为信息确定各所述候选用户针对所述目标产品的行为意图信息;
确定模块,用于根据所述特征信息及所述行为意图信息,确定所述基准用户与各所述候选用户之间的匹配信息;
挖掘模块,用于根据所述匹配信息,从所述多个候选用户中挖掘出满足预设匹配条件的目标用户。
在一个实施例中,所述针对所述目标产品的行为意图信息包括以下至少一项:
用户是否具有通过所述销售网页成功购买所述目标产品的购买行为信息;
用户是否具有浏览所述目标产品对应的销售网页、但重定向至其他网页的重定向行为信息;
用户是否具有成功购买由网络侧推送的、所述目标产品的相关产品的交叉行为信息。
在一个实施例中,所述匹配信息包括匹配值;
相应的,所述确定模块包括:
打分单元,用于按照预设的第一打分规则,为各所述候选用户的特征相关信息及所述行为意图信息进行打分,得到各所述候选用户分别对应的第一分值;其中,所述特征相关信息包括所述候选用户与所述基准用户之间的特征相似度和/或所述特征信息;
第一确定单元,用于根据各所述候选用户分别对应的第一分值,确定所述基准用户与各所述候选用户之间的匹配值;
其中,所述第一打分规则包括:所述候选用户与所述基准用户之间的特征相似度和/或所述特征信息的特征浓度越高,对应的分值越高;及,所述行为意图信息与所述目标产品的匹配度越高,对应的分值越高。
在一个实施例中,所述确定模块还包括:
第二确定单元,用于确定所述基准用户的特征信息的特征浓度;
分类单元,用于若所述特征浓度低于第一预设阈值,则根据所述基准用户及各所述候选用户的特征信息,并利用指定二分类模型对所述候选用户进行分类,得到分类结果;所述分类结果包括所述候选用户属于所述目标用户的概率;
按照预设的第二打分规则,为所述分类结果进行打分,得到各所述候选用户分别对应的第二分值;
其中,所述第二打分规则包括:所述候选用户属于所述目标用户的概率越大,对应的分值越高;
相应的,所述第一确定单元还用于:
根据所述各所述候选用户分别对应的所述第一分值及所述第二分值,确定所述基准用户与各所述候选用户之间的匹配值。
在一个实施例中,所述第一确定单元还用于:
确定所述第一分值及所述第二分值分别对应的权重;
根据所述第一分值及所述第二分值分别对应的权重,对所述第一分值及所述第二分值进行加权计算,得到所述候选用户对应的综合分值;
确定所述候选用户对应的所述综合分值为所述基准用户与所述候选用户之间的匹配值。
在一个实施例中,所述预设匹配条件包括所述基准用户与各所述候选用户之间的匹配值高于第二预设阈值。
在一个实施例中,所述挖掘模块包括:
挖掘单元,用于从所述多个候选用户中挖掘出满足预设匹配条件、且符合所述目标产品对应的预设挖掘规则的目标用户;其中,所述预设挖掘规则包括所述候选用户的用户信息满足指定条件的规则。
再一方面,本说明书一个或多个实施例提供一种相似用户的挖掘设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取第一数据库中存储的与目标产品对应的用户行为信息;及,根据所述用户行为信息,确定与所述目标产品相关的基准用户及多个候选用户的用户信息;
从第二数据库中获取所述基准用户及和所述候选用户的特征信息;及,根据所述用户行为信息确定各所述候选用户针对所述目标产品的行为意图信息;
根据所述特征信息及所述行为意图信息,确定所述基准用户与各所述候选用户之间的匹配信息;
根据所述匹配信息,从所述多个候选用户中挖掘出满足预设匹配条件的目标用户。
再一方面,本申请实施例提供一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取第一数据库中存储的与目标产品对应的用户行为信息;及,根据所述用户行为信息,确定与所述目标产品相关的基准用户及多个候选用户的用户信息;
从第二数据库中获取所述基准用户和各所述候选用户的特征信息;及,根据所述用户行为信息确定各所述候选用户针对所述目标产品的行为意图信息;
根据所述特征信息及所述行为意图信息,确定所述基准用户与各所述候选用户之间的匹配信息;
根据所述匹配信息,从所述多个候选用户中挖掘出满足预设匹配条件的目标用户。
采用本说明书一个或多个实施例的技术方案,能够根据基准用户和各候选用户的特征信息及各候选用户针对目标产品的行为意图信息,来确定基准用户与各候选用户之间的匹配信息,进而根据基准用户与各候选用户之间的匹配信息,从多个候选用户中挖掘出满足预设匹配条件的目标用户。可见,该技术方案能够基于各候选用户的特征信息以及各候选用户针对目标产品的行为意图信息来挖掘相似用户,使得挖掘出的相似用户更能符合各用户的特征及对目标产品的意图,从而能够准确地向挖掘出的相似用户推送目标产品的相关广告,以提升目标产品的营销力。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本说明书一实施例的一种相似用户的挖掘方法的示意性流程图;
图2是根据本说明书一实施例的一种相似用户的挖掘装置的示意性框图;
图3是根据本说明书一实施例的一种相似用户的挖掘设备的示意性框图。
具体实施方式
本说明书一个或多个实施例提供一种相似用户的挖掘方法及装置,用以实现准确高效地挖掘产品营销下的相似用户的目的。
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书一个或多个实施例保护的范围。
图1是根据本说明书一实施例的一种相似用户的挖掘方法的示意性流程图,如图1所示,该方法包括:
S102,获取第一数据库中存储的与目标产品对应的用户行为信息;及,根据用户行为信息,确定与目标产品相关的基准用户及多个候选用户的用户信息。
其中,第一数据库用于存储与各产品分别对应的用户行为信息,包括用户对产品所在的销售页面所执行的任一种或多种行为信息,如对产品销售页面上的产品信息的浏览行为信息、对产品销售页面上的广告信息的浏览行为信息、通过产品销售页面购买产品的行为信息、通过一产品销售页面跳转至另一产品销售页面的行为信息、在产品销售页面上的停留时长信息等。各产品分别对应的用户行为信息可用于确定与各产品相关的基准用户、候选用户等。
与目标产品相关的基准用户可以是预先确定的、对目标产品的营销有一定帮助的用户(或用户群体),例如经常购买目标产品的用户、经常浏览目标产品所在的销售页面的用户、经常购买与目标产品相关的其他产品的用户等。
候选用户可以是随机选取的一些用户群体;也可以是按照预定规则初步筛选出的用户群体,如筛选出年龄段在20~40岁之间的用户作为候选用户,或筛选出每天经过指定地理位置的用户作为候选用户,等等;还可以是根据用户行为信息,筛选出对目标产品执行过某一(些)行为的用户作为候选用户,如筛选出浏览过目标产品所在的销售页面的用户作为候选用户。
S104,从第二数据库中获取基准用户和各候选用户的特征信息,及,根据用户行为信息确定各候选用户针对目标产品的行为意图信息。
其中,第二数据库用于存储各用户的特征信息,包括人脸信息、指纹信息、虹膜信息等任一种或多种可用于表征用户特征的信息。
S106,根据基准用户和各候选用户的特征信息及各候选用户针对目标产品的行为意图信息,确定基准用户与各候选用户之间的匹配信息。
S108,根据基准用户与各候选用户之间的匹配信息,从多个候选用户中挖掘出满足预设匹配条件的目标用户。
采用本说明书一个或多个实施例的技术方案,能够根据基准用户和各候选用户的特征信息及各候选用户针对目标产品的行为意图信息,来确定基准用户与各候选用户之间的匹配信息,进而根据基准用户与各候选用户之间的匹配信息,从多个候选用户中挖掘出满足预设匹配条件的目标用户。可见,该技术方案能够基于各候选用户的特征信息以及各候选用户针对目标产品的行为意图信息来挖掘相似用户,使得挖掘出的相似用户更能符合各用户的特征及对目标产品的意图,从而能够准确地向挖掘出的相似用户推送目标产品的相关广告,以提升目标产品的营销力。
在一个实施例中,针对目标产品的行为意图信息包括以下至少一项:
(1)用户是否具有通过销售网页成功购买目标产品的购买行为信息。
(2)用户是否具有浏览目标产品对应的销售网页、但重定向至其他网页的重定向行为信息。
其中,重定向行为指用户浏览了目标产品对应的销售网页、但并未通过所浏览的销售网页购买目标产品,而是跳转至其他网页进行相应操作(如浏览或购买操作)的行为。
(3)用户是否具有成功购买由网络侧推送的、目标产品的相关产品的交叉行为信息。
其中,目标产品的相关产品可包括但不限于以下产品:与目标产品属于同一类别的产品、与目标产品具有相同用途的产品、与目标产品具有相同使用者的产品等。若用户针对目标产品的相关产品执行了购买、页面浏览等操作,则认为用户执行了对目标产品的交叉行为。
例如,若目标产品为书桌,则目标产品的相关产品可以是办公椅、书等;若目标产品为雨伞,则目标产品的相关产品可以是遮阳伞、雨衣、雨鞋等。
在一个实施例中,匹配信息包括匹配度。根据候选用户针对目标产品的行为意图信息来确定基准用户与候选用户之间的匹配信息时,可判断候选用户是否具有针对目标产品的购买行为信息、重定向行为信息或交叉行为信息。若候选用户具有针对目标产品的购买行为信息,则说明候选用户与基准用户的匹配度较高;若候选用户具有针对目标产品的重定向行为,则说明候选用户与基准用户的匹配度较低,或者进一步判断候选用户是否具有针对目标产品的交叉行为信息;若候选用户具有针对目标产品的交叉行为信息,则说明候选用户与基准用户的匹配度较高。
在一个实施例中,匹配信息包括匹配值。根据基准用户和各候选用户的特征信息及各候选用户针对目标产品的行为意图信息确定基准用户与各候选用户之间的匹配信息时,可先按照预设的第一打分规则为各候选用户的特征相关信息及行为意图信息进行打分,得到各候选用户分别对应的第一分值;其中,特征相关信息包括候选用户与基准用户之间的特征相似度和/或特征信息;然后根据各候选用户分别对应的第一分值,确定基准用户与各候选用户之间的匹配值。
本实施例中,可利用现有的任一种特征相似度确定方法来确定候选用户与基准用户之间的特征相似度,例如,计算候选用户与基准用户的特征向量之间的向量距离,并根据该向量距离确定候选用户与基准用户之间的特征相似度,具体的,向量距离越近,对应的特征相似度越高;反之,向量距离越远,对应的特征相似度越低。
本实施例中,可利用现有的任一种特征识别模型来识别基准用户与各候选用户的特征信息,同时识别出各特征信息对应的特征浓度。特征浓度越高,说明对应的特征越显著;反之,特征浓度越低,说明对应的特征越弱。
本实施例中,预设的第一打分规则包括但不限于以下至少一项:
a、候选用户与基准用户之间的特征相似度越高,对应的分值越高。
b、特征信息的特征浓度越高,对应的分值越高。
c、行为意图信息与目标产品的匹配度越高,对应的分值越高。
其中,行为意图信息与目标产品的匹配度可根据用户针对目标产品实施的具体行为来确定。若候选用户具有针对目标产品的购买行为信息,则说明候选用户与基准用户的匹配度较高;若候选用户具有针对目标产品的重定向行为,则说明候选用户与基准用户的匹配度较低,或者进一步判断候选用户是否具有针对目标产品的交叉行为信息;若候选用户具有针对目标产品的交叉行为信息,则说明候选用户与基准用户的匹配度较高。
此外,行为意图信息与目标产品的匹配度还可根据候选用户针对目标产品实施的具体行为的其他信息来确定,其他信息如行为的执行频率、执行时间、执行次数等。
例如,若候选用户A与候选用户B均具有针对目标产品的购买行为信息,但由于候选用户A购买目标产品的次数高于候选用户B购买目标产品的次数,因此候选用户A与目标产品的匹配度高于候选用户B与目标产品的匹配度。
此外,可预先设置不同的匹配度级别,以及各匹配度级别与候选用户的相关信息对应的分值之间的对应关系。匹配度级别如高匹配度、中匹配度、低匹配度;或者一级匹配度、二级匹配度、三级匹配度等。
表1
匹配度级别 |
第一分值 |
一级 |
20 |
二级 |
40 |
三级 |
60 |
四级 |
80 |
五级 |
100 |
表1示例性地列举了匹配度级别与候选用户对应的第一分值之间的对应关系。其中,匹配度级别包括一级、二级、三级、四级及五级五个级别。各匹配度级别分别对应的第一分值除表1所示的具体分值之外,还可对应分值范围,
例如,当匹配度级别为一级时,对应的第一分值为0~20分;等等。
在一个实施例中,为各候选用户的特征信息打分时,若确定基准用户的特征信息所对应的特征浓度低于第一预设阈值,则还需要对利用二分类模型对候选用户进行分类得到的结果进行打分。因此,在为各候选用户的特征信息打分时,需确定基准用户的特征信息的特征浓度,进而判断基准用户的特征浓度是否低于第一预设阈值。若基准用户的特征浓度低于第一预设阈值,则根据基准用户及各候选用户的特征信息,并利用指定二分类模型对候选用户进行分类,得到分类结果;进而按照预设的第二打分规则,为指定二分类模型对候选用户进行分类的分类结果进行打分。其中,分类结果包括候选用户属于目标用户的概率。
其中,指定二分类模型可以是现有的任一种二分类模型。优选的,可选择pu-learning模型对各候选用户进行分类,在分类过程中,可将基准用户作为正样本,各候选用户作为无标注用户或者负样本。选择pu-learning模型对各候选用户进行分类的优点在于,pu-learning模型能够克服负样本不纯粹的问题,从而解决负样本中的噪音对模型分类结果的影响。
此外,指定二分类模型还可以是预先训练的多任务二分类模型。具体训练过程如下:首先,获取多个样本用户;其次,利用多种不同的二分类模型分别对各样本用户进行识别,以识别出各样本用户的特征信息;其中,二分类模型可包括用于识别用户性别的第一二分类模型、用于识别用户年龄的第二二分类模型、用于识别用户性格的第三二分类模型、用于识别用户喜好的第四二分类模型等;再次,利用样本用户及多种二分类模型所识别出的各样本用户的特征信息进行模型训练,得到多任务二分类模型。多任务二分类模型通过识别出候选用户的各特征信息,并利用各特征信息为候选用户进行分类。
例如,利用第一二分类模型识别出样本用户的用户年龄,利用第二二分类模型识别出样本用户的用户年龄,利用第三二分类模型识别出样本用户的用户性格,利用第四二分类模型识别出样本用户的用户喜好,然后将这些识别出的用户特征信息进一步用于训练多任务二分类模型,从而使训练出的多任务二分类模型具有很高的通用性,且多种二分类模型的交叉也能够使训练出的多任务二分类模型的识别能力更强。
本实施例中,预设的第二打分规则包括但不限于:候选用户属于目标用户的概率越大,对应的分值越高。
本实施例中,利用第一打分规则得到各候选用户分别对应的第一分值,以及利用第二打分规则得到各候选用户分别对应的第二分值后,可确定第一分值及第二分值分别对应的权重,并根据第一分值及第二分值分别对应的权重,对第一分值及第二分值进行加权计算,得到各候选用户分别对应的综合分值,该综合分值即为基准用户与各候选用户之间的匹配值。
在一个实施例中,预设匹配条件包括基准用户与各候选用户之间的匹配值高于第二预设阈值。因此,根据基准用户与各候选用户之间的匹配信息筛选目标用户时,可筛选匹配值高于第二预设阈值的候选用户为目标用户。
在一个实施例中,从多个候选用户中挖掘出满足预设匹配条件的目标用户时,可从多个候选用户中挖掘出满足预设匹配条件、且符合目标产品对应的预设挖掘规则的目标用户。其中,预设挖掘规则包括候选用户的用户信息满足指定条件的规则。用户信息可以是用户年龄、用户性别、用户喜好、用户所在地理位置等信息。例如,挖掘出与基准用户之间的匹配值高于预设阈值、且年龄符合指定年龄段的候选用户为目标用户。
在一个实施例中,挖掘出目标用户之后,可将目标用户的用户信息投放至目标产品的广告推广范畴中,以使后续针对目标产品进行营销时,可将目标产品的相关广告发送至目标用户,从而扩大目标产品的营销范围。
在一个实施例中,可通过目标用户对广告的反馈信息、目标用户针对目标产品的行为信息等对目标用户进行评估,以判断所挖掘出的目标用户是否准确。可选的,若目标用户针对目标产品的购买率达到一定阈值,则可确定挖掘出的目标用户准确。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本说明书一个或多个实施例提供的相似用户的挖掘方法,基于同样的思路,本说明书一个或多个实施例还提供一种相似用户的挖掘装置。
图2是根据本说明书一实施例的一种相似用户的挖掘装置的示意性框图,如图2所示,相似用户的挖掘装置200包括:
第一获取模块210,用于获取第一数据库中存储的与目标产品对应的用户行为信息;及,根据用户行为信息,确定与目标产品相关的基准用户及多个候选用户的用户信息;
第二获取模块220,用于从第二数据库中获取基准用户和各候选用户的特征信息,及,根据用户行为信息确定各候选用户针对目标产品的行为意图信息;
确定模块230,用于根据特征信息及行为意图信息,确定基准用户与各候选用户之间的匹配信息;
挖掘模块240,用于根据匹配信息,从多个候选用户中挖掘出满足预设匹配条件的目标用户。
在一个实施例中,针对目标产品的行为意图信息包括以下至少一项:
用户是否具有通过销售网页成功购买目标产品的购买行为信息;
用户是否具有浏览目标产品对应的销售网页、但重定向至其他网页的重定向行为信息;
用户是否具有成功购买由网络侧推送的、目标产品的相关产品的交叉行为信息。
在一个实施例中,匹配信息包括匹配值;
相应的,确定模块230包括:
打分单元,用于按照预设的第一打分规则,为各候选用户的特征相关信息及行为意图信息进行打分,得到各候选用户分别对应的第一分值;其中,特征相关信息包括候选用户与基准用户之间的特征相似度和/或特征信息;
第一确定单元,用于根据各候选用户分别对应的第一分值,确定基准用户与各候选用户之间的匹配值;
其中,所述第一打分规则包括:所述候选用户与所述基准用户之间的特征相似度和/或所述特征信息的特征浓度越高,对应的分值越高;及,所述行为意图信息与所述目标产品的匹配度越高,对应的分值越高。
在一个实施例中,确定模块230还包括:
第二确定单元,用于确定基准用户的特征信息的特征浓度;
分类单元,用于若特征浓度低于第一预设阈值,则根据基准用户及各候选用户的特征信息,并利用指定二分类模型对候选用户进行分类,得到分类结果;分类结果包括候选用户属于目标用户的概率;
按照预设的第二打分规则,为分类结果进行打分,得到各候选用户分别对应的第二分值;其中,第二打分规则包括:候选用户属于目标用户的概率越大,对应的分值越高;
相应的,第一确定单元还用于:
根据各所述候选用户分别对应的所述第一分值及第二分值,确定基准用户与各候选用户之间的匹配值。
在一个实施例中,第一确定单元还用于:
确定第一分值及第二分值分别对应的权重;
根据第一分值及第二分值分别对应的权重,对第一分值及第二分值进行加权计算,得到候选用户对应的综合分值;
确定候选用户对应的综合分值为基准用户与候选用户之间的匹配值。
在一个实施例中,预设匹配条件包括基准用户与各候选用户之间的匹配值高于第二预设阈值。
在一个实施例中,挖掘模块240包括:
挖掘单元,用于从多个候选用户中挖掘出满足预设匹配条件、且符合目标产品对应的预设挖掘规则的目标用户;其中,预设挖掘规则包括候选用户的用户信息满足指定条件的规则。
采用本说明书一个或多个实施例的装置,能够根据基准用户和各候选用户的特征信息及各候选用户针对目标产品的行为意图信息来确定基准用户与各候选用户之间的匹配信息,进而根据基准用户与各候选用户之间的匹配信息,从多个候选用户中挖掘出满足预设匹配条件的目标用户。可见,该装置能够基于各候选用户的特征信息以及各候选用户针对目标产品的行为意图信息来挖掘相似用户,使得挖掘出的相似用户更能符合各用户的特征及对目标产品的意图,从而能够准确地向挖掘出的相似用户推送目标产品的相关广告,以提升目标产品的营销力。
本领域的技术人员应可理解,上述相似用户的挖掘装置能够用来实现前文所述的相似用户的挖掘方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
基于同样的思路,本说明书一个或多个实施例还提供一种相似用户的挖掘设备,如图3所示。相似用户的挖掘设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器301和存储器302,存储器302中可以存储有一个或一个以上存储应用程序或数据。其中,存储器302可以是短暂存储或持久存储。存储在存储器302的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对相似用户的挖掘设备中的一系列计算机可执行指令。更进一步地,处理器301可以设置为与存储器302通信,在相似用户的挖掘设备上执行存储器302中的一系列计算机可执行指令。相似用户的挖掘设备还可以包括一个或一个以上电源303,一个或一个以上有线或无线网络接口304,一个或一个以上输入输出接口305,一个或一个以上键盘306。
具体在本实施例中,相似用户的挖掘设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对相似用户的挖掘设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取第一数据库中存储的与目标产品对应的用户行为信息;及,根据所述用户行为信息,确定与所述目标产品相关的基准用户及多个候选用户的用户信息;
从第二数据库中获取所述基准用户和各所述候选用户的特征信息;及,根据所述用户行为信息确定各所述候选用户针对所述目标产品的行为意图信息;
根据所述特征信息及所述行为意图信息,确定所述基准用户与各所述候选用户之间的匹配信息;
根据所述匹配信息,从所述多个候选用户中挖掘出满足预设匹配条件的目标用户。
可选地,所述针对所述目标产品的行为意图信息包括以下至少一项:
用户是否具有通过所述销售网页成功购买所述目标产品的购买行为信息;
用户是否具有浏览所述目标产品对应的销售网页、但重定向至其他网页的重定向行为信息;
用户是否具有成功购买由网络侧推送的、所述目标产品的相关产品的交叉行为信息。
可选地,所述匹配信息包括匹配值;
相应的,计算机可执行指令在被执行时,还可以使所述处理器:
按照预设的第一打分规则,为各所述候选用户的特征相关信息及所述行为意图信息进行打分,得到各所述候选用户分别对应的第一分值;其中,所述特征相关信息包括所述候选用户与所述基准用户之间的特征相似度和/或所述特征信息;
根据各所述候选用户分别对应的第一分值,确定所述基准用户与各所述候选用户之间的匹配值;
其中,所述第一打分规则包括:所述候选用户与所述基准用户之间的特征相似度和/或所述特征信息的特征浓度越高,对应的分值越高;及,所述行为意图信息与所述目标产品的匹配度越高,对应的分值越高。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
确定所述基准用户的特征信息的特征浓度;
若所述特征浓度低于第一预设阈值,则根据所述基准用户及各所述候选用户的特征信息,并利用指定二分类模型对所述候选用户进行分类,得到分类结果;所述分类结果包括所述候选用户属于所述目标用户的概率;
按照预设的第二打分规则,为所述分类结果进行打分,得到各所述候选用户分别对应的第二分值;其中,所述第二打分规则包括:所述候选用户属于所述目标用户的概率越大,对应的分值越高;
相应地,计算机可执行指令在被执行时,还可以使所述处理器:
根据所述各所述候选用户分别对应的所述第一分值及所述第二分值,确定所述基准用户与各所述候选用户之间的匹配值。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
确定所述第一分值及所述第二分值分别对应的权重;
根据所述第一分值及所述第二分值分别对应的权重,对所述第一分值及所述第二分值进行加权计算,得到所述候选用户对应的综合分值;
确定所述候选用户对应的所述综合分值为所述基准用户与所述候选用户之间的匹配值。
可选地,所述预设匹配条件包括所述基准用户与各所述候选用户之间的匹配值高于第二预设阈值。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
从所述多个候选用户中挖掘出满足预设匹配条件、且符合所述目标产品对应的预设挖掘规则的目标用户;其中,所述预设挖掘规则包括所述候选用户的用户信息满足指定条件的规则。
本说明书一个或多个实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述相似用户的挖掘方法,并具体用于执行:
获取第一数据库中存储的与目标产品对应的用户行为信息;及,根据所述用户行为信息,确定与所述目标产品相关的基准用户及多个候选用户的用户信息;
从第二数据库中获取所述基准用户和各所述候选用户的特征信息;及,根据所述用户行为信息确定各所述候选用户针对所述目标产品的行为意图信息;
根据所述特征信息及所述行为意图信息,确定所述基准用户与各所述候选用户之间的匹配信息;
根据所述匹配信息,从所述多个候选用户中挖掘出满足预设匹配条件的目标用户。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。