CN104778173B - 目标用户确定方法、装置及设备 - Google Patents
目标用户确定方法、装置及设备 Download PDFInfo
- Publication number
- CN104778173B CN104778173B CN201410012716.3A CN201410012716A CN104778173B CN 104778173 B CN104778173 B CN 104778173B CN 201410012716 A CN201410012716 A CN 201410012716A CN 104778173 B CN104778173 B CN 104778173B
- Authority
- CN
- China
- Prior art keywords
- user
- feature
- users
- social
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000013598 vector Substances 0.000 claims abstract description 132
- 238000012549 training Methods 0.000 claims abstract description 69
- 230000006399 behavior Effects 0.000 claims description 87
- 238000010276 construction Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims 3
- 230000006870 function Effects 0.000 description 93
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000006855 networking Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000008092 positive effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007630 basic procedure Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种目标用户确定方法、装置及设备,属于网络应用领域。所述方法包括:获取各个用户的特征信息;根据各个用户的特征信息生成各个用户的完整特征向量;根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分;根据各个用户的预测得分确定指定功能业务的目标用户。本发明通过获取各个用户的特征信息,并据以生成各个用户的完整特征向量,根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分,继而确定目标用户,解决了现有技术中仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户的问题,达到提高确定目标用户准确率的目的。
Description
技术领域
本发明涉及网络应用领域,特别涉及一种目标用户确定方法、装置及设备。
背景技术
随着计算机和网络技术的不断发展,网络应用所提供的功能业务也越来越丰富。网络应用服务商通常需要从各个用户中确定对某一功能业务感兴趣的目标用户,并对目标用户提供针对性的服务。
现有的确定目标用户的方法中,网络应用的服务器统计用户的历史操作记录,比如用户点击操作记录、积分兑换操作记录以及用户之间的交互操作记录等。服务器根据用户的历史操作记录确定用户是否为可能对指定功能业务感兴趣的目标用户。比如,当服务器需要确定积分兑换业务的目标用户时,可以根据各个用户的历史操作记录查询各个用户在预定时间段内进行积分兑换操作的次数,将积分兑换操作的次数大于预定阈值的用户确定为积分兑换业务的目标用户。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有的确定目标用户的方法中,服务器仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户,没有考虑用户自身属性等因素的影响,从而导致确定目标用户的准确率较低,效果较差。
发明内容
为了解决现有技术中仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户,没有考虑用户自身属性等因素的影响,从而导致确定目标用户的准确率较低,效果较差的问题,本发明实施例提供了一种目标用户确定方法、装置及设备。所述技术方案如下:
一方面,提供了一种目标用户确定方法,所述方法包括:
获取各个用户的特征信息,所述特征信息包括属性特征信息、社交特征信息和行为特征信息中的至少一种;所述属性特征信息用于表征所述各个用户的属性,所述社交特征信息用于表征所述各个用户之间的社交关系,所述行为特征信息用于表征所述各个用户的操作行为;
根据所述各个用户的特征信息生成所述各个用户的完整特征向量;
根据所述各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得所述各个用户的预测得分,所述训练模型为输入的所述各个用户的特征向量与所述各个用户的预测得分之间的函数关系模型,所述各个用户的预测得分用于表征所述各个用户执行所述指定功能业务的可能性的大小;
根据所述各个用户的预测得分从所述各个用户中确定所述指定功能业务的目标用户。
另一方面,提供了一种目标用户确定装置,所述装置包括:
特征信息获取模块,用于获取各个用户的特征信息,所述特征信息包括属性特征信息、社交特征信息和行为特征信息中的至少一种;所述属性特征信息用于表征所述各个用户的属性,所述社交特征信息用于表征所述各个用户之间的社交关系,所述行为特征信息用于表征所述各个用户的操作行为;
生成模块,用于根据所述各个用户的特征信息生成所述各个用户的完整特征向量;
获得模块,用于根据所述各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得所述各个用户的预测得分,所述训练模型为所述各个用户的完整特征向量与所述各个用户的预测得分之间的函数关系模型,所述各个用户的预测得分用于表征所述各个用户执行所述指定功能业务的可能性的大小;
确定模块,用于根据所述各个用户的预测得分从所述各个用户中确定所述指定功能业务的目标用户。
又一方面,提供了一种目标用户确定设备,所述设备包括:
如上所述的目标用户确定装置。
本发明实施例提供的技术方案带来的有益效果是:
通过获取各个用户的属性特征信息、社交特征信息和行为特征信息中的至少一种,并据以生成各个用户的完整特征向量,根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分,根据各个用户的预测得分从各个用户中确定该指定功能业务的目标用户,解决了现有技术中仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户,没有考虑用户自身属性等因素的影响的问题,达到结合各个用户的属性、社交以及行为因素来确定指定功能业务的目标用户,从而提高确定目标用户的准确率的目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的目标用户确定方法的方法流程图;
图2是本发明另一实施例提供的目标用户确定方法的方法流程图;
图3是本发明另一实施例提供的无向带权图;
图4是本发明一个实施例提供的目标用户确定装置的装置结构图;
图5是本发明另一实施例提供的目标用户确定装置的装置结构图;
图6是本发明一个实施例提供的目标用户确定设备的设备构成图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
请参考图1,其示出了本发明一个实施例提供的目标用户确定方法的方法流程图。该目标用户确定方法可以用于在网络应用的服务器中确定可能对指定功能业务感兴趣的目标用户。该目标用户确定方法可以包括:
步骤102,获取各个用户的特征信息,该特征信息包括属性特征信息、社交特征信息和行为特征信息中的至少一种;属性特征信息用于表征各个用户的属性,社交特征信息用于表征各个用户之间的社交关系,行为特征信息用于表征各个用户的操作行为;
步骤104,根据各个用户的特征信息生成各个用户的完整特征向量;
步骤106,根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分,训练模型为输入的各个用户的特征向量与各个用户的预测得分之间的函数关系模型,各个用户的预测得分用于表征各个用户执行该指定功能业务的可能性的大小;
步骤108,根据各个用户的预测得分从各个用户中确定该指定功能业务的目标用户。
综上所述,本发明实施例提供的目标用户确定方法,通过获取各个用户的属性特征信息、社交特征信息和行为特征信息中的至少一种,并据以生成各个用户的完整特征向量,根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分,根据各个用户的预测得分从各个用户中确定该指定功能业务的目标用户,解决了现有技术中仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户,没有考虑用户自身属性等因素的影响的问题,达到结合各个用户的属性、社交以及行为因素来确定指定功能业务的目标用户,从而提高确定目标用户的准确率的目的。
请参考图2,其示出了本发明另一实施例提供的目标用户确定方法的方法流程图。该目标用户确定方法可以用于在网络应用的服务器中确定可能对指定功能业务感兴趣的目标用户。该目标用户确定方法可以包括:
步骤202,获取各个用户的特征信息;
其中,该特征信息包括属性特征信息、社交特征信息和行为特征信息中的至少一种;属性特征信息用于表征各个用户的属性,社交特征信息用于表征各个用户之间的社交关系,行为特征信息用于表征各个用户的操作行为。
步骤204,根据各个用户的特征信息生成各个用户的完整特征向量;
具体的,以该特征信息包括属性特征信息、社交特征信息和行为特征信息为例,服务器可以根据各个用户的属性特性信息生成各个用户的属性特征向量,根据各个用户的社交特征信息生成各个用户的社交特征向量,根据各个用户的行为特征信息生成各个用户的行为特征向量,并将各个用户的属性特征向量、各个用户的社交特征向量和各个用户的行为特征向量按照预定顺序首尾相连,生成各个用户的完整特征向量。
其中,根据各个用户的社交特征信息生成各个用户的社交特征向量时,服务器首先根据各个用户的社交特征信息构建无向带权图,再根据无向带权图提取社交特征数值,最后根据提取到的社交特征数值生成社交特征向量。
以某网络社交应用为例,该网络社交应用的各个用户之间可以互相添加好友、进行对话以及使用积分兑换虚拟道具。其中,以用户u为例,用户u的属性特征信息包括用户u的等级u1、年龄u2以及性别u3(假设u3取值为0或1,0为女性,1为男性),用户u的社交特征信息包括用户u与好友之间进行对话的次数,用户u的行为特征信息包括用户u兑换的虚拟道具的编号u4、兑换的虚拟道具的数量u5、使用的虚拟道具的编号u6、使用的虚拟道具的等级u7。
对于各个用户的属性特征向量和行为特征向量,只需要将各个用户的属性特征对应数值以向量形式表示即可,比如,用户u的属性特征向量为(u1,u2,u3),行为特征向量为(u4,u5,u6,u7)。对于各个用户的社交特征向量,则需要首先建立无向带权图,其中,无向带权图中的每个节点代表一个用户,两个节点之间的边表示两个节点之间的关系,边的权重表示关系的强弱,比如,以两个节点之间的边表示两个用户之间的对话关系为例,假设用户u与用户A进行过5次对话,则节点u与节点A之间的边的权重为5。定义无向带权图中有边进行连接的两个节点对应的用户为朋友关系,定义边的权重大于预定阈值的朋友关系为强关系,定义进行过道具兑换的用户为兑换用户,对于用户u,服务器分别提取以下6种社交特征参数:
1)兑换朋友数量u8,即用户u的朋友中,进行过道具兑换的朋友的数量;
2)强关系兑换朋友数量u9,即用户u的强关系朋友中,进行过道具兑换的朋友的数量;
3)用户u进行过道具兑换的朋友在预定时间段内(比如过去一个月内)兑换道具所使用的积分的平均值u10;
4)用户u进行过道具兑换的强关系朋友在预定时间段内(比如过去一个月内)兑换道具所使用的积分的平均值u11;
5)用户u进行过道具兑换的朋友在无向带权图中形成的连通块的数目u12;
6)用户u进行过道具兑换的强关系朋友在无向带权图中形成的连通块的数目u13。
服务器可以根据提取到的6种社交特征参数确定用户u的社交特征向量为(u8,u9,u10,u11,u12,u13)。
对于上述第1、2、5和6种社交特征参数,以图3所示的无向带权图为例,其中,用户u的朋友有9个,其中,进行过道具兑换的朋友有A、B、C和D四个,用户u与用户A和B之间为强关系朋友。这四个付费朋友与用户u之间形成3个连通块,其中用户B和C一起形成一个连通块,用户A和用户D单独形成一个连通块。则根据图3所示的无向带权图可以获得该用户u的第1、2、5和6种社交特征参数分别为u8=4,u9=2,u12=3,u13=2。
服务器将用户u的属性特征向量、社交特征向量以及行为特征向量首尾相连,生成用户u的完整特征向量(u1,u2,u3,u4,u5,u6,u7,u8,u9,u10,u11,u12,u13)。
步骤206,根据该训练模型和目标函数对各个用户的完整特征向量进行特征选取,获得各个用户的优选特征向量;
在该步骤中,首先介绍本发明中的模型训练的基本过程。其中,训练模型为输入的各个用户的特征向量与各个用户的预测得分之间的函数关系模型,各个用户的预测得分用于表征各个用户执行该指定功能业务的可能性的大小。
在具体进行模型训练之前,为了便于模型学习,服务器可以首先对数据进行标准化处理,将用户的特征向量转化成更加容易学习的形式,比如,可以采用数据装箱或者特征归一化等方法对数据进行处理。此外,当数据出现正负例极不平衡的情况时,服务器还可以对训练数据进行下抽样(Down Sampling),从而确保训练数据的正例和负例数目平衡,达到更好的训练效果。
以步骤204中的网络社交应用为例,该指定功能业务为使用积分兑换虚拟道具业务,在具体的学习模型上,服务器采用基于局部及全局最优的机器学习模型。为方便叙述,可以定义f:V←R表示一个在用户集上的函数,该函数用来表示用户vi的进行道具兑换的可能性。定义Xvi表示输入的用户vi的特征向量,则有:
fvi=g(Xvi)
其中函数g是一个描述输入的用户特征向量与该用户执行使用积分兑换虚拟道具业务可能性之间关系的函数,该函数可以有不同的形式,例如,若采用线性函数进行建模,则有
此外,为了同时考虑局部及全局的最优性,还定义一个与指定功能业务相对应的目标函数来确定模型参数,该目标函数表现如下:
其中,Wij是一个描述两个用户vi和vj亲密程度的矩阵,可以通过步骤204中构造的无向带权图获得。V表示包含有各个待分析用户的用户集,VL为已知是否执行道具兑换业务的用户集,yvi表示用户vi是否进行过道具兑换,若用户vi进行过道具兑换,则yvi取值为1,若用户vi未进行过道具兑换业务,则yvi取值为0。目标函数的第一项是一个正则化项,根据局部的情况,平滑f函数的取值,使得模型学习的过程考虑局部的最优性;目标函数的第二项是一个回归项,使得f函数的取值能够基于全局的最优性进行优化。μ>0,是一个可调的参数,用于平衡第一项和第二项在目标函数中的作用。在模型具体训练时,首先针对设置一个初值,比如通过梯度下降等方式反复迭代计算,将使得O(θ)取极小值的的获取为本次训练获得的模型参数。
由于上述用户的完整特征向量中对应的各个特征不一定都对预测有积极作用,个别特征甚至可能会产生噪声,影响模型预测的准确程度,因此服务器可以通过特征选取的方法选取有效的特征。具体的特征选取过程如下:
1)对于每个特征,计算单独只有该特征的情况下,给新执行指定功能业务的用户分类问题带来的信息增益;
2)将各个特征按照信息增益的值从大到小进行第一次排序;
3)设一共有n个特征,按照第一次排序的顺序,依次取前1个特征、前2个特征、前3个特征一直到前n个特征,分别用这n种特征组合对训练模型进行训练,并计算在数据集上的预测精度,记录每个特征在加入特征集之后所带来的精度增益;
其中,服务器分别用这n种特征组合对训练模型进行训练时,每次训练获得模型参数后,通过获得的模型参数计算预测结果,将计算获得的预测结果(预测的各个用户对指定功能业务的执行情况)与实际结果(实际应用中各个用户对指定功能业务的执行情况)进行比对,计算获得预测精度,比如,若预测结果中30%的结果与实际结果相同,则预测精度为30%。服务器根据每次计算获得的精度增益计算各个特征加入特征集之后所带来的精度增益,比如,第i次计算获得的预测精度减去第i-1次计算获得的预测精度即为第i个特征加入到特征集之后所带来的精度增益。
4)将各个特征按照精度增益从大到小的顺序进行第二次排序;
5)按照第二次排序的顺序,依次取前1个特征、前2个特征、前3个特征一直到前n个特征,分别用这n种特征组合对训练模型进行训练,并计算在数据集上的预测精度,将预测精度最高的特征组合获取为优选特征,并生成优选特征向量。
步骤208,根据各个用户的优选特征向量、训练模型以及目标函数确定模型参数;
以步骤204中的网络社交应用为例,该指定功能业务为使用积分兑换虚拟道具业务,步骤206生成的各个用户的优选特征向量后,按照步骤206所示的方法将生成的各个用户的优选特征向量输入训练模型和目标函数中进行模型训练,获得最终的模型参数。
步骤210,根据各个用户的完整特征向量、训练模型以及确定的模型参数获得各个用户的预测得分;
以步骤204中的网络社交应用为例,该指定功能业务为使用积分兑换虚拟道具业务,服务器将各个用户的完整特征向量输入步骤208确定模型参数后的训练模型中,获得的结果即为各个用户的预测得分,该预测得分用于表征各个用户使用积分兑换虚拟道具业务的可能性的大小。
步骤212,根据各个用户的预测得分从各个用户中确定该指定功能业务的目标用户。
服务器可以将各个用户中,预测得分大于预定阈值且在预定时间段内未发生预定行为的用户确定为目标用户,该预定行为是与该指定功能业务相对应的操作行为;
或者,
服务器也可以将各个用户的预测得分按照从大到小的顺序进行排序,将预测得分排名前N位,且在预定时间段内未发生该预定行为的用户确定为目标用户,N为正整数,该预定行为是与该指定功能业务相对应的操作行为。
上述内容以本发明实施例所述方法应用于网络社交应用,且该指定功能业务为使用积分兑换虚拟道具业务为例进行说明。此外,以对网络游戏中可能付费购买游戏道具的目标用户进行预测为例,本发明实施例还对上述方法进行如下举例说明:
网络游戏的服务器获取各个用户的特征信息,该特征信息包括各个用户的属性特征信息(比如游戏等级、性别、游戏时长、登录频率、游戏次数、是否加入公会以及游戏中好友数量等)、社交特征信息(比如各个用户与游戏中好友进行交易的信息、与游戏中的好友共同闯关的信息以及与游戏中好友的聊天信息等)和行为特征信息(比如各个用户购买游戏道具的行为以及丢弃游戏道具的行为等)。服务器按照步骤204中的方法生成各个用户的完整特征向量,并按照步骤206和步骤208所示的方法进行特征选取,根据预设的训练模型和目标函数确定训练模型的模型参数,最后根据步骤210和步骤212所示的方法进行各个用户的预测得分的计算以及目标用户的确定。
综上所述,本发明实施例提供的目标用户确定方法,通过获取各个用户的属性特征信息、社交特征信息和行为特征信息中的至少一种,并据以生成各个用户的完整特征向量,根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分,根据各个用户的预测得分从各个用户中确定该指定功能业务的目标用户,解决了现有技术中仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户,没有考虑用户自身属性等因素的影响的问题,达到结合各个用户的属性、社交以及行为因素来确定指定功能业务的目标用户,从而提高确定目标用户的准确率的目的。
此外,本发明实施例提供的目标用户确定方法,通过在根据各个用户的完整特征向量、训练模型和目标函数获得各个用户的预测得分时,首先对各个用户的完整特征向量进行特征选取,获得各个用户的优选特征向量,根据各个用户的优选特征向量、训练模型和目标函数确定模型参数,最后根据各个用户的完整特征向量、训练模型以及确定的模型参数获得各个用户的预测得分,避免对预测没有积极作用的特征影响模型预测的准确程度,达到进一步提高确定目标用户准确率的目的。
请参考图4,其示出了本发明一个实施例提供的目标用户确定装置的装置结构图。该目标用户确定装置可以用于执行如图1或图2所示的目标用户确定方法,在网络应用的服务器中确定可能对指定功能业务感兴趣的目标用户。该目标用户确定装置可以包括:
信息获取模块301,用于获取各个用户的特征信息,所述特征信息包括属性特征信息、社交特征信息和行为特征信息中的至少一种;所述属性特征信息用于表征所述各个用户的属性,所述社交特征信息用于表征所述各个用户之间的社交关系,所述行为特征信息用于表征所述各个用户的操作行为;
生成模块302,用于根据所述各个用户的特征信息生成所述各个用户的完整特征向量;
获得模块303,用于根据所述各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得所述各个用户的预测得分,所述训练模型为所述各个用户的完整特征向量与所述各个用户的预测得分之间的函数关系模型,所述各个用户的预测得分用于表征所述各个用户执行所述指定功能业务的可能性的大小;
确定模块304,用于根据所述各个用户的预测得分从所述各个用户中确定所述指定功能业务的目标用户。
综上所述,本发明实施例提供的目标用户确定装置,通过获取各个用户的属性特征信息、社交特征信息和行为特征信息中的至少一种,并据以生成各个用户的完整特征向量,根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分,根据各个用户的预测得分从各个用户中确定该指定功能业务的目标用户,解决了现有技术中仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户,没有考虑用户自身属性等因素的影响的问题,达到结合各个用户的属性、社交以及行为因素来确定指定功能业务的目标用户,从而提高确定目标用户的准确率的目的。
请参考图5,其示出了本发明另一实施例提供的目标用户确定装置的装置结构图。该目标用户确定装置可以用于执行如图1或图2所示的目标用户确定方法,在网络应用的服务器中确定可能对指定功能业务感兴趣的目标用户。该目标用户确定装置可以包括:
信息获取模块401,用于获取各个用户的特征信息,所述特征信息包括属性特征信息、社交特征信息和行为特征信息中的至少一种;所述属性特征信息用于表征所述各个用户的属性,所述社交特征信息用于表征所述各个用户之间的社交关系,所述行为特征信息用于表征所述各个用户的操作行为;
生成模块402,用于根据所述各个用户的特征信息生成所述各个用户的完整特征向量;
获得模块403,用于根据所述各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得所述各个用户的预测得分,所述训练模型为所述各个用户的完整特征向量与所述各个用户的预测得分之间的函数关系模型,所述各个用户的预测得分用于表征所述各个用户执行所述指定功能业务的可能性的大小;
确定模块404,用于根据所述各个用户的预测得分从所述各个用户中确定所述指定功能业务的目标用户。
所述特征信息包括所述属性特征信息、所述社交特征信息和所述行为特征信息,所述生成模块402,包括:
第一生成单元4021,用于根据所述各个用户的属性特性信息生成所述各个用户的属性特征向量;
第二生成单元4022,用于根据所述各个用户的社交特征信息生成所述各个用户的社交特征向量;
第三生成单元4023,用于根据所述各个用户的行为特征信息生成所述各个用户的行为特征向量;
第四生成单元4024,用于将所述各个用户的属性特征向量、所述各个用户的社交特征向量和所述各个用户的行为特征向量按照预定顺序首尾相连,生成所述各个用户的完整特征向量。
所述第二生成单元4022,包括:
构建子单元4022a,用于根据所述各个用户的社交特征信息构建无向带权图;
提取子单元4022b,用于根据所述无向带权图提取社交特征数值;
生成子单元4022c,用于根据提取到的所述社交特征数值生成所述社交特征向量。
所述获得模块403,包括:
参数确定单元4031,用于根据所述各个用户的完整特征向量、所述训练模型以及所述目标函数确定模型参数;
获得单元4032,用于根据所述各个用户的完整特征向量、所述训练模型以及确定的所述模型参数获得所述各个用户的预测得分。
所述参数确定单元4031,包括:
特征选取子单元4031a,用于根据所述训练模型和所述目标函数对所述各个用户的完整特征向量进行特征选取,获得各个用户的优选特征向量;
确定子单元4031b,用于根据所述各个用户的优选特征向量、所述训练模型以及所述目标函数确定所述模型参数。
所述确定模块404,包括:
第一用户确定单元4041,用于将所述各个用户中,预测得分大于预定阈值且在预定时间段内未发生预定行为的用户确定为所述目标用户,所述预定行为是与所述指定功能业务相对应的操作行为;
排序单元4042,用于将所述各个用户的预测得分按照从大到小的顺序进行排序;
第二用户确定单元4043,用于将预测得分排名前N位,且在预定时间段内未发生所述预定行为的用户确定为所述目标用户,N为正整数,所述预定行为是与所述指定功能业务相对应的操作行为。
综上所述,本发明实施例提供的目标用户确定装置,通过获取各个用户的属性特征信息、社交特征信息和行为特征信息中的至少一种,并据以生成各个用户的完整特征向量,根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分,根据各个用户的预测得分从各个用户中确定该指定功能业务的目标用户,解决了现有技术中仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户,没有考虑用户自身属性等因素的影响的问题,达到结合各个用户的属性、社交以及行为因素来确定指定功能业务的目标用户,从而提高确定目标用户的准确率的目的。
此外,本发明实施例提供的目标用户确定装置,通过在根据各个用户的完整特征向量、训练模型和目标函数获得各个用户的预测得分时,首先对各个用户的完整特征向量进行特征选取,获得各个用户的优选特征向量,根据各个用户的优选特征向量、训练模型和目标函数确定模型参数,最后根据各个用户的完整特征向量、训练模型以及确定的模型参数获得各个用户的预测得分,避免对预测没有积极作用的特征影响模型预测的准确程度,达到进一步提高确定目标用户准确率的目的。
请参考图6,其示出了本发明一个实施例提供的目标用户确定设备的设备构成图。该目标用户确定设备可以用于执行如图1或图2所示的目标用户确定方法,用于确定可能对指定功能业务感兴趣的目标用户。该目标用户确定设备可以包括:
如图4或图5所示的目标用户确定装置001。
综上所述,本发明实施例提供的目标用户确定设备,通过获取各个用户的属性特征信息、社交特征信息和行为特征信息中的至少一种,并据以生成各个用户的完整特征向量,根据各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得各个用户的预测得分,根据各个用户的预测得分从各个用户中确定该指定功能业务的目标用户,解决了现有技术中仅仅根据各个用户的历史操作记录确定指定功能业务的目标用户,没有考虑用户自身属性等因素的影响的问题,达到结合各个用户的属性、社交以及行为因素来确定指定功能业务的目标用户,从而提高确定目标用户的准确率的目的。
此外,本发明实施例提供的目标用户确定设备,通过在根据各个用户的完整特征向量、训练模型和目标函数获得各个用户的预测得分时,首先对各个用户的完整特征向量进行特征选取,获得各个用户的优选特征向量,根据各个用户的优选特征向量、训练模型和目标函数确定模型参数,最后根据各个用户的完整特征向量、训练模型以及确定的模型参数获得各个用户的预测得分,避免对预测没有积极作用的特征影响模型预测的准确程度,达到进一步提高确定目标用户准确率的目的。
需要说明的是:上述实施例提供的目标用户确定装置在确定目标用户时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的目标用户确定装置与目标用户确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种目标用户确定方法,其特征在于,所述方法包括:
获取各个用户的特征信息,所述特征信息包括属性特征信息、社交特征信息和行为特征信息中的至少一种;所述属性特征信息用于表征所述各个用户的属性,所述社交特征信息用于表征所述各个用户之间的社交关系,所述行为特征信息用于表征所述各个用户的操作行为;
根据所述各个用户的特征信息生成所述各个用户的完整特征向量;
对于所述完整特征向量中的每种特征,计算所述每种特征给指定功能业务的用户分类问题带来的信息增益;
将所述完整特征向量中的各种特征按照信息增益的值从大到小进行第一次排序;
按照所述第一次排序的顺序,依次取前1至前n个特征,获得n种第一特征组合,分别用所述n种第一特征组合对训练模型进行训练,并计算每种特征在加入特征集之后所带来的精度增益;
将所述完整特征向量中的各种特征按照精度增益从大到小的顺序进行第二次排序;
按照所述第二次排序的顺序,依次取前1至前n个特征,获得n种第二特征组合,分别用所述n种第二特征组合对所述训练模型进行训练,并计算所述n种第二特征组合各自的预测精度,将预测精度最高的第二特征组合获取为优选特征组合,并根据所述优选特征组合生成所述各个用户的优选特征向量;
根据所述各个用户的优选特征向量、所述训练模型以及目标函数确定模型参数;
根据所述各个用户的完整特征向量、所述训练模型以及确定的所述模型参数获得所述各个用户的预测得分;其中,所述训练模型为输入的所述各个用户的特征向量与所述各个用户的预测得分之间的函数关系模型,所述各个用户的预测得分用于表征所述各个用户执行所述指定功能业务的可能性的大小;
根据所述各个用户的预测得分从所述各个用户中确定所述指定功能业务的目标用户。
2.根据权利要求1所述的方法,其特征在于,所述特征信息包括所述属性特征信息、所述社交特征信息和所述行为特征信息,所述根据所述各个用户的特征信息生成所述各个用户的完整特征向量,包括:
根据所述各个用户的属性特性信息生成所述各个用户的属性特征向量;
根据所述各个用户的社交特征信息生成所述各个用户的社交特征向量;
根据所述各个用户的行为特征信息生成所述各个用户的行为特征向量;
将所述各个用户的属性特征向量、所述各个用户的社交特征向量和所述各个用户的行为特征向量按照预定顺序首尾相连,生成所述各个用户的完整特征向量。
3.根据权利要求2所述的方法,其特征在于,所述根据所述各个用户的社交特征信息生成所述各个用户的社交特征向量,包括:
根据所述各个用户的社交特征信息构建无向带权图;
根据所述无向带权图提取社交特征数值;
根据提取到的所述社交特征数值生成所述社交特征向量。
4.根据权利要求1所述的方法,其特征在于,所述根据所述各个用户的预测得分从所述各个用户中确定目标用户,包括:
将所述各个用户中,预测得分大于预定阈值且在预定时间段内未发生预定行为的用户确定为所述目标用户,所述预定行为是与所述指定功能业务相对应的操作行为;
或者,
将所述各个用户的预测得分按照从大到小的顺序进行排序,将预测得分排名前N位,且在预定时间段内未发生所述预定行为的用户确定为所述目标用户,N为正整数,所述预定行为是与所述指定功能业务相对应的操作行为。
5.一种目标用户确定装置,其特征在于,所述装置包括:
信息获取模块,用于获取各个用户的特征信息,所述特征信息包括属性特征信息、社交特征信息和行为特征信息中的至少一种;所述属性特征信息用于表征所述各个用户的属性,所述社交特征信息用于表征所述各个用户之间的社交关系,所述行为特征信息用于表征所述各个用户的操作行为;
生成模块,用于根据所述各个用户的特征信息生成所述各个用户的完整特征向量;
获得模块,用于根据所述各个用户的完整特征向量、训练模型和与指定功能业务相对应的目标函数获得所述各个用户的预测得分,所述训练模型为所述各个用户的完整特征向量与所述各个用户的预测得分之间的函数关系模型,所述各个用户的预测得分用于表征所述各个用户执行所述指定功能业务的可能性的大小;
确定模块,用于根据所述各个用户的预测得分从所述各个用户中确定所述指定功能业务的目标用户;
其中,所述获得模块,包括:
参数确定单元,用于根据所述各个用户的完整特征向量、所述训练模型以及所述目标函数确定模型参数;
获得单元,用于根据所述各个用户的完整特征向量、所述训练模型以及确定的所述模型参数获得所述各个用户的预测得分;
所述参数确定单元,包括:
特征选取子单元,用于根据所述训练模型和所述目标函数对所述各个用户的完整特征向量进行特征选取,获得各个用户的优选特征向量;
确定子单元,用于根据所述各个用户的优选特征向量、所述训练模型以及所述目标函数确定所述模型参数;
所述特征选取子单元,用于对于所述完整特征向量中的每种特征,计算所述每种特征给所述指定功能业务的用户分类问题带来的信息增益;将所述完整特征向量中的各种特征按照信息增益的值从大到小进行第一次排序;按照所述第一次排序的顺序,依次取前1至前n个特征,获得n种第一特征组合,分别用所述n种第一特征组合对训练模型进行训练,并计算每种特征在加入特征集之后所带来的精度增益;将所述完整特征向量中的各种特征按照精度增益从大到小的顺序进行第二次排序;按照所述第二次排序的顺序,依次取前1至前n个特征,获得n种第二特征组合,分别用所述n种第二特征组合对所述训练模型进行训练,并计算所述n种第二特征组合各自的预测精度,将预测精度最高的第二特征组合获取为优选特征组合,并根据所述优选特征组合生成所述各个用户的优选特征向量。
6.根据权利要求5所述的装置,其特征在于,所述特征信息包括所述属性特征信息、所述社交特征信息和所述行为特征信息,所述生成模块,包括:
第一生成单元,用于根据所述各个用户的属性特性信息生成所述各个用户的属性特征向量;
第二生成单元,用于根据所述各个用户的社交特征信息生成所述各个用户的社交特征向量;
第三生成单元,用于根据所述各个用户的行为特征信息生成所述各个用户的行为特征向量;
第四生成单元,用于将所述各个用户的属性特征向量、所述各个用户的社交特征向量和所述各个用户的行为特征向量按照预定顺序首尾相连,生成所述各个用户的完整特征向量。
7.根据权利要求6所述的装置,其特征在于,所述第二生成单元,包括:
构建子单元,用于根据所述各个用户的社交特征信息构建无向带权图;
提取子单元,用于根据所述无向带权图提取社交特征数值;
生成子单元,用于根据提取到的所述社交特征数值生成所述社交特征向量。
8.根据权利要求5所述的装置,其特征在于,所述确定模块,包括:
第一用户确定单元,用于将所述各个用户中,预测得分大于预定阈值且在预定时间段内未发生预定行为的用户确定为所述目标用户,所述预定行为是与所述指定功能业务相对应的操作行为;
排序单元,用于将所述各个用户的预测得分按照从大到小的顺序进行排序;
第二用户确定单元,用于将预测得分排名前N位,且在预定时间段内未发生所述预定行为的用户确定为所述目标用户,N为正整数,所述预定行为是与所述指定功能业务相对应的操作行为。
9.一种目标用户确定设备,其特征在于,所述设备包括:
如权利要求5至8任一所述的目标用户确定装置。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有程序,所述程序由硬件执行,以实现如上述权利要求1至4任一所述的目标用户确定方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410012716.3A CN104778173B (zh) | 2014-01-10 | 2014-01-10 | 目标用户确定方法、装置及设备 |
PCT/CN2015/070170 WO2015103964A1 (en) | 2014-01-10 | 2015-01-06 | Method, apparatus, and device for determining target user |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410012716.3A CN104778173B (zh) | 2014-01-10 | 2014-01-10 | 目标用户确定方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104778173A CN104778173A (zh) | 2015-07-15 |
CN104778173B true CN104778173B (zh) | 2020-01-10 |
Family
ID=53523542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410012716.3A Active CN104778173B (zh) | 2014-01-10 | 2014-01-10 | 目标用户确定方法、装置及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN104778173B (zh) |
WO (1) | WO2015103964A1 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096161B (zh) * | 2015-07-17 | 2017-12-29 | 腾讯科技(深圳)有限公司 | 一种进行信息展示的方法和装置 |
JP5933083B1 (ja) * | 2015-07-23 | 2016-06-08 | 株式会社Cygames | サーバ及びプログラム |
CN105160008B (zh) * | 2015-09-21 | 2020-03-31 | 合一网络技术(北京)有限公司 | 一种定位推荐用户的方法及装置 |
CN105426534A (zh) * | 2015-12-21 | 2016-03-23 | 华为技术有限公司 | 信息确定方法及装置 |
CN106919579B (zh) * | 2015-12-24 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及装置、设备 |
CN105654131A (zh) * | 2015-12-30 | 2016-06-08 | 小米科技有限责任公司 | 分类模型训练方法及装置 |
CN107292465A (zh) * | 2016-03-31 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 用户评价方法、装置及设备 |
CN105975590A (zh) * | 2016-05-03 | 2016-09-28 | 无锡雅座在线科技发展有限公司 | 对象类型的确定方法和装置 |
CN105956122A (zh) * | 2016-05-03 | 2016-09-21 | 无锡雅座在线科技发展有限公司 | 对象属性的确定方法和装置 |
CN107093120A (zh) * | 2016-09-28 | 2017-08-25 | 北京小度信息科技有限公司 | 服务策略推送方法和装置 |
CN108629351B (zh) * | 2017-03-15 | 2022-05-13 | 腾讯科技(北京)有限公司 | 一种数据模型处理方法及其装置 |
CN107578294B (zh) * | 2017-09-28 | 2020-07-24 | 北京小度信息科技有限公司 | 用户行为预测方法、装置及电子设备 |
CN107908742A (zh) * | 2017-11-15 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN107862339B (zh) * | 2017-11-15 | 2022-04-29 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN108288178A (zh) * | 2018-01-12 | 2018-07-17 | 北京奇艺世纪科技有限公司 | 一种引导用户对应用程序评分的方法、装置及电子设备 |
CN108305013B (zh) * | 2018-02-12 | 2022-02-18 | 腾讯科技(深圳)有限公司 | 运营项目有效性的确定方法、装置和计算机设备 |
CN110008999B (zh) * | 2019-03-07 | 2021-07-27 | 腾讯科技(深圳)有限公司 | 目标帐号的确定方法、装置、存储介质及电子装置 |
CN110139288B (zh) * | 2019-04-08 | 2022-07-01 | 简链科技(广东)有限公司 | 一种网络通话方法、装置、系统和记录介质 |
CN110163658B (zh) * | 2019-04-17 | 2022-01-07 | 深圳左邻永佳科技有限公司 | 虚拟资源数据处理方法、装置、计算机设备和存储介质 |
CN110222750A (zh) * | 2019-05-27 | 2019-09-10 | 北京品友互动信息技术股份公司 | 目标受众浓度的确定方法及装置 |
CN112994923B (zh) * | 2019-12-18 | 2023-04-07 | 中国移动通信集团浙江有限公司 | 网元选取方法及装置 |
CN111160975A (zh) * | 2019-12-30 | 2020-05-15 | 中国移动通信集团黑龙江有限公司 | 一种目标用户确定方法、装置、设备及计算机存储介质 |
CN113946758B (zh) * | 2020-06-30 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 一种数据识别方法、装置、设备及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102426686A (zh) * | 2011-09-29 | 2012-04-25 | 南京大学 | 一种基于矩阵分解的互联网信息产品推荐方法 |
WO2013040076A1 (en) * | 2011-09-12 | 2013-03-21 | Fred Hutchinson Cancer Research Center | Dynamics and control of state-dependent networks for probing genomic organization |
CN103399858A (zh) * | 2013-07-01 | 2013-11-20 | 吉林大学 | 基于信任的社会化协同过滤推荐方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923545B (zh) * | 2009-06-15 | 2012-10-10 | 北京百分通联传媒技术有限公司 | 一种个性化信息推荐的方法 |
CN102054003B (zh) * | 2009-11-04 | 2014-03-19 | 北京搜狗科技发展有限公司 | 网络信息推荐、建立网络资源索引的方法及系统 |
CN102208087A (zh) * | 2010-03-30 | 2011-10-05 | 株式会社日立制作所 | 信息推荐装置 |
CN102298650B (zh) * | 2011-10-18 | 2012-12-19 | 东莞市巨细信息科技有限公司 | 一种海量数字信息的分布式推荐方法 |
-
2014
- 2014-01-10 CN CN201410012716.3A patent/CN104778173B/zh active Active
-
2015
- 2015-01-06 WO PCT/CN2015/070170 patent/WO2015103964A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013040076A1 (en) * | 2011-09-12 | 2013-03-21 | Fred Hutchinson Cancer Research Center | Dynamics and control of state-dependent networks for probing genomic organization |
CN102426686A (zh) * | 2011-09-29 | 2012-04-25 | 南京大学 | 一种基于矩阵分解的互联网信息产品推荐方法 |
CN103399858A (zh) * | 2013-07-01 | 2013-11-20 | 吉林大学 | 基于信任的社会化协同过滤推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104778173A (zh) | 2015-07-15 |
WO2015103964A1 (en) | 2015-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104778173B (zh) | 目标用户确定方法、装置及设备 | |
US11659050B2 (en) | Discovering signature of electronic social networks | |
CN106570008B (zh) | 推荐方法及装置 | |
CN110442790A (zh) | 推荐多媒体数据的方法、装置、服务器和存储介质 | |
TW201939400A (zh) | 目標用戶群體的確定方法和裝置 | |
CN107123057A (zh) | 用户推荐方法及装置 | |
CN110971659A (zh) | 推荐消息的推送方法、装置及存储介质 | |
KR101356948B1 (ko) | Sns에서 사회적 이웃의 관심사와 사회적 활동의 토픽을 통해 사용자 관심사를 추론하는 방법 및 그 시스템 | |
CN111510783B (zh) | 确定视频曝光量的方法、装置、电子设备和存储介质 | |
WO2020135642A1 (zh) | 一种基于生成对抗网络的模型训练方法及设备 | |
CN110909230A (zh) | 一种网络热点分析方法及系统 | |
CN109977979B (zh) | 定位种子用户的方法、装置、电子设备和存储介质 | |
JPWO2017159402A1 (ja) | 共クラスタリングシステム、方法およびプログラム | |
CN105989005B (zh) | 一种信息的推送方法及装置 | |
CN113763928A (zh) | 音频类别预测方法、装置、存储介质及电子设备 | |
CN112541010A (zh) | 一种基于逻辑回归的用户性别预测方法 | |
CN112565902A (zh) | 一种视频推荐方法、装置及电子设备 | |
CN114048294B (zh) | 相似人群扩展模型训练方法、相似人群扩展方法和装置 | |
CN106600432B (zh) | 基于社交属性行为数据的行为间影响力评估方法和装置 | |
CN112818241B (zh) | 一种内容推广方法、装置、计算机设备和存储介质 | |
CN106301880B (zh) | 一种确定网络关系稳定度、互联网业务推荐方法和设备 | |
El Marrakchi et al. | Intelligent reputation scoring in social networks: Use case of brands of smartphones | |
Pajo et al. | Analysis of automatic online lead user identification | |
CN113032685B (zh) | 基于社交关系的对象推送方法、装置、设备及存储介质 | |
CN118051782B (zh) | 一种模型训练的方法、业务处理的方法以及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |