一种对象选择方法和装置
技术领域
本发明涉及互联网技术领域,特别涉及一种对象选择方法和装置。
背景技术
随着互联网技术的发展,很多业务都通过网络来执行,例如,可以通过网络向一部分用户分配业务资源,以使得这些用户能够带来更大的业务收益,这些接收资源的用户可以称为业务对象,当然业务对象也可以是用户之外的其他类型。其中,具体向哪些业务对象分配业务资源能够使得收益尽可能最大化,是一个非常重要的问题,如果所选择的对象不合适,将造成资源的浪费。
相关技术中,一种选择分配资源的对象的方法,可以是PageRank算法,该算法考虑了各个对象之间的依赖关系,可以将该依赖关系作为权重计算得到在对象群体中每个对象相对的重要性,选取其中重要性高的对象作为资源分配对象。但是,这种方法的缺点是,重要性计算所依据的参数是有限的,得到的重要性指标并不能准确体现对象在群体中的业务影响力,使得按照该方法确定的业务对象不准确,如果将资源分配给这些对象,将无法实现收益增加的效果。
发明内容
有鉴于此,本发明提供一种对象选择方法和装置,以提高业务对象选择的准确性。
具体地,本发明是通过如下技术方案实现的:
第一方面,提供一种对象选择方法,所述方法包括:
根据用于影响目标对象选择的业务影响参数,分别对每两个对象之间的基础关系权重进行调整,得到新对象关系权重;
根据对象群体中的各新对象关系权重,分别确定所述对象群体中的每个对象对应的传播力值,所述对象群体包括多个对象;
根据每个对象在业务中的业务活动参数,分别确定每个对象对应的活跃度值,所述活跃度值用于表示所述对象在业务中的参与程度;
根据所述活跃度值和传播力值,分别确定每个对象对应的影响力值,所述影响力值用于表示所述对象对其他对象的影响程度;
选择影响力值大于预设阈值的对象作为目标对象。
第二方面,提供一种对象选择装置,所述装置包括:
权重调整模块,用于根据用于影响目标对象选择的业务影响参数,分别对每两个对象之间的基础关系权重进行调整,得到新对象关系权重;
传播确定模块,用于根据对象群体中的各新对象关系权重,分别确定所述对象群体中的每个对象对应的传播力值,所述对象群体包括多个对象;
活跃确定模块,用于根据每个对象在业务中的业务活动参数,分别确定每个对象对应的活跃度值,所述活跃度值用于表示所述对象在业务中的参与程度;
影响确定模块,用于根据所述活跃度值和传播力值,分别确定每个对象对应的影响力值,所述影响力值用于表示所述对象对其他对象的影响程度;
选择处理模块,用于选择影响力值大于预设阈值的对象作为目标对象。
本发明实施例的对象选择方法和装置,通过根据业务影响参数对基础关系权重进行调整,使得传播力值的计算更加准确,并且综合考虑了对象的活跃度值,更加准确的确定对象的影响力,从而也使得根据该影响力选择的目标对象更准确,提高了业务对象选择的准确性。
附图说明
图1为本发明实施例提供的一种对象选择方法的流程示意图;
图2为本发明实施例提供的另一种对象选择方法的流程示意图;
图3为本发明实施例提供的一种对象选择装置的结构示意图;
图4为本发明实施例提供的另一种对象选择装置的结构示意图。
具体实施方式
本申请实施例提供了一种选择待分配资源的对象的方法,该方法可以由包括多个对象的对象群体中选择出部分对象,该部分对象可以称为目标对象,将业务资源(例如,资源可以是业务信息,某商家在某预定时间段将执行促销活动,该活动满一定消费金额将进行优惠打折,或者该资源是直接的折扣券,或者该资源是消费抵用券等)分配至这些目标对象后,目标对象能够根据业务资源进行业务推广处理(例如,目标对象可以通过某种方式将业务资源分发给其他对象),起到协助增加业务收益的效果(例如,较多的对象根据业务资源参加本次业务活动,将增加业务收益);目标对象选择的合适与否,直接关系到业务收益是否增加以及所分配的业务资源是否得到有效利用。
图1示例了一种对象选择方法,该方法可以包括如下处理:
在步骤101中,根据用于影响目标对象选择的业务影响参数,分别对每两个对象之间的基础关系权重进行调整,得到新对象关系权重。
两个对象之间的基础关系权重是用于表示这两个对象之间的交互粘性的一种度量参数。比如,如果两个对象之间经常互相转发博客,或者,相互经常聊天,或者,相互之间多次发生转账操作等,说明这两个对象的关系较为密切,基础关系权重的数值可以较高;相反,如果两个对象之间很少进行相互沟通和交流,其基础关系权重的数值可以较低,以表明两者关系疏远。
本步骤中,可以对基础关系权重进行调整,调整的方法是根据业务相关的业务影响参数。该业务影响参数的特点是,该参数是在选择目标对象时需要考虑的一个重要参数,缺少该参数将影响到目标对象选择的准确度,但是在基础关系权重的计算时又未考虑该参数;因此,需要根据该业务影响参数对基础关系权重进行调整,得到新对象关系权重。由于新对象关系权重已经融合了业务影响参数,可以更准确的反映两个对象之间的关系。
在步骤102中,根据所述对象群体中的各新对象关系权重,分别确定所述对象群体中的每个对象对应的传播力值。
本步骤中,每个对象的传播力值,体现了该对象对其他对象的影响程度。比如,假设某个对象的传播力值比较高,那就表明如果将业务资源分配给该对象,那么该对象就很有可能将业务资源传播至其他对象,并带动其他对象来参与业务资源对应的业务活动,使得业务获益。
例如,步骤101中已经计算得到了任意两个对象之间的新对象关系权重,在根据这些新对象关系权重确定各对象分别对应的传播力时,可以使用带权PageRank算法,新对象关系权重即为该带权PageRank算法中使用到的权重。
在步骤103中,根据每个对象在业务中的业务活动参数,分别确定每个对象对应的活跃度值。
例如,本步骤计算的活跃度值是与上面的传播力值并列的一个参数,每个对象都有对应的传播力值和活跃度值。这里的活跃度值可以是根据对象在业务中的业务活动参数确定,所述活跃度值用于表示所述对象在业务中的参与程度。,如果对象积极参与业务,则其活跃度值较高;否则,活跃度值降低。
比如,可以根据某个对象在最近三个月去过几个店铺消费,消费的天数,消费的次数等,计算对象消费的活跃度值,这些参数可以体现对象的消费是否足够活跃;如果对象经常去店铺消费且光顾多个店铺,其消费活跃度值相对较高,如果对象很少外出消费,其消费活跃度值相对较低。
在步骤104中,根据所述活跃度值和传播力值,分别确定每个对象对应的影响力值。例如,本步骤计算的影响力值,也可以体现该对象对其他对象的影响程度,与传播力值不同的是,影响力值是综合根据传播力值和活跃度值确定,这样可以使得衡量对象的影响力更加准确。
在步骤105中,选择影响力值大于预设阈值的对象作为目标对象。
本步骤中选择影响力值大于预设阈值的对象,也可以有多种选择方式。比如,可以设定一个影响力阈值,将影响力值大于该阈值的对象都作为目标对象;或者,还可以将各个影响力值进行排序,将排在前N位的影响力值对应的对象作为目标对象,N可以是设定一个自然数,这种方式也可以看做是大于预设阈值的一种。在确定目标对象后,可以将业务资源分配给该对象。
本例子的对象选择方法,通过根据业务影响参数对基础关系权重进行调整,使得传播力值的计算更加准确,并且综合考虑了对象的活跃度值,更加准确的确定对象的影响力,从而也使得根据该影响力选择的目标对象更准确,即所选择的目标对象将可以更好的传播业务资源,带动业务收益的提高。
如下以一个餐饮业务中的营销场景为例,来说明本申请实施例的对象选择方法的应用。在该场景中,将涉及到几个概念,预先解释如下:
网络营销:是一种营销手段,通过互联网和社交网络针对部分用户进行产品推广,让这部分用户去消费并带动其朋友消费。
影响力最大化:给定一个社交网络,网络上用户之间的亲密程度已知,该亲密程度可以用关系权重来衡量,需要选择k个种子用户,使得这k个用户影响其他用户数量最多。本例子中,种子用户可以称为目标对象。
O2O:Online To Offline的简称,是一种线下商务模式,是指线上营销及线上购买带动线下的消费。
PageRank算法:PageRank是Google用于网页重要性排名的算法,算法将网页看成节点,将网页对网页的引用看成有向边,其基本假设是一个节点(网页)很重要是因为有很多重要的节点指向它,算法通过迭代的方式来求解这种递归定义的重要性,初始时假设每个节点的重要性是一样的,都为1,然后每个节点向它的邻居均等地贡献重要性,每个节点再将邻居发过来的重要性累加起来作为自己新一轮的重要性,如此迭代下去,直到所有节点的重要性不再不变化。PageRank算法每一轮更新节点重要性的公式如下:
pi表示新一轮迭代后节点i的PageRank值,p′j表示上一轮迭代节点j的PageRank值,wji表示节点j到节点i的边的归一化权重,其值为节点j到节点i的边权重除以所有以j为起点的边权重之和,α是一个参数,一般取0.15。
带权PageRank算法:该算法中,可以采用某种方法计算边的权重,比如当节点表示用户时,可以用一个用户转发另一个用户的博客的数量作为边的权重。
在餐饮业务中的营销场景中,假设给定一批用户群,要从中筛选出k个用户作为种子用户,以使得这一批用户影响的用户更多,比如某个餐饮店铺,打算给10位发送优惠券,请他们来吃饭,希望借助他们的影响力,能带来更多朋友来这个餐馆消费。这种场景就是一种O2O模式的网络营销手段,并且通过选择种子用户发送优惠券可以实现影响力最大化。那么通过本例子的对象选择方法,将可以筛选出这10个有影响力的种子用户。本例子将种子用户称为目标对象,且将发送给种子用户的优惠券称为业务资源。
在种子用户即目标对象的选择中,需要有效度量该用户在社交网络上的影响力,上述餐厅优惠券发放的例子中,用户影响力的准确确定,涉及到多方面因素,比如,用户之间的交互关系程度,某两个用户之间是否经常互相转发博客,或者是否经常聊天等;同时,还有一个重要因素关系到影响力的确定,即用户的地理位置,该地理位置相关的参数即为能够影响目标对象选择的业务影响参数。例如,用户A在北京,而用户B在香港,虽然A和B经常交互,关系权重很大,但A转发北京某个餐厅的广告时,B虽然看到了,但B去这个餐厅的可能性非常小,因此地理位置是一个在餐厅优惠券发放的例子中很重要的业务影响参数。当然在其他的业务场景中,可以根据业务特点使用其他的业务影响参数来衡量对象之间的关系权重。
图2示例了一种对象选择方法的流程,可以通过该方法选择餐厅优惠券发放的场景中所需要的目标对象。如下的方法并不限制各个步骤之间的执行顺序。该方法可以由某个数据处理设备执行,如图2所示,该方法可以包括:
在步骤201中,计算每两个对象之间的基础关系权重。
例如,本例子中的对象群体包括很多的用户,计算每两个对象的基础关系权重即任意两个用户间的权重,两个用户间的基础关系权重可以用于表示这两个用户之间的关系强弱。
该基础关系权重的计算,可以依据的参数包括:双方聊天的次数、点赞的次数、转发微博的次数、转账的次数和金额等。数据处理设备可以获取上述的参数,例如,转账的次数和金额可以由支付服务器获取,支付服务器可以存储有用户转账时的历史数据;又例如,双方聊天的次数可以根据即时通讯服务器存储的数据获取。数据处理设备可以综合这些参数计算两个用户之间的基础关系权重。如果将所计算的两个用户用i和j表示,其对应的基础关系权重可以用W<i,j>表示。
在步骤202中,根据对象在业务中的地址信息,确定所述对象的活跃地,并获取对象在业务中记录的籍贯地。
用户在使用互联网系统时,会留下很多位置信息,例如,上网所使用的终端的IP地址、用户在下单购物时所填写的收货地址等。数据处理设备可以获取上述用户在进行业务时的地址信息,比如IP地址对应的城市,收货地址对应的城市等。可以将出现次数最多的城市作为用户的活跃地。此外,数据处理设备还可以获取用户在业务中记录的籍贯地,有些业务需要用户输入其籍贯地。
在步骤203中,根据对象的活跃地和籍贯地,确定地理位置系数。
本步骤中,可以设定一个参数即地理位置系数,该系数可以用于表示两个用户之间的地理位置关系;该地理位置系数值的设置,可以根据两个对象的活跃地和籍贯地的相同与否来设置。比如,如果两个用户的活跃地和籍贯地相同,则设置地理位置系数值最高,如果两个用户的活跃地和籍贯地至少一个不同,设置地理位置系数值降低。当然也可以有其他的地理位置系数值的设置方式,只要能体现对象的活跃地和籍贯地的关系即可。
举例如下:在O2O的场景下,用户的影响力是受地理位置限制的,在同城的朋友更容易相互影响,假设用户A的活跃城市和籍贯城市都是杭州,他有三个朋友,B(活跃城市在杭州)、C(活跃城市在北京,籍贯城市在杭州)、D(活跃城市和籍贯城市都在北京)。某天用户A在杭州某家餐馆吃饭之后,感觉口味和环境非常好,就在生活圈分享了这家店,他在杭州的朋友B看到了,周末很可能也会去尝一尝,但他在北京的朋友C和D却不太可能去吃,用户A对他的同城朋友影响更大。C与D之间比较,C去这家餐馆的概率更大一些,因为C的籍贯地在杭州,说明C的老家在杭州,逢年过节C可能会去杭州,受A的推荐影响也可能会去这家店吃一餐。D去杭州的可能性很低,但是也不是没有可能,比如出差、旅游去杭州。
在上面的例子中,可以根据两个用户之间的地理位置关系,设置地理位置系数值。例如,假设地理位置系数为p,对于用户A和用户B,设置这两个用户对应的p为1;将用户A和用户C之间的p设为0.2,将用户A和用户D之间的p设为0.02。即,本例子中的地理位置系数p的取值可以按照如下原则:
p=1.0:用户i与j的活跃城市相同,即i和j经常在一个城市;
p=0.2:两个用户籍贯城市相同,或者一个用户的活跃城市与另一个用户的籍贯城市相同;
p=0.02:两个用户的籍贯城市和活跃城市都不同。
在步骤204中,通过所述地理位置系数值,对所述基础关系权重进行调整,得到调整后的所述新对象关系权重。
在步骤201计算得到的基础关系权重的基础上,本例子可以利用步骤203得到的地理位置系数对两个对象的基础关系权重进行调整。例如,假设将调整后得到的权重称为新对象关系权重,并用R<i,j>表示用户i和用户j之间的新对象关系权重,则调整方式如下:
R<i,j>=W<i,j>*p
即新对象关系权重可以为基础关系权重与地理位置系数的乘积。但是,本实施例并不局限于此种调整方式,也可以采用根据地理位置系数进行调整的其他调整公式。例如,如果将p设置为1,则调整后的权重与基础关系权重相同;如果将p设置为0.2,即新对象关系权重降低为基础关系权重的20%;如果将p设置为0.02,即新对象关系权重降低为基础关系权重的2%。
在步骤205中,根据所述对象群体中的各新对象关系权重,分别确定所述对象群体中的每个对象对应的传播力值。
本步骤中,可以将调整后的新对象关系权重R<i,j>归一化,构建一个带权网络,使用带权PageRank算法计算得到每个用户的传播力Transmissibility。即使用步骤204中得到的新对象关系权重,按照PageRank算法中提到的节点重要性更新公式计算,就可以得到传播力Transmissibility。
在步骤206中,根据每个对象在业务中的业务活动参数,分别确定每个对象对应的活跃度值。
本例子要选择的种子用户可以是在O2O领域比较活跃的用户,这样他才有可能走进餐馆去消费,进而影响他的周围朋友去消费,如果他自己是很少去外面餐馆吃饭,总是在家吃饭,那么优惠券很难打动他,更不要说让他影响他的朋友去餐馆消费了。因此,本步骤要确定用户的活跃度值。
例如,可以按照如下方法计算活跃度值:可以获取最近3个月用户在线下消费的次数和商家个数等信息,并按照如下公式计算活跃度值Active:
Active=消费商家数*消费天数*log(消费次数)
根据上面的公式,只有持续多次去多家店铺消费的用户的活跃度才会很高,这种用户也更有可能去影响其他人消费。
在步骤207中,根据所述活跃度值和传播力值,分别确定每个对象对应的影响力值。
本步骤中将综合根据活跃度值和传播力值,确定对象的影响力值;只有活跃度值和传播力值都很高的用户,才有可能是影响力高的用户。本例子中,在影响力值的确定中,设置所述活跃度值对影响力值计算的权重,低于传播力值对影响力值计算的权重。这种影响的不同可以通过如下方式体现:
例如,可以将活跃度Active归一化为[1,50],将传播力值Transmissibility归一化到[1,1000],然后通过如下公式计算对应的影响力值Influence:
Influence=Transmissibility*Active
上述例子中,活跃度对影响力的影响,比传播力值对影响力值计算的影响要低。比如,一个1天去餐馆消费一次的用户A和一个1天去餐馆消费4次的用户,评价其影响力,区别并不是很明显;而传播力却不同,对一个很少在社交网络上发言的普通用户来说,他的传播力几乎可以忽略不计,与高传播力用户之间的差距可以是千倍以上。
在步骤208中,选择影响力值大于预设阈值的对象作为目标对象。
本例子对带权PageRank算法进行了改进,不仅对该算法中的权重进行了调整,将用户的地理位置融入了关系权重的计算中,并且还综合根据了用户的活跃度值,能更加有效的度量用户在O2O领域的影响力,选择影响力高的用户来分配资源,能够取得更好的业务收益。
为了实现上述的对象选择方法,本申请实施例还提供了一种对象选择装置,如图3所示,该装置可以包括:权重调整模块31、传播确定模块32、活跃确定模块33、影响确定模块34和选择处理模块35。
权重调整模块31,用于根据用于影响目标对象选择的业务影响参数,分别对每两个对象之间的基础关系权重进行调整,得到新对象关系权重;
传播确定模块32,用于根据对象群体中的各新对象关系权重,分别确定所述对象群体中的每个对象对应的传播力值,所述对象群体包括多个对象;
活跃确定模块33,用于根据每个对象在业务中的业务活动参数,分别确定每个对象对应的活跃度值,所述活跃度值用于表示对象在业务中的参与程度;
影响确定模块34,用于根据所述活跃度值和传播力值,分别确定每个对象对应的影响力值,所述影响力值用于表示所述对象对其他对象的影响程度;
选择处理模块35,用于选择影响力值大于预设阈值的对象作为目标对象。
在一个例子中,权重调整模块31,具体用于根据两个对象之间的地理位置关系,确定地理位置系数值,所述地理位置系数值作为所述业务影响参数;通过所述地理位置系数值,对所述基础关系权重进行调整,得到调整后的所述新对象关系权重。
在一个例子中,如图4所示,权重调整模块31可以包括:
地址获取单元311,用于根据所述对象在业务中的地址信息,确定所述对象的活跃地,并获取所述对象在业务中记录的籍贯地;
参数设置单元312,用于根据所述两个对象的活跃地和籍贯地相同与否,设置不同的地理位置系数值。
在一个例子中,影响确定模块34,用于在所述影响力值的确定中,设置所述活跃度值对影响力值计算的权重,低于传播力值对影响力值计算的权重。
在一个例子中,所述每个对象对应的传播力值,采用带权PageRank算法确定。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。