CN109428928B - 信息推送对象的选择方法、装置及设备 - Google Patents
信息推送对象的选择方法、装置及设备 Download PDFInfo
- Publication number
- CN109428928B CN109428928B CN201710773844.3A CN201710773844A CN109428928B CN 109428928 B CN109428928 B CN 109428928B CN 201710773844 A CN201710773844 A CN 201710773844A CN 109428928 B CN109428928 B CN 109428928B
- Authority
- CN
- China
- Prior art keywords
- users
- user
- community
- seed
- influence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例提供一种信息推送对象的选择方法、装置及电子设备,本申请在离线状态下利用该信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到信息推送平台的多个候选社区,得到种子包后,按照其与各候选社区的重合值,选择出目标社区即候选扩散用户群,将利用目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象,提高了所选信息推送对象与种子用户的相似性,保证了信息推送效果。
Description
技术领域
本发明涉及信息定向推送应用领域,具体涉及一种信息推送对象的选择方法、装置及电子设备。
背景技术
社交网络,是一种近年来迅速崛起的互联网主流信息传播媒体,它允许用户通过个人终端或移动终端作为入口,利用不超过特定字数限制的字符组织语言,发布感兴趣的内容,或通过评论或留言,发表个人观点,与好友进行线上互动。此外,社交网络还允许成员使其自身与其他成员相关联,从而创建该社交网络成员间的连接网,以便社交网络利用这些连接来根据成员自述的兴趣,为每个成员推送更相关的信息。
基于此,社交网络引起了互联网广告商的关注,也给社交网络的运营商带来了新的商机,使得互联网广告界诞生了社交广告这种新的广告形式,其是以社交网络为广告投放的目标平台,社交网络的运行商和广告商将社交网络中的用户作为广告受众,根据用户线上活动和社交行为,定制并投放契合用户需求的广告,从而提升广告点击率和转化率。
现有技术中,通常是将广告主提供的种子用户对社交广告的点击率作为正样本,将种子用户之外随机选取的用户对社交广告的点击率作为负样本,利用决策树、回归分析等算法进行模型训练,之后,通过训练得到的预测模型对全量用户进行分类,确定出社交广告的定向推送对象。
然而,现有的这种信息推送对象的选择方法,只关注了用户对社交广告的点击率,使得用于训练预测模型的样本数据片面,导致其确定的社交广告的定向推送用户与种子用户相似性不佳,且在社交平台投放社交广告互动效果不够理想。
发明内容
有鉴于此,本发明实施例提供一种信息推送对象的选择方法、装置及电子设备,基于种子用户在所选社区内的影响力传播,选择与种子用户相似性更高的信息推送对象,保证了信息推送效果。
为实现上述目的,本发明实施例提供如下技术方案:
本申请实施例提供了一种信息推送对象的选择方法,所述方法包括:
利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区;
获得本次推送信息的种子包,计算所述种子包与所述多个候选社区的用户重合值,所述种子包包括多个种子用户;
选择最大用户重合值对应的候选社区为目标社区;
利用所述目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象。
本申请实施例还提供了一种信息推送对象的选择装置,所述装置包括:
社区划分模块,用于利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区;
用户重合值计算模块,用于获得本次推送信息的种子包,计算所述种子包与所述多个候选社区的用户重合值;
选择模块,用于选择最大用户重合值对应的候选社区为目标社区;
信息推送对象确定模块,用于利用所述目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象。
本申请实施例还提供了一种电子设备,所述电子设备包括:
通信接口;
存储器,用于存储实现如上所述的信息推送对象的选择方法的程序;
处理器,用于加载并执行所述存储器存储的程序,包括:
利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区;
获得本次推送信息的种子包,计算所述种子包与所述多个候选社区的用户重合值,所述种子包包括多个种子用户;
选择最大用户重合值对应的候选社区为目标社区;
利用所述目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象。
基于上述技术方案,本发明实施例提供了一种信息推送对象的选择方法、装置及电子设备,确定本次推送信息的信息推送平台后且在获取种子用户之前,本申请将在离线状态下利用该信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到信息推送平台的多个候选社区,这样在对种子用户进行在线扩散时,可以从中选择一个目标社区,只需要从该目标社区中确定信息推送对象,保证了对种子用户的扩展过程能够在规定时间内完成。而且,本申请选择出与种子包的用户重合值最大的目标社区后,将利用目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象,可见,本申请在确定信息推送对象时,充分考虑到了信息推送平台中用户之间社交行为的相互影响,提高选定的信息推送对象与种子用户的相似性,从而保证了本次信息推送的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为电子设备的硬件结构框图;
图2为本发明实施例提供的一种信息推送对象的选择方法的流程图;
图3为本发明实施例提供的一种关系网络图;
图4为本发明实施例提供的另一种信息推送对象的选择方法的部分流程图;
图5a为本发明实施例提供的又一种信息推送对象的选择方法的部分流程;
图5b为本发明实施例提供的另一种关系网络图;
图6为本发明实施例提供的一种信息推送对象选择平台界面示意图;
图7为本发明实施例提供的一种创建信息推送对象的操作界面示意图;
图8为本发明实施例提供的又一种信息推送对象的选择方法的流程示意图;
图9为本发明实施例提供的一种信息推送对象的选择装置的结构图;
图10为本发明实施例提供的另一种信息推送对象的选择装置的结构图;
图11为本发明实施例提供的又一种信息推送对象的选择装置的结构图;
图12为本发明实施例提供的又一种信息推送对象的选择装置的结构图。
具体实施方式
本申请的申请人在研究过程中发现,在社交场景下,DMP(Data ManagementPlatform,数据管理平台)获得种子用户,并通过人群扩展方式获取更大的用户群即扩展用户时,为了提高社交广告等信息的投放效果,不仅需要考虑信息的曝光率、点击率等因素,还需要考虑社交平台互动程序,以及与种子用户的相似性。
其中,在社交网络中,物以类聚,人以群分,社交属性通常能够表征一定的相似性,也就是说,用户之间的社交行为是具有一定影响力,比如,用户的点赞概率会随着已经点赞的好友增多而上升,也就是说,用户是否点赞会受好友点赞行为的影响,而且,关系亲密度较高的好友的行为对用户行为的影响力往往较大。所以,申请人综合考虑社交网络的社交属性以及用户兴趣属性,提出一种新的信息推送对象的选择方案。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例提供的信息推送对象的选择方法可以应用于具有数据处理能力的电子设备,该电子设备可能是网络侧设置的服务器,也可能是用户侧设置的PC(个人计算机)等终端设备;该电子设备可以通过装载实现本发明实施例提供的信息推送对象的选择方法相应的程序,实施本发明实施例提供的信息推送对象的选择方法,该程序可以存储于电子设备的存储器中,并由处理器调用实现程序功能;
可选的,图1示出了本发明实施例提供的电子设备的硬件结构框图,参照图1,该电子设备可以包括:通信接口11,存储器12、处理器13和通信总线14;
在本发明实施例中,通信接口11、存储器12、处理器13、通信总线14的数量为至少一个,且通信接口11、存储器12、处理器13、可以通过通信总线14完成相互间的通信;
可选的,通信接口11可以为通信模块的接口,如GSM模块的接口;
处理器13可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器12可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,存储器12存储有程序,处理器13调用存储器12所存储的程序可以实现本发明实施例提供的信息推送对象的选择方法;
显然,图1所示电子设备的硬件结构仅是可选的,根据使用需要,电子设备还可以设置信息输入装置(键盘、鼠标等)、显示器等。
下面站在电子设备的角度,对本发明实施例提供的信息推送对象的选择方法进行介绍,下文描述的方法步骤可以由电子设备执行相应的程序实施。
图2为本发明实施例提供的信息推送对象的选择方法的流程图,该方法可应用于上述电子设备,参照图2,该方法可以包括:
步骤S201,获取信息推送平台在预设时间内产生的用户行为信息,并利用该用户行为信息计算用户之间的相对影响力;
社交网络不同于普通的静态网络,其网络结构随着时间变化而不断发生变化。其中,社交网络的网络结构通常可以由用户和他们的社会网络关系共同构成,不仅取决于单个节点,还包括特定的节点所拥有的连接,且这些连接通常包括内容、方向和强度等特征。这种关系的强度可以称为好友的亲密度,即用于表示了两个用户或两个节点在社交网络中的亲密程度,例如关系好、关系一般、关系疏远。
结合上述描述,在信息推送平台中,对于推送信息接受与否很容易受到好友行为的影响,而且,与用户亲密度越高的好友用户的行为,对用户决定的影响程度越高。所以,本申请实施例可以利用用户之间的相对亲密度来表示这两个用户之间的相对影响力,即一个用户行为影响另一个用户行为的概率。
而在实际应用中,随着时间的推移,好友的亲密度也会随之发生变化,也就是说,用户之间的亲密度并不是固定不变的,基于此,为了提高信息推送对象选择的准确性,以提高信息推送效率,本申请实施例将利用最近预设时间内信息推送平台(如社交网络平台)产生的用户行为信息,如该信息推送平台中的用户操作行为数据及其操作产生的行为数据等等,可以是用户之间的通信次数、用户A对用户B的评论次数、点赞次数等等,从而利用预设时间内的用户行为信息,计算这段时间内用户之间的亲密度。
由此可见,上述获取的用户行为信息可以包括预设时间内,信息推送平台检测到的用户A给用户B发送的信息数量,用户A给用户B的发布的动态信息的评论次数以及点赞次数等。其中,用户A和用户B是信息推送平台中的任意不同用户,且本申请对表征用户之间亲密度的因素即用户行为信息的内容不作限定。
在本实施例中,可以利用数据挖技术计算用户之间的相对亲密度(即相对影响力,下文不再说明),本申请对具体采用的计算方法不作限定,可选的,本申请实施例在此仅以公式(1)这种计算方法为例进行说明,但并不局限于这一种好友亲密度算法。
该公式(1)中,f(u,v)表示预设时间内,信息推送平台中的用户u对用户v的影响力,即用户u相对于用户v来说的相对亲密度,message(u,v)表示预设时间(如一个月等)内,用户u通过信息推送平台给用户v发送的信息数量;comment(u,v)表示该预设时间内,用户u对用户v在信息推送平台发表的动态信息的评论次数;like(u,v)表示该预设时间内,用户u对用户v在信息推送平台发表的动态信息的点赞次数;a、b、c和d表示4个常量,a、b和c可以根据对应参数(如上述信息数量、评论次数、点赞次数等)对用户之间的亲密度大小重要性确定,也可以根据实际经验确定,d可以根据多次样本计算的准确性确定,或根据经验设定,本申请实施例对这4个常量的数值不做限定。
由此可见,本申请实施例可以利用上述公式(1)描述的方式,计算信息推送平台中一个用户相对于另一个用户的相对亲密度,但并不局限于本实施例描述的这种亲密度计算方法,在实际应用中,计算得到的用户之间的相对亲密度可以是-1到1之间的数值。
其中,用户A与用户B的相对亲密度为负数,说明该用户B的行为对用户A的行为起到了负相关作用,如用户B支持某观点,该用户A受其影响,很可能反对该观点;相应地,若用户A与用户B的相对亲密度为正数,说明该用户B的行为对用户A的行为起到了正相关作用,即用户A很大可能会跟随用户B行为,本申请对相对亲密度数值的表示含义不做限定。
需要说明的是,基于公式(1)中各部分表示的含义,由于用户u对用户v发送信息或针对其动态信息发布评论、点赞,并不意味着用户v也会对用户u进行相应操作,所以说,用户u相对于用户v的亲密度,与用户v相对于用户u的亲密度并不一定相同,因此,本申请实施例利用公式(1)可以计算用户之间的相对亲密度,即用户之间亲密度是具有方向的,也就是说用户之间的相对影响力是具有方向的。
步骤S202,利用信息推送平台中任意两个用户之间的相对影响力,确定各用户自身的用户影响力;
在社会学中,普遍认为影响力是指改变他人想法或行为的能力,基于此,在本申请主要是研究人物的影响力,即人物在某个群体中的影响力:在某个群体中,某人采用某个行为后,改变他人想法或行为的能力,也可以成为该人物在这个群体中的影响力。
具体的,在社交网络中,用户的影响力可以指在某个社交网络群体中,某用户采用某个行为之后,引起他人行为改变的能力。在实际应用中,用户的影响力可以分成传播力(被转发、被评论的有效条数和有效人数)、覆盖度(活跃粉丝数)、活跃度(发布信息、转发、评论的有效条数)这三方面。申请人经研究发现,用户之间的亲密度与用户自身的影响力有关。
假设用户i是用户u的好友,用户j是用户i的好友,node_inf(u)表示用户u的全局影响力,node_inf(i)表示用户i的全局影响力,f(i,j)表示用户i对用户j的亲密度,即用户i与用户j的相对亲密度(即相对影响力),计算方法可以参照上述公式(1)的计算方法,本实施例在此不再详述。
那么,在用户i具有全局影响力node_inf(i)的情况下,该用户i将自己的影响力分配给其好友用户u时,具体按照什么比例进行分配,可以根据该用户i对好友用户u的相对亲密度,在该用户i对其所有好友用户的相对亲密度总和所占的比例K(如下公式(2)),为其好友用户u分配其全局影响力,则用户u得到了用户i分配的影响力K*node_inf(i),即下面公式(3)。
按照上述描述的用户u从其某个好友用户i获得的影响力的方案,可以得到该用户u从其所有好友得到影响力的总和,即下面公式(4)表达含义,需要说明的是,在公式(4)中,i表示用户的任意好友。
另外,在本申请中,由于用户的影响力不仅受用户之间的社交关系影响,还会受用户自身兴趣的影响,本实施例可以设置用户影响力不受社交关系影响的系数α,则1-α表示的是受社交关系的影响。所以,该α可以表示一个小于1的常量,可以取0.15,但并不局限于此。
基于此,本申请可以得到公式(5)计算出用户自身的用户影响力,
在该公式(5)中,当α=0,则该公式表示的是用户u(信息推送平台中的任意一个用户)的全局影响力,也就是说,此时用户u的影响力全部取决于社交关系,此时可以将该用户u的所有好友的全局影响力传给用户u之后的求和,得到该用户u自身的用户影响力。
综上可知,本申请实施例采用的是一种改进的pagepank算法(即网页排名算法),实现用户自身影响力的计算,即利用计算得到的任意两个用户之间的相对影响力,按照网页排名算法,计算各用户自身的用户影响力。需要说明的是,关于用户自身的影响力的计算,并不局限于上文描述的计算方法。
步骤S203,将信息推送平台中的用户作为节点,该用户自身的用户影响力作为节点权重,并将用户之间的相对影响力作为相应节点之间的有向边的边权重,构建信息推送平台的关系网络图;
在本申请实施例中,如图3所示的四个节点Q1、Q2、Q3、Q4,结合上述分析,用户u相对用户v的亲密度,与用户v相对于用户u的亲密度可以不同,即任意两个用户之间的相对影响力可以不同,所以,该图3中的任意两个节点,以节点Q1和节点Q2为例,节点Q1相对于节点Q2的边权重w12,与节点Q2相对于Q1的边权重w21不一定相同,即节点Q1和节点Q2之间的不同方向的边权重可以不同。可见,本申请实施例生成的关系网络图实际是有向图。
需要说明的是,本申请实施例对生成的关系网络图的表现形式不做限定。且针对不同信息推送平台,生成的相应的关系网络图可以不同,针对同一信息推送平台的不同时间段内用户行为信息,所生成的关系网络图也可能不同,本申请实施例在此不再一一详述。
步骤S204,确定该关系网络图中各节点一一对应的标签,并根据标签传播算法对所述各节点一一对应的标签进行迭代更新,直至达到第二预设条件;
其中,标签传播算法(LPA)是基于图的半监督学习方法,其是利用已标记节点的标签信息,去预测未标记节点的标签信息。所以,本申请实施例可以利用标签传播算法,基于用户影响力和/或用户之间的相对影响力,对信息推送平台中多个用户进行社区划分,确定多个候选社区。
在得到关系网络图后,首先可以对该关系网络图进行初始化,即为该关系网络图中的每个节点赋予一个唯一的标签。初始时,赋予每个节点的标签,主要用来将关系网络图中的各个节点进行区分,可以数字、字母或者数字与字母的组合,也可以利用每个节点对应的用户ID作为该节点的标签,本申请对赋予每个节点的标签内容不作限定。之后,可以利用节点权重和/或边权重,通过关系网络图中边将标签向其他节点传播,从而实现已标记的节点标签的更新与传播。
可选的,在每一轮的节点标签更新中,对于关系网络图中的任意一个节点Q,可以采用如图4所示的更新方法,实现节点Q标签的更新,该方法可以包括:
步骤S401,获取节点Q的所有邻居节点;
在本实施例中,节点Q的邻居节点可以指与节点Q发生互动的节点,可以包括与节点Q发生单向互动以及双向互动的所有节点,如图3中,对于节点Q2来说,其邻居节点包括节点Q1和Q3;对于节点Q3,其邻居节点可以包括节点Q4。
步骤S402,判断节点Q的所有邻居节点中节点权重最大的邻居节点是否为一个;如果是,进入步骤S403;如果否,执行步骤S404;
步骤S403,将最大节点权重对应的邻居节点的标签作为节点Q更新后的标签;
步骤S404,从最大节点权重对应的多个邻居节点随机选择一个邻居节点,将选择的邻居节点的标签作为节点Q更新后的标签;
在本申请实施例中,在每一轮对关系网络图中的节点标签的更新,可以采用上述图4对应的实施例描述的方法实现,由该方法可知,每个节点的新标签将根据其邻居节点的节点权重以及标签确定,但并不局限于上述实施例描述的方法。
作为本申请另一实施例,与上述可选实施例利用节点权重实现标签传播算法不同,还可以利用边权重实现该标签传播算法,如图5a所示,该方法可以包括:
步骤S501,获取节点Q的所有邻居节点,并确定各邻居节点的标签;
步骤S502,判断出现次数最多的邻居节点的标签是否为一个,若是,执行步骤S505;若否,进入步骤S503;
步骤S503,将标签出现次数最多的多个邻居节点作为候选邻居节点,获取各候选邻居节点对节点Q的边权重;
步骤S504,确定最大边权重对应候选邻居节点的标签为节点Q更新后的标签;
举例说明,如图5b所示,以节点Q2为例,其邻居节点包括节点Q1、节点Q3、节点Q4、节点Q5以及节点Q6,通过这几个邻居节点的标签的比对,可知,其包括2个标签2,2个标签3,以及1个标签4,也就是说,出现次数最多的邻居节点的标签为多个,即标签2和标签3,这种情况下,可以将节点Q1和Q6以及节点Q4和Q5作为候选邻居节点,计算这几个候选邻居节点对节点Q2的边权重,确定最大边权重对应的候选邻居节点的标签作为节点Q2的更新后的标签。
可选的,在本申请中,基于本实施例描述的标签更新算法的实现方法,在步骤S503中也可以获取各候选邻居节点的节点权重,之后,确定最大节点权重对应的候选邻居节点的标签为节点Q更新后的标签。或者,本申请实施例还可以综合考虑邻居节点的节点权重及其与节点Q的边权重,来实现对节点Q的标签的更新,本申请对标签更新算法的具体实现方法不做限定,可以根据实际需要灵活选择,本申请在此不再一一详述各种实施例的实现方法。
步骤S505,将出现次数最多的邻居节点的标签作为节点Q更新后的标签。
可选的,上述第二预设条件可以指当前迭代次数达到预设迭代数量,这种情况下,可以在进行第一轮节点标签更新前,对迭代次数进行统计,如初始化后,可以令迭代计数器t=1,每次完成迭代后,可以检测当前迭代次数即t的数值是否等于预设迭代数量,若是,停止迭代。
当然,上述第二预设条件也可以指当前关系网络图中节点标签的收敛情况达到预设收敛要求。本申请对停止迭代的终止条件的内容不作限定。
在实施例实际应用中,用于需要进行多次迭代,每次迭代时都需要确定每个节点的邻居节点,因此,当关系网络图包括数量众多的节点,如包括1万个节点等,在确定任意一个节点的邻居节点时,都需要遍历其他9999个节点,才能确定该节点的邻居节点,过程比较复杂。
对此,本申请实施例可以针对生成的关系网络图,预先建立邻居节点映射表,即预先建立每一个节点及其邻居节点的映射关系表,这样,当需要对该关系网络图中的任意一个节点的标签进行更新,可以通过查询该映射关系表,快速准确地确定出该节点的邻居节点,简化了运算,提高了社区发现效率。
步骤S205,获得最后一次迭代更新后的各节点一一对应的标签,并将同一标签对应的用户构建成一个社区,得到多个候选社区;
在本申请实施例中,对于本申请确定的关联网络图,按照上述描述的社区划分方法得到的多个候选社区中,每个候选社区可能包含具有相同标签的多个节点,也就是说,本申请实施例通过上述方法,将信息推送平台中的多个用户划分成了多个用户群,每个用户群都包含有对应同一标签的多个用户,或者说是包括多个社交关系比较紧密的用户。
可见,同一候选社区中各节点之间的关系非常紧密,而不同候选社区之间的疏远,甚至有些节点之间并不具有社交关系,即有些候选社区之间的用户并未进行过社交互动。
步骤S206,利用预设社区调整规则,对得到的多个候选社区进行优化处理;
在本申请实施例中,按照上述方法得到关系网络图的多个候选社区后,由于社区大小差别过大,可能会影响信息推送对象选择的准确性,所以,本申请可以对得到的多个候选社区进行进一步优化处理。
其中,对于得到的多个候选社区的优化处理可以包括拆分巨型社区、合并小社区等,基于此,上述预设社区调整规则可以包括进行各种优化处理时对应的社区大小,即拆分巨型社区时依据的巨型社区大小,以及合并小社区时依据的小社区大小,以及不做任何优化处理的社区大小。在本实施例中,社区大小可以指该社区内包含的用户数量,可以指一个用户数量范围。
举例说,参照下表1所示的预设社区调整规则,但并不局限于表1所示的社区调整规则。
候选社区大小(候选社区内用户数量) | 优化处理 |
(-∞,100] | 合并 |
(100,50万) | 不处理 |
[50万,+∞) | 拆分 |
表1
基于此,本申请实施例可以对得到的多个候选社区包含的用户数量进行一一检测,从而按照表1所示的社区调整规则,确定出包含的用户数量不大于100的候选社区(记为小社区)、包含的用户数量不小于50万的候选社区(记为巨型社区),以及包含的用户数量大于100且不大于50万的候选社区(记为大社区)。
之后,对于包含的用户数量小于100的小社区,可以将其合并到大社区中,具体可以将确定出的小社区合并到距离其最近的大社区,其中,关于社区之间的距离可以采用公式(6)计算得到,但并不局限于这一种计算方法。
其中,公式(6)中的Dist(ca,cb)表示社区A和社区B之间的距离,f(A,B)表示社区A和社区B之间的边影响力之和,即两个社区间节点的边影响力之和。在本申请实施例中,可以先确定这两个社区的节点,从而确定两个社区间节点之间的边,从而计算这些边的权重的总和,即为公式(6)中的f(A,B)。
另外,对于包含的用户数量不小于50万的巨型社区,本申请实施例可以对其进行拆分,具体可以利用该巨型社区包含的节点及其节点之间边的权重,确定该巨型社区对应的有向图,之后,利用Fast Unfolding算法(即社区发现算法),实现对该有向图的拆分,并将拆分后的每一部分的节点及其边作为一个社区,所以,本申请实施例可以采用这种方法将一个巨型社区,拆分成多个小社区和/或多个大社区。
在实际应用中,模块度(modularity)是度量社区划分优劣的重要标准,划分后的网络模块度越大,说明社区划分的效果越好。该模块度是指网络中连接社区结构内部顶点的边所占的比例,减去同样的社区结构下任意连接两个节点的比例的期望值。而上述FastUnfolding算法就是基于模块度对社区划分的算法,其实际上是一种迭代算法,主要目标是不断划分社区使得划分后的整个网络的模块度不断增大。
具体的,对巨型社区进行初始化,将其中的每个节点划分在不同的社区中,之后,可以将每个节点尝试划分到与其邻接的节点所在的社区中,并计算此时的模块度,判断划分前后的模块度的差值是否为正数,若是,可以接受本次划分;否则,将放弃本次划分,重复上述步骤,直至不能再增大模块度为止;重新构造网络图,该新的网络图中每个节点代表上述划分出来的社区,继续对新网络图进行社区划分,直至得到的新的网络图的结构不再改变,完成对巨型社区的划分。
步骤S207,获得本次推送信息的种子包,该种子包包括多个种子用户的标识;
在本申请实施例中,针对本次推送信息,可以由推送该信息的用户(如推送广告的广告主)确定一个用户群作为种子用户,也就是该用户的目标用户中非常核心的一群用户,该种子用户往往是本次推送信息的重度使用者,并且积极主动、乐于反馈和分享。
以社交网络中的社区为例,种子用户可以是每日主动登陆社区,积极搜索感兴趣的帖子并回复,论坛积分级别在前1%的用户,通常会主动给出改善建议,并推广团队,在社区内主动发言,回复社区内文图,并作积极引导的用户等等。可见,本申请上述种子用户是具有传播性,有强烈分享意愿,愿意把这些好东西分享给朋友身边的人等,而不是有了好东西也要自己藏起来的类型的用户,本申请对如何筛选种子用户的方法不做限定。
在实际应用中,当需要在信息推送平台推广本次推送信息,为了降低推送成本并提高推送效率,往往需要精准定位有效用户,因此,目前通常是利用小流量产生少量种子用户,再分析种子用户的行为特征,指导更大规模的信息推送,即对种子用户进行扩散,以获得与种子用户相似的大量扩展用户,作为本次推送信息的推送对象,从而提高本次信息推送效果。
本申请实施例中,对于本次推送信息的用户,可以采用种子包的方式,直接给定多个种子用户的标识,以使系统据此得知本次推送信息的种子用户有哪些。可见,该种子用户的标识主要用来区分不同的种子用户,本实施例对其包含的内容不作限定,可以是数字号码、字母等等,所以,本申请实现信息推送对象的选择平台将会接收到用户给定的种子用户的标识包。
步骤208,利用多个种子用户的标识,计算该种子包与优化处理后的各候选社区的用户重合值;
在本申请实施例中,对于得到的每个优化处理后的候选社区,可以计算其与种子包的用户重合值,该用户重合值的大小可以表示候选社区包含的用户与多个种子用户的重合概率,也可以称为重合度或匹配度。
可选的,本申请可以采用公式(7)、(8)和(9),计算得到各优化处理后的候选社区与种子包的用户重合值Flc,但并不局限于这一种计算方法。
上述公式中,SeedNumc表示落在候选社区中的种子用户的数量;SeedNum表示获得的多个种子用户的总数据量;csizec表示该候选社区包含的用户数量;Pc表示落在候选社区中的种子用户占该社区所有用户的比例;R(c)表示落在候选社区中的种子用户占所有种子用户的比例。
由此可见,本申请实施例可以利用多个种子用户的标识,确定针对本次推送信息的种子用户的数量,之后,将这多个种子用户的标识分别与获得的每个候选社区包含的用户标识(即节点标识)进行对比,从而确定落在每个候选社区中的种子用户的数量,即每个候选社区包含的种子用户的标识的数量,并结合每个候选社区包含的用户数量(即节点数量),按照上述公式记载的方法,计算得到优化处理后的每个候选社区与种子包的用户重合值。
步骤S209,选择最大用户重合值对应的候选社区为目标社区;
在本实施例实际应用中,所得候选社区用户与给定的种子用户的重合值越大,说明本次推送信息向该候选社区中的用户推送的意愿越高,信息推送的效果越好。基于此,本申请实施例可以选取综合得分高的候选社区,即与种子用户的重合度最高的候选社区为目标社区。
可见,本申请还可以按照用户重合值从大到小(或从小到大)的顺序,对优化处理后的多个候选社区进行排序,从而确定最高用户重合值对应的候选社区为目标社区。
步骤S210,利用该目标社区包含的用户,用户影响力以及用户之间的相对影响力,构建关系网络子图;
其中,关于关系网络子图的构建过程与上述实施例关系网络图的构建过程类似,可以将目标社区包含的各用户作为该关系网络子图的节点,并将目标社区包含的各用户之间的相对影响力,作为对应节点之间的边的权重,从而生成关系网络子图。
步骤S211,对关系网络子图进行初始化,确定该关系网络子图中各节点的初始社交分数;
在本申请实施例中,仍可以采用迭代的方式对关系网络子图进行处理,因此,在进行迭代运算之前,可以先对关系网络子图进行初始化,即迭代次数t=0的情况下,将该关系网络子图中的各节点的自身全局影响力,确定为对应节点的社交得分初始值,其中,该关系网络子图中包含的种子用户对应的节点的初始值,可以是该种子用户的用户影响力与预设权重的总和,该预设权重通常大于1,具体可以根据经验设定,本申请对该预设权重的具体数值不做限定。
步骤S212,利用预设迭代算法,对得到关系网络子图的各节点的初始社交分数进行更新,直至更新前后的社交分数不再改变或者更新次数达到预设次数;
可选的,本申请实施例的节点的社交分数可以是该节点用户自身的用户影响力,因此,该预设迭代算法可以为上述公式(5),若采用p(u)表示用户的社交分数,则该预设计算公式可以变形为:
其中,β可以表示用户u自身固有影响力,即不受好友行为影响,自主作出决定的概率,可以为0.15,但并不局限与此。需要说明的是,关于公式(10)的解释可以参照上述公式(5)相应部分的说明,本实施例在此不再详述。
在本实施例中,得到关系网络子图中各节点用户的初始社交分数后,令迭代次数t=1,将各用户的初始社交分数代入公式(10),实现对初始的各用户的社交分数的更新,得到各用户更新后的社交分数,继续迭代,即t=2,将各用户更新后的社交分数继续代入公式(10),得到各用户新的社交分数,以此类推,直至t等于预设次数,或者最后得到的更新后的社交分数与更新前的社交分数相同,也就是说关系网络子图中各节点的社交分数收敛,可以终止迭代。本申请可以将更新前后的社交分数不再改变或者更新次数达到预设次数作为第一预设条件。
步骤S213,获得关系网络子图中各节点的目标社交分数,以及基于用户画像的相似人群扩展训练得到的各节点对应的用户兴趣分数;
本申请实施例可以将最后一次迭代得到的各用户的社交分数,作为相应用户的目标社交分数,关于用户兴趣分数可以利用传统的相似人群扩展Lookalike模型训练得到,本申请对其具体实现方法不作限定。
可选的,本申请实施例在获得种子用户后,可以将种子用户的用户画像数据(如年龄、性别、商业兴趣画像等等)作为正样本,将种子用户之外的随机选择用户的用户画像数据作为负样本,利用逻辑回归算法进行模型训练,得到预测用户对推送信息兴趣概率的兴趣预测模型,从而基于关系网络子图中的各节点用户的用户画像数据,利用该兴趣预测模型得到对应用户兴趣分数。其中,用户兴趣分数越高表明该用户对本次推送信息的感兴趣程度越高。
需要说明的是,关于用户兴趣分数的获取过程可以在得到种子包就执行,以提高工作效率,并不限定在步骤S213阶段才执行。
可选的,关于对用户兴趣偏好的分析还可以在离线状态下执行,也就是说,在获取本次种子包之前,采用上述方式确定信息推送平台上各用户的兴趣偏好,并将预测模型输出的数值作为相应用户的兴趣分数,表征该用户对相应推送信息的感兴趣概率,这种情况,在获得本次种子用户后,可以直接调取对应用户的用户兴趣分数即可,进一步提高了工作效率。
步骤S214,对各用户的社交分数和用户兴趣分数进行加权求和运算,得到相应用户的目标分数;
本申请实施例中,用户的目标分数=x*社交分数+y*用户兴趣分数,其中,x和y表示相应分数的权重,其可以根据推送信息的用户的喜好确定,若该用户对于本次推送信息对象选择,更看重用户的社交分数,那么可以相应增大x数值;反之,可以相应增大用户兴趣分数;当然,若仅看重社交分数或用户兴趣分数,另一个分数系统可以为零,本申请对x和y的具体数值不作限定。
步骤S215,选择预设数量的最大目标分数的用户,作为本次推送信息的信息推送对象。
可选的,按照上述方法得到目标社区内各用户的目标分数后,可以按照该目标分数的大小进行用户排序,之后,按照用户目标分数从大到小的顺序,选择预设数量的用户作为本次推送信息的扩展用户即信息推送对象。
当然,本申请还可以针对用户的目标分数设置预设阈值,此时,可以选择目标分数达到预设阈值的用户作为扩展用户等。本申请对如何确定扩展用户的方法不作限定。
综上,本申请实施例综合考虑了信息推送平台中用户的社交信息以及兴趣信息,来选择种子用户的扩展方向,最终得到与种子用户相似度较高的扩展用户,提高了向这些扩展用户进行信息推送的效果。
在本申请中,关于从目标社区中选择信息推送对象的方法,并不局限于上述实施例描述的利用社交分数以及用户兴趣分数的方式得到扩展用户的方法,作为本申请另一实施例,还可以利用用户受种子用户的影响力的大小,来确定该种子用户的多个扩展用户。
具体的,关于获取目标社区的方法可以参照上述实施例的描述,本实施例在此不再赘述,也就是说,本实施例将在上述步骤S209之后开始描述,具体的,在确定扩展用户所在的目标社区后,可以计算该目标社区中的用户受到种子用户的影响力大小,从而按照该影响力大小进行排序,确定本次推送信息的多个扩展用户。
其中,用户受种子用户影响力可以包括直接受种子用户的影响力,以及通过其他好友用户间接受种子用户的影响力,假设目标社区中的用户u与用户j是好友,用户j与种子用户i是好友,且用户u也是种子用户i的好友,此时,可以按照下面公式(11)计算用户u受种子用户i影响力:
该公式(11)中,inf(seed,u)表示目标社区中的用户u受多个种子用户的影响力,f(i,u)表示任意一个种子用户i对用户u的相对影响力,可以利用上述公式(1)计算得到,本实施例在此不再详述;∑表示求和运算;f(i,j)f(j,u)表示任意一个种子用户i通过其不同用户j对用户u的相对影响力。由此可见,公式(11)中等式右侧第一项表示多个种子用户对用户u的相对影响力总和,第二项表示多个种子用户通过其他不同用户对用户u的相对影响力的总和,即种子用户对用户u的间接影响力的总和。
由此可见,本申请可以利用种子用户对目标社区中的用户的影响力大小,选择所需的扩展用户,这种是选择方法也充分考虑到了用户的社交行为影响力,提高了所得扩展用户与种子用户的相似性,保证了对选择出的扩展用户进行信息推送的效果。
基于上述对信息推送对象的选择方案的描述,以广告投放的应用场景为例,在实际应用中,某广告主需要定向投放广告时,为了确定广告投放对象,可以通过电子设备登录相应的社交平台,进入如图6所示的界面,用户可以在界面中确定本次选择广告投放对象的方式,如选择相似人群扩散Lookalike方式,之后,可以进入如图7所示的操作界面,以供用户确定种子用户。
如图7所示,广告主可以预先确定本次广告投放的种子用户,并采用种子包的方式存储,那么,当社交平台需要种子包时,可以选择“上传新用户包”,点击“本地文件上传”,从而通过存储路径上传预存的种子包即新用户包。
可选的,用户可以从已有人群中选择种子用户,或者通过选择MDF文件上传这一选项,得到本次扩展所需的种子用户,本申请对获得种子用户的方式不做限定。
在本实施例中,可以根据需要设定种子用户携带的属性信息,如社交号码、手机号、电子邮箱、MID(Mobile Internet Device,移动互联网设备)等等属性信息,以便据此区分种子包中的多个种子用户。用户可以在图7所示的“用户包内容”一栏选定。同理,对于本次扩散用户也可以设定其携带的属性信息,此时可以在“扩散人群内容”一栏选定。需要说明的是,用户包内容与扩散人群内容可以相同,也可以不同。
另外,用户还可以在图7所示的操作界面中,设定由种子用户扩散得到的广告投放对象的人数,如10万人等,这可以根据广告主要求确定,本申请对扩散得到的扩展用户的具体数量不做限定。
之后,用户可以对本次广告投放的扩散用户的具体来源情况进行设定,此时,可以选择“扩散详情”一栏,从而选择广告主要求的本次广告投放的扩散倾向(如目标效果)、投放平台(即上述实施例的信息推送平台)、投放行业等等,完成设定后,用户点击“创建人群”,系统即可根据广告主提供的种子包,得到多个扩散用户。
可选的,本申请可以在人群名称一栏,为所得扩散用户命名,以便快速查找到本次广告投放的扩散用户包。如可以设置号码,这样,系统将生成以该号码命名的一个扩散用户包。
需要说明的是,按照图7所示的操作界面,完成种子用户以及扩散用户的配置,并点击创建人群后,系统将会检测到相应的创建指令,可以按照上述方法实施例描述的过程,确定本次广告投放的扩散用户并输出,本申请在此不再详述。
由此可见,在本申请实施例中,参照图8所示的流程示意图,系统可以在离线状态下,处理数亿用户以及百亿级的关系链数据,实现各信息推送平台的社区划分,以及用户画像挖掘,得到相应的社交信息以及画像信息。这样,在接收到广告主给定的种子用户后,可以直接从相应的信息推送平台中选择出目标社区,即选择出候选扩展用户群,之后,基于种子用户的影响力传播,以及用户兴趣偏好,筛选出本次信息推送对象,缩短了在线处理时间,提高了信息推送对象选择效率。而且,由于在选择信息推送对象时,考虑到了用户社交行为的相互影响,提高了所选信息推送对象与种子用户的相似性,从而保证了本次信息推送的效果。
如图9所示,为本申请实施例提供的一种信息推送对象的选择装置结构框图,该装置可以包括:
社区划分模块91,用于利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区;
可选的,该装置还可以包括:
社区优化模块,用于利用预设社区调整规则,对得到的多个候选社区进行优化处理。
用户重合值计算模块92,用于获得本次推送信息的种子包,计算所述种子包与所述多个候选社区的用户重合值;
选择模块93,用于选择最大用户重合值对应的候选社区为目标社区;
信息推送对象确定模块94,用于利用所述目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象。
可选的,如图10所示,该信息推送对象确定模块94可以包括
第一计算单元9411,用于基于所述多个种子用户在所述目标社区内进行影响力传播运算,确定所述目标社区中各用户的社交分数;
具体的,该第一计算单元9411可以包括:
第一确定单元,用于利用所述目标社区包含的各用户的用户影响力,确定相应用户的初始社交分数;
第一迭代单元,用于对确定的各用户的初始社交分数进行迭代运算,直至达到第一预设条件;
第二确定单元,用于将最后一次迭代得到的各用户的社交分数作为相应用户的社交分数。
第一获得单元9412,用于获得所述目标社区中的用户的兴趣分数,所述兴趣分数是基于用户画像的相似人群扩散Lookalike训练得到的,用于表征用户对本次推送信息感兴趣的概率;
第一筛选单元9413,用于利用所述目标社区中的用户的社交分数和兴趣分数,从所述目标社区中筛选本次推送信息的信息推送对象。
在本申请实施例中,该第一筛选单元9413具体可以包括:
加权求和单元,用于对所述目标社区中各用户的社交分数和兴趣分数进行加权求和,得到相应用户的目标分数;
选择单元,用于选择预设数量的最大目标分数的用户为本次推送信息的信息推送对象。
作为本申请另一实施例,如图11所示,该信息推送对象确定模块94可以包括
第二计算单元9421,用于计算所述目标社区中各用户受多个种子用户的影响力;
第一排序单元9422,用于按照计算得到的影响力对所述目标社区中的用户进行排序;
第二筛选单元9423,用于筛选预设数量的最大影响力对应的用户为本次推送信息的信息推送对象。
可选的,在上述实施例的基础上,如图12所示,该装置还可包括:
数据获取模块95,用于获取信息推送平台在预设时间内产生的用户行为数据;
影响力计算模块96,用于利用所述用户行为数据,计算得到所述信息推送平台中多个用户的用户影响力;
相应地,上述社区划分模块91具体可以用于利用标签传播算法,基于所述用户影响力和/或用户之间的相对影响力,对所述信息推送平台中多个用户进行社区划分,确定多个候选社区。
在实际应用中,如图12所示,该影响力计算模块96可以包括:
第三计算单元961,用于利用所述用户行为数据,计算所述信息推送平台中任意两个用户之间的相对影响力;
第四计算单元962,用于利用计算得到的任意两个用户之间的相对影响力,按照网页排名算法,计算各用户自身的用户影响力。
需要说明的是,关于用户之间的相对影响力,以及用户自身的用户影响力的计算方法,可以参照上述方法实施例相应部分的描述,本实施例在此不再赘述。
另外,在该可选实施例的基础上,该装置还可以包括:
构建模块,用于构建所述信息推送平台的关系网络图,其中,所述信息推送平台的用户为所述关系网络图中的节点,用户之间的相对影响力为对应节点之间的有向边的边权重,所述用户自身的用户影响力为对应节点权重;
相应地,上述社区划分模块91可以包括:
初始化单元,用于确定所述关系网络图中各节点一一对应的标签;
第二迭代单元,用于基于标签传播算法,利用所述关系网络图中的节点权重和/或有向边的权重,对所述各节点一一对应的标签进行迭代更新,直至达到第二预设条件;
社区划分单元,用于获得最后一次迭代更新后的各节点一一对应的标签,并将同一标签对应的用户构建成一个社区,得到多个候选社区。
综上所述,本申请实施例采用离线挖掘方式,在离线状态下实现信息推送平台的社区发现,得到多个候选社区,在得到种子包后,按照其与各候选社区的重合值,选择出目标社区即候选扩散用户群,之后,将基于种子用户在该目标社区中的影响力传播,选择所需的多个信息推送对象,提高了所选信息推送对象与种子用户的相似性,保证了信息推送效果。
具体的,本申请实施例可以利用目标社区用户的社交分数以及兴趣偏好,确定信息推送对象,也可以直接利用用户受种子用户的影响力的大小,确定信息推送对象,都能够保证所选信息推送对象与种子用户的相似性,进而保证本次信息推送效果,提高了信息推送对象的选择灵活性。
上面是从功能模块角度来说明实现信息推送对象的选择方法的虚拟装置的结构,下面将从硬件结构角度来描述实现该方法的设备的组成结构。
参照图1,为本申请实施例提供的一种电子设备硬件结构图,该电子设备可以包括:
通信接口11可以是WIFI模块、GSM模块或GPRS模块等无线通信模块的接口,也可以是有线通信模块的接口,如USB口等,本申请对通信接口的类型及其结构不作限定,
存储器12,用于存储实现上述的信息推送对象的选择方法的程序。
在本申请实施例中,根据需要,该存储器12还可以存储种子包以及得到的信息推送对象等信息。上述社区划分模块、用户重合值计算模块,选择模块、信息推送对象确定模块,数据获取模块、影响力计算模块以及社区优化模块等均可以作为程序模块存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
可选的,存储器可以包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)等。
处理器13包含内核,由内核去存储器中调取相应的程序模块。内核可以设置一个或以上,通过调整内核参数实现信息推送对象的选择。具体的其可以用于加载并执行所述存储器存储的程序,包括:
利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区;
获得本次推送信息的种子包,计算所述种子包与所述多个候选社区的用户重合值,所述种子包包括多个种子用户;
选择最大用户重合值对应的候选社区为目标社区;
利用所述目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象。
可选的,处理器执行程序具体实现以下步骤:
基于所述多个种子用户在所述目标社区内进行影响力传播运算,确定所述目标社区中各用户的社交分数;
获得所述目标社区中的用户的兴趣分数,所述兴趣分数是基于用户画像的相似人群扩散Lookalike训练得到的,用于表征用户对本次推送信息感兴趣的概率;
利用所述目标社区中的用户的社交分数和兴趣分数,从所述目标社区中筛选本次推送信息的信息推送对象。
作为另一实施例,处理器执行程序具体实现以下步骤:
计算所述目标社区中各用户受多个种子用户的影响力;
按照计算得到的影响力对所述目标社区中的用户进行排序;
筛选预设数量的最大影响力对应的用户为本次推送信息的信息推送对象。
可选的,处理器执行程序还可以实现以下步骤:
获取信息推送平台在预设时间内产生的用户行为数据;
利用所述用户行为数据,计算得到所述信息推送平台中多个用户的用户影响力;
利用标签传播算法,基于所述用户影响力和/或用户之间的相对影响力,对所述信息推送平台中多个用户进行社区划分,确定多个候选社区。
需要说明的是,关于处理器执行程序的具体实现过程可以参照上述方法实施例相应部分的描述,本实施例在此不再赘述。
本申请实施例还提供了一种计算机存储介质,存储实现上述信息推送对象的选择方法的程序,该程序适用于处理器进行加载,以执行上述信息推送对象的选择方法,具体执行过程可以参照上述实施例相应部分的描述,本实施例在此不再赘述。
本申请实施例还提供了一种计算机程序产品,当在电子设备执行时,能够实现如上述信息推送对象的选择方法步骤的程序,具体内容可以参照上述方法实施例相应部分的描述,本实施例在此不再赘述。
最后,需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置和电子设备而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (16)
1.一种信息推送对象的选择方法,其特征在于,包括:
利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区;
获得本次推送信息的种子包,计算所述种子包与所述多个候选社区的用户重合值,所述种子包包括多个种子用户以及多个种子用户的标识;
选择最大用户重合值对应的候选社区为目标社区;
利用所述目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象;
所述计算所述种子包与所述多个候选社区的用户重合值包括:
利用多个种子用户的标识,确定针对本次推送信息的种子用户的数量;
将多个种子用户的标识分别与获得的每个候选社区包含的用户标识进行对比,确定落在每个候选社区中的种子用户的数量;
依据落在每个候选社区中的种子用户的数量以及与该候选社区包含的用户数量,计算得到落在候选社区中的种子用户占该社区所有用户的比例;
依据落在每个候选社区中的种子用户的数量以及获得的多个种子用户的总数据量,计算得到落在候选社区中的种子用户占所有种子用户的比例;
利用落在候选社区中的种子用户占该社区所有用户的比例,以及落在候选社区中的种子用户占所有种子用户的比例,计算得到种子包与所述多个候选社区的用户重合值。
2.根据权利要求1所述的方法,其特征在于,所述利用所述目标社区中各用户自身的用户影响力,确定本次推送信息的多个信息推送对象,包括:
基于所述多个种子用户在所述目标社区内进行影响力传播运算,确定所述目标社区中各用户的社交分数;
获得所述目标社区中的用户的兴趣分数,所述兴趣分数是基于用户画像的相似人群扩散Lookalike训练得到的,用于表征用户对本次推送信息感兴趣的概率;
利用所述目标社区中的用户的社交分数和兴趣分数,从所述目标社区中筛选本次推送信息的信息推送对象。
3.根据权利要求1所述的方法,其特征在于,所述利用所述目标社区中的用户之间的相对影响力,确定本次推送信息的多个信息推送对象,包括:
计算所述目标社区中各用户受多个种子用户的影响力;
按照计算得到的影响力对所述目标社区中的用户进行排序;
筛选预设数量的最大影响力对应的用户为本次推送信息的信息推送对象。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取信息推送平台在预设时间内产生的用户行为数据;
利用所述用户行为数据,计算得到所述信息推送平台中多个用户的用户影响力;
所述利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区,包括:
利用标签传播算法,基于所述用户影响力和/或用户之间的相对影响力,对所述信息推送平台中多个用户进行社区划分,确定多个候选社区。
5.根据权利要求4所述的方法,其特征在于,所述利用所述用户行为数据,计算得到所述信息推送平台中多个用户的用户影响力,包括:
利用所述用户行为数据,计算所述信息推送平台中任意两个用户之间的相对影响力;
利用计算得到的任意两个用户之间的相对影响力,按照网页排名算法,计算各用户自身的用户影响力。
6.根据权利要求2所述的方法,其特征在于,所述基于所述多个种子用户在所述目标社区内进行影响力传播运算,确定所述目标社区中各用户的社交分数,包括:
利用所述目标社区包含的各用户的用户影响力,确定相应用户的初始社交分数;
对确定的各用户的初始社交分数进行迭代运算,直至达到第一预设条件;
将最后一次迭代得到的各用户的社交分数作为相应用户的社交分数。
7.根据权利要求2所述的方法,其特征在于,所述利用所述目标社区中各用户的社交分数和兴趣分数,从所述目标社区中筛选本次推送信息的信息推送对象,包括:
对所述目标社区中各用户的社交分数和兴趣分数进行加权求和,得到相应用户的目标分数;
选择预设数量的最大目标分数的用户为本次推送信息的信息推送对象。
8.根据权利要求5所述的方法,其特征在于,所述方法还包括:
构建所述信息推送平台的关系网络图,其中,所述信息推送平台的用户为所述关系网络图中的节点,用户之间的相对影响力为对应节点之间的有向边的边权重,所述用户自身的用户影响力为对应节点权重;
所述利用标签传播算法,基于所述用户影响力和/或用户之间的相对影响力,对所述信息推送平台中多个用户进行社区划分,确定多个候选社区,包括:
确定所述关系网络图中各节点一一对应的标签;
基于标签传播算法,利用所述关系网络图中的节点权重和/或有向边的权重,对所述各节点一一对应的标签进行迭代更新,直至达到第二预设条件;
获得最后一次迭代更新后的各节点一一对应的标签,并将同一标签对应的用户构建成一个社区,得到多个候选社区。
9.根据权利要求1-7任意一项所述的方法,其特征在于,所述方法还包括:
利用预设社区调整规则,对得到的多个候选社区进行优化处理。
10.一种信息推送对象的选择装置,其特征在于,所述装置包括:
社区划分模块,用于利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区;
用户重合值计算模块,用于获得本次推送信息的种子包,计算所述种子包与所述多个候选社区的用户重合值,所述种子包包括多个种子用户以及多个种子用户的标识;
选择模块,用于选择最大用户重合值对应的候选社区为目标社区;
信息推送对象确定模块,用于利用所述目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象;
所述用户重合值计算模块计算所述种子包与所述多个候选社区的用户重合值包括:利用多个种子用户的标识,确定针对本次推送信息的种子用户的数量;
将多个种子用户的标识分别与获得的每个候选社区包含的用户标识进行对比,确定落在每个候选社区中的种子用户的数量;
依据落在每个候选社区中的种子用户的数量以及与该候选社区包含的用户数量,计算得到落在候选社区中的种子用户占该社区所有用户的比例;
依据落在每个候选社区中的种子用户的数量以及获得的多个种子用户的总数据量,计算得到落在候选社区中的种子用户占所有种子用户的比例;
利用落在候选社区中的种子用户占该社区所有用户的比例,以及落在候选社区中的种子用户占所有种子用户的比例,计算得到种子包与所述多个候选社区的用户重合值。
11.根据权利要求10所述的装置,其特征在于,所述信息推送对象确定模块包括:
第一计算单元,用于基于所述多个种子用户在所述目标社区内进行影响力传播运算,确定所述目标社区中各用户的社交分数;
第一获得单元,用于获得所述目标社区中的用户的兴趣分数,所述兴趣分数是基于用户画像的相似人群扩散Lookalike训练得到的,用于表征用户对本次推送信息感兴趣的概率;
第一筛选单元,用于利用所述目标社区中的用户的社交分数和兴趣分数,从所述目标社区中筛选本次推送信息的信息推送对象。
12.根据权利要求10所述的装置,其特征在于,所述信息推送对象确定模块包括:
第二计算单元,用于计算所述目标社区中各用户受多个种子用户的影响力;
第一排序单元,用于按照计算得到的影响力对所述目标社区中的用户进行排序;
第二筛选单元,用于筛选预设数量的最大影响力对应的用户为本次推送信息的信息推送对象。
13.根据权利要求10所述的装置,其特征在于,所述装置还包括:
数据获取模块,用于获取信息推送平台在预设时间内产生的用户行为数据;
影响力计算模块,用于利用所述用户行为数据,计算得到所述信息推送平台中多个用户的用户影响力;
相应地,所述社区划分模块具体用于利用标签传播算法,基于所述用户影响力和/或用户之间的相对影响力,对所述信息推送平台中多个用户进行社区划分,确定多个候选社区。
14.根据权利要求11所述的装置,其特征在于,所述第一计算单元包括:
第一确定单元,用于利用所述目标社区包含的各用户的用户影响力,确定相应用户的初始社交分数;
第一迭代单元,用于对确定的各用户的初始社交分数进行迭代运算,直至达到第一预设条件;
第二确定单元,用于将最后一次迭代得到的各用户的社交分数作为相应用户的社交分数。
15.一种电子设备,其特征在于,所述电子设备包括:
通信接口;
存储器,用于存储实现如权利要求1-9任意一项所述的信息推送对象的选择方法的程序;
处理器,用于加载并执行所述存储器存储的程序,包括:
利用信息推送平台中用户之间的相对影响力和/或用户自身的用户影响力进行社区划分,得到多个候选社区;
获得本次推送信息的种子包,计算所述种子包与所述多个候选社区的用户重合值,所述种子包包括多个种子用户以及多个种子用户的标识;
选择最大用户重合值对应的候选社区为目标社区;
利用所述目标社区中的用户之间的相对影响力或各用户自身的用户影响力,确定本次推送信息的多个信息推送对象;
所述计算所述种子包与所述多个候选社区的用户重合值包括:
利用多个种子用户的标识,确定针对本次推送信息的种子用户的数量;
将多个种子用户的标识分别与获得的每个候选社区包含的用户标识进行对比,确定落在每个候选社区中的种子用户的数量;
依据落在每个候选社区中的种子用户的数量以及与该候选社区包含的用户数量,计算得到落在候选社区中的种子用户占该社区所有用户的比例;
依据落在每个候选社区中的种子用户的数量以及获得的多个种子用户的总数据量,计算得到落在候选社区中的种子用户占所有种子用户的比例;
利用落在候选社区中的种子用户占该社区所有用户的比例,以及落在候选社区中的种子用户占所有种子用户的比例,计算得到种子包与所述多个候选社区的用户重合值。
16.一种计算机可读存储介质,其特征在于,包括:
所述计算机可读存储介质中存储有计算机程序,所述计算机程序用于执行权利要求1-9任一项所述的信息推送对象的选择方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710773844.3A CN109428928B (zh) | 2017-08-31 | 2017-08-31 | 信息推送对象的选择方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710773844.3A CN109428928B (zh) | 2017-08-31 | 2017-08-31 | 信息推送对象的选择方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109428928A CN109428928A (zh) | 2019-03-05 |
CN109428928B true CN109428928B (zh) | 2021-01-05 |
Family
ID=65504610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710773844.3A Active CN109428928B (zh) | 2017-08-31 | 2017-08-31 | 信息推送对象的选择方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109428928B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109507517B (zh) * | 2018-12-07 | 2020-10-27 | 国网辽宁省电力有限公司鞍山供电公司 | 基于双侧功率大数据比对的配电变压器运行状态分析方法 |
CN110008999B (zh) * | 2019-03-07 | 2021-07-27 | 腾讯科技(深圳)有限公司 | 目标帐号的确定方法、装置、存储介质及电子装置 |
CN110135890A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 基于知识关系挖掘的产品数据推送方法及相关设备 |
CN110135975A (zh) * | 2019-04-23 | 2019-08-16 | 上海淇玥信息技术有限公司 | 一种信贷产品的定制信息发送方法、装置、系统和记录介质 |
JP7315185B2 (ja) * | 2019-06-27 | 2023-07-26 | 大学共同利用機関法人情報・システム研究機構 | 影響力評価システム |
JP7040786B2 (ja) * | 2019-06-27 | 2022-03-23 | 大学共同利用機関法人情報・システム研究機構 | 影響力評価システム |
CN110457573B (zh) * | 2019-07-04 | 2024-05-07 | 平安科技(深圳)有限公司 | 产品推荐方法、装置、计算机设备及存储介质 |
CN110659425B (zh) * | 2019-09-25 | 2022-05-17 | 秒针信息技术有限公司 | 一种资源分配方法、装置、电子设备及可读存储介质 |
CN110750721A (zh) * | 2019-10-21 | 2020-02-04 | 秒针信息技术有限公司 | 资讯信息推送方法、装置、电子设备及可读存储介质 |
CN110830306B (zh) * | 2019-11-20 | 2022-03-29 | 北京百分点科技集团股份有限公司 | 确定网络用户影响力的方法、装置、存储介质及电子设备 |
CN113032685B (zh) * | 2019-12-06 | 2023-11-28 | 北京达佳互联信息技术有限公司 | 基于社交关系的对象推送方法、装置、设备及存储介质 |
CN111539757B (zh) * | 2019-12-30 | 2023-07-28 | 支付宝实验室(新加坡)有限公司 | 信息投放方法、装置、服务器及存储介质 |
CN111159576B (zh) * | 2019-12-31 | 2023-08-11 | 亚信科技(中国)有限公司 | 一种用户分类方法、装置及系统 |
CN111339468B (zh) * | 2020-02-28 | 2023-08-04 | 北京嘀嘀无限科技发展有限公司 | 信息推送方法、装置、电子设备和存储介质 |
CN111292171B (zh) * | 2020-02-28 | 2023-06-27 | 中国工商银行股份有限公司 | 金融理财产品推送方法及装置 |
WO2021174495A1 (zh) * | 2020-03-05 | 2021-09-10 | 深圳市欢太科技有限公司 | 信息推送方法、装置、服务器及存储介质 |
CN112148989B (zh) * | 2020-10-16 | 2021-08-24 | 重庆理工大学 | 基于局部节点以及度折扣的社交网络节点影响力推荐系统 |
CN113343090B (zh) * | 2021-06-18 | 2023-07-28 | 北京百度网讯科技有限公司 | 用于推送信息的方法、装置、设备、介质和产品 |
CN113221016A (zh) * | 2021-07-08 | 2021-08-06 | 北京达佳互联信息技术有限公司 | 资源推荐方法、装置、计算机设备及介质 |
CN113761390B (zh) * | 2021-08-19 | 2022-07-22 | 厦门市美亚柏科信息股份有限公司 | 一种用于属性亲密度的分析方法和系统 |
JP2023146143A (ja) * | 2022-03-29 | 2023-10-12 | 楽天グループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105005918A (zh) * | 2015-07-24 | 2015-10-28 | 金鹃传媒科技股份有限公司 | 一种基于用户行为数据和潜在用户影响力分析的在线广告推送方法及其推送评估方法 |
CN105512242A (zh) * | 2015-11-30 | 2016-04-20 | 浙江工业大学 | 一种基于社会网络结构的并行推荐方法 |
CN105913322A (zh) * | 2016-04-07 | 2016-08-31 | 合肥学院 | 一种基于用户社交圈的信息传播评估方法及装置 |
CN106484764A (zh) * | 2016-08-30 | 2017-03-08 | 江苏名通信息科技有限公司 | 基于人群画像技术的用户相似度计算方法 |
CN106503022A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推送推荐信息的方法和装置 |
CN106600342A (zh) * | 2016-12-29 | 2017-04-26 | 北京奇艺世纪科技有限公司 | 一种广告投放的方法和装置 |
CN106651546A (zh) * | 2017-01-03 | 2017-05-10 | 重庆邮电大学 | 一种面向智慧社区的电子商务信息推荐方法 |
CN106875205A (zh) * | 2016-07-11 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种对象选择方法和装置 |
CN107103057A (zh) * | 2017-04-13 | 2017-08-29 | 腾讯科技(深圳)有限公司 | 一种资源推送方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8417698B2 (en) * | 2008-05-06 | 2013-04-09 | Yellowpages.Com Llc | Systems and methods to provide search based on social graphs and affinity groups |
CN104462156B (zh) * | 2013-09-25 | 2018-12-28 | 阿里巴巴集团控股有限公司 | 一种基于用户行为的特征提取、个性化推荐方法和系统 |
-
2017
- 2017-08-31 CN CN201710773844.3A patent/CN109428928B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105005918A (zh) * | 2015-07-24 | 2015-10-28 | 金鹃传媒科技股份有限公司 | 一种基于用户行为数据和潜在用户影响力分析的在线广告推送方法及其推送评估方法 |
CN106503022A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推送推荐信息的方法和装置 |
CN105512242A (zh) * | 2015-11-30 | 2016-04-20 | 浙江工业大学 | 一种基于社会网络结构的并行推荐方法 |
CN105913322A (zh) * | 2016-04-07 | 2016-08-31 | 合肥学院 | 一种基于用户社交圈的信息传播评估方法及装置 |
CN106875205A (zh) * | 2016-07-11 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种对象选择方法和装置 |
CN106484764A (zh) * | 2016-08-30 | 2017-03-08 | 江苏名通信息科技有限公司 | 基于人群画像技术的用户相似度计算方法 |
CN106600342A (zh) * | 2016-12-29 | 2017-04-26 | 北京奇艺世纪科技有限公司 | 一种广告投放的方法和装置 |
CN106651546A (zh) * | 2017-01-03 | 2017-05-10 | 重庆邮电大学 | 一种面向智慧社区的电子商务信息推荐方法 |
CN107103057A (zh) * | 2017-04-13 | 2017-08-29 | 腾讯科技(深圳)有限公司 | 一种资源推送方法及装置 |
Non-Patent Citations (1)
Title |
---|
一种基于用户互动话题的微博推荐算法;鲁骁,李鹏,王斌,李应博,房婧;《中文信息学报》;20160331;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109428928A (zh) | 2019-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109428928B (zh) | 信息推送对象的选择方法、装置及设备 | |
US11574139B2 (en) | Information pushing method, storage medium and server | |
Kim et al. | Improved churn prediction in telecommunication industry by analyzing a large network | |
US10489825B2 (en) | Inferring target clusters based on social connections | |
CN108280670B (zh) | 种子人群扩散方法、装置以及信息投放系统 | |
Nettleton | Data mining of social networks represented as graphs | |
US10509791B2 (en) | Statistical feature engineering of user attributes | |
US9223849B1 (en) | Generating a reputation score based on user interactions | |
Karczmarczyk et al. | Multi-criteria decision support for planning and evaluation of performance of viral marketing campaigns in social networks | |
CN108304526A (zh) | 一种数据处理方法、装置及服务器 | |
US8571924B2 (en) | High performance personalized advertisement serving by exploiting thread assignments in a multiple core computing environment | |
Shi et al. | A social sensing model for event detection and user influence discovering in social media data streams | |
CN112989169B (zh) | 目标对象识别方法、信息推荐方法、装置、设备及介质 | |
Michelot et al. | Inference in MCMC step selection models | |
CN106651427B (zh) | 基于用户行为的数据关联方法 | |
CN111475744A (zh) | 一种基于集成学习的个性化位置推荐方法 | |
CN109190040B (zh) | 基于协同演化的个性化推荐方法及装置 | |
CN107291860B (zh) | 种子用户确定方法 | |
Felfli et al. | Community detection and unveiling of hierarchy in networks: a density-based clustering approach | |
EP3374958A1 (en) | Methods and systems for providing content to a user of a relationship network | |
Plastria et al. | Aggregation without loss of optimality in competitive location models | |
Suaysom et al. | Expert opinion and coherence based topic modeling | |
CN112632275B (zh) | 基于个人文本信息的人群聚类数据处理方法、装置及设备 | |
Chen et al. | Optimizing online social networks for information propagation | |
Vianna et al. | Crowdsourcing platforms: objective, activities and motivation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |