CN105931079A - 一种扩散种子用户的方法及装置 - Google Patents

一种扩散种子用户的方法及装置 Download PDF

Info

Publication number
CN105931079A
CN105931079A CN201610282514.XA CN201610282514A CN105931079A CN 105931079 A CN105931079 A CN 105931079A CN 201610282514 A CN201610282514 A CN 201610282514A CN 105931079 A CN105931079 A CN 105931079A
Authority
CN
China
Prior art keywords
user
diffusion
sample point
full dose
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610282514.XA
Other languages
English (en)
Inventor
汪飞
王必尧
尹玉宗
姚键
潘柏宇
王冀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
1Verge Internet Technology Beijing Co Ltd
Original Assignee
1Verge Internet Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 1Verge Internet Technology Beijing Co Ltd filed Critical 1Verge Internet Technology Beijing Co Ltd
Priority to CN201610282514.XA priority Critical patent/CN105931079A/zh
Publication of CN105931079A publication Critical patent/CN105931079A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种扩散种子用户的方法及装置,其中所述方法包括:根据网络平台中全量用户的属性信息和正样本点的属性信息构造出负样本点;根据所述正样本点和所述负样本点来训练扩散模型;以及根据所述全量用户的属性信息,按照所述扩散模型,从所述全量用户中提取扩散用户。根据本发明实施例的扩散种子用户的方法及装置能够提高种子用户的扩散精度,使得扩散用户与种子用户人群特征类似。

Description

一种扩散种子用户的方法及装置
技术领域
本发明涉及互联网大数据处理领域,尤其涉及一种扩散种子用户的方法及装置。
背景技术
网络平台在推出新产品时,往往需要精准定位有效用户,从而带来推广成本降低和效率提升。一般会利用小流量产生少量种子人群,通过分析种子人群的静态和行为特征,从而指导更大规模的投放。种子用户的选取对于新产品的运营和投放至关重要,而种子用户覆盖的特征越全面,则越有利于新产品的推广。
然而,在新产品推出初期,获取种子人群的窗口时间是有限的,收集到的种子人群也是有限的,所以,往往在获取了一定数目的种子用户之后,对种子用户进行扩散,以得到更多的种子用户。
目前对种子用户进行扩散的常用方法是:首先提取种子用户的主要特征、例如用户年龄、性别、职业、教育水平和兴趣爱好等,然后根据所提取的种子用户的主要特征,利用特征距离相似性来获取与种子用户相像的用户,将这些用户作为扩散用户。
这种利用特征相似性进行种子用户扩散的方法在提取种子用户的哪些特征、选取多少数量的特征等方面,没有较为系统的策略,全站用户趋同性的行为对于相似性计算干扰非常大,所以实施起来通常需要人工干预,有可能导致获取到的扩散用户并不能起到类似于种子用户的作用,另外,这种方法也不利于对种子用户扩散的规模进行控制。
发明内容
技术问题
有鉴于此,本发明要解决的技术问题是,如何提高种子用户的扩散精度。
解决方案
为了解决上述技术问题,根据本发明的一个方面,提供了一种扩散种子用户的方法,包括:根据网络平台中全量用户的属性信息和正样本点的属性信息构造出负样本点;根据所述正样本点和所述负样本点来训练扩散模型;以及根据所述全量用户的属性信息,按照所述扩散模型,从所述全量用户中提取扩散用户。
对于上述方法,在一种可能的实现方式中,所述正样本点为预定时间段内参与所述网络平台推出的产品的种子用户。
对于上述方法,在一种可能的实现方式中,所述网络平台推出的产品包括:广告、多媒体资源、话题和应用软件中的至少一个;以及参与所述网络平台推出的产品包括:向好友分享、转发、评论以及向所述网络平台反馈所述产品中的至少一个。
对于上述方法,在一种可能的实现方式中,所述负样本点为不会参与所述网络平台推出的产品的用户,构造出所述负样本点包括:从所述全量用户中排除属性信息与所述正样本点的属性信息相同或相近的用户,以得到所述负样本点。
对于上述方法,在一种可能的实现方式中,所述扩散模型为如下函数:f(xi)=p(yi=1|xi,θ);其中,xi是对所述全量用户中的第i个用户的属性信息进行量化后的数值,f(xi)用于表示所述第i个用户为所述扩散用户的概率,θ是所述属性信息的权重,yi=1表示所述第i个用户为所述扩散用户;从所述全量用户中提取扩散用户包括:将所述全量用户的属性信息输入所述扩散模型,将输出大于设定阈值的用户确定为所述扩散用户。
对于上述方法,在一种可能的实现方式中,所述属性信息包括:静态属性和动态属性;根据所述全量用户在所述网络平台上注册的信息数据,来提取所述全量用户的静态属性,所述静态属性包括:年龄、性别、职业、教育水平和兴趣爱好中的至少一个;以及根据所述全量用户在所述网络平台上进行的行为数据,来提取所述全量用户的动态属性,所述动态属性包括:兴趣爱好、最常关注和活跃度中的至少一个。
为了解决上述技术问题,根据本发明的又一个方面,提供了一种扩散种子用户的装置,包括:样本构建模块,用于根据网络平台中全量用户的属性信息和正样本点的属性信息构造出负样本点;模型构建模块,与所述样本构建模块连接,用于根据所述正样本点和所述负样本点来训练扩散模型;以及扩散模块,与所述模型构建模块连接,用于根据所述全量用户的属性信息,按照所述扩散模型,从所述全量用户中提取扩散用户。
对于上述装置,在一种可能的实现方式中,所述正样本点为预定时间段内参与所述网络平台推出的产品的种子用户。
对于上述装置,在一种可能的实现方式中,所述网络平台推出的产品包括:广告、多媒体资源、话题和应用软件中的至少一个;以及参与所述网络平台推出的产品包括:向好友分享、转发、评论以及向所述网络平台反馈所述产品中的至少一个。
对于上述装置,在一种可能的实现方式中,所述负样本点为不会参与所述网络平台推出的产品的用户,所述样本构建模块具体用于:从所述全量用户中排除属性信息与所述正样本点的属性信息相同或相近的用户,以得到所述负样本点。
对于上述装置,在一种可能的实现方式中,所述扩散模型为如下函数:f(xi)=p(yi=1|xi,θ);其中,xi是对所述全量用户中的第i个用户的属性信息进行量化后的数值,f(xi)用于表示所述第i个用户为所述扩散用户的概率,θ是所述属性信息的权重,yi=1表示所述第i个用户为所述扩散用户;所述扩散模块具体用于:将所述全量用户的属性信息输入所述扩散模型,将输出大于设定阈值的用户确定为所述扩散用户。
有益效果
通过根据网络平台中全量用户的属性信息和正样本点的属性信息,构造出负样本点,然后根据所述正样本点和所述负样本点来训练扩散模型,从而根据所述全量用户的属性信息,按照所述扩散模型,能够从所述全量用户中提取扩散用户。根据本发明实施例的扩散种子用户的方法及装置能够提高种子用户的扩散精度,使得扩散用户与种子用户人群特征特征类似。
根据下面参考附图对示例性实施例的详细说明,本发明的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面,并且用于解释本发明的原理。
图1示出根据本发明一实施例的扩散种子用户的方法的流程图;
图2示出根据本发明另一实施例的扩散种子用户的方法的流程图;
图3示出根据本发明又一实施例的扩散种子用户的方法的流程图;
图4示出根据本发明一实施例的扩散种子用户的装置的结构示意图。
具体实施方式
以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本发明的主旨。
实施例1
图1示出根据本发明一实施例的扩散种子用户的方法的流程图。如图1所示,该方法主要包括:
步骤S100、根据网络平台中全量用户的属性信息和正样本点的属性信息,构造出负样本点;其中,网络平台可以是互联网网站或者应用软件,全量用户可以包括在该网络平台上注册的所有用户和访问过该网络平台的所有用户。
企业或者个人在推出新产品时,往往借助网络平台发布,通过种子用户试用并向网络平台反馈关于新产品的意见或建议,使得企业或个人对该新产品进行改进,以使得新产品能够尽可能快地被推广和使用。由此可见,种子用户对于新产品的运营和投放至关重要。
在一种可能的实现方式中,所述正样本点为预定时间段内参与所述网络平台推出的产品的种子用户。所述网络平台推出的产品包括:广告、多媒体资源、话题和应用软件中的至少一个。参与所述网络平台推出的产品包括:向好友分享、转发、评论以及向所述网络平台反馈所述产品中的至少一个。可以通过以下方法来选择种子用户,例如,网络平台新发布了一则广告,统计一天内对该广告进行了评论或者转发的用户,将这些用户作为种子用户。一般情况下,若某用户仅浏览了该广告,而并未进行其它行为,则该用户并不是种子用户。当然,预定时间段不限于上述的一天,可以根据获取的种子用户的数量灵活增加或减小预定时间段。
步骤S200、根据所述正样本点和所述负样本点来训练扩散模型;所述负样本点为不会参与所述网络平台推出的产品的用户。这样,通过参与了网络平台推出的产品的用户和不会参与网络平台推出的产品的用户来确定扩散模型,能够使得确定出的扩散模型更精确。
步骤S300、根据所述全量用户的属性信息,按照所述扩散模型,从所述全量用户中提取扩散用户。其中,扩散用户为有可能会参与网络平台推出的产品的用户,扩散用户参与网络平台推出的产品的可能性越大,则种子用户的扩散精度越高,种子用户的扩散也越成功。
在一种可能的实现方式中,所述扩散模型为如下函数:f(xi)=p(yi=1|xi,θ);其中,xi是对所述全量用户中的第i个用户的属性信息进行量化后的数值,f(xi)用于表示所述第i个用户为所述扩散用户的概率,θ是所述属性信息的权重,yi=1表示所述第i个用户为所述扩散用户。p(yi=1|xi,θ)所表示的是如下含义,即在对所述全量用户中的第i个用户的属性信息进行量化后的数值为xi、并且所述第i个用户的各个属性信息的权重为θ的情况下,该第i个用户为扩散用户的概率。其中,若第i个用户的属性信息有N个,则xi和θ分别都具有N个分量。步骤S300具体可以为:将所述全量用户的属性信息输入所述扩散模型,将输出大于设定阈值的用户确定为所述扩散用户。该设定阈值越高,则提取出的扩散用户参与网络平台推出的产品的可能性越大,但是所能够提取出的扩散用户的数量可能越小,因此可以根据实际需要灵活设置阈值,从而能够实现对扩散用户规模的控制。
在一种可能的实现方式中,所述属性信息可以包括静态属性和动态属性。所述静态属性包括:年龄、性别、职业、教育水平和兴趣爱好中的至少一个,可以根据全量用户在网络平台上注册的信息数据,来提取全量用户的静态属性;动态属性包括:兴趣爱好、最常关注和活跃度中的至少一个,可以根据全量用户在网络平台上进行的行为数据,来提取全量用户的动态属性。其中,全量用户在网络平台上进行的行为数据可以包括其访问和订阅的网络平台所提供的内容、以及其在网络平台上发布的内容等,可以据此获取全量用户的兴趣爱好和最常关注等属性,另外,全量用户在网络平台上进行的行为数据还可以包括其登录网络平台的频率、以及其参与网络平台提供的内容的频率等,可以据此获取全量用户的活跃度。
需要说明的是,由于兴趣爱好有可能会随着时间而改变,用户在网络平台上注册的兴趣爱好与根据其在网络平台上进行的行为数据所提取出的兴趣爱好有可能不同,例如用户在注册时填写的兴趣爱好是体育,但是其经常浏览与电子产品有关的内容而认为其兴趣爱好可能是电子产品,因此可以将兴趣爱好既作为静态属性又作为动态属性同时提取。
另外,上述的扩散模型中的变量xi可以是一个N行1列的向量,每行包括属性信息的一个特征,例如年龄、兴趣爱好、最常关注等。权重θ也可以是一个N行1列的向量,各行分别对应属性信息的各个特征的权重。将正样本点的输出f(xi)设置为最大值,将负样本点的输出f(xi)设置为最小值,通过正样本点和负样本点的属性信息对扩散模型进行训练,最终得到较为精确的权重θ。
以分类器logistic Regression为例,可以通过如下步骤来构造扩散模型:步骤(1)、首先构造损失函数:其中,n表示全量用户的数目,f(xi)是前面所述的用于表示第i个用户为所述扩散用户的概率;步骤(2)、采用梯度下降的方式进行优化,常见的方法有gradient descent/L-BFGS等,通过优化可以得出θ参数,从而最终得到扩散模型:如在上述步骤S300中所述地,可以通过调节设定阈值来对扩散用户的规模进行控制,将设定阈值调节得越大,则扩散的标准越严格,反之则表示扩散的标准越松散。
需要说明的是,上述的扩散模型仅为示例,还可以采用其它常用的训练方法来构造扩散模型,所得到的扩散模型f(x)将根据训练用的分类器的不同而不同。
这样,通过根据正样本点和负样本点来生成扩散模型,并利用全量用户的属性信息,根据该扩散模型从全量用户中提取出扩散用户,根据本发明上述实施例的扩散种子用户的方法能够提高种子用户的扩散精度,使得扩散用户与种子用户人群特征类似。
实施例2
图2示出根据本发明另一实施例的扩散种子用户的方法的流程图。图2中标号与图1相同的组件具有相同的功能,为简明起见,省略对这些组件的详细说明。
由于很难直接定位到不符合预期的用户群、也即不会参与网络平台推出的产品的用户,所以不容易直接找出负样本点。本实施例利用一种组合方法从全量用户中挑选出不符合种子用户特征的用户群,并将其标记为负样本点。具体地,如图2所示,图1所示的构造出负样本点的步骤S100可以包括:
步骤S110、从全量用户中排除属性信息与所述正样本点的属性信息相同或相近的用户,以得到候选用户;其中,与所述正样本点的属性信息相同或相近的用户可以是如下用户:与表示正样本点的种子用户在内容上喜好相同的用户、与种子用户在订阅行为上相似的用户、以及与种子用户主要特征相似的用户。
具体地,如图3所示,可以通过以下步骤挑选出要从全量用户中过滤的用户:
3.1、通过用户访问的内容的数据,找到与种子用户在内容上喜好相同的用户,并标记为内容过滤用户;
3.2、通过用户的订阅数据,找到与种子用户在订阅行为上相似的用户,并标记为订阅过滤用户;
3.3、通过计算特征信息熵的方法,选取种子用户信息熵突出的特征,通过这些特征挑选出与种子用户主要特征相似的用户,将其标记为特征过滤用户。具体地,首先对全量用户进行聚合投影,可以得出标签i的人数在全量用户中所占的比例为接下来对种子用户进行投影,可以得出种子用户中标签i的人数以及比例那么可以将标签i的特征熵(类似FOIL信息熵增益)定义为:通过这个值的大小来确定主要特征。一般选取该值较大的一些特征作为主要特征,主要特征可以包括在前述的用户属性信息中。
然后,从全量用户中排除已经标记的内容过滤用户、订阅过滤用户、特征过滤用户以及种子用户,从剩下的用户中采用随机策略生成负样本点。即步骤S120、从所述候选用户(即上述的剩下的用户)中,抽取出预定数量的用户作为所述负样本点。由于候选用户的数量较多,而往往不需要那么多的负样本点,因此,从候选用户中抽取根据实际需要数量的负样本点。
当然,根据实际应用场景,也可以从所述全量用户中排除属性信息与所述正样本点的属性信息相同或相近的用户,将剩下的用户均作为负样本点。
在一种可能的实现方式中,可以根据已经产生的正样本点和负样本点,采用线性分类器进行训练,生成最终的扩散模型,从而将用于扩散种子用户的扩散模型转化为较为简单的分类模型,同时利用本实例所述的组合方法生成用于确定分类模型的负样本点,从而能够在扩散过程中不需要关注特征选取,能够有效利用全部特征的信息。另外,利用扩散模型对全量用户进行分类,可以通过调节模型的阈值大小来灵活控制扩散用户的数量。
根据本发明上述实施例的扩散种子用户的方法能够提高种子用户的扩散精度,使得扩散用户与种子用户人群特征类似,并能够实现对扩散用户规模的控制。从而通过种子用户和扩散用户的传播和反馈,提高了网络平台投放产品的精度,带来产品运行和投放效率的提升。
实施例3
图4示出根据本发明一实施例的扩散种子用户的装置400的结构示意图。如图4所示,该装置主要包括:样本构建模块410、模型构建模块420和扩散模块430。其中,样本构建模块410用于根据网络平台中全量用户的属性信息和正样本点的属性信息构造出负样本点;模型构建模块420与样本构建模块410连接,用于根据所述正样本点和所述负样本点来训练扩散模型;扩散模块430与模型构建模块420连接,用于根据所述全量用户的属性信息,按照所述扩散模型,从所述全量用户中提取扩散用户。
在一种可能的实现方式中,所述正样本点为预定时间段内参与所述网络平台推出的产品的种子用户。所述网络平台推出的产品包括:广告、多媒体资源、话题和应用软件中的至少一个;参与所述网络平台推出的产品包括:向好友分享、转发、评论以及向所述网络平台反馈所述产品中的至少一个。
在一种可能的实现方式中,所述负样本点为不会参与所述网络平台推出的产品的用户,样本构建模块410具体用于:从所述全量用户中排除属性信息与所述正样本点的属性信息相同或相近的用户,以得到所述负样本点。
在一种可能的实现方式中,所述扩散模型为如下函数:f(xi)=p(yi=1|xi,θ);其中,xi是对所述全量用户中的第i个用户的属性信息进行量化后的数值,f(xi)用于表示所述第i个用户为所述扩散用户的概率,θ是所述属性信息的权重,yi=1表示所述第i个用户为所述扩散用户;扩散模块430具体用于:将所述全量用户的属性信息输入所述扩散模型,将输出大于设定阈值的用户确定为所述扩散用户。
根据本实施例的样本构建模块410、模型构建模块420和扩散模块430的具体实现机理可以参考实施例1和2中对步骤S110至步骤S130的描述,并且根据本实施例的扩散种子用户的装置400能够实现与实施例1和2所述方法相同的有益效果。即够提高种子用户的扩散精度,使得扩散用户与种子用户人群特征类似,并能够实现对扩散用户规模的控制。从而通过种子用户和扩散用户的传播和反馈,提高了网络平台投放产品的精度,带来产品运行和投放效率的提升。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种扩散种子用户的方法,其特征在于,包括:
根据网络平台中全量用户的属性信息和正样本点的属性信息构造出负样本点;
根据所述正样本点和所述负样本点来训练扩散模型;以及
根据所述全量用户的属性信息,按照所述扩散模型,从所述全量用户中提取扩散用户。
2.根据权利要求1所述的方法,其特征在于,所述正样本点为预定时间段内参与所述网络平台推出的产品的种子用户。
3.根据权利要求2所述的方法,其特征在于,
所述网络平台推出的产品包括:广告、多媒体资源、话题和应用软件中的至少一个;以及
参与所述网络平台推出的产品包括:向好友分享、转发、评论以及向所述网络平台反馈所述产品中的至少一个。
4.根据权利要求1所述的方法,其特征在于,所述负样本点为不会参与所述网络平台推出的产品的用户,构造出所述负样本点包括:
从所述全量用户中排除属性信息与所述正样本点的属性信息相同或相近的用户,以得到所述负样本点。
5.根据权利要求1所述的方法,其特征在于,所述扩散模型为如下函数:f(xi)=p(yi=1|xi,θ);其中,xi是对所述全量用户中的第i个用户的属性信息进行量化后的数值,f(xi)用于表示所述第i个用户为所述扩散用户的概率,θ是所述属性信息的权重,yi=1表示所述第i个用户为所述扩散用户;从所述全量用户中提取扩散用户包括:将所述全量用户的属性信息输入所述扩散模型,将输出大于设定阈值的用户确定为所述扩散用户。
6.根据权利要求1所述的方法,其特征在于,所述属性信息包括:静态属性和动态属性;根据所述全量用户在所述网络平台上注册的信息数据,来提取所述全量用户的静态属性,所述静态属性包括:年龄、性别、职业、教育水平和兴趣爱好中的至少一个;以及
根据所述全量用户在所述网络平台上进行的行为数据,来提取所述全量用户的动态属性,所述动态属性包括:兴趣爱好、最常关注和活跃度中的至少一个。
7.一种扩散种子用户的装置,其特征在于,包括:
样本构建模块,用于根据网络平台中全量用户的属性信息和正样本点的属性信息构造出负样本点;
模型构建模块,与所述样本构建模块连接,用于根据所述正样本点和所述负样本点来训练扩散模型;以及
扩散模块,与所述模型构建模块连接,用于根据所述全量用户的属性信息,按照所述扩散模型,从所述全量用户中提取扩散用户。
8.根据权利要求7所述的装置,其特征在于,所述正样本点为预定时间段内参与所述网络平台推出的产品的种子用户。
9.根据权利要求8所述的装置,其特征在于,
所述网络平台推出的产品包括:广告、多媒体资源、话题和应用软件中的至少一个;以及
参与所述网络平台推出的产品包括:向好友分享、转发、评论以及向所述网络平台反馈所述产品中的至少一个。
10.根据权利要求7所述的装置,其特征在于,所述负样本点为不会参与所述网络平台推出的产品的用户,所述样本构建模块具体用于:
从所述全量用户中排除属性信息与所述正样本点的属性信息相同或相近的用户,以得到所述负样本点。
11.根据权利要求7所述的装置,其特征在于,所述扩散模型为如下函数:f(xi)=p(yi=1|xi,θ);其中,xi是对所述全量用户中的第i个用户的属性信息进行量化后的数值,f(xi)用于表示所述第i个用户为所述扩散用户的概率,θ是所述属性信息的权重,yi=1表示所述第i个用户为所述扩散用户;所述扩散模块具体用于:将所述全量用户的属性信息输入所述扩散模型,将输出大于设定阈值的用户确定为所述扩散用户。
CN201610282514.XA 2016-04-29 2016-04-29 一种扩散种子用户的方法及装置 Pending CN105931079A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610282514.XA CN105931079A (zh) 2016-04-29 2016-04-29 一种扩散种子用户的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610282514.XA CN105931079A (zh) 2016-04-29 2016-04-29 一种扩散种子用户的方法及装置

Publications (1)

Publication Number Publication Date
CN105931079A true CN105931079A (zh) 2016-09-07

Family

ID=56837905

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610282514.XA Pending CN105931079A (zh) 2016-04-29 2016-04-29 一种扩散种子用户的方法及装置

Country Status (1)

Country Link
CN (1) CN105931079A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038739A (zh) * 2017-12-27 2018-05-15 北京奇虎科技有限公司 一种根据统计数据关联度确定扩展用户的方法和系统
WO2018126953A1 (zh) * 2017-01-06 2018-07-12 腾讯科技(深圳)有限公司 种子人群扩散方法、装置、信息投放系统以及存储介质
CN108647983A (zh) * 2018-03-16 2018-10-12 北京奇艺世纪科技有限公司 种子用户确定方法、装置及广告投放方法、装置
CN109034853A (zh) * 2017-06-09 2018-12-18 北京京东尚科信息技术有限公司 基于种子用户寻找相似用户方法、装置、介质和电子设备
CN110147882A (zh) * 2018-09-03 2019-08-20 腾讯科技(深圳)有限公司 神经网络模型的训练方法、人群扩散方法、装置及设备
CN110457387A (zh) * 2019-08-19 2019-11-15 腾讯科技(深圳)有限公司 一种应用于网络中用户标签确定的方法及相关装置
CN111144936A (zh) * 2019-12-19 2020-05-12 有米科技股份有限公司 基于用户标签的相似人群扩展方法及装置
CN113536848A (zh) * 2020-04-17 2021-10-22 中国移动通信集团广东有限公司 一种数据处理方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030149612A1 (en) * 2001-10-31 2003-08-07 International Business Machines Corporation Enabling a recommendation system to provide user-to-user recommendations
CN104919480A (zh) * 2012-10-08 2015-09-16 诺基亚技术有限公司 用于基于扩散仿真的社交网络服务策略的方法和设备
CN105427129A (zh) * 2015-11-12 2016-03-23 腾讯科技(深圳)有限公司 一种信息的投放方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030149612A1 (en) * 2001-10-31 2003-08-07 International Business Machines Corporation Enabling a recommendation system to provide user-to-user recommendations
CN104919480A (zh) * 2012-10-08 2015-09-16 诺基亚技术有限公司 用于基于扩散仿真的社交网络服务策略的方法和设备
CN105427129A (zh) * 2015-11-12 2016-03-23 腾讯科技(深圳)有限公司 一种信息的投放方法及系统

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018126953A1 (zh) * 2017-01-06 2018-07-12 腾讯科技(深圳)有限公司 种子人群扩散方法、装置、信息投放系统以及存储介质
CN108280670A (zh) * 2017-01-06 2018-07-13 腾讯科技(深圳)有限公司 种子人群扩散方法、装置以及信息投放系统
CN108280670B (zh) * 2017-01-06 2022-06-21 腾讯科技(深圳)有限公司 种子人群扩散方法、装置以及信息投放系统
US11301884B2 (en) 2017-01-06 2022-04-12 Tencent Technology (Shenzhen) Company Limited Seed population diffusion method, device, information delivery system and storage medium
CN109034853B (zh) * 2017-06-09 2021-11-26 北京京东尚科信息技术有限公司 基于种子用户寻找相似用户方法、装置、介质和电子设备
CN109034853A (zh) * 2017-06-09 2018-12-18 北京京东尚科信息技术有限公司 基于种子用户寻找相似用户方法、装置、介质和电子设备
CN108038739A (zh) * 2017-12-27 2018-05-15 北京奇虎科技有限公司 一种根据统计数据关联度确定扩展用户的方法和系统
CN108647983A (zh) * 2018-03-16 2018-10-12 北京奇艺世纪科技有限公司 种子用户确定方法、装置及广告投放方法、装置
CN110147882B (zh) * 2018-09-03 2023-02-10 腾讯科技(深圳)有限公司 神经网络模型的训练方法、人群扩散方法、装置及设备
CN110147882A (zh) * 2018-09-03 2019-08-20 腾讯科技(深圳)有限公司 神经网络模型的训练方法、人群扩散方法、装置及设备
CN110457387A (zh) * 2019-08-19 2019-11-15 腾讯科技(深圳)有限公司 一种应用于网络中用户标签确定的方法及相关装置
CN110457387B (zh) * 2019-08-19 2023-11-10 腾讯科技(深圳)有限公司 一种应用于网络中用户标签确定的方法及相关装置
CN111144936A (zh) * 2019-12-19 2020-05-12 有米科技股份有限公司 基于用户标签的相似人群扩展方法及装置
CN111144936B (zh) * 2019-12-19 2024-01-05 有米科技股份有限公司 基于用户标签的相似人群扩展方法及装置
CN113536848A (zh) * 2020-04-17 2021-10-22 中国移动通信集团广东有限公司 一种数据处理方法、装置及电子设备
CN113536848B (zh) * 2020-04-17 2024-03-19 中国移动通信集团广东有限公司 一种数据处理方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN105931079A (zh) 一种扩散种子用户的方法及装置
Baym Creator culture: An introduction to global social media entertainment
Bessi et al. Science vs conspiracy: Collective narratives in the age of misinformation
Eisenstein et al. Diffusion of lexical change in social media
US9311683B1 (en) Measuring engagement with a social networking platform
US20180240036A1 (en) Automatic segmentation of a collection of user profiles
Darmon et al. Followers are not enough: A multifaceted approach to community detection in online social networks
CN112153426B (zh) 一种内容账号管理方法、装置、计算机设备及存储介质
CN111858960A (zh) 面向本质计算的跨dikw图谱的虚拟社区资源处理方法及组件
Chang et al. # justiceforgeorgefloyd: how instagram facilitated the 2020 black lives matter protests
CN103020116A (zh) 在社交媒体网络上自动筛选有影响力用户的方法
KR101987915B1 (ko) 자연어 질의로부터 지식 베이스에 대한 쿼리의 생성에 사용되는 템플릿을 생성하는 시스템 및 이를 포함하는 질의 응답 시스템
CN109949174B (zh) 一种异构社交网络用户实体锚链接识别方法
Mastykash et al. Internet social environmental platforms data representation
CN107480137A (zh) 用语义迭代提取网络突发事件并识别外延事件关系的方法
Lu et al. The evolution of polarization in the legislative branch of government
Yoshida Investigation of university students’ behaviour in a Heterarchical twitter community
CN114491149A (zh) 信息处理方法及装置、电子设备、存储介质、程序产品
Moore et al. Big data, actually: Examining systematic messaging in 188 romantic comedies using unsupervised machine learning.
CN117236624A (zh) 一种基于动态图的Issue修复者推荐方法与装置
Zhang et al. Characterizing and modeling the dynamics of activity and popularity
Huang Network fields, cultural identities and labor rights communities: Big data analytics with topic model and community detection
Hutchins et al. New media, new media relations: Building relationships with bloggers, citizen journalists and engaged publics
Bruns Gatewatching and news curation
Huynh et al. A dynamical model of twitter activity profiles

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160907