CN104699679A - 一种确定社交网络平台中用户属性的方法和系统 - Google Patents
一种确定社交网络平台中用户属性的方法和系统 Download PDFInfo
- Publication number
- CN104699679A CN104699679A CN201310645959.6A CN201310645959A CN104699679A CN 104699679 A CN104699679 A CN 104699679A CN 201310645959 A CN201310645959 A CN 201310645959A CN 104699679 A CN104699679 A CN 104699679A
- Authority
- CN
- China
- Prior art keywords
- attribute
- user
- social network
- platform function
- platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种确定社交网络平台中用户属性的方法和系统,其中包括:确定社交网络平台中种子用户的属性;根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;根据社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。本发明能够准确确定社交网络平台中的用户属性。
Description
技术领域
本发明涉及社交网络技术领域,尤其涉及一种确定社交网络平台中用户属性的方法和系统。
背景技术
社交网络平台中的用户属性包括静态属性和动态属性。静态属性包括用户的性别、年龄、教育信息、工作信息等,一般是静态不变的;动态属性包括用户的兴趣爱好、经常关注等,一般是动态变化的。
对于动态属性,一般是通过对用户发表或转播的消息进行切词分析,从而粗略判断出用户的兴趣爱好,得到该用户的动态属性。
例如,“广州恒大”这个关键词属于“体育足球”兴趣大类;当用户发表或者转播的消息中包含多个从属于“体育足球”的关键词时,该用户的动态属性就可以增加“体育足球”。
现有确定动态属性的方法基于消息的切词分析,这种分析得到的关键词不一定总能反映用户的兴趣,因此确定的动态属性不准确。
发明内容
本发明提供了一种确定社交网络平台中用户属性的方法,能够准确确定社交网络平台中的用户属性。
本发明提供了一种确定社交网络平台中用户属性的系统,能够准确确定社交网络平台中的用户属性。
本发明的技术方案是这样实现的:
一种确定社交网络平台中用户属性的方法,包括:
确定社交网络平台中种子用户的属性;
根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;
根据社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。
上述方法中,社交网络平台功能可以为:网页短URL、话题、消息、活动、投票或应用;
用户参与互动网页短URL的方式可以为:用户访问网页短URL或者发表或转播的消息中包含网页短URL。
确定社交网络平台中种子用户属性的方式可以为:
确定社交网络平台中的种子用户;
获取所述种子用户填写的用户标签;
根据所述用户标签以及预先存储的用户标签与属性的对应关系,确定该种子用户的属性;
对所述种子用户的属性进行审核及修正。
上述方法中,根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性的方式可以为:
获取预先设定的时间段内用户参与互动的社交网络平台功能;
针对每个获取的社交网络平台功能分别执行以下步骤:
A、查询与该社交网络平台功能存在互动关系的用户的属性;
B、将所述查询结果中出现次数最多的N个属性作为该社交网络平台功能的属性的中间结果,并且将每个属性的出现次数与N个属性出现总次数的比值作为该属性的权值;其中,N为预先设定的整数;
C、将所述中间结果作为社交网络平台功能的属性的最终结果;或者,将之前计算的所述社交网络平台功能的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为社交网络平台功能的属性的最终结果。
根据社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性的方式可以为:
获取预先设定的时间段内参与互动社交网络平台功能的用户;
针对每个获取的用户分别执行以下步骤:
A、查询该用户及其收听用户互动的社交网络平台功能,获取每个社交网络平台功能的互动次数及属性;
B、根据所述获取的结果计算所述用户属性的中间结果;
C、将所述中间结果作为用户属性的最终结果;或者,将之前计算的所述用户的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为用户属性的最终结果;其中,N为预先设定的整数。
上述过程中,步骤B的具体方式可以为:
将每个社交网络平台功能的属性权值乘以互动次数,并将相应属性的乘积分别相加,将结果作为该属性的比率值;
针对各个属性,将该属性的比率值除以所有属性比率值的和,得到该属性的权值;
取权值最大的N个属性作为该用户属性的中间结果。
当社交网络平台功能为网页短URL时,上述过程中,步骤A中所述的社交网络平台功能可以为:转播次数与原创次数的比值大于预先设定的阈值的网页短URL。
一种确定社交网络平台中用户属性的系统,包括:
种子培育子系统,用于确定社交网络平台中种子用户的属性,将所述种子用户的属性发送至自学习子系统;
自学习子系统,用于根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;还用于根据所述社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。
上述系统中,社交网络平台功能可以为:网页短URL、话题、消息、活动、投票或应用;
用户参与互动网页短URL的方式可以为:用户访问网页短URL或者发表或转播的消息中包含网页短URL。
上述系统中,种子培育子系统确定社交网络平台中种子用户属性的方式可以为:
确定社交网络平台中的种子用户;
获取所述种子用户填写的用户标签;
根据所述用户标签以及预先存储的用户标签与属性的对应关系,确定该种子用户的属性;
对所述种子用户的属性进行审核及修正。
上述系统中,自学习子系统可以包括:
用户属性数据库,用于接收并保存种子培育子系统发送的种子用户的属性,还用于接收并保存用户属性计算模块发送的用户属性;
网页短URL属性计算模块,用于根据所述用户属性数据库中保存的用户属性,确定用户参与互动的社交网络平台功能的属性,将社交网络平台功能的属性发送至网页短URL属性数据库;
网页短URL属性数据库,用于接收并保存网页短URL属性计算模块发送的社交网络平台功能的属性;
用户属性计算模块,用于根据所述网页短URL属性数据库保存的社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性,并将用户属性发送至用户属性数据库。
所述网页短URL属性计算模块确定用户参与互动的社交网络平台功能的属性的方式可以为:
获取预先设定的时间段内用户参与互动的社交网络平台功能;
针对每个获取的社交网络平台功能分别执行以下步骤:
A1、查询与该社交网络平台功能存在互动关系的用户的属性;
B1、将所述查询结果中出现次数最多的N个属性作为该社交网络平台功能的属性的中间结果,并且将每个属性的出现次数与N个属性出现总次数的比值作为该属性的权值;其中,N为预先设定的整数;
C1、将所述中间结果作为社交网络平台功能的属性的最终结果;或者,将之前计算的所述社交网络平台功能的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为社交网络平台功能的属性的最终结果。
所述用户属性计算模块确定参与互动社交网络平台功能的用户的属性的方式可以为:
获取预先设定的时间段内参与互动社交网络平台功能的用户;
针对每个获取的用户分别执行以下步骤:
A2、查询该用户及其收听用户互动的社交网络平台功能,获取每个社交网络平台功能的互动次数及属性;
B2、根据所述获取的结果计算所述用户属性的中间结果;
C2、将所述中间结果作为用户属性的最终结果;或者,将之前计算的所述用户的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为用户属性的最终结果;其中,N为预先设定的整数。
上述系统中,步骤B2的具体方式可以为:
将每个社交网络平台功能的属性权值乘以互动次数,并将相应属性的乘积分别相加,将结果作为该属性的比率值;
针对各个属性,将该属性的比率值除以所有属性比率值的和,得到该属性的权值;
取权值最大的N个属性作为该用户属性的中间结果。
当所述社交网络平台功能为网页短URL时,步骤A2中所述的社交网络平台功能可以为:转播次数与原创次数的比值大于预先设定的阈值的网页短URL。
可见,本发明提出的确定社交网络平台中用户属性的方法和系统,将社交网络平台中用户参与互动的网页短URL、话题、消息、活动、投票或应用等社交网络平台功能作为确定用户属性的桥梁,从而准确确定用户的属性。
附图说明
图1为本发明实施例一的结构示意图;
图2为本发明实施例二所使用的存储系统示意图;
图3为本发明实施例三的实现流程图;
图4为本发明实施例四的实现流程图。
具体实施方式
本发明提出一种确定社交网络平台中用户属性的方法,包括:
确定社交网络平台中种子用户的属性;
根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;
根据社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。
以下结合附图,举具体的实施例详细介绍。
在以下的实施例中,以网页短URL作为计算用户属性的桥梁为例进行介绍。本发明也可以采用用户使用时主观意愿强的其他社交网络平台功能代替该桥梁,例如话题、消息、活动、投票或应用等。
首先需要说明的是,以下实施例中所述的用户与网页短URL互动是指:用户发表包含网页短URL的消息、用户转发包含网页短URL的消息、或者用户点击网页短URL等。用户进行这些互动的主观意愿强,因此网页短URL的属性在一定程度上能够反映出与其存在互动的用户的属性,反之亦然。
除上述互动方式外,其他能够体现用户主观意愿的方式也可以作为互动方式,本发明对此不作限制。
实施例一:
在本实施例中,整个用户属性计算模型分为两部分,如图1所示。图1左侧部分是用户属性自学习子系统,自学习子系统负责根据用户与网页短URL的互动,不断学习计算网页短URL的属性,以及用户属性;右侧部分为种子培育子系统,该系统确定一批初始的种子用户,并确定种子用户的属性,将种子用户的属性作为左侧自学习子系统的学习特征。
下面分别介绍上述两部分:
第一部分:种子培育子系统,包括种子用户属性计算模块。
首先确定种子用户。
然后,根据种子用户输入的用户标签、以及预先保存的用户标签与用户属性的对应关系确定种子用户的属性。例如,种子用户输入的用户标签为“互联网”时,确定该种子用户的属性为“科技”;种子用户输入的用户标签为“云技术”时,确定该种子用户的属性也为“科技”;从而保证确定的用户属性统一且不产生冲突。
最后,进行必要的人工审核及修正,以保证种子用户的属性尽可能准确。
第二部分:自学习子系统,包括用户属性数据库、用户属性计算模块、网页短URL属性数据库和网页短URL属性计算模块。
其中,用户属性数据库首先获取种子培育系统计算出的种子用户的属性;网页短URL属性计算模块根据用户与网页短URL的互动关系、以及用户属性数据库中保存的用户属性,计算网页短URL的属性,将计算结果发送至网页短URL属性数据库;用户属性计算模块根据用户与网页短URL的互动关系、以及网页短URL属性数据库中保存的网页短URL的属性,计算用户的属性,将计算结果发送至用户属性数据库。用户属性计算模块和网页短URL属性计算模块周期性地进行计算,从而计算出社交网络平台中用户的属性。
自学习子系统,由两步计算流程组成:
1)网页短URL属性计算,是根据互动该网页短URL的用户属性,汇总取最大值计算得出。例如:网页短URL被A,B,C三个用户互动,A用户的属性是a和b,B用户的属性是b和c,C用户的属性是a、b及c,那么该短URL的用户属性是b。
2)用户属性计算,可以根据该用户互动的网页短URL的属性确定,也可以根据该用户互动的网页短URL的属性以及该用户的收听好友所互动的网页短URL的属性共同确定。例如:A用户互动的网页短URL的属性为b,A的收听好友互动的网页短URL的属性中,c和b出现次数最多,那么确定A用户的用户属性为b。
上面计算模型中,网页短URL的属性和用户属性两者相互佐证双方数据的准确性,从而使属性数据随着用户基于网页短URL的互动进行动态调整。
实施例二:
本实施例介绍确定种子用户属性的一种方式。如图2为本实施例所使用的存储系统示意图。本实施例包括以下步骤:
步骤201:确定种子用户,将种子用户的ID保存在种子用户数据库中。这里的种子用户为资料填写最完整的高质量用户,本实施例中,取资料填写完整的VIP用户作为种子用户。
步骤202:使用种子用户ID查询用户资料数据库,获取种子用户填写的用户标签。
步骤203:根据用户标签查询模糊匹配数据库,获取用户标签所对应的用户属性,将种子用户的属性保存在种子用户结果数据库中。
模糊匹配数据库预先存储了用户标签与用户属性的对应关系,该步骤可以避免用户填写的用户标签不标准。例如,用户填写的用户标签为“美剧”,根据预先存储的“美剧”与“电影爱好者”的对应关系,可以确定该用户的属性为“电影爱好者”。
模糊匹配数据库中保存的对应关系可以周期性地进行计算,根据计算结果做必要的修订及扩充。
步骤204:对种子用户结果数据库中的数据进行人工审核及修正。
为降低人工审核的工作量,在选择种子用户时,应尽量筛选资料填写可信的用户。
种子培育系统确定出的种子用户属性是标准的、可以信赖的用户属性;且要求培育出来的种子用户必须足够的活跃,以有足够的社交数据参与自学习系统的计算。
实施例三:
本实施例介绍计算网页短URL的属性的一种方式,如图3为本实施例的实现流程图,包括如下步骤:
步骤301:搜集用户与网页短URL的互动流水数据,确定用户与网页短URL的互动关系。
这里可以以一天为时间切片,搜集流水数据。如每天搜集前一天的互动流水数据;这样的计算每天例行一次,不需要每次都计算所有的流水数据。
步骤302:互动关系去重。具体方式为:如果一个用户与某网页短URL存在多次互动,则仅保留该用户与该网页短URL的一次互动关系。本步骤是为了避免某些用户疯狂转发网页短URL,造成网页短URL属性计算不准确。
步骤303:判断互动关系中涉及的网页短URL的属性是否计算完毕,如果没有,则执行步骤304;如果计算完毕,则输出本次计算的所有网页短URL属性的计算结果,结束本次计算。
步骤304:获取互动关系中涉及的一个网页短URL。
步骤305:查询与该网页短URL存在互动关系的所有用户的属性。对于用户属性的查询,有的用户可能尚没有用户属性,则返回空即可,不影响整体计算的准确性。
步骤306:根据步骤305中查询的结果,计算该网页短URL属性的中间结果。
可以取查询结果中出现次数最多的3个(个数可任意规定,本发明不作限制)属性作为该网页短URL属性的中间结果,并将属性出现次数与3个属性出现总次数的比值作为该属性的权值。例如,本次查询结果中,与某网页短URL存在互动关系的用户中,用户属性出现次数最多的属性为a、b、c;其中,a出现的次数为50次,b出现的次数为40次,c出现的次数为10次;则该网页短URL属性的中间结果为:a(权值50%)、b(权值40%)和c(权值10%)。
步骤307:采用步骤306中计算的中间结果、以及上次计算的该网页短URL的属性,计算网页短URL属性的最终结果。
例如,上次计算的该网页短URL的属性为:a(权值30%)、b(权值60%)和d(权值10%);本次计算的该网页短URL属性的中间结果为:a(权值50%)、b(权值40%)和c(权值10%);则可以将上次计算的属性的权值乘以固定的值(例如,0.5,该值应小于1),并将相乘的结果与本次计算的中间结果的属性权值相加,取权值最大的3个属性作为该网页短URL属性的最终结果。就本例而言,计算结果如下:
属性a的权值=30%*0.5+50%=65%;
属性b的权值=60%*0.5+40%=70%;
属性c的权值=10%;
属性d的权值=10%*0.5=5%;
根据上述计算结果,取权值最大的3个属性作为该网页短URL属性的最终结果,即:b(权值70%)、a(权值65%)和c(权值10%)。
或者,也可以直接将步骤306中计算的中间结果作为网页短URL属性的最终结果,也就是说,如果之前已经确定过网页短URL的属性,则直接采用步骤306中计算的中间结果覆盖之前确定的网页短URL属性。
该网页短URL属性的最终结果计算完成之后,返回执行步骤303,计算下一个网页短URL的属性。
实施例四:
本实施例介绍计算用户属性的一种方式,如图4为本实施例的实现流程图,包括如下步骤:
步骤401:搜集用户与网页短URL的互动流水数据,确定与网页短URL互动的用户。
之所以只选取与网页短URL互动的用户进行计算,是为了缩小计算的范围。可以以一天为单位,由自学习系统不断地积累用户属性。
步骤402:为了避免质量不合格的网页短URL对计算结果的影响,对质量不合格的网页短URL进行过滤。
这里提出一个简单的算法来确定网页短URL的质量是否合格。该算法是:1)计算网页短URL的转播比,即:网页短URL转播次数/网页短URL原创次数;2)如果转播比小于预先设定的阀值,则认为该网页短URL的质量不合格。
步骤403:判断互动关系中涉及的用户的属性是否计算完毕,如果没有,则执行步骤404;如果计算完毕,则输出本次计算的所有用户属性的计算结果,结束本次计算。
步骤404:获取互动关系中涉及的一个用户。
步骤405:查询该用户以及该用户所收听的用户(以下简称为“该用户的收听用户”)互动的网页短URL,获取每个网页短URL的互动次数及属性。由于步骤402已经对质量不合格的网页短URL进行过滤,本步骤只涉及质量合格的网页短URL。
对于网页短URL属性的查询,有的网页短URL可能尚没有属性,则返回空即可,不影响整体计算的准确性。
步骤406:根据步骤405中查询的结果计算所述用户属性的中间结果。
具体计算方式可以包括以下步骤:
1)将每个网页短URL的属性权值乘以互动次数,并将相应属性的乘积分别相加,将结果作为该属性的比率值;
2)将各个属性的比率值相加;
3)针对各个属性,将该属性的比率值除以步骤2)中的相加结果,得到该属性的权值;
4)取权值最大的3个属性作为该用户属性的中间结果。
例如,用户A的收听用户有2个,包括用户B和用户C;
与用户A、B和C中至少一个用户存在互动的网页短URL包括URL1和URL2,其中,URL1的属性为:a(权值50%),b(权值30%),c(权值10%),互动次数为3次;URL2的属性为:d(权值70%),b(权值20%),a(权值5%),互动次数为2次;
根据上述查询结果,计算结果如下:
属性a的比率值=50%*3+5%*2=1.6;
属性b的比率值=30%*3+20%*2=1.3;
属性c的比率值=10%*3=0.3;
属性d的比率值=70%*2=1.4;
属性a的权值=1.6/(1.6+1.3+0.3+1.4)=35%;
属性b的权值=1.3/(1.6+1.3+0.3+1.4)=28%;
属性c的权值=0.3/(1.6+1.3+0.3+1.4)=7%;
属性d的权值=1.4/(1.6+1.3+0.3+1.4)=30%;
取权值最大的3个作为该用户A属性的中间结果,即:a(权值35%)、d(权值30%)、b(权值28%)。
步骤407:采用步骤406中计算的中间结果、以及上次计算的该用户的属性,计算该用户属性的最终结果,返回执行步骤403。
例如,上次计算的用户A的属性为:a(权值20%)、c(权值30%)和d(权值40%);本次计算的用户A属性的中间结果为:a(权值35%)、d(权值30%)、b(权值28%);则可以将上次计算的属性的权值乘以固定的值(例如,0.5,该值应小于1),并将相乘的结果与本次计算的中间结果的属性权值相加,取权值最大的3个属性作为用户A属性的最终结果。就本例而言,计算结果如下:
属性a的权值=20%*0.5+35%=45%;
属性b的权值=28%;
属性c的权值=30%*0.5=15%;
属性d的权值=40%*0.5+30%=50%;
根据上述计算结果,取权值最大的3个属性作为用户A属性的最终结果,即:d(权值50%)、a(权值45%)和b(权值28%)。
或者,也可以直接将步骤406中计算的中间结果作为用户属性的最终结果,也就是说,如果之前已经确定过用户属性,则直接采用采用步骤406中计算的中间结果覆盖之前确定的用户属性。
上述四个实施例是以网页短URL作为确定社交网络平台中用户属性的桥梁。本发明也可以采用用户在使用时主观意愿强的其他因素代替网页短URL。所谓主观意愿强,是指用户主动、需要有记忆成本的做一件事情,那么这件事情就能在一定程度上反映用户属性。例如,用户参与一个话题的讨论,则可以认为该用户与该话题存在互动关系,将该话题作为确定社交网络平台中用户属性的桥梁;或者,用户发表、阅读或转发一个消息,则可以认为该用户与该消息存在互动关系,将该消息作为确定社交网络平台中用户属性的桥梁,等等。
本发明还提出一种确定社交网络平台中用户属性的系统,包括:
种子培育子系统,用于确定社交网络平台中种子用户的属性,将所述种子用户的属性发送至自学习子系统;
自学习子系统,用于根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;还用于根据所述社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。
上述系统中,社交网络平台功能可以为:网页短URL、话题、消息、活动、投票或应用;
用户参与互动网页短URL的方式可以为:用户访问网页短URL或者发表或转播的消息中包含网页短URL。
上述系统中,种子培育子系统确定社交网络平台中种子用户属性的方式可以:
确定社交网络平台中的种子用户;
获取所述种子用户填写的用户标签;
根据所述用户标签以及预先存储的用户标签与属性的对应关系,确定该种子用户的属性;
对所述种子用户的属性进行审核及修正。
上述系统中,自学习子系统包括:
用户属性数据库,用于接收并保存种子培育子系统发送的种子用户的属性,还用于接收并保存用户属性计算模块发送的用户属性;
网页短URL属性计算模块,用于根据所述用户属性数据库中保存的用户属性,确定用户参与互动的社交网络平台功能的属性,将社交网络平台功能的属性发送至网页短URL属性数据库;
网页短URL属性数据库,用于接收并保存网页短URL属性计算模块发送的社交网络平台功能的属性;
用户属性计算模块,用于根据所述网页短URL属性数据库保存的社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性,并将用户属性发送至用户属性数据库。
上述系统中,网页短URL属性计算模块确定用户参与互动的社交网络平台功能的属性的方式可以为:
获取预先设定的时间段内用户参与互动的社交网络平台功能;
针对每个获取的社交网络平台功能分别执行以下步骤:
A1、查询与该社交网络平台功能存在互动关系的用户的属性;
B1、将所述查询结果中出现次数最多的N个属性作为该社交网络平台功能的属性的中间结果,并且将每个属性的出现次数与N个属性出现总次数的比值作为该属性的权值;其中,N为预先设定的整数;
C1、将所述中间结果作为社交网络平台功能的属性的最终结果;或者,将之前计算的所述社交网络平台功能的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为社交网络平台功能的属性的最终结果。
用户属性计算模块确定参与互动网页短URL、话题或消息的用户的属性的方式为:
获取预先设定的时间段内参与互动社交网络平台功能的用户的属性的方式可以为:
获取预先设定的时间段内参与互动社交网络平台功能的用户;
针对每个获取的用户分别执行以下步骤:
A2、查询该用户及其收听用户互动的社交网络平台功能,获取每个社交网络平台功能的互动次数及属性;
B2、根据所述获取的结果计算所述用户属性的中间结果;
C2、将所述中间结果作为用户属性的最终结果;或者,将之前计算的所述用户的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为用户属性的最终结果;其中,N为预先设定的整数。
其中,步骤B2的具体方式为:
将每个社交网络平台功能的属性权值乘以互动次数,并将相应属性的乘积分别相加,将结果作为该属性的比率值;
针对各个属性,将该属性的比率值除以所有属性比率值的和,得到该属性的权值;
取权值最大的N个属性作为该用户属性的中间结果。
当社交网络平台功能为网页短URL时,步骤A2中的社交网络平台功能可以为:转播次数与原创次数的比值大于预先设定的阈值的网页短URL。
综上可见,本发明提出的确定社交网络平台中用户属性的方法和系统,将用户互动的网页短URL、话题、消息、活动、投票或应用等社交网络平台功能作为确定用户属性的桥梁。利用平台的社交属性,动态社交网络平台功能的属性及用户属性。由用户互动的社交网络平台功能的属性可以确定该用户的兴趣圈,并通过收听好友的兴趣圈进行确认,从而得出用户真正的属性,提高用户属性的准确率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (15)
1.一种确定社交网络平台中用户属性的方法,其特征在于,所述方法包括:
确定社交网络平台中种子用户的属性;
根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;
根据社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。
2.根据权利要求1所述的方法,其特征在于,所述社交网络平台功能为:网页短URL、话题、消息、活动、投票或应用;
用户参与互动网页短URL的方式为:用户访问网页短URL或者发表或转播的消息中包含网页短URL。
3.根据权利要求1或2所述的方法,其特征在于,所述确定社交网络平台中种子用户属性的方式为:
确定社交网络平台中的种子用户;
获取所述种子用户填写的用户标签;
根据所述用户标签以及预先存储的用户标签与属性的对应关系,确定该种子用户的属性;
对所述种子用户的属性进行审核及修正。
4.根据权利要求1或2所述的方法,其特征在于,所述根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性的方式为:
获取预先设定的时间段内用户参与互动的社交网络平台功能;
针对每个获取的社交网络平台功能分别执行以下步骤:
A、查询与该社交网络平台功能存在互动关系的用户的属性;
B、将所述查询结果中出现次数最多的N个属性作为该社交网络平台功能的属性的中间结果,并且将每个属性的出现次数与N个属性出现总次数的比值作为该属性的权值;其中,N为预先设定的整数;
C、将所述中间结果作为社交网络平台功能的属性的最终结果;或者,将之前计算的所述社交网络平台功能的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为社交网络平台功能的属性的最终结果。
5.根据权利要求1或2所述的方法,其特征在于,所述根据社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性的方式为:
获取预先设定的时间段内参与互动社交网络平台功能的用户;
针对每个获取的用户分别执行以下步骤:
A、查询该用户及其收听用户互动的社交网络平台功能,获取每个社交网络平台功能的互动次数及属性;
B、根据所述获取的结果计算所述用户属性的中间结果;
C、将所述中间结果作为用户属性的最终结果;或者,将之前计算的所述用户的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为用户属性的最终结果;其中,N为预先设定的整数。
6.根据权利要求5所述的方法,其特征在于,所述步骤B的具体方式为:
将每个社交网络平台功能的属性权值乘以互动次数,并将相应属性的乘积分别相加,将结果作为该属性的比率值;
针对各个属性,将该属性的比率值除以所有属性比率值的和,得到该属性的权值;
取权值最大的N个属性作为该用户属性的中间结果。
7.根据权利要求5所述的方法,其特征在于,当所述社交网络平台功能为网页短URL时,步骤A中所述的社交网络平台功能为:转播次数与原创次数的比值大于预先设定的阈值的网页短URL。
8.一种确定社交网络平台中用户属性的系统,其特征在于,所述系统包括:
种子培育子系统,用于确定社交网络平台中种子用户的属性,将所述种子用户的属性发送至自学习子系统;
自学习子系统,用于根据社交网络平台中用户的属性,确定用户参与互动的社交网络平台功能的属性;还用于根据所述社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性。
9.根据权利要求8所述的系统,其特征在于,所述社交网络平台功能为:网页短URL、话题、消息、活动、投票或应用;
用户参与互动网页短URL的方式为:用户访问网页短URL或者发表或转播的消息中包含网页短URL。
10.根据权利要求8或9所述的系统,其特征在于,所述种子培育子系统确定社交网络平台中种子用户属性的方式为:
确定社交网络平台中的种子用户;
获取所述种子用户填写的用户标签;
根据所述用户标签以及预先存储的用户标签与属性的对应关系,确定该种子用户的属性;
对所述种子用户的属性进行审核及修正。
11.根据权利要求8或9所述的系统,其特征在于,所述自学习子系统包括:
用户属性数据库,用于接收并保存种子培育子系统发送的种子用户的属性,还用于接收并保存用户属性计算模块发送的用户属性;
网页短URL属性计算模块,用于根据所述用户属性数据库中保存的用户属性,确定用户参与互动的社交网络平台功能的属性,将社交网络平台功能的属性发送至网页短URL属性数据库;
网页短URL属性数据库,用于接收并保存网页短URL属性计算模块发送的社交网络平台功能的属性;
用户属性计算模块,用于根据所述网页短URL属性数据库保存的社交网络平台功能的属性,确定参与互动社交网络平台功能的用户的属性,并将用户属性发送至用户属性数据库。
12.根据权利要求11所述的系统,其特征在于,所述网页短URL属性计算模块确定用户参与互动的社交网络平台功能的属性的方式为:
获取预先设定的时间段内用户参与互动的社交网络平台功能;
针对每个获取的社交网络平台功能分别执行以下步骤:
A、查询与该社交网络平台功能存在互动关系的用户的属性;
B、将所述查询结果中出现次数最多的N个属性作为该社交网络平台功能的属性的中间结果,并且将每个属性的出现次数与N个属性出现总次数的比值作为该属性的权值;其中,N为预先设定的整数;
C、将所述中间结果作为社交网络平台功能的属性的最终结果;或者,将之前计算的所述社交网络平台功能的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为社交网络平台功能的属性的最终结果。
13.根据权利要求11所述的系统,其特征在于,所述用户属性计算模块确定参与互动社交网络平台功能的用户的属性的方式为:
获取预先设定的时间段内参与互动社交网络平台功能的用户;
针对每个获取的用户分别执行以下步骤:
A、查询该用户及其收听用户互动的社交网络平台功能,获取每个社交网络平台功能的互动次数及属性;
B、根据所述获取的结果计算所述用户属性的中间结果;
C、将所述中间结果作为用户属性的最终结果;或者,将之前计算的所述用户的属性权值乘以预先设定的比值,并将相乘的结果与所述中间结果中相应属性的权值相加,取权值最大的N个属性作为用户属性的最终结果;其中,N为预先设定的整数。
14.根据权利要求13所述的系统,其特征在于,所述步骤B的具体方式为:
将每个社交网络平台功能的属性权值乘以互动次数,并将相应属性的乘积分别相加,将结果作为该属性的比率值;
针对各个属性,将该属性的比率值除以所有属性比率值的和,得到该属性的权值;
取权值最大的N个属性作为该用户属性的中间结果。
15.根据权利要求13所述的系统,其特征在于,当所述社交网络平台功能为网页短URL时,步骤A中所述的社交网络平台功能为:转播次数与原创次数的比值大于预先设定的阈值的网页短URL。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310645959.6A CN104699679B (zh) | 2013-12-04 | 2013-12-04 | 一种确定社交网络平台中用户属性的方法和系统 |
PCT/CN2015/072136 WO2015081912A1 (zh) | 2013-12-04 | 2015-02-03 | 一种确定社交网络平台中用户属性的方法和系统 |
US15/100,504 US9613148B2 (en) | 2013-12-04 | 2015-02-03 | Method and system for determining property of user in social network platform |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310645959.6A CN104699679B (zh) | 2013-12-04 | 2013-12-04 | 一种确定社交网络平台中用户属性的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104699679A true CN104699679A (zh) | 2015-06-10 |
CN104699679B CN104699679B (zh) | 2019-03-26 |
Family
ID=53272922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310645959.6A Active CN104699679B (zh) | 2013-12-04 | 2013-12-04 | 一种确定社交网络平台中用户属性的方法和系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9613148B2 (zh) |
CN (1) | CN104699679B (zh) |
WO (1) | WO2015081912A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653605A (zh) * | 2015-12-23 | 2016-06-08 | 北京搜狗科技发展有限公司 | 一种用于网络社区作弊用户挖掘的方法、系统及电子设备 |
CN108921189A (zh) * | 2018-05-23 | 2018-11-30 | 北京航空航天大学 | 针对社交网络用户属性的推演方法及装置 |
CN110825888A (zh) * | 2019-11-15 | 2020-02-21 | 海南大学 | 可定义隐私模糊度的多维度体系化交互机制 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120198513A1 (en) * | 2011-02-02 | 2012-08-02 | Metasecure Corporation | Secure social web orchestration via a security model |
CN102708176A (zh) * | 2012-05-08 | 2012-10-03 | 山东大学 | 基于活跃用户的微博数据挖掘方法 |
US20120323686A1 (en) * | 2011-06-20 | 2012-12-20 | Microsoft Corporation | Virtual identity manager |
CN102929892A (zh) * | 2011-08-12 | 2013-02-13 | 莫润刚 | 基于社交网络的信息精准推广系统及方法 |
CN103064918A (zh) * | 2012-12-20 | 2013-04-24 | 无锡清华信息科学与技术国家实验室物联网技术中心 | 一种基于社会推荐网络和机制设计的专家寻找方法和系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8601591B2 (en) | 2009-02-05 | 2013-12-03 | At&T Intellectual Property I, L.P. | Method and apparatus for providing web privacy |
US20110276921A1 (en) | 2010-05-05 | 2011-11-10 | Yahoo! Inc. | Selecting content based on interest tags that are included in an interest cloud |
US20120011006A1 (en) * | 2010-07-09 | 2012-01-12 | Richard Schultz | System And Method For Real-Time Analysis Of Opinion Data |
US10127522B2 (en) * | 2011-07-14 | 2018-11-13 | Excalibur Ip, Llc | Automatic profiling of social media users |
US20130159011A1 (en) | 2011-11-30 | 2013-06-20 | Kevin Leville | Providing health-condition specific coaching in a social network |
CN103309957B (zh) | 2013-05-28 | 2016-12-28 | 华东师范大学 | 一种引入列维飞行的社交网络专家定位方法 |
-
2013
- 2013-12-04 CN CN201310645959.6A patent/CN104699679B/zh active Active
-
2015
- 2015-02-03 WO PCT/CN2015/072136 patent/WO2015081912A1/zh active Application Filing
- 2015-02-03 US US15/100,504 patent/US9613148B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120198513A1 (en) * | 2011-02-02 | 2012-08-02 | Metasecure Corporation | Secure social web orchestration via a security model |
US20120323686A1 (en) * | 2011-06-20 | 2012-12-20 | Microsoft Corporation | Virtual identity manager |
CN102929892A (zh) * | 2011-08-12 | 2013-02-13 | 莫润刚 | 基于社交网络的信息精准推广系统及方法 |
CN102708176A (zh) * | 2012-05-08 | 2012-10-03 | 山东大学 | 基于活跃用户的微博数据挖掘方法 |
CN103064918A (zh) * | 2012-12-20 | 2013-04-24 | 无锡清华信息科学与技术国家实验室物联网技术中心 | 一种基于社会推荐网络和机制设计的专家寻找方法和系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653605A (zh) * | 2015-12-23 | 2016-06-08 | 北京搜狗科技发展有限公司 | 一种用于网络社区作弊用户挖掘的方法、系统及电子设备 |
CN105653605B (zh) * | 2015-12-23 | 2020-04-21 | 北京搜狗科技发展有限公司 | 一种用于网络社区作弊用户挖掘的方法、系统及电子设备 |
CN108921189A (zh) * | 2018-05-23 | 2018-11-30 | 北京航空航天大学 | 针对社交网络用户属性的推演方法及装置 |
CN108921189B (zh) * | 2018-05-23 | 2021-05-18 | 北京航空航天大学 | 针对社交网络用户属性的推演方法及装置 |
CN110825888A (zh) * | 2019-11-15 | 2020-02-21 | 海南大学 | 可定义隐私模糊度的多维度体系化交互机制 |
Also Published As
Publication number | Publication date |
---|---|
CN104699679B (zh) | 2019-03-26 |
US20160306884A1 (en) | 2016-10-20 |
WO2015081912A1 (zh) | 2015-06-11 |
US9613148B2 (en) | 2017-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Applying the dynamic DEA model to evaluate the energy efficiency of OECD countries and China | |
Pallard | Moment propagation for weak solutions to the Vlasov–Poisson system | |
CN101505311B (zh) | 一种基于社会化网络的信息传播方法及系统 | |
CN103886047B (zh) | 面向流式数据的分布式在线推荐方法 | |
CN106980692A (zh) | 一种基于微博特定事件的影响力计算方法 | |
TW201717071A (zh) | 推薦方法及裝置 | |
CN102915307A (zh) | 一种个性化信息推荐的方法、装置及信息处理系统 | |
CN103092950A (zh) | 一种网络舆情地理位置实时监控系统和方法 | |
CN102682046A (zh) | 社交网络的节点搜索和分析方法及搜索系统 | |
DE102011101791A1 (de) | Verfahren, vorrichtungen und herstellungsgegenstände zumbewerten des einflusses von websites | |
CN104506578A (zh) | 发布/订阅网络的订阅信息的维护方法及装置 | |
CN103631946A (zh) | 一种基于地理位置的内容推送系统 | |
CN103365842B (zh) | 一种页面浏览推荐方法及装置 | |
CN104699679A (zh) | 一种确定社交网络平台中用户属性的方法和系统 | |
CN103106615B (zh) | 基于电视观看日志挖掘的用户行为分析方法 | |
CN104009993A (zh) | 一种基于模糊过滤的信任评估方法 | |
CN108520337B (zh) | 一种基于网络风险熵差的谣言风险评估方法 | |
US9720975B2 (en) | Dynamic influence tracking engine and method | |
CN104917812A (zh) | 一种应用于群智计算的服务节点选择方法 | |
CN103618702A (zh) | 社会网络信息传播态势感知方法及系统 | |
Clayton et al. | Optimal control of a rabies epidemic model with a birth pulse | |
CN102521360B (zh) | 栅格数据传输方法及系统 | |
Alkhamisi | Ridge estimation in linear models with autocorrelated errors | |
Falck-Ytter et al. | An empirical study of valuation and user behavior in social networking services | |
CN104765757A (zh) | 一种基于异构网络的微博时序排名方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |