CN106685809A - 一种社交圈子的生成方法和装置 - Google Patents

一种社交圈子的生成方法和装置 Download PDF

Info

Publication number
CN106685809A
CN106685809A CN201710103637.7A CN201710103637A CN106685809A CN 106685809 A CN106685809 A CN 106685809A CN 201710103637 A CN201710103637 A CN 201710103637A CN 106685809 A CN106685809 A CN 106685809A
Authority
CN
China
Prior art keywords
user
location point
resident
social
circle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710103637.7A
Other languages
English (en)
Other versions
CN106685809B (zh
Inventor
容毅峰
高瀚
黄�俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710103637.7A priority Critical patent/CN106685809B/zh
Publication of CN106685809A publication Critical patent/CN106685809A/zh
Priority to PCT/CN2018/076227 priority patent/WO2018153292A1/zh
Application granted granted Critical
Publication of CN106685809B publication Critical patent/CN106685809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/222Monitoring or handling of messages using geographical location information, e.g. messages transmitted or received in proximity of a certain spot or area
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种社交圈子的生成方法和装置;本发明实施例采用获取待划分用户集合中用户访问社交平台时的常驻地理位置,然后,根据该常驻地理位置从该待划分用户集合中选取相应的目标用户,得到目标用户集合,提取目标用户集合中用户之间的社交关系,根据该目标用户集合和该社交关系构造局部社交网络,该局部社交网络包括代表用户的网络节点,对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子;该方案可以扩大社交圈子的覆盖范围,减小数据计算量,提升社交圈子划分的精确性。

Description

一种社交圈子的生成方法和装置
技术领域
本发明涉及通信技术领域,具体涉及一种社交圈子的生成方法和装置。
背景技术
随着用户间的好友关系不断发展,社交网络逐渐形成各种社交圈子,比如亲戚家人圈子,工作圈子。用户所处的社交圈子能较好地反映用户的状态,应用场景广泛,如在好友推荐中可向用户推荐处于同一社交圈子的好友,在广告定向中可挑选圈子中具有较大影响力的用户进行广告投放进而影响到同一圈子的用户,在社交征信可根据用户所处的圈子判别其生活、工作状态,等等。
目前,关于社交圈子的挖掘,主要方法为:对每个用户的好友及其二度好友组成的局部社交网络进行处理,主要功能是对用户的好友及二度好友划分圈子从而达到好友分类的效果,但由于未考虑全局社交网络,因而无法刻画用户在全局网络中所处的社交圈子。若要扩大覆盖范围,通常做法是把三度以上的好友也列入考虑,计算数据量将显著上升,可行性较低,且社交圈子划分精确性较低。
发明内容
本发明实施例提供一种社交圈子的生成方法和装置,可以扩大社交圈子的覆盖范围以及提高社交圈子划分的精确性。
本发明实施例提供一种社交圈子的生成方法,包括:
获取待划分用户集合中用户访问社交平台的常驻地理位置;
根据所述常驻地理位置从所述待划分用户集合中选取相应的目标用户,得到目标用户集合;
提取目标用户集合中用户之间的社交关系;
根据所述目标用户集合和所述社交关系构造局部社交网络,所述局部社交网络包括代表用户的网络节点;
对所述局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子。
相应的,本发明实施例还提供一种社交圈子的生成装置,包括:
位置获取单元,用于获取待划分用户集合中用户访问社交平台的常驻地理位置;
用户选取单元,用于根据所述常驻地理位置从所述待划分用户集合中选取相应的目标用户,得到目标用户集合;
关系提取单元,用于提取目标用户集合中用户之间的社交关系;
网络构造单元,用于根据所述目标用户集合和所述社交关系构造局部社交网络,所述局部社交网络包括代表用户的网络节点;
圈子划分单元,用于对所述局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子。
本发明实施例采用获取待划分用户集合中用户访问社交平台时的常驻地理位置,然后,根据该常驻地理位置从该待划分用户集合中选取相应的目标用户,得到目标用户集合,提取目标用户集合中用户之间的社交关系,根据该目标用户集合和该社交关系构造局部社交网络,该局部社交网络包括代表用户的网络节点,对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子;由于该方案可以结合用户间的社交关系和用户的常驻地理位置进行社交圈子划分,因此,可以扩大社交圈子的覆盖范围,减小数据计算量,提升社交圈子划分的精确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的社交圈子的生成方法的流程图;
图1b是本发明实施例提供的一种选取常驻位置点的示意图;
图1c是本发明实施例提供的局部社交网络的示意图;
图1d是本发明实施例提供的社交团体划分示意图;
图1e是本发明实施例提供的社交团体划分的结果示意图;
图1f是本发明实施例提供的局部社交网络的另一示意图;
图1g是本发明实施例提供的社交团体划分的另一结果示意图;
图2a是本发明实施例提供的社交圈子的划分系统的场景示意图;
图2b是本发明实施例提供的社交圈子的生成方法的另一流程图;
图3a是本发明实施例提供的社交圈子的生成装置的结构示意图;
图3b是本发明实施例提供的社交圈子的生成装置的另一结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种社交圈子的生成方法和装置。以下将分别进行详细说明。
实施例一、
本实施例将从社交圈子的生成装置的角度进行描述,该社交圈子的生成装置具体可以集成在服务器等设备中。
一种社交圈子的生成方法,包括:获取待划分用户集合中用户访问社交平台时的常驻地理位置,然后,根据该常驻地理位置从该待划分用户集合中选取相应的目标用户,得到目标用户集合,提取目标用户集合中用户之间的社交关系,根据该目标用户集合和该社交关系构造局部社交网络,该局部社交网络包括代表用户的网络节点,对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子。
如图1a所示,该社交圈子的生成方法的具体流程可以如下:
101、获取待划分用户集合中用户访问社交平台的常驻地理位置。
其中,常驻地理位置指的是用户在一定时间段内访问社交平台的常用或者固定地理位置。比如,可以是用户在一定时间段内登录社交平台的常用或者固定登录地理位置。实际应用中,该常驻地理位置可以是在一定时间段登录社交平台的登录次数超过一定数量的登录地理位置,等等。
该社交平台可以为社交网络平台,比如即时通讯平台等等。
本实施例中,待划分用户集合为需要进行社交圈子划分的用户集合,该待划分用户集合可以包括多个需要进行社交圈子划分的用户,比如,包括n个待划分社交圈子的用户,n大于1且为正整数。在实际应用中,该用户可以是在网络中唯一能够识别用户身份的用户标识。
本实施例中获取常驻地理位置的方式可以有多种,比如,可以从统计某个用户在一定时间段内在地理位置访问社交平台的访问次数,然后,基于该访问次数来确定该用户访问社交平台的常驻地理位置。具体地,当在某个地理位置访问社交平台访问次数达到一定次数时,可以确定该地理位置即为常驻地理位置。
又比如,为减少计算量,便于社交圈子划分,实际应用中可以通过一些算法将地理位置转换成某个平面上的位置点,然后,从位置点中获取代表常驻地理位置的常驻位置点,此时可认为获取到常驻地理位置。也即,步骤“获取待划分用户集合中用户访问社交平台的常驻地理位置”可以包括:
获取终端上报的待划分用户集合中用户访问社交平台的多个地理位置;
根据该地理位置在预设平面上绘制相应的位置点;
从该位置点中选取用户的常驻位置点,该常驻位置点代表用户访问社交平台时的常驻地理位置。
其中,地理位置包括经度和纬度等信息。
比如,集合内某个用户的终端上报了该用户访问社交平台的M(M大于1,且为正整数)个地理位置,那么,便可以在预设平面上绘制M个位置点,一个位置点对应一个地理位置,然后,从M个位置点中选取用户的常驻位置点。
其中,从位置点中选取常驻位置点的方式可以有多种,比如考虑到用户实际生活中访问社交平台比较集中的地理位置,可能存在用户的常驻地理位置;因此,为了提高常驻地理位置的确定速度,本实施例可以基于位置点之间的距离来确定常驻位置点;也即步骤“从该位置点中选取用户的常驻位置点”可以包括:
根据该预设平面中位置点之间的距离以及预设距离阈值,对位置点进行归类;
将属于同一类的位置点作为该用户的一种候选常驻位置点,得到相应的候选常驻位置点集合;
从该候选常驻位置点集合中选取一个位置点作为该类位置点的常驻位置代表点,得到用户的常驻位置点。
比如,对某个用户,上报的M个地理位置,此时,在预设平面上即有M个位置点,然后,可以基于位置点之间的距离以及预设距离阈值对M个位置点进行归类,如可以将位置点1、位置点3、位置点4归为一类,位置点2、位置点5、位置点6归为一类,……将位置点7、位置点9、位置点M归为一类。
那么此时,可以将位置点1、位置点3、位置点4作为该用户的一种候选常驻位置点,得到候选常驻位置点集合a(位置点1、位置点3、位置点4);将位置点2、位置点5、位置点6作为用户的另一种候选常驻位置点,得到候选常驻位置点集合b(位置点2、位置点5、位置点6),……依次类推将位置点7、位置点9、位置点M作为用户的又一种候选常驻位置点,得到候选常驻位置点集合c(位置点7、位置点9、位置点M)。
之后,可以从候选常驻位置点集合中选取一个该类位置点的常驻位置代表点(该代表点即为用户常驻位置点),即选取一个位置点作为常驻位置点的代表;比如,可以从候选位置点集合a中选取位置点1作为用户的常驻位置代表点,从候选位置点集合b中选取位置点5作为用户的常驻位置代表点,从候选位置点集合c中选取位置点9作为用户的常驻位置代表点。最后将常驻位置代表点作为用户常驻位置点。
可选地,可以从候选常驻位置点集合中选取局部密度最大的位置点作为常驻位置代表点。
优选地,步骤“根据该预设平面中位置点之间的距离以及预设距离阈值,对位置点进行归类”可以包括:
从未归类的位置点中选取一个起始位置点;
获取该预设平面上用户的其他未归类位置点与该起始位置点之间的距离;
当存在与该起始位置点之间的距离不大于预设距离阈值的目标位置点时,将该目标位置点添加到起始位置点对应的位置点集合,以将目标位置点与该起始位置点归为同一类;
在该位置点集合中选取新加入的位置点更新该起始位置点;并返回执行获取该预设平面上用户的其他未归类位置点与该起始位置点之间的距离的步骤,直到没有新位置点加入该位置点集合时停止。
比如,针对某个用户,可以随机从该用户的所有位置点中抽取一个位置点作为起始点,计算其他位置点到它的距离,若其它所有位置到该位置的距离均大于预设距离阈值dist,则确定该位置点为离群点,定义为噪声;若存在到该位置点距离不超过dist的其它位置点,则将这些位置归到同一类,将到该位置点距离不超过dist的其它位置点加入到起始位置点对应的位置点集合中。对新加入的位置重复前述操作,直至无新位置点加入。
对其它未被归类的位置重复上述操作,直到所有位置都被归类或被列为噪声。
以位置点1、位置点2……位置点11为例,参考图1b,可以选取一个位置点1作为起始位置点,然后,以位置点1为圆心在平面上画一个半径为预设距离阈值dist的圆,若该圆内有位置点2和位置3,此时将位置点1、位置点2、位置3归为同一类。然后分别以位置点2和位置点3为圆心在平面上画一个半径为预设距离阈值dist的圆,如图1b所示,位置点4位于以位置点2为圆心的圆内,位置点5位于以位置点3为圆心的圆内,此时将位置点1、位置点2、位置3、位置点4和位置点5归为同一类。接着分别以位置点4和位置点5为圆心在平面上画一个半径为预设距离阈值dist的圆,如图1b所示,以位置点4和位置点5为圆心的圆内没有新的位置点,此时便停止操作,得到候选常驻位置点集合(位置点1、位置点2、位置3、位置点4、位置点5)。
对于未归类的其他位置点,如位置点6至位置点11,可以重新选取位置点6为起始位置点,并以位置点6为圆心在在平面上画一个半径为预设距离阈值dist的圆,如图1b所示,该圆内没有新的位置点,此时可以认为该位置点6为噪声点。同理,可以重新选取位置7为起始位置点,并以位置7为圆心在在平面上画一个半径为预设距离阈值dist的圆,如图1b所示,该圆内没有新的位置点,此时可以认为该位置点7也为噪声点。
经过前述归类,还剩余位置点8至位置点11未归类,因此,可以选取位置点10为起始点,并以位置10为圆心在在平面上画一个半径为预设距离阈值dist的圆,如图1b所示,位置点9位于该圆内,此时,将位置点10和位置点9归为同一类。然后便可以以位置9为圆心在在平面上画一个半径为预设距离阈值dist的圆,此时位置点8位于以位置9为圆心的圆内,那么可以位置点8、位置点10和位置点9归为同一类。然后便可以继续以位置8为圆心在在平面上画一个半径为预设距离阈值dist的圆,如图1b所示,以位置8为圆心的圆内没有新的位置点,因此,结束操作,得到候选常驻位置点集合(位置点8、位置点9、位置点10)。
最后,还剩下位置点11未归类,那么通用可以选取位置点11为起始点,并以位置11为圆心在在平面上画一个半径为预设距离阈值dist的圆,如图1b所示,该圆内不出在任何新位置点,至此整个用户的归类过程结束。
在归类结束后,可以从候选常驻位置点集合(位置点1、位置点2、位置3、位置点4、位置点5)中选取常驻位置点的代表,即常驻位置代表点,比如,可以选取局部密度最大的位置点作为常驻位置代表点,如位置点1。同理从候选常驻位置点集合(位置点8、位置点9、位置点10)选取常驻位置代表点,如位置点10。此时,位置点1和位置点10即为用户的常驻位置点。
通过上述的方式可以获取待划分用户集合中每个用户的常驻位置点。
102、根据该常驻地理位置从该待划分用户集合中选取相应的目标用户,得到目标用户集合。
比如,可以根据用户的常驻位置点从该待划分用户集合中选取相应的目标用户。该步骤是根据待划分用户集合中每个用户的常驻位置点选取目标用户。
其中,目标用户集合包括一个或者多个用户。
可选地,本实施例可以基于常驻位置点对应的场景来选取目标用户。也即步骤“根据用户的常驻位置点从该待划分用户集合中选取相应的目标用户”可以包括:
确定用户的该常驻位置点对应的场景;
根据用户的该常驻位置点对应的场景,从该待划分用户集合中选取相应的目标用户。
本实施例可以确定待划分用户集合中每个用户的常驻位置点对应的场景,然后,基于每个用户的常驻位置点对应的场景选取目标用户。
其中,场景可以实际需求设定,比如办公地、居住地、娱乐地、饮食地、休息地、锻炼地等等。优选地,场景包括办公地、居住地。
例如,可以确定用户A的常驻位置点1对应的场景为办公地、用户A的常驻位置点2对应的场景为居住地,确定用户B的常驻位置点1对应的场景为居住地、用户B的常驻位置点2对应的场景为办公地。
其中,确定常驻位置点场景的方式可以有多种,比如,可以基于预置的场景与地理位置之间的映射关系得到,又比如,可以基于常驻点在某个时段的访问频率得到。也即步骤“确定用户的该常驻位置点对应的场景”可以包括:
获取用户的常驻位置点在预设类型时段的访问频率;
根据该访问频率确定该常驻位置点对应的场景。
该访问频率为:一定时间段内用户在常驻位置点对应的地理位置上,且在预设类型时段访问社交平台的访问频率,比如,用户A的常驻位置点在预设类型时段的访问频率。如可以包括:30天内用户A在常驻位置点1对应的地理位置上,且在工作时段访问社交平台的访问频率。
其中,预设类型时段可以根据实际需求划分,比如,可以对一天时间进行划分成得到相应的时间段;如可以将一天时间的划分成工作时段和下班时段两类时段。实际应用中,可以将工作日0到23点、周末及节假日0到23点,划分为工作及下班两类时段。又比如,还可以根据实际需求将一天时间划分成休息时段、上班时段、运动时段等等。
当预设类型时段包括工作时段和下班时段时,步骤“获取用户的常驻位置点在预设类型时段内的访问频率”可以包括:获取用户的常驻位置点在工作时段和下班时段访问该社交平台的访问频率;
此时,步骤“根据该访问频率确定该常驻位置点对应的场景”可以包括:根据该常驻位置点在工作时段和下班时段的访问频率,确定该常驻位置点对应的场景是居住地还是办公地。
优选地,该访问频率包括:在预定天数内用户的常驻位置点在预设类型时段(如工作时段、下班时段)的登录天数与预设天数的比例,在预定天数内用户的常驻位置点下班时段的登录天数与预设天数的比例。比如,在30天内用户A的常驻位置点在工作时段登录24天,那么访问频率可以为(24/30)*100%=80%;在30天内用户A的常驻位置点在工作时段登录12天,那么访问频率可以(12/30)*100%=40%。
本实施例中,获取常驻位置点在预设类型时段的访问频率的方式可以有多种,比如,可以获取常驻位置点访问社交平台的访问时间(如登录时间),然后,根据该访问时间和预设类型时间获取访问频率。该访问时间可以由终端在上报地理位置时上报,也即终端上报用户的多个地理位置以及地理位置对应的访问时间信息。比如,终端上报多个LBS数据,该LBS数据包含地理位置以及当前访问时间信息。
当预设类型时段包括工作时段和下班时段时,本实施例可以综合考虑常驻位置点在工作时段和下班时段的访问频率,来确定该常驻位置点是办公地还是居住地。比如,可以当在工作时段的访问频率f1大于预设阈值F1,且在下班时段的访问频率f2小于F2时,则确定该常驻位置点的场景为办公地。又比如,在下班时段的访问频率f2大于F3,且在工作时段的访问频率f1小于预设阈值F4时,则确定常驻位置点为居住地。
为了提高社交圈子挖掘或者划分的质量和精确性,本实施例还可以基于常驻位置点对应的场景,从常驻位置点中选取相应的常驻位置点,用于社交圈子划分。也即步骤“根据用户的该常驻位置点对应的场景,从该待划分用户集合中选取相应的目标用户”可以包括:
根据用户的该常驻位置点对应的场景,从用户的常驻位置点中选取相应的目标常驻位置点;
根据用户的目标常驻位置点对应的场景,从该待划分用户集合中选取相应的目标用户。
比如,当场景包括办公地、居住地时,可以从用户的常驻位置点选取一个场景为办公地的常驻位置点、和/或一个场景为居住地的常驻位置点,以保证后续社交圈子划分的准确性;优先选取一个办公地常驻位置点和一个居住地常驻位置点,如果选取不到,则就选取一个办公地常驻位置点、或者一个居住地常驻位置点。
例如,如果用户A的常驻位置点包括常驻位置点1、常驻位置点2、常驻位置点3时,该常驻位置点1对应的场景为办公地、常驻位置点2对应的场景为办公地、常驻位置点3对应的场景为居住地,那么可以选取常驻位置点2和常驻位置点3作为目标常驻位置点。
本实施例在确定常驻位置点的场景后,可以基于待划分用户集合中各用户常驻位置点的场景选取相应的目标用户。比如,可以先进行区域划分,然后,提取同一地理区域具有相同场景的常驻位置点。也即步骤“根据用户的该常驻位置点对应的场景,从该待划分用户集合中选取相应的目标用户”可以包括:
在预设圈子划分平面上对地理位置进行区域划分;
确定至少一种目标场景,并确定在同一地理区域具有相同场景的常驻位置点;
从该待划分用户集合中选取在同一地理区域具有相同场景的常驻位置点的用户作为所述目标场景对应的目标用户,得到该地理区域内所述目标场景对应的目标用户集合。
该预设圈子划分平面可以为与前述预设平面为相同平面,比如,将预设平面出非常驻位置点删除,既可以得到预设圈子划分平面。
其中,地理位置划分的方式可以有多种,比如,一是在平面上将地理位置划分为固定大小方格表示的区域(如250m*250m的方格);二是根据行政划分将地理位置划分为多个区域,例如城市里的每个区或者每个街道,可被当作一个区域。
在进行区域划分之后,可以确定至一种或多种目标场景,并确定同一地理区域内具有相同目标场景的常驻位置点,然后,选取同一地理区域内具有相同场景的常驻位置点的用户作为目标用户。比如,以确定一种目标场景为例,在某个地理区域内,用户A的常驻位置点1对应的场景为办公地,用户B的常驻位置点2对应的场景为居住地、用户C的常驻位置点3对应的场景为办公地,用户D的常驻位置点4对应的场景为居住地,那么当目标场景为办公地时,可以确定常驻位置点1和常驻位置点3具有相同场景即办公地,然后,可以选取场景为办公地的用户A和用户C作为目标用户,得到该地理区域内办公地对应的目标用户集合(用户A、用户C);当目标场景为居住地时,。可以选取用户B和用户D作为目标用户,该地理区域内居住地对应的目标用户集合(用户B、用户D)。
又比如,以确定两种目标场景为例,某个地理区域内,用户A的常驻位置点1对应的场景为办公地,用户B的常驻位置点2对应的场景为居住地、用户C的常驻位置点3对应的场景为办公地,用户B的常驻位置点4对应的场景为居住地;那么此时,可以选取场景为办公地的用户A和用户C作为办公地对应的目标用户,选取场景为居住地的用户B和用户D作为居住地对应的目标用户。此时,可以得到该地理区域内办公地对应的目标用户集合(用户A、用户C)、以及该地理区域内居住地对应的目标用户集合(用户B、用户D)。
在进行区域划分之后,本实施例需要在地理区域内构建局部的社交网络,首先将在同一区域中具有同类型常驻点的用户提取出来,再提取他们之间的社交关系形成局部社交网络。例如,可以将办公地位于同一区域的用户提取出来,又例如,可以将居住地位于同一区域的用户提取出来。本实施例,可以针对每个区域提取具有相同场景常驻位置点的用户,得到该区域对应的目标用户集合,一个区域可以对应至少一个目标用户集合,当存在多个区域时,可以得到多个目标用户集合。比如,对于某个地理区域,可以提取场景为办公地的常驻位置点所对应的用户,形成一个目标用户集合;或者,提取场景为居住地的常驻位置点所对应的用户,形成一个目标用户集合。实际应用中,提取何种场景可以根据社交圈子划分的实际目的或者需求相关,比如,如果需要划分工作圈子,那么可以提取场景为办公地的常驻位置点所对应的用户;如果需要划分生活圈子,那么可以提取场景为居住地的常驻位置点所对应的用户;如果需要划分工作圈子和生活圈子,那么可以提取场景为办公地的常驻位置点所对应的用户,形成一个目标用户集合,并且提取场景为居住地的常驻位置点所对应的用户,形成另一个目标用户集合。
103、提取目标用户集合中用户之间的社交关系。
其中,社交关系可以包括在社交平台上用户之间的好友关系。
104、根据该目标用户集合和该社交关系构造局部社交网络,该局部社交网络包括代表用户的网络节点。
比如,可以将目标用户集合内用户作为网络的节点,用户之间的好友关系作为网络的边,形成一个局部社交网络。
当存在多个目标用户集合时,可以针对每个目标用户集合提取用户自己的社交关系,然后,构建每个区域对应的局部社交网络。
例如,参考图1c,在区域划分后,针对某个地理区域S,可以从位于地理区域S内的所有常驻位置点中确定场景为办公地的常驻位置点,然后,提取该常驻位置点的用户,得到目标用户集合,如用户A、用户B、用户C、用户D、用户E,然后,提取用户之间的好友关系,将用户作为网络节点(如将用户A作为节点a、用户B作为节点b),并将好友关系作为网络的边,即网络节点之间的连线,以构造成图1c所示的局部社交网络。
105、对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子。
在构造各区域对应的局部社交网络后,可以针对每个局部社交网络进行社交团体划分。具体地,划分方式也即步骤“、对该局部社交网络中网络节点进行社交圈子划分”可以包括:
将局部社交网络中各网络节点划分到不同的社交团体;
针对局部社交网络中每个网络节点,获取将网络节点移动到邻居节点所在的社交团体时,该局部社交网络的模块度变化值;
按照模块度变化值最大原则,将相应的网络节点移动到目标邻居节点所在的社交团体,得到经过节点移动后的社交团体;
将属于同一社交团体的用户划分到同一个社交圈子。
比如,将网络中所有网络节点划分到不同的社交团体中,顺序对所有节点,判断将其移动到邻居节点所在的社团带来的模块度变化,取模块度增加最多的方式将节点移动到邻居所处社团,若模块度增加不为正,则不作移动。顺序对每个节点进行类似的操作,直至模块度不再增加。得到初步的社交团体划分结果。
其中,模块度变化值可以通过以下公式得到(以节点i移动到社交团体C为例):
其中,∑in为社团C内部的边权重之和,∑tot为连向C中节点的所有边的权重之和,ki,in为i与C的内部节点之间所有边的权重之和,ki为i的所有边权重之和,m为网络中所有边的权重之和。
例如,以图1c所示的局部社交网络为例,参考图1d,首先将网络节点a至网络节点e划分到不同社交团体,得到社交团体1、社交团体2、……社交团体5;然后,可以分别计算将节点a移动到邻居节点b所在的社交团体2、邻居节点c所在的社交圈值3时,局部社交网络的模块度变化△Q1、△Q2;若△Q1、△Q2均小于零,则不移动;若△Q1、△Q2均大于零,且△Q1>△Q2,那么将节点a移动到社交团体2中,此时,社交团体2包含节点a和节点b。
接着,将获取将节点c移动到邻居节点d所在的社交团体4、邻居节点e所在的社交团体5时,局部社交网络的模块度变化△Q3、△Q4;若△Q3、△Q4均小于零,则不移动;若△Q3、△Q4均大于零,且△Q3<△Q4,那么将节点c移动到节点e所在的社交团体5中,此时,社交团体5包含节点e和节点c。
经过上述圈子合并后,可以得到合并后的局部社交网络,以及该网络节点所属的社交团体,参考图1e。
可选地,为能够提高社交圈子的覆盖范围以及划分的精确性,本实施例方法在经过节点移动的初步团体划分后,还可以再次进行团体划分,比如,可以将上述得到社交团体作为一个节点,构建新的局部社交网络,及更新局部社交网络,然后,重复上述节点移动的方式对更新后的局部社交网络进行团体划分。也即本实施例方法在得到经过节点移动后的社交团体之后,将属于同一社交团体的用户划分到同一个社交圈子之前,还可以包括:
将用户所属的社交团体作为一个网络节点,以更新该局部社交网络;
返回执行针对局部社交网络中每个网络节点,获取将网络节点移动到邻居节点所在的社交团体时,该局部社交网络的模块度变化值的步骤,直到不再更新局部社交网络为止。
比如,在图1e所示的社交网络中,可以将社交团体2作为一个网络节点a’、将社交团体4作为一个网络节点b’、将社交团体5作为一个网络节点c’,然后,构造新的局部社交网络,参考图1f。针对图1f所示的局部社交网络中网络节点,可以获取将网络节点移动到邻居节点所在的社交团体时,该局部社交网络的模块度变化值,按照模块度变化值最大原则,将相应的网络节点移动到目标邻居节点所在的社交团体。比如,参考图1g,再次进行社团划分之后,可以得到包含节点a和节点b的社交团体2,包含节点c、节点d、节点e的社交团体5。最后。那么用户A和用户B划分到同一社交圈子,将用户C、用户D和用户E划分到同一个社交圈子。
为了提高挖掘的覆盖度,更完整地挖掘圈子的成员,可选地,可以基于网络地址如IP,将一些未划分的用户补充到相应的工作圈子中。也即,当用户所属的社交圈子包括工作圈子;本实施例的生成方法还包括:
获取待划分用户集合中用户登录社交平台的网络地址,得到地址集合;
从该地址集合中选取目标工作圈子的公司网络地址;
获取未划分社交圈子的用户登录该公司网络地址的登录次数;
当该登录次数大于预设次数时,将未划分社交圈子的用户划分到该目标工作圈子。
比如,统计各用户登录社交平台的IP地址,然后,从IP地址中选取工作圈子的公司IP,然后,获取未划分社交圈子的用户登录该公司IP的登录次数,若超过阈值N5,则将该用户划分到该工作圈子。又比如,还可以将在工作时段登录目标工作圈子的公司IP的次数超过N5的用户挑选出来,划分到该目标圈子中。
在实际应用中,若某用户登录多个圈子的公司IP次数均超过阈值N5,将该用户划分到登录次数最多的圈子。
其中,步骤“从该地址集合中选取目标工作圈子的公司网络地址”可以包括:
从该地址集合中选取可能作为公司网络地址的候选网络地址;
获取该目标工作圈子中用户登录该候选网络地址的登录比例;
当登录比例大于预设比例时,确定该候选网络地址为该目标工作圈子的公司网络地址。
为了提高社交圈子的准确性,本实施例可以选取用户数量比较多的工作圈子作补充挖掘,不考虑用户数量较少的工作圈。因为,对于用户数小于阈值N3的工作圈子,由于人数较少,可能对应是较小的公司,没有相应的专有IP,为保证准确率,不作处理。也即,步骤“获取该目标工作圈子中用户登录该候选网络地址的登录比例”可以包括:
从工作圈子中选取用户数量超过第一预设阈值的工作圈子作为目标工作圈子;
获取该目标工作圈子中用户登录该候选网络地址的登录比例。
可选地,步骤“从该地址集合中选取可能作为公司网络地址的候选网络地址”可以包括:
获取该网络地址对应的登录用户数量、以及登录用户所属工作圈子的圈子数量;
当该登录用户数量大于第二预设阈值,或者该圈子数量大于第三预设阈值时,将该网络地址作为公用网络地址;
将该地址集合中除了公用网络地址以外的网络地址作为候选网络地址。
在统计各用户的登录IP之后,可以针对每个IP,获取该IP的登录用户数,及该IP的登录用户所属的工作圈子数量。其中,登录用户数超过阈值N1或者工作圈子数超过阈值N2的IP,将被当作公用IP,不用于扩散。剩下部分,作为扩散的候选IP,即候选网络地址。
例如,经过社交圈子划分可以得到工作圈子1、工作圈子2以及未被划分用户D,那么,可以获取工作圈子1的公司IP1和工作圈子2的公司IP2,然后,获取用户D在工作时段登录公司IP1的次数,以及登录公司IP2次数,若登录公司IP1的次数和登录公司IP2次数均超过阈值N5时,那么可以将该用户D划分到次数较大的工作圈子,如工作圈子。当登录公司IP1的次数超过阈值N5,登录公司IP2次数没有超过阈值N5,那么此时可以将该用户D划分到工作圈子1。
由上可知,本发明实施例采用获取待划分用户集合中用户访问社交平台时的常驻地理位置,然后,根据该常驻地理位置从该待划分用户集合中选取相应的目标用户,得到目标用户集合,提取目标用户集合中用户之间的社交关系,根据该目标用户集合和该社交关系构造局部社交网络,该局部社交网络包括代表用户的网络节点,对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子;由于该方案可以结合用户间的社交关系和用户的常驻地理位置进行社交圈子划分,因此,可以扩大社交圈子的覆盖范围,减小数据计算量,提升社交圈子划分的精确性。
此外,由于地理位置、时间等信息可以较好地反映用户的线下生活,社交网络则反映用户间的关系,地理位置书与社交网络结合,可对线上形成的关系进行有针对性的筛选,筛选出质量较高的社交关系,根据这些关系挖掘用户所处的社交圈子,提高了社交圈子的质量。
实施例二、
根据实施例一所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该社交圈子的生成装置具体集成在服务器中为例进行说明。
如图2a所示,本实施例提供了一种社交圈子划分系统,该系统包括服务器以及多个用户的终端,服务器与终端之间可通过网络连接。终端上报用户登录社交平台的多个地理位置,服务器根据地理位置在预设平面上绘制相应的位置点,服务器从位置点中选取该用户的常驻位置点,这样服务器即可得到各用户的常驻位置点,然后,服务器基于各用户的常驻位置点进行社交圈子划分。
如图2b所示,一种社交圈子的生成方法,具体流程可以如下:
201、终端向服务器上报用户登录社交平台的地理位置。
其中,地理位置包括经度和纬度等信息。
比如,某个用户的终端上报了该用户访问社交平台的M(M大于1,且为正整数)个地理位置。
202、服务器根据上报的该地理位置在预设平面上绘制相应的位置点。
比如,服务器以在预设平面上绘制M个位置点,一个位置点对应一个地理位置。
203、服务器从该位置点中选取用户的常驻位置点。
比如,服务器从M个位置点中选取用户的常驻位置点。
具体地,可以基于位置点之间的距离来确定常驻位置点。比如,针对某个用户,服务器可以根据该预设平面中位置点之间的距离以及预设距离阈值,对位置点进行归类,根据该预设平面中位置点之间的距离以及预设距离阈值,对位置点进行归类,然后,从该候选常驻位置点集合中选取一个位置点作为该类位置点的常驻位置代表点,得到用户的常驻位置点。
例如,针对某个用户,可以随机从该用户的所有位置点中抽取一个位置点作为起始点,计算其他位置点到它的距离,若其它所有位置到该位置的距离均大于预设距离阈值dist,则确定该位置点为离群点,定义为噪声;若存在到该位置点距离不超过dist的其它位置点,则将这些位置归到同一类,将到该位置点距离不超过dist的其它位置点加入到起始位置点对应的位置点集合中。对新加入的位置重复前述操作,直至无新位置点加入。具体地,常驻位置点的选取可以参考实施例一相关描述,此处不再赘述。
204、服务器确定用户的常驻位置点对应的场景,该场景包括办公地或者居住地。
比如,可以获取用户的常驻位置点在工作时段和下班时段的访问频率,根据该访问频率确定该常驻位置点对应的场景。
实际应用中,可以将工作日0到23点、周末及节假日0到23点,划分为工作及下班两类时段。
该访问频率包括:一定时间段内用户A的常驻位置点在工作时段和下班时段的访问频率。如可以包括:一个月内用户A在常驻位置点1对应的地理位置上,且在工作时段访问社交平台的访问频率。
优选地,该访问频率包括:在预定天数内用户的常驻位置点在预设类型时段(如工作时段、下班时段)的登录天数与预设天数的比例,在预定天数内用户的常驻位置点下班时段的登录天数与预设天数的比例。
其中,可以获取常驻位置点访问社交平台的登录时间,然后,根据该登录时间和预设类型时间获取访问频率。该访问时间可以由终端在上报地理位置时上报,也即终端上报用户的多个地理位置以及地理位置对应的登录时间信息。比如,终端上报多个LBS数据,该LBS数据包含地理位置以及当前登录时间信息。
205、服务器根据常驻位置点对应的场景,从用户的常驻位置点中选取用户的目标常驻位置点。
为了提高社交圈子挖掘或者划分的质量和精确性,当场景包括办公地、居住地时,针对每个用户,可以选取一个场景为办公地的常驻位置点、和/或一个场景为居住地的常驻位置点,以保证后续社交圈子划分的准确性。
例如,如果用户A的常驻位置点包括常驻位置点1、常驻位置点2、常驻位置点3时,该常驻位置点1对应的场景为办公地、常驻位置点2对应的场景为居住地、常驻位置点3对应的场景为居住地,那么可以选取常驻位置点1和常驻位置点2作为目标常驻位置点,如果用户A的常驻位置点包括场景为办公地常驻位置点1、场景为办公地的常驻位置点2,那么可以选取一个办公地的常驻位置点。
206、服务器在预设圈子划分平面上绘制各用户的目标常驻位置点,并在预设圈子划分平面上对地理位置进行区域划分。
其中,地理位置划分的方式可以有多种,比如,一是在平面上将地理位置划分为固定大小方格表示的区域(如250m*250m的方格);二是根据行政划分将地理位置划分为多个区域,例如城市里的每个区或者每个街道,可被当作一个区域。
207、对于每个地理区域,服务器提取该地理区域中具有相同目标场景的常驻位置点对应的用户,得到每个地理区域内目标场景对应的目标用户集合。
比如,对于某个地理区域,可以提取场景均为办公地或者居住地的常驻位置点对应的用户,得到地理区域内办公地或者居住地对应的目标用户集合;又比如,可以分别提取场景均为办公地的常驻位置点对应的用户,得到地理区域内办公地对应的目标用户集合,以及提取场景均为居住地的常驻位置点对应的用户,得到地理区域内居住地对应的目标用户集合。
208、服务器提取目标用户集合中用户之间的好友关系,并根据目标用户集合和用户之间的好友关系构造地理区域对应的局部社交网络。
比如,可以将目标用户集合内用户作为网络的节点,用户自己的好友关系作为网络的边(即节点间的连线),形成一个局部社交网络。其中,局部社交网络包括若干网络节点,节点之间可通过连线连接。
当存在多个地理区域时,可以得到多个目标用户集合,然后,构造每个地理区域对应的局部社交网络。
209、对于每个地理区域对应的局部社交网络,服务器可以对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子。
比如,可以对区域内的社交网络划分圈子,使得关系紧密的用户属于同一圈子,且关系稀疏的用户属于不同圈子。可以采用fast unfolding算法实现:
第一阶段:
将该地理区域对应的局部社交网络中各网络节点划分到不同的社交团体;
针对局部社交网络中每个网络节点,获取将网络节点移动到邻居节点所在的社交团体时,该局部社交网络的模块度变化值;
按照模块度变化值最大原则,将相应的网络节点移动到目标邻居节点所在的社交团体,得到经过节点移动后的社交团体。
其中,模块度变化值可以通过以下公式得到(以节点i移动到社交团体C为例):
其中,∑in为社团C内部的边权重之和,∑tot为连向C中节点的所有边的权重之和,ki,in为i与C的内部节点之间所有边的权重之和,ki为i的所有边权重之和,m为网络中所有边的权重之和。
第二阶段:
将第一阶段得到社交团体作为一个节点,构建新的局部社交网络。两个社团间的边权重用他们的节点之间的边权重之和表示。社团划分过程重复进行上述两个阶段的操作,直到在第二阶段中不再进行合并的操作,得到最终的社团划分结果。
第三阶段:
属于同一社交团体的用户将被划分到同一社交圈子中。
210、服务器统计各用户的登录IP,并针对每个IP获取登录用户数,及登录用户所属的工作圈子数量。
为了提高挖掘的覆盖度,更完整地挖掘圈子的成员识别同一工作圈子的用户使用的常用IP,筛选出相应的公司IP,再将在这些IP上常登录的未被划分到具体工作圈子的用户补充到工作圈子中。由于家庭一般没有专门的出口IP,IP扩散模块不对居住圈子进行处理。
211、服务器获取登录用户数超过阈值N1或者工作圈子数超过阈值N2的IP,并将该IP作为公用IP,其余IP作为扩散的候选IP。
212、服务器确定用户数超过阈值N3的工作圈子,统计该工作圈子中的用户登录各个候选IP的比例,将登录比例超过阈值N4的IP挑选出来作为该工作圈子的公司IP。
对于用户数小于阈值N3的工作圈子,由于人数较少,可能对应是较小的公司,没有相应的专有IP,为保证准确率,不作处理。
213、服务器将在工作时段登录某工作圈子的公司IP次数超过阈值N5的用户挑选出来,划分到该工作圈子中。
若某用户登录多个圈子的公司IP次数均超过阈值N5,将该用户划分到登录次数最多的圈子。
由上可知,本发明实施例采用获取待划分用户集合中用户访问社交平台时的常驻地理位置,然后,根据该常驻地理位置从该待划分用户集合中选取相应的目标用户,得到目标用户集合,提取目标用户集合中用户之间的社交关系,根据该目标用户集合和该社交关系构造局部社交网络,该局部社交网络包括代表用户的网络节点,对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子;由于该方案可以结合用户间的社交关系和用户的常驻地理位置进行社交圈子划分,因此,可以扩大社交圈子的覆盖范围,减小数据计算量,提升社交圈子划分的精确性。
此外,由于地理位置、时间等信息可以较好地反映用户的线下生活,社交网络则反映用户间的关系,地理位置书与社交网络结合,可对线上形成的关系进行有针对性的筛选,筛选出质量较高的社交关系,根据这些关系挖掘用户所处的社交圈子,提高了社交圈子的质量。
实施例三、
为了更好地实施以上方法,本发明实施例还提供社交圈子的生成装置,如图3a所示,该社交圈子的生成装置包括位置获取单元301、用户选取单元302、关系提取单元303、网络构造单元304和圈子划分单元305,如下:
(1)位置获取单元301;
位置获取单元301,用于获取待划分用户集合中用户访问社交平台的常驻地理位置。
其中,常驻地理位置指的是用户在一定时间段内访问社交平台的常用或者固定地理位置。比如,可以是用户在一定时间段内登录社交平台的常用或者固定登录地理位置。实际应用中,该常驻地理位置可以是在一定时间段登录社交平台的登录次数超过一定数量的登录地理位置,等等。
常驻地理位置获取的方式有多种,比如,该位置获取单元301,可以包括:
地理位置获取子单元,用于获取终端上报的待划分用户集合中用户访问社交平台的多个地理位置;
绘制子单元,用于根据该地理位置在预设平面上绘制相应的位置点;
常驻点选取子单元,用于从该位置点中选取用户的常驻位置点,该常驻位置点代表用户访问社交平台时的常驻地理位置。
其中,常驻点选取子单元可以具体用于:
根据该预设平面中位置点之间的距离以及预设距离阈值,对位置点进行归类;
将属于同一类的位置点作为该用户的一种候选常驻位置点,得到相应的候选常驻位置点集合;
从该候选常驻位置点集合中选取一个位置点作为该类位置点的常驻位置代表点,得到用户的常驻位置点。
比如,常驻点选取子单元归类的过程可以包括:
从未归类的位置点中选取一个起始位置点;
获取该预设平面上用户的其他未归类位置点与该起始位置点之间的距离;
当存在与该起始位置点之间的距离不大于预设距离阈值的目标位置点时,将该目标位置点添加到起始位置点对应的位置点集合,以将目标位置点与该起始位置点归为同一类;
在该位置点集合中选取新加入的位置点更新该起始位置点;并返回执行获取该预设平面上用户的其他未归类位置点与该起始位置点之间的距离的步骤,直到没有新位置点加入该位置点集合时停止。
(2)用户选取单元302;
用户选取单元302,用于根据该常驻地理位置从该待划分用户集合中选取相应的目标用户,得到目标用户集合。
比如,用户选取单元302可以用于根据用户的常驻位置点从该待划分用户集合中选取相应的目标用户,得到目标用户集合。
其中,用户选取单元302,可以包括:
场景确定子单元,用于确定用户的该常驻位置点对应的场景;
用户选取子单元,用于根据用户的该常驻位置点对应的场景,从该待划分用户集合中选取相应的目标用户,得到目标用户集合。
其中,为提高圈子划分的精确性,用户选取子单元,可以用于:
根据用户的该常驻位置点对应的场景,从用户的常驻位置点中选取相应的目标常驻位置点;
根据用户的目标常驻位置点对应的场景,从该待划分用户集合中选取相应的目标用户。
其中,场景确定子单元,用于:
获取用户的常驻位置点在预设类型时段的访问频率;
根据该访问频率确定该常驻位置点对应的场景。
比如场景确定子单元,可以具有用于:
获取用户的常驻位置点在工作时段和下班时段访问该社交平台的访问频率;根据该常驻位置点在工作时段和下班时段的访问频率,确定该常驻位置点对应的场景是居住地还是办公地。
其中,用户选择子单元,具体用于:
在该预设圈子划分平面上对地理位置进行区域划分;
确定至少一种目标场景,并确定在同一地理区域具有相同所述目标场景的常驻位置点;
从该待划分用户集合中选取在同一地理区域具有相同所述目标场景的常驻位置点的用户作为所述目标场景对应的目标用户,得到该地理区域内所述目标场景对应的目标用户集合。
(3)关系提取单元303;
关系提取单元303,用于提取目标用户集合中用户之间的社交关系。
其中,社交关系可以包括在社交平台上用户之间的好友关系。
(4)网络构造单元304;
网络构造单元304,用于根据该目标用户集合和该社交关系构造局部社交网络,该局部社交网络包括代表用户的网络节点。
比如,可以将目标用户集合内用户作为网络的节点,用户之间的好友关系作为网络的边,形成一个局部社交网络。
(5)圈子划分单元305;
圈子划分单元305,用于对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子。
比如,圈子划分单元305可以用于:
将局部社交网络中各网络节点划分到不同的社交团体;
针对局部社交网络中每个网络节点,获取将网络节点移动到邻居节点所在的社交团体时,该局部社交网络的模块度变化值;
按照模块度变化值最大原则,将相应的网络节点移动到目标邻居节点所在的社交团体,得到经过节点移动后的社交团体;
将属于同一社交团体的用户划分到同一个社交圈子。
可选地,为提高圈子覆盖范围,该圈子划分单元305还用于在得到经过节点移动后的社交团体之后,将属于同一社交团体的用户划分到同一个社交圈子之前,将用户所属的社交团体作为一个网络节点,以更新该局部社交网络;
返回执行针对局部社交网络中每个网络节点,获取将网络节点移动到邻居节点所在的社交团体时,该局部社交网络的模块度变化值的步骤,直到不再更新局部社交网络为止。
可选地,为提高圈子划分的覆盖范围和准确性,参考图3b,当用户所属的社交圈子包括工作圈子;本实施例生成装置还可以包括:
地址获取单元306,用于获取待划分用户集合中用户登录社交平台的网络地址,得到地址集合;
公司地址获取单元307,用于从该地址集合中选取目标工作圈子的公司网络地址;
登录次数获取单元308,用于获取未划分社交圈子的用户登录该公司网络地址的登录次数;
补充划分单元309,用于当该登录次数大于预设次数时,将未划分社交圈子的用户划分到该目标工作圈子。
其中,公司地址获取单元307,可以包括:
地址选取子单元,用于从该地址集合中选取可能作为公司网络地址的候选网络地址;
登录比例获取子单元,用于获取该目标工作圈子中用户登录该候选网络地址的登录比例;
公司地址获取子单元,用于当登录比例大于预设比例时,确定该候选网络地址为该目标工作圈子的公司网络地址。
比如,登录比例获取子单元,可以用于从工作圈子中选取用户数量超过第一预设阈值的工作圈子作为目标工作圈子;获取该目标工作圈子中用户登录该候选网络地址的登录比例。
又比如,地址选取子单元,可以用于:获取该网络地址对应的登录用户数量、以及登录用户所属工作圈子的圈子数量;
当该登录用户数量大于第二预设阈值,或者该圈子数量大于第三预设阈值时,将该网络地址作为公用网络地址;
将该地址集合中除了公用网络地址以外的网络地址作为候选网络地址。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
该社交圈子的生成装置具体可以集成在服务器中。
由上可知,本实施例的社交圈子的生成装置采用位置获取单元301获取待划分用户集合中用户访问社交平台时的常驻地理位置,然后,由用户选取单元302根据该常驻地理位置从该待划分用户集合中选取相应的目标用户,得到目标用户集合,由关系提取单元303提取目标用户集合中用户之间的社交关系,由网络构造单元304根据该目标用户集合和该社交关系构造局部社交网络,该局部社交网络包括代表用户的网络节点,由圈子划分单元305对该局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子;由于该方案可以结合用户间的社交关系和用户的常驻地理位置进行社交圈子划分,因此,可以扩大社交圈子的覆盖范围,减小数据计算量,提升社交圈子划分的精确性。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、磁盘或光盘等。
以上对本发明实施例所提供的一种社交圈子的生成方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (24)

1.一种社交圈子的生成方法,其特征在于,包括:
获取待划分用户集合中用户访问社交平台的常驻地理位置;
根据所述常驻地理位置从所述待划分用户集合中选取相应的目标用户,得到目标用户集合;
提取目标用户集合中用户之间的社交关系;
根据所述目标用户集合和所述社交关系构造局部社交网络,所述局部社交网络包括代表用户的网络节点;
对所述局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子。
2.如权利要求1所述的生成方法,其特征在于,获取待划分用户集合中用户访问社交平台的常驻地理位置,包括:
获取终端上报的待划分用户集合中用户访问社交平台的多个地理位置;
根据所述地理位置在预设平面上绘制相应的位置点;
从所述位置点中选取用户的常驻位置点,所述常驻位置点代表用户访问社交平台时的常驻地理位置;
根据所述常驻地理位置从所述待划分用户集合中选取相应的目标用户,包括:根据用户的常驻位置点从所述待划分用户集合中选取相应的目标用户。
3.如权利要求2所述的生成方法,其特征在于,从所述位置点中选取用户的常驻位置点,包括:
根据所述预设平面中位置点之间的距离以及预设距离阈值,对位置点进行归类;
将属于同一类的位置点作为所述用户的一种候选常驻位置点,得到相应的候选常驻位置点集合;
从所述候选常驻位置点集合中选取一个位置点作为该类位置点的常驻位置代表点,得到用户的常驻位置点。
4.如权利要求2所述的生成方法,其特征在于,根据用户的常驻位置点从所述待划分用户集合中选取相应的目标用户,包括:
确定用户的所述常驻位置点对应的场景;
根据用户的所述常驻位置点对应的场景,从所述待划分用户集合中选取相应的目标用户。
5.如权利要求4所述的生成方法,其特征在于,所述根据用户的所述常驻位置点对应的场景,从所述待划分用户集合中选取相应的目标用户,包括:
根据用户的所述常驻位置点对应的场景,从用户的常驻位置点中选取相应的目标常驻位置点;
根据用户的目标常驻位置点对应的场景,从所述待划分用户集合中选取相应的目标用户。
6.如权利要求4所述的生成方法,其特征在于,确定用户的所述常驻位置点对应的场景,包括:
获取用户的常驻位置点在预设类型时段的访问频率;
根据所述访问频率确定所述常驻位置点对应的场景。
7.如权利要求6所述的生成方法,其特征在于,
获取用户的常驻位置点在预设类型时段内的访问频率,包括:获取用户的常驻位置点在工作时段和下班时段访问所述社交平台的访问频率;
根据所述访问频率确定所述常驻位置点对应的场景,包括:根据所述常驻位置点在工作时段和下班时段的访问频率,确定所述常驻位置点对应的场景是居住地还是办公地。
8.如权利要求3所述的生成方法,其特征在于,根据所述预设平面中位置点之间的距离以及预设距离阈值,对位置点进行归类,包括:
从未归类的位置点中选取一个起始位置点;
获取所述预设平面上用户的其他未归类位置点与所述起始位置点之间的距离;
当存在与所述起始位置点之间的距离不大于预设距离阈值的目标位置点时,将所述目标位置点添加到起始位置点对应的位置点集合,以将目标位置点与所述起始位置点归为同一类;
在所述位置点集合中选取新加入的位置点更新所述起始位置点;并返回执行获取所述预设平面上用户的其他未归类位置点与所述起始位置点之间的距离的步骤,直到没有新位置点加入所述位置点集合时停止。
9.如权利要求4所述的生成方法,其特征在于,根据用户的所述常驻位置点对应的场景,从所述待划分用户集合中选取相应的目标用户,包括:
在所述预设圈子划分平面上对地理位置进行区域划分;
确定至少一种目标场景,并确定在同一地理区域具有相同所述目标场景的常驻位置点;
从所述待划分用户集合中选取在同一地理区域具有相同所述目标场景的常驻位置点的用户作为所述目标场景对应的目标用户,得到该地理区域内所述目标场景对应的目标用户集合。
10.如权利要求2-9任一项所述的生成方法,其特征在于,对所述局部社交网络中网络节点进行社交圈子划分,包括:
将局部社交网络中各网络节点划分到不同的社交团体;
针对局部社交网络中每个网络节点,获取将网络节点移动到邻居节点所在的社交团体时,所述局部社交网络的模块度变化值;
按照模块度变化值最大原则,将相应的网络节点移动到目标邻居节点所在的社交团体,得到经过节点移动后的社交团体;
将属于同一社交团体的用户划分到同一个社交圈子。
11.如权利要求10所述的生成方法,其特征在于,在得到经过节点移动后的社交团体之后,将属于同一社交团体的用户划分到同一个社交圈子之前,所述生成方法还包括:
将用户所属的社交团体作为一个网络节点,以更新所述局部社交网络;
返回执行针对局部社交网络中每个网络节点,获取将网络节点移动到邻居节点所在的社交团体时,所述局部社交网络的模块度变化值的步骤,直到不再更新局部社交网络为止。
12.如权利要求1-8任一项所述的生成方法,其特征在于,用户所属的社交圈子包括工作圈子;所述生成方法还包括:
获取待划分用户集合中用户登录社交平台的网络地址,得到地址集合;
从所述地址集合中选取目标工作圈子的公司网络地址;
获取未划分社交圈子的用户登录所述公司网络地址的登录次数;
当所述登录次数大于预设次数时,将未划分社交圈子的用户划分到所述目标工作圈子。
13.如权利要求12所述的生成方法,其特征在于,从所述地址集合中选取目标工作圈子的公司网络地址,包括:
从所述地址集合中选取可能作为公司网络地址的候选网络地址;
获取所述目标工作圈子中用户登录所述候选网络地址的登录比例;
当登录比例大于预设比例时,确定所述候选网络地址为所述目标工作圈子的公司网络地址。
14.如权利要求13所述的生成方法,其特征在于,获取所述目标工作圈子中用户登录所述候选网络地址的登录比例,包括:
从工作圈子中选取用户数量超过第一预设阈值的工作圈子作为目标工作圈子;
获取所述目标工作圈子中用户登录所述候选网络地址的登录比例。
15.如权利要求13所述的生成方法,其特征在于,从所述地址集合中选取可能作为公司网络地址的候选网络地址,包括:
获取所述网络地址对应的登录用户数量、以及登录用户所属工作圈子的圈子数量;
当所述登录用户数量大于第二预设阈值,或者所述圈子数量大于第三预设阈值时,将所述网络地址作为公用网络地址;
将所述地址集合中除了公用网络地址以外的网络地址作为候选网络地址。
16.一种社交圈子的生成装置,其特征在于,包括:
位置获取单元,用于获取待划分用户集合中用户访问社交平台的常驻地理位置;
用户选取单元,用于根据所述常驻地理位置从所述待划分用户集合中选取相应的目标用户,得到目标用户集合;
关系提取单元,用于提取目标用户集合中用户之间的社交关系;
网络构造单元,用于根据所述目标用户集合和所述社交关系构造局部社交网络,所述局部社交网络包括代表用户的网络节点;
圈子划分单元,用于对所述局部社交网络中网络节点进行社交圈子划分,得到用户所属的社交圈子。
17.如权利要求16所述的生成装置,其特征在于,所述位置获取单元,包括:
地理位置获取子单元,用于获取终端上报的待划分用户集合中用户访问社交平台的多个地理位置;
绘制子单元,用于根据所述地理位置在预设平面上绘制相应的位置点;
常驻点选取子单元,用于从所述位置点中选取用户的常驻位置点,所述常驻位置点代表用户访问社交平台时的常驻地理位置;
所述用户选取单元,用于根据用户的常驻位置点从所述待划分用户集合中选取相应的目标用户,得到目标用户集合。
18.如权利要求17所述的生成装置,其特征在于,所述常驻点选取子单元,用于:
根据所述预设平面中位置点之间的距离以及预设距离阈值,对位置点进行归类;
将属于同一类的位置点作为所述用户的一种候选常驻位置点,得到相应的候选常驻位置点集合;
从所述候选常驻位置点集合中选取一个位置点作为该类位置点的常驻位置代表点,得到用户的常驻位置点。
19.如权利要求17所述的生成装置,其特征在于,所述用户选取单元,包括:
场景确定子单元,用于确定用户的所述常驻位置点对应的场景;
用户选取子单元,用于根据用户的所述常驻位置点对应的场景,从所述待划分用户集合中选取相应的目标用户。
20.如权利要求19所述的生成装置,其特征在于,所述场景确定子单元,用于:
获取用户的常驻位置点在预设类型时段的访问频率;
根据所述访问频率确定所述常驻位置点对应的场景。
21.如权利要求19所述的生成装置,其特征在于,所述用户选择子单元,具体用于:
在所述预设圈子划分平面上对地理位置进行区域划分;
确定至少一种目标场景,并确定在同一地理区域具有相同所述目标场景的常驻位置点;
从所述待划分用户集合中选取在同一地理区域具有相同场景的常驻位置点的用户作为所述目标场景对应的目标用户,得到该地理区域内所述目标场景对应的目标用户集合。
22.如权利要求17-21任一项所述的生成装置,其特征在于,所述圈子划分单元,用于:
将局部社交网络中各网络节点划分到不同的社交团体;
针对局部社交网络中每个网络节点,获取将网络节点移动到邻居节点所在的社交团体时,所述局部社交网络的模块度变化值;
按照模块度变化值最大原则,将相应的网络节点移动到目标邻居节点所在的社交团体,得到经过节点移动后的社交团体;
将属于同一社交团体的用户划分到同一个社交圈子。
23.如权利要求16-21任一项所述的生成装置,其特征在于,用户所属的社交圈子包括工作圈子,所述生成装置还包括:
地址获取单元,用于获取待划分用户集合中用户登录社交平台的网络地址,得到地址集合;
公司地址获取单元,用于从所述地址集合中选取目标工作圈子的公司网络地址;
登录次数获取单元,用于获取未划分社交圈子的用户登录所述公司网络地址的登录次数;
补充划分单元,用于当所述登录次数大于预设次数时,将未划分社交圈子的用户划分到所述目标工作圈子。
24.如权利要求23所述的生成装置,其特征在于,所述公司地址获取单元,包括:
地址选取子单元,用于从所述地址集合中选取可能作为公司网络地址的候选网络地址;
登录比例获取子单元,用于获取所述目标工作圈子中用户登录所述候选网络地址的登录比例;
公司地址获取子单元,用于当登录比例大于预设比例时,确定所述候选网络地址为所述目标工作圈子的公司网络地址。
CN201710103637.7A 2017-02-24 2017-02-24 一种社交圈子的生成方法和装置 Active CN106685809B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710103637.7A CN106685809B (zh) 2017-02-24 2017-02-24 一种社交圈子的生成方法和装置
PCT/CN2018/076227 WO2018153292A1 (zh) 2017-02-24 2018-02-11 社交圈子的生成方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710103637.7A CN106685809B (zh) 2017-02-24 2017-02-24 一种社交圈子的生成方法和装置

Publications (2)

Publication Number Publication Date
CN106685809A true CN106685809A (zh) 2017-05-17
CN106685809B CN106685809B (zh) 2021-02-02

Family

ID=58861806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710103637.7A Active CN106685809B (zh) 2017-02-24 2017-02-24 一种社交圈子的生成方法和装置

Country Status (2)

Country Link
CN (1) CN106685809B (zh)
WO (1) WO2018153292A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107547633A (zh) * 2017-07-27 2018-01-05 腾讯科技(深圳)有限公司 一种用户常驻点的处理方法、装置和存储介质
WO2018153292A1 (zh) * 2017-02-24 2018-08-30 腾讯科技(深圳)有限公司 社交圈子的生成方法、装置及存储介质
CN108965110A (zh) * 2018-07-06 2018-12-07 佛山市灏金赢科技有限公司 一种好友推荐方法及装置
CN108985309A (zh) * 2017-05-31 2018-12-11 腾讯科技(深圳)有限公司 一种数据处理方法以及装置
CN110598122A (zh) * 2018-06-13 2019-12-20 百度在线网络技术(北京)有限公司 社交群体挖掘方法、装置、设备及存储介质
CN110677309A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 人群聚类方法及系统、终端以及计算机可读存储介质
CN111222056A (zh) * 2018-11-26 2020-06-02 中国移动通信集团重庆有限公司 相关用户的匹配方法、装置、设备和介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641917A (zh) * 2020-05-11 2021-11-12 杭州海康威视数字技术股份有限公司 关系获取方法及装置
CN114501420A (zh) * 2022-03-06 2022-05-13 北京工业大学 一种利用手机信令数据识别家庭关系的方法
CN115190110B (zh) * 2022-07-18 2024-01-09 北京抖音信息服务有限公司 一种地理位置确定方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103686617A (zh) * 2013-12-23 2014-03-26 百度在线网络技术(北京)有限公司 创建即时通讯群组的方法及装置
US20140358912A1 (en) * 2013-05-29 2014-12-04 International Business Machines Corporation Identifying Event-Specific Social Discussion Threads
US20150188875A1 (en) * 2013-12-31 2015-07-02 Google Inc. Systems and methods for throttling display of electronic messages
CN106095843A (zh) * 2016-06-02 2016-11-09 腾讯科技(深圳)有限公司 社交账号挖掘方法及装置
CN106327345A (zh) * 2016-09-12 2017-01-11 电子科技大学 一种基于多网络模块度的社团发现方法
CN106373013A (zh) * 2016-08-24 2017-02-01 重庆大学 协作标准调整方法和协作标准调整装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106685809B (zh) * 2017-02-24 2021-02-02 腾讯科技(深圳)有限公司 一种社交圈子的生成方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140358912A1 (en) * 2013-05-29 2014-12-04 International Business Machines Corporation Identifying Event-Specific Social Discussion Threads
CN103686617A (zh) * 2013-12-23 2014-03-26 百度在线网络技术(北京)有限公司 创建即时通讯群组的方法及装置
US20150188875A1 (en) * 2013-12-31 2015-07-02 Google Inc. Systems and methods for throttling display of electronic messages
CN106095843A (zh) * 2016-06-02 2016-11-09 腾讯科技(深圳)有限公司 社交账号挖掘方法及装置
CN106373013A (zh) * 2016-08-24 2017-02-01 重庆大学 协作标准调整方法和协作标准调整装置
CN106327345A (zh) * 2016-09-12 2017-01-11 电子科技大学 一种基于多网络模块度的社团发现方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018153292A1 (zh) * 2017-02-24 2018-08-30 腾讯科技(深圳)有限公司 社交圈子的生成方法、装置及存储介质
CN108985309A (zh) * 2017-05-31 2018-12-11 腾讯科技(深圳)有限公司 一种数据处理方法以及装置
CN108985309B (zh) * 2017-05-31 2022-11-29 腾讯科技(深圳)有限公司 一种数据处理方法以及装置
CN107547633A (zh) * 2017-07-27 2018-01-05 腾讯科技(深圳)有限公司 一种用户常驻点的处理方法、装置和存储介质
CN107547633B (zh) * 2017-07-27 2021-09-03 腾讯科技(深圳)有限公司 一种用户常驻点的处理方法、装置和存储介质
CN110598122A (zh) * 2018-06-13 2019-12-20 百度在线网络技术(北京)有限公司 社交群体挖掘方法、装置、设备及存储介质
CN110598122B (zh) * 2018-06-13 2022-04-01 百度在线网络技术(北京)有限公司 社交群体挖掘方法、装置、设备及存储介质
CN110677309A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 人群聚类方法及系统、终端以及计算机可读存储介质
CN108965110A (zh) * 2018-07-06 2018-12-07 佛山市灏金赢科技有限公司 一种好友推荐方法及装置
CN111222056A (zh) * 2018-11-26 2020-06-02 中国移动通信集团重庆有限公司 相关用户的匹配方法、装置、设备和介质
CN111222056B (zh) * 2018-11-26 2023-07-25 中国移动通信集团重庆有限公司 相关用户的匹配方法、装置、设备和介质

Also Published As

Publication number Publication date
CN106685809B (zh) 2021-02-02
WO2018153292A1 (zh) 2018-08-30

Similar Documents

Publication Publication Date Title
CN106685809A (zh) 一种社交圈子的生成方法和装置
Blondel et al. A survey of results on mobile phone datasets analysis
CN101990003B (zh) 一种基于ip地址属性的用户行为监控系统与方法
Pappalardo et al. Human mobility modelling: exploration and preferential return meet the gravity model
Huck et al. Comparison of two sampling protocols and four home‐range estimators using radio‐tracking data from urban badgers Meles meles
CN112217675B (zh) 固、移通讯网络大数据联合分析方法
CN106570014A (zh) 用于确定用户的家庭属性信息的方法与设备
Pailes Social network analysis of Early Classic Hohokam corporate group inequality
CN109120465A (zh) 基于模体的目标区域网络拓扑划分方法
CN108809697A (zh) 基于影响力最大化的社交网络关键节点识别方法及系统
Hristova et al. Mapping community engagement with urban crowd-sourcing
CN108777866A (zh) 一种网络分析方法、服务器及网络系统
Soltani et al. Spatial Configuration and Density How Building Density Affects Spatial Arrangement of a Neighbourhood
Girardello et al. Identifying important areas for butterfly conservation in Italy
Kickert et al. Surveying density, urban characteristics, and development capacity of station areas in the Delta Metropolis
Lefulebe et al. Exploring the potential for geographical knowledge systems in upgrading informal settlements in Cape Town
Atiencia et al. Spatio-temporal analysis: Using instagram posts to characterize urban point-of-interest
CN106021441A (zh) 一种机构好友推荐方法和系统
Boitani et al. Potential range and corridors for brown bears in the Eastern Alps, Italy
Bailey et al. Insights and Policy Implications from a Harmonized Earth Observation Approach to Urban Air Quality
Tastevin et al. Characterizing and modeling the distance of mobile calls: A metropolitan case study
KR102374342B1 (ko) 음식물쓰레기 관리 지원 장치 및 방법
CN105025059B (zh) 位置信息服务系统
Baratchi An Intelligent Tree Planning Approach Using Location-Based Social Networks Data
Openshaw et al. Forecasting global climatic change impacts on Mediterranean agricultural land use in the 21st Century

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant