CN103838831B - 一种基于社区划分的在线社交网络海量数据存储方法 - Google Patents

一种基于社区划分的在线社交网络海量数据存储方法 Download PDF

Info

Publication number
CN103838831B
CN103838831B CN201410058324.0A CN201410058324A CN103838831B CN 103838831 B CN103838831 B CN 103838831B CN 201410058324 A CN201410058324 A CN 201410058324A CN 103838831 B CN103838831 B CN 103838831B
Authority
CN
China
Prior art keywords
node
community
user
network
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410058324.0A
Other languages
English (en)
Other versions
CN103838831A (zh
Inventor
蒋嶷川
陈昭娣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201410058324.0A priority Critical patent/CN103838831B/zh
Publication of CN103838831A publication Critical patent/CN103838831A/zh
Application granted granted Critical
Publication of CN103838831B publication Critical patent/CN103838831B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于社区划分的在线社交网络海量数据存储方法,从社交网络的图结构出发,首先根据节点度大小将网络分成名人用户层和普通用户层,再对每一层利用模块度优化的方法进行社区划分。设计一种小集团结伴策略对初始网络进行预处理,形成一个超网,采用边权重优先方案逐步合并超节点以提高模块度。社区划分完成之后,优先存储普通用户数据,将同一社区的用户数据存储在相同服务器节点上,对于名人用户数据优先考虑选择存放在粉丝最多的服务器,其次考虑存放在自身社区所在的服务器节点。设计名人用户数据多副本存储,以减少单台服务器的负载。利用社区划分方法存储社交网络数据,可以提高访问的局部性,减少通信耗费。

Description

一种基于社区划分的在线社交网络海量数据存储方法
技术领域
本发明涉及一种数据存储方法,具体涉及一种基于社区划分的在线社交网络海量数据存储方法。
背景技术
以用户创造内容为主的Web2.0已经渗透到人们日常生活的方方面面,大量在线社交网站迅速兴起,国外的如Facebook、Twitter,国内的如微博、人人网等已经成为人们分享和获取信息的主要平台。人们通过社交网络互动交流,产生的数据和访问规模呈爆炸式增长,给数据的存储和管理带来严峻挑战。
目前网站的架构中基本采用传统的分布式存储方案,如哈希、一致性散列等技术。例如Twitter使用Gizzard,通过将特定范围的数据映射到特定的机器上来实现数据的划分,Facebook使用的Cassandra通过使用用户ID的hash值来划分数据,而Amazon使用的Dynamo通过一致性散列来划分数据。这些划分方案将用户数据随机地放置在集群的各服务器中,方法简单易行,然而这样的数据切分方式忽略了社交网络的社区结构性质,在系统运行期间会增加额外的通信代价,而且访问时延较大。
研究发现社交网络中人与人的好友关系图是具有社区结构特征的网络,即社区内部节点之间的边比较稠密,而社区之间的边比较稀疏,已有分析发现Facebook中的社区结构便是按照年级或宿舍划分的学生集体。社交网络中用户的交互对象大多是和自己在同一社区的好友,例如同一专业、同一公司等。用户基本的操作主要是发布信息和浏览信息,用户登录时,系统先查阅其关注的好友列表,然后把他们最近发布的信息显示在该用户的主页;用户发布信息时,系统先查阅其粉丝列表,然后将该信息更新到这些粉丝的主页。这样的业务流程不仅会涉及到用户本身的数据,还会涉及到用户的好友数据,浏览时还可能涉及到好友的好友这样的多跳关系。从网络结构角度来看,用户与少量几跳以内的好友联系会比较紧密,具有典型的社区性。如果社交网络中某个用户的同一社区内的好友散布在多台服务器上,那么查询和更新操作需要向多台服务器发送请求,对于具有海量用户的社交网络来说这样的通信代价太高。
发明内容
发明目的:为解决现有技术中存在的不足,本发明提供一种基于社区划分的在线社交网络海量数据存储方法。
技术方案:本发明的一种基于社区划分的在线社交网络海量数据存储方法,包括以下步骤:
(1)获取社交网络结构;
(2)将步骤(1)中所得的社交网络结构分为名人用户网络层和普通用户网络层;
(3)对步骤(2)中的每一层网络进行社区划分;
(4)按照社区大小进行数据存储;
(5)将名人用户进行多副本存储。
进一步的,所述步骤(1)中的获取社交网络结构的具体步骤如下:
(11)将社交网络中的用户抽象成网络中的节点,则用户之间的关注与被关注的好友关系抽象为有向边,即用户i关注用户j,表示有一条边从节点i指向节点j,定义A是这个网络的邻接矩阵,Aij表示节点i指向节点j的边的权重,不同的应用场景中,权重代表的意义不同,可以根据实际情况设置权重的值,例如可以均设置为1;
(12)将上述有向网络转换成无向网络,调整两个节点之间的权重,若用户i与用户j互相关注,则Aij为2;若两个用户互不关注,则Aij为0;若两个用户中只存在单向的关注关系,则Aij为1,最后设置Aji=Aij
进一步的,所述步骤(2)中的具体步骤为:设定粉丝数量阈值为K,粉丝数量大于K的社交网络用户为名人用户,粉丝数量小于K的社交网络用户为普通用户,原网络便可以分为普通用户网络层和名人用户网络层,统称为G。
进一步的,采用模块度优化方法对步骤(2)中所得普通用户网络层和名人用户网络层分别进行社区划分,模块度值越高表明该划分越能体现网络的社区结构,那么社区划分就变成了一个模块度优化的问题,即从所有可能的划分中寻找一个划分,使得该划分具有最大的模块度;然而如果把单个节点作为计算单位,对于具有海量用户的社交网络来说计算量非常大。
本发明采用一种小集团结伴策略,先让局部区域范围内的节点结伴形成一个紧密的小集团,再将这些小集团作为网络新节点,称之为超节点,超节点构成的关系网络即一个超网,再对超网通过模块度优化的方法进行社区划分,具体方法如下:
(31)假设初始网络有n个节点,编号为i(i=1,2,...,n),每个节点的度分别为ki,依据节点度优先方法,优先让度大的节点选择h跳以内的好友为一个小集团,再从剩余的节点中找到节点度最大的节点,重复结伴操作,直至所有节点都被包含在一个小集团中,对每个小集团编号Ci,即初始的社区编号;
(32)结伴操作完成后,将每个小集团封装成一个超节点,超节点与超节点之间边的权重设定为内部子节点之间的权重之和,形成超网G0,即初始的网络结构;
(33)通过模块度优化的方法,将超节点合并,超节点之间连边的权重越大,则说明两个超节点内部的节点联系越紧密;设t时刻网络结构为Gt,邻接矩阵为At
根据公式计算此时模块度为Qt,公式中kt=∑iAij,m为网络中所有连边的权重之和,即ki是节点i连边的权重之和,即kt=∑jAij,Ci表示节点i所在的社区编号,δ(x,y)是一个关于x和y的函数,当x=y时值为1,反之为0;
(34)t+1时刻的合并超节点操作中,采用权重优先策略,优先将权重大的边两端的超节点合并,计算合并后的模块度Qnew;如果Qnew≥Qt,则选择合并,Qt+1=Qnew,形成网络Qt+1;反之不合并,继续选择边权重次大的两个超节点合并;
(35)重复上述合并、调整网络的过程,直至模块度的值基本稳定为止,稳定状态时相邻两个时刻的模块度的值相差不大于ε值,即Qt+1-Qt≤ε。
进一步的,所述步骤(4)中的数据存储方法为按照社区大小存储数据,具体步骤为:设有nc个社区并按照数据量大小排序,编号记为Ci(i=1,2,...,nc),有ns台服务器(nc>ns);首先存储普通用户数据,对每个社区依次查找适合的服务器,找到满足待存社区存储需求的第一台服务器存储,然后存储名人用户数据,其存储策略优先选择存放在粉丝数最多的服务器节点,其次考虑存放在自身社区所在的服务器节点。
进一步的,所述步骤(5)的具体步骤为:根据粉丝的社区分布,名人用户的数据另外设置一定数量的存储副本,副本数据和部分粉丝节点存储在同一台服务器上;把副本放置在粉丝数量较多的几个服务器上,其他粉丝由主数据节点直接管辖;名人用户发布信息时,主数据节点将数据发送给副本节点,然后主数据节点和副本节点再将数据发送给各自管辖的粉丝用户。
有益效果:本发明与现有技术相比具有以下优点:
(1)本发明适用于社交网络海量数据存储和管理,设计了一种通过社交网络图结构的社区划分方法来切分数据,这种方法改进传统的基于一致性散列等分布式存储方式,使得相同社区的用户存储在同一台服务器上,用户的相关数据操作就可以在本地完成,减少因好友太分散而造成的服务器之间的通信耗费。
(2)本发明根据好友数量将用户分为名人用户和普通用户,并针对名人用户多副本存储策略,把副本数据分布存储在粉丝较多的服务器节点上,在名人用户推送数据时可以减少单台服务器的压力,有效提高系统性能,分担单台服务器的负载。
(3)同一社区的用户之间联系更紧密,兴趣爱好等相似度较高,根据社区结构性质可以很容易扩展社交网络的功能,如好友推荐、信息推送等。
附图说明
图1为本发明中针对名人用户多副本存储方案示意图;
图2为本发明中社区划分方法流程图。
具体实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
本发明的一种基于社区划分的在线社交网络海量数据存储方法,包括以下步骤:
(1)获取社交网络结构;
(2)将步骤(1)中所得的社交网络结构分为名人用户网络层和普通用户网络层;
(3)对步骤(2)中的每一层网络进行社区划分;
(4)按照社区大小进行数据存储;
(5)将名人用户进行多副本存储。
上述步骤(1)中的获取社交网络结构的具体步骤如下:
将社交网络中的用户抽象成网络中的节点,则用户之间的关注与被关注的好友关系抽象为有向边,即用户i关注用户j,表示有一条边从节点i指向节点j,定义A是这个网络的邻接矩阵,Aij表示节点i指向节点j的边的权重,不同的应用场景中,权重代表的意义不同,可以根据实际情况设置权重的值,例如可以均设置为1;
(12)将上述有向网络转换成无向网络,调整两个节点之间的权重,若用户i与用户j互相关注,则Aij为2;若两个用户互不关注,则Aij为0;若两个用户中只存在单向的关注关系,则Aij为1,最后设置Aji=Aij
所述步骤(2)中的具体步骤为:设定粉丝数量阈值为K,粉丝数量大于K的社交网络用户为名人用户,粉丝数量小于K的社交网络用户为普通用户,原网络便可以分为普通用户网络层和名人用户网络层,统称为G。
采用模块度优化方法对步骤(2)中所得普通用户网络层和名人用户网络层分别进行社区划分,模块度值越高表明该划分越能体现网络的社区结构,那么社区划分就变成了一个模块度优化的问题,即从所有可能的划分中寻找一个划分,使得该划分具有最大的模块度;然而如果把单个节点作为计算单位,对于具有海量用户的社交网络来说计算量非常大。
本发明采用一种小集团结伴策略,先让局部区域范围内的节点结伴形成一个紧密的小集团,再将这些小集团作为网络新节点,称之为超节点,超节点构成的关系网络即一个超网,再对超网通过模块度优化的方法进行社区划分,具体方法如下:
(31)假设初始网络有n个节点,编号为i(i=1,2,...,n),每个节点的度分别为ki,依据节点度优先方法,优先让度大的节点选择h跳以内的好友为一个小集团,再从剩余的节点中找到节点度最大的节点,重复结伴操作,直至所有节点都被包含在一个小集团中,对每个小集团编号Ci,即初始的社区编号;
(32)结伴操作完成后,将每个小集团封装成一个超节点,超节点与超节点之间边的权重设定为内部子节点之间的权重之和,形成超网G0,即初始的网络结构;
(33)通过模块度优化的方法,将超节点合并,超节点之间连边的权重越大,则说明两个超节点内部的节点联系越紧密;设t时刻网络结构为Gt,邻接矩阵为At
根据公式计算此时模块度为Qt,公式中kt=∑iAij,m为网络中所有连边的权重之和,即ki是节点i连边的权重之和,即kt=∑jAij,Ci表示节点i所在的社区编号,δ(x,y)是一个关于x和y的函数,当x=y时值为1,反之为0;
(34)t+1时刻的合并超节点操作中,采用权重优先策略,优先将权重大的边两端的超节点合并,计算合并后的模块度Qnew;如果Qnew≥Qt,则选择合并,Qt+1=Qnew,形成网络Qt+1;反之不合并,继续选择边权重次大的两个超节点合并;
(35)重复上述合并、调整网络的过程,直至模块度的值基本稳定为止,稳定状态时相邻两个时刻的模块度的值相差不大于ε值,即Qt+1-Qt≤ε。
上述步骤(4)中的数据存储方法为按照社区大小存储数据,具体步骤为:设有nc个社区并按照数据量大小排序,编号记为Ci(i=1,2,...,nc),有ns台服务器(nc>ns);首先存储普通用户数据,对每个社区依次查找适合的服务器,找到满足待存社区存储需求的第一台服务器存储,然后存储名人用户数据,其存储策略优先选择存放在粉丝数最多的服务器节点,其次考虑存放在自身社区所在的服务器节点。
所述步骤(5)的具体步骤为:根据粉丝的社区分布,名人用户的数据另外设置一定数量的存储副本,副本数据和部分粉丝节点存储在同一台服务器上;把副本放置在粉丝数量较多的几个服务器上,其他粉丝由主数据节点直接管辖;名人用户发布信息时,主数据节点将数据发送给副本节点,然后主数据节点和副本节点再将数据发送给各自管辖的粉丝用户。

Claims (5)

1.一种基于社区划分的在线社交网络海量数据存储方法,其特征在于包括以下步骤:
(1)获取社交网络结构;
(2)将步骤(1)中所得的社交网络结构分为名人用户网络层和普通用户网络层;
(3)采用模块度优化方法对步骤(2)中所得普通用户网络层和名人用户网络层分别进行社区划分,具体方法如下:
(31)假设初始网络有n个节点,编号为i,且i=1,2,...,n,每个节点的度分别为ki,依据节点度优先方法,优先让度大的节点选择h跳以内的好友为一个小集团,再从剩余的节点中找到节点度最大的节点,重复结伴操作,直至所有节点都被包含在一个小集团中,对每个小集团编号Ci,即初始的社区编号;
(32)结伴操作完成后,将每个小集团封装成一个超节点,超节点与超节点之间边的权重设定为内部子节点之间的权重之和,形成超网G0,即初始的网络结构;
(33)通过模块度优化的方法,将超节点合并,超节点之间连边的权重越大,则说明两个超节点内部的节点联系越紧密;设t时刻网络结构为Gt,邻接矩阵为At
根据公式计算此时模块度为Qt,公式中ki=∑iAij,m为网络中所有连边的权重之和,即ki是节点i连边的权重之和,kj=∑jAij,Ci表示节点i所在的社区编号,Cj表示节点j所在的社区编号,δ(Ci,Cj)是一个关于Ci和Cj的函数,当Ci=Cj时,δ(Ci,Cj)的值为1,反之为0,j为用户编号,取值1,2,3…,编号为j的节点的度分布为kj;Aij表示节点i指向节点j的边的权重;
(34)t+1时刻的合并超节点操作中,采用权重优先策略,优先将权重大的边两端的超节点合并,计算合并后的模块度Qnew;如果Qnew≥Qt,则选择合并,Qt+1=Qnew,形成网络Gt+1;反之不合并,继续选择边权重次大的两个超节点合并;
(35)重复步骤(33)及步骤(34)的过程,直至模块度的值稳定为止,稳定状态时相邻两个时刻的模块度的值相差不大于ε值,即Qt+1-Qt≤ε;
(4)按照社区大小进行数据存储;
(5)将名人用户进行多副本存储。
2.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:所述步骤(1)中的获取社交网络结构的具体步骤如下:
(11)将社交网络中的用户抽象成网络中的节点,则用户之间的关注与被关注的好友关系抽象为有向边,即用户i关注用户j,表示有一条边从节点i指向节点j,定义A是这个网络的邻接矩阵,Aij表示节点i指向节点j的边的权重,该权重均设置为1;
(12)将上述有向网络转换成无向网络,调整两个节点之间的权重,若用户i与用户j互相关注,则Aij为2;若两个用户互不关注,则Aij为0;若两个用户中只存在单向的关注关系,则Aij为1,最后设置Aji=Aij
3.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:所述步骤(2)中的具体步骤为:设定粉丝数量阈值为K,粉丝数量大于K的社交网络用户为名人用户,粉丝数量小于K的社交网络用户为普通用户,原网络便分为普通用户网络层和名人用户网络层,统称为G。
4.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:所述步骤(4)中的数据存储方法为按照社区大小存储数据,具体步骤为:设有nc个社区并按照数据量大小排序,编号记为Ci,且i=1,2,...,nc,有ns台服务器,nc>ns;首先存储普通用户数据,对每个社区依次查找适合的服务器,找到满足待存社区存储需求的第一台服务器存储,然后存储名人用户数据,其存储策略优先选择存放在粉丝数最多的服务器节点,其次考虑存放在自身社区所在的服务器节点。
5.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:所述步骤(5)的具体步骤为:根据粉丝的社区分布,名人用户的数据另外设置一定数量的存储副本,副本数据和部分粉丝节点存储在同一台服务器上;名人用户发布信息时,主数据节点将数据发送给副本节点,然后主数据节点和副本节点再将数据发送给各自管辖的粉丝用户。
CN201410058324.0A 2014-02-21 2014-02-21 一种基于社区划分的在线社交网络海量数据存储方法 Expired - Fee Related CN103838831B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410058324.0A CN103838831B (zh) 2014-02-21 2014-02-21 一种基于社区划分的在线社交网络海量数据存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410058324.0A CN103838831B (zh) 2014-02-21 2014-02-21 一种基于社区划分的在线社交网络海量数据存储方法

Publications (2)

Publication Number Publication Date
CN103838831A CN103838831A (zh) 2014-06-04
CN103838831B true CN103838831B (zh) 2017-02-22

Family

ID=50802328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410058324.0A Expired - Fee Related CN103838831B (zh) 2014-02-21 2014-02-21 一种基于社区划分的在线社交网络海量数据存储方法

Country Status (1)

Country Link
CN (1) CN103838831B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391889A (zh) * 2014-11-11 2015-03-04 西安交通大学 一种面向有向-加权网络的社区结构发现方法
CN107092667B (zh) * 2017-04-07 2018-02-27 平安科技(深圳)有限公司 基于社交网络的群组查找方法和装置
CN107358308B (zh) * 2017-05-16 2021-06-18 广州杰赛科技股份有限公司 实现社会网络影响力最大化的方法和装置
CN108648454A (zh) * 2018-05-18 2018-10-12 中山大学 一种基于出行数据的交通小区动态划分方法
CN109522460A (zh) * 2018-08-30 2019-03-26 中国电子进出口有限公司 一种基于社交网络社团划分的舆情监测方法及系统
CN110765320B (zh) * 2019-10-23 2023-10-27 腾讯科技(深圳)有限公司 数据处理方法、装置、存储介质和计算机设备
CN111324674B (zh) * 2020-01-20 2021-10-15 腾讯科技(深圳)有限公司 业务处理方法、装置、服务器及存储介质
CN114461930B (zh) * 2022-04-13 2022-06-24 四川大学 社交网络数据采集方法、装置及储存介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101370030A (zh) * 2008-09-24 2009-02-18 东南大学 基于内容复制的资源负载平衡方法
US8190645B1 (en) * 2009-06-04 2012-05-29 Matthew Charles Bashaw Method and system for storing, retrieving, and sharing data using a field-accessed database system comprising a mobile unit
CN103279505A (zh) * 2013-05-10 2013-09-04 中国南方电网有限责任公司超高压输电公司 一种基于语义的海量数据处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101370030A (zh) * 2008-09-24 2009-02-18 东南大学 基于内容复制的资源负载平衡方法
US8190645B1 (en) * 2009-06-04 2012-05-29 Matthew Charles Bashaw Method and system for storing, retrieving, and sharing data using a field-accessed database system comprising a mobile unit
CN103279505A (zh) * 2013-05-10 2013-09-04 中国南方电网有限责任公司超高压输电公司 一种基于语义的海量数据处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向新浪微博的数据采集和社区发现算法研究;史春永;《中国优秀硕士学位论文全文数据库 信息科技辑》;20131215;I139-175 *

Also Published As

Publication number Publication date
CN103838831A (zh) 2014-06-04

Similar Documents

Publication Publication Date Title
CN103838831B (zh) 一种基于社区划分的在线社交网络海量数据存储方法
CN102063486B (zh) 一种面向多维数据管理的云计算平台查询处理方法
CN102779308B (zh) 一种广告投放方法及系统
CN107169083A (zh) 公安卡口海量车辆数据存储与检索方法及装置、电子设备
CN110825948B (zh) 基于促谣-辟谣消息和表示学习的谣言传播控制方法
CN105205146B (zh) 一种计算微博用户影响力的方法
CN108156140A (zh) 一种支持数值属性比较的多关键字可搜索加密方法
CN101916256A (zh) 综合行动者兴趣与网络拓扑的社区发现方法
CN101764807A (zh) 基于元搜索引擎的多源下载互联网资源的装置及方法
CN104298785A (zh) 一种众搜资源搜索方法
CN102843420A (zh) 基于模糊划分的社交网络数据分发系统
CN104778210A (zh) 一种微博转发树和转发森林构建方法
CN109447261A (zh) 一种基于多阶邻近相似度的网络表示学习的方法
CN102930029A (zh) 一种社会化的搜索引擎方法和系统
CN104035978B (zh) 社团发现方法及系统
CN110134877A (zh) 线下移动社交网络中挖掘种子用户的方法和装置
CN107257356B (zh) 一种基于超图分割的社交用户数据优化放置方法
CN105959368B (zh) 一种社交云热点资源预测与部署的方法
CN102624893B (zh) 基于spiral曲线的无线Mesh网络P2P资源共享方法
CN102750388A (zh) 一种基于数字资源的网络系统及其使用方法
CN103051476B (zh) 基于拓扑分析的网络社区发现方法
Zhou et al. JPR: Exploring joint partitioning and replication for traffic minimization in online social networks
Li et al. Measuring the external influence in information diffusion
Chandra et al. Modeling temporal and spatial features of collaboration network
Yin et al. Improving accuracy and scalability of personal recommendation based on bipartite network projection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170222

CF01 Termination of patent right due to non-payment of annual fee