CN103838831A - 一种基于社区划分的在线社交网络海量数据存储方法 - Google Patents
一种基于社区划分的在线社交网络海量数据存储方法 Download PDFInfo
- Publication number
- CN103838831A CN103838831A CN201410058324.0A CN201410058324A CN103838831A CN 103838831 A CN103838831 A CN 103838831A CN 201410058324 A CN201410058324 A CN 201410058324A CN 103838831 A CN103838831 A CN 103838831A
- Authority
- CN
- China
- Prior art keywords
- node
- community
- user
- network
- social networks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013500 data storage Methods 0.000 title claims abstract description 17
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 30
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 30
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 abstract description 4
- 238000013461 design Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013506 data mapping Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 210000004317 gizzard Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于社区划分的在线社交网络海量数据存储方法,从社交网络的图结构出发,首先根据节点度大小将网络分成名人用户层和普通用户层,再对每一层利用模块度优化的方法进行社区划分。设计一种小集团结伴策略对初始网络进行预处理,形成一个超网,采用边权重优先方案逐步合并超节点以提高模块度。社区划分完成之后,优先存储普通用户数据,将同一社区的用户数据存储在相同服务器节点上,对于名人用户数据优先考虑选择存放在粉丝最多的服务器,其次考虑存放在自身社区所在的服务器节点。设计名人用户数据多副本存储,以减少单台服务器的负载。利用社区划分方法存储社交网络数据,可以提高访问的局部性,减少通信耗费。
Description
技术领域
本发明涉及一种数据存储方法,具体涉及一种基于社区划分的在线社交网络海量数据存储方法。
背景技术
以用户创造内容为主的Web2.0已经渗透到人们日常生活的方方面面,大量在线社交网站迅速兴起,国外的如Facebook、Twitter,国内的如微博、人人网等已经成为人们分享和获取信息的主要平台。人们通过社交网络互动交流,产生的数据和访问规模呈爆炸式增长,给数据的存储和管理带来严峻挑战。
目前网站的架构中基本采用传统的分布式存储方案,如哈希、一致性散列等技术。例如Twitter使用Gizzard,通过将特定范围的数据映射到特定的机器上来实现数据的划分,Facebook使用的Cassandra通过使用用户ID的hash值来划分数据,而Amazon使用的Dynamo通过一致性散列来划分数据。这些划分方案将用户数据随机地放置在集群的各服务器中,方法简单易行,然而这样的数据切分方式忽略了社交网络的社区结构性质,在系统运行期间会增加额外的通信代价,而且访问时延较大。
研究发现社交网络中人与人的好友关系图是具有社区结构特征的网络,即社区内部节点之间的边比较稠密,而社区之间的边比较稀疏,已有分析发现Facebook中的社区结构便是按照年级或宿舍划分的学生集体。社交网络中用户的交互对象大多是和自己在同一社区的好友,例如同一专业、同一公司等。用户基本的操作主要是发布信息和浏览信息,用户登录时,系统先查阅其关注的好友列表,然后把他们最近发布的信息显示在该用户的主页;用户发布信息时,系统先查阅其粉丝列表,然后将该信息更新到这些粉丝的主页。这样的业务流程不仅会涉及到用户本身的数据,还会涉及到用户的好友数据,浏览时还可能涉及到好友的好友这样的多跳关系。从网络结构角度来看,用户与少量几跳以内的好友联系会比较紧密,具有典型的社区性。如果社交网络中某个用户的同一社区内的好友散布在多台服务器上,那么查询和更新操作需要向多台服务器发送请求,对于具有海量用户的社交网络来说这样的通信代价太高。
发明内容
发明目的:为解决现有技术中存在的不足,本发明提供一种基于社区划分的在线社交网络海量数据存储方法。
技术方案:本发明的一种基于社区划分的在线社交网络海量数据存储方法,包括以下步骤:
(1)获取社交网络结构;
(2)将步骤(1)中所得的社交网络结构分为名人用户网络层和普通用户网络层;
(3)对步骤(2)中的每一层网络进行社区划分;
(4)按照社区大小进行数据存储;
(5)将名人用户进行多副本存储。
进一步的,所述步骤(1)中的获取社交网络结构的具体步骤如下:
(11)将社交网络中的用户抽象成网络中的节点,则用户之间的关注与被关注的好友关系抽象为有向边,即用户i关注用户j,表示有一条边从节点i指向节点j,定义A是这个网络的邻接矩阵,Aij表示节点i指向节点j的边的权重,不同的应用场景中,权重代表的意义不同,可以根据实际情况设置权重的值,例如可以均设置为1;
(12)将上述有向网络转换成无向网络,调整两个节点之间的权重,若用户i与用户j互相关注,则Aij为2;若两个用户互不关注,则Aij为0;若两个用户中只存在单向的关注关系,则Aij为1,最后设置Aji=Aij。
进一步的,所述步骤(2)中的具体步骤为:设定粉丝数量阈值为K,粉丝数量大于K的社交网络用户为名人用户,粉丝数量小于K的社交网络用户为普通用户,原网络便可以分为普通用户网络层和名人用户网络层,统称为G。
进一步的,采用模块度优化方法对步骤(2)中所得普通用户网络层和名人用户网络层分别进行社区划分,模块度值越高表明该划分越能体现网络的社区结构,那么社区划分就变成了一个模块度优化的问题,即从所有可能的划分中寻找一个划分,使得该划分具有最大的模块度;然而如果把单个节点作为计算单位,对于具有海量用户的社交网络来说计算量非常大。
本发明采用一种小集团结伴策略,先让局部区域范围内的节点结伴形成一个紧密的小集团,再将这些小集团作为网络新节点,称之为超节点,超节点构成的关系网络即一个超网,再对超网通过模块度优化的方法进行社区划分,具体方法如下:
(31)假设初始网络有n个节点,编号为i(i=1,2,...,n),每个节点的度分别为ki,依据节点度优先方法,优先让度大的节点选择h跳以内的好友为一个小集团,再从剩余的节点中找到节点度最大的节点,重复结伴操作,直至所有节点都被包含在一个小集团中,对每个小集团编号Ci,即初始的社区编号;
(32)结伴操作完成后,将每个小集团封装成一个超节点,超节点与超节点之间边的权重设定为内部子节点之间的权重之和,形成超网G0,即初始的网络结构;
(33)通过模块度优化的方法,将超节点合并,超节点之间连边的权重越大,则说明两个超节点内部的节点联系越紧密;设t时刻网络结构为Gt,邻接矩阵为At;
根据公式 计算此时模块度为Qt,公式中kt=∑iAij,m为网络中所有连边的权重之和,即ki是节点i连边的权重之和,即kt=∑jAij,Ci表示节点i所在的社区编号,δ(x,y)是一个关于x和y的函数,当x=y时值为1,反之为0;
(34)t+1时刻的合并超节点操作中,采用权重优先策略,优先将权重大的边两端的超节点合并,计算合并后的模块度Qnew;如果Qnew≥Qt,则选择合并,Qt+1=Qnew,形成网络Qt+1;反之不合并,继续选择边权重次大的两个超节点合并;
(35)重复上述合并、调整网络的过程,直至模块度的值基本稳定为止,稳定状态时相邻两个时刻的模块度的值相差不大于ε值,即Qt+1-Qt≤ε。
进一步的,所述步骤(4)中的数据存储方法为按照社区大小存储数据,具体步骤为:设有nc个社区并按照数据量大小排序,编号记为Ci(i=1,2,...,nc),有ns台服务器(nc>ns);首先存储普通用户数据,对每个社区依次查找适合的服务器,找到满足待存社区存储需求的第一台服务器存储,然后存储名人用户数据,其存储策略优先选择存放在粉丝数最多的服务器节点,其次考虑存放在自身社区所在的服务器节点。
进一步的,所述步骤(5)的具体步骤为:根据粉丝的社区分布,名人用户的数据另外设置一定数量的存储副本,副本数据和部分粉丝节点存储在同一台服务器上;把副本放置在粉丝数量较多的几个服务器上,其他粉丝由主数据节点直接管辖;名人用户发布信息时,主数据节点将数据发送给副本节点,然后主数据节点和副本节点再将数据发送给各自管辖的粉丝用户。
有益效果:本发明与现有技术相比具有以下优点:
(1)本发明适用于社交网络海量数据存储和管理,设计了一种通过社交网络图结构的社区划分方法来切分数据,这种方法改进传统的基于一致性散列等分布式存储方式,使得相同社区的用户存储在同一台服务器上,用户的相关数据操作就可以在本地完成,减少因好友太分散而造成的服务器之间的通信耗费。
(2)本发明根据好友数量将用户分为名人用户和普通用户,并针对名人用户多副本存储策略,把副本数据分布存储在粉丝较多的服务器节点上,在名人用户推送数据时可以减少单台服务器的压力,有效提高系统性能,分担单台服务器的负载。
(3)同一社区的用户之间联系更紧密,兴趣爱好等相似度较高,根据社区结构性质可以很容易扩展社交网络的功能,如好友推荐、信息推送等。
附图说明
图1为本发明中针对名人用户多副本存储方案示意图;
图2为本发明中社区划分方法流程图。
具体实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
本发明的一种基于社区划分的在线社交网络海量数据存储方法,包括以下步骤:
(1)获取社交网络结构;
(2)将步骤(1)中所得的社交网络结构分为名人用户网络层和普通用户网络层;
(3)对步骤(2)中的每一层网络进行社区划分;
(4)按照社区大小进行数据存储;
(5)将名人用户进行多副本存储。
上述步骤(1)中的获取社交网络结构的具体步骤如下:
将社交网络中的用户抽象成网络中的节点,则用户之间的关注与被关注的好友关系抽象为有向边,即用户i关注用户j,表示有一条边从节点i指向节点j,定义A是这个网络的邻接矩阵,Aij表示节点i指向节点j的边的权重,不同的应用场景中,权重代表的意义不同,可以根据实际情况设置权重的值,例如可以均设置为1;
(12)将上述有向网络转换成无向网络,调整两个节点之间的权重,若用户i与用户j互相关注,则Aij为2;若两个用户互不关注,则Aij为0;若两个用户中只存在单向的关注关系,则Aij为1,最后设置Aji=Aij。
所述步骤(2)中的具体步骤为:设定粉丝数量阈值为K,粉丝数量大于K的社交网络用户为名人用户,粉丝数量小于K的社交网络用户为普通用户,原网络便可以分为普通用户网络层和名人用户网络层,统称为G。
采用模块度优化方法对步骤(2)中所得普通用户网络层和名人用户网络层分别进行社区划分,模块度值越高表明该划分越能体现网络的社区结构,那么社区划分就变成了一个模块度优化的问题,即从所有可能的划分中寻找一个划分,使得该划分具有最大的模块度;然而如果把单个节点作为计算单位,对于具有海量用户的社交网络来说计算量非常大。
本发明采用一种小集团结伴策略,先让局部区域范围内的节点结伴形成一个紧密的小集团,再将这些小集团作为网络新节点,称之为超节点,超节点构成的关系网络即一个超网,再对超网通过模块度优化的方法进行社区划分,具体方法如下:
(31)假设初始网络有n个节点,编号为i(i=1,2,...,n),每个节点的度分别为ki,依据节点度优先方法,优先让度大的节点选择h跳以内的好友为一个小集团,再从剩余的节点中找到节点度最大的节点,重复结伴操作,直至所有节点都被包含在一个小集团中,对每个小集团编号Ci,即初始的社区编号;
(32)结伴操作完成后,将每个小集团封装成一个超节点,超节点与超节点之间边的权重设定为内部子节点之间的权重之和,形成超网G0,即初始的网络结构;
(33)通过模块度优化的方法,将超节点合并,超节点之间连边的权重越大,则说明两个超节点内部的节点联系越紧密;设t时刻网络结构为Gt,邻接矩阵为At;
根据公式 计算此时模块度为Qt,公式中kt=∑iAij,m为网络中所有连边的权重之和,即ki是节点i连边的权重之和,即kt=∑jAij,Ci表示节点i所在的社区编号,δ(x,y)是一个关于x和y的函数,当x=y时值为1,反之为0;
(34)t+1时刻的合并超节点操作中,采用权重优先策略,优先将权重大的边两端的超节点合并,计算合并后的模块度Qnew;如果Qnew≥Qt,则选择合并,Qt+1=Qnew,形成网络Qt+1;反之不合并,继续选择边权重次大的两个超节点合并;
(35)重复上述合并、调整网络的过程,直至模块度的值基本稳定为止,稳定状态时相邻两个时刻的模块度的值相差不大于ε值,即Qt+1-Qt≤ε。
上述步骤(4)中的数据存储方法为按照社区大小存储数据,具体步骤为:设有nc个社区并按照数据量大小排序,编号记为Ci(i=1,2,...,nc),有ns台服务器(nc>ns);首先存储普通用户数据,对每个社区依次查找适合的服务器,找到满足待存社区存储需求的第一台服务器存储,然后存储名人用户数据,其存储策略优先选择存放在粉丝数最多的服务器节点,其次考虑存放在自身社区所在的服务器节点。
所述步骤(5)的具体步骤为:根据粉丝的社区分布,名人用户的数据另外设置一定数量的存储副本,副本数据和部分粉丝节点存储在同一台服务器上;把副本放置在粉丝数量较多的几个服务器上,其他粉丝由主数据节点直接管辖;名人用户发布信息时,主数据节点将数据发送给副本节点,然后主数据节点和副本节点再将数据发送给各自管辖的粉丝用户。
Claims (6)
1.一种基于社区划分的在线社交网络海量数据存储方法,其特征在于包括以下步骤:
(1)获取社交网络结构;
(2)将步骤(1)中所得的社交网络结构分为名人用户网络层和普通用户网络层;
(3)对步骤(2)中的每一层网络进行社区划分;
(4)按照社区大小进行数据存储;
(5)将名人用户进行多副本存储。
2.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:所述步骤(1)中的获取社交网络结构的具体步骤如下:
(11)将社交网络中的用户抽象成网络中的节点,则用户之间的关注与被关注的好友关系抽象为有向边,即用户i关注用户j,表示有一条边从节点i指向节点j,定义A是这个网络的邻接矩阵,Aij表示节点i指向节点j的边的权重,该权重均设置为1;
(12)将上述有向网络转换成无向网络,调整两个节点之间的权重,若用户i与用户j互相关注,则Aij为2;若两个用户互不关注,则Aij为0;若两个用户中只存在单向的关注关系,则Aij为1,最后设置Aji=Aij。
3.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:所述步骤(2)中的具体步骤为:设定粉丝数量阈值为K,粉丝数量大于K的社交网络用户为名人用户,粉丝数量小于K的社交网络用户为普通用户,原网络便可以分为普通用户网络层和名人用户网络层,统称为G。
4.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:采用模块度优化方法对步骤(2)中所得普通用户网络层和名人用户网络层分别进行社区划分,具体方法如下:
(31)假设初始网络有n个节点,编号为i(i=1,2,...,n),每个节点的度分别为ki,依据节点度优先方法,优先让度大的节点选择h跳以内的好友为一个小集团,再从剩余的节点中找到节点度最大的节点,重复结伴操作,直至所有节点都被包含在一个小集团中,对每个小集团编号Ci,即初始的社区编号;
(32)结伴操作完成后,将每个小集团封装成一个超节点,超节点与超节点之间边的权重设定为内部子节点之间的权重之和,形成超网G0,即初始的网络结构;
(33)通过模块度优化的方法,将超节点合并,超节点之间连边的权重越大,则说明两个超节点内部的节点联系越紧密;设t时刻网络结构为Gt,邻接矩阵为At;
根据公式 计算此时模块度为Qt,公式中kt=∑iAij,m为网络中所有连边的权重之和,即ki是节点i连边的权重之和,即kt=∑jAij,Ci表示节点i所在的社区编号,δ(x,y)是一个关于x和y的函数,当x=y时值为1,反之为0;
(34)t+1时刻的合并超节点操作中,采用权重优先策略,优先将权重大的边两端的超节点合并,计算合并后的模块度Qnew;如果Qnew≥Qt,则选择合并,Qt+1=Qnew,形成网络Qt+1;反之不合并,继续选择边权重次大的两个超节点合并;
(35)重复上述合并、调整网络的过程,直至模块度的值基本稳定为止,稳定状态时相邻两个时刻的模块度的值相差不大于ε值,即Qt+1-Qt≤ε。
5.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:所述步骤(4)中的数据存储方法为按照社区大小存储数据,具体步骤为:设有nc个社区并按照数据量大小排序,编号记为Ci(i=1,2,...,nc),有ns台服务器(nc>ns);首先存储普通用户数据,对每个社区依次查找适合的服务器,找到满足待存社区存储需求的第一台服务器存储,然后存储名人用户数据,其存储策略优先选择存放在粉丝数最多的服务器节点,其次考虑存放在自身社区所在的服务器节点。
6.根据权利要求1所述的基于社区划分的在线社交网络海量数据存储方法,其特征在于:所述步骤(5)的具体步骤为:根据粉丝的社区分布,名人用户的数据另外设置一定数量的存储副本,副本数据和部分粉丝节点存储在同一台服务器上;把副本放置在粉丝数量较多的几个服务器上,其他粉丝由主数据节点直接管辖;名人用户发布信息时,主数据节点将数据发送给副本节点,然后主数据节点和副本节点再将数据发送给各自管辖的粉丝用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410058324.0A CN103838831B (zh) | 2014-02-21 | 2014-02-21 | 一种基于社区划分的在线社交网络海量数据存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410058324.0A CN103838831B (zh) | 2014-02-21 | 2014-02-21 | 一种基于社区划分的在线社交网络海量数据存储方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103838831A true CN103838831A (zh) | 2014-06-04 |
CN103838831B CN103838831B (zh) | 2017-02-22 |
Family
ID=50802328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410058324.0A Expired - Fee Related CN103838831B (zh) | 2014-02-21 | 2014-02-21 | 一种基于社区划分的在线社交网络海量数据存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103838831B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104391889A (zh) * | 2014-11-11 | 2015-03-04 | 西安交通大学 | 一种面向有向-加权网络的社区结构发现方法 |
CN107092667A (zh) * | 2017-04-07 | 2017-08-25 | 平安科技(深圳)有限公司 | 基于社交网络的群组查找方法和装置 |
CN107358308A (zh) * | 2017-05-16 | 2017-11-17 | 广州杰赛科技股份有限公司 | 实现社会网络影响力最大化的方法和装置 |
CN109522460A (zh) * | 2018-08-30 | 2019-03-26 | 中国电子进出口有限公司 | 一种基于社交网络社团划分的舆情监测方法及系统 |
CN109949574A (zh) * | 2018-05-18 | 2019-06-28 | 中山大学 | 一种数据驱动的城市路网交通小区多级划分方法 |
CN110765320A (zh) * | 2019-10-23 | 2020-02-07 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质和计算机设备 |
CN111324674A (zh) * | 2020-01-20 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 业务处理方法、装置、服务器及存储介质 |
CN114461930A (zh) * | 2022-04-13 | 2022-05-10 | 四川大学 | 社交网络数据采集方法、装置及储存介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101370030A (zh) * | 2008-09-24 | 2009-02-18 | 东南大学 | 基于内容复制的资源负载平衡方法 |
US8190645B1 (en) * | 2009-06-04 | 2012-05-29 | Matthew Charles Bashaw | Method and system for storing, retrieving, and sharing data using a field-accessed database system comprising a mobile unit |
CN103279505A (zh) * | 2013-05-10 | 2013-09-04 | 中国南方电网有限责任公司超高压输电公司 | 一种基于语义的海量数据处理方法 |
-
2014
- 2014-02-21 CN CN201410058324.0A patent/CN103838831B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101370030A (zh) * | 2008-09-24 | 2009-02-18 | 东南大学 | 基于内容复制的资源负载平衡方法 |
US8190645B1 (en) * | 2009-06-04 | 2012-05-29 | Matthew Charles Bashaw | Method and system for storing, retrieving, and sharing data using a field-accessed database system comprising a mobile unit |
CN103279505A (zh) * | 2013-05-10 | 2013-09-04 | 中国南方电网有限责任公司超高压输电公司 | 一种基于语义的海量数据处理方法 |
Non-Patent Citations (1)
Title |
---|
史春永: "面向新浪微博的数据采集和社区发现算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104391889A (zh) * | 2014-11-11 | 2015-03-04 | 西安交通大学 | 一种面向有向-加权网络的社区结构发现方法 |
US10268655B2 (en) | 2016-04-07 | 2019-04-23 | Ping An Technology (Shenzhen) Co., Ltd. | Method, device, server and storage medium of searching a group based on social network |
CN107092667A (zh) * | 2017-04-07 | 2017-08-25 | 平安科技(深圳)有限公司 | 基于社交网络的群组查找方法和装置 |
CN107092667B (zh) * | 2017-04-07 | 2018-02-27 | 平安科技(深圳)有限公司 | 基于社交网络的群组查找方法和装置 |
CN107358308B (zh) * | 2017-05-16 | 2021-06-18 | 广州杰赛科技股份有限公司 | 实现社会网络影响力最大化的方法和装置 |
CN107358308A (zh) * | 2017-05-16 | 2017-11-17 | 广州杰赛科技股份有限公司 | 实现社会网络影响力最大化的方法和装置 |
CN109949574A (zh) * | 2018-05-18 | 2019-06-28 | 中山大学 | 一种数据驱动的城市路网交通小区多级划分方法 |
CN109949574B (zh) * | 2018-05-18 | 2021-09-28 | 中山大学 | 一种数据驱动的城市路网交通小区多级划分方法 |
CN109522460A (zh) * | 2018-08-30 | 2019-03-26 | 中国电子进出口有限公司 | 一种基于社交网络社团划分的舆情监测方法及系统 |
CN110765320A (zh) * | 2019-10-23 | 2020-02-07 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质和计算机设备 |
CN110765320B (zh) * | 2019-10-23 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质和计算机设备 |
CN111324674A (zh) * | 2020-01-20 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 业务处理方法、装置、服务器及存储介质 |
CN114461930A (zh) * | 2022-04-13 | 2022-05-10 | 四川大学 | 社交网络数据采集方法、装置及储存介质 |
CN114461930B (zh) * | 2022-04-13 | 2022-06-24 | 四川大学 | 社交网络数据采集方法、装置及储存介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103838831B (zh) | 2017-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103838831A (zh) | 一种基于社区划分的在线社交网络海量数据存储方法 | |
CN109166017A (zh) | 基于重聚类的推送方法、装置、计算机设备及存储介质 | |
CN101505311B (zh) | 一种基于社会化网络的信息传播方法及系统 | |
CN102810113B (zh) | 一种针对复杂网络的混合型聚类方法 | |
CN101778005A (zh) | 复杂网络配置方法和系统 | |
WO2013052563A3 (en) | Social network recommended content and recommending members for personalized search results | |
CN104298785A (zh) | 一种众搜资源搜索方法 | |
CN109447261A (zh) | 一种基于多阶邻近相似度的网络表示学习的方法 | |
CN110362380A (zh) | 一种面向网络靶场的多目标优化虚拟机部署方法 | |
CN103678550A (zh) | 一种基于动态索引结构的海量数据实时查询方法 | |
CN105550275A (zh) | 一种微博转发量预测方法 | |
CN104376083A (zh) | 一种基于关注关系和多用户行为的图推荐方法 | |
CN104111981B (zh) | 一种用于提供发布信息的方法与设备 | |
CN104035987A (zh) | 一种微博网络用户影响力排名方法 | |
CN103581224A (zh) | 推送信息的方法和装置 | |
CN102325161B (zh) | 一种基于查询工作量估算的xml分片方法 | |
CN105138536B (zh) | 基于有向超图的移动社交网络数据分片方法 | |
CN103559320A (zh) | 对异质网络中对象进行排序的方法 | |
CN104111959A (zh) | 基于社交网络的服务推荐方法 | |
CN108133426B (zh) | 一种社交网络链路推荐方法 | |
CN105574183A (zh) | 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 | |
CN107257356A (zh) | 一种基于超图分割的社交用户数据优化放置方法 | |
Fu et al. | An evolving scale-free network with large clustering coefficient | |
CN107734005A (zh) | 一种基于移动智能体技术下智能体联盟形成方法 | |
CN105488056B (zh) | 一种对象处理方法与设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170222 |
|
CF01 | Termination of patent right due to non-payment of annual fee |