CN114461930A - 社交网络数据采集方法、装置及储存介质 - Google Patents
社交网络数据采集方法、装置及储存介质 Download PDFInfo
- Publication number
- CN114461930A CN114461930A CN202210381972.4A CN202210381972A CN114461930A CN 114461930 A CN114461930 A CN 114461930A CN 202210381972 A CN202210381972 A CN 202210381972A CN 114461930 A CN114461930 A CN 114461930A
- Authority
- CN
- China
- Prior art keywords
- node
- community
- nodes
- social network
- concerned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003860 storage Methods 0.000 title claims abstract description 10
- 238000012544 monitoring process Methods 0.000 claims abstract description 15
- 230000009193 crawling Effects 0.000 claims abstract description 7
- 230000008859 change Effects 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000013480 data collection Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 2
- 235000019013 Viburnum opulus Nutrition 0.000 abstract description 5
- 244000071378 Viburnum opulus Species 0.000 abstract description 5
- 230000001902 propagating effect Effects 0.000 abstract description 3
- 230000008451 emotion Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了社交网络数据采集方法、装置及储存介质,涉及信息安全领域,S1获取初始社交网络用户,S2构建候选集合,S3预处理候选集合得到第一集合,S4计算每个社区加入其每个邻居社区时的收益度,并其加入邻居社区,S5判断社区的社区归属是否发生变化,若变化返回S4,反之进S6,S6选取监控节点,S7采集监控节点的信息,S8进行爬取任务,获取指定数据,S9解析指定数据获得目标数据并存放至数据库;能够在海量的社交网络用户节点中选择出社交网络传播信息的监控节点,实时感知社交网络中正在传播的舆情。克服现有“滚雪球”收据收集方法片面同质的问题,克服“关键字”收集方法无法实时感知网络舆情,只能事后分析的局限性。
Description
技术领域
本发明涉及信息安全领域,尤其涉及一种社交网络数据采集方法、装置及储存介质。
背景技术
随着移动互联网与自媒体的发展,社会网络已经成为公众发布、获取信息与表达情感的重要渠道。在社交网络中每天产生海量的数据信息,在海量的信息背后,包含着公众对某一事件、某一问题的看法、态度与情感,这种态度与情感被成为网络舆情。及时把握社交网络中公众表达的网络舆情对维护社会和谐和国家的稳定有着至关重要的作用,掌握社交网络舆情的第一步是能及时掌握社交网络正在传播的信息,现有的舆情与系统侧于舆情检测方法的研究,对于社交网络数据的采集缺乏必要的研究与分析,存在如下问题:现有的社交网络数据主要基于“滚雪球”与基于关键字两种方法。“滚雪球”方法基于某一个用户中的好友信息获取社交网络信息,这种方法收集的数据具有较强的同质性和片面性。基于关键字的收集方法的局限性在于用户在采集数据之前需要提供舆情检索关键字,是一种事后分析方法,无法在舆情在传播之前产生严重结果之前发掘舆情。
发明内容
本发明的目的就在于为了解决上述问题设计了一种社交网络数据采集方法及装置。
本发明通过以下技术方案来实现上述目的:
社交网络数据采集方法,包括:
1、社交网络数据采集方法,其特征在于,包括:
S1、获取初始社交网络用户;
S2、初始社交网络用户构建为候选集合,其中每个初始用户作为一个节点;
S3、对候选集合进行预处理去除冗余数据和同质节点得到第一集合,并将第一集合中的每个节点作为一个社区;
S4、计算每个社区加入其每个邻居社区时的收益度,并根据收益度将其加入邻居社区,其中收益度是用来度量社区内节点的连接边数与随机网络情况下的边的差异;
S5、判断每个社区的社区归属是否发生变化,若发生变化,则返回S4,反之则进入S6;
S6、选取监控节点;
S7、采集每个监控节点的社交网络内容信息和用户标签信息;
S8、爬虫调度器根据监控节点产生数据进行爬取任务,获取爬取任务的指定数据;
S9、网页解析器解析指定数据获得目标数据并存放至数据库。
社交网络数据采集装置,包括存储器和处理器,储存器用于存储程序,处理器用于通过调用存储在存储器中的程序,以执行如上述的社交网络数据采集方法。
一种储存介质,用于计算机,所述储存介质上存储有程序,所述程序被处理器读执行时实现如上述的社交网络数据采集方法的步骤。
本发明的有益效果在于:本方法能够在海量的社交网络用户节点中选择出社交网络传播信息的关键节点,并以关键节点作为监控节点,实时感知社交网络中正在传播的舆情。克服现有“滚雪球”收据收集方法片面同质的问题,克服“关键字”收集方法无法实时感知网络舆情,只能事后分析的局限性。
附图说明
图1是本发明社交网络数据采集方法的采集示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要理解的是,术语“上”、“下”、“内”、“外”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,或者是本领域技术人员惯常理解的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,“设置”、“连接”等术语应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接连接,也可以通过中间媒介间接连接,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
下面结合附图,对本发明的具体实施方式进行详细说明。
如图1所示,社交网络数据采集方法,本实施例的社交网络选择微博进行详细说明,包括:
S1、根据该社交网络中各领域影响力榜单选取初始社交网络用户。
S2、初始社交网络用户构建为候选集合,其中每个初始用户作为一个节点。
S3、对候选集合进行预处理去除冗余数据和同质节点得到第一集合,并将第一集合中的每个节点作为一个社区,具体包括:
S31、对候选集合进行冗余检测去除冗余的节点,候选集合为U,U={v1, v2, v3…vn},去除冗余后的集合为U`,U`={v1, v2, …vm},其中vi表示集合中第i个节点,n表示获取初始用户节点的数目,节点vi={uid,{关注用户列表},{被关注好友列表}},uid为在该社交网络中唯一的数字标识符,m表示去除冗余后集合中用户节点的数目;
S32、计算集合U`的同质节点,表示为:
isSame(vi,vj)=(|{vi节点关注好友对象}∩{vj节点关注好友对象}|+|{vi节点被关注好友对象}∩{vj节点被关注好友对象}|)/(|{vi节点关注好友对象}∪{vj节点关注好友对象}|+|{vi节点被关注好友对象}∪{vj节点被关注好友对象}|),
其中,|{vi节点关注好友对象}∩{vj节点关注好友对象}|表示节点vi与节点vj共同关注用户的数目,|{vi节点被关注好友对象}∩{vj节点被关注好友对象}|表示节点vi与节点vj共同被关注用户的数目,|{vi节点关注好友对象}∪{vj节点关注好友对象}|表示节点vi或节点vj关注的用户数目,|{vi节点被关注好友对象}∪{vj节点被关注好友对象}|表示被节点vi或节点vj关注的用户的数目;
S33、去除isSame(vi,vj)中函数值大于0.5的vj节点,得到第一集合,并将第一集合中的每个节点作为一个社区。
S4、计算每个社区加入其每个邻居社区时的收益度,并根据收益度将其加入邻居社区,其中收益度是用来度量社区内节点的连接边数与随机网络情况下的边的差异,具体包括:
S41、社区内的边的权重设置为0,并遍历其四阶好友节点,计算每个社区加入其每个邻居社区时的收益度,表示为,其中,Aij是表示节点vi与节点vj之间的邻接关系,如果Aij=1表示节点vi与节点vj之间邻接,否则Aij=0,∑jAij表示所有与节点vi邻接的节点的度数之和,ci表示节点vi所属的社区,其中u表示初始用户节点集合中的任一用户节点,v表示节点u的可能的邻居节点,ki与kj分别表示节点vi和节点vj的度数,度数为进入节点边和从节点出去边的和;
S42、将节点vi分配到邻居节点vj所在的社区cj引发的收益度变化为=,其中∑in为社区内内部节点的度数之和,ki,in为社区节点与节点vi邻接的数目,∑tot表示由社区网络内部节点结合in对应的节点随机构建的网络的内部节点度数之和;
S43、选择收益度变化最大的邻居社区,将节点vi加入到该社区。
S5、判断每个社区的社区归属是否发生变化,若发生变化,则返回S4,反之则进入S6。
S6、选取监控节点,具体包括:
S61、计算每个社区的拉普拉斯矩阵,社区拉普拉斯矩阵L=D-A,其中D矩阵为社区矩阵的度矩阵,A矩阵为社区矩阵的邻接矩阵,有,,其中dij表示节点i的出度,aij表示节点i和节点j之间是否有链接,值为1,表示有链接,否则值为0;
S62、计算每个节点主子矩阵最小特征值,并根据最小特征值选择节点作为关键节点;
S63、判断选取的关键节点数量是否小于预设的关键节点数量,若大于则返回S62,反之,则将关键节点作为监控节点,并进入S7。
S7、采用基于API与模拟登录的方式获取数据,利用社交网络中的API模块获取发布信息、相关用户的个人详细信息、用户关注关系、转发关系和评论关系,如下表1所示。
S8、爬虫调度器根据监控节点产生数据进行爬取任务,获取爬取任务的指定数据。
S9、网页解析器解析指定数据获得目标数据并存放至数据库。
表1
社交网络数据采集装置,包括存储器和处理器,储存器用于存储程序,处理器用于通过调用存储在存储器中的程序,以执行如上述的社交网络数据采集方法。
一种储存介质,用于计算机,所述储存介质上存储有程序,所述程序被处理器读执行时实现如上述的社交网络数据采集方法的步骤。
本方法能够在海量的社交网络用户节点中选择出社交网络传播信息的关键节点,并以关键节点作为监控节点,实时感知社交网络中正在传播的舆情。克服现有“滚雪球”收据收集方法片面同质的问题,克服“关键字”收集方法无法实时感知网络舆情,只能事后分析的局限性。
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。
Claims (8)
1.社交网络数据采集方法,其特征在于,包括:
S1、获取初始社交网络用户;
S2、初始社交网络用户构建为候选集合,其中每个初始用户作为一个节点;
S3、对候选集合进行预处理去除冗余数据和同质节点得到第一集合,并将第一集合中的每个节点作为一个社区;
S4、计算每个社区加入其每个邻居社区时的收益度,并根据收益度将其加入邻居社区,其中收益度是用来度量社区内节点的连接边数与随机网络情况下的边的差异;
S5、判断每个社区的社区归属是否发生变化,若发生变化,则返回S4,反之则进入S6;
S6、选取监控节点;
S7、采集每个监控节点的社交网络内容信息和用户标签信息;
S8、爬虫调度器根据监控节点产生数据进行爬取任务,获取爬取任务的指定数据;
S9、网页解析器解析指定数据获得目标数据并存放至数据库。
2.根据权利要求1所述的社交网络数据采集方法,其特征在于,在S3中包括:
S31、对候选集合进行冗余检测去除冗余的节点,候选集合为U,U={v1, v2, v3…vn},去除冗余后的集合为U`,U`={v1, v2, …vm},其中vi表示集合中第i个节点,n表示获取初始用户节点的数目,节点vi={uid,{关注用户列表},{被关注好友列表}},uid为在该社交网络中唯一的数字标识符,m表示去除冗余后集合中用户节点的数目;
S32、计算集合U`的同质节点,表示为:
isSame(vi,vj)=(|{vi节点关注好友对象}∩{vj节点关注好友对象}|+|{vi节点被关注好友对象}∩{vj节点被关注好友对象}|)/(|{vi节点关注好友对象}∪{vj节点关注好友对象}|+|{vi节点被关注好友对象}∪{vj节点被关注好友对象}|)
其中,|{vi节点关注好友对象}∩{vj节点关注好友对象}|表示节点vi与节点vj共同关注用户的数目,|{vi节点被关注好友对象}∩{vj节点被关注好友对象}|表示节点vi与节点vj共同被关注用户的数目,|{vi节点关注好友对象}∪{vj节点关注好友对象}|表示节点vi或节点vj关注的用户数目,|{vi节点被关注好友对象}∪{vj节点被关注好友对象}|表示被节点vi或节点vj关注的用户的数目;
S33、去除isSame(vi,vj)中函数值大于0.5的vj节点,得到第一集合,并将第一集合中的每个节点作为一个社区。
3.根据权利要求2所述的社交网络数据采集方法,其特征在于,在S4中包括:
S41、社区内的边的权重设置为0,并遍历其四阶好友节点,计算每个社区加入其每个邻居社区时的收益度,表示为,其中,Aij是表示节点vi与节点vj之间的邻接关系,如果Aij=1表示节点vi与节点vj之间邻接,否则Aij=0,∑jAij表示所有与节点vi邻接的节点的度数之和,ci表示节点vi所属的社区,其中u表示初始用户节点集合中的任一用户节点,v表示节点u的可能的邻居节点,ki与kj分别表示节点vi和节点vj的度数;
S42、将节点vi分配到邻居节点vj所在的社区cj引发的收益度变化为=,其中∑in为社区内内部节点的度数之和,ki,in为社区节点与节点vi邻接的数目,∑tot表示由社区网络内部节点结合in对应的节点随机构建的网络的内部节点度数之和;
S43、选择收益度变化最大的邻居社区,将节点vi加入到该社区。
5.根据权利要求2所述的社交网络数据采集方法,其特征在于,在S7中,采用基于API与模拟登录的方式获取数据,利用社交网络中的API模块获取发布信息、相关用户的个人详细信息、用户关注关系、转发关系和评论关系。
6.根据权利要求1所述的社交网络数据采集方法,其特征在于,在S1中,根据该社交网络中各领域影响力榜单选取初始社交网络用户。
7.社交网络数据采集装置,其特征在于,包括存储器和处理器,储存器用于存储程序,处理器用于通过调用存储在存储器中的程序,以执行如权利要求1-6中任一项所述的社交网络数据采集方法。
8.一种储存介质,用于计算机,其特征在于,所述储存介质上存储有程序,所述程序被处理器读执行时实现如权利要求1-6中任一项所述的社交网络数据采集方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210381972.4A CN114461930B (zh) | 2022-04-13 | 2022-04-13 | 社交网络数据采集方法、装置及储存介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210381972.4A CN114461930B (zh) | 2022-04-13 | 2022-04-13 | 社交网络数据采集方法、装置及储存介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114461930A true CN114461930A (zh) | 2022-05-10 |
CN114461930B CN114461930B (zh) | 2022-06-24 |
Family
ID=81418452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210381972.4A Active CN114461930B (zh) | 2022-04-13 | 2022-04-13 | 社交网络数据采集方法、装置及储存介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114461930B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130332460A1 (en) * | 2012-06-06 | 2013-12-12 | Derek Edwin Pappas | Structured and Social Data Aggregator |
CN103838831A (zh) * | 2014-02-21 | 2014-06-04 | 东南大学 | 一种基于社区划分的在线社交网络海量数据存储方法 |
CN104715047A (zh) * | 2015-03-26 | 2015-06-17 | 浪潮集团有限公司 | 一种社交网络数据采集与分析系统 |
CN105184326A (zh) * | 2015-09-30 | 2015-12-23 | 广东工业大学 | 基于图数据的主动学习多标签社交网络数据分析方法 |
CN106055627A (zh) * | 2016-05-27 | 2016-10-26 | 西安电子科技大学 | 话题领域中社交网络关键节点的识别方法 |
CN107358534A (zh) * | 2017-06-29 | 2017-11-17 | 浙江理工大学 | 社交网络的无偏数据采集系统及采集方法 |
CN108537542A (zh) * | 2018-04-02 | 2018-09-14 | 北京天材科技有限公司 | 用于社交网络的数据处理方法 |
CN109460299A (zh) * | 2018-11-08 | 2019-03-12 | 中山大学 | 一种分布式并行多源社交网络数据采集系统和方法 |
CN109522460A (zh) * | 2018-08-30 | 2019-03-26 | 中国电子进出口有限公司 | 一种基于社交网络社团划分的舆情监测方法及系统 |
CN109635201A (zh) * | 2018-12-18 | 2019-04-16 | 苏州大学 | 异质社交网络跨平台关联用户账户挖掘方法 |
CN109902216A (zh) * | 2019-03-04 | 2019-06-18 | 桂林电子科技大学 | 一种基于社交网络的数据采集与分析方法 |
CN110019090A (zh) * | 2017-12-01 | 2019-07-16 | 广州明领基因科技有限公司 | 基于众包思想的社交网络大数据采集系统 |
CN111222029A (zh) * | 2020-01-16 | 2020-06-02 | 西安交通大学 | 一种网络舆情信息传播中关键节点选择方法 |
CN114186118A (zh) * | 2021-12-08 | 2022-03-15 | 深圳市网联安瑞网络科技有限公司 | 一种网络舆情话题信息处理系统、方法、存储介质、终端 |
-
2022
- 2022-04-13 CN CN202210381972.4A patent/CN114461930B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130332460A1 (en) * | 2012-06-06 | 2013-12-12 | Derek Edwin Pappas | Structured and Social Data Aggregator |
CN103838831A (zh) * | 2014-02-21 | 2014-06-04 | 东南大学 | 一种基于社区划分的在线社交网络海量数据存储方法 |
CN104715047A (zh) * | 2015-03-26 | 2015-06-17 | 浪潮集团有限公司 | 一种社交网络数据采集与分析系统 |
CN105184326A (zh) * | 2015-09-30 | 2015-12-23 | 广东工业大学 | 基于图数据的主动学习多标签社交网络数据分析方法 |
CN106055627A (zh) * | 2016-05-27 | 2016-10-26 | 西安电子科技大学 | 话题领域中社交网络关键节点的识别方法 |
CN107358534A (zh) * | 2017-06-29 | 2017-11-17 | 浙江理工大学 | 社交网络的无偏数据采集系统及采集方法 |
CN110019090A (zh) * | 2017-12-01 | 2019-07-16 | 广州明领基因科技有限公司 | 基于众包思想的社交网络大数据采集系统 |
CN108537542A (zh) * | 2018-04-02 | 2018-09-14 | 北京天材科技有限公司 | 用于社交网络的数据处理方法 |
CN109522460A (zh) * | 2018-08-30 | 2019-03-26 | 中国电子进出口有限公司 | 一种基于社交网络社团划分的舆情监测方法及系统 |
CN109460299A (zh) * | 2018-11-08 | 2019-03-12 | 中山大学 | 一种分布式并行多源社交网络数据采集系统和方法 |
CN109635201A (zh) * | 2018-12-18 | 2019-04-16 | 苏州大学 | 异质社交网络跨平台关联用户账户挖掘方法 |
CN109902216A (zh) * | 2019-03-04 | 2019-06-18 | 桂林电子科技大学 | 一种基于社交网络的数据采集与分析方法 |
CN111222029A (zh) * | 2020-01-16 | 2020-06-02 | 西安交通大学 | 一种网络舆情信息传播中关键节点选择方法 |
CN114186118A (zh) * | 2021-12-08 | 2022-03-15 | 深圳市网联安瑞网络科技有限公司 | 一种网络舆情话题信息处理系统、方法、存储介质、终端 |
Non-Patent Citations (4)
Title |
---|
DANIEL RÖCHERT 等: ""Opinion-based Homogeneity on YouTube Combining Sentiment and Social Network Analysis"", 《COMPUTATIONAL COMMUNICATION RESEARCH》 * |
WEIXIN_39845113: ""python爬取数据分析_使用Python爬取社交网络数据分析"", 《HTTPS://BLOG.CSDN.NET/WEIXIN_39845113/ARTICLE/DETAILS/110315368》 * |
尹雅丽: ""社交网络数据采集方法研究及社团结构分析"", 《现代计算机(专业版)》 * |
徐雁飞 等: ""社交网络数据采集技术研究与应用"", 《计算机科学》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114461930B (zh) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11070643B2 (en) | Discovering signature of electronic social networks | |
Yang et al. | Friend or frenemy? Predicting signed ties in social networks | |
EP1738524B1 (en) | Method and system for generating a population representative of a set of users of a communication network | |
CN111125453B (zh) | 基于子图同构的社交网络中意见领袖角色识别方法及存储介质 | |
Yang et al. | Using reputation management in participatory sensing for data classification | |
CN113971527A (zh) | 基于机器学习的数据风险评估方法及装置 | |
Kadry et al. | Social network analysis: An introduction with an extensive implementation to a large-scale online network using Pajek | |
Le et al. | Retrieving people: Identifying potential answerers in community question‐answering | |
CN112612942A (zh) | 一种基于社交大数据的基金推荐系统及方法 | |
CN113569162A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN109829593B (zh) | 目标对象的信用度确定方法、装置、存储介质及电子装置 | |
Park et al. | Hackers hedging bets: A cross-community analysis of three online hacking forums | |
CN114461930B (zh) | 社交网络数据采集方法、装置及储存介质 | |
Colbaugh et al. | Emerging topic detection for business intelligence via predictive analysis of'meme'dynamics | |
Zhu et al. | Understanding users’ information dissemination behaviors on Douyin, a short video mobile application in China | |
Sandim et al. | The Role of Social Capital in Information Diffusion over Twitter: A Study Case over Brazilian Posts. | |
CN116150470A (zh) | 内容推荐方法、装置、设备、存储介质及程序产品 | |
Al-garadi et al. | Applications of big social media data analysis: An overview | |
CN111460300A (zh) | 网络内容推送方法、装置及存储介质 | |
Ouyang et al. | critical factors for B2C e-commerce in China | |
Mir et al. | An Adaptive Classification Framework for Handling the Cold Start Problem in Case of News Items | |
Ranganath et al. | Finding time-critical responses for information seeking in social media | |
Glass et al. | Toward Emerging Topic Detection for Business Intelligence: Predictive Analysis ofMeme'Dynamics | |
US11550859B2 (en) | Analytics system entity resolution | |
Hafiene et al. | Influential Nodes Prediction Based on the Structural and Semantic Aspects of Social Media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |