CN105933203B - 一种社交网络综合分析方法 - Google Patents
一种社交网络综合分析方法 Download PDFInfo
- Publication number
- CN105933203B CN105933203B CN201610229518.1A CN201610229518A CN105933203B CN 105933203 B CN105933203 B CN 105933203B CN 201610229518 A CN201610229518 A CN 201610229518A CN 105933203 B CN105933203 B CN 105933203B
- Authority
- CN
- China
- Prior art keywords
- social networks
- data
- network sites
- social network
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 79
- 230000003993 interaction Effects 0.000 claims abstract description 11
- 241000270322 Lepidosauria Species 0.000 claims description 5
- 230000008676 import Effects 0.000 claims description 4
- 210000003813 thumb Anatomy 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 8
- 244000097202 Rathbunia alamosensis Species 0.000 description 9
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 9
- 230000008901 benefit Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/234—Monitoring or handling of messages for tracking messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/48—Message addressing, e.g. address format or anonymous messages, aliases
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种社交网络综合分析方法,通过对社交网络账号相关数据进行采集,并根据采集的信息分析多个社交网络账号之间的最短距、互动情况和关联情况,从而获取更多的嫌疑人在社交网络的活动情况,解决当前办案分析人员采用社交网络综合分析方法,通过社交网络调查嫌疑人时工作负担过重的问题,进一步提高工作效率。同时本发明所述社交网络综合分析方法具有良好的实用性、可靠性和安全性。
Description
技术领域
本发明涉及网络信息分析技术领域,具体涉及一种社交网络综合分析方法。
背景技术
随着网络的普及、计算机技术的发展,互联网正以前所未有的深度和广度影响着人们工作和生活的方方面面。例如对于犯罪嫌疑人犯罪证据的提取,除了原有的传统取证外,采用社交网络综合分析方法,通过社交网络进行取证的方式也被广泛运用。目前采用的社交网络综合分析方法以人工手动点击网页来调查嫌疑人的方式进行,但随着国内外各种社交网络的兴起以及数据量日益增长,这大大增加了办案分析人员调查时的工作负担。
发明内容
本发明所要解决的技术问题是实现自动分析嫌疑人在社交网络的活动情况,目的在于提供一种社交网络综合分析方法,解决当前办案分析人员采用社交网络综合分析方法,通过社交网络调查嫌疑人时工作负担过重的问题。
本发明通过下述技术方案实现:
一种社交网络综合分析方法,包括如下步骤:
A、将社交网站主页地址或社交网站账号放入分析系统任务队列;
B、分步式爬虫领取任务队列中的任务,对任务的相关数据进行采集,并将采集的数据回传分析系统;
C、分析系统根据采集的数据对N个社交网站账号进行分析,获得N个社交网站账号之间的最短距、互动情况和关联情况,其中,N为大于等于2的正整数。
特别地,所述步骤B具体包括:
B1、分布式爬虫领取任务队列中的任务,对任务的相关数据进行采集,将采集的数据回传分析系统;
B2、分析系统判断采集的数据所处的层级是否达到系统设置的最大层级限制,若未达到,则将采集的数据作为新任务加入任务队列,再返回执行步骤B1;若达到,则直接将采集的数据导入分析系统数据库。
特别地,所述步骤B中的任务的相关数据包括但不限于社交网站账号在该社交网站的个人信息、发表的日志、博客、好友、关注人、留言、评论、点赞。
特别地,所述社交网络综合分析方法还包括步骤D:对回传到分析系统的采集数据进行搜索。
特别地,所述社交网络综合分析方法还包括步骤E:对包括但不限于与社交网站账号相关的邮箱、电话、账号、域名及身份证号码的社工信息进行提取。
特别地,所述步骤C中获得的N个社交网站账号之间的最短距、互动情况和关联情况作为分析结果输出到用户页面进行动态展示。
本发明与现有技术相比,具有如下的优点和有益效果:
所述一种社交网络综合分析方法,能够对社交网络自动进行分析,避免传统的分析方法依靠人工手工点击网页的方式对社交网络进行分析的问题,减轻了办案分析人员的工作负担,进一步提高了工作效率。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明实施例1提供的社交网络综合分析方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
如图1所示,图1为本发明实施例1提供的社交网络综合分析方法流程图。
本实施例中,社交网络综合分析方法具体包括:
S101、将社交网站主页地址或社交网站账号放入分析系统任务队列。
办案分析人员针对嫌疑人在某社交网站的活动情况进行调查时,将该嫌疑人在该社交网站的账号或该社交网站主页地址提交到分析系统,分析系统将其放入任务队列。例如,办案分析人员针对嫌疑人在新浪微博中的活动情况进行调查时,获悉嫌疑人在新浪微博中注册账号为X,则将X的新浪微博主页地址和/或账号X提交到分析系统,分析系统将其放入任务队列。
S102、分布式爬虫领取任务队列中的任务,对任务的相关数据进行采集,并将采集的数据回传分析系统。
分布式爬虫领取任务列队中的任务,对该社交网站的该社交网站账号的相关数据进行采集,所述相关数据包括但不限于社交网站账号在该社交网站的个人信息、发表的日志、博客、好友、关注人、留言、评论、点赞等信息,并将采集的数据回传分析系统。仍以上述办案分析人员针对嫌疑人在新浪微博中的活动情况进行调查时,获悉嫌疑人在新浪微博中注册账号为X为例,分布式爬虫对于账号X发布的博客、日志及账号X的好友、关注人以及对账号X发布的博客、日志信息进行的留言、评论和点赞等的信息进行采集。
S103、分析系统判断采集的数据所处的层级是否达到系统设置的最大层级限制。
分析系统内部预设数据采集最大层级限制,判断采集的数据所处的层级是否达到系统设置的最大层级限制,若未达到,则将采集的数据作为新任务加入任务队列,再返回执行步骤B1;若达到,则直接将采集的数据导入分析系统数据库。所述采集的数据包括但不限于该社交网站账号的其他联系人账号、好友、关注人、关注者。本实施例中分析系统设置的最大层级限制为3级,仍以上述办案分析人员针对嫌疑人在新浪微博中的活动情况进行调查时,获悉嫌疑人在新浪微博中注册账号为X为例,分析系统对于账号X进行采集获取的数据包括X1、X2,则将X1、X2返回,分析系统判断X1、X2所处的层级是2级,则判断未达到系统设置的最大层级限制,将X1、X2作为新任务加入任务队列,再返回执行步骤S102,对与X1相关的数据和与X2相关的数据进行采集。分析系统对于X1进行采集获取的数据包括X11、X12,对于X2进行采集获取的数据包括X21、X22,则将X11、X12 、X21、X22返回,分析系统判断X11、X12 、X21、X22所处的层级是3级,则判断达到系统设置的最大层级限制,则执行步骤S104。需要说明的是,所述分析系统内部预设数据采集最大层级限制根据实际应用中具体情况进行调整。
S104、分析系统将采集的数据导入分析系统数据库。
当分析系统判断采集的数据所处的层级已经达到系统设置的最大层级限制时,将采集的数据导入分析系统数据库。仍以上述办案分析人员针对嫌疑人在新浪微博中的活动情况进行调查时,获悉嫌疑人在新浪微博中注册账号为X为例,判断X11、X12 、X21、X22所处的层级达到系统设置的最大层级限制,则将X11、X12 、X21、X22导入分析系统数据库。
S105、分析系统根据采集的数据对N个社交网站账号进行分析,获得N个社交网站账号之间的最短距、互动情况和关联情况。
办案分析人员提交两个或多个社交网站账号,分别对社交网站账号的相关数据进行采集,并根据采集的数据对社交网站账号之间的关系进行分析,获得各个社交网站账号之间的最短距、互动情况和关联情况。例如,办案分析人员提交X、Y两个社交网站账号,对X进行采集获得的数据包括X11、X12 、X21、X22, 对Y进行采集获得的数据包括Y11、Y12、Y21、Y22,比较X11、X12 、X21、X22与Y11、Y12、Y21、Y22之间的一致性,获取各个社交网站账号之间的最短距、互动情况和关联情况。
S106、N个社交网站账号之间的最短距、互动情况和关联情况作为分析结果输出到用户页面进行动态展示。
各个网站账号之间的最短距、互动情况和关联情况作为分析结果输出到用户页面,以数字、图表等形式进行动态展示。
需要说明的是,本实施例中,还可以对分析系统采集的数据进行搜索,提交关键词,如点赞,则可以自动搜索出采集的数据中的点赞信息,其他信息提交对应的关键词即可。
需要说明的是,本实施例中,还可以通过插件对采集的数据进行邮箱、电话、账号、域名及身份证号码的社工信息提取。
本发明的技术方案应用于社交网络综合分析系统,对社交网络账号相关数据进行采集,并根据采集的信息分析多个社交网络账号之间的最短距、互动情况和关联情况,从而获取更多的嫌疑人在社交网络的活动情况,解决当前办案分析人员采用社交网络综合分析方法,通过社交网络调查嫌疑人时工作负担过重的问题,进而提高工作效率。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种社交网络综合分析方法,其特征在于,包括如下步骤:
A、将社交网站主页地址或社交网站账号放入分析系统任务队列;
B、分步式爬虫领取任务队列中的任务,对任务的相关数据进行采集,并将采集的数据回传分析系统;
C、分析系统根据采集的数据对N个社交网站账号进行分析,获得N个社交网站账号之间的最短距、互动情况和关联情况,其中,N为大于等于2的正整数;所述步骤B具体包括:
B1、分布式爬虫领取任务队列中的任务,对任务的相关数据进行采集,将采集的数据回传分析系统;
B2、分析系统判断采集的数据所处的层级是否达到系统设置的最大层级限制,若未达到,则将采集的数据作为新任务加入任务队列,再返回执行步骤B1;若达到,则直接将采集的数据导入分析系统数据库。
2.根据权利要求1所述的社交网络综合分析方法,其特征在于,所述步骤B中的任务的相关数据包括但不限于社交网站账号在该社交网站的个人信息、发表的日志、博客、好友、关注人、留言、评论、点赞。
3.根据权利要求1所述的社交网络综合分析方法,其特征在于,还包括步骤D:对回传到分析系统的采集数据进行搜索。
4.根据权利要求1所述的社交网络综合分析方法,其特征在于,还包括步骤E:对包括但不限于与社交网站账号相关的邮箱、电话、账号、域名及身份证号码的社工信息进行提取。
5.根据权利要求1所述的社交网络综合分析方法,其特征在于,所述步骤C中获得的N个社交网站账号之间的最短距、互动情况和关联情况作为分析结果输出到用户页面进行动态展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610229518.1A CN105933203B (zh) | 2016-04-14 | 2016-04-14 | 一种社交网络综合分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610229518.1A CN105933203B (zh) | 2016-04-14 | 2016-04-14 | 一种社交网络综合分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105933203A CN105933203A (zh) | 2016-09-07 |
CN105933203B true CN105933203B (zh) | 2019-03-26 |
Family
ID=56839033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610229518.1A Active CN105933203B (zh) | 2016-04-14 | 2016-04-14 | 一种社交网络综合分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105933203B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109088908A (zh) * | 2018-06-06 | 2018-12-25 | 武汉酷犬数据科技有限公司 | 一种面向网络的分布式通用数据采集方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870510A (zh) * | 2012-12-17 | 2014-06-18 | 华中科技大学 | 一种基于分布式并行处理模式的社交网络好友过滤方法 |
CN104408149A (zh) * | 2014-12-04 | 2015-03-11 | 威海北洋电气集团股份有限公司 | 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统 |
CN104516954A (zh) * | 2014-12-15 | 2015-04-15 | 公安部第一研究所 | 一种可视化取证分析系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080301099A1 (en) * | 2007-05-31 | 2008-12-04 | Marc Demarest | Systems and methods for using proxies in social network analysis in electronic evidence management |
-
2016
- 2016-04-14 CN CN201610229518.1A patent/CN105933203B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870510A (zh) * | 2012-12-17 | 2014-06-18 | 华中科技大学 | 一种基于分布式并行处理模式的社交网络好友过滤方法 |
CN104408149A (zh) * | 2014-12-04 | 2015-03-11 | 威海北洋电气集团股份有限公司 | 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统 |
CN104516954A (zh) * | 2014-12-15 | 2015-04-15 | 公安部第一研究所 | 一种可视化取证分析系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105933203A (zh) | 2016-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Motoyama et al. | I seek you: searching and matching individuals in social networks | |
CN107169873B (zh) | 一种多特征融合的微博用户权威度评价方法 | |
Hall et al. | Editorial of the special issue on following user pathways: Key contributions and future directions in cross-platform social media research | |
CN103067387B (zh) | 一种反钓鱼监测系统和方法 | |
Lee et al. | The dialogic potential of social media: Assessing the ethical reasoning of companies' public relations on Facebook and Twitter | |
CN106126654B (zh) | 一种基于用户名相似度的跨网站用户关联方法 | |
CN106302849A (zh) | 一种通过运营商数据进行移固融合的方法 | |
CN103729479A (zh) | 基于分布式文件存储的网站页面内容统计的方法和系统 | |
CN103929477B (zh) | 基于Http协议的系统间无耦合集成模拟方法及系统 | |
CN109064068A (zh) | 一种满意度调查系统 | |
Alrobaian et al. | Cybersecurity awareness assessment among trainees of the technical and vocational training corporation | |
Bothner et al. | Do lawsuits by ENGOs improve environmental quality? Results from the field of air pollution policy in Germany | |
Tuyishime et al. | Enhancing cloud security—proactive threat monitoring and detection using a siem-based approach | |
CN107590265A (zh) | 一种基于网络爬虫的网站行政归属识别方法 | |
CN105933203B (zh) | 一种社交网络综合分析方法 | |
Lu et al. | Research on forensic model of online social network | |
Itakura et al. | Incorporating firm heterogeneity into the GTAP Model | |
Hauschild et al. | The influence of technologies in increasing transparency in textile supply chains | |
New Zealand Human Rights Commission | Caring Counts, Tautiaki tika | |
CN107579975A (zh) | 网站信息实时监控系统 | |
CN104866532B (zh) | 一种用于半封闭数据环境下的数据搜索的方法和装置 | |
Antou et al. | The Impact Of Leadership Style, Job Motivation And Job Satisfaction On The Employee Performance Of Manado Adventist Hospital | |
Caggiano et al. | Public and local policymaker preferences for large-scale energy project characteristics | |
CN101853271A (zh) | 一种用户需求的分析方法及装置 | |
Kabanda et al. | Effect of Internet of Things on Competitive Edge in the Rwandan Telecommunication Landscape: A Case of MTN Rwandacell PLC |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230601 Address after: F13, Building 11, Zone D, New Economic Industrial Park, No. 99, West Section of Hupan Road, Xinglong Street, Tianfu New District, Chengdu, Sichuan, 610000 Patentee after: Sichuan Shenhu Technology Co.,Ltd. Address before: No.5, 1st floor, unit 1, building 19, 177 Tianfu Avenue, high tech Zone, Chengdu, Sichuan 610000 Patentee before: SICHUAN CINGHOO TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |