CN108804527A - 基于微信区域朋友圈数据分析系统及方法 - Google Patents
基于微信区域朋友圈数据分析系统及方法 Download PDFInfo
- Publication number
- CN108804527A CN108804527A CN201810400819.5A CN201810400819A CN108804527A CN 108804527 A CN108804527 A CN 108804527A CN 201810400819 A CN201810400819 A CN 201810400819A CN 108804527 A CN108804527 A CN 108804527A
- Authority
- CN
- China
- Prior art keywords
- information
- account
- circle
- friends
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000007405 data analysis Methods 0.000 title claims abstract description 14
- 230000000007 visual effect Effects 0.000 claims abstract description 179
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000008451 emotion Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 3
- 239000004744 fabric Substances 0.000 claims 3
- 230000010365 information processing Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 abstract description 3
- 230000004807 localization Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/222—Monitoring or handling of messages using geographical location information, e.g. messages transmitted or received in proximity of a certain spot or area
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于微信区域朋友圈数据分析系统,包括:账户采集模块,账户消重模块,账户存储模块;信息采集模块,用于连续多次采集该限定区域内的朋友圈可见信息;信息消重模块,过滤掉该限定区域内在该次采集的朋友圈可见信息中以前已经出现过的朋友圈可见信息,得到新的朋友圈可见信息;信息存储模块,用于接收并储存新的朋友圈可见信息。本发明还公开了一种基于微信区域朋友圈数据分析方法。本发明实现了对限定区域内的所有微信用户的朋友圈可见信息进行了全面的分析,及时监测舆情,有效预警突发事件,防患于未然。
Description
技术领域
本发明涉及信息技术领域,具体是一种基于微信区域朋友圈数据分析系统及方法。
背景技术
随着移动互联网的迅猛发展,人们不再局限于新闻网站、论坛、博客等传统传播媒体。微信、微博、移动APP已成为现代人转播和获取信息的重要途径。随时随地获得第一手的新闻资讯、热门话题、图片信息等,表达自己的观点,爆料身边的突发事件。信息以指数形式传播,其形成的舆论力量正深刻改变着中国的思想形态和社会面貌。言路的空前开放,使人们在畅所欲言的同时,也给各类“谣言”提供温床。
近年来微信发展迅速,渗透到了我们生活的方方面面。通过朋友圈分享身边事,评论、点赞亦或是转发好友信息。与传统媒介公开透明、人人皆可见的特性不同,朋友圈以其私密性著称。微信这些特点,使传统的数据分析系统不再适用,传统的数据分析系统只能针对某微信用户的好友朋友圈进行分析,其具有分析范围窄的缺陷,且好友朋友圈的信息也不能代表一个区域内的主流舆情,无法时时监测舆情,并给出具有指导性的预警提示。因此,亟需一种可以通过分析微信朋友圈信息而获得某区域内的舆情从而进行精确预警防范的微信朋友圈信息数据分析系统及方法。
发明内容
本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种基于微信区域朋友圈数据分析系统及方法,本发明实现了对限定区域内的所有微信用户的朋友圈可见信息进行了全面的分析,及时监测舆情,有效预警突发事件,防患于未然。
为了实现根据本发明的这些目的和其它优点,提供了一种基于微信区域朋友圈数据分析系统,包括:
账户采集模块,其用于连续多次采集限定区域内出现的所有微信用户的账户信息;
账户消重模块,其接收账户采集模块每次采集的账户信息,并过滤掉该限定区域内在该次采集的账户信息中以前已经出现过的账户信息,得到新的账户信息;
账户存储模块,其用于接收并储存新的账户信息,形成该限定区域的账户信息库;
信息采集模块,其用于连续多次采集该限定区域内出现的所有微信用户的朋友圈可见信息,该朋友圈可见信息附带发布时间属性以及账户账号属性;
信息消重模块,其接收信息采集模块每次采集的朋友圈可见信息,并过滤掉该限定区域内在该次采集的朋友圈可见信息中以前已经出现过的朋友圈可见信息,得到新的朋友圈可见信息;
信息存储模块,其用于接收并储存新的朋友圈可见信息,形成该限定区域的朋友圈可见信息库。
优选的是,账户采集模块每次采集账户信息的具体过程为:每次采集时捕获已经登录微信的设备在限定区域内搜索到的微信用户的网络数据流,从该网络数据流中获取含有微信用户的账户信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过遍历解析XML文档树中的节点,获取账户详情,再将账户详情解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成账户信息,其中,账户详情包括账户名、账户头像、账户账号、账户所在地区、陌生人ID、账户性别、朋友圈可见信息链接;
信息采集模块每次采集账户信息的具体过程为:访问朋友圈可见信息链接,捕获朋友圈可见信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过预存的信息模板解析获取朋友圈可见信息模板,再将朋友圈可见信息模板解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成朋友圈可见信息,其中,预存的信息模板包括均为无内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板,朋友圈可见信息模板包括均为有内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板。
优选的是,所述账户消重模块将每次接收到的账户信息均添加唯一标识I,具体为:所述账户消重模块从所述消息处理队列中获取账户信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识I,并将唯一标识I转换成易于存储与比较的唯一数字X,其中,同一相同账户信息对应一个相同的唯一数字X,账户消重模块接收账户采集模块每次采集的账户信息,将该次采集的所有账户信息对应的所有唯一数字X与以前已经出现过的账户信息分别对应的唯一数字X进行对比,过滤掉重复的唯一数字X,未重复的唯一数字X对应的账户信息形成新的账户信息;
所述信息消重模块将每次接收到的朋友圈可见信息均添加唯一标识II,具体为:所述账户消重模块从所述消息处理队列中获取朋友圈可见信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识II,并将唯一标识II转换成易于存储与比较的唯一数字Y,其中,同一微信用户的相同朋友圈可见信息对应一个相同的唯一数字Y,信息消重模块接收信息采集模块每次采集的朋友圈可见信息,将该次采集的所有朋友圈可见信息对应的所有唯一数字Y与以前已经出现过的朋友圈可见信息对应的唯一数字Y进行对比,过滤掉重复的唯一数字Y,未重复的唯一数字Y对应的账号信息形成新的朋友圈可见信息。
优选的是,还包括:
账户检索模块,其用于对账户信息库中的账户信息进行检索;
关注账户处理模块,其用于提取并储存预存的待关注账户的账户信息;
账户统计模块,其用于统计该限定区域内同一账户信息的出现频率、以及统计该账户信息在采集时出现的时刻;
信息检索模块,其用于朋友圈可见信息库中的朋友圈可见信息进行检索;
关注信息处理模块,其用于提取并储存含有预存的待关注的关键词的朋友圈可见信息;
话题处理模块,其用于从信息存储模块中提取该限定区域内朋友圈可见信息中出现的热门话题并储存;
信息情感分析模块,其用于对信息存储模块中的朋友圈可见信息进行情感分析,判断信息的情感倾向,若为积极,则将该朋友圈可见信息进行亮显标记;
信息统计模块,其用于统计该限定区域内出现的所有微信用户的朋友圈可见信息的发布总量,并计算日均发布量,统计微信用户储存在信息存储模块中的朋友圈可见信息为积极情感的比例。
优选的是,还包括:
所述账户检索模块中建立账户多节点索引,账户多节点索引将该限定区域内所出现的所有微信用户的账号信息的账户名属性作为索引字段,其余属性作为筛选字段;
所述信息检索模块中建立信息多节点索引,信息多节点索引将该限定区域内所出现的所有微信用户的朋友圈可见信息的正文作为检索字段,账户名、发布时间作为筛选字段。
优选的是,包括以下步骤:
步骤一、在可登录微信的设备上登录微信后,限定区域搜索微信用户,通过账户采集模块连续多次采集该限定区域内所出现的所有微信用户的账号信息,并通过信息采集模连续多次采集该限定区域内所出现的所有微信用户所公布的朋友圈可见信息,该朋友圈可见信息附带发布时间属性以及账户账号属性;
步骤二、通过账户消重模块对该限定区域内后次出现的所有微信用户的账户信息与该限定区域内前次出现的所有微信用户的账户信息进行消重处理,并将消重处理后的账户信息保存在账户存储模块,同时通过信息消重模块对该限定区域内后次出现的所有微信用户所公布的朋友圈可见信息与该限定区域内前次出现的所有微信用户所公布的朋友圈可见信息进行消重处理,并将消重处理后的朋友圈可见信息保存在信息存储模块。
优选的是,还包括步骤三、独立或同时进行以下操作:
a、通过账户检索模块或信息检索模块检索希望了解的微信用户或希望了解的朋友圈可见信息;
b、通过关注账户处理模块将预存的待关注账户的账户信息提取并储存,通过关注信息处理模块将预存的待关注的关键词提取并储存含有该关键词的朋友圈可见信息;
c、通过话题处理模块从信息存储模块中提取该限定区域内朋友圈可见信息中出现的热门话题并储存;
d、通过信息情感分析模块对信息存储模块中的朋友圈可见信息进行情感分析,判断信息的情感倾向,若为积极,则将该朋友圈可见信息进行亮显标记;
e、通过账户统计模块统计该限定区域内同一微信用户的出现频率、以及统计该微信用户在采集时出现的时刻;
f、通过信息统计模块统计限定区域内所出现的所有微信用户的朋友圈可见信息的发布总量,并计算日均发布量,统计每一个微信用户储存在信息存储模块中的朋友圈可见信息为积极情感的比例。
优选的是,步骤一中账户采集模块每次采集时捕获已经登录微信的设备在限定区域内的网络数据流,获取含有微信用户的账户信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过遍历解析XML文档树中的节点,获取账户详情,再将账户详情解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成账户信息,其中,账户详情包括账户名、账户头像、账户账号、账户所在地区、陌生人ID、账户性别、朋友圈可见信息链接;
步骤一中信息采集模块每次采集时访问朋友圈可见信息链接,捕获朋友圈可见信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过预存的信息模板解析获取朋友圈可见信息模板,再将朋友圈可见信息模板解析JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成朋友圈可见信息,其中,预存的信息模板包括均为无内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板,朋友圈可见信息模板包括均为有内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板。
优选的是,步骤二中所述账户消重模块将每次接收到的账户信息均添加唯一标识I,具体为:所述账户消重模块从所述消息处理队列中获取账户信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识I,并将唯一标识I转换成易于存储与比较的唯一数字X,其中,同一相同账户信息对应一个相同的唯一数字X,账户消重模块接收账户采集模块每次采集的账户信息,将该次采集的所有账户信息对应的所有唯一数字X与以前已经出现过的账户信息分别对应的唯一数字X进行对比,过滤掉重复的唯一数字X,未重复的唯一数字X对应的账户信息形成新的账户信息;
步骤二中所述信息消重模块将每次接收到的朋友圈可见信息均添加唯一标识II,具体为:所述账户消重模块从所述消息处理队列中获取朋友圈可见信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识II,并将唯一标识II转换成易于存储与比较的唯一数字Y,其中,同一微信用户的相同朋友圈可见信息对应一个相同的唯一数字Y,信息消重模块接收信息采集模块每次采集的朋友圈可见信息,将该次采集的所有朋友圈可见信息对应的所有唯一数字Y与以前已经出现过的朋友圈可见信息对应的唯一数字Y进行对比,过滤掉重复的唯一数字Y,未重复的唯一数字Y对应的账号信息形成新的朋友圈可见信息。
优选的是,步骤三中所述账户检索模块中建立账户多节点索引,账户多节点索引将该限定区域内所出现的所有微信用户的账号信息的账户名属性作为索引字段,其余属性作为筛选字段;
所述信息检索模块中建立信息多节点索引,信息多节点索引将该限定区域内所出现的所有微信用户的朋友圈可见信息的正文作为检索字段,账户名、发布时间作为筛选字段。
本发明至少包括以下有益效果:
本发通过在可登录微信的设备上登录微信后,通过请求修改该登录微信的设备的定位位置,使登录后的微信获取该登录微信的设备上的定位位置,从而实现对定位位置内的微信用户的搜索,实现了对限定区域内的微信用户的搜索,可根据需要对不同的限定区域内的微信用户进行搜索。实现了对限定区域内的所有微信用户的朋友圈可见信息进行了全面的分析,及时监测舆情,有效预警突发事件,防患于未然。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
如图1所示,本发明提供一种基于微信区域朋友圈数据分析系统,包括:
账户采集模块,其用于连续多次采集限定区域内出现的所有微信用户的账户信息,此处账户采集模块采集的是通过设备(比如手机)登录微信后,将该手机设备的定位区域定位在需要采集的限定区域,登录在该手机上的微信调取手机的定位区域,在该手机上已经登录的微信中搜索附近的人,即是在限定区域搜索,将搜索到的所有微信用户的账户信息进行采集;
账户消重模块,其接收账户采集模块每次采集的账户信息,并过滤掉该限定区域内在该次采集的账户信息中以前已经出现过的账户信息,得到新的账户信息,每次采集时都会对限定区域内在的账户信息进行采集,避免同一账户信息在两次或多次采集时倍重复采集;
账户存储模块,其用于接收并储存新的账户信息,形成该限定区域的账户信息库;
信息采集模块,其用于连续多次采集该限定区域内出现的所有微信用户的朋友圈可见信息,该朋友圈可见信息附带发布时间属性以及账户账号属性,此处账户采集模块采集的是通过设备(比如手机)登录微信后,将该手机设备的定位位置定位在需要采集的限定区域,登录在该手机上的微信调取手机的定位位置,在该手机上已经登录的微信中搜索附近的人,即是在限定区域搜索,将搜索到的所有微信用户的账户信息下对应的朋友圈可见信息进行采集,采集的朋友圈可见信息包括哪个账户账号在什么发布时间发布的什么内容;
信息消重模块,其接收信息采集模块每次采集的朋友圈可见信息,并过滤掉该限定区域内在该次采集的朋友圈可见信息中以前已经出现过的朋友圈可见信息,得到新的朋友圈可见信息,每次采集时都会对限定区域内在的朋友圈可见信息进行采集,消重时要考虑账户账号、发布时间、发布内容,避免同一微信用户的相同朋友圈可见信息在两次或多次采集时被重复采集;
信息存储模块,其用于接收并储存新的朋友圈可见信息,形成该限定区域的朋友圈可见信息库。
本发通过在可登录微信的设备上登录微信后,通过请求修改该登录微信的设备的定位位置,使登录后的微信获取该登录微信的设备上的定位位置,从而实现对定位位置内的微信用户的搜索,实现了对限定区域内的微信用户的搜索,可根据需要对不同的限定区域内的微信用户进行搜索。实现了对限定区域内的所有微信用户的朋友圈可见信息进行了全面的分析,及时监测舆情,有效预警突发事件,防患于未然。
在另一技术方案中,账户采集模块每次采集账户信息的具体过程为:每次采集时捕获已经登录微信的设备在限定区域内搜索到的微信用户的网络数据流,从该网络数据流中获取含有微信用户的账户信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过遍历解析XML文档树中的节点,解析的是对应有账户详情的节点,获取账户详情,再将账户详情解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成账户信息,即账户信息是以JSON字符串的形式存在,便于后台程序识别,其中,账户详情包括账户名、账户头像、账户账号、账户所在地区、陌生人ID、账户性别、朋友圈可见信息链接,陌生人ID是账户采集模块在获取的微信用户的账户信息中,会对前述已经登录的微信中不是该登录的微信的好友的微信用户的识别ID;
信息采集模块每次采集账户信息的具体过程为:访问朋友圈可见信息链接,捕获朋友圈可见信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过预存的信息模板解析获取朋友圈可见信息模板,再将朋友圈可见信息模板解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成朋友圈可见信息,即朋友圈可见信息是以JSON字符串的形式存在,便于后台程序识别,其中,预存的信息模板包括均为无内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板,预存的信息模板是根据以上模板类别建立的空模板,朋友圈可见信息模板包括均为有内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板,朋友圈可见信息模板是将采集到的朋友圈可见信息根据信息内容解析到相应预存的空模板中,形成有对应内容的朋友圈可见信息模板。
在另一技术方案中,所述账户消重模块将每次接收到的账户信息均添加唯一标识I,具体为:所述账户消重模块从所述消息处理队列中获取账户信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识I,并将唯一标识I转换成易于存储与比较的唯一数字X,其中,同一相同账户信息对应一个相同的唯一数字X,账户消重模块接收账户采集模块每次采集的账户信息,将该次采集的所有账户信息对应的所有唯一数字X与以前已经出现过的账户信息分别对应的唯一数字X进行对比,过滤掉重复的唯一数字X,未重复的唯一数字X对应的账户信息形成新的账户信息;
所述信息消重模块将每次接收到的朋友圈可见信息均添加唯一标识II,具体为:所述账户消重模块从所述消息处理队列中获取朋友圈可见信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识II,并将唯一标识II转换成易于存储与比较的唯一数字Y,其中,同一微信用户的相同朋友圈可见信息对应一个相同的唯一数字Y,信息消重模块接收信息采集模块每次采集的朋友圈可见信息,将该次采集的所有朋友圈可见信息对应的所有唯一数字Y与以前已经出现过的朋友圈可见信息对应的唯一数字Y进行对比,过滤掉重复的唯一数字Y,未重复的唯一数字Y对应的账号信息形成新的朋友圈可见信息。
在另一技术方案中,还包括:
账户检索模块,其用于对账户信息库中的账户信息进行检索,即根据给出的需要检索的账户信息完成检索,得到检索结果;
关注账户处理模块,其用于提取并储存预存的待关注账户的账号信息;
账户统计模块,其用于统计该限定区域内同一账户信息的出现频率、以及统计该账户信息在采集时出现的时刻;
信息检索模块,其用于朋友圈可见信息库中的朋友圈可见信息进行检索,即根据给出的需要检索的信息关键词完成检索,得到检索结果;
关注信息处理模块,其用于提取并储存含有预存的待关注的关键词的朋友圈可见信息;
话题处理模块,其用于从信息存储模块中提取该限定区域内朋友圈可见信息中出现的热门话题并储存,热门话题是话题处理模块自动提取出的出现频次高的朋友圈可见信息;
信息情感分析模块,其用于对信息存储模块中的朋友圈可见信息进行情感分析,判断信息的情感倾向,若为积极,则将该朋友圈可见信息进行亮显标记,信息情感分析模块利用现有技术中的神经网络进行情感分析,标记积极情感的朋友圈可见信息,便于后续统计,分析对应微信用户的近期心理状态,若觉得有异常,可提前预防;
信息统计模块,其用于统计该限定区域内出现的所有微信用户的朋友圈可见信息的发布总量,并计算日均发布量,统计微信用户储存在信息存储模块中的朋友圈可见信息为积极情感的比例,该比例可以是对同一个微信用户的朋友圈可见信息的统计,也可以是所有微信用户的朋友圈可见信息的统计。
在另一技术方案中,还包括:
所述账户检索模块中建立账户多节点索引,账户多节点索引将该限定区域内所出现的所有微信用户的账户信息的账户名属性作为索引字段,其余属性作为筛选字段,便于快速检索、精准检索,将检索到的结果毫秒返回;
所述信息检索模块中建立信息多节点索引,信息多节点索引将该限定区域内所出现的所有微信用户的朋友圈可见信息的正文作为检索字段,账户名、发布时间作为筛选字段,便于快速检索、精准检索,将检索到的结果毫秒返回。
本发明还提供一种基于微信区域朋友圈数据分析方法,包括以下步骤:
步骤一、在可登录微信的设备上登录微信后,限定区域搜索微信用户,通过账户采集模块连续多次采集该限定区域内所出现的所有微信用户的账号信息,并通过信息采集模连续多次采集该限定区域内所出现的所有微信用户所公布的朋友圈可见信息,该朋友圈可见信息附带发布时间属性以及账户账号属性;此处限定区域是通过设备(比如手机)登录微信后,将该手机设备的定位区域定位在需要采集的限定区域,登录在该手机上的微信调取手机的定位区域,在该手机上已经登录的微信中搜索附近的人,即是在限定区域搜索;
步骤二、通过账户消重模块对该限定区域内后次出现的所有微信用户的账户信息与该限定区域内前次出现的所有微信用户的账户信息进行消重处理,并将消重处理后的账户信息保存在账户存储模块,同时通过信息消重模块对该限定区域内后次出现的所有微信用户所公布的朋友圈可见信息与该限定区域内前次出现的所有微信用户所公布的朋友圈可见信息进行消重处理,并将消重处理后的朋友圈可见信息保存在信息存储模块。每次采集时都会对限定区域内在的账户信息进行采集,避免同一账户信息在两次或多次采集时倍重复采集。,每次采集时都会对限定区域内在的朋友圈可见信息进行采集,消重时要考虑账户账号、发布时间、发布内容,避免同一微信用户的相同朋友圈可见信息在两次或多次采集时被重复采集。
本发通过在可登录微信的设备上登录微信后,通过请求修改该登录微信的设备的定位位置,使登录后的微信获取该登录微信的设备上的定位位置,从而实现对定位位置内的微信用户的搜索,实现了对限定区域内的微信用户的搜索,可根据需要对不同的限定区域内的微信用户进行搜索。实现了对限定区域内的所有微信用户的朋友圈可见信息进行了全面的分析,及时监测舆情,有效预警突发事件,防患于未然。在另一技术方案中,还包括:步骤三、独立或同时进行以下操作:
a、通过账户检索模块或信息检索模块检索希望了解的微信用户或希望了解的朋友圈可见信息;通过账户检索模块根据给出的需要检索的账户信息完成检索,得到检索结果;通过信息检索模块根据给出的需要检索的信息关键词完成检索,得到检索结果;b、通过关注账户处理模块将预存的待关注账户的账户信息提取并储存,通过关注信息处理模块将预存的待关注的关键词提取并储存含有该关键词的朋友圈可见信息;有目标的对搜索到的微信用户中的账户信息以及其公开的朋友圈可见信息进行查看处理。
c、通过话题处理模块从信息存储模块中提取该限定区域内朋友圈可见信息中出现的热门话题并储存;热门话题是话题处理模块自动提取出的出现频次高的朋友圈可见信息;
d、通过信息情感分析模块对信息存储模块中的朋友圈可见信息进行情感分析,判断信息的情感倾向,若为积极,则将该朋友圈可见信息进行亮显标记;,信息情感分析模块利用现有技术中的神经网络进行情感分析,标记积极情感的朋友圈可见信息,便于后续统计,分析对应微信用户的近期心理状态,若觉得有异常,可提前预防;
e、通过账户统计模块统计该限定区域内同一账户信息的出现频率、以及统计该账户信息在采集时出现的时刻;账户信息直接唯一的对应了微信用户个体。
f、通过信息统计模块统计限定区域内所出现的所有微信用户的朋友圈可见信息的发布总量,并计算日均发布量,统计每一个微信用户储存在信息存储模块中的朋友圈可见信息为积极情感的比例。
实际应用时可根据需要查看以上所有的结果,便于宏观上对限定区域内微信用户的账户信息及其朋友圈可见信息进行分析,有效控制朋友圈舆情,并采取相应预防策略。
在另一技术方案中,步骤一中账户采集模块每次采集时捕获已经登录微信的设备在限定区域内的网络数据流,获取含有微信用户的账户信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过遍历解析XML文档树中的节点,获取账户详情,解析的是对应有账户详情的节点,再将账户详情解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成账户信息,即账户信息是以JSON字符串的形式存在,便于后台程序识别,其中,账户详情包括账户名、账户头像、账户账号、账户所在地区、陌生人ID、账户性别、朋友圈可见信息链接;陌生人ID是账户采集模块在获取的微信用户的账户信息中,会对前述已经登录的微信中不是该登录的微信的好友的微信用户的识别ID;
步骤一中信息采集模块每次采集时访问朋友圈可见信息链接,捕获朋友圈可见信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过预存的信息模板解析获取朋友圈可见信息模板,再将朋友圈可见信息模板解析JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成朋友圈可见信息,即朋友圈可见信息是以JSON字符串的形式存在,便于后台程序识别,其中,预存的信息模板包括均为无内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板,预存的信息模板是根据以上模板类别建立的空模板,朋友圈可见信息模板包括均为有内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板,朋友圈可见信息模板是将采集到的朋友圈可见信息根据信息内容解析到相应预存的空模板中,形成有对应内容的朋友圈可见信息模板。
在另一技术方案中,步骤二中所述账户消重模块将每次接收到的账户信息均添加唯一标识I,具体为:所述账户消重模块从所述消息处理队列中获取账户信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识I,并将唯一标识I转换成易于存储与比较的唯一数字X,其中,同一相同账户信息对应一个相同的唯一数字X,账户消重模块接收账户采集模块每次采集的账户信息,将该次采集的所有账户信息对应的所有唯一数字X与以前已经出现过的账户信息分别对应的唯一数字X进行对比,过滤掉重复的唯一数字X,未重复的唯一数字X对应的账户信息形成新的账户信息;
步骤二中所述信息消重模块将每次接收到的朋友圈可见信息均添加唯一标识II,具体为:所述账户消重模块从所述消息处理队列中获取朋友圈可见信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识II,并将唯一标识II转换成易于存储与比较的唯一数字Y,其中,同一微信用户的相同朋友圈可见信息对应一个相同的唯一数字Y,信息消重模块接收信息采集模块每次采集的朋友圈可见信息,将该次采集的所有朋友圈可见信息对应的所有唯一数字Y与以前已经出现过的朋友圈可见信息对应的唯一数字Y进行对比,过滤掉重复的唯一数字Y,未重复的唯一数字Y对应的账号信息形成新的朋友圈可见信息。
在另一技术方案中,步骤三中所述账户检索模块中建立账户多节点索引,账户多节点索引将该限定区域内所出现的所有微信用户的账号信息的账户名属性作为索引字段,其余属性作为筛选字段;便于快速检索、精准检索,将检索到的结果毫秒返回。
所述信息检索模块中建立信息多节点索引,信息多节点索引将该限定区域内所出现的所有微信用户的朋友圈可见信息的正文作为检索字段,账户名、发布时间作为筛选字段。便于快速检索、精准检索,将检索到的结果毫秒返回。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (10)
1.基于微信区域朋友圈数据分析系统,其特征在于,包括:
账户采集模块,其用于连续多次采集限定区域内出现的所有微信用户的账户信息;
账户消重模块,其接收账户采集模块每次采集的账户信息,并过滤掉该限定区域内在该次采集的账户信息中以前已经出现过的账户信息,得到新的账户信息;
账户存储模块,其用于接收并储存新的账户信息,形成该限定区域的账户信息库;
信息采集模块,其用于连续多次采集该限定区域内出现的所有微信用户的朋友圈可见信息,该朋友圈可见信息附带发布时间属性以及账户账号属性;
信息消重模块,其接收信息采集模块每次采集的朋友圈可见信息,并过滤掉该限定区域内在该次采集的朋友圈可见信息中以前已经出现过的朋友圈可见信息,得到新的朋友圈可见信息;
信息存储模块,其用于接收并储存新的朋友圈可见信息,形成该限定区域的朋友圈可见信息库。
2.如权利要求1所述的基于微信区域朋友圈数据分析系统,其特征在于,
账户采集模块每次采集账户信息的具体过程为:每次采集时捕获已经登录微信的设备在限定区域内搜索到的微信用户的网络数据流,从该网络数据流中获取含有微信用户的账户信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过遍历解析XML文档树中的节点,获取账户详情,再将账户详情解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成账户信息,其中,账户详情包括账户名、账户头像、账户账号、账户所在地区、陌生人ID、账户性别、朋友圈可见信息链接;
信息采集模块每次采集账户信息的具体过程为:访问朋友圈可见信息链接,捕获朋友圈可见信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过预存的信息模板解析获取朋友圈可见信息模板,再将朋友圈可见信息模板解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成朋友圈可见信息,其中,预存的信息模板包括均为无内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板,朋友圈可见信息模板包括均为有内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板。
3.如权利要求2所述的基于微信区域朋友圈数据分析系统,其特征在于,
所述账户消重模块将每次接收到的账户信息均添加唯一标识I,具体为:所述账户消重模块从所述消息处理队列中获取账户信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识I,并将唯一标识I转换成易于存储与比较的唯一数字X,其中,同一相同账户信息对应一个相同的唯一数字X,账户消重模块接收账户采集模块每次采集的账户信息,将该次采集的所有账户信息对应的所有唯一数字X与以前已经出现过的账户信息分别对应的唯一数字X进行对比,过滤掉重复的唯一数字X,未重复的唯一数字X对应的账户信息形成新的账户信息;
所述信息消重模块将每次接收到的朋友圈可见信息均添加唯一标识II,具体为:所述账户消重模块从所述消息处理队列中获取朋友圈可见信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识II,并将唯一标识II转换成易于存储与比较的唯一数字Y,其中,同一微信用户的相同朋友圈可见信息对应一个相同的唯一数字Y,信息消重模块接收信息采集模块每次采集的朋友圈可见信息,将该次采集的所有朋友圈可见信息对应的所有唯一数字Y与以前已经出现过的朋友圈可见信息对应的唯一数字Y进行对比,过滤掉重复的唯一数字Y,未重复的唯一数字Y对应的账号信息形成新的朋友圈可见信息。
4.如权利要求1所述的基于微信区域朋友圈数据分析系统,其特征在于,还包括:
账户检索模块,其用于对账户信息库中的账户信息进行检索;
关注账户处理模块,其用于提取并储存预存的待关注账户的账户信息;
账户统计模块,其用于统计该限定区域内同一账户信息的出现频率、以及统计该账户信息在采集时出现的时刻;
信息检索模块,其用于朋友圈可见信息库中的朋友圈可见信息进行检索;
关注信息处理模块,其用于提取并储存含有预存的待关注的关键词的朋友圈可见信息;
话题处理模块,其用于从信息存储模块中提取该限定区域内朋友圈可见信息中出现的热门话题并储存;
信息情感分析模块,其用于对信息存储模块中的朋友圈可见信息进行情感分析,判断信息的情感倾向,若为积极,则将该朋友圈可见信息进行亮显标记;
信息统计模块,其用于统计该限定区域内出现的所有微信用户的朋友圈可见信息的发布总量,并计算日均发布量,统计微信用户储存在信息存储模块中的朋友圈可见信息为积极情感的比例。
5.如权利要求1所述的基于微信区域朋友圈数据分析系统,其特征在于,还包括:
所述账户检索模块中建立账户多节点索引,账户多节点索引将该限定区域内所出现的所有微信用户的账号信息的账户名属性作为索引字段,其余属性作为筛选字段;
所述信息检索模块中建立信息多节点索引,信息多节点索引将该限定区域内所出现的所有微信用户的朋友圈可见信息的正文作为检索字段,账户名、发布时间作为筛选字段。
6.基于微信区域朋友圈数据分析方法,其特征在于,包括以下步骤:
步骤一、在可登录微信的设备上登录微信后,限定区域搜索微信用户,通过账户采集模块连续多次采集该限定区域内所出现的所有微信用户的账户信息,并通过信息采集模连续多次采集该限定区域内所出现的所有微信用户所公布的朋友圈可见信息,该朋友圈可见信息附带发布时间属性以及账户账号属性;
步骤二、通过账户消重模块对该限定区域内后次出现的所有微信用户的账户信息与该限定区域内前次出现的所有微信用户的账户信息进行消重处理,并将消重处理后的账户信息保存在账户存储模块,同时通过信息消重模块对该限定区域内后次出现的所有微信用户所公布的朋友圈可见信息与该限定区域内前次出现的所有微信用户所公布的朋友圈可见信息进行消重处理,并将消重处理后的朋友圈可见信息保存在信息存储模块。
7.如权利要求6所述的基于微信区域朋友圈数据分析方法,其特征在于,还包括步骤三、独立或同时进行以下操作:
a、通过账户检索模块或信息检索模块检索希望了解的微信用户或希望了解的朋友圈可见信息;
b、通过关注账户处理模块将预存的待关注账户的账户信息提取并储存,通过关注信息处理模块将预存的待关注的关键词提取并储存含有该关键词的朋友圈可见信息;
c、通过话题处理模块从信息存储模块中提取该限定区域内朋友圈可见信息中出现的热门话题并储存;
d、通过信息情感分析模块对信息存储模块中的朋友圈可见信息进行情感分析,判断信息的情感倾向,若为积极,则将该朋友圈可见信息进行亮显标记;
e、通过账户统计模块统计该限定区域内同一微信用户的出现频率、以及统计该微信用户在采集时出现的时刻;
f、通过信息统计模块统计限定区域内所出现的所有微信用户的朋友圈可见信息的发布总量,并计算日均发布量,统计微信用户储存在信息存储模块中的朋友圈可见信息为积极情感的比例。
8.如权利要求7所述的基于微信区域朋友圈数据分析方法,其特征在于,
步骤一中账户采集模块每次采集时捕获已经登录微信的设备在限定区域内的网络数据流,获取含有微信用户的账户信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过遍历解析XML文档树中的节点,获取账户详情,再将账户详情解析为JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成账户信息,其中,账户详情包括账户名、账户头像、账户账号、账户所在地区、陌生人ID、账户性别、朋友圈可见信息链接;
步骤一中信息采集模块每次采集时访问朋友圈可见信息链接,捕获朋友圈可见信息的加密字节流,经过解密、编码,转化为符合XML1.0规范的XML文本,再将该XML文本转换成XML文档树,通过预存的信息模板解析获取朋友圈可见信息模板,再将朋友圈可见信息模板解析JAVA对象,JAVA对象经过RSA算法序列化为JSON字符串,JSON字符串推送至消息处理队列中,形成朋友圈可见信息,其中,预存的信息模板包括均为无内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板,朋友圈可见信息模板包括均为有内容的信息发布时间模板、朋友圈背景图片模板、发布图片地址模板、视频地址模板、文字模板、缩略图模板。
9.如权利要求8所述的基于微信区域朋友圈数据分析方法,其特征在于,
步骤二中所述账户消重模块将每次接收到的账户信息均添加唯一标识I,具体为:所述账户消重模块从所述消息处理队列中获取账户信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识I,并将唯一标识I转换成易于存储与比较的唯一数字X,其中,同一相同账户信息对应一个相同的唯一数字X,账户消重模块接收账户采集模块每次采集的账户信息,将该次采集的所有账户信息对应的所有唯一数字X与以前已经出现过的账户信息分别对应的唯一数字X进行对比,过滤掉重复的唯一数字X,未重复的唯一数字X对应的账户信息形成新的账户信息;
步骤二中所述信息消重模块将每次接收到的朋友圈可见信息均添加唯一标识II,具体为:所述账户消重模块从所述消息处理队列中获取朋友圈可见信息的JSON字符串,将JSON字符串解析成对应的JAVA对象,通过非加密型哈希函数算法为JAVA对象添加唯一标识II,并将唯一标识II转换成易于存储与比较的唯一数字Y,其中,同一微信用户的相同朋友圈可见信息对应一个相同的唯一数字Y,信息消重模块接收信息采集模块每次采集的朋友圈可见信息,将该次采集的所有朋友圈可见信息对应的所有唯一数字Y与以前已经出现过的朋友圈可见信息对应的唯一数字Y进行对比,过滤掉重复的唯一数字Y,未重复的唯一数字Y对应的账号信息形成新的朋友圈可见信息。
10.如权利要求7所述的基于微信区域朋友圈数据分析方法,其特征在于,步骤三中所述账户检索模块中建立账户多节点索引,账户多节点索引将该限定区域内所出现的所有微信用户的账号信息的账户名属性作为索引字段,其余属性作为筛选字段;
所述信息检索模块中建立信息多节点索引,信息多节点索引将该限定区域内所出现的所有微信用户的朋友圈可见信息的正文作为检索字段,账户名、发布时间作为筛选字段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810400819.5A CN108804527A (zh) | 2018-04-28 | 2018-04-28 | 基于微信区域朋友圈数据分析系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810400819.5A CN108804527A (zh) | 2018-04-28 | 2018-04-28 | 基于微信区域朋友圈数据分析系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108804527A true CN108804527A (zh) | 2018-11-13 |
Family
ID=64093513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810400819.5A Pending CN108804527A (zh) | 2018-04-28 | 2018-04-28 | 基于微信区域朋友圈数据分析系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108804527A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840265A (zh) * | 2018-12-26 | 2019-06-04 | 出门问问信息科技有限公司 | Json结构转换方法、装置、设备及存储介质 |
CN109992698A (zh) * | 2019-04-11 | 2019-07-09 | 北京字节跳动网络技术有限公司 | 数据处理方法、装置、电子设备及可读存储介质 |
CN110795660A (zh) * | 2019-09-26 | 2020-02-14 | 北京大米科技有限公司 | 数据分析方法、装置、电子设备及介质 |
CN111130997A (zh) * | 2019-12-19 | 2020-05-08 | 郭艺斌 | 一种即时通讯软件的信息发表方法及信息发表系统 |
CN112308728A (zh) * | 2020-10-29 | 2021-02-02 | 上海连尚网络科技有限公司 | 一种用于管理社交空间的方法与设备 |
CN113240241A (zh) * | 2021-04-14 | 2021-08-10 | 北京蓝光讯智科技有限责任公司 | 基于微信数据的互联网金融线索分析方法、系统及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933093A (zh) * | 2015-05-19 | 2015-09-23 | 武汉泰迪智慧科技有限公司 | 基于大数据的地区舆情监控及决策辅助系统和方法 |
CN107402951A (zh) * | 2017-05-17 | 2017-11-28 | 四川秘无痕信息安全技术有限责任公司 | 一种快速提取Android微信朋友圈数据的方法 |
US20180011933A1 (en) * | 2016-07-08 | 2018-01-11 | Guangzhou Ucweb Computer Technology Co., Ltd. | Method, apparatus, and server for generating hotspot content |
-
2018
- 2018-04-28 CN CN201810400819.5A patent/CN108804527A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933093A (zh) * | 2015-05-19 | 2015-09-23 | 武汉泰迪智慧科技有限公司 | 基于大数据的地区舆情监控及决策辅助系统和方法 |
US20180011933A1 (en) * | 2016-07-08 | 2018-01-11 | Guangzhou Ucweb Computer Technology Co., Ltd. | Method, apparatus, and server for generating hotspot content |
CN107402951A (zh) * | 2017-05-17 | 2017-11-28 | 四川秘无痕信息安全技术有限责任公司 | 一种快速提取Android微信朋友圈数据的方法 |
Non-Patent Citations (2)
Title |
---|
XIAOXI GU 等: "Design and Implementation of Digital Assets Management System Based on WeChat", 《PROCEEDINGS OF 2017 IEEE 2ND INFORMATION TECHNOLOGY, NETWORKING, ELECTRONIC AND AUTOMATION CONTROL CONFERENCE》 * |
王飞飞 等: "移动社交网络微信用户信息发布行为统计特征分析", 《数据分析与知识发现》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840265A (zh) * | 2018-12-26 | 2019-06-04 | 出门问问信息科技有限公司 | Json结构转换方法、装置、设备及存储介质 |
CN109840265B (zh) * | 2018-12-26 | 2020-11-10 | 出门问问信息科技有限公司 | Json结构转换方法、装置、设备及存储介质 |
CN109992698A (zh) * | 2019-04-11 | 2019-07-09 | 北京字节跳动网络技术有限公司 | 数据处理方法、装置、电子设备及可读存储介质 |
CN110795660A (zh) * | 2019-09-26 | 2020-02-14 | 北京大米科技有限公司 | 数据分析方法、装置、电子设备及介质 |
CN111130997A (zh) * | 2019-12-19 | 2020-05-08 | 郭艺斌 | 一种即时通讯软件的信息发表方法及信息发表系统 |
CN112308728A (zh) * | 2020-10-29 | 2021-02-02 | 上海连尚网络科技有限公司 | 一种用于管理社交空间的方法与设备 |
CN113240241A (zh) * | 2021-04-14 | 2021-08-10 | 北京蓝光讯智科技有限责任公司 | 基于微信数据的互联网金融线索分析方法、系统及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804527A (zh) | 基于微信区域朋友圈数据分析系统及方法 | |
CN102547794B (zh) | Wap手机传媒色情图像、视频及不良内容的识别监管平台 | |
Ferguson | The Smart Fourth Amendment | |
CN105488478B (zh) | 一种人脸识别系统和方法 | |
CN105095211B (zh) | 多媒体数据的获取方法和装置 | |
CN108776671A (zh) | 一种网络舆情监控系统及方法 | |
CN103955505B (zh) | 一种基于微博的事件实时监测方法及系统 | |
McMillan et al. | Investigating the increase in mobile phone evidence in criminal activities | |
CN103218431B (zh) | 一种能识别网页信息自动采集的系统 | |
CN107483488A (zh) | 一种恶意Http检测方法及系统 | |
CN106936667A (zh) | 一种基于应用程序流量分布式分析的主机实时识别方法 | |
CN106383887A (zh) | 一种环保新闻数据采集和推荐展示的方法及系统 | |
CN107609103A (zh) | 一种基于推特的事件检测方法 | |
CN103458042A (zh) | 一种微博广告用户检测方法 | |
US20150113651A1 (en) | Spammer group extraction apparatus and method | |
CN107341225B (zh) | 信息智能推送与鉴别方法、装置和系统 | |
Chakraborty et al. | SPAM: a framework for social profile abuse monitoring | |
CN104933191A (zh) | 一种基于贝叶斯算法的垃圾评论识别方法、系统及终端 | |
CN106789572B (zh) | 一种实现自适应消息过滤的即时通讯系统和即时通讯方法 | |
CN109492604A (zh) | 人脸模型特征统计分析系统 | |
CN106209431A (zh) | 一种告警关联方法及网管系统 | |
CN102567101A (zh) | Wap手机传媒色情图像识别、监管的多进程管理系统 | |
Terrana et al. | Facebook users relationships analysis based on sentiment classification | |
CN110020161B (zh) | 数据处理方法、日志处理方法和终端 | |
CN112256880A (zh) | 文本识别方法和装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181113 |
|
RJ01 | Rejection of invention patent application after publication |