CN105701097A - 一种基于社交网络平台的舆情分析方法及系统 - Google Patents

一种基于社交网络平台的舆情分析方法及系统 Download PDF

Info

Publication number
CN105701097A
CN105701097A CN201410689874.2A CN201410689874A CN105701097A CN 105701097 A CN105701097 A CN 105701097A CN 201410689874 A CN201410689874 A CN 201410689874A CN 105701097 A CN105701097 A CN 105701097A
Authority
CN
China
Prior art keywords
author
analysis
theme
report
public opinion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410689874.2A
Other languages
English (en)
Other versions
CN105701097B (zh
Inventor
吴增强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
4399 NETWORK Co Ltd
Original Assignee
4399 NETWORK Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 4399 NETWORK Co Ltd filed Critical 4399 NETWORK Co Ltd
Priority to CN201410689874.2A priority Critical patent/CN105701097B/zh
Publication of CN105701097A publication Critical patent/CN105701097A/zh
Application granted granted Critical
Publication of CN105701097B publication Critical patent/CN105701097B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于社交网络平台的舆情分析方法及系统,方法包括以下步骤:S1.采集被分析的社交网络平台在最近历史时期的源数据;S2.对源数据进行多维度舆情分析,得到多个舆情分析子报告,各个舆情分析子报告构成舆情分析报告;其中,所述舆情分析子报告包括基于用户影响力的关键用户排行榜子报告、用户关系分析子报告、用户行为分析子报告、敏感用户排行榜子报告和敏感用户纵向分析子报告;S3.基于所述舆情分析报告,对所述社交网络平台的变化趋势进行预测。可对社交网络平台进行多维度舆情分析,并且,具有舆情分析结构准确的优点,能够精确客观的反应社交网络平台的舆情,进而可对舆情的主要传播途经和社区言论倾向进行良性疏导。

Description

一种基于社交网络平台的舆情分析方法及系统
技术领域
本发明属于计算机互联网技术领域,具体涉及一种基于社交网络平台的舆情分析方法及系统。
背景技术
当今社会,互联网技术高度发达,各种在线社交网络平台的讨论话题也越来越深入和广泛,社交网络平台已成为社会民众言论的一个集散地。
随着社交网络舆论趋于复杂和多样化,有效的对社交网络平台进行舆情监测和分析,对舆情的言论倾向进行疏导,对于进行有效的社会管理、构建和谐社会均有着重要而深远的意义。现有技术中,尚未出现有效全面对社交网络平台进行舆情分析的方法。
发明内容
针对现有技术存在的缺陷,本发明提供一种基于社交网络平台的舆情分析方法及系统,可对社交网络平台进行多维度舆情分析,从而可对舆情的主要传播途经和社区言论倾向进行良性疏导。
本发明采用的技术方案如下:
本发明提供一种基于社交网络平台的舆情分析方法,包括以下步骤:
S1,采集被分析的社交网络平台在最近历史时期的源数据;
S2,对所述源数据进行多维度舆情分析,得到多个舆情分析子报告,各个所述舆情分析子报告构成舆情分析报告;其中,所述舆情分析子报告包括基于用户影响力的关键用户排行榜子报告、用户关系分析子报告、用户行为分析子报告、敏感用户排行榜子报告和敏感用户纵向分析子报告;
S3,基于所述舆情分析报告,对所述社交网络平台的变化趋势进行预测。
优选的,所述基于用户影响力的关键用户排行榜子报告通过以下方法获得:
S4.1,从所述源数据中提取主题文章ID以及该主题文章属性的对应关系;其中,所述主题文章属性包括主题作者、主题文章浏览量、主题文章回复量以及主题文章表态量;
S4.2,对于每个主题文章ID,将其对应的主题文章浏览量、主题文章回复量以及主题文章表态量进行求和计算,计算结果即为该主题文章的用户影响力;
S4.3,判断同一主题作者所发布的主题文章数量是否为两个以上,如果是,则将该主题作者所发布的各个主题文章的用户影响力进行求和计算,得到该主题作者的用户影响力;如果不是,则该主题作者所发布的主题文章的用户影响力即为该主题作者的用户影响力;
S4.4,对各主题作者按用户影响力由高到低的顺序排序,将排序位于前面设定数量的主题作者称为关键用户;
各个所述关键用户及其用户影响力的对应关系即形成所述关键用户排行榜子报告。
优选的,所述用户关系分析子报告通过以下方法获得:
S5.1,从所述源数据中提取主题文章ID以及该主题文章属性的对应关系;其中,所述主题文章属性包括主题作者ID、回复作者ID、主题作者IP、回复作者IP以及每个回复作者ID对该主题文章ID的回复次数;
S5.2,将被分析作者ID映射为用户关系拓扑网络图的中心节点;
获得与该被分析作者进行直接互动的所有第1作者ID,并将所述第1作者ID映射为用户关系拓扑网络图的第1级节点;然后,使用向量分别连接中心节点与各个第1级节点,向量的权重为相互连接的两个节点的互动次数;
然后,对于每个第1作者ID,获得与该第1作者ID进行直接互动的且除所述被分析作者ID的所有第2作者ID,并将所述第2作者ID映射为用户关系拓扑网络图的第2级节点,然后,使用向量连接第1作者ID与其对应的各个第2作者ID;向量的权重为相互连接的两个节点的互动次数;
依此类推,形成以被分析作者ID为中心节点,向外逐渐发散的树状用户关系拓扑网络图;其中,所述第1级节点所对应的作者ID为所述被分析作者ID的直接关系节点,其他各级节点所对应的作者ID为所述被分析作者ID的间接关系节点;
其中,对于相互连接的两个节点,向量的权重通过以下方法获得:
将相互连接的两个节点分别记为节点A和节点B;其中,节点A代表作者A;节点B代表作者B;
则:对于节点B为节点A下级节点的情形,节点A和节点B之间的权重值为作者A对作者B发布的所有主题文章进行回复的次数。
优选的,所述用户行为分析子报告通过以下方法获得:
S6.1,从所述源数据中提取版块ID以及该版块属性的对应关系;其中,所述版块属性包括主题文章ID、主题作者、主题文章浏览量、主题文章回复量以及主题文章表态量的对应关系;
对于每个主题文章ID,将其对应的主题文章浏览量、主题文章回复量以及主题文章表态量进行求和计算,计算结果即为该主题文章的用户影响力;
S6.2,对于每个版块ID,设定若干个统计时间点,对于每个统计时间点,通过以下方法获得被分析的作者ID在该版块ID的用户影响力:判断作者ID在该版块ID截止到所述统计时间点所发布的主题文章数量是否为两个以上,如果是,则将该作者ID所发布的各个主题文章的用户影响力进行求和计算,得到该作者ID的用户影响力;如果不是,则该作者ID所发布的主题文章的用户影响力即为该作者ID的用户影响力;
S6.3,以各个统计时间点为横坐标,以用户影响力为纵坐标,建立直角坐标系;将每个统计时间点所对应的用户影响力标识到所述直角坐标系,得到若干个离散点,将各个所述离散点按时间先后顺序连接,得到一条曲线,该曲线即为所述作者ID在所述版块ID的用户影响力随时间的变化趋势线;
S6.4,在所述直角坐标系中,绘制同一作者ID在不同版块ID的变化趋势线,即得到所述用户行为分析子报告。
优选的,所述敏感用户排行榜子报告通过以下方法获得:
S7.1,基于所述源数据获得文章内容以及发布该文章内容的作者ID;其中,所述文章内容包括主题文章内容和主题文章回复内容;
S7.2,增量方式运行屏蔽词检索脚本,判断所述文章内容中是否包含所述屏蔽词,如果包含,则记录作者ID、屏蔽词信息以及屏蔽词出现次数的对应关系;
S7.3,统计得到每个作者ID所对应的屏蔽词出现次数,并按屏蔽词出现次数由高到低的顺序,对作者ID进行排序;将屏蔽词出现次数超过设定阈值的作者ID称为敏感用户ID;
各个敏感用户ID及其屏蔽词出现次数的对应关系即形成所述敏感用户排行榜子报告。
优选的,对于S7.3分析得到的每个敏感用户ID,对其进行敏感用户纵向分析的步骤为:
S8.1,对于被分析的敏感用户ID,获得该敏感用户ID在所述最近历史时期所发布的敏感词汇以及每个敏感词汇的出现次数;
S8.2,以具体的敏感词汇为横坐标,以每个敏感词汇的出现次数为纵坐标,得到第一直方图,该第一直方图即为该敏感用户纵向分析子报告。
优选的,S8.2之后,还包括:
S8.3,当所述第一直方图中横坐标的某个指定敏感词汇被触发时,显示第二直方图;其中,所述第二直方图的横坐标为指定敏感词汇的出现时间,所述第二直方图的纵坐标为所述指定敏感词汇在对应的出现时间的出现次数。
本发明还提供一种基于社交网络平台的舆情分析系统,包括:
数据采集服务器,用于采集被分析的社交网络平台在最近历史时期的源数据;
多维度舆情分析服务器,用于对所述源数据进行多维度舆情分析,得到多个舆情分析子报告,各个所述舆情分析子报告构成舆情分析报告;其中,所述舆情分析子报告包括基于用户影响力的关键用户排行榜子报告、用户关系分析子报告、用户行为分析子报告、敏感用户排行榜子报告和敏感用户纵向分析子报告;
舆情发布服务器,用于基于所述舆情分析报告,对所述社交网络平台的变化趋势进行预测,并将预测结果发布。
本发明的有益效果如下:
本发明提供的基于社交网络平台的舆情分析方法及系统,可对社交网络平台进行多维度舆情分析,并且,具有舆情分析结构准确的优点,能够精确客观的反应社交网络平台的舆情,进而可对舆情的主要传播途经和社区言论倾向进行良性疏导。
附图说明
图1为本发明提供的基于社交网络平台的舆情分析方法的流程示意图;
图2为本发明提供的基于社交网络平台的舆情分析系统的结构示意图;
图3为一种数据采集流程的示意图;
图4为敏感用户纵向分析子报告中第一直方图的示意图;
图5为敏感用户纵向分析子报告中第二直方图的示意图。
具体实施方式
以下结合附图对本发明提供的基于社交网络平台的舆情分析方法及系统进行详细说明:
如图1所示,本发明提供一种基于社交网络平台的舆情分析方法,包括以下步骤:
S1,采集被分析的社交网络平台在最近历史时期的源数据;
具体的,社交网络平台通常由多个版块组成,例如,游戏版块、交友版块、旅游版块中,在每个版块中,由数量众多的主题文章组成,每个主题文章对应若干属性,例如,主题作者ID、主题文章浏览量、主题文章回复量以及主题文章表态量等。本步骤中,通过编写采集软件,可对社交网络平台在近一段时间内的所有相关信息进行采集。参考图3,为一种数据采集流程的示意图,首先获取社交网络平台的根域名,然后,抓取到社交网络平台的主页面,社交网络平台的主页面由多个链接组成,通过对社交网络平台的主页面进行解析,读取每个链接的url,即可获得每个链接对应的主页面,每个链接对应的主页面同样由多个子链接组成,再进一步读取每个子链的url,如此循环,直至读取到最底层的页面内容,即可获得社交网络平台在设定时间段的所有相关信息。
S2,对所述源数据进行多维度舆情分析,得到多个舆情分析子报告,各个所述舆情分析子报告构成舆情分析报告;其中,所述舆情分析子报告包括基于用户影响力的关键用户排行榜子报告、用户关系分析子报告、用户行为分析子报告、敏感用户排行榜子报告和敏感用户纵向分析子报告;
S3,基于所述舆情分析报告,对所述社交网络平台的变化趋势进行预测。
本发明中,能够对社交网络平台进行多维度舆情分析,从而得到多个分析子报告,各分析子报告的具体获得方法为:
(一)关键用户排行榜子报告
基于用户影响力的关键用户排行榜子报告通过以下方法获得:
S4.1,从所述源数据中提取主题文章ID以及该主题文章属性的对应关系;其中,所述主题文章属性包括主题作者、主题文章浏览量、主题文章回复量以及主题文章表态量;
S4.2,对于每个主题文章ID,将其对应的主题文章浏览量、主题文章回复量以及主题文章表态量进行求和计算,计算结果即为该主题文章的用户影响力;
S4.3,判断同一主题作者所发布的主题文章数量是否为两个以上,如果是,则将该主题作者所发布的各个主题文章的用户影响力进行求和计算,得到该主题作者的用户影响力;如果不是,则该主题作者所发布的主题文章的用户影响力即为该主题作者的用户影响力;
S4.4,对各主题作者按用户影响力由高到低的顺序排序,将排序位于前面设定数量的主题作者称为关键用户;
各个所述关键用户及其用户影响力的对应关系即形成所述关键用户排行榜子报告。
将本发明提供的方法应用于一个具体的游戏社区,排在前7位的关键用户的主题作者分别为:游戏小助手、4399兔八哥、661343165、圣诞老人、首政牛牛牛、1102035831天使、1493295350。经考察,发现上述7个用户为该游戏社区的活跃用户,且用户的影响力大,影响范围广。由此证实本发明所获得的结果的精确性。
本发明中,通过对用户影响程度进行统计,将关键用户从社区用户中筛选出来,关键用户属于社区核心人物,针对性地对关键用户的言论倾向性和影响力变化进行监测,可以对舆情的主要传播途经和社区言论倾向进行一个良性的疏导,此外,当发生突发事件时,通过引导关键用户,可以对社区舆情进行有效疏导。
需要强调的是,本发明中,后续的用户关系分析和用户行为分析,既可以仅针对关键用户进行分析,从而能够准确掌握社区舆情,也可以针对普遍的用户进行分析,具体根据需求而定。
(二)用户关系分析子报告
用户关系分析子报告通过以下方法获得:
S5.1,从所述源数据中提取主题文章ID以及该主题文章属性的对应关系;其中,所述主题文章属性包括主题作者ID、回复作者ID、主题作者IP、回复作者IP以及每个回复作者ID对该主题文章ID的回复次数;
S5.2,将被分析作者ID映射为用户关系拓扑网络图的中心节点;
获得与该被分析作者进行直接互动的所有第1作者ID,并将所述第1作者ID映射为用户关系拓扑网络图的第1级节点;然后,使用向量分别连接中心节点与各个第1级节点,向量的权重为相互连接的两个节点的互动次数;
然后,对于每个第1作者ID,获得与该第1作者ID进行直接互动的且除所述被分析作者ID的所有第2作者ID,并将所述第2作者ID映射为用户关系拓扑网络图的第2级节点,然后,使用向量连接第1作者ID与其对应的各个第2作者ID;向量的权重为相互连接的两个节点的互动次数;
依此类推,形成以被分析作者ID为中心节点,向外逐渐发散的树状用户关系拓扑网络图;其中,所述第1级节点所对应的作者ID为所述被分析作者ID的直接关系节点,其他各级节点所对应的作者ID为所述被分析作者ID的间接关系节点;
其中,对于相互连接的两个节点,向量的权重通过以下方法获得:
将相互连接的两个节点分别记为节点A和节点B;其中,节点A代表作者A;节点B代表作者B;
则:对于节点B为节点A下级节点的情形,节点A和节点B之间的权重值为作者A对作者B发布的所有主题文章进行回复的次数。
通过上述过程,可精准获得某一用户的直接用户关系和间接用户关系,从而精确获知该用户言论的主要传播途经。
当然,实际应用中,在得到上述用户关系拓扑网络图后,对于每个节点,可绑定该节点对应作者的常用IP地址、在某段时间内的影响力、实时影响力、是否为敏感用户等附属信息,当某一节点被点击时,即弹出对应的附属信息,方便分析者更为直观全面的获知用户关系。
(三)用户行为分析子报告
用户行为分析子报告通过以下方法获得:
S6.1,从所述源数据中提取版块ID以及该版块属性的对应关系;其中,所述版块属性包括主题文章ID、主题作者、主题文章浏览量、主题文章回复量以及主题文章表态量的对应关系;
对于每个主题文章ID,将其对应的主题文章浏览量、主题文章回复量以及主题文章表态量进行求和计算,计算结果即为该主题文章的用户影响力;
S6.2,对于每个版块ID,设定若干个统计时间点,对于每个统计时间点,通过以下方法获得被分析的作者ID在该版块ID的用户影响力:判断作者ID在该版块ID截止到所述统计时间点所发布的主题文章数量是否为两个以上,如果是,则将该作者ID所发布的各个主题文章的用户影响力进行求和计算,得到该作者ID的用户影响力;如果不是,则该作者ID所发布的主题文章的用户影响力即为该作者ID的用户影响力;
S6.3,以各个统计时间点为横坐标,以用户影响力为纵坐标,建立直角坐标系;将每个统计时间点所对应的用户影响力标识到所述直角坐标系,得到若干个离散点,将各个所述离散点按时间先后顺序连接,得到一条曲线,该曲线即为所述作者ID在所述版块ID的用户影响力随时间的变化趋势线;
S6.4,在所述直角坐标系中,绘制同一作者ID在不同版块ID的变化趋势线,即得到所述用户行为分析子报告。
以用户“游戏小助手”为例进行行为分析统计,根据对用户影响力的计算结果,可以得到用户在各个版块的影响力变化趋势曲线,从图中可以看出,“游戏小助手”用户在8月6号这一天,在“4399火线精英官方论坛”的影响力很大。经过查看用户的话题列表,可以证实,在8月6号当天,该用户发布的几则游戏公告,浏览量很高且互动量较之其它帖子都较高,影响力上升。
(四)敏感用户排行榜子报告
敏感用户的发现是是指:通过对用户发布信息中含有的不文明词汇量的进行统计,对统计结果进行排序,得出一段时间内敏感用户的变化趋势曲线,这从而对舆情信息中的负面消息有一个针对性的监控目标群体。可建立敏感用户列表,存储筛选出的敏感用户的用户ID。通过对敏感用户发现及深度分析,可有效疏导和防控负面消息。在得到敏感用户的变化趋势曲线后,通过点击用户的变化趋势曲线,还可以进一步显示对该敏感用户的行为分析和用户关系分析结果。
具体的,敏感用户排行榜子报告通过以下方法获得:
S7.1,基于所述源数据获得文章内容以及发布该文章内容的作者ID;其中,所述文章内容包括主题文章内容和主题文章回复内容;
S7.2,增量方式运行屏蔽词检索脚本,判断所述文章内容中是否包含所述屏蔽词,如果包含,则记录作者ID、屏蔽词信息以及屏蔽词出现次数的对应关系;
S7.3,统计得到每个作者ID所对应的屏蔽词出现次数,并按屏蔽词出现次数由高到低的顺序,对作者ID进行排序;将屏蔽词出现次数超过设定阈值的作者ID称为敏感用户ID;
各个敏感用户ID及其屏蔽词出现次数的对应关系即形成所述敏感用户排行榜子报告。
此外,还可以对每个敏感用户进行纵向分析,即:
S8.1,对于被分析的敏感用户ID,获得该敏感用户ID在所述最近历史时期所发布的敏感词汇以及每个敏感词汇的出现次数;
S8.2,以具体的敏感词汇为横坐标,以每个敏感词汇的出现次数为纵坐标,得到第一直方图,该第一直方图即为该敏感用户纵向分析子报告。如图4所示,为敏感用户纵向分析子报告中第一直方图的示意图;
S8.2之后,还包括:
S8.3,当所述第一直方图中横坐标的某个指定敏感词汇被触发时,显示第二直方图;其中,所述第二直方图的横坐标为指定敏感词汇的出现时间,所述第二直方图的纵坐标为所述指定敏感词汇在对应的出现时间的出现次数。如图5所示,为敏感用户纵向分析子报告中第二直方图的示意图。在图5中,为被分析用户在6月21号至7月9号这段时间发布“人妖”这个敏感词汇的的变化趋势。通过分析图5,能够掌握用户发布含有的敏感信息量的变化趋势,针对性进行舆情疏导,对负面信息的监控和预防起到一定的作用。
如图2所示,本发明还提供一种基于社交网络平台的舆情分析系统,包括:
数据采集服务器,用于采集被分析的社交网络平台在最近历史时期的源数据;
多维度舆情分析服务器,用于对所述源数据进行多维度舆情分析,得到多个舆情分析子报告,各个所述舆情分析子报告构成舆情分析报告;其中,所述舆情分析子报告包括基于用户影响力的关键用户排行榜子报告、用户关系分析子报告、用户行为分析子报告、敏感用户排行榜子报告和敏感用户纵向分析子报告;
舆情发布服务器,用于基于所述舆情分析报告,对所述社交网络平台的变化趋势进行预测,并将预测结果发布。
综上所述,本发明提供的基于社交网络平台的舆情分析方法及系统,可对社交网络平台进行多维度舆情分析,并且,具有舆情分析结构准确的优点,能够精确客观的反应社交网络平台的舆情,进而可对舆情的主要传播途经和社区言论倾向进行良性疏导。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (8)

1.一种基于社交网络平台的舆情分析方法,其特征在于,包括以下步骤:
S1,采集被分析的社交网络平台在最近历史时期的源数据;
S2,对所述源数据进行多维度舆情分析,得到多个舆情分析子报告,各个所述舆情分析子报告构成舆情分析报告;其中,所述舆情分析子报告包括基于用户影响力的关键用户排行榜子报告、用户关系分析子报告、用户行为分析子报告、敏感用户排行榜子报告和敏感用户纵向分析子报告;
S3,基于所述舆情分析报告,对所述社交网络平台的变化趋势进行预测。
2.根据权利要求1所述的基于社交网络平台的舆情分析方法,其特征在于,所述基于用户影响力的关键用户排行榜子报告通过以下方法获得:
S4.1,从所述源数据中提取主题文章ID以及该主题文章属性的对应关系;其中,所述主题文章属性包括主题作者、主题文章浏览量、主题文章回复量以及主题文章表态量;
S4.2,对于每个主题文章ID,将其对应的主题文章浏览量、主题文章回复量以及主题文章表态量进行求和计算,计算结果即为该主题文章的用户影响力;
S4.3,判断同一主题作者所发布的主题文章数量是否为两个以上,如果是,则将该主题作者所发布的各个主题文章的用户影响力进行求和计算,得到该主题作者的用户影响力;如果不是,则该主题作者所发布的主题文章的用户影响力即为该主题作者的用户影响力;
S4.4,对各主题作者按用户影响力由高到低的顺序排序,将排序位于前面设定数量的主题作者称为关键用户;
各个所述关键用户及其用户影响力的对应关系即形成所述关键用户排行榜子报告。
3.根据权利要求1所述的基于社交网络平台的舆情分析方法,其特征在于,所述用户关系分析子报告通过以下方法获得:
S5.1,从所述源数据中提取主题文章ID以及该主题文章属性的对应关系;其中,所述主题文章属性包括主题作者ID、回复作者ID、主题作者IP、回复作者IP以及每个回复作者ID对该主题文章ID的回复次数;
S5.2,将被分析作者ID映射为用户关系拓扑网络图的中心节点;
获得与该被分析作者进行直接互动的所有第1作者ID,并将所述第1作者ID映射为用户关系拓扑网络图的第1级节点;然后,使用向量分别连接中心节点与各个第1级节点,向量的权重为相互连接的两个节点的互动次数;
然后,对于每个第1作者ID,获得与该第1作者ID进行直接互动的且除所述被分析作者ID的所有第2作者ID,并将所述第2作者ID映射为用户关系拓扑网络图的第2级节点,然后,使用向量连接第1作者ID与其对应的各个第2作者ID;向量的权重为相互连接的两个节点的互动次数;
依此类推,形成以被分析作者ID为中心节点,向外逐渐发散的树状用户关系拓扑网络图;其中,所述第1级节点所对应的作者ID为所述被分析作者ID的直接关系节点,其他各级节点所对应的作者ID为所述被分析作者ID的间接关系节点;
其中,对于相互连接的两个节点,向量的权重通过以下方法获得:
将相互连接的两个节点分别记为节点A和节点B;其中,节点A代表作者A;节点B代表作者B;
则:对于节点B为节点A下级节点的情形,节点A和节点B之间的权重值为作者A对作者B发布的所有主题文章进行回复的次数。
4.根据权利要求1所述的基于社交网络平台的舆情分析方法,其特征在于,所述用户行为分析子报告通过以下方法获得:
S6.1,从所述源数据中提取版块ID以及该版块属性的对应关系;其中,所述版块属性包括主题文章ID、主题作者、主题文章浏览量、主题文章回复量以及主题文章表态量的对应关系;
对于每个主题文章ID,将其对应的主题文章浏览量、主题文章回复量以及主题文章表态量进行求和计算,计算结果即为该主题文章的用户影响力;
S6.2,对于每个版块ID,设定若干个统计时间点,对于每个统计时间点,通过以下方法获得被分析的作者ID在该版块ID的用户影响力:判断作者ID在该版块ID截止到所述统计时间点所发布的主题文章数量是否为两个以上,如果是,则将该作者ID所发布的各个主题文章的用户影响力进行求和计算,得到该作者ID的用户影响力;如果不是,则该作者ID所发布的主题文章的用户影响力即为该作者ID的用户影响力;
S6.3,以各个统计时间点为横坐标,以用户影响力为纵坐标,建立直角坐标系;将每个统计时间点所对应的用户影响力标识到所述直角坐标系,得到若干个离散点,将各个所述离散点按时间先后顺序连接,得到一条曲线,该曲线即为所述作者ID在所述版块ID的用户影响力随时间的变化趋势线;
S6.4,在所述直角坐标系中,绘制同一作者ID在不同版块ID的变化趋势线,即得到所述用户行为分析子报告。
5.根据权利要求1所述的基于社交网络平台的舆情分析方法,其特征在于,所述敏感用户排行榜子报告通过以下方法获得:
S7.1,基于所述源数据获得文章内容以及发布该文章内容的作者ID;其中,所述文章内容包括主题文章内容和主题文章回复内容;
S7.2,增量方式运行屏蔽词检索脚本,判断所述文章内容中是否包含所述屏蔽词,如果包含,则记录作者ID、屏蔽词信息以及屏蔽词出现次数的对应关系;
S7.3,统计得到每个作者ID所对应的屏蔽词出现次数,并按屏蔽词出现次数由高到低的顺序,对作者ID进行排序;将屏蔽词出现次数超过设定阈值的作者ID称为敏感用户ID;
各个敏感用户ID及其屏蔽词出现次数的对应关系即形成所述敏感用户排行榜子报告。
6.根据权利要求5所述的基于社交网络平台的舆情分析方法,其特征在于,对于S7.3分析得到的每个敏感用户ID,对其进行敏感用户纵向分析的步骤为:
S8.1,对于被分析的敏感用户ID,获得该敏感用户ID在所述最近历史时期所发布的敏感词汇以及每个敏感词汇的出现次数;
S8.2,以具体的敏感词汇为横坐标,以每个敏感词汇的出现次数为纵坐标,得到第一直方图,该第一直方图即为该敏感用户纵向分析子报告。
7.根据权利要求6所述的基于社交网络平台的舆情分析方法,其特征在于,S8.2之后,还包括:
S8.3,当所述第一直方图中横坐标的某个指定敏感词汇被触发时,显示第二直方图;其中,所述第二直方图的横坐标为指定敏感词汇的出现时间,所述第二直方图的纵坐标为所述指定敏感词汇在对应的出现时间的出现次数。
8.一种基于社交网络平台的舆情分析系统,其特征在于,包括:
数据采集服务器,用于采集被分析的社交网络平台在最近历史时期的源数据;
多维度舆情分析服务器,用于对所述源数据进行多维度舆情分析,得到多个舆情分析子报告,各个所述舆情分析子报告构成舆情分析报告;其中,所述舆情分析子报告包括基于用户影响力的关键用户排行榜子报告、用户关系分析子报告、用户行为分析子报告、敏感用户排行榜子报告和敏感用户纵向分析子报告;
舆情发布服务器,用于基于所述舆情分析报告,对所述社交网络平台的变化趋势进行预测,并将预测结果发布。
CN201410689874.2A 2014-11-25 2014-11-25 一种基于社交网络平台的舆情分析方法及系统 Active CN105701097B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410689874.2A CN105701097B (zh) 2014-11-25 2014-11-25 一种基于社交网络平台的舆情分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410689874.2A CN105701097B (zh) 2014-11-25 2014-11-25 一种基于社交网络平台的舆情分析方法及系统

Publications (2)

Publication Number Publication Date
CN105701097A true CN105701097A (zh) 2016-06-22
CN105701097B CN105701097B (zh) 2018-11-09

Family

ID=56942173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410689874.2A Active CN105701097B (zh) 2014-11-25 2014-11-25 一种基于社交网络平台的舆情分析方法及系统

Country Status (1)

Country Link
CN (1) CN105701097B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447508A (zh) * 2016-10-20 2017-02-22 宁波江东大金佰汇信息技术有限公司 一种改进型基于计算机大数据的社交网络中优质节点探测系统
CN106789565A (zh) * 2016-12-12 2017-05-31 北京小米移动软件有限公司 社交内容分享方法及装置
CN107729455A (zh) * 2017-09-25 2018-02-23 山东科技大学 一种基于多维特征分析的社交网络意见领袖排序算法
CN108021651A (zh) * 2017-11-30 2018-05-11 中科金联(北京)科技有限公司 一种网络舆情风险评估方法及装置
CN108182290A (zh) * 2018-01-30 2018-06-19 深圳市富途网络科技有限公司 一种用于社区内容热度排序的估算方法
CN109299808A (zh) * 2018-06-04 2019-02-01 西安电子科技大学 基于群体劝说力建模的网民观点演化趋势预测方法
CN110717111A (zh) * 2019-10-15 2020-01-21 深圳迅策科技有限公司 一种基于互联网信息的舆情分析的方法
WO2020098157A1 (zh) * 2018-11-12 2020-05-22 平安科技(深圳)有限公司 谣言传播风险的分析方法及装置、计算机可读存储介质
CN111784492A (zh) * 2020-07-10 2020-10-16 讯飞智元信息科技有限公司 舆情分析和财务预警方法、装置、电子设备和存储介质
CN111797333A (zh) * 2020-06-04 2020-10-20 南京擎盾信息科技有限公司 舆情传播任务展示的方法及装置
CN112541361A (zh) * 2020-12-11 2021-03-23 中信银行股份有限公司 一种针对特定业务对象的舆情处理方法及装置
CN114611011A (zh) * 2022-03-09 2022-06-10 之江实验室 一种考虑动态舆情主题的高影响力用户发现方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394311A (zh) * 2008-11-12 2009-03-25 北京交通大学 一种基于时间序列的网络舆情预测方法
CN103150432A (zh) * 2013-03-07 2013-06-12 宁波成电泰克电子信息技术发展有限公司 一种网络舆情分析方法
CN103593431A (zh) * 2013-11-11 2014-02-19 北京锐安科技有限公司 网络舆情分析方法和装置
CN103902659A (zh) * 2014-03-04 2014-07-02 深圳市至高通信技术发展有限公司 一种舆情分析方法及相应的装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394311A (zh) * 2008-11-12 2009-03-25 北京交通大学 一种基于时间序列的网络舆情预测方法
CN103150432A (zh) * 2013-03-07 2013-06-12 宁波成电泰克电子信息技术发展有限公司 一种网络舆情分析方法
CN103593431A (zh) * 2013-11-11 2014-02-19 北京锐安科技有限公司 网络舆情分析方法和装置
CN103902659A (zh) * 2014-03-04 2014-07-02 深圳市至高通信技术发展有限公司 一种舆情分析方法及相应的装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张劭捷: "基于微博社交网络的舆情分析模型及实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447508A (zh) * 2016-10-20 2017-02-22 宁波江东大金佰汇信息技术有限公司 一种改进型基于计算机大数据的社交网络中优质节点探测系统
CN106789565B (zh) * 2016-12-12 2020-06-02 北京小米移动软件有限公司 社交内容分享方法及装置
CN106789565A (zh) * 2016-12-12 2017-05-31 北京小米移动软件有限公司 社交内容分享方法及装置
CN107729455A (zh) * 2017-09-25 2018-02-23 山东科技大学 一种基于多维特征分析的社交网络意见领袖排序算法
CN108021651A (zh) * 2017-11-30 2018-05-11 中科金联(北京)科技有限公司 一种网络舆情风险评估方法及装置
CN108021651B (zh) * 2017-11-30 2020-07-28 中科金联(北京)科技有限公司 一种网络舆情风险评估方法及装置
CN108182290A (zh) * 2018-01-30 2018-06-19 深圳市富途网络科技有限公司 一种用于社区内容热度排序的估算方法
CN109299808A (zh) * 2018-06-04 2019-02-01 西安电子科技大学 基于群体劝说力建模的网民观点演化趋势预测方法
CN109299808B (zh) * 2018-06-04 2021-04-06 西安电子科技大学 基于群体劝说力建模的网民观点演化趋势预测方法
WO2020098157A1 (zh) * 2018-11-12 2020-05-22 平安科技(深圳)有限公司 谣言传播风险的分析方法及装置、计算机可读存储介质
CN110717111A (zh) * 2019-10-15 2020-01-21 深圳迅策科技有限公司 一种基于互联网信息的舆情分析的方法
CN111797333A (zh) * 2020-06-04 2020-10-20 南京擎盾信息科技有限公司 舆情传播任务展示的方法及装置
CN111797333B (zh) * 2020-06-04 2021-04-20 南京擎盾信息科技有限公司 舆情传播任务展示的方法及装置
CN111784492A (zh) * 2020-07-10 2020-10-16 讯飞智元信息科技有限公司 舆情分析和财务预警方法、装置、电子设备和存储介质
CN112541361A (zh) * 2020-12-11 2021-03-23 中信银行股份有限公司 一种针对特定业务对象的舆情处理方法及装置
CN114611011A (zh) * 2022-03-09 2022-06-10 之江实验室 一种考虑动态舆情主题的高影响力用户发现方法
CN114611011B (zh) * 2022-03-09 2024-03-29 之江实验室 一种考虑动态舆情主题的高影响力用户发现方法

Also Published As

Publication number Publication date
CN105701097B (zh) 2018-11-09

Similar Documents

Publication Publication Date Title
CN105701097A (zh) 一种基于社交网络平台的舆情分析方法及系统
Kayes et al. The social world of content abusers in community question answering
US9177046B2 (en) Refining image relevance models
US9639622B2 (en) Image processing system, image processing method, program, and non-transitory information storage medium
CN103218412B (zh) 舆情信息处理方法与装置
CN108491714A (zh) 验证码的人机识别方法
CN105339936A (zh) 文本匹配装置以及方法、和文本分类装置以及方法
CN106503907B (zh) 一种业务评估信息确定方法以及服务器
CN101819585A (zh) 一种论坛事件传播图的构建装置及构建方法
CN107085549A (zh) 故障信息生成的方法和装置
CN105302880A (zh) 内容关联推荐方法及装置
CN107766234A (zh) 一种基于移动设备的网页健康度的测评方法、装置及系统
CN101957845A (zh) 一种在线应用系统及其实现方法
CN104063759A (zh) 一种基于b/s的电力业务应用操作考试系统
CN113778871A (zh) Mock测试方法、装置、设备及存储介质
CN110196941B (zh) 一种资讯推荐方法、装置、服务器与存储介质
CN108446370A (zh) 语音数据统计方法和系统
JP2015191333A (ja) 検出装置、検出方法及び検出プログラム
CN107729455A (zh) 一种基于多维特征分析的社交网络意见领袖排序算法
CN108520337B (zh) 一种基于网络风险熵差的谣言风险评估方法
CN108243046A (zh) 一种基于数据稽核的业务质量评估方法及装置
CN106504102A (zh) 一种基于计算机大数据的社交网络中优质节点探测系统
WO2021135322A1 (zh) 一种自动出题方法、装置及系统
CN103312584B (zh) 一种在网络社区中发布信息的方法与设备
Webber Re-examining the effectiveness of manual review

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant