CN107704621A - 一种互联网舆情地图可视化展示方法 - Google Patents

一种互联网舆情地图可视化展示方法 Download PDF

Info

Publication number
CN107704621A
CN107704621A CN201711025251.5A CN201711025251A CN107704621A CN 107704621 A CN107704621 A CN 107704621A CN 201711025251 A CN201711025251 A CN 201711025251A CN 107704621 A CN107704621 A CN 107704621A
Authority
CN
China
Prior art keywords
map
public
event
public feelings
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711025251.5A
Other languages
English (en)
Inventor
罗松
龚凯
黄宇
康立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwestern University Of Finance And Economics
Original Assignee
Southwestern University Of Finance And Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwestern University Of Finance And Economics filed Critical Southwestern University Of Finance And Economics
Priority to CN201711025251.5A priority Critical patent/CN107704621A/zh
Publication of CN107704621A publication Critical patent/CN107704621A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明公开了一种互联网舆情地图可视化展示方法,所述方法包括如下步骤,S1:构建舆情信息数据库;S2:根据舆情信息数据库,建立XML数据库文件,产生不同事件在不同时间舆情地理分布的XML文件;S3:利用flash文件调用特定的XML数据库文件;S4:获取某一事件对应的舆情关注度在各个地方所占百分比,在地图中对应地区按照着色算法进行着色,并且最后在地图中进行展示。通过本发明,可以精确和直观的观察到舆情在全国以及在各个省、市的具体注重程度,另一方面也可以提高舆情预测及预警的准确性和即时性,为控制策略的抉择提供相应的指导思路。

Description

一种互联网舆情地图可视化展示方法
技术领域
本发明涉及互联网舆情信息展示技术领域,具体来讲,涉及一种互联网舆情地图可视化展示方法。
背景技术
随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友对热点、热门事件的言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
网络舆情是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点,主要通过BBS论坛、博客、新闻跟贴、转贴等实现并加以强化。当今,信息传播与意见交互空前迅捷,网络舆论的表达诉求也日益多元。如果引导不善,负面的网络舆情将对社会公共安全形成较大威胁。对相关政府部门来说,如何加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。如何将抓取的舆情数据直观的展示出来,如何将舆情的严重程度展示出来对于网络舆情的预警就起着至关重要的作用。
目前我国国内一些比较出名的舆情系统, 如:人民网舆情频道、中科天机舆情系统、网鹰舆情监控预警机、Goonie网络舆情监控分析系统等 。但对于这些舆情系统,其对舆情的展示情况大多数也只是使用文字或者统计规律来进行说明展示,并没有直观的体现出不同地域对同一舆情的反映程度,或者说没有直接的展示出舆情的地理分布,更没有通过地理分布来全景展示舆情的变化规律以及作出相应的预测。
如何从全国或者全省宏观的、有效的监视或观察舆情发展蔓延,在舆情初期就有效遏制,成为一个极为重要的问题。本发明提出一种基于用户发现和参与度的地图展示方法,该方法能够根据时刻对特定舆情在全国和各省市影响程度进行追踪并展示,同时,能够对不同舆情势态的变化生成不同的报告,极大方便了舆情事件的监视,在宏观层面为遏制舆情决策提供了实证参考数据。
本发明提供的系统可以直观的分析舆情趋势,分析某个主题在不同的时间段以及不同的地理区域,人们对其所关注的程度。 同时也可以对舆情和疫情进行跨时间、跨空间综合分析,获知事件发生的全貌,及早发现危机的苗头,及早对可能产生的现实危机的规模进行判断,及早通知各有关职能部门共同做好应对危机的准备。
发明内容
本发明的目的在于克服上述现有技术的不足,提供一种能及时准确地了解互联网舆论的网络舆情地图展示方法,本发明主要结合XML数据库和FLASH技术以及ActionScript语言进行搭建。
本发明提出的一种互联网舆情地图可视化展示方法,包括如下步骤,
S1:构建舆情信息数据库;
S2:根据舆情信息数据库,建立XML数据库文件,产生不同事件在不同时间舆情地理分布的XML文件;
S3:利用flash文件调用特定的XML数据库文件;
S4:获取某一事件对应的舆情关注度在各个地方所占百分比,在地图中对应地区按照着色算法进行着色,并且最后在地图中进行展示。
优选的,所述S1的具体包括:
S11:利用网络爬虫对门户网站和论坛的网页内容进行即时采集;
S12:对采集的网页文档进行解析预处理,所述预处理过程包括HTML标记过滤、文档标题及正文内容提取;
S13:将预处理结果组装成网页信息文档,并保存到网页数据库中;
S14:导出网页数据库中的信息文档,进行舆情识别,按照不同的事件名称、时间、地理位置对舆情进行分类,建立舆情信息类别库,基于信息类别库的小类类别对文档进行分类,分类结果写入相应的信息类别库,最后再将结果数据写入到舆情信息数据库。
优选的,所述步骤S2中,对于舆情信息数据库已经存在的舆情信息,根据事件名称、时间、地理位置,建立XML数据库文件,通过该步可以建立前台按地域展示所需要的XML数据库。
优选的,所述步骤S3中“利用flash文件调用特定的XML数据库文件”的具体方法为:根据时间或者地理位置选择所需要进行展示的事件名称,然后通过对该事件的关键字在数据库中进行搜索来判断是否存在相应的XML文件,如果没有对应的XML文件,则说明该事件的舆情信息没有具体的数据,并不在抓取;如存在对应的XML文件,在flash cs4中通过Action Script加载该XML文件。
优选的,所述步骤S4中“获取某一事件对应的舆情关注度在各个地方所占百分比”的具体方法为:通过mapText获取XML文件的各结点并存入myList内,myList中便是针对该事件不同省市对其关注程度的数据百分比信息percentage。
优选的,所述步骤S4中“在地图中对应地区按照着色算法进行着色,并且最后在地图中进行展示”的具体方法为:然后通过各省市对应的数据进行对应的着色,根据结点percentage的不同,将percentage从小到大分为多个区间,对不同区间,通过给定的颜色地图着色,区间数值越大,颜色越深。
优选的,所述步骤S4中“着色算法”为:依据传统媒体关注度和网络社区论坛关注度两项统计指标加权运算,计算舆情等级或百分比。
优选的,在步骤S4中地图上,点击相应的省进入该省的内部,通过地图可视化展示来查看该事件舆情在该省内的表现情况及该事件舆情的过去表现形式,并通过预测算法预测将来的变化趋势。
优选的,当预测算法预测的结果超过预设范围时,进行预警。
本发明公开了一种互联网舆情可视化地图展示方法,该方法体现了社会网络的结构演化分析及其在舆情和疫情预警及控制中的应用项目中互联网舆情可视化系统的设计工作。首先通过舆情监控系统抓取的信息分别建立省级和市级XML舆情数据库,实现在中国地图上通过热区展示各个区域的舆情关注度,同时也可以展示该舆情随时间演化的过程,通过对舆情整体上动态演化的研究,可以借此研制有效的控制和预防措施来遏制舆情的发展。本发明用于指导社会网络的结构演化分析及其在舆情和疫情预警及控制中的应用项目中互联网舆情可视化系统的开发研制工作。
附图说明
图1是本发明的整体流程图;
图2是互联网舆情地图展示方法的详细流程图;
图3是互联网舆情地图展示方法的具体着色流程图;
图4-6是本发明的的实验效果图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式。
本发明提出的一种互联网舆情地图可视化展示方法,包括如下步骤,
S1:构建舆情信息数据库;
S2:根据舆情信息数据库,建立XML数据库文件,产生不同事件在不同时间舆情地理分布的XML文件;
S3:利用flash文件调用特定的XML数据库文件;
S4:获取某一事件对应的舆情关注度在各个地方所占百分比,在地图中对应地区按照着色算法进行着色,并且最后在地图中进行展示。
优选的,所述S1的具体包括:
S11:利用网络爬虫对门户网站和论坛的网页内容进行即时采集;
S12:对采集的网页文档进行解析预处理,所述预处理过程包括HTML标记过滤、文档标题及正文内容提取;
S13:将预处理结果组装成网页信息文档,并保存到网页数据库中;
S14:导出网页数据库中的信息文档,进行舆情识别,按照不同的事件名称、时间、地理位置对舆情进行分类,建立舆情信息类别库,基于信息类别库的小类类别对文档进行分类,分类结果写入相应的信息类别库,最后再将结果数据写入到舆情信息数据库。
优选的,所述步骤S2中,对于舆情信息数据库已经存在的舆情信息,根据事件名称、时间、地理位置,建立XML数据库文件,通过该步可以建立前台按地域展示所需要的XML数据库。
优选的,所述步骤S3中“利用flash文件调用特定的XML数据库文件”的具体方法为:根据时间或者地理位置选择所需要进行展示的事件名称,然后通过对该事件的关键字在数据库中进行搜索来判断是否存在相应的XML文件,如果没有对应的XML文件,则说明该事件的舆情信息没有具体的数据,并不在抓取;如存在对应的XML文件,在flash cs4中通过Action Script加载该XML文件。
优选的,所述步骤S4中“获取某一事件对应的舆情关注度在各个地方所占百分比”的具体方法为:通过mapText获取XML文件的各结点并存入myList内,myList中便是针对该事件不同省市对其关注程度的数据百分比信息percentage。
优选的,所述步骤S4中“在地图中对应地区按照着色算法进行着色,并且最后在地图中进行展示”的具体方法为:然后通过各省市对应的数据进行对应的着色,根据结点percentage的不同,将percentage从小到大分为多个区间,对不同区间,通过给定的颜色地图着色,区间数值越大,颜色越深。
优选的,所述步骤S4中“着色算法”为:依据传统媒体关注度和网络社区论坛关注度两项统计指标加权运算,计算舆情等级或百分比。
优选的,在步骤S4中地图上,点击相应的省进入该省的内部,通过地图可视化展示来查看该事件舆情在该省内的表现情况及该事件舆情的过去表现形式,并通过预测算法预测将来的变化趋势。
优选的,当预测算法预测的结果超过预设范围时,进行预警。
如图1,是本发明一种互联网舆情可视化地图展示方法具体实施方式的整体流程图,通过爬虫对互联网数据进行抓取并分析,然后将不同事件信息存储于XML文件数据库,前台调用解析XML文件,然后对地图进行着色来直观展示舆情的热度情况。通过对在本实施方式中,一种互联网舆情可视化地图展示方法包括以下步骤:
(1)利用的一些门户网站(如新浪、雅虎、网易、腾讯等)和大的论坛中爬取用户的跟贴或者留言的网页的内容进行即时采集,采集的网页包括新闻网页文档、论坛网页文档,由于网页文档包含很多HTML标记,以及公告、导航等无关信息,因此需要对采集的网页文档进行HTML标记过滤和文档标题、正文内容提取等预处理过程,然后将预处理结果组装成信息文档并保存到网页数据库中。该步骤目的是采集互联网中的一些门户网站(如新浪、雅虎、网易、腾讯等)和大的论坛中爬取用户的跟贴或者留言的网页信息文档。
(2)导出网页数据库中的信息文档并进行舆情识别,建立舆情信息类别库,然后基于信息类别库的小类类别对文档进行分类,分类结果写入相应的信息类别库,最后再将结果数据写如到数据库中。经过该步骤就可以从内容方面识别出舆情信息,并且建立舆情信息类别库以及相应的数据库。
(3)对于数据库已经存在的舆情信息,接下来就是建立XML数据库文件,XML数据库文件的建立要根据几个参数才能建立,参数包括:事件名称、时间、地理位置,通过该步可以建立前台按地域展示所需要的XML数据库。
(4)当XML数据库文件产生后,前台的flash文件就会自动调用XML数据库文件,并结合地图中的热区根据该地区的百分比值按照着色算法进行着色,并最后在地图中展示出来。
上述步骤(4)包括:
(4-1)、在Flash CS4中将中国地图按照34个省或直辖市划分为34个热区;
(4-2)、按照时间和地理空间对某舆情或者疫情关键词的关注度建立不同的XML文件,然后解析XML文件,从XML数据库(XML文件通过数据库里面的数据进行自动生成,这样保持了展示数据的即时性)中获取中国34个省或直辖市的舆情关注度(XML文件中保存的是关于某一事件对应的舆情在各个地方所占百分比);
(4-3)、按照某一事件对应的舆情在各个地方所占百分比(数据经过了归一化处理,使数据位于0%-100%之间)显示热区颜色深度,这样容易区分百分比高的区域,即很直观的展示哪些区域对某一具体事件的关注度高;
(4-4)、鼠标移到热区上,热区高亮显示;鼠标移开热区,区域恢复原来的颜色状态。按地图上的次级区域显示并匹配搜索量指数,鼠标单击热区上的某省,可以获得该省基本的搜索量信息;
(4-5)、按照步骤1中的主地图热区划分方法将各省的地图划分热区,单击热区上某省份名称可以深入到该省的城市地图,嵌套的省内的市级地图基本展示和主地图(中国地图)一样。
进一步,为使本发明获得更好的展示效果,在上述步骤(4-3)中,依据XML文件里面的百分比值将舆情热度划分为多个级别,舆情热度也相应由高至低。此处将主要基调色设为红色,热区显示颜色依据XML文件里面各省市所占的百分比不同来显示不同的颜色,颜色从浅红到深红共分为10个等级,其中深红色表示舆情最为严重,应该引起最大的重视,而浅红色则代表舆情没有或者很低。由于经过归一化处理后,大多数数据都会在0%-20%,只有少部份数据会超过20%,所以颜色的取值区间在0%-20%要小且多,在超过20%的区间要大且少,这样展示的效果会更加。
优选的,所述4-1也可以建立在之前的任何一步。
图2是该发明的可视化地图展示的详细流程图,算法伪代码如下:
Cityname /省、直辖市名称/
Percentage /相应比例/
Mylist /结点信息/
Maptext /加载XML/
if XML file exist then
Maptext load XML file
get Mylist_node from XML file
i ← 0
while i < Mylist.length do
get Cityname[i] , Percentage[i] from Mylist_msg
i ← i ++
end while
j ← 0
while j < Mylist.length do
Colour the map with Cityname[j] and Percentage[j]
j ← j ++
end while
end if
为使本发明获得更好的发明效果,图2可视化地图展示主要包括如下步骤 :
(1)首先根据时间或者地理位置选择所需要进行展示的事件名称,然后通过对该事件的关键字在数据库中进行搜索来判断是否存在相应的XML文件,如果没有对应的XML文件,则说明该事件的舆情信息没有具体的数据(不再抓取),这样的事件对应的舆情在地图可不做任何展示,整个地图显示颜色为默认颜色,如存在对应的XML文件,则跳转到步骤2进行处理。
(2) 在flash cs4中通过Action Script加载该XML文件,然后通过mapText获取XML文件的各结点并存入myList内,myList中便是针对该事件不同省市对其关注程度的数据信息percentage,然后通过各省市对应的数据进行对应的着色,地图着色是根据结点percentage的不同,判断percentage在不同的区间内,然后按照给定的区间颜色分层次对地图进行着色,当不同结点的percentage在 >20、20-13、13-8、8-4、4-2、2-0.5、0.5-0.3、0.3-0.1等数值区间内时,确定该区域的颜色深浅程度,然后通过给定的颜色由深到浅为地图着色。着色算法可以依据传统媒体关注度和网络社区论坛关注度两项统计指标加权运算设置舆情等级从而便于展示。各项权重分别为:传统媒体关注度50%、网络社区论坛关注度50%。依据百分比将舆情热度划分为多个级别,舆情关注度也相应由高至低。其中主要基调色为红色,显示程度依据XML文件里面各省市所占的百分比不同来显示不同的颜色,颜色从浅红到深红共分为10个等级,其中深红色表示舆情最为严重,应该引起最大的重视,而浅红则代表舆情没有或者很低。百分比值初始化热区颜色的时候可以更改,可以根据实际的需要更改区域的初始化颜色,就可以很直观的显示某一区域的关注程度或者说是舆情热度。
(3)为了更有效的观察某事件舆情近期的变化趋势,本发明提供了按照不同时间来查看该事件舆情的地图可视化展示情况,对于某一特定的事件,本发明提供了一种展示其舆情走向的趋势图,我们从趋势图中可以观察到从事件的发生之初的地图可视化展示到现在的地图可是展示的变化,从而可以根据这些变化来得出一些相应的算法,通过这些算法得出其对应变化趋势并使用地图可视化展示出来。
(4)当我们选择特定的事件舆情展示时,我们可以点击相应的省进入该省的内部,亦可以通过地图可视化展示来查看该时间舆情在该省内的表现情况,并且同理可以观察该事件舆情的过去表现形式,并预测将来的变化趋势。
图2中,Cityname,percentage,mylist均为数组型量,Cityname,percentage用于存放省、直辖市名称以及相应的比例,mylist用于存放XML文件里面的结点信息,Maptext用于加载不同的xml. i值初始为0,用于对myList中的结点进行计数; j值初始为0,用于对热区进进行计数;flash中各个热区的划分方法:获取中国地图以及各省地图,再把每一张地图根据地域划分为热区。着色的方法:见图3。
图3是该发明的可视化地图展示的着色算法流程图,算法伪代码如下。
j ← 0
while j < Mylist.length do
if percentage[j] > 20 then
colour the Cityname[j] with #4D0000 on the map
elseif 13 < percentage[j] < 20 then
colour the Cityname[j] with #750000 on the map
elseif 8 < percentage[j] < 13 then
colour the Cityname[j] with #930000 on the map
elseif 4 < percentage[j] < 8 then
colour the Cityname[j] with #AE0000 on the map
elseif 2 < percentage[j] < 4 then
colour the Cityname[j] with #CE0000 on the map
elseif 1 < percentage[j] < 2 then
colour the Cityname[j] with #FF2D2D on the map
elseif 0.5 < percentage[j] < 1 then
colour the Cityname[j] with #FF7575 on the map
elseif 0.3 < percentage[j] < 0.5 then
colour the Cityname[j] with #FF9797 on the map
elseif 0.1 < percentage[j] < 0.3 then
colour the Cityname[j] with #FFD2D2 on the map
else
colour the Cityname[j] with #FFECEC on the map
end if
j ← j + +
end while
进一步,为使本发明获得更好的发明效果,图3可视化地图展示主要包括如下步骤:
(1)对一某一特定的事件,通过计算,可以得出各个省市对其的反映百分比在0%-100%之间,为了方便算法比较,我们此处均取百分比的分子,这个各个地方的百分比值可转换为相应的比例指数,该指数的值范围是0-100,接下来我们就可以根据不同的指数值对不同的热点进行着色。
(2)经过数据的转换,我们发现个地域的比例指数绝大多数在0-20范围之间,因此我们不能用传统均值的方法对热区进行着色,为了得到更好的展示效果,我们对热区的着色算法进行调整,对于颜色的取值区间在0%-20%,则该区间的着色方式要小且多,在超过20%的区间,着色方式要大且少,具体着色方法见第三步。
(3)从XML文件的第一个数据开始判断,当该省市的比例指数大于20时,我们将该省市在地图上对应的热区着为#4D0000颜色,当该省市的比例指数位于13-20时,我们将该省市在地图上对应的热区着为#750000颜色, 当该省市的比例指数位于8-13时,我们将该省市在地图上对应的热区着为#930000颜色, 当该省市的比例指数位于4-8时,我们将该省市在地图上对应的热区着为#AE0000颜色, 当该省市的比例指数位于2-4时,我们将该省市在地图上对应的热区着为#CE0000颜色, 当该省市的比例指数位于1-2时,我们将该省市在地图上对应的热区着为#FF2D2D颜色,当该省市的比例指数位于0.5-1时,我们将该省市在地图上对应的热区着为#ff7575颜色, 当该省市的比例指数位于0.3-0.5时,我们将该省市在地图上对应的热区着为#FF9797颜色, 当该省市的比例指数位于0.1-0.3时,我们将该省市在地图上对应的热区着为#FFD2D2颜色, 当该省市的比例指数小于0.1时,我们将该省市在地图上对应的热区着为#FFECEC颜色。
图3中,Cityname[i],percentage为省市名称和对应的舆情比例值。图3中使用的颜色基准色为红色,从#4D0000到#FFECEC为渐进色,趋势为从深到浅。
图4-6位本发明的效果图。图4为“湖南凤凰少女坠楼案”的搜索量指数分布图,从图中可以明显看出,四川、青海、湖南、江西、福建、河南、辽宁等地的关注指数较高,内蒙古和西藏的关注程度则相对偏低。
图5则为“湖南凤凰少女坠楼案”第一天的搜索用户分布图,明显可以看出,四川的检索量远高于其他其他身份。
图6则为“点击”进入黑龙江省后,黑龙江各个市的搜索和关注情况。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、ROM、RAM等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (9)

1.一种互联网舆情地图可视化展示方法,其特征在于,所述互联网舆情地图可视化展示方法包括如下步骤,
S1:构建舆情信息数据库;
S2:根据舆情信息数据库,建立XML数据库文件,产生不同事件在不同时间舆情地理分布的XML文件;
S3:利用flash文件调用特定的XML数据库文件;
S4:获取某一事件对应的舆情关注度在各个地方所占百分比,在地图中对应地区按照着色算法进行着色,并且最后在地图中进行展示。
2.一种如权利要求1所述的互联网舆情地图可视化展示方法,其特征在于,所述S1的具体包括:
S11:利用网络爬虫对门户网站和论坛的网页内容进行即时采集;
S12:对采集的网页文档进行解析预处理,所述预处理过程包括HTML标记过滤、文档标题及正文内容提取;
S13:将预处理结果组装成网页信息文档,并保存到网页数据库中;
S14:导出网页数据库中的信息文档,进行舆情识别,按照不同的事件名称、时间、地理位置对舆情进行分类,建立舆情信息类别库,基于信息类别库的小类类别对文档进行分类,分类结果写入相应的信息类别库,最后再将结果数据写入到舆情信息数据库。
3.一种如权利要求1所述的互联网舆情地图可视化展示方法,其特征在于,所述步骤S2中,对于舆情信息数据库已经存在的舆情信息,根据事件名称、时间、地理位置,建立XML数据库文件,通过该步可以建立前台按地域展示所需要的XML数据库。
4.一种如权利要求1所述的互联网舆情地图可视化展示方法,其特征在于,所述步骤S3中“利用flash文件调用特定的XML数据库文件”的具体方法为:根据时间或者地理位置选择所需要进行展示的事件名称,然后通过对该事件的关键字在数据库中进行搜索来判断是否存在相应的XML文件,如果没有对应的XML文件,则说明该事件的舆情信息没有具体的数据,并不在抓取;如存在对应的XML文件,在flash cs4中通过Action Script加载该XML文件。
5.一种如权利要求1所述的互联网舆情地图可视化展示方法,其特征在于,所述步骤S4中“获取某一事件对应的舆情关注度在各个地方所占百分比”的具体方法为:通过mapText获取XML文件的各结点并存入myList内,myList中便是针对该事件不同省市对其关注程度的数据百分比信息percentage。
6.一种如权利要求5所述的互联网舆情地图可视化展示方法,其特征在于,所述步骤S4中“在地图中对应地区按照着色算法进行着色,并且最后在地图中进行展示”的具体方法为:然后通过各省市对应的数据进行对应的着色,根据结点percentage的不同,将percentage从小到大分为多个区间,对不同区间,通过给定的颜色地图着色,区间数值越大,颜色越深。
7.一种如权利要求5所述的互联网舆情地图可视化展示方法,其特征在于,所述步骤S4中“着色算法”为:依据传统媒体关注度和网络社区论坛关注度两项统计指标加权运算,计算舆情等级或百分比。
8.一种如权利要求6-7所述的互联网舆情地图可视化展示方法,其特征在于,在步骤S4中地图上,点击相应的省进入该省的内部,通过地图可视化展示来查看该事件舆情在该省内的表现情况及该事件舆情的过去表现形式,并通过预测算法预测将来的变化趋势。
9.一种如权利要求8所述的互联网舆情地图可视化展示方法,其特征在于,当预测算法预测的结果超过预设范围时,进行预警。
CN201711025251.5A 2017-10-27 2017-10-27 一种互联网舆情地图可视化展示方法 Pending CN107704621A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711025251.5A CN107704621A (zh) 2017-10-27 2017-10-27 一种互联网舆情地图可视化展示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711025251.5A CN107704621A (zh) 2017-10-27 2017-10-27 一种互联网舆情地图可视化展示方法

Publications (1)

Publication Number Publication Date
CN107704621A true CN107704621A (zh) 2018-02-16

Family

ID=61176251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711025251.5A Pending CN107704621A (zh) 2017-10-27 2017-10-27 一种互联网舆情地图可视化展示方法

Country Status (1)

Country Link
CN (1) CN107704621A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108984640A (zh) * 2018-06-22 2018-12-11 华北电力大学 一种基于web数据挖掘的地理信息获取方法
CN109522490A (zh) * 2018-09-18 2019-03-26 武汉大学 一种互联网信息的地图可视化方法
CN109543186A (zh) * 2018-11-22 2019-03-29 北京奇安信科技有限公司 一种舆情信息处理方法、系统、电子设备和介质
CN109711627A (zh) * 2018-12-28 2019-05-03 大庆市嘉华科技有限公司 一种数据处理方法及装置
CN112085813A (zh) * 2020-08-24 2020-12-15 北京全现在信息技术服务有限公司 事件展示方法、装置、计算机设备及计算机可读存储介质
CN112579925A (zh) * 2019-09-29 2021-03-30 上海幻电信息科技有限公司 舆情数据可视化方法、装置、计算机设备及可读存储介质
CN112905913A (zh) * 2019-12-04 2021-06-04 支付宝(杭州)信息技术有限公司 一种舆情展示方法、装置及设备
CN113010829A (zh) * 2021-03-31 2021-06-22 建信金融科技有限责任公司 一种数据分区可视化方法、装置、计算机设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414300A (zh) * 2008-11-28 2009-04-22 电子科技大学 一种互联网舆情信息的分类处理方法
CN102708096A (zh) * 2012-05-29 2012-10-03 代松 一种基于语义的网络智能舆情监测系统及其工作方法
CN102779174A (zh) * 2012-06-26 2012-11-14 北京奇虎科技有限公司 一种舆情信息展示系统及方法
US20140032629A1 (en) * 2006-07-06 2014-01-30 Visible Measures Corp. Remote invocation mechanism for logging
CN104239383A (zh) * 2014-06-09 2014-12-24 合肥工业大学 一种微博情感可视化方法
CN104516961A (zh) * 2014-12-18 2015-04-15 北京牡丹电子集团有限责任公司数字电视技术中心 一种基于地域的话题挖掘及话题走势分析方法及系统
CN104881417A (zh) * 2014-02-28 2015-09-02 深圳市网安计算机安全检测技术有限公司 舆情分析方法及系统
CN104933093A (zh) * 2015-05-19 2015-09-23 武汉泰迪智慧科技有限公司 基于大数据的地区舆情监控及决策辅助系统和方法
CN105404644A (zh) * 2015-10-27 2016-03-16 北京红马传媒文化发展有限公司 一种舆情信息处理方法和系统
CN105740228A (zh) * 2016-01-25 2016-07-06 云南大学 一种互联网舆情分析方法
CN106339463A (zh) * 2016-08-26 2017-01-18 中国传媒大学 基于Logistic模型的网络舆情预警系统及其预警方法
CN107193793A (zh) * 2017-06-20 2017-09-22 深圳易嘉恩科技有限公司 基于actionscript的树形表格控件
CN107257362A (zh) * 2017-05-27 2017-10-17 苏州全民供求网络科技有限公司 随时间关注度在地图动态显示事件和撮合聊天方法及系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140032629A1 (en) * 2006-07-06 2014-01-30 Visible Measures Corp. Remote invocation mechanism for logging
CN101414300A (zh) * 2008-11-28 2009-04-22 电子科技大学 一种互联网舆情信息的分类处理方法
CN102708096A (zh) * 2012-05-29 2012-10-03 代松 一种基于语义的网络智能舆情监测系统及其工作方法
CN102779174A (zh) * 2012-06-26 2012-11-14 北京奇虎科技有限公司 一种舆情信息展示系统及方法
CN104881417A (zh) * 2014-02-28 2015-09-02 深圳市网安计算机安全检测技术有限公司 舆情分析方法及系统
CN104239383A (zh) * 2014-06-09 2014-12-24 合肥工业大学 一种微博情感可视化方法
CN104516961A (zh) * 2014-12-18 2015-04-15 北京牡丹电子集团有限责任公司数字电视技术中心 一种基于地域的话题挖掘及话题走势分析方法及系统
CN104933093A (zh) * 2015-05-19 2015-09-23 武汉泰迪智慧科技有限公司 基于大数据的地区舆情监控及决策辅助系统和方法
CN105404644A (zh) * 2015-10-27 2016-03-16 北京红马传媒文化发展有限公司 一种舆情信息处理方法和系统
CN105740228A (zh) * 2016-01-25 2016-07-06 云南大学 一种互联网舆情分析方法
CN106339463A (zh) * 2016-08-26 2017-01-18 中国传媒大学 基于Logistic模型的网络舆情预警系统及其预警方法
CN107257362A (zh) * 2017-05-27 2017-10-17 苏州全民供求网络科技有限公司 随时间关注度在地图动态显示事件和撮合聊天方法及系统
CN107193793A (zh) * 2017-06-20 2017-09-22 深圳易嘉恩科技有限公司 基于actionscript的树形表格控件

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108984640A (zh) * 2018-06-22 2018-12-11 华北电力大学 一种基于web数据挖掘的地理信息获取方法
CN109522490A (zh) * 2018-09-18 2019-03-26 武汉大学 一种互联网信息的地图可视化方法
CN109522490B (zh) * 2018-09-18 2021-11-09 武汉大学 一种互联网信息的地图可视化方法
CN109543186A (zh) * 2018-11-22 2019-03-29 北京奇安信科技有限公司 一种舆情信息处理方法、系统、电子设备和介质
CN109543186B (zh) * 2018-11-22 2023-12-19 奇安信科技集团股份有限公司 一种舆情信息处理方法、系统、电子设备和介质
CN109711627A (zh) * 2018-12-28 2019-05-03 大庆市嘉华科技有限公司 一种数据处理方法及装置
CN112579925A (zh) * 2019-09-29 2021-03-30 上海幻电信息科技有限公司 舆情数据可视化方法、装置、计算机设备及可读存储介质
CN112905913A (zh) * 2019-12-04 2021-06-04 支付宝(杭州)信息技术有限公司 一种舆情展示方法、装置及设备
CN112085813A (zh) * 2020-08-24 2020-12-15 北京全现在信息技术服务有限公司 事件展示方法、装置、计算机设备及计算机可读存储介质
CN113010829A (zh) * 2021-03-31 2021-06-22 建信金融科技有限责任公司 一种数据分区可视化方法、装置、计算机设备及存储介质
CN113010829B (zh) * 2021-03-31 2023-01-20 中国建设银行股份有限公司 一种数据分区可视化方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN107704621A (zh) 一种互联网舆情地图可视化展示方法
Collins et al. Trends in combating fake news on social media–a survey
US20220342923A1 (en) User interface for visualizing search data
CN109829089B (zh) 基于关联图谱的社交网络用户异常检测方法和系统
TWI493367B (zh) 搜尋結果之先進過濾方法
CN102760172B (zh) 一种网络搜索方法及网络搜索系统
Crnovrsanin et al. Visual recommendations for network navigation
AU2010330720A1 (en) System and method for attentive clustering and related analytics and visualizations
KR101566616B1 (ko) 빅데이터 처리를 통한 광고의사결정시스템 및 방법
TW202001620A (zh) 自動化網站資料蒐集方法
CN103577404A (zh) 一种面向微博的全新突发事件发现方法
Yuan et al. Wikipedia vandal early detection: from user behavior to user embedding
Lettieri et al. A computational approach for the experimental study of EU case law: analysis and implementation
Xu et al. Analysis of large digital collections with interactive visualization
Zhao et al. The contents and methods of knowledge network from the perspective of bibliometrics
Yang et al. The research of policy big data retrieval and analysis based on elastic search
Menin et al. From linked data querying to visual search: towards a visualization pipeline for LOD exploration
Wang et al. A web text mining approach for the evaluation of regional characteristics at the town level
Wu et al. Neural gender prediction from news browsing data
Ye et al. An interpretable mechanism for personalized recommendation based on cross feature
KR102041915B1 (ko) 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법
Onorati et al. Tweet me and I'll help you: Mapping tweets for emergency operation centers: The case of Paris attacks
Steinberger et al. Observing Trends in Automated Multilingual Media Analysis
Yuan et al. OLAP4R: A top-k recommendation system for OLAP Sessions
Lauro et al. Data science and social research

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180216