CN109325165A - 网络舆情分析方法、装置及存储介质 - Google Patents
网络舆情分析方法、装置及存储介质 Download PDFInfo
- Publication number
- CN109325165A CN109325165A CN201810998132.6A CN201810998132A CN109325165A CN 109325165 A CN109325165 A CN 109325165A CN 201810998132 A CN201810998132 A CN 201810998132A CN 109325165 A CN109325165 A CN 109325165A
- Authority
- CN
- China
- Prior art keywords
- public sentiment
- label
- article
- public
- sentiment article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种网络舆情分析方法,包括:采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理;分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,为每篇舆情文章标注与第二预设关键词对应的第一标签;计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并标注第二标签;分别统计每个第一标签对应的舆情文章总数及负面舆情文章数量;及,分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。本发明还提出一种电子装置及存储介质。利用本发明,可以提高对舆情的监控预警能力,帮助用户针对舆情事件进行相应决策。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种网络舆情分析方法、电子装置及计算机可读存储介质。
背景技术
网络舆情是指在网络上流行的对社会事件不同看法的网络舆论,是社会舆论的一种表现形式。近年来,网络舆情对生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。同时,网络舆情突发事件如果处理不当,极有可能诱发民众的不良情绪,引发群众的违规和过激行为,进而对社会稳定构成威胁。
因此,对于网络舆情状态的监测就变得尤为重要。目前舆情系统大多是通过舆情分析师筛选舆情,然后对系统进行跟踪,从而对事件在影响力上对其舆情状态有一个大致的判断,但是这种方案存在监测媒体源不够全面的缺陷,且无法直观地了解到网络舆情的舆情状态,进而导致无法及时准确地进行预警。
发明内容
本发明提供一种网络舆情分析方法、电子装置及计算机可读存储介质,其主要目的在于提高对舆情的监控预警能力。
为实现上述目的,本发明提供一种网络舆情分析方法,该方法包括:
通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合;
分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签;
根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签;
根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;及
分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。
此外,为实现上述目的,本发明提供一种电子装置,该装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的网络舆情分析程序,该程序被所述处理器执行时实现如上所述的网络舆情分析方法的任意步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有网络舆情分析程序,该程序被处理器执行时实现如上所述的网络舆情分析方法的任意步骤。
相较于现有技术,本发明提出的网络舆情分析方法、电子装置及计算机可读存储介质,对采集的舆情文章进行聚类分析,构建观点主题,实现了对舆情文章的高度概括;利用情感评分模型计算概括得到的观点主题的情感得分,确定舆情文章的情感倾向,提高了对舆情文章的情感分析准确率;利用第一标签对采集的舆情文章进行分类,分别计算每个第一标签的负面舆情影响力及总舆情影响力,确定每个第一标签对应的舆情健康度,直观地展示了当前每个第一标签对应的舆情状况;通过舆情文章的分布信息生成每个第一标签对应的舆情分布图,通过舆情文章的传播路径确定每个第一标签对应的中心媒体,并基于舆情健康度较低的第一标签生成预警信息,提高了对舆情的监控预警能力。
附图说明
图1为本发明电子装置较佳实施例的示意图;
图2为图1中网络舆情分析程序的程序模块示意图;
图3为本发明网络舆情分析方法较佳实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种网络舆情分析方法,该方法应用于一种电子装置1。参照图1所示,为本发明电子装置1较佳实施例的示意图。
在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有数据处理功能的终端设备,所述服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器。
该电子装置1包括存储器11、处理器12,通信总线13,及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。存储器11在另一些实施例中也可以是所述电子装置1的外部存储设备,例如该电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括该电子装置1的内部存储单元也包括外部存储设备。
存储器11不仅可以用于存储安装于该电子装置1的应用软件及各类数据,例如网络舆情分析程序10等,还可以用于暂时地存储已经输出或者将要输出的数据。处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如网络舆情分析程序10等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置1与其他电子设备之间建立通信连接。
图1仅示出了具有组件11-14的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。
可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。其中,显示器也可以称为显示屏或显示单元,用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
在图1所示的装置实施例中,存储器11中存储有网络舆情分析程序10。处理器12执行存储器11中存储的网络舆情分析程序10时实现如下步骤:
通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合。
以集团A为例对本发明的方案进行说明,假设需了解集团A的舆情现状,在采集关于集团A的舆情文章之前,需针对集团A预先设置相关的一个或多个第一预设关键词,例如,集团A的法人名称、集团A旗下各公司的法人名称等,并预先设置待爬取的统一资源定位符(URL)列表,使用网络爬虫根据上述URL列表中的URL地址及预先设置的一个或多个关键词,从预设的数据渠道采集预设时间内(例如,一周)与集团A相关的舆情文章。具体地,预设的数据渠道包括但不仅限于微博、微信、论坛、新闻门户等,从上述数据渠道获取到的舆情文章主要包括新闻评论、论坛帖子、微博博文、微信文章等。
上述采集与预设关键词相关的舆情文章的频率可根据需要设置,例如,实时,或者设置固定的时间间隔(例如,1天),或者在接收到用户发出的采集指令时执行采集与预设关键词相关的舆情文章的步骤。
采集到关于集团A在预设时间内的舆情文章后,对舆情文章进行分词处理:分别提取每篇舆情文章的正文数据,去除超级文本标记语言(HTML)标签数据(例如,图片、链接,甚至音乐、程序等非文字元素)、图像标记等无关数据,然后通过正则表达式去除正文数据中的非中文字符。
然后,对保留的正文数据通过分词工具进行分词,将中文段落生成以空格分隔的初始词汇集合。按照预设的停用词词表对初始词汇集合进行去停用词处理,将经去停用词处理后的词汇集合作为该舆情文章的词汇集合,即以空格分隔的词汇集合作为特征用来表征舆情文章。
分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签。
具体地,所述第一标签为表征舆情文章涉及的专业公司(或者业务板块,例如,保险、银行、投资等)的分类标签。
可以理解的是,在集团决策时,需要了解集团下各专业公司的舆情状况,因此需将上述步骤采集的所有舆情文章根据涉及的各专业公司进行分类。针对集团A下的各专业公司预先设置相关的一个或多个第二预设关键词,例如,集团A下各专业公司的法人名称、简称、各专业公司领导人名字等,不同的第二预设关键词对应不同的专业公司。
在将所有表征各舆情文章的词汇集合分别与一个或多个第二预设关键词进行匹配的过程中,一篇舆情文章的词汇集合中可能包含多个第二预设关键词,为该篇舆情文章标注多个第一标签,表示该篇文章同时涉及到集团A下的多家专业公司。
根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签。
具体地,所述第二标签为表征舆情文章情感倾向的情感标签。在计算集团A下各专业公司的舆情健康度前,需对每篇舆情文章的情感倾向进行判断,优选地,该步骤可细化为以下步骤:
采用聚类算法对所述舆情文章进行聚类分析,生成多个观点主题,根据观点主题包含的舆情文章的词向量计算观点主题的词向量;及
将观点主题的词向量输入到预先训练好的情感评分模型中,输出观点主题的情感得分,根据情感得分确定观点主题对应的舆情文章所属的情感倾向。
获取各个舆情文章的词汇集合,对以空格分隔的词汇集合表征的舆情文章进行聚类。由于大众对于一个事件的看法可能是多种多样的、因此通过对采集到的所有舆情文章进行聚类分析,实现对舆情文章的高度概括,获取到多个观点主题。
具体地,获取预设的语料库,例如,中文维基百科语料库,基于该语料库,根据词频-逆文档频率指数(TF-IDF)算法计算每篇舆情文章对应的词汇集合中各个词汇的重要程度,根据重要程度由高到低的顺序对每篇舆情文章对应的词汇集合中的各个词汇进行排序。选择每篇舆情文章对应的词汇集合中的排序靠前的预设数量的(例如,N个,其中,N>0,且N为整数)词汇作为每篇舆情文章的关键词。
另外,基于中文维基百科语料库生成中文语料的词向量模型(Word2vec模型),通过该Word2vec模型分别计算每篇舆情文章的N个关键词的词向量,并利用上述步骤得到的N个关键词的词向量计算每篇舆情文章的词向量。
在计算得到各舆情文章的词向量后,根据Kmeans算法(K均值算法)对所有舆情文章进行聚类分析,分成为多个观点主题。Kmeans算法的K值的初始值随机设置,K值为分类的类群的数量,根据对分类结果的评估调整K值,直至分类结果的准确度达到设定的阈值。
将每个观点主题中的所有舆情文章的关键词汇总,计算每个关键词的词频,词频体现了该关键词的权重。通过Word2vec模型计算观点主题中汇总的各个关键词的词向量,根据关键词的词向量和词频计算观点主题的词向量。
计算各舆情文章的情感评分前,采取交叉验证的方式,预先根据构建的样本库训练预设深度神经网络模型,确定模型参数,将确定模型参数的深度神经网络模型作为情感评分模型。
使用上述训练好的情感评分模型计算各个观点主题的情感得分,其中,情感得分的取值区间为[-1,1],若观点主题的情感得分为负数,则说明该观点主题的情感偏向于负面;若观点主题的情感得分为正数,则说明该观点主题的情感偏向于正面;若观点主题的情感得分在0附近,则说明该观点主题的情感可能倾向于中立。
根据观点主题的情感得分,分别确定不同观点主题对应的舆情文章对应的情感倾向,并为每篇舆情文章标注相应的第二标签“1”、“0”、“-1”。并从所有舆情文章中筛选出情感标签为“-1”的舆情文章,即负面舆情文章。
根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;
在分别确定了每篇舆情文章的第一标签及第二标签后,根据第一标签,分别确定各专业公司对应的舆情文章,并统计各专业公司对应的舆情文章的总数M1p;根据第二标签,筛选出各专业公司对应的负面舆情文章,并统计每个各专业公司对应的所有舆情文章中负面舆情文章的数量M2p。
分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。
具体地,该步骤可细化为以下步骤:
分别获取所述多个第一标签对应的每篇舆情文章的发布媒体信息,根据发布媒体信息确定每个第一标签对应的每篇舆情文章对应的媒体权重指数及媒体级别指数;
根据每个第一标签对应的负面舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的负面舆情文章的负面舆情影响力;及
根据每个第一标签对应的舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的舆情文章的总舆情影响力。
在本实施例中,所述发布媒体信息为媒体名称,例如,人民网、新华网、新浪网、搜狐网、财经网、和讯网、金融界、今日头条等。可以理解的是,不同的舆情文章的发布媒体可能相同,也可能不同,在确定每篇舆情文章的发布媒体后,根据发布媒体将所有舆情文章划分为多个类别。
然后,分别确定不同的发布媒体对应的媒体权重指数,在本实施例中,媒体权重指数可直接从一些网站提取直接从一些网站上手动提取,或者通过程序对外接口直接提取,例如,从“站长之家”获取不同发布媒体的百度权重指数,作为不同发布媒体的媒体权重指数αi。
优选地,媒体级别包括:包括:中央权威、核心财经、财经垂直、综合门户、资讯客户端、自媒体大V及其他。不同的媒体级别对应不同的媒体级别指数,媒体级别越高,媒体级别指数越大。例如,中央权威:5、核心财经:4.5、财经垂直:4、综合门户:3.5、资讯客户端:3、自媒体大V:2.5、其他:2。分别确定不同发布媒体对应的媒体级别指数βi。
获取每个第一标签对应的负面舆情文章的具体信息,分别计算每个第一标签对应的负面舆情文章的负面舆情影响力,优选地,所述负面舆情影响力的计算公式为为:
其中,INp表示第一标签p对应的M1p篇负面舆情文章的负面舆情影响力,αj表示第一标签p对应的不同负面舆情文章i的媒体权重指数,βi表示第一标签p对应的不同负面舆情文章i的的媒体级别指数,i=[0,M1p]。
获取每个第一标签对应的所有舆情文章的具体信息,分别计算每个第一标签对应的所有舆情文章的总舆情影响力,优选地,所述总舆情影响力的计算公式为:
其中,ITp表示第一标签p对应的M2p篇舆情文章的总舆情影响力,αi表示第一标签p对应的不同舆情文章i的媒体权重指数,βi表示第一标签p对应的不同舆情文章i的的媒体级别指数,i=[0,M2p]。
利用所述负面舆情影响力及所述总舆情影响力,分别计算每个第一标签的舆情健康度,优选地,所述舆情健康度的计算公式为:
H=(1-INp/ITp)*10
其中,INp表示第一标签p对应的M1p篇负面舆情文章的负面舆情影响力,ITp表示第一标签p对应的M2p篇舆情文章的总舆情影响力,M1p≤M2p。
上述实施例提出的电子装置1,对采集的舆情文章进行聚类分析,构建观点主题,实现了对舆情文章的高度概括;利用情感评分模型计算概括得到的观点主题的情感得分,确定舆情文章的情感倾向,提高了对舆情文章的情感分析准确率;利用第一标签对采集的舆情文章进行分类,分别计算每个第一标签的负面舆情影响力及总舆情影响力,确定每个第一标签对应的舆情健康度,直观地展示了当前每个第一标签对应的舆情状况,提高了对舆情的监控能力。
可选地,在其他的实施例中,网络舆情分析程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。例如,参照图2所示,为图1中网络舆情分析程序10的模块示意图,该实施例中,网络舆情分析程序10可以被分割为采集模块110、匹配模块120、情感分析模块130、统计模块140、计算模块150及预警模块160,所述模块110-160所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:
采集模块110,用于通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合;
匹配模块120,用于分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签;
情感分析模块130,用于根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签;
统计模块140,用于根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;
计算模块150,用于分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度;及
预警模块160,用于按照每个第一标签的舆情健康度的高低顺序,对所述多个第一标签进行排序,筛选出预设数量的舆情健康度较高的标签,并根据该预设数量的标签及舆情健康度生成预警信息并输出。
此外,本发明还提供一种网络舆情分析方法。参照图3所示,为本发明网络舆情分析方法第一个较佳实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,网络舆情分析方法包括步骤S1-S5:
S1、通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合。
以集团A为例对本发明的方案进行说明,假设需了解集团A的舆情现状,在采集关于集团A的舆情文章之前,需针对集团A预先设置相关的一个或多个第一预设关键词,例如,集团A的法人名称、集团A旗下各公司的法人名称等,并预先设置待爬取的统一资源定位符(URL)列表,使用网络爬虫根据上述URL列表中的URL地址及预先设置的一个或多个关键词,从预设的数据渠道采集预设时间内(例如,一周)与集团A相关的舆情文章。具体地,预设的数据渠道包括但不仅限于微博、微信、论坛、新闻门户等,从上述数据渠道获取到的舆情文章主要包括新闻评论、论坛帖子、微博博文、微信文章等。
上述采集与预设关键词相关的舆情文章的频率可根据需要设置,例如,实时,或者设置固定的时间间隔(例如,1天),或者在接收到用户发出的采集指令时执行采集与预设关键词相关的舆情文章的步骤。
采集到关于集团A在预设时间内的舆情文章后,对舆情文章进行分词处理:分别提取每篇舆情文章的正文数据,去除超级文本标记语言(HTML)标签数据(例如,图片、链接,甚至音乐、程序等非文字元素)、图像标记等无关数据,然后通过正则表达式去除正文数据中的非中文字符。
然后,对保留的正文数据通过分词工具进行分词,将中文段落生成以空格分隔的初始词汇集合。按照预设的停用词词表对初始词汇集合进行去停用词处理,将经去停用词处理后的词汇集合作为该舆情文章的词汇集合,即以空格分隔的词汇集合作为特征用来表征舆情文章。
S2、分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签。
具体地,所述第一标签为表征舆情文章涉及的专业公司(或者业务板块,例如,保险、银行、投资等)的分类标签。
可以理解的是,在集团决策时,需要了解集团下各专业公司的舆情状况,因此需将上述步骤采集的所有舆情文章根据涉及的各专业公司进行分类。针对集团A下的各专业公司预先设置相关的一个或多个第二预设关键词,例如,集团A下各专业公司的法人名称、简称、各专业公司领导人名字等,不同的第二预设关键词对应不同的专业公司。
在将所有表征各舆情文章的词汇集合分别与一个或多个第二预设关键词进行匹配的过程中,一篇舆情文章的词汇集合中可能包含多个第二预设关键词,为该篇舆情文章标注多个第一标签,表示该篇文章同时涉及到集团A下的多家专业公司。
S3、根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签。
具体地,所述第二标签为表征舆情文章情感倾向的情感标签。在计算集团A下各专业公司的舆情健康度前,需对每篇舆情文章的情感倾向进行判断,优选地,该步骤可细化为以下步骤:
采用聚类算法对所述舆情文章进行聚类分析,生成多个观点主题,根据观点主题包含的舆情文章的词向量计算观点主题的词向量;及
将观点主题的词向量输入到预先训练好的情感评分模型中,输出观点主题的情感得分,根据情感得分确定观点主题对应的舆情文章所属的情感倾向。
获取各个舆情文章的词汇集合,对以空格分隔的词汇集合表征的舆情文章进行聚类。由于大众对于一个事件的看法可能是多种多样的、因此通过对采集到的所有舆情文章进行聚类分析,实现对舆情文章的高度概括,获取到多个观点主题。
具体地,获取预设的语料库,例如,中文维基百科语料库,基于该语料库,根据词频-逆文档频率指数(TF-IDF)算法计算每篇舆情文章对应的词汇集合中各个词汇的重要程度,根据重要程度由高到低的顺序对每篇舆情文章对应的词汇集合中的各个词汇进行排序。选择每篇舆情文章对应的词汇集合中的排序靠前的预设数量的(例如,N个,其中,N>0,且N为整数)词汇作为每篇舆情文章的关键词。
另外,基于中文维基百科语料库生成中文语料的词向量模型(Word2vec模型),通过该Word2vec模型分别计算每篇舆情文章的N个关键词的词向量,并利用上述步骤得到的N个关键词的词向量计算每篇舆情文章的词向量。
在计算得到各舆情文章的词向量后,根据Kmeans算法(K均值算法)对所有舆情文章进行聚类分析,分成为多个观点主题。Kmeans算法的K值的初始值随机设置,K值为分类的类群的数量,根据对分类结果的评估调整K值,直至分类结果的准确度达到设定的阈值。
将每个观点主题中的所有舆情文章的关键词汇总,计算每个关键词的词频,词频体现了该关键词的权重。通过Word2vec模型计算观点主题中汇总的各个关键词的词向量,根据关键词的词向量和词频计算观点主题的词向量。
计算各舆情文章的情感评分前,采取交叉验证的方式,预先根据构建的样本库训练预设深度神经网络模型,确定模型参数,将确定模型参数的深度神经网络模型作为情感评分模型。
使用上述训练好的情感评分模型计算各个观点主题的情感得分,其中,情感得分的取值区间为[-1,1],若观点主题的情感得分为负数,则说明该观点主题的情感偏向于负面;若观点主题的情感得分为正数,则说明该观点主题的情感偏向于正面;若观点主题的情感得分在0附近,则说明该观点主题的情感可能倾向于中立。
根据观点主题的情感得分,分别确定不同观点主题对应的舆情文章对应的情感倾向,并为每篇舆情文章标注相应的第二标签“1”、“0”、“-1”。并从所有舆情文章中筛选出情感标签为“-1”的舆情文章,即负面舆情文章。
S4、根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;
在分别确定了每篇舆情文章的第一标签及第二标签后,根据第一标签,分别确定各专业公司对应的舆情文章,并统计各专业公司对应的舆情文章的总数M1p;根据第二标签,筛选出各专业公司对应的负面舆情文章,并统计每个各专业公司对应的所有舆情文章中负面舆情文章的数量M2p。
S5、分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。
计算每个第一标签的舆情健康度之前,需分别计算各第一标签的肚面舆情影响力及总舆情影响力。具体地,该步骤可细化为以下步骤:
分别获取所述多个第一标签对应的每篇舆情文章的发布媒体信息,根据发布媒体信息确定每个第一标签对应的每篇舆情文章对应的媒体权重指数及媒体级别指数;
根据每个第一标签对应的负面舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的负面舆情文章的负面舆情影响力;及
根据每个第一标签对应的舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的舆情文章的总舆情影响力。
在本实施例中,所述发布媒体信息为媒体名称,例如,人民网、新华网、新浪网、搜狐网、财经网、和讯网、金融界、今日头条等。可以理解的是,不同的舆情文章的发布媒体可能相同,也可能不同,在确定每篇舆情文章的发布媒体后,根据发布媒体将所有舆情文章划分为多个类别。
然后,分别确定不同的发布媒体对应的媒体权重指数,在本实施例中,媒体权重指数可直接从一些网站提取直接从一些网站上手动提取,或者通过程序对外接口直接提取,例如,从“站长之家”获取不同发布媒体的百度权重指数,作为不同发布媒体的媒体权重指数αi。
优选地,媒体级别包括:包括:中央权威、核心财经、财经垂直、综合门户、资讯客户端、自媒体大V及其他。不同的媒体级别对应不同的媒体级别指数,媒体级别越高,媒体级别指数越大。例如,中央权威:5、核心财经:4.5、财经垂直:4、综合门户:3.5、资讯客户端:3、自媒体大V:2.5、其他:2。分别确定不同发布媒体对应的媒体级别指数βi。
获取每个第一标签对应的负面舆情文章的具体信息,分别计算每个第一标签对应的负面舆情文章的负面舆情影响力,优选地,所述负面舆情影响力的计算公式为为:
其中,INp表示第一标签p对应的M1p篇负面舆情文章的负面舆情影响力,αi表示第一标签p对应的不同负面舆情文章i的媒体权重指数,βi表示第一标签p对应的不同负面舆情文章i的的媒体级别指数,i=[0,M1p]。
获取每个第一标签对应的所有舆情文章的具体信息,分别计算每个第一标签对应的所有舆情文章的总舆情影响力,优选地,所述总舆情影响力的计算公式为:
其中,ITp表示第一标签p对应的M2p篇舆情文章的总舆情影响力,αi表示第一标签p对应的不同舆情文章i的媒体权重指数,βi表示第一标签p对应的不同舆情文章i的的媒体级别指数,i=[0,M2p]。
利用所述负面舆情影响力及所述总舆情影响力,分别计算每个第一标签的舆情健康度,优选地,所述舆情健康度的计算公式为:
H=(1-INp/ITp)*10
其中,INp表示第一标签p对应的M1p篇负面舆情文章的负面舆情影响力,ITp表示第一标签p对应的M2p篇舆情文章的总舆情影响力,M1p≤M2p。
在其他实施例中,该方法还包括:
按照每个第一标签的舆情健康度的高低顺序,对所述多个第一标签进行排序;及
筛选出预设数量的舆情健康度较低的第一标签,并根据该预设数量的第一标签及舆情健康度生成预警信息并输出。
根据第一标签及每个第一标签的舆情健康度,生成预设格式的图表,例如,点状图、条形图、柱状图等,直观地了解各专业公司的舆情健康度。
可以理解的是,舆情健康度越低,说明集团A下各专业公司当前的舆情状况越不容乐观,根据每个第一标签的舆情健康度,筛选出Y个舆情健康度最低的第一标签,基于该Y个第一标签及对应的舆情健康度生成预警信息并输出。
在其他实施例中,预先设置一个舆情健康度阈值,当舆情健康度低于舆情健康度阈值时,基于舆情健康度低于舆情健康度阈值的第一标签及对应的舆情健康度生成预警信息并输出。
在其他实施例中,该方法还包括:
根据每个第一标签对应的舆情文章的发布媒体信息,生成每个第一标签对应的舆情分布图;及
获取每个第一标签对应的舆情文章的传播路径,生成每个第一标签对应的媒体曝光分布图,确定每个第一标签对应的舆情文章的中心媒体。
根据每个第一标签对应的舆情文章的发布媒体信息,例如,网站、媒体等所属企业注册地址,生成舆情分布图;根据舆情发布的平台,例如,微博、微信、论坛、新闻门户等,确定舆情分布雷达图。
根据第一标签对应的舆情文章的转载信息,了解每篇舆情文章的传播路径,并根据传播路径生成第一标签的舆情曝光分布图,确定曝光分布图中的中心媒体。
上述实施例提出的网络舆情分析方法,对采集的舆情文章进行聚类分析,构建观点主题,实现了对舆情文章的高度概括;利用情感评分模型计算概括得到的观点主题的情感得分,确定舆情文章的情感倾向,提高了对舆情文章的情感分析准确率;利用第一标签对采集的舆情文章进行分类,分别计算每个第一标签的负面舆情影响力及总舆情影响力,确定每个第一标签对应的舆情健康度,直观地展示了当前每个第一标签对应的舆情状况;通过舆情文章的分布信息生成每个第一标签对应的舆情分布图,通过舆情文章的传播路径确定每个第一标签对应的中心媒体,并基于舆情健康度较低的第一标签生成预警信息,提高了对舆情的监控预警能力。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有网络舆情分析程序10,该程序被处理器执行时实现如下操作:
通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合;
分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签;
根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签;
根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;及
分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。
本发明计算机可读存储介质具体实施方式与上述网络舆情分析方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种网络舆情分析方法,应用于电子装置,其特征在于,该方法包括:
通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合;
分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签;
根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签;
根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;及
分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。
2.如权利要求1所述的网络舆情分析方法,其特征在于,所述“根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向”的步骤包括:
采用聚类算法对所述舆情文章进行聚类分析,生成多个观点主题,根据观点主题包含的舆情文章的词向量计算观点主题的词向量;及
将观点主题的词向量输入到预先训练好的情感评分模型中,输出观点主题的情感得分;及
根据情感得分确定观点主题对应的舆情文章所属的情感倾向。
3.如权利要求2所述的网络舆情分析方法,其特征在于,所述“分别计算每个第一标签对应的负面舆情影响力及总舆情影响力”的步骤包括:
分别获取所述多个第一标签对应的每篇舆情文章的发布媒体信息,根据发布媒体信息确定每个第一标签对应的每篇舆情文章对应的媒体权重指数及媒体级别指数;
根据每个第一标签对应的负面舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的负面舆情文章的负面舆情影响力;及
根据每个第一标签对应的舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的舆情文章的总舆情影响力。
4.如权利要求3所述的网络舆情分析方法,其特征在于,所述负面舆情影响力的计算公式为为:
其中,INp表示第一标签p对应的M1p篇负面舆情文章的负面舆情影响力,αi表示第一标签p对应的不同负面舆情文章i的媒体权重指数,βi表示第一标签p对应的不同负面舆情文章i的的媒体级别指数;
所述总舆情影响力的计算公式为:
其中,ITp表示第一标签p对应的M2p篇舆情文章的总舆情影响力,αi表示第一标签p对应的不同舆情文章i的媒体权重指数,βi表示第一标签p对应的不同舆情文章i的的媒体级别指数;及
所述舆情健康度的计算公式为:
H=(1-INp/ITp)*10
其中,INp表示第一标签p对应的M1p篇负面舆情文章的负面舆情影响力,ITp表示第一标签p对应的M2p篇舆情文章的总舆情影响力。
5.如权利要求1至4中任意一项所述的网络舆情分析方法,其特征在于,该方法还包括:
按照每个第一标签的舆情健康度的高低顺序,对所述多个第一标签进行排序;及
筛选出预设数量的舆情健康度较低的第一标签,并根据该预设数量的第一标签及舆情健康度生成预警信息并输出。
6.一种电子装置,其特征在于,该装置包括:存储器、处理器,所述存储器上存储有可在所述处理器上运行的网络舆情分析程序,该程序被所述处理器执行时实现如下步骤:
通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合;
分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签;
根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签;
根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;及
分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。
7.如权利要求6所述的电子装置,其特征在于,所述“根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向”的步骤包括:
采用聚类算法对所述舆情文章进行聚类分析,生成多个观点主题,根据观点主题包含的舆情文章的词向量计算观点主题的词向量;及
将观点主题的词向量输入到预先训练好的情感评分模型中,输出观点主题的情感得分;及
根据情感得分确定观点主题对应的舆情文章所属的情感倾向。
8.如权利要求7所述的电子装置,其特征在于,所述“分别计算每个第一标签对应的负面舆情影响力及总舆情影响力”的步骤包括:
分别获取所述多个第一标签对应的每篇舆情文章的发布媒体信息,根据发布媒体信息确定每个第一标签对应的每篇舆情文章对应的媒体权重指数及媒体级别指数;
根据每个第一标签对应的负面舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的负面舆情文章的负面舆情影响力;及
根据每个第一标签对应的舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的舆情文章的总舆情影响力。
9.如权利要求6至8中任意一项所述的电子装置,其特征在于,所述网络舆情分析程序被所述处理器执行时还实现如下步骤:
按照每个第一标签的舆情健康度的高低顺序,对所述多个第一标签进行排序;及
筛选出预设数量的舆情健康度较低的第一标签,并根据该预设数量的第一标签及舆情健康度生成预警信息并输出。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有网络舆情分析程序,该程序被处理器执行时实现如权利要求1至5中任一项所述的网络舆情分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810998132.6A CN109325165B (zh) | 2018-08-29 | 2018-08-29 | 网络舆情分析方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810998132.6A CN109325165B (zh) | 2018-08-29 | 2018-08-29 | 网络舆情分析方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109325165A true CN109325165A (zh) | 2019-02-12 |
CN109325165B CN109325165B (zh) | 2023-08-22 |
Family
ID=65264485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810998132.6A Active CN109325165B (zh) | 2018-08-29 | 2018-08-29 | 网络舆情分析方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325165B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977300A (zh) * | 2019-02-22 | 2019-07-05 | 深圳壹账通智能科技有限公司 | 企业舆情获取方法、装置、终端及计算机存储介质 |
CN110134849A (zh) * | 2019-05-20 | 2019-08-16 | 瑞森网安(福建)信息科技有限公司 | 一种网络舆情监控方法及系统 |
CN110222513A (zh) * | 2019-05-21 | 2019-09-10 | 平安科技(深圳)有限公司 | 一种线上活动的异常监测方法、装置及存储介质 |
CN110334263A (zh) * | 2019-07-05 | 2019-10-15 | 北京国创动力文化传媒有限公司 | 一种区块链项目舆情监控方法以及装置 |
CN111046264A (zh) * | 2019-11-29 | 2020-04-21 | 江西省天轴通讯有限公司 | 舆情线索处理方法、系统、可读存储介质及计算机设备 |
CN111160019A (zh) * | 2019-12-30 | 2020-05-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111260402A (zh) * | 2020-01-16 | 2020-06-09 | 精硕科技(北京)股份有限公司 | 一种品牌竞争力分析方法及装置 |
CN111369148A (zh) * | 2020-03-05 | 2020-07-03 | 广州快盈信息技术服务有限公司 | 对象指标的监测方法、电子装置及存储介质 |
CN111950860A (zh) * | 2020-07-21 | 2020-11-17 | 中证征信(深圳)有限公司 | 一种企业舆情风险指数的监控方法及装置 |
CN112084448A (zh) * | 2020-08-31 | 2020-12-15 | 北京金堤征信服务有限公司 | 相似信息处理方法以及装置 |
CN112132368A (zh) * | 2019-06-06 | 2020-12-25 | 阿里巴巴集团控股有限公司 | 信息处理方法以及装置、计算设备、存储介质 |
WO2021012684A1 (zh) * | 2019-07-23 | 2021-01-28 | 中译语通科技股份有限公司 | 市场情绪监测体系建立方法和系统 |
CN112329462A (zh) * | 2020-11-26 | 2021-02-05 | 北京五八信息技术有限公司 | 一种数据排序方法、装置、电子设备及存储介质 |
CN112528133A (zh) * | 2019-09-18 | 2021-03-19 | 北京国双科技有限公司 | 一种网络数据标注方法、装置、设备和存储介质 |
CN112541105A (zh) * | 2019-09-20 | 2021-03-23 | 福建师范大学地理研究所 | 一种关键词生成方法、舆情监测方法、装置、设备和介质 |
CN112749269A (zh) * | 2019-10-31 | 2021-05-04 | 北京国双科技有限公司 | 实体舆情计算方法及系统 |
CN113010764A (zh) * | 2021-04-15 | 2021-06-22 | 杭州恒声科技有限公司 | 一种舆情监测系统、方法、计算机设备及存储介质 |
CN113297848A (zh) * | 2021-05-14 | 2021-08-24 | 中国农业银行股份有限公司 | 信息处理方法、装置、设备和存储介质 |
CN113392195A (zh) * | 2021-02-25 | 2021-09-14 | 中国人民解放军战略支援部队信息工程大学 | 舆情监测方法及装置、电子设备及存储介质 |
CN113642881A (zh) * | 2021-08-09 | 2021-11-12 | 平安国际智慧城市科技股份有限公司 | 舆情数据的风险识别方法、装置、计算机设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104657393A (zh) * | 2013-11-25 | 2015-05-27 | 深圳市至高通信技术发展有限公司 | 一种舆情分析方法及相应的装置 |
WO2017035922A1 (zh) * | 2015-09-02 | 2017-03-09 | 杨鹏 | 一种基于改进lda模型的互联网话题在线挖掘方法 |
WO2018023981A1 (zh) * | 2016-08-03 | 2018-02-08 | 平安科技(深圳)有限公司 | 舆情分析方法、装置、设备及计算机可读存储介质 |
CN107704558A (zh) * | 2017-09-28 | 2018-02-16 | 北京车慧互动广告有限公司 | 一种用户意见抽取方法及系统 |
CN108268448A (zh) * | 2018-01-24 | 2018-07-10 | 闽南师范大学 | 一种基于网络新闻的舆情分析方法、系统及介质 |
CN108319587A (zh) * | 2018-02-05 | 2018-07-24 | 中译语通科技股份有限公司 | 一种多权重的舆情价值计算方法及系统、计算机 |
-
2018
- 2018-08-29 CN CN201810998132.6A patent/CN109325165B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104657393A (zh) * | 2013-11-25 | 2015-05-27 | 深圳市至高通信技术发展有限公司 | 一种舆情分析方法及相应的装置 |
WO2017035922A1 (zh) * | 2015-09-02 | 2017-03-09 | 杨鹏 | 一种基于改进lda模型的互联网话题在线挖掘方法 |
WO2018023981A1 (zh) * | 2016-08-03 | 2018-02-08 | 平安科技(深圳)有限公司 | 舆情分析方法、装置、设备及计算机可读存储介质 |
CN107704558A (zh) * | 2017-09-28 | 2018-02-16 | 北京车慧互动广告有限公司 | 一种用户意见抽取方法及系统 |
CN108268448A (zh) * | 2018-01-24 | 2018-07-10 | 闽南师范大学 | 一种基于网络新闻的舆情分析方法、系统及介质 |
CN108319587A (zh) * | 2018-02-05 | 2018-07-24 | 中译语通科技股份有限公司 | 一种多权重的舆情价值计算方法及系统、计算机 |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977300A (zh) * | 2019-02-22 | 2019-07-05 | 深圳壹账通智能科技有限公司 | 企业舆情获取方法、装置、终端及计算机存储介质 |
CN110134849A (zh) * | 2019-05-20 | 2019-08-16 | 瑞森网安(福建)信息科技有限公司 | 一种网络舆情监控方法及系统 |
CN110222513A (zh) * | 2019-05-21 | 2019-09-10 | 平安科技(深圳)有限公司 | 一种线上活动的异常监测方法、装置及存储介质 |
CN110222513B (zh) * | 2019-05-21 | 2023-06-23 | 平安科技(深圳)有限公司 | 一种线上活动的异常监测方法、装置及存储介质 |
CN112132368A (zh) * | 2019-06-06 | 2020-12-25 | 阿里巴巴集团控股有限公司 | 信息处理方法以及装置、计算设备、存储介质 |
CN110334263A (zh) * | 2019-07-05 | 2019-10-15 | 北京国创动力文化传媒有限公司 | 一种区块链项目舆情监控方法以及装置 |
WO2021012684A1 (zh) * | 2019-07-23 | 2021-01-28 | 中译语通科技股份有限公司 | 市场情绪监测体系建立方法和系统 |
CN112528133A (zh) * | 2019-09-18 | 2021-03-19 | 北京国双科技有限公司 | 一种网络数据标注方法、装置、设备和存储介质 |
CN112541105A (zh) * | 2019-09-20 | 2021-03-23 | 福建师范大学地理研究所 | 一种关键词生成方法、舆情监测方法、装置、设备和介质 |
CN112749269A (zh) * | 2019-10-31 | 2021-05-04 | 北京国双科技有限公司 | 实体舆情计算方法及系统 |
CN111046264A (zh) * | 2019-11-29 | 2020-04-21 | 江西省天轴通讯有限公司 | 舆情线索处理方法、系统、可读存储介质及计算机设备 |
CN111160019A (zh) * | 2019-12-30 | 2020-05-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111160019B (zh) * | 2019-12-30 | 2023-08-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111260402A (zh) * | 2020-01-16 | 2020-06-09 | 精硕科技(北京)股份有限公司 | 一种品牌竞争力分析方法及装置 |
CN111369148A (zh) * | 2020-03-05 | 2020-07-03 | 广州快盈信息技术服务有限公司 | 对象指标的监测方法、电子装置及存储介质 |
CN111950860A (zh) * | 2020-07-21 | 2020-11-17 | 中证征信(深圳)有限公司 | 一种企业舆情风险指数的监控方法及装置 |
CN111950860B (zh) * | 2020-07-21 | 2024-04-16 | 中证征信(深圳)有限公司 | 一种企业舆情风险指数的监控方法及装置 |
CN112084448A (zh) * | 2020-08-31 | 2020-12-15 | 北京金堤征信服务有限公司 | 相似信息处理方法以及装置 |
CN112084448B (zh) * | 2020-08-31 | 2024-05-07 | 北京金堤征信服务有限公司 | 相似信息处理方法以及装置 |
CN112329462A (zh) * | 2020-11-26 | 2021-02-05 | 北京五八信息技术有限公司 | 一种数据排序方法、装置、电子设备及存储介质 |
CN112329462B (zh) * | 2020-11-26 | 2024-02-20 | 北京五八信息技术有限公司 | 一种数据排序方法、装置、电子设备及存储介质 |
CN113392195A (zh) * | 2021-02-25 | 2021-09-14 | 中国人民解放军战略支援部队信息工程大学 | 舆情监测方法及装置、电子设备及存储介质 |
CN113010764B (zh) * | 2021-04-15 | 2023-08-22 | 德观智能控制设备涿州有限公司 | 一种舆情监测系统、方法、计算机设备及存储介质 |
CN113010764A (zh) * | 2021-04-15 | 2021-06-22 | 杭州恒声科技有限公司 | 一种舆情监测系统、方法、计算机设备及存储介质 |
CN113297848B (zh) * | 2021-05-14 | 2024-03-05 | 中国农业银行股份有限公司 | 信息处理方法、装置、设备和存储介质 |
CN113297848A (zh) * | 2021-05-14 | 2021-08-24 | 中国农业银行股份有限公司 | 信息处理方法、装置、设备和存储介质 |
CN113642881A (zh) * | 2021-08-09 | 2021-11-12 | 平安国际智慧城市科技股份有限公司 | 舆情数据的风险识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109325165B (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325165A (zh) | 网络舆情分析方法、装置及存储介质 | |
CN109145216B (zh) | 网络舆情监控方法、装置及存储介质 | |
CN109145215A (zh) | 网络舆情分析方法、装置及存储介质 | |
CN109271512B (zh) | 舆情评论信息的情感分析方法、装置及存储介质 | |
WO2019227710A1 (zh) | 网络舆情的分析方法、装置及计算机可读存储介质 | |
CN108629043B (zh) | 网页目标信息的提取方法、装置及存储介质 | |
CN104408093B (zh) | 一种新闻事件要素抽取方法与装置 | |
CN103914478B (zh) | 网页训练方法及系统、网页预测方法及系统 | |
US8909648B2 (en) | Methods and systems of supervised learning of semantic relatedness | |
CN110163476A (zh) | 项目智能推荐方法、电子装置及存储介质 | |
CN108717406A (zh) | 文本情绪分析方法、装置及存储介质 | |
US9355172B2 (en) | Data trend analysis | |
US20170004128A1 (en) | Device and method for analyzing reputation for objects by data mining | |
CN107704503A (zh) | 用户关键词提取装置、方法及计算机可读存储介质 | |
CN109471937A (zh) | 一种基于机器学习的文本分类方法及终端设备 | |
CN103927309B (zh) | 一种对业务对象标注信息标签的方法及装置 | |
CN103336766A (zh) | 短文本垃圾识别以及建模方法和装置 | |
CN107885793A (zh) | 一种微博热点话题分析预测方法及系统 | |
CN110263248A (zh) | 一种信息推送方法、装置、存储介质和服务器 | |
CN110334178A (zh) | 数据检索方法、装置、设备及可读存储介质 | |
CN105843796A (zh) | 一种微博情感倾向分析方法及装置 | |
CN108733675B (zh) | 基于大量样本数据的情感评价方法及装置 | |
CN104850617A (zh) | 短文本处理方法及装置 | |
CN107870945A (zh) | 内容分级方法和装置 | |
CN110019776A (zh) | 文章分类方法及装置、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |