CN109271512A - 舆情评论信息的情感分析方法、装置及存储介质 - Google Patents
舆情评论信息的情感分析方法、装置及存储介质 Download PDFInfo
- Publication number
- CN109271512A CN109271512A CN201810995915.9A CN201810995915A CN109271512A CN 109271512 A CN109271512 A CN 109271512A CN 201810995915 A CN201810995915 A CN 201810995915A CN 109271512 A CN109271512 A CN 109271512A
- Authority
- CN
- China
- Prior art keywords
- comment information
- target
- initial
- information
- public sentiment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 42
- 230000002996 emotional effect Effects 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims description 18
- 238000012216 screening Methods 0.000 claims description 13
- 239000012141 concentrate Substances 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 9
- 230000007935 neutral effect Effects 0.000 claims description 8
- 230000035945 sensitivity Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 2
- 230000004048 modification Effects 0.000 claims description 2
- 230000008451 emotion Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 7
- 238000012552 review Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 206010001488 Aggression Diseases 0.000 description 1
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000016571 aggressive behavior Effects 0.000 description 1
- 208000012761 aggressive behavior Diseases 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Abstract
本发明提供一种舆情评论信息的情感分析方法,包括:采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及,确定目标评论信息对应的情感类别,并为其标注相应标签。本发明还提出一种电子装置及存储介质。利用本发明对舆情事件的评论信息进行情感分析,便于用户及时了解评论信息情感状态,有助于用户针对舆情事件进行相应决策。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种舆情评论信息的情感分析方法、电子装置及计算机可读存储介质。
背景技术
网络舆情是指在网络上流行的对社会事件不同看法的网络舆论,是社会舆论的一种表现形式。主要是以网络为载体,以事件为核心,公众对该事件的情感、态度、意见、观点的表达、传播与互动,以及后续影响力的集合。通过网络传播公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。网络舆情的表现方式多种多样,例如:新闻评论、论坛帖子、微博博文、微信文章等。而针对网络舆情各网民发布的评论信息可以充分表达其对舆情事件的观点态度。
近年来,网络舆情对生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。同时,网络舆情突发事件如果处理不当,极有可能诱发民众的不良情绪,引发群众的违规和过激行为,进而对社会稳定构成威胁。
因此,对于网络舆情状态的监测就变得较为重要,需要对网络舆情的情感倾向,尤其是网友观点,进行分析。目前舆情系统主要舆情文章进行分析,鲜有对舆情文章的评论信息进行分析,故网民针对舆情事件的态度不能及时得知,因此,需提供一种舆情评论信息的情感分析方法。
发明内容
本发明提供一种舆情评论信息的情感分析方法、电子装置及计算机可读存储介质,其主要目的在于对舆情事件的评论信息进行情感分析,便于用户及时了解评论信息情感状态,有助于用户针对舆情事件进行相应决策。
为实现上述目的,本发明提供一种舆情评论信息的情感分析方法,该方法包括:
S1、利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;
S2、对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;
S3、将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及
S4、根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。
此外,为实现上述目的,本发明提供一种电子装置,该装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的舆情评论信息的情感分析程序程序,该程序被所述处理器执行时如上所述的舆情评论信息的情感分析方法的任意步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有舆情评论信息的情感分析程序,该程序被处理器执行时实现如上所述的舆情评论信息的情感分析方法的任意步骤。
相较于现有技术,本发明提出的舆情评论信息的情感分析方法、电子装置及计算机可读存储介质,1.根据预设的关键词获取舆情事件相关的评论信息,首先过滤掉无价值评论信息,然后对评论信息所属情感类别进行分析,有效提高了舆情事件评论信息情感分析效率;2.通过利用聚类算法对目标评论信息进行分析,构建观点主题,实现了对评论信息的高度概括性,提高舆情评论信息情感分类的准确性;3.在对舆情评论信息的情感进行分析后,筛选出负面评论信息,并确定舆情事件对应的主要负面观点,便于用户及时了解当前舆情事件相关的评论信息情感状态,有助于用户针对舆情事件进行相应决策。
附图说明
图1为本发明电子装置较佳实施例的示意图;
图2为图1中舆情评论信息的情感分析程序的程序模块示意图;
图3为本发明舆情评论信息的情感分析方法第一个较佳实施例的流程图;
图4为本发明舆情评论信息的情感分析方法第二个较佳实施例的流程图;
图5为本发明舆情评论信息的情感分析方法第三个较佳实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种舆情评论信息的情感分析方法,该方法应用于一种电子装置1。参照图1所示,为本发明电子装置1较佳实施例的示意图。
在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有数据处理功能的终端设备,所述服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器。
该电子装置1包括存储器11、处理器12,通信总线13,及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。存储器11在另一些实施例中也可以是所述电子装置1的外部存储设备,例如该电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括该电子装置1的内部存储单元也包括外部存储设备。
存储器11不仅可以用于存储安装于该电子装置1的应用软件及各类数据,例如舆情评论信息的情感分析程序10等,还可以用于暂时地存储已经输出或者将要输出的数据。处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如舆情评论信息的情感分析程序10等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置1与其他电子设备之间建立通信连接。
图1仅示出了具有组件11-14的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。
可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。其中,显示器也可以称为显示屏或显示单元,用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
在图1所示的装置实施例中,存储器11中存储有舆情评论信息的情感分析程序10。处理器12执行存储器11中存储的舆情评论信息的情感分析程序10时实现如下步骤:
A1、利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;
用户预先在本地设置能够体现舆情事件的关键词,并预先设置待爬取的URL列表,定时使用网络爬虫根据上述URL列表中的URL地址及关键字,从预设的数据渠道抓取与该舆情事件相关的舆情文章,并分别获取每篇舆情文章对应的评论信息,得到舆情事件相关的初始评论信息。具体地,预设的数据渠道包括但不限于新闻评论、论坛帖子、微博博文、微信文章等。
A2、对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;
得到舆情事件相关的初始评论信息后,对每条初始评论信息进行分词处理,以空格分隔的词汇集合来表征各条初始评论信息。具体地,提取各条初始评论信息的原始数据,去除无关数据,例如,HTML标签数据、图像标记等,并通过正则表达式去除原始数据中的非中文字符。对保留的数据通过分词工具进行分词,生成以空格分隔的初始词汇集合,按照预设的停用词词表,对初始词汇集合进行去停用词处理,将经去停用词处理后的词汇集合用于表征各初始评论信息。
可以理解的是,网友在针对某一舆情文章发表评论时,存在恶意评论、刷屏等情况,而这类初始评论信息在舆情评论信息情感分析中属于无价值评论,故需将该类初始评论信息过滤掉。
作为一种实施方式,所述“根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息”的步骤包括:
A201、分别统计每条初始评论信息的字数,过滤掉字数低于字数阈值的初始评论信息,得到第一评论信息集;
例如,字数阈值可以设置为10,从所有初始评论信息中删除字数少于10的初始评论信息,如,“同上”、“赞”、“好评”、“很有道理”等评论信息,过滤掉无有价值观点的初始评论信息,得到字数满足条件的第一评论信息集。
A202、统计所述第一评论信息集中每条初始评论信息的重复次数,过滤掉重复次数高于重复次数阈值的评论信息,得到第二评论信息集;
例如,重复次数阈值可以设置为5,若一条初始评论信息的内容在所有评论信息中的重复次数大于或等于5,则删除与该条初始评论信息重复的评论信息,过滤掉直接复制粘贴他人评论的初始评论信息,得到第二评论信息集。
A203、分别将所述第二评论信息集中的每条初始评论信息对应的词汇集合与预设词库进行匹配,并计算所述第二评论信息集中每条初始评论信息对应的匹配率,删除第二评论信息集中匹配率高于匹配率阈值的初始评论信息,得到关于该舆情事件的目标评论信息。
例如,预设词库为用户预先设置的包含不文明信息等的垃圾信息词库,分别统计一条初始评论信息对应的词汇集合中与垃圾信息词库中词汇匹配的词汇数量M1及不能与垃圾信息词库中词汇匹配的词汇数量M2,并计算该初始评论信息对应的匹配率:M1/(M1+M2)。匹配率阈值可以设置为40%,删除匹配率大于或等于40%的初始评论信息,过滤掉包含不文明用语的初始评论信息,得到第三评论信息集,即目标评论信息。
在其他实施例中,为了避免同一网友反复评论的情况,还可以获取每条初始评论信息对应的用户信息(例如,用户名),分别计算所有用户信息之间的同质率,筛选出用户信息同质率高于同质率阈值(例如,95%)的网友对应的初始评论信息,保留发布时间最早的初始评论信息,删除其他的初始评论信息。
A3、将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;
确定舆情事件对应的目标评论信息后,对目标评论信息的情感进行分析。作为一种实施方式,所述步骤A3包括:
A301、将所述目标评论信息对应的词汇集合中的词汇分别与预设的第一关键词库、第二关键词库进行匹配;
其中,第一关键词库为用户根据舆情事件预先确定的正面关键词库,第二关键词库为用户根据舆情事件预先确定的负面关键词库。
A302、当所述目标评论信息的词汇集合中存在与所述第一关键词库匹配的词汇时,将所述目标评论划分至第一集合;
将词汇集合中存在词汇与正面关键词库中的词汇匹配的目标评论信息划分至第一集合中。
A303、当所述目标评论信息的词汇集合中存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第二集合;
将词汇集合中存在词汇与负面关键词库中的词汇匹配的目标评论信息划分至第二集合中。
A304、当所述目标评论的词汇集合中同时存在与所述第一关键词库、第二关键词库匹配的词汇时,将所述目标评论划分至第三集合;
将词汇集合中既存在词汇与正面关键词库中的词汇匹配、又存在词汇与负面关键词库中的词汇匹配的目标评论信息划分至第三集合中。
A305、当所述目标评论信息的词汇集合中既不存在与所述第一关键词库匹配的词汇、又不存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第四集合;
将词汇集合中既不存在词汇与正面关键词库中的词汇匹配、又不存在词汇与负面关键词库中的词汇匹配的目标评论信息划分至第四集合中。
A4、根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。
目标评论信息所属情感类别包括:正面评论信息、负面评论信息、敏感评论信息及中立评论信息。
第一集合对应的情感类别为正面、第二集合对应的情感类别为负面、第三集合对应的情感类别为敏感及第四集合对应的情感类别为中立。具体地,确定所述第一集合中的目标评论信息为正面评论信息,为所述第一集合中的目标评论信息标记“正面”标签;确定所述第二集合中的目标评论信息为负面评论信息,为所述第二集合中的目标评论信息标记“负面”标签;确定所述第三集合中的目标评论信息为敏感评论信息,为所述第三集合中的目标评论信息标记“敏感”标签;确定所述第四集合中的目标评论信息为中性评论信息,为所述第四集合中的目标评论信息标记“中立”标签。
在其他实施例中,根据正/负面关键词库对目标评论信息所属情感类别进行分析后,可能需要对其所属情感类别进行人为修改,例如,需要对敏感评论信息所属情感类别进行再分类时,接收对所述敏感评论信息所属情感类别的再分类信息,更新该敏感评论信息对应的情感类别,并重新为敏感评论信息标注新的标签。
上述实施例提出的电子装置1,根据预设的关键词获取舆情事件相关的评论信息,首先过滤掉无价值评论信息,然后对评论信息所属情感类别进行分析,有效提高了舆情事件评论信息情感分析效率,便于用户及时了解当前舆情事件相关的评论信息情感状态,有助于用户针对舆情事件进行相应决策。
可选地,在其他的实施例中,舆情评论信息的情感分析程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。例如,参照图2所示,为图1中舆情评论信息的情感分析程序10的模块示意图,该实施例中,舆情评论信息的情感分析程序10可以被分割为获取模块110、筛选模块120、划分模块130及分析模块140,所述模块110-140所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:
获取模块110,用于利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;
筛选模块120,用于对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;
划分模块130,用于将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及
分析模块140,用于根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。
此外,本发明还提供一种舆情评论信息的情感分析方法。参照图3所示,为本发明舆情评论信息的情感分析方法第一个较佳实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,舆情评论信息的情感分析方法包括步骤S1-S4:
S1、利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;
用户预先在本地设置能够体现舆情事件的关键词,并预先设置待爬取的URL列表,定时使用网络爬虫根据上述URL列表中的URL地址及关键字,从预设的数据渠道抓取与该舆情事件相关的舆情文章,并分别获取每篇舆情文章对应的评论信息,得到舆情事件相关的初始评论信息。具体地,预设的数据渠道包括但不限于新闻评论、论坛帖子、微博博文、微信文章等。
S2、对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;
得到舆情事件相关的初始评论信息后,对每条初始评论信息进行分词处理,以空格分隔的词汇集合来表征各条初始评论信息。具体地,提取各条初始评论信息的原始数据,去除无关数据,例如,HTML标签数据、图像标记等,并通过正则表达式去除原始数据中的非中文字符。对保留的数据通过分词工具进行分词,生成以空格分隔的初始词汇集合,按照预设的停用词词表,对初始词汇集合进行去停用词处理,将经去停用词处理后的词汇集合用于表征各初始评论信息。
可以理解的是,网友在针对某一舆情文章发表评论时,存在恶意评论、刷屏等情况,而这类初始评论信息在舆情评论信息情感分析中属于无价值评论,故需将该类初始评论信息过滤掉。
作为一种实施方式,所述“根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息”的步骤包括:
S201、分别统计每条初始评论信息的字数,过滤掉字数低于字数阈值的初始评论信息,得到第一评论信息集;
例如,字数阈值可以设置为10,从所有初始评论信息中删除字数少于10的初始评论信息,如,“同上”、“赞”、“好评”、“很有道理”等评论信息,过滤掉无有价值观点的初始评论信息,得到字数满足条件的第一评论信息集。
S202、统计所述第一评论信息集中每条初始评论信息的重复次数,过滤掉重复次数高于重复次数阈值的评论信息,得到第二评论信息集;
例如,重复次数阈值可以设置为5,若一条初始评论信息的内容在所有评论信息中的重复次数大于或等于5,则删除与该条初始评论信息重复的评论信息,过滤掉直接复制粘贴他人评论的初始评论信息,得到第二评论信息集。
S203、分别将所述第二评论信息集中的每条初始评论信息对应的词汇集合与预设词库进行匹配,并计算所述第二评论信息集中每条初始评论信息对应的匹配率,删除第二评论信息集中匹配率高于匹配率阈值的初始评论信息,得到关于该舆情事件的目标评论信息。
例如,预设词库为用户预先设置的包含不文明信息等的垃圾信息词库,分别统计一条初始评论信息对应的词汇集合中与垃圾信息词库中词汇匹配的词汇数量M1及不能与垃圾信息词库中词汇匹配的词汇数量M2,并计算该初始评论信息对应的匹配率:M1/(M1+M2)。匹配率阈值可以设置为40%,删除匹配率大于或等于40%的初始评论信息,过滤掉包含不文明用语的初始评论信息,得到第三评论信息集,即目标评论信息。
在其他实施例中,为了避免同一网友反复评论的情况,还可以获取每条初始评论信息对应的用户信息(例如,用户名),分别计算所有用户信息之间的同质率,筛选出用户信息同质率高于同质率阈值(例如,95%)的网友对应的初始评论信息,保留发布时间最早的初始评论信息,删除其他的初始评论信息。
S3、将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;
确定舆情事件对应的目标评论信息后,对目标评论信息的情感进行分析。作为一种实施方式,所述步骤S3包括:
S301、将所述目标评论信息对应的词汇集合中的词汇分别与预设的第一关键词库、第二关键词库进行匹配;
其中,第一关键词库为用户根据舆情事件预先确定的正面关键词库,第二关键词库为用户根据舆情事件预先确定的负面关键词库。
S302、当所述目标评论信息的词汇集合中存在与所述第一关键词库匹配的词汇时,将所述目标评论划分至第一集合;
将词汇集合中存在词汇与正面关键词库中的词汇匹配的目标评论信息划分至第一集合中。
S303、当所述目标评论信息的词汇集合中存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第二集合;
将词汇集合中存在词汇与负面关键词库中的词汇匹配的目标评论信息划分至第二集合中。
S304、当所述目标评论的词汇集合中同时存在与所述第一关键词库、第二关键词库匹配的词汇时,将所述目标评论划分至第三集合;
将词汇集合中既存在词汇与正面关键词库中的词汇匹配、又存在词汇与负面关键词库中的词汇匹配的目标评论信息划分至第三集合中。
S305、当所述目标评论信息的词汇集合中既不存在与所述第一关键词库匹配的词汇、又不存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第四集合;
将词汇集合中既不存在词汇与正面关键词库中的词汇匹配、又不存在词汇与负面关键词库中的词汇匹配的目标评论信息划分至第四集合中。
S4、根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。
目标评论信息所属情感类别包括:正面评论信息、负面评论信息、敏感评论信息及中立评论信息。
第一集合对应的情感类别为正面、第二集合对应的情感类别为负面、第三集合对应的情感类别为敏感及第四集合对应的情感类别为中立。具体地,确定所述第一集合中的目标评论信息为正面评论信息,为所述第一集合中的目标评论信息标记“正面”标签;确定所述第二集合中的目标评论信息为负面评论信息,为所述第二集合中的目标评论信息标记“负面”标签;确定所述第三集合中的目标评论信息为敏感评论信息,为所述第三集合中的目标评论信息标记“敏感”标签;确定所述第四集合中的目标评论信息为中性评论信息,为所述第四集合中的目标评论信息标记“中立”标签。
在其他实施例中,该方法还包括:接收对所述目标评论信息所属情感类别的修改信息,并更新该目标评论信息对应的情感类别。
根据正/负面关键词库对目标评论信息所属情感类别进行分析后,可能需要对其所属情感类别进行人为修改,例如,需要对敏感评论信息所属情感类别进行再分类时,接收对所述敏感评论信息所属情感类别的再分类信息,更新该敏感评论信息对应的情感类别,并重新为敏感评论信息标注新的标签。
上述实施例提出的舆情评论信息的情感分析方法,根据预设的关键词获取舆情事件相关的评论信息,首先过滤掉无价值评论信息,然后对评论信息所属情感类别进行分析,有效提高了舆情事件评论信息情感分析效率,便于用户及时了解当前舆情事件相关的评论信息情感状态,有助于用户针对舆情事件进行相应决策。
如图4所示,是本发明舆情评论信息的情感分析方法第二个较佳实施例的流程示意图。在本实施例中,所述舆情评论信息的情感分析方法的步骤S1-S2与上述实施例相似,区别在于,上述实施例中的步骤S3-S4可以替换为S5-S8:
S5、分别从每条目标评论信息对应的词汇集合中筛选出预设数量的词汇作为每条目标评论信息的关键词,并根据所述关键词计算每条目标评论信息的词向量;
获取预设的语料库,例如,中文维基百科语料库,基于该语料库,根据TF-IDF(词频-逆文档频率)算法计算每条目标评论信息对应的词汇集合中各个词汇的重要程度,根据重要程度由高到低的顺序对每条目标评论信息对应的词汇集合中的各个词汇进行排序。
选择每条目标评论信息对应的词汇集合中的重要程度最高的预设数量的词汇作为该条目标评论信息的关键词。需要说明的是,当目标评论信息内容较少,其对应的词汇集合中的词汇数量小于预设数量时,将该目标评论信息对应的词汇集合中的所有词汇作为该目标评论信息的关键词。
另外,基于中文维基百科语料库生成中文语料的Word2vec模型,通过该Word2vec模型分别计算每条目标评论信息的各关键词的词向量,并利用上述步骤得到的关键词的词向量计算每条目标评论信息的词向量。
S6、对所有与舆情事件相关的目标评论信息进行聚类分析,确定多个观点主题,并人为判断所述多个观点主题对应的情感类别;
在计算得到每条目标评论信息的词向量后,利用Kmeans算法对所有与舆情事件相关的目标评论信息进行聚类分析,将所有目标评论信息划分为多个观点主题,并人为判断所述多个观点主题对应的情感类别,例如,正面、负面、中性。
具体地,在进行聚类分析时,算法中K值的初始值随机设置,即多个聚类中心,也就是分类的类群的数量,可以根据对分类结果的评估调整K值,直至分类结果的准确度达到预设阈值。利用该算法对目标评论信息进行聚类分析的方法已经比较成熟,在此不做赘述。
S7、将每个观点主题对应的目标评论信息的关键词汇总,并计算每个观点主题的词向量;
在确定每条目标评论信息对应的观点主题后,将目标评论信息按照对应的观点主题进行划分,分别汇总每个观点主题对应的目标评论信息的关键词,分别统计每个关键词的词频,通过Word2vec模型计算每个观点主题中各个关键词的词向量,并根据关键词的词向量和词频计算每个观点主题的词向量。利用Word2vec模型计算词向量为业内人员习知技术,这里不作赘述。
S8、分别计算每条目标评论信息与每个观点主题的相似度,选择相似度最高的观点主题作为所述目标评论信息对应的观点主题,并根据观点主题与情感类别的映射关系,确定所述目标评论信息对应的情感类别,并标注相应标签。
选择一条目标评论信息,获取上述步骤计算得到的每个观点主题的词向量以及该目标评论信息的词向量,利用预设的计算规则,分别计算该目标评论信息与多个观点主题的相似度,从多个观点主题对应的相似度中选择相似度最高值对应的观点主题作为该目标评论信息对应的观点主题,并根据该观点主题对应的情感类别确定该目标评论信息的情感分类。重复上述步骤,确定所有目标评论信息的情感分类,并为舆情事件对应的所有目标评论信息标注相应的标签,例如,正面、负面、中立。
在本实施例中,所述预设的计算规则为:计算目标评论信息的词向量与观点主题的词向量之间的欧式距离,将欧氏距离作为两者之间的相似度。
上述实施例提出的舆情评论信息的情感分析方法,通过利用聚类算法对目标评论信息进行分析,构建观点主题,实现了对评论信息的高度概括性,提高舆情评论信息情感分类的准确性,便于用户及时了解当前舆情事件相关的评论信息情感状态,有助于用户针对舆情事件进行相应决策。
如图5所示,是本发明舆情评论信息的情感分析方法第三个较佳实施例的流程示意图。相较于第二个较佳实施例,本实施例提供的舆情评论信息的情感分析方法还包括步骤S9:
S9、统计负面评论信息中各观点主题对应的目标评论信息数量,确定舆情事件对应的主要负面观点,计算该主要负面观点对应的目标评论信息在所有目标评论信息中的占比。
为了便于用户针对舆情事件对应的评论信息进行相应决策,从所有目标评论信息中筛选出负面评论信息,将目标评论信息数量最多的观点主题作为主要负面观点,计算其在所有目标评论信息中的占比情况,以便展示该主要负面观点的影响力,并将上述信息通过客户端向用户展示。
进一步地,还可以根据所述目标评论信息的标签,分别统计正面/负面/中立这三个情感类别下不同观点主题对应的目标评论信息数量,及各自在所有目标评论信息中的占比情况,选择目标评论信息数量最大的观点主题作为舆情事件的主要观点主题,其对应的情感类别作为舆情事件对应的评论信息的主流情感,并将上述信息通过客户端向用户展示。
上述实施例提出的舆情评论信息的情感分析方法,通过利用聚类算法对目标评论信息进行分析,构建观点主题,实现了对评论信息的高度概括性,提高舆情评论信息情感分类的准确性,在对舆情评论信息的情感进行分析后,筛选出负面评论信息,并确定舆情事件对应的主要负面观点,便于用户及时了解当前舆情事件相关的评论信息情感状态,有助于用户针对舆情事件进行相应决策。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有舆情评论信息的情感分析程序10,该程序被处理器执行时实现如下操作:
A1、利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;
A2、对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;
A3、将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及
A4、根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。
本发明计算机可读存储介质具体实施方式与上述舆情评论信息的情感分析方法和电子装置1各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种舆情评论信息的情感分析方法,应用于电子装置,其特征在于,该方法包括:
S1、利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;
S2、对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;
S3、将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及
S4、根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。
2.如权利要求1所述的舆情评论信息的情感分析方法,其特征在于,所述“根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息”的步骤包括:
分别统计每条初始评论信息的字数,过滤掉字数低于字数阈值的初始评论信息,得到第一评论信息集;
统计所述第一评论信息集中每条初始评论信息的重复次数,过滤掉重复次数高于重复次数阈值的评论信息,得到第二评论信息集;及
分别将所述第二评论信息集中的每条初始评论信息对应的词汇集合与预设词库进行匹配,并计算所述第二评论信息集中每条初始评论信息对应的匹配率,删除第二评论信息集中匹配率高于匹配率阈值的初始评论信息,得到关于该舆情事件的目标评论信息。
3.如权利要求1所述的舆情评论信息的情感分析方法,其特征在于,所述步骤S3包括:
将所述目标评论信息对应的词汇集合中的词汇分别与预设的第一关键词库、第二关键词库进行匹配;
当所述目标评论信息的词汇集合中存在与所述第一关键词库匹配的词汇时,将所述目标评论划分至第一集合;
当所述目标评论信息的词汇集合中存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第二集合;
当所述目标评论的词汇集合中同时存在与所述第一关键词库、第二关键词库匹配的词汇时,将所述目标评论划分至第三集合;或
当所述目标评论信息的词汇集合中既不存在与所述第一关键词库匹配的词汇、又不存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第四集合。
4.如权利要求3所述的舆情评论信息的情感分析方法,其特征在于,所述“为所述目标评论信息标注相应标签”的步骤包括:
确定所述第一集合中的目标评论信息为正面评论信息,为所述第一集合中的目标评论信息标记“正面”标签;
确定所述第二集合中的目标评论信息为负面评论信息,为所述第二集合中的目标评论信息标记“负面”标签;
确定所述第三集合中的目标评论信息为敏感评论信息,为所述第三集合中的目标评论信息标记“敏感”标签;及
确定所述第四集合中的目标评论信息为中性评论信息,为所述第四集合中的目标评论信息标记“中立”标签。
5.如权利要求4所述的舆情评论信息的情感分析方法,其特征在于,该方法还包括:
接收对所述目标评论信息所属情感类别的修改信息,并更新该目标评论信息对应的情感类别。
6.如权利要求1-5所述的舆情评论信息的情感分析方法,其特征在于,所述步骤S3和步骤S4可以替换为:
分别从每条目标评论信息对应的词汇集合中筛选出预设数量的词汇作为每条目标评论信息的关键词,并根据所述关键词计算每条目标评论信息的词向量;
对所有与舆情事件相关的目标评论信息进行聚类分析,确定多个观点主题,并人为判断所述多个观点主题对应的情感类别;
将每个观点主题对应的目标评论信息的关键词汇总,并计算每个观点主题的词向量;及
分别计算每条目标评论信息与每个观点主题的相似度,选择相似度最高的观点主题作为所述目标评论信息对应的观点主题,并根据观点主题与情感类别的映射关系,确定所述目标评论信息对应的情感类别,并标注相应标签。
7.一种电子装置,其特征在于,该装置包括:存储器、处理器,所述存储器上存储有可在所述处理器上运行的舆情评论信息的情感分析程序,该程序被所述处理器执行时实现如下步骤:
A1、利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;
A2、对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;
A3、将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及
A4、根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。
8.如权利要求7所述的电子装置,其特征在于,所述“根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息”的步骤包括:
分别统计每条初始评论信息的字数,过滤掉字数低于字数阈值的初始评论信息,得到第一评论信息集;
统计所述第一评论信息集中每条初始评论信息的重复次数,过滤掉重复次数高于重复次数阈值的评论信息,得到第二评论信息集;及
分别将所述第二评论信息集中的每条初始评论信息对应的词汇集合与预设词库进行匹配,并计算所述第二评论信息集中每条初始评论信息对应的匹配率,删除第二评论信息集中匹配率高于匹配率阈值的初始评论信息,得到关于该舆情事件的目标评论信息。
9.如权利要求8所述的电子装置,其特征在于,所述步骤A3包括:
将所述目标评论信息对应的词汇集合中的词汇分别与预设的第一关键词库、第二关键词库进行匹配;
当所述目标评论信息的词汇集合中存在与所述第一关键词库匹配的词汇时,将所述目标评论划分至第一集合;
当所述目标评论信息的词汇集合中存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第二集合;
当所述目标评论的词汇集合中同时存在与所述第一关键词库、第二关键词库匹配的词汇时,将所述目标评论划分至第三集合;或
当所述目标评论信息的词汇集合中既不存在与所述第一关键词库匹配的词汇、又不存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第四集合。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有舆情评论信息的情感分析程序,该程序被处理器执行时实现如权利要求1至6中任一项所述的舆情评论信息的情感分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810995915.9A CN109271512B (zh) | 2018-08-29 | 2018-08-29 | 舆情评论信息的情感分析方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810995915.9A CN109271512B (zh) | 2018-08-29 | 2018-08-29 | 舆情评论信息的情感分析方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109271512A true CN109271512A (zh) | 2019-01-25 |
CN109271512B CN109271512B (zh) | 2023-11-24 |
Family
ID=65154972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810995915.9A Active CN109271512B (zh) | 2018-08-29 | 2018-08-29 | 舆情评论信息的情感分析方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109271512B (zh) |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008390A (zh) * | 2019-02-27 | 2019-07-12 | 深圳壹账通智能科技有限公司 | 应用程序的评估方法、装置、计算机设备及存储介质 |
CN110047469A (zh) * | 2019-04-09 | 2019-07-23 | 平安科技(深圳)有限公司 | 语音数据情感标注方法、装置、计算机设备及存储介质 |
CN110084373A (zh) * | 2019-04-22 | 2019-08-02 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机可读存储介质和计算机设备 |
CN110188356A (zh) * | 2019-05-30 | 2019-08-30 | 腾讯音乐娱乐科技(深圳)有限公司 | 信息处理方法及装置 |
CN110347934A (zh) * | 2019-07-18 | 2019-10-18 | 腾讯科技(成都)有限公司 | 一种文本数据过滤方法、装置及介质 |
CN110516036A (zh) * | 2019-07-18 | 2019-11-29 | 平安科技(深圳)有限公司 | 法律文书信息提取方法、装置、计算机设备及存储介质 |
CN110634017A (zh) * | 2019-08-23 | 2019-12-31 | 深圳市新系区块链技术有限公司 | 信息分类方法、装置及设备 |
CN110674415A (zh) * | 2019-09-20 | 2020-01-10 | 北京浪潮数据技术有限公司 | 一种信息显示方法、装置及服务器 |
CN110688451A (zh) * | 2019-08-15 | 2020-01-14 | 中国平安人寿保险股份有限公司 | 评价信息处理方法、装置、计算机设备及存储介质 |
CN110825945A (zh) * | 2019-10-29 | 2020-02-21 | 深圳前海环融联易信息科技服务有限公司 | 负面舆论收集方法、装置、计算机设备及存储介质 |
CN111090813A (zh) * | 2019-12-20 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 一种内容处理方法、装置和计算机可读存储介质 |
CN111160019A (zh) * | 2019-12-30 | 2020-05-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111382262A (zh) * | 2020-03-19 | 2020-07-07 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN111488499A (zh) * | 2020-03-06 | 2020-08-04 | 北京健康之家科技有限公司 | 舆情数据的处理方法及装置 |
CN111565322A (zh) * | 2020-05-14 | 2020-08-21 | 北京奇艺世纪科技有限公司 | 一种用户情感倾向信息获得方法、装置及电子设备 |
CN111767725A (zh) * | 2020-06-24 | 2020-10-13 | 中国平安财产保险股份有限公司 | 一种基于情感极性分析模型的数据处理方法及装置 |
CN111784492A (zh) * | 2020-07-10 | 2020-10-16 | 讯飞智元信息科技有限公司 | 舆情分析和财务预警方法、装置、电子设备和存储介质 |
CN111782761A (zh) * | 2020-05-12 | 2020-10-16 | 北京达佳互联信息技术有限公司 | 评论信息的确定方法、装置、电子设备及存储介质 |
CN111814483A (zh) * | 2019-06-12 | 2020-10-23 | 北京京东尚科信息技术有限公司 | 用于分析情感的方法和装置 |
CN111831883A (zh) * | 2020-04-21 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种用户群体意见确定方法及装置 |
CN111950273A (zh) * | 2020-07-31 | 2020-11-17 | 南京莱斯网信技术研究院有限公司 | 基于情感信息抽取分析的网络舆情突发事件自动识别方法 |
CN112100367A (zh) * | 2019-05-28 | 2020-12-18 | 贵阳海信网络科技有限公司 | 一种景区舆情预警方法及装置 |
CN112329462A (zh) * | 2020-11-26 | 2021-02-05 | 北京五八信息技术有限公司 | 一种数据排序方法、装置、电子设备及存储介质 |
CN112417256A (zh) * | 2020-10-20 | 2021-02-26 | 中国环境科学研究院 | 一种基于互联网的自然保护地认知评价系统及方法 |
CN112925930A (zh) * | 2021-03-17 | 2021-06-08 | 北京字节跳动网络技术有限公司 | 一种信息处理方法、装置、计算机设备及存储介质 |
CN112966500A (zh) * | 2021-02-15 | 2021-06-15 | 珠海市鸿瑞信息技术股份有限公司 | 基于人工智能组态的网络数据链安全监测平台 |
CN113111269A (zh) * | 2021-05-10 | 2021-07-13 | 网易(杭州)网络有限公司 | 数据处理方法、装置、计算机可读存储介质及电子设备 |
CN113177170A (zh) * | 2021-04-12 | 2021-07-27 | 维沃移动通信有限公司 | 评论展示方法、装置及电子设备 |
CN113220823A (zh) * | 2020-01-21 | 2021-08-06 | 北京中科闻歌科技股份有限公司 | 一种面向社交媒体公共言论的情感、话题及观点分析方法 |
CN113242453A (zh) * | 2021-05-06 | 2021-08-10 | 深圳小湃科技有限公司 | 弹幕播放方法、服务器以及计算机可读存储介质 |
CN113378128A (zh) * | 2021-06-15 | 2021-09-10 | 河北时代电子有限公司 | 一种电子政务系统网络感知分析平台系统 |
CN113393321A (zh) * | 2021-07-11 | 2021-09-14 | 北京天仪百康科贸有限公司 | 一种基于区块链的金融风控方法 |
CN113393330A (zh) * | 2021-07-11 | 2021-09-14 | 北京天仪百康科贸有限公司 | 一种基于区块链的金融风控管理系统 |
CN113468206A (zh) * | 2021-07-15 | 2021-10-01 | 中国银行股份有限公司 | 数据维护方法、装置、服务器、介质及产品 |
CN113536805A (zh) * | 2021-07-09 | 2021-10-22 | 北京奇艺世纪科技有限公司 | 热点事件的舆情分析方法、装置、设备及存储介质 |
CN113779258A (zh) * | 2021-11-10 | 2021-12-10 | 上海蜜度信息技术有限公司 | 公众满意度的分析方法、存储介质及电子设备 |
CN115244941A (zh) * | 2020-09-16 | 2022-10-25 | 谷歌有限责任公司 | 用于改进视频组包的用户界面 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408883A (zh) * | 2008-11-24 | 2009-04-15 | 电子科技大学 | 一种网络舆情观点收集方法 |
CN102385579A (zh) * | 2010-08-30 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 互联网信息分类方法和系统 |
CN104268197A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN104899309A (zh) * | 2015-06-12 | 2015-09-09 | 百度在线网络技术(北京)有限公司 | 展示事件评论观点的方法和装置 |
CN104933130A (zh) * | 2015-06-12 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法及装置 |
CN107315778A (zh) * | 2017-05-31 | 2017-11-03 | 温州市鹿城区中津先进科技研究院 | 一种基于大数据情感分析的自然语言舆情分析方法 |
CN108153764A (zh) * | 2016-12-05 | 2018-06-12 | 腾讯科技(深圳)有限公司 | 一种舆情处理方法及装置 |
-
2018
- 2018-08-29 CN CN201810995915.9A patent/CN109271512B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408883A (zh) * | 2008-11-24 | 2009-04-15 | 电子科技大学 | 一种网络舆情观点收集方法 |
CN102385579A (zh) * | 2010-08-30 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 互联网信息分类方法和系统 |
CN104268197A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN104899309A (zh) * | 2015-06-12 | 2015-09-09 | 百度在线网络技术(北京)有限公司 | 展示事件评论观点的方法和装置 |
CN104933130A (zh) * | 2015-06-12 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法及装置 |
CN108153764A (zh) * | 2016-12-05 | 2018-06-12 | 腾讯科技(深圳)有限公司 | 一种舆情处理方法及装置 |
CN107315778A (zh) * | 2017-05-31 | 2017-11-03 | 温州市鹿城区中津先进科技研究院 | 一种基于大数据情感分析的自然语言舆情分析方法 |
Cited By (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008390A (zh) * | 2019-02-27 | 2019-07-12 | 深圳壹账通智能科技有限公司 | 应用程序的评估方法、装置、计算机设备及存储介质 |
CN110047469A (zh) * | 2019-04-09 | 2019-07-23 | 平安科技(深圳)有限公司 | 语音数据情感标注方法、装置、计算机设备及存储介质 |
CN110047469B (zh) * | 2019-04-09 | 2023-12-22 | 平安科技(深圳)有限公司 | 语音数据情感标注方法、装置、计算机设备及存储介质 |
CN110084373A (zh) * | 2019-04-22 | 2019-08-02 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机可读存储介质和计算机设备 |
CN110084373B (zh) * | 2019-04-22 | 2021-08-24 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机可读存储介质和计算机设备 |
CN112100367A (zh) * | 2019-05-28 | 2020-12-18 | 贵阳海信网络科技有限公司 | 一种景区舆情预警方法及装置 |
CN110188356B (zh) * | 2019-05-30 | 2023-05-19 | 腾讯音乐娱乐科技(深圳)有限公司 | 信息处理方法及装置 |
CN110188356A (zh) * | 2019-05-30 | 2019-08-30 | 腾讯音乐娱乐科技(深圳)有限公司 | 信息处理方法及装置 |
CN111814483B (zh) * | 2019-06-12 | 2024-04-12 | 北京京东尚科信息技术有限公司 | 用于分析情感的方法和装置 |
CN111814483A (zh) * | 2019-06-12 | 2020-10-23 | 北京京东尚科信息技术有限公司 | 用于分析情感的方法和装置 |
CN110347934B (zh) * | 2019-07-18 | 2023-12-08 | 腾讯科技(成都)有限公司 | 一种文本数据过滤方法、装置及介质 |
CN110516036A (zh) * | 2019-07-18 | 2019-11-29 | 平安科技(深圳)有限公司 | 法律文书信息提取方法、装置、计算机设备及存储介质 |
CN110347934A (zh) * | 2019-07-18 | 2019-10-18 | 腾讯科技(成都)有限公司 | 一种文本数据过滤方法、装置及介质 |
CN110688451A (zh) * | 2019-08-15 | 2020-01-14 | 中国平安人寿保险股份有限公司 | 评价信息处理方法、装置、计算机设备及存储介质 |
CN110634017A (zh) * | 2019-08-23 | 2019-12-31 | 深圳市新系区块链技术有限公司 | 信息分类方法、装置及设备 |
CN110674415B (zh) * | 2019-09-20 | 2022-06-17 | 北京浪潮数据技术有限公司 | 一种信息显示方法、装置及服务器 |
CN110674415A (zh) * | 2019-09-20 | 2020-01-10 | 北京浪潮数据技术有限公司 | 一种信息显示方法、装置及服务器 |
CN110825945A (zh) * | 2019-10-29 | 2020-02-21 | 深圳前海环融联易信息科技服务有限公司 | 负面舆论收集方法、装置、计算机设备及存储介质 |
CN111090813A (zh) * | 2019-12-20 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 一种内容处理方法、装置和计算机可读存储介质 |
CN111160019A (zh) * | 2019-12-30 | 2020-05-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111160019B (zh) * | 2019-12-30 | 2023-08-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN113220823A (zh) * | 2020-01-21 | 2021-08-06 | 北京中科闻歌科技股份有限公司 | 一种面向社交媒体公共言论的情感、话题及观点分析方法 |
CN113220823B (zh) * | 2020-01-21 | 2024-03-01 | 北京中科闻歌科技股份有限公司 | 一种面向社交媒体公共言论的情感、话题及观点分析方法和装置 |
CN111488499A (zh) * | 2020-03-06 | 2020-08-04 | 北京健康之家科技有限公司 | 舆情数据的处理方法及装置 |
CN111382262A (zh) * | 2020-03-19 | 2020-07-07 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN111831883A (zh) * | 2020-04-21 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种用户群体意见确定方法及装置 |
CN111782761B (zh) * | 2020-05-12 | 2023-10-31 | 北京达佳互联信息技术有限公司 | 评论信息的确定方法、装置、电子设备及存储介质 |
CN111782761A (zh) * | 2020-05-12 | 2020-10-16 | 北京达佳互联信息技术有限公司 | 评论信息的确定方法、装置、电子设备及存储介质 |
CN111565322A (zh) * | 2020-05-14 | 2020-08-21 | 北京奇艺世纪科技有限公司 | 一种用户情感倾向信息获得方法、装置及电子设备 |
CN111565322B (zh) * | 2020-05-14 | 2022-03-04 | 北京奇艺世纪科技有限公司 | 一种用户情感倾向信息获得方法、装置及电子设备 |
CN111767725A (zh) * | 2020-06-24 | 2020-10-13 | 中国平安财产保险股份有限公司 | 一种基于情感极性分析模型的数据处理方法及装置 |
CN111767725B (zh) * | 2020-06-24 | 2023-06-20 | 中国平安财产保险股份有限公司 | 一种基于情感极性分析模型的数据处理方法及装置 |
CN111784492A (zh) * | 2020-07-10 | 2020-10-16 | 讯飞智元信息科技有限公司 | 舆情分析和财务预警方法、装置、电子设备和存储介质 |
CN111950273B (zh) * | 2020-07-31 | 2023-09-01 | 南京莱斯网信技术研究院有限公司 | 基于情感信息抽取分析的网络舆情突发事件自动识别方法 |
CN111950273A (zh) * | 2020-07-31 | 2020-11-17 | 南京莱斯网信技术研究院有限公司 | 基于情感信息抽取分析的网络舆情突发事件自动识别方法 |
CN115244941A (zh) * | 2020-09-16 | 2022-10-25 | 谷歌有限责任公司 | 用于改进视频组包的用户界面 |
CN112417256A (zh) * | 2020-10-20 | 2021-02-26 | 中国环境科学研究院 | 一种基于互联网的自然保护地认知评价系统及方法 |
CN112329462B (zh) * | 2020-11-26 | 2024-02-20 | 北京五八信息技术有限公司 | 一种数据排序方法、装置、电子设备及存储介质 |
CN112329462A (zh) * | 2020-11-26 | 2021-02-05 | 北京五八信息技术有限公司 | 一种数据排序方法、装置、电子设备及存储介质 |
CN112966500A (zh) * | 2021-02-15 | 2021-06-15 | 珠海市鸿瑞信息技术股份有限公司 | 基于人工智能组态的网络数据链安全监测平台 |
CN112925930A (zh) * | 2021-03-17 | 2021-06-08 | 北京字节跳动网络技术有限公司 | 一种信息处理方法、装置、计算机设备及存储介质 |
CN113177170A (zh) * | 2021-04-12 | 2021-07-27 | 维沃移动通信有限公司 | 评论展示方法、装置及电子设备 |
CN113177170B (zh) * | 2021-04-12 | 2023-05-23 | 维沃移动通信有限公司 | 评论展示方法、装置及电子设备 |
CN113242453B (zh) * | 2021-05-06 | 2023-04-07 | 深圳小湃科技有限公司 | 弹幕播放方法、服务器以及计算机可读存储介质 |
CN113242453A (zh) * | 2021-05-06 | 2021-08-10 | 深圳小湃科技有限公司 | 弹幕播放方法、服务器以及计算机可读存储介质 |
CN113111269A (zh) * | 2021-05-10 | 2021-07-13 | 网易(杭州)网络有限公司 | 数据处理方法、装置、计算机可读存储介质及电子设备 |
CN113378128B (zh) * | 2021-06-15 | 2022-02-08 | 河北时代电子有限公司 | 一种电子政务系统网络感知分析平台系统 |
CN113378128A (zh) * | 2021-06-15 | 2021-09-10 | 河北时代电子有限公司 | 一种电子政务系统网络感知分析平台系统 |
CN113536805A (zh) * | 2021-07-09 | 2021-10-22 | 北京奇艺世纪科技有限公司 | 热点事件的舆情分析方法、装置、设备及存储介质 |
CN113536805B (zh) * | 2021-07-09 | 2023-07-14 | 北京奇艺世纪科技有限公司 | 热点事件的舆情分析方法、装置、设备及存储介质 |
CN113393330A (zh) * | 2021-07-11 | 2021-09-14 | 北京天仪百康科贸有限公司 | 一种基于区块链的金融风控管理系统 |
CN113393321A (zh) * | 2021-07-11 | 2021-09-14 | 北京天仪百康科贸有限公司 | 一种基于区块链的金融风控方法 |
CN113393330B (zh) * | 2021-07-11 | 2022-12-23 | 深圳市鼎驰科技发展有限公司 | 一种基于区块链的金融风控管理系统 |
CN113468206A (zh) * | 2021-07-15 | 2021-10-01 | 中国银行股份有限公司 | 数据维护方法、装置、服务器、介质及产品 |
CN113468206B (zh) * | 2021-07-15 | 2024-02-23 | 中国银行股份有限公司 | 数据维护方法、装置、服务器、介质及产品 |
CN113779258A (zh) * | 2021-11-10 | 2021-12-10 | 上海蜜度信息技术有限公司 | 公众满意度的分析方法、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109271512B (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271512A (zh) | 舆情评论信息的情感分析方法、装置及存储介质 | |
CN109145215A (zh) | 网络舆情分析方法、装置及存储介质 | |
CN109325165A (zh) | 网络舆情分析方法、装置及存储介质 | |
CN108959383A (zh) | 网络舆情的分析方法、装置及计算机可读存储介质 | |
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN108629043A (zh) | 网页目标信息的提取方法、装置及存储介质 | |
CN109145216A (zh) | 网络舆情监控方法、装置及存储介质 | |
CN107704503A (zh) | 用户关键词提取装置、方法及计算机可读存储介质 | |
CN110532451A (zh) | 针对政策文本的检索方法和装置、存储介质、电子装置 | |
CN106250513A (zh) | 一种基于事件建模的事件个性化分类方法及系统 | |
CN109242275A (zh) | 任务分配方法、装置及存储介质 | |
CN109151023A (zh) | 任务分配方法、装置及存储介质 | |
CN112380859A (zh) | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 | |
CN108304373A (zh) | 语义词典的构建方法、装置、存储介质和电子装置 | |
CN110113634A (zh) | 一种信息互动方法、装置、设备及存储介质 | |
CN107391675A (zh) | 用于生成结构化信息的方法和装置 | |
CN107818491A (zh) | 电子装置、基于用户上网数据的产品推荐方法及存储介质 | |
CN107678800A (zh) | 后台应用清理方法、装置、存储介质及电子设备 | |
CN108228720B (zh) | 识别目标文字内容和原图相关性的方法、系统、装置、终端、及存储介质 | |
CN109873813A (zh) | 文本输入异常监控方法、装置、计算机设备及存储介质 | |
CN109446410A (zh) | 知识点推送方法、装置及计算机可读存储介质 | |
CN110458296A (zh) | 目标事件的标记方法和装置、存储介质及电子装置 | |
CN113435202A (zh) | 基于用户画像的产品推荐方法、装置、电子设备及介质 | |
CN109299235A (zh) | 知识库搜索方法、装置及计算机可读存储介质 | |
CN113626607A (zh) | 异常工单识别方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |