CN109446330B - 网络服务平台情感倾向识别方法、装置、设备和存储介质 - Google Patents

网络服务平台情感倾向识别方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN109446330B
CN109446330B CN201811346303.3A CN201811346303A CN109446330B CN 109446330 B CN109446330 B CN 109446330B CN 201811346303 A CN201811346303 A CN 201811346303A CN 109446330 B CN109446330 B CN 109446330B
Authority
CN
China
Prior art keywords
information
media
service platform
network service
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811346303.3A
Other languages
English (en)
Other versions
CN109446330A (zh
Inventor
刘志宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Technology Co Ltd
Original Assignee
Guangzhou Huya Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Technology Co Ltd filed Critical Guangzhou Huya Technology Co Ltd
Priority to CN201811346303.3A priority Critical patent/CN109446330B/zh
Publication of CN109446330A publication Critical patent/CN109446330A/zh
Application granted granted Critical
Publication of CN109446330B publication Critical patent/CN109446330B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种网络服务平台情感倾向识别方法、装置、设备和存储介质。该方法包括:在媒体平台发布的媒体信息中,确定描述到的网络服务平台的平台数量;根据所述平台数量从所述媒体信息中提取文本特征信息;根据所述文本特征信息识别所述媒体数据中对所述网络服务平台的情感倾向信息。通过该方法解决了现有技术只能判别网页整体的情感倾向,如果网页(媒体信息)中存在多个待评价主体就无法进行判别、或是判别出的结果不能真实体现情感倾向的问题。

Description

网络服务平台情感倾向识别方法、装置、设备和存储介质
技术领域
本发明实施例涉及网络舆情技术领域,尤其涉及一种网络服务平台情感倾向识别方法、装置、设备和存储介质。
背景技术
网络舆情是指在互联网上流行的对社会问题不同看法的网络舆论,是社会舆论的一种表现形式,是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。情感倾向则是通过分析网络舆情获得的每一个舆论信息对于特定目标是持赞成观点还是持反对观点。网络舆情对于各个与网络相关的行业的决策方向都是息息相关的。但是对于近几年兴起的行业,尤其是直播行业,现存的舆情监控产品判断相关新闻或文章的准确率普遍不高,同时存在覆盖的关键词不够全的问题。
目前,现有技术中的一种基于聚类的网络舆情热点发现方法主要包括:通过对样本网页文本的特征提取,构建向量空间模型,使用OPTICS算法获取网页热点簇,根据热点簇特征向量对网页进行二次聚类,从而获取关于舆情的时间演变模式,为相关领域研究提供决策支持。然后,通过二次聚类,提高舆情网页相关度的质量。因此,现有技术只能判别网页整体的情感倾向,如果存在多个主体就无法进行判别的问题。
上述现有技术中的基于聚类的网络舆情热点发现方法的缺点为:若网页中存在多个待评价主体,且存在对待评价主体的舆情倾向不一致时,会造成舆情的误判。
发明内容
本发明提供一种网络服务平台情感倾向识别方法、装置、设备和存储介质发,实现了将繁多且复杂的舆情动态自动化收集处理,并以简洁直观的形式进行呈现的问题。
第一方面,本发明实施例提供了一种网络服务平台情感倾向识别方法,包括:
在媒体平台发布的媒体信息中,确定描述到的网络服务平台的平台数量;
根据所述平台数量从所述媒体信息中提取文本特征信息;
根据所述文本特征信息识别所述媒体数据中对所述网络服务平台的情感倾向信息。
第二方面,本发明实施例还提供了一种网络服务平台情感倾向识别装置,包括:
数量确定模块,用于在媒体平台发布的媒体信息中,确定描述到的网络服务平台的平台数量;
特征信息提取模块,用于根据所述平台数量从所述媒体信息中提取文本特征信息;
倾向信息识别模块,用于根据所述文本特征信息识别所述媒体平台在所述媒体数据中对所述网络服务平台的情感倾向信息。
第三方面,本发明实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如任一实施例所述的网络服务平台情感倾向识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现任一实施例所述的网络服务平台情感倾向识别方法。
本发明通过获取媒体数据,提取文本信息;从文本信息中提取文本特征信息,并根据文本特征信息识别媒体平台在媒体数据中对网络服务平台的情感倾向信息。解决了现有技术只能判别网页整体的情感倾向,如果网页(媒体信息)中存在多个待评价主体就无法进行判别、或是判别出的结果不能真实体现情感倾向的问题。实现了区分媒体数据中只存在待评价网络服务平台和媒体数据中同时存在待评价网络服务平台和其他网络服务平台的情况,采用不同的方式对媒体信息进行处理,获得媒体数据对待评价网络服务平台准确的情感倾向信息。
附图说明
图1为本发明实施例一提供的一种网络服务平台情感倾向识别方法的流程图;
图2为本发明实施例二提供的一种网络服务平台情感倾向识别方法的流程图;
图3为本发明实施例三提供的一种网络服务平台情感倾向识别装置的结构图;
图4为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种网络服务平台情感倾向识别方法的流程图。本实施例中的技术方案,可选的是适用于通过获取媒体数据识别媒体平台在媒体数据中对网络服务平台的情感倾向信息的场景。可以理解的是,本方案也适用于其他应用场景中,只要存在通过获取网络信息,判断信息对于某一评价对象的情感倾向问题即可。该方法由一种网络服务平台情感倾向识别装置来执行,该装置可以由软件和/或软件的方式实现,通常配置于电子设备中。
针对于网络服务平台,尤其是提供直播业务的网络服务平台而言,处于核心地位的主播(称为“头部主播”)一般是独属于某一网络服务平台的。因此,媒体数据针对头部主播的情感倾向也可认为是媒体对于网络服务平台的情感倾向。当然,与头部主播类似,媒体数据针对其他可以代表平台的事物的情感倾向也可认为是媒体对于网络服务平台的情感倾向。
参考图1,该方法包括:
S110、在媒体平台发布的媒体信息中,确定描述到的网络服务平台的平台数量。
其中,媒体平台可以泛指互联网中各个媒体平台,但考虑到数据量以及代表性的问题,一般情况下作为主要数据来源的媒体平台是统合了大部分门户网站发布的内容的聚类门户网站。网络服务平台包含平台本身以及平台内的主播、相关人物等信息。
可选的,对出现频率较高的网站使用对应各自网站结构的采集逻辑,保证所得到的文本只包含文章的正文部分,为后续的提取媒体信息提供便利。
可选的,对于因关键词本身存在歧义而采集到的无关内容,通过文本出现直播行业相关关键词的频次以及词向量模型判别出的与其他相关文章的相似度来进行过滤。保证此时的媒体数据都是与直播行业相关的媒体数据。
其中,媒体信息是指通过去除脏数据和去除文章格式等处理之后的信息,该媒体信息体现每篇文章的实际长度,该媒体信息还可以直接用于分词处理。
其中,一个媒体信息中可能只涉及一家网络服务平台(涉及一家网络服务平台的多个主播的情况也是涉及一家网络服务平台的),则称该篇文章为该平台独占。也可能一个媒体信息中涉及多家网络服务平台,此时称该篇文章为非独占。
具体的,通过爬虫技术等从媒体平台抓取媒体数据;从抓取的媒体数据中确定与网络服务平台相关的关键词,该关键词包括平台名称和主播名称以及其他可以代表平台的名称;从媒体数据中查找与所述关键词匹配的媒体数据,作为与网络服务平台相关的媒体数据。对媒体数据进行处理,获得去除脏数据和去除文章格式之后的媒体信息。依据网络服务平台相关的关键词,确定媒体信息中描述所述网络服务平台的平台数量为一个或两个以上。
S120、根据所述平台数量从所述媒体信息中提取文本特征信息。
其中,文本特征信息是进行后续处理依赖的信息。文本特征信息会因为后续处理的不同而变化。平台数量为多个(两个以上)时,文本特征信息包括:文本长度、所述正向情感得分和所述负向情感得分。平台数量为一个时,文本特征信息可能包括:文本长度、所述正向情感得分和所述负向情感得分;也可能是词向量。
具体的,确定平台数量后,查询对所述平台数量设置的文本特征信息类型,然后从所述媒体信息中提取符合所述特征类型的文本特征信息。
S130、根据所述文本特征信息识别所述媒体数据中对所述网络服务平台的情感倾向信息。
其中,情感倾向信息是媒体平台对于网络服务平台的网络舆情的结果,即在媒体平台的媒体数据对于网络服务平台的看法。
具体的,通过不同的模型对不同的文本特征信息进行处理后,输出情感倾向信息。由此,可以获得媒体平台中某一篇媒体数据对某一个(某几个)网络服务平台的情感倾向信息。
本发明实施例通过获取媒体数据,提取媒体信息;从媒体信息中提取文本特征信息,并根据文本特征信息识别媒体平台在媒体数据中对网络服务平台的情感倾向信息。解决了现有技术只能判别网页整体的情感倾向,如果存在多个主体就无法进行判别的问题。实现了将繁多且复杂的舆情动态自动化收集处理,并以简洁直观的形式进行呈现的问题。
实施例二
图2为本发明实施例二提供的一种网络服务平台情感倾向识别方法的流程图。本实施是在实施例一的基础上进行的细化,主要描述了平台数量为一个和两个以上时分别需要获得怎样的文本特征信息。还描述了当平台数量为一个时,结合文本长度确定需要获得怎样的文本特征信息。参考图2,本实施例包括如下步骤:
S210、在媒体平台发布的媒体信息中,确定描述到网络服务平台的平台数量。若为一个,则执行步骤S220;若为两个以上,则执行步骤S230。
具体的,通过爬虫技术等从媒体平台抓取媒体数据;从抓取的媒体数据中确定与网络服务平台相关的关键词,该关键词包括平台名称和主播名称以及其他可以代表平台的名称;从媒体数据中查找与所述关键词匹配的媒体数据,作为与网络服务平台相关的媒体数据。对媒体数据进行处理,获得去除脏数据和去除文章格式之后的媒体信息。依据网络服务平台相关的关键词,确定媒体信息中描述所述网络服务平台的平台数量为一个或两个以上。
S220、统计所述媒体信息的文本长度。
其中,文本长度是指媒体信息的长度。
具体的,当在媒体信息中描述所述网络服务平台的平台数量为一个时,统计媒体信息的文本长度。
S221、判断长度与长度预设值关系。若长度小于长度预设值,则执行步骤S222;若长度大于或等于长度预设值,则执行步骤S225。
具体的,确定文本长度后,将文本长度与长度预设值进行比价,判断长度是小于长度预设值或大于等于长度预设值。
S222、计算所述平台信息的正向情感得分和负向情感得分。
具体的,通过识别情感词并计算相应权重,对共现词采用Bootstrapping算法,再通过深度神经网络对新生成的情感词结合其权重进行扩展计算,综合最终的结果作为平台信息的正向情感得分和负向情感得分。
S223、将所述文本长度、所述正向情感得分和所述负向情感得分设置为文本特征信息。
具体的,将文本长度、计算得出的正向情感得分和负向情感得分设置为文本特征向量,用于输入逻辑回归模型进行运算。
S224、将所述文本长度、所述网络服务平台对应的所述正向情感得分和所述负向情感得分输入逻辑回归模型,识别所述媒体平台在所述媒体数据中对所述网络服务平台的情感倾向信息。
其中,逻辑回归是机器学习中的一种分类模型,使用前需要对其进行训练。通过一批标注好类别的数据以及描述这些数据的相应特征对逻辑回归模型进行训练。模型的训练集可表示为:D=(x1,y1),(x2,y2)...(xN,yN),其中xi是一个m维的向量。可选的,在本方案中m=3,即包括正向情感得分、负向情感得分和文本长度;y在{0,1}中取值,0代表情感倾向的负面,1代表情感倾向的与正面。随后逻辑回归模型会作出假设:P(y=1|x)=f(x),相应的决策函数为:y*=1if P(y=1|x)>p,从而实现根据所给特征判别情感倾向的极性。而在训练集充分的条件下,通过构造函数f(x)与选择阈值p能使该模型在未知数据集上的判别准确率达到我们的期望水平,在本方案中主要通过调用scikit-learn库的相关方法,完成了对逻辑回归模型的迭代与优化。
具体的,将文本长度、网络服务平台对应的正向情感得分和负向情感得分输入逻辑回归模型,识别所述媒体平台在所述媒体数据中对所述网络服务平台的情感倾向信息。
S225、对所述媒体信息进行分词处理,获得文本分词。
具体的,对于分词的方式不做限制,至少可以通过第三方的jieba库实现。
S226、将所述文本分词转换为词向量,作为文本特征信息。
具体的,一般可以使用gensim.models.doc2vec(该模块提供了将不定长的文本映射到维度大小固定的向量的功能)完成将文本分词转换为词向量的功能。将最终获得的词向量,作为文本特征信息。
S227、将所述词向量输入词向量模型,以识别所述媒体平台在所述媒体数据中对所述网络服务平台的情感倾向信息。
具体的,将词向量输入设置好参数的词向量模型,最终获得一个数值(向量),该数值(向量)对应于一种情感倾向。即媒体平台在所述媒体数据中对所述网络服务平台的情感倾向。
S230、统计所述媒体信息的文本长度。
具体的,当在媒体信息中描述所述网络服务平台的平台数量为两个以上时,统计所述媒体信息的文本长度。
S231、从所述媒体信息中查找描述所述网络服务平台的平台信息。
具体的,通过命名实体识别、句法分析的方法抽取评价对象,通过上述方法可以获得一篇文章中对多个网络服务平台的描述。
S232、计算所述平台信息的正向情感得分和负向情感得分。
具体的,通过识别情感词并计算相应权重,对共现词采用Bootstrapping算法,再通过深度神经网络对新生成的情感词结合其权重进行扩展计算,综合最终的结果作为平台信息的正向情感得分和负向情感得分。此时针对每个网络服务平台会生成其对应的正向情感得分和负向情感得分。
S233、将所述文本长度、所述正向情感得分和所述负向情感得分设置为文本特征信息。
具体的,将文本长度、计算得出的正向情感得分和负向情感得分设置为文本特征向量,用于输入逻辑回归模型进行运算。由于媒体信息中有多个网络服务平台,因此会有每个网络服务平台对应的正向情感得分和负向情感得分。
S234、将所述文本长度、每个网络服务平台对应的所述正向情感得分和所述负向情感得分分别输入逻辑回归模型,以识别所述媒体平台在所述媒体数据中对每个网络服务平台的情感倾向信息。
具体的,将文本长度、每个网络服务平台对应的正向情感得分和负向情感得分输入逻辑回归模型,识别所述媒体平台在所述媒体数据中对所述网络服务平台的情感倾向信息。输出结果为针对多个网络服务平台的多个数值,每个数值表示媒体数据对某一平台的情感倾向。
本发明实施例通过获取媒体数据,提取媒体信息;从媒体信息中提取文本特征信息,并根据文本特征信息识别媒体平台在媒体数据中对网络服务平台的情感倾向信息。同时详细描述了平台数量为一个和两个以上时分别需要获得怎样的文本特征信息。同时还描述了当平台数量为一个时,结合文本长度确定需要获得怎样的文本特征信息解决了现有技术只能判别网页整体的情感倾向,如果存在多个主体就无法进行判别的问题。实现了将繁多且复杂的舆情动态自动化收集处理,并以简洁直观的形式进行呈现的问题。
实施例三
图3为本发明实施例三提供的一种网络服务平台情感倾向识别装置的结构图。该装置包括:数量确定模块31、特征信息提取模块32和倾向信息识别模块33。其中:
数量确定模块31,用于在媒体平台发布的媒体信息中,确定描述到的网络服务平台的平台数量;
特征信息提取模块32,用于根据所述平台数量从所述媒体信息中提取文本特征信息;
倾向信息识别模块33,用于根据所述文本特征信息识别所述媒体平台在所述媒体数据中对所述网络服务平台的情感倾向信息。
本发明实施例通过获取媒体数据,提取媒体信息;从媒体信息中提取文本特征信息,并根据文本特征信息识别媒体平台在媒体数据中对网络服务平台的情感倾向信息。解决了现有技术只能判别网页整体的情感倾向,如果存在多个主体就无法进行判别的问题。实现了将繁多且复杂的舆情动态自动化收集处理,并以简洁直观的形式进行呈现的问题。
在上述实施例的基础上,特征信息提取模块32还用于:
若所述平台数量为一个,则统计所述媒体信息的文本长度;
根据所述文本长度从所述媒体信息中提取文本特征信息。
在上述实施例的基础上,所述根据所述文本长度从所述媒体信息中提取文本特征信息,包括:
若所述长度小于长度预设值,则计算所述平台信息的正向情感得分和负向情感得分;
将所述文本长度、所述正向情感得分和所述负向情感得分设置为文本特征信息。
在上述实施例的基础上,倾向信息识别模块33还用于:
将所述文本长度、所述网络服务平台对应的所述正向情感得分和所述负向情感得分输入逻辑回归模型,识别所述媒体平台在所述媒体数据中对所述网络服务平台的情感倾向信息。
在上述实施例的基础上,所述根据所述文本长度从所述媒体信息中提取文本特征信息,包括:
若所述长度大于或等于长度预设值,则对所述媒体信息进行分词处理,获得文本分词;
将所述文本分词转换为词向量,作为文本特征信息。
在上述实施例的基础上,倾向信息识别模块33还用于:
将所述词向量输入词向量模型,以识别所述媒体平台在所述媒体数据中对所述网络服务平台的情感倾向信息。
在上述实施例的基础上,特征信息提取模块32还用于:
若所述平台数量为两个或两个以上,则统计所述媒体信息的文本长度;
从所述媒体信息中查找描述所述网络服务平台的平台信息;
计算所述平台信息的正向情感得分和负向情感得分;
将所述文本长度、所述正向情感得分和所述负向情感得分设置为文本特征信息。
在上述实施例的基础上,倾向信息识别模块33还用于:
将所述文本长度、每个网络服务平台对应的所述正向情感得分和所述负向情感得分分别输入逻辑回归模型,以识别所述媒体平台在所述媒体数据中对每个网络服务平台的情感倾向信息。
在上述实施例的基础上,还包括数据获取模块,用于:
从媒体平台抓取媒体数据;
确定与网络服务平台相关的关键词,所述关键词包括平台名称和/或主播名称;
从所述媒体数据中查找与所述关键词匹配的媒体数据,作为与网络服务平台相关的媒体数据;
从所述媒体数据中提取媒体信息。
本实施例提供的一种网络服务平台情感倾向识别装置可用于执行上述任一实施例提供的网络服务平台情感倾向识别方法,具有相应的功能和有益效果。
实施例四
图4为本发明实施例四提供的一种电子设备的结构示意图。如图4所示,该电子设备包括处理器40、存储器41、通信模块42、输入装置43和输出装置44;电子设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;电子设备中的处理器40、存储器41、通信模块42、输入装置43和输出装置44可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本实施例中的一种网络服务平台情感倾向识别方法对应的模块(例如,一种网络服务平台情感倾向识别装置中的数量确定模块31、特征信息提取模块32和倾向信息识别模块33)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的一种网络服务平台情感倾向识别方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
通信模块42,用于与显示屏建立连接,并实现与显示屏的数据交互。输入装置43可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。
本实施例提供的一种电子设备,可执行本发明任一实施例提供的网络服务平台情感倾向识别方法,具体相应的功能和有益效果。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种网络服务平台情感倾向识别方法,该方法包括:
在媒体平台发布的媒体信息中,确定描述到的网络服务平台的平台数量;
根据所述平台数量从所述媒体信息中提取文本特征信息;
根据所述文本特征信息识别所述媒体数据中对所述网络服务平台的情感倾向信息。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任一实施例所提供的网络服务平台情感倾向识别方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机电子设备(可以是个人计算机,服务器,或者网络电子设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述网络服务平台情感倾向识别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种网络服务平台情感倾向识别方法,其特征在于,包括:
在媒体平台发布的媒体信息中,依据与网络服务平台相关的关键词确定描述到的网络服务平台的平台数量,所述媒体信息中包括与所述网络服务平台相关的关键词;
根据所述平台数量从所述媒体信息中提取文本特征信息;
根据所述文本特征信息识别所述媒体信息中对所述网络服务平台的情感倾向信息,作为所述媒体平台对于所述网络服务平台的网络舆情。
2.根据权利要求1所述的方法,其特征在于,所述根据所述平台数量从所述媒体信息中提取文本特征信息,包括:
若所述平台数量为一个,则统计所述媒体信息的文本长度;
根据所述文本长度从所述媒体信息中提取文本特征信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述文本长度从所述媒体信息中提取文本特征信息,包括:
若所述长度小于长度预设值,则计算所述媒体信息的正向情感得分和负向情感得分;
将所述文本长度、所述正向情感得分和所述负向情感得分设置为文本特征信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述文本特征信息识别所述媒体平台在所述媒体信息中对所述网络服务平台的情感倾向信息,包括:
将所述文本长度、所述网络服务平台对应的所述正向情感得分和所述负向情感得分输入逻辑回归模型,识别所述媒体平台在所述媒体信息中对所述网络服务平台的情感倾向信息。
5.根据权利要求2所述的方法,其特征在于,所述根据所述文本长度从所述媒体信息中提取文本特征信息,包括:
若所述长度大于或等于长度预设值,则对所述媒体信息进行分词处理,获得文本分词;
将所述文本分词转换为词向量,作为文本特征信息。
6.根据权利要求5所述的方法,其特征在于,所述根据所述文本特征信息识别所述媒体平台在所述媒体信息中对所述网络服务平台的情感倾向信息,包括:
将所述词向量输入词向量模型,以识别所述媒体平台在所述媒体信息中对所述网络服务平台的情感倾向信息。
7.根据权利要求1所述的方法,其特征在于,所述根据所述平台数量从所述媒体信息中提取文本特征信息,包括:
若所述平台数量为两个或两个以上,则统计所述媒体信息的文本长度;
从所述媒体信息中查找描述所述网络服务平台的平台信息;
计算所述平台信息的正向情感得分和负向情感得分;
将所述文本长度、所述正向情感得分和所述负向情感得分设置为文本特征信息。
8.根据权利要求7所述的方法,其特征在于,所述根据所述文本特征信息识别所述媒体平台在所述媒体信息中对所述网络服务平台的情感倾向信息,包括:
将所述文本长度、每个网络服务平台对应的所述正向情感得分和所述负向情感得分分别输入逻辑回归模型,以识别所述媒体平台在所述媒体信息中对每个网络服务平台的情感倾向信息。
9.一种网络服务平台情感倾向识别装置,其特征在于,包括:
数量确定模块,用于在媒体平台发布的媒体信息中,依据与网络服务平台相关的关键词确定描述到的网络服务平台的平台数量,所述媒体信息中包括与所述网络服务平台相关的关键词;
特征信息提取模块,用于根据所述平台数量从所述媒体信息中提取文本特征信息;
倾向信息识别模块,用于根据所述文本特征信息识别所述媒体平台在所述媒体信息中对所述网络服务平台的情感倾向信息,作为所述媒体平台对于所述网络服务平台的网络舆情。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8任一所述的一种网络服务平台情感倾向识别方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8任一所述的一种网络服务平台情感倾向识别方法。
CN201811346303.3A 2018-11-13 2018-11-13 网络服务平台情感倾向识别方法、装置、设备和存储介质 Active CN109446330B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811346303.3A CN109446330B (zh) 2018-11-13 2018-11-13 网络服务平台情感倾向识别方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811346303.3A CN109446330B (zh) 2018-11-13 2018-11-13 网络服务平台情感倾向识别方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN109446330A CN109446330A (zh) 2019-03-08
CN109446330B true CN109446330B (zh) 2021-05-14

Family

ID=65552753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811346303.3A Active CN109446330B (zh) 2018-11-13 2018-11-13 网络服务平台情感倾向识别方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN109446330B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382366B (zh) * 2020-03-03 2022-11-25 重庆邮电大学 基于语言和非语言特征的社交网络用户识别方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408883B (zh) * 2008-11-24 2010-09-01 电子科技大学 一种网络舆情观点收集方法
US20150193482A1 (en) * 2014-01-07 2015-07-09 30dB, Inc. Topic sentiment identification and analysis
CN106503049A (zh) * 2016-09-22 2017-03-15 南京理工大学 一种基于svm融合多种情感资源的微博情感分类方法
CN108255805B (zh) * 2017-12-13 2022-02-25 讯飞智元信息科技有限公司 舆情分析方法及装置、存储介质、电子设备

Also Published As

Publication number Publication date
CN109446330A (zh) 2019-03-08

Similar Documents

Publication Publication Date Title
CN110516067B (zh) 基于话题检测的舆情监控方法、系统及存储介质
CN109918673B (zh) 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN107657048B (zh) 用户识别方法及装置
CN111400607B (zh) 搜索内容输出方法、装置、计算机设备及可读存储介质
CN110020422B (zh) 特征词的确定方法、装置和服务器
CN110168535B (zh) 一种信息处理方法及终端、计算机存储介质
CN112699246B (zh) 基于知识图谱的领域知识推送方法
CN105279277A (zh) 知识数据的处理方法和装置
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN110134777B (zh) 问题去重方法、装置、电子设备和计算机可读存储介质
CN112559684A (zh) 一种关键词提取及信息检索方法
CN111083141A (zh) 一种仿冒账号的识别方法、装置、服务器和存储介质
CN113282754A (zh) 针对新闻事件的舆情检测方法、装置、设备和存储介质
CN111783467A (zh) 一种企业名称识别方法及装置
CN112528022A (zh) 主题类别对应的特征词提取和文本主题类别识别方法
CN112364014A (zh) 数据查询方法、装置、服务器及存储介质
CN104035955A (zh) 搜索方法和装置
CN113486664A (zh) 文本数据可视化分析方法、装置、设备及存储介质
CN109446330B (zh) 网络服务平台情感倾向识别方法、装置、设备和存储介质
CN107368923B (zh) 景点热度预测方法及装置
CN110413997B (zh) 针对电力行业的新词发现方法及其系统、可读存储介质
CN111985226A (zh) 标注数据生成方法及装置
CN116304155A (zh) 基于二维图片的三维构件检索方法、装置、设备及介质
CN113704623B (zh) 一种数据推荐方法、装置、设备及存储介质
CN116090450A (zh) 一种文本处理方法及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant