CN110442717A - 一种适应性情感分析系统及其方法 - Google Patents

一种适应性情感分析系统及其方法 Download PDF

Info

Publication number
CN110442717A
CN110442717A CN201910728857.8A CN201910728857A CN110442717A CN 110442717 A CN110442717 A CN 110442717A CN 201910728857 A CN201910728857 A CN 201910728857A CN 110442717 A CN110442717 A CN 110442717A
Authority
CN
China
Prior art keywords
mood
sentiment analysis
feeling polarities
enforcement mechanisms
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910728857.8A
Other languages
English (en)
Inventor
庄子琪
汉斯·乌思克尔特
艾人龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenju Technology (beijing) Co Ltd
Original Assignee
Shenju Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenju Technology (beijing) Co Ltd filed Critical Shenju Technology (beijing) Co Ltd
Priority to CN201910728857.8A priority Critical patent/CN110442717A/zh
Publication of CN110442717A publication Critical patent/CN110442717A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Abstract

一种适应性情感分析系统及其方法,包括包括用于情感分析的终端,所述用于情感分析的终端中包括方面提取模块和情感极性分类模块;所述方面提取模块用于标识要进行情感分析的文本中的方面;所述情感极性分类模块对每个识别出的情感极性进行分类。所述方面提取模块包括有监督模式的方面提取子模块和无监督模式的方面提取子模块;并结合其它的方法和模块有效避免了现有技术中的情感分析方法通常过于简单化、未能提供精确的解决方案和对文本文件中包含的意见数据的细粒度分析的缺陷。

Description

一种适应性情感分析系统及其方法
技术领域
本发明涉及情感分析技术领域,具体涉及一种适应性情感分析系统及其方法,尤其涉及一种多语言适应性的情感分析系统及其方法。
背景技术
随着大数据、人工智能技术的快速发展,语音、文本、图像、视频等多媒体信息得到大力挖掘,为用户提供了视觉、听觉等感官上的智能体验。而这些多媒体信息中,文本信息的重要性尤为突出。无论是语音到文字的转写,还是图像或视频的文本描述,文本数据的理解能为其它媒体信息提供更高层面的认知智能。而文本情感分析是对文本数据理解的一个重要方向,能帮助挖掘用户评论观点、进行商品口碑分析等。
由此可见,在意见挖掘领域,情感分析是一个专注于研究人们对产品,服务,组织,话题和个体的情感,观点和态度的主观信息的领域。 由于其对许多场景的适用性和重要性,情感分析已经成为一个热门的研究领域,在自然语言处理领域非常活跃。事实上,情感分析的发展与互联网本身和社交媒体的出现有关。万维网包含大量意见数据,由论坛,博客,在线新闻,社交媒体和客户评论中的真实用户生成。很多公司和机构都对这些数据很感兴趣,因为从中可以分析用户对产品或决定的意见。由于网上有大量的主观数据,人类不可能手动处理和总结。因此,需要自动情绪分析系统。情感分析领域的大多数研究都集中在开发能够预测整个文档的总体情绪分数的系统上。但是目前这些方法通常过于简单化,只关注计算文本中的正面或负面词汇,以总结整体情绪。他们未能提供精确的解决方案和对文本文件中包含的意见数据的细粒度分析。
发明内容
为解决上述问题,本发明提供了一种适应性情感分析系统及其方法,有效避免了现有技术中的情感分析方法通常过于简单化、未能提供精确的解决方案和对文本文件中包含的意见数据的细粒度分析的缺陷。
为了克服现有技术中的不足,本发明提供了一种适应性情感分析系统及其方法的解决方案,具体如下:
一种适应性情感分析系统,包括:
用于情感分析的终端,所述用于情感分析的终端中包括方面提取模块和情感极性分类模块;
所述方面提取模块用于标识要进行情感分析的文本中的方面;
所述情感极性分类模块对每个识别出的情感极性进行分类。
所述方面提取模块包括有监督模式的方面提取子模块和无监督模式的方面提取子模块;
所述有监督模式的方面提取子模块和无监督模式的方面提取子模块用于对来自文档集合的需要进行情感分析的文本文档提取其方面;
所述情感极性分类模块包括有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块;
所述有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块用于对方面和需要进行情感分析的文本文档分别进行预测,各自得到每个方面的情绪。
所述用于情感分析的终端还包括并集模块和合并模块;
所述并集模块用于通过并集操作方式来合并所提取的方面;
所述合并模块用于合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;
如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:
A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;
B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,则最终情绪为中性。
所述适应性情感分析系统的方法,包括两个子任务分别如下:
(1)方面提取,其标识要进行情感分析的文本中的方面;
(2)情感极性分类,其对每个识别出的情感极性进行分类。
所述方面提取和情感极性分类均分为有监督模式和无监督模式,具体方式如下:
首先,通过有监督模式的方面提取方法和无监督模式的方面提取方法对来自文档集合的需要进行情感分析的文本文档提取其方面;
接着通过并集操作方式来合并所提取的方面;
所述方面和需要进行情感分析的文本文档由有监督模式的情感极性分类方法和无监督模式的情感极性分类方法分别进行预测,各自得到每个方面的情绪;
然后,合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;
如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:
A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;
B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,则最终情绪为中性。
所述适应性情感分析系统可以处理任何语言;
对于所述监督模式,只要可以为特定语言提供训练数据,在此监督模式下的方面提取和基于方面的情感极性分类的方法可以学习如何对文档的情感进行分类,为该语言构建模型;
而对于所述无监督模式。其基于通用依赖分析方式指定的规则,可以将多种语言解析为类似的通用依赖关系表示,然后,该基于通用依赖分析方式指定的规则可以应用于编写多种语言的文档的情感分析预测。
所述监督模式是基于语言表征模型BERT来实现的;
对于有监督模式的方面提取,能够运用两种基于BERT的方法:
第一种基于BERT的方法称为BERT-NER方法,该方法为:输入文本文档的每个单词被分类为方面或非方面;它能够在句子中找到明确的方面;
第二种基于BERT的方法称为BERT多标签分类方法, 该方法将文本文档句子中的方面分类为一个或多个预定义的类。
对于有监督模式的情绪极性分类,也运用BERT方法进行极性分类。在这种情况下,BERT接收由文本和显式或隐式类的方面组成的双重输入,并将情绪分类为正面,负面或中性类别。
所述无监督模式包括基于规则的实现;
无监督模式的方面提取是通过处理文本以找到文本中单词的词性,其中词性为名词和复合名词的单词被识别并标记为潜在方面,然后,进行修剪以消除潜在方面列表中的误报,所述修剪包括:删除停用词,意见词,低频词,模糊词以及黑名单词;修剪后 剩下的名词被认为是文本的方面;
对于无监督模式的情绪极性分类方法,包括使用情感词典,该情感词典包含带注释的单词及其情绪分数,所述情绪分数范围在[-1,1]之间,其中-1为最负数,1为最正数; 此外,文本的语法结构被解析,并且查找依赖关系解析中的意见词和显式方面词之间的关系; 通过这些关系,可以分配方面的情绪分数。
本发明的有益效果为:
本发明的适应性情感分析系统及其方法与现有技术的一般情感分析方法相比具有明显的优势,因为它可以产生关于文档集合的情感的深入细节。此外,将有监督模式与无监督模式的步骤相结合使得适应性情感分析系统及其方法能够找到更多方面,并且可以将两种方法的最佳结合在一起,从而获得高精度的结果。此外,用户可以选择特定于其场景的最佳方面提取方法。最后,实验表明,这样的有监督模式和无监督模式的基于方面的情感分类在情绪极性分类方面具有88%的一致性。
附图说明
图1为本发明的适应性情感分析系统的方法的流程图。
具体实施方式
由于一般的情绪分析方法不足以进行深入的意见挖掘,本发明关注的是一种有针对性的适应性情感分析系统及其方法,也称之为基于方面的情感分析。从广义上讲,方面是指与文本中提到的给定实体相关的特征,功能,性能或词语。方面可以是:
a)在文档中明确,例如文本中明确提到的实体的单词或名称; 或
b)隐含的方面类别,不能从文本中推断出来。
因此,基于方面的情感分析是对一般情绪分析的更详细和更优越的方法。基于方面的情感分析有两个主要功能:
1)方面提取: 其中确定了给定需要进行情感分析的文件的各个方面;
2)基于方面的情感分析: 它在上下文中对每个方面的情感极性(正面,负面,中立)进行了分类。
此外,该基于方面的情感分析能够处理多种语言的文本数据。
下面将结合附图和实施例对本发明做进一步地说明。
如图1所示,适应性情感分析系统,包括:
用于情感分析的终端,所述用于情感分析的终端能够是PC机、笔记本电脑或者服务器;所述用于情感分析的终端中包括方面提取模块和情感极性分类模块;
所述方面提取模块用于标识要进行情感分析的文本中的方面;
所述情感极性分类模块对每个识别出的情感极性进行分类。
所述方面提取模块包括有监督模式的方面提取子模块和无监督模式的方面提取子模块;
所述有监督模式的方面提取子模块和无监督模式的方面提取子模块用于对来自用于情感分析的终端中的文档集合的需要进行情感分析的文本文档提取其方面;
所述情感极性分类模块包括有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块;
所述有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块用于对方面和需要进行情感分析的文本文档分别进行预测,各自得到每个方面的情绪。
所述用于情感分析的终端还包括并集模块和合并模块;
所述并集模块用于通过并集操作方式来合并所提取的方面;
所述合并模块用于合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;
但是,如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:
A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;
B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,即预测出的情绪分别为消极和积极,则最终情绪为中性。
所述适应性情感分析系统的方法,包括两个子任务分别如下:
(1)方面提取,其标识要进行情感分析的文本中的方面;
(2)情感极性分类,其对每个识别出的情感极性进行分类。
所述方面提取和情感极性分类均分为有监督模式和无监督模式,具体方式如下:
首先,通过有监督模式的方面提取方法和无监督模式的方面提取方法对来自用于情感分析的终端中的文档集合的需要进行情感分析的文本文档提取其方面;
接着通过并集操作方式来合并所提取的方面;
所述方面和需要进行情感分析的文本文档由有监督模式的情感极性分类方法和无监督模式的情感极性分类方法分别进行预测,各自得到每个方面的情绪;
然后,合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;
但是,如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:
A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;
B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,即预测出的情绪分别为消极和积极,则最终情绪为中性。
重要的是该所述适应性情感分析系统可以处理任何语言;
对于所述监督模式,只要可以为特定语言提供训练数据,在此监督模式下的方面提取和基于方面的情感极性分类的方法可以学习如何对文档的情感进行分类,为该语言构建模型;
而对于所述无监督模式。其基于通用依赖分析(Universal Dependencies)方式指定的规则,可以将多种语言解析为类似的通用依赖关系表示,然后,该基于通用依赖分析(Universal Dependencies)方式指定的规则可以应用于编写多种语言的文档的情感分析预测。在这种情况下,每种语言都需要一个情感词典。目前,该体系已经过测试,可用于预测英语和中文等语言的语料库的情绪。
所述监督模式是基于语言表征模型BERT来实现的;也即变换器的双向编码表达模型; 所述基于语言表征模型BERT提供预训练的词语双向表示模型,可用于对其他任务进行微调;预训练的词语双向表示模型源自表示需要进行情感分析的文本文档的不同上下文中的单词的大量未标记文本。由于其在一般分类任务中的最新结果的性能,选择基于语言表征模型BERT的预训练的词语双向表示模型应用于情绪分析场景。
对于有监督模式的方面提取,能够运用两种基于BERT的方法:
第一种基于BERT的方法称为BERT-NER方法,该方法为:输入文本文档的每个单词被分类为方面或非方面; 因此,它能够在句子中找到明确的方面;
第二种基于BERT的方法称为BERT多标签分类方法, 该方法将文本文档句子中的方面分类为一个或多个预定义的类。它的主要优点是它可以处理显式和隐式方面。在本发明的方法中,用户可以选择这两种方法。
对于有监督模式的情绪极性分类,也运用BERT方法进行极性分类。在这种情况下,BERT接收由文本和显式或隐式类的方面组成的双重输入,并将情绪分类为正面,负面或中性类别。
所述无监督模式包括基于规则的实现;无监督模式与有监督模式相比具有一些优点,因为无监督模式不需要经过训练的数据并且计算效率高,只是其不太精确。
无监督模式的方面提取是通过处理文本以找到文本中单词的词性,其中词性为名词和复合名词的单词被识别并标记为潜在方面,然后,进行一系列修剪以消除潜在方面列表中的误报,所述修剪包括:删除停用词,意见词,低频词,模糊词以及黑名单词;修剪后 剩下的名词被认为是文本的方面;
对于无监督模式的情绪极性分类方法,包括使用情感词典,该情感词典包含带注释的单词及其情绪分数,所述情绪分数范围在[-1,1]之间,其中-1为最负数,1为最正数; 此外,文本的语法结构被解析,并且运用设定的一组规则用于查找依赖关系解析中的意见词和显式方面词之间的关系; 通过这些关系,可以分配方面的情绪分数。
该适应性情感分析系统及其方法与现有技术的一般情感分析方法相比具有明显的优势,因为它可以产生关于文档集合的情感的深入细节。此外,将有监督模式与无监督模式的步骤相结合使得适应性情感分析系统及其方法能够找到更多方面,并且可以将两种方法的最佳结合在一起,从而获得高精度的结果。此外,用户可以选择特定于其场景的最佳方面提取方法。最后,实验表明,这样的有监督模式和无监督模式的基于方面的情感分类在情绪极性分类方面具有88%的一致性。
此外,对框架的不同组件进行了实验,该实验的实例中使用了文献中提供的两个数据集:来自SemEval会议的餐厅和笔记本电脑数据集。对于方面提取,就分别使用SemEval2016和SemEval2014的数据集,分别用于餐厅和笔记本电脑。对于情绪极性分类任务,就使用了SemEval2014的两个数据集。通过10倍交叉验证实验评估结果,并使用平均F1评分来显示模型的性能。
对于方面提取,将本适应性情感分析系统及其方法得到的结果与试图进行方面提取的现有技术文献中的其他工作进行比较。本适应性情感分析系统及其方法的BERT-NER和BertMultilabel方法比现有技术文献中的其他数据集更好或更具竞争力。对于BERT-Multilabel,本适应性情感分析系统及其方法无法在SemEval2014上执行,因为数据集不包含预定义的类,只标记没有上下文的单词。
对于情绪极性分类,本适应性情感分析系统及其方法将得到的结果与现有技术文献中的其他结果进行比较。使用本适应性情感分析系统及其方法就可以观察笔记本电脑数据集的更好结果和餐馆数据集的竞争结果。
该适应性情感分析系统及其方法可应用于许多场景:从审查分析到民意调查和决策策略。更具体地说,本适应性情感分析系统及其方法可以作为咨询公司,以寻求了解其客户群在其提供的产品或服务方面的行为。用户经常在社交媒体和购物网站上撰写关于表明他们购买的产品和服务的评论,表明他们喜欢或不喜欢的内容。本适应性情感分析系统及其方法可以根据产品各方面的具体细节来识别和总结客户群对产品的一般情绪。
例如,考虑一家销售笔记本电脑的公司。本适应性情感分析系统及其方法能够分析和总结笔记本电脑各个方面的使用感受和意见:屏幕,键盘,触摸板,电池,处理器,内存,图形等。这些详细数据可用于公司内部的决策制定例如,设计更好的营销和广告策略,设计更好的产品,解决缺陷。该框架还可以与地理定位的实时分析相结合,预测不同地点和不同时间戳中客户意见的情绪数据。
此外,基于方面的情绪分析可以应用于有兴趣了解对某个公司或股票的意见的投资者。社交媒体用户和新闻媒体有关于公司的持续数据流。投资者非常有兴趣了解对未来影响股票价格的因素的一般情绪,并相应地进行投资。
而用于情感分析的终端得到的最终情绪信息无法备份和远程监视,于是就须用于情感分析的终端连接通信模块,所述通信模块能够是3G通信模块或者4G通信模块,通信模块连接通信网里的路由器,所述通信网能够是3G网或4G网,该路由器与后台终端连接,所述后台终端能够是计算机或者笔记本电脑,这里用于情感分析的终端能与通信网间构建通信连接,用于情感分析的终端与通信模块能够焊接在一个PCB基板上;在用于情感分析的终端要把最终情绪信息传递到后台终端之际,用于情感分析的终端经由通信模块把最终情绪信息凭借信息发送通道传递至通信网里的路由器,通信网里的路由器接着运用中转传输通道传递到后台终端;相应的,在后台终端得到最终情绪信息后,就把该最终情绪信息存储在后台终端并显示在后台终端的显示屏上,以此达到传输到用于情感分析的终端的最终情绪信息的备份和远程监视的目的,并对用于情感分析的终端传递获得该最终情绪信息的响应消息,传递响应消息的过程是:后台终端把响应消息先传送至通信网里的路由器,通信网里的路由器接着凭借响应通道把响应消息传递至给通信模块,通信模块再把响应消息传递至用于情感分析的终端。
目前的后台终端对用于情感分析的终端传递获得该最终情绪信息的响应消息的方式运用起来即使较为容易达成,然而亦因为响应消息相对于最终情绪信息而言非常短小,使得响应消息在传递期间常发生噪声信号形成的扰动,使得响应消息传递稳定性不高;详细而言,噪声信号形成的扰动让经由为了安全考虑而加密的响应消息的解密出现错码的概率高,以此导致通信网的再次传递加密的响应消息,该再次传递加密的响应消息是其解密出现错码的消息,这种方式就使得一些加密的响应消息须被若干次再次传递来让消息传递的稳定性减弱,以此加大了通信网的消息传递的迟误,也就导致了响应消息的传递速度变慢。
经过改进,用于情感分析的终端与后台终端连接。用于情感分析的终端与后台终端连接的第一种结构为:用于情感分析的终端连接通信模块,通信模块能够是3G通信模块或者4G通信模块,通信模块连接通信网里的路由器,通信网能够是3G网或4G网,该通信网里的路由器与后台终端连接,后台终端能够是计算机或者笔记本电脑,这里用于情感分析的终端能与通信网间构建通信连接,用于情感分析的终端与通信模块能够焊接在一个PCB基板上;通信网里的路由器作为中转路由器,用于情感分析的终端与通信网里的路由器间构成信息传输通道,通信网里的路由器与后台终端间构成信息传输通道。用于情感分析的终端与后台终端连接的第二种结构为:用于情感分析的终端和通信网一里的路由器间构成信息传输通道,通信网一里的路由器和通信网二里的路由器间构成信息传输通道,后台终端与通信网二里的路由器间构成信息传输通道,通信网一里的路由器作为中转路由器。经由设置的最终情绪传感器,能够方便监控人员了解最终情绪的情况,具体而言,就是通过最终情绪传感器把最终情绪信息传输到用于情感分析的终端,用于情感分析的终端能够是单片机、PLC控制器、ARM处理器或者FPGA处理器,再把该最终情绪信息发送到数显屏上显示,以此能让监控人员在数显屏上观察到最终情绪信息,下面步骤里提及的加密级别与加密算法为相应的,就如,如果加密算法是IDEA国际数据加密算法,那么其加密级别是1,如果加密算法是3DES加密算法,那么其加密级别是3,如果加密算法是TEA加密算法,那么其加密级别是5,这样不一样的加密算法有不同的属性,加密级别更小的加密算法加大了更大的运算量使得更为复杂,然而可确保很好的安全性,加密级别更大的加密算法带有更简便的性能然而相对安全性不好;所以下述步骤里经由减小加密级别来确保数据传输的安全性。
所述用于情感分析的终端把最终情绪信息传递到后台终端的方法,包括如下步骤:
步骤1:在用于情感分析的终端要把最终情绪信息传递到后台终端之际,用于情感分析的终端经由通信模块把最终情绪信息凭借信息传输通道传递到后台终端;
步骤2:在后台终端得到最终情绪信息后,就把该最终情绪信息存储在后台终端并显示在后台终端的显示屏上,以此达到传输到用于情感分析的终端的最终情绪信息的备份和远程监视的目的,并对用于情感分析的终端传递获得该最终情绪信息的响应消息。
在用于情感分析的终端与后台终端的连接为第一种结构的条件下,在后台终端把响应消息传递至用于情感分析的终端之际,后台终端经由后台终端与通信网里的路由器间的信息传输通道传递至通信网里的路由器,通信网里的路由器接着经由通信网里的路由器与用于情感分析的终端间的信息传输通道来把响应消息传递至用于情感分析的终端,这样就达成了通信网里的路由器朝用于情感分析的终端传递响应消息的流程。
在用于情感分析的终端与后台终端的连接为第二种结构的条件下,在后台终端把响应消息传递至用于情感分析的终端之际,经由后台终端与通信网二里的路由器间的信息传输通道传递至通信网二里的路由器,通信网二里的路由器接着经由通信网一里的路由器和通信网二里的路由器间的信息传输通道和用于情感分析的终端和通信网一里的路由器间的信息传输通道来把响应消息传递至用于情感分析的终端,以此达成通信网二里的路由器朝通信网一里的路由器传递响应消息的流程。
而用于情感分析的终端、通信网里的路由器和后台终端间传递消息之际所运用的通道被叫做信息传输通道,信息传输通道包括用于最终情绪信息传输的通道与用于响应消息传输的通道。
后台终端把响应消息传递至用于情感分析的终端的方法,包括如下步骤:
步骤A-1:中转路由器收受后台终端传递的要传递至目标方的响应消息;
这里,目标方为用于情感分析的终端或通信网一里的路由器;
中转路由器在后台终端到用于情感分析的终端间传递响应消息的期间起到中转的性能;
步骤A-2:中转路由器在符合信噪比调整要求的条件下,凭借目标方回应的信息传输通道的信噪比值一来认定信噪比值二;
这里,信噪比调整要求包括中转路由器的现下所在的信息传输通道的软硬件运用状态不高于承载限定值,另外信噪比值一位于设定的范畴里;
承载限定值为一设定的比率,比该承载限定值更小就表明中转路由器的能运用的信息传输通道的软硬件更为充足;该承载限定值的设定和中转路由器的承载性能的均值相应,如果中转路由器的承载性能的均值不低,就把该值承载限定值设定的更大,不然该响应消息的传递方式运作就很困难;如果中转路由器的承载性能的均值不高,就把该承载限定值设定的更小,来竭力防止运用该方式对中转路由器现下正和另外的设备的交互构成不利的因素;
就像,设定的范畴为一个以上的信噪比范畴,如果目标方回应的信息传输通道的信噪比值一位于该设定的范畴,就表明在传递响应消息的期间比该信噪比值一相应的加密级别更小的加密算法传递安全性能显著改善;详细的设定方式须凭借使用者的需求而定,该设定的范畴设定的太高,会让传递消息之际整体减小加密级别,使得信息传输通道的软硬件占用率太小;如果设定的范畴设定的太低,会让该响应消息的传递方式不容易运作。
信息传输通道的软硬件的运用状态包括信息传输通道的带宽的占有率、中转路由器的内存的占有率和与中转路由器连接的设备数量。
信噪比调整要求还包括目标方的权值不低于临界值。
就像,目标方的权值为事先设定的,详细而言,即能够用不一样的识别码执行区分;亦能够把全部目标方都设定成大权值目标方,或全部目标方都设定成小权值目标方,亦能够凭借使用者具体的需求而定;这里,大权值目标方与小权值目标方为权值大小而划分的,能够设定低于一临界值的为小权值目标方,大于该临界值的是大权值目标方。
就像,目标方回应的信息传输通道的信噪比值一的达成方式如下:信噪比值一是经同目标方相连的通信模块(该通信模块能够是3G通信模块或4G通信模块)检测通信模块到中转路由器间的信息传输通道的信噪比值一,因为通信模块是与目标方相连的,所以亦能够把信噪比值一当做目标方和中转路由器间的信息传输通道的,接着通信模块径直把信噪比值一传递给中转路由器,或者通信模块把信噪比值一先传递给目标方,经目标方把信噪比值一传递给中转路由器。
这里,信噪比值二相应的加密算法小于信噪比值一相应的加密算法的加密级别。
信噪比值、加密算法以及加密级别间的相应关系为:
信噪比值小于10dB时,相应的加密算法是IDEA国际数据加密算法,相应的加密级别是1;
信噪比值在不小于10dB且小于15 dB时,相应的加密算法是IDEA国际数据加密算法,相应的加密级别是1;
信噪比值在不小于15dB且小于20 dB时,相应的加密算法是IDEA国际数据加密算法,相应的加密级别是1;
信噪比值在不小于20dB且小于25 dB时,相应的加密算法是IDEA国际数据加密算法,相应的加密级别是1;
信噪比值在不小于25dB且小于30 dB时,相应的加密算法是IDEA国际数据加密算法,相应的加密级别是1;
信噪比值在不小于30dB且小于35dB时,相应的加密算法是IDEA国际数据加密算法,相应的加密级别是1;
信噪比值在不小于35dB且小于40dB时,相应的加密算法是3DES加密算法,相应的加密级别是3;
信噪比值在不小于35dB且小于40dB时,相应的加密算法是3DES加密算法,相应的加密级别是3;
信噪比值在不小于40dB且小于45dB时,相应的加密算法是3DES加密算法,相应的加密级别是3;
信噪比值在不小于45dB且小于50dB时,相应的加密算法是TEA加密算法,相应的加密级别是5;
信噪比值在不小于50dB且小于55dB时,相应的加密算法是TEA加密算法,相应的加密级别是5;
信噪比值在不小于55dB且小于60dB时,相应的加密算法是TEA加密算法,相应的加密级别是5;
信噪比值在不小于60dB且小于65dB时,相应的加密算法是TEA加密算法,相应的加密级别是5;
信噪比值在不小于65dB且小于70dB时,相应的加密算法是TEA加密算法,相应的加密级别是5;
信噪比值在不小于70dB时,相应的加密算法是TEA加密算法,相应的加密级别是5。
这样,如果目标方回应的信息传输通道的信噪比值一是63,能得到信噪比值一是63相应的加密算法的加密级别是5,那么认定出的信噪比值二的相应的加密级别就低于5,那么信噪比值二为在小于45dB的范畴里任意选取一个值。
要改善响应消息传递的安全性,该信噪比值二为在不小于35dB且小于45dB为在小于45dB的范畴里任意选取一个值,于是能确保信噪比值二相应的加密算法比信噪比值一相应的加密算法的加密级别低一等。
在确保响应消息传递的安全性且无需减小传递响应消息的比特率,该信噪比值二是44,于是能够让信噪比值二是信噪比值一相应的加密级别的小一等所相应的信噪比值的接近上限值的值。
步骤A-3:中转路由器凭借信噪比值二确定加密算法标识一,且把加密算法标识一传递至目标方;
步骤A-3里径直把该加密算法标识一传递至目标方里,来利于目标方凭借该加密算法标识一相应的解密算法解密响应消息;IDEA国际数据加密算法的加密算法标识一能够是aaa, 3DES加密算法的加密算法标识一能够是bbb, TEA加密算法的加密算法标识一能够是ccc;
步骤A-4:中转路由器凭借加密算法标识一朝目标方传递用该加密算法加密的响应消息。
这样的响应消息的传递方式,中转路由器经由收受后台终端传递的要传递至目标方的响应消息,中转路由器在符合信噪比调整要求的条件下,凭借目标方回应的信息传输通道的信噪比值一来认定信噪比值二;信噪比值二相应的加密算法小于信噪比值一相应的加密算法的加密级别;信噪比调整要求包括中转路由器的现下所在的信息传输通道的软硬件运用状态不高于承载限定值,另外信噪比值一位于设定的范畴里;中转路由器凭借信噪比值二确定加密算法标识一,且把加密算法标识一传递至目标方;中转路由器凭借加密算法标识一朝目标方传递用该加密算法加密的响应消息;因为这类所认定的信噪比值二相应的加密算法比信噪比值一相应的加密算法的加密级别更小,而运用该加密级别更小的加密算法执行加密后的响应消息的传递时安全性更好,抵抗噪声的扰动性能更佳,以此让出现响应消息再次传递的次数减少,亦就减少了响应消息传递的迟误,改善了传递性能。
后台终端把响应消息传递至用于情感分析的终端的方法,还包括:
步骤A-5:在中转路由器的现下信息传输通道的软硬件运用状态高于承载限定值,或者目标方的权值低于临界值,或信噪比值一不在设定的范畴里,凭借目标方回应的信息传输通道的信噪比值一认定加密算法标识二;
步骤A-6:把加密算法标识二传递至目标方,加密算法标识二是除了加密算法标识一代表的加密算法之外的加密算法;
步骤A-7:凭借加密算法标识二朝目标方传递用该加密算法加密的响应消息。
中转路由器,包括中央处理器和与该中央处理器连接的Flash闪存;Flash闪存中包括:收受单元、执行单元和传递单元,这里:收受单元,用来收受后台终端传递的要传递至目标方的响应消息;执行单元,用来在符合信噪比调整要求的条件下,凭借目标方回应的信息传输通道的信噪比值一来认定信噪比值二;这里,信噪比调整要求包括中转路由器的现下所在的信息传输通道的软硬件运用状态不高于承载限定值,另外信噪比值一位于设定的范畴里;执行单元,还用来凭借信噪比值二确定加密算法标识一;传递单元,用来将加密算法标识一传递至目标方。传递单元,还用来凭借加密算法标识一朝目标方传递用该加密算法加密的响应消息。中转路由器经由收受后台终端传递的要传递至目标方的响应消息,中转路由器在符合信噪比调整要求的条件下,凭借目标方回应的信息传输通道的信噪比值一来认定信噪比值二;信噪比值二相应的加密算法小于信噪比值一相应的加密算法的加密级别;信噪比调整要求包括中转路由器的现下所在的信息传输通道的软硬件运用状态不高于承载限定值,另外信噪比值一位于设定的范畴里;中转路由器凭借信噪比值二确定加密算法标识一,且把加密算法标识一传递至目标方;中转路由器凭借加密算法标识一朝目标方传递用该加密算法加密的响应消息;因为这类所认定的信噪比值二相应的加密算法比信噪比值一相应的加密算法的加密级别更小,而运用该加密级别更小的加密算法执行加密后的响应消息的传递时安全性更好,抵抗噪声的扰动性能更佳,以此让出现响应消息再次传递的次数减少,亦就减少了响应消息传递的迟误,改善了传递性能。如果加密算法是IDEA国际数据加密算法,那么其加密级别是1,如果加密算法是3DES加密算法,那么其加密级别是3,如果加密算法是TEA加密算法,那么其加密级别是5。信噪比值二相应的加密算法比信噪比值一对应的加密算法小一等。在信噪比值一相应的加密算法的加密级别是5的条件下,信噪比值二相应的加密算法比信噪比值一相应的加密算法的加密级别小两等,也就是该信噪比值二相应的加密算法的加密级别是1。
这样中转路由器经由收受后台终端传递的要传递至目标方的响应消息,所述中转路由器在符合信噪比调整要求的条件下,凭借目标方回应的信息传输通道的信噪比值一来认定信噪比值二;所述信噪比值二相应的加密算法小于所述信噪比值一相应的加密算法的加密级别;所述信噪比调整要求包括所述中转路由器的现下所在的信息传输通道的软硬件运用状态不高于承载限定值,另外信噪比值一位于设定的范畴里;所述中转路由器凭借信噪比值二确定加密算法标识一,且把加密算法标识一传递至目标方;所述中转路由器凭借加密算法标识一朝目标方传递用该加密算法加密的响应消息;因为这类所认定的信噪比值二相应的加密算法比信噪比值一相应的加密算法的加密级别更小,而运用该加密级别更小的加密算法执行加密后的响应消息的传递时安全性更好,抵抗噪声的扰动性能更佳,以此让出现响应消息再次传递的次数减少,亦就减少了响应消息传递的迟误,改善了传递性能。
以上以用实施例说明的方式对本发明作了描述,本领域的技术人员应当理解,本公开不限于以上描述的实施例,在不偏离本发明的范围的情况下,可以做出各种变化、改变和替换。

Claims (9)

1.一种适应性情感分析系统,包括用于情感分析的终端,其特征在于,所述用于情感分析的终端中包括方面提取模块和情感极性分类模块;
所述方面提取模块用于标识要进行情感分析的文本中的方面;
所述情感极性分类模块对每个识别出的情感极性进行分类。
2.根据权利要求1所述的适应性情感分析系统,其特征在于,所述方面提取模块包括有监督模式的方面提取子模块和无监督模式的方面提取子模块;
所述有监督模式的方面提取子模块和无监督模式的方面提取子模块用于对来自文档集合的需要进行情感分析的文本文档提取其方面;
所述情感极性分类模块包括有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块;
所述有监督模式的情感极性分类子模块和无监督模式的情感极性分类子模块用于对方面和需要进行情感分析的文本文档分别进行预测,各自得到每个方面的情绪。
3.根据权利要求1所述的适应性情感分析系统,其特征在于,所述用于情感分析的终端还包括并集模块和合并模块;
所述并集模块用于通过并集操作方式来合并所提取的方面;
所述合并模块用于合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;
如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:
A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;
B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,则最终情绪为中性。
4.一种适应性情感分析系统的方法,其特征在于,包括两个子任务,分别如下:
(1)方面提取,其标识要进行情感分析的文本中的方面;
(2)情感极性分类,其对每个识别出的情感极性进行分类。
5.根据权利要求4所述的适应性情感分析系统的方法,其特征在于,所述方面提取和情感极性分类均分为有监督模式和无监督模式,具体方式如下:
首先,通过有监督模式的方面提取方法和无监督模式的方面提取方法对来自文档集合的需要进行情感分析的文本文档提取其方面;
接着通过并集操作方式来合并所提取的方面;
所述方面和需要进行情感分析的文本文档由有监督模式的情感极性分类方法和无监督模式的情感极性分类方法分别进行预测,各自得到每个方面的情绪;
然后,合并方面的情绪,所述合并方面的情绪为如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是一致的,则定义该情绪为最终情绪;
如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法在预测该方面的情绪是不一致的,就应用如下两条原则来确定最终情绪:
A.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法其中一种方法预测该方面的情绪是中性,则以另一种方法预测出的情绪为准来作为最终情绪;
B.如果有监督模式的情感极性分类方法和无监督模式的情感极性分类方法这两种方法预测出的情绪相互矛盾,则最终情绪为中性。
6.根据权利要求4所述的适应性情感分析系统的方法,其特征在于,所述适应性情感分析系统可以处理任何语言;
对于所述监督模式,只要可以为特定语言提供训练数据,在此监督模式下的方面提取和基于方面的情感极性分类的方法可以学习如何对文档的情感进行分类,为该语言构建模型;
而对于所述无监督模式。其基于通用依赖分析方式指定的规则,可以将多种语言解析为类似的通用依赖关系表示,然后,该基于通用依赖分析方式指定的规则可以应用于编写多种语言的文档的情感分析预测。
7.根据权利要求4所述的适应性情感分析系统的方法,其特征在于,所述监督模式是基于语言表征模型BERT来实现的;
对于有监督模式的方面提取,能够运用两种基于BERT的方法:
第一种基于BERT的方法称为BERT-NER方法,该方法为:输入文本文档的每个单词被分类为方面或非方面;它能够在句子中找到明确的方面;
第二种基于BERT的方法称为BERT多标签分类方法,该方法将文本文档句子中的方面分类为一个或多个预定义的类。
8.根据权利要求4所述的适应性情感分析系统的方法,其特征在于,对于有监督模式的情绪极性分类,也运用BERT方法进行极性分类。在这种情况下,BERT接收由文本和显式或隐式类的方面组成的双重输入,并将情绪分类为正面,负面或中性类别。
9.根据权利要求4所述的适应性情感分析系统的方法,其特征在于,所述无监督模式包括基于规则的实现;
无监督模式的方面提取是通过处理文本以找到文本中单词的词性,其中词性为名词和复合名词的单词被识别并标记为潜在方面,然后,进行修剪以消除潜在方面列表中的误报,所述修剪包括:删除停用词,意见词,低频词,模糊词以及黑名单词;修剪后剩下的名词被认为是文本的方面;
对于无监督模式的情绪极性分类方法,包括使用情感词典,该情感词典包含带注释的单词及其情绪分数,所述情绪分数范围在[-1,1]之间,其中-1为最负数,1为最正数;此外,文本的语法结构被解析,并且查找依赖关系解析中的意见词和显式方面词之间的关系;通过这些关系,可以分配方面的情绪分数。
CN201910728857.8A 2019-08-08 2019-08-08 一种适应性情感分析系统及其方法 Pending CN110442717A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910728857.8A CN110442717A (zh) 2019-08-08 2019-08-08 一种适应性情感分析系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910728857.8A CN110442717A (zh) 2019-08-08 2019-08-08 一种适应性情感分析系统及其方法

Publications (1)

Publication Number Publication Date
CN110442717A true CN110442717A (zh) 2019-11-12

Family

ID=68433858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910728857.8A Pending CN110442717A (zh) 2019-08-08 2019-08-08 一种适应性情感分析系统及其方法

Country Status (1)

Country Link
CN (1) CN110442717A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737475A (zh) * 2020-07-21 2020-10-02 南京擎盾信息科技有限公司 一种无监督的网络舆情垃圾长文本识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484815A (zh) * 2014-12-18 2015-04-01 刘耀强 基于模糊本体面向产品方面的情感分析方法及系统
CN105550269A (zh) * 2015-12-10 2016-05-04 复旦大学 一种有监督学习的产品评论分析方法及系统
CN108563647A (zh) * 2017-11-29 2018-09-21 重庆邮电大学 一种基于评论情感分析的汽车销量预测方法
US20190130463A1 (en) * 2017-11-02 2019-05-02 Paypal, Inc. Automated analysis of and response to social media
CN109933795A (zh) * 2019-03-19 2019-06-25 上海交通大学 基于上下文-情感词向量的文本情感分析系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484815A (zh) * 2014-12-18 2015-04-01 刘耀强 基于模糊本体面向产品方面的情感分析方法及系统
CN105550269A (zh) * 2015-12-10 2016-05-04 复旦大学 一种有监督学习的产品评论分析方法及系统
US20190130463A1 (en) * 2017-11-02 2019-05-02 Paypal, Inc. Automated analysis of and response to social media
CN108563647A (zh) * 2017-11-29 2018-09-21 重庆邮电大学 一种基于评论情感分析的汽车销量预测方法
CN109933795A (zh) * 2019-03-19 2019-06-25 上海交通大学 基于上下文-情感词向量的文本情感分析系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李然,林政: "文本情绪分析综述", 《计算机研究与发展》 *
马刚: "《基于语义的Web数据挖掘》", 30 January 2014 *
黄家君: "情感分析中的方面类别识别研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737475A (zh) * 2020-07-21 2020-10-02 南京擎盾信息科技有限公司 一种无监督的网络舆情垃圾长文本识别方法
CN111737475B (zh) * 2020-07-21 2021-06-22 南京擎盾信息科技有限公司 一种无监督的网络舆情垃圾长文本识别方法

Similar Documents

Publication Publication Date Title
Volkova et al. Inferring perceived demographics from user emotional tone and user-environment emotional contrast
Choudrie et al. Applying and understanding an advanced, novel deep learning approach: A Covid 19, text based, emotions analysis study
US10621181B2 (en) System and method for screening social media content
US20140365208A1 (en) Classification of affective states in social media
US20140129213A1 (en) Svo-based taxonomy-driven text analytics
Hitesh et al. Real-time sentiment analysis of 2019 election tweets using word2vec and random forest model
Beykikhoshk et al. Overcoming data scarcity of Twitter: using tweets as bootstrap with application to autism-related topic content analysis
Chang et al. Accelerating mixed methods research with natural language processing of big text data
US20210073255A1 (en) Analyzing the tone of textual data
US10600017B2 (en) Co-opetition index based on rival behavior in social networks
Purohit et al. Classifying User Types on Social Media to inform Who-What-Where Coordination during Crisis Response.
CN113591489B (zh) 语音交互方法、装置及相关设备
Lai et al. Detecting summarization hot spots in meetings using group level involvement and turn-taking features
Brooks Human centered tools for analyzing online social data
CN110442717A (zh) 一种适应性情感分析系统及其方法
Elroy et al. Analysis of COVID-19 5G conspiracy theory tweets using SentenceBERT embedding
Schneider et al. Dimensions of argumentation in social media
Almotiri Twitter sentiment analysis during the lockdown on New Zealand
Mircoli et al. Automatic Emotional Text Annotation Using Facial Expression Analysis.
Haghighi et al. Integrating social media with ontologies for real-time crowd monitoring and decision support in mass gatherings
KR20220142705A (ko) 초고속 분석 인공지능을 이용한 실시간 댓글 판단 방법
CN115840796A (zh) 一种事件整合方法、装置、设备及计算机可读存储介质
Bohmann Variation in English world-wide: Varieties and genres in a quantitative perspective
Win et al. AI-based personalized virtual therapist for alcohol relapse
Zishumba Sentiment Analysis Based on Social Media Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191112