CN113468292A - 方面级情感分析方法、装置及计算机可读存储介质 - Google Patents
方面级情感分析方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113468292A CN113468292A CN202110725517.7A CN202110725517A CN113468292A CN 113468292 A CN113468292 A CN 113468292A CN 202110725517 A CN202110725517 A CN 202110725517A CN 113468292 A CN113468292 A CN 113468292A
- Authority
- CN
- China
- Prior art keywords
- feature
- analyzed
- target text
- vector
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 239000013598 vector Substances 0.000 claims abstract description 94
- 238000004458 analytical method Methods 0.000 claims abstract description 36
- 239000011159 matrix material Substances 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 34
- 230000004913 activation Effects 0.000 claims abstract description 29
- 230000002996 emotional effect Effects 0.000 claims abstract description 13
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 32
- 238000010586 diagram Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 9
- 230000007935 neutral effect Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 4
- 230000008901 benefit Effects 0.000 abstract description 8
- 239000010410 layer Substances 0.000 description 29
- 230000000694 effects Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 12
- 238000012549 training Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种方面级情感分析方法、装置及计算机可读存储介质,其中该方法包括:将目标文本提供至卷积神经网络的输入层,得到对应的输入特征矩阵;将输入特征矩阵提供至第一卷积层,得到对应的第一特征图,并采用第一激活函数处理第一特征图,得到第一特征向量,其中,第一特征图体现目标文本的情感特征信息;根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,并采用第二激活函数处理第二特征图,得到第二特征向量,其中,第二特征图体现目标文本与待分析方面的关联信息;根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性。该方法使得模型结构简单,运算量低。
Description
技术领域
本申请属于文本情感分析领域,具体涉及一种方面级情感分析方法、装置及计算机可读存储介质。
背景技术
本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认其为现有技术。
方面级情感分析是分析一段文本的多个方面的情感极性。情感极性一般有积极(也称正面)、消极(也称负面)、中性。
相关技术中,采用长短时间记忆(LSTM)结合注意力机制的卷积神经网络(CNN)进行方面级情感分析。网络结构复杂、参数众多,训练过程耗时。
发明内容
针对上述现有技术的问题,本申请实施例提出了方面级情感分析方法、装置及计算机可读存储介质。利用这种方法及装置,能够至少部分解决上述问题。
本申请的实施例中提供了以下方案:一种方面级情感分类方法,包括:
将目标文本提供至卷积神经网络的输入层,得到对应的输入特征矩阵;
将输入特征矩阵提供至第一卷积层,得到对应的第一特征图,并采用第一激活函数处理第一特征图,得到第一特征向量,其中,第一特征图体现目标文本的情感特征信息;
根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,并采用第二激活函数处理第二特征图,得到第二特征向量,其中,第二特征图体现目标文本与待分析方面的关联信息;
根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性。
本申请的实施例中提供了以下方案:一种方面级情感分类装置,包括:
目标文本处理模块,用于将目标文本提供至卷积神经网络的输入层,得到对应的输入特征矩阵;
情感特征提取模块,用于将输入特征矩阵提供至第一卷积层,得到对应的第一特征图,并采用第一激活函数处理第一特征图,得到第一特征向量,其中,第一特征图体现目标文本的情感特征信息;
方面特征提取模块,用于根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,并采用第二激活函数处理第二特征图,得到第二特征向量,其中,第二特征图体现目标文本与待分析方面的关联信息;
情感极性分析模块,用于根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性。
本申请的实施例中提供了以下方案:一种方面级情感分类装置,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:前述的方面级情感分析方法。
本申请的实施例中提供了以下方案:一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器执行前述的方面级情感分析方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:生成第二特征图的过程相当于一个门控的过程。如果目标文本与待分析方面具有较大的关联,则情感特征信息会被传递到后续计算步骤,从而计算得到目标文本对于这个待分析方面的情感极性是积极、消极还是中性。如果目标文本与待分析方面关联很弱,则情感特征信息不会传递到后续计算步骤,从而能够确定出目标文本对于待分析方面的情感极性是未提及(也即是无关)。如此,可以实现对目标文本对于每一个待分析方面的情感极性,处理过程高效准确,网络结构简单且计算量低,并且网络参数的训练成本低。
进一步,该方法对于待分析方面的方面数量没有约束,有助于用户挖掘详细的信息,有助于产品和服务的优化。
应当理解,上述说明仅是本申请技术方案的概述,以便能够更清楚地了解本申请的技术手段,从而可依照说明书的内容予以实施。为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举例说明本申请的具体实施方式。
附图说明
通过阅读下文的示例性实施例的详细描述,本领域普通技术人员将明白本文所述的优点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的标号表示相同的部件。在附图中:
图1为根据本申请一实施例的方面级情感分析方法的流程示意图;
图2为根据本申请一实施例的方面特征值的生成方法的流程示意图;
图3为根据本申请一实施例的卷积神经网络的结构示意图;
图4为根据本申请一实施例的方面级情感分析装置的结构示意图;
图5为根据本申请另一实施例的方面级情感分析装置的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本申请中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。
另外还需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1为根据本申请一实施例的方法的流程示意图,该方法用于,在该流程中,从设备角度而言,执行主体可以是一个或者多个电子设备,更具体地可以是其中的处理模块;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。
图1中的流程可以包括以下步骤101~步骤104。
步骤101、将目标文本提供至卷积神经网络的输入层,得到对应的输入特征矩阵。
目标文本即待分析的文本。以下以“满减优惠还是很足的,就是名额太少了。”这句评论作为目标文本的示例。
通常,对目标文本进行繁简转换、过滤和分词的操作。
具体地,繁简转换步骤中,使用zhconv工具包将繁体字转换为简体字。这个工具包提供基于MediaWiki词汇表的最大正向匹配繁简转换。
过滤步骤中,使用了哈工大停用词数据库来对语料数据进行清洗。
分词步骤中,使用word2vec语言模型对语料进行分词处理。当然,也可以采用GloVe模型进行分词。该步骤中同时得到各个词的词向量。
传统方式中,本领域技术人员采用词向量构成的矩阵来表示一句话。但是只用词向量的话,如碰到某一个单词不属于预设词库的情况下,这个词对应的词向量会设置为0向量,导致这个词所包含的信息被忽略。同时,中文的“字”本身会有一定的信息,故在本申请的一些实施例中,采用词向量和字向量共同来表示一个词,能够保存目标文本的完整信息,进而更准确的分析情感极性。
目标文本的每一个词对应于输入特征矩阵中的一个词向量以及这个词中每一个字的字向量,其中,词向量和字向量的维度相同。
具体地,可以采用skip-gram模型处理字向量。
“满减优惠还是很足的”这个分句的表达为:
[W2V(满减);
W2V(满);
W2V(减);
W2V(活动);
W2V(活);
W2V(动);
W2V(还是);
W2V(满);
W2V(还);
W2V(是);
W2V(很大的);
W2V(很);
W2V(大);
W2V(的);]。
步骤102、将输入特征矩阵提供至第一卷积层,得到对应的第一特征图,并采用第一激活函数处理第一特征图,得到第一特征向量,其中,第一特征图体现目标文本的情感特征信息。
第一卷积层的作用是提取目标文本的情感特征。第一卷积层可以是单层输出的,也可以是多层输出的。
如果第一卷积层是单层输出的,则第一特征图为一个向量。进而采用第一激活函数处理第一特征图得到一个第一特征向量。
如果第一卷积层是多层输出的,则第一特征图为一个矩阵。进而采用第一激活函数处理第一特征图得到多个第一特征向量。
第一激活函数例如是Tanh激活函数。
具体地,采用Tanh激活函数分别第一特征图中的每一个数据点进行非线性变换。
第一卷积层可以是常规的卷积层的结构,其参数优化过程简单。
步骤103、根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,并采用第二激活函数处理第二特征图,得到第二特征向量,其中,第二特征图体现目标文本与待分析方面的关联信息。
第二特征图表示的是目标文本与待分析方面关联程度的大小。如果目标文本与待分析方面的关联程度很低,参数优化的结果应当是第一特征向量的信息不会传递到后续情感极性分类的步骤中;换言之,后续的计算步骤会判定目标文本不涉及当前的待分析方面。
例如,第二激活函数采用ReLU激活函数。这是因为ReLU激活函数的输出值为0到1,便于体现目标文本与待分析方面关联程度的强弱。
具体地,采用ReLU激活函数分别第二特征图中的每一个数据点进行非线性变换。
如第二特征图是一个向量,则对应得到一个第二特征向量。
如第二特征图是一个矩阵,则对应得到多个第二特征向量。
步骤104、根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性。
第二特征向量相当于一个门控的信号。
若目标文本涉及待分析方面,则第一特征向量所包含的信息会在步骤104中进行分析处理。进而判断目标文本对于待分析方面的情感极性是积极、消极还是中性。
以上处理过程高效准确,网络结构简单且计算量低,并且网络参数的训练成本低。进一步,该方法对于待分析方面的方面数量没有约束,有助于用户挖掘详细的信息,有助于产品和服务的优化。
具体而言,第一、该方法实现多标签细粒度情感分析。相比传统二分类或者三分类的意见挖掘和情绪分析,细粒度方面的情绪分析能够比传统情绪分析提供更详细的信息与数据,帮助企业更好地理解用户评论,有针对性地对活动和产品进行优化改进。
第二、方面特征信息更准确。通过多个分类器(处理一个待分析方面的模型即为一个分类器)的迭代训练,得到隐含的重要特征信息,特征提取更准确。
第三、分类模型更高效准确。已有的大部分方法都是利用LSTM和注意力机制进行建模,但二者时间复杂度很高。本申请构建了一个门控机制CNN的网络模型,可以选择性的抽取目标文本与待分析方面相关的情感信息,运行效率得到显著提升。
基于图1的方面级情感分析方法,本申请的一些实施例还提供了该方法的一些具体实施方案,以及扩展方案,下面进行说明。
在一些实施例中,根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,包括:分别将第一特征图中每一个数据点与待分析方面的方面特征值进行加法运算,所得的和作为第二特征图中对应坐标的数据点,其中,待分析方面的方面特征信息为方面特征值。
如第一特征图为一个向量,则第一特征图的每个数据点为该向量的一个分量。如第一特征图为一个矩阵,则第一特征图中的每一个数据点为该矩阵的一个元素。
也即是经过模型训练,每一个待分析方面对应一个方面特征值,当第一特征图中每一个数据点与一个方面特征值相加之后,如果目标文本不涉及待分析方面,则第二特征向量中每一个分量应当是为0或者接近为0的。
以“满减优惠还是很足的,就是名额太少了。”这句评论作为目标文本为例,如待分析方面为优惠力度,那么“就是名额太少了”这部分内容在第二特征向量中对应的部分数值应为0或接近为0,从而这部分信息对目标文本在优惠力度这个方面的情感极性的分析没有影响。
在一些实施例中,参考图2,待分析方面的方面特征值按照如下方式确定:
步骤201、按照优先级从大到小从待分析方面所对应的关键词中挑选设定数量的关键词;
步骤202、将挑选出的关键词按照优先级从大到小的顺序连接成待分析方面所对应的特征句;
步骤203、将待分析方面所对应的特征句映射为方面特征矩阵;
步骤204、将方面特征矩阵提供至第二卷积层,得到待分析方面的方面特征值,其中,第二卷积层的层数为1,且卷积核的尺寸与方面特征矩阵的尺寸相等。
也即是将待分析方面的特征词构成一个非常长的句子,然后对这个句子执行一次卷积运算,得到对应待分析方面的方面特征值。
在一个促销活动的情感分析任务中,参考下表,分别对优惠力度、优惠名额、产品体验、客户服务、活动时间这几个方面进行关键词的排序。关键词后边的数字表示该关键字的重要程度(或者出现的频次)。
那么优惠活动这个方面对应的特征句为:“活动银联10优惠随机5030抠门最高便宜几天感觉100五折300大方现在立减良心价格。”
为了得到每一个待分析方面的方面特征词,可以对原始的评价数据运行一个LightGBM的二分类器。如果要分析17个方面,则要运行17个二分类器。通过“是否包含方面”进行二分类训练,训练完成后可得到对应特征词。
在一些实施例中,根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性,包括:
将第一特征向量与第二特征向量执行点积运算,得到中间特征向量;
将中间特征向量输入池化层,并由全连接层处理池化层的输出,由softmax分类器处理全连接层的输出以得到对应于待分析方面的情感极性。
具体地,彼此对应的第一特征向量和第二特征向量均对应于同一个二维的卷积核。彼此对应的第一特征向量和第二特征向量进行点积运算,得到的结果作为中间特征向量的一个分量。
模型优化的目标应当是,如果目标文本涉及待分析方面,则中间特征向量非0;如果目标文本不涉及待分析方面,则中间特征向量为0或趋近于0向量;如果目标文本的某一个分句或某一个句子不涉及待分析方面,则这部分句子对应于中间特征向量的位置处的分量的取值为0或趋近于0。
本申请对池化层、全连接层的结构不作限定。
本领域技术人员可以在以上卷积神经网络的基础上进行其他修改,例如增加其他的层结构。例如在以上模型的基础上,在输入部分或者在输出部分增加长短时间记忆模型。
参考图3,对于目标文本的方面A进行情感极性分析时,方面特征信息为方面A的特征信息;对于目标文本的方面B进行情感极性分析时,方面特征信息为方面B的特征信息;以此类推。也就是对于不同的待分析方面,方面特征信息是不同的。
以下介绍一个实际的应用例子。发明人在一台个人电脑上运行将上述方面级情感分析方法,进而对营销活动评价数据进行分析。
第一步、营销评价数据集构建。
本实施例选择“62、公交、加油、话费”4个较大型的营销活动主题。每个主题包含多个营销活动。例如“62”活动主题包含有“移动能能够专享:银联云闪付2020年银联62节”、“银联云闪付:银联62节优惠攻略指南”等。在“什么值得买”网站爬取2020年银联营销活动评论的文本数据。文本数据样例如下:
使用文本相似度、关键词匹配等方式,同2020年银联营销活动列表做匹配。具体地讲,从2020年43947个活动中匹配了564个营销活动。四个主题分别有143、138、301、295条评论,其他主题212。未匹配数据约5000条。未匹配的数据将作为训练集,按照构建的标签体系进行数据标注。
第二步、数据预处理。
对于匹配和未匹配数据均进行数据预处理。
(1)繁简转换。
使用zhconv工具将繁体字转换为简体字,这个工具提供基于MediaWiki词汇表的最大正向匹配简繁转换。
(2)过滤。
在这里使用了哈工大停用词数据库来对语料数据进行清洗;
(3)分词。
使用word2vec语言模型对语料进行分词处理。我们使用skip-gram模型,分别对字、词向量进行语言模型的处理。
第三步、细粒度情感分析。
首先使用标注的训练集进行模型训练,得到细粒度情感分析模型。
使用训练好的模型进行匹配的营销数据的情感预测。以“加油”营销主题的评论文本“宁波有,但是有限制加油站,太远”为例,分别将优惠力度、优惠名额等方面特征信息同句子一起输入模型,得到各个方面的情感信息,如下:
其中,1表示积极情感极性,0表示中性情感极性,-1表示消极情感极性,-2表示未提及。当目标文本缺少某一维度的评价信息时,采用“未提及”标签进行填充。
可以看出该评论文本,在“限制条件”、“活动商户”方面情感极性为负,在“活动地区”方面情感极性为正。同样的我们对所有匹配数据均进行细粒度情感分析,得到结果。
第四步、营销活动分析。
四个营销主题的评论文本均完成情感标注,我们对其进行整体的活动分析。按照标签的大类维度来分,我们得到四个活动的整体情感分数。可通过雷达图的方式直观看出每个优惠活动在哪一个方面得分较高,在哪一个方面得分较低。
进一步的,我们分析了对活动规则不满的原因及对覆盖范围不满的城市,结果如下:
可以看出,方面级的情感分析可以带来更细粒度的营销活动评价。使企业更好了解用户对不同类别的情感划分,进而了解产品和活动的特性与口碑,协助品牌市场推广策略的优化,带来可观的市场回报和高度的品牌黏度。
基于相同的技术构思,本申请实施例还提供一种方面级情感分析装置,用于执行上述任一实施例所提供的方面级情感分析方法。图4为本申请实施例提供的一种方面级情感分析装置结构示意图。
如图4所示,方面级情感分析装置包括:
目标文本处理模块1,用于将目标文本提供至卷积神经网络的输入层,得到对应的输入特征矩阵;
情感特征提取模块2,用于将输入特征矩阵提供至第一卷积层,得到对应的第一特征图,并采用第一激活函数处理第一特征图,得到第一特征向量,其中,第一特征图体现目标文本的情感特征信息;
方面特征提取模块3,用于根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,并采用第二激活函数处理第二特征图,得到第二特征向量,其中,第二特征图体现目标文本与待分析方面的关联信息;
情感极性分析模块4,用于根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性。
在一些实施例中,目标文本的每一个词对应于输入特征矩阵中的一个词向量以及这个词中每一个字的字向量,其中,词向量和字向量的维度相同。
在一些实施例中,第二激活函数采用ReLU激活函数。
在一些实施例中,方面特征提取模块3具体用于:分别将第一特征图中每一个数据点与待分析方面的方面特征值进行加法运算,所得的和作为第二特征图中对应坐标的数据点,其中,待分析方面的方面特征信息为方面特征值。
在一些实施例中,待分析方面的方面特征值按照如下方式确定:
按照优先级从大到小从待分析方面所对应的关键词中挑选设定数量的关键词;
将挑选出的关键词按照优先级从大到小的顺序连接成成待分析方面所对应的特征句;
将待分析方面所对应的特征句映射为方面特征矩阵;
将方面特征矩阵提供至第二卷积层,得到待分析方面的方面特征值,其中,第二卷积层的层数为1,且卷积核的尺寸与方面特征矩阵的尺寸相等。
在一些实施例中,情感极性分析模块4具体用于:
将第一特征向量与第二特征向量执行点积运算,得到中间特征向量;
将中间特征向量输入池化层,并由全连接层处理池化层的输出,由softmax分类器处理全连接层的输出以得到对应于待分析方面的情感极性。
需要说明的是,本申请实施例中的方面级情感分类装置可以实现前述方面级情感分类方法的实施例的各个过程,并达到相同的效果和功能,这里不再赘述。
图5为根据本申请一实施例的装置,用于执行图1所示出的方面级情感分类方法,该方面级情感分类装置包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:前述方面级情感分类。
根据本申请的一些实施例,提供了方法的非易失性计算机存储介质,其上存储有计算机可执行指令,该计算机可执行指令设置为在由处理器运行时执行:前述方面级情感分类。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以其描述进行了简化,相关之处可参见方法实施例的部分说明即可。
本申请实施例提供的装置和计算机可读存储介质与方法是一一对应的,因此,装置和计算机可读存储介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置和计算机可读存储介质的有益技术效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本申请的精神和原理,但是应该理解,本申请并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本申请旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (16)
1.一种方面级情感分析方法,其特征在于,包括:
将目标文本提供至卷积神经网络的输入层,得到对应的输入特征矩阵;
将输入特征矩阵提供至第一卷积层,得到对应的第一特征图,并采用第一激活函数处理第一特征图,得到第一特征向量,其中,第一特征图体现目标文本的情感特征信息;
根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,并采用第二激活函数处理第二特征图,得到第二特征向量,其中,第二特征图体现目标文本与待分析方面的关联信息;
根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性。
2.根据权利要求1所述的方法,其特征在于,目标文本的每一个词对应于输入特征矩阵中的一个词向量以及这个词中每一个字的字向量,其中,词向量和字向量的维度相同。
3.根据权利要求1所述的方法,其特征在于,第二激活函数采用ReLU激活函数。
4.根据权利要求1所述的方法,其特征在于,根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,包括:分别将第一特征图中每一个数据点与待分析方面的方面特征值进行加法运算,所得的和作为第二特征图中对应坐标的数据点,其中,待分析方面的方面特征信息为方面特征值。
5.根据权利要求4所述的方法,其特征在于,待分析方面的方面特征值按照如下方式确定:
按照优先级从大到小从待分析方面所对应的关键词中挑选设定数量的关键词;
将挑选出的关键词按照优先级从大到小的顺序连接成成待分析方面所对应的特征句;
将待分析方面所对应的特征句映射为方面特征矩阵;
将方面特征矩阵提供至第二卷积层,得到待分析方面的方面特征值,其中,第二卷积层的层数为1,且卷积核的尺寸与方面特征矩阵的尺寸相等。
6.根据权利要求1所述的方法,其特征在于,根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性,包括:
将第一特征向量与第二特征向量执行点积运算,得到中间特征向量;
将中间特征向量输入池化层,并由全连接层处理池化层的输出,由softmax分类器处理全连接层的输出以得到对应于待分析方面的情感极性。
7.根据权利要求1所述的方法,其特征在于,目标文本的情感极性为:积极、消极、中性和未提及中的一项。
8.一种方面级情感分类装置,其特征在于,包括:
目标文本处理模块,用于将目标文本提供至卷积神经网络的输入层,得到对应的输入特征矩阵;
情感特征提取模块,用于将输入特征矩阵提供至第一卷积层,得到对应的第一特征图,并采用第一激活函数处理第一特征图,得到第一特征向量,其中,第一特征图体现目标文本的情感特征信息;
方面特征提取模块,用于根据待分析方面的方面特征信息处理第一特征图,得到第二特征图,并采用第二激活函数处理第二特征图,得到第二特征向量,其中,第二特征图体现目标文本与待分析方面的关联信息;
情感极性分析模块,用于根据第一特征向量和第二特征向量判断目标文本对应于待分析方面的情感极性。
9.根据权利要求8所述的装置,其特征在于,目标文本的每一个词对应于输入特征矩阵中的一个词向量以及这个词中每一个字的字向量,其中,词向量和字向量的维度相同。
10.根据权利要求8所述的装置,其特征在于,第二激活函数采用ReLU激活函数。
11.根据权利要求8所述的装置,其特征在于,方面特征提取模块具体用于:分别将第一特征图中每一个数据点与待分析方面的方面特征值进行加法运算,所得的和作为第二特征图中对应坐标的数据点,其中,待分析方面的方面特征信息为方面特征值。
12.根据权利要求11所述的装置,其特征在于,待分析方面的方面特征值按照如下方式确定:
按照优先级从大到小从待分析方面所对应的关键词中挑选设定数量的关键词;
将挑选出的关键词按照优先级从大到小的顺序连接成成待分析方面所对应的特征句;
将待分析方面所对应的特征句映射为方面特征矩阵;
将方面特征矩阵提供至第二卷积层,得到待分析方面的方面特征值,其中,第二卷积层的层数为1,且卷积核的尺寸与方面特征矩阵的尺寸相等。
13.根据权利要求8所述的装置,其特征在于,情感极性分析模块具体用于:
将第一特征向量与第二特征向量执行点积运算,得到中间特征向量;
将中间特征向量输入池化层,并由全连接层处理池化层的输出,由softmax分类器处理全连接层的输出以得到对应于待分析方面的情感极性。
14.根据权利要求8所述的装置,其特征在于,目标文本的情感极性为:积极、消极、中性和未提及中的一项。
15.一种方面级情感分类装置,其特征在于,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:根据权利要求1至7任意一项所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器执行:根据权利要求1至7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110725517.7A CN113468292B (zh) | 2021-06-29 | 2021-06-29 | 方面级情感分析方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110725517.7A CN113468292B (zh) | 2021-06-29 | 2021-06-29 | 方面级情感分析方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113468292A true CN113468292A (zh) | 2021-10-01 |
CN113468292B CN113468292B (zh) | 2024-06-25 |
Family
ID=77873912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110725517.7A Active CN113468292B (zh) | 2021-06-29 | 2021-06-29 | 方面级情感分析方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113468292B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120179692A1 (en) * | 2011-01-12 | 2012-07-12 | Alexandria Investment Research and Technology, Inc. | System and Method for Visualizing Sentiment Assessment from Content |
CN107025284A (zh) * | 2017-04-06 | 2017-08-08 | 中南大学 | 网络评论文本情感倾向的识别方法及卷积神经网络模型 |
CN109597997A (zh) * | 2018-12-07 | 2019-04-09 | 上海宏原信息科技有限公司 | 基于评论实体、方面级情感分类方法和装置及其模型训练 |
WO2019097236A1 (en) * | 2017-11-15 | 2019-05-23 | X-System Limited | Method and system for categorizing musical sound according to emotions |
CN109992779A (zh) * | 2019-03-29 | 2019-07-09 | 长沙理工大学 | 一种基于cnn的情感分析方法、装置、设备及存储介质 |
WO2019200806A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
WO2019214145A1 (zh) * | 2018-05-10 | 2019-11-14 | 平安科技(深圳)有限公司 | 文本情绪分析方法、装置及存储介质 |
CN110502626A (zh) * | 2019-08-27 | 2019-11-26 | 重庆大学 | 一种基于卷积神经网络的方面级情感分析方法 |
CN111881291A (zh) * | 2020-06-19 | 2020-11-03 | 山东师范大学 | 一种文本情感分类方法及系统 |
CN111985205A (zh) * | 2020-08-05 | 2020-11-24 | 重庆大学 | 一种方面级情感分类模型 |
CN112163091A (zh) * | 2020-09-25 | 2021-01-01 | 大连民族大学 | 基于cnn的方面级跨领域情感分析方法 |
CN112231478A (zh) * | 2020-10-22 | 2021-01-15 | 电子科技大学 | 基于bert和多层注意力机制的方面级情感分类方法 |
CN112347248A (zh) * | 2020-10-30 | 2021-02-09 | 山东师范大学 | 一种方面级文本情感分类方法及系统 |
CN112633010A (zh) * | 2020-12-29 | 2021-04-09 | 山东师范大学 | 基于多头注意力和图卷积网络的方面级情感分析方法及系统 |
-
2021
- 2021-06-29 CN CN202110725517.7A patent/CN113468292B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120179692A1 (en) * | 2011-01-12 | 2012-07-12 | Alexandria Investment Research and Technology, Inc. | System and Method for Visualizing Sentiment Assessment from Content |
CN107025284A (zh) * | 2017-04-06 | 2017-08-08 | 中南大学 | 网络评论文本情感倾向的识别方法及卷积神经网络模型 |
WO2019097236A1 (en) * | 2017-11-15 | 2019-05-23 | X-System Limited | Method and system for categorizing musical sound according to emotions |
WO2019200806A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
WO2019214145A1 (zh) * | 2018-05-10 | 2019-11-14 | 平安科技(深圳)有限公司 | 文本情绪分析方法、装置及存储介质 |
CN109597997A (zh) * | 2018-12-07 | 2019-04-09 | 上海宏原信息科技有限公司 | 基于评论实体、方面级情感分类方法和装置及其模型训练 |
CN109992779A (zh) * | 2019-03-29 | 2019-07-09 | 长沙理工大学 | 一种基于cnn的情感分析方法、装置、设备及存储介质 |
CN110502626A (zh) * | 2019-08-27 | 2019-11-26 | 重庆大学 | 一种基于卷积神经网络的方面级情感分析方法 |
CN111881291A (zh) * | 2020-06-19 | 2020-11-03 | 山东师范大学 | 一种文本情感分类方法及系统 |
CN111985205A (zh) * | 2020-08-05 | 2020-11-24 | 重庆大学 | 一种方面级情感分类模型 |
CN112163091A (zh) * | 2020-09-25 | 2021-01-01 | 大连民族大学 | 基于cnn的方面级跨领域情感分析方法 |
CN112231478A (zh) * | 2020-10-22 | 2021-01-15 | 电子科技大学 | 基于bert和多层注意力机制的方面级情感分类方法 |
CN112347248A (zh) * | 2020-10-30 | 2021-02-09 | 山东师范大学 | 一种方面级文本情感分类方法及系统 |
CN112633010A (zh) * | 2020-12-29 | 2021-04-09 | 山东师范大学 | 基于多头注意力和图卷积网络的方面级情感分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113468292B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alaparthi et al. | Bidirectional Encoder Representations from Transformers (BERT): A sentiment analysis odyssey | |
CN110162627B (zh) | 数据增量方法、装置、计算机设备及存储介质 | |
CN111767741B (zh) | 一种基于深度学习和tfidf算法的文本情感分析方法 | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
CN108446271B (zh) | 基于汉字部件特征的卷积神经网络的文本情感分析方法 | |
CN110619044B (zh) | 一种情感分析方法、系统、存储介质及设备 | |
CN108255813B (zh) | 一种基于词频-逆文档与crf的文本匹配方法 | |
CN111783993A (zh) | 智能标注方法、装置、智能平台及存储介质 | |
CN110489523B (zh) | 一种基于网购评价的细粒度情感分析方法 | |
CN108509415B (zh) | 一种基于词序加权的句子相似度计算方法 | |
CN106649282A (zh) | 基于统计的机器翻译方法、装置及电子设备 | |
Mekala et al. | Classifying user requirements from online feedback in small dataset environments using deep learning | |
CN110879938A (zh) | 文本情感分类方法、装置、设备和存储介质 | |
CN110597966A (zh) | 自动问答方法及装置 | |
CN111339260A (zh) | 一种基于bert和qa思想的细粒度情感分析方法 | |
CN112800184B (zh) | 基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法 | |
CN113297365A (zh) | 一种用户意向判定方法、装置、设备及存储介质 | |
US9563847B2 (en) | Apparatus and method for building and using inference engines based on representations of data that preserve relationships between objects | |
US20230121404A1 (en) | Searching for normalization-activation layer architectures | |
CN111078874B (zh) | 基于随机子空间的决策树分类的对外汉语难度评估方法 | |
CN117131155A (zh) | 多类目识别方法、装置、电子设备及储存介质 | |
CN109635289B (zh) | 词条分类方法及审计信息抽取方法 | |
CN110851600A (zh) | 基于深度学习的文本数据处理方法及装置 | |
CN110717029A (zh) | 一种信息处理方法和系统 | |
CN110287396A (zh) | 文本匹配方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |