CN112561718A - 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法 - Google Patents

基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法 Download PDF

Info

Publication number
CN112561718A
CN112561718A CN202011275960.0A CN202011275960A CN112561718A CN 112561718 A CN112561718 A CN 112561718A CN 202011275960 A CN202011275960 A CN 202011275960A CN 112561718 A CN112561718 A CN 112561718A
Authority
CN
China
Prior art keywords
microblog
evaluation
evaluation object
bilstm
comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011275960.0A
Other languages
English (en)
Inventor
余正涛
王静赟
相艳
黄于欣
郭军军
线岩团
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202011275960.0A priority Critical patent/CN112561718A/zh
Publication of CN112561718A publication Critical patent/CN112561718A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,属于自然语言处理技术领域。本发明首先通过建立输入分别为案件微博评论和案件微博评价对象的双向BiLSTM分类模型,同时利用权重共享将两个不同空间的向量映射到同一个向量空间上,在同一向量空间上对不同向量进行编码,可以得到案件微博评论和评价对象的相关信息;最后结合注意力机制提高特征向量的表达能力,进行情感倾向性判别。本发明解决了目前案件微博评价对象情感倾向性分析基本都是通过对评价对象和评论文本分别进行编码,然后再输入到模型进行评价对象级别的情感倾向性分析,并没有考虑到这两种信息之间的差异性的问题。

Description

基于BiLSTM权重共享的案件微博评价对象情感倾向性分析 方法
技术领域
本发明涉及基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,属于自然语言处理技术领域。
背景技术
情感倾向性分析是指对文本进行积极、消极、中性等类别的判断,细粒度情感分析是细粒度的情感分析一般指词汇级情感分析,也就是评价对象。案件微博评论数据存在表述不清晰、主语不明确等特点。往往在同一个评论里有一个或多个评价对象,而且每个评价对象的极性也是不相同的。不能单纯地通过情感词语来轻易判断情感极性,需要更细粒度的情感分析。如何基于案件微博评价对象对评论进行细粒度的情感分析,准确快捷地判别评论信息中评价对象对应的评价极性,利用案件信息正确地引导舆论走向,是一项极其有价值的工作。
发明内容
本发明提供了基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,以用于解决现有方法大多利用上下文为评价对象构造特征,在一个句子中存在多个评价对象的情况会因不同评价对象的特征较相近导致分类结果不准确等问题。
本发明的技术方案是:基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,所述方法包括:
Step1、收集用于案件微博评价对象情感倾向性分析的微博评论文本,对微博评论文本进行去重与筛选;
进一步地,所述Step1中,使用Scrapy作为爬取工具,收集用于案件微博评价对象情感倾向性分析的微博评论文本。
此优选方案设计是本发明的重要组成部分,主要为本发明收集语料过程,为本发明分析案件微博评价对象情感倾向性提供了数据支撑。
Step2、定制案件微博评价对象情感倾向性分析的标注体系,标记微博评论文本,将标记好的微博评论语料按照4:1的比例分配训练语料和测试语料;
Step3、获取评论语句对应的词向量和评价对象对应的词向量,训练数据经过预处理后作为具有权重共享的BiLSTM的输入;
Step4、采用权重共享的BiLSTM获取评论和评价对象的语义特征,训练案件微博评价对象情感倾向性分析模型;
Step5、将评价对象对应的隐含层输出向量进行mean pooling(平均池化)得到代表评价对象的向量,然后将末尾的隐含层的输出向量进行连接操作,结合注意力机制得到最终的特征表达,输入到softmax分类器,用于进行情感倾向性分析。
进一步地,所述步骤Step2的具体步骤为:
Step2.1、定制的案件微博评价对象情感倾向性分析的标注体系采用了XML的可扩展标记语言组织文本,分别针对评价对象文本、评价对象的开始位置、评价对象的结束位置、评价对象的情感极性对收集到的微博评论文本进行标记;
Step2.2、再将实验数据分为训练语料和测试语料。
本发明使用的数据集为人工标注共2379条案件微博评论,标注内容为案件微博评论句中的评价对象以及对应的情感极性,分别是A和B两个数据集。
此优选方案设计是本发明的重要组成部分,主要为本发明提供语料预处理过程,为后续工作提供模型训练时所需训练语料和为模型测试时提供测试语料;并且为本发明分析案件微博评价对象情感倾向性提供了支撑和挖掘的对象。
进一步地,所述步骤Step3包括:在嵌入层中用word2vec词向量模型对案件微博评论和评价对象进行表征,得到评论语句对应的词向量和评价对象对应的词向量。
模型输入如图2所示,
Figure RE-GDA0002933935960000021
Figure RE-GDA0002933935960000022
分别是评论语句对应的词向量和评价对象对应的词向量,其中,m代表组成评论语句词的个数,r是评价对象的个数。
此优选方案设计是本发明的重要组成部分,主要为本发明提供向量编码的过程。
作为本发明的优选方案,本发明利用权重共享的BiLSTM将两个不同空间的向量映射到同一个向量空间上,在同一向量空间上对不同向量进行编码,然后结合注意力机制提高特征向量的表达能力,进行情感倾向性判别,其中:
所述步骤Step4的具体步骤:
Step4.1、训练数据经过预处理后,输入到具有权重共享的BiLSTM中;
Step4.2、将案件微博评论句和评价对象的向量映射到同一个空间维度上,通过双向长短时记忆网络能够获取句子中潜在的语义信息,由一个前向的LSTM网络层和后向的LSTM网络层组成;
Step4.3、利用双向长短时记忆网络中的门结构单元对句子信息进行选择性记忆。
进一步地,所述步骤Step5的具体步骤为:
Step5.1、单独对评价对象对应的隐含层输出向量进行mean pooling,得到的结果拼接到评论句的每个词向量中,以获得每个词的最终上下文语义表示,最终输出的向量将作为下一步注意力机制层的输入;
Step5.2、结合注意力机制,通过计算对句子语义重要的信息,滤掉与句子无关的信息,突出评价对象作为关键信息在整体句子中的重要程度,增强关键特征所携带的特征信息,得到最终的特征表达;
Step5.3、将最终的特征表达输入到softmax分类器中,决策出最大概率的类别,得到评论句最终的情感极性;其中情感极性的标签是分为三个,分别是积极、中立和消极。
作为本发明的优选方案,所述权重共享的BiLSTM包括编码层和注意力机制层;
所述BiLSTM:
训练数据经过预处理后,输入到具有权重共享的BiLSTM中,将案件微博评论句和评价对象的向量映射到同一个空间维度上,通过双向长短时记忆网络能够获取句子中潜在的语义信息,由一个前向的LSTM网络层和后向的LSTM网络层组成。利用双向长短时记忆网络中的门结构单元对句子信息进行选择性记忆。在输入层表示的向量经过LSTM网络层的过程中,在时间步骤时会按公式式(1)-式(5)计算输入门、遗忘门和输出门的隐藏状态和单独完整LSTM网络层的输出状态值,表达式如下:
it=σ(Wiht-1+Vixt+bi) (1)
ft=σ(Wfht-1+Vfxt+bf) (2)
c=tanh(Wcht-1+Vcxt+bc) (3)
ot=σ(Woht-1+Voxt+bo) (4)
ht=ot tanh(ct) (5)
其中σ表示的是sigmoid激活函数,ct表示的是当前单元的细胞状态值。Wx和Vx (x=i,o,f,c)分别表示输入门、遗忘门和输出门以及所在的单元状态所对应的权重参数,bx(x=i,o,f,c)分别表示所对应的偏置项。通过前向LSTM层和后向LSTM层计算的单元隐藏状态分别为
Figure RE-GDA0002933935960000031
Figure RE-GDA0002933935960000032
两个隐藏单元状态向量按公式(6)结合,案件微博评论句和评价对象的输出向量分别表示为
Figure RE-GDA0002933935960000033
Figure RE-GDA0002933935960000034
Figure RE-GDA0002933935960000035
接下来,单独对评价对象的输出进行mean pooling,得到
Figure RE-GDA0002933935960000036
Figure RE-GDA0002933935960000037
拼接到评论句的每个词向量中,以获得每个词的最终上下文语义表示为公式7:
Figure RE-GDA0002933935960000041
最终输出的向量hi将作为下一步注意力机制层的输入。
所述注意力机制:
通过计算对句子语义重要的信息,滤掉与句子无关的信息,注意力机制层可以突出评价对象作为关键信息在整体句子中的重要程度,增强关键特征所携带的特征信息。
具体可以表示为:
ei,j=tanh(Whhi,j+bh) (8)
Figure RE-GDA0002933935960000042
其中,ei,j为没有进行归一化的注意力分配概率权重值,αi,j为编码器第i个元素对于解码器第j个元素所计算的隐层状态注意力权重值,m为输入集合中词的个数, Wh为注意力机制层的矩阵权重。
最后,将注意力机制得到的特征表达用于最后的分类。
本发明的有益效果是:
1、本发明的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,将案件微博评论和评价对象分别输入到两个BiLSTM网络进行编码,通过权重共享在获取句子语义特征的同时,还可以得到案件微博评价对象的相关性信息;
2、本发明的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,为了处理评价对象的杂乱问题使用mean pooling得到代表评价对象的向量;
3、本发明的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,加入了注意力机制,不仅关注评论中词与词之间的相互作用,同时能针对评价对象有所侧重,最后结合注意力机制可以提高特征向量的表达能力,可以更为准确地判断对评价对象的情感极性;
4、本发明的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,解决了案件微博评论的细粒度情感分析任务。
附图说明
图1为本发明提出的案件微博评价对象情感倾向性分析流程图;
图2为本发明提出的权重共享的BiLSTM模型图。
具体实施方式
实施例1:如图1-2所示,基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,所述方法包括:
Step1、收集用于案件微博评价对象情感倾向性分析的微博评论文本,对微博评论文本进行去重与筛选;
进一步地,所述Step1中,使用Scrapy作为爬取工具,收集用于案件微博评价对象情感倾向性分析的微博评论文本。
Step2、定制案件微博评价对象情感倾向性分析的标注体系,标记微博评论文本,将标记好的微博评论语料按照4:1的比例分配训练语料和测试语料;
进一步地,所述步骤Step2的具体步骤为:
Step2.1、定制的案件微博评价对象情感倾向性分析的标注体系采用了XML的可扩展标记语言组织文本,分别针对评价对象文本、评价对象的开始位置、评价对象的结束位置、评价对象的情感极性对收集到的微博评论文本进行标记;
Step2.2、再将实验数据分为训练语料和测试语料。
Step3、获取评论语句对应的词向量和评价对象对应的词向量,训练数据经过预处理后作为具有权重共享的BiLSTM的输入;
进一步地,所述步骤Step3包括:在嵌入层中用word2vec词向量模型对案件微博评论和评价对象进行表征,得到评论语句对应的词向量和评价对象对应的词向量。
模型输入如图2所示,
Figure RE-GDA0002933935960000051
Figure RE-GDA0002933935960000052
分别是评论语句对应的词向量和评价对象对应的词向量,其中,m代表组成评论语句词的个数,r是评价对象的个数。
Step4、采用权重共享的BiLSTM获取评论和评价对象的语义特征,训练案件微博评价对象情感倾向性分析模型;
作为本发明的优选方案,本发明利用权重共享的BiLSTM将两个不同空间的向量映射到同一个向量空间上,在同一向量空间上对不同向量进行编码,然后结合注意力机制提高特征向量的表达能力,进行情感倾向性判别,其中:
所述步骤Step4的具体步骤:
Step4.1、训练数据经过预处理后,输入到具有权重共享的BiLSTM中;
Step4.2、将案件微博评论句和评价对象的向量映射到同一个空间维度上,通过双向长短时记忆网络能够获取句子中潜在的语义信息,由一个前向的LSTM网络层和后向的LSTM网络层组成;
Step4.3、利用双向长短时记忆网络中的门结构单元对句子信息进行选择性记忆。
Step5、将评价对象对应的隐含层输出向量进行mean pooling(平均池化)得到代表评价对象的向量,然后将末尾的隐含层的输出向量进行连接操作,结合注意力机制得到最终的特征表达,输入到softmax分类器,用于进行情感倾向性分析。
进一步地,所述步骤Step5的具体步骤为:
Step5.1、单独对评价对象对应的隐含层输出向量进行mean pooling,得到的结果拼接到评论句的每个词向量中,以获得每个词的最终上下文语义表示,最终输出的向量将作为下一步注意力机制层的输入;
Step5.2、结合注意力机制,通过计算对句子语义重要的信息,滤掉与句子无关的信息,突出评价对象作为关键信息在整体句子中的重要程度,增强关键特征所携带的特征信息,得到最终的特征表达;
Step5.3、将最终的特征表达输入到softmax分类器中,决策出最大概率的类别,得到评论句最终的情感极性;其中情感极性的标签是分为三个,分别是积极、中立和消极。
作为本发明的优选方案,所述权重共享的BiLSTM包括编码层和注意力机制层;
所述BiLSTM:
训练数据经过预处理后,输入到具有权重共享的BiLSTM中,将案件微博评论句和评价对象的向量映射到同一个空间维度上,通过双向长短时记忆网络能够获取句子中潜在的语义信息,由一个前向的LSTM网络层和后向的LSTM网络层组成。利用双向长短时记忆网络中的门结构单元对句子信息进行选择性记忆。在输入层表示的向量经过LSTM网络层的过程中,在时间步骤时会按公式式(1)-式(5)计算输入门、遗忘门和输出门的隐藏状态和单独完整LSTM网络层的输出状态值,表达式如下:
it=σ(Wiht-1+Vixt+bi) (1)
ft=σ(Wfht-1+Vfxt+bf) (2)
c=tanh(Wcht-1+Vcxt+bc) (3)
ot=σ(Woht-1+Voxt+bo) (4)
ht=ot tanh(ct) (5)
其中σ表示的是sigmoid激活函数,ct表示的是当前单元的细胞状态值。Wx和Vx (x=i,o,f,c)分别表示输入门、遗忘门和输出门以及所在的单元状态所对应的权重参数,bx(x=i,o,f,c)分别表示所对应的偏置项。通过前向LSTM层和后向LSTM层计算的单元隐藏状态分别为
Figure RE-GDA0002933935960000071
Figure RE-GDA0002933935960000072
两个隐藏单元状态向量按公式(6)结合,案件微博评论句和评价对象的输出向量分别表示为
Figure RE-GDA0002933935960000073
Figure RE-GDA0002933935960000074
Figure RE-GDA0002933935960000075
接下来,单独对评价对象的输出进行mean pooling,得到
Figure RE-GDA0002933935960000076
Figure RE-GDA0002933935960000077
拼接到评论句的每个词向量中,以获得每个词的最终上下文语义表示为公式7:
Figure RE-GDA0002933935960000078
最终输出的向量hi将作为下一步注意力机制层的输入。
所述注意力机制:
通过计算对句子语义重要的信息,滤掉与句子无关的信息,注意力机制层可以突出评价对象作为关键信息在整体句子中的重要程度,增强关键特征所携带的特征信息。
具体可以表示为:
ei,j=tanh(Whhi,j+bh) (8)
Figure RE-GDA0002933935960000079
其中,ei,j为没有进行归一化的注意力分配概率权重值,αi,j为编码器第i个元素对于解码器第j个元素所计算的隐层状态注意力权重值,m为输入集合中词的个数, Wh为注意力机制层的矩阵权重。
最后,将注意力机制得到的特征表达用于最后的分类。
Step6、本发明的实验模型基于Keras的深度学习框架,经过实验,证明模型设置的合理性与高效性,又将该模型与现有模型进行对比,证明本方法在案件微博评价对象情感倾向性分析上具有较好效果。
在实验中,把评价对象级别的情感极性处理成分类问题,因此采用判断正确分类结果的准确率(Acc,Accuracy)来评价模型的效果,计算公式如下式:
Figure RE-GDA00029339359600000710
其中,Right_num表示预测正确情感极性的评价对象数量;total_num表示数据中所有评价对象的数量。
本发明的实验模型基于Keras的深度学习框架。最大句子长度设置为60,词向量的维度根据数据集的规模定为100维。LSTM层为64(BiLSTM为128)。在两个输入的嵌入层插入σ=0.2的高斯噪声,在句子嵌入层进行dropout,参数为0.3,在LSTM层进行dropout,参数为0.2,LSTM层的递归连接与注意力机制层和Maxout 层之间进行dropout,参数为0.2,学习率为0.001。
本发明模型分别与CNN、LSTM、TDLSTM和BiLSTM等基准模型与本模型做了对比实验。实验结果如表1所示。
表1为A和B数据集模型准确率对比
Figure RE-GDA0002933935960000081
在几种基准模型的进行实验对比后,可以看出在A数据集上,CNN方法的实验结果中准确率较低为60.42%。主要是因为是CNN对局部特征抽取的效果比较好,面对一个评论中有不同的评价对象具有不同的情感极性时,使得CNN在这种复杂的情况下无法确地抽取出相应的特征来进行判断。相对而言LSTM模型得到的准确率为62.15%,结果比CNN的准确率提高了1.73%。主要因为LSTM可以捕捉到的范围更大,通过门结构能够获取到句长较大且结构复杂的完整上下文信息,可以更好地利用上下文语义信息决定当前单元值的输出,相较于CNN抽取局部特征而言能更好地判断当前评价对象的情感极性。TDLSTM的准确率较LSTM增加了2.31%,因为它是从标准的LSTM发展起来的,用LSTM来处理位于评价对象两边的上下文表示,所以评价对象是通过两次表示的,可以集中地表示最终的特征。BiLSTM也比单向的LSTM要好,准确率为65.89%,双向的LSTM结构模型通过前后两个方向计算隐层输出单元的状态,相对独立的LSTM能更全面准确地获取上下文之间的特征信息,在准确率方面有所提高。
本发明模型相比其他基准模型在两个数据集上均取得了最高的准确率,分别为67.70%和65.98%。本发明模型将案件微博评论和评价对象分别输入到两个BiLSTM 网络进行编码,通过权重共享在获取句子语义特征的同时,还可以得到案件微博评价对象的相关性信息;为了处理评价对象的杂乱问题使用mean pooling得到代表评价对象的向量;加入注意力机制的目的是不仅关注评论中词与词之间的相互作用,同时能针对评价对象有所侧重。最后结合注意力机制可以提高特征向量的表达能力,可以更为准确地判断对评价对象的情感极性。
从以上数据可以看出,本发明方法相比其他基准的评价对象抽取模型能取得更好的结果。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (6)

1.基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述方法包括:
Step1、收集用于案件微博评价对象情感倾向性分析的微博评论文本,对微博评论文本进行去重与筛选;
Step2、定制案件微博评价对象情感倾向性分析的标注体系,标记微博评论文本,将标记好的微博评论语料分为训练语料和测试语料;
Step3、获取评论语句对应的词向量和评价对象对应的词向量,训练数据经过预处理后作为具有权重共享的BiLSTM的输入;
Step4、采用权重共享的BiLSTM获取评论和评价对象的语义特征,训练案件微博评价对象情感倾向性分析模型;
Step5、将评价对象对应的隐含层输出向量进行mean pooling得到代表评价对象的向量,然后将末尾的隐含层的输出向量进行连接操作,结合注意力机制得到最终的特征表达,输入到softmax分类器,用于进行情感倾向性分析。
2.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述Step1中,使用Scrapy作为爬取工具,收集用于案件微博评价对象情感倾向性分析的微博评论文本。
3.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述步骤Step2的具体步骤为:
Step2.1、定制的案件微博评价对象情感倾向性分析的标注体系采用了XML的可扩展标记语言组织文本,分别针对评价对象文本、评价对象的开始位置、评价对象的结束位置、评价对象的情感极性对收集到的微博评论文本进行标记;
Step2.2、再将实验数据分为训练语料和测试语料。
4.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述步骤Step3中:将评论语句中的词与评价对象输入到embedding层中得到评论语句对应的词向量
Figure FDA0002779050980000011
和评价对象对应的词向量
Figure FDA0002779050980000012
其中,m代表组成评论语句词的个数,r是评价对象的个数。
5.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述步骤Step4的具体步骤:
Step4.1、训练数据经过预处理后,输入到具有权重共享的BiLSTM中;
Step4.2、将案件微博评论句和评价对象的向量映射到同一个空间维度上,通过双向长短时记忆网络能够获取句子中潜在的语义信息,由一个前向的LSTM网络层和后向的LSTM网络层组成;
Step4.3、利用双向长短时记忆网络中的门结构单元对句子信息进行选择性记忆。
6.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述步骤Step5的具体步骤为:
Step5.1、单独对评价对象对应的隐含层输出向量进行mean pooling,得到的结果拼接到评论句的每个词向量中,以获得每个词的最终上下文语义表示,最终输出的向量将作为下一步注意力机制层的输入;
Step5.2、结合注意力机制,通过计算对句子语义重要的信息,滤掉与句子无关的信息,突出评价对象作为关键信息在整体句子中的重要程度,增强关键特征所携带的特征信息,得到最终的特征表达;
Step5.3、将最终的特征表达输入到softmax分类器中,决策出最大概率的类别,得到评论句最终的情感极性;其中情感极性的标签是分为三个,分别是积极、中立和消极。
CN202011275960.0A 2020-11-16 2020-11-16 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法 Pending CN112561718A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011275960.0A CN112561718A (zh) 2020-11-16 2020-11-16 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011275960.0A CN112561718A (zh) 2020-11-16 2020-11-16 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法

Publications (1)

Publication Number Publication Date
CN112561718A true CN112561718A (zh) 2021-03-26

Family

ID=75042386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011275960.0A Pending CN112561718A (zh) 2020-11-16 2020-11-16 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法

Country Status (1)

Country Link
CN (1) CN112561718A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113076425A (zh) * 2021-04-25 2021-07-06 昆明理工大学 一种用于微博评论的事件相关观点句分类方法
CN113158684A (zh) * 2021-04-21 2021-07-23 清华大学深圳国际研究生院 一种情绪分析方法、情绪提醒方法及情绪提醒控制装置
CN113688236A (zh) * 2021-08-03 2021-11-23 东北大学秦皇岛分校 基于微博评论构建公民接种新冠疫苗的情感分类方法
CN113901172A (zh) * 2021-09-16 2022-01-07 昆明理工大学 基于关键词结构编码的涉案微博评价对象抽取方法
CN114943216A (zh) * 2022-05-12 2022-08-26 昆明理工大学 基于图注意力网络的案件微博属性级观点挖掘方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334213A (zh) * 2019-07-09 2019-10-15 昆明理工大学 基于双向交叉注意力机制的汉越新闻事件时序关系识别方法
CN111581474A (zh) * 2020-04-02 2020-08-25 昆明理工大学 基于多头注意力机制的涉案微博评论的评价对象抽取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334213A (zh) * 2019-07-09 2019-10-15 昆明理工大学 基于双向交叉注意力机制的汉越新闻事件时序关系识别方法
CN111581474A (zh) * 2020-04-02 2020-08-25 昆明理工大学 基于多头注意力机制的涉案微博评论的评价对象抽取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姚海申: "面向网络敏感信息的主题识别及其情感分析技术研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》, no. 12, 15 December 2019 (2019-12-15), pages 4 - 4 *
阚明刚等: "《话语标记概貌分析与情感倾向探索》", 31 March 2017, pages: 174 - 178 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113158684A (zh) * 2021-04-21 2021-07-23 清华大学深圳国际研究生院 一种情绪分析方法、情绪提醒方法及情绪提醒控制装置
CN113076425A (zh) * 2021-04-25 2021-07-06 昆明理工大学 一种用于微博评论的事件相关观点句分类方法
CN113688236A (zh) * 2021-08-03 2021-11-23 东北大学秦皇岛分校 基于微博评论构建公民接种新冠疫苗的情感分类方法
CN113901172A (zh) * 2021-09-16 2022-01-07 昆明理工大学 基于关键词结构编码的涉案微博评价对象抽取方法
CN113901172B (zh) * 2021-09-16 2024-04-26 昆明理工大学 基于关键词结构编码的涉案微博评价对象抽取方法
CN114943216A (zh) * 2022-05-12 2022-08-26 昆明理工大学 基于图注意力网络的案件微博属性级观点挖掘方法
CN114943216B (zh) * 2022-05-12 2024-04-19 昆明理工大学 基于图注意力网络的案件微博属性级观点挖掘方法

Similar Documents

Publication Publication Date Title
CN110059188B (zh) 一种基于双向时间卷积网络的中文情感分析方法
CN107832400B (zh) 一种基于位置的lstm和cnn联合模型进行关系分类的方法
CN107203511B (zh) 一种基于神经网络概率消歧的网络文本命名实体识别方法
CN110083833B (zh) 中文字词向量和方面词向量联合嵌入情感分析方法
CN111274398B (zh) 一种方面级用户产品评论情感分析方法及系统
CN111382565B (zh) 基于多标签的情绪-原因对抽取方法及系统
CN112561718A (zh) 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法
CN111897908A (zh) 融合依存信息和预训练语言模型的事件抽取方法及系统
CN110532557B (zh) 一种无监督的文本相似度计算方法
CN110717332B (zh) 基于非对称孪生网络的新闻与案件相似度计算方法
CN106855853A (zh) 基于深度神经网络的实体关系抽取系统
CN110287323B (zh) 一种面向目标的情感分类方法
CN111368086A (zh) 一种基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法
CN110717341B (zh) 一种以泰语为枢轴的老-汉双语语料库构建方法及装置
CN115357719B (zh) 基于改进bert模型的电力审计文本分类方法及装置
CN110046356B (zh) 标签嵌入的微博文本情绪多标签分类方法
CN112256866A (zh) 一种基于深度学习的文本细粒度情感分析方法
CN110472245B (zh) 一种基于层次化卷积神经网络的多标记情绪强度预测方法
CN110851601A (zh) 基于分层注意力机制的跨领域情感分类系统及方法
CN112434161B (zh) 一种采用双向长短期记忆网络的方面级情感分析方法
CN112417132B (zh) 一种利用谓宾信息筛选负样本的新意图识别方法
CN111368082A (zh) 一种基于层次网络的领域自适应词嵌入的情感分析方法
CN112818698A (zh) 一种基于双通道模型的细粒度的用户评论情感分析方法
CN114548116A (zh) 一种基于语序与语义联合分析的中文文本检错方法及系统
CN114547303A (zh) 基于Bert-LSTM的文本多特征分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210326