CN110347836B - 融入观点句特征的汉越双语新闻情感分类方法 - Google Patents
融入观点句特征的汉越双语新闻情感分类方法 Download PDFInfo
- Publication number
- CN110347836B CN110347836B CN201910635891.0A CN201910635891A CN110347836B CN 110347836 B CN110347836 B CN 110347836B CN 201910635891 A CN201910635891 A CN 201910635891A CN 110347836 B CN110347836 B CN 110347836B
- Authority
- CN
- China
- Prior art keywords
- chinese
- sentence
- news
- vietnamese
- viewpoint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000002156 mixing Methods 0.000 title claims description 5
- 230000008451 emotion Effects 0.000 claims abstract description 50
- 230000007246 mechanism Effects 0.000 claims abstract description 27
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 49
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 230000002996 emotional effect Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 claims description 6
- 238000009825 accumulation Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 239000004576 sand Substances 0.000 claims description 3
- 235000019580 granularity Nutrition 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 6
- 238000013145 classification model Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及融入观点句特征的汉越双语新闻情感分类方法,属于自然语言处理技术领域。本发明通过汉越双语词嵌入模型将汉语和越南语映射到同一个语义空间中;然后根据新闻文本的特点,使用卷积神经网络从观点句中抽取观点特征,并通过选择性门控网络将观点句特征融入隐藏层中,之后利用层次注意力机制对新闻中的情感信息进行关注,最后通过softmax对情感极性进行分类。本发明有效地提升越南语新闻情感分类的准确性。
Description
技术领域
本发明涉及融入观点句特征的汉越双语新闻情感分类方法,属于自然语言处理技术领域。
背景技术
情感分类是当前自然语言处理研究的热点问题,如何识别一个新闻文本的情感极性是当前的舆情监控的关键问题。通常的情感分类方法主要是构建文本的向量表征进行情感分类。相比较统计特征的文本表征方式,基于神经网络的文本建模有更好的表达能力,比如卷积神经网络(CNN)、循环神经网络(RNN)、Self-attention网络、Transformer网络等。这些文本建模方法可以有效捕捉文本的语义信息,建模文本表征。同时,注意力机制可以对文本表征中的情感相关信息进行关注,提升情感分类效果。上述方法可以广泛应用于评论文本的情感分类任务中;而对于新闻文本来说,其主要是对事实的客观描述,情感的表达并不明显。但通过观察,发现新闻的观点句中包含较多情感信息,利用这些情感信息有助于新闻情感分类。因此,为了对越南语新闻进行情感分类,提出了一种将观点句特征融入文档表征的汉越双语新闻情感分类方法。
发明内容
本发明提供了融入观点句特征的汉越双语新闻情感分类方法,通过汉越双语词嵌入模型将汉语和越南语映射到同一个语义空间中;然后根据新闻文本的特点,使用卷积神经网络从观点句中抽取观点特征,并通过选择性门控网络将观点句特征融入隐藏层中,之后利用层次注意力机制对新闻中的情感信息进行关注,最后通过softmax对情感极性进行分类;以用于有效地提升越南语新闻情感分类的准确性。
本发明的技术方案是:融入观点句特征的汉越双语新闻情感分类方法,具体步骤如下:
Step1、实验语料收集:收集汉语、越南语的新闻文本和汉越平行句对;
首先,构建汉越双语词嵌入模型需要大量的汉越新闻文本以及少量的汉越平行文本。为此,从汉语和越南语新闻网站中抓取了汉越新闻各35000篇,并且从越南语学习网(http://vie.tingroom.com/)中抓取了10W条汉越平行句对;
Step2、实验语料标注:为了提供监督学习的应该有的带有标签的数据,通过人工的方式标记了4000篇越南文新闻和12000篇中文新闻的观点句和情感极性,并使用这些标注数据来训练汉越新闻情感分类模型。在汉越新闻标注数据中,军事、时政、财经、娱乐4个不同领域的新闻分别占比为25%;
Step3、构建汉越双语词嵌入模型:使用标注好的汉语和越南语的新闻文本以及汉越平行句对来训练汉越双语词嵌入模型;
进一步地,所述步骤Step3中,分别使用标注好的汉语和越南语的新闻文本分别训练汉语和越南语的词嵌入模型,然后使用汉越平行句对词嵌入模型联合训练得到汉越双语词向量。此步骤能获得汉语和越南语的双语词向量,作为序列输入到后续模型中;
Step4、使用BiLSTM网络对新闻文本进行建模:使用步骤Step3得到的汉越双语词嵌入模型将汉语和越南语标注文本的词映射到一个语义空间中,然后将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,对新闻文本进行建模,输出每一时刻的隐藏状态;通过双向LSTM网络后,能获得新闻文本的蕴含上下文信息的隐状态,从而能进行拼接得到一个完成的句子的向量表征;
进一步地,利用步骤Step3构建的汉越双语词嵌入模型将汉语、越南语新闻的词编码为双语词向量,在所述步骤Step4中,将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,得到文档中第i句话中第j个词的隐藏状态;具体公式为:其中,表示前向LSTM网络输出的隐藏状态,表示后向LSTM网络输出的隐藏状态。
Step5、观点句特征的抽取与融入:使用卷积神经网络抽取观点句特征,并且使用门控网络将观点句特征融入到隐藏状态中;通过门控网络得到的隐状态,拼接后能得到一个带有观点句子特征的句子的向量表征;
进一步地,所述步骤Step5中,使用观点句特征来增强新闻文本的情感表达;通过多个不同大小的卷积核来抽取不同粒度的观点句特征,然后使用选择性门控网络将观点句特征融入模型的隐藏层中。
进一步地,所述步骤Step5中,使用卷积神经网络抽取观点句特征的具体步骤如下:
Step5.1.1、对于标注好的汉语和越南语文本中的每个句子,将前向LSTM网络和反向LSTM网络输出的最后一个隐状态进行拼接,得到该句子的向量表征si,具体公式为其中表示第i句第Si个词的前向LSTM网络输出的隐藏状态,表示第i句第1个词后向LSTM网络输出的隐藏状态;
Step5.1.2、由于新闻文档中有多个表达观点的句子,因此将文档中标记为观点句的句子的向量表征组成一个矩阵,然后通过多个不同大小的卷积核对该矩阵进行卷积来抽取出观点句特征s′。
卷积的过程如图3所示,sa和sb等都是观点句的句子表征。
表1为每组卷积核的大小。
组数 | 卷积核维数 |
1 | [1,400] |
2 | [2,400] |
3 | [3,400] |
4 | [4,400] |
5 | [5,400] |
进一步地,所述步骤Step5中,使用选择性门控网络将观点特征融入到隐藏状态hi,j中,具体过程如图3所示。选择性门控网络有三个输入,分别是Step3中输出的隐藏状态hi,j,通过卷积神经网络抽取的观点特征s′,文档中每个句子的向量表征si。在选择性门控网络中,计算文档中每个句子和观点句特征的关联程度;
使用门控网络将观点句特征融入到隐藏状态中的具体步骤如下:
其中,Ws和Us是权重矩阵,b是偏置项,σ是sigmoid激活函数;
Step5.2.2、将Step4输出的隐藏状态hi,j和门控向量sGatei相乘,得到了融入观点句特征后隐藏状态h′i,j;具体公式为:h′i,j=hi,j⊙sGatei;其中,⊙表示向量对应元素相乘。
Step6、使用层次注意力机制对情感信息进行关注:对于长文档,不同的词或句子对于情感分类会有不同的作用,使用层次注意力机制分别从词级和句子级对情感相关的信息赋予不同的权重,并得到新闻文本的向量化表征;通过层级注意力,能提高重要信息在新闻文本中的权重,并得到的文本级别的向量表征;
进一步地,所述步骤Step6的具体步骤如下:
Step6.1、首先,第一层是句子级的注意力机制,用两层前馈神经网络来预测句子级注意力的权重打分Ai;句子级注意力机制的具体公式为 其中,f是两层前馈神经网络,s′i是融入观点句信息后的句向量,θs表示前馈神经网络的参数;
Step6.2、然后,第二层是词级的注意力机制,同样用两层前馈神经网络来预测词级注意力的权重打分ai.j;词级注意力机制的具体公式为 其中,f同样是两层前馈神经网络,h′i,j是融入观点特征后第i句话第j个词的隐藏状态,θw是前馈神经网络的参数;
Step7、使用softmax分类器对新闻的情感极性进行分类,之后使用交叉熵损失来最小化输出结果和情感标签之间的预测误差,从而通过对预测样本和真实样本标记产生的误差反向传播指导网络参数学习;具体公式为其中,是模型预测的情感极性标签向量,yi是标记好的标签向量,λ||θ||2是L2正则化项。通过softmax分类器后,能将文本的向量表征进行一个分类,得到可能结果的概率分布,从而得到最后的分类结果。
本发明的有益效果是:本发明根据新闻文本的特点,使用卷积神经网络从观点句中抽取观点特征,并通过选择性门控网络将观点句特征融入隐藏层中,之后利用层次注意力机制对新闻中的情感信息进行关注,最后通过softmax对情感极性进行分类,能有效地提升越南语新闻情感分类的准确性。
附图说明
图1为本发明中的流程图;
图2为本发明中是新闻情感分类模型的整体架构示意图;
图3为本发明中观点句抽取与融入的具体细节示意图。
具体实施方式
实施例1:如图1-3所示,融入观点句特征的汉越双语新闻情感分类方法,具体包括如下步骤:
Step1、从汉语和越南语新闻网站中抓取了汉越新闻各35000篇,并且从越南语学习网(http://vie.tingroom.com/)中抓取了10W条汉越平行句对;
Step2、通过人工的方式标记了4000篇越南文新闻和12000篇中文新闻的观点句和情感极性,并使用这些标注数据来训练汉越新闻情感分类模型。在汉越新闻标注数据中,军事、时政、财经、娱乐4个不同领域的新闻分别占比为25%;分别以90%、5%、5%的比例来划分训练集、验证集和测试集;
Step3、分别使用标注好的汉语和越南语的新闻文本分别训练汉语和越南语的词嵌入模型,然后使用汉越平行句对词嵌入模型联合训练得到汉越双语词向量。
Step4、利用步骤Step3构建的汉越双语词嵌入模型将汉语、越南语新闻的词编码为双语词向量,将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,得到文档中第i句话中第j个词的隐藏状态;具体公式为:其中,表示前向LSTM网络输出的隐藏状态,表示后向LSTM网络输出的隐藏状态。
Step5、使用卷积神经网络抽取观点句特征,并且使用门控网络将观点句特征融入到隐藏状态中;
使用卷积神经网络抽取观点句特征的具体步骤如下:
Step5.1.1、对于标注好的汉语和越南语文本中的每个句子,将前向LSTM网络和反向LSTM网络输出的最后一个隐状态进行拼接,得到该句子的向量表征si,具体公式为其中表示第i句第Si个词的前向LSTM网络输出的隐藏状态,表示第i句第1个词后向LSTM网络输出的隐藏状态;
Step5.1.2、由于新闻文档中有多个表达观点的句子,因此将文档中标记为观点句的句子的向量表征组成一个矩阵,然后通过多个不同大小的卷积核对该矩阵进行卷积来抽取出观点句特征s′。
使用门控网络将观点句特征融入到隐藏状态中的具体步骤如下:
其中,Ws和Us是权重矩阵,b是偏置项,σ是sigmoid激活函数;
Step5.2.2、将Step4输出的隐藏状态hi,j和门控向量sGatei相乘,得到了融入观点句特征后隐藏状态h′i,j;具体公式为:h′i,j=hi,j⊙sGatei;其中,⊙表示向量对应元素相乘。
Step6、使用层次注意力机制对情感信息进行关注:对于长文档,不同的词或句子对于情感分类会有不同的作用,使用层次注意力机制分别从词级和句子级对情感相关的信息赋予不同的权重,并得到新闻文本的向量化表征;
进一步地,所述步骤Step6的具体步骤如下:
Step6.1、首先,第一层是句子级的注意力机制,用两层前馈神经网络来预测句子级注意力的权重打分Ai;句子级注意力机制的具体公式为 其中,f是两层前馈神经网络,s′i是融入观点句信息后的句向量,θs表示前馈神经网络的参数;
Step6.2、然后,第二层是词级的注意力机制,同样用两层前馈神经网络来预测词级注意力的权重打分ai.j;词级注意力机制的具体公式为 其中,f同样是两层前馈神经网络,h′i,j是融入观点特征后第i句话第j个词的隐藏状态,θw是前馈神经网络的参数;
Step7、使用softmax分类器对新闻的情感极性进行分类,之后使用交叉熵损失来最小化输出结果和情感标签之间的预测误差,从而通过对预测样本和真实样本标记产生的误差反向传播指导网络参数学习;具体公式为其中,是模型预测的情感极性标签向量,yi是标记好的标签向量,λ||θ||2是L2正则化项。
为了验证本发明的分类效果,通过如下实验结果进行说明;
表2为是否融入观点特征对越南语情感分类的效果结果对比
表3为不同注意力机制对越南语情感分类的对比效果
从表2中可以看出,将观点句特征融入文档表征后,各领域新闻情感分类的准确率均有所提高。在平均准确率上,融入观点句特征的模型提升了3.8%。该实验说明了从观点句中抽取观点句特征,并通过选择性门控网络将这些特征融入模型的方法可以有效提升新闻情感分类的准确率。
从表3中的所有模型都是基于BiLSTM网络并且融入了观点句特征。从结果上来看,发现层次注意力机制对汉越新闻情感分类模型的效果要优于其他三种方法。这证明了层次注意力机制的有效性。此外,还可以从表3中发现,词级注意力机制的效果比句子级注意力机制的效果要好。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (6)
1.融入观点句特征的汉越双语新闻情感分类方法,其特征在于:具体步骤如下:
Step1、收集汉语、越南语的新闻文本和汉越平行句对;
Step2、使用人工标注的方式对汉语、越南语的新闻文本进行观点句和情感极性的标注;
Step3、使用标注好的汉语和越南语的新闻文本以及汉越平行句对来训练汉越双语词嵌入模型;
Step4、使用步骤Step3得到的汉越双语词嵌入模型将汉语和越南语标注文本的词映射到一个语义空间中,然后将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,对新闻文本进行建模,输出每一时刻的隐藏状态;
Step5、使用卷积神经网络抽取观点句特征,并且使用门控网络将观点句特征融入到隐藏状态中;
Step6、使用层次注意力机制对情感信息进行关注:使用层次注意力机制分别从词级和句子级对情感相关的信息赋予不同的权重,并得到新闻文本的向量化表征;
Step7、使用softmax分类器对新闻的情感极性进行分类;
所述步骤Step5中,使用卷积神经网络抽取观点句特征的具体步骤如下:
Step5.1.1、对于标注好的汉语和越南语文本中的每个句子,将前向LSTM网络和反向LSTM网络输出的最后一个隐状态进行拼接,得到该句子的向量表征si,具体公式为其中表示第i句第Si个词的前向LSTM网络输出的隐藏状态,表示第i句第1个词后向LSTM网络输出的隐藏状态;
Step5.1.2、由于新闻文档中有多个表达观点的句子,因此将文档中标记为观点句的句子的向量表征组成一个矩阵,然后通过多个不同大小的卷积核对该矩阵进行卷积来抽取出观点句特征s′;
所述步骤Step5中,使用门控网络将观点句特征融入到隐藏状态中的具体步骤如下:
Step5.2.1、将标注后的汉语和越南语文本中每个句子的向量表征si和观点句特征s′输入到多层感知机中,得到门控向量sGatei;具体公式为:sGatei=σ(Wssi+Uss′+b);
其中,Ws和Us是权重矩阵,b是偏置项,σ是sigmoid激活函数;
Step5.2.2、将Step4输出的隐藏状态hi,j和门控向量sGatei相乘,得到了融入观点句特征后隐藏状态h′i,j;具体公式为:h′i,j=hi,j⊙sGatei;其中,⊙表示向量对应元素相乘。
2.根据权利要求1所述的融入观点句特征的汉越双语新闻情感分类方法,其特征在于:所述步骤Step3中,分别使用标注好的汉语和越南语的新闻文本分别训练汉语和越南语的词嵌入模型,然后使用汉越平行句对词嵌入模型联合训练得到汉越双语词向量。
4.根据权利要求1所述的融入观点句特征的汉越双语新闻情感分类方法,其特征在于:所述步骤Step5中,使用观点句特征来增强新闻文本的情感表达;通过多个不同大小的卷积核来抽取不同粒度的观点句特征,然后使用选择性门控网络将观点句特征融入模型的隐藏层中。
5.根据权利要求1所述的融入观点句特征的汉越双语新闻情感分类方法,其特征在于:所述步骤Step6的具体步骤如下:
Step6.1、首先,第一层是句子级的注意力机制,用两层前馈神经网络来预测句子级注意力的权重打分Ai;句子级注意力机制的具体公式为 其中,f是两层前馈神经网络,s′i是融入观点句信息后的句向量,θs表示前馈神经网络的参数;
Step6.2、然后,第二层是词级的注意力机制,同样用两层前馈神经网络来预测词级注意力的权重打分ai.j;词级注意力机制的具体公式为 其中,f同样是两层前馈神经网络,h′i,j是融入观点特征后第i句话第j个词的隐藏状态,θw是前馈神经网络的参数;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910635891.0A CN110347836B (zh) | 2019-07-15 | 2019-07-15 | 融入观点句特征的汉越双语新闻情感分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910635891.0A CN110347836B (zh) | 2019-07-15 | 2019-07-15 | 融入观点句特征的汉越双语新闻情感分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110347836A CN110347836A (zh) | 2019-10-18 |
CN110347836B true CN110347836B (zh) | 2021-07-09 |
Family
ID=68175292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910635891.0A Active CN110347836B (zh) | 2019-07-15 | 2019-07-15 | 融入观点句特征的汉越双语新闻情感分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110347836B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532380B (zh) * | 2019-07-12 | 2020-06-23 | 杭州电子科技大学 | 一种基于记忆网络的文本情感分类方法 |
CN110968692B (zh) * | 2019-10-23 | 2023-04-07 | 全球能源互联网研究院有限公司 | 一种文本分类方法及系统 |
CN110990564B (zh) * | 2019-11-19 | 2023-12-01 | 北京信息科技大学 | 一种基于情感计算与多头注意力机制的负面新闻识别方法 |
CN111008274B (zh) * | 2019-12-10 | 2021-04-06 | 昆明理工大学 | 特征扩展卷积神经网络的案件微博观点句识别构建方法 |
CN111414731B (zh) * | 2020-02-28 | 2023-08-11 | 北京小米松果电子有限公司 | 文本标注方法和装置 |
CN111581943A (zh) * | 2020-04-02 | 2020-08-25 | 昆明理工大学 | 一种基于句子关联图的汉越双语多文档新闻观点句识别方法 |
CN113626672A (zh) * | 2021-02-26 | 2021-11-09 | 新大陆数字技术股份有限公司 | 基于rcnn网络的舆情分析方法及系统 |
CN113222059B (zh) * | 2021-05-28 | 2023-01-03 | 北京理工大学 | 利用协作式神经网络链的多标签情感分类方法 |
CN113901205B (zh) * | 2021-09-07 | 2024-09-27 | 昆明理工大学 | 基于情感语义对抗的跨语言情感分类方法 |
CN117909506B (zh) * | 2024-03-15 | 2024-06-04 | 中国电子科技集团公司第十研究所 | 一种基于细微特征的核心主题事件监测方法及设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804612B (zh) * | 2018-05-30 | 2021-11-02 | 武汉烽火普天信息技术有限公司 | 一种基于对偶神经网络模型的文本情感分类方法 |
CN109902177B (zh) * | 2019-02-28 | 2022-11-29 | 上海理工大学 | 基于双通道卷积记忆神经网络的文本情感分析方法 |
CN109933795B (zh) * | 2019-03-19 | 2023-07-28 | 上海交通大学 | 基于上下文-情感词向量的文本情感分析系统 |
-
2019
- 2019-07-15 CN CN201910635891.0A patent/CN110347836B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110347836A (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110347836B (zh) | 融入观点句特征的汉越双语新闻情感分类方法 | |
Ishaq et al. | Aspect-based sentiment analysis using a hybridized approach based on CNN and GA | |
CN107992597B (zh) | 一种面向电网故障案例的文本结构化方法 | |
Ain et al. | Sentiment analysis using deep learning techniques: a review | |
Qian et al. | Hierarchical CVAE for fine-grained hate speech classification | |
CN110472047B (zh) | 一种多特征融合的汉越新闻观点句抽取方法 | |
CN108363690A (zh) | 基于神经网络的对话语义意图预测方法及学习训练方法 | |
CN111401061A (zh) | 基于BERT及BiLSTM-Attention的涉案新闻观点句识别方法 | |
CN112749274B (zh) | 基于注意力机制和干扰词删除的中文文本分类方法 | |
Wahid et al. | Cricket sentiment analysis from Bangla text using recurrent neural network with long short term memory model | |
Zhao et al. | ZYJ123@ DravidianLangTech-EACL2021: Offensive language identification based on XLM-RoBERTa with DPCNN | |
CN112989033B (zh) | 基于情绪类别描述的微博情绪分类方法 | |
CN109101490B (zh) | 一种基于融合特征表示的事实型隐式情感识别方法和系统 | |
CN112784041B (zh) | 一种中文短文本情感倾向性分析方法 | |
CN114417851B (zh) | 一种基于关键词加权信息的情感分析方法 | |
CN110472245B (zh) | 一种基于层次化卷积神经网络的多标记情绪强度预测方法 | |
CN112163091A (zh) | 基于cnn的方面级跨领域情感分析方法 | |
CN112597302A (zh) | 基于多维评论表示的虚假评论检测方法 | |
Gandhi et al. | Multimodal sentiment analysis: review, application domains and future directions | |
CN115935975A (zh) | 一种情感可控的新闻评论生成方法 | |
CN113934835B (zh) | 结合关键词和语义理解表征的检索式回复对话方法及系统 | |
CN115129807A (zh) | 基于自注意的社交媒体主题评论的细粒度分类方法及系统 | |
Li et al. | BERTtoCNN: Similarity-preserving enhanced knowledge distillation for stance detection | |
CN113076425A (zh) | 一种用于微博评论的事件相关观点句分类方法 | |
Pandey et al. | Improving sentiment analysis using hybrid deep learning model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |