CN110347836B - 融入观点句特征的汉越双语新闻情感分类方法 - Google Patents

融入观点句特征的汉越双语新闻情感分类方法 Download PDF

Info

Publication number
CN110347836B
CN110347836B CN201910635891.0A CN201910635891A CN110347836B CN 110347836 B CN110347836 B CN 110347836B CN 201910635891 A CN201910635891 A CN 201910635891A CN 110347836 B CN110347836 B CN 110347836B
Authority
CN
China
Prior art keywords
chinese
sentence
news
vietnamese
viewpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910635891.0A
Other languages
English (en)
Other versions
CN110347836A (zh
Inventor
余正涛
刘权
相艳
线岩团
林思琦
赖华
王振晗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201910635891.0A priority Critical patent/CN110347836B/zh
Publication of CN110347836A publication Critical patent/CN110347836A/zh
Application granted granted Critical
Publication of CN110347836B publication Critical patent/CN110347836B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明涉及融入观点句特征的汉越双语新闻情感分类方法,属于自然语言处理技术领域。本发明通过汉越双语词嵌入模型将汉语和越南语映射到同一个语义空间中;然后根据新闻文本的特点,使用卷积神经网络从观点句中抽取观点特征,并通过选择性门控网络将观点句特征融入隐藏层中,之后利用层次注意力机制对新闻中的情感信息进行关注,最后通过softmax对情感极性进行分类。本发明有效地提升越南语新闻情感分类的准确性。

Description

融入观点句特征的汉越双语新闻情感分类方法
技术领域
本发明涉及融入观点句特征的汉越双语新闻情感分类方法,属于自然语言处理技术领域。
背景技术
情感分类是当前自然语言处理研究的热点问题,如何识别一个新闻文本的情感极性是当前的舆情监控的关键问题。通常的情感分类方法主要是构建文本的向量表征进行情感分类。相比较统计特征的文本表征方式,基于神经网络的文本建模有更好的表达能力,比如卷积神经网络(CNN)、循环神经网络(RNN)、Self-attention网络、Transformer网络等。这些文本建模方法可以有效捕捉文本的语义信息,建模文本表征。同时,注意力机制可以对文本表征中的情感相关信息进行关注,提升情感分类效果。上述方法可以广泛应用于评论文本的情感分类任务中;而对于新闻文本来说,其主要是对事实的客观描述,情感的表达并不明显。但通过观察,发现新闻的观点句中包含较多情感信息,利用这些情感信息有助于新闻情感分类。因此,为了对越南语新闻进行情感分类,提出了一种将观点句特征融入文档表征的汉越双语新闻情感分类方法。
发明内容
本发明提供了融入观点句特征的汉越双语新闻情感分类方法,通过汉越双语词嵌入模型将汉语和越南语映射到同一个语义空间中;然后根据新闻文本的特点,使用卷积神经网络从观点句中抽取观点特征,并通过选择性门控网络将观点句特征融入隐藏层中,之后利用层次注意力机制对新闻中的情感信息进行关注,最后通过softmax对情感极性进行分类;以用于有效地提升越南语新闻情感分类的准确性。
本发明的技术方案是:融入观点句特征的汉越双语新闻情感分类方法,具体步骤如下:
Step1、实验语料收集:收集汉语、越南语的新闻文本和汉越平行句对;
首先,构建汉越双语词嵌入模型需要大量的汉越新闻文本以及少量的汉越平行文本。为此,从汉语和越南语新闻网站中抓取了汉越新闻各35000篇,并且从越南语学习网(http://vie.tingroom.com/)中抓取了10W条汉越平行句对;
Step2、实验语料标注:为了提供监督学习的应该有的带有标签的数据,通过人工的方式标记了4000篇越南文新闻和12000篇中文新闻的观点句和情感极性,并使用这些标注数据来训练汉越新闻情感分类模型。在汉越新闻标注数据中,军事、时政、财经、娱乐4个不同领域的新闻分别占比为25%;
Step3、构建汉越双语词嵌入模型:使用标注好的汉语和越南语的新闻文本以及汉越平行句对来训练汉越双语词嵌入模型;
进一步地,所述步骤Step3中,分别使用标注好的汉语和越南语的新闻文本分别训练汉语和越南语的词嵌入模型,然后使用汉越平行句对词嵌入模型联合训练得到汉越双语词向量。此步骤能获得汉语和越南语的双语词向量,作为序列输入到后续模型中;
Step4、使用BiLSTM网络对新闻文本进行建模:使用步骤Step3得到的汉越双语词嵌入模型将汉语和越南语标注文本的词映射到一个语义空间中,然后将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,对新闻文本进行建模,输出每一时刻的隐藏状态;通过双向LSTM网络后,能获得新闻文本的蕴含上下文信息的隐状态,从而能进行拼接得到一个完成的句子的向量表征;
进一步地,利用步骤Step3构建的汉越双语词嵌入模型将汉语、越南语新闻的词编码为双语词向量,在所述步骤Step4中,将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,得到文档中第i句话中第j个词的隐藏状态;具体公式为:
Figure BDA0002130218650000021
其中,
Figure BDA0002130218650000022
表示前向LSTM网络输出的隐藏状态,
Figure BDA0002130218650000023
表示后向LSTM网络输出的隐藏状态。
Step5、观点句特征的抽取与融入:使用卷积神经网络抽取观点句特征,并且使用门控网络将观点句特征融入到隐藏状态中;通过门控网络得到的隐状态,拼接后能得到一个带有观点句子特征的句子的向量表征;
进一步地,所述步骤Step5中,使用观点句特征来增强新闻文本的情感表达;通过多个不同大小的卷积核来抽取不同粒度的观点句特征,然后使用选择性门控网络将观点句特征融入模型的隐藏层中。
进一步地,所述步骤Step5中,使用卷积神经网络抽取观点句特征的具体步骤如下:
Step5.1.1、对于标注好的汉语和越南语文本中的每个句子,将前向LSTM网络和反向LSTM网络输出的最后一个隐状态进行拼接,得到该句子的向量表征si,具体公式为
Figure BDA0002130218650000031
其中
Figure BDA0002130218650000032
表示第i句第Si个词的前向LSTM网络输出的隐藏状态,
Figure BDA0002130218650000033
表示第i句第1个词后向LSTM网络输出的隐藏状态;
Step5.1.2、由于新闻文档中有多个表达观点的句子,因此将文档中标记为观点句的句子的向量表征组成一个矩阵,然后通过多个不同大小的卷积核对该矩阵进行卷积来抽取出观点句特征s′。
卷积的过程如图3所示,sa和sb等都是观点句的句子表征。
表1为每组卷积核的大小。
组数 卷积核维数
1 [1,400]
2 [2,400]
3 [3,400]
4 [4,400]
5 [5,400]
进一步地,所述步骤Step5中,使用选择性门控网络将观点特征融入到隐藏状态hi,j中,具体过程如图3所示。选择性门控网络有三个输入,分别是Step3中输出的隐藏状态hi,j,通过卷积神经网络抽取的观点特征s′,文档中每个句子的向量表征si。在选择性门控网络中,计算文档中每个句子和观点句特征的关联程度;
使用门控网络将观点句特征融入到隐藏状态中的具体步骤如下:
Step5.2.1、将标注后的汉语和越南语文本中每个句子的向量表征si和观点句特征s′输入到多层感知机中,得到门控向量sGait;具体公式为:
Figure BDA0002130218650000034
其中,Ws和Us是权重矩阵,b是偏置项,σ是sigmoid激活函数;
Step5.2.2、将Step4输出的隐藏状态hi,j和门控向量sGatei相乘,得到了融入观点句特征后隐藏状态h′i,j;具体公式为:h′i,j=hi,j⊙sGatei;其中,⊙表示向量对应元素相乘。
Step6、使用层次注意力机制对情感信息进行关注:对于长文档,不同的词或句子对于情感分类会有不同的作用,使用层次注意力机制分别从词级和句子级对情感相关的信息赋予不同的权重,并得到新闻文本的向量化表征;通过层级注意力,能提高重要信息在新闻文本中的权重,并得到的文本级别的向量表征;
进一步地,所述步骤Step6的具体步骤如下:
Step6.1、首先,第一层是句子级的注意力机制,用两层前馈神经网络来预测句子级注意力的权重打分Ai;句子级注意力机制的具体公式为
Figure BDA0002130218650000041
Figure BDA0002130218650000042
其中,f是两层前馈神经网络,s′i是融入观点句信息后的句向量,θs表示前馈神经网络的参数;
Step6.2、然后,第二层是词级的注意力机制,同样用两层前馈神经网络来预测词级注意力的权重打分ai.j;词级注意力机制的具体公式为
Figure BDA0002130218650000043
Figure BDA0002130218650000044
其中,f同样是两层前馈神经网络,h′i,j是融入观点特征后第i句话第j个词的隐藏状态,θw是前馈神经网络的参数;
Step6.3、最后,将融入观点特征后的隐藏状态h′i,j和词级注意力打分ai.j进行累积求和,并且在句子级上同样和句子级注意力打分Ai进行累积求和,得到了文本的向量表征r,具体公式为
Figure BDA0002130218650000045
Step7、使用softmax分类器对新闻的情感极性进行分类,之后使用交叉熵损失来最小化输出结果和情感标签之间的预测误差,从而通过对预测样本和真实样本标记产生的误差反向传播指导网络参数学习;具体公式为
Figure BDA0002130218650000046
其中,
Figure BDA0002130218650000047
是模型预测的情感极性标签向量,yi是标记好的标签向量,λ||θ||2是L2正则化项。通过softmax分类器后,能将文本的向量表征进行一个分类,得到可能结果的概率分布,从而得到最后的分类结果。
本发明的有益效果是:本发明根据新闻文本的特点,使用卷积神经网络从观点句中抽取观点特征,并通过选择性门控网络将观点句特征融入隐藏层中,之后利用层次注意力机制对新闻中的情感信息进行关注,最后通过softmax对情感极性进行分类,能有效地提升越南语新闻情感分类的准确性。
附图说明
图1为本发明中的流程图;
图2为本发明中是新闻情感分类模型的整体架构示意图;
图3为本发明中观点句抽取与融入的具体细节示意图。
具体实施方式
实施例1:如图1-3所示,融入观点句特征的汉越双语新闻情感分类方法,具体包括如下步骤:
Step1、从汉语和越南语新闻网站中抓取了汉越新闻各35000篇,并且从越南语学习网(http://vie.tingroom.com/)中抓取了10W条汉越平行句对;
Step2、通过人工的方式标记了4000篇越南文新闻和12000篇中文新闻的观点句和情感极性,并使用这些标注数据来训练汉越新闻情感分类模型。在汉越新闻标注数据中,军事、时政、财经、娱乐4个不同领域的新闻分别占比为25%;分别以90%、5%、5%的比例来划分训练集、验证集和测试集;
Step3、分别使用标注好的汉语和越南语的新闻文本分别训练汉语和越南语的词嵌入模型,然后使用汉越平行句对词嵌入模型联合训练得到汉越双语词向量。
Step4、利用步骤Step3构建的汉越双语词嵌入模型将汉语、越南语新闻的词编码为双语词向量,将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,得到文档中第i句话中第j个词的隐藏状态;具体公式为:
Figure BDA0002130218650000051
其中,
Figure BDA0002130218650000052
表示前向LSTM网络输出的隐藏状态,
Figure BDA0002130218650000053
表示后向LSTM网络输出的隐藏状态。
Step5、使用卷积神经网络抽取观点句特征,并且使用门控网络将观点句特征融入到隐藏状态中;
使用卷积神经网络抽取观点句特征的具体步骤如下:
Step5.1.1、对于标注好的汉语和越南语文本中的每个句子,将前向LSTM网络和反向LSTM网络输出的最后一个隐状态进行拼接,得到该句子的向量表征si,具体公式为
Figure BDA0002130218650000054
其中
Figure BDA0002130218650000055
表示第i句第Si个词的前向LSTM网络输出的隐藏状态,
Figure BDA0002130218650000056
表示第i句第1个词后向LSTM网络输出的隐藏状态;
Step5.1.2、由于新闻文档中有多个表达观点的句子,因此将文档中标记为观点句的句子的向量表征组成一个矩阵,然后通过多个不同大小的卷积核对该矩阵进行卷积来抽取出观点句特征s′。
使用门控网络将观点句特征融入到隐藏状态中的具体步骤如下:
Step5.2.1、将标注后的汉语和越南语文本中每个句子的向量表征si和观点句特征s′输入到多层感知机中,得到门控向量sGait;具体公式为:
Figure BDA0002130218650000066
其中,Ws和Us是权重矩阵,b是偏置项,σ是sigmoid激活函数;
Step5.2.2、将Step4输出的隐藏状态hi,j和门控向量sGatei相乘,得到了融入观点句特征后隐藏状态h′i,j;具体公式为:h′i,j=hi,j⊙sGatei;其中,⊙表示向量对应元素相乘。
Step6、使用层次注意力机制对情感信息进行关注:对于长文档,不同的词或句子对于情感分类会有不同的作用,使用层次注意力机制分别从词级和句子级对情感相关的信息赋予不同的权重,并得到新闻文本的向量化表征;
进一步地,所述步骤Step6的具体步骤如下:
Step6.1、首先,第一层是句子级的注意力机制,用两层前馈神经网络来预测句子级注意力的权重打分Ai;句子级注意力机制的具体公式为
Figure BDA0002130218650000061
Figure BDA0002130218650000062
其中,f是两层前馈神经网络,s′i是融入观点句信息后的句向量,θs表示前馈神经网络的参数;
Step6.2、然后,第二层是词级的注意力机制,同样用两层前馈神经网络来预测词级注意力的权重打分ai.j;词级注意力机制的具体公式为
Figure BDA0002130218650000063
Figure BDA0002130218650000064
其中,f同样是两层前馈神经网络,h′i,j是融入观点特征后第i句话第j个词的隐藏状态,θw是前馈神经网络的参数;
Step6.3、最后,将融入观点特征后的隐藏状态h′i,j和词级注意力打分ai.j进行累积求和,并且在句子级上同样和句子级注意力打分Ai进行累积求和,得到了文本的向量表征r,具体公式为
Figure BDA0002130218650000065
Step7、使用softmax分类器对新闻的情感极性进行分类,之后使用交叉熵损失来最小化输出结果和情感标签之间的预测误差,从而通过对预测样本和真实样本标记产生的误差反向传播指导网络参数学习;具体公式为
Figure BDA0002130218650000071
其中,
Figure BDA0002130218650000072
是模型预测的情感极性标签向量,yi是标记好的标签向量,λ||θ||2是L2正则化项。
为了验证本发明的分类效果,通过如下实验结果进行说明;
表2为是否融入观点特征对越南语情感分类的效果结果对比
Figure BDA0002130218650000073
表3为不同注意力机制对越南语情感分类的对比效果
Figure BDA0002130218650000074
从表2中可以看出,将观点句特征融入文档表征后,各领域新闻情感分类的准确率均有所提高。在平均准确率上,融入观点句特征的模型提升了3.8%。该实验说明了从观点句中抽取观点句特征,并通过选择性门控网络将这些特征融入模型的方法可以有效提升新闻情感分类的准确率。
从表3中的所有模型都是基于BiLSTM网络并且融入了观点句特征。从结果上来看,发现层次注意力机制对汉越新闻情感分类模型的效果要优于其他三种方法。这证明了层次注意力机制的有效性。此外,还可以从表3中发现,词级注意力机制的效果比句子级注意力机制的效果要好。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (6)

1.融入观点句特征的汉越双语新闻情感分类方法,其特征在于:具体步骤如下:
Step1、收集汉语、越南语的新闻文本和汉越平行句对;
Step2、使用人工标注的方式对汉语、越南语的新闻文本进行观点句和情感极性的标注;
Step3、使用标注好的汉语和越南语的新闻文本以及汉越平行句对来训练汉越双语词嵌入模型;
Step4、使用步骤Step3得到的汉越双语词嵌入模型将汉语和越南语标注文本的词映射到一个语义空间中,然后将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,对新闻文本进行建模,输出每一时刻的隐藏状态;
Step5、使用卷积神经网络抽取观点句特征,并且使用门控网络将观点句特征融入到隐藏状态中;
Step6、使用层次注意力机制对情感信息进行关注:使用层次注意力机制分别从词级和句子级对情感相关的信息赋予不同的权重,并得到新闻文本的向量化表征;
Step7、使用softmax分类器对新闻的情感极性进行分类;
所述步骤Step5中,使用卷积神经网络抽取观点句特征的具体步骤如下:
Step5.1.1、对于标注好的汉语和越南语文本中的每个句子,将前向LSTM网络和反向LSTM网络输出的最后一个隐状态进行拼接,得到该句子的向量表征si,具体公式为
Figure FDA0002922919390000011
其中
Figure FDA0002922919390000012
表示第i句第Si个词的前向LSTM网络输出的隐藏状态,
Figure FDA0002922919390000013
表示第i句第1个词后向LSTM网络输出的隐藏状态;
Step5.1.2、由于新闻文档中有多个表达观点的句子,因此将文档中标记为观点句的句子的向量表征组成一个矩阵,然后通过多个不同大小的卷积核对该矩阵进行卷积来抽取出观点句特征s′;
所述步骤Step5中,使用门控网络将观点句特征融入到隐藏状态中的具体步骤如下:
Step5.2.1、将标注后的汉语和越南语文本中每个句子的向量表征si和观点句特征s′输入到多层感知机中,得到门控向量sGatei;具体公式为:sGatei=σ(Wssi+Uss′+b);
其中,Ws和Us是权重矩阵,b是偏置项,σ是sigmoid激活函数;
Step5.2.2、将Step4输出的隐藏状态hi,j和门控向量sGatei相乘,得到了融入观点句特征后隐藏状态h′i,j;具体公式为:h′i,j=hi,j⊙sGatei;其中,⊙表示向量对应元素相乘。
2.根据权利要求1所述的融入观点句特征的汉越双语新闻情感分类方法,其特征在于:所述步骤Step3中,分别使用标注好的汉语和越南语的新闻文本分别训练汉语和越南语的词嵌入模型,然后使用汉越平行句对词嵌入模型联合训练得到汉越双语词向量。
3.根据权利要求1所述的融入观点句特征的汉越双语新闻情感分类方法,其特征在于:所述步骤Step4中,将汉语或越南语标注文本中的双语词向量输入到双向LSTM网络中,得到文档中第i句话中第j个词的隐藏状态;具体公式为:
Figure FDA0002922919390000021
其中,
Figure FDA0002922919390000022
表示前向LSTM网络输出的隐藏状态,
Figure FDA0002922919390000023
表示后向LSTM网络输出的隐藏状态,其中,汉越双语词嵌入模型将汉语、越南语新闻的词编码为双语词向量。
4.根据权利要求1所述的融入观点句特征的汉越双语新闻情感分类方法,其特征在于:所述步骤Step5中,使用观点句特征来增强新闻文本的情感表达;通过多个不同大小的卷积核来抽取不同粒度的观点句特征,然后使用选择性门控网络将观点句特征融入模型的隐藏层中。
5.根据权利要求1所述的融入观点句特征的汉越双语新闻情感分类方法,其特征在于:所述步骤Step6的具体步骤如下:
Step6.1、首先,第一层是句子级的注意力机制,用两层前馈神经网络来预测句子级注意力的权重打分Ai;句子级注意力机制的具体公式为
Figure FDA0002922919390000024
Figure FDA0002922919390000025
其中,f是两层前馈神经网络,s′i是融入观点句信息后的句向量,θs表示前馈神经网络的参数;
Step6.2、然后,第二层是词级的注意力机制,同样用两层前馈神经网络来预测词级注意力的权重打分ai.j;词级注意力机制的具体公式为
Figure FDA0002922919390000026
Figure FDA0002922919390000027
其中,f同样是两层前馈神经网络,h′i,j是融入观点特征后第i句话第j个词的隐藏状态,θw是前馈神经网络的参数;
Step6.3、最后,将融入观点特征后的隐藏状态h′i,j和词级注意力打分ai.j进行累积求和,并且在句子级上同样和句子级注意力打分Ai进行累积求和,得到了文本的向量表征r,具体公式为
Figure FDA0002922919390000031
6.根据权利要求1所述的融入观点句特征的汉越双语新闻情感分类方法,其特征在于:所述步骤Step7中,使用softmax分类器对新闻的情感极性进行分类后,使用交叉熵损失来最小化输出结果和情感标签之间的预测误差,从而通过对预测样本和真实样本标记产生的误差反向传播指导网络参数学习;具体公式为
Figure FDA0002922919390000032
其中,
Figure FDA0002922919390000033
是模型预测的情感极性标签向量,yi是标记好的标签向量,λ||θ||2是L2正则化项。
CN201910635891.0A 2019-07-15 2019-07-15 融入观点句特征的汉越双语新闻情感分类方法 Active CN110347836B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910635891.0A CN110347836B (zh) 2019-07-15 2019-07-15 融入观点句特征的汉越双语新闻情感分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910635891.0A CN110347836B (zh) 2019-07-15 2019-07-15 融入观点句特征的汉越双语新闻情感分类方法

Publications (2)

Publication Number Publication Date
CN110347836A CN110347836A (zh) 2019-10-18
CN110347836B true CN110347836B (zh) 2021-07-09

Family

ID=68175292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910635891.0A Active CN110347836B (zh) 2019-07-15 2019-07-15 融入观点句特征的汉越双语新闻情感分类方法

Country Status (1)

Country Link
CN (1) CN110347836B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532380B (zh) * 2019-07-12 2020-06-23 杭州电子科技大学 一种基于记忆网络的文本情感分类方法
CN110968692B (zh) * 2019-10-23 2023-04-07 全球能源互联网研究院有限公司 一种文本分类方法及系统
CN110990564B (zh) * 2019-11-19 2023-12-01 北京信息科技大学 一种基于情感计算与多头注意力机制的负面新闻识别方法
CN111008274B (zh) * 2019-12-10 2021-04-06 昆明理工大学 特征扩展卷积神经网络的案件微博观点句识别构建方法
CN111414731B (zh) * 2020-02-28 2023-08-11 北京小米松果电子有限公司 文本标注方法和装置
CN111581943A (zh) * 2020-04-02 2020-08-25 昆明理工大学 一种基于句子关联图的汉越双语多文档新闻观点句识别方法
CN113626672A (zh) * 2021-02-26 2021-11-09 新大陆数字技术股份有限公司 基于rcnn网络的舆情分析方法及系统
CN113222059B (zh) * 2021-05-28 2023-01-03 北京理工大学 利用协作式神经网络链的多标签情感分类方法
CN117909506A (zh) * 2024-03-15 2024-04-19 中国电子科技集团公司第十研究所 一种基于细微特征的核心主题事件监测方法及设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804612B (zh) * 2018-05-30 2021-11-02 武汉烽火普天信息技术有限公司 一种基于对偶神经网络模型的文本情感分类方法
CN109902177B (zh) * 2019-02-28 2022-11-29 上海理工大学 基于双通道卷积记忆神经网络的文本情感分析方法
CN109933795B (zh) * 2019-03-19 2023-07-28 上海交通大学 基于上下文-情感词向量的文本情感分析系统

Also Published As

Publication number Publication date
CN110347836A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN110347836B (zh) 融入观点句特征的汉越双语新闻情感分类方法
Ishaq et al. Aspect-based sentiment analysis using a hybridized approach based on CNN and GA
CN107992597B (zh) 一种面向电网故障案例的文本结构化方法
Ain et al. Sentiment analysis using deep learning techniques: a review
Qian et al. Hierarchical CVAE for fine-grained hate speech classification
CN110472047B (zh) 一种多特征融合的汉越新闻观点句抽取方法
CN111401061A (zh) 基于BERT及BiLSTM-Attention的涉案新闻观点句识别方法
CN110287323B (zh) 一种面向目标的情感分类方法
CN112732916B (zh) 一种基于bert的多特征融合模糊文本分类系统
Wahid et al. Cricket sentiment analysis from Bangla text using recurrent neural network with long short term memory model
CN112749274B (zh) 基于注意力机制和干扰词删除的中文文本分类方法
Zhao et al. ZYJ123@ DravidianLangTech-EACL2021: Offensive language identification based on XLM-RoBERTa with DPCNN
CN109101490B (zh) 一种基于融合特征表示的事实型隐式情感识别方法和系统
CN112784041B (zh) 一种中文短文本情感倾向性分析方法
CN110472245B (zh) 一种基于层次化卷积神经网络的多标记情绪强度预测方法
CN112989033B (zh) 基于情绪类别描述的微博情绪分类方法
Bsir et al. Enhancing deep learning gender identification with gated recurrent units architecture in social text
CN113627151B (zh) 跨模态数据的匹配方法、装置、设备及介质
CN111538841B (zh) 基于知识互蒸馏的评论情感分析方法、装置及系统
CN112163091A (zh) 基于cnn的方面级跨领域情感分析方法
CN112597302A (zh) 基于多维评论表示的虚假评论检测方法
CN114417851A (zh) 一种基于关键词加权信息的情感分析方法
Rauf et al. Using bert for checking the polarity of movie reviews
CN115935975A (zh) 一种情感可控的新闻评论生成方法
Gandhi et al. Multimodal sentiment analysis: review, application domains and future directions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant