CN110046353A - 一种基于多语言层次机制的方面级情感分析方法 - Google Patents

一种基于多语言层次机制的方面级情感分析方法 Download PDF

Info

Publication number
CN110046353A
CN110046353A CN201910324300.8A CN201910324300A CN110046353A CN 110046353 A CN110046353 A CN 110046353A CN 201910324300 A CN201910324300 A CN 201910324300A CN 110046353 A CN110046353 A CN 110046353A
Authority
CN
China
Prior art keywords
word
vector
lstm network
sentence
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910324300.8A
Other languages
English (en)
Other versions
CN110046353B (zh
Inventor
黄贤英
刘广峰
刘小洋
范海波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Technology
Original Assignee
Chongqing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Technology filed Critical Chongqing University of Technology
Priority to CN201910324300.8A priority Critical patent/CN110046353B/zh
Publication of CN110046353A publication Critical patent/CN110046353A/zh
Application granted granted Critical
Publication of CN110046353B publication Critical patent/CN110046353B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于多语言层次机制的方面级情感分析方法,其特征在于,包括以下步骤:S1,将输入文本转化为向量表示;S2,获取输入文本中不同句子之间的时序关系,并获取方面词在单个句子中的局部特征和在整个句子中的长距离依赖关系;S3,基于分类特征来判别输入文本中不同方面的情感极性,将情感极性进行终端展示。本发明能够提高了情感分析的准确度和训练效率,并将情感展现在终端上。

Description

一种基于多语言层次机制的方面级情感分析方法
技术领域
本发明属于社交网络的人文计算技术领域,具体涉及一种基于多语言层次机制的方面级情感分析算法,主要用于但不限于用户评论情感计算和人机交互领域,主 要涉及技术包括文本数据处理、词嵌入处理以及模型特征抽取。
背景技术
如今互联网的兴起趋势不可阻挡,随之带动了社交平台和电商网站的兴起,从 而使得人们可以自由地对自己感兴趣的事物发表蕴含自己情感倾向的观点。针对用 户的情感观点表达进行情感分析不仅可以促进政府的舆情监管、企业的营销决策等 应用平台的发展,甚至对于当前火热的人机对话系统的发展也有一定的帮助作用。
为了针对社交网络中的评论文本进行高效且准确的情感分析,分析算法至关重要。当前该方面级情感分析方法以下缺陷与不足:
1、基于机器学习的情感分析方法需要依赖专家的专业认知以及大量的人工特征构建工作导致模型训练效率低下、模型泛化能力弱。
2、针对多语言文本,针对每一种语言进行特征表示,其表示工作较为复杂,且 忽略了未登入词这个问题。
3、用户评论文本中往往涉及多个评价方面,且不同方面往往对应不同的情感极性,然而现有网络模型无法充分获取同一评论中句子间的相互关系以及不同方面在 整个评论中的依赖关系。
针对以上问题,在对情感分析进行深入研究后,本专利提出了一种新的情感分 析算法,即基于多语言层次机制的方面级情感分析算法,提高了情感分析的准确度 和训练效率。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于多语言层次机制的方面级情感分析方法。
为了实现本发明的上述目的,本发明提供了一种基于多语言层次机制的方面级情感分析方法,包括以下步骤:
S1,将输入文本转化为向量表示;
S2,获取输入文本中不同句子之间的时序关系,并获取方面词在单个句子中的 局部特征和在整个句子中的长距离依赖关系;
S3,基于分类特征来判别输入文本中不同方面的情感极性,将用户评论的情感 展示出来。
在本发明的一种优选实施方式中,步骤S1包括:
对每一个用户评论进行主题词提取,并将所有主题词出现的次数由大到小排列,取前A1个主题词保存,所述A1为正整数;
将用户评论对应的主题词映射为一个m维的连续值向量;
并将用户评论对应的方面词映射为一个m维的连续值向量。
在本发明的一种优选实施方式中,步骤S2包括以下步骤:
S21,对输入文本进行词嵌入操作;
S22,对于长度为d的独立区域rk,将独立区域rk中每一个词语映射为一个m维 的连续值向量,得到每一个区域的向量表示,
将用户评论中的每一个独立区域作为卷积神经网络的输入,然后使用长度为l的卷积核对独立区域rk做卷积操作:
Nk=f(w·rk+b),
其中,f()为非线性激活函数,w为卷积核权重,b为偏置项,对每一个区域 通过卷积操作可以得到独立区域rk的特征图N:
对于每一个区域,采用max-pooling方法进行局部特征的下采样,提取每一个特征图N最重要的特征信息:
N=max-pooling(N),
经过词向量模型得到的句子词向量信息以及区域CNN输出的特征信息,按下述 步骤进行执行:
第一步,使用词语层网络将方面向量和主题向量分别与LSTM网络的上一个神 经单元的隐藏层输出结合作为下一个LSTM神经单元的输入:
其中U和T分别为对应隐藏层输出的权重矩阵,Wα和Wβ分别为方面 词向量α和主题词向量β的权重矩阵;为正向LSTM网络函数;反向LSTM网络函数;为正向LSTM网络的上一个神经单元的隐藏层输出,为正向LSTM网络的神经单元的隐藏层输出,easpect为方面词对应的深度特征,etopic为主题词对应的深度特征;
为反向LSTM网络的上一个神经单元的隐藏层输出,为反向LSTM网络 的神经单元的隐藏层输出;
第二步,将区域CNN的输出按句子的先后顺序形成序列化矩阵和将词语层 Bi-LSTM网络的最终输出结合作为句子层双向LSTM网络的输入:
其中hL、hL′分别为词语层两个LSTM网络最后一层LSTM单元的输出,为简 单拼接操作,N为提取特征图最重要的特征信息;
通过两个LSTM网络生成对应的隐藏状态输出P={P1,P2,P3,…,Pk}、 Q={Q1,Q2,Q3,…,Qk},P1,Q1为两个LSTM网络第一层输出,P2,Q2为两个LSTM 网络第二层输出,P3,Q3为两个LSTM网络第三层输出,Pk,Qk为两个LSTM网 络最后一层输出,将其最后一层LSTM网络输出进行拼接所得到的向量即为本文所 需要的情感分类向量:
在本发明的一种优选实施方式中,步骤S1包括以下步骤:
S11,对于输入句子的每个词wζ,ζ为词在句子中的序号,使用一个预训练的词 查找表E,将其表示为一个低维向量
其中,为词wζ的one-hot编码;
S12,使用字符级别的卷积神经网络得到词语对应的字符向量表示;首先使用一个预定义的字符查找表,将输入词中的每一个字符映射为一个低维的字符向量;这 样每个单词可表示为一个字符矩阵;然后将字符矩阵作为卷积神经网络的输入,得 到每个词在字符级别的词嵌入;使用C[i:j]表示矩阵C第i行到第j行之间所有行构 成的子矩阵;卷积神经网络使用一个维度为h×ψ的滤波器,在大小为h个字符的窗 口上进行卷积,产生一个特征序列c:
cξ=f(w·C[ξ:ξ+h-1]+b),
其中,f()为非线性激活函数,w为卷积核权重,b为偏置项;然后使用 max-pooling对特征序列求最大值,得到该滤波器产生的特征 最后使用n个滤波器产生n个特征,将这n个特征进行拼接得 到词;
S13,使用门机制来自适应地选择最合适的融合方式,得到词语的最终向量表示:
其中,G1、G2、G3和G4为变换参数,将字符级别的词向量变换到与相同维度的空间中,得到σ()为sigmoid函数,g为门权重值,用来 衡量的重要性,最终得到每个词wζ的向量表示
在本发明的一种优选实施方式中,步骤S3中,情感极性的计算方法为:
y=softmax(W·C+b),
其中W为权重矩阵,b为偏置项,softmax()为softmax函数。
在本发明的一种优选实施方式中,还包括对情感极性计算交叉熵,情感极性交 叉熵的计算方法为:
其中,Y为训练集样本集合,O为类别标签集合,为待分类句子的实际类别,为待分类句子的预测类别,λ||θ||2为交叉熵的正则项,λ为正则参数、θ为正则 算子,|| ||为范数。
综上所述,由于采用了上述技术方案,本发明能够提高了情感分析的准确度和 训练效率,并将情感展现在终端上。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为基于多语言层次机制的方面级情感分析算法的模型架构图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至 终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件;下面通 过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明 的限制;
该算法包括如下步骤:
(1)利用gensim对每一个用户评论进行主题词提取并取结果中的前5个主题词 保存,以及进行方面词提取。本文将用户评论对应的主题词映射为一个m维的连续 值向量,即β∈Rm,其中β为主题词对应的词向量值,m为词向量维度。并将句子 中每一个方面词映射为一个m维的连续值向量,即α∈Rm,其中α为方面词对应的 词向量值。
(2)针对输入文本进行词嵌入操作,分为三个步骤:
第一步,对于输入句子的每个词wζ,ζ为词在句子中的序号,使用一个预训练 的词查找表E,E∈R|V|×m,将其表示为一个低维向量
其中,|V|为预训练的词查找表大小,为词wi的one-hot编码,针对英文文本,本文使用斯坦福发布的维度为200的词向量glove.6B.200d.txt,作为预 训练的英文词查找表。针对中文文本,本文使用腾讯AILab发布的维度为200的词 向量Tencent_AILab_ChineseEmbedding.tar,作为预训练的中文词查找表。对于法语 文本,本文使用frWac工具获取相应的单词查找表。对于其他语言的文本,本文使用 Leipzig CorporaCollection获取相应的单词查找表。
第二步,使用字符级别的卷积神经网络得到词语对应的字符向量表示。首先使 用一个预定义的字符查找表,将输入词中的每一个字符映射为一个低维的字符向量 j为字符在词中的序号。这样每个单词可表示为一个字符矩阵其中,C∈Rψ×s,ψ为字符向量的维度,s为词wζ的维度。 然后将字符矩阵C作为卷积神经网络的输入,得到每个词在字符集别的词嵌入。使 用C[i:j]表示矩阵C第i行到第j行之间所有行构成的子矩阵。卷积神经网络使用一 个维度为h×ψ的滤波器,在大小为h个字符的窗口上进行卷积,产生一个特征序列c, c∈Rs-h+1
cξ=f(w·C[ξ:ξ+h-1]+b),
其中,f()为非线性激活函数,w为卷积核权重,b为偏置项。然后使用 max-pooling对特征序列求最大值,得到该滤波器产生的特征 最后使用n个滤波器产生n个特征,将这n个特征进行拼接得 到词,在字符级别的向量表示:
第三步,使用门机制来自适应地选择最合适的融合方式,得到词语的最终向量 表示:
其中,G1,G2,G3和G4为变换参数,等价于G1∈Rm×n,G2∈Rm,G3∈R2m,G4∈R,将字符级别的词向 量变换到与相同维度的空间中,得到σ()为sigmoid函数, g为门权重值,g∈R,用来衡量的重要性。最终得到每个词wζ的向 量表示即为图1中WordEmbedding层的输出。
(3)对于长度为d的独立区域rk,k为独立区域的序号,本文将独立区域rk中 每一个词语映射为一个m维的连续值向量,得到每一个区域的向量表示 rk={W1,W2,W3,…,Wd},W1、W2、W3、……、Wd分别为独立区域rk中每一个词语 映射的m维的连续值向量;其中Wμ∈Rm,μ=1,2,3,...,d。将一个用户评论中的每 一个独立区域作为卷积神经网络的输入,然后使用长度为l的卷积核对独立区域rk做 卷积操作:
Nk=f(w·rk+b)
其中w为卷积核权重,f()为非线性激活函数,w∈Rm×l;b为偏置项,b∈R。 对每一个区域通过卷积操作可以得到独立区域rk的特征图N,N∈Rd-l+1
N=[N1,N2,N3,…,Nk],
对于每一个区域,本文采用max-pooling方法进行局部特征的下采样,提取每一个特征图N最重要的特征信息:
N=max-pooling(N),
对于有k个卷积核的窗口则为:
N=[N1,N2,N3,…,Nk],
(4)针对经过词向量模型得到的句子词向量信息以及区域CNN输出的特征信 息,按下述步骤进行执行:
第一步,使用词语层网络将方面向量和主题向量分别与LSTM网络的上一个神 经单元的隐藏层输出结合作为下一个LSTM神经单元的输入:
其中U和T分别为对应隐藏层输出的权重矩阵,Wα和Wβ分别为方面词向量α和主题词向量β的权重矩阵,{Wα,Wβ}∈Rm×m为正向LSTM网络函数;反向LSTM网络函数;为正向 LSTM网络的上一个神经单元的隐藏层输出,为正向LSTM网络的神经单元的隐 藏层输出,easpect为方面词对应的深度特征,etopic为主题词对应的深度特征;
为反向LSTM网络的上一个神经单元的隐藏层输出,为反向LSTM网络 的神经单元的隐藏层输出。
第二步,将区域CNN的输出按句子的先后顺序形成序列化矩阵和将词语层 Bi-LSTM网络的最终输出结合作为句子层双向LSTM网络的输入:
其中hL、hL′分别为词语层两个LSTM网络最后一层LSTM单元的输出,为简 单拼接操作,N为提取特征图最重要的特征信息。
通过两个LSTM网络生成对应的隐藏状态输出P={P1,P2,P3,…,Pk}、 Q={Q1,Q2,Q3,…,Qk},P1,Q1为两个LSTM网络第一层输出,P2,Q2为两个LSTM 网络第二层输出,P3,Q3为两个LSTM网络第三层输出,Pk,Qk为两个LSTM网 络最后一层输出,将其最后一层LSTM网络输出进行拼接所得到的向量即为本文所 需要的情感分类向量:
通过这种方式既可以使模型在训练过程中高度关注特定方面在整个评论中的特征信息,也可以有效挖掘句子之间的依赖关系。
(5)使用softmax函数对句子层Bi-LSTM网络的输出进行处理,得到待分类句 子的情感极性:
y=softmax(W·C+b)
其中W为权重矩阵,b为偏置,softmax()为softmax函数。
使用反向传播算法来训练网络模型,在训练过程中使用最小化交叉熵损失作为优化目标,交叉熵公式如下所示:
其中,Y为训练集样本集合,O为类别标签集合,为待分类句子的实际类 别,为待分类句子的预测类别,λ||θ||2为交叉熵的正则项,λ为正则参数、θ为 正则算子,|| ||为范数。
在本实施方式中,R|V|×m,R|V|,Rψ,Rh×ψ,Rs-h+1,Rm×n,R2m,Rd-l+1中,R 为实数空间,R的上标为维度。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在 不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换 和变型,本发明的范围由权利要求及其等同物限定。

Claims (6)

1.一种基于多语言层次机制的方面级情感分析方法,其特征在于,包括以下步骤:
S1,将输入文本转化为向量表示;
S2,获取输入文本中不同句子之间的时序关系,并获取方面词在单个句子中的局部特征和在整个句子中的长距离依赖关系;
S3,基于分类特征来判别输入文本中不同方面的情感极性,将用户评论的情感展示出来。
2.根据权利要求1所述的基于多语言层次机制的方面级情感分析方法,其特征在于,步骤S1包括:
对每一个用户评论进行主题词提取,并将所有主题词出现的次数由大到小排列,取前A1个主题词保存,所述A1为正整数;
将用户评论对应的主题词映射为一个m维的连续值向量;
并将用户评论对应的方面词映射为一个m维的连续值向量。
3.根据权利要求1所述的基于多语言层次机制的方面级情感分析方法,其特征在于,步骤S2包括以下步骤:
S21,对输入文本进行词嵌入操作;
S22,对于长度为d的独立区域rk,将独立区域rk中每一个词语映射为一个m维的连续值向量,得到每一个区域的向量表示,
将用户评论中的每一个独立区域作为卷积神经网络的输入,然后使用长度为l的卷积核对独立区域rk做卷积操作:
Nk=f(w·rk+b),
其中,f()为非线性激活函数,w为卷积核权重,b为偏置项,对每一个区域通过卷积操作可以得到独立区域rk的特征图N:
对于每一个区域,采用max-pooling方法进行局部特征的下采样,提取每一个特征图N最重要的特征信息:
N=max-pooling(N),
经过词向量模型得到的句子词向量信息以及区域CNN输出的特征信息,按下述步骤进行执行:
第一步,使用词语层网络将方面向量和主题向量分别与LSTM网络的上一个神经单元的隐藏层输出结合作为下一个LSTM神经单元的输入:
其中U和T分别为对应隐藏层输出的权重矩阵,Wα和Wβ分别为方面词向量α和主题词向量β的权重矩阵;为正向LSTM网络函数;为反向LSTM网络函数;为正向LSTM网络的上一个神经单元的隐藏层输出,为正向LSTM网络的神经单元的隐藏层输出,easpect为方面词对应的深度特征,etopic为主题词对应的深度特征;
为反向LSTM网络的上一个神经单元的隐藏层输出,为反向LSTM网络的神经单元的隐藏层输出;
第二步,将区域CNN的输出按句子的先后顺序形成序列化矩阵和将词语层Bi-LSTM网络的最终输出结合作为句子层双向LSTM网络的输入:
其中hL、hL′分别为词语层两个LSTM网络最后一层LSTM单元的输出,为简单拼接操作,N为提取特征图最重要的特征信息;
通过两个LSTM网络生成对应的隐藏状态输出P={P1,P2,P3,…,Pk}、Q={Q1,Q2,Q3,…,Qk},P1,Q1为两个LSTM网络第一层输出,P2,Q2为两个LSTM网络第二层输出,P3,Q3为两个LSTM网络第三层输出,Pk,Qk为两个LSTM网络最后一层输出,将其最后一层LSTM网络输出进行拼接所得到的向量即为本文所需要的情感分类向量:
4.根据权利要求1所述的基于多语言层次机制的方面级情感分析方法,其特征在于,步骤S1包括以下步骤:
S11,对于输入句子的每个词wζ,ζ为词在句子中的序号,使用一个预训练的词查找表E,将其表示为一个低维向量
其中,v为词wζ的one-hot编码;
S12,使用字符级别的卷积神经网络得到词语对应的字符向量表示;首先使用一个预定义的字符查找表,将输入词中的每一个字符映射为一个低维的字符向量;这样每个单词可表示为一个字符矩阵;然后将字符矩阵作为卷积神经网络的输入,得到每个词在字符级别的词嵌入;使用C[i:j]表示矩阵C第i行到第j行之间所有行构成的子矩阵;卷积神经网络使用一个维度为h×ψ的滤波器,在大小为h个字符的窗口上进行卷积,产生一个特征序列c:
cξ=f(w·C[ξ:ξ+h-1]+b),
其中,f()为非线性激活函数,w为卷积核权重,b为偏置项;然后使用max-pooling对特征序列求最大值,得到该滤波器产生的特征最后使用n个滤波器产生n个特征,将这n个特征进行拼接得到词;
S13,使用门机制来自适应地选择最合适的融合方式,得到词语的最终向量表示:
其中,G1、G2、G3和G4为变换参数,将字符级别的词向量变换到与相同维度的空间中,得到σ()为sigmoid函数,g为门权重值,用来衡量的重要性,最终得到每个词wζ的向量表示
5.根据权利要求1所述的基于多语言层次机制的方面级情感分析方法,其特征在于,步骤S3中,情感极性的计算方法为:
y=softmax(W·C+b),
其中W为权重矩阵,b为偏置项,softmax()为softmax函数。
6.根据权利要求5所述的基于多语言层次机制的方面级情感分析方法,其特征在于,还包括对情感极性计算交叉熵,情感极性交叉熵的计算方法为:
其中,Y为训练集样本集合,O为类别标签集合,为待分类句子的实际类别,为待分类句子的预测类别,λ||θ||2为交叉熵的正则项,λ为正则参数、θ为正则算子,|| ||为范数。
CN201910324300.8A 2019-04-22 2019-04-22 一种基于多语言层次机制的方面级情感分析方法 Active CN110046353B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910324300.8A CN110046353B (zh) 2019-04-22 2019-04-22 一种基于多语言层次机制的方面级情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910324300.8A CN110046353B (zh) 2019-04-22 2019-04-22 一种基于多语言层次机制的方面级情感分析方法

Publications (2)

Publication Number Publication Date
CN110046353A true CN110046353A (zh) 2019-07-23
CN110046353B CN110046353B (zh) 2022-05-13

Family

ID=67278354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910324300.8A Active CN110046353B (zh) 2019-04-22 2019-04-22 一种基于多语言层次机制的方面级情感分析方法

Country Status (1)

Country Link
CN (1) CN110046353B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457543A (zh) * 2019-07-25 2019-11-15 中国科学院软件研究所 一种基于端到端多视角匹配的实体消解方法和系统
CN111026845A (zh) * 2019-12-06 2020-04-17 北京理工大学 一种获取多层次上下文语义的文本分类方法
CN111160037A (zh) * 2019-12-02 2020-05-15 广州大学 一种支持跨语言迁移的细粒度情感分析方法
CN111241849A (zh) * 2020-01-21 2020-06-05 重庆理工大学 一种文本语义分析方法及系统
CN111259153A (zh) * 2020-01-21 2020-06-09 桂林电子科技大学 一种完全注意力机制的属性级情感分析方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001052032A (ja) * 1999-05-28 2001-02-23 Nippon Telegr & Teleph Corp <Ntt> 要約文作成方法及び装置及び要約文作成プログラムを格納した記憶媒体
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN107291795A (zh) * 2017-05-03 2017-10-24 华南理工大学 一种结合动态词嵌入和词性标注的文本分类方法
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN108427670A (zh) * 2018-04-08 2018-08-21 重庆邮电大学 一种基于语境词向量和深度学习的情感分析方法
CN108875021A (zh) * 2017-11-10 2018-11-23 云南大学 一种基于区域cnn-lstm的情感分析方法
CN109299253A (zh) * 2018-09-03 2019-02-01 华南理工大学 一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法
CN109299262A (zh) * 2018-10-09 2019-02-01 中山大学 一种融合多粒度信息的文本蕴含关系识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001052032A (ja) * 1999-05-28 2001-02-23 Nippon Telegr & Teleph Corp <Ntt> 要約文作成方法及び装置及び要約文作成プログラムを格納した記憶媒体
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN107291795A (zh) * 2017-05-03 2017-10-24 华南理工大学 一种结合动态词嵌入和词性标注的文本分类方法
CN108875021A (zh) * 2017-11-10 2018-11-23 云南大学 一种基于区域cnn-lstm的情感分析方法
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN108427670A (zh) * 2018-04-08 2018-08-21 重庆邮电大学 一种基于语境词向量和深度学习的情感分析方法
CN109299253A (zh) * 2018-09-03 2019-02-01 华南理工大学 一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法
CN109299262A (zh) * 2018-10-09 2019-02-01 中山大学 一种融合多粒度信息的文本蕴含关系识别方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
LEI Z. 等: "SAAN: a sentiment-aware attention network for sentiment analysis", 《THE 41ST INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH & DEVELOPMENT IN INFORMATION RETRIEVAL》 *
LEI ZEYANG 等: "A Multi-sentiment-resource Enhanced Attention Network for Sentiment Classification", 《网页在线公开:HTTPS://ARXIV.ORG/ABS/1807.04990》 *
SCHOUTEN KIM 等: "Survey on aspect-level sentiment analysis", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 *
何炎祥 等: "用于微博情感分析的一种情感语义增强的深度学习模型", 《计算机学报》 *
黄宏程 等: "用户兴趣相似性度量的关系预测算法", 《计算机科学与探索》 *
黄贤英 等: "融合兴趣的微博用户相似度计算研究", 《计算机应用研究》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457543A (zh) * 2019-07-25 2019-11-15 中国科学院软件研究所 一种基于端到端多视角匹配的实体消解方法和系统
CN110457543B (zh) * 2019-07-25 2021-10-22 中国科学院软件研究所 一种基于端到端多视角匹配的实体消解方法和系统
CN111160037A (zh) * 2019-12-02 2020-05-15 广州大学 一种支持跨语言迁移的细粒度情感分析方法
WO2021109671A1 (zh) * 2019-12-02 2021-06-10 广州大学 一种支持跨语言迁移的细粒度情感分析方法
CN111026845A (zh) * 2019-12-06 2020-04-17 北京理工大学 一种获取多层次上下文语义的文本分类方法
CN111026845B (zh) * 2019-12-06 2021-09-21 北京理工大学 一种获取多层次上下文语义的文本分类方法
CN111241849A (zh) * 2020-01-21 2020-06-05 重庆理工大学 一种文本语义分析方法及系统
CN111259153A (zh) * 2020-01-21 2020-06-09 桂林电子科技大学 一种完全注意力机制的属性级情感分析方法

Also Published As

Publication number Publication date
CN110046353B (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
Peng et al. A survey on deep learning for textual emotion analysis in social networks
Roy et al. Unit dependency graph and its application to arithmetic word problem solving
CN110222188B (zh) 一种多任务学习的公司公告处理方法及服务端
CN110046353A (zh) 一种基于多语言层次机制的方面级情感分析方法
Huang et al. Lexicon-based sentiment convolutional neural networks for online review analysis
US20160350288A1 (en) Multilingual embeddings for natural language processing
Mitra et al. Helpfulness of online consumer reviews: A multi-perspective approach
Fetaya et al. Restoration of fragmentary Babylonian texts using recurrent neural networks
Al-Shaibani et al. Meter classification of Arabic poems using deep bidirectional recurrent neural networks
Neto et al. Automatic content analysis of online discussions for cognitive presence: A study of the generalizability across educational contexts
CN110134934A (zh) 文本情感分析方法和装置
CN115329200A (zh) 一种基于知识图谱和用户相似度的教学资源推荐方法
CN111368082A (zh) 一种基于层次网络的领域自适应词嵌入的情感分析方法
CN112287197B (zh) 动态记忆案件描述的涉案微博评论讽刺句检测方法
Dou et al. Improving word embeddings for antonym detection using thesauri and sentiwordnet
CN116757164A (zh) 一种gpt生成语言识别与检测系统
Huang et al. A window-based self-attention approach for sentence encoding
CN115906816A (zh) 一种基于Bert的双通道Attention模型的文本情感分析方法
Diao et al. Multi-granularity bidirectional attention stream machine comprehension method for emotion cause extraction
CN114970557A (zh) 基于知识增强的跨语言结构化情感分析方法
CN115600561A (zh) 融合规则与小样本的网页结构化方法、设备和存储介质
CN113449103B (zh) 融入标签与文本交互机制的银行交易流水分类方法及系统
Markov et al. Exploiting native language interference for native language identification
Rai et al. Identification of landscape preferences by using social media analysis
Liu et al. TCAMixer: A lightweight Mixer based on a novel triple concepts attention mechanism for NLP

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant