CN113254637A - 一种融合语法的方面级文本情感分类方法及系统 - Google Patents

一种融合语法的方面级文本情感分类方法及系统 Download PDF

Info

Publication number
CN113254637A
CN113254637A CN202110495625.XA CN202110495625A CN113254637A CN 113254637 A CN113254637 A CN 113254637A CN 202110495625 A CN202110495625 A CN 202110495625A CN 113254637 A CN113254637 A CN 113254637A
Authority
CN
China
Prior art keywords
text
classified
word
level
grammar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110495625.XA
Other languages
English (en)
Other versions
CN113254637B (zh
Inventor
刘培玉
刘杰
朱振方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN202110495625.XA priority Critical patent/CN113254637B/zh
Publication of CN113254637A publication Critical patent/CN113254637A/zh
Application granted granted Critical
Publication of CN113254637B publication Critical patent/CN113254637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种融合语法的方面级文本情感分类方法及系统,对待分类方面级情感文本进行预处理,得到待分类的文本信息;将待分类文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;分类时先对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;对带有语法感知的文本表示,获取依赖关系向量矩阵;从依赖关系向量矩阵中,选择最显著特征;对最显著特征进行分类,得到分类结果。考虑了语法信息对方面级情感分析任务的重要性,将语法依赖邻近转化为权重,加入权重后提高下游情感分析任务的准确度。

Description

一种融合语法的方面级文本情感分类方法及系统
技术领域
本发明涉及自然语言处理技术领域,特别是涉及一种融合语法的方面级文本情感分类方法及系统。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
随着互联网的蓬勃发展,越来越越多的用户乐于在互联网社交平台分享自己的观点与体验,在线评论信息呈指数增长,互联网信息也更加全面、可靠。对这些带有情感极性的评论信息进行分析,可以帮助我们快速地了解不同人对于该事物所持有的看法和态度。近年来,在自然语言处理领域如何利用深度学习技术去分析网络上评论文本的情感极性,已经成为一大研究热点。这在商业应用以及舆情分析中有着极其重要的应用。
情感分析技术也称为观点挖掘,通过计算机的相关技术手段对用户表达的内容进行分析,进而推断出用户的情感倾向。方面级情感分析是情感分析的一个分支,方面级情感分析的目标是确定句子中的特定方面的情感极性(如积极、消极和中性)。在句子“Theprice is reasonable although the service is poor”中“price”和“service”是两个方面,“reasonable”和“poor”分别是方面“price”和“service”对应的情感极性词语。尽管之前的研究取得了显著的进步,但之前的研究通常关注如何根据组成词与相应方面的语义关联来获得上下文表示,而忽略了语法信息,这会导致错误地识别描述方面的关键上下文词汇。
发明内容
为了解决现有技术的不足,本发明提供了一种融合语法的方面级文本情感分类方法及系统;
第一方面,本发明提供了一种融合语法的方面级文本情感分类方法;
一种融合语法的方面级文本情感分类方法,包括:
获取待分类的方面级情感文本;对待分类的方面级情感文本进行预处理,得到待分类的文本信息;
将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;
其中,训练后的深度学习模型,先对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;然后,对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;然后,对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;然后,对带有语法感知的文本表示,获取依赖关系向量矩阵;然后,从依赖关系向量矩阵中,选择最显著特征;最后,对最显著特征进行分类,得到待分类方面级文本情感的分类结果。
第二方面,本发明提供了一种融合语法的方面级文本情感分类系统;
一种融合语法的方面级文本情感分类系统,包括:
预处理模块,其被配置为:获取待分类的方面级情感文本;对待分类的方面级情感文本进行预处理,得到待分类的文本信息;
分类模块,其被配置为:将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;
其中,训练后的深度学习模型,先对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;然后,对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;然后,对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;然后,对带有语法感知的文本表示,获取依赖关系向量矩阵;然后,从依赖关系向量矩阵中,选择最显著特征;最后,对最显著特征进行分类,得到待分类方面级文本情感的分类结果。
第三方面,本发明还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。
第四方面,本发明还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
与现有技术相比,本发明的有益效果是:
本发明充分考虑了语法信息对方面级情感分析任务的重要性,将语法依赖邻近转化为权重,加入权重后可以提高下游情感分析任务的准确度。
图卷积网络进一步得到具有语法感知的文本信息和长距离依赖关系,从而有效的提高情感分析的准确率。
本发明首先使用双向GRU获取隐藏状态信息,在获得隐藏状态信息之后考虑将语法依赖信息加入,将语法依赖信息形式化为权重加入到模型,然后将得到的带有语法信息的表示输入到图卷积网络,图卷积网络进一步利用句子中的句法依存结构,解决方面情感分析的长期依存问题,输出的特征只有少数对我们的分类任务有指导意义,因此通过max-pooling来选择最显著的特征。最后预测方面的情感极性。本发明的模型简易、轻便。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本公开实施例的方面级情感分析方法流程图;
图2是本公开实施例的方面级情感分析的模型图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明主要解决文本情感分析中方面级情感分析的问题。现有的方法大多只根据潜在语义空间中的词向量表示计算注意权重,忽略语法信息对方面情感分析任务的重要性。
术语解释:GloVe模型(Global vectors for word representation),进行词的向量化表示,使得向量之间尽可能多地蕴含语义和语法的信息。
实施例一
本实施例提供了一种融合语法的方面级文本情感分类方法;
如图1所示,一种融合语法的方面级文本情感分类方法,包括:
S101:获取待分类的方面级情感文本;对待分类的方面级情感文本进行预处理,得到待分类的文本信息;
S102:将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;
其中,训练后的深度学习模型,先对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;然后,对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;然后,对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;然后,对带有语法感知的文本表示,获取依赖关系向量矩阵;然后,从依赖关系向量矩阵中,选择最显著特征;最后,对最显著特征进行分类,得到待分类方面级文本情感的分类结果。
进一步地,所述方面级文本情感分类,具体是指:给定一个文本句子——Theprice is reasonable although the service is poor,在这个句子中“price”和“service”是两个方面,“reasonable”和“poor”分别是方面“price”和方面“service”对应的情感极性词语。方面级文本情感分类就是识别给定文本中的方面所表达的情感极性。
进一步地,所述对待分类的方面级情感文本进行预处理,得到待分类的文本信息;具体包括:
S1011:对待分类的方面级情感文本进行分词处理,对分词处理后的结果进行去除停用词处理;
S1012:将去除停用词处理后得到的结果,输入到神经网络中,得到待分类的文本信息;所述待分类的文本信息为设定长度的文本。
设定长度的文本例如设定长度为20,超出的部分会被舍弃,不足的部分会被补齐(补零)。
进一步地,如图2所示,所述S102:将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;其中,深度学习模型的网络结构包括:
依次连接的嵌入层、隐藏状态层、加权层、图卷积网络层、最大池化层和分类器;
所述嵌入层,用于使用嵌入矩阵对每个单词进行降维处理;实现对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;其中,每个词被嵌入成低维实值向量,形成嵌入矩阵。
所述隐藏状态层,通过双向门控循环单元GRU来实现;用于对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;
所述加权层,用于基于当前单词的上下文单词,计算每个单词的权重;对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;
所述图卷积网络层,对带有语法感知的文本表示,获取依赖关系向量矩阵;
所述最大池化层,从依赖关系向量矩阵中,选择最显著特征;
所述分类器,在整个模型框架中起到分类的作用。
示例性的,所述嵌入层,针对给定文本序列:
s={w1,w2,...,wr+1,…,wr+m,…,wn},
文本序列中包含m个方面词。
使用嵌入矩阵来得到每个单词的固定单词嵌入。
所述嵌入矩阵是将词的特征组成矩阵,实现了词语转化为数字向量的形式。
所述嵌入矩阵,是通过已知数字向量的若干个词语对Glove模型进行反复训练得到的。
嵌入矩阵表示为E∈Rde×V,其中de是单词向量的维数,V是词汇大小。
示例性的,所述隐藏状态层,通过双向门控循环单元GRU来实现;
经过双向GRU之后得到的隐藏表示向量为:
H={h1,h2,...,hr+1,...,hr+m,...,hn}。
进一步地,所述加权层,用于基于当前单词的上下文单词,计算每个单词的权重;具体包括:
根据基于当前单词的上下文单词构建依赖树,在依赖树中计算上下文单词基于所构建依赖树的距离,即上下文单词与方面词之间的最短路径的长度;
若当前方面单词含有多个单词,则取上下文单词和所有方面词之间基于树的最小距离作为每个方面单词的权重。
句子中的语法权重表示为:
Figure BDA0003054150610000071
其中,pi是第i个单词的权重;di表示上下文单词与方面词之间基于依赖树的最短路径的长度,n是上下文单词文本的长度;
最后,得到带有语法感知的文本表示H(hc):
H(hc)=pihi
其中,pi是第i个单词权重,hi是经过GRU的向量表示。
应理解的,考虑到语法信息对方面情感分析的重要性。在这里将语法感知信息形式化为权重,权重描述上下文词对方面的接近程度。
应理解的,所述加权层,将语法依赖信息转化为一种权重,运用上下文词汇对方面的语法邻近度(即权重),来确定当前词汇在句子中的重要性。
进一步地,所述图卷积网络层,对带有语法感知的文本表示进行处理,获取句子的语法信息和长距离依赖关系向量矩阵。
示例性的,图卷积网络层采用两层图卷积网络。
根据单词构建上下文单词的邻接矩阵A∈Rn×n,图卷积网络中每个节点的表示用有归一化因子的卷积运算更新,具体更新公式为:
Figure BDA0003054150610000081
其中
Figure BDA0003054150610000082
是从前一层的GCN演化而来的第j个令牌的表示。
Figure BDA0003054150610000083
其中,σ是ReLU函数,
Figure BDA0003054150610000084
进一步地,所述最大池化层,用于从图卷积神经网络输出的向量矩阵中,选择最显著的特征。
运用核长为n的最大池化操作,选择出最显著的特征:
r=[max hi,j]T0≤i<n。
应理解的,所述分类器,用于最显著特征进行分类,得到待分类方面级情感文本的分类结果。
示例性的,所述分类器,是将获取的最显著的特征嵌入到分类器,特征表示r输入到分类器,
y=softmax(Wf Tr+bf)
其中Wf是学习权重,bf是分类器的偏差。
进一步地,所述分类器,采用Softmax分类函数。
进一步地,所述S102:将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;深度学习模型的训练步骤包括:
构建第二训练集;所述第二训练集为已知分类结果的文本信息;
将第二训练集,输入到深度学习模型中,进行反复训练,当损失函数达到最小值时或迭代次数满足设定次数时,停止训练,得到训练后的深度学习模型。
示例性的,所述第二训练集,在具体实施中,选择方面情感分析的三个标准数据集,分别为Twitter、Laptop和Restaurant。三个公开标准数据集中每个数据集都分别被标记为三种情感极性,分别为积极、消极和中立。每个类别中的训练和测试实例的每种情感极性的具体数量如表1所示。
表1数据集
Figure BDA0003054150610000091
Figure BDA0003054150610000101
进一步地,所述损失函数,采用带有L2正则项的交叉熵损失函数。
进一步地,带有L2正则项的交叉熵损失函数:
Figure BDA0003054150610000102
其中,C是数据集的集合,
Figure BDA0003054150610000103
是集合y的第
Figure BDA0003054150610000104
个元素。λ是L2正则化系数,θ指可训练的参数。
实施例二
本实施例提供了一种融合语法的方面级情感文本分类系统;
一种融合语法的方面级情感文本分类系统,包括:
预处理模块,其被配置为:获取待分类的方面级情感文本;对待分类的方面级情感文本进行预处理,得到待分类的文本信息;
分类模块,其被配置为:将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;
其中,训练后的深度学习模型,先对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;然后,对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;然后,对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;然后,对带有语法感知的文本表示,获取依赖关系向量矩阵;然后,从依赖关系向量矩阵中,选择最显著特征;最后,对最显著特征进行分类,得到待分类方面级文本情感的分类结果。
此处需要说明的是,上述预处理模块和分类模块对应于实施例一中的步骤S101至S102,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种融合语法的方面级文本情感分类方法,其特征是,包括:
获取待分类的方面级情感文本;对待分类的方面级情感文本进行预处理,得到待分类的文本信息;
将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;
其中,训练后的深度学习模型,先对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;然后,对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;然后,对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;然后,对带有语法感知的文本表示,获取依赖关系向量矩阵;然后,从依赖关系向量矩阵中,选择最显著特征;最后,对最显著特征进行分类,得到待分类方面级文本情感的分类结果。
2.如权利要求1所述的一种融合语法的方面级文本情感分类方法,其特征是,对待分类的方面级情感文本进行预处理,得到待分类的文本信息;具体包括:
对待分类的方面级情感文本进行分词处理,对分词处理后的结果进行去除停用词处理;
将去除停用词处理后得到的结果,输入到神经网络中,得到待分类的文本信息;所述待分类的文本信息为设定长度的文本。
3.如权利要求1所述的一种融合语法的方面级文本情感分类方法,其特征是,将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;其中,深度学习模型的网络结构包括:
依次连接的嵌入层、隐藏状态层、加权层、图卷积网络层、最大池化层和分类器;
所述嵌入层,用于使用嵌入矩阵对每个单词进行降维处理;实现对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;其中,每个词被嵌入成低维实值向量,形成嵌入矩阵;
所述隐藏状态层,通过双向门控循环单元GRU来实现;用于对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;
所述加权层,基于当前单词的上下文单词,计算每个单词的权重;对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;
所述图卷积网络层,对带有语法感知的文本表示,获取依赖关系向量矩阵;
所述最大池化层,从依赖关系向量矩阵中,选择最显著特征;
所述分类器,在整个模型框架中起到分类的作用。
4.如权利要求3所述的一种融合语法的方面级文本情感分类方法,其特征是,所述加权层,基于当前单词的上下文单词,计算每个单词的权重;具体包括:
根据基于当前单词的上下文单词构建依赖树,在依赖树中计算上下文单词基于所构建依赖树的距离,即上下文单词与方面词之间的最短路径的长度;
若当前方面单词含有多个单词,则取上下文单词和所有方面词之间基于树的最小距离作为每个方面单词的权重。
5.如权利要求3所述的一种融合语法的方面级文本情感分类方法,其特征是,所述嵌入矩阵,是通过已知数字向量的若干个词语对Glove模型进行反复训练得到的。
6.如权利要求3所述的一种融合语法的方面级文本情感分类方法,其特征是,将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;深度学习模型的训练步骤包括:
构建第二训练集;所述第二训练集为已知分类结果的文本信息;
将第二训练集,输入到深度学习模型中,进行反复训练,当损失函数达到最小值时或迭代次数满足设定次数时,停止训练,得到训练后的深度学习模型。
7.如权利要求6所述的一种融合语法的方面级文本情感分类方法,其特征是,所述损失函数,采用带有L2正则项的交叉熵损失函数。
8.一种融合语法的方面级文本情感分类系统,其特征是,包括:
预处理模块,其被配置为:获取待分类的方面级情感文本;对待分类的方面级情感文本进行预处理,得到待分类的文本信息;
分类模块,其被配置为:将待分类的文本信息,输入到训练后的深度学习模型中,得到待分类方面级情感文本的分类结果;
其中,训练后的深度学习模型,先对待分类的文本信息进行词嵌入处理,得到文本词向量矩阵;然后,对文本词向量矩阵进行聚合处理,得到文本的隐藏状态;然后,对文本的隐藏状态进行加权处理,得到带有语法感知的文本表示;然后,对带有语法感知的文本表示,获取依赖关系向量矩阵;然后,从依赖关系向量矩阵中,选择最显著特征;最后,对最显著特征进行分类,得到待分类方面级文本情感的分类结果。
9.一种电子设备,其特征是,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的方法。
CN202110495625.XA 2021-05-07 2021-05-07 一种融合语法的方面级文本情感分类方法及系统 Active CN113254637B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110495625.XA CN113254637B (zh) 2021-05-07 2021-05-07 一种融合语法的方面级文本情感分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110495625.XA CN113254637B (zh) 2021-05-07 2021-05-07 一种融合语法的方面级文本情感分类方法及系统

Publications (2)

Publication Number Publication Date
CN113254637A true CN113254637A (zh) 2021-08-13
CN113254637B CN113254637B (zh) 2023-04-07

Family

ID=77223977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110495625.XA Active CN113254637B (zh) 2021-05-07 2021-05-07 一种融合语法的方面级文本情感分类方法及系统

Country Status (1)

Country Link
CN (1) CN113254637B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597299A (zh) * 2020-12-07 2021-04-02 深圳价值在线信息科技股份有限公司 文本的实体分类方法、装置、终端设备和存储介质
CN114282528A (zh) * 2021-08-20 2022-04-05 腾讯科技(深圳)有限公司 一种关键词提取方法、装置、设备及存储介质
CN115712726A (zh) * 2022-11-08 2023-02-24 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9633007B1 (en) * 2016-03-24 2017-04-25 Xerox Corporation Loose term-centric representation for term classification in aspect-based sentiment analysis
US20180053107A1 (en) * 2016-08-19 2018-02-22 Sap Se Aspect-based sentiment analysis
WO2020204364A2 (ko) * 2019-04-02 2020-10-08 성균관대학교 산학협력단 단어의 문맥 정보와 형태론적 정보를 고려한 단어 임베딩 방법 및 장치
CN111858945A (zh) * 2020-08-05 2020-10-30 上海哈蜂信息科技有限公司 基于深度学习的评论文本方面级情感分类方法及系统
CN112001185A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种结合中文句法和图卷积神经网络的情感分类方法
CN112001186A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种利用图卷积神经网络和中文句法的情感分类方法
CN112001187A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种基于中文句法和图卷积神经网络的情感分类系统
CN112035661A (zh) * 2020-08-24 2020-12-04 北京大学深圳研究生院 基于图卷积网络的文本情感分析方法、系统和电子装置
CN112115700A (zh) * 2020-08-19 2020-12-22 北京交通大学 一种基于依存句法树和深度学习的方面级情感分析方法
CN112131886A (zh) * 2020-08-05 2020-12-25 浙江工业大学 一种文本的方面级别情感分析方法
CN112329474A (zh) * 2020-11-02 2021-02-05 山东师范大学 融合注意力的方面级用户评论文本情感分析方法及系统
CN112347248A (zh) * 2020-10-30 2021-02-09 山东师范大学 一种方面级文本情感分类方法及系统
CN112417157A (zh) * 2020-12-15 2021-02-26 华南师范大学 一种基于深度学习网络的文本属性词的情感分类方法
CN112528672A (zh) * 2020-12-14 2021-03-19 北京邮电大学 一种基于图卷积神经网络的方面级情感分析方法及装置
CN112560440A (zh) * 2020-12-03 2021-03-26 湘潭大学 一种基于深度学习的面向方面级情感分析的句法依赖方法
CN112686056A (zh) * 2021-03-22 2021-04-20 华南师范大学 一种情感分类方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9633007B1 (en) * 2016-03-24 2017-04-25 Xerox Corporation Loose term-centric representation for term classification in aspect-based sentiment analysis
US20180053107A1 (en) * 2016-08-19 2018-02-22 Sap Se Aspect-based sentiment analysis
WO2020204364A2 (ko) * 2019-04-02 2020-10-08 성균관대학교 산학협력단 단어의 문맥 정보와 형태론적 정보를 고려한 단어 임베딩 방법 및 장치
CN111858945A (zh) * 2020-08-05 2020-10-30 上海哈蜂信息科技有限公司 基于深度学习的评论文本方面级情感分类方法及系统
CN112131886A (zh) * 2020-08-05 2020-12-25 浙江工业大学 一种文本的方面级别情感分析方法
CN112115700A (zh) * 2020-08-19 2020-12-22 北京交通大学 一种基于依存句法树和深度学习的方面级情感分析方法
CN112035661A (zh) * 2020-08-24 2020-12-04 北京大学深圳研究生院 基于图卷积网络的文本情感分析方法、系统和电子装置
CN112001185A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种结合中文句法和图卷积神经网络的情感分类方法
CN112001187A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种基于中文句法和图卷积神经网络的情感分类系统
CN112001186A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种利用图卷积神经网络和中文句法的情感分类方法
CN112347248A (zh) * 2020-10-30 2021-02-09 山东师范大学 一种方面级文本情感分类方法及系统
CN112329474A (zh) * 2020-11-02 2021-02-05 山东师范大学 融合注意力的方面级用户评论文本情感分析方法及系统
CN112560440A (zh) * 2020-12-03 2021-03-26 湘潭大学 一种基于深度学习的面向方面级情感分析的句法依赖方法
CN112528672A (zh) * 2020-12-14 2021-03-19 北京邮电大学 一种基于图卷积神经网络的方面级情感分析方法及装置
CN112417157A (zh) * 2020-12-15 2021-02-26 华南师范大学 一种基于深度学习网络的文本属性词的情感分类方法
CN112686056A (zh) * 2021-03-22 2021-04-20 华南师范大学 一种情感分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DIANYUAN ZHANG,ZHENFANG ZHU,SHIYONG KANG,GUANGYUAN ZHANG: "Syntac tic and semantic analysis network for aspec t-level sentiment classification", 《SPRINGER》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597299A (zh) * 2020-12-07 2021-04-02 深圳价值在线信息科技股份有限公司 文本的实体分类方法、装置、终端设备和存储介质
CN114282528A (zh) * 2021-08-20 2022-04-05 腾讯科技(深圳)有限公司 一种关键词提取方法、装置、设备及存储介质
CN115712726A (zh) * 2022-11-08 2023-02-24 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备
CN115712726B (zh) * 2022-11-08 2023-09-12 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备

Also Published As

Publication number Publication date
CN113254637B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN109933664B (zh) 一种基于情感词嵌入的细粒度情绪分析改进方法
CN108363790B (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN108255805B (zh) 舆情分析方法及装置、存储介质、电子设备
CN113254637B (zh) 一种融合语法的方面级文本情感分类方法及系统
WO2018028077A1 (zh) 一种基于深度学习的中文语义分析的方法及装置
CN112329474B (zh) 融合注意力的方面级用户评论文本情感分析方法及系统
US11727211B2 (en) Systems and methods for colearning custom syntactic expression types for suggesting next best correspondence in a communication environment
CN109597493B (zh) 一种表情推荐方法及装置
CN107818084B (zh) 一种融合点评配图的情感分析方法
Kaur Incorporating sentimental analysis into development of a hybrid classification model: A comprehensive study
CN108628868B (zh) 文本分类方法和装置
CN113361258A (zh) 基于图卷积网络和选择注意力的方面级情感分析方法及系统
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
CN112818698B (zh) 一种基于双通道模型的细粒度的用户评论情感分析方法
CN112667782A (zh) 一种文本分类方法、装置、设备及存储介质
CN113449084A (zh) 基于图卷积的关系抽取方法
CN114528374A (zh) 一种基于图神经网络的电影评论情感分类方法及装置
CN112183106A (zh) 一种基于音素联想及深度学习的语义理解方法及装置
CN111984780A (zh) 多意图识别模型训练方法和多意图识别方法及相关装置
CN115952292A (zh) 多标签分类方法、装置及计算机可读介质
Af'idah et al. Long short term memory convolutional neural network for Indonesian sentiment analysis towards touristic destination reviews
CN109727091A (zh) 基于对话机器人的产品推荐方法、装置、介质及服务器
CN113486143A (zh) 一种基于多层级文本表示及模型融合的用户画像生成方法
Ermatita et al. Sentiment Analysis of COVID-19 using Multimodal Fusion Neural Networks.
WO2023159759A1 (zh) 模型的训练方法、情感消息生成方法和装置、设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant