CN115587597B - 基于子句级关系图的方面词的情感分析方法以及装置 - Google Patents

基于子句级关系图的方面词的情感分析方法以及装置 Download PDF

Info

Publication number
CN115587597B
CN115587597B CN202211471094.1A CN202211471094A CN115587597B CN 115587597 B CN115587597 B CN 115587597B CN 202211471094 A CN202211471094 A CN 202211471094A CN 115587597 B CN115587597 B CN 115587597B
Authority
CN
China
Prior art keywords
words
sentence
emotion
feature
aspect words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211471094.1A
Other languages
English (en)
Other versions
CN115587597A (zh
Inventor
邱植勋
薛云
马志豪
黄震华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202211471094.1A priority Critical patent/CN115587597B/zh
Publication of CN115587597A publication Critical patent/CN115587597A/zh
Application granted granted Critical
Publication of CN115587597B publication Critical patent/CN115587597B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及情感分析领域,特别涉及一种基于子句级关系图的方面词的情感分析方法、装置、设备以及存储介质,通过构建子句级关系图,并用图卷积网络以及关系图注意网络,分别提取待测语句中多个方面词的特征信息,利用获得的特征信息,更加全面地对多个方面词的情感极性的进行分析,提升了情感分析的准确性以及效率。

Description

基于子句级关系图的方面词的情感分析方法以及装置
技术领域
本发明涉及情感分析领域,特别涉及一种基于子句级关系图的方面词的情感分析方法、装置、设备以及存储介质。
背景技术
在自然语言处理领域,情感分析是一个活跃的研究领域,其旨在显示情感和自动发现文本中表达的情感。基本上情感分析被认为是识别对某一时间表达的积极、消极或中性情绪的意见极性。特定目标情感分析是情感分析的一个子领域,指的是预测给定文本中特定方面词的情感极性,目前的主流方法主要是采用基于句法的图神经网络从句法依赖树中提取句法信息,通过句法树缩短方面词和意见词的距离,缓解了远距离依赖问题。
语句往往包含多个方面词,其可能对用于分析的目标方面词带来额外的信息,然而,上述方法都是针对单个方面建模,忽略语句中存在多个方面词的情况,无法建模多个方面词的相互依赖关系,从而难以对方面词进行全面的情感分析,降低了情感分析的准确性。
发明内容
基于此,本发明提供一种基于子句级关系图的方面词的情感分析方法、装置、设备以及存储介质,通过构建子句级关系图,并用图卷积网络以及关系图注意网络,分别提取待测语句中多个方面词的特征信息,利用获得的特征信息,更加全面地对多个方面词的情感极性的进行分析,提升了情感分析的准确性以及效率。该技术方法如下:
第一方面,本申请实施例提供了一种基于子句级关系图的方面词的情感分析方法,包括以下步骤:
获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的若干个方面词,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络;
将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示;
构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵;
将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量;
构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,其中,所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量;
根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量;
将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。
第二方面,本申请实施例提供了一种基于子句级关系图的方面词的情感分析装置,包括:
获取模块,用于获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的方面词,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络;
句子编码模块,用于将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示;
第一邻接矩阵计算模块,用于构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵;
第一特征计算模块,用于将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量;
第二邻接矩阵计算模块,用于构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,其中,所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量;
第二特征计算模块,用于根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量;
情感分析模块,用于将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的基于子句级关系图的方面词的情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于子句级关系图的方面词的情感分析方法的步骤。
在本实施例中,提供一种基于子句级关系图的方面词的情感分析方法、装置、设备以及存储介质,通过构建子句级关系图,并用图卷积网络以及关系图注意网络,分别提取待测语句中多个方面词的特征信息,利用获得的特征信息,更加全面地对多个方面词的情感极性的进行分析,提升了情感分析的准确性以及效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请第一实施例提供的基于子句级关系图的方面词的情感分析方法的流程示意图;
图2为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S4的流程示意图;
图3为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S5的流程示意图;
图4为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S6的流程示意图;
图5为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S7的流程示意图;
图6为本申请另一个实施例提供的基于子句级关系图的方面词的情感分析方法的流程示意图;
图7为本申请一个实施例提供的基于子句级关系图的方面词的情感分析装置的结构示意图;
图8为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请第一实施例提供的基于子句级关系图的方面词的情感分析方法的流程示意图,包括如下步骤:
S1:获取待测语句以及预设的情感分析模型。
本申请的基于子句级关系图的方面词的情感分析方法的执行主体为基于子句级关系图的方面词的情感分析方法的分析设备(以下简称分析设备)。
在一个可选的实施例中,分析设备可以是一台计算机设备,可以是服务器,或多台计算机设备联合而成的服务器机群。
在本实施例中,分析设备可以获取用户输入的待测语句,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的若干个方面词,所述方面词为待测语句中所描述的某一实体,包括若干个方面,所述方面为单词,具体如下:
Figure 477496DEST_PATH_IMAGE001
式中,W为所述待测语句的句子表示,
Figure 44743DEST_PATH_IMAGE002
为第n个单词对应的词表示,n为所述单词 的数目,
Figure 952788DEST_PATH_IMAGE003
为第m个方面词对应的词表示,其中,
Figure 871065DEST_PATH_IMAGE004
式中,
Figure 240866DEST_PATH_IMAGE005
为所述第m个方面词中第
Figure 662620DEST_PATH_IMAGE006
个方面,
Figure 990834DEST_PATH_IMAGE007
为所述第m个方面 词中方面的在所述待测语句中的起始位置,
Figure 865249DEST_PATH_IMAGE008
为所述第m个方面词中方面的在所述 待测语句中的终止位置,
Figure 153640DEST_PATH_IMAGE009
为所述方面词数目。
分析设备获取预设的情感分析模型,其中,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络。
S2:将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示。
在本实施例中,分析设备将所述待测语句分别输入至所述句子编码网络,获得所述待测语句的句子特征表示。
具体地,所述句子编码网络包括词嵌入模块以及双向门控模块,其中,所述词嵌入模块可以采用为BERT(Bidirectional Encoder Representation from Transformers)词嵌入模型,或者Word2vec词嵌入模型,所述双向门控模块可以采用BiGURE模型。分析设备将所述待测语句分别输入至所述词嵌入模型中,获得所述待测语句的若干个单词的词嵌入向量,并将所述待测语句的若干个单词的词嵌入向量输入至所述双向门控模型,将所述词嵌入向量转换为隐藏层向量,获得所述待测语句的若干个单词的隐藏层向量,并进行编码处理,获得待测语句的句子特征表示。
S3:构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵。
在本实施例中,分析设备获取初始依存句法树,所述初始依存句法树包括若干个节点,将所述待测语句的若干个单词分别设置于所述初始依存句法树的节点上,构建所述待测语句的依存句法图,获取所述待测语句的依存关系信息,所述依存关系信息用于指示所述待测语句中单词与单词之间的连接关系,根据所述待测语句的依存关系信息,将所述待测语句的初依存句法图转化为句法邻接矩阵,作为所述待测语句的第一邻接矩阵,其中,所述第一邻接矩阵包括若干个单词之间的依存关系向量。
S4:将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量。
在本实施例中,分析设备将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量。
请参阅图2,图2为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S4的流程示意图,包括步骤S41~S42,具体如下:
S41:将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述图卷积网络的首层的输入信息,根据所述待测语句的第一邻接矩阵中若干个单词之间的依存关系向量以及预设的第一特征计算算法,获得所述图卷积网络的最后一层的若干个单词的初始第一特征向量。
所述第一特征计算算法为:
Figure 429900DEST_PATH_IMAGE010
式中,ij为所述单词的索引,
Figure 929015DEST_PATH_IMAGE011
为所述图卷积网络的第l层的第i个单词的初始 第一特征向量,
Figure 290726DEST_PATH_IMAGE012
为所述图卷积网络的第l层的第j个单词的初始第一特征向量,
Figure 2330DEST_PATH_IMAGE013
为非 线性激活函数,
Figure 414988DEST_PATH_IMAGE014
为所述第一邻接矩阵中第i个单词与第j个单词之间的依存关系向量,
Figure 819425DEST_PATH_IMAGE015
为第一可训练权重参数矩阵,
Figure 934011DEST_PATH_IMAGE016
为第一偏差参数,n是所述待测语句的单词数目。
在本实施例中,分析设备将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述图卷积网络的首层的输入信息,根据所述待测语句的第一邻接矩阵中若干个单词之间的依存关系向量以及预设的第一特征计算算法,获得所述图卷积网络的最后一层的若干个单词的初始第一特征向量。
S42:根据所述待测语句的若干个单词的初始第一特征向量以及预设的加权算法,对所述若干个单词的初始第一特征向量进行加权处理,获得加权处理后的所述若干个单词的初始第一特征向量,并进行编码处理,获得加权处理后的所述待测语句的第一特征表示,并对所述加权处理后的待测语句的第一特征表示进行平均池化处理,获得平均池化处理后的第一特征表示,作为所述待测语句的第一特征表示。
所述加权算法为:
Figure 449306DEST_PATH_IMAGE017
式中,τ为所述方面词的开始位置,m为所述方面词的数目,
Figure 965738DEST_PATH_IMAGE018
为第i个单词的位置 权重参数,
Figure 541076DEST_PATH_IMAGE019
为所述加权处理后的所述第i个单词对应的第一特征向量。
在本实施例中,分析设备根据所述待测语句的若干个单词的初始第一特征向量以及预设的加权算法,对所述若干个单词的初始第一特征向量进行加权处理,获得加权处理后的所述若干个单词的初始第一特征向量,并进行编码处理,获得加权处理后的所述待测语句的第一特征表示,并对所述加权处理后的待测语句的第一特征表示进行平均池化处理,获得平均池化处理后的第一特征表示,作为所述待测语句的第一特征表示。
S5:构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵。
所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量。
请参阅图3,图3为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S5的流程示意图,包括步骤S51~S53,具体如下:
S51:将所述待测语句划分为若干个子待测语句,根据所述若干个子待测语句,获取所述方面词的句子标识,根据所述方面词的句子标识,构建所述待测语句的子句级关系图。
所述子句级关系图包括所述若干个方面词彼此的连接关系。
在本实施例中,分析设备将所述待测语句划分为若干个子待测语句,根据所述若干个子待测语句,获取所述方面词的句子标识,根据所述方面词的句子标识,构建所述待测语句的子句级关系图,所述子句级关系图包括所述若干个方面词彼此的连接关系。
具体地,分析设备采用话语分割工具,其原理是在待测语句中的每个单词后面设置标记,使用一个二分类器输入语义、句法、词性等特征来决定该标记是否为EDU边界,并通过大量人工标记的数据训练提升话语分割效果。分析设备将所述待测语句分割为若干个基本话语单元(EDUs),作为所述若干个子待测语句。
分析设备根据所述若干个子待测语句中包含的方面词,设置各个方面词的的句子标识,以指示相应的方面词处于某一个子待测语句中。对所述方面词进行两两分析,根据所述方面词的句子标识,判断分析的所述方面词是否处于同一个子待测语句中,从而构建若干个方面词彼此的连接关系,构建所述待测语句的子句级关系图。
S52:根据所述若干个方面词彼此的连接关系,对所述待测语句的句子特征表示中的单词的隐藏层向量进行屏蔽处理,构建第一屏蔽句子特征表示以及第二屏蔽句子特征表示。
在本实施例中,分析设备根据所述若干个方面词彼此的连接关系,对所述待测语句的句子特征表示中的单词的隐藏层向量进行屏蔽处理,构建第一屏蔽句子特征表示以及第二屏蔽句子特征表示。
具体地,分析设备分别将所述若干个方面词作为目标方面词,其他的方面词作为相邻方面词,根据所述若干个方面词彼此的连接关系,可以获得第一连接关系以及第二连接关系,其中,所述第一连接关系用于指示连接的所述方面词处于同一个子待测语句中,所述第二连接关系用于指示连接的所述方面词不处于同一个子待测语句。
若所述连接关系为第一连接关系,对所述待测语句的句子特征表示中非相邻方面词的隐藏层向量进行屏蔽处理,获取第一屏蔽句子特征表示;将所述目标方面词所在的子待测语句作为目标语句,其他子待测语句作为非目标语句,对所述待测语句的句子特征表示中,处于所述非目标语句的单词的隐藏层向量进行屏蔽处理,获取第二屏蔽句子特征表示;
若所述连接关系为第二连接关系,将所述若干个相邻方面词所在的子待测语句作为目标语句,其他子待测语句作为非目标语句,对所述待测语句的句子特征表示中,处于所述非目标语句的单词的隐藏层向量进行屏蔽处理,获取第一屏蔽句子特征表示;对所述待测语句的句子特征表示中,不处于所述目标语句的单词的隐藏层向量进行屏蔽处理,获取第二屏蔽句子特征表示。
S53:根据所述第一屏蔽句子特征表示、第二屏蔽句子特征表示以及预设的连接关系特征计算算法,获得所述若干个方面词彼此的连接关系对应的特征向量,构建所述待测语句的第二邻接矩阵。
所述连接关系特征计算算法为:
Figure 893691DEST_PATH_IMAGE020
式中,pq为所述方面词的索引,
Figure 212677DEST_PATH_IMAGE021
为所述第p个方面词与第q个方面词的连接关 系对应的特征向量,ijk分别单词的索引,
Figure 318036DEST_PATH_IMAGE022
为所述第二屏蔽句子特征表示中第k个单词 的隐藏层向量,
Figure 329854DEST_PATH_IMAGE023
为所述第一屏蔽句子表示第一屏蔽句子特征表示中第i个单词的隐藏层 向量,
Figure 153454DEST_PATH_IMAGE024
为所述第二屏蔽句子特征表示中第j个单词的隐藏层向量,T表示转置。
在本实施例中,分析设备根据所述第一屏蔽句子特征表示、第二屏蔽句子特征表示以及预设的连接关系特征计算算法,获得所述若干个方面词彼此的连接关系对应的特征向量,构建所述待测语句的第二邻接矩阵。
S6:根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量。
在本实施例中,分析设备根据所述第一特征表示,获取所述若干个方面词的第一特征向量,具体地,分析设备对所述第一特征表示中,非方面词的第一特征向量进行屏蔽处理,从而获取屏蔽处理后的第一特征表示,并从所述屏蔽处理后的第一特征表示中,提取所述若干个方面词的第一特征向量。
由于普通图卷积并没有考虑到边上关系,仅使用普通图卷积会丢失大量的信息,为了避免上述情况,提高对方面词的情感分析的准确性,分析设备通过设置注意力机制,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量。
请参阅图4,图4为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S6的流程示意图,包括步骤S61~S62,具体如下:
S61:根据所述第二邻接矩阵中若干个方面词彼此的连接关系对应的特征向量以及预设的注意力系数计算算法,获得所述关系图注意网络的若干层对应的若干个所述连接关系对应的注意力系数。
所述注意力系数计算算法为:
Figure 292442DEST_PATH_IMAGE025
式中,
Figure 252308DEST_PATH_IMAGE026
为所述关系图注意网络的第l层对应的所述第p个方面词与第q个方面词 彼此的连接关系对应的注意力系数,
Figure 435028DEST_PATH_IMAGE013
为非线性激活函数,relu()为线性激活函数,
Figure 745923DEST_PATH_IMAGE027
为 第二可训练权重参数矩阵,
Figure 406712DEST_PATH_IMAGE028
为第三可训练权重参数矩阵,
Figure 234466DEST_PATH_IMAGE029
为第二偏差参数,
Figure 853666DEST_PATH_IMAGE030
为第三 偏差参数,
Figure 386279DEST_PATH_IMAGE031
为所述第p个方面词连接的方面词的集合;
在本实施例中,分析设备根据所述第二邻接矩阵中若干个方面词彼此的连接关系对应的特征向量以及预设的注意力系数计算算法,获得所述关系图注意网络的若干层对应的若干个所述连接关系对应的注意力系数。
S62:将所述若干个方面词的第一特征向量作为所述关系图注意网络的首层的输入信息,根据若干个所述连接关系对应的注意力系数以及预设的第二特征计算算法,获得所述关系图注意网络的最后一层的所述若干个方面词的第二特征向量。
所述第二特征计算算法为:
Figure 850758DEST_PATH_IMAGE032
式中,
Figure 785216DEST_PATH_IMAGE033
为所述关系图注意网络的最后一层的所述方面词的第二特征向量,
Figure 309738DEST_PATH_IMAGE034
为所述所述方面词的第一特征向量,
Figure 80379DEST_PATH_IMAGE035
为第四可训练权重参数矩阵。
在本实施例中,分析设备将所述若干个方面词的第一特征向量作为所述关系图注意网络的首层的输入信息,根据若干个所述连接关系对应的注意力系数以及预设的第二特征计算算法,所述关系图注意网络通过每一层的卷积计算,每一层都能在迭代计算中聚合其相邻层的信息并更新自身的信息。最终所述关系图注意网络的最后一次迭代计算得到的输出特征,即获得所述关系图注意网络的最后一层的所述若干个方面词的第二特征向量。
S7:将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。
在本实施例中,分析设备将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。
请参阅图5,图5为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S7的流程示意图,包括步骤S71,具体如下:
S71:根据所述若干个方面词的拼接特征向量以及预设的情感概率分布向量计算算法,获得所述若干个方面词的拼接特征向量的预测情感概率分布向量,根据所述预测情感概率分布向量,获得概率最大的维度对应的预测情感极性,作为所述若干个方面词的情感分析结果。
所述情感概率分布向量计算算法为:
Figure 348550DEST_PATH_IMAGE036
式中,pre为所述若干个方面词的预测情感概率分布向量,
Figure 403093DEST_PATH_IMAGE037
为归一化函 数,
Figure 832938DEST_PATH_IMAGE038
为预设的第五可训练权重参数矩阵,x为所述情感分析特征向量,
Figure 605722DEST_PATH_IMAGE039
为预设的预设 的第五偏置参数。
在本实施例中,分析设备将根据所述若干个方面词的拼接特征向量,利用softmax函数和单层感知机构建的情感概率分布向量计算算法,将所述若干个方面词的拼接特征向量输入至所述情感概率分布向量计算算法中,获得所述若干个方面词的拼接特征向量的预测情感概率分布向量。
在本实施例中,分析设备根据所述若干个方面词的拼接特征向量的预测情感概率分布向量,获取各个方面词对应的概率最大的维度对应的情感极性,作为所述若干个方面词的情感分析结果。具体地,当计算得到pre=[pre积极,pre消极,pre中性]=[0.1,0.7,0.2],概率最大为pre消极,其概率最大的维度对应的情感极性为消极,作为所述方面词的情感分析结果。
在另一个可选的实施例中,还包括步骤:训练所述情感分析模型,请参阅图6,图6为本申请另一个实施例提供的基于子句级关系图的方面词的情感分析方法的流程示意图,包括步骤S81~S84,具体如下:
S81:获取待训练的情感分析模型、若干个样本语句以及样本语句对应的情感标签信息。
所述样本语句包括若干个样本方面词;所述情感标签信息包括真实情感概率分布向量。
在本实施例中,分析设备获取待训练的情感分析模型、若干个样本语句以及样本语句对应的情感标签信息。
S82:获取若干个样本方面词的句子标识,根据所述若干个样本方面词的句子标识,构建连接关系集。
所述连接关系集包括若干个样本方面词彼此的连接关系。
在本实施例中,分析设备获取若干个样本方面词的句子标识,根据所述若干个样本方面词的句子标识,获取若干个样本方面词彼此的连接关系,构建连接关系集。具体实施例可以参考步骤S51中的实施例的对应过程,在此不再赘述。
S83:获得所述若干个样本方面词对应的预测情感概率分布向量以及预测情感极性,根据所述若干个样本方面词彼此的连接关系以及所述若干个样本方面词对应的预测情感极性,构建标签关系集。
所述标签关系集包括若干个样本方面词彼此的连接关系对应的标签关系信息。
在本实施例中,分析设备获得所述若干个样本方面词对应的预测情感概率分布向量以及预测情感极性,根据所述若干个样本方面词彼此的连接关系以及所述若干个样本方面词对应的预测情感极性,构建标签关系集。
具体地,分析设备设置第一标签关系信息、第二标签关系信息以及第三标签关系信息,其中,第一标签关系信息用于指示两个样本方面词位于不同的样本语句,且两个样本方面词的预测情感极性相同,表现了该两个样本方面词彼此的连接关系为协同关系。
第二标签关系信息用于指示两个样本方面词位于不同的样本语句,且两个样本方面词的预测情感极性不同,表现了该两个样本方面词彼此的连接关系为无关关系。
第三标签关系信息用于指示两个样本方面词位于相同的样本语句,表现了该两个样本方面词彼此的连接关系为协同关系。
S84:根据所述连接关系集、标签关系集以及预设的第一损失函数,获取第一损失值,根据所述若干个样本方面词对应的预测情感概率分布向量、真实情感概率分布向量以及预设的第二损失函数,获取第二损失值,根据所述第一损失值、第二损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行训练,获取所述情感分析模型。
在本实施例中,分析设备采用一个对比学习方法,根据所述标签关系集,把具有相同标签关系信息的所述样本方面词彼此的连接关系聚集到一起,同时将不同标签关系信息的所述样本方面词彼此的连接关系拉开,从而将所述连接关系集划分为若干个不同标签关系信息对应的连接关系子集,根据所述若干个不同标签关系信息对应的连接关系子集以及预设的第一损失函数,获取第一损失值,其中,所述第一损失函数为:
Figure 162736DEST_PATH_IMAGE040
式中,
Figure 71786DEST_PATH_IMAGE041
为所述第一损失值,u、v以及b为所述连接关系集中的连接关系的索引,
Figure 938111DEST_PATH_IMAGE042
为所述连接关系集中第u个所述样本方面词彼此的连接关系,
Figure 667033DEST_PATH_IMAGE043
为所述连接关系集中第v个所述样本方面词彼此的连接关系,
Figure 542585DEST_PATH_IMAGE044
为所述连接关系集中第b个所述样本方面词彼此的 连接关系,R为所述连接关系集中所述样本方面词彼此的连接关系的数目,
Figure 322453DEST_PATH_IMAGE045
为所述连接关 系集中第u个所述样本方面词彼此的连接关系对应的标签关系信息,
Figure 94100DEST_PATH_IMAGE046
为所述连接关系集 中第v个所述样本方面词彼此的连接关系对应的标签关系信息,
Figure 575897DEST_PATH_IMAGE047
为所述第u个所述样本 方面词彼此的连接关系对应的标签关系信息的数目,
Figure 989561DEST_PATH_IMAGE048
为温度系数,sim()为余弦相似度函 数。
分析设备根据所述若干个样本方面词对应的预测情感概率分布向量、真实情感概率分布向量以及预设的第二损失函数,获取第二损失值,其中,所述第二损失函数为:
Figure 607624DEST_PATH_IMAGE049
式中,L为所述第二损失值,K为所述样本方面词的数目,k表示第k个样本方面词,
Figure 815751DEST_PATH_IMAGE050
为所述样本方面词对应的真实情感概率分布向量,
Figure 532647DEST_PATH_IMAGE051
为所述样本方面词对应的预测 情感概率分布向量;
分析设备根据所述第一损失值、第二损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行训练,获取所述情感分析模型,其中,所述总损失函数为:
Figure 484422DEST_PATH_IMAGE052
式中,Loss为所述总损失值,
Figure 222571DEST_PATH_IMAGE053
为第一衰减系数,
Figure 601600DEST_PATH_IMAGE054
为第二衰减系数,
Figure 57989DEST_PATH_IMAGE055
为可训练参 数。
请参阅图7,图7为本申请一个实施例提供的基于子句级关系图的方面词的情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于子句级关系图的方面词的情感分析方法的全部或一部分,该装置7包括:
获取模块71,用于获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的若干个方面词,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络;
句子编码模块72,用于将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示;
第一邻接矩阵计算模块73,用于构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵;
第一特征计算模块74,用于将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量;
第二邻接矩阵计算模块75,用于构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,其中,所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量;
第二特征计算模块76,用于根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量;
情感分析模块77,用于将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。
在本申请的实施例中,通过获取模块,获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的方面词,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络;通过句子编码模块,将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示;通过第一邻接矩阵计算模块,构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵;通过第一特征计算模块,将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量;通过第二邻接矩阵计算模块,构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,其中,所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量;通过第二特征计算模块,根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量;通过情感分析模块,将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。本申请通过构建子句级关系图,并用图卷积网络以及关系图注意网络,分别提取待测语句中多个方面词的特征信息,利用获得的特征信息,更加全面地对多个方面词的情感极性的进行分析,提升了情感分析的准确性以及效率。
请参考图8,图8为本申请一个实施例提供的计算机设备的结构示意图,计算机设备8包括:处理器81、存储器82以及存储在存储器82上并可在处理器81上运行的计算机程序83;计算机设备可以存储有多条指令,指令适用于由处理器81加载并执行上述图1至图6所述实施例的方法步骤,具体执行过程可以参见图1至图6所述实施例的具体说明,在此不进行赘述。
其中,处理器81可以包括一个或多个处理核心。处理器81利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器82内的指令、程序、代码集或指令集,以及调用存储器82内的数据,执行基于子句级关系图的方面词的情感分析装置8的各种功能和处理数据,可选的,处理器81可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programble Logic Array,PLA)中的至少一个硬件形式来实现。处理器81可集成中央处理器81(Central Processing Unit,CPU)、图像处理器81(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器81中,单独通过一块芯片进行实现。
其中,存储器82可以包括随机存储器82(Random Access Memory,RAM),也可以包括只读存储器82(Read-Only Memory)。可选的,该存储器82包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器82可用于存储指令、程序、代码、代码集或指令集。存储器82可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器82可选的还可以是至少一个位于远离前述处理器81的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤,具体执行过程可以参见所示图1至图6所述实施例的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (10)

1.一种基于子句级关系图的方面词的情感分析方法,其特征在于,包括以下步骤:
获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的若干个方面词,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络;
将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示;
构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵;
将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量;
构建所述待测语句的子句级关系图,所述子句级关系图包括所述若干个方面词彼此的连接关系,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,其中,所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量;
根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量;
将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。
2.根据权利要求1所述的基于子句级关系图的方面词的情感分析方法,其特征在于:所述句子特征表示包括若干个单词的隐藏层向量,所述第一邻接矩阵包括若干个单词之间的依存关系向量;
所述将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,包括步骤:
将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述图卷积网络的首层的输入信息,根据所述待测语句的第一邻接矩阵中若干个单词之间的依存关系向量以及预设的第一特征计算算法,获得所述图卷积网络的最后一层的若干个单词的初始第一特征向量,其中,所述第一特征计算算法为:
Figure 827535DEST_PATH_IMAGE001
式中,ij为单词的索引,
Figure 668452DEST_PATH_IMAGE002
为所述图卷积网络的第l层的第i个单词的初始第一特征向量,
Figure 4756DEST_PATH_IMAGE003
为所述图卷积网络的第l层的第j个单词的初始第一特征向量,
Figure 340053DEST_PATH_IMAGE004
为非线性激活函数,
Figure 445413DEST_PATH_IMAGE005
为所述第一邻接矩阵中第i个单词与第j个单词之间的依存关系向量,
Figure 191652DEST_PATH_IMAGE006
为第一可训练权重参数矩阵,
Figure 15251DEST_PATH_IMAGE007
为第一偏差参数,n是所述待测语句的单词数目;
根据所述待测语句的若干个单词的初始第一特征向量以及预设的加权算法,对所述若干个单词的初始第一特征向量进行加权处理,获得加权处理后的所述若干个单词的初始第一特征向量,并进行编码处理,获得加权处理后的所述待测语句的第一特征表示,并对所述加权处理后的待测语句的第一特征表示进行平均池化处理,获得平均池化处理后的第一特征表示,作为所述待测语句的第一特征表示,其中,所述加权算法为:
Figure 137928DEST_PATH_IMAGE008
式中,τ为所述方面词的开始位置,m为所述方面词的数目,
Figure 97794DEST_PATH_IMAGE009
为第i个单词的位置权重参数,
Figure 28316DEST_PATH_IMAGE010
为所述加权处理后的所述第i个单词对应的第一特征向量。
3.根据权利要求2所述的基于子句级关系图的方面词的情感分析方法,其特征在于,所述构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,包括步骤:
将所述待测语句划分为若干个子待测语句,根据所述若干个子待测语句,获取所述方面词的句子标识,根据所述方面词的句子标识,构建所述待测语句的子句级关系图;
根据所述若干个方面词彼此的连接关系,对所述待测语句的句子特征表示中的单词的隐藏层向量进行屏蔽处理,构建第一屏蔽句子特征表示以及第二屏蔽句子特征表示;
根据所述第一屏蔽句子特征表示、第二屏蔽句子特征表示以及预设的连接关系特征计算算法,获得所述若干个方面词彼此的连接关系对应的特征向量,构建所述待测语句的第二邻接矩阵,其中,所述连接关系特征计算算法为:
Figure 604791DEST_PATH_IMAGE011
式中,pq为所述方面词的索引,
Figure 265579DEST_PATH_IMAGE012
为第p个方面词与第q个方面词的连接关系对应的特征向量,ijk分别单词的索引,
Figure 79952DEST_PATH_IMAGE013
为所述第二屏蔽句子特征表示中第k个单词的隐藏层向量,
Figure 699152DEST_PATH_IMAGE014
为所述第一屏蔽句子特征表示中第i个单词的隐藏层向量,
Figure 982497DEST_PATH_IMAGE015
为所述第二屏蔽句子特征表示中第j个单词的隐藏层向量,T表示转置。
4.根据权利要求3所述的基于子句级关系图的方面词的情感分析方法,其特征在于,所述将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量,包括步骤:
根据所述第二邻接矩阵中若干个方面词彼此的连接关系对应的特征向量以及预设的注意力系数计算算法,获得所述关系图注意网络的若干层对应的若干个所述连接关系对应的注意力系数,其中,所述注意力系数计算算法为:
Figure 446976DEST_PATH_IMAGE016
式中,
Figure 381434DEST_PATH_IMAGE017
为所述关系图注意网络的第l层对应的所述第p个方面词与第q个方面词彼此的连接关系对应的注意力系数,
Figure 171536DEST_PATH_IMAGE004
为非线性激活函数,relu()为线性激活函数,
Figure 191444DEST_PATH_IMAGE018
为第二可训练权重参数矩阵,
Figure 194035DEST_PATH_IMAGE019
为第三可训练权重参数矩阵,
Figure 999311DEST_PATH_IMAGE020
为第二偏差参数,
Figure 694735DEST_PATH_IMAGE021
为第三偏差参数,
Figure 201940DEST_PATH_IMAGE022
为所述第p个方面词连接的方面词的集合;
将所述若干个方面词的第一特征向量作为所述关系图注意网络的首层的输入信息,根据若干个所述连接关系对应的注意力系数以及预设的第二特征计算算法,获得所述关系图注意网络的最后一层的所述若干个方面词的第二特征向量,其中,所述第二特征计算算法为:
Figure 8222DEST_PATH_IMAGE023
式中,
Figure 182851DEST_PATH_IMAGE024
为所述关系图注意网络的最后一层的所述方面词的第二特征向量,
Figure 534329DEST_PATH_IMAGE025
为所述方面词的第一特征向量,
Figure 794409DEST_PATH_IMAGE026
为第四可训练权重参数矩阵。
5.根据权利要求4所述的基于子句级关系图的方面词的情感分析方法,其特征在于,所述对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果,包括步骤:
根据所述若干个方面词的拼接特征向量以及预设的情感概率分布向量计算算法,获得所述若干个方面词的拼接特征向量的预测情感概率分布向量,根据所述预测情感概率分布向量,获得概率最大的维度对应的预测情感极性,作为所述若干个方面词的情感分析结果,其中,所述情感概率分布向量计算算法为:
Figure 138803DEST_PATH_IMAGE027
式中,pre为所述若干个方面词的预测情感概率分布向量,
Figure 902359DEST_PATH_IMAGE028
为归一化函数,
Figure 939586DEST_PATH_IMAGE029
为预设的第五可训练权重参数矩阵,x为所述情感分析特征向量,
Figure 421382DEST_PATH_IMAGE030
为预设的第五偏置参数。
6.根据权利要求5所述的基于子句级关系图的方面词的情感分析方法,其特征在于,还包括训练所述情感分析模型,所述训练所述情感分析模型,包括步骤:
获取待训练的情感分析模型、若干个样本语句以及样本语句对应的情感标签信息,其中,所述样本语句包括若干个样本方面词;所述情感标签信息包括真实情感概率分布向量;
获取若干个样本方面词的句子标识,根据所述若干个样本方面词的句子标识,构建连接关系集,其中,所述连接关系集包括若干个样本方面词彼此的连接关系;
获得所述若干个样本方面词对应的预测情感概率分布向量以及预测情感极性,根据所述若干个样本方面词彼此的连接关系以及所述若干个样本方面词对应的预测情感极性,构建标签关系集,其中,所述标签关系集包括若干个样本方面词彼此的连接关系对应的标签关系信息;
根据所述连接关系集、标签关系集以及预设的第一损失函数,获取第一损失值,根据所述若干个样本方面词对应的预测情感概率分布向量、真实情感概率分布向量以及预设的第二损失函数,获取第二损失值,根据所述第一损失值、第二损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行训练,获取所述情感分析模型。
7.根据权利要求6所述的基于子句级关系图的方面词的情感分析方法,其特征在于:所述第一损失函数为:
Figure 582849DEST_PATH_IMAGE031
式中,
Figure 200912DEST_PATH_IMAGE032
为所述第一损失值,u、v以及b为所述连接关系集中的连接关系的索引,
Figure 674619DEST_PATH_IMAGE033
为所述连接关系集中第u个所述样本方面词彼此的连接关系,
Figure 378133DEST_PATH_IMAGE034
为所述连接关系集中第v个所述样本方面词彼此的连接关系,
Figure 64329DEST_PATH_IMAGE035
为所述连接关系集中第b个所述样本方面词彼此的连接关系,R为所述连接关系集中所述样本方面词彼此的连接关系的数目,
Figure 818789DEST_PATH_IMAGE036
为所述连接关系集中第u个所述样本方面词彼此的连接关系对应的标签关系信息,
Figure 932239DEST_PATH_IMAGE037
为所述连接关系集中第v个所述样本方面词彼此的连接关系对应的标签关系信息,
Figure 388628DEST_PATH_IMAGE038
为所述第u个所述样本方面词彼此的连接关系对应的标签关系信息的数目,
Figure 878515DEST_PATH_IMAGE039
为温度系数,sim()为余弦相似度函数;
所述第二损失函数为:
Figure 736750DEST_PATH_IMAGE040
式中,L为所述第二损失值,K为所述样本方面词的数目,k表示第k个样本方面词,
Figure 286680DEST_PATH_IMAGE041
为所述样本方面词对应的真实情感概率分布向量,
Figure 715518DEST_PATH_IMAGE042
为所述样本方面词对应的预测情感概率分布向量;
所述总损失函数为:
Figure 9096DEST_PATH_IMAGE043
式中,Loss为所述总损失值,
Figure 721837DEST_PATH_IMAGE044
为第一衰减系数,
Figure 442669DEST_PATH_IMAGE045
为第二衰减系数,
Figure 873650DEST_PATH_IMAGE046
为可训练参数。
8.一种基于子句级关系图的方面词的情感分析装置,其特征在于,包括:
获取模块,用于获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的若干个方面词,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络;
句子编码模块,用于将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示;
第一邻接矩阵计算模块,用于构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵;
第一特征计算模块,用于将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量;
第二邻接矩阵计算模块,用于构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,其中,所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量;
第二特征计算模块,用于根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量;
情感分析模块,用于将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。
9.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于子句级关系图的方面词的情感分析方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于子句级关系图的方面词的情感分析方法的步骤。
CN202211471094.1A 2022-11-23 2022-11-23 基于子句级关系图的方面词的情感分析方法以及装置 Active CN115587597B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211471094.1A CN115587597B (zh) 2022-11-23 2022-11-23 基于子句级关系图的方面词的情感分析方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211471094.1A CN115587597B (zh) 2022-11-23 2022-11-23 基于子句级关系图的方面词的情感分析方法以及装置

Publications (2)

Publication Number Publication Date
CN115587597A CN115587597A (zh) 2023-01-10
CN115587597B true CN115587597B (zh) 2023-03-24

Family

ID=84783009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211471094.1A Active CN115587597B (zh) 2022-11-23 2022-11-23 基于子句级关系图的方面词的情感分析方法以及装置

Country Status (1)

Country Link
CN (1) CN115587597B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115827878B (zh) * 2023-02-13 2023-06-06 华南师范大学 语句情感分析方法、装置以及设备
CN116595975A (zh) * 2023-07-17 2023-08-15 四川大学 一种基于句信息进行词信息增强的方面级情感分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378545A (zh) * 2021-06-08 2021-09-10 北京邮电大学 一种方面级情感分析方法、装置、电子设备及存储介质
CN113656564A (zh) * 2021-07-20 2021-11-16 国网天津市电力公司 一种基于图神经网络的电网业务对话数据情感检测方法
CN114647730A (zh) * 2022-03-25 2022-06-21 华南师范大学 一种融合图注意力和图卷积网络的事件检测方法
CN115204183A (zh) * 2022-09-19 2022-10-18 华南师范大学 基于知识增强的双通道情感分析方法、装置以及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083705B (zh) * 2019-05-06 2021-11-02 电子科技大学 一种用于目标情感分类的多跳注意力深度模型、方法、存储介质和终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378545A (zh) * 2021-06-08 2021-09-10 北京邮电大学 一种方面级情感分析方法、装置、电子设备及存储介质
CN113656564A (zh) * 2021-07-20 2021-11-16 国网天津市电力公司 一种基于图神经网络的电网业务对话数据情感检测方法
CN114647730A (zh) * 2022-03-25 2022-06-21 华南师范大学 一种融合图注意力和图卷积网络的事件检测方法
CN115204183A (zh) * 2022-09-19 2022-10-18 华南师范大学 基于知识增强的双通道情感分析方法、装置以及设备

Also Published As

Publication number Publication date
CN115587597A (zh) 2023-01-10

Similar Documents

Publication Publication Date Title
CN115587597B (zh) 基于子句级关系图的方面词的情感分析方法以及装置
CN115204183B (zh) 基于知识增强的双通道情感分析方法、装置以及设备
CN114676704B (zh) 句子情感分析方法、装置、设备以及存储介质
CN111866004B (zh) 安全评估方法、装置、计算机系统和介质
CN111475622A (zh) 一种文本分类方法、装置、终端及存储介质
CN115168592B (zh) 基于方面类别的语句情感分析方法、装置以及设备
CN116151263B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN116402063A (zh) 多模态讽刺识别方法、装置、设备以及存储介质
CN110046356A (zh) 标签嵌入在微博文本情绪多标签分类中的应用研究
CN112418320A (zh) 一种企业关联关系识别方法、装置及存储介质
CN115659951B (zh) 基于标签嵌入的语句情感分析方法、装置以及设备
CN115827878B (zh) 语句情感分析方法、装置以及设备
CN115906863B (zh) 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115905524B (zh) 融合句法和语义信息的情感分析方法、装置以及设备
CN113505583A (zh) 基于语义决策图神经网络的情感原因子句对提取方法
CN115906861B (zh) 基于交互方面信息融合的语句情感分析方法以及装置
CN115905518B (zh) 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115659987B (zh) 基于双通道的多模态命名实体识别方法、装置以及设备
CN114547312B (zh) 基于常识知识图谱的情感分析方法、装置以及设备
CN115033700A (zh) 基于相互学习网络的跨领域情感分析方法、装置以及设备
CN115618884A (zh) 基于多任务学习的言论分析方法、装置以及设备
CN111090723B (zh) 一种基于知识图谱的电网安全生产内容推荐方法
CN113688232A (zh) 招标文本分类方法、装置、存储介质及终端
CN115712726B (zh) 基于双词嵌入的情感分析方法、装置以及设备
CN116029294B (zh) 词项配对方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant