CN115659951B - 基于标签嵌入的语句情感分析方法、装置以及设备 - Google Patents
基于标签嵌入的语句情感分析方法、装置以及设备 Download PDFInfo
- Publication number
- CN115659951B CN115659951B CN202211670269.1A CN202211670269A CN115659951B CN 115659951 B CN115659951 B CN 115659951B CN 202211670269 A CN202211670269 A CN 202211670269A CN 115659951 B CN115659951 B CN 115659951B
- Authority
- CN
- China
- Prior art keywords
- sentence
- feature
- words
- semantic
- syntactic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及情感分析领域,特别涉及一种基于标签嵌入的语句情感分析方法、装置、设备以及存储介质,获得待测语句的句法信息以及语义信息,采用扰动掩码的方法,对句法信息进行更新,并通过特征交互的方法,对语义信息以及句法信息进行增强,并构建权重标签数据,合理设置语句的语义信息与句法信息的权重,提高了对句法依赖解析的准确性,能够更加全面地对语句进行情感分析,提高情感分析的精准性以及效率。
Description
技术领域
本发明涉及情感分析领域,特别涉及一种基于标签嵌入的语句情感分析方法、装置、设备以及存储介质。
背景技术
情感分类是自然语言处理的一个子领域,旨在挖掘出主观性文本中存在的情感信息并做出准确判断。按照处理评论文本的层次不同也可以将情感分类分为方面级情感分类、句子级情感分类、篇章级情感分类。方面级情感分类作为一项细粒度情感分类任务,目标是预测句中特定方面词的情感极性。近年来,通过图卷积神经网络和大规模预训练模型在方面级情感分类中得到了广泛的应用。
然而,目前的技术方法采用的句法解析器并不是针对方面级情感分类任务,这会导致句法解析器会引入与方面级情感分类任务无关的信息,此外,有些语句的语义信息和句法信息并不是同等重要的,目前的技术方法采用的双通道图卷积神经网络,对语句的语义信息与句法信息给与了同等的地位,导致了对句法依赖解析不准确,对句子本身句法结构分析得不完整,从而难以对语句进行全面的情感分析,降低了情感分析的准确性。
发明内容
基于此,本发明提供一种基于标签嵌入的语句情感分析方法、装置、设备以及存储介质,获得待测语句的句法信息以及语义信息,采用扰动掩码的方法,对句法信息进行更新,并通过特征交互的方法,对语义信息以及句法信息进行增强,并构建权重标签数据,合理设置语句的语义信息与句法信息的权重,提高了对句法依赖解析的准确性,能够更加全面地对语句进行情感分析,提高情感分析的精准性以及效率。
该技术方法如下:
第一方面,本申请实施例提供了一种基于标签嵌入的语句情感分析方法,包括以下步骤:
获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感分析模型包括句子编码模块、句法提取模块、句法更新模块、语义提取模块、特征交互模块以及情感分析模块;
将所述待测语句输入至所述句子编码模块中,获取所述待测语句的句子特征表示,其中,所述句子特征表示包括若干个上下文单词的隐藏层向量;
构建所述待测语句的依存句法图,根据所述依存句法图,获得第一邻接矩阵,将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示;
采用扰动掩码方法,获得所述若干个上下文单词与所述方面词的句法关联向量,将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示;
获取所述句子编码模块的若干层的自注意力权重参数矩阵,根据所述句子编码模块的若干层的自注意力权重参数矩阵,构建语义图,根据所述语义图,获得第二邻接矩阵,将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示,其中,所述第二邻接矩阵包括若干个单词之间的语义关联向量;
将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,并从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量;
根据所述方面词对应的句法交互特征向量以及预设的权重分配标签计算算法,获取权重分配标签数据,将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
第二方面,本申请实施例提供了一种基于标签嵌入的语句情感分析装置,包括:
获取模块,用于获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感分析模型包括句子编码模块、句法提取模块、句法更新模块、语义提取模块、特征交互模块以及情感分析模块;
句子编码模块,用于将所述待测语句输入至所述句子编码模块中,获取所述待测语句的句子特征表示,其中,所述句子特征表示包括若干个上下文单词的隐藏层向量;
句法特征提取模块,用于构建所述待测语句的依存句法图,根据所述依存句法图,获得第一邻接矩阵,将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示;
句法特征更新模块,用于采用扰动掩码方法,获得所述若干个上下文单词与所述方面词的句法关联向量,将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示;
语义特征提取模块,用于获取所述句子编码模块的若干层的自注意力权重参数矩阵,根据所述句子编码模块的若干层的自注意力权重参数矩阵,构建语义图,根据所述语义图,获得第二邻接矩阵,将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示,其中,所述第二邻接矩阵包括若干个单词之间的语义关联向量;
特征交互模块,用于将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,并从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量;
情感分析模块,用于根据所述方面词对应的句法交互特征向量以及预设的权重分配标签计算算法,获取权重分配标签数据,将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的基于标签嵌入的语句情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于标签嵌入的语句情感分析方法的步骤。
在本实施例中,提供一种基于标签嵌入的语句情感分析方法、装置、设备以及存储介质,获得待测语句的句法信息以及语义信息,采用扰动掩码的方法,对句法信息进行更新,并通过特征交互的方法,对语义信息以及句法信息进行增强,并构建权重标签数据,合理设置语句的语义信息与句法信息的权重,提高了对句法依赖解析的准确性,能够更加全面地对语句进行情感分析,提高情感分析的精准性以及效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请第一实施例提供的基于标签嵌入的语句情感分析方法的流程示意图;
图2为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S3的流程示意图;
图3为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S4的流程示意图;
图4为本申请第二实施例提供的基于标签嵌入的语句情感分析方法中S4的流程示意图;
图5为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S5的流程示意图;
图6为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S6的流程示意图;
图7为本申请第一实施例提供的基于标签嵌入的语句情感分析方法的中S7流程示意图;
图8为本申请第三实施例提供的基于标签嵌入的语句情感分析方法的流程示意图;
图9为本申请第四实施例提供的基于标签嵌入的语句情感分析装置的结构示意图;
图10为本申请第五实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请第一实施例提供的基于标签嵌入的语句情感分析方法的流程示意图,包括如下步骤:
S1:获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感分析模型包括句子编码模块、句法提取模块、句法更新模块、语义提取模块、特征交互模块以及情感分析模块。
本申请的基于标签嵌入的语句情感分析方法的执行主体为基于标签嵌入的语句情感分析方法的分析设备(以下简称分析设备)。
在一个可选的实施例中,分析设备可以是一台计算机设备,可以是服务器,或多台计算机设备联合而成的服务器机群。
在本实施例中,分析设备获取待测语句以及预设的情感分析模型,具体地,分析设备可以获取用户输入的待测语句,也可以从预设的数据库中,获取相应的待测语句,其中,所述待测语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述待测语句的句子表达式为:
S2:将所述待测语句输入至所述句子编码模块中,获取所述待测语句的句子特征表示,其中,所述句子特征表示包括若干个上下文单词的隐藏层向量。
所述句子编码模块采用BERT(BidirectionalEncoder Representation fromTransformers)词嵌入模型。
在本实施例中,分析设备将所述待测语句输入至所述句子编码模块中进行编码处理,获得所述待测语句的句子特征表示。具体地,分析设备将所述待测语句分别输入至预设的BERT词嵌入模型中,将待测语句中的每个单词映射到低维向量空间中,经过查询预训练好的BERT矩阵,获得BERT词嵌入模型输出的所述待测语句的若干个单词的隐藏层向量,并进行编码处理,获得所述待测语句的句子特征表示,其中,所述句子特征表示为:
S3:构建所述待测语句的依存句法图,根据所述依存句法图,获得第一邻接矩阵,将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示。
在本实施例中,分析设备获取初始依存句法树,所述初始依存句法树包括若干个节点,将所述待测语句的若干个单词分别设置于所述初始依存句法树的节点上,构建所述待测语句的依存句法图,获取所述待测语句的依存关系信息,所述依存关系信息用于指示所述待测语句中单词与单词之间的连接关系,根据所述待测语句的依存关系信息,将所述待测语句的依存句法图转化为句法邻接矩阵,作为所述待测语句的第一邻接矩阵,其中,所述第一邻接矩阵包括若干个单词之间的依存关系向量。
分析设备将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示。
所述句法提取模块为第一多层图卷积网络,请参阅图2,图2为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S3的流程示意图,包括步骤S31,具体如下:
S31:将所述句子特征表示作为所述第一多层图卷积网络的首层输入信息数据,根据所述第一邻接矩阵以及预设的初始句法特征计算算法,获得所述第一多层图卷积网络的最后一层的初始句法特征表示。
所述初始句法特征计算算法为:
式中,为所述第一多层图卷积网络的第l+1层的初始句法特征表示,为所述第一多层图卷积网络的第l层的初始句法特征表示,为非线性激活函数,为所述第一邻接矩阵,为所述第一多层图卷积网络的第l层的可训练权重参数矩阵,为所述第一多层图卷积网络的第l层的偏差参数。
在本实施例中,分析设备将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述第一多层图卷积网络的首层的输入信息,根据所述待测语句的第一邻接矩阵中若干个单词之间的依存关系向量以及预设的初始句法特征计算算法,获得所述图卷积网络的最后一层的若干个单词的初始句法特征向量,获得所述初始句法特征表示。
S4:采用扰动掩码方法,获得所述若干个上下文单词与所述方面词的句法关联向量,将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示。
为了降低构建依存句法图时,引入的噪声对生成的句法特征提取的影响,在本实施例中,分析设备采用扰动掩码方法(Perturbed Masking),对所述待测语句进行分析,以获得所述若干个上下文单词与所述方面词的句法关联向量,并将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示。
请参阅图3,图3为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S4的流程示意图,包括步骤S41~S44,具体如下:
S41:分别对所述待测语句中若干个特定词进行屏蔽处理,获得若干个第一屏蔽语句,基于所述第一屏蔽语句中,分别对所述第一屏蔽语句中若干个上下文单词进行屏蔽处理,获得所述若干个第一屏蔽语句对应的若干个第二屏蔽语句。
在本实施例中,分析设备分别对所述待测语句中若干个特定词进行屏蔽处理,获得若干个第一屏蔽语句,其中,所述第一屏蔽语句的表达式为:
基于所述第一屏蔽语句中,分别对所述第一屏蔽语句中若干个上下文单词进行屏蔽处理,获得所述若干个第一屏蔽语句对应的若干个第二屏蔽语句,其中,所述第二屏蔽语句的表达式为:
S42:将所述若干个第一屏蔽语句,以及所述若干个第一屏蔽语句对应的若干个第二屏蔽语句分别输入至所述句子编码模块中,获得所述若干个第一屏蔽语句的句子特征表示,以及所述若干个第一屏蔽语句对应的若干个第二屏蔽语句的句子特征表示。
在本实施例中,分析设备将所述若干个第一屏蔽语句,以及所述若干个第一屏蔽语句对应的若干个第二屏蔽语句分别输入至所述句子编码模块中,获得所述若干个第一屏蔽语句的句子特征表示,以及所述若干个第一屏蔽语句对应的若干个第二屏蔽语句的句子特征表示。
S43:基于所述第一屏蔽语句的句子特征表示,以及所述第一屏蔽语句对应的若干个第二屏蔽语句的句子特征表示,根据预设的影响得分计算算法,获得所述待测语句的若干个上下文单词对所述方面词的若干个特定词的影响得分数据。
所述影响得分数据用于体现所述特定词对待测语句的句法信息的重要性,所述影响得分计算算法为:
式中,为方面词中第q个特定词,为第p个上下文单词,为第p个上下文单词对方面词中第q个特定词的影响得分数据,为对方面词中第q个特定词进行屏蔽处理后的第一屏蔽语句的句子特征表示,为对方面词中第q个特定词进行屏蔽处理后的第一屏蔽语句对应的,对第p个上下文单词进行屏蔽处理后的第二屏蔽语句。
在本实施例中,分析设备基于所述第一屏蔽语句的句子特征表示,以及所述第一屏蔽语句对应的若干个第二屏蔽语句的句子特征表示,根据预设的影响得分计算算法,获得所述待测语句的若干个上下文单词对所述方面词的若干个特定词的影响得分数据。
S44:采用快速选择方法,对所述若干个上下文单词对所述方面词的若干个特定词的影响得分数据进行筛选,获得所述若干个上下文单词与所述若干个特定词之间的句法关联向量,并将同一个上下文单词对应的,与所述若干个特定词之间的句法关联向量进行累加,获得所述若干个上下文单词与所述方面词的句法关联向量。
在本实施例中,分析设备采用快速选择(top-k)方法,对所述若干个上下文单词对所述方面词的若干个特定词的影响得分数据进行筛选,获得所述若干个上下文单词与所述若干个特定词之间的句法关联向量,具体地,分析设备通过设置若干个筛选数目,利用快速选择(top-k)方法,获取若干个筛选数目对应的影响得分数据的值最大的上下文单词与特定词组合,将该上下文单词与该特定词之间的句法关联向量设置为1,其他的上下文单词与特定词组合对应的上下文单词与特定词之间的句法关联向量设置为0。
将同一个上下文单词对应的,与所述若干个特定词之间的句法关联向量进行累加,获得所述若干个上下文单词与所述方面词的句法关联向量,具体如下:
请参阅图4,图4为本申请第二实施例提供的基于标签嵌入的语句情感分析方法中S4的流程示意图,还包括步骤S45~S46,具体如下:
S45:根据所述若干个上下文单词与方面词的句法关联向量以及预设的句法关联阈值,从所述若干个上下文单词中,提取若干个目标上下文单词,根据所述句子特征表示中若干个目标上下文单词的隐藏层向量、若干个特定词的隐藏层向量以及预设的句法关联特征计算算法,获得所述若干个目标上下文单词与若干个特定词之间的句法关联特征向量。
在本实施例中,分析设备根据所述若干个上下文单词与方面词的句法关联向量以及预设的句法关联阈值,从所述若干个上下文单词中,提取若干个目标上下文单词,具体地,分析设备根据所述若干个上下文单词与方面词的句法关联向量以及预设的句法关联阈值,将所述若干个上下文单词与方面词的句法关联向量进行重新设置,如下所述:
分析设备并根据重新设置后的所述若干个上下文单词与方面词的句法关联向量的值,将句法关联向量的值为1对应的上下文单词作为目标上下文单词,进行提取。分析设备根据所述句子特征表示中若干个目标上下文单词的隐藏层向量、若干个特定词的隐藏层向量以及预设的句法关联特征计算算法,获得所述若干个目标上下文单词与若干个特定词之间的句法关联特征向量,其中,所述句法关联特征计算算法为:
式中,为所述目标上下文单词的位置索引,为第个目标上下文单词与第q个特定词之间的句法关联特征向量,为第个目标上下文单词的隐藏层向量,为第q个特定词的隐藏层向量,为所述句法更新模块中预设的可训练参数矩阵,为所述句法更新模块中预设的第一可训练权重参数矩阵,为所述句法更新模块中预设的第二可训练权重参数矩阵。
S46:根据所述若干个特定词的隐藏层向量、所述若干个目标上下文单词与若干个特定词之间的句法关联特征向量以及预设的特征更新计算算法,获得所述若干个目标上下文单词的更新隐藏层向量,根据所述若干个目标上下文单词的更新隐藏层向量,对所述句子特征表示中相应的目标上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示。
所述特征更新计算算法为:
式中,为第个目标上下文单词的更新隐藏层向量,为非线性激活函数,为非线性激活函数,N为所述方面词中特定词的集合,k表示为第k个特定词,为第个目标上下文单词与第k个特定词之间的句法关联特征向量,为所述句法更新模块中预设的第三可训练权重参数矩阵。
在本实施例中,分析设备根据所述若干个特定词的隐藏层向量、所述若干个目标上下文单词与若干个特定词之间的句法关联特征向量以及预设的特征更新计算算法,获得所述若干个目标上下文单词的更新隐藏层向量,根据所述若干个目标上下文单词的更新隐藏层向量,对所述句子特征表示中相应的目标上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示。
S5:获取所述句子编码模块的若干层的自注意力权重参数矩阵,根据所述句子编码模块的若干层的自注意力权重参数矩阵,构建语义图,根据所述语义图,获得第二邻接矩阵,将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示,其中,所述第二邻接矩阵包括若干个单词之间的语义关联向量。
为了提高情感分析模型训练的精准性以及效率,在本实施例中,分析设备利用所述句子编码模块中已经经过大规模数据预训练的自注意力权重参数矩阵,获取所述句子编码模块的若干层的自注意力权重参数矩阵,根据所述句子编码模块的若干层的自注意力权重参数矩阵,构建语义图。
具体地,采用BERT模型作为句子编码模块的层数为12层,分析设备根据获取的最后四层的自注意力权重矩阵、所述句子编码模块的自注意力头数以及预设的自注意力平均算法,获得最后四层的平均自注意力权重矩阵:,其中,为第x层的平均自注意力权重矩阵。
所述自注意力平均算法为:
分析设备将最后四层的平均自注意力权重矩阵进行相加并取平均,获得处理后的平均自注意力权重矩阵,如下所述:
分析设备根据所述处理后的平均自注意力权重矩阵以及预设的权重阈值参数,获取所述待测语句的语义关系信息,并根据所述语义关系信息以及依次句法图,将所述依存句法图转换为基于语义信息的邻接矩阵,作为所述第二邻接矩阵,其中,所述语义关系信息用于指示所述待测语句中单词与单词之间的语义关系,所述第二邻接矩阵包括若干个单词之间的语义关联向量,如下所述:
分析设备将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示。
所述语义提取模块为第二多层图卷积网络,请参阅图5,图5为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S5的流程示意图,还包括步骤S51~S52,具体如下:
S51:将所述句子特征表示作为所述第二多层图卷积网络的首层输入信息数据,根据所述第二邻接矩阵以及预设的初始语义特征计算算法,获得所述第二多层图卷积网络的最后一层的初始语义特征表示。
所述初始语义特征计算算法为:
式中,为所述第二多层图卷积网络的第l+1层的初始语义特征表示,为所述第二多层图卷积网络的第l层的初始语义特征表示,为非线性激活函数,为所述第二邻接矩阵,为所述第二多层图卷积网络的第l层的可训练权重参数矩阵,为所述第二多层图卷积网络的第l层的偏差参数。
在本实施例中,分析设备将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述第二多层图卷积网络的首层的输入信息,根据所述待测语句的第二邻接矩阵中若干个单词之间的语义关联向量以及预设的初始语义特征计算算法,获得所述图卷积网络的最后一层的若干个单词的初始语义特征向量,获得所述初始语义特征表示。
S52:根据所述初始语义特征表示、句子特征表示以及预设的语义信息补充算法,获得所述语义特征表示。
所述语义信息补充算法为:
为了补充语义信息,提高所述情感分析模型对于情感分析的准确性,在本实施例中,分析设备根据所述初始语义特征表示、句子特征表示以及预设的语义信息补充算法,获得所述语义特征表示。
S6:将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,并从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量。
在本实施例中,分析设备将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,通过特征交互的方法,对语义信息以及句法信息进行增强,从而进一步提高所述情感分析模型对于情感分析的准确性。
分析设备从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量,具体地,分析设备从所述句法交互特征表示中,提取所有特定词的句法交互特征向量,并进行平均池化处理,获得所述方面词对应的句法交互特征向量,分析设备从所述语义交互特征表示中,提取所有特定词的语义交互特征向量,并进行平均池化处理,获得所述方面词对应的语义交互特征向量。
请参阅图6,图6为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S6的流程示意图,包括步骤S61~S63,具体如下:
S61:根据所述初始句法特征表示、更新句法特征表示以及预设的第一特征交互算法,获得第一交互特征表示。
所述第一特征交互算法为:
在本实施例中,分析设备采用单向的双仿射机制,根据所述初始句法特征表示、更新句法特征表示以及预设的第一特征交互算法,获得第一交互特征表示,实现了对句法信息进行增强。
S62:根据所述第一交互特征表示、语义特征表示以及预设的第二特征交互算法,获得所述句法交互特征表示。
所述第二特征交互算法为:
为了更加有效地将增强后的句法信息与语义信息进行交互,在本实施例中,分析设备采用双仿射机制,根据所述第一交互特征表示、语义特征表示以及预设的第二特征交互算法,获得所述句法交互特征表示。
S63:根据所述第一交互特征表示、语义特征表示以及预设的第三特征交互算法,获得所述语义交互特征表示。
所述第三特征交互算法为:
在本实施例中,分析设备采用双仿射机制,根据所述第一交互特征表示、语义特征表示以及预设的第三特征交互算法,获得所述语义交互特征表示。
S7:根据所述方面词对应的句法交互特征向量以及预设的权重分配标签计算算法,获取权重分配标签数据,将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
所述权重分配标签计算算法为:
所述第一标签嵌入矩阵以及第二标签嵌入矩阵表示为标签在向量空间上的表示,其中表示的是句法可靠的标签嵌入,表示的是句法不可靠的标签嵌入,以及均可训练的,在一个可选的实施例中,分析设备可以通过利用两种句法解析器对所述待测语句进行解析,并判断是否一致,从而构建所述第一标签嵌入矩阵以及第二标签嵌入矩阵。
在本实施例中,分析设备根据所述方面词对应的句法交互特征向量以及预设的权重分配标签计算算法,获取权重分配标签数据,将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
请参阅图7,图7为本申请第一实施例提供的基于标签嵌入的语句情感分析方法中S7的流程示意图,包括步骤S71,具体如下:
S71:根据所述方面词对应的句法交互特征向量、语义交互特征向量、权重分配标签数据以及预设的预测情感极性向量计算算法,获取所述待测语句的预测情感极性向量,根据所述预测情感极性向量,获取概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
所述情感极性向量计算算法为:
式中,p(a)为所述预测情感极性向量,γ为所述权重分配标签数据,为所述方面词对应的语义交互特征向量,为所述方面词对应的句法交互特征向量,为所述情感分析模块的第一可训练权重参数矩阵,为所述情感分析模块的第二可训练权重参数矩阵,softmax()为归一化函数。
在本实施例中,分析设备根据所述方面词对应的句法交互特征向量、语义交互特征向量、权重分配标签数据以及预设的预测情感极性向量计算算法,获取所述待测语句的预测情感极性向量,根据所述预测情感极性向量,获取概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。具体地,当计算得到p(a)=[p(a1),p(a2),p(a3),p(a4),p(a5)]=[0.1,0.5,0.1,0.2,0.1],概率最大为p(a2),其概率最大的维度对应的情感极性作为所述待测语句的情感分析结果。
请参阅图8,图8为本申请第三实施例提供的基于标签嵌入的语句情感分析方法的流程示意图,还包括步骤:训练所述情感分析模型,所述训练所述情感分析模型,包括步骤S81~S86,具体如下:
S81:获取训练语句集、情感标签集以及句法可靠标签集其中,所述训练语句集中包括若干个训练语句,所述训练语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感标签集包括若干个训练语句的真实情感极性向量,所述句法可靠标签集包括若干个训练语句的句法可靠标签数据。
在本实施例中,分析设备可以获取用户输入的训练语句集、情感标签集以及句法可靠标签集,也可以在预设的数据库中获取训练语句集、情感标签集以及句法可靠标签集。
S82:将所述训练语句集输入至待训练的情感分析模型中,获得所述若干个训练语句的方面词的句法交互特征向量、语义交互特征向量,以及所述若干个训练语句的预测情感极性向量以及预测情感极性。
在本实施例中,分析设备将所述训练语句集输入至待训练的情感分析模型中,获得所述若干个训练语句的方面词的句法交互特征向量、语义交互特征向量,以及所述若干个训练语句的预测情感极性向量以及预测情感极性。
S83:基于所述预测情感极性,构建正例句法交互特征集、正例语义交互特征集、负例句法交互特征集以及负例语义交互特征集,其中,所述正例句法交互特征集包括相同预测情感极性的若干个训练语句的方面词的句法交互特征向量,所述正例语义交互特征集包括相同预测情感极性的若干个训练语句的方面词的语义交互特征向量,所述负例句法交互特征集包括不同预测情感极性的若干个训练语句的方面词的句法交互特征向量,所述负例语义交互特征集包括不同预测情感极性的若干个训练语句的方面词的语义交互特征向量。
在本实施例中,分析设备分别将相同预测情感极性的若干个训练语句进行集合,构建正例语句集,分别提取所述正例语句集中若干个训练语句的方面词的句法交互特征向量以及语义交互特征向量,进行组合,构建正例句法交互特征集以及正例语义交互特征集,将不同的预测情感极性的若干个训练语句进行集合,构建负例语句集,分别提取所述负例语句集中若干个训练语句的方面词的句法交互特征向量以及语义交互特征向量,进行组合,构建负例句法交互特征集以及负例语义交互特征集。
S84:根据所述正例句法交互特征集样本集、负例句法交互特征集以及预设的第一损失函数,分别获取所述正例句法交互特征集样本集对应的第一损失值以及所述负例句法交互特征集样本集对应的第一损失值,进行累加,获得第一总损失值。
所述第一损失函数为:
式中,为所述第一损失值,为所述训练语句的数目,z、t以及r均为所述训练语句的位置索引,为第z个训练语句的预测情感极性,为第t个训练语句的预测情感极性,为第z个训练语句的方面词的句法交互特征向量,为第t个训练语句的方面词的句法交互特征向量,为第r个训练语句的方面词的句法交互特征向量,sim()为余弦相似度函数,τ为温度系数。
在本实施例中,分析设备根据所述正例句法交互特征集样本集、负例句法交互特征集以及预设的第一损失函数,分别获取所述正例句法交互特征集样本集对应的第一损失值以及所述负例句法交互特征集样本集对应的第一损失值,进行累加,获得第一总损失值。
S85:根据所述正例语义交互特征集样本集、负例语义交互特征集以及预设的第二损失函数,分别获取所述正例语义交互特征集样本集对应的第二损失值以及所述负例语义交互特征集样本集对应的第二损失值,进行累加,获得第二总损失值。
所述第二损失函数为:
在本实施例中,分析设备根据所述正例语义交互特征集样本集、负例语义交互特征集以及预设的第二损失函数,分别获取所述正例语义交互特征集样本集对应的第二损失值以及所述负例语义交互特征集样本集对应的第二损失值,进行累加,获得第二总损失值。
S86:构建所述待训练的情感分析模块的第一标签嵌入矩阵以及第二标签嵌入矩阵,根据所述第一标签嵌入矩阵、第二标签嵌入矩阵以及预设的第三损失函数,获取第三损失值。
所述第三损失函数为:
在本实施例中,分析设备构建所述待训练的情感分析模块的第一标签嵌入矩阵以及第二标签嵌入矩阵,根据所述第一标签嵌入矩阵、第二标签嵌入矩阵以及预设的第三损失函数,获取第三损失值。
S87:根据所述若干个训练语句的方面词的句法交互特征向量、所述若干个训练语句的句法可靠标签数据、第一标签嵌入矩阵、第二标签嵌入矩阵以及预设的第四损失函数,获取第四损失值。
所述第四损失函数为:
式中,为所述第四损失值,s和c为所述训练语句的位置索引,为第s个训练语句的方面词的句法交互特征向量,为第c个训练语句的方面词的句法交互特征向量,为第s个训练语句的句法可靠标签数据,为标签嵌入矩阵的索引,为第标签嵌入矩阵。
在本实施例中,分析设备根据所述若干个训练语句的方面词的句法交互特征向量、所述若干个训练语句的句法可靠标签数据、第一标签嵌入矩阵、第二标签嵌入矩阵以及预设的第四损失函数,获取第四损失值。
在对比学习中引入所述第一标签嵌入矩阵、第二标签嵌入矩阵,通过计算第一标签嵌入矩阵以及第二标签嵌入矩阵与所述若干个训练语句的方面词的句法交互特征向量的余弦相似度,从而计算相应的权重值,根据该权重值,进行第四损失值的计算,提高了模型在对比学习中的训练的精准性。
S88:根据所述若干个训练语句的预测情感极性向量、真实情感极性向量以及预设的第五损失函数,获取第五损失值。
所述第五损失函数为:
在本实施例中,分析设备根据所述若干个训练语句的预测情感极性向量、真实情感极性向量以及预设的第五损失函数,获取第五损失值。
S89:根据所述第一总损失值、第二总损失值、第三损失值、第四损失值、第五损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行优化训练,获得训练好的情感分析模型。
所述总损失函数为:
在本实施例中,分析设备根据所述第一总损失值、第二总损失值、第三损失值、第四损失值、第五损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行优化训练,获得训练好的情感分析模型。
请参阅图9,图9为本申请第四实施例提供的基于标签嵌入的语句情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于标签嵌入的语句情感分析方法的全部或一部分,该装置9包括:
获取模块91,用于获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感分析模型包括句子编码模块、句法提取模块、句法更新模块、语义提取模块、特征交互模块以及情感分析模块;
句子编码模块92,用于将所述待测语句输入至所述句子编码模块中,获取所述待测语句的句子特征表示,其中,所述句子特征表示包括若干个上下文单词的隐藏层向量;
句法特征提取模块93,用于构建所述待测语句的依存句法图,根据所述依存句法图,获得第一邻接矩阵,将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示;
句法特征更新模块94,用于采用扰动掩码方法,获得所述若干个上下文单词与所述方面词的句法关联向量,将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示;
语义特征提取模块95,用于获取所述句子编码模块的若干层的自注意力权重参数矩阵,根据所述句子编码模块的若干层的自注意力权重参数矩阵,构建语义图,根据所述语义图,获得第二邻接矩阵,将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示,其中,所述第二邻接矩阵包括若干个单词之间的语义关联向量;
特征交互模块96,用于将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,并从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量;
情感分析模块97,用于根据所述方面词对应的句法交互特征向量以及预设的权重分配标签计算算法,获取权重分配标签数据,将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
在本申请的实施例中,通过获取模块,获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感分析模型包括句子编码模块、句法提取模块、句法更新模块、语义提取模块、特征交互模块以及情感分析模块;通过句子编码模块,将所述待测语句输入至所述句子编码模块中,获取所述待测语句的句子特征表示,其中,所述句子特征表示包括若干个上下文单词的隐藏层向量;通过句法特征提取模块,构建所述待测语句的依存句法图,根据所述依存句法图,获得第一邻接矩阵,将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示;通过句法特征更新模块,采用扰动掩码方法,获得所述若干个上下文单词与所述方面词的句法关联向量,将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示;通过语义特征提取模块,获取所述句子编码模块的若干层的自注意力权重参数矩阵,根据所述句子编码模块的若干层的自注意力权重参数矩阵,构建语义图,根据所述语义图,获得第二邻接矩阵,将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示,其中,所述第二邻接矩阵包括若干个单词之间的语义关联向量;通过特征交互模块,将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,并从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量;通过情感分析模块,根据所述方面词对应的句法交互特征向量以及预设的权重分配标签计算算法,获取权重分配标签数据,将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。获得待测语句的句法信息以及语义信息,采用扰动掩码的方法,对句法信息进行更新,并通过特征交互的方法,对语义信息以及句法信息进行增强,并构建权重标签数据,合理设置语句的语义信息与句法信息的权重,提高了对句法依赖解析的准确性,能够更加全面地对语句进行情感分析,提高情感分析的精准性以及效率。
请参考图10,图10为本申请第五实施例提供的计算机设备的结构示意图,计算机设备10包括:处理器101、存储器102以及存储在存储器102上并可在处理器101上运行的计算机程序103;计算机设备可以存储有多条指令,指令适用于由处理器101加载并执行上述第一实施例以及第三实施例的方法步骤,具体执行过程可以参见所述第一实施例以及第三实施例的具体说明,在此不进行赘述。
其中,处理器101可以包括一个或多个处理核心。处理器101利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器102内的指令、程序、代码集或指令集,以及调用存储器102内的数据,执行基于标签嵌入的语句情感分析装置8的各种功能和处理数据,可选的,处理器101可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programble Logic Array,PLA)中的至少一个硬件形式来实现。处理器101可集成中央处理器101(Central ProcessingUnit,CPU)、图像处理器101(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器101中,单独通过一块芯片进行实现。
其中,存储器102可以包括随机存储器102(Random Access Memory,RAM),也可以包括只读存储器102(Read-OnlyMemory)。可选的,该存储器102包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器102可用于存储指令、程序、代码、代码集或指令集。存储器102可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器102可选的还可以是至少一个位于远离前述处理器101的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤,具体执行过程可以参见所示所述第一实施例以及第三实施例的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。
Claims (10)
1.一种基于标签嵌入的语句情感分析方法,其特征在于,包括以下步骤:
获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感分析模型包括句子编码模块、句法提取模块、句法更新模块、语义提取模块、特征交互模块以及情感分析模块;
将所述待测语句输入至所述句子编码模块中,获取所述待测语句的句子特征表示,其中,所述句子特征表示包括若干个上下文单词的隐藏层向量;
构建所述待测语句的依存句法图,根据所述依存句法图,获得第一邻接矩阵,将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示;
采用扰动掩码方法,获得所述若干个上下文单词与所述方面词的句法关联向量,将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示;
获取所述句子编码模块的若干层的自注意力权重参数矩阵,根据所述句子编码模块的若干层的自注意力权重参数矩阵,构建语义图,根据所述语义图,获得第二邻接矩阵,将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示,其中,所述第二邻接矩阵包括若干个单词之间的语义关联向量;
将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,并从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量;
根据所述方面词对应的句法交互特征向量以及预设的权重分配标签计算算法,获取权重分配标签数据,将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
2.根据权利要求1所述的基于标签嵌入的语句情感分析方法,其特征在于:所述句法提取模块为第一多层图卷积网络;
将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示,包括步骤:
将所述句子特征表示作为所述第一多层图卷积网络的首层输入信息数据,根据所述第一邻接矩阵以及预设的初始句法特征计算算法,获得所述第一多层图卷积网络的最后一层的初始句法特征表示,其中,所述初始句法特征计算算法为:
3.根据权利要求1所述的基于标签嵌入的语句情感分析方法,其特征在于,所述采用扰动掩码方法,获得所述若干个上下文单词与所述方面词的句法关联向量,包括步骤:
分别对所述待测语句中若干个特定词进行屏蔽处理,获得若干个第一屏蔽语句,基于所述第一屏蔽语句中,分别对所述第一屏蔽语句中若干个上下文单词进行屏蔽处理,获得所述若干个第一屏蔽语句对应的若干个第二屏蔽语句;
将所述若干个第一屏蔽语句,以及所述若干个第一屏蔽语句对应的若干个第二屏蔽语句分别输入至所述句子编码模块中,获得所述若干个第一屏蔽语句的句子特征表示,以及所述若干个第一屏蔽语句对应的若干个第二屏蔽语句的句子特征表示;
基于所述第一屏蔽语句的句子特征表示,以及所述第一屏蔽语句对应的若干个第二屏蔽语句的句子特征表示,根据预设的影响得分计算算法,获得所述待测语句的若干个上下文单词对所述方面词的若干个特定词的影响得分数据,其中,所述影响得分计算算法为:
式中,为方面词中第q个特定词,为第p个上下文单词,为第p个上下文单词对方面词中第q个特定词的影响得分数据,为对方面词中第q个特定词进行屏蔽处理后的第一屏蔽语句的句子特征表示,为对方面词中第q个特定词进行屏蔽处理后的第一屏蔽语句对应的,对第p个上下文单词进行屏蔽处理后的第二屏蔽语句;
采用快速选择方法,对所述若干个上下文单词对所述方面词的若干个特定词的影响得分数据进行筛选,获得所述若干个上下文单词与所述若干个特定词之间的句法关联向量,并将同一个上下文单词对应的,与所述若干个特定词之间的句法关联向量进行累加,获得所述若干个上下文单词与所述方面词的句法关联向量。
4.根据权利要求3所述的基于标签嵌入的语句情感分析方法,其特征在于:所述句子特征表示包括若干个特定词的隐藏层向量;
所述将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示,包括步骤:
根据所述若干个上下文单词与方面词的句法关联向量以及预设的句法关联阈值,从所述若干个上下文单词中,提取若干个目标上下文单词,根据所述句子特征表示中若干个目标上下文单词的隐藏层向量、若干个特定词的隐藏层向量以及预设的句法关联特征计算算法,获得所述若干个目标上下文单词与若干个特定词之间的句法关联特征向量,其中,所述句法关联特征计算算法为:
式中,为所述目标上下文单词的位置索引,为第个目标上下文单词与第q个特定词之间的句法关联特征向量,为第个目标上下文单词的隐藏层向量,为第q个特定词的隐藏层向量,为所述句法更新模块中预设的可训练参数矩阵,为所述句法更新模块中预设的第一可训练权重参数矩阵,为所述句法更新模块中预设的第二可训练权重参数矩阵;
根据所述若干个特定词的隐藏层向量、所述若干个目标上下文单词与若干个特定词之间的句法关联特征向量以及预设的特征更新计算算法,获得所述若干个目标上下文单词的更新隐藏层向量,根据所述若干个目标上下文单词的更新隐藏层向量,对所述句子特征表示中相应的目标上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示,其中,所述特征更新计算算法为:
5.根据权利要求3所述的基于标签嵌入的语句情感分析方法,其特征在于:所述语义提取模块为第二多层图卷积网络;
所述将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示,包括步骤:
将所述句子特征表示作为所述第二多层图卷积网络的首层输入信息数据,根据所述第二邻接矩阵以及预设的初始语义特征计算算法,获得所述第二多层图卷积网络的最后一层的初始语义特征表示,其中,所述初始语义特征计算算法为:
式中,为所述第二多层图卷积网络的第l+1层的初始语义特征表示,为所述第二多层图卷积网络的第l层的初始语义特征表示,为非线性激活函数,为所述第二邻接矩阵,为所述第二多层图卷积网络的第l层的可训练权重参数矩阵,为所述第二多层图卷积网络的第l层的偏差参数;
根据所述初始语义特征表示、句子特征表示以及预设的语义信息补充算法,获得所述语义特征表示,其中,所述语义信息补充算法为:
6.根据权利要求1所述的基于标签嵌入的语句情感分析方法,其特征在于,所述将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,包括步骤:
根据所述初始句法特征表示、更新句法特征表示以及预设的第一特征交互算法,获得第一交互特征表示,其中,所述第一特征交互算法为:
根据所述第一交互特征表示、语义特征表示以及预设的第二特征交互算法,获得所述句法交互特征表示,其中,所述第二特征交互算法为:
根据所述第一交互特征表示、语义特征表示以及预设的第三特征交互算法,获得所述语义交互特征表示,其中,所述第三特征交互算法为:
7.根据权利要求1所述的基于标签嵌入的语句情感分析方法,其特征在于,所述将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果,包括步骤:
根据所述方面词对应的句法交互特征向量、语义交互特征向量、权重分配标签数据以及预设的预测情感极性向量计算算法,获取所述待测语句的预测情感极性向量,根据所述预测情感极性向量,获取概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果,其中,所述情感极性向量计算算法为:
8.根据权利要求1所述的基于标签嵌入的语句情感分析方法,其特征在于,还包括步骤:训练所述情感分析模型,所述训练所述情感分析模型,包括步骤:
获取训练语句集、情感标签集以及句法可靠标签集,其中,所述训练语句集中包括若干个训练语句,所述训练语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感标签集包括若干个训练语句的真实情感极性向量,所述句法可靠标签集包括若干个训练语句的句法可靠标签数据;
将所述训练语句集输入至待训练的情感分析模型中,获得所述若干个训练语句的方面词的句法交互特征向量、语义交互特征向量,以及所述若干个训练语句的预测情感极性向量以及预测情感极性;
基于所述预测情感极性,构建正例句法交互特征集、正例语义交互特征集、负例句法交互特征集以及负例语义交互特征集,其中,所述正例句法交互特征集包括相同预测情感极性的若干个训练语句的方面词的句法交互特征向量,所述正例语义交互特征集包括相同预测情感极性的若干个训练语句的方面词的语义交互特征向量,所述负例句法交互特征集包括不同预测情感极性的若干个训练语句的方面词的句法交互特征向量,所述负例语义交互特征集包括不同预测情感极性的若干个训练语句的方面词的语义交互特征向量;
根据所述正例句法交互特征集样本集、负例句法交互特征集以及预设的第一损失函数,分别获取所述正例句法交互特征集样本集对应的第一损失值以及所述负例句法交互特征集样本集对应的第一损失值,进行累加,获得第一总损失值,其中,所述第一损失函数为:
式中,为所述第一损失值,为所述训练语句的数目,z、t以及r均为所述训练语句的位置索引,为第z个训练语句的预测情感极性,为第t个训练语句的预测情感极性,为第z个训练语句的方面词的句法交互特征向量,为第t个训练语句的方面词的句法交互特征向量,为第r个训练语句的方面词的句法交互特征向量,sim()为余弦相似度函数,τ为温度系数,为指示函数,B为预设的批次;
根据所述正例语义交互特征集样本集、负例语义交互特征集以及预设的第二损失函数,分别获取所述正例语义交互特征集样本集对应的第二损失值以及所述负例语义交互特征集样本集对应的第二损失值,进行累加,获得第二总损失值,其中,所述第二损失函数为:
构建所述待训练的情感分析模块的第一标签嵌入矩阵以及第二标签嵌入矩阵,根据所述第一标签嵌入矩阵、第二标签嵌入矩阵以及预设的第三损失函数,获取第三损失值,其中,所述第三损失函数为:
根据所述若干个训练语句的方面词的句法交互特征向量、所述若干个训练语句的句法可靠标签数据、第一标签嵌入矩阵、第二标签嵌入矩阵以及预设的第四损失函数,获取第四损失值,其中,所述第四损失函数为:
式中,为所述第四损失值,s和c为所述训练语句的位置索引,为第s个训练语句的方面词的句法交互特征向量,为第c个训练语句的方面词的句法交互特征向量,为第s个训练语句的句法可靠标签数据,为标签嵌入矩阵的索引,为第标签嵌入矩阵;
根据所述若干个训练语句的预测情感极性向量、真实情感极性向量以及预设的第五损失函数,获取第五损失值,其中,所述第五损失函数为:
根据所述第一总损失值、第二总损失值、第三损失值、第四损失值、第五损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行优化训练,获得训练好的情感分析模型,其中,所述总损失函数为:
9.一种基于标签嵌入的语句情感分析装置,其特征在于,包括:
获取模块,用于获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括若干个上下文单词以及若干个特定词,所述若干个特定词组合成方面词,所述情感分析模型包括句子编码模块、句法提取模块、句法更新模块、语义提取模块、特征交互模块以及情感分析模块;
句子编码模块,用于将所述待测语句输入至所述句子编码模块中,获取所述待测语句的句子特征表示,其中,所述句子特征表示包括若干个上下文单词的隐藏层向量;
句法特征提取模块,用于构建所述待测语句的依存句法图,根据所述依存句法图,获得第一邻接矩阵,将所述句子特征表示以及第一邻接矩阵输入至所述句法提取模块中进行特征提取,获得所述待测语句的初始句法特征表示;
句法特征更新模块,用于采用扰动掩码方法,获得所述若干个上下文单词与所述方面词的句法关联向量,将所述句子特征表示以及所述若干个上下文单词与所述方面词的句法关联向量输入至所述句法更新模块,对所述句子特征表示中若干个上下文单词的隐藏层向量进行更新,获得所述待测语句的更新句法特征表示;
语义特征提取模块,用于获取所述句子编码模块的若干层的自注意力权重参数矩阵,根据所述句子编码模块的若干层的自注意力权重参数矩阵,构建语义图,根据所述语义图,获得第二邻接矩阵,将所述句子特征表示以及第二邻接矩阵输入至所述语义提取模块中进行特征提取,获得所述待测语句的语义特征表示,其中,所述第二邻接矩阵包括若干个单词之间的语义关联向量;
特征交互模块,用于将所述初始句法特征表示、更新句法特征表示以及语义特征表示输入至所述特征交互模块中,进行特征交互,获得所述待测语句的句法交互特征表示以及语义交互特征表示,并从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量;
情感分析模块,用于根据所述方面词对应的句法交互特征向量以及预设的权重分配标签计算算法,获取权重分配标签数据,将所述方面词对应的句法交互特征向量、语义交互特征向量以及权重分配标签数据输入至所述情感分析模块中进行情感分析,获取所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
10.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的基于标签嵌入的语句情感分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211670269.1A CN115659951B (zh) | 2022-12-26 | 2022-12-26 | 基于标签嵌入的语句情感分析方法、装置以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211670269.1A CN115659951B (zh) | 2022-12-26 | 2022-12-26 | 基于标签嵌入的语句情感分析方法、装置以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115659951A CN115659951A (zh) | 2023-01-31 |
CN115659951B true CN115659951B (zh) | 2023-03-21 |
Family
ID=85023605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211670269.1A Active CN115659951B (zh) | 2022-12-26 | 2022-12-26 | 基于标签嵌入的语句情感分析方法、装置以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115659951B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115827878B (zh) * | 2023-02-13 | 2023-06-06 | 华南师范大学 | 语句情感分析方法、装置以及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021169364A1 (zh) * | 2020-09-23 | 2021-09-02 | 平安科技(深圳)有限公司 | 分析语义情感的方法、装置、设备及存储介质 |
CN114676704A (zh) * | 2022-05-30 | 2022-06-28 | 华南师范大学 | 句子情感分析方法、装置、设备以及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528672B (zh) * | 2020-12-14 | 2021-07-30 | 北京邮电大学 | 一种基于图卷积神经网络的方面级情感分析方法及装置 |
CN112560503B (zh) * | 2021-02-19 | 2021-07-02 | 中国科学院自动化研究所 | 融合深度特征和时序模型的语义情感分析方法 |
CN112883741B (zh) * | 2021-04-29 | 2021-07-27 | 华南师范大学 | 基于双通道图神经网络的特定目标情感分类方法 |
CN112966074B (zh) * | 2021-05-17 | 2021-08-03 | 华南师范大学 | 一种情感分析方法、装置、电子设备以及存储介质 |
CN113033215B (zh) * | 2021-05-18 | 2021-08-13 | 华南师范大学 | 情感检测方法、装置、设备以及存储介质 |
CN114417823B (zh) * | 2022-01-10 | 2024-09-06 | 大连海事大学 | 一种基于句法和图卷积网络的方面级情感分析方法及装置 |
CN114676687A (zh) * | 2022-04-15 | 2022-06-28 | 重庆理工大学 | 基于增强语义句法信息的方面级情感分类方法 |
CN115048938A (zh) * | 2022-06-13 | 2022-09-13 | 华南师范大学 | 基于语义和句法双通道的语句情感分析方法以及装置 |
CN115269847A (zh) * | 2022-08-02 | 2022-11-01 | 广西师范大学 | 基于知识增强句法异构图的方面级情感分类方法 |
-
2022
- 2022-12-26 CN CN202211670269.1A patent/CN115659951B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021169364A1 (zh) * | 2020-09-23 | 2021-09-02 | 平安科技(深圳)有限公司 | 分析语义情感的方法、装置、设备及存储介质 |
CN114676704A (zh) * | 2022-05-30 | 2022-06-28 | 华南师范大学 | 句子情感分析方法、装置、设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115659951A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107516110B (zh) | 一种基于集成卷积编码的医疗问答语义聚类方法 | |
CN111428044A (zh) | 多模态获取监管识别结果的方法、装置、设备及存储介质 | |
CN116402063B (zh) | 多模态讽刺识别方法、装置、设备以及存储介质 | |
CN114676704B (zh) | 句子情感分析方法、装置、设备以及存储介质 | |
CN113987187B (zh) | 基于多标签嵌入的舆情文本分类方法、系统、终端及介质 | |
CN115204183B (zh) | 基于知识增强的双通道情感分析方法、装置以及设备 | |
CN113378970B (zh) | 语句相似性检测方法、装置、电子设备及存储介质 | |
CN115587597B (zh) | 基于子句级关系图的方面词的情感分析方法以及装置 | |
CN115659987B (zh) | 基于双通道的多模态命名实体识别方法、装置以及设备 | |
CN116151263B (zh) | 多模态命名实体识别方法、装置、设备以及存储介质 | |
CN115168592B (zh) | 基于方面类别的语句情感分析方法、装置以及设备 | |
CN115659951B (zh) | 基于标签嵌入的语句情感分析方法、装置以及设备 | |
WO2023159756A1 (zh) | 价格数据的处理方法和装置、电子设备、存储介质 | |
CN112418320A (zh) | 一种企业关联关系识别方法、装置及存储介质 | |
CN113159315A (zh) | 一种神经网络的训练方法、数据处理方法以及相关设备 | |
CN114492669A (zh) | 关键词推荐模型训练方法、推荐方法和装置、设备、介质 | |
CN115827878B (zh) | 语句情感分析方法、装置以及设备 | |
CN112347252A (zh) | 一种基于cnn文本分类模型的可解释性分析方法 | |
CN115905518B (zh) | 基于知识图谱的情感分类方法、装置、设备以及存储介质 | |
CN115618884B (zh) | 基于多任务学习的言论分析方法、装置以及设备 | |
CN115906863B (zh) | 基于对比学习的情感分析方法、装置、设备以及存储介质 | |
CN115905524B (zh) | 融合句法和语义信息的情感分析方法、装置以及设备 | |
CN115906861B (zh) | 基于交互方面信息融合的语句情感分析方法以及装置 | |
CN114547312B (zh) | 基于常识知识图谱的情感分析方法、装置以及设备 | |
CN115033700A (zh) | 基于相互学习网络的跨领域情感分析方法、装置以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |