CN115906863B - 基于对比学习的情感分析方法、装置、设备以及存储介质 - Google Patents
基于对比学习的情感分析方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN115906863B CN115906863B CN202211311151.XA CN202211311151A CN115906863B CN 115906863 B CN115906863 B CN 115906863B CN 202211311151 A CN202211311151 A CN 202211311151A CN 115906863 B CN115906863 B CN 115906863B
- Authority
- CN
- China
- Prior art keywords
- sample
- sentence
- sentences
- sample sentences
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明涉及情感分析领域,特别涉及一种基于对比学习的情感分析方法、装置、设备以及存储介质,通过引入依存信息以及词性信息,构建若干个样本语句的正例以及负例,利用对比学习方法加强语句中的信息,并结合若干个样本语句的情感极性,利用对比学习方法以兼顾语义特征以及句法特征的一致性和均匀性,更加全面地对语句进行情感分析,提升了情感分析的准确性以及效率。
Description
技术领域
本发明涉及情感分析领域,特别涉及一种基于对比学习的情感分析方法、装置、设备以及存储介质。
背景技术
方面级情感分类是自然语言处理中一个重要任务,旨在识别一个句子中给定的方面词的情感极性(积极,中性,消极)。
目前基于神经网络的方法已广泛应用于方面级情感分类任务,一些采用基于注意力机制的方法,期望能够帮助模型捕获到有利于情感极性判断的词语。然而注意力机制仅根据语义特征可能错误地关注无关上下文词语,特别是包含多个方面词的句子中,复杂的语义结构往往会迷惑模型,从而导致模型做出错误的情感极性判断。近些年来图卷积神经网络的广泛应用,将句法依存信息融入模型中,并取得出色的效果,进一步说明了句法结构信息的引入,能够有效缓解注意力机制的不足和解决循环神经网络存在的长距离依赖问题。后来的方法开始思考将句法信息和语义信息同时结合起来,多通道的图卷积神经网络开始应用于方面级情感分类任务中。
尽管这一类的方法相较于仅利用句法图神经网络的方法能取得更好的效果,但依然存在以下问题:1、构造的句法解析结果往往是针对整个句子进行句法解析,没有考虑特定的方面词或者一些对情感极性判断有帮助的观点词的重要性,这样的做法容易在特征提取阶段引入额外的冗余信息;2、此外,目前的做法往往是将语义和语法视为两种空间的特征,并分别提取和融合语法特征和语义特征,最后简单拼接后送入分类层,但是却忽略了对语法特征和语义特征一致性/对齐性(alignment)和均匀性(uniformity)的讨论,难以对语句进行准确的情感分析。
发明内容
基于此,本发明提供一种基于对比学习的情感分析方法、装置、设备以及存储介质,通过引入依存信息以及词性信息,构建若干个样本语句的正例以及负例,利用对比学习方法加强语句中的信息,并结合若干个样本语句的情感极性,利用对比学习方法以兼顾语义特征以及句法特征的一致性和均匀性,更加全面地对语句进行情感分析,提升了情感分析的准确性以及效率。该技术方法如下:
第一方面,本申请实施例提供了一种基于对比学习的情感分析方法,包括以下步骤:
获取若干个样本语句、依存信息、词性信息以及情感标签集,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;
根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;
将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;
将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;
将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;
将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;
获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
第二方面,本申请实施例提供了一种基于对比学习的情感分析装置,包括:
数据获取模块,用于获取若干个样本语句、依存信息、词性信息以及情感标签集,根据预设的批次,将所述若干个样本语句划分为若干个样本语句,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
句子信息提取模块,用于获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;
数据构建模块,用于根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
第一损失值计算模块,用于将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
语法信息提取模块,用于将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;
特征融合模块,用于将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;
情感分析模块,用于将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;
第二损失值计算模块,用于将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;
第三损失值计算模块,用于将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
模型训练模块,用于根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;
处理模块,用于获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的基于对比学习的情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于对比学习的情感分析方法的步骤。
在本实施例中,提供一种基于对比学习的情感分析方法、装置、设备以及存储介质,通过引入依存信息以及词性信息,构建若干个样本语句的正例以及负例,利用对比学习方法加强语句中的信息,并结合若干个样本语句的情感极性,利用对比学习方法以兼顾语义特征以及句法特征的一致性和均匀性,更加全面地对语句进行情感分析,提升了情感分析的准确性以及效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请第一实施例提供的基于对比学习的情感分析方法的流程示意图;
图2为本申请一个实施例提供的基于对比学习的情感分析方法中S7的流程示意图;
图3为本申请一个实施例提供的基于对比学习的情感分析方法中S7的流程示意图;
图4为本申请一个实施例提供的基于对比学习的情感分析方法中S8的流程示意图;
图5为本申请第一实施例提供的基于对比学习的情感分析方法中S9的流程示意图;
图6为本申请一个实施例提供的基于对比学习的情感分析装置的结构示意图;
图7为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请第一实施例提供的基于对比学习的情感分析方法的流程示意图,包括如下步骤:
S1:获取若干个样本语句、依存信息、词性信息以及情感标签集。
本申请的基于对比学习的情感分析方法的执行主体为基于对比学习的情感分析方法的分析设备(以下简称分析设备)。
在一个可选的实施例中,分析设备可以是一台计算机设备,可以是服务器,或多台计算机设备联合而成的服务器机群。
在本实施例中,分析设备可以获取用户输入的若干个样本语句、依存信息、词性信息以及情感标签集,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,具体地,对于所述方面词有一阶邻居句法关联的单词,该单词的依存类型标记信息设置为给改单词,对于与方面词具有多阶邻居句法关联的单词,该单词的依存类型标记信息设置为con:n。
所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量。
具体地,分析设备可以通过使用StanfordCoreNLP工具对样本语句进行分析,获取与样本语句相关联的依存信息以及词性信息,也可以在预设的数据库中,获取若干个样本语句的依存信息以及词性信息。
S2:获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示。
在本实施例中,分析设备获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络。
所述句子编码网络包括词嵌入模块以及特征提取模块,具体地,所述词嵌入模块可以采用BERT(Bidirectional Encoder Representation from Transformers)模型,也可以采用GloVe模型,所述特征提取模块可以采用Bi-LSTM模型。
分析设备将所述若干个样本语句输入至所述句子编码网络,使用BERT模型分别对若干个样本语句进行编码,获取上下文隐藏层表示,即样本语句的各个单词对应的词嵌入表示,具体如下:
式中,X为所述样本语句的句子表示,xN为第N个单词对应的词嵌入表示,方面词a为所述方面词中单词的起始索引,la为所述方面词的长度。
采用Bi-LSTM模型,对所述样本语句的各个单词对应的词嵌入表示进行编码,获得样本语句的句子特征表示,其中,句子特征表示为:
H={h1,h2,...,hN}
式中,H为所述样本语句的句子特征表示,hN为第N个单词对应的词嵌入表示。
S3:根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列。
在本实施例中,分析设备根据所述依存信息,构建所述若干个样本语句的依存句法图。
由于上述针对生成的面向特定方面词的嵌入矩阵忽略了对情感分类有帮助的关键词,且仍然存在一定的噪声信息。
为了减少噪声信息对情感分析带来的影响,在本实施例中,分析设备根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵。
具体地,分析设备可以通过设置动词、名词、形容词、程度副词作为关键词类型,并对所述样本语句中非方面词的若干个单词的词性进行对比,对于正例表示序列,若一个单词词性属于上述关键词类型,则将该单词对应位置掩模值设置为1,否则为0,获得若干个样本语句的正例表示序列。
同理,对于负例表示序列,若一个单词词性不属于上述关键词类型,则将该单词对应位置掩模值设置为1,否则为0,获得若干个样本语句的负例表示序列。
S4:将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
在本实施例中,分析设备将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵
具体地,分析设备根据预设的嵌入矩阵查询表,将所述依存句法图中方面词与各个单词之间的依存类型标记信息转换为相应的依存类型向量,获得所述若干个样本语句的嵌入矩阵;
具体地,所述嵌入矩阵查询表为其中,|Vt|代表转化后的依存类型向量的数目,dt代表嵌入矩阵的维度大小。
所述样本语句的嵌入矩阵为:
式中,Asyn为所述样本语句的嵌入矩阵,为所述样本语句中第N个单词对应的依存类型向量。
分析设备将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵,具体如下:
式中,为所述样本语句的正例嵌入矩阵,/>为所述样本语句的负例嵌入矩阵,Mpos为所述样本语句的正例表示序列,Mneg为所述样本语句的负例表示序列,其中,所述正例嵌入矩阵包括若干个单词的正例嵌入向量,所述负例嵌入矩阵包括若干个单词的负例嵌入向量。
分析设备根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值。
具体地,为了提高模型的训练速率,分析设备根据预设的批次,将所述若干个样本语句划分为若干个批次对应的样本语句训练集。
分析设备根据所述若干个批次对应的样本语句训练集中若干个样本语句的嵌入矩阵中若干个单词的依存类型向量、所述正例嵌入矩阵中若干个单词的正例嵌入向量、负例嵌入矩阵中若干个单词的负例嵌入向量以及预设的第一损失函数,获得所述若干个批次对应的样本语句训练集的第一损失值,作为所述嵌入矩阵构建网络输出的第一损失值,其中,所述第一损失函数为:
式中,为所述第一损失值,B为所述批次对应的样本语句训练集中样本语句的数目,N为所述样本语句中单词的数目,j为所述批次对应的样本语句训练集中样本语句的位置索引,i以及t均为所述样本语句的单词的位置索引,/>为所述样本语句的第t个单词的正例嵌入向量,Asyn,i为所述样本语句的第i个单词的依存类型向量,/>为所述样本语句的第t个单词的负例嵌入向量,sim()为余弦相似度函数,τ1为预设的第一温度系数。
利用对比学习方法强化所述样本语句中关键词的信息,从而提高对语句的情感分析的准确性。
S5:将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示。
在本实施例中,分析设备将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示。
请参阅图2,图2为本申请一个实施例提供的基于对比学习的情感分析方法中S5的流程示意图,包括步骤S51~S52,具体如下:
S51:根据所述若干个样本语句的句子特征表示以及预设的第一多头自注意力算法,获得所述若干个样本语句的第一注意力权重矩阵。
所述第一多头自注意力算法为:
式中,Aswm为所述样本语句的第一注意力权重矩阵,Softmax()为归一化指数函数,H为所述样本语句的句子特征表示,Wq为预设的第一可训练权重参数矩阵,Wk为预设的第二可训练权重参数矩阵,d为第一多头自注意力的维度参数。
为了所述样本语句中每个单词对语句的情感信息的贡献,在本实施例中,分析设备根据所述若干个样本语句的句子特征表示以及预设的第一多头自注意力算法,获得所述若干个样本语句的第一注意力权重矩阵,以对所述句子特征表示赋予不同的权重,抽取出更加关键及重要的信息,提高对所述语句的情感分析的准确性。
S52:根据所述若干个样本语句的第一注意力权重矩阵以及预设的语义特征计算算法,获得所述若干个样本语句的初始语义特征表示。
所述语义特征计算算法为:
Hsem=σ(AsemWvH+b)
式中,Hsem为所述样本语句的语义特征表示,σ()为非线性激活函数,Wv为预设的第三可训练权重参数矩阵,b为预设的第一偏置参数。
在本实施例中,分析设备根据所述若干个样本语句的第一注意力权重矩阵以及预设的语义特征计算算法,获得所述若干个样本语句的初始语义特征表示。
请参阅图3,图3为本申请一个实施例提供的基于对比学习的情感分析方法中S5的流程示意图,包括步骤S53~S54,具体如下:
S53:根据所述若干个样本语句的句子特征表示、嵌入矩阵以及预设的第二多头自注意力算法,获得所述若干个样本语句的第二注意力权重矩阵。
所述第二多头自注意力算法为:
式中,att为所述样本语句的第二注意力权重矩阵,Softmax()为归一化指数函数,Sayn为所述样本语句的嵌入矩阵,H为所述样本语句的句子特征表示,Wt为预设的第四可训练权重参数矩阵,Wh为预设的第五可训练权重参数矩阵,dm为第二多头自注意力的维度参数;bD为预设的第二偏置参数,bh为预设的第三偏置参数。
为了所述样本语句中每个单词对语句的情感信息的贡献,在本实施例中,分析设备根据所述若干个样本语句的句子特征表示以及预设的第二多头自注意力算法,获得所述若干个样本语句的第二注意力权重矩阵,以对所述句子特征表示赋予不同的权重,抽取出更加关键及重要的信息,提高对所述语句的情感分析的准确性。
S54:根据所述若干个样本语句的第二注意力权重矩阵以及预设的句法特征计算算法,获得所述若干个样本语句的初始句法特征表示。
所述句法特征计算算法为:
Hsyn=att*H
式中,Hsyn为所述样本语句的语义特征表示。
在本实施例中,分析设备根据所述若干个样本语句的第二注意力权重矩阵以及预设的句法特征计算算法,获得所述若干个样本语句的初始句法特征表示。
S6:将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示。
在本实施例中,将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示。
请参阅图4,图4为本申请一个实施例提供的基于对比学习的情感分析方法中S6的流程示意图,包括步骤S61~S62,具体如下:
S61:将所述若干个样本语句的初始语义特征表示以及初始句法特征表示作为所述多层互双仿射网络的第一层的输入信息。
在本实施例中,分析设备将所述若干个样本语句的初始语义特征表示以及初始句法特征表示作为所述多层互双仿射网络的第一层的输入信息。
S62:根据所述多层互双仿射网络的第一层的输入信息以及预设的特征融合计算算法,获得所述多层互双仿射网络的最后一层输出的所述若干个样本语句的融合语义特征表示以及融合句法特征表示。
所述特征融合计算算法为:
式中,为所述互双仿射网络的第l层输出的样本语句的融合语义特征表示,为所述互双仿射网络的第l层输出的样本语句的融合句法特征表示,Softmax()为归一化指数函数,/>为所述互双仿射网络的第l-1层对应的第一可学习参数,/>为所述互双仿射网络的第l-1层对应的第二可学习参数。
在本实施例中,分析设备根据预设的特征融合计算算法,所述多层互双仿射网络通过每一层的卷积计算,每一层都能在迭代计算中聚合其相邻层的信息并更新自身的信息,获得所述多层互双仿射网络的最后一层输出的所述若干个样本语句的融合语义特征表示以及融合句法特征表示。通过采用交互机制进行语义特征表示以及句法特征信息的融合,更加准确地对语句包含的信息进行分析,从而更好地对语句进行情感分析,提高情感分析的准确性以及效率。
S7:将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性。
在本实施例中,分析设备将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性。
请参阅图5,图5为本申请一个实施例提供的基于对比学习的情感分析方法中S7的流程示意图,包括步骤S71~S73,具体如下:
S71:从所述若干个样本语句的融合语义特征表示、融合句法特征表示中,获取所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量,根据所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量以及预设的池化计算算法,获得池化处理后的所述若干个样本语句的融合语义特征表示以及融合句法特征表示。
所述池化计算算法为:
式中,为所述池化处理后的若干个样本语句的融合语义特征表示,/>为所述池化处理后的若干个样本语句的融合句法特征表示,/>为所述互双仿射网络的第l层输出的样本语句的方面词中第a个位置索引对应的单词的融合语义特征向量,/>为所述互双仿射网络的第l层输出的样本语句的第a个位置索引对应的单词的融合句法特征向量,a为所述方面词中单词的起始索引,la为所述方面词的长度,avgpool()为平均池化函数。
在本实施例中,分析设备从所述若干个样本语句的融合语义特征表示、融合句法特征表示中,获取所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量,根据所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量以及预设的池化计算算法,获得池化处理后的所述若干个样本语句的融合语义特征表示以及融合句法特征表示。通过取充分交互得到的基于方面词的融合语义特征向量和融合句法特征作为待处理数据,来进行情感分析,以增加方面词在语句中的信息,提高对语句的情感分析的准确性。
S72:将池化处理后的同一所述样本语句的融合语义特征表示以及融合句法特征表示进行拼接处理,获得所述若干个样本语句的拼接处理特征表示,根据所述若干个样本语句的拼接处理特征表示以及预设的情感概率分布向量计算算法,获得所述若干个样本语句的情感概率分布向量。
所述情感分析特征计算算法为:
式中,Z为所述样本语句的情感概率分布向量,Wz为预设的第六可训练权重参数矩阵,为所述拼接处理特征表示,bz为预设的预设的第四偏置参数。
在本实施例中,分析设备将池化处理后的同一所述样本语句的融合语义特征表示以及融合句法特征表示进行拼接处理,获得所述若干个样本语句的拼接处理特征表示,根据所述若干个样本语句的拼接处理特征表示以及预设的情感概率分布向量计算算法,获得所述若干个样本语句的情感概率分布向量。将充分交互得到的基于方面词的融合语义特征向量和融合句法特征进行拼接,以获得与方面词相关联的最终特征表示,以增加方面词在语句中的信息,提高对语句的情感分析的准确性。
S73:根据所述若干个样本语句的情感概率分布向量,获得所述若干个样本语句的概率最大的维度对应的情感极性。
在本实施例中,分析设备根据所述若干个样本语句的情感概率分布向量,获得所述若干个样本语句的概率最大的维度对应的情感极性。
具体地,当分析设备计算得到Z=[Z积极,Z消极,Z中性]=[0.1,0.7,0.2],概率最大为Z消极,其概率最大的维度对应的情感极性为消极,从而获得所述若干个样本语句的情感极性。
S8:将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值。
在本实施例中,分析设备将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值。
具体地,分析设备根据所述若干个批次对应的样本语句训练集中若干个样本语句的预测情感概率分布向量、所述情感标签集中若干个样本语句对应的真实情感概率分布向量以及预设的第二损失函数,获得所述若干个批次对应的样本语句训练集的第二损失值,作为所述全连接网络输出的第二损失值,其中,所述第二损失函数为:
式中,为所述第二损失值,/>为所述预测情感概率分布向量,y为所述真实情感概率分布向量。
S9:将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值。
考虑到语义特征表示以及句法特征表示是两种不同空间的信息,结合不同的情感极性,应该同时兼顾特征的一致性和均匀性,在本实施例中,分析设备将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值。
具体地,分析设备分别将所述若干个批次对应的样本语句训练集中具有相同情感极性的所述若干个样本语句进行组合,获取若干个批次对应的若干个正例样本语句集。
分析设备根据所述若干个批次对应的若干个正例样本语句集对应的若干个样本语句的融合语义特征表示、融合句法特征表示以及预设的第三损失函数,获得所述若干个批次对应的若干个正例样本语句集对应的第三损失值,并将同一批次对应的若干个正例样本语句集对应的第三损失值进行累加,获得若干个批次对应的若干个正例样本语句集的第三损失值,作为所述全连接网络输出的第三损失值,其中,所述第三损失函数为:
式中,为所述第三损失值,s以及b均为所述批次对应的样本语句训练集中样本语句的位置索引,/>为所述正例样本语句集中样本语句的数目,c为所述正例样本语句集中样本语句的位置索引,/>为所述批次对应的样本语句训练集中第s个样本语句的融合句法特征表示,/>为所述正例样本语句集中第c个样本语句的融合语义特征表示,/>为所述批次对应的样本语句训练集中第b个样本语句的融合语义特征表示,τ2为预设的第二温度系数。
分析设备根据所述若干个批次对应的若干个正例样本语句集对应的若干个样本语句的融合语义特征表示、融合句法特征表示以及预设的第四损失函数,获得所述若干个批次对应的若干个正例样本语句集对应的第四损失值,并将同一批次对应的若干个正例样本语句集对应的第四损失值进行累加,获得若干个批次对应的若干个正例样本语句集的第四损失值,作为所述全连接网络输出的第四损失值,其中,所述第四损失函数为:
式中,为所述第四损失值,/>为所述批次对应的样本语句训练集中第s个样本语句的融合语义特征表示,/>为所述正例样本语句集中第c个样本语句的融合句法特征表示,/>为所述批次对应的样本语句训练集中第b个样本语句的融合语义特征表示,τ3为预设的第三温度系数。
利用双重对比学习方法使表达相同情感极性的语义特征表示和句法特征表示相互吸引,同时表达相反情感极性的语义特征表示和句法特征表示相互远离,提高对语句的情感分析的准确性。
S10:根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型。
在本实施例中,分析设备根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,其中,所述总损失函数为:
式中,为所述总损失函数,α以及β分别为预设的第一超参数以及第二超参数。
结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型。
S11:获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
在本实施例中,分析设备获得用户发送的分析指令并进行响应,获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
请参阅图6,图6为本申请一个实施例提供的基于对比学习的情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于对比学习的情感分析方法的全部或一部分,该装置6包括:
数据获取模块601,用于获取若干个样本语句、依存信息、词性信息以及情感标签集,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
句子信息提取模块602,用于获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;
数据构建模块603,用于根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
第一损失值计算模块604,用于将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
语法信息提取模块605,用于将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;
特征融合模块606,用于将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;
情感分析模块607,用于将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;
第二损失值计算模块608,用于将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;
正例样本语句集获取模块69,用于将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
第三损失值计算模块610,用于将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
模型训练模块611,用于根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;
处理模块612,用于获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
在本申请的实施例中,通过数据获取模块,获取若干个样本语句、依存信息、词性信息以及情感标签集,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;通过句子信息提取模块,获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;通过数据构建模块,根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;通过第一损失值计算模块,将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;通过语法信息提取模块,将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;通过特征融合模块,将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;通过情感分析模块,将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;通过第二损失值计算模块,将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;通过正例样本语句集获取模块,将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;通过第三损失值计算模块,将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;通过模型训练模块,根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;通过处理模块,获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
本申请通过引入依存信息以及词性信息,构建若干个样本语句的正例以及负例,利用对比学习方法加强语句中的信息,并结合若干个样本语句的情感极性,利用对比学习方法以兼顾语义特征以及句法特征的一致性和均匀性,更加全面地对语句进行情感分析,提升了情感分析的准确性以及效率。
请参考图7,图7为本申请一个实施例提供的计算机设备的结构示意图,计算机设备7包括:处理器71、存储器72以及存储在存储器72上并可在处理器71上运行的计算机程序73;计算机设备可以存储有多条指令,指令适用于由处理器71加载并执行上述图1至图5所述实施例的方法步骤,具体执行过程可以参见图1至图5所述实施例的具体说明,在此不进行赘述。
其中,处理器71可以包括一个或多个处理核心。处理器71利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器72内的指令、程序、代码集或指令集,以及调用存储器72内的数据,执行基于对比学习的情感分析装置6的各种功能和处理数据,可选的,处理器71可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrambleLogic Array,PLA)中的至少一个硬件形式来实现。处理器71可集成中央处理器71(CentralProcessing Unit,CPU)、图像处理器71(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器71中,单独通过一块芯片进行实现。
其中,存储器72可以包括随机存储器72(Random Access Memory,RAM),也可以包括只读存储器72(Read-Only Memory)。可选的,该存储器72包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器72可用于存储指令、程序、代码、代码集或指令集。存储器72可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器72可选的还可以是至少一个位于远离前述处理器71的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤,具体执行过程可以参见所示图1至图5所述实施例的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。
Claims (10)
1.一种基于语句的情感分析方法,其特征在于,包括以下步骤:
获取若干个样本语句、依存信息、词性信息以及情感标签集;其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
获取预设的情感分类模型;所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络;将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;
根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示;将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;
将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;
将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;
将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;
将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;
获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
2.根据权利要求1所述的基于语句的情感分析方法,其特征在于:所述句子特征表示集包括若干个样本语句的句子特征表示;
所述将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,包括步骤:
根据所述若干个样本语句的句子特征表示以及预设的第一多头自注意力算法,获得所述若干个样本语句的第一注意力权重矩阵,其中,所述第一多头自注意力算法为:
式中,Asem为所述样本语句的第一注意力权重矩阵,Softmax( )为归一化指数函数,H为所述样本语句的句子特征表示,Wq为预设的第一可训练权重参数矩阵,Wk为预设的第二可训练权重参数矩阵,d为第一多头自注意力的维度参数;
根据所述若干个样本语句的第一注意力权重矩阵以及预设的语义特征计算算法,获得所述若干个样本语句的初始语义特征表示,其中,所述语义特征计算算法为:
Hsem=σ(AsemWvH+b)
式中,Hsem为所述样本语句的语义特征表示,σ( )为非线性激活函数,Wv为预设的第三可训练权重参数矩阵,b为预设的第一偏置参数。
3.根据权利要求2所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示,包括步骤:
根据所述若干个样本语句的句子特征表示、相应的嵌入矩阵以及预设的第二多头自注意力算法,获得所述若干个样本语句的第二注意力权重矩阵,其中,所述第二多头自注意力算法为:
式中,att为所述样本语句的第二注意力权重矩阵,Softmax( )为归一化指数函数,Asyn为所述样本语句的嵌入矩阵,H为所述样本语句的句子特征表示,Wt为预设的第四可训练权重参数矩阵,Wh为预设的第五可训练权重参数矩阵,dm为第二多头自注意力的维度参数;bD为预设的第二偏置参数,bh为预设的第三偏置参数;
根据所述若干个样本语句的第二注意力权重矩阵以及预设的句法特征计算算法,获得所述若干个样本语句的初始句法特征表示,其中,所述句法特征计算算法为:
Hsyn=att*H
式中,Hsyn为所述样本语句的语义特征表示。
4.根据权利要求3所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示,包括步骤:
将所述若干个样本语句的初始语义特征表示以及初始句法特征表示作为所述多层互双仿射网络的第一层的输入信息;
根据所述多层互双仿射网络的第一层的输入信息以及预设的特征融合计算算法,获得所述多层互双仿射网络的最后一层输出的所述若干个样本语句的融合语义特征表示以及融合句法特征表示,其中,所述特征融合计算算法为:
式中,为所述互双仿射网络的第l层输出的样本语句的融合语义特征表示,/>为所述互双仿射网络的第l层输出的样本语句的融合句法特征表示,Softmax( )为归一化指数函数,/>为所述互双仿射网络的第l-1层对应的第一可学习参数,/>为所述互双仿射网络的第l-1层对应的第二可学习参数。
5.根据权利要求4所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性,包括步骤:
从所述若干个样本语句的融合语义特征表示、融合句法特征表示中,获取所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量,根据所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量以及预设的池化计算算法,获得池化处理后的所述若干个样本语句的融合语义特征表示以及融合句法特征表示,其中,所述池化计算算法为:
式中,为所述池化处理后的若干个样本语句的融合语义特征表示,/>为所述池化处理后的若干个样本语句的融合句法特征表示,/>为所述互双仿射网络的第l层输出的样本语句的方面词中第a个位置索引对应的单词的融合语义特征向量,/>为所述互双仿射网络的第l层输出的样本语句的第a个位置索引对应的单词的融合句法特征向量,a为所述方面词中单词的起始索引,la为所述方面词的长度,avgpool( )为平均池化函数;
将池化处理后的同一所述样本语句的融合语义特征表示以及融合句法特征表示进行拼接处理,获得所述若干个样本语句的拼接处理特征表示,根据所述若干个样本语句的拼接处理特征表示以及预设的情感概率分布向量计算算法,获得所述若干个样本语句的情感概率分布向量,其中,所述情感分析特征计算算法为:
式中,Z为所述样本语句的情感概率分布向量,Wz为预设的第六可训练权重参数矩阵,为所述拼接处理特征表示,bz为预设的预设的第四偏置参数;
根据所述若干个样本语句的情感概率分布向量,获得所述若干个样本语句的概率最大的维度对应的情感极性。
6.根据权利要求5所述的基于语句的情感分析方法,其特征在于:所述嵌入矩阵包括若干个单词的依存类型向量,所述正例嵌入矩阵包括若干个单词的正例嵌入向量,所述负例嵌入矩阵包括若干个单词的负例嵌入向量;
所述将所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵输入至所述嵌入矩阵构建网络,根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值,包括步骤:
根据预设的批次,将所述若干个样本语句划分为若干个批次对应的样本语句训练集;
根据所述若干个批次对应的样本语句训练集中若干个样本语句的嵌入矩阵中若干个单词的依存类型向量、所述正例嵌入矩阵中若干个单词的正例嵌入向量、负例嵌入矩阵中若干个单词的负例嵌入向量以及预设的第一损失函数,获得所述嵌入矩阵构建网络输出的第一损失值,其中,所述第一损失函数为:
式中,为所述第一损失值,B为所述批次对应的样本语句训练集中样本语句的数目,N为所述样本语句中单词的数目,j为所述批次对应的样本语句训练集中样本语句的位置索引,i以及t均为所述样本语句的单词的位置索引,/>为所述样本语句的第t个单词的正例嵌入向量,Asyn,i为所述样本语句的第i个单词的依存类型向量,/>为所述样本语句的第t个单词的负例嵌入向量,sim( )为余弦相似度函数,τ1为预设的第一温度系数。
7.根据权利要求6所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值,包括步骤:
根据所述若干个批次对应的样本语句训练集中若干个样本语句的预测情感概率分布向量、相应的真实情感概率分布向量以及预设的第二损失函数,获得所述全连接网络输出的第二损失值,其中,所述第二损失函数为:
式中,为所述第二损失值,/>为所述预测情感概率分布向量,y为所述真实情感概率分布向量。
8.根据权利要求7所述的基于语句的情感分析方法,其特征在于,所述将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值,包括步骤:
分别将所述若干个批次对应的样本语句训练集中具有相同情感极性的所述若干个样本语句进行组合,获取若干个批次对应的若干个正例样本语句集;
根据所述若干个批次对应的若干个正例样本语句集对应的若干个样本语句的融合语义特征表示、融合句法特征表示以及预设的第三损失函数,获得所述全连接网络输出的第三损失值,其中,所述第三损失函数为:
式中,为所述第三损失值,s以及b均为所述批次对应的样本语句训练集中样本语句的位置索引,/>为所述正例样本语句集中样本语句的数目,c为所述正例样本语句集中样本语句的位置索引,/>为所述批次对应的样本语句训练集中第s个样本语句的融合句法特征表示,/>为所述正例样本语句集中第c个样本语句的融合语义特征表示,/>为所述批次对应的样本语句训练集中第b个样本语句的融合语义特征表示,τ2为预设的第二温度系数;
根据所述若干个批次对应的若干个正例样本语句集对应的若干个样本语句的融合语义特征表示、融合句法特征表示以及预设的第四损失函数,获得所述全连接网络输出的第四损失值,其中,所述第四损失函数为:
式中,为所述第四损失值,/>为所述批次对应的样本语句训练集中第s个样本语句的融合语义特征表示,/>为所述正例样本语句集中第c个样本语句的融合句法特征表示,/>为所述批次对应的样本语句训练集中第b个样本语句的融合语义特征表示,τ3为预设的第三温度系数。
9.根据权利要求8所述的基于语句的情感分析方法,其特征在于:所述总损失函数为:
式中,为所述总损失函数,α以及β分别为预设的第一超参数以及第二超参数。
10.一种基于对比学习的情感分析装置,其特征在于,包括:
数据获取模块,用于获取若干个样本语句、依存信息、词性信息以及情感标签集,根据预设的批次,将所述若干个样本语句划分为若干个样本语句,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
句子信息提取模块,用于获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;
数据构建模块,用于根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
第一损失值计算模块,用于将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
语法信息提取模块,用于将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;
特征融合模块,用于将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;
情感分析模块,用于将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;
第二损失值计算模块,用于将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;
第三损失值计算模块,用于将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
模型训练模块,用于根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;
处理模块,用于获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211311151.XA CN115906863B (zh) | 2022-10-25 | 2022-10-25 | 基于对比学习的情感分析方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211311151.XA CN115906863B (zh) | 2022-10-25 | 2022-10-25 | 基于对比学习的情感分析方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115906863A CN115906863A (zh) | 2023-04-04 |
CN115906863B true CN115906863B (zh) | 2023-09-12 |
Family
ID=86486274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211311151.XA Active CN115906863B (zh) | 2022-10-25 | 2022-10-25 | 基于对比学习的情感分析方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115906863B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116595975A (zh) * | 2023-07-17 | 2023-08-15 | 四川大学 | 一种基于句信息进行词信息增强的方面级情感分析方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614611A (zh) * | 2018-11-28 | 2019-04-12 | 中山大学 | 一种融合生成非对抗网络与卷积神经网络的情感分析方法 |
CN109635109A (zh) * | 2018-11-28 | 2019-04-16 | 华南理工大学 | 基于lstm并结合词性及多注意力机制的句子分类方法 |
CN110362819A (zh) * | 2019-06-14 | 2019-10-22 | 中电万维信息技术有限责任公司 | 基于卷积神经网络的文本情感分析方法 |
CN110569508A (zh) * | 2019-09-10 | 2019-12-13 | 重庆邮电大学 | 融合词性和自注意力机制的情感倾向性分类方法及系统 |
CN112214601A (zh) * | 2020-10-21 | 2021-01-12 | 厦门市美亚柏科信息股份有限公司 | 一种社交短文本情感分类方法、装置及存储介质 |
CN112258262A (zh) * | 2020-09-15 | 2021-01-22 | 浙江大学 | 一种基于卷积自注意力网络的会话推荐方法 |
CN112528672A (zh) * | 2020-12-14 | 2021-03-19 | 北京邮电大学 | 一种基于图卷积神经网络的方面级情感分析方法及装置 |
CN113239186A (zh) * | 2021-02-26 | 2021-08-10 | 中国科学院电子学研究所苏州研究院 | 一种基于多依存关系表示机制的图卷积网络关系抽取方法 |
CN113688212A (zh) * | 2021-10-27 | 2021-11-23 | 华南师范大学 | 句子情感分析方法、装置以及设备 |
CN114528398A (zh) * | 2022-01-12 | 2022-05-24 | 山东师范大学 | 一种基于交互双重图卷积网络的情感预测方法及系统 |
CN114564565A (zh) * | 2022-03-02 | 2022-05-31 | 湖北大学 | 面向公共安全事件分析的深度语义识别模型及其构建方法 |
CN114676695A (zh) * | 2022-05-30 | 2022-06-28 | 华南师范大学 | 基于情感分析的文本语句处理方法、装置以及设备 |
CN114676704A (zh) * | 2022-05-30 | 2022-06-28 | 华南师范大学 | 句子情感分析方法、装置、设备以及存储介质 |
CN114791950A (zh) * | 2022-04-29 | 2022-07-26 | 西安邮电大学 | 基于词性位置与图卷积网络的方面级情感分类方法及装置 |
CN115168592A (zh) * | 2022-08-30 | 2022-10-11 | 华南师范大学 | 基于方面类别的语句情感分析方法、装置以及设备 |
-
2022
- 2022-10-25 CN CN202211311151.XA patent/CN115906863B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614611A (zh) * | 2018-11-28 | 2019-04-12 | 中山大学 | 一种融合生成非对抗网络与卷积神经网络的情感分析方法 |
CN109635109A (zh) * | 2018-11-28 | 2019-04-16 | 华南理工大学 | 基于lstm并结合词性及多注意力机制的句子分类方法 |
CN110362819A (zh) * | 2019-06-14 | 2019-10-22 | 中电万维信息技术有限责任公司 | 基于卷积神经网络的文本情感分析方法 |
CN110569508A (zh) * | 2019-09-10 | 2019-12-13 | 重庆邮电大学 | 融合词性和自注意力机制的情感倾向性分类方法及系统 |
CN112258262A (zh) * | 2020-09-15 | 2021-01-22 | 浙江大学 | 一种基于卷积自注意力网络的会话推荐方法 |
CN112214601A (zh) * | 2020-10-21 | 2021-01-12 | 厦门市美亚柏科信息股份有限公司 | 一种社交短文本情感分类方法、装置及存储介质 |
CN112528672A (zh) * | 2020-12-14 | 2021-03-19 | 北京邮电大学 | 一种基于图卷积神经网络的方面级情感分析方法及装置 |
CN113239186A (zh) * | 2021-02-26 | 2021-08-10 | 中国科学院电子学研究所苏州研究院 | 一种基于多依存关系表示机制的图卷积网络关系抽取方法 |
CN113688212A (zh) * | 2021-10-27 | 2021-11-23 | 华南师范大学 | 句子情感分析方法、装置以及设备 |
CN114528398A (zh) * | 2022-01-12 | 2022-05-24 | 山东师范大学 | 一种基于交互双重图卷积网络的情感预测方法及系统 |
CN114564565A (zh) * | 2022-03-02 | 2022-05-31 | 湖北大学 | 面向公共安全事件分析的深度语义识别模型及其构建方法 |
CN114791950A (zh) * | 2022-04-29 | 2022-07-26 | 西安邮电大学 | 基于词性位置与图卷积网络的方面级情感分类方法及装置 |
CN114676695A (zh) * | 2022-05-30 | 2022-06-28 | 华南师范大学 | 基于情感分析的文本语句处理方法、装置以及设备 |
CN114676704A (zh) * | 2022-05-30 | 2022-06-28 | 华南师范大学 | 句子情感分析方法、装置、设备以及存储介质 |
CN115168592A (zh) * | 2022-08-30 | 2022-10-11 | 华南师范大学 | 基于方面类别的语句情感分析方法、装置以及设备 |
Non-Patent Citations (1)
Title |
---|
基于层次注意力机制和门机制的属性级别情感分析;冯超 等;《中文信息学报》;128-136 * |
Also Published As
Publication number | Publication date |
---|---|
CN115906863A (zh) | 2023-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110023963A (zh) | 使用神经网络处理文本序列 | |
CN114676704B (zh) | 句子情感分析方法、装置、设备以及存储介质 | |
CN112257858A (zh) | 一种模型压缩方法及装置 | |
CN112288075A (zh) | 一种数据处理方法及相关设备 | |
CN115204183A (zh) | 基于知识增强的双通道情感分析方法、装置以及设备 | |
CN115587597B (zh) | 基于子句级关系图的方面词的情感分析方法以及装置 | |
CN115048938A (zh) | 基于语义和句法双通道的语句情感分析方法以及装置 | |
CN115168592B (zh) | 基于方面类别的语句情感分析方法、装置以及设备 | |
CN111259851A (zh) | 一种多模态事件检测方法及装置 | |
CN115906863B (zh) | 基于对比学习的情感分析方法、装置、设备以及存储介质 | |
JP7081454B2 (ja) | 処理装置、処理方法、及び処理プログラム | |
CN112860907B (zh) | 一种情感分类方法及设备 | |
US11797281B2 (en) | Multi-language source code search engine | |
CN116258145B (zh) | 多模态命名实体识别方法、装置、设备以及存储介质 | |
CN110427465B (zh) | 一种基于词语知识图谱的内容推荐方法及装置 | |
CN115659987B (zh) | 基于双通道的多模态命名实体识别方法、装置以及设备 | |
CN115827878B (zh) | 语句情感分析方法、装置以及设备 | |
CN115905518B (zh) | 基于知识图谱的情感分类方法、装置、设备以及存储介质 | |
CN115906861B (zh) | 基于交互方面信息融合的语句情感分析方法以及装置 | |
CN115905524B (zh) | 融合句法和语义信息的情感分析方法、装置以及设备 | |
CN114547312B (zh) | 基于常识知识图谱的情感分析方法、装置以及设备 | |
CN114970666B (zh) | 一种口语处理方法、装置、电子设备及存储介质 | |
CN115659951A (zh) | 基于标签嵌入的语句情感分析方法、装置以及设备 | |
CN115033700A (zh) | 基于相互学习网络的跨领域情感分析方法、装置以及设备 | |
JP7081455B2 (ja) | 学習装置、学習方法、及び学習プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |